近期,谷歌發(fā)布神經(jīng)網(wǎng)絡(luò)機(jī)器翻譯系統(tǒng),使用了當(dāng)前最先進(jìn)的訓(xùn)練技術(shù),能夠?qū)崿F(xiàn)迄今為止機(jī)器翻譯質(zhì)量的最大提升。機(jī)器語(yǔ)言翻譯其實(shí)早已有之,十年前谷歌推出的Google Translate帶來(lái)了行業(yè)格局的重大變化,機(jī)器智能的快速發(fā)展也令翻譯行業(yè)不斷進(jìn)步。
與谷歌的大張旗鼓不同,國(guó)內(nèi)的翻譯軟件企業(yè)相對(duì)低調(diào)的多。而早在1996年,金山詞霸就已經(jīng)推出了第一個(gè)版本的翻譯軟件,幾乎與計(jì)算機(jī)在中國(guó)的普及時(shí)間同步。而金山詞霸也是當(dāng)時(shí)的裝機(jī)必備軟件,并迅速占領(lǐng)了國(guó)內(nèi)市場(chǎng)。在近幾年,金山詞霸在引入牛津詞典、柯林斯高階詞典提升翻譯能力的基礎(chǔ)上,在用戶的場(chǎng)景性應(yīng)用層面不斷深入。每日一句、四六級(jí)精品課、英文原版小說(shuō)等板塊漸漸豐富了翻譯軟件的內(nèi)容,也更加迎合用戶的情景需求。
在翻譯領(lǐng)域,更了解國(guó)人需求的金山詞霸,走出了差異化競(jìng)爭(zhēng)的第一步。
在談到神經(jīng)網(wǎng)絡(luò)算法對(duì)機(jī)器翻譯引擎的作用時(shí),業(yè)內(nèi)的專家表示過(guò)去的機(jī)器翻譯引擎都是基于統(tǒng)計(jì)算法和規(guī)則算法,更多的是以詞和短語(yǔ)作為基本單元,而神經(jīng)網(wǎng)絡(luò)算法的加入可以以句子作為翻譯的基本單元,降低了對(duì)調(diào)整語(yǔ)序的依賴,提升了機(jī)器翻譯的可用性。但是,神經(jīng)網(wǎng)絡(luò)也只是一種算法而已,更大的提升還是需要廣大的機(jī)器翻譯從業(yè)者夜以繼日的辛勤工作和研究來(lái)取得。
其實(shí)早在一年前,金山詞霸已經(jīng)開(kāi)始研究神經(jīng)網(wǎng)絡(luò)算法,并致力于把神經(jīng)網(wǎng)絡(luò)算法和過(guò)去的統(tǒng)計(jì)翻譯算法相結(jié)合,試圖打造更加智能聰明的翻譯引擎。據(jù)相關(guān)的技術(shù)人員介紹,目前取得了一定的進(jìn)展,在翻譯后句子的語(yǔ)序這部分得到了很大的優(yōu)化。
金山詞霸的產(chǎn)品經(jīng)理提到,單純的翻譯應(yīng)用始終都是一個(gè)工具,未來(lái)在商業(yè)模式上有很大的局限性。機(jī)器翻譯未來(lái)應(yīng)該和更多的場(chǎng)景、行業(yè)進(jìn)行結(jié)合,為特定的行業(yè)解決特定的問(wèn)題,在特定的場(chǎng)景解決特定的問(wèn)題。例如,當(dāng)用戶在境外國(guó)家旅游的過(guò)程中生病了,去了當(dāng)?shù)氐尼t(yī)院,由于語(yǔ)言障礙,用戶無(wú)法描述清楚自己的病情,醫(yī)生也無(wú)法精確的定位用戶的病因,在這樣的特定場(chǎng)景下,翻譯應(yīng)用其實(shí)是有很大機(jī)會(huì)和很好的應(yīng)用的。
因此,金山詞霸在用戶場(chǎng)景應(yīng)用層面付出了更多的努力。以用戶需求和技術(shù)驅(qū)動(dòng)產(chǎn)品的發(fā)展,讓翻譯軟件可以隨時(shí)融入到用戶的生活,為不同需求和不同場(chǎng)景的用戶提供相應(yīng)的內(nèi)容和服務(wù)。
對(duì)于谷歌的神經(jīng)網(wǎng)絡(luò)算法而言,好處是有了一種無(wú)限逼近目標(biāo)的方法,當(dāng)然也有它自身的局限性,最大的局限性就是神經(jīng)網(wǎng)絡(luò)算法目前需要大量的計(jì)算設(shè)備支持,為它實(shí)際應(yīng)用提高了成本門(mén)檻。但不論是谷歌在技術(shù)層面的不斷追求,還是金山詞霸在場(chǎng)景方面的不斷探索,都為用戶帶來(lái)了更好的翻譯體驗(yàn)。