大家都知道,歐盟擁有24種官方語(yǔ)言,理想情況下,歐盟的翻譯官們應(yīng)該能夠隨時(shí)從一種語(yǔ)言直譯到另一種語(yǔ)言,但這種翻譯組合實(shí)在是太多了,高達(dá)576種,所以他們選擇英語(yǔ)當(dāng)做中間語(yǔ)言來解決這一問題。
同樣地,我們的谷歌工程師們也面臨著同樣的問題,但谷歌面臨的麻煩要更大一點(diǎn),因?yàn)樗麄冃枰g的語(yǔ)言種類要比歐盟的官方語(yǔ)言多,達(dá)到100多種,(例如:英語(yǔ)翻法語(yǔ)是一種組合,而法語(yǔ)翻英語(yǔ)又是另一種組合),而這些翻譯組合會(huì)高達(dá)上萬(wàn)種。
如果為每一種組合訓(xùn)練一種神經(jīng)翻譯模型的話,那么就需要訓(xùn)練上萬(wàn)個(gè)。真的是好多??!但是現(xiàn)在不要了,我們只需要一個(gè)模型就可以解決這些問題。近日,來自谷歌的工程師門發(fā)表了一篇論文,上面提到如何只用一個(gè)模型實(shí)現(xiàn)多語(yǔ)言之間的翻譯。這個(gè)模型被稱為NMT模型。 NMT模型的訓(xùn)練不需要任何語(yǔ)言學(xué)知識(shí),且具有模型簡(jiǎn)單、翻譯質(zhì)量高等優(yōu)點(diǎn)。它基于原有的單一語(yǔ)言翻譯模型,但不需要對(duì)原有翻譯模型進(jìn)行任何修改,便可實(shí)現(xiàn)多語(yǔ)言之間的翻譯。
論文顯示這種新方法有三個(gè)優(yōu)點(diǎn):
一、簡(jiǎn)單,即減少需要訓(xùn)練的模型數(shù);
二、改善翻譯質(zhì)量。尤其是那些訓(xùn)練語(yǔ)料不足的語(yǔ)言;
三、具有‘zero shot’翻譯能力,即如果我們訓(xùn)練一個(gè)模型可以將葡萄牙語(yǔ)翻譯成英語(yǔ),然后在訓(xùn)練一下讓其可以實(shí)現(xiàn)英語(yǔ)到西班牙語(yǔ)之間的翻譯,此時(shí)神奇的一幕出現(xiàn)了,我們雖然并沒有進(jìn)行葡萄牙語(yǔ)到西班牙語(yǔ)之間的翻譯,但是此時(shí)模型仍然可以實(shí)現(xiàn)葡萄牙語(yǔ)到西班牙語(yǔ)之間的正確翻譯。
谷歌宣稱這是世界首次研發(fā)出zero-shot翻譯。很明顯,zero-shot 還具有明顯的速度優(yōu)勢(shì),它可以使解碼時(shí)間減半。 其另一個(gè)優(yōu)勢(shì)就是可以實(shí)現(xiàn)句間轉(zhuǎn)換。如果一個(gè)句子中包含不止一種語(yǔ)言,它照樣可以翻譯。這樣如果一個(gè)大的數(shù)據(jù)集中如果包含多種語(yǔ)言,那么它照樣可以實(shí)現(xiàn)翻譯。論文的最后,谷歌翻譯人員用BLEU方法對(duì)翻譯結(jié)果進(jìn)行評(píng)判,發(fā)現(xiàn)結(jié)果改善不少。
實(shí)際上,神經(jīng)機(jī)器翻譯還有很長(zhǎng)的路要走。谷歌貌似已經(jīng)將NMT 推廣到了其它語(yǔ)言翻譯上,例如英語(yǔ)到德語(yǔ)的翻譯。在我們對(duì)谷歌翻譯進(jìn)行的隨機(jī)測(cè)試中,我們發(fā)現(xiàn)其翻譯流暢度有所提升,但仍有一些漏翻或誤翻。
論文簡(jiǎn)介:《Google's Multilingual Neural Machine Translation System: Enabling Zero-Shot Translation》
我們用一個(gè)簡(jiǎn)單而優(yōu)雅的多語(yǔ)言神經(jīng)機(jī)器翻譯模型解決了多種語(yǔ)言之間的翻譯問題,這個(gè)模型與原有模型對(duì)比并沒有任何改變,只是在輸入句子時(shí)引入了一個(gè)變量,以標(biāo)明需要翻譯的目標(biāo)語(yǔ)言是什么。后面的編碼、解碼、注意力模型在所有語(yǔ)言中都一樣,詞表也共享,參數(shù)無需要增加。
與我們起初的設(shè)計(jì)相比,實(shí)現(xiàn)了極大的簡(jiǎn)化。在保持參數(shù)值不變的情況下,翻譯質(zhì)量居然還有所提升。在WMT'14 測(cè)試中,我們的模型在英法翻譯中不比任何模型差,在英德翻譯中比任何模型好,在多語(yǔ)言測(cè)試中,我們的模型在 14 年法英、15 年德英翻譯中效果最優(yōu)。我們的模型不僅可以對(duì) 12 種語(yǔ)言對(duì)(例如英法、法英,這是兩個(gè)語(yǔ)言對(duì))進(jìn)行翻譯,而且其翻譯效果也比大多數(shù)單語(yǔ)言對(duì)的翻譯模型還要好。除此之外、對(duì)于沒有訓(xùn)練過的語(yǔ)言對(duì),我們的模型仍然可以學(xué)習(xí),這就表明神經(jīng)網(wǎng)絡(luò)是可以實(shí)現(xiàn)遷移學(xué)習(xí)與‘zero-shot’翻譯的,在文章最后我們將向大家介紹一些在混合翻譯中發(fā)生的一些趣事。
- 2024年終盤點(diǎn) | 華為以“技術(shù)為根、實(shí)戰(zhàn)為魂”,助力高校,培養(yǎng)千萬(wàn)數(shù)智人才
- 余承東2025年全員信:通過海量鴻蒙設(shè)備,拉動(dòng)中國(guó)電子工業(yè)崛起
- 速通 NVIDIA 專業(yè)顯卡:專業(yè)顯卡有哪些優(yōu)勢(shì)?適合什么場(chǎng)景?
- 馬蜂窩跨年出行預(yù)測(cè):儀式感必不可少,“跨年煙花”帶動(dòng)目的地?zé)岫壬蠞q
- 30億元!比亞迪捐資興教推動(dòng)中國(guó)科教進(jìn)步
- 閉著眼睛寫代碼是一種什么樣的體驗(yàn)?
- 2024世界顯示產(chǎn)業(yè)大會(huì)啟幕,4K花園自研“滿天星”獲十大創(chuàng)新應(yīng)用
- 哈佛商學(xué)院:2024年全球96%代碼庫(kù)包含開源組件 Rust采用率增長(zhǎng)500%
- 硅谷1/10程序員在摸魚?基本不干活卻能拿20-30萬(wàn)美元年薪
- 傳馬斯克的"友商"擔(dān)心被報(bào)復(fù) 紛紛示好特朗普
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。