高層速讀
關(guān)鍵信息:微軟亞洲研究院宣布開(kāi)發(fā)出第一個(gè)機(jī)器翻譯系統(tǒng),該系統(tǒng)在通用新聞報(bào)道測(cè)試集newstest2017的中-英測(cè)試集上達(dá)到了人類(lèi)水平,在自然語(yǔ)言處理上,實(shí)現(xiàn)了媲美人類(lèi)專(zhuān)業(yè)譯者的里程碑式突破。
由微軟亞洲研究院與雷德蒙研究院的研究人員組成的團(tuán)隊(duì)周三宣布,他們已經(jīng)開(kāi)發(fā)出了第一個(gè)機(jī)器翻譯系統(tǒng),該系統(tǒng)在通用新聞報(bào)道測(cè)試集newstest2017的中-英測(cè)試集上達(dá)到了人類(lèi)水平。當(dāng)100分是標(biāo)準(zhǔn)滿分時(shí),微軟的系統(tǒng)得分69.9,專(zhuān)業(yè)譯者68.6。
微軟表示,他們對(duì)來(lái)自各種在線報(bào)紙的大約2000個(gè)句子樣本進(jìn)行了反復(fù)測(cè)試,并將測(cè)試結(jié)果與機(jī)器翻譯的結(jié)果進(jìn)行了比較,甚至聘請(qǐng)了雙語(yǔ)語(yǔ)言顧問(wèn),以進(jìn)一步驗(yàn)證機(jī)器翻譯的準(zhǔn)確性。
首個(gè)媲美人類(lèi)專(zhuān)業(yè)譯者的里程碑式突破
這個(gè)名為newstest 2017的數(shù)據(jù)集是去年秋天在WMT 17的研究會(huì)議上發(fā)布的,由專(zhuān)業(yè)人員從在線報(bào)紙樣本翻譯而來(lái),因此,研究人員能夠如此迅速地達(dá)到這一成果,可以說(shuō)是機(jī)器翻譯領(lǐng)域的里程碑,特別是機(jī)器翻譯是人們幾十年來(lái)一直試圖解決的問(wèn)題。微軟指出,許多人甚至認(rèn)為,機(jī)器翻譯與人類(lèi)水平相同的目標(biāo)永遠(yuǎn)不會(huì)實(shí)現(xiàn)。
黃學(xué)東院士在微軟的博文中表示:“在機(jī)器翻譯任務(wù)中,實(shí)現(xiàn)人與人之間的平等是我們所有人的夢(mèng)想,我們只是沒(méi)想到這么快就能成功。”同時(shí)研究人員也提醒大家,這并不代表人類(lèi)已經(jīng)完全解決了機(jī)器翻譯的問(wèn)題,只能說(shuō)明我們離終極目標(biāo)又更近了一步。
近年來(lái),人工智能和語(yǔ)音識(shí)別技術(shù)的進(jìn)步使得語(yǔ)音助理能夠進(jìn)入我們的手機(jī)和家庭,幫助消費(fèi)者完成日常的計(jì)算任務(wù),控制智能家居設(shè)備,以及聊天和娛樂(lè)。但是,對(duì)網(wǎng)頁(yè)或新聞文章進(jìn)行機(jī)器翻譯,仍然會(huì)造成難以理解的語(yǔ)言上的混亂。因?yàn)?strong>機(jī)器翻譯最多能準(zhǔn)確翻譯字面意思,但幾乎不可能用任何深刻的語(yǔ)言來(lái)供你深入理解文章。要想真正理解長(zhǎng)篇文章,你需要人的幫助。
但,即使是不同的譯者,翻譯一個(gè)句子的方式也可能略有不同,你不能說(shuō)兩者誰(shuí)對(duì)誰(shuí)錯(cuò)。“機(jī)器翻譯要比單純的模式識(shí)別任務(wù)復(fù)雜得多”微軟亞洲副院長(zhǎng)、從事該項(xiàng)目的自然語(yǔ)言處理小組負(fù)責(zé)人周明說(shuō),“人們可以用不同的詞來(lái)表達(dá)完全相同的東西,但你不一定能說(shuō)哪個(gè)更好?!?/strong>
微信搜索【AI商業(yè)報(bào)道】,獲取國(guó)內(nèi)外AI巨頭新動(dòng)向及行業(yè)資訊!
深度神經(jīng)網(wǎng)絡(luò)使翻譯更加流暢、自然
微軟還指出,人工智能的最新技術(shù)——深度神經(jīng)網(wǎng)絡(luò),為研究人員實(shí)現(xiàn)了這一突破做出了貢獻(xiàn)。深層神經(jīng)網(wǎng)絡(luò)是一種訓(xùn)練人工智能系統(tǒng)的方法,使研究人員能夠創(chuàng)造出更流暢、更自然的翻譯??紤]到更廣泛的使用場(chǎng)景,以前的方法稱為統(tǒng)計(jì)機(jī)器翻譯。
微軟的研究人員在系統(tǒng)中添加了自己的訓(xùn)練方法,以提高系統(tǒng)的準(zhǔn)確性,這相當(dāng)于人們一次又一次地檢查自己的翻譯作業(yè),以確保它是正確的。
周明表示,“由于翻譯沒(méi)有唯一的標(biāo)準(zhǔn)答案,它更像是一種藝術(shù),因此需要更加復(fù)雜的算法和系統(tǒng)去應(yīng)對(duì)?!弊匀徽Z(yǔ)言計(jì)算組基于之前的研究積累,在此次的系統(tǒng)模型中增加了另外兩項(xiàng)新技術(shù):聯(lián)合訓(xùn)練(Joint Training)和一致性規(guī)范(Agreement Regularization),以提高翻譯的準(zhǔn)確性。
聯(lián)合訓(xùn)練可以理解為用迭代的方式去改進(jìn)翻譯系統(tǒng),用中英翻譯的句子對(duì)去補(bǔ)充反向翻譯系統(tǒng)的訓(xùn)練數(shù)據(jù)集,同樣的過(guò)程也可以反向進(jìn)行。一致性規(guī)范則讓翻譯可以從左到右進(jìn)行,也可以從右到左進(jìn)行,最終讓兩個(gè)過(guò)程生成一致的翻譯結(jié)果。
▲微軟中-英翻譯系統(tǒng)試用界面
“這一機(jī)器翻譯研究成果可以應(yīng)用到人工智能的各個(gè)領(lǐng)域中”周明說(shuō)。此外,它今后還將能夠準(zhǔn)確、自然地翻譯其他語(yǔ)言,同時(shí)應(yīng)用到微軟的商用多語(yǔ)言翻譯系統(tǒng)產(chǎn)品中。
除了微軟,谷歌的研究人員也一直在致力于機(jī)器翻譯,包括使用神經(jīng)網(wǎng)絡(luò)的中英文查詢機(jī)器學(xué)習(xí)技術(shù)。這些技術(shù)已經(jīng)被用于改進(jìn)谷歌面向消費(fèi)者的產(chǎn)品中,比如谷歌翻譯的App,以及谷歌搜索。
微信搜索【AI商業(yè)報(bào)道】,獲取國(guó)內(nèi)外AI巨頭新動(dòng)向及行業(yè)資訊!
- 蜜度索驥:以跨模態(tài)檢索技術(shù)助力“企宣”向上生長(zhǎng)
- 美媒聚焦比亞迪“副業(yè)”:電子代工助力蘋(píng)果,下個(gè)大計(jì)劃瞄準(zhǔn)AI機(jī)器人
- 微信零錢(qián)通新政策:銀行卡轉(zhuǎn)入資金提現(xiàn)免手續(xù)費(fèi)引熱議
- 消息稱塔塔集團(tuán)將收購(gòu)和碩印度iPhone代工廠60%股份 并接管日常運(yùn)營(yíng)
- 蘋(píng)果揭秘自研芯片成功之道:領(lǐng)先技術(shù)與深度整合是關(guān)鍵
- 英偉達(dá)新一代Blackwell GPU面臨過(guò)熱挑戰(zhàn),交付延期引發(fā)市場(chǎng)關(guān)注
- 馬斯克能否成為 AI 部部長(zhǎng)?硅谷與白宮的聯(lián)系日益緊密
- 余承東:Mate70將在26號(hào)發(fā)布,意外泄露引發(fā)關(guān)注
- 無(wú)人機(jī)“黑科技”亮相航展:全球首臺(tái)低空重力測(cè)量系統(tǒng)引關(guān)注
- 賽力斯發(fā)布聲明:未與任何伙伴聯(lián)合開(kāi)展人形機(jī)器人合作
- 賽力斯觸及漲停,汽車(chē)整車(chē)股盤(pán)初強(qiáng)勢(shì)拉升
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。