7月11日下午消息(岳明) 在今天舉行的“2017中國互聯(lián)網(wǎng)大會”上,谷歌翻譯研發(fā)科學家高勤介紹,谷歌翻譯現(xiàn)在提供超過100種語言互通,覆蓋全球99%的網(wǎng)民,每天提供超過10億次的翻譯,大約相當于100萬本書的文本總量。
谷歌翻譯月度活躍用戶超過10億人次,其中95%來自于美國以外地區(qū)。在技術(shù)層面,谷歌利用機器學習帶來了許多全新的翻譯體驗,例如利用手機攝像頭做的即時翻譯,利用手機麥克風和揚聲器進行即時對話翻譯,離線翻譯的支持為沒有數(shù)據(jù)服務的旅行者提供幫助。
高勤認為,翻譯質(zhì)量一直是谷歌翻譯所關(guān)注的焦點,在近十年以來,谷歌翻譯一直致力于翻譯質(zhì)量的提升,特別是最近一年以來,谷歌翻譯的質(zhì)量有了長足的提升,無論從流暢度和準確性上都有了巨大的提升,而其背后正是神經(jīng)網(wǎng)絡機器翻譯技術(shù)。
傳統(tǒng)的翻譯技術(shù),基于短語的統(tǒng)計機器翻譯是拼圖過程,通過對短語對的排列和組合,嘗試找出較好的翻譯選項,而整個決策過程是離散的,而支持這個決策的信息也都是局部的。而神經(jīng)網(wǎng)絡機器學習是反其道而行之,做每一步翻譯過程中可以利用云語言與目標語言所有信息,使整個決策過程既是連續(xù)也是全局的。
高勤表示,2015年最初預計完成項目計劃要花三年時間,但基于TensorFlow平臺,在2016年11月針對16個語言的機器翻譯能力基本實現(xiàn)。這其中,多語言模型使200個模型的訓練與維護成為可能。所謂多語言模型是指用同一套神經(jīng)網(wǎng)絡學習多種語言的互相翻譯。如將英語、西班牙語、韓語放在同一個翻譯模型中進行翻譯。在外界看來,谷歌翻譯之所以能夠做到如此快速,主要歸功于多年的積累以及Tensor Processing Unit(張量處理單元,簡稱TPU)處理器的引入。
- 蜜度索驥:以跨模態(tài)檢索技術(shù)助力“企宣”向上生長
- 泡沫破滅:韓國SKT關(guān)閉元宇宙服務平臺
- 涉嫌違規(guī)失信行為 咪咕視訊遭軍采網(wǎng)暫停全軍采購資格
- 中信科移動孫韶輝:6G通感算智融合,驅(qū)動以用戶為中心的網(wǎng)絡變革
- 泡沫破滅:韓國SKT關(guān)閉元宇宙服務平臺
- 30億美元缺口已補 美國將全面拆除中國電信設(shè)備
- 30億美元缺口已補 美國將全面拆除中國電信設(shè)備
- 400G:骨干網(wǎng)的最新趨勢
- 三大運營商11月成績單:用戶數(shù)據(jù)增幅放緩
- 2025年數(shù)字錢包:重塑金融生態(tài)的領(lǐng)先應用
- 什么是聚合交換機?
免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關(guān)資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。