精品国产亚洲一区二区三区|亚洲国产精彩中文乱码AV|久久久久亚洲AV综合波多野结衣|漂亮少妇各种调教玩弄在线

<blockquote id="ixlwe"><option id="ixlwe"></option></blockquote>
  • <span id="ixlwe"></span>

  • <abbr id="ixlwe"></abbr>

    親測(cè)|Google翻譯內(nèi)核升級(jí):大型數(shù)據(jù)集神經(jīng)機(jī)器翻譯加持 稱誤差再降超55%

    5月8日消息,近期,Google翻譯悄然升級(jí)了其翻譯內(nèi)核。據(jù)Google官方提供的數(shù)據(jù)顯示,Google翻譯搭載的Google的神經(jīng)機(jī)器翻譯(GNMT:Google Neural Machine Translation)系統(tǒng)使用了當(dāng)前最先進(jìn)的訓(xùn)練技術(shù),因而提升了機(jī)器翻譯水平,將翻譯誤差再度降低了55%-85%。

    Google展示的翻譯模型質(zhì)量

    十多年前,Google發(fā)布了Google翻譯,早年基于短語(yǔ)的統(tǒng)計(jì)機(jī)器翻譯,會(huì)將輸入句子分解成詞和短語(yǔ),然后對(duì)它們進(jìn)行獨(dú)立翻譯。這種翻譯方式的劣勢(shì)非常明顯:句子中原本完整的信息被碎片化,無(wú)法連貫地進(jìn)行表達(dá)。而這種現(xiàn)象在英中互譯的情況下顯得尤其明顯。

    而Google神經(jīng)機(jī)器翻譯則將輸入的句子作為一個(gè)整體翻譯。

    以中英翻譯為例,Google神經(jīng)機(jī)器翻譯首先將這句中文的詞編碼成一個(gè)向量列表,其中每個(gè)向量都表示了到目前為止所有被讀取到的詞的含義(編碼器“Encoder”)。讀取完整個(gè)句子,解碼器就開(kāi)始工作——一次生成英語(yǔ)句子的一個(gè)詞(解碼器“Decoder”)。

    上圖展示了Google神經(jīng)機(jī)器翻譯的中英翻譯原理

    為了在每一步都生成翻譯正確的詞,解碼器重點(diǎn)注意了與生成英語(yǔ)詞最相關(guān)編碼的中文向量的權(quán)重分布。

    在被首次提出時(shí),神經(jīng)機(jī)器翻譯系統(tǒng)在中等規(guī)模的數(shù)據(jù)集上就與基于短語(yǔ)的翻譯系統(tǒng)水平相當(dāng)。

    現(xiàn)在,Google方面表示,通過(guò)讓神經(jīng)機(jī)器翻譯戰(zhàn)勝在非常大型的數(shù)據(jù)集上工作的許多挑戰(zhàn),打造了在速度和準(zhǔn)確度上都更好翻譯的系統(tǒng)。

    目前,Google神經(jīng)機(jī)器翻譯系統(tǒng)已投入到了中文-英語(yǔ)的翻譯中。現(xiàn)在,移動(dòng)版和網(wǎng)頁(yè)版的Google翻譯的中英翻譯已完全使用神經(jīng)機(jī)器翻譯——每天大約1800萬(wàn)條翻譯。

    有經(jīng)過(guò)大型數(shù)據(jù)集考驗(yàn)的Google神經(jīng)機(jī)器翻譯系統(tǒng)加持,最新的Google翻譯效果究竟如何呢?

    我們做了一個(gè)簡(jiǎn)單的比較測(cè)試。當(dāng)然,還是在中英翻譯場(chǎng)景下。

    測(cè)試場(chǎng)景:PC端 Google翻譯網(wǎng)頁(yè)版

    隨機(jī)選擇了一則英文消息,原文如下:

    Since COVID-19 began, we’ve heard from our retail and brand manufacturing partners that they’re hungry for more insights on how consumer interests are changing, given fluctuations in consumer demand. We see these changes reflected in how people are searching on Google. Last month, there were spikes in search interest for household supplies and jigsaw puzzles as people spent more time at home. This month we’ve seen surging interest for sewing machines and baking materials in the U.S., and tetherball sets and chalk in the United Kingdom and Australia.

    Businesses are using a variety of resources to understand changing consumer interests—including Google Trends, social listening, surveys, and their own data—in order to help make decisions on the fly. But if they don’t know what to look for, there isn’t an easy way to understand which product categories are gaining in popularity, and might pose an opportunity.

    That’s why we’re launching a rising retail categories tool on Think with Google. It surfaces fast-growing, product-related categories in Google Search, the locations where they’re growing, and the queries associated with them. This is the first time we’ve provided this type of insight on the product categories that people are searching for.

    舊版Google翻譯給出的英譯中結(jié)果:

    升級(jí)后Google翻譯給出的英譯中新結(jié)果,紅色標(biāo)記字部分為與舊翻譯結(jié)果的不同地方。新版翻譯具體如下:

    對(duì)比兩段翻譯結(jié)果,可以看出區(qū)別還挺大的。整體而言,新版翻譯結(jié)果中標(biāo)紅文字的表述明顯更符合漢語(yǔ)的語(yǔ)法和表述習(xí)慣。

    另外,最后一段的翻譯結(jié)果優(yōu)化則更為明顯,對(duì)Google產(chǎn)品名稱“Think with Google”進(jìn)行了準(zhǔn)確識(shí)別,避免了亂翻譯的尷尬。

    確實(shí)更智能啦!

    極客網(wǎng)企業(yè)會(huì)員

    免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。

    2020-05-08
    親測(cè)|Google翻譯內(nèi)核升級(jí):大型數(shù)據(jù)集神經(jīng)機(jī)器翻譯加持 稱誤差再降超55%
    近期,Google翻譯悄然升級(jí)了其翻譯內(nèi)核。據(jù)Google官方提供的數(shù)據(jù)顯示,Google翻譯搭載的Google的神經(jīng)機(jī)器翻譯GNMT系統(tǒng)使用了當(dāng)前最先進(jìn)的訓(xùn)練

    長(zhǎng)按掃碼 閱讀全文