文|曾響鈴
來(lái)源|科技向令說(shuō)(xiangling0815)
百度翻譯日活迎來(lái)新一輪逆勢(shì)增長(zhǎng):2020年Q1日活較上一季度環(huán)比增長(zhǎng)10%,較去年Q1同比增長(zhǎng)40%,這還是在在業(yè)內(nèi)大盤(pán)增長(zhǎng)整體放緩的前提下。
同時(shí),百度翻譯目前可支持語(yǔ)種擴(kuò)充到200個(gè),翻譯方向近4萬(wàn)個(gè),每天來(lái)自世界各地的翻譯請(qǐng)求字符量超過(guò)千億,相當(dāng)于2000部大英百科全書(shū),平均每秒鐘就要翻譯超過(guò)1百萬(wàn)字符。
百度翻譯日活的增長(zhǎng),我們或可將歸結(jié)為疫情的推動(dòng)。
一方面是學(xué)生們?cè)诩覍W(xué)習(xí)、在線學(xué)習(xí),有了更多時(shí)間通過(guò)手機(jī)和電腦使用百度翻譯(在校學(xué)習(xí)期間K12學(xué)生不能使用手機(jī));另一方面,疫情背景下,跨過(guò)的多語(yǔ)言溝通變得更加重要,跨語(yǔ)言的信息分享變得緊迫,百度翻譯正好滿足了突然集中爆發(fā)的市場(chǎng)需求。
當(dāng)然,這并不是百度布局翻譯方向十年以來(lái)能持續(xù)保持增長(zhǎng)的全部,在翻譯之外,百度翻譯還藏著更多“秘密”。
好的翻譯產(chǎn)品,從來(lái)不只是“翻得準(zhǔn)確”
在過(guò)去很長(zhǎng)一段時(shí)間內(nèi),“準(zhǔn)確率”是評(píng)判一款翻譯產(chǎn)品是否優(yōu)秀的唯一標(biāo)準(zhǔn),因而所有的翻譯產(chǎn)品都在準(zhǔn)確率上“做文章”,從各個(gè)維度的“成績(jī)”來(lái)說(shuō)明自己在這方面有多厲害,但事實(shí)上,隨著越來(lái)越多AI技術(shù)融入到翻譯產(chǎn)品,其體驗(yàn)好壞的評(píng)判維度變得多元起來(lái)。
首先,在翻譯的廣度和速度方面,要不斷擴(kuò)充與突破。
前者不應(yīng)只局限在主流語(yǔ)言的互通上,而應(yīng)尋求更大范圍內(nèi)的多語(yǔ)言互譯,做到真正意義上的“與世界對(duì)話”;后者的最高境界是同聲傳譯。
道理大家都懂,但做起來(lái)才知道為什么這兩項(xiàng)能力不是每家都有,其原因就在于太難了。
翻譯廣度牽涉到小語(yǔ)種語(yǔ)言的訓(xùn)練資源,全球5000多種語(yǔ)言,有一半的語(yǔ)言使用者不到萬(wàn)人,很大一部分小語(yǔ)種語(yǔ)言的訓(xùn)練數(shù)據(jù)只有幾萬(wàn)條甚至幾千條,難以邁過(guò)翻譯的門(mén)檻。
翻譯速度牽涉到時(shí)間延遲和翻譯質(zhì)量難以平衡的難題,導(dǎo)致很多翻譯產(chǎn)品的同聲傳譯體驗(yàn)很難盡人所意。
百度翻譯通過(guò)模型上的創(chuàng)新,比如在多語(yǔ)言翻譯技術(shù)上,提出基于多任務(wù)學(xué)習(xí)的翻譯模型、多智能體聯(lián)合學(xué)習(xí)模型等,使多個(gè)語(yǔ)言可以共享模型表示,再經(jīng)過(guò)回譯技術(shù)進(jìn)行數(shù)據(jù)增強(qiáng),使得1個(gè)季度之內(nèi),翻譯語(yǔ)種擴(kuò)充了近7倍,目前支持200種語(yǔ)言互譯,是全球支持語(yǔ)種數(shù)量最多的翻譯系統(tǒng)。
在同聲傳譯領(lǐng)域上,百度翻譯又相繼提出了可控時(shí)延的翻譯模型、語(yǔ)義單元驅(qū)動(dòng)的上下文感知翻譯模型等,在技術(shù)獲得了突破,不但開(kāi)放了全球首個(gè)面向真實(shí)場(chǎng)景的中英文同傳數(shù)據(jù)集,還舉辦了首屆同傳評(píng)測(cè),促進(jìn)本領(lǐng)域技術(shù)發(fā)展。
還有一個(gè)值得一說(shuō)的案例,由前沿科技領(lǐng)域頂級(jí)科學(xué)家參與的iCANX Talks(全球前沿科技直播)主辦方之前嘗試了多款翻譯產(chǎn)品,對(duì)翻譯效果都不甚滿意,直到近期才更換為百度翻譯。
其次,翻譯產(chǎn)品的使用場(chǎng)景不應(yīng)只局限在原始的文本或語(yǔ)音輸入場(chǎng)景中,還應(yīng)更加豐富和多元。
在技術(shù)不斷強(qiáng)化的今天,用戶追求的產(chǎn)品體驗(yàn)變得更加全面和多樣,如果只有“結(jié)果”而沒(méi)有細(xì)節(jié)豐滿的過(guò)程,哪怕有100%的準(zhǔn)確率,也因?yàn)橐粋€(gè)字一個(gè)字地輸入而產(chǎn)生干澀的使用感受,市場(chǎng)不會(huì)買(mǎi)賬,用戶也不會(huì)買(mǎi)單。
百度翻譯除了文本和語(yǔ)音這兩種常規(guī)的輸入翻譯功能之外,其PC文檔翻譯功能支持word、pdf、ppt、excel等多種格式,支持中英、中日、中韓互譯,一鍵上傳,實(shí)現(xiàn)不限字?jǐn)?shù)快速翻譯,保留文檔樣式排版,原文譯文對(duì)照查看,并支持免費(fèi)導(dǎo)出,提升文檔翻譯效率。
視頻翻譯領(lǐng)域,百度翻譯攜手人人譯視界聯(lián)合推出了百度視頻翻譯平臺(tái),只需上傳視頻文件并填寫(xiě)必要信息,即可一站式獲取AI和人工視頻翻譯結(jié)果。
除此之外,百度翻譯在拍照翻譯、實(shí)景AR翻譯、對(duì)話翻譯等場(chǎng)景中通過(guò)AI技術(shù)的融合持續(xù)在對(duì)體驗(yàn)細(xì)節(jié)進(jìn)行改善。
可以預(yù)料的是,來(lái)源于百度的AI技術(shù)基底,百度翻譯在幫助用戶更好地完成翻譯這件事上,未來(lái)或?qū)⒃黾痈鄤?chuàng)新性的技術(shù)體驗(yàn)。
最后,要從“語(yǔ)言轉(zhuǎn)換”的狹隘產(chǎn)品認(rèn)知中跳出。
“語(yǔ)言轉(zhuǎn)換”是翻譯產(chǎn)品的基本盤(pán),但如果只盯著“語(yǔ)言轉(zhuǎn)換”,就將翻譯產(chǎn)品劃定了一個(gè)局限的牢籠。
借助著AI的能量,翻譯產(chǎn)品的路子可以變得更寬,也更能符合當(dāng)前所有APP都開(kāi)始提供關(guān)聯(lián)多樣化服務(wù)的趨勢(shì)。
如何理解?
百度翻譯在業(yè)界首先推出了第四代AI詞典,可以為用戶提供個(gè)性化、可互動(dòng)、智能化、視頻化的“生動(dòng)”體驗(yàn),主要增加了面向?qū)W生群體的單詞考頻及題型大數(shù)據(jù),單詞講解及情景演繹小視頻,相關(guān)知識(shí)內(nèi)容個(gè)性化推薦,AI互動(dòng)跟讀評(píng)測(cè),多模態(tài)智能取詞等功能。
例如,產(chǎn)品啟動(dòng)時(shí),用戶只要完成個(gè)人身份及目標(biāo)(或興趣)的填寫(xiě),就能夠體驗(yàn)到資訊流帶來(lái)的專屬定制化推薦。
又例如,在學(xué)習(xí)場(chǎng)景下,能夠根據(jù)用戶的查詞歷史為用戶智能推薦講解視頻;在英語(yǔ)學(xué)習(xí)十分重要的發(fā)音方面,百度翻譯能夠?qū)τ脩舻母x進(jìn)行智能評(píng)分糾錯(cuò)。
文章開(kāi)頭提到,疫情期間讓學(xué)生們有了更多使用百度翻譯的機(jī)會(huì),如果說(shuō)這是特殊情況下的被動(dòng)拉新,那么通過(guò)第四代AI詞典的能力,百度翻譯或?qū)⑦M(jìn)一步強(qiáng)化用戶粘性,從而形成對(duì)新增用戶的留存,繼續(xù)在后續(xù)競(jìng)爭(zhēng)保持領(lǐng)跑。
從更開(kāi)闊的視野來(lái)看,百度翻譯某種程度上可以成為一種生活方式,在產(chǎn)品中內(nèi)置與翻譯相關(guān)的原創(chuàng)內(nèi)容,在常規(guī)信息流(例如百度APP)之外給出了一個(gè)垂直的專業(yè)的信息獲取方式。而與翻譯相關(guān)的內(nèi)容很多,旅行、人文、美食、探索,這些內(nèi)容更深度也更體現(xiàn)翻譯的生活化信息。
也正是因?yàn)樵凇皽?zhǔn)確率”之外,百度翻譯豐富了翻譯產(chǎn)品的體驗(yàn)細(xì)節(jié),來(lái)自用戶的反饋也是一面倒的好評(píng),百度翻譯APP的下載評(píng)論區(qū)中大批網(wǎng)友寫(xiě)道:“文檔翻譯功能非常好用,把文檔拖進(jìn)翻譯框里數(shù)秒就能翻譯出保留原格式的譯文,節(jié)省了我們數(shù)倍的工作時(shí)間”、“在學(xué)術(shù)文章上百度翻譯表現(xiàn)非常出色!”“全篇拍照翻譯厲害到飛起”……
產(chǎn)品體驗(yàn)是基礎(chǔ),社會(huì)責(zé)任是高度
體驗(yàn)是一款優(yōu)秀翻譯產(chǎn)品的基本盤(pán),但若要夠領(lǐng)跑行業(yè),還在于其通過(guò)技術(shù)建立起行業(yè)優(yōu)勢(shì)之后所釋放出的社會(huì)價(jià)值。
在目前正在進(jìn)行的疫情當(dāng)中,百度翻譯就向公眾積極提供自己的能力,將中國(guó)抗疫經(jīng)驗(yàn)精準(zhǔn)推向全球,以及服務(wù)防疫志愿者團(tuán)隊(duì),開(kāi)放翻譯醫(yī)療定制服務(wù),體現(xiàn)出一家有責(zé)任企業(yè)的社會(huì)擔(dān)當(dāng)。
在這里不得不提到百度翻譯的多領(lǐng)域翻譯技術(shù),采用預(yù)訓(xùn)練+精細(xì)化訓(xùn)練、以及領(lǐng)域自適應(yīng)方法,研發(fā)了領(lǐng)域定制翻譯引擎。
在疫情發(fā)生初期,百度翻譯第一時(shí)間免費(fèi)對(duì)外開(kāi)放了生物醫(yī)藥垂直領(lǐng)域翻譯。深度定制生物醫(yī)藥領(lǐng)域中英互譯模型,截止目前已累計(jì)服務(wù)上百萬(wàn)用戶,累計(jì)翻譯字符達(dá)7.6億。
此外,百度翻譯還緊急成立了專項(xiàng)小組,兩天內(nèi)開(kāi)發(fā)搭建并免費(fèi)開(kāi)放了醫(yī)療領(lǐng)域定制化翻譯產(chǎn)品,同時(shí)為千余名防疫志愿者,定向提供單獨(dú)醫(yī)療領(lǐng)域頁(yè)面,包括免費(fèi)的術(shù)語(yǔ)定制、圖片翻譯、文檔翻譯等功能。
隨著疫情在全球范圍的蔓延,百度翻譯新增了包括波斯語(yǔ)在內(nèi)的172個(gè)語(yǔ)種,累計(jì)上線語(yǔ)種達(dá)200個(gè),累計(jì)翻譯方向約4萬(wàn)個(gè),覆蓋全球約180個(gè)國(guó)家的74億人口,讓疫情信息的共享更加平等和便捷。
為將防疫的“中國(guó)經(jīng)驗(yàn)”及時(shí)分享出去,百度翻譯不僅免費(fèi)開(kāi)放覆蓋病毒、疫情、癥狀、防護(hù)等多維度重點(diǎn)詞語(yǔ)的多語(yǔ)種疫情詞典,為馳援海外抗疫的中國(guó)志愿者提供更準(zhǔn)確的翻譯結(jié)果,還攜手中新視頻、人人譯視界,為國(guó)際疫情嚴(yán)峻地區(qū)提供防疫視頻翻譯,讓“中國(guó)經(jīng)驗(yàn)”在全球抗疫中發(fā)揮更大作用。
我們可以看出,百度翻譯在疫情防控這件事上,不光提供自己的能力,還拉上了生態(tài)伙伴們一同參與,眾人拾柴火焰高,推動(dòng)的不光是防疫工作,更重要的是在更大的范圍內(nèi)提高了社會(huì)對(duì)防疫工作的重視以及對(duì)疫情危害的認(rèn)知。
在提供翻譯服務(wù)的對(duì)象上,也不僅限于中國(guó)的疫情防控工作,而是著眼全球,站在更高的公益高度,也正是因?yàn)槿绱耍俣确g收到了很多正面反饋:“文檔翻譯功能非常好用,把文檔拖進(jìn)翻譯框里數(shù)秒就能翻譯出保留原格式的譯文,很驚喜,這個(gè)細(xì)節(jié)節(jié)省了我們數(shù)倍的工作時(shí)間”、 “在學(xué)術(shù)文章上百度翻譯表現(xiàn)非常出色!”等。
疫情使得全球人民更加緊密團(tuán)結(jié)起來(lái)共同面對(duì)困難,也讓百度翻譯獲得了一次極好的歷練機(jī)會(huì)。正是因?yàn)榘俣确g近十年來(lái)兢兢業(yè)業(yè)打磨技術(shù),不斷創(chuàng)造滿足用戶需求的產(chǎn)品,提升體驗(yàn),才得以在疫情期間獲得口碑傳播,引來(lái)日活增加。
通過(guò)助力防疫,展示出的是百度翻譯的技術(shù)力量與產(chǎn)品情懷。
百度翻譯的發(fā)展史,翻譯產(chǎn)品的三級(jí)跳
上文主要分析的是百度翻譯當(dāng)前所構(gòu)建起的護(hù)城河,然而當(dāng)我們回頭環(huán)視百度翻譯的發(fā)展歷程,可以發(fā)現(xiàn)正是在百度翻譯的帶動(dòng)下,翻譯產(chǎn)品這才完成從工具到產(chǎn)品,再到交互服務(wù)的三階進(jìn)化。
1、工具階段:百度利用技術(shù)沉淀解決翻譯工具從無(wú)到有
早在2010年初,百度就已經(jīng)組建了機(jī)器翻譯的核心研發(fā)團(tuán)隊(duì),籌備在翻譯領(lǐng)域有所作為。作為全球最大的中文搜索引擎,百度與“語(yǔ)言翻譯”這件事天然親近,僅一年半后的2011年6月,百度就正式推出了web端“百度翻譯”產(chǎn)品。
這個(gè)階段,可以認(rèn)為是百度翻譯利用了百度已有的技術(shù)積淀解決翻譯工具從無(wú)到有的過(guò)程。
此時(shí)的百度翻譯,使用的是百度自主研發(fā)的翻譯核心技術(shù),其原理是機(jī)器自動(dòng)從大量語(yǔ)料中學(xué)習(xí)并自動(dòng)生成翻譯結(jié)果,不經(jīng)過(guò)任何人工整理與編輯。
2、產(chǎn)品階段:與AI融合帶來(lái)更多翻譯體驗(yàn)
隨著移動(dòng)互聯(lián)網(wǎng)時(shí)代到來(lái),把PC端的工具變成移動(dòng)端的隨身產(chǎn)品成為一時(shí)的浪潮,2013年2月百度翻譯發(fā)布Android客戶端(iOS在半個(gè)月后發(fā)布),首次在Android平臺(tái)上支持離線翻譯應(yīng)用。
這一過(guò)程,是翻譯產(chǎn)品與AI逐步結(jié)合,帶來(lái)更多翻譯體驗(yàn)的過(guò)程。
百度翻譯背靠百度強(qiáng)大的AI技術(shù),將AI能力與產(chǎn)品逐步融合,既可以認(rèn)為是領(lǐng)先行業(yè)、獲取競(jìng)爭(zhēng)優(yōu)勢(shì)的舉動(dòng),也可以看作在為整個(gè)翻譯產(chǎn)品門(mén)類與AI融合“探路”。
3、交互服務(wù)階段:圍繞用戶、內(nèi)容、服務(wù)的多維度融合
隨著AI滲透的不斷深入,百度翻譯在“翻譯”這件事上的智能化程度大大提高。
比如百度翻譯推出的第四代AI詞典實(shí)現(xiàn)了專屬定制化內(nèi)容推送與服務(wù)的融合,甚至還能為用戶的英語(yǔ)學(xué)習(xí)提供輔助服務(wù)。
從以上三個(gè)階段跨越看出,行業(yè)與百度翻譯一樣,也在經(jīng)歷從翻譯得更好,到翻譯得更便利,再到翻譯有更多應(yīng)用的進(jìn)化。
如今,百度翻譯的產(chǎn)品形態(tài)已經(jīng)跨越了傳統(tǒng)翻譯產(chǎn)品古板的工具形象,其使用場(chǎng)景和用戶圈層也在不斷擴(kuò)大,隨著能力的不斷提升,百度翻譯也正在抹平語(yǔ)言之間的障礙,翻譯產(chǎn)品讓中國(guó)與世界的溝通更加順暢的同時(shí),也帶來(lái)了見(jiàn)識(shí)和眼界的提高。
“與世界更好地溝通”是百度翻譯的愿景。
在過(guò)去十年,百度翻譯致力于提升翻譯的精準(zhǔn)度廣度和速度、改變翻譯的輸入方式、豐富翻譯產(chǎn)品的應(yīng)用場(chǎng)景等,在下一個(gè)十年,隨著產(chǎn)品形態(tài)的進(jìn)一步進(jìn)化,百度翻譯或?qū)⒃谟谑澜纭皩?duì)話”的同時(shí),講出更多在翻譯之外的故事。
*此內(nèi)容為【科技向令說(shuō)】原創(chuàng),未經(jīng)授權(quán),任何人不得以任何方式使用,包括轉(zhuǎn)載、摘編、復(fù)制或建立鏡像。
【完】
曾響鈴
1鈦媒體、品途、人人都是產(chǎn)品經(jīng)理等多家創(chuàng)投、科技網(wǎng)站年度十大作者;
2虎嘯獎(jiǎng)評(píng)委;
3作家:【移動(dòng)互聯(lián)網(wǎng)+ 新常態(tài)下的商業(yè)機(jī)會(huì)】等暢銷(xiāo)書(shū)作者;
4《中國(guó)經(jīng)營(yíng)報(bào)》《商界》《商界評(píng)論》《銷(xiāo)售與市場(chǎng)》等近十家報(bào)刊、雜志特約評(píng)論員;
5鈦媒體、36kr、虎嗅、界面、澎湃新聞等近80家專欄作者;
6“腦藝人”(腦力手藝人)概念提出者,現(xiàn)演變?yōu)椤白悦襟w”,成為一個(gè)行業(yè);
7騰訊全媒派榮譽(yù)導(dǎo)師、多家科技智能公司傳播顧問(wèn)。
- 蜜度索驥:以跨模態(tài)檢索技術(shù)助力“企宣”向上生長(zhǎng)
- 美媒聚焦比亞迪“副業(yè)”:電子代工助力蘋(píng)果,下個(gè)大計(jì)劃瞄準(zhǔn)AI機(jī)器人
- 微信零錢(qián)通新政策:銀行卡轉(zhuǎn)入資金提現(xiàn)免手續(xù)費(fèi)引熱議
- 消息稱塔塔集團(tuán)將收購(gòu)和碩印度iPhone代工廠60%股份 并接管日常運(yùn)營(yíng)
- 蘋(píng)果揭秘自研芯片成功之道:領(lǐng)先技術(shù)與深度整合是關(guān)鍵
- 英偉達(dá)新一代Blackwell GPU面臨過(guò)熱挑戰(zhàn),交付延期引發(fā)市場(chǎng)關(guān)注
- 馬斯克能否成為 AI 部部長(zhǎng)?硅谷與白宮的聯(lián)系日益緊密
- 余承東:Mate70將在26號(hào)發(fā)布,意外泄露引發(fā)關(guān)注
- 無(wú)人機(jī)“黑科技”亮相航展:全球首臺(tái)低空重力測(cè)量系統(tǒng)引關(guān)注
- 賽力斯發(fā)布聲明:未與任何伙伴聯(lián)合開(kāi)展人形機(jī)器人合作
- 賽力斯觸及漲停,汽車(chē)整車(chē)股盤(pán)初強(qiáng)勢(shì)拉升
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。