百度翻譯日活迎來新一輪逆勢增長:2020年Q1日活較上一季度環(huán)比增長10%,較去年Q1同比增長40%,這還是在在業(yè)內(nèi)大盤增長整體放緩的前提下。
同時(shí),百度翻譯目前可支持語種擴(kuò)充到200個(gè),翻譯方向近4萬個(gè),每天來自世界各地的翻譯請求字符量超過千億,相當(dāng)于2000部大英百科全書,平均每秒鐘就要翻譯超過1百萬字符。
百度翻譯日活的增長,我們或可將歸結(jié)為疫情的推動(dòng)。
一方面是學(xué)生們在家學(xué)習(xí)、在線學(xué)習(xí),有了更多時(shí)間通過手機(jī)和電腦使用百度翻譯(在校學(xué)習(xí)期間K12學(xué)生不能使用手機(jī));另一方面,疫情背景下,跨過的多語言溝通變得更加重要,跨語言的信息分享變得緊迫,百度翻譯正好滿足了突然集中爆發(fā)的市場需求。
當(dāng)然,這并不是百度布局翻譯方向十年以來能持續(xù)保持增長的全部,在翻譯之外,百度翻譯還藏著更多“秘密”。
好的翻譯產(chǎn)品,從來不只是“翻得準(zhǔn)確”
在過去很長一段時(shí)間內(nèi),“準(zhǔn)確率”是評判一款翻譯產(chǎn)品是否優(yōu)秀的唯一標(biāo)準(zhǔn),因而所有的翻譯產(chǎn)品都在準(zhǔn)確率上“做文章”,從各個(gè)維度的“成績”來說明自己在這方面有多厲害,但事實(shí)上,隨著越來越多AI技術(shù)融入到翻譯產(chǎn)品,其體驗(yàn)好壞的評判維度變得多元起來。
首先,在翻譯的廣度和速度方面,要不斷擴(kuò)充與突破。
前者不應(yīng)只局限在主流語言的互通上,而應(yīng)尋求更大范圍內(nèi)的多語言互譯,做到真正意義上的“與世界對話”;后者的最高境界是同聲傳譯。
道理大家都懂,但做起來才知道為什么這兩項(xiàng)能力不是每家都有,其原因就在于太難了。
翻譯廣度牽涉到小語種語言的訓(xùn)練資源,全球5000多種語言,有一半的語言使用者不到萬人,很大一部分小語種語言的訓(xùn)練數(shù)據(jù)只有幾萬條甚至幾千條,難以邁過翻譯的門檻。
翻譯速度牽涉到時(shí)間延遲和翻譯質(zhì)量難以平衡的難題,導(dǎo)致很多翻譯產(chǎn)品的同聲傳譯體驗(yàn)很難盡人所意。
百度翻譯通過模型上的創(chuàng)新,比如在多語言翻譯技術(shù)上,提出基于多任務(wù)學(xué)習(xí)的翻譯模型、多智能體聯(lián)合學(xué)習(xí)模型等,使多個(gè)語言可以共享模型表示,再經(jīng)過回譯技術(shù)進(jìn)行數(shù)據(jù)增強(qiáng),使得1個(gè)季度之內(nèi),翻譯語種擴(kuò)充了近7倍,目前支持200種語言互譯,是全球支持語種數(shù)量最多的翻譯系統(tǒng)。
在同聲傳譯領(lǐng)域上,百度翻譯又相繼提出了可控時(shí)延的翻譯模型、語義單元驅(qū)動(dòng)的上下文感知翻譯模型等,在技術(shù)獲得了突破,不但開放了全球首個(gè)面向真實(shí)場景的中英文同傳數(shù)據(jù)集,還舉辦了首屆同傳評測,促進(jìn)本領(lǐng)域技術(shù)發(fā)展。
還有一個(gè)值得一說的案例,由前沿科技領(lǐng)域頂級科學(xué)家參與的iCANX Talks(全球前沿科技直播)主辦方之前嘗試了多款翻譯產(chǎn)品,對翻譯效果都不甚滿意,直到近期才更換為百度翻譯。
其次,翻譯產(chǎn)品的使用場景不應(yīng)只局限在原始的文本或語音輸入場景中,還應(yīng)更加豐富和多元。
在技術(shù)不斷強(qiáng)化的今天,用戶追求的產(chǎn)品體驗(yàn)變得更加全面和多樣,如果只有“結(jié)果”而沒有細(xì)節(jié)豐滿的過程,哪怕有100%的準(zhǔn)確率,也因?yàn)橐粋€(gè)字一個(gè)字地輸入而產(chǎn)生干澀的使用感受,市場不會(huì)買賬,用戶也不會(huì)買單。
百度翻譯除了文本和語音這兩種常規(guī)的輸入翻譯功能之外,其PC文檔翻譯功能支持word、pdf、ppt、excel等多種格式,支持中英、中日、中韓互譯,一鍵上傳,實(shí)現(xiàn)不限字?jǐn)?shù)快速翻譯,保留文檔樣式排版,原文譯文對照查看,并支持免費(fèi)導(dǎo)出,提升文檔翻譯效率。
視頻翻譯領(lǐng)域,百度翻譯攜手人人譯視界聯(lián)合推出了百度視頻翻譯平臺,只需上傳視頻文件并填寫必要信息,即可一站式獲取AI和人工視頻翻譯結(jié)果。
除此之外,百度翻譯在拍照翻譯、實(shí)景AR翻譯、對話翻譯等場景中通過AI技術(shù)的融合持續(xù)在對體驗(yàn)細(xì)節(jié)進(jìn)行改善。
可以預(yù)料的是,來源于百度的AI技術(shù)基底,百度翻譯在幫助用戶更好地完成翻譯這件事上,未來或?qū)⒃黾痈鄤?chuàng)新性的技術(shù)體驗(yàn)。
最后,要從“語言轉(zhuǎn)換”的狹隘產(chǎn)品認(rèn)知中跳出。
1234下一頁>(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實(shí),并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )