原標(biāo)題:與朱廣權(quán)在線battle,百度智能云AI手語(yǔ)主播正式上崗
近日,一則段子手朱廣權(quán)與“手語(yǔ)主播”在線pk的視頻火了,剛剛上線播放量就突破百萬(wàn)。視頻中,朱廣權(quán)用超快語(yǔ)速的順口溜挑戰(zhàn)“手語(yǔ)主播”的“手速”,而這位手語(yǔ)主播也憑過(guò)硬的專業(yè)能力輕松應(yīng)戰(zhàn)。事實(shí)上,這位手語(yǔ)主播不是真人,而是一位虛擬數(shù)字人。
這位數(shù)字人是由“百度智能云曦靈”數(shù)字人平臺(tái)打造的首個(gè)AI手語(yǔ)主播。她形象親切自然,專業(yè)能力出色,在剛剛開啟的冰雪賽事中,百度智能云AI手語(yǔ)主播已經(jīng)上線,為聽(tīng)障用戶提供24小時(shí)的手語(yǔ)服務(wù),讓他們也能快捷地獲取賽事資訊。
(AI手語(yǔ)主播)
據(jù)統(tǒng)計(jì),全球約有4.3億人患中度及以上聽(tīng)力障礙,根據(jù)全國(guó)第二次殘疾人抽樣調(diào)查數(shù)據(jù),中國(guó)有聽(tīng)障人士2780萬(wàn)。他們雖然聽(tīng)不到賽場(chǎng)的聲音,但同樣希望感受賽事的精彩。AI手語(yǔ)數(shù)字人無(wú)疑成為了他們觀賽的重要橋梁。
百度集團(tuán)副總裁吳甜表示:“百度已發(fā)布集數(shù)字人生產(chǎn)、內(nèi)容創(chuàng)作、業(yè)務(wù)配置服務(wù)為一體的智能數(shù)字人平臺(tái)——百度智能云曦靈,百度希望通過(guò)領(lǐng)先的全棧AI能力,把虛擬人的生產(chǎn)周期縮短到小時(shí)級(jí)別,降低生產(chǎn)成本,并且用AI驅(qū)動(dòng)生成內(nèi)容?!?/p>
研發(fā)一款A(yù)I手語(yǔ)主播有多難?
手語(yǔ)數(shù)字人的本質(zhì)是在解決翻譯問(wèn)題。
區(qū)別于傳統(tǒng)翻譯,手語(yǔ)翻譯的難點(diǎn)在于:手語(yǔ)并非按照語(yǔ)言逐字翻譯,而需要根據(jù)語(yǔ)句整體意思進(jìn)行語(yǔ)言精煉和語(yǔ)序調(diào)整,同時(shí)還需實(shí)時(shí)配合表情和唇語(yǔ),幫助聽(tīng)障者更好的理解。這就導(dǎo)致AI手語(yǔ)數(shù)字人在信息凝練度、低時(shí)延和精細(xì)化三方面面臨極其復(fù)雜的技術(shù)難題。因此,AI手語(yǔ)主播不僅需要具備高精度的數(shù)字人形象,還需要具備能夠語(yǔ)音識(shí)別、手語(yǔ)翻譯和手語(yǔ)表達(dá)的AI大腦。
(AI手語(yǔ)主播面部細(xì)節(jié)圖)
從外形看,對(duì)比以往AI主播形象,百度智能云打造的AI手語(yǔ)主播不僅高度還原真人發(fā)膚,且在立體感、靈活度、可塑性上都有大幅提升。據(jù)悉,百度智能云建立了規(guī)模龐大的手語(yǔ)動(dòng)作庫(kù),基于《國(guó)家通用手語(yǔ)詞典》規(guī)范,結(jié)合動(dòng)作捕捉設(shè)備和真實(shí)手語(yǔ)老師的雙向調(diào)優(yōu),精修近1萬(wàn)個(gè)手語(yǔ)動(dòng)作,保證了手語(yǔ)表達(dá)的動(dòng)作準(zhǔn)確性。同時(shí)首創(chuàng)4D掃描技術(shù),使得AI手語(yǔ)主播表情自然生動(dòng),口型生成準(zhǔn)確度高達(dá)98.5%。
而她的“AI大腦“則依托于百度智能云。通過(guò)百度自主研發(fā)的機(jī)器翻譯技術(shù),百度智能云構(gòu)建出?套精確的手語(yǔ)翻譯引擎,可懂度達(dá)到85%以上,媲美主流的中英、中日等方向的機(jī)器翻譯結(jié)果,達(dá)到業(yè)界領(lǐng)先水平,結(jié)合百度自研的語(yǔ)音識(shí)別技術(shù),可將冰雪賽事的文字及音視頻內(nèi)容,快速精準(zhǔn)的轉(zhuǎn)化為手語(yǔ);同時(shí)再通過(guò)專為手語(yǔ)優(yōu)化的自然動(dòng)作引擎,完成AI手語(yǔ)主播的動(dòng)作驅(qū)動(dòng),實(shí)時(shí)演繹為數(shù)字人的動(dòng)作、表情和唇語(yǔ)。這保證了AI手語(yǔ)主播具備高可懂度的手語(yǔ)表達(dá)能力和精準(zhǔn)連貫的呈現(xiàn)效果。
據(jù)了解,如此復(fù)雜的數(shù)字人研發(fā)工作,百度只用了不到2個(gè)月。百度方面表示,虛擬數(shù)字人要為人類提供服務(wù)、與人自然地交流,需要背后強(qiáng)大的知識(shí)體系和對(duì)話能力支撐。百度知識(shí)圖譜積累的5500億知識(shí),幫助數(shù)字人擁有“自己”的經(jīng)驗(yàn)和認(rèn)識(shí)去思考?;诎俣热ツ臧l(fā)布的百億參數(shù)對(duì)話模型PLATO,虛擬人可以跟用戶進(jìn)行有料、有趣、有情感的交流。
百度智能云曦靈數(shù)字人平臺(tái):半小時(shí)生成2D數(shù)字人、一兩周制作完成3D數(shù)字人
目前,數(shù)字人尚未實(shí)現(xiàn)規(guī)?;a(chǎn)業(yè)落地,主要原因在于數(shù)字人制作技術(shù)門檻高、周期長(zhǎng)、成本高。打造一個(gè)高精度、高保真的非特異型虛擬人,動(dòng)輒就需要百萬(wàn)甚至上千萬(wàn)的資金投入。
2021年12月,百度發(fā)布了集數(shù)字人生產(chǎn)、內(nèi)容創(chuàng)作、業(yè)務(wù)配置服務(wù)為一體的智能數(shù)字人平臺(tái)——“百度智能云曦靈”,基于人像驅(qū)動(dòng)、智能對(duì)話、語(yǔ)音交互、智能推薦四大技術(shù)引擎,實(shí)現(xiàn)數(shù)字人的“能聽(tīng)、能說(shuō)、能理解、可互動(dòng)”。同時(shí),百度智能云曦靈提供便捷簡(jiǎn)單的操作平臺(tái),幫助企業(yè)低成本快速定制2D卡通、真人形象及3D卡通、超寫實(shí)數(shù)字人像,實(shí)現(xiàn)對(duì)話服務(wù)、內(nèi)容創(chuàng)作全流程業(yè)務(wù)配置,極大降低數(shù)字人開發(fā)難度。
不久前,百度集團(tuán)副總裁吳甜做客央視《對(duì)話》節(jié)目時(shí)提到,“百度希望通過(guò)領(lǐng)先的全棧AI能力,把虛擬人的生產(chǎn)周期縮短到小時(shí)級(jí)別,降低生產(chǎn)成本,并且用AI驅(qū)動(dòng)生成內(nèi)容?!?/p>
(百度智能云曦靈平臺(tái)架構(gòu)圖)
例如,只要用戶在百度智能云曦靈平臺(tái)上傳一張照片,就能快速生成一個(gè)可被AI驅(qū)動(dòng)的2D數(shù)字人像,原來(lái)生產(chǎn)流程需要一個(gè)星期做出來(lái)的2D數(shù)字人,現(xiàn)在可以縮短成半個(gè)小時(shí)。以前需要兩三個(gè)月時(shí)間做出來(lái)的3D數(shù)字人,現(xiàn)在可以壓縮到一兩周,同時(shí)數(shù)字人個(gè)性化功能開發(fā)也較之前更加完善,比如通過(guò)20句話的輕量化模型訓(xùn)練,可生成數(shù)字人的聲音,即用戶說(shuō)20句話即可生成屬于自己音色的數(shù)字人。
(數(shù)字人運(yùn)營(yíng)后臺(tái)圖)
目前,百度智能云曦靈已為廣電、互娛、金融、政務(wù)、運(yùn)營(yíng)商、零售等行業(yè)提供一站式的虛擬主持人、虛擬員工、虛擬偶像、品牌代言人的創(chuàng)建與運(yùn)營(yíng)服務(wù)。已落地的案例包括:浦發(fā)銀行理財(cái)專員數(shù)字人“小浦”、中國(guó)聯(lián)通數(shù)字人客服“小U”、百度APP代言人“龔俊數(shù)字人”、百度集團(tuán)數(shù)字人“希加加”、火星車數(shù)字人“祝融號(hào)”等。
百度AI人機(jī)交互實(shí)驗(yàn)室負(fù)責(zé)人李士巖表示:“我們近一兩年的奮斗目標(biāo)是通過(guò)百度智能云曦靈平臺(tái)的開放,讓每個(gè)人、每一家企業(yè)實(shí)現(xiàn)數(shù)字人自由?!?/p>
(百度智能云曦靈數(shù)字人家族)
- 蜜度索驥:以跨模態(tài)檢索技術(shù)助力“企宣”向上生長(zhǎng)
- 美媒聚焦比亞迪“副業(yè)”:電子代工助力蘋果,下個(gè)大計(jì)劃瞄準(zhǔn)AI機(jī)器人
- 微信零錢通新政策:銀行卡轉(zhuǎn)入資金提現(xiàn)免手續(xù)費(fèi)引熱議
- 消息稱塔塔集團(tuán)將收購(gòu)和碩印度iPhone代工廠60%股份 并接管日常運(yùn)營(yíng)
- 蘋果揭秘自研芯片成功之道:領(lǐng)先技術(shù)與深度整合是關(guān)鍵
- 英偉達(dá)新一代Blackwell GPU面臨過(guò)熱挑戰(zhàn),交付延期引發(fā)市場(chǎng)關(guān)注
- 馬斯克能否成為 AI 部部長(zhǎng)?硅谷與白宮的聯(lián)系日益緊密
- 余承東:Mate70將在26號(hào)發(fā)布,意外泄露引發(fā)關(guān)注
- 無(wú)人機(jī)“黑科技”亮相航展:全球首臺(tái)低空重力測(cè)量系統(tǒng)引關(guān)注
- 賽力斯發(fā)布聲明:未與任何伙伴聯(lián)合開展人形機(jī)器人合作
- 賽力斯觸及漲停,汽車整車股盤初強(qiáng)勢(shì)拉升
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。