當(dāng)科技遇上新年,會有怎樣的火花?
近日,科大訊飛最新上線了A.I.虛擬人愛加幫你送新春祝福的H5《你用A.I.拜年了嗎?》,把最暖心的新春祝福通過愛加聲情并茂地送到家人朋友眼前,讓你今年的拜年更酷炫。和以往的虛擬人不一樣的是,愛加的形象更加活潑可愛,行動也更靈活,還熟悉更多種語言和方言,能給天南海北的朋友傳達(dá)更親切的拜年祝福。(在微信公眾號“科大訊飛”后臺回復(fù)“愛加”即刻體驗,還有機(jī)會獲得千元驚喜A.I.禮物)
百節(jié)年為首,回家過年是每個在外打拼的人一年中最大的期盼。然而,今年情況特殊,很多地方都倡議“原地過年”。通過愛加傳達(dá)你的新春祝福,讓今年的“屏”上拜年將更具科技感和真實感。
個性化科技拜年,這個虛擬人更逼真
集成語音合成、語義理解、機(jī)器翻譯、人臉建模、口唇預(yù)測、圖像生成等多項人工智能技術(shù)不斷發(fā)展,使得A.I.虛擬人能根據(jù)文本語義做出相對應(yīng)的面部表情及肢體動作,并逐漸走入尋常生活中。對于虛擬人,很多人并不陌生,2001年,英國 PA New Media公司推出了世界上第一個虛擬主持人“阿娜諾娃”,三年后央視推出了國內(nèi)首位虛擬電視節(jié)目主持人“小龍”,都是虛擬人的應(yīng)用案例。
相比于愛加來說,此前科大訊飛推出的A.I.虛擬主播小晴表情動作相對比較單一,使用場景很受限制。而當(dāng)前推出的虛擬人愛加在風(fēng)格上更多樣,在聲音、肢體動作乃至于微表情的表達(dá)上更豐富,使用虛擬人愛加來幫你送上拜年祝福視頻,讓接收者更能真切感受到濃濃的新春祝福。另外,特別關(guān)注到的一點,這次的愛加拜年活動視頻,除了愛加本身形象更多樣表達(dá)更靈動,還創(chuàng)新性的引入了語義理解技術(shù)根據(jù)文本實現(xiàn)背景、音效等更多豐富視頻元素的自動搭配,引領(lǐng)了AI驅(qū)動多模態(tài)視頻合成方向,這一突破,也意味著A.I.虛擬人技術(shù)有望實現(xiàn)更加多元的拓展應(yīng)用,各行業(yè)大范圍應(yīng)用虛擬形象交互的時代,或許不遠(yuǎn)將至。
攻克合成技術(shù)壁壘,拜年虛擬人體現(xiàn)“人性化”
人工智能不斷進(jìn)步,A.I.早已不再是冷冰冰的科技,而是演變成為能幫助人類享受智慧生活、守護(hù)情感世界的好幫手。虛擬人的應(yīng)用前景可期,但由于技術(shù)限制,其肢體動作、語言、情感表達(dá)效果還不能滿足人們期待。
那么科大訊飛是如何攻克合成難點,讓其A.I.虛擬人有更高的觸達(dá)率?
首先,拓展A.I.虛擬人的“本事”,讓其“能說會道”“能歌善舞”。在科大訊飛A.I.虛擬人已有的多語種、多方言合成能力之外,科大訊飛提出了基于歌唱音準(zhǔn)的無監(jiān)督歌唱標(biāo)注方法,將發(fā)音和音準(zhǔn)分離,利用神經(jīng)網(wǎng)絡(luò)分層級預(yù)測,結(jié)合高精度神經(jīng)網(wǎng)絡(luò)聲碼器合成高品質(zhì)歌曲,同時提出姿態(tài)自適應(yīng)的表情合成技術(shù),解決了舞動狀態(tài)面部姿態(tài)大角度以及多角度快速切換場景下的唇形合成難題,在使得虛擬人在精通各種語言的同時,還能傾情演唱。
其次,增強(qiáng)虛擬人的“人性化”。為了給虛擬人注入情感,使其在互動表達(dá)中更有人情味,科大訊飛結(jié)合認(rèn)知心理學(xué)理論對虛擬人進(jìn)行交互情感設(shè)計,利用無監(jiān)督表征學(xué)習(xí)方法,分離并獲取語音中的情感表征。同時,利用海量文本無監(jiān)督語義模型對各類文本進(jìn)行情感分類預(yù)測,實現(xiàn)人性化的端到端情感合成系統(tǒng),讓虛擬人“活潑”起來。
最后,提升虛擬人的“表現(xiàn)力”。為使拜年視頻更具個性化,科大訊飛提出結(jié)合場景的背景音樂、音效疊加方案。通過對常用場景分類分析,構(gòu)建豐富多元的背景音樂、音效資源庫,結(jié)合具體應(yīng)用場景,進(jìn)行背景音樂、音效的預(yù)測、疊加,從而實現(xiàn)高表現(xiàn)力的虛擬形象合成,用戶能定制理想狀態(tài)中的拜年場景,讓A.I.拜年場景更加生動多元。
值得一提的是,基于科大訊飛提出的海量說話人的音視頻數(shù)據(jù)預(yù)訓(xùn)練技術(shù),虛擬人愛加能夠做到基于少量數(shù)據(jù)就完成快速的建模,滿足多種場景多種風(fēng)格形象的快速定制,同時,當(dāng)前虛擬人實時合成的速度以及并發(fā)一直是業(yè)界的痛點,科大訊飛本次的虛擬人拜年活動支持了高并發(fā)在線高質(zhì)量視頻生成,從而大幅提升虛擬人視頻制作的效率。用戶只需要等待幾秒鐘就可以完成一個A.I.虛擬人合成視頻,有效突破了A.I.虛擬人因為并發(fā)路數(shù)有限而不能大規(guī)模推廣的難題,同時也展現(xiàn)出A.I.虛擬人從toB向toC推廣應(yīng)用的可能。
可以預(yù)見,虛擬人愛加只是一個科大訊飛在虛擬人技術(shù)突破的一個新起點,它的出現(xiàn)為下一步A.I.虛擬人的大范圍、規(guī)?;瘧?yīng)用奠定了堅實基礎(chǔ)。
接棒人機(jī)交互領(lǐng)域,虛擬交互已大勢所驅(qū)
5G時代的到來,讓科大訊飛人工智能科技與各行業(yè)有了更深的融合。通過人機(jī)協(xié)作,把人從重復(fù)性工作中解放出來,更好地解放社會生產(chǎn)力,虛擬人技術(shù)如今正在匹配不同行業(yè)的更多場景需求,助推各行業(yè)“服務(wù)力”提升。
目前,科大訊飛基于A.I.交互能力的虛擬形象解決方案已經(jīng)應(yīng)用于多個場景,如虛擬站務(wù)員、虛擬金融理財顧問、虛擬面試官,科大訊飛虛擬人的多模態(tài)得到了廣泛應(yīng)用。在教育場景中,科大訊飛一對一的A.I.虛擬老師”面對面“現(xiàn)場教學(xué),大大提高了教學(xué)效率、豐富了教學(xué)的內(nèi)容形式。
在視頻內(nèi)容生產(chǎn)上,通過A.I.虛擬主播系統(tǒng)提供的一站式視頻智能生產(chǎn)服務(wù),目前已累計為150多家媒體提供高效率、低成本的新聞內(nèi)容生產(chǎn),保障了傳統(tǒng)媒體往移動化、快速化新媒體陣營的內(nèi)容遷移,為未來視頻的生產(chǎn)提供更快捷的方式。
隨著A.I.虛擬人愛加的應(yīng)用,科大訊飛也將進(jìn)一步推動技術(shù)的發(fā)展,拓展更多領(lǐng)域的虛擬人落地應(yīng)用。在智能交互領(lǐng)域,科大訊飛將不斷拓展,并將更多視頻融合元素、虛擬人情感、豐富虛擬人技能、場景化主題、情感化決策融入虛擬人設(shè)計中,讓其有望變換成A.I.客服、A.I.經(jīng)理、A.I.店長、A.I.演示員等多種社會角色,陸續(xù)在不同行業(yè)、不同領(lǐng)域上崗,并有望接棒下一個時代的人機(jī)交互領(lǐng)域。
科技時代,以人工智能為驅(qū)動的虛擬人的技能越來越豐富,能夠適用的場景也將越來越多元,或許某天,虛擬人會是我們的理財顧問、健康管理師......未來,科大訊飛將持續(xù)堅持“頂天立地”戰(zhàn)略,用人工智能建設(shè)美好世界。
(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實,并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )