11月19日,第五屆世界聲博會(huì)暨2022科大訊飛全球1024開發(fā)者節(jié)AI+家庭論壇在合肥奧體中心舉辦,現(xiàn)場(chǎng)發(fā)布推出以AI虛擬數(shù)字人為媒介的新一代電視語音平臺(tái)——iFLYHOME OS 2.0。iFLYHOME OS是科大訊飛針對(duì)家庭場(chǎng)景及智能終端開發(fā)的AI多模態(tài)人工智能操作系統(tǒng)。此次iFLYHOME OS 2.0以AI虛擬數(shù)字人為媒介,對(duì)多模態(tài)交互系統(tǒng)進(jìn)行了全面能力提升,并帶來了三大創(chuàng)新亮點(diǎn),讓大屏交互更便捷、更智慧、更溫暖。
伴隨智能終端和ICT技術(shù)的蓬勃發(fā)展,智慧家庭新時(shí)代正在撲面而來。2021年12月,業(yè)內(nèi)首個(gè)雙編號(hào)標(biāo)準(zhǔn)《智能家居系統(tǒng)跨平臺(tái)接入與身份驗(yàn)證技術(shù)要求》正式發(fā)布,有效解決當(dāng)前智能家居互聯(lián)互通中存在的“生態(tài)壁壘”問題,助推智能家居互聯(lián)互通產(chǎn)業(yè)的進(jìn)一步規(guī)范發(fā)展。面對(duì)廣闊前景空間,智慧家庭市場(chǎng)將深度聚焦平臺(tái)、應(yīng)用、技術(shù)、場(chǎng)景探索智慧家庭生態(tài)構(gòu)建,不斷完善服務(wù)化水平。
訊飛智慧家庭作為科大訊飛垂直行業(yè)品牌,以人工智能技術(shù)深度賦能運(yùn)營(yíng)商數(shù)字家庭業(yè)務(wù)及終端設(shè)備。在2016年發(fā)布首款電視語音助手,開啟大屏入口探索,2020發(fā)布電視語音平臺(tái)iFLYHOME OS,聚焦平臺(tái)生態(tài)能力建設(shè)。此次發(fā)布的iFLYHOME OS 2.0則標(biāo)志著大屏交互從語音邁入多模態(tài)新時(shí)代。
關(guān)鍵核心技術(shù)突破帶來交互體驗(yàn)升級(jí)
全新發(fā)布的iFLYHOME OS 2.0在語音識(shí)別、語音合成和端到端交互成功率方面都有顯著效果提升。在平臺(tái)系統(tǒng)化布局基礎(chǔ)上,每個(gè)單點(diǎn)性能的提升都能給用戶帶來極大的交互體驗(yàn)改變。
其一,面向家庭復(fù)雜環(huán)境和人群的識(shí)別優(yōu)化,讓語音交互更簡(jiǎn)單。科大訊飛在語音識(shí)別方面取得關(guān)鍵技術(shù)突破,通過增強(qiáng)模型和識(shí)別模型的深度耦合,實(shí)現(xiàn)高噪、遠(yuǎn)場(chǎng)混響等各種復(fù)雜環(huán)境下的高精度語音識(shí)別。即使在客廳和廚房這種高噪音復(fù)雜場(chǎng)景下,升級(jí)優(yōu)化的語音識(shí)別可以精準(zhǔn)識(shí)別到家庭用戶的指令詞。同時(shí),iFLYHOME OS 2.0針對(duì)各種方言和口音也能實(shí)現(xiàn)復(fù)雜場(chǎng)景高魯棒性語音識(shí)別,支持7種方言自由切換,滿足家庭多代同堂的“年輕人普通話&老人方言”混合識(shí)別問題。
其二,極致擬人的語音合成,讓AI虛擬人交互更有情感。科大訊飛最新一代語音合成技術(shù)在深度學(xué)習(xí)框架的基礎(chǔ)上進(jìn)行了技術(shù)升級(jí),結(jié)合無監(jiān)督語音聽感屬性解耦和聽感量化編碼技術(shù),實(shí)現(xiàn)對(duì)語音韻律和情感的精細(xì)化建模,從而達(dá)到能夠媲美真人細(xì)膩情感表達(dá)的效果,使得合成語音變得更具有表現(xiàn)力,韻律、音質(zhì)和情感上都要更加貼近真人。目前,iFLYHOME OS 2.0定制化音庫(kù)中有十多種超自然發(fā)音人選擇,家庭用戶可以根據(jù)年齡、性別、場(chǎng)景喜好定制專屬自己的發(fā)言人陪自己對(duì)話聊天。
其三,交互全流程評(píng)價(jià)體系打造,讓端到端體驗(yàn)更完善。針對(duì)平臺(tái)交互評(píng)價(jià)標(biāo)準(zhǔn),科大訊飛聯(lián)合中國(guó)移動(dòng)智慧家庭運(yùn)營(yíng)中心和福建移動(dòng)分公司,在iFLYHOME OS首發(fā)“懂有暢快暖”語音評(píng)價(jià)體系,不同于現(xiàn)有行業(yè)通用的識(shí)別率、語義分析等偏技術(shù)化和分段碎片化的評(píng)價(jià)體系。iFLYHOME OS 2.0聚焦家庭用戶交互全流程,從用戶語音需求出發(fā),注重整體體驗(yàn)感的提升,從單一搜索服務(wù)擴(kuò)充到全場(chǎng)景交互服務(wù),為家庭用戶帶來更人性化的智能操控體驗(yàn),獲取信息更快、更準(zhǔn)、更智能。將端到端交互成功率提升到90%以上,為行業(yè)平臺(tái)交互應(yīng)用提供標(biāo)準(zhǔn)參考。
- 懂-聽得懂:聚焦語音交互服務(wù),提升“識(shí)別-語義-搜索”全流程交互滿足率,保障用戶基礎(chǔ)體驗(yàn),保障用戶基礎(chǔ)體驗(yàn)。
- 有-服務(wù)多:結(jié)合大屏場(chǎng)景及人群特征,打造100+精品技能。
- 暢-推得準(zhǔn):針對(duì)現(xiàn)網(wǎng)普遍30%+的影片缺失率問題,形成“用戶搜索時(shí)給予推薦、搜索后后臺(tái)統(tǒng)計(jì)、資源更新后用戶提醒”的閉環(huán)
- 快-速度快:通過搜索邏輯與界面展示流程優(yōu)化,全流程響應(yīng)時(shí)間在1S內(nèi)。
- 暖-有情感:通過交互流暢性、視覺效果、合成音效果、回復(fù)語人性化程度、用戶引導(dǎo)等功能優(yōu)化。
(以上數(shù)據(jù)來源:訊飛電視語音平臺(tái)BI數(shù)據(jù))
智慧家庭道路上,科大訊飛始終堅(jiān)持從技術(shù)中來,到產(chǎn)品中去。目前,科大訊飛已成功構(gòu)建一套“AI+家庭”智能化解決方案。相信,基于iFLYHOME OS 2.0的升級(jí)迭代,訊飛將持續(xù)賦能智慧家庭生態(tài),圍繞家庭場(chǎng)景的多樣化需求,技術(shù)連接家庭內(nèi)的智能終端,并通過開展多元化運(yùn)營(yíng),給家庭用戶帶去多模態(tài)、主動(dòng)式的交互體驗(yàn)。
更溫暖、更精準(zhǔn)、更安全的大屏應(yīng)用創(chuàng)新
iFLYHOME OS 2.0也在場(chǎng)景應(yīng)用方面有所突破創(chuàng)新,家庭用戶體驗(yàn)感提升,大屏語音交互更溫暖、更精準(zhǔn)、更安全。
其一,基于場(chǎng)景的情感型對(duì)話,讓大屏交互更溫暖。相比對(duì)傳統(tǒng)的指令性交互,必須等待用戶主動(dòng)說話然后系統(tǒng)進(jìn)行機(jī)械師回復(fù)的方式,家庭用戶對(duì)大屏交互提出更高層次的要求??拼笥嶏w通過多模態(tài)感知及表達(dá)、主動(dòng)對(duì)話等技術(shù)賦能,在iFLYHOME OS 2.0上升級(jí)AI交互對(duì)話系統(tǒng)能力,系統(tǒng)會(huì)在合適的場(chǎng)景下主動(dòng)進(jìn)行電視助手的關(guān)懷引導(dǎo)和情感化表達(dá),如用戶之前搜索的缺失影片更新上映了,系統(tǒng)會(huì)主動(dòng)進(jìn)行提醒,實(shí)現(xiàn)熱門影片推薦服務(wù)閉環(huán)。
經(jīng)過多年深耕,iFLYHOME OS 2.0已經(jīng)擁有一整套家庭垂直領(lǐng)域知識(shí)圖譜,覆蓋衣食住行文購(gòu)?qiáng)蕵返燃彝ド钊珗?chǎng)景。通過AI對(duì)話系統(tǒng)深度學(xué)習(xí),會(huì)在和用戶對(duì)話的過程中,結(jié)合用戶的對(duì)話內(nèi)容,進(jìn)行電視內(nèi)容和服務(wù)的推薦,將電視端的內(nèi)容和服務(wù)推薦給家庭用戶使用,從簡(jiǎn)單指令逐漸提升到智能服務(wù)的層次。
其二,面向多人場(chǎng)景的“圖像+聲音”多模態(tài)融合,讓遠(yuǎn)場(chǎng)交互更精準(zhǔn)。現(xiàn)在很多電視、音箱的遠(yuǎn)場(chǎng)交互都是依賴“單語音+喚醒詞”的方式進(jìn)行,一來這種方式需要用戶頻繁進(jìn)行喚醒詞喚醒,每說一句話都要喊一次,非常繁雜;二來客廳環(huán)境經(jīng)常有各種人聲、電視背景音、甚至窗外的雜音等,會(huì)影響遠(yuǎn)場(chǎng)語音的識(shí)別效果。
iFLYHOME OS 2.0通過“圖像+聲音”多模態(tài)融合技術(shù),可利用遠(yuǎn)場(chǎng)麥克風(fēng)陣列搭配攝像頭,實(shí)現(xiàn)遠(yuǎn)場(chǎng)聲音定位+攝像頭的人臉和唇形檢測(cè),視覺+聽覺雙重信息進(jìn)行說話人和內(nèi)容解析,既解決每次說話需要喊喚醒詞的繁瑣操作,也做到即使旁邊有其他人說話,也能將主說話人的干凈人聲從嘈雜背景環(huán)境中分離出來,提升在多人、遠(yuǎn)距離復(fù)雜場(chǎng)景下的語音交互精準(zhǔn)性。有了這種技術(shù),以后即使客廳有再多人,電視也能做到只“聽”你的聲音,隨時(shí)隨地和你實(shí)時(shí)互動(dòng)。
其三,多場(chǎng)景輸入輸出的定向優(yōu)化,大屏輕社交方案更安全。iFLYHOME OS 2.0上線大屏輕交互解決方案,可實(shí)現(xiàn)大屏彈幕和大屏字幕翻譯功能。針對(duì)大屏彈幕功能,上線組合敏感詞識(shí)別、基于語義的敏感內(nèi)容識(shí)別,敏感詞過濾保障大屏內(nèi)容安全。另外,字幕在線翻譯支持中文和英語等四十多個(gè)語種的互相翻譯,實(shí)施率和準(zhǔn)確率高達(dá)99%,讓大屏視頻觀看實(shí)時(shí)無障礙。
首款大屏AI虛擬人開啟家庭“元宇宙”
在本次發(fā)布會(huì)上,訊飛智慧家庭還推出了大屏首款情感陪伴AI虛擬人。作為一款兼具情感交互和工具服務(wù)的AI虛擬人,AI虛擬管家可以實(shí)現(xiàn)與家庭用戶在情感陪伴、影視娛樂、老人健康、兒童成長(zhǎng)、生活服務(wù)、AIoT等多個(gè)場(chǎng)景生態(tài)下的實(shí)時(shí)交互,為用戶提供一站式大屏生活服務(wù)。
AI虛擬管家的多情緒識(shí)別和表達(dá)能力表現(xiàn)出色,能夠根據(jù)家庭用戶的意圖,主動(dòng)推薦內(nèi)容及服務(wù)。從語音交互再到“類人化”交互,AI虛擬管家越來越接近人與人的對(duì)話習(xí)慣,也更加適合多樣化的現(xiàn)代家庭。
基于iFLYHOME OS 2.0的發(fā)布,科大訊飛依舊秉承著開放共贏的合作理念,面向行業(yè)和合作伙伴提供標(biāo)準(zhǔn)化對(duì)接接口,實(shí)現(xiàn)高效技術(shù)保障。并且面向多種應(yīng)用場(chǎng)景實(shí)現(xiàn)我們的場(chǎng)景開放,向行業(yè)提供多種場(chǎng)景提供帶屏解決方案。
面對(duì)現(xiàn)下元宇宙背景下的“虛擬人”熱潮,科大訊飛誠(chéng)邀產(chǎn)業(yè)合作伙伴共建虛擬人生態(tài),基于訊飛AI虛擬人交互平臺(tái),為客戶提供定制虛擬人解決方案。訊飛希望聯(lián)手運(yùn)營(yíng)商和合作伙伴,通過iFLYHOME OS 2.0平臺(tái),不斷創(chuàng)造并完善更多的數(shù)字家庭新場(chǎng)景。
作為AI虛擬人技術(shù)及相關(guān)產(chǎn)品和生態(tài)合作的服務(wù)平臺(tái),訊飛AI虛擬人交互平臺(tái)具備多模感知、多維表達(dá)、情感貫穿、自主定制四大關(guān)鍵特點(diǎn)。2022年6月,科大訊飛AI虛擬人交互系統(tǒng)通過國(guó)內(nèi)首批數(shù)字人系統(tǒng)基礎(chǔ)能力評(píng)測(cè),成功獲得了數(shù)字人領(lǐng)域的權(quán)威標(biāo)準(zhǔn)認(rèn)證,為和產(chǎn)業(yè)鏈合作伙伴合作奠定深厚的技術(shù)基礎(chǔ)。
iFLYHOME OS 2.0的發(fā)布是科大訊飛穩(wěn)步布局智慧家庭生態(tài)布局的重要一步。面對(duì)智慧家庭產(chǎn)業(yè)市場(chǎng)藍(lán)海,科大訊飛將會(huì)繼續(xù)以技術(shù)創(chuàng)新為動(dòng)力進(jìn)行探索,推動(dòng)未來家庭生活逐步走向智能化。
(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )