11月4日,在2021騰訊數(shù)字生態(tài)大會的云智能專場中,騰訊智能產(chǎn)品副總裁、騰訊教育副總裁李學(xué)朝通過題為《溝通有溫度,服務(wù)新高度》的主題演講,正式發(fā)布了騰訊云小微基于新一代多模態(tài)人機交互技術(shù)的全新數(shù)智人產(chǎn)品矩陣,并對外分享了數(shù)智人產(chǎn)品的技術(shù)優(yōu)勢、業(yè)務(wù)場景和應(yīng)用案例。
(騰訊智能產(chǎn)品副總裁、騰訊教育副總裁李學(xué)朝)
“AI助手不僅要提供更加智能的交互體驗,還需要通過自學(xué)習(xí)和自適應(yīng)等來提升對于行業(yè)、應(yīng)用和用戶的理解能力、應(yīng)變能力和表達能力。”李學(xué)朝表示,為賦予AI助手交互智能的能力,騰訊云小微整合了語音交互、自然語言理解、圖像識別等AI能力,融合AI Lab前沿AI技術(shù)以及搜狗數(shù)字人團隊豐富的業(yè)務(wù)模式,打造了基于新一代多模態(tài)人機交互技術(shù)的全新數(shù)智人產(chǎn)品矩陣,實現(xiàn)了從“數(shù)字人”到“數(shù)智人”的智能化升級。
談及數(shù)智人的技術(shù)優(yōu)勢時,李學(xué)朝介紹道,在NLP、知識圖譜、視覺等全棧AI底層能力的加持下,數(shù)智人擁有強大的形象表現(xiàn)力、識別力和感知理解能力,能在不同行業(yè)的多種業(yè)務(wù)場景下做到“聽得清、聽得懂、會表達”;而3D超寫實、3D寫實、3D半寫實、2D真人、2D卡通五種數(shù)智人的風(fēng)格,搭配可定制形象和騰訊海量IP形象授權(quán),能讓數(shù)智人擁有豐富多樣的人物形象,以滿足不同場景下的服務(wù)需求。
(五款數(shù)智人亮相)
“云小微數(shù)智人應(yīng)用服務(wù)的兩大場景,分別是企業(yè)服務(wù)和生活服務(wù)。”李學(xué)朝表示,目前數(shù)智人已經(jīng)為金融、文教傳媒、公共服務(wù)等行業(yè)的體驗型業(yè)務(wù)場景提供解決方案,以坐席客服、審核面簽、理財顧問等形象為用戶提供智能交互的新體驗,幫助企業(yè)在提升服務(wù)體驗的同時實現(xiàn)降本增效的目的。
以金融行業(yè)為例,騰訊云小微數(shù)智人助力平安普惠打造了首個金融行業(yè)數(shù)字員工——平安普惠金融AI數(shù)字員工,兩年間已經(jīng)為500萬個用戶提供7x24小時的自然可視化的人機智能交互服務(wù),在提升用戶服務(wù)體驗的同時,將審核成本降低60%。
“我們希望的是,通過數(shù)智人,在生活服務(wù)中為用戶帶來更多陪伴、更多信息交互以及更深的情感鏈接。”李學(xué)朝表示,未來,騰訊云小微數(shù)智人希望能夠突破時間和空間的限制,打破虛擬和現(xiàn)實的邊界,在數(shù)字化進程中為各行各業(yè)提供有溫度的智能交互服務(wù),助力各行各業(yè)的智慧化轉(zhuǎn)型。
以下為演講實錄:
尊敬的各位嘉賓、媒體朋友和線上的觀眾朋友們:
大家好,我是騰訊李學(xué)朝,很高興能在騰訊一年一度的數(shù)字生態(tài)大會中與大家進行交流。
今天主要跟大家分享的是,騰訊云小微數(shù)智人的全新產(chǎn)品,并且從技術(shù)到服務(wù),從內(nèi)到外,從現(xiàn)在到未來,講一講我們“開啟有溫度的數(shù)智未來“的愿景是怎樣展開的。
隨著人工智能、大數(shù)據(jù)、物聯(lián)網(wǎng)等技術(shù)高速發(fā)展,各行業(yè)數(shù)字化進程加快,不同業(yè)務(wù)場景對線上用戶服務(wù)都提出了更高的要求,AI助手除了要提供更加智能的交互體驗,還需要通過自學(xué)習(xí)自適應(yīng)等來提升對于行業(yè)、應(yīng)用和用戶的理解能力、應(yīng)變能力和表達能力。人機交互模式從文本客服升級為語音客服再到多模態(tài)人機交互系統(tǒng),也就是大家常說的數(shù)字人,溝通效率和服務(wù)溫度都得到了大幅提升。
而騰訊云小微通過整合語音交互、自然語言理解、圖像識別等AI能力,同時連接騰訊豐富的內(nèi)容和服務(wù)生態(tài),面向使用場景打磨平臺能力,助力行業(yè)客戶打造有智能、有形象、可交互的數(shù)字分身,實現(xiàn)了從“數(shù)字人”到“數(shù)智人”的智能化升級,也就是騰訊云小微與AI Lab聯(lián)合開發(fā)的新一代多模態(tài)人機交互系統(tǒng)——數(shù)智人。
最近搜狗正式并入騰訊,也為數(shù)智人能力提供了助力。數(shù)智人產(chǎn)品深度聯(lián)動了云小微、AI Lab、搜狗,匯聚云小微綜合AI能力,融合AI Lab前沿AI技術(shù),以及搜狗數(shù)字人團隊豐富的業(yè)務(wù)模式、作為多模態(tài)能力的服務(wù)載體,便捷地服務(wù)于機構(gòu)、企業(yè),持續(xù)賦能行業(yè)。
這些能力從內(nèi)而外賦予了產(chǎn)品極大的優(yōu)勢。
首先,通過AI技術(shù)的加持,數(shù)智人產(chǎn)品目前已擁有強大的形象表現(xiàn)力、識別力和理解能力,并且能夠保證最優(yōu)服務(wù)性能,在很多場景中都能做到“聽得清、聽得懂、會表達”。
聽得清就是能夠把人的聲音精準轉(zhuǎn)化成文本。騰訊云小微在語音識別方面深耕建模、降噪、口音與領(lǐng)域適應(yīng)等技術(shù)能力,讓數(shù)智人能夠適應(yīng)各種復(fù)雜的噪聲環(huán)境。同時,可識別超過34種語種、方言,擁有超過46萬的垂直場景熱詞庫。
聽清后還需要聽得懂。騰訊云小微數(shù)智人結(jié)合知識圖譜能力和垂直領(lǐng)域庫,并充分運用全雙工的能力,通過語音(ASR)+語義(NLP)雙向判斷,降低錯誤響應(yīng)概率,可進行超過11個語種的機器翻譯;同時,通過流式語義+語義VAD,在商用環(huán)境中,服務(wù)端推流渲染方案文本驅(qū)動首幀延遲已降低至600ms內(nèi),單臺服務(wù)器并發(fā)上限,半年內(nèi)提升了60%,在保障交互體驗的同時,大幅提升了接待的效率。
在表達交流能力上,騰訊云小微數(shù)智人由個性化沉浸式TTS、有風(fēng)格的語音合成技術(shù)、以及具備形象、情緒和動作的虛擬人合成,擁有超過28種語音合成音色,超過30個擬人化形象,在技術(shù)內(nèi)測中實現(xiàn)了根據(jù)語義匹配肢體動作,把對話內(nèi)容多模態(tài)多層次地表達出來。
此外,為了讓數(shù)智人有個性、有情感、更真實生動,我們提供了3D超寫實、3D寫實、3D半寫實、2D真人、2D卡通等5類數(shù)智人形象風(fēng)格,擁有超細微面部情感表情以及數(shù)百種肢體動作,可以滿足各類場景需求。同時,擁有騰訊的海量IP形象授權(quán),讓數(shù)智人的形象選擇更加豐富多樣。
每一位數(shù)智人都擁有著不同的形象和性格,可從事不同的職業(yè),并且,每一位都身懷絕技,與眾不同。這兩天,他們也參與到了數(shù)字生態(tài)大會多個專場的主持工作中,為所有與會觀眾帶來了他們的“職業(yè)首秀”。
云小微數(shù)智人一直在通過不斷的自學(xué)習(xí)、自適應(yīng),以求為用戶提供更主動、更專業(yè)的服務(wù)。目前,他們已經(jīng)以不同的形象出現(xiàn)在金融、傳媒、文旅、出行等多個行業(yè)中,踐行著我們服務(wù)于人的理念。接下來讓我們看看,云小微數(shù)智人的落地應(yīng)用情況。
云小微數(shù)智人應(yīng)用服務(wù)的兩大場景,分別是企業(yè)服務(wù)和生活服務(wù)。
在企業(yè)服務(wù)方面,以往一直是以企業(yè)和服務(wù)提供者為中心,現(xiàn)在我們轉(zhuǎn)變?yōu)橐韵M者和使用者為中心,通過人機交互與協(xié)創(chuàng),提升服務(wù)體驗的同時實現(xiàn)降本增效。在生活服務(wù)方面,數(shù)智人以用戶體驗提升為中心,通過實現(xiàn)“軟硬結(jié)合”,給用戶提供智能交互的新體驗。
在企業(yè)服務(wù)場景中,數(shù)智人已優(yōu)先面向金融、文教傳媒、公共服務(wù)等行業(yè)的體驗型業(yè)務(wù)場景提供解決方案,可擔(dān)任坐席客服、審核面簽、理財顧問、資訊播報、會展主持、導(dǎo)游導(dǎo)覽等多種角色。
接下來大家可以通過幾個案例進行更深入的了解:
在金融領(lǐng)域,我們助力平安普惠落地了首個金融行業(yè)數(shù)字員工——平安普惠金融AI數(shù)字員工,針對企業(yè)面臨的人工成本攀升、人力缺乏、員工工作時間無法保障全時段服務(wù)等痛點,通過自然可視化的人機智能交互,打造金融數(shù)智人分身。目前已累計服務(wù)用戶500萬,審核成本降低60%,保障了2年間7x24h的在線服務(wù),極大提升了用戶服務(wù)體驗。
在疫情期間,觀眾無法親臨展廳和現(xiàn)場,近距離參與各項活動,給很多展會活動的舉辦帶來了困難。我們?yōu)橹袊?深圳)國際文化產(chǎn)業(yè)博覽交易會打造了線上虛擬講解員,擁有講解服務(wù)能力、多種情緒表達能力,能夠?qū)φ箯d、展館的相關(guān)問題對答如流,并配合場景作出生動的情緒動作反饋,讓用戶在疫情期間,突破空間限制,享受互動性極強的在線講解游覽體驗。
在新聞播報領(lǐng)域,我們與新華社合作推出了全球首個AI合成主播。依托少量音視頻數(shù)據(jù)即可快速、低成本生成主播形象,輸入文本即可AI合成播報實時音視頻流,主播的表情、唇動自然且專業(yè),基本與真人無異。到目前為止AI合成主播已經(jīng)累計播報新聞超過1萬條,保證播報零誤差,可實現(xiàn)對日常和突發(fā)事件的實時響應(yīng)。
可以說,數(shù)智人具備降本、增效、提升服務(wù)體驗、增強服務(wù)靈活性等優(yōu)勢,比如數(shù)字坐席不但可提供7*24小時全時段、大體量服務(wù),成本也僅為真人坐席的1/5,可真正做到多維度提升企業(yè)服務(wù)能力。隨著數(shù)智人技術(shù)的不斷迭代升級,我們相信科技創(chuàng)新的力量也將為企業(yè)服務(wù)創(chuàng)造更大的價值和可能。
在生活服務(wù)場景,騰訊云小微數(shù)智人也有著很大的應(yīng)用空間。數(shù)智人以交互智能增強人機互動,在智能車載、智能交通、智能家居、智能硬件等智能服務(wù)場景,為用戶提供更便捷、智能的服務(wù)。
我們的核心思路是:讓數(shù)智人與智能設(shè)備結(jié)合,打造以用戶為中心的生活服務(wù)。
一方面,數(shù)智人可以助力提升公眾服務(wù)效率。比如,數(shù)智人可及時、高效地處理用戶在公共交通場景中的票務(wù)等問題,可代替人力進行政策問答,提升政策辦事問答效率。同時,憑借語音交互能力優(yōu)勢,加強對中老年人等群體的服務(wù)關(guān)懷。
另一方面,數(shù)智人可憑借全新的視覺表達,為用戶提供自然、豐富的智能交互服務(wù)。比如在智能家居中,用戶通過語音指令即可隨時隨地與數(shù)智人交流;個性化的形象表現(xiàn)和動作表達能力,也能打造出更優(yōu)的虛擬偶像服務(wù)。未來,數(shù)智人技術(shù)將重點向融合文字、聽覺、視覺、觸覺、肢體動作等多維度感知的多模態(tài)交互方式演進。
我們希望的是,通過數(shù)智人,在生活服務(wù)中為用戶帶來更多陪伴、更多信息交互以及更深的情感鏈接。首先,全天陪伴可隨時呼喚,提升交互效率;其次,有問題直接問,讓中老年人也可簡單方便地使用,打破數(shù)字化中的科技鴻溝,高度還原人與人之間的交流,打造有溫度的交流體驗,拉近個人與技術(shù)的距離。
同時,數(shù)智人支持個性化自定義設(shè)置,讓企業(yè)和用戶都可打造屬于自己獨一無二的數(shù)智人。
前面說的都是我們的過去,我們過往的成就,接下來讓我們說一說未來。未來,我們的數(shù)智人會向什么方向發(fā)展,又將為社會創(chuàng)造哪些價值呢?
正如我今天分享的主題“溝通有溫度,服務(wù)新高度”,未來,騰訊云小微數(shù)智人希望能夠突破時間和空間的限制,打破虛擬和現(xiàn)實的邊界,在數(shù)字化進程中,為各行各業(yè)提供有溫度的智能交互服務(wù)。
我們將不斷提升平臺能力,輸出更優(yōu)質(zhì)的AI應(yīng)用解決方案,與更多行業(yè)實現(xiàn)場景共建,以定制化的服務(wù),助力各行各業(yè)的智慧化轉(zhuǎn)型。同時,在不斷進行科技創(chuàng)新、產(chǎn)品創(chuàng)新、模式創(chuàng)新的過程中,更好地服務(wù)社會,服務(wù)于人,為社會創(chuàng)造更大的價值,從而全面開啟全新的有溫度的數(shù)智未來!謝謝大家!
(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關(guān)資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責(zé)任。
任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )