“大模型帶來(lái)了語(yǔ)音技術(shù)發(fā)展的全新機(jī)會(huì)。”
1月30日,科大訊飛發(fā)布新升級(jí)的訊飛認(rèn)知大模型星火V3.5,并正式發(fā)布星火語(yǔ)音大模型,推動(dòng)萬(wàn)物互聯(lián)時(shí)代下人機(jī)交互場(chǎng)景變革。
“科大訊飛從創(chuàng)業(yè)之初的夢(mèng)想和使命,就是要實(shí)現(xiàn)溝通無(wú)障礙。25年了,我們目標(biāo)和夢(mèng)想一天都沒(méi)有變。”科大訊飛董事長(zhǎng)劉慶峰在發(fā)布會(huì)現(xiàn)場(chǎng)如是說(shuō)。星火語(yǔ)音大模型所展現(xiàn)出的卓越性能,驗(yàn)證了科大訊飛在人工智能自然語(yǔ)音領(lǐng)域的深厚積累,也彰顯了其在推動(dòng)人機(jī)交互技術(shù)進(jìn)步方面的能力與決心。
三大維度能力升級(jí),星火語(yǔ)音大模型效果國(guó)際領(lǐng)先
科大訊飛的智能語(yǔ)音技術(shù)持續(xù)走在世界前列,2023年以來(lái),在DCASE工業(yè)聲紋挑戰(zhàn)賽、IWSLT國(guó)際機(jī)器口語(yǔ)翻譯大賽、CHiME高噪音復(fù)雜多通道多人說(shuō)話場(chǎng)景比賽、國(guó)際車(chē)載多通道語(yǔ)音識(shí)別挑戰(zhàn)賽等涉及工業(yè)、高噪、車(chē)載等復(fù)雜場(chǎng)景的比賽中接連收獲冠軍。
與此同時(shí),全球?qū)φZ(yǔ)音大模型的研究開(kāi)始快速升溫,出現(xiàn)了新的顛覆性技術(shù)邏輯。基于海量的數(shù)據(jù)訓(xùn)練,大模型可以實(shí)現(xiàn)更精細(xì)的模型描述、更精準(zhǔn)的語(yǔ)義理解以及更統(tǒng)一的多任務(wù)建模,這給語(yǔ)音技術(shù)的發(fā)展帶來(lái)了全新機(jī)會(huì)。憑借星火認(rèn)知大模型的持續(xù)升級(jí),以及科大訊飛在語(yǔ)音屬性解耦表征預(yù)訓(xùn)練等方面的深厚積累,基于“飛星一號(hào)”的國(guó)產(chǎn)算力平臺(tái),科大訊飛在幾個(gè)月內(nèi)迅速推出了訊飛星火語(yǔ)音大模型。
目前,星火語(yǔ)音大模型在語(yǔ)音合成層面提升了韻律表現(xiàn)力和擬人度,在語(yǔ)音識(shí)別領(lǐng)域突破復(fù)雜場(chǎng)景識(shí)別效果上限,在多語(yǔ)種層面提升語(yǔ)料稀缺小語(yǔ)種效果。“通過(guò)星火語(yǔ)音大模型的評(píng)測(cè)效果,我們非常自豪地告訴大家,科大訊飛繼續(xù)保持了全球領(lǐng)先的水平。”劉慶峰介紹,星火語(yǔ)音大模型效果國(guó)際領(lǐng)先,中文、英語(yǔ)、法語(yǔ)、俄語(yǔ)等首批37個(gè)主流語(yǔ)種的語(yǔ)音識(shí)別效果超過(guò)OpenAI Whisper V3,在多語(yǔ)種語(yǔ)音合成方面,星火語(yǔ)音大模型的首批40個(gè)語(yǔ)種擬人度超83%。
四大功能特性,重塑人機(jī)交互體驗(yàn)
在星火語(yǔ)音大模型的加持下,智能客服實(shí)現(xiàn)進(jìn)一步升級(jí),具備超擬人語(yǔ)音合成、情緒感知、復(fù)雜語(yǔ)義理解、業(yè)務(wù)邏輯推理四大功能特性,將重塑人機(jī)交互體驗(yàn)。
超擬人合成技術(shù)可以通過(guò)更精細(xì)的模型描述,提升智能客服的韻律表現(xiàn)力和擬人度,生成更像人、更生動(dòng)的語(yǔ)音表達(dá),實(shí)現(xiàn)近乎完美的人機(jī)交互體驗(yàn),為客服機(jī)器人的應(yīng)用開(kāi)辟了新的可能。
情緒感知能力使智能客服能夠更好地理解和回應(yīng)用戶的情感狀態(tài)。通過(guò)分析用戶的語(yǔ)音語(yǔ)調(diào)、語(yǔ)速和表達(dá)方式等特征,智能客服可以判斷用戶的情緒是積極的、消極的還是中性的,調(diào)整自己的回答方式,以提供更加貼心的服務(wù)。
復(fù)雜語(yǔ)義理解能力讓智能客服可以在較長(zhǎng)的對(duì)話中,理解上下文的變化,對(duì)用戶的需求提供更準(zhǔn)確的反饋,并能通過(guò)提問(wèn)的方式引導(dǎo)用戶提供更多信息,從而解決復(fù)雜問(wèn)題,提高用戶滿意度。語(yǔ)音打斷功能允許用戶隨時(shí)中斷智能客服的發(fā)言,這種靈活性使得用戶能夠更好地控制對(duì)話的進(jìn)程,實(shí)現(xiàn)更加高效的交互。
業(yè)務(wù)邏輯推理能力使智能客服在接入客戶問(wèn)詢時(shí),能夠理解用戶意向及偏好,識(shí)別銷售機(jī)會(huì),引導(dǎo)相關(guān)產(chǎn)品或服務(wù),以提供更為精準(zhǔn)和個(gè)性化的體驗(yàn),這一能力對(duì)于增強(qiáng)用戶體驗(yàn)和提升服務(wù)效率具有顯著意義,也可幫助企業(yè)在服務(wù)過(guò)程中實(shí)現(xiàn)潛在的業(yè)務(wù)轉(zhuǎn)化。
“百”搭型選手,賦能實(shí)際行業(yè)應(yīng)用
客服是人機(jī)交互的典型場(chǎng)景之一,也是各行各業(yè)的剛需場(chǎng)景。作為“百搭”型產(chǎn)品,星火智能客服在行業(yè)中的應(yīng)用已經(jīng)非常廣泛。
以金融客戶服務(wù)為例,當(dāng)用戶來(lái)電咨詢關(guān)于理財(cái)產(chǎn)品或信用卡額度等相關(guān)問(wèn)題時(shí),智能客服能夠迅速識(shí)別用戶的多樣化需求,并將這些需求與相應(yīng)的業(yè)務(wù)模塊相匹配,提供準(zhǔn)確的解答。同時(shí),在回答問(wèn)題的過(guò)程中,智能客服還會(huì)運(yùn)用專業(yè)的引導(dǎo)話術(shù),如在收到用戶咨詢信用卡額度相關(guān)問(wèn)題時(shí),關(guān)聯(lián)信用卡提額相關(guān)活動(dòng),引導(dǎo)用戶完成業(yè)務(wù)辦理,從而在一輪通話內(nèi)完成從閑聊咨詢到業(yè)務(wù)營(yíng)銷到業(yè)務(wù)辦理的全過(guò)程。
星火語(yǔ)音大模型的應(yīng)用遠(yuǎn)不止于客服領(lǐng)域,其廣泛的適用性使其能夠在各行各業(yè)發(fā)揮重要作用。例如,在汽車(chē)行業(yè),星火語(yǔ)音大模型的集成將極大提升智能駕駛艙、智能座艙、智能導(dǎo)航系統(tǒng)以及音樂(lè)控制系統(tǒng)的交互體驗(yàn),使之更加精準(zhǔn)、高效。此外,陪伴機(jī)器人、導(dǎo)購(gòu)機(jī)器人、輔助診斷機(jī)器人、智能家居設(shè)備以及穿戴式技術(shù)產(chǎn)品等領(lǐng)域,也將因星火語(yǔ)音大模型的加持而迎來(lái)新的發(fā)展機(jī)遇,進(jìn)一步激發(fā)產(chǎn)業(yè)活力。
雙重價(jià)值提升:用戶體驗(yàn)與企業(yè)效率
技術(shù)價(jià)值的核心在于應(yīng)用,而應(yīng)用的成效需要看實(shí)際落地效果。目前,星火智能客服產(chǎn)品已經(jīng)在科大訊飛內(nèi)部上線使用,其應(yīng)用價(jià)值不僅體現(xiàn)在提升用戶體驗(yàn),更在于幫助企業(yè)降本增效。
首先,星火智能客服較之傳統(tǒng)智能客服,在復(fù)雜說(shuō)法理解、擬人化交互層面具有較大優(yōu)勢(shì),加之目前知識(shí)管理已實(shí)現(xiàn)文檔級(jí)運(yùn)營(yíng),能夠?qū)崿F(xiàn)24小時(shí)不間斷的客戶服務(wù),端到端解決用戶問(wèn)題,提升用戶體驗(yàn)??拼笥嶏w400客服中心,率先使用大模型文字客服,機(jī)器人自助服務(wù)率環(huán)比提升142%, 通過(guò)大模型賦能坐席,話后處理時(shí)長(zhǎng)環(huán)比降低30%。
此外,星火智能客服能夠自動(dòng)學(xué)習(xí)知識(shí)庫(kù)中的知識(shí),處理大量重復(fù)性和常規(guī)性的咨詢,話后可以自動(dòng)生成工單小結(jié),將坐席人員從繁重冗余的工作中解放出來(lái),從事更為復(fù)雜和創(chuàng)造性的工作。這樣的智能化分工,有助于降低企業(yè)的人力成本,同時(shí)提高整體的工作效率。再深一層,星火智能客服還能夠從海量通話中提取共性需求,幫助企業(yè)更好地理解用戶,優(yōu)化產(chǎn)品和服務(wù),在激烈的市場(chǎng)競(jìng)爭(zhēng)中獲得優(yōu)勢(shì)。
在智能語(yǔ)音領(lǐng)域,科大訊飛始終保持著行業(yè)領(lǐng)跑者的姿態(tài)。“如今,通過(guò)大模型的應(yīng)用,科大訊飛能夠賦予語(yǔ)音更多維度的特性,包括語(yǔ)種識(shí)別、內(nèi)容理解、韻律把握、音色變化以及情緒表達(dá)等。”可以預(yù)見(jiàn),2024年,由訊飛星火所引領(lǐng)的新一代人機(jī)交互模式,將全面開(kāi)啟未來(lái)交互新紀(jì)元。
*文中數(shù)據(jù)來(lái)源于實(shí)際應(yīng)用
(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。 )