人工智能快速發(fā)展催生語音合成技術(shù)不斷成熟,讓機器不僅能“開口說話”,還能“談心交心”,在語音技術(shù)的突破下,人機交互將迎來新的發(fā)展階段。1月30日,訊飛星火認知大模型V3.5升級發(fā)布會即將舉行,會上將同步發(fā)布訊飛星火語音大模型, 此外還將發(fā)布開源大模型等。
2023年5月6日,科大訊飛正式發(fā)布了訊飛星火認知大模型,可以基于自然對話方式完成用戶需求理解與任務(wù)執(zhí)行。它還能支持“語音輸入”及“語音播報”功能,可以實現(xiàn)對文本內(nèi)容的朗讀和純享語音對話,這兩項功能豐富了大模型的交互方式,拓寬了其場景應(yīng)用的邊界。
自首發(fā)以來,星火認知大模型經(jīng)歷V1.5版本的迭代,于去年8月15日如期迎來V2.0版本,對代碼能力進行了代碼生成、代碼補齊、代碼糾錯、代碼解釋、單元測試生成5個維度升級,其多模態(tài)能力的升級具體體現(xiàn)在圖像描述、圖像問答、識圖創(chuàng)作等多個維度。
去年10月24日,在第六屆世界聲博會暨2023科大訊飛全球1024開發(fā)者節(jié)的主論壇上,星火認知大模型V3.0正式發(fā)布,從文本生成、語言理解、知識問答、邏輯推理、數(shù)學(xué)能力、代碼能力以及多模態(tài)能力方面都有了持續(xù)的提升。星火V3.0進一步升級了多模態(tài)指令跟隨與細節(jié)表達等能力,實現(xiàn)從多輪對話、主動對話再到啟發(fā)式對話的跨越。
作為首個基于全國產(chǎn)化算力平臺訓(xùn)練的全民開放大模型,訊飛星火認知大模型V3.5將打造更實用、更通用的大模型底座。據(jù)了解,1月30日,訊飛星火認知大模型V3.5發(fā)布會上將公布在語音能力方面實現(xiàn)的重要突破。
科大訊飛從語音起家,多年來在語音識別、語音合成、聲音事件檢測等多個領(lǐng)域始終保持源頭核心技術(shù)創(chuàng)新迭代,并收獲多項相關(guān)國際權(quán)威賽事和評測冠軍。語音識別方面,科大訊飛繼2016年參與以來,連續(xù)四屆在國際多通道語音分離與識別大賽CHiME奪冠,領(lǐng)跑國際競爭對手;語音合成方面,科大訊飛獲國際語音合成大賽Blizzard Challenge十四連冠,屢次在自然度、相似度等指標(biāo)上打破紀(jì)錄;在聲音事件檢測上,科大訊飛獲2020、2022和2023年國際聲學(xué)場景和事件檢測及分類挑戰(zhàn)賽DCASE多項冠軍,展現(xiàn)了在智能音頻技術(shù)領(lǐng)域的不俗實力。
持續(xù)技術(shù)創(chuàng)新的同時,科大訊飛也將智能語音技術(shù)賦能教育、醫(yī)療、金融、汽車、工業(yè)等多個行業(yè)領(lǐng)域,科大訊飛在不斷推動智能語音技術(shù)革新的同時,也積極拓展其應(yīng)用范圍,與各行各業(yè)深度融合,為用戶帶來更加豐富和便捷的交互體驗。不久前,科大訊飛在國際車載多通道語音識別挑戰(zhàn)賽中取得ASR和ASDR兩個賽道的第一名,相關(guān)技術(shù)已經(jīng)在車載領(lǐng)域落地應(yīng)用,有效提升了車內(nèi)語音識別準(zhǔn)確率,讓車上多個位置的乘客與語音助手交互實現(xiàn)互不干擾,充分展現(xiàn)了新技術(shù)賦能行業(yè)新變革的重要價值。
從2021年語音云平臺問世和訊飛輸入法上線語音輸入,到訊飛翻譯機、AI學(xué)習(xí)機、錄音筆、辦公本等產(chǎn)品的不斷推動,科大訊飛智能語音技術(shù)也已深入賦能到C端產(chǎn)品,服務(wù)更多用戶,為工作、學(xué)習(xí)、生活提高效率,提供便利。
結(jié)合大模型底座,此次即將發(fā)布的語音大模型也將帶來語音方面的多項技術(shù)創(chuàng)新升級和應(yīng)用體驗。智能語音是萬物互聯(lián)機器溝通的入口,語音大模型的發(fā)布也將推動全新人機交互變革,帶來更便捷的語音交互和更廣的語言互通。
投身于通用人工智能技術(shù)浪潮,科大訊飛始終以自主創(chuàng)新推動每一次技術(shù)躍遷。本次發(fā)布的星火語音大模型將以全球領(lǐng)先的主流語種能力,引領(lǐng)萬物互聯(lián)時代的人機交互革命。期待在大模型技術(shù)革新浪潮下,語音能力會實現(xiàn)更高的突破,未來將與多領(lǐng)域進行深度融合,持續(xù)賦能更多產(chǎn)品落地,實現(xiàn)多語種和個性化的全面提升。
(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責(zé)任。
任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )