10月25日~26日,由聲網(wǎng)和RTE開發(fā)者社區(qū)聯(lián)合主辦的RTE 2024實(shí)時(shí)互聯(lián)網(wǎng)大會(huì)在北京舉行。在AI技術(shù)突破式發(fā)展引發(fā)各行業(yè)革新浪潮的當(dāng)下,此次大會(huì)主題聚焦“AI 愛”,匯聚行業(yè)代表企業(yè)、技術(shù)大咖、專家學(xué)者等嘉賓,共同深度探討AI為互聯(lián)網(wǎng)生態(tài)帶來的新發(fā)展。作為AI在社交領(lǐng)域落地的前沿探索者,Soul App與通義千問、MiniMax、智譜等受邀參加開幕式當(dāng)天的“AI論壇”,展現(xiàn)現(xiàn)階段最新的技術(shù)能力積累以及應(yīng)用創(chuàng)新方向的更多可能。
在活動(dòng)現(xiàn)場(chǎng),Soul App AI算法技術(shù)總監(jiān)劉忠亮以《實(shí)時(shí)互動(dòng)、情感陪伴,開啟智能社交新時(shí)代》為主題,重點(diǎn)分享了Soul多模態(tài)大模型的技術(shù)研發(fā)脈絡(luò),以及圍繞社交場(chǎng)景深度打磨多模態(tài)交互、情感陪伴、自然反饋等AI能力方向的最新成果和應(yīng)用實(shí)踐。
劉忠亮表示,Soul致力于構(gòu)建一個(gè)AI Being與Human Being共存的社交社區(qū),其中,“人”是最為關(guān)鍵的,因此Soul的AI探索從用戶的實(shí)際社交場(chǎng)景出發(fā),在AI輔助人、解決人與人鏈接需求的基礎(chǔ)上,以更智能、更沉浸的人機(jī)互動(dòng)升級(jí)社交體驗(yàn)。“Soul在AI方向的布局有清晰的推進(jìn)層次,在以AI增強(qiáng)關(guān)系建立的效率和質(zhì)量后,團(tuán)隊(duì)探索多模態(tài)大模型、重點(diǎn)關(guān)注AI如何提供即時(shí)的交流反饋和情緒價(jià)值。”
2016年上線之初,Soul首先推出了靈犀引擎,基于平臺(tái)用戶站內(nèi)全場(chǎng)景畫像與獨(dú)特算法,持續(xù)挖掘有效特征,實(shí)現(xiàn)平臺(tái)上“人與人”“人與內(nèi)容”的智能連接,合理分配注意力資源和交流機(jī)會(huì),這讓Soul在當(dāng)時(shí)成為了較早將AI引入人與人鏈接的社交平臺(tái),并在用戶群體中形成了差異化的產(chǎn)品認(rèn)知。
2020年,Soul正式啟動(dòng)對(duì)AIGC的技術(shù)研發(fā)工作,系統(tǒng)推進(jìn)在智能對(duì)話、語音技術(shù)、3D虛擬人等AIGC關(guān)鍵技術(shù)能力研發(fā)工作。2023年,Soul推出自研語言大模型Soul X,成為行業(yè)中較早通過備案的科技企業(yè)之一,此后,平臺(tái)先后推出了語音生成大模型、語音識(shí)別大模型、語音對(duì)話大模型、音樂生成大模型等語音大模型能力。
今年6月,Soul還在社交領(lǐng)域中較早推出了自研端到端全雙工語音通話大模型,具備超低交互延遲、快速自動(dòng)打斷、超真實(shí)聲音表達(dá)和情緒感知理解能力等特點(diǎn),能夠直接理解豐富的聲音世界,支持超擬人化的多風(fēng)格語言。
2024年,Soul AI大模型能力整體升級(jí)為了多模態(tài)端到端大模型,支持文字對(duì)話、語音通話、多語種、多模態(tài)理解、真實(shí)擬人等特性,特別是團(tuán)隊(duì)在模型感知能力和推理能力層面的技術(shù)突破,疊加端到端方案對(duì)延遲問題的解決(現(xiàn)階段Soul端到端對(duì)話模型的延遲低于200毫秒),進(jìn)一步實(shí)現(xiàn)了實(shí)現(xiàn)更接近生活日常的交互對(duì)話和“類真人”的情感陪伴體驗(yàn),使人機(jī)互動(dòng)也能具備“在場(chǎng)感”和超擬人屬性。
通過在現(xiàn)場(chǎng)展示目前Soul多模態(tài)大模型落地在平臺(tái)智能機(jī)器人“AI茍蛋”、AI聊天助理、狼人殺Agent、數(shù)字分身以及最新的AI虛擬人智能陪伴功能的實(shí)際效果,劉忠亮說,“大模型能力服務(wù)人的社交需求,并不只是單點(diǎn)的人機(jī)對(duì)話,而是在豐富、趣味的社交場(chǎng)景中,以AI建立完善的關(guān)系鏈發(fā)現(xiàn)——建立——深化的環(huán)節(jié),并讓AI為人提供情緒價(jià)值,這是Soul在產(chǎn)品應(yīng)用探索層面的主脈絡(luò),目前平臺(tái)推出的相關(guān)功能也受到了用戶的廣泛認(rèn)可和積極反饋。”
在不久前結(jié)束的全球最具影響力的盛會(huì)之一—— GITEX GLOBAL海灣信息技術(shù)博覽會(huì)上,Soul攜集成3D虛擬人能力的多模態(tài)AI交互方案亮相,在博覽會(huì)現(xiàn)場(chǎng)接受記者采訪時(shí),Soul App CTO陶明表示,“預(yù)計(jì)今年年底,Soul多模態(tài)端到端大模型將再次升級(jí),推出全雙工視頻通話能力。”
這也意味著,Soul將實(shí)現(xiàn)真正意義上的AI多模態(tài)交互,集合文字、語音、動(dòng)作交互的多模態(tài)大模型,讓用戶可以在平臺(tái)實(shí)現(xiàn)更接近人類模式的互動(dòng)體驗(yàn)和更高效、自然、豐富維度的信息傳遞,真正獲得社交體驗(yàn)的顛覆式升級(jí)。
(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )