Soul App語音生成大模型上線，支持擬真人、多語言實時對話互動

和喜歡的虛擬人實時通話是一種什么樣的體驗?

近日，社交平臺Soul App(以下簡稱“Soul”)語音生成大模型上線，同時自研語音大模型“伶?zhèn)?rdquo;正式升級，現(xiàn)階段，Soul語音大模型“伶?zhèn)?rdquo;包括了語音生成大模型、語音識別大模型、語音對話大模型、音樂生成大模型等，可支持真實音色生成、語音DIY、多語言切換、多情感擬真人實時對話等能力。目前，“伶?zhèn)?rdquo;已應(yīng)用于Soul “AI茍蛋”、站內(nèi)狼人游戲“狼人魅影”AI語音實時互動、獨立新產(chǎn)品“異世界回響”等場景。

Soul上線于2016年，依托技術(shù)和產(chǎn)品模式創(chuàng)新，平臺持續(xù)推出受用戶歡迎的社交玩法和多元社交場景，例如，多對多語音實時互動場景“群聊派對”、一對一互動場景“語音匹配”等，幫助用戶基于興趣相遇同好，提升關(guān)系發(fā)現(xiàn)的質(zhì)量和效率，沉淀深度社交網(wǎng)絡(luò)。

一直以來，聲音都是傳遞信息和情感的重要媒介，也最能在溝通中賦予“情緒溫度”和“陪伴感”。在Soul，用戶積極通過語音實時互動，表達自我、分享交流，收獲新關(guān)系，“語音社交”也成為平臺頗具代表性的標簽之一。

與此同時，作為率先將AI引入社交關(guān)系的平臺，Soul不斷思考如何將AI應(yīng)用于社交具體場景，進一步實現(xiàn)交互效率、交互質(zhì)量、交互體驗、交互對象等多方面的提升和拓展。2020年，Soul系統(tǒng)啟動AIGC的技術(shù)研發(fā)工作，并在智能對話、圖像生成、語音技術(shù)、虛擬人等方面擁有前沿的技術(shù)積累。

其中，在語音探索方面，Soul基于平臺沉淀豐富且多風(fēng)格的高質(zhì)量公域語音數(shù)據(jù)，推出自研語音大模型“伶?zhèn)?rdquo;，在深度融入站內(nèi)“AI茍蛋”等場景提供多模態(tài)互動體驗外，還推出了系列趣味社交玩法和活動。

如Soul于2023年上線了“Soul次元歌手”活動，幫助每個人打造自己的AI歌手分身，讓很多熱愛音樂但不一定會唱歌的人，也能實現(xiàn)“唱歌自由”;“懶人KTV”活動則在音色克隆的基礎(chǔ)上，創(chuàng)新性實現(xiàn)多人UGC“AI合唱”。基于音樂模型個性化的創(chuàng)作能力，平臺的“AI幫你出靈魂專輯“活動，使用戶自由輸入任意作曲的主題關(guān)鍵詞，即可一鍵完成詞曲創(chuàng)作。

此次，新升級的“伶?zhèn)?rdquo;在訓(xùn)練數(shù)據(jù)規(guī)模和模型架構(gòu)上均實現(xiàn)了拓展和創(chuàng)新，實現(xiàn)了更真實自然、更多樣性和更細顆粒度的控制效果以及流式超低延遲的生成。特別是上線的語音生成大模型在多風(fēng)格多情感可控、超自然人聲生成、多語言切換等方面表現(xiàn)出色。

具體來說，在多情感可控上，“伶?zhèn)?rdquo;能夠?qū)崿F(xiàn)對情緒的深度理解和模擬，在語音生成和對話中表現(xiàn)出不同情感;在聲音顆粒度上，支持包括吸氣、喘氣、笑聲、結(jié)巴/重復(fù)、咳嗽、嘆氣、哭聲等一系列副語言語音合成，聲音效果更真實生動。

值得一提的是，基于新升級的“伶?zhèn)?rdquo;，Soul站內(nèi)應(yīng)用場景中多模態(tài)互動體驗顯著提升，例如狼人游戲“狼人魅影”中AI可實現(xiàn)實時發(fā)言，流暢完成刀人、悍跳等玩法交互。

此外，獨立新產(chǎn)品“異世界回響”，提供多種場景、風(fēng)格的虛擬人角色，每個虛擬角色具備形象、聲音、人設(shè)對話能力，用戶可與虛擬角色進行沉浸式即時交流。新上線的“語音通話”功能，在“伶?zhèn)?rdquo;支持下，能夠讓用戶體驗與虛擬人實時語音通話效果，延遲時間少于行業(yè)平均水平，更快響應(yīng)用戶互動需求，提供即時的AI交流和陪伴。

根據(jù)Soul發(fā)布的《2024 Z世代AIGC態(tài)度報告》，三分之一的年輕人表示愿意和AI成為朋友，人機互動已然成為年輕人中的社交新趨勢。大模型應(yīng)用深入人機互動場景，發(fā)力語音、視覺等多維度，無疑將進一步提升用戶社交體驗。

當(dāng)下，大模型競賽的焦點正從模型參數(shù)延伸至具體應(yīng)用場景。Soul App CTO陶明在接受媒體采訪時表示，“新一輪AI發(fā)展中，關(guān)注場景和交互體驗將會是必然的趨勢。”

基于對社交場景的深刻理解，Soul將圍繞用戶的實際使用場景和核心社交需求，不斷提升技術(shù)能力，從AI推薦關(guān)系到AI輔助對話，從降低表達門檻到提升互動體驗，推進AIGC技術(shù)與社交場景的深度融合，實現(xiàn)AI原生社交場景創(chuàng)新。

（免責(zé)聲明：本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿，凡在本網(wǎng)站出現(xiàn)的信息，均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性，但不保證有關(guān)資料的準確性及可靠性，讀者在使用前請進一步核實，并對任何自主決定的行為負責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏，概不負任何法律責(zé)任。
任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時，應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明，并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后，將會依法盡快聯(lián)系相關(guān)文章源頭核實，溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。）

精品国产亚洲一区二区三区|亚洲国产精彩中文乱码AV|久久久久亚洲AV综合波多野结衣|漂亮少妇各种调教玩弄在线

Soul App語音生成大模型上線，支持擬真人、多語言實時對話互動

Soul App語音生成大模型上線，支持擬真人、多語言實時對話互動