精品国产亚洲一区二区三区|亚洲国产精彩中文乱码AV|久久久久亚洲AV综合波多野结衣|漂亮少妇各种调教玩弄在线

<blockquote id="ixlwe"><option id="ixlwe"></option></blockquote>
  • <span id="ixlwe"></span>

  • <abbr id="ixlwe"></abbr>

    語音大模型“國家隊(duì)”再添一員,趣丸科技與港中大(深圳)發(fā)布首款開源模型MaskGCT

    10月24日,趣丸科技宣布與中國香港中文大學(xué)(深圳)聯(lián)合研發(fā)的語音大模型“MaskGCT”正式開源,面向全球用戶開放使用。區(qū)別于傳統(tǒng)TTS模型,該模型采用掩碼生成模型與語音表征解耦編碼的創(chuàng)新范式,在聲音克隆、跨語種合成、語音控制等任務(wù)中展現(xiàn)出卓越效果。

    據(jù)介紹,MaskGCT在三個(gè)TTS基準(zhǔn)數(shù)據(jù)集上都達(dá)到了SOTA效果,超過當(dāng)前最先進(jìn)的同類模型,某些指標(biāo)甚至超過人類水平。顯著特點(diǎn)如下:

    1、秒級(jí)超逼真的聲音克隆:提供3秒音頻樣本即可復(fù)刻人類、動(dòng)漫、“耳邊細(xì)語”等任意音色,且能完整復(fù)刻語調(diào)、風(fēng)格和情感。

    2、更精細(xì)可控的語音生成:可靈活調(diào)整生成語音的長度、語速和情緒,支持通過編輯文本編輯語音,并保持韻律、音色等方面的極度一致。

    3、高質(zhì)量多語種語音數(shù)據(jù)集:訓(xùn)練于中國香港中文大學(xué)(深圳)和趣丸科技等機(jī)構(gòu)聯(lián)合推出的10萬小時(shí)數(shù)據(jù)集Emilia,是全球最大且最為多樣的高質(zhì)量多語種語音數(shù)據(jù)集之一,精通中英日韓法德6種語言的跨語種合成。

    據(jù)介紹,MaskGCT(Masked Generative Codec Transformer)是一個(gè)大規(guī)模的零樣本TTS模型,采用非自回歸掩碼生成Transformer,無需文本與語音的對齊監(jiān)督和音素級(jí)持續(xù)時(shí)間預(yù)測。其技術(shù)突破性在于采用掩碼生成模型與語音表征解耦編碼的創(chuàng)新范式。實(shí)驗(yàn)表明,MaskGCT在語音質(zhì)量、相似度和可理解性方面優(yōu)于當(dāng)前最先進(jìn)的TTS模型,并且在模型規(guī)模和訓(xùn)練數(shù)據(jù)量增加時(shí)表現(xiàn)更佳,同時(shí)能夠控制生成語音的總時(shí)長。MaskGCT已在中國香港中文大學(xué)(深圳)與上海人工智能實(shí)驗(yàn)室聯(lián)合開發(fā)的開源系統(tǒng)Amphion發(fā)布。

    該模型研發(fā)團(tuán)隊(duì)在語音領(lǐng)域擁有深厚的研究積累和原創(chuàng)性成果。這主要依托趣丸科技十年深耕音頻技術(shù)領(lǐng)域和億級(jí)高質(zhì)量語音用戶的服務(wù)經(jīng)驗(yàn),以及中國香港中文大學(xué)(深圳)國際一流水平的師資隊(duì)伍。早在今年5月份,趣丸科技就與中國香港中文大學(xué)(深圳)宣布共建聯(lián)合實(shí)驗(yàn)室,針對人工智能音頻大模型相關(guān)的前沿課題進(jìn)行研究,旨在突破行業(yè)難題,促進(jìn)產(chǎn)學(xué)研深度融合,打造技術(shù)領(lǐng)先的生成式音頻大模型,填補(bǔ)業(yè)界空白。

    目前,MaskGCT在短劇出海、數(shù)字人、智能助手、有聲讀物、輔助教育等領(lǐng)域擁有豐富的應(yīng)用場景。為了加快落地應(yīng)用,在安全合規(guī)下,趣丸科技打造了多語種速譯智能視聽平臺(tái)“趣丸千音”。一鍵上傳視頻即可快速翻譯成多語種版本,并實(shí)現(xiàn)字幕修復(fù)與翻譯、語音翻譯、唇音同步等功能。該產(chǎn)品進(jìn)一步革新視頻翻譯制作流程,大幅降低過往昂貴的人工翻譯成本和冗長的制作周期,成為影視、游戲、短劇等內(nèi)容出海的理想選擇平臺(tái)。

    (免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實(shí),并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
    任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )