精品国产亚洲一区二区三区|亚洲国产精彩中文乱码AV|久久久久亚洲AV综合波多野结衣|漂亮少妇各种调教玩弄在线

<blockquote id="ixlwe"><option id="ixlwe"></option></blockquote>
  • <span id="ixlwe"></span>

  • <abbr id="ixlwe"></abbr>

    騰訊云公布聲音復(fù)刻技術(shù),錄音20句便可實(shí)現(xiàn)聲音定制

    隨著AI語(yǔ)音應(yīng)用進(jìn)入差異化競(jìng)爭(zhēng)時(shí)代,AI語(yǔ)音定制開始“飛入尋常百姓家”,越來(lái)越多地出現(xiàn)在智能電子產(chǎn)品、APP甚至愛心公益活動(dòng)中。12月20日,在Techo Park開發(fā)者大會(huì)人工智能分論壇上,騰訊微信智聆實(shí)驗(yàn)室高級(jí)研究員鄭藝斌展示了騰訊云聲音復(fù)刻產(chǎn)品。

    鄭藝斌介紹,聲音復(fù)刻產(chǎn)品基于騰訊云AI平臺(tái)打造,客戶(用戶)只需要提供少量的錄音即可快速獲得個(gè)性化、輕量級(jí)的定制音色服務(wù),主要應(yīng)用于在線教育、音視頻內(nèi)容創(chuàng)作、智能硬件等場(chǎng)景或設(shè)備。

    具體而言,針對(duì)在線教育領(lǐng)域,產(chǎn)品可以快速?gòu)?fù)刻老師音色,降低老師課堂互動(dòng)成本,提升師生交互的體驗(yàn);在音視頻創(chuàng)作領(lǐng)域,可以幫助創(chuàng)作者低成本、快速地完成配音、錄音等工作,提升內(nèi)容生產(chǎn)效率;智能硬件方面,可以在玩具、音箱等智能設(shè)備上復(fù)刻家人音色,提升語(yǔ)音交互的溫度。

    騰訊云公布聲音復(fù)刻技術(shù),錄音20句便可實(shí)現(xiàn)聲音定制

    聲音復(fù)刻功能的背后,是騰訊AI語(yǔ)音技術(shù)的賦能。騰訊云聲音復(fù)刻技術(shù)是基于騰訊云的端到端語(yǔ)音合成系統(tǒng),主要由文本分析、聲學(xué)模型和聲碼器三部分組成。其中,文本分析負(fù)責(zé)從語(yǔ)言層、語(yǔ)法層、語(yǔ)義層解決文本發(fā)音問(wèn)題,在漢語(yǔ)合成中主要涉及多音字、專業(yè)名詞、數(shù)字以及兒化音的問(wèn)題。聲學(xué)模型負(fù)責(zé)建立文本序列到聲學(xué)序列的映射關(guān)系,為語(yǔ)音賦予韻律,如語(yǔ)速、語(yǔ)調(diào)、停頓、重音和情感變化等。最后通過(guò)聲碼器模型將聲學(xué)序列轉(zhuǎn)換為對(duì)應(yīng)的波形信號(hào)。在端到端語(yǔ)音合成框架下,聲音復(fù)刻的主要技術(shù)思路是:首先對(duì)說(shuō)話人音色空間進(jìn)行建模,然后將建模結(jié)果分別作為聲學(xué)模型和聲碼器模型的輸入構(gòu)建對(duì)應(yīng)的“平均”模型,最后在利用遷移學(xué)習(xí)對(duì)少量的目標(biāo)人數(shù)據(jù)進(jìn)行定制訓(xùn)練。這里“平均”模型是在大量的語(yǔ)料上通過(guò)神經(jīng)網(wǎng)絡(luò)的建模分析方法訓(xùn)練得到的人類語(yǔ)言與發(fā)聲特征的規(guī)律,因此可以在這個(gè)“平均”模型的基礎(chǔ)上達(dá)到音色快速定制的目的。

    值得一提的是,騰訊云聲音復(fù)刻產(chǎn)品只需要20句錄音、訓(xùn)練30min左右便可完成定制訓(xùn)練并建立定制語(yǔ)音模型,而傳統(tǒng)的TTS建模至少需要10小時(shí)或10000句的聲音樣本量,這一變化使得語(yǔ)音定制的門檻被降低,讓更多的企業(yè)甚至普通消費(fèi)者的聲音定制成為可能。

    在英劇《黑鏡》中,女主人公瑪莎通過(guò)AI語(yǔ)音合成技術(shù)聽到了已故男友的聲音,傷痛心靈得以撫慰。而在現(xiàn)實(shí)世界中,定制語(yǔ)音也一直在探索中前進(jìn)。如公益項(xiàng)目Revoice幫助漸凍癥患者留住自己的聲音;用明星語(yǔ)音進(jìn)行地圖導(dǎo)航、起床提醒,甚至可以聊天、玩游戲等。

    隨著前沿技術(shù)逐漸普世化,夯實(shí)人工智能技術(shù),開發(fā)出千人千面的硬件、千變?nèi)f化的應(yīng)用已成為行業(yè)生存必選。目前,騰訊云AI智能語(yǔ)音產(chǎn)品包括語(yǔ)音識(shí)別、語(yǔ)音合成、機(jī)器翻譯等,騰訊云AI日處理語(yǔ)言達(dá)250萬(wàn)小時(shí)。在產(chǎn)品矩陣之外,騰訊云為開發(fā)人員、算法工程師、合作伙伴提供了多層次的平臺(tái),降低打造AI應(yīng)用的門檻,加速AI應(yīng)用創(chuàng)新,提升AI開發(fā)體驗(yàn)。

    未來(lái),騰訊云AI語(yǔ)音團(tuán)隊(duì)將和微信智聆實(shí)驗(yàn)室等騰訊內(nèi)部AI團(tuán)隊(duì)持續(xù)打磨技術(shù),為業(yè)界提供最具性價(jià)比的智能語(yǔ)音產(chǎn)品,推動(dòng)智能語(yǔ)音在產(chǎn)業(yè)互聯(lián)網(wǎng)的廣泛落地,用前沿的技術(shù)和更極致的體驗(yàn),助力各行各業(yè)的數(shù)字化和智能化轉(zhuǎn)型,同時(shí)也努力創(chuàng)造更多社會(huì)價(jià)值,讓技術(shù)有溫度、更暖心。

    (免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
    任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )