2023年,AIGC爆發(fā)出前所未有的發(fā)展?jié)摿Γ渲胁粩嗤晟频纳疃葘W習模型、開源模式的推動,以及大模型探索商業(yè)化的可能,成為了AIGC發(fā)展的“加速度”。AIGC或將會改變內容領域的生產方式,帶來整個行業(yè)的變革。
3月29日,量子位主辦的中國AIGC產業(yè)峰會在北京舉行。大會以「Hello New World」為主題,AIGC領域學界、產業(yè)界的專家學者齊聚一堂,從產學研等多維度,覆蓋大公司玩家、創(chuàng)新創(chuàng)業(yè)公司、學研和創(chuàng)投代表,全方位探討和分享中國AIGC產業(yè)的現(xiàn)狀、機遇和未來??拼笥嶏wAI研究院常務副院長高建清受邀參加并作主題演講。
在《AIGC技術探索與應用創(chuàng)新》的演講中,高建清分享了基于文本預訓練、多模態(tài)預訓練、多元異構基礎資源構建、異構集群構建及大模型訓練套件,訊飛在音頻創(chuàng)作、視覺創(chuàng)作、文本創(chuàng)作等方面的研究和應用。
高建清表示,科大訊飛的AIGC整體布局可以總結為三層架構:“底座+能力+應用”,是,形成了音頻創(chuàng)作、視覺創(chuàng)作、文本創(chuàng)作三大AIGC能力,進而衍生出在教育、醫(yī)療、人機交互等領域的豐富應用。
關于“底座”,科大訊飛以文本預訓練、多模態(tài)預訓練、多元異構基礎資源構建、異構集群構建及大模型訓練套件為技術底座,充分培養(yǎng)出強大的AIGC能力,并能結合實際應用。 此前,科大訊飛擁有的扎實技術積累就已經鑄就了其語音AI龍頭地位,憑借其在語音合成、語音識別、機器翻譯以及自然語言理解等核心技術上的深厚的積累,在AIGC火熱的背景下,自然擁有著乘風而起的底氣。
關于“能力”,科大訊飛由底層技術延伸出的三大AIGC能力分別為音頻創(chuàng)作、視覺創(chuàng)作和文本創(chuàng)作。
在音頻創(chuàng)作方面,多風格多情感語音合成系統(tǒng)SMART-TTS是訊飛研究院此次的重磅技術突破之一。高建清分享了科大訊飛研究院在虛擬聲音自動創(chuàng)造和多風格多情感語音合成系統(tǒng)SMART-TTS上的技術進展和成果,拋棄生硬的機器人“口音”,語音合成將變得更加具有“喜怒哀樂”。在此創(chuàng)新下,語音合成從依據(jù)真人生成走向語義可控生成,音色、韻律、口音等還可根據(jù)自己需要進行控制和調整。
在視覺創(chuàng)作方面,你對AIGC的印象還停留在“AI作畫”嗎?現(xiàn)在,制作獨一無二的虛擬人才是最“潮”玩法!
作為國內較早開展虛擬人技術研究的人工智能公司,早在2018年,科大訊飛就發(fā)布了多語種虛擬人口唇驅動,2021年發(fā)布2D真人捏臉系統(tǒng);目前已形成了從3D虛擬形象口唇表情和動作的AI驅動到AI貫穿3D形象構建的全流程。目前,科大訊飛AI虛擬人已廣泛應用于媒體、金融、文旅、教育、政企等多場景。。隨著AIGC的發(fā)展,其AI生成的應用場景將更加廣闊。
基于在AIGC各方面的技術積累與行業(yè)應用經驗,訊飛推出了AIGC內容創(chuàng)作平臺——訊飛智作和訊飛音樂的詞曲家平臺。訊飛智作平臺為用戶提供AI配音、虛擬人音視頻播報、聲音定制、形象定制等服務,一鍵生成定制化音視頻,其平臺界面清晰,操作簡單,使用門檻低,真正實現(xiàn)讓AIGC的技術飛入尋常百姓家造福社會。作為面向廣大詞曲作者和采買方的詞曲創(chuàng)作交易平臺,詞曲家平臺不僅提供了輔助作詞、輔助作曲和歌曲試音、質量分析等AI輔助工具,還能夠幫助廣大音樂人有效縮短交易路徑,獲得更多收益與安全交易保障,助力詞曲創(chuàng)作交易良性發(fā)展。
高建清在大會上表示,訊飛將在認知智能大模型核心技術的研發(fā)基礎上,重點結合教育、醫(yī)療、人機交互、辦公等若干領域方向進行應用落地探索,并將持續(xù)賦能行業(yè),促進數(shù)字經濟發(fā)展與產業(yè)進步。
科大訊飛此次AIGC布局的分享,展現(xiàn)了其在技術層面的強大底氣,致力于用AI技術賦能行業(yè)及個人,其在具體應用場景上所體現(xiàn)出的企業(yè)社會責任感只增不減。
免責聲明:此文內容為第三方自媒體作者發(fā)布的觀察或評論性文章,所有文字和圖片版權歸作者所有,且僅代表作者個人觀點,與極客網(wǎng)無關。文章僅供讀者參考,并請自行核實相關內容。投訴郵箱:editor@fromgeek.com。
免責聲明:本網(wǎng)站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網(wǎng)站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。