科技云報道原創(chuàng)。
北京冬奧運AI 虛擬人手語主播、杭州亞運會數(shù)字人點火、新華社數(shù)字記者、數(shù)字航天員小諍......當隨著越來越多數(shù)字人出現(xiàn)在人們生活中,整個數(shù)字人行業(yè)也朝著多元化且廣泛的應用方向發(fā)展,快速拓展到不同行業(yè)、不同場景。
面向C端,數(shù)字人幫助用戶生產內容和輔助工作,如:數(shù)字人練口語、和數(shù)字人玩游戲等;面向B端,數(shù)字人是企業(yè)的“工具人”,應用于金融、影視、電商、直播等行業(yè),提高行業(yè)生產和運營效率。
毫無疑問,數(shù)字人是一門好生意,但其規(guī)?;涞匾廊幻媾R著人才、成本、場景、技術等層層困難。其中,最關鍵的是技術瓶頸,如何讓數(shù)字人擺脫“空有一副好皮囊”的市場評價是一大難題。
然而,隨著大模型的出現(xiàn),數(shù)字人的發(fā)展似乎正在迎來新的機遇。
大模型賦能數(shù)字人
對于產業(yè)界而言,數(shù)字人本身并不新鮮。在過去很長一段時間內,為了又力求數(shù)字人視覺外形上的高保真呈現(xiàn),生產成本不亞于制作一部專業(yè)級電影。
瑞銀發(fā)布的數(shù)字人研究報告指出,高級虛擬人物的先期投入成本平均為3000萬元,后期又需要真人團隊完成拍攝、配音、剪輯。以樂華娛樂的虛擬女團A-SOUL為例,其一支單曲制作成本約200萬元,一場線下演唱會成本約2000萬元。
但即便是如此高昂的成本,也解決不了數(shù)字人的互動效果問題。由于智能水平不足,與其說它是數(shù)字人,更像是一個沒有靈魂的數(shù)字皮套。
高成本,再加上互動效果不佳,使得數(shù)字人的使用被限制在廠商內部或大企業(yè)客戶的試驗項目。
因此,當具有學習能力的生成式大模型顛覆了內容制作范式后,面向更廣范圍的中小型企業(yè)用戶、優(yōu)先規(guī)?;涞厥褂玫牧畠r數(shù)字人成為了可行方案。
據(jù)一名人工智能研究人員介紹,大模型對數(shù)字人的重塑與賦能主要體現(xiàn)為降本增效。
從技術角度來說,搭建一個數(shù)字人主要分為建模、驅動、渲染幾個環(huán)節(jié)。傳統(tǒng)的數(shù)字人主要依托計算機圖形學技術+真人動作捕捉,需要采集大量的真人數(shù)據(jù),深度建模,耗時長,效率低,成本高。
如今在大模型的加持下,通過AI算法,基于深度學習模型、動作模擬、情感模擬等技術,只需要幾分鐘的真人視頻,用大模型訓練若干個小時,就可以生成逼真的數(shù)字人,制作成本大大降低。
不僅如此,數(shù)字人在成本降低的同時,效能也大大提升。
在大模型出現(xiàn)以前,數(shù)字人在外形上差異度較小,而且只能根據(jù)輸入的統(tǒng)一腳本,“照本宣科”地回答問題。
在大模型的賦能下,數(shù)字人擁有了“靈魂”,不僅外貌特征可以自定義設計,智能化、交互性也有了很大提升。比如在一些直播帶貨場景中,數(shù)字人已經可以與受眾進行基礎互動。
比如,百度智能云發(fā)布的曦靈數(shù)字人,大模型的加持下,可以15分鐘快速完成直播間搭建,自動生成匹配產品特色的講品話術,開啟智能互動問答。
在某餐飲品牌的直播間,曦靈數(shù)字人主播自動生成直播話術,包含開場破冰、福利放送、暖場話術、催單話術等。在這場真人與曦靈數(shù)字人的接力直播中,用戶竟然沒有絲毫察覺。
更令人驚訝的事,在真實6小時的直播比對中,數(shù)字人主播僅需真人主播15%的成本,就可獲得真人主播85%GMV。
除了直播帶貨,百度智能云曦靈作為國內首個大模型全面重構的數(shù)字人平臺,還可為企業(yè)提供2D真人、3D寫實、3D超寫實的人像,實現(xiàn)視頻制作、數(shù)字員工、數(shù)字人代言人等多種應用。
比如,在曦靈平臺,只需5分鐘的真人視頻,半小時即可訓練人像,錄制100句話語,24小時生成專屬音色庫,相比真人授課成本只需過去的30%,錄制效率提升20倍。
不難發(fā)現(xiàn),經過大模型重塑與賦能的數(shù)字人,一定程度上擺脫了價格昂貴、互動性差等問題,越來越廣泛地出現(xiàn)在短視頻、直播間中。
同時,數(shù)字人開始朝著更多“身份”進軍——銀行理財師、律師、老師、已逝的名人……數(shù)字人正在成為任何想成為的人,也為這條日漸擁擠的賽道帶來了新的機遇。
讓數(shù)字人更像“人”
大模型的出現(xiàn)讓數(shù)字人“脫胎換骨”,成為如今最火的創(chuàng)業(yè)賽道之一。
目前市場上主要的數(shù)字人廠商主要有兩類:一類是以百度、騰訊、華為等為代表的科技巨頭,基于自身大模型方面的優(yōu)勢研發(fā)推出數(shù)字人產品;另一類是以硅基智能、出門問問、相芯科技等為代表的中小廠商。
多名人工智能領域投資人表示,目前AIGC(生成式人工智能)還處于早期階段,能落地產生利潤的不多,數(shù)字人是其中比較少有的商業(yè)化路徑,且已經能夠盈利的項目。
但隨著大量的創(chuàng)業(yè)者涌入,行業(yè)競爭趨于激烈和同質化,賽道逐漸變得擁擠和內卷。
內卷的一個表現(xiàn)是價格越降越低。目前2D數(shù)字人的價格大多數(shù)已經降到千元級別,有的甚至只需要幾百元。
360集團的數(shù)字人營銷服務也顯示,通過智能營銷云平臺的配套SaaS服務推廣給客戶,按照會員用戶每月付費的標準估算,一款數(shù)字人的價格最低幾十元,最高在一、二百元上下。
隨著大量低成本的數(shù)字人涌入市場,百元級別的數(shù)字分身迅速被炒成一本萬利的“財富經”。
每到深夜,打開主流平臺,大量的數(shù)字人堅守在直播間。隨之而來的是關于數(shù)字人的質疑聲漸起,諸如效果太假、市場混亂等,導致用戶體驗不佳。
有業(yè)內人士認為,隨著越來越多的玩家涌入,一些創(chuàng)業(yè)者技術能力有限,生產的數(shù)字人產品質量良莠不齊,容易導致劣幣驅逐良幣。
一方面,數(shù)字人多用于較為簡單的環(huán)境、解決較為基礎的問題,在場景切換或面對多輪對話時,可能出現(xiàn)答非所問或陷入死循環(huán)的情況,制約用戶體驗。
另一方面,大模型下的數(shù)字人交互體驗始終與真人存在明顯差異,比如,在Sora生成內容中,無視物理學原理、人的手指時多時少等問題被廣為詬病,可能進一步引發(fā)心理方面的“恐怖谷效應”。
對此,也有專家認為,需要進一步提升技術創(chuàng)新能力和用戶體驗感,在保證數(shù)字人外在擬人效果的同時,優(yōu)化用戶交互體驗,注重實時渲染、光學捕捉、三維重建、智能人機交互等新興技術與自然語言處理、語音識別、計算機視覺、生成式AI等技術的研究和應用。
“當前行業(yè)正在共同突破的技術目標是‘如何讓數(shù)字人變得更像一個人’,像人一樣去思考”,一位業(yè)內人士表示,加快企業(yè)間的技術協(xié)同,解決交互型數(shù)字人在情緒感知、語義理解等方面的技術難題是接下來的重點。
這一系列的挑戰(zhàn)都指向技術側。
2024年度《中國虛擬數(shù)字人影響力指數(shù)報告》指出,截至2024年2月底,國家知識產權局“專利檢索”數(shù)據(jù)顯示,2023年全年數(shù)字人領域專利申請數(shù)高達544個,反映出業(yè)界在核心技術研發(fā)上的強勁勢頭和深度創(chuàng)新。
從2023年數(shù)字人相關專利申請機構來看,以百度、騰訊為代表的老牌互聯(lián)網巨頭,以中國移動、工商銀行為代表的頭部通信、金融機構,以小冰公司、世優(yōu)科技、黑鏡科技為代表的頭部數(shù)字人公司形成了技術端的多強格局。
盡管行業(yè)頭部大廠在AI技術上擁有了先發(fā)優(yōu)勢,但在產業(yè)高速發(fā)展的過程中,每個公司在技術本身都沒有絕對的壁壘,本質上技術背后是人。對于所有數(shù)字人廠商來說,AIGC帶來機會的同時,也成為直面挑戰(zhàn)的起點。
結語
數(shù)字人正處于風口,吸引了大量想分一杯羹的創(chuàng)業(yè)者涌入。但不可否認的是,作為一項年輕的技術,數(shù)字人還處于早期階段,市場尚在培育之中。
對于同處一片紅海中的數(shù)字人公司來說,要思考的或許不是如何“卷低價”,而是通過技術的不斷進步,讓數(shù)字人“更像人”,提高行業(yè)的整體水位,讓數(shù)字人“活下去”,創(chuàng)造更多的價值。
【關于科技云報道】
專注于原創(chuàng)的企業(yè)級內容行家——科技云報道。成立于2015年,是前沿企業(yè)級IT領域Top10媒體。獲工信部權威認可,可信云、全球云計算大會官方指定傳播媒體之一。深入原創(chuàng)報道云計算、大數(shù)據(jù)、人工智能、區(qū)塊鏈等領域。
免責聲明:此文內容為第三方自媒體作者發(fā)布的觀察或評論性文章,所有文字和圖片版權歸作者所有,且僅代表作者個人觀點,與極客網無關。文章僅供讀者參考,并請自行核實相關內容。投訴郵箱:editor@fromgeek.com。
- 蜜度索驥:以跨模態(tài)檢索技術助力“企宣”向上生長
- 算力荒緩解,自主化智算還有必要嗎?
- 波司登千元鵝絨褲僅3克鵝絨,警惕被“國貨品牌”割韭菜
- 中國電車進入10萬級時代,2025年決生死,但日本車先頂不住了
- 中國存儲芯片大舉圍剿美日韓芯片,外媒確認在技術上進一步突破
- 谷歌成為手機市場的殺手,國產手機或被迫擁護國產操作系統(tǒng)
- 折疊屏2024的新東西、好東西、舊東西
- 董明珠與小米的二次戰(zhàn)爭
- 芯片不賣中國,美芯無處賣了,本來不要的市場偷偷地賣,后悔莫及
- 僅售999元 月底開售 閃極打響AI眼鏡量產發(fā)令槍
- 蘿卜快跑走紅、滴滴加碼,中國Robotaxi大戰(zhàn)升級
免責聲明:本網站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網站出現(xiàn)的信息,均僅供參考。本網站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網站中的網頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。