1982年7月9日,好萊塢上映了一部對后世影響極大的科幻電影,《電子世界爭霸戰(zhàn)》。
影片講述的是一個黑客程序員,進入電子世界中,在自己所開發(fā)的游戲里作戰(zhàn)。這個故事在《頭號玩家》、《失控玩家》遍地的當下,并沒有什么好稀奇的,但在當時,它準確地開啟了一個時代。
從技術(shù)上來說,《電子世界爭霸戰(zhàn)》是全世界范圍內(nèi)第一部采用“CG+真人結(jié)合”的方式完成特效的電影,被認為是開創(chuàng)了CG制作電腦的新紀元。而從文本或者說哲學的角度來看,這部影片的影響更為深遠,自此之后,電影對世界本源的追溯從未停止。
《電子世界爭霸戰(zhàn)》之后的第7年,日本漫畫師士郎正宗創(chuàng)作出了《攻殼機動隊》,并在1995年由押井守搬上了大熒幕,名聲大噪。
1999年,深受《電子世界爭霸戰(zhàn)》和《攻殼機動隊》影響的沃卓斯基兄弟如今已是姐弟創(chuàng)作出了《黑客帝國》,這部作品是以“現(xiàn)實+虛擬”為世界觀構(gòu)架的集大成作品,至今無人能望其項背。
所以,從電影史的歷程來看,今年以來大火的“元宇宙”,其文本雖然是1992的尼奧·斯蒂文森在小說《雪崩》中提出來的,但具體的概念,應該是更遙遠的1982年。
01
《電子世界爭霸戰(zhàn)》的影像風格如今看來非?!拔迕?,是一種典型的像素風。當時的CG技術(shù),僅僅只能支撐對人體關節(jié)部位的動作替代,沒有辦法對臉部進行特效處理,否則就將成為徹徹底底的卡通片。因此只能夠使用“CG+真人結(jié)合”的方式。
而在2010年,這部影片進行了重拍,重拍之后的《創(chuàng):戰(zhàn)紀》視聽效果獲得了極大的提升,還獲得了當年奧斯卡最佳音效獎,但仍然延續(xù)的是“CG+真人結(jié)合”的拍攝模式。
與近年來上映的《頭號玩家》和《失控玩家》對比,影像技術(shù)近十年來獲得了很大的提升。隨著互聯(lián)網(wǎng)技術(shù)的不斷發(fā)展,看似遙遠的“元宇宙”世界,其實并非海市蜃樓般遙遠,而要實現(xiàn)它,虛擬世界中的數(shù)字成像技術(shù)是最需要攻克的難題。
數(shù)字人,則可能是開啟元宇宙時代的“任督二脈”。
從最基礎的文本交互,到語音互動,再到融合了視覺、語音及語義技術(shù)的多模態(tài)數(shù)字人交互,我們對虛擬世界中的交流需求越來越高,數(shù)字人的概念隨之逐漸火熱。
那么,數(shù)字人技術(shù)的實現(xiàn)有哪些難點呢?
作為“數(shù)字新物種”,數(shù)字人的真實感來源于形象的表現(xiàn)力。相比文字、語音交互產(chǎn)品,數(shù)字人加入了視覺元素,這就需要一個更加逼真、更具表現(xiàn)力的形象來滿足用戶的視覺需求,讓用戶能夠有充足的交互沉浸感。這樣的表現(xiàn)力需要做到數(shù)字人的聲音、形象、嘴型、表情的一致性。
此外,相關的運算和處理需要在與用戶對話的過程中實時生成,對于AI算法和計算機的性能也要求較高。當傳遞的信息從簡單的文字信息,變成復雜的音視頻信息,只有同時具備自然語言理解(NLP)、語音識別和生成,視覺合成這樣的整體AI能力,才能給用戶一個自然逼真的體驗。
舉個例子,“捏臉”是每個數(shù)字人誕生的過程中最為重要的環(huán)節(jié),也是長期以來數(shù)字人的誕生過程中最耗時的部分。關于這道題的解法,Epic Games提供了一套解法。通過工具實現(xiàn)從嘴唇伸縮到眼睛距離、皮膚顏色、牙齒形狀、皺紋形態(tài)、毛細血管和胡須的自定性,創(chuàng)作者可以自定義所有內(nèi)容,自由地“捏”出想要的人臉,例如抬起或放下眉毛,改變頜骨的形狀和耳朵的高度,甚至睫毛的長度也是可以改變的。并且,隨著光影變化,光線在不同膚色、不同年齡、不同性別的角色上均會呈現(xiàn)出不同的效果。
而數(shù)字人如何表現(xiàn)得像個“人類”,提供更為合適的交互手段,也是亟待解決的問題。盡管現(xiàn)在人工智能已經(jīng)越來越普遍地被運用在互聯(lián)網(wǎng)上,包括人工智能客服、自動化流程、自動化工具,甚至是像AlphaGo這樣的人工智能玩家??梢哉f,人工智能技術(shù)的發(fā)展,已經(jīng)可以基本滿足用戶的需求。但人工智能長期以來被用戶所詬病的就在于:始終呈現(xiàn)的是冷冰冰的文字形象,這樣偏二維世界的體驗并沒有與網(wǎng)絡技術(shù)和人工智能的發(fā)展相匹配,這種體驗和我們現(xiàn)在看《電子世界爭霸戰(zhàn)》是一樣的。
因此實現(xiàn)數(shù)字人的人格化、讓數(shù)字人的行為動作“像個人類”至關重要。
關于這點,行業(yè)內(nèi)也有眾多失敗案例。2018年,瑞典一家銀行就曾經(jīng)“開除”了一名“表現(xiàn)不佳”的數(shù)字人。最直接的理由就是Amelia的業(yè)績表現(xiàn)沒能達到預期。盡管Amelia被認為是世界上最好的AI系統(tǒng)之一,并被廣泛地應用于醫(yī)療和金融行業(yè),但其中欠缺的人格化,也是眾多用戶摒棄數(shù)字人的原因。
02
8月,芯片巨頭NVIDIA的真假“皮衣教主事件”,將數(shù)字人推向熱度至高點。部分媒體當時稱“NVIDIA欺騙了全世界”,英偉達CEO黃仁勛某次兩個小時線上演講,全程數(shù)字人出面,從家居背景到人物、服裝等均是虛擬AI能力展示。盡管黃仁勛的“數(shù)字人”只出現(xiàn)了14秒,其他部分均為真人演講,但仍向外界傳遞了數(shù)字人技術(shù)未來具有無限的可能性。
其實,數(shù)字人距離生活已不遙遠,虛擬主播、虛擬教師、虛擬明星、虛擬客服……數(shù)字人的形象正在愈發(fā)立體和全面地展示在我們的生活中,讓以商業(yè)和技術(shù)為導向的數(shù)字經(jīng)濟多了些溫情和煙火氣。
據(jù)量子位智庫發(fā)布的《虛擬數(shù)字人深度產(chǎn)業(yè)分析報告》顯示,截至2030年,圍繞虛擬數(shù)字人我國將會形成一個高達2700億的藍海市場。而這個市場也并不單一,將圍繞著包括游戲影視、服務平臺、媒體平臺、醫(yī)學等更豐富的領域展開。
用戶對于數(shù)字體驗“真實化”的需求永不止步,在數(shù)字文化產(chǎn)業(yè)領域,數(shù)字人最基本的應用就在于對游戲、影視作品沉浸感的提升。Epic Game的虛幻引擎被廣泛應用,在虛幻引擎的官網(wǎng),Epic Games是這樣定義數(shù)字人技術(shù)對于游戲行業(yè)的影響的:A world of possibilities。通過技術(shù),Epic Games實現(xiàn)了游戲人物的“高保真化”。隨著近幾年人工智能技術(shù)的不斷演進,游戲行業(yè)中涌現(xiàn)的一些新技術(shù)讓數(shù)字人的制作過程得到了有效地簡化,使得數(shù)字人成功地進入了公眾的視野之中。
數(shù)字人甚至已經(jīng)被運用至眾多非娛樂產(chǎn)業(yè),展現(xiàn)出了其強大的“功能性”價值。
虛擬互動技術(shù)的擴展,讓數(shù)字人已經(jīng)可以發(fā)揮一些常人無法企及的作用,例如醫(yī)學、礦產(chǎn)、航空航天等領域。此外,通過定制主持人形象,也可以實現(xiàn)內(nèi)容快速、自動化的生產(chǎn),優(yōu)化觀看體驗。例如,在神州十二號成功發(fā)射三位航天員順利抵達空間站后不久,由新華社和騰訊聯(lián)合打造、專門面向航天主題和場景研發(fā)的數(shù)字航天員、國內(nèi)首個進入多場景運營的數(shù)字人“小諍”亮相,帶用戶漫游三大空間站。截至目前“小諍”已經(jīng)完成了多次太空報道,涵蓋了“天問一號”火星探測任務和中國空間站。這種效率從側(cè)面說明了當前數(shù)字人技術(shù)的成熟度已經(jīng)到達了一定的水平。
除了功能性的應用以外,數(shù)字人同樣具有“人文關懷”的功用。通過基于真人形象,打造出具有高度關懷感和真實感的多模態(tài)AI助手型虛擬數(shù)字人。這種虛擬數(shù)字人在特定關懷類場景乃至通用化交互中,可以提供顧問、關懷、陪伴,以及事務處理等服務。國外廠商已有的落地場景包括個性化理財顧問、心理咨詢顧問和購物助理等。
03
《電子世界爭霸戰(zhàn)》發(fā)布后的近四十年,外界對于“現(xiàn)實和虛擬”的二元對立討論,幾乎從未停止,并在《黑客帝國》上映后達到巔峰。但此前討論更多聚焦的是哲學層面,而技術(shù)層面能否實現(xiàn),以及如何實現(xiàn),還是近段時間被行業(yè)所關注。
2020年,馬化騰提到了“全真互聯(lián)網(wǎng)”的概念,他認為互聯(lián)網(wǎng)的下一步就是虛擬世界和真實世界的大門完全敞開。一個由游戲和虛擬空間組成的經(jīng)濟崛起。
從相關技術(shù)的匹配和發(fā)展路徑而言,游戲公司在元宇宙的崛起中將起到至關重要的作用。而最關鍵的一步就是持續(xù)拓展元宇宙的內(nèi)容生態(tài),即把握數(shù)字人的發(fā)展。
換句話說,如果把元宇宙當做一款3A大作,再強大的3A游戲也跟不上玩家的消耗,只有這樣源源不斷地創(chuàng)新,才能保持新鮮感,進而推動整個社會進入全真互聯(lián)網(wǎng)時代。
現(xiàn)在,互聯(lián)網(wǎng)和社交平臺的超高速發(fā)展已經(jīng)極大地拓展了人們的社會關系?,F(xiàn)有形式的社交平臺的發(fā)展和用戶增長已經(jīng)觸及天花板,急需新的增長路徑,才能幫助互聯(lián)網(wǎng)行業(yè)重新找回快速增長的節(jié)奏。元宇宙和數(shù)字人技術(shù)就是這樣的路徑關鍵點。只不過,而要想真正實現(xiàn)類似《失控玩家》和《頭號玩家》電影中的游戲世界,元宇宙還有一段很長的路要走。
但現(xiàn)在我們做出的關于元宇宙的投資和決策,都將決定元宇宙的未來面貌。一篇來自Medium的文章提到,元宇宙的構(gòu)成與“硬件”“內(nèi)容”以及“構(gòu)成世界的底層框架”息息相關,涵蓋了元宇宙的體驗層、發(fā)現(xiàn)層、創(chuàng)作者經(jīng)濟層、空間計算層、去中心化層、人機界面層以及基礎設施層七大要素。在目前的發(fā)展階段下,盡管各大互聯(lián)網(wǎng)巨頭入局,但元宇宙的硬件層面尚未取得質(zhì)變;因此內(nèi)容和構(gòu)成世界的底層框架就成為了當下進軍元宇宙的發(fā)力點。
毫無疑問,元宇宙的“沉浸感”是體驗的至高標準。想要創(chuàng)造這種“沉浸感”,需要“高保真”的游戲環(huán)境。因此,數(shù)字人技術(shù)+突破性的硬件是進入元宇宙時代的先決條件,數(shù)字人技術(shù)可以賦能組成元宇宙的各種元素,突破性的硬件能夠?qū)⑷说囊庾R從外部世界和虛擬世界進行串聯(lián),二者結(jié)合才可搭建出一個與現(xiàn)實世界別無二致的虛擬世界。
截至目前,數(shù)字人的高保真技術(shù)日漸成熟。從數(shù)字人的外形構(gòu)造來看,不論是Epic Game還是NExT Studios均已經(jīng)在數(shù)字人面部的細節(jié)還原方面取得眾多進展,且達到了實用的水平。隨著拍照式相機陣列掃描重建得到飛速發(fā)展,目前可實現(xiàn)毫秒級高速拍照掃描,成為當前人物建模主流方式,并成功應用于游戲、電影、傳媒等行業(yè)。同時,通過實時動作捕捉系統(tǒng)將人物動作還原,也使得各類型互動體驗成為了可能。
數(shù)字人的“高保真”,也體現(xiàn)在整體環(huán)境和交互體驗的深度還原:運用虛幻引擎、實時光線追蹤技術(shù)等等,創(chuàng)作出更為真實、沉浸感更強的模擬效果和視覺體驗。
作為新生事物,數(shù)字人雖然進入實用階段,但仍尚屬“稚嫩”。關于數(shù)字人未來發(fā)展的方向,也需要更多地思考。誰也無法預測數(shù)字人和元宇宙最后的發(fā)展結(jié)果。我們目前對于元宇宙的眾多想象,也只是基于影視作品的天馬行空。
元宇宙的實現(xiàn),需要人工智能來進行源源不斷的內(nèi)容供給,利用AI推動各行各業(yè)完成現(xiàn)實世界和虛擬世界的鏈接;也需要VRAR技術(shù)的持續(xù)進步,不斷加強用戶的沉浸感和體驗感;需要心理學知識,讓元宇宙超脫出“數(shù)字組成的冰冷世界”的概念,數(shù)字也同樣具有溫度;甚至,元宇宙的實現(xiàn)也需要區(qū)塊鏈,保障新世界中的身份、資產(chǎn)、社會關系,以建立元宇宙的公信力。
就目前而言,關于元宇宙我們能做的,就是先搭建好組成宇宙中各個元素的基礎。
但總有一天,我們會在《電子世界爭霸戰(zhàn)》所描繪的那個世界中相見。(來源:獵云網(wǎng))
- 特斯拉CEO馬斯克身家暴漲,穩(wěn)居全球首富寶座
- 阿里巴巴擬發(fā)行 26.5 億美元和 170 億人民幣債券
- 騰訊音樂Q3持續(xù)穩(wěn)健增長:總收入70.2億元,付費用戶數(shù)1.19億
- 蘋果Q4營收949億美元同比增6%,在華營收微降
- 三星電子Q3營收79萬億韓元,營業(yè)利潤受一次性成本影響下滑
- 賽力斯已向華為支付23億,購買引望10%股權(quán)
- 格力電器三季度營收同比降超15%,凈利潤逆勢增長
- 合合信息2024年前三季度業(yè)績穩(wěn)?。籂I收增長超21%,凈利潤增長超11%
- 臺積電四季度營收有望再攀高峰,預計超260億美元刷新紀錄
- 韓國三星電子決定退出LED業(yè)務,市值蒸發(fā)超4600億元
免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內(nèi)容或斷開相關鏈接。