從兩月前, Sora大模型的發(fā)布,如平地一聲驚雷,到近日,StreamingT2V的AI視頻模型在幀數(shù)和視頻長度上的突破,全球的注意力都被文生/AI視頻生成領域所牽系,生成的視頻產(chǎn)品無論是連貫性的場景和運動鏡頭,還是模擬復雜情境和角色表情,都為AI在理解真實世界場景并與之實現(xiàn)互動,增添了更多細節(jié)和想象空間。
Sora可以說是人工智能領域的一次革命性突破,OpenAI更是將Sora定位為“世界模擬器”—— Sora對語言深刻理解,遵循現(xiàn)實世界的邏輯,展現(xiàn)物體運動和交互,甚至是光影的捕捉,這些都符合現(xiàn)實世界的基本物理規(guī)律。
然而,已展現(xiàn)了超強算力的Sora在細節(jié)的呈現(xiàn)上并不是完美的——在模擬復雜場景的物理效應,以及理解某些特定因果關系時,它可能會遇到難題——比如,視頻中的人物可能會咬一口食物,但食物上可能看不到明顯咬痕;比如,在處理空間細節(jié)分辨左右時,Sora也可能會出現(xiàn)混淆;比如,特定的攝影機移動軌跡時,也可能顯得力不從心。
目前,人工智能大模型都由數(shù)據(jù)驅動,Sora也不例外,她需要“看”到大量的包羅萬象的物理現(xiàn)象,進行學習,才能讓自身智能真正融合到現(xiàn)實的的物理場景中。世界的運行規(guī)律無處不在又極其復雜,人類無法把這個所有的運行細節(jié)全部捕捉給Sora們,這也是當前人工智能模型在運行中碰到的待解決難題。
科技界經(jīng)過漫長的觀察實踐,捕捉到了世界運行背后的基本規(guī)律,并通過第一性原理建立起各種物理定律和數(shù)理方程,并在此基礎上形成的世界模擬模型——“仿真計算”(CAE仿真)。這一強大的技術,用于生成符合物理規(guī)律的數(shù)據(jù)集,這在許多工程和科學領域中都是至關重要的。對于通用人工智能(AGI)來說,這些數(shù)據(jù)集可以用于訓練和優(yōu)化模型,以更好地理解和模擬物理世界,這無疑能為Sora們創(chuàng)造出無窮的“糧食”和針對性的“營養(yǎng)元素”。
自然界中大多數(shù)物理過程是穩(wěn)恒態(tài)和臨界態(tài)的交替變化。在臨界態(tài)(災變態(tài))中系統(tǒng)驟然突變,很難抓拍到足夠的觀察數(shù)據(jù)。因此,臨界態(tài)的數(shù)據(jù)樣本非常稀少,Sora“看”到的絕大多數(shù)都是穩(wěn)恒態(tài)的數(shù)據(jù),所以生成的穩(wěn)恒態(tài)的視頻讓我們嘆為觀止,但是對臨界態(tài)的處理,往往又讓人啼笑皆非。畢竟,在人類認知中,最為關鍵的物理事件恰恰是概率幾乎為零的臨界態(tài)。正如在Open AI發(fā)布的視頻中看到明顯的時空不一致,包括違反重力、碰撞動力學、穩(wěn)固性和物理永恒性。
在以上生成的視頻中,我們看到有兩個明顯的穩(wěn)定狀態(tài):水杯直立和果汁已經(jīng)潑濺完成的狀態(tài)。然而,最為關鍵的臨界狀態(tài)--果汁從杯中流灑出來的過程卻未被生成。
究其原因,Sora對物理世界的理解,完全來自于對海量視頻的學習。而物理世界的運行規(guī)律可能在這些視頻里表現(xiàn)出來的都是一些微不足道的細節(jié),并不能完全被Sora所“重視”。幸運的是,這些細節(jié)背后蘊含的物理世界的運行規(guī)律經(jīng)過人類漫長的“學習”,已經(jīng)形成了無數(shù)個固定的數(shù)理方程,通過求解這些方程,人們能模擬物理世界的真實運行,從而為Sora提供各類符合物理規(guī)律的數(shù)據(jù),使其能夠更好地學習、理解和進而模擬真實世界,實現(xiàn)真正的AGI。
以上的視頻由云廬科技生成,是基于計算流體動力學仿真數(shù)據(jù)渲染而成,當液體從杯子流出時,所呈現(xiàn)的過程更為真實,而這正是目前Sora等不具備物理引擎基底的視頻生成模型無法實現(xiàn)的。而CAE仿真技術作為模擬物理世界的核心底層技術,是無縫連接物理世界和數(shù)字世界的橋梁,無數(shù)的符合物理世界運行規(guī)律的數(shù)據(jù)或視頻被“喂養(yǎng)”給Sora們,并基于這些海量視頻數(shù)據(jù)樣本進行再訓練,讓Sora等大模型學習和發(fā)現(xiàn)隱藏在這些視頻數(shù)據(jù)背后的物理規(guī)律,茁壯成長。
據(jù)前瞻產(chǎn)業(yè)研究院測算,2023-2025年是我國AIGC產(chǎn)業(yè)市場規(guī)模增長的第一階段,增長率維持在25%左右,2025年市場規(guī)模達到約260億人民幣。2025年開始,由于行業(yè)生態(tài)完善(特別是底層大模型完成對外開放),應用層蓬勃發(fā)展將帶動產(chǎn)業(yè)快速增長,年復合增長率將超過70%。如果說,AI是未來10-20年最重要的新質(zhì)生產(chǎn)力,那么誰掌握了CAE仿真技術,誰就擁有打開未來之門的鑰匙。正如英偉達CEO黃仁勛在GTC大會上表達的一樣,“數(shù)字孿生和生成式AI都是將價值高達50萬億美元的重工業(yè)市場進行數(shù)字化所需的基礎技術”。
仿真技術及相關軟件無疑是未來新質(zhì)生產(chǎn)力的核心底座之一,全球的創(chuàng)新科技企業(yè)對其商業(yè)價值的探索也在如火如荼展開,國內(nèi)科技企業(yè)在這一波全球化的浪潮中不落人后,堅持發(fā)展工業(yè)軟件的自主自力,堅持走從中國制造到中國智造的發(fā)展道路,研發(fā)實力和成果同樣取得了矚目的成就。深耕于仿真計算領域的云廬科技是一家立足于工業(yè)軟件行業(yè),擁有完整自主知識產(chǎn)權的國家級高新技術企業(yè),搭建了國內(nèi)領先的全棧仿真計算平臺,包括方程式代碼生成器,多物理場求解器,仿真云平臺,仿真應用云平臺等。繼2021年發(fā)布了“非線性多物理場耦合仿真云平臺”, 將多物理場耦合仿真能力提升到一個新的高度后,又于去年9月,發(fā)布了全球首款CAE領域大模型——CAEGPT。CAEGPT是基于云廬完全自主研發(fā)的CAE內(nèi)核代碼庫構建和訓練的一個智能生成CAE代碼的大模型,它通過輸入自然語言文本,能夠快速生成各種場景的CAE仿真代碼。
如果說,過去的大半個世紀里,在推動人類工業(yè)化、信息化進程中的仿真計算領域,已孵育出的大多還是市值百億美元的歐美公司。那么現(xiàn)在,云廬科技等企業(yè)的出現(xiàn)讓我們看到了中國CAE公司奮起直追與勃勃生機,看到了躋身世界先進行列的希望。
解決Sora之痛,中國科技公司給出了自己的方案,在未來即將到來的生成式AI改變?nèi)f物的時代,我們有理由相信中國CAE的明天也將星河燦爛,熠熠生輝。
(免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。
任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權或存在不實內(nèi)容時,應及時向本網(wǎng)站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內(nèi)容或斷開相關鏈接。 )