ChatGPT 標志著生成式 AI 的大爆炸時刻正在開啟。在剛剛過去的CES2025上,NVIDIA (英偉達)創(chuàng)始人兼CEO黃仁勛在演講中提到,人形機器人的時代即將到來。
作為全球領先的算力提供商,NVIDIA在機器人領域投入布局巨大,著手迎接“通用機器人的ChatGPT時刻”。
當前,生成式 AI 發(fā)展火熱,但 AI 在人形機器人、工廠和其它工業(yè)系統(tǒng)設備中的具象化體現(xiàn)尚未達到突破點。這阻礙了運輸和移動、制造業(yè)、物流和機器人等行業(yè)的發(fā)展。
三大驅動力:機器人技術需求的源泉
相關數(shù)據(jù)顯示,未來二十年,預計人形機器人市場將達到 380 億美元。為了滿足這一巨大需求,尤其是工業(yè)和制造業(yè)領域的需求,NVIDIA 發(fā)布了一系列機器人基礎模型、數(shù)據(jù)管線和仿真框架,以加速下一代人形機器人的開發(fā)進程。
在2025年的技術浪潮中,機器人正迅速成為解決社會和產業(yè)需求的關鍵工具。NVIDIA機器人與邊緣計算副總裁Deepu Talla在近期分享中,深刻闡述了機器人技術發(fā)展的驅動力、技術突破與未來應用,揭示了這一領域的巨大潛力與挑戰(zhàn)。
Deepu Talla認為,指出,機器人技術的快速發(fā)展背后有三大核心驅動力:
1. 危險工作:在采礦等高危環(huán)境中,機器人可以替代人類承擔風險,確保人員安全。
2. 勞動力短缺:社會職業(yè)結構的變化導致勞動力逐步減少,機器人可以填補這一空白。
3. 養(yǎng)老需求:隨著全球平均壽命的延長,對護理和陪伴機器人的需求日益增長,機器人能夠成為有效的“社會伴侶”。
這三大需求共同推動機器人技術成為現(xiàn)代社會不可或缺的組成部分。
關鍵突破:機器人技術發(fā)展的轉折點
Deepu Talla強調,過去12個月中,機器人技術經歷了兩大關鍵突破:
1. 生成式AI(GenAI)的引入:兩年前,大型語言模型(LLMs)顛覆了數(shù)字應用,如今這些技術被應用到機器人領域,成功連接了數(shù)字與物理應用。
2. 仿真環(huán)境的成熟:以NVIDIA Omniverse為代表的仿真技術提供了高精度的虛擬環(huán)境,使機器人測試從依賴真實世界轉向虛擬測試,大幅降低了成本和時間消耗。
這些技術突破顯著加快了機器人開發(fā)的進程,也為更多企業(yè)投入機器人研發(fā)提供了契機。
三臺計算機,解決機器人挑戰(zhàn)
為了真正解決機器人領域的挑戰(zhàn),我們需要三臺計算機?!?Deepu Talla如是說。
第一臺計算機用于訓練:這是用于訓練AI模型的系統(tǒng)。訓練通常在云端、數(shù)據(jù)中心或像NVIDIA DGX這樣的強大系統(tǒng)上進行。這是構建機器人“大腦”的關鍵步驟。
第二臺計算機用于仿真:一旦訓練完成,就需要進行測試。以往的標準是物理測試,但這種方式既慢又昂貴,還存在風險。更好的解決方案是引入一個“仿真層”,即“數(shù)字孿生”(Digital Twin),在虛擬環(huán)境中完成測試。仿真允許在大規(guī)模、快速且安全的條件下運行數(shù)千種場景測試,無需受到真實世界時間或成本的限制。
第三臺計算機用于部署:它安裝在機器人內部,就是操作物理機器人的“大腦”。對NVIDIA來說,這可以通過像Jetson或AGX這樣的系統(tǒng)來實現(xiàn)。
通過將訓練、仿真、部署的循環(huán)過程,使得機器人技術進步從50年縮短到了5年,顯著縮短機器人的開發(fā)周期。Deepu Talla對此解釋,在將機器人部署至現(xiàn)實世界前,利用仿真系統(tǒng)開展成千上萬次測試,可有效加速整個開發(fā)流程。倘若某個設計在現(xiàn)實應用中表現(xiàn)欠佳,便可返回仿真環(huán)境對模型進行優(yōu)化,之后再次測試。
這種開發(fā)方法也解釋了機器人技術相較于自動駕駛技術難度更高的原因。自動駕駛主要聚焦于躲避障礙物和保障行駛安全,無需與物理物體產生直接交互。而機器人領域則涉及與物體的接觸、碰撞以及復雜的物理互動,這些環(huán)節(jié)的測試與優(yōu)化難度極大。
仿真并非一個新概念。在芯片領域,仿真就早已進入了大規(guī)模生產之中,因為芯片設計一旦出現(xiàn)錯誤,可能會導致項目延誤數(shù)月,造成數(shù)百萬甚至數(shù)十億美元的損失。所以,這樣來看,給機器人仿真,也具備一定可行性。
不過,在機器人領域,仿真的主要的挑戰(zhàn)在于 “仿真與現(xiàn)實的差距”(sim-to-real gap),即仿真結果與實際表現(xiàn)之間存在差異。在過去,由于仿真技術精度有限,該技術并未得到廣泛應用。然而,諸如 Omniverse 等技術的出現(xiàn),顯著縮小了這一差距。盡管目前這一差距尚未完全消除,但技術的改進程度已足以使仿真成為機器人開發(fā)中可行且有效的工具。
據(jù)了解, NVIDIA 并不直接參與機器人的制造環(huán)節(jié),而是選擇與所有投身于機器人制造以及機器人解決方案開發(fā)的專業(yè)人員展開合作。當前,NVIDIA 正在搭建一個綜合性平臺,該平臺涵蓋了訓練、仿真、部署三種計算系統(tǒng),以及與之相關的軟件工具和工作流程。其目的在于助力機器人專家、研究人員、機械工程師和測試人員能夠更為便捷地開發(fā)機器人解決方案,通過簡化流程和提高效率,加速機器人技術的研發(fā)進程。
機器人技術的另一個核心挑戰(zhàn)在于數(shù)據(jù)的獲取與生成。Deepu指出,與自動駕駛汽車依賴現(xiàn)有車輛生成海量數(shù)據(jù)不同,當前機器人的數(shù)量遠不足以滿足訓練需求。為此,NVIDIA采用了以下解決方案:
1. 合成數(shù)據(jù)生成:通過工具(如NVIDIA Cosmos)創(chuàng)建逼真的虛擬環(huán)境,生成多樣化的機器人交互數(shù)據(jù)。
2. 結合真實與合成數(shù)據(jù):整合少量真實數(shù)據(jù)與大規(guī)模合成數(shù)據(jù),形成高效的數(shù)據(jù)工作流,滿足訓練與測試需求。
3. 仿真與現(xiàn)實結合的優(yōu)化:克服“仿真與現(xiàn)實的差距”(sim-to-real gap),通過高精度仿真提升現(xiàn)實應用的準確性。
這一數(shù)據(jù)生成與整合方案不僅解決了數(shù)據(jù)稀缺問題,還大幅加快了機器人技術的開發(fā)進程。
在分享會上,銀河通用創(chuàng)始人、CTO王鶴分享了其在與英偉達合作取得的進展。他表示,我們使用NVIDIA Isaac系列以及現(xiàn)在的Omniverse等,積極探索使用仿真器合成大量的機器人操作數(shù)據(jù),并將其轉化為機器人的模型。我們將各種 3D 固體資產、環(huán)境以及各類材質和紋理素材相互融合,模擬機器人的運行場景,探討機器人如何操作物體。
銀河通用憑借具身大模型,已經成功涉足眾多行業(yè),涵蓋零售、酒店、接待、養(yǎng)老以及工業(yè)制造等領域。在北京奔馳的工廠里,我們可以看到銀河通用的人形機器人在人工裝載天窗玻璃及轉運過程中發(fā)揮著重要作用。在這個過程中,天窗玻璃在吸起和放下時容易出現(xiàn)錯誤擺放,一旦出現(xiàn)這種情況,以往需要人工終止轉運并進行修正。而現(xiàn)在,人形機器人基于視覺閉環(huán)和從仿真中學到的操作技能,經過良好訓練后,能夠快速發(fā)現(xiàn)錯誤并進行有目的的糾正。大家可以觀看這個視頻,視頻中人形機器人在搬運場景中的表現(xiàn)十分出色,面對 3×3×327 箱緊密排列的設備,人形機器人能夠在貨箱間高效搬運。
(免責聲明:本網站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網站出現(xiàn)的信息,均僅供參考。本網站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。
任何單位或個人認為本網站中的網頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。 )