撰文 | 小不董
編輯 | 李信馬
題圖 | IC Photo
科技圈整個(gè)10月最大的爭(zhēng)議事件之一,可能就是特斯拉的人形機(jī)器人了。
2022年10月1日上午,在全世界期待了一年之后,最后出現(xiàn)在屏幕面前的,卻是步履蹣跚的“垂垂老朽”,演示也僅僅是打了個(gè)招呼,并沒有回答問題或者跳舞,裸露的線路和電池給人一種剛從實(shí)驗(yàn)室拉出來的感覺。
Optimus原型機(jī) ,動(dòng)圖有加速 圖片來源:特斯拉
去年的AI Day上,特斯拉人形機(jī)器人的展示視頻中,是一位靈活的的機(jī)器人舞者。也因此,小米的CyberOne(鐵大)首次亮相后,被觀眾們?nèi)撼捌渥呗纷藙?shì)像裹腳老太太,可以被特斯拉的機(jī)器人扶著過馬路。但沒想到,真實(shí)的特斯拉的人形機(jī)器人Optimus(擎天柱)卻也遠(yuǎn)沒達(dá)到觀眾們的預(yù)期。
不過這絲毫沒有影響特斯拉CEO埃隆·馬斯克的興致,馬斯克在AI Day現(xiàn)場(chǎng)表示,有信心以非常低的成本來實(shí)現(xiàn)機(jī)器人的量產(chǎn),并且產(chǎn)量應(yīng)該可以達(dá)到數(shù)百萬(wàn)臺(tái),最終價(jià)格會(huì)不到2萬(wàn)美元。?
這一臺(tái)目前看起來還很簡(jiǎn)陋的人形機(jī)器人,真的能推動(dòng)行業(yè)的變革嗎??
在優(yōu)必選科技副總裁、人形機(jī)器人創(chuàng)新中心負(fù)責(zé)人付春江看來,還真有這個(gè)可能。
目前人形機(jī)器人的技術(shù)相關(guān)路線分成三個(gè)范式:第一是以本田Asimo為代表的簡(jiǎn)化模型位置控制,其特點(diǎn)是利用簡(jiǎn)化模型節(jié)約算力;第二是波士頓動(dòng)力Atlas的動(dòng)力學(xué)控制,以及后期發(fā)展的高速 WBC全身內(nèi)控的相關(guān)算法,特點(diǎn)是實(shí)時(shí)優(yōu)化;第三是美國(guó)敏捷機(jī)器人公司人形機(jī)器人Digit強(qiáng)化學(xué)習(xí)的范式,其特點(diǎn)是可以補(bǔ)償彈性連桿的沒有建模的相關(guān)屬性。?
付春江認(rèn)為,基于其實(shí)時(shí)性與通用性,特斯拉的擎天柱很有可能創(chuàng)造第四范式,即基于大規(guī)模神經(jīng)網(wǎng)絡(luò)的通用視覺決策運(yùn)動(dòng)控制。?
在AI Day的這次展示中,擎天柱所演示的場(chǎng)景有三個(gè):澆花、搬箱子和工廠零部件的移動(dòng),分別代表家庭服務(wù)、物流遞送和工廠裝配,每做一件事情都有相應(yīng)的一整套流程。
付春江告訴:“這三個(gè)場(chǎng)景在現(xiàn)實(shí)的開發(fā)難度其實(shí)是反過來的,隨著場(chǎng)景從結(jié)構(gòu)化到非結(jié)構(gòu)化,從靜態(tài)到動(dòng)態(tài),首先會(huì)實(shí)施的是在工廠里邊,因?yàn)楣S的環(huán)境以及所使用的零部件的尺寸,都可以有相應(yīng)數(shù)據(jù)輸入到機(jī)器人當(dāng)中,這個(gè)是相對(duì)比較結(jié)構(gòu)化的。第二個(gè)場(chǎng)景就是在物流遞送方面,從這開始它的環(huán)境就逐步開放了,隨著環(huán)境的動(dòng)態(tài)性、開放性以及任務(wù)的復(fù)雜性,最后才能到家庭服務(wù)場(chǎng)景。先在自己(特斯拉)的工廠里面去布置人形機(jī)器人,用途是為了快速積累數(shù)據(jù)與迭代調(diào)試?!?/p>
付春江認(rèn)為,特斯拉有龐大的、先進(jìn)的FSD自動(dòng)駕駛平臺(tái)作為基礎(chǔ),隨著它的大規(guī)模數(shù)據(jù)和網(wǎng)絡(luò)的建立,以及在它自身工廠場(chǎng)景部署數(shù)據(jù)采集,特斯拉的未來迭代速度會(huì)超過大家的預(yù)期。?
一、FSD:車能用,機(jī)器人也能用?
FSD(Full Self-Drive),即“完全自動(dòng)駕駛”。
人形機(jī)器人想要有能力在物理世界中移動(dòng)并且具備一定程度的智能,那其“大腦”就需要做到人類大腦能做的,比如能夠處理視覺數(shù)據(jù),發(fā)出動(dòng)作指令,還要支持通信,擎天柱的大腦就是特斯拉的人工智能系統(tǒng)。
機(jī)器視覺作為一種底層通用技術(shù),可以擴(kuò)展到手機(jī)、攝像頭、自動(dòng)駕駛汽車、機(jī)器人等諸多產(chǎn)品形態(tài),在鐵大的視覺系統(tǒng)上,就用了很多小米手機(jī)的圖像處理能力。而擎天柱頭部會(huì)裝配特斯拉車同款的智能駕駛攝像頭,具備與特斯拉車相同的視覺感知能力,可以說在機(jī)器視覺算法上,擎天柱與特斯拉汽車的FSD一脈相承。
特斯拉結(jié)合自動(dòng)駕駛的視覺處理和傳感技術(shù),可以確保機(jī)器人保持良好的姿態(tài)和步態(tài),同時(shí)對(duì)人類相關(guān)的動(dòng)作進(jìn)行關(guān)鍵幀分析,再用算法映射到機(jī)器人,做到更好的軌跡規(guī)劃。?
此外,特斯拉在汽車自動(dòng)駕駛領(lǐng)域的自研芯片、軟件算法、訓(xùn)練模型以及其超級(jí)計(jì)算機(jī)Dojo的AI算力,都可以支持到特斯拉人形機(jī)器人,這是擎天柱其相較于其它人形機(jī)器人的核心優(yōu)勢(shì)。比如特斯拉的機(jī)器人使用了單顆特斯拉自研的SoC芯片,而并非特斯拉在汽車上使用的雙芯片自動(dòng)駕駛方案。?
下圖中,特斯拉的研發(fā)人員最近正在訓(xùn)練人形機(jī)器人的計(jì)算機(jī)視覺識(shí)別高頻特征,讓人形機(jī)器人能夠快速找到最近的充電站。?
圖片來源:特斯拉
軟件上的優(yōu)勢(shì)固然重要,不過當(dāng)下機(jī)器人最需要解決的問題,可能還是集中在硬件上,對(duì)此,付春江也表示:“就硬件水平來講,特斯拉與世界領(lǐng)先的人形機(jī)器人是沒有代差的。”?
二、硬件:性價(jià)比高,可以量產(chǎn)?
目前業(yè)界運(yùn)動(dòng)能力最強(qiáng)的人形機(jī)器人,非波士頓動(dòng)力Atlas莫屬,但其成本之高也令人咋舌。而特斯拉顯然是希望打造一款足夠靈活但又性價(jià)比高,能夠大量生產(chǎn)的人形機(jī)器人,這也是這款產(chǎn)品的初衷——替代人類去做大量重復(fù)性的工作。
要達(dá)到這個(gè)目標(biāo),就像電動(dòng)汽車一樣,首先要能“續(xù)航”。從擎天柱的概念圖中可以看到,整個(gè)機(jī)器人包含了28個(gè)電動(dòng)驅(qū)動(dòng)器(橙色標(biāo)注)和電池及控制模塊(藍(lán)色標(biāo)注)。特斯拉將配電和計(jì)算機(jī)集中到平臺(tái)的物理中心,也就是機(jī)器人的軀干中心,身體中間有2.3kWh的電池組,工作電壓為52V,其中的電池組可以維持它一整天的工作,其目標(biāo)就是盡量減少每個(gè)元件的數(shù)量和功能損耗。
圖片來源:特斯拉
電池組的獨(dú)特之處在于,可以把所有電池的電子設(shè)備集中到電池組內(nèi)的單個(gè)PCB里面,這就意味著從傳感到融合到充電管理,全都匯集到這一個(gè)系統(tǒng)中。這項(xiàng)技術(shù)借鑒了特斯拉在電子產(chǎn)品和汽車上的設(shè)計(jì),電池組只有實(shí)現(xiàn)真正高效簡(jiǎn)單的冷卻,才能確保良好的電池管理和安全性。
其次,是足夠靈活且耐用。完全體的擎天柱體重73kg,用電功率在靜坐時(shí)為100W,快走時(shí)500W,全身有200多個(gè)自由度,手部27個(gè)自由度。機(jī)器人在研發(fā)過程中,受到了生物學(xué)的啟發(fā),以機(jī)器人腿部關(guān)節(jié)為例,就是仿照了人類膝蓋的真實(shí)結(jié)構(gòu)。
圖片來源:特斯拉
研發(fā)人員將人類的膝蓋和其運(yùn)動(dòng)過程中所受的力線性化,比如說行走,上樓梯下蹲,它的關(guān)節(jié)會(huì)呈現(xiàn)什么樣一個(gè)壓力曲線,從而學(xué)習(xí)如何讓機(jī)器人膝蓋使用更少的力來構(gòu)建,能實(shí)現(xiàn)更好的力度控制的同事,也讓相關(guān)結(jié)構(gòu)緊密的包裹在膝蓋周圍。
圖片來源:特斯拉
在爬樓梯、攀巖或步行時(shí),要考慮機(jī)器人關(guān)節(jié)所承受的壓力,研發(fā)人員將不同的參數(shù)錄入優(yōu)化程序和優(yōu)化模型中,以求機(jī)器人適應(yīng)不同的場(chǎng)景。
人形機(jī)器人行走并轉(zhuǎn)彎的場(chǎng)景 來源:特斯拉
執(zhí)行器的效率圖生成了相關(guān)軌跡,以點(diǎn)云的形式進(jìn)行記錄。機(jī)器人的每個(gè)關(guān)節(jié)都是特定的,28個(gè)關(guān)節(jié)都需要定制規(guī)格。因此,研發(fā)人員需要減少定制的執(zhí)行器設(shè)計(jì),解析它們上傳的云并采取共性研究。特斯拉展示了擎天柱在極限情況下所能達(dá)到的測(cè)試效果,其關(guān)節(jié)驅(qū)動(dòng)器能吊起一架半噸重的鋼琴。
圖片來源:特斯拉
同樣采用了生物學(xué)的還有機(jī)械手,和人手一樣同樣使用五個(gè)手指來驅(qū)動(dòng),既可以完成大口徑物體抓取,同時(shí)也能滿足抓取精巧物體的需求。特斯拉的人形機(jī)器人手指有6個(gè)執(zhí)行器和11個(gè)自由度,搭載了能夠驅(qū)動(dòng)手指并進(jìn)行感知的傳感器。
圖片來源:特斯拉
在安全性和可靠性方面,特斯拉也做了不少的設(shè)計(jì)。由于一臺(tái)機(jī)器人的維修成本很高,所以為了保護(hù)機(jī)器人,研發(fā)人員對(duì)其結(jié)構(gòu)基礎(chǔ)進(jìn)行了優(yōu)化,在人形機(jī)器人摔倒時(shí)不會(huì)把變速器和胳膊弄壞。
圖片來源:特斯拉
研發(fā)人員還采用了與汽車相同的底層技術(shù),讓機(jī)器人在所有組件中產(chǎn)生壓力,使得其行走控制變得更加容易,也不會(huì)那么僵硬。
圖片來源:特斯拉
今年4月份,擎天柱的移動(dòng)速度還很慢;今年7月,人形機(jī)器人解鎖了骨盆的應(yīng)用來保持平衡;8月時(shí),手臂開始發(fā)揮作用;到9月份,擎天柱的腳趾也利用了起來,擎天柱的移動(dòng)速度有了明顯的提升。一年的時(shí)間,軟硬件升級(jí)過后的擎天柱,就這樣出現(xiàn)在了我們眼前。
圖片來源:特斯拉
雖然現(xiàn)在還顯得笨拙,但這樣的不斷進(jìn)步是有其價(jià)值的,比如人形機(jī)器人可能最早落地的場(chǎng)景——工廠,目前自動(dòng)化程度已經(jīng)很高了,但是總裝線的自動(dòng)化率依然較低,細(xì)碎輕巧的任務(wù)基本是靠人工,那么人形機(jī)器人正好能夠彌補(bǔ)這個(gè)空白,在移動(dòng)中實(shí)現(xiàn)裝配。
“人形機(jī)器人在B端的應(yīng)用,與常見的機(jī)械臂、物流機(jī)器人相比,是在中短距離的移動(dòng)范圍內(nèi),用雙臂和靈巧手完成的序列化的工作。比如需要快速更換不同工具,需要多種對(duì)象的動(dòng)態(tài)任務(wù)序列等等,這些都是與機(jī)械臂和物流機(jī)器人可以打出差異化來的。”付春江說。
三、人形機(jī)器人什么時(shí)候能真正投入實(shí)用?
工廠更期待的是二十出頭的年輕勞動(dòng)力,而非七老八十的“老年機(jī)器人”。
“我個(gè)人認(rèn)為研發(fā)和量產(chǎn),是人形機(jī)器人最終走向落地、走進(jìn)千家萬(wàn)戶非常關(guān)鍵的一步。但從過去的這種Demo級(jí)來看的話,量產(chǎn)還存在運(yùn)動(dòng)能力不達(dá)標(biāo)、成本居高不下、缺乏落地場(chǎng)景這三個(gè)非常大的困難?!备洞航锌?。
優(yōu)必選科技同樣是全球優(yōu)秀的人形機(jī)器人科技公司,旗下人形機(jī)器人Walker X也開始在科研開發(fā)和科技展館、影視綜藝、商演活動(dòng)、政企展廳等商用服務(wù)領(lǐng)域?qū)崿F(xiàn)落地應(yīng)用,做出了人形機(jī)器人商業(yè)化嘗試的示范案例,未來有望走進(jìn)千家萬(wàn)戶,在家庭服務(wù)場(chǎng)景中使用。
在場(chǎng)景落地方面,優(yōu)必選科技進(jìn)行了超過1000小時(shí)無故障的實(shí)際場(chǎng)景落地演練工作,在付春江看來,人形機(jī)器人現(xiàn)在是相當(dāng)于iPhone1的階段,還處于快速發(fā)展的開端。“隨著大手企業(yè)的不斷進(jìn)入,對(duì)賽道的不斷加碼,會(huì)有大量的上游零部件企業(yè),比如電機(jī)檢測(cè)、器廠、傳感器廠、結(jié)構(gòu)加工廠會(huì)得到相關(guān)益處,質(zhì)量、數(shù)量方面都會(huì)有所增加。另外下游的場(chǎng)景開發(fā)的針對(duì)性的這些廠商,數(shù)據(jù)服務(wù)廠商等等,甚至是第三方運(yùn)維交付的廠商都會(huì)有很大的發(fā)展。”
在成本方面,優(yōu)必選科技是全球第一個(gè)實(shí)現(xiàn)大型人形機(jī)器人BOM成本降至十萬(wàn)美元級(jí)別的公司。付春江表示,國(guó)產(chǎn)人形機(jī)器人在量產(chǎn)加國(guó)產(chǎn)化之后,至少在動(dòng)力系統(tǒng)方面可以下降50%,算力系統(tǒng)可以有15%-25%的下降,而結(jié)構(gòu)及外觀可以有40%甚至更多的下降,“在2025年左右,我認(rèn)為人形機(jī)器人的成本可以降到5萬(wàn)美元,或者是再稍微高一點(diǎn)的程度”。
而特斯拉大量沿用來自車端的成熟技術(shù),再加上偏量產(chǎn)實(shí)用性的設(shè)計(jì)思路,使得擎天柱的生產(chǎn)成本具備極大的優(yōu)勢(shì)。除量產(chǎn)以外,還可以通過國(guó)產(chǎn)化替代,或者國(guó)產(chǎn)的二線廠商隨著技術(shù)水平進(jìn)步替代國(guó)產(chǎn)一線廠商,以及改進(jìn)生產(chǎn)工具,減少相關(guān)零部件,還有用更魯棒的運(yùn)動(dòng)控制算法來降低對(duì)硬件精確度及硬件指標(biāo)的要求來降低成本。如果能結(jié)合以上4點(diǎn),付春江估計(jì)特斯拉會(huì)在2025-2030年之間,實(shí)現(xiàn)2萬(wàn)美元的相關(guān)成本。
人形機(jī)器人想要走進(jìn)千家萬(wàn)戶,首先要能以較高的完成度去完成消費(fèi)者和社會(huì)的需求,其次是成本和通用AI的發(fā)展,最后還少不了人形機(jī)器人的易用程度,例如能夠開箱即用和售后維護(hù),這些都是人形機(jī)器人未來產(chǎn)品化過程中不可或缺的。
圖片來源:網(wǎng)絡(luò)
顯然,這不是短期能達(dá)到的,但我們依然可以看好其未來的成長(zhǎng)性,馬斯克在活動(dòng)期間發(fā)的推文,透露擎天柱機(jī)器人將會(huì)有“貓女版”,可以看出,特斯拉對(duì)于人形機(jī)器人抱有強(qiáng)烈的信心,隨著更多的資本進(jìn)入賽道,特斯拉入局有望推動(dòng)行業(yè)從實(shí)驗(yàn)室階段過渡到商業(yè)化階段,?人形機(jī)器人的發(fā)展未來可期。
- 蜜度索驥:以跨模態(tài)檢索技術(shù)助力“企宣”向上生長(zhǎng)
- 特斯拉CEO馬斯克身家暴漲,穩(wěn)居全球首富寶座
- 阿里巴巴擬發(fā)行 26.5 億美元和 170 億人民幣債券
- 騰訊音樂Q3持續(xù)穩(wěn)健增長(zhǎng):總收入70.2億元,付費(fèi)用戶數(shù)1.19億
- 蘋果Q4營(yíng)收949億美元同比增6%,在華營(yíng)收微降
- 三星電子Q3營(yíng)收79萬(wàn)億韓元,營(yíng)業(yè)利潤(rùn)受一次性成本影響下滑
- 賽力斯已向華為支付23億,購(gòu)買引望10%股權(quán)
- 格力電器三季度營(yíng)收同比降超15%,凈利潤(rùn)逆勢(shì)增長(zhǎng)
- 合合信息2024年前三季度業(yè)績(jī)穩(wěn)?。籂I(yíng)收增長(zhǎng)超21%,凈利潤(rùn)增長(zhǎng)超11%
- 臺(tái)積電四季度營(yíng)收有望再攀高峰,預(yù)計(jì)超260億美元刷新紀(jì)錄
- 韓國(guó)三星電子決定退出LED業(yè)務(wù),市值蒸發(fā)超4600億元
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。