商湯科技聯(lián)合創(chuàng)始人、首席科學(xué)家、商湯絕影CEO王曉剛
編者按:騰訊汽車編輯部把過去十年的電動(dòng)化浪潮稱之為中國汽車工業(yè)的“狂飆年代”,如今,站在2024年這個(gè)被譽(yù)為“智駕元年”的歷史節(jié)點(diǎn),我們不禁要問:產(chǎn)業(yè)主要參與者將堅(jiān)持怎樣的技術(shù)路線?又如何構(gòu)筑各自的競爭壁壘?騰訊汽車特別推出智駕系列策劃,通過訪談、實(shí)測、橫評(píng)、綜述等多種方式,力求站在歷史的原點(diǎn),進(jìn)一步洞悉汽車工業(yè)未來十年可能發(fā)生的巨大變革,為讀者和行業(yè)提供更全面的內(nèi)容導(dǎo)引,為行業(yè)留下部分歷史注腳。
騰訊新聞《遠(yuǎn)光燈》
作者 傲敦
編輯 楊布丁
商湯闖入汽車圈,或許要感謝一場暴雨。
2017年夏天,商湯、本田和另一家公司的技術(shù)團(tuán)隊(duì)同時(shí)出現(xiàn)在本田日本測試場,本田要求商湯只用兩顆攝像頭完成車輛自動(dòng)駕駛,其他團(tuán)隊(duì)則使用多傳感器融合方案。
誰都沒料到,演示那天下起了暴雨,那些依賴激光雷達(dá)、慣導(dǎo)、高精度地圖的車輛徹底“罷工”。商湯用純視覺方案,在惡劣天氣條件下順利完成了任務(wù)。
幾個(gè)月后,商湯和本田簽署了長達(dá)5年的合作協(xié)議,雙方共研L4自動(dòng)駕駛技術(shù)。
那日帶隊(duì)贏下項(xiàng)目的是商湯科技聯(lián)合創(chuàng)始人、首席科學(xué)家王曉剛,現(xiàn)在他還有另一個(gè)新身份——商湯絕影CEO。從2017起,王曉剛便帶著近四十人的團(tuán)隊(duì)一腳踏入眼下最卷、最殘酷的行業(yè):汽車圈。
2017年的智駕圈,Transformer等先進(jìn)的網(wǎng)絡(luò)結(jié)構(gòu)尚未成熟,如今火爆的端到端更是沒出現(xiàn),自動(dòng)駕駛技術(shù)路線、商業(yè)模式也都不清晰,多數(shù)以L4級(jí)為主,距離規(guī)?;慨a(chǎn)還有一段距離。
直到2020、 2021年,商湯等一批新入局的智駕供應(yīng)商終于看到了機(jī)會(huì)。當(dāng)時(shí)國內(nèi)車企多數(shù)用Mobileye方案,但它高度封閉,導(dǎo)致車企無法采集自己數(shù)據(jù),車廠不得不嘗試更多可能性。王曉剛回憶說,那時(shí)商湯看到了做量產(chǎn)智駕方案的機(jī)會(huì),開始逐步加大對(duì)智駕的投入。2021年絕影品牌誕生,聚焦智能汽車領(lǐng)域。
闖入汽車圈后,商湯絕影經(jīng)歷了波折且痛苦的轉(zhuǎn)型過程,但最終還是成功交付,完成了第一階段蛻變。如今,特斯拉FSD入華已箭在弦上,但在王曉剛看來,這是商湯絕影一個(gè)機(jī)會(huì)點(diǎn),“車企跟我們深度合作,會(huì)是在AGI時(shí)代取得成功的最佳路徑”。
“中國車企和科技公司的合作閉環(huán)里,不能只是會(huì)解bug。”王曉剛認(rèn)為,雙方需要建立“你中有我,我中有你”的模式,共同打造一個(gè)可升級(jí)、可迭代的研發(fā)體系,即AI時(shí)代的基礎(chǔ)建設(shè)。
從2014成立那天起,商湯一直在聚光燈下,那里有一群頂尖科學(xué)家,曾被稱為“AI四小龍”之首。但成立十年來,商湯一直在探索如何通過技術(shù)變現(xiàn)來養(yǎng)活自己,按照王曉剛說法,“壓力還是很大的”。他對(duì)絕影團(tuán)隊(duì)說, “只有半年的生命,半年之后可能再續(xù)命”。
以下是騰訊新聞《遠(yuǎn)光燈》與王曉剛的對(duì)話,經(jīng)編輯:
“在今天,汽車成了AI最大的牽引動(dòng)力”
《遠(yuǎn)光燈》:我比較好奇,你從學(xué)術(shù)界轉(zhuǎn)到工業(yè)界,今天又進(jìn)入到汽車這個(gè)特別卷的行業(yè),有什么感受?
王曉剛:我是2016年從學(xué)校進(jìn)入到商湯,大家很多時(shí)候都覺得商湯是教授從實(shí)驗(yàn)室出來創(chuàng)辦的公司,那里面學(xué)術(shù)氛圍比較濃,不接地氣。其實(shí)不是這樣,從商湯建立那天起,你就必須得通過技術(shù)變現(xiàn)來養(yǎng)活自己,壓力還是非常大的。所以,那時(shí)候開始我負(fù)責(zé)研究,很快開始接觸業(yè)務(wù),包括當(dāng)時(shí)跟本田的合作,手機(jī)業(yè)務(wù)、互聯(lián)網(wǎng)業(yè)務(wù)我都負(fù)責(zé)過。
今天我們說汽車行業(yè)“卷”,其實(shí)手機(jī)市場 “卷”得更早。在手機(jī)業(yè)務(wù)市場,我們經(jīng)歷過比較殘酷的、激烈的市場競爭,記得當(dāng)時(shí)我們大年初三就到崗,跟友商PK非常激烈,好在我們?cè)诩夹g(shù)比拼方面比較有優(yōu)勢,最后我?guī)ш?duì)拿下了訂單。
另外,我們最早接觸的本田項(xiàng)目也是我?guī)е鴪F(tuán)隊(duì)最終贏下來的。當(dāng)時(shí)有一個(gè)展示前端技術(shù)的活動(dòng),本田的社長等高層都在場,本田要求我們就用兩顆攝像頭,在本田日本測試場里能夠完成自動(dòng)駕駛。
那天有我們和本田自己的團(tuán)隊(duì)、還有一個(gè)外部團(tuán)隊(duì),他們用的就是激光雷達(dá)、慣導(dǎo)、高精度地圖。演示那天下起了暴雨,那些強(qiáng)依賴于這些傳感器和硬件設(shè)備的團(tuán)隊(duì),整個(gè)就不能工作了。最后我們商湯純視覺方案,就用兩個(gè)攝像頭,還是在惡劣天氣條件下順利完成任務(wù),最終贏得了這個(gè)項(xiàng)目。
商湯是經(jīng)歷了很多考驗(yàn),但是進(jìn)入汽車這個(gè)行業(yè)后,我們發(fā)現(xiàn)競爭更加激烈、更加殘酷。到淘汰賽階段,車廠對(duì)交付、質(zhì)量要求、deadline的限制,這些要求都特別高。我們也經(jīng)歷過項(xiàng)目交付的各種挑戰(zhàn),我跟團(tuán)隊(duì)一塊駐場,跟客戶一起完成的。我覺得,這些都是必經(jīng)的過程,商湯和絕影也都是在這樣的過程當(dāng)中成長起來的。
《遠(yuǎn)光燈》:“AI四小龍”里,其實(shí)你們是最早堅(jiān)定的進(jìn)入到汽車產(chǎn)業(yè)的公司,這是為什么?
王曉剛:這跟創(chuàng)始人對(duì)于每一個(gè)公司的未來和定位是息息相關(guān)的。商湯是一家人工智能平臺(tái)公司,因?yàn)锳I的發(fā)展是有周期的,跟行業(yè)密切相關(guān),所以不同行業(yè)依次會(huì)形成AI的推動(dòng)力,AI的發(fā)展需要某些行業(yè)來進(jìn)行牽引。
在今天,我們看來,汽車就成了AI最大的牽引動(dòng)力。但是,若干年前那就是智慧城市、手機(jī)和互聯(lián)網(wǎng),它們是AI的動(dòng)力。商湯其實(shí)都有前瞻性的布局,作為一個(gè)平臺(tái)公司,商湯也是隨著行業(yè)的變化和發(fā)展,往前演進(jìn)。
今天汽車作為非常重要的板塊,我們需要深耕下去,大模型無論是在智能駕駛還是智能座艙領(lǐng)域,它都是有非常好的、比較明確的落地場景。
將來,這些技術(shù)可能又能夠被機(jī)器人所復(fù)用。只不過今天,機(jī)器人的量產(chǎn)數(shù)量是非常少,汽車有比較龐大的量產(chǎn)群體給你提供反饋,去打磨你的技術(shù)。
《遠(yuǎn)光燈》:所以對(duì)于商湯這類AI公司來說,下一個(gè)風(fēng)口行業(yè)就是機(jī)器人?
王曉剛:對(duì)于絕影來說,我們會(huì)扎根在汽車這個(gè)方向。商湯本身,它不會(huì)一直就只停留在汽車這個(gè)方向,它還會(huì)再往前走。因?yàn)?a href="http://worldfootballweekly.com/%E4%BA%BA%E5%B7%A5%E6%99%BA%E8%83%BD_1.html" target="_blank" class="keylink">人工智能技術(shù)本身也還在演進(jìn)過程當(dāng)中,我們就會(huì)一直深耕下去。
《遠(yuǎn)光燈》:目前你們?cè)谒懔用娴膬?chǔ)備是多少?
王曉剛:在算力層面,商湯從2018年開始布局建設(shè)AI基礎(chǔ)設(shè)施,在上海臨港投入了超50億元建設(shè)智算中心AIDC。商湯大裝置已經(jīng)布局全國一體化的智算網(wǎng)絡(luò),運(yùn)營54,000卡GPU,總體算力規(guī)模達(dá)20,000 petaFLOPS(每秒千萬億次浮點(diǎn)運(yùn)算次數(shù),下稱“P”)。
其實(shí),國內(nèi)大多數(shù)車企的算力儲(chǔ)備尚未突破2,000 P,所以說,我們充足的算力資源為UniAD自動(dòng)駕駛方案的高效訓(xùn)練學(xué)習(xí)和實(shí)車部署奠定了堅(jiān)實(shí)的基礎(chǔ)。
《遠(yuǎn)光燈》:商湯大裝置和基礎(chǔ)設(shè)施會(huì)給到絕影什么樣的支持?
王曉剛: 我們的合作非常緊密。首先,像基礎(chǔ)設(shè)施,也就是我們說的大裝置,算力平臺(tái)、數(shù)據(jù)存儲(chǔ)等,因?yàn)樽詣?dòng)駕駛,尤其是端到端對(duì)于數(shù)據(jù)存儲(chǔ)要求非常高,因?yàn)槎际且曨l片段。
在端到端早期訓(xùn)練過程中,我們遇到了很多困難,中臺(tái)部門跟我們一起進(jìn)行反復(fù)迭代;另外,大模型、多模態(tài)大模型等很多方面,商湯產(chǎn)研部門會(huì)進(jìn)行支持,包括最新的日日新5o流式多模態(tài)大模型。我們把商湯在大模型上的這些突破運(yùn)用到車載的領(lǐng)域。
自動(dòng)駕駛量產(chǎn)交付是考驗(yàn)的第一步
《遠(yuǎn)光燈》: 從最早的本田項(xiàng)目再到絕影品牌,你們是怎么確定的這個(gè)方向?
王曉剛:我們是從2016、2017年開始了智駕方面的研發(fā)。當(dāng)時(shí)本田來中國尋找智駕合作伙伴,他們看了很多公司。當(dāng)時(shí)商湯整個(gè)體量還比較小,做智駕的研發(fā)人員也就三四十人,但本田非??粗厣虦诨A(chǔ)設(shè)施、訓(xùn)練框架等方面的能力和創(chuàng)新能力,所以最終選定跟我們合作。
本田當(dāng)時(shí)給我們提出的目標(biāo)跟今天的端到端自動(dòng)駕駛非常像,就是純視覺,只用攝像頭、沒有高精度地圖,不使用激光雷達(dá),直接根據(jù)視覺去預(yù)測輸出駕駛軌跡。在當(dāng)時(shí),像Transformer等先進(jìn)的網(wǎng)絡(luò)結(jié)構(gòu)還沒有成熟,無論是端上的算力還是云上的算力,也都不具備相應(yīng)條件。
另外,早期自動(dòng)駕駛的技術(shù)路線、商業(yè)模式也都是不清晰,那時(shí)候雖然有很多自動(dòng)駕駛公司,但大多數(shù)以L4級(jí)的自動(dòng)駕駛為主。
直到2020和2021年,我們?cè)谥邱{方面看到了一個(gè)契機(jī)。一些國產(chǎn)車廠之前大多用的都是某廠商的方案,它是高度封閉的,甚至車廠連自己的數(shù)據(jù)都沒有辦法采集到,就只能給到某廠商。所以,一些新的供應(yīng)商獲得了一個(gè)契機(jī),為車廠去做量產(chǎn)智駕解決方案。從那時(shí)開始,商湯開始逐步加大對(duì)智駕的投入,2021年,商湯就有了“絕影”這個(gè)名字和品牌。
《遠(yuǎn)光燈》:當(dāng)時(shí)你們內(nèi)部有沒有產(chǎn)生過什么爭執(zhí)或者猶豫過?對(duì)你們來說這是一個(gè)比較大的轉(zhuǎn)型。
王曉剛:2021年商湯上市之前,我們內(nèi)部針對(duì)智駕做過比較大的討論,因?yàn)橹邱{投入是比較高的,而且有很強(qiáng)的不確定性,風(fēng)險(xiǎn)比較高,但是汽車給AI帶來的牽引動(dòng)力會(huì)是巨大的,最后我們還是下決定要做。所以到2022年,我們就成立了絕影智能汽車事業(yè)群,由我來負(fù)責(zé)。
另外,這幾年商湯逐漸加大智能汽車領(lǐng)域的投入,因?yàn)槲覀円部吹揭恍┍容^清晰的商業(yè)模式,跟主機(jī)廠合作去提供量產(chǎn)方案,這是一個(gè)趨勢。到2022年年底,我們提出了端到端UniAD的解決方案。
同時(shí),2022年年底,ChatGPT出圈了,大家對(duì)大模型開始有了認(rèn)知。其實(shí)在2022年一整年,我們給各個(gè)車廠推的就是智駕大模型,現(xiàn)在看來確實(shí)是太超前了。
所以到了2023年,我們絕影繼續(xù)加大這方面的投入,包括UniAD端到端自動(dòng)駕駛,車艙大模型應(yīng)用。在這個(gè)過程中,絕影逐步找到了自己在整個(gè)行業(yè)中的定位和未來發(fā)展方向,同時(shí)商湯本身在基礎(chǔ)設(shè)施大裝置方面的優(yōu)勢也更加清晰。
《遠(yuǎn)光燈》:剛開始的時(shí)候你們有沒有制定一個(gè)目標(biāo)或者打法?
王曉剛:具體看業(yè)務(wù)本身,座艙相對(duì)來說“輕”一些,交付速度會(huì)快一些,現(xiàn)在我們的市場覆蓋度還比較高,有30多個(gè)車廠合作。智駕業(yè)務(wù)比較“重”,從未來發(fā)展趨勢看,其實(shí)是要求合作伙伴跟車企有一些比較深度的合作。
尤其在今天的端到端時(shí)代,我們的目標(biāo)是能夠?qū)ふ規(guī)准抑攸c(diǎn)車企形成戰(zhàn)略合作,因?yàn)檐嚻笥辛慨a(chǎn)車,有比較豐沛的數(shù)據(jù),而我們商湯絕影有包括算力和數(shù)據(jù)生產(chǎn)管線在內(nèi)的基礎(chǔ)設(shè)施,雙方能夠打通整個(gè)閉環(huán)。
這是比較重要的,因?yàn)槠囀袌龈偁幈容^激烈,未來還會(huì)進(jìn)一步聚焦,我覺得重點(diǎn)不是說貪多,而是要一些形成閉環(huán)、戰(zhàn)略合作。
《遠(yuǎn)光燈》:商湯是一家AI公司,你們是怎么說服更多車企客戶跟你們合作的?
王曉剛:我們這樣的AI公司作為供應(yīng)商進(jìn)入汽車行業(yè),在量產(chǎn)交付上一定要實(shí)現(xiàn)一個(gè)蛻變。從整個(gè)行業(yè)看,2021年到2023年大家剛開始做自動(dòng)駕駛量產(chǎn)交付、開始轉(zhuǎn)型,我們有三個(gè)量產(chǎn)交付的客戶其實(shí)都很關(guān)鍵,就是廣汽、合眾和一汽。
很多時(shí)候,實(shí)際上是我們客戶幫著我們成長的,因?yàn)樗麄冇懈鞣N流程、工作方式的要求,這個(gè)轉(zhuǎn)型過程是非常波折和痛苦的,但最終還是成功交付了。
所以我覺得在那個(gè)階段,經(jīng)歷量產(chǎn)的考驗(yàn)是第一步,是里程碑,絕影完成了蛻變。
我為什么說我們“只有半年的生命”
《遠(yuǎn)光燈》:聽說你跟團(tuán)隊(duì)說“只有半年的生命,半年之后可能再續(xù)命”,這是什么意思?
王曉剛:在汽車行業(yè),我們學(xué)到最多的就是結(jié)果導(dǎo)向。最終你要去看結(jié)果,你的量產(chǎn)交付質(zhì)量、時(shí)間點(diǎn),在一個(gè)項(xiàng)目里面,我們做軟件可能是最后一環(huán),那前面還有很多環(huán)節(jié),最后到我們這是后墻不倒。
具體到自動(dòng)駕駛,它又是一個(gè)技術(shù)棧特別深的的方向,要依賴的環(huán)節(jié)很多,所以要給大家梳理,要結(jié)果導(dǎo)向,守住自己的每一班崗。說的再好、再怎么樣天花亂墜,最終還是要結(jié)果。
對(duì)絕影來說,我們敬畏客戶,取得他們的信任和友誼,形成持久的戰(zhàn)略合作,這是因?yàn)槲覀冊(cè)陉P(guān)鍵時(shí)刻能夠去交付好的結(jié)果。
汽車行業(yè)你也知道,很多時(shí)候有一款車沒有做好,可能關(guān)系到這家公司的生死存亡。之所以我說半年的時(shí)間,是因?yàn)樵谄囆袠I(yè)經(jīng)歷的特定的時(shí)間點(diǎn)上,產(chǎn)業(yè)的演進(jìn)速度與競爭格局是非常激烈的。
只有半年的時(shí)間,并不是說沒有錢了、沒有現(xiàn)金流了。而是說,當(dāng)你的技術(shù)落后了,或者是沒有去交付好的時(shí)候,半年以后你可能就沒有客戶了。沒有客戶,你自然就已經(jīng)是被市場拋棄了,那么無論你是有多大的團(tuán)隊(duì)規(guī)模、多少現(xiàn)金,其實(shí)都是面臨著被淘汰的危險(xiǎn)。
所幸的是今天我們是有機(jī)會(huì)的,但我們要時(shí)刻提醒自己,這個(gè)機(jī)會(huì)也是稍縱即逝的,因?yàn)榇蠹已葸M(jìn)的速度都非???。
大模型上車、端到端自動(dòng)駕駛,在這個(gè)時(shí)間窗口里面,如果你不能夠拿出市場上認(rèn)可的產(chǎn)品和技術(shù)的話,那就會(huì)被淘汰。
《遠(yuǎn)光燈》:你的意思是說,無論是誰,汽車產(chǎn)業(yè)的競爭變化是半年決定著大家的存活。
王曉剛: 對(duì),而且你的技術(shù)路線也都是這樣的。去年這個(gè)時(shí)候,大家都在追求從高速到城區(qū),從有圖到無圖,現(xiàn)在是端到端的兩段式與一段式,技術(shù)演進(jìn)非???。
《遠(yuǎn)光燈》:從競爭氛圍看,你覺得2021年同2024年有哪些不一樣?你的對(duì)手、客戶,跟2021、2022年相比發(fā)生了什么變化?
王曉剛:我們覺得上一個(gè)階段競爭出來的結(jié)果是一種標(biāo)準(zhǔn)化產(chǎn)品的交付,到了今天,大家開始關(guān)注端到端,很多企業(yè)也開始了內(nèi)部調(diào)整。
在上一個(gè)階段,大家發(fā)現(xiàn)市場上已經(jīng)有一些成熟方案跑出來了,出于時(shí)間和成本的考慮,客戶直接采購市場上成熟的方案就可以了。這會(huì)使得車企自研團(tuán)隊(duì)跟供應(yīng)商,某種程度上是競爭和替代關(guān)系。
但是端到端出現(xiàn)以后,讓事情發(fā)生了變化。車廠數(shù)據(jù)、用戶駕駛數(shù)據(jù)更具價(jià)值了,車廠會(huì)給自研團(tuán)隊(duì)一個(gè)新的定位。像特斯拉,它不僅有數(shù)據(jù),還有比較強(qiáng)的AI基礎(chǔ)設(shè)施。這十萬塊GPU和幾百萬臺(tái)車,能夠形成數(shù)據(jù)閉環(huán),特斯拉想采什么數(shù)據(jù)就可以從自己的數(shù)據(jù)中拿,根據(jù)需要去訓(xùn)練模型。
我們的車廠沒有那么多算力,別說十萬塊GPU,有的連1000塊都沒有。作為供應(yīng)商來說,它又沒有辦法去拿到數(shù)據(jù),那車企和供應(yīng)商要怎么去跟行業(yè)的標(biāo)桿進(jìn)行抗衡?只有兩個(gè)結(jié)合在一起。
《遠(yuǎn)光燈》:絕影能解決什么痛點(diǎn)?你們?cè)趺幢WC這個(gè)結(jié)合一定能形成合力?
王曉剛:車廠自己的數(shù)據(jù)是有價(jià)值的,但怎么去用好這個(gè)數(shù)據(jù)?這需要有資源,怎么用好數(shù)據(jù)也有門檻。
車上每天產(chǎn)生的攝像頭采集數(shù)據(jù)量是龐大的,你不可能把這些數(shù)據(jù)都傳到后臺(tái)去,怎么去選擇這些數(shù)據(jù)、在什么樣的條件下去弄,這是非常關(guān)鍵的。
過去的標(biāo)準(zhǔn)化交付和未來與合作伙伴深度的合作,兩者之間有哪些差別,這些需要有車企自研團(tuán)隊(duì)能夠去理解。
你可以想象,如果我們是一個(gè)標(biāo)準(zhǔn)化交付,給車廠的方案都是黑盒,車廠不會(huì)放心的把數(shù)據(jù)交給你。因?yàn)榘褦?shù)據(jù)交給你,他什么也沒有得到。只有車企也能夠擁有這些研發(fā)體系,能夠理解你的研發(fā)流程,才能夠跟你一起去共同合作,共建共生。只有這樣,車企數(shù)據(jù)的價(jià)值才能發(fā)揮出來。這里面就是會(huì)產(chǎn)生新的合作的模式,那就是下一個(gè)階段了。
《遠(yuǎn)光燈》:下一個(gè)階段是指什么?
王曉剛:在端到端時(shí)代,車企和供應(yīng)商是要有比較深的融合,不僅僅是產(chǎn)品交付層面的合作,中國車企和科技公司的合作閉環(huán)里,不能只是會(huì)解bug,需要共同打造一個(gè)可升級(jí)、可迭代的研發(fā)體系,其實(shí)就是AI時(shí)代的基礎(chǔ)建設(shè)。
車企和AI公司深度融合,雙方把研發(fā)流程,研發(fā)體系能夠去對(duì)齊,不斷更新和迭代它的產(chǎn)品和服務(wù),將推動(dòng)雙方的進(jìn)一步合作。
《遠(yuǎn)光燈》:你的意思是說,下一步車廠研發(fā)團(tuán)隊(duì)來把數(shù)據(jù)這一塊做好,絕影發(fā)揮AI優(yōu)勢把算法做好,雙方深度綁定。這么做的原因,更多是考慮技術(shù)落地還是成本?
王曉剛:兩方面都有。比如,現(xiàn)在AI、大模型技術(shù)門檻本身就很高,同時(shí)需要持續(xù)投入,也需要演進(jìn)。雖然現(xiàn)在看到有一些有車廠也做大模型,同時(shí)自研自動(dòng)駕駛,不過你會(huì)發(fā)現(xiàn)這種模式一定是不劃算的。因?yàn)檫@些投入和基建設(shè)施只是服務(wù)一家企業(yè),但像商湯這樣的AI平臺(tái)公司,基礎(chǔ)設(shè)施和服務(wù)投入不光可以分?jǐn)偟狡囆袠I(yè),還有到其他行業(yè),去不斷迭代和共享這些平臺(tái)。
我們可以說,無論怎樣,目前自動(dòng)駕駛還在投入期。每個(gè)車廠維護(hù)一兩千人的團(tuán)隊(duì),大量投入和維護(hù)基礎(chǔ)設(shè)施,對(duì)他來說是不可持續(xù)的。尤其是今天,汽車圈價(jià)格戰(zhàn)一直在持續(xù),這對(duì)成本的要求是非常高的。
除了特斯拉,很少有車企能夠一家單打獨(dú)斗把算力、模型和數(shù)據(jù)幾方面都形成規(guī)模,這既需要持續(xù)的龐大資源投入,還需要強(qiáng)大的技術(shù)實(shí)力支撐。
“大家要拼平臺(tái)能力,否則給了代碼也跑不起來”
《遠(yuǎn)光燈》:假設(shè)絕影有了十家合作伙伴,他們都要把數(shù)據(jù)跟你們分享,那客戶們會(huì)愿意嗎?
王曉剛:這里面不是直接的數(shù)據(jù)融合。我們絕影具備商湯大裝置這樣行業(yè)領(lǐng)先的算力儲(chǔ)備、原生垂類汽車大模型、領(lǐng)先的軟硬件架構(gòu)和全棧數(shù)據(jù)生產(chǎn)管線等四大技術(shù)基座,是平臺(tái)化能力。
合作過程中,絕影愿意白盒交付,對(duì)合作伙伴開源,幫助車企掌握大模型研發(fā)的Know-how,理解絕影的研發(fā)流程,雙方的研發(fā)流程和研發(fā)體系相互對(duì)齊,讓數(shù)據(jù)在合作伙伴之間流轉(zhuǎn)起來。
在全新的合作模式下,車企在掌握大模型Know-how、對(duì)齊研發(fā)流程和體系之后,能夠理解和放大數(shù)據(jù)的價(jià)值,選取不同組合的數(shù)據(jù)來針對(duì)性訓(xùn)練專屬于自己的模型,打造差異化的特色。
而絕影作為大模型平臺(tái)能力的合作支持方,車企伙伴的數(shù)據(jù)回流,形成數(shù)據(jù)閉環(huán),以量產(chǎn)車輛數(shù)據(jù)來驅(qū)動(dòng)基礎(chǔ)模型的訓(xùn)練和迭代,打造更有針對(duì)性、性能更強(qiáng)大的垂類基礎(chǔ)大模型,形成一個(gè)良性循環(huán)的深度合作模式,讓雙方你中有我,我中有你。
以大模型行業(yè)為例,既需要GPT-4這樣的模型,也有基于GPT-4長出來各具特色的面向C端的應(yīng)用或者Agent(智能體)。
《遠(yuǎn)光燈》:如果自動(dòng)駕駛的底層技術(shù)越來越趨同,這個(gè)差異化怎么體現(xiàn)?供應(yīng)商去做,還是車企去做這個(gè)差異化?
王曉剛:車企主導(dǎo),因?yàn)樵谧罱K產(chǎn)品交付階段,供應(yīng)商跟車企共同完成。車企要篩選數(shù)據(jù),重點(diǎn)強(qiáng)調(diào)什么樣的場景,什么樣的用戶的體驗(yàn),這是由車企來主導(dǎo)來完成。
《遠(yuǎn)光燈》:意思是說,就像傳統(tǒng)燃油車時(shí)代的博世一樣,你們給各車廠提供一樣的產(chǎn)品或者部件,讓車企去做面向智能化時(shí)代的產(chǎn)品和體驗(yàn)?
王曉剛: 我們提供的不是一樣的產(chǎn)品,如上面說的,我們提供平臺(tái)能力,包括訓(xùn)練模型的能力、處理數(shù)據(jù)的能力,還有一些其他基礎(chǔ)能力,這樣的話,車企不需要從頭開始。
絕影的合作模式跟之前博世跟車廠合作不一樣,之前博世是提供比較標(biāo)準(zhǔn)化的部件,讓車企完成組裝、安裝。我們不一樣,未來人工智能時(shí)代,差異點(diǎn)最大的是在于高質(zhì)量數(shù)據(jù),大家都得在這方面去下功夫。但是做這個(gè)事,得有一個(gè)基礎(chǔ)。如果從頭開始做起,別人花一年兩年時(shí)間就做好,你要三四年才拿出產(chǎn)品去比拼,這是大家接受不了的。
所以絕影其實(shí)就是幫助車企打造一個(gè)比較好的起點(diǎn),在這個(gè)起點(diǎn)的基礎(chǔ)上,車企再琢磨怎么把數(shù)據(jù)的質(zhì)量進(jìn)行提升。
《遠(yuǎn)光燈》:剛才說白盒交付,這是多大程度的白盒,你們還是有所保留吧?
王曉剛:在大模型時(shí)代,白盒交付不是最大的難題。其實(shí)今天各個(gè)車廠可能已經(jīng)收集很多套白盒代碼了,但是技術(shù)在飛快的演進(jìn)的,今天收集到這些東西,明年又是下一套。
解決這樣的問題,核心是要找到一個(gè)戰(zhàn)略合作伙伴,雙方共同去打造一套研發(fā)體系,而且這個(gè)研發(fā)體系,是能夠不斷快速迭代和進(jìn)步的,這才是比較關(guān)鍵的。
比如說,車企今天用的是A的研發(fā)體系,供應(yīng)商B來了,給一套白盒,這個(gè)白盒也挺好的,但要讓所有的研發(fā)團(tuán)隊(duì)從A切換到B,采用另外一套東西的時(shí)候,成本就非常高。就算別人給了你白盒,你都不一定愿意做切換。所以,今天就是大家要能夠形成這種合作的話,是比較關(guān)鍵的。
將來,車端的那些代碼會(huì)越來越簡單,越來越復(fù)雜的是后端的平臺(tái)化能力,算力基礎(chǔ)設(shè)施、數(shù)據(jù)生產(chǎn)管線這些需要時(shí)間沉淀和積累的能力。
《遠(yuǎn)光燈》:現(xiàn)在多數(shù)車企都已經(jīng)在喊大模型上車了,這個(gè)不能幫助他們解決這個(gè)問題嗎?
王曉剛:今天大模型時(shí)代好多開源的大模型,也有很多開源的代碼,或者是工具鏈。開源大模型的性能或許不弱,但并不能夠百分之百解決問題,滿足企業(yè)的需求,這也導(dǎo)致不能夠把大模型用到實(shí)際的業(yè)務(wù)當(dāng)中,不能完全解決問題。
從這種意義上來說,大模型其實(shí)沒太大的用處。車企更需要的是什么?是這套模型背后的數(shù)據(jù)生產(chǎn)管線、訓(xùn)練平臺(tái),通過這些要能夠重新再把這個(gè)模型再訓(xùn)練一遍,這個(gè)能力是很重要的。把開源大模型再訓(xùn)練一遍的企業(yè),這是非常少的。將來大家要比拼的是平臺(tái)能力,否則就是給了代碼,企業(yè)也跑不起來。
比如說,一個(gè)模型要幾千塊GPU一起才能訓(xùn)練成功的,一般的集群訓(xùn)練起來的話,每20分鐘就要中斷一次,做一次診斷,又得花一天兩天的時(shí)間。這其實(shí)根本就跑不起來,只有在一套平臺(tái)下面,大模型才能發(fā)揮作用。
《遠(yuǎn)光燈》:相比幾年前,車企現(xiàn)在還糾結(jié)白盒黑盒問題嗎,有沒有一些改觀?
王曉剛:我們其實(shí)不太糾結(jié)白盒交付,一直以來,我們跟車廠的合作都是一個(gè)比較開放的,各種合作方式都是可以談。
現(xiàn)在車企對(duì)大模型的認(rèn)知越來越深刻,行業(yè)本身已經(jīng)有一些標(biāo)桿,同時(shí),各家有的時(shí)候自己也嘗試過訓(xùn)練大模型,他會(huì)發(fā)現(xiàn)大模型都是金子堆出來的,資源消耗非常高。
想從頭到尾去訓(xùn)練一個(gè)大模型,比如類似ChatGPT這樣的一個(gè)模型要訓(xùn)練出來,消耗都是上億級(jí)的,所以這時(shí)候大家也都逐漸明白,大模型時(shí)代要分工協(xié)作,最后才能把有競爭力的產(chǎn)品和體驗(yàn)做出來。
這個(gè)行業(yè)里,無論是白盒還是黑盒,在殘酷的市場競爭面前,在快速發(fā)展的技術(shù)面前,只有好的產(chǎn)品和體驗(yàn)才是最具價(jià)值和競爭力的。
《遠(yuǎn)光燈》:北京車展你們說過商湯絕影UniAD方案的天花板更高,今天還是這樣嗎?
王曉剛: 因?yàn)楝F(xiàn)在大家采用比較多的還是兩段式的端到端,就是把感知的輸出作為規(guī)控的輸入,過程中信息量已經(jīng)大大縮減。最終的結(jié)果就是感知網(wǎng)絡(luò)加上一個(gè)比較小的規(guī)控網(wǎng)絡(luò),它對(duì)復(fù)雜場景的理解能力是比較有限的。
絕影的方案是只用一個(gè)網(wǎng)絡(luò),輸入感知的信息,直接輸出行駛軌跡。預(yù)測行駛軌跡這件事情是非常難的,要達(dá)到這個(gè)目標(biāo),就必須得讓這個(gè)模型自己能夠理解很復(fù)雜的場景。
絕影的一段式端到端,我們并沒有刻意教它去理解復(fù)雜的道路場景,比如施工路段、潮汐車道,還有一些交通標(biāo)志,但最后它也能夠做出復(fù)雜分析決策和路徑規(guī)劃,它是通過視頻數(shù)據(jù)訓(xùn)練的方式學(xué)會(huì)的。
這種訓(xùn)練方式需要一個(gè)比較大的模型,充分發(fā)揮模型的能力,這需要像商湯大裝置這樣的豐沛算力。如果要是兩段式,其實(shí)對(duì)訓(xùn)練算力、車載算力的要求,跟以前沒什么太大差別。
我們?cè)诒本┸囌沟臅r(shí)候,特別強(qiáng)調(diào)絕影的方案是一段式,是真端到端?,F(xiàn)在一些行業(yè)專家和企業(yè)也認(rèn)可了這個(gè)說法。其他企業(yè)也開始走一段式的路。
《遠(yuǎn)光燈》:總結(jié)下來,絕影跟車廠之間有幾種合作模式?
王曉剛:一種是標(biāo)準(zhǔn)化交付,就是針對(duì)已經(jīng)比較成熟的基于規(guī)則的自動(dòng)駕駛方案,我們就進(jìn)行標(biāo)準(zhǔn)化的交付;另外一種是數(shù)據(jù)驅(qū)動(dòng)的端到端方案,我們希望跟車企深度合作:我們輸出的是平臺(tái)化能力,能夠去實(shí)現(xiàn)把商湯絕影的基礎(chǔ)設(shè)施跟車企的量產(chǎn)車連接,這樣能夠給端到端的產(chǎn)品帶來比較好的更新迭代,未來隨著商湯大模型技術(shù)和基礎(chǔ)設(shè)施的不斷演進(jìn),絕影會(huì)給客戶持續(xù)更新底層的平臺(tái)化能力。
特斯拉FSD入華,對(duì)絕影來說是機(jī)會(huì)點(diǎn)
《遠(yuǎn)光燈》:你怎么評(píng)價(jià)特斯拉FSD入華?
王曉剛: 我覺得是好事,行業(yè)標(biāo)桿能夠讓大家感受得到自動(dòng)駕駛的價(jià)值,行業(yè)里面有這樣的一個(gè)錨點(diǎn)還是非常好的。
我們兩家都是走感知決策一體化的端到端路徑,從推動(dòng)一段式端到端落地角度來看,我們都是技術(shù)領(lǐng)先的玩家,以更低成本帶來更高開城效率,同時(shí)讓量產(chǎn)智駕有更高性能的天花板。
《遠(yuǎn)光燈》:它是“鯊魚”還是“鯰魚”?
王曉剛:無論鯊魚還是鯰魚,特斯拉FSD入華對(duì)整個(gè)行業(yè)的示范作用還有引領(lǐng)作用,這是比較重要的,害怕也沒有用,要積極的去擁抱新的趨勢,參與競爭。我覺得車廠賣車不是單靠自動(dòng)駕駛這一個(gè)功能,涉及到方方面面,有很多綜合因素。
《遠(yuǎn)光燈》:假如,特斯拉FSD入華后的表現(xiàn)真的非常強(qiáng),做到了技術(shù)上非常領(lǐng)先,是不是反而可能會(huì)對(duì)絕影這樣的供應(yīng)鏈公司有利?傳統(tǒng)主機(jī)廠可能會(huì)更著急補(bǔ)齊能力?
王曉剛:這確實(shí)是我們的機(jī)會(huì)點(diǎn)?,F(xiàn)在行業(yè)里還有觀望的人,產(chǎn)品、性價(jià)比很重要,但時(shí)機(jī)也很重要,錯(cuò)過了,可能就沒機(jī)會(huì)了。這個(gè)機(jī)會(huì)窗口對(duì)于車企和我們來說,都是一樣的。
主機(jī)廠要補(bǔ)齊能力,追趕甚至超越特斯拉,需要實(shí)力深厚且志同道合的戰(zhàn)略合作伙伴。商湯絕影是智能汽車行業(yè)非常稀缺的同時(shí)具備“大算力+大模型體系+數(shù)據(jù)閉環(huán)+量產(chǎn)經(jīng)驗(yàn)”等全棧技術(shù)能力的AI公司,我們相信,車企跟我們進(jìn)行深度合作,會(huì)是在AGI時(shí)代取得成功的最佳路徑。
在我看來,自動(dòng)駕駛技術(shù)的發(fā)展與應(yīng)用是循序漸進(jìn)的,商湯絕影目前已經(jīng)跟廣汽、哪吒和一汽紅旗等多個(gè)品牌實(shí)現(xiàn)量產(chǎn)落地。同時(shí),我們商湯絕影的UniAD也是面向量產(chǎn)的端到端技術(shù)方案,預(yù)計(jì)明年也會(huì)量產(chǎn)落地;此外,絕影還有下一代自動(dòng)駕駛技術(shù)——基于多模態(tài)大模型的 DriveAGI智駕大模型。
這些不同技術(shù)路線的智駕方案,都可以成為我們合作伙伴與特斯拉競爭的“武器”,大家一起抓住這難得的時(shí)機(jī)。同時(shí),商湯絕影是面向全球布局的,對(duì)于車企出海戰(zhàn)略也能夠提供有力的支持。
《遠(yuǎn)光燈》:你們正在研發(fā)的DriveAGI相比UniAD方案有哪些不同?是更多考慮了艙駕結(jié)合嗎?
王曉剛:無論是駕駛還是座艙,其實(shí)都是大模型的需求,尤其多模態(tài)大模型的出現(xiàn),它既能服務(wù)智駕也能服務(wù)座艙。DriveAGI,它是基于多模態(tài)大模型對(duì)端到端智駕方案進(jìn)行改進(jìn)研發(fā),也能服務(wù)座艙,能夠帶來感知和交互的變革。
DriveAGI的交互能力非常強(qiáng)大,在體驗(yàn)上進(jìn)一步做到可感知、可交互、可信賴。比如在自動(dòng)駕駛的狀態(tài)下,導(dǎo)航信息顯示車輛需要在下一個(gè)路口調(diào)頭才能到達(dá)目的地,但主駕位上的用戶知道可以提前在一個(gè)缺口直接拐彎,用戶可以語音命令它“直接左拐”,系統(tǒng)會(huì)根據(jù)實(shí)時(shí)路況對(duì)命令進(jìn)行反饋操作。
我們看到了一些芯片廠商正在推出大算力芯片,像英偉達(dá)Thor有1000T、2000T的算力,這么大的算力,駕駛部分占用個(gè)幾百T,還有很多算力是空出來的。所以大家在想,那就把座艙的大模型也放到同樣一顆芯片里面去,絕影也在努力實(shí)現(xiàn)芯片層面的艙駕融合?,F(xiàn)階段我們也是有駕駛跟座艙在產(chǎn)品上一些體驗(yàn)的融合。
《遠(yuǎn)光燈》:艙駕融合行業(yè)內(nèi)說了很多年,一直沒實(shí)現(xiàn),你覺得這種真正的艙駕融合什么時(shí)候才能落地?
王曉剛: 這已經(jīng)有明確的量產(chǎn)時(shí)間表了,明年就會(huì)有量產(chǎn)車出現(xiàn)在市場上。
《遠(yuǎn)光燈》:價(jià)格會(huì)不會(huì)很高,高算力芯片都不便宜吧?
王曉剛:它也會(huì)分成不同檔次。另外,除了英偉達(dá)以外,高通、MTK都在推他們的大模型芯片,核心在于把場景跟體驗(yàn)做出來,消費(fèi)者才愿意買單。
《遠(yuǎn)光燈》:有觀點(diǎn)說2027年之前,中國市場有90%的汽車品牌要么會(huì)倒下,要么就退出中國市場。你怎么看?
王曉剛: 競爭激烈,進(jìn)入淘汰賽是共識(shí)。我覺得是會(huì)分成不同的層次,大家在不同的區(qū)間,找到自己的發(fā)展領(lǐng)域。
《遠(yuǎn)光燈》:商湯絕影希望是在哪個(gè)區(qū)間?
王曉剛:我們絕影不希望只是單純拼性價(jià)比,而是一定要依托于商湯的基礎(chǔ)設(shè)施和AI大模型能力的領(lǐng)先性,把通用人工智能、大模型這些平臺(tái)能力跟車廠形成一個(gè)比較深度的合作。
《遠(yuǎn)光燈》:你說的這個(gè)領(lǐng)域會(huì)不會(huì)出現(xiàn)一家獨(dú)大的這種局面?比如華為。
王曉剛: 我覺得行業(yè)里面不太會(huì)出現(xiàn)一家獨(dú)大的情況,因?yàn)樗枰幸粋€(gè)更加開放的合作模式。以前,某廠商算是一家獨(dú)大,從市場份額來說是絕對(duì)的領(lǐng)先者,但隨著產(chǎn)業(yè)的發(fā)展,它的合作模式被發(fā)現(xiàn)是不可持續(xù)的,行業(yè)迎來了新的機(jī)會(huì),開放合作是更加長久的模式。
(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )