10月17日,美國加強了面向中國市場的AI芯片禁令。其中明確將性能、密度作為出口管制標準,將單芯片超過300teraflops算力,以及性能密度超過每平方毫米370 gigaflops的芯片都納入了禁止出口行列。
雖然在這一禁令下,AMD、英特爾等公司提供的高端AI芯片也受到影響。但由于英偉達在全球AI芯片領域一家獨大,本次禁令涉及A100、H100等主流AI訓練用英偉達GPU,因此這次的芯片禁令也被稱為“英偉達禁令”。
消息一出,立刻引起了AI產(chǎn)業(yè)的熱議。但討論大多集中在禁令何時施行,是否有緩沖地帶,具體涉及哪些GPU型號,禁令期限是多久等。這就導致一個顯而易見的宏觀背景被忽略了:自貿(mào)易摩擦發(fā)生以來,中美經(jīng)貿(mào)關系雖然時有波動,但面向中國的芯片管控卻始終有增無減。尤其是高端AI芯片禁令,在諸多爭議中依舊被堅定推行。
至此,AI行業(yè)似乎已經(jīng)必須形成一個基本的共識:拋棄幻想,準備斗爭。
與其斤斤計較哪些GPU被禁,是否有解禁可能。不如重新審視在芯片鐵幕時代下,中國AI計算究竟何去何從?
本文希望從目前的產(chǎn)業(yè)局面出發(fā),和大家一起思考AI計算的前行之路。
目前的局面
首先我們必須了解一個問題,那就是為什么這次英偉達禁令出臺之后,大眾輿論與AI行業(yè)的反應都沒有18、19年芯片封鎖剛開始時嚴重。似乎只有在消費級顯卡RTX 4090是否被禁問題上,引發(fā)了游戲玩家和相關商家的一些爭論。
這背后的宏觀邏輯在于,行業(yè)是非常不愿意看到高端AI芯片被禁售的,但其實也對這種局面早有預料。一方面是美國對華芯片封鎖推動多年,此前英偉達部分高端GPU已經(jīng)被禁,產(chǎn)業(yè)界的反饋早就從驚愕調(diào)整為了泰然處之。加上ChatGPT爆火之后今年全球高端GPU行情陡然看漲,隨之而來的是美國方面屢次表態(tài)要推動對華整體性的高端AI芯片禁售。虛虛實實幾個月之后,最終落下一錘也不外如是。
為了應對這次可預見的禁令,同時也有大模型發(fā)展的客觀推動,去年年底到今年上半年大量中國科技、金融、汽車等領域的企業(yè)集中囤貨英偉達高端GPU,已經(jīng)造成了市面上一卡難求的局面。換句話說,對于很多中國中小型科技企業(yè)、AI創(chuàng)業(yè)公司來說,高端GPU本就買不到,禁售之后并沒有太多改變。
另外一個真實情況是,高端AI芯片并非無法國產(chǎn)化。早在18、19年貿(mào)易摩擦開始之后,國內(nèi)AI芯片產(chǎn)業(yè)加速發(fā)展。這就導致在AI訓練需求上,英偉達高端GPU雖然很難被替代,但并非不可替代。
加上AI芯片并不像手機芯片那樣事關大眾消費者,且華為已經(jīng)在手機芯片上完成了突破。種種跡象合在一起,導致無論是大眾還是行業(yè),都對這次禁令產(chǎn)生了一種坦然,甚至有點見怪不怪的心態(tài)。
但必須客觀看到的是,這次禁令絕非對中國AI行業(yè)沒有傷害。一方面短期內(nèi)更換英偉達GPU,無論在芯片產(chǎn)能、生態(tài)兼容性等問題上都非常困難。并且禁令還將直接在AI服務器等領域,給大規(guī)模使用英偉達產(chǎn)品的廠商造成傷害。
而更關鍵的問題在于未來,如果禁令長期存在,中國AI計算將逐漸與全球高端芯片脫鉤,那么可能帶來的長期負面影響是非常復雜的,比如說:
1.英偉達高端GPU代表的AI芯片在更新迭代之后,是否會造成中國AI算力的發(fā)展脫節(jié)?
2.底層算力出現(xiàn)發(fā)展分歧后,中國AI產(chǎn)業(yè)是否會在大模型等軟件技術發(fā)展中掉隊?
3.本次AI芯片禁令,已經(jīng)呈現(xiàn)出大規(guī)模封鎖的特征。這種科技封鎖真的只會停留在AI芯片領域嗎?通用算力、存儲、基礎軟件等數(shù)字化基礎能力是否將成為接下來的打擊目標?
總而言之,這次的AI芯片禁令,對中國來說是一次有準備的博弈,而非一場奇襲。想要成功度過這一關,也需要將手中的每一張牌都打好,打出配合,從而降低傷害烈度,提升長期發(fā)展的勝率。
而就目前來看,中國AI計算有三項必須同時發(fā)力的“突圍方案”。
方案1:用好“買家”身份
有個簡單的道理,商業(yè)市場的行為邏輯是由供需決定的。但在以芯片為代表的中美科技貿(mào)易中,我們經(jīng)常會陷入一個思維誤區(qū):認為絕大部分游戲規(guī)則是由美國政府和企業(yè)制定的,他們想賣我們就買,他們不想買我們就無奈。
作為全球芯片市場的最大“買家”,中國企業(yè)卻沒有話語權,這是非?;闹嚨摹?/p>
事實上,針對中國市場的AI芯片禁令,最直接傷害的就是以英偉達為代表的美國科技巨頭。目前,英偉達AI芯片方面最大市場需求來自中國。此前英偉達CEO黃仁勛就明確表示,“如果被剝奪了中國市場,我們是沒有應急措施的,世界上沒有另一個中國”。
在這種情況下,我們能看到追求商業(yè)利益的美國科技公司,與追求政治利益的美國政府之間有著鮮明的矛盾。美國科技企業(yè)總是想方設法尋求反對禁令和繞過禁令,比如英偉達就從去年開始推出了應對禁運政策的中國特供版GPU。
中國市場,消化了美國科技企業(yè)約三分之一的產(chǎn)能,二者之間的供需紐帶是無法長期割裂的。面對美國愈發(fā)明顯的整體性科技封禁,中國市場也應該積極用好“買家”身份,讓自身的行為更具鮮明立場與可預測性。
避免造成一種“賣了就歡迎,不賣只能無奈”的表現(xiàn)和印象。
“買家身份”應該是一種有立場、有力量且會憤怒的身份。
方案2:以云代卡,算力集中
在可見的較長時間里,美國對中國的AI芯片封禁恐怕都只會加強,而這個時機恰好對應上AI大模型發(fā)展的關鍵階段。很多業(yè)內(nèi)人士認為,大模型發(fā)展雖快,但沒有呈現(xiàn)出此前其他科技風口的迅猛局面,投資缺錢,計算缺卡是主要原因。
那么如何解決中國AI產(chǎn)業(yè)在禁令之下的算力缺口問題呢?首先的應急方案就是企業(yè)加大云端AI算力的配置和投入,推進以云代卡。
事實上,在高端AI芯片可能被禁的大趨勢下,中國幾大公有云廠商都做出了加強囤積英偉達高端GPU的動作。這一方面是因為云廠商自身要加大大模型投入,打開MaaS市場,所以對AI算力有直接需求。另一方面也是因為GPU轉(zhuǎn)化為云資源池之后可以長期復用,對于云廠商來說是一個進可攻,退可守的局面。因此,今年上半年一度出現(xiàn)了市面上高端AI芯片全都流向云廠商,中小企業(yè)一卡難求的局面。
客觀來看,這種高端AI芯片集中向云的舉動,對整個中國市場統(tǒng)籌應對AI芯片禁令是有利的,并且也符合東數(shù)西算的戰(zhàn)略思路。
另一個利好云端AI算力的趨勢在于,隨著大模型參數(shù)和使用數(shù)據(jù)量的不斷加大。本地化的卡池訓練已經(jīng)愈發(fā)吃緊。必須在云端發(fā)生的千卡、萬卡訓練成為未來主要的發(fā)展方向,因此企業(yè)用戶天然會更積極走向云端。
同時,云端AI算力也不會僅僅停留在囤積英偉達GPU的層面。接下來,國產(chǎn)的自主AI算力駛入云端是大勢所趨。在相關政策的推動下,云廠商正在加大自主AI芯片的采購力度。根據(jù)IDC數(shù)據(jù),2023年上半年中國AI服務器已經(jīng)使用了50萬塊自主開發(fā)的AI加速器芯片。在自主AI算力的服務化方面,華為云已經(jīng)推出了昇騰AI云服務。云端化與自主化結合的AI算力,將在AI芯片禁令背景下得到極大發(fā)展。
加上近些年在東數(shù)西算大背景下,各地陸續(xù)建立了大量采用自主AI算力的AI計算中心,整體來看中國的云端AI算力是供給穩(wěn)定、保障可靠的。
而很多企業(yè)依舊傾向于采購本地AI算力。這一方面是因為英偉達GPU市場緊缺,保值性特別好,甚至能作為企業(yè)的核心資產(chǎn)。另一方面是因為云端AI算力往往會有排隊、宕機、軟件服務缺失等問題。
如何進一步提高開發(fā)者的云端AI算力使用體驗,是公有云廠商接下來需要發(fā)力的方向。
方案3:讓國產(chǎn)AI算力爆發(fā)式成長
面對新一輪AI芯片禁令,中國AI產(chǎn)業(yè)最大的底氣是什么?是多年之后的習以為常,還是大量屯卡之后的家有余糧?都不是。最關鍵的節(jié)點在于經(jīng)過多年發(fā)展,中國AI芯片產(chǎn)業(yè)已經(jīng)得到了巨大發(fā)展。英偉達的高端GPU確實依舊重要,但已經(jīng)不是毫無替代選項可言。
根據(jù)IDC此前發(fā)布的數(shù)據(jù),2022年中國AI加速卡出貨量約為109萬張,其中英偉達市場份額達到了85%,華為昇騰實市場占有率10%,百度昆侖為2%,寒武紀和燧原科技均為1%。
從中可以看出,國產(chǎn)AI算力已經(jīng)實現(xiàn)了一定程度的市場占比,而不僅僅是概念與理論中的“紙上談兵”。同時也應該看到,國產(chǎn)AI芯片在核心性能、軟件生態(tài)以及出貨能力上依舊不理想,還有很長的路要走。在英偉達禁令的客觀條件倒逼下,國產(chǎn)AI算力必須在短期內(nèi)跨越這些困難,加速自身的成長與成熟周期。
為了實現(xiàn)這個目標,有幾件事非常重要:
1.形成產(chǎn)業(yè)共識,避免概念混淆。
提起AI芯片,我們經(jīng)常會說它有非常多的實現(xiàn)方式,有很多自主品牌參與這個市場,看上去一片繁榮。比如AI芯片有GPU、FPGA、ASIC、存算一體和類腦芯片等,國產(chǎn)AI加速芯片廠商有阿里、百度、華為、寒武紀、海光信息、燧原科技、天數(shù)智芯、壁仞科技、摩爾線程、龍芯中科等。
這種“繁榮”的表述,不僅在大眾輿論和投資市場上具有迷惑性,還經(jīng)常出現(xiàn)在一些行業(yè)報告與政策分析當中。但其中蘊藏的問題在于,普遍過分拓展了AI芯片的定義。比如說,類腦芯片在可見的未來中都僅僅是技術暢想,如果每次討論國產(chǎn)AI芯片都把類腦加上,那只會浪費時間,分散精力。再比如,有些AI芯片廠商只能做自用芯片,無法面向市場出貨。有些廠商目前還不具備商業(yè)化能力,處在早期建設階段,他們短期內(nèi)對于AI計算自主化的貢獻也就非常之小。
為了應對英偉達高端GPU禁售問題,我們需要把目光集中在可行、有效的GPU替代品上,而不是進行過多聯(lián)想和發(fā)散。只有形成了這一產(chǎn)業(yè)共識,才能聚集力量解決問題。
2.走向規(guī)?;逃茫苊釶PT造芯。
事實上,無論從AI加速芯片還是服務器整機來看,國內(nèi)目前能夠出貨的AI芯片廠商都寥寥無幾。主要集中在華為、百度兩家,燧原科技、海光信息也有一定的出貨。而大量半導體廠商與AI企業(yè),更多還停留在打造芯片的計劃與愿景上。這就導致大量受到政策支持與投資市場期待的國產(chǎn)AI芯片停滯不前,甚至有停留在這一階段享受金融市場紅利的嫌疑。
接下來的產(chǎn)業(yè)導向,應該從AI芯片的立項走向出貨,幫助AI芯片廠商獲得直接的商業(yè)回饋,產(chǎn)品與產(chǎn)能接受市場檢驗,逐步塑造正向的現(xiàn)金流。
3.加強軟件生態(tài),強化遷移能力。
英偉達GPU之所以重要,不僅在于硬件性能,更在以CUDA、PyTorch為核心的軟件生態(tài)能力,因此發(fā)展國產(chǎn)AI芯片絕不能低估軟件的能力。在強化自主軟件生態(tài)建設的同時,也要重視基于英偉達生態(tài)打造AI模型的遷移能力與遷移成本。
為此,已經(jīng)有大量廠商進行了探索,比如海光信息的DCU,就在生態(tài)、編程環(huán)境等方面與CUDA高度相似,CUDA用戶可以以較低代價快速遷移至海光的ROCm平臺。而在此前,PyTorch2.1 版本宣布支持華為昇騰??梢妵a(chǎn)AI芯片已經(jīng)具備了一定的規(guī)模化影響力,可以更多融入全球軟件生態(tài)當中。
未來想要實現(xiàn)國產(chǎn)AI計算的爆發(fā),是無法離開國產(chǎn)AI基礎軟件生態(tài)爆發(fā)的。
4、加大對“主品牌”支持,形成規(guī)?;?。
對于美國AI芯片,除了英偉達GPU,你還知道哪些?這個問題即使是問一些AI開發(fā)者,答案也很大程度是不清楚,或者沒試過。從中可見,AI計算就像通用計算、圖形計算一樣,極大概率是會最終出現(xiàn)一到兩個“主品牌”的。這屬于客觀的市場規(guī)律,沒有必要以揠苗助長的方式實現(xiàn)“百花齊放”的局面。
甚至就目前中國AI計算必須加速成熟,完成自主化替代的目標來說,盡快實現(xiàn)一超多強的局面是件好事。這可以避免生態(tài)割裂,避免產(chǎn)業(yè)在搖擺形成大量IT投資浪費。這個過程理應交給市場選擇,慢慢成型。但在芯片禁令的大背景下,國產(chǎn)AI計算崛起已經(jīng)時不我待,與其讓100種AI芯片慢慢成熟,慢慢洗牌,比如加速形成“主品牌”快速替代的局面。
而從目前局面看,昇騰是最有可能成為國產(chǎn)AI算力主品牌的一支力量??拼笥嶏w創(chuàng)始人、董事長劉慶峰此前表示,華為GPU已經(jīng)對標英偉達A100。根據(jù)數(shù)據(jù)顯示,昇騰310整數(shù)精度算力達到了16TOPS,昇騰910整數(shù)精度算力達到640TOPS。這意味著昇騰910性能已經(jīng)接近英偉達A100。
同時,昇騰也是目前唯一穩(wěn)定占據(jù)市場份額的國產(chǎn)AI算力,并且在軟件上孵化了類似英偉達CUDA的異構計算架構CANN和AI計算框架MindSpore。在核心性能、軟件生態(tài)與市場占有率三項指標來看,昇騰都已經(jīng)具備了可以加快成長,實現(xiàn)AI算力大規(guī)模國產(chǎn)化替代的可行性。
規(guī)范行業(yè)標準,強化軟件建設,提高自主品牌支持,是短期內(nèi)推動國產(chǎn)AI算力快速成長的主要途徑。
英偉達禁令,是一個中國AI行業(yè)普遍不愿意看到,盡量避免,甚至到今天也有些諱莫如深的問題。但形勢比人強,在不斷加速的逆全球化進程與AI競賽中,類似禁令未來大概率只多不少。
逃避、迂回、噤若寒蟬,都無法解決問題,只有坦然應對,奮力自強,才能從根本上解決受制于人的問題。
禁令之下,中國AI計算何去何從?
答案是我們已別無選擇,所以要給世界第二個選擇。
免責聲明:此文內(nèi)容為第三方自媒體作者發(fā)布的觀察或評論性文章,所有文字和圖片版權歸作者所有,且僅代表作者個人觀點,與極客網(wǎng)無關。文章僅供讀者參考,并請自行核實相關內(nèi)容。投訴郵箱:editor@fromgeek.com。
免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權或存在不實內(nèi)容時,應及時向本網(wǎng)站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內(nèi)容或斷開相關鏈接。