2023年大煉模型興起,全球范圍內(nèi)都出現(xiàn)了算力供不應(yīng)求、一卡難求的情況。各地紛紛興建數(shù)據(jù)中心、智算中心,來(lái)解決國(guó)產(chǎn)大模型的算力短缺問(wèn)題。
今年算力市場(chǎng)又倒向了另一個(gè)方向,算力開(kāi)始過(guò)剩和大量閑置了。
主要體現(xiàn)在,高端顯卡囤積居奇的生意不好做了,“GPU倒?fàn)敗钡呐笥讶σ呀?jīng)從“欲購(gòu)從速,過(guò)時(shí)不候”,變成了“A100/H100滯銷,幫幫我們”。而算力租賃市場(chǎng),理想情況下的上架率應(yīng)該是80%,但很多集群只能達(dá)到30%甚至更低,投入大量資金建設(shè)的算力閑置,租不出去。
于是一種聲音開(kāi)始甚囂塵上,認(rèn)為算力荒已經(jīng)緩解了,供過(guò)于求,應(yīng)該放慢自主化智算的建設(shè)。還有人說(shuō),智算中心建的太多了,大模型都用不完了。
發(fā)展自主化智算,到底還有沒(méi)有必要?
還記得2023年算力荒焦灼、智算建設(shè)突飛猛進(jìn)的時(shí)候,倪光南院士曾提到過(guò):各地盲目建設(shè)各種低水平智算中心,讓人唏噓不已,一定要警惕“技術(shù)房地產(chǎn)”和“數(shù)字爛尾樓”。所謂“技術(shù)房地產(chǎn)”,就是算力資源賣不出去,只能變成一堆放著服務(wù)器的磚頭水泥房子,閑置在那里。
短短一年多時(shí)間,從算力短缺到算力過(guò)剩,究竟是怎么發(fā)生的?目前來(lái)看,閑置算力主要集中在三種情況:
1.用不起。英偉達(dá)的高端顯卡GPU是AI訓(xùn)練的首選,2023年一度一卡難求。以N卡為主的智算資源閑置,一是因?yàn)榫揞^們此前已經(jīng)大量囤積采購(gòu)了GPU,需求減少;二是炒作之后價(jià)格昂貴,即使價(jià)格回落,中小企業(yè)還是用不起。在很多討論“算力過(guò)?!钡脑u(píng)論區(qū),我們總能看到“降價(jià)試試”的留言,說(shuō)明高端AI算力的需求仍在,只是昂貴的N卡被價(jià)格勸退了。
2.不好用。國(guó)產(chǎn)卡組成的算力集群,也存在上架率不高、資源閑置的問(wèn)題,主要是不好用。因?yàn)?strong>國(guó)產(chǎn)卡的集中度不高,一個(gè)千卡或萬(wàn)卡集群,往往是由各類國(guó)產(chǎn)算力卡組成的,異構(gòu)算力之間的協(xié)同調(diào)度,涉及大量工程化細(xì)節(jié),沒(méi)有做好就無(wú)法開(kāi)箱即用。勉強(qiáng)用了,又時(shí)不時(shí)出現(xiàn)業(yè)務(wù)中斷、算效不高、恢復(fù)訓(xùn)練慢等各種問(wèn)題,導(dǎo)致客戶流失。這類被迫閑置的國(guó)產(chǎn)算力,正是沒(méi)有考慮配套,盲目建設(shè)的低水平智算中心。
3.用不上。“百模大戰(zhàn)”之后,企業(yè)不再大煉模型,預(yù)訓(xùn)練的算力需求也就大幅下降,算力市場(chǎng)開(kāi)始轉(zhuǎn)向以推理算力為主。但推理市場(chǎng)的爆發(fā),需要一個(gè)過(guò)程,目前AI的行業(yè)滲透率還比較低,總體不到10%,很多企業(yè)對(duì)AI的投入以嘗試為主,還沒(méi)有大規(guī)模爆發(fā)。所以,訓(xùn)練用算力開(kāi)始出現(xiàn)閑置,而推理用算力還未大規(guī)模崛起,因此短缺問(wèn)題尚未完全顯現(xiàn)。
低水平算力的閑置與過(guò)剩,再一次警醒我們:一個(gè)繁榮健康的算力市場(chǎng),關(guān)鍵不是建出來(lái),而是用起來(lái)。
這種情況下,仍然大力發(fā)展自主化智算,還有必要嗎?
我們認(rèn)為,這個(gè)問(wèn)題的答案不該有猶豫,要旗幟鮮明地,鼓勵(lì)自主化智算基礎(chǔ)設(shè)施的繼續(xù)建設(shè)、加速建設(shè)。
首先,從長(zhǎng)期看,國(guó)內(nèi)智算屬于后發(fā),基礎(chǔ)仍然薄弱。
中國(guó)智算的進(jìn)步速度是很快的,但也要客觀看到,美國(guó)這樣的IT先行者,從20世紀(jì)90年代以來(lái)就在IT建設(shè)上大力投入。根據(jù)彼得森國(guó)際經(jīng)濟(jì)研究所的消息,在2024年美國(guó)在電子制造業(yè)建設(shè)方面(主要是芯片)的投資,就超過(guò)了1996年至2020年(24年的時(shí)間跨度)的總投資。而產(chǎn)業(yè)界,xAI、Meta、OpenAI等海外AI巨頭,都在積極布局十萬(wàn)卡、五十萬(wàn)卡規(guī)模的智算集群。
所以,國(guó)內(nèi)自主化智算近年來(lái)的發(fā)展雖然迅猛,也是在積極補(bǔ)課,打牢基礎(chǔ)。這時(shí)候如果停止,不僅會(huì)前功盡棄,還會(huì)讓中美在AI基礎(chǔ)設(shè)施上的差距進(jìn)一步拉大。
從近期看,自主化AI算力需求仍然沒(méi)有得到充分滿足,算力荒仍在。
一方面,海外AI算力進(jìn)口受到限制,極不穩(wěn)定。目前,國(guó)內(nèi)AI訓(xùn)練芯片市場(chǎng)英偉達(dá)占據(jù)了80%~80%的市場(chǎng)份額,要避免威脅供應(yīng)鏈安全,這種情況必須盡快改變。上海的“算力浦江”智算行動(dòng)實(shí)施方案(2024—2025年)要在2025年,實(shí)現(xiàn)新建智算中心的國(guó)產(chǎn)算力芯片使用占比超過(guò)50%;《北京市算力基礎(chǔ)設(shè)施建設(shè)實(shí)施方案(2024—2027年)》則提出,2027年要具備100%自主可控智算中心建設(shè)能力。
三年左右,從不到20%發(fā)展到100%。所以,如今的自主化智算不是太多了,而是還不夠。
與此同時(shí),算力需求仍在增長(zhǎng)。大模型的規(guī)模法則仍在繼續(xù),以Sora為代表的視頻生成模型對(duì)算力的需求量是LLM大模型的數(shù)倍,已經(jīng)出現(xiàn)了“一棟樓放不下一個(gè)模型”“一個(gè)模型需要多個(gè)集群”的情況,超萬(wàn)卡智算中心是必不可少的基礎(chǔ)設(shè)施,目前國(guó)內(nèi)的十萬(wàn)卡集群還遠(yuǎn)遠(yuǎn)不足。
此外,大煉模型的階段雖然結(jié)束了,但基礎(chǔ)模型的市場(chǎng)集中度提高和能力提高,又會(huì)釋放AI應(yīng)用需求,促進(jìn)AI的行業(yè)滲透率、普及率,導(dǎo)致AI推理算力的需求爆發(fā),急需要更多高質(zhì)量算力來(lái)滿足。目前部分國(guó)產(chǎn)AI算力集群的利用率極高,西安昇騰智能科技有限公司的人工智算中心算力使用率就高達(dá)98.5%;曙光在長(zhǎng)沙的5A級(jí)智算中心,也吸引上百家企業(yè)入駐,實(shí)現(xiàn)萬(wàn)余個(gè)商業(yè)應(yīng)用接入。因此,隨著產(chǎn)業(yè)智能化升級(jí)的繼續(xù)推進(jìn),國(guó)產(chǎn)AI算力荒不是已經(jīng)解決,而是從現(xiàn)在開(kāi)始重視和應(yīng)對(duì)。
互聯(lián)網(wǎng)產(chǎn)業(yè)的核心,當(dāng)然不是寬帶和機(jī)房,但沒(méi)有“寬帶高速公路”,就沒(méi)有美國(guó)互聯(lián)網(wǎng)經(jīng)濟(jì)的爆發(fā);移動(dòng)互聯(lián)網(wǎng)的核心,也不是基站,但沒(méi)有廣泛覆蓋的4G基站,就沒(méi)有智能手機(jī)和移動(dòng)應(yīng)用軟件的興起。AI大模型也是一樣, AI作為一種依附在基礎(chǔ)設(shè)施之上的軟件技術(shù),核心不是智算,但沒(méi)有自主化智算,國(guó)內(nèi)AI絕不可能獨(dú)善其身、獨(dú)自蓬勃發(fā)展。
因此,自主化智算并不存在過(guò)剩,更不該就此放慢發(fā)展。
綜上,“國(guó)內(nèi)AI算力過(guò)?!?,是個(gè)假問(wèn)題,“如何合理地推進(jìn)自主化智算的建設(shè)”,才是真問(wèn)題。
解決這個(gè)真問(wèn)題,國(guó)內(nèi)智算產(chǎn)業(yè)已經(jīng)來(lái)到了承上啟下的新階段。不僅要追求把智算中心“建起來(lái)”,還要能運(yùn)營(yíng)好、用起來(lái)。
因此,智算廠商的競(jìng)爭(zhēng),也從售賣硬件資源與智算解決方案,轉(zhuǎn)變?yōu)槎嗑S度、綜合性、長(zhǎng)期服務(wù)的競(jìng)爭(zhēng)。比如華為昇騰AI全棧、中科曙光的“立體計(jì)算”、寧暢的“全局智算”、聯(lián)想的“萬(wàn)全生態(tài)”,新華三的“1+N”智算等,以更全面的能力,支撐自主化智算的建設(shè)運(yùn)營(yíng)。
追求全面,并不意味著胡子眉毛一把抓,目前來(lái)看,智算廠商們主要集中解決自主化AI算力的幾個(gè)痛點(diǎn)問(wèn)題:
1.異構(gòu)問(wèn)題。目前,國(guó)產(chǎn)AI芯片還無(wú)法規(guī)?;鲐?,市場(chǎng)集中度較低,因此都是以混合算力的形式,來(lái)加入智算集群。多元異構(gòu)算力的協(xié)同調(diào)度、管理、算效、業(yè)務(wù)可靠性等,面臨很多技術(shù)挑戰(zhàn)。如果一個(gè)企業(yè)或開(kāi)發(fā)者,要針對(duì)ABCD不同廠商的卡進(jìn)行適配開(kāi)發(fā),是不可能的。所以,就需要智算廠商提供相應(yīng)的系統(tǒng)平臺(tái),屏蔽底層異構(gòu)硬件的復(fù)雜性,讓大家用好國(guó)產(chǎn)算卡。比如聯(lián)想的萬(wàn)全異構(gòu)智算平臺(tái),實(shí)現(xiàn)異構(gòu)化AI算力的管理與調(diào)配;新華三面向異構(gòu)智算的智能管理平臺(tái),一站式應(yīng)對(duì)多樣化的AI應(yīng)用場(chǎng)景。
2.算效問(wèn)題。解決“低質(zhì)量算力過(guò)剩,自主化高質(zhì)量算力不足”的結(jié)構(gòu)性問(wèn)題,需要進(jìn)一步提高國(guó)產(chǎn)AI的性能。面對(duì)工藝制程的限制,可以通過(guò)軟硬件系統(tǒng)的無(wú)縫配合,從而實(shí)現(xiàn)國(guó)產(chǎn)算卡性能的充分釋放。以昇騰為例,就與昇思緊密結(jié)合,為各類智算場(chǎng)景提供高性能的自主化AI算力,深圳鵬城實(shí)驗(yàn)室的“鵬城云腦Ⅱ”就依托昇騰實(shí)現(xiàn)了中國(guó)首個(gè)自主可控的E級(jí)智能算力平臺(tái),可以提供不低于1000Pops的整機(jī)AI計(jì)算能力。
3.運(yùn)營(yíng)問(wèn)題。如今,一些地方在智算中心建設(shè)之前,開(kāi)始提出上架率、收益率等要求,需要保證項(xiàng)目投運(yùn)后有一定的使用率。同時(shí),也會(huì)要求建設(shè)方提供設(shè)計(jì)、使用、運(yùn)營(yíng)等一體化服務(wù),避免智算中心因無(wú)人運(yùn)營(yíng)而成為“數(shù)字爛尾樓”。以用促建、以服促用,已經(jīng)是自主化智算發(fā)展的必然潮流。比如新華三與杭州市合作,打造“圖靈小鎮(zhèn)”,培育AIGC產(chǎn)業(yè)和數(shù)字人才;中科曙光“立體計(jì)算”主張“算力建設(shè)、應(yīng)用賦能、生態(tài)共生”三位一體,推動(dòng)多元算力向新質(zhì)生產(chǎn)力轉(zhuǎn)化,目前已經(jīng)在5A級(jí)智算中心落地實(shí)踐。
回顧這一年多來(lái),國(guó)內(nèi)智算的發(fā)展突飛猛進(jìn),取得了舉世矚目的成績(jī),我們不必再為算力荒而憂心忡忡。但人無(wú)遠(yuǎn)慮必有近憂,AI算力的自主化之路不能就此戛然而止,而要一鼓作氣,再加把勁,把已經(jīng)取得的成果夯實(shí),為接下來(lái)的智能浪潮做好準(zhǔn)備。
避免低質(zhì)量算力過(guò)剩,與加速自主化智算發(fā)展,這兩件事可以并行不悖,也應(yīng)該理性分開(kāi)看待。
免責(zé)聲明:此文內(nèi)容為第三方自媒體作者發(fā)布的觀察或評(píng)論性文章,所有文字和圖片版權(quán)歸作者所有,且僅代表作者個(gè)人觀點(diǎn),與極客網(wǎng)無(wú)關(guān)。文章僅供讀者參考,并請(qǐng)自行核實(shí)相關(guān)內(nèi)容。投訴郵箱:editor@fromgeek.com。
- 蜜度索驥:以跨模態(tài)檢索技術(shù)助力“企宣”向上生長(zhǎng)
- 折疊屏2024的新東西、好東西、舊東西
- “客服來(lái)電”懷疑有詐?抖音上線“驗(yàn)證助手”幫助用戶防范詐騙
- 葉國(guó)富觀點(diǎn)很精彩,奈何名創(chuàng)優(yōu)品說(shuō)得好聽(tīng)、做得難看?
- 算力荒緩解,自主化智算還有必要嗎?
- 波司登千元鵝絨褲僅3克鵝絨,警惕被“國(guó)貨品牌”割韭菜
- 中國(guó)電車進(jìn)入10萬(wàn)級(jí)時(shí)代,2025年決生死,但日本車先頂不住了
- 谷歌成為手機(jī)市場(chǎng)的殺手,國(guó)產(chǎn)手機(jī)或被迫擁護(hù)國(guó)產(chǎn)操作系統(tǒng)
- 董明珠與小米的二次戰(zhàn)爭(zhēng)
- 芯片不賣中國(guó),美芯無(wú)處賣了,本來(lái)不要的市場(chǎng)偷偷地賣,后悔莫及
- 僅售999元 月底開(kāi)售 閃極打響AI眼鏡量產(chǎn)發(fā)令槍
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。