極客網(wǎng)·極客觀察(朱飛)12月3日 美東時(shí)間12月1日,國際權(quán)威AI基準(zhǔn)測試MLPerf?公布了最新一期的訓(xùn)練(Training)榜單V1.1。結(jié)果顯示,在全部16個(gè)固定任務(wù)(Closed)測試中,英偉達(dá)和浪潮信息包攬了15個(gè)冠軍,形成了罕見的霸榜現(xiàn)象。
MLPerf? AI訓(xùn)練測試分為集群測試與單機(jī)測試兩個(gè)場景,各自涵蓋圖像識別(ResNet)、醫(yī)學(xué)影像分割(U-Net 3D)、目標(biāo)物體檢測(SSD)、目標(biāo)物體檢測(Mask R-CNN)、語音識別(RNN-T)、自然語言理解(BERT)、智能推薦(DLRM)和強(qiáng)化學(xué)習(xí)(MiniGo)8類極具代表性的機(jī)器學(xué)習(xí)任務(wù),旨在考察各家產(chǎn)品完成AI任務(wù)訓(xùn)練的時(shí)間,時(shí)間越快代表性能越強(qiáng)。
作為AI“跑分”領(lǐng)域的“奧林匹克”,MLPerf?打榜一向最為牽動AI產(chǎn)業(yè)各界的神經(jīng)。特別是其中的固定任務(wù)(Closed)測試,因要求參賽各方使用相同模型(或與參考模型等價(jià)的模型)和限定的優(yōu)化器,對實(shí)際用戶評判AI計(jì)算系統(tǒng)性能具備很強(qiáng)的參考意義,一直以來便是廠商角逐最激烈、用戶選型最關(guān)注的領(lǐng)域。
本輪MLPerf? AI訓(xùn)練測試結(jié)果有何看點(diǎn)?“跑分”競速背后蘊(yùn)藏著AI產(chǎn)業(yè)怎樣的發(fā)展趨勢?這些結(jié)果和趨勢對數(shù)智化浪潮下的千行百業(yè)企業(yè)意味著什么?讓我們一探究竟。
從V1.0到V1.1,MLPerf?霸榜現(xiàn)象愈發(fā)顯著
和云計(jì)算類似,AI基本上被認(rèn)為最終會是少數(shù)幾家“大廠”的競技場。背后的支撐邏輯在于:AI作為新一代通用目的技術(shù),其能力進(jìn)化十分仰賴計(jì)算系統(tǒng)的獨(dú)到設(shè)計(jì)、全棧技術(shù)的迭代創(chuàng)新、應(yīng)用(數(shù)據(jù))的規(guī)模反哺等,具備綜合能力的大廠更容易“越滾越大”。
谷歌、微軟云、英偉達(dá)、浪潮信息、百度、戴爾等14家公司及科研機(jī)構(gòu)參與了此次MLPerf? AI訓(xùn)練測試,共提交了180項(xiàng)固定任務(wù)(Closed)成績和6項(xiàng)開放任務(wù)(Open)成績。在單機(jī)測試的8項(xiàng)固定任務(wù)中,浪潮信息獲得7項(xiàng)冠軍,英偉達(dá)獲得1項(xiàng)冠軍;在集群測試的8項(xiàng)固定任務(wù)中,英偉達(dá)獲得7項(xiàng)冠軍,微軟云獲得1項(xiàng)冠軍。
在半年前的V1.0中,英偉達(dá)和浪潮信息還分別“只”拿下16項(xiàng)固定任務(wù)(Closed)中的6項(xiàng)和4項(xiàng)冠軍,半年后兩家即以8項(xiàng)和7項(xiàng)冠軍霸榜V1.1,足見AI領(lǐng)域的馬太效應(yīng)正在加速發(fā)生。
同樣的現(xiàn)象也發(fā)生在MLPerf? AI推理測試中(MLPerf?每年組織AI推理及AI訓(xùn)練性能測試各2次)。數(shù)據(jù)顯示,在2021年MLPerf?數(shù)據(jù)中心推理和邊緣推理兩大場景的固定任務(wù)(Closed)測試中,浪潮信息與英偉達(dá)分別拿下全部63個(gè)任務(wù)中的33項(xiàng)和14項(xiàng)冠軍,同樣排在榜單前兩位。
總體來看,隨著MLPerf? 2021年度4次測試全部收官,全球高手同場競技,頭部效應(yīng)愈發(fā)明顯。其中,浪潮信息共斬獲44項(xiàng)冠軍,名列MLPerfTM2021年度冠軍榜首;英偉達(dá)共拿下28項(xiàng)冠軍,位居第二;戴爾(11)、高通(5)、谷歌(4)分列第三、第四、第五位。
AI行業(yè)不“內(nèi)卷”,AI計(jì)算系統(tǒng)性能仍在躍升
值得注意的是,MLPerf?打榜中頭部玩家越來越強(qiáng),并非業(yè)界AI計(jì)算系統(tǒng)性能提升停滯,或者“友商不給力”。相反,從V1.0到V1.1,既不乏“新鮮血液”加入競爭,也能明顯看到AI性能仍在持續(xù)提升。這表明,AI行業(yè)不“內(nèi)卷”,全球頂級玩家之間的競爭還很激烈。
資料顯示,雖然訓(xùn)練評測V1.1相比V1.0在參與廠商數(shù)量上只增加了1家(微軟云、百度、HPE、三星加入,英特爾、Nettrix、PCL & PKU缺席),但MLPerf?打榜熱度絲毫不減,直觀體現(xiàn)在最主要的固定任務(wù)(Closed)賽道勁增了55個(gè)任務(wù)成績,使得各家提交的任務(wù)成績總量達(dá)到創(chuàng)新高的180個(gè)。
與此同時(shí),各項(xiàng)冠軍的表現(xiàn)也越來越優(yōu)異。在單機(jī)系統(tǒng)測試的8項(xiàng)任務(wù)中,相較半年前的V1.0競賽最佳成績,浪潮信息將醫(yī)學(xué)影像分割、語音識別、智能推薦和自然語言理解任務(wù)的AI訓(xùn)練速度分別提升18%、14%、11%和8%。英偉達(dá)在單機(jī)系統(tǒng)測試中獲得強(qiáng)化學(xué)習(xí)1項(xiàng)冠軍,訓(xùn)練速度相較V1.0提升2%。
單機(jī)性能冠軍V1.0 vs. V1.1
在集群系統(tǒng)測試的8項(xiàng)任務(wù)中,相較于V1.0競賽最佳成績,英偉達(dá)將自然語言理解、目標(biāo)物體檢測(MASK R-CNN)、語音識別任務(wù)的AI訓(xùn)練速度分別提升22%、18%、14%。微軟云在集群系統(tǒng)測試中奪得1項(xiàng)冠軍,以1.26分鐘完成醫(yī)學(xué)影像分割任務(wù)訓(xùn)練,訓(xùn)練速度相較V1.0提升58%。
集群性能冠軍V1.0 vs. V1.1
這其中令人印象深刻的是,在MLPerf V1.0至V1.1推理比賽中,浪潮信息是唯一率先實(shí)現(xiàn)支持8顆A100-SXM-80GB(500W) GPU服務(wù)器的廠商,其他廠商能夠支持的同款GPU數(shù)量只有4顆;而在V1.1訓(xùn)練測試中,Supermicro也第二家推出了單機(jī)搭載8塊A100-SXM-80GB(500W) GPU的機(jī)型SYS-420GP-TNAR,在主要配置上與浪潮信息的NF5688M6實(shí)現(xiàn)了看齊,標(biāo)志著單機(jī)AI服務(wù)器正加速邁進(jìn)“八卡A100 500W時(shí)代”。
從實(shí)際表現(xiàn)看,盡管距離榜首浪潮信息仍有一定的差距,但Supermicro這款產(chǎn)品在圖像識別(ResNet)、醫(yī)學(xué)影像分割(U-Net 3D)、目標(biāo)物體檢測(SSD)任務(wù)上都取得了TOP3的優(yōu)異成績,足見AI業(yè)界在推動主流機(jī)器學(xué)習(xí)任務(wù)性能提升方面還在你追我趕、不懈努力。
談及AI服務(wù)器在MLPerf?基準(zhǔn)評測中的出色表現(xiàn),浪潮信息方面表示主要是得益于公司在AI計(jì)算系統(tǒng)創(chuàng)新上卓越的系統(tǒng)設(shè)計(jì)能力和全棧優(yōu)化能力,涵蓋硬件的精細(xì)校準(zhǔn)和全面優(yōu)化、軟件的調(diào)優(yōu),以及散熱技術(shù)創(chuàng)新等。而這些能力是建立在浪潮信息對客戶應(yīng)用場景理解之上的,包括在產(chǎn)品研發(fā)、客戶需求、實(shí)際應(yīng)用中所獲得的洞察和理解。
英偉達(dá)方面也表示,其在MLPerf?基準(zhǔn)評測中的突破性性能得益于硬件、軟件和系統(tǒng)層面技術(shù)的緊密結(jié)合,公司在全棧性能上的持續(xù)投資使得其吞吐量相較之前的MLPerf? 測試提交成績有所提高。
固定任務(wù)與開放任務(wù)“冷熱”不同,AI加速落地
本次MLPerf?訓(xùn)練榜單結(jié)果還有一個(gè)顯而易見的趨勢,那便是與固定任務(wù)(Cloesed)與開放任務(wù)(Open)賽道的參與度“冰火兩重天”——從V1.0到V1.1,前者大增了55個(gè)任務(wù)成績,后者僅僅增加了1個(gè),這表明更多玩家將主要精力放在了基于主流成熟模型的軟硬件系統(tǒng)優(yōu)化能力的提升。
熟悉MLPerf?基準(zhǔn)測試的可能都知道,固定任務(wù)(Cloesed)測試要求使用相同模型和優(yōu)化器,并限制Batch大小或?qū)W習(xí)率等超參數(shù)的值,衡量的是同一深度學(xué)習(xí)模型在不同軟硬件上的性能表現(xiàn);開放任務(wù)(Open)測試則放開了對深度學(xué)習(xí)模型及精度的約束,只會限制使用相同的數(shù)據(jù)解決相同的問題,其它模型或平臺等條件都不受限制。
簡言之,前者旨在對硬件和軟件系統(tǒng)進(jìn)行公平的比較,考察的是廠商對軟硬件系統(tǒng)優(yōu)化的能力;后者側(cè)重于深度學(xué)習(xí)模型及算法優(yōu)化的能力,旨在推進(jìn)ML模型和算法精度的創(chuàng)新。很明顯,前者更貼近實(shí)際AI應(yīng)用環(huán)境,能夠?yàn)橛脩魪挠?jì)算向智算轉(zhuǎn)型升級時(shí)提供評判AI計(jì)算系統(tǒng)性能的更強(qiáng)的參考意義;后者更類似于實(shí)驗(yàn)室的自由發(fā)揮、充分“炫技”。
這也反映出,經(jīng)過近幾年的高速發(fā)展,頭部廠商的AI全棧能力已經(jīng)趨于成熟,它們的創(chuàng)新重點(diǎn)轉(zhuǎn)向了AI的應(yīng)用落地,以推動AI產(chǎn)業(yè)化和產(chǎn)業(yè)AI化,釋放這一劃時(shí)代通用目的技術(shù)巨大的經(jīng)濟(jì)價(jià)值和社會價(jià)值。
IDC的報(bào)告也印證了這種趨勢。該機(jī)構(gòu)預(yù)測,AI計(jì)算在整體計(jì)算市場的占比正逐年提高。作為AI基礎(chǔ)設(shè)施的主體,全球AI服務(wù)器2020年上半年市場規(guī)模已達(dá)55.9億美元,預(yù)計(jì)到2024年將達(dá)到251億美元。上述冠軍霸榜的浪潮信息,目前全球AI服務(wù)器市場份額第一,中國市場份額已連續(xù)五年穩(wěn)居第一。
- 蜜度索驥:以跨模態(tài)檢索技術(shù)助力“企宣”向上生長
- 美媒:一些中國大模型已經(jīng)追平甚至超越美國產(chǎn)品
- 透過這場開發(fā)者圈的“年度盛典”,窺見華為開發(fā)者生態(tài)構(gòu)建之道
- 谷歌Willow量子芯片有進(jìn)步 但離實(shí)用還很遙遠(yuǎn)
- LLM很難變成AGI?科學(xué)家:創(chuàng)造AGI理論上可行
- PON在園區(qū)網(wǎng)絡(luò)的“先天不足”,無源以太全光來拯救!
- 英特爾CEO黯然退場背后:芯片制造陷泥潭,AI起大早趕晚集
- 開源5年樹立新里程 openEuler以智能 致世界
- 華為推出Mate 70手機(jī)引發(fā)高度關(guān)注 看外媒是如何評價(jià)的?
- 5G-A終端規(guī)模鋪開響應(yīng)“以舊換新”,湖北移動“機(jī)網(wǎng)套”協(xié)同刺激內(nèi)需
- 六載華為開發(fā)者大賽,“賽”出云上開發(fā)新生態(tài)
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實(shí),并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。