8月12日消息,2024開(kāi)放計(jì)算中國(guó)峰會(huì)上,開(kāi)放算力模組(OCM)規(guī)范正式啟動(dòng)立項(xiàng),首批成員包括中國(guó)電子技術(shù)標(biāo)準(zhǔn)化研究院、浪潮信息、Intel、AMD、百度、小紅書、聯(lián)想、超聚變等,旨在打造國(guó)內(nèi)首個(gè)服務(wù)器計(jì)算模組設(shè)計(jì)規(guī)范,構(gòu)建CPU統(tǒng)一算力底座。
開(kāi)放計(jì)算模組規(guī)范(OCM) 規(guī)范的正式啟動(dòng),旨在建立基于處理器的標(biāo)準(zhǔn)化算力模組單元,通過(guò)統(tǒng)一不同處理器算力單元對(duì)外高速互連、管理協(xié)議、供電接口等,實(shí)現(xiàn)不同架構(gòu)處理器芯片兼容,構(gòu)建CPU的統(tǒng)一的算力底座,以解決CPU生態(tài)挑戰(zhàn)問(wèn)題,方便客戶根據(jù)人工智能、云計(jì)算、大數(shù)據(jù)等多樣化應(yīng)用場(chǎng)景,靈活、快速匹配最適合的算力平臺(tái),推動(dòng)算力產(chǎn)業(yè)高質(zhì)量快速發(fā)展。
為何要構(gòu)建“OCM”規(guī)范?
在談及“OCM”規(guī)范發(fā)起的初衷時(shí),浪潮信息服務(wù)器產(chǎn)品線總經(jīng)理趙帥表示,現(xiàn)在,無(wú)論是手機(jī)、電腦、邊緣設(shè)備、CPU服務(wù)器、加速服務(wù)器都具有了AI計(jì)算的能力,也都在承載著多樣化的AI應(yīng)用。AI算力已經(jīng)深入到千行百業(yè),滲透進(jìn)每一個(gè)計(jì)算設(shè)備里,面向人工智能的算力范式不斷革新。通用算力也要具有AI計(jì)算的能力,可以說(shuō)“未來(lái)一切計(jì)算皆AI”。
在智算時(shí)代背景下,CPU算力單元應(yīng)用越來(lái)越豐富,除了大數(shù)據(jù)、關(guān)鍵計(jì)算、科學(xué)計(jì)算外,也要承擔(dān)AI應(yīng)用的重要任務(wù),這是CPU算力單元的重大機(jī)遇。
與此同時(shí),隨著應(yīng)用范式的多樣化,CPU呈現(xiàn)了多元化發(fā)展方向。目前x86、ARM、RISC-V等不同架構(gòu)的CPU處理器百花齊放,僅在中國(guó),目前就有10多種CPU處理器,不同CPU協(xié)議標(biāo)準(zhǔn)不統(tǒng)一,系統(tǒng)功耗、總線速率、電流密度不斷提升,導(dǎo)致硬件開(kāi)發(fā)、固件適配、部件測(cè)試資源等時(shí)間激增,給算力系統(tǒng)設(shè)計(jì)帶來(lái)巨大挑戰(zhàn)。
趙帥強(qiáng)調(diào):“需要構(gòu)建一個(gè)CPU的統(tǒng)一算力底座,解決CPU計(jì)算的效率問(wèn)題?!?/p>
“OCM”規(guī)范的思路就是把原來(lái)一個(gè)緊耦合式的服務(wù)器架構(gòu)拆散,以CPU和內(nèi)存作為最小的算力單元,標(biāo)準(zhǔn)化高速和低速的互連接口。這樣,未來(lái)不同的算力平臺(tái),只更換計(jì)算的模組,就可以實(shí)現(xiàn)從芯片到算力快速的落地應(yīng)用。
通過(guò)這種標(biāo)準(zhǔn)化的算力模組,讓算力可以快速抵達(dá)用戶,讓用戶可以快速地利用最先進(jìn)的算力。
“OCM”規(guī)范的價(jià)值和意義
浪潮信息服務(wù)器產(chǎn)品部產(chǎn)品規(guī)劃經(jīng)理羅劍認(rèn)為,隨著OCM規(guī)范的啟動(dòng),對(duì)算力上游廠商、終端用戶、系統(tǒng)集成商都大有裨益。
對(duì)于上游廠商來(lái)說(shuō),這個(gè)規(guī)范可以讓他們?cè)谧鎏幚砥鞯耐瑫r(shí),把這個(gè)算力模塊做出來(lái),新的平臺(tái)可以快速地在系統(tǒng)上面去做集成。
對(duì)于終端用戶來(lái)說(shuō),這種標(biāo)準(zhǔn)化可以實(shí)現(xiàn)對(duì)多元算力的統(tǒng)一管理、統(tǒng)一運(yùn)維,管理復(fù)雜性極大降低了。
對(duì)于系統(tǒng)集成商來(lái)說(shuō),算力標(biāo)準(zhǔn)化后,就可以在不同的系統(tǒng)里應(yīng)用統(tǒng)一的算力模塊,類似于硬盤一樣,一個(gè)系統(tǒng)里面可以支持多家的硬盤,一樣的道理,未來(lái)一個(gè)系統(tǒng)里面就可以支持多元算力平臺(tái)。
事實(shí)上,這不是浪潮信息首次參與發(fā)起相關(guān)行業(yè)規(guī)范。此前,浪潮信息就參與和支持了針對(duì)超大規(guī)模深度學(xué)習(xí)訓(xùn)練的AI加速卡的“開(kāi)放加速規(guī)范OAM”。
“OAM”構(gòu)建了一個(gè)統(tǒng)一的加速芯片底座,解決了單個(gè)服務(wù)器內(nèi)多元AI加速卡形態(tài)和接口不統(tǒng)一,高速互連效率低,研發(fā)周期長(zhǎng)等問(wèn)題,促進(jìn)了加速算力單元接口的統(tǒng)一和生態(tài)的完善。
目前開(kāi)放計(jì)算規(guī)范OAM已成為全球最多高端AI加速芯片遵循的統(tǒng)一設(shè)計(jì)標(biāo)準(zhǔn),全球20多家芯片企業(yè)支持開(kāi)放加速規(guī)范,為AI芯片企業(yè)節(jié)省研發(fā)時(shí)間6個(gè)月以上,為整體產(chǎn)業(yè)研發(fā)投入節(jié)省數(shù)十億元,極大地降低了AI算力產(chǎn)業(yè)創(chuàng)新的難度,加速高質(zhì)量AI算力普惠發(fā)展。
浪潮信息最新一代基于OAM規(guī)范的AI服務(wù)器NF5698G7支持多種基于OAM規(guī)范的開(kāi)放加速芯片,并為用戶構(gòu)建了一個(gè)千卡液冷集群,支持超千億參數(shù)量的AI大模型訓(xùn)練。
目前,OAM規(guī)范還在持續(xù)迭代,未來(lái)基于OAM2.0規(guī)范的AI加速卡將支持1024張加速卡的卡間互聯(lián),突破大模型互聯(lián)瓶頸。
談到剛剛啟動(dòng)的OCM規(guī)范,趙帥表示:“開(kāi)放計(jì)算對(duì)于智算時(shí)代有非常重要的意義和價(jià)值,要用開(kāi)放應(yīng)對(duì)多元算力的挑戰(zhàn)。OCM是國(guó)內(nèi)首個(gè)服務(wù)器模組設(shè)計(jì)規(guī)范,希望更多的行業(yè)伙伴以及更多的用戶參與進(jìn)來(lái),真正讓多元的統(tǒng)一算力模組盡快地走進(jìn)每一個(gè)用戶的機(jī)房當(dāng)中。”
(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。 )