9月9日,全球權(quán)威AI基準(zhǔn)評測MLPerf Inference v2.1榜單公布結(jié)果。
MLPerf是業(yè)內(nèi)公認(rèn)的國際權(quán)威AI性能基準(zhǔn)評測,由圖靈獎得主大衛(wèi)·帕特森(David Patterson)聯(lián)合谷歌、英偉達(dá) 、英特爾、Facebook、浪潮等全球AI領(lǐng)軍企業(yè),以及來自哈佛大學(xué)、斯坦福大學(xué)等學(xué)術(shù)機構(gòu)的研究人員創(chuàng)立。
該測評以其標(biāo)準(zhǔn)嚴(yán)格、測評嚴(yán)謹(jǐn)而著稱,英偉達(dá)、高通等國際AI芯片企業(yè)均攜最強產(chǎn)品參加測評,競爭十分激烈,各賽道均有數(shù)百項產(chǎn)品提交成績。
中國AI芯片企業(yè)首次超越英偉達(dá)“史上最強GPU”、未來4nm產(chǎn)品——H100:中國AI芯片明星創(chuàng)業(yè)公司——墨芯人工智能(以下簡稱“墨芯”)S30計算卡以95784 FPS的單卡算力,奪得Resnet-50模型算力全球第一。
以上數(shù)據(jù)摘自MLCommons官網(wǎng)MLPerf Inference v2.1測試結(jié)果
墨芯首次參賽 單卡算力全球第一
眾所周知,“單卡算力”是檢驗AI計算產(chǎn)品的“真標(biāo)準(zhǔn)”。
墨芯奪冠項目是數(shù)據(jù)中心最常用主流模型ResNet-50,該賽道競爭尤為激烈,競爭者包括H100、A100。
S30以ResNet-50 95784 FPS的單卡算力奪得第一,是英偉達(dá)未來4nm產(chǎn)品——H100的1.2倍,是A100的2倍。
同時,墨芯S30運行BERT-Large是A100的2倍,僅次于H100,在Bert-large高精度模型(99.9%),單卡算力達(dá)3,837 SPS。
值得強調(diào)的是此次是“12nm”戰(zhàn)勝“4nm”。
從競爭者角度看,墨芯參與的ResNet-50和BERT-Large都是數(shù)據(jù)中心最常用主流模型,因此競爭尤為激烈。特別是競爭者包括H100,是英偉達(dá)迄今推出的最強大的GPU,據(jù)悉使用臺積電最新的4納米工藝,可謂“最強王者”。而戰(zhàn)勝“最強王者”,足以體現(xiàn)墨芯S30采用12nm,性能已經(jīng)站在世界頂尖水平。
精度要求99%以上,經(jīng)受嚴(yán)格檢驗
更值得一提的是,MLPerf的測試要求非常嚴(yán)格:不僅考驗各產(chǎn)品算力,同時設(shè)置精度要求在99%以上,主要為了考察AI推理精度的高要求對計算性能的影響。換句話說,參賽廠商無法以犧牲精度的方式換取算力提升,在這種嚴(yán)要求下奪冠,表明了墨芯的硬核技術(shù)實力。
- 蜜度索驥:以跨模態(tài)檢索技術(shù)助力“企宣”向上生長
- 高通在與Arm的法律糾紛中部分勝訴,但Arm表態(tài)將尋求再審
- 臺積電2納米芯片性能提升僅15%,知情人士稱試產(chǎn)良率超過60%
- 半導(dǎo)體2025:影響技術(shù)革命的新興趨勢
- 這家普通人不熟悉的公司,市值如何超過萬億美元
- 增資超30億元 華為增持旗下極目機器公司
- 傳蘋果將在新一代iPhone SE中采用自研5G基帶芯片,速度僅為高通的一半
- 美國模擬芯片巨頭亞德諾過去一年全球減員2000人,2024財年營收同比下降23%
- 移動芯片之王Arm,下一步要做AI芯片之王
- 2025年全球半導(dǎo)體市場規(guī)模將達(dá)6971億美元,AI驅(qū)動增長勢頭強勁
- 臺積電回應(yīng)美出口管制新規(guī):影響可控,2nm制程未來或轉(zhuǎn)移美國
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實,并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。