9月25日,MLCommons協(xié)會發(fā)布最新MLPerf™ Storage v1.0 AI存儲基準(zhǔn)測試成績。浪潮信息分布式存儲平臺AS13000G7表現(xiàn)出眾,在3D-UNet和CosmoFlow兩個模型共計八項測試中,斬獲五項冠軍。
MLPerf™ Storage v1.0 AI存儲基準(zhǔn)測試成績
MLPerf™是影響力最廣的國際AI性能基準(zhǔn)評測,由圖靈獎得主大衛(wèi)•帕特森(David Patterson)聯(lián)合頂尖學(xué)術(shù)機(jī)構(gòu)發(fā)起成立。2023年推出MLPerf™ 存儲基準(zhǔn)性能測試,旨在以架構(gòu)中立、具有代表性和可重復(fù)的方式衡量機(jī)器學(xué)習(xí)(ML)工作負(fù)載的存儲系統(tǒng)性能。該測試通過準(zhǔn)確建模ML工作負(fù)載所產(chǎn)生的I/O模式來幫助解決存算平衡問題,為不同存儲系統(tǒng)和不同加速器類型的混合和匹配提供了靈活性,為ML/AI模型開發(fā)者選擇存儲解決方案提供權(quán)威的參考依據(jù)。
本次MLPerf™ 存儲基準(zhǔn)評測(v1.0)吸引了全球13家領(lǐng)先存儲廠商和研究機(jī)構(gòu)參與。該評測圍繞醫(yī)學(xué)影像分割、圖像分類、宇宙學(xué)參數(shù)預(yù)測三大AI存儲應(yīng)用場景,采用主流的3D-Unet、ResNet50、CosmoFlow三類模型,在GPU利用率高達(dá)90%或70%的條件下,以帶寬和支持的模擬 GPU (模擬加速器)數(shù)量為關(guān)鍵性能指標(biāo),評估單客戶端或集群模式下存儲系統(tǒng)的性能表現(xiàn)。
本次測試,浪潮信息采用3臺AS13000G7搭建分布式存儲集群,搭載ICFS自研分布式文件系統(tǒng),在3D-UNet和CosmoFlow兩大評測任務(wù)中共獲得五項最佳成績。其中,在圖像分割3D-UNet多客戶端2評測任務(wù)中,服務(wù)于10個客戶端264個加速器,集群聚合帶寬達(dá)到360GB/s,單個存儲節(jié)點的帶寬高達(dá)120GB/s;在宇宙學(xué)分析CosmoFlow單客戶端2和多客戶端2評測任務(wù)中,分別提供了18 GB/s和52 GB/s的帶寬最佳成績。
近年來,浪潮信息基于存算協(xié)同的理念,持續(xù)加大存儲研發(fā)投入,從整體架構(gòu)到各技術(shù)棧持續(xù)創(chuàng)新,優(yōu)化升級存力,提升了GPU算力整體性能表現(xiàn),實現(xiàn)了模型訓(xùn)練數(shù)據(jù)處理的即時性,消除了GPU資源閑置(即“饑餓GPU”現(xiàn)象),全面提升大模型訓(xùn)練效率。
■ 架構(gòu)層面,采用全新數(shù)控分離架構(gòu)。數(shù)據(jù)面和控制面完全解耦,控制面實現(xiàn)數(shù)據(jù)管理和訪問,數(shù)據(jù)面讀寫操作直通到盤,達(dá)到120 GB/s的單存儲節(jié)點的超高性能,單存儲節(jié)點支撐5臺8卡計算節(jié)點規(guī)模,同時計算集群GPU利用率90%以上;
■ 軟件層面,通過多路并發(fā)透傳技術(shù),有效減少I/O操作中頻繁的上下文切換,降低單次I/O時延50%,同時達(dá)到高并發(fā)下時延穩(wěn)定性。本次測試中1430個高并發(fā)讀線程支撐下,保證每個線程單次I/O的時延均在0.005秒,AI端到端訓(xùn)練中I/O占比低于10%。此外,通過元數(shù)據(jù)VRANK技術(shù),達(dá)到單個元數(shù)據(jù)進(jìn)程多單元并發(fā)處理,提供高性能元數(shù)據(jù)服務(wù);
■ 軟硬協(xié)同層面,通過內(nèi)核親和力調(diào)度,I/O請求動態(tài)調(diào)整,增強(qiáng)文件系統(tǒng)與計算節(jié)點親和性,確保負(fù)載均衡,將數(shù)據(jù)移動與多核CPU之間的訪問效率提升400%。
浪潮信息是全球領(lǐng)先的存儲供應(yīng)商,存儲裝機(jī)容量連續(xù)3年穩(wěn)居全球前三、中國第一,是承載中國用戶數(shù)據(jù)最多、數(shù)據(jù)存力貢獻(xiàn)最大的存儲廠商。近年來,浪潮信息積極擁抱AI生態(tài),專注于構(gòu)建面向人工智能的存儲平臺,通過精準(zhǔn)優(yōu)化存算資源配置與持續(xù)強(qiáng)化技術(shù)創(chuàng)新,全面推進(jìn)AI產(chǎn)業(yè)化和產(chǎn)業(yè)AI化進(jìn)程,力爭打造AI存儲的理想之選。
(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實,并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )