4月18日,第十屆聯(lián)想創(chuàng)新科技大會Tech World在上海舉行。聯(lián)想集團副總裁、中國基礎(chǔ)設(shè)施業(yè)務(wù)群總經(jīng)理陳振寬表示,聯(lián)想基于最全面的AI基礎(chǔ)設(shè)施產(chǎn)品組合以及最豐富的AI行業(yè)解決方案,加速了全球客戶的智能化轉(zhuǎn)型,同時在這場非贏不可的比賽和角逐中將竭盡所能,為客戶提供縱橫智能化時代的萬全之策。
陳振寬稱,聯(lián)想是扎根于中國的高科技企業(yè),引領(lǐng)了一個又一個的中國IT技術(shù)發(fā)展浪潮。
在通用計算領(lǐng)域,聯(lián)想的X86服務(wù)器可靠性連續(xù)9年第一,實現(xiàn)463項性能世界記錄;在科學(xué)計算領(lǐng)域,聯(lián)想連續(xù)9年實現(xiàn)中國HPC TOP 100 NO.1,助力中國在科學(xué)計算、仿真、氣象等前沿領(lǐng)域的創(chuàng)新突破;在人工智能1.0時代,聯(lián)想基于中國特色需求設(shè)計了完整AI基礎(chǔ)設(shè)施組合,并實現(xiàn)165個行業(yè)驗證落地的AI方案。
現(xiàn)如今,大模型的AI 2.0時代已經(jīng)邁著大步走來。隨著AI模型參數(shù)的指數(shù)級增加、邁入千億、萬億級大關(guān),大模型具備了超強的泛化、生成能力,促使人工智能進入更廣的應(yīng)用場景和更深的業(yè)務(wù)流程當(dāng)中,發(fā)揮更大的價值。
為解決用戶面對的挑戰(zhàn),聯(lián)想AI基礎(chǔ)設(shè)施聚焦三大領(lǐng)域。一是為用戶匹配經(jīng)過驗證優(yōu)化的最佳算力,二是賦能用戶充分利用算力,提升計算效率。三是以先進的液冷技術(shù)幫助用戶節(jié)能增效且突破芯片散熱的瓶頸。
同時,陳振寬總結(jié)了聯(lián)想過去一年為AI應(yīng)用大潮創(chuàng)新的五大技術(shù),包括智能匹配AI算力的智算魔方,針對GPU,AI集群提效設(shè)計的先進算法,以及跨AI和HPC集群充分共享算力的超級調(diào)度器。
算力匹配魔方:基于海量的硬件評測和AI算子算法集成工作, 聯(lián)想構(gòu)建了AI場景與算法與集群硬件三者匹配關(guān)系的算力魔方知識庫。立體魔方中的數(shù)千個交叉點中的每一個,代表一種場景和與之最匹配的算法和集群配置。應(yīng)用算力匹配魔方,用戶可以跳過選擇驗證數(shù)十種算法和近百種AI集群配置的復(fù)雜過程,只需輸入場景和數(shù)據(jù),算力魔方即可自動加載最優(yōu)算法和調(diào)度最佳集群配置。
挖掘GPU潛力的GPU內(nèi)核態(tài)虛擬化技術(shù):在AI推理和中小訓(xùn)練中,AI子任務(wù)多以虛擬GPU承載,而在容器和調(diào)度層做GPU虛擬化和容器間數(shù)據(jù)隔離是目前業(yè)界較普遍的做法,這使得虛擬化和資源隔離的開銷造成約20%的GPU算力損耗。聯(lián)想研究院與高校研究機構(gòu)多年合作開發(fā)在GPU驅(qū)動層進行虛擬化和資源管理,新的算法可以將虛擬化造成的GPU損耗降至<5%,極致情況降至<1%,大幅提升GPU利用率。
聯(lián)想集合通信庫:聯(lián)想在多年集群網(wǎng)絡(luò)設(shè)計中積累了豐富的對大規(guī)模集群網(wǎng)絡(luò)的拓撲優(yōu)化手段,同時聯(lián)想研究院與高校研究機構(gòu)合作建立了基于深層數(shù)學(xué)原理的集合通信優(yōu)化算法。在千卡規(guī)模訓(xùn)練集群,采用集成了聯(lián)想集合通信庫的聯(lián)想異構(gòu)智算平臺做管理調(diào)度,可提升網(wǎng)絡(luò)通信效率超過10%,集群規(guī)模越大,效果越顯著。
高效AI斷點續(xù)訓(xùn)技術(shù):AI訓(xùn)練故障頻發(fā)是常態(tài),因此有必要在訓(xùn)練前設(shè)置故障檢查點和備份,以備訓(xùn)練因故障中斷時能提取備份做到從斷點續(xù)訓(xùn)。聯(lián)想異構(gòu)智算平臺在常規(guī)以外,深化了對軟、硬件的全面監(jiān)控,優(yōu)化了多級存儲備份架構(gòu)和策略,更以多年積累的AI訓(xùn)練故障預(yù)測的AI模型來預(yù)測斷點和提前優(yōu)化備份,由此能將斷點續(xù)訓(xùn)恢復(fù)時間縮減到分鐘級。
聯(lián)想AI與HPC異構(gòu)集群超級調(diào)度技術(shù):HPC集群部分會用到GPU節(jié)點,AI集群絕大部分用GPU節(jié)點。 同時擁有HPC集群和AI集群的用戶希望在不同集群間根據(jù)任務(wù)優(yōu)先級和資源狀況共享寶貴的GPU節(jié)點資源。聯(lián)想異構(gòu)智算平臺在AI和HPC調(diào)度之上架構(gòu)了超級調(diào)度器,全局自動化管理不同類任務(wù)和調(diào)度異構(gòu)資源,實現(xiàn)了資源動態(tài)共享。
以上這些就是聯(lián)想在AI基礎(chǔ)設(shè)施積累的三大能力和領(lǐng)先的五大技術(shù)創(chuàng)新,是聯(lián)想整合全球和本地研發(fā)智慧,潛心鉆研AI技術(shù)和應(yīng)用發(fā)展趨勢,并深耕本地客戶特色需求的基礎(chǔ)上打造的。
大會上,陳振寬正式發(fā)布了“聯(lián)想萬全異構(gòu)智算平臺”,它集合了聯(lián)想在AI 2.0時代的IT基礎(chǔ)設(shè)施技術(shù)主張。AI技術(shù)正在高速發(fā)展,聯(lián)想萬全異構(gòu)智算平臺也將布局未來,將挑戰(zhàn)分鐘內(nèi)的斷點續(xù)訓(xùn),持續(xù)優(yōu)化超大規(guī)模集群的通信算法,深入研究相變式液冷技術(shù),并布局模塊化液冷數(shù)據(jù)中心。這些技術(shù)將為中國用戶提供更加強大、穩(wěn)定、高效、綠色的智能算力。
- 蜜度索驥:以跨模態(tài)檢索技術(shù)助力“企宣”向上生長
- 長江存儲發(fā)布聲明:從無“借殼上市”意愿
- 泛微·數(shù)智大腦Xiaoe.AI正式發(fā)布,千人現(xiàn)場體驗數(shù)智化運營場景
- IDC:2024年第三季度北美IT分銷商收入增長至202億美元
- AI成為雙刃劍!凱捷調(diào)查:97%組織遭遇過GenAI漏洞攻擊
- openEuler開源五年樹立新里程碑,累計裝機量突破1000萬
- 創(chuàng)想 華彩新程!2024柯尼卡美能達媒體溝通會煥新增長之道
- 操作系統(tǒng)大會2024即將在京召開,見證openEuler發(fā)展新里程
- Gartner:AI引領(lǐng)歐洲IT支出激增,2025年將支出1.28萬億美元
- IDC:中國數(shù)字化轉(zhuǎn)型支出五年復(fù)合增長率約為15.6% 高于全球整體增速
- 2028年中國數(shù)字化轉(zhuǎn)型總體市場規(guī)模將超7300億美元
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責(zé)任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。