人工智能的發(fā)展如何引發(fā)數(shù)據(jù)中心的重新設計
By Alan Morrison
正在進行的數(shù)據(jù)中心重新設計的一個主要方面是,由于人工智能的龐大、復雜的工作負載以及需要添加更多圖形處理單元(GPU)、張量處理單元(TPU)或加速器。
這些單元所需的功率和產(chǎn)生的熱量,迫使設計人員重新思考什么是可行的和最佳的布局設計。而且,重新設計的成本正在不斷增加。
因此,根據(jù)Tirias Research的數(shù)據(jù),到2028年,業(yè)主每年可能會在新的人工智能數(shù)據(jù)中心基礎設施上花費760億美元。
數(shù)據(jù)中心當前面臨的挑戰(zhàn):當今基于GPU的密集集群
Tom's Hardware的Anton Shilov最近評估了人工智能工作負載對GPU的巨大需求:Omdia表示,Nvidia在2023年第二季度實際上售出了900噸H100處理器。Omdia估計,Nvidia在第二季度為人工智能(AI)和高性能計算(HPC)應用銷售了超過900噸(180萬磅)H100計算GPU。Omdia認為,帶有散熱器的Nvidia H100計算GPU的平均重量超過3公斤(6.6磅),因此Nvidia在第二季度出貨了超過30萬臺H100。
因此,單個Nvidia H100圖形處理單元(GPU)的重量約為一個輕型保齡球的重量。Omdia上面計算的重量不包括相關的布線或液體冷卻。
Schneider Electric數(shù)據(jù)中心創(chuàng)新副總裁Steven Carlini表示,用于人工智能的機架必須重新設計,以適應額外的重量和熱量。其將當今密集的人工智能服務器集群與“整齊分布”的成排普通服務器機架進行了對比,這些服務器機架在當代人工智能開始認真發(fā)展之前很常見,將整齊的行變成了密集的熱運行集群。
Carlini表示,這些人工智能集群每個機架的功耗高達100千瓦,而傳統(tǒng)的非人工智能數(shù)據(jù)中心機架的每個機架功耗高達20千瓦。Schneider Electric能源管理研究中心的高級研究分析師Victor Avelar指出,每臺Nvidia H100的功耗為700瓦,而舊款A100的功耗為400瓦,后者的需求量仍然很高。兩種GPU類型都需要液體冷卻。
每個GPU中密集的800億個晶體管硅區(qū)域產(chǎn)生大部分熱量。Amazon和Google等企業(yè)正在安裝的一臺人工智能服務器包含8個這樣的GPU。如果設計得當,人工智能服務器集群可以持續(xù)100%運行,相比之下,非人工智能AI應用的服務器利用率要低得多。
數(shù)據(jù)中心能源管理的長遠視角
承載當今人工智能工作負載的主要數(shù)據(jù)中心的所有者,長期以來一直致力于減輕對環(huán)境的影響,并且在能源管理方面,他們往往著眼于長遠。的確,能源消耗比以往任何時候都高,但現(xiàn)在大部分頂級數(shù)據(jù)中心容量都是由可再生能源供電,業(yè)主正在尋找其他零排放替代方案。例如,Microsoft在5月份簽署了一份合同,從2028年開始從聚變能源初創(chuàng)企業(yè)Helion購買至少50兆瓦的電力。
Victor Avelar致力于量化當今數(shù)據(jù)中心在其生命周期內(nèi)的碳足跡,并幫助優(yōu)化未來數(shù)據(jù)中心的布局和設計。Avelar在其免費的數(shù)據(jù)中心生命周期二氧化碳當量計算器上進行了演示,該計算器既關注了隱含碳,如數(shù)據(jù)中心建設中使用的混凝土的資源、制造和澆筑過程中排放的碳,也關注了數(shù)據(jù)中心運營過程中產(chǎn)生的碳。
圖片來源:Schneider Electric
成本計算器幫助規(guī)劃者考慮替代方案并選擇最佳設計標準。例如,Schneider Electric對電源進行了研究。Avelar對比了西弗吉尼亞州的一個燃煤電廠和法國的一個核電廠。
通過按范圍查看年度總二氧化碳當量,發(fā)現(xiàn)西弗吉尼亞選項的范圍2(從當?shù)毓檬聵I(yè)購買的電力)排放量在混合排放中所占的比例要大得多。相比之下,法國的選項在范圍3(間接能源,例如新數(shù)據(jù)中心混凝土中的隱含碳)中所占的比例更大。范圍1和范圍2的排放更多地在規(guī)劃者的控制范圍內(nèi)。
數(shù)據(jù)中心所有權的轉變
Carlini指出,從歷史上看,數(shù)據(jù)中心往往遵循一種類似購物中心的模式,即主要租戶和精品店,所有者只專注于滿足當?shù)匦枨蟮慕ㄖI(yè)務,并管理空間租賃。
但最近,大型云計算、媒體和SaaS提供商在新建數(shù)據(jù)中心的比例方面更加占據(jù)主導地位。對于那些所有者/運營商而言,沒有標準的數(shù)據(jù)中心設計。每個數(shù)據(jù)中心都是不同的,當前環(huán)境下的主要挑戰(zhàn)就是跟上所有正在發(fā)生的變化。
相關推薦:
人工智能在數(shù)字營銷中的崛起人工智能和安全:連接的雙胞胎十大最佳人工智能學習應用程序人工智能迫使數(shù)據(jù)中心重新思考設計如何釋放人工智能在智慧城市中的潛力?CIBIS峰會
由千家網(wǎng)主辦的2023年第24屆CIBIS筑智能化峰會即將正式拉開帷幕,本屆峰會主題為“智慧連接,‘筑’就未來”, 將攜手全球知名智能化品牌及業(yè)內(nèi)專家,共同探討物聯(lián)網(wǎng)、AI、云計算、大數(shù)據(jù)、IoT、智慧建筑、智能家居、智慧安防等熱點話題與最新技術應用,分享如何利用更知慧、更高效、更安全的智慧連接技術,“筑”就未來美好智慧生活。歡迎建筑智能化行業(yè)同仁報名參會,分享交流!
報名方式
成都站(10月24日):https://www.huodongxing.com/event/6715336669000
西安站(10月26日):https://www.huodongxing.com/event/3715335961700
長沙站(11月09日):https://www.huodongxing.com/event/7715337579900
上海站(11月21日):https://www.huodongxing.com/event/9715337959000
北京站(12月23日):https://www.huodongxing.com/event/3715338464800
廣州站(12月07日):https://www.huodongxing.com/event/6715338767700
更多2023年CIBIS峰會信息,詳見峰會官網(wǎng):http://summit.qianjia.com/
- 中國電信:李峻辭任公司執(zhí)行董事
- 5G專網(wǎng)賦能,糯扎渡水電廠開啟智慧運營新時代
- Dell'Oro報告:2024年調整期結束 光傳輸設備市場將恢復增長
- Dell'Oro報告:2024年調整期結束 光傳輸設備市場將恢復增長
- 為什么要云轉型?企業(yè)邁向數(shù)字化未來的必由之路
- 受AI和混合云推動 分布式云網(wǎng)絡市場到2028年將達170億美元
- 商業(yè)航天產(chǎn)業(yè)不僅是戰(zhàn)略新興產(chǎn)業(yè),更是戰(zhàn)略常興產(chǎn)業(yè)
- 韋爾股份預計2024年營收創(chuàng)歷史新高 凈利潤預計增長五倍
- 郝文宇:我國商業(yè)衛(wèi)星應堅持自主發(fā)展 遵循產(chǎn)業(yè)規(guī)律
- 瑞芯微2024年預計營收創(chuàng)歷史新高 凈利潤增長超300%
免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權或存在不實內(nèi)容時,應及時向本網(wǎng)站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內(nèi)容或斷開相關鏈接。