隨著人工智能逐漸成為推動社會經(jīng)濟發(fā)展的新引擎,各行各業(yè)都隨之步入產(chǎn)業(yè)智能升級的隊列。在越來越旺盛的算力需求下,我國的人工智能計算中心正呈現(xiàn)全面開花、多點落地的態(tài)勢。然而,與其他領(lǐng)域的發(fā)展初期類似,伴隨人工智能中心的建設熱潮,相關(guān)的爭議及討論也越來越多:有認為人工智能計算中心建起來不一定能用上的,有認為人工智能計算中心建設需要根據(jù)算力定價格的,還有認為越多臺AI服務器就代表人工智能計算中心能力更強的等等。
不被雜音誤導則需回歸本源,人工智能計算中心是以基于AI芯片構(gòu)建的AI計算機集群為基礎(chǔ),涵蓋了包括基建設施、硬件設備和軟件應用在內(nèi)的完整系統(tǒng)。而系統(tǒng)的構(gòu)成,硬件部分往往最先被考量,那么我們先從AI訓練芯片說起。
硬件基礎(chǔ)設施:重點關(guān)注訓練芯片
AI芯片對于人工智能有多重要?一言以蔽之,各行業(yè)、各企業(yè)數(shù)字化轉(zhuǎn)型需要構(gòu)建匹配自身的AI模型,而高質(zhì)量AI模型則需要通過訓練持續(xù)迭代優(yōu)化而來。這就要求提供算力的當?shù)?a href="http://worldfootballweekly.com/%E4%BA%BA%E5%B7%A5%E6%99%BA%E8%83%BD_1.html" target="_blank" class="keylink">人工智能計算中心具備高性能的AI芯片,以此確保充沛、穩(wěn)定的算力供應。
具體到AI芯片,又分訓練芯片和推理芯片,其中訓練芯片是基礎(chǔ)中的基礎(chǔ),因為AI首先要解決認知訓練的問題,然后才是推理,這就要求訓練芯片必須具備浮點運算能力,因為在復雜模型的訓練過程中,需對上千億個浮點參數(shù)進行微調(diào)數(shù)十萬步,需要精細的浮點表達能力。相比之下,無浮點運算能力的芯片如用于訓練將增加約40%的額外操作,以及至少4倍的內(nèi)存讀寫次數(shù)。
軟件基礎(chǔ)設施:框架自主可控和AI使能更關(guān)鍵
框架是所有算法模型的開發(fā)基礎(chǔ),90%的AI應用開發(fā)都是基于AI框架,其重要性毋庸置疑?,F(xiàn)階段很多廠商采用的都是國外的AI開源框架,實際上相當于將中國人工智能發(fā)展的可控性交到了他國手中。未來國與國之間的科技競爭將愈演愈烈,一旦出現(xiàn)問題,我國想要重新實現(xiàn)安全、自主、可控的技術(shù)布局,勢必要從底層將一切推倒重建,可能造成大量的人力、物力和財力損失。
與其亡羊補牢,不如防患于未然。讓人工智能計算中心在建設之初就實現(xiàn)國產(chǎn)化,擁有自主可控的AI框架,目前已成為業(yè)內(nèi)的基本共識。據(jù)悉,目前大多數(shù)人工智能計算中心都使用了國產(chǎn)自研的全場景AI計算框架MindSpore,該框架原生支持大模型訓練,并支持端、邊、云全場景協(xié)同,具備安全可信、高效執(zhí)行、一次開發(fā)多次部署的能力。
框架之外, AI使能平臺也需要關(guān)注。以武漢人工智能計算中心采用的ModelArts為例,該平臺是全功能AI平臺,功能豐富,具備多租戶、細粒度資源管理的能力,包含一體化的集成開發(fā)環(huán)境,支持大規(guī)模訓練數(shù)據(jù)管理、大模型的大規(guī)模分布式訓練,并集成了自主可控的AI計算框架及第三方框架。在云管平臺方面,安全、易用是關(guān)鍵考量:可提供公有云技術(shù)滿足公共服務平臺技術(shù)要求,支持多租戶管理與資源隔離;源自云的服務能力,統(tǒng)一運維,統(tǒng)一計量。
輔助運營: “建起來”更要“用的好”
人工智能計算中心想要穩(wěn)定運行,建設和使用之間就不能出現(xiàn)斷層。當下的人工智能計算中心通常由地方政府牽頭,技術(shù)支持廠商參與建設。但有些廠商只管建,卻不管養(yǎng),或者提供不了全面的輔助運營。
輔助運營是發(fā)展人工智能產(chǎn)業(yè)的保障,這一點是業(yè)內(nèi)專家和項目實踐的共識。例如武漢、西安、深圳等地的人工智能計算中心在建成之后,技術(shù)支持廠商設立生態(tài)創(chuàng)新中心,組建輔助運營團隊,以“扶上馬、送一程”的方式輔助運營公司開展計算中心算力運營和生態(tài)運營,向當?shù)仄髽I(yè)提供產(chǎn)品、客戶、渠道等支持服務,并給當?shù)仄髽I(yè)提供科研創(chuàng)新、人才培養(yǎng)、應用孵化、產(chǎn)業(yè)發(fā)展等服務。這一做法確保了人工智能計算中心建起來之后,既可以高效發(fā)揮算力價值,也可以確保AI產(chǎn)業(yè)生態(tài)建設。
除了軟硬件,全棧一體化還涵蓋基建設施,同樣以武漢、西安人工智能計算中心為例,技術(shù)支持廠商采用預制模塊化方式建設,不到半年即完成了建設交付,其建設周期是傳統(tǒng)樓宇方式機房建設的一半,效率對比高下立現(xiàn)。
當下,國內(nèi)人工智能計算中心的規(guī)劃與建設如火如荼,隨著武漢、西安、深圳等地人工智能計算中心正式投入運營后對當?shù)厝斯ぶ悄墚a(chǎn)業(yè)的口碑反饋,全棧一體化的優(yōu)勢將更加凸顯。相信在可以預見的將來,選擇全棧解決方案的人工智能計算中心會越來越多,為我國數(shù)字經(jīng)濟的快速發(fā)展提供更多動力。
(免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關(guān)資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責任。
任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )