Graphcore發(fā)布兩款大型IPU產(chǎn)品 支持超大規(guī)模AI計算
10月22日消息,Graphcore今日宣布發(fā)布最新產(chǎn)品IPU-POD128和IPU-POD256。IPU-POD128和IPU-POD256是Graphcore迄今為止發(fā)布的最大型的產(chǎn)品,分別能夠提供32 petaFLOPS和64 petaFLOPS的AI計算。IPU-POD128和IPU-POD256的發(fā)布 意味著Graphcore進一步擴展了其在超級計算機領域的業(yè)務范圍,將為超級計算機領域提供超強AI算力。
IPU-POD16是理想的探索平臺,IPU-POD64適用于想要建立AI計算的客戶,而IPU-POD128和IPU-POD256適合需要實現(xiàn)進一步快速增長的客戶,可以在整個系統(tǒng)中更快地訓練基于Transformer的大型語言模型,在生產(chǎn)中運行大規(guī)模商業(yè)AI推理應用程序,通過將系統(tǒng)劃分為更小、更靈活的vPOD,為更多開發(fā)人員提供IPU訪問權限,或者通過在整個系統(tǒng)中探索GPT和GNN等新興模型來實現(xiàn)科學突破,是云超大規(guī)模企業(yè)(Cloud Hyperscaler)、國家科學計算實驗室以及在金融服務或制藥等市場擁有大型AI團隊的企業(yè)的理想之選。
首批部署IPU-POD128的客戶包括韓國科技巨頭Korea Telecom(KT)。為了不斷滿足日益增長的超大規(guī)模AI HPC環(huán)境市場需求,KT正與Graphcore合作,將其所擁有的IPU-POD64升級為IPU-POD128,以增加為客戶所提供的“超大規(guī)模AI服務”。
KT云/數(shù)字體驗業(yè)務部高級副總裁Mihee Lee表示:“通過此次升級,預計我們的AI計算規(guī)模將增加至32 petaFLOPS的AI計算,使更多元的客戶能夠使用KT的先進AI計算技術進行大規(guī)模AI模型訓練和推理。”
與其他IPU-POD系統(tǒng)一樣,AI計算和服務器的解聚意味著IPU-POD128和IPU-POD256可以在優(yōu)化后,為不同的AI工作負載提供最大性能,實現(xiàn)最佳總體擁有成本(TCO)。例如一個以自然語言處理(NLP)為主的系統(tǒng)可以只使用2臺服務器;而更多的數(shù)據(jù)密集型任務,例如計算機視覺任務等可以使用8臺服務器。此外,系統(tǒng)存儲可以使用來自Graphcore最近公布的存儲合作伙伴所提供的技術,圍繞特定的AI工作負載進行優(yōu)化。
廣泛使用的語言和視覺模型的結果顯示,IPU-POD128和IPU-POD256具有極為出色的訓練性能和高效的擴展能力,隨著未來軟件的優(yōu)化,這兩大產(chǎn)品有望進一步提高性能。
將Graphcore計算擴展到IPU-POD128和IPU-POD256需要大量使能技術支持,其中既包括硬件技術也包括軟件技術。Graphcore將攜手合作伙伴為全球客戶部署IPU-POD256和IPU-POD128,客戶可以從云端或Atos等Graphcore的合作伙伴處獲取IPU-POD256和IPU-POD128。
Atos集團高級副總裁兼HPC和Quantum主管Agnès Boudot表示:“我們十分高興能將 IPU-POD128和IPU-POD256 加入到我們的Atos ThinkAI產(chǎn)品組合中,使我們的客戶能夠在眾多領域更快探索和部署更大、更具創(chuàng)新性的AI模型。”
(免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。
任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權或存在不實內(nèi)容時,應及時向本網(wǎng)站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內(nèi)容或斷開相關鏈接。 )