在AI浪潮推動下,大量新奇的AI應(yīng)用迅猛而生。但這些應(yīng)用非常場景化,既需要成熟的CPU和GPU,也需要全新的AI處理器。IPU(Intelligence Processing Unit)就是一種為AI計算而生的革命性架構(gòu),如今,IPU已經(jīng)在金融、醫(yī)療、電信、機器人、云和互聯(lián)網(wǎng)等領(lǐng)域取得成效。
近日,英國初創(chuàng)公司Graphcore發(fā)布了第二代IPU以及用于大規(guī)模系統(tǒng)級產(chǎn)品IPU-Machine: M2000(IPU-M2000),新一代產(chǎn)品具有更強的處理能力、更多的內(nèi)存和內(nèi)置的可擴展性,可處理極其龐大的機器智能工作負載。據(jù)了解,IPU-M2000可構(gòu)建成IPU-POD64這一Graphcore全新模塊化機架規(guī)模解決方案,可用于極大型機器智能橫向擴展,提供前所未有的AI計算可能性,以及完全的靈活性和易于部署的特性。它可以從一個機架式本地系統(tǒng)擴展到高度互連的超高性能AI計算設(shè)施中的1000多個IPU-POD64系統(tǒng)。
這款即插即用的機器智能刀片式計算單元能有出眾的性能,得益于Graphcore全新的7nm Colossus MK2(也叫IPU GC200),并由Poplar軟件棧提供全面支持。
可不要小看那這塊IPU,它是臺積電7nm工藝的成果,晶體管數(shù)量高達594億個,裸片面積達到823平方毫米。這比兩個月前英偉達最新發(fā)布的安培架構(gòu)GPU A100的540億個晶體管增加了10%。
IPU是一種全新的大規(guī)模并行處理器,此前報道,他們已經(jīng)推出了基于臺積電16nm工藝集成236億個晶體管的GC2 IPU,120瓦的功耗下有125TFlops的混合精度、300M的SRAM能夠把完整的模型放在片內(nèi)。
據(jù)介紹,Graphcore最新的MK2對三大技術(shù)——計算、數(shù)據(jù)、通信進行了顛覆性突破:
1.計算
Mk2 GC200處理器是比較復(fù)雜的單一處理器,基于臺積電7nm技術(shù),集成了將近600億個晶體管,擁有250TFlops AI-Float的算力和900MB的處理器內(nèi)存儲。處理器內(nèi)核從上一代1217提升到了1472個獨立處理器內(nèi)核,從而達到有近9000個單獨的并行線程。相對于第一代產(chǎn)品,其系統(tǒng)級的性能提升了8倍以上。
說到處理內(nèi)存,可大致分為兩部分:一部分是程序存儲(program Memory);另一部分是模型存儲空間(Available Memory);當時的MK1擁有300MB SRAM,算是單一芯片里面最大的存儲容量,在相同承訓(xùn)存儲空間下,MK2擁有更大的Available Memory,相當于6倍以上的處理器內(nèi)有效存儲,大大提高了運算效率。這也使得每個IPU Memory的帶寬是47.5TB/s。同時還包含IPU-Exchange以及PCI Gen4跟主機交互接口;互聯(lián)速度(IPU-Links)也達到了320GB/s。
一個M2000的盒子里集成了4個GC200處理器,具有1PFlops16.16的算力,和近6000個處理器核心,以及超過35000個并行線程,In-Processor Memory達到3.6GB,450GB Exchange Memory。
1234下一頁>(免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關(guān)資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責任。
任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )