3月20日消息,亞馬遜云科技和英偉達(dá)宣布,英偉達(dá)在2024年GTC大會(huì)上推出的新一代NVIDIA Blackwell GPU平臺(tái)即將登陸亞馬遜云科技。亞馬遜云科技將提供NVIDIA GB200 Grace Blackwell Superchip和 B100 Tensor Core GPU。
英偉達(dá)Blackwell在亞馬遜云科技上的應(yīng)用,使得該平臺(tái)在應(yīng)對(duì)資源密集型和數(shù)萬億參數(shù)語言模型等推理工作負(fù)載加速方面實(shí)現(xiàn)了巨大飛躍。
NVIDIA GB200 Grace Blackwell Superchip和 B100 Tensor Core GPU是英偉達(dá)剛剛在2024年GTC大會(huì)推出的最新GPU產(chǎn)品。
新的NVIDIA B200 GPU 由 2080 億個(gè)晶體管組成,而NVIDIA GB200 包含了兩個(gè) B200 GPU 和一個(gè) Grace CPU。
Blackwell 在單芯片訓(xùn)練方面的 FP8 性能是其上一代架構(gòu)的 2.5 倍,在推理方面的 FP4 性能是其上一代架構(gòu)的 5 倍。在具有 1750 億個(gè)參數(shù)的 GPT-3 大語言模型基準(zhǔn)測(cè)試中,GB200 性能是 H100 的 7 倍,訓(xùn)練速度是 H100 的 4 倍,成本和能耗上GB200 比 H100 降低了 25 倍。
據(jù)介紹,亞馬遜云科技將提供配置GB200 NVL72的英偉達(dá)Blackwell平臺(tái),它配備72顆Blackwell GPU和36顆Grace CPU,通過第五代NVIDIA NVLink互連。當(dāng)與亞馬遜云科技的EFA網(wǎng)絡(luò)、Amazon Nitro高級(jí)虛擬化系統(tǒng)和Amazon EC2 UltraClusters超大規(guī)模集群等技術(shù)結(jié)合時(shí),客戶能夠輕松擴(kuò)展至數(shù)千個(gè)GB200 Superchips。
NVIDIA GB200 NVL72 是一種多節(jié)點(diǎn)、液冷、機(jī)架級(jí)系統(tǒng),利用 Blackwell 為萬億參數(shù)模型提供強(qiáng)力計(jì)算,在單個(gè)機(jī)架中可實(shí)現(xiàn) 720 petaflops 的 AI 訓(xùn)練性能和1.4 exaflops 的AI推理性能。
在安全性方面,亞馬遜云科技的Nitro 系統(tǒng)、Amazon KMS、EFA加密 和 Blackwell 加密的集成將為客戶提供對(duì)其訓(xùn)練數(shù)據(jù)和模型權(quán)重的端到端控制,從而為客戶在亞馬遜云科技上的生成式AI應(yīng)用程序提供更強(qiáng)的安全性。
Blackwell也加入了雙方合作的Project Ceiba項(xiàng)目,該項(xiàng)目專為NVIDIA自身的AI研發(fā)工作設(shè)計(jì),是一臺(tái)亞馬遜云科技上托管的采用DGX Cloud的AI超級(jí)計(jì)算機(jī),它搭載了20,736顆GB200 Superchips芯片,并通過第四代EFA網(wǎng)絡(luò)擴(kuò)展,為每個(gè)Superchip提供高達(dá)800 Gbps的低延遲、高帶寬網(wǎng)絡(luò)吞吐量,能夠提供414 exaflops的計(jì)算能力,與之前計(jì)劃在Hopper架構(gòu)上構(gòu)建Ceiba相比,性能提升了6倍。
同時(shí),亞馬遜云科技與英偉達(dá)聯(lián)手,通過Amazon SageMaker與NVIDIA NIM推理微服務(wù)的整合,提供了高性能、低成本的生成式AI推理解決方案,該服務(wù)作為NVIDIA AI企業(yè)版的一部分提供??蛻艨梢岳眠@一組合在Amazon SageMaker中快速部署和運(yùn)行已預(yù)編譯且對(duì)NVIDIA GPU進(jìn)行優(yōu)化的基礎(chǔ)模型,縮短生成式AI應(yīng)用的推出時(shí)間。
亞馬遜云科技與英偉達(dá)還在利用計(jì)算機(jī)輔助的藥物發(fā)現(xiàn)領(lǐng)域進(jìn)行合作拓展,推出了新的NVIDIA BioNeMo基礎(chǔ)模型,用于生成化學(xué)、蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè),以及理解藥物分子與目標(biāo)的相互作用。這些新模型將很快在Amazon HealthOmics上提供,這是一個(gè)專為幫助醫(yī)療保健和生命科學(xué)組織存儲(chǔ)、查詢和分析基因組、轉(zhuǎn)錄組及其他組學(xué)數(shù)據(jù)而設(shè)計(jì)的專用服務(wù)。
Amazon HealthOmics和英偉達(dá)醫(yī)療保健團(tuán)隊(duì)還合作推出生成式AI微服務(wù),以推進(jìn)藥物發(fā)現(xiàn)、醫(yī)療技術(shù)和數(shù)字健康領(lǐng)域的發(fā)展,該服務(wù)提供一個(gè)新的GPU加速的云端服務(wù)目錄,涵蓋生物學(xué)、化學(xué)、成像和醫(yī)療保健數(shù)據(jù),以便醫(yī)療企業(yè)能夠在亞馬遜云科技上利用生成式AI的最新成果。
亞馬遜云科技首席執(zhí)行官Adam Selipsky表示:“我們雙方的深入合作可以追溯到13年前,當(dāng)時(shí)我們共同推出了世界上第一個(gè)亞馬遜云科技上的GPU云實(shí)例,而今天我們?yōu)榭蛻籼峁┝俗顝V泛的英偉達(dá)GPU解決方案。英偉達(dá)的下一代Grace Blackwell處理器是生成式AI和GPU計(jì)算領(lǐng)域的標(biāo)志性事件。當(dāng)結(jié)合亞馬遜云科技強(qiáng)大的EFA網(wǎng)絡(luò)、Amazon EC2 UltraClusters的超大規(guī)模集群功能,以及我們獨(dú)有的Amazon Nitro高級(jí)虛擬化系統(tǒng)及其安全功能時(shí),我們就能夠使客戶更快、更大規(guī)模且更安全地構(gòu)建和運(yùn)行具有數(shù)萬億參數(shù)的大型語言模型。”(果青)
- 標(biāo)配天神之眼高階智駕 比亞迪全新MPV夏正式上市:24.98萬元起
- 消息稱豐田第13代卡羅拉或?qū)⒉捎帽葋喌螪M-i插混技術(shù)
- 天貓與銀聯(lián)達(dá)成合作 無需跳轉(zhuǎn)即可領(lǐng)取云閃付政府補(bǔ)貼
- 京東超市聯(lián)合黑龍江商務(wù)廳上線東北特色年貨會(huì)場(chǎng)
- 網(wǎng)宿旗下綠色云圖、山東省??圃?、巴斯夫、禾泰科技成立聯(lián)合實(shí)驗(yàn)室,將研發(fā)生物可降解冷卻液
- 京東PLUS會(huì)員權(quán)益再升級(jí):無限免郵、180天只換不修、“買1得5”超級(jí)聯(lián)名卡
- 手機(jī)、平板電腦補(bǔ)貼來了:相當(dāng)于打八五折,每件不超過500元
- 《大奉打更人》海外同步上線 被翻譯成13種語言播出
- 劉強(qiáng)東給老家村民發(fā)年貨,喊村民開車來拉
- 網(wǎng)易捐贈(zèng)800萬元物資 馳援西藏
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。