11月29日消息,在美國(guó)時(shí)間周二舉辦的Reinvent大會(huì)上,亞馬遜旗下的云計(jì)算部門AWS發(fā)布了新的人工智能(AI)芯片,供客戶構(gòu)建和運(yùn)行人工智能應(yīng)用程序,并計(jì)劃提供英偉達(dá)的最新芯片。
AWS正試圖以各種高性價(jià)比的選擇脫穎而出,成為云服務(wù)提供商。不過(guò),它不會(huì)只銷售廉價(jià)的亞馬遜品牌產(chǎn)品。就像亞馬遜的在線零售市場(chǎng)一樣,亞馬遜的云計(jì)算服務(wù)也將提供來(lái)自其他供應(yīng)商的頂級(jí)產(chǎn)品,包括頂級(jí)人工智能芯片制造商英偉達(dá)的GPU。
自人工智能初創(chuàng)企業(yè)OpenAI去年發(fā)布ChatGPT聊天機(jī)器人以來(lái),英偉達(dá)GPU的需求就不斷飆升。ChatGPT聊天機(jī)器人具有總結(jié)信息和撰寫(xiě)類似真人文本的能力,令人們驚嘆不已。這導(dǎo)致英偉達(dá)的芯片短缺,因?yàn)楦骷夜径荚诟?jìng)相將類似的生成式人工智能技術(shù)整合到自己的產(chǎn)品中。
亞馬遜選擇了雙管齊下戰(zhàn)略,既生產(chǎn)自己的芯片,又允許客戶使用英偉達(dá)的最新芯片,這可能會(huì)幫助它對(duì)抗云計(jì)算領(lǐng)域的頭號(hào)競(jìng)爭(zhēng)對(duì)手微軟。本月早些時(shí)候,微軟也采取了類似的做法,發(fā)布了其首款人工智能芯片Maia 100,并表示Azure云將采用英偉達(dá)H200 GPU。
具體來(lái)說(shuō),AWS表示,它將提供英偉達(dá)最新H200人工智能圖形處理單元。該公司還發(fā)布了新的Trainium2人工智能芯片和通用Graviton4處理器。
新的H200 GPU是H100的升級(jí)版,OpenAI曾使用H100來(lái)訓(xùn)練其最先進(jìn)的大語(yǔ)言模型GPT-4。大型公司、初創(chuàng)公司和政府機(jī)構(gòu)都在爭(zhēng)奪有限的芯片供應(yīng),這意味著從亞馬遜等云服務(wù)提供商那里租用芯片的需求也很高。英偉達(dá)表示,H200的輸出速度將是H100的近兩倍。
亞馬遜自己的Trainium2芯片是為訓(xùn)練人工智能模型而設(shè)計(jì)的,包括支持OpenAI ChatGPT等人工智能聊天機(jī)器人及其競(jìng)爭(zhēng)對(duì)手運(yùn)行的基礎(chǔ)模型。亞馬遜表示,初創(chuàng)公司Databricks和OpenAI的競(jìng)爭(zhēng)對(duì)手、亞馬遜支持的Anthropic計(jì)劃用新的Trainium2芯片構(gòu)建模型,新模型的性能將比原來(lái)的模型提高四倍。
Graviton4處理器基于Arm架構(gòu),比英特爾或AMD的芯片能耗更低。Graviton4承諾比現(xiàn)有的Graviton3芯片性能提高30%,從而實(shí)現(xiàn)AWS所說(shuō)的更高的價(jià)格產(chǎn)出。由于通貨膨脹率始終高于往常,這促使央行提高利率,那些希望繼續(xù)使用AWS,但為降低云服務(wù)賬單以更好應(yīng)對(duì)經(jīng)濟(jì)問(wèn)題的組織可能希望考慮遷移到Graviton上。
亞馬遜表示,超過(guò)5萬(wàn)名AWS客戶已經(jīng)在使用Graviton芯片。
最后,作為與英偉達(dá)加深合作關(guān)系的一部分,AWS表示,它將運(yùn)營(yíng)超過(guò)16000顆英偉達(dá)GH200 Grace Hopper超級(jí)芯片,這些芯片包含英偉達(dá)GPU和基于Arm架構(gòu)的通用處理器。英偉達(dá)自己的研發(fā)團(tuán)隊(duì)和AWS客戶都將能夠利用這一基礎(chǔ)設(shè)施。
自2006年推出用于計(jì)算和存儲(chǔ)數(shù)據(jù)的EC2和S3服務(wù)以來(lái),AWS已經(jīng)推出了200多種云產(chǎn)品。當(dāng)然,并不是所有服務(wù)都大獲成功,有些版本已經(jīng)很長(zhǎng)時(shí)間沒(méi)有更新,而少數(shù)版本已經(jīng)停產(chǎn),從而讓亞馬遜釋放并重新分配資源。然而,該公司仍在繼續(xù)投資Graviton和Trainium項(xiàng)目,這表明亞馬遜已經(jīng)意識(shí)到了需求。
AWS沒(méi)有宣布搭載英偉達(dá)H200芯片的虛擬機(jī)實(shí)例的發(fā)布日期,也沒(méi)有宣布使用其Trainium2芯片的虛擬機(jī)實(shí)例的發(fā)布日期。不過(guò),客戶現(xiàn)在就可以開(kāi)始測(cè)試Graviton4的虛擬機(jī)實(shí)例,幾個(gè)月后就可以投入商業(yè)使用。(小小)
(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。 )