2024 年 Nvidia GTC 大會涵蓋了圍繞 AI 時代的主題,這引出了以下總體問題:各行業(yè)組織的云和 IT 基礎設施是否已為 AI 的未來做好準備?
在主題演講中,Nvidia 首席執(zhí)行官黃仁勛在加州圣何塞 SAP 中心向觀眾發(fā)表了兩個小時的演講。演講的亮點是新的Blackwell GPU 平臺,該平臺旨在在萬億參數(shù)大語言模型上運行實時生成 AI。每個 Blackwell 芯片提供 2080 億個晶體管,最新版本的 NVLink 提供 1.8TBps 的雙向吞吐量。
這一最新聲明激發(fā)了人們對人工智能潛力的日益興奮。根據(jù)TechTarget 的企業(yè)戰(zhàn)略集團研究,54% 的組織將在未來一年內(nèi)擁有或預計將擁有生成式人工智能。
然而,盡管有這么多令人興奮的事情,Nvidia GTC 上展示的技術規(guī)模也應該讓任何企業(yè)決策者三思而行。在做出任何決定之前,先問問自己:是否需要這種級別的技術?能負擔得起嗎?如何根據(jù)自己的組織和用例調(diào)整我 AI 基礎設施投資規(guī)模?
盡管 GPU 技術有時會供不應求,但可用的基礎設施選項卻并不短缺。三大公共云提供商 AWS、Google Cloud Platform 和 Microsoft Azure 在 Nvidia GTC 期間宣布計劃利用新的 Blackwell 技術。
這些公共云服務為組織提供了利用最新 GPU 技術的選擇,而無需在本地采購和部署基礎設施。雖然預計云應用將大量采用,但 AI 和生成式 AI 工作負載正在推動本地基礎設施的復興。
根據(jù)研究,78% 的企業(yè)表示他們更愿意將高價值的專有數(shù)據(jù)保存在自己的數(shù)據(jù)中心。人工智能計劃的成功取決于數(shù)據(jù),企業(yè)希望將人工智能工作負載部署到更靠近數(shù)據(jù)所在位置,以降低成本并加快價值實現(xiàn)時間。
因此,基礎設施提供商正在積極致力于通過提供將其技術與 Nvidia 的技術相結(jié)合的集成和經(jīng)過驗證的基礎設施產(chǎn)品來加快 AI 計劃的價值實現(xiàn)時間。
在展廳里,大家看到了戴爾科技、DataDirect Networks、日立 Vantara、Hammerspace、Liqid、Pure Storage、Vast Data 和 Weka 的產(chǎn)品。每款產(chǎn)品都旨在簡化 Nvidia 技術的部署和集成,同時加快 AI 計劃的價值實現(xiàn)時間。盡管目的相似,但這些產(chǎn)品針對的是成本最小。雖然檢索增強生成等技術可以降低現(xiàn)有模型出現(xiàn)幻覺的可能性,但之前的不良體驗可能會阻礙內(nèi)部用戶對 AI 項目的熱情。
用例識別至關重要,因為基礎設施需求可能會因所用數(shù)據(jù)的規(guī)模、用于訓練模型的參數(shù)數(shù)量以及你計劃開發(fā)自己的模型還是使用自己的數(shù)據(jù)增強現(xiàn)有模型而有很大差異。使用現(xiàn)成模型的檢索增強生成也可以使基礎設施投資比人們預期的要輕得多。
在確定用例時,組織可以利用不斷壯大的服務合作伙伴生態(tài)系統(tǒng)來確定正確的策略。此外,戴爾科技等基礎設施提供商正在通過補充咨詢服務組合來增強其基礎設施選項,以幫助組織識別和定義用途,以及準備其數(shù)據(jù)以用于 AI 計劃。
人工智能和生成式人工智能有望改變整個商業(yè)格局。鑒于最新 Nvidia 技術的強大功能,很容易讓人不知所措。但不要驚慌,人工智能計劃通常可以從合理的基礎設施投資開始。重要的是確定正確的用途和數(shù)據(jù)集,并在流程早期利用合作伙伴。
- 蜜度索驥:以跨模態(tài)檢索技術助力“企宣”向上生長
- 400G:骨干網(wǎng)的最新趨勢
- 三大運營商11月成績單:用戶數(shù)據(jù)增幅放緩
- 2025年數(shù)字錢包:重塑金融生態(tài)的領先應用
- 量子計算:商業(yè)世界的新前沿與設計思維的融合
- 什么是聚合交換機?
- 電池技術如何影響車輛性能
- 千家早報|庫克稱蘋果從未考慮過AI收費;OpenAI GPT-5“難產(chǎn)”:訓練6個月花費5億美元,已落后原計劃半年——2024年12月23日
- 中國電信再次出讓三家金融機構(gòu)股權 價值規(guī)模近10億
- 中國移動無源器件產(chǎn)品集采:規(guī)模為1807.93萬件
- 中國移動分天線產(chǎn)品集采:規(guī)模為1588.82萬面
免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權或存在不實內(nèi)容時,應及時向本網(wǎng)站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內(nèi)容或斷開相關鏈接。