如今,我們正在見證計算領域巨大的創(chuàng)新階段,全球5G的快速部署與數(shù)據密集型工作負載以及生成型人工智能的突破性發(fā)展交織在一起。整個計算生態(tài)系統(tǒng)對靈活性的需求從未如此強烈,以創(chuàng)新和探索新型加速、新穎的系統(tǒng)架構以及滿足不斷增長的數(shù)據消費需求的新方法。半導體設計成本上升和全球能源預算收緊帶來的額外挑戰(zhàn)意味著我們正處于全球計算基礎設施轉型之中。
5G與人工智能的結合蘊藏著巨大的機遇。5G技術可以提供人工智能應用收集、傳輸和處理大量數(shù)據所需的高吞吐量、低延遲和可靠的連接。作為回報,人工智能可以幫助5G網絡動態(tài)分配資源、管理流量和檢測異常。人工智能還可以利用5G為用戶和設備提供個性化、情境化的智能服務。這兩項技術將共同真正改變我們的溝通、工作和生活方式。
但每個故事都有兩個方面。5G 和人工智能給數(shù)據中心運營商和客戶帶來了重大挑戰(zhàn),因為兩者都會產生大量數(shù)據,需要以靈活、及時、經濟和節(jié)能的方式存儲、處理和分析。為了充分利用這個機會,數(shù)據中心架構師需要圍繞計算的設計、構建和部署方式尋找變革性方法。
5G虛擬RAN:邊緣數(shù)據中心的關鍵推動者
支持5G的關鍵創(chuàng)新之一是虛擬無線接入網絡 (vRAN)。vRAN 是一種相對較新的部署模型,正在流行。它將蜂窩基帶處理功能與硬件解耦,并將其作為軟件在通用服務器上運行。
這可以在部署和管理5G網絡時提供更大的靈活性、可擴展性和效率。虛擬化5G基礎設施的規(guī)模經濟可以通過多種方式實現(xiàn)。第一,結合相同的計算基礎設施來服務5G連接和邊緣應用,使連接和數(shù)據處理更接近源;其次,軟件驅動的云原生基礎設施可實現(xiàn)動態(tài)資源分配、負載平衡、更快的配置和自動化網絡管理,這對運營效率產生巨大影響。第三,借助光纖連接,vRAN可以將多個基站匯集到一個集中式服務器池中,從而降低5G基礎設施的成本和復雜性。
通過使計算能力更接近最終用戶及其設備,vRAN可以促進邊緣計算,同時減少延遲并提高性能。
但為了充分發(fā)揮其潛力,vRAN需要計算平臺能夠支持高吞吐量、低延遲和確定性的無線電信號處理,同時保持非常高的計算效率。它還需要高速網絡接口來處理服務器、無線電和終端設備之間的大量數(shù)據流量,這進一步強調了對變革性方法的需求。
當今的5G數(shù)據中心:CPU和DPU
傳統(tǒng)通用CPU無法處理5G vRAN堆棧復雜且多樣化的工作負載。通過將所有網絡功能虛擬化為軟件,包括操作系統(tǒng)、網絡層、應用程序和協(xié)議,數(shù)據中心內的流量急劇增加,從而降低了CPU效率。為了應對這一挑戰(zhàn),CPU需要一個補充性的專用加速設備,可以卸載CPU的網絡任務,以提高性能和效率。當今5G數(shù)據中心最流行的加速設備之一是數(shù)據處理單元 (DPU)。
DPU是具有嵌入式處理器或可編程邏輯的網卡,可以執(zhí)行網絡功能,例如數(shù)據包處理、加密/解密、壓縮/解壓縮、負載平衡、防火墻、路由/交換和服務質量 (QoS)。DPU可以通過接管部分網絡相關任務來幫助降低服務器的CPU利用率和功耗,從而實現(xiàn)根據不同場景配置和優(yōu)化網絡功能的靈活性和可編程性。
異構計算為未來的工作負載增加了更多靈活性
雖然當今的5G數(shù)據中心已經利用CPU和DPU來支持vRAN和其他5G應用,但下一代5G數(shù)據中心將需要在硬件架構、軟件平臺和服務模型方面提供更大的靈活性。例如,數(shù)據中心可能使用GPU來處理復雜的數(shù)學、圖形、視頻或其他大型數(shù)據集;用于機器學習工作負載的GPU或TPU;以及用于可編程邏輯的FPGA,以解決更多自定義工作負載。
這種類型的異構計算有助于提高融合智能邊緣數(shù)據中心的性能、效率和可擴展性,這些數(shù)據中心可以提供更接近最終用戶的RAN服務、云計算能力和人工智能應用服務。最終,將更專業(yè)的計算移至更靠近設備和最終用戶的位置,可以改善延遲并實現(xiàn) 5G 所承諾的許多下一代用例。
軟銀、英偉達和Arm最近宣布合作,旨在為人工智能和高性能計算 (HPC) 創(chuàng)建世界上最先進的數(shù)據中心。它是當前此類數(shù)據中心轉型的最佳示例之一,具有專門的處理功能。此次合作預計將為基于Nvidia GH200 Grace Hopper超級芯片的生成式AI和5G/6G應用提供一個開創(chuàng)性的平臺,軟銀計劃在日本各地新的分布式AI 數(shù)據中心推出該平臺。與過去使用的數(shù)據中心相比,新數(shù)據中心的分布將更加均勻,并可處理人工智能和5G 工作負載。這將使他們能夠以低延遲更好地以峰值容量運行,并大幅降低總體能源成本。
軟銀將與Nvidia合作建立數(shù)據中心,為在全球范圍內快速部署生成式AI應用和服務鋪平道路,該數(shù)據中心可以在多租戶通用服務器平臺上托管生成式 AI 和無線應用,從而高效節(jié)能、降低成本并提供更多服務。
此類創(chuàng)新代表了5G和人工智能的重要拐點。整個數(shù)據中心圍繞專業(yè)處理提供的目標性能而構建,為運營商提供實現(xiàn)vRAN潛力所需的運營效率。此外,專業(yè)處理使運營商能夠在同一物理位置共同托管計算密集型服務,例如人工智能或3D視頻會議 - 更靠近數(shù)據,更靠近用戶。這一點至關重要,因為靈活性、低延遲和性能效率確保了計算資源及其所需資本和能源成本的最佳利用,從而改變了整個數(shù)據中心的TCO(總擁有成本)。
當我們展望下一代5G數(shù)據中心時,對靈活高效的計算平臺的需求至關重要。為了滿足在 5G 和人工智能的推動下對數(shù)據中心服務不斷增長的需求,下一代數(shù)據中心將被定義為適應新技術和工作負載的能力,并提供企業(yè)和消費者所需的性能和效率。因此,我們將繼續(xù)將高效、專業(yè)的芯片視為該領域創(chuàng)新和轉型的基礎。
本文作者:Panch Chandrasekaran
- 蜜度索驥:以跨模態(tài)檢索技術助力“企宣”向上生長
- 光網絡改造:通過減少包層光纖實現(xiàn)優(yōu)化
- 解鎖電源:了解UPS設計配置
- 利用先進的邊緣智能優(yōu)化電網
- 什么是不可變存儲或備份?
- 2025年能源和公用事業(yè)行業(yè)五大趨勢
- 揭開網絡交換機的強大力量:以太網連接的終極指南
- 千家早報|蘋果為AirPods開發(fā)多項健康功能;美的發(fā)布新品真省空氣能采暖機以及全屋智慧空氣解決方案——2024年12月24日
- 中國電信盒式波分代工集采,4家廠商中標
- 第二十五屆中國專利獎公示:中國移動、華為、中興入圍金獎
- 國家知識產權局:第二十五屆中國專利獎評審結果公示
免責聲明:本網站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網站出現(xiàn)的信息,均僅供參考。本網站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網站中的網頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。