精品国产亚洲一区二区三区|亚洲国产精彩中文乱码AV|久久久久亚洲AV综合波多野结衣|漂亮少妇各种调教玩弄在线

<blockquote id="ixlwe"><option id="ixlwe"></option></blockquote>
  • <span id="ixlwe"></span>

  • <abbr id="ixlwe"></abbr>

    騰訊李方超:光電融合創(chuàng)新解決方案全力支持MegaScaleOut

    1月16日消息(艾斯)AI時代已經(jīng)來臨。大模型等新興AI應(yīng)用需求海量的算力支撐,一座座智算中心拔地而起,規(guī)模龐大的萬卡集群逐漸投入商用。如何更好地實(shí)現(xiàn)智算中心互聯(lián),服務(wù)AI應(yīng)用創(chuàng)新發(fā)展,業(yè)界做了大量研究工作。

    1月16日,作為“2025中國光通信高質(zhì)量發(fā)展論壇”的開篇之作,“智算中心互聯(lián):算網(wǎng)協(xié)同,構(gòu)筑智算互聯(lián)新底座”線上研討會順利召開,會議邀約產(chǎn)業(yè)鏈專家代表,圍繞智算中心間跨地域、跨層級、跨主體、高可靠的算力協(xié)同與調(diào)度,以及智算中心互聯(lián)關(guān)鍵技術(shù)等話題展開了深入探討。

    騰訊光網(wǎng)絡(luò)架構(gòu)師李方超應(yīng)邀作了題為《 超大規(guī)模橫向擴(kuò)展網(wǎng)絡(luò)》的主題報告。在報告中,李方超針對AI大模型飛速發(fā)展對于網(wǎng)絡(luò)提出的全新挑戰(zhàn)與需求進(jìn)行了深入分析,并詳細(xì)介紹了騰訊針對網(wǎng)絡(luò)超大規(guī)模擴(kuò)展所打造的MegaScaleOut軟硬件創(chuàng)新解決方案。

    以算力換智力存在物理上限 跨IDC的ScaleOut成為剛需

    大模型的能力每2-3年就會上一個全新的臺階,同時伴隨著GPU規(guī)模相應(yīng)擴(kuò)大了數(shù)倍乃至數(shù)10倍。如今,大模型訓(xùn)練已從早期GPT3的千卡規(guī)模迅速擴(kuò)展至GPT5的10萬卡規(guī)模。顯然,AI的發(fā)展與GPU資源線性相關(guān)。不過,以算力替換智力天然存在物理資源上限。

    “從業(yè)務(wù)的需求與物理供給之間的矛盾可以推斷出,大園區(qū)的擴(kuò)展是必然的。”李方超在演講中介紹道,參考國際市場發(fā)展來看,以谷歌、微軟、Meta為代表的北美巨頭們正在積極布局算力園區(qū),這些Hyperscalers通過在自己的優(yōu)勢區(qū)域部署多個子園區(qū),以3-4個IDC的方式共建一個超大規(guī)模的算力集群,以此來實(shí)現(xiàn)對于電力的供應(yīng)和投資安全的保證。

    作為對比,在國內(nèi)環(huán)境中,如果想訓(xùn)練一個對標(biāo)GPT5或者Llama4的大模型,由于GPU的性能限制,我們可能需要更多的GPU來實(shí)現(xiàn)相同的算力。同時,隨著多模態(tài)訓(xùn)練的到來,不同型號、不同性能的GPU對應(yīng)不同類型的訓(xùn)練存在最優(yōu)選擇,這對于網(wǎng)絡(luò)的靈活和任務(wù)分配帶來了更多挑戰(zhàn)。此外,由于交付與工程的因素,會存在不同型號的GPU與不同廠商的GPU混布在同一個IDC的可能,這些最終會導(dǎo)致出現(xiàn)GPU碎片池化的問題。

    “因此,結(jié)合AI的發(fā)展和規(guī)模的限制,跨IDC的ScaleOut可能會成為剛需?!崩罘匠瑥?qiáng)調(diào)。

    跨IDC ScaleOut存在多重挑戰(zhàn) IP與光的融合成為最優(yōu)解

    他進(jìn)一步分析稱,當(dāng)進(jìn)入到DCI以后,收斂比與可靠將變成一個全新的挑戰(zhàn)。

    對于DCI出口而言,大象流是一個需要解決的問題。不過,通過優(yōu)化擁塞控制算法與擴(kuò)容帶寬等方式,便可以有效應(yīng)對高并發(fā)需求。更大的挑戰(zhàn)在于解決可靠性問題,這主要?dú)w因于跨機(jī)房之后對于光纜的不可控。相比傳統(tǒng)網(wǎng)絡(luò)來說,無損系統(tǒng)在帶寬下降的時候會直接影響算力能力,網(wǎng)絡(luò)抖動與丟包也會直接影響RDMA的性能,光纜故障與抖動成為新的變數(shù)。

    “根據(jù)我們的測算,在丟包0.1%數(shù)據(jù)的情況下,RDMA的吞吐量會下降10%,因此從機(jī)房內(nèi)到機(jī)房間,對于跨IDC的場景,帶寬充裕、鏈路可靠是必備的基本需求?!崩罘匠窒砹艘唤M詳細(xì)的測試數(shù)據(jù),并指出無法簡單通過光纜與設(shè)備來換取可靠性的絕對提升,其中深層次的原因在于“交換機(jī)無法實(shí)時預(yù)見到即將到來的劣化和故障”。

    于是,騰訊光網(wǎng)絡(luò)團(tuán)隊意識到,如果可以讓交換機(jī)快速地了解物理層到底發(fā)生了什么,使交換機(jī)有時間去提前執(zhí)行預(yù)定好的策略,并規(guī)避物理層的一些變化,這對于IDC的無損網(wǎng)絡(luò)來說非常有意義。因此,該團(tuán)隊提出,IP與光的融合是跨園區(qū)無損網(wǎng)絡(luò)的最優(yōu)解。

    李方超談到,“針對IP over DWDM,我們正積極推動光器件的小型化與標(biāo)準(zhǔn)化,也即微光學(xué)模塊。這一次我們將通過這些創(chuàng)新,讓IP與光可以真正地拉近,實(shí)現(xiàn)打破硬件的隔閡,完成真正的融合。通過相干芯片與交換芯片的融合創(chuàng)新,我們讓交換機(jī)具備了物理層健康度的評估能力,為跨IDC的Scaleout做好了一切準(zhǔn)備。”

    此外,他還詳細(xì)介紹了騰訊在ODCC立項的MegaScaleOut項目組,及其在IP over DWDM當(dāng)中的全新硬件DTS在解決DCI可靠性問題方面的應(yīng)用,以及通過OCS全光交換設(shè)備解決DCI側(cè)應(yīng)用解決容量按需分配的應(yīng)用。

    免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實(shí),并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實(shí)內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

    2025-01-16
    騰訊李方超:光電融合創(chuàng)新解決方案全力支持MegaScaleOut
    騰訊李方超:光電融合創(chuàng)新解決方案全力支持MegaScaleOut,C114訊 1月16日消息(艾斯)AI時代已經(jīng)來臨。大模型等新興AI應(yīng)用需求海量的算力支撐,一座座智

    長按掃碼 閱讀全文