6月8日消息(焦焦)ChatGPT引爆了人工智能(AI)/機器學習(ML)新的需求高潮,當前GPU互聯(lián)端口已采用800G(2x400G),下一代會演進到1.6T(2x800G),數(shù)據(jù)中心對光互聯(lián)的帶寬需求越來越高。在昨日舉辦的2023年中國光通信高質(zhì)量發(fā)展論壇系列“數(shù)據(jù)中心光互聯(lián)技術研討會”上,凌云光解決方案總監(jiān)張華博士與行業(yè)同仁分享了在當今數(shù)字化轉(zhuǎn)型的時期, “軟件定義全光交換在高性能計算和數(shù)據(jù)中心應用”。
Al/ML集群互聯(lián)對HPC和數(shù)據(jù)中心互聯(lián)提出新挑戰(zhàn)
伴隨著帶寬增長,AI/ML集群規(guī)模從幾百張加速卡到上萬張擴展,集群互聯(lián)距離從數(shù)十米到上百米延伸,Al/ML集群互聯(lián)對低功耗和低延遲需求迫切,現(xiàn)有電交換面臨瓶頸。由此,也對HPC的發(fā)展提出了更高要求:第一、HPC集群規(guī)模需要靈活配置;第二、HPC網(wǎng)絡要求長期穩(wěn)定運行。
此外,大規(guī)模數(shù)據(jù)中心互聯(lián)也面臨著新的挑戰(zhàn):挑戰(zhàn)一:Spine交換機成為性能瓶頸;挑戰(zhàn)2:隨著端口速率從100G->200G->400G->800G演進,能效提升進入平臺期。
OCS全光交換方案適配新挑戰(zhàn)
OCS全光交換方案可以很好應對上述需求和挑戰(zhàn)。OCS具備全光交換優(yōu)點,光信號完全透明傳輸,支持光纖中任意速率/任意調(diào)制格式/任意通信波長光信號交換,具有無時鐘抖動,無延遲,不讀取數(shù)據(jù),無泄漏風險等特點,也支持SDN使能控制。目前在以Google為代表的TPUv4高性能計算中心和Jupiter數(shù)據(jù)中心已成功應用。
基于OCS全光交換有效提升了Google TPU v4集群互聯(lián)可靠性,在主機可靠性降到99.0%仍能保證TPU切片有較好的性能,可使系統(tǒng)的性能提升6倍以上。在取得以上這些收益的同時,光交換互聯(lián)方案包括OCS、光模塊及光纖占總體超算節(jié)點成本<5%、功耗<3%。
Google Jupiter數(shù)據(jù)中心網(wǎng)絡方案在Spine層引入光線路交換(OCS),采用SDN動態(tài)調(diào)整拓撲路由適配,流量工程可適應秒~分鐘級變化;拓撲工程可適應以天為單位變化,適配異質(zhì)速率和實時應用通信模式??捎糜诖罅髁客負渲貥?、網(wǎng)絡擴容、多速率共存等場景。從收益方面看,網(wǎng)絡CAPEX降低30%,功耗下降40%。Fabric拓撲重構速度提升10倍以上。流完成時間(FCT)提升10%,吞吐量提升30%。
OCS全光交換技術應用廣泛,前景不容小覷
張華表示,從上述兩個Google方案中已經(jīng)全面的展示了OCS全光交換技術優(yōu)勢。目前OCS全光交換應用較廣泛的核心技術主要包括:DirectLight技術、2D/3D MEMS技術以及其他光開關技術。
其中,DirectLight技術采用壓電陶瓷材料帶動準直器旋轉(zhuǎn),空間直接耦合對準(“針尖對麥芒”),實現(xiàn)任意端口光路切換,目前矩陣規(guī)模最大574x574。DirectLight技術的最要特點為:插損等光學性能指標優(yōu)異,抗震性佳(可抗里氏8級以上地震),能實現(xiàn)靈活的光信號交換,支持“暗光纖(無光)”模式下光信號單路雙向?qū)鞯取?/p>
基于DirectLight壓電陶瓷技術的矩陣光開關自從2003年商用化以來,已經(jīng)廣泛應用于各種場合,例如智能監(jiān)控系統(tǒng)、國際空間站、數(shù)據(jù)中心/超算中心等等。目前累計現(xiàn)網(wǎng)運行時間150億+端口小時,4500+套系統(tǒng)已鋪設,300+個客戶在使用。其穩(wěn)定性和可靠性已經(jīng)得到充分驗證。
最后,張華總結到,隨著數(shù)據(jù)中心OCS應用進一步下沉(Spine->Leaf),需要更快切換速度、小端口低成本OCS,能適配TOR與匯聚交換機之間突發(fā)流量。未來隨著集群規(guī)模擴展,將需要更大端口OCS,同時需提升OCS可靠性和插回損性能,DirectLight OCS技術方案會有更廣闊應用前景。
- 蜜度索驥:以跨模態(tài)檢索技術助力“企宣”向上生長
- 聯(lián)特科技五大股東全部完成股份減持目標
- 武漢郵科院將烽火科技92.6905%股權劃轉(zhuǎn)至中國信科集團
- 四川聯(lián)通中標雅安電信投訴,結果是損人不利己
- 神州數(shù)碼信息系統(tǒng)進軍采暫停名單
- 盤點中國鐵塔2024:創(chuàng)立十年,兩翼展翅
- 中國工程院院士張平:未來通信要深刻理解ComAI與語義通信
- 數(shù)據(jù)中心技術革新與基礎設施升級指南
- 私有邊緣AI和5G如何支持新的工業(yè)4.0應用
- 無人機技術在提高農(nóng)田生產(chǎn)力方面的作用
- 2024年運營商集采盤點:夯實5G基礎建設,全力推進智能化進程
免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權或存在不實內(nèi)容時,應及時向本網(wǎng)站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內(nèi)容或斷開相關鏈接。