PCIE5存儲時代關(guān)鍵趨勢:EDSSF、QLC、SCM、CXL、云定義存儲
數(shù)據(jù)中心通訊的“5G新標(biāo)準(zhǔn)”
根據(jù)IDC數(shù)據(jù)顯示,到2025年,全球數(shù)據(jù)圈總量將激增至175ZB,而根據(jù)二八法則,到2025年全球數(shù)據(jù)圈中將有35ZB的高價值熱數(shù)據(jù),會一刻不停的處于運轉(zhuǎn)狀態(tài)中,能否支撐起這些海量最熱化的高價值數(shù)據(jù),將決定了全球數(shù)字經(jīng)濟的發(fā)展效率。
在5G、元宇宙、高頻線上交易等低延時海量實時數(shù)據(jù)處場景的背后是以服務(wù)器、網(wǎng)絡(luò)、存儲等ICT 設(shè)備不間斷管理和運營的基礎(chǔ)設(shè)施。而PCIe 5.0正是數(shù)據(jù)中心高頻海量低延時海量實時數(shù)據(jù)通訊的新標(biāo)準(zhǔn)。
PCI-SIG此前給出PCIe的帶寬增長趨勢。2020-2021期間,PCIe4.0-5.0作為PCIe3.0的更新版本陸續(xù)出現(xiàn)并量產(chǎn)。在從 PCIe 4.0 到 PCIe 5.0 的過渡中,速度翻倍、向后兼容和加速發(fā)布周期是構(gòu)建實施策略的三個基本支柱。
數(shù)據(jù)中心的核心包括網(wǎng)絡(luò)通信(網(wǎng)卡等)、計算(CPU)與存儲(SSD與HDD)。
在網(wǎng)絡(luò)層面,目前在網(wǎng)絡(luò)IO已有400G的解決方案,然而自PCIe 5.0 標(biāo)準(zhǔn)2019年發(fā)布至今,仍未得以大規(guī)模商用推廣,關(guān)鍵為缺乏PCIe 5.0 CPU及存儲硬件方案生態(tài),尤其是以PCIe 5.0 CPU為核心的服務(wù)器平臺。
數(shù)據(jù)中心CPU行業(yè)龍頭AMD及Intel都計劃將于2022年下半年發(fā)布支持PCIe 5.0的Sapphire Rapids和Zen4服務(wù)器級別主控平臺,預(yù)計2023年,其他CPU廠商將陸續(xù)跟隨,2023年下半年P(guān)CIe5的服務(wù)器應(yīng)用將開始逐步成為主流。
PCIe 5.0時代的數(shù)據(jù)中心存儲基礎(chǔ)設(shè)施-SSD
PCIe 5.0.0對于存儲與計算之間的意義是,算得快需要存得及時,才可以真正滿足海量實時數(shù)據(jù)處理/存儲的需求。與現(xiàn)在的PCIe 4.0相比,PCIe 5.0單通道速率翻倍到了32GT/s,大約是4GB/s,SSD硬盤主控通常是PCIe 5.0 x4,速度理論上可達(dá)16GB/s,相比現(xiàn)在的PCIe 4.0硬盤提升一倍。固態(tài)硬盤是否支持PCIe 5.0,與SSD主控芯片及固件直接相關(guān)。
SSD(固態(tài)硬盤)通過SSD 主控PCIe接口將I/O命令和響應(yīng)映射到主機的共享內(nèi)存,支持多核CPU處理器并行I/O,以促進(jìn)高吞吐量,緩解CPU的壓力。同時,利用并行數(shù)據(jù)路徑,在加速方面提供更好的性能,通過與PCIe接口的結(jié)合,使得數(shù)據(jù)通過NVMe協(xié)議直接與CPU相連,從而達(dá)到低延時性。
全球最早發(fā)布PCIe 5.0 SSD主控方案為2021年5月末發(fā)布的Marvell Bravera SC5,最高 14 GB/s 的傳輸速度,高達(dá) 200 萬 IOPS 的隨機性能。官方表示,SC5 系列主控可以滿足云數(shù)據(jù)中心的需求,為實時應(yīng)用實現(xiàn)超低延遲運行。2021年12月,三星宣布成功研發(fā)新一代用于企業(yè)服務(wù)器的PM1743固態(tài)硬盤,采用最新的PCIe 5.0接口和三星第六代V-NAND閃存技術(shù),PM1743的順序讀寫速度達(dá)到13GB/s,隨機讀取速度達(dá)到2500K IOPS,鎧俠最近也展示過PCIe 5.0硬盤的性能,下代硬盤的讀取速度達(dá)到了14GB/s,寫入也有7GB/s。
國內(nèi)廠商亦紛紛發(fā)布PCIe 5.0 SSD主控方案,包括江蘇華存、英韌科技、庫瀚科技等,其中庫瀚科技發(fā)布的Aurora為全球首款基于RISC-V架構(gòu)的PCIe 5.0企業(yè)級SSD主控。從各家發(fā)布信息匯總整理來看,可見以下行業(yè)發(fā)展趨勢:
PCIe 5.0 SSD 企業(yè)級將先于消費級實現(xiàn)大規(guī)模商用
SSD業(yè)內(nèi)人士的看法認(rèn)為,目前消費級SSD還在處于PCIe 3.0向PCIe 4.0升級的階段,PCIe 5.0普及要晚上一兩年到,要到2024年才會在消費級市場上出貨。而在企業(yè)級高性能場景可承受新技術(shù)標(biāo)準(zhǔn)相對較高的基礎(chǔ)設(shè)施成本,PCIe 5.0 企業(yè)級SSD有望2023年開始得以全面應(yīng)用普及。
目前,英特爾、三星、庫瀚科技、英韌科技等,明確已發(fā)布的PCIe5 SSD主控是面向企業(yè)級服務(wù)器場景,而群聯(lián)的PCIe5方案從發(fā)布信息來看,應(yīng)主要聚焦高端消費級SSD市場。
無論消費級還是企業(yè)級,從各家發(fā)布的測試數(shù)據(jù)來看,標(biāo)稱性能幾乎都可接近14GB/s的讀寫速度,但這是由PCIe 5.0的通訊標(biāo)準(zhǔn)決定的,單從最高性能上,并不能完全體現(xiàn)各家產(chǎn)品性能優(yōu)劣。企業(yè)級與消費級最大的分別在于,需要更復(fù)雜的主控系統(tǒng)架構(gòu)實現(xiàn)在企業(yè)級高性能荷載場景下(如觸發(fā)垃圾回收策略等)能保證高穩(wěn)態(tài)的性能。
目前各家發(fā)布的產(chǎn)品都未見商業(yè)化供應(yīng),未見PCIe 5.0 企業(yè)級SSD相關(guān)穩(wěn)態(tài)性能數(shù)據(jù)的第三方測試數(shù)據(jù),在庫瀚Aurora主控的相關(guān)發(fā)布信息上,有透露了部分PCIe4平臺測試場景下數(shù)據(jù),其穩(wěn)態(tài)性能已可實現(xiàn)500K IOPS,這對目前主流的PCIe4 SSD而言,已有25%以上的性能提升。
大容量密度存儲時代到臨,GB/W將大幅降低
PCIE 5.0時代傳統(tǒng)U.2/AIC 規(guī)格的SSD已無法滿足技術(shù)需求,要實現(xiàn)大容量、更低的每GB能耗以及TCO,必須在硬盤規(guī)格上進(jìn)行創(chuàng)新設(shè)計。EDSFF工業(yè)界新標(biāo)準(zhǔn)的推動,將帶來存儲基礎(chǔ)設(shè)施物理形態(tài)重構(gòu)。從各家發(fā)布的方案來看,無論是頭部企業(yè)三星、鎧俠,還是國內(nèi)方案廠商英韌、庫瀚,都明確表示將支持EDSSF規(guī)格高密度SSD設(shè)計。隨著PCIe 5.0 SSD主控的普及,單盤容量將從U.2規(guī)格主流的4/8TB,躍升到EDSFF可支持的16/32 TB。
在PCIe 4.0階段之所以服務(wù)器OEM廠商仍青睞U.2,主要就是機箱的驅(qū)動器槽位、連接器部分能夠與2.5英寸SATA、SAS乃至HDD機械盤兼容。但Hyperscale大型互聯(lián)網(wǎng)和云服務(wù)提供商相對沒有這個包袱,針對應(yīng)用劃分出的全閃存服務(wù)器機型早前已經(jīng)試水E1.S。而最終過渡到PCIe 5.0.0的時候,U.2和M.2電氣上較難達(dá)到相應(yīng)技術(shù)要求??深A(yù)見到2U服務(wù)器可能會普遍采用E1.S/E3.S;用于服務(wù)器擴展的存儲/JBOF使用E1.L。
PCIe 5.0時代將加速更低延時速度的存儲介質(zhì)SCM的商用
SCM(Storage Class Memory)內(nèi)存級存儲介質(zhì),是同時兼具內(nèi)存的微秒級延時以及閃存的容量、掉電保護(hù)等方面優(yōu)勢的新型存儲介質(zhì)。存儲硬件方案的延時核心由主控以及閃存介質(zhì)的物理特性延時決定,PCIe5意味著更快的速率,更快的速率將推動更低延時的SCM存儲介質(zhì)的商用。
目前業(yè)內(nèi)主要有三家國際廠商可提供相關(guān)商業(yè)化的SCM方案,包括英特爾傲騰、三星Z-NAND、鎧俠XL-FLASH(XLF)。英特爾采取了極其封閉的市場策略,并不開放傲騰的SCM介質(zhì)顆粒3D Xpiont(3DXP),且其傲騰持久內(nèi)存僅可在英特爾X86服務(wù)器主板上適配使用,而鎧俠的XLF目前是秉承開放策略,可單獨出售。
值得一提的是,英特爾在近日發(fā)布的2022年第二季度季報時,已正式宣布收縮并逐步關(guān)停傲騰業(yè)務(wù),而秉承開放供應(yīng)SCM顆粒策略的鎧俠,在英特爾宣布關(guān)停傲騰業(yè)務(wù)的差不多時間正式發(fā)布了第二代XL-FLASH方案,第二代XLF在容量上大幅提升,伴隨著PCIe5低延時時代的到臨,XLF有望將成為市場主流的SCM SSD選擇。目前發(fā)布的眾多的PCIe5 SSD主控方案廠商來看,包括Marvell及國內(nèi)的庫瀚、英韌等,均明確其主控方案將支持XLF。
但XLF受物理特性局限,只可應(yīng)用于超高性能的SCM SSD,而無法應(yīng)用在目前已得以真正大規(guī)模商用的持久內(nèi)存形態(tài)。SCM持久內(nèi)存應(yīng)用廣于SCM硬盤,主要原因是SCM介質(zhì)顆粒的定價在乎內(nèi)存與閃存之間,SCM SSD硬盤相比于以TLC閃存為核心的企業(yè)級SSD成本劣勢明顯,且現(xiàn)有的PCIe3/4系統(tǒng)無法充分釋放SCM SSD性能,但傲騰SCM持久內(nèi)存形態(tài)因相比于內(nèi)存具備成本及掉電保護(hù)等的優(yōu)勢,在高性能場景,已成為眾多廠商的主流選擇。
英特爾已投入多年培育起SCM持久內(nèi)存的應(yīng)用生態(tài),在其宣布退出SCM持久內(nèi)存市場后,相關(guān)頭部介質(zhì)、主控廠商將有望加速研發(fā)填補空白。國際上,SK海力士在其發(fā)布論文信息中顯示了其XPOINT技術(shù)與英特爾3D XPoint技術(shù)具有強烈的相似性,是最有可能可應(yīng)用在持久內(nèi)存的介質(zhì);在國內(nèi),庫瀚科技創(chuàng)始人為美國海力士存儲解決方案公司CTO背景,但目前未知其發(fā)布的第一款PCIe5 主控方案是否可支持SCM持久內(nèi)存設(shè)計。華中科大、中科院上海技術(shù)物理研究所等均有發(fā)布SCM介質(zhì)研究的相關(guān)論文,目前產(chǎn)業(yè)化進(jìn)展未知;從招聘信息可見,長江存儲亦在招聘具備SCM主控經(jīng)驗的工程師,但也仍未見正式發(fā)布相關(guān)SCM產(chǎn)品。
PCIe 5.0時代的CXL技術(shù)將重塑數(shù)據(jù)中心基礎(chǔ)設(shè)施
2019年3月,在Interconnect Day 上,英特爾公布了服務(wù)于下一代高性能計算與數(shù)據(jù)中心的CXL(Compute Express Link)開放互連技術(shù)及其CXL 1.0規(guī)范。該技術(shù)建立在完善的PCIe 5.0的物理和電氣實現(xiàn)上,因為無需通過專門設(shè)計的接口,簡化了服務(wù)器硬件的設(shè)計難度,也消除了CPU與設(shè)備、CPU與存儲之間的計算密集型工作負(fù)載的傳輸瓶頸,顯著提升性能、整體成本也大大降低。
CXL為英特爾發(fā)起的行業(yè)技術(shù)標(biāo)準(zhǔn),阿里巴巴、華為、谷歌、微軟等均為CXL聯(lián)盟會員。CXL技術(shù)推廣也是英特爾的一種自我革命,傳統(tǒng)以高成本、超高性能通用架構(gòu)X86 CPU為唯一核心的數(shù)據(jù)存儲基礎(chǔ)設(shè)施格局可能將發(fā)生改變 - 雖然通用計算依然無法撼動X86 CPU的主導(dǎo)局面,但是不同的加速、專用系統(tǒng)級芯片將有望得以更快普及,超異構(gòu)計算的XPU時代將加速到臨。
CXL技術(shù)的引入將是一個改變行業(yè)架構(gòu)的技術(shù),它解綁了計算和內(nèi)存,突破了內(nèi)存帶寬和容量的限制。CXL讓系統(tǒng)可以用異構(gòu)處理和內(nèi)存進(jìn)行擴展,所有設(shè)備都通過一致的機制來使用共享的內(nèi)存空間。如此一來,未來可能會出現(xiàn)集群規(guī)模的內(nèi)存層,一個可字節(jié)尋址的PB級存儲池,而這個存儲池,不一定必須依賴以通用CPU為單一核心。
國際存儲廠商Marvell在今年五月宣布收購CXL技術(shù)公司Tanzanite信息可見,在 Marvell 的完整愿景中,XPU 上會有一些本地內(nèi)存,而 PCIe 上的 CXLink將連接到內(nèi)存模塊它已在其上集成計算以執(zhí)行專門的功能。Marvell 希望使用其定制處理器設(shè)計團(tuán)隊來幫助超大規(guī)模、云構(gòu)建者和其他任何擁有合理容量的客戶將計算放在內(nèi)存上并將其鏈接到 XPU。在國內(nèi),庫瀚科技基于RISC-V架構(gòu)的存儲基礎(chǔ)設(shè)施芯片SPU(Storage Processing Unit),具有計算能力,可以進(jìn)行壓縮、加密、搜索或向量處理,它們將配備用于數(shù)據(jù)移動的DMA引擎,也可以使用諸如NVMe之類的PCIe服務(wù)。
PCIe 5.0時代的NVMe 2.0 ZNS技術(shù)將加速更低成本的QLC閃存商用
閃存介質(zhì)顆粒根據(jù)每個單元存儲的容量不同,可分為SLC、MLC、TLC、QLC等,SLC的存儲容量最低,但是支持讀寫次數(shù)最多,使用壽命最長。QLC的存儲容量最高,但是使用壽命最短,寫入速度相對較慢。
對于用戶來說,采用QLC首先有助于降低大容量閃存的成本,也有助于提高存儲的密度,當(dāng)QLC替代磁盤存儲,也就減少了存儲層級,架構(gòu)得以簡化。但目前QLC主要應(yīng)用為消費級,在現(xiàn)PCIe 4.0階段的企業(yè)級大規(guī)模熱數(shù)據(jù)場景上,因QLC使用壽命短、寫入速度慢等原因,仍無法挑戰(zhàn)TLC在企業(yè)級存儲上的主流地位地位。
伴隨PCIe 5.0 時代到臨的NVME2.0 ZNS技術(shù)為QLC的大規(guī)模商用提供了可行性,QLC比較適合順序?qū)?、隨機讀和順序讀的場景,適合讀取密集型場景。采用ZNS技術(shù)的中國電子云PCIe 5.0 CeaFlash平臺已明確表示將對QLC提供支持。基于ZNS技術(shù),通過系統(tǒng)層過軟硬件融合設(shè)計,基于數(shù)據(jù)熱度使用場景,實現(xiàn)數(shù)據(jù)智能放置分層,這將使得QLC可以應(yīng)用在云存儲和CDN等的核心場景。
云廠商自研或定制硬件的趨勢將加速PCIe 5.0存儲時代到臨
正如5G的商用,離不開電信運營商。PCIe 5.0數(shù)據(jù)基礎(chǔ)設(shè)施的普及,核心在于云廠商的應(yīng)用推廣。艾瑞咨詢指出,企業(yè)級固態(tài)硬盤下游客戶主要來自云計算,占總市場規(guī)模的份額達(dá)到67%,企業(yè)級SSD將充分受益云基礎(chǔ)設(shè)施增量。
云存儲的主要商業(yè)模式為出租虛擬存儲資源,存儲硬件SSD為云基礎(chǔ)設(shè)施的主要成本支出,伴隨PCIe 5.0標(biāo)準(zhǔn)而來的NVME 2.0 ZNS、CXL等新行業(yè)技術(shù)規(guī)范,使得掌握核心場景的云廠商,圍繞自研系統(tǒng)架構(gòu)自研軟硬件融合的整體解決方案成為可能。而華為、浪潮等云廠商基礎(chǔ)設(shè)施投資的主要供應(yīng)商,亦通過軟硬件融合創(chuàng)新,紛紛切入云服務(wù)市場與云廠商構(gòu)成直接競爭,這也加速了相關(guān)頭部云廠商采用最新技術(shù)自研或定制云定義存儲方案的速度。
近日,中國電子云發(fā)布全球首個PCIe 5.0云定義固態(tài)存儲解決方案CeaFlash,這是繼亞馬遜云發(fā)布Nitro SSD平臺、阿里云發(fā)布AliFlash平臺之后,最新宣布軟硬件融合設(shè)計自研云定義全閃存儲的云廠商,也是首家發(fā)布PCIe 5.0全閃存儲技術(shù)平臺的云廠商。
據(jù)IDC預(yù)測,中國將在2025年成為全球最大數(shù)據(jù)圈(48.6ZB),未來全球云廠商的頭部企業(yè)有望將誕生在中國。據(jù)Canalys測算,中國云市場的平均增長率達(dá)到60%,超過世界其他地區(qū)。中國在5G商業(yè)化普及上已經(jīng)領(lǐng)先全球,隨著國內(nèi)云廠商的崛起,數(shù)字經(jīng)濟存儲基礎(chǔ)設(shè)施的“5G新標(biāo)準(zhǔn)”-PCIe 5.0的應(yīng)用普及將有望在中國最早實現(xiàn)大規(guī)模商用推廣,賦能中國數(shù)字新經(jīng)濟發(fā)展。
(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實,并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )