2020年初,一場以新基建之名的數(shù)字基礎設施建設熱潮,讓國人為之興奮。所謂“新基建”也稱為新型基礎設施,主要是指融合了云計算、大數(shù)據(jù)、人工智能等新興數(shù)字技術的城市基礎設施,2020年4月中央明確“新基建”范圍,包括5G建設、大數(shù)據(jù)中心、人工智能等七大領域。新基建之所以重要,還在于它承擔了推動傳統(tǒng)基礎設施向新型基礎設施轉型的歷史重任,這在十三五與十四五之交具有格外重要的意義。
針對新基建以及大數(shù)據(jù)中心等具體的數(shù)字基礎設施,浪潮作為國內(nèi)老牌技術廠商以及全球第二大服務器廠商,在2020年4月提出了“智算中心”的概念,為大規(guī)模數(shù)據(jù)中心的演進指明了方向。如果說大規(guī)模數(shù)據(jù)中心強調的是算力、性能、可靠性等,那么智算中心更多強調的是算力的集約化,包括各種異構計算的整合以及云、大數(shù)據(jù)、人工智能等平臺的協(xié)同打通。開放標準、集約高效、普適普惠,是智算中心的基本特征。
從大規(guī)模數(shù)據(jù)中心到智算中心,其核心“操作系統(tǒng)”又將迎來怎樣的變化?2020年11月25日,浪潮在2020云海創(chuàng)新論壇(IIF2020)上發(fā)布了智算中心操作系統(tǒng),向外界展示了對智算中心操作系統(tǒng)的構想及落地實踐——云海OS完成了全球最大規(guī)模OpenStack單一集群1000節(jié)點的云數(shù)智融合實踐。
(浪潮信息副總裁張東)
浪潮信息副總裁張東表示,浪潮云海OS以開源開放技術為基礎、以新時期用戶需求為出發(fā)點,不斷進化成為開放、融合、敏捷、智能的操作系統(tǒng),滿足新基建時代智算中心的要求,奠定了政企數(shù)字化轉型“云數(shù)智”融合的基礎,是智算中心的中樞。
浪潮云海OS經(jīng)歷了從虛擬化管理到云數(shù)據(jù)中心操作系統(tǒng)的演變,如今又進化為智算中心操作系統(tǒng),而其底座仍然是開源技術及工業(yè)標準硬件,從而滿足開放標準、普適普惠、集約高效的要求。
突破OpenStack大規(guī)模單一集群
在11月25日舉辦的浪潮云海創(chuàng)新論壇2020上,浪潮云海發(fā)布了全球最大規(guī)模OpenStack單一集群達1000節(jié)點的云數(shù)智融合實踐。浪潮云海在2019年就完成了單一集群500節(jié)點的測試,是當時基于OpenStack Rocky版本的全球最大規(guī)模單一集群實踐。本次1000節(jié)點大規(guī)模測試,在規(guī)模、場景、性能等方面進行了全面突破,完成了從500節(jié)點到1000節(jié)點的升級,還刷新了今年4月云海OS所取得的SPEC Cloud IaaS 測試紀錄,實現(xiàn)了量變到質變的躍遷。
中國信通院全程參與了兩次集群的測試。中國信通院云大所副所長栗蔚表示,OpenStack是當前主流的云架構開源項目,逐漸成為高速發(fā)展企業(yè)和成熟企業(yè)基礎IT架構的首選解決方案之一。OpenStack在小規(guī)模部署時,其性能和穩(wěn)定性較為穩(wěn)定,開源特性和良好的社區(qū)支持也為小規(guī)模部署提供了技術參考。隨著企業(yè)探索的不斷深入,大規(guī)模應用的需求越發(fā)迫切,OpenStack大規(guī)模云集群有待突破。
作為全球頂級的開源項目之一,OpenStack已經(jīng)走過了十年的歷程,成為私有云的產(chǎn)業(yè)事實標準以及部分公有云的“底座”,是當前全球部署最為廣泛的開源云軟件。截止2020年,OpenStack發(fā)布了22個版本,社區(qū)里有超過40個項目,全球有超過1000萬的基于OpenStack的計算核心,在全球187個國家和地區(qū)有數(shù)十萬成員。今年10月,OpenStack基金會演進成為Open Infrastructure Foundation開源基礎設施基金會,凸顯了融合人工智能、5G、大數(shù)據(jù)、邊緣計算等新型工作負載的定位。
一方面,OpenStack可以納管和支持融合的工作負載越來越多;另一方面,由于開源技術和復雜組件帶來的局限性,導致當達到一定規(guī)模時,系統(tǒng)的運維難度陡增、并發(fā)性能降低,而通過對系統(tǒng)的合理優(yōu)化方能滿足大規(guī)模節(jié)點部署的應用場景,保證系統(tǒng)的正常穩(wěn)定運行,這就是浪潮云海OpenStack大規(guī)模單一集群測試的意義所在。
更大、更全、更高
浪潮在多年云平臺建設的探索中發(fā)現(xiàn),大型用戶的云平臺實踐普遍面臨大規(guī)模的挑戰(zhàn)。隨著內(nèi)外部用戶數(shù)量的增長,單一應用和服務的規(guī)模變得愈發(fā)龐大,需要同時部署數(shù)百甚至數(shù)千臺虛擬機。如果使用多個小規(guī)模集群構建云平臺,應用和服務的跨集群部署、管理、升級會變得異常困難甚至無法實現(xiàn),因此對單一集群的規(guī)模產(chǎn)生了強烈的需求。
針對大型用戶對大規(guī)模云平臺單一集群的需求,浪潮云海團隊在中國信通院的見證下開展了OpenStack大規(guī)模單一集群的測試。浪潮云計算與大數(shù)據(jù)產(chǎn)品線首席架構師亓開元表示,從2019年的OpenStack單一集群500節(jié)點到今年的1000節(jié)點,不僅僅是更大規(guī)模的單一集群,今年還加入了大數(shù)據(jù)和人工智能,測試集群支撐的業(yè)務更全,整體系統(tǒng)達到的更高性能。
本次測試,浪潮云海團隊在短短3天內(nèi)完成了1000臺服務器部署,支撐傳統(tǒng)業(yè)務、云原生業(yè)務、大數(shù)據(jù)業(yè)務、人工智能應用等,并刷新了SPEC Cloud基準測試世界紀錄:OpenStack實現(xiàn)3000個虛擬機高并發(fā)創(chuàng)建,密度可達5萬,30分鐘內(nèi)完成百節(jié)點裸機發(fā)放;容器實現(xiàn)1000節(jié)點管理,3萬POD并發(fā)創(chuàng)建,20萬POD管理,10萬應用管理;存儲實現(xiàn)240節(jié)點管理,10萬卷分布式存儲,單節(jié)點1萬IOPS,單集群240萬IOPS;SDN實現(xiàn)2到7層網(wǎng)絡10萬臺虛擬機統(tǒng)一管理配置,流量靈活調度。
亓開元強調,浪潮公司大力支持OpenStack大規(guī)模單一集群的測試,僅本次測試用的1000臺服務器的成本就高達上億,是直接從生產(chǎn)線拉下來后送入老化線,其目標就是向用戶展示浪潮的交鑰匙工程能力。換言之,本次所測試實現(xiàn)的1000臺OpenStack大規(guī)模單一集群,同樣的方案可以直接部署到用戶的數(shù)據(jù)中心,馬上就可獲得本次測試所實現(xiàn)的各種極致性能,例如金融和電信等行業(yè)都對1000節(jié)點單一集群有著實際需求,因此1000節(jié)點單一集群相應就極具行業(yè)參考規(guī)范價值。
而在1000節(jié)點之后,下一個測試規(guī)模是什么?亓開元介紹,實際上在本次測試中也進行了1000節(jié)點集群的多集群連接測試,未來可以通過多集群方式擴大到上萬節(jié)點,滿足用戶更大規(guī)模數(shù)據(jù)中心的未來需求。
從云數(shù)據(jù)中心到智算中心
作為OpenStack社區(qū)的重要成員之一,浪潮早在2015年就開始圍繞“開放、融合、敏捷”的理念,以OpenStack為核心構建數(shù)據(jù)中心操作系統(tǒng),通過敏捷開發(fā)的模式實現(xiàn)了虛擬、裸機、容器的統(tǒng)一管理及增強。尤其是在高性能、高效率、高可用、資源融合、多云融合、云數(shù)智融合以及智能運維、智能服務等方面持續(xù)進行優(yōu)化創(chuàng)新,在開源版本基礎上融入了大量企業(yè)級增強和優(yōu)化,打造了云數(shù)智堅實的底座。
實際上,對于云計算、大數(shù)據(jù)和人工智能計算來說,這是三種不同形態(tài)的計算方式,對于計算資源的要求和調度等有著各自的要求,那么作為智算中心操作系統(tǒng)又是如何實現(xiàn)云數(shù)智融合的呢?這首先就需要對云計算、大數(shù)據(jù)和人工智能等開源技術的深入掌握和深度理解,特別是需要掌握OpenStack云計算“底座”的精深知識以及相關的工程實踐,而這就是1000節(jié)點單一集群測試和實踐的重要價值。
對于浪潮云海OS來說,不僅強調對OpenStack開源技術的掌握,更強調參與開源社區(qū)以及通過自己的實踐來回饋開源社區(qū)。例如在OpenStack第21個版本Ussuri和剛發(fā)布的第22個版本Victoria中,浪潮在代碼提交數(shù)、完成藍圖數(shù)、起草藍圖數(shù)、補丁修復數(shù)和參與人天數(shù)均達到全球前列、中國第一。近年來,浪潮的社區(qū)貢獻主要集中在Nova(計算)、Cinder(塊存儲)、Cyborg(加速)、Vitrage(根因分析)、Manila(文件存儲)等核心模塊,并主導完成Nova通過Cyborg管理加速設備的特性、貢獻Inspur GPU、FPGA、NVMe SSD等硬件設備驅動,有效促進了人工智能、邊緣計算等新興領域的發(fā)展,今年還發(fā)布了Venus智能日志管理開源項目,與業(yè)界共同構建開放統(tǒng)一的智能基礎設施。
而面向云原生領域、滿足用戶容器化場景需求,浪潮基于微服務思想、以應用為中心、面向私有云市場打造的企業(yè)級容器服務平臺,這就是浪潮云海容器云平臺InCloud K8S(簡稱ICK8S),并于2020年9月發(fā)布了V2.2版本。該版本新增了微服務治理功能,并在應用管理、應用部署、應用中心等方面全面升級,實現(xiàn)針對容器化業(yè)務場景的全面覆蓋。例如在最重要的微服務治理方面,ICK8S實現(xiàn)了無侵入式微服務治理——支持全流量治理、鏈路追蹤、灰度發(fā)布等治理服務,治理實現(xiàn)與業(yè)務開發(fā)的完全解耦,平臺兼容多種微服務框架,已有微服務應用無需額外改造即可平滑遷移。
在面向人工智能和機器學習方面,大數(shù)據(jù)處理平臺浪潮云海Insight入選了Forrester發(fā)布中國預測分析和機器學習市場研究報告《Now Tech: PredictiveAnalytics And Machine Learning In China,Q3 2020》(簡稱PAML),浪潮與百度、阿里云、騰訊云等企業(yè)入選中國預測分析和機器學習市場第一陣營。浪潮云海Insight平臺具備數(shù)據(jù)智能化分析挖掘、多數(shù)據(jù)源協(xié)同計算、大規(guī)模集群一鍵式部署、異構平臺混合部署與資源精細化管理等領先技術特性。
正是有了前期在云計算、大數(shù)據(jù)和人工智能等領域的技術布局,如今浪潮云海OS才有可能升級到智算中心操作系統(tǒng),特別是實踐了1000節(jié)點大規(guī)模單一融合集群。浪潮以OpenStack、K8S等開放基礎設施為底座,融入AIOps和人工智能訓練推理平臺,構建云數(shù)智一體化平臺并提供智能化服務。“智算中心操作系統(tǒng)是智算中心的靈魂,能夠有效聯(lián)接下層硬件和上層服務,異構融合多種算力和多元場景,敏捷應對不同智算需求,以智能驅動創(chuàng)新”,浪潮信息副總裁張東就此表示。
總結來說:浪潮云海OS向智算中心操作系統(tǒng)的升級,是面向未來政企用戶需求而提前進行的布局。浪潮作為互聯(lián)網(wǎng)市場的第一大服務器廠商,將互聯(lián)網(wǎng)對于新興技術的需求以及相應的技術方案沉淀和積累下來,再向傳統(tǒng)政企用戶擴散。無論是云原生、大數(shù)據(jù)和人工智能等,真正要全面進入政企應用還要幾年的時間,而浪潮智算中心操作系統(tǒng)不僅為新基建樹立了新標桿,更是為十四五的政企數(shù)字化轉型立下了新標桿!
(免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。
任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權或存在不實內(nèi)容時,應及時向本網(wǎng)站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內(nèi)容或斷開相關鏈接。 )