隨著企業(yè)引入OpenStack平臺以后,從邊緣應(yīng)用需求逐步進(jìn)入到準(zhǔn)核心,甚至是核心業(yè)務(wù)的需求和趨勢,私有云運(yùn)營團(tuán)隊(duì)常常需要面對多樣化的虛擬機(jī)遷移問題和需求(包括計(jì)劃內(nèi)和計(jì)劃外)。
例如,物理服務(wù)器進(jìn)行計(jì)劃內(nèi)的停機(jī)維護(hù),或者根據(jù)對計(jì)算和存儲更加細(xì)粒度的管理和規(guī)劃,需要將計(jì)算和存儲融合部署的架構(gòu),拆成分離部署架構(gòu),以便于未來業(yè)務(wù)的擴(kuò)展。這些都涉及到虛擬機(jī)的遷移。
根據(jù)遷移操作對業(yè)務(wù)的影響,虛擬機(jī)的遷移一般分為兩類:
1、冷遷移(Cold Migration / Non-live Migration)
虛擬機(jī)需要先停機(jī),等待與此虛擬機(jī)相關(guān)的計(jì)算和存儲等資源遷移完成后,再重新啟動。在遷移期間,業(yè)務(wù)無法訪問,只有遷移完成后,業(yè)務(wù)才能恢復(fù)。由于遷移過程中涉及到存儲數(shù)據(jù)的拷貝,如果數(shù)據(jù)量比較大,會造成停機(jī)時間過長且不可控,因此冷遷移僅適用于對系統(tǒng)可用性要求不高的業(yè)務(wù)。
2、熱遷移(Live Migration)
虛擬機(jī)在遷移過程中保持運(yùn)行狀態(tài),業(yè)務(wù)可正常訪問,根據(jù)虛擬機(jī)的存儲類型又可分為:基于共享存儲的熱遷移、塊設(shè)備的熱遷移和基于卷的熱遷移等。 由于涉及到計(jì)算、網(wǎng)絡(luò)和存儲的一體化熱遷移,對底層基礎(chǔ)設(shè)施的要求較高。
01兩種場景下的對比
我們先來對比VMware和OpenStack對虛擬機(jī)遷移的支持情況:
從上圖可以看出,VMware歷經(jīng)了十多年的商業(yè)化發(fā)展道路,對虛擬機(jī)遷移的支持更為全面,支持計(jì)算和存儲的熱遷移,甚至是跨集群遷移,這通常對于目標(biāo)規(guī)劃兩地三中心業(yè)務(wù)高可用的用戶來講非常重要,但這些功能僅限于VMware場景使用,也就意味著在滿足業(yè)務(wù)高可用需求的同時,選擇了相對比較單一的私有云模型,給用戶在供應(yīng)商平臺選擇上帶來局限性;
相比之下,OpenStack對虛擬機(jī)遷移功能的支持則不夠完善,對于存儲遷移,由于OpenStack本身開放的架構(gòu),需要依賴存儲廠商實(shí)現(xiàn)存儲層的遷移能力。
以Ceph為例,Ceph RBD作為OpenStack主流的存儲后端,默認(rèn)不支持在線熱遷移,RBD裸盤只能進(jìn)行離線遷移,這就意味著如果進(jìn)行跨集群遷移,虛擬機(jī)需要長時間停機(jī),整體遷移進(jìn)度受制于存儲的遷移進(jìn)度,如果存儲容量較大,更會讓整個遷移時間不可控。
如今,XSKY SDS逐步被很多用戶引入到已有的OpenStack架構(gòu)中,用于替換該私有云架構(gòu)中原有的Ceph SDS集群,這些用戶包括對于業(yè)務(wù)連續(xù)性要求非常高的省級,甚至是更大規(guī)模的金融平臺。
為了幫助用戶應(yīng)對棘手的在線熱遷移問題,XSKY基于自主研發(fā)的納管卷、在線卷遷移和多集群存儲等特性,設(shè)計(jì)了XMotion納管熱遷移技術(shù),不但支持多家OpenStack廠商,提供面向虛擬機(jī)和租戶的存儲計(jì)算一體化遷移方案,更可將整體遷移效率提升10倍以上。
XSKY的納管遷移方案具有以下優(yōu)勢:
? 支持存儲在線熱遷移,業(yè)務(wù)無需中斷,可在業(yè)務(wù)正常運(yùn)行中進(jìn)行遷移;
? 不僅支持存儲獨(dú)立納管遷移,也支持計(jì)算和存儲一體化遷移;
? 以卷為單位,上層應(yīng)用無感知,無兼容性問題;
? 支持從開源Ceph遷移到XSKY存儲集群,也支持從XSKY老集群遷移到新集群;
? 支持跨計(jì)算和存儲集群進(jìn)行遷移;
? 無廠商鎖定,支持多家OpenStack廠商;
? 強(qiáng)一致的數(shù)據(jù)完整性保證,不丟增量數(shù)據(jù);
? 支持遷移QoS,可根據(jù)業(yè)務(wù)需要自定義遷移速率,并可隨時撤銷遷移任務(wù);
? 支持以虛擬機(jī)或租戶為單位,自動掃描關(guān)聯(lián)的存儲,一鍵遷移;
? 結(jié)合虛機(jī)業(yè)務(wù)的完善回滾方案,應(yīng)對海量數(shù)據(jù)遷移過程中的各種硬件和網(wǎng)絡(luò)異常情況。
02存儲納管遷移
下面以XSKY存儲集群納管開源Ceph為例,介紹存儲納管遷移的步驟:
1、將計(jì)算節(jié)點(diǎn)添加到XSKY存儲集群;
2、OpenStack Nova/Cinder等服務(wù)配置存儲多集群,可同時訪問開源Ceph集群和XSKY存儲集群;
3、在XSKY存儲集群創(chuàng)建納管卷,關(guān)聯(lián)該納管卷與Ceph集群中的被納管卷;
4、OpenStack Nova/Cinder等服務(wù)配置使用納管卷;
5、XSKY納管卷啟動在線卷遷移;
6、后臺數(shù)據(jù)在線遷移完成后,XSKY納管卷會自動合并和清理底層臨時數(shù)據(jù),完成整個遷移過程。
納管遷移中的IO訪問流程如下圖所示:
在遷移過程中,由libvirt發(fā)起的虛擬機(jī)讀操作將由遷移網(wǎng)關(guān)從開源Ceph讀取,寫操作則由遷移網(wǎng)關(guān)進(jìn)行同步雙寫,同時寫入納管卷與被納管卷;
遷移完成后,讀寫操作將都只針對新池進(jìn)行。納管遷移網(wǎng)關(guān)對上層屏蔽遷移細(xì)節(jié),libvirt對整個遷移過程無感知,無需做任何修改。
03存算一體化在線遷移
XMotion除了提供存儲納管遷移以外,也支持多家OpenStack廠商之間的存儲和計(jì)算一體化遷移方案,以虛擬機(jī)為單位,自動化遷移虛擬機(jī)及其存儲部分。
下面我們以某省級農(nóng)信社的大規(guī)模OpenStack生產(chǎn)集群遷移為案例,介紹XMotion的存儲和計(jì)算一體化在線遷移方案。
因?yàn)闅v史原因,過去為了規(guī)避單一供應(yīng)商的產(chǎn)品和服務(wù)風(fēng)險,該用戶在對外省級聯(lián)社以及對私內(nèi)部運(yùn)營,規(guī)劃和籌建了兩套OpenStack集群,這兩套集群各自獨(dú)立運(yùn)營,資源以及權(quán)限分離管理;
而在過去三年的逐步比較中,發(fā)現(xiàn)B集群服務(wù)商具有更好的產(chǎn)品穩(wěn)定性和商業(yè)服務(wù)能力,所以本次遷移的目標(biāo)是為了將OpenStack廠商A的老集群遷移到OpenStack廠商B的新集群中,同時將原XSKY存儲集群遷移到新版本的兩套集群中,做存儲災(zāi)備,因此涉及到計(jì)算和存儲兩個單元的同時跨集群遷移需求。
OpenStack原集群為計(jì)算和存儲分離部署架構(gòu),其中,計(jì)算節(jié)點(diǎn)49臺(46臺為純計(jì)算節(jié)點(diǎn),3臺計(jì)算與控制節(jié)點(diǎn)融合部署),共2886臺虛擬機(jī);存儲節(jié)點(diǎn)107臺,采用3副本,裸容量4.38PB,有效容量1.46PB,已使用1PB,共5625個卷。
集群遷移前后的架構(gòu)如下圖所示:
以單個虛擬機(jī)為例,XSKY的存算一體化遷移方案步驟如下:
1、初始化
? OpenStack廠商創(chuàng)建遷移用的虛擬機(jī),進(jìn)行網(wǎng)絡(luò)和計(jì)算資源初始化等工作
? OpenStack配置多集群
2、XMotion執(zhí)行存儲和計(jì)算的自動一體化遷移
? 創(chuàng)建納管卷
? 遷移虛擬機(jī)
? 納管卷重命名
? 啟動遷移任務(wù)
本次遷移屬于計(jì)劃內(nèi)升級遷移,因此允許對虛擬機(jī)業(yè)務(wù)停機(jī),遷移耗時不超過3分鐘,主要集中于虛擬機(jī)跨計(jì)算集群的重建和啟動階段,得益于XMotion的納管熱遷移技術(shù),整個遷移過程不受存儲容量的限制,新虛擬機(jī)啟動后掛載納管卷即可對外提供服務(wù),由XSKY的遷移網(wǎng)關(guān)在后臺執(zhí)行數(shù)據(jù)熱遷移,業(yè)務(wù)在存儲遷移過程中不受遷移進(jìn)度影響,可正常訪問。
遷移完成后,在OpenStack控制面板可觀察到新虛擬機(jī)已正常運(yùn)行:
而在XSKY存儲控制面板則可觀察到存儲卷為在線遷移狀態(tài):
XSKY支持針對在線遷移中的卷執(zhí)行速率調(diào)整和取消遷移任務(wù)等操作:
? 調(diào)整遷移速率,支持高、中、低三檔遷移速率,如果擔(dān)心遷移速率過大影響正常業(yè)務(wù),則可將遷移速率調(diào)小;
? 取消遷移任務(wù),如果遷移導(dǎo)致業(yè)務(wù)速率降低,則可以取消遷移任務(wù),釋放帶寬來滿足前端業(yè)務(wù)需求,后續(xù)再重新開啟遷移任務(wù)。
本次遷移實(shí)測的不同檔次遷移速率如下:
XMotion遷移不僅可以支持跨OpenStack廠商和存儲遷移,方便后期業(yè)務(wù)擴(kuò)展,而且可以獲得新版本XSKY存儲集群的所有特性,遷移完成后的虛擬機(jī)性能也獲得同步提升:
04更多適用場景
除了以上提到的場景外,XMotion納管熱遷移技術(shù)還可靈活應(yīng)用于多種業(yè)務(wù)場景。
1、遷移開源Ceph或老版本XSKY存儲
遷移需求:
? 開源Ceph運(yùn)維難度大, 將開源Ceph遷移到XSKY存儲上,獲得專業(yè)和易用的企業(yè)級存儲能力;
? 部署了新版本XSKY存儲集群,希望將老集群遷移到新集群,釋放老集群資源。
方案優(yōu)勢:
? 保留OpenStack計(jì)算集群,遷移底層Ceph或XSKY老集群到XSKY新集群;
? 以虛擬機(jī)和租戶為單位,面向業(yè)務(wù)遷移;
? 在線遷移,業(yè)務(wù)無感知;
? 自動化遷移,運(yùn)維成本低。
2、跨集群遷移計(jì)算和存儲集群
遷移需求:
? 計(jì)算集群升級;
? 存算分離;
? 跨集群遷移虛擬機(jī);
? OpenStack集群跨地域遷移;
? 不同OpenStack廠商集群切換;
? 要求遷移時間可控,遷移過程業(yè)務(wù)不中斷。
方案優(yōu)勢:
? 計(jì)算和存儲同時遷移;
? 支持跨計(jì)算集群和跨存儲集群遷移;
? 遷移時間可控,不受存儲容量限制;
? 多OpenStack廠商支持;
? 自動化遷移,運(yùn)維成本低。
05小結(jié)
OpenStack進(jìn)入我們的視線已經(jīng)有很多年了,開源且具有開放性的OpenStack平臺對于許多植根互聯(lián)網(wǎng)基因的企業(yè)來說具有強(qiáng)大的吸引力,但由于產(chǎn)品化程度不足,運(yùn)維和開發(fā)投入的人力和資金往往不可忽視。
而最終在很多需要跨集群滿足業(yè)務(wù)連續(xù)性的場景,無法攻城略地的原因,則來自于OpenStack場景下,天然短板的熱遷移(Live-Migration)能力。XSKY XMotion納管熱遷移技術(shù),讓OpenStack也能夠支持熱遷移,極大提升虛擬機(jī)遷移效率。
- 蜜度索驥:以跨模態(tài)檢索技術(shù)助力“企宣”向上生長
- 為什么年輕人不愛換手機(jī)了
- 柔宇科技未履行金額近億元被曝已6個月發(fā)不出工資
- 柔宇科技被曝已6個月發(fā)不出工資 公司回應(yīng)欠薪有補(bǔ)償方案
- 第六座“綠動未來”環(huán)保公益圖書館落地貴州山區(qū)小學(xué)
- 窺見“新紀(jì)元”,2021元宇宙產(chǎn)業(yè)發(fā)展高峰論壇“廣州啟幕”
- 以人為本,景悅科技解讀智慧城市發(fā)展新理念
- 紐迪瑞科技/NDT賦能黑鯊4 Pro游戲手機(jī)打造全新一代屏幕壓感
- 清潔家電新老玩家市場定位清晰,攜手共進(jìn),核心技術(shù)決定未來
- 新思科技與芯耀輝在IP產(chǎn)品領(lǐng)域達(dá)成戰(zhàn)略合作伙伴關(guān)系
- 芯耀輝加速全球化部署,任命原Intel高管出任全球總裁
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實(shí),并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實(shí)內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。