疫情等黑天鵝事件的頻發(fā),使得企業(yè)更加意識(shí)到數(shù)字化轉(zhuǎn)型的重要性,也因此加速了數(shù)字化轉(zhuǎn)型的需求。數(shù)字化轉(zhuǎn)型不僅可以幫助企業(yè)適應(yīng)新的商業(yè)環(huán)境和市場(chǎng)需求,還能夠提高運(yùn)營(yíng)效率、降低成本、改善客戶體驗(yàn),以及實(shí)現(xiàn)創(chuàng)新和增長(zhǎng)。不過(guò),在數(shù)字化轉(zhuǎn)型的道路上,大多數(shù)企業(yè)會(huì)面臨一個(gè)問(wèn)題:對(duì)傳統(tǒng)企業(yè)或者是 IT 能力薄弱的團(tuán)隊(duì),如何快速的去完成數(shù)字化轉(zhuǎn)型?
基于云原生的輕量級(jí)框架在云上通過(guò)敏捷開(kāi)發(fā)快速實(shí)現(xiàn)數(shù)字化轉(zhuǎn)型的業(yè)務(wù),目前是比較流行的做法。但是享受云原生技術(shù)帶來(lái)的敏捷和便利的同時(shí) ,技術(shù)團(tuán)隊(duì)也會(huì)面臨一些新的挑戰(zhàn),比如上層應(yīng)用復(fù)雜度的增加,出現(xiàn)問(wèn)題時(shí),分析需要使用不同維度的工具,這意味著服務(wù)維持、維護(hù)運(yùn)營(yíng)會(huì)更加的困難。比如近期,英國(guó)空管系統(tǒng)故障,一條小小的飛行記錄導(dǎo)致航班中斷 4 小時(shí),給企業(yè)預(yù)計(jì)造成了 1 億英鎊損失。這意味這一旦企業(yè)轉(zhuǎn)型,業(yè)務(wù)高度依賴數(shù)字化,系統(tǒng)的可運(yùn)維性、連續(xù)性和可觀測(cè)性就變得非常的重要。近期,CSDN 專訪了國(guó)內(nèi)性能監(jiān)測(cè)領(lǐng)域頭部廠商基調(diào)聽(tīng)云產(chǎn)品VP 陳靖華,他從系統(tǒng)性能監(jiān)測(cè)的新手段——可觀測(cè)性核心技術(shù)思路,以及未來(lái)性能監(jiān)測(cè)發(fā)展,給出了詳細(xì)的見(jiàn)解。
可觀測(cè)性:提升云原生復(fù)雜系統(tǒng)的監(jiān)控能力
隨著企業(yè)數(shù)字化轉(zhuǎn)型的加速,傳統(tǒng)的基礎(chǔ)設(shè)施監(jiān)控(ITIM)、應(yīng)用性能監(jiān)控(APM)、網(wǎng)絡(luò)性能監(jiān)控(NPM)和日志監(jiān)控技術(shù)已無(wú)法滿足云原生環(huán)境下的應(yīng)用系統(tǒng)高度連續(xù)性的運(yùn)維監(jiān)控訴求??捎^測(cè)性(Observability)作為新興的技術(shù)和理念,近年來(lái)得到了廣泛關(guān)注?;{(diào)聽(tīng)云作為國(guó)內(nèi)可觀測(cè)性技術(shù)的探索者和實(shí)踐者,在產(chǎn)品矩陣中增加了可觀測(cè)性,并針對(duì)云原生環(huán)境進(jìn)行了技術(shù)創(chuàng)新,以提升在復(fù)雜系統(tǒng)中的觀測(cè)能力。
基調(diào)聽(tīng)云技術(shù) VP 陳靖華在采訪中表示,可觀測(cè)性興起的原因在于云原生和微服務(wù)架構(gòu)下,系統(tǒng)的復(fù)雜度大幅提升,傳統(tǒng)的監(jiān)控手段效率下降,無(wú)法在復(fù)雜系統(tǒng)中快速定位問(wèn)題。而基于CNCF OpenTelemetry標(biāo)準(zhǔn)的確立,可觀測(cè)性系統(tǒng)或平臺(tái)通過(guò)統(tǒng)一采集各維度監(jiān)控?cái)?shù)據(jù),構(gòu)建關(guān)聯(lián)性,在未來(lái)將有效提升復(fù)雜系統(tǒng)的可觀測(cè)能力。
具體來(lái)看,疫情期間遠(yuǎn)程辦公和線上業(yè)務(wù)需求激增,促使許多企業(yè)加速了數(shù)字化轉(zhuǎn)型步伐,這使系統(tǒng)架構(gòu)也向微服務(wù)和云原生演進(jìn)。這給傳統(tǒng)的監(jiān)控帶來(lái)了巨大挑戰(zhàn)。以往傳統(tǒng)的監(jiān)控系統(tǒng)依賴人工構(gòu)建的模板和經(jīng)驗(yàn)進(jìn)行問(wèn)題分析定位,但云原生系統(tǒng)復(fù)雜動(dòng)態(tài),許多問(wèn)題并不在預(yù)判范圍內(nèi)。傳統(tǒng)監(jiān)控系統(tǒng)效率下降,無(wú)法快速定位復(fù)雜的未知的系統(tǒng)故障。而可觀測(cè)性正是通過(guò)采集更多維度監(jiān)控?cái)?shù)據(jù),實(shí)現(xiàn)更全面的系統(tǒng)洞察,才得以應(yīng)對(duì)云原生環(huán)境的監(jiān)控難題。
可觀測(cè)性的核心能力是什么?
作為國(guó)內(nèi)性能監(jiān)測(cè)領(lǐng)域的重要廠商,基調(diào)聽(tīng)云探索和總結(jié)了可觀測(cè)性的四大核心能力,具體來(lái)說(shuō):
1、采集即治理,構(gòu)建一體化探針能力
基調(diào)聽(tīng)云通過(guò)自主研發(fā)的一體化 Agent 探針,實(shí)現(xiàn)了從底層基礎(chǔ)設(shè)施到應(yīng)用層、業(yè)務(wù)層和體驗(yàn)層各維度監(jiān)控?cái)?shù)據(jù)的自動(dòng)化采集。這套探針體系經(jīng)過(guò)多年積累,支持國(guó)產(chǎn)操作系統(tǒng)和中間件,對(duì)云原生組件和信創(chuàng)組件都具有非常好的適配性。其中的關(guān)鍵創(chuàng)新在于“采集即治理”的理念,不再是傳統(tǒng)的分離采集和治理,而是在探針端就完成監(jiān)控?cái)?shù)據(jù)的標(biāo)注、過(guò)濾等治理工作。這種一體化采集和即時(shí)治理的設(shè)計(jì),大幅降低了后端的數(shù)據(jù)處理壓力,也提升了監(jiān)控分析的效果。
2、用戶體驗(yàn)至上,打造 DEM 能力
新冠疫情的影響,讓數(shù)字化轉(zhuǎn)型比以往更加注重用戶體驗(yàn),無(wú)論是最終用戶的辦事和購(gòu)物體驗(yàn),還是公司員工和合作伙伴的遠(yuǎn)程辦公體驗(yàn)?;{(diào)聽(tīng)云非常重視對(duì)終端用戶體驗(yàn)的監(jiān)測(cè),這與可觀測(cè)性要以用戶和業(yè)務(wù)為中心的思想高度一致。基調(diào)聽(tīng)云通過(guò)前端探針采集移動(dòng)App,網(wǎng)站和各種小程序的用戶操作行為和體驗(yàn)數(shù)據(jù),再與后臺(tái)系統(tǒng)性能數(shù)據(jù)關(guān)聯(lián),可以準(zhǔn)確反映用戶視角下的體驗(yàn)狀況。這套能力也稱為 DEM(Digital Experience Management)。未來(lái)基調(diào)聽(tīng)云還會(huì)持續(xù)加強(qiáng) DEM 建設(shè),使得業(yè)務(wù)系統(tǒng)的監(jiān)測(cè)更加用戶導(dǎo)向。
3、構(gòu)建可擴(kuò)展的數(shù)據(jù)湖倉(cāng)
為了支持可觀測(cè)性的落地,基調(diào)聽(tīng)云專門設(shè)計(jì)并搭建了一個(gè)可以并行存取多源異構(gòu)數(shù)據(jù)的“數(shù)據(jù)湖倉(cāng)”平臺(tái)。一方面如“數(shù)據(jù)湖”般可以低成本容納各類結(jié)構(gòu)化和非結(jié)構(gòu)化的數(shù)據(jù);另一方面又具備“數(shù)據(jù)倉(cāng)庫(kù)”的快速查詢與分析功能??梢宰鳛榭捎^測(cè)性后端的數(shù)據(jù)交互引擎,充分支撐數(shù)據(jù)聚合、處理和分析等訴求。該存儲(chǔ)方案也具備良好的橫向擴(kuò)展能力,可以適應(yīng)未來(lái)數(shù)據(jù)量的拓展需要。
4、提供開(kāi)放式的探索分析能力
基調(diào)聽(tīng)云正在打造的新一代可觀測(cè)平臺(tái),在保證數(shù)據(jù)采集完整性的前提下,將提供開(kāi)放式的探索分析能力,支持客戶進(jìn)行 Open-ended 的問(wèn)題發(fā)現(xiàn)和根因追蹤,而不是僅僅依賴固化的分析流程或模板。這種“無(wú)邊界探索”的能力是可觀測(cè)性監(jiān)控與傳統(tǒng)監(jiān)控最核心的區(qū)別所在,也是基調(diào)聽(tīng)云在產(chǎn)品設(shè)計(jì)上的一大創(chuàng)新點(diǎn)。
有了上面可觀測(cè)性的四大能力,在產(chǎn)品規(guī)劃上,基調(diào)聽(tīng)云正致力打造一個(gè)開(kāi)放、適應(yīng)性強(qiáng)的新一代可觀測(cè)性平臺(tái)。該平臺(tái)預(yù)計(jì)會(huì)在 2023 年底正式發(fā)布,屆時(shí)將呈現(xiàn)基調(diào)聽(tīng)云在可觀測(cè)性監(jiān)控領(lǐng)域的系列創(chuàng)新。
具體來(lái)看,新平臺(tái)在數(shù)據(jù)采集端會(huì)提供業(yè)界領(lǐng)先的一體化探針能力,實(shí)現(xiàn)全面的監(jiān)控?cái)?shù)據(jù)自動(dòng)收集,同時(shí)也將用戶體驗(yàn)數(shù)據(jù)(DEM)有機(jī)納入;在數(shù)據(jù)處理端將具備可并行處理多源海量異構(gòu)數(shù)據(jù)的可擴(kuò)展“數(shù)據(jù)湖倉(cāng)”方案;在分析和運(yùn)維端將重點(diǎn)賦能開(kāi)放式的探索分析能力,支持客戶自主、快速地進(jìn)行問(wèn)題發(fā)現(xiàn)和根因分析。
可以看出,新平臺(tái)在設(shè)計(jì)理念上更契合可觀測(cè)性的價(jià)值所在,既提供完備的監(jiān)控?cái)?shù)據(jù),也讓客戶更自主地進(jìn)行故障追蹤和定位,而不是依賴固定的模板或流程,可以更好應(yīng)對(duì)云原生環(huán)境下的動(dòng)態(tài)變化。這也使基調(diào)聽(tīng)云的可觀測(cè)平臺(tái)方案在行業(yè)中能夠脫穎而出。
多年來(lái),基調(diào)聽(tīng)云始終是國(guó)內(nèi) APM 和可觀測(cè)性技術(shù)的引領(lǐng)者。這次新的可觀測(cè)平臺(tái)發(fā)布也將進(jìn)一步鞏固基調(diào)聽(tīng)云在行業(yè)中的技術(shù)優(yōu)勢(shì)地位。目前基調(diào)聽(tīng)云是國(guó)內(nèi)唯一5次成功入選 Gartner APM 及可觀測(cè)性 “魔力象限”的國(guó)產(chǎn)可觀測(cè)性廠商,在未來(lái)的可觀測(cè)性賽道中,基調(diào)聽(tīng)云也將保持持續(xù)領(lǐng)先的地位。
可觀測(cè)性監(jiān)控的未來(lái)走向哪里
展望未來(lái),陳靖華認(rèn)為可觀測(cè)性監(jiān)控將朝兩個(gè)方向發(fā)展:
一是構(gòu)建可觀測(cè)性文化體系??捎^測(cè)性不僅僅是技術(shù),需要貫穿整個(gè)軟件交付鏈。從產(chǎn)品設(shè)計(jì)到開(kāi)發(fā)測(cè)試再到運(yùn)維,每一個(gè)環(huán)節(jié)都要將可觀測(cè)性理念融入,逐步形成一整套可觀測(cè)性方法論。這套方法論將基于基本原理不斷迭代優(yōu)化。
二是結(jié)合人工智能賦能自動(dòng)化。在可觀測(cè)性方法論成熟后,可以嘗試使用人工智能技術(shù)進(jìn)行自動(dòng)化。未來(lái)可期待出現(xiàn)一個(gè)類似 ChatGPT 的 AI Agent,通過(guò)可交互的方式快速進(jìn)行故障分析和定位。最終實(shí)現(xiàn)故障自愈,無(wú)需人工參與。但目前行業(yè)仍處在可觀測(cè)性方法論構(gòu)建階段,完全自動(dòng)化還需 5-10 年時(shí)間。
隨著 IT 系統(tǒng)向云原生架構(gòu)演進(jìn),可觀測(cè)性必將成為監(jiān)控體系的重要組成部分。陳靖華表示,基調(diào)聽(tīng)云將繼續(xù)耕耘這個(gè)藍(lán)海技術(shù)領(lǐng)域,堅(jiān)持以客戶需求為導(dǎo)向,持續(xù)進(jìn)行技術(shù)創(chuàng)新與迭代。相信在不久的將來(lái),基調(diào)聽(tīng)云將會(huì)用自己的可觀測(cè)性實(shí)踐,幫助更多的企業(yè)實(shí)現(xiàn)數(shù)字化轉(zhuǎn)型,提升系統(tǒng)穩(wěn)定性和運(yùn)維效率,創(chuàng)造更大的商業(yè)價(jià)值。
(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。 )