2018年,AIOps智能運維儼然成為中國運維市場的風(fēng)口。在這一年里,傳統(tǒng)ITOM/ITSM廠商、新興APM/NPM廠商、各大云廠商紛紛轉(zhuǎn)戰(zhàn)智能運維,描繪出種種智能運維發(fā)展藍(lán)圖和未來產(chǎn)品。而在各種運維大會上,智能運維也成了焦點話題,專家學(xué)者們不斷向業(yè)界灌輸智能運維的好處,似乎有了智能運維就能立刻破解伴隨數(shù)字化轉(zhuǎn)型而來的IT規(guī)模和復(fù)雜度暴增的管理難題,甚至能逐步取代運維人員,實現(xiàn)NoOps無人化運維。
智能運維到底有沒有這么神奇?什么才是真正的AIOps智能運維?AIOps智能運維到底能給企業(yè)帶來哪些能力?本文將為您逐一解讀。
什么是AIOps智能運維
早在2016年之前,著名IT研究機構(gòu)Gartner在其詞庫就添加了AIOps這一詞條,彼時AIOps是Algorithmic IT Operations的縮寫,按照字面理解,AIOps是一種基于算法的運維方式。時至今日,仍有互聯(lián)網(wǎng)大廠和算法界專家把Algorithmic算法作為AIOps智能運維的核心價值。
清華大學(xué)裴丹教授對AIOps的定義是:AIOps將人工智能應(yīng)用于運維領(lǐng)域,基于已有的運維數(shù)據(jù)(日志、監(jiān)控信息、應(yīng)用信息等),通過機器學(xué)習(xí)的方式來進一步解決自動化運維沒辦法解決的問題。AIOps 不依賴于人為指定規(guī)則,主張由機器學(xué)習(xí)算法自動地從海量運維數(shù)據(jù)中不斷地學(xué)習(xí),不斷地提煉并總結(jié)規(guī)則。
然而,經(jīng)過近3年全球AIOps市場的發(fā)展和沉淀, Gartner在2018年11月發(fā)布的最新版《Market Guide for AIOps Platforms》報告中把AIOps的含義由算法升級為智能,即Artificial Intelligence for IT Operations,并為AIOps平臺作出如下定義:“整合大數(shù)據(jù)和機器學(xué)習(xí)能力,通過松耦合、可擴展方式去提取和分析在數(shù)據(jù)量(volume)、種類(variety)和速度(velocity)這三個維度不斷增長的IT數(shù)據(jù),為所有主流ITOM產(chǎn)品提供支撐。AIOps平臺夠同時使用多個數(shù)據(jù)源、數(shù)據(jù)采集方法及分析和展現(xiàn)技術(shù),廣泛增強IT運維流程和事件管理效率,可用于性能分析,異常檢測,事件關(guān)聯(lián)分析,ITSM和自動化等應(yīng)用場景。”
IT行業(yè)的領(lǐng)頭羊IBM在《金融行業(yè)智能運維實施建議白皮書》開篇明義:“AIOps就是希望通過人工智能的方式,對系統(tǒng)運行過程中所產(chǎn)生的數(shù)據(jù),運用AI和算法、運籌理論等相關(guān)技術(shù),對運維數(shù)據(jù)進行分析,進一步提升運維效率,包括運維決策、故障預(yù)測和問題分析等的新一代運維手段和方法。”
國內(nèi)智能運維的創(chuàng)新公司云智慧,通過3年的探索和實踐,率先實現(xiàn)了AIOps的產(chǎn)品化和場景化。云智慧CEO殷晉對AIOps的理解更加貼合中國市場和數(shù)字化轉(zhuǎn)型企業(yè)的需求:“AIOps與其說是產(chǎn)品,不如說是一種理念和策略。通過以數(shù)據(jù)為基礎(chǔ)、算法為支撐,場景為導(dǎo)向的AIOps平臺,為企業(yè)現(xiàn)有運維管理工具和管理體系賦予統(tǒng)一數(shù)據(jù)管控能力和智能化數(shù)據(jù)分析能力,全面提升運維管理效率。現(xiàn)階段AIOps的目標(biāo)不是NoOps,而是BetterOps,通過更高效的運維幫助企業(yè)快速洞察人力難以企及的故障和問題,準(zhǔn)確預(yù)測風(fēng)險,化被動運維為主動運維。”
AIOps智能運維是突然出現(xiàn)的嗎?
在過去二十年里,人工智能技術(shù)的發(fā)展間歇性影響了ITOM的進步,而AIOps只是這種影響的最新例證。因此,對于傳統(tǒng)企業(yè)來說,智能運維并不是一個全新的理念,而是IT運營分析/運維管理(ITOA/ITOM)體系與大數(shù)據(jù)和人工智能技術(shù)結(jié)合的產(chǎn)物。AIOps智能運維平臺以ITOM/ITOA系統(tǒng)所采集的運維大數(shù)據(jù)為基礎(chǔ),利用人工智能和機器學(xué)習(xí)算法對運維數(shù)據(jù)進行深入分析,涵蓋IT監(jiān)控,應(yīng)用性能管理、外網(wǎng)監(jiān)控、日志分析,系統(tǒng)安全等方面。
市面上流行的ITOM平臺,其核心組件缺少大數(shù)據(jù)采集、分析和機器學(xué)習(xí)的能力,需要AIOps平臺予以完善。AIOps智能運維平臺能夠接入不同業(yè)務(wù)系統(tǒng)、監(jiān)控系統(tǒng)、管理系統(tǒng)的海量IT數(shù)據(jù),并運用各種算法進行快速分析、學(xué)習(xí)甚至預(yù)測。立足于AIOps,IT部門可以獲得強大的IT決策和運營管理能力,并能對業(yè)務(wù)質(zhì)量和用戶體驗進行準(zhǔn)確檢測和持續(xù)優(yōu)化。
目前,國內(nèi)頂級互聯(lián)網(wǎng)及ICT企業(yè),如阿里、騰訊、華為、百度等,都成立專門的部門對AIOps體系開展深入研究并逐步落地,甚至達(dá)到某種程度上的NoOps。但對于數(shù)字化轉(zhuǎn)型中的國內(nèi)大中型企業(yè)來說,互聯(lián)網(wǎng)模式的AIOps平臺無法滿足雙態(tài)IT環(huán)境、混合云環(huán)境、IoT場景下復(fù)雜事務(wù)流程的統(tǒng)一管控和效率提升需求,開放度更高、工程化能力更強、應(yīng)用場景更聚焦的專業(yè)AIOps平臺解決方案才是企業(yè)客戶的首選。
AIOps智能運維平臺選型的必備能力
現(xiàn)階段,數(shù)字化轉(zhuǎn)型的IT挑戰(zhàn)在于一方面要控制IT成本,另一方面又要提供支持更高復(fù)雜度的運維管理能力。傳統(tǒng)ITOM產(chǎn)品在處理海量、多種類和高速數(shù)據(jù)時常常會遇到極大的壓力。更重要的是,這些監(jiān)控工具無法提供橫向業(yè)務(wù)追蹤和根因定位所需的多系統(tǒng)數(shù)據(jù)。
數(shù)字化業(yè)務(wù)要求IT運維提供更快的響應(yīng)速度和更高的處理效率,因此AIOps智能運維平臺需要提供如下能力:
? 提供獨立、開放的歷史/實時數(shù)據(jù)采集、算法分析平臺,整合IT數(shù)據(jù)和業(yè)務(wù)指標(biāo)數(shù)據(jù);
? 提供告警消噪(包括告警抑制、告警收斂等),消除誤報或冗余事件;
? 提供跨系統(tǒng)追蹤和關(guān)聯(lián)分析,有效進行故障的根因分析;
? 設(shè)定動態(tài)基線捕獲超出靜態(tài)閾值的異常,實現(xiàn)單/多指標(biāo)異常檢測;
? 根據(jù)機器學(xué)習(xí)結(jié)果,預(yù)測未來事件,防止?jié)撛诘墓收?
? 直接或通過集成啟動解決問題的動作;
AIOps平臺主要通過整合分析IT基礎(chǔ)設(shè)施、APM、NPM、日志、數(shù)字化體驗監(jiān)測數(shù)據(jù),來提升IT運維流程的效率,而AIOps平臺能力的ROI多是基于平均故障接手時間(MTTA)和平均故障修復(fù)(MTTR)時間這兩個指標(biāo)的降低進行評估的。
主流AIOps平臺推薦
AIOps的發(fā)展獲得了業(yè)界的一致看好,Gartner同樣給出大膽預(yù)測:未來2到5年內(nèi)AIOps將擴展到IT服務(wù)管理和自動化運維領(lǐng)域,到了2022年,部署AIOps平臺的大型企業(yè)數(shù)量將從如今的不足5%,迅速提升到40%左右。
目前,AIOps市場可以說是霧里看花,很多廠商都宣稱擁有自己的AIOps產(chǎn)品。下面,我們遴選了五家國內(nèi)外已經(jīng)實現(xiàn)智能運維工程化的解決方案商,從他們的平臺能力和應(yīng)用場景等維度進行橫向?qū)Ρ?,希望對企業(yè)AIOps選型提供幫助。
注:以上部分?jǐn)?shù)據(jù)來自Moogsoft《Is 2018 the Year of AIOps?》
IBM、BMC等ITOM企業(yè),在傳統(tǒng)IT架構(gòu)的理解和人員規(guī)模等方面擁有強大的實力,而新興的軟件服務(wù)企業(yè)如Moogsoft、Splunk、Cloudwise等公司雖然規(guī)模不大,但是專注于AIOps相關(guān)領(lǐng)域的研發(fā),實力同樣不容小覷。BMC和IBM的AIOps解決方案主要滿足傳統(tǒng)IT場景下的IT資源管理、IT服務(wù)管理、IT 自動化等需求,針對的用戶群體也是以L1/L2級運維工程師為主,這也是此類企業(yè)和諸多由ITOM/ITSM轉(zhuǎn)型AIOps的服務(wù)商多年來積累的優(yōu)勢。而Cloudwise、Moogsoft和Splunk自誕生之時恰逢互聯(lián)網(wǎng)經(jīng)濟大潮的興起,其產(chǎn)品和解決方案更適合數(shù)字化和混合IT場景和現(xiàn)代企業(yè)的需求。
- 蜜度索驥:以跨模態(tài)檢索技術(shù)助力“企宣”向上生長
- 網(wǎng)信辦嚴(yán)打網(wǎng)絡(luò)侵害未成年人行為,守護成長新篇章
- 豆包大模型升級引爆股市,字節(jié)緊急警示:小心為上
- 小米YU7無偽裝實車首次曝光引熱議,小紅書封號事件沖上熱搜,科技圈又掀波瀾?
- 警惕討好型人格:賺錢路上,人格魅力并非一切
- 小米SUV墜崖一家四口奇跡生還,車主回應(yīng):別夸大其詞
- 金融AI大模型新突破:奇富科技AI產(chǎn)品小奇引領(lǐng)行業(yè),重塑金融未來
- 谷歌攜手Apptronik,AI+機器人引領(lǐng)未來:商業(yè)化人形機器人新紀(jì)元
- AI盛宴即將上演!李想回歸,理想汽車12月25日揭秘未來駕駛新篇章
- 特斯拉Model Y勁敵來襲!明年登陸英國市場的未來樂道L60引爆期待
- 火山引擎總裁回應(yīng)豆包大模型定價:如何確保合理毛利,揭秘行業(yè)內(nèi)幕
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。