在5月13日的第四屆國際智能運(yùn)維(AIOps)挑戰(zhàn)賽上,聯(lián)想研究院憑借業(yè)界領(lǐng)先的技術(shù)能力,在660支參賽隊(duì)伍中脫穎而出,奪得了大賽冠軍。
自2017年以來,聯(lián)想研究院企業(yè)服務(wù)云計(jì)算實(shí)驗(yàn)室智能運(yùn)維團(tuán)隊(duì)一直聚焦數(shù)據(jù)中心IT運(yùn)維的自動化和智能化,打造了領(lǐng)先的智能運(yùn)維引擎。在本次比賽中,他們創(chuàng)新地提出了基于有監(jiān)督算法構(gòu)造領(lǐng)域知識和無監(jiān)督算法多指標(biāo)異常評分相結(jié)合的方式,打造了實(shí)時、準(zhǔn)確的綜合故障檢測和根因定位方案,在決賽階段持續(xù)5天的在線算法評測中,評分大幅領(lǐng)先所有其它參賽團(tuán)隊(duì),勇奪桂冠。
除了聯(lián)想研究院,其他晉級決賽的戰(zhàn)隊(duì)包括億陽信通,北京大學(xué),交通銀行,寶蘭德軟件,平安科技,清華大學(xué),以及阿里巴巴達(dá)摩院&云數(shù)據(jù)庫、浙江大學(xué)、大連理工大學(xué)戰(zhàn)隊(duì)等。
運(yùn)維技術(shù)支撐著IT系統(tǒng)的穩(wěn)定運(yùn)行。數(shù)據(jù)中心,或俗稱的機(jī)房里,布置了大量的服務(wù)器。有的數(shù)據(jù)中心規(guī)模龐大,可能有成千上萬臺服務(wù)器。數(shù)據(jù)中心的規(guī)模越大,出現(xiàn)服務(wù)器故障的概率越高。而一臺服務(wù)器啟動日志就有數(shù)百萬行,面對故障,需要從海量的日志中定位問題,即使有經(jīng)驗(yàn)的專家也需要幾天時間才能發(fā)現(xiàn)問題。
隨著支撐數(shù)字世界的軟硬件系統(tǒng)越來越龐大、越來越復(fù)雜,因系統(tǒng)故障問題導(dǎo)致企業(yè)用戶流失和經(jīng)濟(jì)損失的案例逐漸增加。比如,2016年,全日航空由于IT故障導(dǎo)致多個航班被取消;2018年,澳大利亞電信公司Telstra遭遇軟件問題,導(dǎo)致全國范圍內(nèi)的數(shù)百萬客戶無法獲得4G移動服務(wù)……這樣的例子比比皆是。
如何快速發(fā)現(xiàn)、解決這樣的故障,傳統(tǒng)的被動響應(yīng)式IT運(yùn)維方式越來越力不從心,迫切需要更加實(shí)時、更加智能和準(zhǔn)確的IT系統(tǒng)運(yùn)維。于是,智能運(yùn)維(AIOps)技術(shù)應(yīng)時而起,應(yīng)運(yùn)而生了。智能運(yùn)維又稱AIOps(Artificial Intelligence for Operations),是把人工智能技術(shù)應(yīng)用在IT運(yùn)維領(lǐng)域,借助機(jī)器學(xué)習(xí)、深度神經(jīng)網(wǎng)絡(luò)、因果推斷分析等人工智能算法,提升系統(tǒng)自主分析決策能力并實(shí)現(xiàn)系統(tǒng)自治,代替人工進(jìn)行故障管理決策。
聚焦金融場景的智能運(yùn)維挑戰(zhàn)賽
本屆挑戰(zhàn)賽是第一屆國際互聯(lián)網(wǎng)產(chǎn)業(yè)科技創(chuàng)新大會的重要組成部分,由中國計(jì)算機(jī)學(xué)會、國家互聯(lián)網(wǎng)數(shù)據(jù)中心產(chǎn)業(yè)技術(shù)創(chuàng)新戰(zhàn)略聯(lián)盟、中國建設(shè)銀行、中國民生銀行和清華大學(xué)主辦,是業(yè)界頗具影響力的智能運(yùn)維大賽。
比賽以“云環(huán)境下商業(yè)銀行應(yīng)用系統(tǒng)的故障實(shí)時檢測與根因定位”為主題,采用了兩家大型商業(yè)銀行真實(shí)的應(yīng)用數(shù)據(jù),包含實(shí)際環(huán)境中常見的故障類型,具有不同的拓?fù)?,指?biāo)和故障分布差異巨大。
商業(yè)銀行應(yīng)用系統(tǒng)很少出現(xiàn)故障,但一旦出現(xiàn)故障,會產(chǎn)生重大影響。比如2018年,英國TSB銀行面向新的軟件平臺進(jìn)行了一輪大規(guī)模遷移,結(jié)果造成持續(xù)數(shù)周的重大業(yè)務(wù)中斷,導(dǎo)致了該銀行數(shù)百萬用戶的不滿,其CEO最終引咎辭職。
另外,試想一下,如果你正想買入一只股票或基金,而金融系統(tǒng)突然出現(xiàn)故障,交易因此失敗,導(dǎo)致蒙受重大損失……
此次比賽,就是針對金融場景下的IT系統(tǒng)故障檢測。具體而言,每支參賽隊(duì)伍需同時對兩家銀行的數(shù)據(jù)進(jìn)行實(shí)時的故障檢測,并在發(fā)生異常后的規(guī)定時間內(nèi),準(zhǔn)確定位出引起故障的指標(biāo)或日志。評測系統(tǒng)會從平均故障檢測時間、定位精度和查全率等指標(biāo)評判參賽隊(duì)伍的算法效果。
聯(lián)想研究院企業(yè)服務(wù)云計(jì)算實(shí)驗(yàn)室參賽團(tuán)隊(duì)(LR-AIOps)
領(lǐng)域知識建模和多指標(biāo)快速異常檢測及故障定位是聯(lián)想研究院在此次大賽中獲勝的核心技術(shù)能力之一,相關(guān)算法也已集成在聯(lián)想XClarity數(shù)據(jù)中心管理套件和聯(lián)想邊緣計(jì)算平臺中,正在幫助國內(nèi)外數(shù)以萬計(jì)的客戶提升IT運(yùn)維管理的體驗(yàn)和水平,大幅降低了業(yè)務(wù)支持成本,極大地提升了客戶滿意度。
(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實(shí),并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實(shí)內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )