1.背景概述
寶武裝備智能科技有限公司(以下簡稱:寶武智維)是中國寶武設(shè)備智能運維專業(yè)化平臺公司,30 余年始終專注于鋼鐵行業(yè)設(shè)備技術(shù)服務(wù),逐步打通檢測、診斷、檢修、制造等設(shè)備服務(wù)環(huán)節(jié),形成系統(tǒng)解決方案服務(wù)模式,希望為用戶提供穩(wěn)定可靠、智能高效的設(shè)備運行保障。
隨著工業(yè)物聯(lián)網(wǎng)的迅速發(fā)展,面向鋼鐵領(lǐng)域設(shè)備的智能運維成為大數(shù)據(jù)、人工智能等先進(jìn)技術(shù)重要的應(yīng)用方向之一。鋼鐵產(chǎn)線設(shè)備大型化、復(fù)雜度高,設(shè)備之間相互耦合,現(xiàn)場問題定位和修復(fù)難度非常高。同時,鋼鐵設(shè)備通常處于連續(xù)運轉(zhuǎn)狀態(tài),出現(xiàn)異常對于產(chǎn)線產(chǎn)能影響可觀,實現(xiàn)設(shè)備的實時性、預(yù)防性維護(hù)對于保障產(chǎn)線效能、實現(xiàn)企業(yè)降本增效均十分重要。
為實現(xiàn)鋼鐵產(chǎn)線設(shè)備智能運維這一項極具挑戰(zhàn)的復(fù)雜系統(tǒng)創(chuàng)新工程,寶武智維基于海量工業(yè)時序數(shù)據(jù)積累及其豐富的應(yīng)用場景,自主構(gòu)建具備低成本、大規(guī)模接入能力的設(shè)備遠(yuǎn)程智能運維平臺,并于 2023 年全面融合國產(chǎn)時序數(shù)據(jù)庫 IoTDB,作為該平臺管理寶武全集團(tuán)時序數(shù)據(jù)的核心組件。
通過 IoTDB,寶武智維得以“激活”時序數(shù)據(jù)價值,大幅提升寶武集團(tuán)、基地側(cè)智能化數(shù)據(jù)寫入、存儲、分析、傳輸性能,并為下游設(shè)備故障排查業(yè)務(wù)場景提供了堅實的數(shù)據(jù)支撐,形成了面向鋼鐵全流程,一個平臺、一個專家系統(tǒng)、一套標(biāo)準(zhǔn)化體系的智能設(shè)備運維新模式。
2.選型痛點
在全面接入 IoTDB 之前,寶武智維已經(jīng)經(jīng)過多年探索,并使用基于 Hadoop 的 HBase 和 OpenTSDB 作為鋼鐵設(shè)備的時序數(shù)據(jù)管理架構(gòu)。業(yè)務(wù)初期,該架構(gòu)應(yīng)用效果較好,但隨著更多數(shù)據(jù)量的接入,其慢慢成為了制約發(fā)展的底層瓶頸,主要體現(xiàn)在兩個大方面:“慢”和“難”。
寫入慢:常規(guī)情況下,舊版架構(gòu)勉強能夠達(dá)到寫入性能要求,但后續(xù)業(yè)務(wù)的擴(kuò)張伴隨設(shè)備、數(shù)據(jù)量的激增,結(jié)合基地網(wǎng)絡(luò)資源的有限性,寫入性能逐漸捉襟見肘。如果碰到網(wǎng)絡(luò)斷線等異常場景,往往大量消息、數(shù)據(jù)出現(xiàn)堵塞,網(wǎng)絡(luò)恢復(fù)后需要快速地進(jìn)行消費,但舊版架構(gòu)也無法支撐消費速度要求。
查詢慢:寶武集團(tuán)查詢數(shù)據(jù)跨度可能以年為單位,并要求大跨度數(shù)據(jù)實現(xiàn)查詢秒級響應(yīng),而在數(shù)據(jù)量增加后,舊版架構(gòu)僅能實現(xiàn) 5-30 秒內(nèi)返回,對于業(yè)務(wù)平臺使用效果與實時監(jiān)控設(shè)備狀態(tài)的目的實現(xiàn)存在較大影響。
加工慢:數(shù)據(jù)寫入存儲后,需要使用聚合函數(shù)等方法實現(xiàn)多類數(shù)據(jù)加工,但基于舊版架構(gòu)其速度非常有限,且很容易導(dǎo)致整體數(shù)據(jù)架構(gòu)不穩(wěn)定。
抽取慢、匯聚難:當(dāng)進(jìn)行集團(tuán)-基地數(shù)據(jù)資產(chǎn)整合時,往往需要不斷地將基地存儲數(shù)據(jù)抽取至集團(tuán)側(cè)。舊版架構(gòu)對于數(shù)據(jù)的實時傳輸支持不足,對持續(xù)的傳輸過程穩(wěn)定性影響較大。
清理難:基于舊版架構(gòu)的數(shù)據(jù)清理、刪減主要依靠 TTL,過程復(fù)雜且靈活度較低。寶武集團(tuán)實踐時,曾出現(xiàn)磁盤將滿情況下,定好的數(shù)據(jù)需要寫程序進(jìn)行導(dǎo)出,再導(dǎo)回系統(tǒng)的情況,數(shù)據(jù)運維工作十分繁瑣。
備份難:龐大的數(shù)據(jù)體量下,基于舊版架構(gòu)的策略化備份實現(xiàn)非常困難,基本無法備份,只能選擇部署 3 節(jié)點集群以響應(yīng)備份需求。
耗費大量成本獲取的海量高價值數(shù)據(jù),卻變成了深不見底的數(shù)據(jù)黑洞。隨著數(shù)據(jù)量不斷增長,運行效率卻無法提升,數(shù)據(jù)反而成為拖累,下游應(yīng)用系統(tǒng)、團(tuán)隊的施展空間很低,無法將數(shù)據(jù)價值真正轉(zhuǎn)化為業(yè)務(wù)價值。
因此,寶武智維的時序數(shù)據(jù)庫選型標(biāo)準(zhǔn)可以概括為:
能夠?qū)懭牒A坎l(fā)數(shù)據(jù);
能夠用更低成本存儲全量數(shù)據(jù)、高頻數(shù)據(jù);
能夠?qū)崟r查詢、分析數(shù)據(jù),實現(xiàn)高效的數(shù)據(jù)清理與備份;
能夠?qū)崿F(xiàn)集團(tuán)側(cè)-基地側(cè)數(shù)據(jù)實時同步、匯聚的易用方案。
3.部署方案
2023 年開始,IoTDB 全面替換 OpenTSDB,成為寶武集團(tuán)時序數(shù)據(jù)湖的數(shù)據(jù)底座。運用 IoTDB 為時序數(shù)據(jù)管理核心的寶武智維云平臺,已部署至寶武集團(tuán)全部生產(chǎn)基地,并逐步擴(kuò)展至集團(tuán)外,負(fù)責(zé)接入寶武全集團(tuán)所有基地內(nèi)的所有設(shè)備數(shù)據(jù),并進(jìn)行在線狀態(tài)監(jiān)測與設(shè)備智能運維業(yè)務(wù)。
目前,寶武智維云全面覆蓋寶武集團(tuán) 21 大生產(chǎn)基地,接入 27 個子平臺、60 萬以上設(shè)備、240 萬以上數(shù)據(jù)項,總數(shù)據(jù)量超 5 PB。平臺配置規(guī)則超 10 萬條,已沉淀智能模型超 40 大類,平臺用戶數(shù)超 1 萬。
從以 IoTDB 進(jìn)行重構(gòu)的全新架構(gòu)來看,寶武超大規(guī)模分布式數(shù)據(jù)湖由 1 個 E4-IoTDB 集團(tuán)數(shù)據(jù)湖和 N 個 E3-IoTDB 基地數(shù)據(jù)湖集群組成。多個 E3-IoTDB 基地數(shù)據(jù)湖負(fù)責(zé)存儲管理該基地的設(shè)備數(shù)據(jù),而寶武集團(tuán)層的 E4-IoTDB 數(shù)據(jù)湖主要覆蓋常態(tài)數(shù)據(jù)的降頻存儲和故障相關(guān)數(shù)據(jù)的原始頻率存儲。同時,集團(tuán)層可以通過下發(fā)任務(wù)方式,從各個基地抽取所需數(shù)據(jù)并進(jìn)行存儲,用于模型訓(xùn)練及定制化數(shù)據(jù)任務(wù)。
寶武集團(tuán)與基地之間的數(shù)據(jù)同步方式目前有兩種。第一種為通過 Pipe 使用 IoTDB 自研的時序數(shù)據(jù)標(biāo)準(zhǔn)文件格式 TsFile 進(jìn)行高效傳輸,不需要數(shù)據(jù)的重新組織和重復(fù)寫入,可實現(xiàn)數(shù)據(jù)端到端的直接使用。另一種為使用全貫通的 Kafka 數(shù)據(jù)總線進(jìn)行數(shù)據(jù)上傳,能夠滿足寶武各基地及集團(tuán)的數(shù)據(jù)防火墻傳輸要求。
實現(xiàn)數(shù)據(jù)的高性能寫入、存儲,并打通數(shù)據(jù)抽取、傳輸鏈路后,寶武集團(tuán)成功構(gòu)建了 E4 集團(tuán)數(shù)據(jù)湖與 E3 基地數(shù)據(jù)湖。集團(tuán)數(shù)據(jù)湖包括一個主庫、N 個功能庫和一個備份庫,功能庫又包括故障特征庫與 AI 訓(xùn)練庫。故障特征庫包括所有基地的設(shè)備故障特征,各基地一天幾十條至幾百條不等的故障事件所涉及到的相關(guān)數(shù)據(jù)均會上傳并進(jìn)行存儲,方便集團(tuán)集中分析故障趨勢與原因。各基地數(shù)據(jù)湖則包括一個主庫、一個功能庫和一個備份庫,功能庫主要做為同步庫使用。
使用 IoTDB 后,寶武集團(tuán)時序數(shù)據(jù)管理效果提升非常明顯,實現(xiàn)性能提升 1 個量級,存儲成本大幅下降,運維手段豐富,數(shù)據(jù)資產(chǎn)匯聚,AI 模型訓(xùn)練加速等有效成果。
存儲成本方面,通過實踐,基于 IoTDB 可實現(xiàn) 10 倍數(shù)據(jù)壓縮比,并能夠用少量服務(wù)器存儲集團(tuán)規(guī)模數(shù)據(jù)。對于鋼鐵領(lǐng)域最重要的數(shù)據(jù)類型之一——信號數(shù)據(jù)的存儲成本也得到大幅降低。
運維手段方面,相比舊版架構(gòu)僵化、暴力的數(shù)據(jù)清洗處理方式,寶武集團(tuán)成功基于 IoTDB 實現(xiàn)備份、清理的靈活策略化,能夠積累豐富的指標(biāo)、監(jiān)測信息,幫助運維人員實現(xiàn)對設(shè)備狀態(tài)的更好理解。
性能指標(biāo)方面,IoTDB 寫入速度可實現(xiàn)千萬點/秒,可以長時間穩(wěn)定寫入高頻數(shù)據(jù);基地上報的秒級數(shù)據(jù)及邊緣側(cè)上報的毫秒級數(shù)據(jù),一年數(shù)據(jù)量查詢可實現(xiàn)秒級返回,并能夠覆蓋長達(dá)十年、數(shù)百萬點的設(shè)備數(shù)據(jù)降采樣分析,性能獲得用戶認(rèn)可。同時,IoTDB 提供了豐富的聚合函數(shù),有效拓寬寶武集團(tuán)的數(shù)據(jù)加工場景,加速原始數(shù)據(jù)加工,并通過上述數(shù)據(jù)傳輸方案提升數(shù)據(jù)匯聚速度,方便數(shù)據(jù)真正形成模型,實現(xiàn)規(guī)?;\用。
與前文中的選型要求對照可見,IoTDB 在寫入、存儲、查詢、分析、運維、匯聚等方向,均契合了寶武智維的時序數(shù)據(jù)庫選型標(biāo)準(zhǔn),從根源處解決了 OpenTSDB 與 HBase 架構(gòu)的多個性能與功能實踐痛點。
4.應(yīng)用場景舉例
場景一:波形信號數(shù)據(jù)處理
鋼鐵行業(yè)中,設(shè)備實時上報的振動波形數(shù)據(jù)是最可靠的時序數(shù)據(jù)資產(chǎn)之一,能夠有效反映設(shè)備的運行狀態(tài)。寶武集團(tuán)的振動波形數(shù)據(jù)一般分為兩類,一類是通過 PLC、DCS 采集上報的工藝量數(shù)據(jù),一類是通過加裝大量傳感器,如溫振傳感器采集上報的振動波形數(shù)據(jù)。各類傳感器安裝數(shù)量龐大,因此后一類數(shù)據(jù)的體量十分可觀。
舊版架構(gòu)中,以上兩類數(shù)據(jù)基本通過對象存儲方式存入 HBase,存儲量占比在某些基地達(dá)到 1:20。一個基地的數(shù)據(jù)中,20 份為振動數(shù)據(jù),1 份為工藝量數(shù)據(jù),可見振動傳感器上傳的時序數(shù)據(jù)體量十分龐大,存儲管理的成本,以及后續(xù)使用處理的難度可想而知。
引入 IoTDB之后,參考 IoTDB 團(tuán)隊所在的天謀科技技術(shù)人員的建議,寶武智維不再將振動波形數(shù)據(jù)作為對象進(jìn)行存儲,而是直接將數(shù)據(jù)拆散之后,以納秒級精度存儲到 IoTDB,這樣能夠有效提升該類數(shù)據(jù)的存儲壓縮比,大幅降低其存儲成本。同時,存儲模式發(fā)生變化后,應(yīng)用模式也隨之發(fā)生變化。寶武智維可以直接在 IoTDB 層面對振動波形數(shù)據(jù)進(jìn)行處理,為后續(xù)的數(shù)據(jù)加工工作提供了有力支撐。寶武智維表示該項改良是“非常顛覆性的設(shè)計”。
場景二:結(jié)合 AI 的創(chuàng)新應(yīng)用
IoTDB 有效解決了數(shù)據(jù)的抽取、存儲、處理、上傳問題后,豐富的時序數(shù)據(jù)資產(chǎn)被徹底激活,寶武智維也就能夠拓寬目前應(yīng)用數(shù)據(jù)的模式與發(fā)展空間。其 AI 團(tuán)隊成功從“找數(shù)據(jù)”改變?yōu)?ldquo;要數(shù)據(jù)”,能夠發(fā)散更多有想象力的創(chuàng)新應(yīng)用場景,面向多設(shè)備、長周期數(shù)據(jù)進(jìn)行進(jìn)一步歸納與分析。衍生場景包括但不限于:
通用數(shù)據(jù)集的自動構(gòu)建、自動標(biāo)簽化:基于反饋(誤報和漏報) 和閉環(huán)進(jìn)行標(biāo)簽化。
同類故障的數(shù)據(jù)集的構(gòu)建:故障記錄和多源數(shù)據(jù)的匹配映射,基于故障記錄和故障匹配的數(shù)據(jù)對故障類型、故障程度進(jìn)行標(biāo)簽化。
同類設(shè)備的數(shù)據(jù)集的構(gòu)建:同類設(shè)備數(shù)據(jù)的歸并和映射,基于設(shè)備基準(zhǔn)、設(shè)備參數(shù)信息,對同類、同部件同型號進(jìn)行匹配和標(biāo)簽化。
振動信號的特征提?。簳r域信號分段特征的提取、長周期信號特征的提取、頻域特征的提取。
趨勢特征的提?。洪L周期數(shù)據(jù)特征的提取,月度或年度數(shù)據(jù)特征的提取;生產(chǎn)周期的劃分,周期性生產(chǎn)過程特征的提取。
數(shù)據(jù)對齊和數(shù)據(jù)融合:工況數(shù)據(jù)的匹配,多源異構(gòu)數(shù)據(jù)(時序、文本、人工輸入數(shù)據(jù))的匹配。
文本對象數(shù)據(jù)集的構(gòu)建:文本數(shù)據(jù)信息的抽取、實體的匹配。
AI 平臺與 IoTDB 的雙向通訊:數(shù)據(jù)集映射、抽取至 AI 平臺,實現(xiàn)存儲處理與深度分析的一體化融合。
5.未來展望
寶武智維計劃未來在與 IoTDB 深度融合的更多方面進(jìn)行研究,包括但不限于:
視圖功能:切實結(jié)合業(yè)務(wù)需求,實現(xiàn)測點數(shù)據(jù)扁平化。圍繞生產(chǎn)、質(zhì)量、運維等不同角度,結(jié)合 IoTDB 自帶的時序數(shù)據(jù)樹狀模型,運用視圖功能組織、復(fù)用數(shù)據(jù)資產(chǎn),從業(yè)務(wù)方向組織成不同視角的數(shù)據(jù)樹狀架構(gòu),進(jìn)一步降低團(tuán)隊運維學(xué)習(xí)成本。
中臺功能:基于 IoTDB 進(jìn)行通用數(shù)據(jù) API 與專用數(shù)據(jù) API 的研發(fā),形成數(shù)據(jù)資產(chǎn)管理,并在該數(shù)據(jù)中臺之上進(jìn)行 APP 輕量化,以及數(shù)據(jù)可視化的自主探索。
UDF 函數(shù):目前,IoTDB 主要用于構(gòu)建寶武智維平臺中的數(shù)據(jù)存儲、處理底座,未來希望針對振動波形、信號數(shù)據(jù)、長周期趨勢分析等關(guān)鍵場景,通過研發(fā) UDF 自定義函數(shù)并內(nèi)嵌至數(shù)據(jù)湖中,替代原有的外掛 Python 程序調(diào)用,結(jié)合數(shù)據(jù) API、AI 模型,全面提升寶武集團(tuán)工業(yè)數(shù)據(jù)應(yīng)用分析能力。
AINode:通過引入 IoTDB 內(nèi)生支持的機(jī)器學(xué)習(xí)智能節(jié)點,替代原有的數(shù)據(jù)再抽取、單獨外部訓(xùn)練模式,支持使用已有模型直接在 IoTDB 內(nèi)部進(jìn)行推理,針對鋼鐵領(lǐng)域數(shù)據(jù)預(yù)測、異常檢測等方面進(jìn)行預(yù)制模型訓(xùn)練和加載,達(dá)到無需導(dǎo)出數(shù)據(jù),直接使用內(nèi)置模型進(jìn)行數(shù)據(jù)推理的目標(biāo),實現(xiàn)端到端的數(shù)據(jù)深度分析。
以數(shù)據(jù)為牽引,以平臺化為手段,IoTDB 將繼續(xù)與寶武智維深度合作,更好地串聯(lián)產(chǎn)業(yè)鏈上下游數(shù)據(jù)資源,共建鋼鐵生態(tài)圈智能運維服務(wù)生態(tài),讓數(shù)據(jù)賦能鋼鐵產(chǎn)業(yè)價值。
(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實,并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )