在今天這樣的一個云原生時代,業(yè)務(wù)系統(tǒng)不斷上云,容器、微服務(wù)、持續(xù)發(fā)布等云原生技術(shù)被廣泛采用,從而為IT系統(tǒng)的可控性帶來了全新挑戰(zhàn)。我們應(yīng)該以什么樣的方式對云原生應(yīng)用進行監(jiān)控和管理——為保障云原生應(yīng)用的穩(wěn)定性,可觀測技術(shù)被越來越多的企業(yè)所采用。
在了解之前需要明確的是可觀測性不僅是對技術(shù)的要求,更需要團隊融入可觀察性的理念,近些年,隨著可觀測性技術(shù)進一步普及,越來越多的企業(yè)進入嘗試階段,并逐步開展實施。通過可觀測性技術(shù),看到表象,鎖定問題,解決問題,不僅成為企業(yè)系統(tǒng)內(nèi)部狀態(tài)的重要衡量方式,也成為解決系統(tǒng)問題的首選方案,這在阿里、騰訊、奇虎360及B站早已實現(xiàn)了穩(wěn)步落地,并逐漸解鎖產(chǎn)品研發(fā)的各個場景中。
為梳理行業(yè)的最佳實踐,GOPS 全球運維大會·深圳站特別邀請了多位可觀測性領(lǐng)域資深技術(shù)專家,希望在可觀測性技術(shù)平臺的架構(gòu)理念、大數(shù)據(jù)技術(shù)下的云原生監(jiān)控等多方面,與眾多參會嘉賓共同探討未來可觀測性實踐的更多可能。
李煌東,阿里巴巴架構(gòu)師
演講主題:基于 eBPF 的 Kubernetes 可觀測性最佳實踐
Kubernetes監(jiān)控是ARMS打造的基于eBPF、實現(xiàn)無侵入、支持多語言&多協(xié)議的Kubernetes可觀測一站式工具,核心場景支持應(yīng)用黃金指標、應(yīng)用拓撲感知、網(wǎng)絡(luò)流量&性能分析、資源消耗分析等,具有無侵入、多語言、多協(xié)議的特點。本Topic將介紹:1、Kubernetes集群運維的痛點及應(yīng)對方案;2、阿里Kubernetes監(jiān)控的最佳實踐和商業(yè)化路線
演講提綱:
1、 什么是可觀測性?
2、 Kubernetes中的可觀測性痛點?
3、 Kubernetes監(jiān)控解決方案、挑戰(zhàn)
4、 Under the hood – Prometheus(事實標準)+ eBPF(超能力)
5、 Kubernetes問題排查全景圖
6、 案例分析
7、 演進路線
胡喆騫,奇虎360 資深技術(shù)專家
演講主題:大數(shù)據(jù)技術(shù)下的云原生監(jiān)控
面對多云異構(gòu)環(huán)境下,數(shù)萬臺服務(wù)器、數(shù)千臺交換機,不僅需要專業(yè)的人員、嚴謹?shù)牧鞒蹋枰m合新環(huán)境下的高效工具?;诳捎^測性理念的新一代工具,可以有效應(yīng)對云原生時代下對于運維的艱難挑戰(zhàn)。本次將圍繞異構(gòu)環(huán)境下,使用智能化工具對數(shù)據(jù)采集、指標度量、鏈路追蹤領(lǐng)域的便捷性進行說明。
演講提綱:
1、企業(yè)當前的業(yè)務(wù)變遷——離線業(yè)務(wù)為主變?yōu)樵诰€業(yè)務(wù)為主
2、場景增多面對挑戰(zhàn)的新應(yīng)對——可發(fā)現(xiàn)、可度量、可追溯、可管理
3、大數(shù)據(jù)與云原生——云原生技術(shù)與大數(shù)據(jù)下產(chǎn)品形態(tài)
4、云原生監(jiān)控的未來——云原生、大數(shù)據(jù)、AI相結(jié)合下更精準的監(jiān)控
梁俊杰,騰訊IEG SRE技術(shù)專家
演講主題:騰訊IEG可觀測平臺的建設(shè)及SRE實踐
分享騰訊藍鯨可觀測平臺的設(shè)計理念及架構(gòu)設(shè)計,并介紹在平臺建設(shè)過程中,如何通過SRE理念落地實踐,提高系統(tǒng)的交付質(zhì)量及降低系統(tǒng)的運維成本。
演講提綱:
1、騰訊藍鯨可觀測平臺設(shè)計理念
2、騰訊藍鯨可觀測平臺架構(gòu)設(shè)計
3、平臺建設(shè)中的SRE實踐
武安闖,bilibili基礎(chǔ)架構(gòu)部 在線業(yè)務(wù)SRE負責人
演講主題:B站SRE的穩(wěn)定性實踐與反思
SRE如何轉(zhuǎn)型落地?B站SRE做了什么事情?SRE按Google SRE模式實踐是最佳嗎?我們對Google SRE有哪些反思?本次分享會從組織轉(zhuǎn)型,多活容災(zāi)、容量管理、活動保障、故障處理、質(zhì)量運營等多個方面解析B站的穩(wěn)定性體系建設(shè)實踐與反思。
演講提綱:
1、從業(yè)務(wù)運維到SRE的轉(zhuǎn)型
2、SRE穩(wěn)定性保障體系建設(shè)實踐
3、SRE的左與右,再轉(zhuǎn)型
4、SRE文化的建設(shè)與推廣
張越,騰訊TEG 資深架構(gòu)師
演講主題:多元化可觀測體系建設(shè)思考與實踐
隨著研發(fā)效能戰(zhàn)略的推進,可觀測性作為最常用且重要的能力,受到越來越多的關(guān)注。騰訊內(nèi)部業(yè)務(wù)呈現(xiàn)多元化特點,可觀測能力的統(tǒng)一就成為了挑戰(zhàn)。本次分享將主要介紹騰訊TEG在滿足多元化業(yè)務(wù)的可觀測體系方面的設(shè)計思路、架構(gòu)演進過程,以及在落地中的關(guān)鍵技術(shù)實踐。希望我們在實踐中總結(jié)的經(jīng)驗教訓(xùn)和思路可以為大家在探索可觀測性帶來幫助。
演講提綱:
1、騰訊TEG可觀測背景
· 多元化業(yè)務(wù)背景下的可觀測
· 痛點和挑戰(zhàn)
2、可觀測體系構(gòu)建思路和架構(gòu)演進
· 可觀測體系結(jié)構(gòu)設(shè)計思路
· 架構(gòu)演進思路
3、可觀測核心問題落地實踐
· TSDB設(shè)計
· 信息整合和關(guān)聯(lián)
· 告警準確率
4、總結(jié)和展望
以上簡介為 GOPS 全球運維大會 2022 · 深圳站的一部分
更多精彩內(nèi)容請參見大會日程,報名參會可關(guān)注大會官網(wǎng)
(免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關(guān)資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責任。
任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )