日本综合一区二区|亚洲中文天堂综合|日韩欧美自拍一区|男女精品天堂一区|欧美自拍第6页亚洲成人精品一区|亚洲黄色天堂一区二区成人|超碰91偷拍第一页|日韩av夜夜嗨中文字幕|久久蜜综合视频官网|精美人妻一区二区三区

RELATEED CONSULTING
相關(guān)咨詢
選擇下列產(chǎn)品馬上在線溝通
服務(wù)時(shí)間:8:30-17:00
你可能遇到了下面的問題
關(guān)閉右側(cè)工具欄

新聞中心

這里有您想知道的互聯(lián)網(wǎng)營銷解決方案
從技術(shù)運(yùn)營中臺建設(shè)到AIOps實(shí)踐,看著一篇就夠了

 作者簡介:

創(chuàng)新互聯(lián)建站專注于仙游企業(yè)網(wǎng)站建設(shè),響應(yīng)式網(wǎng)站,電子商務(wù)商城網(wǎng)站建設(shè)。仙游網(wǎng)站建設(shè)公司,為仙游等地區(qū)提供建站服務(wù)。全流程按需求定制制作,專業(yè)設(shè)計(jì),全程項(xiàng)目跟蹤,創(chuàng)新互聯(lián)建站專業(yè)和態(tài)度為您提供的服務(wù)

朱世翔,北京移動(dòng)信息系統(tǒng)部技術(shù)運(yùn)維中臺產(chǎn)品經(jīng)理、系統(tǒng)運(yùn)維組主管。

具備較豐富的運(yùn)營上部域系統(tǒng)一線運(yùn)維管理經(jīng)驗(yàn),今年帶領(lǐng)團(tuán)隊(duì)進(jìn)行技術(shù)運(yùn)營能力的建設(shè),初步完成了北京移動(dòng)業(yè)務(wù)支撐系統(tǒng)運(yùn)維能力自動(dòng)化、智能化轉(zhuǎn)型。目前致力于AIOps和運(yùn)維中臺體系實(shí)踐、運(yùn)維開發(fā)團(tuán)隊(duì)構(gòu)建和管理。

文章目錄:

  • 背景介紹
  • 技術(shù)運(yùn)營中臺
  • 技術(shù)運(yùn)營實(shí)踐
  • AIOps 探索
  • 未來展望

一、背景介紹

5G商用啟動(dòng)開始,三大運(yùn)營商正式推出了5G套餐,5G是下一代通信技術(shù),那么5G時(shí)代來了之后同樣需要下一代運(yùn)維。

我們就對下一代運(yùn)維是怎么理解呢?其實(shí)當(dāng) 5G 來了之后,我們理解是有兩個(gè)新的要求:第一,我們面臨的一些場景會(huì)變得復(fù)雜化,對原有運(yùn)維能力的要求也更高了。第二,5G 來了之后運(yùn)維邊界也是不斷拓展的。

第一點(diǎn)怎么理解呢?大家可以思考一個(gè)問題,我們運(yùn)營商和互聯(lián)網(wǎng)行業(yè)、金融行業(yè)核心提供業(yè)務(wù)形態(tài)是不一樣的。

比如,一個(gè)電商企業(yè)提供了業(yè)務(wù)形態(tài)把產(chǎn)品賣好,可以在網(wǎng)站上完成購物,金融行業(yè)是圍繞錢提供一些服務(wù),我們的運(yùn)營商核心服務(wù)形態(tài)是資源,包括語音、流量等,這個(gè)業(yè)務(wù)形態(tài)有什么樣的特點(diǎn)呢?流量和資源服務(wù)每時(shí)每刻都在不斷變化的,所以在這個(gè)過程當(dāng)中給客戶提供一些什么樣的運(yùn)營服務(wù)呢?會(huì)有例如流量提醒等。

我們的團(tuán)隊(duì)會(huì)做一些流量及時(shí)性保障,這是我們的運(yùn)維核心工作之一。我們原來的東西是在變化的,因?yàn)?5G 已經(jīng)變化更快了,要保障客戶進(jìn)行實(shí)時(shí)提醒的難度在增大,要求更高。

第二,運(yùn)維的邊界要進(jìn)行拓展。那么,拓展方面的是什么挑戰(zhàn)呢?

第一個(gè)挑戰(zhàn),傳統(tǒng)的運(yùn)維系統(tǒng)是按照煙囪式進(jìn)行建設(shè)的,按域來劃分有業(yè)支運(yùn)維(B域運(yùn)維)、網(wǎng)絡(luò)運(yùn)維(O域運(yùn)維)。
業(yè)務(wù)運(yùn)維就是業(yè)務(wù)支撐系統(tǒng)運(yùn)維,就是平時(shí)訂購流量包的套餐計(jì)費(fèi)完成,是基于傳統(tǒng)的IT 系統(tǒng)技術(shù)棧來完成這個(gè)過程。
而網(wǎng)絡(luò)運(yùn)維,是圍繞網(wǎng)絡(luò)設(shè)備的運(yùn)行狀態(tài)進(jìn)行,保障的是我的基站是不是有信號等,這是網(wǎng)絡(luò)設(shè)備的運(yùn)維。不同域的運(yùn)維,甚至同一個(gè)域內(nèi)不同的運(yùn)維系統(tǒng),在系統(tǒng)能力建設(shè)上也是隔離的過程。

第二個(gè)挑戰(zhàn)是提供端到端服務(wù)時(shí),沒有辦法提供端到端的運(yùn)維保障服務(wù)。舉個(gè)例子,有一天用戶手機(jī)正常時(shí)沒有辦法上網(wǎng)是什么情況呢?有可能是IT系統(tǒng)的計(jì)費(fèi)出錯(cuò)了,導(dǎo)致停機(jī)了沒有辦法上網(wǎng)了,有可能是網(wǎng)絡(luò)設(shè)備故障導(dǎo)致沒有網(wǎng)絡(luò)信號了,導(dǎo)致無法上網(wǎng)。

我們傳統(tǒng)運(yùn)維響應(yīng)特點(diǎn)就是各查各的,整個(gè)核查過程是比較長的,同時(shí)效率是比較低的,反映不及時(shí),就會(huì)帶來不好的用戶體驗(yàn)感。

第三個(gè)挑戰(zhàn),我們是如何看待運(yùn)維技術(shù)的發(fā)展和升級呢?實(shí)際上我們理解運(yùn)維能力升級更新圍繞運(yùn)維對象的技術(shù)變化而發(fā)生變化的,隨著運(yùn)維對象引入云計(jì)算、容器等,導(dǎo)致運(yùn)維技術(shù)和要求需要隨之迭代升級。 

第四個(gè)挑戰(zhàn),網(wǎng)絡(luò)運(yùn)維開始引入了IT技術(shù),CT領(lǐng)域開始跟IT融合,所以會(huì)導(dǎo)致運(yùn)維模式、生態(tài)圈發(fā)生一個(gè)比較大的變化。

那么,5G時(shí)代 ICT 融合的背景下,運(yùn)維能力是可以進(jìn)行賦能的。第一,網(wǎng)絡(luò)運(yùn)維軟件化之后可以隨著技術(shù)引入,可以向 IT 領(lǐng)域進(jìn)行發(fā)展。
同時(shí)5G時(shí)代的網(wǎng)絡(luò)切片更加靈活,可以對不同行業(yè)不同場景提供支撐,所以對網(wǎng)絡(luò)需求的交付速度提出了更高敏捷要求。所以網(wǎng)絡(luò)域運(yùn)維需要有一個(gè)持續(xù)交付以及一個(gè)敏捷的過程。
因此搞 IT 運(yùn)維的發(fā)現(xiàn)網(wǎng)絡(luò)運(yùn)維開始需要IT運(yùn)維能力,因?yàn)橄到y(tǒng)架構(gòu)和5G網(wǎng)絡(luò)特點(diǎn)導(dǎo)致他們需要IT運(yùn)維的能力,這時(shí)候發(fā)現(xiàn)我們的IT運(yùn)維是可以賦能的。因?yàn)樵跇I(yè)支運(yùn)維這邊從一開始的建設(shè)就在緊跟 IT 變化,所以說從移動(dòng)成立開始就做了基于IT的技術(shù)棧演進(jìn)。

基于這個(gè)切入點(diǎn),我們可以看到 ICT 融合進(jìn)行過程。我們的IT運(yùn)維有之前的ITOA、ITOM等,我們是從業(yè)務(wù)網(wǎng)管到 DevOps 平臺,以前的網(wǎng)絡(luò)管理系統(tǒng)特點(diǎn)是電子工單流。
在5G時(shí)代技術(shù)開始進(jìn)入了軟件化時(shí)代,這兩個(gè)可以逐步融合了,可以建設(shè)一個(gè)靈活可用的平臺,來賦能促使CT和IT平臺進(jìn)行融合。

基于 5G 時(shí)代到來這么一個(gè)很好的切入點(diǎn)和我們傳統(tǒng)運(yùn)維面臨的挑戰(zhàn),最后匯總到一起可以讓技術(shù)運(yùn)營中臺,打通整個(gè)全領(lǐng)域的運(yùn)維能力。

二、技術(shù)運(yùn)營中臺

什么是技術(shù)運(yùn)營中臺?其實(shí)分為技術(shù)運(yùn)營+中臺。 

首先說我們怎么理解技術(shù)運(yùn)營?技術(shù)運(yùn)營與傳統(tǒng)運(yùn)維的區(qū)別是什么?

簡單來說,技術(shù)運(yùn)營不僅關(guān)注傳統(tǒng)運(yùn)營團(tuán)體理解的系統(tǒng)穩(wěn)定、系統(tǒng)安全等指標(biāo),還會(huì)從運(yùn)營角度去關(guān)注效率、客戶體驗(yàn)等指標(biāo)。

那么我們對中臺理解是什么的呢?

第一,企業(yè)級是很關(guān)鍵的,如果你是一個(gè)小的團(tuán)隊(duì),你自己做一個(gè)中臺是沒有意義的。前臺是比較輕,中臺比較重,后臺是賦能的,所以企業(yè)級是很重要的,你現(xiàn)在是給企業(yè)里面的所有的應(yīng)用團(tuán)隊(duì)和業(yè)務(wù)團(tuán)隊(duì)使用你的中臺。

在5G時(shí)代條件下,我們的中臺要面向B域、M域和O域,就是我們的網(wǎng)絡(luò)、IT系統(tǒng)等全局來考慮問題。

第二,能力是中臺主要承載的的對象,要從業(yè)務(wù)中抽離出來,梳理技術(shù)運(yùn)營的公共能力。

第三,復(fù)用是中臺的核心價(jià)值,要去重早復(fù)用對比平臺更細(xì)粒度的抽離。

我們講一下設(shè)計(jì)中臺時(shí)的關(guān)鍵點(diǎn),這是從架構(gòu)方面做的簡單分享。其實(shí)你要做一個(gè)中臺,你要把各個(gè)團(tuán)隊(duì)場景的重復(fù)建設(shè)能力和重復(fù)用的場景抽象出來,做成一個(gè)統(tǒng)一的公共組建能力。

舉個(gè)簡單例子,其實(shí)我們的能力是不止這些的,在以前流程有一個(gè)業(yè)務(wù)平臺,用戶管理有一個(gè)平臺,流量管理有一個(gè),他們都在不同平臺對數(shù)據(jù)進(jìn)行采集、傳輸、檢測、管理,這些冗余都是重復(fù)的。 

第一步,我們要把各個(gè)運(yùn)維建設(shè)能力要做一個(gè)邏輯上的抽象,做一個(gè)技術(shù)上的傳輸,這個(gè)其實(shí)可能跟微服務(wù)治理有一些類似的理念。

第二步,能力復(fù)用。我們建設(shè)一個(gè)運(yùn)維能力開放平臺,首先抽象出來的能力把做好之后,需要注冊在能力平臺上實(shí)現(xiàn)開放,比如說B域、M域不同場景是通過能力平臺做一個(gè)統(tǒng)一的轉(zhuǎn)換來帶動(dòng)后端能力。
同時(shí)這個(gè)也會(huì)帶來運(yùn)維團(tuán)隊(duì)職責(zé)和技能的一個(gè)轉(zhuǎn)型,當(dāng)前端不管是哪一個(gè)領(lǐng)域有需求時(shí),團(tuán)隊(duì)治理能力需要看的是中臺有哪些能力支撐你的場景,我要做對運(yùn)維能力做一個(gè)管控。

第二,他們在能力開放平臺去做一些場景運(yùn)維分析,比如說這個(gè)能力時(shí)長、調(diào)動(dòng)量、成功率是不是滿足要求,如果不能滿足要求要及時(shí)提出,去通知后端系統(tǒng)和能力去進(jìn)行改進(jìn)。 

這樣你的組織架構(gòu)就會(huì)變化點(diǎn),你要有一個(gè)特定的能力技術(shù)團(tuán)隊(duì),會(huì)基于技術(shù)平臺做一些服務(wù)治理的事,所以必須對服務(wù)進(jìn)行管控。

第三步,做了中臺之后,需要給第三方和其他團(tuán)隊(duì)進(jìn)行開放,你要有一些柔性的服務(wù)能力。比如說,對其進(jìn)行限流隔離、熔斷,這個(gè)是中臺能力管控過程。
我們確定出來了一個(gè)技術(shù)框架,這塊還是體現(xiàn)在中臺分配邏輯,我們分成了各種管理操作,我們在里面不斷補(bǔ)充我們的原子化、公共化能力做復(fù)用。

這塊(見上圖)講的是技術(shù)運(yùn)營中臺怎么做設(shè)計(jì)思路的過程,每個(gè)團(tuán)隊(duì)做中臺設(shè)計(jì)時(shí)里面的東西分類不一定是這樣的,或者組件不一定這么設(shè)計(jì),原理是相通的,因?yàn)槟闶墙o前臺去提供賦能和運(yùn)營能力,所以你同時(shí)要進(jìn)行管控,這是一個(gè)核心原則。

三、技術(shù)運(yùn)營實(shí)踐

我們基于生態(tài)能力做了很多實(shí)踐場景,這些都基于中臺能力做了場景化。  

這個(gè)技術(shù)運(yùn)營藍(lán)圖是我們團(tuán)隊(duì)在2016年提出來的,是從集團(tuán)規(guī)范戰(zhàn)略到省公司落地全畫房子,前面是愿景核心,同時(shí)達(dá)到愿景做什么事情,要做這些事情需要做什么樣的保障。
其實(shí)運(yùn)營團(tuán)隊(duì)傳統(tǒng)里面、企業(yè)里面或者自己本身認(rèn)知里面是一個(gè)后端成本部門,是在不斷花錢保障不出事。
我們團(tuán)隊(duì)在不斷思考,技術(shù)運(yùn)維和運(yùn)營的區(qū)別是什么呢?運(yùn)營就是可以創(chuàng)造社會(huì)價(jià)值,就是信息部團(tuán)隊(duì)在2016年提出的藍(lán)圖,這中間也在不斷優(yōu)化,我們不是在去替別人背鍋,不是給別人補(bǔ)漏。
基于這個(gè)愿景提出了核心,就是要保障業(yè)務(wù)滿意,要進(jìn)行一個(gè)風(fēng)險(xiǎn)防控?;谶@些核心做了分解,這些是能力的分解。從標(biāo)準(zhǔn)化到自動(dòng)化、可視化、智能化,這樣是我們一個(gè)藍(lán)圖設(shè)計(jì),我們的崗位設(shè)置都是圍繞這張圖不斷滿足愿景的目標(biāo)。

第一塊講一下CMDB。我們現(xiàn)在分享兩個(gè)點(diǎn),CMDB設(shè)計(jì)時(shí)想得比較全面,我們做了一個(gè)靈活自定義。比如說屬性自定義、模型自定義,其實(shí)這兩個(gè)場景是不一樣的,而你做業(yè)務(wù)模型管理也是不一樣的,里面主要就是IaaS和PaaS的東西。
假如說做一個(gè)軟件版本管理時(shí),你的模型分層是根據(jù)軟件開發(fā)流程有分支的,那我們的模型是可以自定義的,包括模型里面的屬性關(guān)系都是自定義比較靈活的。

我們現(xiàn)在做了一些簡單場景的東西,因?yàn)橥負(fù)涫菑馁Y源盤點(diǎn)來進(jìn)行研究的。如果你想用好CMDB必須要流量和數(shù)據(jù)支撐,怎么保障數(shù)據(jù)是準(zhǔn)確和穩(wěn)定的呢?CMDB有兩個(gè)來源渠道:第一,我們每個(gè)月變更次數(shù)是在1萬次,你沒有辦法靠人工去做準(zhǔn)確性,我們后面會(huì)講到監(jiān)控,這是基于監(jiān)控平臺做的,我們都會(huì)抓過來同步過來。

第二,CMDB自己有自發(fā)現(xiàn)平臺能力這個(gè)也會(huì)獨(dú)立采集到系統(tǒng)運(yùn)行的數(shù)據(jù),我們會(huì)對不同信源進(jìn)行一個(gè)稽核,基于稽核結(jié)果有一個(gè)分析和更新算法,來保證數(shù)據(jù)是更新的。

第二塊講一下系統(tǒng)穩(wěn)定性保障,這塊其實(shí)是核心,在每個(gè)核心環(huán)節(jié)都有自己的痛點(diǎn)和思考。穩(wěn)定性保障圍繞核心就是 CMDB,也就是要做好異常發(fā)現(xiàn)、分析定位、操作恢復(fù)。

在異常發(fā)現(xiàn)做了一個(gè)監(jiān)控體系,就是運(yùn)營對象、規(guī)范指標(biāo)定義和指標(biāo)體系落地。我們的指標(biāo)有內(nèi)存運(yùn)用率、處理時(shí)長等指標(biāo),這樣的對于加指標(biāo)是一個(gè)標(biāo)準(zhǔn)化清單。比如說,請求總量的屬性包括采集頻率、采集數(shù)據(jù)值是什么單位。

還有一個(gè)是閾值,我們把所有傳統(tǒng)的指標(biāo)基于自己的理解來做,像服務(wù)器CPU的值,我們定了一個(gè)標(biāo)準(zhǔn)化的東西,形成了一個(gè)清單。 

我們做這個(gè)事之后有什么好處呢?第一,把監(jiān)控能力規(guī)范化,是指監(jiān)控平臺,把其變成標(biāo)準(zhǔn)化之后,給后端自動(dòng)化操作、時(shí)間扭轉(zhuǎn)進(jìn)行了全局編碼,后面是要知道監(jiān)控了哪些能力,只需要看清單就知道怎么回事了,這是把能力進(jìn)行了規(guī)范化輸出。

第二,數(shù)據(jù)質(zhì)量治理精細(xì)化。我們會(huì)發(fā)現(xiàn)系統(tǒng)里面哪些對象沒有進(jìn)行監(jiān)控,我們在運(yùn)維生產(chǎn)過程當(dāng)中發(fā)現(xiàn)100臺主機(jī)可能監(jiān)控上了,但是其中80臺可能沒有完整的監(jiān)控指標(biāo),那么其中一臺主機(jī)的內(nèi)存率高的時(shí)候是沒有辦法發(fā)現(xiàn)異常的,所以從對象細(xì)化到了指標(biāo)級別。我不僅僅要看每臺主機(jī)是不是上去了,還要是不是黃金指標(biāo),如果差一個(gè)就是不完整的,把我們監(jiān)控點(diǎn)集合的顆粒度精細(xì)變成了指標(biāo)級別。

監(jiān)控是有體系、編碼、閾值的,你所有監(jiān)控動(dòng)作都是圍繞運(yùn)行數(shù)據(jù)來做的,如果數(shù)據(jù)采集之后就是原數(shù)據(jù)的組成部分,就會(huì)形成很標(biāo)準(zhǔn)的運(yùn)維數(shù)據(jù),我們都是基于這個(gè)數(shù)據(jù)來做細(xì)分。

第三,團(tuán)隊(duì)轉(zhuǎn)型賦能化。以前監(jiān)控團(tuán)隊(duì)是一個(gè)被動(dòng)響應(yīng)過程,我也不知道你是不是全了呢?當(dāng)做了監(jiān)控體系之后就會(huì)變成主控團(tuán)隊(duì),你上線時(shí)提出說要95臺,我要基于CMDB看是不是這么多?如果不是的話就不讓你上線。 

我們還可以做運(yùn)行風(fēng)險(xiǎn)的分析和輸出,以前監(jiān)控平臺是做不到這塊的,我只管建,你告訴我監(jiān)控什么我就可以給你做,但是沒有介入業(yè)務(wù),也不知道在系統(tǒng)運(yùn)維的風(fēng)險(xiǎn)?;谶@一點(diǎn)使我們的團(tuán)隊(duì)進(jìn)行轉(zhuǎn)型做賦能,就會(huì)達(dá)到這么一個(gè)好處。

第四,全鏈路監(jiān)控。傳統(tǒng)的開源的APM產(chǎn)品是基于后端鏈路抓出來的,我們實(shí)現(xiàn)了業(yè)務(wù)端到端的全鏈路監(jiān)控,既然到了業(yè)務(wù)就到用戶體驗(yàn)的頁面,其實(shí)這個(gè)技術(shù)復(fù)雜性不難,但是是一個(gè)問題管理場景的思路體現(xiàn)。這樣做完之后形成什么好處呢?我能看到業(yè)務(wù)從最開始的環(huán)節(jié)到最后環(huán)節(jié)的流轉(zhuǎn)過程,這樣就會(huì)帶來一些運(yùn)維改造。

你怎么讓開發(fā)配合改造呢? 

第一個(gè),如果運(yùn)維團(tuán)隊(duì)是架構(gòu)管控型團(tuán)隊(duì),必須要埋點(diǎn)。我有一個(gè)標(biāo)準(zhǔn)化規(guī)范方法,你必須按這個(gè)埋點(diǎn)做這樣的識別,是把我們的流程和技術(shù)實(shí)現(xiàn)了一個(gè)打通。
第二個(gè),我們有三個(gè)下鉆,并且它們分別對應(yīng)了不同人員:第一個(gè)下鉆對應(yīng)業(yè)務(wù)管理人員,可以知道每個(gè)業(yè)務(wù)流程的節(jié)點(diǎn)是什么;第二個(gè)下鉆到集群實(shí)力和具體指標(biāo),這些對應(yīng)的是平臺應(yīng)用人員,需要看集群業(yè)務(wù)下面的實(shí)力,甚至他現(xiàn)在的數(shù)據(jù)和狀態(tài)是不是完好的;
第三個(gè),下鉆看每個(gè)單筆訂單的業(yè)務(wù)鏈,這塊是對應(yīng)的開發(fā)人員,當(dāng)你看到有問題時(shí)是某一個(gè)方法有問題,這樣就可以方便開發(fā)人員進(jìn)行處理,我們?nèi)齻€(gè)下鉆是滿足了不同的管理者,基于不同角色的需要去做了這么一個(gè)設(shè)計(jì)。

第五,應(yīng)急響應(yīng)的閉環(huán)管理。我們比傳統(tǒng)做了一個(gè)更橫向的拓展這塊關(guān)聯(lián)了知識庫和自動(dòng)化操作平臺。我們的技術(shù)運(yùn)營標(biāo)準(zhǔn)提出了一個(gè)更清晰化的管理,要對責(zé)任部門原因、整改措施是否落實(shí)有了細(xì)化要求,這些要求也需要在系統(tǒng)上進(jìn)行實(shí)踐,你會(huì)提出一些整改措施,這些措施后續(xù)流程也需要覆蓋在節(jié)點(diǎn)上進(jìn)行打通。

第六,運(yùn)維小秘賦能。我們在處理故障時(shí)會(huì)有一個(gè)故障應(yīng)急響應(yīng)微信群,領(lǐng)導(dǎo)、業(yè)務(wù)人員和不同故障人員會(huì)把好多信息發(fā)進(jìn)去。我們會(huì)把一個(gè)小秘機(jī)器人實(shí)現(xiàn)了同步,當(dāng)突發(fā)故障報(bào)時(shí)需要收集信息,運(yùn)維小秘會(huì)自動(dòng)匯總信息,它只要判斷有故障就可以直接匯總。當(dāng)一二三線處理時(shí)會(huì)涉及到流轉(zhuǎn)問題,那時(shí)運(yùn)維小秘就會(huì)直接進(jìn)行處理,然后在復(fù)盤環(huán)節(jié)就會(huì)形成報(bào)告了。   

第七,分析定位是鏈路分析。這個(gè)也是基于業(yè)務(wù)全鏈路監(jiān)控來實(shí)現(xiàn)的。

第八,智能根因分析。之前看過一個(gè)廣發(fā)證券分享的主題,你的數(shù)據(jù)很多,但是你數(shù)據(jù)組合形式、展示內(nèi)容對故障處理效率是有很大影響的。

這張圖左邊統(tǒng)計(jì)分析都不是AI過程,不是智能過程,這樣展現(xiàn)之后從故障影響范圍、故障的原因?qū)訉舆f進(jìn),就可以很清楚直觀看到故障的原因是什么,現(xiàn)在是什么情況。這張圖把傳統(tǒng)信息和智能分析過程放在一起形成一個(gè)完整的視圖,就會(huì)帶來一個(gè)“1+1大于2”的結(jié)果。

第九,操作恢復(fù)是平臺級的支撐。我們變成了原子化組件來支撐場景,我們在故障分析、復(fù)盤時(shí)軌跡恢復(fù)是非常重要的。   

第十,自動(dòng)化化預(yù)案策略。我們這個(gè)中心的核心價(jià)值就是實(shí)現(xiàn)應(yīng)急策略的配置化,那么什么是策略呢?策略就是基于什么樣的異常場景,去執(zhí)行什么的規(guī)則,這個(gè)規(guī)則就是策略。比如說,限流熔斷里面的算法都是有規(guī)則的,我們現(xiàn)在已經(jīng)實(shí)現(xiàn)了界面化配置了。

四、AIOps 探索 

首先說一下功能架構(gòu),如果大家對大數(shù)據(jù)比較熟悉的話就是處理層和基礎(chǔ)組建。我們從去年年底到今年引入了AIOps 來做。我們現(xiàn)在離線和在線都是用 Flink 來做的。

再說一下學(xué)件概念,學(xué)件的概念大家應(yīng)該都聽過,在我們北京移動(dòng)是如何理解學(xué)件和它的實(shí)踐價(jià)值呢?就是參照以前的 API 做了標(biāo)準(zhǔn)化接口,學(xué)件就是把數(shù)據(jù)和算法合在一起,合成了完整的學(xué)件,在下一次同樣場景、同指標(biāo)類型數(shù)據(jù)來的時(shí)候,就可以調(diào)動(dòng)同樣的學(xué)件。
你要想達(dá)到使用技術(shù)效果時(shí),你要根據(jù)值做大量的調(diào)優(yōu),我們怎么把其沉淀下來,就會(huì)變成學(xué)件。

比如說,我們在做第一次調(diào)適時(shí),把算法調(diào)優(yōu)了,指標(biāo)就會(huì)很好。如果下次有新的指標(biāo)就可以直接復(fù)用,因?yàn)槟愀鶕?jù)周期性做了調(diào)優(yōu),所以就會(huì)直接有比較好的效果。如果同樣的算法用原始算法做了指標(biāo),你算的指標(biāo)和復(fù)用指標(biāo)是不一樣的。

今天上午浙江移動(dòng)提出了學(xué)件可視化過程,在我們這邊整個(gè)學(xué)件制作過程也是有可視化的,你要有一個(gè)數(shù)據(jù)員源,你還要配置指標(biāo),再進(jìn)行算法訓(xùn)練、最終實(shí)現(xiàn)復(fù)用。

異常檢測分析。我們在這里面做了算法應(yīng)用、實(shí)踐效果、根因分析。我們首先會(huì)基于拓?fù)淠玫疆惓,F(xiàn)象先做一個(gè)確定范圍再做系統(tǒng)分析,同時(shí)把一些非告警的資源指標(biāo)做多元分析,最后匯總之后計(jì)算出來一個(gè)列表。

五、未來展望

5G時(shí)代,5G本身技術(shù)的生態(tài)圈在不斷拓展,對于我們的運(yùn)維團(tuán)隊(duì)在5G時(shí)代,當(dāng)5G給傳統(tǒng)行業(yè)或者創(chuàng)造新生行業(yè)時(shí),新覆蓋行業(yè)同樣需要系統(tǒng)運(yùn)維和技術(shù)運(yùn)營。

盡管這些行業(yè)的商業(yè)和運(yùn)行模式可能是千差萬別的,但是核心能力永遠(yuǎn)不變,所以還是說中臺如果是在適配過程當(dāng)中,基于中臺所有的不同行業(yè)進(jìn)行賦能,把最核心不變的東西保持下來進(jìn)行支撐。

這是我們今年剛剛建立起來的中臺,我們對未來的演進(jìn)模式有一些思考。

第一,服務(wù)運(yùn)營。隨著生態(tài)圈的擴(kuò)大,可以提供更多場景,場景是可以千變?nèi)f化,中臺是以不變應(yīng)萬變的過程,需要去沉淀更多共性的運(yùn)維能力。第二,中臺運(yùn)營。

參照主流技術(shù)的發(fā)展,當(dāng)我們的容器技術(shù)出現(xiàn)之后,K8S等容器管控平臺逐步發(fā)展起來,這些平臺本身有自己的管理、調(diào)度等節(jié)點(diǎn),就可以實(shí)現(xiàn)對容器和資源的靈活調(diào)動(dòng)。 

因此,中臺的未來,應(yīng)該是具備和加強(qiáng)這樣的管控和調(diào)度能力,甚至是達(dá)到智能編排適配的程度,也就是用智能技術(shù)來自動(dòng)分析場景需要什么運(yùn)維能力,怎么組合等。


網(wǎng)頁標(biāo)題:從技術(shù)運(yùn)營中臺建設(shè)到AIOps實(shí)踐,看著一篇就夠了
標(biāo)題URL:http://www.dlmjj.cn/article/djcegjp.html