新聞中心
歷時三個多月的HBase成本優(yōu)化項目按照預(yù)期交付了,HBase云數(shù)據(jù)庫月度成本下降了32.5%,超出預(yù)期達(dá)成目標(biāo)。

創(chuàng)新互聯(lián)公司專注于企業(yè)網(wǎng)絡(luò)營銷推廣、網(wǎng)站重做改版、豐臺網(wǎng)站定制設(shè)計、自適應(yīng)品牌網(wǎng)站建設(shè)、H5高端網(wǎng)站建設(shè)、成都商城網(wǎng)站開發(fā)、集團(tuán)公司官網(wǎng)建設(shè)、外貿(mào)網(wǎng)站建設(shè)、高端網(wǎng)站制作、響應(yīng)式網(wǎng)頁設(shè)計等建站業(yè)務(wù),價格優(yōu)惠性價比高,為豐臺等各大城市提供網(wǎng)站開發(fā)制作服務(wù)。
我們對本次HBase成本優(yōu)化項目進(jìn)行深度復(fù)盤,并進(jìn)一步嘗試總結(jié)云數(shù)據(jù)庫的FinOps之道。
希望能夠賦能mysql、redis、mongo等其他云數(shù)據(jù)庫產(chǎn)品實現(xiàn)降本增效,進(jìn)而給互聯(lián)網(wǎng)寒冬環(huán)境下的企業(yè)IT降本增效,提供一個參考思路。
本文將從4個方面進(jìn)行展開:
- 云數(shù)據(jù)庫成本挑戰(zhàn)
- 什么是FinOps
- HBase成本優(yōu)化實踐
- 云數(shù)據(jù)庫FinOps之道
1、云數(shù)據(jù)庫成本挑戰(zhàn)
在早期,云計算被視為企業(yè)降低IT管理成本、提高業(yè)務(wù)敏捷性的重要途徑。尤其是云數(shù)據(jù)庫,高性能、高可用、彈性使用等特性,“數(shù)據(jù)庫上云”是降本增效的一個重要途徑。
但是,隨著云數(shù)據(jù)庫大規(guī)模使用,云產(chǎn)品的成本問題開始顯現(xiàn)。比如我們使用的雙集群HBase,在投入使用2年后,已經(jīng)成為所有云數(shù)據(jù)庫類別中,成本占比最大的組件。
如何解決云數(shù)據(jù)庫成本優(yōu)化問題?尤其在這樣的互聯(lián)網(wǎng)寒冬下,是擺在很多技術(shù)團(tuán)隊面前的首要問題。
常見的成本優(yōu)化挑戰(zhàn)包括四種情況:
- 挑戰(zhàn)一:無法準(zhǔn)確衡量數(shù)據(jù)庫資源是否存在浪費(fèi)
- 挑戰(zhàn)二:縮容、降配等手段效果不明顯,沒啥別的優(yōu)化措施
- 挑戰(zhàn)三:基礎(chǔ)架構(gòu)團(tuán)隊很著急,一線業(yè)務(wù)團(tuán)隊不care
- 挑戰(zhàn)四:“運(yùn)動式”成本優(yōu)化,無法形成長效機(jī)制
為了系統(tǒng)化解決這些問題,就需要引入FinOps(云成本優(yōu)化)的概念了。
2、什么是FinOps
FinOps 是“Finance”和“DevOps”的綜合體,也被稱為“云財務(wù)管理”、“云成本管理”或“云財務(wù)優(yōu)化”等。
FinOps有一個權(quán)威組織——FinOps 基金會,F(xiàn)inOps 基金會是Linux 基金會發(fā)起的項目,致力于通過最佳實踐、教育和標(biāo)準(zhǔn)來推動實踐云財務(wù)管理學(xué)科。
FinOps基金會對FinOps定義如下:
FinOps is an evolving cloud financial management discipline and cultural practice that enables organizations to get maximum business value by helping engineering, finance, technology and business teams to collaborate on data-driven spending decisions.
(Definition Updated: November 2021 by the FinOps Foundation Technical Advisory Council
這里有三點(diǎn)非常關(guān)鍵:
- cultural practice文化建設(shè):FinOps的準(zhǔn)測與文化需要建設(shè)推廣。(自上而下)
- collaborate 跨團(tuán)隊協(xié)作:工程、財務(wù)、技術(shù)和業(yè)務(wù)團(tuán)隊。(FinOps絕不只是任意一個團(tuán)隊的工作)
- data-driven 方式:數(shù)據(jù)驅(qū)動。(如何推動協(xié)作的關(guān)鍵)
此外,F(xiàn)inOps還有幾個非常重要的維度,包括六大原則、角色、循環(huán)方法論、成熟度模型。
3、HBase成本優(yōu)化實踐
參考FinOps六大原則,我們來看看 HBase成本優(yōu)化項目 中如何落地。
(1)團(tuán)隊協(xié)作
原則1:Teams need to collaborate
原則2:Everyone takes ownership for their cloud usage
這兩條原則非常具有現(xiàn)實意義,成本優(yōu)化很難由單一團(tuán)隊負(fù)責(zé),必須各個團(tuán)隊都把 成本 作為一個關(guān)鍵指標(biāo),持續(xù)優(yōu)化,提高效率和創(chuàng)新能力。
在HBase成本優(yōu)化項目的 立項之初,我們就提前和各個業(yè)務(wù)團(tuán)隊進(jìn)行深入溝通,對HBase成本優(yōu)化的 現(xiàn)狀、價值、實施路徑 充分對齊。
|
業(yè)務(wù)團(tuán)隊 |
目前成本 |
優(yōu)化成本 |
優(yōu)化方案 |
預(yù)計人力投入 |
|
A團(tuán)隊 |
xxx |
5k/月 |
降低副本數(shù) |
20人日 |
|
B團(tuán)隊 |
xxx |
8k/月 |
業(yè)務(wù)降級,取消災(zāi)備 |
30人日 |
|
C團(tuán)隊 |
xxx |
4k/月 |
替換云原生數(shù)據(jù)庫 |
25人日 |
|
D團(tuán)隊 |
xxx |
10k/月 |
冷熱分離 |
40人日 |
因此,在項目開展過程中,各個團(tuán)隊能結(jié)合各自的業(yè)務(wù)特點(diǎn),采用 業(yè)務(wù)架構(gòu)優(yōu)化、數(shù)據(jù)架構(gòu)優(yōu)化、云原生技術(shù) 等手段,共同朝著HBase成本優(yōu)化的大目標(biāo)前進(jìn)。
(2)中心化驅(qū)動
原則3:A centralized team drives FinOps
專門有一個團(tuán)隊來推動FinOps的開展,包括各項流程的推進(jìn)、基礎(chǔ)設(shè)施的搭建等。
本次HBase成本優(yōu)化項目中,采用 項目制 的形式,由基礎(chǔ)架構(gòu)團(tuán)隊進(jìn)行推進(jìn),提供了諸如 成本優(yōu)化目標(biāo)、資源使用狀況、數(shù)據(jù)增長變化、業(yè)務(wù)改造方案支持 等指標(biāo)與工具。
后續(xù),我們會開發(fā)一個統(tǒng)一的 FinOps平臺產(chǎn)品,由一個 中心化產(chǎn)品,進(jìn)行長效持久地推進(jìn)云數(shù)據(jù)庫成本優(yōu)化。
(3)可視化數(shù)據(jù)與報告
原則4:Reports should be accessible and timely
HBase目前是集群模式運(yùn)作,各個集群都存在業(yè)務(wù)團(tuán)隊共用集群的情況。另外,業(yè)務(wù)數(shù)量眾多(近百個敏捷組),如何快速識別成本大頭進(jìn)行優(yōu)化,也是一個重點(diǎn)問題。
因此,本次HBase成本優(yōu)化項目中,充分踐行了 數(shù)據(jù)驅(qū)動 的理念。
- 大數(shù)據(jù)量識別篩選出單副本大于5T的業(yè)務(wù),共15個敏捷組,占總存儲80%以上
- 高增速識別篩選出增速較快的業(yè)務(wù)。
- 優(yōu)化效果指標(biāo)評判采用腳本統(tǒng)計的方式記錄數(shù)據(jù),跟蹤目標(biāo)業(yè)務(wù)的優(yōu)化情況。
這些數(shù)據(jù)驅(qū)動的能力,后續(xù)會沉淀為FinOps平臺上的通用組件能力。
(4)因地制宜,業(yè)務(wù)架構(gòu)優(yōu)化
原則5:Decisions are driven by business value of cloud
獲得成本相關(guān)數(shù)據(jù)后,根據(jù)實際業(yè)務(wù)價值和使用情況進(jìn)行成本優(yōu)化決策。
本次HBase成本優(yōu)化項目中,各個業(yè)務(wù)團(tuán)隊充分利用各自業(yè)務(wù)特點(diǎn),進(jìn)行相關(guān)業(yè)務(wù)優(yōu)化。
減少副本數(shù)
以HBase為例,本身存儲在本地盤的HDFS上,通過三副本機(jī)制保證數(shù)據(jù)不丟失。
為了提高應(yīng)用穩(wěn)定性,降低單HBase不可用帶來的風(fēng)險,我們核心服務(wù)都配備了雙集群主備架構(gòu)的HBase。這樣導(dǎo)致了一份數(shù)據(jù)會存在六個副本,造成了磁盤空間使用率的極速膨脹。
在多副本災(zāi)備架構(gòu)下,可以對主備集群內(nèi)數(shù)據(jù)都調(diào)整為兩副本(去掉replica3、replica6),整體變?yōu)樗母北?,可以降?0%的磁盤空間使用。
某業(yè)務(wù)團(tuán)隊單副本140T數(shù)據(jù),六副本840T,磁盤使用率不斷上漲,造成巨大成本壓力。我們通過調(diào)整副本數(shù)量為四副本(從原來的六副本),有效降低了280T數(shù)據(jù)的磁盤使用空間。
數(shù)據(jù)冷熱分離
如果數(shù)據(jù)量過大,一般可以考慮根據(jù)數(shù)據(jù)生命周期特點(diǎn),實施冷熱分離、無效數(shù)據(jù)清理。
關(guān)鍵邏輯
- 客戶端寫熱存儲
- 客戶端查詢時,根據(jù) 業(yè)務(wù)冷熱劃分邏輯 進(jìn)行路由查詢。
- 遷移任務(wù)根據(jù) 業(yè)務(wù)冷熱劃分邏輯(一般為生產(chǎn)時間或修改時間)進(jìn)行 查詢&過濾 ,將符合條件的冷數(shù)據(jù)寫入冷存儲,并且從熱存儲中刪除
- 對賬任務(wù)根據(jù)遷移任務(wù)的記錄日志log,進(jìn)行定時校驗,確保數(shù)據(jù)不丟失,校驗無誤后清理log
做好數(shù)據(jù)壓縮,減少存儲量
對于單value比較大的數(shù)據(jù),可以通過數(shù)據(jù)壓縮算法,如snappy、lz4、gizp等,提高數(shù)據(jù)壓縮比,降低存儲。
HBase、mongo等數(shù)據(jù)庫服務(wù)端可以做自動壓縮的配置,如果服務(wù)端不支持自動壓縮的,可以采用客戶端壓縮后再寫入。
(5)充分利用云產(chǎn)品
原則6:Take advantage of the variable cost model of the cloud
充分利用好不同的云產(chǎn)品計費(fèi)模型。這個目前其實做得比較多了,比如選擇不同云廠商的不同產(chǎn)品、根據(jù)不同場景選擇不同計費(fèi)模式( 包年包月、按量付費(fèi)、serverless等)等。
本次HBase成本優(yōu)化項目中,典型的就是在某個特定業(yè)務(wù)場景下,引入了 HBase serverless方案 作為災(zāi)備集群,降低了普通集群作為災(zāi)備集群的低效支出。
4、云數(shù)據(jù)庫FinOps之道
前面聊了HBase成本優(yōu)化實踐的若干原則與具體操作,比較偏重“術(shù)”的層面。
下面,我們再結(jié)合FinOps的循環(huán)治理方法論,來更全面地思考云數(shù)據(jù)庫的FinOps之道。
FinOps 基金會建議采用迭代方法來管理云服務(wù)的可變成本。最佳實踐包括應(yīng)持續(xù)管理的三個環(huán)節(jié):通知、優(yōu)化和運(yùn)營。
(1)通知(Inform)
核心在于 數(shù)據(jù)可視化 與 可分配。
業(yè)務(wù)團(tuán)隊和財務(wù)利益相關(guān)者能夠確保他們在控制預(yù)算和準(zhǔn)確預(yù)測支出的同時提高ROI,避免意外。
同時,也能作為一個業(yè)務(wù)團(tuán)隊的基礎(chǔ)指標(biāo),來衡量并提升團(tuán)隊成本優(yōu)化效率。
數(shù)據(jù)可視化
俗話說,It you can’t measure it, you can’t manage it。
數(shù)據(jù)驅(qū)動理念在FinOps中同樣處于核心地位。
包括但不限于:
- 資源(CPU/內(nèi)存/磁盤)使用率
- 資源增長速率
- 資源預(yù)算
- 資源實際使用超額比例
- 資源使用預(yù)測
準(zhǔn)確而全面的可視化,可以較好解決成本優(yōu)化的挑戰(zhàn)一,精準(zhǔn)衡量是否存在資源浪費(fèi)的情況。
可分配
對于所有云上資源,都要盡可能精細(xì)化、準(zhǔn)確 分配到各個實際使用團(tuán)隊上。
目前在微服務(wù)架構(gòu)下,單實例類型的組件比較容易跟上游應(yīng)用綁定,進(jìn)而分配到具體業(yè)務(wù)團(tuán)隊。但是集群類型的組件(如HBase),仍然需要做進(jìn)一步細(xì)粒度的計算與分配。
(2)優(yōu)化(Optimize)
一旦資源優(yōu)化指標(biāo)準(zhǔn)確綁定到 實際使用團(tuán)隊后,就可以開展各項優(yōu)化工作。
最基礎(chǔ)的方式,是根據(jù)數(shù)據(jù)使用率指標(biāo),對空閑資源進(jìn)行降配、縮容等方式。
更深度的優(yōu)化,需要結(jié)合實際業(yè)務(wù)場景,參考3.4的內(nèi)容,實施 減少副本數(shù)、冷熱分離、數(shù)據(jù)壓縮、充分利用云產(chǎn)品 等手段。(解決挑戰(zhàn)二)
(3)運(yùn)營(Oprate)
文化建設(shè)
通過FinOps進(jìn)行成本優(yōu)化的文化建設(shè)是首要條件。必須自上而下推行這種意識和相關(guān)的獎懲制度。
讓基礎(chǔ)團(tuán)隊、業(yè)務(wù)團(tuán)隊認(rèn)識到這項工作不是某個人、某個團(tuán)隊的事情,而是各個團(tuán)隊在架構(gòu)設(shè)計、技術(shù)優(yōu)化、績效達(dá)成中的關(guān)鍵任務(wù)。(解決挑戰(zhàn)三)
如果沒有自上而下推行這種文化,F(xiàn)inOps肯定無法落地,更不用談長期機(jī)制了。
自動化流程與機(jī)制
為了使FinOps成為一種長期機(jī)制,除了文化建設(shè)外,必須將人工流程自動化。
從 數(shù)據(jù)化、成本問題識別、任務(wù)分配、優(yōu)化完成、數(shù)據(jù)追蹤 等環(huán)節(jié)入手,將一整套流程以平臺產(chǎn)品的形式沉淀下來。
轉(zhuǎn)變”運(yùn)動式“優(yōu)化的困境,形成真正的長期機(jī)制。(解決挑戰(zhàn)四)
5、小結(jié)
本文從云數(shù)據(jù)庫成本挑戰(zhàn)引入FinOps的概念,結(jié)合HBase成本優(yōu)化項目闡述了FinOps的具體原則與實踐案例。
最后總結(jié)了云數(shù)據(jù)庫FinOps之道,形成數(shù)據(jù)庫成本優(yōu)化真正的閉環(huán)解決方案,形成長效機(jī)制,徹底解決四種常見成本優(yōu)化挑戰(zhàn)。
本文標(biāo)題:云數(shù)據(jù)庫FinOps實戰(zhàn)復(fù)盤
本文網(wǎng)址:http://www.dlmjj.cn/article/cdeihoc.html


咨詢
建站咨詢
