日本综合一区二区|亚洲中文天堂综合|日韩欧美自拍一区|男女精品天堂一区|欧美自拍第6页亚洲成人精品一区|亚洲黄色天堂一区二区成人|超碰91偷拍第一页|日韩av夜夜嗨中文字幕|久久蜜综合视频官网|精美人妻一区二区三区

RELATEED CONSULTING
相關(guān)咨詢
選擇下列產(chǎn)品馬上在線溝通
服務時間:8:30-17:00
你可能遇到了下面的問題
關(guān)閉右側(cè)工具欄

新聞中心

這里有您想知道的互聯(lián)網(wǎng)營銷解決方案
數(shù)據(jù)異構(gòu)就該這樣做,yyds~

何謂數(shù)據(jù)異構(gòu),上周交易部門商品的同事過來做分享,又看到這個詞,他的PPT里面是 數(shù)據(jù)庫異構(gòu)。其實我們以前做的事情,也是可以稱之為數(shù)據(jù)異構(gòu)。比如我們將DB里面的數(shù)據(jù)持久化到Redis里面去,就是一種數(shù)據(jù)異構(gòu)的方式。

海原網(wǎng)站建設公司創(chuàng)新互聯(lián)建站,海原網(wǎng)站設計制作,有大型網(wǎng)站制作公司豐富經(jīng)驗。已為海原上1000家提供企業(yè)網(wǎng)站建設服務。企業(yè)網(wǎng)站搭建\成都外貿(mào)網(wǎng)站制作要多少錢,請找那個售后服務好的海原做網(wǎng)站的公司定做!

如果要下個定義的話:把數(shù)據(jù)按需(數(shù)據(jù)結(jié)構(gòu)、存取方式、存取形式)異地構(gòu)建存儲。

常見應用場景

分庫分表中有一個最為常見的場景,為了提升數(shù)據(jù)庫的查詢能力,我們都會對數(shù)據(jù)庫做分庫分表操作。比如訂單庫,開始的時候我們是按照訂單ID維度去分庫分表,那么后來的業(yè)務需求想按照商家維度去查詢,比如我想查詢某一個商家下的所有訂單,就非常麻煩。

這個時候通過數(shù)據(jù)異構(gòu)就能很好的解決此問題,如下圖:

異構(gòu)維度

數(shù)據(jù)異構(gòu)總結(jié)起來大概有以下幾種場景

  • 數(shù)據(jù)庫鏡像
  • 數(shù)據(jù)庫實時備份
  • 多級索引
  • search build(比如分庫分表后的多維度數(shù)據(jù)查詢)
  • 業(yè)務cache刷新
  • 價格、庫存變化等重要業(yè)務消息

數(shù)據(jù)異構(gòu)方向

異構(gòu)的幾種方向

在日常業(yè)務開發(fā)中大致可以分為以上幾種數(shù)據(jù)去向,DB-DB這種方式,一般常見于分庫分表后,聚合查詢的時候,比如我們按照訂單ID去分庫分表,那么這個時候我們要按照用戶ID去查詢,查詢這個用戶下面的訂單就非常不方便了,當然可以使用統(tǒng)一加到內(nèi)存中去,但這樣不太好。

所以我們就可以用數(shù)據(jù)庫異構(gòu)的方式,重新按照用戶ID的維度來分一個表,像在上面常見應用場景中介紹的那樣。把數(shù)據(jù)異構(gòu)到redis、elasticserach、slor中去要解決的問題跟按照多維度來查詢的需求差不多。這些存儲天生都有聚合的功能。當然同時也可以提高查詢性能,應對大訪問量,比如redis這種抗量銀彈。

數(shù)據(jù)異構(gòu)的常用方法

1. 完整克隆

這個很簡單就是將數(shù)據(jù)庫A,全部拷貝一份到數(shù)據(jù)庫B,這樣的使用場景是離線統(tǒng)計跑任務腳本的時候可以。缺點也很突出,不適用于持續(xù)增長的數(shù)據(jù)。

2. 標記同步

這個是業(yè)務場景比較簡單的時候,理想情況下數(shù)據(jù)不會發(fā)生改變,比如日志數(shù)據(jù),這個時候可以去標記,比如時間戳,這樣當發(fā)生故障的時候還可以回溯到上一次同步點,開始重新同步數(shù)據(jù)。

3. binlog方式

通過實時的訂閱MySQL的binlog日志,消費到這些日志后,重新構(gòu)建數(shù)據(jù)結(jié)構(gòu)插入一個新的數(shù)據(jù)庫或者是其他存儲比如es、slor等等。訂閱binlog日志可以比較好的能保證數(shù)據(jù)的一致性。

4. MQ方式

業(yè)務數(shù)據(jù)寫入DB的同時,也發(fā)送MQ一份,也就是業(yè)務里面實現(xiàn)雙寫。這種方式比較簡單,但也很難保證數(shù)據(jù)一致性,對簡單的業(yè)務場景可以采用這種方式。

binlog方式

canal異構(gòu)方式

binglog是數(shù)據(jù)的日志記錄方式,每次對數(shù)據(jù)的操作都會有binlog日志?,F(xiàn)在開源的訂閱binlog日志的組件,比如使用比較廣泛的canal,它是阿里開源的基于mysql數(shù)據(jù)庫binlog的增量訂閱和消費組件。

由于cannal服務器目前讀取的binlog事件只保存在內(nèi)存中,并且只有一個canal客戶端可以進行消費。所以如果需要多個消費客戶端,可以引入activemq或者kafka。如上圖綠色虛線框部分。

我們還需要確保全量對比來保證數(shù)據(jù)的一致性(canal+mq的重試機制基本可以保證寫入異構(gòu)庫之后的數(shù)據(jù)一致性),這個時候可以有一個全量同步WORKER程序來保證,如上圖深綠色部分。

canal的工作原理

先來看下mysql主備(主從)復制原理如下圖,在此原理基礎之上我們再來理解canal的實現(xiàn)原理就一眼能明白了。

mysql主備復制實現(xiàn)原理

mysql主備(主從)復制原理,從上層來看,復制分成三步:

  • master將改變記錄到二進制日志(binary log)中(這些記錄叫做二進制日志事件,binary log events,可以通過show binlog events進行查看);
  • slave將master的binary log events拷貝到它的中繼日志(relay log);
  • slave重做中繼日志中的事件,將改變反映它自己的數(shù)據(jù)。

再來看下canal的原理,如下圖:

canal工作原理

cannal實現(xiàn)原理相對比較簡單(參照上面的mysql主備復制實現(xiàn)原理):

  • canal模擬mysql slave的交互協(xié)議,偽裝自己為mysql slave,向mysql master發(fā)送dump協(xié)議
  • mysql master收到dump請求,開始推送binary log給slave(也就是canal)
  • canal解析binary log對象(原始為byte流)

我們在部署canal server的時候要部署多臺,來保證高可用。但是canal的原理,是只有一臺服務器在跑處理,其它的服務器作為熱備。canal server的高可用是通過zookeeper來維護的。

有關(guān)canal更具體的使用和詳細原理請參照:https://github.com/alibaba/canal

注意點

  • 確認MySQL開啟binlog,使用show variables like 'log_bin';查看ON為已開啟
  • 確認目標庫可以產(chǎn)生binlog,show master status注意Binlog_Do_DB,Binlog_Ignore_DB參數(shù)
  • 確認binlog格式為ROW,使用show variables like 'binlog_format';非ROW模式登錄MySQL執(zhí)行set global binlog_format=ROW; flush logs;或者通過更改MySQL配置文件并重啟MySQL生效。
  • 為保證binlake服務可以獲取Binlog,需添加授權(quán),執(zhí)行GRANT SELECT, REPLICATION SLAVE, REPLICATION CLIENT ON *.* TO 'admin'@'%' identified by 'admin'; FLUSH PRIVILEGES;

MQ方式

MQ異構(gòu)方式

mq的方式,就相對簡單,實際上是在業(yè)務邏輯中寫DB的同時去寫一次MQ,但是這種方式不能夠保證數(shù)據(jù)一致性,就是不能保證跨資源的事務。注:調(diào)用第三方遠程RPC的操作一定不要放到事務中。

總結(jié)

本文主要敘述了數(shù)據(jù)異構(gòu)的使用場景,方法。這里面涉及到的activemq以及canal并沒有深入分析,關(guān)于這塊的內(nèi)容可以直接參考相關(guān)具體文檔,文中已給了鏈接地址。

根據(jù)數(shù)據(jù)異構(gòu)的定義,將數(shù)據(jù)異地構(gòu)建存儲,我們可以應用的地方就非常多,文中說的分庫分表之后按照其它維度來查詢的時候,我們想脫離DB直接用緩存比如redis來抗量的時候。數(shù)據(jù)異構(gòu)這種方式都能夠很好的幫助我們來解決諸如此類的問題。


新聞標題:數(shù)據(jù)異構(gòu)就該這樣做,yyds~
轉(zhuǎn)載來源:http://www.dlmjj.cn/article/dhhcghg.html