新聞中心
【經(jīng)驗帖】為什么分布式一定要有Redis?
作者:孤獨煙 2018-06-05 09:14:42
開源
分布式
Redis 考慮到絕大部分寫業(yè)務(wù)的程序員,在實際開發(fā)中使用 Redis 的時候,只會 Set Value 和 Get Value 兩個操作,對 Redis 整體缺乏一個認(rèn)知。

10年積累的成都網(wǎng)站設(shè)計、做網(wǎng)站經(jīng)驗,可以快速應(yīng)對客戶對網(wǎng)站的新想法和需求。提供各種問題對應(yīng)的解決方案。讓選擇我們的客戶得到更好、更有力的網(wǎng)絡(luò)服務(wù)。我雖然不認(rèn)識你,你也不認(rèn)識我。但先做網(wǎng)站設(shè)計后付款的網(wǎng)站建設(shè)流程,更有九臺免費網(wǎng)站建設(shè)讓你可以放心的選擇與我們合作。
考慮到絕大部分寫業(yè)務(wù)的程序員,在實際開發(fā)中使用 Redis 的時候,只會 Set Value 和 Get Value 兩個操作,對 Redis 整體缺乏一個認(rèn)知。
所以我斗膽以 Redis 為題材,對 Redis 常見問題做一個總結(jié),希望能夠彌補(bǔ)大家的知識盲點。
本文圍繞以下幾點進(jìn)行闡述:
- 為什么使用 Redis
- 使用 Redis 有什么缺點
- 單線程的 Redis 為什么這么快
- Redis 的數(shù)據(jù)類型,以及每種數(shù)據(jù)類型的使用場景
- Redis 的過期策略以及內(nèi)存淘汰機(jī)制
- Redis 和數(shù)據(jù)庫雙寫一致性問題
- 如何應(yīng)對緩存穿透和緩存雪崩問題
- 如何解決 Redis 的并發(fā)競爭 Key 問題
為什么使用 Redis
我覺得在項目中使用 Redis,主要是從兩個角度去考慮:性能和并發(fā)。
當(dāng)然,Redis 還具備可以做分布式鎖等其他功能,但是如果只是為了分布式鎖這些其他功能,完全還有其他中間件,如 Zookeeper等代替,并不是非要使用 Redis。因此,這個問題主要從性能和并發(fā)兩個角度去答。
性能
如下圖所示,我們在碰到需要執(zhí)行耗時特別久,且結(jié)果不頻繁變動的 SQL,就特別適合將運行結(jié)果放入緩存。這樣,后面的請求就去緩存中讀取,使得請求能夠迅速響應(yīng)。
題外話:忽然想聊一下這個迅速響應(yīng)的標(biāo)準(zhǔn)。根據(jù)交互效果的不同,這個響應(yīng)時間沒有固定標(biāo)準(zhǔn)。
不過曾經(jīng)有人這么告訴我:"在理想狀態(tài)下,我們的頁面跳轉(zhuǎn)需要在瞬間解決,對于頁內(nèi)操作則需要在剎那間解決。
另外,超過一彈指的耗時操作要有進(jìn)度提示,并且可以隨時中止或取消,這樣才能給用戶***的體驗。"
那么瞬間、剎那、一彈指具體是多少時間呢?
根據(jù)《摩訶僧祗律》記載:
一剎那者為一念,二十念為一瞬,二十瞬為一彈指,二十彈指為一羅預(yù),二十羅預(yù)為一須臾,一日一夜有三十須臾。
那么,經(jīng)過周密的計算,一瞬間為 0.36 秒、一剎那有 0.018 秒、一彈指長達(dá) 7.2 秒。
并發(fā)
如下圖所示,在大并發(fā)的情況下,所有的請求直接訪問數(shù)據(jù)庫,數(shù)據(jù)庫會出現(xiàn)連接異常。
這個時候,就需要使用 Redis 做一個緩沖操作,讓請求先訪問到 Redis,而不是直接訪問數(shù)據(jù)庫。
使用 Redis 有什么缺點
大家用 Redis 這么久,這個問題是必須要了解的,基本上使用 Redis 都會碰到一些問題,常見的也就幾個。
回答主要是四個問題:
緩存和數(shù)據(jù)庫雙寫一致性問題
- 緩存雪崩問題
- 緩存擊穿問題
- 緩存的并發(fā)競爭問題
- 這四個問題,我個人覺得在項目中是常遇見的,具體解決方案,后文給出。
單線程的 Redis 為什么這么快
這個問題是對 Redis 內(nèi)部機(jī)制的一個考察。根據(jù)我的面試經(jīng)驗,很多人都不知道 Redis 是單線程工作模型。所以,這個問題還是應(yīng)該要復(fù)習(xí)一下的。
回答主要是以下三點:
- 純內(nèi)存操作
- 單線程操作,避免了頻繁的上下文切換
- 采用了非阻塞 I/O 多路復(fù)用機(jī)制
題外話:我們現(xiàn)在要仔細(xì)的說一說 I/O 多路復(fù)用機(jī)制,因為這個說法實在是太通俗了,通俗到一般人都不懂是什么意思。
打一個比方:小曲在 S 城開了一家快遞店,負(fù)責(zé)同城快送服務(wù)。小曲因為資金限制,雇傭了一批快遞員,然后小曲發(fā)現(xiàn)資金不夠了,只夠買一輛車送快遞。
經(jīng)營方式一
客戶每送來一份快遞,小曲就讓一個快遞員盯著,然后快遞員開車去送快遞。
慢慢的小曲就發(fā)現(xiàn)了這種經(jīng)營方式存在下述問題:
- 幾十個快遞員基本上時間都花在了搶車上了,大部分快遞員都處在閑置狀態(tài),誰搶到了車,誰就能去送快遞。
- 隨著快遞的增多,快遞員也越來越多,小曲發(fā)現(xiàn)快遞店里越來越擠,沒辦法雇傭新的快遞員了。
- 快遞員之間的協(xié)調(diào)很花時間。
綜合上述缺點,小曲痛定思痛,提出了下面的經(jīng)營方式。
經(jīng)營方式二
小曲只雇傭一個快遞員。然后呢,客戶送來的快遞,小曲按送達(dá)地點標(biāo)注好,然后依次放在一個地方。
***,那個快遞員依次的去取快遞,一次拿一個,然后開著車去送快遞,送好了就回來拿下一個快遞。
上述兩種經(jīng)營方式對比,是不是明顯覺得第二種,效率更高,更好呢?
在上述比喻中:
- 每個快遞員→每個線程
- 每個快遞→每個 Socket(I/O 流)
- 快遞的送達(dá)地點→Socket 的不同狀態(tài)
- 客戶送快遞請求→來自客戶端的請求
- 小曲的經(jīng)營方式→服務(wù)端運行的代碼
- 一輛車→CPU 的核數(shù)
于是我們有如下結(jié)論:
- 經(jīng)營方式一就是傳統(tǒng)的并發(fā)模型,每個 I/O 流(快遞)都有一個新的線程(快遞員)管理。
- 經(jīng)營方式二就是 I/O 多路復(fù)用。只有單個線程(一個快遞員),通過跟蹤每個 I/O 流的狀態(tài)(每個快遞的送達(dá)地點),來管理多個 I/O 流。
下面類比到真實的 Redis 線程模型,如圖所示:
簡單來說,就是我們的 redis-client 在操作的時候,會產(chǎn)生具有不同事件類型的 Socket。
在服務(wù)端,有一段 I/O 多路復(fù)用程序,將其置入隊列之中。然后,文件事件分派器,依次去隊列中取,轉(zhuǎn)發(fā)到不同的事件處理器中。
需要說明的是,這個 I/O 多路復(fù)用機(jī)制,Redis 還提供了 select、epoll、evport、kqueue 等多路復(fù)用函數(shù)庫,大家可以自行去了解。
Redis 的數(shù)據(jù)類型,以及每種數(shù)據(jù)類型的使用場景
是不是覺得這個問題很基礎(chǔ)?我也這么覺得。然而根據(jù)面試經(jīng)驗發(fā)現(xiàn),至少百分之八十的人答不上這個問題。
建議,在項目中用到后,再類比記憶,體會更深,不要硬記。基本上,一個合格的程序員,五種類型都會用到。
String
這個沒啥好說的,最常規(guī)的 set/get 操作,Value 可以是 String 也可以是數(shù)字。一般做一些復(fù)雜的計數(shù)功能的緩存。
Hash
這里 Value 存放的是結(jié)構(gòu)化的對象,比較方便的就是操作其中的某個字段。
我在做單點登錄的時候,就是用這種數(shù)據(jù)結(jié)構(gòu)存儲用戶信息,以 CookieId 作為 Key,設(shè)置 30 分鐘為緩存過期時間,能很好的模擬出類似 Session 的效果。
List
使用 List 的數(shù)據(jù)結(jié)構(gòu),可以做簡單的消息隊列的功能。另外還有一個就是,可以利用 lrange 命令,做基于 Redis 的分頁功能,性能***,用戶體驗好。
Set
因為 Set 堆放的是一堆不重復(fù)值的集合。所以可以做全局去重的功能。為什么不用 JVM 自帶的 Set 進(jìn)行去重?
因為我們的系統(tǒng)一般都是集群部署,使用 JVM 自帶的 Set,比較麻煩,難道為了一個做一個全局去重,再起一個公共服務(wù),太麻煩了。
另外,就是利用交集、并集、差集等操作,可以計算共同喜好,全部的喜好,自己獨有的喜好等功能。
Sorted Set
Sorted Set多了一個權(quán)重參數(shù) Score,集合中的元素能夠按 Score 進(jìn)行排列。
可以做排行榜應(yīng)用,取 TOP N 操作。Sorted Set 可以用來做延時任務(wù)。***一個應(yīng)用就是可以做范圍查找。
Redis 的過期策略以及內(nèi)存淘汰機(jī)制
這個問題相當(dāng)重要,到底 Redis 有沒用到家,這個問題就可以看出來。
比如你 Redis 只能存 5G 數(shù)據(jù),可是你寫了 10G,那會刪 5G 的數(shù)據(jù)。怎么刪的,這個問題思考過么?
還有,你的數(shù)據(jù)已經(jīng)設(shè)置了過期時間,但是時間到了,內(nèi)存占用率還是比較高,有思考過原因么?
回答:Redis 采用的是定期刪除+惰性刪除策略。
為什么不用定時刪除策略
定時刪除,用一個定時器來負(fù)責(zé)監(jiān)視 Key,過期則自動刪除。雖然內(nèi)存及時釋放,但是十分消耗 CPU 資源。
在大并發(fā)請求下,CPU 要將時間應(yīng)用在處理請求,而不是刪除 Key,因此沒有采用這一策略。
定期刪除+惰性刪除是如何工作
定期刪除,Redis 默認(rèn)每個 100ms 檢查,是否有過期的 Key,有過期 Key 則刪除。
需要說明的是,Redis 不是每個 100ms 將所有的 Key 檢查一次,而是隨機(jī)抽取進(jìn)行檢查(如果每隔 100ms,全部 Key 進(jìn)行檢查,Redis 豈不是卡死)。
因此,如果只采用定期刪除策略,會導(dǎo)致很多 Key 到時間沒有刪除。于是,惰性刪除派上用場。
也就是說在你獲取某個 Key 的時候,Redis 會檢查一下,這個 Key 如果設(shè)置了過期時間,那么是否過期了?如果過期了此時就會刪除。
采用定期刪除+惰性刪除就沒其他問題了么?
不是的,如果定期刪除沒刪除 Key。然后你也沒即時去請求 Key,也就是說惰性刪除也沒生效。這樣,Redis的內(nèi)存會越來越高。那么就應(yīng)該采用內(nèi)存淘汰機(jī)制。
在 redis.conf 中有一行配置:
- # maxmemory-policy volatile-lru
該配置就是配內(nèi)存淘汰策略的(什么,你沒配過?好好反省一下自己):
- noeviction:當(dāng)內(nèi)存不足以容納新寫入數(shù)據(jù)時,新寫入操作會報錯。應(yīng)該沒人用吧。
- allkeys-lru:當(dāng)內(nèi)存不足以容納新寫入數(shù)據(jù)時,在鍵空間中,移除最近最少使用的 Key。推薦使用,目前項目在用這種。
- allkeys-random:當(dāng)內(nèi)存不足以容納新寫入數(shù)據(jù)時,在鍵空間中,隨機(jī)移除某個 Key。應(yīng)該也沒人用吧,你不刪最少使用 Key,去隨機(jī)刪。
- volatile-lru:當(dāng)內(nèi)存不足以容納新寫入數(shù)據(jù)時,在設(shè)置了過期時間的鍵空間中,移除最近最少使用的 Key。這種情況一般是把 Redis 既當(dāng)緩存,又做持久化存儲的時候才用。不推薦。
- volatile-random:當(dāng)內(nèi)存不足以容納新寫入數(shù)據(jù)時,在設(shè)置了過期時間的鍵空間中,隨機(jī)移除某個 Key。依然不推薦。
- volatile-ttl:當(dāng)內(nèi)存不足以容納新寫入數(shù)據(jù)時,在設(shè)置了過期時間的鍵空間中,有更早過期時間的 Key 優(yōu)先移除。不推薦。
PS:如果沒有設(shè)置 expire 的 Key,不滿足先決條件(prerequisites);那么 volatile-lru,volatile-random 和 volatile-ttl 策略的行為,和 noeviction(不刪除) 基本上一致。
Redis 和數(shù)據(jù)庫雙寫一致性問題
一致性問題是分布式常見問題,還可以再分為最終一致性和強(qiáng)一致性。數(shù)據(jù)庫和緩存雙寫,就必然會存在不一致的問題。
答這個問題,先明白一個前提。就是如果對數(shù)據(jù)有強(qiáng)一致性要求,不能放緩存。我們所做的一切,只能保證最終一致性。
另外,我們所做的方案從根本上來說,只能說降低不一致發(fā)生的概率,無法完全避免。因此,有強(qiáng)一致性要求的數(shù)據(jù),不能放緩存。
回答:首先,采取正確更新策略,先更新數(shù)據(jù)庫,再刪緩存。其次,因為可能存在刪除緩存失敗的問題,提供一個補(bǔ)償措施即可,例如利用消息隊列。
如何應(yīng)對緩存穿透和緩存雪崩問題
這兩個問題,說句實在話,一般中小型傳統(tǒng)軟件企業(yè),很難碰到這個問題。如果有大并發(fā)的項目,流量有幾百萬左右。這兩個問題一定要深刻考慮。
緩存穿透,即黑客故意去請求緩存中不存在的數(shù)據(jù),導(dǎo)致所有的請求都懟到數(shù)據(jù)庫上,從而數(shù)據(jù)庫連接異常。
緩存穿透解決方案:
- 利用互斥鎖,緩存失效的時候,先去獲得鎖,得到鎖了,再去請求數(shù)據(jù)庫。沒得到鎖,則休眠一段時間重試。
- 采用異步更新策略,無論 Key 是否取到值,都直接返回。Value 值中維護(hù)一個緩存失效時間,緩存如果過期,異步起一個線程去讀數(shù)據(jù)庫,更新緩存。需要做緩存預(yù)熱(項目啟動前,先加載緩存)操作。
- 提供一個能迅速判斷請求是否有效的攔截機(jī)制,比如,利用布隆過濾器,內(nèi)部維護(hù)一系列合法有效的 Key。迅速判斷出,請求所攜帶的 Key 是否合法有效。如果不合法,則直接返回。
緩存雪崩,即緩存同一時間大面積的失效,這個時候又來了一波請求,結(jié)果請求都懟到數(shù)據(jù)庫上,從而導(dǎo)致數(shù)據(jù)庫連接異常。
緩存雪崩解決方案:
- 給緩存的失效時間,加上一個隨機(jī)值,避免集體失效。
- 使用互斥鎖,但是該方案吞吐量明顯下降了。
- 雙緩存。我們有兩個緩存,緩存 A 和緩存 B。緩存 A 的失效時間為 20 分鐘,緩存 B 不設(shè)失效時間。自己做緩存預(yù)熱操作。
然后細(xì)分以下幾個小點:從緩存 A 讀數(shù)據(jù)庫,有則直接返回;A 沒有數(shù)據(jù),直接從 B 讀數(shù)據(jù),直接返回,并且異步啟動一個更新線程,更新線程同時更新緩存 A 和緩存 B。
如何解決 Redis 的并發(fā)競爭 Key 問題
這個問題大致就是,同時有多個子系統(tǒng)去 Set 一個 Key。這個時候大家思考過要注意什么呢?
需要說明一下,我提前百度了一下,發(fā)現(xiàn)答案基本都是推薦用 Redis 事務(wù)機(jī)制。
我并不推薦使用 Redis 的事務(wù)機(jī)制。因為我們的生產(chǎn)環(huán)境,基本都是 Redis 集群環(huán)境,做了數(shù)據(jù)分片操作。
你一個事務(wù)中有涉及到多個 Key 操作的時候,這多個 Key 不一定都存儲在同一個 redis-server 上。因此,Redis 的事務(wù)機(jī)制,十分雞肋。
如果對這個 Key 操作,不要求順序
這種情況下,準(zhǔn)備一個分布式鎖,大家去搶鎖,搶到鎖就做 set 操作即可,比較簡單。
如果對這個 Key 操作,要求順序
假設(shè)有一個 key1,系統(tǒng) A 需要將 key1 設(shè)置為 valueA,系統(tǒng) B 需要將 key1 設(shè)置為 valueB,系統(tǒng) C 需要將 key1 設(shè)置為 valueC。
期望按照 key1 的 value 值按照 valueA > valueB > valueC 的順序變化。這種時候我們在數(shù)據(jù)寫入數(shù)據(jù)庫的時候,需要保存一個時間戳。
假設(shè)時間戳如下:
- 系統(tǒng)A key 1 {valueA 3:00}
- 系統(tǒng)B key 1 {valueB 3:05}
- 系統(tǒng)C key 1 {valueC 3:10}
那么,假設(shè)這會系統(tǒng) B 先搶到鎖,將 key1 設(shè)置為{valueB 3:05}。接下來系統(tǒng) A 搶到鎖,發(fā)現(xiàn)自己的 valueA 的時間戳早于緩存中的時間戳,那就不做 set 操作了,以此類推。
其他方法,比如利用隊列,將 set 方法變成串行訪問也可以??傊`活變通。
總結(jié)
本文對 Redis 的常見問題做了一個總結(jié)。大部分是自己在工作中遇到,以及之前面試別人的時候,愛問的一些問題。
另外,不推薦大家臨時抱佛腳,真正碰到一些有經(jīng)驗的工程師,其實幾下就能把你問懵。***,希望大家有所收獲吧。
新聞名稱:【經(jīng)驗帖】為什么分布式一定要有Redis?
標(biāo)題URL:http://www.dlmjj.cn/article/dhppepj.html


咨詢
建站咨詢
