日本综合一区二区|亚洲中文天堂综合|日韩欧美自拍一区|男女精品天堂一区|欧美自拍第6页亚洲成人精品一区|亚洲黄色天堂一区二区成人|超碰91偷拍第一页|日韩av夜夜嗨中文字幕|久久蜜综合视频官网|精美人妻一区二区三区

RELATEED CONSULTING
相關(guān)咨詢
選擇下列產(chǎn)品馬上在線溝通
服務(wù)時(shí)間:8:30-17:00
你可能遇到了下面的問(wèn)題
關(guān)閉右側(cè)工具欄

新聞中心

這里有您想知道的互聯(lián)網(wǎng)營(yíng)銷解決方案
記一次MySQL死鎖排查過(guò)程

背景

讓客戶滿意是我們工作的目標(biāo),不斷超越客戶的期望值來(lái)自于我們對(duì)這個(gè)行業(yè)的熱愛(ài)。我們立志把好的技術(shù)通過(guò)有效、簡(jiǎn)單的方式提供給客戶,將通過(guò)不懈努力成為客戶在信息化領(lǐng)域值得信任、有價(jià)值的長(zhǎng)期合作伙伴,公司提供的服務(wù)項(xiàng)目有:申請(qǐng)域名、網(wǎng)頁(yè)空間、營(yíng)銷軟件、網(wǎng)站建設(shè)、港閘網(wǎng)站維護(hù)、網(wǎng)站推廣。

以前接觸到的數(shù)據(jù)庫(kù)死鎖,都是批量更新時(shí)加鎖順序不一致而導(dǎo)致的死鎖,但是上周卻遇到了一個(gè)很難理解的死鎖。借著這個(gè)機(jī)會(huì)又重新學(xué)習(xí)了一下 mysql 的死鎖知識(shí)以及常見(jiàn)的死鎖場(chǎng)景。在多方調(diào)研以及和同事們的討論下終于發(fā)現(xiàn)了這個(gè)死鎖問(wèn)題的成因,收獲頗多。雖然是后端程序員,我們不需要像 DBA 一樣深入地去分析與鎖相關(guān)的源碼,但是如果我們能夠掌握基本的死鎖排查方法,對(duì)我們的日常開(kāi)發(fā)還是大有裨益的。

PS:本文不會(huì)介紹死鎖的基本知識(shí),mysql 的加鎖原理可以參考本文的參考資料提供的鏈接。

死鎖起因

先介紹一下數(shù)據(jù)庫(kù)和表情況,因?yàn)樯婕暗焦緝?nèi)部真是的數(shù)據(jù),所以以下都做了模擬,不會(huì)影響具體的分析。

我們采用的是 5.5 版本的 mysql 數(shù)據(jù)庫(kù),事務(wù)隔離級(jí)別是默認(rèn)的 RR(Repeatable-Read),采用 innodb 引擎。假設(shè)存在 test 表:

 
 
 
  1. CREATE TABLE `test` ( 
  2.  `id` int(11) unsigned NOT NULL AUTO_INCREMENT, 
  3.  `a` int(11) unsigned DEFAULT NULL, 
  4.  PRIMARY KEY (`id`), 
  5.  UNIQUE KEY `a` (`a`) 
  6. ) ENGINE=InnoDB AUTO_INCREMENT=100 DEFAULT CHARSET=utf8;    

表的結(jié)構(gòu)很簡(jiǎn)單,一個(gè)主鍵 id,另一個(gè)***索引 a。表里的數(shù)據(jù)如下:

 
 
 
  1. mysql> select * from test; 
  2.  
  3. +----+------+ 
  4.  
  5. | id | a    | 
  6.  
  7. +----+------+ 
  8.  
  9. |  1 |    1 | 
  10.  
  11. |  2 |    2 | 
  12.  
  13. |  4 |    4 | 
  14.  
  15. +----+------+ 
  16.  
  17. 3 rows in set (0.00 sec)    

出現(xiàn)死鎖的操作如下:

步驟事務(wù) 1事務(wù) 2
1 begin
2 delete from test where a = 2;
3begin 
4delete from test where a = 2; (事務(wù) 1 卡?。?/td> 
5提示出現(xiàn)死鎖:ERROR 1213 (40001): Deadlock found when trying to get lock; try restarting transactioninsert into test (id, a) values (10, 2);

然后我們可以通過(guò) SHOW ENGINE INNODB STATUS; 來(lái)查看死鎖日志:

 
 
 
  1. ------------------------ 
  2.  
  3. LATEST DETECTED DEADLOCK 
  4.  
  5. ------------------------ 
  6.  
  7. 170219 13:31:31 
  8.  
  9. *** (1) TRANSACTION: 
  10.  
  11. TRANSACTION 2A8BD, ACTIVE 11 sec starting index read 
  12.  
  13. mysql tables in use 1, locked 1 
  14.  
  15. LOCK WAIT 2 lock struct(s), heap size 376, 1 row lock(s) 
  16.  
  17. MySQL thread id 448218, OS thread handle 0x2abe5fb5d700, query id 18923238 renjun.fangcloud.net 121.41.41.92 root updating 
  18.  
  19. delete from test where a = 2 
  20.  
  21. *** (1) WAITING FOR THIS LOCK TO BE GRANTED: 
  22.  
  23. RECORD LOCKS space id 0 page no 923 n bits 80 index `a` of table `oauthdemo`.`test` trx id 2A8BD lock_mode X waiting 
  24.  
  25. Record lock, heap no 3 PHYSICAL RECORD: n_fields 2; compact format; info bits 32 
  26.  
  27. 0: len 4; hex 00000002; asc     ;; 
  28.  
  29. 1: len 4; hex 00000002; asc     ;; 
  30.  
  31. *** (2) TRANSACTION: 
  32.  
  33. TRANSACTION 2A8BC, ACTIVE 18 sec inserting 
  34.  
  35. mysql tables in use 1, locked 1 
  36.  
  37. 4 lock struct(s), heap size 1248, 3 row lock(s), undo log entries 2 
  38.  
  39. MySQL thread id 448217, OS thread handle 0x2abe5fd65700, query id 18923239 renjun.fangcloud.net 121.41.41.92 root update 
  40.  
  41. insert into test (id,a) values (10,2) 
  42.  
  43. *** (2) HOLDS THE LOCK(S): 
  44.  
  45. RECORD LOCKS space id 0 page no 923 n bits 80 index `a` of table `oauthdemo`.`test` trx id 2A8BC lock_mode X locks rec but not gap 
  46.  
  47. Record lock, heap no 3 PHYSICAL RECORD: n_fields 2; compact format; info bits 32 
  48.  
  49. 0: len 4; hex 00000002; asc     ;; 
  50.  
  51. 1: len 4; hex 00000002; asc     ;; 
  52.  
  53. *** (2) WAITING FOR THIS LOCK TO BE GRANTED: 
  54.  
  55. RECORD LOCKS space id 0 page no 923 n bits 80 index `a` of table `oauthdemo`.`test` trx id 2A8BC lock mode S waiting 
  56.  
  57. Record lock, heap no 3 PHYSICAL RECORD: n_fields 2; compact format; info bits 32 
  58.  
  59. 0: len 4; hex 00000002; asc     ;; 
  60.  
  61. 1: len 4; hex 00000002; asc     ;; 
  62.  
  63. *** WE ROLL BACK TRANSACTION (1)  

分析

閱讀死鎖日志

遇到死鎖,***步就是閱讀死鎖日志。死鎖日志通常分為兩部分,上半部分說(shuō)明了事務(wù) 1 在等待什么鎖:

 
 
 
  1. 170219 13:31:31 
  2.  
  3. *** (1) TRANSACTION: 
  4.  
  5. TRANSACTION 2A8BD, ACTIVE 11 sec starting index read 
  6.  
  7. mysql tables in use 1, locked 1 
  8.  
  9. LOCK WAIT 2 lock struct(s), heap size 376, 1 row lock(s) 
  10.  
  11. MySQL thread id 448218, OS thread handle 0x2abe5fb5d700, query id 18923238 renjun.fangcloud.net 121.41.41.92 root updating 
  12.  
  13. delete from test where a = 2 
  14.  
  15. *** (1) WAITING FOR THIS LOCK TO BE GRANTED: 
  16.  
  17. RECORD LOCKS space id 0 page no 923 n bits 80 index `a` of table `oauthdemo`.`test` trx id 2A8BD lock_mode X waiting 
  18.  
  19. Record lock, heap no 3 PHYSICAL RECORD: n_fields 2; compact format; info bits 32 
  20.  
  21. 0: len 4; hex 00000002; asc     ;; 
  22.  
  23. 1: len 4; hex 00000002; asc     ;;    

從日志里我們可以看到事務(wù) 1 當(dāng)前正在執(zhí)行 delete from test where a = 2,該條語(yǔ)句正在申請(qǐng)索引 a 的 X 鎖,所以提示 lock_mode X waiting。

然后日志的下半部分說(shuō)明了事務(wù) 2 當(dāng)前持有的鎖以及等待的鎖: 

 
 
 
  1. *** (2) TRANSACTION: 
  2.  
  3. TRANSACTION 2A8BC, ACTIVE 18 sec inserting 
  4.  
  5. mysql tables in use 1, locked 1 
  6.  
  7. 4 lock struct(s), heap size 1248, 3 row lock(s), undo log entries 2 
  8.  
  9. MySQL thread id 448217, OS thread handle 0x2abe5fd65700, query id 18923239 renjun.fangcloud.net 121.41.41.92 root update 
  10.  
  11. insert into test (id,a) values (10,2) 
  12.  
  13. *** (2) HOLDS THE LOCK(S): 
  14.  
  15. RECORD LOCKS space id 0 page no 923 n bits 80 index `a` of table `oauthdemo`.`test` trx id 2A8BC lock_mode X locks rec but not gap 
  16.  
  17. Record lock, heap no 3 PHYSICAL RECORD: n_fields 2; compact format; info bits 32 
  18.  
  19. 0: len 4; hex 00000002; asc     ;; 
  20.  
  21. 1: len 4; hex 00000002; asc     ;; 
  22.  
  23. *** (2) WAITING FOR THIS LOCK TO BE GRANTED: 
  24.  
  25. RECORD LOCKS space id 0 page no 923 n bits 80 index `a` of table `oauthdemo`.`test` trx id 2A8BC lock mode S waiting 
  26.  
  27. Record lock, heap no 3 PHYSICAL RECORD: n_fields 2; compact format; info bits 32 
  28.  
  29. 0: len 4; hex 00000002; asc     ;; 
  30.  
  31. 1: len 4; hex 00000002; asc     ;;    

從日志的 HOLDS THE LOCKS(S) 塊中我們可以看到事務(wù) 2 持有索引 a 的 X 鎖,并且是記錄鎖(Record Lock)。該鎖是通過(guò)事務(wù) 2 在步驟 2 執(zhí)行的 delete 語(yǔ)句申請(qǐng)的。由于是 RR 隔離模式下的基于***索引的等值查詢(Where a = 2),所以會(huì)申請(qǐng)一個(gè)記錄鎖,而非 next-key 鎖。

從日志的 WAITING FOR THIS LOCK TO BE GRANTED 塊中我們可以看到事務(wù) 2 正在申請(qǐng) S 鎖,也就是共享鎖。該鎖是 insert into test (id,a) values (10,2) 語(yǔ)句申請(qǐng)的。insert 語(yǔ)句在普通情況下是會(huì)申請(qǐng)排他鎖,也就是 X 鎖,但是這里出現(xiàn)了 S 鎖。這是因?yàn)?a 字段是一個(gè)***索引,所以 insert 語(yǔ)句會(huì)在插入前進(jìn)行一次 duplicate key 的檢查,為了使這次檢查成功,需要申請(qǐng) S 鎖防止其他事務(wù)對(duì) a 字段進(jìn)行修改。

那么為什么該 S 鎖會(huì)失敗呢?這是對(duì)同一個(gè)字段的鎖的申請(qǐng)是需要排隊(duì)的。S 鎖前面還有一個(gè)未申請(qǐng)成功的 X 鎖,所以 S 鎖必須等待,所以形成了循環(huán)等待,死鎖出現(xiàn)了。

通過(guò)閱讀死鎖日志,我們可以清楚地知道兩個(gè)事務(wù)形成了怎樣的循環(huán)等待,再加以分析,就可以逆向推斷出循環(huán)等待的成因,也就是死鎖形成的原因。

死鎖形成流程圖

為了讓大家更好地理解死鎖形成的原因,我們?cè)偻ㄟ^(guò)表格的形式闡述死鎖形成的流程:

步驟
事務(wù) 1事務(wù) 2
1 begin
2 delete from test where a = 2; 執(zhí)行成功,事務(wù) 2 占有 a=2 下的 X 鎖,類型為記錄鎖。
3begin 
4delete from test where a = 2; 事務(wù) 1 希望申請(qǐng) a=2 下的 X 鎖,但是由于事務(wù) 2 已經(jīng)申請(qǐng)了一把 X 鎖,兩把 X 鎖互斥,所以 X 鎖申請(qǐng)進(jìn)入鎖請(qǐng)求隊(duì)列。 
5出現(xiàn)死鎖,事務(wù) 1 權(quán)重較小,所以被選擇回滾(成為犧牲品)。insert into test (id, a) values (10, 2); 由于 a 字段建立了***索引,所以需要申請(qǐng) S 鎖以便檢查 duplicate key,由于插入的 a 的值還是 2,所以排在 X 鎖后面。但是前面的 X 鎖的申請(qǐng)只有在事務(wù) 2commit 或者 rollback 之后才能成功,此時(shí)形成了循環(huán)等待,死鎖產(chǎn)生。

拓展

在排查死鎖的過(guò)程中,有個(gè)同事還發(fā)現(xiàn)了上述場(chǎng)景會(huì)產(chǎn)生另一種死鎖,該場(chǎng)景無(wú)法通過(guò)手工復(fù)現(xiàn),只有高并發(fā)場(chǎng)景下才有可能復(fù)現(xiàn)。

該死鎖對(duì)應(yīng)的日志這里就不貼出了,與上一個(gè)死鎖的核心差別是事務(wù) 2 等待的鎖從 S 鎖換成了 X 鎖,也就是 lock_mode X locks gap before rec insert intention waiting。我們還是通過(guò)表格來(lái)詳細(xì)說(shuō)明該死鎖產(chǎn)生的流程:

步驟
事務(wù) 1事務(wù) 2
1 begin
2 delete from test where a = 2; 執(zhí)行成功,事務(wù) 2 占有 a=2 下的 X 鎖,類型為記錄鎖。
3begin 
4 【insert 第 1 階段】insert into test (id, a) values (10, 2); 事務(wù) 2 申請(qǐng) S 鎖進(jìn)行 duplicate key 進(jìn)行檢查。檢查成功。
5delete from test where a = 2; 事務(wù) 1 希望申請(qǐng) a=2 下的 X 鎖,但是由于事務(wù) 2 已經(jīng)申請(qǐng)了一把 X 鎖,兩把 X 鎖互斥,所以 X 鎖申請(qǐng)進(jìn)入鎖請(qǐng)求隊(duì)列。 
6出現(xiàn)死鎖,事務(wù) 1 權(quán)重較小,所以被選擇回滾(成為犧牲品)。【insert 第 2 階段】insert into test (id, a) values (10, 2); 事務(wù) 2 開(kāi)始插入數(shù)據(jù),S 鎖升級(jí)為 X 鎖,類型為 insert intention。同理,X 鎖進(jìn)入隊(duì)列排隊(duì),形成循環(huán)等待,死鎖產(chǎn)生。


總結(jié)

排查死鎖時(shí),首先需要根據(jù)死鎖日志分析循環(huán)等待的場(chǎng)景,然后根據(jù)當(dāng)前各個(gè)事務(wù)執(zhí)行的 SQL 分析出加鎖類型以及順序,逆向推斷出如何形成循環(huán)等待,這樣就能找到死鎖產(chǎn)生的原因了。

PS:上述分析都是基于經(jīng)驗(yàn)的推斷,希望其他小伙伴們能夠指出當(dāng)中的錯(cuò)誤以及不足指出,謝謝!


分享文章:記一次MySQL死鎖排查過(guò)程
當(dāng)前路徑:http://www.dlmjj.cn/article/dhdcdgi.html