如何阅读死锁日志

Posted 有赞coder

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了如何阅读死锁日志相关的知识,希望对你有一定的参考价值。

文 | 杨一 on 运维


一、前言

工欲善其事必先利其器,前面分析了很多死锁案例,并没有详细的介绍如何通过死锁日志来诊断死锁的成因。本文将介绍如何读懂死锁日志,尽可能的获取信息来辅助我们解决死锁问题。

二、日志分析

2.1 场景

为了更好的学习死锁日志,我们需要提前了解死锁场景:MySQL 5.6 事务隔离级别为 RR。

 
   
   
 
  1. CREATE TABLE `ty` (

  2.  `id` int(11) NOT NULL AUTO_INCREMENT,

  3.  `a` int(11) DEFAULT NULL,

  4.  `b` int(11) DEFAULT NULL,

  5.  PRIMARY KEY (`id`),

  6.  KEY `idxa` (`a`)

  7. ) ENGINE=InnoDB AUTO_INCREMENT=8 DEFAULT CHARSET=utf8mb4;

  8. insert into ty(a,b) values(2,3),(5,4),(6,7);

2.2 测试用例

2.3 我们通过 show engine innodb status 查看的日志是最新一次记录死锁的日志

 
   
   
 
  1. ------------------------

  2. LATEST DETECTED DEADLOCK

  3. ------------------------

  4. 2017-09-09 22:34:13 7f78eab82700

  5. *** (1) TRANSACTION: ##事务1

  6. TRANSACTION 462308399, ACTIVE 33 sec starting index read

  7. mysql tables in use 1, locked 1

  8. LOCK WAIT 2 lock struct(s), heap size 360, 1 row lock(s)

  9. MySQL thread id 3525577, OS thread handle 0x7f896cc4b700, query id 780039657 localhost root updating

  10. delete from ty where a=5

  11. *** (1) WAITING FOR THIS LOCK TO BE GRANTED:

  12. RECORD LOCKS space id 219 page no 4 n bits 72 index `idxa` of table `test`.`ty` trx id 462308399 lock_mode X waiting

  13. *** (2) TRANSACTION:

  14. TRANSACTION 462308398, ACTIVE 61 sec inserting, thread declared inside InnoDB 5000

  15. mysql tables in use 1, locked 1

  16. 5 lock struct(s), heap size 1184, 4 row lock(s), undo log entries 2

  17. MySQL thread id 3525490, OS thread handle 0x7f78eab82700, query id 780039714 localhost root update

  18. insert into ty(a,b) values(2,10)

  19. *** (2) HOLDS THE LOCK(S):

  20. RECORD LOCKS space id 219 page no 4 n bits 72 index `idxa` of table `test`.`ty` trx id 462308398 lock_mode X

  21. *** (2) WAITING FOR THIS LOCK TO BE GRANTED:

  22. RECORD LOCKS space id 219 page no 4 n bits 72 index `idxa` of table `test`.`ty` trx id 462308398 lock_mode X locks gap before rec insert intention waiting

  23. *** WE ROLL BACK TRANSACTION (1)

2.4 日志分析

 
   
   
 
  1. *** (1) TRANSACTION: #事务1

  2. TRANSACTION 462308399, ACTIVE 33 sec starting index read

事务编号为 462308399,活跃 33 秒,*starting index read * 表示事务状态为根据索引读取数据。常见的其他状态:

  1. fetching rows 表示事务状态在 rowsearchfor_mysql 中被设置,表示正在查找记录

  2. updating or deleting 表示事务已经真正进入了 Update/delete 的函数逻辑(rowupdatefor_mysql)

  3. thread declared inside InnoDB 说明事务已经进入 innodb 层。通常而言不在 innodb 层的事务大部分是会被回滚的

mysql tables in use 1, 说明当前的事务使用一个表。

locked 1 表示表上有一个表锁,对于 DML 语句为 LOCK_IX

LOCK WAIT 2 lock struct(s), heap size 360, 1 row lock(s)

LOCK WAIT 表示正在等待锁, 2 lock struct(s) 表示 trx->trx_locks 锁链表的长度为 2,每个链表节点代表该事务持有的一个锁结构,包括表锁,记录锁以及 auto_inc 锁等。本案例中 2locks 表示 IX 锁和 lock_mode X (Next-key lock)

heap size 360 表示事务分配的锁堆内存大小,一般没有什么具体的用处。

1 row lock(s) 表示当前事务持有的行记录锁/gap 锁的个数。

delete from ty where a=5 表示事务 1 在执行的 sql ,不过比较悲伤的事情是 show engine innodb status 是查看不到完整的事务的 sql 的,通常显示当前正在等待锁的 sql。

 
   
   
 
  1. *** (1) WAITING FOR THIS LOCK TO BE GRANTED:

  2. RECORD LOCKS space id 219 page no 4 n bits 72 index `idxa` of table `test`.`ty` trx id 462308399 lock_mode X waiting

RECORD LOCKS 表示记录锁,space id 为 219,page号4 ,n bits 72 表示这个聚集索引记录锁结构上留有 72 个 Bit 位

表示事务 1 正在等待表 ty 上的 idxa 的 X 锁本案例中其实是 Next-Key lock

事务 2 的 log 和上面分析类似,

 
   
   
 
  1. *** (2) HOLDS THE LOCK(S):

  2. RECORD LOCKS space id 219 page no 4 n bits 72 index `idxa` of table `test`.`ty` trx id 462308398 lock_mode X

显示了事务 2 insert into ty(a,b) values(2,10) 持有了 a=5 的 Lock mode X |LOCK_GAP ,不过我们从日志里面看不到事务 2 执行的 delete from ty where a=5;这点也是造成 DBA 仅仅根据日志难以分析死锁的问题的根本原因。

 
   
   
 
  1. *** (2) WAITING FOR THIS LOCK TO BE GRANTED:

  2. RECORD LOCKS space id 219 page no 4 n bits 72 index `idxa` of table `test`.`ty` trx id 462308398 lock_mode X locks gap before rec insert intention waiting

表示事务 2 的 insert 语句正在等待插入意向锁 lock_mode X locks gap before rec insert intention waiting (LOCK_X + LOCK_REC_GAP )

这里需要各位注意的是锁组合,类似 lock_mode X waiting ,lock_mode X,lock_mode X locks gap before rec insert intention waiting 是我们分析死锁的核心重点。如何理解锁组合呢?

首先我们要知道对于 MySQL 有两种常规锁模式:

 
   
   
 
  1. LOCK_S(读锁,共享锁)

  2. LOCK_X(写锁,排它锁)

最容易理解的锁模式,读加共享锁,写加排它锁。

有如下几种锁的属性:

 
   
   
 
  1. LOCK_REC_NOT_GAP      (锁记录)

  2. LOCK_GAP               (锁记录前的GAP)

  3. LOCK_ORDINARY         (同时锁记录+记录前的GAP,也即是Next Key锁)

  4. LOCK_INSERT_INTENTION (插入意向锁,其实是特殊的GAP锁)

锁的属性可以与锁模式任意组合。例如:

 
   
   
 
  1. lock->type_mode       可以是Lock_X或者Lock_S

  2. locks gap before rec  表示为gap锁:lock->type_mode & LOCK_GAP

  3. locks rec but not gap 表示为记录锁,非gap锁:lock->type_mode & LOCK_REC_NOT_GAP

  4. insert intention      表示为插入意向锁:lock->type_mode & LOCK_INSERT_INTENTION

  5. waiting               表示锁等待:lock->type_mode & LOCK_WAIT

三、小结

本文算是简单的死锁分析入门,能够提供部分死锁分析的所需要的技术知识。死锁分析确是一门技术活儿,想要透彻的分析死锁的成因,我们必须要了解造成死锁的业务逻辑 sql 的执行场景,MySQL 的锁机制,各种锁之间的兼容性,必要时还需要透彻的理解源码。


扩展阅读

1. 

2. 

3. 


-The End-

Vol.147








有赞技术团队

为 300 万商家,150 个行业,200 亿电商交易额

提供技术支持


微商城|零售|美业


技术博客:tech.youzan.com




The bigger the dream, 

the more important the team.

以上是关于如何阅读死锁日志的主要内容,如果未能解决你的问题,请参考以下文章

生产环境MySQL死锁如何监控及如何减少死锁发生的概率。

基于innodb_print_all_deadlocks从errorlog中解析MySQL死锁日志

(4.7)怎么捕获和记录SQL Server中发生的死锁?

如何在不产生死锁的情况下拥有一个缓冲通道和多个阅读器?

我的Android进阶之旅NDK开发之在C++代码中使用Android Log打印日志,打印出C++的函数耗时以及代码片段耗时详情

Java并发编程实战 04死锁了怎么办?