MySQL 默认隔离级别是RR,为什么阿里等大厂会改成RC?
Posted Hollis Chuang
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了MySQL 默认隔离级别是RR,为什么阿里等大厂会改成RC?相关的知识,希望对你有一定的参考价值。
△Hollis, 一个对Coding有着独特追求的人△
这是Hollis的第 377 篇原创分享
作者 l Hollis
来源 l Hollis(ID:hollischuang)
我之前写过一篇文章《为什么MySQL选择REPEATABLE READ作为默认隔离级别?》介绍过mysql 的默认隔离级别是 Repeatable Reads以及背后的原因。
主要是因为MySQL在主从复制的过程是通过bin log 进行数据同步的,而MySQL早期只有statement这种bin log格式,这种格式下,bin log记录的是SQL语句的原文。
当出现事务乱序的时候,就会导致备库在 SQL 回放之后,结果和主库内容不一致。
为了解决这个问题,MySQL默认采用了Repetable Read这种隔离级别,因为在 RR 中,会在更新数据的时候增加记录锁的同时增加间隙锁。可以避免这种情况的发生。
关于MySQL的加锁方式及加锁原则,可以参考我写的另外一篇《求你了,别再说数据库锁的只是索引了!》,这里就不再赘述了。
在我知道MySQL 默认隔离级别是RR后,很长一段时间都以为应该不会有人去修改这个默认配置。
但是直到有一天,我们线上发生了一次死锁的问题,我在排查的过程中,才发现我们的数据库用的隔离级别没有使用默认的 RR,而是修改成了Read Committed 。(关于那次死锁排查过程,可以参考:一次数据库的死锁问题排查过程)
大家可以通过这个命令查看数据库当前的隔离级别:
select @@tx_isolation;
那么,这里不禁就有疑问了,为啥阿里要把这个数据库隔离级别修改成 RC 呢,背后有什么思考吗?
RR 和 RC 的区别
想要搞清楚这个问题,我们需要先弄清楚 RR 和 RC 的区别,分析下各自的优缺点。
一致性读
一致性读,又称为快照读。快照即当前行数据之前的历史版本。快照读就是使用快照信息显示基于某个时间点的查询结果,而不考虑与此同时运行的其他事务所执行的更改。
在MySQL 中,只有READ COMMITTED 和 REPEATABLE READ这两种事务隔离级别才会使用一致性读。
在 RC 中,每次读取都会重新生成一个快照,总是读取行的最新版本。
在 RR 中,快照会在事务中第一次SELECT语句执行时生成,只有在本事务中对数据进行更改才会更新快照。
在数据库的 RC 这种隔离级别中,还支持"半一致读" ,一条update语句,如果 where 条件匹配到的记录已经加锁,那么InnoDB会返回记录最近提交的版本,由MySQL上层判断此是否需要真的加锁。
锁机制
数据库的锁,在不同的事务隔离级别下,是采用了不同的机制的。在 MySQL 中,有三种类型的锁,分别是Record Lock、Gap Lock和 Next-Key Lock。
Record Lock表示记录锁,锁的是索引记录。
Gap Lock是间隙锁,锁的是索引记录之间的间隙。
Next-Key Lock是Record Lock和Gap Lock的组合,同时锁索引记录和间隙。他的范围是左开右闭的。
在 RC 中,只会对索引增加Record Lock,不会添加Gap Lock和Next-Key Lock。
在 RR 中,为了解决幻读的问题,在支持Record Lock的同时,还支持Gap Lock和Next-Key Lock;
主从同步
在数据主从同步时,不同格式的 binlog 也对事务隔离级别有要求。
MySQL的binlog主要支持三种格式,分别是statement、row以及mixed,但是,RC 隔离级别只支持row格式的binlog。如果指定了mixed作为 binlog 格式,那么如果使用RC,服务器会自动使用基于row 格式的日志记录。
而 RR 的隔离级别同时支持statement、row以及mixed三种。
为什么互联网公司选择使用 RC
提升并发
互联网公司和传统企业最大的区别是什么?
高并发!
没错,互联网业务的并发度比传统企业要高处很多。2020年双十一当天,订单创建峰值达到 58.3 万笔/秒。
很多人问,要怎么做才能扛得住这么大的并发量。其实,这背后的优化多到几个小时都讲不完,因为要做的、可以做的事情实在是太多了。
而有一个和我们今天这篇文章有关的优化,那就是通过修改数据库的隔离级别来提升并发度。
为什么 RC 比 RR 的并发度要好呢?
首先,RC 在加锁的过程中,是不需要添加Gap Lock和 Next-Key Lock 的,只对要修改的记录添加行级锁就行了。
这就使得并发度要比 RR 高很多。
另外,因为 RC 还支持"半一致读",可以大大的减少了更新语句时行锁的冲突;对于不满足更新条件的记录,可以提前释放锁,提升并发度。
减少死锁
因为RR这种事务隔离级别会增加Gap Lock和 Next-Key Lock,这就使得锁的粒度变大,那么就会使得死锁的概率增大。
死锁:一个事务锁住了表A,然后又访问表B;另一个事务锁住了表B,然后企图访问表A;这时就会互相等待对方释放锁,就导致了死锁。
总结
本文介绍了一些 MySQL数据库的 RR 和 RC 两种事务隔离级别。他们主要在加锁机制、主从同步以及一致性读方面存在一些差异。
而很多大厂,为了提升并发度和降低死锁发生的概率,会把数据库的隔离级别从默认的 RR 调整成 RC。
当然,这样做也不是完全没有问题,首先使用 RC 之后,就需要自己解决幻读的问题,这个其实还好,很多时候幻读问题其实是可以忽略的,或者可以用其他手段解决。
还有就是使用 RC 的时候,不能使用statement格式的 binlog,这种影响其实可以忽略不计了,因为MySQL是在5.1.5版本开始支持row的、在5.1.8版本中开始支持mixed,后面这两种可以代替 statement格式。
所有的技术方案的选择,都是一种权衡的艺术!
参考资料:
Transaction Isolation Levels:https://dev.mysql.com/doc/refman/5.7/en/innodb-transaction-isolation-levels.html#isolevel_repeatable-read
MySQL 中隔离级别 RC 与 RR 的区别:https://www.cnblogs.com/digdeep/p/4968453.html
什么是半一致性读?https://cloud.tencent.com/developer/article/1651628
技术交流群
最近有很多人问,有没有读者交流群,想知道怎么加入。
最近我创建了一些群,大家可以加入。交流群都是免费的,只需要大家加入之后不要随便发广告,多多交流技术就好了。
目前创建了多个交流群,全国交流群、北上广杭深等各地区交流群、面试交流群、资源共享群等。
有兴趣入群的同学,可长按扫描下方二维码,一定要备注:全国 Or 城市 Or 面试 Or 资源,根据格式备注,可更快被通过且邀请进群。
▲长按扫描
往期推荐
杭州程序员从互联网跳央企,晒一天工作和收入,网友:待一年就废
如果你喜欢本文,
请长按二维码,关注 Hollis.
转发至朋友圈,是对我最大的支持。
点个 在看
喜欢是一种感觉
在看是一种支持
↘↘↘
以上是关于MySQL 默认隔离级别是RR,为什么阿里等大厂会改成RC?的主要内容,如果未能解决你的问题,请参考以下文章
MySQL 默认隔离级别是RR,为什么阿里这种大厂会改成RC?