MySQL:MVCC能否解决幻读问题

Posted 星河之码

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了MySQL:MVCC能否解决幻读问题相关的知识,希望对你有一定的参考价值。

尺有所短,寸有所长;不忘初心,方得始终

请关注公众号:星河之码

幻读【前后多次读取,数据总量不一致】

同一个事务里面连续执行两次同样的sql语句,可能导致不同结果的问题,第二次sql语句可能会返回之前不存在的行。

事务A执行多次读取操作过程中,由于在事务提交之前,事务B(insert/delete/update)写入了一些符合事务A的查询条件的记录,导致事务A在之后的查询结果与之前的结果不一致,这种情况称之为幻读

  • MVCC能否解决幻读问题

    首先可以明确的是,MVCC在快照读的情况下可以解决幻读问题,但是在当前读的情况下是不能解决幻读的

一、快照读和当前读

mysql里面实际上有两种读取的方式:快照读和当前读,在之前的文章中《MySQL(八):MVCC多版本并发控制》也有介绍,这里重新简单回顾一下。

  • 快照读【Consistent Read】

    也叫普通读,读取的是记录数据的可见版本,不加锁,不加锁的普通select语句都是快照读,即不加锁的非阻塞读

    快照读的执行方式是生成 ReadView,直接利用 MVCC 机制来进行读取,并不会对记录进行加锁

    如下语句:

    select * from table;
    
  • 当前读

    也称锁定读【Locking Read】,读取的是记录数据的最新版本,并且需要先获取对应记录的锁。如下语句:

    SELECT * FROM student LOCK IN SHARE MODE;  # 共享锁
    SELECT * FROM student FOR UPDATE; # 排他锁
    INSERT INTO student values ...  # 排他锁
    DELETE FROM student WHERE ...  # 排他锁
    UPDATE student SET ...  # 排他锁
    

二、MVCC能解决幻读问题的场景

当我们在读取数据的时候是【快照读】的情况下是可以解决【幻读】的问题,其原理就是MVCC

下面使用案例说明:

假设表中有三条数据,以及有两个事物A/B,A读取数据,B插入数据

#事物A:
select name from user where id > 3;
#事物B:
insert into user valus('6','edwin');

执行过程

时间事务A事物C
1开始事务
2第一次查询:select name from user where id > 3;
6开始事务
7执行插入:insert into user valus(‘6’,‘edwin’);
8提交事务
9第二次查询:select name from user where id > 3;
10提交事务

由于采用的是【快照读】的方式,在A事物开启时会产生一个版本快照,产生版本快照如下

然后通过MVCC的【Read View】对版本快照中各个版本链中的数据进行可见性判断,读取相应的数据版本。两次查询结果都是【id=4,5】两条数据。

Read View具体可见性规则判断在之前的文章中《MySQL(八):MVCC多版本并发控制》有详细的图文详解,这里就不再赘述。

因此,即使事务B新插入了数据,由于已经生成了版本快照,也不会影响Read View的可见性规则判读,所以在【快照读】的情况下,使用MVCC不会产生幻读问题。

三、MVCC不能解决幻读问题的场景

3.1、MVCC什么场景下不能解决幻读问题

当我们在读取数据的时候是【当前读】的情况下,无法使用MVCC解决幻读问题

案例说明:还是先准备几条数据,

有两个事物A/B,A先读取数据,在修改数据,最后有读取数据,B插入数据,看看结果会什么

#事物A:
select name from user where id > 3;
#事物B:
insert into user valus('6','edwin');
#事物A:
update user set name = '彬' where id = 6;

执行过程

时间事务A事物C
1开始事务
2第一次查询:select name from user where id > 3;
6开始事务
7执行插入:insert into user valus (‘6’,‘edwin’);
8提交事务
9第二次查询:select name from user where id > 3;
10修改数据:update user set name = ‘彬’ where id = 6;
11第三次查询:select name from user where id > 3;
12提交事务
  • 在时间点为9的时候

    事务A的【第一次】与【第二次】查询结果与上面的快照读是一样的,基于MVCC两次查询结果都是【id=4,5】两条数据。

  • 在时间点为10的时候

    事务A修改了事务B插入的数据,由于update是当前读,所以此时会读取最新的数据(包括其他已经提交的事务)

  • 在时间点为11的时候

    事务A执行【第三次】查询,是基于当前最新版本查询的,所以会查询到事务B插入的【id=6】的数据,一共会查询到三条数据【id=4,5,6】,与前两次查询结果不同,从而产生了幻读。

3.2、如何解决当前读的幻读问题

在可重复读(RR)的隔离级别下,执行当前读,

案例说明:还是使用上述的数据

  • 事务A,执行当前读,查询id>3的所有记录。
  • 事务B,插入id=5的一条数据。
#事物A:
select name from user where id > 3 lock in share mode;
#事物B:
insert into user valus('6','edwin');

执行过程

时间事务A事物B
1开始事务
2第一次查询:select name from user where id > 3 lock in share mode;
6开始事务
7执行插入时发现,id>3的范围有间隙锁,插入阻塞,处于等待状态
8第二次查询:select name from user where id > 3;
9提交事务
10事物A提交,间隙锁释放,执行插入:insert into user valus (‘6’,‘edwin’);
11提交事务

事务A在执行当前读【select … lock in share mode】的时候,在【id=4,5】的记录上加了共享锁,并且在【id > 6】这个范围上也加了间隙锁,所以上图中的事务B执行插入操作时被阻塞了。所以事务A两次读取的数据是一样的。因此,在这种情况下是不会存在幻读问题。

  • 总结

    RR隔离级别下,当前读执行如下语句时会带上锁之外,还会使用间隙锁+临键锁,锁住索引记录之间的范围,避免范围间插入记录,以避免产生幻影行记录

    SELECT * FROM student LOCK IN SHARE MODE;  # 共享锁
    SELECT * FROM student FOR UPDATE; # 排他锁
    INSERT INTO student values ...  # 排他锁
    DELETE FROM student WHERE ...  # 排他锁
    UPDATE student SET ...  # 排他锁
    
  • 注意

    这种方式不能解决3.1中的幻读问题,因为在3.1中事务A执行修改数据,获取锁之前,已经读取到了事务B插入的数据,并且已经记录到Undo日志中

在 MySQL 中是如何通过 MVCC 机制来解决不可重复读和幻读问题的?

「不可重复读现象指的是,在一个事务内,连续两次查询同一条数据,查到的结果前后不一样」。

在 MySQL 的可重复读隔离级别下,不存在不可重复读的问题,那么 MySQL 是如何解决的呢?

答案就是 MVCC 机制。MVCC 是 Mutil-Version Concurrent Control(多版本并发控制)的缩写,它指的是数据库中的每一条数据,会存在多个版本。对同一条数据而言,MySQL 会通过一定的手段(ReadView 机制)控制每一个事务看到不同版本的数据,这样也就解决了不可重复读的问题。

假设现有一条数据,它的 row_trx_id=10,数据的值为 data0,它的 roll_pointer 指针为 null。

假设现在有事务 A 和事务 B 并发执行,事务 A 的事务 id 为 20,事务 B 的事务 id 为 30。

现在事务 A 开始第一次查询数据,那么此时 MySQL 会为事务 A 产生一个 ReadView,此时 ReadView 的内容如下:m_ids=[20,30],min_trx_id=20,max_trx_id=31,creator_trx_id=20。

此时由于数据的最新版本的 row_trx_id=10,「小于事务 A 的 ReadView 中的 min_trx_id,这表明这个版本的数据是在事务 A 开启之友链交易前就提交的」,因此事务 A 可以读取到数据,读取到的值为 data0。

「结论:事务 A 第一次查询到的数据为 data0」

接着事务 B(trx_id=30)去修改数据,将数据修改为 data_B,并提交事务,此时 MySQL 会写一条对应的 undo log,数据就会新增一个版本,undo log 版本就变成了如下图所示的结构,数据的最新版本的 row_trx_id 就是事务 B 的事务 id,即:30。此时,事务 B 已经提交了,因此系统中活跃事务的数组里就没有 30 这个 id 了。

「重点来了,事务 A 的 ReadView 是在发起第一次查询的时候创建的,当时系统中的活跃事务有 20 和 30 这两个 id,那么此时当事务 B 提交以后,事务 A 的 ReadView 的 m_ids 会变化吗?不会。因为是可重复读隔离级别下,对于读事务,只会在事务查询的第一次创建 ReadView,后面的查询不会再重新创建」

接着事务 A(trx_id=20)开始第二次查询数据,前面事务 A 已经创建了 ReadView,所以在第二次查询时,不会再重复创建 ReadView 了。

此时在 undo log 版本链中,数据最新版本的事务 id 为 30,根据 ReadView 机制(什么是 ReadView 机制,可以去阅读上一篇文章),发现 30 处于事务 A 的 ReadView 中 min_trx_id 和 max_trx_id 之间,因此还需要判断 30 是否处于 m_ids 数组内,结果发现 30 确实在 m_ids 数组中,「这就表示这个版本的数据是和自己在同一时刻开启事务所提交的,因此不能让自己读取。」

所以此时事务 A 需要沿着 undo log 版本链继续向前找,最终发现 row_id=10 的版本数据自己可以读取到,因此事务 A 查询到的值是 data0。

「结论:事务 A 第二次查询到的数据为 data0。这与事务 A 第一次查询的数据结果相同,没有出现不可重复读的现象。」

那假设后来又创建了一个事务 C,id 为 40,并且事务 C 将数据修改为了 data_C。然后数据的 undo log 版本链变

然后事务 A 发起第三次查询,此时事务 A 仍然不会再重新创建 ReadView,所以此时它的 ReadView 依旧是:m_ids=[20,30],min_trx_id=20,max_trx_id=31,creator_trx_id=20。

由于数据最新的版本的为 trx_id=40,依照 ReadView 机制,40 大于事务 A 中的 max_trx_id,「这表示这是在事务 A 开启之后的事务提交的数据,因此事务 A 不能读取到」,所以需要沿着 undo log 版本链往前找,然而 trx_id=30 的版本事务 A 也不能读到,继续向前找,最终读取到 trx_id=10 的版本数据,即 data0。

以上是关于MySQL:MVCC能否解决幻读问题的主要内容,如果未能解决你的问题,请参考以下文章

MySQL ---- MVCC

MySQL ---- MVCC

MySQL ---- MVCC

在 MySQL 中是如何通过 MVCC 机制来解决不可重复读和幻读问题的?

mysql #2045怎么解决

MySQL幻读与MVCC可见性