MVCC(Multiple Version Concurrent Control)多版本并发控制没有一个统一的实现标准。可以认为MVCC是行级锁的一个变种,但是它在很多情况下避免了加锁操作,开销更低。虽然实现机制有所不同,但是大都实现了非阻塞的读操作,写操作只锁定必要的行。MVCC通过保存数据在某个时间点的快照来实现。也就是说,不管需要执行多长时间,每个事务看到的数据都是一致的。根据事务开始的时间不同,每个事务对同一张表,同一时刻看到的数据可能不一样。
InnoDB的MVCC通过在每行记录后面保存两个隐藏的列来实现。这两个列,一个保存了行的创建时间,一个保存行的过期时间(或删除时间)。但是,存储的不是实际的时间值,而是系统版本号。每开始一个新的事务,系统版本号会自动递增。事务开始时刻的系统版本号作为事务的版本号,与查询到的每行记录的版本号进行比较。
存储引擎是InnoDB,在默认隔离级别下(可重复读),MVCC具体操作:
1 select
根据以下两个条件检查每行记录:
a 只查找版本早于当前事务版本的数据行(行的系统版本号小于或等于事务的系统版本号),确保事务读取的行,要么是在事务开始前已经存在,要么是事务自身插入或修改过。
b 行的删除版本要么未定义,要么大于当前事务版本号,确保事务读取到的行在事务开始之前未被删除。
只有符合上述两个条件的记录,才能返回作为查询结果。
2 insert
为插入的每一行保存当前系统版本号作为行版本号。
3 delete
为删除的每一行保存当前系统版本号作为行删除标识。
4 update
插入一行新记录,保存当前系统版本号作为行版本号,保存当前系统版本号到原来的行作为行删除标识。
保存这两个额外系统版本号,使大多数读操作可以不加锁,但是每行记录需要额外的存储空间,需要做更多的行检查工作以及一些额外的维护工作。
MVCC只在可重复读和提交读这两个隔离级别下工作。其他两个隔离级别与MVCC不兼容。未提交读总是读取最新的数据行,而不是符合当前事务版本的数据行。可串行化会对所有读取的行都加锁。
参考资料
《高性能mysql》P12-13