InnoDB体系架构Checkpoint技术

Posted 2020-10-27 WilburXu

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了InnoDB体系架构Checkpoint技术相关的知识，希望对你有一定的参考价值。

Checkpoint技术

　　前篇 InnoDB体系架构（二）内存从缓冲池、缓冲池的管理、重做日志缓冲、额外内存缓冲这四个点介绍了InnoDB存储引擎的内存结构，而在将缓冲池的数据刷新到磁盘的过程中使用到了Checkpoint技术，这篇文章我们着重讲解一下Checkpoint在内存中到应用。

一、Checkpoint使用背景

　　由于日常DML语句，如：Update / Delete操作首先操作了缓冲池的数据，并没有立即写入到磁盘，这有可能会导致内存中数据与磁盘中的数据产生不一致的情况。而与磁盘数据不一致的缓冲池的页就是我们常说的脏页。所以checkpoint的工作就是将内存中的脏页，在一定条件下刷新到磁盘。

　　如果在从缓冲池将页数据刷新到磁盘的过程中发生宕机，那么数据就无法恢复了；为了避免这种情况的发生，采用了Write Ahead Log策略，即当事务提交时，先写重做日志，再修改页，这样发生宕机也可以通过重做日志进行恢复。

二、Checkpoint的目的　　

　　1. 如果重做日志太大，那么数据库启动的时候恢复时间过长；

　　2. 缓冲池不够用时，需要先将脏页数据刷新到磁盘中；

　　3. 重做日志不可用时，刷新脏页到磁盘；

三、Checkpoint的运作机制

　　在了解运作机制之前，先来思考一下这几个问题：Checkpoint发生的时间？发生的条件？脏页（对象）的选择？

　　在InnoDB存储引擎内部，Checkpoint分为了两种：

　　(一） Sharp Checkpoint

　　　　Sharp Checkpoint 发生在数据库关闭时，将所有的脏页都刷新回磁盘，这是默认的工作方式，参数：innodb_fast_shutdown=1。

　　(二）Fuzzy Checkpoint

　　　　在InnoDB存储引擎运行时，使用Fuzzy Checkpoint进行页刷新，只刷新一部分脏页。在以下四种情况下会出发Fuzzy Checkpoint：

　　　　1. Master Thread Checkpoint

　　　　对于Master Thread，以每秒或者每N秒的速度将缓冲池的脏页列表刷新一定比例的页回磁盘，这个过程是异步的，用户查询线程不会阻塞。

　　　　2. FLUSH_LRU_LIST Checkpoint

为了保证LRU列表中有100个左右的空闲页可使用，在InnoDB 1.1.x版本之前，用户查询线程会检查LRU列表是否有足够的空间操作。如果没有，根据LRU算法，溢出LRU列表尾端的页，如果这些页有脏页，需要进行checkpoint。因此叫：FLUSH_LRU_LIST Checkpoint。

3. Async/Sync Flush Checkpoint

Async/Sync Flush checkpoint 发生在重做日志不可用的时候（满了），将buffer pool中的一部分脏页刷新到磁盘中，在脏页写入磁盘之后，事物对应的重做日志也就可以释放了。关于redo_log文件的的大小，可以通过innodb_log_file_size来配置。

4. Dirty Page too much Checkpoint

即脏页太多，强制checkpoint，保证缓冲池有足够可用的页。

参数设置：innodb_max_dirty_pages_pct = 75 表示：当缓冲池中脏页的数量占75%时，强制checkpoint。1.0.x之后默认75

以上是关于InnoDB体系架构Checkpoint技术的主要内容，如果未能解决你的问题，请参考以下文章