MySQL03 Checkpoint机制

Posted 代码被吃掉了

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了MySQL03 Checkpoint机制相关的知识,希望对你有一定的参考价值。

一、思维导图

二、笔记

1. 脏页的产生与处理

缓冲池是用于平衡 CPU 和磁盘之间的速度差的,故,当页的操作也是在缓冲池中进行的,当一个DML语句发生后,例如 Update 或 Delete 语句改变了页中的数据记录,此时,页中的数据记录与磁盘上面的数据记录出现了不一致,为了保持这种一致性,数据库需要将新版本的数据页刷新至磁盘上。

思考问题:

  1. 如果每一次数据页都发生了改变都进行一次磁盘的读写,这样会导致大量的磁盘IO,给数据库造成极大的压力,导致数据库性能变差,怎么办?
  2. 如果在将数据页写入磁盘的过程中,数据库异常关闭,导致内存中的数据页丢失,那么数据就无法被恢复了,怎么办?

为了避免以上两种情况的出现,InnoDB 采取 Write Ahead Log 策略

2. Write Ahead Log 策略

Write Ahead Log 策略:即当事务提交的时候,先将改动写入重做日志(redo log)中,再修改页数据,再以一定的频率将脏页刷新至磁盘上。

由于改动被记录在日志中,所以有效的避免了数据丢失的问题,redo log事务特性ACIDD(持久性)的实现方式

思考问题:

  • 当出现宕机的时候,我们应该从重做日志的哪个地方进行恢复嘞?直接将所有的重做日志恢复一遍嘛?

显然将所有重做日志都恢复一遍这样是不可取的,如果重做日志内容非常的多,这要就会导致数据库的恢复时间过长,InnoDB中有一个名为 checkpoint的技术来解决该问题

3. Checkpoint

checkpoint标志着redo log最新写入位置.

  • 当数据库发生宕机时,数据库并不需要重新把所有的redo log做一遍,因为checkpoint之前的页都已经刷新回磁盘了,只需要将checkpoint之后的重做日志进行恢复即可,这样大大缩短了数据库恢复时间。

  • 当数据库中的缓冲池不够用时,根据LRU算法会置换最近最少使用的页,若该页是脏页,则会强制执行checkpoint,将脏页刷新至磁盘中

重做日志被设计成可以循环使用的,并不是让其无限增大,新的日志会覆盖以往不再需要的日志,不再需要是指数据库宕机恢复不需要的那部分日志,如果没有不再需要的日志用来覆盖,那么必须强制执行产生Checkpoint,将缓冲池中的页至少刷新到当前重做日志的位置,以这样的方式产生一部分不再需要的日志以供覆盖。

4. Log Sequence Number

4.1 LSN概念

对于 InnoDB 存储引擎而言,是通过 LSN ( Log Sequence Number ) 来标记数据状态的版本的,LSN是一个8字节的数字

  • 每个页有LSN,重做日志有LSN,Checkpoint也有LSN
mysql [(none)]> show engine innodb status\\G;
---
LOG
---
Log sequence number 4093975
Log flushed up to   4093975
Pages flushed up to 4093975
Last checkpoint at  4093966
0 pending log flushes, 0 pending chkp writes
12 log i/o's done, 0.00 log i/o's/second

Log sequence number:指当前缓冲区上的 redo log buffer 中的 LSN

Log flushed up to:指刷磁盘上的 redo log file 中的 LSN

Pages flushed up to:指已经刷到磁盘数据页上的 LSN

Last checkpoint at:上一次检查点的 LSN

4.2 LSN 变化解析

  • 事务提交 LSN 变化顺序

  • 详解事务执行过程中的 LSN 流转变化

事务起始点:所有的 LSN 都初始化为 1

①:经过一个 update 语句,同时更新 data_page_in_buffer_lsn 和 redo_log_in_buffer_lsn 两个LSN 为 2

②:经过一个 delete 语句,并且此时距离事务起始点经过了一秒触发重做日志刷盘操作,同时更新 data_page_in_buffer_lsn 和 redo_log_in_buffer_lsn 和 redo_log_on_disk_lsn 三个LSN为3

③:经过一个 update 语句,同时更新 data_page_in_buffer_lsn 和 redo_log_in_buffer_lsn 两个LSN 为 4

④:此时出现 Checkpoint 机制,将所有 LSN 都更新至最新状态 4

⑤:此时距离事务起始点经过了两秒触发重做日志刷盘操作,由于刚刚经过Checkpoint刷盘,所有LSN都是最新状态,故无需做出任何改变

⑥:经过一个 insert 语句,同时更新 data_page_in_buffer_lsn 和 redo_log_in_buffer_lsn 两个LSN 为 5

⑦:此节点事务提交结束,事务提交动作,会触发日志刷盘操作,但是不会触发数据刷盘操作,故更新 redo_log_on_disk_lsn 为 5

⑧:此时出现 Checkpoint 机制,将所有 LSN 都更新至最新状态 5

5. Checkpoint分类

5.1 Sharp Checkpoint

  • Sharp Checkpoint 发生在数据库关闭时所有的脏页都刷新回磁盘
  • 由参数 innodb_fast_shutdown 控制
MySQL [(none)]> show variables like 'innodb_fast_shutdown'\\G;
*************************** 1. row ***************************
Variable_name: innodb_fast_shutdown
        Value: 1

由于Sharp Checkpoint 是将所有的脏页都刷新至磁盘中,所以如果在数据库运行时也使用该种机制,会导致数据库性能手打影响,故在数据库运行时使用 Fuzzy Checkpoint 机制进行脏页的刷新

5.2 Fuzzy Checkpoint

Fuzzy Checkpoint 是数据库在运行时,在一定的触发条件下,刷新一定的比例的脏页进磁盘中,并且刷新的过程是异步的。

有以下四种情况的 Fuzzy Checkpoint :

  • Master Thread Checkpoint

在 Master Thread 执行的 Loop 中,以每秒或每10秒的速度从缓冲池中的 脏页列表 中刷新一定比例的脏页回磁盘,这个过程是异步的,并不会阻塞用户查询线程。

  • FLUSH_LRU_LIST Checkpoint

InnoDB 需要保证差不多有 innodb_lru_scan_depth 个空闲页可以使用,在 MySQL 5.6 版本之后,在 Page Cleaner 线程(并不会阻塞用户的查询线程哦)中会进行 LRU 列表空闲页数量检查,若不够 innodb_lru_scan_depth 个空闲页,那么 InnoDB 存储引擎会根据 LRU 算法将列表尾端的页移除,若被移除的页恰好是脏页,这时就会强制执行 Checkpoint

MySQL [(none)]> show variables like 'innodb_lru_scan_depth'\\G;
*************************** 1. row ***************************
Variable_name: innodb_lru_scan_depth
        Value: 1024
  • Async / Sync Flush Checkpoint

该种 Checkpoint 出现在重做日志不够用的情况下,这时需要强制将一些脏页列表中的脏页刷新回磁盘中。

若将已经写入到重做日志的 LSN 标记为 redo_lsn,将已经刷新会磁盘最新页的 LSN 标记为 checkpoint_lsn

则定义: checkpoint_age = redo_lsn - checkpoint_lsn

再定义:

async_water_mark = 75% * total_redo_log_file_size

sync_water_mark = 90% * total_redo_log_file_size

查看重做日志总大小

MySQL [(none)]> SELECT @@innodb_log_file_size/1024/1024;
+----------------------------------+
| @@innodb_log_file_size/1024/1024 |
+----------------------------------+
|                      48.00000000 |
+----------------------------------+
1 row in set (0.00 sec)
  • checkpoint_age < async_water_mark 时,处于正常状态,无需任何刷新操作
  • async_water_mark < checkpoint_age 时,触发Async Flush 操作,从 Flush List 中刷新足够的脏页回磁盘,使得回到正常状态
  • checkpoint_age > sync_water_mark 时,触发Sync Flush操作,从 Flush List 中刷新足够的脏页回磁盘,使得回到正常状态

使用Async / Sync Flush Checkpoint是为了保证重做日志文件循环可用性

  • Dirty Page too much Checkpoint

当缓冲池中的脏页数量多于 innodb_max_dirty_pages_pct 比例时,会强制执行 Checkpoint,刷新一部分脏页进磁盘中

MySQL [(none)]> show variables like 'innodb_max_dirty_pages_pct'\\G;
*************************** 1. row ***************************
Variable_name: innodb_max_dirty_pages_pct
        Value: 75.000000

以上是关于MySQL03 Checkpoint机制的主要内容,如果未能解决你的问题,请参考以下文章

RDD的checkpoint机制

Flink Checkpoint 机制详解

FLinkFlink checkpoint 实现数据连续计算 恢复机制 拓扑图 变化 如何处理

Flink源码阅读--Checkpoint触发机制

Flink可靠性的基石-checkpoint机制详细解析

flink超越Spark的Checkpoint机制