再学MySQL
Posted Shi Peng
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了再学MySQL相关的知识,希望对你有一定的参考价值。
一、mysql的架构
从MySQL架构来说,MySQL分为Server层和存储引擎层2层。
Server层包括:连接器、查询缓存、分析器、优化器、执行器。
内置函数、存储过程、触发器、视图等跨存储引擎的功能,都在Server层实现。
Server层通过固定的API来访问存储引擎层,各种不同的存储引擎就好比OSS,COS, MinIO等,都兼容了AWS S3的API。
二、redo Log、bin log与两阶段提交
redo log就是WAL(Write-Ahead Logging)日志,其实现是通过环形链表(这个实现与redis主从同步的binlog相同,都是用环形链表):
redo log是用于当数据库发生重启,之前收到的请求但还没有存储的记录不会丢失,这个能力叫做crash-safe,redo log是InnoDB存储引擎所特有的。
server层也有类似的日志,叫做bin log。bin log所有存储引擎都支持。
redo log和bin log的区别:
1)redo log是InnoDB存储引擎特有的;而bin log在server层实现的。
2)redo log是环形链表,而bin log是追加写方式实现
看 “update T set c=c+1 where id=2” 这条SQL做了什么?
把redo log拆成2个步骤:prepare和commit,这个过程就是两阶段提交。
为什么要两阶段提交呢?
如果不用两阶段提交,redo log和bin log在一个文件写成功,另一个文件没有写成功之前,数据库crash,这时会导致这两个文件内容不一致。通过两阶段提交来保证事务的一致性。
三、事务隔离
事务:就是要保证一组数据库操作,要么全部成功,要么全部失败。
在MySQL中,事务是在存储引擎层实现的。
事务隔离行,就是指ACID(Atomicity、Consistency、Isolation、Durability,即原子性、一致性、隔离性、持久性)中的C。
3.1、四种事务隔离级别的区别
SQL 标准的事务隔离级别包括:
- 读未提交(read uncommitted) :一个事务还没提交时,它做的变更就能被别的事务看到
- 读提交(read committed) :一个事务提交之后,它做的变更才会被其他事务看到
- 可重复读(repeatable read):一个事务执行过程中看到的数据,总是跟这个事务在启动时看到的数据是一致的。当然在可重复读隔离级别下,未提交变更对其他事务也是不可见的。
- 串行化(serializable ):顾名思义是对于同一行记录,“写”会加“写锁”,“读”会加“读锁”。当出现读写锁冲突的时候,后访问的事务必须等前一个事务执行完成,才能继续执行。
下面举例说明“读提交”和“可重复读”的区别:
有一个表T,其字段C的值为1:
create table T(c int) engine=InnoDB;
insert into T© values(1);
接下来,事务A和事务B执行两个语句:
接下来,我们看下不同事务隔离级别,其事务A的V1,V2,V3分别得到什么值?
1)读未提交:V1=V2=V3=2。对于V1,虽然事务B还没有提交,但修改结果已经被事务A看到了。
2)读提交:V1=1,V2=V3=2。对于V1,在事务B提交前,事务A是看不到结果的。
3)可重复读:V1=V2=1, V3=2。可重复读遵循的原则:在事务启动到事务提交之前,看到的数据是一致的,所以V2=1。
4)串行化:V1=V2=1,V3=2。在事务执行把C的1改为2时,会被锁住,等待事务A提交,所以等事务A提交后,事务B才能把1改成2.
3.2、可重复读隔离级别
对于可重复读事务隔离级别,事务T在启动时,会创建一个试图read-view。这样,在事务执行期间,即使有其他事务修改了数据,事务T看到的数据仍然不变。但是,当事务T要更新一行,此时,另一个事务正在更新这行,即另一个事务正在持有这个行的行锁,那么事务T不得不进入等待锁的状态,那么,等到另一个事务释放行锁,而事务T读取到数据时,读到的值是什么呢?
下面举例说明:
CREATE TABLE `t`
( `id` int(11) NOT NULL,
`k` int(11) DEFAULT NULL,
PRIMARY KEY (`id`)) ENGINE=InnoDB;
insert into t(id, k) values(1,1),(2,2);
这里,我们需要注意的是事务的启动时机。
begin/start transaction 命令并不是一个事务的起点,在执行到它们之后的第一个操作 InnoDB 表的语句,事务才真正启动。如果你想要马上启动一个事务,可以使用 start transaction with consistent snapshot 这个命令。
在这个例子中,事务 C 没有显式地使用 begin/commit,表示这个 update 语句本身就是一个事务,语句完成的时候会自动提交。事务 B 在更新了行之后查询 ; 事务 A 在一个只读事务中查询,并且时间顺序上是在事务 B 的查询之后。
这时,如果我告诉你事务 B 查到的 k 的值是 3,而事务 A 查到的 k 的值是 1,你是不是感觉有点晕呢?
A的k是1好理解,因为是可重复读;那么B为什么k是3呢?B事务开始时读到的k=1,然后他自己+1然后提交,此时k=2;然后呢,C的更改对B就可见了,因为他提交了,所以k变成了3。
3.2.1、快照读 & 当前读
对于上述过程,先要搞清“快照”在MVCC里面是怎样工作的?
在可重复读级别,事务在启动时,就相当于“拍了个快照”。这个快照是基于整个库的。
但是,如果整个库有100G,快照难到要copy出100G?肯定不是的,那么快照怎么实现的呢?
InnoDB 里面每个事务有一个唯一的事务 ID,叫作 transaction id。它是在事务开始的时候向 InnoDB 的事务系统申请的,是按申请顺序严格递增的。
而每行数据也都是有多个版本的。每次事务更新数据的时候,都会生成一个新的数据版本,并且把 transaction id 赋值给这个数据版本的事务 ID,记为 row trx_id。同时,旧的数据版本要保留,并且在新的数据版本中,能够有信息可以直接拿到它。
也就是说,数据表中的一行记录,其实可能有多个版本 (row),每个版本有自己的 row trx_id。
下图表示了一个记录被多个事务连续更新后的状态:
图中虚线框里是同一行数据的 4 个版本,当前最新版本是 V4,k 的值是 22,它是被 transaction id 为 25 的事务更新的,因此它的 row trx_id 也是 25。
语句更新会生成 undo log(回滚日志)。那么,undo log 在哪呢?
上图中的三个虚线箭头,就是 undo log;而 V1、V2、V3 并不是物理上真实存在的,而是每次需要的时候根据当前版本和 undo log 计算出来的。比如,需要 V2 的时候,就是通过 V4 依次执行 U3、U2 算出来。
明白了多版本和 row trx_id 的概念后,我们再来想一下,InnoDB 是怎么定义那个“100G”的快照的。
按照可重复读的定义,一个事务启动的时候,能够看到所有已经提交的事务结果。但是之后,这个事务执行期间,其他事务的更新对它不可见。
因此,一个事务只需要在启动的时候声明说,“以我启动的时刻为准,如果一个数据版本是在我启动之前生成的,就认;如果是我启动以后才生成的,我就不认,我必须要找到它的上一个版本”。
当然,如果“上一个版本”也不可见,那就得继续往前找。还有,如果是这个事务自己更新的数据,它自己还是要认的。
在实现上, InnoDB 为每个事务构造了一个数组,用来保存这个事务启动瞬间,当前正在“活跃”的所有事务 ID。“活跃”指的就是,启动了但还没提交。
数组里面事务 ID 的最小值记为低水位,当前系统里面已经创建过的事务 ID 的最大值加 1 记为高水位。
这个视图数组和高水位,就组成了当前事务的一致性视图(read-view)
而数据版本的可见性规则,就是基于数据的 row trx_id 和这个一致性视图的对比结果得到的。
InnoDB 利用了“所有数据都有多个版本”的这个特性,实现了“秒级创建快照”的能力。
对于上面的例子,事务B最后k为什么是3,是因为事务C在执行k=k+1的update时,是先读了事务B的k=2, 然后才执行update。这样,我们得出结论:
更新数据都是先读后写的,而这个读,只能读当前的值,称为**“当前读”(current read)**。
再进一步,如果事务C并不是马上提交的,而是后面手动提交的,会怎样?
这时,会遵循“两阶段提交”:
事务C在执行set k=k+1时,生成了版本102,但是他没有提交。之后呢,事务B在还行set k=k+1这个update时,必须是“当前读”,而此时他需要等待事务C commit完释放行锁后,才能进行当前读。
所以,对于上述场景,事务B最终查询结果仍是3,但他的流程不同:先是等待事务C释放锁,即事务C先把k改为2,然后事务B做当前读,获得k=2后再set k=k+1, 得到k=3。
这样,我们把一致性读、当前读和行锁就串起来了:
然后我们总结可重复读是怎样实现的:
可重复读的核心就是一致性读(consistent read);而事务更新数据的时候,只能用当前读。如果当前的记录的行锁被其他事务占用的话,就需要进入锁等待。
读提交和可重复读的区别是:
1)在可重复读隔离级别下,只需要在事务开始的时候创建一致性视图,之后事务里的其他查询都共用这个一致性视图;
2)在读提交隔离级别下,每一个语句执行前都会重新算出一个新的视图。
3.2.2、幻读
看个例子:
CREATE TABLE `t`
( `id` int(11) NOT NULL,
`c` int(11) DEFAULT NULL,
`d` int(11) DEFAULT NULL,
PRIMARY KEY (`id`),
KEY `c` (`c`)) ENGINE=InnoDB;
insert into t values(0,0,0),(5,5,5),(10,10,10),(15,15,15),(20,20,20),(25,25,25);
id是表t的主键索引,c是普通索引。
接下来执行下面的语句:
begin;
select * from t where d=5 for update;
commit;
加的什么锁,然后锁怎样释放的?
在id=5这行,加的是写锁,由于两阶段提交协议,这个写锁会在commit的时候被释放。由于d字段上无索引,所以会被全表扫描,那么在d不等于5的记录,是否会被加锁呢?
带着这个问题,我们看幻读是什么?
假设我们只对d=5这行加锁,其他行不加锁,会发生什么?
session A 里执行了三次查询,分别是 Q1、Q2 和 Q3。它们的 SQL 语句相同,都是 select * from t where d=5 for update,使用的是当前读,并且加上写锁。
1)Q1:只返回 id=5 这一行;
2)Q2:在 T2 时刻,session B 把 id=0 这一行的 d 值改成了 5,因此 T3 时刻 Q2 查出来的是 id=0 和 id=5 这两行;
3)Q3:在 T4 时刻,session C 又插入一行(1,1,5),因此 T5 时刻 Q3 查出来的是 id=0、id=1 和 id=5 的这三行。
其中,Q3 读到 id=1 这一行的现象,被称为“幻读”。也就是说,幻读指的是一个事务在前后两次查询同一个范围的时候,后一次查询看到了前一次查询没有看到的行。
幻读需要注意的是:
1)在可重复读隔离级别下,普通的查询是快照读,是不会看到别的事务插入的数据的。因此,幻读在“当前读”下才会出现。
2)上面 session B 的修改结果,被 session A 之后的 select 语句用“当前读”看到,不能称为幻读。幻读仅专指“新插入的行”。
如何解决幻读?
产生幻读的原因是,行锁只能锁住行,但是新插入记录这个动作,要更新的是记录之间的“间隙”。因此,为了解决幻读问题,InnoDB 只好引入新的锁,也就是间隙锁 (Gap Lock)。
顾名思义,间隙锁,锁的就是两个值之间的空隙。
例如,开始时我们插入了6条记录,就产生了7个空隙:
这样,当你执行 select * from t for update 的时候,就不止是给数据库中已有的 6 个记录加上了行锁,还同时加了 7 个间隙锁。这样就确保了无法再插入新的记录。
也就是说这时候,在一行行扫描的过程中,不仅将给行加上了行锁,还给行两边的空隙,也加上了间隙锁。
间隙锁和行锁合称 next-key lock,每个 next-key lock 是前开后闭区间。
也就是说,我们的表 t 初始化以后,如果用 select * from t for update 要把整个表所有记录锁起来,就形成了 7 个 next-key lock,分别是 (-∞,0]、(0,5]、(5,10]、(10,15]、(15,20]、(20, 25]、(25, +supremum]。
间隙锁和 next-key lock 的引入,帮我们解决了幻读的问题,但同时可能会导致同样的语句锁住更大的范围,这其实是影响了并发度的。
四、索引
4.1、hash索引和btree+索引的适用场景
hash索引:数组+链表构成,适用于等值查询。
btree+索引:适用于范围查询
4.2、主键索引和非主键索引的区别:回表
在MySQL中,索引是在存储引擎层实现。在InnoDB中,索引采用BTree+实现。
下面举例说明btree+索引:
create table T(id int primary key, k int not null, name varchar(16),index (k))engine=InnoDB;
数据库表T,其id字段为主键,并在k字段上创建了索引。
然后分别对id和k做如下写入:
(100,1)、(200,2)、(300,3)、(500,5) 、 (600,6)、 (700,7)
由于我们有2个索引:id主键索引,和字段k的索引,所以有两个bree+,分别为:
可以看出,主键索引和非主键索引,其叶子节点存储的数据不同:
1)主键索引的叶子节点,存储的是整行真正的数据,所以主键索引也被称为聚簇索引。
2)非主键索引的叶子节点,存储的是主键的内容。
那么,主键索引和非主键索引,在查询时的区别是什么?
1)如果通过主键索引查询,如select from T where ID=500,那么只需要查左边ID的这个索引树即可。
2)如果非主键索引查询,如select * from T where k=5,则先搜索右边的k索引树,查到id=500, 然后再去查左边的id索引树。这种先查k索引树,再查id索引树的方式,称为回表。
从上述过程可得出结论:
主键长度越小,普通索引的叶子节点就越小,普通索引占用的空间也就越小。
所以从性能和空间考虑,自增主键是个不错的选择。
什么场景业务字段适合直接做主键呢?
只有一个索引。
需要注意的一点:重建主键索引,也就是对表数据重新构建的过程,代价很高。
4.3、页分裂
从上面id索引树的叶子节点可以看到,其有两个“页”,每个“页”的容量是有最大限制的,当数据页被写满后,根据btree+的算法,需要申请一个新的数据页,然后挪动部分数据过去,这个过程叫做“页分裂”,页分裂的过程会影响性能。
当页中的数据被删除后,也会有“页合并”,是页分裂的逆过程。
4.4、覆盖索引
思考:执行 select * from T where k between 3 and 5,需要执行几次树的搜索操作,会扫描多少行?
create table T (
ID int primary key,
k int NOT NULL DEFAULT 0,
s varchar(16) NOT NULL DEFAULT '',
index k(k))
engine=InnoDB;
insert into T values(100,1, 'aa'),(200,2,'bb'),(300,3,'cc'),(500,5,'ee'),(600,6,'ff'),(700,7,'gg');
还是一个主键索引id, 一个普通索引字段k:
这条SQL “select * from T where k between 3 and 5”的执行过程如下:
Step1: 在 k 索引树上找到 k=3 的记录,取得 ID = 300;
Step2: 再到 ID 索引树查到 ID=300 对应的 R3;
Step3:在 k 索引树取下一个值 k=5,取得 ID=500;
Step4:再回到 ID 索引树查到 ID=500 对应的 R4;
Step5:在 k 索引树取下一个值 k=6,不满足条件,循环结束。
可以看到,这个查询过程读了 k 索引树的 3 条记录(步骤 1、3 和 5),回表了两次(步骤 2 和 4)。
在这个例子中,由于查询结果所需要的数据只在主键索引上有,所以不得不回表。那么,有没有可能经过索引优化,避免回表过程呢?
答:覆盖索引。
如果执行的语句是 select ID from T where k between 3 and 5,这时只需要查 ID 的值,而 ID 的值已经在 k 索引树上了,因此可以直接提供查询结果,不需要回表。也就是说,在这个查询里面,索引 k 已经“覆盖了”我们的查询需求,我们称为覆盖索引。
基于覆盖索引,我们思考这样的场景:在一个市民信息表上,是否有必要将身份证号和名字建立联合索引?
市民表定义如下:
CREATE TABLE `tuser` (
`id` int(11) NOT NULL, `id_card` varchar(32) DEFAULT NULL,
`name` varchar(32) DEFAULT NULL,
`age` int(11) DEFAULT NULL,
`ismale` tinyint(1) DEFAULT NULL,
PRIMARY KEY (`id`),
KEY `id_card` (`id_card`),
KEY `name_age` (`name`,`age`)
) ENGINE=InnoDB
如果现在有一个高频请求,要根据市民的身份证号查询他的姓名,这个联合索引就有意义了。它可以在这个高频请求上用到覆盖索引,不再需要回表查整行记录,减少语句的执行时间。
当然,索引字段的维护总是有代价的。因此,在建立冗余索引来支持覆盖索引时就需要权衡考虑了。
总结:覆盖索引,就是把要查询的结果作为索引,好处是节省了回表的步骤。缺点是增加了索引,也就增加了系统资源消耗,也不是索引占用了内存。
4.5、最左前缀原则
对于上述覆盖索引的例子,有一个疑问,如果为每一种查询都设计一个索引,索引是不是太多了。如果我现在要按照市民的身份证号去查他的家庭地址呢?
btree+,可以利用索引前缀,来定位记录。
我们用(name,age)这个联合索引来分析:
可以看到,索引项是按照索引定义里面出现的字段顺序排序的。当你的逻辑需求是查到所有名字是“张三”的人时,可以快速定位到 ID4,然后向后遍历得到所有需要的结果。
如果你要查的是所有名字第一个字是“张”的人,你的 SQL 语句的条件是"where name like ‘张 %’"。这时,你也能够用上这个索引,查找到第一个符合条件的记录是 ID3,然后向后遍历,直到不满足条件为止。
4.6、索引下推
我们还是以市民表的联合索引(name, age)为例。如果现在有一个需求:检索出表中“名字第一个字是张,而且年龄是 10 岁的所有男孩”。那么,SQL 语句是这么写的:
select * from tuser where name like '张%' and age=10 and ismale=1;
在 MySQL 5.6 之前,只能从 ID3 开始一个个回表。到主键索引上找出数据行,再对比字段值。而 MySQL 5.6 引入的索引下推优化(index condition pushdown), 可以在索引遍历过程中,对索引中包含的字段先做判断,直接过滤掉不满足条件的记录,减少回表次数。
下面看5.6版本前后的对比图:
1)无索引前缀下推:需要回表
2)有索引前缀下推:
五、MySQL的锁
根据加锁的范围,MySQL的锁分为3类:全局锁、表级锁、行锁。
5.1、全局锁
全局锁就是对整个数据库实例加锁。
加全局锁命令是 Flush tables with read lock (FTWRL)
当你需要让整个库处于只读状态的时候,可以使用这个命令,之后其他线程的以下语句会被阻塞:数据更新语句(数据的增删改)、数据定义语句(包括建表、修改表结构等)和更新类事务的提交语句。
全局锁的典型使用场景是,做全库逻辑备份。也就是把整库每个表都 select 出来存成文本。
5.2、表级锁
表级锁分两类:表锁 和 元数据锁
表锁的语法是 lock tables … read/write
举个例子, 如果在某个线程 A 中执行 lock tables t1 read, t2 write; 这个语句,则其他线程写 t1、读写 t2 的语句都会被阻塞。同时,线程 A 在执行 unlock tables 之前,也只能执行读 t1、读写 t2 的操作。线程A连写 t1 都不允许,自然也不能访问其他表。
在还没有出现更细粒度的锁的时候,表锁是最常用的处理并发的方式。而对于 InnoDB 这种支持行锁的引擎,一般不使用 lock tables 命令来控制并发,毕竟锁住整个表的影响面还是太大。
另一类表级的锁是 MDL(metadata lock)。MDL 不需要显式使用,在访问一个表的时候会被自动加上。MDL 的作用是,保证读写的正确性。你可以想象一下,如果一个查询正在遍历一个表中的数据,而执行期间另一个线程对这个表结构做变更,删了一列,那么查询线程拿到的结果跟表结构对不上,肯定是不行的。因此,在 MySQL 5.5 版本中引入了 MDL,当对一个表做增删改查操作的时候,加 MDL 读锁;当要对表做结构变更操作的时候,加 MDL 写锁。
注意:不能随便给表加字段,因为会加MDL,会block所有的变更,可能会引起线上问题。所以,在加新的字段时,要加上执行的超时时间。
5.3、行锁
MySQL的行锁,是由各存储引擎层实现的。InnoDB是支持行锁的,这是InnoDB相比MyISAM强的主要原因之一。
行锁就是针对数据表中行记录的锁,如事务 A 更新了一行,而这时候事务 B 也要更新同一行,则必须等事务 A 的操作完成后才能进行更新。
从两阶段锁说起:
还是上面的例子,表t 有字段id作为主键索引,事务B执行update语句时会怎样?
这个问题的结论取决于事务 A 在执行完两条 update 语句后,持有哪些锁,以及在什么时候释放。你可以验证一下:实际上事务 B 的 update 语句会被阻塞,直到事务 A 执行 commit 之后,事务 B 才能继续执行。
事务 A 持有的两个记录的行锁,都是在 commit 的时候才释放的。
在 InnoDB 事务中,行锁是在需要的时候才加上的,但并不是不需要了就立刻释放,而是要等到事务结束时才释放。这个就是两阶段锁协议。
所以我们要注意:如果你的事务中需要锁多个行,要把最可能造成锁冲突、最可能影响并发度的锁尽量往后放。
5.4、死锁和死锁检测
死锁的例子:
事务 A 在等待事务 B 释放 id=2 的行锁,而事务 B 在等待事务 A 释放 id=1 的行锁。 事务 A 和事务 B 在互相等待对方的资源释放,就是进入了死锁状态。
当出现死锁以后,有两种策略:
策略1:直接进入等待,直到超时。这个超时时间可以通过参数 innodb_lock_wait_timeout 来设置。
策略2:发起死锁检测,发现死锁后,主动回滚死锁链条中的某一个事务,让其他事务得以继续执行。将参数 innodb_deadlock_detect 设置为 on,表示开启这个逻辑。
由于死锁超时时间默认50s, 时间太久,设置时间短了会出现误伤,因为可能不是死锁,只是普通的锁等待。所以,正常情况下我们还是要采用第二种策略,即:主动死锁检测,而且 innodb_deadlock_detect 的默认值本身就是 on。
以上是关于再学MySQL的主要内容,如果未能解决你的问题,请参考以下文章