MySQL的SQL语句执行流程(简述)

Posted 5ran2yl

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了MySQL的SQL语句执行流程(简述)相关的知识,希望对你有一定的参考价值。

导言:

MySQL和服务器端对接的时候,我们知道一般就是服务器端会打包一些SQL命令去增删改查数据库,这个打包的数据库SQL语句数据包一般为4MB,再大一些就不会被数据库端接收了

但是我们可以自己更改默认大小,当数据包到达数据库端以后,它们会经历那些操作然后返回结果给服务器端呢?

大概有:查询缓存,SQL解析,预处理器,SQL优化器,执行器,存储引擎,返回结果给服务器端

 上面就是sql命令的整体执行流程,接下来我们对各个步骤进行拆分,细化的讲解一下他们都做了些什么操作

一.连接

在服务器端和数据库端的连接方式中,我们采用的是半双工的方式,也就是说要么是一次申请到达数据库端,要么是一次结果响应到服务器端

不存在一个数据包还没全部到数据库端,它的结果已经开始响应到服务器的情况

另外,作为第三方连接,我们一般都是使用的数据库连接池,数据库端一般会提供很多的连接接口,供服务器端不同的用户去连接,使用完了然后释放

既然作为第三方连接,它就会使用到数据库驱动,就像JDBC,C3P0等等

此外,数据库一次接收服务器端发来的数据包大概有4MB,多了它就选择不接受了,当然我们也可以自己更改默认接收包的大小

在数据查询完了,返回结果给服务器端也是,它只能一次全部接收,不能只接受一部分结果响应

二.查询缓存

MySQL的缓存是一个很鸡肋的东西,它很少用,但是要想了解底层就必须知道它,它的存在很鸡肋,也导致使用它的很少

数据缓存指的是对已经查询过的数据放在缓存中,下次sql命令来了以后先查询缓存中有没有已经查过的,没有才会去执行新的一次查询,有则直接返回给服务器端

缓存的构成是Map集合,他有两个属性组成,key和value ,key用来存放sql语句,而value用来存放查询的结果

看起来使用缓存会提升查询的效率,但是真正到实战开发以后就会知道,它并没有那么好用,首先一般我们的查询语句都是不同的,很难连续两次的sql完全一样,最好的情况也是条件相差不大

但是也是达不到完全吻合key值的sql,所以实战开发使用效率十分低,伴随着的就是它的缺点,因为它是sql执行的第一个操作,每个sql进来的都要去找一遍,但是都是找不到的

白白的浪费了这么多的开销,而且每一次对数据库的增删改都会影响这个缓存,使其失效,维护又是很大的开销

所以在MySQL 5.7版本是默认关闭这个缓存的,他会跳过查询缓存这一步直接sql解析,到了MySQL8.0的时候直接把查询缓存删掉了,不再需要这个功能了

三.SQL解析

sql解析执行包括了:词法分析,语法分析,分析机,生成语法树

 词法分析:从左到右一个字符、一个字符地输入,然后根据构词规则识别单词。将会生成Token词

在进行了词法分析以后,他会把sql默认扫描成两个部分,一个是关键字(select,insert,from,where,group by .......)一个是非关键字(查询的字段,查询的表,查询的筛选条件,分组条件)

语法分析,分析机:它们两个是一起工作的,它们对词法分析生成的Token词开始循环构造语法树,直到整个SQL语句扫描完成了,就构成了一棵语法树

值得注意的是,当MySQL中我们的关键字写错了以后会在词法分析阶段报错,当我们没有加上表名,或条件等格式错误了会在语法分析阶段报错

生成语法树:由每次分析机的输出构成

 从上面的语法上树不难看出原sql语句,这就是sql分析阶段,当这一步完成以后,就会进入预处理阶段

四.预处理器

根据一些mysql规则进一步检查解析树是否合法。如检查查询的表名、列名是否正确,是否有表的权限

这一步操作目的是解决原来每一句sql都会单独解析执行的问题,后来变成了使用预处理器,对于相同的命令模板,不断的替换参数,减少对表权限和语法树是否合法的计算

生成命令模板:对于第一次进入的sql语句肯定是没有命令模板的,所以它需要参与生成命令模板 ,比如select  id  from student  where id =1; 那么 “ select  id  from student  where id = ” 就会成为模板

当模板生成了以后,对于student这个表,属性为id的字段,这个模板是已经检查过有没有权限的了,它在这个模板上都是有记录的

替换参数条件:这是对于有模板的情况下,我们就会直接使用参数替换的形式,把命令完成,比如这个时候有一条sql:select  id  from student  where id = 100 ;很显然,上次我们已经生成过模板了,

就可以直接用,模板就是select  id  from student  where id = 这个时候就只需要把参数替换掉,这次 id = 100;就把原来的 1 替换为100 ,这样做的好处就是,不用再去检查语法树合不合法了,

不用去看表是否有没有权限了,因为在生成模板的时候这些操作都是做过的了,如果模板语法树不合法,拿这次的sql也不合法,如果模板没有student表的权限,那么这次也没有

极大避免了二次计算和操作,对性能的提升非常大

 经过了预处理器以后,就拿到了这句sql是否有执行的权力,即能否更改表和查询表的权力,

如果权限没有问题,那么就可以进行下一步:SQL优化

五.SQL优化器

当语法树被认为是合法的了,并且由优化器将其转化成执行计划。一条查询可以有很多种执行方式,最后都返回相同的结果。优化器的作用就是找到这其中最好的执行计划。

执行计划:mysql不会生成查询字节码来执行查询,mysql生成查询的一棵指令树,然后通过存储引擎执行完成这棵指令树并返回结果。最终的执行计划包含了重构查询的全部信息。

 查询的生命周期的下一步是将一个SQL转换成一个执行计划,mysql在依照这个执行计划和存储引擎进行交互。这包含多个子阶段:解析SQL、预处理、优化SQL执行计划。这个过程中任何错误都可能终止查询。

  • 查询优化器:当语法树被认为是合法的了,并且由优化器将其转化成执行计划。一条查询可以有很多种执行方式,最后都返回相同的结果。优化器的作用就是找到这其中最好的执行计划。
  • 执行计划:mysql不会生成查询字节码来执行查询,mysql生成查询的一棵指令树,然后通过存储引擎执行完成这棵指令树并返回结果。最终的执行计划包含了重构查询的全部信息。

在优化器的内部,是开发者定义的许多“优化规则”来进行优化的,如关联查询重排,索引优选,连接查询重组,优化排序,优化聚合函数,提前终止查询,等价变化等;

这里我们简单来列举一下索引优选:

 这个简单的例子应该可以感受到SQL优化器的作用是干什么的了,它内置很多规则,它贴合物理层,有自己的执行规则,同时又因为一些不合格的程序员写的sql不合规

这就导致SQL优化器非常重要了,能到sql优化器处理的sql基本上语法都是没问题的,主要的是怎么提高sql的执行效率,这就是优化器最大的作用

只要SQL优化器处理完了以后,就会生成执行计划,这个执行计划就是存储引擎的处理单元

生成执行计划以后,他就会交给执行器,去调用存储存储引擎的相应Headler API来完成相应的执行计划

六.执行器

这里的执行器和操作系统的操作系统差不多,都是负责调用和分发的,在sql执行中,执行器扮演两个角色

  • 调用存储引擎的Headler API 处理执行计划
  • 接收存储引擎返回的结果,并将它返回给服务器端

七.存储引擎(InnoDB)

我们常说的索引查询,遍历查询,临时表查询等等行为都是在存储引擎中完成的

 

 在我前面写的MySQL之存储引擎中有写道InnoDB是如何存储数据的,主要是内存的读写速度比硬盘的快,所以有了Buffer Pool ,这里当一个查询计划来了以后,他首先会去Buffer Pool中查看是否有关这次查询的相关更新,

如果没有,我们就会直接去磁盘中刷出数据到Buffer Pool中,然后由存储引擎负责返回给MySQL执行器,最后返回给服务器端

当Buffer Pool中有关此次查询的更新时,我们需要等到存储引擎把旧的值放到undo  Log(用于事务回滚的日志)中,然后就会更新Buffer Pool和把更新数据刷入到磁盘,此时就可以去根据查询条件,查询数据到Buffer Pool中,

然后返回给MySQL执行器

有关InnoDB的存储,可以去看看我以前写的博客MySQL存储之InnoDB

拓展:什么是MySQL的二阶段提交?

MySQL的二阶段提交指的是MySQL为了保证redo  Log和 Binlog的一致性而产生的一种设计,把日志写入和日志提交拆分成两个阶段,保证数据写入的一致性

redo  log是事务日志,Binlog是数据变更的逻辑日志,二者必须同时成功,保证记录一致,

二阶段提交指的就是:

第一阶段:在事务开始时,MySQL会把操作记录到redo  log中,同时会在redo  log中打上 prepare 的标志,表示在redo log中事务开始了

第二阶段:在事务完成以后,会先记录到BinLog中,然后再去redo log中标记上commit,这样就保证了redo log 和binLog的一致性

以上就是MySQL的二次提交,所以InnoDB在写入redo log并不是一次写完的,而是分成两个阶段 prepare 和 commit

对应情况:

在写入 redo  log 时崩溃:两个日志中都没有数据,满足数据的一致性

在写入redo log的prepare时崩溃:由于没有打上commit 的标记,所以在Binlog中找不到对应的这个事务的id,那么就需要执行回滚操作

在写入Binlog之后崩溃:由于redo log中的事务id可以在Bin log 中可以找到(表示事务已经刷入磁盘),所以可以直接提交数据,为redo log中事务打上commit标记

 

MySQL中的SQL流程分析简述

分析MySQL中这条语句的整个流程

update table_a set c1=xx where c2=xxx

朋友考我的一个问题在此处列出个人见解

1 客户端连接进来首先进行权限验证

2 验证通过后 进入SQL接口,接收用户的SQL命令

3 SQL命令到解释器中进行验证和解析

4 解析后查询优化器会对查询进行优化生成最终查询结果

5 如果查询的结果在缓存中则直接从缓存中获取返回给客户端

6 如果没有则调用存储引擎的API接口从文件系统中获取返回给客户端,同时写入到缓存中

 

MySQL的体系结果参考图

技术分享

以上是关于MySQL的SQL语句执行流程(简述)的主要内容,如果未能解决你的问题,请参考以下文章

MySql基础架构以及SQL语句执行流程

MySQL/Hive SQL 语句执行流程

详解MySQL的逻辑架构和SQL语句执行流程

简述SQL的执行过程?Linux云计算运维

Mysql架构以及SQL语句的执行流程

在mysql,一个流程控制语句中可以保护多少个sql语句