详解一条sql语句的执行过程

Posted 2020-10-05

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了详解一条sql语句的执行过程相关的知识，希望对你有一定的参考价值。

SQL是一套标准，全称结构化查询语言，是用来完成和数据库之间的通信的编程语言，SQL语言是脚本语言，直接运行在数据库上。同时，SQL语句与数据在数据库上的存储方式无关，只是不同的数据库对于同一条SQL语句的底层实现不同罢了，但结果相同。这有点类似于java中接口的作用，一个接口可以有不同的实现类，不同的实现类对于接口中方法的实现方式可以不同，结果可以相同。这里SQL语言的作用就类似于java中的接口，数据库就类似于java中接口的实现类，SQL语句就类似于java接口中的方法。不同的是java中接口的不同实现类对于接口中方法的执行结果可以相同，也可以不同，而不同的数据库对于同一条SQL语句的执行是相同的。（这里只是做一个类比，方便我们理解）

　　一般情况下，大部分SQL语句在不同的数据库上是通用的，但我们知道每个数据库都有自己独有的特性，像在mysql数据库中，可以使用substr(取字符串)，trim(去空格)，ifnull(空值处理函数)，还可以使用limit语句对数据库表进行截取，但这些都是oracle数据库没有的。（类比接口实现类中，实现类独有的方法，而接口中没有的）

　　这里简单介绍一下mysql数据库，mysql数据库是一款关系型数据库，所谓关系型数据库就是以二维表的形式存储数据，使用行和列方便我们对数据的增删改查。

　　这篇博客，我们以mysql数据库为例，对一条sql语句的执行流程进行分析。（本篇博客不涉及到表连接）

　　首先，创建一张student表，字段有自增主键id，学生姓名name，学科subject，成绩grade

　　建表语句：

DROP TABLE IF EXISTS student;
CREATE TABLE `student` (
  `id` int(5) NOT NULL AUTO_INCREMENT,
  `name` varchar(10) DEFAULT NULL,
  `subject` varchar(10) DEFAULT NULL,
  `grade` double(4,1) DEFAULT NULL,
  PRIMARY KEY (`id`)
) ENGINE=InnoDB AUTO_INCREMENT=40 DEFAULT CHARSET=utf8;

　　初始化数据：

INSERT INTO student(`name`,`subject`,grade)VALUES(‘aom‘,‘语文‘,88);
INSERT INTO student(`name`,`subject`,grade)VALUES(‘aom‘,‘数学‘,99);
INSERT INTO student(`name`,`subject`,grade)VALUES(‘aom‘,‘外语‘,55);

INSERT INTO student(`name`,`subject`,grade)VALUES(‘jack‘,‘语文‘,67);
INSERT INTO student(`name`,`subject`,grade)VALUES(‘jack‘,‘数学‘,44);
INSERT INTO student(`name`,`subject`,grade)VALUES(‘jack‘,‘外语‘,55);

INSERT INTO student(`name`,`subject`,grade)VALUES(‘susan‘,‘语文‘,56);
INSERT INTO student(`name`,`subject`,grade)VALUES(‘susan‘,‘数学‘,35);
INSERT INTO student(`name`,`subject`,grade)VALUES(‘susan‘,‘外语‘,77);

INSERT INTO student(`name`,`subject`,grade)VALUES(‘alice‘,‘语文‘,88);
INSERT INTO student(`name`,`subject`,grade)VALUES(‘alice‘,‘数学‘,77);
INSERT INTO student(`name`,`subject`,grade)VALUES(‘alice‘,‘外语‘,100);

INSERT INTO student(`name`,`subject`,grade)VALUES(‘rajo‘,‘语文‘,33);
INSERT INTO student(`name`,`subject`,grade)VALUES(‘rajo‘,‘数学‘,55);
INSERT INTO student(`name`,`subject`,grade)VALUES(‘rajo‘,‘外语‘,55);

下面我们来看一下，数据在数据库中的存储形式。

技术分享

　　（图1.0）

现在针对这张student表中的数据提出一个问题：要求查询出挂科数目多于两门（包含两门）的前两名学生的姓名，如果挂科数目相同按学生姓名升序排列。

下面是这条查询的sql语句

SELECT `name`,COUNT(`name`) AS num FROM student WHERE grade < 60 GROUP BY `name` HAVING num >= 2 ORDER BY num DESC,`name` ASC LIMIT 0,2;

执行结果：

技术分享

　　图（1.1）

以上这条sql语句基本上概括了单表查询中所有要注意的点，那么我们就以这条sql为例来分析一下一条语句的执行流程。

1，一条查询的sql语句先执行的是 FROM student 负责把数据库的表文件加载到内存中去，如图1.0中所示。（mysql数据库在计算机上也是一个进程，cpu会给该进程分配一块内存空间，在计算机‘服务’中可以看到，该进程的状态）

技术分享

　　图（1.2）

2，WHERE grade < 60，会把（图1.0）所示表中的数据进行过滤，取出符合条件的记录行，生成一张临时表，如下图所示。

技术分享

　　图（1.3）

3，GROUP BY `name`会把图（1.3）的临时表切分成若干临时表，我们用下图来表示内存中这个切分的过程。

技术分享　　　　

　　图（1.4)　　　　　　　　　　　　　　图（1.5)　　　　　　　　　　　　　　　图（1.6)　　　　　　　　　　　　　图（1.7)

4，SELECT 的执行读取规则分为sql语句中有无GROUP BY两种情况。

　　（1）当没有GROUP BY时，SELECT 会根据后面的字段名称对内存中的一张临时表整列读取。

　　（2）当查询sql中有GROUP BY时，会对内存中的若干临时表分别执行SELECT，而且只取各临时表中的第一条记录，然后再形成新的临时表。这就决定了查询sql使用GROUP BY的场景下，SELECT后面跟的一般是参与分组的字段和聚合函数，否则查询出的数据要是情况而定。另外聚合函数中的字段可以是表中的任意字段，需要注意的是聚合函数会自动忽略空值。

　　我们还是以本例中的查询sql来分析，现在内存中有四张被GROUP BY `name`切分成的临时表，我们分别取名为 tempTable1,tempTable2,tempTable3,tempTable4分别对应图（1.4)、图（1.5)、图（1.6)，图（1.7)下面写四条"伪SQL"来说明这个查询过程。

SELECT `name`,COUNT(`name`) AS num FROM tempTable1;
SELECT `name`,COUNT(`name`) AS num FROM tempTable2;
SELECT `name`,COUNT(`name`) AS num FROM tempTable3;
SELECT `name`,COUNT(`name`) AS num FROM tempTable4;

最后再次成新的临时表，如下图：

技术分享

　　图（1.8)

5，HAVING num >= 2对上图所示临时表中的数据再次过滤，与WHERE语句不同的是HAVING 用在GROUP BY之后，WHERE是对FROM student从数据库表文件加载到内存中的原生数据过滤，而HAVING 是对SELECT 语句执行之后的临时表中的数据过滤，所以说column AS otherName ,otherName这样的字段在WHERE后不能使用，但在HAVING 后可以使用。但HAVING的后使用的字段只能是SELECT 后的字段，SELECT后没有的字段HAVING之后不能使用。HAVING num >= 2语句执行之后生成一张临时表，如下：

技术分享

　　图（1.9)

6，ORDER BY num DESC,`name` ASC对以上的临时表按照num，name进行排序。

技术分享

7，LIMIT 0,2取排序后的前两个。

技术分享

以上就是一条sql的执行过程，同时我们在书写查询sql的时候应当遵守以下顺序。

SELECT XXX FROM XXX WHERE XXX GROUP BY XXX HAVING XXX ORDER BY XXX LIMIT XXX;

　　最后说一点，我们作为程序员，研究问题还是要仔细深入一点的。当你对原理了解的有够透彻，开发起来也就得心应手了，很多开发中的问题和疑惑也就迎刃而解了，而且在面对其他问题的时候也可做到触类旁通。当然在开发中没有太多的时间让你去研究原理，开发中要以实现功能为前提，可等项目上线的后，你有大把的时间或者空余的时间，你大可去刨根问底，深入的去研究一项技术，为觉得这对一名程序员的成长是很重要的事情。

一般情况下，大部分SQL语句在不同的数据库上是通用的，但我们知道每个数据库都有自己独有的特性，像在MySql数据库中，可以使用substr(取字符串)，trim(去空格)，ifnull(空值处理函数)，还可以使用limit语句对数据库表进行截取，但这些都是oracle数据库没有的。（类比接口实现类中，实现类独有的方法，而接口中没有的）

　　这篇博客，我们以mysql数据库为例，对一条sql语句的执行流程进行分析。（本篇博客不涉及到表连接）

　　首先，创建一张student表，字段有自增主键id，学生姓名name，学科subject，成绩grade

　　建表语句：

DROP TABLE IF EXISTS student;
CREATE TABLE `student` (
  `id` int(5) NOT NULL AUTO_INCREMENT,
  `name` varchar(10) DEFAULT NULL,
  `subject` varchar(10) DEFAULT NULL,
  `grade` double(4,1) DEFAULT NULL,
  PRIMARY KEY (`id`)
) ENGINE=InnoDB AUTO_INCREMENT=40 DEFAULT CHARSET=utf8;

　　初始化数据：

INSERT INTO student(`name`,`subject`,grade)VALUES(‘aom‘,‘语文‘,88);
INSERT INTO student(`name`,`subject`,grade)VALUES(‘aom‘,‘数学‘,99);
INSERT INTO student(`name`,`subject`,grade)VALUES(‘aom‘,‘外语‘,55);

INSERT INTO student(`name`,`subject`,grade)VALUES(‘jack‘,‘语文‘,67);
INSERT INTO student(`name`,`subject`,grade)VALUES(‘jack‘,‘数学‘,44);
INSERT INTO student(`name`,`subject`,grade)VALUES(‘jack‘,‘外语‘,55);

INSERT INTO student(`name`,`subject`,grade)VALUES(‘susan‘,‘语文‘,56);
INSERT INTO student(`name`,`subject`,grade)VALUES(‘susan‘,‘数学‘,35);
INSERT INTO student(`name`,`subject`,grade)VALUES(‘susan‘,‘外语‘,77);

INSERT INTO student(`name`,`subject`,grade)VALUES(‘alice‘,‘语文‘,88);
INSERT INTO student(`name`,`subject`,grade)VALUES(‘alice‘,‘数学‘,77);
INSERT INTO student(`name`,`subject`,grade)VALUES(‘alice‘,‘外语‘,100);

INSERT INTO student(`name`,`subject`,grade)VALUES(‘rajo‘,‘语文‘,33);
INSERT INTO student(`name`,`subject`,grade)VALUES(‘rajo‘,‘数学‘,55);
INSERT INTO student(`name`,`subject`,grade)VALUES(‘rajo‘,‘外语‘,55);

下面我们来看一下，数据在数据库中的存储形式。

技术分享

　　（图1.0）

下面是这条查询的sql语句

SELECT `name`,COUNT(`name`) AS num FROM student WHERE grade < 60 GROUP BY `name` HAVING num >= 2 ORDER BY num DESC,`name` ASC LIMIT 0,2;

执行结果：

技术分享

　　图（1.1）

以上这条sql语句基本上概括了单表查询中所有要注意的点，那么我们就以这条sql为例来分析一下一条语句的执行流程。

技术分享

　　图（1.2）

2，WHERE grade < 60，会把（图1.0）所示表中的数据进行过滤，取出符合条件的记录行，生成一张临时表，如下图所示。

技术分享

　　图（1.3）

3，GROUP BY `name`会把图（1.3）的临时表切分成若干临时表，我们用下图来表示内存中这个切分的过程。

技术分享　　　　

　　图（1.4)　　　　　　　　　　　　　　图（1.5)　　　　　　　　　　　　　　　图（1.6)　　　　　　　　　　　　　图（1.7)

4，SELECT 的执行读取规则分为sql语句中有无GROUP BY两种情况。

　　（1）当没有GROUP BY时，SELECT 会根据后面的字段名称对内存中的一张临时表整列读取。

SELECT `name`,COUNT(`name`) AS num FROM tempTable1;
SELECT `name`,COUNT(`name`) AS num FROM tempTable2;
SELECT `name`,COUNT(`name`) AS num FROM tempTable3;
SELECT `name`,COUNT(`name`) AS num FROM tempTable4;

最后再次成新的临时表，如下图：

技术分享

　　图（1.8)

技术分享

　　图（1.9)

6，ORDER BY num DESC,`name` ASC对以上的临时表按照num，name进行排序。

技术分享

7，LIMIT 0,2取排序后的前两个。

技术分享

以上就是一条sql的执行过程，同时我们在书写查询sql的时候应当遵守以下顺序。

SELECT XXX FROM XXX WHERE XXX GROUP BY XXX HAVING XXX ORDER BY XXX LIMIT XXX;

以上是关于详解一条sql语句的执行过程的主要内容，如果未能解决你的问题，请参考以下文章

详解一条sql语句的执行过程

mysql—— 详解一条sql语句的执行过程

一条SQL语句是怎么执行之“步步惊心”过程详解与案例分析

详解一条 SQL 的执行过程

MySQL数据库详解一条SQL更新语句是如何执行的？

MySQL一条 SQL 的执行过程详解