一图解析MySQL执行查询全流程

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了一图解析MySQL执行查询全流程相关的知识，希望对你有一定的参考价值。

摘要：当我们希望mysql能够以更高的性能运行查询时,最好的办法就是弄清楚MySQL是如何优化和执行查询的。

本文分享自华为云社区《mysql执行查询全流程解析》，作者：breakDraw。

mysql执行查询的过程

客户端和服务端之间是半双工的，即一个通道内只能一个在发一个接收，不能同时互相发互相接收
客户端只会发送一个数据包给服务端，并不会在应用层拆成2个数据包去发（max_allowed_packet可以设置数据包最大长），这关系到sql语句不能太长。
服务端返回给客户端可以有多个数据包，但是客户端必须完整接收，不能接到一半停掉连接或用连接去做其他事（UI界面可以操作，不同的线程）
例如java，如果没设置fetchSize，那么都是一次性把结果读进内存。当你使用resultSet的时候，其实已经全部进来了，而不是一条条从服务端获取。————使用fetch Size边读边处理的坏处：服务端占用的资源时间变久了。

使用 show full processlist 命令可以查看mysql服务端某些线程的状态

mysql可能会生成多种计划，他会分别计算一个预测成本值，然后选一个成本最小的计划
计算信息来自于表的页面个数、索引分布、长度、个数、数据行长度
因为多种原因，可能不会选择到最优的计划，有偏差
静态优化和动态优化的区别：
静态优化类似“编译期优化”，只和语句结构有关，和具体值无关
动态优化是在运行中去优化的，需要依赖索引行数、where取值，执行次数可能比静态优化要多。

join实际执行的顺序会关系到性能
例如a\\b\\c三个表关联，可能先让a和b关联得到的临时表里的记录只有10条，而如果让a和c先关联，会有10000条，那么后面的效率就会截然不同
EXPLAIN EXTENDED可以展示关联的顺序
STRAIGHT_JOIN可以手动指定关联顺序
mysql自己会评估搜索一个最优的顺序，但如果join表太多，则无法搜完所有结果（O(n!))，那时候就会采用贪心。是否使用贪心算法的边界值可以根据optimizer_seartch_depth去指定。

两次传输排序：先取要排序的字段加行序号，按照字段排序好之后，再根据行索引一条条取读
优点: 排序时占用内存小。
缺点: 排序之后读的过程会很慢，根据行序号取读不是很方便
单次传输排序：直接把行读出来（行里只有需要用的列，不一定是整行），然后排序
优点: 把全部行读出来相当于顺序IO，读取速度快
缺点: 可能会很大导致需要文件排序

关联查询order by的注意事项
如果order by的列都来自关联的 第一张 表，则直接第一张表join的时候就排序了。
除此之外！！都是全部join完，再排序！就算用了limit，也是全部join+排序后，再limit的！

以上是关于一图解析MySQL执行查询全流程的主要内容，如果未能解决你的问题，请参考以下文章