对SQL慢查询的优化(MySQL)

Posted 一碗谦谦粉

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了对SQL慢查询的优化(MySQL)相关的知识,希望对你有一定的参考价值。

一、慢查询原因

要对慢查询进行优化,首先要搞清楚慢查询的原因,原因主要有三:

(1)加载了不需要的数据列

(2)查询条件没有命中索引

(3)数据量太大

二、优化方案

优化也是针对这三个方向的:

(1)先分析语句,看看是否加载了额外的数据,可能是查询了多余的行并且抛弃掉了,可能是加载了许多结果中并不需要的列,如果有这些问题,则对语句进行分析、重写

(2)分析语句的执行计划,获得其使用索引的情况,然后修改语句或修改索引,使得语句尽可能地命中索引

(3)如果对语句的优化都已经无法进行了,可以考虑是否是表中数据量太大引起的慢查询,如果是,则可以进行横向或者纵向分表

三、补充-执行计划

1、mysql的执行计划怎么看

(1)最简单的做法是,使用可视化工具Navicat,执行查询时打开【解释】

(2)具体的含义

 

执行计划字段对照表
序号字段作用
1id

id是一个有顺序的编号,是查询的顺序号

(1)id的顺序按select出现的顺序增长,有几个select就显示几行,就有几个id。

(2)id列的值越大执行的优先级越高越先执行,id列的值相同则从上往下执行,id列的值为NULL最后执行 

2select_type

表示查询中每个select子句的类型

(1)SIMPLE: 表示此查询不包含 UNION 查询或子查询
(2)PRIMARY: 表示此查询是最外层的查询(包含子查询)
(3)SUBQUERY: 子查询中的第一个 SELECT
(4)UNION: 表示此查询是 UNION 的第二或随后的查询
(5)DEPENDENT UNION: UNION 中的第二个或后面的查询语句,取决于外面的查询
(6)UNION RESULT,UNION 的结果
(7)DEPENDENT SUBQUERY:子查询中的第一个 SELECT,取决于外面的查询. 即子查询依赖于外层查询的结果
(8)DERIVED:衍生,表示导出表的SELECT(FROM子句的子查询)
3table表示该语句查询的表
4partitions
5type

是优化SQL的重要字段,判断SQL性能和优化程度的重要指标。

type的取值类型范围:

(1)const:通过索引一次命中,匹配一行数据

(2)system:表中只有一行记录,相当于系统表

(3)eq_ref:唯一性索引扫描,对于每个索引键,表中只有一条记录与之匹配

(4)ref:非唯一性索引扫描,返回匹配某个值的所有

(5)range:只检索给定范围的行,使用一个索引来选择行,一般用于:between,<,>

(6)index:只遍历索引树

(7)ALL:表示全表扫描,这个类型的查询是性能最差的查询之一。随着表的数量增多,执行效率变慢

*(8)执行效率:
ALL < index < range< ref < eq_ref < const < system。最好是避免ALL和index

6possible_keys表示Mysql在执行该sql语句的时候,可能用到的索引信息,仅仅是可能,实际不一会用到。很多时候索引不一定会命中。
7key此字段是 mysql 在当前查询时所真正使用到的索引。 key是possible_keys的子集
8key_len表示查询优化器使用了索引的字节数,这个字段可以评估组合索引是否完全被使用,这也是我们优化sql时,评估索引的重要指标。
9ref
10rowsmysql 查询优化器根据统计信息,估算该sql返回结果集需要扫描读取的行数,这个值相关重要,索引优化之后,扫描读取的行数越多,说明索引设置不对,或者字段传入的类型之类的问题,说明要优化空间越大
11filtered返回结果的行占需要读到的行(rows列的值)的百分比,就是百分比越高,说明需要查询到数据越准确, 百分比越小,说明查询到的数据量大,而结果集
12extra(1)using filesort :表示 mysql 对结果集进行外部排序,不能通过索引顺序达到排序效果。一般有using filesort都建议优化去掉,因为这样的查询 cpu 资源消耗大,延时大。
(2)using index:覆盖索引扫描,表示查询在索引树中就可查找所需数据,不用扫描表数据文件,往往说明性能不错。
(3)using temporary:查询有使用临时表, 一般出现于排序, 分组和多表 join 的情况, 查询效率不高,建议优化。
(4)using where :sql使用了where过滤,效率较高。

对1的一个例子:有多少个select就有多少行,就有多少id

注:执行计划就是SQL的执行查询的顺序。

2、SQL语句的执行顺序

SQL语句的执行顺序是区别于,SQL的执行查询的顺序的,这感觉有点咬字眼了。

但是一般说的SQL语句的执行顺序是指:

SELECT * FROM `student` 这么一个select查询语句的执行顺序,这里是先from然后才是select。

如果有where等其他关键字:

select 语句的执行顺序

1from
2join
3on
4where
5group by
6count、sum等统计函数
7having
8select
9distinct
10order by
11limit



 

 3、关于索引没有命中的一种猜想

如果创建了索引,特别是组合索引,却没有命中,那么优先要考虑创建的索引有没有符合最左前缀原则。

(1)最左前缀原则:顾名思义是最左优先,以最左边的为起点任何连续的索引都能匹配上。

        1)如果第一个字段是范围查询需要单独建一个索引;

        2)在创建多列索引时,要根据业务需求,where子句中使用最频繁的一列放在最左边;

当创建(a,b,c)复合索引时,想要索引生效的话,只能使用 a和ab、ac和abc三种组合。

(2)一个例子:

为student表创建一个组合索引 age_name_sex_index

 在执行计划中可以看到,索引命中了,这时where 了 age字段

 但是如果没有where了age字段,那么索引就不会命中

MySQL优化:慢SQL分析

对慢SQL优化一般可以按下面几步的思路:

1、开启慢查询日志,设置超过几秒为慢SQL,抓取慢SQL

2、通过explain对慢SQL分析(重点)

3、show profile查询SQL在Mysql服务器里的执行细节和生命周期情况(重点)

4、对数据库服务器的参数调优

一、慢查询日志

1、设置慢查询

(1)设置开启:SET GLOBAL slow_query_log = 1;   #默认未开启,开启会影响性能,mysql重启会失效
(2)查看是否开启:SHOW VARIABLES LIKE \'%slow_query_log%\';
(3)设置阈值:SET GLOBAL long_query_time=3;
(4)查看阈值:SHOW 【GLOBAL】 VARIABLES LIKE \'long_query_time%\';  #重连或新开一个会话才能看到修改值
(5)通过修改配置文件my.cnf永久生效,在[mysqld]下配置:
  [mysqld]
  slow_query_log = 1;  #开启
  slow_query_log_file=/var/lib/mysql/atguigu-slow.log   #慢日志地址,缺省文件名host_name-slow.log
  long_query_time=3;    #运行时间超过该值的SQL会被记录,默认值>10
  log_output=FILE           

2、获取慢SQL信息   

查看慢查询日志记录数:SHOW GLOBAL STATUS LIKE \'%Slow_queries%\';

  模拟语句:select sleep(4);

  查看日志:cat atguigu-slow.log

   

3、搭配日志分析工具mysqldumpslow

mysqldumpslow -s r -t 10 /var/lib/mysql/atguigu-slow.log     #得到返回记录集最多的10个SQL
mysqldumpslow -s c -t 10 /var/lib/mysql/atguigu-slow.log     #得到访问次数最多的10个SQL
mysqldumpslow -s t -t 10 -g "LEFT JOIN" /var/lib/mysql/atguigu-slow.log   #得到按照时间排序的前10条里面含有左连接的查询语句
mysqldumpslow -s r -t 10 /var/lib/mysql/atguigu-slow.log | more      #结合| more使用,防止爆屏情况

s:表示按何种方式排序
c:访问次数
l:锁定时间
r:返回记录
t:查询时间
al:平均锁定时间
ar:平均返回记录数
at:平均查询时间
t:返回前面多少条的数据
g:后边搭配一个正则匹配模式,大小写不敏感

二、explain分析慢SQL

  通过explain分析慢SQL很重要,单独一章列举,MySQL优化(4):explain分析

三、Show Profile分析慢SQL

    Show Profile也是分析慢SQL的一种手段,但它能获得比explain更详细的信息,能分析当前会话中语句执行的资源消耗情况,能获得这条SQL在整个生命周期的耗时,相当于执行时间的清单,也很重要。

1、默认关闭。开启后,会在后台保存最近15次的运行结果,然后通过Show Profile命令查看结果。

开启:set profiling = on;
查看:SHOW VARIABLES LIKE \'profiling%\';

2、通过Show Profile能查看SQL的耗时

   

3、通过Query_ID可以得到具体SQL从连接 - 服务 - 引擎 - 存储四层结构完整生命周期的耗时

  

可用参数type:
ALL    #显示所有的开销信息
BLOCK IO  #显示块IO相关开销
CONTEXT SWITCHES  #上下文切换相关开销
CPU     #显示CPU相关开销信息
IPC     #显示发送和接收相关开销信息
MEMORY #显示内存相关开销信息
PAGE FAULTS  #显示页面错误相关开销信息
SOURCE  #显示和Source_function,Source_file,Source_line相关的开销信息
SWAPS  #显示交换次数相关开销的信息

4、出现这四个status时说明有问题,group by可能会创建临时表

#危险状态:
converting HEAP to MyISAM   #查询结果太大,内存不够用了,在往磁盘上搬 Creating tmp table   #创建了临时表,回先把数据拷贝到临时表,用完后再删除临时表 Copying to tmp table on disk  #把内存中临时表复制到磁盘,危险!!! locked

  

四、全局查询日志

只在测试环境用,别在生产环境用,会记录所有使用过的SQL

1、开启:

开启:会将sql记录到mysql库的general_log表
    set global general_log=1;
    set global log_output=\'TABLE\';
配置文件的方式:
    在my.cnf中配置
    general_log=1    #开启
    general_log_file=/path/logfile    #记录日志文件的路径
    log_output=FILE    #输出格式

2、查看

select * from mysql.general_log;

   

以上是关于对SQL慢查询的优化(MySQL)的主要内容,如果未能解决你的问题,请参考以下文章

MySQL优化:慢SQL分析

mysql 优化

如何查找MySQL中查询慢的SQL语句

MySQL数据库优化

mysql慢查询

MySQL优化--02----慢SQL定位慢查询日志