mysql执行计划与索引详解---mysql详解
Posted 如月之恒-
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了mysql执行计划与索引详解---mysql详解相关的知识,希望对你有一定的参考价值。
文章目录
- mysql执行计划
- 创建索引原则
- 查询语句优化原则
- 1、全值匹配
- 2、最佳左前缀法则
- 3、不在索引上做任何的操作(计算、函数、(自动or手动)类型转换),会导致索引失效而变成全表扫描
- 4、存储引擎不能使用索引中范围条件(>、<、between等范围查询)右边的列
- 5、尽量使用覆盖索引
- 6、mysql在使用“不等于”、is null 、 is not null的时候不会使用索引,会进行全表扫描
- 7、少用or或者in,用or或者in时会导致索引失效
- 8、字符串不加单引号导致索引失效。
- 9、当取出的数据超过全表数据的20%时,不会使用索引
- 10、使用like时注意:
- 11、如果使用数字作为字符,则数字需要加引号,否则mysql会自动在列上加数据类型转换函数
- 12、字段加运算符不会使用索引。所以尽量把运算放在数值上
- 13、ORDER BY 子句只在以下的条件下使用索引:
- 14、只要能满足你的需求,应尽可能使用更小的数据类型:例如使用MEDIUMINT代替INT
- 15、从 PROCEDURE ANALYSE() 取得建议
- 16、join 语法,尽量将小的表放在前面,在需要on的字段上,数据类型保持一致,并设置对应的索引,否则MySQL无法使用索引来join查询
- 17、在大表上做大量更新时,如果会锁全表,则需要拆分执行,避免长时间锁住表,导致其他请求积累太多InnoDB 支持行锁,但前提是Where子句需要建立索引,没有索引也一样是锁全表
- 18、永远用小结果集驱动大的结果集,小数据集的表先执行。
- 19、MySQL支持两种方式的排序filesort和index,Using index 是指MySQL扫描索引本身完成排序。index效率高,filesort效率低。
- 20、 order by 满足两种情况会使用Using index。
- 21、group by 与order by 很类似,其实质是先排序后分组,遵照索引创建顺序的最佳左前缀法则。注意Where高于having,能写在where中的限定条件就不要去having限定了。
- 注
mysql执行计划
注意:mysql各个版本的执行计划的结果会有区别,需要根据具体的结果来做优化
explain各列释义
id列
id列的编号是 select 的序列号,有几个 select 就有几个id,并且id的顺序是按 select 出现的顺序增长的。id越大越早执行。
select_type列
select_type 表示对应行是是简单还是复杂的查询。
复杂查询分为三类:简单子查询、派生表(from语句中的子查询)、union 查询。
该列的数据类型有:
- simple:简单查询。查询不包含子查询和union
- primary:复杂查询中最外层的 select
- subquery:包含在 select 中的子查询(不在 from 子句中)
- derived:包含在 from 子句中的子查询。MySQL会将结果存放在一个临时表中,也称为派生表
- union:在 union 中的第二个和随后的 select
- union result:从 union 临时表检索结果的 select
table列
这一列表示 explain 的一行正在访问哪个表。
当 from 子句中有子查询时,table列是derivenN 格式,表示当前查询依赖 id=N 的查询,于是先执行 id=N 的查询。当有 union 时,UNION RESULT 的 table 列的值为 <union1,2>,1和2表示参与 union 的 select 行id。
type列
这一列表示关联类型或访问类型,即MySQL决定如何查找表中的行。
依次从最优到最差分别为:system > const > eq_ref > ref > fulltext > ref_or_null > index_merge > unique_subquery > index_subquery > range > index > ALL
type列各数值含义:
- NULL:mysql能够在优化阶段分解查询语句,在执行阶段用不着再访问表或索引。例如:在索引列中选取最小值,可以单独查找索引来完成,不需要在执行时访问表
- const, system:mysql能对查询的某部分进行优化并将其转化成一个常量(可以看show warnings 的结果)。用于 primary key 或 unique key 的所有列与常数比较时,所以表最多有一个匹配行,读取1次,速度比较快。
- eq_ref:primary key 或 unique key 索引的所有部分被连接使用 ,最多只会返回一条符合条件的记录。这可能是在 const 之外最好的联接类型了,简单的 select 查询不会出现这种 type。
- ref:相比 eq_ref,不使用唯一索引,而是使用普通索引或者唯一性索引的部分前缀,索引要和某个值相比较,可能会找到多个符合条件的行。
- ref_or_null:类似ref,但是可以搜索值为NULL的行。
- index_merge:表示使用了索引合并的优化方法。
- range:范围扫描通常出现在 in(), between ,> ,<, >= 等操作中。使用一个索引来检索给定范围的行。
- index:和ALL一样,不同就是mysql只需扫描索引树,这通常比ALL快一些。
- ALL:即全表扫描,意味着mysql需要从头到尾去查找所需要的行。通常情况下这需要增加索引来进行优化了
possible_keys列
这一列显示查询可能使用哪些索引来查找。
explain 时可能出现 possible_keys 有列,而 key 显示 NULL 的情况,这种情况是因为表中数据不多,mysql认为索引对此查询帮助不大,选择了全表查询。
如果该列是NULL,则没有相关的索引。在这种情况下,可以通过检查 where 子句看是否可以创造一个适当的索引来提高查询性能,然后用 explain 查看效果。
key列
这一列显示mysql实际采用哪个索引来优化对该表的访问。
如果没有使用索引,则该列是 NULL。如果想强制mysql使用或忽视possible_keys列中的索引,在查询中使用 force index、ignore index。
key_len列
这一列显示了mysql在索引里使用的字节数,通过这个值可以算出具体使用了索引中的哪些列。
ref列
这一列显示了在key列记录的索引中,表查找值所用到的列或常量,常见的有:const(常量),func,NULL,字段名。
rows列
这一列是mysql估计要读取并检测的行数,注意这个不是结果集里的行数。
Extra列
这一列展示的是额外信息。常见的重要值如下:
- distinct: 一旦mysql找到了与行相联合匹配的行,就不再搜索了
- Using index:查询的列被索引覆盖(即覆盖索引),并且where筛选条件是索引的前导列。这发生在对表的请求列都是同一索引的部分的时候,返回的列数据只使用了索引中的信息,而没有再去访问表中的行记录。是性能高的表现。
- Using where:查询的列未被索引覆盖,where筛选条件非索引前导列。
- Using index condition:与user where类似,查询的列不完全被索引覆盖,where 条件中是一个前导列的范围。
- Using where;Using index:查询的列被索引覆盖,并且Where筛选条件是索引列之一但是不是索引的前导列,意味着无法直接通过索引查找符合条件的数据。
- NULL : 查询的列未被索引覆盖,where筛选条件是索引前导列。意味着用到了索引,但是部分字段未被索引覆盖,必须通过回表来实现。
- Using temporary:mysql需要创建一张临时表来处理查询。出现这种情况一般是要进行优化的,首先是想到用索引来优化。
- Using filesort:mysql 会对结果使用一个外部索引排序,而不是按索引次序从表里读取行。此时mysql会根据联接类型浏览所有符合条件的记录,并保存排序关键字和行指针,然后排序关键字并按顺序检索行信息。这种情况下一般也是要考虑使用索引来优化的。
创建索引原则
熟记这些创建索引原则,但具体效果要具体分析。
1、有大量重复值、且经常有范围查询( > ,< ,> =,< =)和order by、group by发生的列,可考虑建立群集索引;
2、经常同时存取多列,且每列都含有重复值可考虑建立组合索引;
3、组合索引要尽量使关键查询形成索引覆盖,其前导列一定是使用最频繁的列;
索引虽有助于提高性能但不是索引越多越好,恰好相反过多的索引会导致系统低效。用户在表中每加进一个索引,维护索引集合就要做相应的更新工作。
4、表的主键、外键必须有索引;
5、区分度更高(同值的最少)的字段,建索引;
6、单表数据太少,不适合建索引。例如字典表
7、如果既有单字段索引,又有这几个字段上的联合索引,一般可以删除联合索引;
8、尽量使用前缀来索引
其实一般情况下我们也不会在字段类型为TEXT和BLOG类型上加索引。
如果索引字段的值很长,最好使用值的前缀来索引。例如,TEXT和BLOG类型的字段,进行全文检索会很浪费时间。如果只检索字段的前面的若干个字符,这样可以提高检索速度。
9、为经常需要排序,分组和联合操作的字段建立索引。
10、为常作为查询条件的字段建立索引。
查询语句优化原则
优化方法不止下述提到的这些。有碰到优化方法就要记录和验证(一定要验证,而不是去记,很多博客写得并不严谨)。
以下的方法如果博主有验证通过了会给完整案例(包括建表、数据量、数据库执行计划等信息),如没有,就是仅供参考而已,优化原则均来自博主同事与网上博客。
这些优化要结合mysql的数据结构,要自己去看explain(执行计划)。mysql还有他自己的优化,例如:数据量小的时候明明用了这些优化方法还是不走索引。所以要具体问题具体分析。
熟记这些优化原则,但具体效果要具体分析。
1、全值匹配
如果用到了联合索引,那么一般情况下,最好是将联合索引的各字段都用到查询条件中。
2、最佳左前缀法则
如果索引了多列,要遵守最左前缀法则。指的是查询从索引的最左前列开始并且不跳过索引中的列。
3、不在索引上做任何的操作(计算、函数、(自动or手动)类型转换),会导致索引失效而变成全表扫描
4、存储引擎不能使用索引中范围条件(>、<、between等范围查询)右边的列
举例:
name、age、title为联合索引,如果是下面的查询语句,那么只会用到name、age两个索引。
SELECT * FROM employees WHERE name = 'qitian' AND age>18 AND title= '经理'
5、尽量使用覆盖索引
就是查询的结果集都为索引字段,那么就是覆盖索引。
6、mysql在使用“不等于”、is null 、 is not null的时候不会使用索引,会进行全表扫描
7、少用or或者in,用or或者in时会导致索引失效
a为主键,b为索引
select a, b from test where b in ( 'x1', 'x2','x3')
正常情况下,上述sql语句不会走索引。
如果类似的查询语句必须走索引的话
可以考虑用union来联结,分开查询就可以走索引了。
select a, b from test where b ='x1'
union
select a, b from test where b ='x2'
union
select a, b from test where b ='x3'
8、字符串不加单引号导致索引失效。
9、当取出的数据超过全表数据的20%时,不会使用索引
10、使用like时注意:
不使用索引:
like ‘%L%’
使用索引:
like ‘L%’
11、如果使用数字作为字符,则数字需要加引号,否则mysql会自动在列上加数据类型转换函数
不使用索引
where mobile=18868886888
使用索引
where mobile=’18868886888’
12、字段加运算符不会使用索引。所以尽量把运算放在数值上
不使用索引:
SELECT ACCOUNT_NAME, AMOUNT FROM TRANSACTION WHERE AMOUNT + 3000 >5000;
使用索引:
SELECT ACCOUNT_NAME, AMOUNT FROM TRANSACTION WHERE AMOUNT > 2000 ;
13、ORDER BY 子句只在以下的条件下使用索引:
ORDER BY中所有的列必须包含在相同的索引中并保持在索引中的排列顺序.
ORDER BY中不能既有ASC也有DESC
例如:
alter table test1 add index(a,b);
alter table test1 add index©;
不使用索引:
select * from test1 order by a,c; 不在一个索引中
select * from test1 order by b; 没有出现组合索引的第一列
select * from test1 order by a asc, b desc; 混合ASC和DESC
select * from test1 where a=1 order by c; where和order by用的不是同一个索引,where使用索引,order by不使用。
使用索引:
select * from test1 order by a,b;
select * from test1 order where a=1 order by b;
select * from test1 order where a=1 order by a,b;
select * from test1 order by a desc, b desc;
select * from test1 where c=1 order by c;
14、只要能满足你的需求,应尽可能使用更小的数据类型:例如使用MEDIUMINT代替INT
15、从 PROCEDURE ANALYSE() 取得建议
PROCEDURE ANALYSE() 会让 MySQL 帮你去分析你的字段和其实际的数据,并会给你一些有用的建议。只有表中有实际的数据,这些建议才会变得有用,因为要做一些大的决定是需要有数据作为基础的。
表中需要有数据,这样mysql才好给出建议,结果集的最后一列就是mysql认为应该改用的数据类型建议。
16、join 语法,尽量将小的表放在前面,在需要on的字段上,数据类型保持一致,并设置对应的索引,否则MySQL无法使用索引来join查询
17、在大表上做大量更新时,如果会锁全表,则需要拆分执行,避免长时间锁住表,导致其他请求积累太多InnoDB 支持行锁,但前提是Where子句需要建立索引,没有索引也一样是锁全表
18、永远用小结果集驱动大的结果集,小数据集的表先执行。
19、MySQL支持两种方式的排序filesort和index,Using index 是指MySQL扫描索引本身完成排序。index效率高,filesort效率低。
20、 order by 满足两种情况会使用Using index。
- order by语句使用索引最左前列。
- 使用Where子句与order by 子句条件列组合满足索引最左前列
21、group by 与order by 很类似,其实质是先排序后分组,遵照索引创建顺序的最佳左前缀法则。注意Where高于having,能写在where中的限定条件就不要去having限定了。
注
- 文章是个人知识点整理总结,如有错误和不足之处欢迎指正。
- 如有疑问、或希望与笔者探讨技术问题(包括但不限于本章内容),欢迎添加笔者微信(o815441)。请备注“探讨技术问题”。欢迎交流、一起进步。
以上是关于mysql执行计划与索引详解---mysql详解的主要内容,如果未能解决你的问题,请参考以下文章