分析SQL执行过程中，哪些SQL条件会走索引

Posted 2023-04-16

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了分析SQL执行过程中，哪些SQL条件会走索引相关的知识，希望对你有一定的参考价值。

参考技术A 这样回答你，以下几种情况sql中索引不会被用到
1、查询谓词没有使用索引的主要边界,换句话说就是select *，可能会导致不走索引。
比如，你查询的是SELECT * FROM T WHERE Y=XXX;假如你的T表上有一个包含Y值的组合索引，但是优化器会认为需要一行行的扫描会更有效，这个时候，优化器可能会选择TABLE ACCESS FULL，但是如果换成了SELECT Y FROM T WHERE Y = XXX，优化器会直接去索引中找到Y的值，因为从B树中就可以找到相应的值。

2、单键值的b树索引列上存在null值，导致COUNT(*)不能走索引。
如果在B树索引中有一个空值，那么查询诸如SELECT COUNT(*) FROM T 的时候，因为HASHSET中不能存储空值的，所以优化器不会走索引，有两种方式可以让索引有效，一种是SELECT COUNT(*) FROM T WHERE XXX IS NOT NULL或者把这个列的属性改为not null (不能为空)。

3、索引列上有函数运算，导致不走索引
如果在T表上有一个索引Y，但是你的查询语句是这样子SELECT * FROM T WHERE FUN(Y) = XXX。这个时候索引也不会被用到，因为你要查询的列中所有的行都需要被计算一遍，因此，如果要让这种sql语句的效率提高的话，在这个表上建立一个基于函数的索引，比如CREATE INDEX IDX FUNT ON T(FUN(Y));这种方式，等于Oracle会建立一个存储所有函数计算结果的值，再进行查询的时候就不需要进行计算了，因为很多函数存在不同返回值，因此必须标明这个函数是有固定返回值的。

4、隐式转换导致不走索引。
索引不适用于隐式转换的情况，比如你的SELECT * FROM T WHERE Y = 5 在Y上面有一个索引，但是Y列是VARCHAR2的，那么Oracle会将上面的5进行一个隐式的转换，SELECT * FROM T WHERE TO_NUMBER(Y) = 5,这个时候也是有可能用不到索引的。

5、表的数据库小或者需要选择大部分数据，不走索引
在Oracle的初始化参数中，有一个参数是一次读取的数据块的数目，比如你的表只有几个数据块大小，而且可以被Oracle一次性抓取，那么就没有使用索引的必要了，因为抓取索引还需要去根据rowid从数据块中获取相应的元素值，因此在表特别小的情况下，索引没有用到是情理当中的事情。
6、cbo优化器下统计信息不准确，导致不走索引
很长时间没有做表分析，或者重新收集表状态信息了，在数据字典中，表的统计信息是不准确的，这个情况下，可能会使用错误的索引，这个效率可能也是比较低的。
7、！=或者<>(不等于），可能导致不走索引，也可能走 INDEX FAST FULL SCAN
例如select id from test where id<>100
8、表字段的属性导致不走索引，字符型的索引列会导致优化器认为需要扫描索引大部分数据且聚簇因子很大，最终导致弃用索引扫描而改用全表扫描方式，
由于字符型和数值型的在insert的时候排序不同，字符类型导致了聚簇因子很大，原因是插入顺序与排序顺序不同。详细点说，就是按照数字类型插入（1..3200000），按字符类型（'1'...'32000000'）t排序，在对字符类型使用大于运算符时，会导致优化器认为需要扫描索引大部分数据且聚簇因子很大，最终导致弃用索引扫描而改用全表扫描方式。

7.使用EXPLAIN 来分析SQL和表结构_1

explain：查看执行计划

　　使用explain 关键字可以模拟优化器执行SQL查询语句，从而知道MySQL是如何处理你的SQL语句的

　　分析你的查询语句或是表结构的性能瓶颈

使用explain 可以获取哪些信息：

　　表的读取顺序

　　数据读取操作的操作类型

　　哪些索引可以使用

　　哪些索引被实际使用

　　表之间的引用

　　每张表有多少行被优化器查询

explain + sql语句

　　执行计划包含的信息：

　　　　1.id　　select查询的序列号，包含一组数字，表示查询中执行select子句或操作表的顺序

　　　　2.select_type　　查询的类型，主要用于区别普通查询、联合查询、子查询等的复杂查询

　　　　3.table　　显示这一行的数据是关于哪张表的

　　　　4.type　　显示查询使用了何种类型 system>const>eq_ref>ref>range>index>ALL

　　　　5.possible_keys　　可能用在这条语句上的索引

　　　　6.key　　实际使用到的索引

　　　　7.key_len　　索引字段的最大可能长度

　　　　8.ref　　索引在哪一列被使用了

　　　　9.rows　　读取的行数

　　　　10.Extra　　包含不适合在其他列中显示但十分重要的额外信息

下面一个一个来说

id：select查询的序列号，包含一组数字，表示查询中执行select子句或操作表的顺序

三种情况：

　　id相同，执行顺序由上至下

　　id不同，如果是子查询，id的序号会递增，id值越大优先级越高，越先被执行

　　id有相同，有不同：先执行id大的，id相同的，由上到下依次执行

select_type 查询的类型，主要用于区别普通查询、联合查询、子查询等复杂查询　　

　　1.SIMPLE 简单的select查询，查询中不包含子查询或者UNION

　　2.PRIMARY 查询中若包含任何复杂的子部分，最外层查询则被标记为PRIMARY,即最后执行这个

　　3.SUBQUERY 在SELECT或 WHERE 列表中包含了子查询

　　4.DERIVED 在FROM 列表中包含的子查询被标记为DERIVED(衍生)

　　　　　　　　　MySQL会递归执行这些子查询，把结果放在临时表里

　　5.UNION 若第二个SELECT 出现在 UNION 之后，则被标记为UNION

　　　　　　　　　若UNION包含在FROM 子查询中，外层SELECT将被标记为：DERIVED

　　6.UNION RESULT 从UNION 表获取结果的SELECT

table：显示这一行的数据是关于哪张表的，不再赘述

type：显示查询使用了何种类型，最好到最差依次是： system>const>eq_ref>ref>range>index>ALL

　　system　------　表只有一行数据（等于系统表），这是const类型的特例，平时不会出现，可以忽略

　　const　 ------ 表示表通过索引依次就找到了，const用于比较primary key 或者 unique索引。

　　　　　　　　因为只匹配一行数据，所以快，如将主键置于where列表中，MySQL就能将该查询转换为一个常量

　　eq_ref　 ------ 唯一性索引扫描，对于每个索引键，表中只有一条记录与之匹配，常见于主键或唯一索引扫描

　　　　　　　　　使用了唯一性索引，知道查出来的结果只有一个，找到这个就不找了

　　ref ------ 非唯一性索引扫描，返回匹配某个单独值的所有行，本质上也是一种索引访问，它返回所有匹配

　　　　　　　　　某个单独值的行，然而，它可能会找到多个符合条件的列，所以他应该属于查找和扫描的混合体

　　　　　　　　　 /*查找条件（某个确定的值）使用了索引，但是不为主键和 unique索引，即不保证查出来的结果唯一

　　　　　　　　　　如果存在多条记录，在找到了第一条符合的记录之后，仍然不能停止，要进行目标值附近的小范围扫描

　　range ------ 只检索给定范围的行，使用一个索引来进行选择行。key列显示使用了哪个索引

　　　　　　　　一般就是在你的 where 语句中出现了between、<、>、in、or等查询

　　　　　　　　　这种范围扫描索引比全表扫描要好，因为它只需要开始于索引的某一点，而结束于另一点，不用扫描全部索引

　　　　　　　　　 range 是建立在索引的基础之上，对建立了索引的列进行范围查找扫描部分索引

　　index ------ Full Index Scan ，index 与ALL 区别为 index 类型遍历的索引树，这通常比ALL块，因为索引文件通常比数据文件小

　　　　　　　　　也就是说，虽然ALL 和 Index 都是读取全表，但是Index 是从索引中读取的，而ALL是从硬盘中读取的

　　　　　　　　　需要遍历整个索引树，后面性能更好的几种类型，都是建立在索引的基础之上，查找的都是索引

　　all　　　------ Full TableScan　将遍历全表以找到匹配的行

注：一般来说，得保证查询至少是 range 级别，最好能达到 ref

以上是关于分析SQL执行过程中，哪些SQL条件会走索引的主要内容，如果未能解决你的问题，请参考以下文章

浅析SQL SERVER执行计划中的各类怪相

简述项目中优化sql语句执行效率的方法，从哪些方面，sql语句性能如何分析？

执行3小时超长SQL的分析优化过程：从索引遇见IS NULL，到最佳实践

sql执行计划

mysql-一条sql的执行过程