MySQL 查询优化 - 关联查询

Posted moongeek

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了MySQL 查询优化 - 关联查询相关的知识,希望对你有一定的参考价值。

1. 关联查询执行流程

MySQL执行关联查询的策略很简单,他会从一个表中循环取出单条数据,然后用该条数据到下一个表中寻找匹配的行,然后回溯到上一个表,到所有的数据匹配完成为止。因此也被称为“嵌套循环关联”。

来看下面这个SQL:

select tb1.col1, tb2,col2
  from tb1 inner join tb2 using(col3)
  where tb1.col1 in (5,6)

他的执行顺序为(伪代码):

List outerDataList = "select * from tb1 where col1 in (5,6)"
  for(outerData in outerDataList)
    List innerDataList = "select * from tb2 where col3 = outerData.col3"
      for(innerData : innerDataList)
        output(outterData,innerData)
      
  

mysql认为所有的查询都是一次关联查询,所以如果查询一个表,上述过程也适合,不过只需要完成上面外层的基本操作。

再来看看left outter join查询的过程,SQL如下:

select tb1.col1, tb2,col2
from tb1 left outer join tb2 using(col3)
where tb1.col1 in (5,6)

伪代码如下:

List outerDataList = "select * from tb1 where col1 in (5,6)"
  for(outerData in outerDataList)
    List innerDataList = "select * from tb2 where col3 = outerData.col3"
      if(innerDataList != null)
        for(innerData : innerDataList)
          output(outterData,innerData)
        
      else
        // inner表无对应数据,以outter数据为准
        output(outterData,null)
      
  

但是这种遍历的查询方式不能满足所有的联合查询,比如“全外连接”查询(full outer join)不能使用该方法来实现,这可能是MySQL不支持全外接查询的原因 ~~~

2. 优化

MySQL会将查询命令生成一颗指令树,比如四表联合查询的指令树如下:
技术图片

?

MySQL在生成指令树之前会先对SQL语句的执行效率进行评估,然后选择他认为效率最高的关联顺序执行。对于如下SQL:

EXPLAIN SELECT
    actor.NAME,
    film.title 
FROM
    actor actor
    INNER JOIN film_actor USING ( actor_id )
    INNER JOIN film USING ( film_id )

技术图片

从执行计划可以看出,MySQL选择将film作为第一个关联表,拿到数据后再依次扫描film_actor、actor表取数据。MySQL的选择策略是,尽量让查询执行更少的嵌套循环和回溯操作,因此,他会尽量将外层查询的数据量更少。因为film表只有4条记录,actor表有6条记录,因此他认为选择将film作为第一个表开始查询有更高的执行效率。

但是MySQL的优化策略会比这复杂的多,MySQL会计算所有执行顺序的代价,然后选择他认为的最佳执行计划。但是,如果联合查询的表比较多,他不一定能穷举所有的执行情况选择最佳的执行策略,所以这种默认的优化方式却不一定总是最佳的。还是以上条SQL为例子,假设在film表的film_id字段上建立了索引,那么即使film上的字段少于actor,可能使用actor表作为第一个表进行查询,效率会更高(里层嵌套查询film表数据时可以使用索引)。如果你认为有更佳的执行顺序,可以使用STRAIGHT_JOIN关键字强行执行查询顺序:

EXPLAIN SELECT
    actor.NAME,
    film.title 
FROM
    actor actor
    STRAIGHT_JOIN film_actor USING ( actor_id )
    STRAIGHT_JOIN film USING ( film_id )

注意:绝大多数时候,MySQL做出的判断都比人类要准确,绝大多数时候,不推荐强制执行顺序。

以上是关于MySQL 查询优化 - 关联查询的主要内容,如果未能解决你的问题,请参考以下文章

MySql性能优化查询优化

MySQL 查询优化 - 关联查询

mysql关联子查询索引优化

Mysql(19)—join关联查询的原理以及优化手段

mysql 关联子查询优化

mysql查询优化