mysql回表

Posted 戚焱

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了mysql回表相关的知识,希望对你有一定的参考价值。

回表

我们知道当mysql的索引并不能包含查询语句所需要的所有字段时,就需要拿到二级索引查找出的id去到聚簇索引树上拿到需要的字段。这个操作也就是回表。

也就是说回表操作时:mysql会采用访问二级索引+聚簇索引的方式去完成这条查询。

比如:

现在有这样一张表

表的索引如下:index_order_id_product_name(order_id,product_name)

若执行下面这条语句,就可以使用到覆盖索引。即只访问index_order_id_product_name这一棵索引树,就可以拿到查询的所有需要的数据。

 SELECT order_id,product_name FROM `test_orderdetail` where order_id = 100; 

但是如果想要多查询一个字段:cnt,那么mysql就需要先查询二级索引,拿到id去聚簇索引中拿到对应的cnt。因为索引index_order_id_product_name存放的数据是order_id,product_name和id。

 SELECT order_id,product_name,cnt FROM `test_orderdetail` where order_id = 100; 

索引index_order_id_product_name对应的索引树是首先按照order_id排序的,在order_id相等的情况下又会按照product_name排序。换句话说:我们所需要的order_id=100的数据,集中分布在一个或多个数据页上,即使不在一个数据页上,它们之间也有相互关联的指针。mysql可以只读取少量的数据页就能拿到所有需要的数据。即:顺序I/O。

在第二条sql中,由于索引index_order_id_product_name并不能覆盖所有需要的字段,mysql需要根据在二级索引树上拿到的id再去聚簇索引树中查找。注意:索引index_order_id_product_name是按照order_id和product_name排序的,他们的id可能并不相邻,而聚簇索引是通过id排序的。也就是说我们通过二级索引拿到的id可能散乱的分布在各个数据页中,而某个数据页中可能有用数据的仅有一条。mysql想要拿到这些id对应的数据就需要访问很多的数据页。即随机I/O。

随机I/O比顺序I/O需要更多的时间。所以回表的代价可能是巨大的。

当需要回表的数据越多,二级索引+回表到聚簇索引查找的代价就越大。而且当需要回表的数量巨大时,mysql会认为全表扫描的性能会比使用二级索引的性能更好,从而放弃使用二级索引。

以上是关于mysql回表的主要内容,如果未能解决你的问题,请参考以下文章

SQL - MySQL回表

mysql 14 覆盖索引+回表

mysql回表

Mysql 回表SQL优化四种隔离级别三大日志binlogredo logundo log

什么是 MySQL 的“回表”?

mysql索引的性能分析