阿里三面:MySQL回表的性能伤害有多大?

Posted JavaEdge.

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了阿里三面:MySQL回表的性能伤害有多大?相关的知识,希望对你有一定的参考价值。

1 回表的性能消耗

无论单列索引 or 联合索引,一个索引就对应一个独立的B+索引树,索引树节点仅包含:

  • 索引里的字段值
  • 主键值

即使根据索引树按条件找到所需数据,也仅是索引里的几个字段的值和主键值,万一你搞个select *,那就还得其他字段,就需回表,根据主键到聚簇索引里找,聚簇索引的叶节点是数据页,找到数据页才能把一行数据所有字段值读出来。

所以类似

select * from table order by xx1,xx2,xx3

得从联合索引的索引树里按序取出所有数据,接着对每条数据都走一个主键的聚簇索引查找,性能不高。

有时mysql执行引擎可能认为,你要是类似

select * from table order by xx1,xx2,xx3

相当于得把联合索引和聚簇索引,两个索引的所有数据都扫描一遍,那还不如不走联合索引,直接全表扫描得了,这样就只需扫描一个主键索引。

但若形如:

select * from table order by xx1,xx2,xx3 limit 10

那执行引擎就知道你先扫描联合索引的索引树,拿到10条数据,接着对10条数据在聚簇索引里查找10次即可,那就还是会走联合索引。

2 覆盖索引

覆盖索引不是一种索引,只是一种基于索引查询的方式,即针对类似

select xx1,xx2,xx3 from table order by xx1,xx2,xx3

仅需联合索引里的几个字段的值,那就只需扫描联合索引的索引树,无需回表找其它字段,这种查询方式就是覆盖索引。

所以当你使用联合索引时,注意是否可能会导致大量回表到聚簇索引,若回表聚簇索引的次数太多,可能就直接给你做成全表扫描而不走联合索引了。

尽可能还是在SQL里指定你仅需要的字段,而不要暴力select *,最好直接走覆盖索引。

即使无可避免地要回表,你也尽可能用limit、 where限定一下回表的次数,就从联合索引里筛选少数数据,再回表,这样性能好一点。

以上是关于阿里三面:MySQL回表的性能伤害有多大?的主要内容,如果未能解决你的问题,请参考以下文章

mysql 数据库可以有多大

在性能开始下降之前 MySQL 数据库可以有多大

“if”语句对性能有多大影响?

普通公司员工的编程水平与阿里巴巴有多大差距?

阿里二面:MySQL索引是怎么支撑千万级表的快速查找?

高性能MySQL--创建高性能的索引