Group by 和distinct对比

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Group by 和distinct对比相关的知识,希望对你有一定的参考价值。

**  Group by 和distinct对比**

CREATE TABLE sbtest1 (
id int(11) NOT NULL AUTO_INCREMENT,
k int(11) NOT NULL DEFAULT ‘0‘,
c char(120) NOT NULL DEFAULT ‘‘,
pad char(60) NOT NULL DEFAULT ‘‘,
PRIMARY KEY (id),
KEY k_1 (k)
) ENGINE=InnoDB AUTO_INCREMENT=10000001 DEFAULT CHARSET=utf8;
1000w数据量

1、  对于主键

Group by的执行计划
技术分享图片
Distinct的执行计划
技术分享图片
可以看到group by使用了主键,而distinct使用了辅助索引k_1
这说明了distinct可能是一种统计操作,也就是Innodb在有辅助索引时候,统计会走辅助索引,如下图,进行count(*)也是走的k_1辅助索引。
技术分享图片

2、  对于辅助索引

Group by的执行计划
技术分享图片
Distinct的执行计划
技术分享图片
通过以上对比,可以看出来他们是等价的,执行计划一致。

3、  对于普通字段

Group by的执行计划,这里做了一个order by null的处理,就是不排序
技术分享图片
Distinct的执行计划,按理说,如果distinct要是统计的话为啥没有走k_1
技术分享图片
通过以上对比,可以看出来也是等价的,执行计划一致。

4、  Group by 需要聚合,而distinct不需要聚合

5、  Group by 比 distinct效率高,distinct需要读取所有记录,而group by只需要读取分组的

数量的记录。
set profiling=1;
select distinct(k) from sbtest1
select k from sbtest1 group by k
再通过show profiles查看
技术分享图片
Group by比distinct快了0.05秒多

以上是关于Group by 和distinct对比的主要内容,如果未能解决你的问题,请参考以下文章

distinct和group by的区别

group by与distinct有何区别

在 Access 2007 SQL 中的 Group By 聚合函数中计数 Distinct

sqlserver 用distinct和group by哪个效率高

distinct 和 group by那个执行时间更快一点?

sql 中,distinct 和 group by 的效率,哪个更快