partition by和group by的区别和对比

Posted 晨云寒

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了partition by和group by的区别和对比相关的知识,希望对你有一定的参考价值。

今天大概弄懂了partition bygroup by的区别联系。

1. group by是分组函数partition by是分析函数(然后像sum()等是聚合函数);

2. 在执行顺序上,

以下是常用sql关键字的优先级

from > where > group by > having > order by

partition by应用在以上关键字之后,实际上就是在执行完select之后,在所得结果集之上进行partition

3. partition by相比较于group by,能够在保留全部数据的基础上,只对其中某些字段做分组排序(类似excel中的操作),而group by只保留参与分组的字段和聚合函数的结果(类似excel中的pivot)。

partition by

group by

4. 如果partition结果上聚合,千万注意聚合函数是逐条累计运行结果!而在group by后的结果集上使用聚合函数,会作用在分组下的所有记录上

数据如下,

SQL1

select 
    a.cc,
    a.item,
    sum(a.num)
from table_temp a
group by a.cc,a.item

Result1

11条记录经group by后为10条,其中cc='cn' and item='8.1.1'对应的两条记录的num汇总成值3.

SQL2

select 
    a.cc,
    a.num, 
    min(a.num) over (partition by a.cc order by a.num asc) as amount
from table_temp a
group by a.cc,a.num;


select 
    a.cc,
    a.num, 
    min(a.num) over (partition by a.cc order by a.num desc) as amount
from table_temp a
group by a.cc,a.num;

Result2

  

两个sql的唯一区别在于a.num的排序上,但从结果红框中的数据对比可以看到amount值并不相同,且第二个结果集amount并不都是最小值1。

在这里就是要注意将聚合函数用在partition后的结果集上时,聚合函数是逐条累积计算值的!

其实partition by常同row_number() over一起使用,

select 
    a.*,
    row_number() over (partition by a.cc,a.item order by a.num desc) 
as seq
from table_temp a

清醒时做事,糊涂时读书,大怒时睡觉,独处时思考; 做一个幸福的人,读书,旅行,努力工作,关心身体和心情,成为最好的自己 -- 共勉

以上是关于partition by和group by的区别和对比的主要内容,如果未能解决你的问题,请参考以下文章

partition by和group by的区别和对比

oracle分析函数over partition by 和group by的区别

关于sql当中的group by 和partition by 的区别。

sqlserver中分区函数 partition by与 group by 区别 删除关键字段重复列

over partition by与group by 的区别

Oracle LISTAGG() 聚合查询用法 GROUP BY 和 PARTITION BY 的使用和比较