hive分组排序函数 分组取top10

Posted 跳出

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了hive分组排序函数 分组取top10相关的知识,希望对你有一定的参考价值。

hive分组排序函数 分组取top10

语法:row_number() over( partition by 字段a order by 计算项b desc) rank

--这里rank是别名

Partition by:类似hive的建表,分区的意思

这里按字段a分区,对计算项b进行降序排序

实例:

要取top10品牌,各品牌的top10渠道,各品牌的top10渠道中各渠道的top10档期

1) 取top10品牌

Select 品牌,count/sum/其他() as num from tb_name order by num limit 10;

2) 取top10品牌下各品牌的top10渠道

Select a.* from(

Select 品牌,渠道,count/sum/其他() as num, row_number() over(partition by 品牌,order by num desc) rank

From tb_name

Where 品牌限制条件

Group by 品牌,渠道

)a

Where a.rank<=10;

3) 取top10品牌下各品牌的top10渠道中各渠道的top10档期

Select a.* from(

Select 品牌,渠道,档期,count/sum/其他() as num, row_number() over(partition by 品牌,渠道,order by num desc) rank

From tb_name

Where 品牌,渠道 限制条件

Group by 品牌,渠道,档期

)a

Where a.rank<=10;

 

以上是关于hive分组排序函数 分组取top10的主要内容,如果未能解决你的问题,请参考以下文章

hive分组取随机数

Hive窗口函数

hive中分组计算top N.

Clickhouseclickhouse 开窗函数 last_value first_value 分组排序 top值

hive 和 mysql 求解分组 top n

hive 和 mysql 求解分组 top n