Hive 如何使用 Grouping Sets

Posted @SmartSi

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Hive 如何使用 Grouping Sets相关的知识,希望对你有一定的参考价值。

Hive 版本:2.3.4

这篇文章描述了 SELECT 语句 GROUP BY 子句的增强聚合功能 GROUPING SETS。GROUPING SETS 子句是 SELECT 语句的 GROUP BY 子句的扩展。通过 GROUPING SETS 子句,你可采用多种方式对结果分组,而不必使用多个 SELECT 语句来实现这一目的。这就意味着,能够减少响应时间并提高性能。

在Hive 0.10.0版本中添加了 Grouping sets,CUBE 和 ROLLUP 运算符以及 GROUPING__ID 函数。参见HIVE-2397HIVE-3433HIVE-3471HIVE-3613。另外在Hive 0.11.0版本进行的优化 HIVE-3552

1. GROUPING SETS

GROUP BY 中的 GROUPING SETS 子句允许我们在同一记录集中指定多个 GROUP BY 选项。所有 GROUPING SET 子句都可以逻辑表示为 UNION 连接的几个 GROUP BY 查询。为了帮助我们快速了解 GROUPING SETS 子句的思想,我们看一下如下几个示例。

以上是关于Hive 如何使用 Grouping Sets的主要内容,如果未能解决你的问题,请参考以下文章

Hive GROUPING SETS和GROUPING__IDCUBEROLLUP

Hive GROUPING SETS和GROUPING__IDCUBEROLLUP

hive grouping sets 实现原理

hive grouping sets 等聚合函数

大数据之hive:hive新功能之GROUPING SETS,Cube, Rollup

Hive之grouping sets用法详解