按 Hive 中的列分组

Posted

技术标签:

【中文标题】按 Hive 中的列分组【英文标题】:Group by a column in Hive 【发布时间】:2019-05-27 17:52:55 【问题描述】:

我正在尝试编写一个配置单元查询来解决以下问题。我可以得到一些解决问题的建议吗?

我有一个包含 3 列(ID、代码、金额)的销售表。我想按 ID 列分组,并将与 ID 相关的代码和金额放在一行中。

示例输入

ID  codes   amount

100  20      30
100  10      15
100  11      12
200  30      40
200  40      50

预期输出

Id  code1 code2 code3 amount1 amount2 amount3

100  20    10    11     30      15      12
200  30    40           40      50

【问题讨论】:

阅读此答案:***.com/a/52191974/2700344 【参考方案1】:

你需要做的你可以得到更多detail

【讨论】:

以上是关于按 Hive 中的列分组的主要内容,如果未能解决你的问题,请参考以下文章

使用 Python,如何按小时对 Dataframe 中的列进行分组?

如何比较按一列分组的 SQL 中的列值?

查找列的最大值,按不同表中的列分组

如何按范围对csv文件中的列进行分组并使用python绘制直方图?

Hive 中的联合分组结果集

加入和分组依据 - 选择列表中的列无效