Hadoop Pig 自定义键名

Posted

技术标签:

【中文标题】Hadoop Pig 自定义键名【英文标题】:Hadoop Pig customize the key name 【发布时间】:2013-08-08 20:07:41 【问题描述】:

例如,我有一个这样的输入文件:

xxx,14
yyy,20
zzz,11

我想对第二个字段和输出求和。现在我知道如何使用 Hadoop Pig 对其求和,但我想要这样的输出:

Canada,45

所以这意味着我自己将键名设置为“加拿大”并添加 SUM 作为值。如何自己设置键名?

【问题讨论】:

【参考方案1】:

只需应用一个常量字段:

A = load 'data.txt' using PigStorage(',') as (txt:chararray, num:int);
B = group A ALL;
C = foreach B generate 'Canada' as country:chararray, SUM(A.num) as total:int;

【讨论】:

以上是关于Hadoop Pig 自定义键名的主要内容,如果未能解决你的问题,请参考以下文章

Hadoop相关项目Hive-Pig-Spark-Storm-HBase-Sqoop

Pig和Hive的对比

大数据笔记(十八)——Pig的自定义函数

使用自定义键名映射通用多对多

Pig用户自定义函数(UDF)转

在 Spring Boot 中自定义 JSON 响应以更改键名