Hadoop Pig 自定义键名
Posted
技术标签:
【中文标题】Hadoop Pig 自定义键名【英文标题】:Hadoop Pig customize the key name 【发布时间】:2013-08-08 20:07:41 【问题描述】:例如,我有一个这样的输入文件:
xxx,14
yyy,20
zzz,11
我想对第二个字段和输出求和。现在我知道如何使用 Hadoop Pig 对其求和,但我想要这样的输出:
Canada,45
所以这意味着我自己将键名设置为“加拿大”并添加 SUM 作为值。如何自己设置键名?
【问题讨论】:
【参考方案1】:只需应用一个常量字段:
A = load 'data.txt' using PigStorage(',') as (txt:chararray, num:int);
B = group A ALL;
C = foreach B generate 'Canada' as country:chararray, SUM(A.num) as total:int;
【讨论】:
以上是关于Hadoop Pig 自定义键名的主要内容,如果未能解决你的问题,请参考以下文章