Pig: Pivoting & Sum 3 关系

Posted

技术标签:

【中文标题】Pig: Pivoting & Sum 3 关系【英文标题】:Pig: Pivoting & Sum 3 relations 【发布时间】:2016-05-19 06:24:09 【问题描述】:

我有 3 种不同的关系,如下所述,我可以使用 UDF 获得输出,但在 PIG 中寻找实现。在论坛中提到了其他东西,但没有得到关于这个问题的具体想法。

过程:

FN1,10
FN2,20
FN3,23
FN4,25
FN5,15
FN7,40
FN10,56

拒绝:

FN1,12
FN2,13
FN3,33
FN6,60
FN8,23
FN9,44
FN10,4

所有FN:

FN1
FN2
FN3
FN4
FN5
FN6
FN7
FN8
FN9
FN10

需要的输出是:

FN1,10,12,22
FN2,20,13,33
FN3,23,33,56
FN4,25,0,25
FN5,15,0,15
FN6,0,60,60
FN7,40,0,40
FN8,0,23,23
FN9,0,44,44
FN10,56,4,60

【问题讨论】:

【参考方案1】:

假设您的关系在 test.txt test2.txt 和 test3.txt 中

A = LOAD 'test.txt' using PigStorage(',');
B = LOAD 'test2.txt' using PigStorage(',');
C = LOAD 'test3.txt' using PigStorage(',');
D = COGROUP A by $0, B by $0;
E = COGROUP C by $0, D by $0;
F = FOREACH E generate $0, FLATTEN(D.A), FLATTEN(D.B);
G = FOREACH F generate $0, $1.$1, $2.$1;
H = FOREACH G generate $0, FLATTEN((IsEmpty($1)?null:$1)), FLATTEN((IsEmpty($2)?null:$2));
I = foreach H generate $0, ($1 is null?0:$1),($2 is null?0:$2),($1 is null?0:$1)+($2 is null?$0:$2);
dump I;

输出

(FN1,10,12,22)
(FN2,20,13,33)
(FN3,23,33,56)
(FN4,25,0,)
(FN5,15,0,)
(FN6,0,60,60)
(FN7,40,0,)
(FN8,0,23,23)
(FN9,0,44,44)
(FN10,56,4,60)

【讨论】:

【参考方案2】:

您可以使用 COGROUP 来实现这一点

【讨论】:

以上是关于Pig: Pivoting & Sum 3 关系的主要内容,如果未能解决你的问题,请参考以下文章

数学pivoting求矩阵逆

SUM 函数上的 Pig 错误

从 PIG 中的 SUM 中获取 MAX

PIG 中的 SUM 函数

Apache Pig 中的 SUM

无法在 Pig 中使用 max 和 sum 函数