使用元组进行 Pig 编程

Posted

技术标签:

【中文标题】使用元组进行 Pig 编程【英文标题】:Pig Programming with Tuples 【发布时间】:2014-07-06 12:13:41 【问题描述】:

如何从 UDF 返回元组?

我知道如何从 UDF 返回一个字符串。

谁能通过一个简单的例子向我解释如何从 UDF 返回元组?

【问题讨论】:

【参考方案1】:

只需用下面的元组替换字符串..

public class YourUdf extends EvalFunc<Tuple> 

    public Tuple exec(Tuple input) throws IOException 

             DefaultTuple dt = new DefaultTuple();//creating tuple object

            //using tuple object you can add the values

                              //your code here;

             return dt;
        


【讨论】:

【参考方案2】:

使用 Python UDF,您的 @outputSchema 定义了它是一个元组或字符串。示例:

@outputSchema("record: (Id, name, age)")

【讨论】:

以上是关于使用元组进行 Pig 编程的主要内容,如果未能解决你的问题,请参考以下文章

使用 pig,如何将混合格式的行解析为元组和一袋元组?

无法使用 Pig 中的 Elephant Bird 访问带有包和元组的嵌套 JSON

apache pig Java UDF - 更改属性中的值似乎并没有坚持

如何将 Pig 元组拆分为子元组?

在 Pig 中投影分组元组

Pig - FilterFunc 不采用整个元组