如何在 apache pig 中将列添加到已经存在的表中

Posted

技术标签:

【中文标题】如何在 apache pig 中将列添加到已经存在的表中【英文标题】:How to add a column to an already existing table in apache pig 【发布时间】:2013-09-20 06:26:51 【问题描述】:

我已经有一个使用 Pig 创建的表。现在我想在每一行(记录)中添加一个随机数,以便为我提供一个包含此添加列的新表。

这可能吗?怎么做?

【问题讨论】:

【参考方案1】:

您可以为此目的使用RANDOM UDF。 例如:

A = ...
B = foreach A generate (int)(RANDOM()*100.0) as rnd, [other fields...]

【讨论】:

感谢您发布此内容。

以上是关于如何在 apache pig 中将列添加到已经存在的表中的主要内容,如果未能解决你的问题,请参考以下文章

Apache Pig,抑制“输出位置验证失败”“输出目录......已经存在”

如何在 PIG 中将 XLSX 文件转换为 CSV 文件?

在单个实例中将 pig 输出存储到 Hive 表中

如何在 PIG 中将变量与一些硬编码值连接起来

当键分为列时,如何在 Apache Pig 中加入两个商店?

我可以在 Apache Pig Latin 中将命令拆分为多行吗?