PIG 脚本、Hive 查询和相应 MapReduce 代码的包装代码

Posted

技术标签:

【中文标题】PIG 脚本、Hive 查询和相应 MapReduce 代码的包装代码【英文标题】:Wrapping code for PIG script,Hive Queries and Corresponding MapReduce code 【发布时间】:2015-04-11 07:26:03 【问题描述】:

我正在处理 2 个数据集。我已经 MapReduce 那些,然后通过 PIG 和 HIVE 对输出进行操作。我想按顺序一次执行所有这些步骤。我应该如何将这些东西包装到一个脚本中,即 Map减少代码,然后是 PIG 脚本,最后是几个 Hive 查询。

谢谢, 克坦

【问题讨论】:

【参考方案1】:

您需要将它们封装在 Oozie 工作流程中。 Oozie 使您能够运行在 DAG 中排列的操作集合 - 检查 this link

他们有很好的文档,所以你可以从那开始。

【讨论】:

以上是关于PIG 脚本、Hive 查询和相应 MapReduce 代码的包装代码的主要内容,如果未能解决你的问题,请参考以下文章

通过 pig 脚本删除 hive 表分区

对存储在 Hive 中的数据运行 Pig 查询

Hive--简介

大数据 hadoop pig hive 关系

hive、pig、map-reduce 用例之间的区别

PL/SQL 能否可靠地转换为 Pig Latin 或带有 Pig Latin 和 Hive 的 Oozie 管道