何时使用 Hive 引擎 MR,何时使用 TEZ?

Posted

技术标签:

【中文标题】何时使用 Hive 引擎 MR,何时使用 TEZ?【英文标题】:When to use Hive engine MR and when to use TEZ? 【发布时间】:2016-07-02 00:38:01 【问题描述】:

在什么情况下使用 Hive 引擎 TEZ 优于 MR?

各有什么优缺点?

【问题讨论】:

【参考方案1】:

TEZ 与 MR 相同,只是速度更快。查询越复杂,TEZ 的好处就越大。所以 TEZ 在工作时总是更可取。

Tez 通过为单个作业提供执行复杂 DAG(有向无环图)任务的能力,将 MapReduce 范式推广到更强大的框架。 当计划通过 map-reduce 原语实现时,不可避免地存在许多作业边界,这会为持久存储和作业启动引入读/写开销,并且可能会错过简单的优化机会,例如工作节点重用和暖缓存.

当然,在您的 TEZ 版本中还有一些错误尚未解决 - 这是您在 TEZ 上实施某些特定解决方案时可能面临的唯一问题。

虽然 MR 更成熟,但 Hive-on-MR 在 Hive 2 中已弃用,并且可能在未来的版本中不可用。

另请阅读:

Difference between MR and Tez

还有这个:

Introducing Tez

【讨论】:

以上是关于何时使用 Hive 引擎 MR,何时使用 TEZ?的主要内容,如果未能解决你的问题,请参考以下文章

配置 Hive On Tez

Hive常用参数

USDP使用笔记设置Hive on Tez解决return code 2 from org.apache.hadoop.hive.ql.exec.mr.MapRedTask问题

USDP使用笔记设置Hive on Tez解决return code 2 from org.apache.hadoop.hive.ql.exec.mr.MapRedTask问题

从 Beeline 连接时,Hive 查询在 Tez 上失败,但在 Map-Reduce 上成功

Hive 使用Tez引擎的配置