非 mapreduce 应用程序如何在 YARN 中工作?

Posted

技术标签:

【中文标题】非 mapreduce 应用程序如何在 YARN 中工作?【英文标题】:How non mapreduce applications work in YARN? 【发布时间】:2015-12-30 08:44:44 【问题描述】:

通过使用 YARN,我们可以运行非 mapreduce 应用程序。

但它是如何工作的呢?

在 HDFS 中,所有都存储在块中。对于每个块,将创建一个映射器任务来处理整个数据集。

但非 mapreduce 应用程序,如何在不使用 mapreduce 的情况下处理不同数据节点中的数据集?

请解释一下。

【问题讨论】:

【参考方案1】:

不要将 Map reduce 范式与其他应用程序(例如 Spark)混淆。 Spark 可以在 Yarn 下运行,但不使用映射器或减速器。

它使用执行器,这些执行器知道数据局部性,就像 mapreduce 一样。

spark Driver 将在数据节点上启动执行程序,并在这样做时尽量记住数据局部性。

也不要将 Map Reduce 默认行为与标准行为混淆。您不需要在每个输入拆分中使用 1 个映射器。

HDFS 和 Map Reduce 也是两个不同的东西。 HDFS 只是存储层,而 Map Reduce 处理处理。

【讨论】:

以上是关于非 mapreduce 应用程序如何在 YARN 中工作?的主要内容,如果未能解决你的问题,请参考以下文章

如何通过Java程序提交yarn的MapReduce计算任务

Hadoop详解 - HDFS - MapReduce - YARN - HA

大数据系列4:Yarn以及MapReduce 2

YARN对比MapReduce1

Yarn流程Yarn与MapReduce 1相比

YarnYarn MapReduce 程序开发