非 mapreduce 应用程序如何在 YARN 中工作?
Posted
技术标签:
【中文标题】非 mapreduce 应用程序如何在 YARN 中工作?【英文标题】:How non mapreduce applications work in YARN? 【发布时间】:2015-12-30 08:44:44 【问题描述】:通过使用 YARN,我们可以运行非 mapreduce 应用程序。
但它是如何工作的呢?
在 HDFS 中,所有都存储在块中。对于每个块,将创建一个映射器任务来处理整个数据集。
但非 mapreduce 应用程序,如何在不使用 mapreduce 的情况下处理不同数据节点中的数据集?
请解释一下。
【问题讨论】:
【参考方案1】:不要将 Map reduce 范式与其他应用程序(例如 Spark)混淆。 Spark 可以在 Yarn 下运行,但不使用映射器或减速器。
它使用执行器,这些执行器知道数据局部性,就像 mapreduce 一样。
spark Driver 将在数据节点上启动执行程序,并在这样做时尽量记住数据局部性。
也不要将 Map Reduce 默认行为与标准行为混淆。您不需要在每个输入拆分中使用 1 个映射器。
HDFS 和 Map Reduce 也是两个不同的东西。 HDFS 只是存储层,而 Map Reduce 处理处理。
【讨论】:
以上是关于非 mapreduce 应用程序如何在 YARN 中工作?的主要内容,如果未能解决你的问题,请参考以下文章
如何通过Java程序提交yarn的MapReduce计算任务