如何在MR作业中配置映射以批量执行?

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了如何在MR作业中配置映射以批量执行?相关的知识,希望对你有一定的参考价值。

Map-reduce作业生成几个映射器并在Yarn中运行。如何批量运行这些映射器。假设MR作业产生了100个地图,如何一次只运行10个,以及如何配置下一个10个地图集,以便在前一个集完成后进行拾取。目前所有映射器都是并行运行的。

答案

如果您使用的是Hadoop 2.7或更高版本,则可以使用mapreduce.job.running.map.limit属性来限制同时运行的映射器数量

以上是关于如何在MR作业中配置映射以批量执行?的主要内容,如果未能解决你的问题,请参考以下文章

如何在 Jenkins 作业中获取 MR 的所有 GitLab 评论

如何在 Amazon EMR 集群上远程提交 hadoop MR 作业

MR1和MR2的工作原理

如何使用新 API 以编程方式获取 Hadoop 集群中所有正在运行的作业?

map-reduce 如何在 HDFS 与 S3 上工作?

长时间运行的作业不应阻止合并 MR