如何在 EMR 上设置减速器的数量

Posted

技术标签:

【中文标题】如何在 EMR 上设置减速器的数量【英文标题】:How to Set Number of Reducers on EMR 【发布时间】:2019-02-27 03:33:59 【问题描述】:

我有一系列 Mapper 和 Reducer 任务,我通过 aws 上的自定义 jar 步骤运行这些任务。我想只通过一个减速器运行最后一个减速器任务。我该怎么做?

【问题讨论】:

【参考方案1】:

也许:

SET mapreduce.job.reduces=XX

取自:How do you force the number of reducers in a map reduce job to be higher? - Hortonworks

或许:

SET mapred.reduce.tasks=XX

发件人:hadoop - How does Hive choose the number of reducers for a job? - Stack Overflow

【讨论】:

【参考方案2】:

我通过将 job.setNumReduceTasks(1) 放入包含我的映射器和减速器的 java 文件的 main 方法中解决了我的问题。

【讨论】:

以上是关于如何在 EMR 上设置减速器的数量的主要内容,如果未能解决你的问题,请参考以下文章

如何在 EMR 上设置并行 reducer 的数量?

EMR 上 Spark 中的 S3 减速错误

如何在 Hadoop 流中设置每个节点的最大减速器数量?

如何估算 Amazon EMR 中的实例数量?

如何在 EMR 集群引导上设置 livy.server.session.timeout?

如何在 EMR 上使用 MrJob 0.4.2 设置 IAM 角色