hive中,动态添加map和reduce的大小,以增加并行度

Posted HarkLee

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了hive中,动态添加map和reduce的大小,以增加并行度相关的知识,希望对你有一定的参考价值。

map是配置mapred.max.split.size,来定义map处理文件的大小,默认是256000000字段,换算就是256M。  如果想增加map的并行度,那么就是减少map处理文件的大小即可。 即set mapred.max.split.size=xxx(更小的字节)

 

reduce和map是一致的,修改hive.exec.reducers.bytes.per.reducer这个参数

以上是关于hive中,动态添加map和reduce的大小,以增加并行度的主要内容,如果未能解决你的问题,请参考以下文章

hive优化之——控制hive任务中的map数和reduce数

Hive中Map任务和Reduce任务数量计算原理

Hive中Map任务和Reduce任务数量计算原理

关于hive当中的map输入数据和reduce输出数据的合并。

hive设置map和reduce数量

hive如何调整map数和reduce数