MR Combiner

Posted xiangyuguan

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了MR Combiner相关的知识,希望对你有一定的参考价值。

在Mapper和Reducer之间有一个非常重要的组件Combiner。每一个map都可能会产生大量的本地输出,Combiner的作用就是对map端的输出先做一次合并,以减少在map和reduce节点之间的数据传输量,以提高网络IO性能,是MapReduce的一种优化手段之一

  • Combiner最基本是实现本地key的聚合,对map输出的key排序,value进行迭代

  • Combiner还有本地reduce功能(其本质上就是一个reduce)

  • 与mapper和reducer不同的是,combiner没有默认的实现,需要显式的设置在conf中才有作用

  • 并不是所有的job都适用combiner,只有操作满足结合律的才可设置combiner

以上是关于MR Combiner的主要内容,如果未能解决你的问题,请参考以下文章

Hbase 用mr-hdfs hdfs-mr

VR/MR ✙ 深入浅出⚡️ | 影创VR/MR 介绍

mr调优

MagicalRecord 中的 MR_saveToPersistentStoreWithCompletion 方法和 MR_saveToPersistentStoreAndWait 方法有啥区别

MR1和MR2的工作原理

Hive mapreduce SQL实现原理——SQL最终分解为MR任务,而group by在MR里和单词统计MR没有区别了