combiner hadoop

Posted 2020-07-24 草莓干123456

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了combiner hadoop相关的知识，希望对你有一定的参考价值。

Combiner用来在map输出之前先做一次合并，减少map和reduce节点之间的数据传输，优化mapreduce。

Combiner相当于是一个小的reduce，如下所示

map:(key1,value1) ——> list(key2,value2)

combiner:(key2,list(value2)) ——> list(key2,value2)

reduce:(key2,list(value2)) ——> list(key3,value3)

注意一下几点：

1、如果当前集群在很繁忙的情况下job就是设置了也不会执行Combiner。

2、Combiner的输出是Reduce的输入，它绝不会改变最终的计算结果。

3、combiner的数据类型是由reduce决定的，因而输入输出是和reducer一致的。又因为combiner的输出是reducer的输入，所以reducer的输入输出的数据类型要保持一致的时候才能使用combiner，否则报错。

以上是关于combiner hadoop的主要内容，如果未能解决你的问题，请参考以下文章