MapReduce ChainMapper/ChainReducer

Posted mzzcy

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了MapReduce ChainMapper/ChainReducer相关的知识,希望对你有一定的参考价值。

The ChainMapper class allows to use multiple Mapper classes within a single Map task

The ChainReducer class allows to chain multiple Mapper classes after a Reducer within the Reducer task.

 

  没有Chain之前,只能通用多个Job迭代来实现数据递进处理,这样做的缺点是:

    a. 每次迭代,如果所有 Job 对象重复创建,代价将非常高。

    b. 每次迭代,数据的 I/O和网络传输的代价比较大;

 

MapReduce工作流三种方式:迭代;JobControl依赖;Chain链式结构;

 

--------

示例参考:http://www.iteye.com/topic/1134144 (多个mapper执行不同操作,reducer合并处理后,再对唯一字段进行处理)

       http://blog.csdn.net/genghaihua/article/details/46910865

  

 

以上是关于MapReduce ChainMapper/ChainReducer的主要内容,如果未能解决你的问题,请参考以下文章

什么是MapReduce?MapReduce整体架构搭建使用介绍

[hadoop]怎么把两个mapreduce工程合起来

MapReduce 知识

MapReduce(6)特性

mapreduce 数据去重 问题

MapReduce mapreduce基础入门