Hadoop Mapreduce的运行机制
Posted 李华东
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Hadoop Mapreduce的运行机制相关的知识,希望对你有一定的参考价值。
在Hadoop中,一个MapReduce作业会把输入的数据集切分为若干独立的数据块,由Map任务以完全并行的方式处理。框架会对Map的输出先进行排序,然后把结果输入给Reduce任务。作业的输入和输出都会被存储在文件系统中,整个框架负责任务的调度和监控,以及重新执行已关闭的任务。MapReduce框架和分布式文件系统是运行在一组相同的节点,计算节点和存储节点都是在一起的。
以上是关于Hadoop Mapreduce的运行机制的主要内容,如果未能解决你的问题,请参考以下文章
Hadoop之 - 剖析 MapReduce 作业的运行机制(MapReduce 2)