MapReduce_input阶段

Posted lihui001

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了MapReduce_input阶段相关的知识,希望对你有一定的参考价值。

Input阶段将数据节点上的数据进行反序列化,然后划分切片。

数据切片:(1)一个job的map阶段并行度由客户端在提交job时的切片数决定

     (2)每个切片分配一个MapTask并行实例处理

     (3)默认情况下,切片的大小等于BlockSize,也就是数据块大小

技术图片

 

 

 

     

 

以上是关于MapReduce_input阶段的主要内容,如果未能解决你的问题,请参考以下文章

python python-get-count-by-date-mapreduce.py

sparksql 概述

HDFSYARNMapreduce简介

常见分布式文件系统

分布式文件系统介绍

Hive基础架构