Hadoop Mapper参数含义

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Hadoop Mapper参数含义相关的知识,希望对你有一定的参考价值。

我是Hadoop的新手并且对参数有疑问:对于单词计数示例,请参阅下面的代码片段:

public static class TokenizerMapper
   extends Mapper<LongWritable, Text, Text, IntWritable> {

   .....

   public void map(LongWritable key, Text value, Context context) throws IOException, InterruptedException 
   {
       .......
   }
}

我知道“value”参数是从文件读取的行,但“key”参数是什么意思?它对应的是什么?

为什么它的类型是LongWritable?

通过搜索文档我浪费了几个小时,有人可以帮忙吗?

答案

关键是LongWritable类型,因为wordcount程序将输入作为TextInputFormat

根据JavDocTextInputFormat

纯文本文件的InputFormat。文件分为几行。换行或回车用于发出行尾信号。键是文件中的位置,值是文本行。

根据定义,假设你的文字是

We are fine.
How are you?
All are fine.

然后输入到映射器

关键:1价值:We are fine.

键:14值:How are you?(第一行包含换行符约13个字符,因此行位置为14)

键:28值:All are fine.(第二行中还有大约13个字符,包括换行符,因此自文件开头以来的行位置为28)

以上是关于Hadoop Mapper参数含义的主要内容,如果未能解决你的问题,请参考以下文章

hadoop三个配置文件的参数含义说明

hadoop三个配置文件的参数含义说明

MyBatis之Mapper XML 文件详解-sql和入参

运用MRUnit测试mapper和reducer

SpringBoot启动报错“Consider defining a bean of type ‘xxx.mapper.UserMapper‘ in your configuration.“(代码片段

hadoop的mapreduce常见算法案例有几种