MapReduce编程之实例分析:wordCount

Posted ws1149939228

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了MapReduce编程之实例分析:wordCount相关的知识,希望对你有一定的参考价值。

1.WordCount程序任务

  输入:一个包含大量单词的文本文件

  输出:文件中没个单词及出现的次数(频数),并按照单词顺序排序每个单词和其频数占一行,单词和频数之间有间隔

2.WordCount程序设计思路

  WordCount可以使用MapReduce去做

  在/usr/local/目录下创建WordCount文件夹

  mkdir /usr/local/wordcount

技术图片

   切换到指定文件夹,创建文件

  vim file1.txt   vim file2.txt

技术图片  技术图片

   在Hdfs中创建一个input文件夹

技术图片

   把刚才创建的两个文件上传到input里

  hadoop fs -put *.txt /input

技术图片

   运用wordcount程序

  hadoop的jar文件中默认已帮助我们提供了wordcount程序,都位于/usr/local/hadoop/hadoop-2.8.0/share/hadoop/mapreduce

 技术图片

   #切换目录

  cd /usr/local/hadoop/hadoop-2.8.0/share/hadoop/mapreduce

  #运行jar包程序

  hadoop jar hadoop-mapreduce-examples-2.8.0.jar wordcount /input/ /putout/

  #查看运行结果

  hadoop fs -cat /putout/part-r-00000

技术图片

以上是关于MapReduce编程之实例分析:wordCount的主要内容,如果未能解决你的问题,请参考以下文章

hadoop之mapreduce编程实例(系统日志初步清洗过滤处理)

大数据技术之MapReduce

Hadoop MapReduce编程 API入门系列之邮箱统计分析(十九)

大数据之MapReduce分布编程模型之函数式编程范式

Hadoop MapReduce编程 API入门系列之Crime数据分析(二十五)(未完)

MapReduce分布编程模型之函数式编程范式