MapReduce实验——WordCount

Posted dream0-0

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了MapReduce实验——WordCount相关的知识,希望对你有一定的参考价值。

实验要求及步骤

  参考博客:https://blog.csdn.net/qq_41035588/article/details/90514824,但是创建的项目是Map/Reduce项目。其实创建Java项目也可以做,只是需要导入Map/Reduce项目所需要的jar包。

运行结果截图

技术图片

 出现的问题及解决办法

文件buyer_favorite在eclipse上打开会出现空格乱码的情况,但是不影响本次实验,可以忽略不计。或者也可以将空格改为其它间隔符,如“|”。

eclipse里不能对Hadoop上的文件进行创建操作(创建新文件夹,上传文件和文件夹),只能查看和删除。原因是权限不够,需要关闭Hadoop后修改hdfs-site.xml文件再开启Hadoop。

<configuration>
    <property>
             <name>dfs.replication</name>
             <value>1</value>
        </property>
        <property>
             <name>dfs.namenode.name.dir</name>
             <value>file:/home/hadoop/local/hadoop/tmp/dfs/name</value>
        </property>
        <property>
             <name>dfs.datanode.data.dir</name>
             <value>file:/home/hadoop/local/hadoop/tmp/dfs/data</value>
        </property>
        <property>
             <name>dfs.permissions</name>
             <value>false</value>
        </property>
</configuration>

林子雨的Hadoop配置教程里只有前三项,需要再加上高亮区域那一项。

 

以上是关于MapReduce实验——WordCount的主要内容,如果未能解决你的问题,请参考以下文章

MapReduce之WordCount实战——统计某电商网站买家收藏商品数量

Hadoop- Wordcount程序原理及代码实现

MapReduce编程实践——WordCount运行实例(Python实现)

mapreduce

MapReduce编写wordcount程序代码实现

MapReduce编程初步(WordCount,TopN)