如何运行自带wordcount-Hadoop2

Posted 2023-02-20

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了如何运行自带wordcount-Hadoop2相关的知识，希望对你有一定的参考价值。

参考技术A

1.找到examples例子
我们需要找打这个例子的位置：首先需要找到你的hadoop文件夹，然后依照下面路径：
/hadoop/share/hadoop/mapreduce会看到如下图：

hadoop-mapreduce-examples-2.2.0.jar

第二步：
我们需要需要做一下运行需要的工作，比如输入输出路径，上传什么文件等。
1.先在HDFS创建几个数据目录：

hadoop fs -mkdir -p /data/wordcount

hadoop fs -mkdir -p /output/

2.目录/data/wordcount用来存放Hadoop自带的WordCount例子的数据文件，运行这个MapReduce任务的结果输出到/output/wordcount目录中。
首先新建文件inputWord：

vi /usr/inputWord

新建完毕，查看内容：

cat /usr/inputWord

将本地文件上传到HDFS中：

hadoop fs -put /usr/inputWord /data/wordcount/

可以查看上传后的文件情况，执行如下命令：

hadoop fs -ls /data/wordcount

可以看到上传到HDFS中的文件。

通过命令

hadoop fs -text /data/wordcount/inputWord

看到如下内容：

下面，运行WordCount例子，执行如下命令：

hadoop jar /usr/hadoop/share/hadoop/mapreduce/hadoop-mapreduce-examples-2.2.0.jar wordcount /data/wordcount /output/wordcount

可以看到控制台输出程序运行的信息：

查看结果，执行如下命令：

hadoop fs -text /output/wordcount/part-r-00000

结果数据示例如下：

aboutyun@master:~$ hadoop fs -text /output/wordcount/part-r-00000

aboutyun 2

first 1

hello 3

master 1

slave 2

what 1

登录到Web控制台，访问链接http://master:8088/可以看到任务记录情况。

以上是关于如何运行自带wordcount-Hadoop2的主要内容，如果未能解决你的问题，请参考以下文章