大数据3.1hadoop本地运行

Posted 2022-12-19 dddd_疾

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了大数据3.1hadoop本地运行相关的知识，希望对你有一定的参考价值。

目标

1.运行wordcount

1）Hadoop官方网站：http://hadoop.apache.org/
2）Hadoop运行模式包括：本地模式、伪分布式模式以及完全分布式模式。
本地模式：单机运行，只是用来演示一下官方案例。生产环境不用。
伪分布式模式：也是单机运行，但是具备Hadoop集群的所有功能，一台服务器模拟一个分布式的环境。个别缺钱的公司用来测试，生产环境不用。
完全分布式模式：多台服务器组成分布式环境。生产环境使用

首先进入hadoop目录
然后输入
mkdir wcinput
创建wcinput这个文件夹

进入wcinput
在里创建一个Word.txt
vim word.txt

在里面随便输入点单词

保存退出后
回到hadoop目录
注意wcoutput不能存在
输入
sbin/hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-3.3.4.jar wordcount wcinput wcoutput

进入wcoutput
里面有这个两文件输入
cat part-r-00000
可以查看统计的结果

如果wcoutput存在就会报错

以上是关于大数据3.1hadoop本地运行的主要内容，如果未能解决你的问题，请参考以下文章

大数据-Hadoop 本地运行模式

大数据技术之_03_Hadoop学习_02_入门_Hadoop运行模式+本地运行模式+伪分布式运行模式+完全分布式运行模式(开发重点)+Hadoop编译源码(面试重点)+常见错误及解决方案(示例代(代

大数据讲课笔记3.1 Hadoop安装准备

大数据 hadoop 三种运行模式的区别、及详细配置讲解

打怪升级之小白的大数据之旅(四十三)＜Hadoop运行模式(集群搭建)＞

2021年大数据Hadoop（十八）：MapReduce程序运行模式和深入解析