hadoop伪分布式

Posted 2021-12-07 jsg-1262534563

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了hadoop伪分布式相关的知识，希望对你有一定的参考价值。

1、传输jdk和Hadoop压缩包

2、解压jdk和hadoop压缩包

3、配置jdk环境和hadoop环境并生效

4、单机模式配置hadoop -env.sh：本地模式没有HDFS和Yarn，配置JDK后MapReduce能够运行java程序。

5、Hadoop伪分布式模式配置

一、5个配置文件

①core-site.xml

<property>
        <name>fs.defaultFS</name>
        <value>hdfs://bigdata128:9000</value>
</property>

<property>
        <name>hadoop.tmp.dir</name>
        <value>/opt/module/hadoop-2.7.3/tmp</value>
</property>

②hdfs-site.xml

<property>
      <name>dfs.replication</name>
      <value>1</value>
</property>

<property>
         <name>dfs.namenode.secondary.http-address</name>
         <value>bigdata128:50090</value>
</property>

③mapred-site.xml(该配置文件不存在，先复制)
cp mapred-site.xml.template mapred-site.xml

<property>
   <name>mapreduce.framework.name</name>
   <value>yarn</value>
</property>

④yarn-site.xml

<property>
   <name>yarn.resourcemanager.hostname</name>
   <value>bigdata128</value>
</property>

<property>
   <name>yarn.nodemanager.aux-services</name>
   <value>mapreduce_shuffle</value>
</property>

⑤Slaves文件里使用默认localhost，或者添加 bigdata128（既是NameNode又是DataNode）
注：如果Slaves文件为空，就没有DataNode和NodeManager。
⑥修改\etc\hosts配置文件
运行命令 vi \etc hosts
注释掉已有内容，添加虚拟机的ip及对应主机名：
192.168.163.128 bigdata128
⑦修改\etc\hostname配置文件
运行命令 vi \etc hostname
添加虚拟机的主机名：
bigdata128
重启虚拟机，主机名生效。

6、格式化：hdfs namenode -format

7、启动：start-all.sh

8、查看伪分布式配置是否成功：

①执行ll，查看/opt/module/hadoop-2.7.3/tmp/dfs目录，如下图所示，则正确。
②执行jps，如下图所示，NameNode、DataNode、SecondaryNameNode、ResourceManager、NodeManager如果全部启动，伪分布式配置成功。

以上是关于hadoop伪分布式的主要内容，如果未能解决你的问题，请参考以下文章

搭建spark伪分散式需要先搭建hadoop吗

Hadoop中单机模式和伪分布式的区别是啥

我做hadoop伪分布式的时候，将本地文件上传到dfs中去，但是老是提示不存在，还请大神帮忙看一下。

Hadoop安装最后一步~Hadoop伪分布式配置

Hadoop伪分布式配置

Hadoop 配置-Hadoop伪分布式配置