Hadoop集群配置及启动

Posted 米有奶油的小蛋糕

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Hadoop集群配置及启动相关的知识,希望对你有一定的参考价值。

一、搭建完全分布式hadoop集群,我们先来实现如下集群的配置:

配置前我们介绍一下配置文件:
以下所有的配置文件都在hadoop安装目录下etc文件中,路径如下:
/opt/module/hadoop-3.1.3/etc/hadoop/

我们需要配置的文件如下:

core-site.xml :1、NameNode的地址 2、Hadoop数据存储目录

hdfs-site.xml :1、NameNode和2NN对外web访问地址

yarn-site.xml:1、指定MapReduce的协议 2、指定ResourceManger的地址 3、添加Maperd环境变量的继承(此项hadoop3.2以上版本可以无需指定)

mapred-site.xml :1、指定MapReduce程序运行在Yarn上

好了,到现在为止,我们搭建了一台服务器,其他两台的配置我们用集群分发脚本分发一下(脚本见之前的文章)。

二、启动集群

1、格式化NameNode

如果是第一次启动集群,我们在含有NameNode的服务器上先格式化NameNode( 注意 : 格 式 化 NameNode , 会 产 生 新的集群 id , 导 致 NameNode 和 DataNode 的集群 id 不 一 致 , 集群 找 不 到已 往 数据。 如果集群在 运 行过程中 报错 , 需 要 重 新 格 式 化 NameNode 的 话 , 一定要 先 停止 namenode 和 datanode 进程, 并 且 要 删 除所有 机 器的 data 和 logs 目 录 , 然后再 进行 格 式 化 。 及停服务、删文件、格式化)

 hdfs namenode  -format

结果展示:出现存数据的Data文件、logs日志文件

2、启动HDFS

sbin/start-dfs.sh
jps

结果如下:
hadoop001上启动NameNode、DataNode

hadoop002上启动ResourceManager、DataNoda
hadoop上启动YARN:

sbin/start-yarn.sh


hadoop003上启动了DataNade、SecondaryNode

3、查看Web端HDFS的NameNode和YARN的ResourceManager
首先关闭服务器防火墙

sudo systemctl stop firewalld.service

浏览器输入http://hadoop001:9870查看HDFS信息

浏览器输入http://hadoop002:8088查看ResourceManager信息

至此,hadoop完全分布式搭建完成!

以上是关于Hadoop集群配置及启动的主要内容,如果未能解决你的问题,请参考以下文章

Hadoop集群及组件

Hadoop集群的搭建及配置

hadoop集群单点启动

Hadoop多节点集群安装配置

最近有安装了一次hadoop集群,NameNode启动失败,及原因

华为云Hadoop与Spark集群环境搭建