Hadoop集群配置及启动
Posted 米有奶油的小蛋糕
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Hadoop集群配置及启动相关的知识,希望对你有一定的参考价值。
一、搭建完全分布式hadoop集群,我们先来实现如下集群的配置:
配置前我们介绍一下配置文件:
以下所有的配置文件都在hadoop安装目录下etc文件中,路径如下:
/opt/module/hadoop-3.1.3/etc/hadoop/
我们需要配置的文件如下:
core-site.xml :1、NameNode的地址 2、Hadoop数据存储目录
hdfs-site.xml :1、NameNode和2NN对外web访问地址
yarn-site.xml:1、指定MapReduce的协议 2、指定ResourceManger的地址 3、添加Maperd环境变量的继承(此项hadoop3.2以上版本可以无需指定)
mapred-site.xml :1、指定MapReduce程序运行在Yarn上
好了,到现在为止,我们搭建了一台服务器,其他两台的配置我们用集群分发脚本分发一下(脚本见之前的文章)。
二、启动集群
1、格式化NameNode
如果是第一次启动集群,我们在含有NameNode的服务器上先格式化NameNode( 注意 : 格 式 化 NameNode , 会 产 生 新的集群 id , 导 致 NameNode 和 DataNode 的集群 id 不 一 致 , 集群 找 不 到已 往 数据。 如果集群在 运 行过程中 报错 , 需 要 重 新 格 式 化 NameNode 的 话 , 一定要 先 停止 namenode 和 datanode 进程, 并 且 要 删 除所有 机 器的 data 和 logs 目 录 , 然后再 进行 格 式 化 。 及停服务、删文件、格式化)
hdfs namenode -format
结果展示:出现存数据的Data文件、logs日志文件
2、启动HDFS
sbin/start-dfs.sh
jps
结果如下:
hadoop001上启动NameNode、DataNode
hadoop002上启动ResourceManager、DataNoda
hadoop上启动YARN:
sbin/start-yarn.sh
hadoop003上启动了DataNade、SecondaryNode
3、查看Web端HDFS的NameNode和YARN的ResourceManager
首先关闭服务器防火墙
sudo systemctl stop firewalld.service
浏览器输入http://hadoop001:9870查看HDFS信息
浏览器输入http://hadoop002:8088查看ResourceManager信息
至此,hadoop完全分布式搭建完成!
以上是关于Hadoop集群配置及启动的主要内容,如果未能解决你的问题,请参考以下文章