namenode启动失败,这是啥原因

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了namenode启动失败,这是啥原因相关的知识,希望对你有一定的参考价值。

1、不小心把namenode节点服务器shutdown了,重启服务器后,启动hadoop发现namenode节点无法启动,50070端口无法访问,50030端口正常。
这种情况下只好去看namenode日志了,下载日志文件到本地查看
2、在hadoop的logs目录下
查看发现是主节点上的一个文件权限不是hadoop的,启动时报错:java.io.FileNotFoundException: /usr/local/hadoop/dfs/name/current/VERSION (Permission denied)
3、查看此路径文件发现问题
4、对于该问题直接chown -R进行权限修改即可,如上图红线标示
5、至此,在启动hadoop即可启动namenode节点,启动后进入了安全模式
解决方案:$bin/hadoop dfsadmin -safemode leave #关闭safe mode
这样,就解决了namenode 无法启动的问题。
5、这里注意,后期关闭服务器时,一定要先将hadoop集群关闭后才能关闭服务器,不然容易出现很多问题。我这里是出现的namenode无法启动,可能还有其他的问题,出了问题一定去日志中看出了什么问题,然后才能对症下药解决。
参考技术A 应该format的时候就会出现问题,楼主需要检测下权限和配置文件。贴出自己认为不对内容。否则无法定位。
然后再看看有没有namenode, 有没有初始化

多次NameNode执行format后DataNode启动不了解决方案

1.问题

执行start-dfs.sh后在进程中查看jps,发现NameNode启动,但DataNode没有

2.原因

在失败的.log文件中看到datanode的clusterID 和 namenode的clusterID 不一致

原因可能是多次Hadoop namenode -format导致clusterID不一致

3.解决方法

1)先去hadoop路径下的配置文件hdfs-site.xml可知dfs.namenode.name.dir的地址和dfs.datanode.data.dir的地址

默认:file://$hadoop.tmp.dir/dfs/name、file://$hadoop.tmp.dir/dfs/data

2)在.../name/current/VERSION 中获得clusterID

[root@hadoop201 current]# more VERSION 
#Mon Sep 02 18:06:26 CST 2019
namespaceID=1033971221
clusterID=CID-98e754ef-ad92-49f8-88b2-6830888f2d48
cTime=0
storageType=NAME_NODE
blockpoolID=BP-1400239548-192.168.1.201-1567418785939
layoutVersion=-63

3)将clusterID修改到.../dfs/data/current/VERSION

[root@hadoop201 current]# vi VERSION 
#Sun Sep 01 19:46:01 CST 2019
storageID=DS-330d79ed-7c1b-4d40-b151-81ffcadcf9f0
#clusterID=CID-ae479da3-0b1e-44b0-a383-029a213b3481
clusterID=CID-98e754ef-ad92-49f8-88b2-6830888f2d48
cTime=0
datanodeUuid=67fcc2ae-1b74-46cd-90df-336a0b1950e6
storageType=DATA_NODE
layoutVersion=-56

4)再次启动DataNode,成功启动

[root@hadoop201 hadoop-2.7.2]# sbin/hadoop-daemon.sh start datanode
starting datanode, logging to /opt/module/hadoop-2.7.2/logs/hadoop-root-datanode-hadoop201.com.out
[root@hadoop201 hadoop-2.7.2]# jps
11525 DataNode
10809 QuorumPeerMain
11001 NameNode
11598 Jps

 

以上是关于namenode启动失败,这是啥原因的主要内容,如果未能解决你的问题,请参考以下文章

最近有安装了一次hadoop集群,NameNode启动失败,及原因

linux mei_me启动失败是啥原因

namenode无法启动(namenode格式化失败)

namenode无法启动(namenode格式化失败)

hadoop namenode启动失败

在linux下的tomcat启动时没有报错,但一直停在装载应用那里,就一直不动了,这是啥原因呢?