来自ambari的数据节点活动不稳定
Posted
技术标签:
【中文标题】来自ambari的数据节点活动不稳定【英文标题】:Data-node Alive from ambari isnt stable 【发布时间】:2018-12-05 18:04:41 【问题描述】:我们有 ambari 集群版本 - 2.6.1 和 hadoop 版本 2.6.4
datanode 的数量是 - 10
从 ambari 仪表板我们可以看到显示以下内容的窗口:
DataNodes Live
9/10
但几分钟后,所有数据节点都处于活动状态:
DataNodes Live
10/10
几分钟后我们又看到了
DataNodes Live
9/10
似乎namenode超过时间间隔没有从datanode收到心跳消息,那么datanode将被标记为“dead”
我们检查以下内容:
-
主机解析正常(DNS 正常)
IP 解析正常(DNS 正常)
HDFS服务检查成功
每个数据节点都已启动 (ps -ef | grep datanode | grep -v grep)
netstat -anp | grep '0.0.0.0:50010' 端口没问题
systemctl status firewalld.service(防火墙应该是关闭的)
sestatus SELinux 状态(禁用)
MTU 配置为 9000(我们验证所有组件上的 9000 设置正确
我们还能做些什么来验证为什么 DataNode alive 不稳定?
【问题讨论】:
【参考方案1】:我们将数据节点堆大小从默认值 - 2G 增加到 6G 从那时起,现在来自 ambari 仪表板的数据节点是稳定的
【讨论】:
以上是关于来自ambari的数据节点活动不稳定的主要内容,如果未能解决你的问题,请参考以下文章