CDH集群-无法找到主机的NTP 服务或该服务未响应时钟偏差请求

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了CDH集群-无法找到主机的NTP 服务或该服务未响应时钟偏差请求相关的知识,希望对你有一定的参考价值。

参考技术A 问题:

部分主机宕机后,CDH集群启动成功,但是有某些主机提示“无法找到主机的NTP 服务,或该服务未响应时钟偏差请求”

解决步骤:

1.先同步服务器时钟

执行命令:

service ntpd stop  停止ntp服务

ntpdate  主机ip   同步主机时钟

service ntpd start  启动ntp服务

service ntpd status  查看服务启动情况

ntpq -pn  查看同步的服务器IP

ntpstat  查看同步结果

2.在CDH界面停止主机上的角色

3.进入该主机的CDH安装目录执行 ./cloudera-scm-agent restart (即需要在问题主机上重启cloudera-scm-agent服务)

目录在 etc/init.d下

4.等待CDH界面刷新,问题解决,大概等3  5分钟就看不到时钟偏差问题了。

解决思路:

1.同步服务器时钟是为了确定是否是ntp服务本身的问题。

2.发现服务器时钟没有问题,所以不是ntp服务本身的问题。

其中这句话说,如果该命令失败、NTP 未与服务器同步,或主机的 NTP 后台程序未运行或无法联系,该测试将返回运行状况“不良”。

所以可能是CDH集群本身没有接收到时间同步服务器的结果,于是执行重启agent的命令。至此问题解决!

修改cdh5集群中主机节点IP或hostName

前言

  在使用cdh集群过程中,难免会因为某些不可抗拒的原因导致节点IP或hostName变动,而cm的监控界面无法完成这些事情,但是cm将集群中所有的主机的信息都存在postgresql数据库的hosts表中,

现在让我们来通过修改hosts来完成这个操作。

第一步,关闭服务

  1. 关闭集群服务,及 Cloudera Management Service,
  2. 关闭cm服务:( cm安装节点 )

    命令 : service cloudera-scm-server stop

         service cloudera-scm-agent stop( 没有可忽略 )
    

第二步,登录postgresql 数据库,修改节点IP

  1. 获取postgresql的登录密码

     命令: grep password /etc/cloudera-scm-server/db.properties
    
  2. 登录数据库 ( 和登录mysql 类似 )

    命令 :psql -h localhost -p 7432 -U scm    (回车 输入第一步的密码即可)
    

第三步,查看并修改节点IP

  1. 查看IP信息

    命令:select host_id, name, ip_address from hosts;

  2. 修改IP信息(hostName类似)

    命令 : update hosts set (ip_address) = (‘your_ip’) where host_id=x;

  3. 退出

    命令 : \\q

4 . 启动服务, 查看cm界面是否修改成功。

转载:http://www.cnblogs.com/jechedo/p/5128517.html

以上是关于CDH集群-无法找到主机的NTP 服务或该服务未响应时钟偏差请求的主要内容,如果未能解决你的问题,请参考以下文章

修改cdh5集群中主机节点IP或hostName

1000+节点的cdh集群主服务迁移全过程

1000+节点的cdh集群主服务迁移全过程

1000+节点的cdh集群主服务迁移全过程

1000+节点的cdh集群主服务迁移全过程

部署CDH集群环境准备