来自 Ambari 的 HAWQ 服务检查失败

Posted

技术标签:

【中文标题】来自 Ambari 的 HAWQ 服务检查失败【英文标题】:HAWQ service check Fails From Ambari 【发布时间】:2016-06-06 09:14:11 【问题描述】:

我们有小型 Hadoop-Hawq 集群。其中,当我执行 HAWQ 服务的检查时,有一次从主机服务失败。

从 Ambari UI 得到以下错误:

**stderr:** 
Traceback (most recent call last):
  File "/var/lib/ambari-agent/cache/stacks/PHD/3.0/services/HAWQ/package/scripts/service_check.py", line 9, in <module>
    HAWQServiceCheck().execute()
  File "/usr/lib/python2.6/site-packages/resource_management/libraries/script/script.py", line 123, in execute
    method(env)
  File "/var/lib/ambari-agent/cache/stacks/PHD/3.0/services/HAWQ/package/scripts/service_check.py", line 6, in service_check
    hawq.verify_segments_state(env)
  File "/var/lib/ambari-agent/cache/stacks/PHD/3.0/services/HAWQ/package/scripts/hawq.py", line 20, in verify_segments_state
    raise Exception("gpstate command returned non-zero result: 0. Out: 1 Error: 2".format(retcode, out, err))
Exception: gpstate command returned non-zero result: 255. Out:  Error: Permission denied, please try again.
Permission denied, please try again.
Permission denied (publickey,gssapi-keyex,gssapi-with-mic,password).
 **stdout:**
(255, '', 'Permission denied, please try again.\r\nPermission denied, please try again.\r\nPermission denied (publickey,gssapi-keyex,gssapi-with-mic,password).\r\n')

任何帮助将不胜感激?

【问题讨论】:

嗨@vickps,欢迎来到SO 或类似的......在问这个问题之前,您是否尝试过以详细模式运行脚本?似乎存在权限问题......在继续之前先看看。你知道“一步一步”的表达...... 我们正在从 Ambari UI 进行检查。并且没有详细的选项。 那么你有一个真正的问题......你的系统管理员在说什么......? 我是系统管理员和HAWQ相关问题的负责人 ...(喘气)@vickps 【参考方案1】:

HAWQ 要求对所有集群节点进行无密码 ssh 访问。检查系统是否配置为允许,并执行以下 hawq 命令在您的主机文件中定义的节点上设置无密码 ssh:

$ gpssh-exkeys -f hostfile (in version 1.x)

$ hawq ssh-exkeys -f hostfile (in version 2.x)

【讨论】:

以上是关于来自 Ambari 的 HAWQ 服务检查失败的主要内容,如果未能解决你的问题,请参考以下文章

HDP Ambari 安装失败

Ambari hadoop 安装失败

为啥 Ambari 集群设置在 zookeeper 安装时失败并出现符号链接错误?

2 NameNode 失败后移动 NameNode - Hortonworks - Hadoop

【Ambari-部署】记一次HDFS HA启用失败恢复过程

获取 D-Bus 连接失败:不允许操作