在一个节点上 ssh 关闭时正确停止 Greenplum
Posted
技术标签:
【中文标题】在一个节点上 ssh 关闭时正确停止 Greenplum【英文标题】:proper stop Greenplum when on one node ssh is down 【发布时间】:2015-05-19 08:31:28 【问题描述】:greenplum DB 有问题。 sshd 的一个节点出现故障,我们无法连接到该节点。只能硬重启。我们尝试正确停止 greenplum,以便能够再次启动它。在 GP 文档中没有描述当 SSH 不在其中一个节点上工作时如何分段完全停止 DB。
【问题讨论】:
【参考方案1】:GPDB 依赖 SSH 进行管理活动,例如启动/停止。所以我认为最好的选择是停止在集群上运行的所有查询,重新启动有问题的节点,等待 GPDB 故障转移到镜像,当节点再次启动时执行“gprecoverseg”。这样您就不需要关闭整个集群。
一般来说,如果您的 gpadmin 用户在 sudoers 列表中,您可以尝试在此特定段上执行外部 Web 表并重新启动 sshd 本身(在有问题的节点上运行的一个段上执行 sudo /etc/init.d/ssh restart
的外部 Web 表)
【讨论】:
【参考方案2】:您可以使用gpstop
命令停止 gp。这是最好的办法。它将尝试停止所有段。对于损坏的 sshd 段,master 会自动将其从集群中移除。如果您为损坏的服务器配置镜像,则不会丢失任何数据。
【讨论】:
以上是关于在一个节点上 ssh 关闭时正确停止 Greenplum的主要内容,如果未能解决你的问题,请参考以下文章