在一个节点上 ssh 关闭时正确停止 Greenplum

Posted

技术标签:

【中文标题】在一个节点上 ssh 关闭时正确停止 Greenplum【英文标题】:proper stop Greenplum when on one node ssh is down 【发布时间】:2015-05-19 08:31:28 【问题描述】:

greenplum DB 有问题。 sshd 的一个节点出现故障,我们无法连接到该节点。只能硬重启。我们尝试正确停止 greenplum,以便能够再次启动它。在 GP 文档中没有描述当 SSH 不在其中一个节点上工作时如何分段完全停止 DB。

【问题讨论】:

【参考方案1】:

GPDB 依赖 SSH 进行管理活动,例如启动/停止。所以我认为最好的选择是停止在集群上运行的所有查询,重新启动有问题的节点,等待 GPDB 故障转移到镜像,当节点再次启动时执行“gprecoverseg”。这样您就不需要关闭整个集群。

一般来说,如果您的 gpadmin 用户在 sudoers 列表中,您可以尝试在此特定段上执行外部 Web 表并重新启动 sshd 本身(在有问题的节点上运行的一个段上执行 sudo /etc/init.d/ssh restart 的外部 Web 表)

【讨论】:

【参考方案2】:

您可以使用gpstop 命令停止 gp。这是最好的办法。它将尝试停止所有段。对于损坏的 sshd 段,master 会自动将其从集群中移除。如果您为损坏的服务器配置镜像,则不会丢失任何数据。

【讨论】:

以上是关于在一个节点上 ssh 关闭时正确停止 Greenplum的主要内容,如果未能解决你的问题,请参考以下文章

关闭 SSH 时保持 Django 运行服务器处于活动状态

优雅地关闭节点实例,不中途停止任何事情

Linuxnohup后台运行 & 关闭ssh 后 后台程序停止

解决Linux关闭终端(关闭SSH等)后运行的程序自动停止

解决Linux关闭终端(关闭SSH等)后运行的程序自动停止

由于间隙,AVPlayer 流在后台停止 [关闭]