repmgr+pg12集群,挂掉的主机如何手动加入集群

Posted mingfan

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了repmgr+pg12集群,挂掉的主机如何手动加入集群相关的知识,希望对你有一定的参考价值。

接上回,备机在检测到主机挂掉后,备机通过standby promote成功升级为主机继续提供服务

此时集群状态如下:

技术图片

接下来需要恢复原主机为备机加入集群继续提供服务

1、主机执行node rejoin,将节点重新加入集群:

./repmgr node rejoin -h192.168.101.7 -Upostgres -dpostgres
[postgres@localhost bin]$ ./repmgr node rejoin -h192.168.101.7 -Upostgres -dpostgres
ERROR: this node cannot attach to rejoin target node 2
DETAIL: rejoin target servers timeline 2 forked off current database system timeline 1 before current recovery point 0/8000028
HINT: use --force-rewind to execute pg_rewind

报错日志可以看出,此时的节点和现在的主节点日志发生了分歧,需要调用--force-rewind重做备机,执行如下命令即可

./repmgr node rejoin -h192.168.101.7 -Upostgres -dpostgres --force-rewind

技术图片

 

 检查节点状态,可知原主机成功作为备机加入集群提供服务

./repmgr cluster show

技术图片

 

 

 ps:调用pg_rewind重做备机有丢失原主机数据风险,需要注意。

以上是关于repmgr+pg12集群,挂掉的主机如何手动加入集群的主要内容,如果未能解决你的问题,请参考以下文章

repmgr+pg12构建高可用集群

三postgresql-14+repmgr-5.3.3高可用安装配置

PostgreSQL集群管理—repmgr

repmgr 集群双主问题处理

Hbase regionserver 逐个挂掉的问题分析

Configure PostgreSQL Replication With Repmgr