如何重启数据库服务(包含单实例/流复制/集群)

Posted 瀚高PG实验室

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了如何重启数据库服务(包含单实例/流复制/集群)相关的知识,希望对你有一定的参考价值。

目录
环境
文档用途
详细信息

环境
系统平台:N/A
版本:4.3.4.5,4.3.4.6,4.3.4.7,4.3.4.8,4.3.4.9,4.5
文档用途
本文档概述了单实例数据库、流复制环境和集群环境三种架构下启动和关闭的步骤。并非故障排除文档。 但是可以清楚地了解这三种方式数据库在Linux系统下启动和关闭方式。

详细信息
对于单实例数据库和流复制数据库启动和关闭的顺序无特别要求,对于集群数据库必须首先关闭所有备节点数据库后,才能关闭主节点数据库。

  1. 单实例数据库启动和关闭

1.1 systemctl方式

systemctl为使用操作系统服务的方式将数据库启动和关闭的方法,方便流复制和集群的管理。

(1)数据库启动

[root@hgv4 ~]# systemctl start hgdb-se4.5.service

查看运行数据库状态

[root@hgv4 ~]# systemctl status hgdb-se4.5.service
hgdb-se4.5.service - hgdb4.5-see
Loaded: loaded (/usr/lib/systemd/system/hgdb-se4.5.service; enabled; vendor preset: disabled)
Active: active (running) since 四 2020-09-10 10:25:08 CST; 41s ago
Process: 79115 ExecStop=/highgo/database/4.5/etc/hgdb-se4.5 stop (code=exited, status=1/FAILURE)
Process: 79222 ExecStart=/highgo/database/4.5/etc/hgdb-se4.5 start (code=exited, status=0/SUCCESS)
Main PID: 79229 (postgres)
Tasks: 10
CGroup: /system.slice/hgdb-se4.5.service
├─79229 /highgo/database/4.5/bin/postgres -D /highgo/database/4.5/data
├─79230 postgres: logger
├─79231 postgres: auditwriter
├─79233 postgres: checkpointer
├─79234 postgres: background writer
├─79235 postgres: walwriter
├─79236 postgres: autovacuum launcher
├─79237 postgres: archiver
├─79238 postgres: stats collector
└─79239 postgres: logical replication launcher

9月 10 10:25:08 hgv4 systemd[1]: Starting hgdb4.5-see…
9月 10 10:25:08 hgv4 hgdb-se4.5[79222]: Starting HighGo Database Server:
9月 10 10:25:08 hgv4 hgdb-se4.5[79222]: waiting for server to start… done
9月 10 10:25:08 hgv4 hgdb-se4.5[79222]: server started
9月 10 10:25:08 hgv4 hgdb-se4.5[79222]: HighGo Database Server started successfully
9月 10 10:25:08 hgv4 systemd[1]: Started hgdb4.5-see.

查看数据库的操作系统进程

[root@hgv4 ~]# ps -ef|grep postg
root 79435 1 0 10:27 ? 00:00:00 /highgo/database/4.5/bin/postgres
root 79441 79435 0 10:27 ? 00:00:00 postgres: logger
root 79442 79435 0 10:27 ? 00:00:00 postgres: auditwriter
root 79444 79435 0 10:27 ? 00:00:00 postgres: checkpointer
root 79445 79435 0 10:27 ? 00:00:00 postgres: background writer
root 79446 79435 0 10:27 ? 00:00:00 postgres: walwriter
root 79449 79435 0 10:27 ? 00:00:00 postgres: autovacuum launchr
root 79450 79435 0 10:27 ? 00:00:00 postgres: archiver
root 79451 79435 0 10:27 ? 00:00:00 postgres: stats collector
root 79452 79435 0 10:27 ? 00:00:00 postgres: logical replication launcher
root 79511 76215 0 10:28 pts/1 00:00:00 grep --color=auto postg

(2)数据库关闭

[root@hgv4 ~]# systemctl stop hgdb-se4.5.service

查看数据库服务状态

[root@hgv4 ~]# systemctl status hgdb-se4.5.service
hgdb-se4.5.service - hgdb4.5-see
Loaded: loaded (/usr/lib/systemd/system/hgdb-se4.5.service; enabled; vendor preset: disabled)
Active: inactive (dead) since 四 2020-09-10 10:25:59 CST; 2s ago
Process: 79291 ExecStop=/highgo/database/4.5/etc/hgdb-se4.5 stop (code=exited, status=0/SUCCESS)
Process: 79222 ExecStart=/highgo/database/4.5/etc/hgdb-se4.5 start (code=exited, status=0/SUCCESS)
Main PID: 79229 (code=exited, status=0/SUCCESS)

9月 10 10:25:08 hgv4 hgdb-se4.5[79222]: Starting HighGo Database Server:
9月 10 10:25:08 hgv4 hgdb-se4.5[79222]: waiting for server to start… done
9月 10 10:25:08 hgv4 hgdb-se4.5[79222]: server started
9月 10 10:25:08 hgv4 hgdb-se4.5[79222]: HighGo Database Server started successfully
9月 10 10:25:08 hgv4 systemd[1]: Started hgdb4.5-see.
9月 10 10:25:59 hgv4 systemd[1]: Stopping hgdb4.5-see…
9月 10 10:25:59 hgv4 hgdb-se4.5[79291]: Stopping HighGo Database
9月 10 10:25:59 hgv4 hgdb-se4.5[79291]: waiting for server to shut down… done
9月 10 10:25:59 hgv4 hgdb-se4.5[79291]: server stopped
9月 10 10:25:59 hgv4 systemd[1]: Stopped hgdb4.5-see.

查看数据库的操作系统进程

[root@hgv4 ~]# ps -ef|grep postg
root 79428 76215 0 10:27 pts/1 00:00:00 grep --color=auto postg
1.2 pg_ctl方式

(1)数据库启动

[root@hgv4 ~]# pg_ctl start

等待服务器进程启动 …2020-09-10 10:27:44.923 CST [79405] 日志: 正在启动 HighGo Security Enterprise Edition Database System 4.5 on CentOS7 x86_64,build on 20200426

2020-09-10 10:27:44.923 CST [79405] 日志: 正在监听IPv4地址"0.0.0.0",端口 5866

2020-09-10 10:27:44.923 CST [79405] 日志: 正在监听IPv6地址"::",端口 5866

2020-09-10 10:27:44.928 CST [79405] 日志: 在Unix套接字 "/tmp/.s.PGSQL.5866"上侦听

2020-09-10 10:27:44.939 CST [79405] 日志: 日志输出重定向到日志收集进程

2020-09-10 10:27:44.939 CST [79405] 提示: 后续的日志输出将出现在目录 "hgdb_log"中.

完成

服务器进程已经启动

(2)数据库关闭

如果当期环境允许,为了加快数据库关闭速度,数据库可以提前将应用、中间件提前关闭后并结束与数据库的连接残留进程。

检查数据库会话连接数

highgo=# select datname,usename,client_addr,count(*) from pg_stat_activity where pid <> pg_backend_pid()and state=‘idle’ group by 1,2,3 order by 1,2,4 desc;

datname | usename | client_addr | count

---------±--------±------------±------

highgo | sysdba | | 1

(1 行记录)

kill除自己会话连接之外的所有用户连接进程

highgo=# select pg_terminate_backend(pid) from pg_stat_activity where state=‘idle’;

pg_terminate_backend


t

(1 行记录)

关闭数据库

[root@hgv4 ~]# pg_ctl stop -m fast

等待服务器进程关闭 … 完成

服务器进程已经关闭

对于 pg_ctl 关闭数据库 -m 参数的说明

-m 选项:

关闭或重启的选项:

-m, --mode=MODE 可以是 “smart”, “fast”, 或者 “immediate”

关闭模式有如下几种:

smart 所有客户端断开连接后退出

fast 直接退出, 正确的关闭(默认)

immediate 不完全的关闭退出; 此方式会导致数据库再次启动时进行实例恢复

  1. 流复制数据库启动和关闭

流复制数据同样可以使用systemctl或者pg_ctl命令方式关闭和启动数据库,对于流复制环境一主多备或一主一备模式,并没有先后启动和关闭顺序上的要求。

如果你想要确定主备节点的角色可参考文档(HighGo Database判断流复制主备角色的方法(Document 017033702)。我们此处我们采用pg_ctl方式进行关闭和启动。

2.1 采用 pg_ctl方式启动和关闭流复制环境

与单实例数据库启动和关闭相同,为加速停止你也可以采用关闭应用和结束残余的用户进程的方法。

(1)启动数据库

启动主节点

[root@hgv4 highgo]# pg_ctl start

等待服务器进程启动 …2020-09-14 14:21:01.520 CST [102693] 日志: 正在启动 HighGo Security Enterprise Edition Database System 4.5 on CentOS7 x86_64,build on 20200426

2020-09-14 14:21:01.520 CST [102693] 日志: 正在监听IPv4地址"0.0.0.0",端口 5866

2020-09-14 14:21:01.520 CST [102693] 日志: 正在监听IPv6地址"::",端口 5866

2020-09-14 14:21:01.522 CST [102693] 日志: 在Unix套接字 "/tmp/.s.PGSQL.5866"上侦听

2020-09-14 14:21:01.539 CST [102693] 日志: 日志输出重定向到日志收集进程

2020-09-14 14:21:01.539 CST [102693] 提示: 后续的日志输出将出现在目录 "hgdb_log"中.

完成

服务器进程已经启

检查主节点操作系统后台进程

[root@hgv4 highgo]# ps -ef|grep postg

postgres 48939 48938 0 14:42 ? 00:00:00 postgres: logger

postgres 48941 48938 0 14:42 ? 00:00:00 postgres: checkpointer

postgres 48942 48938 0 14:42 ? 00:00:00 postgres: background writer

postgres 48943 48938 0 14:42 ? 00:00:00 postgres: walwriter

postgres 48944 48938 0 14:42 ? 00:00:00 postgres: autovacuum launcher

postgres 48945 48938 0 14:42 ? 00:00:00 postgres: archiver

postgres 48946 48938 0 14:42 ? 00:00:00 postgres: stats collector

postgres 48947 48938 0 14:42 ? 00:00:00 postgres: logical replication launcher

postgres 48949 48938 0 14:42 ? 00:00:00 postgres: walsender repuser hgv4dg(65096) streaming 4/200000D8 --流复制日志发送进程, hgv4dg为备节点的主机名。

启动备节点

[root@hgv4dg highgo]# pg_ctl start

等待服务器进程启动 …2020-09-14 14:21:01.520 CST [102693] 日志: 正在启动 HighGo Security Enterprise Edition Database System 4.5 on CentOS7 x86_64,build on 20200426

2020-09-14 14:21:01.520 CST [102693] 日志: 正在监听IPv4地址"0.0.0.0",端口 5866

2020-09-14 14:21:01.520 CST [102693] 日志: 正在监听IPv6地址"::",端口 5866

2020-09-14 14:21:01.522 CST [102693] 日志: 在Unix套接字 "/tmp/.s.PGSQL.5866"上侦听

2020-09-14 14:21:01.539 CST [102693] 日志: 日志输出重定向到日志收集进程

2020-09-14 14:21:01.539 CST [102693] 提示: 后续的日志输出将出现在目录 "hgdb_log"中.

完成

服务器进程已经启

检查备节点操作系统后台进程

[root@hgv4dg highgo]# ps -ef|grep postg

postgres 49906 49905 0 14:42 ? 00:00:00 postgres: logger

postgres 49907 49905 0 14:42 ? 00:00:00 postgres: startup recovering 000000060000000400000020

postgres 49908 49905 0 14:42 ? 00:00:00 postgres: checkpointer

postgres 49909 49905 0 14:42 ? 00:00:00 postgres: background writer

postgres 49910 49905 0 14:42 ? 00:00:00 postgres: stats collector

postgres 49922 49905 0 14:42 ? 00:00:00 postgres: walreceiver streaming 4/200000D8 --流复制日志接收进程

(2)关闭数据库

关闭主节点

[root@hgv4 highgo]# pg_ctl stop

等待服务器进程关闭 … 完成

服务器进程已经关闭

关闭备节点

[root@hgv4dg highgo]# pg_ctl stop

等待服务器进程关闭 … 完成

服务器进程已经关闭

  1. 集群数据库启动和关闭

需采用Linux启动和关闭服务(systemctl)的方式进行关闭和启动,不建议使用 pg_ctl 方式启动和关闭集群中的节点。

集群启动顺序:

主节点->备节点

说明:顺序不能颠倒,严格按照先启动主节点数据库服务,在启动所有备节点数据库服务的顺序进行。

集群关闭顺序:

备节点->主节点

说明:顺序不能颠倒,严格按照先关闭所有备节点数据库服务后,再关闭主节点数据库服务的的顺序进行。

3.1 启动集群数据库

(1)启动主节点

使用systemctl方式启动

[root@hs01 ] systemctl start hgdb-se4.5.service

[root@hs01 ] systemctl status hgdb-se4.5.service

查看主节点数据库的操作系统进程

[root@hs01 hgdb_log]# ps -ef|grep post

root 10251 1 0 15:23 ? 00:00:00 /usr/libexec/postfix/master -w

postfix 10261 10251 0 15:23 ? 00:00:00 qmgr -l -t unix -u

postfix 16252 10251 0 16:30 ? 00:00:00 pickup -l -t unix -u

root 24217 1 0 17:33 ? 00:00:00 /highgo/database/4.5/bin/postgres -D /highgo/database/4.5/data

root 24218 24217 0 17:33 ? 00:00:00 postgres: logger process

root 24220 24217 0 17:33 ? 00:00:00 postgres: checkpointer process

root 24221 24217 0 17:33 ? 00:00:00 postgres: writer process

root 24222 24217 0 17:33 ? 00:00:00 postgres: wal writer process

root 24223 24217 0 17:33 ? 00:00:00 postgres: autovacuum launcher process

root 24224 24217 0 17:33 ? 00:00:00 postgres: archiver process

root 24225 24217 0 17:33 ? 00:00:00 postgres: stats collector process

root 24226 24217 0 17:33 ? 00:00:00 postgres: bgworker: logical replication launcher

root 24238 24217 0 17:33 ? 00:00:00 postgres: sysdba highgo 192.168.0.121(39996) idle

查看主节点集群守护进程

[root@hs01 hgdb_log]# ps -ef|grep repmgrd

root 24240 1 0 17:33 ? 00:00:00 /highgo/database/4.5/bin/repmgrd -d

root 24719 16546 0 17:36 pts/2 00:00:00 grep --color=auto repmgrd

查看主节点集群状态

  • 可以通过查看数据库集群状态的命令;如果主备库显示一致且如下所示,说明集群状态正常

  • 在 status 一栏中出现 * 表示正常状态,如果出现了其他的符号(比如 !,?),表明集群状态出现故障

[root@hs01 arch]# repmgr cluster show

ID | Name | Role | Status | Upstream | Location | Priority | Replication lag | Last replayed LSN

----±--------------±--------±----------±--------------±---------±---------±----------------±------------------

1 | 192.168.0.121 | primary | * running | | default | 100 | n/a | none

2 | 192.168.0.122 | standby | running | 192.168.0.121 | default | 100 | 0 bytes | 0/70006F0

(2)启动备节点

使用systemctl方式启动

[root@hs02 ~]# systemctl start hgdb-se4.5.service

[root@hs02 ~]# systemctl status hgdb-se4.5.service

查看备节点数据库的操作系统进程

[root@hs02 ~]# ps -ef|grep postg

root 20568 1 0 17:37 ? 00:00:00 /highgo/database/4.5/bin/postgres -D /highgo/database/4.5/data

root 20569 20568 0 17:37 ? 00:00:00 postgres: logger process

root 20570 20568 0 17:37 ? 00:00:00 postgres: startup process recovering 000000010000000000000007

root 20571 20568 0 17:37 ? 00:00:00 postgres: checkpointer process

root 20572 20568 0 17:37 ? 00:00:00 postgres: writer process

root 20573 20568 0 17:37 ? 00:00:00 postgres: stats collector process

root 20574 20568 0 17:37 ? 00:00:00 postgres: wal receiver process streaming 0/70006F0

root 20585 20568 0 17:37 ? 00:00:00 postgres: sysdba highgo 192.168.0.122(13382) idle

查看备节点集群守护进程

[root@hs02 ~]# ps -ef|grep repmgrd

root 20587 1 0 17:37 ? 00:00:00 /highgo/database/4.5/bin/repmgrd -d

root 20638 15513 0 17:37 pts/2 00:00:00 grep --color=auto repmgrd

查看备节点集群状态

[root@hs01 arch]# repmgr cluster show

ID | Name | Role | Status | Upstream | Location | Priority | Replication lag | Last replayed LSN

----±--------------±--------±----------±--------------±---------±---------±----------------±------------------

1 | 192.168.0.121 | primary | * running | | default | 100 | n/a | none

3.2 关闭集群数据库

(1)确认数据库主备节点

[root@hs01 arch]# repmgr cluster show

ID | Name | Role | Status | Upstream | Location | Priority | Replication lag | Last replayed LSN

----±--------------±--------±----------±--------------±---------±---------±----------------±------------------

1 | 192.168.0.121 | primary | * running | | default | 100 | n/a | none

2 | 192.168.0.122 | standby | running | 192.168.0.121 | default | 100 | 0 bytes | 0/70007D0

(2)关闭备节点

使用systemctl方式关闭

[root@hs02 ~]# systemctl stop hgdb-se4.5.service

[root@hs02 ~]# systemctl status hgdb-se4.5.service

查看备节点数据库的操作系统进程

[root@hs02 ~]# ps -ef|grep postg

root 26121 15265 0 18:22 pts/1 00:00:00 grep --color=auto postg

– 显示已无数据库进程

查看备节点集群守护进程

[root@hs02 etc]# ps -ef|grep repmgrd

root 26453 15265 0 18:26 pts/1 00:00:00 grep --color=auto repmgrd

– 显示已无 repmgrd -d 守护进程
(3)关闭主节点

使用systemctl方式关闭

[root@hs01 ~]# systemctl stop hgdb-se4.5.service

[root@hs01 ~]# systemctl status hgdb-se4.5.service

查看主节点数据库的操作系统进程

[root@hs01 arch]# ps -ef|grep postg

root 35230 16270 0 18:35 pts/1 00:00:00 grep --color=auto postg

– 显示已无数据库进程

查看主节点集群守护进程

[root@hs01 arch]# ps -ef|grep repmgrd

root 35337 16270 0 18:37 pts/1 00:00:00 grep --color=auto repmgrd

– 显示已无 repmgrd -d 守护进程

查看备节点集群状态

[root@hs01 arch]# repmgr cluster show

WARNING: log_switch/true: unknown name/value pair provided; ignoring

ERROR: connection to database failed

DETAIL:

could not connect to server: Connection refused

    Is the server running on host "192.168.0.121" and accepting

    TCP/IP connections on port 5866?

DETAIL: attempted to connect using:

user=sysdba password=hgdb1234 connect_timeout=2 dbname=highgo host=192.168.0.121 port=5866 fallback_application_name=repmgr

说明: 此时使用repmgr cluster show 在各个集群节点查看状态均显示无法连接数据库。此为集群关闭后的正常返回结果。

以上是关于如何重启数据库服务(包含单实例/流复制/集群)的主要内容,如果未能解决你的问题,请参考以下文章

如何重启数据库服务(包含单实例/流复制/集群)

重启数据库集群服务器( 主库服务器/备库服务器 )步骤

重启数据库集群服务器( 主库服务器/备库服务器 )步骤

Redis为什么需要集群?

Redis为什么需要集群?

Redis 集群演进探讨和总结