如何重启数据库服务(包含单实例/流复制/集群)
Posted 瀚高实验室
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了如何重启数据库服务(包含单实例/流复制/集群)相关的知识,希望对你有一定的参考价值。
目录 环境 文档用途 详细信息 环境 系统平台:N/A 版本:4.3.4.5,4.3.4.6,4.3.4.7,4.3.4.8,4.3.4.9,4.5 文档用途-
本文档概述了单实例数据库、流复制环境和集群环境三种架构下启动和关闭的步骤。并非故障排除文档。 但是可以清楚地了解这三种方式数据库在Linux系统下启动和关闭方式。
对于单实例数据库和流复制数据库启动和关闭的顺序无特别要求,对于集群数据库必须首先关闭所有备节点数据库后,才能关闭主节点数据库。
1. 单实例数据库启动和关闭
1.1 systemctl方式
systemctl为使用操作系统服务的方式将数据库启动和关闭的方法,方便流复制和集群的管理。
(1)数据库启动
[root@hgv4 ~]# systemctl start hgdb-se4.5.service |
-
查看运行数据库状态
[root@hgv4 ~]# systemctl status hgdb-se4.5.service 9月 10 10:25:08 hgv4 systemd[1]: Starting hgdb4.5-see... |
-
查看数据库的操作系统进程
[root@hgv4 ~]# ps -ef|grep postg |
(2)数据库关闭
[root@hgv4 ~]# systemctl stop hgdb-se4.5.service |
-
查看数据库服务状态
[root@hgv4 ~]# systemctl status hgdb-se4.5.service 9月 10 10:25:08 hgv4 hgdb-se4.5[79222]: Starting HighGo Database Server:
|
-
查看数据库的操作系统进程
[root@hgv4 ~]# ps -ef|grep postg root 79428 76215 0 10:27 pts/1 00:00:00 grep --color=auto postg |
1.2 pg_ctl方式
(1)数据库启动
[root@hgv4 ~]# pg_ctl start 等待服务器进程启动 ....2020-09-10 10:27:44.923 CST [79405] 日志: 正在启动 HighGo Security Enterprise Edition Database System 4.5 on CentOS7 x86_64,build on 20200426 2020-09-10 10:27:44.923 CST [79405] 日志: 正在监听IPv4地址"0.0.0.0",端口 5866 2020-09-10 10:27:44.923 CST [79405] 日志: 正在监听IPv6地址"::",端口 5866 2020-09-10 10:27:44.928 CST [79405] 日志: 在Unix套接字 "/tmp/.s.PGSQL.5866"上侦听 2020-09-10 10:27:44.939 CST [79405] 日志: 日志输出重定向到日志收集进程 2020-09-10 10:27:44.939 CST [79405] 提示: 后续的日志输出将出现在目录 "hgdb_log"中. 完成 服务器进程已经启动 |
(2)数据库关闭
如果当期环境允许,为了加快数据库关闭速度,数据库可以提前将应用、中间件提前关闭后并结束与数据库的连接残留进程。
-
检查数据库会话连接数
highgo=# select datname,usename,client_addr,count(*) from pg_stat_activity where pid <> pg_backend_pid()and state=\'idle\' group by 1,2,3 order by 1,2,4 desc; datname | usename | client_addr | count ---------+---------+-------------+------- highgo | sysdba | | 1 (1 行记录) |
-
kill除自己会话连接之外的所有用户连接进程
highgo=# select pg_terminate_backend(pid) from pg_stat_activity where state=\'idle\'; pg_terminate_backend ---------------------- t (1 行记录) |
关闭数据库
[root@hgv4 ~]# pg_ctl stop -m fast 等待服务器进程关闭 .... 完成 服务器进程已经关闭 |
-
对于 pg_ctl 关闭数据库 -m 参数的说明
-m 选项: 关闭或重启的选项: -m, --mode=MODE 可以是 "smart", "fast", 或者 "immediate"
关闭模式有如下几种: smart 所有客户端断开连接后退出 fast 直接退出, 正确的关闭(默认) immediate 不完全的关闭退出; 此方式会导致数据库再次启动时进行实例恢复 |
2. 流复制数据库启动和关闭
流复制数据同样可以使用systemctl或者pg_ctl命令方式关闭和启动数据库,对于流复制环境一主多备或一主一备模式,并没有先后启动和关闭顺序上的要求。
如果你想要确定主备节点的角色可参考文档(HighGo Database判断流复制主备角色的方法(Document 017033702)。我们此处我们采用pg_ctl方式进行关闭和启动。
2.1 采用 pg_ctl方式启动和关闭流复制环境
与单实例数据库启动和关闭相同,为加速停止你也可以采用关闭应用和结束残余的用户进程的方法。
(1)启动数据库
-
启动主节点
[root@hgv4 highgo]# pg_ctl start 等待服务器进程启动 ....2020-09-14 14:21:01.520 CST [102693] 日志: 正在启动 HighGo Security Enterprise Edition Database System 4.5 on CentOS7 x86_64,build on 20200426 2020-09-14 14:21:01.520 CST [102693] 日志: 正在监听IPv4地址"0.0.0.0",端口 5866 2020-09-14 14:21:01.520 CST [102693] 日志: 正在监听IPv6地址"::",端口 5866 2020-09-14 14:21:01.522 CST [102693] 日志: 在Unix套接字 "/tmp/.s.PGSQL.5866"上侦听 2020-09-14 14:21:01.539 CST [102693] 日志: 日志输出重定向到日志收集进程 2020-09-14 14:21:01.539 CST [102693] 提示: 后续的日志输出将出现在目录 "hgdb_log"中. 完成 服务器进程已经启 |
-
检查主节点操作系统后台进程
[root@hgv4 highgo]# ps -ef|grep postg postgres 48939 48938 0 14:42 ? 00:00:00 postgres: logger postgres 48941 48938 0 14:42 ? 00:00:00 postgres: checkpointer postgres 48942 48938 0 14:42 ? 00:00:00 postgres: background writer postgres 48943 48938 0 14:42 ? 00:00:00 postgres: walwriter postgres 48944 48938 0 14:42 ? 00:00:00 postgres: autovacuum launcher postgres 48945 48938 0 14:42 ? 00:00:00 postgres: archiver postgres 48946 48938 0 14:42 ? 00:00:00 postgres: stats collector postgres 48947 48938 0 14:42 ? 00:00:00 postgres: logical replication launcher postgres 48949 48938 0 14:42 ? 00:00:00 postgres: walsender repuser hgv4dg(65096) streaming 4/200000D8 --流复制日志发送进程, hgv4dg为备节点的主机名。 |
-
启动备节点
[root@hgv4dg highgo]# pg_ctl start 等待服务器进程启动 ....2020-09-14 14:21:01.520 CST [102693] 日志: 正在启动 HighGo Security Enterprise Edition Database System 4.5 on CentOS7 x86_64,build on 20200426 2020-09-14 14:21:01.520 CST [102693] 日志: 正在监听IPv4地址"0.0.0.0",端口 5866 2020-09-14 14:21:01.520 CST [102693] 日志: 正在监听IPv6地址"::",端口 5866 2020-09-14 14:21:01.522 CST [102693] 日志: 在Unix套接字 "/tmp/.s.PGSQL.5866"上侦听 2020-09-14 14:21:01.539 CST [102693] 日志: 日志输出重定向到日志收集进程 2020-09-14 14:21:01.539 CST [102693] 提示: 后续的日志输出将出现在目录 "hgdb_log"中. 完成 服务器进程已经启 |
-
检查备节点操作系统后台进程
[root@hgv4dg highgo]# ps -ef|grep postg postgres 49906 49905 0 14:42 ? 00:00:00 postgres: logger postgres 49907 49905 0 14:42 ? 00:00:00 postgres: startup recovering 000000060000000400000020 postgres 49908 49905 0 14:42 ? 00:00:00 postgres: checkpointer postgres 49909 49905 0 14:42 ? 00:00:00 postgres: background writer postgres 49910 49905 0 14:42 ? 00:00:00 postgres: stats collector postgres 49922 49905 0 14:42 ? 00:00:00 postgres: walreceiver streaming 4/200000D8 --流复制日志接收进程 |
(2)关闭数据库
-
关闭主节点
[root@hgv4 highgo]# pg_ctl stop 等待服务器进程关闭 .... 完成 服务器进程已经关闭 |
-
关闭备节点
[root@hgv4dg highgo]# pg_ctl stop 等待服务器进程关闭 .... 完成 服务器进程已经关闭 |
3. 集群数据库启动和关闭
需采用Linux启动和关闭服务(systemctl)的方式进行关闭和启动,不建议使用 pg_ctl 方式启动和关闭集群中的节点。
-
集群启动顺序:
主节点->备节点 说明:顺序不能颠倒,严格按照先启动主节点数据库服务,在启动所有备节点数据库服务的顺序进行。 |
-
集群关闭顺序:
备节点->主节点 说明:顺序不能颠倒,严格按照先关闭所有备节点数据库服务后,再关闭主节点数据库服务的的顺序进行。 |
3.1 启动集群数据库
(1)启动主节点
-
使用systemctl方式启动
[root@hs01 ] systemctl start hgdb-se4.5.service [root@hs01 ] systemctl status hgdb-se4.5.service |
-
查看主节点数据库的操作系统进程
[root@hs01 hgdb_log]# ps -ef|grep post root 10251 1 0 15:23 ? 00:00:00 /usr/libexec/postfix/master -w postfix 10261 10251 0 15:23 ? 00:00:00 qmgr -l -t unix -u postfix 16252 10251 0 16:30 ? 00:00:00 pickup -l -t unix -u root 24217 1 0 17:33 ? 00:00:00 /highgo/database/4.5/bin/postgres -D /highgo/database/4.5/data root 24218 24217 0 17:33 ? 00:00:00 postgres: logger process root 24220 24217 0 17:33 ? 00:00:00 postgres: checkpointer process root 24221 24217 0 17:33 ? 00:00:00 postgres: writer process root 24222 24217 0 17:33 ? 00:00:00 postgres: wal writer process root 24223 24217 0 17:33 ? 00:00:00 postgres: autovacuum launcher process root 24224 24217 0 17:33 ? 00:00:00 postgres: archiver process root 24225 24217 0 17:33 ? 00:00:00 postgres: stats collector process root 24226 24217 0 17:33 ? 00:00:00 postgres: bgworker: logical replication launcher root 24238 24217 0 17:33 ? 00:00:00 postgres: sysdba highgo 192.168.0.121(39996) idle |
-
查看主节点集群守护进程
[root@hs01 hgdb_log]# ps -ef|grep repmgrd root 24240 1 0 17:33 ? 00:00:00 /highgo/database/4.5/bin/repmgrd -d root 24719 16546 0 17:36 pts/2 00:00:00 grep --color=auto repmgrd |
-
查看主节点集群状态
- 可以通过查看数据库集群状态的命令;如果主备库显示一致且如下所示,说明集群状态正常
- 在 status 一栏中出现 * 表示正常状态,如果出现了其他的符号(比如 !,?),表明集群状态出现故障
[root@hs01 arch]# repmgr cluster show ID | Name | Role | Status | Upstream | Location | Priority | Replication lag | Last replayed LSN ----+---------------+---------+-----------+---------------+----------+----------+-----------------+------------------- 1 | 192.168.0.121 | primary | * running | | default | 100 | n/a | none 2 | 192.168.0.122 | standby | running | 192.168.0.121 | default | 100 | 0 bytes | 0/70006F0 |
(2)启动备节点
-
使用systemctl方式启动
[root@hs02 ~]# systemctl start hgdb-se4.5.service [root@hs02 ~]# systemctl status hgdb-se4.5.service |
-
查看备节点数据库的操作系统进程
[root@hs02 ~]# ps -ef|grep postg root 20568 1 0 17:37 ? 00:00:00 /highgo/database/4.5/bin/postgres -D /highgo/database/4.5/data root 20569 20568 0 17:37 ? 00:00:00 postgres: logger process root 20570 20568 0 17:37 ? 00:00:00 postgres: startup process recovering 000000010000000000000007 root 20571 20568 0 17:37 ? 00:00:00 postgres: checkpointer process root 20572 20568 0 17:37 ? 00:00:00 postgres: writer process root 20573 20568 0 17:37 ? 00:00:00 postgres: stats collector process root 20574 20568 0 17:37 ? 00:00:00 postgres: wal receiver process streaming 0/70006F0 root 20585 20568 0 17:37 ? 00:00:00 postgres: sysdba highgo 192.168.0.122(13382) idle |
-
查看备节点集群守护进程
[root@hs02 ~]# ps -ef|grep repmgrd root 20587 1 0 17:37 ? 00:00:00 /highgo/database/4.5/bin/repmgrd -d root 20638 15513 0 17:37 pts/2 00:00:00 grep --color=auto repmgrd |
-
查看备节点集群状态
[root@hs01 arch]# repmgr cluster show ID | Name | Role | Status | Upstream | Location | Priority | Replication lag | Last replayed LSN ----+---------------+---------+-----------+---------------+----------+----------+-----------------+------------------- 1 | 192.168.0.121 | primary | * running | | default | 100 | n/a | none |
3.2 关闭集群数据库
(1)确认数据库主备节点
[root@hs01 arch]# repmgr cluster show ID | Name | Role | Status | Upstream | Location | Priority | Replication lag | Last replayed LSN ----+---------------+---------+-----------+---------------+----------+----------+-----------------+------------------- 1 | 192.168.0.121 | primary | * running | | default | 100 | n/a | none 2 | 192.168.0.122 | standby | running | 192.168.0.121 | default | 100 | 0 bytes | 0/70007D0 |
(2)关闭备节点
-
使用systemctl方式关闭
[root@hs02 ~]# systemctl stop hgdb-se4.5.service [root@hs02 ~]# systemctl status hgdb-se4.5.service |
-
查看备节点数据库的操作系统进程
[root@hs02 ~]# ps -ef|grep postg root 26121 15265 0 18:22 pts/1 00:00:00 grep --color=auto postg -- 显示已无数据库进程 |
-
查看备节点集群守护进程
[root@hs02 etc]# ps -ef|grep repmgrd root 26453 15265 0 18:26 pts/1 00:00:00 grep --color=auto repmgrd -- 显示已无 repmgrd -d 守护进程 |
(3)关闭主节点
-
使用systemctl方式关闭
[root@hs01 ~]# systemctl stop hgdb-se4.5.service [root@hs01 ~]# systemctl status hgdb-se4.5.service |
-
查看主节点数据库的操作系统进程
[root@hs01 arch]# ps -ef|grep postg root 35230 16270 0 18:35 pts/1 00:00:00 grep --color=auto postg -- 显示已无数据库进程 |
-
查看主节点集群守护进程
[root@hs01 arch]# ps -ef|grep repmgrd root 35337 16270 0 18:37 pts/1 00:00:00 grep --color=auto repmgrd -- 显示已无 repmgrd -d 守护进程 |
-
查看备节点集群状态
[root@hs01 arch]# repmgr cluster show WARNING: log_switch/true: unknown name/value pair provided; ignoring ERROR: connection to database failed DETAIL: could not connect to server: Connection refused Is the server running on host "192.168.0.121" and accepting TCP/IP connections on port 5866?
DETAIL: attempted to connect using: user=sysdba password=hgdb1234 connect_timeout=2 dbname=highgo host=192.168.0.121 port=5866 fallback_application_name=repmgr
说明: 此时使用repmgr cluster show 在各个集群节点查看状态均显示无法连接数据库。此为集群关闭后的正常返回结果。 |
以上是关于如何重启数据库服务(包含单实例/流复制/集群)的主要内容,如果未能解决你的问题,请参考以下文章