基于MySQL双主的高可用解决方案理论及实践

Posted 2023-04-12

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了基于MySQL双主的高可用解决方案理论及实践相关的知识，希望对你有一定的参考价值。

参考技术A

mysql在互联网应用中已经遍地开花，但是在银行系统中，还在生根发芽的阶段。本文记录的是根据某生产系统实际需求，对数据库高可用方案从需求、各高可用技术特点对比、实施、测试等过程进行整理，完善Mysql高可用方案，同时为后续开展分布式数据库相关测试做相应准备。

存储复制技术： 传统IOE架构下，常用高可用方案，靠存储底层复制技术实现数据的一致性，优点数据安全性有保障，限制在于是依赖存储硬件，实施成本较高。

keepalived+双主复制： 两台MySQL互为主从关系，即双主模式，通过Keepalived配置虚拟IP，实现当其中的一台数据库故障时，自动切换VIP到另外一台MySQL数据库，备机快速接管业务来保证数据库的高可用。

MHA： MHA部署在每台mysql服务器上，定时探测集群中的master节点，当master出现故障时，它可以自动将最新的slave提升为新的master，然后将所有其他的slave重新指向新的master，优点在最大程度保证数据的一致性的前提下实现快速切换，最少需要3台服务器，存在数据丢失的可能性。

PXC： Percona eXtra Cluster是Percona基于galera cluster封装的集群方案。不同于普通多主复制，PXC保障强一致性和实时同步，故障切换更快。但是也需要3个节点，配置相对复杂，对性能也稍有影响。

除了上述方案外，还有MMM、Heartbeat+DRBD等高可用方案，此处不做详细介绍。

综合评估下，本次实施采用了 keepalived+mysql双主实现数据库同城双机房的高可用。MySQL版本为： 5.7.21。操作系统：Red Hat Enterprise Linux Server 7.3。

配置过程如下：

Mysql-master1: IP地址1 --以下简称master1

Mysql-master2: IP地址2 --以下简称master2

Mysql-vip : VIP地址 --应用连接使用

Mysql复制相关概念描述：

1、 Mysql主从复制图示：

2、 Mysql主从复制过程描述：

（1）master记录二进制日志：在每个事务更新数据完成之前，master在二进制日志记录这些改变。MySQL将事务写入二进制日志。在事务写入二进制日志完成后，master通知存储引擎提交事务。

（2）slave将master的binarylog拷贝到自己的中继日志：首先，slave开始一个工作线程——I/O线程。I/O线程在master上打开一个普通的连接，然后开始binlog dump process。Binlog dump process从master的二进制日志中读取事务，如果已经同步了master，它会睡眠并等待master产生新的事件。I/O线程将这些事务写入中继日志。

（3）SQL slave thread处理该过程的最后一步：SQL线程从中继日志读取事务，并重放其中的事务而更新slave的数据，使其与master中的数据一致。只要该线程与I/O线程保持一致，中继日志通常会位于OS的缓存中，所以中继日志的开销很小。

主主同步就是两台机器互为主的关系，在任何一台机器上写入都会同步至备端。

为了便于后续数据库服务器的扩展，且在整个复制环境中能够自动地切换，降低运维成本，引入了当前主流的基于Mysql GTID的复制特性，工作原理及优缺点简介如下。

3、 GTID工作原理简介：

（1） master更新数据时，会在事务前产生GTID，一同记录到Binlog日志中。

（2） slave的I/O线程将变更的binlog写入到本地的relay log中。

（3） slave的sql线程从relay log中获取GTID，然后对比slave端的binlog是否有记录。

（4）如果有记录说明该GTID的事务已经执行，slave会忽略。

（5）如果没有记录，slave就会从relay log中执行该GTID的事务，并记录到binlog。

（6）在解析的过程中会判断是否有主键，如果有就用索引，如果没有就用全部扫描。

4、 GTID优点：

（1）一个事务对应一个唯一的ID，一个GTID在一个服务器上只会执行一次。（2） GTID是用来替代传统复制的方法，GTID复制与普通复制模式的最大不同就是不需要指定二进制文件名和位置。

（3）减少手工干预和降低服务故障时间，当主机宕机之后会通过软件从众多的备机中提升一台备机为新的master。

5、 GTID也存在一些限制：

（1）不支持非事务引擎。

（2）不支持create table … select 语句复制(主库直接报错)。

（3）不允许一个sql同时更新一个事务引擎表和非事务引擎表。

（4）在一个复制组中，必须要求统一开启GTID或者是统一关闭GTID。

（5）开启GTID需要重启(5.7版本除外)。

（6）开启GTID后，就不再使用原理的传统复制方式。

（7）不支持create temporary table 和 drop temporary table语句。

（8）不支持sql_slave_skip_counter。

前置条件：

主备两个节点使用行内统一的安装部署脚本安装mysql5.7.21介质(略)

Master1端创建应用的数据库(略)

1、修改MySQL配置文件

参考相关配置规范，分别设置master1、master2的my.cnf文件，

其中server-id参数设置为不同值;

由于后续keepalived会挂起VIP，应用通过VIP连接数据库，为了避免应用程序无法通过VIP访问，需将两个节点的bind-address参数注释掉；

2、设置master1端自动半同步模式

Mysql的同步模式主要有如下3种：

a. 主从同步复制：数据完整性好，但是性能消耗略高；

b. 主从异步复制：性能消耗低，但容易出现不一致；

c. 主从半自动复制：介于上述两种之间，既保持了数据的完整性，又提高了性能；

基于上述特性，建议采用半自动同步模式，由于后续要配置为双主模式，因此任一节点其角色既为master又为slave，因此相关的master/slave插件要同时配置，过程如下。

（1）首先查看库是否支持动态加载(默认都支持)

（2）主从库上分别安装插件

作为主库，安装插件semisync_master.so

作为从库，安装插件semisync_slave.so

（3）安装完成后，从plugin表中能够看到刚刚安装的插件

（4）分别打开主从库半同步复制

同时添加到各自的my.cnf中，在后续数据库实例重启时自动加载该配置。

此时查看状态还没有启动

（5）两个节点分别启动IO进程

（6）查看半同步状态

3、将master1设为master2的主服务器

（1）在master1主机上创建授权账户，允许在master2主机上连接

（2）将主库master1数据导出

（3）将master.sql传输到master2上并导入

（4）在master2端将master1设置为自己的主库，并开启slave功能

在master2上查看slave状态

至此master1到master2的主从复制关系已经建立完成。

4、将master2设为master1的主服务器

在master1上执行

在master1上查看slave状态

1、keepalived相关概念说明：

keepalived是集群管理中保证集群高可用的一个软件解决方案，其功能类似于heartbeat，用来防止单点故障

keepalived是以VRRP协议为实现基础的，VRRP全称VirtualRouter Redundancy Protocol，即虚拟路由冗余协议。

虚拟路由冗余协议，可以认为是实现路由器高可用的协议，即将N台提供相同功能的路由器组成一个路由器组，这个组里面有一个master和多个backup，master上面有一个对外提供服务的vip，master会发组播（组播地址为224.0.0.18），当backup收不到vrrp包时就认为master宕掉了，这时就需要根据VRRP的优先级来选举一个backup当master，这样的话就可以保证路由器的高可用了。

keepalived主要有三个模块，分别是core 、check和vrrp。core模块为keepalived的核心，负责主进程的启动、维护以及全局配置文件的加载和解析。check负责健康检查，包括常见的各种检查方式。vrrp模块是来实现VRRP协议的。同时为了避免出现脑裂，应关闭防火墙或者开启防火墙但允许接收VRRP协议。

2、keepalived的安装配置

（1）配置本地yum源，在master1和master2两台服务器上安装keepalived的相关依赖包Kernel-devel/openssl-devel/popt-devl等

配置指向rhel-7.5.iso的yum本地源，步骤略

注意：如不知道keepalived需要哪些依赖包，可到下载后的源码解压目录下查看INSTALL 文件内容，安装需要的依赖包，源码安装任何一个软件都要养成查看源码包文档的习惯，比如INSTALL，README,doc等文档，可以获得很多有用的信息。

（2）在两台mysql上解压缩并编译安装keepalived

（3）master1、master2上分别配置keepalived.conf

注意上图红色字体中两个节点配置相同处及差异。

说明：keepalived只有一个配置文件keepalived.conf，里面主要包括以下几个配置区域：

· global_defs：主要是配置故障发生时的通知对象以及机器标识。

· vrrp_instance：用来定义对外提供服务的VIP区域及其相关属性。

· virtual_server：虚拟服务器定义

（4）同时两个节点上都需要添加检测脚本

作用：是当mysql停止工作时自动关闭本机的keeplived服务，从而实现将故障主机踢出热备组，因每台机器上keepalived只添加了本机为realserver，所以当mysqld正常启动后，我们还需要手动启动keepalived服务。

（5）分别启动两个节点的keepalived服务

检查两个节点keepalived启动进程

检查两个节点的vip挂载情况

（6）主备机故障切换测试

停止master2的mysql服务，看keepalived 健康检查程序是否会触发脚本，自动进行故障切换，步骤略

查看master1节点的VIP挂载情况，验证是否实现了自动切换，步骤略

说明在master2服务器的mysql服务发生故障时，触发了脚本，自动完成了切换。

（7）现在我们把master2的mysql服务开起来，并且keepalived的服务也需要启动。

即便master2的mysql服务和keepalived服务都重新开启了，master1仍然是主master了，master2未对主master的权利进行抢夺，说明设置的nopreempt参数生效了，为了保证群集的稳定性，生产环境不允许抢占配置，只有当master1的mysql服务坏掉的时候，master2才会再次成为主master，否则它永远只能当master1的备份。（注：nopreempt一般是在优先级高的mysql上设置）

Sysbench是一个模块化的、跨平台、多线程基准测试工具，可用于评估数据库负载情况，通过sysbench命令配置IP地址、端口号、用户名、密码连接到指定的数据库db1中，创建多个表，并快速插入指定条数的记录，观察主备库同步效率

(1) 下载开源工具sysbench-0.4.12.14.tar.gz，放置在相应目录下并解压

(2) 使用iso配置本地yum源并安装Sysbench如下的依赖包(步骤略)：autoconf/automake/cdbs/debhelper(>=9)/docbook-xml/docbook-xsl/libmysqlclient15-dev/libtool/xsltproc

(3) 编译sysbench

编辑配置文件/etc/ld.so.conf中添加mysql lib目录/mysql/app/5.7.21/lib，并执行命令ldconfig生效

(4) 执行sysbench压测

使用sysbench工具向主节点的db1数据库中创建5张表，并且每张表分别插入10万条记录

同时观察备机同步效率

几个重要的参数说明：

B、半自动同步模式、异步模式切换测试

(1) 检查主备同步状态，及同步参数设置

rpl_semi_sync_master_enabled参数表示启用半同步模式；

rpl_semi_sync_master_timeout参数单位为毫秒，表示主库事务等待从库返回commit成功信息超过10秒就降为异步模式，不再等待从库，等探测到从库io线程恢复后，再返回为半自动同步；

rpl_semi_sync_master_wait_no_slave参数表示事务提交后需要等待从库返回确认信息；

(2) 将slave的io线程停止

(3) 使用sysbench向master写入少量的数据，本例创建一张表，并插入10条记录，命令包装在1.sh测试脚本中

通过记录的时间戳发现，master在等待了slave10秒无响应，自动切换为异步模式，将数据写入本地。

(4) Slave启动io线程，数据自动追平

至此MySQL主主复制配置完成，运行在半自动同步模式，通过keepalived实现Mysql的HA高可用。

上线后应符合统一的标准监控策略，添加备份协议对数据进行周期备份并保存到带库中，以及定期的数据恢复测试。

由于是靠keepalived实现的高可用，还应将如下资源添加到监控管理平台：

1、对每台数据库主机的3个keepalived进程进行监控；

2、对主备节点的io线程、sql线程工作状态进行监控；

我C，MySQL双主架构，原来能这么玩

经常有朋友问，MySQL双主的一致性问题，今天简单聊一聊。

MySQL为什么要使用双主架构？

MySQL最常见的集群架构，是一主多从，主从同步，读写分离的架构。通过这种方式，能够扩充数据库的读性能，保证读库的高可用，但此时写库仍然是单点。

为了保证MySQL写库的高可用，可以在一个MySQL数据库集群中可以设置两个主库，并设置双向同步，以冗余写库的方式，来保证写库的高可用。

MySQL双主架构，会存在什么问题？

如果MySQL双主架构，同时提供服务，可能会引发数据的一致性问题。因为数据的同步有一个时间差，并发的写入可能导致数据同步失败，引起数据丢失。

举个栗子：
技术图片
如上图所述，假设主库使用了auto increment来作为自增主键：
（1）两个MySQL主库设置双向同步可以用来保证主库的高可用；
（2）数据库中现存的记录主键是1，2，3；
（3）主库1插入了一条记录，主键为4，并向主库2同步数据；
（4）数据同步成功之前，主库2也插入了一条记录，由于数据还没有同步成功，插入记录生成的主键也为4，并向主库1也同步数据；
（5）主库1和主库2都插入了主键为4的记录，双主同步失败，数据不一致；

能否在MySQL层面，保证两个主库生成的主键一定不冲突呢？

可以的，只需要为两个主库的自增ID：
（1）设置不同的初始值；
（2）设置相同的增长步长；
技术图片

如上图所示：
（1）两个MySQL主库设置双向同步可以用来保证主库的高可用；
（2）库1的自增初始值是1，库2的自增初始值是2，增长步长都为2；
（3）库1中插入数据主键为1/3/5/7，库2中插入数据主键为2/4/6/8，不冲突；
（4）数据双向同步后，两个主库会包含全部数据；
技术图片

如上图所示，两个主库最终都将包含1/2/3/4/5/6/7/8所有数据，即使有一个主库挂了，另一个主库也能够保证写库的高可用。

上述方案，依赖与数据库的配置，能不能由应用程序，来保证数据的一致性呢？

答案是肯定的，应用程序使用统一的ID生成器，可以保证ID的生成不冲突。
技术图片
如上图所示，调用方插入数据时，带入全局唯一ID，而不依赖于数据库的auto increment，也能解决这个问题。
画外音：如何生成全局唯一趋势递增的ID，不展开。

引发不一致的根本原因，是保证高可用的两个主库都对外提供服务，如果只有一个主库对外提供服务，另一个主库平时不提供服务，仅仅在主库挂了的时候提供服务，能否消除上述数据不一致呢？
答案是悲观的，仍然不行。

使用虚IP+keepalived的方式保证数据库主库的高可用，平时只有一台主库提供服务，也可能出现数据不一致。
技术图片
如上图所示：
（1）两个MySQL主库设置双向同步可以用来保证主库的高可用；
（2）只有主库1对外提供写入服务；
（3）两个主库设置相同的虚IP，在主库1挂掉或者网络异常的时候，虚IP自动漂移，备用主库顶上，保证主库的高可用；

切换过程中，由于虚IP没有变化，所以切换过程对调用方是透明的，但在极限的情况下，仍可能引发数据不一致。
技术图片
如上图所示：
（1）两个MySQL主库设置双向同步，可以用来保证主库的高可用，并设置了相同的虚IP；
（2）网络抖动前，主库1对上游提供写入服务，插入了一条记录，主键为4，并向备用主库2同步数据；
（3）突然主库1网络异常，keepalived检测出异常后，实施虚IP漂移，备用主库2开始提供服务；
（4）在主键4的数据同步成功之前，主库2插入了一条记录，也生成了主键为4的记录，结果导致数据不一致；

有没有办法缓解上述问题呢？

虚IP漂移，双主同步延时导致的数据不一致，本质上，需要在双主同步完数据之后，再实施虚IP偏移。

使用内网DNS探测，缓解上述问题：
（1）使用内网域名连接数据库，例如：db.kg.org；
（2）主库1和主库2设置双主同步，不使用相同虚IP，而是分别使用ip1和ip2；
（3）一开始db.kg.org指向ip1；
（4）用一个小脚本轮询探测ip1主库的连通性；
（5）当ip1主库发生异常时，脚本delay一个x秒的延时，等待主库2同步完数据之后，再将db.kg.org解析到ip2；
（6）应用程序以内网域名进行重连，即可自动连接到ip2主库，并保证了数据的一致性；
画外音：本质上，这是一个可用性与一致性的折衷。

总结

MySQL主库高可用，主库一致性，一些小技巧：
（1）双主同步是一种常见的保证写库高可用的方式；
（2）设置相同步长，不同初始值，可以避免auto increment生成冲突主键；
（3）不依赖数据库，业务调用方自己生成全局唯一ID是一个好方法；
（4）双主保证写库高可用，只有一个写库提供服务，并不能完全保证一致性；
（5）内网DNS探测，可以实现在主库1出现问题后，延时一个时间，再进行主库切换，以保证数据一致性，但牺牲了几秒钟的高可用；

希望大家有收获，谢转。

原创功能恢复了，“可喜可贺”。
《账号被罚了，有点不开心》
《账号被罚了，申诉的结果出来了，果然》

以上是关于基于MySQL双主的高可用解决方案理论及实践的主要内容，如果未能解决你的问题，请参考以下文章

Keepalived+MySQL 8.0.17 实现MySQL双主的高可用

基于keepalived搭建MySQL的高可用集群

我C，MySQL双主架构，原来能这么玩

mysql学习-mysql8.0配置双主复制+keepalived实现高可用架构

MySQL双主+keepalived实现高可用

keepalived+双主实现数据库的高可用