_主从复制

Posted 2023-04-05 shark-Gao

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了_主从复制相关的知识，希望对你有一定的参考价值。

第18章_主从复制

🏠个人主页：shark-Gao

🧑个人简介：大家好，我是shark-Gao，一个想要与大家共同进步的男人😉😉

🎉目前状况：23届毕业生，目前在某公司实习👏👏

❤️欢迎大家：这里是CSDN，我总结知识的地方，欢迎来到我的博客，我亲爱的大佬😘

🖥️个人小站：个人博客，欢迎大家访问

配套视频参考：MySQL数据库天花板–康师傅

1. 主从复制概述

1.1 如何提升数据库并发能力

在实际工作中，我们常常将Redis作为缓存与mysql配合来使用，当有请求的时候，首先会从缓存中进行查找，如果存在就直接取出。如果不存在再访问数据库，这样就提升了读取的效率，也减少了对后端数据库的访问压力。Redis的缓存架构是高并发架构中非常重要的一环。

此外，一般应用对数据库而言都是“ 读多写少 ”，也就说对数据库读取数据的压力比较大，有一个思路就是采用数据库集群的方案，做 主从架构 、进行 读写分离 ，这样同样可以提升数据库的并发处理能力。但并不是所有的应用都需要对数据库进行主从架构的设置，毕竟设置架构本身是有成本的。

如果我们的目的在于提升数据库高并发访问的效率，那么首先考虑的是如何 优化SQL和索引 ，这种方式简单有效；其次才是采用 缓存的策略 ，比如使用 Redis将热点数据保存在内存数据库中，提升读取的效率；最后才是对数据库采用 主从架构 ，进行读写分离。

按照上面的方式进行优化，使用和维护的成本是由低到高的。

1.2 主从复制的作用

主从同步设计不仅可以提高数据库的吞吐量，还有以下 3 个方面的作用。

**第1个作用：读写分离。**我们可以通过主从复制的方式来同步数据，然后通过读写分离提高数据库并发处理能力。

其中一个是Master主库，负责写入数据，我们称之为：写库。

其他都是Slave从库，负责读取数据，我们称之为：读库。

当主库进行更新的时候，会自动将数据复制到从库中，而我们在客户端读取数据的时候，会从从库进行读取。

面对“读多写少”的需求，采用读写分离的方式，可以实现更高的并发访问。同时，我们还能对从服务器进行负载均衡，让不同的读请求按照策略均匀地分发到不同的从服务器上，让读取更加顺畅。读取顺畅的另一个原因，就是减少了锁表的影响，比如我们让主库负责写，当主库出现写锁的时候，不会影响到从库进行SELECT的读取。

**第2个作用就是数据备份。**我们通过主从复制将主库上的数据复制到从库上，相当于一种热备份机制，也就是在主库正常运行的情况下进行的备份，不会影响到服务。

**第3个作用是具有高可用性。**数据备份实际上是一种冗余的机制，通过这种冗余的方式可以换取数据库的高可用性，也就是当服务器出现故障或宕机的情况下，可以切换到从服务器上，保证服务的正常运行。

2. 主从复制的原理

Slave 会从 Master 读取 binlog 来进行数据同步。

2.1 原理剖析

三个线程

实际上主从同步的原理就是基于 binlog 进行数据同步的。在主从复制过程中，会基于 3 个线程 来操作，一个主库线程，两个从库线程。

二进制日志转储线程 （Binlog dump thread）是一个主库线程。当从库线程连接的时候，主库可以将二进制日志发送给从库，当主库读取事件（Event）的时候，会在 Binlog 上 加锁 ，读取完成之后，再将锁释放掉。

从库 I/O 线程 会连接到主库，向主库发送请求更新 Binlog。这时从库的 I/O 线程就可以读取到主库的二进制日志转储线程发送的 Binlog 更新部分，并且拷贝到本地的中继日志（Relay log）。

从库 SQL 线程 会读取从库中的中继日志，并且执行日志中的事件，将从库中的数据与主库保持同步。

注意：

不是所有版本的MySQL都默认开启服务器的二进制日志。在进行主从同步的时候，我们需要先检查服务器是否已经开启了二进制日志。

除非特殊指定，默认情况下从服务器会执行所有主服务器中保存的事件。也可以通过配置，使从服务器执行特定的事件。

复制三步骤

步骤1： Master 将写操作记录到二进制日志（ binlog ）。

步骤2： Slave 将 Master 的binary log events拷贝到它的中继日志（ relay log ）；

步骤3： Slave 重做中继日志中的事件，将改变应用到自己的数据库中。 MySQL复制是异步的且串行化的，而且重启后从 接入点 开始复制。

复制的问题

复制的最大问题： 延时

2.2 复制的基本原则

每个 Slave 只有一个 Master
每个 Slave 只能有一个唯一的服务器ID
每个 Master 可以有多个 Slave

3. 一主一从架构搭建

一台 主机 用于处理所有 写请求 ，一台 从机 负责所有 读请求 ，架构图如下:

3.1 准备工作

1、准备 2台 CentOS 虚拟机（具体设置内容在P192）

2、每台虚拟机上需要安装好MySQL (可以是MySQL8.0 )

说明：前面我们讲过如何克隆一台CentOS。大家可以在一台CentOS上安装好MySQL，进而通过克隆的方式复制出1台包含MySQL的虚拟机。

注意：克隆的方式需要修改新克隆出来主机的：① MAC地址 ② hostname ③ IP 地址 ④ UUID 。

此外，克隆的方式生成的虚拟机（包含MySQL Server），则克隆的虚拟机MySQL Server的UUID相同，必须修改，否则在有些场景会报错。比如： show slave status\\G ，报如下的错误：

Last_IO_Error: Fatal error: The slave I/O thread stops because master and slave have
equal MySQL server UUIDs; these UUIDs must be different for replication to work.

修改MySQL Server 的UUID方式：

vim /var/lib/mysql/auto.cnf

systemctl restart mysqld

3.2 主机配置文件

建议mysql版本一致且后台以服务运行，主从所有配置项都配置在 [mysqld] 节点下，且都是小写字母。

具体参数配置如下：

必选

#[必须]主服务器唯一ID
server-id=1

#[必须]启用二进制日志,指名路径。比如：自己本地的路径/log/mysqlbin
log-bin=atguigu-bin

可选

#[可选] 0（默认）表示读写（主机），1表示只读（从机）
read-only=0

#设置日志文件保留的时长，单位是秒
binlog_expire_logs_seconds=6000

#控制单个二进制日志大小。此参数的最大和默认值是1GB
max_binlog_size=200M

#[可选]设置不要复制的数据库
binlog-ignore-db=test

#[可选]设置需要复制的数据库,默认全部记录。比如：binlog-do-db=atguigu_master_slave
binlog-do-db=需要复制的主数据库名字

#[可选]设置binlog格式
binlog_format=STATEMENT

重启后台mysql服务，使配置生效。

注意：

先搭建完主从复制，再创建数据库。

MySQL主从复制起始时，从机不继承主机数据。

① binlog格式设置：

格式1： STATEMENT模式 （基于SQL语句的复制(statement-based replication, SBR)）

binlog_format=STATEMENT

每一条会修改数据的sql语句会记录到binlog中。这是默认的binlog格式。

SBR 的优点：
- 历史悠久，技术成熟
- 不需要记录每一行的变化，减少了binlog日志量，文件较小
- binlog中包含了所有数据库更改信息，可以据此来审核数据库的安全等情况
- binlog可以用于实时的还原，而不仅仅用于复制
- 主从版本可以不一样，从服务器版本可以比主服务器版本高
SBR 的缺点：
- 不是所有的UPDATE语句都能被复制，尤其是包含不确定操作的时候
使用以下函数的语句也无法被复制：LOAD_FILE()、UUID()、USER()、FOUND_ROWS()、SYSDATE() (除非启动时启用了 --sysdate-is-now 选项)
- INSERT … SELECT 会产生比 RBR 更多的行级锁
- 复制需要进行全表扫描(WHERE 语句中没有使用到索引)的 UPDATE 时，需要比 RBR 请求更多的行级锁
- 对于有 AUTO_INCREMENT 字段的 InnoDB表而言，INSERT 语句会阻塞其他 INSERT 语句
- 对于一些复杂的语句，在从服务器上的耗资源情况会更严重，而 RBR 模式下，只会对那个发生变化的记录产生影响
- 执行复杂语句如果出错的话，会消耗更多资源
- 数据表必须几乎和主服务器保持一致才行，否则可能会导致复制出错

② ROW模式（基于行的复制(row-based replication, RBR)）

binlog_format=ROW

5.1.5版本的MySQL才开始支持，不记录每条sql语句的上下文信息，仅记录哪条数据被修改了，修改成什么样了。

RBR 的优点：
- 任何情况都可以被复制，这对复制来说是最 安全可靠 的。（比如：不会出现某些特定情况下的存储过程、function、trigger的调用和触发无法被正确复制的问题）
- 多数情况下，从服务器上的表如果有主键的话，复制就会快了很多
- 复制以下几种语句时的行锁更少：INSERT … SELECT、包含 AUTO_INCREMENT 字段的 INSERT、没有附带条件或者并没有修改很多记录的 UPDATE 或 DELETE 语句
- 执行 INSERT，UPDATE，DELETE 语句时锁更少
- 从服务器上采用多线程来执行复制成为可能
RBR 的缺点：
- binlog 大了很多
- 复杂的回滚时 binlog 中会包含大量的数据
- 主服务器上执行 UPDATE 语句时，所有发生变化的记录都会写到 binlog 中，而 SBR 只会写一次，这会导致频繁发生 binlog 的并发写问题
- 无法从 binlog 中看到都复制了些什么语句

③ MIXED模式（混合模式复制(mixed-based replication, MBR)）

binlog_format=MIXED

从5.1.8版本开始，MySQL提供了Mixed格式，实际上就是Statement与Row的结合。

在Mixed模式下，一般的语句修改使用statment格式保存binlog。如一些函数，statement无法完成主从复制的操作，则采用row格式保存binlog。

MySQL会根据执行的每一条具体的sql语句来区分对待记录的日志形式，也就是在Statement和Row之间选择一种。

3.3 从机配置文件

要求主从所有配置项都配置在 my.cnf 的 [mysqld] 栏位下，且都是小写字母。

必选

#[必须]从服务器唯一ID
server-id=2

可选

#[可选]启用中继日志
relay-log=mysql-relay

重启后台mysql服务，使配置生效。

注意：主从机都关闭防火墙
service iptables stop #CentOS 6
systemctl stop firewalld.service #CentOS 7

3.4 主机：建立账户并授权

#在主机MySQL里执行授权主从复制的命令
GRANT REPLICATION SLAVE ON *.* TO 'slave1'@'从机器数据库IP' IDENTIFIED BY 'abc123'; #5.5,5.7

注意：如果使用的是MySQL8，需要如下的方式建立账户，并授权slave:

CREATE USER 'slave1'@'%' IDENTIFIED BY '123456';

GRANT REPLICATION SLAVE ON *.* TO 'slave1'@'%';

#此语句必须执行。否则见下面。
ALTER USER 'slave1'@'%' IDENTIFIED WITH mysql_native_password BY '123456';

flush privileges;

注意：在从机执行show slave status\\G时报错：

Last_IO_Error: error connecting to master ‘slave1@192.168.1.150:3306’ - retry-time: 60 retries: 1 message:

Authentication plugin ‘caching_sha2_password’ reported error: Authentication requires secure connection.

查询Master的状态，并记录下File和Position的值。

show master status;

记录下File和Position的值

注意：执行完此步骤后不要再操作主服务器MySQL，防止主服务器状态值变化。

3.5 从机：配置需要复制的主机

**步骤1：**从机上复制主机的命令

CHANGE MASTER TO
MASTER_HOST='主机的IP地址',
MASTER_USER='主机用户名',
MASTER_PASSWORD='主机用户名的密码',
MASTER_LOG_FILE='mysql-bin.具体数字',
MASTER_LOG_POS=具体值;

举例：

CHANGE MASTER TO
MASTER_HOST='192.168.1.150',MASTER_USER='slave1',MASTER_PASSWORD='123456',MASTER_LOG_F
ILE='atguigu-bin.000007',MASTER_LOG_POS=154;

步骤2：

#启动slave同步
START SLAVE;

如果报错：

可以执行如下操作，删除之前的relay_log信息。然后重新执行 CHANGE MASTER TO …语句即可。

mysql> reset slave; #删除SLAVE数据库的relaylog日志文件，并重新启用新的relaylog文件

接着，查看同步状态：

SHOW SLAVE STATUS\\G;

上面两个参数都是Yes，则说明主从配置成功！

显式如下的情况，就是不正确的。可能错误的原因有：

1. 网络不通
2. 账户密码错误
3. 防火墙
4. mysql配置文件问题
5. 连接服务器时语法
6. 主服务器mysql权限

3.6 测试

主机新建库、新建表、insert记录，从机复制：

CREATE DATABASE atguigu_master_slave;

CREATE TABLE mytbl(id INT,NAME VARCHAR(16));

INSERT INTO mytbl VALUES(1, 'zhang3');

INSERT INTO mytbl VALUES(2,@@hostname);

3.7 停止主从同步

停止主从同步命令：
```
stop slave;
```
如何重新配置主从

如果停止从服务器复制功能，再使用需要重新配置主从。否则会报错如下：

重新配置主从，需要在从机上执行：

stop slave;

reset master; #删除Master中所有的binglog文件，并将日志索引文件清空，重新开始所有新的日志文件(慎用)

3.8 后续

搭建主从复制：双主双从

一个主机m1用于处理所有写请求，它的从机s1和另一台主机m2还有它的从机s2负责所有读请求。当m1主机宕机后，m2主机负责写请求，m1、m2互为备机。结构图如下：

4. 同步数据一致性问题

主从同步的要求：

读库和写库的数据一致(最终一致)；
写数据必须写到写库；
读数据必须到读库(不一定)；

4.1 理解主从延迟问题

进行主从同步的内容是二进制日志，它是一个文件，在进行 网络传输 的过程中就一定会 存在主从延迟 （比如 500ms），这样就可能造成用户在从库上读取的数据不是最新的数据，也就是主从同步中的 数据不一致性 问题。

4.2 主从延迟问题原因

在网络正常的时候，日志从主库传给从库所需的时间是很短的，即T2-T1的值是非常小的。即，网络正常情况下，主备延迟的主要来源是备库接收完binlog和执行完这个事务之间的时间差。

**主备延迟最直接的表现是，从库消费中继日志（relay log）的速度，比主库生产binlog的速度要慢。**造成原因：

1、从库的机器性能比主库要差

2、从库的压力大

3、大事务的执行

**举例1：**一次性用delete语句删除太多数据

结论：后续再删除数据的时候，要控制每个事务删除的数据量，分成多次删除。

**举例2：**一次性用insert…select插入太多数据

**举例3：**大表DDL

比如在主库对一张500W的表添加一个字段耗费了10分钟，那么从节点上也会耗费10分钟。

4.3 如何减少主从延迟

若想要减少主从延迟的时间，可以采取下面的办法：

降低多线程大事务并发的概率，优化业务逻辑
优化SQL，避免慢SQL， 减少批量操作 ，建议写脚本以update-sleep这样的形式完成。
提高从库机器的配置 ，减少主库写binlog和从库读binlog的效率差。
尽量采用 短的链路 ，也就是主库和从库服务器的距离尽量要短，提升端口带宽，减少binlog传输的网络延时。
实时性要求的业务读强制走主库，从库只做灾备，备份。

4.4 如何解决一致性问题

如果操作的数据存储在同一个数据库中，那么对数据进行更新的时候，可以对记录加写锁，这样在读取的时候就不会发生数据不一致的情况。但这时从库的作用就是 备份 ，并没有起到 读写分离 ，分担主库 读压力 的作用。

读写分离情况下，解决主从同步中数据不一致的问题，就是解决主从之间 数据复制方式 的问题，如果按照数据一致性 从弱到强 来进行划分，有以下 3 种复制方式。

方法 1：异步复制

异步模式就是客户端提交 COMMIT 之后不需要等从库返回任何结果，而是直接将结果返回给客户端，这样做的好处是不会影响主库写的效率，但可能会存在主库宕机，而Binlog还没有同步到从库的情况，也就是此时的主库和从库数据不一致。这时候从从库中选择一个作为新主，那么新主则可能缺少原来主服务器中已提交的事务。所以，这种复制模式下的数据一致性是最弱的。

方法 2：半同步复制

方法 3：组复制

异步复制和半同步复制都无法最终保证数据的一致性问题，半同步复制是通过判断从库响应的个数来决定是否返回给客户端，虽然数据一致性相比于异步复制有提升，但仍然无法满足对数据一致性要求高的场景，比如金融领域。MGR 很好地弥补了这两种复制模式的不足。

组复制技术，简称 MGR（MySQL Group Replication）。是 MySQL 在 5.7.17 版本中推出的一种新的数据复制技术，这种复制技术是基于 Paxos 协议的状态机复制。

MGR 是如何工作的

首先我们将多个节点共同组成一个复制组，在 执行读写（RW）事务 的时候，需要通过一致性协议层（Consensus 层）的同意，也就是读写事务想要进行提交，必须要经过组里“大多数人”（对应 Node 节点）的同意，大多数指的是同意的节点数量需要大于（N/2+1），这样才可以进行提交，而不是原发起方一个说了算。而针对 只读（RO）事务 则不需要经过组内同意，直接 COMMIT 即可。

在一个复制组内有多个节点组成，它们各自维护了自己的数据副本，并且在一致性协议层实现了原子消息和全局有序消息，从而保证组内数据的一致性。

MGR 将 MySQL 带入了数据强一致性的时代，是一个划时代的创新，其中一个重要的原因就是MGR 是基于 Paxos 协议的。Paxos 算法是由 2013 年的图灵奖获得者 Leslie Lamport 于 1990 年提出的，有关这个算法的决策机制可以搜一下。事实上，Paxos 算法提出来之后就作为 分布式一致性算法 被广泛应用，比如 Apache 的 ZooKeeper 也是基于 Paxos 实现的。

5. 知识延伸

在主从架构的配置中，如果想要采取读写分离的策略，我们可以 自己编写程序 ，也可以通过 第三方的中间件 来实现。

自己编写程序的好处就在于比较自主，我们可以自己判断哪些查询在从库上来执行，针对实时性要求高的需求，我们还可以考虑哪些查询可以在主库上执行。同时，程序直接连接数据库，减少了中间件层，相当于减少了性能损耗。
采用中间件的方法有很明显的优势， 功能强大 ， 使用简单 。但因为在客户端和数据库之间增加了中间件层会有一些 性能损耗 ，同时商业中间件也是有使用成本的。我们也可以考虑采取一些优秀的开源工具。

① Cobar 属于阿里B2B事业群，始于2008年，在阿里服役3年多，接管3000+个MySQL数据库的 schema,集群日处理在线SQL请求50亿次以上。由于Cobar发起人的离职，Cobar停止维护。

② Mycat 是开源社区在阿里cobar基础上进行二次开发，解决了cobar存在的问题，并且加入了许多新的功能在其中。青出于蓝而胜于蓝。

③ OneProxy 基于MySQL官方的proxy思想利用c语言进行开发的，OneProxy是一款商业收费的中间件。舍弃了一些功能，专注在性能和稳定性上。

④ kingshard 由小团队用go语言开发，还需要发展，需要不断完善。

⑤ Vitess 是Youtube生产在使用，架构很复杂。不支持MySQL原生协议，使用需要大量改造成本。

⑥ Atlas 是360团队基于mysql proxy改写，功能还需完善，高并发下不稳定。

⑦ MaxScale 是mariadb（MySQL原作者维护的一个版本）研发的中间件

⑧ MySQLRoute 是MySQL官方Oracle公司发布的中间件

主备切换：

主动切换
被动切换
如何判断主库出问题了？如何解决过程中的数据不一致性问题 ?

REDIS04_主从复制概述及搭建反客为主薪火相传原理哨兵模式集群搭建

①. 主从复制 - 概述

①. 概念:从复制,是指将一台Redis服务器的数据,复制到其他的Redis服务器。前者称为主节点(Master/Leader),后者称为从节点(Slave/Follower)数据的复制是单向的!只能由主节点复制到从节点(主节点以写为主、从节点以读为主)
②. 默认情况下,每台Redis服务器都是主节点,一个主节点可以有0个或者多个从节点,但每个从节点只能有一个主节点
③. 主从复制作用

读写分离,性能扩展(主节点负责写入、从节点负责读取)
容灾快速恢复(一般建议配置一主多从的方式、当从服务器A出现问题,可以快速切换到从服务器B)
如果当主服务器出现问题呢？这个时候可以配置一主多从集群模式A、B,A、B之间建立某种联系,当主A出现问题,马上可以切换到主B

②. 主从复制 - 环境搭建

①. 查看当前库的信息:info replication

127.0.0.1:6379> info replication
# Replication
role:master # 角色 master：主节点
connected_slaves:0 # 从机数量：0
master_replid:425bbc84c7141a0738b5d0d6cd6920a756e334e4
master_replid2:0000000000000000000000000000000000000000
master_repl_offset:0
second_repl_offset:-1
repl_backlog_active:0
repl_backlog_size:1048576
repl_backlog_first_byte_offset:0
repl_backlog_histlen:0
127.0.0.1:6379>

②. 既然需要启动多个服务,就需要配置多个配置文件。每个配置文件对应修改以下信息：
(端口号、pid文件名、日志文件名、rdb文件名)

[root@TANG2021 kconfig]# # redis.conf 【备份不使用,不修改】
[root@TANG2021 kconfig]# cp redis.conf redis_master79.conf
[root@TANG2021 kconfig]# cp redis.conf redis_sub80.conf 
[root@TANG2021 kconfig]# cp redis.conf redis_sub81.conf 
[root@TANG2021 kconfig]# ls
redis.conf  redis_master79.conf  redis_sub80.conf  redis_sub81.conf
[root@TANG2021 kconfig]#

③. 编辑redis-conf配置文件

[root@TANG2021 kconfig]# vi redis_master79.conf 
[root@TANG2021 kconfig]# vi redis_sub80.conf 
[root@TANG2021 kconfig]# vi redis_sub81.conf

# redis.conf 【备份不使用,不修改】
# 端口号
port 6379
# 日志文件名
logfile ""
# pid文件名
pidfile /var/run/redis_6379.pid
# rdb文件名
dbfilename dump.rdb

# redis_master79.conf 【做主节点】
port 6379
logfile "6379.log"
pidfile /var/run/redis_6379.pid
dbfilename dump6379.rdb

# redis_sub80.conf 【做从节点1】
port 6380
logfile "6380.log"
pidfile /var/run/redis_6380.pid
dbfilename dump6380.rdb

# redis_sub81.conf 【做从节点2】
port 6381
logfile "6381.log"
pidfile /var/run/redis_6381.pid
dbfilename dump6381.rdb

④. 根据指定的配置文件启动redis

[root@TANG2021 bin]# redis-server /usr/local/bin/kconfig/redis_master79.conf
[root@TANG2021 bin]# redis-server /usr/local/bin/kconfig/redis_sub80.conf
[root@TANG2021 bin]# redis-server /usr/local/bin/kconfig/redis_sub81.conf
[root@TANG2021 bin]# ps -ef |grep redis
polkitd    4770   4750  0 10:27 ?        00:00:00 redis-server *:6379
root       5717      1  0 10:37 ?        00:00:00 redis-server *:6380
root       5724      1  0 10:37 ?        00:00:00 redis-server *:6381
root       5729   4366  0 10:37 pts/0    00:00:00 grep --color=auto redis
[root@TANG2021 bin]#

⑤. 一主二从配置,默认情况下,每台Redis服务器都是主节点,我们一般情况下只用配置从机就好了。使用SLAVEOF host port就可以为从机配置主机了

# 6380
# SLAVEOF host port
# 二个从机 都 认 127.0.0.1 6379 为老大

127.0.0.1:6380> SLAVEOF 127.0.0.1 6379
OK
# Replication
role:slave # 角色:奴隶(从属)
master_host:127.0.0.1 # 老大的ip
master_port:6379 # 老大的端口

# 6381
127.0.0.1:6381> SLAVEOF 127.0.0.1 6379
OK
127.0.0.1:6381> info replication
# Replication
role:slave
master_host:127.0.0.1
master_port:6379

# 6378 [主机]
# 然后主机上也能看到从机的状态：
127.0.0.1:6379> info replication
# Replication
role:master # 角色：主机
connected_slaves:2 # 从机数量
slave0:ip=127.0.0.1,port=6381,state=online,offset=322,lag=1  # 从机2信息
slave1:ip=127.0.0.1,port=6380,state=online,offset=322,lag=0  # 从机1信息

# 从服务器写入操作报错
127.0.0.1:6381> set name tang
(error) READONLY You can't write against a read only replica.

⑥. 我们这里是使用命令搭建,是暂时的(重启失效),真实开发中应该在从机的配置文件中进行配置,这样的话是永久的
⑦. 配置文件方式永久生效

################################# REPLICATION #################################
#
#   +------------------+      +---------------+
#   |      Master      | ---> |    Replica    |
#   | (receive writes) |      |  (exact copy) |
#   +------------------+      +---------------+
#
# 配置主机信息
# replicaof <masterip> <masterport>
replicaof 127.0.0.1 6379

# 如果 Redis 有密码需要在配置文件设置主机密码 masterauth ******
# masterauth <master-password>

③. 主从复制 - 如何使用

①. 从机自动保存主机的所以数据

# === 主机【6379】  === 
127.0.0.1:6379> set name 张三
OK
127.0.0.1:6379> set age 25
OK
127.0.0.1:6379> keys *
age
name
127.0.0.1:6379> 

# === 主机【6380】  === 
127.0.0.1:6380> keys *
name
age

# === 主机【6381】  === 
127.0.0.1:6381> keys *
name
age

②. 从机只能读,不能写,主机可读可写但是多用于写

127.0.0.1:6380> set name 张三 # 从机【6380】写入失败
READONLY You can't write against a read only replica.

127.0.0.1:6381> set name 张三 # 从机【6381】写入失败
READONLY You can't write against a read only replica.

127.0.0.1:6379> set name 张三 # 主机【6379】写入成功
OK
127.0.0.1:6379> get name # 主机【6379】读取成功
张三

127.0.0.1:6381> get name # 从机【6380】读取成功
张三

127.0.0.1:6381> get name # 从机【6381】读取成功
张三

③. 当主机断电宕机后,默认情况下从机的角色不会发生变化 ,集群中只是失去了写操作,当主机恢复以后,又会连接上从机恢复原状
④. 当从机断电宕机后,若不是使用配置文件配置的从机,再次启动后作为主机是无法获取之前主机的数据的,若此时重新配置称为从机,又可以获取到主机的所有数据。这里就要提到一个同步原理
⑤. 第二条中提到,默认情况下,主机故障后,不会出现新的主机,有两种方式可以产生新的主机

从机手动执行命令slaveof no one,这样执行以后从机会独立出来成为一个主机
使用哨兵模式(自动选举)

⑥. 反客为主(谋朝篡位):如果主机断开了连接,我们可以使用SLAVEOF no one让自己变成主机!其他的节点就可以手动连接到最新的主节点(手动),如果这个时候老大修复了,也不能让失去的从节点回归
⑦. 薪火相传:上一个Slave可以是下一个slave的Master,Slave同样可以接收其他 slaves的连接和同步请求,那么该slave作为了链条中下一个的master, 可以有效减轻master的写压力,去中心化降低风险

用 slaveof ip port
风险是一旦某个slave宕机,后面的slave都没法备份
薪火相传:类似于一个大部门下面有100人,一个部长管理100人,这个时候部长选出10个组长出来,部长只负责管理10个组长,部长发了通知,由组长通知给对应的组员

④. 主从复制 - 原理

①. 主从复制原理解析:

当从连接上主服务器之后,从服务器向主服务发送进行数据同步消息 - 全量复制
主服务器接收到从服务器发送过来同步消息,把主服务数据进行持久化rbd文件,把rdb文件发送从服务器,从服务器拿到rdb进行读取
每次主服务器进行写操作之后,和从服务器进行数据同步(这里是主服务器主动) - 增量复制

②. 图解:

⑤. 哨兵模式 - 概述

①. 主从切换技术的方法是：当主服务器宕机后,需要手动把一台从服务器切换为主服务器,这就需要人工干预,费事费力,还会造成一段时间内服务不可用。这不是一种推荐的方式,更多时候,我们优先考虑哨兵模式。Redis从2.8开始正式提供了Sentinel(哨兵) 架构来解决这个问题。谋朝篡位的自动版,能够后台监控主机是否故障,如果故障了根据投票数自动将从库转换为主库。
②. 概述:哨兵模式是一种特殊的模式,首先Redis提供了哨兵的命令,哨兵是一个独立的进程,作为进程,它会独立运行。其原理是哨兵通过发送命令,等待Redis服务器响应,从而监控运行的多个Redis实例
③. 单哨兵模式

通过发送命令,让Redis服务器返回监控其运行状态,包括主服务器和从服务器
当哨兵监测到master宕机,会自动将slave切换成master,然后通过发布订阅模式通知其他的从服务器,修改配置文件,让它们切换主机
然而一个哨兵进程对Redis服务器进行监控,可能会出现问题(比如哨兵死了),为此,我们可以使用多个哨兵进行监控。各个哨兵之间还会进行监控,这样就形成了多哨兵模式

④. 多哨兵模式
假设主服务器宕机,哨兵1先检测到这个结果,系统并不会马上进行failover过程,仅仅是哨兵1主观的认为主服务器不可用,这个现象成为主观下线。当后面的哨兵也检测到主服务器不可用,并且数量达到一定值时,那么哨兵之间就会进行一次投票,投票的结果由一个哨兵发起,进行failover[故障转移]操作。切换成功后,就会通过发布订阅模式,让各个哨兵把自己监控的从服务器实现切换主机,这个过程称为客观下线

⑤. 哨兵模式优点

哨兵集群,基于主从复制模式,所有主从复制的优点,它都有
主从可以切换,故障可以转移,系统的可用性更好
哨兵模式是主从模式的升级,手动到自动,更加健壮

⑥. 哨兵模式缺点

Redis不好在线扩容,集群容量一旦达到上限,在线扩容就十分麻烦
实现哨兵模式的配置其实是很麻烦的,里面有很多配置项

⑥. 哨兵模式 - 配置

①. 自定义目录下新建sentinel.conf文件,名字绝不能错

# sentinel monitor 被监控的名称 host port 1
# 其中mymaster为监控对象起的服务器名称,1 为至少有多少个哨兵同意迁移的数量。
sentinel monitor mymaster 127.0.0.1 6379 1

②. 启动哨兵

[root@TANG2021 bin]# redis-sentinel  sentinel.conf 
18585:X 04 Sep 2022 13:35:09.729 # oO0OoO0OoO0Oo Redis is starting oO0OoO0OoO0Oo
18585:X 04 Sep 2022 13:35:09.729 # Redis version=5.0.8, bits=64, commit=00000000, modified=0, pid=18585, just started
18585:X 04 Sep 2022 13:35:09.729 # Configuration loaded
                _._                                                  
           _.-``__ ''-._                                             
      _.-``    `.  `_.  ''-._           Redis 5.0.8 (00000000/0) 64 bit
  .-`` .-```.  ```\\/    _.,_ ''-._                                   
 (    '      ,       .-`  | `,    )     Running in sentinel mode
 |`-._`-...-` __...-.``-._|'` _.-'|     Port: 26379
 |    `-._   `._    /     _.-'    |     PID: 18585
  `-._    `-._  `-./  _.-'    _.-'                                   
 |`-._`-._    `-.__.-'    _.-'_.-'|                                  
 |    `-._`-._        _.-'_.-'    |           http://redis.io        
  `-._    `-._`-.__.-'_.-'    _.-'                                   
 |`-._`-._    `-.__.-'    _.-'_.-'|                                  
 |    `-._`-._        _.-'_.-'    |                                  
  `-._    `-._`-.__.-'_.-'    _.-'                                   
      `-._    `-.__.-'    _.-'                                       
          `-._        _.-'                                           
              `-.__.-'                                               

18585:X 04 Sep 2022 13:35:09.731 # WARNING: The TCP backlog setting of 511 cannot be enforced because /proc/sys/net/core/somaxconn is set to the lower value of 128.
18585:X 04 Sep 2022 13:35:09.734 # Sentinel ID is 4a9ef6f1269e0848f76284eaf9808c6d4eb95303
18585:X 04 Sep 2022 13:35:09.734 # +monitor master mymaster 127.0.0.1 16379 quorum 1
18585:X 04 Sep 2022 13:35:09.735 * +slave slave 127.0.0.1:6380 127.0.0.1 6380 @ mymaster 127.0.0.1 16379
18585:X 04 Sep 2022 13:35:09.736 * +slave slave 127.0.0.1:6381 127.0.0.1 6381 @ mymaster 127.0.0.1 16379

③. 这个时候,我们将19736端口shutdown掉,看sentinel服务重新选举

                _._                                                  
           _.-``__ ''-._                                             
      _.-``    `.  `_.  ''-._           Redis 5.0.8 (00000000/0) 64 bit
  .-`` .-```.  ```\\/    _.,_ ''-._                                   
 (    '      ,       .-`  | `,    )     Running in sentinel mode
 |`-._`-...-` __...-.``-._|'` _.-'|     Port: 26379
 |    `-._   `._    /     _.-'    |     PID: 18585
  `-._    `-._  `-./  _.-'    _.-'                                   
 |`-._`-._    `-.__.-'    _.-'_.-'|                                  
 |    `-._`-._        _.-'_.-'    |           http://redis.io        
  `-._    `-._`-.__.-'_.-'    _.-'                                   
 |`-._`-._    `-.__.-'    _.-'_.-'|                                  
 |    `-._`-._        _.-'_.-'    |                                  
  `-._    `-._`-.__.-'_.-'    _.-'                                   
      `-._    `-.__.-'    _.-'                                       
          `-._        _.-'                                           
              `-.__.-'                                               

18585:X 04 Sep 2022 13:35:09.731 # WARNING: The TCP backlog setting of 511 cannot be enforced because /proc/sys/net/core/somaxconn is set to the lower value of 128.
18585:X 04 Sep 2022 13:35:09.734 # Sentinel ID is 4a9ef6f1269e0848f76284eaf9808c6d4eb95303
18585:X 04 Sep 2022 13:35:09.734 # +monitor master mymaster 127.0.0.1 16379 quorum 1
18585:X 04 Sep 2022 13:35:09.735 * +slave slave 127.0.0.1:6380 127.0.0.1 6380 @ mymaster 127.0.0.1 16379
18585:X 04 Sep 2022 13:35:09.736 * +slave slave 127.0.0.1:6381 127.0.0.1 6381 @ mymaster 127.0.0.1 16379
18585:X 04 Sep 2022 13:36:19.806 # +sdown master mymaster 127.0.0.1 16379
18585:X 04 Sep 2022 13:36:19.806 # +odown master mymaster 127.0.0.1 16379 #quorum 1/1
18585:X 04 Sep 2022 13:36:19.806 # +new-epoch 1
18585:X 04 Sep 2022 13:36:19.806 # +try-failover master mymaster 127.0.0.1 16379
18585:X 04 Sep 2022 13:36:19.811 # +vote-for-leader 4a9ef6f1269e0848f76284eaf9808c6d4eb95303 1
18585:X 04 Sep 2022 13:36:19.811 # +elected-leader master mymaster 127.0.0.1 16379
18585:X 04 Sep 2022 13:36:19.811 # +failover-state-select-slave master mymaster 127.0.0.1 16379
18585:X 04 Sep 2022 13:36:19.902 # +selected-slave slave 127.0.0.1:6381 127.0.0.1 6381 @ mymaster 127.0.0.1 16379
18585:X 04 Sep 2022 13:36:19.902 * +failover-state-send-slaveof-noone slave 127.0.0.1:6381 127.0.0.1 6381 @ mymaster 127.0.0.1 16379
18585:X 04 Sep 2022 13:36:19.969 * +failover-state-wait-promotion slave 127.0.0.1:6381 127.0.0.1 6381 @ mymaster 127.0.0.1 16379
18585:X 04 Sep 2022 13:36:20.167 # +promoted-slave slave 127.0.0.1:6381 127.0.0.1 6381 @ mymaster 127.0.0.1 16379
18585:X 04 Sep 2022 13:36:20.167 # +failover-state-reconf-slaves master mymaster 127.0.0.1 16379
18585:X 04 Sep 2022 13:36:20.256 * +slave-reconf-sent slave 127.0.0.1:6380 127.0.0.1 6380 @ mymaster 127.0.0.1 16379
18585:X 04 Sep 2022 13:36:21.210 * +slave-reconf-inprog slave 127.0.0.1:6380 127.0.0.1 6380 @ mymaster 127.0.0.1 16379
18585:X 04 Sep 2022 13:36:21.210 * +slave-reconf-done slave 127.0.0.1:6380 127.0.0.1 6380 @ mymaster 127.0.0.1 16379
18585:X 04 Sep 2022 13:36:21.310 # +failover-end master mymaster 127.0.0.1 16379
18585:X 04 Sep 2022 13:36:21.310 # +switch-master mymaster 127.0.0.1 16379 127.0.0.1 6381
18585:X 04 Sep 2022 13:36:21.310 * +slave slave 127.0.0.1:6380 127.0.0.1 6380 @ mymaster 127.0.0.1 6381
18585:X 04 Sep 2022 13:36:21.310 * +slave slave 127.0.0.1:16379 127.0.0.1 16379 @ mymaster 127.0.0.1 6381
18585:X 04 Sep 2022 13:36:51.333 # +sdown slave 127.0.0.1:16379 127.0.0.1 16379 @ mymaster 127.0.0.1 6381

④. 故障恢复原理

新主登机:从下线的主服务器的所有从服务里面挑选一个从服务,将其转成主服务,选择条件依次是:
选择优先级靠前的(优先级在redis.conf中默认：slave-priority 100,值越小优先级越高)
选择偏移量最大的(是指获得原主机数据最全的)
群仆俯首:挑选出新的主服务之后sentinel向原主服务的从服务发送slaveof新主服务的命令,复制新master
旧主俯首:当已下线的服务重新上线时,sentinel会向其发送slaveof命令,让其成为新主的从

⑦. 集合概述及环境搭建

①. 背景:容量不够,redis如何进行扩容？并发写操作, redis如何分摊？

主从模式,薪火相传模式,主机宕机,导致ip地址发生变化,应用程序中配置需要修改对应的主机地址、端口等信息
之前通过代理主机来解决,但是redis3.0中提供了解决方案。就是无中心化集群配置

②. Redis集群实现了对Redis的水平扩容,即启动N个redis节点,将整个数据库分布存储在这N个节点中,每个节点存储总数据的1/N
③. 制作6个实例,16379,16380,16381,16389,16390,16391

# 开启daemonize yes
daemonize yes
# Pid文件名字
pidfile /var/run/redis_16379.pid
# 指定端口
port 16379
# Log文件名字
logfile "16379.log"
# Dump.rdb名字
dbfilename dump16379.rdb

# redis cluster配置修改
# 打开集群模式
cluster-enabled yes    
# 设定节点配置文件名
cluster-config-file nodes-6379.conf  
# 设定节点失联时间,超过该时间(毫秒),集群自动进行主从切换
cluster-node-timeout 15000

④. 修改好redis16379.conf文件,拷贝多个redis.conf文件
使用查找替换修改另外5个文件:例如：:%s/16379/16380

[root@TANG2021 cluster]#  cp redis.conf redis16380.conf 
[root@TANG2021 cluster]#  cp redis.conf redis16381.conf 
[root@TANG2021 cluster]#  cp redis.conf redis16389.conf 
[root@TANG2021 cluster]#  cp redis.conf redis16390.conf 
[root@TANG2021 cluster]#  cp redis.conf redis16391.conf 
[root@TANG2021 cluster]# ll
总用量 448
-rw-r--r-- 1 root root 61779 9月   4 16:12 redis16379.conf
-rw-r--r-- 1 root root 61779 9月   4 16:12 redis16380.conf
-rw-r--r-- 1 root root 61779 9月   4 16:13 redis16381.conf
-rw-r--r-- 1 root root 61779 9月   4 16:13 redis16389.conf
-rw-r--r-- 1 root root 61779 9月   4 16:13 redis16390.conf
-rw-r--r-- 1 root root 61779 9月   4 16:13 redis16391.conf
-rw-r--r-- 1 root root 61779 9月   4 16:12 redis.conf

⑤. 启动6个redis服务

[root@TANG2021 cluster]# ../redis-server redis16381.conf 
[root@TANG2021 cluster]# ps -ef |grep redis
root       5229      1  0 16:25 ?        00:00:00 ../redis-server *:16389 [cluster]
root       5237      1  0 16:25 ?        00:00:00 ../redis-server *:16390 [cluster]
root       5244      1  0 16:25 ?        00:00:00 ../redis-server *:16391 [cluster]
root       5249      1  0 16:25 ?        00:00:00 ../redis-server *:16379 [cluster]
root       5263      1  0 16:25 ?        00:00:00 ../redis-server *:16380 [cluster]
root       5501      1  0 16:28 ?        00:00:00 ../redis-server *:16381 [cluster]
root       5508   3575  0 16:28 pts/0    00:00:00 grep --color=auto redis

⑥. redis集群合体:cd /opt/redis-6.2.1/src

此处不要用127.0.0.1, 请用真实IP地址
–replicas 1 采用最简单的方式配置集群,一台主机,一台从机,正好三组

[root@TANG2021 src]# ll |grep *.rb
-rwxrwxr-x 1 root root    3600 3月  12 2020 redis-trib.rb
[root@TANG2021 src]# redis-cli --cluster create --cluster-replicas 1 192.168.68.143:16379 192.168.68.143:16380 192.168.68.143:16381 192.168.68.143:16389 192.168.68.143:16390 192.168.68.143:16391
>>> Performing hash slots allocation on 6 nodes...
Master[0] -> Slots 0 - 5460
Master[1] -> Slots 5461 - 10922
Master[2] -> Slots 10923 - 16383
Adding replica 192.168.68.143:16390 to 192.168.68.143:16379
Adding replica 192.168.68.143:16391 to 192.168.68.143:16380
Adding replica 192.168.68.143:16389 to 192.168.68.143:16381
>>> Trying to optimize slaves allocation for anti-affinity
[WARNING] Some slaves are in the same host as their master
M: 050f426fbbe0c68882a3c2fe1e9a8c0fede020e9 192.168.68.143:16379
   slots:[0-5460] (5461 slots) master
M: 6cf02daaa7797e506a788acf0ceca2bc7387d284 192.168.68.143:16380
   slots:[5461-10922] (5462 slots) master
M: b994fb96b5a6e9b9aeb4d9ca9be0e5e7f0ac3df0 192.168.68.143:16381
   slots:[10923-16383] (5461 slots) master
S: 7754ce5033cef06c3844969878a1b64f17ab5dbb 192.168.68.143:16389
   replicates 050f426fbbe0c68882a3c2fe1e9a8c0fede020e9
S: a856a2fab10f875511e63aa5e2a52a9837c80176 192.168.68.143:16390
   replicates 6cf02daaa7797e506a788acf0ceca2bc7387d284
S: 3ae80e542decefa2ca19568d3a3a89eb8fd26207 192.168.68.143:16391
   replicates b994fb96b5a6e9b9aeb4d9ca9be0e5e7f0ac3df0
Can I set the above configuration? (type 'yes' to accept): yes
>>> Nodes configuration updated
>>> Assign a different config epoch to each node
>>> Sending CLUSTER MEET messages to join the cluster
Waiting for the cluster to join
..
>>> Performing Cluster Check (using node 192.168.68.143:16379)
M: 050f426fbbe0c68882a3c2fe1e9a8c0fede020e9 192.168.68.143:16379
   slots:[0-5460] (5461 slots) master
   1 additional replica(s)
S: 7754ce5033cef06c3844969878a1b64f17ab5dbb 192.168.68.143:16389
   slots: (0 slots) slave
   replicates 050f426fbbe0c68882a3c2fe1e9a8c0fede020e9
S: a856a2fab10f875511e63aa5e2a52a9837c80176 192.168.68.143:16390
   slots: (0 slots) slave
   replicates 6cf02daaa7797e506a788acf0ceca2bc7387d284
M: 6cf02daaa7797e506a788acf0ceca2bc7387d284 192.168.68.143:16380
   slots:[5461-10922] (5462 slots) master
   1 additional replica(s)
M: b994fb96b5a6e9b9aeb4d9ca9be0e5e7f0ac3df0 192.168.68.143:16381
   slots:[10923-16383] (5461 slots) master
   1 additional replica(s)
S: 3ae80e542decefa2ca19568d3a3a89eb8fd26207 192.168.68.143:16391
   slots: (0 slots) slave
   replicates b994fb96b5a6e9b9aeb4d9ca9be0e5e7f0ac3df0
[OK] All nodes agree about slots configuration.
>>> Check for open slots...
>>> Check slots coverage...
[OK] All 16384 slots covered.
[root@TANG2021 src]#

⑦. 普通方式登录
可能直接进入读主机,存储数据时,会出现MOVED重定向操作。所以,应该以集群方式登录

[root@TANG2021 cluster]# ../redis-cli -p 16379 
127.0.0.1:16379> keys *
(empty list or set)
127.0.0.1:16379> set name tang
(error) MOVED 5798 192.168.68.143:16380
127.0.0.1:16379> exit

⑧. -c:采用集群策略连接,设置数据会自动切换到相应的写主机

[root@TANG2021 cluster]# ../redis-cli -c -p 16379 
127.0.0.1:16379> keys *
(empty list or set)
127.0.0.1:16379> set name tang
-> Redirected to slot [5798] located at 192.168.68.143:16380
OK
192.168.68.143:16380> cluster nodes
3ae80e542decefa2ca19568d3a3a89eb8fd26207 192.168.68.143:16391@26391 slave b994fb96b5a6e9b9aeb4d9ca9be0e5e7f0ac3df0 0 1662280767952 6 connected
6cf02daaa7797e506a788acf0ceca2bc7387d284 192.168.68.143:16380@26380 myself,master - 0 1662280767000 2 connected 5461-10922
a856a2fab10f875511e63aa5e2a52a9837c80176 192.168.68.143:16390@26390 slave 6cf02daaa7797e506a788acf0ceca2bc7387d284 0 1662280766942 5 connected
b994fb96b5a6e9b9aeb4d9ca9be0e5e7f0ac3df0 192.168.68.143:16381@26381 master - 0 1662280766000 3 connected 10923-16383
050f426fbbe0c68882a3c2fe1e9a8c0fede020e9 192.168.68.143:16379@26379 master - 0 1662280768962 1 connected 0-5460
7754ce5033cef06c3844969878a1b64f17ab5dbb 192.168.68.143:16389@26389 slave 050f426fbbe0c68882a3c2fe1e9a8c0fede020e9 0 1662280765934 4 connected
192.168.68.143:16380> exit

# 主服务器有数据
[root@TANG2021 cluster]# ../redis-cli -c -p 16380 
127.0.0.1:16380> keys *
1) "name"
127.0.0.1:16380> exit
# 从服务器没有数据
[root@TANG2021 cluster]# ../redis-cli -c -p 16389
127.0.0.1:16389> keys *
(empty list or set)

⑧. 集群 - 经典小问题

①. redis cluster如何分配这六个节点?

一个集群至少要有三个主节点
选项 --cluster-replicas 1:表示我们希望为集群中的每个主节点创建一个从节点
分配原则尽量保证每个主数据库运行在不同的IP地址,每个从库和主库不在一个IP地址上

②. 什么是slots

一个 Redis 集群包含16384个插槽(hash slot)数据库中的每个键都属于这16384个插槽的其中一个
集群使用公式CRC16(key) %16384来计算键key属于哪个槽, 其中CRC16(key) 语句用于计算键key的CRC16校验和
集群中的每个节点负责处理一部分插槽。举
以上是关于_主从复制的主要内容，如果未能解决你的问题，请参考以下文章