redis主从复制

Posted 2021-07-04 小刘你最强

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了redis主从复制相关的知识，希望对你有一定的参考价值。

redis主从复制

主从复制简介

互联网“三高”架构

高并发
高性能
高可用

为了避免单点redis服务器故障，准备多台服务器，互相连通。将数据复制多个副本保存在不同的服务器上，连接在一起，并保证数据是否同步，即使有其中一台服务器宕机，其他服务器依然可以继续提供服务，实现redis的高可用，同时实现数据冗余备份。

多态服务器连接方案

在这里插入图片描述

提供多数据方：master
主服务器，主节点，主库
主客户端
接受数据方：slave
从服务器，从节点，从库
从客户端
需要解决的问题
数据同步
核心工作
master的数据复制到slave中

主从复制

主从复制即将master中的数据即时、有效的复制到slave中
特征：一个master可以拥有多个slave，一个slave只对应一个master
职责：

master
写数据
执行写操作时，将出现变化的数据自动同步到slave
读数据（可忽略）
slave
读数据
写数据（禁止）

高可用集群

在这里插入图片描述

主从复制的作用

读写分离：master写，slave读，提高服务器的读写负载能力
负载均衡：基于主从结构，配合读写分离，有slave分担master负载，并根据需求的变化，改变slave的数量，通过多个从节点分担数据读取负载，大大提高redis服务器并发量与数据吞吐量
故障恢复：当master出现问题时，有slave提供服务，实现快速的故障恢复
数据冗余：实现数据热备份，是持久化之外的一种数据冗余方式
高可用基石：基于主从复制，构建哨兵模式与集群，实现redis的高可用方案

主从复制工作流程

总述

主从复制过程大体可以分为3个阶段

建立连接节点（即准备阶段）
数据同步阶段
命令传播阶段

在这里插入图片描述

阶段一：建立连接

建立slave到master的连接，使master能够识别slave，并保存slave端口号

建立连接工作流程

设置master的地址和端口号，保存master信息
建立socket连接
发送ping命令（定时器任务）
身份验证
发送slave端口信息
至此，主从连接成功

状态：

slave：保存master的地址和端口
master：保存slave的端口
总体：之间创建了连接的socket

在这里插入图片描述
主从连接（slave连接master）

方式一：客户端发送命令

slaveof <masterip> <masterport>

方式二：启动服务器参数

redis-server -slaveof <masterip> <masterport>

方式三：服务器配置

slaveof <masterip> <masterport>

主从断开连接

客户端发送命令

slaveof no one

说明：slave断开连接后，不会删除已有的数据，只是不在接受master的数据。

授权访问

master配置文件设置密码

requirepass <password>

master客户端发送命令设置密码

config set requirepass <password>
config get requirepass

slave客户端发送命令设置密码

auth <password>

slave配置文件设置密码

masterauth <password>

启动客户端设置密码

redis-cli -a <password>

阶段二：数据同步

在slave初次连接master后，复制master中的所有数据到slave
将slave的数据库状态更新成master当前的数据库状态

数据同步阶段工作流程

请求同步
创建RDB同步数据
恢复RDB同步数据
请求部分同步数据
恢复部分同步数据
至此，数据同步工作完成

状态：

slave：具有master端全部数据，包含RDB过程接收的数据
master：保存slave当前数据同步的位置
总体：之间完成了数据克隆
在这里插入图片描述

数据同步阶段master说明

如果master数据量巨大，数据同步阶段应该避免流量高峰期，避免造成master阻塞，影响业务正常执行
复制缓冲区大小设定不合理，会导致数据溢出。如进行全量复制周期太长，进行部分赋值时发现数据已经存在丢失的情况，必须进行第二次全量复制，致使slave陷入死循环状态,修改缓冲区大小操作如下
```
repl-backlog-size lmb
```
master单机内存占用主机内存的比例不应过大，建议使用50-70%的内存，留下30-50%的内存用于执行bgsave命令和创建复制缓冲区

数据同步阶段slave说明

为避免slave进行全量复制、部分复制时服务器响应阻塞或数据不同步，建议关闭此期间的对外服务
```
slave-server-stale-data yes|no
```
数据同步阶段，master发送给slave信息可以理解master是slave的一个客户端，主动向slave发送命令
多个slave同时对master请求数据同步，master发送的RDB文件增多，会对带宽造成巨大冲击，如果master宽带不足，因此数据同步需要根据业务需求，适量错峰。
slave过多时，建议调整拓扑结构，由一主多从结构变为树状结构，中间接待你即是master,也是slave。注意使用树状结构时，由于层级深度，导致深度越高的slave与最顶层master间数据同步延迟较大，数据一致性变差，应谨慎选择

阶段三：命令传播

实时的数据同步

当master数据库状态被修改后，导致主从服务器数据库状态不一致，此时需要让主从数据同步到一致的状态，同步的动作称为命令传播
master将接收到的数据变更命令发送给slave，slave接收命令后执行命令

命令传播阶段的部分复制

部分复制的三个要素

服务器运行id（run id）
主服务器的复制积压缓冲区
主从服务器的复制偏移量

服务器运行ID（runid）

概念：服务器运行ID是每一台服务器每次运行的身份识别码，一台服务器多次运行可以生成多个运行id

组成：运行id由40位字符组成，是一个随机的十六进制字符，例如：fdc9ff13b9bbaab28db42b3d50f852bb5e3fcdce

作用：运行id被用于在服务器间进行传输，识别身份。如果想两次操作均对同一台服务器进行，必须每次操作携带对应的运行id，用于对方识别。

实现方式：运行id在每台服务器启动时自动生成的，master在首次连接slave时，会将自己的运行ID发送给slave，slave保存此ID，通过info Server命令，可以查看节点的runid

复制缓冲区

概念：复制缓冲区，又名复制积压缓冲区，是一个先进先出（FIFO）的队列，用于存储服务器执行过的命令，每次传播命令，master都会将传播的命令记录下来，并存储在复制缓冲区。
复制缓冲区默认数据存储空间大小是1M，由于存储空间大小是固定的，当入队元素的数量大于队列长度时，最先入队的元素会被弹出，而新元素会被放入队列。

由来：每台服务器启动时，如果开启有AOF或被连接成为master节点，即创建复制缓冲区。

作用：用于保存master收到的所有指令（仅影响数据变更的指令，例如set，select）

数据来源：当master接收到主客户端的指令时，除了将指令执行，会将该指令存储到缓冲区中

组成