redis高可用之主从复制,哨兵,集群
Posted 知己一语
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了redis高可用之主从复制,哨兵,集群相关的知识,希望对你有一定的参考价值。
redis 高可用:主从复制,哨兵,cluster 集群
一:redis 的主从复制
1.1 redis高可用分类
- 主从复制:主从复制时高可用redis 的基础,哨兵和集群都是在主从复制基础上实现高可用的。主从复制实现了数据的多机备份,以及对于读操作的负载均衡和简单的故障恢复。
- 缺陷是故障恢复无法自动化,写操作无法负载均衡;存储能力受到单机的限制。
- 哨兵:在主从复制的基础上,哨兵实现了自动化的故障恢复。
- 缺陷:写操作无法负载均衡;存储能力受到单机的限制;哨兵无法对从节点进行自动故障转移,在读写分离场景下,从节点故障会导致读服务不可用,需要对从节点做额外的监控,切换操作
- 集群:通过集群,redis解决了写操作无法负载均衡,以及存储能哪里受到单机限制的问题,实现了较为完善的高可用方案。
1.2 redis 的主从复制
主从复制,是指将一台redis服务器的数据,复制到其他redis服务器。前者称为主节点(master),后者称为从节点(slave);数据的复制时单项的,只能由主节点到从节点。
默认情况下,每台redis服务器都是主节点;且一个主节点可以有多个从节点(或者没有从节点),但是一个从节点只能由一个主节点
1.3主从复制的作用
- 数据冗余:主从复制实现了数据的热备份,是持久化之外的一种数据冗余方式。
- 故障恢复:当主节点出现问题是,可以由从节点提供服务,实现快速的故障恢复;实际上是一种服务的冗余
- 负载均衡:当主从复制的基础上,配合读写分离,可以由主节点提供写服务,由从节点提供读服务(即写redis数据时应用连接上主节点,读redis数据时,应用连接上从节点),分担服务器负载;尤其是在写少读多的场景下,通过多个从节点分担负载,可以大大提高redis服务器的并发量。
- 高可用基石:除了上述作用以外,主从复制还是哨兵和集群能够实施的基础,因此说主从复制时redis高可用的基础。
1.4主从复制的流程
- 若启动一个Slave机器进程,则它会向Master机器发送一个"sync command"命令,请求同步连接。
- 无论是第一次连接还是重新连接, Master机器都会启动一个后台进程,将数据快照保存到数据文件中(执行rdb操作) ,同时Master还会记录修改数据的所有命令并缓存在数据文件中。
- 后台进程完成缓存操作之后, Master机器就会向Slave机器发送数据文件, Slave端机器将数据文件保存到硬盘上,然后将其加载到内存中,接着Master机器就会将修改数据的所有操作一并发送给Slave端机器。若Slave出现故障导致宕机,则恢复正常后会自动重新连接。
- Master机器收到Slave端机器的连接后,将其完整的数据文件发送给Slave端机器,如果Mater同时收到多个slave发来的同步请求,则Master会在后台启动一个进程以保存数据文件,然后将其发送给所有的Slave端机器,确保所有的Slave端机器都正常。
二 : 搭建redis主从复制
2.1 安装redis
systemctl stop firewalld
setenforce 0
yum -y install gcc gcc-c++ make
cd /opt/
tar xf redis-5.0.7.tar.gz -C /opt/
cd redis-5.0.7/
make && make PREFIX=/usr/local/redis install
cd /opt/redis-5.0.7/utils/
./install_server.sh
......
#填上执行文件路径。
Please select the redis executable path [] /usr/local/redis/bin/redis-serve
ln -s /usr/local/redis/bin/* /usr/local/bin/
2.2修改配置master节点redis配置文件
host103:192.168.23.103
[root@host103 ~]# vim /etc/redis/6379.conf
#70行,修改监听地址为0.0.0.0,监听所有ip
70// bind 0.0.0.0
#137行,开启守护进程,默认开启
137// daemonize yes
#172行,指定日志文件目录,默认即可
172// logfile /var/log/redis_6379.log
#264行,指定工作目录,默认即可
264// dir /var/lib/redis/6379
#700行,开启AOF持久化功能
700// appendonly yes
:wq
#重启redis服务
[root@host103 ~]# /etc/init.d/redis_6379 restart
[root@host103 ~]# netstat -natp | grep redis
tcp 0 0 0.0.0.0:6379 0.0.0.0:* LISTEN 8041/redis-server 0
2.3 修改slave 节点的 redis 配置文件
host13:192.168.23.13; host104:192.168.23.104
[root@host104 ~]# vim /etc/redis/6379.conf
#70行,修改监听地址为0.0.0.0,监听所有ip
70// bind 0.0.0.0
#137行,开启守护进程,默认开启
137// daemonize yes
#172行,指定日志文件目录,默认即可
172// logfile /var/log/redis_6379.log
#264行,指定工作目录,默认即可
264// dir /var/lib/redis/6379
#288行,仿照287行的格式,指定要同步的master节点ip和端口
288// replicaof 192.168.23.103 6379
#700行,开启AOF持久化功能
700// appendonly yes
:wq
[root@host104 ~]# /etc/init.d/redis_6379 restart
[root@host104 ~]# netstat -natp | grep redis
2.4验证主从
在Master节点上查看日志
[root@host103 ~]# cat /var/log/redis_6379.log
....
Replica 192.168.23.104:6379 asks for synchronization
.....
Replica 192.168.23.13:6379 asks for synchronization
在Master 节点上验证从节点
[root@host103 ~]# redis-cli info replication
三 redis哨兵模式
哨兵的核心功能:在主从复制的基础上,哨兵引入了主节点故障自动转移
3.1 redis哨兵的原理
哨兵(sentinel):是一个分布式系统,用于主从结构中的每台服务器进行监控,当出现故障时通过投票机制,选择新的Master,并将所有slave 连接到新的master。所以整个运行哨兵的集群数据不得少于3台。
- 哨兵模式是分布式系统去中心化的模式.由leader和follower 组成..当leader 宕机后,follower 选举产生leader.
- 当哨兵集群宕机的服务器超过半数,则集群失效
- 组成哨兵集群的 redis 服务器数量必须是奇数个数
3.2 redis哨兵的作用
- 监控:哨兵会不断地检查主节点和从节点是否运作正常。
- 自动故障转移:当主节点不能正常工作时,哨兵会开始自动故障转移操作,它会将失效主节点放到其中一个从节点升级为新的主节点,并让其他从节点改为复制新的主节点。
- 通知(提醒):哨兵可以将故障转移的结果发送给客户端。
3.3 哨兵的组成
哨兵结构由两部分组成,哨兵节点和数据节点,哨兵节点的端口号是26379。
- 哨兵节点:哨兵系统由一个或多个哨兵节点组成,哨兵节点是特殊的redis节点,不存储数据。
- 数据节点:主节点和从节点都是数据节点。
3.4故障转移机制
(1) 由哨兵节点定期监控发现主节点是否出现了故障
每个哨兵节点每隔1秒会向主节点,从节点,其他哨兵节点发送一次ping 命令做一次心跳检测。如果主节点在一定时间范围内不回复或者是回复一个错误信息,那么这个哨兵就会认为这个主节点主观下线(单方面认为)。当超过半数哨兵节点认为该主节点主管下线了,这样就客观下线了
(2) 当主节点出现故障,此时哨兵节点会通过Raft算法(选举算法)实现选举机制共同选举出一个哨兵节点为leader,来负责处理主节点的故障转移和通知。所以,运行哨兵的集群的数量不能少于3个节点。
(3) 由leader 哨兵节点执行故障转移。过程:
- 将某一个从节点升级为新的主节点,让其他从节点指向新的主节点。
- 若原主节点恢复,也变成从节点,并指向新的主节点。
- 通知客户端主节点已经更换.
需要特别注意的是,客观下线是主节点才有的概念;如果从节点和哨兵节点发生故障,被哨兵主观下线后,不会再有后续的客观下线和故障转移操作
3.5 哨兵的主节点选举
- 过滤掉不健康(已经下线的),没有回复哨兵ping 响应的从节点。
- 选择配置文件中从节点优先级配置最高的。(replica-priority,默认为100)
- 选择复制偏移量最大,也就是最完整的从节点.
哨兵的启动依赖于主从模式,所以必须把主从模式安装好的情况下再去做哨兵模式.所有节点上都需要部署哨兵模式,哨兵模式会监控所有的redis工作节点是否正常,当master出现问题的时候,因为其他节点与主节点失去联系,因此会投票,投票过半就会认为这个master的确出现问题,然后会通知哨兵间,然后从 slave中选取一个作为新的master。
四:搭建redis哨兵模式
4.1 服务器分配
出于节约机器考虑,把哨兵节点和数据节点合并了
master节点:192.168.23.103
slave1节点:192.168.23.104
slave2 节点:192.168.23.13
systemctl stop firewalld
setenforce 0
4.2所有哨兵节点修改配置文件
在redis解压安装的时候,就在解压包的目录下有sentinel.conf,这是哨兵模式的配置文件
[root@host103 redis-5.0.7]# vim /opt/redis-5.0.7/sentinel.conf
#17行,关闭保护模式
17// protected-mode no
#21行,redis哨兵监听端口。保持默认的26379即可
21// port 26379
#26行,指定sentinel为后台启动
26// daemonize yes
#36行,指定日志存放路径
36// logfile "/var/log/sentinel.log"
#65,指定数据库存放路径
65// dir "/var/lib/redis/6379"
#84行,指定该哨兵监控192.168.23.103:6379这个主节点。
#该主节点名称为mymaster
#最后的 2 的含义为:至少2 个哨兵节点同意,才能判定主节点故障并进行故障转移
84// sentinel monitor mymaster 192.168.23.103 6379 2
#113行,判定服务器down点的时间间隔,默认为30000毫秒(30s),保持默认即可
113// sentinel down-after-milliseconds mymaster 30000
#146行,故障节点的最大超时时间为180000毫秒(180s)
146// sentinel failover-timeout mymaster 180000
4.3 启动哨兵模式,查看哨兵信息
启动哨兵模式
先启动master,再启动slave
[root@host103 redis-5.0.7]# cd /opt/redis-5.0.7/
[root@host103 redis-5.0.7]# redis-sentinel sentinel.conf &
[1] 9550
查看哨兵信息
[root@host103 redis-5.0.7]# redis-cli -p 26379 info Sentinel
4.4 故障模拟
查看redis-server的进程号
[root@host103 redis-5.0.7]# ps -ef | grep redis
结束Master 节点上的redis-server进程
#先强制停止redis-serber
[root@host103 redis-5.0.7]# kill -9 8041
[root@host103 redis-5.0.7]# ps -ef | grep redis
#删除redis的进程文件
[root@host103 redis-5.0.7]# rm -rf /var/run/redis_6379.pid
#启动redis服务
[root@host103 redis-5.0.7]# /etc/init.d/redis_6379 start
验证结果
(1),查看redis的日志
[root@host103 redis-5.0.7]# tail -f /var/log/sentinel.log
(2)查看哨兵信息
[root@host103 ~]# redis-cli -p 26379 INFO Sentinel
(3)查看redis的主配置文件
#在原来的mster节点上查看配置文件/etc/redis/6379.conf
[root@host103 ~]# vim /etc/redis/6379.conf
#在配置文件最后一行,原master重新启动后,变为了从节点,并且指向新的master节点192.168.23.104:6379
1375 replicaof 192.168.23.104 6379
五:redis的cluster集群模式
集群,即 redis cluster。是redis 3.0开始引入的分布式存储方案。
集群由多个节点(node)组成。redis的数据 分布在这些节点中。集群中的节点分为主节点和从节点;只有主机欸按负责读写请求和集群信息的维护;从节点只进行主节点数据和状态的复制
5.1 集群的作用
集群的作用 可以归纳为 两点:
- 数据分区:数据分区(或称数据分片)是集群最核心的功能。
- 集群将数据分散到多个节点,一方面突破了Redis单机内存大小的限制,存储容量大大增加;另一方面每个主节点都可以对外提供读服务和写服务,大大提高了集群的响应能力。
- Redis单机内存大小受限问题,在介绍持久化和主从复制时都有提及;例如,如果单机内存太大, bgsave和bgrewriteaof的fork操作可能导致主进程阻塞,主从环境下主机切换时可能导致从节点长时间无法提供服务,全量复制阶段主节点的复制缓冲区可能溢出。
- 高可用:集群支持主从复制和主节点的自动故障转移(与哨兵类似) :
- 当任一节点发生故障时,集群仍然可以对外提供服务。
因为数据分区这个功能,并且,每个主节点都可以对外提供读写服务,所以,就实现了负载均衡功能
5.2 redis集群的数据分片
Redis集群的数据分片:
Redis集群引入了哈希槽的概念
Redis集群有16384个哈希槽(编号0-16383)
集群的每个节点负责一部分哈希槽
创建或读取Key时通过CRC16校验后得出一个数,用该数字除以16384取余,通过余数来决定放置哪个哈希槽,通过这个值,去找到对应的插槽所对应的节点,然后直接自动跳转到这个对应的节点上进行存储或读取的操作
以3个节点组成的集群为例:
节点A包含0到5460号哈希槽
节点B包含5461到10922号哈希槽
节点C包含10923到16383号哈希槽
redis集群的主从复制模型:
集群中具有A、B、C三个节点,如果节点B失败了,整个集群就会因缺少5461-10922这个范围的槽而不可以用。
为每个节点添加一个从节点A1、B1、C1整个集群便有三个Master节点和三个slave节点组成,在节点B失败后,集群选举B1位为的主节点继续服务。当B和B1都失败后,集群将不可用。
六: 搭建redis集群模式
6.1配置redis多实例
redis的集群一般需要6个节点,3主3从。方便起见,也因为资源限制,这里所有节点在同一台服务器上模拟:以端口进行区分:3个主节点端口 6001/6002/6003,3个从节点:6004/6005/6006
[root@host103 ~]# cd /etc/redis/
#创建工作目录
[root@host103 redis]# mkdir -p redis-cluster/redis600{1..6}
#将主配置文件和 redis-cli,redis-server可执行文件复制到各个实例的工作目录中
#redis.conf :redis 的配置文件
#redis-cli : redis 客户端工具
#redis-server: redis 的主服务,启动redis节点
[root@host103 redis]# for i in {1..6}
> do
> cp /opt/redis-5.0.7/redis.conf /etc/redis/redis-cluster/redis600$i
> cp /opt/redis-5.0.7/src/redis-cli /opt/redis-5.0.7/src/redis-server /etc/redis/redis-cluster/redis600$i
> done
[root@host103 redis]# ls -R /etc/redis/redis-cluster/
6.2修改配置文件,开启集群功能
其他5个目录的配置文件以此类推,注意6个端口都要不一样
[root@host103 redis]# cd /etc/redis/redis-cluster/redis6001
[root@host103 redis6001]# vim redis.conf
#69行,
69// #bind 127.0.0.1,注释bind项,默认监听所有网卡
#88行,关闭保护模式
88// protected-mode no
#92行,修改redis监听端口
92// port 6001
#136行,开启守护进程,以独立进程启动
136// daemonize yes
#700行,开启aof持久化
700// appendonly yes
#832行,取消注释,开启集群功能
832// cluster-enabled yes
#840行,取消注释,设置集群文件名称
840// cluster-config-file nodes-6001.conf
#846行,取消注释,设置集群超时时间
846// cluster-node-timeout 15000
因为是在一台机器上模拟,所以要修改端口号。如果是在多台主机上做,就不用改端口。
同样,bind 监听,因为是在一台主机上做,所以注释。如果是在多台主机做,就要监听各自的物理ip地址
6.3 启动redis节点
分别进入6个目录,执行命令 redis-server redis.conf
[root@host103 redis6001]# for i in {1..6}
> do
> cd /etc/redis/redis-cluster/redis600$i
> redis-server redis.conf
> done
[root@host103 redis6006]# ps -ef | grep redis
6.4启动集群
因为是在一台主机上做,所以就用127.0.0.1.如果是不同的主机上,则ip要区分清楚
#启动集群。前面的三个为主,后面的做从节点。下面交互时,需要输入yes才可以创建
#--cluster-replicase 1 表示每个主节点有1个从节点。
[root@host103 redis6006]# redis-cli --cluster create \\
> 127.0.0.1:6001 127.0.0.1:6002 127.0.0.1:6003 \\
> 127.0.0.1:6004 127.0.0.1:6005 127.0.0.1:6006 \\
> --cluster-replicas 1
6.5 验证集群
启动集群模式连接数据库,查看哈希槽
# -p 指点端口
#-c ,启动集群模式,节点之间可以互相跳转
[root@host103 ~]# redis-cli -p 6001 -c
#查看集群哈希槽编号范围
127.0.0.1:6001> cluster slots
连接主库,写入数据
127.0.0.1:6001> set boss wanglei
OK
127.0.0.1:6001> set teacher zhangsan
-> Redirected to slot [12541] located at 127.0.0.1:6003
OK
集群中查看键值,获取键的哈希值
127.0.0.1:6003> keys *
1) "teacher"
127.0.0.1:6003> get boss
-> Redirected to slot [4126] located at 127.0.0.1:6001
"wanglei"
127.0.0.1:6001> keys *
1) "boss"
127.0.0.1:6001> CLUSTER KEYSLOT boss
(integer) 4126
在从节点查看
[root@host103 ~]# redis-cli -p 6004 -c
127.0.0.1:6004> keys *
(empty list or set)
127.0.0.1:6004> exit
[root@host103 ~]# redis-cli -p 6005 -c
127.0.0.1:6005> keys *
1) "teacher"
127.0.0.1:6005> exit
[root@host103 ~]# redis-cli -p 6006 -c
127.0.0.1:6006> keys *
1) "boss"
127.0.0.1:6006> get teacher
-> Redirected to slot [12541] located at 127.0.0.1:6003
"zhangsan"
127.0.0.1:6003>
以上是关于redis高可用之主从复制,哨兵,集群的主要内容,如果未能解决你的问题,请参考以下文章
Redis高可用集群方案(主从复制,哨兵模式,Redis集群)