Redis群集

Posted 水木,年華

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Redis群集相关的知识,希望对你有一定的参考价值。

一.Redis群集模式

redis群集有三种模式,分别是主从同步/复制、哨兵模式、Cluster,下面会讲解一下三种模式的工作方式,以及如何搭建:Cluster群集
在Redis中,实现高可用的技术主要包括持久化、主从复制、哨兵和集群,
下而分别说明它们的作用,以及解决了什么样的问题

1.1主从复制模式

主从复制是高可用Redis的基础,哨兵和集群都是在主从复制基础上实现高可用的。主从复制主要实现了数据的多机备份,以及对于读操作的负载均衡和简单的故障恢复。
缺陷:故障恢复无法自动化:写操作无法负载均衡:存储能力受到单机的限制。

1.2哨兵模式

在主从复制的基础上,哨兵实现了自动化的故障恢复。
缺陷:写操作无法负载均衡:存储能力受到单机的限制。

1.3集群

通过集群,Redis解决了写操作无法负载均衡,以及存储能力受到单机限制的问题,实现了较为完善的高可用方案。

二.Redis群集

redis是一个开源的kev-value存储系统,受到了广大互联网公司的青睐。redis3.0版本之前只支持单例模式,
在3.0版本及以后才支持集群redis集群采用P2P模式,是完全去中心化/无中心化的,不存在中心节点或者代理节点;

为了实现集群的高可用,即判新节点是否健康(能否正常使用),redis-cluster有一个投票容错机制;
如果集群中超过半数的节点投票认为某个节点挂了,那么这个节点就挂了(fail)。这是判断节点是否挂了的方法:

判断集群是否正常:
如果集群中任意一个节点挂了,而且该节点没有从节点(备份节点),那么这个集群就挂了。这是判断集群是否挂了的方法

中心化集群和非中心化集群的区别

1、中心化集群
群集区分主-次关系(区分中心和普通服务器)单点故障由mha缓解(ha不仅仅包含了冗余备份,还有高性能)

2、无中心化/去中心化集群
多台相同的服务器组成集群后,服务器之间不存在主-次关系,即中心服务器和普通服务器关系
去中心化集群,典型的特点是数据共享(每个服务器都会同步对方的数据),挂掉一个不会有太大的影响(非高并发情况下)方便横向扩容(增加服务器),可以说没有特别典型的单点故障,同时去中心化实现ha(高性能)方式是分布式来实现的

有状态和无状态的概念

无状态:加入集群之后集群认为是普通节点,没有明确的角色定位
有状态:加入集群之后有定位要求(主或从角色),有明确的角色定位

那么为什么任意一个节点挂了(没有从节点)这个集群就挂了:

因为集群(cluster)内置了16384个slot (哈希槽)存储位,并且把所有的redis物理节点映射到了这16384[0-16383]个slot上,或者说把这些slot均等的分配给了各个redis节点(集群模式)。
当需要在Redis集群存放一个数据(key-value)时,redis会先对这个key进行crc16算法,然后得到一个结果再把这个结果对16384进行求余,这个余数会对应[0-16383]其中一个槽,进而决定key-value存储到哪个节点中。所以一旦某个节点挂了,该节点对应的slot就无法使用,那么就会导致集群无法正常工作。

示例(三个节点):

节点A覆盖0-5460;
节点B覆盖5461-10922
节点c覆盖10923-16383
:每个节点有5461个哈希槽

新增一个节点
节占A覆盖1365-5460
节占B覆盖6827-10922
节点c覆盖12288-16383
节点D覆盖0-13645461-682610923-12287
:每个节点有4095个哈希槽

综上所述,每个Redis集群理论上最多可以有16384个节点。

三.Redis主从复制

3.1Redis主从复制概述

通过持久化功能,redis保证了即使在服务器重启的情况下也不会丢失(或少量丢失)数据,因为持久化会把内存中的数据保存到硬盘上,重启会从硬盘上加载数据,但是由于数据是存储在一台服务器上的,如果这台服务器出现硬盘故障等问题,也会导致数据丢失。为了避免单点故障,通常的做法是将数据库复制多个副本以部署在不同的服务器上,这样即使有一台服务器出现故障,其他服务器依然可以继续提供服务,为此,redis提供了复制(replication)功能,可以实现当一台数据库中的数据更新后,自动将更新的数据同步到其他数据库上。
在复制的概念中,数据库分为两类,一类是主数据库(master),另一类是从数据(slave)。主数据可以进行读写操作,当写操做导致数据变化时自动把数据同步给从数据库,而从数据库一般是只读的,并接收主数据同步过来的数据。一个主数据库
可以拥有多个从数据库,而一个从数据库只能拥有一个主数据库

3.2主从复制流程


①若启动一个Slave机器进程,则它会向Master机器发送一个"sync command"命令,请求同步连接

②无论是第一次连接还是重新连接,Master机器都会启动一个后台进程,将数据快照(RDB)保存到数据文件中(执行rdb操作),同时Master还会记录修改数据的所有命令并缓存在数据文件中。

③后台进程完成缓存操作之后,Master机器就会向slave机器发送数据文件,Slave端机器将数据文件保存到硬盘上,然后将其加载到内存中,接着Master机器就会将修改数据的所有操作一并发送给slave端机器。若Slave出现故障导致宕机,则恢复正常后会自动重新连接。

④Master机器收到slave端机器的连接后,将其完整的数据文件发送给Slave端,如果Mater同时收到多个slave发来的同步请求则Master会在后台启动一个进程以保存数据文件,然后将其发送给所有的slave端服务器器,确保所有的slave端服务器都正常。

四.哨兵模式

4.1哨兵模式集群架构

哨兵是Redis集群架构中非常重要的一个组件,哨兵的出现主要是解决了主从复制出现故障时需要人为干预的问题

4.2哨兵模式主要功能

①集群监控:负责监控Redis master和slave进程是否正常工作
②消息通知:如界某个Redis实例有故障,那么哨兵负责发送消息作为告警通知给管理员
③故障转移:如果master node (master角色)挂掉了,会自动转移到slave node上
④配置中心:如果故障转移发生了,通知client客户端新的master地址

使用一个或者多个哨兵(Sentinel)实例组成的监控管理系统,对redis节点进行监控在主节点出现故障的情况下,能将从节点角色中升级为主节点,进行故障转移,保证系统的可用性。

4.3哨兵监控整个系统节点的过程

①首先主节点的信息是配置在哨兵(Sentinel)的配置文件中

②哨兵节点会和配置的主节点建立起两条连接命令连接和订阅连接
PS:Redis发布订阅(pub/sub)是一种消息通信模式:发送者(pub)发送消息,订阅者 (sub)接收消息。
MQ消息代理/队列

③哨兵会通过命令连接每10s发送一次INFO命令,通过INFO命令,主节点会返回自己的run _id和自己的从节点信息

④哨兵会对这些从节点也建立两条连接命令连接和订阅连接

⑤哨兵通过命令连接向从节点发送INFO命令,获取到他的一些信息:
run_id(redis服务器id)
role(职能)
从服务器的复制偏移量offset
其他

⑥通过命令连接向服务器的sentinel:hello频道发送一条消息,内容包括自己的ip端口、runid、配置(后续投票的时候会用到)等

⑦通过订阅连接对服务器的sentinel(哨兵): hello频道做了监听,所以所有的向该频道发送的哨兵的消息都能被接受到

⑧解析监听到的消息,进行分析提取,就可以知道还有那些别的哨兵服务节点也在监听这些主从节点了,更新结构体将这些哨兵节点记录下来

⑨向观察到的其他的哨兵节点建立命令连接----没有订阅连接


通过以下的方式获取到redis集群的信息
1、配置文件指向master (ip:port)
2、从master中周期性获取slaves的信息(slave的位置ip:端口)
3、哨兵会向slaves建立连接以及建立持续性的连接(订阅连接)

4.4哨兵的工作原理

①哨兵之间相互进行命令连接目的为了在同一频道进行信息共享和监控

②哨兵们向master发送命令连接和订阅连接(周期性)

③哨兵们10/s向master发送info信息,master会回应哨兵本节点的信息状态和从节点的位置

④哨兵收到回复之后,知道从节点的位置

⑤然后再向slaves发送命令连接和订阅连接(周期性),以达到监控整个集群的目的

4.5哨兵模式下的故障迁移

4.5.1主观下线

哨兵(Sentinei)节点会每秒一次的频率向建立了命令连接的实例发送PING命令,如果在down-after-milliseconds毫秒内没有做出有效响应包括(PONG/LOADTNG/NASTERDONM)以外的响应,哨兵就会将该实例在本结构体中的状态标记为SRI_S_DOwN主观下线

4.5.2客观下线

多方求证(几个哨兵节点认为挂掉了由我们指定)
当一个哨兵节点发现主节点处于主观下线状态时,会向其他的哨兵节点发出询问,该节点是不是已经主观下线了。如果超过配置参数quorum(哨兵节点个数)个节点认为是主观下线时,该哨兵节点就会将自己维护的结构体中该主节点标记为SRIO DOWN客观下线
询问命令SENTINEL is-master-down-by-addr

4.6master选举

在认为主节点客观下线的情况下,哨兵节点,节点间会发起一次选举,命令为:SENTINEL is-master-down-by-addr
只是runid这次会将自己的runid带进去,希望接受者将自己设置为主节点。如果超过半数以上的节点返回将该节点标记为leader的情况下,会有该leader对故障进行迁移

服务器列表中挑选备选master原则:
选在线的
排除反应慢的,与原master断开时间久的

优先原则:
优先级
offset
runid

4.7故障转移

####在从节点中挑选出新的主节点
通讯正常
优先级排序
优先级相同时选择offset最大的(最接近master的)

###将该节点设置成新的主节点SLAVEOF no one,并确保在后续的INGO命令时该节点返回状态为master
###将其他的从节点设置成从新的主节点的从节点,SLAVEOF命令
###将旧的主节点变成新的主节点的从节点
mysql mha
原master 修复完成加入集群的时候,会以slave节点的身份加入


PS:优缺点
#优点:
高可用,哨兵模式是基于主从模式的,所有主从模式的优点,哨兵模式可以简单的检测和故障自动切换,系统更健壮,可用性更高

#缺点:
redis比较难支持在线扩容,在群集容量达到上限时在线扩容会变得很复杂

五.Cluster群集

redis的哨兵模式基本已经可以实现高可用、读写分离,但是在这种模式每台redis服务器都存储相同的数据,很浪费内存资源,所以在redis3.0上加入了cluster群集模式,实现了redis的分布式存储,也就是说每台redis节点存储着不同的内容根据官方推荐,集群部署至少要3台以上的master节点,最好使用3主3从六个节点的模式。
Cluster群集由多个redis服务器组成的分布式网络服务群集,群集之中有多个master主节点,每一个主节点都可读可写,节点之间会相互通信,两两相连,redis群集无中心节点

在redis-Cluster群集中,可以给每个一个主节点添加从节点,主节点和从节点直接尊循主从模型的特性,当用户需要处理更多读请求的时候,添加从节点可以扩展系统的读性能

redis-Cluster的故障转移:redis群集的主机节点内置了类似redissentinel的节点故障检测和自动故障转移功能,当群集中的某个主节点下线时,群集中的其他在线主节点会注意到这一点,并且对已经下线的主节点进行故障转移
集群进行故障转移的方法和redis sentinel进行故障转移的方法基本一样(投票方式),不同的是,在集群里面,故障转移是由集群中其他在线的主节点负责进行的,所以群集不必另外使用redis sentinel

集群master的数量:奇数。原因:投票机制,挂掉的mater也会有投票。相当于遗书。

六.搭建Redis主从复制

Master 192.168.80.1
slave1 192.168.80.2
slave2 192.168.80.3

三台服务器部署redis服务

修改redis配置文件
Master 节点

 vim /etc/redis/6379.conf 
bind 0.0.0.0
#70行,修改监听地址为0.0.0.0
daemonize yes
#137行,开启守护进程
logfile /var/log/redis_6379.log
#172行,指定日志文件目录
dir /var/lib/redis/6379
#264行,指定工作目录
appendonly yes
#700行,开启AOF持久化功能

重启服务使配置生效

/etc/init.d/redis_6379 restart

从服务器器节点

vim /etc/redis/6379.conf 
bind 0.0.0.0
#70行,修改监听地址为0.0.0.0
daemonize yes
#137行,开启守护进程
logfile /var/log/redis_6379.log
#172行,指定日志文件目录
dir /var/lib/redis/6379
#264行,指定工作目录
replicaof 192.168.80.1 6379
#288行,指定要同步的Master节点IP和端口
appendonly yes
#700行,开启AOF持久化功能

重启服务使配置生效

/etc/init.d/redis_6379 restart

验证主从效果
主节点输入

cat /var/log/redis_6379.log 或者 tail -f /var/log/redis_6379.log

[root@master ~]# redis-cli info replication 
[root@master ~]# redis-cli info replication 
# Replication
role:master
connected_slaves:2
slave0:ip=192.168.80.2,port=6379,state=online,offset=994,lag=1
slave1:ip=192.168.80.3,port=6379,state=online,offset=994,lag=1
#master启动时生成的4016进制的随机字符串,用来标识master节点
master_replid:ff20857ba7bbb81b6f36c54427a7ce4b8e60c4bd
#切换主王从的时候master节点标识会有更改(暂时是0)
master_replid2:0000000000000000000000000000000000000000

#复制流中的一个偏移量,master处理完写入命令后,会把命令的字节长度做累加记录,统计在该字段。该字段也是实现部分复制的关键字段。
master_repl_offset:994

#无论主从,都表示自己上次主实例repid1和复制偏移量;用于兄弟实例或级联复制,主库故障切换psync
second_repl_offset:-1

repl_backlog_active:1
repl_backlog_size:1048576
repl_backlog_first_byte_offset:1
repl_backlog_histlen:994

验证主从复制
在master上创建键值对,在从服务器上能能查看服务的内容



I
(4)报错排查

WARNING: The TCP backlog setting of 511 cannot be enforced because /proc/sys/net/core/somaxconn is setto the lower value of 128
当前每一个端口最大的监听队列的长度不满足这个高负载环境,需要调整
解决办法
echo 2048 > /proc/sys/net/core/somaxconn

WARNING overcommit memory is set to 0! Background save may fail under low memory condition
内存超额警告,当前内存设置为0会导致后台保存失败
解决办法:
echo "vm.overcommit_memory=1" > letc/sysctl.conf
#刷新配置文件保其生效
sysctl vm.overcommit_memory=1

MARNING you have Transparent Huge Pages (THP) support enabled in your kernel. This will create latencyand memory usage issues with Redis
内核中启用了透明大页面(THP)支持会将导致Redis的延迟和内存使用问题
解决:
echo never > /sys/kernel/mm/transparent_hugepage/enabled

Error condition on socket for SYNC: Connection reset by peer
连接被拒绝,因为主服务器可能绑定了自身IP地址

解决办法
主节点配置文件bind 0.0.0.0

搭建哨兵模式

在主从复制的基础上起到主节点自动故障转移的作用
1、作用及原理
(1) 、哨兵模式的作用
监控
哨兵会不断地检查主节点和从节点是否运作正常
自动故障转移
当主节点不能正常工作时,哨兵会开始自动故障转移操作,它会将失效主节点的其中一个从节点升级为新的主节点,并让其他从节点改为复制新的主节点
通知
哨兵可以将故障转移的结果发送给客户端

2哨兵模式的原理
它一个分布式系统,用于对主从结构中的每台服务器进行监控,当出现故障时通过投票机制选择新的 Master 并将所有slave连接到新的Master
整个运行哨兵的集群的数量不得少于3个节点

3结构
哨兵结构由两部分组成,哨兵节点和数据节点

哨兵节点
哨兵系统由一个或多个哨兵节点组成,哨兵节点是特殊的 redis节点,不存储数据

数据节点
主节点和从节点都是数据节点

4工作过程
哨兵的启动依赖于主从模式,所以须把主从模式安装好的情况下再去做哨兵模式,所以节点上都需要部署哨兵模式,哨兵模式会监控所有的 Redis 工作节点是否正常

当Master 出现问题的时候,因为其他节点与主节点失去联系,因此会投票,投票过半就认为这个Master的确出现问题,然后会通知哨兵间会推选出一个哨兵来进行故障转移工作(由该哨兵来指定哪个slave来做新的master) ,然后从slaves 中选取一个作为新的 Master

筛选方式是哨兵互相发送消息,并且参与投票,票多者当选
需要特别注意的是,客观下线是主节点才有的概念,即如果从节点和哨兵节点发生故障,被哨兵主观下线后,将不会再有后续的客观下线和故障转移操作(及哨兵模式只负责Master 的方面,而不管slaves)

当某个哨兵发现主服务器挂掉了,会将master 中的SentinelRedistance 中的 master改为SRI_S_DOWN(主观下线),并通知其他哨兵,告诉他们发现 master挂掉了
其他哨兵在接收到该哨兵发送的信息后,也会尝试去连接 master,如果超过半数(配置文件中设置的)确认master挂掉后,会将
master中的 SentinelRedistance 中的master改为SRI_O_DOWN(客观下线)

搭建哨兵模式
正常情况下不要和节点服务器放一起,这里是为了节省服务器才这样做的

节点名           IP地址
master         192.168.80.1
slave1         192.168.80.2
slave2         192.168.80.3
#17行,关闭保护模式
protected-mode no
#21行,Redis哨兵默认的监听端口
port 26379
#26行开启守护进程
daemonize yes
#36行,指定日志存放路径
logfile "/var/log/sentinel.log"
#65行,指定数据库存放路径
dir " /var/lib/redis/6379"
#84行,指定哨兵节点
#2表示,至少需要2个哨兵节点同意,才能判定主节点故障并进行故障转移sentinel monitor mymaster 192.168.80.1 6379 2
#113行,判定服务器down掉的时间周期,默认30000毫秒(30)
sentinel down-after-milliseconds mymaster 3000
#146行,故障节点的最大超时时间为180000 (180)
sentinel failover-timeout mymaster 180000

6启动哨兵模式
先启动主节点在启动从节点

cd /opt/redis-5.0.9/
redis-sentinel sentinel.conf &

查看哨兵信息

[root@slave1 redis-5.0.7]# redis-cli -p  26379 info sentinel 

watch -n 1 redis-cli -p 26379  info sentinel 

模拟故障

rm -rf /var/run/redis_6379.pid
ps -ef | grep "redis"    #查看redis-server 的进程号
kill -9 65600            #杀死Master节点上的redis-server 的进程号

查看哨兵信息

[ root@master redis-5.0.7]#redis-cli -p 26379 info sentinel
#sentinel
sentinel_masters : 1sentinel_tilt : o
sentinel_running_scripts : o
sentinel_scripts_queue_length : 0sentinel_simulate_failure_flags : o
master0 :name=mymaster,status-odown , address=192.168.80.1:6379,slaves=2, sentinels-3
Ps : status=odown :
o即objectively ,客观
status=sdown  s:主观

查看master哨兵日志验证结果

tail -f /var/ log/ sentinel.log
redis-cli -p 26379 info Sentinel

七.搭建Cluster集群

主节点负责读写请求和集群信息的维护,从节点只进行主节点数据和状态信息的复制

1 作用
(1) 数据分区
数据分区(或称数据分片)是集群最核心的功能(分布式)
集群将数据分散到多个节点,一方面突破了 Redis 单机内存大小的限制,存储容量大大增加,另一方面每个主节点都可以对外提供读服务和写服务,大大提高了集群的响应能力
Redis 单机内存大小受限问题,在介绍持久化和主从复制时都有提及
例如,如果单机内存太大,bgsave 和 bgrewriteaof 的 fork 操作可能导致主进程阻塞,主从环境下主机切换时可能导致从节点长时间无法提供服务,全量复制阶段主节点的复制缓冲区可能溢出

(2) 高可用
集群支持主从复制(模式)和主节点的自动故障转移(与哨兵类似),当任意节点发送故障时,集群仍然可以对外提供服务

(3) 数据分片
Redis 集群引入了哈希槽的概念,有 16384 个哈希槽(编号 0~16383)
集群的每个节点负责一部分哈希槽,每个 Key 通过 CRC16 校验后对 16384 取余来决定放置哪个哈希槽,通过这个值,去找到对应的插槽所对应的节点,然后直接自动跳转到这个对应的节点上进行存取操作
以 3 个节点组成的集群为例:
节点 A 包含 0~5469 号的哈希槽
节点 B 包含 5461~10922 号的哈希槽
节点 C 包含 10923~16383 号的哈希槽

以上是关于Redis群集的主要内容,如果未能解决你的问题,请参考以下文章

Redis群集部署

Redis群集

Redis 群集

配置Redis群集

基于centos 7的Redis群集原理及配置

centos 7之Redis群集详解及参数调优(内附搭建群集案例)