Rediso(￣︶￣)o进入正题---搭建集群模式

Posted 2021-09-04 可乐卷儿

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了Rediso(*￣︶￣*)o进入正题---搭建集群模式相关的知识，希望对你有一定的参考价值。

前言

首先单节点Redis服务器会带来单点故障，服务不可用，其次由于Redis默认是单进程，无法处理大量的并发数据请求，那么若是开启多进程又会导致cpu压力过大，重中之重的是数据丢失是一大灾难，为了避免以上情况，需要Redis服务器数量，但是增加服务器数据并不是单一的增加，需要搭建Redis集群模式，从而共享任务/资源。

一、Redis集群

1、简介

Redis集群是一个提供在多个Redis间节点间共享数据的程序集
Redis集群并不支持处理多个keys的命令,因为这需要在不同的节点间移动数据，从而达不到像Redis那样的性能，在高负载的情况下可能会导致不可预料的错误
Redis集群通过分区来提供一定程度的可用性,在实际环境中当某个节点宕机或者不可达的情况下可继续处理命令

2、Redis集群的优势

自动分割数据到不同的节点上
整个集群的部分节点失败戟者不可达的情况下能够继续处理命令

3、Redis集群的实现方法

有客户端分片
代理分片
服务器端分片

二、Redis三种模式原理介绍

Redis群集有三种模式：

主从同步/复制
哨兵模式
Cluster

1、主从模式

通过持久化功能，redis保证了即使在服务器重启的情况下也不会丢失(或少量丢失)数据，因为持久化会把内存中的数据保存到硬盘上，重启会从硬盘上加载数据，但是由于数据是存储在一台服务器上的，如果这台服务器出现硬盘故障等问题，也会导致数据丢失。为了避免单点故障，通常的做法是将数据库复制多个副本以部署在不同的服务器上，这样即使有一台服务器出现故障，其他服务器依然可以继续提供服务，为此，redis提供了复制(replication)功能，可以实现当一台数据库中的数据更新后，自动将更新的数据同步到其他数据库上。
在复制的概念中，数据库分为两类，一类是主数据库(master)，另一类是从数据(slave)。主数据可以进行读写操作，当写操做导致数据变化时自动把数据同步给从数据库，而从数据库一般是只读的，并接收主数据同步过来的数据。一个主数据库可以拥有多个从数据库，而一个从数据库只能拥有一个主数据库
主从复制流程
redis-主
1、缓存写入操作的命令
2、主redis派生一个子进程，触发RDB持久化，生成RDB快照文件
在触发RDB持久化到完成的过程中，客户端在持续写入，这段数据是保存在内存、缓存，这类的数据，靠AOF进行持久化
3、在ADB持久化完成，生成.rdb文件后，主会将.rdb文件和aof持久化的缓存命令，全部交给redis-从服务
4、在持续的主从同步过程中，客户端会持续进行写入命令操作，命令操作也会由主安按照一定的规则来同步给从服务器
redis-从
rdb文件和缓存的命令
基于以上部分进行加载以达到与master趋于一致的状态

2、哨兵模式(Sentinel)

哨兵模式集群架构
哨兵是Redis集群架构中非常重要的一个组件，哨兵的出现主要是解决了主从复制出现故障时需要人为干预的问题
哨兵模式主要功能
①：集群监控：负责监控Redis的master和slave进程是否正常工作
②：消息通知：如果某个Redis实例有故障，那么哨兵负责发送消息作为告警通知给管理员
③：故障转移：如果master node(master角色)挂掉了，会自动转移到slave node上
④：配置中心：如果故障转移发生了，通知client客户端新的master地址

使用一个或者多个哨兵(Sentinel)实例组成的系统，对redis节点进行监控在主节点出现故障的情况下，能将从节点中的一个从节点角色升级为主节点，进行故障转义，保证系统的可用性

哨兵们监控整个系统节点的过程
①：哨兵之间相互进行命令连接目的为了在同一频道进行信息共享和监控
②：哨兵们向master发送命令连接和订阅连接(周期性)
③：哨兵10/s向master发送info,iR-M会回应哨兵本节点的信息状态+从节点的位置
④：哨兵收到回复之后,知晓R-S01 R-S02的位置
⑤：然后再向slaves发送命令连接和订阅连接(周期性) ,以达到监控整个集群的目的
哨兵模式下的故障迁移
①：主观下线
哨兵(Sentinel)节点会每秒一次的频率向建立了命令连接的实例发送PING命令，如果在down-after-milliseconds毫秒内没有做出有效响应包括(PONG/ LOADING/MASTERDOWN)以外的响应，哨兵就会将该实例在本结构体中的状态标记为SRI_s_DOWN主观下线
②：客观下线
当一个哨兵节点发现主节点处于主观下线状态是，会向其他的哨兵节点发出询问，该节点是不是已经主观下线了。如果超过配置参数quorum个节点认为是主观下线时，该哨兵节点就会将自己维护的结构体中该主节点标记为SRIO DOWN客观下线询问命令SENTINEL is-master-down-by-addr
③：master选举
在认为主节点客观下线的情况下，哨兵节点节点间会发起一.次选举，命令为:SENTINEL is-master-down-by-addr只是runid这次会将自己的runid带进去，希望接受者将自己设置为主节点。如果超过半数以.上的节点返回将该节点标记为leacer的情况下，会有该leader对故障进行迁移
⑥：故障转移
在从节点中挑选出新的主节点
通讯正常
优先级排序
优先级相同时选择offset最大的( 最接近master的)
将该节点设置成新的主节点SLAVEOFnoone,并确保在后续的INGO命令时该节点返回状态为master
将其他的从节点设置成从新的主节点的从节点，SLAVEQF命令
将旧的主节点变成新的主节点的从节点

3、Cluster集群模式

主节点负责读写请求和集群信息的维护，从节点只进行主节点数据和状态信息的复制

3.1、作用

数据分区
数据分区( 或称数据分片)是集群最核心的功能( 分布式)
集群将数据分散到多个节点，一方面突破了Redis
单机内存大小的限制，存储容量大大增加，另一方面每个主节点都可以对外提供读服务和写服务，大大提高了集群的响应能力
Redis单机内存大小受限问题，在介绍持久化和主从复制时都有提及
例如，如果单机内存太大，bgsave 和bgrewriteaof的fork操作可能导致主进程阻塞，主从环境下主机切换时可能导致从节点长时间无法提供服务，全量复制阶段主节点的复制缓冲区可能溢出
高可用
集群支持主从复制(模式)和主节点的自动故障转移(与哨兵类似)，当任意节点发送故障时，集群仍然可以对外提供服务
数据分片
Redis 集群引入了哈希槽的概念，有16384 个哈希槽(编号0~16383)
集群的每个节点负责一部分哈希槽，每个Key通过CRC16校验后对16384取余来决定放置哪个哈希槽，通过这个值，去找到对应的插槽所对应的节点，然后直接自动跳转到这个对应的节点上进行存
取操作
以3个节点组成的集群为例:
节点A包含0~5469号的哈希槽
节点B包含5461~10922号的哈希槽
节点C包含10923~16383 号的哈希槽

三、搭建主从复制

实验准备

节点名	ip地址
msater	192.168.35.40
slave1	192.168.35.10
slave2	192.168.35.20

1、安装redis

三台服务器均需要安装redis，具体安装过程请参考《Redis(一)(✿◡‿◡)初体验–安装及命令工具》此篇文字

2、修改Redis配置文件

-------------------->Master节点<-----------------------------

vim /etc/ redis/ 6379. conf
70 bind 0.0.0.0		##修改监听地址为0.0.0.0
137 daemonize yes		##开启守护进程
172 logfile /var/log/redis_6379.log		##指定日志文件目录
264 dir /var/lib/redis/6379		##指定工作目录
700 appendonly yes 		##开启AOF持久化功能
/etc/init.d/redis_6379 restart 	##重启服务使配置生效
-------------------->Slave1/2节点<-----------------------------
vim /etc/redis/6379.conf
70 bind 0.0.0.0 		##修改监听地址为0.0.0.0
137 daemonize yes		##开启守护进程
172 logfile/var/log/redis_6379.log
264 dir /var/lib/redis/6379		##指定工作目录
288 replicaof 192.168.35.40 6379		##添加一条指定要同步的Master节点IP和端口
700 appendonly yes		##开启AOF持久化功能
/etc/init.d/redis_6379 restart	##重启服务使使配置生效

3、验证主从效果

cat /var/log/redis_6379.log		##master查看日志

redis-cli info replication
	# Replication
	role:master		##角色是master
	connected_slaves:2		##连接从服务器2个
	slave0:ip=192.168.35.10,port=6379,state=online,offset=238,lag=0	
	slave1:ip=192.168.35.20,port=6379,state=online,offset=238,lag=0	##master启动时生成的40位16进制的随机字符串，用来标识master节点
	master_replid:772983217a6c859cf43f95ddcca57f78ab306c55	##切换主从的时候master节点标识会有更改	
	master_replid2:0000000000000000000000000000000000000000	##复制流中的一个偏移量，master处理完写入命令后，会把命令的字节长度做累加记录，统计在该字段。该字段也是实现部分复制的关键字段
	master_repl_offset:238	
------>无论主从，以下内容都表示自己上次主实例repid1和复制偏移量;用于兄弟实例或级联复制，主库故障切换<------------
	second_repl_offset:-1
	repl_backlog_active:1
	repl_backlog_size:1048576
	repl_backlog_first_byte_offset:1
	repl_backlog_histlen:238
[root@msater ~]# redis-cli		##master登录创建kl键
	127.0.0.1:6379> keys *
	(empty list or set)
	127.0.0.1:6379> set kl 1
	OK
	127.0.0.1:6379> get kl
	"1"

master创建key，slave1和slave2同步创建

四、搭建哨兵模式

哨兵的启动依赖于主从模式，所以须把主从模式安装好的情况下再去做哨兵模式，所以节点上都需要部署哨兵模式，哨兵模式会监控所有的Redis 工作节点是否正常
实验准备

节点名	ip地址
msater	192.168.35.40
slave1	192.168.35.10
slave2	192.168.35.20

1、修改哨兵配置文件

三台服务器均需要更改

vim /opt/redis-5.0.7/sentinel.conf
17 protected-mode no		##关闭保护模式
21 port 26379		##Redis哨兵默认的监听端口
26 daemonize yes		##开启守护进程
36 logfile "/var/log/sentinel.log"		##指定日志存放路径
65 dir /var/lib/redis/6379		##指定数据库存放路径
84 sentinel monitor mymaster 192.168.35.40 6379 2	##指定哨兵节点；2：至少需要2个哨兵节点同意，才能判定主节点故障并进行故障转移
113 sentinel down-after-milliseconds mymaster 3000		##判定服务器down掉的时间周期，默认30000毫秒 (30秒)
146 sentinel failover- timeout mymaster 180000		##故障节点的最大超时时间为180000 (180秒)

2、启动哨兵模式

各服务器先启动主节点在启动从节点

cd /opt/redis-5.0.7/
redis-sentinel sentinel.conf &		##使用redis-sentinel启动，再使用sentinel.conf，&：放在在后台启动

redis-cli -p 26379 info sentinel		##查看哨兵信息；哨兵端口26379
	# Sentinel
	sentinel_masters:1
	sentinel_tilt:0
	sentinel_running_scripts:0
	sentinel_scripts_queue_length:0
	sentinel_simulate_failure_flags:0
	master0:name=mymaster,status=ok,address=192.168.35.40:6379,slaves=2,sentinels=3
[3]   完成                  redis-sentinel sentinel.conf

3、模拟故障

netstat -antp | grep redis		##查看redis-server的进程号
kill -9 94948		##杀死Master 节点_上的redis-server 的进程号

4、验证结果

tail -f /var/log/ sentinel.log		##查看时时日志

watch -n 1 redis-cli -p 26379 info sentinel	##先复制一个msater的会话，查看哨兵信息		##查看哨兵信息；status会从sdown->odown->ok,快速变化

①：status=sdown ##s表示主观下线
②：status=odown ##o即objectively客观下线

五、搭建Cluster集群

redis的集群一般需要6个节点，3主3从。方便起见，这里所有节点在同一台服务器上模拟
以端口号进行区分: 3个主节点端口号: 6001/6002/6003，对应的从节点端口号: 6004/ 6005/ 6006

1、创建6个端口的工作目录

cd /opt/redis-5.0.7/utils/
./install_server.sh	##回车，直到出现以下选项，手动修改为"/usr/local/redis/bin/redis-server"
Please select the redis executable path [ ] /usr/local/redis/bin/redis-server
ln -s /usr/local/redis/bin/* /usr/local/bin/
cd /etc/redis/
mkdir -p redis-cluster/redis600{1..6}	###创建redis 6个端口的工作目录

vim /opt/redis.sh
	#!/bin/bash
	for i in {1..6}
	do
	cp /opt/redis-5.0.7/redis.conf /etc/redis/redis-cluster/redis600$i
	cp /opt/redis-5.0.7/src/redis-cli /opt/redis-5.0.7/src/redis-server /etc/redis/redis-	cluster/redis600$i
	done
sh -x /opt/redis.sh

2、修改6个redis的配置文件

cd /etc/redis/redis-cluster/redis6001
vim redis.conf
	69 bind 127.0.0.1		##注释掉bind项或不修改，默认监听所有网卡
	88 protected -mode no		##修改，关闭保护模式
	92 port 6001		##修改，redis监听端口
	136 daemonize yes		##开启守护进程，以独立进程启动
	832 cluster-enabled yes		## 取消注释，开启群集功能
	840 cluster-config-file nodes-6001.conf		##取消注释，群集名称文件设置
	846 cluster-node-timeout 15000		##取消注释群集超时时间设置
其他五个配置文件除端口号和文件名称外其余改动相同，复制redis6001至redis6002-6006

3、启动服务

可以手动启动六次或者写入脚本执行脚本

-------------->手动启动六次<------------------
cd /etc/redis/redis-cluster/redis6001
redis-server redis.conf		###启动服务
-------------->写入脚本执行脚本<------------------
vim /opt/redis_start.sh	##根据对应配置文件启动redis
	#!/bin/bash
	for d in {1..6}
	do
	cd /etc/redis/redis-cluster/redis600$d
	redis-server redis.conf
	done
sh -x /opt/redis_start.sh
ps -ef | grep redis

4、加入集群

六个实例分为三组，每组一主一从，前面的做主节点，后面的做从节点；下面交互的时候需要输入yes才可以创建；-replicas 1表示每个主节点有一个从节点

redis-cli --cluster create 127.0.0.1:6001 127.0.0.1:6002 127.0.0.1:6003 127.0.0.1:6004 127.0.0.1:6005 127.0.0.1:6006 --cluster-replicas 1

5、测试群集

redis-cli -p 6001 -c		##加-c参数，节点之间就可以互相跳转
127.0.0.1:6001> cluster slots		##查看节点的哈希槽编号范围
1) 1) (integer) 10923
   2) (integer) 16383
   3) 1) "127.0.0.1"
      2) (integer) 6003
      3) "4d00a92e17456ea977247d17e03a6b694bb62f12"
   4) 1) "127.0.0.1"
      2) (integer) 6006
      3) "96da9ee7f44404cc667eec96fbd63d63fa7ca484"
2) 1) (integer) 5461
   2) (integer) 10922
   3) 1) "127.0.0.1"
      2) (integer) 6002
      3) "50874a35e526855d24fcd9574e2fc24a9db27147"
   4) 1) "127.0.0.1"
      2) (integer) 6005
      3) "4fc4fb848de9e8284fec1e451a1f3bc9ba12e4a4"
3) 1) (integer) 0
   2) (integer) 5460
   3) 1) "127.0.0.1"
      2) (integer) 6001
      3) "89b5c4caf0bc04943bfa0f1f6c216102d160efd2"
   4) 1) "127.0.0.1"
      2) (integer) 6004
      3) "c2db328985191ad6512b0c17bda0536e1398f915"
127.0.0.1:6001> set name kl		##新建的键，验证是否会分配到指定哈希槽
-> Redirected to slot [5798] located at 127.0.0.1:6002
OK
127.0.0.1:6002> cluster keyslot kl
(integer) 15098