redis集群搭建及一些问题
Posted 束发读诗书
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了redis集群搭建及一些问题相关的知识,希望对你有一定的参考价值。
redis
1、简化版redis
(本套Redis集群为简化版安装部署,只需解压至普通用户家目录下或者任意目录,解压后修改脚本,执行脚本后即可使用。)
注意,此版本需要在redis配置文件中添加 protected-mode no,确认添加完成后再启动服务。
1、单机部署
1.新建普通用户,将压缩包解压到家目录下。
tar zxf rediscluster.tar.gz -C /home/sm01
2.修改scripts下的modify_userdir.sh脚本
userdir=‘/home/sm01‘ #修改为普通用户的家目录
3.修改scripts下的start_redis_cluster.sh脚本
localip="192.168.188.155" #本地IP
userdir="/home/sm01" #修改为普通用户的家目录
4.加载家目录下环境变量
source .bash_profile
5.启动脚本
sh start_redis_cluster.sh
(注意:以上操作仅限单台机器情况,并且部署的方式为三主三从方式,一共启动6个redis进程,端口分别为 7001~7006。)
6、创建集群
这个目录下 /home/redis/redis/bin
redis-trib.rb create --replicas 1 192.168.58.135:7001 192.168.58.135:7002 192.168.58.135:7003 192.168.58.135:7004 192.168.58.135:7005 192.168.58.135:7006
7、测试
上述目录下的登录redis客户端
redis-cli -h 192.168.58.135 -p 7001 -c
8、问题
1、ruby 找不着
.bash_profile为隐藏文件,查看里面是否配置了 ruby的信息
每次启动集群前加载其中ruby配置文件
2、Node xxxx:x is not empty. Either the node already knows other nodes (check with CLUSTER NODES) or contains some key in database 0
删除.aof,dump.rdb,清空nodes.conf文件,不可删除
2、多机部署
1、第一台机器部署(端口为7001~7003):
1.1.新建普通用户,将压缩包解压到家目录下。
tar zxf rediscluster.tar.gz -C /home/sm01
1.2.修改scripts下的modify_userdir.sh脚本
userdir=‘/home/sm01‘ #修改为普通用户的家目录
1.3.修改scripts下的start_redis_cluster.sh脚本
localip="192.168.188.155" #本地IP
userdir="/home/sm01" #修改为普通用户的家目录
同时注释掉不用启动的端口
1.4.加载家目录下环境变量
source .bash_profile
1.5.删除不用的文件及目录,进入redis_cluster目录
由于本机仅使用7001~7003端口,因此需要删除7004~7006目录以及其目录下的所有文件。
1.6.启动redis。
sh ~/script/start_redis_cluster.sh
1.7.检查
ps -ef|grep redis
如果有三个redis进程,则表明启动成功。
2、第二台机器部署(端口为7004~7006):
2.1.新建普通用户,将压缩包解压到家目录下。
tar zxf rediscluster.tar.gz -C /home/sm01
2.2.修改scripts下的modify_userdir.sh脚本
userdir=‘/home/sm01‘ #修改为普通用户的家目录
2.3.修改scripts下的start_redis_cluster.sh脚本
localip="192.168.188.155" #本地IP
userdir="/home/sm01" #修改为普通用户的家目录
同时注释掉不用启动的端口
2.4.加载家目录下环境变量
source .bash_profile
2.5.删除不用的文件及目录,进入redis_cluster目录
由于本机仅使用7004~7006端口,因此需要删除7001~7003目录以及其目录下的所有文件。
2.6.启动redis。
sh ~/script/start_redis_cluster.sh
2.7.检查
ps -ef|grep redis
如果有三个redis进程,则表明启动成功。
3、创建集群
3.1修改节点配置文件
创建集群的时候,修改nodes.conf
3.2创建集群
${userdir}/redis/bin/redis-trib.rb create --replicas 1 IP_1:7001 IP_1:7002 IP_1:7003 IP_2:7004 IP_2:7005 IP_2:7006
(注意:$(userdir)为该程序解压的文件路径,如果解压的目录为家目录,则$(userdir)需要改成家目录路径。)
启动后,redis自己的进程会自动分配主和从
/home/redis/redis/bin/redis-trib.rb create --replicas 1 192.168.58.136:7001 192.168.58.136:7002 192.168.58.136:7003 192.168.58.137:7004 192.168.58.137:7005 192.168.58.137:7006
如果确认这些主都分配在不同的机器上后,输入yes ,然后等待redis自己创建集群。
4、问题
4.1集群有问题
3966:M 12 Nov 10:55:31.720 #You requested maxclients of 10000 requiring at least 10032 max file descriptors.
3966:M 12 Nov 10:55:31.720 # Server can‘t set maximum open files to 10032 because of OS error: Operation not permitted.
3966:M 12 Nov 10:55:31.720 # Current maximum open files is 4096. maxclients has been reduced to 4064 to compensate for low ulimit. If you need higher maxclients increase ‘ulimit -n‘.
3966:M 12 Nov 10:55:31.734 * Node configuration loaded, I‘m 6a0147d71f1f32b70cabb177445bfa919adea47c
4.2检查
redis-trib.rb check 192.168.58.136:7001
报
[ERR] Sorry, can‘t connect to node 192.168.58.136:xxx
……
4.3修改xxx节点对应的nodes.conf
18860debef76e635b06795d7a6dca709ca0cde49 192.168.188.155:7002 master - 0 1468643278156 2 connected 5461-10922
ae5653466f624c96a7c829afbab2eb8683daac4b 192.168.188.155:7003 master - 0 1468643278758 3 connected 10923-16383
6a0147d71f1f32b70cabb177445bfa919adea47c 192.168.188.155:7001 myself,master - 0 0 1 connected 0-5460
f6bd8b2d33e2448f08f5e3c942f6a552d8c4494a 192.168.188.155:7006 slave ae5653466f624c96a7c829afbab2eb8683daac4b 0 1468643278257 6 connected
87c629fc5e2c3340d157d9db617fac722b57d453 192.168.188.155:7004 slave 6a0147d71f1f32b70cabb177445bfa919adea47c 0 1468643278758 4 connected
631a997bad244b734ad6e1873685cb3042ac5342 192.168.188.155:7005 slave 18860debef76e635b06795d7a6dca709ca0cde49 1468643279259 1468643276752 5 connected
vars currentEpoch 6 lastVoteEpoch 0
2、从头部署redis
1、redis cluster安装
1、下载和解包
cd /usr/local/
wget http://download.redis.io/releases/redis-3.2.1.tar.gz
tar -zxvf /redis-3.2.1.tar.gz
2、 编译安装
cd redis-3.2.1
make && make install
3、创建redis节点
测试我们选择2台服务器,分别为:192.168.1.237,192.168.1.238.每分服务器有3个节点。
1、我先在192.168.1.237创建3个节点:
cd /usr/local/
mkdir redis_cluster //创建集群目录
mkdir 7003 7001 7002 //分别代表三个节点 其对应端口 7003 7001 7002
//创建7003节点为例,拷贝到7003目录
cp /usr/local/redis-3.2.1/redis.conf ./redis_cluster/7003/
//拷贝到7001目录
cp /usr/local/redis-3.2.1/redis.conf ./redis_cluster/7001/
//拷贝到7002目录
cp /usr/local/redis-3.2.1/redis.conf ./redis_cluster/7002/
分别对7001,7002、7003文件夹中的3个文件修改对应的配置
2、复制下面的代码到redis.conf
daemonize yes //redis后台运行
pidfile /var/run/redis_7000.pid //pidfile文件对应7001,7002,7003
port 7000 //端口7001,7002,7003
cluster-enabled yes //开启集群 把注释#去掉
cluster-config-file nodes_7000.conf //集群的配置配置文件首次启动自动生成
cluster-node-timeout 5000 //请求超时 设置5秒够了
appendonly yes //aof日志开启 有需要就开启,它会每次写操作都记录一条日志
3、重复以上2步
在192.168.1.238创建3个节点:对应的端口改为7006,7004,7005.配置对应的改一下就可以了。
4、两台机启动各节点(两台服务器方式一样)
cd /usr/local
redis-server redis_cluster/7000/redis.conf
redis-server redis_cluster/7001/redis.conf
redis-server redis_cluster/7002/redis.conf
redis-server redis_cluster/7003/redis.conf
redis-server redis_cluster/7004/redis.conf
redis-server redis_cluster/7005/redis.conf
5、查看服务
ps -ef | grep redis #查看是否启动成功
netstat -tnlp | grep redis #可以看到redis监听端口
2、创建集群
1、集群前准备
前面已经准备好了搭建集群的redis节点,接下来我们要把这些节点都串连起来搭建集群。官方提供了一个工具:redis-trib.rb(/usr/local/redis-3.2.1/src/redis-trib.rb) 看后缀就知道这鸟东西不能直接执行,它是用ruby写的一个程序,所以我们还得安装ruby.
yum -y install ruby ruby-devel rubygems rpm-build
再用 gem 这个命令来安装 redis接口 gem是ruby的一个工具包.
gem install redis //等一会儿就好了
当然,方便操作,两台Server都要安装。
/usr/local/redis-3.2.1/src/redis-trib.rb
Usage: redis-trib <command> <options> <arguments ...>
reshard host:port
--to <arg>
--yes
--slots <arg>
--from <arg>
check host:port
call host:port command arg arg .. arg
set-timeout host:port milliseconds
add-node new_host:new_port existing_host:existing_port
--master-id <arg>
--slave
del-node host:port node_id
fix host:port
import host:port
--from <arg>
help (show this help)
create host1:port1 ... hostN:portN
--replicas <arg>
2、创建集群
/usr/local/redis-3.2.1/src/redis-trib.rb create --replicas 1 192.168.1.237:7000 192.168.1.237:7001 192.168.1.237:7003 192.168.1.238:7003 192.168.1.238:7004 192.168.1.238:7005
1、 --replicas 1
表示 自动为每一个master节点分配一个slave节点 上面有6个节点,程序会按照一定规则生成 3个master(主)3个slave(从)
2、运行中
提示Can I set the above configuration? (type ‘yes‘ to accept): yes //输入yes
3、接下来 提示 Waiting for the cluster to join..........
安装的时候在这里就一直等等等,没反应,傻傻等半天,看这句提示上面一句,Sending Cluster Meet Message to join the Cluster.
这下明白了,我刚开始在一台Server上去配,是不需要等的,这里还需要跑到Server2上做一些这样的操作。
在192.168.1.238, redis-cli -c -p 700* 分别进入redis各节点的客户端命令窗口, 依次输入
cluster meet 192.168.1.238 7000
……
回到Server1,已经创建完毕了。
查看一下 /usr/local/redis/src/redis-trib.rb check 192.168.1.237:7000
3、测试
1、说明
还是要说明一下,redis集群有16383个slot组成,通过分片分布到多个节点上,读写都发生在master节点。
2、假设测试
果断先把192.168.1.238服务Down掉,(192.168.1.238有1个Master, 2个Slave) , 跑回192.168.1.238, 查看一下 发生了什么事,192.168.1.237的3个节点全部都是Master,其他几个Server2的不见了
测试一下,依然没有问题,集群依然能继续工作。
原因: redis集群 通过选举方式进行容错,保证一台Server挂了还能跑,这个选举是全部集群超过半数以上的Master发现其他Master挂了后,会将其他对应的Slave节点升级成Master.
疑问: 要是挂的是192.168.1.237怎么办? 哥试了,cluster is down!! 没办法,超过半数挂了那救不了了,整个集群就无法工作了。 要是有三台Server,每台两Master,切记对应的主从节点
不要放在一台Server,别问我为什么自己用脑子想想看,互相交叉配置主从,挂哪台也没事,你要说同时两台crash了,呵呵哒......
3、安装遇到的问题
1、GCC没有安装或版本不对
CC adlist.o
/bin/sh: cc: command not found
make[1]: *** [adlist.o] Error 127
make[1]: Leaving directory `/usr/local/redis-3.2.1/src
make: *** [all] Error 2
解决办法:
yum install gcc
2、没有安装jemalloc
zmalloc.h:50:31:
error: jemalloc/jemalloc.h: No such file or directory
zmalloc.h:55:2: error:
#error "Newer version of jemalloc required"
make[1]: *** [adlist.o] Error
1
make[1]: Leaving directory `/data0/src/redis-2.6.2/src
make: *** [all]
Error 2
解决办法:原因是没有安装jemalloc内存分配器,
1、可以安装jemalloc 或 直接
2、输入make MALLOC=libc && make install
以上是关于redis集群搭建及一些问题的主要内容,如果未能解决你的问题,请参考以下文章