redis集群搭建及一些问题

Posted 束发读诗书

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了redis集群搭建及一些问题相关的知识,希望对你有一定的参考价值。

redis

1、简化版redis

    (本套Redis集群为简化版安装部署,只需解压至普通用户家目录下或者任意目录,解压后修改脚本,执行脚本后即可使用。)

    注意,此版本需要在redis配置文件中添加 protected-mode no,确认添加完成后再启动服务。

1、单机部署

1.新建普通用户,将压缩包解压到家目录下。

tar zxf rediscluster.tar.gz -C /home/sm01

2.修改scripts下的modify_userdir.sh脚本

userdir=‘/home/sm01‘  #修改为普通用户的家目录

3.修改scripts下的start_redis_cluster.sh脚本

localip="192.168.188.155"   #本地IP

userdir="/home/sm01"    #修改为普通用户的家目录

4.加载家目录下环境变量

source .bash_profile

5.启动脚本

sh  start_redis_cluster.sh

(注意:以上操作仅限单台机器情况,并且部署的方式为三主三从方式,一共启动6个redis进程,端口分别为 7001~7006。)

6、创建集群

这个目录下 /home/redis/redis/bin

redis-trib.rb create --replicas  1  192.168.58.135:7001 192.168.58.135:7002 192.168.58.135:7003 192.168.58.135:7004 192.168.58.135:7005 192.168.58.135:7006

7、测试

上述目录下的登录redis客户端

redis-cli -h 192.168.58.135 -p 7001 -c

8、问题

1、ruby 找不着

.bash_profile为隐藏文件,查看里面是否配置了 ruby的信息

每次启动集群前加载其中ruby配置文件

2、Node xxxx:x is not empty. Either the node already knows other nodes (check with CLUSTER NODES) or contains some key in database 0

删除.aof,dump.rdb,清空nodes.conf文件,不可删除

 

2、多机部署

1、第一台机器部署(端口为7001~7003):

1.1.新建普通用户,将压缩包解压到家目录下。

tar zxf rediscluster.tar.gz -C /home/sm01

1.2.修改scripts下的modify_userdir.sh脚本

userdir=‘/home/sm01‘  #修改为普通用户的家目录

1.3.修改scripts下的start_redis_cluster.sh脚本

localip="192.168.188.155"   #本地IP

userdir="/home/sm01"    #修改为普通用户的家目录

同时注释掉不用启动的端口

 

1.4.加载家目录下环境变量

source .bash_profile

1.5.删除不用的文件及目录,进入redis_cluster目录

由于本机仅使用7001~7003端口,因此需要删除7004~7006目录以及其目录下的所有文件。

1.6.启动redis。

sh  ~/script/start_redis_cluster.sh

1.7.检查

ps -ef|grep redis

如果有三个redis进程,则表明启动成功。

2、第二台机器部署(端口为7004~7006):

2.1.新建普通用户,将压缩包解压到家目录下。

tar zxf rediscluster.tar.gz -C /home/sm01

2.2.修改scripts下的modify_userdir.sh脚本

userdir=‘/home/sm01‘  #修改为普通用户的家目录

2.3.修改scripts下的start_redis_cluster.sh脚本

localip="192.168.188.155"   #本地IP

userdir="/home/sm01"    #修改为普通用户的家目录

同时注释掉不用启动的端口

 

2.4.加载家目录下环境变量

source .bash_profile

2.5.删除不用的文件及目录,进入redis_cluster目录

由于本机仅使用7004~7006端口,因此需要删除7001~7003目录以及其目录下的所有文件。

2.6.启动redis。

sh  ~/script/start_redis_cluster.sh

2.7.检查

ps -ef|grep redis

如果有三个redis进程,则表明启动成功。

3、创建集群

3.1修改节点配置文件

创建集群的时候,修改nodes.conf

3.2创建集群

${userdir}/redis/bin/redis-trib.rb create --replicas  1  IP_1:7001  IP_1:7002  IP_1:7003 IP_2:7004  IP_2:7005  IP_2:7006

(注意:$(userdir)为该程序解压的文件路径,如果解压的目录为家目录,则$(userdir)需要改成家目录路径。)

启动后,redis自己的进程会自动分配主和从

/home/redis/redis/bin/redis-trib.rb create --replicas  1  192.168.58.136:7001 192.168.58.136:7002 192.168.58.136:7003 192.168.58.137:7004 192.168.58.137:7005 192.168.58.137:7006

 

 

如果确认这些主都分配在不同的机器上后,输入yes ,然后等待redis自己创建集群。

4、问题

4.1集群有问题

3966:M 12 Nov 10:55:31.720 #You requested maxclients of 10000 requiring at least 10032 max file descriptors.

3966:M 12 Nov 10:55:31.720 # Server can‘t set maximum open files to 10032 because of OS error: Operation not permitted.

3966:M 12 Nov 10:55:31.720 # Current maximum open files is 4096. maxclients has been reduced to 4064 to compensate for low ulimit. If you need higher maxclients increase ‘ulimit -n‘.

3966:M 12 Nov 10:55:31.734 * Node configuration loaded, I‘m 6a0147d71f1f32b70cabb177445bfa919adea47c

4.2检查

redis-trib.rb check 192.168.58.136:7001

[ERR] Sorry, can‘t connect to node 192.168.58.136:xxx

……

4.3修改xxx节点对应的nodes.conf

18860debef76e635b06795d7a6dca709ca0cde49 192.168.188.155:7002 master - 0 1468643278156 2 connected 5461-10922

ae5653466f624c96a7c829afbab2eb8683daac4b 192.168.188.155:7003 master - 0 1468643278758 3 connected 10923-16383

6a0147d71f1f32b70cabb177445bfa919adea47c 192.168.188.155:7001 myself,master - 0 0 1 connected 0-5460

f6bd8b2d33e2448f08f5e3c942f6a552d8c4494a 192.168.188.155:7006 slave ae5653466f624c96a7c829afbab2eb8683daac4b 0 1468643278257 6 connected

87c629fc5e2c3340d157d9db617fac722b57d453 192.168.188.155:7004 slave 6a0147d71f1f32b70cabb177445bfa919adea47c 0 1468643278758 4 connected

631a997bad244b734ad6e1873685cb3042ac5342 192.168.188.155:7005 slave 18860debef76e635b06795d7a6dca709ca0cde49 1468643279259 1468643276752 5 connected

vars currentEpoch 6 lastVoteEpoch 0

2、从头部署redis

1、redis cluster安装

1、下载和解包

  cd /usr/local/

  wget http://download.redis.io/releases/redis-3.2.1.tar.gz

  tar -zxvf /redis-3.2.1.tar.gz

2、 编译安装

 cd redis-3.2.1

 make && make install

3、创建redis节点

测试我们选择2台服务器,分别为:192.168.1.237,192.168.1.238.每分服务器有3个节点。

1、我先在192.168.1.237创建3个节点:

  cd /usr/local/

  mkdir redis_cluster  //创建集群目录

  mkdir 7003 7001 7002  //分别代表三个节点    其对应端口 7003 7001 7002

 //创建7003节点为例,拷贝到7003目录

 cp /usr/local/redis-3.2.1/redis.conf  ./redis_cluster/7003/  

 //拷贝到7001目录

 cp /usr/local/redis-3.2.1/redis.conf  ./redis_cluster/7001/  

 //拷贝到7002目录

 cp /usr/local/redis-3.2.1/redis.conf  ./redis_cluster/7002/  

   分别对7001,7002、7003文件夹中的3个文件修改对应的配置

2、复制下面的代码到redis.conf

daemonize    yes                   //redis后台运行

pidfile  /var/run/redis_7000.pid        //pidfile文件对应7001,7002,7003

port  7000                         //端口7001,7002,7003

cluster-enabled  yes                 //开启集群  把注释#去掉

cluster-config-file  nodes_7000.conf    //集群的配置配置文件首次启动自动生成

cluster-node-timeout  5000           //请求超时  设置5秒够了

appendonly  yes                    //aof日志开启  有需要就开启,它会每次写操作都记录一条日志

3、重复以上2步

    在192.168.1.238创建3个节点:对应的端口改为7006,7004,7005.配置对应的改一下就可以了。

4、两台机启动各节点(两台服务器方式一样)

cd /usr/local

redis-server  redis_cluster/7000/redis.conf

redis-server  redis_cluster/7001/redis.conf

redis-server  redis_cluster/7002/redis.conf

redis-server  redis_cluster/7003/redis.conf

redis-server  redis_cluster/7004/redis.conf

redis-server  redis_cluster/7005/redis.conf

5、查看服务

ps -ef | grep redis   #查看是否启动成功

netstat -tnlp | grep redis #可以看到redis监听端口

2、创建集群

1、集群前准备

  前面已经准备好了搭建集群的redis节点,接下来我们要把这些节点都串连起来搭建集群。官方提供了一个工具:redis-trib.rb(/usr/local/redis-3.2.1/src/redis-trib.rb) 看后缀就知道这鸟东西不能直接执行,它是用ruby写的一个程序,所以我们还得安装ruby.

yum -y install ruby ruby-devel rubygems rpm-build

再用 gem 这个命令来安装 redis接口    gem是ruby的一个工具包.

gem install redis    //等一会儿就好了

当然,方便操作,两台Server都要安装。

 /usr/local/redis-3.2.1/src/redis-trib.rb

   Usage: redis-trib <command> <options> <arguments ...>

 

  reshard        host:port

                  --to <arg>

                  --yes

                  --slots <arg>

                  --from <arg>

  check          host:port

  call            host:port command arg arg .. arg

  set-timeout    host:port milliseconds

  add-node        new_host:new_port existing_host:existing_port

                  --master-id <arg>

                  --slave

  del-node        host:port node_id

  fix             host:port

  import          host:port

                  --from <arg>

  help            (show this help)

  create          host1:port1 ... hostN:portN

                  --replicas <arg>

2、创建集群

/usr/local/redis-3.2.1/src/redis-trib.rb  create  --replicas  1  192.168.1.237:7000 192.168.1.237:7001  192.168.1.237:7003 192.168.1.238:7003  192.168.1.238:7004  192.168.1.238:7005

1、 --replicas  1 

表示 自动为每一个master节点分配一个slave节点    上面有6个节点,程序会按照一定规则生成 3个master(主)3个slave(从)

2、运行中

提示Can I set the above configuration? (type ‘yes‘ to accept): yes    //输入yes

3、接下来 提示  Waiting for the cluster to join..........

安装的时候在这里就一直等等等,没反应,傻傻等半天,看这句提示上面一句,Sending Cluster Meet Message to join the Cluster.

    这下明白了,我刚开始在一台Server上去配,是不需要等的,这里还需要跑到Server2上做一些这样的操作。

    在192.168.1.238, redis-cli -c -p 700*  分别进入redis各节点的客户端命令窗口, 依次输入

cluster meet 192.168.1.238 7000

……

回到Server1,已经创建完毕了。

查看一下 /usr/local/redis/src/redis-trib.rb check 192.168.1.237:7000

3、测试

1、说明

    还是要说明一下,redis集群有16383个slot组成,通过分片分布到多个节点上,读写都发生在master节点。

2、假设测试

    果断先把192.168.1.238服务Down掉,(192.168.1.238有1个Master, 2个Slave) ,  跑回192.168.1.238, 查看一下 发生了什么事,192.168.1.237的3个节点全部都是Master,其他几个Server2的不见了

    测试一下,依然没有问题,集群依然能继续工作。

    原因:  redis集群  通过选举方式进行容错,保证一台Server挂了还能跑,这个选举是全部集群超过半数以上的Master发现其他Master挂了后,会将其他对应的Slave节点升级成Master.

    疑问: 要是挂的是192.168.1.237怎么办?    哥试了,cluster is down!!    没办法,超过半数挂了那救不了了,整个集群就无法工作了。 要是有三台Server,每台两Master,切记对应的主从节点

    不要放在一台Server,别问我为什么自己用脑子想想看,互相交叉配置主从,挂哪台也没事,你要说同时两台crash了,呵呵哒......

3、安装遇到的问题

1、GCC没有安装或版本不对

  CC adlist.o

  /bin/sh: cc: command not found

  make[1]: *** [adlist.o] Error 127

  make[1]: Leaving directory `/usr/local/redis-3.2.1/src

  make: *** [all] Error 2

   解决办法:

   yum  install  gcc

2、没有安装jemalloc

  zmalloc.h:50:31:

  error: jemalloc/jemalloc.h: No such file or directory

  zmalloc.h:55:2: error:

  #error "Newer version of jemalloc required"

  make[1]: *** [adlist.o] Error

  1

  make[1]: Leaving directory `/data0/src/redis-2.6.2/src

  make: *** [all]

  Error 2

    解决办法:原因是没有安装jemalloc内存分配器,

         1、可以安装jemalloc 直接

    2、输入make MALLOC=libc  && make install

 

以上是关于redis集群搭建及一些问题的主要内容,如果未能解决你的问题,请参考以下文章

Windows Server2016+SqlServer2016搭建AlwaysOn集群

Windows Server2016+SqlServer2016搭建AlwaysOn集群

Windows Server2016+SqlServer2016搭建AlwaysOn集群

ELK介绍及搭建 Elasticsearch 分布式集群

接手老项目的痛——MongoDB学习及集群搭建

在搭建Hadoop集群环境时遇到的一些问题