redis集群角色切换java调用异常

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了redis集群角色切换java调用异常相关的知识,希望对你有一定的参考价值。

redis集群角色切换java调用异常
一、Redis状态检查

唯一标记一个redis实例的是ip和端口,前端是用tcp方式来访问redis的,我们提供给应用访问的是一个ip+63379(一般使用63379) 端口。因此我们执行如下命令检查redis状态:

上面的role这个值一定是master的,只要保证vip在master上我们的Padis cache服务就是没有问题的,如果不通或者role的角色是slave,那就得继续查看是什么问题.

二、两个redis的角色都是slave的问题

当两个主机都挂了或者我们自己不小心将两个redis停了,并且我们用下面的命令检查

/wls/wls81/redis/bin/redis-cli -h ip -p port -a password info replication

发现无论是vip还是另外的两个ip都是role:slave 的角色,这个时候需要对vip所在的主机执行slaveof no one 的操作,将vip 所在的redis变成master,如:

/wls/wls81/redis/bin/redis-cli -h vip -p port -a password slaveof no one

三、sentinel的配置参数

我们的sentinel 配置文件里面有两个重要的配置

sentinel monitor pds_jks-core-prd 10.33.94.65 63379 1 -----------配置的ip和端口任何时候都需要是master的ip端口,切换的时候程序自动会改 。另外,红色所示部分pds_jks-core-prd为redis对外提供的主机名,一般Jedis在调用redis时会用到此名称。如果配置多个哨兵则一般要求此名称唯一标识

sentinel down-after-milliseconds pds_jks-core-prd 15000 ----------这个是sentinel连接master的超时时间,超过这个时间就认为master挂了,实现自动切换。这个默认是30秒,这个时间得调节好,大了会在真正出现故障的时候切换时间会长,小了有时候master由于持久化数据,繁忙不响应,会导致自动切换,实际只是瞬间不可用,现在认为设置为15秒为宜.

四、AOF日志

这个日志记录了每一个写入命令或者删除命令的,这个对于我们审计功能是有用的,由于占用很多磁盘,默认我们是关闭的

如果开启会生成一个.aof的文件在data文件中. 如: /wls/apache/servers/pds_jks-core-prd/data

在redis运行中中开启:

/wls/wls81/redis-icore/bin/redis-cli -h ip -p port -a password config set appendonly yes

开启了可以查看日志,记录每一个命令,如有必要可以开启查完问题后关闭. 同时说明一下

/wls/wls81/redis-icore/bin/redis-cli -h ip -p port -a password config set 可以在redis运行的时候设置多个它的参数

五、空闲连接的timeout

redis服务端不会自动断开客户端来的连接,redis服务端有设置客户端空闲连接超时时间,可用命令

/wls/wls81/redis-icore/bin/redis-cli -h ip -p port -a password config get timeout

查看当前timeout时间,默认是0,就是不断开空闲的连接,如果不断开空闲的连接,就会造成redis连接过多

所以一般情况下可以设置为3600秒:

/wls/wls81/redis-icore/bin/redis-cli -h ip -p port -a password config set timeout 3600

也就是3600秒后将空闲的连接关闭掉. 可以用下面的命令查看某个连接空闲了多久:

/wls/wls81/redis-icore/bin/redis-cli -h ip -p port -a password client list

六、监控redis执行的命令

/wls/wls81/redis-icore/bin/redis-cli -h ip -p port -a password monitor

上述这个monitor命令可以查看redis执行了什么命令,有时候查问题很有必要用到,我们可以知道那段时间redis执行了什么,从而进行我们的问题诊断。

七、key的查找与执行

/wls/wls81/redis-icore/bin/redis-cli -h ip -p port -a password keys "*"

keys这个命令查找所有的key,但是最好慎用,因为它很耗redis的性能,每个key都遍历一遍. 也可以进行模糊匹配如: keys "send*"

千万记住在生产环境上不能随便乱用,因为它会将redis性能耗尽,导致其他连接获取不到响应.

/wls/wls81/redis/bin/redis-cli -h ip -p port -a password dbsize

dbsize 这个命令可以看到整一个redis里面有多少个key,当然和keys "*" | wc -l结果是一样的。

当我们需要批量删除key值时可以用如下命令即可:

/wls/wls81/redis/bin/redis-cli -h ip -p port -a password keys "send*" | xargs /wls/wls81/redis/bin/redis-cli -h ip -p port -a password del

我们需要将整个db都flush掉可以用:

/wls/wls81/redis/bin/redis-cli -h ip -p port -a password -a MamcCorePrd flushdb

/wls/wls81/redis/bin/redis-cli -h ip -p port -a password -a flushall

八、由于连接redis的客户端使用jedisPool

如果设置了

redis.pool.testOnBorrow.REL=true

redis.pool.testOnReturn.REL=true

这两个参数是说在或者pool中的连接和返回连接给pool的时候都需要检查一下连接的有用性,也就是ping一下这个redis是不是好的,

这样在高并发的时候,由于并发线程太多,ping操作相对线程启动来说很慢,因此,应用会堵在类似如下线程dump的地方

"[ACTIVE] ExecuteThread: '19' for queue: 'weblogic.kernel.Default (self-tuning)'" id=33 idx=0x9c tid=273669 prio=5 alive, native_blocked, daemon

at jrockit/net/SocketNativeIO.readBytesPinned(Ljava/io/FileDescriptor;[BIII)I(Native Method)

at jrockit/net/SocketNativeIO.socketRead(SocketNativeIO.java:32)

at java/net/SocketInputStream.socketRead0(Ljava/io/FileDescriptor;[BIII)I(SocketInputStream.java)

at java/net/SocketInputStream.read(SocketInputStream.java:129)

at java/net/SocketInputStream.read(SocketInputStream.java:90)

at redis/clients/util/RedisInputStream.fill(RedisInputStream.java:109)

at redis/clients/util/RedisInputStream.readByte(RedisInputStream.java:45)

at redis/clients/jedis/Protocol.process(Protocol.java:64)

at redis/clients/jedis/Protocol.read(Protocol.java:131)

at redis/clients/jedis/Jedis.ping(Jedis.java:35)

at redis/clients/jedis/JedisPool$JedisFactory.validateObject(JedisPool.java:104)

at org/apache/commons/pool/impl/GenericObjectPool.addObjectToPool(GenericObjectPool.java:922)

at org/apache/commons/pool/impl/GenericObjectPool.returnObject(GenericObjectPool.java:917)

^-- Holding lock: org/apache/commons/pool/impl/GenericObjectPool@0xb8513338[fat lock]

at redis/clients/util/Pool.returnResourceObject(Pool.java:29)

at redis/clients/util/Pool.returnResource(Pool.java:41)

at com/paic/icore/mams/common/jedis/util/RedisPoolCacheTools.release(RedisPoolCacheTools.java:43)

虽然后面会自动恢复,不过导致应用响应缓慢.解决方法是将该两个参数设置为false,并且定期检查:

testOnBorrow.REL=false

testOnReturn.REL=false

timeBetweenEvictionRunsMillis=60000 -------每隔60秒定期检查空闲连接

minEvictableIdleTimeMillis=120000 ---------连接在池中保持空闲而不被空闲连接回收器线程回收的最小时间值,单位毫秒

numTestsPerEvictionRun=-1 ----------空闲连接扫描时,每次最多扫描的连接数,一般设置为-1,全部扫描

设置成这样之后就不用每次都测试了,这样就提高了应用的性能

有时候由于持久化导致master变得缓慢,所以建议关闭master的持久化,让slave持久化

关闭持久化 /wls/wls81/redis/bin/redis-cli -h ip -p port -a password config set save ""

开通持久化 /wls/wls81/redis/bin/redis-cli -h ip -p port -a password config set save "900 1 300 10 60 10000"

关闭持久化后如果发生主备切换了,请将master的持久化关闭,slave的持久化开启

九、查询每秒执行的命令个数

十、单位时间内Redis执行的命令次数
参考技术A redis集群角色切换java调用异常解决办法:
1:打开软件java
2:编辑所需要的信息
3:然后编辑好了之后确认,点击右上角的设置中心
4:在设置中心里面找到信息就可以了
参考技术B 1.
Redis状态检查 唯一标记一个redis实例的是ip和端口,前端是用tcp方式来访问redis的,我们提供给应用访问的是一个ip+63379(一般使用63379) 端口。因此我们执行如下命令检查redis状态: 上面的role这个值一定是master的,只要保证vip在master上我们的Padis cache服务就是没有问题的,如果不通或者role的角色是slave,那就得继续查看是什么问题.
2.
两个redis的角色都是slave的问题 当两个主机都挂了或者我们自己不小心将两个redis停了,并且我们用下面的命令检查 /wls/wls81/redis/bin/redis-
参考技术C 异常的分类: 所有的异常类都是属于Throwable类的子类。其主要分为两大类派,Exception类和Error类。Error类是十分严重的错误如Java运行系统中的内部错误及Java虚拟机资源耗尽等,我们无法解决。而Exception类又衍生出两个子类RuntimeException(运行时异常/非检测异常)类以及CheckedException(检测异常)类。 CheckedException(检测异常)在代码编译的过程中,编译器要求你对可能出现的异常必须做出相应的处理的异常。如IOException、SQLException 参考技术D Redis状态检查 唯一标记一个redis实例的是ip和端口,前端是用tcp方式来访问redis的,我们提供给应用访问的是一个ip+63379(一般使用63379) 端口。因此我们执行如下命令检查redis状态: 上面的role这个值一定是master的,只要保证vip在master上我们的Padis cache服务就是没有问题的,如果不通或者role的角色是slave,那就得继续查看是什么问题.
2.
两个redis的角色都是slave的问题 当两个主机都挂了或者我们自己不小心将两个redis停了,并且我们用下面的命令检查

以上是关于redis集群角色切换java调用异常的主要内容,如果未能解决你的问题,请参考以下文章

Redis集群redis主从自动切换Sentinel(哨兵模式)

redis 集群热备自动切换sentinel配置实战

scala怎样创建redis集群连接池

redis集群-哨兵

RedisCluster集群模式下master宕机主从切换期间Redis command timed out的问题

redis安装集群的2种方式