mha故障切换报错了,漂移成功了,slave指向新master没成功,究竟如何处理!我有点小暴躁!
Posted 龙少。
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了mha故障切换报错了,漂移成功了,slave指向新master没成功,究竟如何处理!我有点小暴躁!相关的知识,希望对你有一定的参考价值。
mha故障切换报错了怎么办啊,ip漂移成功,master转换没成功
一.报错背景
mha安装成功,测试免密登录成功,测试主从复制也成功了,健康检查也ok。当将主master关掉模拟故障切换时报错。
二.具体报错信息
----- Failover Report -----
app1: mysql Master failover 192.168.206.88(192.168.206.88:3306) to 192.168.206.188(192.168.206.188:3306)
Master 192.168.206.88(192.168.206.88:3306) is down!
Check MHA Manager logs at manager:/var/log/masterha/app1/manager.log for details.
Started automated(non-interactive) failover.
Invalidated master IP address on 192.168.206.88(192.168.206.88:3306)
The latest slave 192.168.206.188(192.168.206.188:3306) has all relay logs for recovery.
Selected 192.168.206.188(192.168.206.188:3306) as a new master.
192.168.206.188(192.168.206.188:3306): OK: Applying all logs succeeded.
192.168.206.188(192.168.206.188:3306): OK: Activated master IP address.
192.168.206.177(192.168.206.177:3306): This host has the latest relay log events.
Generating relay diff files from the latest slave succeeded.
192.168.206.177(192.168.206.177:3306): WARN: Applying all logs succeeded. But starting slave failed.
Master failover to 192.168.206.188(192.168.206.188:3306) done, but recovery on slave partially failed.
三.导致的结果现象
我到slave1查看vip已经漂移成功,ifconfig 能看到vip192.168.206.100已经在slave1上
slave1查看发现slave1并没有变为新的master
slave2查看发现master指向了slave1,脑瓜子嗡嗡的!
显然,slave2已经将slave1指向了master,可是slave1不正常,还是指向的源master为master。故障切换没有成功!
四.分析解决
1.首先我觉得免密登录测试和主从复制测试都是正常的,应该是没有什么问题的,竟然切换失败的,我就重新change了从服务器,做好新的主从后又重新模拟故障切换了,结果结果是一样的,还是报错。这里开始我就有不好的预感了。
2.那肯定是哪里有问题的,完全没有思路,感觉不应该啊。实在没有头绪就顺着日志文件去看吧,发现错误位置的提示,mysqlbinlog 没有找到命令,显然看到这个我明白了,软链接没做
3.主服务器软链接做一下,之前是2个从服务器做了,主服务器没有做,漏勺,给他补上
ln -s /usr/local/mysql/bin/mysql /usr/sbin
ln -s /usr/local/mysql/bin/mysqlbinlog /usr/sbin
做完后再重新来一遍看看有没有惊喜,有的是惊吓,又报错了
4.这个还算熟悉啊,因为我在健康检查的时候遇到这个报错了,需要注销字符集,遇到过还犯错,又是漏勺,该打
主服务器master上
vim /etc/my.cnf
5.好的,不要慌再来一遍先,乖乖的还有错啊,一直顺着日志文件找报错点来分析
6.这里我真的是卡了好久,说是slave没能成功,想不通为什么,到处百度到处搜就是找不到我这种现象的,见了鬼了,我这运气是真的好。可怜的我啊,终于发现是slave从服务器的配置问题,因为主从复制是正常的,我就没往slave上面子想,一直在盯着manager的master_ip_failover内容和MHA的/etc/masterha/app1.cnf配置文件看,以为是这里哪里配置有问题,怎么也找不到原因,反复试了故障切换就是不成功。
想想是有可能slave配置问题就到2个slave配置文件/etc/my.cnf看了一下,我这骂娘了,唉!大把的时光啊浪费在这里啊。
server-id有问题,2个我都配置的33,瞬间想抽自己
slave1
slave2
7.现在就是见证奇迹的时候了,终于是成功了,倍爽!得加鸡腿去了!
以上是关于mha故障切换报错了,漂移成功了,slave指向新master没成功,究竟如何处理!我有点小暴躁!的主要内容,如果未能解决你的问题,请参考以下文章