mysql主从复制故障分析
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了mysql主从复制故障分析相关的知识,希望对你有一定的参考价值。
mysql故障分析故障现象:
进入slave服务器查看运行状态
mysql> show slave status\G
.......
Relay_Log_File: mariadb-relay-bin.000001
Relay_Log_Pos: 21795072
Relay_Master_Log_File: mysql-bin.000001
Slave_IO_Running: Yes
Slave_SQL_Running: No
Replicate_Do_DB:
Replicate_Ignore_DB:
......
解决办法一、
Slave_SQL_Running: No
1.程序可能在slave上进行了写操作
2.也可能是slave机器重起后,事务回滚造成的
一般是事务回滚造成的
解决办法:
mysql> slave stop;
mysql> set GLOBAL SQL_SLAVE_SKIP_COUNTER=1;
mysql> slave start;
解决办法二
首先停掉Slave服务:slave stop
到主服务器上查看主机状态:
记录File和Position对应的值
进入master
mysql> show master status;
+----------------------+----------+--------------+------------------+
| File | Position | Binlog_Do_DB | Binlog_Ignore_DB |
+----------------------+----------+--------------+------------------+
| mysql-bin.000094 | 33622483 | | |
+----------------------+----------+--------------+------------------+
1 row in set (0.00 sec)
然后到slave服务器上执行手动同步:
mysql> change master to
> master_host=‘master_ip‘,
> master_user=‘user‘,
> master_password=‘pwd‘,
> master_port=3306,
> master_log_file=mysql-bin.000001‘,
> master_log_pos=33622483 ;
1 row in set (0.00 sec)
mysql> slave start;
1 row in set (0.00 sec)
mysql> show slave status\G
*************************** 1. row ***************************
........
Master_Log_File: mysql-bin.000094
Read_Master_Log_Pos: 33768775
Relay_Log_File: mysql-bin.000001
Relay_Log_Pos: 1094034
Relay_Master_Log_File: mysql-bin.000001
Slave_IO_Running: Yes
Slave_SQL_Running: Yes
Replicate_Do_DB:
手动同步需要停止master的写操作!
查看mysql主从配置的状态及修正 slave不启动问题
-
查看master的状态
show master status; //Position不应该为0 show processlist; //state状态应该为Has sent all binlog to slave; waiting for binlog to be updated
-
查看slave状态
show slave status; //Slave_IO_Running 与 Slave_SQL_Running 状态都要为Yes show processlist; //应该有两行state值为: Has read all relay log; waiting for the slave I/O thread to update it Waiting for master to send event
-
错误日志
MySQL安装目录 /usr/local/mysql MySQL日志目录 /usr/local/mysql/data/ 形如,Hostname.err
- Change master to
如果从库的Slave未启动,Slave_IO_Running为NO
可能是主库是的master的信息有变化
查看主库show master status
记录下File,Position字段,假设为‘mysql-bin.000001’,98;
在从库执行:
mysql>stop slave;
mysql>change master to master_log_file=‘mysql-bin.000001‘,master_log_pos=98;
mysql>start slave;
- SET global sql_slave_skip_counter=n;
如果从库的slave_sql_running为NO
Err文件中记录:Slave:Error "Duplicate entry ‘1‘ for key 1" on query.....
可能是master未向slave同步成功,但slave中已经有了记录。造成的冲突可以在从库上执行
set global sql_slave_skip_counter=n;
跳过几步。再restart slave就可以了。
- 同步错误处理
发现mysql slave服务器经常因为一些特殊字符或者符号产生的更新语句报错,整个同步也会因此而卡在那,最初的办法只是手动去出错的机器执行下面三条SQL语句,跳过错误即可。mysql>slave stop; mysql>set GLOBAL SQL_SLAVE_SKIP_COUNTER=1; mysql>slave start;
说明:
Slave_IO_Running:连接到主库,并读取主库的日志到本地,生成本地日志文件
Slave_SQL_Running:读取本地日志文件,并执行日志里的SQL命令
以上是关于mysql主从复制故障分析的主要内容,如果未能解决你的问题,请参考以下文章