slave断电，mysql主从奔溃恢复从服务至正常

Posted 2020-07-01

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了slave断电，mysql主从奔溃恢复从服务至正常相关的知识，希望对你有一定的参考价值。

本想连照片一起上传的，这样更直观；很遗憾照片无法上传，但是也无法阻止我发文！！！

slave上操作：

[[email protected] mysql]# tail slave.err

160121 21:44:43 [Note] Event Scheduler: Purging the queue. 0 events

160121 21:44:43 [Note] Error reading relay log event: slave SQL thread was killed

160121 21:44:43 [Note] Slave I/O thread killed while reading event

160121 21:44:43 [Note] Slave I/O thread exiting, read up to log ‘test.000003‘, position 1048964

160121 21:44:43 InnoDB: Starting shutdown...

160121 21:44:44 InnoDB: Shutdown completed; log sequence number 0 44243

160121 21:44:44 [Note] /usr/local/mysql/bin/mysqld: Shutdown complete

160121 21:44:44 mysqld_safe mysqld from pid file /data/mysql/slave.pid ended

上面有个position值为1048964；这就是同步这个binlog位置的时候出错了；为了避免错误，先去主上面看看是不是有这个position值；

master上操作：

mysqlbinlog test.000003 >test000003.txt

vim test000003.txt#查找1048964，确定有这个位置；

slave上操作：

mysqlbinlog slave-relay-bin.000008 > 0008.txt

vim 0008.txt#查找1048964，发现1048964的位置在文件记录的最下端

上面生成的那两个txt还可以对比下内容，两者1048964位置附近内容是一致的，所以确定1048964这个位置是slave奔溃前同步主的位置了

继续从上操作：

mysql

slave stop;#显示OK

change master to master_host=‘192.168.20.125‘, master_port=3306, master_user=‘repl‘,master_password=‘123456‘, master_log_file=‘test.000003‘, master_log_pos=1049044;

#重新change master to；报错！！

ERROR 1201 (HY000): Could not initialize master info structure; more error messages can be found in the MySQL error log

只能先清空了

reset slave;#显示OK；再重新操作上面的change master to；就可以执行了；显示OK

slave start;#显示OK

show slave status\G; #IO和SQL线程Yes，主从恢复。查询下数据库表，发现数据都同步了过来了

注：mysqlbinlog后那几步操作，如果在比较大的日志文件中直接vim后查找需要很长时间和特别费劲；

可以先grep -n 1048964 0008.txt，得出他的行号，再使用tail和head 截取他们的一段。

最后说说，mysql主从配置不难；只是很脆弱，需要写个脚本监控，在此不阐述；

奔溃后应该怎么恢复，这得理清mysql主从的机制；mysql主从运行机制大概为:

1．Slave 上面的IO线程连接上 Master，并请求从指定日志文件的指定位置(或者从最开始的日志)之后的日志内容；

2. Master 接收到来自 Slave 的 IO 线程的请求后，通过负责复制的 IO 线程根据请求信息读取指定日志指定位置之后的日志信息，返回给 Slave 端的 IO 线程。返回信息中除了日志所包含的信息之外，还包括本次返回的信息在 Master 端的 Binary Log 文件的名称以及在 Binary Log 中的位置；

3. Slave 的 IO 线程接收到信息后，将接收到的日志内容依次写入到 Slave 端的Relay Log文件(mysql-relay-bin.xxxxxx)的最末端，并将读取到的Master端的bin-log的文件名和位置记录到master- info文件中，以便在下一次读取的时候能够清楚的高速Master“我需要从某个bin-log的哪个位置开始往后的日志内容，请发给我”

4. Slave 的 SQL 线程检测到 Relay Log 中新增加了内容后，会马上解析该 Log 文件中的内容成为在 Master 端真实执行时候的那些可执行的 Query 语句，并在自身执行这些 Query。这样，实际上就是在 Master 端和 Slave 端执行了同样的 Query，所以两端的数据是完全一样的。

从上面第三点可以理解恢复的时候应该怎么操作了；也就是指定binlog的位置从而达到恢复的目的，仅此而已。

本文出自 “kw_lee” 博客，请务必保留此出处http://11398377.blog.51cto.com/11388377/1758396

以上是关于slave断电，mysql主从奔溃恢复从服务至正常的主要内容，如果未能解决你的问题，请参考以下文章

Mysql主从级联复制

记一次线上mysql主从架构异常的恢复经历

keepalive+redis 主从高可用

redis keepalive+redis 主从高可用

mysql怎么实现主从复制

MySQL主从复制遇到的错误及解决方法