mysql中如何用mysqlbinlog工具将日志文件生成txt文件出来分析
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了mysql中如何用mysqlbinlog工具将日志文件生成txt文件出来分析相关的知识,希望对你有一定的参考价值。
mysql 的 Binlog 记录着 MySQL 数据库的所有变更信息,了解 Binlog 的结构可以帮助我们解析Binlog,甚至对 Binlog 进行一些修改,或者说是“篡改”,例如实现类似于 Oracle 的 flashback 的功能,恢复误删除的记录,把 update 的记录再还原回去等。本文将带您探讨一下这些神奇功能的实现,您会发现比您想象地要简单得多。本文指的 Binlog 是 ROW 模式的 Binlog,这也是 MySQL 8 里的默认模式,STATEMENT 模式因为使用中有很多限制,现在用得越来越少了。Binlog 由事件(event)组成,请注意是事件(event)不是事务(transaction),一个事务可以包含多个事件。事件描述对数据库的修改内容。
现在我们已经了解了 Binlog 的结构,我们可以试着修改 Binlog 里的数据。例如前面举例的 Binlog 删除了一条记录,我们可以试着把这条记录恢复,Binlog 里面有个删除行(DELETE_ROWS_EVENT)的事件,就是这个事件删除了记录,这个事件和写行(WRITE_ROWS_EVENT)的事件的数据结构是完全一样的,只是删除行事件的类型是 32,写行事件的类型是 30,我们把对应的 Binlog 位置的 32 改成 30 即可把已经删除的记录再插入回去。从前面的 “show binlog events” 里面可看到这个 DELETE_ROWS_EVENT 是从位置 378 开始的,这里的位置就是 Binlog 文件的实际位置(以字节为单位)。从事件(event)的结构里面可以看到 type_code 是在 event 的第 5 个字节,我们写个 Python 小程序把把第383(378+5=383)字节改成 30 即可。当然您也可以用二进制编辑工具来改。
找出 Binlog 中的大事务
由于 ROW 模式的 Binlog 是每一个变更都记录一条日志,因此一个简单的 SQL,在 Binlog 里可能会产生一个巨无霸的事务,例如一个不带 where 的 update 或 delete 语句,修改了全表里面的所有记录,每条记录都在 Binlog 里面记录一次,结果是一个巨大的事务记录。这样的大事务经常是产生麻烦的根源。我的一个客户有一次向我抱怨,一个 Binlog 前滚,滚了两天也没有动静,我把那个 Binlog 解析了一下,发现里面有个事务产生了 1.4G 的记录,修改了 66 万条记录!下面是一个简单的找出 Binlog 中大事务的 Python 小程序,我们知道用 mysqlbinlog 解析的 Binlog,每个事务都是以 BEGIN 开头,以 COMMIT 结束。我们找出 BENGIN 前面的 “# at” 的位置,检查 COMMIT 后面的 “# at” 位置,这两个位置相减即可计算出这个事务的大小,下面是这个 Python 程序的例子。
切割 Binlog 中的大事务
对于大的事务,MySQL 会把它分解成多个事件(注意一个是事务 TRANSACTION,另一个是事件 EVENT),事件的大小由参数 binlog-row-event-max-size 决定,这个参数默认是 8K。因此我们可以把若干个事件切割成一个单独的略小的事务
ROW 模式下,即使我们只更新了一条记录的其中某个字段,也会记录每个字段变更前后的值,这个行为是 binlog_row_image 参数控制的,这个参数有 3 个值,默认为 FULL,也就是记录列的所有修改,即使字段没有发生变更也会记录。这样我们就可以实现类似 Oracle 的 flashback 的功能,我个人估计 MySQL 未来的版本从可能会基于 Binlog 推出这样的功能。
了解了 Binlog 的结构,再加上 Python 这把瑞士军刀,我们还可以实现很多功能,例如我们可以统计哪个表被修改地最多?我们还可以把 Binlog 切割成一段一段的,然后再重组,可以灵活地进行 MySQL 数据库的修改和迁移等工作。 参考技术A 在cmd下或者linux终端命令行执行
mysqlbinlog -u root -p密码 二进制文件名 >d:\\test.sql 参考技术B mysqlbinlog 文件名 > 文件名
1027mysqlbinlog工具日志恢复
-- 转自http://bbs.csdn.net/topics/310068149
-- 其实就是找到对应的位置然后执行语句即可
-- 第一部分 输出
mysqlbinlog "C:\ProgramData\MySQL\MySQL Server 5.6\Data\mysql-bin.000063" > D:\ab\01.txt
-- 第二部分 输入到mysql
mysqlbinlog "C:\ProgramData\MySQL\MySQL Server 5.6\Data\mysql-bin.000063" | mysql -uroot -p111111 back_db
mysqlbinlog "C:\ProgramData\MySQL\MySQL Server 5.6\Data\mysql-bin.000063" | mysql -uroot -p111111 back_db
237 1018 1170 1488
mysqlbinlog "C:\ProgramData\MySQL\MySQL Server 5.6\Data\mysql-bin.000064" --start-position 1170 --stop-position 1488 | mysql -uroot -p111111 back_db
mysqlbinlog "C:\ProgramData\MySQL\MySQL Server 5.6\Data\mysql-bin.000064" --start-position 237 --stop-position 1018 | mysql -uroot -p111111 back_db
237 664
mysqlbinlog "C:\ProgramData\MySQL\MySQL Server 5.6\Data\mysql-bin.000065" --start-position 237 --stop-position 664 | mysql -uroot -p111111 back_db
mysqlbinlog工具的使用,大家可以看MySQL的帮助手册。里面有详细的用,
在这个例子中,重点是--start-position参数和--stop-position参数的使用。
?--start-position=N
从二进制日志中第1个位置等于N参量时的事件开始读。
?--stop-position=N
从二进制日志中第1个位置等于和大于N参量时的事件起停止读。
OK,现在开始,要启动二进制日志记录,
要先在my.cnf / my.ini文件的mysqld里添加
log-bin=日志名
在这里,偶是的设置是log-bin=liangck
然后再启动mysql服务,因为偶是用windows系统,
所以执行net start mysql命令即可。
然后在一测试数据库里,创建一个表,并添加记录。
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
|
mysql> create table test(id int auto_increment not null primary key , val int ,data varchar (20)); mysql> insert into test(val,data) values (10, ‘liang‘ ); Query OK, 1 row affected (0.03 sec) mysql> insert into test(val,data) values (20, ‘jia‘ ); Query OK, 1 row affected (0.08 sec) mysql> insert into test(val,data) values (30, ‘hui‘ ); Query OK, 1 row affected (0.03 sec) mysql> flush logs; --产生第二个日志文件 Query OK, 0 rows affected (0.09 sec) mysql> insert into test(val,data) values (40, ‘aaa‘ ); Query OK, 1 row affected (0.05 sec) mysql> insert into test(val,data) values (50, ‘bbb‘ ); Query OK, 1 row affected (0.03 sec) mysql> insert into test(val,data) values (60, ‘ccc‘ ); Query OK, 1 row affected (0.03 sec) mysql> delete from test where id between 4 and 5; --删除记录 Query OK, 2 rows affected (0.05 sec) mysql> insert into test(val,data) values (70, ‘ddd‘ ); Query OK, 1 row affected (0.03 sec) mysql> flush logs; --产生第三个文件文件 Query OK, 0 rows affected (0.11 sec) mysql> insert into test(val,data) values (80, ‘dddd‘ ); Query OK, 1 row affected (0.05 sec) mysql> insert into test(val,data) values (90, ‘eeee‘ ); Query OK, 1 row affected (0.03 sec) mysql> drop table test; --删除表 Query OK, 0 row affected (0.05 sec) |
――――――――――――――――――――――――――――――――――
OK,现在测试数据已经建好了,要求是什么呢?
就是将test表的数据全部恢复出来。
先用mysqlbinlog工具将日志文件生成txt文件出来分析。
F:\Program Files\MySQL_Data\data\log>
mysqlbinlog liangck.000001 > G:\001.txt
F:\Program Files\MySQL_Data\data\log>
mysqlbinlog liangck.000002 > G:\002.txt
F:\Program Files\MySQL_Data\data\log>
mysqlbinlog liangck.000003 > G:\003.txt
通过这三个命令,可以在G盘下生成3个文件,
里面分别记录了日志文件的内容,
也就是用户操作的步骤。
因为我们需要重做第一个日志文件的所有操作,
所以这里只需要将第一个日志文件全恢复就行了。
F:\Program Files\MySQL_Data\data\log>
mysqlbinlog liangck.000001 | mysql -uroot –p
Ok,接着,我们需要分析的是第二个日志文件。为什么要分析它呢,
因为它中途执行了一个操作是DELETE,因为我们要做的是恢复全部数据,
也就是我们不希望去重做这个语句。所以在这里我们要想办法去绕开它。
我们先打开002.txt文件来分析一下。
在这个文件中,我们可以看到DELETE的操作的起始位置是875,终止位置是1008.
那么我们只要重做第二个日志文件的开头到875的操作,然后再从1008到末尾的操作,
我们就可以把数据给恢复回来,而不会DELETE数据。所以执行两个命令:
F:\Program Files\MySQL_Data\data\log>
mysqlbinlog liangck.000002 --stop-pos=875 | mysql -uroot -p
F:\Program Files\MySQL_Data\data\log>
mysqlbinlog liangck.000002 --start-pos=1008 | mysql -uroot -p mytest
OK,现在第二个日志文件的数据了。
第三个日志文件也是同理,只要找到DROP TABLE的位置,就可以了。
F:\Program Files\MySQL_Data\data\log>
mysqlbinlog liangck.000003 --stop-pos=574 | mysql -uroot –p
现在我们再查一下数据看看:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
|
mysql> select * from test; + ----+------+-------+ | id | val | data | + ----+------+-------+ | 1 | 10 | liang | | 2 | 20 | jia | | 3 | 30 | hui | | 4 | 40 | aaa | | 5 | 50 | bbb | | 6 | 60 | ccc | | 7 | 70 | ddd | | 8 | 80 | dddd | | 9 | 90 | eeee | + ----+------+-------+ 9 rows in set (0.00 sec) |
可以看到,全部数据都回来了。
以上是关于mysql中如何用mysqlbinlog工具将日志文件生成txt文件出来分析的主要内容,如果未能解决你的问题,请参考以下文章