大数据Canal:Canal介绍
Posted Lansonli
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了大数据Canal:Canal介绍相关的知识,希望对你有一定的参考价值。
文章目录
Canal介绍
一、什么是Canal
Canal [kə'næl],译意为水道/管道/沟渠,主要用途是基于 mysql 数据库增量日志解析,提供增量数据订阅和消费。
早期阿里巴巴因为杭州和美国双机房部署,存在跨机房同步的业务需求,实现方式主要是基于业务 trigger 获取增量变更。从 2010 年开始,业务逐步尝试数据库日志解析获取增量变更进行同步,由此衍生出了大量的数据库增量订阅和消费业务。
当前的 canal 支持源端 MySQL 版本包括 5.1.x , 5.5.x , 5.6.x , 5.7.x , 8.0.x。
Canal目前没有独立的官网,可以在GitHub上下载和查看Canal文档,地址如下:https://github.com/alibaba/canal/wiki
二、Canal工作原理
1、MySQL主备复制原理
1.1、MySQL master 将数据变更写入二进制日志(binary log, 其中记录叫做二进制日志事件binary log events,可以通过 show binlog events 进行查看)
1.2、MySQL slave 将 master 的 binary log events 拷贝到它的中继日志(relay log)
注意:中继日志是从服务器I/O线程将主服务器的二进制日志读取过来,记录到从服务器本地文件,然后从服务器SQL线程会读取relay-log日志的内容并应用到从服务器,从而使从服务器和主服务器的数据保持一致。
1.3、MySQL slave 重放 relay log 中事件,将数据变更反映它自己的数据
2、canal 工作原理
2.1、canal 模拟 MySQL slave 的交互协议,伪装自己为 MySQL slave ,向 MySQL master 发送dump 协议
2.2、MySQL master 收到 dump 请求,开始推送 binary log 给 slave (即 canal )
2.3、canal 解析 binary log 对象(原始为 byte 流)
注意:mysql-binlog是MySQL数据库的二进制日志,记录了所有的DDL和DML(除了数据查询语句)语句信息。一般来说开启二进制日志大概会有1%的性能损耗。
- 📢博客主页:https://lansonli.blog.csdn.net
- 📢欢迎点赞 👍 收藏 ⭐留言 📝 如有错误敬请指正!
- 📢本文由 Lansonli 原创,首发于 CSDN博客🙉
- 📢停下休息的时候不要忘了别人还在奔跑,希望大家抓紧时间学习,全力奔赴更美好的生活✨
以上是关于大数据Canal:Canal介绍的主要内容,如果未能解决你的问题,请参考以下文章
大数据Spark Streaming实时处理Canal同步binlog数据