数据异构

Posted koushr

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了数据异构相关的知识,希望对你有一定的参考价值。

数据异构指的是把数据按照需要异地构建存储。

其中一个应用场景是分库分表的时候。假如已经按照某个维度做了分库分表,新来一个需求,需要按照另外一个维度做分库分表,这个时候就需要数据异构了。

数据异构主要有两种方式,binlog方式和mq方式。binlog方式是指订阅mysql的binlog日志,解析这些日志,重构数据然后写到新的数据库或者其他存储,如kafka、es中。常用的binlog订阅组件是canal,由阿里开源。mq方式是指在数据写入数据库时,同时双写至mq中。

mysql主从复制原理:

1、mysql master将改变记录到二进制文件中(binary log,俗称binlog)

2、mysql slave从master拉取binlog至自己的中继日志中(relay log)

3、slave重做中继日志中的事件,将改变落实到自己的数据上

canal原理:

canal把自己伪装成一个mysql slave。

参考https://www.jianshu.com/p/99d1762b2fda

以上是关于数据异构的主要内容,如果未能解决你的问题,请参考以下文章

HDFS 异构存储实战

异构存储(冷热数据分离)

异构存储(冷热数据分离)

DataX 异构数据源离线同步

DataX 异构数据源离线同步

大数据 -->淘宝异构数据源数据交换工具 DataX