数据泵中间件

Posted sharper

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了数据泵中间件相关的知识,希望对你有一定的参考价值。

一、数据泵定义

能够实时从RDBMS持续不断导出增量数据的中间件

例如:

1mysql dump

2Oralce dump

3基于JDBC的select命令

4触发器

5、其他


缺点:

1非自动化

2非实时

3、不支持异构数据库

二、Change Data Capture

CDC(异动数据捕获)在MySQL、Oracle下都比较成熟,其他数据库没有深入研究,下面以MySQL来做说明。

MySQL主从是从捕获主的binlog方式实现,那么CDC中间件就可以借助MySQL主从模式伪装成从库来监听主库binlog异动,例如Maxwell中间件,从网上找了几张MySQL主从复制原理图


数据泵中间件


数据泵中间件

Oralce是以在线日志文档来记录数据异动

数据泵中间件

三、数据泵产品

数据泵中间件

目前我司正在使用Maxwell,缺点就是它本身不支持高可用,要自己想办法(如keepalived),另外不支持异构数据库如SQLServer、DB2、Oracle,若企业内统一都使用MySQL数据库Maxwell也是一个不错的选择,上手容易,若企业用了用友等其他非MySQL数据库软件则建议kafka connect ,易于朝数据中台扩展且能够支持HA。

Maxwell也支持全量数据导出,Canal并不支持,需要阿里DataX来解决。

Kafka Connect应用示意图

四、数据泵应用


下游应用任意想象、任意发挥

五、数据泵+MQ的意义

解耦

以上是关于数据泵中间件的主要内容,如果未能解决你的问题,请参考以下文章

Oracle 数据泵导入导出(expdp/impdp)

数据泵导的数据怎么导入其他用户

怎样在linux系统上用数据泵导入数据

oracle数据泵导入导出需要同一个用户么

数据泵导出导入

oracle 12C版本用数据泵导出的数据,要导入到11g版本中,应该怎么进行,不太会用数据泵,求救!!!