Bireme:一个 Greenplum数据仓库的增量同步工具

Posted kuang17

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Bireme:一个 Greenplum数据仓库的增量同步工具相关的知识,希望对你有一定的参考价值。

https://hashdatainc.github.io/bireme/

 

Bireme 是一个 Greenplum / HashData 数据仓库的增量同步工具。目前支持 mysql、PostgreSQL 和 MongoDB 数据源。

Greenplum 是一个高级,功能齐全的开源数据仓库,为PB级数据量提供强大而快速的分析。它独特地面向大数据分析,由世界上最先进的基于成本的查询优化器提供支持,可在大数据量上提供高分析查询性能。

HashData 则是基于 Greenplum 构建弹性的云端数据仓库。

Bireme 采用 DELETE + COPY 的方式,将数据源的修改记录同步到 Greenplum / HashData ,相较于INSERT + UPDATE + DELETE的方式,COPY 方式速度更快,性能更优。

Bireme 特性与约束:

  • 采用小批量加载的方式提升数据同步的性能,默认加载延迟时间为10秒钟。
  • 所有表在目标数据库中必须有主键

 

技术分享图片

 

这里也介绍了其他两个工具:

Debezium

maxwell

 

以上是关于Bireme:一个 Greenplum数据仓库的增量同步工具的主要内容,如果未能解决你的问题,请参考以下文章

bireme数据源同步工具--debezium+kafka+bireme

Greenplum 实时数据仓库实践——Greenplum与数据仓库

Greenplum 实时数据仓库实践——Greenplum与数据仓库

开源数据仓库解决方案GreenPlum

瀚高王亮:解读《PB级数据仓库和开源Greenplum数据库》

Greenplum 实时数据仓库实践——Greenplum监控与运维