Bireme:一个 Greenplum数据仓库的增量同步工具
Posted kuang17
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Bireme:一个 Greenplum数据仓库的增量同步工具相关的知识,希望对你有一定的参考价值。
https://hashdatainc.github.io/bireme/
Bireme 是一个 Greenplum / HashData 数据仓库的增量同步工具。目前支持 mysql、PostgreSQL 和 MongoDB 数据源。
Greenplum 是一个高级,功能齐全的开源数据仓库,为PB级数据量提供强大而快速的分析。它独特地面向大数据分析,由世界上最先进的基于成本的查询优化器提供支持,可在大数据量上提供高分析查询性能。
HashData 则是基于 Greenplum 构建弹性的云端数据仓库。
Bireme 采用 DELETE + COPY 的方式,将数据源的修改记录同步到 Greenplum / HashData ,相较于INSERT + UPDATE + DELETE的方式,COPY 方式速度更快,性能更优。
Bireme 特性与约束:
- 采用小批量加载的方式提升数据同步的性能,默认加载延迟时间为10秒钟。
- 所有表在目标数据库中必须有主键
这里也介绍了其他两个工具:
Debezium
maxwell
以上是关于Bireme:一个 Greenplum数据仓库的增量同步工具的主要内容,如果未能解决你的问题,请参考以下文章
bireme数据源同步工具--debezium+kafka+bireme
Greenplum 实时数据仓库实践——Greenplum与数据仓库
Greenplum 实时数据仓库实践——Greenplum与数据仓库