从 DynamoDB 迁移到 Spanner/BigTable

Posted

技术标签:

【中文标题】从 DynamoDB 迁移到 Spanner/BigTable【英文标题】:Migration from DynamoDB to Spanner/BigTable 【发布时间】:2020-03-01 17:03:00 【问题描述】:

我有一个用例,我需要将 70 TB 的数据从 DynamoDB 迁移到 BigTable 和 Spanner。具有单个索引的表将转到 BigTable,否则它们将转到 Spanner。

我可以通过将数据导出到 S3 --> GCS --> Spanner/BigTable 轻松处理历史负载。但具有挑战性的部分是处理在 DynamoDB 上同时发生的增量流负载。 DynamoDB 中有 300 个表。

如何以最好的方式处理这件事?以前有人做过吗?

【问题讨论】:

【参考方案1】:

一种方法可以使用 lambdas 捕获 dynamodb 更改,将更改发布到 GCP pub/sub,然后让 Dataflow 流式管道处理传入的 pub/sub 消息,根据表将其写入 Spanner 或 BigTable

基本的 DynamoDB->Spanner 解决方案记录在此:https://cloud.google.com/solutions/migrating-dynamodb-to-cloud-spanner

这可以适应处理不同表的不同目的地。

【讨论】:

以上是关于从 DynamoDB 迁移到 Spanner/BigTable的主要内容,如果未能解决你的问题,请参考以下文章

从 Parse 迁移到 AWS Dynamo DB

如何将 DynamoDb 迁移到 RDS (Aurora)

需要将大型表从 RDS 迁移到 DynamoDB 的策略建议

ScyllaDB - DynamoDB 迁移

实现混合数据库系统的最佳实践 DynamoDB

AWS 数据管道 Dynamodb 到 Redshift