红移:数据迁移

Posted

技术标签:

【中文标题】红移:数据迁移【英文标题】:Redshift : Data migration 【发布时间】:2016-10-19 11:55:40 【问题描述】:

我需要在两个 redshift 环境之间迁移表(生产到登台,反之亦然)。这两个环境在物理上是不同的位置。是否有任何实用程序可用于此。我不想使用 ETL 工具。 到目前为止,我已经尝试使用卸载到 csv 并加载,但它并不像预期的那样快。 我也需要自动化这个活动。请建议最好的方法。

【问题讨论】:

您是否尝试过 Redshift 快照?您甚至可以仅从快照还原表。由于制作快照不会花费太长时间,因此它适合您。检查此以获取详细信息。 docs.aws.amazon.com/redshift/latest/mgmt/… 吞吐量如何,能否处理多线程并行迁移? 你说你正在使用卸载,这很慢,你是卸载到 s3 还是其他地方? @JonScott 我正在将其卸载到 s3 。 【参考方案1】:

只有两种方法可以从 Amazon Redshift 导出数据:

使用 UNLOAD 命令将 CSV 文件保存到 Amazon S3 创建 Amazon Redshift 集群的快照

现在可以Restoring a Table from a Snapshot,因此您可以对整个集群进行快照,然后将所需的表恢复到另一个集群。

文档说:

您可以从快照恢复单个表,而不是恢复整个集群。当您从快照恢复单个表时,您需要为恢复的表指定源快照、数据库、架构和表名,以及目标集群、架构和新表名。 p>

您应该测试该过程以确定恢复的速度。

可以使用AWS Command-Line Interface (CLI) 中的aws redshift restore-table-from-cluster-snapshot 命令自动执行该过程。

【讨论】:

以上是关于红移:数据迁移的主要内容,如果未能解决你的问题,请参考以下文章

AWS Glue 数据从 S3 迁移到 Redshift

使用 AWS DMS 加载数据时如何修剪列

Oracle 到 Redshift 查询迁移

什么是数据库迁移

【MongoDB-数据迁移】

什么是数据迁移?在数据迁移中需要考虑的问题