将数据加载到 redshift 数据库中

Posted

技术标签:

【中文标题】将数据加载到 redshift 数据库中【英文标题】:Loading data into redshft database 【发布时间】:2018-10-08 04:01:51 【问题描述】:

我在 amazon s3 的一个文件夹中有五个 JSON 文件。我正在尝试使用复制命令将所有五个文件从 s3 加载到 redshift 中。将一个文件从 s3 加载到 redshift 时出现错误。 redshift 中是否有任何方法可以跳过加载该文件并加载下一个文件。

【问题讨论】:

是完整的文件更正还是有一些记录有数据问题? 【参考方案1】:

COPY 命令中使用MAXERROR 参数来增加允许的错误数。这将跳过任何产生错误的

然后,使用STL_LOAD_ERRORS 表查看错误并诊断数据问题。

【讨论】:

以上是关于将数据加载到 redshift 数据库中的主要内容,如果未能解决你的问题,请参考以下文章

如何将 CDC 加载到 Redshift 数据库中?

将数据加载到 Redshift

使用 COPY 功能自动将数据加载到 Redshift

有没有办法将数据从 redshift 加载到 HDFS?

Redshift中的存储过程将数据加载到表中

Node-Redshift 是不是支持复制命令(查询)将数据从 S3 加载到 Redshift?