从充满 CSV 文件的 AWS S3 目录中复制 Redshift

Posted

技术标签:

【中文标题】从充满 CSV 文件的 AWS S3 目录中复制 Redshift【英文标题】:Redshift COPY from AWS S3 directory full of CSV files 【发布时间】:2020-06-05 07:38:40 【问题描述】:

我正在尝试在 Redshift 中执行 COPY 查询,以加载存储在 AWS S3 路径中的不同 .csv 文件(比如说s3://bucket/path/csv/)。该路径中的 .csv 文件在其文件名中包含一个日期(即:s3://bucket/path/csv/file_20200605.csvs3://bucket/path/csv/file_20200604.csv、...),因为其中的数据对应于特定日期的数据。我的问题是(因为加载文件的顺序很重要),Redshift 会按字母顺序加载这些文件吗?

【问题讨论】:

【参考方案1】:

COPY 命令利用 Amazon Redshift 大规模并行处理 (MPP) 架构从 Amazon S3 存储桶中的文件中并行读取和加载数据。

关于您的问题,文件将并行加载。

【讨论】:

以上是关于从充满 CSV 文件的 AWS S3 目录中复制 Redshift的主要内容,如果未能解决你的问题,请参考以下文章

AWS DMS - 如何将 RDS 表数据写入单个 S3 目标文件?

将 csv 和 json 数据从 S3 复制到 Redshift

AWS Glue - 从 sql server 表中读取并作为自定义 CSV 文件写入 S3

如何使用 Python 在 myBucket 中上传 CSV 文件并在 S3 AWS 中读取文件

当我们从 s3 中的 csv 文件读取数据并在 aws athena 中创建表时如何跳过标题。

使用 python 从 AWS S3 到 PostgreSQL Amazon RDS 的 CSV 文件