从充满 CSV 文件的 AWS S3 目录中复制 Redshift
Posted
技术标签:
【中文标题】从充满 CSV 文件的 AWS S3 目录中复制 Redshift【英文标题】:Redshift COPY from AWS S3 directory full of CSV files 【发布时间】:2020-06-05 07:38:40 【问题描述】:我正在尝试在 Redshift 中执行 COPY 查询,以加载存储在 AWS S3 路径中的不同 .csv 文件(比如说s3://bucket/path/csv/
)。该路径中的 .csv 文件在其文件名中包含一个日期(即:s3://bucket/path/csv/file_20200605.csv
、s3://bucket/path/csv/file_20200604.csv
、...),因为其中的数据对应于特定日期的数据。我的问题是(因为加载文件的顺序很重要),Redshift 会按字母顺序加载这些文件吗?
【问题讨论】:
【参考方案1】:COPY 命令利用 Amazon Redshift 大规模并行处理 (MPP) 架构从 Amazon S3 存储桶中的文件中并行读取和加载数据。
关于您的问题,文件将并行加载。
【讨论】:
以上是关于从充满 CSV 文件的 AWS S3 目录中复制 Redshift的主要内容,如果未能解决你的问题,请参考以下文章
AWS DMS - 如何将 RDS 表数据写入单个 S3 目标文件?
将 csv 和 json 数据从 S3 复制到 Redshift
AWS Glue - 从 sql server 表中读取并作为自定义 CSV 文件写入 S3
如何使用 Python 在 myBucket 中上传 CSV 文件并在 S3 AWS 中读取文件