用于将数据从AWS S3加载到Redshift的Python脚本

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了用于将数据从AWS S3加载到Redshift的Python脚本相关的知识,希望对你有一定的参考价值。

有没有人致力于创建一个python脚本来将数据从s3加载到多个文件的redshift表。我们如何在AWS CLI中实现它。您对此的学习和投入表示赞赏。

答案

COPY command是将数据从Amazon S3加载到Amazon Redshift的最佳方式。它可以将多个文件并行加载到一个表中。

使用任何Python库(例如PostgreSQL + Python | Psycopg)连接到Amazon Redshift,然后发出COPY命令。

AWS Command-Line Interface (CLI)无法在Redshift上运行COPY命令,因为它需要发布到数据库,而AWS CLI会向AWS发出命令。 (AWS CLI可用于启动/终止Redshift群集,但不能连接到群集本身。)

以上是关于用于将数据从AWS S3加载到Redshift的Python脚本的主要内容,如果未能解决你的问题,请参考以下文章

AWS Redshift:从 S3 上的许多存储桶加载数据

将 Parquet 文件从 AWS Glue 加载到 Redshift

aws Glue / Redshift 的预过滤解决方案(在加载到 S3 之前)

如何使用 aws unload 命令将数据从 AWS Redshift 卸载到 s3?

何时通过 AWS Glue ETL 使用 Amazon Redshift 频谱来查询 Amazon S3 数据

无法将制表符分隔的 Txt 文件从 S3 加载到 Redshift