如何使用无服务器架构将数据从 S3 加载到 Redshift?

Posted

技术标签:

【中文标题】如何使用无服务器架构将数据从 S3 加载到 Redshift?【英文标题】:How do I load data from S3 to Redshift using serverless architecture? 【发布时间】:2017-07-14 03:38:07 【问题描述】:

有没有关于如何使用 AWS-Lambda 函数在不使用 EC2 的情况下将文件从 S3 加载到 AWS redshift 的 Python 演示?

【问题讨论】:

【参考方案1】:

有一个库可用于使用 AWS Lambda 函数将数据加载到 Amazon Redshift。

见:A Zero-Administration Amazon Redshift Database Loader

【讨论】:

但是好像用javascript,我想用Python。有办法吗?【参考方案2】:

我不知道有 Python 演示,但构建它应该不难。您需要编写一个 Lambda 连接到 Redshift,然后执行 COPY from S3。如果你想要更多的自动化,那么你可以trigger it from s3:ObjectCreated。这样上传文件会自动将其复制到 Redshift。

【讨论】:

以上是关于如何使用无服务器架构将数据从 S3 加载到 Redshift?的主要内容,如果未能解决你的问题,请参考以下文章

使用引号将数据从 S3 加载到 Amazon Redshift

如何检查从 aws S3 到雪花的数据加载结果

在不使用 S3 存储桶的情况下将数据从远程服务器的 .gz 文件加载到 redshift 的 postgresql 实例?

用于将数据从AWS S3加载到Redshift的Python脚本

使用复制命令将数据从 s3 加载到 redshift

将批量数据从 s3 加载到 redshift