Apache Airflow:将s3复制到s3的运算符
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Apache Airflow:将s3复制到s3的运算符相关的知识,希望对你有一定的参考价值。
在airflow中将文件从一个s3复制到另一个s3的最佳操作符是什么?我已经尝试过S3FileTransformOperator,但它需要transform_script或select_expression。我的要求是将确切的文件从源复制到目标。
答案
你有两个选择(即使我忽视Airflow
)
- 使用AWS CLI:
cp
commandaws s3 cp <source> <destination>
在Airflow
中,可以使用BashOperator
(本地机器)或SSHOperator
(远程机器)运行此命令 - 使用AWS SDK aka
boto3
在这里你将使用boto3
的S3Client
气流已经以S3Hook
的形式提供了它的包装 甚至copy_object(..)
method ofS3Client
也可以在S3Hook
as (again)copy_object(..)
获得 您可以在任何合适的自定义S3Hook
内使用operator
或只使用PythonOperator
以上是关于Apache Airflow:将s3复制到s3的运算符的主要内容,如果未能解决你的问题,请参考以下文章
使用 Airflow PUT 命令将 S3 文件移动到 Snowflake 阶段
在 docker 容器超时中从 s3 复制到 Redshift
使用从 S3 事件调用的 AWS Lambda 触发 Airflow DAG
Apache Airflow - 在 AWS MWAA 上解析 SQL 查询很慢