比较s3 bucket和csv文件之间的行并发送到s3

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了比较s3 bucket和csv文件之间的行并发送到s3相关的知识,希望对你有一定的参考价值。

我有带有zip文件的s3存储桶。 zip文件的路径是s3:// bucketName / tech / type / serialNumber。

我还有包含region,serialNumber和type的csv文件

我需要将s3存储桶中的serialNumber和type与serialNumber进行比较并从csv中键入,并将带有zip文件的文件夹上传到与该序列对齐的区域下的另一个s3存储桶中的位置,并从csv输入。

我不知道怎么开始:)我希望我能够解释我的自我

**我在bash中编写脚本

谢谢

答案

一种方法是将源数据加载到数据库中。

然后,您的应用程序可以读取CSV文件并查询数据库以获取适当的信息。 (这就是数据库存在的原因!)

另一种方法是通过CSV文件读取您的应用程序。对于每个条目,它将从S3下载匹配文件并根据需要进行处理。

或者,您可以从S3下载所有数据并在本地执行所有操作(这可能意味着在您自己的计算机上或在Amazon EC2实例上)。

我建议你选择一种编程语言(例如Python),而不是试图在bash中这样做。

以上是关于比较s3 bucket和csv文件之间的行并发送到s3的主要内容,如果未能解决你的问题,请参考以下文章

如何将表中的数据作为 CSV 从 Greenplum 数据库导出到 AWS s3 存储桶

将 CSV 流从 Ruby 上传到 S3

从充满 CSV 文件的 AWS S3 目录中复制 Redshift

AWS S3监控文件夹级别指标

将 s3 中跨 CSV 文件的数十亿条记录推送到 MongoDb

在 S3 和 Redshift 之间测试数据