使用 Python 在 AWS Glue 中打开和读取文件

Posted

技术标签:

【中文标题】使用 Python 在 AWS Glue 中打开和读取文件【英文标题】:File open and read in AWS Glue with Python 【发布时间】:2022-01-17 18:34:00 【问题描述】:

我在下面有一个简单的 python 代码。这是用桌面编写的,现在我想将其重新创建为 aws 胶水或 lambda,我必须从 s3 目录中读取 testfile.csv 并将其放入 txt 中,如下所示。如何在 aws 胶水/lambda 环境中重新创建这种打开和读取。任何意见表示赞赏。

filepath = testfile.csv
txt = open(filepath).read()

【问题讨论】:

【参考方案1】:

我已经找到了解决方案。第一行将文件存储为字节对象,第二行将其转换为字符串并存储到 txt。

object = s3client.get_object(Bucket='mybucket',Key='testfile.csv')
txt = (object['Body'].read().decode('utf-8'))

【讨论】:

以上是关于使用 Python 在 AWS Glue 中打开和读取文件的主要内容,如果未能解决你的问题,请参考以下文章

AWS Python Shell - 如何使用 Glue 目录连接

AWS Glue Python Shell 与 Oracle 的连接

Python 函数在 AWS Glue 中返回非类型,即使是在本地机器上工作的相同函数

AWS Glue Python shell 配置 DPU

如何在 AWS-Glue 脚本中编写用户定义的函数?

至少一个安全组必须打开所有入口端口。 AWS Glue 连接到 RDS