如何使用 Python Jupyter Notebook 通过 KMS 加密从 S3 读取文件

Posted

技术标签:

【中文标题】如何使用 Python Jupyter Notebook 通过 KMS 加密从 S3 读取文件【英文标题】:How to read a file from S3 with KMS encryption using Python Jupyter Notebook 【发布时间】:2021-02-08 21:58:25 【问题描述】:

我正在尝试使用 spark.read.csv 从 S3 读取文件。但是,我无法读取具有 KMS 加密的文件。我有可用的 KMS 密钥。如何在配置时在 spark 会话中指定它们。

【问题讨论】:

【参考方案1】:

对于 SSE-KMS,它是自动的:当文件被加密时,密钥 ID 与对象一起存储,为了解密文件 S3 端它直接与 KMS 对话以解密(如果您可以读取密钥)

对于客户端,AWS EMR 确实支持这一点。开源 S3A 连接器没有,因为多年来 S3 客户端加密总是填充数据,所以事情会中断。现在情况有所改变,但没有人(2021 年 1 月)提供补丁

【讨论】:

以上是关于如何使用 Python Jupyter Notebook 通过 KMS 加密从 S3 读取文件的主要内容,如果未能解决你的问题,请参考以下文章

使用Jupyter notebook的简单说明

Pyechart在Jupyter Lab下无法正确显示图形的问题

从 jupyter-notebook 下载 HTML 文件到本地

设置 jupyter notebook 可远程访问

解决Jupyter notebook报错:AssertionError: wrong color format ‘var(--jp-mirror-editor-variable-color)‘(代码片

如何使用Jupyter单元调用python命令行程序