为啥我们需要 Hadoop KMS?

Posted

技术标签:

【中文标题】为啥我们需要 Hadoop KMS?【英文标题】:Why do we need Hadoop KMS?为什么我们需要 Hadoop KMS? 【发布时间】:2017-07-15 16:06:22 【问题描述】:

我不知道为什么我们需要这个Hadoop KMS 到底是为了什么?我浏览了 Apache Hadoop 的官方文档,并没有明确提到我们为什么需要这个概念。我唯一清楚的是,使用clientserver 可以使用REST APIshttphttps 上共享密钥,然后有多种身份验证方式。是从安全角度来看的吗??有人可以用外行的方式向我解释它到底是什么吗?? 如果我在任何地方错了,请纠正我。

【问题讨论】:

不要将其标记为负面帖子,帮助!我是这个领域的新手,我不认为我的帖子不遵循 SO 规则。我提到了我的看法。如果我错了,请纠正我 【参考方案1】:

KMS 基本上是 HDFS 原生数据加密实用程序的一部分, 用于存储加密密钥。您现在可以在 HDFS 中加密选定的文件或目录,而无需更改任何应用程序代码。

HDFS 管理员设置加密,然后 HDFS 负责实际的加密或解密,最终用户无需手动加密或解密文件。以下术语描述了透明数据加密 (TDE) 的关键领域:

加密区 - HDFS 管理员创建一个加密区,然后将其链接到一个空的 HDFS 目录和一个加密密钥。任何放入目录的文件都会被 HDFS 自动加密。

密钥管理服务器 (KMS) - KMS 负责存储加密密钥。 KMS 提供 REST API 和对存储在 KMS 中的密钥的访问控制。

Key Provider API - HDFS 名称节点和客户端用来连接密钥管理服务器的粘合剂。

参考:Enabling transparent data encryption

【讨论】:

【参考方案2】:

是的,你是对的 KMS(密钥管理服务器)用于安全性。它用于存储和管理用于通过 HTTP 进行安全通信的密钥。它也可以与 Apache Ranger 一起使用。可以找到更多信息这里:https://hadoop.apache.org/docs/r2.8.0/hadoop-kms/index.html

【讨论】:

以上是关于为啥我们需要 Hadoop KMS?的主要内容,如果未能解决你的问题,请参考以下文章

为啥我们需要 Hadoop 无密码 ssh?

使用AWS KMS加密本地数据

为啥我们使用 hadoop mapreduce 进行数据处理?为啥不在本地机器上做呢?

大数据Hadoop-Kms 安装及相关详细配置,看完你就会了

kms激活到底安全不安全

Hadoop数据节点:为啥数据块的阈值有一个神奇的“数字”?