为啥我们需要 Hadoop KMS?
Posted
技术标签:
【中文标题】为啥我们需要 Hadoop KMS?【英文标题】:Why do we need Hadoop KMS?为什么我们需要 Hadoop KMS? 【发布时间】:2017-07-15 16:06:22 【问题描述】:我不知道为什么我们需要这个Hadoop KMS
到底是为了什么?我浏览了 Apache Hadoop 的官方文档,并没有明确提到我们为什么需要这个概念。我唯一清楚的是,使用client
和server
可以使用REST APIs
在http
或https
上共享密钥,然后有多种身份验证方式。是从安全角度来看的吗??有人可以用外行的方式向我解释它到底是什么吗??
如果我在任何地方错了,请纠正我。
【问题讨论】:
不要将其标记为负面帖子,帮助!我是这个领域的新手,我不认为我的帖子不遵循 SO 规则。我提到了我的看法。如果我错了,请纠正我 【参考方案1】:KMS 基本上是 HDFS 原生数据加密实用程序的一部分, 用于存储加密密钥。您现在可以在 HDFS 中加密选定的文件或目录,而无需更改任何应用程序代码。
HDFS 管理员设置加密,然后 HDFS 负责实际的加密或解密,最终用户无需手动加密或解密文件。以下术语描述了透明数据加密 (TDE) 的关键领域:
加密区 - HDFS 管理员创建一个加密区,然后将其链接到一个空的 HDFS 目录和一个加密密钥。任何放入目录的文件都会被 HDFS 自动加密。
密钥管理服务器 (KMS) - KMS 负责存储加密密钥。 KMS 提供 REST API 和对存储在 KMS 中的密钥的访问控制。
Key Provider API - HDFS 名称节点和客户端用来连接密钥管理服务器的粘合剂。
参考:Enabling transparent data encryption
【讨论】:
【参考方案2】:是的,你是对的 KMS(密钥管理服务器)用于安全性。它用于存储和管理用于通过 HTTP 进行安全通信的密钥。它也可以与 Apache Ranger 一起使用。可以找到更多信息这里:https://hadoop.apache.org/docs/r2.8.0/hadoop-kms/index.html
【讨论】:
以上是关于为啥我们需要 Hadoop KMS?的主要内容,如果未能解决你的问题,请参考以下文章
为啥我们使用 hadoop mapreduce 进行数据处理?为啥不在本地机器上做呢?