如何从 HDFS 中的 BP 文件夹中恢复数据
Posted
技术标签:
【中文标题】如何从 HDFS 中的 BP 文件夹中恢复数据【英文标题】:How to restore data from BP folder in HDFS 【发布时间】:2018-09-01 05:59:26 【问题描述】:配置:我们有 1 个 HDFS Namenode 和 3 个数据节点。
现在,namenode 已重新启动,并且由于某种原因集群 ID 已更改(Datanodes 仍在运行)
我们尝试将集群 ID 从 datanode 更新到 namenode,反之亦然,但没有成功。 Namenode 和 datanode 永远无法同步数据。
由于它很关键且数据较少,我们格式化了 HDFS。 (在格式化之前,我们将整个 BP 文件夹复制到某个存储中)。
现在我们可以将备份文件夹中的数据恢复到 HDFS 了吗?
【问题讨论】:
【参考方案1】:如果没有 NameNode fsimage
,仅使用备份的 BP 文件夹是不可能恢复数据的。修复集群 ID 比从 BP 文件夹恢复数据要容易得多。
【讨论】:
以上是关于如何从 HDFS 中的 BP 文件夹中恢复数据的主要内容,如果未能解决你的问题,请参考以下文章