如何从 HDFS 中的 BP 文件夹中恢复数据

Posted

技术标签:

【中文标题】如何从 HDFS 中的 BP 文件夹中恢复数据【英文标题】:How to restore data from BP folder in HDFS 【发布时间】:2018-09-01 05:59:26 【问题描述】:

配置:我们有 1 个 HDFS Namenode 和 3 个数据节点。

现在,namenode 已重新启动,并且由于某种原因集群 ID 已更改(Datanodes 仍在运行)

我们尝试将集群 ID 从 datanode 更新到 namenode,反之亦然,但没有成功。 Namenode 和 datanode 永远无法同步数据。

由于它很关键且数据较少,我们格式化了 HDFS。 (在格式化之前,我们将整个 BP 文件夹复制到某个存储中)。

现在我们可以将备份文件夹中的数据恢复到 HDFS 了吗?

【问题讨论】:

【参考方案1】:

如果没有 NameNode fsimage,仅使用备份的 BP 文件夹是不可能恢复数据的。修复集群 ID 比从 BP 文件夹恢复数据要容易得多。

【讨论】:

以上是关于如何从 HDFS 中的 BP 文件夹中恢复数据的主要内容,如果未能解决你的问题,请参考以下文章

被误删的HDFS文件如何有效恢复

被误删的HDFS文件如何有效恢复

如何恢复未释放租约的HDFS文件

HDFS中NameNode发生故障没有备份从SecondNameNode恢复

hadoop上删除文件

hdfs文件系统故障 MISSING * blocks