HDFS的Checkpoint机制

Posted lijiong

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了HDFS的Checkpoint机制相关的知识,希望对你有一定的参考价值。

Checkpoint机制

技术图片

  • NameNode负责管理元数据,元数据存在内存中,但在磁盘上有元数据镜像文件FSimage和操作日志文件edits

    内存中的元数据和磁盘镜像文件有状态差,状态差体现在操作日志文件中

    SecondaryNameNode会定期将NameNode上的操作日志文件下载到本地,跟上一个状态的镜像文件合并,得到新的镜像文件并上传给NameNode,让NameNode的镜像文件和内存元数据状态差保持在一个比较小的范围

  • 触发条件:时间间隔、操作事件次数、操作日志文件数目

    1分钟检查一次是否触发触发条件,两次checkpoint间的最大周期是1小时,最大操作记录是100万,最大操作日志保留数目是100万

  1. 达到触发条件后,Secondary NameNode通知NameNode滚动操作日志
  2. Secondary NameNode下载元数据镜像文件和操作日志
  3. Secondary NameNode加载镜像文件,回放操作日志更新元数据对象,再序列化为新的镜像文件上传到NaemNode

以上是关于HDFS的Checkpoint机制的主要内容,如果未能解决你的问题,请参考以下文章

Hadoop 两种环境下的checkpoint机制

HDFS成员的工作机制

Flink状态管理和恢复机制

Flink Checkpoint 机制详解

Hadoop系列

RDD的checkpoint机制