HDFS组成架构

Posted 2023-03-30 互联网小阿祥

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了HDFS组成架构相关的知识，希望对你有一定的参考价值。

1.HDFS产生背景

随着数据量越来越大，在一个操作系统存不下所有的数据，那么就分配到更多的操作系统管理的磁盘中，但是不方便管理和维护，迫切需要一种系统来管理多台机器上的文件，这就是分布式文件管理系统。HDFS只是分布式文件管理系统中的一种。

2.HDFS定义

HDFS（Hadoop Distributed File System），它是一个文件系统，用于存储文件，通过目录树来定位文件；其次，它是分布式的，由很多服务器联合起来实现其功能，集群中的服务器有各自的角色。

HDFS的使用场景：适合一次写入，多次读出的场景。一个文件经过创建、写入和关闭之后就不需要改变。

1.优点

2.缺点

HDFS中的文件在物理上是分块存储（Block），块的大小可以通过配置参数（dfs.blocksize）来规定，默认大小在Hadoop2.x/3.x版本中都是128M，1.x版本中是64M。

HDFS的块设置太小，会增加寻址时间，程序一直在找块的开始位置。

如果块设置的太大，从磁盘传输数据的时间会明显大于定位这个块开始位置所需的时间，导致程序在处理这块数据的时候，非常慢。

HDFS 采用Master/Slave的架构来存储数据，这种架构主要由四个部分组成NameNode， DataNode，client，和SencondayNameNode组成

HDFS架构和组成

NameNode(Master)：

1. 管理 HDFS 的命名空间，维护元数据。

2. 接收客户端的请求。

3. 管理数据块（Block）映射信息.

4. 配置副本策略

DataNode(Slave)：

1. 存储实际的数据块。

2. 执行数据块的读/写操作。

3. 向namenode上传心跳信息。

Client(客户端)：

1、文件上传 HDFS 的时候，Client 将文件切分成Block，然后进行存储。

2、与 NameNode 交互，获取文件的位置信息。

3、与 DataNode 交互，读取或者写入数据。

4、Client 提供一些命令来管理 HDFS，比如启动或者关闭HDFS。

SencondayNameNode(辅助工作者)：

1、辅助 NameNode，分担其工作量。

2、定期合并 fsimage和fsedits，并推送给NameNode。

3、在紧急情况下，可辅助恢复 NameNode。

以上是关于HDFS组成架构的主要内容，如果未能解决你的问题，请参考以下文章