hdfs读数据流程

Posted gaoshanmuxue

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了hdfs读数据流程相关的知识,希望对你有一定的参考价值。

1,客户端通过Distributed FileSystem 向namenode请求下载文件,namenode 通过查找元数据,返回文件块所在datanode的地址。

2,客户端挑选一台datanode(按照就近原则,返回的块地址根据网络拓扑图排序,距离客户端进的排在前面)服务器,建立连接,请求读取数据;如果dn异常,则从第二优先的dn读取数据,并且标记该dn异常,后续读取块的数据直接跳过该dn。

3,datanode开始传输数据给客户端(从磁盘读取数据输入流,以packet为单位来做校验),如果块读取完毕,则关闭和datanode的连接。

4,客户端以packet为单位接收数据,先在本地缓存下来,然后写入目标文件。

以上是关于hdfs读数据流程的主要内容,如果未能解决你的问题,请参考以下文章

HDFS的读写流程面试的重点

Hadoop--04---HDFS_02----读写流程

HDFS重要概念

Hadoop面试重点HDFS 的读写流程

HDFS 读写解析

2021年大数据Hadoop:HDFS的数据读写流程