HDFS数据复本存放

Posted enzodin

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了HDFS数据复本存放相关的知识,希望对你有一定的参考价值。

复本怎么放
Hadoop的默认布局策略是在运行客户端的节点上放第一个复本(如果客户端运行在容器之外,就随机选择一个节点,不过系统会避免挑选那些存储太满或太忙的节点)。第二个复本放在与第一个不通且随机另外选择的机架中节点上(离架)。第三个复本与第二个复本放在同一个机架上,且随机选择另一个节点,其他复本放在集群中随机选择的节点上,不过系统会尽量避免在同一个机架上放太多复本。
一旦选定复本的放置位置,就根据网络拓扑创建一个管线。
总的来说,这一方法不仅提供很好的稳定性(数据块存储在两个机架中)并实现很好的负载均衡,包括写入带宽(写入操作只需要遍历一个交换机)、读取性能(可以从两个机架中选择读取)和集群中块的均匀分布(客户端只在本地机架上写入一个块)

 技术分享图片

 




以上是关于HDFS数据复本存放的主要内容,如果未能解决你的问题,请参考以下文章

[HDFS_add_3] HDFS 机架感知

大数据:Hadoop(HDFS 的设计思路设计目标架构副本机制副本存放策略)

HDFS存储介绍

HDFS

Hadoop之HDFS读写流程

Hadoop三大组件