HDFS学习：HDFS机架感知与副本放置策略

Posted 2021-04-14 大数据和云计算技术

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了HDFS学习：HDFS机架感知与副本放置策略相关的知识，希望对你有一定的参考价值。

洋哥YARN和HDFS实践系列大作，这是第三篇，前面两篇分别是：

1.1 机架感知(RackAwareness)概述

通常，大型Hadoop集群会分布在很多机架上。在这种情况下，

-- 希望不同节点之间的通信能够尽量发生在同一个机架之内，而不是跨机架。

-- 为了提高容错能力，名称节点会尽可能把数据块的副本放到多个机架上。

综合考虑这两点的基础上Hadoop设计了机架感知功能。

1.1.1 外在脚本实现机架感知

HDFS不能够自动判断集群中各个datanode的网络拓扑情况。这种机架感知需要topology.script.file.name属性定义的可执行文件（或者脚本）来实现，文件提供了IP->rackid的翻译。NameNode通过这个得到集群中各个datanode机器的rackid。如果topology.script.file.name没有设定，则每个IP都会翻译成/default-rack。

为了获取机架id，可以写一个小脚本来定义IP（或者DNS名），并把想要的机架id打印到标准输出stdout。

这个脚本必须要在配置文件hadoop-site.xml里通过属性’topology.script.file.name’来指定。

例如：

用Python语言编写的脚本范例： HDFS学习：HDFS机架感知与副本放置策略

1.1.2 内部Java类实现机架感知

该处采用配置topology.node.switch.mapping.impl来实现机架感知，需在core-site.xml配置文件中加入以下配置项：

<name>topology.node.switch.mapping.impl</name>

<value>com.dmp.hadoop.cluster.topology.JavaTestBasedMapping</value>

</property>

还需编写一个JAVA类，一个示例如下所示：

public class JavaTestBasedMapping implements DNSToSwitchMapping {

//key:ip value:rack

private staticConcurrentHashMap<String,String> cache = new ConcurrentHashMap<String,String>();

static {

//rack0 16

cache.put("192.168.5.116","/ht_dc/rack0");

cache.put("192.168.5.117","/ht_dc/rack0");

cache.put("192.168.5.118","/ht_dc/rack0");

cache.put("192.168.5.120","/ht_dc/rack0");

cache.put("192.168.5.121","/ht_dc/rack0");

cache.put("host116","/ht_dc/rack0");

cache.put("host117","/ht_dc/rack0");

cache.put("host118","/ht_dc/rack0");

cache.put("host120","/ht_dc/rack0");

cache.put("host121","/ht_dc/rack0");

}

@Override

publicList<String> resolve(List<String> names) {

List<String>m = new ArrayList<String>();

if (names ==null || names.size() == 0) {

m.add("/default-rack");

return m;

}

for (Stringname : names) {

Stringrack = cache.get(name);

if (rack!= null) {

m.add(rack);

}

return m;

}

将上述Java类打成jar包，加上执行权限；然后放到$HADOOP_HOME/lib目录下运行。

1.1.3 网络拓扑(NetworkTopology)

有了机架感知，NameNode就可以画出上图所示的datanode网络拓扑图。D1,R1都是交换机，最底层是datanode。则H1的rackid=/D1/R1/H1，H1的parent是R1，R1的是D1。这些rackid信息可以通过topology.script.file.name配置。有了这些rackid信息就可以计算出任意两台datanode之间的距离。