hadoop3.x的HA解析

Posted bioamin

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了hadoop3.x的HA解析相关的知识,希望对你有一定的参考价值。

1.官网   https://hadoop.apache.org/docs/r3.1.2/hadoop-project-dist/hadoop-hdfs/HDFSHighAvailabilityWithQJM.html

2.namenode支持3个及3个以上的namenode,官方建议3个,journal node奇数个

 

hdfs-site.xml
#namespace名称:

<property>
  <name>dfs.nameservices</name>
  <value>mycluster</value>
</property>
#namenode id hdfs-site.xml 指定3个namenode
<property>
  <name>dfs.ha.namenodes.mycluster</name>
  <value>nn1,nn2, nn3</value>
</property>
#各个namenode的通信地址:rpc

<property>
  <name>dfs.namenode.rpc-address.mycluster.nn1</name>
  <value>machine1.example.com:8020</value>
</property>
<property>
  <name>dfs.namenode.rpc-address.mycluster.nn2</name>
  <value>machine2.example.com:8020</value>
</property>
<property>
  <name>dfs.namenode.rpc-address.mycluster.nn3</name>
  <value>machine3.example.com:8020</value>
</property>
#每个namenode的http服务  在2.x默认是50070,在3.x已经变成9870
<property>
  <name>dfs.namenode.http-address.mycluster.nn1</name>
  <value>machine1.example.com:9870</value>
</property>
<property>
  <name>dfs.namenode.http-address.mycluster.nn2</name>
  <value>machine2.example.com:9870</value>
</property>
<property>
  <name>dfs.namenode.http-address.mycluster.nn3</name>
  <value>machine3.example.com:9870</value>
</property>
#配置journal node的共享路径
<property>
  <name>dfs.namenode.shared.edits.dir</name>
  <value>qjournal://node1.example.com:8485;node2.example.com:8485;node3.example.com:8485/mycluster</value>
</property>

 

#定义联系namonode的java类,用于确定当前处于 Active 状态的 NameNode:ConfiguredFailoverProxyProvider或者RequestHedgingProxyProvider
<property> 
  <name> dfs.client.failover.proxy.provider.mycluster </ name> 
  <value> org.apache.hadoop.hdfs.server.namenode.ha.ConfiguredFailoverProxyProvider </ value> 
</ property>

 

#故障转移期间的防护方法shell和sshfence,免密登陆杀进程
    <!-- 配置隔离机制 -->
    <property>
        <name>dfs.ha.fencing.methods</name>
        <value>sshfence</value>
    </property>
    <!-- 使用隔离机制时需要ssh免登陆 -->
    <property>
        <name>dfs.ha.fencing.ssh.private-key-files</name>
        <value>/home/dip/.ssh/id_rsa</value>
    </property>

 

<property>
<!-- Journal Edit Files 的存储目录 -->
<name>dfs.journalnode.edits.dir</name>
<value>/opt/cslc/hadoop-2.7.7/journalnode/data</value>
</property>

故障自动转移(需要在core-site.xml配置zookeeper地址)

<property>
   <name>dfs.ha.automatic-failover.enabled</name>
   <value>true</value>
 </property>

 

core-site.xml

<property>
  <name>fs.defaultFS</name>
  <value>hdfs://mycluster</value>
</property>

故障转移配置zookeeper

 <property>
   <name>ha.zookeeper.quorum</name>
   <value>zk1.example.com:2181,zk2.example.com:2181,zk3.example.com:2181</value>
 </property>

 

 启动journal node

hdfs --daemon start journalnode

一个namenode初始化

hdfs namenode -format

 

剩余namenode同步数据

故障自动转移:在ZooKeeper中初始化HA状态(在一个namenode上执行)

hdfs   zkfc  -formatZK

以上是关于hadoop3.x的HA解析的主要内容,如果未能解决你的问题,请参考以下文章

[hadoop3.x系列]Google Option概要及使用

大数据Hadoop2.x与Hadoop3.x相比较都有哪些变化

SpringCloud系列四:Eureka 服务发现框架(定义 Eureka 服务端Eureka 服务信息Eureka 发现管理Eureka 安全配置Eureka-HA(高可用) 机制Eur(代码片段

Hadoop3.x新特性

搭建Hadoop3.x分布式集群

2021年大数据Hadoop(三十):Hadoop3.x的介绍