YarnYarn HA 高可用集群

Posted 九师兄

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了YarnYarn HA 高可用集群相关的知识,希望对你有一定的参考价值。


2023年初一,发个博客纪念一下

1.概述

背景

ResourceManager负责资源管理和应用的调度,是YARN的核心组件,集群的主角色。

在Hadoop 2. 4之前, ResourceManager是YARN群集中的SPOF ( Single Point of Failure ,单点故障)

为了解决RM的单点故障问题, YARN设计了一套Active/Standby模式的ResourceManager HA架构。


架构

Hadoop官方推荐方案 :基于Zookeeper集群实现YARN HA。

  • 实现HA集群的关键是:主备之间状态数据同步、主备之间顺利切换(故障转移机制)

  • 针对数据同步问题 ,可以通过zk来存储共享集群的状态数据。因为zk本质也是一个小文件存储系统。

  • 针对主备顺利切换,可以手动,也可以基于zk自动实现。

2. 故障转移机制

第一种:手动故障转移

管理员使用命令手动进行状态切换。

第二种:自动故障转移

以上是关于YarnYarn HA 高可用集群的主要内容,如果未能解决你的问题,请参考以下文章

HA 高可用集群概述及其原理解析

高可用集群HA(heartbeat)

Linux 高可用(HA)集群基本概念详解

高可用集群HA之双机集群

HA高可用集群

HadoopHDFS HA高可用