spark基于Zookeeper的HA集群重启

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了spark基于Zookeeper的HA集群重启相关的知识,希望对你有一定的参考价值。

1、首先应该了解,spark集群基于Zookeeper的HA实现

  当master挂了之后,会重新ElectLeader,不会影响Application的运行。默认的Zookeeper"/spark"目录下,会持久化driver,worker,master等信息。

2、Application需要重新submit的情况是在重启Driver所在的机器的时候,也就是说Driver一旦挂了,那么只有重新去提交Application这一途径。

 

3、重启步骤:

01,02,03三台master机器。

master01,master02,master03上分别运行worker01,worker02,worker03,Application提交的任务在worker03上。

master01是ALIVE状态。

 

重启:

  当重启01机器时候,master会切到02,同时WebUI页面Application依旧会运行。

  接着重启机器02,情况与重启01类似。

  最后重启03,重启03后,Application状态会变为UNKNOWN,之后变为FINISH,此时需要重新提交你的Application

以上是关于spark基于Zookeeper的HA集群重启的主要内容,如果未能解决你的问题,请参考以下文章

spark的HA集群搭建

hadoop-ha+zookeeper+hbase+hive+sqoop+flume+kafka+spark集群安装

转Spark:Master High Availability(HA)高可用配置的2种实现

Spark技术内幕:Master基于ZooKeeper的High Availability(HA)源代码实现

Spark技术内幕:Master基于ZooKeeper的High Availability(HA)源代码实现

基于ZooKeeper的Hadoop HA集群搭建