Flink 基于K8S HA 存在的问题

Posted 鸿乃江边鸟

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Flink 基于K8S HA 存在的问题相关的知识,希望对你有一定的参考价值。

背景

本文基于Flink 1.13.x
Flink on K8S
在基于原生K8S做JobManager HA服务的前提下,随着部署在K8S的flink任务越来越多,JobManager节点挂的频率越来越高,这严重影响了整个Flink作业的运行。

分析

对于目前的flink的架构,画出如下的图,该图也是参考了官方

其实最主要的原因是flink集群对etcd的访问过于频繁(etcd是K8S的最为关键的组件),导致了整个K8S集群的不稳定。

以上是关于Flink 基于K8S HA 存在的问题的主要内容,如果未能解决你的问题,请参考以下文章

FLINK ON K8S 基于Zookeeper和基于K8S原生HA的区别

FLINK ON K8S 基于Zookeeper和基于K8S原生HA的区别

Flink JobManager高可用性(HA)

大数据Flink进阶(十六):Flink HA搭建配置

Flink Flink JobManager HA 机制的扩展与实现

flink-1.12.2 ha 集群配置