flinkflink作业超额启动多个taskManager k8s
Posted 九师兄
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了flinkflink作业超额启动多个taskManager k8s相关的知识,希望对你有一定的参考价值。
1.概述
flink作业按照配置应该启动4个taskManager,但是现在发现一个作业启动了十几个taskManager,jobManager只监控到3个taskManager,导致集群资源耗尽,启动不了新的taskManager了。还在不断尝试启动一个新的taskManager,导致作业一直在创建状态
我怀疑作业运行一段时间,和某些taskManager失联了,然后疯狂启动tm,并伴随部分tm失联,失联的tm pod也没有被清理掉,直到资源被tm耗尽。
on K8s网络性能确实不太好,我们之前测试环境的小机器小带宽也是各种毛病
可以看看TM报的什么错,然后适当调调Akka超时或者心跳超时之类的
以上是关于flinkflink作业超额启动多个taskManager k8s的主要内容,如果未能解决你的问题,请参考以下文章
FlinkFlink The rpc invocation size %d exceeds the maximum akka framesize