K8S集群POD数量达到上限导致无法升级

Posted vinsent

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了K8S集群POD数量达到上限导致无法升级相关的知识,希望对你有一定的参考价值。

客户问题:
因为部分节点 pod 数量达到上限,无法通过前置检查

问题原因:
集群升级需要在节点上运行一个pod,用于集群升级。前置检查中也需要在节点上运行一个pod,进行节点检查。所以节点的pod限额被用光会导致无法升级。这是一个Corner case

临时方案:
对集群进行扩容,将pod配额用光的节点上的pod,驱逐一到两个到新的节点上,从而为集群升级和前置检查腾出空间,完成升级

产品化方案:
为每个集群都创建一个daemon set,在每个节点上常驻一个pod,后续前置检查和集群升级都通过这个常驻pod完成。





以上是关于K8S集群POD数量达到上限导致无法升级的主要内容,如果未能解决你的问题,请参考以下文章

k8s 调度不合理解决方案如下-临时方案

K8S使用Statefulset管理集群pod模式

精品k8s的pod迁移与节点停机维护

解决k8s集群中Redis Cluster故障

K8S系列Deployment 详解

处理K8S集群pod不能访问其他service的问题