k8s医生k8s集群故障排查 – 关于kubelet 的NotReady故障

Posted Friends of the wind

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了k8s医生k8s集群故障排查 – 关于kubelet 的NotReady故障相关的知识,希望对你有一定的参考价值。

问题场景:

提示:便于理解,本节只讲一例以kubelet服务停止导致NotReady故障

无论是模拟环境,还是生产环境;kubelet 的NotReady故障是最常见的问题之一,所以掌握其排查方法很重要,而且要学会灵活变通的应用。

若是遇到此类问题,主要从系统资源和服务两个方面排查,资源不足也会导致此类问题;服务异常停止等等。

还有,我遇到不是问题的问题。在新部署的k8s集群,出现NotReady,检查来检查去没有发现问题,什么原因?是虚机环境,集群之间通信慢,等它几分钟后,自动恢复了。尤其是新手,遇到问题学会冷静分析,不要找错方向,把原本好的配置,给改错,造成二次伤害


问题描述

提示:遇到问题,如果难以解决,我们先考虑,做点什么让问题不会扩大化,再寻求解决方案

巡检过程发现k8s-node02的节点为NotReady。


解决方案:

1、系统资源排查:free -h 返回信息,分析节点内存充足;df -h返回信息,分析节点硬盘空间充足。因此,排除系统资源不足,导致服务进程停止ÿ

以上是关于k8s医生k8s集群故障排查 – 关于kubelet 的NotReady故障的主要内容,如果未能解决你的问题,请参考以下文章

k8s学习-CKA真题-集群故障排查kubelet

k8s学习-CKA真题-集群故障排查kubelet

K8s常见故障排查思路

[问题记录]k8s集群中coredns解析失败

解决k8s集群中Redis Cluster故障

故障排查:k8s内存不足(0 nodes are available:Insufficient memory)