一次master节点notReady的修复过程

Posted janeysj

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了一次master节点notReady的修复过程相关的知识,希望对你有一定的参考价值。

这天打开电脑,发现master节点的状态异常,是notReady状态。其他计算机点还好时Ready状态。

检查etcd集群状态

首先通过命令etcdctl member list确认etcd集群是OK的。

检查master节点各个进程状态

这时检查master节点上的各个kube相关进程都在. 但通过systemctl status kubelet,kubelet的的进程显示如下:
??技术图片

于是重启kube-proxy和kubelet,查看进程状态正常。但奇怪的是过了一会kubelet状态又异常了。这时我使用命令kubectl delete node k8s-master删除了这个master-node.但是这个node一直注册不到集群中。
这时查看kubelet的log文件显示如下:
技术图片

因此可以判定是认证文件出了问题。

检查证书

首先通过命令kubectl get cs查看获取集群状态,显示如下:
技术图片

使用命令kubectl get csr查看证书状态,显示如下:
技术图片

使用命令kubectl certificate approve node-csr-qwDqWMuffouPtl2DIqz8NN3cB9R-DvBg_ULg6mYrEKUapprove CSR 请求,最后重启kubelet就可以了。但因为之前把这个节点删除了,所以需要给这个节点打上所需要的label.

以上是关于一次master节点notReady的修复过程的主要内容,如果未能解决你的问题,请参考以下文章

K8S kubeadm 部署出现的故障:kubectl get nodes 节点显示 NotReady

K8S kubeadm 部署出现的故障:kubectl get nodes 节点显示 NotReady

K8S Node启动后 处于NotReady状态的问题

记一次虚机强制断电磁盘损坏导致 K8s 集群 部分节点未就绪(NotReady) 问题解决

记一次虚机强制断电磁盘损坏导致 K8s 集群 部分节点未就绪(NotReady) 问题解决

kubernetes排错系列:机房搬迁导致的节点NotReady