一次master节点notReady的修复过程
Posted janeysj
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了一次master节点notReady的修复过程相关的知识,希望对你有一定的参考价值。
这天打开电脑,发现master节点的状态异常,是notReady状态。其他计算机点还好时Ready状态。
检查etcd集群状态
首先通过命令etcdctl member list确认etcd集群是OK的。
检查master节点各个进程状态
这时检查master节点上的各个kube相关进程都在. 但通过systemctl status kubelet,kubelet的的进程显示如下:
??
于是重启kube-proxy和kubelet,查看进程状态正常。但奇怪的是过了一会kubelet状态又异常了。这时我使用命令kubectl delete node k8s-master
删除了这个master-node.但是这个node一直注册不到集群中。
这时查看kubelet的log文件显示如下:
因此可以判定是认证文件出了问题。
检查证书
首先通过命令kubectl get cs
查看获取集群状态,显示如下:
使用命令kubectl get csr
查看证书状态,显示如下:
使用命令kubectl certificate approve node-csr-qwDqWMuffouPtl2DIqz8NN3cB9R-DvBg_ULg6mYrEKU
approve CSR 请求,最后重启kubelet就可以了。但因为之前把这个节点删除了,所以需要给这个节点打上所需要的label.
以上是关于一次master节点notReady的修复过程的主要内容,如果未能解决你的问题,请参考以下文章
K8S kubeadm 部署出现的故障:kubectl get nodes 节点显示 NotReady
K8S kubeadm 部署出现的故障:kubectl get nodes 节点显示 NotReady
记一次虚机强制断电磁盘损坏导致 K8s 集群 部分节点未就绪(NotReady) 问题解决