k8s-踩坑篇2-服务器重启后重启集群

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了k8s-踩坑篇2-服务器重启后重启集群相关的知识,希望对你有一定的参考价值。

参考技术A 昨天不知道说明原因,测试环境的物理机挂了,安装k8s的3台虚拟机正好全在这台物理机上面,现在要把他们全部启动起来,安装的时候好像没有相关的步骤,今天研究一下手动重启。

报错:The connection to the server 10.100.1.236:6443 was refused

很明显apiserver没有起来,但是apiserver安装的时候是以容器的方式安装的

显示一个容器也没起来,完全不知道咋整,搜索k8s重启,看了好几篇文章,有的文章居然是kubeadm init,这txx还有什么好说的呢。不过民间的高手也是很多的,如下:

静态pod可以直接被kubelet启动,那很有可能是kubelet没有正确启动,尝试如下:每台机器上都要操作

然后用 docker ps 查看,可以看到master节点上的很多k8s容器已经启动起来了,但是worker node上的容器依然没有启动,用 kubectl get nodes ,看到node的状态还是notReady,那就很有可能是防火墙的问题了,直接关闭防火墙,看到worker node上的容器也起来了。

等待所有的calico pod启动完毕,node状态就变成ready了。

但是之前启动的 nignx pod 都不存在了,原因可能是:etcd的启动方式也是容器化的,重启后etcd内的数据被初始化了。

---本来怀疑是 systemctl daemon-reload 命令造成的,但是,今天这台服务器又重启了,我又试了一遍,不执行 systemctl daemon-reload 命令是无法重启k8s的。

---但是今天重启k8s,完成之后,昨天新建的2个pod仍然是存在的,那很有可能是我昨天不熟悉流程参杂了误操作,但是现在也想不起来了,就暂时告一段落了,后面遇到问题再说吧。

以上是关于k8s-踩坑篇2-服务器重启后重启集群的主要内容,如果未能解决你的问题,请参考以下文章

重启后k8s主节点连不上了

重启后k8s主节点连不上了

k8s -- 集群重启, Node 节点如何重新加入集群

Zookeeper集群循环重启

nacos初体验-踩坑与填坑篇

k8s-集群node节点重启docker进程的操作