K8s常见故障排查思路
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了K8s常见故障排查思路相关的知识,希望对你有一定的参考价值。
step_1: kubectl get node1. 查看集群节点是否处于 Ready 状态
a. 如果是Ready状态,再使用kubectl describe node <nodeName>, 资源使用率
b. 如果是NotReady,则使用kubectl get node -owide 查看对应的节点,然后登陆到对应节点上, 查看kubelet 和docker 服务是否正常;
step_2: kubectl get cs
1. 查看集群关键组件的状态是否是 Healthy
a. 如果是,不予理睬
b. 如果是Unhealthy 状态,使用则使用kubectl get node -owide 查看对应的节点,然后登陆到对应节点上查看kubelet 和docker 服务是否正常;
step_3: kubectl -n <namespace> get pod -owide <-w>
查看pod 是否处于running 状态
step_4: kubectl -n <namespace> describe pod <podName>
查看非running 状态到具体可能原因
step_5: kubectl -n <namespace> logs -f <podName> [-c <containerName>]
以上是关于K8s常见故障排查思路的主要内容,如果未能解决你的问题,请参考以下文章