K8s常见故障排查思路

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了K8s常见故障排查思路相关的知识,希望对你有一定的参考价值。

step_1: kubectl get node
1. 查看集群节点是否处于 Ready 状态
        a. 如果是Ready状态,再使用kubectl describe node <nodeName>, 资源使用率
        b. 如果是NotReady,则使用kubectl  get node -owide 查看对应的节点,然后登陆到对应节点上, 查看kubelet 和docker 服务是否正常;

step_2: kubectl get cs

1. 查看集群关键组件的状态是否是 Healthy
        a. 如果是,不予理睬
        b. 如果是Unhealthy 状态,使用则使用kubectl  get node -owide 查看对应的节点,然后登陆到对应节点上查看kubelet 和docker 服务是否正常;

step_3: kubectl -n <namespace> get pod -owide <-w>

查看pod 是否处于running 状态

step_4: kubectl -n <namespace> describe pod <podName>

查看非running 状态到具体可能原因

step_5: kubectl -n <namespace> logs -f <podName> [-c <containerName>]

以上是关于K8s常见故障排查思路的主要内容,如果未能解决你的问题,请参考以下文章

k8s故障排查指南

k8s常见故障排查一点通

linux运维系统故障排查思路及常见故障处理

linux运维系统故障排查思路及常见故障处理

电脑常见故障排查思路

rsync 常见故障排查及思路