运维人员处理服务器故障的方法总结

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了运维人员处理服务器故障的方法总结相关的知识,希望对你有一定的参考价值。

运维人员处理服务器故障的方法总结

一、尽可能搞清楚问题的前因后果

二、查看有谁在线

who

last

三、查看之前执行了什么命令

 history

四、查看现在在运行的进程是什么

 pstree -a

 ps aux

五、查看监听的网络服务

netstat -nxlp

netstat -ntlp

netstat -nulp

六、查看CPU 和内存

free -m

uptime

top

htop

七、查看硬件

lspci

dmidecode

ethtool

八、查看IO 性能

iostat -kx 2

vmstat 2 10

mpstat 2 10

dstat --top-io --top-bio #可以看到谁在进行 IO

九、查看挂载点 和 文件系统

mount

cat /etc/fstab

vgs

pvs

lvs

df -h

lsof +D / 







本文出自 “银河系|计算机网络” 博客,谢绝转载!

以上是关于运维人员处理服务器故障的方法总结的主要内容,如果未能解决你的问题,请参考以下文章

502与504故障分析与解决方法

5分钟学会处理服务器故障的方法

无法及时发现设备故障还是你的痛处吗?

快狠准排查各类系统故障的运维套路

服务器运维常见的故障及其解决办法

这些 K8S 日常故障处理集锦,运维请收藏~