运维人员处理服务器故障的方法总结
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了运维人员处理服务器故障的方法总结相关的知识,希望对你有一定的参考价值。
运维人员处理服务器故障的方法总结
一、尽可能搞清楚问题的前因后果
二、查看有谁在线
who
last
三、查看之前执行了什么命令
history
四、查看现在在运行的进程是什么
pstree -a
ps aux
五、查看监听的网络服务
netstat -nxlp
netstat -ntlp
netstat -nulp
六、查看CPU 和内存
free -m
uptime
top
htop
七、查看硬件
lspci
dmidecode
ethtool
八、查看IO 性能
iostat -kx 2
vmstat 2 10
mpstat 2 10
dstat --top-io --top-bio #可以看到谁在进行 IO
九、查看挂载点 和 文件系统
mount
cat /etc/fstab
vgs
pvs
lvs
df -h
lsof +D /
本文出自 “银河系|计算机网络” 博客,谢绝转载!
以上是关于运维人员处理服务器故障的方法总结的主要内容,如果未能解决你的问题,请参考以下文章