Linux运维故障排查思路
Posted 心之所动,就随风去吧
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Linux运维故障排查思路相关的知识,希望对你有一定的参考价值。
linux系统故障
网络问题
linux系统无响应
linux系统无法启动
linux系统故障处理思路
1.重视报错信息,一般情况下此提示基本定位了问题的所在
2.查阅日志文件,系统日志和应用日志
3.分析、定位问题
4.动手解决
网络问题处理思路
1.网络硬件问题。网线、网卡、路由器、交换机等是否正常工作。
2.网卡驱动是否正常加载、网卡ip设置是否正确,系统路由是否正确。
3.检查局域网之间的通信是否正常。
4.检查dns是否设定正确。可从/etc/resolv.conf、/etc/host文件来确认。
5.服务是否打开。
6.访问权限是否打开。iptables、selinux
linux系统无响应
1.系统硬件问题
2.外围硬件问题,网络设备,网络参数方面查找解决。
3.软件问题,系统bug,软件bug,升级内核,修复程序bug,更新驱动等方面解决。
4.系统设置问题,参数设置不当。
Linux系统无法启动
常见系统故障,比如突然断电,配置更新,软件升级,内核升级等都有可能造成无法正常启动。常见的情况如:
1.文件系统破坏,一般是linux的根分区文件系统遭到破坏,一般由系统突然断点或者非法关机引起。
2.文件系统配置不当,比如/etc/fstab文件、/etc/inittab文件等配置文件错误或者丢失,一般是执行配置更新时人为导致的。
3.linux内核文件丢失或者崩溃。一般由内核升级错误或者内核存在bug引起。
4.系统引导程序问题。比如grub丢失或者损坏,一般由人为修改错误或者文件系统故障。
5.系统硬件故障。主板、电源、硬盘等出现问题。
以上是关于Linux运维故障排查思路的主要内容,如果未能解决你的问题,请参考以下文章