Linux运维故障排查思路

Posted 心之所动,就随风去吧

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Linux运维故障排查思路相关的知识,希望对你有一定的参考价值。

linux系统故障

网络问题

linux系统无响应

linux系统无法启动

 

linux系统故障处理思路

1.重视报错信息,一般情况下此提示基本定位了问题的所在

2.查阅日志文件,系统日志和应用日志

3.分析、定位问题

4.动手解决


网络问题处理思路

1.网络硬件问题。网线、网卡、路由器、交换机等是否正常工作。

2.网卡驱动是否正常加载、网卡ip设置是否正确,系统路由是否正确。

3.检查局域网之间的通信是否正常。

4.检查dns是否设定正确。可从/etc/resolv.conf、/etc/host文件来确认。

5.服务是否打开。

6.访问权限是否打开。iptables、selinux

 

linux系统无响应

1.系统硬件问题

2.外围硬件问题,网络设备,网络参数方面查找解决。

3.软件问题,系统bug,软件bug,升级内核,修复程序bug,更新驱动等方面解决。

4.系统设置问题,参数设置不当。


Linux系统无法启动

常见系统故障,比如突然断电,配置更新,软件升级,内核升级等都有可能造成无法正常启动。常见的情况如:

1.文件系统破坏,一般是linux的根分区文件系统遭到破坏,一般由系统突然断点或者非法关机引起。

2.文件系统配置不当,比如/etc/fstab文件、/etc/inittab文件等配置文件错误或者丢失,一般是执行配置更新时人为导致的。

3.linux内核文件丢失或者崩溃。一般由内核升级错误或者内核存在bug引起。

4.系统引导程序问题。比如grub丢失或者损坏,一般由人为修改错误或者文件系统故障。

5.系统硬件故障。主板、电源、硬盘等出现问题。



以上是关于Linux运维故障排查思路的主要内容,如果未能解决你的问题,请参考以下文章

linux运维系统故障排查思路及常见故障处理

linux运维系统故障排查思路及常见故障处理

51CTO学习笔记--Linux运维故障排查思路与系统调优技巧视频课程(高俊峰)

IT运维问题排查思路方案(图文)

论运维之故障排查思路与方法

Linux运维常见故障排查和处理的33个技巧汇总