linux 分析和排查系统故障

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了linux 分析和排查系统故障相关的知识,希望对你有一定的参考价值。

日志分类:
?系统日志:存放系统产生的消息,由syslog统一管理
?用户日志:记录系统用户登录、退出、登录失败等相关信息
?程序日志:由各种应用程序独立管理的日志文件,格式不统一。(安装的每个程序都会产生自己的日志)
技术图片技术图片
用户日志:
?lastlog: 每个用户登录历史
?secure: 用户登录的安全方面
?wtmp: 退出消息
?btmp: 登录失败消息

日志格式:日期时间 主机名 服务名 详细描述
下方每行代表一条日志,开头是日期时间,主机名,服务名,最后是产生日志的详细信息
技术图片
日志管理工具: rsyslog (默认运行)
技术图片
技术图片
debug:调试,开启后会产生大量调试信息(不管做什么都会产生信息)
info:消息,一般信息
err:错误,运行某些内容出现错误

查看当前登入用户:users 、 who
查看最近登入历史:last
查看登入失败日志:lastb
查看安全日志记录:vim /var/log/secure

MBR(主引导程序):一块磁盘的第一个柱面的第一个扇区的第一个磁道是MBR的起点,直到第512字节。里面包含了系统引导程序、硬盘分区表。前446字节是引导程序 + 64字节的磁盘分区表 + 2字节的校验
root=’hd0,msdos1’ //指定/boot所在的分区,第一块磁盘的第一个分区
技术图片
提前备份MBR:因MBR里存在分区表,所以不能备份在本硬盘里,需备份到另一块磁盘中。
添加一块硬盘——格式化——分区——挂载——备份
dd if=/dev/sda of=/123/ban bs=512 count=1 //从/dev/sda中拿出一个512字节放在/123(挂载sdb的文件夹)中,名字叫做ban(随意一个名字) (一般的引导文件都存放在/dev/sda下

模拟故障: dd if=dev/zero of=/dev/sda bs=512 count=1 //从dev/zero中拿出512字节覆盖/dev/sda的前512字节。

修复故障:进入救援模式——选择第二项——按1回车进入救援模式终端——创建文件夹并且挂载sdb——恢复
Dd if=/atm/sda.mbr.bak of=/deev/sda bs=512 count=1 //将备份的文件覆盖到MBR的前512字节。

模拟故障之后重启,插入光盘显示如下界面,选择第三项(救援模式)。第一项和第二项都是安装系统
技术图片
同样选择第二项(救援模式)
技术图片
根据描述与需求选择不同数字 (这里的大意是将/目录放在/mut/sysimage)1 表示保存
技术图片
进入救援模式终端
技术图片
进入救援模式之后,新建一个目录,将/dev/sdb挂载在目录之下(由于文件是写在磁盘之下的,挂载之后磁盘里的文件会自动出现在目录中),然后将备份的文件覆盖到MBR的前512字节。
技术图片
GRUB2 //引导程序,存在MBR前446字节中。(引导内容是先找到内核,然后加载系统)
Grub2故障现象:无法找到系统。
配置文件地址:/boot/grub2/grub.cfg
Linux16 //引导内核
Initrdi16 //引导系统
技术图片
模拟故障:rm -rf /boot/grub2/grub.cfg //删除grub配置文件
修复过程:F2进入bios——光盘启动——进入救援模式
技术图片
进入救援终端之后——挂载一下根——重新安装grub——手动生成配置文件
chroot /mnt/sysimage //挂载根
grub2-install /dev/sda //重新安装grub2
grub2-mkconfig -o /boot/grub2/grub.cfg //生成配置文件
exit //退出
reboot //重启
重启之后:进入BIOS——恢复正常启动

恢复root密码
?进入救援模式:passwd root 新密码 //更改新密码
?启动项姐们,按e,在linux16………root 后加入 rw init=/sysroot/bin/sh
然后ctrl+X进入单用户模式
Chroot /sysroot //挂载根
Passwd root //更改密码
Exit
Reboot

在这个界面上按e修改启动项
技术图片
将ro改成rw init=/sysroot/bin/sh
技术图片
技术图片
直接更改密码(输入两次新密码,第二次是确认新密码)然后重启
技术图片
xfs repair /dev/sdb1 //修复文件系统
i节点耗尽故障(等同于文件数限制,若出现此故障,则需要删除一些文件)
df?–i?/backup??? //查看/backup的i节点数
创建32M分区
mkfs.xfs?–f?/dev/sdb1???//强制格式化
vim?atm?.sh
#!/bin/bash
!=1
While[$i?–le?17000]
do
touch?/backup/file$i
let?i++
done
chmod?+x?atm.sh?????????//赋予atm.sh执行权限
sh?atm.sh???????????????//执行

以上是关于linux 分析和排查系统故障的主要内容,如果未能解决你的问题,请参考以下文章

Linux的系统故障分析与排查

linux 分析和排查系统故障

linux运维系统故障排查思路及常见故障处理

linux运维系统故障排查思路及常见故障处理

分析和排查系统故障笔记

分析和排查系统故障笔记