如何解决AIX的文件系统故障

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了如何解决AIX的文件系统故障相关的知识,希望对你有一定的参考价值。

在进行文件系统维护和管理过程中,会碰到这样一些问题,例如无法安装文件系统或者无法拆卸文件系统,当文件系统的超级块被破坏,而无法正常使用文件系统,如何修复rootvg中的主要文件系统,下面就讨论如何解决一些常见的文件系统问题。
  一、恢复超级块错误
  有些用户在使用fsck或mount命令时,当见到下面的提示信息时,可能是文件系统的超级块出了问题: fsck: Not an AIX3 file system
  fsck: Not an AIXV3 file system
  fsck: Not an AIX4 file system
  fsck: Not an AIXV4 file system
  fsck: Not a recognized file system type
  mount: invalid argument
  例如,当用户安装一个/allenfs文件系统时,出现下面的错误提示: #mount /allenfs
  mount: 0506-324 Cannot mount /dev/lv1 on /allenfs: A system call received a parameter that is not valid.
  修复该文件系统时,出现下面错误提示,并异常终止: #fsck /dev/lv1
  Not a recognized filesystem type. (TERMINATED)
  要解决这个问题,只能用备份的超级块来恢复主超级块,我们都知道,在文件系统中,1号逻辑块是主超级块,31号逻辑块是备份超级块,因此就把31号逻辑块上的内容写到1号逻辑块上去。
  例如文件系统对应的逻辑卷为/dev/lv1,则恢复该文件系统的超级块命令如下:
  #dd count=1 bs=4k skip=31 seek=1 if=/dev/lv1 of=/dev/lv1
  当恢复完成,就要用fsck命令来检查文件系统的完整性:
  #fsck /dev/lv1
  ** Checking /dev/rlv1 (/allen)
  ** Phase 0 - Check Log
  log redo processing for /dev/rlv00
  ** Phase 1 - Check Blocks and Sizes
  ** Phase 2 - Check Pathnames
  ** Phase 3 - Check Connectivity
  ** Phase 4 - Check Reference Counts
  ** Phase 5 - Check Inode Map
  ** Phase 6 - Check Block Map
  9 files 608 blocks 15776 free
  在许多情况下,通过恢复备份超级块到主超级块可以解决这个问题,使文件系统处于正常工作状况下。如果这样做还不能解决问题,那只能删除文件系统,然后重新建立文件系统,再恢复备份的数据。
二、无法拆卸文件系统
  如果有用户或程序在一个文件系统中活动,就无法拆卸这个文件系统,当使用拆卸命令时,会提示下面的错误:
  Device busy 或者 A device is already mounted or cannot be unmounted 例如由于安装程序的异常终止或其它原因经常会遇到不能正常释放光驱(光驱是CDROM文件系统)的问题,当用户再次访问光盘驱动器时就产生错误0514- 062: 指定的设备忙。
  按照下面的步骤去解决:
  1、检查用户自己的当前工作目录是否在这个文件系统中,如果是,则用cd /命令使当前工作目录回到根目录,然后再试着拆卸文件系统;
  2、如果还是不能拆卸文件系统,可能在文件系统有文件正在被打开使用,因此在拆卸文件系统之前应该关闭这些文件。有时候可能还有一些进程在使用这个文件系统的资源,可以使用fuser命令来检查有那些进程仍然在这个文件系统中活动。Fuser命令将显示在这个文件系统中正在活动的所有进程ID号。下面就 fuser命令使用的例子:
  #fuser /dev/cd
  /dev/cd: 2910 3466
  如果使用fuser –u /dev/cd将在进程号后指出用户名。如果root用户用fuser –k /dev/cd命令,则给这些进程发出SIGKILL信号,来杀死这些进程。然后用kill命令将这些正在活动的进程杀死,然后再试着拆卸文件系统。例如: #kill –9 2910 3466
  这时您可以用下面命令检查设备的状态是否为可用: #lsdev -Cc cdrom
  或者 #lsdev –C –l cd0
  (若为其它文件系统,将cd0换为文件系统的逻辑名)如果设备状态为可用,您就可以使用该设备或卸载文件系统。
  3、如果文件系统仍然处于忙状态,不能被拆卸,可能是在这个文件系统中加载了一个内核扩展,这种情况用fuser命令无法检查到内核扩展,系统提供了一个检查内核扩展的工具——genkex,用这个命令可以显示目前已加载的所有扩展内核。
  4、如果在一个文件系统还安装了另一个文件系统,则要直接拆卸这个文件系统也是不能成功,必须先将该文件系统中所有安装的文件系统拆卸掉,才能拆卸自己。使用 mount命令查看有那些文件系统还在安装在系统上,然后根据安装点将安装在这个文件系统中的所有其它文件系统用umount命令拆卸掉,再试着拆卸自己。
  三、 无法删除文件系统
  当一个文件系统可以用mount命令安装或用unmount拆卸,但是无法删除该文件系统,在删除时,系统会报如下错误
  : 0516-306:get lvodm: unable to find in the device confgiguration data. 发生此错误的原因可能是ODM数据库中的定义与实际不一致。可以用下面命令检查该文件系统的类型:
  #lsvg -l rootvg
  若类型显示为???,则用synclvodm -P rootvg 和 syncvg -v rootvg 命令对卷组进行同步,之后,再用命令 lsvg -l rootvg 显示出正确的文件类型。此时可以成功删除该文件系统。
四、 修复rootvg中的主要文件系统和日志
  如果要检查和修复rootvg中的/、/tmp、/usr、/var文件系统,必须先将它们卸载,然而在正常的多用户环境下是无法卸载这些文件系统,要完成这些工作必须在维护模式下进行。
  首先重启动系统,在系统引导时按F6键(对于图形方式)或数字“6”键(对于字符方式)进入到系统的在线诊断(Online Diagnostics)服务模式,选择“5”进入单用户模式,即维护模式。
  如果当前的AIX是AIX 3.2.4或3.2.5版本,还必须设置ODMDIR环境变量,命令如下:
  #ODMDIR=/etc/objrepos;export ODMDIR
  运行fsck命令清理检查上面提到的文件系统,命令如下:
  #fsck /dev/hd4
  #fsck /dev/hd2
  #fsck /dev/hd3
  #fsck /dev/hd9var
  当然也可使用其fsck选项。如果rootvg中缺省文件系统的日志(JFSLOG)即/dev/hd8有问题,这时也可以重建它,命令如下:
  #logform /dev/hd8
  然后会提示您是否继续初始化,如果回答y,以前在/dev/hd8上的日志信息就被清掉。初始化成功后,输入exit命令就退出单用户模式,根据提示按回车进入多用户模式,这些文件系统会自动被安装上。最后用shutdown命令关闭系统。
参考技术A 在进行文件系统维护和管理过程中,会碰到这样一些问题,例如无法安装文件系统或者无法拆卸文件系统,当文件系统的超级块被破坏,而无法正常使用文件系统,如何修复rootvg中的主要文件系统,下面就讨论如何解决一些常见的文件系统问题。
一、恢复超级块错误
有些用户在使用fsck或mount命令时,当见到下面的提示信息时,可能是文件系统的超级块出了问题: fsck: Not an AIX3 file system
fsck: Not an AIXV3 file system
fsck: Not an AIX4 file system
fsck: Not an AIXV4 file system
fsck: Not a recognized file system type
mount: invalid argument
例如,当用户安装一个/allenfs文件系统时,出现下面的错误提示: #mount /allenfs
mount: 0506-324 Cannot mount /dev/lv1 on /allenfs: A system call received a parameter that is not valid.
修复该文件系统时,出现下面错误提示,并异常终止: #fsck /dev/lv1
Not a recognized filesystem type. (TERMINATED)
要解决这个问题,只能用备份的超级块来恢复主超级块,我们都知道,在文件系统中,1号逻辑块是主超级块,31号逻辑块是备份超级块,因此就把31号逻辑块上的内容写到1号逻辑块上去。
例如文件系统对应的逻辑卷为/dev/lv1,则恢复该文件系统的超级块命令如下:
#dd count=1 bs=4k skip=31 seek=1 if=/dev/lv1 of=/dev/lv1
当恢复完成,就要用fsck命令来检查文件系统的完整性:
#fsck /dev/lv1
** Checking /dev/rlv1 (/allen)
** Phase 0 - Check Log
log redo processing for /dev/rlv00
** Phase 1 - Check Blocks and Sizes
** Phase 2 - Check Pathnames
** Phase 3 - Check Connectivity
** Phase 4 - Check Reference Counts
** Phase 5 - Check Inode Map
** Phase 6 - Check Block Map
9 files 608 blocks 15776 free
在许多情况下,通过恢复备份超级块到主超级块可以解决这个问题,使文件系统处于正常工作状况下。如果这样做还不能解决问题,那只能删除文件系统,然后重新建立文件系统,再恢复备份的数据。
二、无法拆卸文件系统
如果有用户或程序在一个文件系统中活动,就无法拆卸这个文件系统,当使用拆卸命令时,会提示下面的错误:
Device busy 或者 A device is already mounted or cannot be unmounted 例如由于安装程序的异常终止或其它原因经常会遇到不能正常释放光驱(光驱是CDROM文件系统)的问题,当用户再次访问光盘驱动器时就产生错误0514- 062: 指定的设备忙。
按照下面的步骤去解决:
1、检查用户自己的当前工作目录是否在这个文件系统中,如果是,则用cd /命令使当前工作目录回到根目录,然后再试着拆卸文件系统;
2、如果还是不能拆卸文件系统,可能在文件系统有文件正在被打开使用,因此在拆卸文件系统之前应该关闭这些文件。有时候可能还有一些进程在使用这个文件系统的资源,可以使用fuser命令来检查有那些进程仍然在这个文件系统中活动。Fuser命令将显示在这个文件系统中正在活动的所有进程ID号。下面就 fuser命令使用的例子:
#fuser /dev/cd
/dev/cd: 2910 3466
如果使用fuser –u /dev/cd将在进程号后指出用户名。如果root用户用fuser –k /dev/cd命令,则给这些进程发出SIGKILL信号,来杀死这些进程。然后用kill命令将这些正在活动的进程杀死,然后再试着拆卸文件系统。例如: #kill –9 2910 3466
这时您可以用下面命令检查设备的状态是否为可用: #lsdev -Cc cdrom
或者 #lsdev –C –l cd0
(若为其它文件系统,将cd0换为文件系统的逻辑名)如果设备状态为可用,您就可以使用该设备或卸载文件系统。
3、如果文件系统仍然处于忙状态,不能被拆卸,可能是在这个文件系统中加载了一个内核扩展,这种情况用fuser命令无法检查到内核扩展,系统提供了一个检查内核扩展的工具——genkex,用这个命令可以显示目前已加载的所有扩展内核。
4、如果在一个文件系统还安装了另一个文件系统,则要直接拆卸这个文件系统也是不能成功,必须先将该文件系统中所有安装的文件系统拆卸掉,才能拆卸自己。使用 mount命令查看有那些文件系统还在安装在系统上,然后根据安装点将安装在这个文件系统中的所有其它文件系统用umount命令拆卸掉,再试着拆卸自己。
三、 无法删除文件系统
当一个文件系统可以用mount命令安装或用unmount拆卸,但是无法删除该文件系统,在删除时,系统会报如下错误
: 0516-306:get lvodm: unable to find in the device confgiguration data. 发生此错误的原因可能是ODM数据库中的定义与实际不一致。可以用下面命令检查该文件系统的类型:
#lsvg -l rootvg
若类型显示为???,则用synclvodm -P rootvg 和 syncvg -v rootvg 命令对卷组进行同步,之后,再用命令 lsvg -l rootvg 显示出正确的文件类型。此时可以成功删除该文件系统。
四、 修复rootvg中的主要文件系统和日志
如果要检查和修复rootvg中的/、/tmp、/usr、/var文件系统,必须先将它们卸载,然而在正常的多用户环境下是无法卸载这些文件系统,要完成这些工作必须在维护模式下进行。
首先重启动系统,在系统引导时按F6键(对于图形方式)或数字“6”键(对于字符方式)进入到系统的在线诊断(Online Diagnostics)服务模式,选择“5”进入单用户模式,即维护模式。
如果当前的AIX是AIX 3.2.4或3.2.5版本,还必须设置ODMDIR环境变量,命令如下:
#ODMDIR=/etc/objrepos;export ODMDIR
运行fsck命令清理检查上面提到的文件系统,命令如下:
#fsck /dev/hd4
#fsck /dev/hd2
#fsck /dev/hd3
#fsck /dev/hd9var
当然也可使用其fsck选项。如果rootvg中缺省文件系统的日志(JFSLOG)即/dev/hd8有问题,这时也可以重建它,命令如下:
#logform /dev/hd8
然后会提示您是否继续初始化,如果回答y,以前在/dev/hd8上的日志信息就被清掉。初始化成功后,输入exit命令就退出单用户模式,根据提示按回车进入多用户模式,这些文件系统会自动被安装上。最后用shutdown命令关闭系统。

如何在 AIX 上擦除文件系统

【中文标题】如何在 AIX 上擦除文件系统【英文标题】:how to wipe a filesystem on AIX 【发布时间】:2021-10-15 02:11:48 【问题描述】:

我的公司正在销售一些旧的 AIX 系统,他们希望我清除其中的所有数据。不确定最好的方法。我猜它会是这样的:

    卸载文件系统 在 fstab 中查找“hdisk#”设备 - 并将其注释掉。 使用 dd 将 /dev/null 复制到设备

我不确定整个逻辑卷管理器是否比这更复杂。即,出于此目的将 /dev/hdisk# 设备视为物理磁盘是否正确?

【问题讨论】:

【参考方案1】:

您可以从Standalone Diagnostics CD 启动并擦除驱动器。您可以选择格式化和验证、格式化而不验证和擦除。如果需要,您可以多次运行每个选项。

【讨论】:

【参考方案2】:

卸载文件系统后,您应该发送exportvg <your_vg>,否则在重新启动系统时会收到投诉(尽管考虑到您正在出售它们,这可能不再是您关心的问题了)。

从系统中删除 VG 后,您可以按照您的描述使用 dd 擦除磁盘。

(一个常见的误解是你必须擦拭不止一次。只要正确地擦拭,一次就足够了。)

【讨论】:

以上是关于如何解决AIX的文件系统故障的主要内容,如果未能解决你的问题,请参考以下文章

aix 系统报错,怎么解决

AIX报错0506-342 无法挂载分区问题解决

aix 如何做raid0

故障案例: 进入到心创建的用户中,系统会提示-bash-4.1$,请问如何解决?

AIX系统日志

老男孩教育每日一题-第82天-发现文件系统只读了,是什么原因?如何解决?