存储数据恢复案例IBM存储服务器更换故障磁盘,数据同步引发其他磁盘问题导致业务中断-数据恢复
Posted 宋国建
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了存储数据恢复案例IBM存储服务器更换故障磁盘,数据同步引发其他磁盘问题导致业务中断-数据恢复相关的知识,希望对你有一定的参考价值。
环境:
IBM V7000存储
AIX+Sybase+V7000存储阵列柜
12块600G容量的SAS机械硬盘(其中一块为热备盘)
故障描述:
IBM V7000磁盘故障,在更换磁盘数据同步的时候,另一个磁盘也出现了问题,导致逻辑盘无法挂接在小型机上,业务暂时中断。
3号槽位和10号槽位两块硬盘显示故障脱机,10号槽位故障硬盘为热备盘
阵列柜中创建的2组Mdisk加到一个pool中,主要数据pool无法加载,其中共三个通用卷均无法挂载
数据恢复流程:
在数据恢复操作之前,为防止数据恢复过程中由于误操作对原始磁盘造成二次破坏, 使用winhex软件为其中的10块磁盘做镜像, 用PC3000给3号槽位的故障硬盘做镜像(可能有较多坏道), 以后所有的数据恢复操作都在镜像盘上进行, 不会对原始磁盘造成影响。
经过北亚数据恢复工程师讨论后,最终出具了2套数据恢复的方案:
数据恢复方案一、对存储进行强制上线操作
1、分析故障存储中,故障硬盘的离线顺序。
2、修复后离线的故障硬盘。
3、将修复的硬盘插回存储,进行强制上线操作。
数据恢复方案二、解析存储结构
1、Mdisk分析及重组
A、根据客户给出的部分配置信息,将硬盘按照Mdisk组分类。
B、分析每一组Mdisk中的所有硬盘,得到相关raid信息。
C、使用专业的数据恢复软件对Mdisk进行虚拟重组。
2、pool分析
A、对所有Mdisk进行分析,得到pool的相关信息。
B、解析pool在Mdisk上的分布情况。
3、LUN结构分析
A、分析pool中的条带大小。
B、解析LUN位图,分析各LUN在pool中的分布情况。
C、编写程序提取LUN。
验证数据:对生成出的数据进行随机抽样检测,确认数据没有问题。
数据移交:客户提供存储设备,在存储设备上创建与原先环境一样大小数量的LUN,将提取出的数据LUN的镜像文件,使用dd的方式,复制到存储上创建的LUN中,交给客户。数据移交后,客户重新配置存储环境,数据一切正常。
以上是关于存储数据恢复案例IBM存储服务器更换故障磁盘,数据同步引发其他磁盘问题导致业务中断-数据恢复的主要内容,如果未能解决你的问题,请参考以下文章
IBM DS5300存储数据恢复由于硬盘坏道导致RAID5崩溃的数据恢复案例