raid阵列常见故障解决方案分享

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了raid阵列常见故障解决方案分享相关的知识,希望对你有一定的参考价值。

Raid磁盘阵列是一种将多块物理硬盘整合成一个虚拟存储的技术,raid模块相当于一个存储管理中间层,上层接收并执行操作系统及文件系统的数据读写指令,下层管理数据在各个物理硬盘上的存储及读写,相对于单独的物理硬盘,raid可以为用户提供更大的独立存储空间,更快的读写速度,更高的数据存储安全及更方便的统一管理模式。Raid磁盘阵列的正常运转是保障服务器中数据正常读写的关键所在。

服务器raid损坏的常见特征:

1.Raid磁盘阵列中有多快物理硬盘指示灯报警。
2.磁盘阵列中显示多块硬盘呈离线状态或丢失状态
3.Raid信息丢失、所有物理硬盘不再是online状态
4.无法进入raid管理界面或查看raid相关信息时死机。

磁盘阵列出现故障的可能原因分析:

1.磁盘阵列中的单块硬盘出现物理故障,可能导致服务器内数据出现一定损坏。
2.Raid数据传输通道不畅或者数据传输模块老化,可能导致服务器内数据出现不一致情况。
3.因服务器系统更新、重启或服务器意外断电导致raid信息丢失或raid模块损坏。这种情况下可能导致服务器数据受到一定破坏。
4.Raid模块升级或重装系统导致raid信息丢失或被重新创建,可能导致服务器数据受到严重破坏。
5.错误插拔磁盘阵列中的物理硬盘或者强制硬盘online/rebuild可能导致服务器数据遭到完全损坏。

数据恢复解决方案:

首先将磁盘阵列中所有运行状态良好的非热备盘完整备份到带有冗余功能的安全存储中,对于存在物理故障的硬盘必须首先按照相应故障类型的解决方案进行恢复,然后尽最大可能将故障物理硬盘中的数据同样备份至安全存储中。
然后对完整备份的所有硬盘镜像进行分析,确定故障raid的原结构参数,(raid级别、条带块大小、硬盘盘序、数据校验方式等),同时判断故障raid中各硬盘的离线情况。
根据分析所得的raid参数及硬盘离线情况在只读环境中构建raid数据,并对所构建的虚拟raid进行基本的逻辑校验,确定文件系统大体结构无误后将raid阵列生成完整镜像。
最后对备份生成的raid镜像进行完整的逻辑分析和校验,若文件系统仍存在不一致的情况则依据相应文件系统损坏情况的解决方案记性修复,直至迁移出所需数据。

Raid磁盘阵列故障后数据保护建议:

1.切忌使硬盘再次受到磕碰,服务器中任何一块硬盘对于数据恢复来说都非常重要,如果关键硬盘出现严重物理损坏,数据恢复工作将变的异常艰难甚至无法完成。
2.切忌重新创建raid或者强制online/rebuild,若服务器中有提早离线硬盘或上线同步选择错误,此时的数据恢复工作将异常艰难甚至无法完成。
3.切忌非专业人士对故障存储的主要模块进行拆卸、更换等操作,不当的操作会对服务器内部的数据造成严重影响,甚至永久性的破坏服务器数据。

以上是关于raid阵列常见故障解决方案分享的主要内容,如果未能解决你的问题,请参考以下文章

服务器raid常见故障分析 附数据恢复方案

raid5阵列两块硬盘出现硬件故障怎么恢复数据

遇到RAID5阵列硬盘出现问题的情况该如何解决?

Raid5两块硬盘离线解决方案 -阵列数据恢复案例

某服务器RAID5阵列数据恢复方案及过程

第7章 使用RAID与LVM磁盘阵列技术