-4006-505-646

RAID5故障数据恢复案例


北亚小编在这里分享一篇关于服务器硬盘故障的恢复案例,故障机器为一台IBM服务器,一个机头,连接4扩展柜,底层是50600GB的硬盘组的RAID。两组RAID5,其中一组RAID崩溃,这组RAID27600G硬盘组成,存放是Oracle 数据库文件,在存储系统上层一共分了11个卷,卷大小为1TB10个,一个为4TB,后来因磁盘故障导致服务器不可用。

 

数据恢复初检

工程师首先对客户的27块硬盘做了硬件检测,发现客户的2块硬盘出现坏道SMART错误冗余级别已经超过阀值,对25正常的硬盘进行全盘镜像,对2有坏道的硬盘用数据恢复工具进行了恢复生成镜像文件。镜像之前已经讲过在这里就不过多介绍了。

 图片1.png

故障情况分析

首先收集IBM DS5300存储日志信息,从存储硬盘的指示灯看到有两块盘亮黄灯,对收集到的日志信息进行分析,分析两块硬盘的掉线时间从而知道那块硬盘里面的数据是最新,用数据最新的硬盘进行数据恢复。

 

数据恢复方案

方案一:可以通过IBM DS存储管理软件进行强制上线,强制上线之前把存储所有硬盘都进行备份,之后进行强制上线。

方案二:可以通过硬盘底层数据分析,进行RAID重组,底层提取数据,重新加载Oracle数据库调试上层应用。

 

数据恢复过程

已经把存储的所有硬盘都进行过备份,出现问题也可以进行还原,所以先采用第一种解决方案,在模拟器上进行测试,之后再存储上进行上线操作

通过IBM DS存储管理软件进行强制上线,强制上线之后RAID处于降级状态,这个时候设置好热备盘,让热备盘顶上,进行数据同步,同步完之后上层的卷直接可以用了,所有数据也都可见了,上层应用能正常使用

第一种解决方案,节省了很多时间,上层应用不需要在调试可以直接启动

 

数据恢复结果及时间

由于上层的卷直接可以用了,所以数据也都可见了,但是考虑到安全问题,我们还是将卷里的文件都拷贝出来,然后移交给客户。终于在用户要求的时间内将数据恢复完成。整个恢复过程一共历时5天,数据恢复成功。


微信图片_20200720133039.jpg

北京北亚数据恢复中心:4006-505-646

官方网址:www.frombyte.com

4006-505-646