-4006-505-646

Raid5阵列热备盘上线过程中其他硬盘离线导致同步失败

一、raid5数据恢复故障概述

1、阵列硬件环境

客户需要进行数据恢复的设备为raid5磁盘阵列,阵列一共有两组,都是raid5阵列,两组阵列都包含了4块硬盘,两组阵列都划分为lun,组成了lvm结构,文件系统都是采用的ext3文件系统。


2、raid5阵列故障发生过程

磁盘阵列中有一块硬盘由于物理故障意外离线,此时raid阵列中的热备盘顶替故障盘上线并开始同步数据,在数据尚未同步完成的同时,同一阵列中的另一块正常硬盘又因为未知原因掉线,此时热备盘同步失败,这组raid5阵列因此出现故障无法使用,lvm结构被损坏,文件系统也不可正常使用了。


北亚数据恢复中心工程师对客户的两块故障硬盘就进行了检测,经检测确认第一块离线的硬盘存在物理故障,如果不进行开盘物理修复将不可读取,后掉线的硬盘则可以识别。


二、制定数据恢复方案

北亚服务器数据恢复工程师根据客户硬盘的故障情况制定了针对此次raid5阵列的数据恢复方案:

1、由硬件数据恢复工程师对存在物理故障的硬盘进行物理修复,然后借助专业的数据修复工具“MRT”将物理修复后的故障硬盘进行备份,提取硬盘内的原始数据。

2、对于同一组raid阵列中的可以识别的硬盘则使用winhex进行扇区级镜像备份。

3、将镜像出来的所有硬盘数据进行分析和重组raid5阵列。

4、对重组出的磁盘阵列进行简单分析,找到丢失的lvm信息,重组lvm卷。

5、再对raid5阵列上的lvm卷进行分析,解析出ext3文件系统数据,恢复并导出即可。

未标题-1.jpg

三、实施数据恢复方案

1、故障盘修复

    硬件数据恢复工程师在开盘环境下对故障盘进行了开盘数据恢复操作,但是遗憾的是,这块硬盘被打开后发现盘片已经出现了严重的磨损,有大量肉眼可见的划痕,已经无法通过数据恢复手段进行修复,看来后期的raid5数据恢复只能进行缺盘处理了。


2、raid5硬盘镜像备份

    由于故障硬盘已经不可恢复,只能继续使用winhex对可以识别的raid5阵列中的其他可识别硬盘进行专业的镜像备份,同时对客户服务器上的另一组正常raid5阵列也进行了镜像备份。


3、重组raid5阵列
数据恢复工程师对备份出的底层数据进行了常规分析,结合已知的EXT3文件系统结构分析出了raid5阵列的盘序、条带、校验方向等重组阵列的必要信息,然后借助数据恢复工具将客户的raid5阵列进行了重组,对于无法修复的故障硬盘进行缺盘处理。


4、重组LVM结构
    数据恢复工程师对raid5进行了重组后继续分析raid阵列的底层数据,找到与数据恢复有关的lvm结构信息,分析lvm结构并提取出raid阵列中的lvm物理卷lun。然后使用专业的数据恢复软件UFS Explorer重组pv,生成lvm逻辑卷。


5、恢复raid5数据

    按照数据恢复方案中的计划,重组lvm以后,服务器数据恢复工程师继续分析逻辑卷内的EXT3文件系统,分析并导出所有数据。


五、raid5数据恢复结论

    在本次数据恢复案例中,由于有一块硬盘存在严重的物理故障,这块硬盘不具有任何数据恢复可能,因此在数据恢复过程中可能会出现raid结构缺陷或者部分文件损坏的情况,好在本次数据恢复中大部分文件都成功恢复并通过了验证,大约只有3%的数据被损坏,经过客户验证,认可本次数据恢复结果。

北京北亚数据恢复中心:4006505646

4006-505-646