一、服务器数据恢复故障描述
断电导致整个存储瘫痪,加电后存储无法使用。
经过诊断后认为是断电导致存储阵列损坏。
整个存储是由12块日立硬盘(3T SAS硬盘)组成的RAID-6磁盘阵列,被分成一个卷,分配给几台Vmware的ESXI主机做共享存储。整个卷中存放了大量的Windows虚拟机,虚拟机基本都是模板创建的,因此系统盘都统一为160G。
二、服务器数据恢复备份数据
将故障存储的所有磁盘和备份sss数据的目标磁盘连入到一台Windows Server 2008的服务器上。故障磁盘都设为脱机(只读)状态,使用WinHex 对HD13-HD24以底层方式读取扇区,发现了大量损坏扇区。初步判断可能是这种硬盘的读取机制与常见的硬盘不一样。尝试更换操作主机,更换HBA卡,更换扩展柜,更换为Linux操作系统,均呈现相同故障。
对硬盘损坏扇区的分布规律进行检测,发现:
1、损坏扇区分布以256个扇区为单位。
2、除损坏扇区片断的起始位置不固定外,后面的损坏扇区都是以2816个扇区为间隔。
三、服务器数据恢复故障分析
分析损坏扇区
仔细分析损坏扇区发现,损坏扇区呈规律性出现。
-每段损坏扇区区域大小总为256。-损坏扇区分布为固定区域,每跳过11个256扇区遇到一个坏的256扇区。-损坏扇区的位置一直存在于RAID的P校验或Q校验区域。-所有硬盘中只有10号盘中有一个自然坏道。
四、重组RAID
存储RAID-6阵列,接下来只需要分析出RAID 成员数量以及RAID的走向就可以重组RAID。
五、验证数据
虚拟机做验证,发现虚拟机大多都可以开机,可以进入登陆界面。数据恢复成功。