服务器数据恢复-raid5故障导致上层oracle数据库故障的数据恢复案例

随笔1个月前发布 海螺笔记
21 0 0

服务器数据恢复环境:
一台服务器中有一组由24块FC硬盘组建的raid5磁盘阵列,linux操作系统+ext3文件系统,服务器上层部署有oracle数据库。

服务器故障&检测:
raid5阵列中有两块硬盘出现故障掉线,导致服务器上层卷无法挂载,oracle数据库无法正常使用。
通过管理后台查看服务器中硬盘的状态,显示有两块硬盘处于离线状态。

服务器数据恢复过程:
1、将故障服务器中所有硬盘编号后取出,硬件工程师检测后发现2块离线硬盘存在物理故障,硬件工程师对存在物理故障的2块磁盘进行处理后进行扇区级的全盘镜像。针对没有物理故障的磁盘以只读方式进行扇区级的全盘镜像。镜像完成后将所有磁盘按照编号还原到故障服务器中,后续的数据分析和数据恢复操作都基于镜像文件进行,避免对原始磁盘数据造成二次破坏。
2、镜像过程中,在服务器管理后台以及硬盘SMART状态检测中均没有发现问题的另外3块盘也存在大量不规律的坏道分布。通过坏道列表定位到目标镜像文件,发现ext3文件系统的部分关键源数据信息被坏道破坏,只能通过同一条带进行xor以及根据文件系统上下文关系手动修复损坏的文件系统。
3、北亚企安数据恢复工程师对服务器的文件系统和日志进行逆向分析,获取到服务器raid5阵列的盘序信息、raid块大小、校验方式等重组raid的必要信息。利用上述信息虚拟重组raid后,进一步分析服务器文件系统信息&提取oracle数据库dmp文件。
4、在恢复数据库时出现imp-008报错。对oracle数据库进行排查后,发现从虚拟raid阵列中提取出的dmp文件存在异常,从而导致导入dmp文件时报错。
5、重新分析raid阵列结构和文件系统结构并提取数据,提取出dmp文件及dbf原始库文件,导入dmp文件进行检验,重复上面步骤直到检验正常。
6、将dmp文件移交给用户方验证,经过验证,用户方确认dmp文件没有问题。
7、将恢复出来的数据导入搭建好的环境中由用户方进行验证,经过验证,用户方确认恢复数据完整有效。本次服务器数据恢复工作完成。

© 版权声明

相关文章

暂无评论

您必须登录才能参与评论!
立即登录
暂无评论...