RAID 1主盘有坏块导致重构失败

                                RAID 1主盘有坏块导致重构失败

问题现象描述

硬件配置:

RH2285服务器+LSISAS1078卡+300G SAS*2。

问题现象:

两块盘做RAID1,有块硬盘故障,申请新盘替换,重构失败,新更换硬盘亮黄灯。

关键过程、根本原因分析

关键过程:

使用megacli工具收集RAID卡日志信息,发现重构的时候报错:

2218: 14-07-02,02:08:12 Info:State change on PD 03(e0xfc/s3) from HOT SPARE(2) to REBUILD(14)
2219: 14-07-02,02:09:36 Info:Unexpected sense: PD 00(e0xfc/s0) Path 5000cca043200d71, CDB: 28 00 01 c9 3f 00 00 00 80 00, Sense: F0 00 03 01 C9 3F 0C 18 00 00 00 00 11 14 00 80 00 8A 00 00 F7 CC 00 00 00 19 AA 01 08 B6 00 00
2220: 14-07-02,02:09:36 FATAL:Unrecoverable medium error during rebuild on PD 00(e0xfc/s0) at 1c93f0c
2221: 14-07-02,02:09:36 FATAL:Puncturing bad block on PD 03(e0xfc/s3) at 1c93f0c
2257: 14-07-02,02:10:41 WARNING:Error on PD 03(e0xfc/s3) (Error 02)
2258: 14-07-02,02:10:41 Info:State change on PD 03(e0xfc/s3) from REBUILD(14) to FAILED(11)
2259: 14-07-02,02:10:41 CRITICAL:Rebuild failed on PD 03(e0xfc/s3) due to target drive error

根本原因分析:

分析日志,发现在重构失败的时候,系统报主盘有坏块,导致重构失败。

结论、解决方案及效果

解决方案:

这种情况可以有两种处理方式:

  • 把数据备份,然后重新申请两块硬盘做RAID1,之后把数据拷贝回去,缺点是需要重新安装操作系统以及应用软件。
  • 使用dd或者DiskGenius等工具,直接把整个盘数据拷贝到新的RAID组里面,优点是不需要再重新安装操作系统以及软件。

经验总结、预防措施和规范建议

和1078卡或者2208卡相关问题,一定要使用megacli工具收集RAID卡信息以及日志信息。

阅读剩余
THE END