LSISAS2208卡RAID组成员盘在线变更槽位导致硬盘告警无法恢复案例

     LSISAS2208卡RAID组成员盘在线变更槽位导致硬盘告警无法恢复案例

硬件配置:

RH2288A V2配置LSISAS2208卡,使用5块硬盘(Slot0~4)做RAID5。

问题现象:

业务系统开机状态下将Slot3硬盘拔出,触发iBMC上报Disk3 In Failed Array告警。将拔出的Slot3槽位更换至Slot5,并清除该硬盘被标记的外部RAID配置信息,将Slot5设备为热备盘,RAID5重构后状态恢复正常,如图5-164所示。

图5-164 RAID5恢复
LSISAS2208卡RAID组成员盘在线变更槽位导致硬盘告警无法恢复案例

但iBMC依然上报Disk3 In Failed Array告警。

关键过程、根本原因分析

根本原因分析

RAID卡会记录RAID组每个成员盘的槽位信息,当RAID组一个成员盘掉盘,尽管其他槽位的热备盘/紧急备份盘可以参与重构,使得RAID组恢复正常,但是原成员盘槽位依旧会亮灯告警,iBMC告警DiskN in failed array(N表示硬盘物理槽位编号),该机制是用来提示用户该槽位曾经有一个RAID组成员盘,且没有被恢复,表明硬盘当前槽位配置与最初槽位配置存在差异。

结论、解决方案及效果

解决方案:

  1. 服务器关机,将所有硬盘拔出(脱离硬盘背板即可)。
  2. 服务器开机,POST阶段通过“Ctrl+H”快捷键进入RAID卡配置界面,通过“Configuration Wizard > Clear Configuration”清除RAID卡记录的原RAID配置信息。
  3. 服务器关机,将所有硬盘插回。
  4. 服务器开机,POST阶段通过“Ctrl+H”快捷键进入RAID卡配置界面,通过“Scan Drives > Preview > Import”导入硬盘RAID配置信息。

经验总结、预防措施和规范建议

如果热备盘在线被拔出,BMC也会产生In failed array记录,热备盘在线变更槽位也会产生上述现象。

阅读剩余
THE END