RH5485光通路诊断板BRD告警处理

RH5485光通路诊断板BRD告警处理

RH5485光通路诊断板BRD告警处理

问题现象描述

光通路诊断板如图5-82图5-82所示。红框中标注的即为BRD告警灯。BRD告警灯亮表明I/O板或者CPU板出现问题。

图5-81 光通路诊断面板
RH5485光通路诊断板BRD告警处理
RH5485光通路诊断板BRD告警处理

关键过程、根本原因分析

关键过程:

  1. 登录IMM,查看IMM Event Log,发现如有下告警日志:
    1499. E --  -- 7/24/2011:16:19:58 -- Fault in slot "No Op ROM Space" on system "SN# 99B5585"
  2. 检查PCIe Slot5槽位上是否安装有PCIe设备。如果有,则将其移至其他槽位上。
  3. 通过以上步骤,一般可以解决此类BRD告警问题。如果IMM仍报错,且主板集成的网卡不做PXE启动,则进到UEFI disabled网卡的ROM,具体操作如下:
    1. 选择“F1 setup > System Settings > Network > XE Configuration”。
    2. 选择板载网卡1的MAC地址。
    3. 更改“PXE Mode”,设置为“Disabled”。
    4. 选择“Save Changes”。
    5. 选择板载网卡2的MAC地址。
    6. 更改“PXE Mode”,设置为“Disabled”。
    7. 选择“Save Changes”。
  4. 若BRD告警灯仍然被点亮,则需要根据其他情况,判断是I/O板还是CPU板出现故障,并将故障件更换掉。

结论、解决方案及效果

定位结论:

  • 若服务器PCIe Slot5上安装有PCIe设备,且服务器配置了BR10i RAID卡,则可能导致BRD告警。
  • 若服务器7个PCIe槽位上都安装了PCIe设备,则可能导致BRD告警。
  • 若服务器PCIe Slot5上未安装PCIe设备,则BRD告警是由于CPU板或者I/O板故障导致。

解决方案:

  • 若是PCIe Slot5上的PCIe设备导致的BRD告警,只需要将该PCIe设备从Slot5上移除至其他PCIe槽位即可。
  • 若是7个PCIe槽位满配了PCIe设备,导致BRD告警,则建议将不用的PCIe设备移除。
  • 若是CPU板或者I/O板故障导致的BRD告警,则需要更换相应的故障板。

经验总结、预防措施和规范建议

经验总结:遇上光通路诊断板BRD告警,先检查PCIe设备是否满配,PCIe Slot5上是否有PCIe设备,RAID卡是否为BR10i卡,再检查IMM日志中是否有“No Op ROM Space”的告警。

预防措施:安装PCIe设备时,尽量避开PCIe Slot5槽位。

阅读剩余
THE END