RH2288H V2搭配K1显卡iMana告警POST Error Unrecoverable video controller failure

RH2288H V2搭配K1显卡iMana告警POST Error Unrecoverable video controller failure

RH2288H V2搭配K1显卡iMana告警POST Error Unrecoverable video controller failure

问题现象描述

RH2288H V2服务器安装K1显卡,设备开机是红灯告警,iMana上报“POST Error,Unrecoverable video controller failure”。

关键过程、根本原因分析

BIOS中未开启pci 64-bit decode参数。

结论、解决方案及效果

服务器POST阶段按Delete键进入BIOS,依次进入Advanced->Misc Configuration->pci 64-bit decode,将pci 64-bit decode设置为Enabled,按F10保存退出。

排查思路:

  1. 查看服务器兼容性列表,确认高功耗GPU卡对应的Riser卡BOM编码,以确认显卡电源线缆是否配套。http://support.huawei.com/onlinetoolsweb/ftca/
  2. 确认GPU显卡线缆连接方式是否正确,如表5-75图5-101所示。
    表5-75 线缆连接方式RH2288H V2搭配K1显卡iMana告警POST Error Unrecoverable video controller failure

    RH2288H V2搭配K1显卡iMana告警POST Error Unrecoverable video controller failure

    1. BIOS版本确认是否最新版本。
    2. BIOS开启pci 64-bit decoded参数。
    3. 排查riser卡、GPU显卡(包含GPU显卡线缆)、主板是否硬件故障。

    经验总结、预防措施和规范建议

    备注

    如果服务器(机架/刀片/高密度等)未配置GPU显卡,但iMana告警依然有POST Error,Unrecoverable video controller failure,则按照如下思路处理。

    1. 恢复BIOS默认值(iMana命令执行ipmcset -d clearcmos,然后重启服务器)。
    2. 如果有其他PCI-E设备,需要确认PCI-E设备安装的位置是否与CPU匹配(不同CPU管理不同PCI-E槽)。可以尝试插拔PCI-E设备。
    3. 更新BMC/BIOS到最新版本。
    4. 更换主板
阅读剩余
THE END