机房供电异常导致服务器电源频繁产生AC Lost告警

                机房供电异常导致服务器电源频繁产生AC Lost告警

问题现象描述

问题现象:

某局点多台RH2288 V2(配置750W金牌电源)反复出现电源AC lost告警产生与恢复事件,如图5-94所示,业务运行正常。

图5-94 电源AC lost告警产生与恢复
机房供电异常导致服务器电源频繁产生AC Lost告警

关键过程、根本原因分析

关键过程:

管理软件iMana读取到电源寄存器0X04信息为input loss,如图5-95所示,对外上报AC LOST,以提示用户排查设备供电环境是否正常。

机房供电异常导致服务器电源频繁产生AC Lost告警

通过示波器接入客户现场供电环境进行检测,组网示意图如图5-96所示。

机房供电异常导致服务器电源频繁产生AC Lost告警

通过分析捕获到的电源波形,如图5-97所示,发现两个问题:

  • L-N输入电压的波形畸变比较严重,超过了电源能承受的10%的规格范围。
  • N-PE线之间的电压峰峰值达到20.6V,说明零线与地线电压差畸变极大(即机房接地条件差),导致电源0x04寄存器状态频繁检测到input loss,触发iMana AC lost告警,
  • 机房供电异常导致服务器电源频繁产生AC Lost告警
  • 结论、解决方案及效果

    定位结论:

    机房电源输入端零线和地线电压差畸变过大导致电源AC Lost告警。

    解决方案:

    优化机房接地,确保零线和地线电压差稳定在2V以内。

    经验总结、预防措施和规范建议

    排除iMana误告警的情况下,需要排查供电环境,包括但不限于电源线缆、PDU插座、UPS等供电部件。

阅读剩余
THE END