锐捷RSR77-X 高校场景 dhcp进程CPU利用率高

一、故障现象描述

RSR7708-X 设备CPU利用率达到99%、每次持续1分钟左右、业务未出现异常

二、故障排查分析

  1. 确认故障信息:设备上查看历史日志记录,每次CPU告警<dhcpd_task>进程占用CPU利用率占用最高、每次出现CPU高时间间隔均为1小时50分钟;
  1. 查看CPU高的时候CPU利用率情况、dhcp6_main进程占用40%左右;

三、故障根因说明

该问题原因是存在dhcp模块监听流转发模块时的处理不当(代码级监听,和是否配置dhcp无关),当设备上出现中断信号非常多的情况时,会导致dhcp抢不到CPU而发生消息事件积压;中断信号处理完成后、dhcp处理堆积的消息事件时会占用较多的cpu,堆积信息事件处理完成后恢复正常的cpu使用;整体体现为系统cpu使用率突然飙升,之后再慢慢恢复正常,整个过程持续时间约为1分钟。可以简单理解为dhcp模块出现空转现象,这种空转现象不影响设备的正常业务使用。

四、故障解决方案

升级软件版本至RSR77-X_10.4(3b98)p3_R235360及以上版本解决。
阅读剩余
THE END