锐捷CPU-nsmd/ripd/ospfd/bgpd/isisd 进程高
一、故障现象
路由器CPU nsmd/ripd/ospfd/bgpd/isisd进程利用率高
二、组网拓扑
无
三、可能原因
1、以上这些进程都和路由协议强相关,在路由协议发生震荡时,特别是网络比较庞大的情况下,需要消耗大量的CPU计算和收敛。
四、排查步骤
步骤一:通过命令show cpu查看进程cpu利用率。
Ruijie#sho cpu
=======================================
CPU Using Rate Information
CPU utilization in five seconds: 0%
CPU utilization in one minute : 0%
CPU utilization in five minutes: 0%
NO 5Sec 1Min 5Min Process
0 0% 0% 0% LISR INT
1 0% 0% 0% HISR INT
......
60 0.00% 0.00% 0.00% nsmd
61 0.00% 0.00% 0.00% ripd
62 0.00% 0.00% 0.00% ospfd
63 0.00% 0.00% 0.00% ripngd
64 0.00% 0.00% 0.00% ospf6d
65 0.00% 0.00% 0.00% bgpd
66 0.00% 0.00% 0.00% isisd
进程解释:
nsmd:网络服务模块,管理接口表与路由表,为协议模块与底层模块之间提供各种信息的交互。如接口UP/DOWN、路由添加删除等等,因此,nsmd线程处理的东西很多,比如接口创建/删除、VRF绑定/解绑定、接口UP/DOWN、路由震荡等等,都有可能导致nsmd线程占用大量的CPU,这个时候只能结合其他系统信息才能具体分析了。
ospfd/ospf6d:OSPF协议守护线程/ OSPFv6协议守护进程
ripd/ripngd:RIP协议守护线程/ RIPng协议守护进程
bgpd:BGP协议守护进程
isisd: ISIS协议守护进程
步骤二:查看是否有动态路由协议频繁重新协商的情况。
查看是否存在日志不断打印信息:
*Aug 9 10:26:10: %LINEPROTO-5-UPDOWN: Line protocol on Interface GigabitEthernet 0/24, changed state to up.
*Aug 9 10:26:20: %OSPF-5-ADJCHG: Process 10, Nbr 10.10.10.1-GigabitEthernet 0/24 from Down to Init, HelloReceived.
*Aug 9 10:26:50: %OSPF-5-ADJCHG: Process 10, Nbr 10.10.10.1-GigabitEthernet 0/24 from Exchange to Full, ExchangeDone.
*Aug 9 10:27:44: %OSPF-5-ADJCHG: Process 10, Nbr 10.10.10.1-GigabitEthernet 0/24 from Full to Init, 1-WayReceived.
*Aug 9 10:27:55: %OSPF-5-ADJCHG: Process 10, Nbr 10.10.10.1-GigabitEthernet 0/24 from Exchange to Full, ExchangeDone.
步骤三:排查路由容量是否达到设备极限。
1)可以先通过show memory查看内存情况
路由容量极限和内存强相关,如果内存使用率在85%以上,就很可能是内存不足,路由无法收敛完成进而不断重启路由进程;内存占用高可参考内存利用率高章节进行排查。
2)关闭部分接口
此时需要大约计算下设备的路由条目数,如果数量确实庞大,可以通过关闭部分接口观察CPU是否下降。比如,在政务网MPLS-VPN环境中有多个VRF,可以尝试shutdown几个VRF接口,看路由收敛情况。
3)路由汇总
如果存在路由容量达到设备极限,可通过路由汇总进行优化
步骤四:排查链路是否频繁UP/DOWN
链路的UP/DOWN必然导致动态路由收敛,可以通过show log确认是否有哪些接口链路本身频繁UP/DOWN,找出原因。
由于接口链路问题导致邻居协议频繁UP/Down的,可以临时将物理接口关闭(shutdown)或关闭动态路由协议观察问题是否解决,或继续深入排查接口链路问题
五、信息收集
show run
show memory
show version
show cpu
show log
show memory
show arp
show ef-rnfp all //间隔10S,收集3次
Show ip fpm statistics
sh ip fpm users
show ip rou summary
show ip ref route statistic
sho ip ref adjacency
show ip fpm st
show ip fpm count
show core | b Buff
debug support
show except
pcie show
show skb
show task
show efb
六、总结与建议
nsmd/ripd/ospfd/bgpd/isisd这些进程都和路由协议强相关,在路由协议发生震荡时,特别是网络比较庞大的情况下,需要消耗大量的CPU计算和收敛。
阅读剩余
版权声明:
作者:SE_You
链接:https://www.cnesa.cn/8163.html
文章版权归作者所有,未经允许请勿转载。
THE END