锐捷RSR7708 MP口直连不通问题

一、故障现象描述

RSR7708路由器和下联单位对接MP接口直连不通

二、故障排查分析

1.现场的故障情况为核心和分支直连的multilink 26号接口直连不通,查看线卡流表显示收发正常,收集了以下信息:
通过上面的log发现总部发出的icmp echo报文能在分支端的主控到CPOS卡并且建立数据流,说明数据流已经到了快转框架层面,但是快转统计并没有统计到丢包的情况,是由于分支端CPOS线卡EFB数量异常导致。如下图所示:
可以看到线卡上EFB数量较少,由于没有业务运行,判断是EFB被异常占有了,触发条件是异常报文改写内存导致快转TX接口不匹配,从而EFB减少,且报文不能正常转发出去。最终现场执行了如下两个动作:
1.重新配置multilink 26接口,业务没有恢复
2.重置CPOS线卡,直连能够互通,业务恢复。
从现场两个动作看,现场分支端CPOS线卡处于异常状态,并且收到大量异常报文导致的,如下图所示:

三、故障根因说明

现场1/2线卡EFB内存出现泄露,导致无法及时处理加密机发送报文,导致大量报文被识别为错误帧导致直连ping不通的情况。

四、故障解决方案

由于本次故障原因主要是由于CPOS线卡收到大量的异常报文,导致线卡状态出现异常,报文无法正常地从接口发出导致,因此现场可以通过升级3b95版本来解决CPOS线卡异常问题。
阅读剩余
THE END