S9700交换机netstream故障

问题描述

设备类型为S9700,版本号:V200R001C00SPC300。在S9700交换机上面配置netstream,采用随板做法,业务板是E系列单板,支持netstream配置。配置完成以后,在流量分析服务器统计信息,发现统计到的端口入方向流量比实际流量小好几倍。

告警信息

处理过程

1、确认配置绝对没有问题
2、确认服务器与S9700之间的链路正常无丢包
3、确认服务器性能正常,服务器能正常分析其他设备上发送的netstream流且分析结果正常
4、以上情况都确认以后,怀疑是S9700交换机本身问题。S9700交换机随板做netstream情况下,默认能处理的数据流上限为4000,初步怀疑是由于单板超规格造成的故障。选取其中一个存在故障现象的端口,这里选取的G8/0/42,该端口在第8槽位,然后在交换机的诊断模式下获取如下信息:
[SW-diagnose]debugging lsw-command slot 8 open
[SW-diagnose]lsw-command 8 0 by-string g ING_IPFIX_MISSED_BUCKET_FULL_COUNT
[SW-diagnose]
ING_IPFIX_MISSED_BUCKET_FULL_COUNT.ipipe0[0x10a80030]=0x2a1ee489
: <COUNT=0x2a1ee489>

[SW-diagnose]lsw-command 8 0 by-string g ING_IPFIX_MISSED_EXPORT_FULL_COUNT
[SW-diagnose]
ING_IPFIX_MISSED_EXPORT_FULL_COUNT.ipipe0[0x10a80031]=0: <COUNT=0>

[SW-diagnose]lsw-command 8 0 by-string g ING_IPFIX_MISSED_PORT_LIMIT_COUNT
[SW-diagnose]
ING_IPFIX_MISSED_PORT_LIMIT_COUNT.ipipe0[0x10a80029]=0: <COUNT=0>

[SW-diagnose]debugging lsw-command slot 8 close
由以上信息判断出,的确是由于数据流超过设备的单板规格造成服务器统计流量信息不准确。最后采用SPU板卡来配置netstream,问题解决。

根因

1、S9700交换机上参数配置不当
2、服务器与S9700之间的链路问题造成丢包
3、S9700交换机设备性能问题或者服务器性能问题

建议与总结

S9700的netstream配置最好用支持该性能的SPU板卡来做,避免在业务板上配置时遇到瓶颈
上一篇 防火墙和路由器同时做 NAT,会有哪些坑?
下一篇 【Linux】进程等待:wait/waitpid 与僵尸进程治理