锐捷N18K 极简环境 无感知用户异常掉线

一、故障现象描述

客户新部署极简无感知认证,但是使用过程中存在大量异常掉线情况,影响用户体验
设备型号:N18007
设备版本:11.0(1)B3P4

二、故障排查分析

  1. 查看SAM上用户下线详情,错误代码为code=15(NAS不能提供所需服务)。确认是N18K主动踢用户下线。
  1. N18K上查看认证迁移记录,发现用户下线时SNOOPING先通告下线。
  1. 查看snooping表项,发现故障时该mac存在vlan或者端口的迁移,旧的snooping老化导致的下线,然后发起了新的dhcp流程上线。

三、故障根因说明

分析:mac漫游时,N18K用户发生了vlan或者端口迁移,此时会老化旧的snooping表项并重新进行DHCP续约流程,旧的snooping老化时会通告给1X组件下线消息,导致无感知下线的现象。

四、故障解决方案

规避方案:配置dot1x snp-del-ip ignore,忽略snooping老化执行清除1X表项的动作
解决方案:升级最新版本

五、经验总结

针对认证异常下线原因,一般思路为:
  1. SAM查询下线日志,确定下线的主动发起者是SAM还是NAS。
  2. 如果是SAM,则由SAM排查故障原因;如果是NAS,则在NAS上查看用户认证迁移记录,确定下线原因。
  3. 注意NAS上非认证组件通告下线的场景,如snooping或者lsm等。
阅读剩余
THE END