锐捷路由器设备线卡无法识别或者加载成功排查方法
一、故障现象
故障现象主要有如下三种:
1、在网运营设备上插入一张增购的线卡,无法识别;
2、对设备进行软件版本升降级后,发现某些线卡无法识别;
3、设备在运行过程中,某线卡突然反复重启
二、组网拓扑
无
三、可能原因
1、正常情况或者操作不当
2、主机软件版本不支持该线卡;
3、线卡没有正确装载;
4、线卡硬件故障;
5、机箱槽位故障;
6、软件故障
四、排查步骤
步骤一:检查是否是正常情况或者是否存在操作问题
通过show ver slot命令,查看该槽位线卡的状态

Configured-module:表示install命令预装载的线卡(用于未插入线卡时,提前加载线卡配置调试)
Online-module:表示实际在线的线卡
Status:
Master:主控板(该主控板为主用状态);
Slave:主控板(该主控板为备份状态);
none:插槽上没有线卡,也没有预装载线卡;
running:线卡正常工作;
installed:插槽上没有线卡,但预装载了一张线卡,后续使用需插入实际线卡;
running-config:主控正在给线卡下载配置,一般是用户没有长按ofl按钮到灯灭或未remove对应线卡就直接拔出线卡导致,需重启设备解决;
run-remove:用户执行了remove操作,但还没有拔卡,可以拔插线卡恢复;
conflict:用户的预配置和实际插入的卡类型不一致,需更换其他槽位,或者Ruijie(config)#no install X/X对应槽位线卡(之前该槽位的线卡配置会丢失,注意提前备份);
unins-remove:用户执行了no install操作,但还没有拔卡,可以拔插线卡恢复。
通过上述各项状态及描述,可以判断是否是正常情况或是否存在操作层面的问题。若仍未解决,可以参考如下详细步骤。
步骤二:查看是否软件版本不支持该线卡
通过show ver命令确认主机软件版本号,查看对应版本配套的《版本发行说明》,确认该软件版本是否支持该线卡。如果不支持该线卡,请升级到支持该线卡的推荐软件版本。

步骤三:查看是否线卡没有正确装载
通过对应设备的硬件安装手册查看线卡是否插在正确的槽位上。设备对某些线卡可能存在槽位限制,插入不正确的槽位就会导致线卡无法识别。
步骤四:查看是否线卡硬件故障或机槽位故障
通过show version slot 查看线卡的状态

若线卡的状态为none,则需通过替换槽位和线卡确认是否硬件问题——①该线卡换个槽位测试,确认是否槽位问题;②换一张同类型的其它线卡做测试,确认是否线卡问题。 详细如下:
1)尝试通过拔插线卡尝试
尝试通过热插拔,并关注线卡是否扣紧;如果线卡恢复正确识别,那么可能是之前没扣紧或者软件上识别上存在问题。如果无法解决请继续排查。
2)将线卡插在本机其他槽位上
尝试将线卡更换到本机其他槽位测试,以确定是否是槽位问题(机框问题)。
如果更换槽位解决,说明原槽位有问题,但还是不能排除软件故障的可能;请把线卡插回原槽位,并尝试整机重启(条件允许的情况下),确认是否可以正确识别;如果可以识别,说明软件故障的可能性大;如果仍然不能识别,那么机框硬件问题的可能性大。 如果都无法解决请,继续排查。
3)通过更换线卡尝试
如果故障机箱仅单块线卡存在故障,整机其他线卡正常,通常本张线卡的单体故障可能性较大,通过更换线卡可以解决。
如果现场有其他同型号的线卡或备件线卡,可尝试替换到当前故障线卡槽位,通过替换法能够定位线卡是否存在硬件故障;
4)将线卡插在其他设备上
如果没有多余同型号线卡,但有同型号主机,可尝试将线卡更换到其他设备,以确定是否是线卡故障或整机软件故障
对于在网设备,以上动作有导致断网的风险,请小心操作,并在操作前获得用户同意。
步骤五:查看是否软件故障
早期版本可能存在软件BUG,导致设备重启后线卡无法启动。建议将设备升级至推荐版本。
如果升级软件版本后,线卡恢复正常识别,故障解决,继续观察。
如果升级软件版本后,线卡依然无法识别,请收集信息联系400处理
软件升级必须得到客户批准,因为设备可能其它板卡还工作正常,不能因升级中断业务,如无法升级版本直接联系400处理 。
五、信息收集
信息收集命令参考
ter len 0
show ver
show run
show log
show cpu
show memory
show version
show version slot
show environment
show ip fpm counters
show ip fpm statistics
show ip interface brief
show interface
show clock
show redundancy
show upg
debug support
show exception
show efb
show skb
more /tmp/debug_log.txt
ter no len
dir //把主备引擎最近几天的日志拷贝发出来【重要】
vtty 6/0 //如果能vtty到线卡,在故障线卡上收集exception信息。注意:若是SIP5X载板不进入子卡槽位,需进入载板槽位
en
o l c
ter len 0
show log
debug su
show exception
show skb
show efb
pcie show
more /tmp/debug_log.txt
ter no len
ctrl+x //退出线卡
六、总结与建议
  线卡无法识别或反复重启时,需注意以下几点:
  1、正常情况或者操作不当
  2、主机软件版本不支持该线卡;
  3、线卡没有正确装载;
  4、线卡硬件故障;
  5、机箱槽位故障;
  6、软件故障
阅读剩余
版权声明:
作者:SE_You
链接:https://www.cnesa.cn/8599.html
文章版权归作者所有,未经允许请勿转载。
        
        THE END
    
        