锐捷路由设备死机无法启动或登陆排查方法

一、故障现象

设备出现死机

二、组网拓扑

三、可能原因

1、软件问题或者触发某个程序导致死机

四、排查步骤

步骤一:设备死机紧急处理

1、如果已经影响客户业务,且客户需要立刻恢复业务,无法提供信息收集的情况下,可直接先暂时重启设备,观察是否能够恢复
2、设备重启后,业务恢复正常,业务恢复正常后可用巡检工具对设备进行巡检,并及时联系4008111000进行处理
3、设备重启后,业务仍旧异常,注意记录设备面板灯状态,并及时联系4008111000进行处理。

步骤二:收集死机堆栈信息

系统会自动将每次设备发生死机异常的异常信息都记录到flash中,以便事后仍然可以查看相应的死机信息
Ruijie#debug support
Ruijie(support)#show exception
Exception address is 0x40000!
查看对应时间点的异常信息。
收集tmp下的debug_log.txt信息
more tmp/debug_log.txt
如果设备console登入无显示,可以CRT记录下日志信息,输入@@@@@一键通收集系统信息
提示:收集后联系4008111000协助处理。

五、信息收集

信息收集命令参考
  Show run
  show version
  show cpu
  show_memory
  show ip fpm s
  show ip route summary
  Show log
  show efb
  Debug support
  show exception (Debug support后)
  show skb (Debug support后)
  more tmp/debug_log.txt

六、总结与建议

  设备死机,注意查看下是否有死机时间点的堆栈信息,查看下日志是否有异常信息。
  建议开启日志记录在flash:防止设备重启后日志因重启丢失。
  如果设备重启无法恢复
  1、记录设备console口打印的日志信息,以及设备面板灯。
  2、在ctrl层,重新对设备进行升级,看是否能恢复。
  3、及时申请备机。
阅读剩余
THE END