LDP 邻居震荡排查步骤

一、故障现象

R1和R2建立的LDP邻居建立后不断翻滚,频繁up/down。

二、组网拓扑

拓扑描述:
R1和R2直连,通过OSPF互相学习对方环回口路由,之后通过两端环回口地址建立LDP邻居。

三、可能原因

1、传输地址相关路由震荡;
2、hello包及keepalive包延迟处理或丢弃;

四、排查步骤

步骤一:检查是否确实存在LDP抖动情况

通过show log,检查是否存在LDP邻居up、down频繁抖动的情况。

步骤二:确认用于建立邻居的传输地址的路由是否稳定

1、通过show ip route来查看路由表多次,看看是否存在去往目标传输地址(LDP的router-id默认就是传输地址)的路由;若发现路由不断变换,需从路由协议层面进行排查。
2、通过通过带本设备传输地址去ping对端传输地址进行长ping测试,确认中间环境是否存在路由不稳定、丢包等情况
若发现ping存在较多丢包,也需从路由协议层面进行排查。

步骤三:检查hello、keepalive的收发是否异常

在业务低峰期,可接受设备宕机风险的前提下,才可以执行此操作!
debug mpls ldp message //打开debug
Un all //关闭debug
如上图,发现LDP有收发hello包(Sent/Rcvd keepalive msg)和收发keepalive包(sent/Rcvd keepalive msg)。且hello包默认5s一个,keepalive包15s一个为正常。如果未能收发hello、keepalive,则需排查具体原因。
1、检查接口使用带宽是否超过运营商带宽导致拥塞。可以通过show interface gix/x/x接口查看接口当前使用的带宽。若超过,检查运营商问题。
2、检查邻居间的链路质量问题,导致hello包及keepalive包延迟处理或丢弃。可以通过show interface对应LDP互联接口,查看是否有CRC错误且持续增加。若有持续增加,说明链路质量有问题,可替换模块和线路

五、信息收集

信息收集命令参考
主控:
ping [对端传输地址] source [本段传输地址]
show run
show memory
show version
show version slot
show bgp vpnv4 unicast all summary
show mpls ldp neighbor
show mpls ldp discovery
show mpls ldp adj
sho mpls forwarding-table summary detai
show log
Show ip route
show ip ref mpls summary
show ip ref mpls for ftn vrf xxx,或者show ip ref mpls for ilm
sho core | b Buff
show interface
show ip fpm st
show ip fpm count
线卡(集中式盒式设备忽略):
vtty 相关线卡
sho mpls forwarding-table summary
show ip ref mp sum detai
show ip ref excep
show ip ref mpls packet debug-buf
show ip ref mpls for ftn vrf xxx,或者show ip ref mpls for ilm
sho core | b Buff
show ip fpm st
show ip fpm count

六、总结与建议

LDP邻居震荡时,需注意以下几点:
1、传输地址相关路由震荡;
2、hello包及keepalive包延迟处理或丢弃;
上一篇 静态路由和动态路由各自的优缺点?
下一篇 华为CE交接机-配置BFD状态与子接口状态联动