一、故障现象
R1和R2建立的LDP邻居建立后不断翻滚,频繁up/down。
二、组网拓扑

拓扑描述:
R1和R2直连,通过OSPF互相学习对方环回口路由,之后通过两端环回口地址建立LDP邻居。
三、可能原因
1、传输地址相关路由震荡;
2、hello包及keepalive包延迟处理或丢弃;
四、排查步骤
步骤一:检查是否确实存在LDP抖动情况

通过show log,检查是否存在LDP邻居up、down频繁抖动的情况。
步骤二:确认用于建立邻居的传输地址的路由是否稳定
1、通过show ip route来查看路由表多次,看看是否存在去往目标传输地址(LDP的router-id默认就是传输地址)的路由;若发现路由不断变换,需从路由协议层面进行排查。

2、通过通过带本设备传输地址去ping对端传输地址进行长ping测试,确认中间环境是否存在路由不稳定、丢包等情况

若发现ping存在较多丢包,也需从路由协议层面进行排查。
步骤三:检查hello、keepalive的收发是否异常
在业务低峰期,可接受设备宕机风险的前提下,才可以执行此操作!
debug mpls ldp message //打开debug
Un all //关闭debug

如上图,发现LDP有收发hello包(Sent/Rcvd keepalive msg)和收发keepalive包(sent/Rcvd keepalive msg)。且hello包默认5s一个,keepalive包15s一个为正常。如果未能收发hello、keepalive,则需排查具体原因。
1、检查接口使用带宽是否超过运营商带宽导致拥塞。可以通过show interface gix/x/x接口查看接口当前使用的带宽。若超过,检查运营商问题。

2、检查邻居间的链路质量问题,导致hello包及keepalive包延迟处理或丢弃。可以通过show interface对应LDP互联接口,查看是否有CRC错误且持续增加。若有持续增加,说明链路质量有问题,可替换模块和线路

五、信息收集
信息收集命令参考
主控:
ping [对端传输地址] source [本段传输地址]
show run
show memory
show version
show version slot
show bgp vpnv4 unicast all summary
show mpls ldp neighbor
show mpls ldp discovery
show mpls ldp adj
sho mpls forwarding-table summary detai
show log
Show ip route
show ip ref mpls summary
show ip ref mpls for ftn vrf xxx,或者show ip ref mpls for ilm
sho core | b Buff
show interface
show ip fpm st
show ip fpm count
线卡(集中式盒式设备忽略):
vtty 相关线卡
sho mpls forwarding-table summary
show ip ref mp sum detai
show ip ref excep
show ip ref mpls packet debug-buf
show ip ref mpls for ftn vrf xxx,或者show ip ref mpls for ilm
sho core | b Buff
show ip fpm st
show ip fpm count
六、总结与建议
LDP邻居震荡时,需注意以下几点:
1、传输地址相关路由震荡;
2、hello包及keepalive包延迟处理或丢弃;