MPLS_L3VPN场景业务中断原因判断步骤
步骤1:询问客户在故障前是否有做过网络调整
根据网络调整内容进行评估该问题是否是影响业务中断的原因,如果是则进行改动回退,业务恢复
步骤2:比对前后配置是否发生变化
比对故障前设备的前后配置是否发生变化(比如全局MPLS IP 配置删除等),如果发生变化,则评估是否是影响业务中断的原因,如果是则进行配置回退,恢复业务。
步骤3:查看show log信息
查看日志中在故障时期的关键信息,是否有异常日志,根据异常日志进行排查。
步骤4:查看MPLS LDP邻居建立是否正常
1)排查配置,确认以下配置是否完全配置。
全局配置:
mpls ip
mpls router ldp
ldp router-id interface Loopback 0 force //指定ldp的router-id
启用LDP接口的配置:
interface GigabitEthernet 4/1/3
label-switching
mpls ip
2)确认两端参数是否一致
通过show mpls ldp parameters来查看

设备默认参数如下
标签分发模式:DU,控制模式:独立,保留模式:自由,环路检测:关闭
3)确认是否有正常收到hello包
通过show mpls ldp discovery命令查看,如果有“xmit/recv”输出,则表示hello收发正常;如果只有xmit,则说明没有收到hello报文。 (xmit表示接口发送了hello,recv表示接收到了hello包)

未收到对方的hello包的可能原因有以下几项,逐项排查
-
1)对端接口未开启
-
2)中间线路质量有问题,导致hello包丢失
-
3)对端接口出方向配置了ACL,deny了对端接口地址到224.0.0.2的upd 646的端口报文。
-
4)中间存在安全设备,过滤了对端接口地址到224.0.0.2的upd 646的端口报文
-
5)hello报文异常不兼容,或者底层处理有问题。抓包,收集信息寻求技术支持。
4)确认双方TCP连接建立情况
前提:首先通过show mpls ldp discovery确认双发的hello包收发都正常
然后show mpls ldp adj来确认TCP的建立情况

1、若TCP连接未建立(如上图);则需进行TCP建联方面的排查;
1)确认是否有建立TCP连接所需的路由
通过show ip route查看路由表,确认是否有对应传输地址路由;再通过带源地址ping的方式进行验证。
2)是否存在ACL或者安全设备过滤了TCP建联的报文
建联方向:地址大--》地址小
协议端口:TCP/646
3)单方面开启了MD5验证
有对应的日志提示
%TCP-6-BADAUTH_MD5_NOT_FOUND: Unable to find expected MD5 option from (2.2.2.2, 1032) to (1.1.1.1, 646)
2、若TCP建立正常,而邻居无法建立,则进行下一步的排查。
3、若show mpls lad adj显示为空(如下图),则说明LDP对hello处理异常,收集信息,联系技术支持。

步骤5:查看MPLS VPN的标签是否正常
1)确认PE之间的公网LSP建立是否正常。
在PE设备上通过show ip ref mpls forwarding-table ftn 3.3.3.3 255.255.255.255来确认是否存在公网LSP
RSR77_1#show ip ref mpls forwarding-table ftn 3.3.3.3 255.255.255.255
Label Operation Code:
PH--PUSH label
PP--POP label
SW--SWAP label
SP--SWAP topmost label and push new label
DP--DROP packet
PC--POP label and continue lookup( IP or Label )
PI--POP label and do ip lookup forward
PN--POP label and forward to nexthop
PM--POP label and do MAC lookup forward
PV--POP label and output to VC attach interface
IP--IP lookup forward
The flag (#) means NHLFE SET, it is the first NHLFE of the NHLFE SET
tag/prefixuididxOP vrf outIntf adj next_hopout_lab
3.3.3.3/321048575 1048575 PH-- 47 11.1.1.2 8192
如有没有公网LSP信息,则检查LDP的运行状态
在PE/P设备上通过show mpls ldp nei查看邻居关系建立是否正常。
正常示例如下:

2)排查路由学习是否正常,从以下几个方面进行排查
让对端CE学到本端CE的路由,关键操作有以下几步,需点对点排查【单向路由学习,回程路由的学习也是如此】
1)PE之间的MP-BGP邻居建立正常
2)VRF的RT设置正确,本端PE的export和对端的PE的import必须严格对应
3)本端PE和CE之间运行的IGP路由学习正常
4)本端PE将1)点学到的路由重分布到MP-BGP中(或CE上有指向PE的默认路由)
5)对端PE将MP-BGP重分布到对端PE和对端CE运行的IGP中