问题描述
版本信息:
S系列交换机版本为V200R010C00SPC600。
组网概述:

故障现象:
S系列交换机使用Eth-Trunk接口与对端友商设备对接时,华为设备接口状态正常,无告警信息;友商设备接口出现频繁的up/down,并出现告警信息。
告警信息
*Mar 1 02:05:20.173: %LINEPROTO-5-UPDOWN: Line protocol on Interface GigabitEthernet0/45, changed state to down
*Mar 1 02:05:23.188: %LINK-3-UPDOWN: Interface GigabitEthernet0/45, changed state to down
*Mar 1 02:05:27.793: %LINEPROTO-5-UPDOWN: Line protocol on Interface GigabitEthernet0/46, changed state to down
*Mar 1 02:05:28.850: %LINK-3-UPDOWN: Interface GigabitEthernet0/46, changed state to down
*Mar 1 02:06:30.226: %LINEPROTO-5-UPDOWN: Line protocol on Interface GigabitEthernet0/45, changed state to up
*Mar 1 02:06:36.098: %LINK-3-UPDOWN: Interface GigabitEthernet0/46, changed state to up
*Mar 1 02:06:58.111: %LINK-3-UPDOWN: Interface GigabitEthernet0/46, changed state to down
*Mar 1 02:06:59.009: %LINK-3-UPDOWN: Interface GigabitEthernet0/45, changed state to down
处理过程
1、查看两端设备聚合接口模式,如下:
友商设备:
interface GigabitEthernet0/45
switchport mode trunk
channel-group 1 mode active
!
interface GigabitEthernet0/46
switchport mode trunk
channel-group 1 mode active
!
华为S系列交换机:
[XXZW-33G-HJ-S9703-2]dis eth- 2
Eth-Trunk2's state information is:
WorkingMode: NORMAL Hash arithmetic: According to SIP-XOR-DIP
Least Active-linknumber: 1 Max Bandwidth-affected-linknumber: 8
Operate status: up Number Of Up Port In Trunk: 2
--------------------------------------------------------------------------------
PortName Status Weight
GigabitEthernet1/0/0 Up 1
GigabitEthernet1/0/1 Up 1
2、可看到华为交换机的Eth-Trunk接口的模式为normal,将模式修改为lacp。如下:
[Quidway]interface eth-trunk 2
[Quidway-Eth-Trunk2]mode lacp
3、查看两端设备端口状态,如下:
华为设备:

友商设备:

4、可以看到两端设备端口都为up状态,友商设备不再出现告警信息,故障排除。
根因
思科设备接口出现频繁的up/down,同时出现err-disabled loopback的状态,说明接口对接失败,两端设备间存在环路,而思科设备协商发送LADP报文时,LADP报文环回原来的接口,而思科设备有自身的保护机制,loopback原因会导致接口err-disabled。思科设备接口出现err-disabled状态常见的原因有udld,bpduguard,link-flap以及loopback等;具体由什么原因导致当前接口err-disable可以由show interface status err-disable来查看。在缺省配置下,一旦接口被置为err-disable,设备将不会试图恢复接口。思科设备可以调整自身的err-disable机制,在一段时间后进行接口恢复。可通过show errdisable recovery来查看自动恢复时间,如下,本案例中,由于手工配置了恢复,可看到udld,bpduguard,loopback等的timer status的值变为Enable。但是,如果引起err-disable的源没有根治,在恢复工作后,接口会再次被置为err-disable,所以导致接口频繁出现up/down状态。通过调整两端设备聚合接口模式后,接口对接成功,故障排除。
#show errdisable recovery
ErrDisable Reason Timer Status
----------------- --------------
udld Enabled
bpduguard Enabled
security-violatio Disabled
channel-misconfig Enabled
vmps Disabled
pagp-flap Disabled
dtp-flap Disabled
link-flap Enabled
l2ptguard Disabled
psecure-violation Disabled
gbic-invalid Disabled
dhcp-rate-limit Disabled
unicast-flood Disabled
loopback Enabled
Timer interval: 30 seconds
Interfaces that will be enabled at the next timeout:
Interface Errdisable reason Time left(sec)
--------- ----------------- --------------
interface GigabitEthernet0/45 loopback 25
interface GigabitEthernet0/45 loopback 26
解决方案
当使用华为设备Eth-Trunk接口与友商设备对接失败时,可以调整接口模式与对端设备进行对接,配置如下:
华为设备:
[Quidway]interface GigabitEthernet X
[Quidway-GigabitEtherneY]eth-trunk Z
[Quidway]interface GigabitEthernet Y
[Quidway-GigabitEthernetY]eth-trunk Z
[Quidway-Eth-TrunkZ]mode ?
lacp LACP working mode
manual Manual working mode
友商设备:
Switch(config)#interface gigabitEthernet X
Switch(config-if)#channel-group Z
Switch(config)#interface gigabitEthernet Y
Switch(config-if)#channel-group Z
Switch(config-if)#channel-group Z mode ?
active Enable LACP unconditionally
auto Enable PAgP only if a PAgP device is detected
desirable Enable PAgP unconditionally
on Enable Etherchannel only
passive Enable LACP only if a LACP device is detected
华为Eth-Trunk接口模式有lacp和manual两种模式,而友商设备接口捆绑有active,auto,desirable,on,passive五种模式,其中对接方式有两种,第一种为华为Eth-Trunk接口lacp模式可以与友商设备使用active模式时,可以正常对接。第二种为华为Eth-Trunk接口undo lacp模式可以与友商设备使用on模式时,可以正常对接。
建议与总结
当使用华为设备与友商设备对接失败时,尽量使用标准化的共有协议进行对接。