S9706 堆叠对接服务器设备出方向流量负载分担不均
问题描述
版本/补丁:S9706 V200R010C00SPC600
组网:交换机=======服务器
配置脚本:
链路聚合
interface Eth-Trunk20
port link-type access
port default vlan 10
load-balance src-ip
undo local-preference enable
故障现象:
服务器使用load-balance,交换机使用手工聚合。服务器发向交换机侧流量负载,但交换机发向服务器侧流量极化到一条链路,另一条几乎无流量。
处理过程
1、梳理组网和负载模式:
组网为常规直连组网,无问题。服务器使用load-balance,交换机使用手工聚合,正常情况下就是负载均衡。
2、梳理流量类型
流量基本为二层流量,且有部分未知单播。
3、调整load-balance模板,采用enhanced模式
[HUAWEI] load-balance-profile a
[HUAWEI-load-balance-profile-a] ipv4 field sip protocol //考虑后续网络变更,将sip加上
[HUAWEI-load-balance-profile-a] l2 field smac //将mac作为hash因子计算的参数
[HUAWEI-load-balance-profile-a]unknown-unicast load-balance smacxordmac//针对未知单播将s/dmac异或结果作为hash因子计算的参数
接口调用模板
4、10分钟后观察,流量负载均衡。
根因
load-balance负载算法无法匹配现网实际流量,导致hash结果单一流量极化到一条线路。
解决方案
调整hash模板:
[HUAWEI] load-balance-profile a
[HUAWEI-load-balance-profile-a] ipv4 field sip protocol //考虑后续网络变更,将sip加上
[HUAWEI-load-balance-profile-a] l2 field smac //将mac作为hash因子计算的参数
[HUAWEI-load-balance-profile-a]unknown-unicast load-balance smacxordmac//针对未知单播将s/dmac异或结果作为hash因子计算的参数
建议与总结
类似问题先排查两端负载模式是否一致,lacp对lacp,lb对手工。排查模式后,分析现网流量类型,选取变化率较大的参数作为hash计算的参数。