用户通过AR上网慢故障处理(V600)

了解你的网络

随着网络的普及,娱乐、游戏、学习、购物等活动都需要在网上进行,上网已经成为人们日常生活中必不可少的一项活动。在上网的过程中,很多用户都会遇到上网慢问题,例如,网页打开慢、看视频卡顿等。在介绍如何解决网速慢问题之前,先了解一下你的网络基本信息,包括上网方式、理论网速、网速测量等。

上网方式及理论网速

图1-1,宽带网络是一个极其复杂的端到端系统,包括LAN侧和WAN侧。LAN侧指用户到AR这一段,包括FIT AP、S、用户终端等设备。WAN侧指AR到Internet之间,包括光猫、接入网、核心网设备,不过这些都是运营商提供的,与用户无关,不在本文讨论范围内。

图1-1 用户上网组网图
用户通过AR上网慢故障处理(V600)

下行速率是指Internet向用户发送信息时的数据传输速率,单位是Mbit/s,比如打开浏览器,下载文件等。上行速率是指用户向Internet上传文件时可以达到的速率。对于大部分用户来说,主要上网业务是从Internet下载文件,而非上传文件,所以下行速率一般都高于上行速率。用户从宽带运营商那里办理的带宽值就是下行速率。例如,用户办理了200M宽带套餐,这里的200M就是下行速率,对应的上行速率可能只有几十M。

用户终端可以通过有线方式上网,也可以通过无线方式上网,不同的上网方式,用户能达到的最大网速也不同。本文讨论的是有线用户访问Internet时遇到的下行网速慢问题,因此下行速率才是有线用户网速可以达到的理论值。此外,有线用户的网速还与网络硬件设施(光猫、AR、S、网线)有关。

如何测网速

当发现上网慢问题时,建议先测量一下实际的网速后再处理故障。常用的网速测量方法有网站测速、测速工具测速等。不同的测速方法测量结果略有不同,建议使用不同的测速方法多测几次:

  • 使用网站测速。各大运营商网站都提供了测速功能,例如中国电信宽带测速网,不同区域网址不一样;也可以用一些专门的测速网站来测,例如测速网
  • 使用测速工具测速。在应用商店下载并安装测量网速的工具进行测速,例如网速测试、网络测速大师、测网速大师等。

有些测速软件的测量结果是下载速度MB/s,但会同步换算成对应的带宽值Mbit/s。如果没有,也可以根据1MB/s = 8Mbit/s的关系,自己换算一下。

了解用户上网慢故障场景

AR作为企业网络的路由网关设备,在企业网络里扮演了非常重要的角色,为用户提供上网服务。为了帮助用户解决在通过AR上网时遇到的上网慢问题,本文从多个现网真实案例中,总结出两大常见上网慢故障场景:单上行出口上网慢和双上行/多上行出口上网慢。

单上行出口上网慢

单上行出口上网是指AR路由器和公网之间只有一条上行链路相连。如图1-2所示,AR和Internet之间的连线只有一条,10GE0/0/0是连接Internet的接口,也叫作公网口,GE0/0/2是连接私网的接口,也叫作私网口。该场景常见的上网慢原因包括:TCP最大报文段长度MSS(Max Segment Size)值配置不合理、网络攻击导致设备Session资源耗尽、接口模式协商错误等,具体定位方法请参见单上行出口上网慢故障处理章节。

图1-2 单上行出口上网场景组网示例
用户通过AR上网慢故障处理(V600)

双上行/多上行出口上网慢

双上行/多上行出口上网是指AR路由器和公网之间有两条或者大于两条上行链路相连。如图1-3所示,AR和Internet之间的连线有多条,10GE0/0/1和10GE0/0/2都是公网口,GE0/0/3是私网口。该场景常见的上网慢原因除了单出口场景中列出的,还包括一些特有的原因,例如:Dialer口路由问题、报文来回路径不一致、等价路由问题等,具体定位方法请参见双上行出口/多上行出口上网慢故障处理章节。

图1-3 双上行/多上行出口上网场景组网示例(PPPoE拨号)
用户通过AR上网慢故障处理(V600)

为什么有线网速慢,原因在这里

图1-4是用户通过AR路由器上网慢的故障树,列出了单上行出口和双上行出口两种场景上网慢的常见原因。

图1-4 用户上网慢故障树
用户通过AR上网慢故障处理(V600)

单上行出口上网慢故障处理

报文分片导致部分网页打开慢

背景信息

如果仅是部分网页访问慢,其他网页访问正常,则大概率是由于TCP最大报文段长度MSS(Max Segment Size)值配置不合理,导致报文被分片传输,影响用户的上网速度。此时,可以参考本节内容,修改报文分片的参数值。

最大传输单元MTU(Maximum Transmission Unit)是用来标识IP报文是否分片的选项。如果对端发送的IP报文长度超过MTU值,则IP报文会进行分片处理。为了保证TCP报文不分片,配置过程中需要注意MSS与MTU的关系。一般情况下,为了不影响报文传输,MSS值加上报文开销(TCP首部、IP首部等)不超过MTU值。例如,以太网接口的缺省MTU值为1500字节,为了保证报文不分片,MSS值最大配置为1460(1500 − 20(TCP首部最小长度) − 20(IP首部最小长度))字节。推荐用户配置MSS值为1200字节。

定位步骤

  1. 执行命令display ip interface brief,查看公网接口是物理接口还是Dialer接口。 
    <Huawei> display ip interface brief
    *down: administratively down                                                    
    ^down: standby                                                                  
    (l): loopback                                                                   
    (s): spoofing                                                                   
    (E): E-Trunk down    
    The number of interface that is UP in Physical is 2                             
    The number of interface that is DOWN in Physical is 3                           
    The number of interface that is UP in Protocol is 2                             
    The number of interface that is DOWN in Protocol is 3                           
    
    Interface                         IP Address/Mask      Physical   Protocol      
    Atm0/0/0                          unassigned           down       down          
    Bridge-if10                       unassigned           down       down          
    MFR0/0/1                          unassigned           down       down          
    NULL0                             unassigned           up         up(s)         
    GE0/0/1                           x.x.x.x/24           up         up   
    GE0/0/2                           x.x.x.x/24           up         up       
    <HUAWEI> display ip interface brief 
    *down: administratively down 
    (l): loopback 
    (s): spoofing 
    (d): Dampening Suppressed 
    (ed): error down 
    The number of interface that is UP in Physical is 3 
    The number of interface that is DOWN in Physical is 0 
    The number of interface that is UP in Protocol is 3 
    The number of interface that is DOWN in Protocol is 0 
    Interface                   IP Address/Mask    Physical Protocol VPN 
    10GE0/0/1                   10.1.1.1/16         up       up       -- 
    MEth0/0/0                   192.168.190.129/16  up       up       -- 
    NULL0                       unassigned          up       up(s)    --
    • 如果是物理接口,则在物理接口视图下执行命令tcp adjust-mss配置接口的TCP最大报文段长度,推荐数值为1200。
      <Huawei> system-view
      [Huawei] interface 10GE 0/0/0
      [Huawei-10GE0/0/0] tcp adjust-mss 1200 
      [Huawei-10GE0/0/0] quit
    • 如果是Dialer接口,则在Dialer接口视图下执行命令tcp adjust-mss配置接口的TCP最大报文段长度,推荐数值为1200,并执行命令mtu配置接口的最大传输单元值为1492。对于Dialer接口,adjust-mss值和mtu值不能配置一样。
      [Huawei] interface Dialer 0
      [Huawei-Dialer0] tcp adjust-mss 1200
      [Huawei-Dialer0] mtu 1492
      [Huawei-Dialer0] restart
      [Huawei-Dialer0] quit
      [Huawei] quit

     

  2. 建议同步将私网接口的TCP最大报文段长度值也配置成推荐值1200。假设私网接口为GE0/0/2,则在私网接口上配置tcp adjust-mss 1200命令。 
    <Huawei> system-view
    [Huawei] interface GE 0/0/2
    [Huawei-GE0/0/2] tcp adjust-mss 1200 
    [Huawei-GE0/0/2] quit

     

DNS耗时太长导致网页打开慢

背景信息

用户通过域名访问某个网页时,如果DNS查询时间较长,也会影响网页的打开速度。本节以谷歌浏览器为例,帮助用户解决由于DNS耗时长导致的网页打开慢问题。

图1-5所示,当用户使用谷歌浏览器打开一个网页时,浏览器标题栏的圆圈逆时针转动表示浏览器正在进行DNS查询,顺时针转动表示浏览器正在下载网页内容。如果发现标题栏的圆圈逆时针转动时间较长,则说明DNS查询耗时长。

图1-5 谷歌浏览器标题栏
用户通过AR上网慢故障处理(V600)

定位步骤

  1. 在设备上执行命令display cpu-defend statistics all查看上送CPU的报文统计信息中是否有DNS报文丢弃计数。 
    <Huawei> display cpu-defend statistics all
    Statistics(packets) on slot 0 :                                                 
    ----------------------------------------------------------------------------------------------                                                                  
    PacketType                             Total Passed        Total Dropped   Last Dropping Time                                                                   
                                      Last 5 Min Passed   Last 5 Min Dropped        
    --------------------------------------------------------------------------------
    --------------                                                                  
    8021x                                             0                    0   -    
                                                      0                    0        
    8021x-ident                                       0                    0   -    
                                                      0                    0        
    8021x-ident-wlan                                  0                    0   -    
                                                      0                    0        
    8021x-start                                       0                    0   -    
                                                      0                    0        
    8021x-start-wlan                                  0                    0   -    
                                                      0                    0        
    8021x-wlan                                        0                    0   -    
                                                      0                    0        
    ad                                                0                    0   -    
                                                      0                    0        
    arp-miss                                          2                    0   - 
    ...
    dns-reply                                         0                    0   -    
                                                      0                    0        
    dns-request                                       0                    0   -    
                                                      0                    0        
    ...

     

  2. 如果DNS报文被丢弃了,则通过如下操作修改DNS报文的上送速率,让设备不丢弃DNS报文。 
    <Huawei> system-view 
    [Huawei] cpu-defend policy dns
    [Huawei-cpu-defend-policy-dns] car packet-type dns-reply pps 512 
    [Huawei-cpu-defend-policy-dns] auto-defend enable 
    [Huawei-cpu-defend-policy-dns] quit
    [Huawei] cpu-defend-policy dns

     

  3. AR设备默认不转发解析失败的DNS Reply报文给DNS客户端,但是有的DNS客户端会一直等待这个报文而不进行后续动作。此时,可以在AR设备上执行命令dns proxy ipv6 ] forward-any-response,配置AR设备转发DNS服务器回应的所有应答报文给DNS客户端(包括解析失败的DNS Reply报文)。 
    <Huawei> system-view 
    [Huawei] dns proxy forward-any-response
    <Huawei> system-view 
    [Huawei] dns proxy ipv6 forward-any-response

     

私网流量大导致设备的Session资源耗尽

背景信息

当网络中存在一些攻击行为或者业务较多时,路由器会收到大量流量,路由器的Session和Block内存资源很快会被耗尽,超过阈值。其他正常用户可能会因为分配不到Session和Block资源而出现上网慢情况。此时,可以参考本节内容,检查下设备的Session和Block资源是否正常。如果发现资源被耗尽,则通过traffic-policy或者traffic-filter命令禁止端口上的异常流量通过,同时找出攻击源进行杀毒。如果正常流量本身就很多,超过了设备的性能,则需要更换更高性能的设备。

定位步骤

  1. 执行命令display logbuffer,查看Log缓冲区记录的信息中是否有大量Session和Block内存资源过载的日志。 
    <Huawei> display logbuffer
    Logging buffer configuration and contents: enabled                              
    Allowed max buffer size: 1024                                                   
    Actual buffer size: 512                                                         
    Channel number: 4, Channel name: logbuffer                                      
    Dropped messages: 0                                                             
    Overwritten messages: 167                                                       
    Current messages: 512 
    
    Mar  5 2025 15:47:25+08:00 Huawei %%01HPP/2/hwSessExceed_active: The number of session resources exceeds the limit. (Current usage=95%, Threshold=80%, TopNSourceIpAddress=10.1.2.3)
    Mar  5 2025 16:29:25+08:00 Huawei %%GMDB/2/hwNDBResThresholdExceed_active: The usage of NDB resources reached the threshold. (Slot=0, CPU=2, Threshold=80, Current=90, ReasonId=01, Description=The block memory usage exceeded the threshold)
    Mar  5 2025 16:34:25+08:00 Huawei %%01FORWARD/4/SESSION-RES-LACK(l)[261]:The device session resources were overloaded.(Usage = 92%)
    Mar  5 2025 16:43:25+08:00 Huawei%%01CONFIGURATION/4/CONFIGMIB_FILE_OPERATE_FINISH(l):CID=0x80cb001a;Configuration was copied. (OperationType=3, OptTime=640, OptState=2, OptEndTime=9079349)

     

  2. 进入诊断视图,执行命令display session topn 10 session-number order-by source-ip根据源IP地址统计Top 10用户的Session信息,检查Total Sessions字段的值是否接近设备的Session规格。 
    <Huawei> system-view
    [Huawei] diagnose
    [Huawei-diagnose] display session topn 10 session-number order-by source-ip
    Session number top 10 (Condition: Source IP, Items: 3, Total Sessions: 25768) 
    -------------------------------------------------------------------------------------------------
    TOP-N     IP/Port                       Counts              Percentage(%)       
    -------------------------------------------------------------------------------------------------
    1         192.168.1.99                  19714               76.505744           
    2         192.168.1.88                  5988                23.238125           
    3         192.168.1.165                  9                   0.034927

     

  3. 如果设备的Session数已达到设备的规格,且发现Top 10会话里有大量私网终端建立的会话(源IP地址为私网终端的IP地址,例如步骤1中的192.168.1.99192.168.1.88),说明私网中可能存在攻击行为。此时,执行命令display session statistics top 10 order-by destination-port进一步查看私网终端建立的会话的端口信息。本例中,私网用户建立了大量目的端口为445和1433的会话,建议在私网接口上配置ACL规则拒绝目的端口为445和1433的流量通过。 
    [Huawei-diagnose] display session topn 10 session-number order-by destination-port
    Session number top 10 (Condition: Destination Port,Items: 3, Total Sessions: 25768)
    -------------------------------------------------------------------------------------------------
    TOP-N     IP/Port                       Counts              Percentage(%)       
    -------------------------------------------------------------------------------------------------
    1         445                           15486               60.097796           
    2         1433                          9565                37.119683           
    3         3389                           648                 2.514747
    [Huawei-diagnose] quit  
    [Huawei] interface GE 0/0/0
    [Huawei-GE0/0/0] display this
    #
    ip address 192.168.1.255 255.255.255.0
    #
    [Huawei-GE0/0/0] quit

    在流策略里绑定ACL并将流策略应用到私网接口GE0/0/0,不允许目的端口为445和1433的流量通过私网接口,从而解决故障。

    [Huawei] acl 3000 
    [Huawei-acl4-advance-3000] rule 20 permit tcp  destination-port eq 445
    [Huawei-acl4-advance-3000] rule 25 permit tcp  destination-port eq 1433
    [Huawei-acl4-advance-3000] quit
    [Huawei] traffic classifier virus type or
    [Huawei-classifier-virus] if-match acl 3000
    [Huawei-classifier-virus] quit
    [Huawei] traffic behavior virus
    [Huawei-behavior-virus] deny
    [Huawei-behavior-virus] quit
    [Huawei] traffic policy virus 
    [Huawei-trafficpolicy-virus] classifier virus behavior virus 
    [Huawei-trafficpolicy-virus] quit
    [Huawei] interface GE 0/0/0
    [Huawei-GE0/0/0] traffic-policy virus outbound
    [Huawei-GE0/0/0] traffic-policy virus inbound
    [Huawei-GE0/0/0] quit

     

  4. 如果检查之后,没有发现私网有攻击行为,则说明私网的业务较多,流量大属于正常现象,当前的设备性能已无法满足私网的业务,需要更换性能更高的设备。

私网存在ARP攻击导致用户上网时断时续

背景信息

如果用户发现上网时断时续,且网速特别慢,则很有可能是因为私网存在ARP攻击。此时,可以参考本节内容,检查设备上是否存在ARP攻击。

定位步骤

  1. 执行命令display logbuffer检查设备运行日志,看是否有ARP协议报文因CPU阀值的限制被丢弃。 
    <Huawei> display logbuffer
    Mar  9 2025 16:01:54+00:00 Huawei %%01CPUDEFEND/4/hwCpcarDropPacketAlarm_active: Rate of packets to cpu exceeded the CPCAR limit in slot [SlotId]. (Protocol=arp-miss, PPS/CBS=xx/xx, ExceededPacketCount=700])
    Mar  9 2025 16:01:54+00:00 Huawei %%01CPUDEFEND/4/hwCpcarDropPacketAlarm_active: Rate of packets to cpu exceeded the CPCAR limit in slot [SlotId]. (Protocol=arp-request, PPS/CBS=xx/xx, ExceededPacketCount=829])

     

  2. 如果日志中有ARP报文被丢弃,则怀疑设备连接的私网中存在ARP攻击。此时,可以在设备上配置攻击溯源功能,进一步排查。 
    <Huawei> system-view
    [Huawei] cpu-defend policy 1
    [Huawei-cpu-defend-policy-1] auto-defend enable
    [Huawei-cpu-defend-policy-1] auto-defend threshold 40  //可适当调整建议不要太小
    [Huawei-cpu-defend-policy-1] auto-defend attack-packet sample 5
    [Huawei-cpu-defend-policy-1] auto-defend protocol all
    [Huawei-cpu-defend-policy-1] auto-defend trace-type source-ip source-mac source-portvlan
    [Huawei-cpu-defend-policy-1] auto-defend alarm enable
    [Huawei-cpu-defend-policy-1] quit
    [Huawei] cpu-defend-policy 1

     

  3. 配置完攻击溯源后,当网络出现异常时,在设备上执行命令display auto-defend attack-source history进一步确认是否存在ARP攻击。 
    [Huawei] display auto-defend attack-source history
     Attack History User Table on Slot 0 :                                                                                                                    --------------------------------------------------------------------------------                                                      
    AttackTime             MAC Address    Interface         VLAN:O/I    PacketType                                                        
    --------------------------------------------------------------------------------                                                      
    S:2020-06-07 14:07:24  yyyy-yyyy-yyyy GE0/0/1        100/--       ARP                                                               
    E:2020-06-07 14:07:25                                                                                                                 
    --------------------------------------------------------------------------------                                                      
    Total: 1                                                                                                                              
    Attack History IP Table on Slot 0 :                                                                                                   
    -----------------------------------------------------------------------------                                                         
    AttackTime             IP Address                                PacketType                                                           
    -----------------------------------------------------------------------------                                                         
    S:2020-06-07 14:06:14  y.y.y.y                                 ARP                                                                  
    E:2020-06-07 14:06:17                                                                                                                 
    -----------------------------------------------------------------------------                                                         
    Total: 1                                                                                                                              
    Attack History Port Table on Slot 0 :                                                                                                 
    -----------------------------------------------------------------                                                                     
    AttackTime             Interface         VLAN:O/I    PacketType                                                                       
    -----------------------------------------------------------------                                                                     
    S:2020-06-07 14:06:17  GE0/0/1        100/--      ARP                                                                              
    E:2020-06-07 14:06:38                                                                                                                                                                                                                             -----------------------------------------------------------------                                                                     
    Total: 1

    如上所示,私网中源IP地址为y.y.y.y,源MAC为yyyy-yyyy-yyyy的用户发送了大量的攻击报文(本例中GE0/0/1为公网接口,报文数量增长不大,可以忽略)。此时,根据被攻击端口GE0/0/1,逐层往下找到攻击源用户,使用杀毒软件杀毒,解决故障。

     

  4. 如果无法查到攻击源用户,可以在设备的私网接口GE0/0/1上配置ACL规则过滤掉二层ARP流量功能,拒绝源MAC地址为yyyy-yyyy-yyyy的报文通过私网接口,解决故障。 
    [Huawei] acl number 4444
    [Huawei-acl-L2-4444] rule 5 permit type arp source-mac yyyy-yyyy-yyyy 
    [Huawei-acl-L2-4444] quit
    [Huawei] traffic classifier c1 
    [Huawei-classifier-c1] if-match acl 3001
    [Huawei-classifier-c1] quit
    [Huawei] traffic behavior b1
    [Huawei-behavior-b1] deny
    [Huawei-behavior-b1] quit
    [Huawei] traffic policy p1 
    [Huawei-trafficpolicy-p1] classifier c1 behavior b1 
    [Huawei-trafficpolicy-p1] quit
    [Huawei] interface GE 0/0/0
    [Huawei-GE0/0/0] traffic-policy p1 inbound
    [Huawei-GE0/0/0] quit
    [Huawei] quit

     

公网接口状态异常导致网速慢

背景信息

如果公网接口状态异常,也会导致用户上网慢,例如,接口的双工模式不对。此时,可以参考本节内容,检查下AR设备连接公网的接口状态是否正常。

定位步骤

  1. 假设AR设备连接公网的接口为GE0/0/1,执行命令display interface查看公网接口的信息,关注DuplexTotal ErrorCRCGiants等加粗部分的参数值。 
    <Huawei> display interface GE 0/0/1                                 
    GE0/0/1 current state : DOWN (ifindex: 6)                                       
    Line protocol current state : DOWN                                              
    Description:                                                                    
    Route Port,The Maximum Transmit Unit is 1500,The Maximum Frame Length is 9216   
    Internet Address is 8.255.255.8/24                                              
    IP Sending Frames' Format is PKTFMT_ETHNT_2, Hardware address is 1ce6-39c7-32f8 
    Port Mode:    COMMON COPPER,     Port Split:                         -          
    Speed:                 1000,     Loopback:                        NONE          
    Duplex:                FULL,     Negotiation:                   ENABLE          
    Input Flow-control: DISABLE,     Output Flow-control:          DISABLE          
    Mdi:                   AUTO                                                     
    Last physical up time   : -                                                     
    Last physical down time : 2025-04-18 11:30:03                                   
    Current system time: 2025-04-19 15:52:03                                        
    Statistics last cleared:never                                                   
        Last 300 seconds input rate: 0 bits/sec, 0 packets/sec                      
        Last 300 seconds output rate: 0 bits/sec, 0 packets/sec                     
        Input peak rate 0 bits/sec, Record time: -                                  
        Output peak rate 0 bits/sec, Record time: -                                 
        Input :                  0 bytes,                  0 packets                
        Output:                  0 bytes,                  0 packets                
        Input:                                                                      
          Unicast:                      0,   Multicast:                       0     
          Broadcast:                    0,   Jumbo:                           0     
          Discard:                      0,   Frames:                         --     
          Pause:                        0,   Ignoreds:                        0     
    
          Total Error:                  0                                           
          CRC:                          0,   Giants:                          0     
          Jabbers:                     --,   Fragments:                       0     
          Runts:                        0,   DropEvents:                      0     
          Alignments:                   0,   Symbols:                         0     
    
        Output:                                                                     
          Unicast:                      0,   Multicast:                       0     
          Broadcast:                    0,   Jumbo:                           0     
          Discard:                      0,   Buffers Purged:                  0     
          Pause:                        0                                           
    
          Total Error:                  0                                           
    
        FEC:                                                                        
          FEC Corrected Errors:                      0                              
          FEC Uncorrected Errors:                    0                              
    
        Input bandwidth utilization threshold : 90.00%                              
        Output bandwidth utilization threshold: 90.00%                              
        Last 300 seconds input utility rate:  0.00%                                 
        Last 300 seconds output utility rate: 0.00%

     

  2. 如果在全双工模式下,公网接口的双工模式被协商成了半双工,则公网接口在发送报文时会丢包,从而影响用户的上网速度。此时,可以检查公网接口协商的双工状态是否正确,即Duplex是否为FULL。 
    • 如果发现接口双工模式协商的不对,则可能是设备本身协商错了,也可能是对端接口的速率与本端接口的速率不一致导致。先在公网接口上执行命令speed,修改本端接口的速率和对端相同。
      <Huawei> system-view                                                       
      [Huawei] interface GE 0/0/1
      [Huawei-GE0/0/1] undo negotiation-mode auto
      [Huawei-GE0/0/1] speed 100
    • 速率修改成一致后,如果接口的双工模式仍然协商错误,则可以执行命令duplex full手动配置接口的双工模式为全双工。
      [Huawei-GE0/0/1] duplex full
      [Huawei-GE0/0/1] quit
      [Huawei] quit
    • 如果上述步骤无法解决双工问题,建议直接更换一根确认为好的网线,重新对接端口。

     

  3. 如果接口上存在一些错包计数,即Total ErrorCRC等参数不为0,则说明设备收到了错误报文。设备收到错误报文的原因比较多,可能是使用的线缆类型错误,也可能是对端设备的问题。此时建议收集信息,寻求技术支持,具体请参见收集上网慢故障信息章节。
  4. 如果以上操作都无法解决接口异常问题,则有可能是硬件故障,可以尝试更换一台新的设备解决故障。

双上行出口/多上行出口上网慢故障处理

公网口上收到的报文来回路径不一致

背景信息

在双出口/多出口链路上网场景,为了保证私网用户可以从任意一个公网口上网,每个公网口上都会配置NAT功能。AR的NAT功能会检查公网口上收到报文的来回路径是否一致,即报文从哪个公网口发送出去,对端回复的报文也要从该公网口收到。如果发现某个公网口上收到的报文来回路径不一致,则会丢弃该报文,导致出现上网慢问题。

例如,AR的双上行公网口分别为GE1和GE2,某个报文从GE1口发送出去,回程报文却从GE2口回来,此时,AR会丢弃该回程报文。出现这种报文来回路径不一致的情况,一般都是由对端设备发送报文时路由选择不对引起的。本节内容主要是指导用户如何在AR上定位出是否是因为报文的来回路径不一致引起的上网慢问题。具体的解决办法需要联系对端网络工程师处理,可以检查对端网络的组网或者修改配置等,保证对端设备发出的报文满足源进源出的要求。

定位步骤

  1. 假设AR双上行公网口分别为GE0/0/1上和GE0/0/2,GE0/0/1口的对端设备所在的网络地址为172.16.1.0/24,用户访问该网段的一台主机的IP地址和端口号为172.16.1.254/24和65532。在AR的GE0/0/2口上配置基于ACL对报文流进行过滤功能,即GE0/0/2口上仅允许源IP地址为172.16.1.254/24,源端口号为65532的报文通过。 
    <Huawei> system-view
    [Huawei] acl 3000
    [Huawei-acl4-advance-3000] rule 5 permit tcp source 172.168.1.254 0.0.0.0 source-port eq 65532 
    [Huawei-acl4-advance-3000] quit
    [Huawei] traffic classifier tc1
    [Huawei-classifier-tc1] if-match acl 3000
    [Huawei-classifier-tc1] quit
    [Huawei] traffic behavior tb1
    [Huawei-behavior-tb1] deny
    [Huawei-behavior-tb1] quit
    [Huawei] traffic policy tp1
    [Huawei-trafficpolicy-tp1] classifier tc1 behavior tb1 
    [Huawei-trafficpolicy-tp1] quit
    [Huawei] interface GE 0/0/2
    [Huawei-GE0/0/2] traffic-policy tp1 inbound 
    [Huawei-GE0/0/2] quit

     

  2. 在GE0/0/2上配置完流量统计功能后,执行命令display acl all查看设备上是否有ACL匹配计数。如果有如下粗体部分的记录,说明GE0/0/2口上收到了GE0/0/1口发出去的报文,出现了报文来回路径不一致的情况,需要联系对端网络工程师处理。 
    [Huawei] display acl all                                                         
     Total nonempty ACL number is 1                                     
    
    Advanced ACL 3000, 1 rule                                                       
    Acl's step is 5                                                                 
     rule 5 permit tcp source 172.168.1.254 0 source-port eq 65532 (2 matches)

     

负载分担场景下的用户上网慢

背景信息

在双出口/多出口场景中,链路之间的关系分为负载分担和主备备份两种。负载分担是指同一时刻,多条链路都在转发流量。主备备份表示同一时刻只有一条链路在转发流量,另一条处于备份状态。负载分担可以提高链路使用效率,增加带宽,主要通过配置多条等价路由来实现。主备备份可以提高链路可靠性,主要通过配置多条不同优先级的路由来实现。

不同的企业使用不同的方式,但是在多条质量差别较大的链路间使用负载分担可能会引入上网慢问题。例如,AR将某个用户访问某个网页的报文分配到两条链路上转发,质量较差的链路转发报文慢,且丢包多,必然会影响用户的上网体验。因此,在双出口/多出口场景时,如果遇到负载分担场景下的上网慢问题,可以参考本节内容。

定位步骤

  1. 在AR上执行命令display ip routing-table protocol static查看配置的静态路由表信息。如果路由表内有两条优先级相同的路由分别到不同的下一跳,说明两条路由是等价路由,链路之间是负载分担的关系。 
    <Huawei> display ip routing-table protocol static                                                                        
    Route Flags: R - relay, D - download to fib, T - to vpn-instance, B - black hole route 
    ------------------------------------------------------------------------------  
    _public_ Routing Table : Static                                                 
             Destinations : 2        Routes : 2        Configured Routes : 2        
    
    
    Static routing table status : <Active>                                          
             Destinations : 2        Routes : 2 
    
    
    
    Destination/Mask    Proto   Pre  Cost      Flags NextHop         Interface      
    
            0.0.0.0/0   Static  60   0               172.16.1.2      Unknown        
            0.0.0.0/0   Static  60   0               10.1.1.2        Unknown 

     

  2. 删掉其中一条路由,重新访问网页,检查使用单链路上网时是否会出现上网慢现象。 
    • 如果无,则说明两条链路质量都很好,上网慢并非是等价路由引起的问题,有可能是负载分担算法配置不合理引起的。此时,可以执行命令ip load-balance,配置两条等价路由的负载分担方式。缺省情况下,IP报文基于源IP地址和目的IP地址进行逐流负载分担;TCP或者UDP报文基于源IP地址、目的IP地址、源端口号和目的端口号进行负载分担。
      <Huawei> system-view 
      [Huawei] ip load-balance flow src-ip  //配置基于源IP地址进行逐流负载分担
    • 如果有,说明该条链路质量差。建议执行命令ip route-static,修改该条路由的优先级,使其小于另一条路由的优先级,让该条链路成为备份链路。路由优先级值越大,路由优先级越低。
      [Router] ip route-static 0.0.0.0 0 10.1.1.2 preference 100

     

主备链路场景下的用户上网慢

背景信息

在双出口/多出口场景中,有些企业用户对链路的可靠性要求较高,会同时部署多条链路作为主备链路。这种组网确实可以提高链路可靠性,减少丢包,但不表示一点丢包都没有。当主链路发生故障时,AR会删除NAT表项里该条链路的相关信息,并等待客户端给服务器发送新的建立连接请求。AR则根据客户端发送的连接请求重新建立会话表项。AR重新建立会话表项的时间依赖于客户端和服务器之间的报文交互时间。极端情况下,如果客户端一直不发请求,则网络访问会中断。有些用户不太了解AR建立连接的机制,会误认为出故障了,实际上属于正常上网慢现象。如果遇到主备链路场景下的上网慢问题,可以参考本节内容,检查是否由于重新建立连接引起的。

定位步骤

  1. 在AR路由器上连续多次执行命令display session module nat verbose查看NAT映射表项信息是否有变化。 
    <HUAWEI> display session module nat verbose
       Session Table Information:   
         Protocol           : 6 (TCP)   
         SrcAddr Port VPN   : 192.168.1.2 123 65532
         DestAddr Port VPN  : 192.168.2.1 234 1024
         Time To Live       : 60 s
         NAT Info
           New SrcAddr      : 1.1.1.1
           New SrcPort      : 1000
           New DestAddr     : 1.1.2.1
           New DestPort     : 1001
         Protocol           : 17 (UDP)
         SrcAddr Port VPN   : 192.168.1.2 123 65532
         DestAddr Port VPN  : 192.168.2.2 234  1024
         Time To Live       : 60 s     NAT Info
           New SrcAddr      : 1.1.1.2
           New SrcPort      : 2000
           New DestAddr     : 1.1.2.2
           New DestPort     : 2001
        Total : 2

     

  2. 如果发现NAT表项中“SrcAddr Port Vpn”字段的源端口号发生变化,说明AR设备上重新建立了NAT会话表项,该上网慢是由NAT表项重新建立引起的,属于正常情况,无需额外处理。

收集上网慢故障信息

如果以上步骤均未能解决您的问题,请先按如下步骤收集相关信息,然后寻求技术支持。

  1. 收集故障相关信息
    • 一键式收集设备的所有诊断信息并导出文件。
      1. 在用户视图下,执行display diagnostic-information file-name命令,采集设备诊断信息并保存为文件。

        <Huawei> display diagnostic-information dia-info.txt
          This operation will take several minutes, please wait.........................
        ..................................................................              
        Info: The diagnostic information was saved to the device successfully..
      2. 当诊断信息文件生成之后,您可以通过TFTP、FTP和SFTP方式将其从设备上导出,详细操作可参考文件系统管理配置
        • 您可以在用户视图下执行dir命令,确认文件是否正确生成。

        • 您也可以直接执行display diagnostic-information命令,并通过终端日志存盘方式获取设备诊断信息文件。

        • 若输出诊断信息过长,可以按Ctrl+C停止。

        • 此命令主要用于问题定位,搜集系统诊断信息,搜集时可能会影响系统的性能(例如CPU占用率升高等)。因此,在系统正常运行时不建议执行此命令。

        • 严禁在连接到设备的多个终端上同时执行display diagnostic-information命令,否则可能造成设备的CPU占用率明显增高,导致设备性能下降。

    • 收集设备的日志和告警信息并导出文件。
      1. 在用户视图下,执行save logfile命令,将缓冲区的日志和告警信息保存为文件。

        <Huawei> save logfile
        Info: Save log file successfully.
      2. 当日志和告警文件生成之后,您可以通过TFTP、FTP、SFTP方式将其从设备上导出。

        您也可以直接执行display logbufferdisplay trapbuffer命令查看设备的日志和告警信息,并通过终端日志存盘方式获取日志和告警信息文件,操作方法与设备诊断信息文件的获取方式相同。

  2. 寻求技术支持

    请参考如下网页链接信息http://e.huawei.com/cn/how-to-buy/contact-us,寻求技术支持。

    在技术支持过程中,请按技术支持人员的指导,将收集的所有信息和文件完整提交,方便技术支持人员进行问题定位。

阅读剩余
THE END