故障定位步骤:
步骤1:检查配置
检查交换机上端口配置、VLAN配置、VLANIF接口配置、IP地址配置是否正确,首先排除配置问题;确认两端端口的端口类型,两端VLAN的封装方式是否一致,VLANIF接口下IP地址配置的网段是否存在问题。
步骤2:检查链路
检查物理链路:
1)光纤或网线连接的端口需要和网络要求的部署一致。
2)光纤所带的光模块波长参数需要一致,光模块建议使用华为认证光模块。
3)如果是通过Eth-Trunk接口连接,两端设备上Eth-Trunk中加入的物理成员端口数量需要保持一致;若Eth-Trunk启用LACP协议,需要保证LACP协议状态稳定。
4)检查两端设备之间是否有传输设备,两端的物理端口是否处于UP状态。
5)确认Ping业务经过的物理端口是否存在CRC校验错误,且错误计数是否在不断增长。
检查物理端口是否存在阻塞现象。检查设备上是否运行了STP、RRPP或SMART LINK等二层协议,确认Ping业务经过的物理端口是否被阻塞。
步骤3:检查路由
检查设备上是否存在到Ping目的地址的路由。
• 如果和交换机连接的是终端设备,检查终端设备上是否配置了正确的网关地址。
• 如果和交换机连接的是交换机或路由设备,检查对端设备上是否有正确的回程路由。
参考命令:display ip routing-table
如果路由不正常,检查接口协议状态是否UP,设备上运行的路由协议是否正常,排查路由故障。
步骤4:检查ARP表项
1、检查直连地址的ARP是否学习正常。
相关命令:
1 | display arp |
2、如果ARP学习正确,查看MAC表项,确认MAC地址的出端口和ARP的物理出端口是否一致。
相关命令:
1 | display mac-addressmac-address |
3、如果ARP学习不到,排查ARP故障,步骤如下:
1)检查设备上是否使能严格ARP学习,若配置将其去使能后观察能否正常学习ARP。
2)在不能互相学习ARP的两端设备的其中一端执行长Ping操作,命令行如下:
1 | ping -c 100000ip-address |
也可视情况添加-t/-m等参数将Ping的速率适当调整。
3)长ping操作会不断触发本端设备发出ARP请求报文,可通过流量统计确认ARP请求报文是否从端口送出。
4)通过流量统计检查对端设备的物理端口是否收到了ARP请求报文。若收到ARP请求,查看是否能生成ARP表项,并是否能回应ARP-REPLY;若收到请求未生成表项,联系华为工程师处理。
5)同样可采用流量统计方法确认ARP-REPLY报文是否从对端设备物理口发出。若未发出,联系华为工程师处理。
6)检查本端设备是否收到ARP-REPLY报文,若物理端口上收到ARP-REPLY但没有上送CPU,联系华为工程师处理。
ARP请求和ARP回应报文的流量统计配置,示例如下:
也可视情况添加-t/-m等参数将Ping的速率适当调整。
3)长ping操作会不断触发本端设备发出ARP请求报文,可通过流量统计确认ARP请求报文是否从端口送出。
4)通过流量统计检查对端设备的物理端口是否收到了ARP请求报文。若收到ARP请求,查看是否能生成ARP表项,并是否能回应ARP-REPLY;若收到请求未生成表项,联系华为工程师处理。
5)同样可采用流量统计方法确认ARP-REPLY报文是否从对端设备物理口发出。若未发出,联系华为工程师处理。
6)检查本端设备是否收到ARP-REPLY报文,若物理端口上收到ARP-REPLY但没有上送CPU,联系华为工程师处理。
ARP请求和ARP回应报文的流量统计配置,示例如下:
1 | [huawei] traffic classifier aa operator and//配置流分类 |
Tips:对应ARP请求报文,目的MAC需要匹配广播MAC(FFFF-FFFF-FFFF),源MAC匹配发送端设备的MAC;对于ARP回应报文,目的MAC匹配对端MAC,源MAC匹配本设备MAC。上面的数据仅是举例,实际故障定位中需要按照这个原则替换。
1 | [huawei]traffic behavior bb //配置流行为 |
步骤5:检查报文收***况
Ping不通问题或Ping有丢包问题的定位关键主要是确认报文丢在哪里了,可以通过如下几个方式进行确认。
1、ICMP统计
进行Ping操作时,通过命令display icmp statistics查看ICMP报文的收***况,echo和echo reply报文收发是否一致,是否存在checksum错误统计计数。
reset ip statistics命令用来清除统计计数。
1 | <HUAWEI> display icmp statistics |
2、IP层调试开关
这一层调试开关需要定义ACL匹配Ping报文,即源IP、目的IP地址,进行Ping操作同时打开IP层调试开关,观察报文的收***况。
配置命令如下:
\
1 | # |
下面举例说明:
如:ping 7.8.20.5
1 | PING 7.8.20.5: 56 data bytes, press CTRL_C to break*0.55569503 L3FC-4 IP/7/debug_case:Sending, interface = Vlanif20, version = 4, headlen = 20, tos = 0,pktlen = 84, pktid = 35000, offset = 0, ttl = 255, protocol = 1,checksum = 64727, s = 7.8.20.4, d = 7.8.20.5prompt: Sending the packet from local at Vlanif20 |
3、CPCAR统计
查看CPCAR的统计情况,检查ICMP报文是否被car掉了。相关命令:
大S V100R002版本、小S V100R005版本:display cpu-defend icmp statistics all
大S V100R003及之后、小S V100R006及之后的版本:display cpu-defend statistics packet-type icmp all
主要关注Drop计数是否在增加。如果Drop计数在增加,说明存在CPCAR丢包,可以适当增加car值再进行Ping测试,看问题是否解决。最后建议恢复car值。
4、流量统计
配置流量统计,确认报文的收***况。定义流分类时需要匹配到Ping的源IP和目的IP,其他配置同ARP报文的统计。
配置完成后,执行Ping命令,查看流量统计情况。相关命令:
display traffic policy statistics interface GigabitEthernet 0/0/1 inbound
display traffic policy statistics interface GigabitEthernet 0/0/1 outbound
如果outbound方向没有统计计数,说明报文没有发送出去;如果inbound方向没有统计计数,说明没有收到应答报文。
5、配置镜像查看报文收*况
通过镜像来确认报文的收**况。
如果端口上流量不大,可以直接用端口镜像;
如果端口上流量较大,可以使用流镜像。
通过对镜像报文进行分析,不仅可以确认报文的收况,同时可以对报文进行校验,包括:报文的VLAN是否正确、报文的目的MAC地址是否是设备系统MAC地址、报文IP头的checksum是否正确、ICMP的checksum是否正确。
- 本文链接:https://zeozzz.github.com/2019/07/15/63/
- 版权声明:本博客所有文章除特别声明外,均默认采用 许可协议。