网络故障排除.ppt
Chapter 14 网络故障排除,华为网络技术培训中心,学习目标,描述故障排除的基本方法和步骤掌握故障排除常用工具软件的使用分析处理基本的网络故障问题,学习完本课程,您应该能够:,课程内容,网络故障排除模型故障排除工具典型故障排除案例小结,网 络 现 状,支持包括数据、音频和视频集成传输的综合应用新技术不断出现现代网络与传统网络的共存,对网络管理人员的要求,目前互联网络技术、拓扑和应用的复杂性决定了网络管理人员必须:确保网络尽量稳定运行掌握故障排除方法熟悉各种协议可能故障点,迅速定位排除故障,网络故障的一般分类,连通性问题硬件、媒介、电源故障软件配置错误兼容性问题性能问题网络拥塞供电不足路由环路,一般故障的解决步骤,分层故障排除法,主要关注:电缆、连接 头、信号电平、编码、时钟和组帧,负责介质的连接,分层故障排除法,主要关注:端口的状态,协议是为UP,则为链路层工作正常。同时和利用率也有关。,封装的不一致,分层故障排除法,主要关注:地址和子网掩码是否正确,路由协议配置是否正确。排除时沿着源到目的地的路径查看路由表。同时检查接口的IP地址。,分段打包和重组及差错报告,分层故障排除法,主要关注:网络终端的高层协议,以及终端设备软硬件运行良好。,负责端到端的数据,分块故障排除法,配置文件可分为以下几块:管理部分(路由器名称、口令、服务、日志等)端口部分(位址、封装、cost、认证等)路由协议部分(静态路由、RIP、OSPF、BGP、路由引入等)策略部分(路由策略、策略路由、安全配置等)接入部分(主控制台、Telnet登录或哑终端、拨号等)其他应用部分(语言配置、VPN配置、Qos配置等可以把故障归入上述一类或几类,分段故障排除法,把网络分段,逐段排除故障主机到路由器LAN接口的这一段路由器到CSU/DSU界面的这一段CSU/DSU到电信部门界面的这一段WAN电路CSU/DSU本身问题路由器本身问题,替换法,替换法是检查硬件问题最常用的方法当怀疑是网线问题时,更换一根确定是好的网线试一试;当怀疑是接口模块有问题时,更换一个其它接口模块试一试 在实际网络故障排错时,可以先采用分段法确定故障点,再通过分层或其它方法排除故障,课程内容,网络故障排除模型故障排除工具典型故障排除案例小结,常用故障诊断命令,华为网络设备故障诊断主要有以下命令:ping命令tracert命令display命令reset命令debugging命令,Ping命令,Ping命令简介VRP平台的ping命令Windows平台的ping命令案例:使用大包ping对端进行MTU不一致的故障排除,Tracert命令,Tracert命令简介VRP平台的tracert命令Windows平台的tracert命令案例:使用tracert命令定位不当的网络配置点,故障排除常用display命令,display versiondisplay current-configurationdisplay saved-configuration display interface,display version,Quidwaydisplay versionHuawei Versatile Routing Platform SoftwareVRP(tm)Software,Version 3.10Copyright(c)2000-2002 HUAWEI TECH CO.,LTD.Quidway S3526 3526-002Quidway S3526 uptime is 0 weeks,0 days,0 hours,21 minutesQuidway S3526 with 1 MPC 8240 Processor 64M bytes DRAM8192K bytes Flash MemoryConfig Register points to FLASHHardware Version is REV.0CPLD Version is CPLD 002Bootrom Version is 360Subslot 0 24 FE Hardware Version is REV.0,display current-configuration,显示当前设备配置文件信息把启动配置文件存放到路由器以外的其他设备上 使维护人员能够迅速配置一个替代的路由器 将该配置文件通过E-mail形式发给华为技术支持人员以帮助定位配置问题,display interfaces,Quidwaydisplay interfaces serial 0Serial0 is up,line protocol is up physical layer is synchronous,baudrate is 64000 bps interface is DCE,clock is DCECLK,cable type is RS232 Maximum Transmission Unit is 1500 Internet address is 1.1.1.1 255.255.255.0 Link-protocol is PPP LCP opened,IPCP initial,IPXCP initial,CCP initial,BRIDGECP initial 5 minutes input rate 0.00 bytes/sec,0.00 packets/sec 5 minutes output rate 0.00 bytes/sec,0.00 packets/sec Input queue:(size/max/drops)0/50/0 FIFO queueing:FIFO Output queue:(size/max/drops)FIFO:0/75/0 input packets:8,bytes:108,no buffers:0 output packets:8,bytes:108,no buffers:0 input errors:0,CRC:0,frame errors:0 overrunners:0,aborted sequences:0,input no buffers:0 DCD=UP DTR=UP DSR=UP RTS=UP CTS=UP,reset,reset:清空当前的统计信息 reset counters interface reset ip counters,debugging命令,debugging命令概述获得路由器中交换的报文和帧的细节信息 用于调试信息debugging命令使用注意事项 不使用debug命令监控正常的网络运行在网络使用的低峰期使用不要轻易使用类似debugging all之类的命令 使用debugging命令后,应立即以“undo debugging”命令终止debugging命令的执行。display和debugging命令配合使用,华为Quidview故障管理功能,告警实时监视,提供告警声光提示,支持外接告警箱支持告警转到Email,手机短信支持告警过滤,让用户关注重要的告警,查询结果可生成报表支持告警基极别重新定义,支持告警转存,保证系统的运行效率和稳定性支持告警拓扑定位,将显示的焦点定位到产生选定告警的拓扑对象。支持告警相关性分析,包括屏蔽重复告警、屏蔽闪断告警、屏蔽root-cause告警等。,课程内容,网络故障排除模型故障排除工具典型故障排除案例小结,案例:广播流量引起的FTP业务问题,10.11.56.0为一个用户网段;10.11.56.118为一个日志服务器;10.15.0.0是一个集中了很多应用服务器的网段。用户反映:日志服务器与10.15.0.0/16网段的备份服务器间备份发生问题!,案例:广播流量引起的FTP业务问题,故障现象描述如何描述故障现象这个问题是连续出现,还是间断出现的?是完全不能备份,还是备份的速度慢(即性能下降)?哪个或哪些局域网服务器受到影响,地址是什么?正确故障描述在网络的高峰期,日志服务器10.11.56.11到集中备份服务器10.15.254.253之间进行备份时,FTP传输速度很慢,大约是0.6Mbps。,案例:广播流量引起的FTP业务问题,故障相关信息收集:信息收集途径向受影响的用户、网络人员或其他关键人员提出问题;根据故障描述性质,使用各种工具搜集情况,如网络管理系统、协议分析仪、相关show和debug命令等;测试性能与网络基线进行比较。收集到以下信息最近10.11.56.0网段的客户机不断在增加;129.9.0.0网段的机器与备份服务器间进行FTP传输时速度正常为7Mbps,与日志服务器间进行FTP传输时速度慢,只有0.6Mbps;在非高峰期日志服务器和备份服务器间FTP传输速度正常,大约为6Mbps。,案例:广播流量引起的FTP业务问题,经验判断和理论分析各种可能原因列表日志服务器A的性能问题;10.11.56.0网络的网关性能问题;10.11.56.0网络本身的性能问题;网云性能问题。,案例:广播流量引起的FTP业务问题,对每一原因实施排错方案观察故障排除结果循环进行故障排除过程:当针对某一可能原因的排错方案没有达到预期目的,循环进入下一可能原因制定排错方案并实施;当所有可能原因列表的排错方案均没有达到排错目的,重现进行故障相关信息收集以分析新的可能原因。案例可能故障循环分析定位故障:最近大量用户加入导致网段10.11.56.0上广播包过多;排除故障:把日志服务器移到10.15.0.0/16网段。,案例:广播流量引起的FTP业务问题,故障排除过程文档化故障现象描述及收集的相关信息;网络拓扑图绘制;网络中使用的设备清单和介质清单;网络中使用的协议清单和应用清单;故障发生的可能原因;对每一可能原因制定的方案和实施结果;本次排错的心得体会;其他:如排错中使用的参考资料列表等。,小结,网络故障排除是一项重要的工作网络排错方法有分层故障排除法、分段故障排除法、分块故障排除法和替换法等熟悉使用故障排除常见工具,包括网络设备自带的软件诊断工具,以及华为的网络管理工具等通过案例分析和实验,初步掌握网络设备常见故障现象的排除方法。,