【网络工程】网络故障—01-故障排除概述.docx
《【网络工程】网络故障—01-故障排除概述.docx》由会员分享,可在线阅读,更多相关《【网络工程】网络故障—01-故障排除概述.docx(44页珍藏版)》请在三一办公上搜索。
1、华为中低端路由器故障处理手册目 录目 录第1章 故障排除技术概述1-11.1 网络故障排除技术概览1-11.1.1 在当今日益复杂的网络中进行故障排除1-11.1.2 网络故障的一般分类1-21.1.3 一般网络故障的解决步骤1-21.2 华为中低端路由器产品介绍1-61.1.1 Quidway R1600系列低端路由器1-61.1.2 Quidway R2500/4000系列低端路由器1-61.1.3 Quidway R1700系列低端路由器1-61.1.4 Quidway R2600系列和R3600系列中端路由器1-61.3 路由器常用诊断工具介绍1-61.3.1 Ping命令1-61.1
2、.2 Tracert 命令1-61.1.3 Show命令1-61.1.4 Clear命令1-61.1.5 Debug命令1-61.4 故障排除常用方法1-61.4.1 分层故障排除法1-61.1.2 分块故障排除法1-61.1.3 分段故障排除法1-61.1.4 替换法1-61.5 故障排除对网络维护和管理人员的要求1-61.5.1 对协议要求有精深的理解1-61.5.2 能够引导客户详细描述出故障现象和相关信息1-61.5.3 充分了解自己所管理和维护的网络1-61.5.4 及时进行故障排除的文档记录和经验总结1-61.6 华为数据通信产品故障排除资源1-61.1.1 Huawei Data
3、comm Online1-61.1.2 Huawei Technical Support1-61-43华为中低端路由器故障处理手册第1章 故障排除技术概述第1章 故障排除技术概述1.1 网络故障排除技术概览1.1.1 在当今日益复杂的网络中进行故障排除当今的网络互连环境是复杂的,而且其复杂性的日益增长也是可以预见的,主要原因如下: 现代的互连网络要求支持更广泛的应用,包括数据、语音、视频及它们的集成传输; 新业务发展使网络带宽的需求不断增长,这就要求新技术的不断出现。例如:十兆以太网向百兆、千兆以太网的演进;MPLS技术的出现;提供QoS能力等。l 新技术的应用同时还要兼顾传统的技术。例如,传
4、统的SNA体系结构仍在某些场合使用,DLSw作为通过TCP/IP承载SNA的一种技术而被应用。图1-1 多样业务的需求和各种先进技术的引入使网络日益复杂因此,现代的互连网络是协议、技术、介质和拓扑的混合体。互连网络环境越复杂,意味着网络的连通性和性能故障发生的可能性越大,而且引发故障的原因也越发难以确定。同时,由于人们越来越多的依赖网络处理日常的工作和事务,一旦网络故障不能及时修复,其所造成的损失可能很大甚至是灾难性的。能够正确地维护网络尽量不出现故障,并确保出现故障之后能够迅速、准确地定位问题并排除故障,对网络维护人员和网络管理人员来说是个挑战,这不但要求他们对网络协议和技术有着深入的理解,
5、更重要的是要建立一个系统化的故障排除思想并合理应用于实际中,以将一个复杂的问题隔离、分解或缩减排错范围,从而及时修复网络故障。本书着眼于帮助网络维护人员和管理人员将他们所掌握的知识有条理的应用于诊断和排除网络故障的过程中;帮助他们针对各种网络环境中的常见故障现象进行定位和解决。1.1.2 网络故障的一般分类网络故障一般分为两大类:连通性问题和性能问题。它们各自故障排除的关注点如下: 连通性问题硬件、媒介、电源故障 配置错误 不正确的相互作用 性能问题 网络拥塞 到目的地不是最佳路由 供电不足 路由环路 网络错误 1.1.3 一般网络故障的解决步骤故障排除系统化是合理地一步一步找出故障原因并解决
6、的总体原则。它的基本思想是系统地将由故障可能的原因所构成的一个大集合缩减(或隔离)成几个小的子集,从而使问题的复杂度迅速下降。故障排除时有序的思路有助于解决所遇到的任何困难,下图给出了一般网络故障解决的处理流程。& 说明:该处理流程是网络维护人员所能够采用的排错模型中的一种,如果你根据自己的经验和实践总结了另外的排错模型并证明是行之有效的,请继续使用它-网络故障解决的处理流程是可以变化的,但故障排除有序化的思维模式是不可变化的。图1-2 网络故障排除基本步骤下面我们以一个故障排除的实例来学习如何应用这些步骤。案例:用户网段广播包过多造成该网段的服务器FTP业务传输速度慢该案例组网图如下:某校园
7、网的三个局域网,其中10.11.56.0为一个用户网段,10.11.56.118为一个日志服务器;10.15.0.0是一个集中了很多应用服务器的网段。图1-3 用户网段广播包过多造成该网段的服务器FTP业务传输速度慢1. 故障现象描述要想对网络故障做出准确的分析,首先应该了解故障表现出来的各种现象,然后才能确定可能产生这些现象的故障根源或症结。因此,对网络故障做出完整、清晰的描述是重要的一步。如上述案例,用户反映:“日志服务器与备份服务器间备份发生问题。”这就是一个不完整不清晰的故障现象描述。因为这个描述没有讲述清楚下列问题:l 这个问题是连续出现,还是间断出现的?l 是完全不能备份,还是备份
8、的速度慢(即性能下降)?l 哪个或哪些局域网服务器受到影响,地址是什么?正确的故障现象描述是:在网络的高峰期,日志服务器10.11.56.11到集中备份服务器10.15.254.253之间进行备份时,FTP传输速度很慢,大约是0.6Mbps。2. 故障案例相关信息收集本步骤是搜集有助于查找故障原因的更详细的信息。主要是三种途径:l 向受影响的用户、网络人员或其他关键人员提出问题;l 根据故障描述性质,使用各种工具搜集情况,如网络管理系统、协议分析仪、相关show和debug命令等;l 测试性能与网络基线进行比较。如上述案例,可以向用户提问或自行收集下列相关信息:l 网络结构或配置是否最近修改过
9、,即问题出现是否与网络变化有关?l 是否有用户访问受影响的服务器时没有问题?l 在非高峰期日志服务器和备份服务器间FTP传输速度是多少?通过该步骤,我们收集到了下面一些相关信息:l 最近10.11.56.0网段的客户机不断在增加;l 129.9.0.0网段的机器与备份服务器间进行FTP传输时速度正常为7Mbps,与日志服务器间进行FTP传输时速度慢,只有0.6Mbps;l 在非高峰期日志服务器和备份服务器间FTP传输速度正常,大约为6Mbps;3. 经验判断和理论分析利用前两个步骤收集到的数据,并根据自己以往的故障排除经验和所掌握的互连网络设备和协议的知识,来确定一个排错范围。通过范围的划分,
10、就只需注意某一故障或与故障情况相关的那一部分产品、介质和主机。如上述案例:我们现在能够确定是一个网络性能下降问题。那么,是网段10.11.56.0的性能问题?是中间网云的性能问题?是10.15.0.0网段的性能问题呢?由于129.9.0.0网段的机器与备份服务器间进行FTP传输时速度正常为7Mbps这一事实,我们可以排除掉10.15.0.0网段的性能问题。4. 各种可能原因列表该步骤列出根据经验判断和理论分析后总结的各种可能原因。如上述案例,可能原因如下:(1) 网段10.11.56.0的性能问题,其子原因可能为:l 日志服务器A的性能问题l 10.11.56.0网络的网关性能问题l 10.1
11、1.56.0网络本身的性能问题(2) 网云性能问题,主要是到网络10.15.0.0的路由不是最佳路由5. 对每一原因实施排错方案根据所列出的可能原因制定故障排查计划,分析最有可能的原因,确定一次只对一个变量进行操作,这种方法使你能够重现某一故障的解决办法。如果有多个变量同时被改变,而问题得以解决,那么如何判断哪个变量导致了故障发生呢?& 说明:我们在对故障处理流程5、6、7步骤介绍完毕后,再继续进行上述实例案例的排错步骤介绍。6. 观察故障排查结果当我们对某一原因执行了排错方案后,需要对结果进行分析,判断问题是否解决,是否引入了新的问题。如果问题解决,那么就可以直接进入文档化过程;如果没有解决
12、问题,那么就需要再次循环进行到故障排查过程。7. 循环进行故障排查过程当实施了一个方案没有达到预期的排错目的时,我们进入到该步骤这是一个努力缩小可能原因的清单过程。在进行下一循环之前必须做的事情就是将网络恢复到实施上一方案前的状态。如果保留上一方案对网络的改动,很可能导致新的问题,例如:假设修改了访问列表但没有产生预期的结果,此时如果不将访问列表恢复到原始状态,就会导致出现不可预期的结果。循环排错可以有两个切入点:l 当针对某一可能原因的排错方案没有达到预期目的,循环进入下一可能原因制定排错方案并实施;l 当所有可能原因列表的排错方案均没有达到排错目的,重现进行故障相关信息收集以分析新的可能原
13、因。如上述案例,我们在列出了可能原因列表后,开始制定方案进行故障排除。(1) 可能原因1:“网络10.11.56.0到网络10.15.0.0的路由不是最佳路由”制定的方案:在10.11.56.0网段的网关上使用“Tracert 10.15.245.253”命令,发现探测报文返回时长仅为10ms,表明该可能原因并不是造成故障的原因。我们进入循环排错过程。(2) 可能原因2:“日志服务器A的性能问题”制定的方案:测试同一网段的主机C和日志服务器间的FTP传输速度,是6Mbps,正常。可见问题与服务器A无关。(3) 可能原因3:“10.11.56.0网络的网关性能问题”制定的方案:测试主机C和备份服
14、务器B间FTP传输速度是7Mbps,正常。排除了网关因素,因为B、C在不同网段上而速度正常。(4) 可能原因3:“10.11.56.0网络本身的性能问题”制定的方案:在网段10.11.56.0的以太网交换机上使用命令“Show mac”,输出如下:Port Rcv-Unicast Rcv-Multicast Rcv-Broadcast- - - -6/32 10317812 0 8665Port Xmit-Unicast Xmit-Multicast Xmit-Broadcast- - - -6/32 6667987 286652 2474038(输出的广播:输出的单播比例为1:3,太大了。)
15、Port Rcv-Octet Xmit-Octet- - - 6/32 14094829358 1516443041在网段10.15.0.0上的以太网交换机上使用命令“Show mac”输出如下:Port Rcv-Unicast Rcv-Multicast Rcv-Broadcast- - - -6/36 55780287 0 285Port Xmit-Unicast Xmit-Multicast Xmit-Broadcast- - - -6/36 27879749 190257 119430(广播:单播比例1:270,属于正常。)Port Rcv-Octet Xmit-Octet- - -6
16、/36 67172587081 4998816809由此知道,网段10.11.56.0上广播包和单播包比例为1:3,确实太大了。再次询问用户该网段主要运行的业务是什么,从而得出了故障最终原因如下:10.11.56.0是普通用户网段,由于业务原因每个用户需要发送大量广播包和多播包,随着近期越来越多的用户接入该网络,在这个网段上的服务器需要花费更多的资源来处理越来越多的广播和多播包,因此其服务的传输速度自然减慢。由于这是一个网络布局不恰当的问题,于是重新安排服务器的位置,将服务器移动10.15.0.0网段后,故障排除。8. 故障排除过程文档化当最终排除了网络故障后,那么排除流程的最后一步就是对所做
17、的工作进行文字记录。文档化过程决不是一个可有可无的工作,原因如下:l 文档是排错宝贵经验的总结,是 “经验判断和理论分析”这一过程中最重要的参考资料;l 文档记录了这次排错中网络参数所做的修改,这也是下一次网络故障应收集的相关信息。文档记录主要包括以下几个方面:l 故障现象描述及收集的相关信息l 网络拓扑图绘制l 网络中使用的设备清单和介质清单l 网络中使用的协议清单和应用清单l 故障发生的可能原因l 对每一可能原因制定的方案和实施结果l 本次排错的心得体会l 其他:如排错中的使用的参考资料列表等请读者对照上述案例完成文档记录工作。1.2 华为中低端路由器产品介绍如图1-2所示,Quidway
18、系列路由器依托华为公司拥有自主知识产权的VRP(Versatile Routing Platform,通用路由平台)软件平台,使用高性能的处理器、总线技术及快速路由策略,为电信、专网、ISP、金融、税务、公安、铁路等行业用户和大中型企业用户提供从中低端、高端到核心端的全方位的网络解决方案。图1-4 华为IP网络产品线Quidway NetEngine80是面向电信级运营网络及骨干核心网络的GSR路由器,以满足核心网络高速转发数据的需求并实现不同业务的不同级别服务。Quidway NetEngine16/08是面向运营级核心网络的高端网络产品,是具有高性能、高可靠性、高可扩展性、多业务的边缘交换
19、层的高端路由器。本书所举的故障排除案例分析主要是针对Quidway中低端路由器的系列产品,下面将详细介绍一下华为中低端路由器系列产品的特性。华为中低端路由器产品主要包括: Quidway 1600系列低端路由器 Quidway 2500系列低端路由器 Quidway 1700系列低端路由器 Quidway 2600系列中端路由器 Quidway 3600系列中端路由器1.2.1 Quidway R1600系列低端路由器Quidway R1600系列路由器包括R1602、R1603和R1604三款路由器, 是华为公司面向家庭办公、小型办公室(SOHO)开发的新一代路由器产品,主要应用于企业上网、
20、家庭办公、公司远程机构互连和Internet上网等。Quidway R1602路由器定位为桌面级远程分支路由器。采用M68360 33M RISC CPU;提供1个10Base-T、2个同/异步串口(可达2Mbps)、1个AUX口。Quidway R1603/1604路由器定位为桌面级分支ISDN接入路由器。采用M68360 33M RISC CPU;提供1个10Base-T、1个ISDN BRI接口(R1603提供BRI S/T接口,R1604提供BRI U接口)、1个同/异步串口(可达2Mbps)、1个AUX口和2个模拟电话接口。1.2.2 Quidway R2500系列低端路由器Quid
21、way R2500系列路由器包括R2501/2501E、R2509/2509E、 R2511/2511E、 R4001/4001E八款路由器。是华为公司面向中、小型办公室开发的新一代路由器产品,主要应用于电信记费、电信网管、机构互连、Internet访问、电信设备配套IP接入网关等。Quidway R2501路由器定位为网络远程分支路由器。采用M68360 25M RISC CPU;提供1个10Base-T、1个以太网口、2个高速同/异步串口、1个AUX口。Quidway R2509/R2511路由器定位为网络远程分支接入路由器。采用M68360 33M RISC CPU;提供1个10Base
22、-T、1个以太网口、2个高速同/异步串口、1个AUX口、1/2个8异步串行口;可作为小企业PSTN接入服务器。Quidway R4001路由器定位为企业级分支路由器。采用M68360 33M RISC CPU;提供1个10Base-T;1个AUI口;1个高速同/异步串口、1个AUX口、1个E1/CE1/PRI接口。可作为企业ISDN接入服务器使用;它是以低端产品价格提供E1接口的路由器,具有超高性价比。Quidway R2500E系列路由器(R2501E、R2509E、R2511E、R4001E)内置一个接口插槽,可以插入128位以上硬件序列码加密的加密板,升级为一台高性能边缘加密路由器。应用
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 网络工程 网络故障 01 故障 排除 概述
链接地址:https://www.31ppt.com/p-2014018.html