H3CSR66系列路由器维护与故障处理.ppt
《H3CSR66系列路由器维护与故障处理.ppt》由会员分享,可在线阅读,更多相关《H3CSR66系列路由器维护与故障处理.ppt(92页珍藏版)》请在三一办公上搜索。
1、ISSUE 1.0,日期:2008.4.26,杭州华三通信技术有限公司 版权所有,未经授权不得使用与传播,H3C SR66维护与故障处理,SR66出了问题应该如何处理网络中常见的故障有哪些,了解网络故障诊断的一般方法了解SR66常用信息搜集方法掌握SR66日常维护方法掌握NSR66常见故障处理方法,课程目标,学习完本课程,您应该能够了解:,网络故障处理概述信息采集方法设备日常维护具体故障处理方法案例与FAQ,目录,网络故障处理的概念,网络故障处理是一门综合性技术,涉及网络技术的方方面面。故障处理是指网络中的某台或某些台设备发生故障后,用户在设备供应商提供的相关故障处理手册的指导下,很快定位出具
2、体的故障原因并快速恢复业务。故障诊断,是从故障现象出发,以网络诊断工具为手段获取诊断信息,确定网络故障点,查找问题的根源,排除故障,使网络故障恢复到正常运行状态。,网络故障分类及原因,连通性问题硬件、媒介、电源故障配置错误兼容性问题性能问题网络拥塞到目的地不是最佳路由供电不足路由环路其他网络错误,网络故障处理的一般步骤,故障信息收集观察设备状态相关命令故障定位故障原始信息、指示灯状态、日志告警信息分析仪器仪表辅助分析性能统计辅助分析测试活动辅助分析(如环回操作、对比/互换、倒换/复位)故障排除检修线路更换单板修改配置数据倒换系统、复位单板、复位系统,网络故障处理概述信息采集方法设备日常维护具体
3、故障处理方法案例与FAQ,目录,设备故障信息收集故障现象描述,Who?谁出了问题?是单个用户、一组存在共性的用户还是网络中的所有用户?What?是什么问题?是连通性问题,还是性能差的问题?如果是连通性问题,是完全连通性问题?还是部分连通性问题?When?何时产生的?是间歇性问题,还是经常发生的问题,或者是刚刚发生的问题?Where?何处出现的?故障发生在核心区域、边缘区域还是接入区域?,设备故障信息确认,诊断命令ping、tracert命令display命令debugging命令在使用debugging命令时要慎重,选择各种参数进行过滤,减少无用的诊断信息。而且在分析完后,一定要使用undo
4、debugging命令关闭调试信息开关网络管理工具网管软件测试仪器其它故障诊断工具,Ping命令,Ping命令简介Comware平台的ping命令Windows平台的ping命令案例:使用大包ping对端进行MTU不一致的故障排除,Tracert命令,Tracert命令简介Comware平台的tracert命令Windows平台的tracert命令案例:使用tracert命令定位配置不当的网络点,设备面板指示灯,主控板面板指示灯,RUN(绿色)常灭无电源输入或者主控板故障 慢闪(1Hz)正常工作状态 快闪(8Hz)正在加载应用软件ACT(绿色)常灭主控板处于备用状态 常亮主控板处于主用状态AL
5、M(红色)常灭系统运行正常,无任何告警 常亮系统出现故障,需要立即查看系统日志 快闪(8Hz)系统出现严重故障,需要立即处理,SR66的版本和配置信息,=display version=H3C Comware Platform SoftwareComware Software,Version 5.20,Beta 2107Copyright(c)2004-2007 Hangzhou H3C Tech.Co.,Ltd.All rights reserved.H3C SR6602 uptime is 0 week,0 day,0 hour,5 minutes CPU type:RMI XLR732
6、1000MHz 1024M bytes DDR2 SDRAM Memory 4M bytes Flash Memory PCB Version:Ver.B Logic Version:1.0 Basic BootWare Version:1.10 Extend BootWare Version:1.15 FIXED PORT CON(Hardware)Ver.B,(Driver)1.0,(Cpld)1.0 FIXED PORT AUX(Hardware)Ver.B,(Driver)1.0,(Cpld)1.0 FIXED PORT GE 0/0(Hardware)Ver.B,(Driver)1.
7、0,(Cpld)1.0 FIXED PORT GE 0/1(Hardware)Ver.B,(Driver)1.0,(Cpld)1.0 FIXED PORT GE 0/2(Hardware)Ver.B,(Driver)1.0,(Cpld)1.0 FIXED PORT GE 0/3(Hardware)Ver.B,(Driver)1.0,(Cpld)1.0 SUBSLOT 1 The SubCard is not present SUBSLOT 2 The SubCard is not present,诊断信息和日志,设备诊断信息display diagnostic-information设备日志d
8、isplay logbuffer显示当前配置display current-configuration,异常情况需要收集的信息,故障情况详细说明诊断信息(display diagnostic)登陆方式,网络故障处理概述信息采集方法设备日常维护具体故障处理方法案例与FAQ,目录,设备日常维护,在设备的正常运行过程中,为及时发现并消除设备所存在的隐患或缺陷、维持设备的良好运转,从而使系统能够长期安全、稳定、可靠地运行而对设备进行的定期检查与保养,设备日常维护,机房环境温度、湿度、清洁度设备环境设备温度、电压、清洁等日志和告警是否有大量日志和告警?设备运行状况电源、风扇、告警灯、CPU占用率、异常流
9、量、链路不稳定业务运行路由表、路由协议状态,网络故障处理概述信息采集方法设备日常维护具体故障处理方法案例与FAQ,目录,物理层故障处理,物理层负责通过某种介质提供到另一设备的物理连接,包括端点间的二进制流的发送与接收,完成与数据链路层的交互操作等功能物理层需要关注的是:接地、电缆、连接头、信号电平、编码、时钟和组帧等,常见问题原因,以太网口常见问题:速率、双工、线序(可以up但不转发,千兆以太网口线序要求与百兆不同)、光电口类型、光信号强弱(光口)、干扰T1/E1接口常见问题:常见编码方式:AMI/HDB3(H3C与Cisco默认不同);时钟设置(要求一端设置为主时钟);线缆长度;是否CRC校
10、验及校验和长度;电源及接地等串口常见问题:速率、时钟、电缆类型、工作模式,典型案例一,故障描述:某银行使用SR6602 8E1模块和远端设备互联,发现E1端口物理层不断地UP、Down原因分析:通过命令display cont e1 3/0查看发现有大量Code Violations、帧错误及LOS错误,并且错误一直在增长。首先排查配置没有问题,对接双方没有共地,因为没有共地,两端设备存在电压差,发送方和接收方收发信号的基准不一致,发送方用自己的基准电压发送信号,而接收方用自己的基准电压接收信号,由于基准的不一致,导致信号在接收方看来达不到门限值而产生LOS告警。将路由器和传输设备共地后问题解
11、决,典型案例二,故障描述:某企业SR6602 E1工作的非通道化(using e1)方式下,对端帧间填充类型配置为FF,问题现象是E1物理层为down,display controller e1/t1有AIS告警原因分析:首先排除板卡硬件和电缆没有问题;在E1接口下,AIS告警信号格式为全1的码流。而对端设备在线路空闲状态下发出的码流就是全1,这样会被我们认为是AIS告警,此时,可通过在E1接口下配置undo detect-ais命令来禁止E1接口检测AIS,或通过修改对端设备发送的空闲码类型来解决,典型案例三,故障描述:某企业SR6608 CPOS拆分成 e1,视频会议出现严重马赛克的现象原
12、因分析:首先查明马赛克的问题是由于线路有丢包导致;其次通过传输检查线路,线路一切正常最后通过分段打环,最后发现从SR6608上打外环,接SR6608的传输上打内环有丢包,最后发现SR6608上配置是多模的CPOS模块,传输上配置的是单模的CPOS模块,接口不匹配更换SR6608的模块为单模CPOS,丢包现象解决,视频会议正常,典型案例四,故障描述:某企业SR6608 POS接口与JUNIPER M320 POS接口对接,反复up/down现象原因分析:该问题由于前期版本中,SR6608 POS接口与JUNIPER对接存在故障有关,升级到2109及以后版本可以解决该问题,数据链路层故障处理,数据
13、链路层负责在网络层与物理层之间进行信息传输;规定了介质如何接入和共享;站点如何进行标识;如何根据物理层接收的二进制数据建立帧数据链路层需要关注的是:协议封装类型、协议参数设置、路径MTU、安全、认证、压缩、分片、传输设备和线路等,常见问题原因,链路层协议分类:链路层协议一般分为PPP、HDLC、FR、X.25及SDLC等,但最为广泛使用的是PPP协议PPP常见故障及原因:物理链路故障导致PPP链路不能UP 物理链路的配置不当导致链路不能互通 PAP或CHAP验证配置不当导致验证不通过 AAA配置错误导致链路挂断MP的绑定参数设置错误 使用异步口互通时对端设备不支持字符转义,PPP典型案例一,故
14、障描述:SR66路由器与Cisco路由器使用同步串口互通,两端都使用缺省的最简配置。SR66的链路层协议不能UP,Cisco路由器的链路层虽然可以UP,但过一分钟左右又会DOWN掉原因分析:SR66广域网口缺省的链路层协议是PPP,但Cisco的同步串口上缺省的链路层协议是HDLC,所以不能互通。Cisco的HDLC协议发出的KEEPALVE报文,得不到回应,导致协议DOWN,PPP MP典型案例一,故障描述:SR66 PPP MP捆绑与Cisco 互通时,有四条链路分别是两两绑定到一个VT,但发现前两个绑定到VT0上的串口能正常工作,后两个绑定到VT3上的串口不通正常工作 原因分析:此问题是
15、终端描述符的问题。SR66路由器在每个Virtual-Template发送的终端描述符都一样,对端Cisco 发现不同VT口绑定的终端描述符一样就拆线。修改配置为PAP或CHAP认证,不同的VT口发送不同的用户名,就可以解决这个问题,PPP MP典型案例二,故障描述:SR66 PPP MP捆绑与港湾设备互通时,两两绑定到一个VT,当使用SR6608与省局的港湾ES80 MP对接时mp接口与物理接口均up,但是不能ping通对端mp接口的地址,但使用单接口正常。NE系列与港湾设备MP正常 原因分析:此问题是终端描述符的问题。SR6608不支持指定终端描述符的特性,而港湾设备MP需要配置终端描述符
16、,所以和6608互通导致省局GW设备找不到MP父接口,导致无法ping通。而NE设备支持终端描述符的识别,所以MP可以ping通。更改SR6608与港湾设备之间的MP方式为认证方式即可,网络层故障处理,网络层负责实现数据的分段打包与重组以及差错报告,更重要的是它负责信息通过网络的最佳路径网络层需要关注的是:IP地址及子网掩码、无路由(非预期路由)、路由环路、路由振荡、地址重复等可以使用Ping和Tracert命令分段测试连通性,BGP典型案例,故障描述:SR66 和 Cisco互通时,BGP采用MD5认证,BGP邻居可以建立,但BGP路由仅仅能够学习一条缺省路由原因分析:SR66缺省情况下,M
17、TU配置最小分片为1500,加入MD5认证后,MTU值大于1500,当路由条目过多时,BGP报文过大,被中间传输丢弃。更改端口MTU设为1480,问题解决。,IP MTU典型案例,故障描述:SR66 ppp mp捆绑和 Cisco互通时,SR66下连PC通过FTP访问Cisco下连FTP服务器,上传文件非常慢,对端设置了强制不分片功能,并且无法更改。原因分析:SR66缺省情况下,min-fragment值为128字节。MP出报文大于等于128则开始分片。而对端设置了强制不分片功能,所以SR66 MP发去的分片报文对端无法重组。后来改成ppp mp min-fragment 1500,但MTU缺
18、省情况下是1500。网络层传下来的报文是1500,当报文如果大于等于1500时会分为两片,所以还是有问题MTU通过修改配置最小分片为1500,MTU设为1400,这样网络层发下来的报文只有1400,小于1500就不会分片,问题解决。,传输层以上故障处理,故障现象:无法访问、连接失败FTP传输大包不过、WEB无法访问网络运行不稳定网速慢、部分网页打不开原因定位:TCP MSS参数设置不当安全及防火墙参数配置错误CPU或内存利用率过高Qos策略及其参数配置不当,TCP MSS典型案例,故障描述:SR66路由器作为BGP/MPLS VPN网络的PE设备,下连CE设备为Web服务器,属于VPN1;远端
19、PE设备下属VPN1中有一个普通PC,发现PC访问网页速率很慢,另外FTP下载也很慢原因分析:中间P设备MTU值把8个字节MPLS标签计算在内,且MTU值最大为1500,不可修改。Web服务器发给PC的报文经过MPLS封装后为1508字节,超过P设备出接口MTU而分片,由于IP报文DF1,故丢弃报文。在SR66绑定VPN1的接口下配置tcp mss 1400命令解决,具体故障处理方法,单板注册故障处理以太网接口故障处理POS接口故障处理CPOS接口故障处理E1&CE1接口故障处理ATM接口故障处理PPP和MP故障处理VLAN故障处理,单板注册故障诊断流程,单板注册故障处理,检查是否为单板注册故
20、障单板状态指示灯是否正未注册一般快闪,或在一段时间内常亮通过display device命令查看单板状态查看单板复位原因通过display device 查看通过display logbuffer可以查看更详细的信息注意:单板有无物理损坏?单板是否有断针、倒针的情况单板未插紧会导致注册异常,可尝试拔出单板并重新插紧,具体故障处理方法,单板注册故障处理以太网接口故障处理POS接口故障处理CPOS接口故障处理E1&CE1接口故障处理ATM接口故障处理PPP和MP故障处理VLAN故障处理,以太网接口故障诊断流程,以太网接口故障处理检查物理状态,使用display interface命令查看端口信息线
21、缆问题配置问题协商问题在接口视图下运行loopback命令如果状态为UP:本地接口硬件工作正常,线缆有问题,需要更换线缆如果状态为DOWN:单板故障,需要维修单板,以太网接口故障处理检查链路状态,如果物理层状态为UP,而链路层状态DOWN未配置正确的IP地址如果物理层和链路层都UP,却ping不通两个以太网接口的IP地址是否位于同一子网内?是否学习到对端设备的ARP?网络内是否有相冲突的IP地址?,以太网接口故障处理检查链路层处理,检查网络中是否有相同IP的主机存在日志里会有相关记录ARP表项是否正常生成没有生成:可能是ARP表项满有表项但表项显示为Incomplete:可能是配置问题或路由有
22、问题使用debug arp命令查看ARP报文Ethernet链路层收发报文是否正常使用debug ethernet packet命令查看链路层报文的收发情况使用display interface查看端口是否有大量CRC错误查看子接口的VLAN ID两端相应的子接口封装的VLAN是否一致?,以太网接口故障处理查看端口计数,RouterA-Ethernet2/0/0display this interfaceEthernet2/0/0 current state:upLine protocol current state:up Hardware is WAN-FastEthernet,Addres
23、s is 00e0-fc68-adb8 Description:HUAWEI,Quidway Series,Ethernet2/0/0 Interface Internet address is:5.0.0.4/24 Is-Primary The Maximum Transmit Unit is 1500 bytes,the BandWidth is 100000 Kbits Send-frame-type is Ethernet_II,loopback not set Negotiation enabled,full-duplex,100Mbps,urpf disabled This por
24、t works as a Router Statistics last cleared:never Traffic statistics:Last 5 minutes input rate 0 bytes/sec,0 packets/sec Last 5 minutes output rate 0 bytes/sec,0 packets/sec 29 packets input,2448 bytes 29 packets output,2448 bytes Input:0 shorts,0 jumbos,0 giants,0 pauses 5 unicasts,24 multicasts,0
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- H3CSR66 系列 路由器 维护 故障 处理

链接地址:https://www.31ppt.com/p-5360335.html