GPON故障定位及分析.ppt
2023/7/29,FTTX产品故障定位及分析,Page 2,第1章 解决方案介绍第2章 故障处理第3章 典型故障分析第4张 常用工具、FAQ,内容介绍,Page 3,FTTx解决方案场景,FTTH解决方案:主要是针对新建的楼宇或者高档住宅,提供光纤到家的宽带接入。可提供视频、语音和数据业务。FTTB/C解决方案:主要是针对城区改造和光纤到路边交接箱的场景,在老城区改造项目中,利用MDU设备提供ADSL2+或者VDSL2接入用户,给用户提供2M20M的带宽。此场景要求光纤到大楼或者路边的交接箱即可,在用户接入侧可以重用之前的铜缆资源,设备投资低。FTTO解决方案:主要针对商用用户或者政府、银行和医院等政府办公场所,采用SBU设备提供E1/GE/FE/POTS等接口,满足办公需要。,Page 4,第1章 解决方案介绍第2章 故障处理第3章 典型故障分析第4张 常用工具、FAQ,内容介绍,Page 5,故障处理流程,Page 6,故障处理流程,故障处理准备,初步定位故障位置,初步判断故障范围,接到用户申告、系统告警、网管侧告警后,应初步判断故障范围,在充分了解组网、业务的基础上,对故障影响范围、类型、故障点建立初步的认识。,1,Page 7,收集故障信息,初步定位故障位置,了解问题可能的原因,评估严重程度,Page 8,使用方法:对比分析,对比是指将故障的部件或现象与正常的部件或现象进行比较分析,查出不同点,从而找出问题的所在,一般适用于故障单一的场合。相同BRAS或Lanswitch下面相同的机框不同的单板相同的单板不同的接口相同的接口不同的终端相同的终端不同的接口,PC,ONT&MDU,OLT,IP,BRAS,PC,LS,Page 9,故障处理知识准备,ODN组网结构、分光器原理、上下行光波分复用特性,测试工具抓包工具,光纤接入的原理,常用仪表的基本操作,PPPoE、DHCP、H.248、IGMP等协议和交互方式,业务流程、协议、配置,OLTMDU、ONT,典型故障,快速定位专业知识故障预判,关键,Page 10,故障处理相关信息,了解工程组网信息网络拓扑信息组网,上层网络交换机、路由器连接情况业务配置信息VLAN标签添加,单层、多层VLAN语音数据、协议接口设备运行状态工程文档,现场操作时做好故障现场数据的采集与保存backup tftp data/configuration,Page 11,故障处理流程,查找故障原因,检查光口、光纤状况,检查设备运行状态,检查ONU状态,检查设备统计信息,检查设备数据配置,检查上层设备状态,在初步判定故障范围的基础上,按照先局端设备,后用户设备,先数据后物理线路的方式查找故障点和故障原因。,2,Page 12,检查设备运行状态,检查主控板的运行灯状态正常情况:RUN ALM 灯1s 亮1s 灭,周期闪烁,主用主控板ACT 灯长亮。如果出现异常,请检查主控板是否接触良好。检查业务板的运行灯状态正常情况:RUN ALM 灯1s 亮1s 灭,周期闪烁。如果出现异常,请检查业务板是否接触良好。检查PON接口灯状态正常情况下:ONU在线时,PON 接口的灯长亮。如果出现PON口灯不亮,请检查光口激光器是否打开。如果被关闭,在GPON 模式下,使用port portid laser-switch on命令打开。,Page 13,告警分析,告警信息包含故障或异常现象的具体描述、可能的发生原因、有哪些修复建议等等,涉及硬件、链路、业务、CPU 占用率等各个方面,信息量大且全,是进行故障分析和定位的重要依据之一。获取告警信息有以下几种途径:N2000网管告警面板命令行模式display alarm history命令查询现场设备单板指示灯,告警分类,告警级别,告警原因,通信类告警业务质量类告警处理出错类告警硬件设备类告警环境类告警,严重重要次要警告,多种,Page 14,告警分析,huawei(config)#display alarm history alarmclass|alarmid|alarmlevel|alarmparameter|alarmsn|alarmK|alarmtype|all:allALARM 4031 故障告警 警告 0 x60311011 硬件设备类 2009-08-11 17:27:21 告警名称:ONT掉电(DGi)参数信息:机框号:0,槽位号:2,端口号:0,ONT ID:3,硬件版本:H821EPUA 告警描述:ONT掉电(Dgi),ONT下线业务中断 告警原因:ONT电源出现异常 修复建议:检查ONT电源,保证ONT电源正常工作-END ALARM 4030 恢复告警 清除 0 x60321011 硬件设备类 2009-08-11 17:27:21 告警名称:ONT掉电(DGi)恢复 参数信息:机框号:0,槽位号:2,端口号:0,ONT ID:3,硬件版本:H821EPUA 告警描述:ONT掉电(DGi)恢复 告警原因:无 修复建议:无需处理-END,Page 15,日志分析,通过查询日志发现一些异常的配置命令行模式display log all命令查询发现是否存在误操作huawei(config)#display log all|cli|failure|index|memory|name|snmp:-序号 用户名 域名 IP地址 271 huawei456-时间:2009-08-11 16:40:38操作:ip address 172.16.146.150 16-序号 用户名 域名 IP地址 270 huawei456-时间:2009-08-11 16:40:32操作:interface vlanif 4000-序号 用户名 域名 IP地址 269 huawei456-时间:2009-08-11 16:40:25操作:undo interface vlanif 172,Page 16,检查设备流量信息,如果发现哪个阶段的数据只有收或只有发,则可以定位数据在该段丢失,再查看相关段的配置。上行口流量统计PON口流量统计ONT流量统计查看协议传输是否正常,Page 17,检查设备统计信息,查看流量统计信息,可以很好的定位排除故障,步骤一:查询上行口的流量统计信息,查看是否有收、发的流量huawei(config-if-giu-0/1)#display port statistics 0步骤二:查询GPON 端口的性能统计信息huawei(config-if-gpon-0/3)#display port statistic 0步骤三:查询ONT 的性能统计信息huawei(config-if-gpon-0/3)#display ont traffic 0 0查询以太网端口流量信息:huawei(config-if-giu-0/19)#display port traffic 0The received traffic of this port(packets/s)=0 The received traffic of this port(octets/s)=62 The transmitted traffic of this port(packets/s)=0 The transmitted traffic of this port(octets/s)=62,Page 18,可使用方法:分段分析,在完成对比分析后,不一定能找到具体的故障点,此时还可将故障网络分为不同的故障网段,逐段排查,定位故障。上侧网络问题Lanswitch到BRAS的问题上行口到Lanswitch的问题从业务单板到无源分光器从无源分光器到用户光终端从光终端到用户设备,PC,ONT&MDU,OLT,干路故障,用户终端故障,IP,支路故障,BRAS,网络侧故障,其他:PPPoE H248 IGMPDHCP,LS,示例:采用PING等各种方法,检测是否存在丢包、无流量现象。,PING,Page 19,检查设备数据配置,检查是否为VLAN 绑定上行口使用display vlan命令检查是否为网络侧VLAN增加了上行口。若没有则使用port vlan命令指定VLAN上行口。检查业务流配置是否正确使用display service-port all命令查询业务流配置是否正确。使用display ont-srvprofile命令查询ONU的端口VLAN 配置是否与业务流对应。用户侧VLAN 为untagged方式的业务流,修改ont-srvprofile将ONU端口要加入到上行VALN,使用ont port native-vlan命令配置端口的Native VLAN与上行VLAN相同。用户侧VLAN 为tagged方式的业务流,修改ont-srvprofile将ONU端口要加入到用户侧VALN 中。检查ONU绑定的各类模板使用display ont info 0 0命令检查ONU所绑定的各类模板。使用display dba-profile all命令检查DBA模板,确认绑定的DBA模板是否满足需求。如果不满足,可以使用ont-lineprofile命令修改ONT 所绑定的DBA 模板。,Page 20,检查上层设备状态,在GPON业务发生故障时,通过检查上层设备状态排除故障。如果前面的检查都正常,则问题可能出在上层设备,请检查上层设备的运行状态、数据配置。特别要关注上层设备和OLT对接接口属性的兼容性。对接端口的全、半双工;10M、100M、1000M速率类型一致光模块单、多模类型一致,光纤类型正确两端同时开启或关闭链路聚合功能(link aggregation)huawei(config-if-giu-0/19)#display port state all-端口 端口 光模块 Native 网线 速率 双工 流控 端口 链路 类型 状态 VLAN 自适应(Mbps)激活 状态-0 GE-1 直通 1000 全双工 关 激活 离线 1 FE-1 自协商 自协商100 自协商全 双工 关 激活 在线,Page 21,数据分析,数据配置错误或者更改往往是系统故障的重要原因,配置数据分析是故障定位,尤其是新开局的故障定位不可缺少的一个方法。VLAN配置上行口配置业务口配置终端配置查询设备当前业务配置huawei#display current-configuration,Page 22,检查光口、光纤状况,光口检查上行口、PON口平均发送光功率是否正常。接收光灵敏度是否正常。,检查光纤光纤是否插好。光纤是否弯曲严重。光纤是否有断线。,问题:用户接收端正常情况下光功率的范围是多少?正常情况下PON口的光功率范围是多少?如何分段检测光功率?,答案:光口的接收光功率应该在-27dBm-6dBm之间PON口光功率在2dBm 7dBmONT与OLT之间的光衰减应该在15dB25dB之间,Page 23,其他可使用方法:互换分析,互换是指将处于正常状态的部件与可能故障的部件对调。通过比较对调后二者运行状况的变化,判断故障的范围或部位。单板互换端口互换光纤互换终端互换,互换操作风险:例如,将短路的单板换到正常的机框有可能造成正常机框损坏。因此,使用互换方法需要谨慎,确保不导致新故障。主要能发现一些物理器件上的问题。,Page 24,故障原因及分析方法汇总,故障原因分层:物理层故障(设备,线路,终端)链路层故障(SN地址,VLAN)网络层故障(IP地址,IP路由)传输层故障(端口号)应用层故障(应用软件,数据配置),故障处理常用分析方法:对比分析(原因判定)分段分析(故障定位)互换分析(硬件,数据)告警分析(全面把握,收集信息)性能分析(监控流量,丢包情况)数据分析(数据配置)仪表分析(电流,电压,功率)协议分析(抓包,信令),Page 25,第1章 解决方案介绍第2章 故障处理第3章 典型故障分析1,ont状态异常;2,宽带故障;第4张 常用工具、FAQ,内容介绍,Page 26,PON端口下单个或多个ONU无法自动发现,OLT上配置的最近最远距离不合适,光纤线路故障或连接不规范,光路衰减过大或过小,1、检查光纤线路,可以使用光时域反射仪(OTDR)测量线路状况,确认线路正常;2、检查分光器的连接,目前版本EPON最多支持1:32分光,即一个端口下最多可以接32个ONU;3、使用光功率计测量ONU收发光功率,OLT与ONU设备光收发光功率参考值,1、使用interface epon命令进入EPON模式,在EPON模式下使用display port info命令查看EPON端口设置的最大最小距离。缺省值最近距离为0km,最远距离为20km。2、查看无法注册的ONU与OLT之间的距离。距离大于20km,在OLT上使用port range命令修改最远距离,使其大于ONU与OLT的实际距离。,Page 27,PON端口下所有ONU都无法自动发现,OLT端口光模块故障,1、在EPON模式下,使用display port info命令查看EPON端口光模块状态,如果“Laser switch”为“Off”,使用port laser-switch命令打开光模块的激光器。2、测量光模块发光功率,确认发光功率在规定范围内,如果不在范围,更换光模块。,OLT上自动发现开关未打开,使用interface epon命令进入EPON模式,在EPON模式下使用display port info命令查看EPON端口自动发现开关状态,如果“Autofind”为“Disable”,使用port ont-auto-find命令使能自动发现功能,即修改“Autofind”为“Enable”。,主干光纤故障,检查光纤线路,可以使用光功率计或光时域反射仪(OTDR)测量线路状况,确认线路正常。检查主要包括以下几个方面:光纤是否插好、光纤是否严重弯曲、光纤是否有断纤、平均发送光功率是否正常、接受光灵敏度是否正常、测试到的光功率值与光功率预算值接近。,Page 28,端口下单个或多个ONU无法注册,ONU状态不正常,PON端口下存在MAC地址冲突,使用display ont info命令查看OLT上已经注册的所有ONU的MAC地址,与无法注册的ONU的MAC地址进行比对,更换存在冲突的ONU后重新注册。,端口下存在流氓ONU或长发光设备,检查端口下是否存在流氓ONU或者长发光设备。端口下存在流氓ONU,会导致其他ONU无法注册。端口下存在长发光设备,长发光设备对PON系统的影响与流氓ONU类似。,ONU关键参数的故障态说明,使用display ont info命令查看ONU的当前状态,主要检查Control Flag、Run State、MAC、Config State、Match State等。,Page 29,端口下所有ONU都无法注册,OLT端口光模块故障,端口下存在流氓ONU或长发光设备,主干光纤故障,检查光纤线路,可以使用光功率计或光时域反射仪(OTDR)测量线路状况,确认线路正常。检查主要包括以下几个方面:光纤是否插好、光纤是否严重弯曲、光纤是否有断纤、平均发送光功率是否正常、接受光灵敏度是否正常、测试到的光功率值与光功率预算值接近。,EPON接口光功率范围:,1、在EPON模式下,使用display port info命令查看EPON端口光模块状态,如果“Laser switch”为“Off”,使用port laser-switch命令打开光模块的激光器。2、测量光模块发光功率,确认发光功率在规定范围内,如果不在范围,更换光模块。,检查端口下是否存在流氓ONU或者长发光设备。端口下存在流氓ONU,会导致其他ONU无法注册。端口下存在长发光设备,长发光设备对PON系统的影响与流氓ONU类似,ONU 状态异常典型故障案例,案例一.TC-C6000 能力集模板配置与ONU 实际支持的规格不一致 导致匹配状态为mismatch 现象描述 某新开局点OLT 设备上添加ONU 后,在OLT 上使用display ont info 命令查看ONU,发现其Match State 一直为“mismatch”。原因分析 在ONU 添加完成后,如果出现ONU 能够正常上线且Run State 为“up”,Match State为“mismatch”的情况,一般情况下是因为ONU 的实际能力与绑定的能力集模板不一致,或者ONT 本身故障。,ONU 状态异常典型故障案例,操作步骤 步骤1 在现场实际查看设备端口,发现OLT 上配置的能力集模板和实际ONU 一致。在OLT上使用display ont capability 命令检查ONU 设备端口、T-CONTS 等参数,发现其与ONU 实际配置也是一致。步骤2 查看ONU 技术手册,发现该设备可以支持GEM Port 数量为128 个,但是在OLT 配置能力集模板时GEM Port 数量最大只能配置32 个,故两边参数不一致,导致ONU的Match State 状态为“mismatch”。建议与总结 该参数虽然不影响业务,但是复位ONU 后,将会导致配置无法下发到ONU 上。可以使用ont resume resource 命令配置ONU 的恢复策略,这样当ONU 实际能力与绑定的能力集模板不一致时,OLT 根据该ONU 上报的硬件能力参数,排除ONU 管理命令中超过实际硬件能力范围的部分,只下发ONU 硬件能力允许的配置命令。,ONU 状态异常典型故障案例,案例二.光纤接头不匹配导致ONT 无法注册 现象描述 某ONT 开局安装时,查询光路衰减-23dbm,属于正常衰减范围。但插上光纤后,PON端口状态指示灯不停闪烁,同时设备无法正常注册,不停的上下线。原因分析 光路衰减过大。光纤接头不干净或接触不良。操作步骤 步骤1 使用光功率计测量光路衰减为-23dBm,光路衰减正常。步骤2 推断是ONT(OT928)的光纤接头不干净导致光信号质量差,清洁光纤接头,重新插拔后故障现象仍然存在。,ONU 状态异常典型故障案例,步骤3 更换一台ONT(OT928)设备测试,故障仍然产生,排除ONT(OT928)硬件问题。步骤4 检查ONT(OT928)使用的尾纤,发现光纤头不匹配(虽然尾纤接头都是方头,但是颜色不匹配)。经过核实,ONT(OT928)设备规范应该使用的光纤接头为绿色,方头SC/APC 步骤5 更换正确的尾纤(SC/APC-FC/PC)后,设备光口指示灯稳定,同时设备注册正常。建议与总结 目前ONT(OT928)设备光口接头所使用的尾纤类型国内使用较少,主要是国外使用。请注意正确使用尾纤。绿色光纤接头和蓝色光纤接头的最大区别是:线芯内部(绿色接头的尾纤)和OT928设备对接面是斜面,而蓝色光纤接头是平面的,可能导致3 6 个dBm 的光衰减。,ONU 状态异常典型故障案例,案例三.最大距离设置值偏小导致部分ONT 无法在OLT上注册现象描述 某局一台OLT 出现一个EPON 端口下的部分ONT 能够正常注册,部分ONT 无法正常注册的故障。原因分析 ONT 硬件故障。EPON 单板端口工作不正常。系统数据配置错误,设置ONT 可注册的最大距离值偏小。操作步骤 步骤1 由于故障发生在多个ONT 上,并且更换了ONT 后故障现象仍然存在,排除ONT 硬件原因。步骤2 该PON 端口下有能够正常注册的ONT,并且这些ONT 工作状态稳定,排除EPON 单板问题。,ONU 状态异常典型故障案例,步骤3 检查发现无法正常注册的ONT 距离该OLT 的物理距离都比较远,集中在3km 5km距离范围。距离OLT 物理距离在 1km 之内的ONT 则没有出现该故障。步骤4 使用display port info 命令查看该PON 端口设置的最大注册距离,发现最大注册距离设置为2km,使用port range 命令修改此PON 端口最大注册距离为20km 后,问题得到解决建议与总结 系统一般默认最大注册距离为20km,该参数不要随意修改。缺省情况下,可注册ONT的最小距离固定为0km,最大距离为20km,配置粒度为1km。,ONU 状态异常典型故障案例,案例四.电压不稳定导致ONU 反复上下线现象描述 某局OLT 下接的一台ONU 无规律的反复上下线。原因分析 光纤衰减过大。ONU 硬件故障。OLT 单板故障。操作步骤步骤1 由于此PON 端口下接其他ONU 都正常,因此排除OLT 的 PON 单板故障。步骤2 使用光功率计在ONU 侧测试光纤衰减为正常(-20dB),正常。,ONU 状态异常典型故障案例,步骤3 更换ONU 后,故障仍存在,排除硬件故障。步骤4 因为出现故障的ONU 在较为偏远的山区,怀疑是周围环境因素导致。Telnet 登录到设备使用display alarm list all 命令仔细查看告警信息,发现连续四天都是在早上7 点到晚上8 点用电高峰期ONU 发生重启,初步判断为电压问题。步骤5 在现场使用万用表测试电压,发现电压不稳定,将此ONU 更换为带有直流电模块的ONU 后问题解决。建议与总结 华为的ONU 设备有交流供电和直流供电两种供电方式。如果设备采用的是交流供电,在电压不稳定的时候会导致设备反复重启。如果电压不正常且不能保证正常电压,建议用户选择使用带直流模块的ONU 设备。,ONU 状态异常典型故障案例,案例五.光路损耗较大的流氓ONU 常发光导致该PON 端口下其它 ONU 注册失败现象描述 OLT(MA5680T)下一个PON 端口下的ONU 当发生掉电或者复位系统后,重新注册时出现注册失败的问题。原因分析 EMAC 芯片故障。网络光路不稳定。操作步骤步骤1 OLT 打印“The chipset of EMAC failed”告警,初步分析为EPBA 单板的EMAC 芯片故障,现场更换EPBA 单板,但故障现象依然存在,排除芯片故障原因。,ONU 状态异常典型故障案例,步骤2 把定位方向重点放在光路的检查上,现场发现一个ONU 的接收光功率为-25.35dbm1490nm),而在同一个分路器下,其它3 个ONU 的接收光功率分别为-18dBm、17dBm、-19dBm,通过命令无法关闭此ONU 的发光,判断此ONU 出现故障。步骤3 更换故障ONU 后业务正常。建议与总结 ONU 由于故障出现常发光,业界称之为流氓ONU。本例中因为流氓ONU 的对应的链路损耗比其它ONU 大9dB 左右,不会完全导致其它ONU 无法注册,只是出现ONU 发生掉电或者复位系统后不能注册的问题。,ONU 状态异常典型故障案例,案例六.ONU 上配置了管理地址导致从OLT 下发IP 失败现象描述 OLT(MA5680T)下新添加ONU(MA5620E),配置“ipconfig”命令时提示“ONT 执行CTC 协议时资源不足”,配置不成功。原因分析 ONU 没有注册。数据配置错误。ONU 上已经存在管理数据。操作步骤步骤1 检查OLT 的数据,数据配置没有问题。查看MxU 状态已经正常注册。步骤2 检查ONU 的数据,发现ONU 已经配置了管理VLAN 和IP 地址。删除管理VLAN 和IP 地址后,在OLT 上重新下发“ipconfig”命令,配置成功,也可以telnet 到ONU。建议与总结对于ONU 设备,尽量采用从网管下发管理VLAN 和IP 地址的方式,这样节约了时间,又避免产生故障。,ONU 状态异常典型故障案例,步骤4 在PC 的DOS 中输入arp a 命令查询PC 的ARP 表项,发现 10.11.104.2 对应的MAC地址为00-18-82-77-1c-c0,与PC 所连接的ONU 的MAC 地址(0018-8277-1d02)不一致。C:Documents and SettingsAdministratorarp-aInterface:10.11.104.1-0 x2Internet Address Physical Address Type10.11.104.2 00-18-82-77-1c-c0 dynamic步骤5 输入arp-d,清除此前保留的ARP 映射,即可登陆到当前连接的ONU,问题解决。建议与总结 PON 开局时有多台ONU 要升级,每台ONU 的METH 口默认IP 地址都是10.11.104.2,导致计算机的ARP 表未及时更新,IP 地址10.11.104.2 对应MAC 地址一直是之前登陆过的ONU 的MAC 地址,而不是当前ONU 的MAC 地址。一般计算机ARP 表中的映射要在停止使用5 到10 分钟后才会自动失效,导致计算机无法登陆到当前连接的ONU。,上网业务典型故障案例,案例一.OLT 与对端设备的链路聚合配置不一致导致用户有时打不 开网页现象描述 OLT 下的用户打开网页有时很慢,有时正常,语音业务及网管 正常。原因分析 ONU 设备流量模板索引配置问题。网络连接有问题。OLT 配置问题。操作步骤步骤1 检查ONU 设备流量模板索引,配置没有问题。步骤2 PING 网站域名有不稳定,有时通有时不通。具体表现为:当能PING通的时候,如果一直长PING 则不会丢包,如果此时中断PING 包,然后再PING 就很有可能无法PING通,但过一会又能PING 通,没有明显规律。步骤3 查看OLT 配置,发现MAC 地址老化时间为10 秒,怀疑MAC 地址老化过快导致,修改为300 秒后问题依旧。,上网业务典型故障案例,步骤4 从PC PING OLT 上层设备的网关地址一直正常,初步判断是OLT 上层设备的问题。步骤5 检查发现OLT 是双上行,但1 端口没有配置数据,只是ONLINE。后确认对接的上层设备上做了链路聚合,但OLT 上没有相应的配置,拔掉1 端口的光纤后问题解决。建议与总结 在OLT 上配置链路聚合后可以彻底解决问题,同时提高网络可靠性。为什么PING 上层设备的网关地址一直正常,而PING 网站域名时通时不通?这与上层设备上的负荷分担机制有关,由于PING 上层设备的网关地址时,源MAC 地址与目地MAC 地址都是固定的,所以只会出现通或不通的情况。而PING 网站域名时,由于网站可以有多台服务器,所以目的MAC 地址不是固定的,这样返回的ICMP 报文就有可能从1 端口的链路回来,于是出现概率性不通的情况。,上网业务典型故障案例,案例二.ONU 上配置的广播域太多导致PC 经常无法获取DHCP 分 配的地址现象描述 OLT 下挂多台ONU 设备,OLT 上接一台防火墙。开启DHCP Server,并做NAT,再接入城域网汇聚交换机。ONU 下的PC 经常无法获取到IP 地址,但当PC 配置DHCP 地址池中的固定IP 地址时,就可以ping 通网关,也可以正常上网。原因分析 客户为了做到端口隔离,为ONU 的每个用户端口都分别配置了一个VLAN。为了节省VLAN 资源,在ONU 到OLT 上进行VLAN 切换。这样就使得OLT 下的广播域过多,导致DHCP offer 报文丢失。,上网业务典型故障案例,操作步骤步骤1 在防火墙上开启debugging dhcp server parket,通过抓包工具发现防火墙上面已经发送了DHCP offer 报文,但PC 没有收到DHCP offer 报文。步骤2 在OLT 上行端口镜像抓包,发现DHCP offer 报文已经送到OLT,但没有到达PC。步骤3 重新配置数据,在每个ONU 上配置一个Smart VLAN,减少OLT 下的广播域。再次测试,所有PC 都可以正常获取IP 地址建议与总结 同一个Smart VLAN 内端口相互隔离,因此在每个ONU 上配置一个Smart VLAN 就可以实现ONU 上用户端口隔离功能。,上网业务典型故障案例,案例三.关闭MAC 地址老化功能导致ADSL 用户下载速度慢现象描述组网:OLT C OLT B OLT A 汇聚交换机 BRAS 九台OLT 三台一组级联,连接到汇聚交换机。其中两组工作正常,第三组的三台OLT上网速率低。在上网速率低的三台OLT 上Ping 网关,时延稳定在2ms,没有发生丢包。原因分析 OLT 配置问题。上层设备配置问题,上网业务典型故障案例,操作步骤步骤1 另外六台OLT 正常,可以排除汇聚交换机上层设备的问题。步骤2 重启OLT A,故障几天内未出现。可确认故障点在OLT A。步骤3 登录OLT A,检查设备端口协商信息和统计信息。检查OLT A 的上行接口协商情况,协商结果为全双工模式,没有问题。l 检查收发报文统计,发现“discard frames”增长很快,其他正常节点没有该现象存在。发生帧丢弃应该与下载慢有关系。步骤4 检查发现MAC 地址表异常:MAC 地址老化时间被设置为“No aging”,xxxx-0198-7600作为BRAS 的MAC 地址被多个业务端口学习到。修改MAC 地址老化时间为300s(默认值)。10 分钟后再次查询,MAC 地址表恢复正常,只有上行单板学习到建议与总结 问题产生的原因是操作员错误的将MAC 地址老化时间设置为“不老化”引起的。对于MAC 地址等基本功能的配置,如没有特殊需求,建议全部采用缺省值,不要随意更改。,上网业务典型故障案例,案例四.错误配置导致DHCP 方式上网不成功现象描述 用户获取IP 地址不成功。查看报文统计信息,只收到用户的DHCP DISCOVER 报文,没有收到DHCP 服务器的DHCP OFFER 报文,并且在BRAS 上没有收到任何报文原因分析 OLT 配置问题。操作步骤步骤1 检查用户到OLT 的链路,链路正常。步骤2 检查OLT 到BRAS 的链路,链路正常。步骤3 检查系统配置,发现用户业务VLAN 没有绑定DHCP 服务器步骤4 将DHCP 服务器绑定用户业务VLAN 后,用户成功获取IP 地址,可以上网。建议与总结 本案例中,操作员曾经执行删除三层接口的操作。重新建立三层接口后,没有重新绑定DHCP 服务器,导致配置丢失。按照经验,DHCP 的大多数问题都出现在OLT,遇到问题可优先检查OLT 的配置。,Page 49,第1章 解决方案介绍第2章 故障处理第3章 典型故障分析第4张 常用工具、FAQ,内容介绍,Page 50,仪表分析,利用各种仪器、仪表取得实际的各种性能参数,对照正常的参数值,定位和排除故障。在故障处理中常用的仪器、仪表包括:光功率计OTDR万用表可调光衰减器,Page 51,常用测试软件,SmartBits 专门测试和分析网络性能的一种工具。下载路径及使用说明:Tesgine 流量创建,报文统计,报文捕获和分析以及协议报文的测试.Ethereal(业界通用工具,互联网上可以下载程序和使用说明)支持Unix、Windows。借助这个程序,你既可以直接从网络上抓取数据进行分析,也可以对由其他嗅探器抓取后保存在硬盘上的数据进行分析。你能交互式地浏览抓取到的数据包,查看每一个数据包的摘要和详细信息。Ethereal有多种强大的特征,如支持几乎所有的协议、丰富的过滤语言、易于查看TCP会话经重构后的数据流等。,Page 52,问题1:OLT设备有那些版本查询命令?答复:使用display patch all命令查询系统当前版本和运行的补丁信息。使用display language命令查询系统当前运行的版本信息,也就是主用主控板的信息。使用display version frameid/slotid命令查询主控板的R级版本及单板硬件版本。,Page 53,问题2:如何查询和修改ARP老化时间?答复:V800R006C02之前的版本,ARP老化时间固定20分钟,不能查询和修改。V800R006C02版本上,可以查询和修改ARP老化时间,命令如下:查询ARP老化时间:display arp aging-time 修改ARP老化时间:arp aging-time,Page 54,问题3:MA5680T/MA5683T的PON口多长时间接收不到光信号后就会上报LOS告警?答复:根据协议规定:OLT在连续的4帧内检测不到任何光,就认为收不到光了,就会将PON口设置为DOWN。ONU的上行光频率是8000帧/秒,4帧也就是0.5ms,所以MA5680T/MA5683T的PON口多长时间接收不到光信号后就会上报LOS告警。协议规定原文:LOS Loss of Signal The OLT did not receive any expected transmissions in the upstream(complete PON failure)for 4 consecutive frames.,谢谢,Page 55,