FTTxEPON业务故障处理.ppt
《FTTxEPON业务故障处理.ppt》由会员分享,可在线阅读,更多相关《FTTxEPON业务故障处理.ppt(82页珍藏版)》请在三一办公上搜索。
1、Page 0,修订记录,本页不打印,FTTx EPON 故障处理,Page 2,培训目标,学完本课程后,您应该能:了解故障处理注意事项熟悉故障处理基本流程掌握故障处理基本方法处理一些常见故障,Page 3,目 录,EPON故障处理一般流程和分析方法EPON常见故障类型和排除方式,Page 4,故障处理流程,故障处理准备,初步定位故障位置,初步判断故障范围,查找故障原因,排除故障,联系华为技术支持,屏蔽或隔离故障,排除故障,查看故障是否已恢复,检查光口、光纤状况,检查设备运行状态,检查ONU状态,检查设备统计信息,检查设备数据配置,检查上层设备状态,1,2,3,4,5,Page 5,故障处理流程
2、,故障处理准备,初步定位故障位置,初步判断故障范围,接到用户申告、系统告警、网管侧告警后,应初步判断故障范围,在充分了解组网、业务的基础上,对故障影响范围、类型、故障点建立初步的认识。,1,Page 6,收集故障信息,初步定位故障位置,了解问题可能的原因,评估严重程度,Page 7,使用方法:对比分析,对比是指将故障的部件或现象与正常的部件或现象进行比较分析,查出不同点,从而找出问题的所在,一般适用于故障单一的场合。相同BRAS或Lanswitch下面相同的机框不同的单板相同的单板不同的接口相同的接口不同的终端相同的终端不同的接口,PC,ONT&MDU,OLT,IP,BRAS,PC,LS,Pa
3、ge 8,故障处理知识准备,ODN组网结构、分光器原理、上下行光波分复用特性,测试工具抓包工具,光纤接入的原理,常用仪表的基本操作,PPPoE、DHCP、H.248、IGMP等协议和交互方式,业务流程、协议、配置,OLTMDU、ONT,典型故障,快速定位专业知识故障预判,关键,Page 9,故障处理相关信息,了解工程组网信息网络拓扑信息组网,上层网络交换机、路由器连接情况业务配置信息VLAN标签添加,单层、多层VLAN语音数据、协议接口设备运行状态工程文档,现场操作时做好故障现场数据的采集与保存backup tftp data/configuration,Page 10,故障处理流程,查找故障
4、原因,检查光口、光纤状况,检查设备运行状态,检查ONU状态,检查设备统计信息,检查设备数据配置,检查上层设备状态,在初步判定故障范围的基础上,按照先局端设备,后用户设备,先数据后物理线路的方式查找故障点和故障原因。,2,Page 11,检查设备运行状态,检查主控板的运行灯状态正常情况:RUN ALM 灯1s 亮1s 灭,周期闪烁,主用主控板ACT 灯长亮。如果出现异常,请检查主控板是否接触良好。检查业务板的运行灯状态正常情况:RUN ALM 灯1s 亮1s 灭,周期闪烁。如果出现异常,请检查业务板是否接触良好。检查PON接口灯状态正常情况下:ONU在线时,PON 接口的灯长亮。如果出现PON口
5、灯不亮,请检查光口激光器是否打开。如果被关闭,在EPON 模式下,使用port portid laser-switch on命令打开。,Page 12,告警分析,告警信息包含故障或异常现象的具体描述、可能的发生原因、有哪些修复建议等等,涉及硬件、链路、业务、CPU 占用率等各个方面,信息量大且全,是进行故障分析和定位的重要依据之一。获取告警信息有以下几种途径:N2000网管告警面板命令行模式display alarm history命令查询现场设备单板指示灯,告警分类,告警级别,告警原因,通信类告警业务质量类告警处理出错类告警硬件设备类告警环境类告警,严重重要次要警告,多种,Page 13,告
6、警分析,huawei(config)#display alarm history alarmclass|alarmid|alarmlevel|alarmparameter|alarmsn|alarmK|alarmtype|all:allALARM 4031 故障告警 警告 0 x60311011 硬件设备类 2009-08-11 17:27:21 告警名称:ONT掉电(DGi)参数信息:机框号:0,槽位号:2,端口号:0,ONT ID:3,硬件版本:H821EPUA 告警描述:ONT掉电(Dgi),ONT下线业务中断 告警原因:ONT电源出现异常 修复建议:检查ONT电源,保证ONT电源正常工
7、作-END ALARM 4030 恢复告警 清除 0 x60321011 硬件设备类 2009-08-11 17:27:21 告警名称:ONT掉电(DGi)恢复 参数信息:机框号:0,槽位号:2,端口号:0,ONT ID:3,硬件版本:H821EPUA 告警描述:ONT掉电(DGi)恢复 告警原因:无 修复建议:无需处理-END,Page 14,日志分析,通过查询日志发现一些异常的配置命令行模式display log all命令查询发现是否存在误操作huawei(config)#display log all|cli|failure|index|memory|name|snmp:-序号 用户名
8、 域名 IP地址 271 huawei456-192.168.146.76时间:2009-08-11 16:40:38操作:ip address 172.16.146.150 16-序号 用户名 域名 IP地址 270 huawei456-192.168.146.76时间:2009-08-11 16:40:32操作:interface vlanif 4000-序号 用户名 域名 IP地址 269 huawei456-192.168.146.76时间:2009-08-11 16:40:25操作:undo interface vlanif 172,Page 15,检查设备流量信息,如果发现哪个阶段
9、的数据只有收或只有发,则可以定位数据在该段丢失,再查看相关段的配置。上行口流量统计PON口流量统计ONT流量统计查看协议传输是否正常,Page 16,检查设备统计信息,查看流量统计信息,可以很好的定位排除故障,步骤一:查询上行口的流量统计信息,查看是否有收、发的流量huawei(config-if-giu-0/1)#display port statistics 0步骤二:查询EPON 端口的性能统计信息huawei(config-if-epon-0/3)#display port statistic 0步骤三:查询ONT 的性能统计信息huawei(config-if-epon-0/3)#d
10、isplay ont traffic 0 0查询以太网端口流量信息:huawei(config-if-giu-0/19)#display port traffic 0The received traffic of this port(packets/s)=0 The received traffic of this port(octets/s)=62 The transmitted traffic of this port(packets/s)=0 The transmitted traffic of this port(octets/s)=62,Page 17,可使用方法:分段分析,在完成对
11、比分析后,不一定能找到具体的故障点,此时还可将故障网络分为不同的故障网段,逐段排查,定位故障。上侧网络问题Lanswitch到BRAS的问题上行口到Lanswitch的问题从业务单板到无源分光器从无源分光器到用户光终端从光终端到用户设备,PC,ONT&MDU,OLT,干路故障,用户终端故障,IP,支路故障,BRAS,网络侧故障,其他:PPPoE H248 IGMPDHCP,LS,示例:采用PING等各种方法,检测是否存在丢包、无流量现象。,PING,Page 18,可使用方法:协议分析,协议分析是指对通过信令跟踪、捕获数据包分析等手段对故障进行分析的方法。协议分析要求维护工程师对协议有深入的了
12、解,掌握各种信令的交互流程,从而能够从获得的信令消息中定位出故障的真正原因。在用户侧抓包在上行口抓包(interface giu/port mirror)在上层设备处抓包Debug工具(terminal debugging/debugging xxx/terminal monitor),Page 19,检查设备数据配置,检查是否为VLAN 绑定上行口使用display vlan命令检查是否为网络侧VLAN增加了上行口。若没有则使用port vlan命令指定VLAN上行口。检查业务流配置是否正确使用display service-port all命令查询业务流配置是否正确。使用display o
13、nt-srvprofile命令查询ONU的端口VLAN 配置是否与业务流对应。用户侧VLAN 为untagged方式的业务流,修改ont-srvprofile将ONU端口要加入到上行VALN,使用ont port native-vlan命令配置端口的Native VLAN与上行VLAN相同。用户侧VLAN 为tagged方式的业务流,修改ont-srvprofile将ONU端口要加入到用户侧VALN 中。检查ONU绑定的各类模板使用display ont info 0 0命令检查ONU所绑定的各类模板。使用display dba-profile all命令检查DBA模板,确认绑定的DBA模板是
14、否满足需求。如果不满足,可以使用ont-lineprofile命令修改ONT 所绑定的DBA 模板。,Page 20,检查上层设备状态,在EPON业务发生故障时,通过检查上层设备状态排除故障。如果前面的检查都正常,则问题可能出在上层设备,请检查上层设备的运行状态、数据配置。特别要关注上层设备和OLT对接接口属性的兼容性。对接端口的全、半双工;10M、100M、1000M速率类型一致光模块单、多模类型一致,光纤类型正确两端同时开启或关闭链路聚合功能(link aggregation)huawei(config-if-giu-0/19)#display port state all-端口 端口 光
15、模块 Native 网线 速率 双工 流控 端口 链路 类型 状态 VLAN 自适应(Mbps)激活 状态-0 GE-1 直通 1000 全双工 关 激活 离线 1 FE-1 自协商 自协商100 自协商全 双工 关 激活 在线,Page 21,数据分析,数据配置错误或者更改往往是系统故障的重要原因,配置数据分析是故障定位,尤其是新开局的故障定位不可缺少的一个方法。VLAN配置上行口配置业务口配置终端配置查询设备当前业务配置huawei#display current-configuration,Page 22,检查光口、光纤状况,光口检查上行口、PON口平均发送光功率是否正常。接收光灵敏度是
16、否正常。,检查光纤光纤是否插好。光纤是否弯曲严重。光纤是否有断线。,问题:用户接收端正常情况下光功率的范围是多少?正常情况下PON口的光功率范围是多少?如何分段检测光功率?,答案:光口的接收光功率应该在-27dBm-6dBm之间PON口光功率在2dBm 7dBmONT与OLT之间的光衰减应该在15dB25dB之间,Page 23,分析方法:仪表分析,利用各种仪器、仪表取得实际的各种性能参数,对照正常的参数值,定位和排除故障。在故障处理中常用的仪器、仪表包括:光功率计OTDR万用表可调光衰减器,以上器件主要针对ODN测试,请参考ODN链路测试,Page 24,检查ONT状态,Page 25,检查
17、MDU状态,Page 26,检查ONU状态,在线查询ONU的状态使用display ont info命令检查ONU的信息,主要检查控制标志、运行标志、MAC、配置状态、匹配状态huawei(config-if-epon-0/2)#display ont info 0 all-框/槽/端口 ONT编号 MAC 控制标志 运行标志 配置状态 匹配状态-0/2/0 0 0018-82D4-AC74 激活 在线 正常 匹配 0/2/0 1 001E-E3FF-1B68 激活 离线 初始状态 初始状态 0/2/0 2 001E-E3FF-1C3E 去激活 离线 初始状态 初始状态 0/2/0 3 001
18、8-82F7-A9C6 激活 离线 初始状态 初始状态 0/2/0 4 0018-82DA-89F6 激活 在线 正常 不匹配-,Page 27,检查ONU状态说明,如果“控制标志”为激活态且“运行标志”为在线,则正常,说明用户上线且认证通过。而“运行标志”为离线,则说明用户未上线。如果“控制标志”为去激活态会禁止ONU进行注册,需要在EPON模式下使用ont activate命令把控制开关设为激活。如果ONU的“MAC”与实际的ONU不一致,会导致注册失败。如果“配置状态”为“正常”状态,说明ONU配置恢复状态正常。如果“配置状态”为“初始状态”状态,说明ONU配置恢复失败,有可能是ONU绑
19、定了错误的ONU模板。可尝试通过重新下发配置命令或重启ONU来排除故障。,Page 28,其他可使用方法:互换分析,互换是指将处于正常状态的部件与可能故障的部件对调。通过比较对调后二者运行状况的变化,判断故障的范围或部位。单板互换端口互换光纤互换终端互换,互换操作风险:例如,将短路的单板换到正常的机框有可能造成正常机框损坏。因此,使用互换方法需要谨慎,确保不导致新故障。主要能发现一些物理器件上的问题。,Page 29,故障原因及分析方法汇总,故障原因分层:物理层故障(设备,线路,终端)链路层故障(MAC地址,VLAN)网络层故障(IP地址,IP路由)传输层故障(端口号)应用层故障(应用软件,数
20、据配置),故障处理常用分析方法:对比分析(原因判定)分段分析(故障定位)互换分析(硬件,数据)告警分析(全面把握,收集信息)性能分析(监控流量,丢包情况)数据分析(数据配置)仪表分析(电流,电压,功率)协议分析(抓包,信令),Page 30,问 题,处理一般故障时,主要应该查询哪些信息?常用的故障排除方法有哪些?在使用互换法的时候应该注意什么?,Page 31,目 录,EPON故障处理一般流程和分析方法EPON常见故障类型和排除方式,Page 32,常见故障类型分析,Page 33,讨论,Page 34,案例一 ONT无法注册,故障现象:某县局,某工程师手工添加ONT终端后,现场安装人员发现O
21、NT 指示灯不断闪烁,一致无法达到稳定状态,OLT上该ONT无法正常注册,同一PON口下其他用户正常。,Page 35,案例一 ONT无法注册,查找故障原因:光功率(现场无功率计)硬件故障数据配置故障排除:修改MAC后业务正常。,建议:在每个接口底下打开ONT自动发现功能,当ONT被自动发现后,会自动上报MAC,通过复制粘贴,然后使用ONTconfirm来确认,这样就不会通过由人工来念MAC码而产生不必要的错误了!,初步判断故障范围:单个用户故障,故障点可能在ONU、支路光纤、分光器、数据配置。可排除上行、单板、PON口问题,Page 36,案例二 MDU反复上下线,现象描述某村村通工程,小A
22、在网管上看到告警,在一偏远山区发现OLT下接的一台MDU无规律的反复上下线,其他MDU正常。告警信息OLT和网管上出现ONT反复上下线告警。原因分析光纤衰减过大MDU硬件故障 MDU单板故障,Page 37,案例二 MDU反复上下线,初步判断故障范围:单个用户故障,其他MDU正常,因此排除OLT的PON单板故障,初步判断故障范围为OLT以下器件和数据问题。故障原因查找:使用光功率计在MDU侧测试光纤衰减为正常(-20dB),排除线路原因。更换MDU后,当时正常,但后续两三天里告警仍时常发生。因为出现故障的MDU在较为偏远的山区,怀疑是周围环境因素导致。Telnet登录到设备使用display
23、alarm history all命令仔细查看告警信息,发现连续四天都是在晚上7点到晚上8点用电高峰期MDU发生重启,初步判断为电压问题。在现场使用万用表测试电压,发现电压不稳定,导致MDU反复重启。故障排除:将此MDU更换为带有直流电模块的MDU后问题解决。,建议与总结:如果设备采用的是交流供电,在电压不稳定的时候会导致设备反复重启。如果电压不正常且不能保证正常电压,建议用户选择使用带直流模块的MDU设备。,Page 38,案例三 用户申告所有业务不通,故障现象某局MA5680T 上行口通过二层交换机连接到路由器NE40上,某用户申告上网业务不通,拨号失败,其他用户正常。组网说明告警无,OL
24、T,Internet,NE40,S6505,MA5680T,Page 39,案例三 用户申告所有业务不通,初步判断故障范围:单个用户故障,ONU、光纤、用户电脑终端病毒、用户帐号等,可排除上行、PON口等问题。故障原因查找:查看告警,无告警信息。查看用户数据,模版、VLAN等各项数据正常。换一个备用终端,业务依然不通;将终端直接连接在其他同一分光器下的光纤上,终端正常注册,业务正常;使用光功率计测量发现用户侧跳纤,用户装修时将入户光纤压坏,接收光功率为30db,小于最低接收功率27db,接收光功率在终端光模块接收灵敏度之外。故障排除:到用户侧更换跳纤,业务正常。,Page 40,经验分享,您是
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- FTTxEPON 业务 故障 处理
链接地址:https://www.31ppt.com/p-2460358.html