OptiXOSN告警与性能专题.ppt
OptiX OSN告警与性能专题,前言,基于SDH原理及NG-SDH设备告警与性能特性,开发此课程。本课程旨在让一线理解SDH告警和性能,并能够处理常见的告警。,课程目标,学习完此课程,您应能:理解SDH告警与性能产生的原理理解SDH告警与性能的关系掌握告警抑制关系掌握OSN产品常见告警的处理,第1章 SDH告警及性能事件产生原理 第2章 常见告警分析与处理第3章 OSN常见新增告警分析与处理第4章 环带链案例分析,内容介绍,第1章 SDH告警及性能事件产生原理 1.1 基本概念1.2 高阶告警、性能事件的产生和检测1.3 低阶告警、性能事件的产生和检测1.4 NG-SDH设备对AIS告警下插的支持情况1.5 告警信号间的抑制关系 1.6 性能事件的产生和检测 1.7 告警与性能的关系,内容介绍,基本概念,下行信号流,上行信号流,下行信号流、上行信号流,基本概念,高阶信号流、低阶信号流,基本概念,两种通用告警,AIS告警(Alarm Indication Signal):对下一级电路下插全“1”,告知该信号不可用。常见的AIS告警有:MS_AIS、AU_AIS、TU_AIS、E1_AISRDI告警(Remote Defect Indication):指对端站检测到LOS、AIS、TIM 等告警后,而传给本站的回送告警,常见的告警有:MS_RDI、HP_RDI、LP_RDI,第1章 SDH告警及性能事件产生原理 1.1 基本概念1.2 高阶告警、性能事件的产生和检测1.3 低阶告警、性能事件的产生和检测1.4 NG-SDH设备对AIS告警下插的支持情况1.5 告警信号间的抑制关系 1.6 性能事件的产生和检测 1.7 告警与性能的关系,内容介绍,上行信号流,下行信号流,高阶告警、性能事件的产生和检测,思考:各功能块的作用是什么?各功能块检查哪些SDH开销?这些开销检测会上报什么告警和性能?,结合SDH原理已经下面的课程需要思考的问题,高阶告警、性能事件的产生和检测,帧同步器和再生段开销处理器,(RST),复用段开销处理器,(MST),指针处理器和高阶通道开销处理器,(MSA、HPT),下行信号流,告警上报或回告,信号传递点(下插全“1”信号),告警终结点(上报主控),高阶告警、性能事件的产生和检测-下行信号流,帧同步器和再生段开销处理器,光接收光电转换信号检测(无光、光功率过低、光功率过高、输入信号码型不匹配时上报R_LOS)A1、A2和J0字节检测定位信号的捕捉(R_OOF、R_LOF)线路参考同步定时源 的提取J0字节(J0_MM)扰码器(解扰)B1字节检测B1误码检测(B1_SD、B1_EXC、SES、RSUAT)F1、D1-D3和E1字节的处理,高阶告警、性能事件的产生和检测-下行信号流,K1、K2字节检测 SF、SD的检测 D4-D12、S1和E2字节的处理 MSP保护功能(K1、K2字节和主控单元、交叉单元)MS_AIS、MS_RDI 的检测上报B2字节检测 B2误码检测(B2_SD、B2_OVER、SES、MSUAT)M1字节(MS_REI),复用段开销处理器,高阶告警、性能事件的产生和检测-下行信号流,H1、H2字节检测 指针解释和指针调整、定位每一路VC4至相应HPT AU_AIS、AU_LOP 的检测上报J1、C2、B3、G1字节检测 J1字节(HP_TIM)C2字节(HP_UNEQ、HP_SLM)B3误码检测(B3_SD、B3_OVER、SES、HVCUAT)H4字节(仅VC12信号,HP_LOM)G1字节(HP_RDI、HP_REI)F3、K3、N1字节的处理(保留),指针处理器和高阶通道开销处理器,高阶告警、性能事件的产生和检测-上行信号流,高阶通道开销字节初始值的生成 J1、C2、B3、G1、F2、F3、N1字节告警信号的回传 HP_RDI(G1字节)HP_REI(G1字节)指针处理 指针的生成,指针处理器和高阶通道开销处理器,高阶告警、性能事件的产生和检测-上行信号流,复用段开销处理器,复用段开销字节初始值的生成 K1、K2、D4-D12、S1、M1、E2、B2字节告警信号的回传 MS_RDI(K2字节)MS_REI(M1字节),高阶告警、性能事件的产生和检测-上行信号流,再生段开销字节初始值的生成 A1、A2、J0、E1、F1、D1-D3、B1字节扰码器(扰码)电光转换,帧同步器和再生段开销处理器,第1章 SDH告警及性能事件产生原理 1.1 基本概念1.2 高阶告警、性能事件的产生和检测1.3 低阶告警、性能事件的产生和检测1.4 NG-SDH设备对AIS告警下插的支持情况1.5 告警信号间的抑制关系 1.6 性能事件的产生和检测 1.7 告警与性能的关系,内容介绍,低阶告警、性能事件的产生和检测,思考:各功能块的作用是什么?各功能块检查哪些SDH开销?这些开销检测会上报什么告警和性能?,结合SDH原理以及下面的课程需要思考的问题,低阶告警、性能事件的产生和检测,异步物理接口模块,低阶通道适配功能块,高阶通道适配功能块和低阶通道终端功能块,信号流程,告警上报或回告,信号传递点(下插全“1”信号),告警终结点(上报主控),低阶告警、性能事件的产生和检测-下行信号流,V1、V2、V3字节检测 VC4解映射成VC12、指针解释和指针调整 TU_AIS、TU_LOP的检测上报V5字节检测 LP_RDI(b8)LP_UNEQ、LP_SLM(b5-b7)LP_REI(b3)BIP-2误码检测(b1-b2)H4字节检测 HP_LOMJ2字节检测LP_TIM,高阶通道适配功能块和低阶通道终端功能块,低阶告警、性能事件的产生和检测-下行信号流,低阶通道适配功能块 数据流和相关时钟参考信号的恢复 LP_RFIFO的检测上报异步物理接口模块 码型转换,低阶通道适配功能块和异步物理接口模块,低阶通道适配功能块和异步物理接口模块,异步物理接口模块 时钟提取和数据再生、抖动的抑制 T_ALOS的检测上报低阶通道适配功能块 数据适配 E1_AIS的检测上报 LP_TFIFO的检测上报,低阶告警、性能事件的产生和检测-上行信号流,低阶告警、性能事件的产生和检测-上行信号流,低阶通道终端功能块LPT的功能 LP-POH的写入(C12至VC12)V5字节(信号标记、BIP-2计算、LP_REI的回送)高阶通道适配功能块HPA的功能 VC12适配入TU12再映射到VC4 复帧的生成,高阶通道适配功能块和低阶通道终端功能块,同类型告警,名称不同:2Mbit/s:T_ALOS DOWN_E1_AIS/UP_E1_AIS34Mbit/s:P_LOS P_AIS140Mbit/s:EXT_LOS C4_R_LAISD/C4_T_LAISD,告警和性能事件监视所使用到的通道开销字节不同 2Mbit/s:V5字节34Mbit/s、140Mbit/s:B3、J1、C2和G1字节,34M/140M告警信号和2M告警信号的区别,34Mbit/s和140Mbit/s等速率的PDH业务,其信号处理流程与2Mbit/s业务基本相同,但也存在一些区别:,第1章 SDH告警及性能事件产生原理 1.1 基本概念1.2 高阶告警、性能事件的产生和检测1.3 低阶告警、性能事件的产生和检测1.4 NG-SDH设备对AIS告警下插的支持情况1.5 告警信号间的抑制关系 1.6 性能事件的产生和检测 1.7 告警与性能的关系,内容介绍,NG-SDH设备对AIS告警下插的支持情况,NG-SDH设备支持是否下插AIS告警的开关设置,当光板或支路板收到以下告警时:R_OOF,HP_TIM,HP_SLM,HP_UNEQ,HP_LOM,B1_EXC,B1_SD,B2_EXC,B2_SD,B3_EXC,B3_SD,LP_TIM,LP_UNEQ,LP_SLM,BIP_EXC 可以设置是否向下游下插AIS告警。光板在默认情况下,下插AIS功能开关如下:R_OOF(disable),B1_EXC(enable),B1_SD(disable),B2_EXC(enable),B2SD(disable),B3_EXC(enable),B3_SD(disable),HP_TIM(disable),HP_SLM(disable),HP_UNEQ(disable),HP_LOM(enable)支路单板默认情况下,下插AIS功能开关如下:LP_TIM(disable)、LP_UNEQ(disable)、LP_SLM(disable)、BIP2_OVER(disable),第1章 SDH告警及性能事件产生原理 1.1 基本概念1.2 高阶告警、性能事件的产生和检测1.3 低阶告警、性能事件的产生和检测1.4 NG-SDH设备对AIS告警下插的支持情况1.5 告警信号间的抑制关系 1.6 性能事件的产生和检测 1.7 告警与性能的关系,内容介绍,告警信号间的抑制关系:主要告警抑制树,R_LOS,R_LOF,R_OOF,AU_AIS,AU_LOP,B1_SD,B2_SD,HP_TIM,HP_SLM,HP_LOM,HP_UNEQ,B3_EXEC,B3_SD,TU_AIS,TU_LOP,BIP_EXEC,LP_UNEQ,LP_TIM,LP_SLM,BIP_SD,MS_RDI,HP_RDI,LP_RDI,J0_MM,MS_AIS,B1_EXEC,B2_EXEC,A1、A2字节,RSOH、MSOH(除A1、A2外),第1章 SDH告警及性能事件产生原理 1.1 基本概念1.2 高阶告警、性能事件的产生和检测1.3 低阶告警、性能事件的产生和检测1.4 NG-SDH设备对AIS告警下插的支持情况1.5 告警信号间的抑制关系 1.6 性能事件的产生和检测 1.7 告警与性能的关系,内容介绍,性能事件的产生和检测,误码产生机理:比特间插奇偶校验;发送端将本帧校验结果置于下一帧相应字节中,在接收端收到后再次校验并与发送端结果进行异或运算,根据异或结果判断误码。B1:BIP-8,用于再生段层误码监测;B2:BIP-24(每个STM-1),用于复用段层误码监测;B3:BIP-8,用于高阶通道层误码监测;V5:BIP-2,用于低阶通道层误码监测,性能事件的产生和检测,注意:高阶误码可能会引起低阶误码,但低阶误码不一定引起高阶误码。,误码检测上报,性能事件的产生和检测-误码相关术语介绍,性能事件的产生和检测,指针调整工作机理:是指针根据实际需要进行的调整,以容纳净负荷信号的速率不同步和相位差。即通过指针调整对信息净负荷进行速率调整,使其与STM-N帧同步。指针调整分为:管理单元指针(AU_PTR)支路单元指针(TU_PTR),性能事件的产生和检测,H1 Y Y H2 F F H3 H3 H3,位置:,主要原因:网络时钟不同步。,指针调整状态:,AU指针调整产生机理,性能事件的产生和检测,主要原因:AU指针调整转化为TU指针调整。系统时钟与接收时钟不一致,解复用过程中产生TU指针调整。业务经过的上游网元产生指针调整,穿通到本站后,在解复用过程中产生TU指针调整。,TU指针调整产生机理,指针调整检测上报,远端检测:本站产生远端站点上报。,本端检测:本站产生本站上报。,结论:对于AU指针来说,它一般在上游站产生,而在下游站检测上报;对于TU指针来说,它在AU指针转化成TU指针的站点产生,而在业务终结站点的支路板上检测上报。,第1章 SDH告警及性能事件产生原理 1.1 基本概念1.2 高阶告警、性能事件的产生和检测1.3 低阶告警、性能事件的产生和检测1.4 NG-SDH设备对AIS告警下插的支持情况1.5 告警信号间的抑制关系 1.6 性能事件的产生和检测 1.7 告警与性能的关系,内容介绍,告警与性能的关系,误码相关的性能事件和告警列表,告警、性能关系:告警和性能分属于不同的层次。告警表征在传送数据过程中出现故障,性能表征所传送数据的传送质量优劣程度。但如果性能数据达到或超过设定的阈值时,性能转化为告警,如指针调整转化为LOP,误码则转化EXC告警,从而导致业务中断。,课堂讨论(15分钟),请描述告警抑制关系树。误码和指针的产生机理。告警与性能间的关系是什么?,第1章 SDH告警及性能事件产生原理 第2章 常见告警分析与处理第3章 OSN常见新增告警分析与处理第4章 环带链案例分析,内容介绍,第2章 常见告警分析与处理2.1 SDH接口板常见告警分析与处理2.2 PDH处理板常见告警分析与处理2.3 以太网单板常见告警分析与处理2.4 交叉时钟单元常见告警分析与处理2.5 主控单元常见告警分析与处理,内容介绍,R_LOF,SDH接口板常见告警分析与处理,告警含义:表示接收线路侧帧丢失,为紧急告警。告警产生的可能原因:接收光功率过低或过高;对端站发送信号无帧结构;本板接收方向故障。,SDH接口板常见告警分析与处理,R_LOF/R_LOS的处理步骤:,检查本端收光功率与对端发光功率,检查本端和对端光板的告警,检查本端和对端光板的性能事件,检查本端和对端光板之间的线路,检查是否上游交叉时钟板故障,解决光板报RLOF/RLOS故障,更换故障单板或器件,解决问题,知道这些检查手段吗?,B2_OVER,SDH接口板常见告警分析与处理,表示复用段(B2)误码过量,为主要告警。,告警原因:,接收信号衰减偏大;光纤头不清洁;光纤连接器不正确;本站接收部分故障;对端站发送部分故障。,概述:,SDH接口板常见告警分析与处理,B2_OVER的处理步骤:,检查是否存在更高级别的告警,检查本端和对端光板的告警,检查本端和对端光板的性能事件,检查设备运行环境,检查是否上游交叉时钟板故障,解决光板报B2_OVER告警,更换故障单板或器件,解决问题,再生段误码和复用段误码一定是本端和对端之间故障导致的!,MS_AIS,SDH接口板常见告警分析与处理,表示复用段告警指示,为主要告警。,告警原因:,对端站发送MS_AIS信号;对端站时钟板故障;本板接收部分故障。,概述:,SDH接口板常见告警分析与处理,MS_AIS的处理步骤:,检查对应的线路板是否有R_LOS、R_LOF告警,处理完R_LOS、RLOF后MS_AIS是否消失,复位、更换本端、对端线路板,告警是否消失,更换对端交叉单板,检查告警是否消失,解决光板报MS_AIS告警问题,AU_AIS,SDH接口板常见告警分析与处理,表示AU告警指示,为主要告警。,告警原因:,对端站发送AU_AIS;对端站发送部分故障;本站接收部分故障。,概述:,SDH接口板常见告警分析与处理,AU_AIS告警处理步骤:,找出该告警涉及业务的流向,沿业务流向检查本地光板是否存在更高级别的告警,检查上游站点该业务是否为VC4穿通,是否有高级别告警,检查设备是否处于倒换态,恢复正常态后故障是否消失,检查设备告警、性能事件,进行告警性能分析,解决光板报AU_AIS告警问题,环回定位至故障单板,更换故障单板,AU_AIS是会沿VC4穿通方向下插的!,SDH接口板常见告警分析与处理,其它告警,第2章 常见告警分析与处理2.1 SDH接口板常见告警分析与处理2.2 PDH处理板常见告警分析与处理2.3 以太网单板常见告警分析与处理2.4 交叉时钟单元常见告警分析与处理2.5 主控单元常见告警分析与处理,内容介绍,TU_AIS,PDH处理板常见告警分析与处理,表示TU告警指示,为主要告警。,告警原因:,业务配置错误;对端站对应通道失效;由更高阶告警引起;交叉板故障。,概述:,PDH处理板常见告警分析与处理,TU_AIS告警分析与处理步骤:,检查告警涉及业务的流向,检查沿业务流向是否存在 高级别的会导致TU_AIS下插的告警,检查网元是否处于倒换态,排除倒换问题,检查网元业务配置是否正确,环回分析、更改业务时隙定位故障到单板,更换故障单板,处理TU_AIS告警,TU_LOP,表示TU指针丢失,为主要告警。,告警原因:,支路板与交叉板间接口故障;业务配置错误。,概述:,PDH处理板常见告警分析与处理,PDH处理板常见告警分析与处理,TU_LOP告警分析与处理步骤:,检查告警涉及业务的流向,检查沿业务流向是否存在 高级别的告警,检查网元是否处于倒换态,排除倒换问题,检查网元业务配置是否正确,环回分析、更改业务时隙定位故障到单板,复位相关故障单板,更换故障单板,解决TU_LOP告警问题,T_ALOS,PDH处理板常见告警分析与处理,表示2M接口模拟信号丢失,为主要告警。,告警原因:,2M业务未接入;DDF架侧2M接口输出端口脱落或松动;本站2M接口输入端口脱落或松动;单板故障;电缆故障。,概述:,PDH处理板常见告警分析与处理,TA_LOS告警分析与处理步骤:,在DDF架处对告警通道的业务自环(硬件内环回),在接口板处对该通道进行自环(硬件内环回),,网管上对该通道进行内环回设置,更换故障单板、接口板、电缆,检查告警是否排除。,处理TA_LOS告警,PDH处理板常见告警分析与处理,其它告警,第2章 常见告警分析与处理2.1 SDH接口板常见告警分析与处理2.2 PDH处理板常见告警分析与处理2.3 以太网单板常见告警分析与处理2.4 交叉时钟单元常见告警分析与处理2.5 主控单元常见告警分析与处理,内容介绍,以太网单板常见告警分析与处理,ALM_SUBCARD_ABN,表示检测到子卡状态错误,为主要告警。,告警原因:,接口板不在位或者不匹配。,概述:,处理步骤:,检查接口板是否插好,或者接口板槽位是否和处理板槽位对应。检查网管上是否安装了接口板,或者通过命令行查询对应的接口板是否配置正确。,以太网单板常见告警分析与处理,其它告警,第2章 常见告警分析与处理2.1 SDH接口板常见告警分析与处理2.2 PDH处理板常见告警分析与处理2.3 以太网单板常见告警分析与处理2.4 交叉时钟单元常见告警分析与处理2.5 主控单元常见告警分析与处理,内容介绍,APS_FAIL,交叉时钟单元常见告警分析与处理,表示保护倒换失败指示,为主要告警。,告警原因:,节点的复用段保护参数设置错误;节点的复用段保护参数丢失。,概述:,告警处理:,检查节点的复用段保护参数是否设置正确,修改错误配置后,查看告警是否排除。;检查全网的复用段协议是否正常,重新停止、启动协议后,查看告警是否排除。,APS_INDI,表示保护倒换指示,为主要告警,在环倒换的两端网元上报。,告警原因:,发生复用段保护倒换。,概述:,交叉时钟单元常见告警分析与处理,告警处理:,如果保护倒换后,倒换状态正常,告警正常,业务正常,则该告警不需要处理如果检查到APS_INDI发生的同时,有未结束的AIS告警,则需要分析复用段保护倒换失败的原因,EXT_SYNC_LOS,表示外部时钟源丢失,为紧急告警。,告警原因:,外部时钟源物理接口信号丢失。,概述:,交叉时钟单元常见告警分析与处理,告警处理:,检查外部时钟源是否正常检查时钟输入接口是否正确连接到设备的时钟接口倒换交叉板,检查告警是否消失,LTI告警,表示同步源丢失,为主要告警。,告警原因:,光纤断(跟踪线路时钟);外部源时钟无输入(跟踪外部时钟);同步源设为不可恢复或被阻塞或设置错。,概述:,交叉时钟单元常见告警分析与处理,检查网元的外部时钟源、线路时钟源、支路时钟源的配置,检查外部时钟源输入模式和阻抗配置,测试是否有信号,检查外部时钟输入是否正确的接入到设备,检查时钟相关的线路单元和支路单元是否有LOS告警,处理LTI告警,LTI告警分析与处理,交叉时钟单元常见告警分析与处理,尝试复位时钟相关的线路、支路单板,更换故障电缆、线路单板、支路单板、交叉单板,其它告警,交叉时钟单元常见告警分析与处理,第2章 常见告警分析与处理2.1 SDH接口板常见告警分析与处理2.2 PDH处理板常见告警分析与处理2.3 以太网单板常见告警分析与处理2.4 交叉时钟单元常见告警分析与处理2.5 主控单元常见告警分析与处理,内容介绍,NESTATE_INSTALL,主控单元常见告警分析与处理,表示网元处于安装态,为紧急告警。,告警原因:,网元处于安装态,没有校验开工或校验未通过,概述:,处理步骤:,如果是下发配置后,检查到该告警,一般为配置数据错误导致,更改配置数据,重新下发校验。如果网元在运行过程中出现该告警,请检查主控单板复位记录,并检查网管日志确认用户最近做过什么操作。确认为主控问题,需要更换主控单板,重新下发网管数据。,主控单元常见告警分析与处理,其它告警,第1章 SDH告警及性能事件产生原理 第2章 常见告警分析与处理第3章 OSN部分新增告警分析与处理第4章 环带链案例分析,内容介绍,NG-SDH线路支路单板TR_LOC告警分析与处理,TR_LOC告警告警含义:线路单板或支路单板,检测到交叉时钟板送来的系统时钟丢失告警原因:单板检测到时钟板送来的系统时钟丢失,所以故障原因:交叉时钟板故障本板故障软件缺陷导致交叉板错误的置坏,NG-SDH线路支路单板TR_LOC告警分析与处理,TR_LOC告警处理告警的参数检查:按照第三个参数的值确定哪块交叉单板过来的时钟信号丢失判断是否软件问题:如果故障反复出现,考虑是否版本问题,早期的版本由于交叉单板置坏条件问题,常常导致交叉板被错误的置坏,导致该告警误报,彻底解决需要升级。更换单板:使用替换法确定是交叉板的问题还是线路支路单板的问题,NG-SDH线路支路单板T_LOSEX告警分析与处理,告警含义:单板检测到背板业务总线信号丢失告警原因:单板检测到背板业务总线信号丢失,故障原因:线路板未插好;无交叉板;主备交叉板时钟源失效注:告警参数的详细含义请见备注,NG-SDH线路支路单板T_LOSEX告警,处理步骤:分析告警参数,确定T_LOSEX告警对应的交叉单板检查线路单板和相应交叉单板的母板是否有倒针情况检查线路单板和相应的交叉单板是否插到位用替换法更换线路单板或交叉单板,NG-SDH线路支路交叉主控单板POWER_ABNORMAL,POWER_ABNORMAL告警告警含义:单板检测到电源异常告警原因:各种单板检测的电源种类不同,目前7500主机会对10路电压进行检测,10路电压检测分别是EOW板3.3V,备份电源3.3V,本板3.3V,本板电源模块3.6V,本板1.5V,本板1.8V,本板5V,备份电源在缓起动后的3.3V,A路-48V和B路-48V检测。备份电源在缓起动后的3.3V(V33_BAKIN),A路-48V和B路-48V检测。注:告警参数含义请参考备注和相应的单板开局指导书,NG-SDH单板POWER_ABNORMAL告警分析与处理,POWER_ABNORMAL分析处理:POWER_ABNORMAL告警参数分析:注意该告警在不同类型单板上检测的电源是不同的,请参考相应单板的开局指导书给出的参数分析告警原因。判断是否为本板电源部分故障:如果是本板电源系统故障,请立即更换单板判断是否为备份电源故障:请根据其他单板是否上报该告警确定是本板问题还是AUX或SAP单板问题,并更换故障单板。,NG-SDH线路支路交叉主控单板COMMUN_FAIL,告警含义:板间通信失效,包括485通信和以太网通信。告警原因:485通信或以太网通信失效;板间通信异常,通常是板间通信的芯片出现故障引起,也不排除通讯量太大时其他单板长期占用通讯通道造成阻塞等原因造成。注:告警参数的详细含义请参考备注信息,NG-SDH单板COMMUN_FAIL告警分析与处理,COMMUN_FAIL告警分析与处理分析告警参数,确定是485总线通信失效还是以太网通信失效以太网通信失效导致该告警:和AUX/SAP单板通信问题,可尝试复位AUX/SAP单板或相应的故障单板485总线通信失效导致该告警:更换故障单板解决早期版本存在该告警的误报问题,可以根据版本策略升级解决该问题。,NG-SDH主控/交叉单板HSC_UNAVAIL 告警分析与处理,告警含义:热备份状态异常告警原因:备板坏,业务板检测备板坏,备板上有2型BUSERR,备板硬复位起来不到5分钟等。BUSERR/hardbad告警的误报导致HSC_UNAVIL告警误报,NG-SDH主控/交叉单板HSC_UNAVAIL 告警分析与处理,告警含义:热备份功能不可用告警的作用:指示用户在告警上报的时间段里不能或不要进行人工主备倒换或插拔交叉或主控主板 处理步骤:1、检查备用交叉或主控单板是否存在异常告警,如hardbad、bus_err2、检查备用交叉或主控是否在5分钟内进行复位操作3、如果确认是备用单板故障,需要更换硬件解决,NG-SDH交叉单板BUS_ERR告警分析与处理,告警含义:总线错误告警告警原因:交叉单板检测到支路、线路单板到交叉板的背板总线故障告警分析与处理:交叉板主备倒换,时钟切换,备板频偏相位调整,都会引起信号质量劣化,这个问题在R1B027,R2C01B021,R2C02B014之后的版本已经解决业务板(如SLQ1)未使用总线连到交叉芯片上且信号不稳定,导致交叉板报BUSERR硬件确实存在故障,如帧头没调好,虚焊,导致,芯片故障等,需要更换单板,OSN9500板间通信告警-HDLC_FAIL,告警含义:板间通信失败告警原因:主机和单板间的HDLC通信失败;单板与单板间HDLC通信异常告警分析与处理:HDLC通信失败会导致TPS和SNCP功能异常,处理该告警时,请先检查TPS和SNCP保护是否正常。HDLC通信失败可能是单板没有插到位或软件问题导致,在不影响业务的情况下,可尝试重新拔插单板或复位单板通过上述步骤无法解决,则使用单板替代法定位故障单板,更换坏板。,OSN9500通信告警T_LOSEX,告警含义:线路单板监测到从交叉单板过来的业务信号丢失。告警原因:1、线路单板没有插好 2、交叉板没有插好或者没有交叉板 3、母板相应总线故障。告警分析与处理:在不影响其他业务的情况下,尝试复位线路或相关交叉单板,进行交叉板主备倒换。使用单板替换法,确定故障单板。,OSN9500线路板告警SLAVE_WORKING,告警含义:单板工作在备用交叉时钟、主控板告警原因:主用交叉时钟、主控单板单板故障或者到业务单板的总线有误码,时钟丢失。告警分析与处理:根据告警参数确定是交叉、时钟、还是主控到业务单板的问题检查交叉、时钟、主控单板是否有异常告警,例如:BUS_ERR、SYN_BAD、HARD_BAD告警检查交叉时钟、主控单板是否插好,在不影响业务的情况下,可尝试复位。使用单板替换法定位故障单板,然后更换。,第1章 SDH告警及性能事件产生原理 第2章 常见告警分析与处理第3章 OSN新增告警分析与处理第4章 环带链案例分析,内容介绍,环带链案例分析,某局组网情况如图所示,为SNCP环带链。NE1、NE2、NE4站为OSN 3500设备;NE3站为OSN硬件REG(中继站,仅处理再生段开销字节);NE5站为OSN 2500的TM设备,环带链案例分析,若2站发往3站的单方向光纤中断(2站收3站光信号正常),请根据各单板接收端上报的告警,填写下表。(从给出的告警中选择,没有告警则填无)A、R_LOS;B、MS_AIS;C、MS_RDI;D、TU_AIS;E、LP_RDI;,课题讨论:,主题1:告警与性能产生与检查原理及相互关系。主题2:告警抑制关系,结合实际组网讨论主题3:NG-SDH常见基本告警有哪些?讨论处理过程。,