SNCP故障定位及典型数据分析.ppt
SNCP故障定位及典型数据分析,课程目标,回顾SNCP基本概念和原理,掌握典型组网下的业务配置方法,解决配置错误问题;回顾各产品SNCP组网特性,掌握混合组网时重点关注点,排除对接开销、倒换条件设置错误问题;掌握SNCP故障定位的方法和思路及故障数据分析方法;解决深层次SNCP故障定位问题。通过数据分析演练,巩固SNCP故障定位的方法。,回顾SNCP基本概念及原理、典型组网业务配置回顾和演练各产品SNCP组网特性回顾SNCP故障定位思路及故障数据分析方法采集数据分析演练,主要内容,思考:1、组成SNCP业务对的三要素?2、拖延时间及什么时候需要拖延时间?3、完成SNCP保护倒换各单板的作用?4、SNCP保护原理双发选收与PP环的区别?5、哪些单板上会保存SNCP业务编号数据?6、主控板在SNCP保护倒换中是否必须?,这些问题您会吗?,基本概念和原理回顾,思考:满足什么条件才能生成SNCP业务对?1、节点属性为SNCP,在本节点上下低阶业务(包括2M、34M),是否会生成SNCP业务对?2、节点属性为SNCP,在本节点配置跨环业务(即环间业务),是否会生成SNCP业务对?3、节点属性不为SNCP,若为MSP环DNI结构,且在本节点配置跨环业务,是否会生成SNCP业务对?,总结:生成SNCP业务对必要的条件1、节点属性为SNCP或隐含具有SNCP属性;2、配置跨环业务。,基本概念和原理回顾,SNCP独立节点业务配置规律总结,业务配置规则:在相切的节点处,如果业务源宿均具有业务复制特性,一般 按照环的外围进行业务配置;业务复制规则:业务源如果是SNCP属性,生成SNCP业务对;业务宿如果是SNCP、PP属性,业务将在节点处双发,此时如果业务源为PP属性,就会同向双发;,注:以上业务复制规则不适用DNI网络,1)配置:sys1,gw1-sys2,gw1自动生成:sys1,ge1-sys2,gw1(业务对)sys1,gw1-sys2,ge1(双发业务)sys1,ge1-sys2,ge1(业务对)2)配置:sys2,ge1-sys1,ge1自动生成:sys2,gw1-sys1,gw1(同向复制业务),sys1,sys2,w,e,w,e,SNCP环,PP环,典型组网业务配置:SNCP切PP环,思考:两环任意处各断一纤,环间的业务是否有保护?,典型组网业务配置演练,w,e,w,e,SNCP环,SNCP环,2500+,2500+,e,1+1线性复用段,w,w,#1节点配置和业务生成:1)配置:sys1,gw1-sys2,ge1自动生成:sys1,ge1-sys2,ge1(业务对)sys1,gw1-sys1,ge1(contiue业务)2)配置:sys2,ge1-sys1,gw1自动生成:sys2,gw1-sys1,gw1(业务对)sys2,ge1-sys2,gw1(contiue业务)#2节点配置和业务生成:1)配置:sys1,ge1-sys2,gw1自动生成:sys1,gw1-sys2,gw1(业务对)sys1,ge1-sys1,gw1(contiue业务)2)配置:sys2,gw1-sys1,ge1自动生成:sys2,ge1-sys1,ge1(业务对)sys2,gw1-sys2,ge1(contiue业务)反向业务雷同。,sys1,SNCP环,SNCP环,w,sys1,sys2,sys2,w,w,w,e,e,e,e,#1节点,#2节点,主节点,主节点,从节点,从节点,典型组网业务配置:SNCP与SNCP相交,思考:1、环间的业务保护情况?2、相交环使用共享光纤时配置需要注意哪些?,典型组网业务配置:SNCP与MSP相交,外侧:主节点西向/从节点东向内侧:主节点东向/从节点西向,#1节点配置和业务生成:配置:sys1,gw1-sys2,gw1自动生成:sys2,ge1-sys2,gw1(业务对)2)配置:sys2,gw1-sys1,gw1自动生成:sys2,gw1-sys2,ge1(continue 业务)#2节点配置和业务生成:配置:sys1,ge1-sys2,gw1sys2,gw1-sys1,ge1无自动生成;,sys1,SNCP环,sys1,#1节点,#2节点,主节点,从节点,主节点,从节点,w,w,w,e,e,e,e,w,sys2,sys2,MSP环,#1节点配置和业务生成:配置:sys1,gw1-sys2,gw1自动生成:sys2,ge1-sys2,gw1(业务对)sys1,gw1-sys1,ge1(continue业务)2)配置:sys2,gw1-sys1,gw1自动生成:sys1,ge1-sys1,gw1(业务对)sys2,gw1-sys2,ge1(continue 业务)#2节点配置和业务生成:配置:sys1,gw1-sys2,gw1sys2,gw1-sys1,gw1无自动生成;,sys1,MSP环,sys1,#1节点,#2节点,从节点,MSP环,sys2,sys2,主节点,主节点,从节点,w,w,e,e,w,w,e,e,典型组网业务配置:MSP与MSP相交,典型组网配置:DNI结构,#1节点配置和业务生成:1)配置:sys1,gw1-sys2,gw1自动生成:sys1,gw1-sys1,ge1(contiue业务)sys1,ge1-sys2,gw1(业务对)2)配置:sys2,gw1-sys1,gw1无生成业务#4节点配置和业务生成1)配置:sys1,ge1-sys2,gw1自动生成:sys1,ge1-sys1,gw1(continue业务)sys1,gw1-sys2,gw1(业务对)2)配置:sys2,gw1-sys1,ge1无业务生成,SNCP/MSP主从节点业务配置规律小结,业务配置规则:在相交的节点处,均需配置为双向业务;业务复制规则:SNCP主从节点处业务复制规则一致,但均区别于独立的SNCP 节点;MSP主从节点处业务复制规则可以用内侧、外侧来诠释,即:业务源为外侧,就会continue业务;业务宿为外侧,就会生成SNCP业务对;业务源宿均为内侧,不会复制业务。,注:以上业务复制规则只适用DNI网络,典型组网业务配置演练,w,e,w,e,SNCP环,SNCP环,10GV2R004,2500+,e,1+1线性复用段,w,w,小结,本部分主要在回顾SNCP相关概念、原理的基础上,对典型组网业务配置进行演练和回顾,重点掌握各种组网情况下的业务配置规律,掌握保护路由分析。本部分的介绍主要以4.0平台为例,在配置SNCP业务时需要注意5.0平台的不同点,5.0平台默认具有SNCP属性,不需要创建SNCP节点即可创建相关的业务。,思考:5.0平台SNCP组网,本地上下业务如何配置?,各产品SNCP组网特性回顾,重点关注:HPTIM告警AUAIS透传,各产品SNCP组网特性,盒式设备版本支持情况,各版本支持SNCP情况(包括高阶、低阶),各产品SNCP组网特性,盒式设备版本支持情况,各版本支持VC4 SNCP倒换条件说明,各产品SNCP组网特性,155/622/2500设备版本支持情况,各版本支持SNCP情况(包括高阶、低阶),各产品SNCP组网特性,155/622/2500设备版本支持情况,各版本支持VC4 SNCP倒换条件说明,注1:SL4 V7.30(受控)在配置VC4级别的业务时能够下插或透传AU-AIS注2:2500软REG 32ASP板04年9月推出的版本支持AU-AIS透传功能。,各产品SNCP组网特性,2500+设备版本支持情况,各版本支持SNCP情况(包括高阶、低阶),所有版本均支持。,各版本支持VC4 SNCP倒换条件说明,各产品SNCP组网特性,10G MADM设备版本支持情况,各版本支持SNCP情况(包括高阶、低阶),VC4级别SNCP所有版本均支持,VC12级别SNCP从R3开始支持。,各版本支持VC4 SNCP倒换条件说明,J1字节跳变,因此只能利用AUAIS来触发倒换。需将S16板单板软件升级至2.19及以上,该版本的软件才具有AUAIS告警透传功能。同时需要消失HP_TIM告警做为SNCP的倒换条件。目前最新主机也无法成功设置取消HP_TIM告警做为倒换条件,只能通过PTP命令来直接设置单板侧数据,再用SPTP命令进行保存。取消HP_TIM作为SNCP倒换条件的方法:主机侧:cfg-set-sncvc4:sys1,gw1,1,sys2,gw1,1,0 说明:该方案要求全环线路板必须支持AU-AIS透传功能。,取消HPTIM告警作为倒换条件的方法,误码倒换支持情况,误码倒换是SNCP的倒换的可选条件低阶(V12级别,包括VC3级别)的SNCP业务,产品支持情况如下:,不直接支持的原因是SNCP检测点无法判断线路板低阶通道是否出现了误码劣化或误码越限,各产品SF/SD抢占情况,各产品支持的SNCP倒换条件可能不同,具体包括:SF包括:RLOS、RLOF、MSAIS、B2-EXC、AULOP和AUAIS;SD包括:HP-UNEQ、HP-TIM、B3-EXC和B3-SD。对于SF不抢占SD的SNCP节点,在所有被设置为SNCP的倒换条件中,如果有一个倒换条件“故障”,则会认为相应通道出现“故障”,SNCP相应通道的状态即被置为“bad”。对于主用通道,则会启动倒换;对于备用通道,则会认为备用通道“bad”,在工作通道检测到其它倒换条件的情况下,也不倒换。各产品是否支持SF抢占SD统计如下(该功能非必须的):,各产品SNCP组网限制,各产品SNCP组网支持情况,各产品SNCP组网限制,网管对SNCP组网支持情况,小结,注:2500的4.5.5.12主机侧取消了HPTIM告警作为默认的倒换条件,但单板侧依旧默认作为倒换条件。,本部分主要回顾各产品SNCP组网特性,掌握混合组网时重点关HPTIM告警和AUAIS透传。关于各产品组SNCP环时,对于各个告警做为SNCP的倒换条件,请根据前面的回顾在下面的空格中填入A代表“缺省”、B代表“必配”、C代表“选配”或D代表“不配”。:,SNCP故障定位和数据分析,SNCP保护倒换的常见故障原因分析,SNCP保护倒换的常见故障现象和原因主要 有:,SNCP故障定位思路(1),了解中断业务的信号流及业务配置及版本信息确认倒换点动作,判断是未发生倒换还是倒换后业务中断,通过检查交叉板数据。相关的查询命令是::cfg-get-bdslot:xcsbid,bus,0 xff(xcsbid为交叉板id):cfg-get-bsslot:cfg-get-xcsslot:xcsbid(xcsbid为交叉板id)如果是SNCP已经倒换但业务中断,则不属于SNCP故障,需另作分析。,SNCP故障定位思路及处理步骤,SNCP故障定位思路(2),如果是SNCP未倒换,则需查询中断SNCP业务编号是否一致。如不一致软复位交叉可重新生成编号信息或在网管上对故障业务执行一次激活/去激活操作。SNCP编号的查询应分别查询主机、交叉板和线路板,并比较三者的结果是否一致,具体的命令如下::cfg-get-sncpair(查询主机保存的sncp编号信息):ptp:xcsbid,12,c0,0(查询交叉板保存的sncp编号信息,多包数据返回):ptp:bid,12,b9,光口号,0,0(bid为线路板id,查询线路板保存的sncp编号信息,敲一次命令返回一包数据,需要敲多次),SNCP故障定位思路及处理步骤(续),SNCP故障定位思路(3),如果SNCP编号一致,则根据前面分析的中断业务得知对应的SNCP编号,查询中断SNCP业务状态(主机、单板)判断是否未状态检测上报异常;具体的查询命令如下::cfg-get-sncstate:业务走向(查主机,具体命令见相关手册):ptp:xcsbid,fa,f,1,high,low(查出问题的SNCP在交叉板的状态.sncp编号,高位在前低位在后,注意备板不上报):ptp:bid,12,b9,光口号,0,0(查线路板的sncp编号,要敲多次才能查全)同时,要通过命令:ptp:xcsbid,fa,19,1,high,low(SNCP编号,高位在前低位在后)查询出问题的sncp的状态变量,此环节一定要做,以帮助返回分析。如果发现线路板、交叉板和主机上报的状态异常,则可以推断相关单板可能存在问题。则需要查询线路板的SD525芯片;采集交叉板的5B数据,协助分析故障原因。,SNCP故障定位主要采集的数据,基本数据:组网图、配置文件、软硬件版本查询告警和性能数据查询SNCP业务的好坏以及工作状态查询线路板当前SNCP业务状态查询交叉板以及主机的SNCP业务配置查询交叉板黑匣子数据查询线路板开销穿通模式,详细请参见“中低端SDH问题处理数据反馈指导书”以及“10GV2设备常见网上问题处理数据反馈指导书”。,SNCP故障数据采集,常用数据采集命令,:cfg-get-xcsslot:bid;/查询当前交叉板业务连接信息:ptp:bid,fa,f,0;/查询当前交叉板上SNCP的状态:ptp:bid,12,b9,光口号,0;/查询线路板上SNCP的编号信息:ptp:bid,12,c0,0;/查询交叉板SNCP配置数据:cfg-get-sncpair;/查询主机业务配置数据:ptp:bid,16,0;/查询是否有COMM_FAIL告警:ptp:bid,fa,4.10,1,0;/查询交叉板配置数据:ptp:bid,12,98,a0;/查询线路板的开销模式:ptp:bid,5b,1/2/3,0/ff;/查询交叉板5B事件,2500+设备常用命令,155622设备常用命令,常用数据采集命令,:ptp:bid,12,c3,0;/查询当前主用交叉板上SNCP的状态说明:只需关注返回数据“SNCSTATE”项,将该项返回值转化为二进制,各位含义如下bit7bit2 bit1 bit0 当前状态 备用状态 主用状态 0为主1为备 0为好1为坏 0为好1为坏,10G MADM设备常用命令,:cfg-get-sncpstate/查询SNCP保护组的状态:cfg-get-sncdivert/查询监测点状态,155622设备常用命令,常用数据采集命令,:ptp:bid,12,c3,0;/查询当前主用交叉板上SNCP的状态说明:只需关注返回数据“SNCSTATE”项,将该项返回值转化为二进制,各位含义如下bit7bit2 bit1 bit0 当前状态 备用状态 主用状态 0为主1为备 0为好1为坏 0为好1为坏,10G MADM设备常用命令,:cfg-get-sncpstate/查询SNCP保护组的状态:cfg-get-sncdivert/查询监测点状态,以2500为例进行数据分析(1),倒换前数据:cfg-get-xcsslot:7 XCS BOARD SLOT(HEX)SRC-BUS SRC-SLOT SINK-BUS SINK-SLOT LEVEL NUMBER 0 x20 2 0 x50 2 bdvc12 5041 0 x22 1 0 x52 1 bdvc4 5166 Total records:2倒换后数据:cfg-get-xcsslot:7 XCS BOARD SLOT(HEX)SRC-BUS SRC-SLOT SINK-BUS SINK-SLOT LEVEL NUMBER 0 x40 2 0 x50 2 bdvc12 5041 0 x42 1 0 x52 1 bdvc4 5166 Total records:2,查询业务判断是否发生倒换,以2500为例进行数据分析(2),查询主机保存的SNCP业务编号:cfg-get-sncpair SNC PAIR GRP ID Sbus Sslot Pbus Pslot Dbus Dslot 0 x00 0 x0001 0 x20 0 x02 0 x40 0 x02 0 x50 0 x02 0 x00 0 x0002 0 x22 0 x01 0 x42 0 x01 0 x52 0 x01,查询SNCP业务编号,以2500为例进行数据分析(3),查询交叉板保存的SNCP编号信息:ptp:7,12,c0,0cmd 0:07 12 c0 00 04 20 82 40 82 50 02 01 00 00 0122 01 42 01 52 01 04 00 00 02 ff ff,以2500为例进行数据分析(4),查询线路板保存的SNCP编号信息,方法一:使用ptp命令/工作源对应线路板信息:ptp:5,12,b9,1,0,0cmd 0:05 12 b9 01 02 00 02 03 01 04 00 87 02,以2500为例进行数据分析(5),查询线路板保存的SNCP编号信息,方法二:采用主机命令cfg-get-sncsdh:5 SNC SDH GRP ID Bus Slot Start Stype Hdtime XCbid 0 2 3 1 0 1 0 135 Total records:1:cfg-get-sncsdh:6 SNC SDH GRP ID Bus Slot Start Stype Hdtime XCbid 0 2 3 1 0 1 0 135 Total records:2,以2500为例进行数据分析(6),查询命令:cfg-get-sncstate:sys1,g1w1,2,sys2,g1w1,2,vc12;:ptp:7,fa,f,0;/查询所有的SNC业务状态:ptp:7,fa,f,1,00,01;/查询SNCP编号为00 01的在交叉板上的状态 返回值 SNCP STATE LEVEL SRC-SYS SRC-VC4 SRC-SLOT DST-SYS DST-VC4 DST-SLOT WORK PROT PATH STATE vc12 sys1 g1w1 2 sys2 g1w1 2 bad bad work snormal,查询SNCP业务状态,以2500为例进行数据分析(7),SNCP业务对状态,查询SNCP业务状态,以2500为例进行数据分析(8),查询命令::ptp:xcsbid,fa,8f,1(A通道)/2(B通道),1(打开),a5;:apsc-set-mbrep:xcsbid,true;/(xcsbid为交叉板id)返回值:(交叉板PTP C3命令返回值)BS AUTOREPORT cmd 0:07 0d 13 99 22 02 09 22 c3 01 01 00 02 00 80 03 00 00 a8 d8 07 00 9c a9 08 00 eb e0 02 00 38 dc 07 00 01 01 返回含“c3”命令的为上报的SNCP状态信息,上述画有下划线的解释如下页表格所示:,线路板向交叉板上报SNCP业务对状态,以2500为例进行数据分析(9),线路板向交叉板上报的SNCP业务对状态信息,以2500为例进行数据分析(10),线路板SNCP业务状态上报异常(对应S16时是交叉板)时,可以通过查询SD525芯片状态验证是业务监测异常还是状态上报异常。查询SD525芯片的命令为::ptp:bid,56,address1,address2,address3,address4,length(以地址开始的length长度的所有寄存器值,一般长度为0 x80,单板类型不同对应的地址有区别)。Address1一般取0,address2&address3&address4为单板各通道对应的寄存器地址。该命令主要是排除是否是SD525问题,检查对应的业务是否有TULOP告警。具体数据请参见附件:,SD525芯片状态查询,小结,本部分通过对SNCP故障定位思路阐述、通过对采集数据分析的基础上,重点掌握SNCP故障定位的方法和思路及主要故障数据分析方法。,通过这部分的学习,您是不是发现分析SNCP故障数据不再是一件难事?,总结,在回顾SNCP相关概念、原理的基础上,对典型组网业务配置进行演练和回顾,重点掌握各种组网情况下的业务配置规律,掌握保护路由分析,排除配置错误类问题。回顾各产品SNCP组网特性,掌握混合组网时重点关HPTIM告警和AUAIS透传。排除对接开销、倒换条件设置错误。通过对SNCP故障定位思路阐述、通过对采集数据分析的基础上,重点掌握SNCP故障定位的方法和思路及主要故障数据分析方法。,