MSAP故障定位、处理原则、技巧及案例分析.ppt
《MSAP故障定位、处理原则、技巧及案例分析.ppt》由会员分享,可在线阅读,更多相关《MSAP故障定位、处理原则、技巧及案例分析.ppt(61页珍藏版)》请在三一办公上搜索。
1、北京华环电子股份有限公司Beijing Huahuan Electronics Co.,Ltd.,MSAP故障定位、处理原则、技巧及案例分析,讲师 孙振禹,故障定位基本原则故障处理手段故障处理技巧案例分析,主要内容,故障定位基本原则,先外线,后设备在定位故障时,应先排除外部的可能因素的影响,如光纤断、电缆断、用户设备故障或电源问题、电缆虚接、不共地等先单点,后网络尽快准确的把故障定位到单点先群路,后支路首先排除交叉板故障;然后再确认支路先高级,后低级分析告警时,应首先分析高级别的告警,然后再分析低级别的告警分析告警时,应首先分析高阶的告警,然后再分析低阶的告警,故障定位基本原则故障处理手段故障
2、处理技巧案例分析,主要内容,告警、性能数据分析法:利用传输设备网管的告警、性能数据,可帮助我们随时了解全网设备的运行情况,甚至能检测到故障的先兆,将故障解决在萌芽期。故障发生时可知道当前设备存在什么告警,什么时间发生的,以前曾发生过什么告警,性能不好时将给出误码有多少等。从而分析可能发生故障的原因和部位。,故障定位的常用手段(一),排除法:有时出现负载过重,电源过流保护,或SDH设备没有告警,但全部业务都不通的情况,可以用逐块拔单元盘的方法来确定故障盘位。,故障定位的常用手段(二),环回法:在故障处理中有时出现大量的告警性能事件,使维修人员无从着手分析。环回法是传输设备定位故障最常用的方法之一
3、,它的最大特点就是依次逐段定位故障,最终将故障定位到单站或单盘。这种方法也有它自身的缺陷,就是可能会影响正常的业务,并要求维护人员必须清楚设备的硬件连接,如纤芯的连接方向、DDF架的分配、业务通道的组织等,以免误操作延误故障的及时排除。传输设备的环回操作又分为软件环回和硬件环回,硬件环回相对于软件环回要更彻底,但它的操作不是很方便,需到现场才能操作。网管系统提供了软件环回功能,在电路开通和处理单个业务时十分方便。但在做光路环回和群路环回时要十分小心,应避免环回后发生远端站数据通信通路中断。,故障定位的常用手段(三),替换法:替换法就是使用一个正常的物件去替换一个被怀疑工作有异常的物件,从而达到
4、故障定位的目的。替换法适用于及时排除光纤、中继电缆、单盘等故障。此法要求维修人员规范操作,避免正常物件的受损而造成不必要的损失。,故障定位的常用手段(四),配置参数修改法:更改配置适用于故障定位到单站后,通过修改设备的交叉配置数据、单板参数等排除故障。如怀疑某一槽位有问题时,可通过更改板位配置进行排除。更改配置法操作起来比较复杂,对维修人员要求较高,一般不提倡使用,使用此方法前必须对原配置数据进行备份,同时对所进行的操作进行记录,以便故障定位。,故障定位的常用手段(五),1、以尽快恢复业务为原则,但同时一定要做好故障记录,留作分析,防止潜在问题的遗留。2、在解决问题过程中,尽可能少地进行掉电、
5、拔盘等危险 操作,避免因为操作不当而导致问题扩大化。3、尽量通过分析解决问题,避免盲目换盘。4、在自身无法解决问题的情况下,应向单位负责人汇报,请求技术支援。5、设备维修人员应注意对维修知识的学习,从故障处理过 程中吸取维修经验。6、处理完故障要写维修报告。,故障处理的基本原则,故障定位基本原则故障处理手段故障处理技巧案例分析,主要内容,设备指示灯,城网直通车设备接口光接口LOS或者OLOS,灯灭表示正常,红灯光缆故障E1接口E1 LOS,灯灭表示正常,红灯电缆故障;红灯慢闪表环回;红灯快闪表AIS。有些设备(LMXE)没有E1接口指示灯,需要从网管及对端设备判定V.35接口V.35 LOS,
6、灯灭表示正常,红灯电缆故障10/100Base-T接口接口处绿灯表LINK状态,黄灯表示全、半双工状态10/100Base-Fx接口灯灭表示正常,红灯光缆故障,城网直通车设备通用告警指示灯紧急告警 ALM-P一般告警 AML-D城网直通车设备个性告警指示灯H9MO-LMA的Err灯指示光接口有误码H9MO-LMXE的BER3、BER6指标光接口误码,设备指示灯,故障处理技巧利用设备指示灯判定故障利用开销字节判定故障板卡及设备故障简易判定对MSAP告警的理解,故障处理技巧,利用设备指示灯判别故障,城网直通车设备接口光接口LOS或者OLOS,灯灭表示正常,红灯光缆故障E1接口E1 LOS,灯灭表示
7、正常,红灯电缆故障;红灯慢闪表环回;红灯快闪表AIS。有些设备(LMXE)没有E1接口指示灯,需要从网管及对端设备判定V.35接口V.35 LOS,灯灭表示正常,红灯电缆故障10/100Base-T接口接口处绿灯表LINK状态,黄灯表示全、半双工状态10/100Base-Fx接口灯灭表示正常,红灯光缆故障,利用设备指示灯判别故障,城网直通车设备通用告警指示灯紧急告警 ALM-P一般告警 AML-D城网直通车设备个性告警指示灯H9MO-LMA的Err灯指示光接口有误码H9MO-LMXE的BER3、BER6指标光接口误码,故障处理技巧利用设备指示灯判定故障利用开销字节判定故障板卡及设备故障简易判定
8、对MSAP告警的理解,故障处理技巧,更改J0字节跟踪光纤连接,适用场景设备多光方向连出时组环时使用方法改变J0字节为约定字符,在接收侧观察是否在对应光口收到该字节。反之亦然。思考问题?出现RS-TIM告警如何处理?,更改J1字节跟踪高阶通道,适用场景VC-4、VC-3高阶业务时使用方法改变J1字节为约定字符,在接收侧观察是否在对应光口收到该字节。反之亦然。思考问题?出现HP-TIM告警如何处理?,更改J2字节跟踪低阶通道,适用场景多通道绑定的以太网业务,无低阶告警,怀疑时隙未一一对应与其它MSAP厂家或者自己产品跨网对通时使用方法改变J2字节为约定字符,在接收侧观察是否在对应通道收到该字节。反
9、之亦然。多通道绑定的以太网业务中可用些方法逐个核对时隙;跨网对通时,可检查时隙对应否正确思考问题?出现LP-TIM告警如何处理?,正确利用以太网端口包统计,适用场景具有端口数据包统计功能的板卡及设备在开通以太网业务使用方法从网管上查询板卡或者设备的以太网端口包的收、发统计数是否在同比增加。增加表明以太网业务正常;收增长、发不增长或者发增长、收不增长都表明业务不正常,需要查明原因。思考问题?端口发包统计是来源于那个方向?端口收包统计是来源于那个方向?,正确利用以太网端口CRC包统计,适用场景具有端口CRC错包统计功能的板卡及设备在开通以太网业务使用方法网管上查询到有CRC错包数,可能是连接的网线
10、或者光纤(100BASE-FX)有问题。网线的问题表现为网线质量问题、RJ45水晶头问题、网线与水晶头不搭配问题(比如五类线用了6类头)、错误用了三类线等等;网管上查询到有CRC错包数,也可能是网线连接的两个端口一端强制、一端自协商造成的。思考问题?LMXE的以太网盘端口CRC错包统计是来源于那个方向?,故障处理技巧利用设备指示灯判定故障利用开销字节判定故障板卡及设备故障简易判定对MSAP告警的理解,故障处理技巧,板卡及设备故障简易判定,E1端口或者PDH接口板故障判定H9MO-LMXE、H9MO-LMFIT设备在交叉矩阵环回,观察网管低阶通道告警消失,用2M误码仪测试E1端口能测通,表明PD
11、H接口板没有问题。其它城网直通车设备用硬件拔子做相应环回,用用2M误码仪测试E1端口能测通,表明端口没有问题。备注:也可以用光端机2M连接的终端设备2M端口状态来判定V.35端口或者V.35接口板故障判定设备在交叉矩阵环回,观察网管低阶通道告警消失,用V.35误码仪测试V.35接口口能测通,表明V.35接口板没有问题。备注:也可以用光端机V.35接口连接的终端设备来判定,需要终端设备支持,板卡及设备故障简易判定,以太网电接口或者以太网电接口板故障判定设备在交叉矩阵环回,内端口做通道捆绑,观察网管GFP告警消失,表明以太网内部没有问题;用计算机网口(自协商)连接至以太网电接口,端口绿灯和黄灯亮,
12、表明外端口没有问题;以上都正确,表明设备或者板卡没有问题。注意,以太网环回后,不要接入网络交换机,否则会造成桥环路对于H9MO-LMXE和H9MO-LMFIT的通道型板卡,一般有四个独立通道端口,可以把一端口和其它剩余的三个端口中任意一个端口设置业务相通,用两台计算机相PING,PING通表明板卡没有问题。,板卡及设备故障简易判定,以太网光接口或者以太网光接口板故障判定设备在交叉矩阵环回,内端口做通道捆绑,观察网管GFP告警消失,表明以太网内部没有问题;以太网光接口环回,接口指示灯灭,表明外端口没有问题;以上都正确,表明设备或者板卡没有问题。注意,以太网环回后,不要接入网络交换机,否则会造成桥
13、环路对于H9MO-LMXE和H9MO-LMFIT的通道型板卡,一般有四个独立通道端口,可以把一端口和其它剩余的三个端口中任意一个端口设置业务相通,相应以太网光接口外接两个光纤收发器,再用两台计算机相PING,PING通表明板卡没有问题。,板卡及设备故障简易判定,如何做交叉矩阵环回即源、宿盘位选择同盘位同时隙,交叉矩阵环回会导致原有业务重新设置,板卡及设备故障简易判定,SDH光接口或者SDH光接口板故障判定光口用跳纤环回,观察网管光接口告警消失,接口指示灯灭。表明SDH光接口或者SDH光接口板没有问题。,故障处理技巧利用设备指示灯判定故障利用开销字节判定故障板卡及设备故障简易判定对MSAP告警的
14、理解,故障处理技巧,AIS与RDI,AISAIS 告警(全1 告警):对下一级电路插全1,告知该信号不可用。常见的AIS告警有MS-AIS、AU-AIS、TU-AIS 和E1-AIS 等。业务配置正确后不会出现MS-AIS、AU-AIS、TU-AIS 告警。信道空闲会发E1-AIS。RDIRDI告警(远端接收缺陷指示):用于指示对端站检测到LOS(信号丢失)、AIS、TIM(追踪识别符失配)等告警后,而传给本站的对告。常见的告警有MS-RDI、HP-RDI 和LP-RDI等。RDI出现后应该是对端收或者本站发故障。,B1、B2、B3与REI,B1、B2、B3B1、B2或者B3误码计数:B1是再
15、生段误码计数、B2是复用段误码计数、B3是高阶误码计数。出误码后首先要检查光缆衰减。出误码后然后检查对端发或者本站收故障,可用环回法判定。REIREI告警(远端误码指示):对端站接收到B1、B2或者B3误码,而传给本站的告警。常见的告警有RS-REI、MS-REI 和HP-REI等。出误码首先要检查光缆衰减REI出现后应该是对端收或者本站发故障,可用环回法判定。,TIM与SLM,TIMTIM 告警(追踪识别符失配):本站与对端站低阶通道追踪识别符配置不一致。常见的TIM告警有RS-TIM、HP-TIM、LP-TIM 等。国内厂商设备出现TIM告警一般不会影响业务。国内厂商设备出现TIM告警会下
16、插全1。SLMSLM告警(信号标记失配):本站应收信号标记与对端站应发信号标记配置不一致。常见的告警有HP-SLM 和LP-SLM等。一般厂家设备出现SLM告警会在通道下插全1。我公司设备不会下插全1,如果通道净荷相同,不会影响业务。,TDM电路告警一,TDM电路告警二,低阶无告警表明电路正常,低阶无告警表明电路正常,透传型以太网电路告警,低阶无告警和GFP不失步表明电路正常,低阶无告警和GFP不失步表明电路正常,汇聚型以太网电路告警,低阶无告警和GFP不失步表明电路正常,低阶无告警和GFP不失步表明电路正常,故障定位基本原则故障处理手段故障处理技巧案例分析,主要内容,案例一(1),故障现象:
17、妥宁网通分公司SCDMA的基站(北京信威的产品,BSC设在成都)网管系统显示南涪小区基站业务6月15日从PDH割接至华环SDH环网后基站频繁告警,并出现基站系统复位,最终造成业务瞬断。妥宁网通分公司曾经怀疑基站GPS时钟模块有问题(基站时钟同步于GPS),更换VCC板,故障依旧。怀疑在用的通道有问题,在华环公司设备上重新换一个2M,问题还是存在。网络拓扑:,案例一(2),处理过程 查阅基站网管系统历史告警信息,并从中找到可能的故障原因。网管中告警多显示E1的CRC4校验错和RAI对告,其中隔一段时间出现基站复位,业务瞬断。和妥宁网通分公司负责大灵通基站的工程师沟通,说以前PDH链路很正常,更换
18、华环SDH后故障频繁。询问基站设备复位原因,设备本身时钟同步问题,链路误码等都会使基站设备自动复位。网通工程师更换过基站设备上的VCC板,排除了基站设备本身有问题。从故障发生时间分析,最有可能是基站设备至华环SDH段链路误码造成基站复位,业务瞬断。为确定误码产生在那一段,在妥宁网通王工陪同下,我们到了射洪县新阳机房。首先测试以前用过出问题的2M通道(从南涪小区LMXE的2M端口做软件环回)二个小时,没有误码,华环的传输设备没有问题。然后到南涪小区基站,查看在用的电路,发现此电路在DDF架上有一条电缆的外皮虚焊并断开,随后检查基站设备(信威的CW95-18B)已接地、LMXE设备没有接地、DDF
19、架也没有接地,测量基站设备2M接口外皮和地有感应的33.3V直流电压,由此我确定故障点就在南涪小区2M线缆这一段。焊好虚焊点,LMXE、DDF架接地。从基站设备2M处接误码仪,新阳站DDF架上硬环回,测试一个小时没有误码。最后拉直电路长时间观察,业务没有问题,基站工作正常。结论 由于基站设备和华环传输设备LMXE的不共地,两点出现电位差,造成南涪小区传输设备和基站设备之间2M线缆产生误码。从而导致基站复位,业务瞬断。,案例二,故障现象:H9MO-LMFIT与ECI设备XDM-16测试通道保护,业务的通道保护设置正确。ECI设置通道保护业务也正确。ECI自己环回业务能通,FIT自己环回业务也能通
20、。FIT和XDM-16光口互联后,业务不通,更谈不上测试通道保护。原因分析:ECI和FIT自己环回业务能通,说明业务设置没有问题。问题应该出在不同厂家光口的一些参数设置。查看FIT网管光口没有任何告警,但查询ECI网管在对应FIT的光口J0、J1失配告警。把ECI的J0、J1字节禁止,业务马上开通。根据协议J0、J1失配SDH设备会下插全1,所以通道不会通。禁止J0、J1字节后(注意不是屏蔽),ECI设备不在下插全1,业务开通。通道保护也顺利测试通过。FIT缺省不检测J0、J1,也不能设置J0、J1,所以不会有告警。知识点:J0-再生段踪迹标识,英文RS-TIM;J1-高阶通道踪迹标识,英文H
21、P-TIM,案例三,故障现象:H9MO-LMFIT与ECI设备XDM-16测试E1及以太网业务互通性,XDM-16设 置时隙1-4,FIT也设置1-4。除第一时隙通以外,其它时隙业务不通。原因分析:第一时隙业务能通起来,说明直接相连ECI XDM-16和FIT之间的光口参数设 置正确。第一时隙的业务配置也正确。其它时隙不能通,是因为不同厂家对于TUG时隙的编号不一致造成的。根据测试,XDM-16设置的时隙1,2,3,4时隙对应FIT编号为1,4,7,10的时隙。FIT设置业务时把时隙对应好后业务开通,测试成功。知识点:华为、华环、格林威尔、瑞士康达等厂家TUG时隙编号一致,叫TS方式。ECI、
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- MSAP 故障 定位 处理 原则 技巧 案例 分析

链接地址:https://www.31ppt.com/p-5440790.html