TRTS06C11ZXTRRNC系统故障排查(对接).ppt
ZXTR RNC系统故障排查(对接),中兴通讯学院,学习目标(必选),学习完此课程,您将会:掌握Iub口对接故障。掌握Uu口对接故障。掌握Iu口对接故障。,课程内容,第一部分 常见故障现象Iub口对接故障现象Uu口对接故障现象Iu口对接故障现象 第二部分 故障定位思路Iub口对接类故障基本定位思路Uu口对接类故障基本定位思路Iu口对接类故障基本定位思路,常见故障现象,按照3GPP接口类型,将常见的对接故障分为三类Iub口对接故障;Uu口对接故障;Iu口对接故障,Iub口对接故障,Iub口对接故障现象物理层不通(光口类型);物理层不通(E1类型);物理层已经连通,但是AAL5链路不通;AAL5链路正常,但是小区建立失败;小区建立成功,但是公共传输信道反复删建;无线链路建立失败;,Uu口对接故障,Uu口对接故障现象Uu口没有看到任何信令;UE发了RRC连接请求,直接被RNC拒绝;RRC连接建立流程失败;,Iu口对接故障,Iu口对接故障现象物理层不通;到MGW的信令点状态不可达;到MGW的信令点状态可达,到MSCS的信令点不可达;MGW和MSCS的信令点状态为可达,但SCCP连接失败;CS域位置更新失败;CS域RAB指派失败;PS域Attach失败;PDP上下文激活失败;PDP上下文激活成功,向PDN ping包不通;向PDN ping小字节包通,向PDN ping大字节包不通;,故障定位思路,Iub口对接类故障基本定位思路物理层不通(光口类型):【故障现象】:1)NodeB侧接口板(IIA/IIP等)告警指示灯有红灯告警;2)RNC侧接口板(APBE/APBI/SDTB/GIPI)的光口指示灯熄灭;3)LMT或者OMCB的告警管理上有光口告警;4)OMCR的告警管理上有光口告警;,故障定位思路,Iub口对接类故障基本定位思路物理层不通(光口类型):【排查思路】:检查RNC侧接口板和NodeB侧接口板的RUN灯是否是1Hz慢闪,来判断单板是否运行正常。正常情况下单板的RUN灯应该是1Hz慢闪,如果不正常,则检查单板的版本加载是否正常,单板硬件是否损坏,可以尝试替换单板来判断。检查双方的光模块是否匹配(单模还是多模)。检查光纤的收发是否接反了,RNC侧的Tx口的光纤应该接到对端的Rx口,RNC侧的Rx口的光纤应该接到对端的Tx口。检查每一条光纤是否和其他光纤交叉了。检查RNC到CN的光纤/光模块有没有插紧,如果收到了光信号,光口指示灯会常亮。判断传输线缆是否正常,通常可以采用逐段环回法来定位。基本原则是在各个线缆对接的地方,可以分别向RNC和CN进行自环,最终定位到某段传输具体出问题的地方。一般使用光纤法兰盘来进行环回测试。检查RNC和NodeB侧的相关数据配置是否正确,例如配置的Iub接口应该为STM-1类型,而实际上配置的是E1类型。,故障定位思路,Iub口对接类故障基本定位思路物理层不通(E1类型):【故障现象】:NodeB侧接口板(IIA/IIP等)告警指示灯有红灯告警;LMT或者OMCB的告警管理上有E1告警;OMCR的告警管理上有E1告警;,故障定位思路,Iub口对接类故障基本定位思路物理层不通(E1类型):【排查思路】:检查RNC侧接口板和NodeB侧接口板的RUN灯是否是1Hz慢闪,来判断单板是否运行正常。正常情况下单板的RUN灯应该是1Hz慢闪,如果不正常,则检查单板的版本加载是否正常,单板硬件是否损坏,可以尝试替换单板来判断。检查基站侧的E1线有没有插紧,如果收到了电信号,E1指示灯没有红灯告警。检查传输线缆是否正常。判断传输线缆是否正常,通常可以采用逐段环回法来定位。基本原则是在各个线缆对接的地方,可以分别向RNC和NodeB进行自环,最终定位到某段传输具体出问题的地方。一般依靠传输网管来进行环回测试。环回的时候需要注意,如果基站是配置的IMA组,则环回时必须将该IMA组内所有E1都自环,才能看到IMA组的正常状态;或者把IMA组里面的E1都断开以后,再一路一路单独环回查看。检查RNC侧的IMA组的配置是否与NodeB侧的IMA组配置一致,主要看接口类型是否匹配,是否加扰,时钟模式,协议版本等参数。,故障定位思路,Iub口对接类故障基本定位思路物理层不通(E1类型):【排查思路】:SDH的传输制式有两种,不同的厂家可能采用不同的传输制式,这两种制式下的时隙对应关系不同,所以对接的时候注意要问清楚传输厂家的传输制式。RNC的传输制式可以在SDTB板的单元属性里面修改。一般来说,与华为的传输设备对接时,选择“ITUT-G.703排列PCM”,与中兴的传输设备或烽火的传输设备对接时,选择“Tributary排列PCM”,即能做到两端打散之后的E1次序一致。,故障定位思路,Iub口对接类故障基本定位思路物理层连通,但是AAL5链路不通;【故障现象】:物理层连接正常。查看网管告警,有该基站的NCP,CCP,ALCAP等AAL5链路的告警,有小区退服和NodeB退服告警。【排查思路】:在OMM的动态管理管理中,查看NCP,CCP,ALCAP等AAL5链路对应的PVC的状态,查看该PVC是否被人工闭塞了。检查双方的PVC配置中的cVPI/cVCI是否匹配。分别向RNC和NodeB物理自环,看看SSCOP状态是否正常。如果自环后SSCOP状态不正常,则需要判断接口板的运行状态。,故障定位思路,Iub口对接类故障基本定位思路AAL5链路正常,但是小区建立失败;【故障现象】:有小区退服和NodeB退服告警。NBAP信令跟踪显示,审计请求和审计响应以后,RNC没有下发小区建立请求。或者RNC下发小区建立请求,NodeB回应小区建立失败。【排查思路】:检查RNC侧和NodeB侧的相应硬件告警,如果有告警先处理告警。检查RNC侧和NodeB侧是否配置了本地小区,配置的本地小区ID是否一致。检查RNC侧是否RUB所有的DSP都被闭塞或者DSP资源已经耗尽。检查NodeB侧的本地小区是否被阻塞了,TBPx系列基带资源板是否被闭塞了,小区的载波资源是否被闭塞了。检查审计响应的结果是成功还是失败,如果失败则检查NodeB的运行状态。,故障定位思路,Iub口对接类故障基本定位思路小区建立成功,但是公共传输信道反复删建;(一)【故障现象】:有公共传输信道告警。NBAP信令跟踪显示,公共传输信道建立请求,公共传输信道建立响应,之后RNC立即又发起公共传输信道删除请求,NodeB回应公共传输信道删除响应。【排查思路】:检查ALCAP链路是否被闭塞了,可以在OMCR上查询ALCAP的状态。ALCAP链路虽然通了,但是和RNC侧的ALCAP链路对应错误,比如该条PVC,NodeB侧配置的用途是ALCAP,RNC侧配置的用途是CCP。NodeB侧的ATM地址和RNC侧对应局向的ATM地址不一致。NodeB侧的AAL2链路的VPI,VCI,PathID和RNC侧对应局向的AAL2链路的cVPI,cVCI,PathID配置不一致。NodeB配置的AAL2的条数和RNC配置的AAL2的条数不一致。,故障定位思路,Iub口对接类故障基本定位思路无线链路建立失败;【故障现象】:业务信令跟踪显示,在RRC连接建立过程中,RNC发起“无线链路建立请求”,NodeB回应“无线链路建立失败”。【排查思路】:检查NodeB侧的CCP链路的编号是否正确,正常值应该为1。检查NodeB工作状态异常,负荷拥塞,没有可用资源。Iub口带宽不足会导致无线链路建立失败或者无线链路重配取消。,故障定位思路,Uu口对接类故障基本定位思路Uu口没有看到任何信令;【故障现象】:小区建立成功,但是Uu口的信令跟踪没有任何关于该UE的信令。【排查思路】:确认手机是选择的TD-SCDMA模式或者Dual模式。是否驻留在本小区的覆盖区域,是否锁频到别的小区。通过手机的测试模式,确认手机是否正确的解码出广播消息,主要检查MCC,MNC,扰码,主频点等。通过登录LMT,查看小区是否正常建立,查看公共传输信道是否有缺失或者反复删建的情况。如果业务正常但是信令跟踪没有消息,检查创建的信令跟踪任务是否正确。有时候信令跟踪任务正确,但由于CN没有下发commonID,RNC不知道该UE的IMSI号码,此时信令跟踪任务按照IMSI号码跟踪会看不到UE信令,改为按照cell/RNC跟踪就可以看到UE信令。,故障定位思路,Uu口对接类故障基本定位思路UE发了RRC连接请求,直接被RNC拒绝;【故障现象】:UE发送了RRC连接请求以后,RNC直接回复RRC连接拒绝。【排查思路】:从RRC连接拒绝的cause里面可以看到拒绝的原因。检查RNC侧的关于RRC连接建立的参数设置,看看RRC连接是强制建立在FACH还是DCH上,是高速还是普通信令。一般要求是强制建立在DCH上,如果选择是高速信令而RRC连接被拒,可以修改成普通信令试试。检查是否由于资源拥塞而导致RRC连接拒绝。可以通过OMCR动态管理,查看各种资源的闭塞情况,主要包括服务小区、DSP等。,故障定位思路,Uu口对接类故障基本定位思路RRC连接建立流程失败;【故障现象】:UE发送了RRC连接请求,RNC也下发了RRCConnectionSetup,但是手机没有收到RNC发出的RRC连接建立。或者UE接受到了RRCConnectionSetup,但是RNC收不到UE发回的RRCConnectionSetupComplete消息。【排查思路】:通过测试手机的接收电平强度,查看当地的信号强度RSCP,看看是否由于下行信号覆盖太差。检查RNC侧PCCPCH和FACH配置的发射功率是否太小。通过测试手机的接收电平强度,查看当地的信号质量C/I,看看是否存在干扰。外界无线环境的强干扰,表现为RSSI一直偏高。对室内环境,如果出现RSSI突然上升的情况,注意检查射频部分上行通路的阻抗匹配情况,建议增加上行衰减试试看。如果信令显示NodeB返回无线链路建立响应,但是没有无线链路恢复过程,说明NodeB与UE之间的物理层失步了。无线链路无法恢复的原因在于NodeB测量物理信道误码比较高,没有达到同步要求的门限。,故障定位思路,Iu口对接类故障基本定位思路物理层不通;【故障现象】:APBE的光口指示灯熄灭,OMCR的告警管理上有光口告警。【排查思路】:检查RNC的接口板(基于ATM是APBE、基于IP是GIPI)的RUN灯是否1S慢闪,来判断单板是否运行正常。正常情况下单板的RUN灯应该是1Hz慢闪,如果不正常,则检查单板的版本加载是否正常,单板硬件是否损坏,可以尝试替换单板来判断。检查双方的光模块是否匹配(单模还是多模)。检查光纤的收发是否接反了,RNC侧的Tx口的光纤应该接到对端的Rx口,RNC侧的Rx口的光纤应该接到对端的Tx口。检查每一条光纤是否和其他光纤交叉了。检查RNC到CN的光纤/光模块有没有插紧,如果收到了光信号,光口指示灯会常亮。判断传输线缆是否正常,通常可以采用逐段环回法来定位。基本原则是在各个线缆对接的地方,可以分别向RNC和CN进行自环,最终定位到某段传输具体出问题的地方。一般使用光纤法兰盘来进行环回测试。检查RNC和CN侧的相关数据配置是否正确,例如配置的IU接口应该为STM-1类型,而实际上配置的是E1类型。,故障定位思路,Iu口对接类故障基本定位思路到MGW信令点不可达;(一)【故障现象】:SSCOP层反复删建,MTP3B层不通,CN邻接局的信令点状态为不可达。【排查思路】:常见的方法是采集信令分析,可以在IU口挂接信令仪。双方的信令链路编码(SLC)不一致;如果从MTP3B的信令跟踪来看,如果从MTP3B的信令跟踪来看,现象为:RNC和CN双方都在向对方发送SLTM消息,但是对于接收到的对方的SLTM消息,都不回应SLTA消息。这种情况下,要进一步查看双方的SLTM消息,可以看到Signal link code这个值,可以比较一下双方在各自的SLTM中携带的这个值是不是一致。双方的的信令点编码(SPC)不一致;从MTP3B的信令跟踪,找到DPC和OPC这两个值,可以看到RNC发送的SLTM携带的DPC和RNC接收的SLTM的OPC不一致。在这种情况下,RNC发到CN的SLTM被对方认为不是发给自己的,丢弃掉了,而对方发送给RNC的SLTM,由于根据该消息的OPC在RNC的配置中找不到相应的信令点配置,所以RNC也无法做出相应的回应。,故障定位思路,Iu口对接类故障基本定位思路到MGW信令点不可达;(二)【故障现象】:SSCOP层反复删建,MTP3B层不通,CN邻接局的信令点状态为不可达。【排查思路】:双方的信令点编码格式(SSF)不一致;从信令跟踪来看,也是RNC和CN各自发送SLTM,各自都不给对方回应SLTA消息。首先检查OPC和DPC这两栏。如果检查无误后,再查看双方各自SLTM消息中的Network indicator字段,例如发现一个是0(Interational network,14 bits signal point code),一个是8(National network,24 bits signal point code),那么就是这个值不一致导致的。CN信令路由设置错误;对于R99以后的协议版本,MGW和SGSN应该是直达,MSCS应该是通过MGW进行信令转接。如果路由配置错误,发往MSCS的消息将无法被MGW成功转发。信令链路设成了环回状态,需要解环。假设是CN侧把信令链路设置成环回状态,这种情况下,通过MTP3B信令查看,现象是RNC发送的SLTM没有回应,也收不到CN发送的SLTM,但是CN侧的MTP3B消息是看到有SLTM,也有SLTA消息。,故障定位思路,Iu口对接类故障基本定位思路到MGW信令点可达,到MSCS信令点不可达;【故障现象】:RNC到MGW的信令点状态为可达,但是到MSCS的信令点状态不可达。【排查思路】:出现这种现象,一般来说,故障在于MGW和MSCS之间。RNC和MSCS侧配置的信令点编码或者信令点格式不一致;MGW和MSCS之间的信令链路中断了,需要CN侧的人员检查MGW和MSCS之间的信令连接;MGW上配置的MSCS邻接局的信令点编码不正确,导致RNC发送的SLTM无法被MGW转发给MSCS。,故障定位思路,Iu口对接类故障基本定位思路CS域位置更新失败;【故障现象】:手机发起位置更新,但是位置更新失败。【排查思路】:如果CN回复位置更新拒绝,失败原因是MAC Error,则检查UE里面烧录的IMSI,Ki和OPc等信息和HLR里面的信息不一致。UE的IMSI可以从初始直传消息里面的NAS信息中获取,或者直接从CN下发的CommomID消息中查看。如果CN回复位置更新拒绝,失败原因是非法位置区,则检查RNC侧配置的LAI(PLMNIDLAC)与CN侧的配置是否一致;RNC发上去的位置区标示可以从初始直传消息里面获取。如果CN回复位置更新拒绝,失败原因是网络侧失败,则请CN侧排查。如果根据信令流程,是鉴权失败,则请CN检查HLR放号的情况。如果根据信令流程,是安全模式失败,则检查RNC配置的加密和完整性算法和CN侧的配置是否对应,以及网络侧配置的加密和完整性算法和UE的能力是否匹配。,故障定位思路,Iu口对接类故障基本定位思路CS域RAB指派失败;【故障现象】:作语音业务,CN下发RAB指派以后,RNC回复RAB指派响应中的结果为失败。【排查思路】:检查AAL2的链路状态是不是被人为闭塞,本端闭塞或者是远端闭塞。如果是被闭塞了,则需要解闭塞;检查AAL2的链路状态是不是业务闭塞,如果是业务闭塞的,检查RNC侧Iu-CS的AAL2的cVPI,cVCI,PathID和MGW侧的配置是否一致。查看RAB指派中CN下发的AMR的速率是否和RNC侧的AMR配置相匹配;可以在RABAssignmentRequestMsg里面,查看AMR的速率配置。查看RAB中MGW下发的MGW的ATM地址,是否和RNC配置数据中MGW的ATM地址一致;可以在RABAssignmentRequestMsg里面,查看CN侧配置的MGW的ATM地址。跟踪到MGW的A2SP信令,看看是否RNC发出了ERQ,MGW是否回应了ECF。如果是无线链路重配,RBSetupComplete信令超时等无线侧原因导致RAB指派失败,请查看Uu口,Iub口相关问题的排查思路。,故障定位思路,Iu口对接类故障基本定位思路PS域Attach失败;【故障现象】:Attach失败。【排查思路】:与CS域位置更新失败一样的排查思路。如果是如果CN回复Attach失败,里面的失败原因是MAC Error,检查UE里面烧录的IMSI,Ki和OPc等信息和HLR里面的信息不一致。如果CN回复位置更新拒绝,里面的失败原因是非法路由区,请检查RNC侧配置的RAI(PLMNIDLACRAC)与CN侧的配置是否一致;路由区标识可以在UE的初始直传消息里面找到。如果CN回复Attach失败,里面的失败原因是网络侧失败,请SGSN侧排查。如果根据信令流程,是鉴权失败,则请CN检查HLR放号的情况;如果根据信令流程,是安全模式失败,请检查RNC配置的加密和完整性算法和CN侧是否对应,以及网络侧配置的加密和完整性算法和UE的能力是否匹配;一般要求打开完整性保护,关闭加密控制。如果CN下发Attach Accept以后,UE并不回应Attath Complete,请CN把安全变量“Attach时是否鉴权”选择“是”,这是由于3G网络对UE鉴权,同时UE也对网络鉴权,所以如果不启动鉴权流程,UE不会选择这张网络的,也是为了保护用户的信息,避免非法网络骗取用户信息。,故障定位思路,Iu口对接类故障基本定位思路PDP上下文激活失败;【故障现象】:PS域PDP上下文激活失败。【排查思路】:检查UE上报的APN是否正确,可以在RNC发送的PDP上下文激活请求中找到UE携带上去的APN名称,或者用解码工具解出NAS消息后也能看出APN的值。拨号号码设置不正确,也可能会导致激活失败,或者过一段时间,终端就会主动发起释放。中国大陆地区,中国移动TD网络,拨号通常是*98*1#,但在其他国家地区或其他网络,该号码不同。在IU口抓取信令,分析其交互流程。RNC发送PDP上下文激活请求以后,如果CN没有给RNC回应任何消息,请CN侧检查;如果CN回复了失败或者拒绝消息,请CN侧检查。RNC回复了RAB建立失败,导致PDP上下文激活失败。通常是由于PS域的IuUP建立失败。如果是基于ATM承载,主要检查RNC和SGSN侧承载PS域用户面的那条IPOA的状态和配置,检查双方配置该链路的cVPI、cVCI是否一致,带宽设置是否太小。如果是基于IP承载,可以通过用户面ping包,测试一下IP是否可以ping通。,故障定位思路,Iu口对接类故障基本定位思路PDP上下文激活成功,向PDN ping包不通;【故障现象】:PDP上下文激活成功以后,向PDN ping包不通。网页打不开。【排查思路】:首先判断ping包丢在什么地方。检查对接数据,主要包括:IPOA的本端地址和对端地址,RNC的用户面地址,CN的用户面地址,以及静态路由的配置情况。其中,CN侧的用户面地址可以在信令消息RABAssignmentRequestMsg里面查看。请CN侧检查PDN上是否增加了到手机地址端的反向路由。请CN侧ping RNC侧的接口地址和用户面地址,正常情况下应该可以ping通,而且时延应符合该业务类型的QOS。在IU口抓取信令,分析其交互流程。检查RNC是否发送了数据包,CN是否回复了数据包。,故障定位思路,Iu口对接类故障基本定位思路向PDN ping小字节包通,ping大字节包不通;【故障现象】:向PDN ping小字节包通,ping大字节的包不通。部分网页打不开。【排查思路】:此问题比较复杂,涉及的方面也比较多,一般可以检查以下几点:检查USIM卡签约信息,看看是否签约的最大/保证速率过低。检查核心网的IP网络设备是否存在一些IP包的约束,例如在IP包长度超过1518字节,需要分片时,丢失了除第一片以外的包,所以最后无法重组出原有的IP包,导致丢包。在核心网的IP网络设备上使用抓包工具,看看丢包丢在哪一段。,