基站设备类故障.doc
《基站设备类故障.doc》由会员分享,可在线阅读,更多相关《基站设备类故障.doc(34页珍藏版)》请在三一办公上搜索。
1、第1章 基站设备类故障1.1 BBU典型故障基站侧故障比较特殊,不能简单地划分大类。本文按照如下模式进行描述:先介绍几种常见的,共性的故障;然后针对各单板的告警进行分析处理。BBU的几种类型当中,以B328为主进行介绍;B322是把BCCS、IIA、TORN板集成,故障排查涉及环节更少,参考B328排查方法即可;涉及到B326的内容,会将特殊性进行说明1.1.1 前后台通信故障1.1.1.1 本地前后台通信故障【故障现象】:近端通过LMT网口无法登陆主控单板。【可能原因】: 主控单板工作状态异常 电脑设置不当 背板拨码开关设置错误 背板到机顶的网线故障(B328、B326) 主控单板硬件故障
2、【排查思路】:1. 核查主控单板加电以及是否正常工作,参见1.1.2节内容2. 检查电脑网络设置是否正常:IP地址、掩码等(防火墙、部分杀毒工具、VPN等影响LMT接入的软件是否已经关闭)。建议IP设置如下表:前台IP地址本机IP地址掩码B328100.193.2.254100.193.2.100255.255.0.0B326100.193.2.254100.193.2.100255.255.0.0B322100.193.1.254100.193.1.100255.255.0.03. 拔出主控单板(B328和B326在备板位置),按照下述说明检查拨码设置和实际登陆IP是否一致:B328,B32
3、2,B326机架背板的拨码示例R2 R1 R0 S1 S0 上 上 上 上 下 下 下 下0 0 0 0 1 1 1 1上:0,下:1IP的计算规则机架号RackId = R2 R1 R0 (二进制) + 1 可通过BspGetRackID()查询数值机框号ShelfId = S1 S0 (二进制) + 1 可通过BspGetShelfID()查询数值IP地址0为100 IP地址1为192 + RackIdIP地址2为 ShelfIdIP地址3为 槽位号如上图示例: RackId = 0 + 1 ShlefId = 1 + 1所以IP地址1 = 192 + 1 = 193 IP地址2 = 2因
4、此各单板的IP地址为100.193.2.*注:BCCS的IP地址方案固定为100.19x.x.254通常拨码,要拨成100.193.1.x,拨码规则是: 上 上 上 上 上 下 下 下要拨成100.193.2.x,拨码规则是: 上 上 上 上 下 下 下 下要拨成100.193.3.x,拨码规则是: 上 上 上 下 上 下 下 下4. 检查背板到机顶LMT口的网线是否接错(有不少站点LMT1和LMT2口接反导致连接使用IP地址错误)或故障:对B328和B326而言,LMT网口是从背板引出两根网线到机顶的LMT1和LMT2口并转接。其中,LMT1口提供到BCCS的CPU的连接,仅用于和BCCS通
5、信;LMT2口提供到主控板上交换芯片的连接,用于本框所有单板的通信。5. 拔插单板仍不能解决则更换主控单板1.1.1.2 IPOA方式通信故障【故障现象】:IPOA方式下,后台无法和前台建链。【可能原因】:这里只介绍基站侧的相关排查思路,RNC侧排查本文档不做详细介绍 物理传输故障 物理打线与E1配置不一致 对接参数配置错误 数据库加载失败 BOOTP请求包无响应 【排查思路】:1. 先排查物理传输故障,具体参见1.1.4.1节排查思路2. 检查物理打线(注意标签也可能错)与后台实际配置E1是否一致,该问题现场发生多次3. 核查RNC和Node B数据配置是否一致,网元IP地址是否与IPOA通
6、道设置一致等,这里不作详细介绍4. 在主控板上输入“DbsShowLoad”命令核查数据库加载是否正常注:2、3、4故障均算数据配置错误,在现场无人配合情况下,可以通过修改OMCR侧IPOA通道的VPI/VCI为1/100的方法来完成IPOA自动建链功能,建链后将OMCB配置数据整表同步到前台即可。5. 本地登陆主控单板,输入ifShow命令检查是否未分配到OMCR配置的IPOA通道IP地址。这种情况下,需要和RNC配合排障: 在IIA板上使用n5 64500,查看是否发出了BOOTP包。若未发包,拔插IIA单板,故障不恢复则更换IIA单板(该问题目前还未遇到过) 在RNC的接口板上使用MCS
7、_C5_UCOMStatsPrn,察看RNC是否收到了Node B的BOOTP请求和发出了BOOTP回应。如果RNC收到了Bootp请求但是没有回应,那么有可能是RNC的BOOTP协议处理有问题;如果RNC没有收到BOOTP请求,则需要继续往下排查 在RNC接口板上使用ip_print_if命令,根据DRV_STAT一项是UP还是DOWN,看该接口板端口是否有效;根据ipv4_address一项看RNC接口板接口地址是否生效和正确配置。若未正确配置,核查RNC数据配置以及通过更换接口单板来确认是否单板芯片故障1.1.2 启动类故障1.1.2.1 单板上电不工作【故障现象】:上电以后,单板RUN
8、灯不亮。【可能原因】: 电源问题(加电异常、单板或背板电源模块异常) BOOT芯片问题 单板故障 【排查思路】:1. 核查是否所有单板PWR灯灭,是则检查加电是否正常,机框供电是否正常;若仅单块单板PWR灯灭或闪烁,拔插单板,不恢复说明是电源故障,采用更换单板的方法来判断问题出在单板还是背板2. 若PWR灯亮正常,按下RST键查看复位时RUN灯是否仍一直灭,若灭则更换单板;若复位时所有单板灯亮,拔插单板,不恢复进入下一步3. 重新插拔或更换BOOT芯片,故障消失说明BOOT芯片故障;故障依旧说明是单板故障1.1.2.2 单板反复重启【故障现象】:上电以后,单板反复重启。【可能原因】: 软件版本
9、加载失败 主控单板电子盘异常 单板硬件故障 【排查思路】:主控单板和外围单板的排查思路不一样,下面分别描述:主控单板反复重启:1. 用直连网线连LMT1网口,使用“100.225.2.254”登录BCCS单板重新上传单板软件版本。具体方法见Node B版本升级指导手册注:登陆SBMP时使用“100.209.1.254”2. 若上传失败或发现前台文件夹目录不正常,则在登陆主控单板并输入“man”命令停止BOOT启动后输入“BspFormatDoc”对电子盘进行格式化,成功后再上传单板软件版本3. 上传完以后拔插主控单板,如果还不正常,那么就可以排除软件版本问题的可能,更换主控单板外围单板反复重启
10、:1. 在主控板上输入“DbsShowLoad”命令核查数据库加载是否正常,若加载失败则使用与主控单板软件版本匹配的数据库表整表到前台,并正常进行数据配置和外围单板版本升级,否则进入下一步2. 核查配置数据是否正常配置了该单板,且单板类型匹配3. 核查软件版本管理,是否存在该类型单板的所有软件版本4. 拔插该单板后故障仍不消失,应该是本地Flash盘故障,更换单板1.1.2.3 外围单板不在位【故障现象】:外围单板上报“单板不在位”告警。【可能原因】: 配置槽位上未插单板 外围单板故障 主控板故障 背板故障 【排查思路】:1. 确认告警槽位是否插有单板,前台单板与后台配置槽位是否不一致2. 若
11、故障单板是TBPx、TORx、IIA,则更换单板槽位和后台配置,判断是单板问题还是背板问题: 如果是发生故障的单板在正常槽位仍有问题,故障单板返修 如果另一正常单板在发生故障的槽位有问题,更换主控板,看故障能否恢复,恢复则主控板故障,不恢复则说明背板故障 若有其它槽位可用,则尽量利用;否则更换背板1.1.2.4 外围单板通信链路断【故障现象】:外围单板上报“通信链路断”告警。【可能原因】: 配置槽位上未插单板 外围单板故障 主控板故障 背板故障 【排查思路】:1. 先确认单板是否正常上电,是否上报“单板不在位”告警,有则先解决2. Ping该单板,若一直无法ping通,说明CPU小系统未启动。
12、将该单板与另一正常单板交换或更换槽位: 如果是发生故障的单板在正常槽位仍无法ping通,则依次拔插更换BOOT芯片,故障不消失则更换单板 如果另一正常单板在发生故障的槽位有问题,更换主控板,看故障能否恢复,恢复则主控板故障,不恢复则说明背板故障(若有其它槽位可用,则尽量利用;否则更换背板)3. 如果能ping通单板,但出现时通时断,说明单板启动过程出现问题,单板处于反复重启状态。 如果所有同类型单板均有此现象,核查单板软件版本配置是否正确 若只有某块单板有此现象。除TBPx以外单板直接返修,对TBPx单板,需要进一步判断 LogView登陆TBPx单板,输入bspLogOn命令,查看单板的启动
13、中软件版本加载流程,判断FPGA版本加载失败还是具体哪一块DSP版本加载失败,示例如下:下面为在B328机架上,一块TBPE单板启动失败时的打印消息。TBPE-BII 0 Mac: 0x0 0xd0 0xd0 0xc1 0x12 0xfBII 1 Mac: 0x0 0xd0 0xd0 0xc1 0x12 0x10TBPA Mac: 0x0 0xd0 0xd0 0xc1 0x2 0x5bspLogOnTBPE-open flash succ. Read ChipType 3 SubChipType 0 head info in the flash success.open flash succ.
14、Read ChipType 3 SubChipType 0 version in the flash success.download time=1 ok.上面的打印说明,读取FPGA版本头文件、读取FPGA版本文件、下载FPGA等步骤正常。下载正常后,FPGA指示灯开始闪动。open flash succ. Read ChipType 4 SubChipType 1 head info in the flash success.open flash succ.Read ChipType 4 SubChipType 1 version in the flash success.dsp 0 do
15、wnload success.Read Ver Data From DSP=0 success.dsp 0 SBSDRAM download success.Read Ver Data From DSP=0 success.ver Data1 of DSP=0 differ for times=1!dsp 0 SBSDRAM download success.Read Ver Data From DSP=0 success.ver Data1 of DSP=0 differ for times=2!dsp 0 SBSDRAM download success.Read Ver Data Fro
16、m DSP=0 success.ver Data1 of DSP=0 differ for times=3!dsp 0 SBSDRAM download success.Read Ver Data From DSP=0 success.ver Data1 of DSP=0 differ for times=4!dsp 0 SBSDRAM download success.Read Ver Data From DSP=0 success.ver Data1 of DSP=0 differ for times=5!上面的打印说明,读取DSP0的版本头文件、读取DSP0版本文件、下载DSP0内部RA
17、M并校验等步骤正常,但是下载DSP0外部SDRAM并校验时,发现校验错误,反复进行5次下载校验后,单板停止后续DSP的下载,重新启动。1.1.2.5 外围单板FPGA自检失败【故障现象】:外围单板(TBPx、TORx)上报“FPGA自检失败”告警。【可能原因】: 单板硬件故障 【排查思路】:1. 拔插该单板,故障不消失则更换单板1.1.3 时钟类故障1.1.3.1 实时时钟告警【故障现象】:上报“BCCS实时时钟无输出(系统时间)”告警,告警码0x001F。【可能原因】: SNTP服务器工作异常 Node B模块配置中SNTP服务器IP地址设置错误 主控单板硬件故障 【排查思路】:1. 检查S
18、NTP服务器是否工作正常。重点关注是否Windows系统的“windows time”服务未关闭导致123端口被占用2. 在Node B模块配置中核查SNTP服务器IP地址配置是否与实际一致3. 若仍存在该问题,则是主控单板实时时钟芯片故障,更换主控单板1.1.3.2 系统主控时钟无输出【故障现象】:主控单板上报“系统主控时钟无输出”告警,告警码0x0013。告警子码: 1 61.44M时钟无输出210M时钟无输出3帧时钟(FR)无输出4 帧号(FN)无输出519.44M无输出6- 2M无输出【可能原因】: 主控单板硬件故障 误告警 【排查思路】:1. 登录主控单板,输入命令“BspGetFp
19、gaReg 0x1011”,返回的值转换为8bit二进制数,第二位(从低到高)表示2M时钟是否存在,第三位表示19M时钟是否存在,第四位表示10M时钟是否存在,第五位表示61.44M时钟是否存在,第八位表示帧时钟(FR)是否存在;输入命令“BspGetFpgaReg 0x1010”,返回的值转换为8bit二进制数,第六位(从低到高)表示帧号(FN)是否存在。这些数值正常应该为1,为0时并且复位拔插后故障依旧,需要更换主控单板2. 若为1但上报告警,初步判断后台显示误告警,在主控单板上输入OamTraceAlmMap(BoardId,AlmCode)察看前台是否存在该告警。目前碰到的几次都是由于
20、前后台告警同步问题导致,从后台发起告警同步即可注:其他告警误告警的解决就不再介绍1.1.3.3 传输时钟异常【故障现象】:IIA上报“传输时钟异常”告警,告警码0x0012。告警子码:119.44M时钟丢失 22M时钟丢失【可能原因】: 传输时钟丢失说明 “主控板背板Iub传输板”的通道出现了问题。故障点就是主控板BCCS、Iub传输板(IIA等)和背板 【排查思路】:1. 若BCCS单板上报“系统主控时钟无输出”告警(子码5、6),先按1.1.3.2排查2. 若无, 拔插IIA单板,故障不恢复则更换IIA单板3. 更换后故障依旧,则先修改IIA槽位配置(B326只有1块Iub接口板BIIP,
21、跳过此步)。若故障恢复,说明是背板上原槽位处故障,在不影响的情况下可不更换背板;若仍不恢复,直接更换背板1.1.3.4 外围单板参考时钟故障【故障现象】:外围单板上报“外围单板参考时钟故障”告警,告警码0x0014 “外围单板时钟频率异常”告警,告警码0x0031告警子码: 对于TBPx:1-输入61.44M chip时钟丢失2-帧同步时钟丢失3-输入帧号丢失对于TORx:11-上行FPGA输入61.44M chip时钟丢失12-下行FPGA输入61.44M chip时钟丢失21-上行FPGA帧同步时钟丢失22-下行FPGA帧同步时钟丢失41-上行FPGA输入10M射频参考时钟丢失42-下行F
22、PGA输入10M射频参考时钟丢失【可能原因】: 和传输时钟丢失告警类似,说明 “主控板背板外围单板”的通道出现了问题。故障点就是主控板BCCS、外围单板和背板 【排查思路】:1. 排查方法与传输时钟异常类似。若BCCS单板上报“系统主控时钟无输出”告警(子码1、2、3、4),先按1.1.3.2排查2. 若无,察看是否所有同类型单板均上报该告警,是则更换BCCS单板3. 拔插该外围单板,故障不恢复则更换该单板4. 更换后故障依旧,则先修改外围单板槽位配置(可更改多次)。若故障恢复,说明是背板上原槽位处故障,在不影响的情况下可不更换背板;若仍不恢复,直接更换背板1.1.3.5 锁相环失锁类【故障现
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基站设备 故障
链接地址:https://www.31ppt.com/p-4136738.html