pon组网及原理17-典型案例培训.ppt
《pon组网及原理17-典型案例培训.ppt》由会员分享,可在线阅读,更多相关《pon组网及原理17-典型案例培训.ppt(93页珍藏版)》请在三一办公上搜索。
1、维护案例培训,FIBERHOME 2011-05,摘 要,一、故障处理流程 二、设备类案例 三、网管类案例 四、其他案例,数据业务故障排查流程,语音业务故障排查流程,CATV业务故障排查流程,摘 要,一、故障处理流程 二、设备类案例 三、网管类案例 四、其他案例,设备类:1、语音业务通信中断后,不能自动注册,一、语音业务通信中断后,不能自动注册【现象描述】某FTTX工程AN5116-02型OLT设备下带AN5006-07和09型ONU有语音和数据业务,onu停电,等来电设备重新上电后,语音业务不正常,需要多次重写配置,才能注册成功。语音协议使用MGCP。【处理过程】首先,找一个故障点,然后做镜
2、像抓包,如下图所示:,设备类:1、语音业务通信中断后,不能自动注册,从抓包分析来看,onu在通信正常后,就会给软件换平台发注册消息,但此软件换平台给onu回的是一个400的错误码,是一个临时不执行的错误,只有连续多下几次配置,也就是多次向软交换平台发起注册,onu才能注册上,平台才会回200 ok的消息。为进一步查找故障原因,让软交换平台也做信令跟踪。通过软交换平台的信令跟踪发现,MGC向下发的审计消息,如下图所示:,设备类:1、语音业务通信中断后,不能自动注册,设备类:1、语音业务通信中断后,不能自动注册,与软交换平台工程师联系沟通后,发现信令跟踪的是MGC与SBC间的信令,根据从onu侧抓
3、的包和MGC侧的跟踪信令可以说明SBC没有转发onu向平台发的注册消息。因此,初步可以判断是上层平台的问题导致onu注册不上的。最后,软交换平台工程师在查找原因时发现,所提供的软交换平台地址为备用地址,将注册地址修改后,故障消失。【故障分析】从此次故障来看,通过抓包发现onu在注册时,软交换平台给回的消息为400(临时不执行)的错误,那么就需要平台给出为什么不执行的原因,最后通过平台侧的工程师协助查找,发现是所提供软交换平台地址错误导致的。,设备类:2、09AONU下联设备ARP攻击导致同一个PON口下所有用户pppoe拨号678的故障案例,二、09AONU下联设备ARP攻击导致同一个PON口
4、下所有用户pppoe拨号678的故障案例【网络拓扑】,设备类:2、09AONU下联设备ARP攻击导致同一个PON口下所有用户pppoe拨号678的故障案例,【现象描述】某处运营商网络使用我司AN5116-02系列EPON设备,下挂09A,07A的ONU,全部为FTTB设备。某日该OLT有一个PON口下带的FTTB用户出现拨号678的故障,但拨号并不是每次都拨不上,有时拨号十次或二十多次偶尔还是能够成功拨到BRAS的,拨通后宽带业务使用正常,无掉包或网速慢等问题。【处理过程】首先对该处进行OLT上联、ONU下联进行PING包处理,目的是检查整个通路到BRAS的情况。在某个故障点的07A设备接一部
5、电脑,在OLT上联空的电口接一部电脑,使用同一VLAN PING包,PING包10000个后发现只丢一个包,丢包率近0%,故无物理通路故障。继续检查OLT设备的FDB表,以及投诉点07A设备的ARL表。当我们进行拨号的时候,可以在29槽看到上层8505交换机的MAC地址,也可以在EC2槽位上看到用户拨号电脑的MAC地址,并且业务VLAN ID正确;同时看07A设备ARL表,可以看26口上学到的8505的MAC,也可看到用户端口学到的用户电脑的MAC,且VLAN ID正确。由以上信息可以证明在设备内部的VLAN学习及地址转发情况都是正常的,而且一但拨上后业务一切正常,PING DNS都是良好,说
6、明上层设备也正常,但始终pppoe拨号十分困难。,设备类:2、09AONU下联设备ARP攻击导致同一个PON口下所有用户pppoe拨号678的故障案例,继续在OLT上联口做拨号测试,挑空电口做测试,发现每次拨号都能成功;再进一步了解情况,做各处的拨号测试,将故障范围缩小在了一个PON口上,即其它几个PON口拨号都正常,仅一个PON口下的共计10台ONU拨号不正常。怀疑存在环回,再检查FDB表,对比29槽和该槽位的地址表,并未发现有EC2板存在上层设备地址的情况,而且此处也设置了ONU ACL,已经杜绝了下联ONU端口环回情况,但不能排除ONU下挂交换机的硬件环回情况,因为此处有大量FTTB_O
7、NU下挂或级联交换机的情况。再继续从抓包分析入手,分别在镜像ONU上联、EC2前面板、OLT上联口等三处同时安排人员,各挂一台电脑,将每次pppoe拨号包的流程进行抓包。实施后发现PPPOE拨号的PADI广播包不是每次都能到达上联口,直到成功发送出上联口才能收到BRAS的PADO回复,那样才能成功拨号上网。而我们从某次pppoe发包,ONU端抓包发现共发送了两次拨号直到第7个PADI广播才收到PADO回复,对比EC2抓包,只收到了总共3个PADI广播包;而上联口当然只收到了一个PADI的广播包,也就是最后一次拨号成功了。反复进行了多次pppoe抓包,都是随机性的拨号成功,有时候拨号十几次才拨号
8、成功。从上述情况看就是因为PADI广播包在ONU-EC2丢失一次,在EC2-GSWC-GUP7丢失一次。请参考下图,ONU处总共发出7次PADI才成功的流程:,设备类:2、09AONU下联设备ARP攻击导致同一个PON口下所有用户pppoe拨号678的故障案例,得知故障根源后,要确定是什么缘由导致丢弃PADI包才行。OLT系统内部有广播包的门限限制,AN5116-02系统内部每个PON口的广播包带宽是2048kbit/s。再次抓包,并且不过滤包,终于在包中发现有一个MAC为00:27:19:5d:61:62的设备不停的向上层发送大量ARP广播包,不停的查找192.168.1.1的地址是对应哪台
9、设备,它完全把目的地址为ff:ff:ff:ff:ff:ff的广播类型带宽资源占用耗尽,这很明显这是属于病毒包。找到该包的VLAN Tag值,立即找出了对应的是一台AN5006-09A设备的端口,立即屏蔽掉该端口业务,发现拨号每次都能正常了,故障解决。赴,设备类:2、09AONU下联设备ARP攻击导致同一个PON口下所有用户pppoe拨号678的故障案例,现场发现该台09A下面下挂一台交换机,这个交换机上没有做任何设置,默认的VLAN 1也没有关闭,导致不停的向上发送ARP包,造成广播类型带宽资源耗尽,致使正常用户拨号受阻。请看下图,大量无用ARP广播包:,设备类:2、09AONU下联设备ARP
10、攻击导致同一个PON口下所有用户pppoe拨号678的故障案例,【故障分析】AN5006-07A、AN5006-09B、AN5006-10几款设备中都有一个包抑制功能的设置,在stwich目录下,可以在ONU的switch目录中输入show storm port 1-24查看门限,查看07ONU的包抑制设置方法如下:其中有广播包、多播包、目的地环回失败包等类型的门限设置,广播包门限默认设置为62kbit/s,也可以用set storm port 1-24 enable 1 bcast 62设置门限(出厂一般都是62kbit/s)。由于组网时,ONU侧的FE口有下挂多个交换机或级联的情况,不可避
11、免的造成了网络复杂化,也很难杜绝一些硬件环回和病毒包的泛滥,而07ONU等设备下有门限设置,即使存在下游设备问题也不会影响PON口,设备类:2、09AONU下联设备ARP攻击导致同一个PON口下所有用户pppoe拨号678的故障案例,的上行广播包带宽。而AN5006-09A设备早期固件版本不支持上行包的抑制功能,导致09AONU下带交换机产生的大量ARP广播包上行到EC2盘PON口,同时pppoe协议中的PADI包是广播方式通过EC2盘和GSWC盘上行到BRAS,导致用户发出PADI广播包上行到EC2盘后被丢弃,引起PPPOE连接不能成功,因此用户端电脑拨号出现678错误无法上网。对于5006
12、-09A型ONU可以有两种方法解决此问题:1、查到此大量广播包的端口,屏蔽此端口,然后查清广播包问题来源,进行处理;2、升级5006-09A设备为最新固件版本,可以进行广播包抑制,避免此故障发生。推荐采用第二种方法。另外关于抓包分析,平时分析故障抓包总是通过过滤等手段逐步细化定位问题,虽然某些问题如语音可以通过此法逐步定位问题,但此次故障仅过滤pppoed报文不能完全定位出问题,相反抓包不过滤看全部的包,才能发现是其它的ARP攻击包占用了广播包带宽。同时抓包需要在OLT的上联口,EC2盘上,09AONU的端口上分别抓包,分析PPPOE协议的报文是否正确。,设备类:3、5006-15设备语音单通
13、故障分析,三、5006-15设备语音单通故障分析【现象描述】AN5006-15设备语音出现单通现象。具体现象为该15设备下用户无论做主叫还是做被叫,与外部电话通话时,15ONU设备的用户可以听到外部电话的声音,但是外部电话听不到15ONU设备用户的声音。【处理过程】AN5006-15设备配置情况如下:设备IP地址:10.14.149.242 MGC IP地址:10.14.132.36 出现故障时,我们在OLT的上联口做镜像抓包。对所抓的包进行如下分析:1、查看信令流程,如下图所示 A、远端信息 通话建立的时候平台给设备下发的远端的IP地址是10.14.134.4,远端端口号是27744。,设备
14、类:3、5006-15设备语音单通故障分析,B本地信息 通话建立的时候设备的本地IP地址是10.14.149.242,本地端口号是20000。,设备类:3、5006-15设备语音单通故障分析,2、查看媒体流信息,如下图所示 A、远端发给设备的RTP流,编码方式为G.711A RTP流从10.14.134.4发给10.14.149.242,远端端口号是27744,本地端口号是20000 IP地址信息与信令中所指明的一致。远端MAC地址为:00:e0:fc:6e:ba:e2本地MAC地址为:00:0a:c2:1f:8e:cd B、设备发给远端的RTP流 RTP流从10.14.149.242发给10
15、.14.134.4,本地端口号是20000,远端端口号是27744 IP地址信息与信令中所指明的一致。远端MAC地址为:00:e0:fc:6e:ba:e2本地MAC地址为:00:0a:c2:1f:8e:cd,设备类:3、5006-15设备语音单通故障分析,3、将所抓的RTP流还原成声音文件,可以听到两边说话的声音。设备正常时同样抓了一个包。对该包的分析如下:1、查看信令流程,如下图所示 A远端信息 通话建立的时候平台给设备下发的远端的IP地址是10.14.134.4,远端端口号是45916。,设备类:3、5006-15设备语音单通故障分析,B本地信息 通话建立的时候设备的本地IP地址是10.1
16、4.149.242,本地端口号是20000。,设备类:3、5006-15设备语音单通故障分析,2、查看媒体流信息,如下图所示 A远端发给设备的RTP流 RTP流从10.14.134.4发给10.14.149.242,远端端口号是45916,本地端口号是20000 IP地址信息与信令中所指明的一致。远端MAC地址为:00:18:82:84:e7:ff本地MAC地址为:00:0a:c2:1f:8e:cd B.设备发给远端的RTP流 RTP流从10.14.149.242发给10.14.134.4,本地端口号是20000,远端端口号是45916。IP地址信息与信令中所指明的一致。远端MAC地址为:00
17、:18:82:84:e7:ff本地MAC地址为:00:0a:c2:1f:8e:cd,设备类:3、5006-15设备语音单通故障分析,3、将所抓的RTP流还原成声音文件,可以听到两边说话的声音。【故障结论】单通现象的产生一般是由于没有收到对方的媒体流导致的。而我们发现所抓的单通的包中媒体流是双向的,而且声音还原出来两边都可以听得到,这表明设备是有发媒体流给远端的。由于包是在OLT上联抓的,这说明从AN5006-15设备到OLT端没有问题。对比正常和单通时的抓包,两个包并没有区别,这说明对于EPON设备这端来说没有任何改变,出现单通问题并不是由于EPON设备引起的。,设备类:4、IPTV业务HTT
18、P页面失败故障,四、IPTV业务HTTP页面失败故障【现象描述】用户的IPTV 业务应用中,观看大部分频道节目正常,就是唯独新闻频道无法正常收看。【处理过程】现场处理测试把机顶盒放在设备上联口单VLAN测试,结果正常。放在用户处无法正常收看。根据现在捕获的信令消息,分析如下:用户处异常时信令报文:,设备类:4、IPTV业务HTTP页面失败故障,如上图:在NO.4报文的位置,用HTTP协议(TCP PSH)GET操作尝试从服务器58.223.251.72获取新闻频道的内容.接着服务器也响应了该请求。(TCP ACK)如下图:接下来,等待了15s服务器却未应答HTML请求成功(HTTP/1.0 2
19、00 OK),也没有发回任何HTML资源,于是在15.57s的时候结束了TCP连接,如下图:,设备类:4、IPTV业务HTTP页面失败故障,异常时,HTTP协议并未应答成功,于是机顶盒一直去尝试用GET获取HTML资源。在怀疑上层服务器未应答的同时,在捕获下来的正常的过程中,我们发现了问题所在。在机顶盒以同样GET方式请求服务器资源的时候(TCP PUH),服务器也像刚才那样用(TCP ACK)给与响应,但与之前不同的是,这次服务器开始传输HTML资源的内容(第103的报文开始包含了HTML请求的应答200 OK,后续为HTML资源内容)。如下图:,设备类:4、IPTV业务HTTP页面失败故障
20、,HTTP协议请求服务器端服务成功(HTTP/1.0 200 OK)再观察上面帧的长度达到了1514,不带VLAN的帧是1514,加上双层VLAN,帧的长度就达到了1522.再去看下主控盘交换芯片的最大帧长度为1518,这样的下行应答报文主控盘不让过也就不足为奇了。,设备类:4、IPTV业务HTTP页面失败故障,【故障结论】在TCP/IP协议中,TCP协议提供可靠的连接服务,采用三次握手建立一个连接。第一次握手:建立连接时,客户端发送syn包(syn=j)到服务器,并进入SYN_SEND状态,等待服务器确认;SYN:同步序列编号(Synchronize Sequence Numbers)第二次
21、握手:服务器收到syn包,必须确认客户的SYN(ack=j+1),同时自己也发送一个SYN包(syn=k),即SYN+ACK包,此时服务器进入SYN_RECV状态;第三次握手:客户端收到服务器的SYNACK包,向服务器发送确认包ACK(ack=k+1),此包发送完毕,客户端和服务器进入ESTABLISHED状态,完成三次握手。完成三次握手,客户端与服务器开始传送数据,流程如下:HTTP协议请求服务器端服务成功(HTTP/1.0 200 OK)上述故障是由于TCP协议在三次握手失败,导致创建TCP连接失败,故障出现。导致TCP握手和建链失败是由于OLT上的MTU值限制了包的大小。通过修改增大GS
22、WC主控盘的最大帧长度解决了故障。,设备类:4、IPTV业务HTTP页面失败故障,设备类:5、pos机拨号频繁失败,五、pos机拨号频繁失败【现象描述】AN5116-02下挂07B型ONU,出现窄带pos机拨号无法连接,抛开POS机使用而电脑进行模拟拨号正常。【处理过程】通过电脑模拟pos机拨号情况。,设备类:5、pos机拨号频繁失败,设备类:5、pos机拨号频繁失败,上图是电脑连接POS中心过程,将连接过程中电脑发出的RTP包还原成语音(send1.au),电脑接收的RTP包还原成语音(recv1.au),上图是将这两个语音信号放到语音处理软件中看到的频域信号连接之初交互过程,红色直线表示时
23、间上的对应关系,下图中红色圆中的信号是POS中心发过来的信号。,设备类:5、pos机拨号频繁失败,设备类:5、pos机拨号频繁失败,上图红色圆圈中的是电脑与POS中心连接上过程,从电脑与POS中心交互信号的特征可以判断双方使用的是V90协议。2 pos机拨号情况。下图是POS机与POS中心连接过程,将连接过程中POS机发出的RTP包还原成语音(send2.au),POS机接收的RTP包还原成语音(recv2.au),上图是将这两个语音信号放到语音处理软件中看到的频域信号连接之初交互过程,红色直线表示时间上的对应关系,下图中红色圆中的信号是POS中心发过来的信号。通过对比图1与图3中recv1和
24、recv2信号发现这两个在交互之初是一样的,随后就不同了。同时通过对比图1与图3中send1和send2信号可以看到用蓝色箭头标记的就是这两个信号的不同之处,正是由于这两个信号的不同导致了POS中心随后发出来的信号有差异,在图1中POS中心随后用V90协议与电脑进行协商并且最终电脑可以连接上,而在图2中POS中心随后一直发送频率为2100HZ的ansbar信号,而POS机也一直发送频率范围为700hz1400hz信号,最终协商超时,连接失败。,设备类:5、pos机拨号频繁失败,设备类:5、pos机拨号频繁失败,【故障结论】基于以上分析,更改服务器或者客户端的modem协商协议使其匹配后,故障解
25、决。,设备类:6、数图错误导致无法拨号问题,六、数图错误导致无法拨号问题【现象描述】开通时注册能够成功,被叫正常,但是主叫时无法拨号。【处理过程】1、被叫正常,说明端点用户名、RTP资源设置正确。2、通过抓包分析,发现在主叫时,收到软交换下放数图后,ONU回复语法错误,如图:,设备类:6、数图错误导致无法拨号问题,3、根据此错误提示,应该是数图中存在语法不支持,导致回错。与软交换配置人员沟通后,确认为软交换数图配置错误导致,软交换更改配置后正常。【故障分析】数图截图如下:,设备类:6、数图错误导致无法拨号问题,从上面数图截图可以看到,在数图中间连续出现两个“|”,标准中规定“|”表示前后内容为
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- pon 组网 原理 17 典型 案例 培训

链接地址:https://www.31ppt.com/p-6514934.html