以太网的环路检测技术.doc
以太网的环路检测技术Loop Detection Technology for Ethernet吴少勇/WU Shaoyong 1甘玉玺/GAN Yuxi 1张翰之/ZHANG Hanzhi 2(1.中兴通讯股份有限公司,广东 深圳 518057; 2.武汉邮电科学研究院,湖北 武汉 430074)(1. ZTE Corporation, Shenzhen 518057, China;2. Wuhan Research Institute of Post and Telecommunications, Wuhan 430074, China)中图分类号:TP393 文献标志码: A 文章编号:1009-6868(2011)06-0000-00摘要:以太网在局域网中取得了巨大的成功,但是在城域网应用领域中仍需要解决网络环路的相关问题。根据不同的以太网应用领域,文章分析了几种环路检测的解决方案,包括生成树协议(STP)、以太网环路保护切换协议(ERPS)、环回检测和成环点定位技术。其中,成环点定位技术新颖实用,非常适合各种以太网局域网和城域网,对于以太网的运行和维护都有很大的意义。目前,全球的标准组织均正在积极对以太网环路检测技术进行标准化,随着标准的不断成熟,以太网的环路检测技术将逐步降低以太网的环路风险,提高以太网的可靠性,便于网络的管理。关键词:以太网;环路;检测;可靠性Abstract: Using Ethernet in the local area network (LAN) has been very successful. However, for applications in a metropolitan area network (MAN), loop problems still need to be resolved. In this paper, several loop detection solutions are analyzed, including spanning-tree algorithm and protocol (STP), Ethernet ring protection switching (ERPS), loop detection, and loop point location technology. Loop point location is suitable for a variety of Ethernet LANs and WANs, and is very important for OAM in LANs. Domestic and international standards organizations are currently standardizing loop detection technology for Ethernet. When standards are mature, loop detection technology will gradually reduce the risk of loop in Ethernet, increase Ethernet reliability, and make network administration more convenient.Keywords: Ethernet; loop; detection; reliability1 以太网和网络环路在城域网和局域网中广泛采用的是以太网组网技术,网络中90%以上的接入数量也都由以太网承载。以太网的突出优势是可以封装任何协议数据、易于使用、成本低、灵活性好、兼容性强、标准化成熟,对于用户而言可以做到即插即用,网络的管理和维护都非常简单。然而,以太网本质上是一种局域网技术,对可靠性要求不高的微型局域网是非常适用的,但当网络规模扩大时,以太网本身存在的一些局限性会给网络带来致命的故障,其中网络环路就易导致以太网区域内的所有网络瘫痪1-2。根据以太网的原理,当以太网交换机节点收到一个广播帧或未知单播帧时,会向其他所有端口泛洪该帧。在局域网中,以太网的这种转发方式非常简单实用,交换机节点通过泛洪的方式,很容易将广播帧或未知单播帧转发给目的主机。但是当网络中有环路存在时,广播帧会在环路中的各个交换机节点上依次进行泛洪和转发,最终回到源交换机节点,而源交换机节点收到该广播帧后,并不会丢弃,而是继续按照广播帧的转发方式进行泛洪,因此广播帧会永无休止地在环路的各个交换机节点上进行转发,最终流量越来越大,耗尽带宽。以太网交换机节点还会将广播帧向环路之外的端口泛洪,发送给局域网中的主机,随着泛洪流量的增大,主机将难以承受收到的泛洪流量,从而导致整个局域网及其主机瘫痪,造成严重的网络故障,这种场景也称为“网络风暴”。在无环路的网络中,新连接的一条链路如果导致了环路,则称这条链路为成环点。在局域网中,通常网络中以太网交换机节点数量较少,网络结构简单,不易形成环路,即使新增加链路形成环路,也很容易定位出成环点,造成网络故障范围较小,维护难度不大。但是当网络范围扩大时,特别是在城域网中,通常有数十台以太网交换机,承载着成千上万的用户,网络拓扑非常复杂,一旦新增加链路形成环路,很难定位到成环点,而且故障的影响范围都是非常大的。因此随着以太网应用范围越来越大,各种以太网的环路探测技术应运而生。2 基于STP的以太网环路检测技术生成树协议(STP)是在IEEE 802.1D标准中定义的一种提供路径冗余和环路切换的技术,其主要目的是在任何以太网拓扑中,自动发现一个树状无环路的逻辑拓扑。其主要原理是:在网络的各个以太网交换机节点上运行STP,首先所有节点的端口都为阻塞状态,节点周期(默认为2 s)通过网桥协议数据单元(BPDU)帧和其他节点之间协商,再比较节点的优先级从而选出根节点,其余的非根节点则根据路径花费选择一个通向根节点的最优端口(又称为“根端口”);然后在每个网段选择一个指派端口,将非指派端口设置为阻塞状态,其他端口设置为转发状态;按照STP的算法,最终在以太网中建立一个树状的逻辑拓扑。当以太网中有环路存在时,由于STP阻塞了其中的非指派端口,数据帧则不能从阻塞端口通过,节点之间的数据帧传输路径为树状拓扑,网络中任何两个以太网交换机节点之间只有唯一的数据帧传输路径,因此不会形成“网络风暴”。此外,当网络中链路发生故障时,STP还能检测故障,并重新进行运算,建立新的树状逻辑拓扑,节点之间的数据帧能够通过新的路径进行传输,起到了链路保护的作用。图1为STP的环路检测示意图,在图1(a)所示的存在环路的以太网中,通过STP的算法,阻塞冗余端口(如图中节点3端口2),最终将网络收敛为树状无环路的逻辑拓扑;当网络中发生链路故障时,如图1(b)中节点3和4之间的链路发生故障,STP则会重新运算出新的树状逻辑拓扑,打开原先阻塞的节点3端口2,提高了网络的可靠性。(a) 网络环路状态 (b) 环路故障状态图1 STP的环路探测但是STP的算法比较复杂,而且收敛时间非常长,并随着网络的增加收敛时间越来越大。例如对于以太网交换机节点在5个左右的网络,STP的收敛时间通常在30 S以上,虽然快速生成树协议(RSTP)对STP进行了优化,但是收敛时间通常也要3 S以上。当网络规模扩大、可靠性要求增加后,STP变得非常复杂,而且收敛时间也变得很长。此外,STP的阻塞端口的选择是基于路径花费值,而在无环路的网络中,当新增加一条链路导致环路时,该新加链路的路径花费值可以和其他链路相同,也可以和它们不同。从路径花费上并不能识别出成环点的位置,因而STP选择的阻塞端口并不一定是成环点,STP无法实现成环点的定位。因此STP主要适用于对可靠性要求不高、节点数量比较少的以太网局域网络。3 基于ERPS的以太网环路检测技术以太网环路保护切换协议(ERPS)是在国际电信联盟电信标准化部(ITU-T) G.8032标准中定义的一种以太网环路保护切换技术3。其主要目的是对环路的以太网络进行保护,主要原理是:在网络正常时,阻塞一个端口防止环路,该端口称为环保护链路(RPL)端口。在网络出现故障时,打开RPL端口可以使得数据帧能够通过,从而实现网络的保护。ERPS最大的优点是保护切换时间小于50 ms,满足电信级的高可靠性要求,而且与环路中节点数量无关。此外,由于ERPS的网络拓扑本身就是环路,存在冗余链路,ERPS通过阻塞RPL端口的方式,不仅仅在逻辑上将环路解除,防止了数据帧形成“网络风暴”,而且还设置了备份链路。因此当网络出现故障时,ERPS可以启用阻塞的RPL端口对网络进行保护。图2为ERPS在网络链路正常状态和发生故障时的环路保护切换示意图。在图2(a)中,节点1为RPL节点,在网络正常时阻塞RPL端口2,防止网络出现环路;当网络中出现链路故障时,如图2(b)所示,节点3和4之间出现链路故障,故障链路相邻节点向环上发送故障协议帧,RPL节点收到故障协议帧后则会打开RPL端口,数据帧能够通过RPL端口传输,网络重新连通。(a) 网络环路状态 (b) 环路故障状态EPRS:以太网环路保护切换协议RPL:环保护链路图2 ERPS的环路保护切换ERPS本质上是一种环路保护切换技术,对于已知的以太网环路拓扑是非常适用的,而且能够运用环路中的冗余路径进行保护切换,提高网络的可靠性。但是对于非环路拓扑,只能针对特定的、可能的成环点进行预先设置。当网络没有形成环路时,相当于EPRS的链路处于故障状态,ERPS的RPL端口为转发状态,节点之间的数据帧能够通过RPL端口进行正常传输;当网络形成环路时,相当于ERPS的链路处于正常状态,ERPS的RPL端口被阻塞,节点之间的数据帧无法通过RPL端口进行转发,因此在逻辑上解除了环路,不会形成“网络风暴”。但是在成环点不能预先获知的情况下,ERPS也无法进行设置,难以进行保护。因此ERPS主要适用于用环路进行保护或者成环点能够预先判断的以太网络。4 基于环回检测的以太网环路检测技术环回检测也是一种应用比较广泛的以太网环路检测技术,其主要目的是发现以太网中的环路,并对环路进行隔离。它的主要原理是:在以太网节点周期的从端口发送一个带有自身地址的检测协议帧,节点在接收到检测协议帧后,将协议帧中包含的地址和自身地址进行比较,如果两者相同,则说明该节点接收到了自身发出的检测协议帧,接收端口外存在环路,需要将端口阻塞;如果节点在N(例如N为3.5)倍发送周期内没有收到带有自身地址的检测协议帧,则说明环路解除,并需要将阻塞端口打开,这个N倍发送周期称为成环消失时间。图3为环回检测的环路检测示意图。在图3(a)中,网络中无环路,节点1收不到自身发出的检测协议帧;在图3(b)中,当网络中出现环路时,节点1收到自身发出的检测协议帧,将端口2阻塞,防止了环路。环回检测的机制比较简单,可靠性也很高,而且发现环路的时间非常快,通常如果1 s发送一个检测协议帧,那么发现环路的时间则会在2 s以内,而且如加快检测协议帧的发送频率,就能够进一步减少发现环路的时间4-6。(a) 网络无环路状态 (b) 网络新增环路状态图3 环回检测的环路检测当网络中出现环路时,环回检测能够很好地发现环路并通过阻塞端口的方式将环路解除,但是只能提供网络中存在环路的信息,而无法获知具体的成环点位置。在规模较大的网络中,仅仅获知网络出现环路是不够的,只有确切得到成环点的位置,才能对网络进行维护,彻底解除网络隐患。因此环回检测主要适用于规模较小、易维护性要求不高的以太网络。5 基于成环点定位的以太网环路检测技术成环点定位技术是由中国通信标准化协会(CCSA)最新定义的一种新型以太网环路检测及定位技术,其主要目的是发现以太网中的环路,并能快速定位到成环点的具体位置7。成环点定位技术在环回检测的原理上进行了进一步的扩展和创新,主要原理为:当节点检测到端口的状态由不通转变为通时,会增大节点的成环消失时间,并且在成环消失时间到达后,进行一个随机的延时,最后再打开阻塞端口。如果网络由于新增链路而导致环路出现,则新增链路两端节点会检测到端口的状态由不通到通的转变,因此将节点的成环消失时间增大;在出现环路后,各个节点都能检测到环路已将端口阻塞,从而使得网络的环路解除;环路中多个端口被阻塞,各个节点都不能收到自身发出的环回检测协议帧,接着成环消失时间小的节点先打开阻塞端口;由于成环点相邻节点的成环消失时间最长,在其他节点都打开端口后,只有成环点相邻节点仍然为阻塞状态,并且能够收到自身发出的环回检测协议帧,因此仍然需要继续保持端口为阻塞状态,既解除了环路,又能定位到成环点位置。在网络中,当新增加一条链路导致两个节点连通时,这两个节点通过连通性检测技术(例如端口物理状态、操作、管理、维护(OAM)检测等)能够发现端口的状态由不通转变为通。运用该特性,当节点检测到端口的状态由不通转变为通时,则会增大节点成环消失时间,例如会将节点成环消失时间增大到6.5倍发送周期,而其他节点的成环消失时间仍然保持为3.5倍发送周期。如果该新增链路导致了环路,即这条链路为成环点,则根据环回检测原理,环路上的各个节点都能检测到环路,并将端口阻塞。如图4(a)所示,节点3和4之间新增加了一条链路从而导致环路,在形成环路后各个节点都能收到自身发出的环回检测协议帧,因此将端口阻塞,其中节点3和4的成环消失时间增大为6.5倍发送周期,其他节点仍然保持为3.5倍发送周期。由于各个节点阻塞了端口,因此环路得到了解除,在环路解除后,各个节点都不能收到自身发出的检测协议帧。由于非成环点相邻节点的成环消失时间较小,在成环消失时间到达后,会首先打开阻塞端口,只有成环点相邻两个节点会继续保持阻塞端口。在成环点相邻两个节点的成环消失时间到达后,由于两者都会随机延时一段时间后再打开端口,因此其中一个会先打开端口,这样另外一个节点会继续收到自己发出的检测协议帧,从而保持端口为阻塞状态。如图4(a)所示,在各个节点阻塞端口后,各个节点都不能收到自身发出的环回检测协议帧,在成环消失时间到达后,会打开阻塞端口;节点1和2的成环消失时间较小,他们会首先打开端口,待节点3和4的成环消失时间到达后,两个节点会在随机延时后再打开端口,由于两个节点的随机延时时间不一样,延时时间短的节点会先打开端口,延时时间长的节点会继续保持端口阻塞。如图4(b)所示,最终只有节点4阻塞了端口,由于其他节点都打开了端口,节点4能够重新收到自身发出的环回检测协议帧,因此继续保持端口为阻塞状态。根据环路中的阻塞端口,很容易定位出成环点的位置,非常便于维护。 (a) 网络新增环路后的状态 (b) 网络新增环路后成环点阻塞状态图4 成环点定位成环点定位的以太网环路检测技术,同时设置非常简单,针对的网络拓扑也非常灵活,而且并不会随着网络节点数量增加而提高复杂度,为以太网提供了一种简单高效的环路避免和成环点定位方法,非常适合各种以太网局域网和城域网,是一种创新性的以太网环路检测技术。CCSA也正在对该技术进行标准化,为该技术的规模应用奠定了标准的基础。6 结束语以太网在应用领域扩大的过程中遇到了网络环路、易维护性等方面的局限性,STP、ERPS、环回检测和成环点定位等技术针对以太网的各种应用领域提供了环路检测的解决方案,根据网络范围、承载业务的可靠性、维护性要求等方面的不同可以选择使用不同的技术。全球的标准组织也正在积极对以太网环路检测技术进行标准化。随着标准的不断成熟,以太网的环路检测技术将得到规模的应用,彻底解除以太网的环路风险。7 参考文献1 韦乐平. 电信技术发展的趋势和挑战J. 重庆邮电大学学报(自然科学版), 2010, 22(5):545-550. 2 张智江, 张尼. 下一代互联网的网络安全 J. 中兴通讯技术, 2011,17(2):30-32.3 ITU-T G.8032/Y.1344 v2. Ethernet ring protection switchingS.2010.4 蒋林涛. 未来互联网的承载网络 J. 中兴通讯技术, 2010,16(2):10-12.5 李玉宏, 程时端. 未来自管理互联网的结构和机制 J. 中兴通讯技术, 2010,16(2):23-26.6 高安妮. 移动IP城域网组网技术研究J. 数字通信, 2010,(2):42-46.7 以太网环路检测及定位技术要求S.北京:中国通信标准化协会,2011.收稿日期:2011-10-11作者简介:吴少勇,武汉大学硕士毕业;现就职于中兴通讯股份有限公司,任主任工程师;现从事分组传送网可靠性保护技术研发,参与ITU、IEEE标准工作;已发表学术论文4篇。甘玉玺,清华大学硕士毕业;现就职于中兴通讯股份有限公司,任主任工程师;现从事IP承载网、软交换、GoTa、IP高清和绿色动力电源等技术在轨道交通通信领域研究和应用;已发表学术论文3篇。张翰之,武汉邮电科学研究院硕士毕业;现就职于武汉邮电科学研究院,任主任工程师;现从事电信级以太网和NG-PON技术领域的研究;已发表学术论文3篇,申请专利4篇。