以太网二层静态环路保护技术分析.ppt
ETH L2 Static Ring-Protect Technical Analysis,CN1010/echegan 2010/8/20,以太网二层静态环路保护技术分析,目 录,以太网二层静态环路保护技术到底是什么 包括的协议 介绍其作用回忆它的过去 产生的背景 发展史介绍它的现在 RRPP简介 ERP简介 协议对比预测它的将来 ERP一统天下?七国八制,协议互通?,它到底是什么?-包括的协议,哪些不是?以太网 令牌环、SDH保护环二层 OSPF、IS-IS、vrrp、mpls frr静态 xSTP、PVST/PVST+环路 LAG、PBT、G.8031、Loop-detect(HW)、REUP(锐捷),PS:RPR虽支持以太网,但需要硬件支持,成本较高,各设备商支 持力度不大,且它的发展过程有自己的一套体系,因此虽满足以上条 件,但以下内容不作涉及;同理,基于RPR的MSR(Multiple Service Ring)-烽火 也不作涉及,它到底是什么?-包括的协议,因此,可以清楚知道它包括了以下的一系列协议:ERP(Ethernet Ring Protection Switching)Ericsson、Overture RRPP(Rapid Ring Protection Protocol)-HW、H3 ZESR(ZTE Ethernet Smart Ring)-ZTE RCPR(Raisecom Protection Ring)-Raisecom RERP(Rapid Ethernet Ring Protection)-锐捷 Turbo-Ring v1/v2-MOMA DT-Ring/DT-Ring+-东土 OESS-北电 大多为私有协议,之间并不互通,目录,以太网二层静态环路保护技术到底是什么 包括的协议 介绍其作用回忆它的过去 产生的背景 发展史介绍它的现在 RRPP简介 ERP简介 协议对比预测它的将来 ERP一统天下?七国八制,协议互通?,它到底是什么?-作用,破环:在以太二层网络上变环为链,避免环路(注意网络成环本身不是问题,根本问题是以下的几点)防止广播风暴:二层网络环路将导致广播风暴(没有三层网络的TTL机制),网络带宽的无效占用、网络设备的CPU、内存等资源的无效占用。防止MAC地址学习错误:环路将导致同一个MAC地址在多个端口之间来回震荡,从而可能指导二层流量转发错误。,它到底是什么?-作用,保护:提供备份的数据通路,应对网络故障(重点),以太网动态二层环路保护协议,因为环未知(不知有无担心出现/已出现成环迹象但不知在哪),因此主要作用是破环,以太网静态二层环路保护协议,因为环已知,因此主要作用是保护,目录,以太网二层静态环路保护技术到底是什么 包括的协议 介绍其作用回忆它的过去 产生的背景 发展史介绍它的现在 两种具有方案代表性的协议对比预测它的将来 ERP一统天下?七国八制,协议互通?,回忆它的过去-产生的背景,在实际的应用中存在一些小型网络,其包含设备数量相对较少,拓扑相对固定(设备、链路的添加和移除较少)在这样的网络中也存在一些引起故障和震荡的因素(链路故障、节点故障、线缆/接口接触不良、配置变更等等)动态环路保护在应对这样的情况时存在一些问题 收敛时间过长:STP的收敛时间至少是30s(Forward Delay 默认15s)RSTP的收敛时间也经常在秒级别 特别是随着网络中节点数的增多和拓扑结构的复杂 化,收敛时间会进一步增大 那这样的收敛时间是否满足要求呢?,回忆它的过去-产生的背景,根据和MEF 2的定义,网络保护的时间模型如图所示,回忆它的过去-产生的背景,保护倒换时间不等于业务恢复时间。保护倒换时间=故障检测时间保持时间故障通告时间保护操作时间为了确保保护倒换时间达到电信级的50ms要求,则需分别努力缩短故障检测、通告和倒换的时间,回忆它的过去-产生的背景,MEF对于业务恢复时间定义分级标准,分成了4类 50ms 恢复时间-典型的电信级以太网业务 200ms恢复时间-部分实时业务(如语音业务)2s恢复时间 5s恢复时间-基于TCP的应用,ITU-T对于线性保护和环网保护,保护倒换时间都要求 在50ms以内,两者所描述的对象略有差别,但考虑到两者一般差别不大,且业务恢复更具有实际意义,因此测试时一般以均以业务在50ms内恢复为准,因此xSTP不可能满足要求,回忆它的过去-产生的背景,可能造成网络资源的浪费:由于需要破环,需要阻塞一些端口/链路,当拓扑高度冗余的时候,会造成网络资源 的浪费,VS,回忆它的过去-产生的背景,转发路径难以预测:当拓扑较为复杂时,若没有经过特定配置,节点上到 底那个端口阻塞比较难预测(尤其是优先级靠后的几个参数),x,EAPS,VS,目录,以太网二层静态环路保护技术到底是什么 包括的协议 介绍其作用回忆它的过去 产生的背景 发展史介绍它的现在 RRPP简介 ERP简介 协议对比预测它的将来 ERP一统天下?七国八制,协议互通?,回忆它的过去-发展史,Extreme公司在2003年提出了EAPS保护技术,并在IETF发布了RFC3619,它的核心思想是标准MAC交换+改进的生成树算法+以太网故障检测机制+简单的环网控制协议。虽然只是报告(Informational)而不是标准,但采用Hello帧等简单的以太网故障检测机制和相对简单灵活且易于实现的保护倒换协议,早期被一些设备制造商在一些汇聚网络上商用,并在此基础上不断改进。随着技术的发展,后期各个厂家又衍生出多个私有的技术,比如ZESR,RRPP,ERP,MSR等以太网保护技术,但这些技术并不能互通。,为了实现以太网二层静态环路保护协议的标准化,ITU-T的Study Group15,从2006年2月立项开始研究,在2008年6月成功发布了ERP协议的第一个版本G.8032,随后又在2009年4月、2009年9月和2010年3月进行了多次修正和增补,协议本身正逐渐趋于完善,目录,以太网二层静态环路保护技术到底是什么 包括的协议 介绍其作用回忆它的过去 产生的背景 发展史介绍它的现在 RRPP简介 ERP简介 协议对比预测它的将来 ERP一统天下?七国八制,协议互通?,介绍它的现在-选这两个的原因和目的,以太网二层环路保护协议很多,为什么单单选这两个支持两种协议的公司在业界的地位较高支持这两种协议的相关产品种类较多最重要的是这两种协议分别代表了两种多环的实现方案,作比较的目的:它山之石,可以攻玉,开拓眼界,提高测试技术总结出两种实现方案共性的东西及这样实现的原因通过比较分析出各重要功能点实现方式的优缺点,介绍它的现在-RRPP,RRPP组成要素 RRPP域由整数表示的ID来标识,一组配置了相同的域ID和控制VLAN,并且相互联通的交换机群体构成一个RRPP域,一个RRPP域具有如下的组成要素:两种RRPP环:主环、子环四种节点:主节点、传输节点、边缘节点和辅助边缘节点四种端口角色:主端口、副端口 公共端口、边缘端口两种VLAN:控制VLAN(主/子)数据VLAN三种典型组网:单环、相交环、相切环主节点/环两种状态:Complete State Fail State传输节点三种状态:Link-Up State Link-Down State,Pre-forwarding State(临时阻塞),主环,子环,主环主节点主端口,子环主端口,公共端口,公共端口,主环主节点,子环主节点,主环主节点副端口,子环主节点副端口,传输节点,传输节点,边缘节点,辅助边缘节点,边缘端口,边缘端口,介绍它的现在-RRPP,RRPP的定时器,Hello Timer:hello报文的发送间隔(主节点),两种定时器的在主节点上的作用在于检测环状态,Fail Timer:hello报文的超时时间(主节点)自行开放临时阻塞端口的等待时间(传输节点),介绍它的现在-RRPP,RRPP基本原理每个域上所有节点配置相同的RRPP域ID和控制VLAN。每个域拥有两个控制VLAN,主控制VLAN和子控制VLAN。(只需要手动指定住控制VLAN,子控制VLAN为主控制VLAN+1)主环协议报文在主控制VLAN中传播,子环协议报文在子控制VLAN中传播。主环节点上的RRPP端口同时加入主控制VLAN和子控制VLAN,子环上的RRPP端口只加入子控制VLAN。子环的协议报文在主环中视为数据报文处理,与数据报文实现同步阻塞/放开。,介绍它的现在-RRPP,Polling机制-环状态检测 Polling机制是RRPP环的主节点主动检测环网健康状态的机制。主节点周期性的从其主端口发送HELLO报文,依次经过各传输节点在环上传播。如果主节点能够从副端口收到自己发送的HELLO报文,说明环网链路完整;否则如果在规定时间内收不到HELLO报文,就认为环网发生链路故障。,处于Failed状态的主节点从副端口收到自己发送的HELLO报文,立即迁移到Complete状态,放开副端口并刷新FDB,而且还会从主端口发送COMPLETE_FLUSH_FDB报文通知所有传输节点放开临时阻塞端口和刷新FDB。,介绍它的现在-RRPP,链路状态变化通知机制-环状态通知 链路状态变化通知机制提供了比Polling机制更快环网拓扑改变的处理机制,这一机制的发起者是传输节点。传输节点总是在监测自己的端口链路状态,一旦端口链路状态改变为Down时,它就会通过发送LINK-DOWN报文把这种变化通知主节点,然后由主节点来决定如何处理;端口链路状态改变为Up时,无需发送报文通知主节点。,介绍它的现在-RRPP,主环上子环协议报文通道状态检查机制 这一机制应用在多子环与主环相交的组网中。子环的协议报文需要通过主环提供的通道在边缘节点和辅助边缘节点的边缘端口之间传播,就好像整个主环是子环上的一个节点。当主环链路出现故障,边缘节点与辅助边缘节点间子环协议报文的通道中断(主环中与子环的公共链路故障,并且有一条以上的非公共链路故障)时,子环主节点将收不到自己发出的Hello报文,于是Fail定时器超时,子环主节点迁移到Failed状态,放开副端口。,介绍它的现在-RRPP,单环RRPP协议作用过程 以单环为例,以环网状态从健康-故障-健康的变化过程为线索,来描述RRPP协议的运行细节和拓扑收敛过程,健康状态(Complete State)当整个环网上所有链路都处于UP状态时,RRPP环处于健康状态,主节点的状态反映整个环网的健康状态。环网处于健康状态时,为了防止其上的数据报文形成广播环路,主节点阻塞其副端口。主节点从其主端口周期性的发送HELLO报文,依次经过各传输节点,最后从主节点副端口回到主节点。,介绍它的现在-RRPP,链路故障 当传输节点交换机上的RRPP环上发生链路DOWN时,链路两端节点各发送LINK-DOWN报文通知主节点,LINK-DOWN上报过程如图所示,介绍它的现在-RRPP,主节点收到LINK-DOWN报文后,立即将状态切换到Failed状态,放开副端口。由于网络拓扑发生改变,以免报文定向错误,主节点还需要刷新FDB表,并从主端口发送COMMON-FLUSH-FDB报文通知所有传输节点刷新FDB。主节点状态向Failed状态迁移过程如图所示。,介绍它的现在-RRPP,故障恢复 当传输节点交换机上的RRPP端口发生恢复时,传输节点迁移到Preforwarding状态,并阻塞刚刚恢复的端口。传输节点端口恢复时的处理过程如图所示。,介绍它的现在-RRPP,环网恢复的过程是由主节点主动发起的,主节点周期性的从主端口发送HELLO报文,环网上的故障链路全部恢复后,主节点将从副端口收到自己发出的检测报文。主节点收到自己发出的HELLO报文后,首先将状态迁移回Complete状态,阻塞副端口,然后从主端口发送COMPLETE_FLUSH_FDB报文。传输节点收到COMPLETE_FLUSH_FDB报文后,迁移回Link-Up状态,放开临时阻塞端口,并刷新FDB表。环网恢复的处理过程如图所示。,介绍它的现在-RRPP,如果不幸COMPLETE_FLUSH_FDB报文在传播过程中丢失,还有一种备份机制来实现传输节点临时阻塞端口的恢复,就是传输节点处于Preforwarding状态时如果在规定时间(由Fail定时器定义)内收不到主节点发来的COMPLETE_FLUSH_FDB报文,自行放开临时阻塞端口,恢复数据通信。,介绍它的现在-RRPP,单环报文,介绍它的现在-RRPP,单环报文,5表示HELLO报文6表示COMPLETE-FLUSH-FDB报文7表示COMMON-FLUSH-FDB报文8表示LINK-DOWN报文,Destination MAC Address:48bits,协议报文的目的MAC地址,范围是0 x000FE20782170 x000FE2078416。Source Mac Address:48bits,协议报文的源MAC地址,总是0 x000fe203fd75。EtherType:8bits,报文封装类型域,总是0 x8100,表示Tagged封装。PRI:4bits,COS(Class of Service)优先级,总是0 xe0。VLAN ID:12bits,报文所在VLAN的ID。Frame Length:16bits,以太网帧的长度,总是0 x48。DSAP/SSAP:16bits,目的服务访问点/源服务访问点,总是0 xaaaa。CONTROL:8bits,总是0 x03。OUI:24bits,总是0 x00e02b。RRPP Length:16bits,RRPP协议数据单元长度,总是0 x40。RRPP_VER:16bits,RRPP版本信息,当前是0 x0001。RRPP Type:8bits,RRPP协议报文的类型。5表示HELLO报文;6表示COMPLETE-FLUSH-FDB报文;7表示COMMON-FLUSH-FDB报文;8表示LINK-DOWN报文;10表示EDGE-HELLO报文;11表示MAJOR-FAULT报文。Domain ID:16bits,报文所属RRPP域的ID。Ring ID:16bits,报文所属RRPP环的ID。SYSTEM_MAC_ADDR:48bits,发送报文节点的桥MAC。HELLO_TIMER:16bits,发送报文节点使用的Hello定时器的超时时间,单位为秒。FAIL_TIMER:16bits,发送报文节点使用的Fail定时器的超时时间,单位为秒。LEVEL:8bits,报文所属RRPP环的级别。,RRPP报文参数,介绍它的现在-RRPP,RRPP相交环原理多环的情况与单环大致相同。多环与单环的不同之处在于多环中加入了主环中子环协议报文通道状态检测机制,在通道中断子环主节点副端口放开之前,先阻塞边缘节点的边缘端口来防止子环间形成数据广播环路(因为同域中所有子环使用同一个协议vlan),详细情况见主环上子环协议报文通道状态检查机制。另外,主环上节点收到子环的COMMON-FLUSH-FDB或者COMPLETE-FLUSH-FDB报文时,都会导致刷新FDB表;子环的COMPLETE-FLUSH-FDB不会导致主环传输节点放开临时阻塞端口,只有收到主环自己的COMPLETE-FLUSH-FDB报文才会这样做。,介绍它的现在-RRPP,RRPP相切环原理,目录,以太网二层静态环路保护技术到底是什么 包括的协议 介绍其作用回忆它的过去 产生的背景 发展史介绍它的现在 RRPP简介 ERP简介 协议对比预测它的将来 ERP一统天下?七国八制,协议互通?,介绍它的现在-ERP,ERP组成要素,RPL Neighbour Node,RPL Owner Node,RPL,两种ERP环:Major-ring、Sub-ring,两种特殊链路:Ring Protection Link、share link,三种节点:RPL Owner Node、RPL Node、Interconnection Node,三种典型组网:单环、相交环、相切环,Interconnection Node,Major-ring,Sub-ring,Interconnection Node,RPL OwnerPort,share link,介绍它的现在-ERP,ERP的定时器,WTR(Wait to Restore):SF的恢复延时,WTB(Wait to Block):Forced Switch/Manual Switch的恢复延时,Hold-off timer:SF的通告延时,Guard timer:恢复的通告延时,四种定时器的作用均在于防止拓扑震荡,其中Guard timer是防止之前发送的R-APS(SF)报文仍在环上转发导致状态在恢复SF之间震荡,因此一般根据环的大小设置为大于R-APS(SF)报文在环上传一周所需时间,介绍它的现在-ERP,三种典型组网,Major-ring,Sub-ring,Normal-ring,Normal-ring2,Normal-ring1,介绍它的现在-ERP,环上RPL Owner node双向发R-APS(NR,RB,NFS)报文来监测节点间链路状态(只有RPL Owner node发,其他节点不发),健康状态(Idle state),同样以单环为例,以环网状态从健康-故障-健康的变化过程为线索,来描述ERP协议的运行细节和拓扑收敛过程,Ring-Automatic Protection Switching,R-APS:,介绍它的现在-ERP,发生故障(Signal Failure),环上某处发生故障,两端节点检测到故障后,起定时器,等待hold-off time后向两端逐跳扩散R-APS(SF)报文报文触发两个动作1.RPL Owner收到后阻塞RPL2.所有收到报文的节点 清MAC表中动态表项,介绍它的现在-ERP,故障恢复(Failure Recovery),RPL Owner,RPL,1、当链路恢复后,恢复链路的两 端节点立即阻塞up起来的端口2、两端节点发送R-APS(NR)报文 向两端逐跳扩散3、RPL Owner收到NR报文后启动WTR定时器,超时后阻塞RPL Owner port,发出R-APS(NR,NB)报文逐跳扩散4、恢复链路的两端节点收到报文后,打开先前阻塞的端口,清MAC表中动态表项至此,环状态恢复至健康状态,介绍它的现在-ERP,从健康-故障-健康的流程演示,RPL Owner Node,RPL Neighbour Node,介绍它的现在-ERP,R-APS报文,介绍它的现在-ERP,报文举例R-APS(NR,RB),目录,以太网二层静态环路保护技术到底是什么 包括的协议 介绍其作用回忆它的过去 产生的背景 发展史介绍它的现在 RRPP简介 ERP简介 协议对比预测它的将来 ERP一统天下?七国八制,协议互通?,介绍它的现在-协议对比,因为同源,所以相同点较多,不同点较少,介绍它的现在-协议对比,环中链路状态的监测方法,从头到尾单方向检测使用私有单播报文Hello 独占vlan,链路上RPL Owner node 双向发送使用标准协议组播报文R-APS(NR,RB,NFS)独占vlan且报文优先级最高,分析:RRPP的hello报文单向发送,受到QOS或其他意外情况影响可能性较大 在带宽充足的情况下,独占vlan完全排除了数据报文影响导致丢弃的可能 在带宽不足的情况下,报文丢弃策略偏向于丢弃优先级低的,ERP更有优势,VS,介绍它的现在-协议对比,环故障通知改逻辑拓扑,故障链路两端节点先通知主节点主节点再发COMMON-FLUSH-FDB通知其他节点清MAC,过程由主节点控制,故障链路两端节点沿两端逐节点通知+清MAC,直到主节点,VS,分析:分散控制比集中控制更为安全,防止因主节点问题导致整网逻辑拓扑不能改变,介绍它的现在-协议对比,主子环划分方式不同,Sub-ring子环划分模型,子环协议报文必须走共享链路或主环链路,子环协议报文可以不上主环,介绍它的现在-协议对比,对于多VLAN的支持方法不同,多域多环,各域独立VLAN,无域多环,各环独立VLAN,最终网络为复合环叠加,最终网络为独立环叠加,预测它的未来,以太网二层环路保护协议的发展方向,ERP以其标准性和相对完善性,必将在未来逐渐成为主流,因为各设备商多年来已经在私有协议上投入了大量人力物力,现网上也有着大量应用,在可预见的短时期内,放弃自己的私有协议转而支持ERP并不现实;更由于这些私有协议与ERP同源,同时支持公私协议的可能性也比较小。因此在可预见的短时期内,仍然会是七国八制的混乱局面,对于多域多环的研究仍将是以后的重点之一,由于已经标准化,协议所支持的网络类型有可能增加,协议的精华思想可能会融入其他业务中去,形成一些新的解决方案,随着ERP标准化的推进,互通的需求将进一步上升,私有协议厂商有可能在自己现有的基础上增加与ERP互通的特性,