CN1466391A - Ip环分布式带宽处理方法 - Google Patents

Ip环分布式带宽处理方法 Download PDF

Info

Publication number
CN1466391A
CN1466391A CNA021250111A CN02125011A CN1466391A CN 1466391 A CN1466391 A CN 1466391A CN A021250111 A CNA021250111 A CN A021250111A CN 02125011 A CN02125011 A CN 02125011A CN 1466391 A CN1466391 A CN 1466391A
Authority
CN
China
Prior art keywords
node
bag
priority
ring
packet
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA021250111A
Other languages
English (en)
Other versions
CN1292567C (zh
Inventor
�ż���
张嘉全
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Device Shenzhen Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Priority to CN02125011.1A priority Critical patent/CN1292567C/zh
Priority to AU2003244050A priority patent/AU2003244050A1/en
Priority to PCT/CN2003/000409 priority patent/WO2004002077A1/zh
Publication of CN1466391A publication Critical patent/CN1466391A/zh
Application granted granted Critical
Publication of CN1292567C publication Critical patent/CN1292567C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L47/00Traffic control in data switching networks
    • H04L47/10Flow control; Congestion control
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L12/00Data switching networks
    • H04L12/28Data switching networks characterised by path configuration, e.g. LAN [Local Area Networks] or WAN [Wide Area Networks]
    • H04L12/42Loop networks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L47/00Traffic control in data switching networks
    • H04L47/10Flow control; Congestion control
    • H04L47/12Avoiding congestion; Recovering from congestion
    • H04L47/122Avoiding congestion; Recovering from congestion by diverting traffic away from congested entities

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Small-Scale Networks (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

一种涉及电通信技术的IP环分布式带宽处理方法,这种IP环分布式带宽处理方法,在采用双环型拓朴结构的IP环中,对环上每个节点进行一定的访问控制,流量控制包根据IP环上拥塞节点的信息及其所处的相对位置,控制数据传送流量,通过近无队首阻塞与具有权重的公平算法在每个节点上完成流量控制,互相传递流量信息,解决了队首阻塞问题,本发明合理利用宽带资源,提高带宽利用率,使用权重公平算法,使带宽分配更加合理,实用性强,适合于数据无损传输。

Description

IP环分布式带宽处理方法
技术领域
本发明涉及电通信技术,尤其涉及一种IP环分布式带宽处理方法。
背景技术
CISCO公司提出了DPT技术,即Dynamic Packet Transport,这是CISCO光互连战略中的第四步,其核心是目标节点剥离和带宽复用,但DPT技术具有队首阻塞(Head of line blocking)的弱点:
DPT的SRP-fa算法对“公平”原则作了详细的限制,但没有充分做到带宽复用,SRP-fa公平算法在对节点的上环流量进行限制时,只限制了总的流量,对目的节点不加考虑。如图1所示,假设节点1、节点2、节点3都从外环向节点4发送数据包,如果节点3发生拥塞,会通过内环向节点2发带有流量限制信息的流量控制包,即公告包,节点2再将此流量控制包复制后从内环发送给节点1,遵循路径最短原则,控制包在相应数据包路径相反环向发送,节点1和节点2上执行的公平算法SRP-fa根据收到的流量限制信息限制本节点的上环总流量,目的是使节点3解除或者减轻拥塞,这样,节点1在外环的所有上环流量都会受到限制;假设节点1有发往节点2、3、4的数据包,这些数据包中,只有发往节点4的数据包对节点3的拥塞有责任,发往节点2和节点3的数据包,对节点3的拥塞没有“贡献”,在SRP-fa中,由于节点3拥塞,却导致节点1发往节点2、3的流量受到限制,从而产生队首阻塞,这样的处理方法是不合理的,浪费了带宽。
发明内容
本发明的目的在于提供一种合理利用宽带资源的IP环分布式带宽处理方法。
这种IP环分布式带宽处理方法,其特征在于:它包括如下步骤:
A、节点剥离:IP环中,对于单播包,实行目的节点剥离;对于多播包,实行源节点剥离;
B、支持多优先级:
    IP环的包主要分为控制包和数据包,包头格式相同,包头依
次包含如下域:TTL、RI、MODE、PRI和P;
    TTL:类似于IP报文的TTL域,包上环时L3会根据目的节点地
址设置初使的TTL域值,指示源节点到目的节点之间路由的逻辑
距离;
    RI:指示当前包在外环还是内环传送;
    MODE:指示当前包的类型;目前可用的类型包括:流量控制
包、拓朴包、IPS包和数据包等;
    PRI:指示IP环的包的优先级;
    P:包头校验位,对TTL、RI、MODE、PRI进行奇校验;
    IP环的数据包格式包含:包头、DESTINATION NODE ADDRESS、
SOURCE NODE ADDRESS、PAYLOAD、FCS;
    其中,DESTINATION NODE ADDRESS:目的节点地址,环上
的所有节点被配置唯一的逻辑地址;
    SOURCE NODE ADDRESS:源节点地址;
    PAYLOAD:载荷,其长度可变,以字节为单位,通常情况下是
MAC帧;
    FCS:帧校验序列;对IP环的包中除了包头和FCS本身外的部
分进行CRC32校验计算;
    IP环的流量控制包的格式如下:包头、SOURCE NODE ADDRESS、
TTL_TO_CONGEST、BAND-ALLOW、FCS;
    SOURCE NODE ADDRESS:发出带宽控制信息的节点地址;
    TTL_TO_CONGEST:距离本节点最近的拥塞节点到本节点之间
的逻辑距离;
    BAND-ALLOW:带宽控制信息;
    IP环包头的PRI域指示了包的发送优先级,当载荷为MAC帧时,
包优先级由MAC帧的VLAN优先级和MAC帧中IP包的TOS优先级按照
一定规则映射而成,共支持8个优先级;不同的优先级有不同的
调度策略,在IP环上优先级高的包被优先传送;
C、拥塞及流量处理:在IP环***中,采用公平算法计算可用带宽,使整个环网构成一个流量互控、分布计算的闭合负反馈环;流量控制包根据IP环上拥塞节点的信息及其所处的相对位置,控制数据传送流量;
所述的TTL域在每个中间转发节点将TTL域减去1,单播包会被目的节点剥离,当有一部分上游节点发来的数据包被本节点作目的剥离后,本节点就将更多的L3数据发送到环上;多播包则被源节点剥离,如果在IP环的包上环后,且到达目的节点之前,源节点和目标节点都失效,则当TTL减到0时被强制从环上剥离;在拥塞及流量处理方法中,流量控制包的SOURCE NODE ADDRESS域指示IP环上拥塞最严重的节点的地址,相应的BAND-ALLOW指示IP环网上拥塞最严重节点的send_rate;流量控制包中的TTL_TO_CONGEST指示距离最近的拥塞节点到本节点之间的逻辑距离,节点检测到自己拥塞,就将向上游发出的流量控制包的TTL_TO_CONGEST域设置成1;不拥塞的节点如果收到一个公告包,就将接收公告包中TTL_TO_CONGEST域的数值加上1,赋给发出公告包的TTL_TO_CONGEST域,若拥塞节点收到这个公告包,就将发出公告包的TTL_TO_CONGEST复位成1;
所述的公平算法对环网上每个节点采用权重公平算法,根据各节点重要程度及所需带宽流量在初使化时配置相应的权重系数,在计算中,各节点的send_rate及BAND-ALLOW为经过相应的权重系数归一化计算后的send_rate和BAND-ALLOW;
所述的权重系数越大则表明节点的重要程度越高,在环网拥塞时应该比权重系数小的节点享有更多的IP环路带宽,它们所享有的带宽正比于节点权重值;
所述的IP环所支持的节点数最多为64个;
所述的TTL域的最大值是IP环网所支持的节点数量的两倍;
所述的帧校验序列所进行的校验计算的校验多项式为:
X32+X26+X23+X22+X16+X12+X11+X10+X8+X7+X5+X4+X2+X+1;
所述的IPR中实现高和低两个优先级,有一个可配置的参数作为划分高、低优先级的门限;L3将上环的数据包根据优先级分类放在高优先级Transmit Buffer和低优先级Transmit Buffer中,MAC将需要转发的上游数据包根据优先级放置在高优先级Transit Buffer和低优先级Transit Buffer中;有4种数据包需要从节点的Tx接口发送:高、低优先级Transit Buffer里的数据包和高、低优先级Transmit Buffer里的数据包;在IP环中,包发送调度策略遵循如下原则:
高优先级的包应比低优先级包优先发送;已经上环的业务,在Transit Buffer中的数据包不应丢弃;在IP环节点中4种数据包调度的一般优先次序为:
高优先级Transit包,转发从上游节点上环的高优先级包;
高优先级Transmit包,从本节点上环的高优先级包;
低优先级Transmit包,从本节点上环的低优先级包;
低优先级Transit包,转发从上游节点上环的低优先级包;
高优先级数据包配置预留带宽,高优先级Transit Buffer中的数据包总是被无条件优先发送,但高优先级Transmit Buffer中的数据包被有条件优先发送:如果低优先级Transit Buffer的深度到达危险高门限HI_THRESHOLD,节点的高优先级Transmit包必须停发,立即发送低优先级Transit包,MAC输出STOP_HIGH信号给L3,指示停止发送高优先级Transmit包;
在低优先级Transit Buffer深度没有达到危险低门限LO_THRESHOLD前,低优先级Transmit包先于低优先Transit包发送,但一旦达到危险低门限,就要立刻停止低优先级Transmit包的发送,立即转发低优先级Transit包;低优先级Transmit包在流量超过带宽处理方法限制的流量后,也要停止发送,MAC输出STOP_LOW信号给L3,指示停止发送低优先级Transmit包;
所述的高优先级Transit Buffer的深度为2-3个最大包长MTU,最大包长MTU即Max Transport Unit,IPR中的最大包长MTU为9216字节;低优先级Transit Buffer要足够大;低优先级Transit Buffer的危险低门限大约为整个Buffer大小的一半,危险高门限设置为整个Buffer大小减去3个最大包长MTU尺寸。
本发明的原理和有益效果为:IP环是一种IP包环网传输技术,用于城域网中对IP包的优化传输,IP环网***是一种新型的传输***,它结合了路由器的带宽使用效率高的特点和光纤网络带宽大、自愈能力强的优点,IP环利用目标节点剥离技术,充分优化本地带宽,实现带宽复用,即,使得环网上的综合带宽利用率高于不复用情况,同时按照一定规则保证环网上每个节点获得合理、公平的接入带宽数量。IP环使用与所有环技术如令牌环、FDDI等一样的双环型拓朴结构,如图1所示,使用均衡双向环型拓朴结构,两个环分别被称为内环和外环,两个环并发地传送数据包和控制包,相关的数据包和控制包在相反的环向上传送,例如,对于在内环传送的数据包来说,和它相关的控制包在外环以相反的方向传送,对于外环的数据包,和它相关的控制包则在内环以相反的方向传送,IPR拓朴包,一种控制包,完成环网拓朴图映射,IPR倒换包,一种控制包,完成保护倒换,IP环带宽控制包,一种控制包,完成带宽限制信息传递功能;在正常(非倒换)工作模式下,任意两个节点之间存在两条数据路径,数据包的路由既可以选择外环路由,如图1所示,节点1发给节点3的数据包可以选择外环路由节点1->节点2->节点3,也可以选择内环路由,如图1中,节点1发给节点3的数据包可以选择内环路由节点1->节点6->节点5->节点4->节点3,选择哪条环路由L3层决定,一般遵循最短路径原则,按照这种原则,节点1发给节点3的数据包将选择路由节点1->节点2->节点3;作为一种共享媒体,需要对环上每个节点进行一定的访问控制,来保证环上各个节点合理、公正地共享环路带宽,但不象Token Ring和FDDI,IP Ring不用token来作集中式访问控制,它通过在每个节点上执行分布式带宽处理方法完成流控,节点之间用专门的流量控制包互相传递流量信息,节点上的分布式带宽处理方法直接在硬件,如专用集成电路ASIC、现场可编程门阵列FPGA上实现;IP环实际上是一个流量控制反馈环,由于所有的带宽计算、流量互控、拥塞处理等直接由各个节点硬件完成,不需要软件控制,所以大大提高响应速度,缩短了从流量突变到流量公平时的收敛时间。
在本发明中,流量控制包中的TTL_TO_CONGEST指示本节点到距离最近的拥塞节点之间的逻辑距离,节点一检测到自己拥塞,就将向上游发出的流量控制包的TTL_TO_CONGEST域设置成1,不拥塞的节点如果收到一个公告包,就将接收公告包中TTL_TO_CONGEST域的数值加上1,赋给发出公告包的TTL_TO_CONGEST域,现举例如下,如图1所示,假设节点4发生拥塞,节点1、2、3、5、6都没有拥塞,则节点4向节点3发出的公告包中,SOURCE NODE ADDRESS等于4,TTL_TO_CONGEST等于1,BAND-ALLOW为节点4的send_rate,节点3在收到这个公告后,复制一个内容相同的公告,再将TTL_TO_CONGEST加上1后变成2,向节点2发送,节点2作相同处理......节点1收到公告后,用公告包中的信息限制自己的上环流量,首先要保证发往4节点以远但不包括节点4的低优先级带宽总和不大于收到的BAND-ALLOW,即节点4的send_rate,然后检查收到公告的TTL_TO_CONGEST域,发现为3,就知道和最近的拥塞节点之间的逻辑距离为3,于是,节点1不加限制的向节点2、节点3、节点4发送Transmit数据包,节点1的L3会将发送给这3个节点的数据包的TTL分别设置为1,2,3。这样,节点4的拥塞限制了节点1发往节点4以远的流量,但不影响发往节点2、3、4的带宽,解决了队首阻塞问题,提高了带宽利用率;
在本发明中增加了权重公平算法,当环网流量公平时,各个节点的带宽利用数量和配置的节点权重成正比,使带宽分配更加合理,使环网上的每个节点带宽流量符合现实使用的需要,提高了本发明的实用性;IP环网所支持的节点数最多为64个、TTL域的最大值采用IP环网所支持的节点数量的两倍即128,虽然优先级域PRI表示8个优先级,在本发明的IP环中只采用高和低两个优先级,用优先级门限加以区分,以及高优先级Transit Buffer中的深度为2-3个最大包长MTU,低优先级TransitBuffer的危险低门限大约为整个Buffer大小的一半,危险高门限设置为整个Buffer大小减去3个最大包长MTU尺寸等等,使本发明在实际的工程应用中更趋于合理、实用。
总之,本发明合理利用宽带资源,解决了队首阻塞问题,提高带宽利用率,使用权重公平算法,使带宽分配更加合理,实用性强,适合于数据无损传输。
附图说明
图1为双环型拓朴结构示意图;
图2为IP环节点实现模型示意图;
图3为IP环连接示意图;
图4为环网应用示例示意图。
具体实施方式
下面根据附图和实施例对本发明作进一步详细说明:根据图1、图2、图3和图4,在采用双环型拓朴结构的IP环中,对环上每个节点进行访问控制,通过一定的处理方法在每个节点上完成流量控制,节点间互相传递流量控制信息,IP环节点需要同时处理内环和外环流量,因此一个IP环节点由两块背靠背的MAC处理芯片组成,配合处理内环和外环的包,如图2所示,对于一个IPR节点来说,有两种输入流量:从上游节点(按照数据包路由路径划分上游和下游)收到的流量和本节点上环的流量,也有两种输出流量:从上游节点发出,目的为本节点的流量和向下游节点发送的流量。MAC节点其实就是一个分组转发器;如图3所示,IP环相邻节点的Rx和Tx首尾相连,组成IP环网,本发明采用如下方法,在每个节点上完成分布式流量控制信息的计算:
A、节点剥离:传统的数据环如令牌环和FDDI环使用源地址剥离和令牌处理来控制对环网的访问,数据包在被剥离之前会在整个环网上绕行一周,本发明实行单播包的目的节点剥离,当节点在Rx处接收到上游相邻节点发来的单播数据包时,进行CAM匹配,如果该单播数据包的DESTINATION NODE ADDRESS等于本节点地址,则将该数据包送给HOST,即L3设备,并将该数据包从环上剥离;如果CAM匹配不成功,说明本节点不是目的节点,则该数据包被放置在Transit Buffer里,在流量控制模块Flow Control Module的控制下继续向下游节点转发,对于多播包,实行源节点剥离的方式,目的节点剥离方式使得带宽复用成为可能,Tx接口输出的总带宽是一定的,当有一部分上游节点发来的数据包被本节点作目的剥离后,本节点就将更多的L3数据发送到环上,从而提高了带宽利用率;另外,IP环使用反向双环结构也有利于带宽复用,因为双环中任何源节点和目的节点之间总有两条路由路径,内环和外环,一般选择较短路由路径,较短路径的逻辑距离一定不会大于环逻辑周长(即环节点总数)的一半,假设每个源节点发往各目的节点的数据包数量呈随机平均分布的话,那么所有路由的平均逻辑距离只有环逻辑周长的1/4,如果所有路由段的带宽都被利用上的话,会大大提高带宽复用效率。
B、支持多优先级:
    IP环的包主要分为控制包和数据包,包头格式相同,包头依次
包含如下域:TTL、RI、MODE、PRI和P;
    TTL(8bits):类似于IP报文的TTL域,包上环时L3会根据目
的节点地址设置初使的TTL域,指示所选择路由的逻辑距离,每个中
间转发节点将TTL域减去1,单播IPR包会被目的节点剥离,如果是广
播包则被源节点剥离。如果当IPR包上环后,在到达目的节点之前,
源节点和目标节点都失效,则当TTL减到0时被强制从环上剥离,这
主要是为了防止该IPR包在环上无限传输,TTL的最大值是节点最大
数量的两倍,目前的IP环最多支持64个节点,节点越多,节点间的
距离越长,环网流量调节的收敛时间越长。
    RI(1bit):指示当前包在外环还是内环传送;
    MODE(3bit):指示当前包的类型;可指的类型包括:流量控
制包、拓朴包、IPS包和数据包等;
    其中,000-011:保留
          100:表示拓朴包;
      101:表示IPS包;
      110:表示流量控制包;
      111:表示数据包
PRI(3bits):指示IP环的包的优先级;
P(1bit):包头校验位,对TTL、RI、MODE、PRI进行奇校验;
IP环的数据包格式包含:包头、DESTINATION NODE ADDRESS、SOURCE NODE ADDRESS、PAYLOAD、FCS;
其中,DESTINATION NODE ADDRESS(8bits):目的节点地址,环上的所有节点被配置以唯一的逻辑地址,这样所有节点上的MAC根据逻辑地址进行快速的二层交换;
SOURCE NODE ADDRESS(8bits):源节点地址;
PAYLOAD:载荷,其长度可变,以字节为单位,可以是任意载荷,通常情况下是MAC帧;
FCS(32bits):帧校验序列;对IP环的包中除了包头和FCS本身外的部分进行CRC32校验计算,帧校验序列所进行的校验计算的校验多项式为:
X32+X26+X23+X22+X16+X12+X11+X10+X8+X7+X5+X4+X2+X+1
IP环的流量控制包的格式如下:包头、SOURCE NODE ADDRESS、TTL_TO_CONGEST、BAND-ALLOW、FCS;
SOURCE NODE ADDRESS(8bits):发出带宽控制信息的节点;
TTL_TO_CONGEST(8bits):本节点距离最近的拥塞节点到本节点之间的逻辑距离;
BAND-ALLOW(16bits):带宽控制信息;
控制包的其它格式与数据包的相应其它格式相同。
IP环包头的PRI域指示了包的发送优先级,包优先级由MAC帧的VLAN优先级和MAC帧中IP包的TOS优先级按照一定规则映射而成,共支持8个优先级;不同的优先级有不同的调度策略,在IP环上优先级高的包被优先传送;出于实现代价的原因,IP环中实现高和低两个优先级,有一个可配置的参数作为划分高、低优先级的门限;如图2所示,L3将上环的数据包根据优先级分类放在高优先级TransmitBuffer和低优先级Transmit Buffer中,MAC将需要转发的上游数据包根据优先级放置在高优先级Transit Buffer和低优先级TransitBuffer中;有4种数据包需要从节点的Tx接口发送:高、低优先级Transit Buffer里的数据包和高、低优先级Transmit Buffer里的数据包;在IP环中,包发送调度策略遵循如下原则:
高优先级的包应比低优先级包优先发送;已经上环的业务,在Transit Buffer中的数据包不应丢弃,已经上环的业务被丢弃的情况一般发生在:低优先级Transit Buffer已满,上游节点又有需要本节点转发的低优先级数据包从Rx接口来到,新到的数据包无法写入低优先级Transit Buffer只好被丢弃。因此,防止低优先级TransitBuffer拥塞或溢出是调度策略和公平算法的重要作用,高优先级Transit Buffer中的包在节点总是被优先调度,因此,没有被丢弃的危险。
在IP环节点中4种数据包调度的一般优先次序为:
高优先级Transit包,转发从上游节点上环的高优先级包;
高优先级Transmit包,从本节点上环的高优先级包;
低优先级Transmit包,从本节点上环的低优先级包;
低优先级Transit包,转发从上游节点上环的低优先级包;
通过优先发送低优先级Transmit包,使得低优先级TransitBuffer深度到达拥塞门限,拥塞后,本节点就向上游节点发送带有流量限制信息的流量控制包,即公告包,使上游节点减少上环流量,以减轻或消除本节点的低优先级Transit Buffer拥塞状况,因此,低优先级Transmit包优先于低优先级Transit转发。
高优先级数据包配置预留带宽,高优先级Transit Buffer中的数据包总是被无条件优先发送,但各个节点配置的高优先级预留带宽之和不能太大,否则低优先级数据包上环后转发延迟很大,而且很容易造成节点拥塞甚至溢出;高优先级Transmit Buffer中的数据包被有条件优先发送:如果低优先级Transit Buffer的深度到达危险高门限HI_THRESHOLD,说明低优先级Transit Buffer即将溢出,节点的高优先级Transmit包必须停发,立即发送低优先级Transit包,以防低优先级Transit Buffer溢出,此时,MAC输出STOP_HIGH信号给L3,指示停止发送高优先级Transmit包;
低优先级Transmit Buffer数据包优先于低优先级TransitBuffer发送的策略也是有条件的:在低优先级Transit Buffer深度没有达到危险低门限LO_THRESHOLD之前,低优先级Transmit包先于低优先Transit包的发送,但一旦达到危险低门限,就要立刻停止低优先级Transmit包的转发,立即转发低优先级Transit包,避免低优先级Transit Buffer溢出。低优先级Transmit包在流量超过带宽处理方法限制的流量后,也要停止发送,此时,MAC输出STOP_LOW信号给L3,指示停止发送低优先级Transmit包;
由于高优先级Transit Buffer中的包总是被优先转发,所以不需要太大,高优先级Transit Buffer中的深度为2-3个最大包长MTU,最大包长MTU即Max Transport Unit,IPR中的最大包长MTU为9216字节;低优先级Transit Buffer要足够大,以避免溢出,具体大小要视仿真情况而定,在环路带宽为622Mbps、环直径为100km的情况下,推荐Buffer容量256Kbyte,环路带宽或环直径增加时,应相应增加Buffer容量;低优先级Transit Buffer的危险低门限大约为整个Buffer大小的一半,危险低门限太低会造成频繁拥塞,并因此导致低优先级包的延迟过大,危险高门限只有在环路拥塞极其恶劣的情况下才会达到,设置为整个Buffer大小减去3个最大包长MTU尺寸。
C、拥塞及流量处理:在IP环***中,采用带权重的公平算法,使整个环网构成一个流量互控、分布计算的闭合负反馈环,流量控制包根据IP环上拥塞节点的信息及其所处的相对位置,控制数据传送流量,流量控制包中的流量控制信息BAND-ALLOW也叫做“公告”,流量控制包也叫做“公告包”;如果收到公告的节点自己不拥塞,则将收到的公告继续向上游节点发送,如果收到公告的节点自己也拥塞,那么它比较收到的BAND-ALLOW和自己的send_rate,选择较小的一个放在公告包中向上游发送出去,流量控制包中的SOURCE NODEADDRESS域指示BAND-ALLOW的数值出自哪个节点,不拥塞的节点和send_rate比收到BAND-ALLOW大的节点会将收到流量控制包的SOURCE NODE ADDRESS域内容拷贝到本节点发出的流量控制包的SOURCE NODE ADDRESS域,流量控制包的SOURCE NODE ADDRESS域实质上指示的是IP环上拥塞最严重的节点的地址,相应的BAND-ALLOW指示的是IP环网上拥塞最严重节点的send_rate;流量控制包中的TTL_TO_CONGEST指示距离最近的拥塞节点的逻辑距离,节点检测到自己拥塞,就将向上游发出的流量控制包的TTL_TO_CONGEST域设置成1;不拥塞的节点如果收到一个公告包,就将接收公告包中TTL_TO_CONGEST域的数值加上1,赋给发出公告的TTL_TO_CONGEST域,用这种方法,每个不拥塞的节点都知道最近的拥塞节点到本节点之间的逻辑距离,这样,不拥塞节点就可以向最近拥塞节点以近无队首阻塞的方法发送数据包,本发明应用了这种拥塞以近无队首阻塞的方法,很好地解决了队首阻塞问题。
在IP环***中,每个节点周期发送流量控制包,流量控制包中的BAND-ALLOW指示了允许上游节点最大可发送的、需要本节点转发的低优先级带宽,如图1所示,节点4向节点3发出的流量控制包中就指示了节点3可以发往节点4以远的低优先级带宽,在IP环网中,流量控制包都是点对点的,节点4发送给节点3的流量控制包会被节点3剥离。
如果环网上所有节点都不拥塞,那么每个节点都可以尽量发送低优先级数据包,这时,每个节点发出的流量控制包的BAND-ALLOW都是16’hFFFF,表示不限制上游节点的上环低优先级流量;一旦某个节点出现拥塞,即低优先级Transit Buffer深度达到一个***初使化时配置的拥塞门限,此节点就要将发出的BAND-ALLOW设置成自己的本地低优先级上环速率send_rate,上游节点收到这个流量控制公告包后,会调节自己的上环低优先级Transmit流量,使之不要超过BAND-ALLOW。简言之,拥塞节点的上游节点发送的低优先级Transmit带宽不应比拥塞节点发送的低优先级Transmit带宽大,这就体现了公平,不拥塞的节点在收到下游节点发来的限制流量公告后,会将BAND-ALLOW拷贝到流量控制包中,继续向上游节点发送,这样,整个环网就构成了一个流量互控、分布计算的闭合负反馈环,最终环网各节点流量达到稳定和公平,但这只是简单的公平,例如图4所示,节点1、2,3在外环上都有数据包发送给4,假设单环的带宽是600M,则首先发生拥塞的是节点3,节点3将首先发送公告给节点2,节点2再将公告复制后发送给节点1。在公平算法的作用下,最终环路的收敛结果是节点1、2、3各自向节点4发送200M流量,这就是无权重绝对公平。在实际网络应用中,各个节点的流量并不一致,比如节点3可以提供500M的平均流量,节点1和节点2可以提供300M的平均流量;而且可能节点3的业务比节点1、2更加重要,这时简单公平就显得不太合理。
本发明在公平算法中对环网上每个节点根据其重要程度及所需带宽流量在初使化时配置相应的权重系数,在计算中,各节点的send_rate及BAND-ALLOW为经过相应的权重系数归一化计算的send_rate和BAND-ALLOW;权重系数越大则表明节点的重要程度越高,在拥塞时应该比权重系数小的节点享有更多的IP环路带宽,显然,使用具有权重的公平算法解决了简单公平问题。例如,在环网上每个节点初使化时配置权重系数,如节点1、2,3配置的权重系数分别是1、2,3,权重越大说明节点的重要程度越高,在拥塞时应该比权重系数小的节点享有更多的环路带宽。如图4所示,当节点3拥塞时,它不是将自己的send_rate发给节点2,而是将send_rate除以3,即节点3的权重系数,后再发给2,这样,环网上传送的都是归一化计算后的流量控制信息,收到公告后,节点2上执行的公平算法会限制上环的低优先级数据包不要大于收到的BAND-ALLOW乘以2,即节点2的权重系数,同理,节点1上执行的公平算法限制上环的低优先级数据包不大于BAND-ALLOW乘以1;在环网带宽收敛后,节点1、2,3可上环的低优先级带宽分别是100M、200M、300M,使带宽分配更加合理。

Claims (9)

1.一种IP环分布式带宽处理方法,其特征在于:它包括如下步骤:
A、节点剥离:IP环中,对于单播包,实行目的节点剥离;对于多播包,实行源节点剥离;
B、支持多优先级:
    IP环的包主要分为控制包和数据包,包头格式相同,包头依
次包含如下域:TTL、RI、MODE、PRI和P;
    TTL:类似于IP报文的TTL域,包上环时L3会根据目的节点地
址设置初使的TTL域值,指示源节点到目的节点之间路由的逻辑
距离;
    RI:指示当前包在外环还是内环传送;
    MODE:指示当前包的类型;目前可用的类型包括:流量控制
包、拓朴包、IPS包和数据包等;
    PRI:指示IP环的包的优先级;
    P:包头校验位,对TTL、RI、MODE、PRI进行奇校验;
    IP环的数据包格式包含:包头、DESTINATION NODE ADDRESS、
SOURCE NODE ADDRESS、PAYLOAD、FCS;
    其中,DESTINATION NODE ADDRESS:目的节点地址,环上
的所有节点被配置唯一的逻辑地址;
    SOURCE NODE ADDRESS:源节点地址;
    PAYLOAD:载荷,其长度可变,以字节为单位,通常情况下是
MAC帧;
    FCS:帧校验序列;对IP环的包中除了包头和FCS本身外的部
分进行CRC32校验计算;
    IP环的流量控制包的格式如下:包头、SOURCE NODE ADDRESS、
TTL_TO_CONGEST、BAND-ALLOW、FCS;
    SOURCE NODE ADDRESS:发出带宽控制信息的节点地址;
    TTL_TO_CONGEST:距离本节点最近的拥塞节点到本节点之间
的逻辑距离;
    BAND-ALLOW:带宽控制信息;
    IP环包头的PRI域指示了包的发送优先级,当载荷为MAC帧
时,包优先级由MAC帧的VLAN优先级和MAC帧中IP包的TOS优先级
按照一定规则映射而成,共支持8个优先级;不同的优先级有不
同的调度策略,在IP环上优先级高的包被优先传送;
C、拥塞及流量处理:在IP环***中,采用公平算法计算可用带宽,使整个环网构成一个流量互控、分布计算的闭合负反馈环;流量控制包根据IP环上拥塞节点的信息及其所处的相对位置,控制数据传送流量。
2.根据权利要求1所述的IP环分布式带宽处理方法,其特征在于:所述的TTL域在每个中间转发节点将TTL域减去1,单播包会被目的节点剥离,当有一部分上游节点发来的数据包被本节点作目的剥离后,本节点就将更多的L3数据发送到环上;多播包则被源节点剥离,如果在IP环的包上环后,且到达目的节点之前,源节点和目标节点都失效,则当TTL减到0时被强制从环上剥离;
在拥塞及流量处理方法中,流量控制包的SOURCE NODE ADDRESS域指示IP环上拥塞最严重的节点的地址,相应的BAND-ALLOW指示IP环网上拥塞最严重节点的send_rate;流量控制包中的TTL_TO_CONGEST指示距离最近的拥塞节点到本节点之间的逻辑距离,节点检测到自己拥塞,就将向上游发出的流量控制包的TTL_TO_CONGEST域设置成1;不拥塞的节点如果收到一个公告包,就
将接收公告包中TTL_TO_CONGEST域的数值加上1,赋给发出公告包的TTL_TO_CONGEST域,若拥塞节点收到这个公告包,就将发出公告包的TTL_TO_CONGEST复位成1。
3.根据权利要求1所述的IP环分布式带宽处理方法,其特征在于:所述的公平算法对环网上每个节点采用权重公平算法,根据各节点重要程度及所需带宽流量在初使化时配置相应的权重系数,在计算中,各节点的send_rate及BAND-ALLOW为经过相应的权重系数归一化计算后的send_rate和BAND-ALLOW。
4.根据权利要求3所述的IP环分布式带宽处理方法,其特征在于:所述的权重系数越大则表明节点的重要程度越高,在环网拥塞时应该比权重系数小的节点享有更多的IP环路带宽,它们所享有的带宽正比于节点权重值。
5.根据权利要求1或2所述的IP环分布式带宽处理方法,其特征在于:所述的IP环所支持的节点数最多为64个。
6.根据权利要求1或2所述的IP环分布式带宽处理方法,其特征在于:所述的TTL域的最大值是IP环网所支持的节点数量的两倍。
7.根据权利要求1所述的IP环分布式带宽处理方法,其特征在于:所述的帧校验序列所进行的校验计算的校验多项式为:
X32+X26+X23+X22+X16+X12+X11+X10+X8+X7+X5+X4+X2+X+1
8.根据权利要求1或2所述的IP环分布式带宽处理方法,其特征在于:所述的IP环中实现高和低两个优先级,有一个可配置的参数作为划分高、低优先级的门限;L3将上环的数据包根据优先级分类放在高优先级Transmit Buffer和低优先级Transmit Buffer中,MAC将需要转发的上游数据包根据优先级放置在高优先级Transit Buffer和低优先级Transit Buffer中;有4种数据包需要从节点的Tx接口发送:高、低优先级Transit Buffer里的数据包和高、低优先级Transmit Buffer里的数据包;在IP环中,包发送调度策略遵循如下原则:
高优先级的包应比低优先级包优先发送;已经上环的业务,在Transit Buffer中的数据包不应丢弃;在IP环节点中4种数据包调度的一般优先次序为:
高优先级Transit包,转发从上游节点上环的高优先级包;
高优先级Transmit包,从本节点上环的高优先级包;
低优先级Transmit包,从本节点上环的低优先级包;
低优先级Transit包,转发从上游节点上环的低优先级包;
高优先级数据包配置预留带宽,高优先级Transit Buffer中的数据包总是被无条件优先发送,但高优先级Transmit Buffer中的数据包被有条件优先发送:如果低优先级Transit Buffer的深度到达危险高门限(HI_THRESHOLD),节点的高优先级Transmit包必须停发,立即发送低优先级Transit包,MAC输出STOP_HIGH信号给L3,指示停止发送高优先级Transmit包;
在低优先级Transit Buffer深度没有达到危险低门限(LO_THRESHOLD)前,低优先级Transmit包先于低优先Transit包发送,但一旦达到危险低门限,就要立刻停止低优先级Transmit包的发送,立即转发低优先级Transit包;低优先级Transmit包在流量超过带宽处理方法限制的流量后,也要停止发送,MAC输出STOP_LOW信号给L3,指示停止发送低优先级Transmit包。
9.根据权利要求8所述的IP环分布式带宽处理方法,其特征在于:所述的高优先级Transit Buffer的深度为2-3个最大包长(MTU),最大包长(MTU)即Max Transport Unit,IPR中的最大包长(MTU)为9216字节;低优先级Transit Buffer要足够大;低优先级Transit Buffer的危险低门限大约为整个Buffer大小的一半,危险高门限设置为整个Buffer大小减去3个最大包长(MTU)尺寸。
CN02125011.1A 2002-06-22 2002-06-22 Ip环分布式带宽处理方法 Expired - Fee Related CN1292567C (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN02125011.1A CN1292567C (zh) 2002-06-22 2002-06-22 Ip环分布式带宽处理方法
AU2003244050A AU2003244050A1 (en) 2002-06-22 2003-05-29 Ip ring distributed bandwidth processing method
PCT/CN2003/000409 WO2004002077A1 (fr) 2002-06-22 2003-05-29 Procede de traitement de largeur de bande repartie en anneau ip

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN02125011.1A CN1292567C (zh) 2002-06-22 2002-06-22 Ip环分布式带宽处理方法

Publications (2)

Publication Number Publication Date
CN1466391A true CN1466391A (zh) 2004-01-07
CN1292567C CN1292567C (zh) 2006-12-27

Family

ID=29743963

Family Applications (1)

Application Number Title Priority Date Filing Date
CN02125011.1A Expired - Fee Related CN1292567C (zh) 2002-06-22 2002-06-22 Ip环分布式带宽处理方法

Country Status (3)

Country Link
CN (1) CN1292567C (zh)
AU (1) AU2003244050A1 (zh)
WO (1) WO2004002077A1 (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1791097B (zh) * 2004-12-15 2010-09-08 北京邮电大学 在基于wdm的obs环网中应用的接收端口指示帧控制方法
CN102170397A (zh) * 2011-05-09 2011-08-31 中兴通讯股份有限公司 一种基于生存时间(ttl)控制的保护倒换优化方法和装置
CN1889511B (zh) * 2005-06-30 2012-02-29 华为技术有限公司 虚交换网络中数据转发实体实现业务流流量控制的方法
CN1703025B (zh) * 2004-05-28 2012-06-20 英特尔公司 双向环路互连上单分组到达的流量控制方法和设备
CN102859952A (zh) * 2010-04-19 2013-01-02 日本电气株式会社 交换机和流表控制方法
CN105553753A (zh) * 2015-12-03 2016-05-04 上海高性能集成电路设计中心 一种固定时间片协同流控的片上环网防饥饿处理方法

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004035861A1 (en) 2002-10-15 2004-04-29 Henkel Kommanditgesellschaft Auf Aktien Pickling or brightening/passivating solution and process for steel and stainless steel
US20080159291A1 (en) * 2006-12-28 2008-07-03 Futurewei Technologies, Inc. Method of Detecting Transport Leaks in Hybrid Switching Networks
US8149837B2 (en) 2007-01-16 2012-04-03 Futurewei Technologies, Inc. Method of supporting an open provider backbone network
CN104753805B (zh) * 2013-12-31 2018-07-24 腾讯科技(深圳)有限公司 分布式流量控制方法、服务器和***
CN107306192B (zh) * 2016-04-18 2020-12-18 ***通信集团广东有限公司 一种业务数据传输方法、装置和***

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3293719B2 (ja) * 1994-09-30 2002-06-17 富士通株式会社 ネットワーク管理システム
US6108338A (en) * 1995-12-28 2000-08-22 Dynarc Inc. Method and device for dynamic synchronous transfer mode in a dual ring topology
JP3976397B2 (ja) * 1998-04-28 2007-09-19 株式会社日立コミュニケーションテクノロジー Blsrネットワークシステム
JP2003526278A (ja) * 2000-03-03 2003-09-02 ルミナス ネットワークス インコーポレイテッド 故障リンクの検出に起因してトラヒックを動的に経路指定し直すための経路指定スイッチ

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1703025B (zh) * 2004-05-28 2012-06-20 英特尔公司 双向环路互连上单分组到达的流量控制方法和设备
CN1791097B (zh) * 2004-12-15 2010-09-08 北京邮电大学 在基于wdm的obs环网中应用的接收端口指示帧控制方法
CN1889511B (zh) * 2005-06-30 2012-02-29 华为技术有限公司 虚交换网络中数据转发实体实现业务流流量控制的方法
CN102859952A (zh) * 2010-04-19 2013-01-02 日本电气株式会社 交换机和流表控制方法
US8971342B2 (en) 2010-04-19 2015-03-03 Nec Corporation Switch and flow table controlling method
CN102859952B (zh) * 2010-04-19 2016-05-11 日本电气株式会社 交换机和流表控制方法
CN102170397A (zh) * 2011-05-09 2011-08-31 中兴通讯股份有限公司 一种基于生存时间(ttl)控制的保护倒换优化方法和装置
CN102170397B (zh) * 2011-05-09 2016-09-28 中兴通讯股份有限公司 一种基于生存时间(ttl)控制的保护倒换优化方法和装置
CN105553753A (zh) * 2015-12-03 2016-05-04 上海高性能集成电路设计中心 一种固定时间片协同流控的片上环网防饥饿处理方法
CN105553753B (zh) * 2015-12-03 2018-09-25 上海高性能集成电路设计中心 一种固定时间片协同流控的片上环网防饥饿处理方法

Also Published As

Publication number Publication date
WO2004002077A1 (fr) 2003-12-31
CN1292567C (zh) 2006-12-27
AU2003244050A1 (en) 2004-01-06

Similar Documents

Publication Publication Date Title
CN100338915C (zh) 报文镜像方法及具有报文镜像功能的网络设备
TWI531184B (zh) 於聚合網路中選擇通訊路徑之通訊裝置及運行方法
CN1820462A (zh) 用于减轻环形网络中的客户端过订的***和方法
CN1292567C (zh) Ip环分布式带宽处理方法
CN1420664A (zh) 网络传递***和传递方法
US20130114595A1 (en) Method for Multicast Flow Routing Selection
JP2006005437A (ja) トラフィック分散制御装置
CN1618025A (zh) 在利用标签交换的环形网中提供故障保护的方法和***
CN1725761A (zh) 网络设备实现链路聚合的方法
CN101040471A (zh) 数据中心的以太网扩展
CN104104609B (zh) 用于提供网络中基于信用的流控制的方法和***
CN1852242A (zh) 保障数据分组业务服务等级的方法及速率限制方法
JP2014511091A (ja) Wanipバックボーンのための凝縮されたコアエネルギー効率の高いアーキテクチャ
CN1697416A (zh) 一种环网及其业务实现方法
JP4899649B2 (ja) リジリエントパケットリングトラフィック管理のための装置及び方法
US11563521B2 (en) Method and apparatus for port channelization at physical layer
CN104956632B (zh) 用于在无线通信***中的改进的网络编码的方法和装置
CN101989952A (zh) 一种组播方法及装置
ES2565656T3 (es) Difusión agrupada independiente del protocolo con soporte de la calidad de servicio
CN108667746B (zh) 一种在深空延时容忍网络中实现业务优先级的方法
CN103188151A (zh) 一种分组传送网络和在分组传送网络中传输业务的方法
CN103402205A (zh) 一种无线树状网接入控制方法及网络节点设备
CN103346962B (zh) 未知单播报文转发方法及路由桥
WO2012068834A1 (zh) 聚合链路的管理方法及***
US9584333B2 (en) Optimization of rules used for prevention of duplication and looping of multicast traffic within a multi-homed cluster of backbone edge bridges in a shortest path bridging multicast network

Legal Events

Date Code Title Description
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
CI01 Publication of corrected invention patent application

Correction item: Inventor

Correct: Zhang Xiquan

False: Zhang Jiaquan

Number: 1

Volume: 21

CI02 Correction of invention patent application

Correction item: Inventor

Correct: Zhang Xiquan

False: Zhang Jiaquan

Number: 1

Page: The title page

Volume: 21

COR Change of bibliographic data

Free format text: CORRECT: INVENTOR; FROM: ZHANG JIAQUAN TO: ZHANG XIQUAN

ERR Gazette correction

Free format text: CORRECT: INVENTOR; FROM: ZHANG JIAQUAN TO: ZHANG XIQUAN

C14 Grant of patent or utility model
GR01 Patent grant
ASS Succession or assignment of patent right

Owner name: SHENZHEN HUAWEI TECHNOLOGY SOFTWARE CO., LTD.

Free format text: FORMER OWNER: HUAWEI TECHNOLOGY CO LTD

Effective date: 20120222

C41 Transfer of patent application or patent right or utility model
COR Change of bibliographic data

Free format text: CORRECT: ADDRESS; FROM: 518057 SHENZHEN, GUANGDONG PROVINCE TO: 518129 SHENZHEN, GUANGDONG PROVINCE

TR01 Transfer of patent right

Effective date of registration: 20120222

Address after: 518129 Longgang District, Guangdong, Bantian HUAWEI base B District, building 2, building No.

Patentee after: Shenzhen Huawei Technologies Co., Ltd.

Address before: 518057 Guangdong city of Shenzhen province Nanshan District Science Park Branch Road No. 1 HUAWEI Service Center Building

Patentee before: Huawei Technologies Co., Ltd.

CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20061227

Termination date: 20150622

EXPY Termination of patent right or utility model