CN1442987A - 用于大规模并行路由器的冗余机制协议 - Google Patents

用于大规模并行路由器的冗余机制协议 Download PDF

Info

Publication number
CN1442987A
CN1442987A CN02156400A CN02156400A CN1442987A CN 1442987 A CN1442987 A CN 1442987A CN 02156400 A CN02156400 A CN 02156400A CN 02156400 A CN02156400 A CN 02156400A CN 1442987 A CN1442987 A CN 1442987A
Authority
CN
China
Prior art keywords
routing
node
hello
appointment
routing node
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN02156400A
Other languages
English (en)
Other versions
CN1216480C (zh
Inventor
崔明寿
杰克·C·怀本加
普拉迪普·萨穆德拉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Samsung Electronics Co Ltd
Original Assignee
Samsung Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from US10/193,355 external-priority patent/US7277383B2/en
Application filed by Samsung Electronics Co Ltd filed Critical Samsung Electronics Co Ltd
Publication of CN1442987A publication Critical patent/CN1442987A/zh
Application granted granted Critical
Publication of CN1216480C publication Critical patent/CN1216480C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L12/00Data switching networks
    • H04L12/28Data switching networks characterised by path configuration, e.g. LAN [Local Area Networks] or WAN [Wide Area Networks]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L45/00Routing or path finding of packets in data switching networks
    • H04L45/42Centralised routing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L45/00Routing or path finding of packets in data switching networks
    • H04L45/02Topology update or discovery
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L45/00Routing or path finding of packets in data switching networks
    • H04L45/28Routing or path finding of packets in data switching networks using route fault recovery
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L45/00Routing or path finding of packets in data switching networks
    • H04L45/58Association of routers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L45/00Routing or path finding of packets in data switching networks
    • H04L45/60Router architectures
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L69/00Network arrangements, protocols or services independent of the application payload and not provided for in the other groups of this subclass
    • H04L69/40Network arrangements, protocols or services independent of the application payload and not provided for in the other groups of this subclass for recovering from a failure of a protocol instance or entity, e.g. service redundancy protocols, protocol state redundancy or protocol service redirection

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Computer Security & Cryptography (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

一种并行路由器,包括:1)多个路由节点,多个路由节点的每个能从和向外部装置接收和发送信息数据分组,其中各路由节点的每个使路由表保持适于将消息数据分组从多个路由节点中的发送节点路由到多个路由节点中的接收节点;2)光纤交换机,能在发送节点与接收节点之间传输信息数据分组,其中多个路由节点中的一个指定节点能向多个路由节点的至少一个非指定节点发送Hello请求消息,使非指定节点发回Hello确认消息,其中指定路由节点监视Hello请求消息的发送与Hello确认消息的接收之间的时间持续期,确定是否非指定路由节点出故障。

Description

用于大规模并行路由器的冗余机制协议
本发明要求在2001年10月5日申请的、申请号为No.60/327494的和在2001年10月5日申请的、申请号为No.60/327230的美国临时专利申请的优先权。
相关申请的交叉参考
本发明相关于在下列美国专利申请中的公开:
1)2001年10月5日申请的申请号为No.60/327494的名称为“松耦合大规模并行路由器的路由协调协议”的临时专利申请;
2)2001年10月5日申请的申请号为No.60/327230的名称为“多-千兆位交换路由器的冗余机制协议”的临时专利申请;
3)与本申请同时申请的申请号为[SAMS01-00193]的名称为“大规模并行路由器结构的路由协作协议”的专利申请。
上述申请均转让给本发明的受让人。因此在这里援引这些相关专利申请以用于参考目的。
技术领域
本发明一般涉及大规模并行路由器,更具体地涉及用于大规模并行路由器的冗余机制协议。
背景技术
互联网业务量的迅猛增长已引起互联网用户数量的增加,来自这些用户的各种服务需求,新的服务的实现,诸如通过IP的语音业务(VoIP)、或流式应用程序、移动互联网的发展。起连接到各个子网络或其它路由器的中继节点作用的常规路由器在处理数据分组、确定其目的地和转移数据分组到目的地的要求的时间通常小于在网络路径上的传输时间情况下已经很好地实现了其作用。但是,近来高宽带网路径的数据分组传输容量和与互联网业务的增加组合起来超过了常规路由器的处理容量。因此,路由器成为了互联网中无法提速的主要瓶颈。
早期路由器是在计算机主机上实现的,以便主机的CPU执行诸如经共享总线和路由表计算的数据分组的转发之类的所有管理任务。但是,由于CPU的集中的开销和在总线上存在拥塞,所以这种明文(Plain)的结构是低效率的。结果,开发分布式路由器结构的路由器开发商提供了比集中结构的更有效的数据分组处理。在分布式路由器结构中,许多以前由集中CPU执行的功能是分配给各个线路卡并且共享总线是由高速纵横交换器替代的。
图1表示按照现有技术的示例性实施例的分布式路由器100。分布式路由器100与图1中不同类型的网络接口,包括光纤网(OC-192)、异步传输模式(ATM)网、和作为网络接口的千兆位以太网、以及其它网(未示出)。分布式路由器100包括线路卡模块(LCM)111-113、光纤交换机130、路由处理器140和线路卡模块(LCM)151-153、分别含有转移表(FT)121、转移表(FT)122和转移表(FT)123的LCM111、LCM112和LCM113。同样,LCM151、LCM152和LCM153分别含有转移表(FT)161、转移表(FT)162、和转移表(FT)163。
来自相邻路由器或子网络的数据分组由线路卡模块111-113和线路卡模块151-153接收,并被发送到光纤交换机130。光纤交换机130交换来自于或到线路卡模块111-113和151-153的数据分组,并在中继数据分组中充当最重要的角色。
路由处理器140装有路由表141并且通过及时更新变化的路由来保持路由表141的当前状态。路由处理器140利用运行路由协议保持路由表141,这些路由协议诸如是:路由信息协议(RIP)、开放式最短路径优先(OSPF)、或边缘网关协议(BGP)。转移表121-123和161-163支持在每个线路卡中的有效查找并且是从路由处理器140的路由表141下载的。如果线路卡模块的输入数据分组不能从转移表中找到其目的地的路径,则对应的数据分组可以通过光纤交换机130转移到预定的缺省路由,或者可以在线路卡上被抛弃。
路由器的制造商喜欢分布式结构的主要原因是:以一致性的方式利用集中处理器管理一个路由表非常简单。另外一方面,虽然路由和转移功能的分离能够进行高速数据分组处理,但是Qos-能力路由服务和由网络的不稳定性引起路由延迟要求甚至更快的数据分组处理能力,从而导致路由处理器的额外开销或者路由器本身的不稳定性。
如果建立交互操作规则的有效设置,那么大量的小路由器可以一起进行操作(即,并行)。工业界已经通过利用单路由服务器处理路由问题来避免这种协作上的问题。因此,它既限制了路由器规模并且又限制了对可用微处理器处理能力的规模的最大性能。
因此,在现有技术上存在着改善大规模并行路由器的需求。具体地,存在着对具有分布结构的大规模并行路由器的需求,该结构实现有效的数据分组路由协议,但不限制该路由器及其可用微处理器处理能力的规模的最大性能。
发明概述
按照本发明原理的松耦合统一标准环境(LUE)路由协作协议,设计了在可能产生大量通信业务的虚拟区域的路由节点(RN)上减少业务量。本发明提出如下几种专门的改进。开放式最短路径优先(OSPF)域内路由协议允许把要被分组的各个邻近网络和各个主机收集在一起。这种组连同与所包含网络中的任意一个具有接口的分布式路由结构被称为一个区。区的拓扑从区的外部是看不到的。给定区的内部路由节点内部对该区的外部详细拓扑一无所知。与将为整个独立***作为单个链路状态域相比较,这种知识的隔离技术使得提出的LUE协议的路由通信业务产生明显减少。属于相同区的路由节点具有相同区链接状态数据库。
路由节点协议支持必须包括将相邻的IP类A、B或C网络数的汇集集合为较大数量的顶级网(supernet)。为了减少***中的概括-链路状态公告(LSA)数据分组的数量,每个RN集合其路由项并发送它们到指定的路由节点(DRN)。对于交换LSA数据分组而言扩散式方案是一种不经济的方案。每个RN可以通过光纤交换机访问其它RN。在这种方案中,当存在N个路由节点时,扩散式方案的消息复杂性等于O(N2)。并行路由器结构实现一种星形拓扑,利用分配2个交换处理器(SWP)给一个DRN和一个备份DRN减少消息业务为O(N),因此与集中路由和如图1所示的分布式转移路由器结构的复杂性相竞争。
为了减少在各个路由节点中确定指定的(或备份的)IOP或SWP所要求的控制消息,在***初始化时,不竞争地选择DRN和备份DRN,其中具有最小IP地址的SWP选为DRN,因此导致消息复杂性O(1)代替O(N2)。
为了克服现有技术的上述缺陷,本发明的主要目的是提供一种改善的分布式路由器。按照本发明的有益的实施例,该并行路由器包括:1)多个路由节点,多个路由节点的每个能从外部装置接收消息数据分组并发送消息数据分组到外部装置,其中多个路由节点的每个保持适合从多个路由节点的发送节点到多个路由节点的接收节点的路由消息数据分组的路由表;2)光纤交换机,能够在各个发送节点与各个接收节点之间发送消息数据分组,其中多个路由节点的一个指定节点可操作地向多个路由节点的至少一个非指定节点发送一个‘Hello’请求消息,可操作地使非指定节点发回一个‘Hello’确认消息,其中指定路由节点监视‘Hello’请求消息的发送与‘Hello’确认消息的接收之间的时间周期,确定是否非指定节点出故障。
按照本发明的一个实施例,如果该时间周期未超过预定最大阈值,则指定路由节点发送收集的LSA消息数据分组到至少一个非指定路由节点。
按照本发明的另一个实施例,指定路由节点可操作地向多个路由节点的每个非指定节点广播‘Hello’请求消息,可操作地使每个非指定路由节点发回一个‘Hello’确认消息,其中指定路由节点监视每个非指定路由节点的‘Hello’请求消息的发送与‘Hello’确认消息的接收之间的时间周期,确定是否非指定节点出故障。
按照本发明的另一个实施例,如果该时间周期未超过预定最大阈值,指定路由节点向每个非指定路由节点发送收集的LSA消息数据分组
上面已经相当宽地概述出本发明的特点和技术优点,这样本专业的技术人员可以更好地理解本发明的如下细节。本发明的附加特点和优点将从本发明的权利要求书的主题予以描述。本专业的技术人员应当清楚,为了实现本发明的相同的目,他们可以很容易地按照修改或设计其它结构使用所公开的概念和具体实施例。本专业的技术人员还应当认识到,这样一些等效的结构并未超出以本发明的最宽形式的精神与范围。
在理解下面的本发明的详细描述前,可以有益地描述一下在这个发明文件中始终使用的某些词和短语的定义;术语“包括”和“组成”及其派生词,意思是不加限制地包括;术语“或者”包含和/或的意思;短语“与相联系”和“与相关”及其派生词,可以指意思是,包含在其中、与互联、含有、含在其中、连接到或与连接、耦合到或与耦合、可与通信、与协作、交叉、并列、接近到、限制到或与限制、具有、具有一种特性等等;术语“控制器”意味着控制至少一个操作的任何装置、***或其一部分,这种装置可以用硬件、固件或软件,或者其中至少两种的组合进行实施。应当注意到,与任何特定的控制器相关的功能可以是集中的或分布的,无论是本地的还是远端的。在这个发明文件中始终提供的某些词和短语的定义,本专业的技术人员应当理解为,如果不是大多数的场合,使用这种限定的词和短语,许多这种定义可以在以前及将来应用。
附图说明
为了完整地理解本发明及其优点,现结合附图参照下面的描述,其中相同标号表示相同的对象,其中:
图1表示按照现有技术的示例性实施例的分布式路由器结构;
图2表示按照本发明的原理使用改进的协作协议的大规模并行路由器结构;
图3表示按照本发明的原理在路由节点的输入-输出处理器(IOP)中和交换处理器(SWP)中的软件模块的交互操作;
图4是按照本发明示例性实施例的松耦合统一标准环境(LUE)的数据分组的说明;
图5是按照本发明示例性实施例的数据库描述(DD)数据分组的说明;
图6是按照本发明示例性实施例在指定路由节点(DRN)与非指定路由节点(非-DRN)之间形成交换的LSA数据分组的DD数据分组的消息流图;
图7是按照本发明示例性实施例利用从指定路由节点(DRN)向非指定路由节点(非-DRN)发送概括-LSA形成LSA数据分组的DD数据分组的消息流图;
图8是表示按照本发明示例性实施例的‘Hello’数据分组主体;
图9是按照本发明示例性实施例在指定路由节点(DRN)与非指定路由节点(非-DRN)之间的‘Hello’消息数据分组的消息流图。
具体实施方式
在这个发明文件中下面讨论的图2到图9和用于描述本发明原理的各种实施例仅仅是说明方式的并且不以任何方式限制本发明。本专业的技术人员将理解为,本发明的原理可以在任何合适排列的并行路由器中实现。
图2表示使用按照本发明的原理的经改进的路由协作协议的并行路由器结构200。并行路由器结构200利用多达N个独立路由节点(RN)提供规模可缩放性和高性能,包括通过交换机249连接的示例性路由节点210、220、230和240,该交换机由一对高速光纤交换机250A和250B组成。每个路由节点包括输入-输出处理器(IOP),一个或多个物理媒介装置(PMD)。示例性RN210包括PMD212(标号PMD-A)、PMD214(标号PMD-B)和IOP216。RN220包括PMD222(标号PMD-A)、PMD224(标号PMD-B)和IOP226。RN230包括PMD232(标号PMD-A)、PMD234(标号PMD-B)和IOP236。最后,示例性RN240包括PMD242(标号PMD-A)、PMD244(标号PMD-B)和IOP246。
IOP216、IOP226、IOP236和IOP246的每个缓冲来自诸如路由器290和网络295之类的各个子网或邻近路由器的输入互联网协议(IP)数据分组。IOP216、IOP226、IOP236和IOP246的每个还分类所请求的服务,从数据分组首端查找目的地地址,和转移数据分组到出境IOP。另外,每个IOP还保持由路由协议数据分组确定的内部路由表并从路由表计算最短数据路径。每个IOP处理来自它的各PMD模块之一的输入数据分组。按照本发明的一个实施例,每个PMD卡成帧来自IP网(或ATM交换机)的一个输入数据分组(或单元),将在IOP中进行处理并执行总线变换功能。
每一个由IOP和PMD构成和由光纤交换机250A和250B链接的路由节点210、220、230和240基本上等效于一个路由器本身。本发明提出一种由多个通过高速光纤交换机250A和250B连接的RN组成的通用的和规模可缩放路由器结构。因此,并行路由器结构200可以认为是一组高速链路连接到每个块的RN标准部件。诸如分别位于光纤交换机250A和250B中的示例***换处理器(SWP)255A和255B的交换处理器支持***管理以及各IOP之间的数据分组的交换。并行路由器结构200可以利用市场分别选购的部件来构成,因此通过加入每个标准部件到光纤交换机上导致成本方面有竞争力、灵活性和可缩放性。
与传统路由器不同,并行路由器结构200要求具有监视每个路由节点210、220、230和240的激活性(或活性)的有效机制。本发明引入一种新颖的路由协作协议,叫做松耦合统一标准环境(LUE)协议,它可以用于通过保持对每个路由节点的协调链接状态的数据库,连接所有的独立路由节点起到单个路由器作用。松耦合统一标准环境(LUE)协议是根据OSPF(开放式最短路径优先)路由协议的设计概念并且是通过在RN210、220、230和240每个中以及在SWP255A和SWP255B中的守护程序按并行执行,在RN210、220、230和240中选择一个指定的RN,并且同步整个路由表。众所周知,守护程序是一种代理程序,在处理节点上连续操作并提供资源给客户***。守护程序是用于处理低级操作***任务的背景处理。为了有效地实施,在***初始化期间,一个指定RN分配给主SWP和一个备份指定RN分配给备份SWP。
图3表示按照本发明原理在路由节点的输入-输出处理器(IOP)中和在交换处理器(SWP)中的软件模块的交互操作。假设RN210(或IOP216)、RN220(或IOP226)、RN230(或IOP236)和RN240(或IOP246),以及SWP255A和SWP255B被初始化,并且保持激活,LUE路由器守护程序320、指定LUE路由器守护程序330和备份指定LUE路由器守护程序340在诸如RN216、指定(或首选)SWP255A和备份SWP255B之类的各自路由节点上运行。由LUE路由器守护程序的操作引起改变路由条目,诸如指定的LUE路由器守护程序320,通过诸如核心路由表守护程序310之类的核心路由表守护程序反映到核心路由表。
在IOP216、IOP226、IOP236、IOP246以及诸如路由信息协议(RIP)守护程序350、开放式最短路径优先(OSPF)守护程序360、边缘网关协议(BGP)守护程序370之类的路由守护程序的每个中经核心路由表守护程序310交换路由信息。在IOP216中的LUE路由器守护程序320具有经例如网络通信接口到核心路由表守护程序310的连接。位于指定SWP255A和备份SWP255B中的每个***处理器必须具有从在每个IOP的LUE守护程序收集的协调路由信息。为了保证这种为真,LUE路由器守护程序320、330和340的每个具有由指定LUE路由器守护程序保持的相容链路状态数据库(LSDB)。
与其它路由软件模块不同,因为在各个IOP的各个路由表中它仅仅执行路由协作并保持同步,每个LUE路由器守护程序不保持在它自己的路由表中。这使得所有IOP具有全局相容路由表,从用户的角度来看好象所有IOP是作为一个路由器进行工作的。
各个RN和各个SWP被连接到一个广播网上。在***初始化期间,两个SWP被分别分配给一个指定路由节点(DRN)和一个备份路由节点(非-DRN)。在其他情况下,象在OSPF路由协议中使用的选择算法要求在点对点网络中的消息复杂性为O(N2),在广播或NBMA(非广播多址)网络中的消息复杂性为O(N)其中N是路由节点数。在本发明中,消息复杂性降低到刚好O(1)。
图4是表示按照本发明的示例性实施例的松耦合统一标准环境(LUE)数据分组。由于在OSPF协议情况下,LUE数据分组直接通过IP网层(由IP首端410表示)运行,并且不要求UDP或TCP协议的服务。当路由节点接收具有IP协议号=99的IP数据分组时,其中它可以专供另外的适当协议使用,该路由节点确定数据分组包含一个LUE有效负荷。除去它的IP首端410,该路由节点识别包括LUE首端420和LUE有效负荷430的LUE数据分组。
LUE首端420含有对确定是否该数据分组应当进行接收用于按照在首端格式的规定进一步处理需要的所有信息。LUE首端420包括:版本#字段421、类型字段422、数据分组长度字段423、路由器识别符(ID)字段424和区识别符(ID)字段425。版本#字段421包含LUE协议版本号。如果类型字段422设置为1值,则LUE数据分组是“Hello”数据分组。如果type字段422设置为2值,则LUE数据分组是数据库描述(DD)数据分组。数据分组长度字段423含有按字节的LUE协议数据分组的长度。这个长度包括LUE首端420。路由器(例如,IOP或SWP)ID字段含有为LUE数据分组的源的IOP或SWP的ID。区ID字段425是识别LUE数据分组所属的虚拟区的32比特数。虚拟基干区具有“0、0、0、0”的区ID字段425。
当由于从对应的IOP的外部连接输入数据分组而由核心路由表守护程序310管理的路由表变化时,数据库描述(DD)数据分组从IOP发送到指定的SWP。另外,指定SWP周期性地(或事件驱动方式)广播链路状态广告(LSA)消息到激活IOP。DD数据分组还描述链接状态数据库的内容。多DD数据分组可以用于描述整个数据库,如果可能,仅一个集合DD数据分组从IOP发送到指定SWP,反之亦然。
当发送的各数据分组大于网络最大传输速率(MTU)时,LUE路由器协议取决于IP分片。LUE数据分组的长度可以长达65535字节,包括IP首端410。LUE协议使用IP协议数99。为了同步位于每个IOP的路由表,本发明使用数据库描述数据分组,其中类型字段422设置为2值。
每个链接状态广告消息描述一段LUE路由器域。所有LSA消息根据点对点的方式从各IOP中正常LUE守护程序发送到指定SWP LUE路由器守护程序。在指定LUE路由器守护程序中LSA的集合被称为链接状态数据库。指定LUE路由器守护程序周期性地广播它的集合的LSA数据分组到位于每个IOP的正常LUE路由器守护程序。
LUE有效负荷430可以进一步分为两部分:LSA首端440和LSA主体450。LUE协议可以忽略校检和并且验证各个字段以求效率。LSA首端440是标准的20字节首端。LSA首端440包括:链接状态(LS)期限字段441、链接状态类型字段442、链接状态识别(ID)字段443、广告路由器字段444、LS序列号字段445和长度字段446。首端含有唯一识别LSA的足够信息。LS期限和LS序列号字段用于确定哪个情况更靠前。
LS期限字段441含有自LSA始发后按秒计的时间。LS类型字段442含有识别LSA消息类型的值(例如,1=路由器-LSA、2=网络-LSA、3=概括-LSA)。链接状态ID字段443识别由LSA消息描述的互联网环境的部分。在这种情况下,链接状态ID是IP网络号。广告路由器字段444含有始发LSA消息的IOP或SWP的ID。LS序列号字段445用于检测老的或复制的LSA。LSA的连续情况给出连续的LS序列号。长度字段446含有LSA消息的字节长度。
LUE主体450包括网络掩码字段451和度量字段452。网络掩码字段451表示指定网络的IP地址掩码。例如,当广告A类网络的位置时,可以使用值0xff000000。度量字段452表示这个路由的“成本”。该值被表示为与在OSPF协议中的路由器-LSA的接口成本相同的单位。
图5是按照本发明示例性实施例的数据库描述(DD)数据分组的说明。DD数据分组包括:接口MTU字段501、数据库描述序列号字段502、#LSA字段503和LSA字段504。接口MTU字段501含有可以不分片发送到相关接口的最大IP数据报的字节数。DD序列号字段502用于对数据库描述数据分组的集合排序。初始值应当是唯一的。然后,DD序列号字段502递增,直至完全数据库描述已经被发送。#LSA字段503含有包含在路由反映的各个LSA的数。最后,链接状态广告(LSA)字段504包含剩余的DD数据分组和包含链接状态数据库段的集合(可能部分)表,其中在相应的IOP上描述其自己的链接状态数据库的每个LSA由概括-LSA数据分组表示。
LUE路由器守护程序仅使用类型-3的概括-LSA。在每个IOP从核心路由表守护程序集合的各路由包含在类型-3概括-LSA格式中。另外,从图7的指定LUE路由器守护程序广播的aggr_lsa数据分组具有与DD数据分组相同LSA格式。当描述缺省概括路由时,概括-LSA的链接状态ID始终设置为缺省指定值(0.0.0.0)并且网络掩码设置为0.0.0.0。
图6是按照本发明示例性实施例在指定路由节点(DRN)与非指定路由节点(非-DRN)之间形成交换的LSA数据分组的DD数据分组的消息流图。为了在虚拟区各RN中提供可靠LSDB(链接状态数据库)交换,假设以非-DRN605A(标号为非-DRN1)和非-DRN605B(标号为非-DRN2)连接到DRN610的网络链接是可靠的。如果非-DRN605A从核心路由表守护程序310接收到集合的路由条目,则非-DRN605A通过发送具有DD序列号=X的数据库描述(DD)数据分组到在DRN610中的指定LUE路由器守护程序(消息621)予以响应。如果非-DRN605B从核心路由表守护程序310接收到集合的路由条目,则非-DRN605B通过发送具有DD序列号=Y的数据库描述(DD)数据分组到在DRN610中的指定LUE路由器守护程序(消息622)予以响应。
接收到含有概括-LSA消息的DD数据分组后,DRN610将其保持在自己的LSDB中。如果非-DRN605B从核心路由表守护程序310接收到附加的集合路由条目,则非-DRN605B通过发送序列号=Y+1的具有概括-LSA的DD数据分组到在DRN610(消息623)予以响应。如果非-DRN605A从核心路由表守护程序310接收到附加的集合路由条目,则非-DRN605A通过发送序列号=X+1的具有概括-LSA的DD数据分组到在DRN610(消息624)予以响应。
为了降低DRN与非-DRN之间的LSA数,从对应RN中由核心路由表守护程序管理的路由表集合DD数据分组中LSA首端和LSA有效负荷。当具有集合的LSA的DD数据分组到达一个DRN时,在该DRN的LSDB中更新LSA消息。在DRN中指定的LUE路由器守护程序周期性地按具有概括-LSA有效负荷(称为“aggr_LSA”)的DD数据分组形式广播其集合各路由到非-DRN。
图7是按照本发明示例性实施例在具有概括-LSA的DD数据分组中的集合LSA数据分组从指定路由节点(DRN)向非指定路由节点(非-DRN)广播的消息流图。在消息705、710、715、720、725和730中集合的LSA数据分组(aggr_LSA)通过称为RxmtInterval的限定时间周期进行广播。当从DRN 610接收到aggr-LSA数据分组时,在每个非-DRN605A、605B中的LUE路由器守护程序320将其旁路到核心路由表守护程序310,在该守护程序中更新路由表并反映各个IOP中的所有路由变化。
在OSPF协议的正常环境下,按至少每个周期间隔(例如,每30分钟一次)更新链接状态数据库中的每个LSA。在该间隔以后已被更新的LSA中,该LSA被假设为不再有效并从数据库中去掉。LS期限字段441表示从LSA最后被更新后逝过的时间长度。保持位于指定RN的链接状态数据库中的所有LSA,直至它们期满。当由于它的期满DRN中的一个LS被清除时,LSA消息被广播到所有非-DRN,保证7所有RN在近似同时去掉LSA,而不取决于同步时钟。然后,所有其它非-DRN去掉由DRN从其数据库拷贝广播的与“MaxAge”相匹配的LSA的各个LSA,以减少占用存储器和计算工作负荷。
网络多点广播能力允许一个应用程序发送一个单一数据报,该数据报将被传送到多个接收器。应用程序呈现一对多和多对多的通信模式,诸如多人电话会议、电视会议、远程教学、分布式交互仿真、和相同数据组到大量接收器的批转移,发现多点广播是非常有用的。主机利用互联网分组从属协议(IGMP)可以动态地接入和离开多点广播组,保持通知主机的当前从属状态的具有多点广播能力的路由器。在本发明中,接收分组-从属关系LSA消息的每个RN将其发送给DRN,然后DRN广播对应的LSA消息到其余各个RN,共享协调链接状态数据库。
本发明实施为一种规模可缩放高性能路由器,该路由器可以通过改变连接到高速交换机上的自主路由器的数量容易地定制为任何路由能力。本发明还引入了一种新颖冗余机制协议,可以用于连接作为概念上的单一路由器的所有独立的路由器,并且根据BGP和OSPF路由协议的基本概念通过交换各IOP与各SWP之间的状态数据分组监视故障的IOP。
通过发送某些健康状态数据分组,路由部件的冗余按1∶1或1∶N方便地提供,确定是否一个部件有故障并且然后利用事先存储的状态消息交换冗余部件。本发明提出了一种方法,在该方法中,标准路由协议的高性能变量方法(LUE)以足够高的速率发送出现有数据分组,指示资源的丢失。如果可替代路径存在,即使在较高成本的测量下,作为正常内部路由协议的一部分,通信业务被路由到该可替代路径。
为了在路由节点(RN)与交换处理器(SWP)之间建立邻接,交换“Hello”数据分组。Hello数据分组包括:IP首端410、LUE首端420和作为LUE有效负荷430的Hello数据分组主体。除正常数据分组格式外,***管理和监视、时钟同步和平衡负载的基本信息可以加装在Hello数据分组的尾部。
图8是按照本发明示例性实施例的Hello数据分组主体的说明。Hello数据分组包括类型字段422设置为1值的LUE首端。Hello数据分组主体包括网络掩码字段801(与网络掩码字段451相同)、Hello间隔字段802、路由节点优先级字段803、路由器无效间隔字段804、指定SWP字段805、备份指定SWP字段806、邻居字段807和位置保持字段808。
网络掩码字段801是与接口相关的网络掩码。Hello间隔字段802是从指定SWP(例如,15毫秒)的连续Hello数据分组之间的毫秒数。IOP中的Hello间隔字段802设置为0。RN优先级字段803含有路由节点的优先级并使用在(备份)指定路由器选择中。当***初始化时,每个路由节点和SWP255被静态地预分配。在IOP216中的LUE路由器守护程序320具有优先级0。在指定SWP255A中的LUE路由器守护程序330具有优先级2和在备份指定SWP255B中的LUE路由器守护程序340具有优先级1。
路由器无效间隔字段804含有在宣告静止路由节点(或IOP)无功能之前的毫秒数。按照本发明的示例性实施例,路由器无效间隔字段804设置为两倍于Hello间隔字段802的值(例如,30毫秒)。鉴于正在发送IOP,指定SWP字段805含有网络的指定SWP的识别符。指定SWP由其网络上的IP接口地址进行识别。鉴于正在发送IOP,备份指定SWP字段806含有网络的指定SWP的识别符。备份指定SWP由其网络上的IP接口地址进行识别。
邻居字段807含有从其在网络上最近看到的各有效数据分组的每个IOP(或SWP)的IOP ID(或SWP Id)。最近意味着在路由器无效间隔字段804时间间隔内(以秒计)。IOP216的原始LUE路由器守护程序320仅有两个邻居(即,指定LUE路由器守护程序330和备份指定LUE路由器守护程序340)。位置保持字段808保留用于后者使用。
图9是按照本发明示例性实施例的指定路由节点(DRN)与非指定路由节点(非-DRN)的‘Hello’消息数据分组的消息流图。每个RN(或SWP)保持称为Hello定时器的定时器。Hello定时器在存储在Hello间隔字段802中的每个时间间隔(以秒计)后触发。Hello间隔被定义为在由RN发送的连续Hello消息数据分组之间的以秒计的时间长度,诸如消息902与904之间的时间间隔。Hello间隔在LUE路由器协议中是从15到30毫秒可调的。
虽然OSPF协议仅具有一种Hello数据分组类型,但是本发明的LUE协议要求两种不同的Hello消息数据分组:1)Hello_Req和2)Hello_Ack,这些数据分组在DRN610和非-DRN605A和605B之间交换。如果DRN610在发送Hello_Req消息到非-DRN605后,在路由器无效间隔字段804定义的最后时间间隔内未收到Hello_Ack消息,则DRN610认为对应的非-DRN605为无效。
为了减少在各RN中的控制消息的数量,Hello消息数据分组被用于加装***监视和管理信息,用于加载共享或任何其它应用目的。
虽然已经对本发明进行了详细地描述,但是本专业的技术人员应当理解,在不超出其最宽形式的情况下可以作出各自变化、替换和改变。

Claims (8)

1.一种并行路由器,包括:
多个路由节点,所述多个路由节点的每个能从外部装置接收消息数据分组并能向其发送消息数据分组,其中所述多个路由节点的每个使路由表保持适于将消息数据分组从所述多个路由节点的发送节点路由到所述多个路由节点的接收节点;
光纤交换机,能在所述发送节点与所述接收节点之间传输所述消息数据分组;
其中所述多个路由节点中的一个指定节点可操作地向所述多个路由节点中的至少一个非指定节点发送Hello请求消息,可操作地使所述非指定路由节点发回Hello确认消息,其中所述指定路由节点监视所述Hello请求消息的发送与所述Hello确认消息的接收之间的时间持续期,确定是否所述非指定路由节点已出故障。
2.按权利要求1所述的并行路由器,其特征在于如果所述时间持续期未超过预定最大阈值,所述指定路由节点发送所述集合的LSA信息数据分组到所述至少一个非指定路由节点。
3.按权利要求1所述的并行路由器,其特征在于所述指定路由节点可操作地向所述多个路由节点的每个指定节点广播Hello请求消息,可操作地使所述每个非指定路由节点发回Hello确认消息,其中所述指定路由节点对所述每个非指定路由节点监视所述Hello请求消息发送与所述Hello确认消息接收之间的时间持续期,确定是否所述每个非指定路由节点出故障。
4.按权利要求3所述的并行路由器,其特征在于如果所述时间持续期未超过预定最大阈值,所述指定路由节点向所述每个非指定路由节点发送集合的LSA消息数据分组。
5.一种电信网络,所述电信网络包括多个并行路由器,所述并行路由器在连接到所述电信网络上的各电信装置之间路由信息数据分组,每个所述并行路由器包括:
多个路由节点,所述多个路由节点的每个能从外部装置接收消息数据分组并能向其发送消息数据分组,其中所述多个路由节点的每个使路由表保持适于将消息数据分组从所述多个路由节点的发送节点路由到所述多个路由节点的接收节点;
光纤交换机,能在所述发送节点与所述接收节点之间传输所述消息数据分组;
其中所述多个路由节点中的一个指定节点可操作地向所述多个路由节点中的至少一个非指定节点发送Hello请求消息,可操作地使所述非指定路由节点发回Hello确认消息,其中所述指定路由节点监视所述Hello请求消息的发送与所述Hello确认消息的接收之间的时间持续期,确定是否所述非指定路由节点已出故障。
6.按权利要求5所述的并行路由器,其特征在于如果所述时间持续期未超过预定最大阈值,所述指定路由节点向向至少一个非指定路由节点发送集合LSA消息数据分组。
7.按权利要求5所述的并行路由器,其特征在于所述指定路由节点可操作地向所述多个路由节点的每个指定节点广播Hello请求消息,可操作地使所述每个非指定路由节点发回Hello确认消息,其中所述指定路由节点对所述每个非指定路由节点监视所述Hello请求消息发送与所述Hello确认消息接收之间的时间持续期,确定是否所述每个非指定路由节点出故障。
8.按权利要求7所述的并行路由器,其特征在于如果所述时间持续期未超过预定最大阈值,所述指定路由节点向所述每个非指定路由节点发送集合LSA消息数据分组。
CN021564000A 2001-10-05 2002-10-08 用于大规模并行路由器的冗余机制协议 Expired - Fee Related CN1216480C (zh)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US32723001P 2001-10-05 2001-10-05
US60/327,230 2001-10-05
US10/193,355 US7277383B2 (en) 2001-10-05 2002-07-11 Redundancy mechanization protocol for a massively parallel router
US10/193,355 2002-07-11

Publications (2)

Publication Number Publication Date
CN1442987A true CN1442987A (zh) 2003-09-17
CN1216480C CN1216480C (zh) 2005-08-24

Family

ID=26888914

Family Applications (1)

Application Number Title Priority Date Filing Date
CN021564000A Expired - Fee Related CN1216480C (zh) 2001-10-05 2002-10-08 用于大规模并行路由器的冗余机制协议

Country Status (3)

Country Link
EP (1) EP1303084A3 (zh)
KR (1) KR100450951B1 (zh)
CN (1) CN1216480C (zh)

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1649341B (zh) * 2003-12-22 2012-03-21 惠普公司 应用路由选择协议的堆叠式路由器
CN101710896B (zh) * 2009-11-30 2012-10-03 中国人民解放军信息工程大学 一种链路质量探测方法和装置
CN107925617A (zh) * 2015-08-11 2018-04-17 Nicira股份有限公司 逻辑路由器的路由配置
US10797998B2 (en) 2018-12-05 2020-10-06 Vmware, Inc. Route server for distributed routers using hierarchical routing protocol
US10795716B2 (en) 2015-10-31 2020-10-06 Nicira, Inc. Static route types for logical routers
US10911360B2 (en) 2016-09-30 2021-02-02 Nicira, Inc. Anycast edge service gateways
US10931560B2 (en) 2018-11-23 2021-02-23 Vmware, Inc. Using route type to determine routing protocol behavior
US10938788B2 (en) 2018-12-12 2021-03-02 Vmware, Inc. Static routes for policy-based VPN
US11252024B2 (en) 2014-03-21 2022-02-15 Nicira, Inc. Multiple levels of logical routers
US11283731B2 (en) 2015-01-30 2022-03-22 Nicira, Inc. Logical router with multiple routing components
US11418445B2 (en) 2016-06-29 2022-08-16 Nicira, Inc. Installation of routing tables for logical router in route server mode
US11425021B2 (en) 2015-08-31 2022-08-23 Nicira, Inc. Authorization for advertised routes among logical routers
US11539574B2 (en) 2016-08-31 2022-12-27 Nicira, Inc. Edge node cluster network redundancy and fast convergence using an underlay anycast VTEP IP

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FI116958B (fi) * 2003-07-01 2006-04-13 Nokia Corp Hallintasolmujen määrittäminen laitteenhallintajärjestelmässä
US20060002306A1 (en) * 2004-06-30 2006-01-05 Ronald Brown Failure detection of path information corresponding to a transmission path
CN102447638A (zh) * 2012-01-12 2012-05-09 中兴通讯股份有限公司 负载均衡的方法及转发设备

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0969630B1 (en) * 1998-07-01 2011-10-12 Hitachi, Ltd. Method for sharing network information and router apparatus

Cited By (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1649341B (zh) * 2003-12-22 2012-03-21 惠普公司 应用路由选择协议的堆叠式路由器
CN101710896B (zh) * 2009-11-30 2012-10-03 中国人民解放军信息工程大学 一种链路质量探测方法和装置
US11252024B2 (en) 2014-03-21 2022-02-15 Nicira, Inc. Multiple levels of logical routers
US11799800B2 (en) 2015-01-30 2023-10-24 Nicira, Inc. Logical router with multiple routing components
US11283731B2 (en) 2015-01-30 2022-03-22 Nicira, Inc. Logical router with multiple routing components
CN107925617A (zh) * 2015-08-11 2018-04-17 Nicira股份有限公司 逻辑路由器的路由配置
US10805212B2 (en) 2015-08-11 2020-10-13 Nicira, Inc. Static route configuration for logical router
US11533256B2 (en) 2015-08-11 2022-12-20 Nicira, Inc. Static route configuration for logical router
US11425021B2 (en) 2015-08-31 2022-08-23 Nicira, Inc. Authorization for advertised routes among logical routers
US10795716B2 (en) 2015-10-31 2020-10-06 Nicira, Inc. Static route types for logical routers
US11593145B2 (en) 2015-10-31 2023-02-28 Nicira, Inc. Static route types for logical routers
US11418445B2 (en) 2016-06-29 2022-08-16 Nicira, Inc. Installation of routing tables for logical router in route server mode
US11539574B2 (en) 2016-08-31 2022-12-27 Nicira, Inc. Edge node cluster network redundancy and fast convergence using an underlay anycast VTEP IP
US10911360B2 (en) 2016-09-30 2021-02-02 Nicira, Inc. Anycast edge service gateways
US10931560B2 (en) 2018-11-23 2021-02-23 Vmware, Inc. Using route type to determine routing protocol behavior
US10797998B2 (en) 2018-12-05 2020-10-06 Vmware, Inc. Route server for distributed routers using hierarchical routing protocol
US10938788B2 (en) 2018-12-12 2021-03-02 Vmware, Inc. Static routes for policy-based VPN

Also Published As

Publication number Publication date
EP1303084A3 (en) 2005-08-24
CN1216480C (zh) 2005-08-24
EP1303084A2 (en) 2003-04-16
KR20030029511A (ko) 2003-04-14
KR100450951B1 (ko) 2004-10-06

Similar Documents

Publication Publication Date Title
US7277383B2 (en) Redundancy mechanization protocol for a massively parallel router
US7254111B2 (en) Routing coordination protocol for a massively parallel router architecture
CN1216480C (zh) 用于大规模并行路由器的冗余机制协议
US8654680B2 (en) Packet forwarding using multiple stacked chassis
US8185657B2 (en) Data generating device
US6934292B1 (en) Method and system for emulating a single router in a switch stack
EP2421205B1 (en) Flooding-based routing protocol having average-rate and burst-rate control
US8243729B2 (en) Multiple chassis stacking using front end ports
US8102848B1 (en) Multicast high availability enhancements for faster convergence
US8345536B1 (en) Multicast high availability enhancements for non-stop forwarding
US8442045B2 (en) Multicast packet forwarding using multiple stacked chassis
US9106569B2 (en) System and method that routes flows via multicast flow transport for groups
US8599851B2 (en) System and method that routes flows via multicast flow transport for groups
Li et al. RDCM: Reliable data center multicast
US6370583B1 (en) Method and apparatus for portraying a cluster of computer systems as having a single internet protocol image
AU2005322969A1 (en) End-to-end publish/subscribe middleware architecture
JP2000307657A (ja) ホスト・クラスタのためのネットワーク・ディスパッチャを利用するデータ伝送システムにおけるルータ監視システム
US8345576B2 (en) Methods and systems for dynamic subring definition within a multi-ring
WO2020078043A1 (zh) 一种确定组播流的df的方法、设备及***
Mahajan et al. Athena: Reliable multicast for group communication in SDN-based data centers
CN1266911C (zh) 用于大规模并行路由器结构的路由协调协议
Raghavendra et al. Multicast routing in internetworks using dynamic core based trees
KR100450930B1 (ko) 대용량 병렬 라우터 아키텍쳐용 조정 프로토콜의 경로설정
JP4609862B2 (ja) ネットワーク中継方法、ネットワーク要素およびネットワーク中継システム
KR100487127B1 (ko) 분산형 라우터에 있어서 멀티캐스트 라우팅 테이블 관리방법

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20050824

Termination date: 20141008

EXPY Termination of patent right or utility model