CN100461748C - 直接互连交换网路由的方法 - Google Patents

直接互连交换网路由的方法 Download PDF

Info

Publication number
CN100461748C
CN100461748C CNB2004100853814A CN200410085381A CN100461748C CN 100461748 C CN100461748 C CN 100461748C CN B2004100853814 A CNB2004100853814 A CN B2004100853814A CN 200410085381 A CN200410085381 A CN 200410085381A CN 100461748 C CN100461748 C CN 100461748C
Authority
CN
China
Prior art keywords
deadlock
cell
exchange
plane
exchange plane
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CNB2004100853814A
Other languages
English (en)
Other versions
CN1764150A (zh
Inventor
胡致远
王少勇
王凯
邹昕光
李英新
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Priority to CNB2004100853814A priority Critical patent/CN100461748C/zh
Publication of CN1764150A publication Critical patent/CN1764150A/zh
Application granted granted Critical
Publication of CN100461748C publication Critical patent/CN100461748C/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

一种直接互连交换网路由的方法,将交换节点中的缓存队列分组,各交换节点中具有相同目的地址的缓存队列组形成虚拟输出缓存队列VOQ交换平面,信元在各VOQ交换平面中进行路由,在交换节点还配置用于解除死锁的缓存队列组,当发生死锁时,将队列头信元送到由各交换节点中用于解除死锁的缓存队列组所形成的交换平面中进行路由;用于解除死锁的缓存队列组所形成的交换平面包括两个交换平面,其中一个交换平面对发生死锁的信元进行局部恢复,一个交换平面对发生死锁的信元进行全局恢复,本发明提供了一种消除死锁的直接互连交换网路由方法,提高了交换网通道利用率,避免了交换网络丢包。

Description

直接互连交换网路由的方法
技术领域
本发明涉及通信技术领域,尤其涉及一种在直接互连拓扑结构的交换网中进行路由的方法。
背景技术
随着通信网络规模的不断扩大,要求交换网(Switching fabric)能够实现经济扩展和提供服务质量(QoS)保障。传统的(动态)间接互连结构交换网,如Crossbar(交换矩阵)、三级Clos等,采用集中交换背板结构,扩容时代价过大。而直接互连拓扑结构网络,如三维Torus(圆环),可以提供线性扩展结构,实现平滑扩容,且这种多路径网络结构提供了良好的容错性。近十多年来,直接互连网络一直用于并行计算机结构中,有很高的可扩展性、经济性、鲁棒性,然而直接互连的计算机网络未能提供路由器所需的QoS保障,其“树饱和(tree-saturation)”的阻塞特性,不能保证包时延。
“树饱和(tree saturation)”是因节点缓存竞争而产生的网络阻塞,网络中通往“热点端口”路径上“中间节点”的缓存资源可能耗尽,从而阻止需要经过这些“中间节点”到其他端口的业务流通过,进而诱发更多的网络缓存资源耗尽、直至全网瘫痪。目前解决树饱和的办法是:交换节点配置虚拟输出缓存队列(VOQ),网络中各交换节点按照目的地址相同原则,组成不同的虚拟输出缓存队列(VOQ)交换平面(简称虚拟交换平面),以避免不同输出端口之间的缓存竞争,如图1所示,交换节点1—9中分别配置虚拟输出缓存队列(VOQ),每个节点缓存中目的地址为4的VOQ和目的地址为6的VOQ分别组成2个虚拟交换平面,目的地址为4或6的信元分别在各自的虚拟交换平面进行路由,虚拟交换平面的数目一般至少为总节点数,也可根据缓存资源适当增加。采用虚拟交换平面技术解决了“树饱和(tree saturation)”带来的缓存竞争问题。
多路径的直接互连网络的通道利用率与路由算法、流量分担算法和仲裁相关。路由算法常分为最短路径和非最短路径两种,最短路径算法的优点是易于避免死锁;非最短路径算法的优点是有较高的通道利用率且适应流量突发。
常见的最短路由算法有以下三种:
1、最小路径的源路由算法——随机等概率选择源节点到目的节点之间的任意一条最小路径来转发分组,如图2所示;
2、自适应最小路径路由算法,如图3所示;
3、维序路由算法(Dimension-Ordered),如图4所示。
流量分担算法的主要目的是平衡整个交换网各路径的流量负担,可在网络源节点预先分配确定路由,或由中间交换节点动态平衡。另外反馈检测信号(反压或节点故障)能够帮助各交换节点调整流量。
仲裁算法解决直接互连交换网的交换节点内部的对外通道竞争问题,公平性是其主要指标,可以采用轮循类或公平调度算法。
直接互连网络的多路径特性,保证了突发条件下的通过率,增加了***容错性,而且采用虚拟交换平面技术解决了“树饱和”带来的缓存竞争,但在非最短路由条件下,未能消除同一虚拟交换平面中节点之间可能出现的缓存循环依赖关系,易产生死锁。
如图5所示为死锁产生机理示意图,图中产生死锁的4个交换节点各沿逆时针回环路径申请缓存资源,但不放弃其已经拥有的缓存资源。死锁现象出现在非最短路由或者因交换节点异常而采用偏折路由策略的情况。
目前解决死锁的主要方法有:
1)破坏资源循环依赖关系;
2)提供充分的缓存资源;
3)允许强占和丢弃。
上述第一种方法要限制一些路径,需采用最短路由或其他特定路由选择规则,这样降低了通道利用率;第二种方案受到技术和成本制约;而由于处在链路层的交换网内部不允许丢弃,从而限制了第三种方案。
发明内容
本发明所要解决的技术问题是:克服现有的直接互连拓扑结构交换网在采用虚拟交换平面解决了树饱和带来的缓存竞争后,仍存在非最短路由条件下易产生死锁的问题,提供一种消除死锁的直接互连交换网路由方法,并提高交换网通道利用率,避免网络丢包。
本发明为解决上述技术问题所采用的技术方案为:
这种直接互连交换网路由的方法,将交换节点中的缓存队列分组,各交换节点中具有相同目的地址的缓存队列组形成虚拟输出缓存队列VOQ交换平面,信元在各VOQ交换平面中进行路由,其特征在于:对所述VOQ交换平面中的死锁进行消除,包括以下步骤:
A、在交换节点配置用于解除死锁的缓存队列组;
B、当发生死锁时,将队列头信元送到由各交换节点中的所述用于解除死锁的缓存队列组所形成的交换平面中进行路由。
所述的步骤B中,所述用于解除死锁的缓存队列组所形成的交换平面包括两个交换平面,其中一个交换平面对发生死锁的信元进行局部恢复,当该信元到达后续交换节点时,重新回到VOQ交换平面进行路由;另一个交换平面则对发生死锁的信元进行全局恢复,信元在此交换平面中一直路由到目的节点。
所述的步骤B中,采用队列头信元等待时间计算器进行死锁判断,当队列头信元等待时间超过预置时间门限,则认为发生了死锁。
所述的预置时间门限包括下限和上限,通过预置上、下时间门限,决定将死锁信元送到哪个交换平面进行处理,当超过下限时,送到进行局部恢复的交换平面处理;当超过上限时,送到进行全局恢复的交换平面处理。
所述的解除死锁的交换平面中,交换节点中的信元优先级随等待时间延长而增加。
所述的VOQ交换平面中的信元采用高通道利用率的非最短路由进行路由,所述用于解除死锁的缓存队列组所形成的交换平面中的信元采用无死锁路径进行路由。
本发明的有益效果为:本发明通过划分直接互连拓扑结构交换网的缓存单元,分别组成“虚拟交换平面”和“死锁恢复平面”,为利用不同的路由算法提高非均衡业务下的交换网通过率创造了条件;清晰的层次划分解决了路径多样性与死锁概率增大之间的矛盾;解决了直接互连拓扑结构的交换网路由算法的死锁问题,提高了交换网通过率,避免了丢包。
本发明采用多“虚拟交换平面”共用“死锁恢复平面”,减少了解除死锁所需的缓存队列数,并进一步细分“死锁恢复平面”为“局部”和“全局”两类,分别解决了均匀业务下的死锁和突发条件的死锁对“死锁恢复平面”的缓存需求,另外,死锁检测和交换节点通道仲裁机制,保证了交换网QoS指标。
附图说明
图1为虚拟交换平面结构示意图;
图2为源路由方案示意图;
图3为自适应最短路由方案示意图;
图4为维序路由方案示意图;
图5为死锁产生机理示意图;
图6为本发明实现方案流程图。
具体实施方式
下面根据附图和实施例对本发明作进一步详细说明:
直接互连拓扑结构的交换网的多路径特性,可能引发死锁,而目前常用的解决死锁的方案都有其局限性,需要寻求新的路由策略。
本发明的基本思想是:由于“树饱和”与“死锁”现象的原因都是要解决缓存利用问题,因此解决方案是将直接互连交换网按交换节点的缓存队列分组,形成不同的交换平面,其交换平面划分为多个“虚拟交换平面”和“死锁恢复交换平面”,两种交换平面可分别采用不同的路由算法,以避免“树饱和”以及“死锁”现象。
虚拟输出缓存队列(VOQ)按照目的地址相同原则,组成不同的虚拟交换平面,虚拟交换平面的数目至少等于总节点数,可根据缓存资源适当增加虚拟交换平面,以降低死锁概率;在交换节点中利用一个额外的缓存队列组用于解除死锁,各节点中用于解除死锁的缓存队列组形成死锁恢复交换平面,如果已发生死锁,则由死锁恢复平面解决,将队列头信元送到该交换平面中进行路由。
本发明的“死锁恢复平面”为所有的“虚拟交换平面”提供了死锁恢复机制,“虚拟交换平面”可采用高通道利用率的非最短路由算法,采用虚拟交换平面的死锁概率较低,整个交换网使用统一的死锁恢复平面,每个死锁恢复平面对应于交换节点中的一个额外(用于解除死锁的)缓存队列组,该死锁恢复平面使用无死锁的路由算法。
解决死锁的基本条件是能够检测到死锁,由于直接互连网络中各交换节点的分布控制特性,难以从逻辑上判定死锁,较容易的方法是采用等待时间判断方案。本发明采用队列头信元等待时间计算器,当队列头信元等待时间超过预置门限,则将该队列头信元送到死锁恢复平面。
“死锁恢复平面”又可分为“局部死锁恢复平面”和“全局死锁恢复平面”。超过时间门限的信元首先送到“局部死锁恢复平面”,而当其到达下一跳交换节点时,回到“虚拟交换平面”。该平面将死锁恢复功能在整个交换网中均匀分布,而对不平衡流量所产生的严重死锁将提高“全局死锁恢复平面”处理。因此,时间门限可分为下限和上限,通过预置上下时间门限,决定将死锁信元送至“局部死锁恢复平面”或“全局死锁恢复平面”处理。超过上限(等待时间更长)的信元将在“全局死锁恢复平面”中一直送达目的节点,中间节点不返回“虚拟交换平面”。
虚拟交换平面中,交换节点的仲裁采用轮循或其他公平调度算法;而“死锁恢复平面”中,交换节点仲裁也可上述方案,但为了体现等待时间与信元转发紧迫性关系,可采用动态优先级方案,其信元优先级随等待时间增加而增加,解决了交换平面内不同信元通道的竞争。
如图6所示,本发明实现方案流程如下:
1、首先进行初始化,设置队列头信元等待时间上门限和下门限;
2、如果信元在全局死锁恢复平面,或队列等待时间大于上门限,则根据信元优先级在全局死锁恢复平面分配无死锁路由转发信元,或等待下次时隙处理;
3、如果信元等待的时间未超过上门限而大于下门限,则将信元送到局部死锁恢复平面,根据信元优先级分配无死锁路由转发信元,或等待下次时隙处理;
4、如果信元等待的时间不大于下门限,则在虚拟交换平面中进行仲裁,选择成功信元分配路由转发信元,或等待下次时隙处理。
本发明提供了“虚拟交换平面”和“死锁恢复平面”组合的交换平面方案,分别解决了直接互连交换网的“树饱和”和“死锁”问题,并提高了通道利用率,避免了网络丢包。

Claims (6)

1.一种直接互连交换网路由的方法,将交换节点中的缓存队列分组,各交换节点中具有相同目的地址的缓存队列组形成虚拟输出缓存队列VOQ交换平面,信元在各VOQ交换平面中进行路由,其特征在于:对所述VOQ交换平面中的死锁进行消除,包括以下步骤:
A、在交换节点配置用于解除死锁的缓存队列组;
B、当发生死锁时,将队列头信元送到由各交换节点中的所述用于解除死锁的缓存队列组所形成的交换平面中进行路由。
2.根据权利要求1所述的直接互连交换网路由的方法,其特征在于:所述的步骤B中,所述用于解除死锁的缓存队列组所形成的交换平面包括两个交换平面,其中一个交换平面对发生死锁的信元进行局部恢复,当该信元到达后续交换节点时,重新回到VOQ交换平面进行路由;另一个交换平面则对发生死锁的信元进行全局恢复,信元在此交换平面中一直路由到目的节点。
3.根据权利要求2所述的直接互连交换网路由的方法,其特征在于:所述的步骤B中,采用队列头信元等待时间计算器进行死锁判断,当队列头信元等待时间超过预置时间门限,则认为发生了死锁。
4.根据权利要求3所述的直接互连交换网路由的方法,其特征在于:所述的预置时间门限包括下限和上限,通过预置上、下时间门限,决定将死锁信元送到哪个交换平面进行处理,当超过下限时,送到进行局部恢复的交换平面处理;当超过上限时,送到进行全局恢复的交换平面处理。
5.根据权利要求3所述的直接互连交换网路由的方法,其特征在于:所述的解除死锁的交换平面中,交换节点中的信元优先级随等待时间延长而增加。
6.根据权利要求1所述的直接互连交换网路由的方法,其特征在于:所述的VOQ交换平面中的信元采用高通道利用率的非最短路由进行路由,所述用于解除死锁的缓存队列组所形成的交换平面中的信元采用无死锁路径进行路由。
CNB2004100853814A 2004-10-22 2004-10-22 直接互连交换网路由的方法 Expired - Fee Related CN100461748C (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CNB2004100853814A CN100461748C (zh) 2004-10-22 2004-10-22 直接互连交换网路由的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CNB2004100853814A CN100461748C (zh) 2004-10-22 2004-10-22 直接互连交换网路由的方法

Publications (2)

Publication Number Publication Date
CN1764150A CN1764150A (zh) 2006-04-26
CN100461748C true CN100461748C (zh) 2009-02-11

Family

ID=36748108

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB2004100853814A Expired - Fee Related CN100461748C (zh) 2004-10-22 2004-10-22 直接互连交换网路由的方法

Country Status (1)

Country Link
CN (1) CN100461748C (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2393015B1 (en) * 2009-01-30 2015-07-01 Fujitsu Limited Information processing system, information processing device, control method for information processing device, control program for information processing device, and computer-readable recording medium
CN102137010B (zh) * 2011-02-17 2013-11-06 大唐移动通信设备有限公司 一种数据传输方法和通信节点
NO2776466T3 (zh) * 2014-02-13 2018-01-20

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5805589A (en) * 1993-03-04 1998-09-08 International Business Machines Corporation Central shared queue based time multiplexed packet switch with deadlock avoidance
US20020191619A1 (en) * 2001-05-31 2002-12-19 Philip Shafer Network router management interface with API invoked via login stream
CN1487699A (zh) * 2002-09-30 2004-04-07 华为技术有限公司 一种用于交换网测试的流量模拟方法及装置
CN1518298A (zh) * 2003-01-06 2004-08-04 ض� 虚拟输出队列(VoQ)管理方法和装置
US20040199734A1 (en) * 2003-04-03 2004-10-07 Oracle International Corporation Deadlock resolution through lock requeuing

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5805589A (en) * 1993-03-04 1998-09-08 International Business Machines Corporation Central shared queue based time multiplexed packet switch with deadlock avoidance
US20020191619A1 (en) * 2001-05-31 2002-12-19 Philip Shafer Network router management interface with API invoked via login stream
CN1487699A (zh) * 2002-09-30 2004-04-07 华为技术有限公司 一种用于交换网测试的流量模拟方法及装置
CN1518298A (zh) * 2003-01-06 2004-08-04 ض� 虚拟输出队列(VoQ)管理方法和装置
US20040199734A1 (en) * 2003-04-03 2004-10-07 Oracle International Corporation Deadlock resolution through lock requeuing

Also Published As

Publication number Publication date
CN1764150A (zh) 2006-04-26

Similar Documents

Publication Publication Date Title
US11588733B2 (en) Slice-based routing
EP1005745B1 (en) Router with virtual channel allocation
US20030035371A1 (en) Means and apparatus for a scaleable congestion free switching system with intelligent control
CN107046500B (zh) 一种应用于层次化片上网络的两级拆分路由器及其路由算法
CN102368739A (zh) 面向包-电路交换片上路由器的广播机制路由算法
CN108337196B (zh) 一种通过交换芯片构建的交换***及其路由算法
WO2022037266A1 (zh) 数据中心中的通信方法、装置和***
US20030231588A1 (en) Method and apparatus for multicast and unicast scheduling
US20060029058A1 (en) Highly parallel switching systems utilizing error correction II
García et al. Dynamic evolution of congestion trees: Analysis and impact on switch architecture
CN104022950A (zh) 一种可共享和自配置缓存的路由器结构
CN102394829A (zh) 片上互连网络中基于可靠性需求的仲裁方法
CN111224883A (zh) 一种高阶路由器的瓦片结构及其构建的高阶路由器
CN100461748C (zh) 直接互连交换网路由的方法
WO2023130835A1 (zh) 一种数据交换方法及装置
Escudero-Sahuquillo et al. FBICM: Efficient congestion management for high-performance networks using distributed deterministic routing
US6389017B1 (en) Resource scheduling algorithm in packet switched networks with multiple alternate links
CN1606273B (zh) 蜂巢式路由器
Rocher-Gonzalez et al. Efficient congestion management for high-speed interconnects using adaptive routing
Escudero-Sahuquillo et al. An efficient strategy for reducing head-of-line blocking in fat-trees
CN1741503B (zh) 一种交换设备和交换方法
CN117135107B (zh) 一种网络通信拓扑***、路由方法、设备及介质
Kuribayashi et al. Optimal LSP selection method in MPLS networks
Garcia et al. Recn-dd: A memory-efficient congestion management technique for advanced switching
Stojanovic et al. Optimized port allocation algorithm for deflection router with minimal buffering‟

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20090211

Termination date: 20161022

CF01 Termination of patent right due to non-payment of annual fee