CN102025614B - 一种线上可重构的4元树状片上网络***及其重构方法 - Google Patents

一种线上可重构的4元树状片上网络***及其重构方法 Download PDF

Info

Publication number
CN102025614B
CN102025614B CN2010105589917A CN201010558991A CN102025614B CN 102025614 B CN102025614 B CN 102025614B CN 2010105589917 A CN2010105589917 A CN 2010105589917A CN 201010558991 A CN201010558991 A CN 201010558991A CN 102025614 B CN102025614 B CN 102025614B
Authority
CN
China
Prior art keywords
network
node
tree
yuan
switch
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN2010105589917A
Other languages
English (en)
Other versions
CN102025614A (zh
Inventor
潘赟
王一木
严晓浪
程爱莲
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang University ZJU
Original Assignee
Zhejiang University ZJU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University ZJU filed Critical Zhejiang University ZJU
Priority to CN2010105589917A priority Critical patent/CN102025614B/zh
Publication of CN102025614A publication Critical patent/CN102025614A/zh
Application granted granted Critical
Publication of CN102025614B publication Critical patent/CN102025614B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Data Exchanges In Wide-Area Networks (AREA)
  • Small-Scale Networks (AREA)

Abstract

一种线上可重构的4元树状片上网络***,包括处理单元,用以实现片上网络的计算任务;网络接口,用以对网络上传输的数据包进行打包、解包;交换机,用以进行数据交互;控制单元,用以根据收集来的各处理单元的任务量信息,按照重构方法重组网络群集;交换机有五个端口,其中四个连接同级之间的处理单元,并行工作的处理单元每隔固定时间进行任务交互,另一个端口通向下一级网络;每四个处理单元及其网络接口和它们的交换机以4元树结构组成一个群集,各群集以此方式递归组成更大的群集,直至整个网络***。以及提供了4元树状片上网络***的重构方法。本发明有效减少通信量、降低通信延迟、重构过程具有良好的划分结果。

Description

一种线上可重构的4元树状片上网络***及其重构方法
技术领域
本发明涉及一种片上网络与复杂性理论中数字划分领域,是一种采用线上可重构技术的4元树状片上网络***及其可重构方法。
背景技术
随着半导体技术的不断前进,***芯片(System on Chip, SoC)也日趋复杂,包含着越来越多的处理器、存储器等IP模块,以片上网络为代表的新一代片上通信***成为了SoC的研究热点。树状拓扑结构的片上网络由于其较低的通信延迟、物理设计中布局的灵活性在同构***中被广泛应用。
然而传统的树形片上网络***由于各节点链接固定,参照图3 (a),从而导致部分数据包可能需要经过较远的距离才能传输到目的节点,以致片上通讯延迟高,数据传输量大,功耗高。
树形片上网络***的重构问题涉及复杂性理论中数字划分领域,尤其是平衡数字划分(Balanced Number Partitioning),解决这类问题的方法包括可在多项式时间和空间内找到近似解的启发式算法,在多项式时间内完成但需要大量空间的动态规划算法,以及只要运行时间足够长即可找到最佳解的任意时间算法(Anytime Algorithm)。介于重构控制模块的计算能力及空间所限,启发式算法是重构方法的最佳选择。平衡最大差分法(Balanced Largest Differencing Method, BLDM)是解决平衡数字划分的经典方法,好过其他通用多项式时间方法。
发明内容
为了克服已有树形片上网络***的通信量较大、通信延迟较大、重构过程中划分结果不可靠的不足,本发明提供了一种有效减少通信量、降低通信延迟、重构过程具有良好的划分结果的线上可重构的4元树状片上网络***及其重构方法。
本发明解决其技术问题所采用的技术方案是:
一种线上可重构的4元树状片上网络***,所述4元树状片上网络***包括:处理单元,用以实现片上网络的计算任务;网络接口,用以对网络上传输的数据包进行打包、解包;交换机,用以进行数据交互;控制单元,用以根据收集来的各处理单元的任务量信息,按照重构方法重组网络群集;
所述交换机有五个端口,其中四个连接同级之间的处理单元,并行工作的处理单元每隔固定时间进行任务交互,另一个端口通向下一级网络;每四个处理单元及其网络接口和它们的交换机以4元树结构组成一个群集,各群集以此方式递归组成更大的群集,直至整个网络***。
作为优选的一种方案:片上网络中传输的数据包括处理单元发给控制器的任务量信息、控制器发给交换机的群集信息、控制器发给处理单元的任务发送信息和处理单元之间发送的任务信息。
进一步,所述控制单元中,所述重构方法采用平衡最远绑定法,即将n个节点分为                                                
Figure 841419DEST_PATH_IMAGE001
组,记做
Figure 890015DEST_PATH_IMAGE002
,每组4个节点,其中n为能被4整除的自然数;某一时刻各节点的当前任务量为
Figure 540964DEST_PATH_IMAGE003
,排序后为序列
Figure 95442DEST_PATH_IMAGE004
,并且
Figure 399385DEST_PATH_IMAGE005
为节点平均任务量,即
Figure 799142DEST_PATH_IMAGE006
,使得交换机通信量
Figure 757127DEST_PATH_IMAGE007
近似最小,其中,
Figure 469124DEST_PATH_IMAGE008
一种线上可重构的4元树状片上网络***的重构方法,所述4元树状片上网络***中,每四个处理单元及其网络接口和它们的交换机以4元树结构组成一个群集,各群集以此方式递归组成更大的群集;
设网络***的节点数为nn为能被4整除的自然数,将n个节点分为
Figure 322680DEST_PATH_IMAGE001
组,记做
Figure 526128DEST_PATH_IMAGE002
,每组4个节点,某一时刻各节点的当前任务量为
Figure 288022DEST_PATH_IMAGE003
,排序后为序列
Figure 184302DEST_PATH_IMAGE004
,并且为节点平均任务量,即
Figure 204397DEST_PATH_IMAGE006
为使得交换机通信量近似最小,其中,
Figure 751626DEST_PATH_IMAGE008
,重构的基本思想是每一次循环将任务量最大和最小的两个节点分到同一组并作为一个新的节点重新归入序列中,循环次后完成重构,可以使得重构后交换机通信量
Figure 49326DEST_PATH_IMAGE010
近似最小,各群集任务量比较平均。
作为优选的一种方案:所述重构方法包括以下步骤:
1)首先,各节点当前任务量减去平均任务量,得到节点通信量,因此,各元素值为
2)除去两个距离最远的元素,所述距离最远即节点通信量最大;
3)将除去的两元素值以及标签加起来成为一个新的元素,按照元素值的大小重新***到序列L当中;
4)返回步骤2),直到划分完毕。
进一步,所述序列L每个元素包括两个部分,即元素值和标签,标签标识元素的源数据的个数,初始值为1。
再进一步,步骤3)中合并的两个元素的标签和需小于等于4,同时,当序列中有元素标签为3时,接下来的循环需要找到一个距离最远并与之对应的元素和它配对,所述对应的元素的标签为1。
更进一步,每一次重构过程,将群集中的四个设备单元组合到一起,所述设备单元包括处理单元或群集子集。由于群集以此方式递归组成更大的群集,因此,更大的群集中含有四个群集子集。
本发明的技术构思为:发明的线上可重构4元树状片上网络***可以根据各节点的待通讯数据量对其群集重组,以最大程度地减少通信量、减小通信延迟,从而提高实时处理性能,降低***功耗。
对于重构方法中,针对4元树状片上网络***,提出了平衡最远绑定法(Balanced Farthest Binding Method,BFBM)在划分结果上要优于BLDM。
本发明的有益效果主要表现在:有效减少通信量、降低通信延迟、重构过程具有良好的划分结果。
附图说明
图1 是4元树状片上网络***的示意图。
图2 是重构方法的迭代方式的示意图。
图3 (a) 是传统树状片上网络通信的示意图。
图3 (b) 是可重构的树状片上网络通信的示意图。
图4是交换机***可重构电路图。
图5是BFBM重构方法示意图。
具体实施方式
下面结合附图对本发明做进一步描述。
实施例1
参照图1,一种线上可重构的4元树状片上网络***,包括处理单元(Processing Element, PE)、网络接口(Network Interface, NI)、交换机(Switch)、控制单元(Control Unit, CU)。***中各处理单元硬件结构完全相同,是计算任务的主要承担者。为保证***工作效率,各并行工作的处理单元需每隔固定时间进行任务交互,以平衡工作量。网络接口负责对网络上传输的数据包进行打包、解包。传输的数据包括四类:处理单元发给控制器的任务量信息、控制器发给交换机的群集信息、控制器发给处理单元的任务发送信息、处理单元之间发送的任务信息。交换机有五个端口,其中四个连接同级之间的处理单元,另一个端口通向下一级网络。***中每四个处理单元及其网络接口和它们的交换机以4元树结构组成一个群集,如图所示1,各群集以此方式递归组成更大的群集,直至整个***。树状片上网络***的根节点为顶层的交换机,与控制单元相连。控制单元根据收集来的各处理单元的任务量信息,按照重构方法重组网络群集。
为支持线上可重构,发明的片上网络***在传统树形***的基础上增加控制单元。控制单元可以为专用电路模块亦可为嵌入式CPU来执行重构方法。每固定间隔时间,各处理单元将其正在处理的任务量信息以数据包的形式发送给控制单元。控制单元根据这些信息通过重构方法计算出重构后的节点位置并告知各交换机。
所述控制单元中,所述重构方法采用平衡最远绑定法,即将n个节点分为
Figure 946929DEST_PATH_IMAGE001
组,记做
Figure 999723DEST_PATH_IMAGE002
,每组4个节点,其中n为能被4整除的自然数;某一时刻各节点的当前任务量为
Figure 535616DEST_PATH_IMAGE003
,排序后为序列
Figure 659430DEST_PATH_IMAGE004
,并且
Figure 246576DEST_PATH_IMAGE005
为节点平均任务量,即
Figure 721420DEST_PATH_IMAGE006
,使得交换机通信量
Figure 63933DEST_PATH_IMAGE007
近似最小,其中,
Figure 307832DEST_PATH_IMAGE008
实施例2
参照图1~图5,一种线上可重构的4元树状片上网络***的重构方法,假设***节点数为n,某一时刻各节点的当前任务量为
Figure 622139DEST_PATH_IMAGE003
,排序后为序列
Figure 836476DEST_PATH_IMAGE012
,并且
Figure 464903DEST_PATH_IMAGE005
为节点平均任务量,即
Figure 891205DEST_PATH_IMAGE006
。发明的BFBM可重构方法将n个节点分为
Figure 566294DEST_PATH_IMAGE001
组,记做
Figure 15730DEST_PATH_IMAGE002
,每组4个节点,使得交换机通信量
Figure 774081DEST_PATH_IMAGE007
近似最小,其中
BFBM重构方法中序列L每个元素包括两个部分,即元素值和标签。标签标识元素的源数据的个数,初始值为1。
重构方法的具体步骤如下:
1)       首先为各节点当前任务量减去平均任务量,得到节点通信量,因此各元素值为
Figure 897950DEST_PATH_IMAGE011
2)       除去两个距离最远的元素,所述距离最远即节点通信量最大。
3)       将除去的两元素值以及标签加起来成为一个新的元素,按照元素值的大小重新***到序列当中。
4)       返回步骤2),直到划分完毕。
值得注意的是由于数字划分的基数(Cardinality)为4,因此步骤2中除去的两个元素的标签和需小于等于4。同时,当序列中有元素标签为3时,接下来重构方法需要找到一个距离最远并与之对应的元素(标签为1)和它配对,只有这样才能保证最终划分得到的各组元素的数目为4个。
为使***各层交换机通信量近似最小,可在重构时将此方法迭代使用,如图2所示。每一次使用重构方法,将每四个设备单元(处理单元或群集)组合到一起,可保证此层次交换机的通信量较小。
以16节点***为例,假设某一时刻各处理单元之间的通信量如图3 (a)所示,此时传统树形***第一层交换机的通信量分别为:118、54、132、84,共388个单位数据包;顶层交换机需转发170个单位数据包。而当采用提出的可重构树形***时,各节点根据重构方法重新组合,如图3 (b)所示。此时,第一层交换机通信量分别为:48、86、64、22,共220个单位数据包;顶层交换机的通信量仅为2个单位数据包。因此,提出的可重构的片上网络***可以有效地减少通信延迟,节省***功耗。
交换机的***可重构硬件支持如图4所示,每层交换机通过多路选择器(MUX)与同层所有设备单元(处理单元或群集)相连接。重构时,交换机根据控制单元发来的重构结果选择处理单元或群集。
本发明的BFBM重构方法的数字划分结果优于通用的BLDM方法,以16个数1, 1, 1, 1, 2, 8, 10, 15, 19, 29, 51, 67, 88, 139, 258, 334为例,= 64,BLDM方法得到的数字划分结果为{1,2,19,334}, {1,8,29,258}, {1,10,51,139}, {1,15,67,88},
Figure 572032DEST_PATH_IMAGE013
,而BFBM重构方法的实施过程如图5所示,最终
Figure 870158DEST_PATH_IMAGE014
,优于BLDM方法。

Claims (3)

1.一种线上可重构的4元树状片上网络***,其特征在于:所述4元树状片上网络***包括:
处理单元,用以实现片上网络的计算任务;
网络接口,用以对网络上传输的数据包进行打包、解包;
交换机,用以进行数据交互;
控制单元,用以根据收集来的各处理单元的任务量信息,按照重构方法重组网络群集;
所述重构方法采用平衡最远绑定法,即将n个节点分为k=n/4组,记做A1,A2,...,Ak,每组4个节点,其中n为能被4整除的自然数;某一时刻各节点的当前任务量为b1,b2,...bn,排序后为序列L=a1,a2,...an,a1≤a2≤...≤an,并且c为节点平均任务量,即∑j∈Aaj=nc,使得交换机通信量 
Figure FDA00002215775200011
近似最小,其中,
Figure FDA00002215775200012
所述交换机有五个端口,其中四个连接同级之间的处理单元,并行工作的处理单元每隔固定时间进行任务交互,另一个端口通向下一级网络;每四个处理单元及其网络接口和它们的交换机以4元树结构组成一个群集,各群集以此方式递归组成更大的群集,直至整个网络***。
2.如权利要求1所述的线上可重构的4元树状片上网络***,其特征在于:片上网络中传输的数据包括处理单元发给控制单元的任务量信息、控制单元发给交换机的群集信息、控制单元发给处理单元的任务发送信息和处理单元之间发送的任务信息。 
3.一种如权利要求1所述的线上可重构的4元树状片上网络***的重构方法,其特征在于:所述4元树状片上网络***中,每四个处理单元及其网络接口和它们的交换机以4元树结构组成一个群集,各群集以此方式递归组成更大的群集;
设网络***的节点数为n,n为能被4整除的自然数,将n个节点分为k=n/4组,记做A1,A2,...,Ak,每组4个节点,某一时刻各节点的当前任务量为b1,b2,...bn,排序后为序列L=a1,a2,...an,a1≤a2≤...≤an,并且c为节点平均任务量,即∑j∈Aaj=nc;
所述重构方法包括以下步骤:
1)首先,各节点当前任务量减去平均任务量,得到节点通信量,因此,各元素值为aj-c;
2)除去两个距离最远的元素,所述距离最远即节点通信量最大;
3)将除去的两元素值以及标签加起来成为一个新的元素,按照元素值的大小重新***到序列L当中;
4)返回步骤2),直到划分完毕;
所述序列L每个元素包括两个部分,即元素值和标签,标签标识元素的源数据的个数,初始值为1;
步骤3)中合并的两个元素的标签和需小于等于4,同时,当序列中有元素标签为3时,接下来的循环需要找到一个距离最远并与之对应的元素和它配对,所述对应的元素的标签为1;
每一次重构过程,将群集中的四个设备单元组合到一起,所述设备单元包括处理单元或群集子集。 
CN2010105589917A 2010-11-25 2010-11-25 一种线上可重构的4元树状片上网络***及其重构方法 Expired - Fee Related CN102025614B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2010105589917A CN102025614B (zh) 2010-11-25 2010-11-25 一种线上可重构的4元树状片上网络***及其重构方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2010105589917A CN102025614B (zh) 2010-11-25 2010-11-25 一种线上可重构的4元树状片上网络***及其重构方法

Publications (2)

Publication Number Publication Date
CN102025614A CN102025614A (zh) 2011-04-20
CN102025614B true CN102025614B (zh) 2013-01-30

Family

ID=43866488

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2010105589917A Expired - Fee Related CN102025614B (zh) 2010-11-25 2010-11-25 一种线上可重构的4元树状片上网络***及其重构方法

Country Status (1)

Country Link
CN (1) CN102025614B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103986672B (zh) * 2014-05-23 2017-12-19 清华大学 片上网络拓扑结构的重构方法及***
CN105450481B (zh) * 2014-07-10 2018-09-14 龙芯中科技术有限公司 片上网络的布局优化方法及装置
CN105550157B (zh) 2015-12-24 2017-06-27 中国科学院计算技术研究所 一种分形树结构通信结构、方法、控制装置及智能芯片
CN105634960B (zh) * 2015-12-24 2017-04-05 中国科学院计算技术研究所 基于分形树结构的数据发布装置、方法、控制装置及智能芯片

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7467358B2 (en) * 2004-06-03 2008-12-16 Gwangju Institute Of Science And Technology Asynchronous switch based on butterfly fat-tree for network on chip application
US7382154B2 (en) * 2005-10-03 2008-06-03 Honeywell International Inc. Reconfigurable network on a chip
CN101420380B (zh) * 2008-11-28 2012-11-14 西安邮电学院 一种双层双环型片上***
CN101420355B (zh) * 2008-11-28 2011-06-01 西安邮电学院 一种星簇双环片上网络拓扑结构装置

Also Published As

Publication number Publication date
CN102025614A (zh) 2011-04-20

Similar Documents

Publication Publication Date Title
CN107211036B (zh) 一种数据中心网络组网的方法以及数据中心网络
KR20140139032A (ko) 패킷플로우 상호연결 패브릭
Winter et al. Hierarchical routing architectures in clustered 2D-mesh networks-on-chip
CN102025614B (zh) 一种线上可重构的4元树状片上网络***及其重构方法
CN107430574A (zh) 用于分析***的io、处理和存储器带宽的优化的方法和装置
CN108628800A (zh) 一种动态可重构的智能计算集群及其配置方法
Wolfe et al. Preliminary performance analysis of multi-rail fat-tree networks
CN102075578A (zh) 基于分布式存储单元的层次化片上网络架构
CN102325089A (zh) 基于差分进化和捕食搜索策略的胖树型片上网络映射方法
Ogleari et al. String figure: A scalable and elastic memory network architecture
CN106101262A (zh) 一种基于以太网的直连架构计算集群***及构建方法
Marcon et al. Tiny NoC: A 3D mesh topology with router channel optimization for area and latency minimization
CN102752207B (zh) 可重配置的2D mesh片上网络结构及其重配置方法
Bhanu et al. Fault-tolerant application mapping on mesh-of-tree based network-on-chip
CN104065577B (zh) 一种适用于航空电子的片上网络***
Moradi et al. A memory-efficient routing method for large-scale spiking neural networks
Agyeman et al. Optimised application specific architecture generation and mapping approach for heterogeneous 3d networks-on-chip
Joseph et al. NEWROMAP: Mapping CNNs to NoC-interconnected self-contained data-flow accelerators for edge-AI
CN105634960B (zh) 基于分形树结构的数据发布装置、方法、控制装置及智能芯片
Filiposka et al. Community-based complex cloud data center
Bouhraoua et al. Improved modified fat-tree topology network-on-chip
Yamada et al. Folded fat H-tree: An interconnection topology for dynamically reconfigurable processor array
Ueno et al. VCSN: Virtual circuit-switching network for flexible and simple-to-operate communication in HPC FPGA cluster
Urgese et al. Work-in-progress: Multiple alignment of packet sequences for efficient communication in a many-core neuromorphic system
Zhang et al. KGT: An Application Mapping Algorithm Based on Kernighan–Lin Partition and Genetic Algorithm for WK-Recursive NoC Architecture

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C17 Cessation of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20130130

Termination date: 20131125