CN111090613B

CN111090613B - 一种基于图分割的低复杂度软硬件划分与调度方法

Info

Publication number: CN111090613B
Application number: CN201911164151.XA
Authority: CN
Inventors: 唐麒; 郭彪; 魏急波; 熊俊; 赵海涛; 周力
Original assignee: National University of Defense Technology
Current assignee: National University of Defense Technology
Priority date: 2019-11-25
Filing date: 2019-11-25
Publication date: 2022-03-15
Anticipated expiration: 2039-11-25
Also published as: CN111090613A

Abstract

本发明涉及一种基于图分割的低复杂度软硬件划分与调度方法，在动态部分可重构片上***中，能够对各个任务进行软硬件划分和调度。在面对规模复杂的综合应用时能够有较好的任务调度性能和较低的时间复杂度。所采用的基于图分割的软硬件划分方法，通过计算任务的优先级得到任务的排序列表，完成对复杂DAG模型的划分，有效降低了模型的复杂度，利用MILP模型求解时能够快速得到调度长度最短的结果。本发明提出的方法在实际应用中有广泛的应用基础和应用前景。

Description

一种基于图分割的低复杂度软硬件划分与调度方法

技术领域

本发明涉及一种动态部分可重构片上***的软硬件划分与调度方法，具体来说，涉及由微处理器和动态部分可重构可编程逻辑门阵列组成的片上***中，基于图分割的软硬件划分与调度方法，该方法结合图分割技术及整数线性算法，具有较低的时间复杂度及较好的性能。

背景技术

随着技术的进步和用户对功能的需求不断增加，可重构片上***在传统计算机、智能手机、多媒体***、软件无线电等领域的应用越来越广。与传统的处理器***相比，动态部分可重构片上***在处理能力、尺寸、重量、成本、功耗等方面都有很大的优势。可重构片上***的一个重要特点是设备可编程，可编程逻辑门阵列(FPGA)可以动态地加载比特流文件从而实现功能的切换。然而，在进行功能切换时需要重构整个FPGA的资源，当应用规模较小、所需资源较少时，这种重构方式会增加重构时延和资源浪费。

动态部分可重构技术将FPGA划分成若干区域，每个区域在执行任务时互不影响。动态部分可重构技术可以减少重构时间，以Xilinx Zynq-7010为例，其重构端口的速率为400MB/s，重构整个FPGA需要8ms。而使用动态部分可重构技术，重构一个占用资源为25％的应用仅需要2ms。针对动态部分可重构片上***的软硬件划分与调度技术是发挥可重构***优势、满足应用实时性能的重要前提。采用高级语言综合技术可以将应用任务灵活编译到不同的硬件平台(微处理器和FPGA的部分可重构区域)，为软硬件划分与调度技术的应用奠定了良好的基础。软硬件划分与调度问题是一个组合优化问题，在满足任务重构顺序、依赖条件、重构时延等约束条件的情况下，获得调度长度最短的最优解。

采用混合整数线性规划(MILP)可以获得上述约束问题组合的最优解。但是随着任务复杂度和规模的增加，现有的基于MILP的解决方法的时间复杂度与任务规模呈正相关，解决一个中等规模的应用可能需要花费数十小时，难以有效应用于实际***。因此，本发明提出一种可以降低软硬件划分与调度时间复杂度的方法，可以快速得到较优的软硬件划分与调度策略。

发明内容

为了克服采用混合整数线性规划求解大型应用的软硬件划分与调度策略时存在的时间复杂度高的不足，本发明提出了一种基于图分割的低复杂度软硬件划分与调度方法。本方法通过一种多阶段混合机制，将一个应用划分成若干个子图，利用MILP方法求解子图的划分与调度策略，从而降低算法时间复杂度，提升了软硬件划分与调度效率。

本方法提出的多阶段混合机制将一个应用的划分与调度问题划分成若干个子问题，再进行逐步求解，求解时把前一个子问题的部分划分和调度结果作为后一个问题的输入。利用图分割法将应用的DAG(Directed Acyclic Graphs，有向无环图)模型按照一定顺序划分成若干个子图，后一个子图包含前一个子图，从而获得一个子图序列。子图序列中的各子图对应一个划分与调度的子问题，这些子问题可通过MILP进行求解，使用MILP求解子图划分与调度结果时，采用前一子图的部分结果作为输入。由于各子图的规模与原应用模型相比更小，且采用了前一子图的部分结果作为输入，因此，子图对应子问题的复杂度得以有效降低。

针对应用的子图划分问题，本发明提出一种基于优先级的图分割方法，即将应用的任务先按照一定的优先级进行排序，根据一定的计算方法将应用的任务划分到子图序列中的某个子图。

本发明所采用的技术方案是：将组成应用的各个任务进行基于优先级的排序，把任务划分到不同的子图中，即将DAG模型划分成若干个有序子图，然后再对每个子图利用MILP求解得到任务调度长度最短的最优解，具体包括下述步骤：

1.***平台与MILP建模

1.1平台模型

***的硬件平台由一块微处理器和一块支持动态部分可重构功能的FPGA组成。把FPGA划分成静态区域和一系列动态区域。

PR＝{PR₁,PR₂,...,PR_|PR|} (1)

H＝{h₁,h₂,...,h_|H|} (2)

其中PR_i表示第i个可重构区域，h_i表示FPGA的某种硬件资源(如：CLB、DSP、BRAM等)，其中重构区域重构开销的大小与重构区域的面积和重构端口的带宽的比值成正比。

1.2应用模型

将应用建模为有向无环图DAG，一个DAG由V,E两部分组成，可表示为G(V,E)。其中V表示组成应用的一系列子任务，E表示相邻两个任务之间依赖关系边的集合。cs_v和ch_v分别表示任务在微处理器和FPGA上的执行时间。对于每条边e∈E，使用src(e)表示边e上的源任务，dst(e)表示目的任务，每条边有一个属性w_e表示源任务到目的任务的通信开销。对于每条边e∈E，d_e＝1表示源任务和目的任务分别在微处理器和FPGA上执行，d_e＝0表示两个任务均在CPU或FPGA上执行。

1.3资源约束与MILP建模

软硬件划分问题即任务映射到不同的计算处理单元(如：CPU、FPGA静态区域、FPGA动态区域)。任务映射时要满足一系列物理约束条件，例如，任务在CPU上应顺序执行、同一个重构区域任务执行和重构不能同时进行、重构时任务应在重构之后执行、重构端口不能同时重构多个任务、任务执行所需的资源量应小于或等于可重构区的资源数量、所有可重构区的资源量总和应小于FPGA提供的资源总量等。

根据上述约束条件，通过设置变量，建立约束方程，将实际问题抽象建模成混合整数线性规划(MILP)模型，对其求解最优解。得到的结果即该模型下软硬件划分与调度的最优解，包括各个任务节点的部署方式，执行顺序等。

2.基于图分割的多阶段混合算法

2.1算法结构

当问题规模增大，利用MILP求解最优解时，时间复杂度也随之增加，本发明提出一种低复杂度的多阶段混合算法来进行软硬件划分和调度。该方法利用图分割法将应用的DAG模型划分成若干子图，再对每个子图利用MILP算法进行最优解的求解。图分割法即按照一定任务优先级，把应用的DAG模型划分成若干个包含任务节点的有序子图，其中顺序在后的子图包含顺序在前的子图。并且，为了减小模型复杂度将前一个子图的部分结果作为后一个子图的输入。利用基于图分割的多阶段混合算法的步骤如下：

步骤1：将应用划分成一系列有序的DAG子图(G′＝{G′₁,G′₁,…,G′_|G|})同时满足以下两个条件：

(1)

(2)

因为G′_i+1在G′_i之后进行调度，为了在划分DAG时将G_i′的部分调度结果作为G′_i+1的输入来降低复杂度，必须满足条件

第二个条件表示从G′_j到G′_i没有通信边即G′_i在G′_j前完成调度。

步骤2：对于每一个G′_i∈G′的DAG子图，使用MILP进行求解时，将前一个子图G′_i-1的部分调度结果

作为其输入信息。DAG的第一个子图G′₁没有输入信息。

其中

包含以下信息：

(1)G′_i-1中所有任务的映射信息；

(2)G′_i-1中所有任务在每一个独立计算处理设备(微处理器和FPGA可重构区域)上的执行和重构顺序；

(3)各任务相应的目的任务和源任务的执行设备标识d_e；

步骤3：对最后一个子图G′_|G|进行调度，得到初始问题的最优解。

本发明提出的通过基于图分割的多阶段混合算法方法来简化DAG模型，划分后的各个子图逐个嵌套，通过重复利用已求解的结果来达到减少计算量和减小时间复杂度的效果；

2.2基于优先级的图分割方法

利用上述基于图分割的多阶段混合算法进行求解时，将DAG模型划分成若干个子图至关重要，本发明提出一种基于静态底部等级(sbl)和静态顶部等级(stl)两种优先级的图分割法，在满足上述多阶段混合算法要求的同时，降低图分割算法的复杂度。

sbl表示在不考虑通信消耗的前提下，某任务到最后一个任务结束的最大路径长度。因为任务在微处理器上的执行时间比在FPGA上长3-5倍，所以只考虑在任务在FPGA上的时间消耗来计算sbl。当一个任务的sbl较大时，表明它可能有多个直接或者间接目的任务，在对应用DAG模型进行划分时应让其划分顺序在前。对于两个任务a和b，如果sbl_a＞sbl_b则a和b是不相关的或者b是a的直接或间接目的任务。stl表示从最初的源任务到某任务的最大路径长度。当一个任务的stl较大时，表明它可能有多个间接源任务。

本基于优先级的图分割法有两个输入，一个是DAG，另一个是DAG子图中任务的最大数量m。m的值应该根据MILP的求解时间来设置，m的值越大时间复杂度越高。通常实际实验中m≤10效果较好。基于优先级的图分割法具体步骤如下：

步骤1：计算DAG模型中各个任务节点的sbl；

步骤2：计算DAG模型中各个任务节点的stl；

步骤3：将DAG模型中的任务按照sbl递减的顺序排列，若sbl相同则按照stl递减的顺序排列，得到任务的顺序列表V'＝v′₁',v'₂,...,v′_|V'|；

步骤4：将每一个有序的子任务划分到相应的DAG模型子图，对于任务v′_i将其分配到子图G′_floor(i/m)+1，floor(i/m)表示对(i/m)进行取整；

步骤5：对于每一个子图G′_i，将G′_i-1划分到G′_i中(假定

)；

步骤6：将任务之间的通信边添加到每一个子图中，G′_i-1中任务的输出通信边被添加到G′_i，G′_i中包含通信边的目的任务；

按照上述基于优先级的任务划分方法满足DAG模型划分的两个限制条件。对于每一个DAG子图G′_i，其包含的任务和通信边属于G′_i+1，满足条件1的限制要求；另外DAG模型中的任务根据sbl和stl进行排序，没有通信边从后一个任务指向前一个任务，同时，优先级较高的任务被划分到顺序在前的DAG子图，满足条件2的限制要求。

本发明的有益效果：

本发明提出了一种基于图分割的低复杂度软硬件划分与调度方法，应用于动态部分可重构片上***中，通过一种阶段混合方法和基于任务优先级的图分割方法可以将一个复杂应用的DAG模型划分成若干嵌套子图，通过对子图逐个求解并重用求解结果，降低了问题的复杂度，能有效降低大中型规模应用的求解时间，具有广泛的应用基础和应用前景。

附图说明

图1为动态可重构的片上***，

图2为示例应用的DAG模型，

图3为示例应用的任务参数，

图4为采用图分割法进行软硬件划分与调度时构建的子图序列，

图5为示例应用的调度结果图。

具体实施方式

下面结合附图对本发明作进一步说明：

图1是本发明应用的动态可重构的片上***。如图1所示，该动态可重构的片上***平台由一块微处理器和一块支持动态可重构的FPGA组成，其中FPGA可以划分为一块静态区域和多块动态部分重构区域，各可重构区域可根据实际需要通过ICAP/PCAP端口下载不同的配置文件实现功能重构；

图2为示例应用的DAG模型，如图2所示该示例应用由n₀-n₇8个任务节点以及9条表示各任务之间的相互依赖关系的边组成；

图3为示例应用的任务参数，如图3所示任务参数包括Sw时间(任务在CPU上的执行时间)、Hw时间(任务在FPGA上的执行时间)和任务执行所需的FPGA中CLB资源的数量；

图4为采用图分割法进行软硬件划分与调度时构建的子图序列，如图4所示通过计算所有任务的sbl和stl优先级，按照降序排列得到任务的顺序列表，再通过相应计算将任务划分到各个子图，即把应用的DAG模型划分成G′₁和G′₂两个子图。按照划分顺序先对G′₁建立约束方程，应用MILP求解最优解。再将G′₁抽象成一个任务节点，对G′₂建立约束方程，应用MILP求解最优解，进而得到所有任务的调度结果；

图5为示例应用的调度结果，如图5所示，所有任务节点按照本发明提出的多阶段混合方法得到的调度结果部署到异构***的不同区域。圆形节点代表应用的任务节点n_i，包括任务开始时间、执行时间、结束时间三个属性；灰色方形节点代表重构节点，分别代表同一重构区域相邻两个任务之间的重构开始时间、重构消耗时间、重构结束时间三个属性。

综上所述，本发明提出的多阶段混合方法及基于任务优先级的图分割方法方法可有效的降低了问题的复杂度，显著缩短了求解时间，在针对大中型规模应用时有较好的性能，可以显著提高可重构片上***的软硬件划分效率，减少开发者的开发时间。

Claims

1.一种基于图分割的低复杂度软硬件划分与调度方法，通过多阶段混合机制，将一个应用划分成若干个子图，利用MILP方法求解子图的划分与调度的最优解，其特征在于，所述多阶段混合机制是将一个应用的划分与调度问题划分成若干个子问题，再进行逐步求解，求解时把前一个子问题的部分划分和调度结果作为后一个问题的输入，利用图分割法将应用的有向无环图DAG模型划分成若干个子图，后一个子图包含前一个子图，从而获得一个子图序列，子图序列中的各子图对应一个划分与调度的子问题，这些子问题通过MILP进行求解，

所述子图划分，采用基于优先级的图分割方法，即将应用的任务先按照优先级进行排序，将应用的任务划分到子图序列中的某个子图；

具体步骤如下：

第1步 ***平台与MILP建模

1.1平台模型

把FPGA划分成静态区域和一系列动态区域，

PR＝{PR₁,PR₂,...,PR_|PR|} (1)

H＝{h₁,h₂,...,h_|H|} (2)

其中PR_i表示第i个可重构区域，h_i表示FPGA的某种硬件资源，

1.2应用模型

将应用建模为有向无环图DAG，一个DAG由V,E两部分组成，表示为G(V,E)，其中V表示组成应用的一系列子任务，E表示相邻两个任务之间依赖关系边的集合，

1.3资源约束与MILP建模

软硬件的划分问题即任务映射到不同的计算处理单元，任务映射时要满足约束条件：任务在CPU上应顺序执行、同一个重构区域任务执行和重构不能同时进行、重构时任务应在重构之后执行、重构端口不能同时重构多个任务、任务执行所需的资源量应小于或等于可重构区的资源数量、所有可重构区的资源量总和应小于FPGA提供的资源总量；

根据上述约束条件，通过设置变量，建立约束方程，将实际问题抽象建模成混合整数线性规划MILP模型，对其求解最优解；

第2步多步混合的软硬件划分与调度方法

2.1算法结构

采用低复杂度的多步混合方法来进行软硬件的划分和调度，利用图分割法将应用的DAG模型划分成若干子图，再对每个子图模型应用MILP进行最优解的求解，图分割法即按照任务优先级，把应用的DAG模型划分成若干个包含任务节点的有序子图，其中顺序在后的子图包含顺序在前的子图，并且，将前一个子图的部分结果作为后一个子图的输入；

2.2基于优先级的图分割方法

在对应用的DAG模型进行划分时应用基于静态底层sbl和静态顶层stl两种优先级的图分割法，sbl表示在不考虑通信消耗的前提下，某任务到最后一个任务结束的最大路径长度，当一个任务的sbl较大时，表明它可能有多个直接或者间接目的任务，在对应用DAG模型进行划分时应让其划分顺序在前，对于两个任务a和b，如果sbl_a＞sbl_b则a和b是不相关的或者b是a的直接或间接目的任务；

stl表示从最初的源任务到某任务的最大路径长度，当一个任务的stl较大时，表明它可能有多个间接源任务。

2.根据权利要求1所述的一种基于图分割的低复杂度软硬件划分与调度方法，其特征在于，利用多步混合方法进行软硬件划分的步骤如下：

步骤1：将应用划分成一系列有序的DAG子图G′＝{G′₁,G′₂,…,G′_|G′|}同时满足以下两个条件：

(1)

(2)

因为G′_i+1在G′_i之后进行调度，为了在划分DAG时将G′_i的部分调度结果作为G′_i+1的输入来降低复杂度，必须满足条件

第二个条件表示从G′_j到G′_i没有通信边即G′_i在G′_j前完成调度；

作为其输入信息，DAG的第一个子图G′₁没有输入信息；

其中

包含以下信息：

(1)G′_i-1中所有任务的映射信息；

(2)G′_i-1中所有任务在每一个独立计算处理设备上的执行和重构顺序；

(3)各任务相应的目的任务和源任务的执行设备标识d_e；

步骤3：对最后一个子图G′_|G'|进行调度，得到初始问题的最优解。

3.根据权利要求1所述的一种基于图分割的低复杂度软硬件划分与调度方法，其特征在于，基于优先级的图分割法有两个输入，一个是DAG，另一个是DAG子图中任务的最大数量m，m的值该根据MILP的求解时间来设置，m的值越大时间复杂度越高，基于优先级的图分割法具体步骤如下：

步骤1：计算DAG模型中各个任务节点的sbl；

步骤2：计算DAG模型中各个任务节点的stl；

步骤3：将DAG模型中的任务按照sbl递减的顺序排列，若sbl相同则按照stl递减的顺序排列，得到任务的顺序列表V'＝v′₁,v'₂,...,v′_|V'|；

步骤5：对于每一个子图G′_i，将G′_i-1划分到G′_i中，假定

按照上述基于优先级的任务划分方法满足DAG模型划分的两个限制条件，对于每一个DAG子图G′_i，其包含的任务和通信边属于G′_i+1，满足条件1的限制要求；另外DAG模型中的任务根据sbl和stl进行排序，没有通信边从后一个任务指向前一个任务，同时，优先级较高的任务被划分到顺序在前的DAG子图，满足条件2的限制要求。