CN113448736B

CN113448736B - 一种近似计算任务在多核异构处理平台上基于能量和QoS联合优化的任务映射方法

Info

Publication number: CN113448736B
Application number: CN202110827931.9A
Authority: CN
Inventors: 莫磊; 李昕镁; 周琦; 曹向辉
Original assignee: Southeast University
Current assignee: Southeast University
Priority date: 2021-07-22
Filing date: 2021-07-22
Publication date: 2024-03-19
Anticipated expiration: 2041-07-22
Also published as: CN113448736A

Abstract

本发明公开了一种近似计算任务在多核异构平台上基于能量和任务服务质量(QoS)联合优化映射方法，包括以下步骤：将具有相关性的实时任务建模为非精确计算任务模型，由此得到任务有向无环图和任务相关性矩阵；基于big.LITTLE多核异构处理平台，通过任务迁移，使得同个任务可在不同集群的处理器上执行，以提高任务分配和动态电压/频率调整的灵活性；通过引入任务分配、频率选择、实时性、任务非抢占性、任务相关性和能量消耗约束，构造了基于QoS和能量联合优化的任务映射问题；使用变量替代方法处理问题中的非线性项，将该任务映射问题线性化，以求得最优解；显著降低了问题求解的时间，提高了本任务映射方法的适用性。

Description

一种近似计算任务在多核异构处理平台上基于能量和QoS联合优化的任务映射方法

技术领域

本发明属于多核处理器任务调度领域，涉及一种基于能量和QoS联合优化的任务映射方法。

背景技术

嵌入式实时***被广泛地应用于网络服务器、信息检索、工业过程控制、飞行控制以及多媒体***等领域。实时***要求在规定的时限内产生结果，并且保证计算结果的准确性。如果***未能在截止时间前完成任务，可能会导致***故障，降低***的可靠性。传统的调度算法通常考虑任务的最坏执行情况，这样的调度方法会降低处理器的执行效率，浪费***资源。在任务调度过程中，引入近似计算，能够平衡***的能耗和计算结果的精度，提高***利用率和可靠性。因此，在资源受限的情况下，研究近似计算任务在多核异构处理平台上的优化调度问题具有重要的现实意义。

对于实时***，研究者一般使用动态电压和频率调节技术和动态功耗管理技术来优化***功耗。目前，在异构多核处理器的任务调度研究中，已经取得了很多的研究成果，但还存在以下问题：1)基于能量优化的任务调度方法中，任务的执行周期是固定的，在调度过程中***的资源利用率较低，同时***QoS固定，不能通过任务调整来提高***QoS；2)基于QoS优化的任务调度研究一般考虑近似计算任务模型，旨在能量受限的情况下最大化***QoS，但很少考虑任务迁移的情况；3)针对异构多核处理器，基于QoS和能量的联合优化任务映射问题具有较高的计算复杂度。

发明内容

本发明提出了一种近似计算任务在多核异构处理平台上基于能量和QoS联合优化的任务映射方法，在满足***实时性、能效性、可靠性的基础上，引入任务迁移技术，进一步提高***的QoS。

为实现本发明的目的，本发明所采用的技术方案是：一种近似计算任务在多核异构处理平台上基于能量和QoS联合优化的任务映射方法，该方法包括如下步骤：

(1)将具有相关性的实时任务建模为非精确计算任务模型，由此得到任务有向无环图和任务相关性矩阵；

(2)基于big.LITTLE多核异构平台，通过任务迁移，使得同一任务可在不同集群的处理器上执行，以提高任务分配和动态电压和频率调整的灵活性；

(3)通过构造任务分配、频率选择、实时性、任务非抢占性、任务相关性和能量消耗约束，提出了基于QoS和能量联合优化的任务映射问题；

(4)使用变量替代方法处理问题中的非线性项，将(3)中提出的任务映射问题转换为混合整型线性规划问题，并使用最优化方法求解；

(5)针对(3)中提出的问题，利用问题分解的方法，设计了一种低计算复杂度的启发式算法，显著降低了问题求解的时间，提高了本任务映射方法的适用性。

进一步的，步骤(1)中，可以将可用N个具有相关性的非精确计算(ImpreciseComputation,IC)任务{τ₁,τ₂,…,τ_N}来描述实时***的任务模型，由此可以得到任务的有向无环图。对于任务τ_i，IC任务在逻辑上被分为强制执行部分和可选执行部分。M_i表示任务τ_i的强制执行周期，变量o_i表示可选执行周期，D_i表示任务的截止时间。可选执行周期o_i不应该超过上界O_i，即0≤o_i≤O_i。对于近似计算任务的调度，任务的强制执行部分和可选执行部分之间有着严格的执行顺序约束：必须在完成强制部分任务之后，才能执行可选部分任务。任务的相关性可用一个二进制矩阵q＝[q_ij]_M×M来描述。q_ij表示任务之间的执行顺序；如果任务τ_i与任务τ_j相关且任务τ_i在任务τ_j之前执行，则q_ij＝1，否则，q_ij＝0。

进一步的，步骤(2)中，big.LITTLE异构处理平台存在big和LITTLE两种不同类型的集群，其中同一集群中的处理器是同构的。该平台支持动态电压和频率调节技术，考虑big和LITTLE集群中对应处理器的电压和频率等级分别表示为和由于集群间处理器的异构性，γ_i,k∈(0,1]被定义为处理器θ_k执行任务τ_i的执行能效因子。big.LITTLE支持任务迁移技术，因此同一个任务在执行过程中，可由一个集群上的处理器迁移到另一个集群的处理器上执行。根据任务迁移技术，能够将步骤(1)中的IC任务τ_i分解成两个具有相关性的子任务τ_2i-1 ^′和τ_2i ^′，由此得到新的任务相关性矩阵。子任务τ_2i-1 ^′和τ_2i ^′可在不同集群的处理器上执行，任务迁移的具体实施过程，在后面的步骤中详细给出。通过归一化处理，μ_i∈[0,1]表示子任务τ_i ^′在一个处理器上执行的比例。对于任务τ_i，子任务τ_2i-1 ^′和τ_2i ^′的执行比例之和等于1，即μ_2i-1+μ_2i＝1。

进一步的，步骤(3)中，引入任务分配、频率选择、实时性、任务调度等优化变量：1)如果子任务τ_i ^′被分配到处理器θ_k上执行，则二进制变量x_i,k＝1，否则x_i,k＝0；2)如果子任务τ_i ^′以电压和频率等级l执行，则二进制变量c_i,l＝1，否则c_i,l＝0；3)如果任意两个不具有相关性的子任务τ_i ^′和τ_j ^′被分配到同一个处理器，τ_i ^′在τ_j ^′前执行，则二进制变量p_i,j＝1，否则p_i,j＝0；4)连续变量ts_i和te_i表示子任务τ_i ^′的执行起始时间和结束时间。为了描述一种近似计算任务在多核异构处理平台上基于能量和QoS联合优化的任务映射方法，需增加以下约束条件：

1)任务分配：根据任务迁移技术，同个任务可在不同集群的处理器上执行。由于同一集群中的处理器是同构的，本发明不考虑任务在同构处理器之间的迁移情况。因此在任务分配方面加入以下约束：

2)频率选择：本发明考虑的是任务内动态电压和频率调节技术，处理器在子任务执行完成后，可以调节电压和频率等级，而每一个子任务只能被分配一个电压和频率等级。big和LITTLE集群中的处理器是异构的，其电压和频率等级不同，所以需要根据任务分配结果确定处理器的电压和频率等级选择范围。λ_i表示子任务τ_i ^′在big(或是LITTLE)集群上执行的情况。如果子任务τ_i ^′在big集群上执行，则二进制变量λ_i＝1，否则λ_i＝0。因此在任务的频率选择方面需要加入如下约束：

3)实时性：对于实时性约束，任务τ_i的强制部分M_i和可选部分o_i必须在截止时间D_i内完成，而子任务τ^′ _2i需要在子任务τ^′ _2i-1完成后才开始执行。处理器θ_k以电压和频率等级(V_l,f_l)执行子任务τ_2i-1 ^′所用的时间为μ_2i-1(M_i+o_i)/(γ_2i-1,kf_l)。为了不引入额外的下标k，使用参数γ_i,l替换γ_i,k。γ_i,l表示以(V_l,f_l)执行子任务τ_i ^′的能效因子。因此在实时性方面需要加入以下约束：

4)非抢占性约束：本发明考虑的是非抢占式调度方法，即被分配到同一处理器上的任意两个不具有相关性的子任务不能被同时执行，其约束条件为：

te_i≤ts_j+(2-x_i,k-x_j,k)H+(1-p_i,j)H#(8)

te_j≤ts_i+(2-x_i,k-x_j,k)H+p_i,jH#(9)

5)任务相关性约束：本发明考虑的是具有相关性的任务集，任务根据有向无环图中的顺序严格执行，其约束条件为：

6)能量约束：本发明不考虑任务通信的能耗和时间，只考虑处理器的动态功耗和静态功耗，其中P_on表示保持内核开启的固有功耗，在任务映射过程中，***总能耗不能超过能量预算E_buget，因此在能量方面需要加入以下约束：

其中，t_i表示处理器处于空闲状态的时间。根据***功耗表达式P_core,l＝P_sta,l+

P_dyn,l+P_on，可以将约束(11)进行如下转换：

该任务映射问题以QoS优化作为目标函数，而QoS与可选执行周期o_i相关。本发明使用线性QoS函数f_i(o_i)＝k_io_i+R_i，其中R_i表示执行强制部分任务后的基线QoS。根据问题模型，可建立基于QoS和能量联合优化的任务映射优化问题：

进一步的，步骤(4)中，对步骤(3)中建立的问题模型进行线性化处理。在问题模型PP中，存在连续变量相乘、整型变量相乘的非线性项，因此优化问题(13)是一个混合整型非线性规划问题。步骤(4)通过变量替换等线性化方式将问题(13)等价地转换为混合整型线性规划问题，其过程为：

(5.1)由于公式(5)和(12)中存在连续变量相乘的非线性项(M_i+o_i)μ_2i-1和(M_i+o_i)μ_2i，根据实际的物理意义，引入辅助变量和/>去替代非线性项。/>和/>表示子任务τ^′ _2i-1和τ^′ _2i的实际执行周期，可以得到如下关系：

和/>

big.LITTLE平台提供离散的电压和频率(V_l,f_l)，当电压和频率等级l固定时，其相应的参数P_sta,l、P_dyn,l和1/f_l也可以被确定。因此，在公式(5)和(12)中，分别使用P_l ^′、f₂ ^′ _i-1和f₂ ^′ _i代替P_sta,l+P_dyn,l、1/γ_2i-1,lf_l和1/γ_2i,lf_l。

(5.2)通过(5.1)进行变量替换，公式(5)和(12)中出现非线性项和为了将其线性化，首先引入如下引理：

引理1：假设常数s₁,s₂>0，存在两个约束空间P₁＝{[t,b,x]|t＝bx,-s₁≤x≤s₂,b∈{0,1}}和P₂＝{[t,b,x]|-b·s₁≤t≤b·s₂,t+b·s₁-x-s₁≤0,t-b·s₂-x+s₂≥0,b∈{0,1}}，则有

证明：由于t＝bx和-s₁≤x≤s₂，我们可以得到-b·s₁≤t≤b·s₂。根据-s₁≤x≤s₂和b∈{0,1}，我们可以得到(b-1)(x-s₂)≥0和(b-1)(x+s₁)≤0。因此，t+b·s₁-x-s₁≤0和t-b·s₂-x+s₂≥0成立。

如果b＝0，我们有t＝0和-s₁≤x≤s₂；如果b＝1，我们可以得到-s₁≤t＝x≤s₂。因此，/>成立。

根据引理1，引入中间变量C_i,l去替代公式(5)和(12)中的非线性项当c_i,l＝1时，/>C_i,l有上界/>和下界/>当c_i,l＝0时，C_i,l＝0。对于该变量替换，需要添加以下约束条件：

根据引理1，公式(5)和(12)可以被线性化为

(5.3)由于公式(4)中存在整型变量相乘的非线性项λ_ic_i,l，λ_ic_i,l可以被表示为引入引理2对公式(4)进行线性化。

引理2：假设x₁和x₂是0-1变量。非线性项x₁x₂能够被转换为一个0-1变量y，其中变量y带有约束y≤x₁，y≤x₂和y≥x₁+x₂-1。

证明2：当0-1变量x₁和x₂都等于1时，上述约束可以被转换为y＝1。因此，y＝x₁x₂＝1成立。同样地，如果x₁＝0，x₂＝0，或者x₁＝0，x₂＝1，或者x₁＝1，x₂＝0，我们可以得到y＝x₁x₂＝0。因此，引理2成立。

基于引理2，对于非线性项引入中间变量z_i,k,l，并添加以下约束来替换非线性项x_i,kc_i,l：

z_i,k,l≤x_i,k,z_i,k,l≤c_i,l,z_i,k,l≥x_i,k+c_i,l-1,z_i,k,l∈{0,1}#(19)

公式(4)可转换为：

因此，问题(13)可线性化为：

进一步的，步骤(5)中，根据步骤(3)中优化问题结构，利用问题分解的方法，设计了一种低计算复杂度的启发式算法，以提高本映射方法的适用性。步骤(3)中的原任务映射问题可以分解为3个子问题：1)频率选择；2)任务分配与任务调度；3)可选执行周期调整。依次求解以上3个子问题，可以得到一个基于QoS优化的任务映射方案。具体步骤如下：

(6.1)确定频率选择优化变量c_i,l；

为了简化任务迁移模型，将原IC任务分解为两个子任务τ_2i-1 ^′和τ_2i ^′，其中子任务τ_2i-1 ^′表示原任务的强制执行部分，τ_2i ^′表示可选执行部分。为了减少问题求解的优化变量，子问题(6.1)只考虑执行任务的强制执行周期，即实际可选执行周期o_i＝0。在实时***中，***可以使用的能量E_buget是有限的，在保证强制部分任务被全部执行后，需要将剩余的能量尽可能多地用来执行任务的可选部分，以提高***的QoS。E_2i-1表示执行强制部分子任务τ^′ _2i-1所消耗的能量。因此，子问题(6.1)以最小化任务执行总能量作为目标函数。此外，还需要考虑实时性约束，该约束可以被简化为有向无环图中的关键路径上的子任务满足实时性约束。CPT表示关键路径上强制子任务序号的集合，将CPT中的子任务按照执行的先后顺序进行排序，得到排序后的子任务序号集合CPT^′，即CPT^′＝{2r₁-1,…,2r_n-1,…,2r_R-1}。因此，子问题(6.1)可以被表述为：

根据问题(22)的结构，采用贪婪算法来求解该问题。针对每个强制执行子任务，遍历所有的电压和频率等级，选择使***总能量增量最小的电压和频率等级，将此作为该子任务的频率选择方案。同时，在给定频率选择方案的情况下，判断有向无环图的关键路径上的子任务是否满足实时性约束，如果不满足实时性约束，则排除这种频率选择方案。在任务集中迭代上述频率选择算法，最终可以得到问题(22)的解。

(6.2)基于(6.1)的结果确定任务分配优化变量x_i,k和任务执行起始时间ts_i；

根据频率选择方案，可以确定每个强制执行子任务的执行时间和执行时所在的集群。TB和TL分别表示在big和LITTLE集群中执行的强制子任务集合。为了避免子任务被分配到少数几个处理器上执行的情况，需要均衡每个处理器执行任务的时间。因此，子问题(6.2)以最小化处理器的任务执行总时间作为目标函数，而约束条件包括任务的非抢占性约束和相关性约束。tp_k表示处理器θ_k上执行所有强制子任务的总时间。子问题(6.2)可以被表述为：

问题(23)需要同时求解任务分配优化变量x_i,k和任务执行起始时间ts_i，根据该问题的结构，使用贪婪算法求解，该求解方法分为3个步骤。

第一步，确定贪婪算法中子任务的遍历顺序，即将任务的相关性和任务执行时间转换为有向无环图中任务的分层树状关系，而每一层中的任务是相互独立的。具体的分层规则为：如果从入口节点到任务τ_i的最长逻辑路径由n条边组成，则该τ_i等级为n；如果任务τ_i为入口节点，则等级为0。任务的分层等级越低，任务的执行顺序越靠前。

具体方法为：

(1)在有向无环图中，寻找入口子任务，构成等级为0的分层任务集RT₀；

(2)循环RT₀中的子任务，通过递归的方法依次确定每个的后继任务等级，并由此更新已经确定的子任务等级；

(3)按照分层等级由小到大将子任务排序，对于同一等级的子任务按照执行时间由小到大排列。

第二步，利用贪婪算法确定任务分配优化变量x_i,k。使用第一步中的任务等级分层方法将子任务进行排序，从而确定贪婪算法中子任务遍历的顺序。根据(6.1)得到的子任务频率等级可以确定任务分配的处理器选择范围。根据贪婪算法，按照任务的分层顺序，依次将子任务循环遍历分配到候选的处理器上执行，选择处理器结束执行时间最大的分配情况作为任务分配方案，由此可以确定任务分配优化变量x_i,k和子任务执行起始时间ts_i。

第三步，验证得到的频率选择和任务分配方案是否满足***的实时性约束。如果出现违反实时性约束的方案，则需要重新进行频率选择。具体方法为：

(1)验证(6.1)和(6.2)得到的任务映射方案是否满足实时性要求，如果不满足实时性约束，记录下该方案中不满足约束的子任务τ^′ _m的序号；

(2)在满足能量约束的条件下，可以将τ^′ _m以及τ^′ _m的前驱子任务的电压和频率等级提高一级，将τ^′ _m的后继子任务的电压和频率等级降低一级，电压和频率等级调整次数加1；

(3)根据(6.2)重新确定任务分配方案，再次验证方案是否满足实时性约束，如果仍不满足，重复(2)中的方法，直至调整次数达到任务数量，停止调整，任务映射失败。

(6.3)确定可选执行周期o_i；

根据(6.1)和(6.2)的结果，可以得到强制执行子任务的任务映射方案，由此可得***剩余的总能量E_optl以及每个处理器上的空闲时间段Δt。TC_l表示以电压和频率(V_l,f_l)执行单位周期所用的时间；EC_l表示以电压和频率(V_l,f_l)执行单位周期所消耗的能量。根据贪婪算法的思想，在时间和能量受限情况下，需要尽可能多的执行可选子任务，即确定空闲时间段能够执行的最大可选周期，以提高***QoS。具体方法为：

(1)将处理器按照第一个空闲时间段的起始时间从小到大进行排序，并根据任务分层等级确定该空闲时间段中能够执行的子任务候选集Temp；

(2)遍历该空闲时间段内能够被分配的所有电压和频率等级，从而确定该时间段的最大可选执行周期

(3)按照分层等级给Temp中的可选子任务分配实际执行周期，并确定可选子任务的起始执行时间。返回(1)，循环执行上述步骤，直至***剩余的总能量E_optl等于0(或者全部可选子任务被执行)。

基于上述问题，能够求解频率选择优化变量c_i,l、任务分配优化变量x_i,k、任务执行起始时间ts_i和可选执行周期o_i，从而得到一个基于QoS优化的任务映射方案。

有益效果：与现有技术相比，本发明的技术方案具有以下有益效果：1)本发明提供了一种有关近似计算任务在big.LITTLE多核异构平台上，基于QoS和能量联合优化的任务映射方法，能够明显提高***QoS。在资源受限的情况下，本发明提出的任务映射方法对实例1中随机生成的14个任务集进行调度，其***QoS平均提升了31.2％(最高能够提升112.8％)。2)原任务映射问题中存在连续变量与整型变量的耦合项等非线性项，该问题结构复杂，无法在短时间内求得最优解。针对原任务映射问题的结构，以牺牲求解精度为代价，本发明提供了一种低计算复杂度的启发式贪婪算法，能够显著降低算法的运行时间。以实例2中随机生成的任务集为例，与最优化方法相比(平均求解时间约为38s)，本发明提出的启发式贪婪算法能够在可忽略的时间内(大约为0.04s)得到一个问题的次优解。

附图说明

图1是本发明提出的基于能量和QoS联合优化的任务映射方法的示意图；

图2是本发明实施例使用的任务有向无环图和引入任务迁移后扩展得到的任务图；

图3是本发明实例1配置任务数量为8，在big.LITTLE平台(big和LITTLE集群分别包含4个处理器)使用基于QoS和能量联合优化方法得到的任务映射结果示意图，其中τ^′ ₁-τ^′ ₁₆为任务图扩展后的子任务；

图4是本发明实例1配置任务数量为8，在big.LITTLE平台(big和LITTLE集群分别包含4个处理器)使用启发式贪婪方法得到的任务映射结果示意图，其中τ^′ ₁-τ^′ ₁₆为任务图扩展后的子任务；

图5是本发明实例2配置任务数量为5至18，对应随机生成的14个任务集，在任务映射中引入任务迁移和不采用任务迁移时求最优解得到的***QoS对比图；

图6是本发明实例2配置任务数量为5至15，对应随机生成的11个任务集，在任务映射中不采用任务迁移求最优解时任务调度失败比例图(ω＝不采用任务迁移的调度失败次数/采用任务迁移的调度成功总次数)；

图7是本发明实例2配置任务数量为5至8，对应随机生成的4个任务集，调整能量因子β(β取值范围为[0,0.5])和时间调节因子δ(δ取值范围为[0.4,1])，在任务映射中引入任务迁移时求最优解得到的***QoS对比图；

图8是本发明实例2配置任务数量为5至8，对应随机生成的4个任务集，调整任务有向无环图并行性因子η，在任务映射中引入任务迁移时求最优解得到的***QoS增量对比图；

图9是本发明实例2配置任务数量为5至8，对应随机生成的4个任务集，调整处理器异构性比例因子γ_L/γ_b(γ_L/γ_b取值范围为[0.5,1])，在任务映射中引入任务迁移时求最优解得到的***QoS增量对比图；

图10是本发明实例2配置任务数量为5至18，对应随机生成的14个任务集，能量因子β＝0.4，时间调节因子δ＝0.4，big集群异构性因子γ_b＝1，LITTLE集群异构性因子γ_L＝0.6时，使用求最优解和提出的启发式算法在QoS增量方面的对比图；

图11是本发明实例2配置任务数量为5至15时，使用求最优解和提出的启发式算法在算法运行时间方面的对比图。

具体实施方式

以下将结合附图及实施例来详细说明本发明的实施方式，借此对本发明如何应用技术手段来解决技术问题，并达成技术效果的实现过程能充分理解并据以实施。需要说明的是，只要不构成冲突，本发明中的各个实施例以及各实施例中的各个特征可以相互结合，所形成的技术方案均在本发明的保护范围之内。

实施例1：一种近似计算任务在多核异构处理平台上基于能量和QoS联合优化的任务映射方法，包括如下步骤：

(1)将具有相关性的实时任务建模为非精确计算任务，由此得到任务有向无环图和任务相关性矩阵；

(3)通过引入任务分配、频率选择、实时性、任务非抢占性、任务相关性和能量消耗约束，构造了基于QoS和能量联合优化的任务映射问题；

图1是本发明提出的基于能量和QoS联合优化的任务映射方法的示意图，图2为本发明实施例使用的任务有向无环图和引入任务迁移后扩展得到的任务图，下面参照图1和图2中的任务映射方法和任务有向无环图示例，详细说明各个步骤。

步骤(1)，可以将可用N个具有相关性的非精确计算(Imprecise Computation,IC)任务{τ₁,τ₂,…,τ_N}来描述实时***的任务模型，由此可以得到任务的有向无环图。对于任务τ_i，IC任务在逻辑上被分为强制执行部分和可选执行部分。M_i表示任务τ_i的强制执行周期，变量o_i表示可选执行周期，D_i表示任务的截止时间。可选执行周期o_i不应该超过上界O_i，即0≤o_i≤O_i。对于近似计算任务的调度，任务的强制执行部分和可选执行部分之间有着严格的执行顺序约束：必须在完成强制部分任务之后，才能执行可选部分任务。任务的相关性可用一个二进制矩阵q＝[q_ij]_M×M来描述。q_ij表示任务之间的执行顺序；如果任务τ_i与任务τ_j相关且任务τ_i在任务τ_j之前执行，则q_ij＝1，否则，q_ij＝0。

步骤(2)，big.LITTLE异构处理平台存在big和LITTLE两种不同类型的集群，其中同一集群中的处理器是同构的。该平台支持动态电压和频率调整技术，考虑big集群电压和频率等级为LITTLE集群为/>由于集群间处理器的异构性，γ_i,k∈(0,1]被定义为处理器θ_k执行任务τ_i的执行能效因子。big.LITTLE支持任务迁移技术，因此同一个任务在执行过程中，可由一个集群上的处理器迁移到另一个集群的处理器上执行。根据任务迁移技术，能够将步骤(1)中的IC任务τ_i分解成两个具有相关性的子任务τ_2i-1 ^′和τ_2i ^′，由此得到新的任务相关性矩阵。子任务τ_2i-1 ^′和τ_2i ^′可在不同集群的处理器上执行，任务迁移的具体实施过程，在后面的步骤中详细给出通过归一化处理，μ_i∈[0,1]表示子任务τ_i ^′在一个处理器上执行的比例。对于任务τ_i，子任务τ_2i-1 ^′和τ_2i ^′的执行比例之和等于1，即μ_2i-1+μ_2i＝1。

步骤(3)，引入任务分配、频率选择、实时性、任务调度等优化变量：1)如果子任务τ_i ^′被分配到处理器θ_k上执行，则二进制变量x_i,k＝1，否则x_i,k＝0；2)如果子任务τ_i ^′以电压和频率等级l执行，则二进制变量c_i,l＝1，否则c_i,l＝0；3)如果任意两个不具有相关性的子任务τ_i ^′和τ_j ^′被分配到同一个处理器，τ_i ^′在τ_j ^′前执行，则二进制变量p_i,j＝1，否则p_i,j＝0；4)连续变量ts_i和te_i表示子任务τ_i ^′的执行起始时间和结束时间。为了描述一种近似计算任务在多核异构处理平台上基于能量和QoS联合优化的任务映射方法，需增加以下约束条件：

3)实时性：对于实时性约束，任务τ_i的强制部分M_i和可选部分o_i必须在截止时间D_i内完成，而子任务τ^′ _2i需要在子任务τ^′ _2i-1完成后才开始执行。处理器θ_k以电压和频率等级(V_l,f_l)执行子任务τ_2i-1 ^′所用的时间为μ_2i-1(M_i+o_i)/(γ_2i-1,kf_l)。为了不引入额外的下标k，使用参数γ_i,k替换为γ_i,l。γ_i,l表示以(V_l,f_l)执行子任务τ_i ^′的能效因子。因此在实时性方面需要加入以下约束：

4)非抢占性约束：本发明考虑的是非抢占式(Non-preemtive)调度方法，即被分配到同一处理器上的任意两个不具有相关性的子任务不能被同时执行，其约束条件为：

te_i≤ts_j+(2-x_i,k-x_j,k)H+(1-p_i,j)H#(8)

te_j≤ts_i+(2-x_i,k-x_j,k)H+p_i,jH#(9)

6)能量约束：本发明不考虑任务通信的能耗和时间，只考虑处理器的动态功耗和静态功耗，其中P_on表示保持内核开启的固有功耗。在任务映射过程中，***总能耗不能超过能量预算E_buget，因此在能量方面需要加入以下约束：

P_dyn,l+P_on，可以将约束(11)进行如下转换：

步骤(4)，对步骤(3)中建立的问题模型进行线性化处理。在问题模型PP中，存在连续变量相乘、整型变量相乘的非线性项，因此优化问题(13)是一个混合整型非线性规划问题。步骤(4)通过变量替换等线性化方式将问题(13)等价地转换为混合整型线性规划问题，其过程为：

和/>

根据引理1，公式(5)和(12)可以被线性化为

z_i,k,l≤x_i,k,z_i,k,l≤c_i,l,z_i,k,l≥x_i,k+c_i,l-1,z_i,k,l∈{0,1}#(19)

公式(4)可转换为：

因此，问题(13)可线性化为：

/>

步骤(5)，根据步骤(3)中优化问题结构，利用问题分解的方法，设计了一种低计算复杂度的启发式算法，以提高本映射方法的适用性。步骤(3)中的原任务映射问题可以分解为3个子问题：1)频率选择；2)任务分配与任务调度；3)可选执行周期调整。依次求解以上3个子问题，可以得到一个基于QoS优化的任务映射方案。具体步骤如下：

(6.1)确定频率选择优化变量c_i,l；

为了简化任务迁移模型，将原IC任务分解为两个子任务τ_2i-1 ^′和τ_2i ^′，其中子任务τ_2i-1 ^′表示原任务的强制执行部分，τ_2i ^′表示可选执行部分。为了减少问题求解的优化变量，子问题(6.1)只考虑执行任务的强制执行周期，即实际可选执行周期o_i＝0。在实时***中，***可以使用的能量E_buget是有限的，在保证强制部分任务被全部执行后，需要将剩余的能量尽可能多地用来执行任务的可选部分，以提高***的QoS。E_2i-1表示执行强制部分子任务τ^′ _2i-1所消耗的能量。因此，子问题(6.1)以最小化任务执行总能量作为目标函数。此外，还需要考虑实时性约束，该约束可以被简化为有向无环图中的关键路径上的子任务满足实时性约束，CPT表示关键路径上强制子任务序号的集合，将CPT中的子任务按照执行的先后顺序进行排序，得到排序后的子任务序号集合CPT^′，即CPT^′＝{2r₁-1,…,2r_n-1,…,2r_R-1}。因此，子问题(6.1)可以被表述为：

具体方法为：

第三步，验证得到的频率选择和任务分配方案是否满足***的实时性约束。如果出现不满足实时性约束的方案，则需要重新进行频率选择。具体方法为：

(1)验证(6.1)和(6.2)得到的任务映射方案是否满足实时性要求，如果不满足实时性约束，记录下该方案中违反约束的子任务τ^′ _m的序号；

(6.3)确定可选执行周期o_i；

实施例2：

图5至图11为本发明的实验结果图。

图5是本发明实例2配置任务数量为5至18，对应随机生成的14个任务集，在任务映射中引入任务迁移和不采用任务迁移时求最优解得到的***QoS对比图。由图可知，在任务映射中引入任务迁移能够明显提升***的QoS。

图6是本发明实例2配置任务数量为5至15，对应随机生成的11个任务集，在任务映射中不采用任务迁移求最优解时任务调度失败比例图(ω＝不采用任务迁移的调度失败次数/采用任务迁移的调度成功总次数)。随着任务集规模增大，不采用任务迁移求最优解时，任务调度失败的比例明显上升。由此可见，引入任务迁移，能够在一定程度上增加调度成功的比例。

图7是本发明实例2配置任务数量为5至8，对应随机生成的4个任务集，调整能量因子β(β取值范围为[0,0.5])和时间调节因子δ(δ取值范围为[0.4,1])，在任务映射中引入任务迁移时求最优解得到的***QoS对比图。由图可知，当能量因子β和时间调节因子δ较小(资源受限)时，采用引入任务迁移的任务映射方法，提升***QoS的效果越好。

图8是本发明实例2配置任务数量为5至8，对应随机生成的4个任务集，调整任务有向无环图并行性因子η，在任务映射中引入任务迁移时求最优解得到的***QoS增量对比图。由图可知，DAG任务图的并行性越低，引入任务迁移的调度方案得到的***QoS增量越大。

图9是本发明实例2配置任务数量为5至8，对应随机生成的4个任务集，调整处理器异构性比例因子γ_L/γ_b(γ_L/γ_b取值范围为[0.5,1])，在任务映射中引入任务迁移时求最优解得到的***QoS增量对比图。由图可知，当γ_L/γ_b的取值较小，即big和LITTLE集群中处理器的性能差距较为明显时，引入任务迁移的调度方案对***QoS的提升更有利。

图10是本发明实例2配置任务数量为5至18，对应随机生成的14个任务集，能量因子β＝0.4，时间调节因子δ＝0.4，big集群异构性因子γ_b＝1，LITTLE集群异构性因子γ_L＝0.6时，使用求最优解和提出的启发式算法在QoS增量方面的对比图。由图可知，在任务映射中引入任务迁移后，使用求最优解方法得到的映射方案能够显著提升***QoS，而启发式算法能够得到一个***QoS的次优解。

图11是本发明实例2配置任务数量为5至15时，使用求最优解和提出的启发式算法在算法运行时间方面的对比图。结合图10可知，启发式算法以牺牲***QoS为代价，显著提升了任务调度算法的运行速度。

虽然本发明所揭露的实施方式如上，但所述的内容只是为了便于理解本发明而采用的实施方式，并非用以限定本发明。任何本发明所属技术领域内的技术人员，在不脱离本发明所揭露的精神和范围的前提下，可以在实施的形式上及细节上作任何的修改与变化，但本发明的专利保护范围，仍须以所附的权利要求书所界定的范围为准。

Claims

1.一种近似计算任务在多核异构处理平台上基于能量和QoS联合优化的任务映射方法，其特征在于，包括如下步骤：

(5)针对(3)中提出的问题，利用问题分解的方法，设计了一种低计算复杂度的启发式算法；

其中，步骤(1)中，将可用N个具有相关性的非精确计算(Imprecise Computation，IC)任务{τ₁，τ₂，…，τ_N}来描述实时***的任务模型，由此得到任务的有向无环图，对于任务τ_i，IC任务在逻辑上被分为强制执行部分和可选执行部分，M_i表示任务τ_i的强制执行周期，变量o_i表示可选执行周期，D_i表示任务的截止时间，可选执行周期o_i不超过上界O_i，即0≤o_i≤O_i，对于近似计算任务的调度，任务的强制执行部分和可选执行部分之间有着严格的执行顺序约束：必须在完成强制部分任务之后，才能执行可选部分任务，任务的相关性可用一个二进制矩阵q＝[q_ij]_N×N来描述，q_ij表示任务之间的执行顺序；如果任务τ_i与任务τ_j相关且任务τ_i在任务τ_j之前执行，则q_ij＝1，否则，q_ij＝0；

步骤(2)中，big.LITTLE异构处理平台存在big和LITTLE两种不同类型的集群，其中同一集群中的处理器是同构的，该平台支持动态电压和频率调节技术，考虑big和LITTLE集群中对应处理器的电压和频率等级分别表示为和由于集群间处理器的异构性，γ_i，k∈(0，1]被定义为处理器θ_k执行任务τ_i的执行能效因子，big.LITTLE支持任务迁移技术，因此同一个任务在执行过程中，由一个集群上的处理器迁移到另一个集群的处理器上执行，根据任务迁移技术，能够将步骤(1)中的IC任务τ_i分解成两个具有相关性的子任务τ_2i-1′和τ_2i′，由此得到新的任务相关性矩阵，子任务τ_2i-1′和τ_2i′可在不同集群的处理器上执行，任务迁移的具体实施过程，在后面的步骤中详细给出，通过归一化处理，μ_i∈[0，1]表示子任务τ_i′在一个处理器上执行的比例，对于任务τ_i，子任务τ_2i-1′和τ_2i′的执行比例之和等于1，即μ_2i-1+μ_2i＝1；

步骤(3)中，引入任务分配、频率选择、实时性、任务调度等优化变量：1)如果子任务τ′_i被分配到处理器θ_k上执行，则二进制变量x_i，k＝1，否则x_i，k＝0；2)如果子任务τ′_i以电压和频率等级l执行，则二进制变量c_i，l＝1，否则c_i，l＝0；3)如果任意两个不具有相关性的子任务τ′_i和τ′_j被分配到同一个处理器，τ′_i在τ′_j前执行，则二进制变量p_i，j＝1，否则p_i，j＝0；4)连续变量ts_i和te_i表示子任务τ′_i的执行起始时间和结束时间，为了描述一种近似计算任务在多核异构处理平台上基于能量和QoS联合优化的任务映射方法，需增加以下约束条件：

1)任务分配：根据任务迁移技术，同个任务可在不同集群的处理器上执行，由于同一集群中的处理器是同构的，不考虑任务在同构处理器之间的迁移情况，因此在任务分配方面加入以下约束：

2)频率选择：考虑的是任务内动态电压和频率调节技术，处理器在子任务执行完成后，调节电压和频率等级，而每一个子任务只能被分配一个电压和频率等级，big和LITTLE集群中的处理器是异构的，其电压和频率等级不同，需要根据任务分配结果确定处理器的电压和频率等级选择范围，λ_i表示子任务τ_i′在big(或是LITTLE)集群上执行的情况，如果子任务τ_i′在big集群上执行，则二进制变量λ_i＝1，否则λ_i＝0，因此在任务的频率分配方面需要加入如下约束：

3)实时性：对于实时性约束，任务τ_i的强制部分M_i和可选部分o_i必须在截止时间D_i内完成，而子任务τ′_2i需要在子任务τ′_2i-1完成后才开始执行，处理器θ_k以电压和频率等级(V_l，f_l)执行子任务τ_2i-1′所用的时间为μ_2i-1(M_i+o_i)/(γ_2i-1，kf_l)，为了不引入额外的下标k，使用参数γ_i，l替换γ_i，k，γ_i，l表示以(V_l，f_l)执行子任务τ′_i的能效因子，在实时性方面需要加入以下约束：

4)非抢占性约束：考虑的是非抢占式调度方法，即被分配到同一处理器上的任意两个不具有相关性的子任务不能被同时执行，其约束条件为：

te_i≤ts_j+(2-x_i，k-x_j，k)H+(1-p_i，j)H#(8)

te_j≤ts_i+(2-x_i，k-x_j，k)H+p_i，jH#(9)

5)任务相关性约束：考虑的是具有相关性的任务集，任务根据有向无环图中的顺序严格执行，其约束条件为：

6)能量约束：不考虑任务通信的能耗和时间，只考虑处理器的动态功耗和静态功耗，其中P_on表示保持内核开启的固有功耗，在任务映射过程中，***总能耗不能超过能量预算E_buget，在能量方面加入以下约束：

其中，t_i表示处理器处于空闲状态的时间，根据***功耗表达式P_core，l＝P_sta，l+P_dyn，l+P_on，将约束(11)进行如下转换：

该任务映射问题以QoS优化作为目标函数，而QoS与可选执行周期o_i相关，使用线性QoS函数f_i(o_i)＝k_io_i+R_i，其中R_i表示执行强制部分任务后的基线QoS，根据问题模型，可建立基于QoS和能量联合优化的任务映射优化问题：

步骤(4)中，对步骤(3)中建立的问题模型进行线性化处理，在问题模型PP中，存在连续变量相乘、整型变量相乘的非线性项，优化问题(13)是一个混合整型非线性规划问题，步骤(4)通过变量替换等线性化方式将问题(13)等价地转换为混合整型线性规划问题，其过程为：

(5.1)由于公式(5)和(12)中存在连续变量相乘的非线性项(M_i+o_i)μ_2i-1和(M_i+o_i)μ_2i，根据实际的物理意义，引入辅助变量和/>去替代非线性项，/>和/>表示子任务τ′_2i-1和τ′_2i的实际执行周期，得到如下关系：

和/>

big.LITTLE平台提供离散的电压和频率(V_l，f_l)，当电压和频率等级l固定时，其相应的参数P_sta，l、P_dyn，l和1/f_l也被确定，因此，在公式(5)和(12)中，分别使用P′_l、f′_2i-1和f′_2i代替P_sta，l+P_dyn，l、1/γ_2i-1，lf_l和1/γ_2i，lf_l；

(5.2)通过(5.1)进行变量替换，公式(5)和(12)中出现非线性项和/>为了将其线性化，首先引入如下引理：

引理1：设常数s₁，s₂＞0，存在两个约束空间P₁＝{[t，b，x]|t＝bx，-s₁≤x≤s₂，b∈{0，1}}和P₂＝{[t，b，x]|-b·s₁≤t≤b·s₂，t+b·s₁-x-s₁≤0，t-b·s₂-x+s₂≥0，b∈{0，1}}，则有

证明：由于t＝bx和-s₁≤x≤s₂，得到-b·s₁≤t≤b·s₂，根据-s₁≤x≤s₂和b∈{0，1}，得到(b-1)(x-s₂)≥0和(b-1)(x+s₁)≤0；因此，t+b·s₁-x-s₁≤0和t-b·s₂-x+s₂≥0成立；

如果b＝0，有t＝0和-s₁≤x≤s₂；如果b＝1，得到-s₁≤t＝x≤s₂；因此，/>成立；

根据引理1，引入中间变量C_i，l去替代公式(5)和(12)中的非线性项当c_i，l＝1时，C_i，l有上界/>和下界/>当c_i，l＝0时，C_i，l＝0，对于该变量替换，需要添加以下约束条件：

根据引理1，公式(5)和(12)被线性化为

(5.3)由于公式(4)中存在整型变量相乘的非线性项λ_ic_i，l，λ_ic_i，l被表示为引入引理2对公式(4)进行线性化；

引理2：假设x₁和x₂是0-1变量，非线性项x₁x₂能够被转换为一个0-1变量y，其中变量y带有约束y≤x₁，y≤x₂和y≥x₁+x₂-1，

证明2：当0-1变量x₁和x₂都等于1时，上述约束被转换为y＝1，因此，y＝x₁x₂＝1成立，同样地，如果x₁＝0，x₂＝0，或者x₁＝0，x₂＝1，或者x₁＝1，x₂＝0，得到y＝x₁x₂＝0，因此，引理2成立；

基于引理2，对于非线性项引入中间变量z_i，k，l，并添加以下约束来替换非线性项x_i，kc_i，l：

z_i，k，l≤x_i，k，z_i，k，l≤c_i，l，z_i，k，l≥x_i，k+c_i，l-1，z_i，k，l∈{0，1}#(19)

公式(4)可转换为：

因此，问题(13)可线性化为：

在步骤(5)中，根据步骤(3)中优化问题结构，利用问题分解的方法，设计了一种低计算复杂度的启发式算法，以提高本映射方法的适用性，步骤(3)中的原任务映射问题分解为3个子问题：1)频率选择；2)任务分配与任务调度；3)可选执行周期调整，依次求解以上3个子问题，得到一个基于QoS优化的任务映射方案，具体步骤如下：

(6.1)确定频率分配优化变量c_i，l；

为了简化任务迁移模型，将原IC任务分解为两个子任务τ_2i-1′和τ_2i′，其中子任务τ_2i-1′表示原任务的强制执行部分，τ_2i′表示可选执行部分，为了减少问题求解的优化变量，子问题(6.1)只考虑执行任务的强制执行周期，即实际可选执行周期o_i＝0，在实时***中，***使用的能量E_buget是有限的，在保证强制部分任务被全部执行后，需要将剩余的能量尽可能多地用来执行任务的可选部分，以提高***的QoS，E_2i-1表示执行强制部分子任务τ′_2i-1所消耗的能量，因此，子问题(6.1)以最小化任务执行总能量作为目标函数，此外，还需要考虑实时性约束，该约束被简化为有向无环图中的关键路径上的子任务满足实时性约束，CPT表示关键路径上强制子任务序号的集合，将CPT中的子任务按照执行的先后顺序进行排序，得到排序后的子任务序号集合CPT′，即CPT′＝{2r₁-1，…，2r_n-1，…，2r_R-1}，因此，子问题(6.1)被表述为：

根据问题(22)的结构，采用贪婪算法来求解该问题，针对每个强制执行子任务，遍历所有的电压和频率等级，选择使***总能量增量最小的电压和频率等级，将此作为该子任务的频率分配方案，同时，在给定频率分配方案的情况下，判断有向无环图的关键路径上的子任务是否满足实时性约束，如果不满足实时性约束，则排除这种频率分配方案，在任务集中迭代上述频率分配算法，最终得到问题(22)的解；

(6.2)基于(6.1)的结果确定任务分配优化变量x_i，k和任务执行起始时间ts_i；

根据频率分配方案，确定每个强制执行子任务的执行时间和执行时所在的集群，TB和TL分别表示在big和LITTLE集群中执行的强制子任务集合，为了避免子任务被分配到少数几个处理器上执行的情况，需要均衡每个处理器执行任务的时间，因此，子问题(6.2)以最小化处理器的任务执行总时间作为目标函数，而约束条件包括任务的非抢占性约束和相关性约束，tp_k表示处理器θ_k上执行所有强制子任务的总时间，子问题(6.2)被表述为：

问题(23)需要同时求解任务分配优化变量x_i，k和任务执行起始时间ts_i，根据该问题的结构，使用贪婪算法求解，该求解方法分为3个步骤，

第一步，确定贪婪算法中子任务的遍历顺序，即将任务的相关性和任务执行时间转换为有向无环图中任务的分层树状关系，而每一层中的任务是相互独立的，具体的分层规则为：如果从入口节点到任务τ_i的最长逻辑路径由n条边组成，则该τ_i等级为n；如果任务τ_i为入口节点，则等级为0，任务的分层等级越低，任务的执行顺序越靠前，

具体方法为：

(3)按照分层等级由小到大将子任务排序，对于同一等级的子任务按照执行时间由小到大排列，

第二步，利用贪婪算法确定任务分配优化变量x_i，k，使用第一步中的任务等级分层方法将子任务进行排序，从而确定贪婪算法中子任务遍历的顺序，根据(6.1)得到的子任务频率等级确定任务分配的处理器选择范围，根据贪婪算法，按照任务的分层顺序，依次将子任务循环遍历分配到候选的处理器上执行，选择处理器结束执行时间最大的分配情况作为任务分配方案，由此确定任务分配优化变量x_i，k和子任务执行起始时间ts_i，

第三步，验证得到的频率分配和任务分配方案是否满足***的实时性约束，如果出现违反实时性约束的方案，则需要重新进行频率分配，具体方法为：

(1)验证(6.1)和(6.2)得到的任务映射方案是否满足实时性要求，如果不满足实时性约束，记录下该方案中不满足约束的子任务τ′_m的序号；

(2)在满足能量约束的条件下，将τ′_m以及τ′_m的前驱子任务的电压和频率等级提高一级，将τ′_m的后继子任务的电压和频率等级降低一级，电压和频率等级调整次数加1；

(3)根据(6.2)重新确定任务分配方案，再次验证方案是否满足实时性约束，如果仍不满足，重复(2)中的方法，直至调整次数达到任务数量，停止调整，任务映射失败，

(6.3)确定可选执行周期o_i；

根据(6.1)和(6.2)的结果，得到强制执行子任务的任务映射方案，由此可得***剩余的总能量E_optl以及每个处理器上的空闲时间段Δt，TC_l表示以电压和频率(V_l，f_l)执行单位周期所用的时间；EC_l表示以电压和频率(V_l，f_l)执行单位周期所消耗的能量，根据贪婪算法的思想，在时间和能量受限情况下，需要尽可能多的执行可选子任务，即确定空闲时间段能够执行的最大可选周期，以提高***QoS，具体方法为：

(3)按照分层等级给Temp中的可选子任务分配实际执行周期，并确定可选子任务的起始执行时间，返回(1)，循环执行上述步骤，直至***剩余的总能量E_optl等于0或者全部可选子任务被执行；

基于上述问题，能够求解频率分配优化变量c_i，l、任务分配优化变量x_i，k、任务执行起始时间ts_i和可选执行周期o_i，从而得到一个基于QoS优化的任务映射方案。