CN108108225B

CN108108225B - 一种面向云计算平台的任务调度方法

Info

Publication number: CN108108225B
Application number: CN201711340244.4A
Authority: CN
Inventors: 耿晓中; 柯洪昌; 于澜; 任斌; 鲍杰; 徐欣欣
Original assignee: Changchun Institute Technology
Current assignee: Changchun Institute Technology
Priority date: 2017-12-14
Filing date: 2017-12-14
Publication date: 2019-05-24
Anticipated expiration: 2037-12-14
Also published as: CN108108225A

Abstract

本发明提供一种面向云计算平台的任务调度方法，包括：遍历DAG图中的所有任务结点，依次计算得到每个结点任务的静态优先级；按照静态优先级降序排列任务，将任务依次放入任务优先级队列中；对于任务优先级队列中各个任务，只要能够提前当前任务的开始执行时间，且已经被调度的任务不被延迟的情况下，就复制当前任务的父任务，而不仅仅复制当前任务的关键父任务。相对于传统算法，提前了任务复制的开始阶段，先任务复制，然后再选择虚拟机，使任务能在使它完成最快的虚拟机上执行，使虚拟机的选择更加合理。在虚拟机的选择阶段考虑了负载平衡，实现了云计算***良好的负载均衡性，提高了云计算***的资源利用率。

Description

一种面向云计算平台的任务调度方法

技术领域

本发明属于云计算任务调度技术领域，具体涉及一种面向云计算平台的任务调度方法。

背景技术

作为一个商业模型，云计算需要处理大量的用户群体提交的任务集合，怎样有效地调度这些任务是一个至关重要的问题。云计算任务调度策略是决定***性能的关键因素，也是云计算服务质量的重要保证。一个好的任务调度方法应能减少任务的总执行时间，提高虚拟机的资源利用率；在任务调度过程中应能兼顾***的负载平衡，合理有效地利用计算资源，确保用户需求在较短时间内被响应，提高资源的利用率。

对于独立任务调度，一些成熟的理论和方法已经被广泛使用，然而关于相关任务的调度问题仍然是国内外的研究热点之一。当前已有的经典算法的调度策略和应用角度也是各不相同。

启发式算法中的表调度方法由于设计简单并且容易实现而被广泛使用。表调度方法的基本思想是：通过分配每个任务一个优先级构造任务调度列表，然后依次取出每个任务分配给各个处理器，使当前任务的开始执行时间或者完成时间最早，但是没有考虑任务执行的并行性和处理器之间的通信开销。

HEFT算法是一个基于***的表调度方法，只要不违背任务间的优先级限制就可以把任务***到两个已经被调度的任务之间的空闲时间内去执行，HEFT算法按照从当前任务到结束任务的关键路径长度去计算任务的优先级，这种方法比较简单，但是容易陷入局部最优，并且没有使用任务复制技术，很难得到较短的调度时间。

HCPFD和HNDP方法合并了表调度和任务复制技术，HCPFD仅考虑复制关键父任务，HNDP方法不仅考虑复制关键父任务，而且考虑复制关键父任务的父任务，尽可能早地提前了当前任务的开始时间。然而，HCPFD和HNDP方法都没有有效调度非关键路径上的任务，因此影响了任务调度的整体性能。

DDS方法采用先调度后优化的思想，在不违背任务之间约束关系的前提下，将关键任务尽可能调度到处理器的空闲时间段去运行，从而缩短了全体任务的执行时间。但是该算法没有考虑处于不同处理器的关键任务之间的通信开销，也没有考虑***的负载平衡。

因此，现有的各类任务调度方法，无法满足人们对最小化任务调度长度和合理利用虚拟资源的需求。

发明内容

针对现有技术存在的缺陷，本发明提供一种面向云计算平台的任务调度方法，可有效解决上述问题。

本发明采用的技术方案如下：

本发明提供一种面向云计算平台的任务调度方法，包括以下步骤：

步骤1，初始化任务调度队列，计算每个任务的静态优先级，按照静态优先级降序排列任务，将任务依次放入任务优先级队列中；

具体包括：

构建任务DAG图；DAG图由四元组G＝(T,E,W,C)构成，各成员定义如下：

(1)T表示DAG图中的任务集合，共有n个任务，T＝{T₁,T₂,…,T_n}；

(2)E＝{E_i,j|T_i,T_j∈T}表示任务间通信边的集合，E_i,j表示从任务T_i到任务T_j的一条有向边；

(3)W是一个n*m矩阵，表示n个任务分别在m个虚拟机上的执行时间，m为虚拟机总数量；虚拟机集合P表示为：P＝{P₁,P ₂,…,P _m}；

W(T_i,P_k)表示任务T_i在虚拟机P_k上的运行时间，P_k∈P；按照公式(1)计算任务T_i的平均运行时间

(4)C是任务间的通信开销，C(E_i,j)表示有向边E_i,j上的通信开销。假设当两个任务被分到同一虚拟机上时，任务间的通信开销为0；

(5)任务T_i的前驱任务集合pred(T_i)表示为：pred(T_i)＝{T_e|E_e,i∈E}；

任务T_i的后继任务集合succ(T_i)表示为：succ(T_i)＝{T_s|E_i,s∈E}；

(6)假设DAG图中只有一个起点，用T_start表示；只有一个终点用T_end表示；

(7)按照如下公式(2)计算DAG图中的每个任务T_i的静态优先级rank(T_i)：

以T_end作为计算开始结点，以T_start作为计算结束结点，按照从下向上，同层从左到右的原则，遍历DAG图中的所有任务结点，依次计算得到每个结点任务的静态优先级；

步骤2，令i＝1；

步骤3，选择任务T_i；

步骤4，令k＝1；

步骤5，按照公式(3)计算任务T_i在虚拟机P_k上的开始执行时间(st(T_i,P_k))：

其中：

任务T_i在虚拟机P_k上的开始执行时间(st(T_i,P_k))是指：任务T_i的所有前驱任务都被执行完，并且虚拟机P_k接收到任务T_i的所有前驱任务的执行结果时，任务T_i可以在P_k上开始运行的时间：

ava(P_k)表示虚拟机P_k的起始可用时间，指虚拟机P_k的就绪时间或最近分配到虚拟机P_k上的任务T_i的完成时间，表示为：ava(P_k)＝0或者ava(P_k)＝ct(T_i,P_k)；

ct(T_e,P_x)表示任务T_i的前驱任务在除虚拟机P_k外的其他对应虚拟机上的完成时间；

步骤6，将任务T_i的父任务结点按照静态优先级值降序排列，构造得到父任务队列；F为父任务队列中父任务结点数量；父任务队列T_i ⁰表示为：T_i ⁰＝{T_i-1 ⁰,T_i-2 ⁰,…,T_i-F ⁰}；其中，T_i-1 ⁰表示任务T_i的父任务队列中静态优先级最高的任务；T_i-2 ⁰表示任务T_i的父任务队列中静态优先级次高的任务；T_i-F ⁰表示任务T_i的父任务队列中静态优先级最低的任务；父任务队列T_i ⁰中任意一个父任务表示为T_i-f ⁰；

步骤7，令f＝1；

步骤8，按照公式(5)计算虚拟机P_k相对于任务T_i的空闲时间slot(T_i,P_k)；其中，虚拟机P_k的空闲时间指虚拟机P_k已经处于就绪状态，但任务T_i需要等待其前驱任务的执行结果；

slot(T_i,P_k)＝st(T_i,P_k)-ava(P_k) (5)

步骤9，判断T_i的父任务T_i-f ⁰是否满足以下规则：1)slot(T_i,P_k)≥W(T_i-f ⁰,P_k)并且ct(Q_f,P_k)＜st(T_i,P_k)；而且父任务T_i-f ⁰没有在虚拟机P_k上执行过；其中，W(T_i-f ⁰,P_k)代表父任务T_i-f ⁰在虚拟机P_k上的运行时间；ct(Q_f,P_k)表示父任务T_i-f ⁰在虚拟机P_k上的完成时间；

如果满足，则复制T_i-f ⁰到虚拟机P_k的空闲时间slot(T_i,P_k)上，更新当前任务T_i的开始执行时间(st(T_i,P_k))和虚拟机P_k的空闲时间slot(T_i,P_k)；如果不满足，执行步骤10；

步骤10，令f＝f+1；判断f是否大于F，如果大于，则执行步骤11；如果不大于，则返回执行步骤9；

步骤11，任务T_i在虚拟机P_k上的完成时间等于任务T_i的开始执行时间加上任务T_i的执行时间，即：根据公式(4)计算T_i在P_k上的完成时间(ct(T_i,P_k))：

ct(T_i,P_k)＝st(T_i,P_k)+W(T_i,P_k) (4)

步骤12，令k＝k+1；判断k是否大于m，如果大于，则执行步骤13；如果不大于，则返回执行步骤5；

步骤13，计算云计算***的虚拟机负载平衡标准偏差L_k；

步骤14，根据用户需求分配任务T_i到ct(T_i,P_k)+L_k值小的虚拟机上去执行；

步骤15，令i＝i+1；判断i是否大于n，如果大于，则执行步骤16；如果不大于，则返回执行步骤3；

步骤16，输出每个任务所分配的虚拟机；由虚拟机执行所分配的对应任务。

优选的，步骤13具体包括以下步骤：

步骤13.1，根据公式(6)计算虚拟机P_k的负载权值load(P_k)：

load(P_k)＝w₁·r_cpu+w₂·r_mem+w₃·r_bw (6)

其中：r_cpu表示CPU利用率，r_mem表示内存利用率，r_bw表示网络带宽利用率；w₁+w₂+w₃＝1，w₁,w₂,w₃分别表示CPU、内存、带宽的影响因子；

步骤13.2，根据公式(7)计算云计算***的虚拟机平均负载load_ave：

其中：load(P_k)表示虚拟机P_k的负载值；

步骤13.3，根据公式(8)计算云计算***的虚拟机负载平衡标准偏差L_k：

由此得到云计算***的虚拟机负载平衡标准偏差L_k。

本发明提供的一种面向云计算平台的任务调度方法具有以下优点：

(1)只要能够提前当前任务的开始执行时间，且已经被调度的任务不被延迟的情况下，就复制当前任务的父任务，而不仅仅复制当前任务的关键父任务。该方法最大地提前了当前任务的开始时间，从而提前了全体任务的完成时间。

(2)相对于传统算法，提前了任务复制的开始阶段。先任务复制，然后再选择虚拟机，使任务能在使它完成最快的虚拟机上执行，使虚拟机的选择更加合理。

(3)修改了任务优先级的计算公式，使该调度方法不容易陷入局部最优。

(4)在虚拟机的选择阶段考虑了负载平衡，实现了云计算***良好的负载均衡性，提高了云计算***的资源利用率。

附图说明

图1为本发明提供的一种面向云计算平台的任务调度方法的流程示意图。

图2为任务DAG图的示意图。

具体实施方式

为了使本发明所解决的技术问题、技术方案及有益效果更加清楚明白，以下结合附图及实施例，对本发明进行进一步详细说明。应当理解，此处所描述的具体实施例仅用以解释本发明，并不用于限定本发明。

为方便对本发明进行理解，首先介绍基础知识：

云计算是将计算资源进行统一管理与统一分配的一种新型商业计算模式。云计算把具有可伸缩的、动态的、分散的计算资源进行虚拟化以后，以付费的方式提供给用户，用户只需要提交任务给云计算中心，云计算中心就会根据任务的需求分配相应的计算资源来执行这些任务。

任务调度是云计算中心将任务分配给计算资源的过程。由于云计算面对的任务量非常庞大，云中计算资源又具有异构性和动态性等因素，这些因素使得云计算任务调度变得比较复杂，任务调度是云计算的核心技术之一。

本发明的关键点是任务复制和表调度技术的综合使用，通过利用虚拟机的空闲时间复制当前任务的前驱任务，尽可能减小当前任务和其所有父任务间的通信开销，提前了当前任务的开始执行时间；在选择虚拟机时，不仅考虑当前任务的最早完成时间，也考虑了云计算***的负载平衡。

本发明特点如下：

(1)只要能够提前当前任务的开始执行时间，且已经被调度的任务不被延迟的情况下，就复制当前任务的父任务，而不仅仅复制当前任务的关键父任务。该方法最大地提前了当前任务的开始时间，从而提前了总任务的完成时间。

(3)在虚拟机的选择阶段考虑了负载平衡，实现了良好的负载均衡性，提高了云计算***的资源利用率。

参考图1，本发明提供一种面向云计算平台的任务调度方法，是一种云计算环境下基于优先级列表和任务复制技术的改进任务调度方法，包括以下步骤：

具体包括：

构建任务DAG图；如图2所示，为一种DAG图具体示例；DAG图由四元组G＝(T,E,W,C)构成，各成员定义如下：

(1)T表示DAG图中的任务集合，共有n个任务，T＝{T₁,T₂,…,T_n}；例如，在图2中，共有12个任务；

(2)E＝{E_i,j|T_i,T_j∈T}表示任务间通信边的集合，E_i,j表示从任务T_i到任务T_j的一条有向边；例如，在图2中，任务T₁到任务T₂的一条有向边为E_1,2；

(4)C是任务间的通信开销，C(E_i,j)表示有向边E_i,j上的通信开销。假设当两个任务被分到同一虚拟机上时，任务间的通信开销为0；例如，在图2中，如果任务T₁和任务T₂没有被分到同一虚拟机上，则任务T₁到任务T₂的通信开销C(E_1,2)为5；

(5)任务T_i的前驱任务集合pred(T_i)表示为：pred(T_i)＝{T_e|E_e,i∈E}；例如，在图2中，任务T₅的前驱任务集合pred(T₅)为任务T₂和任务T₃；本发明中，前驱任务均是指直接前驱任务；

任务T_i的后继任务集合succ(T_i)表示为：succ(T_i)＝{T_s|E_i,s∈E}；例如，在图2中，任务T₅的后继任务集合succ(T₅)为任务T₇和任务T₁₀；本发明中，后继任务均是指直接后继任务；

(6)假设DAG图中只有一个起点，用T_start表示；只有一个终点用T_end表示；例如，在图2中，T_start即为任务T₁；T_end即为任务T₁₂；

步骤2，令i＝1；

步骤3，选择任务T_i；

步骤4，令k＝1；

其中：

ava(P_k)表示虚拟机P_k的起始可用时间，指虚拟机P_k的就绪时间或最近分配到虚拟机P_k上的任务T_i的完成时间，表示为：ava(P_k)＝0或者ava(P_k)＝ct(T_i,P_k)；其中，如果虚拟机P_k当前为空闲状态，则ava(P_k)即为虚拟机P_k的就绪时间，值为0；如果虚拟机P_k当前为非空闲状态，则ava(P_k)为最近分配到虚拟机P_k上的任务T_i的完成时间。

步骤7，令f＝1；

slot(T_i,P_k)＝st(T_i,P_k)-ava(P_k) (5)

ct(T_i,P_k)＝st(T_i,P_k)+W(T_i,P_k) (4)

步骤13，计算云计算***的虚拟机负载平衡标准偏差L_k；

本步骤具体包括以下步骤：

步骤13.1，根据公式(6)计算虚拟机P_k的负载权值load(P_k)：

load(P_k)＝w₁·r_cpu+w₂·r_mem+w₃·r_bw (6)

其中：load(P_k)表示虚拟机P_k的负载值；

由此得到云计算***的虚拟机负载平衡标准偏差L_k。

对比传统方法，本发明有以下优势：

以上所述仅是本发明的优选实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本发明原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也应视本发明的保护范围。

Claims

1.一种面向云计算平台的任务调度方法，其特征在于，包括以下步骤：

具体包括：

(3)W是一个n*m矩阵，表示n个任务分别在m个虚拟机上的执行时间，m为虚拟机总数量；虚拟机集合P表示为：P＝{P₁,P₂,…,P_m}；

(4)C是任务间的通信开销，C(E_i,j)表示有向边E_i,j上的通信开销，假设当两个任务被分到同一虚拟机上时，任务间的通信开销为0；

步骤2，令i＝1；

步骤3，选择任务T_i；

步骤4，令k＝1；

其中：

步骤7，令f＝1；

步骤8，按照公式(4)计算虚拟机P_k相对于任务T_i的空闲时间slot(T_i,P_k)；其中，虚拟机P_k的空闲时间指虚拟机P_k已经处于就绪状态，但任务T_i需要等待其前驱任务的执行结果，任务T_i在等待其前驱任务的执行结果的等待时间，即为，虚拟机P_k的空闲时间；

slot(T_i,P_k)＝st(T_i,P_k)-ava(P_k) (4)

步骤9，判断T_i的父任务T_i-f ⁰是否满足以下规则：slot(T_i,P_k)≥W(T_i-f ⁰,P_k)并且ct(Q_f,P_k)<st(T_i,P_k)；而且父任务T_i-f ⁰没有在虚拟机P_k上执行过；其中，W(T_i-f ⁰,P_k)代表父任务T_i-f ⁰在虚拟机P_k上的运行时间；ct(Q_f,P_k)表示父任务T_i-f ⁰在虚拟机P_k上的完成时间；

步骤11，任务T_i在虚拟机P_k上的完成时间等于任务T_i的开始执行时间加上任务T_i的执行时间，即：根据公式(5)计算T_i在P_k上的完成时间(ct(T_i,P_k))：

ct(T_i,P_k)＝st(T_i,P_k)+W(T_i,P_k) (5)

步骤13，计算云计算***的虚拟机负载平衡标准偏差L_k；

2.根据权利要求1所述的面向云计算平台的任务调度方法，其特征在于，步骤13具体包括以下步骤：

步骤13.1，根据公式(6)计算虚拟机P_k的负载权值load(P_k)：

load(P_k)＝w₁·r_cpu+w₂·r_mem+w₃·r_bw (6)

其中：load(P_k)表示虚拟机P_k的负载权值；

由此得到云计算***的虚拟机负载平衡标准偏差L_k。