CN113515351B

CN113515351B - 一种基于能耗与QoS协同优化的资源调度实现方法

Info

Publication number: CN113515351B
Application number: CN202111041530.7A
Authority: CN
Inventors: 刘发贵; 王彬
Original assignee: South China University of Technology SCUT
Current assignee: South China University of Technology SCUT
Priority date: 2021-09-07
Filing date: 2021-09-07
Publication date: 2022-03-29
Anticipated expiration: 2041-09-07
Also published as: CN113515351A

Abstract

本发明公开了一种基于能耗与QoS协同优化的资源调度实现方法。所述方法包括：在云计算数据中心环境下构建多虚拟机的云任务到达排队模型；利用堆叠降噪自动编码器技术对数据中心的QoS特征进行提取，得到降维后描述QoS特征信息的矩阵，求得当前的虚拟机的最大响应时间，以完善协同优化目标函数的约束条件；结合云任务到达排队模型、协同优化目标函数和李雅普诺夫优化方法，得到基于李雅普诺夫优化理论的资源调度算法，采用资源调度算法实现基于能耗与QoS协同优化的资源调度。本发明在保障QoS的同时有效地降低数据中心的能耗，并克服了云计算数据中心的真实场景中云任务到达的波动性对优化问题求解的干扰。

Description

一种基于能耗与QoS协同优化的资源调度实现方法

技术领域

本发明属于云计算节能调度领域，具体涉及一种基于能耗与QoS协同优化的资源调度实现方法。

背景技术

云计算凭借其超大规模的服务能力早已成为全球IT领域热门的研究项目。随着云计算技术的不断发展，越来越多的数据中心在全球范围内涌现，基础设施产生的能耗也呈现指数级的增长态势。当前全球IT行业的碳排放量占全球碳排放总量的3-5％。根据最近的报道，Google数据中心消耗了近3亿瓦，而Facebook的数据中心消耗了6000万瓦。数据中心比高能耗制造业消耗更多的电力。国际调查机构麦肯锡对70个大型数据中心进行了调查，发现用于计算机操作的平均功耗仅占6％至12％。随着数据中心规模的不断增长，数据中心消耗的大量电能对环境的影响日益突出。

虚拟机迁移技术可以提升物理节点的资源利用率，通过关闭数据中心空闲状态的服务器可以降低云计算***的总体能耗值。传统的这类节能解决方案也会带来明显的不利影响。当CPU利用率接近100％时，虚拟机的性能会出现明显的下降，这意味着节能和保障服务质量（QoS）这两个优化目标之间不可避免地存在着冲突关系。过度追求这些指标中的任何一个都会阻碍对另一指标的优化。在实际的数据中心场景中，由于负载的波动性及不确定因素，节能和QoS保障的双重目标变得更为复杂。先前的优化方法要求所有实体（用户、云任务、服务提供商等）在整个云计算调度过程中满足单个QoS约束，这在实际的云计算环境中是不现实的。并且这些优化方法的求解过程复杂，收敛速度慢，难以满足大规模云计算数据中心的实时调度需求。

发明内容

为了实现能耗和QoS优化之间更好的权衡，本发明提出了一种基于能耗与QoS协同优化的资源调度实现方法，在保障用户QoS的前提下最小化数据中心产生的能耗。本发明构建了一个多虚拟机（VM）的云任务到达排队模型，并在此基础上构建了数据中心的能耗模型以及目标优化函数，并结合李雅普诺夫（Lyapunov）稳定性理论的优化方法，将协同优化问题具体到了每一个调度时间片内进行求解，使得虚拟机的云任务队列可达到允许的最大值，可以充分发挥虚拟机的处理能力，实现资源的利用。

本发明的目的至少通过如下技术方案之一实现。

一种基于能耗与QoS协同优化的资源调度实现方法，包括以下步骤：

S1、在云计算数据中心环境下构建多虚拟机（VM）的云任务到达排队模型；

S2、利用堆叠降噪自动编码器技术对数据中心的QoS特征进行提取，得到降维后描述QoS特征信息的矩阵，通过该矩阵求得当前的虚拟机的最大响应时间，以完善协同优化目标函数的约束条件；

S3、结合云任务到达排队模型、协同优化目标函数和李雅普诺夫（Lyapunov）优化方法，求得满足能耗与QoS优化调度的虚拟机应该具备的云任务队列长度条件，得到基于李雅普诺夫（Lyapunov）优化理论的资源调度算法，采用资源调度算法将能耗与QoS协同优化的资源调度问题具体到每一个时间片内进行求解，实现基于能耗与QoS协同优化的资源调度。

进一步地，步骤S1中，所述云任务到达排队模型由主机排队模型和虚拟机（VM）排队模型串联组成，用于优化虚拟机云任务队列积压长度与***能耗之间的关系；

主机排队模型中，云任务被提交到数据中心之后，数据中心会采用最少负载 (least loaded)准则的负载均衡策略，将云任务优先分配给云任务请求未完成数量最少的主机，并由此构成云任务到达间隔时间为指数分布、云任务执行时间为指数分布的排队模型（

排队模型）；

虚拟机（VM）排队模型中，每一个虚拟机（VM）实例都构成了一个云任务到达间隔时间为指数分布、云任务执行时间为指数分布，虚拟机数量为

，虚拟机容量为

的排队模型（

排队模型），云任务首先经过主机排队模型的分配后被数据中心提交至虚拟机排队模型中，然后以先到先服务（FCFS）的方式进行处理。

进一步地，当云任务进入主机排队模型时，如果主机上至少有一个可用虚拟机（VM），数据中心则将该云任务分配至当前处于空闲状态的虚拟机（VM）上执行；当主机上所有的虚拟机都已被云任务占用满载时，新到达的云任务将会进入虚拟机排队模型的队列缓冲区内，队列缓冲区是一个专门存放等候被执行的云任务的先进先出(FIFO)队列；当有云任务执行完毕离开某个虚拟机（VM）后，数据中心会将位于队列缓冲区头部的云任务分配给此虚拟机（VM）；当云任务获得对虚拟机（VM）的访问权限后，可立即向其提供云服务；

将数据中心的运行时间视为由成若干个连续时间片所组成，每个时间片的长度定义为t；因此在时隙t内，单个虚拟机的排队模型（

排队模型）通过以下公式进行定义：

其中，

和

是第j个和第j+1个时间片中第k个虚拟机（VM）的队列长度；

表示在第j个时间片

中第k个虚拟机

处理的云任务数；

是第j个时间片

中第k个虚拟机

队列中的云任务数量；当

时，虚拟机（VM）中的队列长度小于其处理能力

，虚拟机（VM）的队列长度可以达到最小值0；

虚拟机（VM）排队模型的长度会直接影响数据中心中主机的运行状态；主机的运行状态可以分为以下两类：

1）活跃状态：主机上虚拟机（VM）的云任务队列不为空，云任务正在等待被处理；

2）空闲状态：主机上虚拟机（VM）的云任务队列为空，处于空闲状态的主机可被视为处于睡眠模式，且处于低功耗状态，通常而言，处于空闲状态下主机产生的功耗为一恒定值；

因此数据中心的功耗模型可以描述为如下形式：

式中，

表示当前数据中心的总体能源功耗量，其中能耗等式右侧的第一项表示当前处于活动状态的物理主机产生的总功耗；p是运行中的物理主机的数量，

是第

个处于活动状态的物理主机的功耗；q是处于空闲状态的物理主机的数量，

是第

个处于空闲状态的物理主机的功耗；空闲状态下的功耗可以看作是一个常量；M是当前数据中心可用虚拟机（VM）的最大数量；

当资源利用率较高时，处于空闲状态的物理主机数量较少，功耗也较小；由此公式（2）可以以如下形式表示：

其中

为第

个处于活动状态的物理主机的功耗，

，

为空闲状态下主机的恒定功耗常量，

是第j个时间片中第

个虚拟机的队列长度。

进一步地，步骤S2中，利用堆叠降噪自动编码器技术对数据中心中的虚拟机的资源占用历史数据进行处理，通过堆叠降噪编码器的鲁棒性提取出影响数据中心QoS指标的特征信息；

利用由虚拟机的参数集合组成的高维矩阵作为网络输入层的数据，并构建堆叠降噪自动编码器的目标函数，通过目标函数将对所述高维矩阵进行降维与数据重构，得到优化后的特征；

在最小化编码器损失函数的过程中，同时将堆叠降噪自动编码器的复杂度也作为其中一项指标参与到训练的过程中，作为损失函数的约束项；在损失函数后加入了基于权重衰减的正则项，以提升堆叠降噪自动编码器的泛化效果以避免过拟合，并采用

和

的交叉熵

作为损失函数，进一步增强堆叠降噪自动编码器的鲁棒性。

进一步地，在云环境中，不同的用户提交的任务的要求也各不相同，有的倾向于在最短时间内完成，有的只需要保障任务在一段时间内完成即可。针对完成期限比较长的任务，可以考虑将它们分配到性能较弱的虚拟机上去执行，性能较强的虚拟机优先保障完成时限短的任务，这样可以尽可能地保障所有用户的利益。传统的调度方法要求整个云计算环境中的所有的实体满足单一的QoS约束目标，这往往无法满足真实云计算环境的需求。

本发明提出了一种基于堆叠降噪自动编码器的QoS服务能力发现方法，来构建目标函数中的QoS约束条件。自动编码器是一种无监督的神经网络模型，其基本思想就是使编码层（隐藏层）学习到输入数据的隐含特征，学习到的新特征同时可以经过解码层重构出原始输入数据。因此自动编码器进行特征降维以及特征学习的工作。

堆叠降噪自动编码器（SDAE）是在自动编码器基础上做的改进，其目的是为了学习更为鲁棒的特征；除了常规的编码阶段和解码阶段外，降噪自动编码器在编码之前先对数据信息进行随机的损坏处理，而损坏处理的主要是向原始输入数据中加入噪声；通过向训练数据中加入噪声，并使得编码器学会去除这种噪声来获得未被污染过的真实输入；因此，这就迫使编码器学习并提取到输入数据中鲁棒性更强的特征。

在云任务执行的过程中，当云任务的响应时间

过长时，会造成SLA violation的现象；在训练堆叠降噪自动编码器的过程中，将虚拟机的参数集合组成的高维矩阵作为堆叠降噪自动编码器网络输入层的数据，并通过堆叠降噪自动编码器将对高维矩阵进行降维与数据重构，得到优化后的QoS特征信息；

虚拟机的参数集合包括云任务响应时间、队列长度、虚拟机CPU利用率、带宽、CPU 数量、内存大小、内存占用率、虚拟机迁移次数、虚拟机迁移时间开销、虚拟机上一时刻的 SLA违反率；当数据中心内有

台虚拟机处于启动状态时，在每一个调度周期间隔内，虚拟机的参数集合会构成

的高维矩阵

；

堆叠降噪自动编码器的网络结构包括输入层、损坏输入层、隐藏层以及输出层；除了传统的编码阶段和解码阶段，堆叠降噪自动编码器在对编码之前的数据执行随机损坏处理，目的是将噪声添加到训练数据中，从而迫使编码器从输入层数据中学习并提取更好的 QoS特征信息；令

表示原始输入数据样本，

表示加入了高斯噪声之后的损坏数据，

和

分别代表编码器和解码器的权重，

和

代表偏置项，堆叠降噪自动编码器（SDAE）的编码函数对原始输入进行编码，得到新的特征表征

，编码过程如下所示：

其中

是sigmoid函数，

，它被用来作为非线性确定性的映射；类似地，解码函数将来自隐藏层的表征

输入重构为原始输入

，解码过程如下所示：

训练堆叠降噪自动编码器的目的是优化参数集合

以最小化

之间的重构误差；令

代表堆叠降噪自动编码器（SDAE）的损失函数，降噪自动编码器的优化目标函数

可以表示为：

在最小化损失函数的过程中，同时需要考虑到堆叠降噪自动编码器的复杂度，过于复杂的模型容易导致过拟合，因此将模型的复杂度也作为其中一项指标参与到训练的过程中，进而约束模型；在损失函数后加入基于权重衰减的正则项（L2 Norm），以提升模型的泛化效果以避免过拟合；权重衰减是放在正则项前的系数，可以调节模型复杂度对损失函数的影响；

采用

和

的交叉熵

作为损失函数；

；其中

为堆叠降噪自动编码器在第j个时间片时，第i个样本的权重向量的平方损失函数值，其中，

， T为时间片的总数；

，D为堆叠降噪自动编码器输入层的样本总数；

是正则项的权重调节系数；

；由此得到最终的损失函数如下所示：

其中交叉熵损失函数

可表示为：

根据上式，堆叠降噪自动编码器的损失优化函数可表示为：

上述目标函数的优化可以通过使用拟牛顿法进行求解，用于估计参数

，通过使用求得的估计参数作为堆叠降噪自动编码器网络模型的参数，可以得到反应虚拟机 QoS特征信息的低维矩阵

；

以云任务的最大响应时间

作为数据中心服务质量的评估标准；令

表示虚拟机（VM）的最大响应时间；

表示服务水平协议（SLA）指定的最大响应时间；

表示堆叠降噪自动编码器（SDAE）通过当前虚拟机（VM）的QoS特征信息矩阵

与

的余弦相似度计算出在该虚拟机上的云任务最大响应时间；为了确保云任务的服务质量，

应该小于

和

之间的最小值；因此，总体的协同优化目标函数可以写为：

进一步地，步骤S3中，利用李雅普诺夫（Lyapunov）优化理论对云任务到达排队模型的队列长度进行分析，并利用QoS特征信息对当前时刻的云任务执行时间进行拟合，改善数据中心资源调度的时间约束条件；

当

时，资源调度算法应最大程度地减少虚拟机（VM）的非空任务队列的数量，以减少数据中心产生的能耗；与此同时，当

时，云任务队列的长度应保持足够地大，优先使得虚拟机的利用率尽可能地处于满载状态，优先使得虚拟机的利用率尽可能地处于满载状态，以便使得虚拟机的处理能力得到充分的释放。

进一步地，李雅普诺夫（Lyapunov）方程常用来分析排队模型的稳定性，李雅普诺夫（Lyapunov）方程表达式可表达为如下的形式：

其中

是第j个时间片中第k个虚拟机的队列长度，

是第j个时间片中堆叠降噪自动编码器的优化目标函数的取值；

为在第j个时间片中堆叠降噪自动编码器的优化目标函数的李雅普诺夫方程取值，

，T为时间片的总数，

， N为当前数据中心可用虚拟机的最大数量，在每个时间片

内，李雅普诺夫漂移函数定义为如下形式：

为了能够在云计算波动的环境下依然保持云任务队列的稳定性，公式（12）的结果应收敛，漂移值

的最终结果取值越小便说明云任务队列越稳定；

在保证云任务服务质量的前提下，为了使物理主机的能源消耗得到进一步地降低，也就是令虚拟机排队模型中运行的虚拟机数量降至最低；协同优化问题的目标函数可以重写为：

其中V是单位转换系数，其作用是将能源消耗量转换为相应的云任务队列长度单位；根据李雅普诺夫优化方法，数据中心的资源调度协同优化目标函数从公式（13）中得到：

该函数的求解过程如下所示：

对公式(15)进行变形转换，得到如下形式的等效公式：

其中

是第

个虚拟机的李雅普诺夫漂移加罚函数的惩罚值，公式（16）的第一个解为:

当

时，公式（16）通过一元二次方程式求解得结果：

如公式（18）所示，

；当

时，资源调度算法必须要满足如下条件：

；因此当

时，资源调度算法应最大程度地减少VM的非空任务队列的数量；与此同时，当

时，资源调度算法将优先使得虚拟机地利用率趋于或处于满载状态，以便使得虚拟机的处理能力得到充分的释放。

进一步地，基于李雅普诺夫（Lyapunov）优化理论的资源调度算法在云环境的每个预设调度周期由数据中心执行，资源调度算法的执行过程如下：

若有

个云任务在该周期内到达数据中心，

为云任务的最大响应时间，

虚拟机

的处理能力，

为虚拟机

的当前云任务排队队列长度；首先针对当前的云任务排队队列

，找到队列长度最短的队列

；如果

，则：

其中

为当前待处理的云任务数目，

为可由虚拟机

进行处理的云任务数目；

如果

，则令

；并将已被分配给虚拟机的队列从

中移除，并重复上述步骤直至云任务排队队列长度为0；资源调度算法是将具有非空队列的虚拟机的资源利用率按升序排列，以便在具有非空队列的虚拟机中，选择满足李雅普诺夫优化条件的队列的虚拟机进行迁移，使得利用率最低的虚拟机达到最大资源利用率极限，资源调度算法可以实现资源的平衡利用并减少超载主机的数量。

与现有技术相比，本发明具有如下的优点与技术效果：

1.提出了一种云计算环境下能耗与QoS协同优化的资源调度框架，能够在保障用户QoS的前提下最小化数据中心产生的能耗，并将协同优化问题的求解具体到了每一个时间片内，可以更为高效地应对云任务到达的波动性引发的能效问题。

2.构建了一个多虚拟机的云任务到达排队模型，该模型将主机排队模型与虚拟机排队模型以M/M/∞ + M/M/C/N的排队结构串联在一起，可以提升云任务到达数据中心后进行调度分配的效率。

3.提出了高效的数据中心QoS特征提取方法，通过堆叠降噪编码器的鲁棒性挖掘出更多影响数据中心QoS的特征信息，并拟合得到当前时刻的云任务执行时间，完全数据中心资源调度的时间约束条件。

4.提出了一种可以充分发挥虚拟机的处理能力的李雅普诺夫优化方法，该方法结合排队模型、深度降噪自动编码器网络与李雅普诺夫（Lyapunov）稳定性理论相结合，并给出了基于李雅普诺夫（Lyapunov）优化理论的资源调度算法，可以在保障QoS的同时有效地降低数据中心的能耗，并大幅优化数据中心调度的总时间开销。

附图说明

图1为本发明实施例中云计算平台协同优化框架图；

图2为本发明实施例中数据中心基于降噪自动编码器的QoS特征提取框架图。

具体实施方式

在下面的描述中结合具体图示阐述了技术方案以便充分理解本发明申请。但是本发申请能够以很多不同于在此描述的的其他方法来实施，本领域普通技术人员在没有作出创造性劳动前提下所做的类似实施例，都属于本发明保护的范围。

在本说明书中使用的术语是仅仅出于描述特定实施例的目的，而非旨在限制本说明。在本说明书一个或多个实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式，除非上下文清楚地表示其他含义。还应当理解，本说明书一个或多个实施例中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。

应当理解，尽管在本说明书一个或多个实施例中可能采用术语第一、第二等来描述各种信息，但这些信息不应限于这些术语，这些术语仅用与区别类似的对象，不必用于本说明书一个或多个实施例所描述特征的先后顺序或次序。此外，术语“具备”、“包含”以此相似表达，意图在于说明覆盖不排它的一个范围，例如，包含了一系列的步骤或者模块的过程、方法、***、产品或设备不必限于详细列出的内容，而是可包括没有列出的对于这些步骤或模块所涉及的固有内容。

实施例：

如图1所示，所述云任务到达排队模型由主机排队模型和虚拟机（VM）排队模型串联组成，用于优化虚拟机云任务队列积压长度与***能耗之间的关系；

排队模型）；

，虚拟机容量为

的排队模型（

当云任务进入主机排队模型时，如果主机上至少有一个可用虚拟机（VM），数据中心则将该云任务分配至当前处于空闲状态的虚拟机（VM）上执行；当主机上所有的虚拟机都已被云任务占用满载时，新到达的云任务将会进入虚拟机排队模型的队列缓冲区内，队列缓冲区是一个专门存放等候被执行的云任务的先进先出(FIFO)队列；当有云任务执行完毕离开某个虚拟机（VM）后，数据中心会将位于队列缓冲区头部的云任务分配给此虚拟机（VM）；当云任务获得对虚拟机（VM）的访问权限后，可立即向其提供云服务；

排队模型）通过以下公式进行定义：

其中，

和

是第j个和第j+1个时间片中第k个虚拟机（VM）的队列长度；

表示在第j个时间片

中第k个虚拟机

处理的云任务数；

是第j个时间片

中第k个虚拟机

队列中的云任务数量；当

时，虚拟机（VM）中的队列长度小于其处理能力

，虚拟机（VM）的队列长度可以达到最小值0；

因此数据中心的功耗模型可以描述为如下形式：

式中，

是第

其中

为第

个处于活动状态的物理主机的功耗，

，

为空闲状态下主机的恒定功耗常量。

利用堆叠降噪自动编码器技术对数据中心中的虚拟机的资源占用历史数据进行处理，通过堆叠降噪编码器的鲁棒性提取出影响数据中心QoS指标的特征信息；

和

的交叉熵

作为损失函数，进一步增强堆叠降噪自动编码器的鲁棒性。

在云任务执行的过程中，当云任务的响应时间

的高维矩阵

；

堆叠降噪自动编码器的结构如图2所示，该编码器的网络结构包括输入层、损坏输入层、隐藏层以及输出层；除了传统的编码阶段和解码阶段，堆叠降噪自动编码器在对编码之前的数据执行随机损坏处理，目的是将噪声添加到训练数据中，从而迫使编码器从输入层数据中学习并提取更好的QoS特征信息；令

表示原始输入数据样本，

表示加入了高斯噪声之后的损坏数据，W1和W2分别代表编码器和解码器的权重，

和

代表偏置项，堆叠降噪自动编码器（SDAE）的编码函数对原始输入进行编码，得到新的特征表征，编码过程如下所示：

其中

是sigmoid函数，

，它被用来作为非线性确定性的映射；类似地，解码函数将来自隐藏层的表征输入重构为原始输入，解码过程如下所示：

训练堆叠降噪自动编码器的目的是优化参数集合

以最小化

之间的重构误差；令

可以表示为：

采用

和

的交叉熵

作为损失函数；

；

是正则项的权重调节系数；

；由此可以得到最终的损失函数如下所示：

其中交叉熵损失函数

可表示为：

根据上式，堆叠降噪自动编码器的损失优化函数可表示为：

上述目标函数的优化可以通过使用拟牛顿法进行求解，本实施例中，使用了基于线性搜索的拟牛顿优化算法用于估计参数

，通过使用求得的估计参数作为堆叠降噪自动编码器网络模型的参数，可以得到反应虚拟机QoS特征信息的低维矩阵

；

以云任务的最大响应时间

作为数据中心服务质量的评估标准；令

表示虚拟机（VM）的最大响应时间；

表示服务水平协议（SLA）指定的最大响应时间；

与

应该小于

和

之间的最小值；因此，总体的协同优化目标函数可以写为：

利用李雅普诺夫（Lyapunov）优化理论对云任务到达排队模型的队列长度进行分析，并利用QoS特征信息对当前时刻的云任务执行时间进行拟合，改善数据中心资源调度的时间约束条件；

当

时，云任务队列的长度应保持足够地大，优先使得虚拟机的利用率尽可能地处于满载状态，以便使得虚拟机的处理能力得到充分的释放。

李雅普诺夫（Lyapunov）方程常用来分析排队模型的稳定性，李雅普诺夫（Lyapunov）方程表达式可表达为如下的形式：

其中在每个时间片

内，李雅普诺夫（Lyapunov）漂移函数可以定义为如下形式：

的最终结果取值越小便说明云任务队列越稳定；本实施例中，首先证明在公式（10）的条件下云任务队列模型的稳定性，即可使得公式（12）的最大值可收敛；通过公式（12）可以得到如下表达式：

基于以下的不等式关系：

虚拟机可容纳的最大云任务队列长度可以表示为如下形式：

其中t表示单个云任务的执行时间；整合上述公式，当需满足协同优化目标函数的约束条件时，虚拟机上调度的云任务数量需满足以下条件：

因此，公式（13）可重写为以下的形式：

公式（17）不等号右边的第一项为一个常数项；第二项为凸二次函数，表示该函数可取得一个有限的最大值；因此，证明李雅普诺夫（Lyapunov）漂移函数在公式（10）的条件约束下可以令云计算环境保持稳定性。

其中V是单位转换系数，其作用是将能源消耗量转换为相应的云任务队列长度单位；根据李雅普诺夫（Lyapunov）优化方法，数据中心的资源调度目标优化函数可以从公式（18）中得到：

优化函数的求解过程如下所示：

对公式(20)进行变形转换，可以得到如下形式的等效公式：

其中

是李雅普诺夫（Lyapunov）漂移加罚函数的惩罚值，公式（21）的第一个解为:

当

时，公式（21）可通过一元二次方程式求解得结果：

如公式（23）所示，

；当

时，资源调度算法必须要满足如下条件：

；因此可得当

时，资源调度算法应最大程度地减少VM的非空任务队列的数量，以减少数据中心产生的能耗；与此同时，当

时，资源调度算法将优先使得虚拟机地利用率尽可能地处于满载状态，，以便使得虚拟机的处理能力得到充分的释放。

基于李雅普诺夫（Lyapunov）优化理论的资源调度算法在云环境的每个预设调度周期由数据中心执行，资源调度算法的执行过程如下：

若有

个云任务在该周期内到达数据中心，

为云任务的最大响应时间，

虚拟机

的处理能力，

为虚拟机

，找到队列长度最短的队列

；如果

，则：

其中

为当前待处理的云任务数目，

为可由虚拟机

进行处理的云任务数目；

如果

，则令

；并将已被分配给虚拟机的队列从

中移除，并重复上述步骤直至队列长度为0；资源调度算法是将具有非空队列的虚拟机的资源利用率按升序排列，以便在具有非空队列的虚拟机中，选择满足李雅普诺夫优化条件的队列的虚拟机进行迁移，使得利用率最低的虚拟机达到最大资源利用率极限，资源调度算法可以实现资源的平衡利用并减少超载主机的数量。

本实施例中，设有

个虚拟机，令

表示通过在每个时间片t上执行漂移加罚函数获得的策略，

表示单位转换系数，用于将***能耗转换为相应的云任务队列长度单位；

和

分别表示通过执行漂移加罚函数获得的李雅普诺夫（Lyapunov）漂移值和罚值；通过分析协同优化目标函数，可以得出以下方程式：

其中，

是时间片

中第

个虚拟机的队列长度，

为时间片

时第k个虚拟机漂移值，

为第k个虚拟机的漂移值与漂移策略的映射函数，

为常量，

；

为t时刻堆叠降噪自动编码器的参数集；

同时对公式的两边取期望值，根据期望的标准计算方式，可以得到：

由于拟牛顿法求解得到的是最优解的近似值，故

为执行漂移加罚函数获得的最优估计策略，

为常量，函数E为期望值的求解函数。

根据以上推导结论对时间片进行累加，可以得到：

其中

为李雅普诺夫漂移加罚函数惩罚值的估计值，

为时间片的总数，

为在时间片T时优化目标函数

的李雅普诺夫方程取值，

为在t时刻堆叠降噪自动编码器的优化目标函数

的取值。因为L（Θ（T））≥0，可以求得：

观察公式的右端，可以发现只有一个可调参数V，其余为固定值；因此，对于以上公式，云环境能耗的目标优化函数可以表示为：

其中

为能耗与转换系数V之间的映射函数；

类似地，分析云任务队列的平均长度，可以获得以下不等式：

，

在上述的公式中，

代表计算云任务队列平均长度时根据实施例中公式（17）常数项求得的常量，

代表李雅普诺夫期望值与罚值伸缩系数，

代表执行漂移加罚函数后取得的最大罚值，

代表执行漂移加罚函数后取得的最小罚值；

V作为唯一的变量参数确定云任务队列积压长度的大小；V确定原始问题的时间平均约束收敛到非负数的速度；因此，平均持续时间的云任务队列积压长度可以用O（V）表示；根据以上分析得出的结论，很明显，单位转换系数V对云***的能耗优化和云任务队列积压的长度具有相反的影响；这说明了算法执行时间（迭代次数）和算法效率（求解精度）之间存在着[O（V），O（1/V）]的折衷关系。由于该李雅普诺夫（Lyapunov）优化方法属于无模型学习范畴，优化问题可以在每个独立的时间片内求解完成，因此也证明了通过该方法能够充分发挥虚拟机的处理能力，可以在保障QoS的同时有效地降低数据中心的能耗，并能大大减少数据中心调度的时间开销。

上述流程为本发明较佳的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到的变化或替换，都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应该以权利要求的保护范围为准。

Claims

1.一种基于能耗与QoS协同优化的资源调度实现方法，其特征在于，包括以下步骤：

S1、在云计算数据中心环境下构建多虚拟机的云任务到达排队模型；所述云任务到达排队模型由主机排队模型和虚拟机排队模型串联组成，用于优化虚拟机云任务队列积压长度与***能耗之间的关系；

主机排队模型中，云任务被提交到数据中心之后，数据中心会采用最少负载准则的负载均衡策略，将云任务优先分配给云任务请求未完成数量最少的主机，并由此构成云任务到达间隔时间为指数分布、云任务执行时间为指数分布的排队模型；虚拟机排队模型中，每一个虚拟机实例都构成了一个云任务到达间隔时间为指数分布、云任务执行时间为指数分布，虚拟机数量为C，虚拟机容量为N的排队模型，云任务首先经过主机排队模型的分配后被数据中心提交至虚拟机排队模型中，然后以先到先服务的方式进行处理；当云任务进入主机排队模型时，如果主机上至少有一个可用虚拟机，数据中心则将该云任务分配至当前处于空闲状态的虚拟机上执行；当主机上所有的虚拟机都已被云任务占用满载时，新到达的云任务将会进入虚拟机排队模型的队列缓冲区内，队列缓冲区是一个专门存放等候被执行的云任务的先进先出队列；当有云任务执行完毕离开某个虚拟机后，数据中心会将位于队列缓冲区头部的云任务分配给此虚拟机；当云任务获得对虚拟机的访问权限后，能立即向云任务提供云服务；在云任务执行的过程中，当云任务的响应时间T_response过长时，会造成SLA违规的现象；在训练堆叠降噪自动编码器的过程中，将虚拟机的参数集合组成的高维矩阵作为堆叠降噪自动编码器网络输入层的数据，并通过堆叠降噪自动编码器将对高维矩阵进行降维与数据重构，得到优化后的QoS特征信息；

虚拟机的参数集合包括云任务响应时间、队列长度、虚拟机CPU利用率、带宽、CPU数量、内存大小、内存占用率、虚拟机迁移次数、虚拟机迁移时间开销、虚拟机上一时刻的SLA违反率；当数据中心内有p台虚拟机处于启动状态时，在每一个调度周期间隔内，虚拟机的参数集合会构成p×10的高维矩阵M₁；

将数据中心的运行时间视为由成若干个连续时间片所组成，每个时间片的长度定义为t；因此在时隙t内，单个虚拟机的排队模型通过以下公式进行定义：

Q_k(t_j+1)＝max{Q_k(t_j)-μ_k，0}+λ_k(t_j)； (1)

其中，Q_k(t_j)和Q_k(t_j+1)是第j个和第j+1个时间片中第k个虚拟机VM_k的队列长度；μ_k表示在第j个时间片t_j中第k个虚拟机VM_k处理的云任务数；λ_k(t_j)是第j个时间片t_j中第k个虚拟机VM_k队列中的云任务数量；当Q_k(tj)≤μ_k时，虚拟机中的队列长度小于虚拟机处理能力μ_k，虚拟机的队列长度能达到最小值0；

虚拟机排队模型的长度会直接影响数据中心中主机的运行状态；主机的运行状态分为以下两类：

1)活跃状态：主机上虚拟机的云任务队列不为空，云任务正在等待被处理；

2)空闲状态：主机上虚拟机的云任务队列为空，处于空闲状态的主机可被视为处于睡眠模式，且处于低功耗状态，处于空闲状态下主机产生的功耗为一恒定值；

数据中心的功耗模型描述为如下形式：

式中，E表示当前数据中心的总体能源功耗量，其中能耗等式右侧的第一项表示当前处于活动状态的物理主机产生的总功耗；p是运行中的物理主机的数量，P_α是第α个处于活动状态的物理主机的功耗；q是处于空闲状态的物理主机的数量，P_l是第l个处于空闲状态的物理主机的功耗；空闲状态下的功耗看作是一个常量；M是当前数据中心可用虚拟机的最大数量；

公式(2)以如下形式表示：

其中P_θ为第θ个处于活动状态的物理主机的功耗，1≤θ≤M，C为空闲状态下主机的恒定功耗常量，Q_θ(t_j)是第j个时间片中第θ个虚拟机的队列长度；

S2、利用堆叠降噪自动编码器技术对数据中心的QoS特征进行提取，得到降维后描述QoS特征信息的矩阵，通过该矩阵求得当前的虚拟机的最大响应时间，以完善协同优化目标函数的约束条件；利用堆叠降噪自动编码器技术对数据中心中的虚拟机的资源占用历史数据进行处理，通过堆叠降噪编码器的鲁棒性提取出影响数据中心QoS指标的特征信息；

在编码器损失函数的最小化过程中，同时将堆叠降噪自动编码器的复杂度也作为其中一项指标参与到训练的过程中，作为损失函数的约束项；在损失函数后加入了基于权重衰减的正则项，以提升堆叠降噪自动编码器的泛化效果以避免过拟合，并采用x和

的交叉熵

作为损失函数，进一步增强堆叠降噪自动编码器的鲁棒性；堆叠降噪自动编码器的网络结构包括输入层、损坏输入层、隐藏层以及输出层；堆叠降噪自动编码器在对编码之前的数据执行随机损坏处理，将噪声添加到训练数据中，从而迫使编码器从输入层数据中学习并提取更好的QoS特征信息；令x_i表示原始输入数据样本，其中1≤i≤D，且D为堆叠降噪自动编码器输入层的样本总数；

表示加入了高斯噪声之后的损坏数据，W₁和W₂分别代表编码器和解码器的权重；b₁和b₂代表偏置项，堆叠降噪自动编码器(SDAE)的编码函数对原始输入进行编码，得到新的特征表征

编码过程如下所示：

其中sigm(·)是sigmoid函数，sigm(x)＝1/(1+exp(-x))，它被用来作为非线性确定性的映射；解码函数将来自隐藏层的表征h_i输入重构为原始输入

解码过程如下所示：

训练堆叠降噪自动编码器的目的是优化参数集合Θ＝{W₁，W₂，b₁，b₂}以最小化x_i和

之间的重构误差；令L(Θ)代表堆叠降噪自动编码器的损失函数，降噪自动编码器的优化目标函数

表示为：

在最小化损失函数的过程中，同时考虑到堆叠降噪自动编码器的复杂度，将模型的复杂度也作为其中一项指标参与到训练的过程中，进而约束模型；在损失函数后加入基于权重衰减的正则项，以提升模型的泛化效果以避免过拟合；权重衰减是放在正则项前的系数，用于调节模型复杂度对损失函数的影响；

采用x和

的交叉熵

作为损失函数；

其中

为堆叠降噪自动编码器在第j个时间片时，第i个样本的权重向量的平方损失函数值，其中，1≤j≤T-1，T为时间片的总数；1≤i≤D，D为堆叠降噪自动编码器输入层的样本总数；γ是正则项的权重调节系数；0.001≤γ≤0.002；由此得到最终的损失函数如下所示：

其中交叉熵损失函数

可表示为：

根据上式，堆叠降噪自动编码器的损失优化函数可表示为：

通过使用拟牛顿法进行求解，用于估计参数

其中

为编码器权重的估计值，

为解码器权重的估计值，

为偏置项b₁的估计值，

为偏置项b₂的估计值，通过使用求得的估计参数作为堆叠降噪自动编码器网络模型的参数，得到反应虚拟机QoS特征信息的低维矩阵M₂；

以云任务的最大响应时间T_response作为数据中心服务质量的评估标准；令T_max表示云任务的最大响应时间；T_SLA表示服务水平协议指定的最大响应时间；T_DAE表示堆叠降噪自动编码器通过当前虚拟机的QoS特征信息矩阵M₂与T_SLA的余弦相似度计算出在该虚拟机上的云任务最大响应时间；T_response小于T_DAE和T_SLA之间的最小值；总体的协同优化目标函数如下：

T_response＜T_max

T_max＝min(T_DAE，T_SLA) (10)；

S3、结合云任务到达排队模型、协同优化目标优化函数和李雅普诺夫优化方法，求得满足能耗与QoS优化调度的虚拟机应该具备的云任务队列长度条件，得到基于李雅普诺夫优化理论的资源调度算法，采用资源调度算法将能耗与QoS协同优化的资源调度问题具体到每一个时间片内进行求解，实现基于能耗与QoS协同优化的资源调度。

2.根据权利要求1所述的一种基于能耗与QoS协同优化的资源调度实现方法，其特征在于，步骤S3中，利用李雅普诺夫优化理论对云任务到达排队模型的队列长度进行分析，并利用QoS特征信息对当前时刻的云任务执行时间进行拟合，改善数据中心资源调度的时间约束条件；

当Q_k(t_j)＝0时，资源调度算法应最大程度地减少虚拟机的非空任务队列的数量，以减少数据中心产生的能耗；与此同时，当Q_k ^max(t_j)＝Q_k(t_j)+μ_k时，云任务队列的长度应保持足够地大，以便使得虚拟机的处理能力得到充分的释放。

3.根据权利要求2所述的一种基于能耗与QoS协同优化的资源调度实现方法，其特征在于，李雅普诺夫方程表达为如下的形式：

其中Q_k(t_j)是第j个时间片中第k个虚拟机的队列长度，Θ(t_j)是第j个时间片中堆叠降噪自动编码器的优化目标函数的取值；

为在第j个时间片中堆叠降噪自动编码器的优化目标函数的李雅普诺夫方程取值，1≤j≤T-1，T为时间片的总数，1≤k≤N，N为当前数据中心可用虚拟机的最大数量，在每个时间片t_j内，李雅普诺夫漂移函数定义为如下形式：

其中，Δ(Θ(t_j))为漂移值大小，在云计算波动的环境下需保持云任务队列的稳定性，公式(12)的结果应收敛，漂移值Δ(Θ(t_j))的最终结果取值越小便说明云任务队列越稳定；

在保证云任务服务质量的前提下，使物理主机的能源消耗得到进一步地降低，也就是令虚拟机排队模型中运行的虚拟机数量降至最低；协同优化问题的目标函数重写为：

其中V是单位转换系数，其作用是将能源消耗量转换为相应的云任务队列长度单位；根据李雅普诺夫优化方法，数据中心的资源调度协同优化目标函数从公式(13)中得到：

该函数的求解过程如下所示：

Q_k ^max(t_j)Q_k(t_j)-Q_k ²(t_j)-μ_k·Q_k(t_j)+V·P_k＝0 (15)

对公式(15)进行变形转换，得到如下形式的等效公式：

Q_k(t_j)[Q_k ^max(t_j)-Q_k(t_j)-μ_k]+V·P_k＝0 (16)

其中P_k是第k个虚拟机的李雅普诺夫漂移加罚函数的惩罚值，公式(16)的第一个解为：

Q_k(t_j)＝0 (17)

当Q_k(t_j)≠0时，公式(16)通过一元二次方程式求解得结果：

如公式(18)所示，Q_k(t_j)≥Q_k ^max(t_j)-μ_k；当Q_k(t_j)≠0时，资源调度算法必须要满足如下条件：Q_k(t_j)＝Q_k ^max(t_j)-μ_k；因此当Q_k(t_j)＝0时，资源调度算法应最大程度地减少VM的非空任务队列的数量；与此同时，当Q_k ^max(t_j)＝Q_k(t_j)+μ_k时，资源调度算法将优先使得虚拟机地利用率趋于或处于满载状态，以便使得虚拟机的处理能力得到充分的释放。

4.根据权利要求1～3任一项所述的一种基于能耗与QoS协同优化的资源调度实现方法，其特征在于，基于李雅普诺夫优化理论的资源调度算法在云环境的每个预设调度周期由数据中心执行，资源调度算法的执行过程如下：

若有λ(t_j)个云任务在该周期内到达数据中心，T_max为云任务的最大响应时间；

首先针对当前的云任务排队队列[Q₁(t_j)，Q₂(t_j)，…，Q_k(t_j)]，找到队列长度最短的队列Q_k(t_j)；如果Q_k(t_j)＞Q_k ^max(t_j)-λ_k(t_j)，则：

λ(t_j)＝λ(t_j)-λ_k(t_j)； (20)

其中λ(t_j)为当前待处理的云任务数目；

如果Q_k(t_j)≤Q_k ^max(t_j)-λ_k(t_j)，则令λ_k(t_j)＝λ(t_j)；并将已被分配给虚拟机的队列从[Q₁(t_j)，Q₂(t_j)，…，Q_k(t_j)]中移除，并重复上述步骤直至云任务排队队列长度为0；资源调度算法是将具有非空队列的虚拟机的资源利用率按升序排列，以便在具有非空队列的虚拟机中，选择满足李雅普诺夫优化条件的队列的虚拟机进行迁移，使得利用率最低的虚拟机达到最大资源利用率极限。