CN115617526A

CN115617526A - 基于云数据中心构建和虚拟机整合的云数据中心节能方法

Info

Publication number: CN115617526A
Application number: CN202211386286.2A
Authority: CN
Inventors: 吕义飞; 刘筱; 夏云霓; 吴曾; 彭青蓝; 朱治学; 孙晓宁
Original assignee: Chongqing Jinyuyun Energy Technology Co ltd; Chongqing University
Current assignee: Chongqing Jinyuyun Energy Technology Co ltd; Chongqing University
Priority date: 2022-11-07
Filing date: 2022-11-07
Publication date: 2023-01-17

Abstract

本发明提出了一种基于云数据中心构建和虚拟机整合的云数据中心节能方法，包括以下步骤：S1，建立云数据中心资源模型；S2，若数据中心资源不足，使用DQN模型选择物理机扩容数据中心；若数据中心资源充足，则执行下一步骤；S3，进行虚拟机整合以优化空闲资源，降低云数据中心的能耗。本发明能够通过对物理机的选型从而减少虚拟机和***产生资源碎片的数量；以及将不同宿主机上的虚拟机进行动态整合，关闭部分低负载物理机，从而减少空闲资源，降低能源消耗量。

Description

基于云数据中心构建和虚拟机整合的云数据中心节能方法

技术领域

本发明涉及云计算能耗领域，特别是涉及一种基于云数据中心构建和虚拟机整合的云数据中心节能方法。

背景技术

云计算作为一种逐步发展成熟的服务计算模式具有重要的实际应用意义。近年来，云计算技术架构和商业模式越来越成熟，其对众多类型的应用程序和计算场景展现出的良好的兼容性使得其服务范围涵盖了企业单位，政府机关，科研院校等各个行业。云计算技术为人们的日常工作和生活提供了便捷，其用户群体也愈发庞大，云数据中心的用户需求也愈发密集。为了应对庞大的用户需求量，云提供商需建立大体量的云数据中心。如今大规模的数据中心都配备了数千甚至上万台物理机，这些物理机会产生资源利用率低、能源消耗量大等问题。

用户请求通常会以虚拟机或容器的方式部署在宿主机上，当一台宿主机搭载多台不同的虚拟机时，很容易出现由于某种硬件资源数量限制而使其他硬件资源无法被使用的情况，这种资源闲置会导致数据中心产生不必要的资源碎片。资源碎片的产生的重要原因是宿主机和虚拟机资源量的亲和性，即虚拟机的资源需求量和宿主机的资源拥有量并不总是完全匹配。在实际工业生产条件下，构成云数据中心物理机的型号及资源量等指标往往不同，云提供商对外租售的虚拟机类型，每种类型虚拟机保有的资源量也有所差异。在云数据中心集群运行过程中，选用何种类型的物理机来承载虚拟机和***产生资源碎片的数量有联系密切。

现有商业模式下，用户多以租约的形式向云提供商的请求服务，宿主机上运行的虚拟机在用户请求到期后会被释放，宿主机出现空闲资源；云数据中心内的宿主机在运行过程中需要大量的能耗开销，资源碎片和空闲资源都会增加非必要的电力消耗，造成电能浪费。将不同宿主机上的虚拟机进行动态整合可以减少空闲资源，关闭部分低负载物理机，降低能源消耗量。

经过广泛而深入的调研后，我们发现目前云环境下有关减少资源碎片和降低空闲资源的研究还存在了一些不足：

(1)现有的云数据中心优化策略，多数将研究对象设定为了静态云数据中心，较少研究将研究对象设置资源保有量和承载量不断变化的动态云数据中心。

(2)现有的方法没有考虑在云数据中心建立过程中用户资源需求对物理机选型策略的影响，没有对优化云数据中心资源碎片这一问题进行深入研究。

(3)现有的虚拟机整合策略，多数只考虑单一资源限制(例如：CPU核心数量或内存大小)而未对多种资源限制综合考虑。

发明内容

本发明旨在至少解决现有技术中存在的技术问题，特别创新地提出了一种基于云数据中心构建和虚拟机整合的云数据中心节能方法。

为了实现本发明的上述目的，本发明提供了一种基于云数据中心构建和虚拟机整合的云数据中心节能方法，包括以下步骤：

S1，建立云数据中心资源模型；

S2，若数据中心资源不足，使用DQN模型选择物理机扩容数据中心；若数据中心资源充足，则执行下一步骤；

S3，进行虚拟机整合以优化空闲资源，降低云数据中心的能耗。

进一步地，所述S1包括以下步骤：

S1-1，设定云提供商提供L种不同类型的虚拟机出租给用户，用户的资源请求序列定义为：R＝{r₁,r₂,r₃,...}，r_j∈R,j＝(1,2,3,...,n)，其中r_j表示请求序列中的第j个资源请求；每个用户请求对应一台虚拟机

其中虚拟机

的资源量为

表示请求r_j请求的CPU数量，

表示请求r_j请求的内存数量；

S1-2，共有K种拥有不同资源量的物理机可以用来构建云数据中心，每种类型的物理机都具有的不同的CPU核心数量、内存资源量以及单日最大能耗量；

S1-3，通过约束条件建立云数据中心资源模型：

构建组成云数据中心的物理机序列：

其中

代表类型为k的第i台物理机，每台物理机包含三个属性

其中

表示该物理机的cpu数量，

表示该物理机的内存数量，

表示该物理机的单日能耗；

所有的用户请求都通过虚拟机的方式部署在对应的物理机上，所以用于构建云数据中心的物理机所拥有的资源量总要满足以下约束条件：

其中m表示物理机的总数；

n表示用户提出的请求的数量；

表示位于物理机

的虚拟机

的cpu核心数；

表示位于物理机

的虚拟机

的内存大小；

上述约束的作用在于，保证目标物理机拥有的资源量大于虚拟机的申请资源量，否则，当前物理机不能满足组成云数据中心基础设施的条件。

物理机和其负载的虚拟机具有一一对应的关系，这种映射关系在整个数据中心集群中具有唯一性，使用一个布尔变量f_i,j＝{0,1}标识用户请求r_j和物理机

的映射关系。且每台物理机

和其负载的虚拟机

是一对多的关系，对于给定的第i台物理机

的其负载情况均应满足：

其中，r_j表示请求序列中的第j个用户请求；

代表类型为k的第i台物理机。

该约束的作用在于，规定单台物理机的每种资源阈值，约束模型中的单台物理机资源上限。

进一步地，所述S2包括以下步骤：

S2-1，确定DQN模型中的智能体状态集、动作集、奖励值；

S2-2，使用DQN模型进行物理机选型，选型问题视作一个马尔科夫决策过程。

进一步地，所述S2-1包括以下步骤：

(1)获取云数据中心中物理机在t时刻的***状态，状态集

其中，

代表集群中类型k的物理机的平均CPU利用率，

代表集群中类型k的物理机的平均内存利用率；

(2)设置动作集覆盖所有K个类型的待选择物理机，动作a∈A，其中a包含一维两种状态{add,pass}，即要或不要向集群中添加该种类型的物理机；A为所有型号的物理机的动作集合，即为动作集；

(3)得到与状态集和动作集相关的奖励函数：

首先，分别求取已加入集群的每台物理机产生的空闲资源量，其计算方式如下：

其中，

表示该台物理机空闲的CPU数量；

表示类型为k的物理机空闲的内存数量；

表示位于物理机

的虚拟机

的cpu核心数；

表示位于物理机

的虚拟机

的内存大小。

然后，计算某时刻该物理机产生的资源碎片量CPU碎片量和内存碎片量分别记：

DQN模型优化的目标是为了减小资源碎片的总量，为了降低算法的计算度模型，将它们做归一化处理：

其中

为资源碎片量；

α为调节CPU和内存之间单位价值的参数；

型号为k的物理机的奖励值R按如下设定，即产生碎片资源越小的物理机可以获得越高的奖励：

其中，

表示型号为k的物理机在t时刻的奖励值。

进一步地，所述选型过程中Q值表的更新规则如下：

S2-2-1，当前状态s进行一次前馈，可获得所有动作预测的Q值：

max_a'Q(s',a')

S2-2-2，对下一个状态s'进行一次前馈，计算整个网络最大的输出值：

其中

表示型号为k的物理机在t+1时刻的奖励值；

S2-2-3，为动作目标设置Q值；

S2-2-4，利用深度卷积神经网络逼近值函数；

S2-2-5，利用经验回放训练强化学习的学习过程。

进一步地，所述S3包括以下步骤：

S3-1，确定待迁出虚拟机的源主机列表；

S3-1-1，建立迁出算子池D＝{d₁,d₂,d₃,...,d_z},d_p∈d_z，其中d_p代表不同的迁出算子，每种算子代表了不同的物理机迁移优先级确定策略；

所述迁出算子包括：

算子d₁按照集群中物理机负载量高低确定其迁移优先级，负载量低的物理机优先迁移；

算子d₂按照集群中物理机CPU资源利用率确定其迁移优先级，资源利用率的物理机优先迁移；

算子d₃按照集群中物理机内存资源利用率确定其迁移优先级，内存利用率低的物理机优先迁移；

算子d₄按照集群中物理机CPU利用率和内存利用率之差确定其迁移优先级，利用率差值大的物理机优先迁移。

S3-1-2，给每个算子赋予权重，分别记作：{w₁,w₂,w₃,...,w_p}，其中w_p对应算子d_p的权重；

S3-1-3，根据每天的虚拟机迁移数量上限以及每个算子的权重确定每种算子可以分配到的虚拟机迁移台数；

S3-1-4，每个算子的权重值更新；

S3-1-5，计算每个算子以新权重w_n分配迁移次数后的***新的总能耗成本E_n与E的大小，E表示预迁出完成后的总能耗成本；如果E>E_n，则输出迁移序列L；如果E<E_n，则返回步骤S3-1-4，再次进行权重更新；

S3-2，确定待迁入虚拟机的目标主机列表；

S3-2-1，获取步骤S5-1中输出的已迁出的虚拟机列表L作为本步骤的输入；

S3-2-2，建立迁入算子池R＝{r₁,r₂,r₃,...,r_P},r_p∈r_P，其中r_p代表不同的迁入算子，每种算子代表了不同的虚拟机迁入优先级确定策略；

所述迁入算子包括：算子r₁：目标物理机按照CPU资源量优先排序，优先将虚拟机迁入CPU空闲率高的物理机；

算子r₂：目标物理机按照内存资源量优先排序，优先将虚拟机迁入内存空闲率高的物理机；

算子r₃：目标物理机按照综合资源量优先排序，优先将虚拟机迁入总资源空闲率高的物理机。

S3-2-3，保存集群当前状态，分别使用每个迁入算子进行预迁入，并计算其增加的能耗成本；

S3-2-4，选择增加能耗成本最少的算子，并完成迁入操作。

进一步地，所述每天的虚拟机迁移数量上限为：

其中，u是每日可以迁移的虚拟机数量；

m表示物理机的总数；

n表示用户提出的请求的数量；

f_i,j＝{0,1}表示用户请求r_j和物理机s_i的映射关系；

表示虚拟机迁移完成后，用户请求r_j和新的物理机之间的映射情况；

nav为整个数据中心中虚拟机的数量。

进一步地，所述每个算子的权重值更新包括以下步骤：

(1)为每种算子分配可迁移虚拟机台数，进行虚拟机预迁出并将已完成预迁出的虚拟机加入迁出列表L，计算预迁出完成后节约的总能耗成本E；

(2)算子权重由基础权重和临时权重两部分组成，每次预迁移后会更新算子临时权重；

(3)计算每种算子节省的能耗成本e，挑选出其中节省成本最多的算子记作

按照下面公式更新其临时权重：

其中，

表示算子

的临时权重；

表示算子

的起始权重；

表示该算子

在预迁移之后减少的能耗开销；

e'_p指算子d_p在预迁移之后减少的能耗开销；

z表示迁出算子池中算子的总数量；

(4)按照如下公式，更新其他算子临时权重：

其中，w_t表示该算子d_p的起始权重；

为算子的临时权重；

e'_p表示该算子d_p在预迁移之后减少的能耗开销；

z表示迁出算子池中算子的总数量；

(5)按照如下公式，更新算子权重：

w_n＝λw_p+(1+λ)w

其中，w_n是算子更新后的权重值；

w_p是算子d_p未更时候的基础权重；

为算子的临时权重；

λ∈(0,1)为一个参数，使用二分法调节更新时算子基础权重和临时权重加权求和时的权重比例至最优权重。

综上所述，由于采用了上述技术方案，本发明能够通过对物理机的选型从而减少虚拟机和***产生资源碎片的数量；以及将不同宿主机上的虚拟机进行动态整合，关闭部分低负载物理机，从而减少空闲资源，降低能源消耗量。

本发明的附加方面和优点将在下面的描述中部分给出，部分将从下面的描述中变得明显，或通过本发明的实践了解到。

具体实施方式

下面详细描述本发明的实施例，其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面描述的实施例是示例性的，仅用于解释本发明，而不能理解为对本发明的限制。

S1，建立云数据中心资源模型。

S1-1，设定云提供商提供L种不同类型的虚拟机出租给用户。用户的资源请求序列定义为：R＝{r₁,r₂,r₃,...}，r_j∈R,j＝(1,2,3,...,n)，其中r_j表示请求序列中的第j个资源请求。每个用户请求对应一台虚拟机

其中虚拟机

的资源量为

表示请求r_j请求的CPU数量(单位：核)，

表示请求r_j请求的内存数量(单位：GB)。

S1-2，设定共有K种拥有不同资源量的物理机可以用来构建云数据中心。每种类型的物理机都具有的不同的CPU核心数量、内存资源量以及单日最大能耗量。

S1-3，通过约束条件建立云数据中心资源模型。

构建组成云数据中心的物理机序列：

其中

代表类型为k的第i台物理机，每台物理机包含三个属性

其中

表示该物理机的cpu数量(单位：核)，

表示该物理机的内存数量(单位：GB)，

表示该物理机的单日能耗(单位：kw/h)。

其中m表示物理机的总数；

n表示用户提出的请求的数量；

表示位于物理机

的虚拟机

的cpu核心数；

表示位于物理机

的虚拟机

的内存大小；

的映射关系。且每台物理机

和其负载的虚拟机

是一对多的关系，对于给定的第i台物理机

的其负载情况均应满足：

S2，使用DQN模型选择物理机扩容数据中心，所述DQN模型即深度强化学习模型。

我们将云数据中心数量不足的资源定义为短板资源。对数据中心资源扩容时，需要根据用户对不同类型的虚拟机请求量和当前云数据中心中各种资源的剩余状态来动态进行物理机选择。在虚拟机DQN的核心思想是确定模型中的智能体，使其执行动作序列来与周围环境交互来获得奖励，并根据奖励值优化动作序列直至完成模型结果收敛。在本模型中将物理机资源碎片量做为学习智能体，与云数据中心资源量、负载变化、用户请求情况等指标进行交互来进行优化学习。

S2-1，确定DQN模型中的智能体状态集、动作集、奖励值以及***环境。

(1)获取云数据中心中物理机在t时刻的***状态，状态集

其中，

代表集群中类型k的物理机的平均CPU利用率，

代表集群中类型k的物理机的平均内存利用率；

(2)设置动作集覆盖所有K个类型的待选择物理机，动作a∈A，其中a包含一维两种状态{add,pass}，即要或不要向集群中添加该种类型的物理机；A为所有型号的物理机的动作集合，即为动作集。

(3)得到与状态集和动作集相关的奖励函数

其中，

表示该台物理机空闲的CPU数量，

表示类型为k的物理机空闲的内存数量；

其中

为资源碎片量，α为调节CPU和内存之间单位价值的参数。

其中，

表示型号为k的物理机在t时刻的奖励值；

每个状态下的动作数量会和k值大小与采样时刻t的多少相关，为了节约内存空间，使用神经网络来表示Q值函数，每层网络的权重就是对应的Q值函数。

例：假设k＝100,读取的时刻数取10，则每组状态下就会生成2000个Q值，利用神经网络来决策具有最高Q值的动作，使用简单平方差作为损失函数来优化神经网络：

其中s'表示s状态之后的下一个状态；

a'表示s'状态下要执行的动作；

对Q值函数使用如下更新规则：

S2-2，物理机的选型问题可以视作一个马尔科夫决策过程，使用<s,a,r,s'>来表示这一过程。对于给定的马尔科夫决策过程，基于DQN模型的物理机选型步骤中Q值表的更新规则如下：

max_a'Q(s',a')

其中

表示型号为k的物理机在t+1时刻的奖励值；

S2-2-3，为动作目标设置Q值；

S2-2-4，利用深度卷积神经网络逼近值函数；

S2-2-5，利用经验回放训练强化学习的学习过程；

具体执行过程实施如下：

1.初始化经验池D，容量为N；

2.初始化估值Q网络：Q(s,a)，其中θ为神经网络的参数；

3.初始化目标Q网络：Q^π(s,a)，其中θ_-为目标网络的参数；

4.初始化起始状态s；

5.在状态s，利用概率ε随机选择动作a∈A；若小概率事件没有发生，贪婪选择当前状态下值函数最大的那个动作；

6.得到即使奖励r和新的状态s'；

7.将s,a,r,s'放入经验池D中，D会随着程序的运行而不断扩容；

8.从D中采样得到ss,aa,rr,ss'；

9.按照如下方式计算采样动作在目标Q网络中的奖励值；

这里的ss'是否为终止态，即为学习过程中允许循环的最大次数。

10.以[y-Q(ss,aa)]²作为损失函数来训练估值Q网络；

11.将状态s更新至s'

12.每隔C步将，估值Q网络中的θ参数值赋值给目标Q网络中的参数θ_-

13.重复步骤5-12直至s为终止状态(即资源碎片量数量最低)

14.重复步骤4-13直至估值Q网络收敛。

15.输出估值Q网络Q(s,a)

16.根据输出的结果贪心选择Q值最大的物理机。

本步骤主要内用是根据云数据中心中物理机的资源剩余情况进行虚拟机整合，搜索目标解集空间领域中的近似最优解，得到使空闲资源量最少的虚拟机部署方式，以降低云数据中心的能耗量。物理机的负载状态会影响其电能消耗量，在空负载情况下，云提供商通常会将物理机切换至待机或关机状态来节约电能。这里使用一个布尔变量b_i＝{0,1}标识物理机

的开关机状态。在统计整个数据中心的能耗成本时，可以忽略处于关机态的物理机产生的能耗开销，数据中心一段时间内总能耗成本ec_d计算方式如下：

表示第i台物理机的单日能耗。

其中Y表示连续Y天内的数据中心的总能耗成本。

在实际场景下，为了缩减***能耗成本，通常会将集群内部的虚拟机进行整合，但进行虚拟机整合工作会带来时间成本的开销，即每天可以迁移的最大虚拟机台数是固定的，于是每日的数据中心虚拟机迁移数量上限为：

其中，u是每日可以迁移的虚拟机数量；

f_i,j＝{0,1}表示用户请求r_j和物理机s_i的映射关系；

表示虚拟机迁移完成后，用户请求r_j和新的物理机之间的映射情况。

nav为整个数据中心中虚拟机的数量；

因此得到问题的优化总目标为：

min tec

s.t.：

u≤nav*5％

其中，tec为数据中心在连续一段时间内的总能耗成本。

在虚拟机首次部署时，由于为了尽快的相应用户需求以保证服务质量，采用首次适应的贪心算法将虚拟机部署到数据中心集群中。该算法会不可避免的使云数据中心产生空闲资源。

虚拟机整合可以很大程度上减少空闲资源带来的能耗开销，其的目标是为了降低能耗成本，主要思想是将资源利用率低或者资源利用严重不平衡的物理机上的负载迁移到其他物理机上以关闭低负载物理机并实现物理机的负载均衡以节省能耗开销。虚拟机整合策略中关键的步骤是确定哪些物理机为需要迁出虚拟机的源主机和哪些物理机为接收虚拟机的目标主机。由于组成云数据中心的物理机种类并不单一，具体的迁移策略会受到每台物理机资源使用情况、总资源量等指标的影响，所以确定源主机和目标主机的参考指标也应动态变化，其具体步骤如下：

S3-1，确定待迁出虚拟机的源主机列表；

S3-1-1，建立迁出算子池D＝{d₁,d₂,d₃,...,d_z},d_p∈d_z，其中d_p代表不同的迁出算子，每种算子代表了不同的物理机迁移优先级确定策略。

为了便于理解，这里列举一些算子实例：

算子d₄按照集群中物理机CPU利用率和内存利用率之差确定其迁移优先级，利用率差值大的物理机优先迁移；

S3-1-3，根据每天的虚拟机迁移数量上限以及每个算子的权重确定每种算子可以分配到的虚拟机迁移台数。(初始每个算子权重值相同)

S3-1-4，按照下面公式进行每个算子的权重值更新；

按照下面公式更新其临时权重：

其中，

表示算子

的临时权重；

表示算子

的起始权重；

表示该算子

在预迁移之后减少的能耗开销；

e'_p指算子d_p在预迁移之后减少的能耗开销；

z表示迁出算子池中算子的总数量。

(4)按照如下公式，更新其他算子临时权重：

其中，w_t表示该算子d_p的起始权重；

为算子的临时权重；

e'_p表示该算子d_p在预迁移之后减少的能耗开销；

z表示迁出算子池中算子的总数量。

(5)按照如下公式，更新算子权重：

w_n＝λw_p+(1+λ)w

其中，w_n是算子更新后的权重值；

w_p是算子d_p未更时候的基础权重；

为算子的临时权重；

S3-1-5，计算每个算子以新权重w_n分配迁移次数后的***新的总能耗成本E_n与E的大小，E表示预迁出完成后的总能耗成本；如果E>E_n，则输出迁移序列L；如果E<E_n，则返回步骤S3-1-4，再次进行权重更新。

S3-2，确定待迁入虚拟机的目标主机列表；

为了便于理解，下面列举了一些算子实例：

算子r₁：目标物理机按照CPU资源量优先排序，优先将虚拟机迁入CPU空闲率高的物理机；

算子r₃：目标物理机按照综合资源量优先排序，优先将虚拟机迁入总资源空闲率高的物理机；

S3-2-4，选择增加能耗成本最少的算子，并完成迁入操作。

尽管已经示出和描述了本发明的实施例，本领域的普通技术人员可以理解：在不脱离本发明的原理和宗旨的情况下可以对这些实施例进行多种变化、修改、替换和变型，本发明的范围由权利要求及其等同物限定。

Claims

1.一种基于云数据中心构建和虚拟机整合的云数据中心节能方法，其特征在于，包括以下步骤：

S1，建立云数据中心资源模型；

2.根据权利要求1所述的一种基于云数据中心构建和虚拟机整合的云数据中心节能方法，其特征在于，所述S1包括以下步骤：

其中虚拟机

的资源量为

表示请求r_j请求的CPU数量，

表示请求r_j请求的内存数量；

S1-3，通过约束条件建立云数据中心资源模型：

构建组成云数据中心的物理机序列：

其中

代表类型为k的第i台物理机，每台物理机包含三个属性

其中

表示该物理机的cpu数量，

表示该物理机的内存数量，

表示该物理机的单日能耗；

其中m表示物理机的总数；

n表示用户提出的请求的数量；

表示位于物理机

的虚拟机

的cpu核心数；

表示位于物理机

的虚拟机

的内存大小；

每台物理机

和其负载的虚拟机

是一对多的关系，对于给定的第i台物理机

的其负载情况均应满足：

其中，r_j表示请求序列中的第j个用户请求；

代表类型为k的第i台物理机。

3.根据权利要求1所述的一种基于云数据中心构建和虚拟机整合的云数据中心节能方法，其特征在于，所述S2包括以下步骤：

S2-1，确定DQN模型中的智能体状态集、动作集、奖励值；

4.根据权利要求3所述的一种基于云数据中心构建和虚拟机整合的云数据中心节能方法，其特征在于，所述S2-1包括以下步骤：

(1)获取云数据中心中物理机在t时刻的***状态，状态集

其中，

代表集群中类型k的物理机的平均CPU利用率，

代表集群中类型k的物理机的平均内存利用率；

(3)得到与状态集和动作集相关的奖励函数：

其中，

表示该台物理机空闲的CPU数量；

表示类型为k的物理机空闲的内存数量；

表示位于物理机

的虚拟机

的cpu核心数；

表示位于物理机

的虚拟机

的内存大小；

其中

为资源碎片量；

α为调节CPU和内存之间单位价值的参数；

其中，

表示型号为k的物理机在t时刻的奖励值。

5.根据权利要求3所述的一种基于云数据中心构建和虚拟机整合的云数据中心节能方法，其特征在于，所述选型过程中Q值表的更新规则如下：

max_a'Q(s',a')

其中

表示型号为k的物理机在t+1时刻的奖励值；

S2-2-3，为动作目标设置Q值；

S2-2-4，利用深度卷积神经网络逼近值函数；

S2-2-5，利用经验回放训练强化学习的学习过程。

6.根据权利要求3所述的一种基于云数据中心构建和虚拟机整合的云数据中心节能方法，其特征在于，所述S3包括以下步骤：

S3-1，确定待迁出虚拟机的源主机列表；

S3-1-4，每个算子的权重值更新；

S3-2，确定待迁入虚拟机的目标主机列表；

S3-2-4，选择增加能耗成本最少的算子，并完成迁入操作。

7.根据权利要求6所述的一种基于云数据中心构建和虚拟机整合的云数据中心节能方法，其特征在于，所述每天的虚拟机迁移数量上限为：

其中，u是每日可以迁移的虚拟机数量；

m表示物理机的总数；

n表示用户提出的请求的数量；

f_i,j＝{0,1}表示用户请求r_j和物理机s_i的映射关系；

nav为整个数据中心中虚拟机的数量。

8.根据权利要求6所述的一种基于云数据中心构建和虚拟机整合的云数据中心节能方法，其特征在于，所述每个算子的权重值更新包括以下步骤：

按照下面公式更新其临时权重：

其中，

表示算子

的临时权重；

表示算子

的起始权重；

表示该算子

在预迁移之后减少的能耗开销；

e'_p指算子d_p在预迁移之后减少的能耗开销；

z表示迁出算子池中算子的总数量；

(4)按照如下公式，更新其他算子临时权重：

其中，w_t表示该算子d_p的起始权重；

为算子的临时权重；

e'_p表示该算子d_p在预迁移之后减少的能耗开销；

z表示迁出算子池中算子的总数量；

(5)按照如下公式，更新算子权重：

w_n＝λw_p+(1+λ)w

其中，w_n是算子更新后的权重值；

w_p是算子d_p未更时候的基础权重；

为算子的临时权重；