CN103873498B - 云平台资源自适应预警方法与*** - Google Patents

云平台资源自适应预警方法与*** Download PDF

Info

Publication number
CN103873498B
CN103873498B CN201210531771.4A CN201210531771A CN103873498B CN 103873498 B CN103873498 B CN 103873498B CN 201210531771 A CN201210531771 A CN 201210531771A CN 103873498 B CN103873498 B CN 103873498B
Authority
CN
China
Prior art keywords
consumption data
resource
resource consumption
virtual machine
physical machine
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201210531771.4A
Other languages
English (en)
Other versions
CN103873498A (zh
Inventor
陆浩
王福荣
王丽清
胡华伟
吴子特
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Telecom Corp Ltd
Original Assignee
China Telecom Corp Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Telecom Corp Ltd filed Critical China Telecom Corp Ltd
Priority to CN201210531771.4A priority Critical patent/CN103873498B/zh
Publication of CN103873498A publication Critical patent/CN103873498A/zh
Application granted granted Critical
Publication of CN103873498B publication Critical patent/CN103873498B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Debugging And Monitoring (AREA)

Abstract

本发明实施例公开了一种云平台资源自适应预警方法与***,其中,方法包括:节点管理单元按照第一预设周期采集物理机与各虚拟机的各种资源消耗数据并上报给资源分析预警服务器;资源分析预警服务器按照第二预设周期对各种资源消耗数据进行分析,预测未来各采集点物理机与各虚拟机的各种资源消耗数据;实时监控物理机的运行负载,若超过预警门限值,采集各虚拟机在当前时刻的资源消耗数据,并分析相对于之前预测的资源消耗数据的变化率是否大于1;若大于1,重新预测未来各采集点的资源消耗数据;并在预测出的资源消耗数据超过预设告警门限值时,进行事件通知。本发明实施例可以预测分析虚拟机未来的资源消耗数据,为定期调整资源分配提供支持。

Description

云平台资源自适应预警方法与***
技术领域
本发明涉及计算机技术,尤其是一种云平台资源自适应预警方法与***。
背景技术
云计算是一种将池化的集群计算能力通过互联网向内外部用户提供按需服务的互联网新业务。云计算技术的优势在于能提高服务器的资源利用率,确保部署在同一台物理机上的虚拟机消耗资源的高峰期相互错开,能提高云平台的资源利用率,起到削峰填谷的效果。
在实现本发明的过程中,发明人发现现有的云计算技术至少存在以下问题:
由于虚拟机对资源的消耗不是一成不变的,高峰期和低谷期出现的规律也是会发生变化的。而现有的云计算技术无法***同一台物理机上的虚拟机未来的资源消耗数据,从而无法提供安排部署虚拟机的依据、为定期调整资源分配提供支持,若在资源消耗高峰,进行虚拟机动态迁移调整,则会加剧对资源的消耗,影响云平台的正常运行。
发明内容
本发明实施例所要解决的技术问题是:提供一种云平台资源自适应预警方法与***,以预测分析虚拟机未来的资源消耗数据,以此作为安排部署虚拟机的依据,为定期调整资源分配提供支持。
本发明实施例提供的一种云平台资源自适应预警方法,包括:
物理机上布署的节点管理单元按照第一预设周期规定的采集点,采集所在物理机与该物理机上运行的各虚拟机的各种资源消耗数据,并上报给资源分析预警服务器,所述各种资源消耗数据为物理机与各虚拟机对物理机中各项计算资源的使用数据;
资源分析预警服务器将节点管理单元上报的各种资源消耗数据存储在数据库中;
资源分析预警服务器按照第二预设周期,从数据库中获取当前时刻之前一个预设时间段内所述物理机与所述各虚拟机的各种资源消耗数据作为历史数据进行分析,预测未来各采集点所述物理机与所述各虚拟机的各种资源消耗数据并存储在所述数据库中;
资源分析预警服务器实时监控所述物理机的运行负载,在当前时刻到达未来某个时刻点时,分析所述物理机在当前时刻的各种资源消耗数据是否超过预警门限值;
响应于所述物理机在当前时刻有一项资源消耗数据超过预警门限值,资源分析预警服务器指示所述节点管理单元实时采集所述各虚拟机在当前时刻的该项资源消耗数据,并分析所述各虚拟机在当前时刻的该项资源消耗数据分别相对于之前预测的各虚拟机在当前时刻的该项资源消耗数据的变化率是否大于1;
响应于各虚拟机在当前时刻的该项资源消耗数据分别相对于之前预测的各虚拟机在当前时刻的该项资源消耗数据的变化率大于1,资源分析预警服务器根据所述之前预测的各虚拟机在当前时刻的该项资源消耗数据与所述变化率重新预测未来各采集点所述物理机与所述各虚拟机的该项资源消耗数据;
并在预测出的未来各采集点所述物理机的该项资源消耗数据超过预设告警门限值时,资源分析预警服务器进行事件通知。
上述方法的一个具体实施例中,所述各项计算资源具体包括中央处理单元CPU资源、内存资源、磁盘输入输出IO资源、网络吞吐量;
所述物理机对各项计算资源中每一项计算资源的使用数据具体为物理机上运行的所有虚拟机对该项计算资源的使用数据、以及所述物理机上用于虚拟出各虚拟机的虚拟化软件应用程序对该项计算资源的使用数据之和。
上述方法的一个具体实施例中,实时监控所述物理机的运行负载包括:
所述节点管理单元具体根据资源分析预警服务器的采集指令实时采集所述物理机在当前时刻的各种资源消耗数据并上报给所述资源分析预警服务器;所述资源分析预警服务器具体根据所述节点管理单元实时上报的所述物理机在当前时刻的各种资源消耗数据实时监控所述物理机的运行负载;或者
所述节点管理单元按照监控时限定时采集所述各虚拟机的各项资源消耗数据并上报给所述资源分析预警服务器;所述资源分析预警服务器具体根据所述节点管理单元定时上报的所述物理机的各种资源消耗数据实时监控所述物理机的运行负载。
上述方法的一个具体实施例中,还包括:
在每个预设时间段内连续产生M次事件通知时,将告警级别上升一个等级,其中,M为预设大于1的整数;
在告警级别上升到等级N时,产生严重告警通知,其中,N为预设大于1的整数;
所述资源分析预警服务器向所述节点管理单元下发控制指令,以启动对相应虚拟机的启动、关停或迁移。
上述方法的一个具体实施例中,所述资源分析预警服务器向所述节点管理单元下发控制指令包括:
所述资源分析预警服务器向统一综合网管***上报严重告警通知以及重新预测的未来各采集点所述物理机与所述各虚拟机的该项资源消耗数据;
统一综合网管***根据所述重新预测的未来各采集点所述物理机与所述各虚拟机的该项资源消耗数据对不同物理机上的虚拟机进行统一资源调配,并根据调配结果向所述资源分析预警服务器下发调配指令;
所述资源分析预警服务器根据所述调配指令向所述节点管理单元下发控制指令。
上述方法的一个具体实施例中,所述资源分析预警服务器根据所述调配指令向所述节点管理单元下发控制指令时,还向其它物理机上的节点管理单元下发控制指令,以启动对所述其它物理机上相应虚拟机的启动、关停或迁移。
本发明实施例提供的一种云平台资源自适应预警***,包括各节点管理单元与资源分析预警服务器,每个节点管理单元分别布署于一个物理机上;
所述节点管理单元,用于按照第一预设周期规定的采集点,采集所在物理机与该物理机上运行的各虚拟机的各种资源消耗数据,并上报给资源分析预警服务器,所述各种资源消耗数据为物理机与各虚拟机对物理机中各项计算资源的使用数据;
所述资源分析预警服务器,用于将节点管理单元上报的各种资源消耗数据存储在数据库中;以及按照第二预设周期,从数据库中获取当前时刻之前一个预设时间段内所述物理机与所述各虚拟机的各种资源消耗数据作为历史数据进行分析,预测未来各采集点所述物理机与所述各虚拟机的各种资源消耗数据并存储在所述数据库中;以及实时监控所述物理机的运行负载,在当前时刻到达未来某个时刻点时,分析所述物理机在当前时刻的各种资源消耗数据是否超过预警门限值;响应于所述物理机在当前时刻有一项资源消耗数据超过预警门限值,指示所述节点管理单元实时采集所述各虚拟机在当前时刻的该项资源消耗数据,并分析所述各虚拟机在当前时刻的该项资源消耗数据分别相对于之前预测的各虚拟机在当前时刻的该项资源消耗数据的变化率是否大于1;响应于各虚拟机在当前时刻的该项资源消耗数据分别相对于之前预测的各虚拟机在当前时刻的该项资源消耗数据的变化率大于1,根据所述之前预测的各虚拟机在当前时刻的该项资源消耗数据与所述变化率重新预测未来各采集点所述物理机与所述各虚拟机的该项资源消耗数据;并在预测出的未来各采集点所述物理机的该项资源消耗数据超过预设告警门限值时,进行事件通知。
上述***的一个具体实施例中,所述各项计算资源具体包括中央处理单元CPU资源、内存资源、磁盘输入输出IO资源、网络吞吐量;
所述物理机对各项计算资源中每一项计算资源的使用数据具体为物理机上运行的所有虚拟机对该项计算资源的使用数据、以及所述物理机上用于虚拟出各虚拟机的虚拟化软件应用程序对该项计算资源的使用数据之和。
上述***的一个具体实施例中,所述节点管理单元包括控制管理模块与资源采集模块;
所述资源采集模块,用于按照第一预设周期规定的采集点,采集所在物理机与该物理机上运行的各虚拟机的各种资源消耗数据;
所述控制管理模块,用于将所述资源采集模块采集的各种资源消耗数据上报给资源分析预警服务器。
上述***的一个具体实施例中,所述资源分析预警服务器包括数据收集模块、智能分析模块、监控预警模块与数据库;
所述数据收集模块,用于将所述节点管理单元中控制管理模块上报的各种资源消耗数据存储在数据库中;
所述智能分析模块,用于按照第二预设周期,从数据库中获取当前时刻之前一个预设时间段内所述物理机与所述各虚拟机的各种资源消耗数据作为历史数据进行分析,预测未来各采集点所述物理机与所述各虚拟机的各种资源消耗数据并存储在所述数据库中;
所述监控预警模块,用于实时监控所述物理机的运行负载,在当前时刻到达未来某个时刻点时,分析所述物理机在当前时刻的各种资源消耗数据是否超过预警门限值;响应于所述物理机在当前时刻有一项资源消耗数据超过预警门限值,指示所述控制管理模块实时采集所述各虚拟机在当前时刻的该项资源消耗数据,并根据所述控制管理模块上报的该项资源消耗数据,分析所述各虚拟机在当前时刻的该项资源消耗数据分别相对于之前预测的各虚拟机在当前时刻的该项资源消耗数据的变化率是否大于1;响应于各虚拟机在当前时刻的该项资源消耗数据分别相对于之前预测的各虚拟机在当前时刻的该项资源消耗数据的变化率大于1,根据所述之前预测的各虚拟机在当前时刻的该项资源消耗数据与所述变化率重新预测未来各采集点所述物理机与所述各虚拟机的该项资源消耗数据;并在预测出的未来各采集点所述物理机的该项资源消耗数据超过预设告警门限值时,进行事件通知;
所述数据库,用于存储所述控制管理模块上报的各种资源消耗数据、以及预测出的未来各采集点所述物理机与所述各虚拟机的各种资源消耗数据。
上述***的一个具体实施例中,所述控制管理模块还用于根据资源分析预警服务器的采集指令,指示资源采集模块实时采集所述物理机在当前时刻的各种资源消耗数据并上报给所述监控预警模块;所述监控预警模块实时监控所述物理机的运行负载时,具体根据所述节点管理单元实时上报的所述物理机在当前时刻的各种资源消耗数据实时监控所述物理机的运行负载;或者
所述控制管理模块还用于按照监控时限,指示资源采集模块定时采集所述各虚拟机的各项资源消耗数据并上报给所述监控预警模块;所述监控预警模块实时监控所述物理机的运行负载时,具体根据所述控制管理模块定时上报的所述物理机的各种资源消耗数据实时监控所述物理机的运行负载。
上述***的一个具体实施例中,所述监控预警模块还用于在每个预设时间段内连续产生M次事件通知时,将告警级别上升一个等级,其中,M为预设大于1的整数;并在告警级别上升到等级N时,产生严重告警通知,其中,N为预设大于1的整数;以及响应于产生严重告警通知,向所述控制管理模块下发控制指令,以启动对相应虚拟机的启动、关停或迁移。
上述***的一个具体实施例中,还包括统一综合网管***;
所述监控预警模块,还用于向统一综合网管***上报严重告警通知以及重新预测的未来各采集点所述物理机与所述各虚拟机的该项资源消耗数据;以及具体根据所述统一综合网管***下发的调配指令向所述控制管理模块下发控制指令;
所述统一综合网管***,用于根据所述重新预测的未来各采集点所述物理机与所述各虚拟机的该项资源消耗数据对不同物理机上的虚拟机进行统一资源调配,并根据调配结果向所述资源分析预警服务器下发调配指令。
上述***的一个具体实施例中,所述监控预警模块根据所述调配指令向所述控制管理模块下发控制指令时,还向其它物理机上的节点管理单元中的控制管理模块下发控制指令,以启动对所述其它物理机上相应虚拟机的启动、关停或迁移。
基于本发明上述实施例提供的云平台资源自适应预警方法与***,在每个物理机上分别布署一个节点管理单元,按照第一预设周期规定的采集点,采集所在物理机与该物理机上运行的各虚拟机的各种资源消耗数据,并上报给资源分析预警服务器;资源分析预警服务器可以按照第二预设周期,对当前时刻之前一个预设时间段内物理机与各虚拟机的各种资源消耗数据作为历史数据进行分析,预测未来各采集点物理机与各虚拟机的各种资源消耗数据并存储在数据库中;并实时监控物理机的运行负载,在当前时刻到达未来某个时刻点时,分析物理机在当前时刻的各种资源消耗数据是否超过预警门限值;若超过预警门限值,实时采集各虚拟机在当前时刻的该项资源消耗数据,并分析各虚拟机在当前时刻的该项资源消耗数据分别相对于之前预测的各虚拟机在当前时刻的该项资源消耗数据的变化率是否大于1;若变化率大于1,根据之前预测的各虚拟机在当前时刻的该项资源消耗数据与变化率重新预测未来各采集点物理机与各虚拟机的该项资源消耗数据,并在预测出的未来各采集点物理机的该项资源消耗数据超过预设告警门限值时,资源分析预警服务器进行事件通知。
与现有技术相比,本发明实施例可以以近期历史资源消耗数据为基准,分析虚拟机消耗资源的变化规律,预测分析虚拟机未来的资源消耗数据,以此作为安排部署虚拟机的依据,为定期调整资源分配提供支持,将消耗资源高峰期不同的虚拟机错开部署,达到削峰填谷和自适应业务发展变化的效果。同时对资源运行负载进行提前预警分析,提前提出资源调配预警,避免在资源消耗高峰,进行虚拟机动态迁移调整,加剧对资源的消耗,影响平台运行,有利于提高云平台的资源使用率。
下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。
附图说明
构成说明书的一部分的附图描述了本发明的实施例,并且连同描述一起用于解释本发明的原理。
参照附图,根据下面的详细描述,可以更加清楚地理解本发明,其中:
图1为本发明云平台资源自适应预警***一个实施例的结构示意图。
图2为本发明云平台资源自适应预警方法一个实施例的流程图。
图3为本发明云平台资源自适应预警方法一个应用实施例的流程图。
具体实施方式
现在将参照附图来详细描述本发明的各种示例性实施例。应注意到:除非另外具体说明,否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本发明的范围。
同时,应当明白,为了便于描述,附图中所示出的各个部分的尺寸并不是按照实际的比例关系绘制的。
以下对至少一个示例性实施例的描述实际上仅仅是说明性的,决不作为对本发明及其应用或使用的任何限制。
对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论,但在适当情况下,所述技术、方法和设备应当被视为说明书的一部分。
在这里示出和讨论的所有示例中,任何具体值应被解释为仅仅是示例性的,而不是作为限制。因此,示例性实施例的其它示例可以具有不同的值。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步讨论。
本发明实施例提出一种云平台资源自适应预警方法与***,定期或实时采集云平台资源池中物理机和虚拟机消耗资源的数据,例如,中央处理单元(CPU)资源、内存资源、磁盘输入输出(IO)资源、、网络吞吐量等。以近期历史数据为基准,分析虚拟机消耗资源的变化规律,预测分析未来的资源消耗数据,以此作为安排部署虚拟机的依据,为定期调整资源分配提供支持,将消耗资源高峰期不同的虚拟机错开部署,达到削峰填谷和自适应业务发展变化的效果。同时对资源运行负载进行提前预警分析,避免在资源消耗高峰,进行虚拟机动态迁移调整,加剧对资源的消耗,影响平台运行。
图1为本发明云平台资源自适应预警***一个实施例的结构示意图。如图1所示,该实施例的云平台资源自适应预警***包括各节点管理单元110与资源分析预警服务器120,每个节点管理单元110分别布署于一个物理机上。其中:
节点管理单元(Agent)110,用于按照第一预设周期规定的采集点,采集所在物理机与该物理机上运行的各虚拟机的各种资源消耗数据,并上报给资源分析预警服务器120,各种资源消耗数据为物理机与该物理机上各虚拟机对物理机中各项计算资源的使用数据。另外,节点管理单元110也可以根据资源分析预警服务器120的采集指令采集所在物理机与该物理机上运行的各虚拟机的各种资源消耗数据。示例性地,各项计算资源具体可以包括但不限于CPU资源、内存资源、磁盘IO资源、网络吞吐量等资源。
具体地,物理机对各项计算资源中每一项计算资源的使用数据具体为该物理机上运行的所有虚拟机对该项计算资源的使用数据、以及物理机上用于虚拟出各虚拟机的虚拟化软件应用程序对该项计算资源的使用数据之和,即:本发明的各实施例中,针对每项计算资源分别计算。
资源分析预警服务器120,用于将节点管理单元110上报的各种资源消耗数据存储在数据库124中;以及按照第二预设周期,从数据库124中获取当前时刻之前一个预设时间段内物理机与该物理机上各虚拟机的各种资源消耗数据作为历史数据进行分析,预测未来各采集点物理机与该物理机上各虚拟机的各种资源消耗数据并存储在数据库124中;以及实时监控物理机的运行负载,在当前时刻到达未来某个时刻点时,分析节点管理单元110物理机在当前时刻的各种资源消耗数据是否超过预警门限值;响应于物理机在当前时刻有一项资源消耗数据超过预警门限值,指示节点管理单元110实时采集该物理机上各虚拟机在当前时刻的该项资源消耗数据,并分析节点管理单元110上报的各虚拟机在当前时刻的该项资源消耗数据分别相对于数据库124之前预测的各虚拟机在当前时刻的该项资源消耗数据的变化率是否大于1;响应于各虚拟机在当前时刻的该项资源消耗数据分别相对于数据库124之前预测的各虚拟机在当前时刻的该项资源消耗数据的变化率大于1,根据之前预测的各虚拟机在当前时刻的该项资源消耗数据与变化率重新预测未来各采集点物理机与该物理机上各虚拟机的该项资源消耗数据;并在预测出的未来各采集点物理机的该项资源消耗数据超过预设告警门限值时,进行事件通知。示例性地,资源分析预警服务器120可以单独设置,也可以部署在单独一个物理机或者虚拟机上。
再参见图1,根据本发明云平台资源自适应预警***实施例一个的一个具体示例而非限制,节点管理单元110具体可以包括控制管理模块111与资源采集模块112。其中:
资源采集模块112,用于按照第一预设周期规定的采集点,采集所在物理机与该物理机上运行的各虚拟机的各种资源消耗数据。
控制管理模块111,用于将资源采集模块112采集的各种资源消耗数据上报给资源分析预警服务器120。
再参见图1,根据本发明云平台资源自适应预警***实施例一个的另一个具体示例而非限制,资源分析预警服务器120具体可以包括数据收集模块121、智能分析模块122、监控预警模块与数据库124。其中:
数据收集模块121,用于将节点管理单元110中控制管理模块111上报的各种资源消耗数据存储在数据库124中。
智能分析模块122,用于按照第二预设周期,从数据库124中获取当前时刻之前一个预设时间段内物理机与该物理机上各虚拟机的各种资源消耗数据作为历史数据,对不同种类的资源消耗数据分别进行分析,预测未来各采集点物理机与该物理机上各虚拟机的各种资源消耗数据并存储在数据库124中。
示例性地,智能分析模块122以天为周期分析其中任意一个虚拟机消耗资源的变化规律。将1天24小时按5分钟(作为第一预设周期)颗粒度作为资源消耗数据采集点与分析点,取最近7天(作为第二预设周期)的资源消耗数据作为分析的历史数据,预测分析第二天该虚拟机资源消耗的变化曲线,其中第一预设周期与第二预设周期的时间可以根据实际需求配置调整。
假设Yi,其中i=[1,2,3,…,287,288]为1天中288个的数据分析点。Xij,其中j=[1,2,3,4,5,6,7]为对应Yi最近7天在该时间点的历史数据。
计算Yi的期望值:Ei=∑j Xij/7;
计算Yi的标准方差σi=√(∑(Xij-Ei)2/7);
将期望值Ei和标准方差σi的和作为未来第二天Yi的预测值Yi=Eii
期望值Ei计算了当前时刻点近7天的一个平均值,标准方差σi则计算近7天的一个平均波动范围。期望值Ei加标准方差σi的综合分析方法,提供了自适应的资源预警机制。
监控预警模块123,用于实时监控物理机的运行负载,即:物理机对每项资源的消耗,在当前时刻到达未来某个时刻点时,分析节点管理单元110物理机在当前时刻的各种资源消耗数据是否超过预警门限值;响应于物理机在当前时刻有一项资源消耗数据超过预警门限值,指示控制管理模块111实时采集该物理机上各虚拟机在当前时刻的该项资源消耗数据,并根据控制管理模块111上报的该项资源消耗数据,分析各虚拟机在当前时刻的该项资源消耗数据分别相对于数据库124之前预测的各虚拟机在当前时刻的该项资源消耗数据的变化率是否大于1;响应于各虚拟机在当前时刻的该项资源消耗数据分别相对于数据库124之前预测的各虚拟机在当前时刻的该项资源消耗数据的变化率大于1,根据之前预测的各虚拟机在当前时刻的该项资源消耗数据与变化率重新预测未来各采集点物理机与各虚拟机的该项资源消耗数据;并在预测出的未来各采集点物理机的该项资源消耗数据超过预设告警门限值时,进行事件通知。
继续智能分析模块122中的示例,假设当前时刻采集的该物理机上各虚拟机在当前时刻的该项资源消耗数据的当前值为Z,智能分析模块122预测的各虚拟机在当前时刻的每一项资源消耗数据表示为Y=E+σ,计算变化率:ε=(Z-E)/σ。当ε>1时,说明当前的资源使用波动超过了原先预测的范围,未来的资源使用负载可能增加。若当前时刻不是数据采集点,则可以通过对智能分析模块122预测得到的当前时刻前一时刻与后一时刻的各虚拟机在当前时刻的每一项资源消耗数据进行线性插值得到,例如,取二者的平均值。通过线性插值法可以得到第二天每个时刻点的预测值。
对ε>1的虚拟机重新计算后续时间点的各个预测值:Y’=E+σ*ε,然后根据新的预测值,检查物理机当前时刻的后续各时刻点的运行负载。
数据库124,用于存储控制管理模块111上报的各种资源消耗数据、以及预测出的未来各采集点物理机与该物理机上各虚拟机的各种资源消耗数据。
进一步地,在另一个具体示例中,控制管理模块111还可以用于根据资源分析预警服务器120的采集指令,指示资源采集模块112实时采集物理机在当前时刻的各种资源消耗数据并上报给监控预警模块123。相应地,监控预警模块123实时监控物理机的运行负载时,具体可以根据节点管理单元110实时上报的物理机在当前时刻的各种资源消耗数据实时监控物理机的运行负载。
或者,控制管理模块111还可以用于按照监控时限,指示资源采集模块112定时采集各虚拟机的各项资源消耗数据并上报给监控预警模块123。相应地,监控预警模块123实时监控物理机的运行负载时,具体可以根据控制管理模块111定时上报的物理机的各种资源消耗数据实时监控物理机的运行负载。如果运行负载超过预设告警门限,可能出现性能问题,产生事件通知。
在本发明云平台资源自适应预警***的另一个实施例中,监控预警模块123还可以用于在每个预设时间段内连续产生M次事件通知时,将告警级别上升一个等级,其中,M为预设大于1的整数;并在告警级别上升到等级N时,产生严重告警通知,提高了告警的有效性和及时性,其中,N为预设大于1的整数;以及响应于产生严重告警通知,向控制管理模块111下发控制指令,以启动对相应虚拟机的启动、关停或迁移。
示例性地,如果事件通知持续产生,例如连续产生三次,则告警级别逐步升级,告警级别可以示例性地分三个等级,升级为严重告警时,说明需要启动虚拟机动态迁移,将负载较高的物理机上的部分虚拟机迁移到其他负载较低物理机上,减轻该负载较高的物理机运行负载,否则后续可能产生性能问题影响云平台运行,从而通过监控预警分析,规避了资源消耗异常波动对云平台的影响。
进一步地,在本发明云平台资源自适应预警***的又一个实施例中,还可以包括统一综合网管***130。该实施例中,监控预警模块123,还可以用于向统一综合网管***130上报严重告警通知以及重新预测的未来各采集点物理机与该物理机上各虚拟机的该项资源消耗数据;以及具体根据统一综合网管***130下发的调配指令向控制管理模块111下发控制指令。统一综合网管***130,用于根据监控预警模块123上报的重新预测的未来各采集点物理机与该物理机上各虚拟机的该项资源消耗数据对不同物理机上的虚拟机进行统一资源调配,并根据调配结果向资源分析预警服务器120下发调配指令。可选地,监控预警模块123还可以定期将智能分析模块122预测得到的虚拟机资源消耗的预测分析结果上报电信统一综合网管130,以便于查询、统一管理。
可选地,监控预警模块123根据调配指令向控制管理模块111下发控制指令时,还可以向其它物理机上的节点管理单元110中的控制管理模块111下发控制指令,以启动对其它物理机上相应虚拟机的启动、关停或迁移,从而实现各物理机上各虚拟机之间的统一资源调配,通过分析虚拟机在一个时间段当中(例如,以天为周期时,一天)消耗各种不同资源的规律,将资源消耗高峰期不同的虚拟机部署在同一台物理机上,使得物理机的资源使用率在大部分时间内稳定在一个水平,达到削峰填谷的效果,更加合理的利用云平台的资源。
在一个云平台资源池中,有多台物理机,可以根据需要决定哪些物理机接收资源分析预警服务器120的统一管理,这些物理机上就需要配置节点管理单元110,从而连接到资源分析预警服务器120,接受统一调度。根据本发明云平台资源自适应预警***实施例的再一个具体示例而非限制,各实施例的云平台资源自适应预警***还可以包括一个注册管理单元(图中未示出),该注册管理单元可以单独设置,也可以设置在资源分析预警服务器120中。节点管理单元110启动后,可以通过其中的控制管理模块111,可以向注册管理单元注册所在服务器以及该服务器上运行的各虚拟机的名称、编号等标识信息,还可以在该服务器上运行的各虚拟机发生变化(例如,关停、启动、迁移等)时,向注册管理单元发送更新消息,以对注册信息进行更新,以便资源分析预警服务器120根据该注册管理单元中的注册信息向节点管理单元110或其中的控制管理模块111发送运行指令,例如,资源采集指令,以及虚拟机关停、启动、迁移(从一台物理机迁移至另一台物理机)等控制指令。
图2为本发明云平台资源自适应预警方法一个实施例的流程图。如图2所示,该实施例云平台资源自适应预警方法包括:
210,物理机上布署的节点管理单元按照第一预设周期规定的采集点,采集所在物理机与该物理机上运行的各虚拟机的各种资源消耗数据,并上报给资源分析预警服务器,各种资源消耗数据为物理机与各虚拟机对物理机中各项计算资源的使用数据。
示例性地,各项计算资源具体可以包括但不限于CPU资源、内存资源、磁盘IO资源、网络吞吐量等资源。
具体地,物理机对各项计算资源中每一项计算资源的使用数据具体为该物理机上运行的所有虚拟机对该项计算资源的使用数据、以及物理机上用于虚拟出各虚拟机的虚拟化软件应用程序对该项计算资源的使用数据之和,即:本发明的各实施例中,针对每项计算资源分别计算。
220,资源分析预警服务器将节点管理单元上报的各种资源消耗数据存储在数据库中。
230,资源分析预警服务器按照第二预设周期,从数据库中获取当前时刻之前一个预设时间段内物理机与该物理机上各虚拟机的各种资源消耗数据作为历史数据进行分析,预测未来各采集点物理机与该物理机上各虚拟机的各种资源消耗数据并存储在数据库中。
240,资源分析预警服务器实时监控物理机的运行负载,在当前时刻到达未来某个时刻点时,分析物理机在当前时刻的各种资源消耗数据是否超过预警门限值。
响应于物理机在当前时刻有一项资源消耗数据超过预警门限值,执行250的操作。否则,若物理机在当前时刻的各项资源消耗数据均未超过预警门限值,不执行本实施例的后续流程。
示例性地,可以通过如下方式实时监控物理机的运行负载:
节点管理单元具体根据资源分析预警服务器的采集指令实时采集物理机在当前时刻的各种资源消耗数据并上报给资源分析预警服务器;资源分析预警服务器具体根据节点管理单元实时上报的物理机在当前时刻的各种资源消耗数据实时监控物理机的运行负载;或者
节点管理单元按照监控时限定时采集各虚拟机的各项资源消耗数据并上报给资源分析预警服务器;资源分析预警服务器具体根据节点管理单元定时上报的物理机的各种资源消耗数据实时监控物理机的运行负载。
250,资源分析预警服务器指示该物理机上的节点管理单元实时采集该物理机上各虚拟机在当前时刻的该项资源消耗数据,并分析节点管理单元上报的各虚拟机在当前时刻的该项资源消耗数据分别相对于之前预测的各虚拟机在当前时刻的该项资源消耗数据的变化率是否大于1。
响应于各虚拟机在当前时刻的该项资源消耗数据分别相对于之前预测的各虚拟机在当前时刻的该项资源消耗数据的变化率大于1,执行260的操作。否则,若该变化率不大于1,不执行本实施例的后续流程。
260,资源分析预警服务器根据之前预测的各虚拟机在当前时刻的该项资源消耗数据与变化率重新预测未来各采集点物理机与该物理机上各虚拟机的该项资源消耗数据。
270,在预测出的未来各采集点物理机的该项资源消耗数据超过预设告警门限值时,资源分析预警服务器进行事件通知。
根据本发明云平台资源自适应预警方法的另一个实施例,在图2所示实施例中,资源分析预警服务器在每个预设时间段内连续产生M次事件通知时,可以将告警级别上升一个等级,其中,M为预设大于1的整数;并在在告警级别上升到等级N时,产生严重告警通知,其中,N为预设大于1的整数;此时,资源分析预警服务器可以向节点管理单元下发控制指令,以启动对相应虚拟机的启动、关停或迁移。
示例性地,资源分析预警服务器向节点管理单元下发控制指令具体可以包括:
资源分析预警服务器向统一综合网管***上报严重告警通知以及重新预测的未来各采集点物理机与该物理机上各虚拟机的该项资源消耗数据;
统一综合网管***根据重新预测的未来各采集点物理机与该物理机各虚拟机的该项资源消耗数据对不同物理机上的虚拟机进行统一资源调配,并根据调配结果向资源分析预警服务器下发调配指令;
资源分析预警服务器根据调配指令向节点管理单元下发控制指令。
进一步地,资源分析预警服务器根据调配指令向节点管理单元下发控制指令时,还可以向其它物理机上的节点管理单元下发控制指令,以启动对其它物理机上相应虚拟机的启动、关停或迁移。
图3为本发明云平台资源自适应预警方法一个应用实施例的流程图。该应用实施例以一个具体实例为例对本发明实施例的实现进行进一步说明,该实施例的数字仅为示例性例举,并不构成对本发明实施例的应用限制。如图3所示,该应用实施例包括以下流程:
310,各节点管理单元Agent注册到资源预警分析服务器中的注册管理单元,每隔5分钟采集一次所在物理机和该物理上虚拟机资源消耗数据,并上报到预警分析服务器中的数据收集模块。
320,数据收集模块汇总各节点管理单元Agent上报的资源消耗数据,录入数据库。
330,智能分析模块根据操作320中收集的资源消耗数据,每隔6个小时分析一次资源消耗变化规律,分析方法如下:
331,针对每个采集点,提取近7天的历史数据;
332,计算每个采集点近7天的期望值:Ei=∑j Xij/;
333,计算每个采集点近7天的标准方差:σi=√(∑(Xij-Ei)2/7);
334,计算Yi=Eii,作为对应采集点第二天的预测值,并录入数据库。
340,监控预警模块第二天实时监控物理机运行负载是否超过预警门限值。
350,如果超过预警门限值,监控预警模块获取该物理机上每台虚拟机在当前时刻点的资源消耗数据Zi和从数据库提取之前的预测分析值Yi=Eii。否则,不执行后续操作。
360,监控预警模块计算每台虚拟机当前资源消耗的变化率:εi=(Zi-Ei)/σi
如果εi>1,说明当前虚拟机资源消耗超过了预期的增长范围,需要重新评估未来该虚拟机的资源消耗值。否则,不执行后续操作。
370,监控预警模块根据变化率εi,重新计算该虚拟机后续每个采集点的资源消耗值Yi’=Ei+σ*εi
380,监控预警模块根据物理机上每台虚拟机新的资源消耗值,计算物理机运行负载,是否会超过预设告警门限。
如果超过预设告警门限,可能产生性能问题,执行400的操作。否则,不执行后续操作。
400,监控预警模块产生事件通知。
如果事件通知持续产生(例如,连续产生三次),则告警逐步升级(告警可以分三个等级)并产生告警通知,告警通知传递至电信统一综合网管***。
410,当预警级别为严重告警时,监控预警模块可以根据电信统一综合网管***的调配指令,向相应的节点管理单元发送控制指令,作为启动虚拟机迁移,以减轻物理机运行负载的参考。
本说明书中各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同或相似的部分相互参见即可。由于***实施例与方法实施例基本对应,所以相关之处相互参见相应实施例说明即可。
可能以许多方式来实现本发明的方法和***。例如,可通过软件、硬件、固件或者软件、硬件、固件的任何组合来实现本发明的方法和***。用于所述方法的步骤的上述顺序仅是为了进行说明,本发明的方法的步骤不限于以上具体描述的顺序,除非以其它方式特别说明。此外,在一些实施例中,还可将本发明实施为记录在记录介质中的程序,这些程序包括用于实现根据本发明的方法的机器可读指令。因而,本发明还覆盖存储用于执行根据本发明的方法的程序的记录介质。
本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于一计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
本发明实施例提可以以近期历史资源消耗数据为基准,分析虚拟机消耗资源的变化规律,预测分析虚拟机未来的资源消耗数据,以此作为安排部署虚拟机的依据,为定期调整资源分配提供支持,将消耗资源高峰期不同的虚拟机错开部署,达到削峰填谷和自适应业务发展变化的效果。同时对资源运行负载进行提前预警分析,提前提出资源调配预警,避免在资源消耗高峰,进行虚拟机动态迁移调整,加剧对资源的消耗,影响平台运行,有利于提高云平台的资源使用率。
本发明的描述是为了示例和描述起见而给出的,而并不是无遗漏的或者将本发明限于所公开的形式。很多修改和变化对于本领域的普通技术人员而言是显然的。选择和描述实施例是为了更好说明本发明的原理和实际应用,并且使本领域的普通技术人员能够理解本发明从而设计适于特定用途的带有各种修改的各种实施例。

Claims (14)

1.一种云平台资源自适应预警方法,其特征在于,包括:
物理机上布署的节点管理单元按照第一预设周期规定的采集点,采集所在物理机与该物理机上运行的各虚拟机的各种资源消耗数据,并上报给资源分析预警服务器,所述各种资源消耗数据为物理机与各虚拟机对物理机中各项计算资源的使用数据;
资源分析预警服务器将节点管理单元上报的各种资源消耗数据存储在数据库中;
资源分析预警服务器按照第二预设周期,从数据库中获取当前时刻之前一个预设时间段内所述物理机与所述各虚拟机的各种资源消耗数据作为历史数据进行分析,预测未来各采集点所述物理机与所述各虚拟机的各种资源消耗数据并存储在所述数据库中;
资源分析预警服务器实时监控所述物理机的运行负载,在当前时刻到达未来某个时刻点时,分析所述物理机在当前时刻的各种资源消耗数据是否超过预警门限值;
响应于所述物理机在当前时刻有一项资源消耗数据超过预警门限值,资源分析预警服务器指示所述节点管理单元实时采集所述各虚拟机在当前时刻的该项资源消耗数据,并分析所述各虚拟机在当前时刻的该项资源消耗数据分别相对于之前预测的各虚拟机在当前时刻的该项资源消耗数据的变化率是否大于1;
响应于各虚拟机在当前时刻的该项资源消耗数据分别相对于之前预测的各虚拟机在当前时刻的该项资源消耗数据的变化率大于1,资源分析预警服务器根据所述之前预测的各虚拟机在当前时刻的该项资源消耗数据与所述变化率重新预测未来各采集点所述物理机与所述各虚拟机的该项资源消耗数据;
并在预测出的未来各采集点所述物理机的该项资源消耗数据超过预设告警门限值时,资源分析预警服务器进行事件通知。
2.根据权利要求1所述的方法,其特征在于,所述各项计算资源具体包括中央处理单元CPU资源、内存资源、磁盘输入输出IO资源、网络吞吐量;
所述物理机对各项计算资源中每一项计算资源的使用数据具体为物理机上运行的所有虚拟机对该项计算资源的使用数据、以及所述物理机上用于虚拟出各虚拟机的虚拟化软件应用程序对该项计算资源的使用数据之和。
3.根据权利要求2所述的方法,其特征在于,实时监控所述物理机的运行负载包括:
所述节点管理单元具体根据资源分析预警服务器的采集指令实时采集所述物理机在当前时刻的各种资源消耗数据并上报给所述资源分析预警服务器;所述资源分析预警服务器具体根据所述节点管理单元实时上报的所述物理机在当前时刻的各种资源消耗数据实时监控所述物理机的运行负载;或者
所述节点管理单元按照监控时限定时采集所述各虚拟机的各项资源消耗数据并上报给所述资源分析预警服务器;所述资源分析预警服务器具体根据所述节点管理单元定时上报的所述物理机的各种资源消耗数据实时监控所述物理机的运行负载。
4.根据权利要求1至3任意一项所述的方法,其特征在于,还包括:
在每个预设时间段内连续产生M次事件通知时,将告警级别上升一个等级,其中,M为预设大于1的整数;
在告警级别上升到等级N时,产生严重告警通知,其中,N为预设大于1的整数;
所述资源分析预警服务器向所述节点管理单元下发控制指令,以启动对相应虚拟机的启动、关停或迁移。
5.根据权利要求4所述的方法,其特征在于,所述资源分析预警服务器向所述节点管理单元下发控制指令包括:
所述资源分析预警服务器向统一综合网管***上报严重告警通知以及重新预测的未来各采集点所述物理机与所述各虚拟机的该项资源消耗数据;
统一综合网管***根据所述重新预测的未来各采集点所述物理机与所述各虚拟机的该项资源消耗数据对不同物理机上的虚拟机进行统一资源调配,并根据调配结果向所述资源分析预警服务器下发调配指令;
所述资源分析预警服务器根据所述调配指令向所述节点管理单元下发控制指令。
6.根据权利要求5所述的方法,其特征在于,所述资源分析预警服务器根据所述调配指令向所述节点管理单元下发控制指令时,还向其它物理机上的节点管理单元下发控制指令,以启动对所述其它物理机上相应虚拟机的启动、关停或迁移。
7.一种云平台资源自适应预警***,其特征在于,包括各节点管理单元与资源分析预警服务器,每个节点管理单元分别布署于一个物理机上;
所述节点管理单元,用于按照第一预设周期规定的采集点,采集所在物理机与该物理机上运行的各虚拟机的各种资源消耗数据,并上报给资源分析预警服务器,所述各种资源消耗数据为物理机与各虚拟机对物理机中各项计算资源的使用数据;
所述资源分析预警服务器,用于将节点管理单元上报的各种资源消耗数据存储在数据库中;以及按照第二预设周期,从数据库中获取当前时刻之前一个预设时间段内所述物理机与所述各虚拟机的各种资源消耗数据作为历史数据进行分析,预测未来各采集点所述物理机与所述各虚拟机的各种资源消耗数据并存储在所述数据库中;以及实时监控所述物理机的运行负载,在当前时刻到达未来某个时刻点时,分析所述物理机在当前时刻的各种资源消耗数据是否超过预警门限值;响应于所述物理机在当前时刻有一项资源消耗数据超过预警门限值,指示所述节点管理单元实时采集所述各虚拟机在当前时刻的该项资源消耗数据,并分析所述各虚拟机在当前时刻的该项资源消耗数据分别相对于之前预测的各虚拟机在当前时刻的该项资源消耗数据的变化率是否大于1;响应于各虚拟机在当前时刻的该项资源消耗数据分别相对于之前预测的各虚拟机在当前时刻的该项资源消耗数据的变化率大于1,根据所述之前预测的各虚拟机在当前时刻的该项资源消耗数据与所述变化率重新预测未来各采集点所述物理机与所述各虚拟机的该项资源消耗数据;并在预测出的未来各采集点所述物理机的该项资源消耗数据超过预设告警门限值时,进行事件通知。
8.根据权利要求7所述的***,其特征在于,所述各项计算资源具体包括中央处理单元CPU资源、内存资源、磁盘输入输出IO资源、网络吞吐量;
所述物理机对各项计算资源中每一项计算资源的使用数据具体为物理机上运行的所有虚拟机对该项计算资源的使用数据、以及所述物理机上用于虚拟出各虚拟机的虚拟化软件应用程序对该项计算资源的使用数据之和。
9.根据权利要求8所述的***,其特征在于,所述节点管理单元包括控制管理模块与资源采集模块;
所述资源采集模块,用于按照第一预设周期规定的采集点,采集所在物理机与该物理机上运行的各虚拟机的各种资源消耗数据;
所述控制管理模块,用于将所述资源采集模块采集的各种资源消耗数据上报给资源分析预警服务器。
10.根据权利要求9所述的***,其特征在于,所述资源分析预警服务器包括数据收集模块、智能分析模块、监控预警模块与数据库;
所述数据收集模块,用于将所述节点管理单元中控制管理模块上报的各种资源消耗数据存储在数据库中;
所述智能分析模块,用于按照第二预设周期,从数据库中获取当前时刻之前一个预设时间段内所述物理机与所述各虚拟机的各种资源消耗数据作为历史数据进行分析,预测未来各采集点所述物理机与所述各虚拟机的各种资源消耗数据并存储在所述数据库中;
所述监控预警模块,用于实时监控所述物理机的运行负载,在当前时刻到达未来某个时刻点时,分析所述物理机在当前时刻的各种资源消耗数据是否超过预警门限值;响应于所述物理机在当前时刻有一项资源消耗数据超过预警门限值,指示所述控制管理模块实时采集所述各虚拟机在当前时刻的该项资源消耗数据,并根据所述控制管理模块上报的该项资源消耗数据,分析所述各虚拟机在当前时刻的该项资源消耗数据分别相对于之前预测的各虚拟机在当前时刻的该项资源消耗数据的变化率是否大于1;响应于各虚拟机在当前时刻的该项资源消耗数据分别相对于之前预测的各虚拟机在当前时刻的该项资源消耗数据的变化率大于1,根据所述之前预测的各虚拟机在当前时刻的该项资源消耗数据与所述变化率重新预测未来各采集点所述物理机与所述各虚拟机的该项资源消耗数据;并在预测出的未来各采集点所述物理机的该项资源消耗数据超过预设告警门限值时,进行事件通知;
所述数据库,用于存储所述控制管理模块上报的各种资源消耗数据、以及预测出的未来各采集点所述物理机与所述各虚拟机的各种资源消耗数据。
11.根据权利要求10所述的***,其特征在于,所述控制管理模块还用于根据资源分析预警服务器的采集指令,指示资源采集模块实时采集所述物理机在当前时刻的各种资源消耗数据并上报给所述监控预警模块;所述监控预警模块实时监控所述物理机的运行负载时,具体根据所述节点管理单元实时上报的所述物理机在当前时刻的各种资源消耗数据实时监控所述物理机的运行负载;或者
所述控制管理模块还用于按照监控时限,指示资源采集模块定时采集所述各虚拟机的各项资源消耗数据并上报给所述监控预警模块;所述监控预警模块实时监控所述物理机的运行负载时,具体根据所述控制管理模块定时上报的所述物理机的各种资源消耗数据实时监控所述物理机的运行负载。
12.根据权利要求11所述的***,其特征在于,所述监控预警模块还用于在每个预设时间段内连续产生M次事件通知时,将告警级别上升一个等级,其中,M为预设大于1的整数;并在告警级别上升到等级N时,产生严重告警通知,其中,N为预设大于1的整数;以及响应于产生严重告警通知,向所述控制管理模块下发控制指令,以启动对相应虚拟机的启动、关停或迁移。
13.根据权利要求12所述的***,其特征在于,还包括统一综合网管***;
所述监控预警模块,还用于向统一综合网管***上报严重告警通知以及重新预测的未来各采集点所述物理机与所述各虚拟机的该项资源消耗数据;以及具体根据所述统一综合网管***下发的调配指令向所述控制管理模块下发控制指令;
所述统一综合网管***,用于根据所述重新预测的未来各采集点所述物理机与所述各虚拟机的该项资源消耗数据对不同物理机上的虚拟机进行统一资源调配,并根据调配结果向所述资源分析预警服务器下发调配指令。
14.根据权利要求13所述的***,其特征在于,所述监控预警模块根据所述调配指令向所述控制管理模块下发控制指令时,还向其它物理机上的节点管理单元中的控制管理模块下发控制指令,以启动对所述其它物理机上相应虚拟机的启动、关停或迁移。
CN201210531771.4A 2012-12-11 2012-12-11 云平台资源自适应预警方法与*** Active CN103873498B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210531771.4A CN103873498B (zh) 2012-12-11 2012-12-11 云平台资源自适应预警方法与***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210531771.4A CN103873498B (zh) 2012-12-11 2012-12-11 云平台资源自适应预警方法与***

Publications (2)

Publication Number Publication Date
CN103873498A CN103873498A (zh) 2014-06-18
CN103873498B true CN103873498B (zh) 2017-06-23

Family

ID=50911623

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210531771.4A Active CN103873498B (zh) 2012-12-11 2012-12-11 云平台资源自适应预警方法与***

Country Status (1)

Country Link
CN (1) CN103873498B (zh)

Families Citing this family (31)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105320559B (zh) * 2014-07-30 2019-02-19 ***通信集团广东有限公司 一种云计算***的调度方法和装置
CN104579763B (zh) * 2014-12-25 2017-12-01 华为技术有限公司 一种网络扩容方法和设备
CN104869435A (zh) * 2015-05-18 2015-08-26 无锡天脉聚源传媒科技有限公司 一种播出卡的处理方法及装置
CN104991854B (zh) * 2015-06-12 2018-09-04 北京奇虎科技有限公司 一种服务器资源的监控统计方法和***
CN104991853B (zh) * 2015-07-22 2018-07-06 北京京东尚科信息技术有限公司 一种输出预警信息的方法和装置
CN105262634A (zh) * 2015-09-06 2016-01-20 浪潮集团有限公司 一种监控阈值的生成方法、装置和***
CN105912403B (zh) * 2016-04-14 2019-08-06 聚好看科技股份有限公司 Docker容器的资源管理方法及装置
CN107305487A (zh) * 2016-04-18 2017-10-31 北京万合鸿瑞科技有限公司 一种基于vmware虚拟化助手管理软件***
CN106067852A (zh) * 2016-06-08 2016-11-02 智者四海(北京)技术有限公司 服务器使用量的监控方法及装置
CN109564535B (zh) * 2016-07-29 2022-05-27 微软技术许可有限责任公司 云计算架构中的计算资源泄漏的检测
US20180097744A1 (en) * 2016-10-05 2018-04-05 Futurewei Technologies, Inc. Cloud Resource Provisioning for Large-Scale Big Data Platform
CN108023834A (zh) * 2016-11-03 2018-05-11 ***通信集团广东有限公司 一种云资源自动分配方法及装置
CN107070692A (zh) * 2017-01-16 2017-08-18 中国联合网络通信有限公司广东省分公司 一种基于大数据分析的云平台监控服务***及方法
CN107247651B (zh) * 2017-05-09 2020-12-08 中国电子产品可靠性与环境试验研究所 云计算平台监测预警方法和***
CN107276797A (zh) * 2017-06-09 2017-10-20 上海斐讯数据通信技术有限公司 一种硬件设备的告警播报方法、控制器及硬件设备
CN109428941A (zh) * 2017-09-04 2019-03-05 上海仪电(集团)有限公司中央研究院 一种云平台服务器的资源预测以及动态构建***
CN107623601A (zh) * 2017-09-30 2018-01-23 郑州云海信息技术有限公司 一种私有化云平台告警方案
CN107784440A (zh) * 2017-10-23 2018-03-09 国网辽宁省电力有限公司 一种电力信息***资源调配***及方法
CN108153650A (zh) * 2018-02-02 2018-06-12 郑州云海信息技术有限公司 获取云服务器资源信息的方法、***、装置及存储介质
CN110267351B (zh) * 2018-03-12 2022-07-22 华为云计算技术有限公司 通信方法和装置
CN109308245A (zh) * 2018-09-07 2019-02-05 郑州市景安网络科技股份有限公司 一种服务器资源预警方法、装置、设备及可读存储介质
CN110888898A (zh) * 2018-09-11 2020-03-17 北京奇虎科技有限公司 集群资源使用情况处理方法、装置及电子设备
CN110928649A (zh) * 2018-09-19 2020-03-27 北京国双科技有限公司 资源调度的方法和装置
CN109726082A (zh) * 2019-01-03 2019-05-07 中国银行股份有限公司 一种预警处理方法及***
CN110333991B (zh) * 2019-05-30 2022-11-25 武汉科技大学 云平台任务最大资源使用率预测方法
CN111104203B (zh) * 2019-12-13 2023-04-28 广东省华南技术转移中心有限公司 虚拟机分散调度方法、装置以及电子设备、存储介质
CN111858267B (zh) * 2020-07-29 2024-01-05 中国工商银行股份有限公司 预警方法、装置、电子设备及存储介质
US11947436B2 (en) 2020-12-21 2024-04-02 International Business Machines Corporation Automatic evaluation of virtual machine computing power
CN113806089B (zh) * 2021-09-17 2023-06-27 中国联合网络通信集团有限公司 集群负载资源调度方法、装置、电子设备及可读存储介质
CN115085994B (zh) * 2022-06-09 2023-05-12 河南翼宣科技有限公司 一种云计算内部物理机的信息集中化安全管理***
CN116760832B (zh) * 2023-06-01 2024-02-13 兴容(上海)信息技术股份有限公司 一种基于多源节点的云平台资源管理***及方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101593133A (zh) * 2009-06-29 2009-12-02 北京航空航天大学 虚拟机资源负载均衡方法及装置
CN102096601A (zh) * 2011-02-11 2011-06-15 浪潮(北京)电子信息产业有限公司 一种虚拟机迁移的管理方法和***

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011110026A1 (zh) * 2010-10-29 2011-09-15 华为技术有限公司 一种实现数据中心资源负载均衡的方法及装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101593133A (zh) * 2009-06-29 2009-12-02 北京航空航天大学 虚拟机资源负载均衡方法及装置
CN102096601A (zh) * 2011-02-11 2011-06-15 浪潮(北京)电子信息产业有限公司 一种虚拟机迁移的管理方法和***

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
《基于随机规划的云计算中虚拟机分配优化研究》;谢文静等;《计算机工程与科学》;20120717;第34卷(第5期);全文 *

Also Published As

Publication number Publication date
CN103873498A (zh) 2014-06-18

Similar Documents

Publication Publication Date Title
CN103873498B (zh) 云平台资源自适应预警方法与***
US11392843B2 (en) Utilizing a machine learning model to predict a quantity of cloud resources to allocate to a customer
Saxena et al. A proactive autoscaling and energy-efficient VM allocation framework using online multi-resource neural network for cloud data center
EP3716075A1 (en) Utilizing machine learning models to process resource usage data and to determine anomalous usage of resources
Xie et al. Real-time prediction of docker container resource load based on a hybrid model of ARIMA and triple exponential smoothing
Vazquez Time series forecasting of cloud data center workloads for dynamic resource provisioning
US20200125973A1 (en) Data Centre Utilisation Forecasting System And Method
CN102959510A (zh) 用于计算机功率和资源消耗建模的方法和***
CN107515663A (zh) 调整中央处理器内核运行频率的方法和装置
Naskos et al. Cloud elasticity: a survey
Khan et al. HeporCloud: An energy and performance efficient resource orchestrator for hybrid heterogeneous cloud computing environments
CN107203255A (zh) 一种网络功能虚拟化环境中迁移节能方法和装置
Nguyen et al. Building resource auto-scaler with functional-link neural network and adaptive bacterial foraging optimization
CN109491760A (zh) 一种高效能数据中心云服务器资源自主管理方法和***
Jeong et al. Stable and efficient resource management using deep neural network on cloud computing
Yadav et al. Maintaining container sustainability through machine learning
Netti et al. Operational data analytics in practice: experiences from design to deployment in production HPC environments
JP5988173B2 (ja) アプリケーションアーキテクチャ設計方法、アプリケーションアーキテクチャ設計システム、およびプログラム
Lee et al. Refining micro services placement over multiple kubernetes-orchestrated clusters employing resource monitoring
CN106293949A (zh) 一种计算环境下基于基线分析的资源调度策略
Su et al. Achieving self-aware parallelism in stream programs
Zhang et al. A novel hybrid model for docker container workload prediction
Zheng et al. Towards an adaptive human-centric computing resource management framework based on resource prediction and multi-objective genetic algorithm
Wang et al. An Efficient Load Prediction‐Driven Scheduling Strategy Model in Container Cloud
Qiu et al. FLASH: Fast model adaptation in ML-centric cloud platforms

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant