CN113918341A - 设备调度方法、装置、设备及存储介质 - Google Patents

设备调度方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN113918341A
CN113918341A CN202111221767.3A CN202111221767A CN113918341A CN 113918341 A CN113918341 A CN 113918341A CN 202111221767 A CN202111221767 A CN 202111221767A CN 113918341 A CN113918341 A CN 113918341A
Authority
CN
China
Prior art keywords
migration
service object
execution
access
amount
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111221767.3A
Other languages
English (en)
Inventor
叶善茂
陈卓
杨丹
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Life Insurance Company of China Ltd
Original Assignee
Ping An Life Insurance Company of China Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Life Insurance Company of China Ltd filed Critical Ping An Life Insurance Company of China Ltd
Priority to CN202111221767.3A priority Critical patent/CN113918341A/zh
Publication of CN113918341A publication Critical patent/CN113918341A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5083Techniques for rebalancing the load in a distributed system
    • G06F9/5088Techniques for rebalancing the load in a distributed system involving task migration
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5005Allocation of resources, e.g. of the central processing unit [CPU] to service a request
    • G06F9/5027Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals
    • G06F9/505Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals considering the load
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本申请涉及数据处理技术领域,揭示了一种设备调度方法、装置、设备及存储介质,其中方法包括:获取预设的统计时间段内不同的服务对象接收到的历史访问量,根据历史访问量计算每一个服务对象的预测访问量;根据预测访问量的总量移除执行设备或添加新的执行设备,并根据预测访问量对服务对象进行迁移;获取各个执行设备按照预设的时间间隔上报的资源信息;接收访问请求,识别访问请求的请求报文对应的服务对象,获取服务对象的实时访问量,根据资源信息得到各个执行设备的当前负载状态,计算服务对象所在的执行设备的预测负载状态;对满足迁移条件的执行设备中的服务对象进行迁移;从而提高对服务器的访问效率。

Description

设备调度方法、装置、设备及存储介质
技术领域
本申请涉及到数据处理技术领域,特别是涉及到一种设备调度方法、装置、设备及存储介质。
背景技术
现有的集群管理方案通常是以机器为单位的,每个机器部署的服务以及加载的产品都是一致的,因此,若几个访问量大的产品同时部署在同一机器上,会导致该机器的服务压力大大提高,且会导致该机器中访问量较小的产品被访问量较大的产品挤占机器资源,导致访问效率较低的问题。
发明内容
本申请的主要目的为提供一种设备调度方法、装置、设备及存储介质,旨在解决现有技术中对服务器的访问效率较低的问题。
为了实现上述发明目的,本申请提出一种设备调度方法,所述方法包括:
获取预设的统计时间段内,不同的服务对象接收到的历史访问量,根据所述历史访问量得到预测模型,并根据所述预测模型计算每一个所述服务对象的预测访问量;
当所述预测访问量的总量小于预设的缩容阈值时,根据所述预测访问量对所述服务对象进行迁移,并在迁移完成后移除空闲的执行设备,当所述预测访问量的总量大于预设的扩容阈值时,根据所述预测访问量添加新的执行设备,并根据所述预测访问量对所述服务对象进行迁移;
获取各个所述执行设备按照预设的时间间隔上报的资源信息;
接收访问请求的请求报文,识别所述请求报文对应的服务对象,获取所述服务对象的实时访问量,根据所述资源信息得到各个所述执行设备的当前负载状态,并根据所述实时访问量和当前负载状态,计算所述服务对象所在的执行设备的预测负载状态;
将所述预测负载状态满足预设的迁移条件的执行设备作为第一迁移设备,根据所述实时访问量和所述当前负载状态,对所述第一迁移设备中的服务对象进行迁移。
进一步的,所述根据所述实时访问量和所述当前负载状态,对所述第一迁移设备中的服务对象进行迁移,包括:
获取迁移方案库,其中,所述迁移方案库中包括若干预设的迁移方案,每一个所述迁移方案对应至少一组实时访问量和所述当前负载状态;
根据所述实时访问量和所述当前负载状态,在所述迁移方案库中选取对应的迁移方案,并根据选取的迁移方案对所述第一迁移设备中的服务对象进行迁移。
进一步的,所述获取各个所述执行设备按照预设的时间间隔上报的资源信息之后,还包括:
当接收到所述资源信息时,对所述资源信息对应的执行设备进行延时计时;
当所述延时计时的时间大于预设的上报时间阈值时,对所述执行设备进行入网检测,若所述执行设备的入网状态正常,向控制中心发送检修指令;
若所述执行设备的入网状态异常,判断所述执行设备是否为已移除状态,若否,向所述控制中心发送检修指令。
进一步的,所述根据所述实时访问量和所述当前负载状态,对所述第一迁移设备中的服务对象进行迁移,还包括:
判断所述第一迁移设备中,是否存在实时访问量大于预设的负载上限的服务对象,若存在,将实时访问量大于预设的负载上限的所述服务对象拆分为若干个服务片段;
根据所述实时访问量选取若干个执行设备作为第二迁移设备,并将所述服务片段分别迁移至不同的所述第二迁移设备中。
进一步的,所述对所述第一迁移设备中的服务对象进行迁移,包括:
获取所述第一迁移设备中,每一个需要迁移的所述服务对象的优先级参数,并按照优先级参数由高到低的顺序对所述服务对象进行迁移。
进一步的,所述移除空闲的执行设备,包括:
识别每一个空闲的所述执行设备对应的机架信息,并按照所述机架信息对空闲的所述执行设备进行分组移除。
本申请还提出了一种设备调度装置,包括:
访问量计算模块,用于获取预设的统计时间段内不同的服务对象接收到的历史访问量,采用预设的预测模型,根据所述预测模型计算每一个所述服务对象的预测访问量;
设备调节模块,用于当所述预测访问量的总量小于预设的缩容阈值时,根据所述预测访问量对所述服务对象进行迁移,并在迁移完成后移除空闲的执行设备,当所述预测访问量的总量大于预设的扩容阈值时,根据所述预测访问量添加新的执行设备,并根据所述预测访问量对所述服务对象进行迁移;
资源信息获取模块,用于获取各个所述执行设备按照预设的时间间隔上报的资源信息;
负载状态预测模块,用于接收访问请求的请求报文,识别所述请求报文对应的服务对象,获取所述服务对象的实时访问量,根据所述资源信息得到各个所述执行设备的当前负载状态,并根据所述实时访问量和当前负载状态,计算所述服务对象所在的执行设备的预测负载状态;
对象迁移模块,用于将所述预测负载状态满足预设的迁移条件的执行设备作为第一迁移设备,根据所述实时访问量和所述当前负载状态,对所述第一迁移设备中的服务对象进行迁移。
本申请还提出了一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述任一项所述方法的步骤。
本申请还提出了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任一项所述的方法的步骤。
本申请的设备调度方法、装置、设备及存储介质,根据预测模型对各个服务对象的预测访问量进行计算,能够得到准确率较高的预测访问量结果;通过预测访问量的总量对执行设备进行扩容或缩容,提高了执行设备的平均利用率,同时避免了执行设备过载,并且避免了某些执行设备频繁地满足迁移条件的情况,进而导致调度中心需要频繁地对服务对象进行反复调度,影响服务对象的执行效率的问题;通过获取各个执行设备间隔上报的资源信息,以便于对当前接入的各个执行设备进行负载计算,从而为设备调度提供参数支持;通过获取访问请求所对应的服务对象,分别计算不同服务对象的实时访问量,从而区分不同服务对象的资源要求,并根据实时访问量和当前负载状态对各个执行设备的预测负载状态进行计算,从而判定执行设备是否能继续负担当前的服务对象;根据预测负载状态判定是否需要迁移,并在满足迁移条件时根据实时访问量和当前负载状态进行服务对象的迁移,从而使各个执行设备之间的负载较为均衡,并且避免访问量较小的服务对象被访问量较大的服务对象挤占机器资源,导致访问效率降低的问题。
附图说明
图1为本申请一实施例的设备调度方法的流程示意图;
图2为本申请一具体实施方式的设备调度方法的流程示意图;
图3为本申请一实施例的设备调度装置的结构示意框图;
图4为本申请一实施例的计算机设备的结构示意框图。
本申请目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
参照图1,为了实现上述发明目的,本申请提出一种设备调度方法,所述方法包括:
S1:获取预设的统计时间段内,不同的服务对象接收到的历史访问量,根据所述历史访问量得到预测模型,并根据所述预测模型计算每一个所述服务对象的预测访问量;
S2:当所述预测访问量的总量小于预设的缩容阈值时,根据所述预测访问量对所述服务对象进行迁移,并在迁移完成后移除空闲的执行设备,当所述预测访问量的总量大于预设的扩容阈值时,根据所述预测访问量添加新的执行设备,并根据所述预测访问量对所述服务对象进行迁移;
S3:获取各个所述执行设备按照预设的时间间隔上报的资源信息;
S4:接收访问请求的请求报文,识别所述请求报文对应的服务对象,获取所述服务对象的实时访问量,根据所述资源信息得到各个所述执行设备的当前负载状态,并根据所述实时访问量和当前负载状态,计算所述服务对象所在的执行设备的预测负载状态;
S5:将所述预测负载状态满足预设的迁移条件的执行设备作为第一迁移设备,根据所述实时访问量和所述当前负载状态,对所述第一迁移设备中的服务对象进行迁移。
本实施例根据预测模型对各个服务对象的预测访问量进行计算,能够得到准确率较高的预测访问量结果;通过预测访问量的总量对执行设备进行扩容或缩容,提高了执行设备的平均利用率,同时避免了执行设备过载,并且避免了某些执行设备频繁地满足迁移条件的情况,进而导致调度中心需要频繁地对服务对象进行反复调度,影响服务对象的执行效率的问题;通过获取各个执行设备间隔上报的资源信息,以便于对当前接入的各个执行设备进行负载计算,从而为设备调度提供参数支持;通过获取访问请求所对应的服务对象,分别计算不同服务对象的实时访问量,从而区分不同服务对象的资源要求,并根据实时访问量和当前负载状态对各个执行设备的预测负载状态进行计算,从而判定执行设备是否能继续负担当前的服务对象;根据预测负载状态判定是否需要迁移,并在满足迁移条件时根据实时访问量和当前负载状态进行服务对象的迁移,从而使各个执行设备之间的负载较为均衡,并且避免访问量较小的服务对象被访问量较大的服务对象挤占机器资源,导致访问效率降低的问题。
对于步骤S1,本实施例应用于资源分配,尤其是设备调度的应用中。随着机器智能化的发展,采用机器人应答客户请求的场景日益普及,为了避免各个机器人之间负载不均衡的问题,需要对各个机器人处理的任务进行动态调度。而各个机器人中搭载的服务对象的访问量,情况往往与用户的行为息息相关,当访问的用户量足够大时,访问量情况往往会呈现某种规律,示例性地,通常情况下,凌晨1点的访问量往往会远低于上午11点;因此,可以设定统计时间段,例如将一个小时作为一个统计时间段,并统计不同时间段内各个服务对象接收到的访问请求的数量,最终能够得到各个服务对象的访问量规律;由于除了时间外,工作日或节假日、外界天气情况等均有可能对访问量产生影响,因此本实施例预先训练一个预测模型,具体来说,该模型的训练方式如下:通过计算机等处理器,基于模拟退火和二分查找的算法,生成根据日期属性和天气状态等相关的历史特征预测未来访问量的神经网络初始模型,接收预设的统计时间段内,不同的服务对象接收到的历史访问量,将历史访问量对应的日期、天气等历史特征输入初始模型中,获得输出结果,计算输出结果与上述历史访问量之间的损失值,并根据损失值对初始模型中的约束参数进行调整完善,直至初始模型的输出结果的损失值小于预设的阈值;将实时得到的日期、天气等数据输入训练后的预测模型,对各个服务对象的未来时间段内的预测访问量进行计算,能够得到准确率较高的预测访问量结果。
对于步骤S2,随着实时访问量的改变,有可能导致某些执行设备频繁地满足迁移条件的情况,进而导致调度中心需要频繁地对服务对象进行反复调度,反而影响服务对象的执行效率;因此,本实施例基于上述预测访问量,对执行设备集群进行伸缩,即扩容或缩容;具体地,当服务对象的预测访问量的总量大于预设的最大值时,表示当前数量的执行设备不足以支持即将接入的访问请求,因此需要根据超出阈值的比例添加新的执行设备,当服务对象的预测访问量的总量小于预设的最小值时,表示当前数量的执行设备对于即将接入的访问请求总数而言是过盈状态,因此需要根据差值的比例移除部分执行设备,避免设备资源浪费;示例性地,可以设定为服务对象的预测访问量的总数到达最大值的1.2倍时,就添加一台执行设备,到达最大值的1.4倍时,就添加两台执行设备;此外,还可以设定服务对象的预测访问量的总数达到最小值的0.8倍时,就移除一台执行设备;本发明通过预测访问量的总量对执行设备进行扩容或缩容,提高了执行设备的平均利用率,同时避免了执行设备过载,并且避免了某些执行设备频繁地满足迁移条件的情况,进而导致调度中心需要频繁地对服务对象进行反复调度,影响服务对象的执行效率的问题。
对于步骤S3,上述执行设备通常为可以搭载不同智能答复程序等的机器,是用于根据用户的访问请求反馈相应的行为的智能机器设备。上述资源信息包括执行设备的IP、执行设备的CPU、执行设备加载的服务类别和数量等,能够用于定位每一个执行设备的负载状态的参数。上述预设的时间间隔可以为2s,即每个执行设备每间隔2S向调度中心进行心跳上报,上报的内容包括机器IP、机器的cpu、机器加载的服务类别和数量等,通过心跳上报,使得调度中心能够为维护一份列表保存整个集群的机器资源以及每个机器上面加载的产品。本发明中,通过获取各个执行设备间隔上报的资源信息,以便于对各个执行设备进行负载计算,从而为设备调度提供参数支持。
对于步骤S4,当网关中心接收到访问请求的访问请求报文时,先判断该报文是否合法,若为合法报文,则进一步识别对应的服务对象,若为非法报文,则对报文进行抛弃,并向管理中心发出警告;上述服务对象可以为面试机器人、督导机器人、外呼机器人、客服机器人等机器人的智能应答程序,上述面试机器人、督导机器人、外呼机器人、客服机器人等机器人的智能应答程序可以分别搭载于互不相同的执行设备中,也可以搭载于相同的执行设备中,因此,需要根据实时访问量来区分不同服务对象的资源要求;示例性地,若面试机器人和督导机器人程序在执行设备A中执行,外呼机器人和客服机器人程序在执行设备B中执行,而面试机器人的实时访问量为10000,督导机器人、外呼机器人和客服机器人的实时访问量分别为100,且此时执行设备A的当前负载状态为满负载状态的90%,而执行设备B的当前负载状态为满负载状态的20%,若根据执行设备A的CPU和当前负载状态计算得到接入面试机器人的实时访问请求后,导致执行设备A的预测负载状态为满负载状态的110%,显然在不进行设备调度的情况下,该负载状态是不合理的。本发明中,通过获取访问请求所对应的服务对象,分别计算不同服务对象的实时访问量,从而区分不同服务对象的资源要求,并根据实时访问量和当前负载状态对各个执行设备的预测负载状态进行计算,从而判定执行设备是否能继续负担当前的服务对象。
对于步骤S5,当有至少一个执行设备的预测负载状态满足预设的迁移条件时,将该执行设备作为第一迁移设备,并对第一迁移设备中的服务对象进行迁移,避免不同执行设备之间工作状态均衡性较差的情况;上述迁移条件可以为,执行设备的预测负载状态大于预设的阈值,例如大于满负载状态的80%,还可以为,执行设备的预测负载状态与各个执行设备的平均预测负载状态之间的差值大于预设的阈值,例如,大于平均预测负载状态的30%等负载不均衡的情况,在上述情况下,往往会导致某一些执行设备的访问效率较低,且会导致访问量较小的服务对象被访问量较大的服务对象挤占机器资源,导致访问效率降低的问题;因此,当存在至少一个执行设备的预测负载状态满足预设的迁移条件时,根据不同服务对象的实时访问量和不同执行设备的当前负载状态,在执行设备中进行可迁移设备选取,以使执行设备的预测负载状态不大于预设的阈值,且执行设备的预测负载状态与各个执行设备的平均预测负载状态之间的差值不大于预设的阈值。本发明中,根据预测负载状态判定是否需要迁移,并在满足迁移条件时根据实时访问量和当前负载状态进行服务对象的迁移,从而使各个执行设备之间的负载较为均衡,并且避免访问量较小的服务对象被访问量较大的服务对象挤占机器资源,导致访问效率降低的问题。
在一个实施例中,所述根据所述实时访问量和所述当前负载状态,对所述第一迁移设备中的服务对象进行迁移S5,包括:
S51:获取迁移方案库,其中,所述迁移方案库中包括若干预设的迁移方案,每一个所述迁移方案对应至少一组实时访问量和所述当前负载状态;
S52:根据所述实时访问量和所述当前负载状态,在所述迁移方案库中选取对应的迁移方案,并根据选取的迁移方案对所述第一迁移设备中的服务对象进行迁移。
本实施例通过建立迁移方案库,根据所述实时访问量和所述当前负载状态,在所述迁移方案库中选取对应的迁移方案,并根据选取的迁移方案对所述服务对象进行迁移,从而提高迁移效率和迁移的稳定性。
对于步骤S51,当执行设备的数量较多时,临时计算并生成迁移方案有可能会耗费较长的时间,导致迁移效率较低,进而影响服务对象的响应效率。因此,可以获取预先建立的各个服务对象的实时访问量范围和各个执行设备的当前负载状态范围对应的迁移方案。
对于步骤S52,示例性地,当实时访问量大于10000的服务对象的数量小于服务对象总数量的50%,而当前负载状态小于满负载状态的20%的执行设备数量大于服务对象总数量的50%,那么迁移方案可以为,将实时访问量大于10000的服务对象依次迁移至当前负载状态小于满负载状态的20%的执行设备中,且一个当前负载状态小于满负载状态的20%的执行设备仅搭载一个实时访问量大于10000的服务对象;当实时访问量大于10000的服务对象的数量小于服务对象总数量的10%,然而超过80%的执行设备的当前负载状态大于满负载状态的50%,那么迁移方案可以为,将每三个实时访问量小于1000的服务对象集合至同一个执行服务器中,集合完成后,再将实时访问量大于10000的服务对象分别迁移至当前负载状态最小的执行设备中,以实现将服务对象分配给加载服务少、CPU空闲、不在同一个机架的机器上。在具体的应用过程中,还可以根据实际情况预设不同的迁移方案,以提高迁移效率和迁移的稳定性。
在一个实施例中,参照图2,所述获取各个执行设备按照预设的时间间隔上报的资源信息S3之后,还包括:
S31:当接收到所述资源信息时,对所述资源信息对应的执行设备进行延时计时;
S32:当所述延时计时的时间大于预设的上报时间阈值时,对所述执行设备进行入网检测,若所述执行设备的入网状态正常,向控制中心发送检修指令;
S33:若所述执行设备的入网状态异常,判断所述执行设备是否为已移除状态,若否,向所述控制中心发送检修指令。
本实施例通过在接收到资源信息后,对资源信息对应的执行设备进行延时计时,并根据延时计时情况对各个执行设备的入网状态进行检测,从而识别各个执行设备的工作状态是否异常,提高了检修的及时性。
对于步骤S32,由于预先对执行设备设定了心跳上报,因此若某一个执行设备未能按照心跳时间完成资源信息上报,则可能是出现设备故障;然而本实施例会对执行设备进行缩容,因此执行设备的入网状态异常后,还需要判断该执行设备是否为缩容过程中移除的执行设备,若是,则认为该执行设备无异常,若否,则认为该执行设备存在入网异常。
在一个实施例中,所述根据所述实时访问量和所述当前负载状态,对所述第一迁移设备中的服务对象进行迁移S5,还包括:
S53:判断所述第一迁移设备中,是否存在实时访问量大于预设的负载上限的服务对象,若存在,将实时访问量大于预设的负载上限的所述服务对象拆分为若干个服务片段;
S54:根据所述实时访问量选取若干个执行设备作为第二迁移设备,并将所述服务片段分别迁移至不同的所述第二迁移设备中。
本实施例通过判断是否存在实时访问量大于预设的负载上限的服务对象,根据所述实时访问量选取若干个执行设备作为第二迁移设备,并将所述服务片段分别迁移至不同的所述第二迁移设备中,从而避免了执行设备过载的问题,提高了设备调度的稳定性。
对于步骤S53,当第一迁移设备中,若存在服务对象的实时访问量大于每一个单独的执行设备所能承受的负载上限时,可以对其进行拆分。
对于步骤S54,在对实时访问量大于单个执行设备所能承受的负载上限时,对服务对象进行拆分后,将拆分得到的服务片段分别迁移至不同的第二迁移设备中,避免某一执行设备过载的问题,提高了设备调度的稳定性。
在一个实施例中,所述根据所述预测模型计算每一个所述服务对象的预测访问量S1之后,包括:
S11:选取所述预测访问量的波动值不大于预设的波动范围的所述服务对象作为稳定对象;
S12:将所述稳定对象组成若干个稳定对象组,并将所述稳定对象组分别迁移至预设的稳定设备中。
本实施例根据预测访问量的波动值进行稳定对象判定,并将所述稳定对象组分别迁移至预设的稳定设备中,从而减少迁移总次数,提高迁移效率。
对于步骤S11,部分服务对象有可能随时间变化,访问量也会存在较大的波动,而部分服务对象有可能在每个时间段中的访问量基本保持稳定。
对于步骤S12,针对满足步骤S11条件的这种长期保持稳定的服务对象,可以集合为稳定对象组,并指定部分稳定设备处理,而通常情况下不对稳定设备中的稳定对象组进行迁移,从而减少迁移总次数,提高迁移效率。
在一个实施例中,所述对所述服务对象进行迁移S5,包括:
S55:获取每一个需要迁移的所述服务对象的优先级参数,并按照优先级参数由高到低的顺序对所述服务对象进行迁移。
本实施例通过优先级参数判定服务对象的迁移,提高了对不同优先级的服务对象处理的有序性,避免迁移导致执行顺序混乱的问题。
对于步骤S55,对优先级参数较高的服务对象进行迁移,能够使得优先级参数高的服务对象更早地完成迁移,从而更早地迁移完成,以便于新迁移到的执行设备更早地开始执行,提高了对不同优先级的服务对象处理的有序性,避免迁移导致执行顺序混乱的问题。
在一个实施例中,所述移除空闲的执行设备S2,包括:
S21:识别每一个空闲的所述执行设备对应的机架信息,并按照所述机架信息对空闲的所述执行设备进行分组移除。
本实施例基于机架信息对执行设备进行分组移除,提高了对执行设备的可监控性。
对于步骤S21,在具体的实施方式中,不用的执行设备有可能通过同一个背板连接在同一个机架上,也可能通过通信线路与同一个机架控制***连接,为了提高执行设备移除的有序性,可以按照机架信息将属于同一个机架的执行设备分为一组,依次对各个组进行执行设备移除,并在一个组的执行设备均移除完成后,关闭该组所属的机架,从而在移除过程中节约机架控制***资源。
参照图3,本申请还提出了一种设备调度装置,包括:
访问量计算模块100,用于获取预设的统计时间段内不同的服务对象接收到的历史访问量,采用预设的预测模型,根据所述预测模型计算每一个所述服务对象的预测访问量;
设备调节模块200,用于当所述预测访问量的总量小于预设的缩容阈值时,根据所述预测访问量对所述服务对象进行迁移,并在迁移完成后移除空闲的执行设备,当所述预测访问量的总量大于预设的扩容阈值时,根据所述预测访问量添加新的执行设备,并根据所述预测访问量对所述服务对象进行迁移;
资源信息获取模块300,用于获取各个所述执行设备按照预设的时间间隔上报的资源信息;
负载状态预测模块400,用于接收访问请求的请求报文,识别所述请求报文对应的服务对象,获取所述服务对象的实时访问量,根据所述资源信息得到各个所述执行设备的当前负载状态,并根据所述实时访问量和当前负载状态,计算所述服务对象所在的执行设备的预测负载状态;
对象迁移模块500,用于将所述预测负载状态满足预设的迁移条件的执行设备作为第一迁移设备,根据所述实时访问量和所述当前负载状态,对所述第一迁移设备中的服务对象进行迁移。
本实施例根据预测模型对各个服务对象的预测访问量进行计算,能够得到准确率较高的预测访问量结果;通过预测访问量的总量对执行设备进行扩容或缩容,提高了执行设备的平均利用率,同时避免了执行设备过载,并且避免了某些执行设备频繁地满足迁移条件的情况,进而导致调度中心需要频繁地对服务对象进行反复调度,影响服务对象的执行效率的问题;通过获取各个执行设备间隔上报的资源信息,以便于对当前接入的各个执行设备进行负载计算,从而为设备调度提供参数支持;通过获取访问请求所对应的服务对象,分别计算不同服务对象的实时访问量,从而区分不同服务对象的资源要求,并根据实时访问量和当前负载状态对各个执行设备的预测负载状态进行计算,从而判定执行设备是否能继续负担当前的服务对象;根据预测负载状态判定是否需要迁移,并在满足迁移条件时根据实时访问量和当前负载状态进行服务对象的迁移,从而使各个执行设备之间的负载较为均衡,并且避免访问量较小的服务对象被访问量较大的服务对象挤占机器资源,导致访问效率降低的问题。
在一个实施例中,所述对象迁移模块500,还用于:
获取迁移方案库,其中,所述迁移方案库中包括若干预设的迁移方案,每一个所述迁移方案对应至少一组实时访问量和所述当前负载状态;
根据所述实时访问量和所述当前负载状态,在所述迁移方案库中选取对应的迁移方案,并根据选取的迁移方案对所述服务对象进行迁移。
在一个实施例中,所述资源信息获取模块300,还用于:
当接收到所述资源信息时,对所述资源信息对应的执行设备进行延时计时;
当所述延时计时的时间大于预设的上报时间阈值时,对所述执行设备进行入网检测,若所述执行设备的入网状态正常,向控制中心发送检修指令;
若所述执行设备的入网状态异常,判断所述执行设备是否为已移除状态,若否,向所述控制中心发送检修指令。
在一个实施例中,所述对象迁移模块500,还用于:
判断所述第一迁移设备中,是否存在实时访问量大于预设的负载上限的服务对象,若存在,将实时访问量大于预设的负载上限的所述服务对象拆分为若干个服务片段;
根据所述实时访问量选取若干个执行设备作为第二迁移设备,并将所述服务片段分别迁移至不同的所述第二迁移设备中。
在一个实施例中,还包括稳定对象选取模块600,用于:
选取所述预测访问量的波动值不大于预设的波动范围的所述服务对象作为稳定对象;
将所述稳定对象组成若干个稳定对象组,并将所述稳定对象组分别迁移至预设的稳定设备中。
在一个实施例中,所述第二迁移模块500,还用于:
获取所述第一迁移设备中,每一个需要迁移的所述服务对象的优先级参数,并按照优先级参数由高到低的顺序对所述服务对象进行迁移。
在一个实施例中,所述设备调节模块200,还用于:
识别每一个空闲的所述执行设备对应的机架信息,并按照所述机架信息对空闲的所述执行设备进行分组移除。
参照图4,本申请实施例中还提供一种计算机设备,该计算机设备可以是服务器,其内部结构可以如图4所示。该计算机设备包括通过***总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设计的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作***、计算机程序和数据库。该内存器为非易失性存储介质中的操作***和计算机程序的运行提供环境。该计算机设备的数据库用于储存设备调度方法等数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种设备调度方法。所述设备调度方法,包括:获取预设的统计时间段内,不同的服务对象接收到的历史访问量,根据所述历史访问量得到预测模型,并根据所述预测模型计算每一个所述服务对象的预测访问量;当所述预测访问量的总量小于预设的缩容阈值时,根据所述预测访问量对所述服务对象进行迁移,并在迁移完成后移除空闲的执行设备,当所述预测访问量的总量大于预设的扩容阈值时,根据所述预测访问量添加新的执行设备,并根据所述预测访问量对所述服务对象进行迁移;获取各个所述执行设备按照预设的时间间隔上报的资源信息;接收访问请求的请求报文,识别所述请求报文对应的服务对象,获取所述服务对象的实时访问量,根据所述资源信息得到各个所述执行设备的当前负载状态,并根据所述实时访问量和当前负载状态,计算所述服务对象所在的执行设备的预测负载状态;将所述预测负载状态满足预设的迁移条件的执行设备作为第一迁移设备,根据所述实时访问量和所述当前负载状态,对所述第一迁移设备中的服务对象进行迁移。
本申请一实施例还提供一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现一种设备调度方法,包括步骤:获取预设的统计时间段内,不同的服务对象接收到的历史访问量,根据所述历史访问量得到预测模型,并根据所述预测模型计算每一个所述服务对象的预测访问量;当所述预测访问量的总量小于预设的缩容阈值时,根据所述预测访问量对所述服务对象进行迁移,并在迁移完成后移除空闲的执行设备,当所述预测访问量的总量大于预设的扩容阈值时,根据所述预测访问量添加新的执行设备,并根据所述预测访问量对所述服务对象进行迁移;获取各个所述执行设备按照预设的时间间隔上报的资源信息;接收访问请求的请求报文,识别所述请求报文对应的服务对象,获取所述服务对象的实时访问量,根据所述资源信息得到各个所述执行设备的当前负载状态,并根据所述实时访问量和当前负载状态,计算所述服务对象所在的执行设备的预测负载状态;将所述预测负载状态满足预设的迁移条件的执行设备作为第一迁移设备,根据所述实时访问量和所述当前负载状态,对所述第一迁移设备中的服务对象进行迁移。
上述执行的设备调度方法,本实施例根据预测模型对各个服务对象的预测访问量进行计算,能够得到准确率较高的预测访问量结果;通过预测访问量的总量对执行设备进行扩容或缩容,提高了执行设备的平均利用率,同时避免了执行设备过载,并且避免了某些执行设备频繁地满足迁移条件的情况,进而导致调度中心需要频繁地对服务对象进行反复调度,影响服务对象的执行效率的问题;通过获取各个执行设备间隔上报的资源信息,以便于对当前接入的各个执行设备进行负载计算,从而为设备调度提供参数支持;通过获取访问请求所对应的服务对象,分别计算不同服务对象的实时访问量,从而区分不同服务对象的资源要求,并根据实时访问量和当前负载状态对各个执行设备的预测负载状态进行计算,从而判定执行设备是否能继续负担当前的服务对象;根据预测负载状态判定是否需要迁移,并在满足迁移条件时根据实时访问量和当前负载状态进行服务对象的迁移,从而使各个执行设备之间的负载较为均衡,并且避免访问量较小的服务对象被访问量较大的服务对象挤占机器资源,导致访问效率降低的问题。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的和实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可以包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双速据率SDRAM(SSRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、装置、物品或者方法不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、装置、物品或者方法所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、装置、物品或者方法中还存在另外的相同要素。
以上所述仅为本申请的优选实施例,并非因此限制本申请的专利范围,凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本申请的专利保护范围内。

Claims (10)

1.一种设备调度方法,其特征在于,所述方法包括:
获取预设的统计时间段内,不同的服务对象接收到的历史访问量,根据所述历史访问量得到预测模型,并根据所述预测模型计算每一个所述服务对象的预测访问量;
当所述预测访问量的总量小于预设的缩容阈值时,根据所述预测访问量对所述服务对象进行迁移,并在迁移完成后移除空闲的执行设备,当所述预测访问量的总量大于预设的扩容阈值时,根据所述预测访问量添加新的执行设备,并根据所述预测访问量对所述服务对象进行迁移;
获取各个所述执行设备按照预设的时间间隔上报的资源信息;
接收访问请求的请求报文,识别所述请求报文对应的服务对象,获取所述服务对象的实时访问量,根据所述资源信息得到各个所述执行设备的当前负载状态,并根据所述实时访问量和当前负载状态,计算所述服务对象所在的执行设备的预测负载状态;
将所述预测负载状态满足预设的迁移条件的执行设备作为第一迁移设备,根据所述实时访问量和所述当前负载状态,对所述第一迁移设备中的服务对象进行迁移。
2.根据权利要求1所述的设备调度方法,其特征在于,所述根据所述实时访问量和所述当前负载状态,对所述第一迁移设备中的服务对象进行迁移,包括:
获取迁移方案库,其中,所述迁移方案库中包括若干预设的迁移方案,每一个所述迁移方案对应至少一组实时访问量和所述当前负载状态;
根据所述实时访问量和所述当前负载状态,在所述迁移方案库中选取对应的迁移方案,并根据选取的迁移方案对所述第一迁移设备中的服务对象进行迁移。
3.根据权利要求1所述的设备调度方法,其特征在于,所述获取各个所述执行设备按照预设的时间间隔上报的资源信息之后,还包括:
当接收到所述资源信息时,对所述资源信息对应的执行设备进行延时计时;
当所述延时计时的时间大于预设的上报时间阈值时,对所述执行设备进行入网检测,若所述执行设备的入网状态正常,向控制中心发送检修指令;
若所述执行设备的入网状态异常,判断所述执行设备是否为已移除状态,若否,向所述控制中心发送检修指令。
4.根据权利要求1所述的设备调度方法,其特征在于,所述根据所述实时访问量和所述当前负载状态,对所述第一迁移设备中的服务对象进行迁移,还包括:
判断所述第一迁移设备中,是否存在实时访问量大于预设的负载上限的服务对象,若存在,将实时访问量大于预设的负载上限的所述服务对象拆分为若干个服务片段;
根据所述实时访问量选取若干个执行设备作为第二迁移设备,并将所述服务片段分别迁移至不同的所述第二迁移设备中。
5.根据权利要求1所述的设备调度方法,其特征在于,所述根据所述预测模型计算每一个所述服务对象的预测访问量之后,包括:
选取所述预测访问量的波动值不大于预设的波动范围的所述服务对象作为稳定对象;
将所述稳定对象组成若干个稳定对象组,并将所述稳定对象组分别迁移至预设的稳定设备中。
6.根据权利要求1所述的设备调度方法,其特征在于,所述对所述第一迁移设备中的服务对象进行迁移,包括:
获取所述第一迁移设备中,每一个需要迁移的所述服务对象的优先级参数,并按照优先级参数由高到低的顺序对所述服务对象进行迁移。
7.根据权利要求1所述的设备调度方法,其特征在于,所述移除空闲的执行设备,包括:
识别每一个空闲的所述执行设备对应的机架信息,并按照所述机架信息对空闲的所述执行设备进行分组移除。
8.一种设备调度装置,其特征在于,包括:
访问量计算模块,用于获取预设的统计时间段内不同的服务对象接收到的历史访问量,采用预设的预测模型,根据所述预测模型计算每一个所述服务对象的预测访问量;
设备调节模块,用于当所述预测访问量的总量小于预设的缩容阈值时,根据所述预测访问量对所述服务对象进行迁移,并在迁移完成后移除空闲的执行设备,当所述预测访问量的总量大于预设的扩容阈值时,根据所述预测访问量添加新的执行设备,并根据所述预测访问量对所述服务对象进行迁移;
资源信息获取模块,用于获取各个所述执行设备按照预设的时间间隔上报的资源信息;
负载状态预测模块,用于接收访问请求的请求报文,识别所述请求报文对应的服务对象,获取所述服务对象的实时访问量,根据所述资源信息得到各个所述执行设备的当前负载状态,并根据所述实时访问量和当前负载状态,计算所述服务对象所在的执行设备的预测负载状态;
对象迁移模块,用于将所述预测负载状态满足预设的迁移条件的执行设备作为第一迁移设备,根据所述实时访问量和所述当前负载状态,对所述第一迁移设备中的服务对象进行迁移。
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述的方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。
CN202111221767.3A 2021-10-20 2021-10-20 设备调度方法、装置、设备及存储介质 Pending CN113918341A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111221767.3A CN113918341A (zh) 2021-10-20 2021-10-20 设备调度方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111221767.3A CN113918341A (zh) 2021-10-20 2021-10-20 设备调度方法、装置、设备及存储介质

Publications (1)

Publication Number Publication Date
CN113918341A true CN113918341A (zh) 2022-01-11

Family

ID=79241446

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111221767.3A Pending CN113918341A (zh) 2021-10-20 2021-10-20 设备调度方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN113918341A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114710334A (zh) * 2022-03-23 2022-07-05 平安付科技服务有限公司 用于服务器的访问策略调整方法及***
CN116882701A (zh) * 2023-07-27 2023-10-13 上海洲固电力科技有限公司 一种基于零碳模式的电力物资智能调度***及其方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114710334A (zh) * 2022-03-23 2022-07-05 平安付科技服务有限公司 用于服务器的访问策略调整方法及***
CN116882701A (zh) * 2023-07-27 2023-10-13 上海洲固电力科技有限公司 一种基于零碳模式的电力物资智能调度***及其方法
CN116882701B (zh) * 2023-07-27 2024-05-31 上海洲固电力科技有限公司 一种基于零碳模式的电力物资智能调度***及其方法

Similar Documents

Publication Publication Date Title
CN110297711B (zh) 批量数据处理方法、装置、计算机设备及存储介质
CN108829494B (zh) 基于负载预测的容器云平台智能资源优化方法
CN111818159B (zh) 数据处理节点的管理方法、装置、设备及存储介质
CN113918341A (zh) 设备调度方法、装置、设备及存储介质
CN113434253B (zh) 集群资源调度方法、装置、设备及存储介质
CN112162865A (zh) 服务器的调度方法、装置和服务器
CN109460301B (zh) 一种流数据负载的弹性资源配置方法及***
CN113010260A (zh) 容器数量弹性伸缩方法以及容器数量弹性伸缩方法***
US11652720B2 (en) Allocating cloud resources in accordance with predicted deployment growth
US20220138012A1 (en) Computing Resource Scheduling Method, Scheduler, Internet of Things System, and Computer Readable Medium
CN110677459A (zh) 资源调整方法、装置、计算机设备和计算机存储介质
CN113672345A (zh) 一种基于io预测的云虚拟化引擎分布式资源调度方法
CN117435306A (zh) 集群容器扩缩容方法、装置、设备及存储介质
CN115297124A (zh) 一种***运维管理方法、装置及电子设备
CN111046091A (zh) 数据交换***的运行方法、装置及设备
CN113672335A (zh) 容器调度方法、装置、电子装置和存储介质
CN105357026A (zh) 一种资源信息收集方法和计算节点
CN110728372B (zh) 一种人工智能模型动态加载的集群设计方法及集群***
CN115562841B (zh) 一种云视频服务自适应资源调度***和方法
CN111783487A (zh) 一种读卡器设备的故障预警方法及装置
CN115203177B (zh) 一种分布式数据存储***及存储方法
CN111381959A (zh) 扩容方法及装置
CN111556126B (zh) 模型管理方法、***、计算机设备和存储介质
CN116546029A (zh) 负载均衡方法、装置、存储介质及计算机设备
CN116204312A (zh) 一种基于边缘云计算的软硬件共享方法及其***

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination