CN113850428A - 作业调度的预测处理方法、装置和电子设备 - Google Patents
作业调度的预测处理方法、装置和电子设备 Download PDFInfo
- Publication number
- CN113850428A CN113850428A CN202111123438.5A CN202111123438A CN113850428A CN 113850428 A CN113850428 A CN 113850428A CN 202111123438 A CN202111123438 A CN 202111123438A CN 113850428 A CN113850428 A CN 113850428A
- Authority
- CN
- China
- Prior art keywords
- job
- executed
- prediction
- plan
- resource
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000003672 processing method Methods 0.000 title abstract description 10
- 238000000034 method Methods 0.000 claims abstract description 62
- 238000012545 processing Methods 0.000 claims abstract description 60
- 230000008569 process Effects 0.000 claims abstract description 31
- 230000000694 effects Effects 0.000 claims abstract description 26
- 238000012544 monitoring process Methods 0.000 claims description 24
- 230000009467 reduction Effects 0.000 claims description 19
- 230000001419 dependent effect Effects 0.000 claims description 13
- 238000012790 confirmation Methods 0.000 claims description 4
- 238000003860 storage Methods 0.000 description 8
- 238000004891 communication Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 7
- 238000012549 training Methods 0.000 description 5
- 238000012360 testing method Methods 0.000 description 4
- 230000009471 action Effects 0.000 description 3
- 238000005520 cutting process Methods 0.000 description 3
- 238000013135 deep learning Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 238000012423 maintenance Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- WWYNJERNGUHSAO-XUDSTZEESA-N (+)-Norgestrel Chemical compound O=C1CC[C@@H]2[C@H]3CC[C@](CC)([C@](CC4)(O)C#C)[C@@H]4[C@@H]3CCC2=C1 WWYNJERNGUHSAO-XUDSTZEESA-N 0.000 description 1
- 230000002776 aggregation Effects 0.000 description 1
- 238000004220 aggregation Methods 0.000 description 1
- 230000002860 competitive effect Effects 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
- G06Q10/06393—Score-carding, benchmarking or key performance indicator [KPI] analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/10—Office automation; Time management
- G06Q10/103—Workflow collaboration or project management
Landscapes
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Engineering & Computer Science (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- Entrepreneurship & Innovation (AREA)
- Physics & Mathematics (AREA)
- Marketing (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- Development Economics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Game Theory and Decision Science (AREA)
- Educational Administration (AREA)
- Data Mining & Analysis (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请公开一种作业调度的预测处理方法、装置和电子设备,在获得提交的待执行作业的作业计划信息后,至少根据提交的作业计划信息,确定待执行作业的预测计划,并根据预测计划对待执行作业执行预测处理,预测在假定分别执行于未来不同时间段的待执行作业的不同假定作业活动下,***的资源指标数值和/或资源状态,得到预测结果,并根据预测结果,生成待执行作业的可用执行时间窗口集,该集合中的每一可用执行时间窗口,能用于在待执行作业的作业活动过程中使***资源的资源状态满足状态条件,从而,最终可通过该可用执行时间窗口集实现为待执行作业规划合适的作业时间窗口,减少待执行作业执行过程中对其他业务的资源竞争。
Description
技术领域
本申请属于作业调度与资源管理领域,尤其涉及一种作业调度的预测处理方法、装置和电子设备。
背景技术
在云计算环境中,作业活动与其他云计算作业共享基础设施到平台层面的资源,作业活动可能会造成本已经负载较大的作业运行更慢,甚至导致作业超时或失败。例如,Hadoop平台在多作业执行过程中产生大量甚至达到负载阈值的磁盘读写,相应导致对平台存储和应用体验造成很大影响等。因此,有必要提前做出作业调度计划,以通过对作业的调度减少作业对其他业务的资源竞争。
发明内容
为此,本申请公开如下技术方案:
一种作业调度的预测处理方法,所述方法包括:
获取提交的待执行作业的作业计划信息;
至少根据所述作业计划信息,确定预测计划;
根据所述预测计划,对所述待执行作业执行预测处理,得到预测结果;所述预测结果包括:在假定分别执行于未来不同时间段的所述待执行作业的不同假定作业活动下,***的资源指标数值和/或资源状态;
根据所述预测结果,生成所述待执行作业的可用执行时间窗口集,以基于所述可用执行时间窗口集对所述待执行作业进行调度;其中,所述可用执行时间窗口集中的每一可用执行时间窗口,能用于在所述待执行作业的执行过程中使***资源的资源状态满足状态条件。
可选的,所述至少根据所述作业计划信息,确定预测计划,包括:
获取所述待执行作业对应的历史作业的作业数据,及对所述历史作业执行过程中的***资源指标和/或资源状态进行监控所得的监控数据;
根据所述作业计划信息和所述历史作业的作业数据及监控数据,确定预测计划。
可选的,其中,所述作业计划信息至少包括所述待执行作业的执行时间计划信息及节点部署计划信息,所述节点部署计划信息用于指示将所述待执行作业部署至相应节点时的相关计划信息;
所述根据所述作业计划信息和所述历史作业的作业数据及监控数据,确定预测计划,包括:
根据所述节点部署计划信息,确定所述待执行作业的各个部署位置及各个部署位置与所依赖资源间的第一资源依赖关系;
根据所述各个部署位置与所依赖资源间的第一资源依赖关系,至少确定部署于各个位置的待执行作业与所依赖资源间的第二资源依赖关系;
根据所述第一资源依赖关系、所述第二资源依赖关系和所述历史作业的作业数据及监控数据,确定预测计划。
可选的,所述预测计划包括:对所述待执行作业执行预测处理时的中期预测计划和短期预测计划;
其中,所述中期预测计划和所述短期预测计划中的每一预测计划包括:所对应的预测时间范围,按预定步长对所对应预测时间范围进行划分所得的多个时间分片,每一时间分片对应的预测算法及预测算法所需的参数;中期预测计划对应的预测时间范围包含且大于相应短期预测计划对应的预测时间范围;
所述根据所述预测计划,对所述待执行作业执行预测处理,得到预测结果,包括:
根据所述短期预测计划中的预测算法和参数,预测所述待执行作业执行于所述短期预测计划对应的各个时间分片时***的资源指标数值和/或资源状态,得到第一预测结果;
根据所述中期预测计划中的预测算法和参数,预测所述待执行作业执行于所述中期预测计划对应的各个时间分片时***的资源指标数值和/或资源状态,得到第二预测结果。
可选的,所述根据所述预测结果,生成所述待执行作业的可用执行时间窗口集,包括:
根据所述第一预测结果和所述第二预测结果,确定每一时间分片对应的时间点是否为可用执行时间点;所述可用执行时间点为能用于在执行所述待执行作业时使***资源的资源状态满足状态条件的时间点;
将同一假定作业活动的各个时间点合并处理成作业时间窗口;
确定每一作业时间窗口内的各个时间点是否均为可用执行时间点;
若是,将所述作业时间窗口确定为可用执行时间窗口;若否,将所述作业时间窗口确定为非可用执行时间窗口,或基于对所述作业时间窗口的可用与否的确认处理,确定所述作业时间窗口是否为可用执行时间窗口;
其中,确定出的各个可用执行时间窗口构成所述可用执行时间窗口集。
可选的,所述根据所述第一预测结果和所述第二预测结果,确定每一时间分片对应的时间点是否为可用执行时间点,包括:
对所述第一预测结果和所述第二预测结果进行汇聚处理,得到每一时间分片对应的时间点的资源指标数值和/或资源状态预测结果的结果集;
根据对应的所述结果集,基于预定策略确定每一时间分片对应的时间点是否为可用执行时间点。
可选的,上述方法,还包括:
对于包含的各个时间点均为可用执行时间点的作业时间窗口,确定所述作业时间窗口是否与输入的未能用于执行作业的时间区间存在重叠;
若存在重叠,将所述作业时间窗口确定为非可用执行时间窗口;
若不存在重叠,将所述作业时间窗口确定为可用执行时间窗口。
可选的,上述方法,在生成所述待执行作业的可用执行时间窗口集之后,还包括:
若所述可用执行时间窗口集为空,对所述待执行作业的作业参数进行降维处理,以根据作业参数降维处理后的待执行作业,确定相匹配的可用执行时间窗口集;
其中,所述降维处理后所得的所述待执行作业的参数组合,能用于使所述待执行作业的作业结果满足质量条件。
一种作业调度的预测处理装置,所述装置包括:
获取模块,用于获取提交的待执行作业的作业计划信息;
确定模块,用于至少根据所述作业计划信息,确定预测计划;
预测处理模块,用于根据所述预测计划,对所述待执行作业执行预测处理,得到预测结果;所述预测结果包括:在假定分别执行于未来不同时间段的所述待执行作业的不同假定作业活动下,***的资源指标数值和/或资源状态;
生成模块,用于根据所述预测结果,生成所述待执行作业的可用执行时间窗口集,以基于所述可用执行时间窗口集对所述待执行作业进行调度;其中,所述可用执行时间窗口集中的每一可用执行时间窗口,能用于在所述待执行作业的执行过程中使***资源的资源状态满足状态条件。
一种电子设备,包括:
存储器,用于存放计算机指令集;
处理器,用于通过执行存储器上存放的指令集,实现如上文任一项所述的作业调度的预测处理方法。
由以上方案可知,本申请公开的作业调度的预测处理方法、装置和电子设备,在获得提交的待执行作业的作业计划信息后,至少根据提交的作业计划信息,确定待执行作业的预测计划,并根据预测计划对待执行作业执行预测处理,预测在假定分别执行于未来不同时间段的待执行作业的不同假定作业活动下,***的资源指标数值和/或资源状态,得到预测结果,并根据预测结果,生成待执行作业的可用执行时间窗口集,该集合中的每一可用执行时间窗口,能用于在待执行作业的作业活动过程中使***资源的资源状态满足状态条件,从而,最终可通过该可用执行时间窗口集实现为待执行作业规划合适的作业时间窗口,减少待执行作业执行过程中对其他业务的资源竞争。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1是本申请提供的作业调度的预测处理方法的一种流程示意图;
图2是本申请提供的本申请方法的一处理逻辑图;
图3是本申请提供的为待执行作业确定预测计划的过程图;
图4是本申请提供的生成待执行作业的可用执行时间窗口集的过程图;
图5是本申请提供的作业调度的预测处理方法的另一种流程示意图;
图6是本申请提供的本申请方法的另一处理逻辑图;
图7是本申请提供的作业调度的预测处理装置的结构示意图;
图8是本申请提供的电子设备的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
在云计算环境中,作业活动与其他云计算作业共享基础设施到平台层面的资源,作业活动将可能会造成本已经负载较大的作业运行更慢,甚至导致作业超时或失败,尤其是在集群环境下的很多作业活动一旦启动就很难快速停止,针对作业的该特点,本申请提出***作业的可用执行时间窗口、为作业活动规划更合适的时间窗口的技术思路,并公开基于上述技术思路的一种作业调度的预测处理方法、装置和电子设备,以减少作业对所处环境中其他业务的资源竞争。
本申请公开的作业调度的预测处理方法,可应用于众多通用或专用的计算装置环境或配置下的设备,例如:个人计算机、服务器计算机、手持设备或便携式设备、平板型设备、多处理器装置、包括上述设备或装置的分布式计算服务平台(如云计算平台)等等。
本申请实施例提供的作业调度的预测处理方法的处理流程如图1所示,具体包括:
步骤101、获取提交的待执行作业的作业计划信息。
在云计算平台或容器平台等作业执行环境下,参见图2,工程师或Web API(Application Programming Interface,应用程序接口)或其他程序接口,可根据需求,向部署于该环境的作业执行设备如平台服务器提交待执行作业的作业计划信息。作业执行设备相应获得所提交的待执行作业的作业计划信息。
待执行作业可以是但不限于模型训练作业、图像处理作业、数据存储作业等等,待执行作业的作业计划信息至少包括待执行作业的执行时间计划信息及节点部署计划信息。其中,执行时间计划信息包括针对某作业标识(如作业编号)、作业类型(如模型训练)的待执行作业,所计划的作业启动时间、计划作业时长以及期望的作业结束时间等参数。节点部署计划信息用于指示将待执行作业部署至相应节点时的相关计划信息,具体包括但不限于将待执行作业部署至哪些服务器节点,针对所部署至的服务器节点,具体部署于该节点的哪些虚拟机等。
除了上述信息,待执行作业的作业计划信息,还可以包括并发量、敏感资源/敏感指标范围、进行节点内部作业可能产生的负载压力评估(如CPU占用量、存储IO压力)等中的任意一种或多种信息。其中,待执行作业的并发量指预先设置的待执行作业在各宿主机如服务器节点上的并发量,待执行作业的敏感资源/敏感指标,是指受待执行作业的作业活动影响较大的资源或指标,换个角度说,也可以理解为容易使待执行作业与平台上其他作业产生竞争导致平台性能下降的资源或指标,如计算资源、存储资源、网络资源、存储延迟、网络吞吐、CPU负载等等。
步骤102、至少根据待执行作业的作业计划信息,确定预测计划。
在获得提交的待执行作业的作业计划信息之后,至少根据待执行作业的作业计划信息,确定预测计划。
本实施例中,除了作业计划信息,还获取待执行作业对应的历史作业的作业数据,及对待执行作业的历史作业执行过程中的***资源指标和/或资源状态进行监控所得的监控数据,来作为当前的待执行作业的参考,例如,关于存储作业,在不同Block Size(块尺寸)下执行不同作业,部分作业参数是可以借鉴或直接复用。在此基础上,根据待执行作业的作业计划信息和待执行作业对应的历史作业的作业数据及监控数据,为待执行作业确定预测计划。
其中,待执行作业对应的历史作业,是指历史上所执行的与待执行作业相同或类似的作业(如,历史上已完成,或作业还未完成但作业升级过,将升级前的作业活动作为历史所执行的作业),以待执行作业为某神经网络模型训练作业为例,其对应的历史作业是指历史上所执行的该神经网络模型训练作业。
待执行作业对应的历史作业的作业数据,包括但不限于待执行作业对应的历史作业的执行时间信息(启动时间、运行时长、结束时间)、并发量、节点部署信息、所部署节点/虚拟机上运行有哪些其他作业等,以获知什么时候在哪儿执行这些与待执行作业相同或类似的历史作业、执行过程中还有哪些其他作业在执行;待执行作业对应的历史作业的监控数据,包括但不限于基于监控数据库或作业历史记录,获得的执行环境中***资源指标和/或资源状态的监控值,如CPU、memory、网络资源状态等。如果待执行作业在历史上未执行过,则可根据经验标注出上述信息以作为为待执行作业制定预测计划时的参考。
参见图3,根据待执行作业的作业计划信息及其对应的历史作业的作业数据和监控数据,为待执行作业确定预测计划的过程,可进一步实现为:
步骤301、根据待执行作业的节点部署计划信息,确定待执行作业的各个部署位置及各个部署位置与所依赖资源间的第一资源依赖关系。
待执行作业的各个部署位置包括但不限于:作业计划信息中的节点部署计划信息所指示的需将待执行作业部署至的各个服务器节点(宿主机)、及在相应服务器节点下需部署至的相应虚拟机。
相应的,本步骤中,具体根据待执行作业的节点部署计划信息,确定需将待执行作业部署至的服务器节点(宿主机)及在相应服务器节点下需布置至的相应虚拟机,并将确定出的信息作为待执行作业的各个部署位置。
之后,进一步基于云计算平台或容器平台等作业执行环境中,不同节点、节点上不同虚拟机与所分配资源间的对应关系,确定待执行作业的各个部署位置与所依赖资源间的资源依赖关系,得到第一资源依赖关系。
实施中,具体可根据待执行作业的节点部署计划信息通过云平台数据库或API获得相关云平台信息,包括但不限于待执行作业有多少个宿主机(服务器节点)、宿主机上运行了哪些虚拟机、宿主机尺寸/虚拟机尺寸、不同的虚拟机以什么方式连接到哪些资源上,并结合这些信息,确定待执行作业的各个部署位置与所依赖资源间的资源依赖关系,如用来部署待执行作业的各个服务器节点、虚拟机与资源间的依赖关系,其中,对于同一类型的资源,不同的服务器节点/虚拟机可能依赖该同一类型资源的同一资源或不同资源,如不同服务器节点/虚拟机依赖同一存储资源或不同存储资源等。
步骤302、根据上述各个部署位置与所依赖资源间的第一资源依赖关系,至少确定部署于各个位置的待执行作业与所依赖资源间的第二资源依赖关系。
在得到各个部署位置与所依赖资源间的第一资源依赖关系后,根据各个部署位置与所依赖资源间的该第一资源依赖关系,并结合待执行作业的运行需依赖的资源类型如存储资源、计算资源、网络资源等,推导部署于各个位置的待执行作业与所依赖资源间的第二资源依赖关系。
步骤303、根据上述第一资源依赖关系、第二资源依赖关系和待执行作业的历史作业的作业数据及监控数据,为待执行作业确定预测计划。
之后,以上述的第一资源依赖关系、第二资源依赖关系和待执行作业的历史作业的作业数据及监控数据作为数据基础,结合这些信息中体现的资源、关键指标、测试规则、测试时长、计划完成时间等规划云平台负载预测,进而为待执行作业制定、生成相应的预测计划。
本实施例中,优选的,为待执行作业生成的预测计划,包括对待执行作业执行预测处理时的中期预测计划和短期预测计划。
其中,中期预测计划和短期预测计划中的每一预测计划包括:所对应的预测时间范围,按预定步长对所对应预测时间范围进行划分所得的多个时间分片,每一时间分片对应的预测算法及预测算法所需的参数。
中期预测计划对应的预测时间范围包含且大于相应短期预测计划对应的预测时间范围。且本申请实施例中,中期预测计划和短期预测计划是相对的,对于待执行作业的一个特定的预测计划A,若其预测时间范围小于该待执行作业的预测计划B的预测时间范围,那么,A为短期预测计划,B为中期预测计划;若A对应的预测时间范围大于该待执行作业的预测计划C的预测时间范围,则A为中期预测计划,C为短期预测计划;因此,本实施例,中期、短期预测计划涵盖的是一系列(如20个)分别对应于不同时间范围和时间分片长度的预测计划,而不表示特定的两个预测计划。
具体的,比如,假设在作业的预测计划中,作业的总执行时长为2小时,针对该作业,分别制定对应于时间范围为作业的前20分钟、前40分钟、前1个小时、前1个小时20分钟、前1个小时40分钟、2个小时的预测计划,则从第二个预测计划起各个预测计划的时间范围分别包含前面预测计划的时间范围,且上述各预测计划中,某一预测计划,相对于在前的预测计划为中期预测计划,相对于在后的预测计划为短期预测计划。
另外,对于每一中期预测计划或短期预测计划,本实施例以一定步长(时间长度)将其划分为若干片段,每一片段视为该预测计划的一个时间分片,每一片段将在后续用于预测数据的比较和分析,以得到相应的预测结果。
不同的短期/中期预测计划,在进行片段划分时所依据的步长可以相同或不同,在此不做限制。
针对所划分的不同时间分片、不同的预测时间范围,将成批生成若干短期/中期预测计划,每一预测计划包含其所对应的预测时间范围、将预测时间范围分割得到的一系列时间分片、在对应的预测时间范围分配的需使用的预测算法(函数)及预测算法所必需的一些参数等,比如,假设作业在做深度学习活动,那么模型特征、迭代的次数、使用的目标优化函数,使用的是什么样的网络结构等作业参数,可作为预测算法所需的参数。
待执行作业的预测计划包含的对应于同一次作业活动的中期、短期预测计划所涵盖的总体预测时间范围,与待执行作业的时间计划信息指示的待执行作业的总执行时间范围相关,例如围绕该计划的总执行时间范围(如未来某天下午13:00-15:00的两小时),结合***资源、关键指标、测试规模、测试时长,为待执行作业确定出未来的与该计划的总执行时间范围相关的多个时间段(包含该计划的总执行时间范围,或仅包含其一部分并适当在其之前或之后进行时间延展等),并对每个时间段进行相应的中/短期时间范围及片段划分。
本实施例中,通过将待执行作业假定执行于上述多个时间段中的每个时间段,来实现对待执行作业的预测处理,其中,待执行作业在每个时间段的假定执行过程可视为待执行作业的同一次假定作业活动。
步骤103、根据确定的预测计划,对待执行作业执行预测处理,得到预测结果;该预测结果包括:在假定分别执行于未来不同时间段的待执行作业的不同假定作业活动下,***的资源指标数值和/或资源状态。
在为待执行作业确定出预测计划的基础上,继续根据不同预测计划,执行相关短期预测和中期预测,结合参见图2,该过程可进一步实现为:
1)根据短期预测计划中的预测算法和参数,预测待执行作业执行于短期预测计划对应的各个时间分片时***的资源指标数值和/或资源状态,得到第一预测结果;
2)根据中期预测计划中的预测算法和参数,预测待执行作业执行于中期预测计划对应的各个时间分片时***的资源指标数值和/或资源状态,得到第二预测结果。
也就是说,具体在假定于未来某时间段执行待执行作业的情况下,利用该时间段包含的短期/中期预测计划分别对应的预测算法及算法所需参数,预测待执行作业的作业活动在该短期/中期预测计划的时间范围内各时间分片(如时间分片对应的时间点)上,***资源如CPU、内存、网络、存储等资源的资源状态(如过载、非过载)和/或具体的资源指标值(如,CPU占用量、存储的IO吞吐等)。
各个不同的短期预测、中期预测处理可以串行执行,也可以并行执行,由于需执行的预测、推断过程较多,优选的,采用并行方式执行各个短期/中期预测处理。
步骤104、根据上述预测结果,生成待执行作业的可用执行时间窗口集,以基于可用执行时间窗口集对待执行作业进行调度;其中,可用执行时间窗口集中的每一可用执行时间窗口,能用于在所述待执行作业的执行过程中使***资源的资源状态满足状态条件。
该状态条件,可以是指能用于表征云计算平台或容器平台的资源性能无异常的条件,如,CPU的占用率低于设定的占用率阈值,IO吞吐低于设定的吞吐量等等。
参见图4,该步骤中,根据上述预测结果,生成待执行作业的可用执行时间窗口集的过程,可实现为:
步骤401、根据上述第一预测结果和第二预测结果,确定每一时间分片对应的时间点是否为可用执行时间点。
其中,可用执行时间点为能用于在执行上述待执行作业时,使云计算云平台或容器平台等执行环境中***资源的资源状态满足以上状态条件的时间点。
该步骤中,具体可对上述第一预测结果和第二预测结果进行汇聚处理,得到每一时间分片对应的时间点的资源指标数值和/或资源状态预测结果的结果集;并根据对应的结果集,基于预定策略确定每一时间分片对应的时间点是否为可用执行时间点。
本实施例中,优选的,预定策略具体为基于投票机制的决策策略,在该策略中,若对于某一时间点,所有包含该时间点的中期/短期预测计划的预测结果均表示当假定待执行作业执行于该时间点时,***资源的资源状态满足状态条件(即,全票通过),则判定该时间点为可用执行时间点,否则,则判定该时间点为非可用执行时间点。
步骤402、将待处理作业的同一假定作业活动的各个时间点合并处理成作业时间窗口。
步骤403、确定每一作业时间窗口内的各个时间点是否均为可用执行时间点;若是,进入步骤404,若否,进入步骤405。
步骤404、将该作业时间窗口确定为可用执行时间窗口。
步骤405、将该作业时间窗口确定为非可用执行时间窗口,或基于对该作业时间窗口的可用与否的确认处理,确定该作业时间窗口是否为可用执行时间窗口。
其中,如果某作业时间窗口内的各个时间点并非均为可用执行时间点,则可基于策略,直接将该作业时间窗口确定为非可用执行时间窗口。或者,可选的,还可以提供给工程师进行确认,由工程师决策保留或者丢弃,即由工程师决策该作业时间窗口是否为可用执行时间窗口。
最终,确定出的各个可用执行时间窗口构成上述的可用执行时间窗口集。
由以上方案可知,本实施例的方法,在获得提交的待执行作业的作业计划信息后,至少根据提交的作业计划信息,确定待执行作业的预测计划,并根据预测计划对待执行作业执行预测处理,预测在假定分别执行于未来不同时间段的待执行作业的不同假定作业活动下,***的资源指标数值和/或资源状态,得到预测结果,并根据预测结果,生成待执行作业的可用执行时间窗口集,该集合中的每一可用执行时间窗口,能用于在待执行作业的作业活动过程中使***资源的资源状态满足状态条件,从而,最终可通过该可用执行时间窗口集实现为待执行作业规划合适的作业时间窗口,减少待执行作业执行过程中对其他业务的资源竞争。
在一实施例中,本申请公开的作业调度的预测处理方法,在确定某作业时间窗口是否为可用执行时间窗口时,还包括以下处理:
对于包含的各个时间点均为可用执行时间点的作业时间窗口,确定该作业时间窗口是否与输入的未能用于执行作业的时间区间存在重叠;若存在重叠,将该作业时间窗口确定为非可用执行时间窗口;若不存在重叠,将该作业时间窗口确定为可用执行时间窗口。
具体的,结合参见图2,云计算平台或容器平台环境下,可能会基于***运维需求要求服务器节点在特定的时间段下线,或服务器节点上在某时间段有重要作业需要执行,要求不能有其他作业执行等等,基于该情况,可由工程师标注不能用于执行上述待执行作业的时间区间,或者由平台***基于预置的运维信息或作业属性,提交不能用于执行上述待执行作业的时间区间。
此种情况下,对于包含的各个时间点均为可用执行时间点的作业时间窗口,进一步结合提交的不能用于执行上述待执行作业的时间区间,来最终确定该作业时间窗口是否为可用执行时间窗口,具体的,如果该作业时间窗口与提交的不能用于执行待执行作业的时间区间存在重叠,则判定该作业时间窗口为非可用执行时间窗口,如果不存在重叠,则判定该作业时间窗口为可用执行时间窗口。
本实施例进一步结合***运维和重要作业计划进行可用执行时间窗口的判定,可使得最终所得的可用执行时间窗口集具有更高的准确度。
在一实施例中,参见图5提供的作业调度的预测处理方法的流程示意图,本申请公开的作业调度的预测处理方法,在生成待执行作业的可用执行时间窗口集之后,还可以包括:
步骤105、若可用执行时间窗口集为空,对待执行作业的作业参数进行降维处理,以根据作业参数降维处理后的待执行作业,确定相匹配的可用执行时间窗口集。
其中,降维处理后所得的待执行作业的参数组合,能用于使待执行作业的作业结果满足质量条件。
若待执行作业的可用执行时间窗口集为空,则表明经预测,未来没有合适的时间窗口来执行该待执行作业,针对该情况,本实施例对待执行作业的作业参数进行降维处理,通过该处理,使得支持为待执行作业匹配到合适的可执行时间窗口。
对待执行作业的作业参数进行降维处理,包括但不限于精简/裁剪待执行作业所涉及的作业参数,和/或降低待执行作业所涉及的作业参数的取值。以基于深度学习的模型训练作业为例,对该作业的作业参数进行降维处理,可以是指减少作业的并发量、精简深度学习网络的网络结构、裁剪模型特征使其数量减少,和/或降低训练过程的迭代次数等等。
具体的,结合参见图6,可根据待执行作业对应的预测结果,识别主要受限资源(关键竞争资源)或指标,例如,若待执行作业因CPU过载,或IO吞吐过高、内存不足、网络资源不足等原因,导致云计算平台或容器平台等的平台性能下降,相应导致未得到合适的可执行时间窗口,则将主要受限资源或指标识别为CPU、或IO吞吐、或内存、或网络资源等。之后,在主要受限资源或指标允许的参数阈值区间内,配置待执行作业各作业参数的不同参数组合或各参数的不同取值组合,获得调整参数之后的各作业参数的笛卡尔积,同时基于调整参数之后的各作业参数的笛卡尔积,评估待执行作业基于调整参数之后的各作业参数的作业执行结果是否能满足质量条件,例如,模型特征裁剪后模型训练结果是否仍能够满足所设定的模型精度要求等,以此得到满足主要受限资源允许的参数阈值区间,且满足待执行作业的作业结果所要求的质量条件的降维处理结果。
之后,将降维处理后的待执行作业的各参数,带入自动生成的更新的作业预测计划执行预测,以得到合适的可执行时间窗口。
本实施例针对待执行作业在未来没有合适的作业时间窗口的情况,通过对待执行作业的作业参数进行相应的降维处理,实现了在保证作业质量的情况下,为待执行作业规划合适的作业时间窗口。
对应于上述的作业调度的预测处理方法,本申请实施例还公开一种作业调度的预测处理装置,该装置的组成结构如图7所示,具体包括:
获取模块701,用于获取提交的待执行作业的作业计划信息;
确定模块702,用于至少根据所述作业计划信息,确定预测计划;
预测处理模块703,用于根据所述预测计划,对所述待执行作业执行预测处理,得到预测结果;所述预测结果包括:在假定分别执行于未来不同时间段的所述待执行作业的不同假定作业活动下,***的资源指标数值和/或资源状态;
生成模块704,用于根据所述预测结果,生成所述待执行作业的可用执行时间窗口集,以基于所述可用执行时间窗口集对所述待执行作业进行调度;其中,所述可用执行时间窗口集中的每一可用执行时间窗口,能用于在所述待执行作业的执行过程中使***资源的资源状态满足状态条件。
在一实施方式中,确定模块702,具体用于:
获取待执行作业对应的历史作业的作业数据,及对该历史作业执行过程中的***资源指标和/或资源状态进行监控所得的监控数据;
根据待执行作业的作业计划信息和其历史作业的作业数据及监控数据,确定预测计划。
在一实施方式中,待执行作业的作业计划信息至少包括待执行作业的执行时间计划信息及节点部署计划信息,节点部署计划信息用于指示将待执行作业部署至相应节点时的相关计划信息;
确定模块702在根据待执行作业的作业计划信息和其历史作业的作业数据及监控数据,确定预测计划时,具体用于:
根据上述节点部署计划信息,确定待执行作业的各个部署位置及各个部署位置与所依赖资源间的第一资源依赖关系;
根据各个部署位置与所依赖资源间的第一资源依赖关系,至少确定部署于各个位置的待执行作业与所依赖资源间的第二资源依赖关系;
根据上述的第一资源依赖关系、第二资源依赖关系和上述历史作业的作业数据及监控数据,确定预测计划。
在一实施方式中,待执行作业的预测计划包括:对待执行作业执行预测处理时的中期预测计划和短期预测计划;
其中,中期预测计划和短期预测计划中的每一预测计划包括:所对应的预测时间范围,按预定步长对所对应预测时间范围进行划分所得的多个时间分片,每一时间分片对应的预测算法及预测算法所需的参数;中期预测计划对应的预测时间范围包含且大于相应短期预测计划对应的预测时间范围;
预测处理模块703,具体用于:
根据短期预测计划中的预测算法和参数,预测待执行作业执行于短期预测计划对应的各个时间分片时***的资源指标数值和/或资源状态,得到第一预测结果;
根据中期预测计划中的预测算法和参数,预测待执行作业执行于中期预测计划对应的各个时间分片时***的资源指标数值和/或资源状态,得到第二预测结果。
在一实施方式中,生成模块704,具体用于:
根据上述的第一预测结果和第二预测结果,确定每一时间分片对应的时间点是否为可用执行时间点;可用执行时间点为能用于在执行所述待执行作业时使***资源的资源状态满足状态条件的时间点;
将同一假定作业活动的各个时间点合并处理成作业时间窗口;
确定每一作业时间窗口内的各个时间点是否均为可用执行时间点;
若是,将该作业时间窗口确定为可用执行时间窗口;若否,将该作业时间窗口确定为非可用执行时间窗口,或基于对该作业时间窗口的可用与否的确认处理,确定该作业时间窗口是否为可用执行时间窗口;
其中,确定出的各个可用执行时间窗口构成待执行作业的可用执行时间窗口集。
在一实施方式中,生成模块704在根据上述的第一预测结果和第二预测结果,确定每一时间分片对应的时间点是否为可用执行时间点时,具体用于:
对上述的第一预测结果和第二预测结果进行汇聚处理,得到每一时间分片对应的时间点的资源指标数值和/或资源状态预测结果的结果集;
根据对应的相应结果集,基于预定策略确定每一时间分片对应的时间点是否为可用执行时间点。
在一实施方式中,上述装置还包括:
降维处理模块,用于在为待执行作业确定出的可用执行时间窗口集为空的情况下,对待执行作业的作业参数进行降维处理,以根据作业参数降维处理后的待执行作业,确定相匹配的可用执行时间窗口集;
其中,降维处理后所得的待执行作业的参数组合,能用于使待执行作业的作业结果满足质量条件。
对于本申请实施例公开的作业调度的预测处理装置而言,由于其与上文各方法实施例公开的作业调度的预测处理方法相对应,所以描述的比较简单,相关相似之处请参见上文相应方法实施例的说明即可,此处不再详述。
本申请实施例还公开一种电子设备,该电子设备可以是但不限于云计算环境中的服务器设备,该电子设备的组成结构如图8所示,具体包括:
存储器801,用于存放计算机指令集;
计算机指令集可以通过计算机程序的形式实现。
处理器802,用于通过执行计算机指令集,实现如上文任一方法实施例公开的控制方法。
处理器802可以为中央处理器(Central Processing Unit,CPU),特定应用集成电路(application-specific integrated circuit,ASIC),数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)或者其他可编程逻辑器件等。
除此之外,电子设备还可以包括通信接口、通信总线等组成部分。存储器、处理器和通信接口通过通信总线完成相互间的通信。
通信接口用于电子设备与其他设备之间的通信。通信总线可以是外设部件互连标准(Peripheral Component Interconnect,PCI)总线或扩展工业标准结构(ExtendedIndustry Standard Architecture,EISA)总线等,该通信总线可以分为地址总线、数据总线、控制总线等。
需要说明的是,本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
为了描述的方便,描述以上***或装置时以功能分为各种模块或单元分别描述。当然,在实施本申请时可以把各单元的功能在同一个或多个软件和/或硬件中实现。
通过以上的实施方式的描述可知,本领域的技术人员可以清楚地了解到本申请可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例或者实施例的某些部分所述的方法。
最后,还需要说明的是,在本文中,诸如第一、第二、第三和第四等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上所述仅是本申请的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本申请的保护范围。
Claims (10)
1.一种作业调度的预测处理方法,所述方法包括:
获取提交的待执行作业的作业计划信息;
至少根据所述作业计划信息,确定预测计划;
根据所述预测计划,对所述待执行作业执行预测处理,得到预测结果;所述预测结果包括:在假定分别执行于未来不同时间段的所述待执行作业的不同假定作业活动下,***的资源指标数值和/或资源状态;
根据所述预测结果,生成所述待执行作业的可用执行时间窗口集,以基于所述可用执行时间窗口集对所述待执行作业进行调度;其中,所述可用执行时间窗口集中的每一可用执行时间窗口,能用于在所述待执行作业的执行过程中使***资源的资源状态满足状态条件。
2.根据权利要求1所述的方法,所述至少根据所述作业计划信息,确定预测计划,包括:
获取所述待执行作业对应的历史作业的作业数据,及对所述历史作业执行过程中的***资源指标和/或资源状态进行监控所得的监控数据;
根据所述作业计划信息和所述历史作业的作业数据及监控数据,确定预测计划。
3.根据权利要求2所述的方法,其中,所述作业计划信息至少包括所述待执行作业的执行时间计划信息及节点部署计划信息,所述节点部署计划信息用于指示将所述待执行作业部署至相应节点时的相关计划信息;
所述根据所述作业计划信息和所述历史作业的作业数据及监控数据,确定预测计划,包括:
根据所述节点部署计划信息,确定所述待执行作业的各个部署位置及各个部署位置与所依赖资源间的第一资源依赖关系;
根据所述各个部署位置与所依赖资源间的第一资源依赖关系,至少确定部署于各个位置的待执行作业与所依赖资源间的第二资源依赖关系;
根据所述第一资源依赖关系、所述第二资源依赖关系和所述历史作业的作业数据及监控数据,确定预测计划。
4.根据权利要求3所述的方法,所述预测计划包括:对所述待执行作业执行预测处理时的中期预测计划和短期预测计划;
其中,所述中期预测计划和所述短期预测计划中的每一预测计划包括:所对应的预测时间范围,按预定步长对所对应预测时间范围进行划分所得的多个时间分片,每一时间分片对应的预测算法及预测算法所需的参数;中期预测计划对应的预测时间范围包含且大于相应短期预测计划对应的预测时间范围;
所述根据所述预测计划,对所述待执行作业执行预测处理,得到预测结果,包括:
根据所述短期预测计划中的预测算法和参数,预测所述待执行作业执行于所述短期预测计划对应的各个时间分片时***的资源指标数值和/或资源状态,得到第一预测结果;
根据所述中期预测计划中的预测算法和参数,预测所述待执行作业执行于所述中期预测计划对应的各个时间分片时***的资源指标数值和/或资源状态,得到第二预测结果。
5.根据权利要求4所述的方法,所述根据所述预测结果,生成所述待执行作业的可用执行时间窗口集,包括:
根据所述第一预测结果和所述第二预测结果,确定每一时间分片对应的时间点是否为可用执行时间点;所述可用执行时间点为能用于在执行所述待执行作业时使***资源的资源状态满足状态条件的时间点;
将同一假定作业活动的各个时间点合并处理成作业时间窗口;
确定每一作业时间窗口内的各个时间点是否均为可用执行时间点;
若是,将所述作业时间窗口确定为可用执行时间窗口;若否,将所述作业时间窗口确定为非可用执行时间窗口,或基于对所述作业时间窗口的可用与否的确认处理,确定所述作业时间窗口是否为可用执行时间窗口;
其中,确定出的各个可用执行时间窗口构成所述可用执行时间窗口集。
6.根据权利要求5所述的方法,所述根据所述第一预测结果和所述第二预测结果,确定每一时间分片对应的时间点是否为可用执行时间点,包括:
对所述第一预测结果和所述第二预测结果进行汇聚处理,得到每一时间分片对应的时间点的资源指标数值和/或资源状态预测结果的结果集;
根据对应的所述结果集,基于预定策略确定每一时间分片对应的时间点是否为可用执行时间点。
7.根据权利要求5所述的方法,还包括:
对于包含的各个时间点均为可用执行时间点的作业时间窗口,确定所述作业时间窗口是否与输入的未能用于执行作业的时间区间存在重叠;
若存在重叠,将所述作业时间窗口确定为非可用执行时间窗口;
若不存在重叠,将所述作业时间窗口确定为可用执行时间窗口。
8.根据权利要求1所述的方法,在生成所述待执行作业的可用执行时间窗口集之后,还包括:
若所述可用执行时间窗口集为空,对所述待执行作业的作业参数进行降维处理,以根据作业参数降维处理后的待执行作业,确定相匹配的可用执行时间窗口集;
其中,所述降维处理后所得的所述待执行作业的参数组合,能用于使所述待执行作业的作业结果满足质量条件。
9.一种作业调度的预测处理装置,所述装置包括:
获取模块,用于获取提交的待执行作业的作业计划信息;
确定模块,用于至少根据所述作业计划信息,确定预测计划;
预测处理模块,用于根据所述预测计划,对所述待执行作业执行预测处理,得到预测结果;所述预测结果包括:在假定分别执行于未来不同时间段的所述待执行作业的不同假定作业活动下,***的资源指标数值和/或资源状态;
生成模块,用于根据所述预测结果,生成所述待执行作业的可用执行时间窗口集,以基于所述可用执行时间窗口集对所述待执行作业进行调度;其中,所述可用执行时间窗口集中的每一可用执行时间窗口,能用于在所述待执行作业的执行过程中使***资源的资源状态满足状态条件。
10.一种电子设备,包括:
存储器,用于存放计算机指令集;
处理器,用于通过执行存储器上存放的指令集,实现如权利要求1-8任一项所述的作业调度的预测处理方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111123438.5A CN113850428A (zh) | 2021-09-24 | 2021-09-24 | 作业调度的预测处理方法、装置和电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111123438.5A CN113850428A (zh) | 2021-09-24 | 2021-09-24 | 作业调度的预测处理方法、装置和电子设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113850428A true CN113850428A (zh) | 2021-12-28 |
Family
ID=78979367
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111123438.5A Pending CN113850428A (zh) | 2021-09-24 | 2021-09-24 | 作业调度的预测处理方法、装置和电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113850428A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023185825A1 (zh) * | 2022-03-30 | 2023-10-05 | 阿里巴巴(中国)有限公司 | 调度方法、第一计算节点、第二计算节点以及调度*** |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103810037A (zh) * | 2014-01-10 | 2014-05-21 | 清华大学 | 一种作业调度方法和计算装置 |
WO2015090022A1 (zh) * | 2013-12-18 | 2015-06-25 | 中兴通讯股份有限公司 | 一种资源调度的方法、装置和计算机存储介质 |
CN105487930A (zh) * | 2015-12-01 | 2016-04-13 | 中国电子科技集团公司第二十八研究所 | 一种基于Hadoop的任务优化调度方法 |
CN110297701A (zh) * | 2019-05-16 | 2019-10-01 | 平安科技(深圳)有限公司 | 数据处理作业调度方法、装置、计算机设备及存储介质 |
CN111488984A (zh) * | 2020-04-03 | 2020-08-04 | 中国科学院计算技术研究所 | 一种用于训练轨迹预测模型的方法和轨迹预测方法 |
CN111813524A (zh) * | 2020-07-09 | 2020-10-23 | 北京奇艺世纪科技有限公司 | 一种任务执行方法、装置、电子设备和存储介质 |
-
2021
- 2021-09-24 CN CN202111123438.5A patent/CN113850428A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2015090022A1 (zh) * | 2013-12-18 | 2015-06-25 | 中兴通讯股份有限公司 | 一种资源调度的方法、装置和计算机存储介质 |
CN103810037A (zh) * | 2014-01-10 | 2014-05-21 | 清华大学 | 一种作业调度方法和计算装置 |
CN105487930A (zh) * | 2015-12-01 | 2016-04-13 | 中国电子科技集团公司第二十八研究所 | 一种基于Hadoop的任务优化调度方法 |
CN110297701A (zh) * | 2019-05-16 | 2019-10-01 | 平安科技(深圳)有限公司 | 数据处理作业调度方法、装置、计算机设备及存储介质 |
CN111488984A (zh) * | 2020-04-03 | 2020-08-04 | 中国科学院计算技术研究所 | 一种用于训练轨迹预测模型的方法和轨迹预测方法 |
CN111813524A (zh) * | 2020-07-09 | 2020-10-23 | 北京奇艺世纪科技有限公司 | 一种任务执行方法、装置、电子设备和存储介质 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023185825A1 (zh) * | 2022-03-30 | 2023-10-05 | 阿里巴巴(中国)有限公司 | 调度方法、第一计算节点、第二计算节点以及调度*** |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11132288B2 (en) | Data-driven scheduling of automated software program test suites | |
US11531909B2 (en) | Computer system and method for machine learning or inference | |
US11119878B2 (en) | System to manage economics and operational dynamics of IT systems and infrastructure in a multi-vendor service environment | |
US11023325B2 (en) | Resolving and preventing computer system failures caused by changes to the installed software | |
US7797141B2 (en) | Predictive analysis of availability of systems and/or system components | |
US7864679B2 (en) | System utilization rate managing apparatus and system utilization rate managing method to be employed for it, and its program | |
EP3932025B1 (en) | Computing resource scheduling method, scheduler, internet of things system, and computer readable medium | |
CN109586954B (zh) | 一种网络流量预测方法、装置及电子设备 | |
CN111381970B (zh) | 集群任务的资源分配方法及装置、计算机装置及存储介质 | |
CN110782706B (zh) | 智能车辆驾驶风险的预警方法和装置 | |
CN115269108A (zh) | 一种数据处理方法、装置及设备 | |
CN109992408B (zh) | 一种资源分配方法、装置、电子设备和存储介质 | |
CN113850428A (zh) | 作业调度的预测处理方法、装置和电子设备 | |
CN110389817B (zh) | 多云***的调度方法、装置和计算机可读介质 | |
CN116962532A (zh) | 集群任务调度方法、装置、计算机设备及存储介质 | |
CN110008098B (zh) | 评估业务流程中的节点的运行状况的方法和装置 | |
CN113342561A (zh) | 任务诊断方法及*** | |
CN113485933A (zh) | 自动化测试方法和分布式*** | |
US20160224378A1 (en) | Method to control deployment of a program across a cluster of machines | |
CN112685390A (zh) | 数据库实例管理方法及装置、计算设备 | |
US11855849B1 (en) | Artificial intelligence based self-organizing event-action management system for large-scale networks | |
CN115022173B (zh) | 一种服务扩容的方法、装置、设备及存储介质 | |
CN112241754B (zh) | 在线模型学习方法、***、设备及计算机可读存储介质 | |
US20240193538A1 (en) | Temporal supply-related forecasting using artificial intelligence techniques | |
EP4184328A1 (en) | Medical imaging device fault handling |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |