CN111400022A - 一种资源调度方法、装置及电子设备 - Google Patents

一种资源调度方法、装置及电子设备 Download PDF

Info

Publication number
CN111400022A
CN111400022A CN201910000981.2A CN201910000981A CN111400022A CN 111400022 A CN111400022 A CN 111400022A CN 201910000981 A CN201910000981 A CN 201910000981A CN 111400022 A CN111400022 A CN 111400022A
Authority
CN
China
Prior art keywords
task
tasks
priority
queue
scheduling
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910000981.2A
Other languages
English (en)
Inventor
丛鹏宇
王斌
赵琪琪
王平辉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Mobile Communications Group Co Ltd
China Mobile Communications Ltd Research Institute
Original Assignee
China Mobile Communications Group Co Ltd
China Mobile Communications Ltd Research Institute
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Mobile Communications Group Co Ltd, China Mobile Communications Ltd Research Institute filed Critical China Mobile Communications Group Co Ltd
Priority to CN201910000981.2A priority Critical patent/CN111400022A/zh
Publication of CN111400022A publication Critical patent/CN111400022A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5005Allocation of resources, e.g. of the central processing unit [CPU] to service a request
    • G06F9/5027Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5061Partitioning or combining of resources
    • G06F9/5066Algorithms for mapping a plurality of inter-dependent sub-tasks onto a plurality of physical CPUs

Landscapes

  • Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供一种资源调度方法、装置及电子设备,其中,所述资源调度方法包括:获取用户输入的任务;确定所述任务的优先级;将所述任务分配至与所述任务的优先级对应的任务队列中;按照所有任务队列的优先级高低,依次为每个任务队列中的任务调度GPU资源。本发明的实施例,可以根据任务的优先级动态地为任务调度GPU资源,满足任务执行需求,提高GPU资源的利用率。

Description

一种资源调度方法、装置及电子设备
技术领域
本发明涉及通信技术领域,尤其涉及一种资源调度方法、装置及电子设备。
背景技术
随着大规模标记数据的积累、神经网络算法的成熟以及高性能通用GPU(GraphicsProcessing Unit,图形处理器)的推广,深度学***台上,深度学习模型的训练过程往往需要大量的计算资源,深度学习模型的数据量和参数规模巨大,需要使用GPU进行相关研究。
目前,在深度学习过程中,常用的GPU资源调度方法为Kubernetes调度。该Kubernetes调度提供了容器编排功能,其中调度模块的作用主要是根据特定的调度算法将任务调度到指定的GPU资源上。具体的,Kubernetes调度的基础是FIFO(First In FirstOut,先进先出)调度过程,即任务输入时间越早越优先被调度执行。对于一个深度学习任务,如果当前***的GPU资源满足任务的需求,则为该任务分配资源,而如果当前***的GPU资源不满足任务的需求,则挂起该任务,直到有足够的GPU资源满足任务的需求。
然而,实际执行多个任务过程中,因用户角色不同,相应任务被执行的优先级,即为相应任务调度GPU资源的优先级往往不同,如果采用现有的Kubernetes调度方法为任务调度GPU资源,将不能满足任务执行需求,造成GPU资源利用率低。
发明内容
本发明实施例提供一种资源调度方法、装置及电子设备,以解决现有的为任务调度GPU资源的方法造成的GPU资源利用率低的问题。
第一方面,本发明实施例提供了一种资源调度方法,包括:
获取用户输入的任务;
确定所述任务的优先级;
将所述任务分配至与所述任务的优先级对应的任务队列中;
按照所有任务队列的优先级高低,依次为每个任务队列中的任务调度GPU资源。
第二方面,本发明实施例提供了一种资源调度装置,包括:
获取模块,用于获取用户输入的任务;
确定模块,用于确定所述任务的优先级;
分配模块,用于将所述任务分配至与所述任务的优先级对应的任务队列中;
调度模块,用于按照所有任务队列的优先级高低,依次为每个任务队列中的任务调度GPU资源。
第三方面,本发明实施例提供了一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其中,所述计算机程序被所述处理器执行时实现上述资源调度方法的步骤。
第四方面,本发明实施例提供了一种计算机可读存储介质,其上存储有计算机程序,其中,所述计算机程序被处理器执行时可实现上述资源调度方法的步骤。
本发明实施例的资源调度方法,通过将用户输入的任务分配至与其优先级对应的任务队列中,按照所有任务队列的优先级高低,依次为每个任务队列中的任务调度GPU资源,可以将不同优先级的任务分配至对应的任务队列中,从而根据任务的优先级动态地为任务调度GPU资源,满足任务执行需求,提高GPU资源的利用率。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例的资源调度方法的流程图;
图2为本发明具体实例中的基于多级反馈队列进行任务调度的***结构示意图;
图3为本发明具体实例中的GPU资源使用情况的示意图之一;
图4为本发明具体实例中的任务队列的示意图之一;
图5为本发明具体实例中的GPU资源使用情况的示意图之二;
图6为本发明具体实例中的任务队列的示意图之二;
图7为本发明具体实例中的GPU资源使用情况的示意图之三;
图8为本发明具体实例中的任务队列的示意图之三;
图9为本发明具体实例中的GPU资源使用情况的示意图之四;
图10为本发明具体实例中的任务队列的示意图之四;
图11为本发明具体实例中的GPU资源使用情况的示意图之五;
图12为本发明具体实例中的任务队列的示意图之五;
图13为本发明具体实例中的GPU资源使用情况的示意图之六;
图14为本发明实施例的资源调度装置的结构示意图;
图15为本发明实施例的电子设备的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
首先说明的是,本发明实施例的资源调度方法可适用于深度学习场景,实现为深度学习任务调度其所需的GPU资源。本发明实施例可使用多级反馈队列多个不同优先级的队列结构,为不同用户的任务设置不同的优先级,并分配到相应的任务队列中进行调度。
参见图1所示,本发明实施例提供了一种资源调度方法,所述方法包括如下步骤:
步骤101:获取用户输入的任务。
其中,上述任务可以为深度学习任务。具体实现时,用户输入的深度学习任务都是独立和随机的。
步骤102:确定任务的优先级。
本发明实施例中,步骤102中确定的任务的优先级可以为任务的初始优先级,而任务的初始优先级可以为最低优先级,也可以为根据利用历史信息训练得到的任务分派模型确定。
可选的,步骤102可包括:将任务的资源需求量和用户的历史资源使用信息输入到根据历史信息训练得到的任务分派模型中,得到任务的优先级。
具体实现时,上述任务的资源需求量可包括如下至少一项:GPU卡数需求量、GPU卡型(高配或低配)、内存需求量和硬盘需求量等。上述用户的历史资源使用信息可包括如下至少一项:GPU平均利用率、总任务数、任务提交频率、任务总运行时长、任务平均时长、正在运行任务数、当前历史排队平均时长和上次任务初始优先级等。若定义任务的资源需求量和用户的历史资源使用信息分别为R和H,则构建的任务分派模型可表示为:
PRIij=F(Rij,Hij)
其中,i和j表示用户i的第j个任务,Rij和Hij会随着用户提交的任务不同发生相应的变化。对于新用户,H的取值为0。任务分派模型以最大化资源利用率为目标,是根据历史信息训练得到的。在利用任务分派模型计算出任务的优先级后,可根据实际使用的优先级队列数量,量化为不同的数值,并将任务调度到对应的队列中。
步骤103:将任务分配至与任务的优先级对应的任务队列中。
步骤104:按照所有任务队列的优先级高低,依次为每个任务队列中的任务调度GPU资源。
其中,在为任务调度GPU资源时,可按照所有任务队列的优先级高低依次调度,即当比某一个任务队列优先级更高的任务队列为空时,才会为该任务队列中的任务调度GPU资源。任何情况下,调度GPU资源时都需要先保证高优先级任务队列中的任务的执行。
本发明实施例的资源调度方法,通过将用户输入的任务分配至与其优先级对应的任务队列中,按照所有任务队列的优先级高低,依次为每个任务队列中的任务调度GPU资源,可以将不同优先级的任务分配至对应的任务队列中,从而根据任务的优先级动态地为任务调度GPU资源,满足任务执行需求,提高GPU资源的利用率。
本发明实施例中,为了保证任务不会因队列调度方式产生饥饿问题,可当低优先级任务队列中的任务满足预设条件时,将该任务动态调整至高优先级任务队列,以增强被调度的可能性。该预设条件比如可为在低优先级任务队列中的等待时间超过预设时间阈值,该预设时间阈值可根据实际情况预先设置。
可选的,步骤103之后,所述方法还包括:
当任务在第一任务队列中的等待时间超过预设时间阈值,且第一任务队列的优先级不是所有任务队列中的最高优先级时,将任务更新至第二任务队列;
其中,所述第二任务队列的优先级比所述第一任务队列的优先级高。
可以理解的,该第一任务队列可以为初始为任务分配的任务队列,也可以为经过动态调整后任务所在的任务队列。该第二任务队列的优先级可以比第一任务队列的优先级高一级。
这样,通过动态调整任务优先级,可以避免任务产生饥饿问题,从而减少任务等待时间。
本发明实施例中,为了提高GPU资源的利用率,可基于GPU最小需求的任务贪心调度策略,为任务调度GPU资源,即每次都从等待队列中选择GPU需求最小的任务运行。
可选的,上述依次为每个任务队列中的任务调度GPU资源可包括:
依次针对每个任务队列执行如下操作:
按照每个任务队列中的任务的GPU资源需求的从小到大,依次为每个任务队列中的任务调度GPU资源。
这样,采用GPU最小需求的任务贪心调度策略,可以提高GPU资源的利用率,减少任务的等待时间。
下面将结合图2和图3对本发明具体实例中的资源调度过程进行说明。
参见图2所示,图2为本发明具体实例中的基于多级反馈队列进行任务调度的***结构示意图。图2中所示出的任务调度过程(即为任务调度GPU资源的过程)可如下所示:
S1:资源调度***接收用户比如用户A、B和C,分别提交的任务;
S2:资源调度***将用户A提交的任务1的资源需求量和用户A的历史资源使用信息输入到任务分派模型中,得到任务1的优先级1;将用户B提交的任务2的资源需求量和用户B的历史资源使用信息输入到任务分派模型中,得到任务2的优先级2;将用户C提交的任务3的资源需求量和用户C的历史资源使用信息输入到任务分派模型中,得到任务3的优先级3;
S3:若优先级1>优先级3>优先级2,且本发明具体实例中的反馈队列为三级反馈队列,包括高优先级任务队列Ⅰ(与优先级1对应)、正常任务队列Ⅱ(与优先级3对应)和低优先级任务队列Ⅲ(与优先级2对应),则资源调度***可将任务1分配到任务队列Ⅰ,将任务3分配到任务队列Ⅱ,和将任务2分配到任务队列Ⅲ;
S4:资源调度***中的调度模块按照三级反馈队列的优先级高低,依次分配任务,即依次为每个任务队列中的任务调度计算资源集群中的GPU资源,同时接收是否有资源释放的反馈信息,以在有资源释放或者有新任务提交情况下选取任务执行资源调度过程。
此外,本发明具体实例中,假设当前***中有6个GPU,有4个任务处于正在执行的状态,分别是{T1(1,5;5),T2(2;4),T3(3;2),T4(4,6;3)},其中T1(1,5;5)表示任务1正在使用第1个和第5个GPU,运行完所需的时间为5*10分钟;T2(2;4)表示任务2正在使用第2个GPU,运行完所需的时间为4*10分钟;T3(3;2)表示任务3正在使用第3个GPU,运行完所需的时间为2*10分钟;T4(4,6;3)表示任务4正在使用第4个和第6个GPU,运行完所需的时间为3*10分钟;参见图3所示,其横轴为时间线T,表示每个任务执行结束的时间。
又假设,当前***中正在排队的任务队列为Queue{T5(4;4;4;1),T6(1;1;7;1),T7(3;2;10;1),T8(2;2;4;2)},其中T5(4;4;4;1)表示任务5需要使用4个GPU,运行完所需的时间为4*10分钟,等待时间阈值为4*10分钟,任务优先级为1级;T6(1;1;7;1)表示任务6需要使用1个GPU,运行完所需的时间为1*10分钟,等待时间阈值为7*10分钟,任务优先级为1级;T7(3;2;10;1)表示任务7需要使用3个GPU,运行完所需的时间为2*10分钟,等待时间阈值为10*10分钟,任务优先级为1级;T8(2;2;4;2)表示任务8需要使用2个GPU,运行完所需的时间为2*10分钟,等待时间阈值为4*10分钟,任务优先级为2级;优先级数字越大代表优先级级别越高;则:
S1,任务输入:任务分派模块将输入的任务的优先级计算出后,可按照任务的优先级将其添加到对应的优先级队列,并根据资源需求量确定该任务在相应队列中的具***置。调整后的任务队列可如图4所示。
S2,任务调度:在有GPU资源释放或者有新任务提交情况下,调度模块可选取任务执行GPU资源调度过程。
具体的,经过2*10分钟时,任务3结束,释放1个GPU,即GPU3,此时***中剩余GPU为GPU3。当前优先级高的任务8需要2个GPU,GPU资源不满足其需求,所以继续等待释放新的GPU资源。此时任务队列未更新如图4所示,GPU资源使用情况如图5所示。
经过3*10分钟时,任务4结束,释放2个GPU,即GPU4和GPU6,此时***中剩余GPU为GPU3,GPU4和GPU6。因当前优先级高的任务8需要2个GPU,GPU资源满足其需求,所以为任务8分配GPU3和GPU4。接着,对于任务级别为1的3个任务,使用基于GPU最小需求的任务贪心调度策略,按照GPU需求最少任务优先进行排队,排队后的执行顺序为T6、T7和T5。因最先执行的任务6需要1个GPU,此时***中剩余一个GPU,即GPU6,GPU资源满足其需求,所以为任务6分配GPU6。任务7需要3个GPU,此时***没有空闲GPU,GPU资源不满足其需求,所以继续等待释放新的GPU资源。此时任务队列更新为如图6所示,GPU资源使用情况如图7所示。
S3:任务队列更新:将等待时间较长的任务动态分配到优先级更高的任务队列中,提高其优先级,保证其得到执行,避免任务饥饿。
具体的,经过4*10分钟时,任务2结束,释放1个GPU,即GPU2,同时任务6结束,释放1个GPU,即GPU6,此时***中剩余GPU为GPU2和GPU6。由于已经等待了4*10分钟,任务5在其队列中的等待时间超过阈值,并且任务5不是处在最高优先级队列,所以需将任务5添加进优先级高一级的队列中,即任务5的优先级级别变为2。调度模块调度时,由于优先级高的任务5需要4个GPU,GPU资源不满足其需求,所以继续等待释放新的GPU资源。此时任务队列更新为如图8所示,GPU资源使用情况如图9所示。
S4:任务调度:在有GPU资源释放或者有新任务提交情况下,调度模块可选取任务执行GPU资源调度过程。
具体的,经过5*10分钟时,任务1结束,释放2个GPU,即GPU1和GPU5,同时任务8结束,释放2个GPU,即GPU3和GPU4,此时***中剩余GPU为GPU1、GPU2、GPU3、GPU4、GPU5和GPU6。因优先级高的任务5需要4个GPU,GPU资源满足其需求,所以为任务5分配GPU1、GPU2、GPU3和GPU4。接着,对于任务级别为1的任务7,需要3个GPU,而此时空闲GPU只有2个,GPU资源不满足其需求,所以继续等待释放新的GPU资源。此时任务队列更新如图10所示,GPU资源使用情况如图11所示。
经过9*10分钟时,任务5结束,释放4个GPU,即GPU1、GPU3、GPU4和GPU5,此时***中剩余GPU为GPU1、GPU2、GPU3、GPU4、GPU5和GPU6。因任务队列中的任务7需要3个GPU,GPU资源满足其需求,所以为任务7分配GPU1、GPU2和GPU3。到11*10分钟时,所有任务全部运行完毕,任务调度结束。此时任务队列更新为如图12所示(即没有任务处于任务队列),GPU资源使用情况如图13所示。
上述实施例对本发明的资源调度方法进行了说明,下面将结合实施例和附图对本发明的资源调度装置进行说明。
参见图14所示,本发明实施例还提供了一种资源调度装置,包括:
获取模块141,用于获取用户输入的任务;
确定模块142,用于确定所述任务的优先级;
分配模块143,用于将所述任务分配至与所述任务的优先级对应的任务队列中;
调度模块144,用于按照所有任务队列的优先级高低,依次为每个任务队列中的任务调度GPU资源。
本发明实施例的资源调度装置,通过将用户输入的任务分配至与其优先级对应的任务队列中,按照所有任务队列的优先级高低,依次为每个任务队列中的任务调度GPU资源,可以将不同优先级的任务分配至对应的任务队列中,从而根据任务的优先级动态地为任务调度GPU资源,满足任务执行需求,提高GPU资源的利用率。
本发明实施例中,可选的,所述确定模块142还用于:
将所述任务的资源需求量和所述用户的历史资源使用信息输入到根据历史信息训练得到的任务分派模型中,得到所述任务的优先级。
可选的,所述分配模块143还用于:
当所述任务在第一任务队列中的等待时间超过预设时间阈值,且所述第一任务队列的优先级不是所有任务队列中的最高优先级时,将所述任务更新至第二任务队列;
其中,所述第二任务队列的优先级比所述第一任务队列的优先级高。
可选的,所述调度模块144还用于:
按照所有任务队列的优先级高低,依次针对每个任务队列执行如下操作:
按照所述每个任务队列中的任务的GPU资源需求的从小到大,依次为所述每个任务队列中的任务调度GPU资源。
此外,本发明实施例还提供了一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其中,所述计算机程序被所述处理器执行时可实现上述资源调度方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
具体的,参见15所示,本发明实施例还提供了一种电子设备,包括总线151、收发机152、天线153、总线接口154、处理器155和存储器156。
在本发明实施例中,所述电子设备还包括:存储在存储器156上并可在处理器155上运行的计算机程序。具体的,所述计算机程序被处理器155执行时可实现如下步骤:
获取用户输入的任务;确定所述任务的优先级;将所述任务分配至与所述任务的优先级对应的任务队列中;按照所有任务队列的优先级高低,依次为每个任务队列中的任务调度GPU资源。
在图15中,总线架构(用总线151来代表),总线151可以包括任意数量的互联的总线和桥,总线151将包括由处理器155代表的一个或多个处理器和存储器156代表的存储器的各种电路链接在一起。总线151还可以将诸如***设备、稳压器和功率管理电路等之类的各种其他电路链接在一起,这些都是本领域所公知的,因此,本文不再对其进行进一步描述。总线接口154在总线151和收发机152之间提供接口。收发机152可以是一个元件,也可以是多个元件,比如多个接收器和发送器,提供用于在传输介质上与各种其他装置通信的单元。经处理器155处理的数据通过天线153在无线介质上进行传输,进一步,天线153还接收数据并将数据传送给处理器155。
处理器155负责管理总线151和通常的处理,还可以提供各种功能,包括定时,***接口,电压调节、电源管理以及其他控制功能。而存储器156可以被用于存储处理器155在执行操作时所使用的数据。
可选的,处理器155可以是CPU、ASIC、FPGA或CPLD。
本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述资源调度方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体,可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (10)

1.一种资源调度方法,其特征在于,包括:
获取用户输入的任务;
确定所述任务的优先级;
将所述任务分配至与所述任务的优先级对应的任务队列中;
按照所有任务队列的优先级高低,依次为每个任务队列中的任务调度图形处理器GPU资源。
2.根据权利要求1所述的方法,其特征在于,所述确定所述任务的优先级,包括:
将所述任务的资源需求量和所述用户的历史资源使用信息输入到根据历史信息训练得到的任务分派模型中,得到所述任务的优先级。
3.根据权利要求1所述的方法,其特征在于,所述将所述任务分配至与所述任务的优先级对应的任务队列中之后,所述方法还包括:
当所述任务在第一任务队列中的等待时间超过预设时间阈值,且所述第一任务队列的优先级不是所有任务队列中的最高优先级时,将所述任务更新至第二任务队列;
其中,所述第二任务队列的优先级比所述第一任务队列的优先级高。
4.根据权利要求1所述的方法,其特征在于,所述依次为每个任务队列中的任务调度图形处理器GPU资源,包括:
依次针对每个任务队列执行如下操作:
按照所述每个任务队列中的任务的GPU资源需求的从小到大,依次为所述每个任务队列中的任务调度GPU资源。
5.一种资源调度装置,其特征在于,包括:
获取模块,用于获取用户输入的任务;
确定模块,用于确定所述任务的优先级;
分配模块,用于将所述任务分配至与所述任务的优先级对应的任务队列中;
调度模块,用于按照所有任务队列的优先级高低,依次为每个任务队列中的任务调度GPU资源。
6.根据权利要求5所述的装置,其特征在于,所述确定模块还用于:
将所述任务的资源需求量和所述用户的历史资源使用信息输入到根据历史信息训练得到的任务分派模型中,得到所述任务的优先级。
7.根据权利要求5所述的装置,其特征在于,所述分配模块还用于:
当所述任务在第一任务队列中的等待时间超过预设时间阈值,且所述第一任务队列的优先级不是所有任务队列中的最高优先级时,将所述任务更新至第二任务队列;
其中,所述第二任务队列的优先级比所述第一任务队列的优先级高。
8.根据权利要求5所述的装置,其特征在于,所述调度模块还用于:
按照所有任务队列的优先级高低,依次针对每个任务队列执行如下操作:
按照所述每个任务队列中的任务的GPU资源需求的从小到大,依次为所述每个任务队列中的任务调度GPU资源。
9.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述计算机程序被所述处理器执行时实现如权利要求1至4中任一项所述的资源调度方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至4中任一项所述的资源调度方法的步骤。
CN201910000981.2A 2019-01-02 2019-01-02 一种资源调度方法、装置及电子设备 Pending CN111400022A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910000981.2A CN111400022A (zh) 2019-01-02 2019-01-02 一种资源调度方法、装置及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910000981.2A CN111400022A (zh) 2019-01-02 2019-01-02 一种资源调度方法、装置及电子设备

Publications (1)

Publication Number Publication Date
CN111400022A true CN111400022A (zh) 2020-07-10

Family

ID=71428219

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910000981.2A Pending CN111400022A (zh) 2019-01-02 2019-01-02 一种资源调度方法、装置及电子设备

Country Status (1)

Country Link
CN (1) CN111400022A (zh)

Cited By (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111913799A (zh) * 2020-07-14 2020-11-10 北京华夏启信科技有限公司 一种视频流在线分析任务调度方法和计算机设备
CN112087503A (zh) * 2020-08-29 2020-12-15 北京明略昭辉科技有限公司 集群任务调度方法、***、计算机和计算机可读存储介质
CN112114967A (zh) * 2020-09-16 2020-12-22 中国船舶重工集团公司第七0九研究所 一种基于服务优先级的gpu资源预留方法
CN112181661A (zh) * 2020-10-13 2021-01-05 极道科技(北京)有限公司 一种任务调度方法
CN112650571A (zh) * 2020-12-30 2021-04-13 中国农业银行股份有限公司 一种作业执行方法及装置
CN112948079A (zh) * 2021-02-18 2021-06-11 北京百度网讯科技有限公司 任务调度方法、装置、设备和计算机存储介质
CN113163452A (zh) * 2021-04-02 2021-07-23 深圳市晨北科技有限公司 信息处理方法、***、信息处理终端和存储介质
CN113391905A (zh) * 2021-06-25 2021-09-14 图灵人工智能研究院(南京)有限公司 基于多gpu的任务调度方法、装置
CN113419831A (zh) * 2021-06-23 2021-09-21 上海观安信息技术股份有限公司 一种沙箱任务调度方法和***
CN114116184A (zh) * 2022-01-28 2022-03-01 腾讯科技(深圳)有限公司 虚拟场景中的数据处理方法及装置、设备、介质
CN114116220A (zh) * 2021-11-29 2022-03-01 苏州浪潮智能科技有限公司 一种gpu共享控制方法、gpu共享控制装置及存储介质
CN114356547A (zh) * 2021-12-07 2022-04-15 北京百度网讯科技有限公司 基于处理器虚拟化环境的低优阻塞方法及装置
WO2022095815A1 (zh) * 2020-11-03 2022-05-12 阿里巴巴集团控股有限公司 显存管理方法、装置、设备及***
CN114500401A (zh) * 2022-01-21 2022-05-13 上海金融期货信息技术有限公司 一种应对突发流量的资源调度方法和***
CN114666284A (zh) * 2022-05-23 2022-06-24 阿里巴巴(中国)有限公司 一种流量控制方法、装置、电子设备及可读存储介质
CN114968509A (zh) * 2021-05-08 2022-08-30 中移互联网有限公司 任务执行方法及装置
CN115269155A (zh) * 2022-08-04 2022-11-01 华院计算技术(上海)股份有限公司 业务数据请求的调度方法、***、设备及存储介质
CN116700913A (zh) * 2022-09-13 2023-09-05 荣耀终端有限公司 嵌入式文件***的调度方法、设备及存储介质
CN117149441A (zh) * 2023-10-27 2023-12-01 南京齐芯半导体有限公司 一种应用于IoT的任务调度优化方法
CN117149393A (zh) * 2023-09-27 2023-12-01 苏州深捷信息科技有限公司 一种可调试的计算机多任务调度方法和***

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102567086A (zh) * 2010-12-30 2012-07-11 ***通信集团公司 一种任务调度的方法、设备和***
CN104035818A (zh) * 2013-03-04 2014-09-10 腾讯科技(深圳)有限公司 多任务调度的方法及装置
CN104156264A (zh) * 2014-08-01 2014-11-19 西北工业大学 一种基于多gpu的基带信号处理任务并行实时调度方法
CN107977268A (zh) * 2017-10-13 2018-05-01 北京百度网讯科技有限公司 人工智能的异构硬件的任务调度方法、装置及可读介质

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102567086A (zh) * 2010-12-30 2012-07-11 ***通信集团公司 一种任务调度的方法、设备和***
CN104035818A (zh) * 2013-03-04 2014-09-10 腾讯科技(深圳)有限公司 多任务调度的方法及装置
CN104156264A (zh) * 2014-08-01 2014-11-19 西北工业大学 一种基于多gpu的基带信号处理任务并行实时调度方法
CN107977268A (zh) * 2017-10-13 2018-05-01 北京百度网讯科技有限公司 人工智能的异构硬件的任务调度方法、装置及可读介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
李薛剑;李凯;: "一种基于动态优先级的RQ作业调度算法", 小型微型计算机***, no. 01, pages 1 - 3 *

Cited By (33)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111913799B (zh) * 2020-07-14 2024-04-19 北京华夏启信科技有限公司 一种视频流在线分析任务调度方法和计算机设备
CN111913799A (zh) * 2020-07-14 2020-11-10 北京华夏启信科技有限公司 一种视频流在线分析任务调度方法和计算机设备
CN112087503A (zh) * 2020-08-29 2020-12-15 北京明略昭辉科技有限公司 集群任务调度方法、***、计算机和计算机可读存储介质
CN112114967A (zh) * 2020-09-16 2020-12-22 中国船舶重工集团公司第七0九研究所 一种基于服务优先级的gpu资源预留方法
CN112114967B (zh) * 2020-09-16 2024-01-30 武汉凌久微电子有限公司 一种基于服务优先级的gpu资源预留方法
CN112181661A (zh) * 2020-10-13 2021-01-05 极道科技(北京)有限公司 一种任务调度方法
CN112181661B (zh) * 2020-10-13 2023-10-24 极道科技(北京)有限公司 一种任务调度方法
WO2022095815A1 (zh) * 2020-11-03 2022-05-12 阿里巴巴集团控股有限公司 显存管理方法、装置、设备及***
CN112650571A (zh) * 2020-12-30 2021-04-13 中国农业银行股份有限公司 一种作业执行方法及装置
CN112948079A (zh) * 2021-02-18 2021-06-11 北京百度网讯科技有限公司 任务调度方法、装置、设备和计算机存储介质
CN112948079B (zh) * 2021-02-18 2022-06-28 北京百度网讯科技有限公司 任务调度方法、装置、设备和计算机存储介质
CN113163452A (zh) * 2021-04-02 2021-07-23 深圳市晨北科技有限公司 信息处理方法、***、信息处理终端和存储介质
CN113163452B (zh) * 2021-04-02 2023-04-28 深圳市晨北科技有限公司 信息处理方法、***、信息处理终端和存储介质
CN114968509A (zh) * 2021-05-08 2022-08-30 中移互联网有限公司 任务执行方法及装置
CN113419831A (zh) * 2021-06-23 2021-09-21 上海观安信息技术股份有限公司 一种沙箱任务调度方法和***
CN113419831B (zh) * 2021-06-23 2023-04-11 上海观安信息技术股份有限公司 一种沙箱任务调度方法和***
CN113391905B (zh) * 2021-06-25 2024-05-14 图灵人工智能研究院(南京)有限公司 基于多gpu的任务调度方法、装置
CN113391905A (zh) * 2021-06-25 2021-09-14 图灵人工智能研究院(南京)有限公司 基于多gpu的任务调度方法、装置
CN114116220A (zh) * 2021-11-29 2022-03-01 苏州浪潮智能科技有限公司 一种gpu共享控制方法、gpu共享控制装置及存储介质
CN114356547B (zh) * 2021-12-07 2023-03-14 北京百度网讯科技有限公司 基于处理器虚拟化环境的低优阻塞方法及装置
CN114356547A (zh) * 2021-12-07 2022-04-15 北京百度网讯科技有限公司 基于处理器虚拟化环境的低优阻塞方法及装置
CN114500401B (zh) * 2022-01-21 2023-11-14 上海金融期货信息技术有限公司 一种应对突发流量的资源调度方法和***
CN114500401A (zh) * 2022-01-21 2022-05-13 上海金融期货信息技术有限公司 一种应对突发流量的资源调度方法和***
CN114116184B (zh) * 2022-01-28 2022-04-29 腾讯科技(深圳)有限公司 虚拟场景中的数据处理方法及装置、设备、介质
CN114116184A (zh) * 2022-01-28 2022-03-01 腾讯科技(深圳)有限公司 虚拟场景中的数据处理方法及装置、设备、介质
CN114666284A (zh) * 2022-05-23 2022-06-24 阿里巴巴(中国)有限公司 一种流量控制方法、装置、电子设备及可读存储介质
CN115269155A (zh) * 2022-08-04 2022-11-01 华院计算技术(上海)股份有限公司 业务数据请求的调度方法、***、设备及存储介质
CN116700913A (zh) * 2022-09-13 2023-09-05 荣耀终端有限公司 嵌入式文件***的调度方法、设备及存储介质
CN116700913B (zh) * 2022-09-13 2024-05-31 荣耀终端有限公司 嵌入式文件***的调度方法、设备及存储介质
CN117149393A (zh) * 2023-09-27 2023-12-01 苏州深捷信息科技有限公司 一种可调试的计算机多任务调度方法和***
CN117149393B (zh) * 2023-09-27 2024-04-02 苏州深捷信息科技有限公司 一种可调试的计算机多任务调度方法和***
CN117149441B (zh) * 2023-10-27 2024-01-05 南京齐芯半导体有限公司 一种应用于IoT的任务调度优化方法
CN117149441A (zh) * 2023-10-27 2023-12-01 南京齐芯半导体有限公司 一种应用于IoT的任务调度优化方法

Similar Documents

Publication Publication Date Title
CN111400022A (zh) 一种资源调度方法、装置及电子设备
CN110442451B (zh) 一种面向深度学习的多类型gpu集群资源管理调度方法和***
JP5120061B2 (ja) 優先度制御プログラム、優先度制御装置、及び優先度制御方法
CN111782355B (zh) 一种基于混合负载的云计算任务调度方法及***
CN109992403B (zh) 多租户资源调度的优化方法、装置、终端设备及存储介质
CN105900064A (zh) 调度数据流任务的方法和装置
CN112380020A (zh) 一种算力资源分配方法、装置、设备及存储介质
CN102096599A (zh) 一种多队列任务调度方法及相关***和设备
CN112817728B (zh) 任务调度方法、网络设备和存储介质
CN110362391B (zh) 资源调度方法、装置、电子设备及存储介质
CN111813524B (zh) 一种任务执行方法、装置、电子设备和存储介质
CN111104227A (zh) 一种K8s平台的资源控制方法、装置及相关组件
CN105677744A (zh) 一种文件***中提高服务质量的方法和装置
CN112749002A (zh) 一种集群资源动态管理的方法和装置
CN111221631A (zh) 一种任务调度方法、装置及存储介质
CN111597044A (zh) 任务调度方法、装置、存储介质及电子设备
CN109783236B (zh) 用于输出信息的方法和装置
CN112925616A (zh) 任务分配方法、装置、存储介质及电子设备
CN102184124B (zh) 任务调度方法及***
CN114138428A (zh) 多优先级任务的slo保障方法、装置、节点及存储介质
CN117519930A (zh) 批量任务的执行方法、装置及电子设备
CN112817722A (zh) 一种基于优先级的分时调度方法、终端及存储介质
CN117608840A (zh) 一种智能监控***资源综合管理的任务处理方法及***
CN113535346B (zh) 线程数量调整的方法、装置、设备及计算机存储介质
CN110851245A (zh) 一种分布式异步任务调度方法及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination