CN103324534A - 作业调度方法及其调度器 - Google Patents

作业调度方法及其调度器 Download PDF

Info

Publication number
CN103324534A
CN103324534A CN2012100783750A CN201210078375A CN103324534A CN 103324534 A CN103324534 A CN 103324534A CN 2012100783750 A CN2012100783750 A CN 2012100783750A CN 201210078375 A CN201210078375 A CN 201210078375A CN 103324534 A CN103324534 A CN 103324534A
Authority
CN
China
Prior art keywords
information
described operation
scheduling
algorithm
dispatching
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2012100783750A
Other languages
English (en)
Other versions
CN103324534B (zh
Inventor
罗宏宇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba Group Holding Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN201210078375.0A priority Critical patent/CN103324534B/zh
Publication of CN103324534A publication Critical patent/CN103324534A/zh
Priority to HK13113233.5A priority patent/HK1185969A1/zh
Application granted granted Critical
Publication of CN103324534B publication Critical patent/CN103324534B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请涉及一种作业调度方法及其调度器。该方法包括,接收作业调度请求信息,该作业调度请求消息中携带作业的标识信息;根据作业的标识信息,查询经验数据数据库中是否有作业的历史运行信息,判断作业的作业类型;根据作业的作业类型,确定作业的执行成本组信息;确定调度所述作业要使用的调度算法;将执行成本组信息和调度***的所有可用资源组信息利用所述调度算法,生成所述作业的调度计划数据以完成作业调度。本申请实现了根据预设调度算法动态选择一种调度算法来制定调度计划,提高了***资源的利用率。

Description

作业调度方法及其调度器
技术领域
本申请涉及作业调度领域,尤其涉及一种作业调度方法及其调度器。
背景技术
目前的ETL(英文全称:Extract-Transform-Load,中文:抽取、转换、装载)工作流调度方法都用最基本的FIFO(英文全称:First In First Out,中文:先来先服务)调度模式或者单独的算法进行调度。由于调度的作业类型和要求不一致,造成运行环境比较复杂。比如,作业需要的数据引擎、运行周期、QoS要求、资源差异等,复杂多变。而且随着云计算时代的到来,作业的调度数量和复杂度都会激增。
现有***或常见的***常常会采用固定的策略去调度作业,不同的策略和算法在不同场景和要求下的效果会大不相同。如果调度策略和算法不适用,会造成降低调度效率的结果。
使用固定的算法进行作业调度的方法流程为:接收作业调度请求信息;使用固定的策略或算法生成执行作业的计划;将执行作业的计划发送给执行器,用以使所述执行器执行所述计划,以完成作业调度。
现有的作业调度方法存在以下缺点:一方面,现有的调度方法采用固定的策略或算法,不能根据***的资源情况,动态地选择合适的策略或算法来制定作业执行计划,影响了***资源的利用率;另一方面,现有调度方法没有很好地利用历史数据来预估作业的执行成本组信息,因此不能将所述预估的执行成本组信息作为制定作业执行计划的重要因素,进而影响了***资源的利用率。
发明内容
本申请的目的是,提供一种作业调度方法及其调度器,实现了动态地选择合适的策略或算法来制定作业调度计划,提高了***资源的利用率。
为实现上述目的,本申请提供了一种作业调度方法,所述方法包括:
接收作业调度请求信息,所述作业调度请求消息中携带作业的标识信息;
根据所述作业的标识信息,查询经验数据数据库中是否有所述作业的历史运行信息,判断所述作业的作业类型;
根据所述作业的作业类型,确定所述作业的执行成本组信息;
确定调度所述作业要使用的调度算法;
将所述执行成本组信息和调度***的所有可用资源组信息利用所述调度算法,生成所述作业的调度计划数据以完成作业调度。
相应地,本申请还提供了一种作业调度器,所述调度器包括:
接收单元,用于接收作业调度请求信息,所述作业调度请求消息中携带作业的标识信息;
判断单元,用于根据所述作业的标识信息,查询经验数据数据库中是否有所述作业的历史运行信息,判断所述作业的作业类型;
成本组信息获取单元,用于根据所述作业的作业类型,确定所述作业的执行成本组信息;
确定单元,用于确定调度所述作业要使用的调度算法;
调度计划生成单元,用于将所述执行成本组信息和调度***的所有可用资源组信息利用所述调度算法,生成所述作业的调度计划数据以完成作业调度。
因此,本申请实现了同时支持多种调度算法,根据作业的类型,来预测或评估所述作业的执行成本组信息;将所述执行成本组信息和调度***的所有可用资源组信息利用调度算法,生成所述作业的调度计划数据以完成作业调度,由此实现了动态地制定调度计划,提高了***资源的利用率。
附图说明
图1为本申请实施例提供的一种作业调度方法流程图;
图2为本申请实施例提供的一种作业调度***框架的信息交互示意图;
图3为本申请实施例提供的一种作业调度器的示意图。
具体实施方式
下面通过附图和实施例,对本申请的技术方案做进一步的详细描述。
本申请实施例通过判断需要调度的作业的类型,根据所述作业的类型信息,确定所述作业的执行成本组信息;将所述执行成本组信息和调度***的所有可用资源组信息利用调度算法,生成所述作业的调度计划数据以完成作业调度。由于调度***将统一组织或确定得出的作业执行成本组信息作为调度算法的输入,从而生成该作业的一个调度计划,因此,根据作业的应用场景,区别设定每个作业的调度算法,可以动态地制定一个对应的调度计划,提高了***资源的利用率。
本申请实施例提供的作业调度方法、调度器和***框架在实际应用时,作为一种好的作业调度方法可应用于一个计算机集群中,应用于集群中的不同的调度场景和要求,在集群中的某个主机需要调度作业时,该主机向集群中的调度器发送调度请求信息,调度器根据作业的类型和内容,预测作业的执行成本组信息,并将所述执行成本组信息和调度***的所有可用资源组信息利用调度算法,生成所述作业的调度计划数据以完成作业调度。本申请实现了针对某个场景、某个作业,区别设定作业的调度算法,动态制定一个对应的作业调度计划,完成作业调度。
如图1所示,其为本申请实施例提供的一种作业调度方法流程图。该实施例主体是调度器,其中详细描述了进行作业调度的方法,即接收到主机发送的作业调度请求信息后,完成作业调度的过程。本申请实施例作业调度方法具体包括以下步骤:
步骤11,接收作业调度请求消息,所述作业调度请求消息中携带作业的标识信息;
在实际应用中,集群中的某台主机需要启动某个作业时,会向集群中的调度器发送作业调度请求信息,作业调度请求信息中携带请求调度的作业的信息,可包括以下信息中的部分或全部:标识ID信息、类型、优先级、计划映射Map数、计划减少Reduce数、输入文件大小、启动时间、执行命令、执行时间和条件等。调度请求信息的格式可以是json格式。Json格式是一种数据格式,其基于JavaScript语法的数组和对象表示。
作业调度请求信息中还可以携带算法标识信息,该算法标识信息用于确定该调度该作业需要使用的调度算法。调度算法的选择由请求作业调度的用户端确定,如果用户端希望优先考虑调度作业的数量,则可以将调度算法设定为Min-Min算法,并将该算法通过祖业调度请求消息携带的算法标识信息发送给作业调度器。
步骤12,根据所述作业的标识信息,查询经验数据数据库中是否有所述作业的历史运行信息,判断所述作业的作业类型;
经验数据数据库是由调度***中的资源管理服务器操作的,其中保存了作业的历史运行信息,例如,作业的标识信息、最小完成时间、最大完成时间、估计完成时间、映射输出数据大小、执行周期、等待时间、内存单元数、CPU单元数、磁盘单元数、重试次数、估计资源使用量、读写文件数量等。
当某一个作业执行完毕时,资源管理器收集该作业此次的执行信息作为该作业的一组历史运行信息,一个作业可以有多组历史运行信息,并且也保证了经验数据数据库中的信息是根据该调度***中执行作业的情况随时更新的。
根据所述作业的标识信息,查询经验数据数据库中是否有所述作业的历史运行信息,判断所述作业的作业类型的具体操作为:如果所述经验数据数据库中有所述作业的标识信息对应的作业的历史运行信息,则判断所述作业为历史作业类型;如果所述经验数据数据库中没有所述作业的标识信息对应的作业的历史运行信息,则判断所述作业为非历史作业类型。
步骤13,根据所述作业的作业类型,确定所述作业的执行成本组信息;
调度器接收到作业调度请求信息后,会根据经验数据数据库中是否有历史运行信息来判断作业的类型,即该作业是否为历史作业。
如果所述作业的类型信息为历史作业,则在经验数据数据库中提取该作业的多组历史运行信息,并对提取的多组历史运行信息求方差,用以预测确定所述作业的执行成本组信息;如果所述作业非历史作业,则解析该作业的内容,确定作业涉及的数据量和任务量,根据数据量和任务量,评估作业的执行成本组信息。
所述历史运行信息可包括以下信息中的部分或全部:作业最小完成时间、最大完成时间、估计完成时间、映射输出数据大小、执行周期、等待时间、内存单元数、CPU单元数、磁盘单元数、重试次数、估计资源使用量、读写文件数量等,即历史运行信息中包括该作业的完成时间、Map映射输出数据大小、执行周期、内存单元数、磁盘单元数、CPU单元数、资源使用量等历史执行成本信息;然后对作业的多次的历史执行成本求方差,以预测确定作业的执行成本组信息。
举例来说明求方差的方法,假设Xi是作业的每次的历史执行成本,X是历史执行成本的平均值,那么方差值就是∑(Xi-X)^2/n。
例如,假设作业已经被运行过5次,经验数据数据库中保存的5组历史运行信息中记录的运行时间和资源消耗分别是(30,70)、(34,71)、(22,65)、(31,72)、(38,77)。
对5组历史运行信息中记录的运行时间求方差,计算得到预测运行时间=((30-31)^2+(34-31)^2+(22-31)^2+(31-31)^2+(39-31)^2)/5=31
对5组历史运行信息中记录的资源消耗求方差,计算得到预测资源消耗=((64-71)^2+(78-71)^2+(58-71)^2+(77-71)^2+(80-71)^2)/5=77
即t1的预测确定的资源消耗和执行时间是(31,77)。
作业的执行成本组信息可包括以下信息中的部分或全部:估计完成时间、Map映射输出数据大小、执行周期、内存单元数、磁盘单元数、CPU单元数、估计资源使用量等。
如果请求调度的作业不是历史作业,则调度器根据作业调度请求信息携带的作业内容信息来评估作业的执行成本组信息。例如,如果作业内容为SQL语句,则可以根据解析语句得到执行计划,确定作业涉及的数据量和任务量,根据数据量和任务量,调度器可以评估出作业的执行成本组信息,方法采用对作业运行所需的数据量大小和运行资源评估。例如,这个作业需要的进程数,扫描文件的大小,来估计完成时间、Map映射输出数据大小、执行周期、内存单元数、磁盘单元数、CPU单元数、估计资源使用量这些信息等。
步骤14,确定调度所述作业要使用的调度算法;
需要说明的是,确定调度所述作业要使用的调度算法的步骤可根据不同确定方式调整确定顺序,如调整为发生在步骤11之后、步骤15之前的任何一步。
确定调度所述作业要使用的调度算法的步骤,具体可以是:根据所述作业调度请求消息中携带的算法标识信息确定要使用的调度算法;或根据所述作业的标识信息查询算法预设数据库,从而确定要使用的调度算法。
优选地,确定调度所述作业要使用的调度算法的步骤,具体可以是:所述历史运行信息包括历史执行成本和所述历史执行成本对应的算法标识信息,遍历所述经验数据数据库中的所述作业对应的多组历史运行信息,计算每个调度算法对应的多组历史执行成本的方差值,获取方差值最小的历史执行成本对应的调度算法的算法标识信息,从而确定要使用的调度算法。
在步骤11中,说明了作业调度请求消息中可以携带调度算法的算法标识信息,由此调度器可以根据该算法标识信息确定调度该作业要使用的调度算法。
优选地,调度器中还可以包括算法预设数据库,在算法预设数据库中,包括了作业的标识信息和作业要使用的调度算法的对应关系。针对某个作业,用户端在发送作业调度请求消息之前,可以先更新该算法预设数据库,将要调度的作业的标识信息和该作业要使用的调度算法保存在算法预设数据库中。当调度器接收到作业调度请求消息时,可以根据作业调度请求消息中携带的作业的标识信息查询该算法预设数据库来确定要使用的调度算法。
优选地,经验数据数据库中中的历史运行信息还可以包括调度作业所使用的调度算法。由此,调度器在接收到作业的调度请求消息后,通过遍历经验数据数据库中该作业的标识信息对应的历史执行成本,然后根据将历史执行成本按照使用的调度算法分组,求每个分组对应的历史执行成本的方差值,将方差值最小的历史执行成本对应的调度算法作为调度本次作业所使用的调度算法。
如果调度***支持的算法中包括用户端调度作业所需要的算法,则可以使用***支持的算法作为调度算法;如果调度***支持的算法都不满足用户端的需要,则用户端可以定制一种算法。
常见的***支持的算法包括:HEFT(Heterogeneous Earliest FinishTime,异构最早完成时间)算法、Sufferage算法、Min-Min算法、Max-Min算法、GRASP算法等。其中,HEFT算法是表调度算法的扩展,表调度的基本思想是通过对节点的优先级别进行排序来构造一个调度列表,从调度列表中顺序取出一个节点,并将节点分配到使它的启动时间最早的处理机器上;Min-Min算法是循环调度一些任务,算出每个任务在这些可用资源中能完成的时间,使用最贴近的资源优先调度最小执行时间的任务的算法;Max-Min算法是循环调度一些任务,算出每个任务在这些可用资源中能完成的时间,使用最贴近的资源优先调度最大执行时间的算法;Sufferage算法是优先调度备选资源运行时间与首选资源运行时间相差很大的任务的算法;贪婪随机自适应搜索法(Greedy RandomizedAdaptive Search Procedure,GRASP)是一种元启发式方法,GRASP算法由构造阶段和局部搜索阶段组成,能够快速构造较好的初始划分,在其构造阶段引入启发式子集选择策略,并与高效搜索技术相结合,在各个局部最优解之间建立路径,从而有效搜索了局部最优解空间。
步骤15,将所述执行成本组信息和调度***的所有可用资源组信息利用所述调度算法,生成所述作业的调度计划数据以完成作业调度。
其中,调度计划数据是指调度***中所有可用资源组信息中作业要使用的一个资源组。
将所述执行成本组信息和调度***的所有可用资源组信息利用调度算法,生成所述作业的调度计划数据以完成作业调度的步骤,具体可以是:将所述执行成本组信息和所述所有可用资源组信息作为所述调度算法的输入,输出调度所述作业所使用的资源组数据。
生成调度计划后,调度器将所述作业的调度计划发送给执行器,用以使所述执行器执行所述调度计划,以完成作业调度。
执行器执行完调度计划,完成作业调度后,***的资源管理服务器将收集该作业的运行信息,以用于调度器以后处理相同的作业时从经验数据数据库中获取该作业的运行信息。
在执行作业调度计划期间,资源管理服务器也可根据实际情况更新***资源组信息,确保调度器可实时获取真实的资源组信息。资源管理服务器在执行器每次执行完一次作业调度计划后,也会收集作业的运行信息到经验数据数据库,作为以后进行作业调度的依据。
调度器根据步骤13中预测或评估出的执行成本组信息和步骤14中确定的调度算法,例如Min-Min算法,在得到的每个资源的资源组信息中选择最合适的资源组信息,即第一资源组信息。
举例来说明将所述执行成本组信息和调度***的所有可用资源组信息利用调度算法,生成所述作业的调度计划数据的方法:如果预测或评估的执行成本为完成时间为30分钟,Map映射输出数据大小5GB,内存8GB;而为了满足用户端保证作业数量优先的执行要求,此处使用的作业调度算法为Min-Min算法;调度***的可用资源中,A资源组的资源为可用时间40分钟,Map映射输出数据大小6GB,内存9GB;B资源组的资源为可用时间90分钟,Map映射输出数据大小15GB,内存为24GB;则此作业的最合适的资源组信息,即作业的调度计划数据为资源组A。
如图1所示,在步骤15之前,本申请实施例还可包括:步骤16,查询资源数据数据库,获取所述调度***的可用资源组信息。
在实际应用中,***中的资源管理服务器可收集***所有资源的可用信息,将***所有的可用资源信息生成为一个资源数据数据库,供调度器进行查询,包括每个资源的CPU信息、内存信息、IO输入输出信息等,得到针对每个资源的资源组信息。
由于***的可用资源是随时更新的,因此***中的资源管理服务器可根据循环收集到的可用资源信息随时更新该资源数据数据库。
本申请上述步骤实现了根据作业的类型预测或评估作业的执行成本组信息,并且根据执行成本组信息和调度算法确定要使用的资源组信息,即生成作业的调度计划。由此,本申请实施例实现了根据作业的应用场景,区别设定每个作业的调度算法,可以动态地制定一个对应的调度计划,这提高了***资源的利用率。
如图2所示,其为本申请实施例提供的一种作业调度***框架的信息交互示意图。该***包括:
资源管理服务器21,资源管理服务器21用于管理资源,可收集该作业调度***中的所有可用资源组信息,也可收集作业的运行信息,作为下次调度该作业时的参考信息;
经验数据数据库22,经验数据数据库22由资源管理服务器操作,其中保存了作业的历史运行信息;
作业的历史运行信息可以包括作业的执行成本信息,还可以包括调度该作业所使用的算法的算法标识信息。当某一个作业执行完毕时,资源管理器收集该作业此次的执行信息作为该作业的一组历史运行信息,一个作业可以有多组历史运行信息,并且经验数据数据库中的信息是根据该调度***中执行作业的情况随时更新的。
资源数据数据库23,资源数据数据库23是由调度***中的可用资源组信息生成的,供作业调度器进行查询。由于调度***的可用资源是随时更新的,因此***中的资源管理服务器可根据循环收集到的可用资源信息随时更新该资源数据数据库。
作业调度器24,作业调度器24是调度***的核心调度引擎,用于接收调度***中的其他主机发送的作业调度请求消息,并根据作业调度请求消息携带的作业标识信息判断作业的类型,来预测或评估所述作业的执行成本组信息;根据执行成本组信息和作业的执行要求信息,选择一种算法;根据执行成本组信息、资源组信息和所选择的算法生成所述作业的调度计划。
算法集成模块25,算法集成模块25中集成了调度***支持的各种算法,如HEFT算法、Sufferage算法、Min-Min算法、Max-Min算法、GRASP算法。算法集成模块25也接收用户端定制的算法。
算法预设数据库26,算法预设数据库26用于保存作业的标识信息和作业的调度算法之间的对应关系,用户端根据作业的应用场景可从算法集成模块25中选择一种算法作业该作业的调度算法。
因此,本申请上述实施例提供的作业调度***框架实现了作业调度器根据作业的类型预测或评估作业的执行成本组信息,并且根据执行成本组信息和调度算法确定要使用的资源组信息,即生成作业的调度计划。由此,本申请实施例实现了根据作业的应用场景,区别设定每个作业的调度算法,可以动态地制定一个对应的调度计划,提高了***资源的利用率。
相应地,本申请提供一种作业调度器。如图3所示,其为申请实施例提供的一种作业调度器的示意图。该调度器包括:
接收单元31,用于接收作业调度请求信息,所述作业调度请求消息中携带作业的标识信息;
判断单元32,用于根据所述作业的标识信息,查询经验数据数据库中是否有所述作业的历史运行信息,判断所述作业的作业类型;
判断单元32具体用于:如果所述经验数据数据库中有所述作业的标识信息对应的作业的历史运行信息,则判断所述作业为历史作业类型;如果所述经验数据数据库中没有所述作业的标识信息对应的作业的历史运行信息,则判断所述作业非历史作业类型。
成本组信息获取单元33,用于根据所述作业调度请求信息中携带的作业的类型信息,确定所述作业的执行成本组信息;
成本组信息获取单元33具体包括:第一信息获取子单元37,用于如果所述作业的所述作业类型为历史作业类型,则根据所述作业的历史运行信息,预测确定所述作业的执行成本组信息;第二信息获取子单元38,用于如果所述作业的所述作业类型为非历史作业类型,则根据所述作业的内容信息,评估确定所述作业的执行成本组信息。
确定单元34,用于确定调度所述作业要使用的调度算法;
确定单元34具体用于:根据所述作业调度请求消息中携带的算法标识信息确定要使用的调度算法;或根据所述作业的标识信息查询算法预设数据库,从而确定要使用的调度算法。
确定单元34还用于:所述历史运行信息包括历史执行成本和所述历史执行成本对应的算法标识信息时,遍历所述经验数据数据库中的所述作业对应的多组历史运行信息,计算每个调度算法对应的多组历史执行成本的方差值,获取方差值最小的历史执行成本对应的调度算法的算法标识信息,从而确定要使用的调度算法。
调度计划生成单元35,用于将所述执行成本组信息和调度***的所有可用资源组信息利用调度算法,生成所述作业的调度计划数据以完成作业调度;所述调度算法根据所述作业调度请求消息中携带的算法标识信息而确定,或根据所述作业的标识信息查询算法预设数据库而确定。
所述调度器还包括:查询单元36,用于查询资源数据数据库,获取所述调度***的所有可用资源组信息。
所述调度算法为:调度***的一种集成算法,或所述用户端定制的一种算法。
因此,本申请提供的上述作业调度器实现了根据作业的类型预测或评估作业的执行成本组信息,根据成本组信息和调度算法选择资源组信息,即生成所述作业的调度计划。由此,本申请实施例实现了根据作业的应用场景,区别设定每个作业的调度算法,可以动态地制定一个对应的调度计划,这提高了***资源的利用率。
相应地,本申请还提供一种作业调度***框架,所述***植入了上述作业调度方法,包括上述作业调度器。该作业调度***框架通过判断需要调度的作业的类型,确定所述作业的执行成本组信息;将所述执行成本组信息和调度***的所有可用资源组信息利用调度算法,生成所述作业的调度计划数据以完成作业调度。由于调度***将统一组织或确定得出的作业执行成本组信息作为调度算法的输入,从而生成该作业的一个调度计划,因此,根据作业的应用场景,区别设定每个作业的调度算法,可以动态地制定一个对应的调度计划,提高了***资源的利用率。由此,本申请实施例提供的作业调度***框架也在本专利申请的保护范围内。
专业人员应该还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
结合本文中所公开的实施例描述的方法或算法的步骤可以用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
以上所述的具体实施方式,对本申请的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本申请的具体实施方式而已,并不用于限定本申请的保护范围,凡在本申请的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

Claims (10)

1.一种作业调度方法,其特征在于,所述方法包括:
接收作业调度请求信息,所述作业调度请求消息中携带作业的标识信息;
根据所述作业的标识信息,查询经验数据数据库中是否有所述作业的历史运行信息,判断所述作业的作业类型;
根据所述作业的作业类型,确定所述作业的执行成本组信息;
确定调度所述作业要使用的调度算法;
将所述执行成本组信息和调度***的所有可用资源组信息利用所述调度算法,生成所述作业的调度计划数据以完成作业调度。
2.如权利要求1所述的作业调度方法,其特征在于,所述确定调度所述作业要使用的调度算法具体为:根据所述作业调度请求消息中携带的算法标识信息确定要使用的调度算法;或
根据所述作业的标识信息查询算法预设数据库,从而确定要使用的调度算法。
3.如权利要求1所述的作业调度方法,其特征在于,所述确定调度所述作业要使用的调度算法具体为:
所述历史运行信息包括历史执行成本和所述历史执行成本对应的算法标识信息,遍历所述经验数据数据库中的所述作业对应的多组历史运行信息,计算每个调度算法对应的多组历史执行成本的方差值,获取方差值最小的历史执行成本对应的调度算法的算法标识信息,从而确定要使用的调度算法。
4.如权利要求1所述的作业调度方法,其特征在于,所述生成所述作业的调度计划数据以完成作业调度之后还包括:调度***中的资源管理服务器收集所述作业的运行信息,将所述运行信息保存到所述经验数据数据库中作为一组新的历史运行信息。
5.如权利要求1所述的作业调度方法,其特征在于,所述将所述执行成本组信息和调度***的所有可用资源组信息利用调度算法,生成所述作业的调度计划数据以完成作业调度具体为:将所述执行成本组信息和所述所有可用资源组信息作为所述调度算法的输入,输出调度所述作业所使用的资源组数据。
6.如权利要求1所述的作业调度方法,其特征在于,所述根据所述作业的标识信息,查询经验数据数据库中是否有所述作业的历史运行信息,判断所述作业的作业类型具体为:如果所述经验数据数据库中有所述作业的标识信息对应的作业的历史运行信息,则判断所述作业为历史作业类型;如果所述经验数据数据库中没有所述作业的标识信息对应的作业的历史运行信息,则判断所述作业非历史作业类型。
7.如权利要求6所述的作业调度方法,其特征在于,所述根据所述作业的作业类型,确定所述作业的执行成本组信息包括:
如果所述作业的所述作业类型为历史作业类型,则根据所述作业的历史运行信息,预测确定所述作业的执行成本组信息;
如果所述作业的所述作业类型为非历史作业类型,则根据所述作业的内容信息,评估确定所述作业的执行成本组信息。
8.如权利要求1所述的作业调度方法,其特征在于,所述根据所述执行成本组信息和调度算法,在调度***的所有可用资源组信息中选择对应的第一资源组信息之前还包括:查询资源数据数据库,获取所述调度***的可用资源组信息。
9.如权利要求8所述的作业调度方法,其特征在于,所述生成所述作业的调度计划数据以完成作业调度之后还包括:调度***中的资源管理服务器收集所述调度***中的可用资源组信息,将所收集到的可用资源组信息保存到所述资源数据数据库中。
10.一种作业调度器,其特征在于,所述调度器包括:
接收单元,用于接收作业调度请求信息,所述作业调度请求消息中携带作业的标识信息;
判断单元,用于根据所述作业的标识信息,查询经验数据数据库中是否有所述作业的历史运行信息,判断所述作业的作业类型;
成本组信息获取单元,用于根据所述作业的作业类型,确定所述作业的执行成本组信息;
确定单元,用于确定调度所述作业要使用的调度算法;
调度计划生成单元,用于将所述执行成本组信息和调度***的所有可用资源组信息利用所述调度算法,生成所述作业的调度计划数据以完成作业调度。
CN201210078375.0A 2012-03-22 2012-03-22 作业调度方法及其调度器 Active CN103324534B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201210078375.0A CN103324534B (zh) 2012-03-22 2012-03-22 作业调度方法及其调度器
HK13113233.5A HK1185969A1 (zh) 2012-03-22 2013-11-27 作業調度方法及其調度器

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210078375.0A CN103324534B (zh) 2012-03-22 2012-03-22 作业调度方法及其调度器

Publications (2)

Publication Number Publication Date
CN103324534A true CN103324534A (zh) 2013-09-25
CN103324534B CN103324534B (zh) 2016-08-03

Family

ID=49193296

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210078375.0A Active CN103324534B (zh) 2012-03-22 2012-03-22 作业调度方法及其调度器

Country Status (2)

Country Link
CN (1) CN103324534B (zh)
HK (1) HK1185969A1 (zh)

Cited By (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103747085A (zh) * 2014-01-10 2014-04-23 浪潮电子信息产业股份有限公司 云计算操作***下一种存储资源调度算法
CN104391749A (zh) * 2014-11-26 2015-03-04 北京奇艺世纪科技有限公司 一种资源分配方法及装置
CN104503833A (zh) * 2014-12-22 2015-04-08 广州唯品会网络技术有限公司 任务调度优化方法及装置
CN105022662A (zh) * 2014-04-22 2015-11-04 ***股份有限公司 一种分布式任务分配方法
CN105511957A (zh) * 2014-09-25 2016-04-20 国际商业机器公司 用于生成作业告警的方法和***
CN105718452A (zh) * 2014-12-01 2016-06-29 金蝶软件(中国)有限公司 数据查询方法和***
CN107169129A (zh) * 2017-06-06 2017-09-15 山东浪潮通软信息科技有限公司 一种调度方法和装置
CN107316124A (zh) * 2017-05-10 2017-11-03 中国航天***科学与工程研究院 大数据环境下大规模事务型作业调度与处理通用平台
CN107545351A (zh) * 2016-06-29 2018-01-05 阿里巴巴集团控股有限公司 任务分配方法和装置
CN104994524B (zh) * 2015-06-19 2018-09-07 海南电信规划设计院有限公司 一种基于lte-a网络的协作调节方法
CN108536528A (zh) * 2018-03-23 2018-09-14 湖南大学 应用感知的大规模网格作业调度方法
CN108646694A (zh) * 2018-07-12 2018-10-12 大族激光科技产业集团股份有限公司 数控机床的智能管理方法、装置、***和计算机设备
CN109684063A (zh) * 2018-12-26 2019-04-26 亚信科技(中国)有限公司 一种任务调度方法和装置
CN110058967A (zh) * 2019-03-14 2019-07-26 郑州轻工业学院 一种基于星型拓扑结构的多计算机协作***及协作方法
CN110362279A (zh) * 2019-08-08 2019-10-22 西安中飞航空测试技术发展有限公司 基于机载高速总线的数据实时处理与存储***
CN111552569A (zh) * 2020-04-28 2020-08-18 咪咕文化科技有限公司 ***资源调度方法、装置及存储介质
CN112000478A (zh) * 2020-08-24 2020-11-27 中国银行股份有限公司 作业运行资源分配方法及装置
CN112001426A (zh) * 2020-08-03 2020-11-27 中国建设银行股份有限公司 计算机作业的自动运维方法、***、装置和存储介质
CN112162846A (zh) * 2020-11-27 2021-01-01 腾讯科技(深圳)有限公司 事务处理方法、设备及计算机可读存储介质
CN112306719A (zh) * 2020-11-23 2021-02-02 中国科学院计算机网络信息中心 一种任务调度方法与装置
CN112953993A (zh) * 2019-12-11 2021-06-11 阿里巴巴集团控股有限公司 资源调度方法、设备、网络***及存储介质
CN113283742A (zh) * 2021-05-21 2021-08-20 建信金融科技有限责任公司 一种任务分配方法和装置
CN113407343A (zh) * 2021-06-23 2021-09-17 中国工商银行股份有限公司 一种基于资源分配的业务处理方法、装置及设备
CN113947778A (zh) * 2021-10-12 2022-01-18 钧宏科技(北京)有限公司 一种基于档案文件数字化处理方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08286958A (ja) * 1995-04-13 1996-11-01 Hitachi Ltd ジョブスケジューリング解析方法
EP1569106A2 (en) * 2003-12-30 2005-08-31 IBM Corporation A scheduler supporting web service invocation
CN1845075A (zh) * 2006-05-11 2006-10-11 上海交通大学 面向服务的网格高性能计算作业调度方法
CN101098255A (zh) * 2007-05-25 2008-01-02 清华大学 交互式网格***中基于期权定价模型调度算法的实现
CN101105891A (zh) * 2007-07-27 2008-01-16 北京金冠鸿远科技有限公司 一种应用于电力***的gps车辆监控调度***

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08286958A (ja) * 1995-04-13 1996-11-01 Hitachi Ltd ジョブスケジューリング解析方法
EP1569106A2 (en) * 2003-12-30 2005-08-31 IBM Corporation A scheduler supporting web service invocation
CN1845075A (zh) * 2006-05-11 2006-10-11 上海交通大学 面向服务的网格高性能计算作业调度方法
CN101098255A (zh) * 2007-05-25 2008-01-02 清华大学 交互式网格***中基于期权定价模型调度算法的实现
CN101105891A (zh) * 2007-07-27 2008-01-16 北京金冠鸿远科技有限公司 一种应用于电力***的gps车辆监控调度***

Cited By (37)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103747085A (zh) * 2014-01-10 2014-04-23 浪潮电子信息产业股份有限公司 云计算操作***下一种存储资源调度算法
CN105022662B (zh) * 2014-04-22 2019-04-09 ***股份有限公司 一种分布式任务分配方法
CN105022662A (zh) * 2014-04-22 2015-11-04 ***股份有限公司 一种分布式任务分配方法
CN105511957A (zh) * 2014-09-25 2016-04-20 国际商业机器公司 用于生成作业告警的方法和***
US10705935B2 (en) 2014-09-25 2020-07-07 International Business Machines Corporation Generating job alert
CN105511957B (zh) * 2014-09-25 2019-05-07 国际商业机器公司 用于生成作业告警的方法和***
CN104391749A (zh) * 2014-11-26 2015-03-04 北京奇艺世纪科技有限公司 一种资源分配方法及装置
CN104391749B (zh) * 2014-11-26 2020-06-05 北京奇艺世纪科技有限公司 一种资源分配方法及装置
CN105718452A (zh) * 2014-12-01 2016-06-29 金蝶软件(中国)有限公司 数据查询方法和***
CN104503833A (zh) * 2014-12-22 2015-04-08 广州唯品会网络技术有限公司 任务调度优化方法及装置
CN104994524B (zh) * 2015-06-19 2018-09-07 海南电信规划设计院有限公司 一种基于lte-a网络的协作调节方法
CN107545351A (zh) * 2016-06-29 2018-01-05 阿里巴巴集团控股有限公司 任务分配方法和装置
CN107316124B (zh) * 2017-05-10 2018-08-31 中国航天***科学与工程研究院 大数据环境下大规模事务型作业调度与处理通用***
CN107316124A (zh) * 2017-05-10 2017-11-03 中国航天***科学与工程研究院 大数据环境下大规模事务型作业调度与处理通用平台
CN107169129A (zh) * 2017-06-06 2017-09-15 山东浪潮通软信息科技有限公司 一种调度方法和装置
CN107169129B (zh) * 2017-06-06 2020-07-14 浪潮通用软件有限公司 一种调度方法和装置
CN108536528A (zh) * 2018-03-23 2018-09-14 湖南大学 应用感知的大规模网格作业调度方法
CN108646694A (zh) * 2018-07-12 2018-10-12 大族激光科技产业集团股份有限公司 数控机床的智能管理方法、装置、***和计算机设备
CN109684063A (zh) * 2018-12-26 2019-04-26 亚信科技(中国)有限公司 一种任务调度方法和装置
CN109684063B (zh) * 2018-12-26 2021-03-26 亚信科技(中国)有限公司 一种任务调度方法和装置
CN110058967A (zh) * 2019-03-14 2019-07-26 郑州轻工业学院 一种基于星型拓扑结构的多计算机协作***及协作方法
CN110362279A (zh) * 2019-08-08 2019-10-22 西安中飞航空测试技术发展有限公司 基于机载高速总线的数据实时处理与存储***
CN110362279B (zh) * 2019-08-08 2024-02-09 西安中飞航空测试技术发展有限公司 基于机载高速总线的数据实时处理与存储***
CN112953993B (zh) * 2019-12-11 2023-09-26 阿里巴巴集团控股有限公司 资源调度方法、设备、网络***及存储介质
CN112953993A (zh) * 2019-12-11 2021-06-11 阿里巴巴集团控股有限公司 资源调度方法、设备、网络***及存储介质
CN111552569A (zh) * 2020-04-28 2020-08-18 咪咕文化科技有限公司 ***资源调度方法、装置及存储介质
CN111552569B (zh) * 2020-04-28 2023-10-20 咪咕文化科技有限公司 ***资源调度方法、装置及存储介质
CN112001426A (zh) * 2020-08-03 2020-11-27 中国建设银行股份有限公司 计算机作业的自动运维方法、***、装置和存储介质
CN112000478A (zh) * 2020-08-24 2020-11-27 中国银行股份有限公司 作业运行资源分配方法及装置
CN112000478B (zh) * 2020-08-24 2024-02-23 中国银行股份有限公司 作业运行资源分配方法及装置
CN112306719A (zh) * 2020-11-23 2021-02-02 中国科学院计算机网络信息中心 一种任务调度方法与装置
WO2022105337A1 (zh) * 2020-11-23 2022-05-27 中国科学院计算机网络信息中心 一种任务调度方法与***
CN112306719B (zh) * 2020-11-23 2022-05-31 中国科学院计算机网络信息中心 一种任务调度方法与装置
CN112162846A (zh) * 2020-11-27 2021-01-01 腾讯科技(深圳)有限公司 事务处理方法、设备及计算机可读存储介质
CN113283742A (zh) * 2021-05-21 2021-08-20 建信金融科技有限责任公司 一种任务分配方法和装置
CN113407343A (zh) * 2021-06-23 2021-09-17 中国工商银行股份有限公司 一种基于资源分配的业务处理方法、装置及设备
CN113947778A (zh) * 2021-10-12 2022-01-18 钧宏科技(北京)有限公司 一种基于档案文件数字化处理方法

Also Published As

Publication number Publication date
HK1185969A1 (zh) 2014-02-28
CN103324534B (zh) 2016-08-03

Similar Documents

Publication Publication Date Title
CN103324534A (zh) 作业调度方法及其调度器
CN104391737B (zh) 云平台中负载平衡的优化方法
US20200104375A1 (en) Data Migration Using Source Classification and Mapping
CN104462432B (zh) 自适应的分布式计算方法
CN104407926B (zh) 一种云计算资源的调度方法
CN110908641B (zh) 基于可视化的流计算平台、方法、设备和存储介质
Cheng et al. Heterogeneity-aware workload placement and migration in distributed sustainable datacenters
US11635799B2 (en) Nanosecond-scale power resource allocation method and system for microservices
CN102104496B (zh) 一种云计算环境下中间数据的容错性优化方法
US20160062880A1 (en) Methods and Systems for the Use of Synthetic Users To Performance Test Cloud Applications
US10642652B2 (en) Best trade-off point on an elbow curve for optimal resource provisioning and performance efficiency
CN104871154A (zh) ***级查询优化
CN105069134A (zh) 一种Oracle统计信息自动收集方法
CN103309946A (zh) 多媒体文件处理方法、装置及***
US10142195B1 (en) Partitioned performance tracking core resource consumption independently
US10148531B1 (en) Partitioned performance: adaptive predicted impact
WO2021093365A1 (zh) 一种gpu显存管理控制方法及相关装置
CN104572856A (zh) 一种服务起源数据的融合存储方法
CN101986661A (zh) 一种改进的虚拟机群下MapReduce数据处理方法
CN102761602A (zh) 一种基于Hadoop的海量数据实时分析处理方法
CN106649869A (zh) 数据库大数据的统计方法及装置
CN102520785A (zh) 一种云数据中心能耗管理方法及***
CN105022823A (zh) 一种基于数据挖掘的云服务性能预警事件生成方法
Paton et al. Autonomic query parallelization using non-dedicated computers: an evaluation of adaptivity options
US20210263718A1 (en) Generating predictive metrics for virtualized deployments

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 1185969

Country of ref document: HK

C14 Grant of patent or utility model
GR01 Patent grant
REG Reference to a national code

Ref country code: HK

Ref legal event code: GR

Ref document number: 1185969

Country of ref document: HK