CN102073546B - 一种云计算环境中分布式计算模式下的任务动态调度方法 - Google Patents

一种云计算环境中分布式计算模式下的任务动态调度方法 Download PDF

Info

Publication number
CN102073546B
CN102073546B CN 201010583597 CN201010583597A CN102073546B CN 102073546 B CN102073546 B CN 102073546B CN 201010583597 CN201010583597 CN 201010583597 CN 201010583597 A CN201010583597 A CN 201010583597A CN 102073546 B CN102073546 B CN 102073546B
Authority
CN
China
Prior art keywords
task
node
computing
main controlled
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN 201010583597
Other languages
English (en)
Other versions
CN102073546A (zh
Inventor
肖利民
毛宏
祝明发
阮利
胡声秋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
SHANGHAI JUNESH INFORMATION TECHNOLOGY CO., LTD.
Original Assignee
Beihang University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beihang University filed Critical Beihang University
Priority to CN 201010583597 priority Critical patent/CN102073546B/zh
Publication of CN102073546A publication Critical patent/CN102073546A/zh
Application granted granted Critical
Publication of CN102073546B publication Critical patent/CN102073546B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Multi Processors (AREA)

Abstract

一种云计算环境中分布式计算模式下的任务动态调度方法,该方法有四大步骤:步骤一、主节点接收子节点的心跳信息并加以分析;步骤二、主节点根据节点状态表和任务状态表预分配任务;步骤三、子节点向主节点索取任务;步骤四、主节点为子节点分配任务。本发明首先考虑任务的资源需求及节点的性能信息,在满足需求的情况下对任务的分配进行动态控制,从而提高作业的响应速度和节点的资源使用率。它在云计算环境下的分布式计算技术领域里具有广泛地实用价值和应用前景。

Description

一种云计算环境中分布式计算模式下的任务动态调度方法
(一)技术领域
本发明涉及一种分布式计算模型的任务调度方法。具体涉及到一种云计算环境中分布式计算模式下的任务动态调度方法。它是一种任务调度子***中任务的基于节点性能的动态调度方法,属于计算机技术领域。
(二)背景技术
目前,随着网络应用的飞速发展使得对计算能力的需求不断增加,伴随着网格计算、并行计算、分布式计算的发展,云计算应运而生,被列为国家未来重点发展的技术方向,并成为了当今计算机研究界和工业界的热点研究课题。随着云计算的流行,越来越多的网络(Web)服务和商业应用被部署到云计算环境中,对于云环境中处理应用层计算请求的分布式节点来说,如何通过任务的调度以高效处理上层计算请求,提高性能上异构的分布式节点的资源的使用率,并提升作业的响应速度成为当前云计算领域的研究热点。
在对云环境中的海量数据进行处理时,以分布式存储和分布式并行处理为基础的任务调度是关键步骤之一。改进作业和任务的调度方法是目前的研究热点,国内外研究主要包括多作业并行运行时作业之间的调度、单作业运行时子任务的调度和并行运行的子任务数量的最优化等方面。
在作业的调度方面,当前的最基本的调度方式为先进先出的作业调度方法,毋庸置疑,这种作业处理方法有很多弊端,尤其是在作业数量较多时,整体响应时间很长。公平调度器(Fair scheduler)的提出较好的解决了这个问题,当单独一个作业在运行时,它将使用整个集群。当有其它作业被提交时,***会将任务空闲时间片赋给这些新的作业,以使得每一个作业都大概获取到等量的CPU时间,并且使小任务得到快速响应的同时保证大任务的服务水平。容量调度器(Capacity scheduler)则支持多队列,作业提交后进入一个队列,资源按队列分配,每个队列中的作业使用该队列的资源;在一个队列中,高优先级的作业可以先于低优先级的作业使用资源;但一旦一个作业开始执行,它就不会被更高优先级的作业抢占;为防止一个或多个用户垄断所有资源,强制为每个队列分配一定比例的资源。中国科学院计算技术研究所提出的基于MR-Predict的三队列调度器根据CPU和I/O使用率将工作负载分成3类,能够在不同类型的工作负载环境下同时提高CPU和I/O资源的使用率。
在任务调度上,加州伯克利大学的研究人员提出的LATE(Longest ApproximateTime to End)调度算法则聚焦于对作业中的备份任务的调度的优化。通过推测完成任务所需要的时间,确保只在速度快的节点上执行估计最晚完成的任务的备份任务。普渡大学的研究人员提出了基于历史统计数据的任务数量最优化配置方法,其研究主要关注在执行作业时,云环境中每个节点上同时运行的任务的数目对性能的影响,根据历史统计数据,获取最优化配置并应用于新的同类作业。
然而,在大多数情况下,不同节点的性能各异,不同时刻各节点的负载状况也不同,如何根据节点的性能异构性及动态负债状况确定任务的动态分配策略,对于高效处理计算任务并提高分布式节点的资源使用率、提升作业的响应速度有重要意义。
(三)发明内容
1、目的:
本发明的主要目的是提供一种云计算环境中分布式计算模式下的任务动态调度方法,它首先考虑任务的资源需求及节点的性能信息,在满足需求的情况下对任务的分配进行动态控制,从而提高作业的响应速度和节点的资源使用率。
为实现上述目的,本发明提出了云计算环境中分布式计算模式下基于节点性能和任务执行状况的任务的动态调度方法,云计算环境下分布式计算节点的组成结构如图1所示,主要包括一个主控节点(主节点)和多个计算节点(子节点),计算节点既可以是物理机,也可以是虚拟机,对主控节点透明,节点间通过网络互联。主控节点与计算节点通过远程过程调用(RPC)方式交互。主控节点主要负责接收计算节点的心跳信息,并加以分析和反馈以控制任务的调度和执行;计算节点除了执行任务以外,还主要负责收集本节点的性能信息和任务执行信息并发送给主控节点。
2、技术方案:
本发明的技术方案是这样的:
本发明一种云计算环境中分布式计算模式下的任务动态调度方法,具体流程如图2所示,该方法包括以下步骤:
步骤201.计算节点动态收集本节点的性能信息及任务执行信息,以心跳信息的形式报告给主控节点。
步骤202.主控节点接收并分析各计算节点的心跳信息,创建并不断更新节点状态表和任务状态表。根据节点状态表和任务状态表,主控节点为计算节点预分配任务,更新节点预取表和任务预分表。
步骤203.如果计算节点中有空的任务槽(task slot)可用,则在下次的心跳信息中加入向主控节点请求任务的标志。
步骤204.主控节点接收到计算节点的任务请求后,按调度策略为其分配任务,并更新节点预取表和任务预分表。
其中,步骤201所述的节点性能信息和任务执行信息是主控节点更新节点状态表和任务状态表的重要数据来源。节点性能信息可包括CPU主频、内存大小、CPU使用率、内存使用率、I/O资源使用率等。任务执行信息包括刚结束的任务执行信息和正在进行中的任务执行信息;刚结束的任务执行信息包括任务的TaskID、所在作业的JobID、用于IO的时间(复制处理数据)和用于CPU计算的时间,其中,复制处理数据发生在该计算节点没有此任务的输入数据的情况下发生;正在进行中的任务执行信息包括任务的TaskID、所在作业的JobID、任务的执行进度和已执行时间。每个计算节点每隔一段时间收集本节点的这两种信息,并封装为心跳信息发送给主控节点。
其中,步骤202中所述的节点状态表和任务状态表是主控节点制定任务分配方案的重要参考信息。节点状态表描述了近一段时期内各计算节点的性能状态,任务状态表记录了各计算节点在近一段时期内处理任务的情况。主控节点第一次接收到计算节点的心跳信息后,创建节点状态表和任务状态表并在以后每次接收到计算节点的心跳信息后更新这两个表。节点状态表包括NodeName、CPU_Speed、MemSize、CPU_Usage、Mem_Usage、IO_Usage这些字段;任务状态表包括JobID、TaskID、NodeName、Time_IO、Time_CPU、Progress、PastTime这些字段。节点预取表和任务预分表记录着当前集群中任务的预分配信息。节点预取表记录了主控节点为计算节点预先分配任务的信息,节点预取表包括NodeName、preFetched、preFetchedTaskID这些字段。任务预分表记录了主控节点将任务预先分配给计算节点的信息,任务预分表包括TaskID、preScheduled、preScheduledNodeName这些字段。
其中,步骤203所述的计算节点的任务槽的大小是指计算节点同一时刻能并行执行的最大任务数,任务槽的大小在分布式节点集群启动前配置好。计算节点只有在有空的任务槽的时候才向主控节点申请任务,任务的申请通过心跳信息传递,心跳信息中包含申请任务的标志位,如果为真则表明该计算节点有空的任务槽,主控节点可以将任务分配给该计算节点执行。
其中,步骤204所述的主控节点为申请任务的计算节点分配任务执行是通过分布式调度算法决定的。分布式调度算法在主控节点的调度器中实现,同一时刻可能有多个计算节点同时申请任务执行,调度器通过读取节点状态表、任务状态表、节点预取表和任务预分表,并结合剩余任务队列,根据分布式调度算法确定为计算节点分配任务的优先次序及任务个数,然后更新节点预取表和任务预分表。
3、优点及功效:本发明一种云计算环境中分布式计算模式下的任务动态调度方法,它与现有技术此,其主要优点是:(1)通过分析计算节点的性能动态变化和历史任务执行信息,使得主控节点对任务的分配更合理,更能充分发挥性能较好的计算节点的性能优势,而原有的任务调度方法都没有考虑各计算节点在性能上的动态变化性;(2)改变了典型的分布式计算模型(如MapReduce)中只要计算节点向主控节点申请任务即可获得任务执行的惯例,而为主控节点赋予了选择计算节点去执行任务的权利,这样就避免了性能较差的计算节点带来的瓶颈问题。
(四)附图说明
图1本发明的云计算环境中分布式计算节点的组成结构示意图
图2云环境中基于分布式节点性能和任务执行状况的任务分布式调度流程示意图
图3本发明包括的三个阶段(初始化、信息更新和任务调度)的交互结构图
图4本发明包括的三个阶段的详细流程图
图5本发明信息更新模块流程示意图
图6本发明任务调度模块流程示意图
图中符号说明如下:
201-204步骤序号;501-505步骤序号;601-604步骤序号;
(五)具体实施方式
为使本发明的目的、技术方案和优点表达得更加清楚明白,下面结合附图及具体实施例对本发明再作进一步详细的说明。
本发明所需满足的设备环境条件见图1,云环境中分布式计算节点的组成结构主要包括一个主控节点(主节点)和多个计算节点(子节点),计算节点既可以是物理机,也可以是虚拟机,对主控节点透明,节点间通过网络互联。主控节点与计算节点通过远程过程调用(RPC)方式交互。主控节点主要负责接收计算节点的心跳信息,并加以分析和反馈以控制任务的调度和执行;其中,节点分析器用于接收和分析计算节点的性能信息,更新节点状态表,任务分析器用于接收和分析计算节点的任务信息,更新任务状态表。计算节点除了执行任务以外,还主要负责收集本节点的性能信息和任务执行信息并发送给主控节点;其中,节点性能监控器负责收集节点最近一段时间的性能信息,任务监控器负责收集节点最近一段时间执行任务的记录信息。
本发明在软件条件方面,要求各节点采用Linux操作***,安装有Java开发工具包1.6及以上版本。
本发明在环境条件方面,要求各节点能够通过ssh无密码互相访问。
基于节点性能和任务执行状况的任务动态调度流程见图2,主要包括两个内容:(1)计算节点收集封装本节点的心跳信息并发送给主控节点,主控节点根据接收到的心跳信息建立和更新节点状态表和任务状态表;(2)主控节点在接收到计算节点的任务请求后,根据调度算法为计算节点分配任务并更新节点预取表和任务预分表。
该方法包括三个阶段:初始化、信息更新和任务调度。其交互结构如图3所示。在初始化阶段,主控节点接收作业,并建立节点状态表和任务状态表;在信息更新阶段,主控节点接收计算节点的心跳信息并更新节点状态表、任务状态表、节点预取表和任务预分表,若计算节点请求任务,则进入任务调度阶段;在任务调度阶段,主控节点根据节点信息和任务信息为计算节点分配任务,结束后返回信息更新阶段等待计算节点的心跳信息。
下面以一实例进行说明,如图4所示,本发明所述的方法包括以下步骤:
步骤401:计算节点上的节点性能监控器收集本节点的性能信息,任务监控器收集本节点的任务执行信息,再封装成心跳信息,发送给主控节点。信息收集和心跳信息发送的周期为3秒。
步骤402:主控节点接收并分析各计算节点的心跳信息,如果是第一次收到心跳信息,则创建节点状态表和任务状态表,如果已创建,则每收到一个心跳信息就更新节点状态表和任务状态表。主控节点根据节点状态表和任务状态表,为计算节点预分配任务,更新节点预取表和任务预分表。具体如图5的信息更新模块所示。
步骤403:计算节点若有空的任务槽(task slot)可用,则在下次的心跳信息中加入向主控节点请求任务的标志。
步骤404:主控节点接收到计算节点的任务请求后,按调度策略为其分配任务。具体如图6的任务调度模块所示。
信息更新模块的详细流程如图5所示,
步骤501:主控节点监听计算节点的RPC访问,接收计算节点发送的心跳信息。主控节点同一时刻只能接收一个计算节点的心跳信息,如果主控节点在接收某个计算节点的心跳信息时,有其他计算节点也向主控节点发送心跳信息,则主控节点将较晚心跳的计算节点加入等待队列。计算节点上的节点性能监控器监控并收集本节点最近一段时间内的性能信息,任务监控器监控本节点上正在执行的任务的信息并收集已执行的最近的3个历史任务的记录,计算节点将性能信息和任务信息封装为心跳信息。如果最近一段时间内的任务信息没有更新,心跳信息中也可以只包含节点的性能信息。计算节点每隔一段时间将心跳信息通过RPC方式发送给主控节点。心跳周期为3秒。每次心跳时,心跳信息中都应包含节点的性能信息和当前正在执行的任务的信息,而计算节点每执行完一个任务,都在下一次心跳时将刚结束的任务的执行记录加入心跳信息发送给主控节点,即任务信息中包含两类任务信息:已完成但未上报的任务信息(可能为空)和正在进行中的任务信息。
步骤502:主控节点根据接收到的心跳信息,更新节点状态表和任务状态表。对于节点状态表,将心跳信息中的计算节点状态信息覆盖主控节点中节点状态表对应于该计算节点的信息。任务状态表中记录着每个节点上执行的最近3个历史任务的信息和正在进行中的任务信息,主控节点每次收到新的任务状态信息时,首先看是否有已完成但未上报的任务信息,如果有,则获得该任务的TaskID并查看该任务在任务状态表中是否已存在,若存在则更新任务状态表中该任务的信息,否则删除任务状态表中该计算节点的最旧的任务信息并加入该已完成的任务信息。对于正在进行中的任务信息,获得该任务的TaskID,如果该任务在任务状态表中已存在,则更新任务状态表中该任务的信息,否则,在任务状态表中加入该任务的信息。
步骤503:根据节点状态表和任务状态表更新节点预取表和任务预分表。对于任务列表中的第m个任务,根据节点状态表和任务状态表,预测每个节点执行该任务所需的时间,预测算法如下:
T i j i = Σ j - h j - 1 ( t s + t io + t cpu ) h , i = 1,2 . . . . . . n - - - ( 1 )
其中,Tij为第i个计算节点执行其第ji个任务所需的预测时间,ts为出现可用任务槽的时间,ti0为复制数据所需的时间,tcpu为数据处理时间,h为计算节点已经成功执行的任务的参考数目,n为集群中的计算节点数。
获得Tij的值后,主控节点选择最小的一个,向其对应的计算节点预分配任务。并将任务m标记为已预分,将即将执行该任务的计算节点标记为已预取。
接着,主控节点继续在未被标记为已预取的各计算节点中为下一个没有标记为已预分的任务选择执行它的计算节点。每次只预分num个任务,其中num=5。预分完毕后,任务队列里可能还有未被标记为已预分的任务,节点列表中也可能会有未被标记为已预取的节点。
步骤504:如果计算节点在心跳信息中将请求任务字段标记为真,则进入任务调度模块。
任务调度模块的详细流程如图6所示:
步骤601:主控节点首先通过查找节点预取表判断是否已为该节点预先分配任务,如果已预先分配,则为该节点分配已预分的任务,并标记该任务已分配,标记该节点为未预取。
步骤602:如果主控节点没有为该节点预先分配任务,根据步骤503中所述的预测算法,未被标记为已预取的节点是性能较差或计算能力较弱的节点,则从任务队列中选取一个任务给该节点执行,但是并不将该任务标记为已分配,待下次预分时,该任务将被预分给处理速度较快的节点,因而该任务将有一个备份任务在快节点上执行以保证其顺利执行。
步骤603:为计算节点分配任务结束后,主控节点更新节点预取表和任务预分表。
步骤604:任务调度阶段结束,转入信息更新阶段,主控节点继续接收并处理计算节点发送过来的心跳信息。
最后所应说明的是:以上实施例仅用以说明而非限制本发明的技术方案,尽管参照上述实施例对本发明进行了详细说明,本领域的普通技术人员应当理解:依然可以对本发明进行修改或者等同替换,而不脱离本发明的精神和范围的任何修改或局部替换,其均应涵盖在本发明的权利要求范围当中。

Claims (1)

1.一种云计算环境中分布式计算模式下的任务动态调度方法,通过动态获取并分析任务的资源需求及节点的性能信息和历史任务执行信息,在满足需求的情况下对任务的分配进行动态控制,从而提高作业的响应速度和节点的资源使用率,其特征在于:该方法包括以下步骤:
步骤一:计算节点动态收集本节点的性能信息及任务执行信息,以心跳信息的形式报告给主控节点;主控节点接收并分析各计算节点的心跳信息,生成节点状态表和任务状态表;
步骤二:主控节点根据节点状态表和任务状态表,为计算节点预分配任务,更新节点预取表和任务预分表;
步骤三:如果计算节点中有空的任务槽即task slot可用,则在下次的心跳信息中加入向主控节点请求任务的标志;
步骤四:主控节点接收到计算节点的任务请求后,按调度策略为其分配任务;
其中;步骤一所述的节点性能信息和任务执行信息是主控节点更新节点状态表和任务状态表的重要数据来源;节点性能信息包括CPU主频、内存大小、CPU使用率、内存使用率和I/O资源使用率;任务执行信息包括刚结束的任务执行信息和正在进行中的任务执行信息;刚结束的任务执行信息包括任务的TaskID、所在作业的JobID、用于IO的时间即复制处理数据和用于CPU计算的时间,其中,复制处理数据发生在该计算节点没有此任务的输入数据的情况下发生;正在进行中的任务执行信息包括任务的TaskID、所在作业的JobID、任务的执行进度和已执行时间;每个计算节点每隔一段时间收集本节点的这两种信息,并封装为心跳信息发送给主控节点;
其中;步骤二所述的节点状态表和任务状态表是主控节点制定任务分配方案的重要参考信息;节点状态表描述了近一段时期内各计算节点的性能状态,任务状态表记录了各计算节点在近一段时期内处理任务的情况;主控节点第一次接收到计算节点的心跳信息后,创建节点状态表和任务状态表并在以后每次接收到计算节点的心跳信息后更新这两个表;节点状态表包括NodeName、CPU_Speed、MemSize、CPU_Usage、Mem_Usage、IO_Usage这些字段;任务状态表包括JobID、TaskID、NodeName、Time_IO、Time_CPU、Progress、PastTime这些字段;节点预取表记录了主控节点为计算节点预先分配任务的信息,节点预取表包括NodeName、preFetched、preFetchedTaskID这些字段;任务预分表记录了主控节点将任务预先分配给计算节点的信息,任务预分表包括TaskID、preScheduled、preScheduledNodeName这些字段;具体实现过程如下:
1)主控节点监听计算节点的RPC访问,接收计算节点发送的心跳信息;主控节点同一时刻只能接收一个计算节点的心跳信息,如果主控节点在接收某个计算节点的心跳信息时,有其他计算节点也向主控节点发送心跳信息,则主控节点将较晚心跳的计算节点加入等待队列;计算节点上的节点性能监控器监控并收集本节点最近一段时间内的性能信息,任务监控器监控本节点上正在执行的任务的信息并收集已执行的最近的3个历史任务的记录,计算节点将性能信息和任务信息封装为心跳信息;如果最近一段时间内的任务信息没有更新,心跳信息中只包含节点的性能信息;计算节点每隔一段时间将心跳信息通过RPC方式发送给主控节点;心跳周期为3秒,每次心跳时,心跳信息中都应包含节点的性能信息和当前正在执行的任务的信息,而计算节点每执行完一个任务,都在下一次心跳时将刚结束的任务的执行记录加入心跳信息发送给主控节点,即任务信息中包含两类任务信息:已完成但未上报的任务信息和正在进行中的任务信息;
2)主控节点根据接收到的心跳信息,更新节点状态表和任务状态表;对于节点状态表,将心跳信息中的计算节点状态信息覆盖主控节点中节点状态表对应于该计算节点的信息;任务状态表中记录着每个节点上执行的最近3个历史任务的信息和正在进行中的任务信息,主控节点每次收到新的任务状态信息时,首先看是否有已完成但未上报的任务信息,如果有,则获得该任务的TaskID并查看该任务在任务状态表中是否已存在,若存在则更新任务状态表中该任务的信息,否则删除任务状态表中该计算节点的最旧的任务信息并加入该已完成的任务信息;对于正在进行中的任务信息,获得该任务的TaskID,如果该任务在任务状态表中已存在,则更新任务状态表中该任务的信息,否则,在任务状态表中加入该任务的信息;
3)根据节点状态表和任务状态表更新节点预取表和任务预分表;对于任务列表中的第m个任务,根据节点状态表和任务状态表,预测每个节点执行该任务所需的时间,预测算法如下:
T ij i = Σ j - h j - 1 ( t s + t io + t cpu ) h , i = 1,2 . . . . . . n - - - ( 1 )
其中,Tiji为第i个计算节点执行其第j个任务所需的预测时间,ts为出现可用任务槽的时间,tio为复制数据所需的时间,tcpu为数据处理时间,h为计算节点已经成功执行的任务的参考数目,n为集群中的计算节点数;
获得Tiji的值后,主控节点选择最小的一个,向其对应的计算节点预分配任务,并将任务m标记为已预分,将即将执行该任务的计算节点标记为已预取;
接着,主控节点继续在未被标记为已预取的各计算节点中为下一个没有标记为已预分的任务选择执行它的计算节点,每次只预分num个任务,其中num=5;
4)如果计算节点在心跳信息中将请求任务字段标记为真,则进入任务调度模块;
其中;步骤三所述的计算节点的任务槽,其大小是指计算节点同一时刻能并行执行的最大任务数,任务槽的大小在分布式节点集群启动前配置好;计算节点只有在有空的任务槽的时候才向主控节点申请任务,任务的申请通过心跳信息传递,心跳信息中包含申请任务的标志位,如果为真则表明该计算节点有空的任务槽,主控节点将任务分配给该计算节点执行;
其中;步骤四所述的主控节点为申请任务的计算节点分配任务执行是通过分布式调度算法决定的;分布式调度算法在主控节点的调度器中实现,同一时刻有多个计算节点同时申请任务执行,调度器通过读取节点状态表、任务状态表、节点预取表和任务预分表,并结合剩余任务队列,根据分布式调度算法确定为计算节点分配任务的优先次序及任务个数,然后更新节点预取表和任务预分表;具体实现过程如下:
1)主控节点首先通过查找节点预取表判断是否已为该节点预先分配任务,如果已预先分配,则为该节点分配已预分的任务,并标记该任务已分配,标记该节点为未预取;
2)如果主控节点没有为该节点预先分配任务,根据步骤二中所述的预测算法公式(1),未被标记为已预取的节点是性能较差或计算能力较弱的节点,则从任务队列中选取一个任务给该节点执行,但是并不将该任务标记为已分配,待下次预分时,该任务将被预分给处理速度较快的节点,因而该任务将有一个备份任务在快节点上执行以保证其顺利执行;
3)为计算节点分配任务结束后,主控节点更新节点预取表和任务预分表;
4)任务调度阶段结束,转入信息更新阶段,主控节点继续接收并处理计算节点发送过来的心跳信息。
CN 201010583597 2010-12-13 2010-12-13 一种云计算环境中分布式计算模式下的任务动态调度方法 Expired - Fee Related CN102073546B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN 201010583597 CN102073546B (zh) 2010-12-13 2010-12-13 一种云计算环境中分布式计算模式下的任务动态调度方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN 201010583597 CN102073546B (zh) 2010-12-13 2010-12-13 一种云计算环境中分布式计算模式下的任务动态调度方法

Publications (2)

Publication Number Publication Date
CN102073546A CN102073546A (zh) 2011-05-25
CN102073546B true CN102073546B (zh) 2013-07-10

Family

ID=44032092

Family Applications (1)

Application Number Title Priority Date Filing Date
CN 201010583597 Expired - Fee Related CN102073546B (zh) 2010-12-13 2010-12-13 一种云计算环境中分布式计算模式下的任务动态调度方法

Country Status (1)

Country Link
CN (1) CN102073546B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10257033B2 (en) 2017-04-12 2019-04-09 Cisco Technology, Inc. Virtualized network functions and service chaining in serverless computing infrastructure

Families Citing this family (113)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102843248B (zh) * 2011-06-21 2018-02-02 中兴通讯股份有限公司 自动单机分布式部署软件的方法及装置
CN102209041B (zh) * 2011-07-13 2014-05-07 上海红神信息技术有限公司 一种调度方法、装置及***
CN102916992B (zh) * 2011-08-03 2016-12-28 世纪恒通科技股份有限公司 一种统一调度云计算远端资源的方法及***
CN102347989A (zh) * 2011-10-25 2012-02-08 百度在线网络技术(北京)有限公司 基于资源描述符号的数据配送方法及配送***
CN102360314A (zh) * 2011-10-28 2012-02-22 中国科学院计算技术研究所 一种数据中心资源管理***和方法
CN102404615A (zh) * 2011-11-29 2012-04-04 广东威创视讯科技股份有限公司 基于云计算的视频处理***
CN102495759A (zh) * 2011-12-08 2012-06-13 曙光信息产业(北京)有限公司 一种云计算环境中作业调度的方法
CN102541640B (zh) * 2011-12-28 2014-10-29 厦门市美亚柏科信息股份有限公司 一种集群gpu资源调度***和方法
CN103324533B (zh) * 2012-03-22 2016-12-28 华为技术有限公司 分布式数据处理方法、装置及***
CN103365713B (zh) * 2012-04-01 2017-06-20 华为技术有限公司 一种资源的调度和管理方法及装置
CN103377087B (zh) * 2012-04-27 2017-06-23 北大方正集团有限公司 一种数据任务处理方法、装置及***
CN103546509B (zh) * 2012-07-13 2018-05-29 天津米游科技有限公司 一种节约资源的云服务***及资源节约方法
CN103546510B (zh) * 2012-07-13 2018-08-28 天津米游科技有限公司 基于云服务的管理***及管理方法
CN102866918B (zh) * 2012-07-26 2016-02-24 中国科学院信息工程研究所 面向分布式编程框架的资源管理***
CN103713942B (zh) * 2012-09-28 2018-01-05 腾讯科技(深圳)有限公司 在集群中调度运行分布式计算框架的方法和***
CN103036946B (zh) * 2012-11-21 2016-08-24 中国电信股份有限公司 一种用于云平台处理文件备份任务的方法和***
CN103092698B (zh) * 2012-12-24 2017-06-13 中国科学院深圳先进技术研究院 云计算应用自动部署***及方法
CN103064742B (zh) * 2012-12-25 2016-05-11 中国科学院深圳先进技术研究院 一种hadoop集群的自动部署***及方法
CN103001809B (zh) * 2012-12-25 2016-12-28 曙光信息产业(北京)有限公司 用于云存储***的服务节点状态监控方法
CN103095853B (zh) * 2013-02-27 2016-08-03 北京航空航天大学 云数据中心计算能力管理***
CN104077188A (zh) * 2013-03-29 2014-10-01 西门子公司 一种用于任务调度的方法和装置
CN103297499B (zh) * 2013-04-19 2017-02-08 无锡成电科大科技发展有限公司 一种基于云平台的调度方法及***
CN104123214B (zh) * 2013-04-26 2017-07-14 阿里巴巴集团控股有限公司 基于运行时数据的任务执行进度度量和展示的方法及***
CN104166589A (zh) * 2013-05-17 2014-11-26 阿里巴巴集团控股有限公司 一种心跳包的处理方法和装置
CN103309738B (zh) * 2013-05-31 2016-12-28 中国联合网络通信集团有限公司 用户作业调度方法及装置
CN103347055B (zh) * 2013-06-19 2016-04-20 北京奇虎科技有限公司 云计算平台中的任务处理***、设备及方法
CN103414771B (zh) * 2013-08-05 2017-02-15 国云科技股份有限公司 一种云计算环境下节点间长任务操作的监测方法
CN103500119B (zh) * 2013-09-06 2017-01-04 西安交通大学 一种基于预调度的任务分配方法
CN103617305A (zh) * 2013-10-22 2014-03-05 芜湖大学科技园发展有限公司 一种自适应的电力仿真云计算平台作业调度算法
WO2015061976A1 (en) * 2013-10-30 2015-05-07 Nokia Technologies Oy Methods and apparatus for task management in a mobile cloud computing environment
CN103593323A (zh) * 2013-11-07 2014-02-19 浪潮电子信息产业股份有限公司 一种MapReduce任务资源配置参数的机器学习方法
CN103761146B (zh) * 2014-01-06 2017-10-31 浪潮电子信息产业股份有限公司 一种MapReduce动态设定slots数量的方法
CN104268007A (zh) * 2014-01-07 2015-01-07 深圳市华傲数据技术有限公司 一种事件请求分布式调度方法和***
CN104917642B (zh) * 2014-03-11 2019-03-22 深圳业拓讯通信科技有限公司 一种端口镜像数据传输方法及其***
CN103941662A (zh) * 2014-03-19 2014-07-23 华存数据信息技术有限公司 一种基于云计算的任务调度***和调度方法
CN104102533B (zh) * 2014-06-17 2017-07-18 华中科技大学 一种基于带宽感知的Hadoop调度方法和***
CN105573824B (zh) * 2014-10-10 2020-04-03 腾讯科技(深圳)有限公司 分布式计算***的监控方法及***
CN104301423B (zh) * 2014-10-24 2018-11-06 北京奇安信科技有限公司 一种发送心跳报文的方法、装置及***
CN105578205A (zh) * 2014-10-27 2016-05-11 深圳国微技术有限公司 一种视频转码方法和***
CN104360909B (zh) * 2014-11-04 2017-10-03 无锡天脉聚源传媒科技有限公司 一种视频处理方法及装置
US9736243B2 (en) * 2014-12-12 2017-08-15 Microsoft Technology Licensing, Llc Multiple transaction logs in a distributed storage system
CN104461722B (zh) * 2014-12-16 2017-11-10 广东石油化工学院 一种用于云计算***的作业调度方法
CN104462581B (zh) * 2014-12-30 2018-03-06 成都因纳伟盛科技股份有限公司 基于微通道内存映射和Smart‑Slice的极速文件指纹提取***及方法
CN104503845B (zh) * 2015-01-14 2017-07-14 北京邮电大学 一种任务分发方法和***
CN106156631B (zh) * 2015-06-01 2019-03-12 上海红神信息技术有限公司 一种服务功能与结构表征对应关系不确定的软硬件装置
CN104933110B (zh) * 2015-06-03 2018-02-09 电子科技大学 一种基于MapReduce的数据预取方法
CN105227488B (zh) * 2015-08-25 2018-05-08 上海交通大学 一种用于分布式计算机平台的网络流组调度方法
CN105095008B (zh) * 2015-08-25 2018-04-17 国电南瑞科技股份有限公司 一种适用于集群***的分布式任务故障冗余方法
CN106484524A (zh) * 2015-08-28 2017-03-08 阿里巴巴集团控股有限公司 一种任务处理方法及装置
CN106528288A (zh) * 2015-09-10 2017-03-22 中兴通讯股份有限公司 一种资源管理方法、装置和***
CN106528189B (zh) * 2015-09-10 2019-05-28 阿里巴巴集团控股有限公司 一种启动备份任务的方法、装置及电子设备
CN106559648A (zh) * 2015-09-29 2017-04-05 鸿富锦精密工业(深圳)有限公司 行人侦测***及方法
CN105468726B (zh) * 2015-11-20 2019-02-01 广州视源电子科技股份有限公司 基于本地计算和分布式计算的数据计算方法及***
CN105516620A (zh) * 2015-12-10 2016-04-20 阔地教育科技有限公司 一种分配控制装置、图像处理装置和直录播互动***
US10503562B2 (en) * 2015-12-17 2019-12-10 Ab Initio Technology Llc Processing data using dynamic partitioning
CN105868008B (zh) * 2016-03-23 2019-05-28 深圳大学 基于关键资源和数据预处理的资源调度方法及识别***
CN105975334A (zh) * 2016-04-25 2016-09-28 深圳市永兴元科技有限公司 任务分布式调度方法及***
CN106027617A (zh) * 2016-05-11 2016-10-12 广东浪潮大数据研究有限公司 一种私有云环境下任务及资源动态调度的实现方法
CN107479963A (zh) * 2016-06-08 2017-12-15 国家计算机网络与信息安全管理中心 一种任务分配方法及***
CN107491265B (zh) * 2016-06-12 2021-05-25 杭州海康威视数字技术股份有限公司 分配网际协议ip磁盘的方法及装置
CN106055401B (zh) * 2016-06-13 2019-02-26 北京唯智佳辰科技发展有限责任公司 海量计算粗颗粒并行的自动启停及计算任务动态分配方法
CN106095586A (zh) * 2016-06-23 2016-11-09 东软集团股份有限公司 一种任务分配方法、装置及***
CN106293952B (zh) * 2016-07-11 2019-06-21 河南大学 一种基于任务需求与服务能力匹配的遥感任务调度方法
CN106375373A (zh) * 2016-08-24 2017-02-01 广西小草信息产业有限责任公司 一种基于动态云节点的任务分解方法和***
CN106354563B (zh) * 2016-08-29 2020-05-22 广州市香港科大***研究院 用于3d重建的分布式计算***以及3d重建方法
CN106371923A (zh) * 2016-08-30 2017-02-01 江苏国泰新点软件有限公司 任务处理方法和装置
CN107870813A (zh) * 2016-09-22 2018-04-03 中兴通讯股份有限公司 一种分布式算法处理数据的方法及装置
CN106452957B (zh) * 2016-09-30 2019-09-10 邦彦技术股份有限公司 心跳检测方法及节点***
CN107885594B (zh) * 2016-09-30 2020-06-12 腾讯科技(深圳)有限公司 分布式资源调度方法、调度节点及接入节点
CN108121599A (zh) * 2016-11-30 2018-06-05 杭州海康威视数字技术股份有限公司 一种资源管理方法、装置及***
CN106657328A (zh) * 2016-12-20 2017-05-10 上海创远仪器技术股份有限公司 一种基于云计算技术的无线通信信号分析测量***
CN106776034B (zh) * 2016-12-27 2020-07-31 国网浙江省电力公司电力科学研究院 一种任务批处理计算方法、主站计算机及***
CN106648900B (zh) * 2016-12-28 2020-12-08 深圳Tcl数字技术有限公司 基于智能电视的超算方法及***
CN107168779A (zh) * 2017-03-31 2017-09-15 咪咕互动娱乐有限公司 一种任务管理方法及***
US10884807B2 (en) 2017-04-12 2021-01-05 Cisco Technology, Inc. Serverless computing and task scheduling
CN107066338A (zh) * 2017-04-13 2017-08-18 中国人民解放军国防科学技术大学 分布式计算***的计算环境自动配置方法
US20180314971A1 (en) * 2017-04-26 2018-11-01 Midea Group Co., Ltd. Training Machine Learning Models On A Large-Scale Distributed System Using A Job Server
US10489195B2 (en) 2017-07-20 2019-11-26 Cisco Technology, Inc. FPGA acceleration for serverless computing
CN107580023B (zh) * 2017-08-04 2020-05-12 山东大学 一种动态调整任务分配的流处理作业调度方法及***
CN109408220A (zh) * 2017-08-17 2019-03-01 北京国双科技有限公司 一种任务处理方法及装置
CN107608773B (zh) * 2017-08-24 2020-08-04 阿里巴巴集团控股有限公司 任务并发处理方法、装置及计算设备
US10771584B2 (en) 2017-11-30 2020-09-08 Cisco Technology, Inc. Provisioning using pre-fetched data in serverless computing environments
CN109995824B (zh) * 2017-12-29 2022-10-04 阿里巴巴集团控股有限公司 一种对等网络中的任务调度方法及装置
CN108449215A (zh) * 2018-03-31 2018-08-24 甘肃万维信息技术有限责任公司 基于分布式服务器性能监控***
US10678444B2 (en) 2018-04-02 2020-06-09 Cisco Technology, Inc. Optimizing serverless computing using a distributed computing framework
CN108769254B (zh) * 2018-06-25 2019-09-20 星环信息科技(上海)有限公司 基于抢占式调度的资源共享使用方法、***及设备
CN108829504A (zh) * 2018-06-28 2018-11-16 泰康保险集团股份有限公司 一种任务调度方法、装置、介质和电子设备
CN110673945A (zh) * 2018-07-03 2020-01-10 北京京东尚科信息技术有限公司 分布式任务管理方法和管理***
CN109086894A (zh) * 2018-07-06 2018-12-25 西安热工研究院有限公司 一种面向区域发电公司的报警消息中心***
CN108958942A (zh) * 2018-07-18 2018-12-07 郑州云海信息技术有限公司 一种分布式***分配任务方法、调度器和计算机设备
CN109343942B (zh) * 2018-09-03 2020-11-03 北京邮电大学 基于边缘计算网络的任务调度方法
CN109246479A (zh) * 2018-10-09 2019-01-18 深圳市亿联智能有限公司 一种基于智能机顶盒的云计算控制方式
CN109450913A (zh) * 2018-11-27 2019-03-08 浪潮软件股份有限公司 一种基于策略的多节点注册调度方法
CN109614211A (zh) * 2018-11-28 2019-04-12 新华三技术有限公司合肥分公司 分布式任务预调度方法及装置
CN111352709A (zh) * 2018-12-20 2020-06-30 顺丰科技有限公司 分布式***中的任务调度方法和装置
CN109783214B (zh) * 2018-12-29 2021-06-22 广东电网有限责任公司广州供电局 任务调度控制***
CN109922050A (zh) * 2019-02-03 2019-06-21 普信恒业科技发展(北京)有限公司 一种任务检测方法及装置
CN109921926B (zh) * 2019-02-19 2022-06-21 重庆市勘测院 一种实景建模集群的自动控制方法及***
CN110109742B (zh) * 2019-05-09 2020-04-28 重庆八戒电子商务有限公司 一种基于zookeeper的分布式任务协调的方法及装置
CN110209488B (zh) 2019-06-10 2021-12-07 北京达佳互联信息技术有限公司 任务执行方法、装置、设备、***及存储介质
CN110297693B (zh) * 2019-07-04 2020-07-28 北京伟杰东博信息科技有限公司 一种分布式软件任务分配的方法及其***
CN110413389B (zh) * 2019-07-24 2021-09-28 浙江工业大学 一种资源不均衡Spark环境下的任务调度优化方法
CN110389822A (zh) * 2019-07-29 2019-10-29 北京金山云网络技术有限公司 执行任务的节点调度方法、装置和服务器
CN110389973B (zh) * 2019-07-30 2022-06-07 大连海事大学 一种异构分布式环境中的并行离群点检测方法
CN110728317A (zh) * 2019-09-30 2020-01-24 腾讯科技(深圳)有限公司 决策树模型的训练方法、***、存储介质及预测方法
CN110737521B (zh) * 2019-10-14 2021-03-05 中国人民解放军32039部队 基于任务调度中心的容灾方法和装置
CN113157403A (zh) * 2020-01-07 2021-07-23 中科寒武纪科技股份有限公司 作业处理的方法、装置、计算机设备及可读存储介质
CN111580945A (zh) * 2020-04-21 2020-08-25 智业互联(厦门)健康科技有限公司 微服务任务协调调度方法及***
CN112003898A (zh) * 2020-07-27 2020-11-27 珠海许继芝电网自动化有限公司 多节点集群的负载均衡方法及***
CN112131007B (zh) * 2020-09-28 2023-02-21 山东浪潮科学研究院有限公司 基于ai平台的gpu资源调度方法、装置及介质
CN113112139A (zh) * 2021-04-07 2021-07-13 上海联蔚盘云科技有限公司 云平台账单的处理方法和设备
CN116781703A (zh) * 2022-03-09 2023-09-19 中兴通讯股份有限公司 数据处理方法、装置、计算机设备及可读介质
CN114706671B (zh) * 2022-05-17 2022-08-12 中诚华隆计算机技术有限公司 一种多处理器调度优化方法与***

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101719931A (zh) * 2009-11-27 2010-06-02 南京邮电大学 一种基于多智能主体的层次式云端计算模型构建方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100287280A1 (en) * 2009-05-08 2010-11-11 Gal Sivan System and method for cloud computing based on multiple providers

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101719931A (zh) * 2009-11-27 2010-06-02 南京邮电大学 一种基于多智能主体的层次式云端计算模型构建方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
万至臻 等.基于MapReduce模型的并行计算平台的设计与实现.《中国优秀硕士学位论文全文数据库》.2008,
基于MapReduce模型的并行计算平台的设计与实现;万至臻 等;《中国优秀硕士学位论文全文数据库》;20081231;22-41 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10257033B2 (en) 2017-04-12 2019-04-09 Cisco Technology, Inc. Virtualized network functions and service chaining in serverless computing infrastructure

Also Published As

Publication number Publication date
CN102073546A (zh) 2011-05-25

Similar Documents

Publication Publication Date Title
CN102073546B (zh) 一种云计算环境中分布式计算模式下的任务动态调度方法
CN102063336B (zh) 一种分布式计算多应用功能异步并发调度方法
Mansouri et al. Combination of data replication and scheduling algorithm for improving data availability in Data Grids
CN114996018A (zh) 面向异构计算的资源调度方法、节点、***、设备及介质
Zhang et al. Meteor: Optimizing spark-on-yarn for short applications
CN115454649A (zh) 面向空间操控仿真模型计算的动态任务调度***
Henzinger et al. Scheduling large jobs by abstraction refinement
Goga et al. Performance analysis of WRF simulations in a public cloud and HPC environment
CN114490049A (zh) 在容器化边缘计算中自动分配资源的方法及***
Tang et al. A survey on scheduling techniques in computing and network convergence
Meyer et al. An opportunistic algorithm for scheduling workflows on grids
Luckow et al. Abstractions for loosely-coupled and ensemble-based simulations on Azure
Meddeber et al. Tasks assignment for Grid computing
Grushin et al. On effective scheduling in computing clusters
Mansouri et al. A novel job scheduling algorithm for improving data grid's performance
Wang et al. A survey of system scheduling for hpc and big data
Fernández-Cerero et al. Quality of cloud services determined by the dynamic management of scheduling models for complex heterogeneous workloads
Megino et al. PanDA: evolution and recent trends in LHC computing
Gunasekaran et al. Dynamic scheduling algorithm for reducing start time in Hadoop
Bakni et al. Survey on improving the performance of MapReduce in Hadoop
Wang et al. FedLoop: looping on federated MapReduce
Monisha et al. Heterogeneous map reduce scheduling using first order logic
Nakajima et al. Performance evaluation of omnirpc in a grid environment
Lin et al. Research on weighted rotation fair scheduling algorithm based on hama parallel computing framework
Jin et al. A super-programming technique for large sparse matrix multiplication on PC clusters

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
ASS Succession or assignment of patent right

Owner name: SHANGHAI SHICONG INFORMATION TECHNOLOGY CO., LTD.

Free format text: FORMER OWNER: BEIHANG UNIVERSITY

Effective date: 20150512

C41 Transfer of patent application or patent right or utility model
COR Change of bibliographic data

Free format text: CORRECT: ADDRESS; FROM: 100191 HAIDIAN, BEIJING TO: 201401 FENGXIAN, SHANGHAI

TR01 Transfer of patent right

Effective date of registration: 20150512

Address after: 201401 Shanghai Fengxian District City Ring Road No. 2200 building 2128 room

Patentee after: Shanghai Shi Cong network information technology Co., Ltd

Address before: 100191 Beijing City, Haidian District Xueyuan Road No. 37 North College of computer

Patentee before: Beihang University

C56 Change in the name or address of the patentee
CP03 Change of name, title or address

Address after: 200233 room 202-35, Guiping Road, Shanghai, Xuhui District, 92

Patentee after: SHANGHAI JUNESH INFORMATION TECHNOLOGY CO., LTD.

Address before: 201401 Shanghai Fengxian District City Ring Road No. 2200 building 2128 room

Patentee before: Shanghai Shi Cong network information technology Co., Ltd

DD01 Delivery of document by public notice

Addressee: SHANGHAI JUNESH INFORMATION TECHNOLOGY CO., LTD.

Document name: Notification to Pay the Fees

DD01 Delivery of document by public notice
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20130710

Termination date: 20181213

CF01 Termination of patent right due to non-payment of annual fee