CN105022662A - 一种分布式任务分配方法 - Google Patents

一种分布式任务分配方法 Download PDF

Info

Publication number
CN105022662A
CN105022662A CN201410162091.9A CN201410162091A CN105022662A CN 105022662 A CN105022662 A CN 105022662A CN 201410162091 A CN201410162091 A CN 201410162091A CN 105022662 A CN105022662 A CN 105022662A
Authority
CN
China
Prior art keywords
task
node
computing node
main control
space
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201410162091.9A
Other languages
English (en)
Other versions
CN105022662B (zh
Inventor
王骏
赵金涛
杨鸿超
邱雪涛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Unionpay Co Ltd
Original Assignee
China Unionpay Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Unionpay Co Ltd filed Critical China Unionpay Co Ltd
Priority to CN201410162091.9A priority Critical patent/CN105022662B/zh
Publication of CN105022662A publication Critical patent/CN105022662A/zh
Application granted granted Critical
Publication of CN105022662B publication Critical patent/CN105022662B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及分布式任务分配方法。该方法包括下述步骤:作业被初始化分解为多个任务,主控制节点为该任务建立任务运行状态表;将第一个任务分配给计算节点的同时,将与第一个任务相同的备份任务分配给预测节点;预测节点计算该备份任务所需要的磁盘空间并将计算结果反馈给主控制节点;主控制节点根据来自预测节点的计算结果更新任务运行状态表;在分配任务给计算节点之前时,主控制节点推测该计算节点的任务状态并且根据推测到的任务状态以及任务运行状态表估算任务可运行空间;在估算的任务可运行空间大于该任务运行所需空间的情况下,将该任务分配给该计算节点,否则重新选择计算节点。

Description

一种分布式任务分配方法
 
技术领域
本发明涉及一种分布式计算***中的任务分配方法,具体地涉及能够预防分布式任务计算时间延迟的优化方法。
 
背景技术
现有技术中,在分布式计算过程中,一个作业(job)通常会被分解成多个子任务,由主控制节点分配给多个计算节点进行并行计算。每一个计算子任务(task)在计算节点上运行时,是需要将中间数据写入本地的文件***的。通常情况下,多个子任务在同一个计算节点上运行的时候,可以分别通过不同的磁盘写入点往文件***写数据,这样来提高作业运行时磁盘的吞吐率。
如果某写入点所在的磁盘空间不够,这个任务会在文件写到一半时因为磁盘空间已满而被拒绝访问,从而导致这个任务运行失败。这时,该计算节点会在下一个心跳机制执行时向主控制节点反馈。主控制节点会把这个任务分配到新的空闲计算节点重新计算。但是,分配时通常会根据数据存储就近策略进行计算节点分配,这时,这个任务还是很有可能被分配到出错的计算节点上,极端的情况,这个新的任务又被分到同一个出错计算节点上,再次运行失败。这样,就会导致同一个子任务不断失败,又不断重复执行,这样会影响整个作业的执行效率。
严重时,还可能因为同一个子任务的多次失败而使主控制节点自发地判定作业执行失败。即使没有出现这种情况,整个作业的执行时间也被大大延迟。比如任务运行需一个小时,如果正好运行到五十九分钟的时候出现磁盘空间不足,这个任务将被重新执行,而这时整个作业也因为这个原因而延迟结束了将近一个小时,这是非常大的代价。
通常情况下,主控制节点在分配任务时只关注计算节点的计算资源使用情况(CPU、内存),而不关注计算节点的磁盘剩余空间,也不关注任务的磁盘使用量。这样,当某一些节点磁盘空间不足的情况下,就容易造成任务运行失败,进而导致整个作业的运行时间延迟。出现因磁盘空间不足而使整个作业运行时间延迟这种情况,是因为主控制节点在分配子任务给计算节点前,无法事先预知计算节点上的文件***是否有足够的磁盘空间来支撑该子任务生成的中间数据,同时主控制结点也无法判断子任务在计算过程中生成的中间数据的大小。
在现有技术中,对于上述问题,作为通常的解决办法有以下2种:
(1)清理磁盘空间,保证所有计算节点的磁盘空间都足够大。这种方法直接,但是工作量很大,耗费时间长,灵活性也不足。尤其在计算节点多的情况下,清理磁盘是一项很浩大的工作。
(2)在计算节点上设置一个配置值,当剩余磁盘空间小于这个配置值时,就不再接收任务。这样虽然可以一定程度上解决上述问题,但配置值是固定,无法因为不同任务的需求而进行动态调整,这样可能会造成计算资源的浪费。如果配置值太低,仍然会出现磁盘空间不足而任务失败;如果配置值过高,计算节点无法得到充分利用。
 
发明内容
鉴于上述问题,本发明旨在提供一种能够降低任务失败风险并且能够保证执行效率的分布式任务分配方法。
本发明的分布式任务分配方法,其特征在于,包括下述步骤:
初始化作业步骤,作业被初始化分解为多个任务,主控制节点为该任务建立任务运行状态表;
初次任务分配步骤,将第一个任务分配给计算节点的同时,将与第一个任务相同的备份任务分配给预测节点;
预测磁盘空间步骤,预测节点计算该备份任务所需要的磁盘空间并将计算结果反馈给主控制节点;
更新任务运行状态表步骤,主控制节点根据来自预测节点的所述计算结果更新所述任务运行状态表;
任务可运行空间预测步骤,在分配任务给计算节点之前时,主控制节点推测该计算节点的任务状态并且根据推测到的任务状态以及所述任务运行状态表估算任务可运行空间;以及
任务分配步骤,在所述估算的任务可运行空间大于该任务运行所需空间的情况下,将该任务分配给该计算节点,否则重新选择计算节点。
优选地,在所述任务分配步骤之后还具备:
计算节点监控步骤,计算节点定期遍历当前计算节点下的所有任务,如果剩余空间不足以保证某个任务执行,则该计算节点主动中止该任务并向主控制节点反馈。
优选地,所述任务可运行空间预测步骤包括下述子步骤:
在分配任务给计算节点之前时,主控制节点向该计算节点请求当前所有运行任务状态,所述运行任务状态至少包括总任务数、各任务执行状态、剩余磁盘空间;
主控制节点根据自身所维护的任务运行状态表,根据规定算法估算所述计算节点的任务可运行空间是否满足该任务;
如果任务可运行空间大于该任务实际所需空间,则将任务分配给该计算节点,否则,则重新选择任务计算节点。
优选地,所述规定算法为计算式(1),
计算式(1):任务可运行空间 = 剩余磁盘空间 – ∑所有正执行任务未写入文件量。
优选地,所述计算节点监控步骤包括下述子步骤:
计算节点定期遍历当前计算节点下的所有任务;
如果剩余空间不足以保证某个任务执行,则该计算节点主动中止该任务并向主控制节点反馈;
主控制节点根据该计算节点的反馈更新任务状态表,并寻找空闲的计算节点,并把当前中止的任务再次分配给新的计算节点。
优选地,所述任务状态表中包括作业ID、任务ID、任务类型、所在节点ID、所需磁盘空间。
优选地,在所述更新任务运行状态表步骤中,主控制节点根据来自预测节点的所述计算结果,对所述任务运行状态表进行相应的增加、删除、修改。
优选地,所述任务类型包括map任务和reduce任务。
优选地,所述预测节点对于一个作业而言,只运行一次map任务或reduce任务并且在把所述计算结果反馈给主控制节点之后不再接受该作业的其他同类型任务。
根据本发明,能够实现一种在分布式计算过程中能够降低由磁盘空间不足引起的运行时间延迟的优化方法。在本发明中,分别对任务分配前和任务运行时两个环节进行预测和监控,能够有效预防失败任务的产生,降低任务运行失败的风险,从而保证了整个作业的执行效率。
 
附图说明
图1是表示本发明的一个实施方式的分布式任务分配方法的流程示意图。
 
具体实施方式
下面介绍的是本发明的多个实施例中的一些,旨在提供对本发明的基本了解。并不旨在确认本发明的关键或决定性的要素或限定所要保护的范围。
一个分布式作业通常分为分片并行任务(map)和合并归约任务(reduce)两类任务,每类任务会分别起若干个相同的子任务。相同类型的子任务通常的输入数据分片大小(split)是相同的。例如,现在多集群分布式作业大多采用的都是Hadoop框架,在Hadoop框架里,分布式任务被分成先后两个阶段,map阶段和reduce阶段。所以相应的有两类子任务,map子任务(将数据分片)和reduce子任务(将分片数据归约),map阶段完成才能进入reduce阶段。相同类型的子任务的输入数据分片大小是一样的,计算过程是一样,因此,生成的中间结果的大小也近似相等。
本发明在现有的分布式计算***的计算方法上增加三个关键环节:主控制节点的推测进程、任务磁盘空间预测节点的磁盘空间预测、计算节点的监控进程。具体地,这三个环节的主要功能如下:
(1)主控制节点的推测进程
在主控制节点上维护着一张各个计算节点的任务运行状态表,这张任务运行状态表包含如下信息:
(i)正在运行的某个作业的map子任务数、以及每个map运行时所需的磁盘空间;
(ii)正在运行的某个作业的reduce子任务数、以及每个reduce运行时所需求的磁盘空间。
任务运行状态表结构如下表1所示:
表1
作业ID 任务ID 任务类型 所在节点ID 所需磁盘空间 运行进度
主控制节点会在分配一个任务给计算节点前,先根据任务运行状态表推测计算当前状态该计算节点的剩余磁盘容量,并比照该任务所需的空间大小,如果剩余空间不足以运行该任务,则重新选择计算节点。
(2)任务磁盘空间预测节点的磁盘空间预测
此预测节点和普通计算节点的差异在于,对于同一类任务,会优先运行。并且一旦运行完该任务,该节点则不再接收该作业的同一类型任务。
具体地,对于分布式任务,输入数据被分成多少个数据分片,就有多少个map子任务。Reduce子任务数由***决定,不由输入数据决定。
以map子任务为例,预测节点只接收一次map任务并把预测参数发给主控制节点,因为map子任务的预测参数几乎都一样,所以没必要再接收到同类型任务。同理对reduce任务也一样。当预测节点的任务执行结束时,它会将该任务所需的磁盘空间大小发送给主控制节点,由此保证该节点的磁盘空间足够。
这里,所谓的预测节点实际上与其他普通的计算节点没有本质上的区别,但是对于一个作业而言,预测节点只运行一次map任务或reduce任务,并把预测参数发给主控制节点,之后不再接收该作业的其他同类型作业,而其他计算节点可能会重复接收到该作业同类型任务。
(3)计算节点的监控进程
这个进程会在定期对当前计算节点上正在运行的所有任务进行遍历,如果磁盘剩余空间不足以支撑某个任务剩余中间文件的写入,计算节点就会立刻中止这个任务,并反馈主控制节点重新为该任务分配计算资源。这样减少失效任务的不必要运行时间。
图1是表示本发明的一个实施方式的分布式任务分配方法的流程示意图。
下面,参照图1对于本发明的一个实施方式的分布式任务分配方法进行说明。
本实施方式的分布式任务分配方法包括下述步骤:
步骤①:当一个新的作业被初始化分解为多个子任务,主控制节点为该作业新建一个任务运行状态表。该任务运行状态表如前面已经表述过的表1所示。
步骤②:将第一个任务分配给计算节点的同时,将与第一个任务相同的备份任务分配给预测节点。
步骤③:预测节点计算该备份任务所需要的磁盘空间并将计算结果反馈给主控制节点,主控制节点根据来自预测节点的所述计算结果更新所述任务运行状态表。其中,更新任务运行状态表是指,主控制节点根据来自预测节点的所述计算结果,对所述任务运行状态表进行相应的增加、删除、修改。
步骤④:在分配任务给计算节点之前时,主控制节点推测该计算节点的任务状态并且根据推测到的任务状态以及所述任务运行状态表估算任务可运行空间,在所述估算的任务可运行空间大于该任务运行所需空间的情况下,主控制节点将该任务分配给该计算节点,否则重新选择计算节点。
在此基础上,更优选地在步骤④之后还具有监控进程即下述的步骤⑤。
步骤⑤:计算节点定期遍历当前计算节点下的所有任务,如果剩余空间不足以保证某个任务执行,则该计算节点主动中止该任务并向主控制节点反馈。
其中,上述步骤④具体包括下述子步骤:
在分配任务给计算节点之前时,主控制节点向该计算节点请求当前所有运行任务状态,所述运行任务状态至少包括总任务数、各任务执行状态、剩余磁盘空间;
主控制节点根据自身所维护的任务运行状态表,根据规定算法估算所述计算节点的任务可运行空间是否满足该任务;
如果任务可运行空间大于该任务实际所需空间,则将任务分配给该计算节点,否则,则重新选择任务计算节点,
其中,所述规定算法为下述的计算式(1),
计算式(1):任务可运行空间 = 剩余磁盘空间 – ∑所有正执行任务未写入文件量。
进一步,其中上述的步骤⑤包括下述子步骤:
计算节点定期遍历当前计算节点下的所有任务;
如果剩余空间不足以保证某个任务执行,则该计算节点主动中止该任务并向主控制节点反馈;
主控制节点根据该计算节点的反馈更新任务状态表,并寻找空闲的计算节点,并把当前中止的任务再次分配给新的计算节点。
如上所述,在本发明中,通过在预测节点实施上述步骤③,即预测节点计算该备份任务所需要的磁盘空间并将计算结果反馈给主控制节点,主控制节点根据来自预测节点的所述计算结果更新所述任务运行状态表。这样,预测节点的任务执行结束时,会将该任务所需的磁盘空间大小发送给主控制节点,能够保证节点的磁盘空间足够。
而且,在本发明中,通过在主控制节点上实施上述步骤④,即在分配任务给计算节点之前时,主控制节点推测该计算节点的任务状态并且根据推测到的任务状态以及所述任务运行状态表估算任务可运行空间,仅在所述估算的任务可运行空间大于该任务运行所需空间的情况下,主控制节点将该任务分配给该计算节点,否则重新选择计算节点。由此,能够降低任务失败的风险,保证执行效率。
进一步,在本发明中,通过在计算节点上实施上述步骤⑤,即计算节点定期遍历当前计算节点下的所有任务,如果剩余空间不足以保证某个任务执行,则该计算节点主动中止该任务并向主控制节点反馈。这样,能够减少失效任务的不要的运行时间,能够预防分布式任务计算时间的延迟。
因此,基于以上内容,本发明提出了一种在分布式计算过程中能够降低由磁盘空间不足引起的运行时间延迟的优化方法。在本发明中,分别对任务分配前和任务运行时两个环节进行预测和监控,能够有效预防失败任务的产生,降低任务运行失败的风险,从而保证了整个作业的执行效率。本方法适合在集群中有大量作业同时运行的情况,它能根据计算节点的存储能力动态分配资源,提前规避任务失败风险,提升整个集群的运算效率。
以上例子主要说明了本发明的分布式任务分配方法。尽管只对其中一些本发明的具体实施方式进行了描述,但是本领域普通技术人员应当了解,本发明可以在不偏离其主旨与范围内以许多其他的形式实施。因此,所展示的例子与实施方式被视为示意性的而非限制性的,在不脱离如所附各权利要求所定义的本发明精神及范围的情况下,本发明可能涵盖各种的修改与替换。

Claims (9)

1.一种分布式任务分配方法,其特征在于,包括下述步骤:
初始化作业步骤,作业被初始化分解为多个任务,主控制节点为该任务建立任务运行状态表;
初次任务分配步骤,将第一个任务分配给计算节点的同时,将与第一个任务相同的备份任务分配给预测节点;
预测磁盘空间步骤,预测节点计算该备份任务所需要的磁盘空间并将计算结果反馈给主控制节点;
更新任务运行状态表步骤,主控制节点根据来自预测节点的所述计算结果更新所述任务运行状态表;
任务可运行空间预测步骤,在分配任务给计算节点之前时,主控制节点推测该计算节点的任务状态并且根据推测到的任务状态以及所述任务运行状态表估算任务可运行空间;以及
任务分配步骤,在所述估算的任务可运行空间大于该任务运行所需空间的情况下,将该任务分配给该计算节点,否则重新选择计算节点。
2.如权利要求1所述的分布式任务分配方法,其特征在于,
在所述任务分配步骤之后还具备:
计算节点监控步骤,计算节点定期遍历当前计算节点下的所有任务,如果剩余空间不足以保证某个任务执行,则该计算节点主动中止该任务并向主控制节点反馈。
3.如权利要求2所述的分布式任务分配方法,其特征在于,
所述任务可运行空间预测步骤包括下述子步骤:
在分配任务给计算节点之前时,主控制节点向该计算节点请求当前所有运行任务状态,所述运行任务状态至少包括总任务数、各任务执行状态、剩余磁盘空间;
主控制节点根据自身所维护的任务运行状态表,根据规定算法估算所述计算节点的任务可运行空间是否满足该任务;
如果任务可运行空间大于该任务实际所需空间,则将任务分配给该计算节点,否则,则重新选择任务计算节点。
4.如权利要求3所述的分布式任务分配方法,其特征在于,
所述规定算法为计算式(1),
计算式(1):任务可运行空间 = 剩余磁盘空间 – ∑所有正执行任务未写入文件量。
5.如权利要求2所述的分布式任务分配方法,其特征在于,
所述计算节点监控步骤包括下述子步骤:
计算节点定期遍历当前计算节点下的所有任务;
如果剩余空间不足以保证某个任务执行,则该计算节点主动中止该任务并向主控制节点反馈;
主控制节点根据该计算节点的反馈更新任务状态表,并寻找空闲的计算节点,并把当前中止的任务再次分配给新的计算节点。
6.如权利要求1~5所述的分布式任务分配方法,其特征在于,
所述任务状态表中包括作业ID、任务ID、任务类型、所在节点ID、所需磁盘空间。
7.如权利要求6所述的分布式任务分配方法,其特征在于,
在所述更新任务运行状态表步骤中,主控制节点根据来自预测节点的所述计算结果,对所述任务运行状态表进行相应的增加、删除、修改。
8.如权利要求6所述的分布式任务分配方法,其特征在于,
所述任务类型包括map任务和reduce任务。
9.如权利要求8所述的分布式任务分配方法,其特征在于,
所述预测节点对于一个作业而言,只运行一次map任务或reduce任务并且在把所述计算结果反馈给主控制节点之后不再接受该作业的其他同类型任务。
CN201410162091.9A 2014-04-22 2014-04-22 一种分布式任务分配方法 Active CN105022662B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410162091.9A CN105022662B (zh) 2014-04-22 2014-04-22 一种分布式任务分配方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410162091.9A CN105022662B (zh) 2014-04-22 2014-04-22 一种分布式任务分配方法

Publications (2)

Publication Number Publication Date
CN105022662A true CN105022662A (zh) 2015-11-04
CN105022662B CN105022662B (zh) 2019-04-09

Family

ID=54412652

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410162091.9A Active CN105022662B (zh) 2014-04-22 2014-04-22 一种分布式任务分配方法

Country Status (1)

Country Link
CN (1) CN105022662B (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107608773A (zh) * 2017-08-24 2018-01-19 阿里巴巴集团控股有限公司 任务并发处理方法、装置及计算设备
CN107678838A (zh) * 2017-10-19 2018-02-09 郑州云海信息技术有限公司 一种跟踪虚拟机操作的方法、装置及虚拟机管理平台
CN107704320A (zh) * 2017-05-12 2018-02-16 贵州白山云科技有限公司 一种分布式***的任务分配方法及***
CN107707673A (zh) * 2017-10-31 2018-02-16 麦格创科技(深圳)有限公司 基于网页任务的实现方法及***
CN110609749A (zh) * 2019-09-06 2019-12-24 阿里巴巴集团控股有限公司 一种分布式任务运行方法、***及设备
CN110838938A (zh) * 2019-10-11 2020-02-25 成都飞机工业(集团)有限责任公司 一种基于工控网的dnc数据存储服务器调度方法
CN110968895A (zh) * 2019-11-29 2020-04-07 北京百度网讯科技有限公司 一种数据的处理方法、装置、电子设备及存储介质
CN113535389A (zh) * 2021-06-28 2021-10-22 中国人民解放军国防科技大学 一种实验方案并行推演管控***
CN115941701A (zh) * 2022-10-13 2023-04-07 华能信息技术有限公司 一种基于微服务架构的动态配置方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101464811A (zh) * 2008-12-29 2009-06-24 艾默生网络能源有限公司 多任务监控管理***
US8365181B2 (en) * 2004-07-12 2013-01-29 Hewlett-Packard Development Company, L.P. Method and system for guiding scheduling decisions in clusters of computers using dynamic job profiling
CN103092698A (zh) * 2012-12-24 2013-05-08 中国科学院深圳先进技术研究院 云计算应用自动部署***及方法
CN103246550A (zh) * 2012-02-09 2013-08-14 深圳市腾讯计算机***有限公司 一种基于容量的多任务调度方法及***
CN103324534A (zh) * 2012-03-22 2013-09-25 阿里巴巴集团控股有限公司 作业调度方法及其调度器

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8365181B2 (en) * 2004-07-12 2013-01-29 Hewlett-Packard Development Company, L.P. Method and system for guiding scheduling decisions in clusters of computers using dynamic job profiling
CN101464811A (zh) * 2008-12-29 2009-06-24 艾默生网络能源有限公司 多任务监控管理***
CN103246550A (zh) * 2012-02-09 2013-08-14 深圳市腾讯计算机***有限公司 一种基于容量的多任务调度方法及***
CN103324534A (zh) * 2012-03-22 2013-09-25 阿里巴巴集团控股有限公司 作业调度方法及其调度器
CN103092698A (zh) * 2012-12-24 2013-05-08 中国科学院深圳先进技术研究院 云计算应用自动部署***及方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
LIJIE XU ET AL.: "FMEM: A Fine-grained Memory Estimator for MapReduce Jobs", 《10TH INTERNATIONAL CONFERENCE ON AUTONOMIC COMPUTING (ICAC ’13)》 *

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107704320A (zh) * 2017-05-12 2018-02-16 贵州白山云科技有限公司 一种分布式***的任务分配方法及***
CN107704320B (zh) * 2017-05-12 2018-08-17 贵州白山云科技有限公司 一种分布式***的任务分配方法及***
WO2018205890A1 (zh) * 2017-05-12 2018-11-15 贵州白山云科技有限公司 一种分布式***的任务分配方法及***及其计算机可读存储介质和计算机设备
CN107608773A (zh) * 2017-08-24 2018-01-19 阿里巴巴集团控股有限公司 任务并发处理方法、装置及计算设备
CN107678838A (zh) * 2017-10-19 2018-02-09 郑州云海信息技术有限公司 一种跟踪虚拟机操作的方法、装置及虚拟机管理平台
CN107678838B (zh) * 2017-10-19 2021-07-02 郑州云海信息技术有限公司 一种跟踪虚拟机操作的方法、装置及虚拟机管理平台
CN107707673A (zh) * 2017-10-31 2018-02-16 麦格创科技(深圳)有限公司 基于网页任务的实现方法及***
CN110609749B (zh) * 2019-09-06 2023-07-14 创新先进技术有限公司 一种分布式任务运行方法、***及设备
CN110609749A (zh) * 2019-09-06 2019-12-24 阿里巴巴集团控股有限公司 一种分布式任务运行方法、***及设备
CN110838938A (zh) * 2019-10-11 2020-02-25 成都飞机工业(集团)有限责任公司 一种基于工控网的dnc数据存储服务器调度方法
CN110838938B (zh) * 2019-10-11 2021-09-07 成都飞机工业(集团)有限责任公司 一种基于工控网的dnc数据存储服务器调度方法
CN110968895A (zh) * 2019-11-29 2020-04-07 北京百度网讯科技有限公司 一种数据的处理方法、装置、电子设备及存储介质
CN110968895B (zh) * 2019-11-29 2022-04-05 北京百度网讯科技有限公司 一种数据的处理方法、装置、电子设备及存储介质
CN113535389A (zh) * 2021-06-28 2021-10-22 中国人民解放军国防科技大学 一种实验方案并行推演管控***
CN115941701A (zh) * 2022-10-13 2023-04-07 华能信息技术有限公司 一种基于微服务架构的动态配置方法
CN115941701B (zh) * 2022-10-13 2023-06-23 华能信息技术有限公司 一种基于微服务架构的动态配置方法

Also Published As

Publication number Publication date
CN105022662B (zh) 2019-04-09

Similar Documents

Publication Publication Date Title
CN105022662A (zh) 一种分布式任务分配方法
EP3577561B1 (en) Resource management for virtual machines in cloud computing systems
CN110249310B (zh) 云计算***中的用于虚拟机的资源管理
CN110858161B (zh) 资源分配方法、装置、***、设备和介质
US20190324819A1 (en) Distributed-system task assignment method and apparatus
US8918792B2 (en) Workflow monitoring and control system, monitoring and control method, and monitoring and control program
Jung et al. Synchronous parallel processing of big-data analytics services to optimize performance in federated clouds
US20150312167A1 (en) Maximizing server utilization within a datacenter
US20140310718A1 (en) Method, computer program and device for allocating computer resources of a cluster for executing a task submitted to said cluster
CN103534687A (zh) 聚簇数据格网中的可扩展集中动态资源分配
JP2017514247A5 (zh)
CN109032769B (zh) 一种基于容器的持续集成ci任务处理方法及装置
JP2012215933A (ja) ジョブ管理システム及びジョブ管理方法
CN105468458A (zh) 计算机集群的资源调度方法及***
KR20130019698A (ko) 사용자 스케줄러와 마이그레이션(Migration)을 통한 자원 최적화 방법 및 시스템
KR20140089749A (ko) 클러스터의 부하 할당 제어 장치 및 그 방법
US20190272201A1 (en) Distributed database system and resource management method for distributed database system
US11438271B2 (en) Method, electronic device and computer program product of load balancing
CN111240824A (zh) 一种cpu资源调度方法及电子设备
US9009713B2 (en) Apparatus and method for processing task
KR102336297B1 (ko) 공유 gpu 클러스터를 위한 분산 딥러닝 작업 스케줄링 방법 및 이를 기록한 컴퓨터 판독 가능 기록매체
CN114546493A (zh) 核共享方法及装置、处理核、电子设备、介质
CN114138453B (zh) 一种适合边缘计算环境的资源优化分配方法与***
JP2011175573A (ja) クラスタシステム、プロセス配置方法、及びプログラム
CN112286631B (zh) 一种Kubernetes资源调度方法、装置与电子设备

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant