CN113162965B - 面向异构MapReduce集群的低时延Map和Reduce联合调度方法 - Google Patents
面向异构MapReduce集群的低时延Map和Reduce联合调度方法 Download PDFInfo
- Publication number
- CN113162965B CN113162965B CN202110020740.1A CN202110020740A CN113162965B CN 113162965 B CN113162965 B CN 113162965B CN 202110020740 A CN202110020740 A CN 202110020740A CN 113162965 B CN113162965 B CN 113162965B
- Authority
- CN
- China
- Prior art keywords
- reduce
- map
- servers
- time delay
- task allocation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 39
- 238000004364 calculation method Methods 0.000 claims abstract description 33
- 230000001934 delay Effects 0.000 claims abstract description 9
- 239000013598 vector Substances 0.000 claims abstract description 6
- 238000004891 communication Methods 0.000 claims description 16
- 230000005540 biological transmission Effects 0.000 claims description 12
- 230000009286 beneficial effect Effects 0.000 abstract description 2
- 238000004422 calculation algorithm Methods 0.000 description 15
- 238000011161 development Methods 0.000 description 5
- 238000005457 optimization Methods 0.000 description 5
- 230000007423 decrease Effects 0.000 description 3
- 238000005265 energy consumption Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000012804 iterative process Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000005094 computer simulation Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000005192 partition Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/10—Protocols in which an application is distributed across nodes in the network
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/10—Protocols in which an application is distributed across nodes in the network
- H04L67/1001—Protocols in which an application is distributed across nodes in the network for accessing one among a plurality of replicated servers
- H04L67/1004—Server selection for load balancing
- H04L67/1008—Server selection for load balancing based on parameters of servers, e.g. available memory or workload
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/10—Protocols in which an application is distributed across nodes in the network
- H04L67/1001—Protocols in which an application is distributed across nodes in the network for accessing one among a plurality of replicated servers
- H04L67/1004—Server selection for load balancing
- H04L67/101—Server selection for load balancing based on network conditions
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Computer Hardware Design (AREA)
- General Engineering & Computer Science (AREA)
- Multi Processors (AREA)
Abstract
本发明公开了一种面向异构MapReduce集群的低时延Map和Reduce联合调度方法,步骤为:客户端提交MapReduce作业到异构集群,控制中心将作业分给各服务器并完成分布式计算以使得作业执行总时延最小。其中,MapReduce框架在Map阶段和Reduce阶段均存在计算任务分配,按照所有服务器能同时完成计算的原则,分别固定其中一处的任务分配来优化另一处,对两个任务分配向量进行迭代求解直至所有服务器的执行时延均相等,得到两个阶段最优的计算任务分配策略,且作业完成的总时延最小。本发明可以用于异构集群下MapReduce分布式计算中,以获得低时延的有益效果。
Description
技术领域
本发明涉及无线通信领域,具体涉及面向异构MapReduce集群的低时延Map和Reduce联合调度方法。
背景技术
随着移动设备的普及和移动互联网的发展,未来将呈现万物互联的发展趋势,5G作为新一代移动通信技术在网络技术方面的提升真正实现了通信从人扩展到万物的转变,尤其是5G通信在低时延、网络大带宽等方面的优势将从根本上推动人工智能、区块链等物联网核心领域的发展。考虑到物联网中大部分数据业务呈现数据量大、类型复杂等特点,并且核心网的资源紧缺,低时延的要求使得用户将超大的计算任务集中处理是不现实的,这极大的促进了分布式计算在无线通信领域的发展。其中,MapReduce作为一种专门为大规模并行数据处理设计的分布式计算框架,非常适用于多个边缘服务器分布式处理各个类型的计算任务,帮助用户终端高效的解决计算问题。
MapReduce框架的执行流程总结为:客户端提交作业后,主节点中的控制中心将其划分到各个服务器上做Map运算,并产生一定量的中间值,其次,这些中间值需要与其他服务器进行通信传输,最终各服务器将其收集到的中间值数据做Reduce运算并输出到HDFS中。
为了能够满足大型计算任务对时延的基本要求,人们研究了不同情况下MapReduce框架中的资源调度问题,一个好的资源调度策略可以有效减少时延代价。具体地,按照优化目标可以分为优化负载、优化能耗、优化时延等。按照提交的作业数里可分为单任务和多任务分布式计算等。大多研究工作均是基于同构环境下的MapReduce来展开,然而随着通信网络的发展,异构的集群环境与实际情况更为贴近,传统的平均分配机制将不再适用,这很大程度会造成负载不均衡,资源浪费和高时延等问题。
发明内容
为了克服现有技术的不足,本发明的目的是按照所有服务器能同时完成计算的原则,最小化单个服务器的时延拖尾,使计算任务完成的总时延最小,进而设计出一种面向异构MapReduce集群的低时延Map和Reduce联合调度方法。
面向异构MapReduce集群的低时延Map和Reduce联合调度方法,步骤如下:
获取执行作业大小、集群服务器数量、各服务器之间通信的传输速率、服务器计算单位比特数据的时钟周期,CPU频率,Map、Reduce的工作槽数,以及单位Map任务输出的数据量等信息;
根据上述信息得到每个服务器作为Reduce计算节点完成Reduce计算的***时延,并定义作业完成总时延最小化问题;
根据最小化单个服务器的时延拖尾,提高服务器之间的并行时间,得到满足所有服务器能同时完成计算的最优性条件:
按照所有服务器完成Reduce计算的***时延均相等的原则,固定一个任务分配变量不变,对另一个任务分配变量进行迭代求解:
固定Map阶段任务分配变量m更新Reduce阶段任务分配变量q:
根据等式约束对当前时刻的Reduce阶段任务分配变量作归一化处理:
固定已更新的Reduce阶段任务分配变量q更新Map阶段任务分配变量m:
根据等式约束对当前时刻的Map阶段任务分配变量作归一化处理:
基于上述方法交替迭代求解两个任务分配变量,使得作业完成总时延单调减少,直到前后两次时延之差在阈值范围内停止迭代,进而得到最优的任务分配向量。
本发明的有益效果:
本发明通过最小化单个服务器的拖尾时延,提高服务器之间的并行时间,设计出一种面向异构MapReduce集群的低时延Map和Reduce联合调度方法,考虑了集群中不同服务器的计算能力以及服务器之间的传输速率,在Map阶段前和Reduce阶段的任务分配均做出了优化,最小化了作业完成的总时延。
附图说明
图1是面向异构MapReduce集群的低时延Map和Reduce联合调度方法的***模型。
图2是不同边缘服务器数量的情况下,本发明方法与四种对比算法在时延方面的性能比较图。
图3是不同作业大小的情况下,本发明方法与四种对比算法在时延方面的性能比较图。
图4是分别固定γ=100,γ=200,在不同平均计算频率的情况下,本发明方法与四种对比算法在时延方面的性能比较图。
图5是分别固定γ=100,γ=300,在不同平均传输速率的情况下,本发明方法与四种对比算法在时延方面的性能比较图。
图6是在集群服务器数量为30,阈值为10-3的情况下,本发明方法在迭代过程中的时延关系图。
具体实施方式
以下结合附图和实施例进一步说明本发明。
采用面向异构MapReduce集群的低时延Map和Reduce联合调度方法的***模型如图1所示,用户在Map和Reduce两个阶段分别按照一定的任务分配规则将计算任务分给集群中的服务器。本发明依据最小化单个服务器的拖尾时延,在固定其中一个任务分配变量的情况下迭代求得另一任务分配变量的当前最优值,交替求解直到前后两次时延之差在阈值范围内停止,进而得到最优的作业完成总时延以及Map和Reduce两个阶段的任务分配策略。
面向异构MapReduce集群的低时延Map和Reduce联合调度方法,包括以下步骤:
步骤1:获取执行作业大小、集群服务器数量、各服务器之间通信的传输速率、服务器计算单位比特数据的时钟周期,CPU频率,Map、Reduce的工作槽数,以及单位Map任务输出的数据量等信息;
步骤2:根据上述信息计算得到每个服务器作为Reduce计算节点时完成计算的***时延,并定义作业完成总时延最小化问题;
步骤3:根据最小化单个服务器的时延拖尾,提高服务器之间的并行时间,得到满足所有服务器能同时完成Reduce计算的最优性条件;
步骤4:根据作业完成总时延τ满足的最优性条件,固定一个任务分配变量不变的同时对另一个任务分配变量进行迭代求解,两个任务分配变量交替迭代使作业完成总时延单调减少,直到前后两次时延之差在阈值范围内迭代停止。
作为一个较好的实施例子,首先获取客户端提交的作业大小、集群服务器数量、各个服务器的计算频率、各服务器之间通信的传输速率等信息,各服务器可按照如下计算方式求得对应的通信和计算时延:
Map阶段的计算时延与Shuffle阶段的通信时延存在重叠,针对作为Reduce计算节点的服务器k,只有当所有服务器的Map与其自身的Shuffle均完成才可以开始执行Reduce操作,其完成计算对应的***时延tk(m,q)为:
比较所有服务器完成Reduce计算的***时延,将最大值作为作业完成总时延τ,满足
进而建立作业完成总时延最小化问题:
minτ
同时,该问题需要满足以下约束条件:单位Map任务产生的中间值将全部分给各个服务器;每个服务器上分配的任务大小为非负数。采用以下公式建立优化问题的约束:
ml,qk≥0
基于此,目标函数可以进一步转化为:
为了使作业完成总时延最小,依据最小化单个服务器的时延拖尾,提高服务器并行时间的基本思想,得到作业完成总时延满足的最优性条件为:
按照所有服务器完成Reduce计算的***时延均相等的原则,固定一个任务分配变量不变,对另一个任务分配变量进行迭代求解,直至当前最优:
固定Map阶段任务分配变量m更新Reduce阶段任务分配变量q:
根据等式约束对当前时刻的Reduce阶段任务分配变量作归一化处理:
固定已更新的Reduce阶段任务分配变量q更新Map阶段任务分配变量m:
根据等式约束对当前时刻的Map阶段任务分配变量作归一化处理:
基于上述方法交替迭代求解两个任务分配变量,使得作业完成的总时延单调减少,直到前后两次时延之差在阈值范围内停止迭代,进而得到最优的任务分配向量。
作为一个较好的实施例子,有一个大小D=1GB的作业需要提交给MapReduce框架来计算,集群中默认服务器数量N=30,每个服务器总工作槽数为4,即集群中任意的服务器k均满足除此之外,假设服务器计算单位比特数的时钟周期、CPU频率与信道的传输速率分别服从[200,600]、[1,2]、[10,30]的均匀分布,单位Map任务输出数据量γ=200,每组数据通过计算机仿真运行1000次取平均值来做为最终结果。
此处引入四个对比方法,对比算法1为默认集群内服务器性能相同,在Map阶段和Reduce阶段的数据分配均采用平均分配的传统资源调度方法;对比算法2为根据集群内各服务器计算性能为其分配Map任务的资源调度方法;对比算法3为根据集群内各服务器计算性能划分Reduce任务的资源调度方法;对比算法4为以最小化执行任务的总能量消耗为目标,联合优化各服务器在Map阶段的任务分配以及各服务器功率分配的资源调度方法。本发明联合优化Map和Reduce阶段的任务分配变量设计出一种低时延资源调度方法。
首先固定提交的作业大小为1GB,改变集群中服务器数量来观察各算法在时延性能中的表现。图2展示了五个算法的作业完成总时延随集群中服务器数量在[30,100]范围内变化的关系,可以看出,本发明方法与四个对比算法相比在总时延方面有明显的降低,随着集群中服务器数量的增加,作业完成的总时延逐渐降低,且本发明方法的性能优势更加显著。
然后固定集群中服务器数量为30,改变提交作业的大小来观察各算法在时延性能中的表现。图3展示了五个算法中不同大小的计算任务对时延产生的影响,我们将计算任务由1GB增加到10GB,从图中看出,作业任务量的增大会对时延产生非常明显的增加,在保持其他参数不变的情况下,计算任务的大小是影响时延最直接的因素,对比观察,本发明法可以获得最优的时延性能。
接下来分别在不同的γ系数下,改变集群服务器平均计算频率和平均传输速率来观察各算法在时延性能中的表现。图4显示随着CPU时钟频率分布的期望值增加,各算法均呈现了时延下降的趋势,CPU时钟频率的均值表征了集群整体的计算能力,CPU时钟频率的增大使得Map与Reduce阶段的计算时延下降,且γ值越小在一定程度上表征通信的总数据量越少,进而总时延也越小。图5显示,当γ值较小时,作业完成总时延随传输速率均值的增大先减小,然后保持不变,这是由于传输速率增大到一定程度会使Shuffle阶段的通信时延降低至没有参与计算,此再继续提高集群中各服务器之间的通信能力并不会降低任务执行总时延。而γ值较大时,Shuffle阶段通信时延较高,此时在一定范围内提高服务器之间的传输速率必然会降低任务执行的总时延。同样地,本发明方法与其他方法相比可以获得最低时延。
最后,图6展示了在集群服务器数量为30,阈值为10-3的情况下,本发明方法在迭代过程中的时延关系,明显的阶跃表示迭代时在交替求解两个任务分配变量,并且能快速收敛到最优的作业完成总时延。
综合以上性能比较,本发明联合优化Map和Reduce的任务分配提出的资源调度方法在时延性能上优于其他对比方法,且在大规模网络中优势更加突出。
Claims (1)
1.面向异构MapReduce集群的低时延Map和Reduce联合调度方法,其特征在于,包括如下步骤:
1)获取如下信息:提交的作业大小D(bits)、集群中服务器数量N、网络中各服务器之间通信的传输速率vlk(Mbps)、服务器计算单位比特数据的时钟周期μk(cycles/bit),CPU频率Map、Reduce任务的工作槽数 以及单位Map任务输出的数据量γ,其中l、k均是服务器的编号;
2)最小化单个服务器的时延拖尾,提高服务器并行时间得到Map和Reduce阶段的任务分配向量m、q;
所述的方法,获取最优的作业完成总时延和任务分配向量,步骤如下:
根据获取信息得到任意一个服务器k作为Reduce计算节点时,完成Reduce计算对应的***时延tk(m,q);
其中,β为服务器计算单位Map任务和Reduce任务的时延比,ml和qk分别为服务器l在Map阶段的任务分配和服务器k在Reduce阶段的任务分配,比较每个服务器完成Reduce计算的***时延,将最大值作为作业完成总时延τ;
基于此得到作业完成总时延τ的另一种等价表示
最小化单个服务器的时延拖尾,提高服务器并行时间,得到作业完成总时延τ满足所有服务器能同时完成Reduce计算的最优性条件:
按照所有服务器完成Reduce计算的***时延均相等的原则,固定一个任务分配变量不变,对另一个任务分配变量进行迭代求解,直至当前最优:
固定Map阶段任务分配变量m更新Reduce阶段任务分配变量q:
根据等式约束对当前时刻的Reduce阶段任务分配变量作归一化处理:
固定已更新的Reduce阶段任务分配变量q更新Map阶段任务分配变量m:
根据等式约束对当前时刻的Map阶段任务分配变量作归一化处理:
基于上述方法交替迭代求解两个任务分配变量,使得作业完成总时延单调减少,直到前后两次时延之差在阈值范围内停止迭代,进而得到最优的任务分配向量。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110020740.1A CN113162965B (zh) | 2021-01-07 | 2021-01-07 | 面向异构MapReduce集群的低时延Map和Reduce联合调度方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110020740.1A CN113162965B (zh) | 2021-01-07 | 2021-01-07 | 面向异构MapReduce集群的低时延Map和Reduce联合调度方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113162965A CN113162965A (zh) | 2021-07-23 |
CN113162965B true CN113162965B (zh) | 2022-09-20 |
Family
ID=76878426
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110020740.1A Active CN113162965B (zh) | 2021-01-07 | 2021-01-07 | 面向异构MapReduce集群的低时延Map和Reduce联合调度方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113162965B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114844781B (zh) * | 2022-05-20 | 2023-05-09 | 南京大学 | Rack架构下面向编码MapReduce的Shuffle性能优化方法及*** |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102567086A (zh) * | 2010-12-30 | 2012-07-11 | ***通信集团公司 | 一种任务调度的方法、设备和*** |
CN103631657A (zh) * | 2013-11-19 | 2014-03-12 | 浪潮电子信息产业股份有限公司 | 一种基于MapReduce的任务调度算法 |
CN111381950A (zh) * | 2020-03-05 | 2020-07-07 | 南京大学 | 一种面向边缘计算环境基于多副本的任务调度方法和*** |
US10880366B1 (en) * | 2018-07-30 | 2020-12-29 | Splunk Inc. | Enabling stateless status checks using collector redirection |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8751639B2 (en) * | 2011-04-27 | 2014-06-10 | Rackspace Us, Inc. | Event queuing and distribution system |
-
2021
- 2021-01-07 CN CN202110020740.1A patent/CN113162965B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102567086A (zh) * | 2010-12-30 | 2012-07-11 | ***通信集团公司 | 一种任务调度的方法、设备和*** |
CN103631657A (zh) * | 2013-11-19 | 2014-03-12 | 浪潮电子信息产业股份有限公司 | 一种基于MapReduce的任务调度算法 |
US10880366B1 (en) * | 2018-07-30 | 2020-12-29 | Splunk Inc. | Enabling stateless status checks using collector redirection |
CN111381950A (zh) * | 2020-03-05 | 2020-07-07 | 南京大学 | 一种面向边缘计算环境基于多副本的任务调度方法和*** |
Non-Patent Citations (2)
Title |
---|
Venkata Swamy Martha ; Weizhong Zhao.h-MapReduce: A Framework for Workload Balancing in MapReduce.《IEEE》.2013,全文. * |
异构Hadoop集群下的负载自适应反馈调度策略;潘佳艺;《计算机工程与科学》;20170330;全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN113162965A (zh) | 2021-07-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112286677B (zh) | 一种面向资源受限边缘云的物联网应用优化部署方法 | |
CN111475274B (zh) | 云协同多任务调度方法及装置 | |
Cui et al. | A novel offloading scheduling method for mobile application in mobile edge computing | |
CN112118287B (zh) | 基于交替方向乘子算法与移动边缘计算的网络资源优化调度决策方法 | |
CN111722910B (zh) | 一种云作业调度及资源配置的方法 | |
CN113810233B (zh) | 一种在随机网络中基于算网协同的分布式计算卸载方法 | |
CN111813506B (zh) | 一种基于粒子群算法资源感知计算迁移方法、装置及介质 | |
CN111163143B (zh) | 一种面向移动边缘计算的低时延任务卸载方法 | |
CN112788605B (zh) | 基于双延迟深度确定性策略边缘计算资源调度方法和*** | |
CN110233755B (zh) | 一种物联网中雾计算的计算资源和频谱资源分配方法 | |
CN112214301B (zh) | 面向智慧城市基于用户偏好的动态计算迁移方法及装置 | |
Zhu et al. | Computing offloading strategy using improved genetic algorithm in mobile edge computing system | |
CN113992677A (zh) | 一种延迟与能耗联合优化的mec计算卸载方法 | |
CN111694664A (zh) | 一种边缘服务器的计算卸载分配方法 | |
CN113918240A (zh) | 任务卸载方法及装置 | |
Wu et al. | A mobile edge computing-based applications execution framework for Internet of Vehicles | |
CN113162965B (zh) | 面向异构MapReduce集群的低时延Map和Reduce联合调度方法 | |
CN115396953A (zh) | 移动边缘计算中一种基于改进粒子群算法的计算卸载方法 | |
CN114925852A (zh) | 一种基于模型分割和资源分配的联邦学习训练方法及*** | |
CN113573363A (zh) | 基于深度强化学习的mec计算卸载与资源分配方法 | |
CN114064294B (zh) | 移动边缘计算环境下的动态资源分配方法和*** | |
CN110266757A (zh) | 一种面向任务协同场景的边缘计算资源优化方法 | |
CN113473542A (zh) | 无线供能边缘计算网络的时延最小化资源分配方法及装置 | |
CN117579701A (zh) | 一种移动边缘网络计算卸载方法及*** | |
CN110928648B (zh) | 融合启发式和智能计算的云工作流分段在线调度优化方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |