CN106168939B - 支持多计算任务和多计算节点的计算协作方法 - Google Patents

支持多计算任务和多计算节点的计算协作方法 Download PDF

Info

Publication number
CN106168939B
CN106168939B CN201610580834.3A CN201610580834A CN106168939B CN 106168939 B CN106168939 B CN 106168939B CN 201610580834 A CN201610580834 A CN 201610580834A CN 106168939 B CN106168939 B CN 106168939B
Authority
CN
China
Prior art keywords
data
calculating
task
node
calculate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201610580834.3A
Other languages
English (en)
Other versions
CN106168939A (zh
Inventor
王坚强
杨吉忠
杨捷
易立富
刘孜学
余颜丽
胡连军
杜成元
冯读贝
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Railway Eryuan Engineering Group Co Ltd CREEC
Original Assignee
China Railway Eryuan Engineering Group Co Ltd CREEC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Railway Eryuan Engineering Group Co Ltd CREEC filed Critical China Railway Eryuan Engineering Group Co Ltd CREEC
Priority to CN201610580834.3A priority Critical patent/CN106168939B/zh
Publication of CN106168939A publication Critical patent/CN106168939A/zh
Application granted granted Critical
Publication of CN106168939B publication Critical patent/CN106168939B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F15/00Digital computers in general; Data processing equipment in general
    • G06F15/16Combinations of two or more digital computers each having at least an arithmetic unit, a program unit and a register, e.g. for a simultaneous processing of several programs
    • G06F15/163Interprocessor communication

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Hardware Design (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Multi Processors (AREA)

Abstract

支持多计算任务和多计算节点的计算协作方法,其特征在于,包括下述步骤:1)计算节点从服务器的数据队列中读取本节点当前运算任务所需的数据作为节点运算的输入数据,所述数据队列中的数据具有任务标识符和序列标记;2)计算节点将运算结果作为输出数据,输出到服务器的数据队列中;所述输出数据具有任务标识符和序列标记;所述任务标识符表示该数据与何任务相关,所述序列标记表示该数据在相关任务中的序号。本发明解决了一个或多个研发团队内部多个计算任务和多个计算节点协作的问题。

Description

支持多计算任务和多计算节点的计算协作方法
技术领域
本发明涉及计算机技术。
背景技术
随着信息技术的深入应用,科学计算、数据分析、模拟仿真等对计算机计算效率和性能的要求越来越高。分布式计算在计算密集型领域得到了广泛应用。
目前,常用分布式计算的通用架构如图1,主要表现为:任务管理(1)+任务执行集群(N)。这种分布式计算模型内部包括一整套调度规则、计算任务分配规则,把真实的计算任务与分布式计算模型耦合在一起。然而,在实际的应用中,一个大型的计算任务可能包括很多第三方的工具或者已经存在的计算模型,在此种情况下就无法修改计算任务以满足分布式计算***的要求。另外,也不能满足在一个团队中可能要求同时进行多个计算任务,并且每个计算任务可能存在计算关联的情况。
因此,需要提供一种计算任务与分布式计算模型完全解耦的计算机制。
发明内容
本发明所要解决的技术问题是,提供一种支持多计算任务和多计算节点的计算协作方法。
本发明解决所述技术问题采用的技术方案是,支持多计算任务和多计算节点的计算协作方法,其特征在于,包括下述步骤:
1)计算节点从服务器的数据队列中读取本节点当前运算任务所需的数据作为节点运算的输入数据,所述数据队列中的数据具有任务标识符和序列标记;
2)计算节点将运算结果作为输出数据,输出到服务器的数据队列中;所述输出数据具有任务标识符和序列标记;
所述任务标识符表示该数据与何任务相关,所述序列标记表示该数据在相关任务中的序号。
所述序号可以为数字、字母或任何其他形式的标识符,用于区分同一任务下的不同数据。
进一步的,所述步骤1)为:计算节点在服务器的数据队列中查询本节点当前运算任务所需的数据,若有则读取,若无则等待后再次查询。
或者,所述步骤1)为:计算节点在服务器的数据队列中查询本节点当前运算任务所需的数据,若有则读取,若无则执行其他计算,其他计算完成后再次查询。
本发明每一节点的输入数据皆为该节点以外的其他节点的输出数据。服务器的数据队列中,每个数据都具有任务标识符、时间戳、数据长度、缓存索引、有效期。节点与服务器之间的通信基于加密渠道。
或者,所述步骤1)为:第一计算节点向请求本节点当前运算任务所需的数据,服务器在服务器数据队列中查询,若有则向第一计算节点发送所请求的数据,若无则通知节点等待,直至收到其他节点送出的数据后发送至第一计算节点。
本发明通过把计算协作模型与计算任务解耦,可以同时支持多个项目组的不同计算任务,每个计算任务的计算节点可以动态扩展,对计算节点数无限制,对计算任务采用何种计算模型或算法不做限制,每个节点只关心自身的输入和输出而不用关心是哪个节点提供的输入和输出到哪个节点,解决了一个或多个研发团队内部多个计算任务和多个计算节点协作的问题。
附图说明
图1为常见分布式计算模型示意图。
图2为本发明的计算协作平台实施案例示意图。
具体实施方式
本发明提供了一种支持多计算任务和多计算节点的计算协作平台,包括一个或多个计算任务,每个计算任务包括多个计算机节点,每个计算节点通过网络与计算协作平台(服务器)连接,其中:
计算任务,完成一个计算模型、数据分析算法、科学计算等的过程:
计算节点,负责计算计算任务中的某个过程,完成同一个计算任务的计算节点具有相同的唯一标识符,计算节点通过网络与计算协作平台相连接,通过计算协作平台与关联计算节点协作;
计算协作平台,即服务器,提供安全服务为计算节点做统一安全认证和提供数据加密协议,提供数据存储和分发的能力,,响应来自计算节点的提交数据和获取数据请求。
本发明的详细过程包括:
为计算任务预定义唯一标识符(包括任务标识符和序列标记),计算节点数,计算节点任务、输入和输出,特别注意在同一个计算任务中每个计算节点的输出必须具有不同的标识符,而且每个计算节点的输入必须是其他计算节点的输出;
启动计算节点后,计算节点首先与计算协作平台建立连接,并通过安全服务获得安全认证和数据加密协议,然后计算节点开始执行计算任务,并根据计算任务预定义的输出要求把计算过程数据输出到计算协作平台,同时根据计算任务预定义的输入要求从计算协作平台获取输入;
计算协作平台的安全服务接受来自计算节点的接入请求,完成安全认证,并返回数据加密协议。
进一步地,
计算协作平台(服务器)接收来自计算节点的提交数据请求,解密数据并验证合法性后把本次数据的标识符、时间戳、数据长度、缓存索引、有效期等添加到数据队列中,然后把数据写入数据缓存中,具有相同标识符的数据被多次提交,以最近一次为准;
进一步地,
计算协作平台(服务器)接收来自多个计算节点的获取数据请求,在数据队列中查找被请求的数据,并依据缓存索引信息从数据缓存中读取数据,加密数据后返回给计算节点;
计算任务完成后,通过任意计算节点可删除计算协作平台中关于本次计算的数据,如果没有删除,计算协作平台将根据数据的有效期删除数据。
实施例
如图2所示,本发明的实施案例示意图包括2个计算任务(T1,T2)。其中T1包括2个计算节点(N1,N2),N1的输入和输出分别是(M4,M5)和(M1,M2,M3),N2的输入和输出分别是(M1,M2,M3)和(M4,M5)。T2包括3个计算节点(S1,S2,S3),S1的输入和输出分别是(M2,M4)和(M1),S2的输入和输出分别是(M1,M5)和(M2,M3),S3的输入和输出分别是(M1,M2,M3)和(M4,M5)。具体内容请参看表1。
其中:
计算任务,被分别定义为T1和T2。T1的过程输出数据有(M1,M2,M3,M4,M5),由(N1,N2)两个节点协作完成任务。T2的过程输出有(M1,M2,M3,M4,M5),由(S1,S2,S3)三个节点协作完成任务;数据M1~M5具有任务标识符和序列标记,例如数据队列中的数据M1的内容为T1M102345,T1为任务标识符,表示与任务T1有关,M1为序列标记,表示本数据为预定义的数据M1,数据M1被预定义为任务中的一个中间参量。
计算节点,这里以执行T1任务的N1(以T1->N1表示)为例,其他节点类似。T1->N1启动后通过网络与计算协作平台建立连接,并通过安全认证和获取数据加密协议。然后,T1->N1开始执行自身的计算过程,并在执行过程中输出数据(M1,M2,M3),同时在支持过程中根据自身需要从计算协作平台获取输入数据(M4,M5)。什么时刻输入和输出,输入什么、输出什么都由计算节点本身的算法决定,输入可以是阻塞和非阻塞的。简而言之,T1->N1只需要把应该输出的数据输出,应该输入的输入,至于输入和输出的方式、时刻并不重要。不过,输出要越早越好,因为可能T1->N2节点正在等待T1->N1的输出结果;
计算协作平台,这里仍然以T1->N1为例,其他节点类似。T1->N1输出M1到计算协作平台,平台接收数据后根据任务唯一标识符(T1),将M1添加到相应的(T1)数据队列,如果数据队列不存在将以T1为关键字建立一个新的数据队列。T1->N1从计算协作平台请求数据M4,如果此时M4已经到达,则返回M4数据,T1->N1继续执行,如果数据未到达就返回空,T1->N1将根据自身算法设计决定是继续等待该数据还是执行其他计算。
计算任务完成后,由任意计算节点向计算协作平台发起清除本次计算数据的请求,如果未发起该请求,计算协作平台将根据数据有效期删除数据。
表1。

Claims (3)

1.支持多计算任务和多计算节点的计算协作方法,其特征在于,包括下述步骤:
1)计算节点在服务器的数据队列中查询本节点当前运算任务所需的数据,若有则读取,若无则执行其他计算,待其他计算完成后再次查询;所述数据队列中的数据具有任务标识符和序列标记;
2)计算节点将运算结果作为输出数据,输出到服务器的数据队列中;所述输出数据具有任务标识符和序列标记;
所述任务标识符表示该数据与何任务相关,所述序列标记表示该数据在相关任务中的序号;
其中,每一节点的输入数据皆为该节点以外的其他节点的输出数据,服务器的数据队列中,每个数据都具有任务标识符、时间戳、数据长度、缓存索引、有效期。
2.如权利要求1所述的支持多计算任务和多计算节点的计算协作方法,其特征在于,节点与服务器之间的通信基于加密渠道。
3.如权利要求1所述的支持多计算任务和多计算节点的计算协作方法,其特征在于,所述步骤1)为:第一计算节点向服务器请求本节点当前运算任务所需的数据,服务器在服务器数据队列中查询,若有则向第一计算节点发送所请求的数据,若无则通知节点等待,直至收到其他节点送出的数据后发送至第一计算节点。
CN201610580834.3A 2016-07-21 2016-07-21 支持多计算任务和多计算节点的计算协作方法 Active CN106168939B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610580834.3A CN106168939B (zh) 2016-07-21 2016-07-21 支持多计算任务和多计算节点的计算协作方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610580834.3A CN106168939B (zh) 2016-07-21 2016-07-21 支持多计算任务和多计算节点的计算协作方法

Publications (2)

Publication Number Publication Date
CN106168939A CN106168939A (zh) 2016-11-30
CN106168939B true CN106168939B (zh) 2019-11-12

Family

ID=58065623

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610580834.3A Active CN106168939B (zh) 2016-07-21 2016-07-21 支持多计算任务和多计算节点的计算协作方法

Country Status (1)

Country Link
CN (1) CN106168939B (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103347055A (zh) * 2013-06-19 2013-10-09 北京奇虎科技有限公司 云计算平台中的任务处理***、设备及方法
CN104598425A (zh) * 2013-10-31 2015-05-06 中国石油天然气集团公司 一种通用多机并行计算方法及***
CN105653204A (zh) * 2015-12-24 2016-06-08 华中科技大学 一种基于磁盘的分布式图计算方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9684364B2 (en) * 2014-12-09 2017-06-20 Intel Corporation Technologies for out-of-band power-based task scheduling for data centers

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103347055A (zh) * 2013-06-19 2013-10-09 北京奇虎科技有限公司 云计算平台中的任务处理***、设备及方法
CN104598425A (zh) * 2013-10-31 2015-05-06 中国石油天然气集团公司 一种通用多机并行计算方法及***
CN105653204A (zh) * 2015-12-24 2016-06-08 华中科技大学 一种基于磁盘的分布式图计算方法

Also Published As

Publication number Publication date
CN106168939A (zh) 2016-11-30

Similar Documents

Publication Publication Date Title
CN110019350B (zh) 基于配置信息的数据查询方法和装置
Wang et al. Maptask scheduling in mapreduce with data locality: Throughput and heavy-traffic optimality
Xie et al. Power of d choices for large-scale bin packing: A loss model
US10057182B2 (en) Method for providing development and deployment services using a cloud-based platform and devices thereof
US20240012641A1 (en) Model construction method and apparatus, and medium and electronic device
JP5245711B2 (ja) 分散データ処理システム、分散データ処理方法および分散データ処理用プログラム
CN109726004B (zh) 一种数据处理方法及装置
CN108334411A (zh) 一种BMC中基于Redfish的资源调用方法及装置
CN112631800A (zh) 面向kafka的数据传输方法、***、计算机设备及存储介质
US20150172369A1 (en) Method and system for iterative pipeline
CN106168963A (zh) 实时流数据的处理方法、装置及服务器
CN110147507A (zh) 一种获取短链接地址的方法、装置及服务器
CN103581273A (zh) 一种分布式***执行业务的方法、装置及***
CN113946816A (zh) 基于云服务的鉴权方法、装置、电子设备和存储介质
WO2018188607A1 (zh) 流处理方法及装置
CN106990913B (zh) 一种大规模流式集合数据的分布式处理方法
CN106168939B (zh) 支持多计算任务和多计算节点的计算协作方法
CN103729451B (zh) 一种数据库的信息录入方法、装置及***
CN111651509B (zh) 基于Hbase数据库的数据导入方法、装置、电子设备及介质
CN114490718A (zh) 数据输出方法、装置、电子设备和计算机可读介质
CN114051029A (zh) 授权方法、授权装置、电子设备和存储介质
CN104156358B (zh) 一种用于数据库的表的批量读取方法、装置和***
CN111625866A (zh) 一种权限管理方法、***、设备及存储介质
Suram et al. Integrating a reduced-order model server into the engineering design process
CN113242306B (zh) 一种区块链的共识方法和装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant