CN107844371A - 任务处理方法、***及电子设备 - Google Patents

任务处理方法、***及电子设备 Download PDF

Info

Publication number
CN107844371A
CN107844371A CN201710951710.6A CN201710951710A CN107844371A CN 107844371 A CN107844371 A CN 107844371A CN 201710951710 A CN201710951710 A CN 201710951710A CN 107844371 A CN107844371 A CN 107844371A
Authority
CN
China
Prior art keywords
task
resource object
parameters
resource
module
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710951710.6A
Other languages
English (en)
Inventor
吕江昭
徐新坤
鲍永成
刘海锋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Jingdong Century Trading Co Ltd
Beijing Jingdong Shangke Information Technology Co Ltd
Original Assignee
Beijing Jingdong Century Trading Co Ltd
Beijing Jingdong Shangke Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Jingdong Century Trading Co Ltd, Beijing Jingdong Shangke Information Technology Co Ltd filed Critical Beijing Jingdong Century Trading Co Ltd
Priority to CN201710951710.6A priority Critical patent/CN107844371A/zh
Publication of CN107844371A publication Critical patent/CN107844371A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5005Allocation of resources, e.g. of the central processing unit [CPU] to service a request
    • G06F9/5027Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5061Partitioning or combining of resources
    • G06F9/5072Grid computing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Stored Programmes (AREA)

Abstract

本公开提供了一种任务处理方法,包括,获取任务的任务类型和任务参数,根据所述任务类型,调用资源对象模板,并根据所述任务参数更新所述资源对象模板,根据所述更新后的资源对象模板,生成至少一个资源对象,以及根据所述资源对象,请求所述任务所需要的资源。

Description

任务处理方法、***及电子设备
技术领域
本公开涉及计算机技术领域,更具体地,涉及任务处理方法、***及电子设备。
背景技术
分布式计算可以共享稀有资源,平衡多台计算机的计算负载,以及可以把程序运行在最适合的计算机上,因此被广泛用于执行各种计算任务。以深度学习为例,由于在训练过程中计算量巨大,需要通过分布式计算进行处理,通过协调计算资源,完成训练。另一方面,深度学习框架的出现在一定程度上降低了人工智能和深度学习的开发难度,应用开发人员可以选择适合的深度学习框架进行开发。
在实现本发明构思的过程中,发明人发现现有技术中至少存在如下问题,应用开发人员在选择所需要的任务时,需要人工管理和调用底层资源,会面临较高的选择和学习成本。
发明内容
有鉴于此,本公开提供了一种支持多种任务自动资源管理和调用的任务处理方法、***和装置。
本公开的一个方面提供了一种任务处理方法,包括,获取任务的任务类型和任务参数,根据所述任务类型,调用资源对象模板,并根据所述任务参数更新所述资源对象模板,根据所述更新后的资源对象模板,生成至少一个资源对象,以及根据所述资源对象,请求所述任务所需要的资源。
根据本公开的实施例,在所述获取任务的任务类型和任务参数之后,所述方法还包括,对所述任务进行预处理。
根据本公开的实施例,所述对所述任务进行预处理包括以下至少一种,根据所述任务参数,解析所需要的依赖程序并进行安装,根据所述任务参数,规范化所要处理的数据,或者优化任务脚本。
根据本公开的实施例,所述获取任务的任务类型和任务参数包括,接收用户自定义的镜像,从所述镜像中提取所述任务的任务类型和任务参数。
根据本公开的实施例,所述任务包括分布式训练任务,以及所述任务类型包括所述分布式训练所使用的执行引擎。
本公开的另一个方面提供了一种任务处理***,包括获取模块,用于获取任务的任务类型和任务参数,模板调用模块,用于根据所述任务类型,调用资源对象模板,并根据所述任务参数更新所述资源对象模板,对象生成模块,用于根据所述更新后的资源对象模板,生成至少一个资源对象,以及资源请求模块,用于根据所述资源对象,请求所述任务所需要的资源。
根据本公开的实施例,所述***还包括预处理模块,用于对所述任务进行预处理。
根据本公开的实施例,所述预处理模块包括以下至少一种,安装子模块,用于根据所述任务参数,解析所需要的依赖程序并进行安装,规范化子模块,用于根据所述任务参数,规范化所要处理的数据,或者优化子模块,用于优化任务脚本。
根据本公开的实施例,所述获取模块包括,提取子模块,用于接收用户自定义的镜像,从所述镜像中提取所述任务的任务类型和任务参数。
根据本公开的实施例,所述任务包括分布式训练任务,以及所述任务类型包括所述分布式训练所使用的执行引擎。
本公开的另一个方面提供了一种电子设备,包括一个或多个处理器,存储装置,用于存储一个或多个程序,其中,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器执行上述中任意一项所述的方法。
本公开的另一方面提供了一种计算机可读介质,其上存储有可执行指令,所述指令在被执行时用于实现如上所述的方法。
本公开的另一方面提供了一种计算机程序,所述计算机程序包括计算机可执行指令,所述指令在被执行时用于实现如上所述的方法。
根据本公开的实施例,可以至少部分地解决应用开发人员在选择所需要的任务时,需要人工管理和调用底层资源,会面临较高的选择和学习成本的问题,并因此可以支持多种任务自动资源管理和调用,降低开发成本。
附图说明
通过以下参照附图对本公开实施例的描述,本公开的上述以及其他目的、特征和优点将更为清楚,在附图中:
图1示意性示出了根据本公开实施例的任务处理方法、***和电子设备的***架构;
图2示意性示出了根据本公开实施例的任务处理方法的流程图;
图3示意性示出了根据本公开另一实施例的任务处理方法的流程图;
图4示意性示出了根据本公开实施例的任务处理***的框图;
图5示意性示出了根据本公开另一实施例的任务处理***的框图;
图6示意性示出了根据本公开实施例的预处理模块的框图;
图7示意性示出了根据本公开实施例的获取模块的框图;以及
图8示意性示出了根据本公开实施例的适于实现任务处理方法和/或***的计算机***的方框图。
具体实施方式
以下,将参照附图来描述本公开的实施例。但是应该理解,这些描述只是示例性的,而并非要限制本公开的范围。此外,在以下说明中,省略了对公知结构和技术的描述,以避免不必要地混淆本公开的概念。
在此使用的术语仅仅是为了描述具体实施例,而并非意在限制本公开。这里使用的词语“一”、“一个(种)”和“该”等也应包括“多个”、“多种”的意思,除非上下文另外明确指出。此外,在此使用的术语“包括”、“包含”等表明了所述特征、步骤、操作和/或部件的存在,但是并不排除存在或添加一个或多个其他特征、步骤、操作或部件。
在此使用的所有术语(包括技术和科学术语)具有本领域技术人员通常所理解的含义,除非另外定义。应注意,这里使用的术语应解释为具有与本说明书的上下文相一致的含义,而不应以理想化或过于刻板的方式来解释。
在使用类似于“A、B和C等中至少一个”这样的表述的情况下,一般来说应该按照本领域技术人员通常理解该表述的含义来予以解释(例如,“具有A、B和C中至少一个的***”应包括但不限于单独具有A、单独具有B、单独具有C、具有A和B、具有A和C、具有B和C、和/或具有A、B、C的***等)。在使用类似于“A、B或C等中至少一个”这样的表述的情况下,一般来说应该按照本领域技术人员通常理解该表述的含义来予以解释(例如,“具有A、B或C中至少一个的***”应包括但不限于单独具有A、单独具有B、单独具有C、具有A和B、具有A和C、具有B和C、和/或具有A、B、C的***等)。本领域技术人员还应理解,实质上任意表示两个或更多可选项目的转折连词和/或短语,无论是在说明书、权利要求书还是附图中,都应被理解为给出了包括这些项目之一、这些项目任一方、或两个项目的可能性。例如,短语“A或B”应当被理解为包括“A”或“B”、或“A和B”的可能性。
本公开的实施例提供了一种用于任务处理的方法、***及电子设备。该方法可以实现为分布式计算平台,分布式计算平台是一种支持应用程序在其上分布式执行的底层服务平台。该方法包括获取任务的任务类型和任务参数,根据所述任务类型,调用资源对象模板,并根据所述任务参数更新所述资源对象模板,根据所述更新后的资源对象模板,生成至少一个资源对象,以及根据所述资源对象,请求所述任务所需要的资源。本公开实施例提供的方法可以支持多种任务的分布式计算,使得开发人员不需要关心底层资源的调度和管理,降低了开发成本。例如,将本公开实施例提供的方法应用于机器学***台既可以支持多种深度学***台完成图像识别、语音识别、自然语言理解、天气预测等机器学习领域的开发。
图1示意性示出了根据本公开实施例的可以应用任务处理方法的示例性***架构100。
如图1所示,根据该实施例的***架构100可以包括终端设备101、102、103,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
用户可以使用终端设备101、102、103通过网络104与服务器105交互,以接收或发送消息等。终端设备101、102、103上可以安装有各种通讯客户端应用,例如购物类应用、网页浏览器应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等(仅为示例)。
终端设备101、102、103可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。
服务器105可以是提供各种服务的服务器,例如对用户利用终端设备101、102、103所浏览的网站提供支持的后台管理服务器(仅为示例)。后台管理服务器可以对接收到的用户请求等数据进行分析等处理,并将处理结果(例如根据用户请求获取或生成的网页、信息、或数据等)反馈给终端设备。
需要说明的是,本公开实施例所提供的任务处理方法一般可以由服务器105执行。相应地,本公开实施例所提供的任务处理装置一般可以设置于服务器105中。本公开实施例所提供的任务处理方法也可以由不同于服务器105且能够与终端设备101、102、103和/或服务器105通信的服务器或服务器集群执行。相应地,本公开实施例所提供的任务处理装置也可以设置于不同于服务器105且能够与终端设备101、102、103和/或服务器105通信的服务器或服务器集群中。
应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
图2示意性示出了根据本公开实施例的任务处理方法的流程图。
如图2所示,该方法包括在操作S210~S240。
在操作S210,获取任务的任务类型和任务参数。
在操作S220,根据所述任务类型,调用资源对象模板,并根据所述任务参数更新所述资源对象模板。
在操作S230,根据所述更新后的资源对象模板,生成至少一个资源对象。
在操作S240,根据所述资源对象,请求所述任务所需要的资源。
该方法通过资源对象模板,可以支持多种任务,使得开发人员不需要关心底层资源的调度和管理,降低了开发成本。
根据本公开的实施例,在操作S210,获取任务的任务类型和任务参数可以是由用户在控制台选择和输入的相关任务类型和任务参数,例如,使用的深度学习框架、启动参数等。具体地,例如,用户选择的是用TensorFlow(一种深度学习框架)进行模型训练,那么提供的任务参数应该包含参数服务器的数量,申请CPU(中央处理器)数量,GPU(图形处理器)数量,内存大小,共享存储盘的挂载路径,启动命令,启动参数等。可以理解的是根据不同的训练模型,任务参数不同。
根据本公开实施例,获取任务的任务类型和参数也可以是接收的用户自定义的镜像,从镜像中提取的任务的类型和任务参数。例如,用户通过***随机生成的用户名和密码登陆一个基于基础镜像的容器中,根据需要手动安装训练脚本的依赖包、设置运行环境,可以将训练脚本上传至特定位置,在启动命令中指定。上述操作完成后***利用已有技术将当前容器状态保存为镜像。此镜像可以用于后续流程中创建训练任务的容器时使用。这种用户自定义制作镜像的方式满足了***自动预处理过程中无法妥善处理的复杂依赖和环境安装的问题,使得该方法的适用性更好。
根据本公开实施例,在操作S220,根据上述任务类型,调用资源对象模板,并根据所述任务参数更新所述资源对象模板。该资源对象模板是通过预先设置的一个带参数的模板文件,将模板文件中的参数用在操作210所述的任务参数的取值替换资源对象模板中对应的任务参数,生成一个具体用于上述任务的资源对象模板。
例如,用户选择了TensorFlow进行模型训练,并提供了参数服务器的数量M,该***调用预先设置的TensorFlow训练模型的模板文件,预先设置的TensorFlow训练模型的模板文件中参数服务器的数量为a,则将TensorFlow训练模型的模板文件中的参数服务器的数量a用传递来的参数M替换。
根据本公开实施例,在操作S230,根据所述更新后的资源对象模板,生成至少一个资源对象。生成的资源对象模板需要通过编排产生出所需数量的资源对象。产生出的资源对象例如可以按照编号从零开始进行递增索引。根据本公开实施例,在操作S240,生成的各资源对象可以直接作为群集资源调度管理平台的输入,实现调度和资源的分配。
根据本公开实施例,所述任务可以是分布式训练任务,支持分布式训练任务,显著提高了深度学习模型的训练速度。所述任务类型可以是所述分布式训练所使用的执行引擎,例如TensorFlow、Caffe、MXNet,该方法支持多种执行引擎,降低了机器学习中代码的迁移成本和学习成本。
图3示意性示出了根据本公开另一实施例的任务处理方法的流程图。
如图3所示,该方法在图2所示意的实施例的基础上,还包括操作S310。
在操作S310,对所述任务进行预处理。
根据本公开的实施例,对所述任务进行预处理,可以是根据所述任务参数,解析所需要的依赖程序并进行安装。例如,根据用户定义的requirements或者shell等文件,获取所需要的依赖包名和版本号,从源或外网下载安装。如果脚本较多,可以打包上传,***将脚本解包,并将用户提供的启动命令和参数传到下个模块,供启动分布式计算任务时使用。
根据本公开的实施例,对所述任务进行预处理,也可以是根据所述任务参数,规范化所要处理的数据。例如,利用提供的处理脚本根据需要处理用户上传的数据,将原始数据转化为脚本可以直接读取的数据。
根据本公开的实施例,对所述任务进行预处理,还可以是优化任务脚本。例如,可以对任务脚本进行检测,在检测到错误时可以进行错误提示,或者检测到任务脚本中存在冗余时,可以进行提示或自动优化。该方法通过预处理,简化任务执行时的工作量。
图4示意性示出了根据本公开实施例的任务处理***400的框图。
如图4所示,该任务处理***400包括,获取模块410、模板调用模块420、对象生成模块430和资源请求模块440。
获取模块410,例如执行上文参考图2描述的操作S210,用于获取任务的任务类型和任务参数。
模板调用模块420,例如执行上文参考图2描述的操作S220,用于根据所述任务类型,调用资源对象模板,并根据所述任务参数更新所述资源对象模板。
对象生成模块430,例如执行上文参考图2描述的操作S230,用于根据所述更新后的资源对象模板,生成至少一个资源对象。
资源请求模块440,例如执行上文参考图2描述的操作S240,用于根据所述资源对象,请求所述任务所需要的资源。
图5示意性示出了根据本公开另一实施例的任务处理***500的框图。
如图5所示,该***在图4所示意的实施例的基础上,还包括预处理模块510。
预处理模块510,例如执行上文参考图3描述的操作S310,用于对所述任务进行预处理。
图6示意性示出了根据本公开实施例的预处理模块510的框图。
如图6所示,该预处理模块510包括,安装子模块511、规范化子模块512和优化子模块513。
安装子模块511,用于根据所述任务参数,解析所需要的依赖程序并进行安装。
规范化子模块512,用于根据所述任务参数,规范化所要处理的数据。
优化子模块513,用于优化任务脚本。
可以理解的是,预处理模块510可以包括上述安装子模块511、规范化子模块512和优化子模块513的一种、两种、或三种模块的任意组合。
图7示意性示出了根据本公开实施例的获取模块410的框图。
如图7所示,该获取模块410包括提取子模块411。
提取子模块411,用于接收用户自定义的镜像,从所述镜像中提取所述任务的任务类型和任务参数。
可以理解的是,获取模块410、模板调用模块420、对象生成模块430、资源请求模块440、预处理模块510、安装子模块511、规范化子模块512、优化子模块513以及提取子模块411可以合并在一个模块中实现,或者其中的任意一个模块可以被拆分成多个模块。或者,这些模块中的一个或多个模块的至少部分功能可以与其他模块的至少部分功能相结合,并在一个模块中实现。根据本发明的实施例,上述模块中的至少一个可以至少被部分地实现为硬件电路,例如现场可编程门阵列(FPGA)、可编程逻辑阵列(PLA)、片上***、基板上的***、封装上的***、专用集成电路(ASIC),或可以以对电路进行集成或封装的任何其他的合理方式等硬件或固件来实现,或以软件、硬件以及固件三种实现方式的适当组合来实现。或者,上述模块中的至少一个可以至少被部分地实现为计算机程序模块,当该程序被计算机运行时,可以执行相应模块的功能。
图8示意性示出了根据本公开实施例的适于实现任务处理方法的计算机***的方框图。
图8示出的计算机***仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
如图8所示,根据本公开实施例的计算机***800包括处理器801,其可以根据存储在只读存储器(ROM)802中的程序或者从存储部分808加载到随机访问存储器(RAM)803中的程序而执行各种适当的动作和处理。处理器801例如可以包括通用微处理器(例如CPU)、指令集处理器和/或相关芯片组和/或专用微处理器(例如,专用集成电路(ASIC)),等等。处理器810还可以包括用于缓存用途的板载存储器。处理器810可以包括用于执行参考图2或图3描述的根据本公开实施例的方法流程的不同动作的单一处理单元或者是多个处理单元。
在RAM 803中,存储有***800操作所需的各种程序和数据。处理器801、ROM 802以及RAM 803通过总线804彼此相连。处理器801通过执行ROM 802和/或RAM 803中的程序来执行以上参考图2或图3描述的根据本公开实施例的方法的各种操作。需要注意,所述程序也可以存储在除ROM 802和RAM 803以外的一个或多个存储器中。处理器801也可以通过执行存储在所述一个或多个存储器中的程序来执行以上参考图2或图3描述的根据本公开实施例的方法的各种操作。
根据本公开的实施例,***800还可以包括输入/输出(I/O)接口805,输入/输出(I/O)接口805也连接至总线804。***800还可以包括连接至I/O接口805的以下部件中的一项或多项:包括键盘、鼠标等的输入部分806;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分807;包括硬盘等的存储部分808;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分809。通信部分809经由诸如因特网的网络执行通信处理。驱动器610也根据需要连接至I/O接口805。可拆卸介质611,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器610上,以便于从其上读出的计算机程序根据需要被安装入存储部分808。
根据本公开的实施例,上文参考流程图描述的方法可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分809从网络上被下载和安装,和/或从可拆卸介质611被安装。在该计算机程序被处理器801执行时,执行本公开实施例的***中限定的上述功能。根据本公开的实施例,上文描述的***、设备、装置、模块、单元等可以通过计算机程序模块来实现。
需要说明的是,本公开所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的***、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行***、装置或者器件使用或者与其结合使用。而在本公开中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行***、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF等等,或者上述的任意合适的组合。根据本公开的实施例,计算机可读介质可以包括上文描述的ROM 802和/或RAM 803和/或ROM 802和RAM 803以外的一个或多个存储器。
附图中的流程图和框图,图示了按照本公开各种实施例的***、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的***来实现,或者可以用专用硬件与计算机指令的组合来实现。
作为另一方面,本公开还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的设备中所包含的;也可以是单独存在,而未装配入该设备中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被一个该设备执行时,使得该设备执行参考图2或图3描述的根据本公开实施例的方法。
以上对本公开的实施例进行了描述。但是,这些实施例仅仅是为了说明的目的,而并非为了限制本公开的范围。尽管在以上分别描述了各实施例,但是这并不意味着各个实施例中的措施不能有利地结合使用。本公开的范围由所附权利要求及其等同物限定。不脱离本公开的范围,本领域技术人员可以做出多种替代和修改,这些替代和修改都应落在本公开的范围之内。

Claims (12)

1.一种任务处理方法,包括:
获取任务的任务类型和任务参数;
根据所述任务类型,调用资源对象模板,并根据所述任务参数更新所述资源对象模板;
根据所述更新后的资源对象模板,生成至少一个资源对象;以及
根据所述资源对象,请求所述任务所需要的资源。
2.根据权利要求1所述的方法,其中,在所述获取任务的任务类型和任务参数之后,所述方法还包括:
对所述任务进行预处理。
3.根据权利要求2所述的方法,其中,所述对所述任务进行预处理包括以下至少一种:
根据所述任务参数,解析所需要的依赖程序并进行安装;
根据所述任务参数,规范化所要处理的数据;或者
优化任务脚本。
4.根据权利要求1所述的方法,其中,所述获取任务的任务类型和任务参数包括:
接收用户自定义的镜像,从所述镜像中提取所述任务的任务类型和任务参数。
5.根据权利要求1所述的方法,其中:
所述任务包括分布式训练任务;以及
所述任务类型包括所述分布式训练所使用的执行引擎。
6.一种任务处理***,包括:
获取模块,用于获取任务的任务类型和任务参数;
模板调用模块,用于根据所述任务类型,调用资源对象模板,并根据所述任务参数更新所述资源对象模板;
对象生成模块,用于根据所述更新后的资源对象模板,生成至少一个资源对象;以及
资源请求模块,用于根据所述资源对象,请求所述任务所需要的资源。
7.根据权利要求1所述的***,还包括:
预处理模块,用于对所述任务进行预处理。
8.根据权利要求7所述的***,其中,所述预处理模块包括以下至少一种:
安装子模块,用于根据所述任务参数,解析所需要的依赖程序并进行安装;
规范化子模块,用于根据所述任务参数,规范化所要处理的数据;或者
优化子模块,用于优化任务脚本。
9.根据权利要求6所述的***,其中,所述获取模块包括:
提取子模块,用于接收用户自定义的镜像,从所述镜像中提取所述任务的任务类型和任务参数。
10.根据权利要求6所述的***,其中:
所述任务包括分布式训练任务;以及
所述任务类型包括所述分布式训练所使用的执行引擎。
11.一种电子设备,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
其中,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器执行如权利要求1~5中任意一项所述的方法。
12.一种计算机可读介质,其上存储有可执行指令,该指令被处理器执行时使处理器执行如权利要求1~5中任意一项所述的方法。
CN201710951710.6A 2017-10-12 2017-10-12 任务处理方法、***及电子设备 Pending CN107844371A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710951710.6A CN107844371A (zh) 2017-10-12 2017-10-12 任务处理方法、***及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710951710.6A CN107844371A (zh) 2017-10-12 2017-10-12 任务处理方法、***及电子设备

Publications (1)

Publication Number Publication Date
CN107844371A true CN107844371A (zh) 2018-03-27

Family

ID=61662325

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710951710.6A Pending CN107844371A (zh) 2017-10-12 2017-10-12 任务处理方法、***及电子设备

Country Status (1)

Country Link
CN (1) CN107844371A (zh)

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108764605A (zh) * 2018-04-04 2018-11-06 北京潘达互娱科技有限公司 一种任务发布方法、装置、电子设备及存储介质
CN109471718A (zh) * 2018-10-12 2019-03-15 平安科技(深圳)有限公司 基于人脸识别的计算资源配置方法、装置、设备及介质
CN109739514A (zh) * 2018-12-21 2019-05-10 北京中科寒武纪科技有限公司 参数处理方法及相关产品
CN109857475A (zh) * 2018-12-27 2019-06-07 深圳云天励飞技术有限公司 一种框架管理的方法及装置
CN110647996A (zh) * 2018-06-08 2020-01-03 上海寒武纪信息科技有限公司 通用机器学习模型的执行方法、装置和存储介质
CN110689134A (zh) * 2018-07-05 2020-01-14 第四范式(北京)技术有限公司 执行机器学习过程的方法、装置、设备以及存储介质
CN111105006A (zh) * 2018-10-26 2020-05-05 杭州海康威视数字技术股份有限公司 一种深度学习网络训练***及方法
CN111488211A (zh) * 2020-04-09 2020-08-04 北京嘀嘀无限科技发展有限公司 基于深度学习框架的任务处理方法、装置、设备及介质
CN112288344A (zh) * 2019-07-24 2021-01-29 北京京东乾石科技有限公司 排产任务数据处理方法、装置、设备及存储介质
CN112714909A (zh) * 2018-09-18 2021-04-27 微软技术许可有限责任公司 合成数据任务的分类和资源分配的协调
US11036480B2 (en) 2018-06-08 2021-06-15 Shanghai Cambricon Information Technology Co., Ltd. General machine learning model, and model file generation and parsing method
US11699073B2 (en) 2018-12-29 2023-07-11 Cambricon Technologies Corporation Limited Network off-line model processing method, artificial intelligence processing device and related products

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1889047A (zh) * 2005-06-27 2007-01-03 腾讯科技(深圳)有限公司 一种实现程序资源共享的***及方法
CN101821709A (zh) * 2007-09-11 2010-09-01 西安姆贝拉有限公司 用于工作流生成、调度和/或执行的***、方法和图形用户界面
CN102096596A (zh) * 2010-11-29 2011-06-15 华中科技大学 一种基于虚拟机内存模板的云计算服务Cache***
CN105007323A (zh) * 2015-07-22 2015-10-28 上海斐讯数据通信技术有限公司 一种云资源的编排***和方法
CN105183561A (zh) * 2015-09-02 2015-12-23 浪潮(北京)电子信息产业有限公司 一种资源分配方法和***
CN105577779A (zh) * 2015-12-21 2016-05-11 用友网络科技股份有限公司 一种容器化部署大企业私有云的方法和***
US20160364262A1 (en) * 2015-06-10 2016-12-15 Tata Consultancy Services Limited System and method for generating service operation implementation
CN106354563A (zh) * 2016-08-29 2017-01-25 广州市香港科大***研究院 用于3d重建的分布式计算***以及3d重建方法
CN106875152A (zh) * 2016-12-16 2017-06-20 新华三技术有限公司 一种任务创建方法及装置
CN107111519A (zh) * 2014-11-11 2017-08-29 亚马逊技术股份有限公司 用于管理和调度容器的***
CN107203424A (zh) * 2017-04-17 2017-09-26 北京奇虎科技有限公司 一种在分布式集群中调度深度学习作业的方法和装置

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1889047A (zh) * 2005-06-27 2007-01-03 腾讯科技(深圳)有限公司 一种实现程序资源共享的***及方法
CN101821709A (zh) * 2007-09-11 2010-09-01 西安姆贝拉有限公司 用于工作流生成、调度和/或执行的***、方法和图形用户界面
CN102096596A (zh) * 2010-11-29 2011-06-15 华中科技大学 一种基于虚拟机内存模板的云计算服务Cache***
CN107111519A (zh) * 2014-11-11 2017-08-29 亚马逊技术股份有限公司 用于管理和调度容器的***
US20160364262A1 (en) * 2015-06-10 2016-12-15 Tata Consultancy Services Limited System and method for generating service operation implementation
CN105007323A (zh) * 2015-07-22 2015-10-28 上海斐讯数据通信技术有限公司 一种云资源的编排***和方法
CN105183561A (zh) * 2015-09-02 2015-12-23 浪潮(北京)电子信息产业有限公司 一种资源分配方法和***
CN105577779A (zh) * 2015-12-21 2016-05-11 用友网络科技股份有限公司 一种容器化部署大企业私有云的方法和***
CN106354563A (zh) * 2016-08-29 2017-01-25 广州市香港科大***研究院 用于3d重建的分布式计算***以及3d重建方法
CN106875152A (zh) * 2016-12-16 2017-06-20 新华三技术有限公司 一种任务创建方法及装置
CN107203424A (zh) * 2017-04-17 2017-09-26 北京奇虎科技有限公司 一种在分布式集群中调度深度学习作业的方法和装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
乔玮: "分布式深度学习***的容器化调度机制的研究", 《PKUFINELAB》 *

Cited By (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108764605A (zh) * 2018-04-04 2018-11-06 北京潘达互娱科技有限公司 一种任务发布方法、装置、电子设备及存储介质
US11036480B2 (en) 2018-06-08 2021-06-15 Shanghai Cambricon Information Technology Co., Ltd. General machine learning model, and model file generation and parsing method
US11726754B2 (en) 2018-06-08 2023-08-15 Shanghai Cambricon Information Technology Co., Ltd. General machine learning model, and model file generation and parsing method
US11403080B2 (en) 2018-06-08 2022-08-02 Shanghai Cambricon Information Technology Co., Ltd. General machine learning model, and model file generation and parsing method
US11379199B2 (en) 2018-06-08 2022-07-05 Shanghai Cambricon Information Technology Co., Ltd. General machine learning model, and model file generation and parsing method
CN110647996A (zh) * 2018-06-08 2020-01-03 上海寒武纪信息科技有限公司 通用机器学习模型的执行方法、装置和存储介质
US11334329B2 (en) 2018-06-08 2022-05-17 Shanghai Cambricon Information Technology Co., Ltd. General machine learning model, and model file generation and parsing method
US11334330B2 (en) 2018-06-08 2022-05-17 Shanghai Cambricon Information Technology Co., Ltd. General machine learning model, and model file generation and parsing method
US11307836B2 (en) 2018-06-08 2022-04-19 Shanghai Cambricon Information Technology Co., Ltd. General machine learning model, and model file generation and parsing method
CN110689134A (zh) * 2018-07-05 2020-01-14 第四范式(北京)技术有限公司 执行机器学习过程的方法、装置、设备以及存储介质
CN112714909A (zh) * 2018-09-18 2021-04-27 微软技术许可有限责任公司 合成数据任务的分类和资源分配的协调
CN109471718A (zh) * 2018-10-12 2019-03-15 平安科技(深圳)有限公司 基于人脸识别的计算资源配置方法、装置、设备及介质
CN109471718B (zh) * 2018-10-12 2023-09-22 平安科技(深圳)有限公司 基于人脸识别的计算资源配置方法、装置、设备及介质
CN111105006A (zh) * 2018-10-26 2020-05-05 杭州海康威视数字技术股份有限公司 一种深度学习网络训练***及方法
CN111105006B (zh) * 2018-10-26 2023-08-04 杭州海康威视数字技术股份有限公司 一种深度学习网络训练***及方法
CN109739514B (zh) * 2018-12-21 2021-03-02 中科寒武纪科技股份有限公司 参数处理方法及相关产品
CN109739514A (zh) * 2018-12-21 2019-05-10 北京中科寒武纪科技有限公司 参数处理方法及相关产品
CN109857475B (zh) * 2018-12-27 2020-06-16 深圳云天励飞技术有限公司 一种框架管理的方法及装置
CN109857475A (zh) * 2018-12-27 2019-06-07 深圳云天励飞技术有限公司 一种框架管理的方法及装置
US11699073B2 (en) 2018-12-29 2023-07-11 Cambricon Technologies Corporation Limited Network off-line model processing method, artificial intelligence processing device and related products
CN112288344A (zh) * 2019-07-24 2021-01-29 北京京东乾石科技有限公司 排产任务数据处理方法、装置、设备及存储介质
CN111488211A (zh) * 2020-04-09 2020-08-04 北京嘀嘀无限科技发展有限公司 基于深度学习框架的任务处理方法、装置、设备及介质

Similar Documents

Publication Publication Date Title
CN107844371A (zh) 任务处理方法、***及电子设备
KR102342604B1 (ko) 뉴럴 네트워크 생성 방법 및 장치
CN110096344A (zh) 任务管理方法、***、服务器集群和计算机可读介质
CN107451109A (zh) 报表生成方法及***
CN108804327A (zh) 一种自动生成测试数据的方法和装置
CN108595628A (zh) 用于推送信息的方法和装置
CN107590186A (zh) 管理和执行数据处理策略的方法和策略引擎***
CN110020329A (zh) 用于生成网页的方法、装置和***
CN109981719A (zh) 信息处理方法及其***、计算机***和计算机可读介质
CN106896937A (zh) 用于输入信息的方法和装置
CN107656768A (zh) 控制页面跳转的方法及其***
CN107844324A (zh) 客户端页面跳转处理方法和装置
CN114911465B (zh) 算子的生成方法、装置、设备以及存储介质
CN110400201A (zh) 信息展示方法、装置、电子设备以及介质
CN107656911A (zh) 表格处理方法及其***
CN110007936A (zh) 数据处理方法和装置
CN114996619A (zh) 一种页面显示的方法、装置、计算机设备及存储介质
CN107305528A (zh) 应用测试方法和装置
CN107908662A (zh) 搜索***的实现方法和实现装置
CN108958826A (zh) 动态配置应用安装包的方法和装置
CN109992177A (zh) 电子设备的用户交互方法、***、电子设备及计算机介质
CN107515947A (zh) 图片加载方法及其***
CN109978650A (zh) 构建决策树的方法及***
CN109597912A (zh) 用于处理图片的方法
CN111580883B (zh) 应用程序启动方法、装置、计算机***和介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20180327

RJ01 Rejection of invention patent application after publication