CN113448739A - 一种数据处理方法及装置 - Google Patents

一种数据处理方法及装置 Download PDF

Info

Publication number
CN113448739A
CN113448739A CN202111015203.4A CN202111015203A CN113448739A CN 113448739 A CN113448739 A CN 113448739A CN 202111015203 A CN202111015203 A CN 202111015203A CN 113448739 A CN113448739 A CN 113448739A
Authority
CN
China
Prior art keywords
vector
memory
feature
identification
tensor
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202111015203.4A
Other languages
English (en)
Other versions
CN113448739B (zh
Inventor
袁满
陈浪石
张�杰
李永
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba China Co Ltd
Alibaba Cloud Computing Ltd
Original Assignee
Alibaba China Co Ltd
Alibaba Cloud Computing Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba China Co Ltd, Alibaba Cloud Computing Ltd filed Critical Alibaba China Co Ltd
Priority to CN202111015203.4A priority Critical patent/CN113448739B/zh
Publication of CN113448739A publication Critical patent/CN113448739A/zh
Application granted granted Critical
Publication of CN113448739B publication Critical patent/CN113448739B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5083Techniques for rebalancing the load in a distributed system
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/16Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5005Allocation of resources, e.g. of the central processing unit [CPU] to service a request
    • G06F9/5027Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals
    • G06F9/505Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals considering the load

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Analysis (AREA)
  • Computational Mathematics (AREA)
  • Algebra (AREA)
  • Databases & Information Systems (AREA)
  • Computing Systems (AREA)
  • Image Analysis (AREA)
  • Memory System Of A Hierarchy Structure (AREA)

Abstract

本申请提供了一种数据处理方法及装置。在本申请中,可以使用至少一个获取算子来执行“根据至少一个标识张量在分布式***中获取至少一个特征张量”的操作,如此实现使用较少的获取算子(例如使用一个获取算子等,使用的获取算子的数量可以少于多个特征向量的向量标识的数量等)即可获取到多个特征向量,如此,虽然标识张量中包括多个特征向量的向量标识,但是多个特征向量的向量标识均被同一个获取算子来执行操作,仅仅需要一次“启动算子”以及一次“调度算子”,减少了“启动算子”的次数以及“调度算子”的次数,从而可以节省获取多个特征向量的过程所需耗费的时间,提高获取多个特征向量的效率,以及节省硬件资源。

Description

一种数据处理方法及装置
技术领域
本申请涉及新一代信息技术领域,特别是涉及一种数据处理方法及装置。
背景技术
稀疏模型是输入样本中包含离散输入(categorical inputs/sparse inputs)特征的机器学习模型,广泛应用在搜索、广告以及推荐等领域。稀疏模型具有参数量大的特点,因此通常需要基于分布式计算集群才能完成对稀疏模型的训练,目前对稀疏模型的训练主要基于CPU(central processing unit,中央处理器)集群。然而,发明人发现,目前对稀疏模型的训练过程往往需要耗费较长时间,导致训练效率低,以及训练过程中占用的***资源多。
发明内容
本申请示出了一种数据处理方法及装置。
第一方面,本申请示出了一种基于分布式***的数据处理方法,所述分布式***中包括多个电子设备,各个电子设备分别存储模型中的一部分特征向量,所述方法应用于所述多个电子设备中的第一电子设备,所述方法包括:获取所述模型中的多个特征向量的向量标识;根据所述多个特征向量的向量标识生成至少一个标识张量;基于至少一个获取算子根据所述至少一个标识张量在所述分布式***中获取至少一个特征张量,所述至少一个特征张量中包括所述多个特征向量;对所述至少一个特征张量拆分,得到所述多个特征向量。
在一个可选的实现方式中,所述基于至少一个获取算子根据所述至少一个标识张量在所述分布式***中获取至少一个特征张量,包括:基于所述至少一个获取算子,在所述第一电子设备存储的特征向量中查找所述标识张量中的向量标识对应的特征向量;和/或,将所述标识张量中的向量标识分别发送给对应的特征向量所在的分布式***中的第二电子设备,并接收所述第二电子设备返回的、根据接收的向量标识查找到的特征向量;所述第二电子设备包括所述分布式***中的除所述第一电子设备以外的电子设备;基于所述至少一个获取算子,将接收的特征向量和/或在所述第一电子设备中查找到的特征向量缝合,得到所述特征张量。
在一个可选的实现方式中,所述在所述第一电子设备存储的特征向量中查找所述标识张量中的向量标识对应的特征向量,包括:在所述第一电子设备中的第一存储器中存储的特征向量中查找是否存在所述标识张量中的向量标识对应的特征向量;在存在所述标识张量中的向量标识对应的特征向量的情况下,获取第一存储器中存储的所述标识张量中的向量标识对应的特征向量,第一存储器中存储的所述标识张量中的向量标识对应的特征向量是事先在所述第一电子设备中的第二存储器中获取的并缓存在所述第一存储器中的;所述第一存储器的数据访问速率大于所述第二存储器的数据访问速率;在不存在所述标识张量中的向量标识对应的特征向量的情况下,在所述第二存储器中存储的特征向量中查找所述标识张量中的向量标识对应的特征向量。
在一个可选的实现方式中,所述方法还包括:获取在所述第二存储器中存储的所述模型中的各个特征向量分别被访问的频率;按照被访问的频率由高至低的顺序,在所述第二存储器中存储的所述模型中的各个特征向量中选择至少部分特征向量;在所述第一存储器中缓存所述至少部分特征向量。
在一个可选的实现方式中,所述方法还包括:在对所述模型进行多轮训练的其中一轮训练的过程中,在所述第二存储器中获取所述其中一轮训练之后的至少一轮训练所需使用的所述模型中的特征向量;在所述第一存储器中缓存所述至少一轮训练所需使用的所述模型中的特征向量。
在一个可选的实现方式中,所述根据所述多个特征向量的向量标识生成至少一个标识张量,包括:使用一个生成算子对所述多个特征向量的向量标识去重复,得到去重复后的向量标识,确定去重复后各个向量标识对应的特征向量所在的电子设备的数量,根据所述数量对去重复后的向量标识分片,得到分片后的向量标识,以及,根据分片后的向量标识生成至少两个标识张量。
在一个可选的实现方式中,所述方法还包括:获取在获取所述模型中的多个特征向量的过程中所需使用所述第一电子设备中的硬件资源的种类;根据所述种类的数量以及负载均衡原则对所述模型中的特征向量分组,得到多个的特征向量组。
在一个可选的实现方式中,所述模型中包括多个特征矩阵,各个特征矩阵中包括至少两个特征向量;所述根据所述种类的数量以及负载均衡原则对所述模型中的特征向量分组,得到多个的特征向量组,包括:将所述多个特征矩阵划分为所述数量个的特征矩阵组,各个特征矩阵组中包括的特征向量的数量之间的差异小于预设差异。
在一个可选的实现方式中,所述根据所述多个特征向量的向量标识生成至少一个标识张量,包括:将所述多个特征向量的向量标识按照对应的特征向量所在的特征向量组分组,得到至少两个向量标识组;根据每一个向量标识组中的向量标识分别生成一个标识张量,得到至少两个标识张量。
在一个可选的实现方式中,所述基于至少一个获取算子根据所述至少一个标识张量在所述分布式***中获取至少一个特征张量,包括:根据至少两个标识张量中的第一标识张量依次调取所述第一电子设备中的多个种类的硬件资源,以通过调取的硬件资源在特征向量组中获取所述第一标识张量中向量标识对应的特征向量;以及,根据至少两个标识张量中的第二标识张量依次调取所述多个种类的硬件资源,以通过调取的硬件资源在特征向量组中获取所述第二标识张量中向量标识对应的特征向量;所述第二标识张量包括所述至少两个标识张量中的除所述第一标识张量以外的标识张量;且,在根据所述第二标识张量依次调取所述多个种类的硬件资源的过程中,在需要根据第二标识张量调取所述多个种类中的目标种类的硬件资源的情况下,判断所述目标种类的硬件资源是否正在被使用;在所述目标种类的硬件资源未正在被使用的情况下,再根据所述第二标识张量调取所述目标种类的硬件资源。
第二方面,本申请示出了一种数据处理方法,所述方法包括:
在训练稀疏模型的过程中或在使用已训练得到的稀疏模型处理数据的过程中,如果需要获取稀疏模型中的多个特征向量中的目标特征向量,在第一存储器中查找所述目标特征向量;
在所述第一存储器中查找到所述目标特征向量的情况下,响应所述目标特征向量;所述目标特征向量是事先根据所述第二存储器中存储的所述多个特征向量分别被访问的频率由高至低的顺序,在所述多个特征向量中选择并缓存在所述第一存储器中的,所述第一存储器的数据访问速率大于所述第二存储器的数据访问速率。
第三方面,本申请示出了一种数据处理方法,所述方法包括:
在需要对稀疏模型进行多轮训练的下一轮训练的情况下,在第一存储器中获取所述下一轮训练所需使用的所述稀疏模型中的特征向量;使用所述特征向量对所述稀疏模型进行多轮训练的下一轮训练;所述特征向量是事先对所述稀疏模型进行多轮训练的上一轮训练的情况下在所述第二存储器中获取并缓存在所述第一存储器中的,所述第一存储器的数据访问速率大于所述第二存储器的数据访问速率。
第四方面,本申请示出了一种基于分布式***的数据处理装置,所述分布式***中包括多个电子设备,各个电子设备分别存储模型中的一部分特征向量,所述装置应用于所述多个电子设备中的第一电子设备,所述装置包括:第一获取模块,用于获取所述模型中的多个特征向量的向量标识;生成模块,用于根据所述多个特征向量的向量标识生成至少一个标识张量;第二获取模块,用于基于至少一个获取算子根据所述至少一个标识张量在所述分布式***中获取至少一个特征张量,所述至少一个特征张量中包括所述多个特征向量;拆分模块,用于对所述至少一个特征张量拆分,得到所述多个特征向量。
在一个可选的实现方式中,所述第二获取模块包括:查找单元,用于基于所述至少一个获取算子,在所述第一电子设备存储的特征向量中查找所述标识张量中的向量标识对应的特征向量;和/或,发送单元,用于将所述标识张量中的向量标识分别发送给对应的特征向量所在的分布式***中的第二电子设备,接收单元,用于接收所述第二电子设备返回的、根据接收的向量标识查找到的特征向量;所述第二电子设备包括所述分布式***中的除所述第一电子设备以外的电子设备;缝合单元,用于基于所述至少一个获取算子,将接收的特征向量和/或在所述第一电子设备中查找到的特征向量缝合,得到所述特征张量。
在一个可选的实现方式中,所述查找单元包括:第一查找子单元,用于在所述第一电子设备中的第一存储器中存储的特征向量中查找是否存在所述标识张量中的向量标识对应的特征向量;第一获取子单元,用于在存在所述标识张量中的向量标识对应的特征向量的情况下,获取第一存储器中存储的所述标识张量中的向量标识对应的特征向量,第一存储器中存储的所述标识张量中的向量标识对应的特征向量是事先在所述第一电子设备中的第二存储器中获取的并缓存在所述第一存储器中的;所述第一存储器的数据访问速率大于所述第二存储器的数据访问速率;第二查找子单元,用于在不存在所述标识张量中的向量标识对应的特征向量的情况下,在所述第二存储器中存储的特征向量中查找所述标识张量中的向量标识对应的特征向量。
在一个可选的实现方式中,所述查找单元还包括:第二获取子单元,用于获取在所述第二存储器中存储的所述模型中的各个特征向量分别被访问的频率;选择子单元,用于按照被访问的频率由高至低的顺序,在所述第二存储器中存储的所述模型中的各个特征向量中选择至少部分特征向量;第一缓存子单元,用于在所述第一存储器中缓存所述至少部分特征向量。
在一个可选的实现方式中,所述查找单元还包括:第三获取子单元,用于在对所述模型进行多轮训练的其中一轮训练的过程中,在所述第二存储器中获取所述其中一轮训练之后的至少一轮训练所需使用的所述模型中的特征向量;第二缓存子单元,用于在所述第一存储器中缓存所述至少一轮训练所需使用的所述模型中的特征向量。
在一个可选的实现方式中,所述生成模块具体用于:使用一个生成算子对所述多个特征向量的向量标识去重复,得到去重复后的向量标识,确定去重复后各个向量标识对应的特征向量所在的电子设备的数量,根据所述数量对去重复后的向量标识分片,得到分片后的向量标识,以及,根据分片后的向量标识生成至少两个标识张量。
在一个可选的实现方式中,所述装置还包括:第三获取模块,用于获取在获取所述模型中的多个特征向量的过程中所需使用所述第一电子设备中的硬件资源的种类;分组模块,用于根据所述种类的数量以及负载均衡原则对所述模型中的特征向量分组,得到多个的特征向量组。
在一个可选的实现方式中,所述模型中包括多个特征矩阵,各个特征矩阵中包括至少两个特征向量;所述分组模块具体用于:将所述多个特征矩阵划分为所述数量个的特征矩阵组,各个特征矩阵组中包括的特征向量的数量之间的差异小于预设差异。
在一个可选的实现方式中,所述生成模块包括:分组单元,用于将所述多个特征向量的向量标识按照对应的特征向量所在的特征向量组分组,得到至少两个向量标识组;生成单元,用于根据每一个向量标识组中的向量标识分别生成一个标识张量,得到至少两个标识张量。
在一个可选的实现方式中,所述第二获取模块包括:第一调取单元,用于根据至少两个标识张量中的第一标识张量依次调取所述第一电子设备中的多个种类的硬件资源,以通过调取的硬件资源在特征向量组中获取所述第一标识张量中向量标识对应的特征向量;第二调取单元,用于根据至少两个标识张量中的第二标识张量依次调取所述多个种类的硬件资源,以通过调取的硬件资源在特征向量组中获取所述第二标识张量中向量标识对应的特征向量;所述第二标识张量包括所述至少两个标识张量中的除所述第一标识张量以外的标识张量;判断单元,用于在根据所述第二标识张量依次调取所述多个种类的硬件资源的过程中,在需要根据第二标识张量调取所述多个种类中的目标种类的硬件资源的情况下,判断所述目标种类的硬件资源是否正在被使用;第三调取单元,用于在所述目标种类的硬件资源未正在被使用的情况下,再根据所述第二标识张量调取所述目标种类的硬件资源。
第五方面,本申请示出了一种数据处理装置,所述装置包括:查找模块,用于在训练稀疏模型的过程中或在使用已训练得到的稀疏模型处理数据的过程中,如果需要获取稀疏模型中的多个特征向量中的目标特征向量,在第一存储器中查找所述目标特征向量;响应模块,用于在所述第一存储器中查找到所述目标特征向量的情况下,响应所述目标特征向量;所述目标特征向量是事先根据所述第二存储器中存储的所述多个特征向量分别被访问的频率由高至低的顺序,在所述多个特征向量中选择并缓存在所述第一存储器中的,所述第一存储器的数据访问速率大于所述第二存储器的数据访问速率。
第六方面,本申请示出了一种数据处理装置,所述装置包括:第四获取模块,用于在需要对稀疏模型进行多轮训练的下一轮训练的情况下,在第一存储器中获取所述下一轮训练所需使用的所述稀疏模型中的特征向量;训练模块,用于使用所述特征向量对所述稀疏模型进行多轮训练的下一轮训练;所述特征向量是事先对所述稀疏模型进行多轮训练的上一轮训练的情况下在所述第二存储器中获取并缓存在所述第一存储器中的,所述第一存储器的数据访问速率大于所述第二存储器的数据访问速率。
第七方面,本申请示出了一种电子设备,所述电子设备包括:处理器;用于存储处理器可执行指令的存储器;其中,所述处理器被配置为执行如第一方面所述的方法。
第八方面,本申请示出了一种非临时性计算机可读存储介质,当所述存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行如第一方面所述的方法。
第九方面,本申请示出了一种计算机程序产品,当所述计算机程序产品中的指令由电子设备的处理器执行时,使得电子设备能够执行如第一方面所述的方法。
第十方面,本申请示出了一种电子设备,所述电子设备包括:处理器;用于存储处理器可执行指令的存储器;其中,所述处理器被配置为执行如第二方面所述的方法。
第十一方面,本申请示出了一种非临时性计算机可读存储介质,当所述存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行如第二方面所述的方法。
第十二方面,本申请示出了一种计算机程序产品,当所述计算机程序产品中的指令由电子设备的处理器执行时,使得电子设备能够执行如第二方面所述的方法。
第十三方面,本申请示出了一种电子设备,所述电子设备包括:处理器;用于存储处理器可执行指令的存储器;其中,所述处理器被配置为执行如第三方面所述的方法。
第十四方面,本申请示出了一种非临时性计算机可读存储介质,当所述存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行如第三方面所述的方法。
第十五方面,本申请示出了一种计算机程序产品,当所述计算机程序产品中的指令由电子设备的处理器执行时,使得电子设备能够执行如第三方面所述的方法。
与现有技术相比,本申请实施例包括以下优点:
在一个情况下,获取各个向量标识分别对应的特征向量的操作是相互独立的。也即,对于多个特征向量的向量标识中的任意一个向量标识,是单独地获取该向量标识对应的特征向量,为了能够获取该向量标识对应的特征向量,在一个方式中,是单独地使用一个获取算子来获取该向量标识对应的特征向量,对于多个特征向量的向量标识中的其他每一个向量标识,同样如此。
可见,上述方式中,针对每一个向量标识都需要使用一个获取算子。
对于获取算子而言,如果需要使用获取算子获取向量标识对应的特征向量,则需要启动获取算子,将获取算子调度至需要操作的对象(例如向量标识等),然后才能使用获取算子执行“获取向量标识对应的特征向量”的操作。
可见,上述过程涉及到“启动算子”-“调度算子”-“执行操作”的流程,实际上“执行操作”才能达到获取向量标识对应的特征向量的目的,前面的“启动算子”以及“调度算子”等并非是执行操作,但是又是必须存在的。这样,实际上非“执行操作”以外的“启动算子”以及“调度算子”等会耗费时间且占用硬件资源。
在向量标识较多(需要单独获取的特征向量较多)的情况下,则会耗费更多的“启动算子”以及“调度算子”的时间,且关于“启动算子”以及“调度算子”会浪费更多的硬件资源。
而在本申请中,可以使用至少一个获取算子来执行“根据至少一个标识张量在分布式***中获取至少一个特征张量”的操作,如此实现使用较少的获取算子(例如使用一个获取算子等,使用的获取算子的数量可以少于多个特征向量的向量标识的数量等)即可获取到多个特征向量,如此,虽然标识张量中包括多个特征向量的向量标识,但是多个特征向量的向量标识均被同一个获取算子来执行操作,仅仅需要一次“启动算子”以及一次“调度算子”,减少了“启动算子”的次数以及“调度算子”的次数,从而可以节省获取多个特征向量的过程所需耗费的时间,提高获取多个特征向量的效率,以及节省硬件资源。
附图说明
图1是本申请示出的一种数据处理方法的流程示意图。
图2是本申请示出的一种数据处理方法的流程示意图。
图3是本申请示出的一种数据处理方法的流程示意图。
图4是本申请示出的一种分布式***的结构框图。
图5是本申请示出的一种基于分布式***的数据处理方法的流程示意图。
图6是本申请示出的一种基于分布式***的数据处理装置的结构框图。
图7是本申请示出的一种数据处理装置的结构框图。
图8是本申请示出的一种数据处理装置的结构框图。
图9是本申请示出的一种装置的结构示意图。
具体实施方式
为使本申请的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本申请作进一步详细的说明。
参照图1,示出了本申请的一种数据处理方法的流程示意图,该方法应用于电子设备中,该方法可以包括:
在步骤S101中,在需要获取模型中的多个特征向量中的目标特征向量的情况下,在电子设备中的第一存储器中查找目标特征向量。
在本申请中,在训练模型的过程中或在模型训练完毕之后使用模型处理线上数据的过程中,需要获取模型中的特征向量。模型包括稀疏模型等,当然,也可以包括其他类型的模型,本申请对模型的类型不加以限定。
模型中包括多个特征向量,在训练模型的过程中的不同阶段或者使用模型处理线上数据的过程中的不同阶段,需要使用模型中的特征向量不尽相同,在需要使用模型中的某一部分特征向量的情况下,电子设备可以获取模型中的这一部分特征向量。
在本申请一个实施例中,模型中的多个特征向量均存储在第二存储器中,第二存储器包括:电子设备中的CPU中的主存储器等。
其中,事先可以将第二存储器中存储的模型中的多个特征向量中的至少一部分特征向量缓存在第一存储器中,第一存储器的数据访问速率大于第二存储器的数据访问速率。这样,之后在需要获取模型中的该至少一部分特征向量的情况下,可以不在第二存储器中获取模型中的该至少一部分特征向量,可以直接在第一存储器中的获取模型中的该至少一部分特征向量,从而提高获取模型中的该至少一部分特征向量的速率,进而可以提高训练模型的效率或者基于模型处理线上数据的效率等。
第一存储器包括:电子设备中的GPU(Graphics Processing Unit,图形处理器)中的存储器等。
其中,将第二存储器中存储的模型中的多个特征向量中的至少一部分特征向量缓存在第一存储器中的具体流程可以参见之后所示的流程,在此不做详述。
在第一存储器中查找到目标特征向量的情况下,在步骤S102中,响应目标特征向量。
在本申请中,在第二存储器中存储的模型中的目标特征向量事先可能已被缓存至第一存储器中,也可能未被缓存至第一存储器中。
在目标特征向量事先已被缓存至第一存储器中的情况下,则就可以在第一存储器中查找到目标特征向量,之后就可以响应目标特征向量。
在本申请中,响应目标特征向量包括使用目标特征向量训练模型或使用特征向量处理线上数据等。
在第一存储器中未查找到目标特征向量的情况下,在步骤S103中,在电子设备中的第二存储器中查找目标特征向量,并响应目标特征向量。
其中,第一存储器的数据访问速率大于第二存储器的数据访问速率。
在目标特征向量事先未被缓存至第一存储器中的情况下,则就无法在第一存储器中查找到目标特征向量,为了能够得到目标特征向量,就可以在电子设备中的第二存储器中查找目标特征向量,之后可以响应目标特征向量。
在本申请中,在需要获取模型中的多个特征向量中的目标特征向量的情况下,在电子设备中的第一存储器中查找目标特征向量。在第一存储器中查找到目标特征向量的情况下,响应目标特征向量。在第一存储器中未查找到目标特征向量的情况下,在电子设备中的第二存储器中查找目标特征向量,并响应目标特征向量,其中,第一存储器的数据访问速率大于第二存储器的数据访问速率。
如此,在需要获取模型中的多个特征向量中的目标特征向量的情况下,电子设备可以在第一存储器中直接获取目标特征向量,然后就可以响应目标特征向量,例如,基于目标特征向量训练模型或者基于目标特征向量处理线上数据等,由于第一存储器的数据访问速率大于第二存储器的数据访问速率,因此,本申请可以提高获取模型中的特征向量的速率,从而可以提高基于特征向量训练模型的效率以及基于特征向量处理线上数据的效率等。
其次,目标特征向量可以为模型中的多个特征向量中的被访问的频率高的特征向量,属于热点特征向量,类似于“大象流”,如此,目标特征向量可以为模型中的多个特征向量中的在当前时刻所在的时间段内被访问的频率高的特征向量。目标特征向量在当前时刻所在的时间段内会被访问的频率往往大于第二存储器中存储的模型中的非目标特征向量以外的其他特征向量在当前时刻所在的时间段内会被访问的频率,如此,在训练模型或者使用模型处理线上数据的情况下,目标特征向量被使用的次数往往多于模型中的非目标特征向量以外的其他特征向量被使用的次数,因此,本申请可以尽可能地使得在第一存储器中获取被使用的频率高的特征向量,所以,本申请可以尽可能地提高训练模型的效率以及基于模型处理线上数据的效率等。
在本申请一个实施例中,需要获取的目标特征向量为多个。其中,多个目标特征向量之间的具有排列顺序。在使用多个目标特征向量训练模型或者使用多个目标特征向量处理线上数据的情况下,需要将多个目标特征向量按照该排列顺序组合后,再使用组合后的目标特征向量训练模型或者使用组合后目标的特征向量处理线上数据。
其中,多个目标特征向量中的一部分目标特征向量在第一存储器中被查找到,多个目标特征向量中的另一部分目标特征向量在第二存储器中被查找到。
由于第一存储器的数据访问速率大于第二存储器的数据访问速率,因此,为了提高响应目标特征向量的效率,在图1所示的实施例的基础之上,响应目标特征向量的流程包括:将在第二存储器中查找到的该另一部分目标特征向量出传递至第一存储器中,以及获取多个目标特征向量中的各个目标特征向量之间的排列顺序。之后可以在第一存储器中,将多个目标特征向量按照各个目标特征向量之间的排列顺序组合,并响应组合后的多个目标特征向量。
在本申请一个实施例中,在第一存储器中或第二存储器中查找目标特征向量的过程,是根据目标特征向量的向量标识在第一存储器中或第二存储器中查找目标特征向量,在一个例子中,是在第一存储器中或第二存储器中存储的向量标识与特征向量之间的对应关系中,查找与特征向量的向量标识相对应的特征向量,并作为目标特征向量。
在起初需要获取模型中的多个特征向量中的多个目标特征向量的情况下,就会得到各个目标特征向量的向量标识,也会获知各个目标特征向量的向量标识之间的排列顺序,因此,可以将各个目标特征向量的向量标识之间的排列顺序作为各个目标特征向量之间的排列顺序等。
在本申请另一实施例中,参见图2,该方法还包括:
在步骤S201中,获取在第二存储器中存储的模型中的各个特征向量分别被访问的频率。
在本申请中,第二存储器中存储有模型中的各个特征向量等,第二存储器中存储的模型中的各个特征向量可以供电子设备中的处理器(例如CPU以及GPU)等访问等。
在一个场景中,在电子设备对模型训练的过程中,往往需要获取第二存储器中存储的模型中的特征向量,然后根据训练数据以及获取的模型中的特征向量进行相关计算,具体计算方式根据模型而定,在此不做详述。
在电子设备对模型训练的过程中,在不同的时刻或者不同的阶段需要使用的模型中的特征向量不同。
如此,在电子设备对模型训练了一段时间之后,对于第二存储器中存储的模型中的各个特征向量分别被访问的情况可能不同,例如,各个特征向量在一段时间内被访问的频率不同等等。
特征向量被访问的频率包括:在当前时刻之前且与当前时刻较近的时间段内特征向量被访问的频率等。
在一个例子中,在当前时刻之前且与当前时刻较近的时间段包括:以当前时刻为结束时刻的时间段。例如,以当前时刻为结束时刻的持续2秒的时长、持续3秒的时长或者持续5秒的时长等,当然,也可以为以当前时刻为结束时刻的持续10秒的时长、持续20秒的时长或持续50秒的时长等,本申请对具体时长不做限定。
在本申请中,对于第二存储器中存储的模型中的任意一个特征向量,每当该特征向量被访问一次,则可以在第二存储器中存储的向量标识与被访问的次数之间的对应关系中,增加与该特征向量的向量标识相对应的被访问的次数,对于第二存储器中存储的模型中的其他每一个特征向量,同样如此。
因此,在本步骤中,可以根据在第二存储器中存储的向量标识与被访问的次数之间的对应关系,获取在第二存储器中存储的模型中的各个特征向量被访问的频率。
在步骤S202中,按照被访问的频率由高至低的顺序,在第二存储器中存储的模型中的各个特征向量中选择至少部分特征向量。
在本申请中,第二存储器中存储有模型中的多个特征向量。在训练模型的过程中或在使用模型处理线上数据的过程中均需要使用模型中的特征向量,在需要使用模型中的特征向量的情况下,在一种方式中,可以在第二存储器中获取需要使用的特征向量。
然而,在本申请中,第二存储器的接口带宽较低,导致第二存储器的数据访问速率较低,这就导致电子设备在第二存储器中获取模型中的特征向量的速率低,进而会导致电子设备训练模型的效率低或使用模型处理线上数据的效率低。
因此,为了提高电子设备训练模型的效率或使用模型处理线上数据的效率,在本申请中,可以提高电子设备获取模型中的特征向量的速率。
为了提高电子设备获取模型中的特征向量的速率,可以设置至少一个第一存储器,第一存储器的数据访问速率大于第二存储器的数据访问速率,也即,电子设备在第一存储器中访问数据的速率大于在第二存储器中访问数据的速率。
进一步地,可以将第二存储器中存储的模型的特征向量中的一部分特征向量先缓存在第一存储器中,以使之后电子设备在需要获取模型中的这部分特征向量的情况下,可以直接在第一存储器中获取这部分特征向量。
由于电子设备在第一存储器中访问数据的速率大于在第二存储器中访问数据的速率,因此,可以提高电子设备获取这部分特征向量的速率,进而提高电子设备训练模型的效率或使用模型处理线上数据的效率。
在本申请中,第二存储器中存储的模型中的特征向量有多个,在训练模型的过程中的不同阶段或者在使用模型处理线上数据的不同阶段,电子设备需要获取的第二存储器中的特征向量不尽相同,在这些特征向量中,有些特征向量在当前时刻所在的时间段内被访问的次数会非常多,有些特征向量在当前时刻所在的时间段内被访问的次数会较少,在当前时刻所在的时间段内被访问的次数非常多的特征向量在训练模型的过程中涉及的阶段就越多或者在使用模型处理线上处理的过程中涉及的阶段就越多,在当前时刻所在的时间段内被访问的次数非常少的特征向量在训练模型的过程中涉及的阶段就越少或者在使用模型处理线上处理的过程中涉及的阶段就越少。
因此,为了尽可能地提高电子设备训练模型的效率或使用模型处理线上数据的效率,在本申请另一实施例中,可以将第二存储器中存储的模型中的多个特征向量中的被访问的频率较高的特征向量缓存在第一存储器中。具体地,可以将多个特征向量中的被访问的频率的topN个特征向量缓存在第一存储器中。N包括正整数,例如5、10、15或20等,具体数值可以根据实际情况而定,本申请对此不加以限定。
在一个例子中,可以按照被访问的频率由高至低的顺序,在第二存储器中存储的模型中的各个特征向量中选择至少部分特征向量,该至少部分特征向量可以包括一个特征向量或者为至少两个特征向量等,具体数量可以根据实际情况而定,在此不做详述。
在步骤S203中,在第一存储器中缓存该至少部分特征向量。
在本申请中,对于该至少部分特征向量中的任意一个特征向量,可以将第二存储器中的该特征向量复制一份,将复制得到的该特征向量缓存在第一存储器中,这样,第一存储器和第二存储器中都具备有该特征向量。或者,也可以直接该特征向量从第二存储器剪切至第一存储器中,这样,第二存储器中就不再存在该特征向量,从而可以节省第二存储器的存储空间,之后也可以在需要的时候将该特征向量重新从第一存储器剪切至第二存储器中。其中,如果第一存储器已经缓存了该特征向量,则不需要重复在第一存储器中缓存该特征向量了。
对于该至少部分特征向量中的其他每一个特征向量,同样如此。
在本申请中,该至少部分特征向量被访问的频率较高,往往说明:相比于第二存储器中除该至少部分特征向量以外的其他特征向量,该至少部分特征向量短期内被访问的次数会更多,该至少部分特征向量在训练模型的过程中涉及的阶段就越多或者在使用模型处理线上处理的过程中涉及的阶段就越多,因此,在第一存储器中缓存该至少部分特征向量,可以提高训练模型的效率或使用模型处理线上数据的效率。
在本申请一个实施例中,通过图2所示的实施例在第一存储器中缓存第二存储器中存储的被访问频率高的至少部分特征向量的流程可以是周期性的,也即,每间隔一段时间就可以执行图2所示的实施例,以提高在第一存储器中缓存的特征向量是被访问的频率高的特征向量的准确性以及时效性。
在本申请中,在需要在第一存储器中缓存该至少部分特征向量的情况下,有时候第一存储器中的空闲存储空间大于或等于该至少部分特征向量的所占空间,这样,第一存储器就可以容纳该至少部分特征向量,因此,可以直接在第一存储器中缓存该至少部分特征向量。
然而,有时候第一存储器中已存储有模型中的其他特征向量,导致第一存储器中的空闲存储空间小于该至少部分特征向量的所占空间,这样,第一存储器就无法容纳该至少部分特征向量,也就无法直接在第一存储器中缓存该至少部分特征向量,之后电子设备也就无法在第一存储器中获取该至少部分特征向量,导致无法提高获取该至少部分特征向量的速率,进而导致无法提高训练模型的效率或使用模型处理线上数据的效率。
因此,为了解决上述问题,在图2所示的实施例的基础之上,在本申请一个实施例中,在第一存储器中缓存该至少部分特征向量之前,参见图3,该方法还包括:
在步骤S301中,确定第一存储器的空闲存储空间是否小于该至少部分特征向量的所占空间。
在第一存储器的空闲存储空间大于或等于该至少部分特征向量的所占空间的情况下,可以直接在第一存储器中缓存该至少部分特征向量。
而在第一存储器的空闲存储空间小于该至少部分特征向量的所占空间的情况下,为了能够在第一存储器中缓存该至少部分特征向量,以使之后可以在第一存储器中获取该至少部分特征向量,以提高获取该至少部分特征向量的速率,进而提高训练模型的效率或使用模型处理线上数据的效率,可以执行步骤S302。
在第一存储器的空闲存储空间小于该至少部分特征向量的所占空间的情况下,在步骤S302中,获取第一存储器中存储的模型中的特征向量分别被访问的频率。
在步骤S303中,依照第一存储器中存储的模型中的各个特征向量分别被访问的频率由低至高的顺序,删除第一存储器中存储的模型中的至少一个特征向量,以使第一存储器的空闲存储空间大于或等于该至少部分特征向量的所占空间,然后再执行步骤S203:在第一存储器中缓存该至少部分特征向量。
这样第一存储器就可以容纳该至少部分特征向量,也就可以在第一存储器中缓存该至少部分特征向量,之后电子设备就可以在第一存储器中获取该至少部分特征向量,从而提高获取该至少部分特征向量数据的速率,进而提高训练模型的效率或使用模型处理线上数据的效率。
其中,可以先在第一存储器中删除被访问的频率最低的一个特征向量,如果此时第一存储器的空闲存储空间还小于该至少部分特征向量的所占空间,则继续在第一存储空间中的剩余的特征向量中删除被访问的频率最低的一个特征向量,直至第一存储器的空闲存储空间大于或等于该至少部分特征向量的所占空间为止。
其中,在第一存储器中,被访问的频率高的特征向量在之后短期内被访问的次数往往大于被访问的频率低的特征向量在之后短期内被访问的次数,被访问的频率高的特征向量在训练模型的过程中涉及的阶段或者在使用模型处理线上处理的过程中涉及的阶段就会多于被访问的频率低的特征向量在训练模型的过程中涉及的阶段或者在使用模型处理线上处理的过程中涉及的阶段,因此,在第一存储器中,优先删除被访问的频率低的特征向量,而保留被访问的频率高的特征向量,可以尽可能地提高训练模型的效率或使用模型处理线上数据的效率。
以一个例子对本申请进行举例说明,但不作为对本申请保护范围的限制。在训练稀疏模型的过程中或在使用已训练得到的稀疏模型处理数据的过程中,如果需要获取稀疏模型中的多个特征向量中的目标特征向量,在第一存储器中查找目标特征向量;在第一存储器中查找到目标特征向量的情况下,响应目标特征向量;目标特征向量是事先根据第二存储器中存储的多个特征向量分别被访问的频率由高至低的顺序,在多个特征向量中选择并缓存在第一存储器中的,第一存储器的数据访问速率大于第二存储器的数据访问速率。
在本申请一个实施例中,在训练模型的过程中,可以对模型进行多轮训练,每一轮训练时涉及的模型中的特征向量不尽相同。也即,在进行一轮训练时需要获取的模型中的特征向量与在进行下一轮时需要获取的模型中的特征向量不尽相同。
对于任意一轮训练,在需要获取该轮训练所需使用的特征向量时,为了能够在第一存储器中获取该轮训练所需使用的特征向量以提高获取特征向量的速率,在该轮训练开始之前,可以在第一存储器中缓存该轮训练所需使用的特征向量,以使之后在进行该轮训练时,可以直接在第一存储器中获取该轮训练所需使用的特征向量以提高获取特征向量的速率,进而提高训练模型的效率。
进一步地,为了节省第一存储器的存储空间,在本申请另一实施例中,在该轮训练结束之后,可以在第一存储器中删除该轮训练所需使用的特征向量。
对于其他每一轮训练,同样如此。
在一个例子中,在对模型进行多轮训练的其中一轮训练的过程中,可以在第二存储器中获取该其中一轮训练之后的至少一轮训练所需使用的模型中的特征向量,然后在第一存储器中缓存该其中一轮训练之后的至少一轮训练所需使用的模型中的特征向量,以供之后在进行该至少一轮训练时,可以直接在第一存储器中获取该至少一轮训练所需使用的模型中的特征向量,进而提高训练模型的效率。
进一步地,为了节省第一存储器的存储空间,在本申请另一实施例中,在该至少一轮训练结束之后,可以在第一存储器中删除该至少一轮训练所需使用的模型中的特征向量。
以一个例子对本申请进行举例说明,但不作为对本申请保护范围的限制。在需要对稀疏模型进行多轮训练的下一轮训练的情况下,在第一存储器中获取下一轮训练所需使用的稀疏模型中的特征向量;使用特征向量对稀疏模型进行多轮训练的下一轮训练;特征向量是事先对稀疏模型进行多轮训练的上一轮训练的情况下在第二存储器中获取并缓存在第一存储器中的,第一存储器的数据访问速率大于第二存储器的数据访问速率。
在多轮训练中,上一轮训练与下一轮训练可以相邻,且上一轮训练位于下一轮训练之前。
在本申请一个实施例中,电子设备可以根据第一存储器的实际使用情况来确定第一存储器中用来缓存模型中的特征向量的缓存空间,缓存空间可以提供用户选择权供用户选择,也可以根据实际情况作自适应调整。
或者,在本申请另一个实施例,用户可以控制电子设备显示调整界面,调整界面中包括用于调整第一存储器中用来缓存模型中的特征向量的缓存空间的调整控件,用户可以通过操作调整控件来实现调整第一存储器中用来缓存模型中的特征向量的缓存空间。
在本申请又一实施例中,用户可以控制电子设备显示设置界面,设置界面中包括用于设置在第一存储器中缓存模型中的特征向量的策略的设置控件。
策略包括以下至少两种:
1、根据第二存储器中存储的模型中的多个特征向量分别被访问的频率由高至低的顺序在多个特征向量中选择一部分特征向量且缓存在第一存储器中。
2、在对稀疏模型进行多轮训练的上一轮训练的情况下在第二存储器中获取下一轮训练所需使用的稀疏模型中的特征向量并缓存在第一存储器中。
用户可以通过操控设置控件来实现设置在第一存储器中缓存模型中的特征向量的策略。
参照图4,示出了本申请的一种分布式***的结构框图,分布式***包括多个电子设备,多个电子设备之间两两通信连接。
电子设备可以包括前端设备,也可以包括后端设备。
前端设备包括广大用户可以直接操控的设备,例如,手机、平板电脑或者笔记本电脑等。
后端设备可以包括服务器等。
在本申请中,模型中包括多个特征向量,分布式***中的各个电子设备中分别存储有模型中的一部分特征向量,且各个电子设备存储的模型中的特征向量不同或者不重叠。各个特征向量均有各自的向量标识,不同的特征向量的向量标识不同。
其中,模型可以包括稀疏模型等。
参照图5,示出了本申请一数据处理方法的流程示意图,该方法应用于图4所示的第一电子设备中,第一电子设备为图4所示的分布式***中的多个电子设备中的其中一个电子设备,该方法可以包括:
在步骤S401中,获取模型中的多个特征向量的向量标识。
在本申请中,在训练模型的过程中或在使用模型处理线上数据的过程中,需要获取模型中的特征向量。
模型中包括大量的特征向量,在训练模型的过程中的不同阶段或者使用模型处理线上数据的过程中的不同阶段,需要使用模型中的特征向量不尽相同,在需要使用某一部分特征向量的情况下,第一电子设备可以获取这一部分特征向量。
其中,在一个阶段需要获取模型中的多个特征向量的情况下,第一电子设备首先会得到多个特征向量的向量标识,然后根据多个特征向量的向量标识获取多个特征向量。
多个特征向量的向量标识可以是该一个阶段之前的且相邻的上一个阶段输出的结果等。
在步骤S402中,根据多个特征向量的向量标识生成至少一个标识张量。
在本申请一个实施例中,可以将多个特征向量的向量标识合并为一个标识张量。例如,使用concat操作将多个特征向量的向量标识合并为一个标识张量。
或者,在本申请另一个实施例中,可以将多个特征向量的向量标识拆分为至少两部分,然后根据每一部分的特征向量分别生成一个标识张量,得到至少两个标识张量,不同的标识张量中的向量标识不重叠。
在步骤S403中,基于至少一个获取算子根据至少一个标识张量在分布式***中获取至少一个特征张量,至少一个特征张量中包括多个特征向量。
在步骤S404中,对至少一个特征张量拆分,得到多个特征向量。
在本申请一个实施例中,如果在步骤S402中得到一个标识张量,则在步骤S403中根据该标识张量可以在分布式***中获取一个特征张量,该一个特征张量中包括多个特征向量,该一个特征张量中的多个特征向量之间的顺序与该标识张量中的向量标识之间的顺序相同。如此,在步骤S404中可以对该特征张量拆分,按照顺序依次得到各个向量标识分别对应的特征向量,从而得到多个特征向量。
在本申请另一个实施例中,如果在步骤S402中得到至少两个标识张量,则在步骤S403中根据每一个标识张量可以分别在分布式***中获取一个特征张量,共得到至少两个特征张量,每一个特征向量中包括至少两个特征向量,每一个特征张量中的至少两个特征向量之间的顺序与特征张量对应的标识张量中对应的向量标识之间的顺序相同。如此,在步骤S404中可以对每一个特征张量分别拆分,按照顺序依次得到各个向量标识分别对应的特征向量,从而得到多个特征向量。
在一个情况下,获取各个向量标识分别对应的特征向量的操作是相互独立的。也即,对于多个特征向量的向量标识中的任意一个向量标识,是单独地获取该向量标识对应的特征向量,为了能够获取该向量标识对应的特征向量,在一个方式中,是单独地使用一个获取算子来获取该向量标识对应的特征向量,对于多个特征向量的向量标识中的其他每一个向量标识,同样如此。
可见,上述方式中,针对每一个向量标识都需要使用一个获取算子。
对于获取算子而言,如果需要使用获取算子获取向量标识对应的特征向量,则需要启动获取算子,将获取算子调度至需要操作的对象(例如向量标识等),然后才能使用获取算子执行“获取向量标识对应的特征向量”的操作。
可见,上述过程涉及到“启动算子”-“调度算子”-“执行操作”的流程,实际上“执行操作”才能达到获取向量标识对应的特征向量的目的,前面的“启动算子”以及“调度算子”等并非是执行操作,但是又是必须存在的。这样,实际上非“执行操作”以外的“启动算子”以及“调度算子”等会耗费时间且占用硬件资源。
在向量标识较多(需要单独获取的特征向量较多)的情况下,则会耗费更多的“启动算子”以及“调度算子”的时间,且关于“启动算子”以及“调度算子”会浪费更多的硬件资源。
而在本申请中,可以使用至少一个获取算子来执行“根据至少一个标识张量在分布式***中获取至少一个特征张量”的操作,如此实现使用较少的获取算子(例如使用一个获取算子等,使用的获取算子的数量可以少于多个特征向量的向量标识的数量等)即可获取到多个特征向量,如此,虽然标识张量中包括多个特征向量的向量标识,但是多个特征向量的向量标识均被同一个获取算子来执行操作,仅仅需要一次“启动算子”以及一次“调度算子”,减少了“启动算子”的次数以及“调度算子”的次数,从而可以节省获取多个特征向量的过程所需耗费的时间,提高获取多个特征向量的效率,以及节省硬件资源。
在本申请一个实施例中,由于在分布式***中的各个电子设备中分别存储了模型中的一部分特征向量,因此,多个特征向量可能分布在多个电子设备中。
如此,对于第一电子设备而言,第一电子设备本地可能存储了一部分特征向量,或者,第一电子设备本地可能并未存储任意一个特征向量,以及,分布式***中的除第一电子设备以外的多个第二电子设备中可能分别存储有多个特征向量中的一部分特征向量。
这样,对于第一电子设备而言,如果第一电子设备需要基于至少一个获取算子根据至少一个标识张量在分布式***中获取至少一个特征张量,则第一电子设备可以基于至少一个获取算子将标识张量中的向量标识分别发送给对应的特征向量所在的分布式***中的第二电子设备,并接收第二电子设备返回的、根据接收的向量标识查找到的特征向量。
例如,对于标识张量中的任意一个向量标识,第一电子设备可以确定该向量标识所对应的特征向量所在的第二电子设备,然后向该向量标识所对应的特征向量所在的第二电子设备发送该向量标识,以使第二电子设备查找该向量标识所对应的特征向量,并向第一电子设备返回该向量标识所对应的特征向量。然后第一电子设备可以接收第二电子设备返回的该向量标识所对应的特征向量。对于标识张量中的其他每一个向量标识,同样如此。
第二电子设备包括分布式***中的除第一电子设备以外的电子设备。
其中,需要说明的是,第一电子设备从第二电子设备中获取各个向量标识分别对应的特征向量的操作均是基于一个获取算子来执行的。
另外,如果第一电子设备存储的有部分特征向量,则第一电子设备还可以基于至少一个获取算子在第一电子设备存储的特征向量中查找标识张量中的向量标识对应的特征向量。
之后,可以基于至少一个获取算子,将接收的特征向量和/或在第一电子设备本地查找到的特征向量缝合,得到特征张量。
其中,在一种方式中,可以使用一个通信算子执行“将标识张量中的向量标识分别发送给对应的特征向量所在的分布式***中的第二电子设备”的操作,使用另一个通信算子执行“接收第二电子设备返回的、根据接收的向量标识查找到的特征向量”的操作,使用查找算子执行“在第一电子设备存储的特征向量中查找标识张量中的向量标识对应的特征向量”的操作,以及使用缝合算子执行“将接收的特征向量和/或在第一电子设备本地查找到的特征向量缝合,得到特征张量”的操作。
可见,上述四个操作需要分别使用四个算子,对于每一个算子而言,如果需要使用算子执行一个操作,则需要启动算子,将算子调度至需要操作的对象(例如特征向量或者特征向量的向量标识等),然后才能使用算子对需要操作的对象执行操作,可见,上述过程涉及到“启动算子”-“调度算子”-“执行操作”的流程,实际上“执行操作”才能达到目的,前面的“启动算子”以及“调度算子”并非是执行操作,但是又是必须存在的。这样,实际上非“执行操作”以外的“启动算子”以及“调度算子”等会耗费时间且占用硬件资源。
在需要先后执行多个操作且各个操作使用的算子不同的情况下,则会耗费更多的“启动算子”以及“调度算子”的时间,且关于“启动算子”以及“调度算子”会浪费更多的硬件资源。
而在本申请中,使用一个获取算子执行“将标识张量中的向量标识分别发送给对应的特征向量所在的分布式***中的第二电子设备,并接收第二电子设备返回的、根据接收的向量标识查找到的特征向量。和/或,在第一电子设备存储的特征向量中查找标识张量中的向量标识对应的特征向量,将接收的特征向量和/或在第一电子设备本地查找到的特征向量缝合,得到特征张量”的操作。
如此,虽然“将标识张量中的向量标识分别发送给对应的特征向量所在的分布式***中的第二电子设备,并接收第二电子设备返回的、根据接收的向量标识查找到的特征向量。和/或,在第一电子设备存储的特征向量中查找标识张量中的向量标识对应的特征向量,将接收的特征向量和/或在第一电子设备本地查找到的特征向量缝合,得到特征张量”的过程涉及先后4个不同的操作,但是,4个不同的操作均使用一个算子来执行,仅仅需要一次“启动算子”以及一次“调度算子”,减少了“启动算子”的次数以及“调度算子”的次数,从而可以节省时间,提高效率,以及节省硬件资源。
在第一电子设备存储的特征向量中查找标识张量中的向量标识对应的特征向量时,可以在第一电子设备中的第一存储器中存储的特征向量中查找是否存在标识张量中的向量标识对应的特征向量;在第一存储器中存在标识张量中的向量标识对应的特征向量的情况下,获取第一存储器中存储的标识张量中的向量标识对应的特征向量,第一存储器中存储的标识张量中的向量标识对应的特征向量是事先在第一电子设备中的第二存储器中获取的并缓存在第一存储器中的;第一存储器的数据访问速率大于第二存储器的数据访问速率;在第一存储器中不存在标识张量中的向量标识对应的特征向量的情况下,在第二存储器中存储的特征向量中查找标识张量中的向量标识对应的特征向量。
由于第一存储器的数据访问速率大于第二存储器的数据访问速率,因此,本申请实施例可以提高在第一电子设备存储的特征向量中查找标识张量中的向量标识对应的特征向量的速率,从而可以提高基于特征向量训练模型的效率以及基于特征向量处理线上数据的效率等。
其中,为了使得能够在获取第一存储器中存储的标识张量中的向量标识对应的特征向量,在本申请一个实施例中,事先可以获取在第二存储器中存储的模型中的各个特征向量分别被访问的频率;按照被访问的频率由高至低的顺序,在第二存储器中存储的模型中的各个特征向量中选择至少部分特征向量;在第一存储器中缓存至少部分特征向量。具体可以参考之前所示的实施例,在此不做详述。
或者,在本申请另一个实施例中,在对模型进行多轮训练的其中一轮训练的过程中,在第二存储器中获取其中一轮训练之后的至少一轮训练所需使用的模型中的特征向量;在第一存储器中缓存至少一轮训练所需使用的模型中的特征向量。具体可以参考之前所示的实施例,在此不做详述。
在本申请另一实施例中,在根据多个特征向量的向量标识生成至少一个标识张量时,可以对多个特征向量的向量标识去重复,得到去重复后的向量标识,确定去重复后各个向量标识对应的特征向量所在的电子设备的数量,根据该数量对去重复后的向量标识分片,得到分片后的向量标识,以及根据分片后的向量标识生成至少两个标识张量。
需要说明的是,上述“对多个特征向量的向量标识去重复,得到去重复后的向量标识,确定去重复后各个向量标识对应的特征向量所在的电子设备的数量,根据该数量对去重复后的向量标识分片,得到分片后的向量标识,以及根据分片后的向量标识生成至少两个标识张量”的操作可以是基于一个生成算子执行的。
其中,在一种方式中,可以使用去重复算子执行“对多个特征向量的向量标识去重复,得到去重复后的向量标识”的操作,以及,使用确定算子执行“确定去重复后各个向量标识对应的特征向量所在的电子设备的数量”的操作,使用分片算子执行“根据该数量对去重复后的向量标识分片,得到分片后的向量标识”的操作,使用生成算子执行“根据分片后的向量标识生成至少两个标识张量”的操作。可见,上述四个操作需要分别使用四个不同的算子,对于每一个算子而言,如果需要使用算子执行一个操作,则需要启动算子,将算子调度至需要操作的对象(例如特征向量等等),然后才能使用算子对需要操作的对象执行操作,可见,上述过程涉及到“启动算子”-“调度算子”-“执行操作”的流程,实际上“执行操作”才能达到目的,前面的“启动算子”以及“调度算子”并非是执行操作,但是又是必须存在的。这样,实际上非“执行操作”以外的“启动算子”以及“调度算子”等会耗费时间且占用硬件资源。
在需要先后执行多个操作且各个操作使用的算子不同的情况下,则会耗费更多的“启动算子”以及“调度算子”的时间,且关于“启动算子”以及“调度算子”会浪费更多的硬件资源。
而在本申请中,使用一个生成算子执行“对多个特征向量的向量标识去重复,得到去重复后的向量标识,确定去重复后各个向量标识对应的特征向量所在的电子设备的数量,根据该数量对去重复后的向量标识分片,得到分片后的向量标识,以及根据分片后的向量标识生成至少两个标识张量”的操作。
如此,虽然“对多个特征向量的向量标识去重复,得到去重复后的向量标识,确定去重复后各个向量标识对应的特征向量所在的电子设备的数量,根据该数量对去重复后的向量标识分片,得到分片后的向量标识,以及根据分片后的向量标识生成至少两个标识张量”的过程涉及先后4个不同的操作,但是,4个不同的操作均使用一个算子来执行,仅仅需要一次“启动算子”以及一次“调度算子”,减少了“启动算子”的次数以及“调度算子”的次数,从而可以节省时间,提高效率,以及节省硬件资源。
其中,在前述实施例的基础之上,为了提高第一电子设备在根据多个特征向量的向量标识在分布式***中获取多个特征向量的效率,在本申请另一实施例中,可以对在分布式***中分布式存储的模型中的特征向量分组,之后在根据多个特征向量的向量标识在分布式***中获取多个特征向量时,可以按照模型中的分组后的特征向量,将多个特征向量的向量标识分组,得到至少两个向量标识组;然后分别根据各个向量标识组在分布式***中获取对应的特征向量,且在“分别根据各个向量标识组在分布式***中获取对应的特征向量”的过程中,针对不同的向量标识组进行交错掩盖,以提高获取多个特征向量的并行率,进而提高获取多个特征向量的效率。
具体地,在一个实施例中,在对分布式***中分布式存储的模型中的多个特征向量分组时,可以通过如下流程实现,包括:
11)、获取在获取模型中的特征向量的过程中所需使用的分布式***中的第一电子设备中的硬件资源的种类。
其中,第一电子设备在“根据多个特征向量的向量标识在分布式***中获取多个特征向量”的过程中,往往会使用到第一电子设备中的多个种类的硬件资源,例如,包括CPU资源、GPU资源以及网络带宽等等。
12)、根据种类的数量以及负载均衡原则对模型中的特征向量分组,得到多个的特征向量组。
可以将模型中的多个特征向量划分为该数量个的特征向量组,也可以将模型中的多个特征向量划分为该数量的若干倍数个的特征向量组。
例如,假设硬件资源的种类的数量为3,则可以将模型中的多个特征向量划分为3个特征向量组,也可以划分为6个特征向量组,也可以划分为9个特征向量组等,具体划分为几个特征向量组也可以根据实际情况而定,本申请对此不加以限定。
在本申请一个实施例中,模型中的特征向量往往是以特征矩阵的形式存在,模型中包括多个特征矩阵,各个特征矩阵中包括至少两个特征向量。
如此,在根据种类的数量以及负载均衡原则对模型中的特征向量分组,得到多个的特征向量组时,可以将多个特征矩阵划分为该数量个的特征矩阵组,各个特征矩阵组中包括的特征向量的数量之间的差异小于预设差异。
其中,对于任意一个特征向量组,该特征向量组中的特征向量可能来自至少两个不同的特征矩阵,因此,为了使得该特征向量组中的特征向量的向量标识具有唯一性,对于该特征向量组中的任意一个特征向量,可以根据该特征向量所在的特征矩阵的ID(Identity Document,身份识别号)与该特征向量在其所在的特征矩阵中的ID生成该特征向量的向量标识。
其中,不同的特征矩阵的ID不同,同一个特征矩阵中的不同的特征向量的ID不同,因此,使得各个特征向量组中的特征向量的向量标识不同。
其中,在前述实施例的基础上,在步骤S402根据多个特征向量的向量标识生成至少一个标识张量时,可以将多个特征向量的向量标识按照对应的特征向量所在的特征向量组分组,得到至少两个向量标识组。例如,对于任意一个特征向量的向量标识,第一电子设备可以根据该特征向量的向量标识确定出该特征向量所在的特征向量组,然后将该特征向量的向量标识纳入该特征向量组对应的向量标识组。对于其他每一个特征向量的向量标识,同样如此,从而就可以根据每一个向量标识组中的向量标识分别生成一个标识张量,得到至少两个标识张量。
相应地,在步骤S403基于至少一个获取算子根据至少一个标识张量在分布式***中获取至少一个特征张量时,可以根据至少两个标识张量中的第一标识张量依次调取第一电子设备中的多个种类的硬件资源,以通过调取的硬件资源在特征向量组中获取第一标识张量中向量标识对应的特征向量。
以及,根据至少两个标识张量中的第二标识张量依次调取第一电子设备中的多个种类的硬件资源,以通过调取的硬件资源在特征向量组中获取第二标识张量中向量标识对应的特征向量。第二标识张量包括至少两个标识张量中的除第一标识张量以外的标识张量。
且,在根据第二标识张量依次调取多个种类的硬件资源的过程中,在需要根据第二标识张量调取多个种类中的目标种类的硬件资源的情况下,判断目标种类的硬件资源是否正在被使用。
在目标种类的硬件资源未正在被使用的情况下,再根据第二标识张量调取目标种类的硬件资源。
在目标种类的硬件资源正在被使用的情况下,等待直至目标种类的硬件资源被释放(不再被使用),再根据第二标识张量调取目标种类的硬件资源。
其中,在第一电子设备在根据多个特征向量的向量标识在分布式***中获取多个特征向量时,在一个例子中,第一电子设备往往需要先使用GPU资源对多个特征向量的向量标识执行去重复操作以及分片操作等,然后再使用带宽资源向分布式***中的第二电子设备发送一部分特征向量的向量标识,以及,使用CPU资源在第一电子设备存储的模型中的一部分特征向量中,根据另一部分特征向量的向量标识查找另一部分特征向量。其次,在第二电子设备根据一部分特征向量的向量标识查找到一部分特征向量之后,再向第一电子设备返回一部分特征向量,第一电子设备再使用带宽资源接收第二电子设备返回的一部分特征向量。
可见,在上述例子中,第一电子设备依次需要使用到GPU资源-带宽资源-CPU资源-带宽资源。
如果是同时“根据多个特征向量的向量标识在分布式***中获取多个特征向量”,则在每一个操作阶段需要涉及的向量标识的数量即是全部特征向量的向量标识(即全量的向量标识)。
这样,在对所有向量标识调取完毕GPU资源之后,才能对所有向量标识继续调取带宽资源;在对所有向量标识调取完毕带宽资源之后,才能对所有向量标识继续调取CPU资源;在对所有向量标识调取完毕CPU资源之后,才能对所有向量标识继续调取带宽资源。
这就会使得在每一个操作阶段(需要使用一个种类的硬件资源)中对每一个向量标识所需耗费的等待时长较长,导致根据多个特征向量的向量标识在分布式***中获取多个特征向量的效率低。
且在一个操作阶段的过程中,其他操作阶段所需使用的其他种类的硬件资源可能会空闲,进而导致其他种类的硬件资源的利用率低。
而在本申请中,是将多个特征向量的向量标识按照对应的特征向量所在的特征向量组,划分为至少两个标识张量。
如此,在基于至少一个获取算子根据至少一个标识张量在分布式***中获取至少一个特征张量时,可以先根据一个标识张量开始依次调取第一电子设备中的多个种类的硬件资源,以通过调取的硬件资源在特征向量组中获取该一个标识张量中向量标识对应的特征向量。
且一旦基于该一个标识张量使用完毕需要使用的第一个种类的硬件资源,则就可以根据另一个标识张量开始依次调取第一电子设备多个种类的硬件资源,以通过调取的硬件资源在特征向量组中获取另一个标识张量中向量标识对应的特征向量。
以此类推,一旦基于另一个标识张量使用完毕需要使用的第一个种类的硬件资源,则就可以根据又一个标识张量开始依次调取第一电子设备多个种类的硬件资源,以通过调取的硬件资源在特征向量组中获取又一个标识张量中向量标识对应的特征向量。
且,在根据一个标识张量依次调取多个种类的硬件资源的过程中,在需要根据该一个标识张量调取多个种类中的目标种类的硬件资源的情况下,判断目标种类的硬件资源是否正在被使用。在目标种类的硬件资源未正在被使用的情况下,再根据该一个标识张量调取目标种类的硬件资源。
这样,在对一部分向量标识调取完毕GPU资源之后,不需要等待对其他向量标识调取完毕GPU资源就可以对该一部分向量标识继续调取带宽资源,同时,对另一部分向量标识调取GPU资源,在对另一部分向量标识调取完毕GPU资源之后,不需要等待对其他向量标识调取完毕GPU资源就可以对另一部分向量标识继续调取带宽资源,同时,对又一部分向量标识调取GPU资源。
如此可以在根据多个特征向量的向量标识在分布式***中获取多个特征向量的过程中的任意一个操作阶段(需要使用一个种类的硬件资源)中硬件资源尽量不空闲(也即硬件资源尽量被使用),从而可以提高硬件资源的利用率。
以及,可以降低在每一个操作阶段(需要使用一个种类的硬件资源)中对每一个向量标识所需耗费的等待时长,可以提高获取多个特征向量的并行率,进而提高根据多个特征向量的向量标识在分布式***中获取多个特征向量的效率。
另外,各个特征向量组之间的负载均衡程度越高,则硬件资源利用率的提高效果越好,以及获取多个特征向量的效率的提高效果也好。
其中,特征向量组中包括多个特征向量,特征向量包括多个数据,特征向量组的负载可以理解为特征向量组中包括的数据的数量等。
需要说明的是,对于方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限制,因为依据本申请,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于可选实施例,所涉及的动作并不一定是本申请所必须的。
参照图6,示出了本申请一种基于分布式***的数据处理装置的实施例的结构框图,所述分布式***中包括多个电子设备,各个电子设备分别存储模型中的一部分特征向量,所述装置应用于所述多个电子设备中的第一电子设备,所述装置包括:
第一获取模块11,用于获取所述模型中的多个特征向量的向量标识;生成模块12,用于根据所述多个特征向量的向量标识生成至少一个标识张量;第二获取模块13,用于基于至少一个获取算子根据所述至少一个标识张量在所述分布式***中获取至少一个特征张量,所述至少一个特征张量中包括所述多个特征向量;拆分模块14,用于对所述至少一个特征张量拆分,得到所述多个特征向量。
在一个可选的实现方式中,所述第二获取模块包括:查找单元,用于基于所述至少一个获取算子,在所述第一电子设备存储的特征向量中查找所述标识张量中的向量标识对应的特征向量;和/或,发送单元,用于将所述标识张量中的向量标识分别发送给对应的特征向量所在的分布式***中的第二电子设备,接收单元,用于接收所述第二电子设备返回的、根据接收的向量标识查找到的特征向量;所述第二电子设备包括所述分布式***中的除所述第一电子设备以外的电子设备;缝合单元,用于基于所述至少一个获取算子,将接收的特征向量和/或在所述第一电子设备中查找到的特征向量缝合,得到所述特征张量。
在一个可选的实现方式中,所述查找单元包括:第一查找子单元,用于在所述第一电子设备中的第一存储器中存储的特征向量中查找是否存在所述标识张量中的向量标识对应的特征向量;第一获取子单元,用于在存在所述标识张量中的向量标识对应的特征向量的情况下,获取第一存储器中存储的所述标识张量中的向量标识对应的特征向量,第一存储器中存储的所述标识张量中的向量标识对应的特征向量是事先在所述第一电子设备中的第二存储器中获取的并缓存在所述第一存储器中的;所述第一存储器的数据访问速率大于所述第二存储器的数据访问速率;第二查找子单元,用于在不存在所述标识张量中的向量标识对应的特征向量的情况下,在所述第二存储器中存储的特征向量中查找所述标识张量中的向量标识对应的特征向量。
在一个可选的实现方式中,所述查找单元还包括:第二获取子单元,用于获取在所述第二存储器中存储的所述模型中的各个特征向量分别被访问的频率;选择子单元,用于按照被访问的频率由高至低的顺序,在所述第二存储器中存储的所述模型中的各个特征向量中选择至少部分特征向量;第一缓存子单元,用于在所述第一存储器中缓存所述至少部分特征向量。
在一个可选的实现方式中,所述查找单元还包括:第三获取子单元,用于在对所述模型进行多轮训练的其中一轮训练的过程中,在所述第二存储器中获取所述其中一轮训练之后的至少一轮训练所需使用的所述模型中的特征向量;第二缓存子单元,用于在所述第一存储器中缓存所述至少一轮训练所需使用的所述模型中的特征向量。
在一个可选的实现方式中,所述生成模块具体用于:使用一个生成算子对所述多个特征向量的向量标识去重复,得到去重复后的向量标识,确定去重复后各个向量标识对应的特征向量所在的电子设备的数量,根据所述数量对去重复后的向量标识分片,得到分片后的向量标识,以及,根据分片后的向量标识生成至少两个标识张量。
在一个可选的实现方式中,所述装置还包括:第三获取模块,用于获取在获取所述模型中的多个特征向量的过程中所需使用所述第一电子设备中的硬件资源的种类;分组模块,用于根据所述种类的数量以及负载均衡原则对所述模型中的特征向量分组,得到多个的特征向量组。
在一个可选的实现方式中,所述模型中包括多个特征矩阵,各个特征矩阵中包括至少两个特征向量;所述分组模块具体用于:将所述多个特征矩阵划分为所述数量个的特征矩阵组,各个特征矩阵组中包括的特征向量的数量之间的差异小于预设差异。
在一个可选的实现方式中,所述生成模块包括:分组单元,用于将所述多个特征向量的向量标识按照对应的特征向量所在的特征向量组分组,得到至少两个向量标识组;生成单元,用于根据每一个向量标识组中的向量标识分别生成一个标识张量,得到至少两个标识张量。
在一个可选的实现方式中,所述第二获取模块包括:第一调取单元,用于根据至少两个标识张量中的第一标识张量依次调取所述第一电子设备中的多个种类的硬件资源,以通过调取的硬件资源在特征向量组中获取所述第一标识张量中向量标识对应的特征向量;第二调取单元,用于根据至少两个标识张量中的第二标识张量依次调取所述多个种类的硬件资源,以通过调取的硬件资源在特征向量组中获取所述第二标识张量中向量标识对应的特征向量;所述第二标识张量包括所述至少两个标识张量中的除所述第一标识张量以外的标识张量;判断单元,用于在根据所述第二标识张量依次调取所述多个种类的硬件资源的过程中,在需要根据第二标识张量调取所述多个种类中的目标种类的硬件资源的情况下,判断所述目标种类的硬件资源是否正在被使用;第三调取单元,用于在所述目标种类的硬件资源未正在被使用的情况下,再根据所述第二标识张量调取所述目标种类的硬件资源。
在一个情况下,获取各个向量标识分别对应的特征向量的操作是相互独立的。也即,对于多个特征向量的向量标识中的任意一个向量标识,是单独地获取该向量标识对应的特征向量,为了能够获取该向量标识对应的特征向量,在一个方式中,是单独地使用一个获取算子来获取该向量标识对应的特征向量,对于多个特征向量的向量标识中的其他每一个向量标识,同样如此。
可见,上述方式中,针对每一个向量标识都需要使用一个获取算子。
对于获取算子而言,如果需要使用获取算子获取向量标识对应的特征向量,则需要启动获取算子,将获取算子调度至需要操作的对象(例如向量标识等),然后才能使用获取算子执行“获取向量标识对应的特征向量”的操作。
可见,上述过程涉及到“启动算子”-“调度算子”-“执行操作”的流程,实际上“执行操作”才能达到获取向量标识对应的特征向量的目的,前面的“启动算子”以及“调度算子”等并非是执行操作,但是又是必须存在的。这样,实际上非“执行操作”以外的“启动算子”以及“调度算子”等会耗费时间且占用硬件资源。
在向量标识较多(需要单独获取的特征向量较多)的情况下,则会耗费更多的“启动算子”以及“调度算子”的时间,且关于“启动算子”以及“调度算子”会浪费更多的硬件资源。
而在本申请中,可以使用至少一个获取算子来执行“根据至少一个标识张量在分布式***中获取至少一个特征张量”的操作,如此实现使用较少的获取算子(例如使用一个获取算子等,使用的获取算子的数量可以少于多个特征向量的向量标识的数量等)即可获取到多个特征向量,如此,虽然标识张量中包括多个特征向量的向量标识,但是多个特征向量的向量标识均被同一个获取算子来执行操作,仅仅需要一次“启动算子”以及一次“调度算子”,减少了“启动算子”的次数以及“调度算子”的次数,从而可以节省获取多个特征向量的过程所需耗费的时间,提高获取多个特征向量的效率,以及节省硬件资源。
参照图7,示出了本申请一种数据处理装置的实施例的结构框图,具体可以包括如下模块:
查找模块21,用于在训练稀疏模型的过程中或在使用已训练得到的稀疏模型处理数据的过程中,如果需要获取稀疏模型中的多个特征向量中的目标特征向量,在第一存储器中查找所述目标特征向量;响应模块22,用于在所述第一存储器中查找到所述目标特征向量的情况下,响应所述目标特征向量;所述目标特征向量是事先根据所述第二存储器中存储的所述多个特征向量分别被访问的频率由高至低的顺序,在所述多个特征向量中选择并缓存在所述第一存储器中的,所述第一存储器的数据访问速率大于所述第二存储器的数据访问速率。
由于第一存储器的数据访问速率大于第二存储器的数据访问速率,因此,本申请可以提高获取模型中的特征向量的速率,从而可以提高基于特征向量训练模型的效率以及基于特征向量处理线上数据的效率等。
参照图8,示出了本申请一种数据处理装置的实施例的结构框图,具体可以包括如下模块:
第四获取模块31,用于在需要对稀疏模型进行多轮训练的下一轮训练的情况下,在第一存储器中获取所述下一轮训练所需使用的所述稀疏模型中的特征向量;训练模块32,用于使用所述特征向量对所述稀疏模型进行多轮训练的下一轮训练;所述特征向量是事先对所述稀疏模型进行多轮训练的上一轮训练的情况下在所述第二存储器中获取并缓存在所述第一存储器中的,所述第一存储器的数据访问速率大于所述第二存储器的数据访问速率。
由于第一存储器的数据访问速率大于第二存储器的数据访问速率,因此,本申请可以提高获取模型中的特征向量的速率,从而可以提高基于特征向量训练模型的效率以及基于特征向量处理线上数据的效率等。
本申请实施例还提供了一种非易失性可读存储介质,该存储介质中存储有一个或多个模块(programs),该一个或多个模块被应用在设备时,可以使得该设备执行本申请实施例中各方法步骤的指令(instructions)。
本申请实施例提供了一个或多个机器可读介质,其上存储有指令,当由一个或多个处理器执行时,使得电子设备执行如上述实施例中一个或多个所述的方法。本申请实施例中,所述电子设备包括服务器、网关、子设备等,子设备为物联网设备等设备。
本公开的实施例可被实现为使用任意适当的硬件,固件,软件,或及其任意组合进行想要的配置的装置,该装置可包括服务器(集群)、终端设备如IoT设备等电子设备。
图9示意性地示出了可被用于实现本申请中所述的各个实施例的示例性装置1300。
对于一个实施例,图9示出了示例性装置1300,该装置具有一个或多个处理器1302、被耦合到(一个或多个)处理器1302中的至少一个的控制模块(芯片组)1304、被耦合到控制模块1304的存储器1306、被耦合到控制模块1304的非易失性存储器(NVM)/存储设备1308、被耦合到控制模块1304的一个或多个输入/输出设备1310,以及被耦合到控制模块1304的网络接口1312。
处理器1302可包括一个或多个单核或多核处理器,处理器1302可包括通用处理器或专用处理器(例如图形处理器、应用处理器、基频处理器等)的任意组合。在一些实施例中,装置1300 能够作为本申请实施例中所述网关等服务器设备。
在一些实施例中,装置1300 可包括具有指令1314的一个或多个计算机可读介质(例如,存储器1306或NVM/ 存储设备1308) 以及与该一个或多个计算机可读介质相合并被配置为执行指令1314以实现模块从而执行本公开中所述的动作的一个或多个处理器1302。
对于一个实施例,控制模块1304可包括任意适当的接口控制器,以向(一个或多个)处理器1302中的至少一个和/或与控制模块1304通信的任意适当的设备或组件提供任意适当的接口。
控制模块1304可包括存储器控制器模块,以向存储器1306提供接口。存储器控制器模块可以是硬件模块、软件模块和/或固件模块。
存储器1306可被用于例如为装置1300加载和存储数据和/或指令1314。对于一个实施例,存储器1306可包括任意适当的易失性存储器,例如,适当的DRAM。在一些实施例中,存储器1306可包括双倍数据速率类型四同步动态随机存取存储器(DDR4SDRAM) 。
对于一个实施例,控制模块1304可包括一个或多个输入/输出控制器,以向NVM/存储设备1308及(一个或多个)输入/输出设备1310 提供接口。
例如,NVM/存储设备1308可被用于存储数据和/或指令1314。NVM/存储设备1308可包括任意适当的非易失性存储器(例如,闪存)和/或可包括任意适当的(一个或多个)非易失性存储设备(例如,一个或多个硬盘驱动器(HDD) 、一个或多个光盘(CD) 驱动器和/或一个或多个数字通用光盘(DVD) 驱动器)。
NVM/存储设备1308可包括在物理上作为装置1300 被安装在其上的设备的一部分的存储资源,或者其可被该设备访问可不必作为该设备的一部分。例如, NVM/存储设备1308可通过网络经由(一个或多个)输入/输出设备1310 进行访问。
(一个或多个)输入/输出设备1310 可为装置1300 提供接口以与任意其他适当的设备通信,输入/输出设备1310可以包括通信组件、拼音组件、传感器组件等。网络接口1312可为装置1300 提供接口以通过一个或多个网络通信,装置1300 可根据一个或多个无线网络标准和/或协议中的任意标准和/或协议来与无线网络的一个或多个组件进行无线通信,例如接入基于通信标准的无线网络,如WiFi、2G、3G、4G、5G等,或它们的组合进行无线通信。
对于一个实施例,(一个或多个)处理器1302中的至少一个可与控制模块1304的一个或多个控制器(例如,存储器控制器模块) 的逻辑封装在一起。对于一个实施例,(一个或多个)处理器1302中的至少一个可与控制模块1304的一个或多个控制器的逻辑封装在一起以形成***级封装(SiP) 。对于一个实施例, (一个或多个)处理器1302中的至少一个可与控制模块1304的一个或多个控制器的逻辑集成在同一模具上。对于一个实施例, (一个或多个)处理器1302中的至少一个可与控制模块1304的一个或多个控制器的逻辑集成在同一模具上以形成片上***(SoC) 。
在各个实施例中,装置1300可以但不限于是:服务器、台式计算设备或移动计算设备(例如,膝上型计算设备、手持计算设备、平板电脑、上网本等)等终端设备。在各个实施例中,装置1300 可具有更多或更少的组件和/或不同的架构。例如,在一些实施例中,装置1300包括一个或多个摄像机、键盘、液晶显示器(LCD) 屏幕(包括触屏显示器)、非易失性存储器端口、多个天线、图形芯片、专用集成电路(ASIC) 和扬声器。
本申请实施例提供了一种电子设备,包括:一个或多个处理器;和,其上存储有指令的一个或多个机器可读介质,当由所述一个或多个处理器执行时,使得所述电子设备执行如本申请中一个或多个所述的方法。
对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
本申请实施例是参照根据本申请实施例的方法、终端设备(***)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理终端设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理终端设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理终端设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理终端设备上,使得在计算机或其他可编程终端设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程终端设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本申请实施例的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本申请实施例范围的所有变更和修改。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者终端设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者终端设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者终端设备中还存在另外的相同要素。
以上对本申请所提供的一种数据处理方法及装置,进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。

Claims (14)

1.一种基于分布式***的数据处理方法,其特征在于,所述分布式***中包括多个电子设备,各个电子设备分别存储模型中的一部分特征向量,所述方法应用于所述多个电子设备中的第一电子设备,所述方法包括:
获取所述模型中的多个特征向量的向量标识;
根据所述多个特征向量的向量标识生成至少一个标识张量;
基于至少一个获取算子根据所述至少一个标识张量在所述分布式***中获取至少一个特征张量,所述至少一个特征张量中包括所述多个特征向量;
对所述至少一个特征张量拆分,得到所述多个特征向量。
2.根据权利要求1所述的方法,其特征在于,所述基于至少一个获取算子根据所述至少一个标识张量在所述分布式***中获取至少一个特征张量,包括:
基于所述至少一个获取算子,在所述第一电子设备存储的特征向量中查找所述标识张量中的向量标识对应的特征向量;和/或,将所述标识张量中的向量标识分别发送给对应的特征向量所在的分布式***中的第二电子设备,并接收所述第二电子设备返回的、根据接收的向量标识查找到的特征向量;所述第二电子设备包括所述分布式***中的除所述第一电子设备以外的电子设备;
基于所述至少一个获取算子,将接收的特征向量和/或在所述第一电子设备中查找到的特征向量缝合,得到所述特征张量。
3.根据权利要求2所述的方法,其特征在于,所述在所述第一电子设备存储的特征向量中查找所述标识张量中的向量标识对应的特征向量,包括:
在所述第一电子设备中的第一存储器中存储的特征向量中查找是否存在所述标识张量中的向量标识对应的特征向量;
在存在所述标识张量中的向量标识对应的特征向量的情况下,获取第一存储器中存储的所述标识张量中的向量标识对应的特征向量,第一存储器中存储的所述标识张量中的向量标识对应的特征向量是事先在所述第一电子设备中的第二存储器中获取的并缓存在所述第一存储器中的;所述第一存储器的数据访问速率大于所述第二存储器的数据访问速率;
在不存在所述标识张量中的向量标识对应的特征向量的情况下,在所述第二存储器中存储的特征向量中查找所述标识张量中的向量标识对应的特征向量。
4.根据权利要求3所述的方法,其特征在于,所述方法还包括:
获取在所述第二存储器中存储的所述模型中的各个特征向量分别被访问的频率;
按照被访问的频率由高至低的顺序,在所述第二存储器中存储的所述模型中的各个特征向量中选择至少部分特征向量;
在所述第一存储器中缓存所述至少部分特征向量。
5.根据权利要求3所述的方法,其特征在于,所述方法还包括:
在对所述模型进行多轮训练的其中一轮训练的过程中,在所述第二存储器中获取所述其中一轮训练之后的至少一轮训练所需使用的所述模型中的特征向量;
在所述第一存储器中缓存所述至少一轮训练所需使用的所述模型中的特征向量。
6.根据权利要求1所述的方法,其特征在于,所述根据所述多个特征向量的向量标识生成至少一个标识张量,包括:
使用一个生成算子对所述多个特征向量的向量标识去重复,得到去重复后的向量标识,确定去重复后各个向量标识对应的特征向量所在的电子设备的数量,根据所述数量对去重复后的向量标识分片,得到分片后的向量标识,以及,根据分片后的向量标识生成至少两个标识张量。
7.根据权利要求1所述的方法,其特征在于,所述方法还包括:
获取在获取所述模型中的多个特征向量的过程中所需使用所述第一电子设备中的硬件资源的种类;
根据所述种类的数量以及负载均衡原则对所述模型中的特征向量分组,得到多个的特征向量组。
8.根据权利要求7所述的方法,其特征在于,所述模型中包括多个特征矩阵,各个特征矩阵中包括至少两个特征向量;
所述根据所述种类的数量以及负载均衡原则对所述模型中的特征向量分组,得到多个的特征向量组,包括:
将所述多个特征矩阵划分为所述数量个的特征矩阵组,各个特征矩阵组中包括的特征向量的数量之间的差异小于预设差异。
9.根据权利要求7所述的方法,其特征在于,所述根据所述多个特征向量的向量标识生成至少一个标识张量,包括:
将所述多个特征向量的向量标识按照对应的特征向量所在的特征向量组分组,得到至少两个向量标识组;
根据每一个向量标识组中的向量标识分别生成一个标识张量,得到至少两个标识张量。
10.根据权利要求7-9任一项所述的方法,其特征在于,所述基于至少一个获取算子根据所述至少一个标识张量在所述分布式***中获取至少一个特征张量,包括:
根据至少两个标识张量中的第一标识张量依次调取所述第一电子设备中的多个种类的硬件资源,以通过调取的硬件资源在特征向量组中获取所述第一标识张量中向量标识对应的特征向量;
以及,根据至少两个标识张量中的第二标识张量依次调取所述多个种类的硬件资源,以通过调取的硬件资源在特征向量组中获取所述第二标识张量中向量标识对应的特征向量;所述第二标识张量包括所述至少两个标识张量中的除所述第一标识张量以外的标识张量;
且,在根据所述第二标识张量依次调取所述多个种类的硬件资源的过程中,在需要根据第二标识张量调取所述多个种类中的目标种类的硬件资源的情况下,判断所述目标种类的硬件资源是否正在被使用;在所述目标种类的硬件资源未正在被使用的情况下,再根据所述第二标识张量调取所述目标种类的硬件资源。
11.一种数据处理方法,其特征在于,所述方法包括:
在训练稀疏模型的过程中或在使用已训练得到的稀疏模型处理数据的过程中,如果需要获取稀疏模型中的多个特征向量中的目标特征向量,在第一存储器中查找所述目标特征向量;
在所述第一存储器中查找到所述目标特征向量的情况下,响应所述目标特征向量;所述目标特征向量是事先根据第二存储器中存储的所述多个特征向量分别被访问的频率由高至低的顺序,在所述多个特征向量中选择并缓存在所述第一存储器中的,所述第一存储器的数据访问速率大于所述第二存储器的数据访问速率。
12.一种数据处理方法,其特征在于,所述方法包括:
在需要对稀疏模型进行多轮训练的下一轮训练的情况下,在第一存储器中获取所述下一轮训练所需使用的所述稀疏模型中的特征向量;
使用所述特征向量对所述稀疏模型进行多轮训练的下一轮训练;所述特征向量是事先对所述稀疏模型进行多轮训练的上一轮训练的情况下在第二存储器中获取并缓存在所述第一存储器中的,所述第一存储器的数据访问速率大于所述第二存储器的数据访问速率。
13.一种电子设备,其特征在于,所述电子设备包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为执行如权利要求1-12任一项所述的方法。
14.一种非临时性计算机可读存储介质,当所述存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行如权利要求1-12任一项所述的方法。
CN202111015203.4A 2021-08-31 2021-08-31 一种数据处理方法及装置 Active CN113448739B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111015203.4A CN113448739B (zh) 2021-08-31 2021-08-31 一种数据处理方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111015203.4A CN113448739B (zh) 2021-08-31 2021-08-31 一种数据处理方法及装置

Publications (2)

Publication Number Publication Date
CN113448739A true CN113448739A (zh) 2021-09-28
CN113448739B CN113448739B (zh) 2022-02-11

Family

ID=77819352

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111015203.4A Active CN113448739B (zh) 2021-08-31 2021-08-31 一种数据处理方法及装置

Country Status (1)

Country Link
CN (1) CN113448739B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115658146A (zh) * 2022-12-14 2023-01-31 成都登临科技有限公司 一种ai芯片、张量处理方法及电子设备

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107169061A (zh) * 2017-05-02 2017-09-15 广东工业大学 一种融合双信息源的文本多标签分类方法
CN111095302A (zh) * 2017-09-21 2020-05-01 高通股份有限公司 稀疏深度卷积网络权重的压缩
CN111506262A (zh) * 2020-03-25 2020-08-07 华为技术有限公司 一种存储***、文件存储和读取方法及终端设备
CN112214652A (zh) * 2020-10-19 2021-01-12 支付宝(杭州)信息技术有限公司 一种报文生成方法、装置及设备
CN112307352A (zh) * 2020-11-26 2021-02-02 腾讯科技(深圳)有限公司 内容推荐方法、***、装置和存储介质
CN112800466A (zh) * 2021-02-10 2021-05-14 支付宝(杭州)信息技术有限公司 基于隐私保护的数据处理方法、装置和服务器
WO2021123790A1 (en) * 2019-12-19 2021-06-24 Sita Information Networking Computing Uk Limited Image processing system and method

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107169061A (zh) * 2017-05-02 2017-09-15 广东工业大学 一种融合双信息源的文本多标签分类方法
CN111095302A (zh) * 2017-09-21 2020-05-01 高通股份有限公司 稀疏深度卷积网络权重的压缩
WO2021123790A1 (en) * 2019-12-19 2021-06-24 Sita Information Networking Computing Uk Limited Image processing system and method
CN111506262A (zh) * 2020-03-25 2020-08-07 华为技术有限公司 一种存储***、文件存储和读取方法及终端设备
CN112214652A (zh) * 2020-10-19 2021-01-12 支付宝(杭州)信息技术有限公司 一种报文生成方法、装置及设备
CN112307352A (zh) * 2020-11-26 2021-02-02 腾讯科技(深圳)有限公司 内容推荐方法、***、装置和存储介质
CN112800466A (zh) * 2021-02-10 2021-05-14 支付宝(杭州)信息技术有限公司 基于隐私保护的数据处理方法、装置和服务器

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115658146A (zh) * 2022-12-14 2023-01-31 成都登临科技有限公司 一种ai芯片、张量处理方法及电子设备

Also Published As

Publication number Publication date
CN113448739B (zh) 2022-02-11

Similar Documents

Publication Publication Date Title
US10719260B2 (en) Techniques for storing and retrieving data from a computing device
KR101994021B1 (ko) 파일 조작 방법 및 장치
US20140215170A1 (en) Block Compression in a Key/Value Store
CN110347651B (zh) 基于云存储的数据同步方法、装置、设备及存储介质
US10909086B2 (en) File lookup in a distributed file system
CN107273392B (zh) 用于搜索图像的计算机实现方法、装置及数据处理***
US20170201566A1 (en) File downloading method, apparatus, and terminal device
US20150227535A1 (en) Caseless file lookup in a distributed file system
US9483493B2 (en) Method and system for accessing a distributed file system
CN102857578A (zh) 一种网络硬盘的文件上传方法、***及网盘客户端
US20190014016A1 (en) Data acquisition device, data acquisition method and storage medium
EP3369238B1 (en) Method, apparatus, computer-readable medium and computer program product for cloud file processing
WO2019041500A1 (zh) 分页的实现方法、装置、计算机设备及存储介质
US20160140140A1 (en) File classification in a distributed file system
CN113448739B (zh) 一种数据处理方法及装置
US11055223B2 (en) Efficient cache warm up based on user requests
CN115396422A (zh) 数据传输方法及装置
WO2017001941A1 (en) System and method for duplicating files on client device for cloud storage
CN114553762A (zh) 一种对流表中的流表项处理的方法及装置
CN113297267A (zh) 数据缓存和任务处理方法、装置、设备以及存储介质
CN111625600B (zh) 数据存储的处理方法、***、计算机设备及存储介质
WO2018111696A1 (en) Partial storage of large files in distinct storage systems
CN113849524B (zh) 一种数据处理方法及装置
CN113296977B (zh) 一种消息处理方法及装置
US10089369B2 (en) Searching method, searching apparatus and device

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant