WO2016041191A1

WO2016041191A1 - 读写数据的方法、装置、存储设备和计算机***

Info

Publication number: WO2016041191A1
Application number: PCT/CN2014/086925
Authority: WO
Inventors: 杨辉联; 卢磊; 时代
Original assignee: 华为技术有限公司
Priority date: 2014-09-19
Filing date: 2014-09-19
Publication date: 2016-03-24
Also published as: CN106489132A; US10303474B2; EP3188002A1; EP3188002A4; US20170185401A1; CN106489132B

Abstract

本发明实施例提供了一种读写数据的方法、装置、存储设备和计算机***，能够缩短多核计算机***中数据读写操作的完成时间，该方法包括：主机设备确定用于执行目标进程的N个内核，该N个内核与该目标进程包括的N个执行线程一一对应；对该N个执行线程进行分组，以确定M个执行线程组，并为各执行线程组分配指示标识；向存储设备发送M个数据读写指令，各该数据读写指令包括所对应的执行线程组的指示标识，以便于该存储设备根据各该数据读写指令包括的指示标识，确定各该数据读写指令所对应的执行线程组，并将各该数据读写指令传输至所对应的执行线程组，以使各该执行线程根据从该存储设备获得的数据读写指令，在该存储设备中进行数据读写操作。

Description

读写数据的方法、装置、存储设备和计算机***

技术领域

本发明涉及计算机领域，并且更具体地，涉及读写数据的方法、装置、存储设备和计算机***。

背景技术

在具有多个内核的计算机***中，一个内核与存储设备之间进行读写操作的数据，可能需要经由其他内核的转发，即，数据读写操作需要内核与内核之间的配合执行，而内核与内核之间存在较大的数据传输时延，该较大的数据传输时延，严重影响了数据读写操作的完成时间，进而影响了整个任务(例如，信号处理)的完成时间。

因此，希望提供一种技术，能够缩短多核计算机***中数据读写操作的完成时间。

发明内容

本发明实施例提供一种读写数据的方法、装置和***，能够缩短多核计算机***中数据读写操作的完成时间。

第一方面，提供了一种读写数据的方法，该方法包括：主机设备确定用于执行目标进程的N个内核，其中，该N个内核与该目标进程包括的N个执行线程一一对应，N≥2；对该N个执行线程进行分组，以确定M个执行线程组，并为各执行线程组分配指示标识，其中，一个指示标识用于标识一个执行线程组，一个执行线程仅属于一个执行线程组，一个执行线程组包括至少一个执行线程，M≥2；向存储设备发送M个数据读写指令，该M个数据读写指令与该M个执行线程组一一对应，各该数据读写指令包括所对应的执行线程组的指示标识，以便于该存储设备根据各该数据读写指令包括的指示标识，确定各该数据读写指令所对应的执行线程组，并将各该数据读写指令传输至所对应的执行线程组，以使各该执行线程根据从该存储设备获得的数据读写指令，在该存储设备中进行数据读写操作。

结合第一方面，在第一方面的第一种实现方式中，各该执行线程与该存储设备之间的数据传输是基于直接存储DMA协议进行的。

结合第一方面及其上述实现方式，在第一方面的第二种实现方式中，该向存储设备发送M个数据读写指令，包括：向存储设备发送数据读写信号，该数据读写信号包括M个信号分量，该M个信号分量与该M个数据读写指令一一对应，各数据读写指令承载于该对应的信号分量中。

结合第一方面及其上述实现方式，在第一方面的第三种实现方式中，该向存储设备发送M个数据读写指令，包括：通过该目标进程包括的主控线程，向存储设备发送M个数据读写指令。

结合第一方面及其上述实现方式，在第一方面的第四种实现方式中，该对该N个执行线程进行分组，包括：确定该目标进程的期望完成时长以及各该内核彼此之间的数据传输时延；根据该期望完成时长和该数据传输时延，对该N个执行线程进行分组。

第二方面，提供了一种读写数据的方法，该方法包括：存储设备接收主机设备发送的M个数据读写指令，该M个数据读写指令与M个执行线程组一一对应，各该数据读写指令包括所对应的执行线程组的指示标识，一个指示标识用于标识一个执行线程组，该M个执行线程组是该主机设备对目标进程包括的N个执行线程进行分组而确定的，该主机设备确定的用于执行该目标进程的N个内核与该N个执行线程一一对应，N≥2，一个执行线程仅属于一个执行线程组，一个执行线程组包括至少一个执行线程，M≥2；根据该指示标识，确定各执行线程组所对应的数据读写指令；将各数据读写指令传输至所对应的执行线程组，以使各该执行线程根据所获得的数据读写指令，在该存储设备中进行数据读写操作。

结合第二方面，在第二方面的第一种实现方式中，各该执行线程与该存储设备之间的数据传输是基于直接存储DMA协议进行的。

结合第二方面及其上述实现方式，在第二方面的第二种实现方式中，该接收主机设备发送的M个数据读写指令，包括：接收主机设备发送的数据读写信号，该数据读写信号包括M个信号分量，该M个信号分量与该M个数据读写指令一一对应，各数据读写指令承载于该对应的信号分量中。

结合第二方面及其上述实现方式，在第二方面的第三种实现方式中，该接收主机设备发送的M个数据读写指令，包括：接收该目标进程包括的主控线程发送的M个数据读写指令。

结合第二方面及其上述实现方式，在第二方面的第四种实现方式中，该 M个执行线程组具体是该主机设备根据该目标进程的期望完成时长以及各该内核彼此之间的数据传输时延，对该N个执行线程进行分组而确定的。

第三方面，提供了一种读写数据的装置，该装置包括：确定单元，用于确定用于执行目标进程的N个内核，其中，该N个内核与该目标进程包括的N个执行线程一一对应，N≥2；分组单元，用于对该N个执行线程进行分组，以确定M个执行线程组，其中，一个执行线程仅属于一个执行线程组，一个执行线程组包括至少一个执行线程，M≥2；发送单元，用于向存储设备发送M个数据读写指令，该M个数据读写指令与该M个执行线程组一一对应，各该数据读写指令包括所对应的执行线程组的指示标识，一个指示标识用于唯一地标识一个执行线程组，以便于该存储设备根据各该指示标识将各该数据读写指令传输至所对应的执行线程组，以使各该执行线程根据从该存储设备获得的数据读写指令，在该存储设备中进行数据读写操作。

结合第三方面，在第三方面的第一种实现方式中，各该执行线程与该存储设备之间的数据传输是基于直接存储DMA协议进行的。

结合第三方面及其上述实现方式，在第三方面的第二种实现方式中，该发送单元具体用于向存储设备发送数据读写信号，该数据读写信号包括M个信号分量，该M个信号分量与该M个数据读写指令一一对应，各数据读写指令承载于该对应的信号分量中。

结合第三方面及其上述实现方式，在第三方面的第三种实现方式中，该发送单元具体用于通过该目标进程包括的主控线程，向存储设备发送M个数据读写指令。

结合第三方面及其上述实现方式，在第三方面的第四种实现方式中，该分组单元具体用于根据该目标进程的期望完成时长以及各该内核彼此之间的数据传输时延，对该N个执行线程进行分组。

结合第三方面及其上述实现方式，在第三方面的第五种实现方式中，该读写数据的装置为计算机***中的主机设备。

第四方面，提供了一种存储设备，包括：传输接口，用于该存储设备与主机设备之间的通信；存储空间，用于存储数据；控制器，用于通过该传输接口接收该主机设备发送的M个数据读写指令，该M个数据读写指令与M个执行线程组一一对应，各该数据读写指令包括所对应的执行线程组的指示标识，一个指示标识用于标识一个执行线程组，该M个执行线程组是该主机设备对目标进程包括的N个执行线程进行分组而确定的，该主机设备确定的用于执行该目标进程的N个内核与该N个执行线程一一对应，N≥2，一个执行线程仅属于一个执行线程组，一个执行线程组包括至少一个执行线程，M≥2，用于根据该指示标识，确定各执行线程组所对应的数据读写指令，通过该传输接口，用于将各数据读写指令传输至所对应的执行线程组，以使各该执行线程根据所获得的数据读写指令，在该存储空间中进行数据读写操作。

结合第四方面，在第四方面的第一种实现方式中，各该执行线程与该存储设备之间的数据传输是基于直接存储DMA协议进行的。

结合第四方面及其上述实现方式，在第四方面的第二种实现方式中，该接收单元具体用于接收主机设备发送的数据读写信号，该数据读写信号包括M个信号分量，该M个信号分量与该M个数据读写指令一一对应，各数据读写指令承载于该对应的信号分量中。

结合第四方面及其上述实现方式，在第四方面的第三种实现方式中，该控制器具体用于通过该传输接口接收该主机设备发送的数据读写信号，该数据读写信号包括M个信号分量，该M个信号分量与该M个数据读写指令一一对应，各数据读写指令承载于该对应的信号分量中。

结合第四方面及其上述实现方式，在第四方面的第四种实现方式中，该M个执行线程组具体是该主机设备根据该目标进程的期望完成时长以及各该内核彼此之间的数据传输时延，对该N个执行线程进行分组而确定的。

第五方面，提供了一种计算机***，包括：总线；与该总线相连的主机设备，用于确定用于执行目标进程的N个内核，其中，该N个内核与该目标进程包括的N个执行线程一一对应，N≥2，对该N个执行线程进行分组，以确定M个执行线程组，并为各执行线程组分配指示标识，其中，一个指示标识用于标识一个执行线程组，一个执行线程仅属于一个执行线程组，一个执行线程组包括至少一个执行线程，M≥2，通过该总线向存储设备发送M个数据读写指令，该M个数据读写指令与该M个执行线程组一一对应，各该数据读写指令包括所对应的执行线程组的指示标识，一个指示标识用于唯一地标识一个执行线程组；与该总线相连的存储设备，用于通过该总线接收该M个数据读写指令，并根据该指示标识，确定各执行线程组所对应的数据读写指令，将各数据读写指令传输至所对应的执行线程组，以使各该执行线程根据所获得的数据读写指令，在该存储设备中进行数据读写操作。

结合第五方面，在第五方面的第一种实现方式中，该M个执行线程组是该主机设备根据该目标进程的期望完成时长以及各该内核彼此之间的数据传输时延，对该N个执行线程进行分组而确定的。

根据本发明的读写数据的方法、装置、存储设备和计算机***，主机设备对用于执行目标进程的N个内核进行分组，并对该N个内核所对应的N个执行线程进行分组以确定M个执行线程组，并在发送给存储设备的数据读写指令中携带与该数据读写指令所对应的执行线程组的指示标识，从而存储设备能够根据该指示标识，识别该数据读写指令所对应的线程组，进而存储设备能够将该数据读写指令转发给该数据读写指令所对应的线程组，能够使各执行线程根据从该存储设备获得的数据读写指令，在该存储设备中进行数据读写操作，从而能够减少在进行数据读写操作时内核之间的信令和数据传输，进而减少因该信令和数据传输而导致的处理时延，能够缩短多核计算机***中数据读写操作的完成时间。

附图说明

为了更清楚地说明本发明实施例的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本发明一实施例的读写数据的装置的示意性结构图。

图2是本发明一实施例的读写数据的流程的示意图。

图3是本发明另一实施例的读写数据的装置的示意性结构图。

图4是本发明一实施例的读写数据的方法的示意性流程图。

图5是本发明另一实施例的读写数据的方法的示意性流程图。

图6是本发明一实施例的读写数据的***的示意结构图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

本发明的技术方案，可以运行在包括例如，CPU、存储器管理单元(MMU，Memory Management Unit)、内存(也称为存储器)的硬件设备上，该硬件设备所运行的操作***可以是各种通过线程或进程(包括多个线程)实现业务处理的计算机操作***，例如，Linux***、Unux***等。

本发明的读写数据的装置可应用计算机***，具体用于进行数据读写操作，例如，该数据读写操作可以是中央处理器(CPU，Central Processing Unit)控制各线程进行运算处理时在缓存设备(存储设备的一例)中进行的数据读写操，或者该数据读写操作可以是CPU在磁盘设备(存储设备的另一例)中进行的数据读写操，本发明并未特别限定，以下，为了便于理解，以在缓存设备中进行的数据读写操过程为例，对本发明实施例的读写数据的方法、装置和***进行详细说明。

另外，作为上述计算机***，例如，可以列举实时操作***(RTOS，Real-time operating system)，又称即时操作***，是指当外界事件或数据产生时，能够接受并以足够快的速度予以处理，其处理的结果又能在规定的时间之内来控制生产过程或对处理***做出快速响应，并控制所有实时任务协调一致运行的操作***。其与一般的操作***相比，最大的特色就是其“实时性”，也就是说，如果有一个任务需要执行，实时操作***会马上(在较短时间内)完成该任务，不会有较长的时延。

应理解，以上列举的实时操作***仅为计算机***的示例性说明，本发明并未特别限定，为了便于理解和说明，以下，以在实时操作***中的应用为例，对本发明实施例的读写数据的方法、装置和***进行详细说明。

图1示出了根据本发明一实施例的读写数据的方法100的示意性框图。如图1所示，该方法100包括：

S110，主机设备确定用于执行目标进程的N个内核，其中，该N个内核与该目标进程包括的N个执行线程一一对应，N≥2；

S120，对该N个执行线程进行分组，以确定M个执行线程组，并为各执行线程组分配指示标识，其中，一个指示标识用于标识一个执行线程组，一个执行线程仅属于一个执行线程组，一个执行线程组包括至少一个执行线程，M≥2；

S130，向存储设备发送M个数据读写指令，该M个数据读写指令与该 M个执行线程组一一对应，各该数据读写指令包括所对应的执行线程组的指示标识，以便于该存储设备根据各该数据读写指令包括的指示标识，确定各该数据读写指令所对应的执行线程组，并将各该数据读写指令传输至所对应的执行线程组，以使各该执行线程根据从该存储设备获得的数据读写指令，在该存储设备中进行数据读写操作

首先，作为该方法100的执行主体，可以列举计算机***中的主机设备，并且，该主机设备具有多个CPU(或者说，内核)，其中，该多个CPU可以协同作业以完成目标任务，例如，每个CPU可以分别运行与该目标任务相对应的进程中的部分(一个或多个)线程。多个CPU彼此之间通信连接，从而可以通过信号交换等方式，实现数据共享。

此外，该计算机***还包括存储设备，该存储设备用于提供存储功能，主机设备在执行目标任务时可以访问该存储设备中的存储空间，进行针对在执行目标任务时产生的信号或数据等的读写操作(或者说，存储操作)。在本发明实施例中，存储设备可以支持各种存储介质，可选地，该存储设备还可以包括存储接口扩展模块，可以连接至少一个固态硬盘(SSD，Solid State Disk)和/或混合硬盘(HHD，Hybrid Hard Disk)从而可以根据需要扩大存储设备的容量。

在本发明实施例中，主机设备与存储设备之间可以通过能够实现数据传输各种计算机接口连接，例如，高速外设部件互连(PCIE，Peripheral Component Interconnect Express)接口、雷电(Thunderbolt)接口、无限带宽(Infiniband)接口、高速通用串行总线(USB，Universal Serial Bus)接口以及高速以太网接口等。

下面，分别对该方法100的各步骤进行详细说明。

在S110，当主机设备确定需要执行目标任务时，可以从主机设备所包括的所有CPU中，确定用于执行该目标任务(即，目标进程)的N个CPU(即，内核)，以下，为了便于理解和说明，将用于执行该目标任务的N个CPU记做：CPU#1～CPU#N。

作为示例而非限定，主机设备可以根据执行该目标任务所需要的运算量，来确定上述“N”的具体数值，例如，如果该目标任务所需要的运算量较大，为了快速完成该任务，可以使上述“N”的数值较大；如果该目标任务所需要的运算量较小，仅需较少的CPU便能够快速完成该任务，则可以使上述“N”的数值较小。

另外，该CPU#1～CPU#N可以分别用于执行上述目标任务的N个线程(即，执行线程)，以下，为了便于理解和说明，将该N个线程记做：线程#1～线程#N，即，CPU#1～CPU#N与线程#1～线程#N一一对应，作为示例而非限定，上述“一一对应”的对应规则可以为，一个CPU用于控制序号相同的线程的运行。

应理解，以上列举的主机设备确定用于执行该目标任务的N个CPU的方法以及所使用的参数仅为示例性说明，本发明并未特别限定，例如，还可以根据预设的数值，默认为所执行的所有任务使用的CPU的数量均相同，例如，该预设的数值可以为主机设备所包括的所有CPU的总和。

需要说明的是，本发明致力于解决因CPU之间的数据传输时延而导致的数据读写操作的完成时间的影响，因此，当N≥2时，能够充分体现本发明的技术效果，随后对技术效果进行详细说明。

图2是本发明一实施例的读写数据的流程的示意图，在图2所示示例中，N为29，即，主机设备确定29个CPU来执行目标进程，该目标进程包括29个执行线程。

其后，在S120，主机设备可以将如上所述确定的CPU#1～CPU#N分为M个CPU组，或者说，用于将如上所述确定的CPU#1～CPU#N所对应的线程#1～线程#N分为M个线程组。作为分组依据，例如，可以列举以下规则：

可选地，该对该N个执行线程进行分组，包括：

确定该目标进程的期望完成时长以及各该内核彼此之间的数据传输时延；

根据该期望完成时长和该数据传输时延，对该N个执行线程进行分组。

具体地说，主机设备可以确定上述CPU#1～CPU#N彼此之间的数据传输时延，例如，可以获取CPU#1～CPU#N的型号、彼此之间连接方式等信息，从而可以根据上述信息，推算出CPU#1～CPU#N彼此之间的数据传输时延。

应理解，以上列举的主机设备确定CPU#1～CPU#N彼此之间的数据传输时延的方法以及所使用的参数仅为示例性说明，本发明并未特别限定，例如，还可以通过试验等方式，检测CPU#1～CPU#N彼此之间的数据传输时延。

并且，主机设备还可以确定该目标进程的期望完成时长，其中，该该目标进程需要在规定的时间内完成，该期望完成时长可以是该目标进程从开始执行到结束执行(例如，可以包括CPU判定该任务执行成功并退出进程的时间)所经历的时间，并且，该期望完成时长可以小于或等于上述规定的时间。

作为示例而非限定，主机设备可以根据该目标进程的类型、处理优先级等属性信息，确定该目标进程的期望完成时长，例如，如果该目标进程的类型指示该目标进程的业务属于实时类型业务(例如，在线游戏，视频通话等)，则可以确定该目标进程的紧急程度较高，且需要在较短时间内完成，从而可以确定目标进程的期望完成时长较短(例如，低于一个预设的门限值)；再例如，如果该目标进程的处理优先级被标记为高时，则可以确定该目标进程的紧急程度较高，且需要在较短时间内完成，从而可以确定目标进程的期望完成时长较短(例如，低于一个预设的门限值)。

从而，主机设备可以基于如上所述确定的CPU#1～CPU#N彼此之间的数据传输时延以及目标进程的期望完成时长，对CPU#1～CPU#N进行分组，以使包括各CPU组内的CPU彼此之间的数据传输时延之和在内的目标进程的完成时长小于或等于目标进程的期望完成时长，例如：

主机设备可以根据各CPU的处理能力，推算在CPU彼此之间不发生数据传输的情况下完成该目标进程的时长，以下，简称该目标进程的参考完成时长，从而可以获得该目标进程的期望完成时长的该目标进程的参考完成时长的差值，可以基于上述结果进而对CPU#1～CPU#N进行分组，以使各组内的CPU彼此之间的数据传输时延之和小于或等于上述差值。

应理解，以上列举的分组依据仅为示例性说明，本发明并未限定于此，例如，主机设备还可以基于预设的基准值K，将CPU#1～CPU#N分为M个CPU组，在该M个CPU组中，至少M-1个CPU组所包括的CPU的数量等于该基准值K，或者说，至多1个CPU组所包括的CPU的数量小于该基准值K，无需赘言，各CPU组所包括的CPU的数量为大于零的整数。

并且，在本发明实施例中，该预设的基准值K可以根据计算机***的负载等参数适当变更，例如，如果当前计算机***的负载较大，则可以采用较小的K值。

在图2所示示例中，K为8，因此，29个CPU被分为4个CPU组，即，CPU组#1～CPU组#4。其中，CPU组#1包括8个CPU，即，CPU#1～CPU#8；CPU组#2包括8个CPU，即，CPU#9～CPU#16；CPU组#3包括8个CPU，即，CPU#17～CPU#24；CPU组#4包括5个CPU，即，CPU#25～CPU#29。

同样，29个线程(即，执行线程)被分为4个线程组，即，线程组#1～线程组#4。其中，线程组#1包括8个线程，即，线程#1～线程#8；线程组#2包括8个线程，即，线程#9～线程#16；线程组#3包括8个线程，即，线程#17～线程#24；线程组#4包括5个线程，即，线程#25～线程#29。

其后，在S130，主机设备可以向存储设备发送M个数据读写指令，具体地说，主机设备可以从各CPU获取数据读写指令，并且，可以根据如上述划分的CPU组或线程组，为各数据读写指令添加指示标识，以指示各数据读写指令所来自的CPU组，或者说，各数据读写指令所对应的线程组。

从而，存储设备可以通过接收单元接收上述M个数据读写指令，并且，可以通过确定单元，根据各数据读写指令所携带的指示标识，确定各数据读写指令所对应的线程组，或者说，各数据读写指令所对应的CPU组。

其后，存储设备可以通过发送单元，根据数据读写指令所携带的指示标识，将数据读写指令传输至该数据读写指令所携带的指示标识所指示的线程组，从而，各线程能够获得来自所对应的CPU的读写指令，进而，能够根据该数据读写指令在存储设备的存储空间中进行数据读写操作。

可选地，各该执行线程与该存储设备之间的数据传输是基于直接存储DMA协议进行的。

具体地说，存储器直接访问(DMA，Direct Memory Access)是指一种高速的数据传输操作，允许在外部设备和存储器之间直接读写数据，既不通过CPU，也不需要CPU干预。例如，可以使整个数据传输操作在一个称为“DMA控制器”的控制下进行。CPU除了在数据传输开始和结束时做一点处理外，在传输过程中还可以进行其他的工作。即，在本发明实施例中，在该计算机***中还可以配置DMA控制器，并由DMA控制器控制各线程在存储设备中的数据读写操作。

实现DMA传送的基本操作如下：

(1)DMA控制器向CPU(属于主机设备)发出DMA请求：

(2)CPU响应DMA请求，***转变为DMA工作方式，并把总线控制权交给DMA控制器；

(3)由DMA控制器发送存储器地址，并决定传送数据块的长度；

(4)执行DMA传送；

(5)DMA操作结束，并把总线控制权交还CPU。

应理解，以上列举的DMA传输的实现方式仅为示例性说明，本发明并未特别限定，也可以使用现有技术中能够实现DMA传输的方法。例如，在本发明实施例中，可以通过软件或程序等实现上述DMA控制器的功能。

可选地，该向存储设备发送M个数据读写指令，包括：

向存储设备发送数据读写信号，该数据读写信号包括M个信号分量，该M个信号分量与该M个数据读写指令一一对应，各数据读写指令承载于该对应的信号分量中。

具体地说，主机设备可以将上述各数据读写指令承载于同一信号(或者说，信号流)中一并发送给存储设备。

应理解，以上列举的主机设备向存储设备发送数据读写指令的方法仅为示例性说明，本发明并未限定于此，也可以将各数据读写指令分别承载于独立的信号中，发送给存储设备。

可选地，该向存储设备发送M个数据读写指令，包括：

通过该目标进程包括的主控线程，向存储设备发送M个数据读写指令。

具体地说，在本发明实施例中，可以配置主控CPU以及与该主控CUP相对应的主控线程，即，主控CPU可以确定上述CPU#1～CPU#N的各数据读写指令，并通过该主控线程向存储设备发送上述数据读写指令。

可选地，该主控线程属于该执行线程。

具体地说，在本发明实施例中，可以从上述CPU#1～CPU#N中选择一个CPU作为主控CPU，与该主控CPU相对应的线程作为主控线程。即，该主控线程可以即用于向存储设备传输上述数据读写指令，也可以用于访问存储设备的存储空间，以进行数据读写操作。

下面结合图2，对本发明实施例的读写数据的流程进行详细说明。

在图2所示实施例中，由29个CPU来执行目标进程，该目标进程包括29个执行线程，并且，29个CPU被分为4个CPU组，即，CPU组#1～CPU组#4。其中，CPU组#1包括8个CPU，即，CPU#1～CPU#8；CPU组#2包括8个CPU，即，CPU#9～CPU#16；CPU组#3包括8个CPU，即，CPU#17～CPU#24；CPU组#4包括5个CPU，即，CPU#25～CPU#29。对应的，29个线程(即，执行线程)被分为4个线程组，即，线程组#1～线程组#4。其中，线程组#1包括8个线程，即，线程#1～线程#8；线程组#2包括8 个线程，即，线程#9～线程#16；线程组#3包括8个线程，即，线程#17～线程#24；线程组#4包括5个线程，即，线程#25～线程#29。

并且，在图2所示实施例中，CPU#0为主控CPU，线程#0为主控线程。

在步骤1，线程#0向存储器发送请求信号，该请求信号中携带有在本周期内需要进行数据读写操作的各CPU的数据读写请求，并且，各数据读写请求中分别携带有所对应的线程组的指示标识。

在步骤2，存储设备可以根据各数据读写请求中携带的指示标识，确定各数据读写请求所对应的线程组，并且，存储设备对该请求信号进行拆分，以线程组为单位，生成与各线程组相对应的响应信号，并且，各响应信号中承载的数据读写指令的指示标识均指向同一线程组。

在步骤3，存储器可以将根据指示标识，将各响应信号发送至所对应的线程组。

在步骤4，各线程组可以在所对应的CUP组的控制下，基于来自存储设备的数据读写指令，在存储设备中进行数据读写操作，其中，该数据读写操作的过程可以与现有技术相似，这里，为了避免赘述，省略其详细说明。

另外，在本发明实施例中，主控线程可以检测各线程组的数据读写操作完成情况，并且，主控线程可以在某一线程组内的所有线程均完成数据读写操作之后，立即结束对该线程组的控制，或者，主控线程也可以在全部线程组内的所有线程均完成数据读写操作之后，统一结束对所有线程组的控制。

或者，在本发明实施例中，存储设备可以检测其存储空间内的数据读写操作完成情况，并且，存储设备可以在某一线程组内的所有线程均完成数据读写操作之后，立即通知主控线程，以使主控线程结束对该线程组的控制，或者，存储设备也可以在全部线程组内的所有线程均完成数据读写操作之后，统一通知主控线程，以使主控线程结束对所有线程组的控制。

衡量一个实时操作***的重要指标，是它从接收一个任务，到完成该任务所需的时间，其时间的变化称为抖动。设计实时操作***的首要目标不是高的吞吐量，而是保证任务在特定时间内完成。

但是，目前的实时操作***对多CPU或者说，多核的支持有限。其原因是多核实时操作***存在较大的核间数据传输时延。具体地说，通常CPU之间采用非互联(mesh)的快速通道互联(QPI，QuickPath Interconnect)连接方式，当一个实时的任务需要跨多个CPU配合执行的时候，例如，一个 CPU在缓存设备中的所读写的数据需要经由另一个CPU的转发，就会产生较大的时延，随即产生一连串的时延反应，从而致使整个***无法正常运行。从而，当执行运算量较大的任务时，仍然仅能依靠数量有限的内核，导致执行时间增长，达不到对实时操作***的要求。

与此相对，根据本发明的读写数据的方法，主机设备对用于执行目标进程的N个内核进行分组，并对该N个内核所对应的N个执行线程进行分组以确定M个执行线程组，并在发送给存储设备的数据读写指令中携带与该数据读写指令所对应的执行线程组的指示标识，从而存储设备能够根据该指示标识，识别该数据读写指令所对应的线程组，进而存储设备能够将该数据读写指令转发给该数据读写指令所对应的线程组，能够使各执行线程根据从该存储设备获得的数据读写指令，在该存储设备中进行数据读写操作，从而能够减少在进行数据读写操作时内核之间的信令和数据传输，进而减少因该信令和数据传输而导致的处理时延，能够缩短多核计算机***中数据读写操作的完成时间，并且能够实现实时操作***对多CPU的扩展。

图3是本发明另一实施例的读写数据的方法200的示意性流程图，如图3所示，该方法200包括：

S210，存储设备接收主机设备发送的M个数据读写指令，该M个数据读写指令与M个执行线程组一一对应，各该数据读写指令包括所对应的执行线程组的指示标识，一个指示标识用于标识一个执行线程组，该M个执行线程组是该主机设备对目标进程包括的N个执行线程进行分组而确定的，该主机设备确定的用于执行该目标进程的N个内核与该N个执行线程一一对应，N≥2，一个执行线程仅属于一个执行线程组，一个执行线程组包括至少一个执行线程，M≥2；

S220，根据该指示标识，确定各执行线程组所对应的数据读写指令；

S230，将各数据读写指令传输至所对应的执行线程组，以使各该执行线程根据所获得的数据读写指令，在该存储设备中进行数据读写操作。

可选地，该M个执行线程组具体是该主机设备根据该目标进程的期望完成时长以及各该内核彼此之间的数据传输时延，对该N个执行线程进行分组而确定的。

可选地，该接收主机设备发送的M个数据读写指令，包括：

接收主机设备发送的数据读写信号，该数据读写信号包括M个信号分量，该M个信号分量与该M个数据读写指令一一对应，各数据读写指令承载于该对应的信号分量中。

可选地，该接收主机设备发送的M个数据读写指令，包括：

接收该主机设备通过该目标进程包括的主控线程发送的M个数据读写指令。

可选地，该主控线程属于该执行线程。

根据本发明实施例的读写数据的方法400的执行主体可对应上述存储器，其具体流程与上述存储器的动作相似，在此不再赘述。

根据本发明的读写数据的方法，主机设备对用于执行目标进程的N个内核进行分组，并对该N个内核所对应的N个执行线程进行分组以确定M个执行线程组，并在发送给存储设备的数据读写指令中携带与该数据读写指令所对应的执行线程组的指示标识，从而存储设备能够根据该指示标识，识别该数据读写指令所对应的线程组，进而存储设备能够将该数据读写指令转发给该数据读写指令所对应的线程组，能够使各执行线程根据从该存储设备获得的数据读写指令，在该存储设备中进行数据读写操作，从而能够减少在进行数据读写操作时内核之间的信令和数据传输，进而减少因该信令和数据传输而导致的处理时延，能够缩短多核计算机***中数据读写操作的完成时间，并且能够实现实时操作***对多CPU的扩展。

上文中，结合图1至图3，详细描述了根据本发明实施例的读写数据的方法，下面，将结合图4和图5，详细描述根据本发明实施例的读写数据的的装置。

图4示出了根据本发明一实施例的读写数据的装置300的示意性框图。如图4所示，该装置300包括：

确定单元310，用于确定用于执行目标进程的N个内核，其中，该N个内核与该目标进程包括的N个执行线程一一对应，N≥2；

分组单元320，用于对该N个执行线程进行分组，以确定M个执行线程组，并为各该执行线程组分配指示标识，其中，一个指示标识用于标识一个执行线程组，一个执行线程仅属于一个执行线程组，一个执行线程组包括至少一个执行线程，M≥2；

发送单元330，用于向存储设备发送M个数据读写指令，该M个数据读写指令与该M个执行线程组一一对应，各该数据读写指令包括所对应的执行线程组的指示标识，以便于该存储设备根据各该指示标识将各该数据读写指令传输至所对应的执行线程组，以使各该执行线程根据从该存储设备获得的数据读写指令，在该存储设备中进行数据读写操作。

并且，可选地，该读写数据的装置为计算机***中的主机设备。

具体地说，作为装置300，可以列举计算机***中的主机设备，并且，该主机设备具有多个CPU(或者说，内核)，其中，该多个CPU可以协同作业以完成目标任务，例如，每个CPU可以分别运行与该目标任务相对应的进程中的部分(一个或多个)线程。多个CPU彼此之间通信连接，从而可以通过信号交换等方式，实现数据共享。

下面，分别对主机设备中各模块的功能进行详细说明。

A.确定单元310

当主机设备确定需要执行目标任务时，该确定单元310可以从主机设备所包括的所有CPU中，确定用于执行该目标任务(即，目标进程)的N个CPU(即，内核)，以下，为了便于理解和说明，将用于执行该目标任务的N个CPU记做：CPU#1～CPU#N。

作为示例而非限定，确定单元310可以根据执行该目标任务所需要的运算量，来确定上述“N”的具体数值，例如，如果该目标任务所需要的运算量较大，为了快速完成该任务，确定单元310可以使上述“N”的数值较大；如果该目标任务所需要的运算量较小，仅需较少的CPU便能够快速完成该任务，则确定单元310可以使上述“N”的数值较小。

应理解，以上列举的确定单元310确定用于执行该目标任务的N个CPU的方法以及所使用的参数仅为示例性说明，本发明并未特别限定，例如，确定单元310还可以根据预设的数值，默认为所执行的所有任务使用的CPU的数量均相同，例如，该预设的数值可以为主机设备所包括的所有CPU的总和。

图2是本发明一实施例的读写数据的流程的示意图，在图2所示示例中，N为29，即，确定单元310确定29个CPU来执行目标进程，该目标进程包括29个执行线程。

B.分组单元320

用于将如上所述确定的CPU#1～CPU#N分为M个CPU组，或者说，用于将如上所述确定的CPU#1～CPU#N所对应的线程#1～线程#N分为M个线程组。作为分组依据，例如，可以列举以下规则：

可选地，该分组单元具体用于根据该目标进程的期望完成时长以及各该内核彼此之间的数据传输时延，对该N个执行线程进行分组。

具体地说，分组单元320可以确定上述CPU#1～CPU#N彼此之间的数据传输时延，例如，该分组单元320可以获取CPU#1～CPU#N的型号、彼此之间连接方式等信息，从而可以根据上述信息，推算出CPU#1～CPU#N彼此之间的数据传输时延。

应理解，以上列举的分组单元320确定CPU#1～CPU#N彼此之间的数据传输时延的方法以及所使用的参数仅为示例性说明，本发明并未特别限定，例如，分组单元320还可以通过试验等方式，检测CPU#1～CPU#N彼此之间的数据传输时延。

并且，分组单元320还可以确定该目标进程的期望完成时长，其中，该该目标进程需要在规定的时间内完成，该期望完成时长可以是该目标进程从开始执行到结束执行(例如，可以包括CPU判定该任务执行成功并退出进程的时间)所经历的时间，并且，该期望完成时长可以小于或等于上述规定的时间。

作为示例而非限定，该分组单元320可以根据该目标进程的类型、处理优先级等属性信息，确定该目标进程的期望完成时长，例如，如果该目标进程的类型指示该目标进程的业务属于实时类型业务(例如，在线游戏，视频通话等)，则可以确定该目标进程的紧急程度较高，且需要在较短时间内完成，从而可以确定目标进程的期望完成时长较短(例如，低于一个预设的门限值)；再例如，如果该目标进程的处理优先级被标记为高时，则可以确定该目标进程的紧急程度较高，且需要在较短时间内完成，从而可以确定目标进程的期望完成时长较短(例如，低于一个预设的门限值)。

从而，分组单元320可以基于如上所述确定的CPU#1～CPU#N彼此之间的数据传输时延以及目标进程的期望完成时长，对CPU#1～CPU#N进行分组，以使包括各CPU组内的CPU彼此之间的数据传输时延之和在内的目标进程的完成时长小于或等于目标进程的期望完成时长，例如：

分组单元320可以根据各CPU的处理能力，推算在CPU彼此之间不发生数据传输的情况下完成该目标进程的时长，以下，简称该目标进程的参考完成时长，从而可以获得该目标进程的期望完成时长的该目标进程的参考完成时长的差值，可以基于上述结果进而对CPU#1～CPU#N进行分组，以使各组内的CPU彼此之间的数据传输时延之和小于或等于上述差值。

应理解，以上列举的分组依据仅为示例性说明，本发明并未限定于此，例如，分组单元320还可以基于预设的基准值K，将CPU#1～CPU#N分为M个CPU组，在该M个CPU组中，至少M-1个CPU组所包括的CPU的数量等于该基准值K，或者说，至多1个CPU组所包括的CPU的数量小于该基准值K，无需赘言，各CPU组所包括的CPU的数量为大于零的整数。

C.发送单元330

用于向存储设备发送M个数据读写指令，具体地说，发送单元330可以从各CPU获取数据读写指令，并且，可以根据如上述划分的CPU组或线程组，为各数据读写指令添加指示标识，以指示各数据读写指令所来自的CPU组，或者说，各数据读写指令所对应的线程组。

具体地说，存储器直接访问(DMA，Direct Memory Access)是指一种高速的数据传输操作，允许在外部设备和存储器之间直接读写数据，既不通过CPU，也不需要CPU干预。例如，可以使整个数据传输操作在一个称为“DMA控制器”的控制下进行。CPU除了在数据传输开始和结束时做一点处理外，在传输过程中还可以进行其他的工作。即，在本发明实施例中，该读写数据的装置300还可以具有DMA控制器，并由DMA控制器控制各线程在存储设备中的数据读写操作。

实现DMA传送的基本操作如下：

(1)DMA控制器向CPU发出DMA请求：

(3)由DMA控制器发送存储器地址，并决定传送数据块的长度；

(4)执行DMA传送；

(5)DMA操作结束，并把总线控制权交还CPU。

可选地，该发送单元330具体用于向存储设备发送数据读写信号，该数据读写信号包括M个信号分量，该M个信号分量与该M个数据读写指令一一对应，各数据读写指令承载于该对应的信号分量中。

具体地说，发送单元330可以将上述各数据读写指令承载于同一信号(或者说，信号流)中一并发送给存储设备。

应理解，以上列举的发送单元330向存储设备发送数据读写指令的方法仅为示例性说明，本发明并未限定于此，发送单元330也可以将各数据读写指令分别承载于独立的信号中，发送给存储设备。

可选地，该发送单元具体用于通过该目标进程包括的主控线程，向存储设备发送M个数据读写指令。

可选地，该主控线程属于该执行线程。

在图2所示实施例中，由29个CPU来执行目标进程，该目标进程包括29个执行线程，并且，29个CPU被分为4个CPU组，即，CPU组#1～CPU组#4。其中，CPU组#1包括8个CPU，即，CPU#1～CPU#8；CPU组#2包括8个CPU，即，CPU#9～CPU#16；CPU组#3包括8个CPU，即，CPU#17～CPU#24；CPU组#4包括5个CPU，即，CPU#25～CPU#29。对应的，29个线程(即，执行线程)被分为4个线程组，即，线程组#1～线程组#4。其中，线程组#1包括8个线程，即，线程#1～线程#8；线程组#2包括8个线程，即，线程#9～线程#16；线程组#3包括8个线程，即，线程#17～线程#24；线程组#4包括5个线程，即，线程#25～线程#29。

在步骤4，各线程组可以在所对应的CUP组的控制下，基于来自存储设备的数据读写指令，在存储设备中进行数据读写操作。

但是，目前的实时操作***对多CPU或者说，多核的支持有限。其原因是多核实时操作***存在较大的核间数据传输时延。具体地说，通常CPU之间采用非互联(mesh)的快速通道互联(QPI，QuickPath Interconnect)连接方式，当一个实时的任务需要跨多个CPU配合执行的时候，例如，一个CPU在缓存设备中的所读写的数据需要经由另一个CPU的转发，就会产生较大的时延，随即产生一连串的时延反应，从而致使整个***无法正常运行。从而，当执行运算量较大的任务时，仍然仅能依靠数量有限的内核，导致执行时间增长，达不到对实时操作***的要求。

与此相对，根据本发明的读写数据的装置，主机设备对用于执行目标进程的N个内核进行分组，并对该N个内核所对应的N个执行线程进行分组以确定M个执行线程组，并在发送给存储设备的数据读写指令中携带与该数据读写指令所对应的执行线程组的指示标识，从而存储设备能够根据该指示标识，识别该数据读写指令所对应的线程组，进而存储设备能够将该数据读写指令转发给该数据读写指令所对应的线程组，能够使各执行线程根据从该存储设备获得的数据读写指令，在该存储设备中进行数据读写操作，从而能够减少在进行数据读写操作时内核之间的信令和数据传输，进而减少因该信令和数据传输而导致的处理时延，能够缩短多核计算机***中数据读写操作的完成时间，并且能够实现实时操作***对多CPU的扩展。

图5示出了根据本发明一实施例的存储设备400的示意性框图。如图5所示，存储设备400包括：

传输接口410，用于该存储设备与主机设备之间的通信；

存储空间420，用于存储数据；

控制器430，用于通过该传输接口接收该主机设备发送的M个数据读写指令，该M个数据读写指令与M个执行线程组一一对应，各该数据读写指令包括所对应的执行线程组的指示标识，一个指示标识用于标识一个执行线程组，该M个执行线程组是该主机设备对目标进程包括的N个执行线程进行分组而确定的，该主机设备确定的用于执行该目标进程的N个内核与该N个执行线程一一对应，N≥2，一个执行线程仅属于一个执行线程组，一个执行线程组包括至少一个执行线程，M≥2，用于根据该指示标识，确定各执行线程组所对应的数据读写指令，通过该传输接口，用于将各数据读写指令传输至所对应的执行线程组，以使各该执行线程根据所获得的数据读写指令，在该存储设备400中进行数据读写操作。

可选地，该M个执行线程组具体是该控制器420根据该目标进程的期望完成时长以及各该内核彼此之间的数据传输时延，对该N个执行线程进行分组而确定的。

可选地，该控制器420具体用于通过该传输接口接收该主机设备发送的数据读写信号，该数据读写信号包括M个信号分量，该M个信号分量与该M个数据读写指令一一对应，各数据读写指令承载于该对应的信号分量中。

可选地，该M个数据读写指令是该主机设备通过该目标进程包括的主控线程发送的。

可选地，该主控线程属于该执行线程。

需要说明的是，在本发明实施例中，存储设备400将M个数据读写指令发送至各执行线程组之后，根据来自各执行线程组的数据读写指令在其存储空间内进行数据读写操作的过程可以与现有技术中数据读写过程相似，这里，为了避免赘述，省略其详细说明

在本发明实施例中，该控制器可以实现或者执行本发明方法实施例中的公开的各步骤及逻辑框图。控制器可以是任何常规的处理器等。结合本发明实施例所公开的方法的步骤可以直接体现为硬件处理器执行完成，或者用解码处理器中的硬件及软件模块组合执行完成。软件模块可以位于上述存储空间中，例如，随机存储器，闪存、只读存储器，可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质。控制器读取上述存储空间中的信息，结合其硬件完成上述方法的步骤

存储设备400可以对应于以上说明中的存储设备，并且，该存储设备400包含的各模块和单元的作用与上述存储设备中对应模块或单元的作用相似，这里，为了避免赘述，省略其详细说明。

该存储设备400可以是只读存储器和随机存取存储器，并向主机设备提供指令和数据。存储设备400的一部分还可以包括非易失性随机存取存储器。例如，存储设备400还可以存储设备类型的信息。

根据本发明的存储设备，主机设备对用于执行目标进程的N个内核进行分组，并对该N个内核所对应的N个执行线程进行分组以确定M个执行线程组，并在发送给存储设备的数据读写指令中携带与该数据读写指令所对应的执行线程组的指示标识，从而存储设备能够根据该指示标识，识别该数据读写指令所对应的线程组，进而存储设备能够将该数据读写指令转发给该数据读写指令所对应的线程组，能够使各执行线程根据从该存储设备获得的数据读写指令，在该存储设备中进行数据读写操作，从而能够减少在进行数据读写操作时内核之间的信令和数据传输，进而减少因该信令和数据传输而导致的处理时延，能够缩短多核计算机***中数据读写操作的完成时间，并且能够实现实时操作***对多CPU的扩展。

图6是本发明另一实施例的计算机***500的示意性流程图，如图6所示，该计算机***500包括：

总线510

与该总线相连的主机设备520，用于确定用于执行目标进程的N个内核，其中，该N个内核与该目标进程包括的N个执行线程一一对应，N≥2，对该N个执行线程进行分组，以确定M个执行线程组，并为各执行线程组分配指示标识，其中，一个指示标识用于标识一个执行线程组，一个执行线程仅属于一个执行线程组，一个执行线程组包括至少一个执行线程，M≥2，通过该总线510向存储设备发送M个数据读写指令，该M个数据读写指令与该M个执行线程组一一对应，各该数据读写指令包括所对应的执行线程组的指示标识，一个指示标识用于唯一地标识一个执行线程组；

与该总线相连的存储设备530，用于通过该总线510接收该M个数据读写指令，并根据该指示标识，确定各执行线程组所对应的数据读写指令，将各数据读写指令传输至所对应的执行线程组，以使各该执行线程根据所获得的数据读写指令，在该存储设备中进行数据读写操作。

可选地，该M个执行线程组是该主机设备根据该目标进程的期望完成时长以及各该内核彼此之间的数据传输时延，对该N个执行线程进行分组而确定的

上述主机设备510可对应于本发明实施例的读写数据的装置300。上述存储设备520可对应于本发明实施例的读写数据的装置200，为了简洁，其功能在此不再赘述。

根据本发明的读写数据的***，主机设备对用于执行目标进程的N个内核进行分组，并对该N个内核所对应的N个执行线程进行分组以确定M个执行线程组，并在发送给存储设备的数据读写指令中携带与该数据读写指令所对应的执行线程组的指示标识，从而存储设备能够根据该指示标识，识别该数据读写指令所对应的线程组，进而存储设备能够将该数据读写指令转发给该数据读写指令所对应的线程组，能够使各执行线程根据从该存储设备获得的数据读写指令，在该存储设备中进行数据读写操作，从而能够减少在进行数据读写操作时内核之间的信令和数据传输，进而减少因该信令和数据传输而导致的处理时延，能够缩短多核计算机***中数据读写操作的完成时间，并且能够实现实时操作***对多CPU的扩展。

应理解，在本发明的各种实施例中，上述各过程的序号的大小并不意味着执行顺序的先后，各过程的执行顺序应以其功能和内在逻辑确定，而不应对本发明实施例的实施过程构成任何限定。

本领域普通技术人员可以意识到，结合本文中所公开的实施例描述的各示例的单元及算法步骤，能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本发明的范围。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的***、装置和单元的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

在本申请所提供的几个实施例中，应该理解到，所揭露的***、装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个***，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本发明各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。

所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述，仅为本发明的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应以所述权利要求的保护范围为准。

Claims

一种读写数据的方法，其特征在于，所述方法包括：

主机设备确定用于执行目标进程的N个内核，其中，所述N个内核与所述目标进程包括的N个执行线程一一对应，N≥2；

对所述N个执行线程进行分组，以确定M个执行线程组，并为各执行线程组分配指示标识，其中，一个指示标识用于标识一个执行线程组，一个执行线程仅属于一个执行线程组，一个执行线程组包括至少一个执行线程，M≥2；

向存储设备发送M个数据读写指令，所述M个数据读写指令与所述M个执行线程组一一对应，各所述数据读写指令包括所对应的执行线程组的指示标识，以便于所述存储设备根据各所述数据读写指令包括的指示标识，确定各所述数据读写指令所对应的执行线程组，并将各所述数据读写指令传输至所对应的执行线程组，以使各所述执行线程根据从所述存储设备获得的数据读写指令，在所述存储设备中进行数据读写操作。
根据权利要求1所述的方法，其特征在于，所述对所述N个执行线程进行分组，包括：

确定所述目标进程的期望完成时长以及各所述内核彼此之间的数据传输时延；

根据所述期望完成时长和所述数据传输时延，对所述N个执行线程进行分组。
根据权利要求1或2所述的方法，其特征在于，各所述执行线程与所述存储设备之间的数据传输是基于直接存储DMA协议进行的。
根据权利要求1至3中任一项所述的方法，其特征在于，所述向存储设备发送M个数据读写指令，包括：

向存储设备发送数据读写信号，所述数据读写信号包括M个信号分量，所述M个信号分量与所述M个数据读写指令一一对应，各数据读写指令承载于所述对应的信号分量中。
根据权利要求1至4中任一项所述的方法，其特征在于，所述向存储设备发送M个数据读写指令，包括：

通过所述目标进程包括的主控线程，向存储设备发送M个数据读写指令。
根据权利要求5所述的方法，其特征在于，所述主控线程属于所述执行线程。
一种读写数据的方法，其特征在于，所述方法包括：

存储设备接收主机设备发送的M个数据读写指令，所述M个数据读写指令与M个执行线程组一一对应，各所述数据读写指令包括所对应的执行线程组的指示标识，一个指示标识用于标识一个执行线程组，所述M个执行线程组是所述主机设备对目标进程包括的N个执行线程进行分组而确定的，所述主机设备确定的用于执行所述目标进程的N个内核与所述N个执行线程一一对应，N≥2，一个执行线程仅属于一个执行线程组，一个执行线程组包括至少一个执行线程，M≥2；

根据所述指示标识，确定各执行线程组所对应的数据读写指令；

将各数据读写指令传输至所对应的执行线程组，以使各所述执行线程根据所获得的数据读写指令，在所述存储设备中进行数据读写操作。
根据权利要求7所述的方法，其特征在于，所述M个执行线程组具体是所述主机设备根据所述目标进程的期望完成时长以及各所述内核彼此之间的数据传输时延，对所述N个执行线程进行分组而确定的。
根据权利要求7或8所述的方法，其特征在于，各所述执行线程与所述存储设备之间的数据传输是基于直接存储DMA协议进行的。
根据权利要求7至9所述的方法，其特征在于，所述接收主机设备发送的M个数据读写指令，包括：

接收主机设备发送的数据读写信号，所述数据读写信号包括M个信号分量，所述M个信号分量与所述M个数据读写指令一一对应，各数据读写指令承载于所述对应的信号分量中。
根据权利要求7至10中任一项所述的方法，其特征在于，所述接收主机设备发送的M个数据读写指令，包括：

接收所述主机设备通过所述目标进程包括的主控线程发送的M个数据读写指令。
根据权利要求11所述的方法，其特征在于，所述主控线程属于所述执行线程。
一种读写数据的装置，其特征在于，所述装置包括：

确定单元，用于确定用于执行目标进程的N个内核，其中，所述N个内核与所述目标进程包括的N个执行线程一一对应，N≥2；

分组单元，用于对所述N个执行线程进行分组，以确定M个执行线程组，并为各所述执行线程组分配指示标识，其中，一个指示标识用于标识一个执行线程组，一个执行线程仅属于一个执行线程组，一个执行线程组包括至少一个执行线程，M≥2；

发送单元，用于向存储设备发送M个数据读写指令，所述M个数据读写指令与所述M个执行线程组一一对应，各所述数据读写指令包括所对应的执行线程组的指示标识，以便于所述存储设备根据各所述指示标识将各所述数据读写指令传输至所对应的执行线程组，以使各所述执行线程根据从所述存储设备获得的数据读写指令，在所述存储设备中进行数据读写操作。
根据权利要求13所述的装置，其特征在于，所述分组单元具体用于根据所述目标进程的期望完成时长以及各所述内核彼此之间的数据传输时延，对所述N个执行线程进行分组。
根据权利要求13或14所述的装置，其特征在于，各所述执行线程与所述存储设备之间的数据传输是基于直接存储DMA协议进行的。
根据权利要求13至15中任一项所述的装置，其特征在于，所述发送单元具体用于向存储设备发送数据读写信号，所述数据读写信号包括M个信号分量，所述M个信号分量与所述M个数据读写指令一一对应，各数据读写指令承载于所述对应的信号分量中。
根据权利要求13至16中任一项所述的装置，其特征在于，所述发送单元具体用于通过所述目标进程包括的主控线程，向存储设备发送M个数据读写指令。
根据权利要求17所述的装置，其特征在于，所述主控线程属于所述执行线程。
根据权利要求13至16中任一项所述的装置，其特征在于，所述装置为计算机***中的主机设备。
一种存储设备，其特征在于，包括：

传输接口，用于所述存储设备与主机设备之间的通信；

存储空间，用于存储数据；

控制器，用于通过所述传输接口接收所述主机设备发送的M个数据读写指令，所述M个数据读写指令与M个执行线程组一一对应，各所述数据读写指令包括所对应的执行线程组的指示标识，一个指示标识用于标识一个执行线程组，所述M个执行线程组是所述主机设备对目标进程包括的N个执行线程进行分组而确定的，所述主机设备确定的用于执行所述目标进程的N个内核与所述N个执行线程一一对应，N≥2，一个执行线程仅属于一个执行线程组，一个执行线程组包括至少一个执行线程，M≥2，用于根据所述指示标识，确定各执行线程组所对应的数据读写指令，通过所述传输接口，用于将各数据读写指令传输至所对应的执行线程组，以使各所述执行线程根据所获得的数据读写指令，在所述存储设备中进行数据读写操作。
根据权利要求20所述的装置，其特征在于，所述M个执行线程组具体是所述控制器根据所述目标进程的期望完成时长以及各所述内核彼此之间的数据传输时延，对所述N个执行线程进行分组而确定的。
根据权利要求20或21所述的装置，其特征在于，各所述执行线程与所述存储设备之间的数据传输是基于直接存储DMA协议进行的。
根据权利要求20至22中任一项所述的装置，其特征在于，所述控制器具体用于通过所述传输接口接收所述主机设备发送的数据读写信号，所述数据读写信号包括M个信号分量，所述M个信号分量与所述M个数据读写指令一一对应，各数据读写指令承载于所述对应的信号分量中。
根据权利要求20至23中任一项所述的装置，其特征在于，所述M个数据读写指令是所述主机设备通过所述目标进程包括的主控线程发送的。
根据权利要求24所述的装置，其特征在于，所述主控线程属于所述执行线程。
一种计算机***，其特征在于，包括：

总线；

与所述总线相连的主机设备，用于确定用于执行目标进程的N个内核，其中，所述N个内核与所述目标进程包括的N个执行线程一一对应，N≥2，对所述N个执行线程进行分组，以确定M个执行线程组，并为各执行线程组分配指示标识，其中，一个指示标识用于标识一个执行线程组，一个执行线程仅属于一个执行线程组，一个执行线程组包括至少一个执行线程，M≥2，通过所述总线向存储设备发送M个数据读写指令，所述M个数据读写指令与所述M个执行线程组一一对应，各所述数据读写指令包括所对应的执行线程组的指示标识，一个指示标识用于唯一地标识一个执行线程组；

与所述总线相连的存储设备，用于通过所述总线接收所述M个数据读写指令，并根据所述指示标识，确定各执行线程组所对应的数据读写指令，将各数据读写指令传输至所对应的执行线程组，以使各所述执行线程根据所获得的数据读写指令，在所述存储设备中进行数据读写操作。
根据权利要求26所述的***，其特征在于，所述M个执行线程组是所述主机设备根据所述目标进程的期望完成时长以及各所述内核彼此之间的数据传输时延，对所述N个执行线程进行分组而确定的。
根据权利要求26或27所述的***，其特征在于，各所述执行线程与所述存储设备之间的数据传输是基于直接存储DMA协议进行的。