WO2021022441A1

WO2021022441A1 - 数据传输方法、装置、电子设备及可读存储介质

Info

Publication number: WO2021022441A1
Application number: PCT/CN2019/099262
Authority: WO
Inventors: 何雷骏; 董镇江; 屠嘉晋; 李震桁
Original assignee: 华为技术有限公司
Priority date: 2019-08-05
Filing date: 2019-08-05
Publication date: 2021-02-11
Also published as: CN114144793A

Abstract

本申请实施例提供一种数据传输方法、装置、电子设备及可读存储介质，在该方法中，从存储单元中获取至少一个待传输数据，存储单元中设置有N个源地址，待传输数据被分散存储于N个源地址中，基于源地址和目标地址之间的第一预设关系，使用第一传输子网络，将存储于第1个源地址至第N/2个源地址中的待传输数据传输至对应的目标地址。第一预设关系包括：当源地址为K时，对应的目标地址为从0开始的0至K中的一个。第一传输子网络包括多个层，层Y的第2^(Y–1)+1个位置至第2^Y个位置上不存在交换节点，并且，当层Y中的第1个位置至第2^Y个位置上存在至少一个交换节点时，该至少一个交换节点中的每个交换节点均不包括上行连接线路。该方法可以极大地降低传输开销以及计算开销，极大提升具有稀疏性的数据的处理效率。

Description

数据传输方法、装置、电子设备及可读存储介质

技术领域

本申请实施例涉及计算机技术，尤其涉及一种数据传输方法、装置、电子设备及可读存储介质。

背景技术

在一些涉及数据计算处理的领域中，数据可能具有稀疏性的特点。以涉及数据计算处理的神经网络为例，神经网络在其特征图和参数中普遍存在稀疏比。其中，特征图中可能存在20％至80％的稀疏比，参数中可能存在50％至90％的稀疏比。稀疏比越高，则表示数据中的0值数据越多，这些0值数据对于最终的计算结果并没有贡献。因此，对这些0值数据的传输以及计算属于无效操作。在进行数据计算处理的处理器中，数据可以保存在存储介质中，当需要进行数据计算处理时，需要将数据从存储介质中传输到处理器的计算模块中进行计算处理。如果将前述的0值数据与其他非0值数据一样进行处理，则需要将0值数据从存储介质中传输到计算模块，并且，计算模块需要对0值数据进行计算处理，这会造成较大的传输开销以及计算开销。

因此，如何对具有稀疏性的数据进行传输和计算处理，以减少对0值数据传输和计算的无效操作，降低传输开销和计算开销，是亟待解决的问题。

发明内容

本申请实施例提供一种数据传输方法、装置、电子设备及可读存储介质，用于降低电子设备中数据的传输开销和计算开销。

第一方面，本申请实施例提供一种数据传输方法，在该方法中，首先从存储单元中获取至少一个待传输数据，该存储单元中设置有N个源地址，待传输数据被分散存储于该N个源地址中，进而，基于源地址和目标地址之间的第一预设关系，使用第一传输子网络，将存储于第1个源地址至第N/2个源地址中的待传输数据传输至对应的目标地址。其中，该第一预设关系包括：当源地址为K时，对应的目标地址为从0开始的0至K中的一个。另外，上述第一传输子网络包括多个层，每个层包括至少一个交换节点，层Y的第2^(Y–1)+1个位置至第2^Y个位置上不存在交换节点，并且，当层Y中的第1个位置至第2^Y个位置上存在至少一个交换节点时，该至少一个交换节点中的每个交换节点均不包括上行连接线路。

在该方法中，基于源地址和目标地址之间满足的第一预设关系，提出了一种在源地址和目标地址之间传输数据的传输网络，该传输网络的第一传输子网络中，层Y的第2^(Y–1)+1个位置至第2^Y个位置上不存在交换节点，并且，当层Y中的第1个位置至第2^Y个位置上存在至少一个交换节点时，该至少一个交换节点中的每个交换节点均不包括上行连接线路，通过该传输网络传输数据时，不会产生碰撞的情况。同时，该传输网络相比于传统的不会发生碰撞的网络，交换节点的数量有了明显减少，传输网络的复杂度有了明显下降。因此，该传输网络具有传输速度快、传输资源占用少的优点。在使用该传输网络传输具有稀疏性的数据时，可以极大地降低传输开销以及计算开销，极大提升具有稀疏性的数据的处理效率。

在一种可选的实现方式中，上述方法还包括：

基于源地址和目标地址之间的第二预设关系，使用第二传输子网络，将存储于第N/2+1个源地址至第N个源地址中的待传输数据传输至对应的目标地址。其中，该第二预设关系包括：当源地址为L时，对应的目标地址为从M-1开始的M-1至M-1-[L％(N/2)]中的一个，M为目标地址的数量，M小于N。另外，第二传输子网络包括多个层，每个层包括至少一个交换节点，层S的第2^(S–1)+1个位置至第2^S个位置上不存在交换节点，并且，当层S中的第1个位置至第2^S个位置上存在至少一个交换节点时，该至少一个交换节点中的每个交换节点均不包括上行连接线路。

该方式中，基于源地址和目标地址之间满足的第二预设关系，提出了一种在源地址和目标地址之间传输数据的传输网络，该传输网络的第二传输子网络中，层S的第2^(S–1)+1个位置至第2^S个位置上不存在交换节点，并且，当层S中的第1个位置至第2^S个位置上存在至少一个交换节点时，该至少一个交换节点中的每个交换节点均不包括上行连接线路。通过该传输网络传输数据时，不会产生碰撞的情况。同时，该传输网络相比于传统的不会发生碰撞的网络，交换节点的数量有了明显减少，传输网络的复杂度有了明显下降。因此，该传输网络具有传输速度快、传输资源占用少的优点。在使用该传输网络传输具有稀疏性的数据时，可以极大地降低传输开销以及计算开销，极大提升具有稀疏性的数据的处理效率。

在一种可选的实现方式中，第一传输子网络的层数为log ₂(N)+1，和/或，第二传输子网络的层数为log ₂(N)+1。

在一种可选的实现方式中，在使用第一传输子网络将存储于第1个源地址至第N/2个源地址中的待传输数据传输至对应的目标地址时，可以首先获取存储于第1个源地址至第N/2个源地址中的待传输数据传输对应的目标地址，该目标地址使用二进制数值表示，进而，从目标地址的LSB开始，根据目标地址中各比特位上的数值确定待传输数据在第一传输子网络中的传输路径，通过第一传输子网络中的传输路径将待传输数据传输至目标地址。

在一种可选的实现方式中，在使用第二传输子网络将存储于第N/2+1个源地址至第N个源地址中的待传输数据传输至对应的目标地址时，可以首先获取存储于第N/2+1个源地址至第N个源地址中的待传输数据对应的目标地址，该目标地址使用二进制数值表示，进而，从目标地址的LSB开始，根据目标地址中各比特位上的数值确定待传输数据在第二传输子网络中的传输路径，通过第二传输子网络中的传输路径将待传输数据传输至目标地址。

在上述两种可选方式中，利用传输网络，将待传输数据按照LSB路由到目标地址，能够使得数据传输的速度进一步提升。

在一种可选的实现方式中，上述目标地址为计算模块中的地址，该计算模块中至少包括M个地址。

在一种可选的实现方式中，在基于源地址和目标地址之间的第一预设关系，使用第一传输子网络，将存储于第1个源地址至第N/2个源地址中的待传输数据传输至对应的目标地址之前，可以首先判断待传输数据的数量是否大于，若待传输数据的数量大于M，则将至少一个待传输数据划分为多组子数据，每组子数据在一个传输时钟下传输。

在该方式中，当待传输数据的数量大于目标地址的数量时，通过将待传输数据划分为多组子数据，并在不同的时钟下传输各组子数据，从而避免数据传输和运算出现冲突，保证数据传输和运算的正确性。

在一种可选的实现方式中，N为8，M为4。

第二方面，本申请实施例提供一种数据传输装置，该装置包括：存储单元、目标模块、传输网络以及控制模块。

存储单元中设置有N个源地址，目标模块中设置多个目标地址。

传输网络分别与存储单元以及目标模块连接。

传输网络包括第一传输子网络，该第一传输子网络包括多个层，每个层包括至少一个交换节点，层Y的第2^(Y–1)+1个位置至第2^Y个位置上不存在交换节点，并且，当层Y中的第1个位置至第2^Y个位置上存在至少一个交换节点时，该至少一个交换节点中的每个交换节点均不包括上行连接线路。

控制模块用于从存储单元中获取至少一个待传输数据，该待传输数据被分散存储于上述N个源地址中，以及，基于源地址和目标地址之间的第一预设关系，使用第一传输子网络，将存储于第1个源地址至第N/2个源地址中的待传输数据传输至对应的目标地址，其中，该第一预设关系包括：当源地址为K时，对应的目标地址为从0开始的0至K中的一个。

在一种可选的实现方式中，传输网络还包括第二传输子网络。

第二传输子网络包括多个层，每个层包括至少一个交换节点，层S的第2^(S–1)+1个位置至第2^S个位置上不存在交换节点，并且，当层S中的第1个位置至第2^S个位置上存在至少一个交换节点时，该至少一个交换节点中的每个交换节点均不包括上行连接线路。

控制模块还用于基于源地址和目标地址之间的第二预设关系，使用第二传输子网络，将存储于第N/2+1个源地址至第N个源地址中的待传输数据传输至对应的目标地址，其中，该第二预设关系包括：当源地址为L时，对应的目标地址为从M-1开始的M-1至M-1-[L％(N/2)]中的一个，M为目标地址的数量，M小于N。

在一种可选的实现方式中，控制模块具体用于：

获取所述存储于第1个源地址至第N/2个源地址中的待传输数据传输对应的目标地址，该目标地址使用二进制数值表示；以及，从目标地址的LSB开始，根据目标地址中各比特位上的数值确定待传输数据在第一传输子网络中的传输路径，通过第一传输子网络中的传输路径将待传输数据传输至目标地址。

在一种可选的实现方式中，控制模块具体用于：

获取存储于第N/2+1个源地址至第N个源地址中的待传输数据对应的目标地址，该目标地址使用二进制数值表示；以及，从目标地址的LSB开始，根据目标地址中各比特位上的数值确定待传输数据在第二传输子网络中的传输路径，通过第二传输子网络中的传输路径将待传输数据传输至目标地址。

在上述各可选的实现方式中，目标模块为计算模块，该计算模块中至少包括M个地址。

在一种可选的实现方式中，控制模块还用于：

在待传输数的数量大于M时，将至少一个待传输数据划分为多组子数据，每组子数据在一个传输时钟下传输。

在一种可选的实现方式中，N为8，M为4。

第三方面，本申请实施例提供一种电子设备，包括：存储器和处理器。

所述处理器用于与所述存储器耦合，读取并执行所述存储器中的指令，以实现上述第一方面所述的方法步骤。

第四方面，本申请实施例提供一种计算机程序产品，其特征在于，所述计算机程序产品包括计算机程序代码，当所述计算机程序代码被计算机执行时，使得所述计算机执行上述第一方面所述的方法。

第五方面，本申请实施例提供一种计算机可读存储介质，其特征在于，所述计算机存储介质存储有计算机指令，当所述计算机指令被计算机执行时，使得所述计算机执行上述第一方面所述的方法的指令。

第六方面，本申请实施例提供一种芯片，所述芯片与存储器相连，用于读取并执行所述存储器中存储的软件程序，以实现上述第一方面所提供的方法。

附图说明

图1为对某神经网络中的一段参数(weight)和一段特征图(feather map)进行卷积运算的过程示例图；

图2为本申请实施例提供的数据传输方法的流程示意图；

图3为传统的butterfly网络的结构示意图；

图4为反向butterfly网络的结构示意图；

图5(a)为前半部分子网络的演变过程；

图5(b)为演变之后的传输网络结构图；

图6(a)为后半部分子网络的演变过程；

图6(b)为演变之后的网络结构图；

图7为同时使用前文所示的两部分子网络演变方法所得到的网络结构示意图；

图8为本申请实施例提供的数据传输方法的流程示意图；

图9为本申请实施例提供的数据传输装置的模块结构图；

图10为本申请实施例提供的一种电子设备的结构示意图。

具体实施方式

首先通过一个示例对数据稀疏比进行说明。

图1为对某神经网络中的一段参数(weight)和一段特征图(feather map)进行卷积运算的过程示例图，如图1所示，该神经网络中包含一段参数以及一段特征图。该一段参数由多个数据组成，该多个数据中部分数据为0。该一段特征图由多个数据组成，该多个数据中部分数据为0。对该一段参数和一段特征图进行卷积运算时，需要将同一角标对应的特征图数据和参数数据相乘，再将相乘的结果进行累加。由于一段特征图和一段参数中均含0，因此，只有角标2和角标7对应的数据在相乘之后为非0值，这些数据对最终的运算结果有贡献，而其余角标对应的数据对最终的运算结果没有贡献。在图1所示的示例中，角标2和角标7对应的数据对最终的运算结果有贡献，其余角标0、1、3、4、5、6对应的数据对最终的运算结果没有贡献，即数据稀疏比为75％。

在进行运算处理的电子设备中，数据在运算之前，首先保存在存储介质中，进而，在进行运算处理时，需要发送到计算模块中进行运算。计算模块进行运算处理后，还可能需要将运算结果发送到下一个计算模块中，以此类推。

为便于描述，在本申请实施例中，将保存运算之前的数据的地址称为源地址，将进行运算处理时数据在计算模块中的地址称为目标地址。数据需要从源地址传输到目的地址并进行运算处理。

值得说明的是，在本申请实施例中，源地址可以是指存储介质中的地址，例如静态随机存储器(static RAM，SRAM)、动态随机存储器(dynamic RAM，DRAM)等存储介质中的地址，或者，源地址还可以是指计算模块中的地址。目标地址可以是指计算模块中的地址。

另外，在本申请实施例中，“数据”是指半精度浮点数、全精度浮点数、整数等可以用于计算的数据，“数据”可以通过十进制表示，也可以通过二进制表示，本申请实施例对于数据的具体表示方式不作具体限定。以上述图1所示的参数为例，一段参数由0、0、1、0、0、0、0、-1这8个数据组成，每个数据为整数，使用十进制表示。

在上述图1的示例中，一段参数和一段特征图可以分别称为一个数据序列，在计算处理时，数据序列统一从源地址传输到目标地址。具体的，数据序列中的一个数据存储在一个源地址中，一个源地址对应一个目标地址，各源地址中的数据分别被传输到对应的目标地址中。

在一种可能设计中，在将数据序列从源地址传输到目标地址之前，首先筛选出数据序列中的有效数据，其中，该有效数据可以指数据序列中对运算结果有贡献的数据，在筛选出有效数据之后，将有效数据通过源地址所在源模块与目标地址所在目标模块之间的传输网络进行传输。其中，源模块中包括多个地址，目标模块中也包括多个地址。源模块的各地址中所保存的数据均通过源模块与目标模块之间的传输网络传输到目标模块的各地址中。示例性的，假设源模块为SRAM，目标模块为某个计算模块A，SRAM中有8个地址，计算模块A中有4个地址，则SRAM中的8个地址中所存储的数据均可以通过SRAM与计算模块A之间的传输网络传输到计算模块A的4个地址中。在筛选出有效数据的基础上，如果能够提供传输速度快、传输资源占用少的传输网络，则可以极大降低具有稀疏性的数据的传输开销和计算开销。

本申请以下实施例，旨在提供一种基于传输速度快、传输资源占用少的传输网络的数据传输方法，以使得基于该网络传输具有稀疏性的数据时可以极大降低传输开销和计算开销。

该方法可以应用于任何包括存储介质和计算模块的电子设备中。示例性的，该电子设备可以是终端设备、网络设备等通信设备，或者，该电子设备还可以是服务器等。

以电子设备为终端设备为例，该终端设备也可以称为终端Terminal、用户设备(user equipment，UE)、移动台(mobile station，MS)、移动终端(mobile terminal，MT)等。该终端设备可以是手机(mobile phone)、平板电脑(pad)、带无线收发功能的电脑、虚拟现实(virtual reality，VR)终端设备、增强现实(augmented reality，AR)终端设备、工业控制(industrial control)中的无线终端、无人驾驶(self driving)中的无线终端、远程手术(remote medical surgery)中的无线终端、智能电网(smart grid)中的无线终端、运输安全(transportation safety)中的无线终端、智慧城市(smart city)中的无线终端、智慧家庭(smart home)中的无线终端等。

以电子设备为网络设备为例，该网络设备可以是基站，例如可以是全球移动通信***(global system for mobile communication，GSM)或码分多址(code division multiple access，CDMA)中的基站(base transceiver station，BTS)，也可以是宽带码分多址(wideband code division multiple access，WCDMA)中的基站(NodeB)，还可以是LTE中的演进型基站(eNB或e-NodeB，evolutional Node B)，也可以是NR中的gNB等。基站还可以是云无线接入网络(cloud radio access network，CRAN)场景下的无线控制器，或者可以为中继站、接入点、车载设备、可穿戴设备以及5G网络中的网络设备或者未来演进的PLMN网络中的网络设备等。

图2为本申请实施例提供的数据传输方法的流程示意图，如图2所示，该方法可以包括：

S201、从存储单元中获取至少一个待传输数据，该存储单元中设置有N个源地址，待传输数据被分散存储于该N个源地址中。

其中，上述至少一个待传输数据可以为一个数据序列中的数据，该数据序列可以是电子设备中需要传输到计算模块中进行计算处理的任何数据序列，例如可以为上述图1所示例的一段参数或一段特征图等。

本申请实施例中，计算模块也可以称为计算单元。

可选的，上述存储单元可以为SRAM、DRAM等，该存储单元中包括多个源地址，每个源地址中可以存储一个待传输数据。

可选的，上述待传输数据可以为数据序列中的有效数据。在将待传输数据保存至存储单元之前，电子设备可以预先标记数据序列中的有效数据。示例性的，电子设备可以根据与数据序列进行运算的另一数据序列，以及数据序列与另一数据序列的运算方式，确定出数据序列以及另一数据中的有效数据，并对有效数据进行标记。以数据序列为前述的图1中的神经网络中的一段含0的参数，另一数据序列为前述的图1中的神经网络中的一段含0的特征图为例，电子设备首先读取该一段参数以及需要与该一段参数进行运算的一段特征图，并获知该一段参数与该一段特征图需要进行相乘，进而，电子设备将该一段参数与该一段特征图中相乘结果不为0的数据标记为有效数据。具体的，将图1中角标2和7对应的数据标记为有效数据，即在图1示例的神经网络的一段参数中，有效数据为1和-1，同时，在图1示例的神经网络的一段数据中，有效数据为3和5。在标记有效数据之后，将有效数据分散存储在存储单元的N个源地址中。

可选的，上述N个源地址可以是存储待传输数据的模块中的所有地址，或者，上述N个源地址也可以是存储待传输数据的模块中的部分地址，本申请实施例对此不作具体限定。

可选的，上述N为偶数。

继续参照图1的示例，一段参数包括8个数据，分别为0、0、1、0、0、0、0、-1，该8个数据分别存储在存储单元的8个源地址中。在该示例中，N为8。

S202、基于源地址和目标地址之间的第一预设关系，使用第一传输子网络，将存储于第1个源地址至第N/2个源地址中的待传输数据传输至对应的目标地址，其中，该第一预设关系包括：当源地址为K时，对应的目标地址为从0开始的0至K中的一个。

可选的，上述至少一个待传输数据分别传输至计算模块中的一个目标地址。其中，目标地址所在的计算模块中至少可以包括M个地址。N个源地址中的数据被传输到计算模块的M个地址中。在本申请实施例中，M小于N，即计算模块单次计算的数据个数小于源地址所在模块存储的数据个数，以进行有效数据的对齐。

其中，N个源地址的数据被传输到计算模块的M个地址时，一方面，N个源地址中的第一源地址与该第一源地址对应的目标地址满足第一预设关系，该第一预设关系包括：当源地址为K时，目标地址为从0开始的0至K中的一个。其中，K为大于等于0的数。上述第一源地址为第1个源地址至第N/2个源地址中的任意一个源地址。

示例性的，源地址与目标地址的映射关系可以通过表项管理方式表示，在诸如Crossbar网络等传统网络中，源地址和目标地址之间的映射关系为全连接关系，即对于一个源地址，其中所存储的数据可能被传输到任意一个目标地址中，而在本申请实施例中，对于第1个源地址至第N/2个源地址中的一个源地址K，其对应的目标地址不再是任意一个目标地址，而是0至K中的一个。这样的设计在保证数据正常传输的前提下，能够简化传输网络的复杂度。

值得说明的是，为便于描述，本申请实施例中假定源地址和目标地址从0开始编号，因此，0至K中的一个，表示第一个目标地址至第K+1个目标地址。例如，假设目标地址为计算模块中的地址，计算模块中包括M个地址，该M个地址从0开始编号，因此，目标地址0表示计算模块中的第一个目标地址，目标地址M-1表示计算模块中的第M个目标地址。

对于存储带传输数据的模块中的第1个源地址至第N/2个源地址，即存储待传输数据的模块中的前半部分源地址，这些地址中保存的数据被传输至计算模块中从0开始的地址，并且，源地址K中的数据被传输到的目标地址为0至K中的一个。对于前半部分源地址来说，对应的目标地址为正向排布方式。

源地址所在模块与计算模块之间通过特定的传输网络进行传输。

在本申请实施例中，上述传输网络包括第一传输子网络，该第一传输子网络用于传输第1个源地址至第N/2个源地址中所存储的待传输数据，该第一传输子网络包括多个层，每个层包括至少一个交换节点，层Y的第2^(Y–1)+1个位置至第2^Y个位置上不存在交换节点，并且，当层Y中的第1个位置至第2^Y个位置上存在至少一个交换节点时，所述至少一个交换节点中的每个交换节点均不包括上行连接线路。

其中，本申请实施例中，符号“^”表示次方运算，例如，2^Y表示2的Y次方，下述不再另行解释。

值得说明的是，在本申请实施例中，交换节点可以是由电路逻辑来实现的逻辑器件。示例性的，交换节点可以是2-2多路复用器(Multiplexer，MUX)等。

在上述传输网络中，第一传输子网络用于传输第1个源地址至第N/2个源地址中所存储的待传输数据，即第一传输子网络用于传输前半部分源地址中的待传输数据。在本申请实施例中，传输网络的层数可以灵活设置。作为一种可选的实施方式，传输网络的层数可以根据源地址的数量确定。当源地址的数量为上述的N时，传输网络的层数可以为log ₂(N)+1向上取整的结果。

在具体实施过程中，可以基于传统的传输网络，在传统的传输网络的基础上，演变出本申请实施例的传输网络。

以下从传统的蝴蝶型网络(butterfly网络)为例，说明本申请实施例的传输网络的特征。

图3为传统的butterfly网络的结构示意图，如图3所示，该butterfly网络负责将8个源地址的数据传输到4个目标地址中，不同源地址中的数据可能需要使用同一条传输线路进行传输，这样可能产生碰撞现象。例如，源地址0中存储的数据和地址4中存储的数据可能同时需要使用节点1和节点2之间的传输线路进行传输，从而产生碰撞。

基于图3所示的传统butterfly网络，在本申请实施例中，首先提出一种反向butterfly网络结构，图4为反向butterfly网络的结构示意图，如图4所示，该网络包括两个传输子网络，一个传输子网络(前半部分传输子网络)负责将前半部分源地址中的数据传输到目标地址中，另一个传输子网络(后半部分传输子网络)负责将后半部分源地址中的数据传输到目标地址中。其中，前半部分源地址和后半部分源地址分别指：假设网络包括N个源地址，前半部分源地址指源地址0至N/2-1，后半部分源地址指N/2至N-1。两个传输子网络均包括多层，每层包括多个交换节点。每个传输子网络中第一层的每个节点分别与每个源地址连接，每个传输子网络中最后一层的每个节点分别与每个目标地址连接。值得说明的是，在图4所示的网络结构中，对于与目标地址连接的交换节点A、交换节点B、交换节点C和交换节点D，其同时属于两个传输子网络。

在图4所示的网络结构的基础上，基于上述的第一预设关系，可以对前半部分传输子网络进行演变，得到上述步骤S202中所述的传输网络。图5(a)为前半部分子网络的演变过程，图5(b)为演变之后的传输网络结构图。如图5(a)和图5(b)所示，该传输网络包括了第一传输子网络和第二传输子网络。其中，第一传输子网络负责将前半部分源地址中的数据传输到目标地址中，第二传输子网络负责将后半部分源地址中的数据传输到目标地址中。两个子网络均包括多层，每层包括多个交换节点。每个传输子网络中第一层的每个节点分别与每个源地址连接，每个子网络中最后一层的每个节点分别与每个目标地址连接。值得说明的是，在图5(b)所示的网络结构中，对于与目标地址连接的交换节点，其同时属于两个子网络。同时，基于上述的第一预设关系，可以对上述图4所示的反向butterfly网络中的前半部分子网络进行演变得到。

对于第一传输子网络中的层Y，演变如下，其中，Y大于等于0，并且小于等于传输网络的层数减去1的差值，例如，第一传输子网络的层数可以为log ₂(N)+1向上取整的结果时，Y的取值为：大于等于0，并且小于等于log(N)向上取整的结果。

第一传输子网络的层数以及第二传输子网络的层数分别与传输网络的层数相同。(1)在层Y中，省略交换节点0至交换节点2^Y-1的上行连接线路。

可选的，第一传输子网络的每一层中交换节点可以按照如下方式进行编号：

A、交换节点的序号从0开始编号。例如，交换节点0表示第1个交换节点，交换节点2^Y-1表示第2^Y个交换节点。

B、在层0中，与最小的源地址连接的交换节点的编号最小，依次类推。例如，在图5(a)所示的第一传输子网络中，与源地址0连接的层0中的交换节点为交换节点0，与源地址1连接的层0的交换节点为交换节点1，依次类推。

C、在除层0以及第一传输子网络的最后一层外的其他层中，各交换节点的编号分别与第一层中与各交换节点位置相同的交换节点的编号保持一致。示例性的，层1中包括4个交换节点，最下方的一个交换交换节点与层0中交换节点0位置相同，即均属于所在层的最下方的一个交换节点，则层1中最下方的交换节点为交换节点0。次下方的一个交换节点与层0中交换节点1位置相同，即均属于所在层次下方的一个交换节点，因此，层1中次下方的交换节点为交换节点1。以此类推，可以得出除层0以及第一传输子网络的最后一层外的其他层中每个交换节点的编号。

D、在最后一层中，与最小的目标地址连接的交换节点的编号最小，依次类推。例如，在图5(a)所述的第一传输子网络，与目标地址0连接的层3中的交换节点为交换节点0，与目标地址1连接的层3的交换节点为交换节点1，依次类推。

另外，在本申请实施例中，源地址和目标地址的序号也从0开始编号。例如，源地址0表示第1个源地址，以此类推。

参照图4、图5(a)和图5(b)，以Y＝1为例，由于在上述第一预设关系中，在源地址K中的数据仅能传输到目标地址0到K中的一个，则对于层1来说，源地址中的数据经过层1中的交换节点0或交换节点1时，并不需要再向上传输，因此，省略掉层1中交换节点0和交换节点1的上行连接线路之后，并不会影响源地址中数据的正常传输。

其中，向上传输是指编号较小的交换节点向编号较大的交换节点传输数据，示例性的，参照图5(a)，层1的交换节点0向层2的交换节点2传输数据时，即为向上传输。

相应的，上行连接线路是指编号较小层中编号较小的交换节点到编号较大层中编号较大的交换节点之间的连接。示例性的，对于层1和层2来说，层1为编号较小层，层2为编号较大层。对于层1中交换节点0和层2中的交换节点2来说，层1中的交换节点0为编号较小的交换节点，层2中的交换节点2为编号较大的交换节点，则层1中的交换节点0至层2中的交换节点2之间的连接为一个上行连接线路。

(2)在层Y中，删除第2^(Y–1)+1个位置至第2^Y个位置上的交换节点。

其中，该层Y为除第一传输子网络中第一层与最后一层之外的层。

值得说明的是，在删除第2^(Y–1)+1个位置至第2^Y个位置上的交换节点之后，第2^(Y–1)+1个位置至第2^Y个位置依然存在，并且，这些位置上不再存在交换节点。

其中，该步骤中删除的交换节点包括2*2的交换节点以及2*1的交换节点。其中，2*2的交换节点是指包括2个输入连接和2个输出连接的节点，2*1的交换节点是指包括2个输入连接和1输出连接的节点。

继续参照图4、图5(a)和图5(b)，以Y＝1为例，在执行上述(1)之后，层1中的交换节点1仅用来连接层0的交换节点1和层2的交换节点1，因此，删除到层1的交换节点1之后，使得层0的交换节点1与层2的交换节点1直接连接，并不会影响源地址中数据的正常传输。依照这一原则，层2的交换节点2和交换节点3也删除，将层1的交换节点3与层3的交换节点3直连；将层1的交换节点2和层3的交换节点2直连。

(3)当Y>＝1时，将交换节点0至交换节点2^(Y-1)-1从2x2节点修改为2x1节点或1x2节点。

可选的，该步骤可以独立于上述(1)和(2)执行，或者，如果执行了上述(1)和(2)之后，该步骤的结果可以被满足。

经过上述演变之后，所得到的传输网络的Y层满足如下条件：

(1)层Y的第2^(Y–1)+1个位置至第2^Y个位置上不存在交换节点。

(2)当层Y中的第1个位置至第2^Y个位置上存在至少一个交换节点时，所述至少一个交换节点中的每个交换节点均不包括上行连接线路。

参照图4、图5(a)和图5(b)，在经过上述的演变之后，传输网络的第一传输子网络中，层1上的交换节点1、层2上的交换节点2和交换节点3被删除。

具体的，图5(b)中的传输网络用于将8个源地址中的数据传输到4个目标地址中，传输网络中的第一传输子网络用于传输源地址0到3中的数据，第一传输子网络包括4层，分别为层0、层1、层2和层3，层0中包括4个交换节点，分别为交换节点0、交换节点1、交换节点2和交换节点3。层1中包括3个交换节点，分别为节点0、节点2和节点3。层2中包括2个交换节点，分别为节点0和节点1。层3中包括4个交换节点。每层中每个交换节点的连接方式可以参照图5(b)，此处不再一一说明。

由于在本申请实施例中，源地址和目标地址满足上述第一预设关系，因此，前半部分源地址中的数据经过上述图5(b)所示的第一传输子网络传输时，不会发生碰撞的情况，同时，上述图5(b)所示的第一传输子网络相比于传统的不会发生碰撞的传输网络，例如交叉开关网络(Crossbar网络)，传输网络的交换节点数量有了明显减少，传输网络的复杂度有了明显下降。

本实施例中，基于源地址和目标地址之间满足的第一预设关系，提出了一种在源地址和目标地址之间传输数据的传输网络，该传输网络的第一传输子网络中，层Y的第2^(Y–1)+1个位置至第2^Y个位置上不存在交换节点，并且，当层Y中的第1个位置至第2^Y个位置上存在至少一个交换节点时，该至少一个交换节点中的每个交换节点均不包括上行连接线路，通过该传输网络传输数据时，不会产生碰撞的情况。同时，该传输网络相比于传统的不会发生碰撞的网络，交换节点的数量有了明显减少，传输网络的复杂度有了明显下降。因此，该传输网络具有传输速度快、传输资源占用少的优点。在使用该传输网络传输具有稀疏性的数据时，可以极大地降低传输开销以及计算开销，极大提升具有稀疏性的数据的处理效率。

作为一种可选的实施方式，在前文所述的N个源地址中，第二源地址与该第二源地址对应的目标地址满足第二预设关系，该第二预设关系包括：当源地址为L时，目标地址为从M-1开始的M-1至M-1-[L％(N/2)]中的一个，其中，该第二源地址为第N/2+1个源地址至第N个源地址中的任意一个源地址。L为大于0的数。

对于存储待传输数据的模块中的第N/2+1个源地址至第第N个源地址，即存储待传输数据的模块中的后半部分源地址，这些地址中保存的数据被传输至计算模块中从M-1开始的地址，并且，源地址L中的数据被传输到的目标地址为M-1至M-1-[L％(N/2)]中的一个。对于后半部分源地址来说，对应的目标地址为逆向排布方式。

在本申请实施例中，上述传输网络还包括第二传输子网络，该第二传输子网络用于传输N/2+1个源地址至第N个源地址中所存储的待传输数据，该第二传输子网络包括多个层，每个层包括至少一个交换节点，层S的第2^(S–1)+1个位置至第2^S个位置上不存在交换节点，并且，当层S中的第1个位置至第2^S个位置上存在至少一个交换节点时，该至少一个交换节点中的每个交换节点均不包括上行连接线路。

基于上述的第二预设关系，可以使用上述第二传输子网络，将存储于第N/2+1个源地址至第N个源地址中的待传输数据传输至对应的目标地址。

基于上述的第二预设关系，在前述的图4所示的网络结构的基础上，可以使用前述的演变过程，演变出传输网络中的第二传输子网络。图6(a)为后半部分子网络的演变过程，图6(b)为演变之后的网络结构图。基于上述的第二预设关系，对上述图4所示的反向butterfly网络的后半部分子网络进行以下演变过程。值得说明的是，在图6(a)和图6(b)中，第二传输子网络首先按照上述逆向排布方式连接，具体为，层2的节点0与层3的节点3连接，层2的节点1与层3的节点2连接，以此类推。

对于第二传输子网络中的层S，演变如下，其中，S大于等于0，并且小于等于第二传输子网络的层数减去1的差值，例如，第二传输子网络的层数可以为log ₂(N)+1向上取整的结果时，S的取值为：大于等于0，并且小于等于log ₂(N)向上取整的结果。

(1)在层S中，省略交换节点0至交换节点2^S-1的上行连接。

可选的，第二传输子网络的每一层中交换节点可以按照如下方式进行编号：

B、在层0中，与最小的源地址连接的交换节点的编号最小，依次类推。例如，在图5(a)所示的第二传输子网络中，与源地址0连接的层0中的交换节点为交换节点0，与源地址1连接的层0的交换节点为交换节点1，依次类推。

C、在除层0以及第二传输子网络的最后一层外的其他层中，各交换节点的编号分别与第一层中与各交换节点位置相同的交换节点的编号保持一致。示例性的，层1中包括4个交换节点，最下方的一个交换交换节点与层0中交换节点0位置相同，即均属于所在层的最下方的一个交换节点，则层1中最下方的交换节点为交换节点0。次下方的一个交换节点与层0中交换节点1位置相同，即均属于所在层次下方的一个交换节点，因此，层1中次下方的交换节点为交换节点1。以此类推，可以得出除层0以及第二传输子网络的最后一层外的其他层中每个交换节点的编号。

D、在最后一层中，与最小的目标地址连接的交换节点的编号最小，依次类推。例如，在图5(a)所示的第二传输子网络中，与目标地址0连接的层3中的交换节点为交换节点0，与目标地址1连接的层3的交换节点为交换节点1，依次类推。

参照图4、图6(a)和图6(b)，以S＝1为例，由于在上述第二预设关系中，在源地址L中的数据仅能传输到目标地址M-1到M-1-[L％(N/2)]中的一个，则对于层1来说，源地址中的数据经过层1中的交换节点0或交换节点1时，并不需要再向上传输，因此，省略掉层1中交换节点0和交换节点1的上行连接线路之后，并不会影响源地址中数据的正常传输。

(2)在层S中，删除第2^(S–1)+1个位置至第2^S个位置上的交换节点。

其中，该层S为除第二传输子网络中第一层与最后一层之外的层。

值得说明的是，在删除第2^(S–1)+1个位置至第2^S个位置上的交换节点之后，第2^(S–1)+1个位置至第2^S个位置依然存在，并且，这些位置上不再存在交换节点。

其中，该步骤中删除的交换节点包括2*2的交换节点以及2*1的交换节点。

继续参照图4、图6(a)和图6(b)，以S＝1为例，在执行上述(1)之后，层1中的交换节点1仅用来连接层0的交换节点1和层2的交换节点1，因此，删除到层1的交换节点1之后，使得层0的交换节点1与层2的交换节点1直接连接，并不会影响源地址中数据的正常传输。依照这一原则，层2的交换节点2和交换节点3也删除，将层1的交换节点3与层3的交换节点0直连；将层1的交换节点2和层3的交换节点1直连。

(3)当S>＝1时，将交换节点0至交换节点2^(S-1)-1从2x2节点修改为2x1节点或1x2节点。

经过上述演变之后，所得到的传输网络的S层满足如下条件：

(1)层S的第2^(S–1)+1个位置至第2^S个位置上不存在交换节点。

(2)当层S中的第1个位置至第2^S个位置上存在至少一个交换节点时，该至少一个交换节点中的每个交换节点均不包括上行连接线路。

参照图4、图6(a)和图6(b)，在经过上述的演变之后，传输网络的第二传输子网络中，层1上的交换节点1、层2上的交换节点2和交换节点3被删除。

具体的，图6(b)中的传输网络用于将8个源地址中的数据传输到4个目标地址中，传输网络中的第二传输子网络用于传输源地址4到7中的数据，第二传输子网络包括4层，分别为层0、层1、层2和层3，层0中包括4个交换节点，分别为交换节点0、交换节点1、交换节点2和交换节点3。层1中包括3个交换节点，分别为节点0、节点2和节点3。层2中包括2个交换节点，分别为节点0和节点1。层3中包括4个交换节点。每层中每个交换节点的连接方式可以参照图6(b)，此处不再一一说明。

由于在本申请实施例中，源地址和目标地址满足上述第二预设关系，因此，后半部分源地址中的数据经过上述图6(b)所示的第二传输子网络传输时，不会发生碰撞的情况，同时，上述图6(b)所示的第二传输子网络相比于传统的不会发生碰撞的传输网络，例如Crossbar网络，传输网络的交换节点数量有了明显减少，传输网络的复杂度有了明显下降。

本实施例中，基于源地址和目标地址之间满足的第二预设关系，提出了一种在源地址和目标地址之间传输数据的传输网络，该传输网络的第二传输子网络中，层S的第2^(S–1)+1个位置至第2^S个位置上不存在交换节点，并且，当层S中的第1个位置至第2^S个位置上存在至少一个交换节点时，该至少一个交换节点中的每个交换节点均不包括上行连接线路。通过该传输网络传输数据时，不会产生碰撞的情况。同时，该传输网络相比于传统的不会发生碰撞的网络，交换节点的数量有了明显减少，传输网络的复杂度有了明显下降。因此，该传输网络具有传输速度快、传输资源占用少的优点。在使用该传输网络传输具有稀疏性的数据时，可以极大地降低传输开销以及计算开销，极大提升具有稀疏性的数据的处理效率。

在具体实施过程中，传输网络可以使用如上述图5(b)所示的结构，即仅第一传输子网络使用演变后的网络结构，或者，传输网络可以使用如上述图6(b)所示的结构，即仅第二传输子网络使用演变后的网络结构。或者，传输网络还可以使用下述图7所示的结构，图7为同时使用前文所示的两部分子网络演变方法所得到的网络结构示意图，在图7中，第一传输子网络的结构与图5(b)中的第一传输子网络相同，第二传输子网络的结构与图6(b)中的第一传输子网络相同，此处不再赘述。

如下表1为对上述图5(b)和上述图7与传统的传输网络进行比较的示例。如表1所示，上述图5(b)和上述图7相比于传统的Crossbar网络，极大节省了2*2交换节点以及连接线的数量，同时，相比于传统的butterfly网络，能够避免碰撞现象的发生。

表1

以下说明基于上述的传输网络，在步骤S202中进行数据传输时的具体过程。

图8为本申请实施例提供的数据传输方法的流程示意图，如图8所示，使用上述的第一传输子网络将待传输数据传输到目标地址的过程包括：

S801、获取所述存储于第1个源地址至第N/2个源地址中的待传输数据传输对应的目标地址，该目标地址使用二进制数值表示。

可选的，待传输数据的目标地址可以根据预设的待传输数据编号与目标地址的对应关系获取。示例性的，假设8个源地址中保存了8个数据，其中包括2个待传输数据，则第一个待传输数据的目标地址为地址0，第二个待传输数据的目标地址为地址1。

S802、从上述目标地址的最低有效位(least significant bit，LSB)开始，根据上述目标地址中各比特位上的数值确定上述待传输数据在上述传输网络中的传输路径，通过上述传输路径将上述待传输数据传输至上述目标地址。

以数据序列为上述图1所示的神经网络中的一段特征图，传输网络为图7所示的传输网络为例，该一段特征图中包括2个有效数据，该2个有效数据为待传输数据。该一段特征图被存储在图7所示的8个源地址中，其中，数据5保存在源地址0中，以此类推，顺序保存。由前文的描述可知，该一段特征图中的有效数据为5和3，其中，数据3保存在源地址5中。因此，数据3可以使用第二传输子网络进行传输。同时，根据上述第二预设关系，数据3可以传输到目标地址2。目标地址1的二进制数值为001。则从001的LSB开始，将数据3在第二传输子网络上进路由。具体的，001的LSB为1，则数据3从层0的交换节点1路由到层2的交换节点1，并从层2的交换节点1直接路由到层3的交换节点2，进而传输到目标地址2。

本实施例中，利用上述的传输网络，将待传输数据按照LSB路由到目标地址，能够使得数据传输的速度进一步提升。

与上述图8所示过程类似的，当使用第二传输子网络传输数据时，可以首先获取存储于第N/2+1个源地址至第N个源地址中的待传输数据对应的目标地址，该目标地址使用二进制数值表示，进而，从目标地址的LSB开始，根据目标地址中各比特位上的数值确定待传输数据在第二传输子网络中的传输路径，通过第二传输子网络中的传输路径将待传输数据传输至目标地址。具体执行过程与上述图8中第一传输子网络的处理过程一致，此处不再赘述。

在上述各实施例中，目标地址的数量M小于源地址的数量N。示例性的，M可以为4，N可以为8。在这种方式下，如果源地址中保存的待传输数据的数量大于M，则无法一次将所有的待传输数据传输到目标地址进行处理。基于该问题，作为一种可选的实施方式，如果上述待传输数据的数量大于M，则可以将待传输数据划分为多组子数据，在一个传输时钟下，使用上述传输网络将一组子数据传输至对应的目标地址。

可选的，可以按照源地址对待传输数据进行划分。示例性的，若源地址数量为8，目标地址数量为4，则将源地址0到源地址3中的数据作为第一组子数据，将源地址4到源地址7中的数据作为第二组子数据。进而，将第一组子数据中的待传输数据在一个时钟下通过上述传输网络传输到目标地址进行运算，将第二组子数据中的待传输数据在另一个时钟下通过上述传输网络传输到目标地址进行运算。

本实施例中，当待传输数据的数量大于目标地址的数量时，通过将待传输数据划分为多组子数据，并在不同的时钟下传输各组子数据，从而避免数据传输和运算出现冲突，保证数据传输和运算的正确性。

图9为本申请实施例提供的数据传输装置的模块结构图，该装置可以为前述实施例所描述的电子设备，也可以为电子设备中能够实现本申请实施例提供的方法中的功能的装置，例如该装置可以是电子设备中的装置或芯片***。如图9所示，该装置包括：

存储单元901、目标模块902、传输网络903以及控制模块904。

其中，存储单元901中设置有N个源地址，目标模块902中设置多个目标地址。

传输网络903分别与存储单元901以及目标模块902连接。

传输网络903包括第一传输子网络，该第一传输子网络包括多个层，每个层包括至少一个交换节点，层Y的第2^(Y–1)+1个位置至第2^Y个位置上不存在交换节点，并且，当层Y中的第1个位置至第2^Y个位置上存在至少一个交换节点时，该至少一个交换节点中的每个交换节点均不包括上行连接线路。

控制模块904可以与存储单元901、目标模块902、传输网络903分别连接。

控制模块904用于从存储单元901中获取至少一个待传输数据，该待传输数据被分散存储于上述N个源地址中，以及，基于源地址和目标地址之间的第一预设关系，使用第一传输子网络，将存储于第1个源地址至第N/2个源地址中的待传输数据传输至对应的目标地址，其中，该第一预设关系包括：当源地址为K时，对应的目标地址为从0开始的0至K中的一个。

在一种可选的实施方式中，传输网络903还包括第二传输子网络。

上述第二传输子网络包括多个层，每个层包括至少一个交换节点，层S的第2^(S–1)+1个位置至第2^S个位置上不存在交换节点，并且，当层S中的第1个位置至第2^S个位置上存在至少一个交换节点时，该至少一个交换节点中的每个交换节点均不包括上行连接线路；

控制模块904还用于基于源地址和目标地址之间的第二预设关系，使用第二传输子网络，将存储于第N/2+1个源地址至第N个源地址中的待传输数据传输至对应的目标地址，其中，该第二预设关系包括：当源地址为L时，对应的目标地址为从M-1开始的M-1至M-1-[L％(N/2)]中的一个，M为目标地址的数量，M小于N。

在一种可选的实施方式中，上述第一传输子网络的层数为log ₂(N)+1，和/或，上述第二传输子网络的层数为log ₂(N)+1。

在一种可选的实施方式中，控制模块904具体用于：

获取存储于第1个源地址至第N/2个源地址中的待传输数据传输对应的目标地址，该目标地址使用二进制数值表示；以及，从目标地址的LSB开始，根据目标地址中各比特位上的数值确定待传输数据在第一传输子网络中的传输路径，通过第一传输子网络中的传输路径将待传输数据传输至目标地址。

在一种可选的实施方式中，控制模块904具体用于：

作为一种可选的实施方式，目标模块902可以为计算模块，该计算模块中至少包括M个地址。

当待传输数据的数量大于M时，控制模块904还用于将至少一个待传输数据划分为多组子数据，每组子数据在一个传输时钟下传输。

本申请实施例提供的数据传输装置，可以执行上述方法实施例中的方法步骤，其实现原理和技术效果类似，在此不再赘述。

需要说明的是，应理解以上装置的各个模块的划分仅仅是一种逻辑功能的划分，实际实现时可以全部或部分集成到一个物理实体上，也可以物理上分开。且这些模块可以全部以软件通过处理元件调用的形式实现；也可以全部以硬件的形式实现；还可以部分模块通过处理元件调用软件的形式实现，部分模块通过硬件的形式实现。例如，确定模块可以为单独设立的处理元件，也可以集成在上述装置的某一个芯片中实现，此外，也可以以程序代码的形式存储于上述装置的存储器中，由上述装置的某一个处理元件调用并执行以上确定模块的功能。其它模块的实现与之类似。此外这些模块全部或部分可以集成在一起，也可以独立实现。这里所描述的处理元件可以是一种集成电路，具有信号的处理能力。在实现过程中，上述方法的各步骤或以上各个模块可以通过处理器元件中的硬件的集成逻辑电路或者软件形式的指令完成。

例如，以上这些模块可以是被配置成实施以上方法的一个或多个集成电路，例如：一个或多个特定集成电路(application specific integrated circuit，ASIC)，或，一个或多个微处理器(digital signal processor，DSP)，或，一个或者多个现场可编程门阵列(field programmable gate array，FPGA)等。再如，当以上某个模块通过处理元件调度程序代码的形式实现时，该处理元件可以是通用处理器，例如中央处理器(central processing unit，CPU)或其它可以调用程序代码的处理器。再如，这些模块可以集成在一起，以片上***(system-on-a-chip，SOC)的形式实现。

在上述实施例中，可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时，可以全部或部分地以计算机程序产品的形式实现。该计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行该计算机程序指令时，全部或部分地产生按照本申请实施例所描述的流程或功能。上述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。上述计算机指令可以存储在计算机可读存储介质中，或者从一个计算机可读存储介质向另一个计算机可读存储介质传输，例如，上述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。上述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。上述可用介质可以是磁性介质，(例如，软盘、硬盘、磁带)、光介质(例如，DVD)、或者半导体介质(例如固态硬盘solid state disk(SSD))等。

图10为本申请实施例提供的一种电子设备的结构示意图。如图10所示，该电子设备1000可以包括：处理器101(例如CPU)、存储器102、收发器103；收发器103耦合至处理器101，处理器101控制收发器103的收发动作。存储器102中可以存储各种指令，以用于完成各种处理功能以及实现本申请实施例中电子设备执行的方法步骤。可选的，本申请实施例涉及的电子设备还可以包括：电源104、***总线105以及通信端口106。收发器103可以集成在电子设备的收发信机中，也可以为电子设备上独立的收发天线。***总线105用于实现元件之间的通信连接。上述通信端口106用于实现电子设备与其他外设之间进行连接通信。

在本申请实施例中，上述处理器101用于与存储器102耦合，读取并执行存储器102中的指令，以实现上述方法实施例中电子设备执行的方法步骤。其实现原理和技术效果类似，在此不再赘述。

该图10中提到的***总线可以是外设部件互连标准(peripheral component interconnect，PCI)总线或扩展工业标准结构(extended industry standard architecture，EISA)总线等。该***总线可以分为地址总线、数据总线、控制总线等。为便于表示，图中仅用一条粗线表示，但并不表示仅有一根总线或一种类型的总线。通信接口用于实现数据库访问装置与其他设备(例如客户端、读写库和只读库)之间的通信。存储器可能包含随机存取存储器(random access memory，RAM)，也可能还包括非易失性存储器(non-volatile memory)，例如至少一个磁盘存储器。

上述的处理器可以是通用处理器，包括中央处理器CPU、网络处理器(network processor，NP)等；还可以是数字信号处理器DSP、专用集成电路ASIC、现场可编程门阵列FPGA或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。

可选的，本申请实施例还提供一种计算机可读存储介质，该存储介质中存储有指令，当其在计算机上运行时，使得计算机执行上述实施例中电子设备的处理过程。

可选的，本申请实施例还提供一种运行指令的芯片，该芯片用于执行上述实施例中电子设备的处理过程。

本申请实施例还提供一种程序产品，该程序产品包括计算机程序，该计算机程序存储在存储介质中，至少一个处理器可以从上述存储介质读取上述计算机程序，上述至少一个处理器执行上述实施例中电子设备的处理过程。

在本申请实施例中，“至少一个”是指一个或者多个，“多个”是指两个或两个以上。“和/或”，描述关联对象的关联关系，表示可以存在三种关系，例如，A和/或B，可以表示：单独存在A，同时存在A和B，单独存在B的情况，其中A，B可以是单数或者复数。字符“/”一般表示前后关联对象是一种“或”的关系；在公式中，字符“/”，表示前后关联对象是一种“相除”的关系。“以下至少一项(个)”或其类似表达，是指的这些项中的任意组合，包括单项(个)或复数项(个)的任意组合。例如，a，b，或c中的至少一项(个)，可以表示：a，b，c，a-b，a-c，b-c，或a-b-c，其中，a，b，c可以是单个，也可以是多个。

可以理解的是，在本申请的实施例中涉及的各种数字编号仅为描述方便进行的区分，并不用来限制本申请实施例的范围。

可以理解的是，在本申请的实施例中，上述各过程的序号的大小并不意味着执行顺序的先后，各过程的执行顺序应以其功能和内在逻辑确定，而不应对本申请的实施例的实施过程构成任何限定

Claims

一种数据传输方法，其特征在于，包括：

从存储单元中获取至少一个待传输数据，所述存储单元中设置有N个源地址，所述待传输数据被分散存储于所述N个源地址中；

基于源地址和目标地址之间的第一预设关系，使用第一传输子网络，将存储于第1个源地址至第N/2个源地址中的待传输数据传输至对应的目标地址，其中，所述第一预设关系包括：当源地址为K时，对应的目标地址为从0开始的0至K中的一个；

其中，所述第一传输子网络包括多个层，每个层包括至少一个交换节点，层Y的第2^(Y–1)+1个位置至第2^Y个位置上不存在交换节点，并且，当层Y中的第1个位置至第2^Y个位置上存在至少一个交换节点时，所述至少一个交换节点中的每个交换节点均不包括上行连接线路。
根据权利要求1所述的方法，其特征在于，所述方法还包括：

基于源地址和目标地址之间的第二预设关系，使用第二传输子网络，将存储于第N/2+1个源地址至第N个源地址中的待传输数据传输至对应的目标地址，其中，所述第二预设关系包括：当源地址为L时，对应的目标地址为从M-1开始的M-1至M-1-[L％(N/2)]中的一个，M为目标地址的数量，M小于N；

所述第二传输子网络包括多个层，每个层包括至少一个交换节点，层S的第2^(S–1)+1个位置至第2^S个位置上不存在交换节点，并且，当层S中的第1个位置至第2^S个位置上存在至少一个交换节点时，所述至少一个交换节点中的每个交换节点均不包括上行连接线路。
根据权利要求2所述的方法，其特征在于，所述第一传输子网络的层数为log ₂(N)+1，和/或，所述第二传输子网络的层数为log ₂(N)+1。
根据权利要求1-3任一项所述的方法，其特征在于，所述使用第一传输子网络，将存储于第1个源地址至第N/2个源地址中的待传输数据传输至对应的目标地址，包括：

获取所述存储于第1个源地址至第N/2个源地址中的待传输数据传输对应的目标地址，所述目标地址使用二进制数值表示；

从所述目标地址的最低有效位LSB开始，根据所述目标地址中各比特位上的数值确定所述待传输数据在所述第一传输子网络中的传输路径，通过所述第一传输子网络中的传输路径将所述待传输数据传输至所述目标地址。
根据权利要求2或3所述的方法，其特征在于，所述使用第二传输子网络，将存储于第N/2+1个源地址至第N个源地址中的待传输数据传输至对应的目标地址，包括：

获取所述存储于第N/2+1个源地址至第N个源地址中的待传输数据对应的目标地址，所述目标地址使用二进制数值表示；

从所述目标地址的LSB开始，根据所述目标地址中各比特位上的数值确定所述待传输数据在所述第二传输子网络中的传输路径，通过所述第二传输子网络中的传输路径将所述待传输数据传输至所述目标地址。
根据权利要求1-5任一项所述的方法，其特征在于，所述目标地址为计算模块中的地址，所述计算模块中至少包括M个地址。
根据权利要求6所述的方法，其特征在于，所述基于源地址和目标地址之间的第一预设关系，使用第一传输子网络，将存储于第1个源地址至第N/2个源地址中的待传输数据传输至对应的目标地址之前，还包括：

若所述待传输数据的数量大于M，则将所述至少一个待传输数据划分为多组子数据，每组子数据在一个传输时钟下传输。
一种数据传输装置，其特征在于，包括：存储单元、目标模块、传输网络以及控制模块；

所述存储单元中设置有N个源地址；

所述目标模块中设置多个目标地址；

所述传输网络分别与所述存储单元以及所述目标模块连接；

所述传输网络包括第一传输子网络，所述第一传输子网络包括多个层，每个层包括至少一个交换节点，层Y的第2^(Y–1)+1个位置至第2^Y个位置上不存在交换节点，并且，当层Y中的第1个位置至第2^Y个位置上存在至少一个交换节点时，所述至少一个交换节点中的每个交换节点均不包括上行连接线路；

所述控制模块用于从所述存储单元中获取至少一个待传输数据，所述待传输数据被分散存储于所述N个源地址中，以及，基于源地址和目标地址之间的第一预设关系，使用所述第一传输子网络，将存储于第1个源地址至第N/2个源地址中的待传输数据传输至对应的目标地址，其中，所述第一预设关系包括：当源地址为K时，对应的目标地址为从0开始的0至K中的一个。
根据权利要求8所述的装置，其特征在于，所述传输网络还包括第二传输子网络；

所述第二传输子网络包括多个层，每个层包括至少一个交换节点，层S的第2^(S–1)+1个位置至第2^S个位置上不存在交换节点，并且，当层S中的第1个位置至第2^S个位置上存在至少一个交换节点时，所述至少一个交换节点中的每个交换节点均不包括上行连接线路；

所述控制模块还用于基于源地址和目标地址之间的第二预设关系，使用第二传输子网络，将存储于第N/2+1个源地址至第N个源地址中的待传输数据传输至对应的目标地址，其中，所述第二预设关系包括：当源地址为L时，对应的目标地址为从M-1开始的M-1至M-1-[L％(N/2)]中的一个，M为目标地址的数量，M小于N。
根据权利要求9所述的装置，其特征在于，所述第一传输子网络的层数为log ₂(N)+1，和/或，所述第二传输子网络的层数为log ₂(N)+1。
根据权利要求8-10任一项所述的装置，其特征在于，所述控制模块具体用于：

获取所述存储于第1个源地址至第N/2个源地址中的待传输数据传输对应的目标地址，所述目标地址使用二进制数值表示；以及，

从所述目标地址的最低有效位LSB开始，根据所述目标地址中各比特位上的数值确定所述待传输数据在所述第一传输子网络中的传输路径，通过所述第一传输子网络中的传输路径将所述待传输数据传输至所述目标地址。
根据权利要求9或10所述的装置，其特征在于，所述控制模块具体用于：

获取所述存储于第N/2+1个源地址至第N个源地址中的待传输数据对应的目标地址，所述目标地址使用二进制数值表示；以及，

从所述目标地址的LSB开始，根据所述目标地址中各比特位上的数值确定所述待传输数据在所述第二传输子网络中的传输路径，通过所述第二传输子网络中的传输路径将所述待传输数据传输至所述目标地址。
根据权利要求8-12任一项所述的装置，其特征在于，所述目标模块为计算模块，所述计算模块中至少包括M个地址。
根据权利要求13所述的装置，其特征在于，所述控制模块还用于：

在所述待传输数的数量大于M时，将所述至少一个待传输数据划分为多组子数据，每组子数据在一个传输时钟下传输。
一种电子设备，其特征在于，包括：存储器和处理器；

所述处理器用于与所述存储器耦合，读取并执行所述存储器中的指令，以实现权利要求1-7任一项所述的方法步骤。
一种计算机程序产品，其特征在于，所述计算机程序产品包括计算机程序代码，当所述计算机程序代码被计算机执行时，使得所述计算机执行权利要求1-7任一项所述的方法。
一种计算机可读存储介质，其特征在于，所述计算机存储介质存储有计算机指令，当所述计算机指令被计算机执行时，使得所述计算机执行权利要求1-7任一项所述的方法的指令。