CN109871510A

CN109871510A - 二维卷积运算处理方法、***、设备及计算机存储介质

Info

Publication number: CN109871510A
Application number: CN201910016318.1A
Authority: CN
Inventors: 董刚; 赵雅倩; 方兴; 杨宏斌
Original assignee: Guangdong Inspur Big Data Research Co Ltd
Current assignee: Guangdong Inspur Smart Computing Technology Co Ltd
Priority date: 2019-01-08
Filing date: 2019-01-08
Publication date: 2019-06-11
Anticipated expiration: 2039-01-08
Also published as: WO2020143235A1; CN109871510B

Abstract

本申请公开了一种二维卷积运算处理方法、***、设备及计算机介质，在预设存储器中读取待计算数据和卷积核运算参数；调用第一矩阵转换处理器将待计算数据转换为矩阵形式的目标待计算数据，同时调用第二矩阵转换处理器将卷积核运算参数转换为矩阵形式的目标卷积核运算参数；在预设的卷积层组中确定出目标卷积层，将目标待计算数据和目标卷积核运算参数传输至目标卷积层，以使目标卷积层对目标待计算数据和目标卷积核运算参数进行二维卷积运算，卷积层组中相同卷积层的数量大于等于2。本申请提供的一种二维卷积运算处理方法，可以提高二维卷积运算的效率。本申请提供的一种二维卷积运算处理***、设备及计算机可读存储介质也解决了相应技术问题。

Description

二维卷积运算处理方法、***、设备及计算机存储介质

技术领域

本申请涉及深度学习技术领域，更具体地说，涉及二维卷积运算处理方法、***、设备及计算机存储介质。

背景技术

在深度学习技术中，主要以CNN(Convolutional Neural Networks，卷积神经网络)为研究对象，但是由于处理场景的不同，对CNN的性能要求也不相同，这就需要根据处理场景实时调整CNN，而CNN中的结构主要是卷积层，那么卷积层进行二维卷积计算的效率便会影响CNN的性能高低。

综上所述，如何提高二维卷积计算的效率是目前本领域技术人员亟待解决的问题。

发明内容

本申请的目的是提供一种二维卷积运算处理方法、***、设备及计算机存储介质，其能在一定程度上解决如何提高二维卷积计算的效率的技术问题。本申请还提供了一种二维卷积运算处理***、设备及计算机可读存储介质。

为了实现上述目的，本申请提供如下技术方案：

一种二维卷积运算处理方法，包括：

在预设存储器中读取待计算数据和卷积核运算参数；

调用第一矩阵转换处理器将所述待计算数据转换为矩阵形式的目标待计算数据，同时调用第二矩阵转换处理器将所述卷积核运算参数转换为矩阵形式的目标卷积核运算参数；

在预设的卷积层组中确定出目标卷积层，将所述目标待计算数据和所述目标卷积核运算参数传输至所述目标卷积层，以使所述目标卷积层对所述目标待计算数据和所述目标卷积核运算参数进行二维卷积运算，所述卷积层组中相同卷积层的数量大于等于2。

优选的，所述在预设存储器中读取待计算数据和卷积核运算参数之前，还包括：

获取设定的所述卷积层组对应的数据格式配置参数，以基于所述数据格式配置参数调整与所述卷积层组对应的数据的格式；

其中，所述数据格式配置参数中的数据类型包括数据输入数据格式、输出数据格式、计算数据格式；所述数据格式配置参数中的格式类型包括INT8、INT16、INT32、fp32、fp16。

获取设定的卷积核配置参数；

基于所述卷积核配置参数调整所述卷积层组中卷积核的参数；

其中，所述卷积核配置参数的参数类型包括卷积核尺寸、卷积核滑动步长、卷积核空洞尺寸。

优选的，所述第一矩阵转换处理器将所述待计算数据转换为矩阵形式的目标待计算数据，包括：

将所述待计算数据切分为待计算数据块；

对于每一个所述待计算数据块，将所述待计算数据块转换为第一矩阵数据块；

对于每一个所述第一矩阵数据块，按照第二矩阵数据块的格式，对所述第一矩阵数据块进行遍历，得到所述第二矩阵数据块；

对所有的所述第二矩阵数据块进行转换，得到所述目标待计算数据。

优选的，所述第二矩阵转换处理器将所述卷积核运算参数转换为矩阵形式的目标卷积核运算参数，包括：

将所述卷积核运算参数切分为卷积核运算参数块；

对于每一个所述卷积核运算参数块，将所述卷积核运算参数块转换为第一矩阵参数块；

对于每一个所述第一矩阵参数块，按照第二矩阵参数块的格式，对所述第一矩阵参数块进行遍历，得到所述第二矩阵参数块；

对所有的所述第二矩阵参数块进行转换，得到所述目标卷积核运算参数。

优选的，所述将所述目标待计算数据和所述目标卷积核运算参数传输至所述目标卷积层之后，还包括：

判断所述预读存储器是否为空，若否，则返回执行所述在预设存储器中读取待计算数据和卷积核运算参数的步骤。

优选的，所述在预设存储器中读取待计算数据和卷积核运算参数，包括：

在预设的DDR SDRAM中读取所述待计算数据和所述卷积核运算参数。

一种二维卷积运算处理***，包括：

第一读取模块，用于在预设存储器中读取待计算数据和卷积核运算参数；

第一调用模块，用于调用第一矩阵转换处理器将所述待计算数据转换为矩阵形式的目标待计算数据，同时调用第二矩阵转换处理器将所述卷积核运算参数转换为矩阵形式的目标卷积核运算参数；

第一传输模块，用于在预设的卷积层组中确定出目标卷积层，将所述目标待计算数据和所述目标卷积核运算参数传输至所述目标卷积层，以使所述目标卷积层对所述目标待计算数据和所述目标卷积核运算参数进行二维卷积运算，所述卷积层组中相同卷积层的数量大于等于2。

一种二维卷积运算处理设备，包括：

存储器，用于存储计算机程序；

处理器，用于执行所述计算机程序时实现如上任一所述二维卷积运算处理方法的步骤。

一种计算机可读存储介质，所述计算机可读存储介质中存储有计算机程序，所述计算机程序被处理器执行时实现如上任一所述二维卷积运算处理方法的步骤。

本申请提供的一种二维卷积运算处理方法，包括在预设存储器中读取待计算数据和卷积核运算参数；调用第一矩阵转换处理器将待计算数据转换为矩阵形式的目标待计算数据，同时调用第二矩阵转换处理器将卷积核运算参数转换为矩阵形式的目标卷积核运算参数；在预设的卷积层组中确定出目标卷积层，将目标待计算数据和目标卷积核运算参数传输至目标卷积层，以使目标卷积层对目标待计算数据和目标卷积核运算参数进行二维卷积运算，卷积层组中相同卷积层的数量大于等于2。本申请提供的一种二维卷积运算处理方法，在预设存储器中读取待计算数据和卷积核运算参数，在调用第一矩阵转换器的同时调用第二矩阵转换器，可以提高对待计算数据和卷积核运算参数的矩阵转换效率，之后在预设卷积层组中确定出目标卷积层，并借助目标卷积层对目标待计算数据和目标卷积核运算参数进行二维卷积运算，由于卷积层组中相同卷积层的数量大于等于2，所以可以借助卷积层组并行对待计算数据和卷积核运算参数进行二维卷积运算，可以提高二维卷积运算的效率。本申请提供的一种二维卷积运算处理***、设备及计算机可读存储介质也解决了相应技术问题。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据提供的附图获得其他的附图。

图1为本申请实施例提供的一种二维卷积运算处理方法的第一流程图；

图2为第一矩阵转换处理器的数据转换示意图；

图3为卷积层组进行二维卷积运算的示意图；

图4为本申请实施例提供的一种二维卷积运算处理方法的第二流程图；

图5为本申请实施例提供的一种二维卷积运算处理***的结构示意图；

图6为实际应用中本申请实施例提供的二维卷积运算处理***的结构示意图；

图7为实际应用中待计算数据和卷积核运算参数的读取过程示意图

图8为本申请实施例提供的一种二维卷积运算处理设备的结构示意图；

图9为本申请实施例提供的一种二维卷积运算处理设备的另一结构示意图。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

在深度学习技术中，主要以CNN(Convolutional Neural Networks，卷积神经网络)为研究对象，但是由于处理场景的不同，对CNN的性能要求也不相同，这就需要根据处理场景实时调整CNN，而CNN中的结构主要是卷积层，那么卷积层进行二维卷积计算的效率便会影响CNN的性能高低。本申请提供的一种二维卷积运算处理方法可以提高二维卷积计算的效率。

本申请实施例提供的一种二维卷积运算处理方法的执行主体可以为本申请实施例提供的二维卷积运算处理***，该***可以内置于服务器、处理器等中，所以本申请实施例提供的一种二维卷积运算处理方法的执行主体还可以为内置了二维卷积运算***的服务器、处理器等。具体的，本申请提供的二维卷积运算处理方法可以采用RTL(RegisterTransfer Level，寄存器转换级电路)进行描述，并可在FPGA(Field-Programmable GateArray，现场可编程门阵列)上运行，或者制作成专用芯片实现。

请参阅图1，图1为本申请实施例提供的一种二维卷积运算处理方法的第一流程图。

本申请实施例提供的一种二维卷积运算处理方法，可以包括以下步骤：

步骤S101：在预设存储器中读取待计算数据和卷积核运算参数。

实际应用中，可以在预设存储器中读取待计算数据和卷积核运算参数，待计算数据和卷积核运算参数的类型可以根据实际需要确定，不难理解，外界在需要进行二维卷积运算时，可以将待计算数据和卷积核运算参数存储在预设存储器中，待计算数据多为外界借助二维卷积运算所要计算的数据，比如一幅图像的像素点数据等，卷积核运算参数指的是二维卷积运算过程中卷积核运算时的参数。具体的，可以同时在预设存储器中读取待计算数据和卷积核运算参数，以便提高二维卷积运算的效率。此外，读取的待计算数据和卷积核运算参数的组数和每组中数据的数量可以根据实际需要确定，比如在二维卷积运算为1×1时，每组可以读取64byte的待计算数据，读取1byte的卷积核运算参数；在二维卷积运算为3×3时，每组可以读取25byte的待计算数据，读取9byte的卷积核运算参数。

下面对卷积相关的概念进行简介：图像中不同数据窗口的数据(feature)和卷积核(filter)作内积的操作叫做卷积，其计算过程又称为滤波，本质是提取图像不同频段的特征。卷积核也称为滤波器，是包含一组固定权重的神经元，通常是n×m的二维矩阵，n和m也被称为神经元的感受野。n×m矩阵中存的是对感受野中数据处理的系数。一个卷积核的滤波可以用来提取特定的特征(例如可以提取物体轮廓、颜色深浅等)。通过卷积层从原始数据中提取出新的特征的过程又称为feature map(特征映射)。filter_size是指filter的大小，例如3×3；filter_num是指每种filter_size的filter个数，通常是通道个数。通道可以理解为视角、角度。例如同样是提取边界特征的卷积核，可以按照R、G、B三种元素的角度提取边界，RGB在边界这个角度上有不同的表达。多个滤波器叠加便成了卷积层。而卷积层的结构参数主要有以下几种：

步幅(Stride)：定义了卷积核遍历图像时的步幅大小。其默认值通常设置为1，也可将步幅设置为2后对图像进行下采样，这种方式与最大池化类似；

边界扩充(Padding)：定义了网络层处理样本边界的方式。当卷积核大于1且不进行边界扩充，输出尺寸将相应缩小；当卷积核以标准方式进行边界扩充，则输出数据的空间尺寸将与输入相等；

输入与输出通道(Channels)：构建卷积层时需定义输入通道I，并由此确定输出通道O。这样，可算出每个网络层的参数量为I×O×K，其中K为卷积核的参数个数。

假设某个网络层有64个大小为3×3的卷积核，则对应K值为3×3＝9。CNN网络中所进行的二维卷积计算过程如下所述：假设有一个3×3大小的卷积层，其输入通道为16、输出通道为32。具体为，32个3×3大小的卷积核会遍历16个通道中的每个数据，从而产生16×32＝512个特征图谱。进而通过叠加每个输出通道对应的16个特征图谱后融合得到1个特征图谱。不难发现，卷积网络的核心思想是将：局部感受野、权值共享以及时间或空间亚采样这三种结构思想结合起来获得了某种程度的位移、尺度、形变不变性。

步骤S102：调用第一矩阵转换处理器将待计算数据转换为矩阵形式的目标待计算数据，同时调用第二矩阵转换处理器将卷积核运算参数转换为矩阵形式的目标卷积核运算参数。

实际应用中，在读取待计算数据和卷积核运算参数后，由于从预设存储器中读取出的数据为顺序的数据，而二维卷积运算所应用的数据格式为矩阵，所以需要将待计算数据和卷积核运算参数转换为矩阵形式的目标待计算数据和目标卷积核运算参数，具体的，可以调用第一矩阵转换处理器将待计算数据转换为矩阵形式的目标待计算数据，同时调用第二矩阵转换处理器将卷积核运算参数转换为矩阵形式的目标卷积核运算参数，由于同时调用第一矩阵转换处理器和第二矩阵转换处理器，所以可以在一定程度上提高得到目标待计算数据和目标卷积核运算参数的效率，进而提高二维卷积运算的效率。第一矩阵转换处理器和第二矩阵转换处理器进行矩阵转换的方式可以根据实际需要确定。

步骤S103：在预设的卷积层组中确定出目标卷积层，将目标待计算数据和目标卷积核运算参数传输至目标卷积层，以使目标卷积层对目标待计算数据和目标卷积核运算参数进行二维卷积运算，卷积层组中相同卷积层的数量大于等于2。

实际应用中，在得到目标待计算数据和目标卷积核运算参数后，便可以在预设的卷积层组中确定出目标卷积层，具体的，可以将空闲的卷积层确定为目标卷积层；之后将目标待计算数据和目标卷积核运算参数传输至目标卷积层，目标卷积层便可以对目标待计算数据和目标卷积核运算参数进行二维卷积运算。由于卷积层组中包含多个卷积层，而目标卷积层是在卷积层组中确定出来的，且目标卷积层可对目标待计算数据和目标卷积核运算参数进行二维卷积运算，所以卷积层组中包含多个可以对目标待计算数据和目标卷积核运算参数进行二维卷积运算的卷积层，相应的，便可以采用并行方式调用卷积层组，以同时对多组待计算数据和卷积核运算参数进行二维卷积运算，提高二维卷积运算的效率。具体的，卷积层组可以设置在DSP(Digital Signal Processor，数字信号处理单元)阵列中

具体应用场景中，为了便于外界对二维卷积运算过程中数据格式的控制，在预设存储器中读取待计算数据和卷积核运算参数之前，还可以获取设定的卷积层组对应的数据格式配置参数，以基于数据格式配置参数调整与卷积层组对应的数据的格式；其中，数据格式配置参数中的数据类型包括数据输入数据格式、输出数据格式、计算数据格式；数据格式配置参数中的格式类型包括INT8、INT16、INT32、fp32、fp16。比如设定的数据格式配置参数为输入数据格式为INT8，输出数据格式为INT16，计算数据格式为fp16，则相应的会将待计算数据和卷积核运算参数的数据格式设置为INT8，将卷积层进行二维卷积运算后的运行结果的格式设置为INT16，并控制二维卷积运算过程中中间参数的格式为fp16。不难理解，计算数据格式指的是二维卷积运算过程中中间参数的数据格式。

具体应用场景中，针对不同类型的数据，可能需要使用不同的卷积层来进行运算，为了便于外界调试卷积层，在预设存储器中读取待计算数据和卷积核运算参数之前，还可以获取设定的卷积核配置参数；并基于卷积核配置参数调整卷积层组中卷积核的参数；其中，卷积核配置参数的参数类型包括卷积核尺寸、卷积核滑动步长、卷积核空洞尺寸。由于卷积层组中包含多个相同的卷积层，所以在对一类卷积层进行设置时，需对所有相同的卷积层进行设置。

具体应用场景中，第一矩阵转换处理器将待计算数据转换为矩阵形式的目标待计算数据的过程可以具体为：将待计算数据切分为待计算数据块；对于每一个待计算数据块，将待计算数据块转换为第一矩阵数据块；对于每一个第一矩阵数据块，按照第二矩阵数据块的格式，对第一矩阵数据块进行遍历，得到第二矩阵数据块；对所有的第二矩阵数据块进行转换，得到目标待计算数据。

请参阅图2，图2为第一矩阵转换处理器的数据转换示意图。假设将1024位的待计算数据转换为1×1形式的矩阵，则可以先将待计算数据切分为16个大小均为64的待计算数据块，并将每一个待计算数据块转换为8×8形式的第一矩阵数据块，之后，在每一个第一矩阵数据块中，按照5×5的矩阵形式对第一矩阵数据块进行遍历，得到所有的5×5形式的第二矩阵数据块，最后，将所有5×5形式的第二矩阵数据块转换为1×1形式的目标待计算数据块。具体的遍历形式和转换算法可以根据实际需要确定。

具体应用场景中，第二矩阵转换处理器将卷积核运算参数转换为矩阵形式的目标卷积核运算参数的过程可以具体为：将卷积核运算参数切分为卷积核运算参数块；对于每一个卷积核运算参数块，将卷积核运算参数块转换为第一矩阵参数块；对于每一个第一矩阵参数块，按照第二矩阵参数块的格式，对第一矩阵参数块进行遍历，得到第二矩阵参数块；对所有的第二矩阵参数块进行转换，得到目标卷积核运算参数。

具体应用场景中，在一次处理过程中可能需要进行多次二维卷积运算，为了保证处理过程的完整性，在将目标待计算数据和目标卷积核运算参数传输至目标卷积层之后，还可以判断预读存储器是否为空，若否，则返回执行在预设存储器中读取待计算数据和卷积核运算参数的步骤。在此过程中，待计算数据可以按照固定节拍在卷积层组中传输，与卷积核运算参数进行乘加的累加运算，当一组待计算数据经过一个卷积层后，卷积核运算参数便立即更换成下一组待计算数据对应的数值，由此可以使得卷积层组连续不断的对待计算数据和卷积核运算参数进行二维卷积运算。请参阅图3，图3为卷积层组进行二维卷积运算的示意图。

具体应用场景中，为了保证在预设存储器中读取待计算数据和卷积核运算参数的读取效率，可以采用高性能的存储器存储待计算数据和卷积核运算参数，则在预设存储器中读取待计算数据和卷积核运算参数的过程可以具体为：在预设的DDR(Double DataRate，双倍速率)SDRAM(Synchronous Dynamic Random Access Memory，同步动态随机存取存储器)中读取待计算数据和卷积核运算参数。

本申请提供的一种二维卷积运算处理方法，包括在预设存储器中读取待计算数据和卷积核运算参数；调用第一矩阵转换处理器将待计算数据转换为矩阵形式的目标待计算数据，同时调用第二矩阵转换处理器将卷积核运算参数转换为矩阵形式的目标卷积核运算参数；在预设的卷积层组中确定出目标卷积层，将目标待计算数据和目标卷积核运算参数传输至目标卷积层，以使目标卷积层对目标待计算数据和目标卷积核运算参数进行二维卷积运算，卷积层组中相同卷积层的数量大于等于2。本申请提供的一种二维卷积运算处理方法，在预设存储器中读取待计算数据和卷积核运算参数，在调用第一矩阵转换器的同时调用第二矩阵转换器，可以提高对待计算数据和卷积核运算参数的矩阵转换效率，之后在预设卷积层组中确定出目标卷积层，并借助目标卷积层对目标待计算数据和目标卷积核运算参数进行二维卷积运算，由于卷积层组中相同卷积层的数量大于等于2，所以可以借助卷积层组并行对待计算数据和卷积核运算参数进行二维卷积运算，可以提高二维卷积运算的效率。

请参阅图4，图4为本申请实施例提供的一种二维卷积运算处理方法的第二流程图。

实际应用中，本申请实施例提供的一种二维卷积运算处理方法可以包括以下步骤：

步骤S201：获取设定的卷积层组对应的数据格式配置参数，以基于数据格式配置参数调整与卷积层组对应的数据的格式。

步骤S202：获取设定的卷积核配置参数。

步骤S203：基于卷积核配置参数调整卷积层组中卷积核的参数。

步骤S204：在预设的DDR SDRAM中读取待计算数据和卷积核运算参数。

步骤S205：调用第一矩阵转换处理器将待计算数据转换为矩阵形式的目标待计算数据，同时调用第二矩阵转换处理器将卷积核运算参数转换为矩阵形式的目标卷积核运算参数。

步骤S206：在预设的卷积层组中确定出目标卷积层，将目标待计算数据和目标卷积核运算参数传输至目标卷积层，以使目标卷积层对目标待计算数据和目标卷积核运算参数进行二维卷积运算，卷积层组中相同卷积层的数量大于等于2。

比如在需要在一幅包含桌子和杯子的目标图像中提取出桌子的图像时，外界可以将目标图像的像素点作为待计算数据，并确定提取算法所对应的卷积核配置参数及卷积核运算参数，并将待计算数据和卷积核运算参数存储至DDR SDRAM中，之后便可以采用本申请提供的二维卷积运算处理方法进行二维卷积运算，其过程如下：获取设定的卷积层组对应的数据格式配置参数，以基于数据格式配置参数调整与卷积层组对应的数据的格式；获取设定的卷积核配置参数，基于卷积核配置参数调整卷积层组中卷积核的参数；在预设的DDRSDRAM中读取待计算数据，也即目标图像的像素点，和卷积核运算参数；调用第一矩阵转换处理器将待计算数据转换为矩阵形式的目标待计算数据，同时调用第二矩阵转换处理器将卷积核运算参数转换为矩阵形式的目标卷积核运算参数；在预设的卷积层组中确定出目标卷积层，将目标待计算数据和目标卷积核运算参数传输至目标卷积层，以使目标卷积层对目标待计算数据和目标卷积核运算参数进行二维卷积运算，卷积层组中相同卷积层的数量大于等于2；获取目标卷积层的运算结果，并将其发送至图像处理器；图像处理器根据运算结果还原桌子的图像。

本申请还提供了一种二维卷积运算处理***，其具有本申请实施例提供的一种二维卷积运算处理方法具有的对应效果。请参阅图5，图5为本申请实施例提供的一种二维卷积运算处理***的结构示意图。

本申请实施例提供的一种二维卷积运算处理***，可以包括：

第一读取模块101，用于在预设存储器中读取待计算数据和卷积核运算参数；

第一调用模块102，用于调用第一矩阵转换处理器将待计算数据转换为矩阵形式的目标待计算数据，同时调用第二矩阵转换处理器将卷积核运算参数转换为矩阵形式的目标卷积核运算参数；

第一传输模块103，用于在预设的卷积层组中确定出目标卷积层，将目标待计算数据和目标卷积核运算参数传输至目标卷积层，以使目标卷积层对目标待计算数据和目标卷积核运算参数进行二维卷积运算，卷积层组中相同卷积层的数量大于等于2。

本申请实施例提供的一种二维卷积运算处理***，还可以包括：

第一获取模块，用于第一读取模块在预设存储器中读取待计算数据和卷积核运算参数之前，获取设定的卷积层组对应的数据格式配置参数，以基于数据格式配置参数调整与卷积层组对应的数据的格式；

其中，数据格式配置参数中的数据类型包括数据输入数据格式、输出数据格式、计算数据格式；数据格式配置参数中的格式类型包括INT8、INT16、INT32、fp32、fp16。

第二获取模块，用于第一读取模块在预设存储器中读取待计算数据和卷积核运算参数之前，获取设定的卷积核配置参数；

第一调整模块，用于基于卷积核配置参数调整卷积层组中卷积核的参数；

其中，卷积核配置参数的参数类型包括卷积核尺寸、卷积核滑动步长、卷积核空洞尺寸。

本申请实施例提供的一种二维卷积运算处理***，第一矩阵转换处理器可以包括：

第一切分模块，用于将待计算数据切分为待计算数据块；

第一转换模块，用于对于每一个待计算数据块，将待计算数据块转换为第一矩阵数据块；

第一遍历模块，用于对于每一个第一矩阵数据块，按照第二矩阵数据块的格式，对第一矩阵数据块进行遍历，得到第二矩阵数据块；

第二转化模块，用于对所有的第二矩阵数据块进行转换，得到目标待计算数据。

本申请实施例提供的一种二维卷积运算处理***，第二矩阵转换处理器可以包括：

第二切分模块，用于将卷积核运算参数切分为卷积核运算参数块；

第三转换模块，用于对于每一个卷积核运算参数块，将卷积核运算参数块转换为第一矩阵参数块；

第二遍历模块，用于对于每一个第一矩阵参数块，按照第二矩阵参数块的格式，对第一矩阵参数块进行遍历，得到第二矩阵参数块；

第四转换模块，用于对所有的第二矩阵参数块进行转换，得到目标卷积核运算参数。

第一判断模块，用于第一传输模块将目标待计算数据和目标卷积核运算参数传输至目标卷积层之后，判断预读存储器是否为空，若否，则返回执行在预设存储器中读取待计算数据和卷积核运算参数的步骤。

本申请实施例提供的一种二维卷积运算处理***，第一读取模块可以包括：

第一读取单元，用于在预设的DDR SDRAM中读取待计算数据和卷积核运算参数。

请参阅图6，图6为实际应用中本申请实施例提供的二维卷积运算处理***的结构示意图。

实际应用中，本申请实施例提供的一种二维卷积运算处理***可以包括DDRSDRAM301、待计算数据缓存模块302，卷积核运算参数缓存模块303、第一矩阵转换处理器304、第二矩阵转换处理器305、DSP阵列306。各个组件的描述可参阅上述实施例。现结合图7对实际应用中待计算数据和卷积核运算参数的读取过程进行描述，图7为实际应用中待计算数据和卷积核运算参数的读取过程示意图。其中，卷积层的输入通道为9，输出通道为32。

在读取待计算数据时，根据配置数值计算feature的输入数据量，输入数据量为i_inputfeaturewidth*i_inputfeatureheight*i_inputchannel；根据i_inputfeatureaddress配置的数值向主存接口发出读请求，将读到的数据缓存；取64x11x11＝7744bytes feature数据进行二级缓存；根据卷积模式取出feature数据，共计取出4*64组数据；在取出9组数据后更换后续32个输出通道的参数；

在读取卷积核运算参数时，根据配置数值计算filter参数个数：i_inputchannel*i_outputchannel*9：i_inputchannel*i_outputchannel；根据i_convfilteraddress配置的数值向主存接口发出读请求，将读到的数据缓存；取出filter的参数数量：64x3x3bytes；根据卷积模式取出16*2组filter数据；

之后读取下一组filter，并遍历全部的输出通道i_outputchannel，遍历全部的输入通道i_inputchannel，之后准备读取下一组数据。

本申请还提供了一种二维卷积运算处理设备及计算机可读存储介质，其均具有本申请实施例提供的一种二维卷积运算处理方法具有的对应效果。请参阅图8，图8为本申请实施例提供的一种二维卷积运算处理设备的结构示意图。

本申请实施例提供的一种二维卷积运算处理设备，包括存储器201和处理器202，存储器201中存储有计算机程序，处理器202执行存储器201中存储的计算机程序时实现如下步骤：

在预设存储器中读取待计算数据和卷积核运算参数；

调用第一矩阵转换处理器将待计算数据转换为矩阵形式的目标待计算数据，同时调用第二矩阵转换处理器将卷积核运算参数转换为矩阵形式的目标卷积核运算参数；

在预设的卷积层组中确定出目标卷积层，将目标待计算数据和目标卷积核运算参数传输至目标卷积层，以使目标卷积层对目标待计算数据和目标卷积核运算参数进行二维卷积运算，卷积层组中相同卷积层的数量大于等于2。

本申请实施例提供的一种二维卷积运算处理设备，包括存储器201和处理器202，，包括存储器201和处理器202，存储器201中存储有计算机子程序，处理器202执行存储器201中存储的计算机子程序时具体实现如下步骤：在预设存储器中读取待计算数据和卷积核运算参数之前，获取设定的卷积层组对应的数据格式配置参数，以基于数据格式配置参数调整与卷积层组对应的数据的格式；其中，数据格式配置参数中的数据类型包括数据输入数据格式、输出数据格式、计算数据格式；数据格式配置参数中的格式类型包括INT8、INT16、INT32、fp32、fp16。

本申请实施例提供的一种二维卷积运算处理设备，包括存储器201和处理器202，，包括存储器201和处理器202，存储器201中存储有计算机子程序，处理器202执行存储器201中存储的计算机子程序时具体实现如下步骤：在预设存储器中读取待计算数据和卷积核运算参数之前，获取设定的卷积核配置参数；基于卷积核配置参数调整卷积层组中卷积核的参数；其中，卷积核配置参数的参数类型包括卷积核尺寸、卷积核滑动步长、卷积核空洞尺寸。

本申请实施例提供的一种二维卷积运算处理设备，包括存储器201和处理器202，，包括存储器201和处理器202，存储器201中存储有计算机子程序，处理器202执行存储器201中存储的计算机子程序时具体实现如下步骤：调用第一矩阵转换处理器时，将待计算数据切分为待计算数据块；对于每一个待计算数据块，将待计算数据块转换为第一矩阵数据块；对于每一个第一矩阵数据块，按照第二矩阵数据块的格式，对第一矩阵数据块进行遍历，得到第二矩阵数据块；对所有的第二矩阵数据块进行转换，得到目标待计算数据。

本申请实施例提供的一种二维卷积运算处理设备，包括存储器201和处理器202，，包括存储器201和处理器202，存储器201中存储有计算机子程序，处理器202执行存储器201中存储的计算机子程序时具体实现如下步骤：调用第二矩阵转换处理器时，将卷积核运算参数切分为卷积核运算参数块；对于每一个卷积核运算参数块，将卷积核运算参数块转换为第一矩阵参数块；对于每一个第一矩阵参数块，按照第二矩阵参数块的格式，对第一矩阵参数块进行遍历，得到第二矩阵参数块；对所有的第二矩阵参数块进行转换，得到目标卷积核运算参数。

本申请实施例提供的一种二维卷积运算处理设备，包括存储器201和处理器202，，包括存储器201和处理器202，存储器201中存储有计算机子程序，处理器202执行存储器201中存储的计算机子程序时具体实现如下步骤：将目标待计算数据和目标卷积核运算参数传输至目标卷积层之后，判断预读存储器是否为空，若否，则返回执行在预设存储器中读取待计算数据和卷积核运算参数的步骤。

本申请实施例提供的一种二维卷积运算处理设备，包括存储器201和处理器202，，包括存储器201和处理器202，存储器201中存储有计算机子程序，处理器202执行存储器201中存储的计算机子程序时具体实现如下步骤：在预设的DDR SDRAM中读取待计算数据和卷积核运算参数。

请参阅图9，本申请实施例提供的另一种二维卷积运算处理设备中还可以包括：与处理器202连接的输入端口203，用于传输外界输入的命令至处理器202；与处理器202连接的显示单元204，用于显示处理器202的处理结果至外界；与处理器202连接的通信模块205，用于实现二维卷积运算处理设备与外界的通信。显示单元204可以为显示面板、激光扫描使显示器等；通信模块205所采用的通信方式包括但不局限于移动高清链接技术(HML)、通用串行总线(USB)、高清多媒体接口(HDMI)、无线连接：无线保真技术(WiFi)、蓝牙通信技术、低功耗蓝牙通信技术、基于IEEE802.11s的通信技术。

本申请实施例提供的一种计算机可读存储介质，计算机可读存储介质中存储有计算机程序，计算机程序被处理器执行时实现如上任一实施例所描述的二维卷积运算处理方法的步骤。

本申请所涉及的计算机可读存储介质包括随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质。

本申请实施例提供的一种二维卷积运算处理***、设备及计算机可读存储介质中相关部分的说明请参见本申请实施例提供的一种二维卷积运算处理方法中对应部分的详细说明，在此不再赘述。另外，本申请实施例提供的上述技术方案中与现有技术中对应技术方案实现原理一致的部分并未详细说明，以免过多赘述。

还需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

对所公开的实施例的上述说明，使本领域技术人员能够实现或使用本申请。对这些实施例的多种修改对本领域技术人员来说将是显而易见的，本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下，在其它实施例中实现。因此，本申请将不会被限制于本文所示的这些实施例，而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims

1.一种二维卷积运算处理方法，其特征在于，包括：

在预设存储器中读取待计算数据和卷积核运算参数；

2.根据权利要求1所述的方法，其特征在于，所述在预设存储器中读取待计算数据和卷积核运算参数之前，还包括：

3.根据权利要求1所述的方法，其特征在于，所述在预设存储器中读取待计算数据和卷积核运算参数之前，还包括：

获取设定的卷积核配置参数；

4.根据权利要求1所述的方法，其特征在于，所述第一矩阵转换处理器将所述待计算数据转换为矩阵形式的目标待计算数据，包括：

将所述待计算数据切分为待计算数据块；

5.根据权利要求1所述的方法，其特征在于，所述第二矩阵转换处理器将所述卷积核运算参数转换为矩阵形式的目标卷积核运算参数，包括：

将所述卷积核运算参数切分为卷积核运算参数块；

6.根据权利要求1所述的方法，其特征在于，所述将所述目标待计算数据和所述目标卷积核运算参数传输至所述目标卷积层之后，还包括：

7.根据权利要求1至6任一项所述的方法，其特征在于，所述在预设存储器中读取待计算数据和卷积核运算参数，包括：

8.一种二维卷积运算处理***，其特征在于，包括：

9.一种二维卷积运算处理设备，其特征在于，包括：

存储器，用于存储计算机程序；

处理器，用于执行所述计算机程序时实现如权利要求1至7任一项所述二维卷积运算处理方法的步骤。

10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质中存储有计算机程序，所述计算机程序被处理器执行时实现如权利要求1至7任一项所述二维卷积运算处理方法的步骤。