CN113946538A

CN113946538A - 一种基于行缓存机制的卷积层融合存储装置及方法

Info

Publication number: CN113946538A
Application number: CN202111112572.5A
Authority: CN
Inventors: 潘红兵; 马舜尧; 王宇宣; 彭成磊
Original assignee: Nanjing University
Current assignee: Nanjing University
Priority date: 2021-09-23
Filing date: 2021-09-23
Publication date: 2022-01-18
Anticipated expiration: 2041-09-23
Also published as: CN113946538B

Abstract

本发明提供了一种基于行缓存机制的卷积层融合存储装置及方法。该装置包括DDR存储器，用于存储原始输入图像数据和最终输出的特征图；片上RAM，用于基于行缓存机制存储卷积层首层的输入图像数据和层间计算结果；DDR控制器，用于控制片上RAM与DDR存储器的数据交互过程；计算模块，包括数据分发模块、卷积运算阵列和结果收集模块，用于按照层融合的分块策略，对图像分块数据进行卷积计算，并将结果存入片上RAM中。本发明可以减少层融合存储过程中分块的重叠搬运，复用数据，提升片上RAM存储资源的利用效率。

Description

一种基于行缓存机制的卷积层融合存储装置及方法

技术领域

本发明属于数字图像分类领域，尤其涉及一种基于行缓存机制的卷积层融合存储装置及方法。

背景技术

卷积神经网络是一种前馈神经网络，它的人工神经元可以响应一部分覆盖范围内的周围单元，对大型图像处理有出色表现。

卷积神经网络中包含了大量的卷积运算，并且卷积层的层数随着分类效果的不断提升而逐渐加深，卷积核的数目与通道数也逐步增多，这些因素都大大增加了卷积层中的卷积运算量，因此卷积运算需要占用大量的存储资源。

从片外的存储器DDR进行数据存取的速度严重滞后于卷积神经网络的运算速度，成为了限制其运算速度的主要原因。相对于处理器的时钟频率和性能，存储器的访问延迟不断增大。在缓解处理器和存储器的发展不平衡的问题时，如何有效地利用有限的片上存储资源发挥着重要的作用。

发明内容

针对上述现有技术存在的问题，本发明旨在提供一种基于行缓存机制的卷积层融合存储装置及方法，能够提升计算能效，充分利用片上有限的存储资源。

本发明采取的技术方案为：

一种基于行缓存机制的卷积层融合存储装置，包括：

DDR存储器，用于存储原始输入图像数据和最终输出的特征图；

片上RAM，用于基于行缓存机制存储卷积层首层的输入图像数据和层间计算结果；

DDR控制器，用于控制片上RAM与DDR存储器的数据交互过程；

计算模块，包括数据分发模块、卷积运算阵列和结果收集模块，用于按照层融合的分块策略，对图像分块数据进行卷积计算，并将结果存入片上RAM中。

进一步地，所述DDR控制器包括读控制器和写控制器，分别用于在读写图像分块数据的过程中，控制片上RAM的读写地址。

进一步地，在卷积层的每一层都配置一块片上RAM，第一层的片上RAM用于存储输入图像数据，其余每个卷积层的片上RAM用于存储层间计算结果。

进一步地，所述数据分发模块，用于按照层融合的分块策略，从片上RAM中读出对应的数据传输给卷积运算阵列进行计算；所述卷积运算阵列，用于对数据分块模块传输的数据进行多层网络的卷积运算；所述结果收集模块，用于接收卷积运算阵列的卷积结果，将结果进行拼接，得到下一层的输入并写入对应的片上RAM内。

本发明利用上述一种基于行缓存机制的卷积层融合存储装置的方法，包括如下步骤：

(1)数据分发模块从DDR存储器的相应地址搬运卷积层首层第一个图像分块的数据至片上RAM；并从片上RAM中取出上述数据给卷积运算阵列进行计算；

(2)结果收集模块收集首层第一个分块的计算结果，由DDR控制器将结果写入片上RAM；

(3)首层其余图像分块的计算重复步骤(1)-步骤(2)，直到卷积层首层所有分块计算完成，卷积层首层计算的特征图写入片上RAM；

(4)从片上RAM读取卷积层首层得到的特征图进行卷积层第二层的计算，重复步骤(1)-步骤(3)，直到得到最终输出的特征图，并将最终输出的特征图写入DDR存储器。

进一步地，步骤(1)和(2)中，由于图像分块之间有部分重叠，每次从DDR存储器往片上RAM搬运图像分块数据时，为了复用重叠部分的数据，要对片上RAM的读写地址进行控制。

进一步地，对片上RAM的读写地址进行控制的具体步骤如下：

1)当写一个分块的数据到片上RAM时，记录其最后写入的地址last_addr；

2)在写下一个分块到片上RAM时，从last_addr+1开始写，写到片上RAM最底部时返回第零行继续；

3)对于有数据复用的分块，则从last_addr-复用行数的地址进行读取

本发明的特点在于能够将大图像用层融合存储策略分块进行计算，并用行缓存机制减少重叠图像分块的重复搬运，与现有技术相比，本发明的优点是：

1、本发明利用层融合存储策略，即将连续的几层卷积操作的层间结果不存储到片外，而是缓存在片上RAM中，下一层计算直接从RAM中取得输入数据。这种方法可以在存储资源有限的情况下对大图像进行存储计算，减少硬件加速器对片外访存的需求，从而降低功耗，提高了运算效率。

2、本发明利用行缓存机制，可以多次读取分块图像的重叠部分，不需要多次搬运，充分利用片上有限的存储资源，进一步提高了存储资源的利用率。

附图说明

图1是本发明装置的结构框图；

图2是本发明实例中图像分块示意图；

图3是本发明实例中分块存储方式示意图；

图4是本发明实例中层融合存储方法的具体实现方式示意图。

具体实施方式

下面结合附图对本发明进行详细说明

如图1所示，本实施例的卷积层融合存储装置包括DDR存储器、片上RAM、DDR控制器、读写控制器和计算模块。DDR存储器作为片外存储资源，用于存储存储原始输入图像数据和最终输出的特征图；片上RAM，用于存储卷积层首层的输入数据和层间计算结果；DDR控制器控制DDR存储器和片上RAM的数据交互过程；读写控制器，用于在读写图像分块数据的过程中，控制片上RAM的读写地址；计算模块，包括数据分发模块、卷积运算阵列和结果收集模块，用于按照层融合的分块策略，从片上RAM中读出对应的数据传输给卷积运算阵列进行计算；卷积运算阵列，用于对数据分块模块传输的数据进行多层网络的卷积运算；结果收集模块，用于接收卷积运算阵列的卷积结果，将结果进行拼接，得到下一层的输入并写入对应的RAM内。

DDR控制器，包括读控制器和写控制器，分别实现数据读控制和数据写控制两个功能。在数据读控制过程中，由于运算按照层融合分块策略进行，每次有读激励请求时需要搬运的数据量都不同，因此读长度需要不断修改。本发明实施例中，卷积层首层图片的尺寸为1080*1920，把它分为4*44个图像分块。如图2所示，水平方向上图像分为4部分，分块宽度从左至右依次为514、554、554和520，各分块之间重叠的宽度为74；垂直方向上将图像分为44块，第一块高度为58，第2～43块高度为24，第44块高度为14，各分块之间没有重叠。

可以提前计算好多个分块对应的读数地址和突发长度，在配置状态时，将读取请求对应的配置信息分别存入对应RAM。在数据写控制过程中，需要传输结果数据，也可以各分块对应的地址和突发长度预先配置给写控制器。如图3所示，分块的数据在RAM中按列——通道——行的顺序存储，即一个地址存放一个通道的一行激励的一部分(根据卷积运算阵列大小决定长度)，先存放完一个分块一行一个通道的数据，再存放该行下一个通道，再存放下一行，每一层的激励存储在不同的RAM中。

如图4所示，片上RAM要求每一层都分配一块RAM，第一层用于存储输入图像数据，其余每个卷积层用于存储层间计算结果。由于图像被拆分为多个分块顺序计算，多个分块会写进同一个RAM，而分块与分块间有复用的数据，因此需要对RAM的读写地址进行一定的控制。当写一个分块的数据进RAM时，记录其最后写入的地址last_addr，发送给写控制器，在写下一个分块进RAM时，从last_addr+1开始写，写到RAM最底部时返回第零行继续。对于有数据复用的分块，读控制器则从(last_addr-复用行数)的地址进行读取。

Claims

1.一种基于行缓存机制的卷积层融合存储装置，其特征在于，包括：

DDR控制器，用于控制片上RAM与DDR存储器的数据交互过程；

2.根据权利要求1所述的一种基于行缓存机制的卷积层融合存储装置，其特征在于，所述DDR控制器包括读控制器和写控制器，分别用于在读写图像分块数据的过程中，控制片上RAM的读写地址。

3.根据权利要求1所述的一种基于行缓存机制的卷积层融合存储装置，其特征在于，在卷积层的每一层都配置一块片上RAM，第一层的片上RAM用于存储输入图像数据，其余每个卷积层的片上RAM用于存储层间计算结果。

4.根据权利要求1所述的一种基于行缓存机制的卷积层融合存储装置，其特征在于，所述数据分发模块，用于按照层融合的分块策略，从片上RAM中读出对应的数据传输给卷积运算阵列进行计算；所述卷积运算阵列，用于对数据分块模块传输的数据进行多层网络的卷积运算；所述结果收集模块，用于接收卷积运算阵列的卷积结果，将结果进行拼接，得到下一层的输入并写入对应的片上RAM内。

5.利用如权利要求1所述一种基于行缓存机制的卷积层融合存储装置的方法，其特征在于，该方法包括如下步骤：

6.根据权利要求5所述的一种基于行缓存机制的卷积层融合存储方法，其特征在于，步骤(1)和(2)中，由于图像分块之间有部分重叠，每次从DDR存储器往片上RAM搬运图像分块数据时，为了复用重叠部分的数据，要对片上RAM的读写地址进行控制。

7.根据权利要求5所述的一种基于行缓存机制的卷积层融合存储方法，其特征在于，对片上RAM的读写地址进行控制的具体步骤如下：

3)对于有数据复用的分块，则从last_addr-复用行数的地址进行读取。