CN109871510A - 二维卷积运算处理方法、***、设备及计算机存储介质 - Google Patents

二维卷积运算处理方法、***、设备及计算机存储介质 Download PDF

Info

Publication number
CN109871510A
CN109871510A CN201910016318.1A CN201910016318A CN109871510A CN 109871510 A CN109871510 A CN 109871510A CN 201910016318 A CN201910016318 A CN 201910016318A CN 109871510 A CN109871510 A CN 109871510A
Authority
CN
China
Prior art keywords
data
target
parameter
calculated
convolution kernel
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910016318.1A
Other languages
English (en)
Other versions
CN109871510B (zh
Inventor
董刚
赵雅倩
方兴
杨宏斌
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong Inspur Smart Computing Technology Co Ltd
Original Assignee
Guangdong Inspur Big Data Research Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong Inspur Big Data Research Co Ltd filed Critical Guangdong Inspur Big Data Research Co Ltd
Priority to CN201910016318.1A priority Critical patent/CN109871510B/zh
Publication of CN109871510A publication Critical patent/CN109871510A/zh
Priority to PCT/CN2019/103633 priority patent/WO2020143235A1/zh
Application granted granted Critical
Publication of CN109871510B publication Critical patent/CN109871510B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/15Correlation function computation including computation of convolution operations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Physics (AREA)
  • Computational Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Analysis (AREA)
  • Software Systems (AREA)
  • Computing Systems (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Biophysics (AREA)
  • Algebra (AREA)
  • Databases & Information Systems (AREA)
  • Complex Calculations (AREA)

Abstract

本申请公开了一种二维卷积运算处理方法、***、设备及计算机介质,在预设存储器中读取待计算数据和卷积核运算参数;调用第一矩阵转换处理器将待计算数据转换为矩阵形式的目标待计算数据,同时调用第二矩阵转换处理器将卷积核运算参数转换为矩阵形式的目标卷积核运算参数;在预设的卷积层组中确定出目标卷积层,将目标待计算数据和目标卷积核运算参数传输至目标卷积层,以使目标卷积层对目标待计算数据和目标卷积核运算参数进行二维卷积运算,卷积层组中相同卷积层的数量大于等于2。本申请提供的一种二维卷积运算处理方法,可以提高二维卷积运算的效率。本申请提供的一种二维卷积运算处理***、设备及计算机可读存储介质也解决了相应技术问题。

Description

二维卷积运算处理方法、***、设备及计算机存储介质
技术领域
本申请涉及深度学习技术领域,更具体地说,涉及二维卷积运算处理方法、***、设备及计算机存储介质。
背景技术
在深度学习技术中,主要以CNN(Convolutional Neural Networks,卷积神经网络)为研究对象,但是由于处理场景的不同,对CNN的性能要求也不相同,这就需要根据处理场景实时调整CNN,而CNN中的结构主要是卷积层,那么卷积层进行二维卷积计算的效率便会影响CNN的性能高低。
综上所述,如何提高二维卷积计算的效率是目前本领域技术人员亟待解决的问题。
发明内容
本申请的目的是提供一种二维卷积运算处理方法、***、设备及计算机存储介质,其能在一定程度上解决如何提高二维卷积计算的效率的技术问题。本申请还提供了一种二维卷积运算处理***、设备及计算机可读存储介质。
为了实现上述目的,本申请提供如下技术方案:
一种二维卷积运算处理方法,包括:
在预设存储器中读取待计算数据和卷积核运算参数;
调用第一矩阵转换处理器将所述待计算数据转换为矩阵形式的目标待计算数据,同时调用第二矩阵转换处理器将所述卷积核运算参数转换为矩阵形式的目标卷积核运算参数;
在预设的卷积层组中确定出目标卷积层,将所述目标待计算数据和所述目标卷积核运算参数传输至所述目标卷积层,以使所述目标卷积层对所述目标待计算数据和所述目标卷积核运算参数进行二维卷积运算,所述卷积层组中相同卷积层的数量大于等于2。
优选的,所述在预设存储器中读取待计算数据和卷积核运算参数之前,还包括:
获取设定的所述卷积层组对应的数据格式配置参数,以基于所述数据格式配置参数调整与所述卷积层组对应的数据的格式;
其中,所述数据格式配置参数中的数据类型包括数据输入数据格式、输出数据格式、计算数据格式;所述数据格式配置参数中的格式类型包括INT8、INT16、INT32、fp32、fp16。
优选的,所述在预设存储器中读取待计算数据和卷积核运算参数之前,还包括:
获取设定的卷积核配置参数;
基于所述卷积核配置参数调整所述卷积层组中卷积核的参数;
其中,所述卷积核配置参数的参数类型包括卷积核尺寸、卷积核滑动步长、卷积核空洞尺寸。
优选的,所述第一矩阵转换处理器将所述待计算数据转换为矩阵形式的目标待计算数据,包括:
将所述待计算数据切分为待计算数据块;
对于每一个所述待计算数据块,将所述待计算数据块转换为第一矩阵数据块;
对于每一个所述第一矩阵数据块,按照第二矩阵数据块的格式,对所述第一矩阵数据块进行遍历,得到所述第二矩阵数据块;
对所有的所述第二矩阵数据块进行转换,得到所述目标待计算数据。
优选的,所述第二矩阵转换处理器将所述卷积核运算参数转换为矩阵形式的目标卷积核运算参数,包括:
将所述卷积核运算参数切分为卷积核运算参数块;
对于每一个所述卷积核运算参数块,将所述卷积核运算参数块转换为第一矩阵参数块;
对于每一个所述第一矩阵参数块,按照第二矩阵参数块的格式,对所述第一矩阵参数块进行遍历,得到所述第二矩阵参数块;
对所有的所述第二矩阵参数块进行转换,得到所述目标卷积核运算参数。
优选的,所述将所述目标待计算数据和所述目标卷积核运算参数传输至所述目标卷积层之后,还包括:
判断所述预读存储器是否为空,若否,则返回执行所述在预设存储器中读取待计算数据和卷积核运算参数的步骤。
优选的,所述在预设存储器中读取待计算数据和卷积核运算参数,包括:
在预设的DDR SDRAM中读取所述待计算数据和所述卷积核运算参数。
一种二维卷积运算处理***,包括:
第一读取模块,用于在预设存储器中读取待计算数据和卷积核运算参数;
第一调用模块,用于调用第一矩阵转换处理器将所述待计算数据转换为矩阵形式的目标待计算数据,同时调用第二矩阵转换处理器将所述卷积核运算参数转换为矩阵形式的目标卷积核运算参数;
第一传输模块,用于在预设的卷积层组中确定出目标卷积层,将所述目标待计算数据和所述目标卷积核运算参数传输至所述目标卷积层,以使所述目标卷积层对所述目标待计算数据和所述目标卷积核运算参数进行二维卷积运算,所述卷积层组中相同卷积层的数量大于等于2。
一种二维卷积运算处理设备,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现如上任一所述二维卷积运算处理方法的步骤。
一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机程序,所述计算机程序被处理器执行时实现如上任一所述二维卷积运算处理方法的步骤。
本申请提供的一种二维卷积运算处理方法,包括在预设存储器中读取待计算数据和卷积核运算参数;调用第一矩阵转换处理器将待计算数据转换为矩阵形式的目标待计算数据,同时调用第二矩阵转换处理器将卷积核运算参数转换为矩阵形式的目标卷积核运算参数;在预设的卷积层组中确定出目标卷积层,将目标待计算数据和目标卷积核运算参数传输至目标卷积层,以使目标卷积层对目标待计算数据和目标卷积核运算参数进行二维卷积运算,卷积层组中相同卷积层的数量大于等于2。本申请提供的一种二维卷积运算处理方法,在预设存储器中读取待计算数据和卷积核运算参数,在调用第一矩阵转换器的同时调用第二矩阵转换器,可以提高对待计算数据和卷积核运算参数的矩阵转换效率,之后在预设卷积层组中确定出目标卷积层,并借助目标卷积层对目标待计算数据和目标卷积核运算参数进行二维卷积运算,由于卷积层组中相同卷积层的数量大于等于2,所以可以借助卷积层组并行对待计算数据和卷积核运算参数进行二维卷积运算,可以提高二维卷积运算的效率。本申请提供的一种二维卷积运算处理***、设备及计算机可读存储介质也解决了相应技术问题。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本申请实施例提供的一种二维卷积运算处理方法的第一流程图;
图2为第一矩阵转换处理器的数据转换示意图;
图3为卷积层组进行二维卷积运算的示意图;
图4为本申请实施例提供的一种二维卷积运算处理方法的第二流程图;
图5为本申请实施例提供的一种二维卷积运算处理***的结构示意图;
图6为实际应用中本申请实施例提供的二维卷积运算处理***的结构示意图;
图7为实际应用中待计算数据和卷积核运算参数的读取过程示意图
图8为本申请实施例提供的一种二维卷积运算处理设备的结构示意图;
图9为本申请实施例提供的一种二维卷积运算处理设备的另一结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
在深度学习技术中,主要以CNN(Convolutional Neural Networks,卷积神经网络)为研究对象,但是由于处理场景的不同,对CNN的性能要求也不相同,这就需要根据处理场景实时调整CNN,而CNN中的结构主要是卷积层,那么卷积层进行二维卷积计算的效率便会影响CNN的性能高低。本申请提供的一种二维卷积运算处理方法可以提高二维卷积计算的效率。
本申请实施例提供的一种二维卷积运算处理方法的执行主体可以为本申请实施例提供的二维卷积运算处理***,该***可以内置于服务器、处理器等中,所以本申请实施例提供的一种二维卷积运算处理方法的执行主体还可以为内置了二维卷积运算***的服务器、处理器等。具体的,本申请提供的二维卷积运算处理方法可以采用RTL(RegisterTransfer Level,寄存器转换级电路)进行描述,并可在FPGA(Field-Programmable GateArray,现场可编程门阵列)上运行,或者制作成专用芯片实现。
请参阅图1,图1为本申请实施例提供的一种二维卷积运算处理方法的第一流程图。
本申请实施例提供的一种二维卷积运算处理方法,可以包括以下步骤:
步骤S101:在预设存储器中读取待计算数据和卷积核运算参数。
实际应用中,可以在预设存储器中读取待计算数据和卷积核运算参数,待计算数据和卷积核运算参数的类型可以根据实际需要确定,不难理解,外界在需要进行二维卷积运算时,可以将待计算数据和卷积核运算参数存储在预设存储器中,待计算数据多为外界借助二维卷积运算所要计算的数据,比如一幅图像的像素点数据等,卷积核运算参数指的是二维卷积运算过程中卷积核运算时的参数。具体的,可以同时在预设存储器中读取待计算数据和卷积核运算参数,以便提高二维卷积运算的效率。此外,读取的待计算数据和卷积核运算参数的组数和每组中数据的数量可以根据实际需要确定,比如在二维卷积运算为1×1时,每组可以读取64byte的待计算数据,读取1byte的卷积核运算参数;在二维卷积运算为3×3时,每组可以读取25byte的待计算数据,读取9byte的卷积核运算参数。
下面对卷积相关的概念进行简介:图像中不同数据窗口的数据(feature)和卷积核(filter)作内积的操作叫做卷积,其计算过程又称为滤波,本质是提取图像不同频段的特征。卷积核也称为滤波器,是包含一组固定权重的神经元,通常是n×m的二维矩阵,n和m也被称为神经元的感受野。n×m矩阵中存的是对感受野中数据处理的系数。一个卷积核的滤波可以用来提取特定的特征(例如可以提取物体轮廓、颜色深浅等)。通过卷积层从原始数据中提取出新的特征的过程又称为feature map(特征映射)。filter_size是指filter的大小,例如3×3;filter_num是指每种filter_size的filter个数,通常是通道个数。通道可以理解为视角、角度。例如同样是提取边界特征的卷积核,可以按照R、G、B三种元素的角度提取边界,RGB在边界这个角度上有不同的表达。多个滤波器叠加便成了卷积层。而卷积层的结构参数主要有以下几种:
步幅(Stride):定义了卷积核遍历图像时的步幅大小。其默认值通常设置为1,也可将步幅设置为2后对图像进行下采样,这种方式与最大池化类似;
边界扩充(Padding):定义了网络层处理样本边界的方式。当卷积核大于1且不进行边界扩充,输出尺寸将相应缩小;当卷积核以标准方式进行边界扩充,则输出数据的空间尺寸将与输入相等;
输入与输出通道(Channels):构建卷积层时需定义输入通道I,并由此确定输出通道O。这样,可算出每个网络层的参数量为I×O×K,其中K为卷积核的参数个数。
假设某个网络层有64个大小为3×3的卷积核,则对应K值为3×3=9。CNN网络中所进行的二维卷积计算过程如下所述:假设有一个3×3大小的卷积层,其输入通道为16、输出通道为32。具体为,32个3×3大小的卷积核会遍历16个通道中的每个数据,从而产生16×32=512个特征图谱。进而通过叠加每个输出通道对应的16个特征图谱后融合得到1个特征图谱。不难发现,卷积网络的核心思想是将:局部感受野、权值共享以及时间或空间亚采样这三种结构思想结合起来获得了某种程度的位移、尺度、形变不变性。
步骤S102:调用第一矩阵转换处理器将待计算数据转换为矩阵形式的目标待计算数据,同时调用第二矩阵转换处理器将卷积核运算参数转换为矩阵形式的目标卷积核运算参数。
实际应用中,在读取待计算数据和卷积核运算参数后,由于从预设存储器中读取出的数据为顺序的数据,而二维卷积运算所应用的数据格式为矩阵,所以需要将待计算数据和卷积核运算参数转换为矩阵形式的目标待计算数据和目标卷积核运算参数,具体的,可以调用第一矩阵转换处理器将待计算数据转换为矩阵形式的目标待计算数据,同时调用第二矩阵转换处理器将卷积核运算参数转换为矩阵形式的目标卷积核运算参数,由于同时调用第一矩阵转换处理器和第二矩阵转换处理器,所以可以在一定程度上提高得到目标待计算数据和目标卷积核运算参数的效率,进而提高二维卷积运算的效率。第一矩阵转换处理器和第二矩阵转换处理器进行矩阵转换的方式可以根据实际需要确定。
步骤S103:在预设的卷积层组中确定出目标卷积层,将目标待计算数据和目标卷积核运算参数传输至目标卷积层,以使目标卷积层对目标待计算数据和目标卷积核运算参数进行二维卷积运算,卷积层组中相同卷积层的数量大于等于2。
实际应用中,在得到目标待计算数据和目标卷积核运算参数后,便可以在预设的卷积层组中确定出目标卷积层,具体的,可以将空闲的卷积层确定为目标卷积层;之后将目标待计算数据和目标卷积核运算参数传输至目标卷积层,目标卷积层便可以对目标待计算数据和目标卷积核运算参数进行二维卷积运算。由于卷积层组中包含多个卷积层,而目标卷积层是在卷积层组中确定出来的,且目标卷积层可对目标待计算数据和目标卷积核运算参数进行二维卷积运算,所以卷积层组中包含多个可以对目标待计算数据和目标卷积核运算参数进行二维卷积运算的卷积层,相应的,便可以采用并行方式调用卷积层组,以同时对多组待计算数据和卷积核运算参数进行二维卷积运算,提高二维卷积运算的效率。具体的,卷积层组可以设置在DSP(Digital Signal Processor,数字信号处理单元)阵列中
具体应用场景中,为了便于外界对二维卷积运算过程中数据格式的控制,在预设存储器中读取待计算数据和卷积核运算参数之前,还可以获取设定的卷积层组对应的数据格式配置参数,以基于数据格式配置参数调整与卷积层组对应的数据的格式;其中,数据格式配置参数中的数据类型包括数据输入数据格式、输出数据格式、计算数据格式;数据格式配置参数中的格式类型包括INT8、INT16、INT32、fp32、fp16。比如设定的数据格式配置参数为输入数据格式为INT8,输出数据格式为INT16,计算数据格式为fp16,则相应的会将待计算数据和卷积核运算参数的数据格式设置为INT8,将卷积层进行二维卷积运算后的运行结果的格式设置为INT16,并控制二维卷积运算过程中中间参数的格式为fp16。不难理解,计算数据格式指的是二维卷积运算过程中中间参数的数据格式。
具体应用场景中,针对不同类型的数据,可能需要使用不同的卷积层来进行运算,为了便于外界调试卷积层,在预设存储器中读取待计算数据和卷积核运算参数之前,还可以获取设定的卷积核配置参数;并基于卷积核配置参数调整卷积层组中卷积核的参数;其中,卷积核配置参数的参数类型包括卷积核尺寸、卷积核滑动步长、卷积核空洞尺寸。由于卷积层组中包含多个相同的卷积层,所以在对一类卷积层进行设置时,需对所有相同的卷积层进行设置。
具体应用场景中,第一矩阵转换处理器将待计算数据转换为矩阵形式的目标待计算数据的过程可以具体为:将待计算数据切分为待计算数据块;对于每一个待计算数据块,将待计算数据块转换为第一矩阵数据块;对于每一个第一矩阵数据块,按照第二矩阵数据块的格式,对第一矩阵数据块进行遍历,得到第二矩阵数据块;对所有的第二矩阵数据块进行转换,得到目标待计算数据。
请参阅图2,图2为第一矩阵转换处理器的数据转换示意图。假设将1024位的待计算数据转换为1×1形式的矩阵,则可以先将待计算数据切分为16个大小均为64的待计算数据块,并将每一个待计算数据块转换为8×8形式的第一矩阵数据块,之后,在每一个第一矩阵数据块中,按照5×5的矩阵形式对第一矩阵数据块进行遍历,得到所有的5×5形式的第二矩阵数据块,最后,将所有5×5形式的第二矩阵数据块转换为1×1形式的目标待计算数据块。具体的遍历形式和转换算法可以根据实际需要确定。
具体应用场景中,第二矩阵转换处理器将卷积核运算参数转换为矩阵形式的目标卷积核运算参数的过程可以具体为:将卷积核运算参数切分为卷积核运算参数块;对于每一个卷积核运算参数块,将卷积核运算参数块转换为第一矩阵参数块;对于每一个第一矩阵参数块,按照第二矩阵参数块的格式,对第一矩阵参数块进行遍历,得到第二矩阵参数块;对所有的第二矩阵参数块进行转换,得到目标卷积核运算参数。
具体应用场景中,在一次处理过程中可能需要进行多次二维卷积运算,为了保证处理过程的完整性,在将目标待计算数据和目标卷积核运算参数传输至目标卷积层之后,还可以判断预读存储器是否为空,若否,则返回执行在预设存储器中读取待计算数据和卷积核运算参数的步骤。在此过程中,待计算数据可以按照固定节拍在卷积层组中传输,与卷积核运算参数进行乘加的累加运算,当一组待计算数据经过一个卷积层后,卷积核运算参数便立即更换成下一组待计算数据对应的数值,由此可以使得卷积层组连续不断的对待计算数据和卷积核运算参数进行二维卷积运算。请参阅图3,图3为卷积层组进行二维卷积运算的示意图。
具体应用场景中,为了保证在预设存储器中读取待计算数据和卷积核运算参数的读取效率,可以采用高性能的存储器存储待计算数据和卷积核运算参数,则在预设存储器中读取待计算数据和卷积核运算参数的过程可以具体为:在预设的DDR(Double DataRate,双倍速率)SDRAM(Synchronous Dynamic Random Access Memory,同步动态随机存取存储器)中读取待计算数据和卷积核运算参数。
本申请提供的一种二维卷积运算处理方法,包括在预设存储器中读取待计算数据和卷积核运算参数;调用第一矩阵转换处理器将待计算数据转换为矩阵形式的目标待计算数据,同时调用第二矩阵转换处理器将卷积核运算参数转换为矩阵形式的目标卷积核运算参数;在预设的卷积层组中确定出目标卷积层,将目标待计算数据和目标卷积核运算参数传输至目标卷积层,以使目标卷积层对目标待计算数据和目标卷积核运算参数进行二维卷积运算,卷积层组中相同卷积层的数量大于等于2。本申请提供的一种二维卷积运算处理方法,在预设存储器中读取待计算数据和卷积核运算参数,在调用第一矩阵转换器的同时调用第二矩阵转换器,可以提高对待计算数据和卷积核运算参数的矩阵转换效率,之后在预设卷积层组中确定出目标卷积层,并借助目标卷积层对目标待计算数据和目标卷积核运算参数进行二维卷积运算,由于卷积层组中相同卷积层的数量大于等于2,所以可以借助卷积层组并行对待计算数据和卷积核运算参数进行二维卷积运算,可以提高二维卷积运算的效率。
请参阅图4,图4为本申请实施例提供的一种二维卷积运算处理方法的第二流程图。
实际应用中,本申请实施例提供的一种二维卷积运算处理方法可以包括以下步骤:
步骤S201:获取设定的卷积层组对应的数据格式配置参数,以基于数据格式配置参数调整与卷积层组对应的数据的格式。
步骤S202:获取设定的卷积核配置参数。
步骤S203:基于卷积核配置参数调整卷积层组中卷积核的参数。
步骤S204:在预设的DDR SDRAM中读取待计算数据和卷积核运算参数。
步骤S205:调用第一矩阵转换处理器将待计算数据转换为矩阵形式的目标待计算数据,同时调用第二矩阵转换处理器将卷积核运算参数转换为矩阵形式的目标卷积核运算参数。
步骤S206:在预设的卷积层组中确定出目标卷积层,将目标待计算数据和目标卷积核运算参数传输至目标卷积层,以使目标卷积层对目标待计算数据和目标卷积核运算参数进行二维卷积运算,卷积层组中相同卷积层的数量大于等于2。
比如在需要在一幅包含桌子和杯子的目标图像中提取出桌子的图像时,外界可以将目标图像的像素点作为待计算数据,并确定提取算法所对应的卷积核配置参数及卷积核运算参数,并将待计算数据和卷积核运算参数存储至DDR SDRAM中,之后便可以采用本申请提供的二维卷积运算处理方法进行二维卷积运算,其过程如下:获取设定的卷积层组对应的数据格式配置参数,以基于数据格式配置参数调整与卷积层组对应的数据的格式;获取设定的卷积核配置参数,基于卷积核配置参数调整卷积层组中卷积核的参数;在预设的DDRSDRAM中读取待计算数据,也即目标图像的像素点,和卷积核运算参数;调用第一矩阵转换处理器将待计算数据转换为矩阵形式的目标待计算数据,同时调用第二矩阵转换处理器将卷积核运算参数转换为矩阵形式的目标卷积核运算参数;在预设的卷积层组中确定出目标卷积层,将目标待计算数据和目标卷积核运算参数传输至目标卷积层,以使目标卷积层对目标待计算数据和目标卷积核运算参数进行二维卷积运算,卷积层组中相同卷积层的数量大于等于2;获取目标卷积层的运算结果,并将其发送至图像处理器;图像处理器根据运算结果还原桌子的图像。
本申请还提供了一种二维卷积运算处理***,其具有本申请实施例提供的一种二维卷积运算处理方法具有的对应效果。请参阅图5,图5为本申请实施例提供的一种二维卷积运算处理***的结构示意图。
本申请实施例提供的一种二维卷积运算处理***,可以包括:
第一读取模块101,用于在预设存储器中读取待计算数据和卷积核运算参数;
第一调用模块102,用于调用第一矩阵转换处理器将待计算数据转换为矩阵形式的目标待计算数据,同时调用第二矩阵转换处理器将卷积核运算参数转换为矩阵形式的目标卷积核运算参数;
第一传输模块103,用于在预设的卷积层组中确定出目标卷积层,将目标待计算数据和目标卷积核运算参数传输至目标卷积层,以使目标卷积层对目标待计算数据和目标卷积核运算参数进行二维卷积运算,卷积层组中相同卷积层的数量大于等于2。
本申请实施例提供的一种二维卷积运算处理***,还可以包括:
第一获取模块,用于第一读取模块在预设存储器中读取待计算数据和卷积核运算参数之前,获取设定的卷积层组对应的数据格式配置参数,以基于数据格式配置参数调整与卷积层组对应的数据的格式;
其中,数据格式配置参数中的数据类型包括数据输入数据格式、输出数据格式、计算数据格式;数据格式配置参数中的格式类型包括INT8、INT16、INT32、fp32、fp16。
本申请实施例提供的一种二维卷积运算处理***,还可以包括:
第二获取模块,用于第一读取模块在预设存储器中读取待计算数据和卷积核运算参数之前,获取设定的卷积核配置参数;
第一调整模块,用于基于卷积核配置参数调整卷积层组中卷积核的参数;
其中,卷积核配置参数的参数类型包括卷积核尺寸、卷积核滑动步长、卷积核空洞尺寸。
本申请实施例提供的一种二维卷积运算处理***,第一矩阵转换处理器可以包括:
第一切分模块,用于将待计算数据切分为待计算数据块;
第一转换模块,用于对于每一个待计算数据块,将待计算数据块转换为第一矩阵数据块;
第一遍历模块,用于对于每一个第一矩阵数据块,按照第二矩阵数据块的格式,对第一矩阵数据块进行遍历,得到第二矩阵数据块;
第二转化模块,用于对所有的第二矩阵数据块进行转换,得到目标待计算数据。
本申请实施例提供的一种二维卷积运算处理***,第二矩阵转换处理器可以包括:
第二切分模块,用于将卷积核运算参数切分为卷积核运算参数块;
第三转换模块,用于对于每一个卷积核运算参数块,将卷积核运算参数块转换为第一矩阵参数块;
第二遍历模块,用于对于每一个第一矩阵参数块,按照第二矩阵参数块的格式,对第一矩阵参数块进行遍历,得到第二矩阵参数块;
第四转换模块,用于对所有的第二矩阵参数块进行转换,得到目标卷积核运算参数。
本申请实施例提供的一种二维卷积运算处理***,还可以包括:
第一判断模块,用于第一传输模块将目标待计算数据和目标卷积核运算参数传输至目标卷积层之后,判断预读存储器是否为空,若否,则返回执行在预设存储器中读取待计算数据和卷积核运算参数的步骤。
本申请实施例提供的一种二维卷积运算处理***,第一读取模块可以包括:
第一读取单元,用于在预设的DDR SDRAM中读取待计算数据和卷积核运算参数。
请参阅图6,图6为实际应用中本申请实施例提供的二维卷积运算处理***的结构示意图。
实际应用中,本申请实施例提供的一种二维卷积运算处理***可以包括DDRSDRAM301、待计算数据缓存模块302,卷积核运算参数缓存模块303、第一矩阵转换处理器304、第二矩阵转换处理器305、DSP阵列306。各个组件的描述可参阅上述实施例。现结合图7对实际应用中待计算数据和卷积核运算参数的读取过程进行描述,图7为实际应用中待计算数据和卷积核运算参数的读取过程示意图。其中,卷积层的输入通道为9,输出通道为32。
在读取待计算数据时,根据配置数值计算feature的输入数据量,输入数据量为i_inputfeaturewidth*i_inputfeatureheight*i_inputchannel;根据i_inputfeatureaddress配置的数值向主存接口发出读请求,将读到的数据缓存;取64x11x11=7744bytes feature数据进行二级缓存;根据卷积模式取出feature数据,共计取出4*64组数据;在取出9组数据后更换后续32个输出通道的参数;
在读取卷积核运算参数时,根据配置数值计算filter参数个数:i_inputchannel*i_outputchannel*9:i_inputchannel*i_outputchannel;根据i_convfilteraddress配置的数值向主存接口发出读请求,将读到的数据缓存;取出filter的参数数量:64x3x3bytes;根据卷积模式取出16*2组filter数据;
之后读取下一组filter,并遍历全部的输出通道i_outputchannel,遍历全部的输入通道i_inputchannel,之后准备读取下一组数据。
本申请还提供了一种二维卷积运算处理设备及计算机可读存储介质,其均具有本申请实施例提供的一种二维卷积运算处理方法具有的对应效果。请参阅图8,图8为本申请实施例提供的一种二维卷积运算处理设备的结构示意图。
本申请实施例提供的一种二维卷积运算处理设备,包括存储器201和处理器202,存储器201中存储有计算机程序,处理器202执行存储器201中存储的计算机程序时实现如下步骤:
在预设存储器中读取待计算数据和卷积核运算参数;
调用第一矩阵转换处理器将待计算数据转换为矩阵形式的目标待计算数据,同时调用第二矩阵转换处理器将卷积核运算参数转换为矩阵形式的目标卷积核运算参数;
在预设的卷积层组中确定出目标卷积层,将目标待计算数据和目标卷积核运算参数传输至目标卷积层,以使目标卷积层对目标待计算数据和目标卷积核运算参数进行二维卷积运算,卷积层组中相同卷积层的数量大于等于2。
本申请实施例提供的一种二维卷积运算处理设备,包括存储器201和处理器202,,包括存储器201和处理器202,存储器201中存储有计算机子程序,处理器202执行存储器201中存储的计算机子程序时具体实现如下步骤:在预设存储器中读取待计算数据和卷积核运算参数之前,获取设定的卷积层组对应的数据格式配置参数,以基于数据格式配置参数调整与卷积层组对应的数据的格式;其中,数据格式配置参数中的数据类型包括数据输入数据格式、输出数据格式、计算数据格式;数据格式配置参数中的格式类型包括INT8、INT16、INT32、fp32、fp16。
本申请实施例提供的一种二维卷积运算处理设备,包括存储器201和处理器202,,包括存储器201和处理器202,存储器201中存储有计算机子程序,处理器202执行存储器201中存储的计算机子程序时具体实现如下步骤:在预设存储器中读取待计算数据和卷积核运算参数之前,获取设定的卷积核配置参数;基于卷积核配置参数调整卷积层组中卷积核的参数;其中,卷积核配置参数的参数类型包括卷积核尺寸、卷积核滑动步长、卷积核空洞尺寸。
本申请实施例提供的一种二维卷积运算处理设备,包括存储器201和处理器202,,包括存储器201和处理器202,存储器201中存储有计算机子程序,处理器202执行存储器201中存储的计算机子程序时具体实现如下步骤:调用第一矩阵转换处理器时,将待计算数据切分为待计算数据块;对于每一个待计算数据块,将待计算数据块转换为第一矩阵数据块;对于每一个第一矩阵数据块,按照第二矩阵数据块的格式,对第一矩阵数据块进行遍历,得到第二矩阵数据块;对所有的第二矩阵数据块进行转换,得到目标待计算数据。
本申请实施例提供的一种二维卷积运算处理设备,包括存储器201和处理器202,,包括存储器201和处理器202,存储器201中存储有计算机子程序,处理器202执行存储器201中存储的计算机子程序时具体实现如下步骤:调用第二矩阵转换处理器时,将卷积核运算参数切分为卷积核运算参数块;对于每一个卷积核运算参数块,将卷积核运算参数块转换为第一矩阵参数块;对于每一个第一矩阵参数块,按照第二矩阵参数块的格式,对第一矩阵参数块进行遍历,得到第二矩阵参数块;对所有的第二矩阵参数块进行转换,得到目标卷积核运算参数。
本申请实施例提供的一种二维卷积运算处理设备,包括存储器201和处理器202,,包括存储器201和处理器202,存储器201中存储有计算机子程序,处理器202执行存储器201中存储的计算机子程序时具体实现如下步骤:将目标待计算数据和目标卷积核运算参数传输至目标卷积层之后,判断预读存储器是否为空,若否,则返回执行在预设存储器中读取待计算数据和卷积核运算参数的步骤。
本申请实施例提供的一种二维卷积运算处理设备,包括存储器201和处理器202,,包括存储器201和处理器202,存储器201中存储有计算机子程序,处理器202执行存储器201中存储的计算机子程序时具体实现如下步骤:在预设的DDR SDRAM中读取待计算数据和卷积核运算参数。
请参阅图9,本申请实施例提供的另一种二维卷积运算处理设备中还可以包括:与处理器202连接的输入端口203,用于传输外界输入的命令至处理器202;与处理器202连接的显示单元204,用于显示处理器202的处理结果至外界;与处理器202连接的通信模块205,用于实现二维卷积运算处理设备与外界的通信。显示单元204可以为显示面板、激光扫描使显示器等;通信模块205所采用的通信方式包括但不局限于移动高清链接技术(HML)、通用串行总线(USB)、高清多媒体接口(HDMI)、无线连接:无线保真技术(WiFi)、蓝牙通信技术、低功耗蓝牙通信技术、基于IEEE802.11s的通信技术。
本申请实施例提供的一种计算机可读存储介质,计算机可读存储介质中存储有计算机程序,计算机程序被处理器执行时实现如上任一实施例所描述的二维卷积运算处理方法的步骤。
本申请所涉及的计算机可读存储介质包括随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质。
本申请实施例提供的一种二维卷积运算处理***、设备及计算机可读存储介质中相关部分的说明请参见本申请实施例提供的一种二维卷积运算处理方法中对应部分的详细说明,在此不再赘述。另外,本申请实施例提供的上述技术方案中与现有技术中对应技术方案实现原理一致的部分并未详细说明,以免过多赘述。
还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
对所公开的实施例的上述说明,使本领域技术人员能够实现或使用本申请。对这些实施例的多种修改对本领域技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下,在其它实施例中实现。因此,本申请将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (10)

1.一种二维卷积运算处理方法,其特征在于,包括:
在预设存储器中读取待计算数据和卷积核运算参数;
调用第一矩阵转换处理器将所述待计算数据转换为矩阵形式的目标待计算数据,同时调用第二矩阵转换处理器将所述卷积核运算参数转换为矩阵形式的目标卷积核运算参数;
在预设的卷积层组中确定出目标卷积层,将所述目标待计算数据和所述目标卷积核运算参数传输至所述目标卷积层,以使所述目标卷积层对所述目标待计算数据和所述目标卷积核运算参数进行二维卷积运算,所述卷积层组中相同卷积层的数量大于等于2。
2.根据权利要求1所述的方法,其特征在于,所述在预设存储器中读取待计算数据和卷积核运算参数之前,还包括:
获取设定的所述卷积层组对应的数据格式配置参数,以基于所述数据格式配置参数调整与所述卷积层组对应的数据的格式;
其中,所述数据格式配置参数中的数据类型包括数据输入数据格式、输出数据格式、计算数据格式;所述数据格式配置参数中的格式类型包括INT8、INT16、INT32、fp32、fp16。
3.根据权利要求1所述的方法,其特征在于,所述在预设存储器中读取待计算数据和卷积核运算参数之前,还包括:
获取设定的卷积核配置参数;
基于所述卷积核配置参数调整所述卷积层组中卷积核的参数;
其中,所述卷积核配置参数的参数类型包括卷积核尺寸、卷积核滑动步长、卷积核空洞尺寸。
4.根据权利要求1所述的方法,其特征在于,所述第一矩阵转换处理器将所述待计算数据转换为矩阵形式的目标待计算数据,包括:
将所述待计算数据切分为待计算数据块;
对于每一个所述待计算数据块,将所述待计算数据块转换为第一矩阵数据块;
对于每一个所述第一矩阵数据块,按照第二矩阵数据块的格式,对所述第一矩阵数据块进行遍历,得到所述第二矩阵数据块;
对所有的所述第二矩阵数据块进行转换,得到所述目标待计算数据。
5.根据权利要求1所述的方法,其特征在于,所述第二矩阵转换处理器将所述卷积核运算参数转换为矩阵形式的目标卷积核运算参数,包括:
将所述卷积核运算参数切分为卷积核运算参数块;
对于每一个所述卷积核运算参数块,将所述卷积核运算参数块转换为第一矩阵参数块;
对于每一个所述第一矩阵参数块,按照第二矩阵参数块的格式,对所述第一矩阵参数块进行遍历,得到所述第二矩阵参数块;
对所有的所述第二矩阵参数块进行转换,得到所述目标卷积核运算参数。
6.根据权利要求1所述的方法,其特征在于,所述将所述目标待计算数据和所述目标卷积核运算参数传输至所述目标卷积层之后,还包括:
判断所述预读存储器是否为空,若否,则返回执行所述在预设存储器中读取待计算数据和卷积核运算参数的步骤。
7.根据权利要求1至6任一项所述的方法,其特征在于,所述在预设存储器中读取待计算数据和卷积核运算参数,包括:
在预设的DDR SDRAM中读取所述待计算数据和所述卷积核运算参数。
8.一种二维卷积运算处理***,其特征在于,包括:
第一读取模块,用于在预设存储器中读取待计算数据和卷积核运算参数;
第一调用模块,用于调用第一矩阵转换处理器将所述待计算数据转换为矩阵形式的目标待计算数据,同时调用第二矩阵转换处理器将所述卷积核运算参数转换为矩阵形式的目标卷积核运算参数;
第一传输模块,用于在预设的卷积层组中确定出目标卷积层,将所述目标待计算数据和所述目标卷积核运算参数传输至所述目标卷积层,以使所述目标卷积层对所述目标待计算数据和所述目标卷积核运算参数进行二维卷积运算,所述卷积层组中相同卷积层的数量大于等于2。
9.一种二维卷积运算处理设备,其特征在于,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现如权利要求1至7任一项所述二维卷积运算处理方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述二维卷积运算处理方法的步骤。
CN201910016318.1A 2019-01-08 2019-01-08 二维卷积运算处理方法、***、设备及计算机存储介质 Active CN109871510B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201910016318.1A CN109871510B (zh) 2019-01-08 2019-01-08 二维卷积运算处理方法、***、设备及计算机存储介质
PCT/CN2019/103633 WO2020143235A1 (zh) 2019-01-08 2019-08-30 二维卷积运算处理方法、***、设备及计算机存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910016318.1A CN109871510B (zh) 2019-01-08 2019-01-08 二维卷积运算处理方法、***、设备及计算机存储介质

Publications (2)

Publication Number Publication Date
CN109871510A true CN109871510A (zh) 2019-06-11
CN109871510B CN109871510B (zh) 2024-01-23

Family

ID=66917550

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910016318.1A Active CN109871510B (zh) 2019-01-08 2019-01-08 二维卷积运算处理方法、***、设备及计算机存储介质

Country Status (2)

Country Link
CN (1) CN109871510B (zh)
WO (1) WO2020143235A1 (zh)

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110516799A (zh) * 2019-08-16 2019-11-29 浪潮电子信息产业股份有限公司 一种数据处理***、方法及介质
CN111160570A (zh) * 2019-12-31 2020-05-15 山东浪潮人工智能研究院有限公司 用于预测性维护的基于卷积算子的特征构造方法及***
CN111242293A (zh) * 2020-01-13 2020-06-05 腾讯科技(深圳)有限公司 一种处理部件、数据处理的方法以及电子设备
CN111310891A (zh) * 2020-01-20 2020-06-19 苏州浪潮智能科技有限公司 一种卷积运算方法、装置、设备及存储介质
WO2020143235A1 (zh) * 2019-01-08 2020-07-16 广东浪潮大数据研究有限公司 二维卷积运算处理方法、***、设备及计算机存储介质
CN111639701A (zh) * 2020-05-28 2020-09-08 山东云海国创云计算装备产业创新中心有限公司 一种图像特征提取的方法、***、设备及可读存储介质
CN111858036A (zh) * 2020-06-29 2020-10-30 浪潮电子信息产业股份有限公司 基于FPGA设备的TensorFlow***加速方法、装置、设备及存储介质
CN111899147A (zh) * 2020-06-16 2020-11-06 北京大学 一种卷积核计算加速器及卷积核计算方法
CN112488296A (zh) * 2020-11-25 2021-03-12 苏州浪潮智能科技有限公司 基于硬件环境的数据操作方法、装置、设备及存储介质
CN113076083A (zh) * 2021-06-04 2021-07-06 南京后摩智能科技有限公司 数据乘加运算电路
CN115292662A (zh) * 2022-08-18 2022-11-04 上海燧原科技有限公司 一种卷积加速运算方法、装置、电子设备及存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108805266A (zh) * 2018-05-21 2018-11-13 南京大学 一种可重构cnn高并发卷积加速器
CN109034373A (zh) * 2018-07-02 2018-12-18 鼎视智慧(北京)科技有限公司 卷积神经网络的并行处理器及处理方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10824934B2 (en) * 2017-01-12 2020-11-03 Texas Instruments Incorporated Methods and apparatus for matrix processing in a convolutional neural network
CN107679620B (zh) * 2017-04-19 2020-05-26 赛灵思公司 人工神经网络处理装置
CN109871510B (zh) * 2019-01-08 2024-01-23 广东浪潮大数据研究有限公司 二维卷积运算处理方法、***、设备及计算机存储介质

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108805266A (zh) * 2018-05-21 2018-11-13 南京大学 一种可重构cnn高并发卷积加速器
CN109034373A (zh) * 2018-07-02 2018-12-18 鼎视智慧(北京)科技有限公司 卷积神经网络的并行处理器及处理方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
DAVID FLANAGAN: "机器人学和计算机视觉的集群计算", 北京理工大学出版社, pages: 108 - 110 *

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020143235A1 (zh) * 2019-01-08 2020-07-16 广东浪潮大数据研究有限公司 二维卷积运算处理方法、***、设备及计算机存储介质
CN110516799A (zh) * 2019-08-16 2019-11-29 浪潮电子信息产业股份有限公司 一种数据处理***、方法及介质
CN111160570A (zh) * 2019-12-31 2020-05-15 山东浪潮人工智能研究院有限公司 用于预测性维护的基于卷积算子的特征构造方法及***
CN111242293A (zh) * 2020-01-13 2020-06-05 腾讯科技(深圳)有限公司 一种处理部件、数据处理的方法以及电子设备
CN111242293B (zh) * 2020-01-13 2023-07-18 腾讯科技(深圳)有限公司 一种处理部件、数据处理的方法以及电子设备
CN111310891A (zh) * 2020-01-20 2020-06-19 苏州浪潮智能科技有限公司 一种卷积运算方法、装置、设备及存储介质
CN111639701B (zh) * 2020-05-28 2022-06-17 山东云海国创云计算装备产业创新中心有限公司 一种图像特征提取的方法、***、设备及可读存储介质
CN111639701A (zh) * 2020-05-28 2020-09-08 山东云海国创云计算装备产业创新中心有限公司 一种图像特征提取的方法、***、设备及可读存储介质
CN111899147A (zh) * 2020-06-16 2020-11-06 北京大学 一种卷积核计算加速器及卷积核计算方法
CN111858036A (zh) * 2020-06-29 2020-10-30 浪潮电子信息产业股份有限公司 基于FPGA设备的TensorFlow***加速方法、装置、设备及存储介质
CN111858036B (zh) * 2020-06-29 2022-06-10 浪潮电子信息产业股份有限公司 基于FPGA设备的TensorFlow***加速方法、装置、设备及存储介质
CN112488296A (zh) * 2020-11-25 2021-03-12 苏州浪潮智能科技有限公司 基于硬件环境的数据操作方法、装置、设备及存储介质
CN112488296B (zh) * 2020-11-25 2022-12-02 苏州浪潮智能科技有限公司 基于硬件环境的数据操作方法、装置、设备及存储介质
CN113076083A (zh) * 2021-06-04 2021-07-06 南京后摩智能科技有限公司 数据乘加运算电路
CN115292662A (zh) * 2022-08-18 2022-11-04 上海燧原科技有限公司 一种卷积加速运算方法、装置、电子设备及存储介质
CN115292662B (zh) * 2022-08-18 2023-09-22 上海燧原科技有限公司 一种卷积加速运算方法、装置、电子设备及存储介质

Also Published As

Publication number Publication date
WO2020143235A1 (zh) 2020-07-16
CN109871510B (zh) 2024-01-23

Similar Documents

Publication Publication Date Title
CN109871510A (zh) 二维卷积运算处理方法、***、设备及计算机存储介质
JP7072640B2 (ja) 畳み込み効率を向上させる方法、システム、及び装置
KR102642853B1 (ko) 컨볼루션 회로, 그것을 포함하는 어플리케이션 프로세서 및 그것의 동작 방법
TWI680409B (zh) 適用於人工神經網路之矩陣及向量相乘的方法
US20210192246A1 (en) Convolutional neural network-based image processing method and device, and unmanned aerial vehicle
CN106874219A (zh) 一种卷积神经网络的数据调度方法、***及计算机设备
CN105938557A (zh) 图像识别方法、图像识别装置
CN107316286A (zh) 一种图像中雨雾同步合成、去除的方法和装置
CN108629406A (zh) 用于卷积神经网络的运算装置
CN109754359A (zh) 一种应用于卷积神经网络的池化处理的方法及***
CN112560701B (zh) 一种人脸图像提取方法、装置及计算机存储介质
WO2020258568A1 (zh) 基于卷积神经网络的数据处理方法和装置
CN104658027A (zh) 一种面向不规则海洋流场数据的三维流线动态可视化算法
CN109429069A (zh) 一种显示流压缩编码器以及显示引擎
CN109542911A (zh) 一种元数据组织方法、***、设备及计算机可读存储介质
CN101071504A (zh) 一种图片的特效处理方法及***
CN104394371B (zh) 一种适合大量连续图像采集和快速存储的***
CN110211069A (zh) 一种图像去噪模型及训练方法、***、设备、计算机介质
CN106603172A (zh) 一种应用于无线电监测接收机的带时间戳数据分时读写方法
JP5759126B2 (ja) パターン識別装置及びその制御方法、プログラム
CN109902821A (zh) 一种数据处理方法、装置及相关组件
CN103970904A (zh) 一种快速响应式遥感大数据处理***
CN114372012B (zh) 一种通用、可配置的高能效池化计算单行输出***和方法
CN108648136A (zh) 对二维查找表进行的方法及装置
CN103237211A (zh) 一种基于fpga的视频亚像素亮度插值的方法及其装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant