CN107992821B - 一种图像识别方法及*** - Google Patents

一种图像识别方法及*** Download PDF

Info

Publication number
CN107992821B
CN107992821B CN201711242391.8A CN201711242391A CN107992821B CN 107992821 B CN107992821 B CN 107992821B CN 201711242391 A CN201711242391 A CN 201711242391A CN 107992821 B CN107992821 B CN 107992821B
Authority
CN
China
Prior art keywords
memory
image
input image
memory block
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201711242391.8A
Other languages
English (en)
Other versions
CN107992821A (zh
Inventor
王鹏
周敏华
王莉娟
赵伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ningxia Hengxinrong Network Technology Co ltd
Original Assignee
Ningxia Hengxinrong Network Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ningxia Hengxinrong Network Technology Co ltd filed Critical Ningxia Hengxinrong Network Technology Co ltd
Priority to CN201711242391.8A priority Critical patent/CN107992821B/zh
Publication of CN107992821A publication Critical patent/CN107992821A/zh
Application granted granted Critical
Publication of CN107992821B publication Critical patent/CN107992821B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/94Hardware or software architectures specially adapted for image or video understanding

Landscapes

  • Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)

Abstract

本申请实施例公开了一种图像识别方法及***,基于深度神经网络前向计算:对输入图像进行的缩放因子进行划分,所述缩放因子根据所述输入图像的图像信息确定,所述图像信息包括所述输入图像的分辨率和所述输入图像所在的平面空间范围;根据划分后的缩放因子对所述输入图像进行尺度变换;构建网络内存池,所述网络内存池包括多个固定大小的内存块,每个内存块包含同等数量和大小的内存单元;将尺度变换后的图像信息输入到所述网络内存池进行处理。通过将原始的图像进行转换,将转换后的图像输入到网络进行处理,通过构建网络内存池,根据图像数据处理的需要对网络内存池中的内存块可进行获取或释放,从而提高了内存利用率,加快了图像处理的速度。

Description

一种图像识别方法及***
技术领域
本申请涉及图像识别技术领域,尤其涉及一种图像识别方法及***。
背景技术
图像识别,是指利用计算机对图像进行处理、分析和理解,以识别各种不同模式的目标和对像的技术。图像识别是人工智能的一个重要领域。目前主要的图像识别方法有基于神经网络的图像识别方法、基于小波矩的图像识别方法等。图像识别方法中的人脸自动检测方式,能够在安防***中,很方便地为人的身份(黑、白名单)、性别年龄等属性进行识别的模块提高准确性。
传统的图像识别方法,主要是基于人工设计的特征,计算量相对较少,识别速度较快。但是传统的图像识别方法由于特征设计的不完备从而导致图像识别准确率较低。而基于深度神经网络的图像识别方法,虽然可以提高图像识别的准确率,但是由于基于深度神经网络的图像识别方法计算量较大,使得在CPU上的运行速度慢。
现有的对于深度神经网络的图像识别方法优化方法大部分都是在网络模型的参数训练上的优化,比如分布式参数服务器的训练带宽占用优化、训练速度的优化、网络模型优化等等,而在实际应用中只涉及前向计算,传统的基本上是调用一些开源的深度学习框架,没有考虑资源的问题,直接在GPU上运行。
发明内容
本申请提供了一种图像识别方法及***,以解决传统的深度神经网络前向计算的图像识别方法复杂,处理速度慢的问题。
为了解决上述技术问题,本申请实施例公开了如下技术方案:
一种图像识别方法,基于深度神经网络前向计算,所述方法包括:对输入图像的缩放因子进行划分,所述缩放因子根据所述输入图像的图像信息确定,所述图像信息包括所述输入图像的分辨率和所述输入图像所在的平面空间范围;根据划分后的缩放因子对所述输入图像进行尺度变换;构建网络内存池,所述网络内存池包括多个固定大小的内存块,每个内存块包含同等数量和大小的内存单元;将尺度变换后的图像信息输入到所述网络内存池进行处理。
可选地,所述对输入图像的缩放因子进行划分,包括:根据所述输入图像的图像信息获取所述输入图像的分辨率和所述输入图像所在的平面空间范围;根据所述输入图像的分辨率将所述输入图像所在的平面空间范围按照预设坐标轴的x和y方向分别进行划分;确定划分后每个区间对应的区间系数;根据所述区间系数确定每个区间的缩放因子。
可选地,所述根据划分后的缩放因子对所述输入图像进行尺度变换,包括:根据所述区间系数和所述输入图像的图像信息预获取变换后的图像信息;根据所述预获取变换后的图像信息对所述输入图像进行双线性插值处理。
可选地,所述构建网络内存池,包括:获取网络内存的存储空间信息;将所述存储空间信息按照第一预设长度进行划分为多个内存块,每个内存块配置内存块头信息,所述内存块头信息用于标记当前内存池的存储空间信息;将每个内存块按照第二预设长度划分为多个内存池单元。
可选地,所述将尺度变换后的图像信息输入到所述网络内存池进行处理,包括:根据输入的图像信息从所述内存池中请求需要的内存块;当所述输入的图像信息不断扩大时,请求获取新的内存块。
可选地,任一内存块使用完毕后,释放对应内存块的占用,并将对应内存块单元的内存块头信息进行标记。
可选地,遍历所有内存块头信息,根据所述内存块头信息获取空闲的内存块。
可选地,如果当前图像信息处理任务处于多线程模式,则每个线程请求不同的内存块。
可选地,当深度神经网络为级联状态且存在大量的图像信息等待处理,则按照深度神经网络的级联数划分对应滤波器,每个滤波器对应一个深度神经网络。
一种图像识别***,基于深度神经网络前向计算,所述***包括:划分单元,用于对输入图像的缩放因子进行划分,所述缩放因子根据所述输入图像的图像信息确定,所述图像信息包括所述输入图像的分辨率和所述输入图像所在的平面空间范围;图像尺度变化单元,用于与根据划分后的缩放因子对所述输入图像进行尺度变换;网络内存池构建单元,用于构建网络内存池,所述网络内存池包括多个固定大小的内存块,每个内存块包含同等数量和大小的内存单元;图像处理单元,用于将尺度变换后的图像信息输入到所述网络内存池进行处理。
由上述技术方案可见,本申请实施例提供的一种图像识别方法和***,基于深度神经网络前向计算包括:对输入图像的缩放因子进行划分,所述缩放因子根据所述输入图像的图像信息确定,所述图像信息包括所述输入图像的分辨率和所述输入图像所在的平面空间范围;根据划分后的缩放因子对所述输入图像进行尺度变换;构建网络内存池,所述网络内存池包括多个固定大小的内存块,每个内存块包含同等数量和大小的内存单元;将尺度变换后的图像信息输入到所述网络内存池进行处理。通过将原始的图像进行转换,将转换后的图像输入到网络进行处理,通过构建网络内存池,根据图像数据处理的需要对网络内存池中的内存块可进行获取或释放,从而提高了内存利用率,加快了图像处理的速度。
附图说明
为了更清楚地说明本申请的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本申请提供的基于深度神经网络前向计算的图像识别方法的一个实施例的流程示意图;
图2为本申请提供的网络内存池的一个实施例的结构示意图;
图3为本申请提供的多个图像并行处理的一个实施例的示意图;
图4为本申请提供的基于深度神经网络前向计算的图像识别***的一个实施例的结构示意图。
具体实施方式
下面结合附图对本申请进行详细说明。
参见图1为本申请提供的基于深度神经网络前向计算的图像识别方法的一个实施例的流程示意图,如图1所示,所述方法包括:
S101,对输入图像的缩放因子进行划分,所述缩放因子根据所述输入图像的图像信息确定,所述图像信息包括所述输入图像的分辨率和所述输入图像所在的平面空间范围。
具体地,根据所述输入图像的图像信息获取所述输入图像的分辨率和所述输入图像所在的平面空间范围。根据所述输入图像的分辨率将所述输入图像所在的平面空间范围按照预设坐标轴的x和y方向分别进行划分,确定划分后每个区间对应的区间系数,根据所述区间系数确定每个区间的缩放因子。
不妨设输入的图像信息为
Figure DEST_PATH_IMAGE001
,图像大小为
Figure DEST_PATH_IMAGE002
,所在的平面空间为
Figure DEST_PATH_IMAGE003
。对
Figure DEST_PATH_IMAGE004
方向划分为
Figure DEST_PATH_IMAGE005
,区间对应的系数为
Figure DEST_PATH_IMAGE006
;同时对
Figure DEST_PATH_IMAGE007
方向划分为
Figure DEST_PATH_IMAGE008
,区间对应的系数分别为
Figure DEST_PATH_IMAGE009
;因此,分辨率
Figure DEST_PATH_IMAGE010
可以得到对应的图像尺度因子,这里不妨设尺度因子为
Figure DEST_PATH_IMAGE011
S102,根据划分后的缩放因子对所述输入图像进行尺度变换。根据所述区间系数和所述输入图像的图像信息预获取变换后的图像信息;根据所述预获取变换后的图像信息对所述输入图像进行双线性插值处理。
设变换后的图像的信息为
Figure DEST_PATH_IMAGE012
,已知点
Figure DEST_PATH_IMAGE013
在原始图像
Figure DEST_PATH_IMAGE014
的四个点
Figure DEST_PATH_IMAGE015
的值分别为
Figure DEST_PATH_IMAGE016
,对原始图像进行双线性插值,计算公式如下:
Figure DEST_PATH_IMAGE017
Figure DEST_PATH_IMAGE018
, (1)
Figure DEST_PATH_IMAGE019
, (2)
Figure DEST_PATH_IMAGE020
, (3)
Figure DEST_PATH_IMAGE021
, (4)
经过图像预处理后,得到一张合适的检测图像;深度神经网络的前向计算中包含大量的数据交换过程,如果每次都用***自动的内存分配函数进行分配及其释放,必然导致大量的内存堆碎片,会使得***随着时间的推移,机器是处理速度越来越慢,因此,这里需要设计一个内存池解决内存碎片、内存利用率的问题。
S103,构建网络内存池,所述网络内存池包括多个固定大小的内存块,每个内存块包含同等数量和大小的内存单元。获取网络内存的存储空间信息;将所述存储空间信息按照第一预设长度进行划分为多个内存块,每个内存块配置内存块头信息,所述内存块头信息用于标记当前内存块的存储空间信息;将每个内存块按照第二预设长度划分为多个内存池单元。
本申请构建的网络内存池采用固定内存池;它由一系列固定大小的内存块组成,每一个内存块又包含了固定数量和大小的内存单元。如图2所示,该内存池一共包含5个内存块。根据网络内存单存储信息,将5个内存块分配同等的长度,而且每个内存块都设置有内存块头信息。针对第3个内存块分析,它由内存池块头信息和3个大小相等的内存池单元构成。上述仅是示意性的,实际中网络内存池可以包含更多的内存块,每个内存块也可以包含更多的内存池单元。
S104,将尺度变换后的图像信息输入到所述网络内存池进行处理。根据输入的图像信息从所述内存池中请求需要的内存块;当所述输入的图像信息不断扩大时,请求获取新的内存块。
在程序的初始化阶段,它只向***申请了一个内存块。随后,随着网络对内存的不断需求,内存池在判断需要动态扩大时,才再次向***申请新的内存块。因大小是固定,所以分配的速度比较快,这样对应网络的性能是有提高的。例如图2中内存块1、2、4、5是空闲的,内存块3已经分配。当需要分配新的内存块时,只需遍历所有的内存池块头信息,根据所述内存块头信息快速定位到空闲单元的那个内存池块。任一内存块使用完毕后,释放对应内存块的占用,并将对应内存块单元的内存块头信息进行标记,对应的内存块头信息中标记置为空闲状态。
一张图像图像进行多尺度的深度神经网络算法检测,这些图像共用着相同的网络结构,因此,需要让这些不同尺度的多张图像在同一时刻下,进行处理。如果当前图像信息处理任务处于多线程模式,则每个线程请求不同的内存块。如图3所示,设置出当前处理任务在几颗核下进行网络前向计算处理;这个步骤中的网络计算启动时,每个尺度图像在对应的核中处理,与其他尺度的处理互相不干扰。
当深度神经网络为级联的情况下(端对端网络可以说是级联网络的特例),在大量提交的图像、视频序列进行检测的任务中,需要使用软件流水线按照网络的级联数划分为对应数目的Filter,每个Filter为对应的一个深度神经网络,这样当一张图像在某个Filter处理时,不影响其他图像在其他Filter上的处理。
从上述实施例可以看出,本实施例提供的一种图像识别方法和***,基于深度神经网络前向计算包括:对输入图像的缩放因子进行划分,所述缩放因子根据所述输入图像的图像信息确定,所述图像信息包括所述输入图像的分辨率和所述输入图像所在的平面空间范围;根据划分后的缩放因子对所述输入图像进行尺度变换;构建网络内存池,所述网络内存池包括多个固定大小的内存块,每个内存块包含同等数量和大小的内存单元;将尺度变换后的图像信息输入到所述网络内存池进行处理。通过将原始的图像进行转换,将转换后的图像输入到网络进行处理,通过构建网络内存池,根据图像数据处理的需要对网络内存池中的内存块可进行获取或释放,从而提高了内存利用率,加快了图像处理的速度。
与上述实施例提供的一种配电网对地参数测量方法相对应,本申请实施例还提供了一种基于深度神经网络前向计算的图像识别***。如图4所示,所述***包括:划分单元201、图像尺度变化单元202、网络内存池构建单元203和图像处理单元204。
所述划分单元201,用于对输入图像的缩放因子进行划分,所述缩放因子根据所述输入图像的图像信息确定,所述图像信息包括所述输入图像的分辨率和所述输入图像所在的平面空间范围。所述图像尺度变化单元202,用于与根据划分后的缩放因子对所述输入图像进行尺度变换。所述网络内存池构建单元203,用于构建网络内存池,所述网络内存池包括多个固定大小的内存块,每个内存块包含同等数量和大小的内存单元。所述图像处理单元204,用于将尺度变换后的图像信息输入到所述网络内存池进行处理。
本实施例提供的一种具体实现中,本申请还提供一种计算机存储介质,其中,该计算机存储介质可存储有程序,该程序执行时可包括本申请提供的呼叫方法的各实施例中的部分或全部步骤。所述的存储介质可为磁碟、光盘、只读存储记忆体(英文:read-onlymemory,简称:ROM)或随机存储记忆体(英文:random access memory,简称:RAM)等。
本领域的技术人员可以清楚地了解到本申请实施例中的技术可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本申请实施例中的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例或者实施例的某些部分所述的方法。
本说明书中各个实施例之间相同相似的部分互相参见即可。尤其,对于***实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例中的说明即可。
以上所述的本申请实施方式并不构成对本申请保护范围的限定。

Claims (6)

1.一种图像识别方法,基于深度神经网络前向计算,其特征在于,所述方法包括:
对输入图像的缩放因子进行划分,所述缩放因子根据所述输入图像的图像信息确定,所述图像信息包括所述输入图像的分辨率和所述输入图像所在的平面空间范围;
根据划分后的缩放因子对所述输入图像进行尺度变换;
构建网络内存池,所述网络内存池包括多个固定大小的内存块,每个内存块包含同等数量和大小的内存单元;
将尺度变换后的图像信息输入到所述网络内存池进行处理;
所述构建网络内存池,包括:
获取网络内存的存储空间信息;
将所述存储空间信息按照第一预设长度进行划分为多个内存块,每个内存块配置内存块头信息,所述内存块头信息用于标记当前内存池的存储空间信息;
将每个内存块按照第二预设长度划分为多个内存池单元;
所述将尺度变换后的图像信息输入到所述网络内存池进行处理,包括:
根据输入的图像信息从所述内存池中请求需要的内存块;
当所述输入的图像信息不断扩大时,遍历所有内存块头信息,根据所述内存块头信息获取空闲的内存块;
其中,任一内存块使用完毕后,释放对应内存块的占用,并将对应内存块单元的内存块头信息进行标记。
2.根据权利要求1所述的图像识别方法,其特征在于,所述对输入图像的缩放因子进行划分,包括:
根据所述输入图像的图像信息获取所述输入图像的分辨率和所述输入图像所在的平面空间范围;
根据所述输入图像的分辨率将所述输入图像所在的平面空间范围按照预设坐标轴的x和y方向分别进行划分;
确定划分后每个区间对应的区间系数;
根据所述区间系数确定每个区间的缩放因子。
3.根据权利要求2所述的图像识别方法,其特征在于,所述根据划分后的缩放因子对所述输入图像进行尺度变换,包括:
根据所述区间系数和所述输入图像的图像信息预获取变换后的图像信息;
根据所述预获取变换后的图像信息对所述输入图像进行双线性插值处理。
4.根据权利要求1所述的图像识别方法,其特征在于,如果当前图像信息处理任务处于多线程模式,则每个线程请求不同的内存块。
5.根据权利要求4所述的图像识别方法,其特征在于,当深度神经网络为级联状态且存在大量的图像信息等待处理,则按照深度神经网络的级联数划分对应滤波器,每个滤波器对应一个深度神经网络。
6.一种图像识别***,基于深度神经网络前向计算,其特征在于,所述***包括:
划分单元,用于对输入图像的缩放因子进行划分,所述缩放因子根据所述输入图像的图像信息确定,所述图像信息包括所述输入图像的分辨率和所述输入图像所在的平面空间范围;
图像尺度变化单元,用于根据划分后的缩放因子对所述输入图像进行尺度变换;
网络内存池构建单元,用于构建网络内存池,所述网络内存池包括多个固定大小的内存块,每个内存块包含同等数量和大小的内存单元;
所述构建网络内存池,包括:
获取网络内存的存储空间信息;
将所述存储空间信息按照第一预设长度进行划分为多个内存块,每个内存块配置内存块头信息,所述内存块头信息用于标记当前内存池的存储空间信息;
将每个内存块按照第二预设长度划分为多个内存池单元;
图像处理单元,用于将尺度变换后的图像信息输入到所述网络内存池进行处理;
所述将尺度变换后的图像信息输入到所述网络内存池进行处理,包括:
根据输入的图像信息从所述内存池中请求需要的内存块;
当所述输入的图像信息不断扩大时,遍历所有内存块头信息,根据所述内存块头信息获取空闲的内存块;
其中,任一内存块使用完毕后,释放对应内存块的占用,并将对应内存块单元的内存块头信息进行标记。
CN201711242391.8A 2017-11-30 2017-11-30 一种图像识别方法及*** Expired - Fee Related CN107992821B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711242391.8A CN107992821B (zh) 2017-11-30 2017-11-30 一种图像识别方法及***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711242391.8A CN107992821B (zh) 2017-11-30 2017-11-30 一种图像识别方法及***

Publications (2)

Publication Number Publication Date
CN107992821A CN107992821A (zh) 2018-05-04
CN107992821B true CN107992821B (zh) 2021-12-03

Family

ID=62034860

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711242391.8A Expired - Fee Related CN107992821B (zh) 2017-11-30 2017-11-30 一种图像识别方法及***

Country Status (1)

Country Link
CN (1) CN107992821B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111314650B (zh) * 2018-12-11 2021-04-20 浙江宇视科技有限公司 图像显示方法及装置
CN109815162A (zh) * 2019-01-28 2019-05-28 Oppo广东移动通信有限公司 内存管理方法、装置、移动终端及存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0775972A2 (en) * 1995-11-27 1997-05-28 Canon Kabushiki Kaisha Digital image processor comprising a neural network
CN101478643A (zh) * 2009-01-08 2009-07-08 华中科技大学 数据采集的方法及***
CN105551036A (zh) * 2015-12-10 2016-05-04 中国科学院深圳先进技术研究院 一种深度学习网络的训练方法和装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0775972A2 (en) * 1995-11-27 1997-05-28 Canon Kabushiki Kaisha Digital image processor comprising a neural network
CN101478643A (zh) * 2009-01-08 2009-07-08 华中科技大学 数据采集的方法及***
CN105551036A (zh) * 2015-12-10 2016-05-04 中国科学院深圳先进技术研究院 一种深度学习网络的训练方法和装置

Also Published As

Publication number Publication date
CN107992821A (zh) 2018-05-04

Similar Documents

Publication Publication Date Title
CN109993299B (zh) 数据训练方法及装置、存储介质、电子装置
US20140355899A1 (en) Video enhancement using related content
CN111260037B (zh) 图像数据的卷积运算方法、装置、电子设备及存储介质
CN111914908B (zh) 一种图像识别模型训练方法、图像识别方法及相关设备
WO2023116632A1 (zh) 基于时空记忆信息的视频实例分割方法和分割装置
WO2022152104A1 (zh) 动作识别模型的训练方法及装置、动作识别方法及装置
WO2023050651A1 (zh) 图像语义分割方法、装置、设备及存储介质
CN113892113A (zh) 一种人体姿态估计方法及装置
CN107992821B (zh) 一种图像识别方法及***
CN111008631A (zh) 图像的关联方法及装置、存储介质和电子装置
CN111444807A (zh) 目标检测方法、装置、电子设备和计算机可读介质
CN111523642B (zh) 用于卷积运算的数据重用方法、运算方法及装置、芯片
CN110956131A (zh) 单目标追踪方法、装置及***
US20140355959A1 (en) Multi-frame patch correspondence identification in video
CN108520532B (zh) 识别视频中物体运动方向的方法及装置
CN107977980B (zh) 一种目标跟踪方法、设备以及可读介质
CN110619624B (zh) 一种图像分解方法及装置
CN116468967B (zh) 样本图像筛选方法、装置、电子设备及存储介质
CN112614108A (zh) 基于深度学习检测甲状腺超声图像中结节的方法和装置
CN112668639A (zh) 一种模型训练方法、装置、服务器及存储介质
CN114820755B (zh) 一种深度图估计方法及***
CN110781223A (zh) 数据处理方法及装置、处理器、电子设备及存储介质
CN111753722B (zh) 一种基于特征点类型的指纹识别方法及装置
CN113887535A (zh) 模型训练方法、文本识别方法、装置、设备和介质
CN114283046A (zh) 基于icp算法的点云文件配准方法、装置及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20211203