CN108197613A - 一种基于深度卷积级联网络的人脸检测优化算法 - Google Patents
一种基于深度卷积级联网络的人脸检测优化算法 Download PDFInfo
- Publication number
- CN108197613A CN108197613A CN201810146901.XA CN201810146901A CN108197613A CN 108197613 A CN108197613 A CN 108197613A CN 201810146901 A CN201810146901 A CN 201810146901A CN 108197613 A CN108197613 A CN 108197613A
- Authority
- CN
- China
- Prior art keywords
- hot
- zone
- face
- depth
- region
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/161—Detection; Localisation; Normalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- Biomedical Technology (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Biophysics (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Computational Linguistics (AREA)
- Artificial Intelligence (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Oral & Maxillofacial Surgery (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
Abstract
本发明提供了一种基于深度卷积级联网络的人脸检测优化算法,具体包括如下步骤:利用深度级联网络检测出人脸可能出现的区域,也就是热区;对热区进行更新,将不在热区内的区域全部置零;把得到的整图进行数据稀疏压缩。本发明在很大程度上减少了冗余的运算量,提高了算法的运行效率。使CNN网络人脸检测算法在前端嵌入式平台上效率能提升20~30%,而且本发明的方法不会损失检测精度,为深度卷积网络在前端更快的运行提供了较好的一个解决方案,为后期网络的规模运用奠定了基础。
Description
技术领域
本发明属于自动检测技术领域,尤其是涉及一种基于深度卷积级联网络的人脸检测优化算法。
背景技术
随着深度学习技术的飞速发展,在目标检测及识别等领域都取得了很大的突破.宽而深的网络带来了较好的效果,但计算量也大得惊人,如何才能使得CNN网络能在嵌入式上运行是目前面临的一个问题。
解决此问题一般的做法是
1、设计更轻的CNN网络来减少计算量,但小的网络一般都是以牺牲精度为代价。
2、根据不同的嵌入式平台采用特有的指令来进行加速,编写调试费时费力。
3、选用带有CNN网络的硬核来实现,效率虽然不是问题,但成本相对较高。
发明内容
有鉴于此,本发明旨在提出一种基于深度卷积级联网络的人脸检测优化算法,以减少冗余计算量,提高检测率。
为达到上述目的,本发明的技术方案是这样实现的:
一种基于深度卷积级联网络的人脸检测优化算法,具体包括如下步骤:
(1)利用深度级联网络检测出人脸可能出现的区域,也就是热区;
(2)对热区进行更新,将不在热区内的区域全部置零;
(3)把得到的整图进行数据稀疏压缩。
进一步的,所述步骤(1)具体包括如下步骤:
(11)采用深度级联网络,利用第一层深度网络快速确定目标的疑似区域;
(12)金字塔类脸区域进行填充,干扰区域清零,并对填充图进行扩张;
(13)将填充后的人脸热区和原图相与,得出最终送入后续网络的人脸热区map。
进一步的,所述步骤(2)具体包括步骤:
(21)根据视频的帧号将处理帧分为奇偶两个处理分支;
(22)对奇数帧进行全图检测同时生成热区map,并将生成的热区传给偶数帧处理分支;
(23)偶数帧处理分支对热区map进行数据稀疏处理,送入CNN网络进行运算。
进一步的,所诉步骤(3)具体包括如下步骤:
(31)将金字塔图像和对应的热度图按像素相与,将非人脸区域全部归0;
(32)将生成的图转化为稀疏矩阵。
相对于现有技术,本发明所述的一种基于深度卷积级联网络的人脸检测优化算法具有以下优势:
本发明在很大程度上减少了冗余的运算量,提高了算法的运行效率。使CNN网络人脸检测算法在前端嵌入式平台上效率能提升20~30%,而且本发明的方法不会损失检测精度,为深度卷积网络在前端更快的运行提供了较好的一个解决方案,为后期网络的规模运用奠定了基础。
附图说明
构成本发明的一部分的附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1为本发明实施例所述的一种基于深度卷积级联网络的人脸检测优化算法的示意图;
图2为本发明实施例所述的人脸定位的深度网络模型结构示意图;
图3为本发明实施例所述的图像数据稀疏示意图。
具体实施方式
需要说明的是,在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。
下面将参考附图并结合实施例来详细说明本发明。
如图1所示,本发明提出一种基于深度卷积级联网络的人脸检测优化算法,在很大程度上大大减少了冗余计算量,提高了检测率。本发明的技术方案主要分人脸热区计算、更新及数据稀疏三个大的方面来实现。由第一层深度网络快速检测出人脸可能出现的区域即热区,并根据上述流程的方法,对热区进行更新,将不在热区内的区域全部置零,并把得到的整图进行数据稀疏压缩,减少后续网络的数据计算量.
1、热区计算:
由于采用的是深度级联网络,前层网络的作用是快速检测出类似人脸的区域,后续网络进行去除伪目标,校正目标位置。本发明正是采用了前层网络的这个特点,将热区计算分为三个步骤来实现,具体如下:
1)利用第一层深度网络快速确定目标的疑似区域,即热区。
图2为对于输入为12*12大小的3通道图像的人脸定位的深度网络模型结构,其中Conv表示卷积核得大小,MP表示卷积核移动步长,face classification表示输入的12*12大小的图像块是否是人脸,bounding box regression表示网络回归出的人脸的具***置。
以12*12作为基本单元对输入图像进行扫描,来判别每个位置是否为人脸,并回归得出模板大小人脸的坐标位置,设定一定的系数(可根据实际需要自行定义,一般在0.6~0.99之间均可,数值越大,金字塔层数越多)将图像作金字塔变换,这样可使得图像中任意大小的人脸都能遍历到模板尺度,从而实现了多尺度人脸的检测,在代码实现过程中,可采用全卷积的模式,使得计算更简单。
2)金字塔类脸区域进行填充,干扰区域清零,并对填充图进行扩张,避免由于目标运动造成的漏检。具体步骤为将face classification为1的bounding box所在的金字塔图像,进行bounding box填充,其余位置清零,为了避免目标运动造成的位置偏差,将填充图进行扩张,一般保持中心不变,填充宽高变为原bounding box的2倍既可.
3)将填充后的人脸热区和原图相与,得出最终送入后续网络的人脸热区map。
2、热区更新。
由于场景中的目标是不断运动的,且不时会有新的目标出现,为了防止发生漏检测,本发明采取了热区更新算法,对出现人脸的疑似区域进行实时更新。具体步骤如下:
1)根据视频的帧号将处理帧分为奇偶两个处理分支。
2)对奇数帧进行全图检测同时生成热区map。并将生成的热区传给偶数帧处理分支。
3)偶数帧处理分支对热区map进行数据稀疏处理,后送入CNN网络进行运算。
3、图像数据稀疏
稀疏矩阵向量乘法可在很多情况下代替稠密矩阵运算,可以大量节省内存占用,减少计算开销。矩阵向量乘法不同于矩阵和矩阵的乘法,这是完全访存密集型的计算,我们主要的优化方向是提升访存效率或减少访存开销。
其中图像数据稀疏可通过下面的示例来说明如图3所示,这里我们以三元组表示方法来表示稀疏矩阵为例,上边的稀疏矩阵可以表示为:((1,4,22),(1,7,15),(2,2,11),(3,4,-6),(4,6,39),(6,3,28))。用三元组表表示的稀疏矩阵不仅节约了空间,而且使得矩阵某些运算的时间比经典算法还少。当然稀疏矩阵的方法还有很多,可根据实际情况选择更快更好的矩阵稀疏方法。
本发明的图像数据稀疏主要有下面几步:
1)将金字塔图像和对应的热度图按像素相与,将非人脸区域全部归0。
2)并将生成的图转化为稀疏矩阵。
3)采用线性运算库,直接把稠密矩阵转换为稀疏矩阵,用于,神经网络卷积计算.其定义转换格式如下;
采用Eigen语法定义动态浮点型矩阵:并调用类函授进行稀疏转换。
Eigen::Map<const Eigen::Matrix<float,Eigen::Dynamic,Eigen::Dynamic,Eigen::RowMajor>>mat_b(B,mat_b_row,mat_b_col);
mat_b.sparseView(0.3f)
4)CNN卷积层采用稀疏矩阵进行卷积运算,提高运算效率,这也是本方案提高效率的关键点之一。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (4)
1.一种基于深度卷积级联网络的人脸检测优化算法,其特征在于:具体包括如下步骤:
(1)利用深度级联网络检测出人脸可能出现的区域,也就是热区;
(2)对热区进行更新,将不在热区内的区域全部置零;
(3)把得到的整图进行数据稀疏压缩。
2.根据权利要求1所述的一种基于深度卷积级联网络的人脸检测优化算法,其特征在于:所述步骤(1)具体包括如下步骤:
(11)采用深度级联网络,利用第一层深度网络快速确定目标的疑似区域;
(12)金字塔类脸区域进行填充,干扰区域清零,并对填充图进行扩张;
(13)将填充后的人脸热区和原图相与,得出最终送入后续网络的人脸热区map。
3.根据权利要求1所述的一种基于深度卷积级联网络的人脸检测优化算法,其特征在于:所述步骤(2)具体包括步骤:
(21)根据视频的帧号将处理帧分为奇偶两个处理分支;
(22)对奇数帧进行全图检测同时生成热区map,并将生成的热区传给偶数帧处理分支;
(23)偶数帧处理分支对热区map进行数据稀疏处理,送入CNN网络进行运算。
4.根据权利要求1所述的一种基于深度卷积级联网络的人脸检测优化算法,其特征在于:所诉步骤(3)具体包括如下步骤:
(31)将金字塔图像和对应的热度图按像素相与,将非人脸区域全部归0;
(32)将生成的图转化为稀疏矩阵。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810146901.XA CN108197613B (zh) | 2018-02-12 | 2018-02-12 | 一种基于深度卷积级联网络的人脸检测优化方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810146901.XA CN108197613B (zh) | 2018-02-12 | 2018-02-12 | 一种基于深度卷积级联网络的人脸检测优化方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108197613A true CN108197613A (zh) | 2018-06-22 |
CN108197613B CN108197613B (zh) | 2022-02-08 |
Family
ID=62593312
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810146901.XA Active CN108197613B (zh) | 2018-02-12 | 2018-02-12 | 一种基于深度卷积级联网络的人脸检测优化方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108197613B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109446964A (zh) * | 2018-10-19 | 2019-03-08 | 天津天地伟业投资管理有限公司 | 基于端到端单级多尺度检测器的面部检测分析方法及装置 |
CN109711322A (zh) * | 2018-12-24 | 2019-05-03 | 天津天地伟业信息***集成有限公司 | 一种基于rfcn的人车分离方法 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20030043922A1 (en) * | 2001-08-24 | 2003-03-06 | Kalker Antonius Adrianus Cornelis Maria | Adding fields of a video frame |
CN1924894A (zh) * | 2006-09-27 | 2007-03-07 | 北京中星微电子有限公司 | 多姿态人脸检测与追踪***及方法 |
CN104361363A (zh) * | 2014-11-25 | 2015-02-18 | 中国科学院自动化研究所 | 深度反卷积特征学习网络、生成方法及图像分类方法 |
CN106650682A (zh) * | 2016-12-29 | 2017-05-10 | Tcl集团股份有限公司 | 一种人脸追踪的方法及装置 |
US20170132496A1 (en) * | 2015-11-05 | 2017-05-11 | Microsoft Technology Licensing, Llc | Hardware-efficient deep convolutional neural networks |
CN107292272A (zh) * | 2017-06-27 | 2017-10-24 | 广东工业大学 | 一种在实时传输的视频中人脸识别的方法及*** |
CN107492115A (zh) * | 2017-08-30 | 2017-12-19 | 北京小米移动软件有限公司 | 目标对象的检测方法及装置 |
-
2018
- 2018-02-12 CN CN201810146901.XA patent/CN108197613B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20030043922A1 (en) * | 2001-08-24 | 2003-03-06 | Kalker Antonius Adrianus Cornelis Maria | Adding fields of a video frame |
CN1924894A (zh) * | 2006-09-27 | 2007-03-07 | 北京中星微电子有限公司 | 多姿态人脸检测与追踪***及方法 |
CN104361363A (zh) * | 2014-11-25 | 2015-02-18 | 中国科学院自动化研究所 | 深度反卷积特征学习网络、生成方法及图像分类方法 |
US20170132496A1 (en) * | 2015-11-05 | 2017-05-11 | Microsoft Technology Licensing, Llc | Hardware-efficient deep convolutional neural networks |
CN106650682A (zh) * | 2016-12-29 | 2017-05-10 | Tcl集团股份有限公司 | 一种人脸追踪的方法及装置 |
CN107292272A (zh) * | 2017-06-27 | 2017-10-24 | 广东工业大学 | 一种在实时传输的视频中人脸识别的方法及*** |
CN107492115A (zh) * | 2017-08-30 | 2017-12-19 | 北京小米移动软件有限公司 | 目标对象的检测方法及装置 |
Non-Patent Citations (4)
Title |
---|
AI之路: "《MTCNN算法和代码笔记》", 26 December 2017 * |
HANG CUI ET AL.: "A Code Selection Mechanism Using Deep Learning", 《2016 IEEE 10TH INTERNATIONAL SYMPOSIUM ON EMBEDDED MULTICORE/MANY-CORE SYSTEMS-ON-CHIP》 * |
刘文志: "《并行编程方法与优化实现》", 30 June 2015, 机械工业出版社 * |
蔡慧苹等: "基于word embedding 和 CNN的情感分类模型", 《计算机应用研究》 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109446964A (zh) * | 2018-10-19 | 2019-03-08 | 天津天地伟业投资管理有限公司 | 基于端到端单级多尺度检测器的面部检测分析方法及装置 |
CN109711322A (zh) * | 2018-12-24 | 2019-05-03 | 天津天地伟业信息***集成有限公司 | 一种基于rfcn的人车分离方法 |
Also Published As
Publication number | Publication date |
---|---|
CN108197613B (zh) | 2022-02-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10048226B2 (en) | Imaging method and apparatus based on magnetic flux leakage testing | |
CN102565810B (zh) | 一种遥感影像上土地利用地物边界轮廓提取方法 | |
CN110659664B (zh) | 一种基于ssd的高精度识别小物体的方法 | |
CN101027679B (zh) | 表达通用的二维空间变换的***和方法 | |
CN106600553A (zh) | 一种基于卷积神经网络的dem超分辨率方法 | |
CN101750606B (zh) | 自动和稳健的卫星遥感影像正射校正方法 | |
CN104067296A (zh) | 一维信号抽取的方法和装置 | |
CN109977952A (zh) | 基于局部最大值的候选目标检测方法 | |
CN110415304B (zh) | 一种视觉标定方法及*** | |
CN111724465B (zh) | 基于平面约束优选虚拟控制点的卫星影像平差方法及装置 | |
CN105678757A (zh) | 一种物***移测量方法 | |
CN108197613A (zh) | 一种基于深度卷积级联网络的人脸检测优化算法 | |
CN104809724A (zh) | 多波段遥感影像的自动精配准方法 | |
CN109709551A (zh) | 一种星载合成孔径雷达影像的区域网平面平差方法 | |
CN103218827A (zh) | 基于形状传递联合分割和图匹配校正的轮廓跟踪方法 | |
Liu et al. | Large-scale lidar consistent mapping using hierarchical lidar bundle adjustment | |
CN116091724A (zh) | 一种建筑数字孪生建模方法 | |
CN106683084B (zh) | 一种基于行间像偏移估计的tdi图像形变程度客观评价方法 | |
CN106875403A (zh) | 一种用于空中加油的仿鹰眼视觉运动目标检测方法 | |
CN110634149B (zh) | 一种用于光学动作捕捉***的非刚体目标特征点匹配方法 | |
US20190213753A1 (en) | Three-dimensional measurement apparatus and three-dimensional measurement method | |
CN109345551A (zh) | 图像外轮廓中凹包络的检测方法、***及计算机存储介质 | |
CN104200525B (zh) | 基于挤压物体图像的三维建模方法及*** | |
CN111652976B (zh) | 基于dem栅格数据的通视分析方法 | |
CN104484404B (zh) | 一种改善分布式文件***中地理栅格数据文件处理方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
TA01 | Transfer of patent application right | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20220114 Address after: No.8, Haitai Huake 2nd Road, Huayuan Industrial Zone, Binhai New Area, Tianjin, 300450 Applicant after: TIANDY TECHNOLOGIES Co.,Ltd. Address before: Room A310, building 4, No.8, Haitai Huake 2nd Road, Huayuan Industrial Zone, Binhai New Area, Tianjin, 300384 Applicant before: TIANJIN TIANDY INFORMATION SYSTEMS INTEGRATION Co.,Ltd. |
|
GR01 | Patent grant | ||
GR01 | Patent grant |