CN110458005A - 一种基于多任务渐进配准网络的旋转不变人脸检测方法 - Google Patents

一种基于多任务渐进配准网络的旋转不变人脸检测方法 Download PDF

Info

Publication number
CN110458005A
CN110458005A CN201910590187.8A CN201910590187A CN110458005A CN 110458005 A CN110458005 A CN 110458005A CN 201910590187 A CN201910590187 A CN 201910590187A CN 110458005 A CN110458005 A CN 110458005A
Authority
CN
China
Prior art keywords
face
image
layer
rotation angle
multitask
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910590187.8A
Other languages
English (en)
Other versions
CN110458005B (zh
Inventor
周丽芳
谷雨
雷帮军
李伟生
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chongqing University of Post and Telecommunications
Original Assignee
Chongqing University of Post and Telecommunications
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chongqing University of Post and Telecommunications filed Critical Chongqing University of Post and Telecommunications
Priority to CN201910590187.8A priority Critical patent/CN110458005B/zh
Publication of CN110458005A publication Critical patent/CN110458005A/zh
Application granted granted Critical
Publication of CN110458005B publication Critical patent/CN110458005B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/161Detection; Localisation; Normalisation
    • G06V40/165Detection; Localisation; Normalisation using facial parts and geometric relationships
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/172Classification, e.g. identification

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • Evolutionary Computation (AREA)
  • Computational Linguistics (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Biophysics (AREA)
  • Multimedia (AREA)
  • Human Computer Interaction (AREA)
  • Computing Systems (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Geometry (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)

Abstract

本发明公开了一种基于多任务渐进配准网络的旋转不变人脸检测方法,属于计算机视觉领域。所述方法主要包括以下步骤:图像预处理,构建并训练级联的多层卷积神经网络;输入测试图像,使用图像金字塔的方式产生不同分辨率的图像集合,然后送入所述的级联的多层卷积神经网络开始检测;每一级网络过滤掉部分非人脸窗口,根据边框回归结果调整候选框位置,同时预测出人脸的旋转角度;然后根据预测出的旋转角度通过翻转图像操作进行配准。在本发明中,通过多任务渐进配准网络方法,实现实时、旋转自适应的人脸检测,在精度和速度取得了良好的效果。

Description

一种基于多任务渐进配准网络的旋转不变人脸检测方法
技术领域
本发明属于图像处理技术领域,特别涉及基于卷积神经网络的旋转不变人脸检测方法。
背景技术
包含人脸的图像对基于智能视觉的人机交互是必不可少的,人脸检测为上述目标进行智能分析提供了丰富的视觉信息,可以用于鉴别图像中感兴趣对象。同时,对于人脸检测的研究也成为图像处理、计算机视觉和模式识别领域中一个难以回避的基础性问题,一直广受研究者的关注。在人脸检测上所取得的进展,对于计算机视觉和模式识别领域的诸多问题起到了重要的支撑作用,例如人脸识别、视频跟踪、头部姿态估计和性别识别等。
利用计算机视觉手段对人体目标实施人脸检测的研究经历了数十年的发展,但很多人脸检测算法的性能都不足以满足实际应用中的需求。与受控环境相比,真实场景下的人脸在图片中有着不同的呈现:受控环境下人脸基本处于正面朝上状态,仅头部有着轻微的几何变形;而真实场景下的人脸姿态更为复杂,最大特点在于人脸目标与成像设备之间有着不确定的平面旋转角度。现有的典型DCNN人脸检测网络一个重要的不足是,缺乏对诸如图像旋转变化、尺度变化等的鲁棒性。
发明内容
针对以上现有技术中的不足,本发明的目的在于提供一种对平面内旋转角度变化较为鲁棒的人脸检测方法。
为实现上述目的本发明采用的技术方案如下:一种基于多任务渐进配准网络的旋转不变人脸检测方法,包括以下步骤:
S1、图像预处理,构建并训练级联的多层卷积神经网络;
S2、输入测试图像,使用图像金字塔的方式产生不同分辨率的图像集合,然后送入所述级联的多层卷积神经网络开始检测;
S3、每一层卷积神经网络过滤掉部分非人脸窗口,根据边框回归结果调整候选框位置,同时预测出人脸的旋转角度;
S4、根据预测出的旋转角度通过翻转图像操作进行配准,并将配准图像判断为人脸图像。
进一步,所述图像预处理包括:
A1、将WIDER FACE数据集图像按任意角度旋转,产生大量包含平面内旋转角度变化的人脸图像,其人脸位置信息也进行相应旋转变化;
A2、将LFW数据集图像按任意角度随机旋转,产生大量包含平面内旋转角度变化的人脸图像,其人脸关键点位置信息也进行相应旋转变化。
进一步,所述级联的多层卷积神经网络采用三层级联架构,第一层包括4个卷积层和1个最大池化层,第二层包括3个卷积层、2个最大池化层和2个全连接层,第三层包括4个卷积层、3个最大池化层和2个全连接层。
本发明的优点及有益效果如下:
本发明主要针对目前流行的基于深度卷积神经网络的人脸检测方法缺乏对图像旋转变化的鲁棒性,设计了一种基于多任务渐进配准网络的旋转不变人脸检测方法。充分考虑实际场景中,可能会出现由于人脸目标与成像设备之间有着不确定的平面旋转角度造成无法对人脸区域进行检测的情况。采用多任务学***面内人脸图像旋转角度信息,为了提升本方法在人脸角度变化时关键点检测的鲁棒性,因此重新定义人脸关键点回归损失函数,有效的提高了算法对平面内旋转角度变化的容忍能力。本方法获得了较好的检测效果。
附图说明
图1是本发明实施例提供的旋转不变的人脸检测的实现流程图;
图2是本发明实施例提供的多级联的卷积神经网络第一级网络结构图;
图3是本发明实施例提供的多级联的卷积神经网络第二级网络结构图;
图4是本发明实施例提供的多级联的卷积神经网络第三级网络结构图;
图5是本发明实施例提供的旋转不变的人脸检测的效果图;
图6是本发明实施例提供的旋转不变人脸检测的方法S4的具体实现流程图;
图7是人脸图像上特征点的标签位置展示图。
具体实施方式
本发明实施例基于级联的多层卷积神经网络实现,待测图像一次通过各级多层卷积神经网络,每级多层卷积神经网络均执行人脸分类、人脸候选框回归、人脸关键点检测及角度识别任务。最后根据预测出的旋转角度通过翻转图像操作进行配准,并将配准图像判断为人脸图像。
为了说明本发明所述的技术方案,下面结合附图和具体实施例作说明。
图1示出了本发明实施例提供的旋转不变的人脸检测的实现流程,详述如下:
S1、构建并训练级联的多层卷积神经网络;
S2、输入测试图像,使用图像金字塔的方式产生不同分辨率的图像集合,然后送入所述的级联的多层卷积神经网络开始检测;
S3、每一级网络过滤掉部分非人脸窗口,根据边框回归结果调整候选框位置,同时预测出人脸的旋转角度;
S4、根据预测出的旋转角度通过翻转图像操作进行配准。
所述的级联的多层卷积神经网络采用三层级联架构设计,每一级由浅层卷积神经网络构成,同时完成人脸检测、角度识别和关键点定位任务,在速度和精度方面取得良好的效果。
进一步的,步骤S1利用多任务间的关联性,结合人脸检测、角度识别和关键点定位任务,构建并训练了基于三层级联架构的多任务卷积神经网络,具体实施步骤如下:
第一级网络、第二级网络和第三级网络的网络结构图分别如图2、图3和图4所示。我们把旋转不变人脸检测分解为人脸/非人脸的二分类问题、人脸的角度识别问题和人脸候选框回归问题,即判断输入图像是否为人脸和使得检测框的输出结果无限接近其真实值。具体地:
A、如图2所示,第一级网络的网络结构从上至下依次是:第一层,卷积层,卷积核大小为3×3,卷积核数目为16;第二层,最大池化层,池化区间为2×2;第三层,卷积层,卷积核大小为3×3,卷积核数目为32;第四层,卷积层,卷积核大小为3×3,卷积核数目为64;第五层分四个子层,分别与第四层串联,这四个子层均为卷积层,卷积核为1×1,使用的监督信息分别为:人脸与非人脸二分类信息、人脸的位置信息和人脸关键点的位置信息;
B、如图3所示,第二级网络的网络结构从上至下依次是:第一层,卷积层,卷积核大小为3×3,卷积核数目为24;第二层,最大池化层,池化区间为3×3;第三层,卷积层,卷积核大小为3×3,卷积核数目为48;第四层,最大池化层,池化区间为3×3;第五层,卷积层,卷积核大小为2×2,卷积核数目为96;第六层,全连接层,神经元个数为196;第七层分四个子层,分别与第六层串联,这四个子层均为全连接层,使用的监督信息分别为:人脸与非人脸二分类信息、人脸的位置信息和人脸关键点的位置信息;
C、如图4所示,第三级网络的网络结构从上至下依次是:第一层,卷积层,卷积核大小为3×3,卷积核数目为24;第二层,最大池化层,池化区间为3×3;第三层,卷积层,卷积核大小为3×3,卷积核数目为48;第四层,最大池化层,池化区间为3×3;第五层,卷积层,卷积核大小为2×2,卷积核数目为96;第六层,最大池化层,池化区间为2×2;第七层,卷积层,卷积核大小为2×2,卷积核数目为192;第八层,全连接层,神经元个数为254;第九层分三个子层,分别与第八层串联,这四个子层均为全连接层,使用的监督信息分别为:人脸与非人脸二分类信息、人脸的位置信息和人脸关键点的位置信息;
D、测试阶段,第一级网络和第二级网络只输出人脸与非人脸的判断结果f、人脸候选框的位移t以及人脸方向g,第三级网络只输出人脸与非人脸的判断结果f、人脸候选框的位移t以及人脸关键点位置p;
E、训练该卷积神经网络时,使用随机梯度下降算法,使用交叉熵函数计算人脸/非人脸二分类任务的损失,根据计算公式(1)所示:
Lcls=ylog f+(1-y)log(1-f) (1)
其中,y表示真实的人脸分类结果。
同样地,使用交叉熵函数计算角度识别任务的损失,根据计算公式(2)所示:
Lcal=xlog g+(1-x)log(1-g) (2)
其中,x表示真实的角度分类结果。
人脸候选框的回归任务使用的是欧式距离函数,其计算公式如下所示:
其中,表示真实的人脸位置坐标值。
最后,充分考虑到了人脸关键点位置坐标包含的平面内人脸图像旋转角度信息,提升本方法在人脸角度变化时关键点检测的鲁棒性,因此重新定义人脸关键点回归损失函数,其计算公式如下所示:
其中,式中的N为参与人脸关键点任务的训练样本总数,d为预测点与真实点的欧式距离,θ为该样本的旋转角度值,满足θ∈[-45°,45°]。
F、在本发明实例中,使用公开人脸数据集WIDER FACE和LFW作为训练集。WIDERFACE包含了32203张图像、393703个人脸检测框位置标记。其中50%的人脸数据用来训练人脸分类和候选框回归任务,40%用作测试集,剩下的10%用作验证集。LFW数据集用来训练角度识别任务人和脸对齐任务。
进一步的,步骤S2将图像输入所述级联的多层卷积神经网络,输出产生人脸候选框位移、候选框得分、关键点位置和人脸旋转角度,具体实施步骤如下:
A、待测试图像首先经过尺度缩放生成图像金字塔。第一级网络的输入是12×12×3,其中,3代表输入图像色彩通道为3通道,即RGB图像。输入图像通过第一级网络产生的输出是人脸候选框位移t、候选框得分f及人脸方向g。此时人脸角度识别任务被看作一个二分类任务,即人脸方向朝上和人脸方向朝下,分别记做1、0;
训练第一层网络角度识别中使用样本的标注值θ为该样本的旋转角度值;
令所述标注值f1为0和1的样本参与训练第一层网络角度识别。
B、第二级网络的输入是24×24×3,输入图像通过第二级网络产生的输出是人脸候选框位移t、候选框得分f及人脸方向g;此时人脸角度识别任务被看作一个三分类任务,即人脸方向朝上、人脸方向朝左和人脸方向朝右,分别记做0、1、2;
训练第二层网络角度识别中使用样本的标注值θ为该样本的旋转角度值;
令所述标注值f2为0、1和2的样本参与训练第二层网络角度识别任务。
进一步的,在步骤S3中网络输出的人脸旋转角度,通过翻转图像操作进行配准,具体实施步骤如下:
A、如步骤S2所述,待测图像通过第一级网络后,产生人脸方向得分g,对应平面内旋转角度的计算公式是其中,0°代表正脸朝上,180°代表正脸朝下。
B、旋转角度p为0°时,图像不翻转;旋转角度p为180°时,图像则翻转180°;此时,平面内人脸旋转角度的范围由[-180°,180°]缩小到[-90°,90°]。图像翻转操作简单、计算花费少,能够实现平面内高效、快速的人脸图像配准;
C、如步骤S2所述,待测图像通过第二级网络后,产生人脸方向得分g,根据公式(5)将人脸方向得分转化为方向标签:
id=argmax gi,i∈[0,1,2] (5)
其中,id表示方向标签,g0,g1,g2分别表示人脸方向朝左、上、右的方向得分。
其对应平面内旋转角度的计算公式是其中,0°代表正脸朝上,90°代表正脸朝左,-90°代表正脸朝右。
D、旋转角度p为0°时,图像不翻转;旋转角度p为90°时,图像则右旋90°;旋转角度p为-90°时,图像则左旋90°。此时,平面内人脸旋转角度的范围由[-90°,90°]缩小到[-45°,45°]。
进一步的,步骤S2将图像输入最后一级多任务卷积神经网络,输出产生人脸候选框位置t、候选框得分f和关键点位置p,具体实施步骤如下:
A、最后一级网络的输入是48×48×3,与第一级、第二级网络结构不同的是,输入图像通过第三级网络产生的输出是人脸候选框位移t、候选框得分f及人脸关键点位置p。
B、待测图像通过第一级网络的目的是用一个全卷积网络快速产生候选窗口、以一种较为粗糙的方式预测图像旋转角度。通过第二级网络的目的是用一个复杂的卷积神经网络对第一级产生的候选窗口不断精细化,丢掉大量重叠窗口同时预测图像旋转角度。
进一步的,步骤S4利用步骤S2输出的人脸候选框位置和人脸关键点之间的几何信息,计算出旋转角度,通过翻转图像进行配准,得到检测人脸图像,具体实施步骤如下:
A、如图6(a)所示,待测图像通过第三级网络进行人脸检测和关键点定位,第三级网络的输出图像确定为人脸图像,平面内人脸旋转角度的范围为[-45°,45°]。
B、如图6(b)所示,我们知道人眼到头顶之间的距离相比其他关键点到头顶之间的距离更为接近。基于这一先验知识,首先通过计算左眼、右眼到四个边界框之间的距离和确定人脸检测框的正向。
C、如图7所示,在一张标准的、正脸朝上的人脸图像上,左眼与鼻尖之间的连线形成的夹角α等于鼻尖与头顶之间的连线形成的夹角β。如图6(d)所示,利用人脸检测框和关键点之间的几何关系,人脸图像旋转角度的计算公式为θ=(α-β)÷2。
本发明实施例提供的旋转不变的人脸检测的效果,如图5所示。

Claims (5)

1.一种基于多任务渐进配准网络的旋转不变人脸检测方法,其特征在于,包括以下步骤:
S1、图像预处理,构建并训练级联的多层卷积神经网络;
S2、输入测试图像,使用图像金字塔的方式产生不同分辨率的图像集合,然后送入所述级联的多层卷积神经网络开始检测;
S3、每一层卷积神经网络过滤掉部分非人脸窗口,根据边框回归结果调整候选框位置,同时预测出人脸的旋转角度;
S4、根据预测出的旋转角度通过翻转图像操作进行配准,并将配准图像判断为人脸图像。
2.根据权利要求1所述一种基于多任务渐进配准网络的旋转不变人脸检测方法,其特征在于:所述图像预处理包括:
A1、将人脸图像随机旋转至任意角度,产生大量包含平面内旋转角度变化的人脸图像,其人脸位置信息也进行相应旋转变化;
A2、将人脸关键点图像随机旋转至任意角度,产生大量包含平面内旋转角度变化的人脸关键点图像,其人脸关键点位置信息也进行相应旋转变化。
3.根据权利要求1或2所述一种基于多任务渐进配准网络的旋转不变人脸检测方法,其特征在于:所述级联的多层卷积神经网络采用三层级联架构,第一层包括4个卷积层和1个最大池化层,第二层包括3个卷积层、2个最大池化层和2个全连接层,第三层包括4个卷积层、3个最大池化层和2个全连接层。
4.根据权利要求3所述一种基于多任务渐进配准网络的旋转不变人脸检测方法,其特征在于:所述三层级联的多层卷积神经网络中,
训练第一层网络角度识别中使用样本的标注值θ为该样本的旋转角度值;
令所述标注值f1为0和1的样本参与训练第一层网络角度识别;
训练第二层网络角度识别中使用样本的标注值θ为该样本的旋转角度值;
令所述标注值f2为0、1和2的样本参与训练第二层网络角度识别任务。
5.根据权利要求1或2或4所述一种基于多任务渐进配准网络的旋转不变人脸检测方法,其特征在于:所述边框回归结果通过人脸关键点回归损失体现;
人脸关键点回归损失为式中的d为预测点与真实点的欧式距离,θ为该样本的旋转角度值,满足θ∈[-45°,45°]。
CN201910590187.8A 2019-07-02 2019-07-02 一种基于多任务渐进配准网络的旋转不变人脸检测方法 Active CN110458005B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910590187.8A CN110458005B (zh) 2019-07-02 2019-07-02 一种基于多任务渐进配准网络的旋转不变人脸检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910590187.8A CN110458005B (zh) 2019-07-02 2019-07-02 一种基于多任务渐进配准网络的旋转不变人脸检测方法

Publications (2)

Publication Number Publication Date
CN110458005A true CN110458005A (zh) 2019-11-15
CN110458005B CN110458005B (zh) 2022-12-27

Family

ID=68482053

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910590187.8A Active CN110458005B (zh) 2019-07-02 2019-07-02 一种基于多任务渐进配准网络的旋转不变人脸检测方法

Country Status (1)

Country Link
CN (1) CN110458005B (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111428657A (zh) * 2020-03-27 2020-07-17 杭州趣维科技有限公司 一种实时旋转不变的人脸关键点检测方法
CN111626160A (zh) * 2020-05-15 2020-09-04 辽宁工程技术大学 一种基于区域式渐进校准网络的角度变化下人脸检测方法
CN111695522A (zh) * 2020-06-15 2020-09-22 重庆邮电大学 一种平面内的旋转不变人脸检测方法、装置及存储介质
CN111739070A (zh) * 2020-05-28 2020-10-02 复旦大学 一种基于渐进校准式网络的实时多姿态人脸检测算法
CN112364805A (zh) * 2020-11-21 2021-02-12 西安交通大学 一种旋转手掌图像检测方法
CN112668465A (zh) * 2020-12-25 2021-04-16 秒影工场(北京)科技有限公司 一种基于多级cnn的影片人脸提取的方法
CN112825118A (zh) * 2019-11-20 2021-05-21 北京眼神智能科技有限公司 旋转不变性人脸检测方法、装置、可读存储介质及设备
CN113838056A (zh) * 2021-11-29 2021-12-24 中国电力科学研究院有限公司 一种电力设备联合检测识别方法、***、设备及存储介质

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050105805A1 (en) * 2003-11-13 2005-05-19 Eastman Kodak Company In-plane rotation invariant object detection in digitized images
WO2012013711A2 (en) * 2010-07-28 2012-02-02 International Business Machines Corporation Semantic parsing of objects in video
CN107239736A (zh) * 2017-04-28 2017-10-10 北京智慧眼科技股份有限公司 基于多任务级联卷积神经网络的人脸检测方法及检测装置
US20170344808A1 (en) * 2016-05-28 2017-11-30 Samsung Electronics Co., Ltd. System and method for a unified architecture multi-task deep learning machine for object recognition
CN107871106A (zh) * 2016-09-26 2018-04-03 北京眼神科技有限公司 人脸检测方法和装置
CN108038455A (zh) * 2017-12-19 2018-05-15 中国科学院自动化研究所 基于深度学习的仿生机器孔雀图像识别方法
WO2018121777A1 (zh) * 2016-12-31 2018-07-05 深圳市商汤科技有限公司 人脸检测方法、装置和电子设备
CN108564029A (zh) * 2018-04-12 2018-09-21 厦门大学 基于级联多任务学习深度神经网络的人脸属性识别方法
CN108960064A (zh) * 2018-06-01 2018-12-07 重庆锐纳达自动化技术有限公司 一种基于卷积神经网络的人脸检测及识别方法
CN109359603A (zh) * 2018-10-22 2019-02-19 东南大学 一种基于级联卷积神经网络的车辆驾驶员人脸检测方法
CN109409303A (zh) * 2018-10-31 2019-03-01 南京信息工程大学 一种基于深度的级联多任务人脸检测与配准方法

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050105805A1 (en) * 2003-11-13 2005-05-19 Eastman Kodak Company In-plane rotation invariant object detection in digitized images
WO2012013711A2 (en) * 2010-07-28 2012-02-02 International Business Machines Corporation Semantic parsing of objects in video
US20170344808A1 (en) * 2016-05-28 2017-11-30 Samsung Electronics Co., Ltd. System and method for a unified architecture multi-task deep learning machine for object recognition
CN107871106A (zh) * 2016-09-26 2018-04-03 北京眼神科技有限公司 人脸检测方法和装置
WO2018121777A1 (zh) * 2016-12-31 2018-07-05 深圳市商汤科技有限公司 人脸检测方法、装置和电子设备
CN107239736A (zh) * 2017-04-28 2017-10-10 北京智慧眼科技股份有限公司 基于多任务级联卷积神经网络的人脸检测方法及检测装置
CN108038455A (zh) * 2017-12-19 2018-05-15 中国科学院自动化研究所 基于深度学习的仿生机器孔雀图像识别方法
CN108564029A (zh) * 2018-04-12 2018-09-21 厦门大学 基于级联多任务学习深度神经网络的人脸属性识别方法
CN108960064A (zh) * 2018-06-01 2018-12-07 重庆锐纳达自动化技术有限公司 一种基于卷积神经网络的人脸检测及识别方法
CN109359603A (zh) * 2018-10-22 2019-02-19 东南大学 一种基于级联卷积神经网络的车辆驾驶员人脸检测方法
CN109409303A (zh) * 2018-10-31 2019-03-01 南京信息工程大学 一种基于深度的级联多任务人脸检测与配准方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
SHI, X等: "Real-Time Rotation-Invariant Face Detection with Progressive Calibration Networks", 《IEEE/CVF CONFERENCE ON COMPUTER VISION AND PATTERN RECOGNITION》 *
余飞等: "多级联卷积神经网络人脸检测", 《五邑大学学报(自然科学版)》 *

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112825118A (zh) * 2019-11-20 2021-05-21 北京眼神智能科技有限公司 旋转不变性人脸检测方法、装置、可读存储介质及设备
CN112825118B (zh) * 2019-11-20 2024-05-03 北京眼神智能科技有限公司 旋转不变性人脸检测方法、装置、可读存储介质及设备
CN111428657A (zh) * 2020-03-27 2020-07-17 杭州趣维科技有限公司 一种实时旋转不变的人脸关键点检测方法
CN111626160A (zh) * 2020-05-15 2020-09-04 辽宁工程技术大学 一种基于区域式渐进校准网络的角度变化下人脸检测方法
CN111626160B (zh) * 2020-05-15 2023-10-03 辽宁工程技术大学 一种基于区域式渐进校准网络的角度变化下人脸检测方法
CN111739070A (zh) * 2020-05-28 2020-10-02 复旦大学 一种基于渐进校准式网络的实时多姿态人脸检测算法
CN111739070B (zh) * 2020-05-28 2022-07-22 复旦大学 一种基于渐进校准式网络的实时多姿态人脸检测算法
CN111695522A (zh) * 2020-06-15 2020-09-22 重庆邮电大学 一种平面内的旋转不变人脸检测方法、装置及存储介质
CN111695522B (zh) * 2020-06-15 2022-10-18 重庆邮电大学 一种平面内的旋转不变人脸检测方法、装置及存储介质
CN112364805A (zh) * 2020-11-21 2021-02-12 西安交通大学 一种旋转手掌图像检测方法
CN112668465A (zh) * 2020-12-25 2021-04-16 秒影工场(北京)科技有限公司 一种基于多级cnn的影片人脸提取的方法
CN113838056A (zh) * 2021-11-29 2021-12-24 中国电力科学研究院有限公司 一种电力设备联合检测识别方法、***、设备及存储介质

Also Published As

Publication number Publication date
CN110458005B (zh) 2022-12-27

Similar Documents

Publication Publication Date Title
CN110458005A (zh) 一种基于多任务渐进配准网络的旋转不变人脸检测方法
CN110263774B (zh) 一种人脸检测方法
CN109543606B (zh) 一种加入注意力机制的人脸识别方法
CN107832672B (zh) 一种利用姿态信息设计多损失函数的行人重识别方法
Nandhini et al. Detection of Crime Scene Objects using Deep Learning Techniques
CN105469041B (zh) 基于多任务正则化与逐层监督神经网络的人脸点检测***
CN102609680B (zh) 一种基于三维深度图像信息的并行统计学习人体部位检测方法
CN109800689A (zh) 一种基于时空特征融合学习的目标跟踪方法
CN106874894A (zh) 一种基于区域全卷积神经网络的人体目标检测方法
CN100440246C (zh) 一种人脸特征点定位方法
CN103279768B (zh) 一种基于增量学习人脸分块视觉表征的视频人脸识别方法
Wang et al. Investigation into recognition algorithm of helmet violation based on YOLOv5-CBAM-DCN
CN101981582A (zh) 用于检测对象的方法、装置和程序
CN112766186B (zh) 一种基于多任务学习的实时人脸检测及头部姿态估计方法
Aung et al. Who Are They Looking At? Automatic Eye Gaze Following for Classroom Observation Video Analysis.
CN101726498B (zh) 基于视觉仿生的铜带表面质量智能检测装置及方法
CN111539351B (zh) 一种多任务级联的人脸选帧比对方法
CN109614990A (zh) 一种目标检测装置
Chen et al. A multi-scale fusion convolutional neural network for face detection
Sornalakshmi et al. Real Time Object Detection Using Deep Learning
CN108108648A (zh) 一种新型的手势识别***装置及方法
CN113158787B (zh) 一种复杂海洋环境下船舶检测分类方法
Wang et al. Thermal infrared object tracking based on adaptive feature fusion
Wang et al. Research and Design of Human Behavior Recognition Method in Industrial Production Based on Depth Image
CN111160179A (zh) 一种基于头部分割和卷积神经网络的摔倒检测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant