CN106250843B - 一种基于额头区域的人脸检测方法及*** - Google Patents
一种基于额头区域的人脸检测方法及*** Download PDFInfo
- Publication number
- CN106250843B CN106250843B CN201610607532.0A CN201610607532A CN106250843B CN 106250843 B CN106250843 B CN 106250843B CN 201610607532 A CN201610607532 A CN 201610607532A CN 106250843 B CN106250843 B CN 106250843B
- Authority
- CN
- China
- Prior art keywords
- classifier
- forehead
- region
- feature
- cascade
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/161—Detection; Localisation; Normalisation
- G06V40/165—Detection; Localisation; Normalisation using facial parts and geometric relationships
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/168—Feature extraction; Face representation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/172—Classification, e.g. identification
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Oral & Maxillofacial Surgery (AREA)
- Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Geometry (AREA)
- Image Analysis (AREA)
Abstract
本发明提供了一种基于额头区域的人脸检测方法及***。该方法包括:采用滑窗的方式对待检测图像进行遍历;获取各个待检测滑窗的方差,若所述待检测滑窗的方差大于预设阈值,则提取待检测滑窗的扩展的Haar‑Like特征和多通道颜色频率特征;根据训练的级联的额头分类器获得所述待检测图像中的目标额头区域;通过肤色检测和边缘检测,采用改进的最小二乘法获得各个目标额头区域对应的人脸区域。本发明实施例通过提取扩展的Haar‑Like特征和多通道颜色频率特征,更加丰富的描述额头区域的发色和肤色的概率分布特征,利用具有丰富形状和颜色特征的额头区域实现对人脸的检测,提高了人脸检测的精度。
Description
技术领域
本发明涉及图像处理技术领域,具体涉及一种基于额头区域的人脸检测方法及***。
背景技术
随着安全需求的提高,人流量统计、人员特征识别、人脸识别等技术的商业价值已经开始显露,并逐步开始应用,而人脸检测作为这些任务的首要环节,具有非常重要的作用和意义,近年来,研究人员在这一领域投入了大量的时间和精力,致力于开发出一种快速准确的人脸检测方法。
现有的基于肤色的人脸检测方法,主要将人脸从RGB空间转化到不同的颜色空间(例如YCbCr、HSV、LUV等),然后根据空间中肤色区域的分布情况训练出对应的高斯概率模型,从而根据高斯概率模型对待检样本区域中的点进行预测,判断是否属于人脸区域,最后对人脸区域进行最小外接矩形判定。现有的基于肤色的人脸检测方法忽视了额头区域的发色和肤色的概率分布特性,人脸检测效果较差。
在真实环境下,摄像头监控的位置往往较高,与人脸具有一定的角度,较难采集到正面人脸;同时多人场合下的位置关系,使得人脸很容易发生局部遮挡现象,不易获得清晰的眼、鼻、口等特征区域;同时不同距离之下的人脸具有不同的分辨率。以上三个问题对于人脸检测来说具有很大的挑战性,使得现有的人脸检测方法检测性能下降。
发明内容
本发明所要解决的技术问题是:如何提供一种对人脸进行准确检测的方法。
为解决上述技术问题,本发明提出了一种基于额头区域的人脸检测方法,该基于额头区域的人脸检测方法包括:
采用滑窗的方式对待检测图像进行遍历;
获取各个待检测滑窗的方差,若所述待检测滑窗的方差大于预设阈值,则提取待检测滑窗的扩展的Haar-Like特征和多通道颜色频率特征;
根据训练的级联的额头分类器获得所述待检测图像中的目标额头区域;
通过肤色检测和边缘检测,采用改进的最小二乘法获得各个目标额头区域对应的人脸区域;
其中,训练的级联的额头分类器包括前向分类器和后向分类器;所述前向分类器包括级联的Adaboost分类器;所述后向分类器包括基于级联结构的分类器和基于多核学习的分类器。
可选地,所述方法还包括:
获取额头样本,根据额头样本训练级联的额头分类器。
可选地,所述获取额头样本,根据额头样本训练级联的额头分类器包括:
提取额头样本的扩展的Haar-Like特征,通过级联的Adaboost算法对所述扩展的Haar-Like特征进行学习,训练得到所述前向分类器;
纵向提取经所述前向分类器分类的额头样本的多通道颜色频率特征,横向提取经所述前向分类器分类的额头样本的多通道颜色频率特征;
通过级联算法对纵向提取的多通道颜色频率特征进行学习,通过多核学习算法对横向提取的多通道颜色频率特征进行学习,训练得到后向分类器;
其中,所述额头样本包括正样本和负样本;扩展的Haar-Like特征包括描述水平方向弧形特征的Haar-Like特征和描述竖直方向弧形特征的Haar-Like特征。
可选地,所述纵向提取经所述前向分类器分类的额头样本的多通道颜色频率特征,横向提取经所述前向分类器分类的额头样本的多通道颜色频率特征,包括:
在N个不同的颜色通道的纵向,所述额头样本区域的每个位置对应N种不同形式的映射,获取各个位置的N种不同形式的映射值;
在N个不同的颜色通道的横向,每个维度对应一个通道,获取每个通道的N种不同类型的颜色信息;
其中,N为大于3的整数。
可选地,所述通过级联算法对纵向提取的多通道颜色频率特征进行学习,包括:
获取纵向提取的多通道颜色频率特征对应的多个弱分类器;
通过基于CART树的GentleAdaboost算法对各个弱分类器进行学习,获得纵向提取的多通道颜色频率特征对应的强分类器。
可选地,所述通过多核学习算法对横向提取的多通道颜色频率特征进行学习,包括:
获取各个像素的横向提取的多通道颜色频率特征,通过多核学习算法对各个像素的横向提取的多通道颜色频率特征进行学习,获得横向提取的多通道颜色频率特征对应的强分类器。
可选地,所述根据训练的级联的额头分类器获得所述待检测图像中的目标额头区域,包括:
通过所述前向分类器获得所述待检测图像中的额头区域;
通过所述后向分类器获得经前向分类器获得额头区域中的目标额头区域。
可选地,所述通过所述后向分类器获得经前向分类器获得额头区域中的目标额头区域包括:
分别通过基于级联结构的分类器和基于多核学习的分类器判断经前向分类器获得的额头区域是否是额头区域;
将基于级联结构的分类器和基于多核学习的分类器均判断经前向分类器获得的额头区域正确的区域确定为目标额头区域。
可选地,所述通过肤色检测和边缘检测,采用改进的最小二乘法获得各个目标额头区域对应的人脸区域,包括:
对各个目标额头区域进行扩展得到目标人头区域;
对所述目标人头区域进行肤色区域分割,获取人脸肤色区域;
采用边缘检测算法获得人脸肤色区域的多个轮廓点;
随机从所述多个轮廓点进行选择,获得局部最优椭圆的轮廓点;
对所述局部最优椭圆进行最小二乘拟合获得全局最优椭圆,所述全部最优椭圆对应所述人脸区域。
本发明还提出了一种基于额头区域的人脸检测***,包括:
图像遍历单元,用于采用滑窗的方式对待检测图像进行遍历;
特征提取单元,用于获取各个待检测滑窗的方差,若所述待检测滑窗的方差大于预设阈值,则提取待检测滑窗的扩展的Haar-Like特征和多通道颜色频率特征;
目标额头区域获取单元,用于根据训练的级联的额头分类器获得所述待检测图像中的目标额头区域;
人脸区域获取单元,用于通过肤色检测和边缘检测,采用改进的最小二乘法获得各个目标额头区域对应的人脸区域;
其中,训练的级联的额头分类器包括前向分类器和后向分类器;所述前向分类器包括级联的Adaboost分类器;所述后向分类器包括基于级联结构的分类器和基于多核学习的分类器。
本发明提供的基于额头区域的人脸检测方法及***,提取待检测滑窗的扩展的Haar-Like特征和多通道颜色频率特征;由于不同类型特征的外在表现形式并不一致,单一的特征学习算法很难很好地对特征进行学习,因此本发明根据训练的级联的额头分类器获得所述待检测图像中的目标额头区域;通过肤色检测和边缘检测,采用改进的最小二乘法获得各个目标额头区域对应的人脸区域。本发明通过提取扩展的Haar-Like特征和多通道颜色频率特征,更加丰富的描述额头区域的发色和肤色的概率分布特征,利用具有丰富形状和颜色特征的额头区域实现对人脸的检测,提高了人脸检测的精度。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明一个实施例的基于额头区域的人脸检测方法的流程示意图;
图2是本发明一个实施例的Haar-Like特征的示意图;
图3是本发明一个实施例的额头区域图像的8个颜色通道的示意图;
图4是本发明一个实施例的通过级联算法对纵向提取的多通道颜色频率特征进行学习的示意图;
图5是本发明一个实施例的通过多核学习算法对横向提取的多通道颜色频率特征进行学习的示意图;
图6是本发明一个实施例的基于额头区域的人脸检测***的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整的描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1是本发明一个实施例的基于额头区域的人脸检测方法的流程示意图。如图1所示,该实施例的基于额头区域的人脸检测方法包括:
S11:采用滑窗的方式对待检测图像进行遍历;
S12:获取各个待检测滑窗的方差,若所述待检测滑窗的方差大于预设阈值,则提取待检测滑窗的扩展的Haar-Like特征和多通道颜色频率特征;
S13:根据训练的级联的额头分类器获得所述待检测图像中的目标额头区域;
S14:通过肤色检测和边缘检测,采用改进的最小二乘法获得各个目标额头区域对应的人脸区域;
其中,训练的级联的额头分类器包括前向分类器和后向分类器;所述前向分类器包括级联的Adaboost分类器;所述后向分类器包括基于级联结构的分类器和基于多核学习的分类器。
在实际应用中,在检测阶段,对于给定的待检测图像,采用滑窗的方式对整张待检测图像进行遍历,首先判定每个待检测滑窗的方差,如果小于预设阈值(可以设为50),则过滤掉,反之对待检测滑窗提取扩展的Haar-Like特征和多通道颜色频率特征,然后利用训练的级联的额头分类器对其进行检测。这样会得到大量候选的额头区域,然后通过最大值抑制的方法对候选区域进行合并,得到最终的额头区域。
本发明实施例的基于额头区域的人脸检测方法,提取待检测滑窗的扩展的Haar-Like特征和多通道颜色频率特征;由于不同类型特征的外在表现形式并不一致,单一的特征学习算法很难很好地对特征进行学习,因此本发明根据训练的级联的额头分类器获得所述待检测图像中的目标额头区域;通过肤色检测和边缘检测,采用改进的最小二乘法获得各个目标额头区域对应的人脸区域。本发明通过提取扩展的Haar-Like特征和多通道颜色频率特征,更加丰富的描述额头区域的发色和肤色的概率分布特征,利用具有丰富形状和颜色特征的额头区域实现对人脸的检测,提高了人脸检测的精度。
在本发明实施例的一种优选的实施方式中,所述方法还包括:
获取额头样本,根据额头样本训练的级联的额头分类器。
进一步地,训练级联的额头分类器的过程包括:
提取额头样本的扩展的Haar-Like特征,通过级联的Adaboost算法对所述扩展的Haar-Like特征进行学习,训练得到所述前向分类器;
纵向提取经所述前向分类器分类的额头样本的多通道颜色频率特征,横向提取经所述前向分类器分类的额头样本的多通道颜色频率特征;
通过级联算法对纵向提取的多通道颜色频率特征进行学习,通过多核学习算法对横向提取的多通道颜色频率特征进行学习,训练得到后向分类器;
其中,所述额头样本包括正样本和负样本;扩展的Haar-Like特征包括描述水平方向弧形特征的Haar-Like特征和描述竖直方向弧形特征的Haar-Like特征。
需要说明的是,本发明实施例主要采用Haar-Like特征来描述额头的形状特征。原始的4类Haar-Like特征主要在V&J提出的方法中来描述人脸的形状特征,例如线性特征、中心特征、边缘特征和对角特征。后来对Haar-Like特征进行了扩展,提出了45度旋转的Haar-Like特征和中心环绕的Haar-Like特征。由于额头区域相对于人脸区域来说,弧形的边缘特征比较明显,因此本发明实施例针对额头对Haar-Like特征进行了扩展,提出了2种描述弧形边缘的Haar-Like特征,分别用来描述水平和竖直方向的弧形特征。如图2所示,1-16为扩展的描述人脸区域的Haar-Like特征,17-18为本发明实施例提出的描述弧形特征的Haar-Like特征。表1示出了本发明实施例的额头区域中每类Haar-Like特征对应的数量。
表1每类Haar-Like特征对应的数量
需要说明的是,前向分类器主要采用经典的级联Adaboost算法对额头区域的Haar-Like特征进行学习,使得最大限度地滤除非额头区域,并且检测到几乎多有的额头区域。在人脸检测中,V&J算法训练出来的人脸模型对于正面人脸的检测具有很好的效果,不过当人脸姿态发生较大的变化时,该算法很难准确地检测到人脸区域。不过相关研究表明,V&J算法对于多姿态人脸检测的性能下降的主要原因是传统的Haar-Like特征不能够很好地捕捉到多姿态情况下的人脸不变特征,而不是Adaboost算法的不足造成的。因此本发明实施例为了更好地捕捉到额头区域对应的不变形状特征,专门提出了2类描述额头弧形特征的Haar-Like特征,并用经典的级联的Adaboost算法对额头区域的Haar-Like特征进行学习。
进一步地,所述通过级联的Adaboost算法对所述扩展的Haar-Like特征进行学习,训练得到所述前向分类器包括:
对于给定的训练样本(正样本P个,负样本M个),则对应的扩展的Haar-Like特征矩阵分别为:P×105888和M×105888。通过级联的AdaBoost算法进行学习,控制每一层正样本被分为正样本的概率和负样本被分为负样本的概率,这里设定的分别为0.999和0.5,同时级联分类器的终止条件为负样本被分为负样本的概率小于10-6,如果每一层中弱分类器的个数超过500也终止级联分类器的训练。由于本发明实施例采用的训练样本中包含了各种姿态、遮挡、光照、肤色、发色和分辨率等情况,得到的级联分类器中强分类器的个数为5,同时每层对应的弱分类器的个数分别为55,85,135,140,331,也即级联的分类器负样本被分为负样本的概率为0.0306.虽然未达到规定的10-6,不过已经使得分类器可以过滤掉几乎0.97×M负样本,同时使得正样本几乎全部通过。
进一步地,所述纵向提取经所述前向分类器分类的额头样本的多通道颜色频率特征,横向提取经所述前向分类器分类的额头样本的多通道颜色频率特征,包括:
在N个不同的颜色通道的纵向,所述额头样本区域的每个位置对应N种不同形式的映射,获取各个位置的N种不同形式的映射值;
在N个不同的颜色通道的横向,每个维度对应一个通道,获取每个通道的N种不同类型的颜色信息;
其中,N为大于3的整数。
特别地,N=8。
需要说明的是,为了能够充分地描述额头的颜色特征,本发明实施例提出了多通道的颜色频率特征,实验表明该特征可以有效地捕捉到额头的不变颜色特征。传统的基于肤色的人脸检测方法,主要将人脸从RGB空间转化到不同的颜色空间(例如YCbCr、HSV、LUV等),然后根据空间中肤色区域的分布情况训练出对应的高斯概率模型,从而根据高斯概率模型对待检样本区域中的点进行预测,判断是否属于人脸区域,最后对人脸区域进行最小外接矩形判定。与传统方法不同的是,为了更加丰富地描述额头区域中发色和肤色的概率分布特性,本文首先将额头从RGB空间扩展到了多个颜色空间(YCbCr、HSV和LUV颜色空间),如图3所示,然后用不同的学习算法对三个空间中8个不同通道内的信息进行有效地学习,进而得到不同方向下对应的分布特性。
进一步地,所述通过级联算法对纵向提取的多通道颜色频率特征进行学习,包括:
获取纵向提取的多通道颜色频率特征对应的多个弱分类器;
通过基于CART树的Gentle Adaboost算法对各个弱分类器进行学习,获得纵向提取的多通道颜色频率特征对应的强分类器。
需要说明的是,多个颜色通道中颜色特征的纵向提取方式是,在不同通道的纵向,额头区域的每个位置都会有8种不同形式的映射形式,对于额头区域,每个位置的8种不同形式的映射具有相似的分布,对每个位置提取8种不同形式的映射值。在多个颜色空间(YCBCR、、HSV、LUV)的不同通道中,额头区域的每个位置都对应8个相关的数据,通过对N个训练样本中8个相关数据的学习,可以得到一个基于多颜色通道的额头区域弱分类器,对于整个额头区域,将会有384个弱分类器,然后通过SoftCasacde结构对384个弱分类器进行学习,就可以得到纵向提取的颜色频率特征对应的强分类器。在该结构中,弱分类器主要通过基于CART树的Gentle Adaboost算法学得,为了提高检测速率,CART树的深度不能超过2,同时Gentle Adaboost算法中CART树的个数不能多于8。对于每个弱分类器,对训练样本进行检测,得到384个弱分类器分别对应的分类准确率,然后借用SoftCascade结构对384个弱分类器进行训练,得到纵向提取的颜色频率特征对应的强分类器。
进一步地,所述通过多核学习算法对横向提取的多通道颜色频率特征进行学习,包括:
获取各个像素的横向提取的多通道颜色频率特征,通过多核学习算法对各个像素的横向提取的多通道颜色频率特征进行学习,获得横向提取的多通道颜色频率特征对应的强分类器。
需要说明的是,多个颜色通道中颜色频率特征的横向提取方式是,在不同通道的横向,每一维度都对应一个通道,每个通道都有384个像素来描述额头区域的颜色信息,对于额头区域,8个通道之间具有一定的相关性,通过将每个通道对应的像素串联起来作为类特征来描述额头区域的颜色信息,则8个通道则对应8种不同类型的颜色信息。在多个颜色空间(YCBCR、HSV、LUV)的不同通道中,每个通道中额头区域都具有独特的分布,同时各个通道之间具有很强的相关性,如何将它们之间的关系学习出来对于多通道的额头识别十分关键。对于每个训练样本,每个通道特征对应的长度都为384,则8个通道对应的特征长度为8×384=3072。本发明实施例采用多核学习算法对不同通道间的特征进行有效地融合,得到一个横向提取的颜色频率特征对应的强分类器。在多核学习中,每个通道中提取的特征对应的核均为高斯核,同时为了增加分类器的泛化能力,多核学习分类器的惩罚系数设置为16(可以根据需求自行调整),经过多核学习分类器的训练,可以得到一个横向提取的颜色频率特征对应的强分类器。
进一步地,所述根据训练的级联的额头分类器获得所述待检测图像中的目标额头区域,包括:
通过所述前向分类器获得所述待检测图像中的额头区域;
通过所述后向分类器获得经前向分类器获得额头区域中的目标额头区域。
需要说明的是,通过前向分类器,过滤掉了大量的非额头样本,然后将误检的额头样本收集起来作为新的负样本,和额头样本一起作为后向分类器的样本。
进一步地,所述通过所述后向分类器获得经前向分类器获得额头区域中的目标额头区域包括:
分别通过基于级联结构的分类器和基于多核学习的分类器判断经前向分类器获得的额头区域是否是额头区域;
将基于级联结构的分类器和基于多核学习的分类器均判断经前向分类器获得的额头区域正确的区域确定为目标额头区域。
需要说明的是,由于在训练的时候,为了增加分类器的泛化能力,SoftCascade分类器和多核学习分类器中的相关系数(SoftCascade结构中CART的深度和Gentle Adaboost中树的个数;多核学习的惩罚系数)设置的都比较小,使得分类器的误检率比较高。因此本发明实施例采用投票机制来构建多通道颜色频率特征对应的强分类器,如果基于级联结构的分类器和基于多核学习的分类器都检测为额头,则该待检样本对应的为额头,反之剩余的情况均为非额头区域。
进一步地,所述通过肤色检测和边缘检测,采用改进的最小二乘法获得各个目标额头区域对应的人脸区域,包括:
对各个目标额头区域进行扩展得到目标人头区域;
对所述目标人头区域进行肤色区域分割,获取人脸肤色区域;
采用边缘检测算法获得人脸肤色区域的多个轮廓点;
随机从所述多个轮廓点进行选择,获得局部最优椭圆的轮廓点;
对所述局部最优椭圆进行最小二乘拟合获得全局最优椭圆,所述全部最优椭圆对应所述人脸区域。
需要说明的是,额头区域下的人脸或部分人脸的轮廓是一个或部分的椭圆。由此,利用先验知识和肤色信息得到人头区域及其边缘关键点,再利用有约束的椭圆拟合算法得到人脸;同时,根据椭圆参数可以实现人脸的粗略对齐。
为了检测人脸区域,作者首先利用先验知识,将检测得到的额头区域在水平和垂直方向分别以3:2和3:1的比例进扩展,获得人头区域。然后利用基于肤色信息的高斯概率模型对该人头区域进行肤色区域分割,获取其中的人脸肤色区域。接着,利用边缘检测算法获得该人脸区域的轮廓点,称之为边缘关键点,记为(xi,yi),(i=1,2,...,k)。最后,基于这些边缘关键点,利用改进的最小二乘法对人脸进行拟合,同时根据椭圆参数获得人脸的偏转角度。考虑到边缘轮廓点容易受到噪声的干扰,给椭圆的拟合带来偏差,在椭圆拟合的过程中引入最小拟合误差约束。
具体地,已知椭圆方程的定义如下:
其中a=[A B C D E]T为椭圆的参数向量,是关于边缘点(xi,yi)的向量。考虑了噪声点和边缘关键点,上面椭圆的方程可重新定义为:
其中X=[X1X2...Xk]T∈RI×5是边缘关键点构成的矩阵,b是通过随机过程得到的二值化稀疏向量。λ是稀疏向量的惩罚系数,其中f的定义如下:
其中εd是一个经验值,X`表示边缘关键点的子集,子集可表示为边缘关键点矩阵与稀疏向量b乘积:
X′=Xb
详细的算法如下所示
实验发现,循环次数T直接影响拟合得到椭圆的准确度和计算时长(本发明实施例实验取T=5000)。与传统基于全部轮廓点的椭圆拟合方法相比,该方法的拟合误差更小。由此,人脸可以被准确的定位得到,并同时可以根据椭圆参数得到人脸的偏斜角度。
图2是本发明一个实施例的基于额头区域的人脸检测***的结构示意图。如图2所示,本发明实施例的基于额头区域的人脸检测***包括:图像遍历单元61、特征提取单元62、目标额头区域获取单元63和人脸区域获取单元64;具体地:
图像遍历单元61,用于采用滑窗的方式对待检测图像进行遍历;
特征提取单元62,用于获取各个待检测滑窗的方差,若所述待检测滑窗的方差大于预设阈值,则提取待检测滑窗的扩展的Haar-Like特征和多通道颜色频率特征;
目标额头区域获取单元63,用于根据训练的级联的额头分类器获得所述待检测图像中的目标额头区域;
人脸区域获取单元64,用于通过肤色检测和边缘检测,采用改进的最小二乘法获得各个目标额头区域对应的人脸区域;
其中,训练的级联的额头分类器包括前向分类器和后向分类器;所述前向分类器包括级联的Adaboost分类器;所述后向分类器包括基于级联结构的分类器和基于多核学习的分类器。
本实施例的基于额头区域的人脸检测***可以用于执行上述方法实施例,其原理和技术效果类似,此处不再赘述。
本发明提供的基于额头区域的人脸检测方法及***,提取待检测滑窗的扩展的Haar-Like特征和多通道颜色频率特征;由于不同类型特征的外在表现形式并不一致,单一的特征学习算法很难很好地对特征进行学习,因此本发明根据训练的级联的额头分类器获得所述待检测图像中的目标额头区域;通过肤色检测和边缘检测,采用改进的最小二乘法获得各个目标额头区域对应的人脸区域。本发明通过提取扩展的Haar-Like特征和多通道颜色频率特征,更加丰富的描述额头区域的发色和肤色的概率分布特征,利用具有丰富形状和颜色特征的额头区域实现对人脸的检测,提高了人脸检测的精度。
本领域内的技术人员应明白,本发明的实施例可提供为方法、***、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
需要说明的是术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本发明的说明书中,说明了大量具体细节。然而能够理解的是,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。类似地,应当理解,为了精简本发明公开并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释呈反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。
以上实施例仅用于说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (10)
1.一种基于额头区域的人脸检测方法,其特征在于,包括:
采用滑窗的方式对待检测图像进行遍历;
获取各个待检测滑窗的方差,若所述待检测滑窗的方差大于预设阈值,则提取待检测滑窗的扩展的Haar-Like特征和多通道颜色频率特征;
根据训练的级联的额头分类器获得所述待检测图像中的目标额头区域;
通过肤色检测和边缘检测,采用改进的最小二乘法获得各个目标额头区域对应的人脸区域;
其中,训练的级联的额头分类器包括前向分类器和后向分类器;所述前向分类器包括级联的Adaboost分类器;所述后向分类器包括基于级联结构的分类器和基于多核学习的分类器。
2.根据权利要求1所述的基于额头区域的人脸检测方法,其特征在于,所述方法还包括:
获取额头样本,根据额头样本训练级联的额头分类器。
3.根据权利要求2所述的基于额头区域的人脸检测方法,其特征在于,所述获取额头样本,根据额头样本训练级联的额头分类器包括:
提取额头样本的扩展的Haar-Like特征,通过级联的Adaboost算法对所述扩展的Haar-Like特征进行学习,训练得到所述前向分类器;
纵向提取经所述前向分类器分类的额头样本的多通道颜色频率特征,横向提取经所述前向分类器分类的额头样本的多通道颜色频率特征;
通过级联算法对纵向提取的多通道颜色频率特征进行学习,通过多核学习算法对横向提取的多通道颜色频率特征进行学习,训练得到后向分类器;
其中,所述额头样本包括正样本和负样本;扩展的Haar-Like特征包括描述水平方向弧形特征的Haar-Like特征和描述竖直方向弧形特征的Haar-Like特征。
4.根据权利要求3所述的基于额头区域的人脸检测方法,其特征在于,所述纵向提取经所述前向分类器分类的额头样本的多通道颜色频率特征,横向提取经所述前向分类器分类的额头样本的多通道颜色频率特征,包括:
在N个不同的颜色通道的纵向,所述额头样本区域的每个位置对应N种不同形式的映射,获取各个位置的N种不同形式的映射值;
在N个不同的颜色通道的横向,每个维度对应一个通道,获取每个通道的N种不同类型的颜色信息;
其中,N为大于3的整数。
5.根据权利要求3所述的基于额头区域的人脸检测方法,其特征在于,所述通过级联算法对纵向提取的多通道颜色频率特征进行学习,包括:
获取纵向提取的多通道颜色频率特征对应的多个弱分类器;
通过基于CART树的GentleAdaboost算法对各个弱分类器进行学习,获得纵向提取的多通道颜色频率特征对应的强分类器。
6.根据权利要求3所述的基于额头区域的人脸检测方法,其特征在于,所述通过多核学习算法对横向提取的多通道颜色频率特征进行学习,包括:
获取各个像素的横向提取的多通道颜色频率特征,通过多核学习算法对各个像素的横向提取的多通道颜色频率特征进行学习,获得横向提取的多通道颜色频率特征对应的强分类器。
7.根据权利要求1所述的基于额头区域的人脸检测方法,其特征在于,所述根据训练的级联的额头分类器获得所述待检测图像中的目标额头区域,包括:
通过所述前向分类器获得所述待检测图像中的额头区域;
通过所述后向分类器获得经前向分类器获得额头区域中的目标额头区域。
8.根据权利要求7所述的基于额头区域的人脸检测方法,其特征在于,所述通过所述后向分类器获得经前向分类器获得额头区域中的目标额头区域包括:
分别通过基于级联结构的分类器和基于多核学习的分类器判断经前向分类器获得的额头区域是否是额头区域;
将基于级联结构的分类器和基于多核学习的分类器均判断经前向分类器获得的额头区域正确的区域确定为目标额头区域。
9.根据权利要求1所述的基于额头区域的人脸检测方法,其特征在于,所述通过肤色检测和边缘检测,采用改进的最小二乘法获得各个目标额头区域对应的人脸区域,包括:
对各个目标额头区域进行扩展得到目标人头区域;
对所述目标人头区域进行肤色区域分割,获取人脸肤色区域;
采用边缘检测算法获得人脸肤色区域的多个轮廓点;
随机从所述多个轮廓点进行选择,获得局部最优椭圆的轮廓点;
对所述局部最优椭圆进行最小二乘拟合获得全局最优椭圆,所述全局最优椭圆对应所述人脸区域。
10.一种基于额头区域的人脸检测***,其特征在于,包括:
图像遍历单元,用于采用滑窗的方式对待检测图像进行遍历;
特征提取单元,用于获取各个待检测滑窗的方差,若所述待检测滑窗的方差大于预设阈值,则提取待检测滑窗的扩展的Haar-Like特征和多通道颜色频率特征;
目标额头区域获取单元,用于根据训练的级联的额头分类器获得所述待检测图像中的目标额头区域;
人脸区域获取单元,用于通过肤色检测和边缘检测,采用改进的最小二乘法获得各个目标额头区域对应的人脸区域;
其中,训练的级联的额头分类器包括前向分类器和后向分类器;所述前向分类器包括级联的Adaboost分类器;所述后向分类器包括基于级联结构的分类器和基于多核学习的分类器。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610607532.0A CN106250843B (zh) | 2016-07-28 | 2016-07-28 | 一种基于额头区域的人脸检测方法及*** |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610607532.0A CN106250843B (zh) | 2016-07-28 | 2016-07-28 | 一种基于额头区域的人脸检测方法及*** |
Publications (2)
Publication Number | Publication Date |
---|---|
CN106250843A CN106250843A (zh) | 2016-12-21 |
CN106250843B true CN106250843B (zh) | 2019-04-26 |
Family
ID=57603993
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610607532.0A Active CN106250843B (zh) | 2016-07-28 | 2016-07-28 | 一种基于额头区域的人脸检测方法及*** |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106250843B (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108280388A (zh) * | 2017-01-06 | 2018-07-13 | 富士通株式会社 | 训练面部检测模型的方法和装置以及面部检测方法和装置 |
CN109002799B (zh) * | 2018-07-19 | 2021-08-24 | 苏州市职业大学 | 人脸识别方法 |
CN112053381A (zh) * | 2020-07-13 | 2020-12-08 | 北京迈格威科技有限公司 | 图像处理方法、装置、电子设备及存储介质 |
CN113536917B (zh) * | 2021-06-10 | 2024-06-07 | 浙江大华技术股份有限公司 | 着装识别方法、***、电子装置和存储介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103093250A (zh) * | 2013-02-22 | 2013-05-08 | 福建师范大学 | 一种基于新Haar-like特征的Adaboost人脸检测方法 |
CN104715244A (zh) * | 2015-04-01 | 2015-06-17 | 华中科技大学 | 一种基于肤色分割和机器学习的多视角人脸检测方法 |
CN105335684A (zh) * | 2014-06-25 | 2016-02-17 | 小米科技有限责任公司 | 人脸检测方法及装置 |
-
2016
- 2016-07-28 CN CN201610607532.0A patent/CN106250843B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103093250A (zh) * | 2013-02-22 | 2013-05-08 | 福建师范大学 | 一种基于新Haar-like特征的Adaboost人脸检测方法 |
CN105335684A (zh) * | 2014-06-25 | 2016-02-17 | 小米科技有限责任公司 | 人脸检测方法及装置 |
CN104715244A (zh) * | 2015-04-01 | 2015-06-17 | 华中科技大学 | 一种基于肤色分割和机器学习的多视角人脸检测方法 |
Non-Patent Citations (3)
Title |
---|
AdaBoost Face Detection on the GPU using Haar-like Features;M.Martinez-Zarzuela等;《ResearchGate》;20110531 |
FACE RECOGNITION ALGORITHM BASED ON HAAR-LIKE FEATURES AND GENTLE ADABOOST FEATURE SELECTION VIA SPARSE REPRESENTATION;Qingwei Wang等;《Applied Mechanics and Materials》;20150316;第742卷 |
FACIAL FEATURE DETECTION USING HAAR CLASSIFIERS;Phillip Ian Wilson等;《Journal of Computing Science in Colleges》;20060430;第21卷(第4期) |
Also Published As
Publication number | Publication date |
---|---|
CN106250843A (zh) | 2016-12-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Silva et al. | A flexible approach for automatic license plate recognition in unconstrained scenarios | |
CN103400110B (zh) | Atm取款机前的异常人脸检测方法 | |
CN102194108B (zh) | 一种聚类线性鉴别分析特征选择的笑脸表情识别方法 | |
CN108268859A (zh) | 一种基于深度学习的人脸表情识别方法 | |
CN106250843B (zh) | 一种基于额头区域的人脸检测方法及*** | |
Roomi et al. | Race classification based on facial features | |
CN103632132A (zh) | 一种基于肤色分割和模板匹配的人脸检测与识别方法 | |
Zheng et al. | Attention-based spatial-temporal multi-scale network for face anti-spoofing | |
Abate et al. | BIRD: Watershed based iris detection for mobile devices | |
Gupta et al. | Face detection using modified Viola jones algorithm | |
El Maghraby et al. | Detect and analyze face parts information using Viola-Jones and geometric approaches | |
CN104021384B (zh) | 一种人脸识别方法及装置 | |
CN106909883A (zh) | 一种基于ros的模块化手部区域检测方法和装置 | |
CN108446642A (zh) | 一种快速人脸识别*** | |
Wu et al. | Natural scene text detection by multi-scale adaptive color clustering and non-text filtering | |
Özbudak et al. | Effects of the facial and racial features on gender classification | |
CN107862298A (zh) | 一种基于红外摄像装置下眨眼的活体检测方法 | |
Szczepański et al. | Pupil and iris detection algorithm for near-infrared capture devices | |
Anantharajah et al. | Quality based frame selection for video face recognition | |
Méndez-Llanes et al. | On the use of local fixations and quality measures for deep face recognition | |
Yi et al. | Face detection method based on skin color segmentation and facial component localization | |
Rifaee et al. | Unconstrained iris recognition | |
Xu et al. | Patch-wise skin segmentation of human body parts via deep neural networks | |
El Maghraby et al. | Detecting and tracking of multiple people in video based on hybrid detection and human anatomy body proportion | |
Das et al. | A novel approach towards detecting faces and gender using skin segmentation and template matching |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |