CN107392182A - 一种基于深度学习的人脸采集识别方法及装置 - Google Patents

一种基于深度学习的人脸采集识别方法及装置 Download PDF

Info

Publication number
CN107392182A
CN107392182A CN201710705219.5A CN201710705219A CN107392182A CN 107392182 A CN107392182 A CN 107392182A CN 201710705219 A CN201710705219 A CN 201710705219A CN 107392182 A CN107392182 A CN 107392182A
Authority
CN
China
Prior art keywords
face
characteristic data
picture
mrow
video
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201710705219.5A
Other languages
English (en)
Other versions
CN107392182B (zh
Inventor
郑士查
李达
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ningbo Yong Hui Intelligent Technology Co Ltd
Original Assignee
Ningbo Yong Hui Intelligent Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ningbo Yong Hui Intelligent Technology Co Ltd filed Critical Ningbo Yong Hui Intelligent Technology Co Ltd
Priority to CN201710705219.5A priority Critical patent/CN107392182B/zh
Publication of CN107392182A publication Critical patent/CN107392182A/zh
Application granted granted Critical
Publication of CN107392182B publication Critical patent/CN107392182B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/168Feature extraction; Face representation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/19Recognition using electronic means
    • G06V30/192Recognition using electronic means using simultaneous comparisons or correlations of the image signals with a plurality of references
    • G06V30/194References adjustable by an adaptive method, e.g. learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/161Detection; Localisation; Normalisation
    • G06V40/165Detection; Localisation; Normalisation using facial parts and geometric relationships
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/168Feature extraction; Face representation
    • G06V40/171Local features and components; Facial parts ; Occluding parts, e.g. glasses; Geometrical relationships

Landscapes

  • Engineering & Computer Science (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • General Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Human Computer Interaction (AREA)
  • Data Mining & Analysis (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Geometry (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)

Abstract

本发明公开一种基于深度学习的人脸采集识别方法及装置,所述方法包括:步骤S1,收集大量含有人脸的图片并处理成人脸文件;步骤S2,对所述人脸文件进行深度学习,建立学习模型;步骤S3,将输入的视频流与所述学习模型比对,对视频中的人脸进行采集;步骤S4,对采集到的所述人脸,提取人脸特征数据,并将此人脸特征数据与数据库中的人脸特征数据进行比对,确认是否相符;所述装置包括与步骤对应的人脸处理单元、模型建立单元、人脸采集单元和人脸识别单元。这样,可以迅速从视频流中提取人脸进行对比,加快了人脸识别速度。

Description

一种基于深度学习的人脸采集识别方法及装置
技术领域
本发明涉及人脸识别技术领域,具体涉及一种基于深度学习的人脸采集识别方法及装置。
背景技术
人脸识别技术是基于人的脸部特征信息进行身份识别的一种生物识别技术,是近年来随着计算机、图像处理、模式识别等技术的迅速进步而出现的一种崭新的生物特征识别技术。用摄像机或摄像头采集含有人脸的图像或者视频流,并自动在图像中检测和跟踪人脸,进而对检测到的人的脸部进行一系列相关技术,达到识别不同人身份的目的。
目前的人脸识别技术有着人脸识别速度慢和人脸识别精确度低等不足之处。
鉴于上述缺陷,本发明创作者经过长时间的研究和实践终于获得了本发明。
发明内容
为解决上述技术缺陷,本发明采用的技术方案在于,首先提供一种基于深度学习的人脸采集识别方法,其包括:
步骤S1,收集大量含有人脸的图片并处理成人脸文件;
步骤S2,对所述人脸文件进行深度学习,建立学习模型;
步骤S3,将输入的视频流与所述学习模型比对,对视频中的人脸进行采集;
步骤S4,对采集到的所述人脸,提取人脸特征数据,并将此人脸特征数据与数据库中的人脸特征数据进行比对,确认是否相符。
较佳的,所述人脸文件包括人脸图片、图片的名字和人脸区域的位置信息。
较佳的,所述步骤S1包括:
步骤S11,收集大量含有人脸的图片;
步骤S12,进行人脸抠图以及记录各个图片的人脸位置信息,并处理成人脸文件。
较佳的,所述步骤S4包括:
步骤S41,采集相关人员的人脸照片,并提取所述人脸特征数据,将所述人脸特征数据保存在所述数据库中;
步骤S42,对采集到的视频中的所述人脸,提取所述人脸特征数据;
步骤S43,将视频中的所述人脸特征数据与数据库中的所述人脸特征数据进行1:N比对,确认是否相符。
较佳的,所述步骤S41包括:
步骤S411,采集相关人员的人脸照片,将所述人脸照片按照固定大小进行缩放,压缩成固定大小尺寸的图片;
步骤S412,确认缩放后的图片中眼睛和嘴唇的位置后,通过分类和回归原理确认其他特征点的位置;
步骤S413,根据所述特征点的位置,提取人脸特征数据并存在所述数据库中。
较佳的,所述步骤S42包括:
步骤S421,对采集到的视频中的所述人脸照片,将所述人脸照片按照固定大小进行缩放,压缩成固定大小尺寸的图片;
步骤S422,确认缩放后的图片中眼睛和嘴唇的位置后,通过分类和回归原理确认其他特征点的位置;
步骤S423,根据所述特征点的位置,提取人脸特征数据。
较佳的,所述步骤S43包括:
步骤S431,将人脸特征切割为多个方块,由所述方块之间进行特征比对,确认所述方块的比对相似度;
步骤S432,根据所述比对相似度确定相似度较高的所述方块;
步骤S433,综合统计各个相似度较高方块的比对相似度,计算出最终的比对百分比,若所述比对百分比超过设定阈值,则认定为相符。
较佳的,所述回归原理公式为:
其中,x为参数。
其次提供一种与所述的人脸采集识别方法对应的基于深度学习的人脸采集识别装置,其包括:
人脸处理单元,收集大量含有人脸的图片并处理成人脸文件;
模型建立单元,对所述人脸文件进行深度学习,建立学习模型;
人脸采集单元,将输入的视频流与所述学习模型比对,对视频中的人脸进行采集;
人脸识别单元,对采集到的所述人脸,提取人脸特征数据,并将此人脸特征数据与数据库中的人脸特征数据进行比对,确认是否相符。
较佳的,所述人脸识别单元包括:
人员特征提取子单元,采集相关人员的人脸照片,并提取所述人脸特征数据,将所述人脸特征数据保存在所述数据库中;
人脸特征提取子单元,对采集到的视频中的所述人脸,提取所述人脸特征数据;
特征比对子单元,将视频中的所述人脸特征数据与数据库中的所述人脸特征数据进行1:N比对,确认是否相符。
与现有技术比较本发明的有益效果在于:提供一种基于深度学习的人脸采集识别方法及装置,这样,可以迅速从视频流中提取人脸进行对比,加快了人脸识别速度;可以在0.1秒以内识别人脸,相对于普通的人脸提取,可以大大提高人脸识别速度;通过深度学习,可以持续不间断进行学习,不断提高人脸识别精度,识别精度将远高于普通的识别技术。
附图说明
为了更清楚地说明本发明各实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍。
图1是本发明基于深度学习的人脸采集识别方法的流程图;
图2是本发明基于深度学习的人脸采集识别方法步骤S1的流程图;
图3是本发明人脸图片中特征点的位置示意图;
图4是本发明基于深度学习的人脸采集识别方法步骤S4的流程图;
图5是本发明基于深度学习的人脸采集识别方法步骤S41的流程图;
图6是本发明基于深度学习的人脸采集识别方法步骤S42的流程图;
图7是本发明基于深度学习的人脸采集识别方法步骤S43的流程图;
图8是本发明基于深度学习的人脸采集识别装置的结构图;
图9是本发明基于深度学习的人脸采集识别装置中人脸识别单元的结构图;
图10是本发明基于深度学习的人脸采集识别装置中人员特征提取子单元的结构图;
图11是本发明基于深度学习的人脸采集识别装置中人脸特征提取子单元的结构图;
图12是本发明基于深度学习的人脸采集识别装置中特征比对子单元的结构图。
具体实施方式
以下结合附图,对本发明上述的和另外的技术特征和优点作更详细的说明。
当前人脸识别作为生物识别技术之一有其固有的缺点,这主要表现在:
1、人脸特征稳定性差
人脸是具有极强可塑性的三维柔软皮肤表面,会随着表情、年龄等方面的变化而改变,皮肤的特型也会随年龄、化妆、整容、意外伤害等情况发生改变。
2、可靠性、安全性低
尽管每个人的脸都不相同,但人类的面孔总体是相似的,很多人的面孔之间的差别是非常细微的,技术上实现安全可靠的认证有相当的难度。
3、图像的采集易受外界条件影响
人脸识别***必须面对不同光照条件、视角、距离变化等非常困难的视觉问题,这些复杂的成像因素都会极大地影响人脸图像的成像质量,使得识别性能不够稳定。这些缺点使得人脸识别***目前只能在视角、光照等条件比较理想的情况下满足一般应用的要求。
有鉴于此,本发明创作者经过长时间的研究和实践终于获得了本发明。
实施例1
如图1所示,其为本发明基于深度学习的人脸采集识别方法的流程图;其中,所述人脸采集识别方法包括:
步骤S1,收集大量含有人脸的图片并处理成人脸文件;
步骤S2,对所述人脸文件进行深度学习,建立学习模型;
步骤S3,将输入的视频流与所述学习模型比对,对视频中的人脸进行采集;
其中,所述输入的视频流可以是通过摄像机或者摄像头采集的,也可以是通过其他方式获得的视频。
步骤S4,对采集到的所述人脸,提取人脸特征数据,并将此人脸特征数据与数据库中的人脸特征数据进行比对,确认是否相符。
这样,可以迅速从视频流中提取人脸进行对比,加快了人脸识别速度;可以在0.1秒以内识别人脸,相对于普通的人脸提取,可以大大提高人脸识别速度;通过深度学习,可以持续不间断进行学习,不断提高人脸识别精度,识别精度将远高于普通的识别技术。
实施例2
如上述所述的基于深度学习的人脸采集识别方法,本实施例与其不同之处在于,如图2所示,所述步骤S1包括:
步骤S11,收集大量含有人脸的图片;
为了提高识别的准确度,需要收集总数不低于10000张的包含人脸的图片;这样,可以进行充分的训练,进而使得识别的准确度大大提高。
步骤S12,进行人脸抠图以及记录各个图片的人脸位置信息,并处理成人脸文件;
该步骤具体为:读取含有人脸的图片,在含有人脸的图片上画矩形框扣取人脸,并且把人脸位置信息等信息保存,并使保存的信息与图片相关联。
其中,可以把人脸位置信息等信息保存到XML文档,然后使XML文档和图片相关联。
在上述基础上增加人脸分类,如幼儿人脸和成人人脸,从而增加识别的准确度。此时,需要在画矩形框扣取人脸后输入分类信息。
该步骤需要处理的内容较多,可以编写专用的软件进行处理,这样节省时间,增加处理速度。
所述人脸文件至少包括:样本文件和处理信息;所述样本文件为人脸图片;所述处理信息为各个图片对应的人脸图片信息;
所述处理信息至少包含对应图片的名字以及人脸区域的位置;这样可以快速读取。还可以包含图片的尺寸,以及人脸分类等,这样便于后续读取。
所述处理信息可以记录在XML文件中,这样便于保存、更改和读取。
所述人脸文件还包括训练文件,所述训练文件包括训练以及测试的图片集的设置文件,以便训练程序读取特定图像分别进行测试以及训练。
实施例3
如上述所述的基于深度学习的人脸采集识别方法,本实施例与其不同之处在于,所述步骤S2中:
进行学习算法的编写,读取上述制作好的人脸文件,进行深度学习,建立学习模型。
所述学习算法的编写,是利用tensorflow多层卷积神经网络编写程序。
卷积神经网络(Convolutional Neural Network,CNN)是一种前馈神经网络,它的人工神经元可以响应一部分覆盖范围内的周围单元,对于大型图像处理有出色表现。卷积神经网络是近年发展起来,并引起广泛重视的一种高效识别方法。一般地,CNN的基本结构包括两层,其一为特征提取层,每个神经元的输入与前一层的局部接受域相连,并提取该局部的特征。一旦该局部特征被提取后,它与其它特征间的位置关系也随之确定下来;其二是特征映射层,网络的每个计算层由多个特征映射组成,每个特征映射是一个平面,平面上所有神经元的权值相等。特征映射结构采用影响函数核小的sigmoid函数作为卷积网络的激活函数,使得特征映射具有位移不变性。此外,由于一个映射面上的神经元共享权值,因而减少了网络自由参数的个数。卷积神经网络中的每一个卷积层都紧跟着一个用来求局部平均与二次提取的计算层,这种特有的两次特征提取结构减小了特征分辨率。
该深度学习可以使用tensorflow库(TensorFlow是谷歌基于DistBelief进行研发的第二代人工智能学习***,其命名来源于本身的运行原理。),在此基础上建立多层卷积神经网络,由于TensorFlow是GOOGLE公开代码,这里就不具体展开深度学习的具体步骤。
利用tensorflow多层卷积神经网络编写程序,可以将类别分别定义为幼儿人脸以及成人人脸,这样通过这种学习模式能够正确区分小孩和成人,提高是别的精确度。
实施例4
如上述所述的基于深度学习的人脸采集识别方法,本实施例与其不同之处在于,所述步骤S3中:
将输入的所述视频流保存为图片格式与生成的所述学习模型进行比对,如果图片某区域与模型的比对成功率大于阈值,则认为此区域包含人脸,将此照片的人脸部分进行保存。
所述阈值为80%,这样比对的准确率更高。所述阈值也可以根据实际情况进行设定。
所述比对为调用Testsorflow库与学习模型进行比对。
实施例5
如上述所述的基于深度学习的人脸采集识别方法,本实施例与其不同之处在于,如图4所示,所述步骤S4包括:
步骤S41,采集相关人员的人脸照片,并提取所述人脸特征数据,将所述人脸特征数据保存在所述数据库中;
步骤S42,对采集到的视频中的所述人脸,提取所述人脸特征数据;
步骤S43,将视频中的所述人脸特征数据与数据库中的所述人脸特征数据进行1:N比对,确认是否相符。
这样,提高了识别精度。
实施例6
如上述所述的基于深度学习的人脸采集识别方法,本实施例与其不同之处在于,如图5所示,步骤S41包括:
步骤S411,采集相关人员的人脸照片,将所述人脸照片按照固定大小进行缩放,压缩成固定大小尺寸的图片;
这样每个特征位置比如说嘴唇或者眼睛将大致出现在相同位置;便于进行特征提取和识别。
步骤S412,确认缩放后的图片中眼睛和嘴唇的位置后,通过分类和回归原理确认其他特征点的位置;
其中,所述回归原理公式为:
其中,x为参数。
这样使得整个特征提取的准确率更高,判断更加稳定。
目标函数是分类和回归损失的和,分类采用交叉熵,回归采用所述回归原理公式。
整体损失函数具体为:
人脸图片中特征点的位置如图3所示。
步骤S413,根据所述特征点的位置,提取人脸特征数据并存在所述数据库中。
所述人脸特征数据提取中,在卷积的最后一层feature map(特征提取图)上使用固定大小的窗口滑动,每个窗口会输出固定大小维度的特征,每一个窗口对候选的9个box进行回归坐标和分类(这里的分类表示box中是不是一个类object(对象),而不是具体的类别)。
所述人脸特征数据提取,可以是利用Testsorflow的深度学习的分类和回归功能实现的,这样便于操作。
实施例7
如上述所述的基于深度学习的人脸采集识别方法,本实施例与其不同之处在于,如图6所示,步骤S42包括:
步骤S421,对采集到的视频中的所述人脸照片,将所述人脸照片按照固定大小进行缩放,压缩成固定大小尺寸的图片;
这样每个特征位置比如说嘴唇或者眼睛将大致出现在相同位置;便于进行特征提取和识别。
步骤S422,确认缩放后的图片中眼睛和嘴唇的位置后,通过分类和回归原理确认其他特征点的位置;
其中,所述回归原理公式为:
这样进行判断更加稳定。
目标函数是分类和回归损失的和,分类采用交叉熵,回归采用所述回归原理公式。
整体损失函数具体为:
人脸图片中特征点的位置如图3所示。
步骤S423,根据所述特征点的位置,提取人脸特征数据。
所述人脸特征数据提取中,在卷积的最后一层feature map(特征提取图)上使用固定大小的窗口滑动,每个窗口会输出固定大小维度的特征,每一个窗口对候选的9个box进行回归坐标和分类(这里的分类表示box中是不是一个类object(对象),而不是具体的类别)。
所述人脸特征数据提取,可以是利用Testsorflow的深度学习的分类和回归功能实现的,这样便于操作。
实施例8
如上述所述的基于深度学习的人脸采集识别方法,本实施例与其不同之处在于,步骤S43中,由于受到光线、环境、拍摄角度等方面的影响,直接将人脸特征数据与数据库进行1:N人脸特征比对时,可能会出现比对成功率比较低的情况。
为了解决该问题,如图7所示,步骤S43包括:
步骤S431,将人脸特征切割为多个方块,由所述方块之间进行特征比对,确认所述方块的比对相似度;
该步骤具体为,将人脸特征切割为多个方块,将方块内的特征点与数据库中的每张人脸对应的特征进行比对,确认每个特征点的相似度。
所述人脸特征定义了多个特征点,如图3所示,其中特征点为67个,切割的所述方块需包含人脸的每个特征点。这样,防止遗漏特征点,降低识别的准确性。
在所述方块之间进行特征比对,是将方块内的特征点与数据库中的每张人脸对应的特征进行比对,这样比对目标明确,比对速度快。
步骤S432,根据所述比对相似度确定相似度较高的所述方块;
具体为:根据上述确认的每个方块的比对相似度,找出一些较高的方块。
这样某些遮盖住的部分脸部也可顺利进行比对,可以减少因改变服装、表情及环境变化带来的影响。
其中,确定的相似度较高的所述方块至少包含50%特征点(即34个方块),相似度阈值由***根据情况自动确定,也可以将方块根据比对相似度进行排序,确认前34个方块为相似度较高的所述方块(也可以是前66个,具体数量可以根据实际情况确认)。
步骤S433,综合统计各个相似度较高方块的比对相似度,计算出最终的比对百分比,若所述比对百分比超过设定阈值,则认定为相符。
其中,所述计算方法为根据各个方块比对相似度比率求平方平均值。这样计算方便,判断准确。
所述设定阈值为70%,这样可以有较高的准确性。也可以根据实际情况确定。
实施例9
如图8所示,其为本发明基于深度学习的人脸采集识别装置的结构图;其中,所述人脸采集识别装置包括:
人脸处理单元1,收集大量含有人脸的图片并处理成人脸文件;
模型建立单元2,对所述人脸文件进行深度学习,建立学习模型;
人脸采集单元3,将输入的视频流与所述学习模型比对,对视频中的人脸进行采集;
其中,所述输入的视频流可以是通过摄像机或者摄像头采集的,也可以是通过其他方式获得的视频。
人脸识别单元4,对采集到的所述人脸,提取人脸特征数据,并将此人脸特征数据与数据库中的人脸特征数据进行比对,确认是否相符。
这样,可以迅速从视频流中提取人脸进行对比,加快了人脸识别速度;可以在0.1秒以内识别人脸,相对于普通的人脸提取,可以大大提高人脸识别速度;通过深度学习,可以持续不间断进行学习,不断提高人脸识别精度,识别精度将远高于普通的识别技术。
实施例10
如上述所述的基于深度学习的人脸采集识别装置,本实施例与其不同之处在于,人脸处理单元1中:
为了提高识别的准确度,需要收集总数不低于10000张的包含人脸的图片;这样,可以进行充分的训练,进而使得识别的准确度大大提高。
该单元中,读取含有人脸的图片,在含有人脸的图片上画矩形框扣取人脸,并且把人脸位置信息等信息保存,并使保存的信息与图片相关联。
其中,可以把人脸位置信息等信息保存到XML文档,然后使XML文档和图片相关联。
在上述基础上增加人脸分类,如幼儿人脸和成人人脸,从而增加识别的准确度。此时,需要在画矩形框扣取人脸后输入分类信息。
该单元需要处理的内容较多,可以编写专用的软件进行处理,这样节省时间,增加处理速度。
所述人脸文件至少包括:样本文件和处理信息;所述样本文件为人脸图片;所述处理信息为各个图片对应的人脸图片信息;
所述处理信息至少包含对应图片的名字以及人脸区域的位置;这样可以快速读取。还可以包含图片的尺寸,以及人脸分类等,这样便于后续读取。
所述处理信息可以记录在XML文件中,这样便于保存、更改和读取。
所述人脸文件还包括训练文件,所述训练文件包括训练以及测试的图片集的设置文件,以便训练程序读取特定图像分别进行测试以及训练。
实施例11
如上述所述的基于深度学习的人脸采集识别装置,本实施例与其不同之处在于,所述模型建立单元2中:
进行学习算法的编写,读取上述制作好的人脸文件,进行深度学习,建立学习模型。
所述学习算法的编写,是利用tensorflow多层卷积神经网络编写程序。
卷积神经网络(Convolutional Neural Network,CNN)是一种前馈神经网络,它的人工神经元可以响应一部分覆盖范围内的周围单元,对于大型图像处理有出色表现。卷积神经网络是近年发展起来,并引起广泛重视的一种高效识别方法。一般地,CNN的基本结构包括两层,其一为特征提取层,每个神经元的输入与前一层的局部接受域相连,并提取该局部的特征。一旦该局部特征被提取后,它与其它特征间的位置关系也随之确定下来;其二是特征映射层,网络的每个计算层由多个特征映射组成,每个特征映射是一个平面,平面上所有神经元的权值相等。特征映射结构采用影响函数核小的sigmoid函数作为卷积网络的激活函数,使得特征映射具有位移不变性。此外,由于一个映射面上的神经元共享权值,因而减少了网络自由参数的个数。卷积神经网络中的每一个卷积层都紧跟着一个用来求局部平均与二次提取的计算层,这种特有的两次特征提取结构减小了特征分辨率。
该深度学习可以使用tensorflow库(TensorFlow是谷歌基于DistBelief进行研发的第二代人工智能学习***,其命名来源于本身的运行原理。),在此基础上建立多层卷积神经网络,由于TensorFlow是GOOGLE公开代码,这里就不具体展开深度学习的具体过程。
利用tensorflow多层卷积神经网络编写程序,可以将类别分别定义为幼儿人脸以及成人人脸,这样通过这种学习模式能够正确区分小孩和成人,提高是别的精确度。
实施例12
如上述所述的基于深度学习的人脸采集识别装置,本实施例与其不同之处在于,所述人脸采集单元3中:
将输入的所述视频流保存为图片格式与生成的所述学习模型进行比对,如果图片某区域与模型的比对成功率大于阈值,则认为此区域包含人脸,将此照片的人脸部分进行保存。
所述阈值为80%,这样比对的准确率更高。所述阈值也可以根据实际情况进行设定。
所述比对为调用Testsorflow库与学习模型进行比对。
实施例13
如上述所述的基于深度学习的人脸采集识别装置,本实施例与其不同之处在于,如图9所示,所述人脸识别单元4包括:
人员特征提取子单元41,采集相关人员的人脸照片,并提取所述人脸特征数据,将所述人脸特征数据保存在所述数据库中;
人脸特征提取子单元42,对采集到的视频中的所述人脸,提取所述人脸特征数据;
特征比对子单元43,将视频中的所述人脸特征数据与数据库中的所述人脸特征数据进行1:N比对,确认是否相符。
这样,提高了识别精度。
实施例14
如上述所述的基于深度学习的人脸采集识别装置,本实施例与其不同之处在于,如图10所示,人员特征提取子单元41包括:
人员采集模块411,采集相关人员的人脸照片,将所述人脸照片按照固定大小进行缩放,压缩成固定大小尺寸的图片;
这样每个特征位置比如说嘴唇或者眼睛将大致出现在相同位置;便于进行特征提取和识别。
第一位置确认模块412,确认缩放后的图片中眼睛和嘴唇的位置后,通过分类和回归原理确认其他特征点的位置;
其中,所述回归原理公式为:
这样进行判断更加稳定。
目标函数是分类和回归损失的和,分类采用交叉熵,回归采用所述回归原理公式。
整体损失函数具体为:
人脸图片中特征点的位置如图3所示。
第一特征提取模块413,根据所述特征点的位置,提取人脸特征数据并存在所述数据库中。
所述人脸特征数据提取中,在卷积的最后一层feature map(特征提取图)上使用固定大小的窗口滑动,每个窗口会输出固定大小维度的特征,每一个窗口对候选的9个box进行回归坐标和分类(这里的分类表示box中是不是一个类object(对象),而不是具体的类别)。
所述人脸特征数据提取,可以是利用Testsorflow的深度学习的分类和回归功能实现的,这样便于操作。
实施例15
如上述所述的基于深度学习的人脸采集识别装置,本实施例与其不同之处在于,如图11所示,人脸特征提取子单元42包括:
人脸数据采集模块421,对采集到的视频中的所述人脸照片,将所述人脸照片按照固定大小进行缩放,压缩成固定大小尺寸的图片;
这样每个特征位置比如说嘴唇或者眼睛将大致出现在相同位置;便于进行特征提取和识别。
第二位置确认模块422,确认缩放后的图片中眼睛和嘴唇的位置后,通过分类和回归原理确认其他特征点的位置;
其中,所述回归原理公式为:
这样进行判断更加稳定。
目标函数是分类和回归损失的和,分类采用交叉熵,回归采用所述回归原理公式。
整体损失函数具体为:
人脸图片中特征点的位置如图3所示。
第二特征提取模块423,根据所述特征点的位置,提取人脸特征数据。
所述人脸特征数据提取中,在卷积的最后一层feature map(特征提取图)上使用固定大小的窗口滑动,每个窗口会输出固定大小维度的特征,每一个窗口对候选的9个box进行回归坐标和分类(这里的分类表示box中是不是一个类object(对象),而不是具体的类别)。
所述人脸特征数据提取,可以是利用Testsorflow的深度学习的分类和回归功能实现的,这样便于操作。
实施例16
如上述所述的基于深度学习的人脸采集识别装置,本实施例与其不同之处在于,特征比对子单元43中,由于受到光线、环境、拍摄角度等方面的影响,直接将人脸特征数据与数据库进行1:N人脸特征比对时,可能会出现比对成功率比较低的情况。
为了解决该问题,如图12所示,特征比对子单元43包括:
方块切割模块431,将人脸特征切割为多个方块,由所述方块之间进行特征比对,确认所述方块的比对相似度;
该模块具体为,将人脸特征切割为多个方块,将方块内的特征点与数据库中的每张人脸对应的特征进行比对,确认每个特征点的相似度。
所述人脸特征定义了多个特征点,如图3所示,其中特征点为67个,切割的所述方块需包含人脸的每个特征点。这样,防止遗漏特征点,降低识别的准确性。
在所述方块之间进行特征比对,是将方块内的特征点与数据库中的每张人脸对应的特征进行比对,这样比对目标明确,比对速度快。
方块确定模块432,根据所述比对相似度确定相似度较高的所述方块;
具体为:根据上述确认的每个方块的比对相似度,找出一些较高的方块。
这样某些遮盖住的部分脸部也可顺利进行比对,可以减少因改变服装、表情及环境变化带来的影响。
其中,确定的相似度较高的所述方块至少包含50%特征点(即34个方块),相似度阈值由***根据情况自动确定,也可以将方块根据比对相似度进行排序,确认前34个方块为相似度较高的所述方块(也可以是前66个,具体数量可以根据实际情况确认)。
百分比计算模块433,综合统计各个相似度较高方块的比对相似度,计算出最终的比对百分比,若所述比对百分比超过设定阈值,则认定为相符。
其中,所述计算方法为根据各个方块比对相似度比率求平方平均值。这样计算方便,判断准确。
所述设定阈值为70%,这样可以有较高的准确性。也可以根据实际情况确定。
以上所述仅为本发明的较佳实施例,对本发明而言仅仅是说明性的,而非限制性的。本专业技术人员理解,在本发明权利要求所限定的精神和范围内可对其进行许多改变,修改,甚至等效,但都将落入本发明的保护范围内。

Claims (10)

1.一种基于深度学习的人脸采集识别方法,其特征在于,包括:
步骤S1,收集大量含有人脸的图片并处理成人脸文件;
步骤S2,对所述人脸文件进行深度学习,建立学习模型;
步骤S3,将输入的视频流与所述学习模型比对,对视频中的人脸进行采集;
步骤S4,对采集到的所述人脸,提取人脸特征数据,并将此人脸特征数据与数据库中的人脸特征数据进行比对,确认是否相符。
2.如权利要求1所述的人脸采集识别方法,其特征在于,所述人脸文件包括人脸图片、图片的名字和人脸区域的位置信息。
3.如权利要求1所述的人脸采集识别方法,其特征在于,所述步骤S1包括:
步骤S11,收集大量含有人脸的图片;
步骤S12,进行人脸抠图以及记录各个图片的人脸位置信息,并处理成所述人脸文件。
4.如权利要求1-3中任一所述的人脸采集识别方法,其特征在于,所述步骤S4包括:
步骤S41,采集相关人员的人脸照片,并提取所述人脸特征数据,将所述人脸特征数据保存在所述数据库中;
步骤S42,对采集到的视频中的所述人脸,提取所述人脸特征数据;
步骤S43,将视频中的所述人脸特征数据与数据库中的所述人脸特征数据进行1:N比对,确认是否相符。
5.如权利要求4所述的人脸采集识别方法,其特征在于,所述步骤S41包括:
步骤S411,采集相关人员的人脸照片,将所述人脸照片按照固定大小进行缩放,压缩成固定大小尺寸的图片;
步骤S412,确认缩放后的图片中眼睛和嘴唇的位置后,通过分类和回归原理确认其他特征点的位置;
步骤S413,根据所述特征点的位置,提取人脸特征数据并存储在所述数据库中。
6.如权利要求4所述的人脸采集识别方法,其特征在于,所述步骤S42包括:
步骤S421,对采集到的视频中的所述人脸照片,将所述人脸照片按照固定大小进行缩放,压缩成固定大小尺寸的图片;
步骤S422,确认缩放后的图片中眼睛和嘴唇的位置后,通过分类和回归原理确认其他特征点的位置;
步骤S423,根据所述特征点的位置,提取所述人脸特征数据。
7.如权利要求4所述的人脸采集识别方法,其特征在于,所述步骤S43包括:
步骤S431,将人脸特征切割为多个方块,由所述方块之间进行特征比对,确认所述方块的比对相似度;
步骤S432,根据所述比对相似度确定相似度较高的所述方块;
步骤S433,综合统计各个相似度较高方块的所述比对相似度,计算出最终的比对百分比,若所述比对百分比超过设定阈值,则认定为相符。
8.如权利要求4所述的人脸采集识别方法,其特征在于,所述回归原理公式为:
<mrow> <msub> <mi>Smooth</mi> <msub> <mi>L</mi> <mn>1</mn> </msub> </msub> <mrow> <mo>(</mo> <mi>x</mi> <mo>)</mo> </mrow> <mo>=</mo> <mfenced open = "{" close = ""> <mtable> <mtr> <mtd> <mrow> <mn>0.5</mn> <msup> <mi>x</mi> <mn>2</mn> </msup> </mrow> </mtd> <mtd> <mrow> <mo>|</mo> <mi>x</mi> <mo>|</mo> <mo>&lt;</mo> <mn>1</mn> </mrow> </mtd> </mtr> <mtr> <mtd> <mrow> <mo>|</mo> <mi>x</mi> <mo>|</mo> <mo>-</mo> <mn>0.5</mn> </mrow> </mtd> <mtd> <mrow> <mi>o</mi> <mi>t</mi> <mi>h</mi> <mi>e</mi> <mi>r</mi> <mi>w</mi> <mi>i</mi> <mi>s</mi> <mi>e</mi> </mrow> </mtd> </mtr> </mtable> </mfenced> </mrow> 1
其中,x为参数。
9.一种与权利要求1-8中任一所述的人脸采集识别方法对应的基于深度学习的人脸采集识别装置,其特征在于,包括:
人脸处理单元,收集大量含有人脸的图片并处理成所述人脸文件;
模型建立单元,对所述人脸文件进行深度学习,建立所述学习模型;
人脸采集单元,将输入的视频流与所述学习模型比对,对视频中的人脸进行采集;
人脸识别单元,对采集到的所述人脸,提取所述人脸特征数据,并将此人脸特征数据与数据库中的人脸特征数据进行比对,确认是否相符。
10.如权利要求9所述的人脸采集识别装置,其特征在于,所述人脸识别单元包括:
人员特征提取子单元,采集相关人员的人脸照片,并提取所述人脸特征数据,将所述人脸特征数据保存在所述数据库中;
人脸特征提取子单元,对采集到的视频中的所述人脸,提取所述人脸特征数据;
特征比对子单元,将视频中的所述人脸特征数据与数据库中的所述人脸特征数据进行1:N比对,确认是否相符。
CN201710705219.5A 2017-08-17 2017-08-17 一种基于深度学习的人脸采集识别方法及装置 Active CN107392182B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710705219.5A CN107392182B (zh) 2017-08-17 2017-08-17 一种基于深度学习的人脸采集识别方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710705219.5A CN107392182B (zh) 2017-08-17 2017-08-17 一种基于深度学习的人脸采集识别方法及装置

Publications (2)

Publication Number Publication Date
CN107392182A true CN107392182A (zh) 2017-11-24
CN107392182B CN107392182B (zh) 2020-12-04

Family

ID=60353143

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710705219.5A Active CN107392182B (zh) 2017-08-17 2017-08-17 一种基于深度学习的人脸采集识别方法及装置

Country Status (1)

Country Link
CN (1) CN107392182B (zh)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108388877A (zh) * 2018-03-14 2018-08-10 广州影子控股股份有限公司 一种猪脸的识别方法
CN108520184A (zh) * 2018-04-16 2018-09-11 成都博锐智晟科技有限公司 一种隐私保护的方法及***
CN109190442A (zh) * 2018-06-26 2019-01-11 杭州雄迈集成电路技术有限公司 一种基于深度级联卷积神经网络的快速人脸检测方法
CN109887234A (zh) * 2019-03-07 2019-06-14 百度在线网络技术(北京)有限公司 一种防儿童走失方法、装置、电子设备及存储介质
CN110807859A (zh) * 2019-10-31 2020-02-18 上海工程技术大学 一种地铁人流量动态监控及高精度识别闸机***
CN110895663A (zh) * 2018-09-12 2020-03-20 杭州海康威视数字技术股份有限公司 一种两轮车识别方法、装置、电子设备及监控***
CN111079720A (zh) * 2020-01-20 2020-04-28 杭州英歌智达科技有限公司 一种基于聚类分析自主再学习的人脸识别方法
CN111428683A (zh) * 2020-04-13 2020-07-17 北京计算机技术及应用研究所 一种基于tensorflow的web前端图像合成方法
CN111860047A (zh) * 2019-04-26 2020-10-30 美澳视界(厦门)智能科技有限公司 一种基于深度学习的人脸快速识别方法
JP2021504214A (ja) * 2018-10-19 2021-02-15 シャンハイ センスタイム インテリジェント テクノロジー カンパニー リミテッド 運転環境知能化調整、運転者登録方法及び装置、車両並びにデバイス

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104573679A (zh) * 2015-02-08 2015-04-29 天津艾思科尔科技有限公司 监控场景下基于深度学习的人脸识别***
CN104636730A (zh) * 2015-02-10 2015-05-20 北京信息科技大学 人脸验证的方法和装置
CN105354543A (zh) * 2015-10-29 2016-02-24 小米科技有限责任公司 视频处理方法及装置
CN105447441A (zh) * 2015-03-19 2016-03-30 北京天诚盛业科技有限公司 人脸认证方法和装置
CN105808709A (zh) * 2016-03-04 2016-07-27 北京智慧眼科技股份有限公司 人脸识别快速检索方法及装置
US20160275341A1 (en) * 2015-03-18 2016-09-22 Adobe Systems Incorporated Facial Expression Capture for Character Animation
CN106295501A (zh) * 2016-07-22 2017-01-04 中国科学院自动化研究所 基于唇部运动的深度学习身份识别方法
CN106951846A (zh) * 2017-03-09 2017-07-14 广东中安金狮科创有限公司 一种人脸3d模型录入和识别方法和装置

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104573679A (zh) * 2015-02-08 2015-04-29 天津艾思科尔科技有限公司 监控场景下基于深度学习的人脸识别***
CN104636730A (zh) * 2015-02-10 2015-05-20 北京信息科技大学 人脸验证的方法和装置
US20160275341A1 (en) * 2015-03-18 2016-09-22 Adobe Systems Incorporated Facial Expression Capture for Character Animation
CN105447441A (zh) * 2015-03-19 2016-03-30 北京天诚盛业科技有限公司 人脸认证方法和装置
CN105354543A (zh) * 2015-10-29 2016-02-24 小米科技有限责任公司 视频处理方法及装置
CN105808709A (zh) * 2016-03-04 2016-07-27 北京智慧眼科技股份有限公司 人脸识别快速检索方法及装置
CN106295501A (zh) * 2016-07-22 2017-01-04 中国科学院自动化研究所 基于唇部运动的深度学习身份识别方法
CN106951846A (zh) * 2017-03-09 2017-07-14 广东中安金狮科创有限公司 一种人脸3d模型录入和识别方法和装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
野孩子1991: "faster rcnn的源码理解(一)SmoothL1LossLayer论文与代码的结合理解", 《网页在线公开:HTTPS://BLOG.CSDN.NET/U010668907/ARTICLE/DETAILS/51456928》 *

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108388877A (zh) * 2018-03-14 2018-08-10 广州影子控股股份有限公司 一种猪脸的识别方法
CN108520184A (zh) * 2018-04-16 2018-09-11 成都博锐智晟科技有限公司 一种隐私保护的方法及***
CN109190442A (zh) * 2018-06-26 2019-01-11 杭州雄迈集成电路技术有限公司 一种基于深度级联卷积神经网络的快速人脸检测方法
CN109190442B (zh) * 2018-06-26 2021-07-06 杭州雄迈集成电路技术股份有限公司 一种基于深度级联卷积神经网络的快速人脸检测方法
CN110895663A (zh) * 2018-09-12 2020-03-20 杭州海康威视数字技术股份有限公司 一种两轮车识别方法、装置、电子设备及监控***
JP2021504214A (ja) * 2018-10-19 2021-02-15 シャンハイ センスタイム インテリジェント テクノロジー カンパニー リミテッド 運転環境知能化調整、運転者登録方法及び装置、車両並びにデバイス
CN109887234A (zh) * 2019-03-07 2019-06-14 百度在线网络技术(北京)有限公司 一种防儿童走失方法、装置、电子设备及存储介质
CN111860047A (zh) * 2019-04-26 2020-10-30 美澳视界(厦门)智能科技有限公司 一种基于深度学习的人脸快速识别方法
CN111860047B (zh) * 2019-04-26 2024-06-11 美澳视界(厦门)智能科技有限公司 一种基于深度学习的人脸快速识别方法
CN110807859A (zh) * 2019-10-31 2020-02-18 上海工程技术大学 一种地铁人流量动态监控及高精度识别闸机***
CN111079720A (zh) * 2020-01-20 2020-04-28 杭州英歌智达科技有限公司 一种基于聚类分析自主再学习的人脸识别方法
CN111428683A (zh) * 2020-04-13 2020-07-17 北京计算机技术及应用研究所 一种基于tensorflow的web前端图像合成方法

Also Published As

Publication number Publication date
CN107392182B (zh) 2020-12-04

Similar Documents

Publication Publication Date Title
CN107392182A (zh) 一种基于深度学习的人脸采集识别方法及装置
CN104143079B (zh) 人脸属性识别的方法和***
CN100397410C (zh) 基于视频的面部表情识别方法及装置
CN109522853B (zh) 面向监控视频的人脸检测与搜索方法
Fouhey et al. People watching: Human actions as a cue for single view geometry
Asif et al. Privacy preserving human fall detection using video data
CN102682309B (zh) 一种基于模板学习的人脸注册方法及装置
CN108960076B (zh) 基于卷积神经网络的耳朵识别与跟踪方法
CN113963445A (zh) 一种基于姿态估计的行人摔倒动作识别方法及设备
CN104112114A (zh) 身份验证方法和装置
CN107808376A (zh) 一种基于深度学习的举手检测方法
CN110263768A (zh) 一种基于深度残差网络的人脸识别方法
WO2019153175A1 (zh) 基于机器学习的遮挡人脸识别***、方法及存储介质
Hsu et al. Hierarchical Network for Facial Palsy Detection.
CN104143076A (zh) 人脸形状的匹配方法和***
CN111488943A (zh) 人脸识别的方法及设备
CN109063643A (zh) 一种用于脸部信息部分隐藏条件下的面部表情痛苦度识别方法
CN103106414A (zh) 一种智能视频监控中行人的检测方法
CN110688980A (zh) 基于计算机视觉的人体姿态分类方法
Wu et al. Kinship verification from faces: Methods, databases and challenges
WO2019091988A1 (en) Change-aware person identification
Echoukairi et al. Improved Methods for Automatic Facial Expression Recognition.
Chen et al. Human posture recognition based on skeleton data
Bai et al. Exploration of computer vision and image processing technology based on OpenCV
CN115937971B (zh) 一种举手投票识别方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant