CN108985159A - 人眼模型训练方法、人眼识别方法、装置、设备及介质 - Google Patents
人眼模型训练方法、人眼识别方法、装置、设备及介质 Download PDFInfo
- Publication number
- CN108985159A CN108985159A CN201810585092.2A CN201810585092A CN108985159A CN 108985159 A CN108985159 A CN 108985159A CN 201810585092 A CN201810585092 A CN 201810585092A CN 108985159 A CN108985159 A CN 108985159A
- Authority
- CN
- China
- Prior art keywords
- eye
- sample data
- facial image
- human
- sample
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/161—Detection; Localisation; Normalisation
- G06V40/165—Detection; Localisation; Normalisation using facial parts and geometric relationships
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2411—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/18—Eye characteristics, e.g. of the iris
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Biology (AREA)
- General Health & Medical Sciences (AREA)
- Oral & Maxillofacial Surgery (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Geometry (AREA)
- Ophthalmology & Optometry (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种人眼模型训练方法、人眼识别方法、装置、设备及介质,该方法包括:获取人脸图像样本并对该人脸图像样本进行标记以得到人脸图像样本数据,提取人脸图像样本的特征向量,将人脸图像样本数据划分为训练样本数据和验证样本数据;采用训练样本数据训练支持向量机分类器,得到支持向量机分类器的临界面;计算验证样本数据中的验证样本的特征向量与临界面的向量距离;获取预设真正类率或预设假正类率,根据向量距离和与验证样本对应的标注数据获取分类阈值,并根据分类阈值获取人眼判断模型。采用该人眼模型训练方法,能够得到判断人眼是否有遮挡的准确率较高的人眼判断模型。
Description
技术领域
本发明涉及计算机技术领域,尤其涉及一种人眼模型训练方法、人眼识别方法、装置、设备及介质。
背景技术
随着人工智能的快速发展,人眼定位识别得到了广泛的关注成为了人工智能领域的热门话题。传统地,在现有的人脸特征点识别算法中,可以从人脸图片中标注出不同器官的位置,例如眼睛、耳朵、嘴巴或者鼻子等,即使对应部位有所遮挡(眼镜、头发、捂嘴等动作),该算法还是可以识别不同部件的相对位置,并提供对应的图片。然而,在一些图片处理过程中,需要的是无遮挡的眼睛图像,而常规采用人脸特征点识别算法识别出来的眼睛图片却无法对有遮挡的图片进行筛选,容易引入误差,不利于后续进一步地处理需要。
发明内容
基于此,有必要针对上述技术问题,提供一种可以提高模型训练效率的人眼模型训练方法、装置、计算机设备及存储介质。
此外,还有必要提出一种人眼识别方法,其根据人眼模型训练方法进行训练后,利用训练好的人眼图片进行识别,以提高人眼识别的准确率。
一种人眼模型训练方法,包括:
获取人脸图像样本,并对所述人脸图像样本进行标记以得到人脸图像样本数据,及提取所述人脸图像样本数据中的人脸图像样本的特征向量,其中,人脸图像样本数据包括人脸图像样本和标注数据;
将所述人脸图像样本数据划分为训练样本数据和验证样本数据;
采用所述训练样本数据训练支持向量机分类器,得到所述支持向量机分类器的临界面;
计算所述验证样本数据中的验证样本的特征向量与所述临界面的向量距离;
获取预设真正类率或预设假正类率,根据所述向量距离和与验证样本数据对应的标注数据获取分类阈值;
根据所述分类阈值,获取人眼判断模型。
一种人眼模型训练装置,包括:
人脸图像样本数据获取模块,用于获取人脸图像样本,并对所述人脸图像样本进行标记以得到人脸图像样本数据,及提取所述人脸图像样本数据中的人脸图像样本的特征向量,其中,人脸图像样本数据包括人脸图像样本和标注数据;
人脸图像样本数据划分模块,用于将所述人脸图像样本数据划分为训练样本数据和验证样本数据;
临界面获取模块,用于采用所述训练样本数据训练支持向量机分类器,得到所述支持向量机分类器的临界面;
向量距离计算模块,用于计算所述验证样本数据中的验证样本的特征向量与所述临界面的向量距离;
分类阈值获取模块,用于获取预设真正类率或预设假正类率,根据所述向量距离和与验证样本数据对应的标注数据获取分类阈值;
人眼判断模型获取模块,用于根据所述分类阈值,获取人眼判断模型。
一种人眼识别方法,包括:
获取待识别人脸图片,采用人脸特征点检测算法获取正向的眼睛区域图像;
对所述正向的眼睛区域图像进行归一化处理,得到待识别眼睛图像;
将所述待识别眼睛图像输入到所述人眼模型训练方法训练得到的人眼判断模型进行识别,获取识别结果。
一种人眼识别装置,包括:
待识别人脸图片获取模块,用于获取待识别人脸图片,采用人脸特征点检测算法获取正向的眼睛区域图像;
待识别眼睛图像获取模块,用于对所述正向的眼睛区域图像进行归一化处理,得到待识别眼睛图像;
识别结果获取模块,用于将所述待识别眼睛图像输入到所述的人眼模型训练方法训练得到的人眼判断模型进行识别,获取识别结果。
一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述人眼模型训练方法的步骤,或者,所述处理器执行所述计算机程序时实现上述人眼识别方法的步骤。
一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述人眼模型训练方法的步骤,或者,所述处理器执行所述计算机程序时实现上述人眼识别方法的步骤。
上述人眼模型训练方法、装置、设备及介质,首先获取人脸图像样本,并对人脸图像样本进行标记以得到人脸图像样本数据,提取人脸图像样本数据中的人脸图像样本的特征向量,其中,人脸图像样本数据包括人脸图像样本和标注数据;然后将人脸图像样本数据划分为训练样本数据和验证样本数据;采用所述训练样本数据训练支持向量机分类器,得到所述支持向量机分类器的临界面,简化了支持向量机分类器的分类过程。计算验证样本数据中的验证样本的特征向量与临界面的向量距离,直观地比较各个验证样本与其所属类别的接近程度。获取预设真正类率或预设假正类率,根据向量距离和与验证样本数据对应的标注数据获取分类阈值;并根据分类阈值,获取人眼判断模型,将待识别人脸图像输入到该人眼判断模型后,会直接根据分类阈值给出是或者否的分类结果,因而能够避免重复训练,提高人眼模型训练的效率。
上述人眼识别方法、装置、设备及介质,首先获取待识别人脸图片,采用人脸特征点检测算法获取正向的眼睛区域图像,然后对正向的眼睛区域图像进行归一化处理,得到待识别眼睛图像,将待识别眼睛图像输入到人眼判断模型中进行识别,获取识别结果。采用该人眼判断模型对待识别眼睛图像进行识别时,可以快速识别出该人脸图片眼睛有无遮挡,提高识别效率。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的人眼模型训练方法、人眼识别方法的应用环境示意图;
图2是本发明实施例提供的人眼模型训练方法的实现流程图;
图3是本发明实施例提供的人眼模型训练方法中步骤S10的实现流程图;
图4是本发明实施例提供的人眼模型训练方法中步骤S30的实现流程图;
图5是本发明实施例提供的人眼模型训练方法中步骤S15的实现流程图;
图6是本发明实施例提供的人眼模型训练方法中步骤S50的实现流程图;
图7是本发明实施例提供的人眼模型训练装置的示意图;
图8是本发明实施例提供的人眼识别方法的实现流程图;
图9是本发明实施例提供的人眼识别装置的示意图;
图10是本发明实施例提供的计算机设备的示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本申请提供的人眼模型训练方法,可应用在如图1的应用环境中,其中,客户端通过网络与服务端进行通信,服务端接收客户端发送的训练样本数据并建立人眼判断模型,进而接收客户端发送的验证样本,进行人眼判断模型训练。其中,客户端可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备。服务端可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
在一个实施例中,如图2所示,以该方法应用于图1中的服务端为例进行说明,包括如下步骤:
S10:获取人脸图像样本,并对人脸图像样本进行标记以得到人脸图像样本数据,及提取人脸图像样本数据中的人脸图像样本的特征向量,其中,人脸图像样本数据包括人脸图像样本和标注数据。
其中,人脸图像样本数据是用于进行模型训练的人眼图像数据。人脸图像样本的特征向量是指人脸图像样本数据中用于表征每一人脸图像样本的图像信息特征的向量,例如:HOG(Histogram of Oriented Gradient,梯度方向直方图)特征向量、LBP(LocalBinary Patterns,局部二值模式)特征向量或PCA(Principal Component Analysis,主成分分析)特征向量等。特征向量能够以简单的数据表征图像信息,避免后续训练过程重复的提取操作。
优选地,本实施例中可以提取人脸图像样本的HOG特征向量。由于人脸图像样本的HOG特征向量是通过人脸图像样本的局部信息的梯度来描述,因此,提取人脸图像样本的HOG特征向量能够避免几何形变和光线变化等因素对人眼模型训练的影响。对人脸图像样本进行标记,是指将人脸图像样本依据样本的内容分为正样本(无遮挡的眼睛图像)和负样本(有遮挡的眼睛图像),对这两种样本数据分别进行标注后,得到了人脸图像样本数据。人脸图像样本中包括正样本和负样本,可以理解地,人脸图像样本数据包括人脸图像样本和标注数据。优选地,负样本数量是正样本数量的2-3倍,可以使得样本信息更加全面,提高模型训练的准确度。
在这个实施方式中,通过获取人脸图像样本数据,以便后续进行模型训练,并且通过把有遮挡的眼睛图像作为人脸图像样本进行训练,从而能够降低误检率。
可选地,该人脸图像样本数据包括但不限于预先采集的人脸图像样本和预先存储在存储器中常用人脸库中的人脸图像样本。
S20:将人脸图像样本数据划分为训练样本数据和验证样本数据。
其中,训练样本数据是用于学习的样本数据,通过匹配一些参数来建立分类器,即采用训练样本数据中的人脸图像样本训练机器学习模型,以确定机器学习模型的参数。验证样本数据是用于验证训练好的机器学习模型的分辨能力(如识别率)的样本数据。可选地,将人脸图像样本数据的70%-75%的数目作为训练样本数据,其余的作为验证样本数据。在一具体实施方式中,选取300个正样本和700个负样本一共1000个人脸图像样本组合成人脸图像样本数据,其中的260个样本作为验证样本数据,740个样本作为训练样本数据。
S30:采用训练样本数据训练支持向量机分类器,得到支持向量机分类器的临界面。
支持向量机(Support Vector Machine,SVM)分类器是一个由分类临界面定义的判别分类器,用于对数据进行分类或者回归分析。临界面为能够将正样本和负样本这两类样本正确分开,并且使两类样本距离最大的分类面。具体地,根据人脸图像样本数据的特点,选取合适核函数,然后将训练样本数据的特征向量与核函数进行核函数运算,使得训练样本数据的特征向量映射到一个高维度特征空间,实现该特征向量在这个高维度特征空间的线性可分,得到临界面,并将临界面作为对训练样本数据进行分类的分类面,将正样本和负样本分开。具体地,输入训练样本数据,支持向量机分类器将会输出一个临界面对训练样本数据进行分类。通过获取临界面简化了支持向量机分类器的分类过程。
本实施例中,通过将人脸图像样本的特征向量训练支持向量机分类器,得到临界面,具有良好的分类能力,提高了人眼模型训练的效率。
S40:计算验证样本数据中的验证样本的特征向量与临界面的向量距离。
其中,验证样本数据是预先存储的用于验证的人脸图像样本数据,其中包括了正样本数据(无遮挡的眼睛图像)和负样本数据(有遮挡的眼睛图像),对这两种样本数据分别进行标注后得到验证样本。其中,验证样本的特征向量是指对验证样本进行特征向量提取后获得的特征向量。
验证样本的特征向量包括但不限于:HOG特征向量、LBP特征向量和PCA特征向量等。
其中,验证样本数据中的验证样本的特征向量与临界面的向量距离是指验证样本的特征向量在数学意义上对应的有向线段与临界面在数学意义上对应的一个平面二者的距离,即数学意义上线到面的距离,其距离为一数值,该距离即为向量距离。假设临界面的表达式为g(x)=wx+b,式中w为多维向量,可表示为w=[w1,w2,w3...wn],那么特征向量x到临界面的向量距离的表达式为式中||w||表示w的范数,即
通过计算验证样本数据中的验证样本的特征向量与临界面的向量距离,能够直观地比较各个验证样本与其所属类别的接近程度。
S50:获取预设真正类率或预设假正类率,根据向量距离和与验证样本数据对应的标注数据获取分类阈值。
预设真正类率是指预先设定的判断为正样本且结果正确的数量占总的正样本数量的比值,预设假正类率是指预先设定的判断为负样本且结果错误的数量占总的正样本数量的比值。在本实施例中,真正类率是指将无遮挡的眼睛图像判断为无遮挡的眼睛的人脸图像样本占总的无遮挡的眼睛图像的人脸图像样本的比值,假正类率是指有遮挡的眼睛图像判断为无遮挡的眼睛的人脸图像样本占总的无遮挡的眼睛图像的人脸图像样本的比值。容易理解地,真正类率越高或者假正类率越低,说明目标的分类要求越严格,能适应更多的应用场合。优选地,本实施例中的预设真正类率为95%时,或者预设假正类率5%时,能够取得很好的分类效果,能够适应多种不同应用场合,通过合理设置真正类率或假正类率,从而较好地扩展支持向量机分类器的适应性。
应理解,此处预设真正类率或预设假正类率,为本发明优选范围,但可以根据实际应用场合的需要进行设置,此处不做限制。
分类阈值是用于对样本进行分类的临界值,具体地,对样本进行分类时,低于分类阈值的判断为正样本,高于分类阈值的判断为负样本。
具体地,与验证样本数据对应的标注数据是指验证样本的标注,例如:将正样本标记为1,将负样本标记为-1。在获得了验证样本的特征向量与临界面的向量距离和验证样本的标注数据后,根据预设真正类率或预设假正类率计算得到分类阈值。
例如预设假正类率为10%,有S1,S2...S15共15个验证样本,其中有5个正样本,10个负样本,10个负样本的特征向量与临界面的向量距离分别为1,2…10,那么此时分类阈值在区间[1,2]时,如分类阈值取1.5,能够满足10%的预设假正类率。
S60:根据分类阈值,获取人眼判断模型。
具体地,人眼判断模型是指用于判断人脸图像样本中的眼睛位置是否有遮挡的模型。确定分类阈值之后,通过将人脸图像样本数据的特征向量与支持向量机分类器的临界面的向量距离,并与分类阈值比较,根据比较结果对人脸图像样本数据进行分类,进而确定人脸图像样本中的眼睛位置为有遮挡或者为无遮挡的两种情形。因此,给定分类阈值后,人眼判断模型就建立完成,将待识别人脸图像输入到该人眼判断模型后,会直接根据分类阈值给出是或者否的分类结果,因而能够避免重复训练,提高人眼模型训练的效率。
在本实施例中,首先获取人脸图像样本并对人脸图像样本进行标记以得到人脸图像样本数据,提取人脸图像样本数据中的人脸图像样本的特征向量,然后将人脸图像样本数据划分为训练样本数据和验证样本数据;采用训练样本数据训练支持向量机分类器,得到支持向量机分类器的临界面,从而简化了分类的过程,接着计算验证样本数据中的验证样本的特征向量与支持向量机分类器的临界面的向量距离,能够直观地比较各个验证样本与其所属类别的接近程度,获取预设真正类率或预设假正类率,以便扩展支持向量机分类器的适应性,根据向量距离和与验证样本数据对应的标注数据获取分类阈值,最后获取人眼判断模型,避免重复训练,提高人眼模型训练的效率。
在一实施例中,如图3所示,步骤S10中,即提取人脸图像样本数据中的人脸图像样本的特征向量,具体包括如下步骤:
S11:采用人脸特征点检测算法获取人脸特征点,人脸特征点包括:左眼角点、右眼角点和眉心点;其中,左眼角点、右眼角点和眉心点是属于同一眼睛区域的特征点。
其中,人脸特征点检测算法是指用于检测人脸五官特征并标记出位置信息的算法。人脸特征点是指眼角点、鼻翼点和嘴角点等用于标志眼、鼻和嘴等脸部轮廓的点。具体地,人脸特征点检测算法包括但不限于根据深度学习的人脸特征点检测算法、根据模型的人脸特征点检测算法或者根据级联形状回归的人脸特征点检测算法等。
可选地,可以采用OpenCV自带的根据Harr特征的Viola-Jones算法获取人脸特征点。其中,OpenCV是一个跨平台计算机视觉库,可以运行在Linux、Windows、Android和MacOS操作***上,由一系列C函数和少量C++类构成,同时提供了Python、Ruby、MATLAB等语言的接口,实现了图像处理和计算机视觉方面的很多通用算法,而根据Harr特征的Viola-Jones算法是其中一种人脸特征点检测算法。Haar特征是一种反映图像的灰度变化的特征,是反映像素分模块差值的一种特征。Haar特征分为三类:边缘特征、线性特征和中心-对角线特征。Viola-Jones算法是根据人脸的haar特征值进行人脸检测的方法。
具体地,获取输入的人脸图像样本数据,对人脸图像样本数据进行预处理,接着依次进行肤色区域分割、人脸特征区域分割和人脸特征区域分类的步骤,最后根据Harr特征的Viola-Jones算法与人脸特征区域分类进行匹配计算,得到人脸图像的人脸特征点信息。
本实施例中,通过采用人脸特征点检测算法获取到人脸图像样本的左眼角点、右眼角点和眉心点,以便根据这几个特征点的位置信息确定人脸图像样本的眼睛所在区域。可以理解地,本步骤中提及的左眼角点、右眼角点和眉心点是属于同一个眼睛区域的三个特征点,例如左眼对应的三个特征点或者右眼对应的三个特征点。在一个实施方式中,对一个人脸图像样本,只采集其中一只眼睛(左眼或者右眼)的图像即可。若有需要处理两只眼睛时,在采集一只眼睛的图像之后,对其做镜像处理即可作为一个人脸图像样本中另一个眼睛的图像,以节省采集时间,提高数据处理效率。
S12:根据左眼角点和右眼角点对人脸图像样本进行正向调整。
其中,正向调整是对人脸特征点的方位进行规范化并设置为正向的调整。本实施例中,正向调整是指是指将左眼角点和右眼角点调整在同一水平线上(即左眼角点和右眼角点的纵坐标相等),从而将人眼特征点规范化到同一方位,以避免训练样本方位变化对模型训练的影响。提高人脸图像样本对方位变化的鲁棒性。
S13:根据左眼角点、右眼角点和眉心点构建眼睛矩形区域。
其中,眼睛矩形区域是指包括眼睛图像的一个矩形区域,在一具体实施方式中,采用人脸特征点检测算法定位出左眼角点、右眼角点和眉心点的位置坐标,眼睛矩形区域以左眼角点的横坐标为左侧坐标,以右眼角点的横坐标为右侧坐标,以眉心点的纵坐标为上侧坐标,以左眼角点纵坐标(或者右眼角点纵坐标)加上眉心点到左眼角点垂直方向的距离为下侧坐标,以这四个点坐标(左侧坐标、右侧坐标、上侧坐标和下侧坐标)构成的矩形区域即为眼睛矩形区域。
S14:对眼睛矩形区域进行图像归一化处理,得到归一化眼睛矩形区域。
其中,归一化处理是指对待处理的图像进行一系列变换以使待处理的图像转换成相应的标准形式。如图像的尺寸归一化、图像的灰度归一化等。优选地,归一化处理是指对眼睛矩形区域进行尺寸归一化。具体地,将眼睛矩形区域依据人脸图像样本的分辨率设置为固定尺寸,例如:眼睛矩形区域可以设置为Size(48,32)矩形,即长为48像素,宽为32像素的矩形区域,通过将眼睛矩形区域设置为固定尺寸,以便后续减少特征向量提取的复杂度。
容易理解地,对眼睛矩形区域进行图像归一化处理,有利于后续支持向量机模型的训练,能够避免大数值区间的属性过分支配了小数值区间的属性,而且还能避免计算过程中数值复杂度。
S15:根据归一化眼睛矩形区域提取HOG特征向量。
HOG(Histogram of Oriented Gradient,HOG)特征向量,是用于描述图像局部区域的梯度方向信息的向量,该特征受图像尺寸位置等变化影响较大,输入图像范围固定使计算得到的HOG特征向量更统一,模型训练时可以更多关注无遮挡眼睛图像与有遮挡眼睛图像的区别而不需要注意眼睛位置的变化,训练更方便,同时HOG特征向量本身关注的即是图像梯度特征而不是颜色特征,受光照变化以及几何形状变化的影响不大,因此,提取HOG特征向量能够方便高效地对人脸图像样本进行特征向量的提取。其中,根据分类检测目标的不同,对于特征提取也不同的,一般是将颜色、纹理以及形状作为目标特征。根据对检测人眼图像准确度的要求,本实施例选择采用形状特征,采用训练样本的HOG特征向量。
在本实施例中,采用人脸特征点检测算法获取人脸特征点的左眼角点、右眼角点和眉心点;然后对图像样本进行正向调整,以提高人脸图片对方向变化的鲁棒性,接着构建眼睛矩形区域并对眼睛矩形区域进行图像归一化处理,得到归一化眼睛矩形区域,有利于后续支持向量机模型的训练,最后提取归一化眼睛矩形区域HOG特征向量,从而方便高效地对人脸图像样本数据中的人脸图像样本进行特征向量的提取。
在一实施例中,如图4所示,步骤S30中,即采用训练样本数据训练支持向量机分类器,得到支持向量机分类器的临界面,具体包括如下步骤:
S31:获取支持向量机分类器的核函数和支持向量机分类器的惩罚参数,采用以下公式求解拉格朗日乘子和决策阈值b:
式中,s.t.是数学公式中约束条件的缩写,min是指在约束条件下取代数式的最小值,K(xi,xj)为支持向量机分类器的核函数,C为支持向量机分类器的惩罚参数,C>0,αi与拉格朗日乘子是共轭关系,xi为训练样本数据的特征向量,l为训练样本数据的特征向量的个数,yi为训练样本数据的标注。
其中,核函数是支持向量机分类器中的核函数,用于对训练支持向量机分类器过程中输入的训练样本的特征向量进行核函数运算,支持向量机分类器的核函数包括但不限于线性核函数、多项式核函数、高斯核函数、高斯核函数和基于径向基核函数,因为本实施例中的支持向量机分类器是线性可分的,优选地,本实施例中采用线性核函数作为支持向量机分类器中的核函数,因此K(xi,xj)=(xi,xj),线性核参数具有参数少、运算速度快的特点,适用于线性可分的情况。yi为训练样本数据的标注,因为是支持向量机分类器的二分类问题,因此yi可以为1或者-1两类,若人脸图像样本为正样本则yi=1,若人脸图像样本为负样本则yi=-1。
惩罚参数C是用于对支持向量机分类器进行优化的参数,是一个确定数值。可以解决样本偏斜的分类问题,具体地,参与分类的两个类别(也可以指多个类别)样本数量差异很大,例如正样本有10000个而负样本有100个,如此会产生样本偏斜问题,此时正样本分布范围广,为解决样本偏斜问题,具体地,可依据正样本数量与负样本数量的比例合理增大C的取值。C越大,表示分类器的容错性小。决策阈值b用于确定支持向量机分类器过程中的决策分类的临界值,是一个实数。
具体地,通过获取合适的核函数K(xi,xj),并设定合适的惩罚参数C,采用公式对训练样本数据的特征向量与核函数进行核函数运算后,求解最优问题,即求取拉格朗日乘子的值,使得核函数运算后的结果达到最小,得到了然后,确定开区间(0,C)范围中的的分量并根据计算b值。
求解了支持向量机分类器的中的拉格朗日乘子和决策阈值b,从而获取较好的参数,以便构建高效的支持向量机分类器。
S32:根据拉格朗日乘子和决策阈值b,采用如下公式,得到支持向量机分类器的临界面g(x):
通过训练支持向量机分类器得到拉格朗日乘子和决策阈值b后,即调整训练样本的拉格朗日乘子和决策阈值b这两个参数后,并代入到公式中,即得到支持向量机分类器的临界面。
容易理解地,通过计算得到临界面,以便后续人脸图像样本根据临界面对训练样本分类,训练程序先提取并保存样本的特征向量,从而可以在不断调整训练参数多次训练过程中节省提取特征的时间,尽快得到符合要求的训练参数。这样可以调整临界面对某一分类的误报率和准确率,而不需要经常重复训练模型,提高了模型训练效率。
本实施例中,首先获取合适的核函数K(xi,xj),并设定合适的惩罚参数C,将训练样本数据的特征向量与核函数进行核函数运算,求解支持向量机分类器中的决策阈值b,从而获取较好的参数,构建支持向量机分类器,然后将拉格朗日乘子和决策阈值b这两个参数代入到公式中,得到临界面g(x),以便后续人脸图像样本根据临界面对训练样本数据分类,而不需要经常重复训练模型,提高了模型训练的效率。
在一实施例中,如图5所示,步骤S15中,即根据归一化眼睛矩形区域提取HOG特征向量,具体包括如下步骤:
S151:将归一化眼睛矩形区域划分成细胞单元,并计算细胞单元的每个像素梯度的大小和方向。
具体地,根据实际需要及对支持向量机分类器的要求不同,对归一化眼睛矩形区域划分的方式也不同。子区域与子区域可重叠也可以不重叠。细胞单元是指图像的连通子区域,即每个子区域是由多个细胞单元组成,例如,一幅48*32的归一化眼睛矩形区域,假设一个细胞单元为4*4像素,将2*2个细胞组成一个子区域,那么这个归一化眼睛矩形区域有6*4个子区域。每个细胞单元的梯度方向区间0°到180°分成了9个区间,因此可以用一个9维向量描述一个细胞单元。
获取归一化眼睛矩形区域每个像素梯度的大小和方向具体过程为:首先获取每个像素的梯度,假如像素为(x,y),其梯度计算公式如下:
其中,Gx(x,y)为像素(x,y)的水平方向梯度,其中Gy(x,y)为像素(x,y)的垂直方向梯度,H(x,y)为像素(x,y)的灰度值。然后采用以下公式计算该像素的梯度大小:
其中,G(x,y)为像素梯度的大小。
最后,采用以下公式计算像素梯度的方向:
其中,α(x,y)为像素梯度的方向的方向角。
S152:统计细胞单元的每个像素梯度的大小和方向的梯度直方图。
其中,梯度直方图是指对像素梯度的大小和方向进行统计得到的直方图,用于表征每个细胞单元的梯度信息。具体地,首先将每个细胞单元的梯度方向从0°到180°均匀地分成9个方向块,即0°-20°是第一个方向块,20°-40°第二个方向块,依此类推,160°-180°为第九个方向块。然后判断细胞单元的像素梯度的方向所在的方向块,并加上该方向块的像素梯度的大小。例如,一个细胞单元的某一像素的方向落在40°-60°,就将梯度直方图第三个方向上的像素值加上该方向的像素梯度的大小,从而得到该细胞单元的梯度直方图。
S153:串联梯度直方图,得到HOG特征向量。
其中,串联是指对各个细胞单元的梯度直方图按照自左向右、自上向下的顺序将所有梯度直方图合并,从而得到归一化眼睛矩形区域的HOG特征向量。
本实施例中,通过将归一化眼睛矩形区域分成若干个小区域,然后计算各个小区域的梯度直方图,最后将各个小区域对应的梯度直方图串联一起,得到整幅归一化眼睛矩形区域的梯度直方图,用于描述人脸图像样本的特征向量,同时HOG特征向量本身关注的即是图像梯度特征而不是颜色特征,受光照变化影响不大。提取HOG特征向量能够方便高效地对人眼图像进行识别。
在一实施例中,如图6所示,步骤S50中,即获取预设真正类率或假正类率,根据向量距离和与验证样本数据对应的标注数据获取分类阈值,具体包括如下步骤:
S51:根据向量距离和与验证样本数据对应的标注数据绘制ROC曲线。
其中,ROC曲线指受试者工作特征曲线/接收器操作特性曲线(receiveroperating characteristic curve),是反映敏感性和特异性连续变量的综合指标,是用构图法揭示敏感性和特异性的相互关系。本实施例中,ROC曲线显示的是支持向量机分类器真正类率和假正类率之间的关系,该曲线越靠近左上角分类器的准确性越高。
在验证训练样本中将样本进行了正负样本的分类:正样本(positive)或负样本(negative)。在对验证训练样本中的人脸图像数据进行分类的过程中,会出现四种情况:如果人脸图像数据是正样本并且也被预测成正样本,即为真正类(True positive,TP),如果人脸图像数据是负样本被预测成正样本,称之为假正类(False positive,FP)。相应地,如果人脸图像数据是负样本被预测成负样本,称之为真负类(True negative,TN),正样本被预测成负样本则为假负样本(false negative,FN)。
真正类率(true positive rate,TPR)刻画的是分类器所识别出的正实例占所有正实例的比例,计算公式为TPR=TP/(TP+FN)。假正类率(false positive rate,FPR)刻画的是分类器错认为正样本的负实例占所有负实例的比例,计算公式为FPR=FP/(FP+TN)。
ROC曲线的绘制过程为:根据验证样本数据的特征向量和临界面特征向量的向量距离和对应的验证样本数据标注,获得众多验证样本的真正类率和假正类率,ROC曲线以假正类率为横轴,以真正类率为纵轴,连接各点即众多验证样本的真正类率和假正类率,绘制曲线,然后计算曲线下的面积,面积越大,判断价值越高。
在一具体实施方式中,可通过ROC曲线绘制工具进行绘制,具体地,通过matlab中的plotSVMroc(true_labels,predict_labels,classnumber)函数绘制ROC曲线。其中,true_labels为正确的标记,predict_labels为分类判断的标记,classnumber为分类类别的数量,本实施例因为是正负样本的二分类问题,因此classnumber=2。具体地,通过计算验证样本数据的特征向量和临界面特征向量的向量距离后,根据向量距离分布情况,即各个验证样本数据与临界面的接近程度的分布范围,并根据对应的验证样本数据的标注能够获取到验证样本数据的真正类率和假正类率,然后依据验证样本数据的真正类率和假正类率绘制ROC曲线。
S52:根据预设真正类率或预设假正类率在ROC曲线的横轴上获取分类阈值。
具体地,预设真正类率或预设假正类率通过实际的使用需要而进行设置,服务端在获取到预设真正类率或预设假正类率后,通过ROC曲线中的横轴表示的假正类率和纵轴表示的真正类率与预设真正类率或预设假正类率比较大小,即预设真正类率或预设假正类率作为对测试样本数据进行分类的标准,从ROC曲线的横轴上依据分类标准确定分类阈值,从而使得后续模型训练中通过ROC曲线可以根据不同的场景选取不同的分类阈值,避免重复训练的需要,提高模型训练的效率。
本实施例中,首先通过计算验证样本数据的特征向量和临界面特征向量的向量距离后,并根据对应的验证样本数据的标注能够获取到验证样本数据的真正类率和假正类率,然后依据验证样本数据的真正类率和假正类率绘制ROC曲线。通过预设真正类率或预设假正类率从ROC曲线的横轴上获取分类阈值,从而使得后续模型训练中通过ROC曲线可以根据不同的场景选取不同的分类阈值,避免重复训练的需要,提高模型训练的效率。
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
图7示出与实施例中人眼模型训练方法一一对应的人眼模型训练装置的原理框图。如图7所示,该人眼模型训练装置包括人脸图像样本数据获取模块10、人脸图像样本数据划分模块20、临界面获取模块30、向量距离计算模块40、分类阈值获取模块50和人眼判断模型获取模块60。其中,人脸图像样本数据获取模块10、人脸图像样本数据划分模块20、临界面获取模块30、向量距离计算模块40、分类阈值获取模块50和人眼判断模型获取模块60的实现功能与实施例中人眼模型训练方法对应的步骤一一对应,各功能模块详细说明如下:
人脸图像样本数据获取模块10,用于获取人脸图像样本,并对人脸图像样本进行标记以得到人脸图像样本数据,及提取人脸图像样本数据中的人脸图像样本的特征向量,其中,人脸图像样本数据包括人脸图像样本和标注数据;
人脸图像样本数据划分模块20,用于将人脸图像样本数据划分为训练样本数据和验证样本数据;
临界面获取模块30,用于采用训练样本数据训练支持向量机分类器,得到支持向量机分类器的临界面;
向量距离计算模块40,用于计算验证样本数据中的验证样本的特征向量与临界面的向量距离;
分类阈值获取模块50,用于获取预设真正类率或预设假正类率,根据向量距离和与验证样本数据对应的标注数据获取分类阈值;
人眼判断模型获取模块60,用于根据分类阈值,获取人眼判断模型。
具体地,人脸图像样本数据获取模块10包括人脸特征点获取单元11、正向调整单元12、眼睛矩形区域构建单元13、眼睛矩形区域获取单元14和特征向量提取单元15。
人脸特征点获取单元11,用于采用人脸特征点检测算法获取人脸特征点,该人脸特征点包括:左眼角点、右眼角点和眉心点;其中,左眼角点、右眼角点和眉心点是属于同一眼睛区域的特征点;
正向调整单元12,用于根据左眼角点和右眼角点对人脸图像样本进行正向调整;
眼睛矩形区域构建单元13,用于根据左眼角点、右眼角点和眉心点构建眼睛矩形区域;
眼睛矩形区域获取单元14,用于对眼睛矩形区域进行图像归一化处理,得到归一化眼睛矩形区域;
特征向量提取单元15,用于根据归一化眼睛矩形区域提取HOG特征向量。
具体地,特征向量提取单元15包括像素梯度获取子单元151、梯度直方图获取子单元152和HOG特征向量获取子单元153。
像素梯度获取子单元151,用于将归一化眼睛矩形区域划分成细胞单元,并计算细胞单元的每个像素梯度的大小和方向;
梯度直方图获取子单元152,用于统计细胞单元的每个像素梯度的大小和方向的梯度直方图;
HOG特征向量获取子单元153,用于串联梯度直方图,得到HOG特征向量。
具体地,临界面获取模块30包括参数获取单元31和临界面获取单元32。
参数获取单元31,用于获取支持向量机分类器的核函数和支持向量机分类器的惩罚参数,采用以下公式求解拉格朗日乘子和决策阈值b:
式中,s.t.是数学公式中约束条件的缩写,min是指在约束条件下取代数式的最小值,K(xi,xj)为支持向量机分类器的核函数,C为支持向量机分类器的惩罚参数,C>0,αi与拉格朗日乘子是共轭关系,xi为训练样本数据的特征向量,l为训练样本数据的特征向量的个数,yi为训练样本数据的标注;
临界面获取单元32:根据拉格朗日乘子和决策阈值b,采用如下公式,得到支持向量机分类器的临界面g(x):
具体地,分类阈值获取模块50包括ROC曲线绘制单元51和分类阈值获取单元52。
ROC曲线绘制单元51,用于根据向量距离和与验证样本数据对应的标注数据绘制ROC曲线;
分类阈值获取单元52,用于根据预设真正类率或预设假正类率在ROC曲线的横轴上获取分类阈值。
关于人眼模型训练装置的具体限定可以参见上文中对于人眼模型训练方法的限定,在此不再赘述。上述人眼模型训练装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一实施例中,提供一人眼识别方法,该人眼识别方法也可以应用在如图1的应用环境中,其中,计算机设备通过网络与服务端进行通信。客户端通过网络与服务端进行通信,服务端接收客户端发送待识别人脸图片,进行人眼识别。其中,客户端可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备。服务端可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
在一个实施例中,如图8所示,以该方法应用于图1中的服务端为例进行说明,包括如下步骤:
S70:获取待识别人脸图片,采用人脸特征点检测算法获取正向的眼睛区域图像。
其中,待识别人脸图片是指需要进行人眼识别的人脸图片。具体地,获取人脸图像可通过预先采集人脸图片,或者直接从人脸库中获取人脸图片,例如AR人脸库。
本实施例中,待识别人脸图片包括无遮挡眼睛图片和有遮挡眼睛图片,并采用人脸特征点检测算法获取正向的眼睛区域图像。该采用人脸特征点检测算法获取正向的眼睛区域图像的实现过程和步骤S11至步骤S13的方法相同,在此不再赘述。
S80:对正向的眼睛区域图像进行归一化处理,得到待识别眼睛图像。
其中,待识别眼睛图像是指实现了归一化处理后的正向的眼睛区域图像,通过对正向的眼睛区域图像进行归一化处理,可以提高识别效率。具体地,归一化处理得到的待识别眼睛图像因为变换到统一的标准形式,从而避免了支持向量机分类器中的大数值区间的属性过分支配了小数值区间的属性,而且还能避免计算过程中数值复杂度。可选地,对正向的眼睛区域图像进行归一化处理的实现过程和步骤S14相同,在此不再赘述。
S90:将待识别眼睛图像输入到如步骤S10至步骤S60中的人眼模型训练方法训练得到的人眼判断模型进行识别,获取识别结果。
其中,识别结果是指对待识别眼睛图像采用人眼判断模型进行识别所得到的结果,包括两种情形:待识别眼睛图像是无遮挡的眼睛图像和待识别眼睛图像是有遮挡的眼睛图像。具体地,将待识别眼睛图像输入到人眼判断模型进行识别,以获取识别结果。
本实施例中,先获取待识别人脸图片,对正向的眼睛区域图像进行归一化处理,得到待识别眼睛图像,以便对归一化处理的待识别人脸图片输入到人眼判断模型进行识别,获取识别结果,快速识别出该人脸图片眼睛有无遮挡,提高识别效率,从而避免影响后续的图像处理过程。
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
图9示出与实施例中人眼识别方法一一对应的人眼识别装置的原理框图。如图9所示,该人眼识别装置包括待识别眼睛图像获取模块70、待识别眼睛图像获取模块80和识别结果获取模块90。其中,待识别眼睛图像获取模块70、待识别眼睛图像获取模块80和识别结果获取模块90的实现功能与实施例中人眼识别方法对应的步骤一一对应,各功能模块详细说明如下:
待识别人脸图片获取模块70,用于获取待识别人脸图片,采用人脸特征点检测算法获取正向的眼睛区域图像;
待识别眼睛图像获取模块80,用于对正向的眼睛区域图像进行归一化处理,得到待识别眼睛图像;
识别结果获取模块90,用于将待识别眼睛图像输入到人眼模型训练方法训练得到的人眼判断模型进行识别,获取识别结果。
关于人眼模型训练装置的具体限定可以参见上文中对于人眼识别方法的限定,在此不再赘述。上述人眼识别装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图10所示。该计算机设备包括通过***总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作***、计算机程序和数据库。该内存储器为非易失性存储介质中的操作***和计算机程序的运行提供环境。该计算机设备的数据库用于存储人眼模型训练方法中的人脸图像样本数据的特征向量和人眼模型训练数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种人眼模型训练方法。或者,该计算机程序被处理器执行时实现实施例中人眼识别装置中各模块/单元的功能
在一个实施例中,提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现上述实施例人眼模型训练方法的步骤,例如图2所示的步骤S10至步骤S60。或者处理器执行计算机程序时实现上述实施例人眼识别方法的步骤,例如图7所示的步骤S70至步骤S90。或者,处理器执行计算机程序时实现上述实施例人眼模型训练装置的各模块/单元的功能,例如图7所示的模块10至模块60。或者,处理器执行计算机程序时实现上述实施例人眼识别装置的各模块/单元的功能,例如图9所示的模块70至模块90。为避免重复,这里不再赘述。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述实施例人眼模型训练方法的步骤,或者计算机程序被处理器执行时实现上述实施例人眼识别方法的步骤,或者,计算机程序被处理器执行时实现上述实施例人眼模型训练装置的各模块/单元的功能,或者,计算机程序被处理器执行时实现上述实施例人眼识别装置的各模块/单元的功能,为避免重复,这里不再赘述。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本发明所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。
上述实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围,均应包含在本发明的保护范围之内。
Claims (10)
1.一种人眼模型训练方法,其特征在于,包括:
获取人脸图像样本,并对所述人脸图像样本进行标记以得到人脸图像样本数据,及提取所述人脸图像样本数据中的人脸图像样本的特征向量,其中,人脸图像样本数据包括人脸图像样本和标注数据;
将所述人脸图像样本数据划分为训练样本数据和验证样本数据;
采用所述训练样本数据训练支持向量机分类器,得到所述支持向量机分类器的临界面;
计算所述验证样本数据中的验证样本的特征向量与所述临界面的向量距离;
获取预设真正类率或预设假正类率,根据所述向量距离和与验证样本数据对应的标注数据获取分类阈值;
根据所述分类阈值,获取人眼判断模型。
2.如权利要求1所述的人眼模型训练方法,其特征在于,所述提取所述人脸图像样本数据中的人脸图像样本的特征向量,具体包括:
采用人脸特征点检测算法获取人脸特征点,所述人脸特征点包括:左眼角点、右眼角点和眉心点;其中,所述左眼角点、所述右眼角点和所述眉心点是属于同一眼睛区域的特征点;
根据所述左眼角点和所述右眼角点对所述人脸图像样本进行正向调整;
根据所述左眼角点、所述右眼角点和所述眉心点构建眼睛矩形区域;
对所述眼睛矩形区域进行图像归一化处理,得到归一化眼睛矩形区域;
根据所述归一化眼睛矩形区域提取HOG特征向量。
3.如权利要求1所述的人眼模型训练方法,其特征在于,所述采用训练样本数据训练支持向量机分类器,得到所述支持向量机分类器的临界面,具体包括:
获取所述支持向量机分类器的核函数和所述支持向量机分类器的惩罚参数,采用以下公式求解拉格朗日乘子和决策阈值b:
式中,s.t.是数学公式中约束条件的缩写,min是指在约束条件下取代数式的最小值,K(xi,xj)为所述支持向量机分类器的核函数,C为所述支持向量机分类器的惩罚参数,C>0,αi与所述拉格朗日乘子是共轭关系,xi为所述训练样本数据的特征向量,l为所述训练样本数据的特征向量的个数,yi为所述训练样本数据的标注;
根据所述拉格朗日乘子和所述决策阈值b,采用如下公式,得到所述支持向量机分类器的临界面g(x):
4.如权利要求2所述的人眼模型训练方法,其特征在于,所述根据所述归一化眼睛矩形区域提取HOG特征向量,具体包括:
将归一化眼睛矩形区域划分成细胞单元,并计算所述细胞单元的每个像素梯度的大小和方向;
统计所述细胞单元的每个像素梯度的大小和方向的梯度直方图;
串联所述梯度直方图,得到所述HOG特征向量。
5.如权利要求1所述的人眼模型训练方法,其特征在于,所述获取预设真正类率或预设假正类率,根据所述向量距离和与验证样本数据对应的标注数据获取分类阈值,具体包括:
根据所述向量距离和与验证样本数据对应的标注数据绘制ROC曲线;
根据所述预设真正类率或预设假正类率在所述ROC曲线的横轴上获取分类阈值。
6.一种人眼识别方法,其特征在于,包括:
获取待识别人脸图片,采用人脸特征点检测算法获取正向的眼睛区域图像;
对所述正向的眼睛区域图像进行归一化处理,得到待识别眼睛图像;
将所述待识别眼睛图像输入到如权利要求1-5任一项所述人眼模型训练方法训练得到的人眼判断模型进行识别,获取识别结果。
7.一种人眼模型训练装置,其特征在于,包括:
人脸图像样本数据获取模块,用于获取人脸图像样本,并对所述人脸图像样本进行标记以得到人脸图像样本数据,及提取所述人脸图像样本数据中的人脸图像样本的特征向量,其中,人脸图像样本数据包括人脸图像样本和标注数据;
人脸图像样本数据划分模块,用于将所述人脸图像样本数据划分为训练样本数据和验证样本数据;
临界面获取模块,用于采用所述训练样本数据训练支持向量机分类器,得到所述支持向量机分类器的临界面;
向量距离计算模块,用于计算所述验证样本数据中的验证样本的特征向量与所述临界面的向量距离;
分类阈值获取模块,用于获取预设真正类率或预设假正类率,根据所述向量距离和与验证样本数据对应的标注数据获取分类阈值;
人眼判断模型获取模块,用于根据所述分类阈值,获取人眼判断模型。
8.一种人眼识别装置,其特征在于,包括:
待识别人脸图片获取模块,用于获取待识别人脸图片,采用人脸特征点检测算法获取正向的眼睛区域图像;
待识别眼睛图像获取模块,用于对所述正向的眼睛区域图像进行归一化处理,得到待识别眼睛图像;
识别结果获取模块,用于将所述待识别眼睛图像输入到如权利要求1-5任一项所述的人眼模型训练方法训练得到的人眼判断模型进行识别,获取识别结果。
9.一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至5任一项所述人眼模型训练方法的步骤;或者,所述处理器执行所述计算机程序时实现如权利要求6所述人眼识别方法的步骤。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至5任一项所述人眼模型训练方法的步骤;或者,所述处理器执行所述计算机程序时实现如权利要求6所述人眼识别方法的步骤。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810585092.2A CN108985159A (zh) | 2018-06-08 | 2018-06-08 | 人眼模型训练方法、人眼识别方法、装置、设备及介质 |
PCT/CN2018/094341 WO2019232866A1 (zh) | 2018-06-08 | 2018-07-03 | 人眼模型训练方法、人眼识别方法、装置、设备及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810585092.2A CN108985159A (zh) | 2018-06-08 | 2018-06-08 | 人眼模型训练方法、人眼识别方法、装置、设备及介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN108985159A true CN108985159A (zh) | 2018-12-11 |
Family
ID=64541049
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810585092.2A Withdrawn CN108985159A (zh) | 2018-06-08 | 2018-06-08 | 人眼模型训练方法、人眼识别方法、装置、设备及介质 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN108985159A (zh) |
WO (1) | WO2019232866A1 (zh) |
Cited By (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109858024A (zh) * | 2019-01-04 | 2019-06-07 | 中山大学 | 一种基于word2vec的房源词向量训练方法及装置 |
CN109919029A (zh) * | 2019-01-31 | 2019-06-21 | 深圳和而泰数据资源与云技术有限公司 | 黑眼圈类型识别方法、装置、计算机设备和存储介质 |
CN110211094A (zh) * | 2019-05-06 | 2019-09-06 | 平安科技(深圳)有限公司 | 黑眼圈智能判断方法、装置及计算机可读存储介质 |
CN110222724A (zh) * | 2019-05-15 | 2019-09-10 | 平安科技(深圳)有限公司 | 一种图片实例检测方法、装置、计算机设备及存储介质 |
CN110222571A (zh) * | 2019-05-06 | 2019-09-10 | 平安科技(深圳)有限公司 | 黑眼圈智能判断方法、装置及计算机可读存储介质 |
CN110276333A (zh) * | 2019-06-28 | 2019-09-24 | 上海鹰瞳医疗科技有限公司 | 眼底身份识别模型训练方法、眼底身份识别方法和设备 |
CN110414588A (zh) * | 2019-07-23 | 2019-11-05 | 广东小天才科技有限公司 | 图片标注方法、装置、计算机设备和存储介质 |
CN110569826A (zh) * | 2019-09-18 | 2019-12-13 | 深圳市捷顺科技实业股份有限公司 | 一种人脸识别方法、装置、设备及介质 |
CN111401440A (zh) * | 2020-03-13 | 2020-07-10 | 重庆第二师范学院 | 目标分类识别方法、装置、计算机设备及存储介质 |
CN111429409A (zh) * | 2020-03-13 | 2020-07-17 | 深圳市雄帝科技股份有限公司 | 对图像中人物佩戴眼镜的识别方法、***及其存储介质 |
CN111626371A (zh) * | 2020-05-29 | 2020-09-04 | 歌尔科技有限公司 | 一种图像分类方法、装置、设备及可读存储介质 |
CN111881770A (zh) * | 2020-07-06 | 2020-11-03 | 上海序言泽网络科技有限公司 | 一种人脸识别方法及*** |
CN111931617A (zh) * | 2020-07-29 | 2020-11-13 | 中国工商银行股份有限公司 | 基于图像处理的人眼图像识别方法、装置及自助终端 |
CN112883774A (zh) * | 2020-12-31 | 2021-06-01 | 厦门易仕特仪器有限公司 | 行人重识别数据增强方法、装置、设备及可读存储介质 |
Families Citing this family (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110991641B (zh) * | 2019-12-17 | 2024-03-05 | 合肥鼎盛锦业科技有限公司 | 一种油藏类型分析方法、装置及电子设备 |
CN111126347B (zh) * | 2020-01-06 | 2024-02-20 | 腾讯科技(深圳)有限公司 | 人眼状态识别方法、装置、终端及可读存储介质 |
CN111259743B (zh) * | 2020-01-09 | 2023-11-24 | 中山大学中山眼科中心 | 一种近视图像深度学习识别模型训练方法及*** |
CN111444860A (zh) * | 2020-03-30 | 2020-07-24 | 东华大学 | 一种表情识别方法和*** |
CN111582068B (zh) * | 2020-04-22 | 2023-07-07 | 北京交通大学 | 人员口罩佩戴状态检测方法 |
CN111583093B (zh) * | 2020-04-27 | 2023-12-22 | 西安交通大学 | 一种实时性好的orb特征点提取的硬件实现方法 |
CN111611910B (zh) * | 2020-05-19 | 2023-04-28 | 黄河水利委员会黄河水利科学研究院 | 一种黄河冰坝影像特征识别方法 |
CN111783598B (zh) * | 2020-06-24 | 2023-08-08 | 北京百度网讯科技有限公司 | 一种人脸识别模型训练方法、装置、设备及介质 |
CN112052723A (zh) * | 2020-07-23 | 2020-12-08 | 深圳市玩瞳科技有限公司 | 识字卡片、基于图像识别的桌面场景的str方法及装置 |
CN114005151B (zh) * | 2020-07-28 | 2024-05-03 | 北京君正集成电路股份有限公司 | 一种人脸角度样本采集与标注的方法 |
CN111967436B (zh) * | 2020-09-02 | 2024-03-19 | 北京猿力未来科技有限公司 | 图像处理方法及装置 |
CN112116525B (zh) * | 2020-09-24 | 2023-08-04 | 百度在线网络技术(北京)有限公司 | 换脸识别方法、装置、设备和计算机可读存储介质 |
CN112733795B (zh) * | 2021-01-22 | 2022-10-11 | 腾讯科技(深圳)有限公司 | 人脸图像的视线矫正方法、装置、设备及存储介质 |
CN114609602B (zh) * | 2022-03-09 | 2023-04-07 | 电子科技大学 | 一种基于特征提取的海杂波背景下目标检测方法 |
CN116311553B (zh) * | 2023-05-17 | 2023-08-15 | 武汉利楚商务服务有限公司 | 应用于半遮挡图像下的人脸活体检测方法及装置 |
CN117275080A (zh) * | 2023-11-22 | 2023-12-22 | 深圳市美爱堂科技有限公司 | 基于计算机视觉的眼部状态识别方法及*** |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107292225B (zh) * | 2016-08-18 | 2020-11-20 | 北京师范大学珠海分校 | 一种人脸识别方法 |
CN107590506B (zh) * | 2017-08-17 | 2018-06-15 | 北京航空航天大学 | 一种基于特征处理的复杂设备故障诊断方法 |
CN107633204B (zh) * | 2017-08-17 | 2019-01-29 | 平安科技(深圳)有限公司 | 人脸遮挡检测方法、装置及存储介质 |
-
2018
- 2018-06-08 CN CN201810585092.2A patent/CN108985159A/zh not_active Withdrawn
- 2018-07-03 WO PCT/CN2018/094341 patent/WO2019232866A1/zh active Application Filing
Cited By (24)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109858024A (zh) * | 2019-01-04 | 2019-06-07 | 中山大学 | 一种基于word2vec的房源词向量训练方法及装置 |
CN109858024B (zh) * | 2019-01-04 | 2023-04-11 | 中山大学 | 一种基于word2vec的房源词向量训练方法及装置 |
CN109919029A (zh) * | 2019-01-31 | 2019-06-21 | 深圳和而泰数据资源与云技术有限公司 | 黑眼圈类型识别方法、装置、计算机设备和存储介质 |
CN110211094A (zh) * | 2019-05-06 | 2019-09-06 | 平安科技(深圳)有限公司 | 黑眼圈智能判断方法、装置及计算机可读存储介质 |
CN110222571A (zh) * | 2019-05-06 | 2019-09-10 | 平安科技(深圳)有限公司 | 黑眼圈智能判断方法、装置及计算机可读存储介质 |
CN110211094B (zh) * | 2019-05-06 | 2023-05-26 | 平安科技(深圳)有限公司 | 黑眼圈智能判断方法、装置及计算机可读存储介质 |
CN110222571B (zh) * | 2019-05-06 | 2023-04-07 | 平安科技(深圳)有限公司 | 黑眼圈智能判断方法、装置及计算机可读存储介质 |
CN110222724A (zh) * | 2019-05-15 | 2019-09-10 | 平安科技(深圳)有限公司 | 一种图片实例检测方法、装置、计算机设备及存储介质 |
CN110222724B (zh) * | 2019-05-15 | 2023-12-19 | 平安科技(深圳)有限公司 | 一种图片实例检测方法、装置、计算机设备及存储介质 |
CN110276333B (zh) * | 2019-06-28 | 2021-10-15 | 上海鹰瞳医疗科技有限公司 | 眼底身份识别模型训练方法、眼底身份识别方法和设备 |
CN110276333A (zh) * | 2019-06-28 | 2019-09-24 | 上海鹰瞳医疗科技有限公司 | 眼底身份识别模型训练方法、眼底身份识别方法和设备 |
CN110414588A (zh) * | 2019-07-23 | 2019-11-05 | 广东小天才科技有限公司 | 图片标注方法、装置、计算机设备和存储介质 |
CN110569826B (zh) * | 2019-09-18 | 2022-05-24 | 深圳市捷顺科技实业股份有限公司 | 一种人脸识别方法、装置、设备及介质 |
CN110569826A (zh) * | 2019-09-18 | 2019-12-13 | 深圳市捷顺科技实业股份有限公司 | 一种人脸识别方法、装置、设备及介质 |
CN111401440B (zh) * | 2020-03-13 | 2023-03-31 | 重庆第二师范学院 | 目标分类识别方法、装置、计算机设备及存储介质 |
CN111429409A (zh) * | 2020-03-13 | 2020-07-17 | 深圳市雄帝科技股份有限公司 | 对图像中人物佩戴眼镜的识别方法、***及其存储介质 |
CN111401440A (zh) * | 2020-03-13 | 2020-07-10 | 重庆第二师范学院 | 目标分类识别方法、装置、计算机设备及存储介质 |
CN111626371A (zh) * | 2020-05-29 | 2020-09-04 | 歌尔科技有限公司 | 一种图像分类方法、装置、设备及可读存储介质 |
CN111626371B (zh) * | 2020-05-29 | 2023-10-31 | 歌尔科技有限公司 | 一种图像分类方法、装置、设备及可读存储介质 |
CN111881770A (zh) * | 2020-07-06 | 2020-11-03 | 上海序言泽网络科技有限公司 | 一种人脸识别方法及*** |
CN111881770B (zh) * | 2020-07-06 | 2024-05-31 | 上海序言泽网络科技有限公司 | 一种人脸识别方法及*** |
CN111931617A (zh) * | 2020-07-29 | 2020-11-13 | 中国工商银行股份有限公司 | 基于图像处理的人眼图像识别方法、装置及自助终端 |
CN111931617B (zh) * | 2020-07-29 | 2023-11-21 | 中国工商银行股份有限公司 | 基于图像处理的人眼图像识别方法、装置及自助终端 |
CN112883774A (zh) * | 2020-12-31 | 2021-06-01 | 厦门易仕特仪器有限公司 | 行人重识别数据增强方法、装置、设备及可读存储介质 |
Also Published As
Publication number | Publication date |
---|---|
WO2019232866A1 (zh) | 2019-12-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108985159A (zh) | 人眼模型训练方法、人眼识别方法、装置、设备及介质 | |
CN108985155A (zh) | 嘴巴模型训练方法、嘴巴识别方法、装置、设备及介质 | |
US11775056B2 (en) | System and method using machine learning for iris tracking, measurement, and simulation | |
CN106897658B (zh) | 人脸活体的鉴别方法和装置 | |
CN109697416B (zh) | 一种视频数据处理方法和相关装置 | |
CN112215180B (zh) | 一种活体检测方法及装置 | |
WO2019096029A1 (zh) | 活体识别方法、存储介质和计算机设备 | |
US20200134868A1 (en) | Gaze point determination method and apparatus, electronic device, and computer storage medium | |
US9031317B2 (en) | Method and apparatus for improved training of object detecting system | |
US8818034B2 (en) | Face recognition apparatus and methods | |
CN105205480B (zh) | 一种复杂场景中人眼定位方法及*** | |
CN108229330A (zh) | 人脸融合识别方法及装置、电子设备和存储介质 | |
CN109086718A (zh) | 活体检测方法、装置、计算机设备及存储介质 | |
CN106778450B (zh) | 一种面部识别方法和装置 | |
CN108229297A (zh) | 人脸识别方法和装置、电子设备、计算机存储介质 | |
CN110390229B (zh) | 一种人脸图片筛选方法、装置、电子设备及存储介质 | |
CN110889355A (zh) | 一种人脸识别校验方法、***及存储介质 | |
CN109858547A (zh) | 一种基于bssd的目标检测方法与装置 | |
CN109190622A (zh) | 基于强特征和神经网络的上皮细胞分类***和方法 | |
CN108416304B (zh) | 一种利用上下文信息的三分类人脸检测方法 | |
Hebbale et al. | Real time COVID-19 facemask detection using deep learning | |
CN110826372A (zh) | 人脸特征点检测方法及装置 | |
Hernandez-Ortega et al. | FaceQvec: Vector quality assessment for face biometrics based on ISO compliance | |
KR101782575B1 (ko) | 왜곡된 원형 이미지를 추출하기 위한 이미지 처리 방법 및 시스템 | |
KR101343623B1 (ko) | 적응적 피부색 검출 방법, 그리고 이를 이용한 얼굴 검출 방법 및 그 장치 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WW01 | Invention patent application withdrawn after publication | ||
WW01 | Invention patent application withdrawn after publication |
Application publication date: 20181211 |