CN112001207B - 一种人脸识别样本库的优化方法 - Google Patents

一种人脸识别样本库的优化方法 Download PDF

Info

Publication number
CN112001207B
CN112001207B CN201910445852.4A CN201910445852A CN112001207B CN 112001207 B CN112001207 B CN 112001207B CN 201910445852 A CN201910445852 A CN 201910445852A CN 112001207 B CN112001207 B CN 112001207B
Authority
CN
China
Prior art keywords
face
path
picture
person
folder
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910445852.4A
Other languages
English (en)
Other versions
CN112001207A (zh
Inventor
于晓静
田凤彬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Ingenic Semiconductor Co Ltd
Original Assignee
Beijing Ingenic Semiconductor Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Ingenic Semiconductor Co Ltd filed Critical Beijing Ingenic Semiconductor Co Ltd
Priority to CN201910445852.4A priority Critical patent/CN112001207B/zh
Publication of CN112001207A publication Critical patent/CN112001207A/zh
Application granted granted Critical
Publication of CN112001207B publication Critical patent/CN112001207B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/168Feature extraction; Face representation

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Collating Specific Patterns (AREA)
  • Processing Or Creating Images (AREA)

Abstract

本发明提供了一种人脸识别样本库的优化方法,所述的方法包括以下步骤:S1,设定样本存放规则;S2,在存放同一人的图片文件夹中,获得该人的人脸图片中最正面人脸的图片;S3,按照步骤S2的方法,提取不同人脸识别库中每个人的最正面人脸的特征值,每个特征值与该人文件夹路径关联,比较两个不同的人脸识别库中的特征值;S3.1,将比较的两个特征值的空间距离大于阈值的视为不是同一人,维持不变;S3.2,将比较的两个特征值的空间距离小于且等于阈值的视为同一人,对应的进行合并;S4,对步骤S3.2合并的文件夹内的图片进行筛选,将不同人的图片分开另存。

Description

一种人脸识别样本库的优化方法
技术领域
本发明涉及人脸图像识别技术领域,特别涉及人脸识别中一种人脸识别样本库的优化方法。
背景技术
随着科技的不断发展,特别是计算机视觉技术的发展,人脸识别技术广泛应用于信息安全、电子认证等各个领域,图像特征提取方法具有良好的识别性能。人脸识别是指基于已知的人脸样本库,利用图像处理和/或模式识别技术从静态或者动态场景中,识别一个或多个人脸的技术。但是目前的人脸识别上技术具有提取处理较差、计算耗时的问题,特别是人脸识别中合并人脸识别库的方法仍存在合并效率较低的问题。
发明内容
为了解决上述现有技术中存在的问题,本发明的目的在于:在人脸识别中实现更好的优化样本库。
本发明提供一种人脸识别样本库的优化方法,其特征在于,所述的方法包括以下步骤:
S1,设定样本存放规则;
S2,在存放同一人的图片文件夹中,获得该人的人脸图片中最正面人脸的图片;
S3,按照步骤S2的方法,提取不同人脸识别库中每个人的最正面人脸的特征值,每个特征值与该人文件夹路径关联,比较两个不同的人脸识别库中的特征值;
S3.1,将比较的两个特征值的空间距离大于阈值的视为不是同一人,维持不变;
S3.2,将比较的两个特征值的空间距离小于且等于阈值的视为同一人,对应的进行合并;
S4,对步骤S3.2合并的文件夹内的图片进行筛选,将不同人的图片分开另存。
所述的步骤S1的设定样本存放规则为,一张图片只有一个人脸,同一人的图片放到同一个文件夹中,一个文件夹代表一个人,该文件夹命名为person。
所述的步骤S2进一步包括:
S2.1,根据人脸眼睛中心的距离与人脸检测框的宽度,进行求得比值;
S2.2,在存放同一人的图片文件夹中,找到距离与高度比值最大的一个张图,这个图就是一个所有该人人脸中最接近正面人脸的图;
S2.3,将步骤S2.2中最接近正面人脸的图作为该人的最正面人脸图片。
所述的步骤S4中合并的文件夹中的图片进一步进行人工筛选处理。
所述步骤S2.1-S2.3进一步包括:
[1]初始化,设置参数tmp=0,图片路径path_img=0;
[2]提取一张图片并记录该图片路径为path_img,检测出该图中人脸的两只眼睛的各自中心位置和人脸的外接矩形的高度height,计算两只眼睛距离与人脸外接矩形高度height的比值为tmp;
[3]提取下一张图片并记录该图片路径path_img1,检测出该图中人脸的两只眼睛的各自中心位置和人脸的外接矩形,计算两只眼睛距离与人脸外接矩形高度的比值tmp1;
[4]比较tmp1与tmp的大小,如果tmp1>tmp并且height>80,那么tmp=tmp1,path_img=path_img1;
[5]重复[3][4]过程,直到该person所有图片被提取完,记录图片路径path_img和该人person的路径。
所述步骤S3进一步包括:
[1]提取不同人脸识库中每个人的最正面人脸的特征值,每个特征值与该人文件名路径关联,初始化i=1;
[2]读取第一个人脸识别库最正人脸的特征值的第i个人脸的特征值eval1,该人路径为path_person1,初始化j=1;
[3]读取第二个人脸识别库最正人脸的特征值的第j个人脸的特征值eval2,该人路径为path_person2,比较eval1与eval2的二范数或称为空间距离dist;
[4]如果空间距离dist小于第一阈值,那么将path_person2的所有人脸图片拷贝到path_person1中,将path_person2的文件夹及其内部图片删除;
如果空间距离dist大于第二阈值,读取下一个人脸特征值数据;
如果空间距离dist大于或等于第一阈值且小于或等于第二阈值,那么将path_person1拷贝到文件夹tmp_file中,将path_person2拷贝到文件夹tmp_file中的path_person1路径所在人的文件目录中,将path_person2的文件夹及其内部图片删除;
[5]j=j+1,重复[3]、[4]过程,直到第二个人脸库中的最正面人脸的特征值与第i个人脸的特征值eval1比较完毕;
[6]进入第一个人脸库,i=i+1,重复[2]、[3]、[4]、[5],直到第一个人脸库中的最正面人脸的特征值全部读取完毕;
[7]两个库中每个人的文件夹名没有重名则合并。
所述的初始化要求每人至少三张图片。
所述的第一阈值命名为th1;所述的第二阈值命名为th2。
所述的步骤S4进一步包括判断是否存在重复,如果存在,进行合并;如果不存在重复,那么就将其分开,另存到另一个文件夹。
本申请的优势在于提高了人脸识别中人脸识别库的优化效率。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,并不构成对本发明的限定。
图1是本发明的方法的框图示意图。
图2是本发明进一步方法的框图示意图。
图3是本发明的方法步骤S2的流程示意图。
图4是本发明的方法步骤S3的流程示意图。
具体实施方式
目前人脸识别技术领域的术语包括:
1、人脸检测:将一张图片输入到一个检测器中,将人脸的眼睛、鼻子、嘴和人脸外接矩形的坐标信息提取出来,如果没有人脸,不会输出任何信息。
2、人脸识别库:是用来训练人脸识别模型的一种样本库。在不会产生混淆的情况下,可以简称为样本库。
3、人脸识别模型:通过使用人脸识别库来训练,可以得到人脸识别模型。使用人脸识别模型,可以对人脸提取人脸的特征值。
4、人脸的特征值:是一张人脸图片,通过人脸识别模型处理后生成的一维数据,这个数据称为该人脸的特征值。同一人的不同人脸图片,特征值间的空间距离很小。
本申请涉及的实施方案包括:
1)、使用现有或已有样本库进行训练出人脸识别模型。
2)、使用人脸检测检测出两个眼睛的位置和人脸的外接矩形的位置。
3)、通过随机抽取一张图片或是将每人的所有图片进行比较,进行合并不同的样本库。
本申请的实施方案具体包括:
1、样本存放规则说明
一张图片只有一个人脸,同一人的图片放到同一个文件夹中,一个文件夹代表一个人,该文件夹命名为person,person中的图片命名为image。将这些不同人的文件夹放到一个总的文件夹下,这个总的文件夹命名为train_data。这种存放和命名方式,便于处理和下面算法的表达。例如train_data_1={person_1,person_2,person_3,person_4,…},其中person_i={image1,image2,image3,…},i=1,2,…n
2、不同样本库的合并
1)提取每个人person的最正面人脸图片。根据人脸眼睛中心的距离与人脸检测框的宽度,进行求得比值,在同一人person中,找到距离与高度比值最大的一个张图,这个图就是所有该人人脸中最接近正面人脸的一个图,命名为image_max。将该图image_max作为该人的最正面人脸图片。按照这种处理方法,将不同人脸识别库提取出所有人的正人脸图片。
如图3所示,提取每个人最正面人脸图片的具体方法:
[1]初始化tmp0=0,图片路径path_img0=0。
[2]提取一张图片和记录该图片路径为path_img0,检测出该图中人脸的两只眼睛的各自中心位置和人脸的外接矩形的高度height,计算两只眼睛距离与人脸外接矩形高度height的比值为tmp0。
[3]提取下一张图片并记录该图片路径path_img1,检测出该图中人脸的两只眼睛的各自中心位置和人脸的外接矩形,计算两只眼睛距离与人脸外接矩形高度的比值tmp1。
[4]比较tmp1与tmp的大小,如果tmp1>tmp并且height>80,那么tmp=tmp1,path_img=path_img1.
[5]重复[3][4]过程,直到该person所有图片被提取完。记录图片路径path_img0和该人person的路径。
2)如图1和图2所示,所述方法包括:
S1,设定样本存放规则;
S2,在存放同一人的图片文件夹中,获得该人的人脸图片中最正面人脸的图片;
S3,按照步骤S2的方法,提取不同人脸识别库中每个人的最正面人脸的特征值,每个特征值与该人文件夹路径关联,比较两个不同的人脸识别库中的特征值;
S3.1,将比较的两个特征值的空间距离大于阈值的视为不是同一人,维持不变;
S3.2,将比较的两个特征值的空间距离小于且等于阈值的视为同一人,对应的进行合并;
S4,对步骤S3.2合并的文件夹内的图片进行筛选,将不同人的图片分开另存。
如图4所示,具体处理的具体方法如下:
[1]提取两个人脸识库中每个人的最正面人脸。提取最正面人脸的特征值,每个特征值与该人文件名路径关联。初始化i=1。
[2]读取第一个人脸识别库最正人脸的特征值的第i个人脸的特征值eval1,该人路径为path_person1。初始化j=1。
[3]读取第二个人脸识别库最正人脸的特征值的第j个人脸的特征值eval2,该人路径为path_person2。比较eval1与eval2的二范数(或称为空间距离)dist。
[4]如果dist小于阈值1(命名为th1),那么将path_person2的所有人脸图片拷贝到path_person1中,将path_person2的文件夹及其内部图片删除。如果dist大于阈值2(命名为th2,th1<th2),读取下一个人脸特征值数据。如果dist大于或等于th1且小于或等于th2,那么将path_person1拷贝到tmp_file中,将path_person2拷贝到tmp_file中的path_person1路径所在人的文件目录中,将path_person2的文件夹及其内部图片删除。
[5]j=j+1,重复[3]、[4]过程,直到第二个人脸库中的最正面人脸的特征值与第i个人脸的特征值eval1比较完毕。
[6]进入第一个人脸识别库,i=i+1,重复[2]、[3]、[4]、[5]。直到第一个人脸库中的最正面人脸的特征值全部读取完毕。
[7]两个人脸识别库进行合并(两个库中每个人的文件夹名没有重名)。
[8]人工处理tmp_file中的文件,筛选是否存在重复,如果存在,进行合并,如果不存在重复,那么就将其分开。将处理后的结果,放入到处理后的第一个人脸识别库中。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明实施例可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (1)

1.一种人脸识别样本库的优化方法,其特征在于,所述的方法包括以下步骤:
S1,设定样本存放规则,一张图片只有一个人脸, 同一人的图片放到同一个文件夹中,一个文件夹代表一个人,该文件夹命名为person ,person 中的图片命名为image;
S2,在存放同一人的图片文件夹中,获得该人的人脸图片中最正面人脸的图片;
S3,按照步骤S2的方法,提取不同人脸识别库中每个人的最正面人脸的特征值,每个特征值与该人文件夹路径关联,比较两个不同的人脸识别库中的特征值;
S3.1,将比较的两个特征值的空间距离大于阈值的视为不是同一人,维持不变;
S3.2,将比较的两个特征值的空间距离小于且等于阈值的视为同一人,对应的进行合并;
S4,对步骤S3.2合并的文件夹内的图片进行筛选,将不同人的图片分开另存;
所述的步骤S1的设定样本存放规则为,一张图片只有一个人脸,同一人的图片放到同一个文件夹中,一个文件夹代表一个人,该文件夹命名为person;
所述的步骤S2进一步包括:
S2.1,根据人脸眼睛中心的距离与人脸检测框的宽度,进行求得比值;
S2.2,在存放同一人的图片文件夹中,找到距离与高度比值最大的一个张图,这个图就是一个所有该人人脸中最接近正面人脸的图;
S2.3,将步骤S2.2中最接近正面人脸的图作为该人的最正面人脸图片;
所述的步骤S4中合并的文件夹中的图片进一步进行人工筛选处理;
所述步骤S2.1-S2.3进一步包括:
[1] 初始化,设置参数tmp=0,图片路径path_img=0;
[2] 提取一张图片并记录该图片路径为path_img,检测出该图中人脸的两只眼睛的各自中心位置和人脸的外接矩形的高度height,计算两只眼睛距离与人脸外接矩形高度height的比值为tmp;
[3] 提取下一张图片并记录该图片路径path_img1,检测出该图中人脸的两只眼睛的各自中心位置和人脸的外接矩形,计算两只眼睛距离与人脸外接矩形高度的比值tmp1;
[4] 比较tmp1与tmp的大小,如果tmp1>tmp并且height>80,那么tmp=tmp1, path_img=path_img1;
[5] 重复[3][4]过程,直到该person所有图片被提取完,记录图片路径path_img和该人person的路径;
所述步骤S3进一步包括:
[1] 提取不同人脸识库中每个人的最正面人脸的特征值,每个特征值与该人文件名路径关联,初始化i=1;
[2] 读取第一个人脸识别库最正人脸的特征值的第i个人脸的特征值eval1,该人路径为path_person1,初始化j=1;
[3] 读取第二个人脸识别库最正人脸的特征值的第j个人脸的特征值eval2, 该人路径为path_person2,比较eval1与eval2的二范数或称为空间距离dist;
[4] 如果空间距离dist小于第一阈值,那么将path_person2的所有人脸图片拷贝到path_person1中,将path_person2的文件夹及其内部图片删除;
如果空间距离dist大于第二阈值,读取下一个人脸特征值数据;
如果空间距离dist大于或等于第一阈值且小于或等于第二阈值,那么将path_person1拷贝到文件夹tmp_file中,将path_person2拷贝到文件夹tmp_file中的path_person1路径所在人的文件目录中,将path_person2的文件夹及其内部图片删除;
[5]j=j+1,重复[3]、[4]过程,直到第二个人脸库中的最正面人脸的特征值与第i个人脸的特征值eval1比较完毕;
[6] 进入第一个人脸库,i=i+1,重复[2]、[3]、[4]、[5],直到第一个人脸库中的最正面人脸的特征值全部读取完毕;
[7]两个库中每个人的文件夹名没有重名则合并;
所述的初始化要求每人至少三张图片;
所述的第一阈值命名为th1;所述的第二阈值命名为th2;
所述的步骤S4进一步包括判断是否存在重复,如果存在,进行合并;如果不存在重复,那么就将其分开,另存到另一个文件夹。
CN201910445852.4A 2019-05-27 2019-05-27 一种人脸识别样本库的优化方法 Active CN112001207B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910445852.4A CN112001207B (zh) 2019-05-27 2019-05-27 一种人脸识别样本库的优化方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910445852.4A CN112001207B (zh) 2019-05-27 2019-05-27 一种人脸识别样本库的优化方法

Publications (2)

Publication Number Publication Date
CN112001207A CN112001207A (zh) 2020-11-27
CN112001207B true CN112001207B (zh) 2024-05-28

Family

ID=73461910

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910445852.4A Active CN112001207B (zh) 2019-05-27 2019-05-27 一种人脸识别样本库的优化方法

Country Status (1)

Country Link
CN (1) CN112001207B (zh)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20120128094A (ko) * 2011-05-16 2012-11-26 캐논 가부시끼가이샤 얼굴 인식 장치, 그 제어 방법, 및 얼굴 인식 방법
CN104573642A (zh) * 2014-12-26 2015-04-29 小米科技有限责任公司 人脸识别方法及装置
CN104778481A (zh) * 2014-12-19 2015-07-15 五邑大学 一种大规模人脸模式分析样本库的构建方法和装置
CN106250439A (zh) * 2016-07-26 2016-12-21 四川长虹电器股份有限公司 照片人物间亲密度展示***及方法
CN107633209A (zh) * 2017-08-17 2018-01-26 平安科技(深圳)有限公司 电子装置、动态视频人脸识别的方法及存储介质
CN108932343A (zh) * 2018-07-24 2018-12-04 南京甄视智能科技有限公司 人脸图像数据库的数据集清洗方法与***
WO2019061659A1 (zh) * 2017-09-26 2019-04-04 平安科技(深圳)有限公司 人脸图像眼镜去除方法、装置及存储介质

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TW201401186A (zh) * 2012-06-25 2014-01-01 Psp Security Co Ltd 人臉判斷系統以及方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20120128094A (ko) * 2011-05-16 2012-11-26 캐논 가부시끼가이샤 얼굴 인식 장치, 그 제어 방법, 및 얼굴 인식 방법
CN104778481A (zh) * 2014-12-19 2015-07-15 五邑大学 一种大规模人脸模式分析样本库的构建方法和装置
CN104573642A (zh) * 2014-12-26 2015-04-29 小米科技有限责任公司 人脸识别方法及装置
CN106250439A (zh) * 2016-07-26 2016-12-21 四川长虹电器股份有限公司 照片人物间亲密度展示***及方法
CN107633209A (zh) * 2017-08-17 2018-01-26 平安科技(深圳)有限公司 电子装置、动态视频人脸识别的方法及存储介质
WO2019061659A1 (zh) * 2017-09-26 2019-04-04 平安科技(深圳)有限公司 人脸图像眼镜去除方法、装置及存储介质
CN108932343A (zh) * 2018-07-24 2018-12-04 南京甄视智能科技有限公司 人脸图像数据库的数据集清洗方法与***

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
人脸检测与匹配识别算法研究;王艺蒙;中国优秀硕士学位论文全文数据库信息科技辑(第01期);全文 *
基于卷积神经网络人脸识别方法研究;陆红;;现代信息科技(第10期);全文 *
基于压缩感知的人脸识别***设计与实现;孙海威;中国优秀硕士学位论文全文数据库 (信息科技辑);20190215(第02期);全文 *
陆红 ; .基于卷积神经网络人脸识别方法研究.现代信息科技.2018,(10),全文. *

Also Published As

Publication number Publication date
CN112001207A (zh) 2020-11-27

Similar Documents

Publication Publication Date Title
CN109784186B (zh) 一种行人重识别方法、装置、电子设备及计算机可读存储介质
US8548256B2 (en) Method for fast scene matching
US7869657B2 (en) System and method for comparing images using an edit distance
EP2676224B1 (en) Image quality assessment
JP5050075B2 (ja) 画像判別方法
Chu et al. Manga facenet: Face detection in manga based on deep neural network
US9025864B2 (en) Image clustering using a personal clothing model
JP4545641B2 (ja) 類似画像検索方法,類似画像検索システム,類似画像検索プログラム及び記録媒体
JP2001325593A (ja) 自動アルバム化システムにおける重複写真検知方法
US20200258236A1 (en) Person segmentations for background replacements
CN111753642B (zh) 一种确定关键帧的方法及装置
CN110490210B (zh) 一种基于紧致通道间t采样差分的彩色纹理分类方法
CN112001207B (zh) 一种人脸识别样本库的优化方法
US10991085B2 (en) Classifying panoramic images
CN112001206B (zh) 一种通过遍历比较合并人脸识别库的方法
JP3962517B2 (ja) 顔面検出方法及びその装置、コンピュータ可読媒体
CN112001203A (zh) 一种人脸识别库中提取正面人脸的方法
Mr et al. Developing a novel technique to match composite sketches with images captured by unmanned aerial vehicle
CN113610071B (zh) 人脸活体检测方法、装置、电子设备及存储介质
Zhang et al. Beyond face: Improving person clustering in consumer photos by exploring contextual information
CN114329050A (zh) 视觉媒体数据去重处理方法、装置、设备和存储介质
CN112000621A (zh) 一种不同人脸识别的样本库的合并方法
Kalantari et al. Visual front-end wars: Viola-Jones face detector vs Fourier Lucas-Kanade
Bratoszewski et al. Face profile view retrieval using time of flight camera image analysis
CN113642503B (zh) 基于图像和语音识别的窗口服务评分方法及***

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant