CN112001207B

CN112001207B - 一种人脸识别样本库的优化方法

Info

Publication number: CN112001207B
Application number: CN201910445852.4A
Authority: CN
Inventors: 于晓静; 田凤彬
Original assignee: Beijing Ingenic Semiconductor Co Ltd
Current assignee: Beijing Ingenic Semiconductor Co Ltd
Priority date: 2019-05-27
Filing date: 2019-05-27
Publication date: 2024-05-28
Anticipated expiration: 2039-05-27
Also published as: CN112001207A

Abstract

本发明提供了一种人脸识别样本库的优化方法，所述的方法包括以下步骤：S1，设定样本存放规则；S2，在存放同一人的图片文件夹中，获得该人的人脸图片中最正面人脸的图片；S3，按照步骤S2的方法，提取不同人脸识别库中每个人的最正面人脸的特征值，每个特征值与该人文件夹路径关联，比较两个不同的人脸识别库中的特征值；S3.1，将比较的两个特征值的空间距离大于阈值的视为不是同一人，维持不变；S3.2，将比较的两个特征值的空间距离小于且等于阈值的视为同一人，对应的进行合并；S4，对步骤S3.2合并的文件夹内的图片进行筛选，将不同人的图片分开另存。

Description

一种人脸识别样本库的优化方法

技术领域

本发明涉及人脸图像识别技术领域，特别涉及人脸识别中一种人脸识别样本库的优化方法。

背景技术

随着科技的不断发展，特别是计算机视觉技术的发展，人脸识别技术广泛应用于信息安全、电子认证等各个领域，图像特征提取方法具有良好的识别性能。人脸识别是指基于已知的人脸样本库，利用图像处理和/或模式识别技术从静态或者动态场景中，识别一个或多个人脸的技术。但是目前的人脸识别上技术具有提取处理较差、计算耗时的问题，特别是人脸识别中合并人脸识别库的方法仍存在合并效率较低的问题。

发明内容

为了解决上述现有技术中存在的问题，本发明的目的在于：在人脸识别中实现更好的优化样本库。

本发明提供一种人脸识别样本库的优化方法，其特征在于，所述的方法包括以下步骤：

S1，设定样本存放规则；

S2，在存放同一人的图片文件夹中，获得该人的人脸图片中最正面人脸的图片；

S3，按照步骤S2的方法，提取不同人脸识别库中每个人的最正面人脸的特征值，每个特征值与该人文件夹路径关联，比较两个不同的人脸识别库中的特征值；

S3.1，将比较的两个特征值的空间距离大于阈值的视为不是同一人，维持不变；

S3.2，将比较的两个特征值的空间距离小于且等于阈值的视为同一人，对应的进行合并；

S4，对步骤S3.2合并的文件夹内的图片进行筛选，将不同人的图片分开另存。

所述的步骤S1的设定样本存放规则为，一张图片只有一个人脸，同一人的图片放到同一个文件夹中，一个文件夹代表一个人，该文件夹命名为person。

所述的步骤S2进一步包括：

S2.1，根据人脸眼睛中心的距离与人脸检测框的宽度，进行求得比值；

S2.2,在存放同一人的图片文件夹中，找到距离与高度比值最大的一个张图，这个图就是一个所有该人人脸中最接近正面人脸的图；

S2.3，将步骤S2.2中最接近正面人脸的图作为该人的最正面人脸图片。

所述的步骤S4中合并的文件夹中的图片进一步进行人工筛选处理。

所述步骤S2.1-S2.3进一步包括：

[1]初始化，设置参数tmp＝0，图片路径path_img＝0；

[2]提取一张图片并记录该图片路径为path_img，检测出该图中人脸的两只眼睛的各自中心位置和人脸的外接矩形的高度height，计算两只眼睛距离与人脸外接矩形高度height的比值为tmp；

[3]提取下一张图片并记录该图片路径path_img1，检测出该图中人脸的两只眼睛的各自中心位置和人脸的外接矩形，计算两只眼睛距离与人脸外接矩形高度的比值tmp1；

[4]比较tmp1与tmp的大小，如果tmp1>tmp并且height>80，那么tmp＝tmp1,path_img＝path_img1；

[5]重复[3][4]过程，直到该person所有图片被提取完，记录图片路径path_img和该人person的路径。

所述步骤S3进一步包括：

[1]提取不同人脸识库中每个人的最正面人脸的特征值，每个特征值与该人文件名路径关联，初始化i＝1；

[2]读取第一个人脸识别库最正人脸的特征值的第i个人脸的特征值eval1，该人路径为path_person1，初始化j＝1；

[3]读取第二个人脸识别库最正人脸的特征值的第j个人脸的特征值eval2,该人路径为path_person2，比较eval1与eval2的二范数或称为空间距离dist；

[4]如果空间距离dist小于第一阈值,那么将path_person2的所有人脸图片拷贝到path_person1中，将path_person2的文件夹及其内部图片删除；

如果空间距离dist大于第二阈值,读取下一个人脸特征值数据；

如果空间距离dist大于或等于第一阈值且小于或等于第二阈值,那么将path_person1拷贝到文件夹tmp_file中，将path_person2拷贝到文件夹tmp_file中的path_person1路径所在人的文件目录中，将path_person2的文件夹及其内部图片删除；

[5]j＝j+1，重复[3]、[4]过程，直到第二个人脸库中的最正面人脸的特征值与第i个人脸的特征值eval1比较完毕；

[6]进入第一个人脸库，i＝i+1,重复[2]、[3]、[4]、[5]，直到第一个人脸库中的最正面人脸的特征值全部读取完毕；

[7]两个库中每个人的文件夹名没有重名则合并。

所述的初始化要求每人至少三张图片。

所述的第一阈值命名为th1；所述的第二阈值命名为th2。

所述的步骤S4进一步包括判断是否存在重复，如果存在，进行合并；如果不存在重复，那么就将其分开,另存到另一个文件夹。

本申请的优势在于提高了人脸识别中人脸识别库的优化效率。

附图说明

此处所说明的附图用来提供对本发明的进一步理解，构成本申请的一部分，并不构成对本发明的限定。

图1是本发明的方法的框图示意图。

图2是本发明进一步方法的框图示意图。

图3是本发明的方法步骤S2的流程示意图。

图4是本发明的方法步骤S3的流程示意图。

具体实施方式

目前人脸识别技术领域的术语包括：

1、人脸检测：将一张图片输入到一个检测器中，将人脸的眼睛、鼻子、嘴和人脸外接矩形的坐标信息提取出来，如果没有人脸，不会输出任何信息。

2、人脸识别库：是用来训练人脸识别模型的一种样本库。在不会产生混淆的情况下，可以简称为样本库。

3、人脸识别模型：通过使用人脸识别库来训练，可以得到人脸识别模型。使用人脸识别模型，可以对人脸提取人脸的特征值。

4、人脸的特征值：是一张人脸图片，通过人脸识别模型处理后生成的一维数据，这个数据称为该人脸的特征值。同一人的不同人脸图片，特征值间的空间距离很小。

本申请涉及的实施方案包括：

1)、使用现有或已有样本库进行训练出人脸识别模型。

2)、使用人脸检测检测出两个眼睛的位置和人脸的外接矩形的位置。

3)、通过随机抽取一张图片或是将每人的所有图片进行比较，进行合并不同的样本库。

本申请的实施方案具体包括：

1、样本存放规则说明

一张图片只有一个人脸，同一人的图片放到同一个文件夹中，一个文件夹代表一个人，该文件夹命名为person，person中的图片命名为image。将这些不同人的文件夹放到一个总的文件夹下，这个总的文件夹命名为train_data。这种存放和命名方式，便于处理和下面算法的表达。例如train_data_1＝{person_1,person_2,person_3,person_4,…}，其中person_i＝{image1,image2,image3,…},i＝1,2,…n

2、不同样本库的合并

1)提取每个人person的最正面人脸图片。根据人脸眼睛中心的距离与人脸检测框的宽度，进行求得比值，在同一人person中，找到距离与高度比值最大的一个张图，这个图就是所有该人人脸中最接近正面人脸的一个图，命名为image_max。将该图image_max作为该人的最正面人脸图片。按照这种处理方法，将不同人脸识别库提取出所有人的正人脸图片。

如图3所示，提取每个人最正面人脸图片的具体方法：

[1]初始化tmp0＝0，图片路径path_img0＝0。

[2]提取一张图片和记录该图片路径为path_img0，检测出该图中人脸的两只眼睛的各自中心位置和人脸的外接矩形的高度height，计算两只眼睛距离与人脸外接矩形高度height的比值为tmp0。

[3]提取下一张图片并记录该图片路径path_img1，检测出该图中人脸的两只眼睛的各自中心位置和人脸的外接矩形，计算两只眼睛距离与人脸外接矩形高度的比值tmp1。

[4]比较tmp1与tmp的大小，如果tmp1>tmp并且height>80，那么tmp＝tmp1,path_img＝path_img1.

[5]重复[3][4]过程，直到该person所有图片被提取完。记录图片路径path_img0和该人person的路径。

2)如图1和图2所示，所述方法包括：

S1，设定样本存放规则；

如图4所示，具体处理的具体方法如下：

[1]提取两个人脸识库中每个人的最正面人脸。提取最正面人脸的特征值，每个特征值与该人文件名路径关联。初始化i＝1。

[2]读取第一个人脸识别库最正人脸的特征值的第i个人脸的特征值eval1，该人路径为path_person1。初始化j＝1。

[3]读取第二个人脸识别库最正人脸的特征值的第j个人脸的特征值eval2,该人路径为path_person2。比较eval1与eval2的二范数(或称为空间距离)dist。

[4]如果dist小于阈值1(命名为th1),那么将path_person2的所有人脸图片拷贝到path_person1中，将path_person2的文件夹及其内部图片删除。如果dist大于阈值2(命名为th2，th1<th2),读取下一个人脸特征值数据。如果dist大于或等于th1且小于或等于th2,那么将path_person1拷贝到tmp_file中，将path_person2拷贝到tmp_file中的path_person1路径所在人的文件目录中，将path_person2的文件夹及其内部图片删除。

[5]j＝j+1，重复[3]、[4]过程，直到第二个人脸库中的最正面人脸的特征值与第i个人脸的特征值eval1比较完毕。

[6]进入第一个人脸识别库，i＝i+1,重复[2]、[3]、[4]、[5]。直到第一个人脸库中的最正面人脸的特征值全部读取完毕。

[7]两个人脸识别库进行合并(两个库中每个人的文件夹名没有重名)。

[8]人工处理tmp_file中的文件，筛选是否存在重复，如果存在，进行合并，如果不存在重复，那么就将其分开。将处理后的结果，放入到处理后的第一个人脸识别库中。

以上所述仅为本发明的优选实施例而已，并不用于限制本发明，对于本领域的技术人员来说，本发明实施例可以有各种更改和变化。凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种人脸识别样本库的优化方法，其特征在于，所述的方法包括以下步骤：

S1，设定样本存放规则，一张图片只有一个人脸，同一人的图片放到同一个文件夹中，一个文件夹代表一个人，该文件夹命名为person ，person 中的图片命名为image；

S4，对步骤S3.2合并的文件夹内的图片进行筛选，将不同人的图片分开另存；

所述的步骤S1的设定样本存放规则为，一张图片只有一个人脸，同一人的图片放到同一个文件夹中，一个文件夹代表一个人，该文件夹命名为person；

所述的步骤S2进一步包括：

S2.3，将步骤S2.2中最接近正面人脸的图作为该人的最正面人脸图片；

所述的步骤S4中合并的文件夹中的图片进一步进行人工筛选处理；

所述步骤S2.1-S2.3进一步包括：

[1] 初始化，设置参数tmp=0，图片路径path_img=0；

[2] 提取一张图片并记录该图片路径为path_img，检测出该图中人脸的两只眼睛的各自中心位置和人脸的外接矩形的高度height，计算两只眼睛距离与人脸外接矩形高度height的比值为tmp；

[3] 提取下一张图片并记录该图片路径path_img1，检测出该图中人脸的两只眼睛的各自中心位置和人脸的外接矩形，计算两只眼睛距离与人脸外接矩形高度的比值tmp1；

[4] 比较tmp1与tmp的大小，如果tmp1>tmp并且height>80，那么tmp=tmp1, path_img=path_img1；

[5] 重复[3][4]过程，直到该person所有图片被提取完，记录图片路径path_img和该人person的路径；

所述步骤S3进一步包括：

[1] 提取不同人脸识库中每个人的最正面人脸的特征值，每个特征值与该人文件名路径关联，初始化i=1；

[2] 读取第一个人脸识别库最正人脸的特征值的第i个人脸的特征值eval1，该人路径为path_person1，初始化j=1；

[3] 读取第二个人脸识别库最正人脸的特征值的第j个人脸的特征值eval2, 该人路径为path_person2，比较eval1与eval2的二范数或称为空间距离dist；

[4] 如果空间距离dist小于第一阈值,那么将path_person2的所有人脸图片拷贝到path_person1中，将path_person2的文件夹及其内部图片删除；

[5]j=j+1，重复[3]、[4]过程，直到第二个人脸库中的最正面人脸的特征值与第i个人脸的特征值eval1比较完毕；

[6] 进入第一个人脸库，i=i+1,重复[2]、[3]、[4]、[5]，直到第一个人脸库中的最正面人脸的特征值全部读取完毕；

[7]两个库中每个人的文件夹名没有重名则合并；

所述的初始化要求每人至少三张图片；

所述的第一阈值命名为th1；所述的第二阈值命名为th2；