CN111062338A

CN111062338A - 一种证照人像一致性比对方法及其***

Info

Publication number: CN111062338A
Application number: CN201911319574.4A
Authority: CN
Inventors: 林玉玲; 郝占龙; 陈文传; 庄国金
Original assignee: Xiamen Shangji Network Technology Co ltd
Current assignee: Xiamen Shangji Network Technology Co ltd
Priority date: 2019-12-19
Filing date: 2019-12-19
Publication date: 2020-04-24
Anticipated expiration: 2039-12-19
Also published as: CN111062338B

Abstract

本发明涉及一种证照人像一致性比对方法及其***，通过人脸特征识别进行人像裁剪建立样本集，搭建并训练深度学习证照人像比对模型，计算能够正确区分不同样本与相似样本的阈值，将待检测的两个证照人像输入深度学习证照人像比对模型获得两个特征向量，计算两个特征向量的余弦距离，将这个余弦距离的值与阈值相减，即可得出两个证照人像是否一致。本发明有益效果：相较于传统的人工比对，能够更准确地表达人像的图像特征，对明显不同衣服、发型能够敏感地辨别，对相同人像在不同光照背景、不同比例大小的图像也可以有效地区分，减少污染、模糊等恶劣条件的干扰。

Description

一种证照人像一致性比对方法及其***

技术领域

本发明涉及一种证照人像一致性比对方法及其***，属于图像识别领域。

背景技术

客户在银行办理业务时，需要提供身份证原件和身份证复印件，银行后台保留身份证复印件作为留档，后续办理其他业务时，银行中心人员需要拍照并比对客户个人身份证照片和银行电子***内部留存的证件照是否为同一张证件。

证照人像对比在传统银行业务里是由专门的审核人员负责人工肉眼审核，而银行大多数业务都需要进行身份证审核验证，该业务要耗费大量人力资源，且当审核人员工作疲劳时会影响到对比的正确率，进而影响到客户业务的办理。例如，当身份证上人像和留底复印件上人像在发型，穿着，脸型等方面类似时，审核员工可能判定为同一证件或者需要经过二次审核才能确认；另一种情况，当前台员工进行身份证拍照时，因为环境光变化，拍摄设备抖动等干扰，造成身份证拍摄出现模糊，扭曲，污染等瑕疵，审核人员经过多次比对判定为不同证件需要重新拍摄。

发明内容

为了解决上述技术问题，本发明提供一种证照人像一致性比对方法及其***，建立深度学习***，通过神经网络使用机器自动审核证照人像代替人工审核，准确度高，速度快。

本发明的技术方案一：

一种证照人像一致性比对方法，包括如下步骤：

S1：获取含有证照人像的图片，所述含有证照人像的图片包括：同一证件的不同特征图像，不同证件的图像，其中，所述不同特征为拍摄参数不同；

S2：识别所述含有证照人像的图片中的人像，将人像按设定的尺寸进行裁剪并保存为样本文件，对属于同一证件的样本文件标注为同类，对不属于同一证件的样本文件标注为不同类；

S3：将所有样本文件分成训练集和测试集；

S4：搭建深度学习人像比对模型，所述深度学习人像比对模型的神经网络主干采用50层残差卷积网络，输入所述样本文件，经过卷积网络的多层卷积和池化处理，输出一个512维的特征向量，所述512维的特征向量接入全连接层，所述全连接层将所述512维的特征向量转化为一个数组，数组的值表示输入的所述样本文件是同类和不同类的概率，其中，所述神经网络设置一损失函数连接所述全连接层，通过所述损失函数运算使得所述深度学习人像比对模型运行结果趋于最优解；

S5：将S3步骤得到的训练集中的样本文件输入到S4步骤搭建的深度学习人像比对模型中进行训练，直至所述全连接层输出的数组预测类型正确的概率达到最高，得到能正确表达证照人像类别特征的证照人像比对模型；

S6：将所述测试集中的样本文件输入到所述证照人像比对模型中，将所有同类样本文件经过所述深度学习人像比对模型输出的512维的特征向量两两组合，并计算每个组合中两个特征向量的差值，记为同类数组；

将所有不同类样本文件经过所述深度学习人像比对模型输出的512维的特征向量两两组合，并计算每个组合中两个特征向量的差值，记为不同类数组；

将两个数组代入ROC曲线算法获得阈值，则高于该阈值的两个样本为同类样本，低于该阈值的两个样本为不同类样本；

S7：将一对待验证证照人像图像通过S2步骤处理，得到归一化图像，分别输入到所述证照人像比对模型中，输出两个证照人像的512维特征描述向量，计算所述两个特征向量的差值，将所述差值与S6步骤得到的所述阈值相减，当结果为正时，判定为两个证照人像一致，当结果为负时，判定为两个证照人像不一致。

S2步骤具体为：

S21：检测人脸的关键点，将所述含有证照人像的图片输入到MTCNN多任务卷积神经网络中，所述MTCNN多任务卷积神经网络通过卷积池化识别到人脸5个关键点，并建立关键点外包围框，所述关键点为人脸的两个眼珠，一个鼻尖，两个嘴角；

S22：以所述关键点外包围框，向外扩展设定的宽度和高度比例，得到四个角点坐标，将四个角点坐标相连裁切得到人像，其中，向外扩展设定的宽度和高度比例分别为30％和40％。

S1步骤中，通过改变拍摄角度，环境光强、拍摄距离，拍摄设备来获取同一证件的不同特征图像。

S4步骤中，所述Arcface损失函数具体为：

其中，

L为损失值，N代表样本的数量，i代表第i个样本，j代表第j个类别，yi代表第i个样本所属的类别的分数，s和m为模型的超参数，W为深度模型的权重，X为输入的特征向量，θ为输入向量X与权重W之间的夹角，T表示的是对这个向量的转置。

S6步骤中，所述计算每个组合中两个特征向量的差值的方法为余弦距离计算方法。

技术方案二

一种证照人像一致性比对***，包括存储器和处理器，所述存储器存储有指令，所述指令适于由处理器加载并执行以下步骤：

S1：获取含有证照人像的图片，所述含有证照人像的图片包括：同一证件的不同特征图像，不同证件的图像，其中，所述不同特征图像为拍摄参数不同；

S3：将所有样本文件分成训练集和测试集；

S2步骤具体为：

S4步骤中，所述损失函数为Arcface损失函数，具体为：

其中，

本发明具有如下有益效果：

1、本发明的一种证照人像一致性比对方法及其***，通过MTCNN多任务卷积神经网络来实现人脸特征识别，确保人像裁剪位置的一致性；

2、本发明的一种证照人像一致性比对方法及其***，通过搭建神经网络进行证照人像特征提取和比对，精度高，效率快；

3、本发明的一种证照人像一致性比对方法及其***，搭建的神经网络采用arcface损失函数，直接关注特征的角度可分性，人为设置分类间隔m以缩小类内间距和拉大类间差距，使得模型的拟合性能更强，准确性更高；

4、本发明的一种证照人像一致性比对方法及其***，通过计算余弦距离和ROC曲线算法获得最佳阈值，准确性高。

附图说明

图1为本发明的一种证照人像一致性比对方法及其***的流程图；

图2为本发明的一种证照人像一致性比对方法及其***的使用的MTCNN人脸关键点检测示意图；

图3为本发明的一种证照人像一致性比对方法及其***的人像裁剪示意图；

图4为本发明的一种证照人像一致性比对方法及其***的ROC曲线算法示意图。

具体实施方式

下面结合附图和具体实施例来对本发明进行详细的说明。

实施例一

如图1所示，一种证照人像一致性比对方法，包括如下步骤：

S1：获取含有证照人像的图片，所述含有证照人像的图片包括：同一证件的不同特征图像，不同证件的图像，其中，所述不同特征为拍摄参数不同。

证照人像一致性比对是比对两个人像是不是完全一致，即是不是同一个证件，这里的同一个人像指完全一样的，同一个人不同发型穿着的两张头像都不能算一致。在银行工作流程中，客户身份证原件没有变化，只是要重新扫描身份证和***里原来保存的图像作对比，然后获取的样本里基于同一个证件可能经过多次拍摄参数的调整，或者各种图像处理比如缩放，裁剪的记为一类，其他完全不一样的记为两类，经过训练神经网络能识别这个图片就是相同一类，还是不同的。

除了在拍摄过程中改变拍摄条件来获得同一证件的不同图像，还可以通过对同一证件的基准图像进行图像处理，例如模糊，加噪声，扭曲等使得图像发生变化。

S2：识别所述含有证照人像的图片中的人像，将人像按设定的尺寸进行裁剪并保存为样本文件，对属于同一证件的样本文件标注为同类，对不属于同一证件的样本文件标注为不同类。

训练时可以分为多组，每一组都有一个基准的证件图像，另外包括这个基准证件的同类图像，和其他不同类图像，例如，在甲组训练组中，甲的多张证件照图像记为同类，乙丙丁等证件照图像记为不同类；在乙组训练组中，乙的多张证件照图像记为同类，甲丙丁等证件照图像记为不同类，其中，甲在本组中被记为同类，在乙组中被记为不同类。通过多组训练可以提高模型的准确性。

S3：将所有样本文件分成训练集和测试集。

在本实施例中，将所有样本文件按8:2的比例分成训练集和测试集，此时训练数据和测试数据的量比较平衡。

S4：搭建深度学习人像比对模型，所述深度学习人像比对模型的神经网络主干采用50层残差卷积网络，输入所述样本文件，经过卷积网络的多层卷积和池化处理，输出一个512维的特征向量，所述512维的特征向量接入全连接层，所述全连接层将所述512维的特征向量转化为一个数组，数组的值表示输入的所述样本文件是同类和不同类的概率，其中，所述神经网络设置一损失函数连接所述全连接层，通过所述损失函数运算使得所述深度学习人像比对模型运行结果趋于最优解。

这个512维的向量是用来表征这个图像的各种特征，是机器自己用来表述一个图像的，可以理解为当前图像的唯一ID。训练神经网络就是为了获得一个能最好的表述图像特征的模型。全连接层的作用是，通过不断的训练，使得全连接层的预测正确的概率越来越大，进而使得表述图像的512维向量越来越准确。

全连接层将经过卷积池化以后输出的多维向量转化为一个数组，执行的是预测工作。

S4步骤中，所述损失函数为Arcface损失函数，具体为：

其中，

损失函数(loss function)是将随机事件或其有关随机变量的取值映射为非负实数以表示该随机事件的“风险”或“损失”的函数。在应用中，损失函数通常作为学习准则与优化问题相联系，即通过最小化损失函数求解和评估模型。在深度学习中，损失函数的计算结果表示卷积网络层的输出结果与实际标注结果的一个差异值，常用的损失函数为softmax，但softmax只在欧式空间里学习特征，只考虑样本是否能正确分类，并没有考虑类内和类间距离，即不能优化特征使得正样本对得到高相似度而负样本对得到低相似度。本实施例采用Arcface损失函数，Arcface损失函数直接关注特征的角度可分性，人为设置分类间隔m以缩小类内间距和拉大类间差距，使得模型的拟合性能更强。

S5：将S3步骤得到的训练集中的样本文件输入到S4步骤搭建的深度学习人像比对模型中进行训练，直至所述全连接层输出的数组预测类型正确的概率达到最高，得到能正确表达证照人像类别特征的证照人像比对模型。

S6：将所述测试集中的样本文件输入到所述证照人像比对模型中，将所有同类样本文件经过所述深度学习人像比对模型输出的512维的特征向量两两组合，并计算每个组合中两个特征向量的差值，记为同类数组。

将两个数组代入ROC曲线算法获得阈值，则高于该阈值的两个样本为同类样本，低于该阈值的两个样本为不同类样本。

计算两个空间点阵数组之间的差值可以使用多种计算方法，欧氏距离，标准化欧氏距离，马氏距离，余弦距离，汉明距离，曼哈顿距离等。其中使用余弦距离计算方法对于512维的向量更加精确，结果之间差异明显。

两个样本每个对应一个输出的向量，这个向量是512维的。计算所有同类余弦距离和不同类余弦距离，然后用算法计算出一个阈值。类似找出所有的值然后画在图上，会发现在某一个点处上面的组合大部分同类，下面的组合大部分非同类，则这个点就是阈值，当然ROC不是这么简单计算的，他是一种现有的数学方法，专门用来计算这种情况。

ROC曲线指受试者工作特征曲线/接收器操作特性曲线(receiver operatingcharacteristic curve),是反映敏感性和特异性连续变量的综合指标,是用构图法揭示敏感性和特异性的相互关系，它通过将连续变量设定出多个不同的临界值，从而计算出一系列敏感性和特异性，再以敏感性为纵坐标、(1-特异性)为横坐标绘制成曲线，曲线下面积越大，诊断准确性越高。在ROC曲线上，最靠近坐标图左上方的点为敏感性和特异性均较高的临界值。

将所有同类样本和不同类样本的两个特征向量的余弦距离带入ROC算法中获得ROC曲线，如图4所示，最接近的顶点的纵坐标true值为0.87，则设定阈值为0.87。

如图3所示，S2步骤具体为：

通过人脸关键点定位并扩展比例，能够获得整副人脸图像，同时又减少了多余部分对后续识别的干扰。且无论原图像大小如何，输出的图像都为同一比例。

步骤S21中，如图2所示，将所述含有证照人像的图片输入到MTCNN多任务卷积神经网络中，所述MTCNN多任务卷积神经网络通过卷积池化识别到人脸5个关键点，并获得关键点外包围框。

MTCNN执行人脸关键点检测时，自动根据关键点连线外扩绘制外包围框。

本发明的一种证照人像一致性比对方法及其***，通过MTCNN多任务卷积神经网络来实现人脸特征识别，确保人像裁剪位置的一致性；通过搭建神经网络进行证照人像特征提取和比对，精度高，效率快；搭建的神经网络采用arcface损失函数，直接关注特征的角度可分性，人为设置分类间隔m以缩小类内间距和拉大类间差距，使得模型的拟合性能更强，准确性更高；通过计算余弦距离和ROC曲线算法获得最佳阈值，准确性高。

实施例二

S3：将所有样本文件分成训练集和测试集；

S2步骤具体为：

S4步骤中，所述损失函数为Arcface损失函数，具体为：

其中，

以上所述仅为本发明的实施例，并非因此限制本发明的专利范围，凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换，或直接或间接运用在其他相关的技术领域，均同理包含在本发明的专利保护范围内。