CN109614881A

CN109614881A - 可自适应调节阈值的生物识别认证方法、设备及存储设备

Info

Publication number: CN109614881A
Application number: CN201811378272.XA
Authority: CN
Inventors: 宋军; 杨帆; 牛蕴方; 林婉霜; 惠峥; 胡雨涛; 张坤
Original assignee: China University of Geosciences
Current assignee: China University of Geosciences
Priority date: 2018-11-19
Filing date: 2018-11-19
Publication date: 2019-04-12
Anticipated expiration: 2038-11-19
Also published as: CN109614881B

Abstract

本发明提供了一种可自适应调节阈值的生物识别认证方法、设备及存储设备，包括：首先对用户的面部图片和声纹样本进行采集，并计算面部图片相似度和声纹相似度；然后计算出面部图片和声纹样本的质量分数，再根据质量分数对实际的面部识别阈值和声纹识别阈值进行调整；最后将面部图片相似度和声纹相似度与实际的阈值相比较，判断用户认证是否成功。一种可自适应调节阈值的生物识别认证设备及存储设备，用于实现一种可自适应调节阈值的生物识别认证方法。本发明的有益效果是：本发明根据图片质量和声音质量动态调节人脸识别和声纹识别通过的阈值，尽量降低外界环境因素对生物特征识别造成的影响，从而调节多模态身份认证方式，提高认证精度。

Description

可自适应调节阈值的生物识别认证方法、设备及存储设备

技术领域

本发明涉及生物识别领域，尤其涉及一种可自适应调节阈值的生物识别认证方法、设备及存储设备。

背景技术

随着对社会安全和身份鉴别准确性和可靠性要求的日益提升，单一生物特征识别在准确性和可靠性方面的局限性日益突出，已远不能满足产品和技术发展的需要。当前，多模态生物特征识别被认为是一个最具潜力和优势的研究方向。针对多模态生物特征观测数据，如何实现异构特征的智能处理和高效的融合计算仍是一个极具挑战性的课题。此外，当今的多模态生物识别技术难以适应较复杂的识别环境。

发明内容

为了解决上述问题，本发明提供了一种可自适应调节阈值的生物识别认证方法，主要包括以下步骤：

S101：在注册阶段，利用相机和麦克风对注册用户的人脸和声音信息进行采集，得到第一面部图片和第一声纹样本，并将第一面部图片和第一声纹样本存储于本地数据库中，作为认证基准信息；

S102：在认证阶段，利用相机和麦克风对待认证的用户进行人脸和声音信息采集，得到第二面部图片和第二声纹样本；并根据认证基准信息，计算得到面部图片相似度face_sim和声纹相似度voice_sim；

S103：对采集的第二面部图片进行图像增强，得到增强的面部图片；并利用无参考型图像质量客观评价算法对增强的面部图片的质量进行评估量化，得到图片质量分数SC_f；

S104：利用DNN深度神经网络算法对第二声纹样本中的语音信息分别进行增强处理，得到增强的声纹样本数据；并根据增强的声纹样本数据，计算得到声纹质量分数SC_s；

S105：对图片质量分数SC_f和声纹质量分数SC_s分别进行归一化处理，得到归一化后的图片质量分数n_f和归一化后的声纹质量分数n_s；

S106：根据归一化后的图片质量分数n_f和归一化后的声纹质量分数n_s，计算得到实际面部识别阈值T_f和实际声纹识别阈值T_s；

S107：将面部图片相似度face_sim和声纹相似度voice_sim与实际面部识别阈值T_f和实际声纹识别阈值T_s进行比对；若条件face_sim≥T_f和voice_sim≥T_s同时成立，则认证成功，允许登陆，并转到步骤S108；否则，认证失败，转到步骤S108；

S108：认证程序结束。

进一步地，步骤S102中，根据认证基准信息，采用OpenCV库中的facedetect功能，对第一面部图片和第二面部图片的相似度进行计算，得到面部图片相似度face_sim；采用梅尔倒谱系数MFCC作为语音特征相似度的评价参数，对第二声纹样本的声纹相似度进行计算，得到声纹相似度voice_sim；所述第二声纹样本包括三段时间长度相等，内容不同的用户语音信息。

进一步地，采用OpenCV库中的facedetect功能，对第一面部图片和第二面部图片的相似度进行计算的方法具体为：首先利用OpenCV库中的facedetect功能将第一面部图片和第二面部图片中的人脸检测出来；然后将检测到的人脸分别剪切出来，得到两张分别只包含第一面部图片中人脸的图片和只包含第二面部图片中人脸的图片；再将分别将只包含人脸的图片转换成单通道的图像；最后使用直方图比较这两张单通道的人脸图像，得到面部图片相似度face_sim。

进一步地，步骤S103中，图像增强的具体过程如下：

S201：调用OpenCV库中的equalizeHist()方法对增强的面部图片进行直方图均衡化处理，得到均衡化后的面部图片；

S202：调用OpenCV库中的GaussianBlur()方法对均衡化后的面部图片进行高斯滤波，得到滤波后的面部图片；

S203：调用OpenCV库中的Laplacian()方法对滤波后的面部图片进行3×3的Laplacian算子卷积滤波，得到增强的面部图片。

进一步地，步骤S103中，SC_f的计算公式如公式(1)所示：

上式中，为图片中人脸部分的平均灰度，为增强后整个图片的灰度平均值；为图片对比度；为图片适宜度； p、G_max和G_min分别为：相邻像素间的灰度差为i的像素分布概率、图像灰度最大值和图像灰度最小值。

进一步地，步骤S104中，增强的声纹样本数据包括：分段信噪比SegSNR和对数谱畸变程度LSD；根据增强的声纹样本数据，采用公式(2)对声纹样本进行质量评估，得到声纹质量分数SC_s：

SC_s＝k_s×SegSNR+k_l×e^-LSD (2)

上式中，k_s和k_l分别表示SegSNR和LSD对质量分数的影响程度，k_s和k_l均大于0，为预设值；声纹质量分数SC_s包括三段增强的语音信息分别进行质量评估后得到的声纹质量分数：SC_s1、SC_s2和SC_s3。

进一步地，步骤S105中，利用公式(3)对图片质量分数SC_f进行归一化处理，得到归一化后的图片质量分数n_f：

n_f＝1-(1-SC_f)^m (3)

上式中，m表示归一化处理程度，m大于0，为预设值；

利用公式(4)对声纹质量分数SC_s进行归一化处理，得到归一化后的声纹质量分数n_s：

上式中，SC_smax＝max(SC_s1,SC_s2,SC_s3)。

进一步地，步骤S106中，利用公式(5)和公式(6)分别计算实际面部识别阈值T_f和实际声纹识别阈值T_s：

当n_f≥n_s时：

当n_f<n_s时：

公式(5)和公式(6)中，T_f0和T_s0分别为面部识别基准阈值和声纹识别基准阈值；A_s1和T_f1分别为面部识别和声纹识别阈值的下降极限值；A_s2和A_f2分别为面部识别和声纹识别阈值的上升极限值；B_s1和B_f1分别为面部识别和声纹识别阈值的下降速度；B_s2和B_f2分别为面部识别和声纹识别阈值的上升速度；T_f0、T_s0、A_s1、A_f1、A_s2、A_f2、B_s1、B_f1、B_s2和B_f2均为先验值。

一种存储设备，所述存储设备存储指令及数据用于实现一种可自适应调节阈值的生物识别认证方法。

一种可自适应调节阈值的生物识别认证设备，包括：处理器及所述存储设备；所述处理器加载并执行所述存储设备中的指令及数据用于实现一种可自适应调节阈值的生物识别认证方法。

本发明提供的技术方案带来的有益效果是：本发明提出的技术方案，通过光线强度、灰度对比度和适宜度等指标对用户提交的人脸图像进行质量评估，根据图片质量动态调节人脸识别通过的阈值，尽量降低外界环境因素，如光线强度、摄像设备等对人脸识别造成的影响，并对图片进行直方图均衡化、高斯滤波等预处理，评估此时的环境因素；同时使用DNN深度神经网络进行人声增强及噪声评估，可较准确地反映当前的语音质量。结合两者质量的评估，动态调整声音识别和面部识别的权重，从而调节多模态身份认证方式，提高认证精度。

附图说明

下面将结合附图及实施例对本发明作进一步说明，附图中：

图1是本发明实施例中一种可自适应调节阈值的生物识别认证的流程图；

图2是本发明实施例中质量较差面部图像的质量评估结果的示意图；

图3是本发明实施例中语音采集界面的示意图；

图4是本发明实施例中语音质量的评价效果的示意图；

图5是本发明实施例中原始语音信号波形示意图；

图6是本发明实施例中语音增强后的信号波形示意图；

图7是本发明实施例中认证准确度的对比示意图；

图8是本发明实施例中硬件设备工作的示意图。

具体实施方式

为了对本发明的技术特征、目的和效果有更加清楚的理解，现对照附图详细说明本发明的具体实施方式。

本发明的实施例提供了一种可自适应调节阈值的生物识别认证方法、设备及存储设备。

请参考图1，图1是本发明实施例中一种可自适应调节阈值的生物识别认证方法的流程图，具体包括如下步骤：

S104：利用DNN深度神经网络算法对第二声纹样本中的语音信息分别进行增强处理，得到增强的声纹样本数据具体步骤，(见参考文献：Xu Y,Du J,Huang Z,et al.Multi-objective learning and mask-based post-processing for deep neural networkbased speech enhancement[C]//INTERSPEECH.2015)；并根据增强的声纹样本数据，计算得到声纹质量分数SC_s；

S108：认证程序结束。

步骤S102中，根据认证基准信息，采用OpenCV库中的facedetect功能，对第一面部图片和第二面部图片的相似度进行计算，得到面部图片相似度face_sim；采用梅尔倒谱系数MFCC作为语音特征相似度的评价参数，对第二声纹样本的声纹相似度进行计算(具体方法，见参考文献：赵桂兰，孙东.基于MATLAB的MFCC在语音相似度评价中的应用)，得到声纹相似度voice_sim；所述第二声纹样本包括三段时间长度相等，内容不同的用户语音信息。

采用OpenCV库中的facedetect功能，对第一面部图片和第二面部图片的相似度进行计算的方法具体为：首先利用OpenCV库中的facedetect功能将第一面部图片和第二面部图片中的人脸检测出来；然后将检测到的人脸分别剪切出来，得到两张分别只包含第一面部图片中人脸的图片和只包含第二面部图片中人脸的图片；再将分别将只包含人脸的图片转换成单通道的图像；最后使用直方图比较这两张单通道的人脸图像，得到面部图片相似度face_sim。

步骤S103中，图像增强的具体过程如下：

步骤S103中，SC_f的计算公式如公式(1)所示：

步骤S104中，增强的声纹样本数据包括：分段信噪比SegSNR和对数谱畸变程度LSD；根据增强的声纹样本数据，采用公式(2)对声纹样本进行质量评估，得到声纹质量分数SC_s：

SC_s＝k_s×SegSNR+k_l×e^-LSD (2)

步骤S105中，利用公式(3)对图片质量分数SC_f进行归一化处理，得到归一化后的图片质量分数n_f：

n_f＝1-(1-SC_f)^m (3)

上式中，m表示归一化处理程度，m大于0，为预设值；

上式中，SC_smax＝max(SC_s1,SC_s2,SC_s3)。

步骤S106中，利用公式(5)和公式(6)分别计算实际面部识别阈值T_f和实际声纹识别阈值T_s：

当n_f≥n_s时：

当n_f<n_s时：

公式(5)和公式(6)中，T_f0和T_s0分别为面部识别基准阈值和声纹识别基准阈值；A_s1和A_f1分别为面部识别和声纹识别阈值的下降极限值；A_s2和A_f2分别为面部识别和声纹识别阈值的上升极限值；B_s1和B_f1分别为面部识别和声纹识别阈值的下降速度；B_s2和B_f2分别为面部识别和声纹识别阈值的上升速度；T_f0、T_s0、A_s1、A_f1、A_s2、A_f2、B_s1、B_f1、B_s2和B_f2均为先验值。

为进一步对本发明所提出的技术方案进行说明，本发明实施例进行了如下测试：

首先使用一张光线条件较差的情况下采集的人脸图片进行测试，如图2所示，为图片测试的结果，可以看到，当光线条件较差时，图片评分显著降低。

然后采集三组测试者的语料信息，采集过程中需要保证相对良好的测试环境，采集界面如图3。采集完毕后，使用DNN深度神经网络进行人声增强及噪声评估，并记录采集语音的SNR、LSD等指标作为声音质量归一化的参考信息。语音质量的评价效果如图4所示，六个数据分别表示三组语音样本的SNR和LSD指标。

原始语音信号波形图和语音增强后的信号波形图分别如图5和图6所示。通过对比可以直观地看出，语音增强后语音信号的质量得到了明显的增强，噪声部分的波形被滤除，增强效果十分明显。

最后进行自适应调节：自适应调节生物认证方式时，首先进行声纹特征的采集，之后***会对其进行降噪处理并得到语音质量的评价信息。语音信息采集完成后，***会调用摄像头拍摄测试者的面部信息，并对面部图像进行质量评价。信息采集完毕后，经过归一化、阈值调整等步骤，综合判断得到的认证结果。

自适应调节生物识别性能测试将从不同环境下人脸识别和声纹识别的准确度展开，并测试自适应调节后的识别准确度。从而判定本模块在极端环境下的效果。

表1展示了不同图像质量条件下，人脸识别准确度(TP)的数值变化趋势，其中人脸识别的通过阈值设定为0.7。

表1不同图像质量(Q)下人脸识别平均准确度(TP)

评估质量(Q)	准确度(TP)
		0.5-0.6	55.6％
0.6-0.7	69.2％
		0.7-0.8	80.7％
0.8-0.9	88.5％
		0.9-1.0	92.4％

表2展示了不同语音信噪比(SNR)下，声纹识别准确度(TP)的数值变化趋势，其中声纹识别设定的通过阈值为1.0。

表2不同信噪比(SNR)下声纹识别平均准确度(TP)

信噪比(SNR)	准确度(TP)
		0.9-1.0	8.1％
1.0-2.0	33.7％
		2.0-3.0	61.2％
3.0-4.0	78.3％
		4.0以上	88.5％

图7展示了本发明所提出的技术方案与单模态条件下的认证准确度的对比，其中，假定单模态各种环境因素出现概率相等。通过分析，该调节模型较好地弥补了单模态生物识别受环境因素制约的缺陷。

以上就是本发明实施例对本发明所提出的技术方案进行测试的结果，经测试，本发明所提出的的技术方案可以实现预期的功能，达到了预期的效果。

请参见图8，图8是本发明实施例的硬件设备工作示意图，所述硬件设备具体包括：一种可自适应调节阈值的生物识别认证设备801、处理器802及存储设备803。

一种可自适应调节阈值的生物识别认证设备801：所述一种可自适应调节阈值的生物识别认证设备801实现所述一种可自适应调节阈值的生物识别认证方法。

处理器802：所述处理器802加载并执行所述存储设备803中的指令及数据用于实现所述一种可自适应调节阈值的生物识别认证方法。

存储设备803：所述存储设备803存储指令及数据；所述存储设备803用于实现所述一种可自适应调节阈值的生物识别认证方法。

本发明的有益效果是：本发明提出的技术方案，通过光线强度、灰度对比度和适宜度等指标对用户提交的人脸图像进行质量评估，根据图片质量动态调节人脸识别通过的阈值，尽量降低外界环境因素，如光线强度、摄像设备等对人脸识别造成的影响，并对图片进行直方图均衡化、高斯滤波等预处理，评估此时的环境因素；同时使用DNN深度神经网络进行人声增强及噪声评估，可较准确地反映当前的语音质量。结合两者质量的评估，动态调整声音识别和面部识别的权重，从而调节多模态身份认证方式，提高认证精度。

以上所述仅为本发明的较佳实施例，并不用以限制本发明，凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种可自适应调节阈值的生物识别认证方法，其特征在于：包括以下步骤：

S108：认证程序结束。

2.如权利要求1所述的一种可自适应调节阈值的生物识别认证方法，其特征在于：步骤S102中，根据认证基准信息，采用OpenCV库中的facedetect功能，对第一面部图片和第二面部图片的相似度进行计算，得到面部图片相似度face_sim；采用梅尔倒谱系数MFCC作为语音特征相似度的评价参数，对第二声纹样本的声纹相似度进行计算，得到声纹相似度voice_sim；所述第二声纹样本包括三段时间长度相等，内容不同的用户语音信息。

3.如权利要求2所述的一种可自适应调节阈值的生物识别认证方法，其特征在于：采用OpenCV库中的facedetect功能，对第一面部图片和第二面部图片的相似度进行计算的方法具体为：首先利用OpenCV库中的facedetect功能将第一面部图片和第二面部图片中的人脸检测出来；然后将检测到的人脸分别剪切出来，得到两张分别只包含第一面部图片中人脸的图片和只包含第二面部图片中人脸的图片；再将分别将只包含人脸的图片转换成单通道的图像；最后使用直方图比较这两张单通道的人脸图像，得到面部图片相似度face_sim。

4.如权利要求1所述的一种可自适应调节阈值的生物识别认证方法，其特征在于：步骤S103中，图像增强的具体过程如下：

5.如权利要求1所述的一种可自适应调节阈值的生物识别认证方法，其特征在于：步骤S103中，SC_f的计算公式如公式(1)所示：

6.如权利要求1所述的一种可自适应调节阈值的生物识别认证方法，其特征在于：步骤S104中，增强的声纹样本数据包括：分段信噪比SegSNR和对数谱畸变程度LSD；根据增强的声纹样本数据，采用公式(2)对声纹样本进行质量评估，得到声纹质量分数SC_s：

SC_s＝k_s×SegSNR+k_l×e^-LSD (2)

7.如权利要求1所述的一种可自适应调节阈值的生物识别认证方法，其特征在于：步骤S105中，利用公式(3)对图片质量分数SC_f进行归一化处理，得到归一化后的图片质量分数n_f：

n_f＝1-(1-SC_f)^m (3)

上式中，m表示归一化处理程度，m大于0，为预设值；

上式中，SC_smax＝max(SC_s1,SC_s2,SC_s3)。

8.如权利要求1所述的一种可自适应调节阈值的生物识别认证方法，其特征在于：步骤S106中，利用公式(5)和公式(6)分别计算实际面部识别阈值T_f和实际声纹识别阈值T_s：

当n_f≥n_s时：

当n_f<n_s时：

9.一种存储设备，其特征在于：所述存储设备存储指令及数据用于实现权利要求1～8所述的任意一种可自适应调节阈值的生物识别认证方法。

10.一种可自适应调节阈值的生物识别认证设备，其特征在于：包括：处理器及存储设备；所述处理器加载并执行存储设备中的指令及数据用于实现权利要求1～8所述的任意一种可自适应调节阈值的生物识别认证方法。