CN109614881A - 可自适应调节阈值的生物识别认证方法、设备及存储设备 - Google Patents

可自适应调节阈值的生物识别认证方法、设备及存储设备 Download PDF

Info

Publication number
CN109614881A
CN109614881A CN201811378272.XA CN201811378272A CN109614881A CN 109614881 A CN109614881 A CN 109614881A CN 201811378272 A CN201811378272 A CN 201811378272A CN 109614881 A CN109614881 A CN 109614881A
Authority
CN
China
Prior art keywords
picture
vocal print
face
threshold value
facial picture
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201811378272.XA
Other languages
English (en)
Other versions
CN109614881B (zh
Inventor
宋军
杨帆
牛蕴方
林婉霜
惠峥
胡雨涛
张坤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China University of Geosciences
Original Assignee
China University of Geosciences
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China University of Geosciences filed Critical China University of Geosciences
Priority to CN201811378272.XA priority Critical patent/CN109614881B/zh
Publication of CN109614881A publication Critical patent/CN109614881A/zh
Application granted granted Critical
Publication of CN109614881B publication Critical patent/CN109614881B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/161Detection; Localisation; Normalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/70Multimodal biometrics, e.g. combining information from different biometric modalities

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Multimedia (AREA)
  • Human Computer Interaction (AREA)
  • Biomedical Technology (AREA)
  • Mathematical Physics (AREA)
  • Data Mining & Analysis (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Evolutionary Computation (AREA)
  • Software Systems (AREA)
  • Biophysics (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Collating Specific Patterns (AREA)

Abstract

本发明提供了一种可自适应调节阈值的生物识别认证方法、设备及存储设备,包括:首先对用户的面部图片和声纹样本进行采集,并计算面部图片相似度和声纹相似度;然后计算出面部图片和声纹样本的质量分数,再根据质量分数对实际的面部识别阈值和声纹识别阈值进行调整;最后将面部图片相似度和声纹相似度与实际的阈值相比较,判断用户认证是否成功。一种可自适应调节阈值的生物识别认证设备及存储设备,用于实现一种可自适应调节阈值的生物识别认证方法。本发明的有益效果是:本发明根据图片质量和声音质量动态调节人脸识别和声纹识别通过的阈值,尽量降低外界环境因素对生物特征识别造成的影响,从而调节多模态身份认证方式,提高认证精度。

Description

可自适应调节阈值的生物识别认证方法、设备及存储设备
技术领域
本发明涉及生物识别领域,尤其涉及一种可自适应调节阈值的生物识别认证方法、设备及存储设备。
背景技术
随着对社会安全和身份鉴别准确性和可靠性要求的日益提升,单一生物特征识别在准确性和可靠性方面的局限性日益突出,已远不能满足产品和技术发展的需要。当前,多模态生物特征识别被认为是一个最具潜力和优势的研究方向。针对多模态生物特征观测数据,如何实现异构特征的智能处理和高效的融合计算仍是一个极具挑战性的课题。此外,当今的多模态生物识别技术难以适应较复杂的识别环境。
发明内容
为了解决上述问题,本发明提供了一种可自适应调节阈值的生物识别认证方法,主要包括以下步骤:
S101:在注册阶段,利用相机和麦克风对注册用户的人脸和声音信息进行采集,得到第一面部图片和第一声纹样本,并将第一面部图片和第一声纹样本存储于本地数据库中,作为认证基准信息;
S102:在认证阶段,利用相机和麦克风对待认证的用户进行人脸和声音信息采集,得到第二面部图片和第二声纹样本;并根据认证基准信息,计算得到面部图片相似度face_sim和声纹相似度voice_sim;
S103:对采集的第二面部图片进行图像增强,得到增强的面部图片;并利用无参考型图像质量客观评价算法对增强的面部图片的质量进行评估量化,得到图片质量分数SCf
S104:利用DNN深度神经网络算法对第二声纹样本中的语音信息分别进行增强处理,得到增强的声纹样本数据;并根据增强的声纹样本数据,计算得到声纹质量分数SCs
S105:对图片质量分数SCf和声纹质量分数SCs分别进行归一化处理,得到归一化后的图片质量分数nf和归一化后的声纹质量分数ns
S106:根据归一化后的图片质量分数nf和归一化后的声纹质量分数ns,计算得到实际面部识别阈值Tf和实际声纹识别阈值Ts
S107:将面部图片相似度face_sim和声纹相似度voice_sim与实际面部识别阈值Tf和实际声纹识别阈值Ts进行比对;若条件face_sim≥Tf和voice_sim≥Ts同时成立,则认证成功,允许登陆,并转到步骤S108;否则,认证失败,转到步骤S108;
S108:认证程序结束。
进一步地,步骤S102中,根据认证基准信息,采用OpenCV库中的facedetect功能,对第一面部图片和第二面部图片的相似度进行计算,得到面部图片相似度face_sim;采用梅尔倒谱系数MFCC作为语音特征相似度的评价参数,对第二声纹样本的声纹相似度进行计算,得到声纹相似度voice_sim;所述第二声纹样本包括三段时间长度相等,内容不同的用户语音信息。
进一步地,采用OpenCV库中的facedetect功能,对第一面部图片和第二面部图片的相似度进行计算的方法具体为:首先利用OpenCV库中的facedetect功能将第一面部图片和第二面部图片中的人脸检测出来;然后将检测到的人脸分别剪切出来,得到两张分别只包含第一面部图片中人脸的图片和只包含第二面部图片中人脸的图片;再将分别将只包含人脸的图片转换成单通道的图像;最后使用直方图比较这两张单通道的人脸图像,得到面部图片相似度face_sim。
进一步地,步骤S103中,图像增强的具体过程如下:
S201:调用OpenCV库中的equalizeHist()方法对增强的面部图片进行直方图均衡化处理,得到均衡化后的面部图片;
S202:调用OpenCV库中的GaussianBlur()方法对均衡化后的面部图片进行高斯滤波,得到滤波后的面部图片;
S203:调用OpenCV库中的Laplacian()方法对滤波后的面部图片进行3×3的Laplacian算子卷积滤波,得到增强的面部图片。
进一步地,步骤S103中,SCf的计算公式如公式(1)所示:
上式中,为图片中人脸部分的平均灰度,为增强后整个图片的灰度平均值;为图片对比度; 为图片适宜度; p、Gmax和Gmin分别为:相邻像素间的灰度差为i的像素分布概率、图像灰度最大值和图像灰度最小值。
进一步地,步骤S104中,增强的声纹样本数据包括:分段信噪比SegSNR和对数谱畸变程度LSD;根据增强的声纹样本数据,采用公式(2)对声纹样本进行质量评估,得到声纹质量分数SCs
SCs=ks×SegSNR+kl×e-LSD (2)
上式中,ks和kl分别表示SegSNR和LSD对质量分数的影响程度,ks和kl均大于0,为预设值;声纹质量分数SCs包括三段增强的语音信息分别进行质量评估后得到的声纹质量分数:SCs1、SCs2和SCs3
进一步地,步骤S105中,利用公式(3)对图片质量分数SCf进行归一化处理,得到归一化后的图片质量分数nf
nf=1-(1-SCf)m (3)
上式中,m表示归一化处理程度,m大于0,为预设值;
利用公式(4)对声纹质量分数SCs进行归一化处理,得到归一化后的声纹质量分数ns
上式中,SCsmax=max(SCs1,SCs2,SCs3)。
进一步地,步骤S106中,利用公式(5)和公式(6)分别计算实际面部识别阈值Tf和实际声纹识别阈值Ts
当nf≥ns时:
当nf<ns时:
公式(5)和公式(6)中,Tf0和Ts0分别为面部识别基准阈值和声纹识别基准阈值;As1和Tf1分别为面部识别和声纹识别阈值的下降极限值;As2和Af2分别为面部识别和声纹识别阈值的上升极限值;Bs1和Bf1分别为面部识别和声纹识别阈值的下降速度;Bs2和Bf2分别为面部识别和声纹识别阈值的上升速度;Tf0、Ts0、As1、Af1、As2、Af2、Bs1、Bf1、Bs2和Bf2均为先验值。
一种存储设备,所述存储设备存储指令及数据用于实现一种可自适应调节阈值的生物识别认证方法。
一种可自适应调节阈值的生物识别认证设备,包括:处理器及所述存储设备;所述处理器加载并执行所述存储设备中的指令及数据用于实现一种可自适应调节阈值的生物识别认证方法。
本发明提供的技术方案带来的有益效果是:本发明提出的技术方案,通过光线强度、灰度对比度和适宜度等指标对用户提交的人脸图像进行质量评估,根据图片质量动态调节人脸识别通过的阈值,尽量降低外界环境因素,如光线强度、摄像设备等对人脸识别造成的影响,并对图片进行直方图均衡化、高斯滤波等预处理,评估此时的环境因素;同时使用DNN深度神经网络进行人声增强及噪声评估,可较准确地反映当前的语音质量。结合两者质量的评估,动态调整声音识别和面部识别的权重,从而调节多模态身份认证方式,提高认证精度。
附图说明
下面将结合附图及实施例对本发明作进一步说明,附图中:
图1是本发明实施例中一种可自适应调节阈值的生物识别认证的流程图;
图2是本发明实施例中质量较差面部图像的质量评估结果的示意图;
图3是本发明实施例中语音采集界面的示意图;
图4是本发明实施例中语音质量的评价效果的示意图;
图5是本发明实施例中原始语音信号波形示意图;
图6是本发明实施例中语音增强后的信号波形示意图;
图7是本发明实施例中认证准确度的对比示意图;
图8是本发明实施例中硬件设备工作的示意图。
具体实施方式
为了对本发明的技术特征、目的和效果有更加清楚的理解,现对照附图详细说明本发明的具体实施方式。
本发明的实施例提供了一种可自适应调节阈值的生物识别认证方法、设备及存储设备。
请参考图1,图1是本发明实施例中一种可自适应调节阈值的生物识别认证方法的流程图,具体包括如下步骤:
S101:在注册阶段,利用相机和麦克风对注册用户的人脸和声音信息进行采集,得到第一面部图片和第一声纹样本,并将第一面部图片和第一声纹样本存储于本地数据库中,作为认证基准信息;
S102:在认证阶段,利用相机和麦克风对待认证的用户进行人脸和声音信息采集,得到第二面部图片和第二声纹样本;并根据认证基准信息,计算得到面部图片相似度face_sim和声纹相似度voice_sim;
S103:对采集的第二面部图片进行图像增强,得到增强的面部图片;并利用无参考型图像质量客观评价算法对增强的面部图片的质量进行评估量化,得到图片质量分数SCf
S104:利用DNN深度神经网络算法对第二声纹样本中的语音信息分别进行增强处理,得到增强的声纹样本数据具体步骤,(见参考文献:Xu Y,Du J,Huang Z,et al.Multi-objective learning and mask-based post-processing for deep neural networkbased speech enhancement[C]//INTERSPEECH.2015);并根据增强的声纹样本数据,计算得到声纹质量分数SCs
S105:对图片质量分数SCf和声纹质量分数SCs分别进行归一化处理,得到归一化后的图片质量分数nf和归一化后的声纹质量分数ns
S106:根据归一化后的图片质量分数nf和归一化后的声纹质量分数ns,计算得到实际面部识别阈值Tf和实际声纹识别阈值Ts
S107:将面部图片相似度face_sim和声纹相似度voice_sim与实际面部识别阈值Tf和实际声纹识别阈值Ts进行比对;若条件face_sim≥Tf和voice_sim≥Ts同时成立,则认证成功,允许登陆,并转到步骤S108;否则,认证失败,转到步骤S108;
S108:认证程序结束。
步骤S102中,根据认证基准信息,采用OpenCV库中的facedetect功能,对第一面部图片和第二面部图片的相似度进行计算,得到面部图片相似度face_sim;采用梅尔倒谱系数MFCC作为语音特征相似度的评价参数,对第二声纹样本的声纹相似度进行计算(具体方法,见参考文献:赵桂兰,孙东.基于MATLAB的MFCC在语音相似度评价中的应用),得到声纹相似度voice_sim;所述第二声纹样本包括三段时间长度相等,内容不同的用户语音信息。
采用OpenCV库中的facedetect功能,对第一面部图片和第二面部图片的相似度进行计算的方法具体为:首先利用OpenCV库中的facedetect功能将第一面部图片和第二面部图片中的人脸检测出来;然后将检测到的人脸分别剪切出来,得到两张分别只包含第一面部图片中人脸的图片和只包含第二面部图片中人脸的图片;再将分别将只包含人脸的图片转换成单通道的图像;最后使用直方图比较这两张单通道的人脸图像,得到面部图片相似度face_sim。
步骤S103中,图像增强的具体过程如下:
S201:调用OpenCV库中的equalizeHist()方法对增强的面部图片进行直方图均衡化处理,得到均衡化后的面部图片;
S202:调用OpenCV库中的GaussianBlur()方法对均衡化后的面部图片进行高斯滤波,得到滤波后的面部图片;
S203:调用OpenCV库中的Laplacian()方法对滤波后的面部图片进行3×3的Laplacian算子卷积滤波,得到增强的面部图片。
步骤S103中,SCf的计算公式如公式(1)所示:
上式中,为图片中人脸部分的平均灰度,为增强后整个图片的灰度平均值;为图片对比度; 为图片适宜度; p、Gmax和Gmin分别为:相邻像素间的灰度差为i的像素分布概率、图像灰度最大值和图像灰度最小值。
步骤S104中,增强的声纹样本数据包括:分段信噪比SegSNR和对数谱畸变程度LSD;根据增强的声纹样本数据,采用公式(2)对声纹样本进行质量评估,得到声纹质量分数SCs
SCs=ks×SegSNR+kl×e-LSD (2)
上式中,ks和kl分别表示SegSNR和LSD对质量分数的影响程度,ks和kl均大于0,为预设值;声纹质量分数SCs包括三段增强的语音信息分别进行质量评估后得到的声纹质量分数:SCs1、SCs2和SCs3
步骤S105中,利用公式(3)对图片质量分数SCf进行归一化处理,得到归一化后的图片质量分数nf
nf=1-(1-SCf)m (3)
上式中,m表示归一化处理程度,m大于0,为预设值;
利用公式(4)对声纹质量分数SCs进行归一化处理,得到归一化后的声纹质量分数ns
上式中,SCsmax=max(SCs1,SCs2,SCs3)。
步骤S106中,利用公式(5)和公式(6)分别计算实际面部识别阈值Tf和实际声纹识别阈值Ts
当nf≥ns时:
当nf<ns时:
公式(5)和公式(6)中,Tf0和Ts0分别为面部识别基准阈值和声纹识别基准阈值;As1和Af1分别为面部识别和声纹识别阈值的下降极限值;As2和Af2分别为面部识别和声纹识别阈值的上升极限值;Bs1和Bf1分别为面部识别和声纹识别阈值的下降速度;Bs2和Bf2分别为面部识别和声纹识别阈值的上升速度;Tf0、Ts0、As1、Af1、As2、Af2、Bs1、Bf1、Bs2和Bf2均为先验值。
为进一步对本发明所提出的技术方案进行说明,本发明实施例进行了如下测试:
首先使用一张光线条件较差的情况下采集的人脸图片进行测试,如图2所示,为图片测试的结果,可以看到,当光线条件较差时,图片评分显著降低。
然后采集三组测试者的语料信息,采集过程中需要保证相对良好的测试环境,采集界面如图3。采集完毕后,使用DNN深度神经网络进行人声增强及噪声评估,并记录采集语音的SNR、LSD等指标作为声音质量归一化的参考信息。语音质量的评价效果如图4所示,六个数据分别表示三组语音样本的SNR和LSD指标。
原始语音信号波形图和语音增强后的信号波形图分别如图5和图6所示。通过对比可以直观地看出,语音增强后语音信号的质量得到了明显的增强,噪声部分的波形被滤除,增强效果十分明显。
最后进行自适应调节:自适应调节生物认证方式时,首先进行声纹特征的采集,之后***会对其进行降噪处理并得到语音质量的评价信息。语音信息采集完成后,***会调用摄像头拍摄测试者的面部信息,并对面部图像进行质量评价。信息采集完毕后,经过归一化、阈值调整等步骤,综合判断得到的认证结果。
自适应调节生物识别性能测试将从不同环境下人脸识别和声纹识别的准确度展开,并测试自适应调节后的识别准确度。从而判定本模块在极端环境下的效果。
表1展示了不同图像质量条件下,人脸识别准确度(TP)的数值变化趋势,其中人脸识别的通过阈值设定为0.7。
表1不同图像质量(Q)下人脸识别平均准确度(TP)
评估质量(Q) 准确度(TP)
0.5-0.6 55.6%
0.6-0.7 69.2%
0.7-0.8 80.7%
0.8-0.9 88.5%
0.9-1.0 92.4%
表2展示了不同语音信噪比(SNR)下,声纹识别准确度(TP)的数值变化趋势,其中声纹识别设定的通过阈值为1.0。
表2不同信噪比(SNR)下声纹识别平均准确度(TP)
信噪比(SNR) 准确度(TP)
0.9-1.0 8.1%
1.0-2.0 33.7%
2.0-3.0 61.2%
3.0-4.0 78.3%
4.0以上 88.5%
图7展示了本发明所提出的技术方案与单模态条件下的认证准确度的对比,其中,假定单模态各种环境因素出现概率相等。通过分析,该调节模型较好地弥补了单模态生物识别受环境因素制约的缺陷。
以上就是本发明实施例对本发明所提出的技术方案进行测试的结果,经测试,本发明所提出的的技术方案可以实现预期的功能,达到了预期的效果。
请参见图8,图8是本发明实施例的硬件设备工作示意图,所述硬件设备具体包括:一种可自适应调节阈值的生物识别认证设备801、处理器802及存储设备803。
一种可自适应调节阈值的生物识别认证设备801:所述一种可自适应调节阈值的生物识别认证设备801实现所述一种可自适应调节阈值的生物识别认证方法。
处理器802:所述处理器802加载并执行所述存储设备803中的指令及数据用于实现所述一种可自适应调节阈值的生物识别认证方法。
存储设备803:所述存储设备803存储指令及数据;所述存储设备803用于实现所述一种可自适应调节阈值的生物识别认证方法。
本发明的有益效果是:本发明提出的技术方案,通过光线强度、灰度对比度和适宜度等指标对用户提交的人脸图像进行质量评估,根据图片质量动态调节人脸识别通过的阈值,尽量降低外界环境因素,如光线强度、摄像设备等对人脸识别造成的影响,并对图片进行直方图均衡化、高斯滤波等预处理,评估此时的环境因素;同时使用DNN深度神经网络进行人声增强及噪声评估,可较准确地反映当前的语音质量。结合两者质量的评估,动态调整声音识别和面部识别的权重,从而调节多模态身份认证方式,提高认证精度。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种可自适应调节阈值的生物识别认证方法,其特征在于:包括以下步骤:
S101:在注册阶段,利用相机和麦克风对注册用户的人脸和声音信息进行采集,得到第一面部图片和第一声纹样本,并将第一面部图片和第一声纹样本存储于本地数据库中,作为认证基准信息;
S102:在认证阶段,利用相机和麦克风对待认证的用户进行人脸和声音信息采集,得到第二面部图片和第二声纹样本;并根据认证基准信息,计算得到面部图片相似度face_sim和声纹相似度voice_sim;
S103:对采集的第二面部图片进行图像增强,得到增强的面部图片;并利用无参考型图像质量客观评价算法对增强的面部图片的质量进行评估量化,得到图片质量分数SCf
S104:利用DNN深度神经网络算法对第二声纹样本中的语音信息分别进行增强处理,得到增强的声纹样本数据;并根据增强的声纹样本数据,计算得到声纹质量分数SCs
S105:对图片质量分数SCf和声纹质量分数SCs分别进行归一化处理,得到归一化后的图片质量分数nf和归一化后的声纹质量分数ns
S106:根据归一化后的图片质量分数nf和归一化后的声纹质量分数ns,计算得到实际面部识别阈值Tf和实际声纹识别阈值Ts
S107:将面部图片相似度face_sim和声纹相似度voice_sim与实际面部识别阈值Tf和实际声纹识别阈值Ts进行比对;若条件face_sim≥Tf和voice_sim≥Ts同时成立,则认证成功,允许登陆,并转到步骤S108;否则,认证失败,转到步骤S108;
S108:认证程序结束。
2.如权利要求1所述的一种可自适应调节阈值的生物识别认证方法,其特征在于:步骤S102中,根据认证基准信息,采用OpenCV库中的facedetect功能,对第一面部图片和第二面部图片的相似度进行计算,得到面部图片相似度face_sim;采用梅尔倒谱系数MFCC作为语音特征相似度的评价参数,对第二声纹样本的声纹相似度进行计算,得到声纹相似度voice_sim;所述第二声纹样本包括三段时间长度相等,内容不同的用户语音信息。
3.如权利要求2所述的一种可自适应调节阈值的生物识别认证方法,其特征在于:采用OpenCV库中的facedetect功能,对第一面部图片和第二面部图片的相似度进行计算的方法具体为:首先利用OpenCV库中的facedetect功能将第一面部图片和第二面部图片中的人脸检测出来;然后将检测到的人脸分别剪切出来,得到两张分别只包含第一面部图片中人脸的图片和只包含第二面部图片中人脸的图片;再将分别将只包含人脸的图片转换成单通道的图像;最后使用直方图比较这两张单通道的人脸图像,得到面部图片相似度face_sim。
4.如权利要求1所述的一种可自适应调节阈值的生物识别认证方法,其特征在于:步骤S103中,图像增强的具体过程如下:
S201:调用OpenCV库中的equalizeHist()方法对增强的面部图片进行直方图均衡化处理,得到均衡化后的面部图片;
S202:调用OpenCV库中的GaussianBlur()方法对均衡化后的面部图片进行高斯滤波,得到滤波后的面部图片;
S203:调用OpenCV库中的Laplacian()方法对滤波后的面部图片进行3×3的Laplacian算子卷积滤波,得到增强的面部图片。
5.如权利要求1所述的一种可自适应调节阈值的生物识别认证方法,其特征在于:步骤S103中,SCf的计算公式如公式(1)所示:
上式中,为图片中人脸部分的平均灰度,为增强后整个图片的灰度平均值;为图片对比度; 为图片适宜度; p、Gmax和Gmin分别为:相邻像素间的灰度差为i的像素分布概率、图像灰度最大值和图像灰度最小值。
6.如权利要求1所述的一种可自适应调节阈值的生物识别认证方法,其特征在于:步骤S104中,增强的声纹样本数据包括:分段信噪比SegSNR和对数谱畸变程度LSD;根据增强的声纹样本数据,采用公式(2)对声纹样本进行质量评估,得到声纹质量分数SCs
SCs=ks×SegSNR+kl×e-LSD (2)
上式中,ks和kl分别表示SegSNR和LSD对质量分数的影响程度,ks和kl均大于0,为预设值;声纹质量分数SCs包括三段增强的语音信息分别进行质量评估后得到的声纹质量分数:SCs1、SCs2和SCs3
7.如权利要求1所述的一种可自适应调节阈值的生物识别认证方法,其特征在于:步骤S105中,利用公式(3)对图片质量分数SCf进行归一化处理,得到归一化后的图片质量分数nf
nf=1-(1-SCf)m (3)
上式中,m表示归一化处理程度,m大于0,为预设值;
利用公式(4)对声纹质量分数SCs进行归一化处理,得到归一化后的声纹质量分数ns
上式中,SCsmax=max(SCs1,SCs2,SCs3)。
8.如权利要求1所述的一种可自适应调节阈值的生物识别认证方法,其特征在于:步骤S106中,利用公式(5)和公式(6)分别计算实际面部识别阈值Tf和实际声纹识别阈值Ts
当nf≥ns时:
当nf<ns时:
公式(5)和公式(6)中,Tf0和Ts0分别为面部识别基准阈值和声纹识别基准阈值;As1和Af1分别为面部识别和声纹识别阈值的下降极限值;As2和Af2分别为面部识别和声纹识别阈值的上升极限值;Bs1和Bf1分别为面部识别和声纹识别阈值的下降速度;Bs2和Bf2分别为面部识别和声纹识别阈值的上升速度;Tf0、Ts0、As1、Af1、As2、Af2、Bs1、Bf1、Bs2和Bf2均为先验值。
9.一种存储设备,其特征在于:所述存储设备存储指令及数据用于实现权利要求1~8所述的任意一种可自适应调节阈值的生物识别认证方法。
10.一种可自适应调节阈值的生物识别认证设备,其特征在于:包括:处理器及存储设备;所述处理器加载并执行存储设备中的指令及数据用于实现权利要求1~8所述的任意一种可自适应调节阈值的生物识别认证方法。
CN201811378272.XA 2018-11-19 2018-11-19 可自适应调节阈值的生物识别认证方法、设备及存储设备 Active CN109614881B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811378272.XA CN109614881B (zh) 2018-11-19 2018-11-19 可自适应调节阈值的生物识别认证方法、设备及存储设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811378272.XA CN109614881B (zh) 2018-11-19 2018-11-19 可自适应调节阈值的生物识别认证方法、设备及存储设备

Publications (2)

Publication Number Publication Date
CN109614881A true CN109614881A (zh) 2019-04-12
CN109614881B CN109614881B (zh) 2021-04-27

Family

ID=66003520

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811378272.XA Active CN109614881B (zh) 2018-11-19 2018-11-19 可自适应调节阈值的生物识别认证方法、设备及存储设备

Country Status (1)

Country Link
CN (1) CN109614881B (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110245561A (zh) * 2019-05-09 2019-09-17 深圳市锐明技术股份有限公司 一种人脸识别方法及装置
CN111898495A (zh) * 2020-07-16 2020-11-06 云从科技集团股份有限公司 一种动态阈值管理方法、***、设备及介质
CN112581981A (zh) * 2020-11-04 2021-03-30 北京百度网讯科技有限公司 人机交互方法、装置、计算机设备和存储介质
CN113593579A (zh) * 2021-07-23 2021-11-02 马上消费金融股份有限公司 一种声纹识别方法、装置和电子设备
CN113688708A (zh) * 2021-08-12 2021-11-23 北京数美时代科技有限公司 一种基于概率特征的人脸识别方法、***及存储介质
CN114093370A (zh) * 2022-01-19 2022-02-25 珠海市杰理科技股份有限公司 声纹识别方法、装置、计算机设备和存储介质
WO2022063219A1 (zh) * 2020-09-25 2022-03-31 北京眼神智能科技有限公司 生物特征多模态融合识别方法、装置、存储介质及设备

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150178579A1 (en) * 2013-12-23 2015-06-25 Samsung Electronics Co., Ltd. Image processing apparatus and control method thereof
CN104834849A (zh) * 2015-04-14 2015-08-12 时代亿宝(北京)科技有限公司 基于声纹识别和人脸识别的双因素身份认证方法及***
CN105426723A (zh) * 2015-11-20 2016-03-23 北京得意音通技术有限责任公司 基于声纹识别、人脸识别以及同步活体检测的身份认证方法及***
CN107545251A (zh) * 2017-08-31 2018-01-05 北京图铭视界科技有限公司 人脸质量判别及图片增强的方法及装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150178579A1 (en) * 2013-12-23 2015-06-25 Samsung Electronics Co., Ltd. Image processing apparatus and control method thereof
CN104834849A (zh) * 2015-04-14 2015-08-12 时代亿宝(北京)科技有限公司 基于声纹识别和人脸识别的双因素身份认证方法及***
CN105426723A (zh) * 2015-11-20 2016-03-23 北京得意音通技术有限责任公司 基于声纹识别、人脸识别以及同步活体检测的身份认证方法及***
CN107545251A (zh) * 2017-08-31 2018-01-05 北京图铭视界科技有限公司 人脸质量判别及图片增强的方法及装置

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
HAGAI ARONOWITZ 等: "Multi-modal biometrics for mobile authentication", 《IEEE BIOMETRICS COMPENDIUMIEEE RFIC VIRTUAL JOURNALIEEE RFID VIRTUAL JOURNAL》 *
张星伟: "基于语音唇动一致性的多模态说话人身份认证***", 《中国优秀硕士学位论文全文数据库信息科技辑》 *
张闻彬 等: "基于信号质量动态加权的多模生物特征识别研究", 《网络与信息安全学报》 *

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110245561A (zh) * 2019-05-09 2019-09-17 深圳市锐明技术股份有限公司 一种人脸识别方法及装置
CN111898495A (zh) * 2020-07-16 2020-11-06 云从科技集团股份有限公司 一种动态阈值管理方法、***、设备及介质
CN111898495B (zh) * 2020-07-16 2021-04-16 云从科技集团股份有限公司 一种动态阈值管理方法、***、设备及介质
WO2022063219A1 (zh) * 2020-09-25 2022-03-31 北京眼神智能科技有限公司 生物特征多模态融合识别方法、装置、存储介质及设备
CN112581981A (zh) * 2020-11-04 2021-03-30 北京百度网讯科技有限公司 人机交互方法、装置、计算机设备和存储介质
CN112581981B (zh) * 2020-11-04 2023-11-03 北京百度网讯科技有限公司 人机交互方法、装置、计算机设备和存储介质
CN113593579A (zh) * 2021-07-23 2021-11-02 马上消费金融股份有限公司 一种声纹识别方法、装置和电子设备
CN113593579B (zh) * 2021-07-23 2024-04-30 马上消费金融股份有限公司 一种声纹识别方法、装置和电子设备
CN113688708A (zh) * 2021-08-12 2021-11-23 北京数美时代科技有限公司 一种基于概率特征的人脸识别方法、***及存储介质
CN114093370A (zh) * 2022-01-19 2022-02-25 珠海市杰理科技股份有限公司 声纹识别方法、装置、计算机设备和存储介质
CN114093370B (zh) * 2022-01-19 2022-04-29 珠海市杰理科技股份有限公司 声纹识别方法、装置、计算机设备和存储介质

Also Published As

Publication number Publication date
CN109614881B (zh) 2021-04-27

Similar Documents

Publication Publication Date Title
CN109614881A (zh) 可自适应调节阈值的生物识别认证方法、设备及存储设备
Hansen et al. Speaker recognition by machines and humans: A tutorial review
US9691392B1 (en) System and method for improved audio consistency
Kishore et al. Emotion recognition in speech using MFCC and wavelet features
Reynolds An overview of automatic speaker recognition technology
CN108305615A (zh) 一种对象识别方法及其设备、存储介质、终端
CN109378002B (zh) 声纹验证的方法、装置、计算机设备和存储介质
CN107657964A (zh) 基于声学特征和稀疏数学的抑郁症辅助检测方法及分类器
AU2013223662B2 (en) Modified mel filter bank structure using spectral characteristics for sound analysis
CN108986824A (zh) 一种回放语音检测方法
CN110120230B (zh) 一种声学事件检测方法及装置
Paul et al. Countermeasure to handle replay attacks in practical speaker verification systems
CN113823293B (zh) 一种基于语音增强的说话人识别方法及***
Sun et al. Dynamic time warping for speech recognition with training part to reduce the computation
CN110570870A (zh) 一种文本无关的声纹识别方法、装置及设备
CN111489763B (zh) 一种基于gmm模型的复杂环境下说话人识别自适应方法
CN111081223A (zh) 一种语音识别方法、装置、设备和存储介质
CN105845143A (zh) 基于支持向量机的说话人确认方法及其***
CN112466276A (zh) 一种语音合成***训练方法、装置以及可读存储介质
Karthikeyan Adaptive boosted random forest-support vector machine based classification scheme for speaker identification
Neelima et al. Mimicry voice detection using convolutional neural networks
CN110415707B (zh) 一种基于语音特征融合和gmm的说话人识别方法
CN111370000A (zh) 声纹识别算法评估方法、***、移动终端及存储介质
Kaminski et al. Automatic speaker recognition using a unique personal feature vector and Gaussian Mixture Models
Xu et al. Voiceprint recognition of Parkinson patients based on deep learning

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant