CN112466310A - 深度学习声纹识别方法、装置、电子设备及存储介质 - Google Patents
深度学习声纹识别方法、装置、电子设备及存储介质 Download PDFInfo
- Publication number
- CN112466310A CN112466310A CN202011105315.4A CN202011105315A CN112466310A CN 112466310 A CN112466310 A CN 112466310A CN 202011105315 A CN202011105315 A CN 202011105315A CN 112466310 A CN112466310 A CN 112466310A
- Authority
- CN
- China
- Prior art keywords
- voiceprint
- audio data
- voiceprint recognition
- information
- user
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 26
- 238000013135 deep learning Methods 0.000 title claims abstract description 24
- 238000012795 verification Methods 0.000 claims abstract description 31
- 238000000605 extraction Methods 0.000 claims abstract description 18
- 238000012549 training Methods 0.000 claims description 18
- 238000004590 computer program Methods 0.000 claims description 13
- 238000013528 artificial neural network Methods 0.000 claims description 6
- 238000011176 pooling Methods 0.000 claims description 6
- 230000004927 fusion Effects 0.000 claims description 3
- 238000010586 diagram Methods 0.000 description 8
- 230000006870 function Effects 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/30—Authentication, i.e. establishing the identity or authorisation of security principals
- G06F21/31—User authentication
- G06F21/32—User authentication using biometric data, e.g. fingerprints, iris scans or voiceprints
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/04—Training, enrolment or model building
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/06—Decision making techniques; Pattern matching strategies
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/18—Artificial neural networks; Connectionist approaches
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Theoretical Computer Science (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Evolutionary Computation (AREA)
- Computer Security & Cryptography (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Software Systems (AREA)
- Artificial Intelligence (AREA)
- Game Theory and Decision Science (AREA)
- Computational Linguistics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Computer Hardware Design (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Business, Economics & Management (AREA)
- Data Mining & Analysis (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Collating Specific Patterns (AREA)
Abstract
本发明公开了深度学习声纹识别方法、装置、电子设备及存储介质,该方法包括:获取包含用户个人信息的音频数据,输入特征提取模型,输出用户个人信息+声纹音频数据;将所述声纹音频数据输入已训练的声纹识别模型,输出声纹识别信息;根据预先存储的验证音频信息对所述声纹识别信息和用户个人信息进行识别,以识别用户身份;响应于所述用户身份识别成功,输出音频数据的声纹识别指令。本发明解决了传统声纹识别算法或者单纯数字密码验证的局限性,实现了较理想的密码验证准确率。
Description
技术领域
本发明涉及一种深度学习声纹识别方法、装置、电子设备及存储介质,属于音频识别技术领域。
背景技术
现有的智能终端的密码验证方式仅仅依靠原有的数字密码验证不能满足多重验证的需要,因此声纹数据关联数字密码的验证方式被引入智能终端的登录验证场景中。
基于传统声纹识别算法或者单纯数字密码验证的局限性,要取得较理想的密码验证准确率,必须对有效长语音进行识别,而在声纹识别的实际应用中,用户讲话习惯决定用户的录音往往达不到有效长语音的要求,因而实际场景下的声纹识别准确率相对较低,在某些特定场景下甚至无法达到可应用的最低要求。
发明内容
本发明的目的在于,克服现有技术存在的技术缺陷,解决上述技术问题,提出一种深度学习声纹识别方法、装置、电子设备及存储介质。
本发明具体采用如下技术方案:深度学习声纹识别方法,所述方法包括:
获取包含用户个人信息的音频数据,输入特征提取模型,输出用户个人信息+声纹音频数据;
将所述声纹音频数据输入已训练的声纹识别模型,输出声纹识别信息;
根据预先存储的验证音频信息对所述声纹识别信息和用户个人信息进行识别,以识别用户身份;响应于所述用户身份识别成功,输出音频数据的声纹识别指令。
作为一种较佳的实施例,所述特征提取模型用于将包含用户个人信息的音频数据区分为相关联的用户个人信息+声纹音频数据。
作为一种较佳的实施例,所述声纹识别模型通过如下方式训练:获取历史用户的历史验证音频数据;将预处理后的历史验证音频数据输入至声纹识别模型,并基于识别分类误差信息对所述声纹识别模型进行训练。
作为一种较佳的实施例,基于识别分类误差信息对所述声纹识别模型进行训练包括:基于所述识别分类误差信息与预定误差阈值对所述神经网络的参数进行调整,以为输入所述池化层的不同语音帧设置不同的权重;响应于所述识别分类误差信息小于等于预定误差阈值,所述声纹识别模型训练完成。
本发明还提出深度学习声纹识别装置,包括:
特征提取模块,用于执行:获取包含用户个人信息的音频数据,输入特征提取模型,输出用户个人信息+声纹音频数据;
声纹识别模块,用于执行:将所述声纹音频数据输入已训练的声纹识别模型,输出声纹识别信息;
身份指令融合模块,用于执行:根据预先存储的验证音频信息对所述声纹识别信息和用户个人信息进行识别,以识别用户身份;响应于所述用户身份识别成功,输出音频数据的声纹识别指令。
作为一种较佳的实施例,所述特征提取模型用于将包含用户个人信息的音频数据区分为相关联的用户个人信息+声纹音频数据。
作为一种较佳的实施例,所述声纹识别模型通过如下方式训练:获取历史用户的历史验证音频数据;将预处理后的历史验证音频数据输入至声纹识别模型,并基于识别分类误差信息对所述声纹识别模型进行训练。
作为一种较佳的实施例,所述基于识别分类误差信息对所述声纹识别模型进行训练包括:基于所述识别分类误差信息与预定误差阈值对所述神经网络的参数进行调整,以为输入所述池化层的不同语音帧设置不同的权重;响应于所述识别分类误差信息小于等于预定误差阈值,所述声纹识别模型训练完成。
本发明还提出一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现所述深度学习声纹识别方法的步骤。
本发明还提出一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现所述深度学习声纹识别方法的步骤。
本发明所达到的有益效果:本发明针对如何解决现有的智能终端的密码验证方式仅仅依靠原有的数字密码验证不能满足多重验证的需要,因此声纹数据关联数字密码的验证方式被引入智能终端的登录验证场景中;基于传统声纹识别算法或者单纯数字密码验证的局限性,要取得较理想的密码验证准确率,必须对有效长语音进行识别,而在声纹识别的实际应用中,用户讲话习惯决定用户的录音往往达不到有效长语音的要求,因而实际场景下的密码验证的准确率相对较低,在某些特定场景下甚至无法达到可应用的最低要求的技术需求,通过设计深度学习声纹识别方法,获取包含用户个人信息的音频数据,输入特征提取模型,输出用户个人信息+声纹音频数据;将所述声纹音频数据输入已训练的声纹识别模型,输出声纹识别信息;根据预先存储的验证音频信息对所述声纹识别信息和用户个人信息进行识别,以识别用户身份;响应于所述用户身份识别成功,输出音频数据的声纹识别指令,解决了传统声纹识别算法或者单纯数字密码验证的局限性,实现了较理想的密码验证准确率。
附图说明
图1是本发明的深度学习声纹识别装置的拓扑原理示意图。
具体实施方式
下面结合附图对本发明作进一步描述。以下实施例仅用于更加清楚地说明本发明的技术方案,而不能以此来限制本发明的保护范围。
实施例1:深度学习声纹识别方法,所述方法包括:获取包含用户个人信息的音频数据,输入特征提取模型,输出用户个人信息+声纹音频数据;
将所述声纹音频数据输入已训练的声纹识别模型,输出声纹识别信息;
根据预先存储的验证音频信息对所述声纹识别信息和用户个人信息进行识别,以识别用户身份;响应于所述用户身份识别成功,输出音频数据的声纹识别指令。
可选的,所述特征提取模型用于将包含用户个人信息的音频数据区分为相关联的用户个人信息+声纹音频数据。
可选的,所述声纹识别模型通过如下方式训练:获取历史用户的历史验证音频数据;将预处理后的历史验证音频数据输入至声纹识别模型,并基于识别分类误差信息对所述声纹识别模型进行训练。
可选的,基于识别分类误差信息对所述声纹识别模型进行训练包括:基于所述识别分类误差信息与预定误差阈值对所述神经网络的参数进行调整,以为输入所述池化层的不同语音帧设置不同的权重;响应于所述识别分类误差信息小于等于预定误差阈值,所述声纹识别模型训练完成。
实施例2:如图1所示,本发明还提出深度学习声纹识别装置,包括:
特征提取模块,用于执行:获取包含用户个人信息的音频数据,输入特征提取模型,输出用户个人信息+声纹音频数据;
声纹识别模块,用于执行:将所述声纹音频数据输入已训练的声纹识别模型,输出声纹识别信息;
身份指令融合模块,用于执行:根据预先存储的验证音频信息对所述声纹识别信息和用户个人信息进行识别,以识别用户身份;响应于所述用户身份识别成功,输出音频数据的声纹识别指令。
可选的,所述特征提取模型用于将包含用户个人信息的音频数据区分为相关联的用户个人信息+声纹音频数据。
可选的,所述声纹识别模型通过如下方式训练:获取历史用户的历史验证音频数据;将预处理后的历史验证音频数据输入至声纹识别模型,并基于识别分类误差信息对所述声纹识别模型进行训练。
可选的,所述基于识别分类误差信息对所述声纹识别模型进行训练包括:基于所述识别分类误差信息与预定误差阈值对所述神经网络的参数进行调整,以为输入所述池化层的不同语音帧设置不同的权重;响应于所述识别分类误差信息小于等于预定误差阈值,所述声纹识别模型训练完成。
实施例3:本发明还提出一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现所述深度学习声纹识别方法的步骤。
实施例4:本发明还提出一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现所述深度学习声纹识别方法的步骤。
本发明针对如何解决现有的智能终端的密码验证方式仅仅依靠原有的数字密码验证不能满足多重验证的需要,因此声纹数据关联数字密码的验证方式被引入智能终端的登录验证场景中;基于传统声纹识别算法或者单纯数字密码验证的局限性,要取得较理想的密码验证准确率,必须对有效长语音进行识别,而在声纹识别的实际应用中,用户讲话习惯决定用户的录音往往达不到有效长语音的要求,因而实际场景下的密码验证的准确率相对较低,在某些特定场景下甚至无法达到可应用的最低要求的技术需求,通过设计深度学习声纹识别方法,获取包含用户个人信息的音频数据,输入特征提取模型,输出用户个人信息+声纹音频数据;将所述声纹音频数据输入已训练的声纹识别模型,输出声纹识别信息;根据预先存储的验证音频信息对所述声纹识别信息和用户个人信息进行识别,以识别用户身份;响应于所述用户身份识别成功,输出音频数据的声纹识别指令,解决了传统声纹识别算法或者单纯数字密码验证的局限性,实现了较理想的密码验证准确率。
本领域内的技术人员应明白,本申请的实施例可提供为方法、***、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(***)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
最后应当说明的是:以上实施例仅用以说明本发明的技术方案而非对其限制,尽管参照上述实施例对本发明进行了详细的说明,所属领域的普通技术人员应当理解:依然可以对本发明的具体实施方式进行修改或者等同替换,而未脱离本发明精神和范围的任何修改或者等同替换,其均应涵盖在本发明的权利要求保护范围之内。
Claims (10)
1.深度学习声纹识别方法,其特征在于,所述方法包括:
获取包含用户个人信息的音频数据,输入特征提取模型,输出用户个人信息+声纹音频数据;
将所述声纹音频数据输入已训练的声纹识别模型,输出声纹识别信息;
根据预先存储的验证音频信息对所述声纹识别信息和用户个人信息进行识别,以识别用户身份;响应于所述用户身份识别成功,输出音频数据的声纹识别指令。
2.根据权利要求1所述的深度学习声纹识别方法,其特征在于,所述特征提取模型用于将包含用户个人信息的音频数据区分为相关联的用户个人信息+声纹音频数据。
3.根据权利要求1所述的深度学习声纹识别方法,其特征在于,所述声纹识别模型通过如下方式训练:获取历史用户的历史验证音频数据;将预处理后的历史验证音频数据输入至声纹识别模型,并基于识别分类误差信息对所述声纹识别模型进行训练。
4.根据权利要求3所述的深度学习声纹识别方法,其特征在于,基于识别分类误差信息对所述声纹识别模型进行训练包括:基于所述识别分类误差信息与预定误差阈值对所述神经网络的参数进行调整,以为输入所述池化层的不同语音帧设置不同的权重;响应于所述识别分类误差信息小于等于预定误差阈值,所述声纹识别模型训练完成。
5.深度学习声纹识别装置,其特征在于,包括:
特征提取模块,用于执行:获取包含用户个人信息的音频数据,输入特征提取模型,输出用户个人信息+声纹音频数据;
声纹识别模块,用于执行:将所述声纹音频数据输入已训练的声纹识别模型,输出声纹识别信息;
身份指令融合模块,用于执行:根据预先存储的验证音频信息对所述声纹识别信息和用户个人信息进行识别,以识别用户身份;响应于所述用户身份识别成功,输出音频数据的声纹识别指令。
6.根据权利要求5所述的深度学习声纹识别装置,其特征在于,所述特征提取模型用于将包含用户个人信息的音频数据区分为相关联的用户个人信息+声纹音频数据。
7.根据权利要求5所述的深度学习声纹识别装置,其特征在于,所述声纹识别模型通过如下方式训练:获取历史用户的历史验证音频数据;将预处理后的历史验证音频数据输入至声纹识别模型,并基于识别分类误差信息对所述声纹识别模型进行训练。
8.根据权利要求7所述的深度学习声纹识别装置,其特征在于,所述基于识别分类误差信息对所述声纹识别模型进行训练包括:基于所述识别分类误差信息与预定误差阈值对所述神经网络的参数进行调整,以为输入所述池化层的不同语音帧设置不同的权重;响应于所述识别分类误差信息小于等于预定误差阈值,所述声纹识别模型训练完成。
9.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现权利要求1至4中任一项所述方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1至4中任一项所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011105315.4A CN112466310A (zh) | 2020-10-15 | 2020-10-15 | 深度学习声纹识别方法、装置、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011105315.4A CN112466310A (zh) | 2020-10-15 | 2020-10-15 | 深度学习声纹识别方法、装置、电子设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112466310A true CN112466310A (zh) | 2021-03-09 |
Family
ID=74833182
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011105315.4A Pending CN112466310A (zh) | 2020-10-15 | 2020-10-15 | 深度学习声纹识别方法、装置、电子设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112466310A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113838469A (zh) * | 2021-09-09 | 2021-12-24 | 竹间智能科技(上海)有限公司 | 一种身份识别方法、***及存储介质 |
CN115086045A (zh) * | 2022-06-17 | 2022-09-20 | 海南大学 | 基于声纹伪造检测的数据安全防护方法及装置 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109036435A (zh) * | 2018-08-15 | 2018-12-18 | 深圳平安综合金融服务有限公司上海分公司 | 基于声纹信息的身份认证及识别方法 |
CN109036436A (zh) * | 2018-09-18 | 2018-12-18 | 广州势必可赢网络科技有限公司 | 一种声纹数据库建立方法、声纹识别方法、装置及*** |
CN110166634A (zh) * | 2019-06-06 | 2019-08-23 | 深圳前海微众银行股份有限公司 | 用户身份辅助识别方法、装置、设备及可读存储介质 |
CN110164455A (zh) * | 2018-02-14 | 2019-08-23 | 阿里巴巴集团控股有限公司 | 用户身份识别的装置、方法和存储介质 |
CN110300086A (zh) * | 2018-03-22 | 2019-10-01 | 北京语智科技有限公司 | 身份识别方法、装置、***及设备 |
CN110970036A (zh) * | 2019-12-24 | 2020-04-07 | 网易(杭州)网络有限公司 | 声纹识别方法及装置、计算机存储介质、电子设备 |
CN111524526A (zh) * | 2020-05-14 | 2020-08-11 | 中国工商银行股份有限公司 | 声纹识别方法及装置 |
-
2020
- 2020-10-15 CN CN202011105315.4A patent/CN112466310A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110164455A (zh) * | 2018-02-14 | 2019-08-23 | 阿里巴巴集团控股有限公司 | 用户身份识别的装置、方法和存储介质 |
CN110300086A (zh) * | 2018-03-22 | 2019-10-01 | 北京语智科技有限公司 | 身份识别方法、装置、***及设备 |
CN109036435A (zh) * | 2018-08-15 | 2018-12-18 | 深圳平安综合金融服务有限公司上海分公司 | 基于声纹信息的身份认证及识别方法 |
CN109036436A (zh) * | 2018-09-18 | 2018-12-18 | 广州势必可赢网络科技有限公司 | 一种声纹数据库建立方法、声纹识别方法、装置及*** |
CN110166634A (zh) * | 2019-06-06 | 2019-08-23 | 深圳前海微众银行股份有限公司 | 用户身份辅助识别方法、装置、设备及可读存储介质 |
CN110970036A (zh) * | 2019-12-24 | 2020-04-07 | 网易(杭州)网络有限公司 | 声纹识别方法及装置、计算机存储介质、电子设备 |
CN111524526A (zh) * | 2020-05-14 | 2020-08-11 | 中国工商银行股份有限公司 | 声纹识别方法及装置 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113838469A (zh) * | 2021-09-09 | 2021-12-24 | 竹间智能科技(上海)有限公司 | 一种身份识别方法、***及存储介质 |
CN115086045A (zh) * | 2022-06-17 | 2022-09-20 | 海南大学 | 基于声纹伪造检测的数据安全防护方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102415503B1 (ko) | 분류기 학습 방법 및 객체 검출 방법 | |
JP6668501B2 (ja) | 音声データ処理方法、装置及び記憶媒体 | |
CN108630193A (zh) | 语音识别方法及装置 | |
CN109754789A (zh) | 语音音素的识别方法及装置 | |
CN112466310A (zh) | 深度学习声纹识别方法、装置、电子设备及存储介质 | |
CN111627423B (zh) | Vad尾点检测方法、装置、服务器和计算机可读介质 | |
CN107871103B (zh) | 一种人脸认证方法和装置 | |
CN111667818A (zh) | 一种训练唤醒模型的方法及装置 | |
EP3989217A1 (en) | Method for detecting an audio adversarial attack with respect to a voice input processed by an automatic speech recognition system, corresponding device, computer program product and computer-readable carrier medium | |
CN112435672A (zh) | 一种声纹识别方法、装置、设备及存储介质 | |
US11133022B2 (en) | Method and device for audio recognition using sample audio and a voting matrix | |
CN112016697A (zh) | 一种联邦学习方法、装置、设备及存储介质 | |
CN111091837A (zh) | 一种基于在线学习的时变声纹认证方法及*** | |
CN113362822A (zh) | 一种具有听觉隐蔽性的黑盒语音对抗样本生成方法 | |
CN106971737A (zh) | 一种基于多人说话的声纹识别方法 | |
CN106531195A (zh) | 一种对话冲突检测方法及装置 | |
CN106205610B (zh) | 一种语音信息识别方法和设备 | |
CN111402899B (zh) | 跨信道声纹识别方法及装置 | |
CN110728984A (zh) | 一种基于语音交互的数据库运维方法及装置 | |
CN106295270A (zh) | 一种用户识别方法及电子设备 | |
CN115547345A (zh) | 声纹识别模型训练及相关识别方法、电子设备和存储介质 | |
CN106971730A (zh) | 一种基于信道补偿的声纹识别方法 | |
CN106971727A (zh) | 一种声纹识别的验证方法 | |
CN113257238B (zh) | 预训练模型的训练方法、编码特征获取方法及相关装置 | |
CN115171710A (zh) | 基于多角度判别的生成对抗网络的语音增强方法及*** |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20210309 |