CN112562695A - 声纹识别方法、装置、计算机设备和存储介质 - Google Patents
声纹识别方法、装置、计算机设备和存储介质 Download PDFInfo
- Publication number
- CN112562695A CN112562695A CN202011348172.XA CN202011348172A CN112562695A CN 112562695 A CN112562695 A CN 112562695A CN 202011348172 A CN202011348172 A CN 202011348172A CN 112562695 A CN112562695 A CN 112562695A
- Authority
- CN
- China
- Prior art keywords
- voiceprint
- environment
- home
- environmental
- away
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 32
- 230000007613 environmental effect Effects 0.000 claims abstract description 108
- 238000012549 training Methods 0.000 claims description 33
- 238000004590 computer program Methods 0.000 claims description 26
- 238000001514 detection method Methods 0.000 claims description 19
- 238000013507 mapping Methods 0.000 claims description 14
- 238000012544 monitoring process Methods 0.000 abstract description 6
- 238000012795 verification Methods 0.000 description 9
- 238000010586 diagram Methods 0.000 description 7
- 238000004880 explosion Methods 0.000 description 6
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 6
- 241000699666 Mus <mouse, genus> Species 0.000 description 4
- 241001465754 Metazoa Species 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- 241000238631 Hexapoda Species 0.000 description 1
- 241000699670 Mus sp. Species 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/26—Recognition of special voice characteristics, e.g. for use in lie detectors; Recognition of animal voices
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L12/00—Data switching networks
- H04L12/28—Data switching networks characterised by path configuration, e.g. LAN [Local Area Networks] or WAN [Wide Area Networks]
- H04L12/2803—Home automation networks
- H04L12/2816—Controlling appliance services of a home automation network by calling their functionalities
- H04L12/282—Controlling appliance services of a home automation network by calling their functionalities based on user interaction within the home
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
Landscapes
- Engineering & Computer Science (AREA)
- Human Computer Interaction (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Automation & Control Theory (AREA)
- Computer Networks & Wireless Communication (AREA)
- User Interface Of Digital Computer (AREA)
Abstract
本发明提供一种声纹识别方法、装置、计算机设备和存储介质,该方法包括检测是否接收到离家模式触发指令;当接收到离家模式触发指令时,进入离家模式,检测是否存在环境声纹;当检测到所述环境声纹时,解析所述环境声纹,得到当前的场景信息。通过触发进入离家模式,使得语音识别***能够在离家模式下,对室内的环境声纹进行监控,实现在无人的情况下对家居的安全监控,有效提高了安全性,并且使得声纹识别更为灵活。
Description
技术领域
本发明涉及声音识别技术领域,特别涉及一种声纹识别方法、装置、计算机设备和存储介质。
背景技术
声纹识别是一种基于语音进行身份认证的技术,属于生物特征识别的一种。在智能家居中,声纹识别已经得到了广泛应用,主要的应用场景是人的身份鉴别或者一些智能家居的权限设置。通过声纹识别,智能***能够识别用户的声音,进而控制屋内家电或者智能设备工作。然而目前这种智能***仅能识别人的声纹,灵活性较低。
发明内容
基于此,有必要针对上述技术问题,提供一种声纹识别方法、装置、计算机设备和存储介质。
一种声纹识别方法,包括:
检测是否接收到离家模式触发指令;
当接收到离家模式触发指令时,进入离家模式,检测是否存在环境声纹;
当检测到所述环境声纹时,解析所述环境声纹,得到当前的场景信息。
在其中一个实施例中,所述当检测到所述环境声纹时,解析所述环境声纹,得到当前场景信息的步骤包括:
当检测到所述环境声纹时,解析所述环境声纹,得到声纹信息;
根据所述声纹信息和预设的声纹场景映射关系,得到当前的所述场景信息。
在其中一个实施例中,所述当接收到离家模式触发指令时,进入离家模式,检测是否存在环境声纹的步骤包括:
当接收到离家模式触发指令时,进入离家模式,检测是否存在环境声纹,并在接收到语音声纹时,将所述语音声纹判定为所述环境声纹。
在其中一个实施例中,在进入离家模式后,所述在接收到语音声纹时,将所述语音声纹判定为所述环境声纹的步骤包括:
在接收到语音声纹时,检测所述语音声纹是否携带居家模式触发指令;
当所述语音声纹未携带居家模式触发指令时,将所述语音声纹判定为所述环境声纹;
当所述语音声纹携带居家模式触发指令时,进入居家模式,检测是否接收到语音声纹,并停止对所述环境声纹的检测。
在其中一个实施例中,所述当检测到所述环境声纹时,解析所述环境声纹,得到当前的场景信息的步骤包括:
当检测到所述环境声纹时,解析所述环境声纹,得到当前的场景信息,记录所述环境声纹和当前的所述场景信息。
在其中一个实施例中,所述检测是否接收到离家模式触发指令的步骤之前还包括:
获取环境训练声纹;
将所述环境训练声纹输入残差网络中进行训练,得到环境声纹识别模型;
所述当检测到所述环境声纹时,解析所述环境声纹,得到当前的场景信息的步骤包括:
当检测到所述环境声纹时,基于所述环境声纹识别模型解析所述环境声纹,得到当前的场景信息。
在其中一个实施例中,所述当接收到离家模式触发指令时,进入离家模式,检测是否存在环境声纹的步骤之后还包括:
检测是否接收到居家模式触发指令;
当接收到居家模式触发指令时,进入居家模式,检测是否接收到语音声纹,并停止对所述环境声纹的检测。
一种声纹识别装置,包括:
离家模式触发检测模块,用于检测是否接收到离家模式触发指令;
环境声纹检测模块,用于当接收到离家模式触发指令时,进入离家模式,检测是否存在环境声纹;
场景信息解析获得模块,用于当检测到所述环境声纹时,解析所述环境声纹,得到当前的场景信息。
一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现以下步骤:
检测是否接收到离家模式触发指令;
当接收到离家模式触发指令时,进入离家模式,检测是否存在环境声纹;
当检测到所述环境声纹时,解析所述环境声纹,得到当前的场景信息。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
检测是否接收到离家模式触发指令;
当接收到离家模式触发指令时,进入离家模式,检测是否存在环境声纹;
当检测到所述环境声纹时,解析所述环境声纹,得到当前的场景信息。
上述声纹识别方法、装置、计算机设备和存储介质,通过触发进入离家模式,使得语音识别***能够在离家模式下,对室内的环境声纹进行监控,实现在无人的情况下对家居的安全监控,有效提高了安全性,并且使得声纹识别更为灵活。
附图说明
图1为一个实施例中声纹识别方法的流程示意图;
图2为一个实施例中声纹识别装置的结构框图;
图3为一个实施例中计算机设备的内部结构图;
图4为一个实施例中的声纹识别方法的执行过程示意图;
图5为一个实施例中的声纹识别模型的构建过程示意图;
图6为一个实施例中的声纹识别模型的训练过程示意图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅用以解释本申请,并不用于限定本申请。
实施例一
本实施例中,如图1所示,提供了一种声纹识别方法,其包括:
步骤110,检测是否接收到离家模式触发指令。
本实施例中,离家模式触发指令用于触发室内或者家中的智能声纹***或语音识别***进入离家模式。该离家模式触发指令可以是由语音方式输入,也可以是通过物理按键输入。
一个实施例中,检测语音声纹,当检测到语音声纹时,解析所述语音声纹,得到语音信息,检测所述语音信息中是否携带离家模式触发指令,当检测到所述语音信息中携带离家模式触发指令时,则进入离家模式;当检测到所述语音信息未携带离家模式触发指令时,则根据所述语音信息执行控制。
一个实施例中,检测是否接收到对预设按键的控制指令,当检测到接收到对预设按键的控制指令时,则判定接收离家模式触发指令。
步骤120,当接收到离家模式触发指令时,进入离家模式,检测是否存在环境声纹。
具体地,离家模式为家里或者房子里的用户离家,家中无人的情况下,智能声纹***或语音识别***进入的工作模式。在该离家模式下,由于家中无人,则智能声纹***不对语音声纹或语音信息做出反馈。
具体地,环境声纹为环境声音的声纹,一个实施例中,除有效语音声纹外的声音对应的声纹均为环境声纹。应该理解的是,本实施例中,有效语音声纹指的是在离家模式下,仍然能够起到语音控制的语音声纹,比如,触发解除离家模式的语音声纹。
一个实施例中,在离家模式下,所有声音的声纹均为环境声纹。一个实施例中,在离家模式下,除语音以外的声音的声纹均为环境声纹。
本实施例中,在接收到离家模式触发指令时,进入离家模式后,则不再对语音声纹作出反馈或者执行语音声纹的指令,而转入对环境声纹的检测。应该理解的是,在进入离家模式前,智能声纹***或语音识别***处于居家模式,在居家模式下,则不对环境声纹进行检测,这样,能有效降低计算资源的消耗。
步骤130,当检测到所述环境声纹时,解析所述环境声纹,得到当前的场景信息。
具体地,在离家模式下,检测到环境声纹时,解析该环境声纹,得到房子当前的场景信息,该房子当前的场景信息用于反映房子、家居当前所处的场景。该场景反映了房子当前所处的情况或状态。这样,能够让离家的用户及时获知房子目前的状态,有效提高了用户离家后的安全性。
在一个实施例中,所述环境声纹对应的声音包括水流声、动物声、敲门的声音、***的声音和风的声音,比如,动物声包括老鼠声音、宠物声音、昆虫声音。对应的场景信息包括家庭存在漏水、家里有老鼠、有未知访客、存在***隐患、宠物未离家门、窗未关闭等。每一种声纹或者多种声纹配合,对应一场景信息。
上述实施例中,通过触发进入离家模式,使得语音识别***能够在离家模式下,对室内的环境声纹进行监控,实现在无人的情况下对家居的安全监控,有效提高了安全性,并且使得声纹识别更为灵活。
为了解析获得场景信息,在一个实施例中,所述当检测到所述环境声纹时,解析所述环境声纹,得到当前场景信息的步骤包括:当检测到所述环境声纹时,解析所述环境声纹,得到声纹信息;根据所述声纹信息和预设的声纹场景映射关系,得到当前的所述场景信息。
本实施例中,该声纹场景映射关系用于反映环境声纹和场景信息的对应关系,应该理解的时,声纹场景映射关系是预先构建的,一个实施例中,该声纹场景映射关系通过预先构建的环境声纹识别模型获得。
一个实施例中,每一种声纹或者多种声纹配合映射一场景信息,映射关系如下表:
识别类别 | 映射场景 |
水流声 | 家庭存在漏水 |
老鼠的声音 | 家里有老鼠 |
敲门的声音 | 有未知访客 |
***的声音 | 存在***隐患 |
宠物的声音 | 宠物未离家 |
风的声音 | 门窗未关闭 |
这样,通过检测到声纹信息,在声纹场景映射关系找到与声纹信息对应的场景信息,即可得到当前的所述场景信息。
在一个实施例中,所述当接收到离家模式触发指令时,进入离家模式,检测是否存在环境声纹的步骤包括:当接收到离家模式触发指令时,进入离家模式,检测是否存在环境声纹,并在接收到语音声纹时,将所述语音声纹判定为所述环境声纹。
一个实施例是,当接收到离家模式触发指令时,进入离家模式,检测是否接收到声纹,检测所述声纹为环境声纹还是语音声纹,当所述声纹为语音声纹时,将所述语音声纹识别为所述环境声纹,且不对语音声纹做出反馈。
本实施例中,进入离家模式后,则将接收到的语音声纹识别为环境声纹,不对语音声纹做出反馈。这样,在离家模式下,用户或者其他人发出的语音声纹都不会被识别,并且也不会对语音声纹做出反馈,一方面,减小对计算资源的消耗,另一方面,则能够在离家模式下,充分识别环境声纹,避免非法或意外闯入的其他人对声纹识别的干扰。
在一个实施例中,在进入离家模式后,所述在接收到语音声纹时,将所述语音声纹判定为所述环境声纹的步骤包括:在接收到语音声纹时,检测所述语音声纹是否携带居家模式触发指令;当所述语音声纹未携带居家模式触发指令时,将所述语音声纹判定为所述环境声纹;当所述语音声纹携带居家模式触发指令时,进入居家模式,检测是否接收到语音声纹,并停止对所述环境声纹的检测。
本实施例中,进入离家模式后,则不再对语音声纹作出反馈或者执行语音声纹的指令,除非该语音声纹携带居家模式触发指令。
具体地,该居家模式触发指令用于解除离家模式,使得智能声纹***或语音识别***解除离家模式,进入居家模式,在居家模式下,智能声纹***或语音识别***不监测环境声纹,仅监测语音声纹。本实施例中,在离家模式下,接收到语音声纹时,解析语音声纹,获得语音信息,检测语音信息是否携带居家模式触发指令,当语音信息携带居家模式触发指令时,则切换至居家模式,对语音声纹进行监测,并停止对环境声纹的监测;当语音信息未携带居家模式触发指令时,则继续维持离家模式,并且持续对环境声纹进行监测,且不对语音声纹做出反馈。
本实施例中,智能声纹***或语音识别***在离家模式下,仅对用户有效的声纹信息做出反馈,该有效的声纹信息即用户发出的带有居家模式触发指令的语音声纹。一方面,能够有效避免无效的语音声纹对离家模式下的声纹识别造成干扰,能够避免对无效的语音声纹做出反馈,有效降低对计算资源的消耗,另一方面,能够使得合法用户有效、快捷地切换至居家模式。
在一个实施例中,所述当检测到所述环境声纹时,解析所述环境声纹,得到当前的场景信息的步骤包括:当检测到所述环境声纹时,解析所述环境声纹,得到当前的场景信息,记录所述环境声纹和当前的所述场景信息。
本实施例中,在离家模式下,解析环境声纹得到当前的场景信息后,记录环境声纹和当前的场景信息,并且记录环境声纹和当前的场景信息的对应关系,将环境声纹和当前的场景信息发送至用户终端,使得在用户离家期间,房子内的杂声能够被记录,并且及时发送至用户终端,使得用户能够及时获知。
在一个实施例中,所述检测是否接收到离家模式触发指令的步骤之前还包括:获取环境训练声纹;将所述环境训练声纹输入残差网络中进行训练,得到环境声纹识别模型;所述当检测到所述环境声纹时,解析所述环境声纹,得到当前的场景信息的步骤包括:当检测到所述环境声纹时,基于所述环境声纹识别模型解析所述环境声纹,得到当前的场景信息。
本实施例中,通过残差网络对各种环境声纹进行训练,从而识别除环境声纹的类型,本实施例中,训练构建环境声纹识别模型包括三个阶段:训练阶段、注册阶段和验证阶段。首先,训练阶段,将大量的环境训练声纹作为训练数据输入残差网络中进行训练,得到环境声纹识别模型,该环境声纹识别模型对不同的环境训练声纹做出了分类;随后,注册阶段,将注册的环境声纹输入至环境声纹识别模型,得到注册特征;最后,验证阶段,在环境声纹识别模型中输入任意的环境声纹,经过残差网络模型提取出验证特征,利用余弦计算验证特征与注册特征的相似度,根据相似度判定环境声纹的类别。从而完成环境声纹识别模型的构建。
在一个实施例中,所述当接收到离家模式触发指令时,进入离家模式,检测是否存在环境声纹的步骤之后还包括:检测是否接收到居家模式触发指令;当接收到居家模式触发指令时,进入居家模式,检测是否接收到语音声纹,并停止对所述环境声纹的检测。
本实施例中,在离家模式下,当监测到居家模式触发指令时,进入居家模式,在居家模式下,进入检测语音声纹,而不对所述环境声纹进行检测,从而使得用户在家时,能够便捷地通过语音控制智能家居,并且减少了计算资源的消耗。
一个实施例中,进入居家模式后,或者在居家模式下,检测语音声纹,当检测到语音声纹时,解析所述语音声纹,得到语音信息,检测所述语音信息中是否携带离家模式触发指令,当检测到所述语音信息中携带离家模式触发指令时,则进入离家模式;当检测到所述语音信息未携带离家模式触发指令时,则根据所述语音信息执行控制。这样,在居家模式下,用户可通过语音声纹,控制智能语音识别***以及关联的智能设备工作。
应该理解的是,虽然图1的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图1中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
实施例二
目前的智能家居离家模式中,安全防护主要依靠摄像头,这里引入声纹识别功能增加离家场景中的安全防护。将声纹识别由主体为人扩展到其他类别。这样,能够增强离家模式智能家居的安全防护。将家居中的一些其他声音纳入声纹识别体系中,用于在离家场景中增强家居的安全防护。
声纹识别***的整体流程,如图4所示。第一步:用户离家时开启离家模式;第二步,在离家模式中,声纹识别模块进行调整,由主体为人设置为其他。之前声纹识别的主体是人,用于鉴别人的身份或者进行一些设备权限的设置。主体更换为其他声音之后用于家居安全的防护预警。这里这么做的主要意图是,切分场景,降低声纹识别任务的复杂度,提高识别精度;第三步、声纹识别***根据监听到的声音识别出对应的类别,然后将识别出来的类别映射为场景。具体的映射举例如下表所示。第四步、把监听的时间和事件信息写入日志,并实时显示在用户的终端。
识别类别 | 映射场景 |
水流声 | 家庭存在漏水 |
老鼠的声音 | 家里有老鼠 |
敲门的声音 | 有未知访客 |
***的声音 | 存在***隐患 |
宠物的声音 | 宠物未离家 |
风的声音 | 门窗未关闭 |
接下来介绍一下声纹识别的整体流程。整个声纹识别的方法如图5和图6所示。声纹识别***中发声类别集合并不固定,增加一个类别重新训练一次模型并不现实,残差网络模型在整个方法中起到特征提取的作用,并不作为分类器或者识别器。方法可以分为三个部分,训练阶段:训练就是一个建立模型的过程,将训练数据输入残差网络中进行训练;注册阶段:模型已经在训练阶段搭建好,这里将注册的环境声纹输入模型得到注册特征;验证阶段:验证阶段就是随意输入环境声纹,经过残差网络模型提取出验证特征,然后利用余弦计算验证特征与注册特征的相似度,如果相似度大于阈值,就认为这是一个类别。
最后介绍残差网络模型的训练。目前大型的数据集都是人的声音,家居中的各种声音需要人工采集且数据规模不大。所以网络模型先在环境声纹的公开数据集上进行预训练,然后在小数据集上进行微调,如果用户有特殊的需要,还可以提供音频进行个性化的定制。
实施例三
本实施例中,如图2所示,提供一种声纹识别装置,包括:
离家模式触发检测模块210,用于检测是否接收到离家模式触发指令;
环境声纹检测模块220,用于当接收到离家模式触发指令时,进入离家模式,检测是否存在环境声纹;
场景信息解析获得模块230,用于当检测到所述环境声纹时,解析所述环境声纹,得到当前的场景信息。
在一个实施例中,所述场景信息解析获得模块包括:
声纹信息解析获得单元,用于当检测到所述环境声纹时,解析所述环境声纹,得到声纹信息;
场景映射单元,用于根据所述声纹信息和预设的声纹场景映射关系,得到当前的所述场景信息。
在一个实施例中,所述环境声纹检测模块用于当接收到离家模式触发指令时,进入离家模式,检测是否存在环境声纹,并在接收到语音声纹时,将所述语音声纹判定为所述环境声纹。
在一个实施例中,所述环境声纹检测模块包括:
居家触发指令检测单元,用于在接收到语音声纹时,检测所述语音声纹是否携带居家模式触发指令;
语音声纹判定单元,用于当所述语音声纹未携带居家模式触发指令时,将所述语音声纹判定为所述环境声纹;
居家模式触发单元,用于当所述语音声纹携带居家模式触发指令时,进入居家模式,检测是否接收到语音声纹,并停止对所述环境声纹的检测。
在一个实施例中,所述场景信息解析获得模块还用于当检测到所述环境声纹时,解析所述环境声纹,得到当前的场景信息,记录所述环境声纹和当前的所述场景信息。
在一个实施例中,声纹识别装置还包括:
训练声纹获取模块,用于获取环境训练声纹;
环境声纹识别模型构建模块,用于将所述环境训练声纹输入残差网络中进行训练,得到环境声纹识别模型;
所述场景信息解析获得模块用于当检测到所述环境声纹时,基于所述环境声纹识别模型解析所述环境声纹,得到当前的场景信息。
在一个实施例中,声纹识别装置还包括:
居家指令检测模块,用于检测是否接收到居家模式触发指令;
居家模式进入模块,用于当接收到居家模式触发指令时,进入居家模式,检测是否接收到语音声纹,并停止对所述环境声纹的检测。
关于声纹识别装置的具体限定可以参见上文中对于声纹识别方法的限定,在此不再赘述。上述声纹识别装置中的各个单元可全部或部分通过软件、硬件及其组合来实现。上述各单元可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个单元对应的操作。
实施例四
本实施例中,提供了计算机设备。其内部结构图可以如图3所示。该计算机设备包括通过***总线连接的处理器、存储器、网络接口、显示屏和输入装置。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作***和计算机程序,且该非易失性存储介质部署有数据库。该内存储器为非易失性存储介质中的操作***和计算机程序的运行提供环境。该计算机设备的网络接口用于与部署了应用软件的其他计算机设备通信。该计算机程序被处理器执行时以实现一种声纹识别方法。该计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏,该计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
本领域技术人员可以理解,图3中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种计算机设备,包括存储器和处理器,该存储器存储有计算机程序,该处理器执行计算机程序时实现以下步骤:
检测是否接收到离家模式触发指令;
当接收到离家模式触发指令时,进入离家模式,检测是否存在环境声纹;
当检测到所述环境声纹时,解析所述环境声纹,得到当前的场景信息。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
当检测到所述环境声纹时,解析所述环境声纹,得到声纹信息;
根据所述声纹信息和预设的声纹场景映射关系,得到当前的所述场景信息。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
当接收到离家模式触发指令时,进入离家模式,检测是否存在环境声纹,并在接收到语音声纹时,将所述语音声纹判定为所述环境声纹。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
在接收到语音声纹时,检测所述语音声纹是否携带居家模式触发指令;
当所述语音声纹未携带居家模式触发指令时,将所述语音声纹判定为所述环境声纹;
当所述语音声纹携带居家模式触发指令时,进入居家模式,检测是否接收到语音声纹,并停止对所述环境声纹的检测。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
当检测到所述环境声纹时,解析所述环境声纹,得到当前的场景信息,记录所述环境声纹和当前的所述场景信息。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
获取环境训练声纹;
将所述环境训练声纹输入残差网络中进行训练,得到环境声纹识别模型;
当检测到所述环境声纹时,基于所述环境声纹识别模型解析所述环境声纹,得到当前的场景信息。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
检测是否接收到居家模式触发指令;
当接收到居家模式触发指令时,进入居家模式,检测是否接收到语音声纹,并停止对所述环境声纹的检测。
实施例五
本实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:
检测是否接收到离家模式触发指令;
当接收到离家模式触发指令时,进入离家模式,检测是否存在环境声纹;
当检测到所述环境声纹时,解析所述环境声纹,得到当前的场景信息。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
当检测到所述环境声纹时,解析所述环境声纹,得到声纹信息;
根据所述声纹信息和预设的声纹场景映射关系,得到当前的所述场景信息。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
当接收到离家模式触发指令时,进入离家模式,检测是否存在环境声纹,并在接收到语音声纹时,将所述语音声纹判定为所述环境声纹。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
在接收到语音声纹时,检测所述语音声纹是否携带居家模式触发指令;
当所述语音声纹未携带居家模式触发指令时,将所述语音声纹判定为所述环境声纹;
当所述语音声纹携带居家模式触发指令时,进入居家模式,检测是否接收到语音声纹,并停止对所述环境声纹的检测。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
当检测到所述环境声纹时,解析所述环境声纹,得到当前的场景信息,记录所述环境声纹和当前的所述场景信息。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
获取环境训练声纹;
将所述环境训练声纹输入残差网络中进行训练,得到环境声纹识别模型;
当检测到所述环境声纹时,基于所述环境声纹识别模型解析所述环境声纹,得到当前的场景信息。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
检测是否接收到居家模式触发指令;
当接收到居家模式触发指令时,进入居家模式,检测是否接收到语音声纹,并停止对所述环境声纹的检测。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。
Claims (10)
1.一种声纹识别方法,其特征在于,包括:
检测是否接收到离家模式触发指令;
当接收到离家模式触发指令时,进入离家模式,检测是否存在环境声纹;
当检测到所述环境声纹时,解析所述环境声纹,得到当前的场景信息。
2.根据权利要求1所述的方法,其特征在于,所述当检测到所述环境声纹时,解析所述环境声纹,得到当前场景信息的步骤包括:
当检测到所述环境声纹时,解析所述环境声纹,得到声纹信息;
根据所述声纹信息和预设的声纹场景映射关系,得到当前的所述场景信息。
3.根据权利要求1所述的方法,其特征在于,所述当接收到离家模式触发指令时,进入离家模式,检测是否存在环境声纹的步骤包括:
当接收到离家模式触发指令时,进入离家模式,检测是否存在环境声纹,并在接收到语音声纹时,将所述语音声纹判定为所述环境声纹。
4.根据权利要求3所述的方法,其特征在于,在进入离家模式后,所述在接收到语音声纹时,将所述语音声纹判定为所述环境声纹的步骤包括:
在接收到语音声纹时,检测所述语音声纹是否携带居家模式触发指令;
当所述语音声纹未携带居家模式触发指令时,将所述语音声纹判定为所述环境声纹;
当所述语音声纹携带居家模式触发指令时,进入居家模式,检测是否接收到语音声纹,并停止对所述环境声纹的检测。
5.根据权利要求1所述的方法,其特征在于,所述当检测到所述环境声纹时,解析所述环境声纹,得到当前的场景信息的步骤包括:
当检测到所述环境声纹时,解析所述环境声纹,得到当前的场景信息,记录所述环境声纹和当前的所述场景信息。
6.根据权利要求1所述的方法,其特征在于,所述检测是否接收到离家模式触发指令的步骤之前还包括:
获取环境训练声纹;
将所述环境训练声纹输入残差网络中进行训练,得到环境声纹识别模型;
所述当检测到所述环境声纹时,解析所述环境声纹,得到当前的场景信息的步骤包括:
当检测到所述环境声纹时,基于所述环境声纹识别模型解析所述环境声纹,得到当前的场景信息。
7.根据权利要求1-6任一项中所述的方法,其特征在于,所述当接收到离家模式触发指令时,进入离家模式,检测是否存在环境声纹的步骤之后还包括:
检测是否接收到居家模式触发指令;
当接收到居家模式触发指令时,进入居家模式,检测是否接收到语音声纹,并停止对所述环境声纹的检测。
8.一种声纹识别装置,其特征在于,包括:
离家模式触发检测模块,用于检测是否接收到离家模式触发指令;
环境声纹检测模块,用于当接收到离家模式触发指令时,进入离家模式,检测是否存在环境声纹;
场景信息解析获得模块,用于当检测到所述环境声纹时,解析所述环境声纹,得到当前的场景信息。
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011348172.XA CN112562695B (zh) | 2020-11-26 | 2020-11-26 | 声纹识别方法、装置、计算机设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011348172.XA CN112562695B (zh) | 2020-11-26 | 2020-11-26 | 声纹识别方法、装置、计算机设备和存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112562695A true CN112562695A (zh) | 2021-03-26 |
CN112562695B CN112562695B (zh) | 2023-09-29 |
Family
ID=75046859
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011348172.XA Active CN112562695B (zh) | 2020-11-26 | 2020-11-26 | 声纹识别方法、装置、计算机设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112562695B (zh) |
Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TW201416656A (zh) * | 2012-10-16 | 2014-05-01 | Rong-Zhao Hong | 家庭用水設備的漏水偵測系統 |
CN103778916A (zh) * | 2013-12-31 | 2014-05-07 | 三星电子(中国)研发中心 | 监控环境声音的方法及*** |
CN108200396A (zh) * | 2018-01-05 | 2018-06-22 | 湖南固尔邦幕墙装饰股份有限公司 | 智能门***及智能门控制方法 |
CN108597164A (zh) * | 2018-04-28 | 2018-09-28 | 上海与德科技有限公司 | 一种防盗方法、装置、终端及计算机可读介质 |
CN108877126A (zh) * | 2017-05-12 | 2018-11-23 | 谷歌有限责任公司 | 经由居家助手进行活动监视的***、方法和设备 |
CN109074035A (zh) * | 2016-04-22 | 2018-12-21 | 微软技术许可有限责任公司 | 多功能的每房间自动化*** |
CN110189769A (zh) * | 2019-05-23 | 2019-08-30 | 复钧智能科技(苏州)有限公司 | 基于多个卷积神经网络模型结合的异常声音检测方法 |
CN110393883A (zh) * | 2019-08-28 | 2019-11-01 | 晋江市长胜电子科技有限公司 | 消防栓 |
CN110867959A (zh) * | 2019-11-13 | 2020-03-06 | 上海迈内能源科技有限公司 | 一种基于声音识别的电力设备智能监控***及监控方法 |
CN111063359A (zh) * | 2019-12-24 | 2020-04-24 | 太平金融科技服务(上海)有限公司 | 电话回访有效性判别方法、装置、计算机设备和介质 |
CN111108554A (zh) * | 2019-12-24 | 2020-05-05 | 广州国音智能科技有限公司 | 一种基于语音降噪的声纹识别方法和相关装置 |
CN111508521A (zh) * | 2019-01-30 | 2020-08-07 | 深圳市冠旭电子股份有限公司 | 安防方法、终端设备及存储介质 |
-
2020
- 2020-11-26 CN CN202011348172.XA patent/CN112562695B/zh active Active
Patent Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TW201416656A (zh) * | 2012-10-16 | 2014-05-01 | Rong-Zhao Hong | 家庭用水設備的漏水偵測系統 |
CN103778916A (zh) * | 2013-12-31 | 2014-05-07 | 三星电子(中国)研发中心 | 监控环境声音的方法及*** |
CN109074035A (zh) * | 2016-04-22 | 2018-12-21 | 微软技术许可有限责任公司 | 多功能的每房间自动化*** |
CN108877126A (zh) * | 2017-05-12 | 2018-11-23 | 谷歌有限责任公司 | 经由居家助手进行活动监视的***、方法和设备 |
CN108200396A (zh) * | 2018-01-05 | 2018-06-22 | 湖南固尔邦幕墙装饰股份有限公司 | 智能门***及智能门控制方法 |
CN108597164A (zh) * | 2018-04-28 | 2018-09-28 | 上海与德科技有限公司 | 一种防盗方法、装置、终端及计算机可读介质 |
CN111508521A (zh) * | 2019-01-30 | 2020-08-07 | 深圳市冠旭电子股份有限公司 | 安防方法、终端设备及存储介质 |
CN110189769A (zh) * | 2019-05-23 | 2019-08-30 | 复钧智能科技(苏州)有限公司 | 基于多个卷积神经网络模型结合的异常声音检测方法 |
CN110393883A (zh) * | 2019-08-28 | 2019-11-01 | 晋江市长胜电子科技有限公司 | 消防栓 |
CN110867959A (zh) * | 2019-11-13 | 2020-03-06 | 上海迈内能源科技有限公司 | 一种基于声音识别的电力设备智能监控***及监控方法 |
CN111063359A (zh) * | 2019-12-24 | 2020-04-24 | 太平金融科技服务(上海)有限公司 | 电话回访有效性判别方法、装置、计算机设备和介质 |
CN111108554A (zh) * | 2019-12-24 | 2020-05-05 | 广州国音智能科技有限公司 | 一种基于语音降噪的声纹识别方法和相关装置 |
Also Published As
Publication number | Publication date |
---|---|
CN112562695B (zh) | 2023-09-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106251874B (zh) | 一种语音门禁和安静环境监控方法及*** | |
CN111048113B (zh) | 声音方向定位处理方法、装置、***、计算机设备及存储介质 | |
CN109285259B (zh) | 一种用于智能门禁的控制***及其控制方法 | |
CN111145782B (zh) | 重叠语音识别方法、装置、计算机设备和存储介质 | |
CN110738769A (zh) | 门禁用户的身份识别方法、装置、***和计算机设备 | |
CN109599117A (zh) | 一种音频数据识别方法及人声语音防重放识别*** | |
CN106847281A (zh) | 基于语音模糊识别技术的智能家居语音控制***及方法 | |
CN109360584A (zh) | 基于深度学习的咳嗽监测方法及装置 | |
CN110555918B (zh) | 考勤管理的方法和考勤管理设备 | |
CN110930989A (zh) | 语音意图识别方法、装置、计算机设备和存储介质 | |
CN110517673A (zh) | 语音识别方法、装置、计算机设备及存储介质 | |
CN109118626B (zh) | 锁具的控制方法、装置、存储介质及电子装置 | |
CN108540357B (zh) | 语音控制方法、装置和音响设备 | |
CN115050372A (zh) | 一种音频片段的聚类方法、装置、电子设备和介质 | |
CN115881126B (zh) | 基于语音识别的开关控制方法、装置和开关设备 | |
CN112562695A (zh) | 声纹识别方法、装置、计算机设备和存储介质 | |
CN112580459A (zh) | 基于生物识别的业务处理方法、装置、计算机设备及介质 | |
CN106971715A (zh) | 一种应用于机器人的语音识别装置 | |
CN116883900A (zh) | 一种基于多维生物特征的视频真伪鉴别方法和*** | |
CN116415591A (zh) | 基于用户意图识别的设备控制方法及装置 | |
CN113345210A (zh) | 一种基于音视频智能判断呼救的方法及装置 | |
CN111091638A (zh) | 存储介质、智能门锁及其鉴权方法 | |
CN111276140A (zh) | 语音命令识别方法、装置、***及存储介质 | |
CN113178196B (zh) | 音频数据提取方法、装置、计算机设备和存储介质 | |
Malik et al. | Speaker identification based home automation system for aging populations through speech recognition |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |