CN103310789B - 一种基于改进的并行模型组合的声音事件识别方法 - Google Patents

一种基于改进的并行模型组合的声音事件识别方法 Download PDF

Info

Publication number
CN103310789B
CN103310789B CN201310239724.7A CN201310239724A CN103310789B CN 103310789 B CN103310789 B CN 103310789B CN 201310239724 A CN201310239724 A CN 201310239724A CN 103310789 B CN103310789 B CN 103310789B
Authority
CN
China
Prior art keywords
sound event
model
noise
template
spectral domain
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201310239724.7A
Other languages
English (en)
Other versions
CN103310789A (zh
Inventor
刘宏
王一
李晓飞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Peking University Shenzhen Graduate School
Original Assignee
Peking University Shenzhen Graduate School
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Peking University Shenzhen Graduate School filed Critical Peking University Shenzhen Graduate School
Priority to CN201310239724.7A priority Critical patent/CN103310789B/zh
Publication of CN103310789A publication Critical patent/CN103310789A/zh
Application granted granted Critical
Publication of CN103310789B publication Critical patent/CN103310789B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)

Abstract

本发明涉及一种基于改进的并行模型组合的声音事件识别方法,其步骤包括:1)录制声音事件的数据,根据干净声音事件训练得到GMM高斯混合模型,建立干净声音事件模板;2)在室内真实有噪声的环境下获取当前环境中的噪声数据,根据噪声数据训练得到GMM,建立噪声模板;3)对噪声模板和干净声音事件模板采用改进的并行模型融合的方法,得到带噪声音事件模板;4)采样得到带噪声音事件样本信号,根据带噪声音事件模板中的参数对样本信号进行声音识别。本发明通过建立能够更好描述背景噪声特征分布的GMM来作为PMC方法中一个输入,建立5种声音事件的干净GMM作为PMC的另一个输入。同时本发明保证了识别***对噪声的鲁棒性。

Description

一种基于改进的并行模型组合的声音事件识别方法
技术领域
本发明属于智能监控中音频信号处理领域,涉及室内环境中声音事件识别方法,具体涉及一种基于改进的并行模型组合的声音事件识别方法。
背景技术
相对于人工智能领域中成熟的语音识别方法来讲,利用计算机来进行声音事件的识别是近几年在比较新研究方向。声音事件识别针对的是自然环境中发声的具有一定含义的或是可以反映人们行为的声音事件,进行自动的判断和归类。在家庭智能监控***中,声音事件的识别可以帮助人们远程的监控家庭室内环境中发生的情况,并及时告知用户产生了什么样的事件,有利于用户及时进行处理。但是,真实的环境中是存在着复杂的噪声的,要想实现在真实环境下的有效的监控,对噪声的处理是必须的和紧迫的。
首先,声音事件的识别属于一个模式识别的问题,类似于自动语音识别。基本的方法是信号处理和模式识别。现有的声音事件识别方法包括以下几个步骤:
(1)声音事件信号的录入,预滤波、模数变换。先把录入的模拟声音信号进行预滤波,高通滤波抑制50HZ电源噪声信号;低通滤波滤除声音信号中频率分量超过采样频率一半的部分,防止混叠干扰。对模拟声音信号进行采样和量化得到数字信号。
(2)分帧、加窗。声音信号和语音信号一样,都具有整体非平稳,局部平稳的短时平稳性,类似语音信号,可以认为声音信号在10~30ms内是平稳的,可以把声音信号按照30ms的长度进行分帧。分帧时利用窗函数进行信号的提取,窗函数它的选择(形状和长度)对短时分析参数的特性影响很大,常用的窗函数包括矩形窗、汉宁窗和汉明窗等。一般选用汉明窗,可以很好地反应语音信号的特性变化。
(3)特征提取。不同的声音事件的特征是不相同的,要想区分不同的声音信号,就要对声音信号的特征进行数学描述。常用的声音事件识别的特征有时域特征:短时能量,短时过零率。频域特征:子带能量,小波时频特性。倒谱域特征:线性预测倒谱系数(LPCC),梅尔频率倒谱系数(MFCC)等。
(4)识别。声音事件的识别方法也是采用类似于语音识别的算法。常用的声音事件识别的方法有基于支持向量机(SVM)的分类,基于混合高斯模型(GMM)聚类方法,隐马尔可夫模型(HMM)方法,贝叶斯分类算法。
其次,对噪声的处理。上述所讲述的识别方法在实际环境中应用时,识别***的性能会随着训练数据和测试数据的失配急剧恶化,而导致所述失配的原因就是环境噪声的影响。由噪声引起的训练和测试的不匹配可以从信号空间、特征空间和模型空间三个空间来分析。常用的方法有类似于语音增强的声音增强法、鲁棒特征提取、特征补偿、模型补偿如并行模型组合(PMC)等方法对噪声进行处理,提高***的鲁棒性。
现有的方法大部分还是沿用语音识别的一套,对噪声的处理也不外乎以上几种方法,以上方法中基于PMC的方法能够充分描述环境噪声而被广泛采用,他们可以充分挖掘环境中的信息,提高***识别的鲁棒性,但现有的PMC方法中对于噪声特征是用单高斯模型(SGM)来描述的,对于噪声比较复杂的情况,SGM并不能很好表征噪声的特性。所以,噪声复杂的情况下识别率不够理想。
发明内容
为了解决上述技术问题,本发明的目的在于提供一种通过改进的模型参数融合的方法得到符合噪声环境的带噪声音事件模型,对于实际噪声环境下的待识别声音事件进行识别。
为了实现上述的目的,本发明技术方案为:一种基于改进的并行模型组合的声音事件识别方法,其步骤包括:
1)根据干净声音事件训练得到GMM高斯混合模型,建立干净声音事件模板;
2)根据噪声数据训练得到GMM高斯混合模型,建立噪声模板;
3)对所述噪声模板和所述干净声音事件模板采用并行模型融合的方法,得到带噪声音事件模板;
4)采样得到带噪声音事件样本信号,根据所述带噪声音事件模板中的参数对样本信号进行声音识别。
更进一步,建立干净声音事件的模板的方法如下:
1)在无噪安静室内的环境下录制声音事件的数据,对录制的声音事件进行预滤波、模数变换后再进行分帧、加窗处理;
2)提取MFCC梅尔倒谱系数特征,训练出声音事件的GMM高斯混合模板。
更进一步,所述高斯混合模型采用EM算法训练并更新高斯模型的参数,训练得到的干净声音事件的GMM参数为λx={wxkxkxk},k=1,2…,M,其中,wxk表示干净声音事件模型的混合权重,μxk表示干净声音事件模型的均值,Σxk表示干净声音事件模型的方差,M表示混合高斯的阶数。
更进一步,在室内真实有噪声的环境下获取当前环境中的噪声数据,建立所述噪声模板方法为:提取MFCC特征,建立噪声的GMM模板,得到噪声模板GMM参数为λn={wnknknk},k=1,2…,M,其中,wnk表示噪声模型的混合权重,μnk表示噪声模型的均值,Σnk表示噪声模型的方差,M表示混合高斯的阶数。
更进一步,对所述噪声模板和所述干净声音事件模板采用改进的并行模型融合的方法如下:
(1)采用离散余弦逆变换将任一模型参数由倒谱域映射到线性谱域,得到对数谱域模型的均值μlog=C-1μ,和方差Σlog=C-1Σ(C-1)T,其中,C为离散余弦变换矩阵,μ,Σ分别为为模型的倒谱域的均值和方差;
(2)将对数谱域模型中的对数谱域均值和方差通过指数函数变换到线性谱域, μ i lin = exp ( μ i log + Σ ii log 2 ) 为线性谱域的均值向量的第i个元素, Σ ij lin = μ i lin μ j lin [ exp ( Σ ij log ) - 1 ] 为线性谱域的协方差矩阵的第i行第j列元素。其中,μi log为对数谱域的均值向量的第i个元素,为对数谱域的协方差矩阵的第i行第j列元素;
(3)采用改进的并行模型组合方法,将干净声音事件模型参数与噪声模型参数在线性谱域进行融合,为融合后的带噪声音事件模型在线性谱域的均值,为融合后的带噪声音事件模型在线性谱域的方差。其中μxk lin为干净声音事件模型经所述步骤(1)(2)变换后的线性谱域的均值,为干净声音事件模型经所述步骤(1)(2)变换后的线性谱域的方差,μnk lin为噪声模型经所述步骤(1)(2)变换后的线性谱域的均值,为噪声模型经所述步骤(1)(2)变换后的线性谱域的方差;
(4)将融合后的带噪声音事件模型的线性谱域模型的均值和方差经过上述步骤(2)的逆变换得到对数谱域参数,再经过上述步骤(1)逆变换得到倒谱域的特征参数,得到带噪声音事件模型的均值向量和方差。
更进一步,带噪声音事件模型的参数为λy={wykykyk},k=1,2…,M,其中wykykyk分别表示噪声模板的混合权重,均值和方差。其中混合权重没有线性谱域,对数谱域以及倒谱域的差别。因此带噪声音事件模型的混合权重wyk即为干净声音事件模板的权重wxk,M表示混合高斯的阶数。
更进一步,根据所述带噪声音事件模型中的参数对样本信号进行声音识别的方法如下:
1)对所述样本信号进行预滤波、模数变换,再进行分帧、加窗处理后提取多维MFCC特征得到样本信号特征序列;
2)将样本信号的特征向量序列与所述带噪声音事件模型进行匹配,计算匹配似然度,最大似然度的匹配模板为识别结果。
更进一步,所述噪声数据采用NoiseX-92的babble噪声和/或室内环境下空调噪声。
本发明的技术效果:
本发明能够在复杂噪声背景下,通过建立能够更好描述背景噪声特征分布的背景GMM,来作为PMC方法中一个输入,建立5种声音事件的干净GMM作为PMC的另一个输入。经过改进的模型参数融合的方法得到符合噪声环境的带噪声音事件模型,对于实际噪声环境下的待识别声音事件,有着良好的识别效果。本发明保证了识别***对噪声的鲁棒性。
附图说明
图1是本发明基于改进的并行模型组合的声音事件识别方法整体识别流程示意图。
图2是本发明基于改进的并行模型组合的声音事件识别方法一实施例中融合方法示意图。
图3是是本发明基于改进的并行模型组合的声音事件识别方法一实施例中5种声音事件识别效果示意图。
具体实施方法
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,可以理解的是,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明针对室内环境中经常发生的需要引起人们注意的5种声音事件进行识别。另外,充分考虑复杂噪声的情况(室内环境下录制的空调噪声、公共噪声数据库NoiseX-92的babble噪声),利用GMM混合高斯模型(GMM,《语音信号处理》第2版,赵力编著,机械工业出版社,228-230页)来描述背景噪声信号,GMM用多个高斯分布加权来描述背景的特征分布,可以更好的充分的描述背景噪声的信息。在模型层对利用所述的背景噪声模型参数,对干净声音事件模型参数进行补偿,得到带噪声音事件的模型,以防止由于噪声带来的训练数据和测试数据的失配。
本发明为一种基于改进的并行模型组合的声音事件识别方法,具体内容为:
第一,建立干净声音事件的模板。
(1)在安静环境下分别录制5种声音事件的数据,按照如前所述的声音信号处理步骤对加窗分帧等预处理。
(2)再按如前所述,提取鲁棒的MFCC特征,分别训练出5种声音事件的高斯混合模型。高斯混合模型的训练采用EM算法更新高斯模型的参数。假设训练得到的干净声音事件的其中一种的GMM参数如下:
λx={wxkxkxk},k=1,2…,M(1)
第二,获取当前环境中的噪声数据,提取MFCC特征,建立噪声的GMM模板。得到噪声模板参数如下:
λn={wnknknk},k=1,2…,M(2)
第三,进行模型融合,由于本发明中用来训练GMM的数据都为MFCC特征,属于倒谱域特征,而背景噪声和声音事件模型参数只在线性谱域是可加的,所以要对以上两种模型同样做以下处理:(用λ={wkkk},k=1,2…,M来统一表述干净声音的GMM和背景噪声的GMM)
1)将模型参数由倒谱域映射到线性谱域,具体可以采用离散余弦变换的逆变换进行处理。这里我们不提取MFCC的差分系数,计算方法公式(3)和(4):
μlog=C-1μ(3)
Σlog=C-1Σ(C-1)T(4)
其中μlog,Σlog为对数谱域模型的均值和方差,μ,Σ为模型的倒谱域的均值和方差,C为离散余弦变换矩阵。
2)将对数谱域的正态分布随机变量通过指数函数变换到线性谱域,计算方法如公式(5)和(6):
μ i lin = exp ( μ i log + Σ ii log 2 ) - - - ( 5 )
Σ ij lin = μ i lin μ j lin [ exp ( Σ ij log ) - 1 ] - - - ( 6 )
其中,μi lin分别为线性谱域的均值向量的第i个元素和协方差矩阵的第i行第j列元素;μi log分别为对数谱域的均值向量的第i个元素和协方差矩阵的第i行第j列元素。
3)假设由上式计算后的干净声音事件模型的线性谱域的均值向量和方差分别为μxk lin噪声模型的线性谱域均值向量和方差分别为μnk lin采用公式(7)和(8)对两个模型进行融合:
μ yk lin = g μ xk lin + ( 1 - g ) Σ k = 1 K w nk μ nk lin - - - ( 7 )
Σ yk lin = g 2 Σ xk lin + ( 1 - g ) 2 Σ k = 1 K w nk Σ nk lin - - - ( 8 )
其中μyk lin,表示融合后的带噪声音事件模型的均值向量和方差,g表示增益因子。
4)将融合后的线性谱域模型参数经过公式(5)(6)的逆变换得到模型的对数谱域参数,再经过公式(3)(4)的逆变换得到模型的倒谱域的参数。将5种声音事件模型均做上述处理即可最后得到的即为融合后的5种带噪声音事件模型参数。
第四,对于在室内噪声环境声音中提取的带噪声音事件信号样本,识别的目的是要确定当前样本属于5种声音事件的哪一个,即计算样本对5种模型的后验概率,其中最大的一个后验概率对应的模型即为样本的类别。根据贝叶斯公式,由于5种声音事件可能发生的概率相同,对于确定的观察矢量而言,上述最大后验概率的计算等同于计算改样本在5种声音事件模型下的概率,使得该概率最大的模型即为样本所属的类别。
如图1所示是本发明基于改进的并行模型组合的声音事件识别方法整体识别流程示意图,包括训练部分和识别部分。
本发明考虑室内环境下经常发生并需要引起人们注意的5种声音事件,分别为关门声、敲门声、拍手声、说话声、尖叫声。5种声音事件模板及噪声训练模板训练过程如下:
1、在安静环境下录制5种声音事件数据库并进行标定。每种声音事件类型100个,由5男5女分别发声或产生动作得到。噪声采用NoiseX-92的babble噪声和室内环境下空调噪声。
2、预滤波,高通滤波抑制50Hz电源噪声信号;低通滤波滤除声音信号中频率分量超过采样频率一半的部分;模数变换,采样频率为11025Hz,采样精度为16bits;
3、对于每个完整的语音段,分帧、加窗。帧长为256采样点,帧移为128采样点。窗函数选取汉明窗;
4、特征提取。提取13维MFCC特征;
5、每种声音事件分别利用60个特征向量序列,噪声采用10个特征向量序列,基于期望最大化(EM)算法训练5种声音的GMM模板λxk,k=1,2,…5,以及噪声的模板λn,模板采用8个高斯分量的高斯混合模型。
本发明的模型融合过程如图2所示是本发明基于改进的并行模型组合的声音事件识别方法一实施例中融合方法示意图。
具体步骤如下:
1、采用所述公式(3)(4)(5)(6)将背景噪声模型和十个干净声音事件模型参数谱域变换至线性谱域。
2、采用所述公式(7)(8)分别将十种干净声音事件的的线性谱域参数与噪声的线性谱域参数进行融合,这里g=0.5。
3、将融合后的带噪声音事件模型的线性谱域参数分别经(5)(6)公式的逆变换和(3)(4)的逆变换,得到带噪声音事件的5个GMM模型λyk,k=1,2,…5。
本发明的识别过程如下:
1、在上述两种噪声条件下录制5种带噪声音事件信号共110个。进行预滤波;模数变换,采样频率为11025Hz,采样精度为16bits。
2、分帧、加窗。帧长为256采样点,帧移为128采样点。窗函数选取汉明窗。提取13维MFCC特征。
3、模板匹配。当前声音信号的特征向量序列与5种带噪声音事件模板进行匹配。特征矢量序列为Xk,k=1,…,N,5个模板为λyk,k=1,2,…5。计算匹配似然度,选择获得最大似然度的模板为识别结果。如图3所示是本发明基于改进的并行模型组合的声音事件识别方法一实施例中5种声音事件识别效果示意图。
上述实例只是本发明的举例,尽管为说明目的公开了本发明的实例,但是本领域的技术人员可以理解:在不脱离本发明及所附的权利要求的精神和范围内,各种替换、变化和修改都是可能的。因此,本发明不应局限于该实例的内容。

Claims (7)

1.一种基于改进的并行模型组合的声音事件识别方法,其步骤包括:
1)根据干净声音事件训练得到GMM高斯混合模型,建立干净声音事件模板;
2)根据噪声数据训练得到GMM高斯混合模型,建立噪声模板;
3)对所述噪声模板和所述干净声音事件模板采用并行模型融合的方法,得到带噪声音事件模板;包括以下分步骤:
3‐1)采用离散余弦逆变换将任一模型参数由倒谱域映射到线性谱域,得到对数谱域模型的均值μlog=C-1μ和方差Σlog=C-1Σ(C-1)T,其中,C为离散余弦变换矩阵,μ,Σ分别为模型的倒谱域的均值和方差;
3‐2)将对数谱域模型中的对数谱域均值和方差通过指数函数变换到线性谱域,为线性谱域的均值向量的第i个元素,为线性谱域的协方差矩阵的第i行第j列元素;其中,μi log为对数谱域的均值向量的第i个元素,为对数谱域的协方差矩阵的第i行第j列元素;
3‐3)采用改进的并行模型组合方法,将干净声音事件模型参数与噪声模型参数在线性谱域进行融合,为融合后的带噪声音事件模型在线性谱域的均值,为融合后的带噪声音事件模型在线性谱域的方差,其中μxk lin为干净声音事件模型经所述步骤3‐1)、3‐2)变换后的线性谱域的均值,为干净声音事件模型经所述步骤3‐1)、3‐2)变换后的线性谱域的方差,μnk lin为噪声模型经所述步骤3‐1)、3‐2)变换后的线性谱域的均值,为噪声模型经所述步骤3‐1)、3‐2)变换后的线性谱域的方差;
3‐4)将融合后的带噪声音事件模型的线性谱域模型的均值和方差经过上述步骤3‐2)的逆变换得到对数谱域参数,再经过上述步骤3‐1)逆变换得到倒谱域的模型参数,得到带噪声音事件模型的均值向量和方差;
4)采样得到带噪声音事件样本信号,根据所述带噪声音事件模板中的参数对样本信号进行声音识别。
2.如权利要求1所述的基于改进的并行模型组合的声音事件识别方法,其特征在于,建立干净声音事件的模板的方法如下:
1)在无噪安静室内的环境下录制声音事件的数据,对录制的声音事件进行预滤波、模数变换后再进行分帧、加窗处理;
2)提取MFCC梅尔倒谱系数特征,训练出声音事件的GMM高斯混合模板。
3.如权利要求1所述的基于改进的并行模型组合的声音事件识别方法,其特征在于,所述高斯混合模型采用EM算法训练并更新高斯模型的参数,训练得到的干净声音事件的GMM参数为λx={wxkxkxk},k=1,2…,M,其中,wxk表示干净声音事件模型的混合权重,μxk表示干净声音事件模型的均值,Σxk表示干净声音事件模型的方差,M表示混合高斯的阶数。
4.如权利要求1所述的基于改进的并行模型组合的声音事件识别方法,其特征在于,在室内真实有噪声的环境下获取当前环境中的噪声数据,建立所述噪声模板方法为:提取MFCC特征,建立噪声的GMM模板,得到噪声模板GMM参数为λn={wnknknk},k=1,2…,M,其中,wnk表示噪声模型的混合权重,μnk表示噪声模型的均值,Σnk表示噪声模型的方差,M表示混合高斯的阶数。
5.如权利要求1所述的基于改进的并行模型组合的声音事件识别方法,其特征在于,带噪声音事件模型的参数λy={wykykyk},k=1,2…,M,其中wykykyk分别表示噪声模板的混合权重,均值和方差,其中混合权重没有线性谱域,带噪声音事件模型的混合权重wyk即为干净声音事件模板的权重wxk,M表示混合高斯的阶数。
6.如权利要求1-5任意一项所述的基于改进的并行模型组合的声音事件识别方法,其特征在于,所述噪声数据采用NoiseX-92的babble噪声和/或室内环境下空调噪声。
7.如权利要求1所述的基于改进的并行模型组合的声音事件识别方法,其特征在于,根据所述带噪声音事件模型中的参数对样本信号进行声音识别的方法如下:
1)对所述样本信号进行预滤波、模数变换,再进行分帧、加窗处理后提取多维MFCC特征得到样本信号特征序列;
2)将样本信号的特征向量序列与所述带噪声音事件模型进行匹配,计算匹配似然度,最大似然度的匹配模板为识别结果。
CN201310239724.7A 2013-05-08 2013-06-17 一种基于改进的并行模型组合的声音事件识别方法 Expired - Fee Related CN103310789B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310239724.7A CN103310789B (zh) 2013-05-08 2013-06-17 一种基于改进的并行模型组合的声音事件识别方法

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
CN201310166660 2013-05-08
CN201310166660.2 2013-05-08
CN2013101666602 2013-05-08
CN201310239724.7A CN103310789B (zh) 2013-05-08 2013-06-17 一种基于改进的并行模型组合的声音事件识别方法

Publications (2)

Publication Number Publication Date
CN103310789A CN103310789A (zh) 2013-09-18
CN103310789B true CN103310789B (zh) 2016-04-06

Family

ID=49135932

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310239724.7A Expired - Fee Related CN103310789B (zh) 2013-05-08 2013-06-17 一种基于改进的并行模型组合的声音事件识别方法

Country Status (1)

Country Link
CN (1) CN103310789B (zh)

Families Citing this family (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104485108A (zh) * 2014-11-26 2015-04-01 河海大学 一种基于多说话人模型的噪声与说话人联合补偿方法
CN105657338A (zh) * 2014-12-02 2016-06-08 深圳大学 一种基于互联网的远程移动终端控制***及控制方法
CN104408440B (zh) * 2014-12-10 2017-10-17 重庆邮电大学 一种基于两步降维和并行特征融合的人脸表情识别方法
CN105118516A (zh) * 2015-09-29 2015-12-02 浙江图维电力科技有限公司 基于声音线性预测倒谱系数的工程机械的识别方法
CN105405447B (zh) * 2015-10-27 2019-05-24 航宇救生装备有限公司 一种送话呼吸噪声屏蔽方法
CN107492153B (zh) * 2016-06-07 2020-04-07 腾讯科技(深圳)有限公司 考勤***、方法、考勤服务器及考勤终端
CN106340292B (zh) * 2016-09-08 2019-08-20 河海大学 一种基于连续噪声估计的语音增强方法
CN108922518B (zh) * 2018-07-18 2020-10-23 苏州思必驰信息科技有限公司 语音数据扩增方法和***
CN109273021B (zh) * 2018-08-09 2021-11-30 厦门亿联网络技术股份有限公司 一种基于rnn的实时会议降噪方法及装置
CN109631104A (zh) * 2018-11-01 2019-04-16 广东万和热能科技有限公司 油烟机的风量自动调节方法、装置、设备及存储介质
CN109472311A (zh) * 2018-11-13 2019-03-15 北京物灵智能科技有限公司 一种用户行为识别方法及装置
CN110120230B (zh) * 2019-01-08 2021-06-01 国家计算机网络与信息安全管理中心 一种声学事件检测方法及装置
CN110544469B (zh) * 2019-09-04 2022-04-19 秒针信息技术有限公司 语音识别模型的训练方法及装置、存储介质、电子装置
CN110838306B (zh) * 2019-11-12 2022-05-13 广州视源电子科技股份有限公司 语音信号检测方法、计算机存储介质及相关设备
CN113112681A (zh) * 2020-01-13 2021-07-13 阿里健康信息技术有限公司 售货设备、出货检测方法及装置
CN111028841B (zh) * 2020-03-10 2020-07-07 深圳市友杰智新科技有限公司 唤醒***调节参数的方法、装置、计算机设备和存储介质
CN111711881B (zh) * 2020-06-29 2022-02-18 深圳市科奈信科技有限公司 一种根据环境音自适应音量调节方法及无线耳机
CN112820318A (zh) * 2020-12-31 2021-05-18 西安合谱声学科技有限公司 一种基于gmm-ubm的冲击声模型建立、冲击声检测方法及***

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1397929A (zh) * 2002-07-12 2003-02-19 清华大学 抗噪声语音识别用语音增强-特征加权-对数谱相加方法
US6876966B1 (en) * 2000-10-16 2005-04-05 Microsoft Corporation Pattern recognition training method and apparatus using inserted noise followed by noise reduction
CN1819019A (zh) * 2006-03-13 2006-08-16 华南理工大学 基于矩阵特征向量范数的语音识别装置及其语音识别方法
CN102426837A (zh) * 2011-12-30 2012-04-25 中国农业科学院农业信息研究所 农业现场数据采集的移动设备语音识别的鲁棒性方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4352790B2 (ja) * 2002-10-31 2009-10-28 セイコーエプソン株式会社 音響モデル作成方法および音声認識装置ならびに音声認識装置を有する乗り物

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6876966B1 (en) * 2000-10-16 2005-04-05 Microsoft Corporation Pattern recognition training method and apparatus using inserted noise followed by noise reduction
CN1397929A (zh) * 2002-07-12 2003-02-19 清华大学 抗噪声语音识别用语音增强-特征加权-对数谱相加方法
CN1819019A (zh) * 2006-03-13 2006-08-16 华南理工大学 基于矩阵特征向量范数的语音识别装置及其语音识别方法
CN102426837A (zh) * 2011-12-30 2012-04-25 中国农业科学院农业信息研究所 农业现场数据采集的移动设备语音识别的鲁棒性方法

Also Published As

Publication number Publication date
CN103310789A (zh) 2013-09-18

Similar Documents

Publication Publication Date Title
CN103310789B (zh) 一种基于改进的并行模型组合的声音事件识别方法
CN103280220B (zh) 一种实时的婴儿啼哭声识别方法
Lee et al. Automatic recognition of animal vocalizations using averaged MFCC and linear discriminant analysis
CN103177722B (zh) 一种基于音色相似度的歌曲检索方法
CN103117059B (zh) 一种基于张量分解的语音信号特征提取方法
CN108922541B (zh) 基于dtw和gmm模型的多维特征参数声纹识别方法
WO2019019252A1 (zh) 声学模型训练方法、语音识别方法、装置、设备及介质
CN102968990B (zh) 说话人识别方法和***
CN104900229A (zh) 一种语音信号混合特征参数的提取方法
CN102436809B (zh) 英语口语机考***中网络语音识别方法
CN103345923A (zh) 一种基于稀疏表示的短语音说话人识别方法
CN103065629A (zh) 一种仿人机器人的语音识别***
CN101923855A (zh) 文本无关的声纹识别***
CN104078039A (zh) 基于隐马尔科夫模型的家用服务机器人语音识别***
CN109949823A (zh) 一种基于dwpt-mfcc与gmm的车内异响识别方法
CN104900235A (zh) 基于基音周期混合特征参数的声纹识别方法
CN109256144A (zh) 基于集成学习与噪声感知训练的语音增强方法
CN111341319B (zh) 一种基于局部纹理特征的音频场景识别方法及***
CN102789779A (zh) 一种语音识别***及其识别方法
CN104795064A (zh) 低信噪比声场景下声音事件的识别方法
CN109192200A (zh) 一种语音识别方法
CN104887263A (zh) 一种基于心音多维特征提取的身份识别算法及其***
CN105845149A (zh) 声音信号中主音高的获取方法及***
CN103456302A (zh) 一种基于情感gmm模型权重合成的情感说话人识别方法
Li et al. Multi-level attention model with deep scattering spectrum for acoustic scene classification

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20160406

Termination date: 20170617