CN103533193A - 残留回波消除方法及装置 - Google Patents

残留回波消除方法及装置 Download PDF

Info

Publication number
CN103533193A
CN103533193A CN201210382181.XA CN201210382181A CN103533193A CN 103533193 A CN103533193 A CN 103533193A CN 201210382181 A CN201210382181 A CN 201210382181A CN 103533193 A CN103533193 A CN 103533193A
Authority
CN
China
Prior art keywords
residual echo
user
signal
user voice
mrow
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201210382181.XA
Other languages
English (en)
Other versions
CN103533193B (zh
Inventor
刘冬梅
孙焘
王进军
薛涛
王霞
张琦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
ZTE Corp
Original Assignee
ZTE Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ZTE Corp filed Critical ZTE Corp
Priority to CN201210382181.XA priority Critical patent/CN103533193B/zh
Publication of CN103533193A publication Critical patent/CN103533193A/zh
Application granted granted Critical
Publication of CN103533193B publication Critical patent/CN103533193B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)

Abstract

本发明公开了一种残留回波消除方法及装置。其中,该方法包括:对当前接收到的残留回波信号进行特征提取,得到残留回波向量;获取存储的用户语音模板向量,其中,用户语音模板向量通过对预先录制的用户语音进行语音特征提取得到;判断残留回波向量与用户语音模板向量之间的距离是否大于预先设定向量阈值,在判断结果为是的情况下,确定残留回波信号为非用户信号,并消除非用户信号。通过本发明,达到了能处理由于双端通话、回波路径改变、滤波器阶数不匹配等因素产生的线性残留回波,同时还能处理噪声信号和其他非线性残留回波的效果。

Description

残留回波消除方法及装置
技术领域
本发明涉及通信领域,具体而言,涉及一种残留回波消除方法及装置。
背景技术
随着无线通信技术的飞速发展,人们对话音通信的质量及舒适性提出了更高的要求。其中,舒适自然的免提对话环境正成为人们日益增长的需求。然而回波的存在却影响了通信质量,严重时能够使通信***不能正常工作。
对于回波的抑制,一般采用自适应回波抵消的方法。自适应滤波器通过对声回授通道的冲击响应的辨识,产生出同回声相同的信号,再从近端话音和回声的混合信号中减去回声信号来达到回声对消的目的。它既可以保证对话音质量影响最小,又使得回声得到最大的抑制。自适应回波对消技术的最大特点就是对声回授通道所在的空间(不论内部空间尺寸如何,不论其内部陈设如何,也不论讲话者所处位置)而言,它都会自动地跟踪房间声学特性的变化,最大限度地抑制由声回授引起回声乃至啸叫。然而,在实际应用中需要提前对自适应滤波器的阶数进行设定,只有当通话环境的冲击响应阶数与自适应滤波器的阶数匹配时,自适应滤波算法才能取得很好的效果,否则将出现较大的残留回波信号。同时,通话中常常存在双端通话,回波路径突变等现象,这些都会影响自适应滤波器的收敛性能,导致回波不能有效地得到消除,出现残留回波。另外,由于话筒的过饱和等因素在通话过程中会出现非线性回波信号,而自适应滤波器只能处理线性回波,最终导致输出信号中存在非线性残留回波信号。
残留回波信号的存在使得用户的回波问题并没有真正得到解决,严重影响用户的听觉体验。一般的解决办法是在自适应回波抑制装置之后加入残留回波抑制模块,对自适应滤波器的输出信号进行进一步的处理。
传统的残留回波抑制方法在检测到存在残留回波信号时,通过断开开关来消除残留回波信号。然而,在信噪比较小的情况下残留回波抑制器会出现转换效应,该效应是由于噪声抑制器在应该处理残留回波的时间处理了噪声,使得残留回波抑制器频繁的处于开关状态。转换效应严重影响了用户的听觉感受,找到一种能将噪声和残留回波同时进行处理的其他非线性方法十分必要。
同时,随着手机终端的迅速发展,用户的个性化服务已经成为未来的发展方向。传统的针对手机终端的回波抑制处理并未利用用户的个性化信息。
针对相关技术中移动语音通信中的残留回波问题,目前尚未提出有效的解决方案。
发明内容
本发明提供了一种残留回波消除方法及装置,以至少解决上述问题。
根据本发明的一个方面,提供了一种残留回波消除方法,包括:对当前接收到的残留回波信号进行特征提取,得到残留回波向量;获取存储的用户语音模板向量,其中,用户语音模板向量通过对预先录制的用户语音进行语音特征提取得到;判断残留回波向量与用户语音模板向量之间的距离是否大于预先设定的向量阈值,在判断结果为是的情况下,确定残留回波信号为非用户信号,并消除非用户信号。
优选地,通过以下方式得到用户语音模板向量:通过获取用户语音的第一线性预测系数,建立用户语音的语音高斯混合模型;根据用户语音高斯混合模型计算用户语音模板向量。
优选地,获取用户语音的第一线性预测系数,包括:对用户语音以第一预定采样频率进行采样,得到第一用户语音序列;对第一用户语音序列进行端点检测和重组处理,得到第二用户语音序列;计算第二用户语音序列的第一线性预测系数。
优选地,对当前接收到的残留回波信号进行特征提取,得到残留回波向量,包括:通过获取残留回波信号的第二线性预测系数,建立残留回波信号的信号高斯混合模型;根据信号语音高斯混合模型计算残留回波向量。
优选地,获取残留回波信号的第二线性预测系数,包括:对残留回波信号以第二预定采样频率进行采样,得到第一信号序列;对第第一信号序列进行端点检测和重组处理,得到第二信号序列;计算第二信号序列的第二线性预测系数。
根据本发明的另一方面,提供了一种残留回波消除装置,包括:提取模块,用于对当前接收到的残留回波信号进行特征提取,得到残留回波向量;获取模块,用于获取存储的用户语音模板向量,其中,用户语音模板向量通过对预先录制的用户语音进行语音特征提取得到;判断模块,用于判断残留回波向量与用户语音模板向量之间的距离是否大于预先设定的向量阈值;确定模块,用于在判断模块的判断结果为是的情况下,确定残留回波信号为非用户信号;消除模块,用于消除非用户信号。
优选地,获取模块包括:第一建立模块,用于通过获取用户语音的第一线性预测系数,建立用户语音的语音高斯混合模型;第一计算模块,用于根据用户语音高斯混合模型计算用户语音模板向量;存储模块,用于存储用户语音模板向量。
优选地,第一建立模块包括:第一采样单元,用于对用户语音以第一预定采样频率进行采样,得到第一用户语音序列;第一处理单元,用于对第一用户语音序列进行端点检测和重组处理,得到第二用户语音序列;第一计算单元,用于计算第二用户语音序列的第一线性预测系数。
优选地,提取模块包括:第二建立模块,用于通过获取残留回波信号的第二线性预测系数,建立残留回波信号的信号高斯混合模型;第二计算模块,用于根据信号语音高斯混合模型计算残留回波向量。
优选地,第二建立模块包括:第二采样单元,用于对残留回波信号以第二预定采样频率进行采样,得到第一信号序列;第二处理单元,用于对第第一信号序列进行端点检测和重组处理,得到第二信号序列;第二计算单元,用于计算第二信号序列的第二线性预测系数。
通过本发明,采用预先为用户语音提取语音特征,将接收到的残留回波信号与语音特征作对比以确定是否需要对残留回波进行消除的方式,解决了现有技术无法将噪声和残留回波同时进行处理问题,进而达到了能处理由于双端通话、回波路径改变、滤波器阶数不匹配等因素产生的线性残留回波,同时还能处理噪声信号和其他非线性残留回波,从而避免了传统的残留回波抑制器的转换效应,满足了实际语音通信的需求的效果。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是根据本发明实施例的残留回波消除方法流程图;
图2是根据本发明实施例的残留回波消除装置的结构框图;
图3是根据本发明实施例的优选残留回波消除装置的结构框图;
图4是根据本发明优选实施例一的残留回波消除装置的结构示意图;
图5是根据本发明优选实施例一的残留回波消除装置中的用户语音处理模块的结构示意图;
图6是根据本发明优选实施例一的残留回波消除过程示意图;
图7是根据本发明优选实施例一的残留回波消除装置中的实时处理模块的结构示意图;
图8是根据本发明优选实施例二的残留回波消除装置的结构示意图;
图9是根据本发明优选实施例三的残留回波消除装置的结构示意图;
图10是根据本发明优选实施例三的残留回波消除流程图。
具体实施方式
下文中将参考附图并结合实施例来详细说明本发明。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。
在对本发明实施例进行详细描述之前,对本发明实施例解决其技术问题的思路做一个简要介绍:人与人之间在发音器官上存在着差异,同时说话时发音习惯也有不同,这使得每个人的语音具备独一无二的特点。本发明实施例正是利用这个特点能够分辨出哪些是用户需要的信号,哪些是需要滤除的信号。
图1是根据本发明实施例的残留回波消除方法流程图,如图1所示,该方法流程主要包括以下步骤(步骤S102-步骤S106):
步骤S102,对当前接收到的残留回波信号进行特征提取,得到残留回波向量;
步骤S104,获取存储的用户语音模板向量,其中,用户语音模板向量通过对预先录制的用户语音进行语音特征提取得到;
步骤S106,判断残留回波向量与用户语音模板向量之间的距离是否大于预先设定的向量阈值,在判断结果为是的情况下,确定残留回波信号为非用户信号,并消除非用户信号。
在本实施例的步骤S104中,可以通过以下方式得到用户语音模板向量:获取用户语音的第一线性预测系数,建立用户语音的语音高斯混合模型;根据用户语音高斯混合模型计算用户语音模板向量。
其中,当获取用户语音的第一线性预测系数时,可以通过以下方式来实现:对用户语音以第一预定采样频率进行采样,得到第一用户语音序列;对第一用户语音序列进行端点检测和重组处理,得到第二用户语音序列;计算第二用户语音序列的第一线性预测系数。
在本实施例中,步骤S102可以这样实现:通过获取残留回波信号的第二线性预测系数,建立残留回波信号的信号高斯混合模型;根据信号语音高斯混合模型计算残留回波向量。
其中,当获取残留回波信号的第二线性预测系数时,可以通过以下方式来实现:对残留回波信号以第二预定采样频率进行采样,得到第一信号序列;对第第一信号序列进行端点检测和重组处理,得到第二信号序列;计算第二信号序列的第二线性预测系数。
例如,在实际应用中,上述残留回波消除方法可以这样进行:
(1)在处理残留回波之前建立用户语音模型,建立后存储在终端中作为用户语音帧的模板,该模块录制近端用户的语音,再依次对录制的用户语音进行端点检测、特征提取,最后建立用户语音模型。
(2)实时处理残留回波信号。对当前接收到的残留回波信号进行特征提取,建立信号高斯混合模型。
(3)判断、消除非用户语音帧。通过比较用户语音模型和残留回波信号高斯模型判断残留回波信号的当前帧是否为非用户语音帧,并将非用户语音帧置零,将用户语音帧正常输出。
在进行完三个步骤之后,继续跳转到步骤(2)循环运行。
图2是根据本发明实施例的残留回波消除装置的结构框图,如图2所示,该装置主要包括:提取模块10、获取模块20、判断模块30、确定模块40以及消除模块50。其中,提取模块10,用于对当前接收到的残留回波信号进行特征提取,得到残留回波向量;获取模块20,连接至提取模块10,用于获取存储的用户语音模板向量,其中,用户语音模板向量通过对预先录制的用户语音进行语音特征提取得到;判断模块30,连接至获取模块20,用于判断残留回波向量与用户语音模板向量之间的距离是否大于预先设定的向量阈值;确定模块40,连接至判断模块30,用于在判断模块的判断结果为是的情况下,确定残留回波信号为非用户信号;消除模块50,连接至确定模块40,用于消除非用户信号。
图3是根据本发明实施例的优选残留回波消除装置的结构框图,如图3所示,在该优选残留回波消除装置中,获取模块20可以包括:第一建立模块22,用于通过获取用户语音的第一线性预测系数,建立用户语音的语音高斯混合模型;第一计算模块24,连接至第一建立模块22,用于根据用户语音高斯混合模型计算用户语音模板向量;存储模块26,连接至第一计算模块24,用于存储用户语音模板向量。
其中,第一建立模块22可以包括:第一采样单元222,用于对用户语音以第一预定采样频率进行采样,得到第一用户语音序列;第一处理单元224,连接至第一采样单元222,用于对第一用户语音序列进行端点检测和重组处理,得到第二用户语音序列;第一计算单元226,连接至第一处理单元224,用于计算第二用户语音序列的第一线性预测系数。
在该优选残留回波消除装置中,提取模块10可以包括:第二建立模块12,用于通过获取残留回波信号的第二线性预测系数,建立残留回波信号的信号高斯混合模型;第二计算模块14,连接至第二建立模块12,用于根据信号语音高斯混合模型计算残留回波向量。
其中,第二建立模块12可以包括:第二采样单元122,用于对残留回波信号以第二预定采样频率进行采样,得到第一信号序列;第二处理单元124,连接至第二采样单元122,用于对第第一信号序列进行端点检测和重组处理,得到第二信号序列;第二计算单元126,连接至第二处理单元124,用于计算第二信号序列的第二线性预测系数。
对于上述的优选残留回波消除装置的结构而言,在实际应用中,不必局限于该结构,例如,也可以采用如下优选实施例一、优选实施例二和优选实施例三的结构来实现上述实施例提供的残留回波消除方法。
下面结合图4至图10以及优选实施例一、优选实施例二和优选实施例三对上述实施例提供的残留回波消除方法及残留回波消除装置进行详细说明。
实施例一
图4是根据本发明优选实施例一的残留回波消除装置的结构示意图,如图1所示,该装置包括:用户语音处理模块,实时处理模块,和判决输出模块。在实际应用中,用户语音处理模块首先录制近端用户的语音依次进行端点检测,特征提取,最后建立高斯模型。用户语音处理模块的结构如图5所示,录制语音长度一般取50-60s,以8000Hz采样后得到用户语音序列f(n)。由于得到的语音序列不完全是语音帧,还存在说话的停顿间隔,所以需要对其进行端点检测和重组处理。端点检测模块将f(n)分成K帧fi(i=1,2,…K),帧长为L(本实施例中L取256),根据规则1和规则计算帧能量:
energyi=∑Lf2 i,[规则1],
energylevel 1 = max ( energy i ) + T N energylevel 2 = max ( energy i ) + T L , [规则2],其中,max()代表取K帧中能量最大的值,TN、TL分别为语音能量门限(TN<TL<0),在本实施例中,TN、TL的取值分别为:-30,-20。
找到首个energyi>energylevel2的帧号M1,从该点向后判断,设当判断至i=M2时出现energyi+1>energyi,则帧编号为M1~M2的帧为一段语音段,M2+1即为下一语音段的开始帧M3,以此可依次找出M4...Mj
为了更加精确的找到语音的起止点,需要进一步的判断。当
Figure BDA00002238736500061
时,根据规则3进行计算帧的起始位置:
Figure BDA00002238736500062
[规则3],
最后可得出只含有用户语音的序列
Figure BDA00002238736500063
图5是根据本发明优选实施例一的残留回波消除装置中的用户语音处理模块的结构示意图,如图5所示,处理后的用户语音序列f'(n)输入语音特征提取模块进行特征提取处理(特征提取就是对语音信号进行分析处理,获得语音信号中表征人的基本特征的信息),由于语音信号采样点之间存在相关性,可以用过去的若干采样点或者它们的线性组合预测现在或将来的样点值,这里是通过使实际语音采样值和线性预测采样值之间的均方误差最小得到一组唯一的线性预测系数(Linear Predictive Coding,简称为LPC),可以利用Levinson-Durbin算法求解近端用户语音的LPC系数。
将f'(n)分成K1帧fi'(i=1,2,…K1),帧长为L1,本实施例中L1取64,设线性预测系数的阶数为P,则第i帧的LPC系数可根据规则4递推求得:
a m ( m ) = - R f &prime; f &prime; ( m ) + r bt m - 1 a m - 1 E m - 1
am(k)=am-1(k)+am(m)am-1(m-k)    [规则4],
Em=Em-1[1-am 2(m)]
E0=Rf'f'(0)
其中,列矢量am为第m阶预测系数,Rf'f'是每帧语音序列的自相关系数,rbt m-1=[Rf'f'(m-1),Rf'f'(m-2),...,Rf'f'(1)],k=1,2,…,m-1,m=1,2,…,P,本实施例中的LPC阶数P=19。
设提取的近端用户的语音特征向量为Φuser,则
&Phi; user = [ a p 1 , a p 2 , . . . , a PK 1 ] , [规则5]
Φiuser=api,[规则6]
其中,api代表第i帧语音信号阶数为P的LPC系数,Φuser为19×K1阶矩阵。
将线性预测系数输入模型建立模块进行模型建立。
M阶高斯混合模型为:
q(Φi useruser)=[a1p1(Φ iuser),...,ajpji user),...,aMpMi user)]T,[规则7]
其中, &Sigma; j = 1 M a j = 1 , p j ( &Phi; i user ) = 1 ( 2 &pi; ) D 2 | &Sigma; j | 1 2 exp { - 1 2 ( &Phi; i user - m j ) T ( &Sigma; j ) - 1 ( &Phi; i user - m j ) } , λuser={aj,mj,∑j},j=1,...,M。λuser是近端用户高斯混合量的特征集合,aj是第j阶高斯混合量的权重,mj、∑j分别代表对应的均值和方差向量,D是向量Φi user的维数。q(Φi useruser)为用户语音的模板向量,它是M×1阶矩阵。
设模型的初始协方差矩阵∑j0为单位矩阵,初始权重aj0=1/M,均值向量μj0的数值为随机数,则λuser可由EM迭代算法求得:
p ( j | &Phi; i user ) = a j p j ( &Phi; i user ) &Sigma; j = 1 M a j p j ( &Phi; i user ) , j=1,2,…,M;i=1,2,…,K1;[规则8],
m j = 1 a j P &Sigma; k = 1 K 1 p ( j | &Phi; k user ) &Phi; k user
&Sigma; j = 1 a j P 2 &Sigma; k = 1 K 1 p ( j | &Phi; k user ) &Phi; k user ( &Phi; k user ) T , [规则9],
a j = 1 P &Sigma; k = 1 K 1 p ( j | &Phi; k user )
其中, p j ( &Phi; i user ) = 1 ( 2 &pi; ) D 2 | &Sigma; j | 1 2 exp { - 1 2 ( &Phi; i user - m j ) T ( &Sigma; j ) - 1 ( &Phi; i user - m j ) } .
由此得到λuser={aj,mj,∑j},j=1,...,M,不断迭代直至迭代前后的参数集 ( | a j - a &prime; j | 2 + | m j - m &prime; j | 2 + | &Sigma; j - &Sigma; &prime; j | 2 ) 1 2 < &epsiv; 停止迭代,一般ε=10-5
通过以上步骤可以得到用户语音的模板向量,而用户语音的每一帧对应一个M阶的模板向量,则K1帧信号得到的模板向量组成M×K1阶矩阵。对此矩阵的行向量值取平均得到高斯混合阶数相同时的模板向量的平均值q(Φa useruser),该值即为需要存储的模板向量。存储的模板向量将在后续步骤中与残留回波的测量向量进行比较,从而判断是否为用户语音帧。
图6是根据本发明优选实施例一的残留回波消除过程示意图,如图6所示,获得实时测量值的方法如下:在工作状态下,自适应滤波器的输出e(n)中存在大量的残留回波,此时可以将e(n)信号输入到残留回波抑制模块进行实时处理,此时请同时参考图4,残留回波信号首先进入实时处理模块进行处理。
实时处理模块对输入信号进行特征提取,建立模型后计算测量值,该模块的结构图请同时参考图7(图7是根据本发明优选实施例一的残留回波消除装置中的实时处理模块的结构示意图),语音特征提取模块采用与用户语音提取中的模块相同的方法和参数对每一帧残留回波信号进行特征提取,设第i帧得到特征向量Φi,测量向量计算模块将特征向量带入高斯混合模型可得到测量向量q(Φiuser)。
模板向量和测量向量最终输入判决输出模块进行判决,利用向量之间的距离设置门限判别是否为用户语音帧:
&Lambda; i = | | q ( &Phi; i | &lambda; user ) - q ( &Phi; a user | &lambda; user ) | | | | q ( &Phi; a user | &lambda; user ) | | , [规则10]
其中,||||表示计算向量的2范数。如果Λi>Threshold判为非近端语音帧,反之为近端语音帧,判为非近端语音帧时,将该帧信号置零以消除回波,Threshold一般取0.1~0.3。
实施例二
通常,最佳判决门限Threshold会随着回波信号发生改变,而回波信号由远端信号产生。图8是根据本发明优选实施例二的残留回波消除装置的结构示意图,如图8所示,门限计算模块首先判断是否有远端语音信号x(n),当远端语音信号较大时即对最佳判决门限影响较大时,启动门限估计。此时随机取第K帧远端信号x(n)带入高斯混合模型中得到远端语音的向量q(Φk faruser),并利用下式对判决门限进行估计。
根据规则11进行能量判决:
Figure BDA00002238736500082
[规则11],其中,Threshold1为远端语音能量门限,N1为滑动窗口的长度,一般取值范围为(100,300),M1=M1+S1,S1为滑动窗滑动长度,一般取取值范围为(50,150)。当[规则11]成立时,根据规则12进行门限估计:
Threshold &prime; = G * | | q ( &Phi; i | &lambda; user ) - q ( &Phi; k far | &lambda; user ) | | | | q ( &Phi; k far | &lambda; user ) | | , [规则12],其中,Threshold'为估计的判决门限,G为门限增益,一般取值范围为(3,5)。
实施例三
在本实施例中,残留回波抑制模块是否工作将取决于语音信号中残留回波的大小。图9是根据本发明优选实施例三的残留回波消除装置的结构示意图,如图9所示,能量与相关性判决模块中,当远端语音比较大时认为此时的回波信号也比较大,此时计算远端语音和自适应滤波器输出信号的相关性,当相关性值大于阈值时,启动残留回波抑制模块,工作流程如图10所示(图10是根据本发明优选实施例三的残留回波消除流程图),根据规则13进行能量判决:
[规则13],其中,Threshold2为远端语音能量门限,N2为滑动窗口的长度,一般取值范围为(100,300),M2=M2+S2,S2为滑动窗滑动长度,一般取取值范围为(50,150)。
当能量超过阈值时,根据规则14计算相关性:
r = n &Sigma; i = 1 n x ( i ) e ( i ) - &Sigma; i = 1 n x ( i ) &CenterDot; &Sigma; i = 1 n e ( i ) n &Sigma; i = 1 n x 2 ( i ) - ( &Sigma; i = 1 n x ( i ) ) 2 &CenterDot; n &Sigma; i = 1 n e 2 ( i ) - ( &Sigma; i = 1 n e ( i ) ) 2 , [规则14],
其中,n为帧长,此处n取256。当r>Threshold2时启动残留回波抑制模块。
本发明实施例从最直接的用户通话需求出发,对用户的语音通话质量进行个性化处理,将非用户语音的其他信号(包括线性残留回波、非线性回波、噪声)作为非有利信号全部消除,只保留用户的语音。
本发明实施例首先对终端用户的语音信号进行处理,计算其线性预测系数。由于线性预测系数能够有效地区分不同的说话人,且对同一说话人的变化保持相对稳定,所以可以以它作为用户的语音特征进行建模。再利用用户的语音特征建立高斯混合模型,最终得出用户语音的模板向量进行存储。高斯混合模型的本质是一个多维概率密度函数,可以用多个高斯分布概率密度函数的加权组合来描述矢量在概率空间的分布情况。利用高斯混合模型能有效地将语音特征聚类,得到语音在特征空间中的表示。当自适应滤波器的输出存在大量的残留回波时,对其进行同样的特征提取和模型建立,找到残留回波在特征空间中的表示,当残留回波的向量与用户语音的模板向量的距离小于所设定的阈值时,判为用户语音帧,否则判为非用户语音帧进行消除。由于处理过程中未区分噪声信号、线性残留回波信号、非线性回波信号,而是将它们都被判为非近端语音帧进行处理,所以有效地避免了传统方法的转换效应。
从以上的描述中,可以看出,本发明实现了如下技术效果:预先为用户语音提取语音特征,将接收到的残留回波信号与语音特征作对比以确定是否需要对残留回波进行消除,解决了现有技术无法将噪声和残留回波同时进行处理问题,进而达到了能处理由于双端通话、回波路径改变、滤波器阶数不匹配等因素产生的线性残留回波,同时还能处理噪声信号和其他非线性残留回波,从而避免了传统的残留回波抑制器的转换效应,满足了实际语音通信的需求的效果。
显然,本领域的技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,并且在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件结合。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种残留回波消除方法,其特征在于,包括:
对当前接收到的残留回波信号进行特征提取,得到残留回波向量;
获取存储的用户语音模板向量,其中,所述用户语音模板向量通过对预先录制的用户语音进行语音特征提取得到;
判断所述残留回波向量与所述用户语音模板向量之间的距离是否大于预先设定的向量阈值,在判断结果为是的情况下,确定所述残留回波信号为非用户信号,并消除所述非用户信号。
2.根据权利要求1所述的方法,其特征在于,通过以下方式得到所述用户语音模板向量:
通过获取所述用户语音的第一线性预测系数,建立所述用户语音的语音高斯混合模型;
根据所述用户语音高斯混合模型计算所述用户语音模板向量。
3.根据权利要求2所述的方法,其特征在于,获取所述用户语音的第一线性预测系数,包括:
对所述用户语音以第一预定采样频率进行采样,得到第一用户语音序列;
对所述第一用户语音序列进行端点检测和重组处理,得到第二用户语音序列;
计算所述第二用户语音序列的所述第一线性预测系数。
4.根据权利要求1至3中任一项所述的方法,其特征在于,对当前接收到的残留回波信号进行特征提取,得到残留回波向量,包括:
通过获取所述残留回波信号的第二线性预测系数,建立所述残留回波信号的信号高斯混合模型;
根据所述信号语音高斯混合模型计算所述残留回波向量。
5.根据权利要求4所述的方法,其特征在于,获取所述残留回波信号的第二线性预测系数,包括:
对所述残留回波信号以第二预定采样频率进行采样,得到第一信号序列;
对所述第第一信号序列进行端点检测和重组处理,得到第二信号序列;
计算所述第二信号序列的所述第二线性预测系数。
6.一种残留回波消除装置,其特征在于,包括:
提取模块,用于对当前接收到的残留回波信号进行特征提取,得到残留回波向量;
获取模块,用于获取存储的用户语音模板向量,其中,所述用户语音模板向量通过对预先录制的用户语音进行语音特征提取得到;
判断模块,用于判断所述残留回波向量与所述用户语音模板向量之间的距离是否大于预先设定的向量阈值;
确定模块,用于在所述判断模块的判断结果为是的情况下,确定所述残留回波信号为非用户信号;
消除模块,用于消除所述非用户信号。
7.根据权利要求6所述的装置,其特征在于,所述获取模块包括:
第一建立模块,用于通过获取所述用户语音的第一线性预测系数,建立所述用户语音的语音高斯混合模型;
第一计算模块,用于根据所述用户语音高斯混合模型计算所述用户语音模板向量;
存储模块,用于存储所述用户语音模板向量。
8.根据权利要求7所述的装置,其特征在于,所述第一建立模块包括:
第一采样单元,用于对所述用户语音以第一预定采样频率进行采样,得到第一用户语音序列;
第一处理单元,用于对所述第一用户语音序列进行端点检测和重组处理,得到第二用户语音序列;
第一计算单元,用于计算所述第二用户语音序列的所述第一线性预测系数。
9.根据权利要求6至8中任一项所述的装置,其特征在于,所述提取模块包括:
第二建立模块,用于通过获取所述残留回波信号的第二线性预测系数,建立所述残留回波信号的信号高斯混合模型;
第二计算模块,用于根据所述信号语音高斯混合模型计算所述残留回波向量。
10.根据权利要求9所述的装置,其特征在于,所述第二建立模块包括:
第二采样单元,用于对所述残留回波信号以第二预定采样频率进行采样,得到第一信号序列;
第二处理单元,用于对所述第第一信号序列进行端点检测和重组处理,得到第二信号序列;
第二计算单元,用于计算所述第二信号序列的所述第二线性预测系数。
CN201210382181.XA 2012-07-04 2012-10-10 残留回波消除方法及装置 Active CN103533193B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210382181.XA CN103533193B (zh) 2012-07-04 2012-10-10 残留回波消除方法及装置

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
CN201210229032.X 2012-07-04
CN201210229032X 2012-07-04
CN201210229032 2012-07-04
CN201210382181.XA CN103533193B (zh) 2012-07-04 2012-10-10 残留回波消除方法及装置

Publications (2)

Publication Number Publication Date
CN103533193A true CN103533193A (zh) 2014-01-22
CN103533193B CN103533193B (zh) 2016-07-06

Family

ID=49934848

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210382181.XA Active CN103533193B (zh) 2012-07-04 2012-10-10 残留回波消除方法及装置

Country Status (1)

Country Link
CN (1) CN103533193B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109087661A (zh) * 2018-10-23 2018-12-25 南昌努比亚技术有限公司 语音处理方法、装置、***及可读存储介质
CN112185388A (zh) * 2020-09-14 2021-01-05 北京小米松果电子有限公司 语音识别方法、装置、设备及计算机可读存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5761318A (en) * 1995-09-26 1998-06-02 Nippon Telegraph And Telephone Corporation Method and apparatus for multi-channel acoustic echo cancellation
US6226380B1 (en) * 1998-02-19 2001-05-01 Nortel Networks Limited Method of distinguishing between echo path change and double talk conditions in an echo canceller
CN1491018A (zh) * 2002-10-14 2004-04-21 中国科学院声学研究所 一种对话交互前端的回声消除和语音检测方法及装置
CN1780165A (zh) * 2004-11-23 2006-05-31 华为技术有限公司 一种回声消除装置和方法
CN1890948A (zh) * 2003-12-12 2007-01-03 摩托罗拉公司 双向通话活动检测器以及用于回波抵消器电路的方法
CN1917386A (zh) * 2006-09-05 2007-02-21 华为技术有限公司 一种回波抵消中双讲状态的检测方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5761318A (en) * 1995-09-26 1998-06-02 Nippon Telegraph And Telephone Corporation Method and apparatus for multi-channel acoustic echo cancellation
US6226380B1 (en) * 1998-02-19 2001-05-01 Nortel Networks Limited Method of distinguishing between echo path change and double talk conditions in an echo canceller
CN1491018A (zh) * 2002-10-14 2004-04-21 中国科学院声学研究所 一种对话交互前端的回声消除和语音检测方法及装置
CN1890948A (zh) * 2003-12-12 2007-01-03 摩托罗拉公司 双向通话活动检测器以及用于回波抵消器电路的方法
CN1780165A (zh) * 2004-11-23 2006-05-31 华为技术有限公司 一种回声消除装置和方法
CN1917386A (zh) * 2006-09-05 2007-02-21 华为技术有限公司 一种回波抵消中双讲状态的检测方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109087661A (zh) * 2018-10-23 2018-12-25 南昌努比亚技术有限公司 语音处理方法、装置、***及可读存储介质
CN112185388A (zh) * 2020-09-14 2021-01-05 北京小米松果电子有限公司 语音识别方法、装置、设备及计算机可读存储介质
CN112185388B (zh) * 2020-09-14 2024-04-09 北京小米松果电子有限公司 语音识别方法、装置、设备及计算机可读存储介质

Also Published As

Publication number Publication date
CN103533193B (zh) 2016-07-06

Similar Documents

Publication Publication Date Title
US9343056B1 (en) Wind noise detection and suppression
JP6291501B2 (ja) 音響エコー除去のためのシステムおよび方法
EP2237271B1 (en) Method for determining a signal component for reducing noise in an input signal
US9966067B2 (en) Audio noise estimation and audio noise reduction using multiple microphones
JP4954334B2 (ja) エコー抑制のためのフィルタ係数を演算する装置および方法
US8594320B2 (en) Hybrid echo and noise suppression method and device in a multi-channel audio signal
EP1855456B1 (en) Echo reduction in time-variant systems
EP2221983B1 (en) Acoustic echo cancellation
US9100756B2 (en) Microphone occlusion detector
US20120123772A1 (en) System and Method for Multi-Channel Noise Suppression Based on Closed-Form Solutions and Estimation of Time-Varying Complex Statistics
JP2014502074A (ja) 後期残響成分のモデリングを含むエコー抑制
CN110853664A (zh) 评估语音增强算法性能的方法及装置、电子设备
TW200913630A (en) Double talk detection method based on spectral acoustic properties
CN109273019B (zh) 用于回声抑制的双重通话检测的方法及回声抑制
EP2201563A1 (en) Multiple microphone voice activity detector
CN101820302B (zh) 一种回声消除装置
JP2003500936A (ja) エコー抑止システムにおけるニアエンド音声信号の改善
CN110995951B (zh) 基于双端发声检测的回声消除方法、装置及***
US20120158401A1 (en) Music detection using spectral peak analysis
CN106033673B (zh) 一种近端语音信号检测方法及装置
Gil-Cacho et al. Transform domain prediction error method for improved acoustic echo and feedback cancellation
CN110956975A (zh) 回声消除方法及装置
WO2002056302A2 (en) Noise reduction apparatus and method
CN112259112A (zh) 一种结合声纹识别和深度学习的回声消除方法
CN113593599A (zh) 一种去除语音信号中噪声信号的方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant