CN103533193A

CN103533193A - 残留回波消除方法及装置

Info

Publication number: CN103533193A
Application number: CN201210382181.XA
Authority: CN
Inventors: 刘冬梅; 孙焘; 王进军; 薛涛; 王霞; 张琦
Original assignee: ZTE Corp
Current assignee: ZTE Corp
Priority date: 2012-07-04
Filing date: 2012-10-10
Publication date: 2014-01-22
Anticipated expiration: 2032-10-10
Also published as: CN103533193B

Abstract

本发明公开了一种残留回波消除方法及装置。其中，该方法包括：对当前接收到的残留回波信号进行特征提取，得到残留回波向量；获取存储的用户语音模板向量，其中，用户语音模板向量通过对预先录制的用户语音进行语音特征提取得到；判断残留回波向量与用户语音模板向量之间的距离是否大于预先设定向量阈值，在判断结果为是的情况下，确定残留回波信号为非用户信号，并消除非用户信号。通过本发明，达到了能处理由于双端通话、回波路径改变、滤波器阶数不匹配等因素产生的线性残留回波，同时还能处理噪声信号和其他非线性残留回波的效果。

Description

残留回波消除方法及装置

技术领域

本发明涉及通信领域，具体而言，涉及一种残留回波消除方法及装置。

背景技术

随着无线通信技术的飞速发展，人们对话音通信的质量及舒适性提出了更高的要求。其中，舒适自然的免提对话环境正成为人们日益增长的需求。然而回波的存在却影响了通信质量，严重时能够使通信***不能正常工作。

对于回波的抑制，一般采用自适应回波抵消的方法。自适应滤波器通过对声回授通道的冲击响应的辨识，产生出同回声相同的信号，再从近端话音和回声的混合信号中减去回声信号来达到回声对消的目的。它既可以保证对话音质量影响最小，又使得回声得到最大的抑制。自适应回波对消技术的最大特点就是对声回授通道所在的空间（不论内部空间尺寸如何，不论其内部陈设如何，也不论讲话者所处位置）而言，它都会自动地跟踪房间声学特性的变化，最大限度地抑制由声回授引起回声乃至啸叫。然而，在实际应用中需要提前对自适应滤波器的阶数进行设定，只有当通话环境的冲击响应阶数与自适应滤波器的阶数匹配时，自适应滤波算法才能取得很好的效果，否则将出现较大的残留回波信号。同时，通话中常常存在双端通话，回波路径突变等现象，这些都会影响自适应滤波器的收敛性能，导致回波不能有效地得到消除，出现残留回波。另外，由于话筒的过饱和等因素在通话过程中会出现非线性回波信号，而自适应滤波器只能处理线性回波，最终导致输出信号中存在非线性残留回波信号。

残留回波信号的存在使得用户的回波问题并没有真正得到解决，严重影响用户的听觉体验。一般的解决办法是在自适应回波抑制装置之后加入残留回波抑制模块，对自适应滤波器的输出信号进行进一步的处理。

传统的残留回波抑制方法在检测到存在残留回波信号时，通过断开开关来消除残留回波信号。然而，在信噪比较小的情况下残留回波抑制器会出现转换效应，该效应是由于噪声抑制器在应该处理残留回波的时间处理了噪声，使得残留回波抑制器频繁的处于开关状态。转换效应严重影响了用户的听觉感受，找到一种能将噪声和残留回波同时进行处理的其他非线性方法十分必要。

同时，随着手机终端的迅速发展，用户的个性化服务已经成为未来的发展方向。传统的针对手机终端的回波抑制处理并未利用用户的个性化信息。

针对相关技术中移动语音通信中的残留回波问题，目前尚未提出有效的解决方案。

发明内容

本发明提供了一种残留回波消除方法及装置，以至少解决上述问题。

根据本发明的一个方面，提供了一种残留回波消除方法，包括：对当前接收到的残留回波信号进行特征提取，得到残留回波向量；获取存储的用户语音模板向量，其中，用户语音模板向量通过对预先录制的用户语音进行语音特征提取得到；判断残留回波向量与用户语音模板向量之间的距离是否大于预先设定的向量阈值，在判断结果为是的情况下，确定残留回波信号为非用户信号，并消除非用户信号。

优选地，通过以下方式得到用户语音模板向量：通过获取用户语音的第一线性预测系数，建立用户语音的语音高斯混合模型；根据用户语音高斯混合模型计算用户语音模板向量。

优选地，获取用户语音的第一线性预测系数，包括：对用户语音以第一预定采样频率进行采样，得到第一用户语音序列；对第一用户语音序列进行端点检测和重组处理，得到第二用户语音序列；计算第二用户语音序列的第一线性预测系数。

优选地，对当前接收到的残留回波信号进行特征提取，得到残留回波向量，包括：通过获取残留回波信号的第二线性预测系数，建立残留回波信号的信号高斯混合模型；根据信号语音高斯混合模型计算残留回波向量。

优选地，获取残留回波信号的第二线性预测系数，包括：对残留回波信号以第二预定采样频率进行采样，得到第一信号序列；对第第一信号序列进行端点检测和重组处理，得到第二信号序列；计算第二信号序列的第二线性预测系数。

根据本发明的另一方面，提供了一种残留回波消除装置，包括：提取模块，用于对当前接收到的残留回波信号进行特征提取，得到残留回波向量；获取模块，用于获取存储的用户语音模板向量，其中，用户语音模板向量通过对预先录制的用户语音进行语音特征提取得到；判断模块，用于判断残留回波向量与用户语音模板向量之间的距离是否大于预先设定的向量阈值；确定模块，用于在判断模块的判断结果为是的情况下，确定残留回波信号为非用户信号；消除模块，用于消除非用户信号。

优选地，获取模块包括：第一建立模块，用于通过获取用户语音的第一线性预测系数，建立用户语音的语音高斯混合模型；第一计算模块，用于根据用户语音高斯混合模型计算用户语音模板向量；存储模块，用于存储用户语音模板向量。

优选地，第一建立模块包括：第一采样单元，用于对用户语音以第一预定采样频率进行采样，得到第一用户语音序列；第一处理单元，用于对第一用户语音序列进行端点检测和重组处理，得到第二用户语音序列；第一计算单元，用于计算第二用户语音序列的第一线性预测系数。

优选地，提取模块包括：第二建立模块，用于通过获取残留回波信号的第二线性预测系数，建立残留回波信号的信号高斯混合模型；第二计算模块，用于根据信号语音高斯混合模型计算残留回波向量。

优选地，第二建立模块包括：第二采样单元，用于对残留回波信号以第二预定采样频率进行采样，得到第一信号序列；第二处理单元，用于对第第一信号序列进行端点检测和重组处理，得到第二信号序列；第二计算单元，用于计算第二信号序列的第二线性预测系数。

通过本发明，采用预先为用户语音提取语音特征，将接收到的残留回波信号与语音特征作对比以确定是否需要对残留回波进行消除的方式，解决了现有技术无法将噪声和残留回波同时进行处理问题，进而达到了能处理由于双端通话、回波路径改变、滤波器阶数不匹配等因素产生的线性残留回波，同时还能处理噪声信号和其他非线性残留回波，从而避免了传统的残留回波抑制器的转换效应，满足了实际语音通信的需求的效果。

附图说明

此处所说明的附图用来提供对本发明的进一步理解，构成本申请的一部分，本发明的示意性实施例及其说明用于解释本发明，并不构成对本发明的不当限定。在附图中：

图1是根据本发明实施例的残留回波消除方法流程图；

图2是根据本发明实施例的残留回波消除装置的结构框图；

图3是根据本发明实施例的优选残留回波消除装置的结构框图；

图4是根据本发明优选实施例一的残留回波消除装置的结构示意图；

图5是根据本发明优选实施例一的残留回波消除装置中的用户语音处理模块的结构示意图；

图6是根据本发明优选实施例一的残留回波消除过程示意图；

图7是根据本发明优选实施例一的残留回波消除装置中的实时处理模块的结构示意图；

图8是根据本发明优选实施例二的残留回波消除装置的结构示意图；

图9是根据本发明优选实施例三的残留回波消除装置的结构示意图；

图10是根据本发明优选实施例三的残留回波消除流程图。

具体实施方式

下文中将参考附图并结合实施例来详细说明本发明。需要说明的是，在不冲突的情况下，本申请中的实施例及实施例中的特征可以相互组合。

在对本发明实施例进行详细描述之前，对本发明实施例解决其技术问题的思路做一个简要介绍：人与人之间在发音器官上存在着差异，同时说话时发音习惯也有不同，这使得每个人的语音具备独一无二的特点。本发明实施例正是利用这个特点能够分辨出哪些是用户需要的信号，哪些是需要滤除的信号。

图1是根据本发明实施例的残留回波消除方法流程图，如图1所示，该方法流程主要包括以下步骤（步骤S102-步骤S106）：

步骤S102，对当前接收到的残留回波信号进行特征提取，得到残留回波向量；

步骤S104，获取存储的用户语音模板向量，其中，用户语音模板向量通过对预先录制的用户语音进行语音特征提取得到；

步骤S106，判断残留回波向量与用户语音模板向量之间的距离是否大于预先设定的向量阈值，在判断结果为是的情况下，确定残留回波信号为非用户信号，并消除非用户信号。

在本实施例的步骤S104中，可以通过以下方式得到用户语音模板向量：获取用户语音的第一线性预测系数，建立用户语音的语音高斯混合模型；根据用户语音高斯混合模型计算用户语音模板向量。

其中，当获取用户语音的第一线性预测系数时，可以通过以下方式来实现：对用户语音以第一预定采样频率进行采样，得到第一用户语音序列；对第一用户语音序列进行端点检测和重组处理，得到第二用户语音序列；计算第二用户语音序列的第一线性预测系数。

在本实施例中，步骤S102可以这样实现：通过获取残留回波信号的第二线性预测系数，建立残留回波信号的信号高斯混合模型；根据信号语音高斯混合模型计算残留回波向量。

其中，当获取残留回波信号的第二线性预测系数时，可以通过以下方式来实现：对残留回波信号以第二预定采样频率进行采样，得到第一信号序列；对第第一信号序列进行端点检测和重组处理，得到第二信号序列；计算第二信号序列的第二线性预测系数。

例如，在实际应用中，上述残留回波消除方法可以这样进行：

（1）在处理残留回波之前建立用户语音模型，建立后存储在终端中作为用户语音帧的模板，该模块录制近端用户的语音，再依次对录制的用户语音进行端点检测、特征提取，最后建立用户语音模型。

（2）实时处理残留回波信号。对当前接收到的残留回波信号进行特征提取，建立信号高斯混合模型。

（3）判断、消除非用户语音帧。通过比较用户语音模型和残留回波信号高斯模型判断残留回波信号的当前帧是否为非用户语音帧，并将非用户语音帧置零，将用户语音帧正常输出。

在进行完三个步骤之后，继续跳转到步骤（2）循环运行。

图2是根据本发明实施例的残留回波消除装置的结构框图，如图2所示，该装置主要包括：提取模块10、获取模块20、判断模块30、确定模块40以及消除模块50。其中，提取模块10，用于对当前接收到的残留回波信号进行特征提取，得到残留回波向量；获取模块20，连接至提取模块10，用于获取存储的用户语音模板向量，其中，用户语音模板向量通过对预先录制的用户语音进行语音特征提取得到；判断模块30，连接至获取模块20，用于判断残留回波向量与用户语音模板向量之间的距离是否大于预先设定的向量阈值；确定模块40，连接至判断模块30，用于在判断模块的判断结果为是的情况下，确定残留回波信号为非用户信号；消除模块50，连接至确定模块40，用于消除非用户信号。

图3是根据本发明实施例的优选残留回波消除装置的结构框图，如图3所示，在该优选残留回波消除装置中，获取模块20可以包括：第一建立模块22，用于通过获取用户语音的第一线性预测系数，建立用户语音的语音高斯混合模型；第一计算模块24，连接至第一建立模块22，用于根据用户语音高斯混合模型计算用户语音模板向量；存储模块26，连接至第一计算模块24，用于存储用户语音模板向量。

其中，第一建立模块22可以包括：第一采样单元222，用于对用户语音以第一预定采样频率进行采样，得到第一用户语音序列；第一处理单元224，连接至第一采样单元222，用于对第一用户语音序列进行端点检测和重组处理，得到第二用户语音序列；第一计算单元226，连接至第一处理单元224，用于计算第二用户语音序列的第一线性预测系数。

在该优选残留回波消除装置中，提取模块10可以包括：第二建立模块12，用于通过获取残留回波信号的第二线性预测系数，建立残留回波信号的信号高斯混合模型；第二计算模块14，连接至第二建立模块12，用于根据信号语音高斯混合模型计算残留回波向量。

其中，第二建立模块12可以包括：第二采样单元122，用于对残留回波信号以第二预定采样频率进行采样，得到第一信号序列；第二处理单元124，连接至第二采样单元122，用于对第第一信号序列进行端点检测和重组处理，得到第二信号序列；第二计算单元126，连接至第二处理单元124，用于计算第二信号序列的第二线性预测系数。

对于上述的优选残留回波消除装置的结构而言，在实际应用中，不必局限于该结构，例如，也可以采用如下优选实施例一、优选实施例二和优选实施例三的结构来实现上述实施例提供的残留回波消除方法。

下面结合图4至图10以及优选实施例一、优选实施例二和优选实施例三对上述实施例提供的残留回波消除方法及残留回波消除装置进行详细说明。

实施例一

图4是根据本发明优选实施例一的残留回波消除装置的结构示意图，如图1所示，该装置包括：用户语音处理模块，实时处理模块，和判决输出模块。在实际应用中，用户语音处理模块首先录制近端用户的语音依次进行端点检测，特征提取，最后建立高斯模型。用户语音处理模块的结构如图5所示，录制语音长度一般取50-60s，以8000Hz采样后得到用户语音序列f(n)。由于得到的语音序列不完全是语音帧，还存在说话的停顿间隔，所以需要对其进行端点检测和重组处理。端点检测模块将f(n)分成K帧f_i（i=1，2，…K），帧长为L（本实施例中L取256），根据规则1和规则计算帧能量：

energy_i=∑_Lf² _i，[规则1]，

\begin{matrix} energylevel 1 = \max ({energy}_{i}) + T_{N} \\ energylevel 2 = \max ({energy}_{i}) + T_{L} \end{matrix},

[规则2]，其中，max（）代表取K帧中能量最大的值，T_N、T_L分别为语音能量门限（T_N<T_L<0），在本实施例中，T_N、T_L的取值分别为：-30，-20。

找到首个energy_i>energylevel2的帧号M₁，从该点向后判断，设当判断至i=M₂时出现energy_i+1>energy_i，则帧编号为M₁～M₂的帧为一段语音段，M₂+1即为下一语音段的开始帧M₃，以此可依次找出M₄...M_j。

为了更加精确的找到语音的起止点，需要进一步的判断。当

时，根据规则3进行计算帧的起始位置：

[规则3]，

最后可得出只含有用户语音的序列

图5是根据本发明优选实施例一的残留回波消除装置中的用户语音处理模块的结构示意图，如图5所示，处理后的用户语音序列f'(n)输入语音特征提取模块进行特征提取处理（特征提取就是对语音信号进行分析处理，获得语音信号中表征人的基本特征的信息），由于语音信号采样点之间存在相关性，可以用过去的若干采样点或者它们的线性组合预测现在或将来的样点值，这里是通过使实际语音采样值和线性预测采样值之间的均方误差最小得到一组唯一的线性预测系数（Linear Predictive Coding，简称为LPC），可以利用Levinson-Durbin算法求解近端用户语音的LPC系数。

将f'(n)分成K₁帧f_i'（i=1，2，…K₁），帧长为L₁，本实施例中L₁取64，设线性预测系数的阶数为P，则第i帧的LPC系数可根据规则4递推求得：

a_{m} (m) = - \frac{R_{f^{'} f^{'}} (m) + {r^{bt}}_{m - 1} a_{m - 1}}{E_{m - 1}}

a_m(k)=a_m-1(k)+a_m(m)a_m-1(m-k) [规则4]，

E_m=E_m-1[1-a_m ²(m)]

E₀=R_f'f'(0)

其中，列矢量a_m为第m阶预测系数，R_f'f'是每帧语音序列的自相关系数，r^bt _m-1=[R_f'f'(m-1),R_f'f'(m-2),...,R_f'f'(1)]，k=1，2，…，m-1，m=1，2，…，P，本实施例中的LPC阶数P=19。

设提取的近端用户的语音特征向量为Φ_user，则

Φ_{user} = [a_{p 1}, a_{p 2}, . . ., a_{{PK}_{1}}],

[规则5]

Φ_iuser=a_pi，[规则6]

其中，a_pi代表第i帧语音信号阶数为P的LPC系数，Φ_user为19×K₁阶矩阵。

将线性预测系数输入模型建立模块进行模型建立。

M阶高斯混合模型为：

q(Φⁱ _user|λ_user)=[a₁p₁(^Φ _iuser),...，a_jp_j(Φⁱ _user),...,a_Mp_M(Φⁱ _user)]^T，[规则7]

其中，

Σ_{j = 1}^{M} a_{j} = 1,

p_{j} ({Φ^{i}}_{user}) = \frac{1}{{(2 π)}^{\frac{D}{2}} {| Σ_{j} |}^{\frac{1}{2}}} \exp {- \frac{1}{2} {({Φ^{i}}_{user} - m_{j})}^{T} {(Σ_{j})}^{- 1} ({Φ^{i}}_{user} - m_{j})},

λ_user={a_j,m_j,∑_j},j=1,...,M。λ_user是近端用户高斯混合量的特征集合，a_j是第j阶高斯混合量的权重，m_j、∑_j分别代表对应的均值和方差向量，D是向量Φⁱ _user的维数。q(Φⁱ _user|λ_user)为用户语音的模板向量，它是M×1阶矩阵。

设模型的初始协方差矩阵∑_j0为单位矩阵，初始权重a_j0=1/M，均值向量μ_j0的数值为随机数，则λ_user可由EM迭代算法求得：

p (j | {Φ^{i}}_{user}) = \frac{a_{j} p_{j} ({Φ^{i}}_{user})}{Σ_{j = 1}^{M} a_{j} p_{j} ({Φ^{i}}_{user})},

j=1，2，…，M；i=1，2，…，K₁；[规则8]，

m_{j} = \frac{1}{a_{j} P} Σ_{k = 1}^{K_{1}} p (j | {Φ^{k}}_{user}) {Φ^{k}}_{user}

Σ_{j} = \frac{1}{a_{j} P^{2}} Σ_{k = 1}^{K_{1}} p (j | {Φ^{k}}_{user}) {Φ^{k}}_{user} {({Φ^{k}}_{user})}^{T},

[规则9]，

a_{j} = \frac{1}{P} Σ_{k = 1}^{K_{1}} p (j | {Φ^{k}}_{user})

其中，

p_{j} ({Φ^{i}}_{user}) = \frac{1}{{(2 π)}^{\frac{D}{2}} {| Σ_{j} |}^{\frac{1}{2}}} \exp {- \frac{1}{2} {({Φ^{i}}_{user} - m_{j})}^{T} {(Σ_{j})}^{- 1} ({Φ^{i}}_{user} - m_{j})} .

由此得到λ_user={a_j,m_j,∑_j},j=1,...,M，不断迭代直至迭代前后的参数集

{({| a_{j} - {a^{'}}_{j} |}^{2} + {| m_{j} - {m^{'}}_{j} |}^{2} + {| Σ_{j} - {Σ^{'}}_{j} |}^{2})}^{\frac{1}{2}} < ϵ

停止迭代，一般ε=10^-5。

通过以上步骤可以得到用户语音的模板向量，而用户语音的每一帧对应一个M阶的模板向量，则K₁帧信号得到的模板向量组成M×K₁阶矩阵。对此矩阵的行向量值取平均得到高斯混合阶数相同时的模板向量的平均值q(Φ^a _user|λ_user)，该值即为需要存储的模板向量。存储的模板向量将在后续步骤中与残留回波的测量向量进行比较，从而判断是否为用户语音帧。

图6是根据本发明优选实施例一的残留回波消除过程示意图，如图6所示，获得实时测量值的方法如下：在工作状态下，自适应滤波器的输出e(n)中存在大量的残留回波，此时可以将e(n)信号输入到残留回波抑制模块进行实时处理，此时请同时参考图4，残留回波信号首先进入实时处理模块进行处理。

实时处理模块对输入信号进行特征提取，建立模型后计算测量值，该模块的结构图请同时参考图7（图7是根据本发明优选实施例一的残留回波消除装置中的实时处理模块的结构示意图），语音特征提取模块采用与用户语音提取中的模块相同的方法和参数对每一帧残留回波信号进行特征提取，设第i帧得到特征向量Φⁱ，测量向量计算模块将特征向量带入高斯混合模型可得到测量向量q(Φⁱ|λ_user)。

模板向量和测量向量最终输入判决输出模块进行判决，利用向量之间的距离设置门限判别是否为用户语音帧：

Λ_{i} = \frac{| | q (Φ^{i} | λ_{user}) - q ({Φ^{a}}_{user} | λ_{user}) | |}{| | q ({Φ^{a}}_{user} | λ_{user}) | |},

[规则10]

其中，||||表示计算向量的2范数。如果Λ_i>Threshold判为非近端语音帧，反之为近端语音帧，判为非近端语音帧时，将该帧信号置零以消除回波，Threshold一般取0.1~0.3。

实施例二

通常，最佳判决门限Threshold会随着回波信号发生改变，而回波信号由远端信号产生。图8是根据本发明优选实施例二的残留回波消除装置的结构示意图，如图8所示，门限计算模块首先判断是否有远端语音信号x（n），当远端语音信号较大时即对最佳判决门限影响较大时，启动门限估计。此时随机取第K帧远端信号x（n）带入高斯混合模型中得到远端语音的向量q(Φ^k _far|λ_user)，并利用下式对判决门限进行估计。

根据规则11进行能量判决：

[规则11]，其中，Threshold1为远端语音能量门限，N₁为滑动窗口的长度，一般取值范围为（100，300），M₁=M₁+S₁，S₁为滑动窗滑动长度，一般取取值范围为（50，150）。当[规则11]成立时，根据规则12进行门限估计：

{Threshold}^{'} = G * \frac{| | q (Φ^{i} | λ_{user}) - q ({Φ^{k}}_{far} | λ_{user}) | |}{| | q ({Φ^{k}}_{far} | λ_{user}) | |},

[规则12]，其中，Threshold'为估计的判决门限，G为门限增益，一般取值范围为（3，5）。

实施例三

在本实施例中，残留回波抑制模块是否工作将取决于语音信号中残留回波的大小。图9是根据本发明优选实施例三的残留回波消除装置的结构示意图，如图9所示，能量与相关性判决模块中，当远端语音比较大时认为此时的回波信号也比较大，此时计算远端语音和自适应滤波器输出信号的相关性，当相关性值大于阈值时，启动残留回波抑制模块，工作流程如图10所示（图10是根据本发明优选实施例三的残留回波消除流程图），根据规则13进行能量判决：

[规则13]，其中，Threshold2为远端语音能量门限，N₂为滑动窗口的长度，一般取值范围为（100，300），M₂=M₂+S₂，S₂为滑动窗滑动长度，一般取取值范围为（50，150）。

当能量超过阈值时，根据规则14计算相关性：

r = \frac{n Σ_{i = 1}^{n} x (i) e (i) - Σ_{i = 1}^{n} x (i) \cdot Σ_{i = 1}^{n} e (i)}{\sqrt{n Σ_{i = 1}^{n} x^{2} (i) - {(Σ_{i = 1}^{n} x (i))}^{2}} \cdot \sqrt{n Σ_{i = 1}^{n} e^{2} (i) - {(Σ_{i = 1}^{n} e (i))}^{2}}},

[规则14]，

其中，n为帧长，此处n取256。当r>Threshold2时启动残留回波抑制模块。

本发明实施例从最直接的用户通话需求出发，对用户的语音通话质量进行个性化处理，将非用户语音的其他信号（包括线性残留回波、非线性回波、噪声）作为非有利信号全部消除，只保留用户的语音。

本发明实施例首先对终端用户的语音信号进行处理，计算其线性预测系数。由于线性预测系数能够有效地区分不同的说话人，且对同一说话人的变化保持相对稳定，所以可以以它作为用户的语音特征进行建模。再利用用户的语音特征建立高斯混合模型，最终得出用户语音的模板向量进行存储。高斯混合模型的本质是一个多维概率密度函数，可以用多个高斯分布概率密度函数的加权组合来描述矢量在概率空间的分布情况。利用高斯混合模型能有效地将语音特征聚类，得到语音在特征空间中的表示。当自适应滤波器的输出存在大量的残留回波时，对其进行同样的特征提取和模型建立，找到残留回波在特征空间中的表示，当残留回波的向量与用户语音的模板向量的距离小于所设定的阈值时，判为用户语音帧，否则判为非用户语音帧进行消除。由于处理过程中未区分噪声信号、线性残留回波信号、非线性回波信号，而是将它们都被判为非近端语音帧进行处理，所以有效地避免了传统方法的转换效应。

从以上的描述中，可以看出，本发明实现了如下技术效果：预先为用户语音提取语音特征，将接收到的残留回波信号与语音特征作对比以确定是否需要对残留回波进行消除，解决了现有技术无法将噪声和残留回波同时进行处理问题，进而达到了能处理由于双端通话、回波路径改变、滤波器阶数不匹配等因素产生的线性残留回波，同时还能处理噪声信号和其他非线性残留回波，从而避免了传统的残留回波抑制器的转换效应，满足了实际语音通信的需求的效果。

显然，本领域的技术人员应该明白，上述的本发明的各模块或各步骤可以用通用的计算装置来实现，它们可以集中在单个的计算装置上，或者分布在多个计算装置所组成的网络上，可选地，它们可以用计算装置可执行的程序代码来实现，从而，可以将它们存储在存储装置中由计算装置来执行，并且在某些情况下，可以以不同于此处的顺序执行所示出或描述的步骤，或者将它们分别制作成各个集成电路模块，或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样，本发明不限制于任何特定的硬件和软件结合。

以上所述仅为本发明的优选实施例而已，并不用于限制本发明，对于本领域的技术人员来说，本发明可以有各种更改和变化。凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种残留回波消除方法，其特征在于，包括：

对当前接收到的残留回波信号进行特征提取，得到残留回波向量；

获取存储的用户语音模板向量，其中，所述用户语音模板向量通过对预先录制的用户语音进行语音特征提取得到；

判断所述残留回波向量与所述用户语音模板向量之间的距离是否大于预先设定的向量阈值，在判断结果为是的情况下，确定所述残留回波信号为非用户信号，并消除所述非用户信号。

2.根据权利要求1所述的方法，其特征在于，通过以下方式得到所述用户语音模板向量：

通过获取所述用户语音的第一线性预测系数，建立所述用户语音的语音高斯混合模型；

根据所述用户语音高斯混合模型计算所述用户语音模板向量。

3.根据权利要求2所述的方法，其特征在于，获取所述用户语音的第一线性预测系数，包括：

对所述用户语音以第一预定采样频率进行采样，得到第一用户语音序列；

对所述第一用户语音序列进行端点检测和重组处理，得到第二用户语音序列；

计算所述第二用户语音序列的所述第一线性预测系数。

4.根据权利要求1至3中任一项所述的方法，其特征在于，对当前接收到的残留回波信号进行特征提取，得到残留回波向量，包括：

通过获取所述残留回波信号的第二线性预测系数，建立所述残留回波信号的信号高斯混合模型；

根据所述信号语音高斯混合模型计算所述残留回波向量。

5.根据权利要求4所述的方法，其特征在于，获取所述残留回波信号的第二线性预测系数，包括：

对所述残留回波信号以第二预定采样频率进行采样，得到第一信号序列；

对所述第第一信号序列进行端点检测和重组处理，得到第二信号序列；

计算所述第二信号序列的所述第二线性预测系数。

6.一种残留回波消除装置，其特征在于，包括：

提取模块，用于对当前接收到的残留回波信号进行特征提取，得到残留回波向量；

获取模块，用于获取存储的用户语音模板向量，其中，所述用户语音模板向量通过对预先录制的用户语音进行语音特征提取得到；

判断模块，用于判断所述残留回波向量与所述用户语音模板向量之间的距离是否大于预先设定的向量阈值；

确定模块，用于在所述判断模块的判断结果为是的情况下，确定所述残留回波信号为非用户信号；

消除模块，用于消除所述非用户信号。

7.根据权利要求6所述的装置，其特征在于，所述获取模块包括：

第一建立模块，用于通过获取所述用户语音的第一线性预测系数，建立所述用户语音的语音高斯混合模型；

第一计算模块，用于根据所述用户语音高斯混合模型计算所述用户语音模板向量；

存储模块，用于存储所述用户语音模板向量。

8.根据权利要求7所述的装置，其特征在于，所述第一建立模块包括：

第一采样单元，用于对所述用户语音以第一预定采样频率进行采样，得到第一用户语音序列；

第一处理单元，用于对所述第一用户语音序列进行端点检测和重组处理，得到第二用户语音序列；

第一计算单元，用于计算所述第二用户语音序列的所述第一线性预测系数。

9.根据权利要求6至8中任一项所述的装置，其特征在于，所述提取模块包括：

第二建立模块，用于通过获取所述残留回波信号的第二线性预测系数，建立所述残留回波信号的信号高斯混合模型；

第二计算模块，用于根据所述信号语音高斯混合模型计算所述残留回波向量。

10.根据权利要求9所述的装置，其特征在于，所述第二建立模块包括：

第二采样单元，用于对所述残留回波信号以第二预定采样频率进行采样，得到第一信号序列；

第二处理单元，用于对所述第第一信号序列进行端点检测和重组处理，得到第二信号序列；

第二计算单元，用于计算所述第二信号序列的所述第二线性预测系数。