WO2018086444A1

WO2018086444A1 - 噪声抑制信噪比估计方法和用户终端

Info

Publication number: WO2018086444A1
Application number: PCT/CN2017/106502
Authority: WO
Inventors: 谢单辉
Original assignee: 电信科学技术研究院
Priority date: 2016-11-10
Filing date: 2017-10-17
Publication date: 2018-05-17
Also published as: CN108074582B; CN108074582A

Abstract

一种噪声抑制信噪比估计方法和用户终端，该方法可包括：估计当前音频帧的预估先验信噪比(101)；根据预估先验信噪比，计算当前音频帧的所述预估先验信噪比对应的MMSE的估计值(102)；计算所述当前音频帧的语音存在概率(103)；结合所述语音存在概率和所述估计值估计所述当前音频帧的最终先验信噪比(104)。

Description

噪声抑制信噪比估计方法和用户终端

相关申请的交叉引用

本申请主张在2016年11月10日在中国提交的中国专利申请No.201611039463.4的优先权，其全部内容通过引用包含于此。

技术领域

本公开文本涉及语音技术领域，尤其涉及一种噪声抑制信噪比估计方法和用户终端。

背景技术

目前用户终端中通常采用单麦克风降噪方法对音频信号进行降噪，该方法中主要包括如下步骤：

将带噪语音使用快速傅氏变换(Fast Fourier Transformation，FFT)或者其他变换方法，将带噪语音在频域分解频域信号Y；

估计频域信号Y的噪声方差；

基于上述噪声方差推算先验信噪比和后验信噪比；

根据先验信噪比和后验信噪比计算出适合的增益；

对频域信号Y的每个频域乘以上述增益，以得到降噪后的频域信号；

将降噪后的频域信号通过快速傅氏逆变换(Inverse Fast Fourier Transform，IFFT)变换成时域信号。

然而，上述技术中，先验信噪比是采用直接判决方法估计的，即通过如下公式进行估计的：

其中，

表示当前帧的先验信噪比的估计值，α通常需要取接近1的平滑数，具体为0.95～1的值，

表示前一帧的降噪处理结果，

表示噪声方差，

表示当前帧的后验信噪比估计值。

通过上述公式可以看出，后验信噪比的估计值严重偏向于前一帧的降噪处理结果

而

可以看成是前一帧语音方差

的瞬时值。所以，通过上述公式最终估计到的先验信噪比ξ并非是估计当前帧的信噪比ξ(m)，可以视为估计前一帧的先验信噪比ξ(m-1)。可见，目前估算当前音频帧的先验信噪比存在与当前音频帧的相关性较差，不利于当前音频帧的噪声抑制的问题。

发明内容

本公开文本的目的在于提供一种噪声抑制信噪比估计方法和用户终端，解决了估算当前音频帧的先验信噪比存在与当前音频帧的相关性较差，不利于当前音频帧的噪声抑制的问题。

为了达到上述目的，本公开文本实施例提供一种先验信噪比估计方法，包括：

估计当前音频帧的预估先验信噪比；

根据所述预估先验信噪比，计算所述当前音频帧的所述预估先验信噪比对应的最小均方误差(Minimum Mean Square Error，MMSE)的估计值；

计算所述当前音频帧的语音存在概率；

结合所述语音存在概率和所述估计值估计所述当前音频帧的最终先验信噪比。

可选地，所述估计当前音频帧的预估先验信噪比，包括：

基于所述当前音频帧的后验信噪比估计值估计当前音频帧的预估先验信噪比。

可选地，所述基于所述当前音频帧的后验信噪比估计值估计当前音频帧的预估先验信噪比，包括：

通过如下公式估计当前音频帧的预估先验信噪比：

其中，表示所述预估先验信噪比，α为平滑数，

表示前一帧的降噪处理结果，

表示噪声方差，

表示所述当前音频帧的后验信噪比估计值；

或者，

通过如下公式估计当前音频帧的预估先验信噪比：

其中，

表示所述预估先验信噪比，α为平滑数，

为前一帧的先验信噪比，

表示当前帧的后验信噪比估计值。

可选地，所述方法还包括：

通过如下公式调整估计所述预估先验信噪比时所需要的平滑数：

其中，a₁和a₂为预设的两个平滑数，且a₁＞a₂，γ_th和ξ_th为两个经验阈值。

可选地，所述基于所述语音存在概率估计值估计当前音频帧的预估先验信噪比的步骤，进一步还包括：

通过如下公式进一步估计所述当前音频帧的预估先验信噪比：

或者

其中，

表示所述预估先验信噪比，

和

分别表示平滑数为a₁时所述当前音频帧的预估先验信噪比和平滑数为a₂时所述当前音频帧的预估先验信噪比，p(H₁|Y)表示所述语音存在概率，p_th为预设阈值。

可选地，所述根据所述预估先验信噪比，计算所述当前音频帧的所述预估先验信噪比对应的最小均方误差的估计值，包括：

根据所述预估先验信噪比，通过如下公式计算所述当前音频帧的所述预估先验信噪比对应的最小均方误差的估计值：

其中，

表示所述预估先验信噪比对应的最小均方误差的估计值，

表示所述预估先验信噪比，

表示所述当前音频帧的后验信噪比估计值。

可选地，所述计算所述当前音频帧的语音存在概率，包括：

通过如下公式计算所述当前音频帧的语音存在概率：

或者

其中，p(H₁|Y)表示所述语音存在概率，p(H₁)和p(H₀)分别表示先验语音存在概率和先验无语音概率，

为一固定值，

表示所述当前音频帧的后验信噪比估计值，exp()为指数函数，γ_min和γ_max为两个经验值，且γ_min＜γ_max，p_max和p_min为两个经验值，且p_min＜p_max。

可选地，所述结合所述语音存在概率和所述估计值估计所述当前音频帧的最终先验信噪比，包括：

通过如下公式估计所述当前音频帧的最终先验信噪比：

其中，

表示所述当前音频帧的最终先验信噪比，

表示所述预估先验信噪比的最小均方误差的估计值，p(H₁|Y)表示所述语音存在概率，ξ_min为某一小数值。

本公开文本实施例还提供一种用户终端，包括：

第一估计模块，用于估计当前音频帧的预估先验信噪比；

第一计算模块，用于根据所述预估先验信噪比，计算所述当前音频帧的所述预估先验信噪比对应的MMSE的估计值；

第二计算模块，用于计算所述当前音频帧的语音存在概率；

第二估计模块，用于结合所述语音存在概率和所述估计值估计所述当前音频帧的最终先验信噪比。

可选地，所述第一估计模块用于基于所述当前音频帧的后验信噪比估计值估计当前音频帧的预估先验信噪比。

可选地，所述第一估计模块用于通过如下公式估计当前音频帧的预估先验信噪比：

其中，

表示所述预估先验信噪比，α为平滑数，

表示前一帧的降噪处理结果，

表示噪声方差，

表示所述当前音频帧的后验信噪比估计值；

或者，

所述第一估计模块用于通过如下公式估计当前音频帧的预估先验信噪比：

其中，

表示所述预估先验信噪比，α为平滑数，

为前一帧的先验信噪比，

表示当前帧的后验信噪比估计值。

可选地，所述用户终端还包括：

调整模块，用于通过如下公式调整估计所述预估先验信噪比时所需要的平滑数：

可选地，所述第一估计模块还用于通过如下公式进一步估计所述当前音频帧的预估先验信噪比：

或者

其中，

表示所述预估先验信噪比，

可选地，所述第一计算模块用于根据所述预估先验信噪比，通过如下公式计算所述当前音频帧的所述预估先验信噪比对应的MMSE的估计值：

其中，

表示所述预估先验信噪比对应的最小均方误差的估计值，

表示所述预估先验信噪比，

表示所述当前音频帧的后验信噪比估计值。

可选地，所述第二计算模块用于通过如下公式计算所述当前音频帧的语音存在概率：

或者

为一固定值，

可选地，所述第二估计模块用于通过如下公式估计所述当前音频帧的最终先验信噪比：

其中，

表示所述当前音频帧的最终先验信噪比，

本公开文本实施例还提供一种用户终端，包括：处理器、存储器和收发机，其中：

所述处理器用于读取存储器中的程序，执行下列过程：

估计当前音频帧的预估先验信噪比；

根据所述预估先验信噪比，计算所述当前音频帧的所述预估先验信噪比对应的最小均方误差的估计值；

计算所述当前音频帧的语音存在概率；

结合所述语音存在概率和所述估计值估计所述当前音频帧的最终先验信噪比，

其中，所述收发机用于接收和发送数据，所述存储器能够存储处理器在执行操作时所使用的数据。

本公开文本的上述技术方案至少具有如下有益效果：

本公开文本实施例，估计当前音频帧的预估先验信噪比；根据所述预估先验信噪比，计算所述当前音频帧的所述预估先验信噪比对应的MMSE的估计值；计算所述当前音频帧的语音存在概率；结合所述语音存在概率和所述估计值估计所述当前音频帧的最终先验信噪比。由于是结合当前帧的语音存在概率和当前音频帧的预估先验信噪比对应的最小均方误差的估计值估计的最终先验信噪比，相比相关技术中根据前一帧的先验信噪比进行估计，本公开文本实施例可以估算的先验信噪比与当前音频帧的相关性更高，从而有利于当前音频帧的噪声抑制。

附图说明

为了更清楚地说明本申请实施例的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请中记载的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。以下附图并未刻意按实际尺寸等比例缩放绘制，重点在于示出本申请的主旨。

图1为本公开文本实施例提供的一种噪声抑制信噪比估计方法的流程示意图；

图2为本公开文本实施例提供的另一种噪声抑制信噪比估计方法的示意图；

图3为本公开文本实施例提供的一种噪声抑制信噪比估计方法的实验数据示意图；

图4为本公开文本实施例提供的一种噪声抑制信噪比估计方法的另一实验数据示意图；

图5为本公开文本实施例提供的一种噪声抑制信噪比估计方法的另一实验数据示意图；

图6为本公开文本实施例提供的一种用户终端的结构示意图；

图7为本公开文本实施例提供的另一种用户终端的结构示意图；

图8为本公开文本实施例提供的另一种用户终端的结构示意图。

具体实施方式

下面将结合本公开文本实施例中的附图，对本公开文本实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本公开文本一部分实施例，而不是全部的实施例。基于本公开文本中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本公开文本保护的范围。

参见图1，本公开文本实施例提供一种噪声抑制信噪比估计方法，如图1所示，包括以下步骤：

101、估计当前音频帧的预估先验信噪比；

102、根据所述预估先验信噪比，计算所述当前音频帧的所述预估先验信噪比对应的MMSE的估计值；

103、计算所述当前音频帧的语音存在概率；

104、结合所述语音存在概率和所述估计值估计所述当前音频帧的最终先验信噪比。

本公开文本实施例中，上述当前音频帧可以是用户终端的麦克风采集的当前帧，该当前帧可能是语音帧，也有可能是噪声帧。

另外，上述预估先验信噪比可以是采用直接判决方法或者最大似然方法等方法进行估计的先验信噪比。上述计算预估先验信噪比的MMSE的估计值可以是采用MMSE算法得到上述预估先验信噪比的MMSE的估计值。上述当前音频帧的语音存在概率可以根据当前音频帧的后验信噪比计算当前音频帧的语音存概率，也可以是结合前几帧相同频点的后验信噪比做一个平均或者平滑得到的值计算当前音频帧的语音存在概率。

需要说明的是，对于步骤103与步骤101和步骤102之间的执行顺序，本公开文本实施例不作限定，例如：可以是先执行步骤103，再执行步骤101，或者可以是先执行步骤101，之后再执行步骤103。

另外，上述当前音频帧的最终先验信噪比可以是理解为，在对音频帧进行降噪过程中用于增益计算的先验信噪比，或者也可以理解为本公开文本实施例中针对当前音频帧输出的先验信噪比。结合所述语音存在概率和所述估计值估计所述当前音频帧的最终先验信噪比可以是，根据上述语音存在概率确定当前音频帧为语音帧的概率，若确定当前音频帧为纯噪声帧，则将上述最终先验信噪比设置为一个稳定的最小值，例如ξ_min，以保证纯噪声段处理平稳，减小音乐噪声；而当确定当前音频帧为语音段中的音频帧时，则计算最终先验信噪比偏向于上述预估先验信噪比对应的最小均方误差的估计值，使得最终先验信噪比估计更为准确。

通过上述步骤可以实现结合当前帧的语音存在概率和当前音频帧的预估先验信噪比的最小均方误差的估计值估计的最终先验信噪比，估算的先验信噪比与当前音频帧的相关性更高，从而有利于当前音频帧的噪声抑制，以提高噪声抑制效果。

可选地，所述估计当前音频帧的预估先验信噪比，包括：

其中，当前音频帧的后验信噪比为公知常识，此处不作详细说明。其中，基于所述当前音频帧的后验信噪比估计值估计当前音频帧的预估先验信噪比可以是基于所述当前音频帧的后验信噪比估计值采用直接判决方法估计当前音频帧的预估先验信噪比，当然，本公开文本实施例对此并不作限定。

可选地，上述基于所述当前音频帧的后验信噪比估计值估计当前音频帧的预估先验信噪比，包括：

通过如下公式估计当前音频帧的预估验信噪比：

其中，

表示所述预估先验信噪比，α为平滑数，

表示前一帧的降噪处理结果，

表示噪声方差，

表示所述当前音频帧的后验信噪比估计值；

或者，

通过如下公式估计当前音频帧的预估先验信噪比：

其中，

表示所述预估先验信噪比，α为平滑数，

为前一帧的先验信噪比，

表示当前帧的后验信噪比估计值。

该实施方式中，可以通过上述两个公式中的任一公式估算上述预估先验信噪比。根据实验表明采用

对应的公式计算上述预估先验信噪比效果更好，该方法中主要是音乐噪声(musical tone)会少，所以本公开文本实施例中可选地，采用

对应的公式计算上述预估先验信噪比。

另外，上述平滑数可以是预先设置的数值，例如，为0.95～1的值，或者为0.98或者0.3等数值，对此不作限定，而噪声方差为公知常识，对此不作详细说明。

可选地，上述方法还包括：

该实施方式中，考虑到α因子需要在纯噪声时，保证尽可能的大，使得估计出来的值尽可能的稳定，而在有语音段的时候需要尽可能的小，以便保证快速的跟踪语音。其中，上述a₁和a₂可以分别为0.98和0.3，当然，本公开文本实施例对此并不作限定，例如：还可以是0.95和0.28等，具体还可以根据实际进行调整。

该实施方式中，通过上述a₁和a₂可以提高预估先验信噪比的准确性。

可选地，该实施方式中，上述基于所述语音存在概率估计值估计当前音频帧的预估先验信噪比的步骤，进一步还包括：

或者

其中，

表示所述预估先验信噪比，

和

该实施方式中，可以根据当前音频帧的音频存在概率切换预估先验信噪比，以提高预估先验信噪比的准确性。

可选地，上述根据所述预估先验信噪比，计算所述当前音频帧的所述预估先验信噪比对应的最小均方误差的估计值，包括：

其中，

表示所述预估先验信噪比对应的最小均方误差的估计值，

表示所述预估先验信噪比，

表示所述当前音频帧的后验信噪比估计值。

需要说明的是，上述

表示步骤101计算得到的所述预估先验信噪比，并不限定是通过上述提到的关于

公式计算的预估先验信噪比。

其中，上述可以是根据复高斯模型得到的

此外，还可以采用语音的超高斯模型来计算E(X²|Y)。其中，

可以等效于E(X²|Y)。因为在实际应用中，先验信噪比主要是估计语音信号的方差

根据定义

这只依赖于语音信号X。但X无从获取，所以大部分对

的估计算法，都得从带噪信号Y估计。这一点也可以从直接判决方法看出，在直接判决方法的计算公式的后一半中的γ-1是对语音方差

在γ已知(i.e.Y已知)的情况的最大似然估计，前一半是使用瞬时值

来替换E(X²)。

所以，从大部分信噪比估计算法来看，都需要建立在带噪信号Y已知的条件下。换句话说，实际上，并不能直接估计语音方差

而是在Y已知的条件，估计

因此，本公开文本实施例中，采用条件期望

或

来估计语音方差

在这种想法的基础上，从条件期望的定义

可以看出，对应的其实是对语音幅度谱X²的MMSE估计。考虑Y中有语音的概率p(H₁|Y)，条件期望最终的表达式为：

根据复高斯模型：

其中，p(H₀|Y)表示Y已知的条件下，无语音H₀的概率，即条件概率，二元假设：

H0：Y＝N，表示无语音

H1：Y＝X+N，表示有语音

E(X²|Y，H₀)根据上述二元假设，E(X²|Y，H₀)＝0。

上式中

是真正的语音方差，实际需要进一步估计，可以采用最大似然或者直接判决方法估计，另一个方面，还可以从假设语音服从其它模型，例如超高斯模型等，例如卡方(chi)分布：

之后推导出

上面

是汇通型超几何函数。由于包含超越函数，使得整体计算比较复杂，一般需要查表等方式来实现。

通过上述分析可知，上述关于

表示所的公式可以通过复高斯模型

和超高斯模型

推导得到。

需要说明的是，本公开文本实施例中，直接可以采用上述公式计算预估先验信噪比的最小均方误差的估计值，而不需要执行上述条件期望的推导过程，而执行相应的步骤即可，上述条件期望仅是本公开文本实施例中在实施时的原理解释说明。

可选地，所述计算所述当前音频帧的语音存在概率，包括：

通过如下公式计算所述当前音频帧的语音存在概率：

或者

为一固定值，

该实施方式中，通过上述公式区分语音和噪声。另外，使用上面公式计算语音存在概率时可以结合前几帧相同频点的后验信噪比做一个平均或者平滑得到的值计算当前音频帧的语音存在概率。另外，上面公式可以是根据上面提供的复高斯模型直接推导出来的。

本公开文本实施例中，通过语音存在概率是提供一个语音存在的概率，使得当前估计的先验信噪比能够在纯噪声和语音段进行软切换，从而加快直接判决方法存在的跟踪时延问题，同时又能保留直接判决方法的优点。

可选地，上述结合所述语音存在概率和所述估计值估计所述当前音频帧的最终先验信噪比，包括：

通过如下公式估计所述当前音频帧的最终先验信噪比：

其中，

表示所述当前音频帧的最终先验信噪比，

该实施方式中，通过上述公式计算使得最终先验信噪比纯噪声尽可能保持在一个稳定的小的数值，例如ξ_min，而在语音段时，估计的先验信噪比偏向于

或者理解为估计的先验信噪比偏向于

该实施方式中，可以区分有语音状态和无语音状态，在有语音状态根据MMSE准则推导出最优的先验信噪估计。无语音状态，使用某一个最小值来作为最大抑制力度的限制，可以保证纯噪声段处理平稳，减小音乐噪声。语音存在和不存在状态的采用语音存在概率进行计算，该概率采用固定值先验信噪比计算，从而使得先验信噪比估计的更为准确，可以解决直接判决存在的跟踪时延问题。

需要说明的是，本公开文本实施例中，上述介绍的多种实施方式可以相互结合实现，也可以单独实现，对此本公开文本实施例不作限定。另外，本公开文本实施例中，估算的先验信噪比可以用于音频信号的降噪过程的增益计算，可选地，可以应用采用单个麦克风降噪过程的增益计算。例如：如图2所示，获取后验信噪比和前一帧处理结构功率谱，基于后验信噪比和前一帧处理结构功率谱使用直接判决方法计算当前音频帧的预估先验信噪比，基于后验信噪比计算当前音频信号帧的语音存在概率，计算预估先验信噪比的MMSE的估计值，以及结合所述语音存在概率和所述估计值估计所述当前音频帧的最终先验信噪比，该先验信噪比用于增益计算。

本公开文本实施例中，通过上述步骤可以消除固有延时一帧的影响，缓解语音的起始段被衰减和末尾段存在的拖尾，进而带来降噪性能的提升。以下通过实验数据进行效果说明：

实验采用Noizus数据库，数据的采样率为8kHz，白噪声使用Cool Edit(为一音频处理软件)生成，其它噪声则为Noizus数据库自带。帧长取20ms，重叠率为50％，前后各使用平方根哈宁窗(Hanning window)，

取15dB。ξ_min取-20dB，抑制准则采用MMSE-STSA(Short-Time Spectral Amplitude，短时谱幅度)算法，噪声估计采用无偏MMSE算法。

图3和图4分别是信噪比为0dB和5dB时的直接判决和本公开文本方法之间的对比。图3的语音为sp01，噪声为白噪，图4的语音为sp04，噪声为汽车噪声，其中，sp01和sp04是数据集里面的语音编号。箭头处可以看出，本公开文本方法明显优于对比算法。主观对比听，处理结果音乐噪声均不明显。图5为Noizus数据库30组汽车噪声和白噪声，在0/5/10/15dB下的平均段信噪比提升，从图中不难看出，本公开文本方法性能优于直接判决。

需要说明的是，上述方法可以应用于任何具备麦克风的用户终端，例如：手机、平板电脑(Tablet Personal Computer)、膝上型电脑(Laptop Computer)、个人数字助理(personal digital assistant，PDA)、移动上网装置(Mobile Intemet Device，MID)、车载设备或可穿戴式设备(Wearable Device)等终端设备，需要说明的是，在本公开文本实施例中并不限定用户终端的具体类型。

估计当前音频帧的预估先验信噪比；根据所述预估先验信噪比，计算所述当前音频帧的所述预估先验信噪比对应的MMSE的估计值；计算所述当前音频帧的语音存在概率；结合所述语音存在概率和所述估计值估计所述当前音频帧的最终先验信噪比。由于是结合当前帧的语音存在概率和当前音频帧的预估先验信噪比对应的最小均方误差的估计值估计的最终先验信噪比，相比相关技术中根据前一帧的先验信噪比进行估计，本公开文本实施例可以估算的先验信噪比与当前音频帧的相关性更高，从而有利于当前音频帧的噪声抑制。

参见图6，本公开文本实施例提供一种用户终端，如图6所示，用户终端600，包括以下模块：

第一估计模块601，用于估计当前音频帧的预估先验信噪比；

第一计算模块602，用于根据所述预估先验信噪比，计算所述当前音频帧的所述预估先验信噪比对应的最小均方误差的估计值；

第二计算模块603，用于计算所述当前音频帧的语音存在概率；

第二估计模块604，用于结合所述语音存在概率和所述估计值估计所述当前音频帧的最终先验信噪比。

可选地，第一估计模块601用于基于所述当前音频帧的后验信噪比估计值估计当前音频帧的预估先验信噪比。

可选地，第一估计模块601用于通过如下公式估计当前音频帧的预估先验信噪比：

其中，

表示所述预估先验信噪比，α为平滑数，

表示前一帧的降噪处理结果，

表示噪声方差，

表示所述当前音频帧的后验信噪比估计值；

或者，

所述第一估计模块601用于通过如下公式估计当前音频帧的预估先验信噪比：

其中，

表示所述预估先验信噪比，α为平滑数，

为前一帧的先验信噪比，

表示当前帧的后验信噪比估计值。

可选地，如图7所示，用户终端600还包括：

调整模块605，用于通过如下公式调整估计所述预估先验信噪比时所需要的平滑数：

可选地，第一估计模块601还用于通过如下公式进一步估计所述当前音频帧的预估先验信噪比：

或者

其中，

表示所述预估先验信噪比，

和

可选地，第一计算模块602用于根据所述预估先验信噪比，通过如下公式计算所述当前音频帧的所述预估先验信噪比对应的最小均方误差的估计值：

其中，

表示所述预估先验信噪比对应的最小均方误差的估计值，

表示所述预估先验信噪比，

表示所述当前音频帧的后验信噪比估计值。

可选地，第二计算模块603用于通过如下公式计算所述当前音频帧的语音存在概率：

或者

为一固定值，

可选地，第二估计模块604用于通过如下公式估计所述当前音频帧的最终先验信噪比：

其中，

表示所述当前音频帧的最终先验信噪比，

需要说明的是，本实施例中上述用户终端600可以是与本公开文本实施例中方法实施例提供的语音信号降噪方法对应的用户终端，本公开文本实施例中方法实施例中的任意实施方式都可以被本实施例中的上述用户终端600所实现，以及达到相同的有益效果，此处不再赘述。

参见图8，本公开文本实施例提供另一种用户终端的结构，该用户终端包括：处理器800、收发机810、存储器820、用户接口830和总线接口，其中：

处理器800，用于读取存储器820中的程序，执行下列过程：

估计当前音频帧的预估先验信噪比；

根据所述预估先验信噪比，计算所述当前音频帧的所述预估先验信噪比对应的MMSE的估计值；

计算所述当前音频帧的语音存在概率；

其中，用户接口830中包括的麦克风，收发机810，用于在处理器800的控制下接收和发送数据。

在图8中，总线架构可以包括任意数量的互联的总线和桥，具体由处理器800代表的一个或多个处理器和存储器820代表的存储器的各种电路链接在一起。总线架构还可以将诸如***设备、稳压器和功率管理电路等之类的各种其他电路链接在一起。总线接口提供接口。收发机810可以是多个元件，即包括发送机和接收机，提供用于在传输介质上与各种其他装置通信的单元。针对不同的用户设备，用户接口830还可以是能够外接内接需要设备的接口，连接的设备包括但不限于小键盘、显示器、扬声器、麦克风、操纵杆等。

处理器800负责管理总线架构和通常的处理，存储器820可以存储处理器800在执行操作时所使用的数据。

可选地，所述估计当前音频帧的预估先验信噪比，包括：

通过如下公式估计当前音频帧的预估先验信噪比：

其中，

表示所述预估先验信噪比，α为平滑数，

表示前一帧的降噪处理结果，

表示噪声方差，

表示所述当前音频帧的后验信噪比估计值；

或者，

通过如下公式估计当前音频帧的预估先验信噪比：

其中，

表示所述预估先验信噪比，α为平滑数，

为前一帧的先验信噪比，

表示当前帧的后验信噪比估计值。

可选地，处理器800还用于：

或者

其中，

表示所述预估先验信噪比，

和

其中，

表示所述预估先验信噪比对应的最小均方误差的估计值，

表示所述预估先验信噪比，

表示所述当前音频帧的后验信噪比估计值。

可选地，所述计算所述当前音频帧的语音存在概率，包括：

通过如下公式计算所述当前音频帧的语音存在概率：

或者

为一固定值，

通过如下公式估计所述当前音频帧的最终先验信噪比：

其中，

表示所述当前音频帧的最终先验信噪比，

需要说明的是，本实施例中上述用户终端可以是与本公开文本实施例中方法实施例提供的语音信号降噪方法对应的用户终端，本公开文本实施例中方法实施例中的任意实施方式都可以被本实施例中的上述用户终端所实现，以及达到相同的有益效果，此处不再赘述

在本申请所提供的几个实施例中，应该理解到，所揭露方法和装置，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个***，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。

另外，在本公开文本各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理包括，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用硬件加软件功能单元的形式实现。

上述以软件功能单元的形式实现的集成的单元，可以存储在一个计算机可读取存储介质中。上述软件功能单元存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本公开文本各个实施例所述收发方法的部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(Read-Only Memory，ROM)、随机存取存储器(Random Access Memory，RAM)、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述是本公开文本的优选实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本公开文本所述原理的前提下，还可以作出若干改进和润饰，这些改进和润饰也应视为本公开文本的保护范围。

Claims

一种噪声抑制信噪比估计方法，包括：

估计当前音频帧的预估先验信噪比；

根据所述预估先验信噪比，计算所述当前音频帧的所述预估先验信噪比对应的最小均方误差的估计值；

计算所述当前音频帧的语音存在概率；

结合所述语音存在概率和所述估计值估计所述当前音频帧的最终先验信噪比。
如权利要求1所述的方法，其中，所述估计当前音频帧的预估先验信噪比，包括：

基于所述当前音频帧的后验信噪比估计值估计当前音频帧的预估先验信噪比。
如权利要求2所述的方法，其中，所述基于所述当前音频帧的后验信噪比估计值估计当前音频帧的预估先验信噪比，包括：

通过如下公式估计当前音频帧的预估先验信噪比：

其中，
表示所述预估先验信噪比，α为平滑数，
表示前一帧的降噪处理结果，
表示噪声方差，
表示所述当前音频帧的后验信噪比估计值；

或者，

通过如下公式估计当前音频帧的预估先验信噪比：

其中，
表示所述预估先验信噪比，α为平滑数，
为前一帧的先验信噪比，
表示当前帧的后验信噪比估计值。
如权利要求3所述的方法，还包括：

通过如下公式调整估计所述预估先验信噪比时所需要的平滑数：

其中，a₁和a₂为预设的两个平滑数，且a₁＞a₂，γ_th和ξ_th为两个经验阈值。
如权利要求4所述的方法，其中，所述基于所述语音存在概率估计值估计当前音频帧的预估先验信噪比的步骤，进一步还包括：

通过如下公式进一步估计所述当前音频帧的预估先验信噪比：

或者

其中，
表示所述预估先验信噪比，
和
分别表示平滑数为a₁时所述当前音频帧的预估先验信噪比和平滑数为a₂时所述当前音频帧的预估先验信噪比，p(H₁|Y)表示所述语音存在概率，p_th为预设阈值。
如权利要求1-5中任一项所述的方法，其中，所述根据所述预估先验信噪比，计算所述当前音频帧的所述预估先验信噪比对应的最小均方误差的估计值，包括：

根据所述预估先验信噪比，通过如下公式计算所述当前音频帧的所述预估先验信噪比对应的最小均方误差的估计值：

其中，
表示所述预估先验信噪比对应的最小均方误差的估计值，
表示所述预估先验信噪比，
表示所述当前音频帧的后验信噪比估计值。
如权利要求1-5中任一项所述的方法，其中，所述计算所述当前音频帧的语音存在概率，包括：

通过如下公式计算所述当前音频帧的语音存在概率：

或者

其中，p(H₁|Y)表示所述语音存在概率，p(H₁)和p(H₀)分别表示先验语音存在概率和先验无语音概率，
为一固定值，
表示所述当前音频帧的后验信噪比估计值，exp()为指数函数，γ_min和γ_max为两个经验值，且γ_min＜γ_max，p_max和p_min为两个经验值，且p_min＜p_max。
如权利要求1-5中任一项所述的方法，其中，所述结合所述语音存在概率和所述估计值估计所述当前音频帧的最终先验信噪比，包括：

通过如下公式估计所述当前音频帧的最终先验信噪比：

其中，
表示所述当前音频帧的最终先验信噪比，
表示所述预估先验信噪比的最小均方误差的估计值，p(H₁|Y)表示所述语音存在概率，ξ_min为某一小数值。
一种用户终端，包括：

第一估计模块，用于估计当前音频帧的预估先验信噪比；

第一计算模块，用于根据所述预估先验信噪比，计算所述当前音频帧的所述预估先验信噪比对应的最小均方误差的估计值；

第二计算模块，用于计算所述当前音频帧的语音存在概率；

第二估计模块，用于结合所述语音存在概率和所述估计值估计所述当前音频帧的最终先验信噪比。
如权利要求9所述的用户终端，其中，所述第一估计模块用于基于所述当前音频帧的后验信噪比估计值估计当前音频帧的预估先验信噪比。
如权利要求10所述的用户终端，其中，所述第一估计模块用于通过如下公式估计当前音频帧的预估先验信噪比：

其中，
表示所述预估先验信噪比，α为平滑数，
表示前一帧的降噪处理结果，
表示噪声方差，
表示所述当前音频帧的后验信噪比估计值；

或者，

所述第一估计模块用于通过如下公式估计当前音频帧的预估先验信噪比：

其中，
表示所述预估先验信噪比，α为平滑数，
为前一帧的先验信噪比，
表示当前帧的后验信噪比估计值。
如权利要求11所述的用户终端，还包括：

调整模块，用于通过如下公式调整估计所述预估先验信噪比时所需要的平滑数：

其中，a₁和a₂为预设的两个平滑数，且a₁＞a₂，γ_th和ξ_th为两个经验阈值。
如权利要求12所述的用户终端，其中，所述第一估计模块还用于通过如下公式进一步估计所述当前音频帧的预估先验信噪比：

或者

其中，
表示所述预估先验信噪比，
和
分别表示平滑数为a₁时所述当前音频帧的预估先验信噪比和平滑数为a₂时所述当前音频帧的预估先验信噪比，p(H₁|Y)表示所述语音存在概率，p_th为预设阈值。
如权利要求9-13中任一项所述的用户终端，其中，所述第一计算模块用于根据所述预估先验信噪比，通过如下公式计算所述当前音频帧的所述预估先验信噪比对应的最小均方误差的估计值：

其中，
表示所述预估先验信噪比对应的最小均方误差的估计值，
表示所述预估先验信噪比，
表示所述当前音频帧的后验信噪比估计值。
如权利要求9-13中任一项所述的用户终端，其中，所述第二计算模块用于通过如下公式计算所述当前音频帧的语音存在概率：

或者

其中，p(H₁|Y)表示所述语音存在概率，p(H₁)和p(H₀)分别表示先验语音存在概率和先验无语音概率，
为一固定值，
表示所述当前音频帧的后验信噪比估计值，exp()为指数函数，γ_min和γ_max为两个经验值，且γ_min＜γ_max，p_max和p_min为两个经验值，且p_min＜p_max。
如权利要求9-13中任一项所述的用户终端，其中，所述第二估计模块用于通过如下公式估计所述当前音频帧的最终先验信噪比：

其中，
表示所述当前音频帧的最终先验信噪比，
表示所述预估先验信噪比的最小均方误差的估计值，p(H₁|Y)表示所述语音存在概率，ξ_min为某一小数值。
一种用户终端，包括：处理器、存储器和收发机，其中：

所述处理器用于读取存储器中的程序，执行下列过程：

估计当前音频帧的预估先验信噪比；

根据所述预估先验信噪比，计算所述当前音频帧的所述预估先验信噪比对应的最小均方误差的估计值；

计算所述当前音频帧的语音存在概率；

结合所述语音存在概率和所述估计值估计所述当前音频帧的最终先验信噪比，

其中，所述收发机用于接收和发送数据，所述存储器能够存储处理器在执行操作时所使用的数据。