CN104269178A - 对语音信号进行自适应谱减和小波包消噪处理的方法和装置 - Google Patents

对语音信号进行自适应谱减和小波包消噪处理的方法和装置 Download PDF

Info

Publication number
CN104269178A
CN104269178A CN201410390560.2A CN201410390560A CN104269178A CN 104269178 A CN104269178 A CN 104269178A CN 201410390560 A CN201410390560 A CN 201410390560A CN 104269178 A CN104269178 A CN 104269178A
Authority
CN
China
Prior art keywords
noise
voice signal
formula
signal
signals
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201410390560.2A
Other languages
English (en)
Inventor
张金明
刘宇
陈少卿
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huadi Computer Group Co Ltd
Original Assignee
Huadi Computer Group Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huadi Computer Group Co Ltd filed Critical Huadi Computer Group Co Ltd
Priority to CN201410390560.2A priority Critical patent/CN104269178A/zh
Publication of CN104269178A publication Critical patent/CN104269178A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明实施例提供了一种对语音信号进行自适应谱减和小波包消噪处理的方法和装置,该方法主要包括计算出语音信号的加性模型的功率谱,根据所述语音信号的加性模型的功率谱和带噪信号、噪声信号的功率估计值得到所述语音信号的功率估计值;对所述语音信号的功率估计值进行逆傅立叶变换,得到增强后的语音信号;利用小波变换矩阵对所述增强后的语音信号作小波变换处理;对小波变换矩阵作门限阈值处理,对门限阈值处理过的小波变换矩阵作逆变换,得到消除了噪声的语音信号。本发明有效地解决了电话会议中的语音信号的背景噪声问题,并且不会带来其他的“音乐噪声”等噪声。

Description

对语音信号进行自适应谱减和小波包消噪处理的方法和装置
技术领域
本发明涉及语音信号处理技术领域,尤其涉及一种对语音信号进行自适应谱减和小波包消噪处理的方法和装置。
背景技术
在我国武警、公安、铁路、电力、石油石化等行业的大型企业中,经常召开生产调度会议,需要支持大容量全交互式的电话会议***。在这些电话会议***中,存在大量的异种语音资源终端,这些异种语音资源终端之间需要通过转换设备进行相互语音通信,如公众通信网、数字集群***、卫星网和有线网中的模拟终端(电话)之间通过程控交换机实现互通;VoIP语音电话终端之间通过软交换实现互通;超短波网和短波网终端分别通过IP无线网关和综合接入设备实现向IP体制的转换,然后再通过软交换机和IP电话等终端实现互通,或通过中继接口和程控交换机连接,实现和其他模拟终端的互通。
上述异种语音资源终端和转换设备在实际应用中的噪声干扰通常是随机的,其背景噪声来源和种类各不相同,需要对带噪信号进行噪声消除处理,以消除背景噪声,改善语音质量,提高语音的清晰度、可懂度和舒适度,提高语音处理***的性能。
现有技术中的电话会议***的噪声消除方法的缺点为:对不同背景噪声来源和种类采用单一降噪方法,只改善部分或对某类噪声有效,如减谱法降噪,本身还会带入“音乐噪声”。
发明内容
本发明的实施例提供了一种对语音信号进行自适应谱减和小波包消噪处理的方法和装置,以有效地消除了电话会议中的语音信号的噪声。
本发明提供了如下方案:
(和权利要求书相互对应)
由上述本发明的实施例提供的技术方案可以看出,本发明实施例通过建立语音信号的加性模型,根据语音信号的加性模型的功率谱和带噪信号、噪声信号的功率估计值得到所述语音信号的功率估计值和增强后的语音信号,再根据实时估算的噪声功率和小波变换矩阵得到去噪后的语音信号,有效地解决了电话会议中的语音信号的背景噪声问题,并且不会带来其他的“音乐噪声”等噪声。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例一提供的一种语音资源处理和交换服务平台的结构示意图;
图2为本发明实施例一提供的一种语音增强处理板采用自适应谱减法对带噪信号进行消噪处理的原理示意图;
图3为本发明实施例一种语音增强处理板对语音信号进行自适应谱减和小波包消噪处理的方法的处理流程图;
图4为本发明实施例一提供的一种对带噪信号进行五层小波分解的原理示意图;
图5为本发明实施例提供的一种对语音信号进行自适应谱减和小波包消噪处理的装置的具体结构示意图,图中,语音信号的功率估计值获取模块51,增强语音信号获取模块52,小波变换处理处理模块53,消噪语音信号获取模块54。
具体实施方式
为便于对本发明实施例的理解,下面将结合附图以几个具体实施例为例做进一步的解释说明,且各个实施例并不构成对本发明实施例的限定。
实施例一
本发明实施例提供的一种语音资源处理和交换服务平台的结构示意图如图1所示,该平台主要完成语音增强、音频媒体流的转码、多路混音、录音、放音、回音消除等功能。该平台具备码流转发功能,能够把前端音频流转发到调度台、存储设备;具备强大的流媒体处理能力,单台支持1440路语音无阻塞调度并发、转发处理,单场会议支持480方混音。
上述语音资源处理和交换服务平台中的I/O板:主要实现交换机与硬件平台的外部连接,同时将外部中继线信息用前后板针脚的形式,实现与数字中继板的中继互连。
数字中继板:主要在CPU板的控制下将中继信息转换成H.110总线背板总线形式,为各资源板进行功能服务提供信息来源。
语音导航板:对背板总线上需要提供语音收发、双音频收号、FSK(Frequency-shift Keying:频移键控)发号等各类语音增值服务的话路信息进行处理。
会议桥板:通过对背板总线数据进行处理,提供多方电话会议的建立。
CPU板:通过PCI(Peripheral Component Interconnect:外设部件互连标准)总线控制各语音资源板之间的协调工作能力。
语音增强处理板:主要采用自适应谱减法完成带噪信号的降噪处理和语音增强处理,改善语音质量,提高语音的清晰度、可懂度和舒适度,提高电话会议***的语音性能。
该实施例提供的一种语音增强处理板采用自适应谱减法对带噪信号进行消噪处理的原理示意图如图2所示,基于上述图2所示的自适应谱减法消噪处理的原理,该实施例提供的一种上述语音增强处理板对语音信号进行自适应谱减和小波包消噪处理的方法的处理流程如图3所示,包括如下的处理步骤:
步骤S310、根据低通过滤处理后的带噪信号、噪声信号和语音信号建立语音信号的加性模型。
高通滤波器是一个使高频率比较容易通过而阻止低频率通过的***。它去掉了信号中不必要的低频成分或者说去掉了低频干扰。
本发明实施例中的高通滤波器的基准频率可以设置为50Hz,该高通滤波器不允许比50Hz低的语音信号通过,而允许比50Hz高的语音信号通过,该高通滤波器对带噪信号进行低通过滤处理,抑制带噪信号的50Hz电源工频干扰。
由于语音信号是短时平稳的,所以在短时谱幅度估计中认为语音信号是平稳随机信号,假设s(m)、n(m)和y(m)分别代表语音信号、噪声信号和低通过滤处理后的带噪信号。
假设噪声n(m)是与语音s(m)不相关的加性噪声,于是,建立语音信号的加性模型:
y(m)=s(m)+n(m)            公式1
步骤S320、计算出所述语音信号的加性模型的功率谱,根据所述语音信号的加性模型的功率谱和带噪信号、噪声信号的功率估计值得到所述语音信号的功率估计值。
对信号y(m)、s(m)、n(m)分别进行加窗处理后,得到信号yw(m),sw(m),nw(m),Ss(ω)、Sn(ω)和Sy(ω)分别表示语音信号、噪声信号和低通过滤处理后的带噪信号的短时谱,上述加窗处理表示取傅立叶变换的帧长数。
则有:
yw(m)=sw(m)+nw(m)          公式2
对公式2的两端分别做傅立叶变换,得到
Yw(ω)=Sw(ω)+Nw(ω)           公式3
公式3中的ω表示频率
对公式3的两端分别作功率谱,该功率谱表示研究信号在频域中的各种特征。
得到:
|Yw(ω)|2=|Sw(ω)|2+|Nw(ω)|2+Sw(ω)N* w(ω)+S* w(ω)Nw(ω)         公式4
其中,N* w(ω)表示噪声信号的功率谱,S* w(ω)表示语音信号的功率谱。
|Yw(ω)|2表示带噪信号的功率估计值,可以根据带噪信号y(m)采用随机分析方法求均值估计出|Yw(ω)|2
其余各项必须近似为统计均值,由于s(m)和n(m)独立,则互相的统计均值为0,所以语音信号的功率估计值的计算公式为:
| S ^ w ( ω ) | 2 = | Y w ( ω ) | 2 - E [ | N w ( ω ) | 2 ]        公式5
其中E[|Nw(ω)|2=|Nw(ω)|2+Sw(ω)N* w(ω)+S* w(ω)Nw(ω)=|Nw(ω)|2
由于s(m)和n(m)独立,则互相的统计均值为0。
采用VAD(Voice Activity Detection,语音激活检测法)估计噪声信号的功率估计值|Nw(ω)|2,利用输入信号的前50ms“寂静段”来估计噪声,在语音信号中,说话人由于呼吸会不断产生语音间歇,利用这些间歇估计背景噪声,利用VAD检测到“寂静段”后,再利用下列公式对噪声信号的功率估计值|Nw(ω)|2进行更新:
| N w ( ω ) | 2 = α | N w - 1 ( ω ) | 2 + ( 1 - α ) | S ^ w - 1 ( ω ) | 2        公式6
其中0<α<1,|Nw-1(ω)|是前一帧的噪声信号的功率估计值,是前一帧的语音信号的功率估计值。
因为噪声是局部平稳的,故可以认为发音前的噪声与发音期间的噪声功率谱相同,因而可以利用发语音前的“寂静帧”来估计噪声。
从公式5中可以看出,语音信号的功率估计值不能保证是非负的,这是因为在估计噪声时存在误差,当噪声信号的功率估计值大于某帧带噪信号的功率估计值时,该帧语音信号的功率估计值就会出现为负的情况,这些负值我们可以通过改变它们的符号使之变为正值,也可以直接给它们置零,本发明实施例采用后种处理方式。
步骤S330、对语音信号的功率估计值进行逆傅立叶变换,得到增强后的语音信号。
只要在频域用公式5得到带噪信号的功率估计值,就可以根据公式7得到增强后的语音信号:
        公式7
上述公式中的表示语音信号的相位
上述IFFT表示逆傅立叶变换。
利用人耳对相位不敏感的特点,在公式7中可利用原带噪信号的相位恢复到时域语音信号,从而得到增强后的语音信号,完成整个基于谱减法的语音增强过程。
步骤S340、对增强后的语音信号作小波变换处理。
本发明实施例采用小波包自适应阈值法进一步消除上述增强后的语音信号中的噪声信号。可以利用语音信号和噪声在小波变换下的不同的特性,通过对小波分解系数进行处理来达到语音和噪声分离的目的。在实际工程应用中,语音信号通常表现为低频信号或是一些比较平稳的信号,而噪声信号则通常表现为高频信号。
将上述增强后的语音信号作为带噪信号,先对带噪信号进行小波分解,比如,进行五层小波分解,该实施例提供的一种对带噪信号进行五层小波分解的原理示意图如图4所示:
y=cA5+cD1+cD2+cD3+cD4+cD5
其中cAi为分解的近似部分,cDi为分解的细节部分,i=1,2,3,4,5,则噪声部分通常包含在cD1,cD2,cD3,cD4,cD5中,用门限阈值对小波系数进行处理,重构信号即可达到去噪的目的。
将上述假设s、n和y分别代表语音信号、噪声信号和小波分解后的带噪信号,噪声信号n是具有方差σ2的高斯白噪声,是与语音信号s不相关的加性噪声。于是得到增强后的语音信号的加性模型:
y=s+n                          公式8
对上述公式8的两端进行小波变换,得到:
Y=S+N                         公式9
其中:S=W·s,N=W·n,W是设定的小波变换矩阵, W ( j , k ) = ∫ R x ( t ) ψ j , k ( t ) ‾ dt
其中 ψ j , k ( t ) = 1 2 j ψ ( t 2 j - k ) , j , k ∈ Z
ψ(t)表示小波函数,R表示实数域,t表示时间,x(t)表示需要变换的信号。
步骤S350、对小波变换矩阵W作门限阈值处理,对门限阈值处理过的小波变换矩阵作逆变换W-1,得到消除了噪声的语音信号。
选取最著名的阈值形式:
η t n = σ 2 log n        公式10
上述公式中的σ表示子带的噪声标准差估计,n表示子带序列长度,这里的子带指的是0~4kHz频率范围内语音临界频带划分。
门限阈值处理可以表示为可以证明当n趋于无穷大时使用阈值公式10对小波变换矩阵作软阈值处理,可以几乎完全去除带噪信号中的噪声。
对门限阈值处理过的小波变换矩阵作逆变换W-1,得到消除了噪声信号的语音信号
s ^ = W - 1 · η t n · W · d              公式11
上述公式11中的d是子波系数,见下面的小波包分解公式。
正交尺度函数φ(t)和小波函数ψ(t)构成二尺度方程
&phi; ( t ) = 2 &Sigma; k h k &phi; ( 2 t - k ) , 其中hk=<φ(t),φ(2t-k)>,k∈Z
&psi; ( t ) = 2 &Sigma; k g k &psi; ( 2 t - k ) , 其中gk=<ψ(t),ψ(2t-k)>,k∈Z
小波包分解后,前后两个尺度之间的子波系数关系为:
d m j + 1,2 n = &Sigma; l d l j , h h ^ l - 2 m d m j + 1,2 n + 1 = &Sigma; l d l j , h g ^ l - 2 m
实施例二
该实施例提供了一种对语音信号进行自适应谱减和小波包消噪处理的装置,其具体结构如图5所示,包括如下的模块:
语音信号的功率估计值获取模块51,用于计算出语音信号的加性模型的功率谱,根据所述语音信号的加性模型的功率谱和带噪信号、噪声信号的功率估计值得到所述语音信号的功率估计值;
增强语音信号获取模块52,用于对所述语音信号的功率估计值进行逆傅立叶变换,得到增强后的语音信号;
小波变换处理处理模块53,用于利用小波变换矩阵对所述增强后的语音信号作小波变换处理;
消噪语音信号获取模块54,用于对小波变换矩阵作门限阈值处理,对门限阈值处理过的小波变换矩阵作逆变换,得到消除了噪声的语音信号。
进一步地,所述的语音信号的功率估计值获取模块51,具体用于通过高通滤波器对带噪信号进行低通过滤处理;
设s(m)、n(m)和y(m)分别代表语音信号、噪声信号和低通过滤处理后的带噪信号,噪声n(m)是与语音s(m)不相关的加性噪声,建立语音信号的加性模型为:
y(m)=s(m)+n(m)          公式1;
对所述信号y(m)、s(m)、n(m)分别进行加窗处理后得到信号yw(m),sw(m),nw(m),所述Ss(ω)、Sn(ω)和Sy(ω)分别表示语音信号、噪声信号和低通过滤处理后的带噪信号的短时谱;
yw(m)=sw(m)+nw(m)          公式2
对所述公式2的两端分别做傅立叶变换,得到:
Yw(ω)=Sw(ω)+Nw(ω)          公式3
所述公式3中的ω表示频率
对所述公式3的两端分别作功率谱,得到:
|Yw(ω)|2=|Sw(ω)|2+|Nw(ω)|2+Sw(ω)N* w(ω)+S* w(ω)Nw(ω)         公式4
其中,N* w(ω)表示噪声信号的功率谱,S* w(ω)表示语音信号的功率谱;
根据带噪信号y(m)采用随机分析方法求均值估计出带噪信号的功率估计值|Yw(ω)|2,采用语音激活检测法估计出噪声信号的功率估计值|Nw(ω)|2,得到语音信号的功率估计值的计算公式为:
| S ^ w ( &omega; ) | 2 = | Y w ( &omega; ) | 2 - E [ | N w ( &omega; ) | 2 ]        公式5
其中E[|Nw(ω)2=|Nw(ω)|2+Sw(ω)N* w(ω)+S* w(ω)Nw(ω)=|Nw(ω)|2。由于s(m)和n(m)独立,则互相的统计均值为0。
进一步地,所述的消噪语音信号获取模块52,具体用于设增强后的语音信号为
       公式7
所述公式7中的表示语音信号的相位,所述IFFT表示逆傅立叶变换。
进一步地,所述的小波变换处理处理模块53,具体用于将所述增强后的语音信号作为带噪信号,对该带噪信号进行小波分解,设s、n和y分别为语音信号、噪声信号和小波分解后的带噪信号,得到增强后的语音信号的加性模型:
y=s+n          公式8
对所述公式8的两端进行小波变换,得到:
Y=S+N           公式9
其中:S=W·s,N=W·n,W是设定的小波变换矩阵, W ( j , k ) = &Integral; R x ( t ) &psi; j , k ( t ) &OverBar; dt
&psi; j , k ( t ) = 1 2 j &psi; ( t 2 j - k ) , j , k &Element; Z
ψ(t)表示小波函数,R表示实数域,t表示时间,x(t)表示需要变换的信号。
进一步地,所述的消噪语音信号获取模块54,具体用于选取阈值形式:
&eta; t n = &sigma; 2 log n
上述公式中的σ表示子带的噪声标准差估计,n表示子带序列长度;
对门限阈值处理过的小波变换矩阵作逆变换W-1,得到消除了噪声信号的语音信号
s ^ = W - 1 &CenterDot; &eta; t n &CenterDot; W &CenterDot; d
上述公式11中的d是子波系数,见下面的小波包分解公式。
正交尺度函数φ(t)和小波函数ψ(t)构成二尺度方程
&phi; ( t ) = 2 &Sigma; k h k &phi; ( 2 t - k ) , 其中hk=<φ(t),φ(2t-k)>,k∈Z
&psi; ( t ) = 2 &Sigma; k g k &psi; ( 2 t - k ) , 其中gk=<ψ(t),ψ(2t-k)>,k∈Z
小波包分解后,前后两个尺度之间的子波系数关系为:
d m j + 1,2 n = &Sigma; l d l j , h h ^ l - 2 m d m j + 1,2 n + 1 = &Sigma; l d l j , h g ^ l - 2 m .
用本发明实施例的装置进行对语音信号进行自适应谱减和小波包消噪处理的具体过程与前述方法实施例类似,此处不再赘述。
综上所述,本发明实施例通过建立语音信号的加性模型,根据语音信号的加性模型的功率谱和带噪信号、噪声信号的功率估计值得到所述语音信号的功率估计值和增强后的语音信号,再根据实时估算的噪声功率和小波变换矩阵得到去噪后的语音信号,有效地解决了电话会议中的语音信号的背景噪声问题,并且不会带来其他的“音乐噪声”等噪声。
本发明实施例极大地改善了电话会议的语音质量,提高了语音的清晰度、可懂度和舒适度;提高了语音增强处理的性能;扩展了语音增强处理的方法,克服单一语音处理方法的缺点;在满足大容量、全交互电话会议要求的同时,语音增强处理后,音质更接近于现场会议。
本领域普通技术人员可以理解:附图只是一个实施例的示意图,附图中的模块或流程并不一定是实施本发明所必须的。
通过以上的实施方式的描述可知,本领域的技术人员可以清楚地了解到本发明可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例或者实施例的某些部分所述的方法。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置或***实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。以上所描述的装置及***实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求的保护范围为准。

Claims (9)

1.一种对语音信号进行自适应谱减和小波包消噪处理的方法,其特征在于,包括:
计算出语音信号的加性模型的功率谱,根据所述语音信号的加性模型的功率谱和带噪信号、噪声信号的功率估计值得到所述语音信号的功率估计值;
对所述语音信号的功率估计值进行逆傅立叶变换,得到增强后的语音信号;
利用小波变换矩阵对所述增强后的语音信号作小波变换处理;
对小波变换矩阵作门限阈值处理,对门限阈值处理过的小波变换矩阵作逆变换,得到消除了噪声的语音信号。
2.根据权利要求1所述的对语音信号进行自适应谱减和小波包消噪处理的方法,其特征在于,所述的计算出所述语音信号的加性模型的功率谱,根据所述语音信号的加性模型的功率谱和带噪信号、噪声信号的功率估计值得到所述语音信号的功率估计值,包括:
通过高通滤波器对带噪信号进行低通过滤处理;
设s(m)、n(m)和y(m)分别代表语音信号、噪声信号和低通过滤处理后的带噪信号,噪声n(m)是与语音s(m)不相关的加性噪声,建立语音信号的加性模型为:
y(m)=s(m)+n(m)           公式1。
对所述信号y(m)、s(m)、n(m)分别进行加窗处理后得到信号yw(m),sw(m),nw(m),所述Ss(ω)、Sn(ω)和Sy(ω)分别表示语音信号、噪声信号和低通过滤处理后的带噪信号的短时谱;
yw(m)=sw(m)+nw(m)            公式2
对所述公式2的两端分别做傅立叶变换,得到:
Yw(ω)=Sw(ω)+Nw(ω)          公式3
所述公式3中的ω表示频率
对所述公式3的两端分别作功率谱,得到:
|Yw(ω)|2=|Sw(ω)|2+|Nw(ω)|2+Sw(ω)N* w(ω)+S* w(ω)Nw(ω)     公式4
其中,N* w(ω)表示噪声信号的功率谱,S* w(ω)表示语音信号的功率谱;
根据带噪信号y(m)采用随机分析方法求均值估计出带噪信号的功率估计值|Yw(ω)|2,采用语音激活检测法估计出噪声信号的功率估计值|Nw(ω)|2,得到语音信号的功率估计值的计算公式为:
| S ^ w ( &omega; ) | 2 = | Y w ( &omega; ) | 2 - E [ | N w ( &omega; ) | 2 ]       公式5
其中E[|Nw(ω)|2=|Nw(ω)|2+Sw(ω)N* w(ω)+S* w(ω)Nw(ω)=|Nw(ω)|2
3.根据权利要求2所述的对语音信号进行自适应谱减和小波包消噪处理的方法,其特征在于,所述的采用语音激活检测法估计出噪声信号的功率估计值|Nw(ω)|2,包括:
采用语音激活检测法检测到带噪信号的寂静段后,再利用下列公式6对噪声信号的功率估计值|Nw(ω)|2进行更新:
| N w ( &omega; ) | 2 = &alpha; | N w - 1 ( &omega; ) | 2 + ( 1 - &alpha; ) | S ^ w - 1 ( &omega; ) | 2      公式6
其中0<α<1,|Nw-1(ω)|是前一帧的噪声信号的功率估计值,是前一帧的语音信号的功率估计值。
4.根据权利要求2或3所述的对语音信号进行自适应谱减和小波包消噪处理的方法,其特征在于,所述的对所述语音信号的功率估计值进行逆傅立叶变换,得到增强后的语音信号,包括:
设增强后的语音信号为
        公式7
所述公式7中的表示语音信号的相位,所述IFFT表示逆傅立叶变换。
5.根据权利要求4所述的对语音信号进行自适应谱减和小波包消噪处理的方法,其特征在于,所述的利用小波变换矩阵对所述增强后的语音信号作小波变换处理,包括:
将所述增强后的语音信号作为带噪信号,对该带噪信号进行小波分解,设s、n和y分别为语音信号、噪声信号和小波分解后的带噪信号,得到增强后的语音信号的加性模型:
y=s+n                   公式8
对所述公式8的两端进行小波变换,得到:
Y=S+N               公式9
其中:S=W·s,N=W·n,W是设定的小波变换矩阵, W ( j , k ) = &Integral; R x ( t ) &psi; j , k ( t ) &OverBar; dt
其中 &psi; j , k ( t ) = 1 2 j &psi; ( t 2 j - k ) , j , k &Element; Z
ψ(t)表示小波函数,R表示实数域,t表示时间,x(t)表示需要变换的信号。
6.根据权利要求5所述的对语音信号进行自适应谱减和小波包消噪处理的方法,其特征在于,所述的对小波变换矩阵作门限阈值处理,对门限阈值处理过的小波变换矩阵作逆变换,得到消除了噪声的语音信号,包括:
选取阈值形式:
&eta; t n = &sigma; 2 log n
上述公式中的σ表示子带的噪声标准差估计,n表示子带序列长度;
对门限阈值处理过的小波变换矩阵作逆变换W-1,得到消除了噪声信号的语音信号
s ^ = W - 1 &CenterDot; &eta; t n &CenterDot; W &CenterDot; d .
7.一种对语音信号进行自适应谱减和小波包消噪处理的装置,其特征在于,包括:
语音信号的功率估计值获取模块,用于计算出语音信号的加性模型的功率谱,根据所述语音信号的加性模型的功率谱和带噪信号、噪声信号的功率估计值得到所述语音信号的功率估计值;
增强语音信号获取模块,用于对所述语音信号的功率估计值进行逆傅立叶变换,得到增强后的语音信号;
小波变换处理处理模块,用于利用小波变换矩阵对所述增强后的语音信号作小波变换处理;
消噪语音信号获取模块,用于对小波变换矩阵作门限阈值处理,对门限阈值处理过的小波变换矩阵作逆变换,得到消除了噪声的语音信号。
8.根据权利要求7所述的对语音信号进行自适应谱减和小波包消噪处理的装置,其特征在于:
所述的语音信号的功率估计值获取模块,具体用于通过高通滤波器对带噪信号进行低通过滤处理;
设s(m)、n(m)和y(m)分别代表语音信号、噪声信号和低通过滤处理后的带噪信号,噪声n(m)是与语音s(m)不相关的加性噪声,建立语音信号的加性模型为:
y(m)=s(m)+n(m)             公式1;
对所述信号y(m)、s(m)、n(m)分别进行加窗处理后得到信号yw(m),sw(m),nw(m),所述Ss(ω)、Sn(ω)和Sy(ω)分别表示语音信号、噪声信号和低通过滤处理后的带噪信号的短时谱;
yw(m)=sw(m)+nw(m)          公式2
对所述公式2的两端分别做傅立叶变换,得到:
Yw(ω)=Sw(ω)+Nw(ω)            公式3
所述公式3中的ω表示频率
对所述公式3的两端分别作功率谱,得到:
|Yw(ω)|2=|Sw(ω)|2+|Nw(ω)|2+Sw(ω)N* w(ω)+S* w(ω)Nw(ω)      公式4
其中,N* w(ω)表示噪声信号的功率谱,S* w(ω)表示语音信号的功率谱;
根据带噪信号y(m)采用随机分析方法求均值估计出带噪信号的功率估计值|Yw(ω)|2,采用语音激活检测法估计出噪声信号的功率估计值|Nw(ω)|2,得到语音信号的功率估计值的计算公式为:
| S ^ w ( &omega; ) | 2 = | Y w ( &omega; ) | 2 - E [ | N w ( &omega; ) | 2 ]          公式5
其中E[|Nw(ω)2|=|Nw(ω)|2+Sw(ω)N* w(ω)+S* w(ω)Nw(ω)=|Nw(ω)|2。由于s(m)和n(m)独立,则互相的统计均值为0;
所述的消噪语音信号获取模块,具体用于设增强后的语音信号为
        公式7
所述公式7中的表示语音信号的相位,所述IFFT表示逆傅立叶变换。
9.根据权利要求8所述的对语音信号进行自适应谱减和小波包消噪处理的装置,其特征在于:
所述的小波变换处理处理模块,具体用于将所述增强后的语音信号作为带噪信号,对该带噪信号进行小波分解,设s、n和y分别为语音信号、噪声信号和小波分解后的带噪信号,得到增强后的语音信号的加性模型:
y=s+n             公式8
对所述公式8的两端进行小波变换,得到:
Y=S+N             公式9
其中:S=W·s,N=W·n,W是设定的小波变换矩阵, W ( j , k ) = &Integral; R x ( t ) &psi; j , k ( t ) &OverBar; dt
其中 &psi; j , k ( t ) = 1 2 j &psi; ( t 2 j - k ) , j , k &Element; Z
ψ(t)表示小波函数,R表示实数域,t表示时间,x(t)表示需要变换的信号;
所述的消噪语音信号获取模块,具体用于选取阈值形式:
&eta; t n = &sigma; 2 log n
上述公式中的σ表示子带的噪声标准差估计,n表示子带序列长度;
对门限阈值处理过的小波变换矩阵作逆变换W-1,得到消除了噪声信号的语音信号
s ^ = W - 1 &CenterDot; &eta; t n &CenterDot; W &CenterDot; d .
CN201410390560.2A 2014-08-08 2014-08-08 对语音信号进行自适应谱减和小波包消噪处理的方法和装置 Pending CN104269178A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410390560.2A CN104269178A (zh) 2014-08-08 2014-08-08 对语音信号进行自适应谱减和小波包消噪处理的方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410390560.2A CN104269178A (zh) 2014-08-08 2014-08-08 对语音信号进行自适应谱减和小波包消噪处理的方法和装置

Publications (1)

Publication Number Publication Date
CN104269178A true CN104269178A (zh) 2015-01-07

Family

ID=52160693

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410390560.2A Pending CN104269178A (zh) 2014-08-08 2014-08-08 对语音信号进行自适应谱减和小波包消噪处理的方法和装置

Country Status (1)

Country Link
CN (1) CN104269178A (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106303357A (zh) * 2016-08-30 2017-01-04 福州瑞芯微电子股份有限公司 一种远场语音增强的视频通话方法与***
CN106531174A (zh) * 2016-11-27 2017-03-22 福州大学 基于小波包分解和声谱图特征的动物声音识别方法
CN108198545A (zh) * 2017-12-19 2018-06-22 安徽建筑大学 一种基于小波变换的语音识别方法
CN109643554A (zh) * 2018-11-28 2019-04-16 深圳市汇顶科技股份有限公司 自适应语音增强方法和电子设备
CN110033757A (zh) * 2019-04-04 2019-07-19 行知技术有限公司 一种人声识别算法
CN110808059A (zh) * 2019-10-10 2020-02-18 天津大学 一种基于谱减法和小波变换的语音降噪方法
CN111110469A (zh) * 2019-12-13 2020-05-08 南方医科大学南方医院 一种多功能护理床
CN111226277A (zh) * 2017-12-18 2020-06-02 华为技术有限公司 语音增强方法及装置
CN111641572A (zh) * 2020-05-22 2020-09-08 Oppo广东移动通信有限公司 一种噪声功率评估方法及装置、存储介质

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1133152C (zh) * 1999-04-19 2003-12-31 摩托罗拉公司 控制语音信号的噪声量估计的更新的方法以及发射机
CN1838839A (zh) * 2006-04-07 2006-09-27 清华大学 扬声器纯音检测方法
CN101320559A (zh) * 2007-06-07 2008-12-10 华为技术有限公司 一种声音激活检测装置及方法
CN101625869A (zh) * 2009-08-11 2010-01-13 中国人民解放军第四军医大学 一种基于小波包能量的非空气传导语音增强方法
US20100023327A1 (en) * 2006-11-21 2010-01-28 Iucf-Hyu (Industry-University Cooperation Foundation Hanyang University Method for improving speech signal non-linear overweighting gain in wavelet packet transform domain
CN101976566A (zh) * 2010-07-09 2011-02-16 瑞声声学科技(深圳)有限公司 语音增强方法及应用该方法的装置
CN102832908A (zh) * 2012-09-20 2012-12-19 西安科技大学 基于小波变换与变步长lms自适应滤波的信号降噪方法
CN103594094A (zh) * 2012-08-15 2014-02-19 王景芳 自适应谱减法实时语音增强
CN103903629A (zh) * 2012-12-28 2014-07-02 联芯科技有限公司 基于隐马尔科夫链模型的噪声估计方法和装置

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1133152C (zh) * 1999-04-19 2003-12-31 摩托罗拉公司 控制语音信号的噪声量估计的更新的方法以及发射机
CN1838839A (zh) * 2006-04-07 2006-09-27 清华大学 扬声器纯音检测方法
US20100023327A1 (en) * 2006-11-21 2010-01-28 Iucf-Hyu (Industry-University Cooperation Foundation Hanyang University Method for improving speech signal non-linear overweighting gain in wavelet packet transform domain
CN101320559A (zh) * 2007-06-07 2008-12-10 华为技术有限公司 一种声音激活检测装置及方法
CN101625869A (zh) * 2009-08-11 2010-01-13 中国人民解放军第四军医大学 一种基于小波包能量的非空气传导语音增强方法
CN101976566A (zh) * 2010-07-09 2011-02-16 瑞声声学科技(深圳)有限公司 语音增强方法及应用该方法的装置
CN103594094A (zh) * 2012-08-15 2014-02-19 王景芳 自适应谱减法实时语音增强
CN102832908A (zh) * 2012-09-20 2012-12-19 西安科技大学 基于小波变换与变步长lms自适应滤波的信号降噪方法
CN103903629A (zh) * 2012-12-28 2014-07-02 联芯科技有限公司 基于隐马尔科夫链模型的噪声估计方法和装置

Non-Patent Citations (11)

* Cited by examiner, † Cited by third party
Title
冯玉亮: "《语音增强方法研究》", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *
孙晋松: "《语音增强算法的研究及改进》", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *
张洪涛 等: "《谱减法与小波变换联合语音增强研究》", 《湖北工业大学学报》 *
朱建华 等: "《基于谱减法和小波阈值的新型语音降噪算法研究》", 《煤炭技术》 *
田玉静 等: "《Bark子带小波包自适应阈值语音去噪方法》", 《计算机应用》 *
田玉静 等: "《小波包自适应阈值语音降噪新算法》", 《应用声学》 *
赵洋: "《基于正交小波变换和谱减法的语音增强研究》", 《科技创新导报》 *
闵姝君: "《基于自适应谱估计的语音增强算法研究及应用》", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *
陈国明: "《基于人耳掩蔽效应的语音增强算法研究》", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *
靳晨升: "《语音增强算法的研究》", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *
马明: "《基于谱减法和小波阈值分解的联合消噪算法研究》", 《无线互联科技》 *

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106303357A (zh) * 2016-08-30 2017-01-04 福州瑞芯微电子股份有限公司 一种远场语音增强的视频通话方法与***
CN106303357B (zh) * 2016-08-30 2019-11-08 福州瑞芯微电子股份有限公司 一种远场语音增强的视频通话方法与***
CN106531174A (zh) * 2016-11-27 2017-03-22 福州大学 基于小波包分解和声谱图特征的动物声音识别方法
CN111226277A (zh) * 2017-12-18 2020-06-02 华为技术有限公司 语音增强方法及装置
CN108198545A (zh) * 2017-12-19 2018-06-22 安徽建筑大学 一种基于小波变换的语音识别方法
CN108198545B (zh) * 2017-12-19 2021-11-02 安徽建筑大学 一种基于小波变换的语音识别方法
CN109643554A (zh) * 2018-11-28 2019-04-16 深圳市汇顶科技股份有限公司 自适应语音增强方法和电子设备
CN110033757A (zh) * 2019-04-04 2019-07-19 行知技术有限公司 一种人声识别算法
CN110808059A (zh) * 2019-10-10 2020-02-18 天津大学 一种基于谱减法和小波变换的语音降噪方法
CN111110469A (zh) * 2019-12-13 2020-05-08 南方医科大学南方医院 一种多功能护理床
CN111641572A (zh) * 2020-05-22 2020-09-08 Oppo广东移动通信有限公司 一种噪声功率评估方法及装置、存储介质

Similar Documents

Publication Publication Date Title
CN104269178A (zh) 对语音信号进行自适应谱减和小波包消噪处理的方法和装置
EP3698360B1 (en) Noise reduction using machine learning
CN104200811A (zh) 对语音信号进行自适应谱减消噪处理的方法和装置
CN111341336B (zh) 一种回声消除方法、装置、终端设备及介质
US7313518B2 (en) Noise reduction method and device using two pass filtering
JP5122879B2 (ja) 時間および周波数領域内のパーティションされた高速畳み込み
CN102739886B (zh) 基于回声频谱估计和语音存在概率的立体声回声抵消方法
Tu et al. Speech enhancement based on deep neural networks with skip connections
CN106233382B (zh) 一种对若干个输入音频信号进行去混响的信号处理装置
CN101896969A (zh) 用于通过音频电平进行上下文取代的***、方法及设备
CN100520913C (zh) 增强语音质量的方法及其装置
CN105788607A (zh) 应用于双麦克风阵列的语音增强方法
CN103632677A (zh) 带噪语音信号处理方法、装置及服务器
CN102377454B (zh) 一种回声消除的方法和装置
CN106210368A (zh) 消除多通道声回波的方法和装置
CN104064191B (zh) 混音方法及装置
WO2015009293A1 (en) Background noise reduction in voice communication
Barros et al. Estimation of speech embedded in a reverberant and noisy environment by independent component analysis and wavelets
CN114530160A (zh) 模型训练方法、回声消除方法、***、设备及存储介质
CN204117590U (zh) 语音采集降噪装置以及语音质量评价***
CN113593599A (zh) 一种去除语音信号中噪声信号的方法
CN102623016A (zh) 宽带语音处理方法及装置
KR20110024969A (ko) 음성신호에서 통계적 모델을 이용한 잡음 제거 장치 및 방법
US20240203439A1 (en) Noise Reduction Based on Dynamic Neural Networks
Chavan et al. Studies on implementation of Harr and Daubechies wavelet for denoising of speech signal

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20150107