CN105575397A - 语音降噪方法及语音采集设备 - Google Patents

语音降噪方法及语音采集设备 Download PDF

Info

Publication number
CN105575397A
CN105575397A CN201410525618.XA CN201410525618A CN105575397A CN 105575397 A CN105575397 A CN 105575397A CN 201410525618 A CN201410525618 A CN 201410525618A CN 105575397 A CN105575397 A CN 105575397A
Authority
CN
China
Prior art keywords
voice
filter
noising
signal
noise
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201410525618.XA
Other languages
English (en)
Other versions
CN105575397B (zh
Inventor
吴晟
蒋斌
林福辉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Spreadtrum Communications Shanghai Co Ltd
Original Assignee
Spreadtrum Communications Shanghai Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Spreadtrum Communications Shanghai Co Ltd filed Critical Spreadtrum Communications Shanghai Co Ltd
Priority to CN201410525618.XA priority Critical patent/CN105575397B/zh
Publication of CN105575397A publication Critical patent/CN105575397A/zh
Application granted granted Critical
Publication of CN105575397B publication Critical patent/CN105575397B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Soundproofing, Sound Blocking, And Sound Damping (AREA)
  • Filters That Use Time-Delay Elements (AREA)

Abstract

本发明提供一种语音降噪方法及语音采集设备,其中,通过一滤波组件,对一滤波形成的消噪语音信号,以及一滤波形成的参考噪声信号进行频域转换并滤波,以滤波输出、对应所述参考噪声信号的原始噪声信号、以及对应所述消噪语音信号的含噪语音信号,分别控制形成所述参考噪声信号的第一抗串扰滤波单元,以及形成所述消噪语音信号的第二抗串扰滤波单元进行滤波系数更新。其技术方案的有益效果是:通过仅使用一对自适应滤波器,并通过后滤波器控制该一对自适应滤波器的滤波系数更新,从而简化了的结构;通过对语音信号和噪声信号的滤波系数更新权重分别进行有针对性的调整,实现优秀的抗串扰和降噪效果。

Description

语音降噪方法及语音采集设备
技术领域
本发明涉及通讯领域,尤其涉及语音降噪方法及语音采集设备。
背景技术
随着通讯技术的革新,人们对于语音通讯的质量要求不断提高。其中,移动通讯终端的抗噪性能是语音通讯质量的重要关注点。在经历了单麦克风***通过单通道语音增强方案降低噪声,提高语音质量的阶段以后,越来越多的移动通讯终端开始配置双麦克风(DualMic)***。这种双麦克风***通常采用主次麦克风的结构,它将一个主麦克风放置在手机下端,靠近嘴的位置,用于接收含噪语音信号,另一个次麦克风放置在手机上端的背部或顶部,靠近耳朵的位置,用于接收以噪声为主的参考噪声信号,如图1所示。
基于这种物理结构,自适应噪声消除(AdaptiveNoiseCancellation,ANC)可以利用含噪语音信号和参考噪声信号这两个信号来进行分析和计算,得到干净的语音。但是,采用目前的技术方案在实际应用中起到的降噪效果并不是很理想,输出的语音还是有存在较大的失真。
因此,如何进一步提高通话质量一直为本领域技术人员所致力研究的方向。
发明内容
针对现有的自适应噪声消除技术中存在的上述问题,本发明旨在提供一种结构简单,并可有效实现有效的抗串扰以及提高语音质量的语音降噪方法及语音采集设备。
具体技术方案如下:
一种语音降噪方法,其中,
通过一滤波组件,对一滤波形成的消噪语音信号,以及一滤波形成的参考噪声信号进行频域转换并滤波,以滤波输出、对应所述参考噪声信号的原始噪声信号、以及对应所述消噪语音信号的含噪语音信号,分别控制形成所述参考噪声信号的第一抗串扰滤波单元,以及形成所述消噪语音信号的第二抗串扰滤波单元进行滤波系数更新。
优选的,所述滤波组件采用离散傅立叶变换,或离散余弦变换,或改进余弦变换对所述消噪语音信号进行频域转换得到第一幅度谱;和/或
所述滤波组件采用离散傅立叶变换,或离散余弦变换,或改进余弦变换对所述参考噪声信号进行频域转换得到第二幅度谱。
优选的,采用离散傅立叶变换得到所述第一幅度谱的公式为:
E a 1 [ k ] t = | Σ n = 1 M w ana ( n ) e 1 ( t - M + n ) e - 2 πj ( n - 1 ) ( k - 1 ) M | , k = 1,2,3 , . . . M
其中,Ea1为所述第一幅度谱,e1(t)为所述参考噪声信号,e为自然对数的底数,j为虚数单位,j=(-1)0.5,wana(n)为窗函数,n=1,2,…M,M为频域分析的时间窗长度;和/或
采用离散傅立叶变换得到所述第二幅度谱的公式为:
E a 2 [ k ] t = | Σ n = 1 M w ana ( n ) e 2 ( t - M + n ) e - 2 πj ( n - 1 ) ( k - 1 ) M | , k = 1,2,3 , . . . M
其中,Ea2为第二幅度谱,e2(t)为所述消噪语音信号,e为自然对数的底数,j为虚数单位,j=(-1)0.5,wana(n)为窗函数,n=1,2,…M,M为频域分析的时间窗长度。
优选的,所述窗函数wana(n)为矩形窗,或者正弦窗,或者汉宁窗,或者海明窗,或者Tukey窗。
优选的,M的取值范围为fs/100/2<M<0.4fs,其中fs为采样频率。
优选的,所述滤波组件提供一后滤波器,所述后滤波器为具有M点冲激响应的频域维纳滤波器,通过下式计算所述频域维纳滤波器的解:
G [ k ] t = max ( P s 1 [ k ] t - P n [ k ] t , 0 ) P s 1 [ k ] t , k = 1,2,3 , . . . , M ,
其中,G为所述维纳滤波器的解,Psl为所述消噪语音信号的自功率谱,Pn为噪声的自功率谱;或者
所述滤波组件提供一后滤波器,所述后滤波器为具有M点冲激响应的频域维纳滤波器,通过下式计算所述频域维纳滤波器的解:
G [ k ] t = SNR [ k ] t SNR [ k ] t + 1 , k = 1,2,3 , . . . , M ,
SNR[k]t=αG[k]t-1 2SNRP[k]t-1+(1-α)max(SNRP[k]t-1,0)
SNR P [ k ] t = P s 1 [ k ] t P n [ k ] t ,
其中,G为所述维纳滤波器的解,SNR为信噪比,SNRp为先验信噪比,Psl为所述消噪语音信号的自功率谱,Pn为噪声的自功率谱,0<α<1。
优选的,所述消噪语音信号的自功率谱Psl通过下式计算:
Ps1[k]t=|Ea1[k]t|2
其中,Ea1为所述消噪语音信号经频域转换后获得的第一幅度谱。
优选的,所述噪声的自功率谱Pn通过下式进行估计:
P n [ k ] t = &eta; 1 P n [ k ] t - 1 + ( 1 - &eta; 1 ) P s [ k ] t , P n [ k ] t - 1 > P s [ k ] t max ( P n [ k ] t - 1 , &eta; 2 P n [ k ] t - 1 + ( 1 - &eta; 2 ) P s [ k ] t - &eta; 3 P s [ k ] t - 1 ( 1 - &eta; 3 ) ) , P n [ k ] t - 1 &le; P s [ k ] t ,
其中,η1,η2,η3为平滑因子,0<η1,η2,η3<1;
Ps为所述消噪语音信号的自功率谱,或者Ps为所述消噪语音信号的自功率谱与所述参考噪声信号的自功率谱两者之间的较小值。
优选的,Ps为所述消噪语音信号的自功率谱时,Ps通过下式计算:
Ps[k]t=|Ea1[k]t|2
其中,Ea1为所述消噪语音信号经频域转换后获得的第一幅度谱。
优选的,Ps为所述消噪语音信号的自功率谱与所述参考噪声信号的自功率谱两者之间的较小值时,Ps通过下式计算:
Ps[k]t=min(|Ea1[k]t|2,|Ea2[k]t|2);
其中,
Ea1为所述消噪语音信号经频域转换后获得的第一幅度谱;
Ea2为所述参考噪音信号经频域转换后获得的第二幅度谱。
优选的,提供一语音激活检测单元,所述语音激活检测单元连接所述滤波组件;
所述语音激活检测单元根据所述含噪语音信号,或者所述含噪语音信号和所述原始噪声器信号,判断是否采集到语音信号,并向所述滤波组件输出判断结果。
优选的,Ps通过下式计算:
P s [ k ] t = min ( | E a 1 [ k ] t | 2 , | E a 2 [ k ] t | 2 ) , VAD is true min [ max ( | E a 1 [ k ] t | 2 , | E a 2 [ k ] t | 2 ) , &beta; | E a 1 [ k ] t | 2 ] , VAD is false ;
其中,VAD为所述语音激活检测单元的输出值,true为采集到语音信号,false为未采集到语音信号;
Ea1为所述消噪语音信号经频域转换后获得的第一幅度谱;
Ea2为所述参考噪音信号经频域转换后获得的第二幅度谱;
β为控制因子,1<β<5。
优选的,所述滤波组件提供一第一自适应滤波器,及一第二自适应滤波器;
所述第一自适应滤波器根据所述频域维纳滤波器的解G、所述参考噪声信号以及所述含噪语音信号计算所述第一抗串扰滤波单元的滤波系数更新项并通过所述滤波系数更新项更新所述第一抗串扰滤波单元的滤波系数g1,t
所述第二自适应滤波器根据所述频域维纳滤波器的解G、所述消噪语音信号以及所述噪声信号,计算所述第二抗串扰滤波单元的滤波系数更新项并采用所述滤波系数更新项更新所述第二抗串扰滤波单元的滤波系数g2,t
优选的,所述第一抗串扰滤波单元通过下式更新滤波系数g1,t
g 1 [ k ] t + 1 = g 1 [ k ] t + g ^ 1 [ k ] t , k = 1,2 , . . . , N ; 和/或
所述第二抗串扰滤波单元通过下式更新滤波系数g2,t
g 2 [ k ] t + 1 = g 2 [ k ] t + g ^ 2 [ k ] t , k = 1,2 , . . . , N .
优选的,所述第一自适应滤波器通过频域最小均方算法计算所述第一抗串扰滤波单元的滤波系数更新项具体算式如下:
其中,G1=Gλ
λ为大于0的非线性控制因子;
μ为更新步长,且0<μ<2;
ε为防止除零错误的微小正数;
·为点乘符号;
上标*为共轭操作;
下标N×N表示矩阵为N行N列;
下标N×(M-N)表示矩阵为N行M-N列;
S1,t为所述含噪语音信号s1(t)的M点傅立叶变换;
E2,t为所述参考噪声信号e2(t)的M点傅立叶变换;
F-为反傅立叶变换矩阵;
E[|S1,t|2]为|S1,t|2在t时刻的短期数学期望。
优选的,S1,t通过下式计算:
S1,t=F[s1(t-M+1),s1(t-M+2),…,s1(t)]T
其中,上标T为转置操作;和/或
E2,t通过下式计算:
E2,t=F{[0,0,…,0]1×N[e2(t-(M-N)+1),e2(t-(M-N)+2),…,e2(t)]}T
其中,上标T为转置操作;和/或
E[|S1,t|2]通过自回归法进行获取,具体算式如下:
E[|S1,t|2]=γE[|S1,t-1|2]+(1-γ)|S1,t|2,0<γ<1。
优选的,所述第二自适应滤波器通过频域最小均方算法计算所述第二抗串扰滤波单元的滤波系数更新项具体算式如下:
其中,G2=1–Gλ或G2=(1–G)λ
λ为大于0的非线性控制因子;
μ为更新步长,且0<μ<2;
ε为防止除零错误的微小正数;
·为点乘符号;
上标*为共轭操作;
下标N×N表示矩阵为N行N列;
下标N×(M-N)表示矩阵为N行M-N列;
S2,t为噪声信号s2(t)的M点傅立叶变换;
E1,t为消噪语音信号e1(t)的M点傅立叶变换;
F-为反傅立叶变换矩阵;
E[|S2,t|2]为|S2,t|2在t时刻的短期数学期望。
优选的,S2,t通过下式计算:
S2,t=F[s2(t-M+1),s2(t-M+2),…,s2(t)]T
其中,F为傅立叶变换矩阵,上标T为转置操作;和/或
E1,t通过下式计算:
E1,t=F{[0,0,…,0]1×N[e1(t-(M-N)+1),e1(t-(M-N)+2),…,e1(t)]}T
其中,F为傅立叶变换矩阵,上标T为转置操作;和/或
E[|S2,t|2]通过自回归法进行获取,具体算式如下:
E[|S2,t|2]=γE[|S2,t-1|2]+(1-γ)|S2,t|2,0<γ<1。
优选的,所述第一自适应滤波器通过加窗频域最小均方算法计算所述第一抗串扰滤波单元的滤波系数更新项具体算式如下:
其中,G1=Gλ
λ为大于0的非线性控制因子;
μ为更新步长且0<μ<2;
ε为防止除零错误的微小正数;
·为点乘符号;
上标*为共轭操作;
下标N×N表示矩阵为N行N列;
下标N×(M-N)表示矩阵为N行M-N列;
Sw1,t为含噪语音信号s1(t)的M点窗傅立叶变换;
Ew2,t为参考噪声信号e2(t)的M点窗傅立叶变换;
F-为反傅立叶变换矩阵;
E[|Sw1,t|2]为|Sw1,t|2在t时刻的短期数学期望。
优选的,Sw1,t通过下式计算:
Sw1,t=F[wadf(t-M+1)s1(t-M+1),wadf(t-M+2)s1(t-M+2),…,wadf(t)s1(t)]T
其中,F为傅立叶变换矩阵,上标T为转置操作,wadf(k)为窗函数,k=1,2,…M;和/或
Ew2,t通过下式计算:
Ew2,t=F[wadf(t-M+1)e2(t-M+1),wadf(t-M+2)e2(t-M+2),…,wadf(t)e2(t)]T
其中,F为傅立叶变换矩阵,上标T为转置操作,wadf(k)为窗函数,k=1,2,…M;和/或
E[|Sw1,t|2]通过自回归法进行获取,具体算式如下:
E[|Sw1,t|2]=γE[|Sw1,t-1|2]+(1-γ)|Sw1,t|2,0<γ<1。
优选的,所述第二自适应滤波器通过加窗频域最小均方算法计算所述第二抗串扰滤波单元的滤波系数更新项具体算式如下:
其中,G2=1–Gλ或G2=(1–G)λ
λ为大于0的非线性控制因子;
μ为更新步长且0<μ<2;
ε为防止除零错误的微小正数;
·为点乘符号;
上标*为共轭操作;
下标N×N表示矩阵为N行N列;
下标N×(M-N)表示矩阵为N行M-N列;
Sw2,t为噪声信号s2(t)的M点窗傅立叶变换;
Ew1,t为消噪语音信号e1(t)的M点窗傅立叶变换;
F-为反傅立叶变换矩阵;
E[|Sw2,t|2]为|Sw2,t|2在t时刻的短期数学期望。
优选的,Sw2,t通过下式计算:
Sw2,t=F[wadf(t-M+1)s2(t-M+1),wadf(t-M+2)s2(t-M+2),…,wadf(t)s2(t)]T
其中,F为傅立叶变换矩阵,上标T为转置操作,wadf(k)为窗函数,k=1,2,…M;和/或
Ew1,t通过下式计算:
Ew1,t=F[wadf(t-M+1)e1(t-M+1),wadf(t-M+2)e1(t-M+2),…,wadf(t)e1(t)]T
其中,F为傅立叶变换矩阵,上标T为转置操作,wadf(k)为窗函数,k=1,2,…M;和/或
E[|Sw2,t|2]通过自回归法进行获取,具体算式如下:
E[|Sw2,t|2]=γE[|Sw2,t-1|2]+(1-γ)|Sw2,t|2,0<γ<1。
优选的,所述窗函数wadf为矩形窗,或者正弦窗,或者汉宁窗,或者海明窗,或者Tukey窗。
优选的,所述第一抗串扰滤波单元包括第一有限冲激响应滤波器,所述第一有限冲激响应滤波器通过下式对所述含噪语音信号进行滤波以获取第一滤波信号:
p 1 ( t ) = &Sigma; k = 1 N s 1 ( t - k + 1 ) g 1 [ k ] t
其中,k为自然序列,g1,t为所述第一有限冲激响应滤波器的滤波系数,N为所述第一有限冲激响应滤波器的冲激响应长度,p1(t)为所述第一滤波信号,s1(t)为所述含噪语音信号,t为采样时刻的序号,下标t表示变量所处的采样时刻;和/或
所述第二抗串扰滤波单元包括第二有限冲激响应滤波器,所述第二有限冲激响应滤波器通过下式对所述原始噪声信号进行滤波以获取所述第二滤波信号:
p 2 ( t ) = &Sigma; k = 1 N s 2 ( t - k + 1 ) g 2 [ k ] t
其中,k为自然序列,g2,t为所述第二有限冲激响应滤波器的滤波系数,N为所述第二有限冲激响应滤波器的冲激响应长度,p2(t)为所述第二滤波信号,s2(t)为所述原始噪声信号,t为采样时刻序号,下标t表示变量所处的采样时刻。
优选的,所述N的取值范围为fs/100/2<N<0.2fs,其中fs为采样频率;或者
当fs=8000Hz时N=256,其中fs为采样频率。
优选的,第二抗串扰滤波单元还包括一第一减法器,所述第一减法器用以将所述含噪语音信号减去所述第二滤波信号以获得所述消噪语音信号;和/或
第一抗串扰滤波单元还包括一第二减法器,所述第二减法器用以将所述原始噪声信号减去所述第一滤波信号以获得所述参考噪声信号。
优选的,第一抗串扰滤波单元还包括一第一延迟单元,所述第一延迟单元用以将所述含噪语音信号延迟后提供至所述第一减法器;和/或
第二抗串扰滤波单元还包括一第二延迟单元,所述第二延迟单元用以将所述原始噪声信号延迟后提供至所述第二减法器。
还包括一种语音采集设备,其中,采用如上述语音降噪方法。
上述技术方案的有益效果为:
1、通过仅使用一对自适应滤波器(ADF),通过后滤波器控制该一对自适应滤波器的滤波系数更新,从而简化了的结构。
2、通过对语音信号和噪声信号的滤波系数更新权重分别进行有针对性的调整,实现优秀的抗串扰和降噪效果。
附图说明
通过阅读参照以下附图对非限制性实施例所作的详细描述,本发明及其特征、外形和优点将会变得更明显。在全部附图中相同的标记指示相同的部分。并未刻意按照比例绘制附图,重点在于示出本发明的主旨。
图1为现有技术中在无串扰的理想情况的自适应噪声消除原理图;
图2为现有技术中在有串扰的实际情况的自适应噪声消除原理;
图3为现有技术中双自适应滤波器结构的抗串扰自适应噪声消除原理图;
图4为现有技术中多级自适应滤波器结构的抗串扰自适应噪声消除原理图;
图5为现有技术中语音激活检测控制的多级自适应滤波器结构的抗串扰自适应噪声消除原理图;
图6为本发明提供的一种语音降噪方法的实施例的原理示意图;
图7为本发明提供的一种语音降噪方法的滤波组件的一种实施例的结构示意图;
图8为本发明提供的一种语音降噪方法的一种实施例的结构示意图;
图9为本发明提供的一种语音降噪方法的实施例在单噪声源环境下降噪前后的语谱演示对比图;
图10为本发明提供的一种语音降噪方法的实施例在单噪声源环境下降噪前后的波形演示对比图;
图11为在本发明提供的一种语音降噪方法的实施例在扩散噪声场降噪前主麦克风和次麦克风的语谱演示图;
图12为在本发明提供的一种语音降噪方法的实施例在扩散噪声场降噪后主麦克风和次麦克风的语谱演示图;
图13为本发明提供的一种语音降噪方法的实施例在扩散噪声场主麦克风降噪前后的波形演示图;
图14为本发明提供的一种语音降噪方法的实施例在扩散噪声场次麦克风降噪前后的波形演示图。
具体实施方式
在下文的描述中,给出了大量具体的细节以便提供对本发明更为彻底的理解。然而,对于本领域技术人员而言显而易见的是,本发明可以无需一个或多个这些细节而得以实施。在其他的例子中,为了避免与本发明发生混淆,对于本领域公知的一些技术特征未进行描述。
应当理解的是,本发明能够以不同形式实施,而不应当解释为局限于这里提出的实施例。相反地,提供这些实施例将使公开彻底和完全,并且将本发明的范围完全地传递给本领域技术人员。在附图中,为了清楚,层和区的尺寸以及相对尺寸可能被夸大。自始至终相同附图标记表示相同的元件。
在此使用的术语的目的仅在于描述具体实施例并且不作为本发明的限制。在此使用时,单数形式的“一”、“一个”和“所述/该”也意图包括复数形式,除非上下文清楚指出另外的方式。还应明白术语“组成”和/或“包括”,当在该说明书中使用时,确定所述特征、整数、步骤、操作、元件和/或部件的存在,但不排除一个或更多其它的特征、整数、步骤、操作、元件、部件和/或组的存在或添加。在此使用时,术语“和/或”包括相关所列项目的任何及所有组合。
需要指出的是,本发明技术方案中的实施方式和/或技术特征在不冲突于本发明主旨的前提下可相互组合。
为了彻底理解本发明,将在下列的描述中提出详细的步骤以及详细的结构,以便阐释本发明的技术方案。本发明的较佳实施例详细描述如下,然而除了这些详细描述外,本发明还可以具有其他实施方式。
本发明基于如下发现,在一个理想的无串扰的情况下,ANC技术的实现过程如图1所示,语音信号ss经过传输途径h1到达主麦克风1;噪声信号sn经过传输途径h2到达次麦克风2,与此同时噪声信号sn经过传输途径h4到达麦克风1。
那么主麦克风1收到了含噪语音信号s1,次麦克风2收到了噪音信号s2
s 1 = h 1 &CircleTimes; s s + h 4 &CircleTimes; s n s 2 = h 2 &CircleTimes; s n ,
其中代表信号和传递函数的卷积或滤波。图1所示的ANC实现过程使用一个滤波系数为g1的自适应滤波器,它利用主麦克风1收到的含噪语音信号s1和次麦克风2收到的噪声信号s2进行滤波和更新,滤波过程以下式体现:
s f 1 = g 1 &CircleTimes; s 2
滤波信号sf1和主麦克风1收到的含噪语音信号s1相减得到误差信号se1,其获得过程以下式体现:
s e 1 = s 1 - s f 1 = h 1 &CircleTimes; s s + h 4 &CircleTimes; s n - g 1 &CircleTimes; h 2 &CircleTimes; s n
误差信号se1反馈给自适应滤波器进行滤波器系数更新。显然,当自适应滤波器收敛到时,就能够将主麦克风1收到的含噪语音信号s1中的噪声分量全部消除,达到了消噪的目的。
然而,理想的情况实际上并不会出现,在真实的使用环境中,如图2所示,总存在着一个串扰路径h3,使语音信号ss泄漏到次麦克风2。这个串扰将严重干扰自适应滤波器的更新。如果没有很好地解决串扰问题,ANC技术将不会带来有益效果,反而会损害语音质量。
为了能够解决串扰问题,很多改进的结构得到推出,它们一般称为抗串扰自适应噪声消除(Cross-talkResistantANC,CR-ANC)技术。
参照图3所示,图3中展示了现有技术中的一种对实时性要求很高的CR-ANC结构,它用一对自适应滤波器实现,并且要用互相的滤波误差作为滤波输入,对延迟要求很高,因此几乎难以实现。见文献[1]。
现有技术中还有一种级联的CR-ANC结构,如图4所示,在第一级自适应滤波器1输出得到相对有所降噪的语音之后,作为第二级自适应滤波器2的输入来估计次麦克风2采集到的信号中的串扰成分并将其削弱,第二级自适应滤波器2的输出中串扰成分得到降低以后,再用它作为噪声参考输入到第三级自适应滤波器3,并在最后一级得到降噪的语音输出。见文献[2]。
在现有技术的某些实施例中,通过在图4所示结构的基础上,通过增加一个语音激活检测模块用于控制3个自适应滤波器的开启和更新,如图5所示,它进一步提高了工作稳定性。见文献[3]。
尽管现有技术有多种CR-ANC的方案被提出,但是ANC的性能有限,因为语音串扰的传递途径是实时发生改变的,例如当说话人或者设备移动,其传递途径就会发生变化,若说话人更迭,则信号也会产生突变。上述CR-ANC方案在实际运作时,有时不能降低串扰,反而会引入更大的串扰,导致ANC的性能急剧下降。
因此,现有技术存在有诸多缺陷,从而导致降噪效果并不理想,而本发明是针对现有技术进行的改进,从而可实现改善语音质量的效果。
本发明的技术方案中提供一种语音降噪方法,如图6所示,其主旨是,通过一滤波组件,对一滤波形成的消噪语音信号,以及一滤波形成的参考噪声信号进行频域转换并滤波,以滤波输出、对应所述参考噪声信号的原始噪声信号、以及对应所述消噪语音信号的含噪语音信号,分别控制形成所述参考噪声信号的第一抗串扰滤波单元g1,以及形成所述消噪语音信号的第二抗串扰滤波单元g2进行滤波系数更新。
上述技术方案的主要目的是,通过一滤波组件对一对实施语音降噪的抗串扰滤波单元进行滤波系数更新。其中,
第一抗串扰滤波单元g1对含噪语音信号进行滤波,以滤除由于串扰作用进入含噪语音信号的噪音成分,然后通过将滤除噪音成分的语音信号与原始噪声信号比较,以期获得一不含有语音成分的参考噪音信号输出。
第二抗串扰滤波单元g2对原始噪声信号进行滤波,以滤除由于串扰作用进入原始噪声信号的语音成分,然后通过将滤除语音成分的噪音信号与含噪语音信号比较,以期获得一不含有噪音成分的消噪语音信号输出。
需要说明的是,上述第一抗串扰滤波单元与第二抗串扰滤波单元的具体结构在本发明的技术方案中并不被具体的限定,本领域技术人员完全可以在不付出创造性劳动的前提下,以现有的手段,获得多种可实现上述第一抗串扰滤波单元与第二抗串扰滤波单元的结构,因此,不可以下文中为体现上述技术方案可行性而描述的具体实施例作为对本发明保护范围的限定。
滤波组件根据消噪语音信号,以及参考噪声信号形成滤波输出,使滤波组件的滤波输出实时的根据消噪语音信号,以及参考噪声信号产生变化,从而使第一抗串扰滤波单元g1与第二抗串扰滤波单元g2的滤波系数可根据消噪语音信号,以及参考噪声信号的变化进行更新,从而可实现有效的语音降噪,进而提高语音质量,同时由于通过一额外的滤波组件控制第一抗串扰滤波单元g1与第二抗串扰滤波单元g2的滤波系数进行更新,使***的实时性要求降低,结构也得到了简化。
于一种较优的实施方式中,滤波组件可采用离散傅立叶变换,或离散余弦变换,或改进余弦变换对消噪语音信号进行频域转换得到第一幅度谱;和/或
滤波组件可采用离散傅立叶变换,或离散余弦变换,或改进余弦变换对参考噪声信号进行频域转换得到第二幅度谱。
由于离散余弦变换及改进余弦变换均为本领域公知的方法,因此不再展开叙述,以下以离散傅里叶变换来说明上述技术方案的可行性。
于可选的实施方式中,采用离散傅立叶变换得到第一幅度谱的公式为:
E a 1 [ k ] t = | &Sigma; n = 1 M w ana ( n ) e 1 ( t - M + n ) e - 2 &pi;j ( n - 1 ) ( k - 1 ) M | , k = 1,2,3 , . . . M
其中,Ea1为第一幅度谱,e1(t)为参考噪声信号,e为自然对数的底数,j为虚数单位,j=(-1)0.5,wana(n)为窗函数,n=1,2,…M,M为频域分析的时间窗长度。
于可选的实施方式中,采用离散傅立叶变换得到第二幅度谱的公式为:
E a 2 [ k ] t = | &Sigma; n = 1 M w ana ( n ) e 2 ( t - M + n ) e - 2 &pi;j ( n - 1 ) ( k - 1 ) M | , k = 1,2,3 , . . . M
其中,Ea2为第二幅度谱,e2(t)为消噪语音信号,e为自然对数的底数,j为虚数单位,j=(-1)0.5,wana(n)为窗函数,n=1,2,…M,M为频域分析的时间窗长度。
在进一步的实施方式中,窗函数wana(n)可采用矩形窗,或者正弦窗,或者汉宁窗,或者海明窗,或者Tukey窗。由于上述窗函数均为本领域技术人员公知的方法,因此不再展开叙述。
在进一步的实施方式中,由于M的大小对应着频域分析的时间窗长度,并决定频域的分辨率,基于频域分辨率大于100Hz,时间窗小于0.4秒的要求,因此,M的取值范围可以是fs/100/2<M<0.4fs,其中fs为采样频率。优选的,当fs=8000Hz时,可令M=512。
于一种较优的实施方式中,滤波组件提供一后滤波器,后滤波器为具有M点冲激响应的频域维纳滤波器,可通过下式计算频域维纳滤波器的解:
G [ k ] t = max ( P s 1 [ k ] t - P n [ k ] t , 0 ) P s 1 [ k ] t , k = 1,2,3 , . . . , M ,
其中,G为维纳滤波器的解,Psl为消噪语音信号的自功率谱,Pn为噪声的自功率谱;或者
于可选的实施方式中,基于获取更优性能的考虑,M点冲激响应的频域维纳滤波器的解也可以通过下式进行计算:
G [ k ] t = SNR [ k ] t SNR [ k ] t + 1 , k = 1,2,3 , . . . , M ,
SNR[k]t=αG[k]t-1 2SNRP[k]t-1+(1-α)max(SNRP[k]t-1,0)
SNR P [ k ] t = P s 1 [ k ] t P n [ k ] t ,
其中,G为维纳滤波器的解,SNR为信噪比,SNRp为先验信噪比,Psl为消噪语音信号的自功率谱,Pn为噪声的自功率谱,0<α<1,优选的α=0.5。
在进一步的实施方式中,消噪语音信号的自功率谱Psl通过下式计算:
Ps1[k]t=|Ea1[k]t|2
其中,Ea1为消噪语音信号经频域转换后获得的第一幅度谱。
噪声的自功率谱Pn需要通过估计获得,其估计方法有跟踪信号频谱短时最小值,时间递归平均等方法,在进一步的实施方式中,可采用G.Doblinger噪声估计法(见文献[4])实现噪声自功率谱Pn的估计,G.Doblinger噪声估计法为频谱短时最小值和时间递归平均方法的一种结合,具体的估计方法见下式:
P n [ k ] t = &eta; 1 P n [ k ] t - 1 + ( 1 - &eta; 1 ) P s [ k ] t , P n [ k ] t - 1 > P s [ k ] t max ( P n [ k ] t - 1 , &eta; 2 P n [ k ] t - 1 + ( 1 - &eta; 2 ) P s [ k ] t - &eta; 3 P s [ k ] t - 1 ( 1 - &eta; 3 ) ) , P n [ k ] t - 1 &le; P s [ k ] t
其中,η1,η2,η3为平滑因子,0<η1,η2,η3<1;优选的,平滑因子η1=0.99,η2=0.99,η3=0.8;
Ps为消噪语音信号的自功率谱,或者Ps为消噪语音信号的自功率谱与参考噪声信号的自功率谱两者之间的较小值。
基于上述实施方式,当Ps为消噪语音信号的自功率谱时,Ps可通过下式计算:
Ps[k]t=|Ea1[k]t|2
其中,Ea1为消噪语音信号经频域转换后获得的第一幅度谱。
在可选的实施方式中,当Ps为消噪语音信号的自功率谱与参考噪声信号的自功率谱两者之间的较小值时,Ps可通过下式计算:
Ps[k]t=min(|Ea1[k]t|2,|Ea2[k]t|2);
其中,
Ea1为消噪语音信号经频域转换后获得的第一幅度谱;
Ea2为参考噪音信号经频域转换后获得的第二幅度谱。
基于上述技术方案,在一种可选的实施方式中,可提供一语音激活检测单元(未于图中示出),语音激活检测单元连接滤波组件;
语音激活检测单元根据含噪语音信号,或者含噪语音信号和原始噪声器信号,判断是否采集到语音信号,并向滤波组件输出判断结果。
进一步的,基于语音激活检测单元的输出结果,Ps可通过下式计算:
P s [ k ] t = min ( | E a 1 [ k ] t | 2 , | E a 2 [ k ] t | 2 ) , VAD is true min [ max ( | E a 1 [ k ] t | 2 , | E a 2 [ k ] t | 2 ) , &beta; | E a 1 [ k ] t | 2 ] , VAD is false ;
其中,VAD为语音激活检测单元的输出值,true为采集到语音信号,false为未采集到语音信号;
Ea1为消噪语音信号经频域转换后获得的第一幅度谱;
Ea2为参考噪音信号经频域转换后获得的第二幅度谱;
β为控制因子,1<β<5,优选的,β=2。
于一种优选的实施方式中,如图7所示,滤波组件可提供一第一自适应滤波器及一第二自适应滤波器
第一自适应滤波器根据频域维纳滤波器的解G、参考噪声信号以及含噪语音信号计算第一抗串扰滤波单元的滤波系数更新项并通过滤波系数更新项更新第一抗串扰滤波单元的滤波系数g1,t
第二自适应滤波器根据频域维纳滤波器的解G、消噪语音信号以及噪声信号,计算第二抗串扰滤波单元的滤波系数更新项并采用滤波系数更新项更新第二抗串扰滤波单元的滤波系数g2,t
于一种优选的实施方式中,第一抗串扰滤波单元通过下式更新滤波系数g1,t
g 1 [ k ] t + 1 = g 1 [ k ] t + g ^ 1 [ k ] t , k = 1,2 , . . . , N ; 和/或
于进一步的实施方式中第二抗串扰滤波单元通过下式更新滤波系数g2,t
g 2 [ k ] t + 1 = g 2 [ k ] t + g ^ 2 [ k ] t , k = 1,2 , . . . , N .
滤波系数更新项须由自适应滤波器计算得到。由于语音能量大的频段对应着后滤波器G的值较大的频段,第一抗串扰滤波单元g1及第二抗串扰滤波单元g2可以通过后滤波器G来控制更新权重,使第一抗串扰滤波单元g1的滤波系数更新项提高语音能量大的频段的更新权重,从而使第一抗串扰滤波单元g1可有效的滤除含噪语音信号中的噪音成分;同时使第二抗串扰滤波单元g2的滤波系数更新项降低语音能量大的频段的更新权重,从而使第二抗串扰滤波单元g2可有效的滤除原始噪声信号中的语音成分。
滤波系数更新项的算法包括最小均方算法(LMS)、归一化最小均方算法(NLMS)、最小二乘算法(RLS)、仿射投影算法(AP)见文献[5]、快速仿射投影算法(FAP)见文献[6]、块最小均方算法(BLMS)见文献[7-8]、频域最小均方算法(FDAF)见文献[9]、加窗频域最小均方算法(WDAF)见文献[10]等多种,由于上述更新算法均为本领域公知的方法,因此不再赘述。基于频域维纳滤波器控制便利的考虑,可选择频域算法作为滤波系数更新项的算法,当然也不排除在增加控制元素的基础上采用其他类型算法作为滤波系数更新项的算法。
于一种优选的实施方式中,第一自适应滤波器可通过频域最小均方算法计算第一抗串扰滤波单元的滤波系数更新项具体算式如下:
其中,G1=Gλ
λ为大于0的非线性控制因子,优选的,λ=1;
μ为更新步长,且0<μ<2,μ取值过大则稳定性较差,μ取值过小则更新太慢,优选的,μ=0.5;
ε为防止除零错误的微小正数;
·为点乘符号;
上标*为共轭操作;
下标N×N表示矩阵为N行N列;
下标N×(M-N)表示矩阵为N行M-N列;
S1,t为含噪语音信号s1(t)的M点傅立叶变换;
E2,t为参考噪声信号e2(t)的M点傅立叶变换;
F-为反傅立叶变换矩阵;
E[|S1,t|2]为|S1,t|2在t时刻的短期数学期望。
于上述技术方案基础上,进一步的,S1,t通过下式计算:
S1,t=F[s1(t-M+1),s1(t-M+2),…,s1(t)]T
其中,上标T为转置操作;和/或
E2,t通过下式计算:
E2,t=F{[0,0,…,0]1×N[e2(t-(M-N)+1),e2(t-(M-N)+2),…,e2(t)]}T
其中,上标T为转置操作;和/或
E[|S1,t|2]通过自回归法进行获取,具体算式如下:
E[|S1,t|2]=γE[|S1,t-1|2]+(1-γ)|S1,t|2,0<γ<1。
于一种优选的实施方式中,第二自适应滤波器可通过频域最小均方算法计算第二抗串扰滤波单元的滤波系数更新项具体算式如下:
其中,G2=1–Gλ或G2=(1–G)λ
λ为大于0的非线性控制因子,优选的,λ=1;
μ为更新步长,且0<μ<2,μ取值过大则稳定性较差,μ取值过小则更新太慢,优选的,μ=0.5;
ε为防止除零错误的微小正数;
·为点乘符号;
上标*为共轭操作;
下标N×N表示矩阵为N行N列;
下标N×(M-N)表示矩阵为N行M-N列;
S2,t为噪声信号s2(t)的M点傅立叶变换;
E1,t为消噪语音信号e1(t)的M点傅立叶变换;
F-为反傅立叶变换矩阵;
E[|S2,t|2]为|S2,t|2在t时刻的短期数学期望。
于上述技术方案基础上,进一步的,S2,t通过下式计算:
S2,t=F[s2(t-M+1),s2(t-M+2),…,s2(t)]T
其中,F为傅立叶变换矩阵,上标T为转置操作;和/或
E1,t通过下式计算:
E1,t=F{[0,0,…,0]1×N[e1(t-(M-N)+1),e1(t-(M-N)+2),…,e1(t)]}T
其中,F为傅立叶变换矩阵,上标T为转置操作;和/或
E[|S2,t|2]通过自回归法进行获取,具体算式如下:
E[|S2,t|2]=γE[|S2,t-1|2]+(1-γ)|S2,t|2,0<γ<1。
于一种可选的实施方式中,第一自适应滤波器通过加窗频域最小均方算法计算第一抗串扰滤波单元的滤波系数更新项具体算式如下:
其中,G1=Gλ
λ为大于0的非线性控制因子,优选的,λ=1;
μ为更新步长且0<μ<2,μ取值过大则稳定性较差,μ取值过小则更新太慢,优选的,μ=0.5;
ε为防止除零错误的微小正数;
·为点乘符号;
上标*为共轭操作;
下标N×N表示矩阵为N行N列;
下标N×(M-N)表示矩阵为N行M-N列;
Sw1,t为含噪语音信号s1(t)的M点窗傅立叶变换;
Ew2,t为参考噪声信号e2(t)的M点窗傅立叶变换;
F-为反傅立叶变换矩阵;
E[|Sw1,t|2]为|Sw1,t|2在t时刻的短期数学期望。
于上述技术方案基础上,进一步的,Sw1,t通过下式计算:
Sw1,t=F[wadf(t-M+1)s1(t-M+1),wadf(t-M+2)s1(t-M+2),…,wadf(t)s1(t)]T
其中,F为傅立叶变换矩阵,上标T为转置操作,wadf(k)为窗函数,k=1,2,…M;和/或
Ew2,t通过下式计算:
Ew2,t=F[wadf(t-M+1)e2(t-M+1),wadf(t-M+2)e2(t-M+2),…,wadf(t)e2(t)]T
其中,F为傅立叶变换矩阵,上标T为转置操作,wadf(k)为窗函数,k=1,2,…M;和/或
E[|Sw1,t|2]通过自回归法进行获取,具体算式如下:
E[|Sw1,t|2]=γE[|Sw1,t|-12]+(1-γ)|Sw1,t|2,0<γ<1。
于一种可选的实施方式中,第二自适应滤波器通过加窗频域最小均方算法计算第二抗串扰滤波单元的滤波系数更新项具体算式如下:
其中,G2=1–Gλ或G2=(1–G)λ
λ为大于0的非线性控制因子,优选的,λ=1;
μ为更新步长且0<μ<2,μ取值过大则稳定性较差,μ取值过小则更新太慢,优选的,μ=0.5;
ε为防止除零错误的微小正数;
·为点乘符号;
上标*为共轭操作;
下标N×N表示矩阵为N行N列;
下标N×(M-N)表示矩阵为N行M-N列;
Sw2,t为噪声信号s2(t)的M点窗傅立叶变换;
Ew1,t为消噪语音信号e1(t)的M点窗傅立叶变换;
F-为反傅立叶变换矩阵;
E[|Sw2,t|2]为|Sw2,t|2在t时刻的短期数学期望。
于上述技术方案基础上,进一步的,Sw2,t通过下式计算:
Sw2,t=F[wadf(t-M+1)s2(t-M+1),wadf(t-M+2)s2(t-M+2),…,wadf(t)s2(t)]T
其中,F为傅立叶变换矩阵,上标T为转置操作,wadf(k)为窗函数,k=1,2,…M;和/或
Ew1,t通过下式计算:
Ew1,t=F[wadf(t-M+1)e1(t-M+1),wadf(t-M+2)e1(t-M+2),…,wadf(t)e1(t)]T
其中,F为傅立叶变换矩阵,上标T为转置操作,wadf(k)为窗函数,k=1,2,…M;和/或
E[|Sw2,t|2]通过自回归法进行获取,具体算式如下:
E [ | S 1 . w 2 , t | 2 ] = &gamma;E [ | S w 2 , t - 1 | 2 ] + ( 1 - &gamma; ) | S w 2 , t | 2 , 0 < &gamma; <
于一种优选的实施方式中,上述窗函数wadf为矩形窗,或者正弦窗,或者汉宁窗,或者海明窗,或者Tukey窗。由于上述列举的窗函数均为本领域技术人员公知的方法,因此不再展开叙述。
为表明本发明技术方案的可行性,现基于图8中所示结构对本发明的实现进行说明,需指出的是,如上文中所述,图8中所示结构仅仅是本发明的一种实施例,并不能以此限定本发明的保护范围。
于一种较优的实施方式中,上述的含噪语音信号可通过一第一换能器获得,上述原始噪声信号可通过以第二换能器获得。于优选的实施方式中,上述第一换能器可通过一主麦克风m1实现,上述第二换能器可通过一次麦克风m2实现。
于一种较优的实施方式中,第一抗串扰滤波单元可包括第一有限冲激响应滤波器FIR1,第一有限冲激响应滤波器FIR1通过下式对含噪语音信号进行滤波以获取第一滤波信号:
p 1 ( t ) = &Sigma; k = 1 N s 1 ( t - k + 1 ) g 1 [ k ] t
其中,k为自然序列,g1,t为第一有限冲激响应滤波器FIR1的滤波系数,N为第一有限冲激响应滤波器FIR1的冲激响应长度,p1(t)为第一滤波信号,s1(t)为含噪语音信号,t为采样时刻的序号,下标t表示变量所处的采样时刻。第一抗串扰滤波单元可通过第一有限冲激响应滤波器实现滤除含噪语音信号中的噪音成分。滤波组件中的第一自适应滤波器通过计算滤波系数更新项对第一有限冲激响应滤波器FIR1的滤波系数g1,t进行更行。
在此实施方式基础上,选择对参考噪声信号进行频域变换的窗函数时,须使频域分析的时间窗长度M大于第一有限冲激响应滤波器FIR1的冲激响应长度N。
在此基础上,进一步的,第二抗串扰滤波单元可包括第二有限冲激响应滤波器FIR2,第二有限冲激响应滤波器FIR2通过下式对原始噪声信号进行滤波以获取第二滤波信号:
p 1 ( t ) = &Sigma; k = 1 N s 1 ( t - k + 1 ) g 1 [ k ] t
其中,k为自然序列,g2,t为第二有限冲激响应滤波器FIR2的滤波系数,N为第二有限冲激响应滤波器FIR2的冲激响应长度,p2(t)为第二滤波信号,s2(t)为原始噪声信号,t为采样时刻序号,下标t表示变量所处的采样时刻。第二抗串扰滤波单元可通过第二有限冲激响应滤波器FIR2实现滤除原始噪声信号中的语音成分。滤波组件中的第二自适应滤波器通过计算滤波系数更新项对第二有限冲激响应滤波器FIR2的滤波系数g2,t进行更行。
在此实施方式基础上,选择对消噪语音信号进行频域变换的窗函数时,须使频域分析的时间窗长度M大于第二有限冲激响应滤波器FIR2的冲激响应长度N。
于进一步的实施方式中,N的取值范围为fs/100/2<N<0.2fs,其中fs为采样频率;或者当fs=8000Hz时N=256,其中fs为采样频率。
于一种优选的实施方式中,第二抗串扰滤波单元还可包括一第一减法器sub1,第一减法器sub1用以将含噪语音信号减去第二滤波信号以获得消噪语音信号。
于进一步的实施方式中,第一抗串扰滤波单元还可包括一第二减法器sub2,第二减法器sub2用以将原始噪声信号减去第一滤波信号以获得参考噪声信号。
于一种优选的实施方式中,第一抗串扰滤波单元还可包括一第一延迟单元z1,第一延迟单元z1用以将含噪语音信号s1(t)延迟后提供至第一减法器sub1,第一延迟单元z1可通过下式进行延迟计算:
z1(t)=s1(t-tz1),
其中,z1(t)为含噪语音信号s1(t)经延迟后形成的第一延迟信号,tz1为第一延迟单元z1的延迟采样数。
于进一步的实施方式中,第二抗串扰滤波单元还可包括一第二延迟单元z2,第二延迟单元z2用以将原始噪声信号s2(t)延迟后提供至第二减法器sub2,第二延迟单元z2可通过下式进行延迟计算:
z2(t)=s2(t-tz2)
其中,z2(t)为原始噪声信号s2(t)经延迟后形成的第二延迟信号,tz2为第二延迟单元z2的延迟采样数。
上述的tz1与tz2和主麦克风m1及次麦克风m2之间的物理距离Ldistence有关,在较优的实施方式中,tz1的取值范围为fsLdistence/csound<tz1<10fsLdistence/csound,和/或tz2的取值范围为fsLdistence/csound<tz2<10fsLdistence/csound,其中csound是声传播速度,fs是采样频率。在进一步的实施方式中,以空气中声速340米/秒,语音采集设备长度0.15米,采样频率8000Hz为例,tz1、tz2的取值范围为,3.52<tz1=tz2<35.2。优选的,tz1=tz2=8。
基于上述具有第一延迟单元z1和第二延迟单元z1的技术方案,一种更进一步的实施方式中,第一减法器sub1可通过下式计算消噪语音信号:
e1(t)=z1(t)-p2(t),
其中,e1(t)为消噪语音信号,z1(t)为含噪语音信号s1(t)经延迟后形成的第一延迟信号,p2(t)为原始噪声信号s2(t)经滤波后形成的第二滤波信号。
于进一步的实施方式中,第二减法器sub2可通过下式计算参考噪声信号:
e2(t)=z2(t)-p1(t),
其中,e2(t)为参考噪声信号,z2(t)为原始噪声信号s2(t)经延迟后形成的第二延迟信号,p1(t)为含噪语音信号s1(t)经滤波后形成的第一滤波信号。
基于上述技术方案,进一步的,后滤波器G将消噪语音信号e1(t)和参考噪声信号e2(t)经频域转换并滤波形成滤波输出。第一自适应滤波器在后滤波器G的输出的控制下,根据参考噪声信号e2(t)和含噪语音信号s1(t)计算第一有限冲激响应滤波器FIR1的更新项第一有限冲激响应滤波器FIR1通过更新项更新滤波系数g1,t。第二自适应滤波器在后滤波器G的输出的控制下,根据消噪语音信号e1(t)和原始噪声信号s2(t)计算第二有限冲激响应滤波器FIR2的更新项第二有限冲激响应滤波器FIR2通过更新项更新滤波系数g2,t
通过变化的消噪语音信号e1(t)及参考噪声信号e2(t),使后滤波器G的输出根据实际情况实时的改变,进而控制第一自适应滤波器及第二自适应滤波器根据实际情况的并且有针对性的形成更新权重不同的更新项及更新项以更新第一有限冲激响应滤波器FIR1,及第二有限冲激响应滤波器FIR2
上述实施方仅仅用以表明本发明技术方案的可行性,不应当以此限制本发明的保护范围。
本发明的技术方案中,还包括一种语音采集设备,其中,采用如上述语音降噪方法。
以下通过两种典型情况来展现本发明的有益效果。情况1是噪声源为单点声源的情况,理论上在没有串扰的时候ANC可以将噪声消除干净。情况2是扩散噪声场情况,噪声是从各个方向过来的。因为串扰的存在,两种情况语音都有很强的泄漏,次麦克风中语音能量很强,这样情况1很难将主麦克风信号中的噪声消除到理想状况,情况2则很难将主麦克风信号中的噪声消除,而次麦克风则很难消除其中的语音串扰。
通过对本发明技术方案的实施,如图9的单噪声源降噪效果的语谱演示(上方为降噪前,下方为降噪后)所示,上方语谱中有大量噪声,而下方语谱已经很清晰,噪声谱变淡;如图10的单噪声源降噪效果的波形演示(上方为降噪前,下方为降噪后)所示,音节间的噪声已经被大幅度的消除。
通过对本发明技术方案的实施,如图11的扩散噪声场降噪前语谱演示(上方为主麦克风信号,下方为次麦克风信号)所示,一个随时间逐渐增大后逐渐减小的噪音几乎将主麦克风信号中的语音谱完全淹没,而次麦克风信号中的串扰语音清晰可见。如图12扩散噪声场降噪后的语谱演示(上方为主麦克风信号,下方为次麦克风信号)所示,噪声最大处,原来被淹没的主麦克风信号中的语音谱已清晰可见,而次麦克风信号中的串扰语音谱已接近完全抹去。如图13扩散噪声场主麦克风降噪前后的波形演示(黑色为降噪前,灰色为降噪后)可见,灰色的处理后信号波形,在噪声段已明显减小;如图14扩散噪声场次麦克风降噪前后的波形演示(黑色为降噪前,灰色为降噪后)可见,灰色的处理后信号波形,在语音段接近完全消除。这样处理后的双麦克风信号,很容易进行语音增强处理,进一步提高其语音质量。
综上所述,由于本发明采用了如上技术方案,提供了一种新的抗串扰自适应噪声消除(CR-ANC)结构,通过仅使用一对自适应滤波器(ADF),并采用后滤波器控制该一对自适应滤波器的滤波系数更新,从而简化了结构,通过对语音信号和噪声信号的滤波系数权重分别进行有针对性的调整,实现优秀的抗串扰和降噪效果。
以上对本发明的较佳实施例进行了描述。需要理解的是,本发明并不局限于上述特定实施方式,其中未尽详细描述的设备和结构应该理解为用本领域中的普通方式予以实施;任何熟悉本领域的技术人员,在不脱离本发明技术方案范围情况下,都可利用上述揭示的方法和技术内容对本发明技术方案作出许多可能的变动和修饰,或修改为等同变化的等效实施例,这并不影响本发明的实质内容。因此,凡是未脱离本发明技术方案的内容,依据本发明的技术实质对以上实施例所做的任何简单修改、等同变化及修饰,均仍属于本发明技术方案保护的范围内。
引用文献:
[1]M.J.Al-KindiandJ.Dunlop,"Alowdistortionadaptivenoisecancellationstructureforrealtimeapplications"Proc.ICASSP'87,pp.2153-2156,1987;
[2]H.Kubota,T.Furukawa,andH.Itakura,"Pre-processednoisecancellerdesignanditsperformance,"IEICETrans.vol.J69-A,no.5,pp.584-591,May1986;
[3]R.L.Bouquin,G.Faucon.StudyofaVoiceActivityDetectoranditsInfluenceonaNoiseReductionSystem.SpeechCommunication,Vol.16,pp.245-254,1995;
[4]GerhardDoblinger,“Computaionallyefficientspeechenhancementbyspectralminimatrackinginsubbands,”Proc.EUROSPEECH’95,Madrid,pp.1513-1516;
[5]S.S.Haykin,Adaptivefiltertheory,4thed.,UpperSaddleRiver,N.J.:PrenticeHall,2002;
[6]S.L.Gay,andS.Tavathia,“Thefastaffineprojectionalgorithm,”inAcoustics,Speech,andSignalProcessing,1995.ICASSP-95.,1995InternationalConferenceon,1995,pp.3023-3026;
[7]E.Ferrara,“FastimplementationsofLMSadaptivefilters,”Acoustics,SpeechandSignalProcessing,IEEETransactionson,vol.28,no.4,pp.474-475,1980;
[8]G.Clark,S.Mitra,andS.Parker,“Blockimplementationofadaptivedigitalfilters,”Acoustics,SpeechandSignalProcessing,IEEETransactionson,vol.29,no.3,pp.744-752,1981;
[9]J.J.Shynk,“Frequency-domainandmultirateadaptivefiltering,”IEEESignalProcessingMagazine,vol.9,no.1,pp.14-37,Jan,1992;
[10]WuSheng,QiuXiaojun,“AWindowingFrequencyDomainAdaptiveFilterforAcousticEchoCancellation”,IEICETransactionsonFundamentalsofElectronics,CommunicationsandComputerSciences,VolumeE92.A,Issue10,pp.2626-2628(2009)。

Claims (28)

1.一种语音降噪方法,其特征在于,
通过一滤波组件,对一滤波形成的消噪语音信号,以及一滤波形成的参考噪声信号进行频域转换并滤波,以滤波输出、对应所述参考噪声信号的原始噪声信号、以及对应所述消噪语音信号的含噪语音信号,分别控制形成所述参考噪声信号的第一抗串扰滤波单元,以及形成所述消噪语音信号的第二抗串扰滤波单元进行滤波系数更新。
2.如权利要求1所述语音降噪方法,其特征在于,所述滤波组件采用离散傅立叶变换,或离散余弦变换,或改进余弦变换对所述消噪语音信号进行频域转换得到第一幅度谱;和/或
所述滤波组件采用离散傅立叶变换,或离散余弦变换,或改进余弦变换对所述参考噪声信号进行频域转换得到第二幅度谱。
3.如权利要求2所述语音降噪方法,其特征在于,采用离散傅立叶变换得到所述第一幅度谱的公式为:
E al [ k ] t = | &Sigma; n = 1 M w ana ( n ) e 1 ( t - M + n ) e - 2 &pi;j ( n - 1 ) ( k - 1 ) M | , k = 1,2,3 , . . . M
其中,Ea1为所述第一幅度谱,e1(t)为所述消噪语音信号,e为自然对数的底数,j为虚数单位,j=(-1)0.5,wana(n)为窗函数,n=1,2,…M,M为频域分析的时间窗长度;和/或
采用离散傅立叶变换得到所述第二幅度谱的公式为:
E a 2 [ k ] t = | &Sigma; n = 1 M w ana ( n ) e 2 ( t - M + n ) e - 2 &pi;j ( n - 1 ) ( k - 1 ) M | , k = 1,2,3 , . . . M
其中,Ea2为所述第二幅度谱,e2(t)为所述参考噪声信号,e为自然对数的底数,j为虚数单位,j=(-1)0.5,wana(n)为窗函数,n=1,2,…M,M为频域分析的时间窗长度。
4.如权利要求3所述语音降噪方法,其特征在于,所述窗函数wana(n)为矩形窗,或者正弦窗,或者汉宁窗,或者海明窗,或者Tukey窗。
5.如权利要求3所述所述语音降噪方法,其特征在于,M的取值范围为fs/100/2<M<0.4fs,其中fs为采样频率。
6.如权利要求1所述语音降噪方法,其特征在于,所述滤波组件提供一后滤波器,所述后滤波器为具有M点冲激响应的频域维纳滤波器,通过下式计算所述频域维纳滤波器的解:
G [ k ] t = max ( P sl [ k ] t - P n [ k ] t , 0 ) P sl [ k ] t , k = 1,2,3 , . . . , M ,
其中,G为所述维纳滤波器的解,Psl为所述消噪语音信号的自功率谱,Pn为噪声的自功率谱;或者
所述滤波组件提供一后滤波器,所述后滤波器为具有M点冲激响应的频域维纳滤波器,通过下式计算所述频域维纳滤波器的解:
G [ k ] t = SNR [ k ] t SNR [ k ] t + 1 , k = 1,2,3 , . . . M ,
SNR[k]t=αG[k]t-1 2SNRP[k]t-1+(1-α)max(SNRP[k]t-1,0)
SNR P [ k ] t = P sl [ k ] t P n [ k ] t ,
其中,G为所述维纳滤波器的解,SNR为信噪比,SNRp为先验信噪比,Psl为所述消噪语音信号的自功率谱,Pn为噪声的自功率谱,0<α<1。
7.如权利要求6所述语音降噪方法,其特征在于,所述消噪语音信号的自功率谱Psl通过下式计算:
Ps1[k]t=|Ea1[k]t|2
其中,Ea1为所述消噪语音信号经频域转换后获得的第一幅度谱。
8.如权利要求6所述语音降噪方法,其特征在于,所述噪声的自功率谱Pn通过下式进行估计:
P n [ k ] t = &eta; 1 P n [ k ] t - 1 + ( 1 - &eta; 1 ) P s [ k ] t , P n [ k ] t - 1 > P s [ k ] t max ( P n [ k ] t - 1 , &eta; 2 P n [ k ] t - 1 + ( 1 - &eta; 2 ) P s [ k ] t - &eta; 3 P s [ k ] t - 1 ( 1 - &eta; 3 ) ) , P n [ k ] t - 1 &le; P s [ k ] t ,
其中,η1,η2,η3为平滑因子,0<η1,η2,η3<1;
Ps为所述消噪语音信号的自功率谱,或者Ps为所述消噪语音信号的自功率谱与所述参考噪声信号的自功率谱两者之间的较小值。
9.如权利要求8所述语音降噪方法,其特征在于,Ps为所述消噪语音信号的自功率谱时,Ps通过下式计算:
Ps[k]t=|Ea1[k]t|2
其中,Ea1为所述消噪语音信号经频域转换后获得的第一幅度谱。
10.如权利要求8所述语音降噪方法,其特征在于,Ps为所述消噪语音信号的自功率谱与所述参考噪声信号的自功率谱两者之间的较小值时,Ps通过下式计算:
Ps[k]t=min(|Ea1[k]t|2,|Ea2[k]t|2);
其中,
Ea1为所述消噪语音信号经频域转换后获得的第一幅度谱;
Ea2为所述参考噪音信号经频域转换后获得的第二幅度谱。
11.如权利要求8所述语音降噪方法,其特征在于,提供一语音激活检测单元,所述语音激活检测单元连接所述滤波组件;
所述语音激活检测单元根据所述含噪语音信号,或者所述含噪语音信号和所述原始噪声器信号,判断是否采集到语音信号,并向所述滤波组件输出判断结果。
12.如权利要求11所述语音降噪方法,其特征在于,Ps通过下式计算:
P s [ k ] t = min ( | E a 1 [ k ] t | 2 , | E a 2 [ k ] t | 2 ) , VAD is true min [ max ( | E a 1 [ k ] t | 2 , | E a 2 [ k ] t | 2 ) , &beta; | E a 1 [ k ] t | 2 ] , VAD is false ;
其中,VAD为所述语音激活检测单元的输出值,true为采集到语音信号,false为未采集到语音信号;
Ea1为所述消噪语音信号经频域转换后获得的第一幅度谱;
Ea2为所述参考噪音信号经频域转换后获得的第二幅度谱;
β为控制因子,1<β<5。
13.如权利要求6所述语音降噪方法,其特征在于,所述滤波组件提供一第一自适应滤波器,及一第二自适应滤波器;
所述第一自适应滤波器根据所述频域维纳滤波器的解G、所述参考噪声信号以及所述含噪语音信号计算所述第一抗串扰滤波单元的滤波系数更新项并通过所述滤波系数更新项更新所述第一抗串扰滤波单元的滤波系数g1,t
所述第二自适应滤波器根据所述频域维纳滤波器的解G、所述消噪语音信号以及所述噪声信号,计算所述第二抗串扰滤波单元的滤波系数更新项并采用所述滤波系数更新项更新所述第二抗串扰滤波单元的滤波系数g2,t
14.如权利要求13所述语音降噪方法,其特征在于,所述第一抗串扰滤波单元通过下式更新滤波系数g1,t
g 1 [ k ] t + 1 = g 1 [ k ] t + g ^ 1 [ k ] t , k = 1,2 , . . . , N ; 和/或
所述第二抗串扰滤波单元通过下式更新滤波系数g2,t
g 2 [ k ] t + 1 = g 2 [ k ] t + g ^ 2 [ k ] t , k = 1,2 , . . . , N .
15.如权利要求13所述语音降噪方法,其特征在于,所述第一自适应滤波器通过频域最小均方算法计算所述第一抗串扰滤波单元的滤波系数更新项具体算式如下:
其中,G1=Gλ
λ为大于0的非线性控制因子;
μ为更新步长,且0<μ<2;
ε为防止除零错误的微小正数;
·为点乘符号;
上标*为共轭操作;
下标N×N表示矩阵为N行N列;
下标N×(M-N)表示矩阵为N行M-N列;
S1,t为所述含噪语音信号s1(t)的M点傅立叶变换;
E2,t为所述参考噪声信号e2(t)的M点傅立叶变换;
F-为反傅立叶变换矩阵;
E[|S1,t|2]为|S1,t|2在t时刻的短期数学期望。
16.如权利要求15所述语音降噪方法,其特征在于,S1,t通过下式计算:
S1,t=F[s1(t-M+1),s1(t-M+2),…,s1(t)]T
其中,上标T为转置操作;和/或
E2,t通过下式计算:
E2,t=F{[0,0,…,0]1×N[e2(t-(M-N)+1),e2(t-(M-N)+2),…,e2(t)]}T
其中,上标T为转置操作;和/或
E[|S1,t|2]通过自回归法进行获取,具体算式如下:
E[|S1,t|2]=γE[|S1,t-1|2]+(1-γ)|S1,t|2,0<γ<1。
17.如权利要求13所述语音降噪方法,其特征在于,所述第二自适应滤波器通过频域最小均方算法计算所述第二抗串扰滤波单元的滤波系数更新项具体算式如下:
其中,G2=1–Gλ或G2=(1–G)λ
λ为大于0的非线性控制因子;
μ为更新步长,且0<μ<2;
ε为防止除零错误的微小正数;
·为点乘符号;
上标*为共轭操作;
下标N×N表示矩阵为N行N列;
下标N×(M-N)表示矩阵为N行M-N列;
S2,t为噪声信号s2(t)的M点傅立叶变换;
E1,t为消噪语音信号e1(t)的M点傅立叶变换;
F-为反傅立叶变换矩阵;
E[|S2,t|2]为|S2,t|2在t时刻的短期数学期望。
18.如权利要求17所述语音降噪方法,其特征在于,S2,t通过下式计算:
S2,t=F[s2(t-M+1),s2(t-M+2),…,s2(t)]T
其中,F为傅立叶变换矩阵,上标T为转置操作;和/或
E1,t通过下式计算:
E1,t=F{[0,0,…,0]1×N[e1(t-(M-N)+1),e1(t-(M-N)+2),…,e1(t)]}T
其中,F为傅立叶变换矩阵,上标T为转置操作;和/或
E[|S2,t|2]通过自回归法进行获取,具体算式如下:
E[|S2,t|2]=γE[|S2,t-1|2]+(1-γ)|S2,t|2,0<γ<1。
19.如权利要求13所述语音降噪方法,其特征在于,所述第一自适应滤波器通过加窗频域最小均方算法计算所述第一抗串扰滤波单元的滤波系数更新项具体算式如下:
其中,G1=Gλ
λ为大于0的非线性控制因子;
μ为更新步长且0<μ<2;
ε为防止除零错误的微小正数;
·为点乘符号;
上标*为共轭操作;
下标N×N表示矩阵为N行N列;
下标N×(M-N)表示矩阵为N行M-N列;
Sw1,t为含噪语音信号s1(t)的M点窗傅立叶变换;
Ew2,t为参考噪声信号e2(t)的M点窗傅立叶变换;
F-为反傅立叶变换矩阵;
E[|Sw1,t|2]为|Sw1,t|2在t时刻的短期数学期望。
20.如权利要求19所述语音降噪方法,其特征在于,Sw1,t通过下式计算:
Sw1,t=F[wadf(t-M+1)s1(t-M+1),wadf(t-M+2)s1(t-M+2),…,wadf(t)s1(t)]T
其中,F为傅立叶变换矩阵,上标T为转置操作,wadf(k)为窗函数,k=1,2,…M;和/或
Ew2,t通过下式计算:
Ew2,t=F[wadf(t-M+1)e2(t-M+1),wadf(t-M+2)e2(t-M+2),…,wadf(t)e2(t)]T
其中,F为傅立叶变换矩阵,上标T为转置操作,wadf(k)为窗函数,k=1,2,…M;和/或
E[|Sw1,t|2]通过自回归法进行获取,具体算式如下:
E[|Sw1,t|2]=γE[|Sw1,t-1|2]+(1-γ)|Sw1,t|2,0<γ<1。
21.如权利要求13所述语音降噪方法,其特征在于,所述第二自适应滤波器通过加窗频域最小均方算法计算所述第二抗串扰滤波单元的滤波系数更新项具体算式如下:
其中,G2=1–Gλ或G2=(1–G)λ
λ为大于0的非线性控制因子;
μ为更新步长且0<μ<2;
ε为防止除零错误的微小正数;
·为点乘符号;
上标*为共轭操作;
下标N×N表示矩阵为N行N列;
下标N×(M-N)表示矩阵为N行M-N列;
Sw2,t为噪声信号s2(t)的M点窗傅立叶变换;
Ew1,t为消噪语音信号e1(t)的M点窗傅立叶变换;
F-为反傅立叶变换矩阵;
E[|Sw2,t|2]为|Sw2,t|2在t时刻的短期数学期望。
22.如权利要求21所述语音降噪方法,其特征在于,Sw2,t通过下式计算:
Sw2,t=F[wadf(t-M+1)s2(t-M+1),wadf(t-M+2)s2(t-M+2),…,wadf(t)s2(t)]T
其中,F为傅立叶变换矩阵,上标T为转置操作,wadf(k)为窗函数,k=1,2,…M;和/或
Ew1,t通过下式计算:
Ew1,t=F[wadf(t-M+1)e1(t-M+1),wadf(t-M+2)e1(t-M+2),…,wadf(t)e1(t)]T
其中,F为傅立叶变换矩阵,上标T为转置操作,wadf(k)为窗函数,k=1,2,…M;和/或
E[|Sw2,t|2]通过自回归法进行获取,具体算式如下:
E[|Sw2,t|2]=γE[|Sw2,t-1|2]+(1-γ)|Sw2,t|2,0<γ<1。
23.如权利要求20或22所述语音降噪方法,其特征在于,所述窗函数wadf为矩形窗,或者正弦窗,或者汉宁窗,或者海明窗,或者Tukey窗。
24.如权利要求1所述语音降噪方法,其特征在于,所述第一抗串扰滤波单元包括第一有限冲激响应滤波器,所述第一有限冲激响应滤波器通过下式对所述含噪语音信号进行滤波以获取第一滤波信号:
p 1 ( t ) = &Sigma; k = 1 N s 1 ( t - k + 1 ) g 1 [ k ] t
其中,k为自然序列,g1,t为所述第一有限冲激响应滤波器的滤波系数,N为所述第一有限冲激响应滤波器的冲激响应长度,p1(t)为所述第一滤波信号,s1(t)为所述含噪语音信号,t为采样时刻的序号,下标t表示变量所处的采样时刻;和/或
所述第二抗串扰滤波单元包括第二有限冲激响应滤波器,所述第二有限冲激响应滤波器通过下式对所述原始噪声信号进行滤波以获取所述第二滤波信号:
p 2 ( t ) = &Sigma; k = 1 N s 2 ( t - k + 1 ) g 2 [ k ] t
其中,k为自然序列,g2,t为所述第二有限冲激响应滤波器的滤波系数,N为所述第二有限冲激响应滤波器的冲激响应长度,p2(t)为所述第二滤波信号,s2(t)为所述原始噪声信号,t为采样时刻序号,下标t表示变量所处的采样时刻。
25.如权利要求24所述语音降噪方法,其特征在于,所述N的取值范围为fs/100/2<N<0.2fs,其中fs为采样频率;或者
当fs=8000Hz时N=256,其中fs为采样频率。
26.如权利要求24所述语音降噪方法,其特征在于,所述第二抗串扰滤波单元还包括一第一减法器,所述第一减法器用以将所述含噪语音信号减去所述第二滤波信号以获得所述消噪语音信号;和/或
所述第一抗串扰滤波单元还包括一第二减法器,所述第二减法器用以将所述原始噪声信号减去所述第一滤波信号以获得所述参考噪声信号。
27.如权利要求24所述语音降噪方法,其特征在于,所述第一抗串扰滤波单元还包括一第一延迟单元,所述第一延迟单元用以将所述含噪语音信号延迟后提供至所述第一减法器;和/或
所述第二抗串扰滤波单元还包括一第二延迟单元,所述第二延迟单元用以将所述原始噪声信号延迟后提供至所述第二减法器。
28.一种语音采集设备,其特征在于,采用如权利要求1-27中任一所述语音降噪方法。
CN201410525618.XA 2014-10-08 2014-10-08 语音降噪方法及语音采集设备 Active CN105575397B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410525618.XA CN105575397B (zh) 2014-10-08 2014-10-08 语音降噪方法及语音采集设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410525618.XA CN105575397B (zh) 2014-10-08 2014-10-08 语音降噪方法及语音采集设备

Publications (2)

Publication Number Publication Date
CN105575397A true CN105575397A (zh) 2016-05-11
CN105575397B CN105575397B (zh) 2020-02-21

Family

ID=55885450

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410525618.XA Active CN105575397B (zh) 2014-10-08 2014-10-08 语音降噪方法及语音采集设备

Country Status (1)

Country Link
CN (1) CN105575397B (zh)

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105957534A (zh) * 2016-06-28 2016-09-21 百度在线网络技术(北京)有限公司 自适应滤波方法和自适应滤波器
CN106340303A (zh) * 2016-09-20 2017-01-18 南京朗逸锐科电子科技有限公司 一种基于时间频率域的语音降噪方法
CN107180640A (zh) * 2017-04-13 2017-09-19 广东工业大学 一种相位相关的高密度叠窗频谱计算方法
CN107301869A (zh) * 2017-08-17 2017-10-27 珠海全志科技股份有限公司 麦克风阵列拾音方法、处理器及其存储介质
CN107424623A (zh) * 2016-05-24 2017-12-01 展讯通信(上海)有限公司 语音信号处理方法及装置
CN108446091A (zh) * 2018-02-26 2018-08-24 浙江创课教育科技有限公司 基于噪音检测的语音播放***
CN108806715A (zh) * 2018-04-12 2018-11-13 会听声学科技(北京)有限公司 降噪性能评价方法及***
CN109243482A (zh) * 2018-10-30 2019-01-18 深圳市昂思科技有限公司 改进acranc与波束形成的微型阵列语音降噪方法
CN109285556A (zh) * 2018-09-29 2019-01-29 百度在线网络技术(北京)有限公司 音频处理方法、装置、设备以及存储介质
CN109584898A (zh) * 2018-12-29 2019-04-05 上海瑾盛通信科技有限公司 一种语音信号的处理方法、装置、存储介质及电子设备
CN110931040A (zh) * 2018-09-20 2020-03-27 萨基姆宽带简易股份有限公司 过滤由语音识别***获取的声音信号
CN112803921A (zh) * 2021-04-13 2021-05-14 浙江华创视讯科技有限公司 自适应滤波器、方法、介质及电子设备
CN113015050A (zh) * 2019-12-20 2021-06-22 瑞昱半导体股份有限公司 具有抗噪机制的音频播放装置及方法
TWI739236B (zh) * 2019-12-13 2021-09-11 瑞昱半導體股份有限公司 具有抗噪機制的音訊播放裝置及方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1851806A (zh) * 2006-05-30 2006-10-25 北京中星微电子有限公司 一种自适应麦克阵列***及其语音信号处理方法
CN102209987A (zh) * 2008-11-24 2011-10-05 高通股份有限公司 用于增强的主动噪声消除的***、方法、设备及计算机程序产品
US20120123772A1 (en) * 2010-11-12 2012-05-17 Broadcom Corporation System and Method for Multi-Channel Noise Suppression Based on Closed-Form Solutions and Estimation of Time-Varying Complex Statistics
CN102938254A (zh) * 2012-10-24 2013-02-20 中国科学技术大学 一种语音信号增强***和方法
US20140278385A1 (en) * 2013-03-13 2014-09-18 Kopin Corporation Noise Cancelling Microphone Apparatus

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1851806A (zh) * 2006-05-30 2006-10-25 北京中星微电子有限公司 一种自适应麦克阵列***及其语音信号处理方法
CN102209987A (zh) * 2008-11-24 2011-10-05 高通股份有限公司 用于增强的主动噪声消除的***、方法、设备及计算机程序产品
US20120123772A1 (en) * 2010-11-12 2012-05-17 Broadcom Corporation System and Method for Multi-Channel Noise Suppression Based on Closed-Form Solutions and Estimation of Time-Varying Complex Statistics
CN102938254A (zh) * 2012-10-24 2013-02-20 中国科学技术大学 一种语音信号增强***和方法
US20140278385A1 (en) * 2013-03-13 2014-09-18 Kopin Corporation Noise Cancelling Microphone Apparatus

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
曾庆宁,欧阳缮: "基于阵列抗串扰自适应噪声抵消与谱减相结合的语音增强", 《声学学报》 *

Cited By (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107424623B (zh) * 2016-05-24 2020-04-07 展讯通信(上海)有限公司 语音信号处理方法及装置
CN107424623A (zh) * 2016-05-24 2017-12-01 展讯通信(上海)有限公司 语音信号处理方法及装置
CN105957534A (zh) * 2016-06-28 2016-09-21 百度在线网络技术(北京)有限公司 自适应滤波方法和自适应滤波器
CN105957534B (zh) * 2016-06-28 2019-05-03 百度在线网络技术(北京)有限公司 自适应滤波方法和自适应滤波器
CN106340303A (zh) * 2016-09-20 2017-01-18 南京朗逸锐科电子科技有限公司 一种基于时间频率域的语音降噪方法
CN107180640A (zh) * 2017-04-13 2017-09-19 广东工业大学 一种相位相关的高密度叠窗频谱计算方法
CN107180640B (zh) * 2017-04-13 2020-06-12 广东工业大学 一种相位相关的高密度叠窗频谱计算方法
CN107301869A (zh) * 2017-08-17 2017-10-27 珠海全志科技股份有限公司 麦克风阵列拾音方法、处理器及其存储介质
CN107301869B (zh) * 2017-08-17 2021-01-29 珠海全志科技股份有限公司 麦克风阵列拾音方法、处理器及其存储介质
CN108446091A (zh) * 2018-02-26 2018-08-24 浙江创课教育科技有限公司 基于噪音检测的语音播放***
CN108446091B (zh) * 2018-02-26 2021-03-23 浙江创课教育科技有限公司 基于噪音检测的语音播放***
CN108806715A (zh) * 2018-04-12 2018-11-13 会听声学科技(北京)有限公司 降噪性能评价方法及***
CN108806715B (zh) * 2018-04-12 2021-02-23 会听声学科技(北京)有限公司 降噪性能评价方法及***
CN110931040B (zh) * 2018-09-20 2022-07-12 萨基姆宽带简易股份有限公司 过滤由语音识别***获取的声音信号
CN110931040A (zh) * 2018-09-20 2020-03-27 萨基姆宽带简易股份有限公司 过滤由语音识别***获取的声音信号
CN109285556B (zh) * 2018-09-29 2022-05-20 阿波罗智联(北京)科技有限公司 音频处理方法、装置、设备以及存储介质
CN109285556A (zh) * 2018-09-29 2019-01-29 百度在线网络技术(北京)有限公司 音频处理方法、装置、设备以及存储介质
CN109243482A (zh) * 2018-10-30 2019-01-18 深圳市昂思科技有限公司 改进acranc与波束形成的微型阵列语音降噪方法
CN109243482B (zh) * 2018-10-30 2022-03-18 深圳市昂思科技有限公司 改进acranc与波束形成的微型阵列语音降噪方法
CN109584898A (zh) * 2018-12-29 2019-04-05 上海瑾盛通信科技有限公司 一种语音信号的处理方法、装置、存储介质及电子设备
TWI739236B (zh) * 2019-12-13 2021-09-11 瑞昱半導體股份有限公司 具有抗噪機制的音訊播放裝置及方法
US11361746B2 (en) 2019-12-13 2022-06-14 Realtek Semiconductor Corporation Audio playback apparatus and method having noise-canceling mechanism
CN113015050A (zh) * 2019-12-20 2021-06-22 瑞昱半导体股份有限公司 具有抗噪机制的音频播放装置及方法
CN113015050B (zh) * 2019-12-20 2022-11-22 瑞昱半导体股份有限公司 具有抗噪机制的音频播放装置及方法
CN112803921A (zh) * 2021-04-13 2021-05-14 浙江华创视讯科技有限公司 自适应滤波器、方法、介质及电子设备

Also Published As

Publication number Publication date
CN105575397B (zh) 2020-02-21

Similar Documents

Publication Publication Date Title
CN105575397A (zh) 语音降噪方法及语音采集设备
CN101369427B (zh) 用于音频信号处理的方法和装置
JP4210521B2 (ja) 雑音低減法および装置
CN103632675B (zh) 个人通信中降噪和回波消除时的噪声估计
CN109727604A (zh) 用于语音识别前端的频域回声消除方法及计算机储存介质
CN102111697B (zh) 一种麦克风阵列降噪控制方法及装置
CN101510426B (zh) 一种噪声消除方法及***
US9336767B1 (en) Detecting device proximities
CN104683614B (zh) 基于m估计的记忆成比例仿射投影自适应回声消除方法
CN105244036A (zh) 一种麦克风语音增强方法及装置
CN101976565A (zh) 基于双麦克风语音增强装置及方法
CN106340292A (zh) 一种基于连续噪声估计的语音增强方法
CN103165137B (zh) 一种非平稳噪声环境下传声器阵列的语音增强方法
CN101763858A (zh) 双麦克风信号处理方法
WO2014181330A1 (en) A method and apparatus for suppression of unwanted audio signals
CN105869651A (zh) 基于噪声混合相干性的双通道波束形成语音增强方法
CN102739886A (zh) 基于回声频谱估计和语音存在概率的立体声回声抵消方法
Niwa et al. Post-filter design for speech enhancement in various noisy environments
CN105635500B (zh) 双麦克风回声及噪声的抑制***及其方法
Lefkimmiatis et al. A generalized estimation approach for linear and nonlinear microphone array post-filters
CN110211602A (zh) 智能语音增强通信方法及装置
Doclo et al. Multimicrophone noise reduction using recursive GSVD-based optimal filtering with ANC postprocessing stage
Schmid et al. An expectation-maximization algorithm for multichannel adaptive speech dereverberation in the frequency-domain
Seltzer Bridging the gap: Towards a unified framework for hands-free speech recognition using microphone arrays
Chinaev et al. A priori SNR Estimation Using a Generalized Decision Directed Approach.

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant