CN100487789C - 感知加权滤波方法及感知加权滤波器 - Google Patents

感知加权滤波方法及感知加权滤波器 Download PDF

Info

Publication number
CN100487789C
CN100487789C CNB2006101269218A CN200610126921A CN100487789C CN 100487789 C CN100487789 C CN 100487789C CN B2006101269218 A CNB2006101269218 A CN B2006101269218A CN 200610126921 A CN200610126921 A CN 200610126921A CN 100487789 C CN100487789 C CN 100487789C
Authority
CN
China
Prior art keywords
coefficient
transition function
sigma
spectrum
lambda
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CNB2006101269218A
Other languages
English (en)
Other versions
CN101140758A (zh
Inventor
胡瑞敏
张伟
杨玉红
张勇
王庭红
马付伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Wuhan University WHU
Original Assignee
Huawei Technologies Co Ltd
Wuhan University WHU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd, Wuhan University WHU filed Critical Huawei Technologies Co Ltd
Priority to CNB2006101269218A priority Critical patent/CN100487789C/zh
Publication of CN101140758A publication Critical patent/CN101140758A/zh
Application granted granted Critical
Publication of CN100487789C publication Critical patent/CN100487789C/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

本发明公开了一种感知加权滤波方法,主要包括:A、对输入的语音或音频信号进行谱倾斜滤波处理;B、对经过谱倾斜滤波处理后输出的语音或音频信号做传统的感知加权滤波处理;C、将经过传统的感知加权滤波处理的语音或音频信号输出;并且,将所述做传统的感知加权滤波处理用到的传输函数的系数中的部分系数直接作为所述谱倾斜滤波处理用到的传输函数的系数。本发明还公开了一种根据上述感知加权滤波方法设计的感知加权滤波器。本发明的实现能够在无需增加额外的编码比特率及减少计算复杂度的同时,较好地模拟输入的宽带语音或音频信号频谱的共振峰结构,充分利用人耳听觉的掩蔽效应,达到提高编码效率、增强主观听觉效果的目的。

Description

感知加权滤波方法及感知加权滤波器
技术领域
本发明涉及语音频的编码解码技术领域,尤其涉及一种适用于宽带语音和/或音频编码解码***的感知加权滤波技术。
背景技术
人耳对一个纯音的听觉感受性受同时存在的另外一个纯音的影响,但是人的听觉仍能清晰地感知前一个纯音,这个现象称为人耳的掩遮效应。
在进行语音编码时,可以利用人耳掩遮效应即共振峰处的噪声相对于能量较低频段的噪声而言不容易被察觉,通过在共振峰区域分配较大的失真,来减少共振峰谷里主观感觉更大的噪声,从而减弱共振峰频率区域的重要性,提高编码效率,并获得较佳的主观听觉效果。这一语音编码技术称为感知加权滤波技术,完成这一处理过程的软件模块称为感知加权滤波器。
在现有技术一中,传统的窄带语音编码技术为了在感知加权域实现噪声按频谱共振峰结构分布,采用传统的感知加权滤波器,对应的传输函数表达式为:
W ( z ) = A ( z / λ 1 ) A ( z / λ 2 ) = 1 + Σ i = 1 l a i λ 1 i z - i 1 + Σ i = 1 l a i λ 2 i z - i - - - ( 1 )
其中, A ( Z ) = 1 + &Sigma; i = 1 l a i z - i , ai为对原始输入信号求得的l阶LPC系数;λ为加权系数,且0<λ21≤1。
表达式(1)所描述的感知加权滤波器形式在范围从200Hz至3400Hz的窄带语音上能够使编码噪声较好的模拟信号频谱的共振峰结构,并在G.729、AMR(自适应多码率)等语音编码中取得较成功的应用。
随着通信技术的发展及用户需求的提升,要求获得更加清晰逼真的听觉效果,而此时,200Hz至3400Hz窄带范围内的语音编码已不能满足这样的要求。语音编码带宽扩展到50Hz至7000Hz的宽带范围。在这一宽带范围内,由于信号的频谱具有更大的动态范围,信号频谱的谱倾斜现象比较明显,而以表达式(1)为基础的传统的感知加权滤波器不能模拟谱倾斜比较明显的宽带信号频谱的共振峰结构,不适用于宽带语音编码。
现有技术二在传统的感知加权滤波器基础上给出改进方案。该方案在表达式(1)所描述的传统的感知加权滤波器基础上级联一个谱倾斜滤波器,所述的谱倾斜滤波器具有如下函数形式:
P ( z ) = 1 1 + &Sigma; i = 1 2 c i &delta; i z - i - - - ( 2 )
其中,pi(i=1,2)为对原始输入信号求得的2阶LPC系数,可见,该谱倾斜滤波器为全极点滤波器。
将表达式(1)与表达式(2)相乘,就得到现有技术二给出的感知加权滤波器:
W′(z)=W(z)P(z),                          (3)
对应的传输函数表达式为:
W &prime; ( z ) = = A ( z / &lambda; i ) A ( z / &lambda; 2 ) 1 1 + &Sigma; i = 1 2 c i &delta; i z - i , - - - ( 4 )
其中,W(z)用于模拟语音信号的共振峰结构,P(z)用于消除宽带语音信号频谱的谱倾斜。
将表达式(4)描述的感知加权滤波器应用在AMR-WB(自适应多码率的宽带编解码)***中,取λ1=0.95,λ2=0.8,δ=0.7时,能够取得较好的模拟效果。在该编码模式下使用表达式(4)描述的感知加权滤波器时,在编码端除需要计算构成A(Z)的l阶LPC系数外,还需要计算构成P(z)的2阶LPC系数。但是,表达式(4)描述的感知加权滤波器并不适用于语音和音频混合编码,如目前广泛采用的AMR-WB+(扩展的自适应多码率宽带编解码)***。其原因在于AMR-WB+采用的ACELP/TCX(代数码激励线性预测/变换码激励)混合编码模式中,除编码端外,还需要在解码端对信号做感知加权处理,因此若在该编码模式下仍使用表达式(4)描述的感知加权滤波器,那么除需要在编码端完成相应的计算,还需要在解码端获得构成P(z)的2阶LPC系数。获得该系数的途径有两种:一种是在编码端将P(z)的2阶LPC系数传递到解码端,该方法存在的缺点是增加了传输的比特率;另一种是在解码端利用编码端传递的W(z)的l阶LPC系数计算P(z)的2阶LPC系数,而这一推导计算过程复杂,涉及高阶非特殊矩阵的求逆运算。可见,该方法的缺点是极大的增加了解码器的运算复杂度。
可见,将表达式(4)描述的感知加权滤波器应用到语音和音频混合编码模式虽然在理论上是可行的,但实际应用中将遇到上述问题。
现有技术三为AMR-WB+协议中采用的感知加权滤波器,对应传输函数为:
W ( z ) = A ( z / &lambda; 1 ) 1 - &mu;z - 1 , - - - ( 5 )
其中μ=0.68。
AMR-WB+通过同一预加重滤波器减小信号的动态范围,以达到消除信号频谱的谱倾斜。但是,这一处理方案并没有依据当前编码频谱本身的特点加以调整,因此得到的噪声模拟信号频谱共振峰结构的效果并不理想。
发明内容
有鉴于此,本发明的第一个主要目的在于:提供一种感知加权滤波方法,减少语音和/或音频信号编码***在编码解码端的运算复杂度,并提高主观听觉效果。
本发明在上述第一个主要目的的基础上,给出第二个主要目的:提供一种感知加权滤波器,提高主观听觉效果。
为了达到上述第一个方面的目的,本发明提出的技术方案为:
一种感知加权滤波方法,对宽带语音或音频信号做感知加权滤波处理,其特征在于,包括以下步骤:
A、对输入的宽带语音或音频信号进行谱倾斜滤波处理;
B、对经过谱倾斜滤波处理后输出的宽带语音或音频信号做传统的感知加权滤波处理;
C、将经过感知加权处理的宽带语音或音频信号输出;
并且,将所述做传统的感知加权滤波处理用到的传输函数的系数中的部分系数直接作为所述谱倾斜滤波处理用到的传输函数的系数。
所述谱倾斜滤波处理和传统的感知加权滤波处理用到的传输函数的系数为均为线性预测系数LPC系数。
令所述谱倾斜滤波处理用到的传输函数系数为一组p阶LPC系数,由该组系数构成集合b={bj,j=1,…,p};所述传统的感知加权滤波处理用到的传输函数系数为一组l阶LPC系数,由该组系数构成集合a={ai,i=1,…,l},则有: b &Subset; a , 1<p<l,且所述的集合b中的p个元素分别与集合a中前p个元素一一对应并相同,其中,bj为p阶LPC系数,ai为l阶LPC系数。
利用传输函数P′(z)对输入的宽带语音或音频信号做谱倾斜滤波处理,所述传输函数P′(z)表达式为:
P &prime; ( z ) = 1 + &Sigma; j = 1 p b j &delta; j z - j
δ为加权系数,z为复变量;所述的P′(z)为全零点传输函数。
利用传输函数W(z)对经过谱倾斜滤波处理后输出的宽带语音或音频信号做传统的感知加权滤波处理,所述传输函数W(z)的表达式为:
W ( z ) = A ( z / &lambda; 1 ) A ( z / &lambda; 2 ) = 1 + &Sigma; i = 1 l a i &lambda; 1 i z - i 1 + &Sigma; i = 1 l a i &lambda; 2 i z - i
其中,λ1与λ2为加权系数,且0<λ21≤1。
令所述的方法用到的传输函数为W"(z),则其表达式为:
W &prime; &prime; ( z ) = W ( z ) P &prime; ( z ) = ( 1 + &Sigma; i = 1 l a i &lambda; 1 i z - i ) ( 1 + &Sigma; i = 1 l a i &lambda; 2 i z - i ) ( 1 + &Sigma; j = 1 p b j &delta; j z - j )
当在自适应多码率的宽带编解码AMR-WB或扩展的自适应多码率的宽带编解码AMR-WB+宽带语音频编解码***中使用所述的方法,则所述W"(z)中各参数取值分别为:l=16,p=2,λ1=0.91,λ2=0.3,δ=0.2;并且,b1=a1、b2=a2
所述的方法将感知加权域的信号变换到非感知加权域,使用的传输函数的表达式为:
1 W &prime; &prime; ( z ) = ( 1 + &Sigma; i = 1 l a i &lambda; 2 i z - i ) ( 1 + &Sigma; i = 1 l a i &lambda; 1 i z - i ) 1 ( 1 + &Sigma; j = 1 p b j &delta; j z - j ) .
为了达到上述第二个方面的目的,本发明提出的技术方案为:
一种感知加权滤波器,对输入的宽带语音或音频信号做感知加权滤波处理,包括:谱倾斜滤波单元和感知加权滤波单元;
所述的谱倾斜滤波单元对输入的宽带语音或音频信号的频谱做谱平坦处理,所述的宽带语音或音频信号经过该单元处理后,继续输入所述的感知加权滤波处理单元;
所述的感知加权滤波单元根据输入的原始宽带语音或音频信号的共振峰结构调整输入该单元的信号的噪声分布,并将经过该单元滤波处理的宽带语音或音频信号继续输出。
将所述感知加权滤波单元用到的传输函数的系数中的部分系数直接作为所述谱倾斜滤波单元用到的传输函数的系数。
令所述的谱倾斜滤波单元用到的传输函数为P′(z),则其表达式为:
P &prime; ( z ) = 1 + &Sigma; j = 1 p b j &delta; j z - j
δ为加权系数,z为复变量,bj即为p阶LPC系数;
令所述感知加权滤波单元用到的传输函数为W(z),且
W ( z ) = A ( z / &lambda; 1 ) A ( z / &lambda; 2 ) = 1 + &Sigma; i = 1 l a i &lambda; 1 i z - i 1 + &Sigma; i = 1 l a i &lambda; 2 i z - i
其中,λ1与λ2为加权系数,且0<λ21≤1;
并令b={bj,j=1,…,p},a={ai,i=1,…,l},则有: b &Subset; a ,1<p<l,且所述的集合b中p个元素分别与集合a中前p个元素一一对应并相同。
令所述的感知加权滤波器用到的传输函数为W"(z),则其表达式为:
W &prime; &prime; ( z ) = W ( z ) P &prime; ( z ) = ( 1 + &Sigma; i = 1 l a i &lambda; 1 i z - i ) ( 1 + &Sigma; i = 1 l a i &lambda; 2 i z - i ) ( 1 + &Sigma; j = 1 p b j &delta; j z - j ) .
由上述技术方案可见,当在宽带语音和/或音频的编码解码***中,尤其是在宽带语音和音频混合编码解码的***中运用本发明提供的感知加权方法或感知加权滤波器,在编码端,只要计算原先就需计算的对宽带语音或音频信号做传统的感知加权滤波处理用到的传输函数W(z)或构成所述的传统的感知加权滤波器的传输函数W(z)的系数,并将该系数中的部分系数直接作为对宽带语音或音频信号做谱倾斜滤波处理用到的传输函数P′(z)或构成所述的谱倾斜滤波器的传输函数P′(z)的系数,因此相比较现有技术,本发明的实现在编码端能够减少计算复杂度;解码端解码W(z)的系数,并将该系数中的部分系数直接作为构成所述的P′(z)的系数,可见,本发明的实现无需增加额外的传输比特率,并且在解码端能够极大减少算法复杂度与计算量。并且,本发明能够在减少信号的感知加权处理滤波环节的算法复杂度与计算量的同时,达到甚至超过现有技术的感知加权的处理效果。
并且本发明给出的感知加权滤波器和感知加权的方法适用于对宽带语音或音频信号进行处理。
另外,本发明提供的技术方案还适用于AMR-WB+编码***,并且在实际应用中能够取得比现有技术更好的噪声整形效果。当本发明给出技术方案应用在除AMR-WB和AMR-WB+之外的其他宽带语音/音频编码***中时,通过调整参数λ1、λ2和δ的值以获得最佳感知加权处理效果。
附图说明
图1是本发明具体实施给出的对输入的宽带语音或音频信号做感知加权滤波处理的流程图;
图2是本发明具体实施给出的感知加权滤波器的结构示意图;
图3是在AMR-WB+的ACELP/TCX编码***中使用现有技术二和本发明给出的感知加权滤波器分别对原始的宽带语音信号进行感知加权处理的实验结果对比图;
图4是在AMR-WB+的ACELP/TCX编码***中使用现有技术二和本发明给出的感知加权滤波器分别对原始的宽带音频信号进行感知加权处理的实验结果对比图;
图5是在AMR-WB+的ACELP/TCX编码***中使用现有技术三和本发明给出的感知加权滤波器分别对原始的宽带语音信号进行感知加权处理的实验结果对比图;
图6是在AMR-WB+的ACELP/TCX编码***中使用现有技术三和本发明给出的感知加权滤波器分别对原始的宽带音频信号进行感知加权处理的理的实验结果对比图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图及具体实施例对本发明作进一步详细描述。
对背景技术中提及的所述的掩遮效应作进一步分析可知,在语音频谱中,能量较高的频段,即共振峰处的噪声相对于能量较低频段的噪声而言,不易被感知。因此,在分配原始语音与合成语音之间的误差,即噪声时,在能量比较大的共振峰区域,可以允许噪声大一些,相应地,在能量比较小的共振峰谷,要求噪声小一些。本发明正是基于这一原理,在宽带语音编码中,通过在感知加权域调整噪声分布,达到提高编码效率、增强语音编码的主观听觉质量的目的。
本发明提供的感知加权滤波方法对输入的宽带语音或音频信号做感知加权滤波处理时,使用的传输函数仍沿用背景技术中所述的表达式(3)的形式,即该传输函数仍包括两部分:传统的感知加权滤波处理用到的传输函数与谱倾斜滤波处理用到的传输函数。本发明着重对后者做出改进,即不再重新计算推导谱倾斜滤波处理用到的传输函数的系数,而是并且,将所述做传统的感知加权滤波处理用到的传输函数的系数中的部分系数直接作为所述谱倾斜滤波处理用到的传输函数的系数;之后,运用本发明给出的传输函数对输入的宽带语音或音频信号进行感知加权滤波处理,即进行噪声整形,达到掩遮噪声的目的。
首先详细说明本发明提供的对宽带语音或音频信号做感知加权处理需要用到的传输函数。
令本发明中,对输入的宽带语音或音频信号做感知加权处理使用的传输函数为W"(z),令其中传统的感知加权滤波处理用到的传输函数仍为W(z),令本发明做出改进的谱倾斜滤波处理用到的传输函数为P′(z),有:
W"(z)=W(z)P′(z),                        (6)
其中,W(z)为表达式(1)描述的函数,若取l=16,则有:
W ( z ) = A ( z / &lambda; 1 ) A ( z / &lambda; 2 ) = 1 + &Sigma; i = 1 16 a i &lambda; 1 i z - i 1 + &Sigma; i = 1 16 a i &lambda; 2 i z - i , - - - ( 7 )
其中,λ为加权系数。
所述的P′(z)的函数形式为:
P &prime; ( z ) = 1 + &Sigma; j = 1 p b j &delta; j z - j - - - ( 8 )
其中,bj为与原始输入的宽带语音或音频信号对应的p阶LPC系数。
在本发明未给出改进方案之前,所述的p阶LPC系数需要从构成A(z)的l阶系数推导求得,该推导过程相当复杂。但鉴于本发明给出的改进,所述的p阶LPC系数可从所述的l阶系数中直接取得,即令组成P′(z)的一组p阶LPC系数构成集合b={bj,j=1,…,p};对应地,组成A(z)的一组l阶LPC系数构成集合a={ai,i=1,…,l},则有: b &Subset; a ,1<p<l,且所述的集合b中p个元素分别与集合a中前p个元素一一对应并相同。可举例说明,设p=2,l=16,那么,可取集合a中前两个系数a1、a2作为与两个系数bj分别对应的系数,即b1=a1、b2=a2
由表达式(2)与表达式(8)可知,现有技术中采用的谱倾斜滤波处理用到的传输函数P(z)为全极点函数;本发明给出的谱倾斜滤波处理用到的P′(z)为全零点函数。
结合表达式(7)与表达式(8),得到本发明给出的对输入的宽带语音或音频信号做感知加权处理的传输函数的表达式为:
W &prime; &prime; ( z ) = W ( z ) P &prime; ( z ) = ( 1 + &Sigma; i = 1 l a i &lambda; 1 i z - i ) ( 1 + &Sigma; i = 1 l a i &lambda; 2 i z - i ) ( 1 + &Sigma; j = 1 p b j &delta; j z - j ) , - - - ( 9 )
然后,结合图1利用本发明给出的传输函数对输入的宽带语音或音频信号做感知加权处理。
步骤101、对输入的宽带语音或音频信号进行谱倾斜滤波处理;
该步骤中,运用上述本发明给出的谱倾斜滤波处理用到的传输函数P′(z)对宽带语音或音频信号做滤波处理,消除所述宽带语音或音频信号的谱倾斜,使得到的输出信号的频谱平坦。
步骤102、对经过步骤101处理后得到的输出的宽带语音或音频信号进一步做传统的感知加权滤波处理,调整噪声分布;
该步骤中,运用上述传统的感知加权滤波处理用到的W(z)调整所述的输出的宽带语音或音频信号的噪声分布,使得到的输出的宽带语音或音频信号的噪声分布能够跟随宽带语音或音频信号频谱共振峰变化。
步骤103、将经过感知加权处理的宽带语音或音频信号输出。
由上述内容可知,本发明给出的感知加权滤波方法通过谱倾斜滤波使宽带语音或音频信号频谱平坦,再对输出的宽带语音或音频信号利用传统的感知加权滤波处理,使噪声分布能够跟随语音或音频信号频谱共振峰变化,从而实现掩遮噪声的目的。
另外,在实际的应用中,如分析合成法中计算合成语音信号的时候,需要将感知加权域的信号恢复到非感知加权域,这个恢复的过程即感知加权的逆过程,因此,对应的传输函数为表达式(9)的倒数:
1 W &prime; &prime; ( z ) = ( 1 + &Sigma; i = 1 l a i &lambda; 2 i z - i ) ( 1 + &Sigma; i = 1 l a i &lambda; 1 i z - i ) 1 ( 1 + &Sigma; j = 1 p b j &delta; j z - j ) - - - ( 10 )
本发明还提供一种如图2所示的感知加权滤波器,该滤波器根据上述本发明给出的感知加权滤波方法而设计,对输入的宽带语音或音频信号进行滤波处理。所述的感知加权滤波器包括:谱倾斜滤波单元201和感知加权滤波单元202。
所述的谱倾斜滤波单元201对输入的宽带语音或音频信号的进行谱倾斜滤波,使输入的宽带语音或音频信号的频谱平坦,所述的宽带语音或音频信号经过该单元处理后,继续输入所述的感知加权滤波处理单元;
所述的感知加权滤波单元202根据原始宽带语音或音频信号的共振峰结构调整输入该单元的宽带语音或音频信号的噪声分布,并将经过该单元滤波处理的宽带语音或音频信号继续输出。所述的感知加权滤波单元202能够减弱谱平坦处理后共振峰频率区域的重要性。
所述的感知加权滤波单元的传输函数参见表达式(1);所述的谱倾斜滤波单元的传输函数参见表达式(8),相应地,所述的感知加权滤波器的传输函数参见表达式(9)。
并且,与上述本发明给出的感知加权滤波方法相对应,将所述感知加权滤波单元用到的传输函数的系数中的部分系数直接作为所述谱倾斜滤波单元用到的传输函数的系数,即令表达式(8)中组成P′(z)的一组p阶LPC系数构成集合b={bj,j=1,…,p};对应地,表达式(1)中组成A(z)的一组l阶LPC系数构成集合a={ai,i=1,…,l},则有: b &Subset; a , 1<p<l,且所述的集合b中p个元素分别与集合a中前p个元素一一对应并相同。可举例说明,设p=2,l=16,那么,可取集合a中前两个系数a1、a2作为与两个系数bj分别对应的系数,即b1=a1、b2=a2
将本发明给出的感知加权滤波器、现有技术二给出的感知加权滤波器以及现有技术三,即AMR-WB+本身采用的感知加权滤波器应用于宽带语音和音频混合编码***,如AMR-WB+的ACELP/TCX语音和音频的混合编码***中,结合附图对比说明本发明技术方案与现有技术对宽带语音信号和音频信号感知加权处理的效果。其中,现有技术二中感知加权滤波器采用的传输函数对应表达式(4),该式中各参数取分别是:p=2,l=16,λ1=0.95,λ2=0.8,δ=0.7;现有技术三中感知加权滤波器采用的传输函数对应表达式(5),其中,取μ=0.68;本发明给出的感知加权滤波器在该实施例中采用的传输函数对应表达式(9),该式中各参数取值分别是:p=2,l=16,即两个系数bj分别与前两个ai系数对应;λ1=0.91,λ2=0.3,δ=0.2。
图3所示为使用现有技术二和本发明给出的感知加权滤波器分别对原始的宽带语音信号进行感知加权处理的实验结果。由图3可见,本实施例中,本发明给出的感知加权滤波器对原始宽带语音信号做滤波后,得到的量化噪声能够很好地跟随原始宽带语音信号的频谱包络的变化而变化;并且共振峰的频率成分能够很好地掩遮掉量化噪声。经过现有技术二给出的感知加权滤波器处理后得到的量化噪声虽然也能够跟随原始宽带语音信号的频谱包络的变化而变化,但是掩遮效果显然没有使用经过本发明改进的感知加权滤波器的效果好。由图3中曲线可见,现有技术二对应的处理效果中,量化噪声相对较高,并且在多处出现共振峰频无法有效掩蔽噪声,这样的处理效果显然是有待改进的。相比较而言,本实施例给出的处理结果显然较好,即能够利用在共振峰区域分配比较大的量化噪声,而在共振峰谷分配比较小的量化噪声,因此,能够获得较好的主观听觉效果。
图4所示为使用现有技术二和本发明给出的感知加权滤波器分别对原始的宽带音频信号进行感知加权处理的实验结果。对图4的分析可参考上述对图3中处理结果的分析。并且,由图4可见,现有技术二在低频段给出的处理结果几乎不能获得共振峰的频率成分掩遮掉量化噪声的效果,因此主观听觉效果并不理想,这一实验结果也跟背景技术中分析得出的现有技术二不适用于宽带语音和音频的混合编码***的结果一致。由图4显而易见,本实施例中,本发明给出的处理结果相对较好。
图5所示为使用现有技术三和本发明给出的感知加权滤波器分别对原始的宽带语音信号进行感知加权处理的实验结果。由图5可见,本实施例中,现有技术三给出的处理结果虽然能够使量化噪声低于本发明的处理结果,但是,图5所示的实验结果显示了该技术固有的缺陷,即背景技术中提及的这一处理方案并没有依据当前编码频谱本身的特点加以调整,因此得到的量化噪声跟随共振峰频谱包络变化的效果并不理想,而这一缺陷带来的后果就是编码效率的降低,即需要分配更多的编码比特率以降低噪声。而本发明处理得到的量化噪声由于能够很好地跟随原始宽带语音信号的频谱包络的变化而变化,因此,根据掩遮效应提高编码效率。
图6所示为使用现有技术三和本发明给出的感知加权滤波器分别对原始的宽带音频信号进行感知加权处理的实验结果。对图6的分析内容可参见上述对图5的分析,不再赘述。
由上述内容可知,当在语音和/或音频的编码解码***中,尤其是在语音和音频混合编码解码的***中运用本发明提供的感知加权方法或感知加权滤波器,在编码端,只要计算原先就需计算的对宽带语音或音频信号做传统的感知加权滤波处理用到的传输函数W(z)或构成所述的传统的感知加权滤波器的传输函数W(z)的系数,并将该系数中的部分系数直接作为对宽带语音或音频信号做谱倾斜滤波处理用到的传输函数P′(z)或构成所述的谱倾斜滤波器的传输函数P′(z)的系数,因此相比较现有技术,本发明的实现在编码端能够减少计算复杂度;解码端解码W(z)的系数,并将该系数中的部分系数直接作为构成所述的P′(z)的系数,可见,本发明的实现无需增加额外的传输比特率,并且在解码端能够极大减少算法复杂度与计算量。并且,由图3至图6给出的实验结果表明,本发明能够在减少宽带语音或音频信号的感知加权滤波处理环节的算法复杂度与计算量的同时,达到甚至超过现有技术的感知加权的处理效果。
并且本发明给出的感知加权滤波器适用于对宽带语音信号或音频信号进行处理。当本发明给出的感知加权滤波器应用在除AMR-WB和AMR-WB+之外的其他宽带语音/音频编码***中时,通过调整参数λ1、λ2和δ的值以获得最佳感知加权滤波效果。
在实际的应用中,如分析合成法中计算合成语音信号的时候,需要将感知加权域的信号恢复到非感知加权域,这个恢复的过程即感知加权的逆过程,因此,本发明基于上述给出的感知加权滤波器还提供一种逆感知加权滤波器,该滤波器对应所述的感知加权滤波器的逆处理,对应的传输函数为表达式(10)。

Claims (11)

1、一种感知加权滤波方法,对宽带语音或音频信号做感知加权滤波处理,其特征在于,包括以下步骤:
A、对输入的宽带语音或音频信号进行谱倾斜滤波处理;
B、对经过谱倾斜滤波处理后输出的宽带语音或音频信号做传统的感知加权滤波处理;
C、将经过传统的感知加权滤波处理的宽带语音或音频信号输出;
并且,将所述做传统的感知加权滤波处理用到的传输函数的系数中的部分系数直接作为所述谱倾斜滤波处理用到的传输函数的系数。
2、根据权利要求1所述的方法,其特征在于,所述谱倾斜滤波处理和感知加权滤波处理用到的传输函数的系数均为线性预测系数LPC系数。
3、根据权利要求2所述的方法,其特征在于,令所述谱倾斜滤波处理用到的传输函数系数为一组p阶LPC系数,由该组系数构成集合b={bj,j=1,…,p};所述传统的感知加权滤波处理用到的传输函数系数为一组l阶LPC系数,由该组系数构成集合a={ai,i=1,…,l},则有: b &Subset; a , 1<p<l,且所述的集合b中的p个元素分别与集合a中前p个元素一一对应并相同,其中,bj为p阶LPC系数,ai为l阶LPC系数。
4、根据权利要求3所述的方法,其特征在于,利用传输函数P′(z)对输入的宽带语音或音频信号做谱倾斜滤波处理,所述传输函数P′(z)表达式为:
P &prime; ( z ) = 1 + &Sigma; j = 1 p b j &delta; j z - j
δ为加权系数,z为复变量;所述的P′(z)为全零点传输函数。
5、根据权利要求4所述的方法,其特征在于,利用传输函数W(z)对经过谱倾斜滤波处理后输出的宽带语音或音频信号做传统的感知加权滤波处理,所述传输函数W(z)的表达式为:
W ( z ) = A ( z / &lambda; 1 ) A ( z / &lambda; 2 ) = 1 + &Sigma; i = 1 l a i &lambda; 1 i z - i 1 + &Sigma; i = 1 l a i &lambda; 2 i z - i
其中,λ1与λ2为加权系数,且0<λ21≤1。
6、根据权利要求5所述的方法,其特征在于,令所述的方法用到的传输函数为W"(z),则其表达式为:
W &prime; &prime; ( z ) = W ( z ) P &prime; ( z ) = ( 1 + &Sigma; i = 1 l a i &lambda; 1 i z - i ) ( 1 + &Sigma; i = 1 l a i &lambda; 2 i z - i ) ( 1 + &Sigma; j = 1 p b j &delta; j z - j ) .
7、根据权利要求6所述的方法,其特征在于,当在自适应多码率的宽带编解码AMR-WB或扩展的自适应多码率的宽带编解码AMR-WB+宽带语音频编解码***中使用所述的方法,则所述W"(z)中各参数取值分别为:l=16,p=2,λ1=0.91,λ2=0.3,δ=0.2;并且,b1=a1、b2=a2
8、根据权利要求6所述的方法,其特征在于,所述的方法将感知加权域的信号变换到非感知加权域,使用的传输函数的表达式为:
1 W &prime; &prime; ( z ) = ( 1 + &Sigma; i = 1 l a i &lambda; 2 i z - i ) ( 1 + &Sigma; i = 1 l a i &lambda; 1 i z - i ) 1 ( 1 + &Sigma; j = 1 p b j &delta; j z - j ) .
9、一种感知加权滤波器,对输入的宽带语音或音频信号做感知加权滤波处理,其特征在于,包括:谱倾斜滤波单元和感知加权滤波单元;
所述的谱倾斜滤波单元对输入的宽带语音或音频信号的频谱做谱平坦处理,所述的宽带语音或音频信号经过该单元处理后,继续输入所述的感知加权滤波处理单元;
所述的感知加权滤波单元根据输入的原始宽带语音或音频信号的共振峰结构调整输入该单元的信号的噪声分布,并将经过该单元滤波处理的宽带语音或音频信号继续输出;
并且,将所述感知加权滤波单元用到的传输函数的系数中的部分系数直接作为所述谱倾斜滤波单元用到的传输函数的系数。
10、根据权利要求9所述的感知加权滤波器,其特征在于,令所述的谱倾斜滤波单元用到的传输函数为P′(z),则其表达式为:
P &prime; ( z ) = 1 + &Sigma; j = 1 p b j &delta; j z - j
δ为加权系数,z为复变量,bj即为p阶LPC系数;
令所述感知加权滤波单元用到的传输函数为W(z),且
W ( z ) = A ( z / &lambda; 1 ) A ( z / &lambda; 2 ) = 1 + &Sigma; i = 1 l a i &lambda; 1 i z - i 1 + &Sigma; i = 1 l a i &lambda; 2 i z - i
其中,λ1与λ2为加权系数,且0<λ21≤1;
并令b={bj,j=1,…,p},a={ai,i=1,…,l},则有: b &Subset; a , 1<p<l,且所述的集合b中p个元素分别与集合a中前p个元素一一对应并相同。
11、根据权利要求9或10所述的感知加权滤波器,其特征在于,令所述的感知加权滤波器用到的传输函数为W"(z),则其表达式为:
W &prime; &prime; ( z ) = W ( z ) P &prime; ( z ) = ( 1 + &Sigma; i = 1 l a i &lambda; 1 i z - i ) ( 1 + &Sigma; i = 1 l a i &lambda; 2 i z - i ) ( 1 + &Sigma; j = 1 p b j &delta; j z - j ) .
CNB2006101269218A 2006-09-06 2006-09-06 感知加权滤波方法及感知加权滤波器 Active CN100487789C (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CNB2006101269218A CN100487789C (zh) 2006-09-06 2006-09-06 感知加权滤波方法及感知加权滤波器

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CNB2006101269218A CN100487789C (zh) 2006-09-06 2006-09-06 感知加权滤波方法及感知加权滤波器

Publications (2)

Publication Number Publication Date
CN101140758A CN101140758A (zh) 2008-03-12
CN100487789C true CN100487789C (zh) 2009-05-13

Family

ID=39192679

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB2006101269218A Active CN100487789C (zh) 2006-09-06 2006-09-06 感知加权滤波方法及感知加权滤波器

Country Status (1)

Country Link
CN (1) CN100487789C (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8391212B2 (en) 2009-05-05 2013-03-05 Huawei Technologies Co., Ltd. System and method for frequency domain audio post-processing based on perceptual masking
CN102054482B (zh) * 2009-10-27 2012-11-28 ***通信集团公司 一种语音信号增强的方法和装置
CN104703093B (zh) * 2013-12-09 2018-07-17 ***通信集团公司 一种音频输出方法及装置
US10115410B2 (en) * 2014-06-10 2018-10-30 Peter Graham Craven Digital encapsulation of audio signals
FR3049084B1 (fr) * 2016-03-15 2022-11-11 Fraunhofer Ges Forschung Dispositif de codage pour le traitement d'un signal d'entree et dispositif de decodage pour le traitement d'un signal code

Also Published As

Publication number Publication date
CN101140758A (zh) 2008-03-12

Similar Documents

Publication Publication Date Title
CN101140759B (zh) 语音或音频信号的带宽扩展方法及***
US10734003B2 (en) Noise signal processing method, noise signal generation method, encoder, decoder, and encoding and decoding system
CN1926610B (zh) 合成单声道音频信号的方法、音频解码器和编码***
EP2791937B1 (en) Generation of a high band extension of a bandwidth extended audio signal
CN102341852B (zh) 滤波语音信号的方法和滤波器
CN103187065B (zh) 音频数据的处理方法、装置和***
CN100487789C (zh) 感知加权滤波方法及感知加权滤波器
CN105070293A (zh) 基于深度神经网络的音频带宽扩展编码解码方法及装置
US20130117030A1 (en) Signal compression method and apparatus
CN1947173B (zh) 分层编码装置及分层编码方法
CN101430880A (zh) 一种背景噪声的编解码方法和装置
CN105280190A (zh) 带宽扩展编码和解码方法以及装置
CN102985969A (zh) 编码装置、解码装置和编码方法、解码方法
KR20070051857A (ko) 스케일러블 오디오 코딩
CN101320565B (zh) 感知加权滤波方法及感知加权滤波器
CN101483495B (zh) 一种背景噪声生成方法以及噪声处理装置
CN101770778B (zh) 一种预加重滤波器、感知加权滤波方法及***
US8370154B2 (en) Method and apparatus for generating an excitation signal for background noise
CN101740033B (zh) 一种音频编码方法和音频编码器
CN102169694B (zh) 生成心理声学模型的方法及装置
CN101572090B (zh) 一种自适应多速率窄带编码方法及编码器
CN101304261A (zh) 一种频带扩展的方法及装置
CN101582263B (zh) 语音解码中噪音增强后处理的方法和装置
CN101533639B (zh) 语音信号处理方法及装置
CN101587711B (zh) 基音后处理方法、滤波器以及基音后处理***

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant