CN1471236A - 用于感知音频编码的信号自适应多分辨率滤波器组 - Google Patents

用于感知音频编码的信号自适应多分辨率滤波器组 Download PDF

Info

Publication number
CN1471236A
CN1471236A CNA031485154A CN03148515A CN1471236A CN 1471236 A CN1471236 A CN 1471236A CN A031485154 A CNA031485154 A CN A031485154A CN 03148515 A CN03148515 A CN 03148515A CN 1471236 A CN1471236 A CN 1471236A
Authority
CN
China
Prior art keywords
filters
signal
bank
cosine
modulation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA031485154A
Other languages
English (en)
Inventor
潘兴德
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
BEIJING FUGUO DIGITAL TECHN Co Ltd
Original Assignee
BEIJING FUGUO DIGITAL TECHN Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by BEIJING FUGUO DIGITAL TECHN Co Ltd filed Critical BEIJING FUGUO DIGITAL TECHN Co Ltd
Priority to CNA031485154A priority Critical patent/CN1471236A/zh
Publication of CN1471236A publication Critical patent/CN1471236A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

本发明涉及信号处理中数据压缩及信号处理用滤波,更详细地说,它用于音频信号的解相关,从而提供一个消解冗余度的方法或装置。除此之外,基于心理声学模型,本发明还可用于分离具有不同重要性的信号分量。本发明的特征在于,利用余弦调制滤波或MDCT技术可以构造多种不同时频划分的滤波器组结构,并且,该滤波器组结构可以信号自适应的切换,从而可以在音频编码过程中更有效的消除信号的统计冗余和听觉无关成分,取得了很高的编码效率。

Description

用于感知音频编码的信号自适应多分辨率滤波器组
技术领域
本发明涉及信号处理中数据压缩及信号处理用滤波器组,更详细地说,它用于音频信号的解相关,从而提供一个消解冗余度的方法和装置,除此之外,基于心理声学模型,本发明还可用于分离具有不同重要性的信号分量。
背景技术
数字音频压缩编码技术能够以比较低的速率获得高质量的编码效果,其基本原理在于:1)设法消除音频信号的冗余度;2)充分利用人耳听觉特性。
众所周知,一些线性变换能够导致接近于零的高频系数,换句话说,时域信号包含的大部分信息能够被转换或集中到频域或时一频域系数的一个子集中,于是,信号压缩技术广泛地采用不同滤波结构作为提高编码效率的手段。
在心理声学中,一个纯音可以被以它为中心,且具有一定带宽的连续噪声所掩蔽,若在这一频带内噪声功率等于该纯音的功率,此时该纯音处于刚好能被听到的临界状态,即称这一频带为临界带宽(单位为Bark)。临界频带是编码中子带划分的心理学依据。人耳对音频信号的分析以临界频带为基础,类似一个非等带宽滤波器组,在不同的子带中差异很大。因此,临界频带是编码中子带划分的心理声学依据。在感知音频编码中,子带的划分应尽量与人耳临界频带的宽度接近,以便更好的适应人耳的听觉特性。但是,在实际的编码中,考虑到实现的代价,这一要求并不能得到完全的满足。原因在于,能够接近人耳的听觉特性的非等带宽滤波器组设计、相关的心理声学分析和量化设计存在技术方面的困难。
一般地,知觉音频编码器的一个基本操作是把输入的音频信号从时间域映射到频率域或者时一频域,其基本的思路为:把信号分解为各频率带上的成分;一旦输入信号在频域上得以表达,心理声学模型就可以用来去除枝节信息;进一步,把各频带上的成份分组。最后,通过合理地分配比特数以表达各组频率参数。由于音频信号展现出强烈的准周期性,这一过程可大大降低数据量、提升编码效率。
最近的几年里,一系列可用于信号成份分离和冗余度提取的时--频域映射(也被称为变换和滤波)算法被开发出来。这些性能各异的方法包括:
(1)离散傅立叶变换(Discrete Fourier transform,DFT)。
(2)离散余弦变换(Discrete cosine transform,DCT)。
(3)镜像滤波器(Quadrature mirror filters,QMF)。
(4)伪镜像滤波器(Pseudo QMF,PQMF)。
(5)余弦调制滤波器(Cosine Modulated Filters,CMF)。(其中包括离散余弦变换,即MDCT)
(6)离散小波(包)变换(Discrete Wavelet(Packet)Transform,DW(P)T)。
上述各种变换具有不同的优缺点,不同的***根据需要选用适当的变换作为其滤波器组的基本构成。
MPEG-1,2 Layers I和II采用了PQMF作为滤波器组。该滤波器组的优点为:结构相对简单、时间分辨率很好。其缺点为:邻近子带之间存在明显的频率重叠;单一频率信号的变化可影响与其相邻的二个子带。2000Hz以下的频带宽度远大于心理声学带宽值,从而无法实现比特数的最优分配。实时运算量偏大。
MPEG-1,2 Layer III采用了PQMF和MDCT的级联作为其滤波器组。虽然MDCT的引入可提升频率分辨率从而改进编码效率,PQMF在邻近子带之间的频率重叠仍然会导致信号的混迭,频域量化噪声在时间域上的扩散比较严重。
MPEG-2,4 AAC采用了MDCT作为滤波器组(稳态信号:1024-点MDCT,暂态信号:128-点MDCT),该滤波器组使用了二种重叠窗形状:SINE和KBD。其优点为:频率分辨率很好;其缺点为:时间分辨率偏低。
MPEG-4 Twin VQ的滤波器组与MPEG-2,4 AAC相似,除此之外,它采用了线性滤波器组以白化频谱系数并在量化级之前执行归一化操作。
AC-3的滤波器组对稳态信号使用256-点MDCT,对暂态信号使用128-点MDCT,其块长选择机制比较简单,选择效果为次最优。
上述***或者只采用一种变换配置去压缩表达一个输入信号帧,或者采用时域分析区间较小的滤波器组或变换压缩表达变化剧烈的信号(或称快变信号),以消除前回声对解码信号的影响。当一个信号帧包含不同暂态特性的成份时,单一的变换配置不足以满足不同信号子帧对优化压缩的基本需求;而简单的采用时域作用区间较小的滤波器组或变换来处理快变信号,则所得系数的频率分辨率较低,使得低频部分的频率分辨率远大于人耳临界子带带宽,因而严重影响编码效率。
ATRAC的滤波器组由前回声增益控制、QMF和MDCT级联而成。它还采用了窗转换机制以根据输入信号的特性调整时频分辨率。
DTS的滤波器组由512-tap 32子带PQMF构成。为了进一步提取冗余度,一个线性滤波器组可被级联在PQMF之后。
Deepen Sinha和J.D.Johnston提出了一种基于MDCT和小波变换信号自适应切换的编码技术(Deepen Sinha和J.D.Johnston“Audiocompression at low bit rates using a signal adaptive switchedfilterbank”,In Proc.IEEE Int.Conf.Acoust.,Speech,SignalProcessing,volume 2,pages 1053-1056,Atlanta,USA,1996.),对缓变信号,采用频率分辨率较高的MDCT变换,对变换剧烈的信号,采用小波变换,获得了较高的编码效率。
Marcus Purat和Peter Noll通过对余弦调制滤波器组的输出进行再滤波,提供了一种新的用于音频编码的多分辨率的滤波技术(MarcusPurat和Peter Noll,“A new orthonormal wavelet packetdecomposition for audio coding using frequency-varying modulatedlapped transforms”,IEEE 1995 Workshop on Applications of SignalProcessing to Audio and Acoustics,New Paltz,N.Y.(USA),1995),也获得了较高的编码效率。
发明内容
为了提高音频编码的品质,必须有效提高编码信号中的统计冗余和听觉无关成份。滤波器组的使用提供了一种去除统计和听觉冗余信息和减少编码边信息的最佳途径。根据其功能,滤波的设计目的包括:
(1)对于不同的信号类型,调整滤波器组的时、频分辨率,优化分离具有不同感知特性的信号成分。
(2)采用尽可能长的改进余弦形式的基函数,有效的去除或削弱音频信号中统计冗余。
(3)通过滤波器组时频分辨率的自适应切换,以及相邻帧间的重叠加窗技术,尽可能减小了前回声(Pre Echo)噪声和由边界之不连续性所导致的听觉块效应(Blocking Effect)。
(4)由于有效的去除了音频信号的统计冗余和感知无关冗余,在保持音频信号品质的前提下,有效提高了音频信号的压缩效率。
(5)采用的滤波技术可以产生较小的编/解延迟。
(6)采用快速算法,运算量较小。
为了实现上述目标,本发明采用余弦调制滤波器组技术,设计一组根据音频输入信号的暂态性度量切换的滤波器组结构,在消除或削弱符号间的统计冗余的同时,充分利用人耳听觉特性,以提高编码效率。
本发明所提出的信号自适应滤波器组结构,是指在音频编码中,根据当前编码信号的类型,动态调整滤波结构的技术。对缓慢信号,采用等带宽的余弦调制滤波器组;对快变信号,采用基于余弦调制的多分辨率时频划分滤波器组,即低频成分利用频率分辨率较高的余弦调制滤波器组,高频成分利用较高的时间分辨率余弦调制滤波器组。并且,根据当前信号的统计特性、掩蔽特性和/或时频特性,可以改变该多分辨率结构,以自适应的实现信号的分析表示,从而有效的减小编码所用的比特数。
所述的信号自适应滤波技术,对不同的信号类型,采用不同的基于余弦调制滤波器组技术的滤波结构。即缓变信号采用等带宽余弦调制滤波器组,快变信号的低频部分和高频部分采用不同时--频分辨率的等带宽余弦调制滤波器组,过渡信号采用等带宽余弦调制滤波器组。等带宽余弦调制滤波器组可以采用经典的余弦调制滤波器组和MDCT两种形式。
本发明滤波器组用于在音频编解码中,取得了很高编码效率,且所需要的运算没有显著的增加。
附图说明
图1是余弦调制滤波器的分析和综合滤波器组的结构框图。
图2是本发明滤波器组的工作原理框图。
图3是快变信号分析滤波结构(编码端)。
图4是快变信号综合滤波结构(解码端)。
图5是快变信号帧的分析/综合窗示意图。
图6是缓变到快变信号处理的分析/综合窗示意图。
图7是本发明滤波器组的工作流程图。
图8是用于音频的一个典型编码流程图。
图9是从“平稳→快变→平稳”的信号类型转变时,滤波器组切换时,窗形状示意图。
图10是快变信号滤波器分析窗。
图11是快变块的时频划分示意图。
具体实施方式
本发明所提出的信号自适应滤波器组结构,是指在音频编码中,根据当前编码信号的类型,动态调整滤波结构的技术。不同于AAC的长短MDCT变换块的策略,本发明对缓慢信号,采用等带宽的余弦调制滤波器组;对于快变信号,采用基于余弦调制技术的多分辨率时频划分滤波器组,即低频成分利用频率分辨率较高的余弦调制滤波器组,高频成分利用较高的时间分辨率余弦调制滤波器组。并且,根据当前信号的统计特性、掩蔽特性和/或时频特性,可以改变该多分辨率结构,以自适应的实现信号的分析表示,从而有效的减小编码所用的比特数。本发明所提出的信号自适应滤波技术的工作原理如图2所示:输入信号经暂态性度量模块分析,分为缓变信号、快变信号(可以对快变信号进行细分,分别非类I型快变信号,类II型信号等)和不同信号类型转换时的过渡信号;然后,不同的信号类型采用不同的滤波结构滤波,获得所需的时--频滤波系数。
本发明所提出的信号自适应滤波技术,不同的信号类型,采用不同的基于余弦调制滤波器组技术的滤波结构。即缓变信号采用等带宽余弦调制滤波器组,快变信号的低频部分和高频部分采用不同时--频分辨率的等带宽余弦调制滤波器组,过渡信号采用等带宽余弦调制滤波器组。等带宽余弦调制滤波器组可以采用经典的余弦调制滤波器组和MDCT两种形式。其中,快变信号的一种多分辨率滤波结构如图3和图4所示,图3为编码端的滤波结构,图4为解码端的滤波结构。
本发明的信号自适应滤波器组技术的工作流程如图7所示。其步骤如下:
(1)频信号分解成帧,输入处理流程;
(2)择暂态性度量方法;
(3)计算当前信号帧的暂态性;
(4)判断当前信号的类型;
(5)选择当前帧信号的滤波结构;
(6)余弦调制滤波;
(7)滤波系数的时频组织;
(8)滤波输出。
为了叙述方便,本发明申请提出两个概念,即“缓变信号”和“快变信号”。由于音频信号是时变的,因此,根据当前帧信号的特点,如统计量变化程度、时/频域波形平坦度、以及信号自身的时间掩蔽能力(是否会产生前回声)等指标,将当前帧信号定义为“缓变信号”或“快变信号”。应该注意,这里定义的“缓变信号”和通常所谓的“准平稳”或“时域缓变”信号是有区别的,“快变信号”也和通常所谓的“非平稳”或“瞬变”信号有所区别。
在本发明的滤波器组的实现过程中,需要确定一个方便有效的信号类型判断机制,并且,该判断机制可以根据实际编码应用确定。
在本发明中,定义音频信号暂态性度量方法为: Z = ( Σ j = 1 N | s j - 1 N Σ j = 1 N s j | 2 + λ ) / Σ j = 1 N | s j | 2 + λ
sj为当前帧第j个信号样本;N为帧长,
λ为大于零小于1的实数;λ的引入是为了突显变化的重要性。
当上式的Z低于某一阈值X1时,该信号可以定义为缓变信号;反之,若低于另一阈值X2,则为类型K1快变信号,这样,可以定义一系列的快变信号类型。若设共K种信号类型,则阈值Xi(i=1,…,K)是可以根据信号变化自适应变化的。其中,K和阈值Xi(i=1,…,K)的确定方法如下:若欲限定每帧滤波器结构信息占用L个比特,则K≤2L,统计信号暂态性度量的分布函数,将暂态性度量分为K个区间,并使每个区间的概率分布相等。
在本发明中,对缓变信号采用等带宽的余弦调制滤波器组;对于快变信号,采用基于余弦调制滤波技术的多分辨率时--频划分滤波器组,即低频成分利用频率分辨率较高的余弦调制滤波器组,高频成分利用较高的时间分辨率余弦调制滤波器组。这种时--频划分特点符合人耳听觉的临界子带的分布规律;同时,由于信号快变成分主要体现在中高频部分,因此,在音频编码中,这样的滤波结构优于其他单一结构的滤波器组或采用简单的切换的滤波器组。请参见图2所示的滤波器组的工作原理框图。
在本发明中,一些参数和机制必须被合理地制定。这些参数和机制包括:
(a)分辨率滤波结构及其选择;
(b)重叠窗的形状;
(c)重叠窗的长度。
如上所述,在本发明中,缓变信号和快变信号的滤波均基于余弦调制滤波器组技术,其中,余弦调制滤波器组包括两种滤波形式:传统的余弦调制滤波技术和MDCT技术。一个基于余弦调制滤波的信源编/解码***如图1所示。在编码端,输入信号被分析滤波器组分解成M个子带,子带系数被量化和熵编码。在解码端,经熵解码和反量化后,获得子带系数,子带系数通过综合滤波器组滤波,恢复音频信号。
传统的余弦调制滤波技术的冲击响应如下: h k ( n ) = 2 p a ( n ) cos ( π M ( k + 0.5 ) ( n - D 2 ) + θ k ) - - - - ( 1 )
n=0,1,…,Nh-1 f k ( n ) = 2 p s ( n ) cos ( π M ( k + 0.5 ) ( n - D 2 ) - θ k ) - - - - ( 2 )
n=0,1,…,Nf-1
其中0≤k<M-1,0≤n<2KM-1,K为大于零的整数, θ k = ( - 1 ) k π 4 .
这里,设M子带余弦调制滤波器组的分析窗(分析原型滤波器)pa(n)的冲击响应长度为Na,综合窗(或称综合原型滤波器)ps(n)的冲击响应长度为Ns,此时整个***的延时D可限定于[M-1,Ns+Na-M+1]范围内,***延时为D=2sM+d(0≤d≤2M-1)。
当分析窗和综合窗相等,即
 pa(n)=ps(n),且Na=Ns                             (3)
时,由(1)式和(2)式表示的余弦调制滤波器组为正交滤波器组,此时矩阵H和F([H]n,k=hk(n),[F]n,k=fk(n))为正交变换矩阵。为获得线性相位滤波器组,进一步规定对称窗
 pa(2KM-1-n)=pa(n)                               (4)
为保证正交和双正交***的完全重构性,窗函数需满足的条件见文献(P.P.Vaidynathan,“Multirate Systems and Filter Banks”,Prentice Hall,Englewood Cliffs,NJ,1993)。
另外一种滤波形式为MDCT(Modified Discrete Cosine Transform),也被称为TDAC(Time Domain Aliasing Cancellation)余弦调制滤波器组,其冲击响应为: h k ( n ) = p a ( n ) 2 M cos ( π M ( k + 0.5 ) ( n + M + 1 2 ) ) - - - - ( 5 ) f k ( n ) = p s ( n ) 2 M cos ( π M ( k + 0.5 ) ( n + M + 1 2 ) ) - - - - ( 6 )
其中0≤k<M-1,0≤n<2KM-1,K为大于零的整数。其中,pa(n)和ps(n)分别为分析窗(或分析原型滤波器)和综合窗(或综合原型滤波器)。
同样的,当分析窗和综合窗相等,即
    pa(n)=ps(n)                                  (7)
时,由(5)式和(6)式表示的余弦调制滤波器组为正交滤波器组,此时矩阵H和F([H]n,k=hk(n),[F]n,k=f(n))为正交变换矩阵。为获得线性相位滤波器组,进一步规定对称窗
    pa(2KM-1-n)=pa(n)                             (8)
则为满足完全重构,由可知,分析窗和综合窗需满足 Σ m = 0 2 K - 1 - 2 s p a ( mM + n ) p a ( ( m + 2 s ) M + n ) = δ ( s ) - - - - ( 9 )
其中s=0,…,K-1,n=0,…,
放宽(7)式的约束条件,即取消分析窗和综合窗相等的限制,则余弦调制滤波器组为双正交调制滤波器组。双正交调制滤波器组虽然丢失了变换的正交性,但有可能获得其他更有实际意义的性能。
时域分析已经证明,如(5)式和(6)式获得的双正交调制滤波器组依然满足完全重构性能,只要 Σ m = 0 2 K - 1 - 2 s p s ( mM + n ) p a ( ( m + 2 s ) M + n ) = δ ( s ) - - - - ( 10 ) Σ m = 0 2 K - 1 - 2 s ( - 1 ) m p s ( mM + n ) p a ( ( m + 2 s ) M + ( M - n - 1 ) ) = 0 - - - - ( 11 )
其中s=0,…,K-1,n=0,…,M-1。
本发明滤波的分析窗和综合窗可以采用任意满足滤波器组完全重构(Perfect Reconstruction)条件的窗形式,如在音频编码中常用的SINE和KBD窗。
为了保证本发明的滤波器组结构的完全重构性质,余弦调制滤波器组需要满足如下条件:
(a)缓变信号帧编/解码端的分析和综合滤波器组的分析窗和综合窗必须满足余弦调制滤波器组完全重构性对窗函数的约束要求,即满足上述(10)、(11)式或其他约束条件。
(b)对快变信号帧编码/解码时,分析和综合滤波器组需要满足如下条件:较高时间分辨率的余弦调制滤波器组的分析窗的时序平方和等于较高频率分辨率的余弦调制滤波器组的分析窗的平方,或者M个较高时间分辨率的余弦调制滤波器组的分析窗的时序平方和等于N个较高频率分辨率的余弦调制滤波器组的分析窗的时序平方和(其中N≤M);当采用多个(>2)时间分辨率的滤波器组时,同样需要满足上述条件。
例如当M=2,N=1时,低频滤波器组分析窗、综合窗长度为高频滤波器组分析窗、综合窗长度的
Figure A0314851500121
倍501,设低频滤波器组分析窗为x(i),i=0,…,L-1,综合窗为y(i),i=0,…,L-1 503;高频滤波器组第一个分析窗为x1(i),i=0,…,L1-1,分析窗为y1(i),i=0,…,L1-1 505;第二个分析窗为x2(i),i=0,…,L1-1,综合窗为y2(i),i=0,…,L1-1 507,并且 L = L 1 × 3 2 . (如图5所示)
要使该多分辨率滤波器组满足完全重构条件,分析窗和综合窗需满足如下条件: z 1 2 ( i + L / 3 ) + z 2 2 ( i ) = 1 - - - ( 13 )
其中,对分析滤波器上述z表示x,对综合滤波器上述z表示y。同时,x和y还需满足上述(10)、(11)式或其他约束条件。
(c)为了实现从等带宽滤波器组和多分辨率滤波器组之间的无失真切换,需要采用过渡滤波器组,过渡滤波器组可以为等带宽余弦调制滤波器组或基于余弦调制的多分辨率滤波器组;过渡滤波器组所采用的窗须根据等带宽滤波器组和多分辨率滤波器组所采用的窗确定,使***满足完全重构条件。
并且,根据余弦调制滤波器的混迭效应性质,要保证过渡滤波器组和相邻滤波器间的混迭消除,保证整个滤波分析和综合***的完全重构性能。过渡滤波器603和其相邻滤波器601和605的关系如图6所示。
(d)当对不同快变信号帧采用不同的分析和综合窗时,则在不同窗信号帧切换时,需要采用基于余弦调制的多分辨率过渡滤波器组,此时过渡滤波器组所采用的窗须根据前后两个滤波器组所采用的窗确定,并且不同分辨率滤波器组的分析窗满足(b)的约束要求,以满足***的完全重构条件。
因此,本发明中的多分辨率滤波结构是建立在余弦调制滤波器组(包括MDCT)技术基础上的,通过使不同分辨率滤波器组的分析和综合窗分析和综合(有时也被称为分析或综合原型滤波器组,这里,原型滤波器组是指用于调制其他滤波器组的基带滤波器组)满足窗口约束来实现。
在设计编/解码器中,可以根据信号的特点,设计多个不同的时间—频率分辨率的余弦调制滤波器组配置,使所获得的多分辨率时频划分能够高效的表示信号,并利用人耳的听觉特性。而这些不同时间分辨率的余弦调制滤波器组的分析和综合滤波器组都需要满足上面的窗口约束条件,以保证该滤波结构的完全重构的性质。
实施例
下面的实施例作为说明本发明的一个具体实现,不限制本发明专利的权利要求的范围,因为,一个技术熟练的研究人员或工程师,可以根据本发明实现一个类似发明创造。
实现平台如图8所示,一个输入音频信号被以44.1kHz采样。采样信号被划分成帧。每帧由1024个样本组成(约23.22ms)。首先根据当前信号的暂态性确定当前信号帧编码块类型801,根据不同的块类型,采用不同的滤波器组805结构。心理声学模型根据所选定的滤波器组配置803,利用人类听觉***的掩蔽现象从输入信号帧中去除感觉不到的内容,同时,确定当前帧编码的预算比特数807。然后,滤波器组执行时间--频率之间的映射805,最后,预处理过的数据被量化809和编码811(量化和编码的方法与所选用的变换配置相对应),索引值和边信息被打包进比特流811。其中滤波器组具体实现和切换方法的实现细节如以下步骤所描述:步骤1.将输入音频数据分解成帧(1024个样本);步骤2.评估当前输入信号帧的暂态性度量: Z = ( Σ j = 1 1024 [ | s j - 1 1024 Σ j = 1 1024 s j | ] 2 + 0.618 ) / Σ j = 1 1024 | s j | 2 + 0.618 步骤3.根据Z值和历史信息确定当前信号帧的滤波器组结构。
根据当前信号类型,该滤波器组采用四种滤波结构,如所示:
平稳块SMOOTH_TYPE,
快变块QUICK_TYPE,
启始块RAISE_TYPE,
结束块STOP_TYPE。其中,快变块采用基于MDCT技术的1152点的多分辨率时--频变换,平稳块采用不同2048点的MDCT变换,启始块采用1024点MDCT和1152点的多分辨率时频变换,结束块采用1024点的MDCT变换。
当信号经过一个从“平稳→快变→平稳”的信号类型转变时,该滤波器组的切换如图9所示,其中两个平稳块901、909,一个快变块905,一个启始块903和一个结束块907。
其中快变帧的滤波结构见图10所示,低频成分采用较高频率分辨率的滤波器组1003,高频成分用较高时间分辨率的滤波器组滤波1005。此时,信号帧的时频划分如图11所示。其中:
1~96系数的时间分辨率为2048/fsSec.,频率分辨率为fs/2048Hz603;
97~1024系数的时间分辨率为256/fsSec.,频率分辨率为fs/256Hz601。
其他结构的时频划分结构滤波结构可以用类似的方式得到。
在编码过程中,需要注意的是,在可选的滤波器组结构确定后,滤波器组实现需要正确处理数据缓冲区,以保证滤波器组切换时数据不发生错位。

Claims (10)

1、一种用于感知音频编码的信号自适应多分辨率滤波器组,其特征在于:所述滤波器组采用余弦调制滤波技术构造多种不同时频划分的滤波结构,并对输入信号进行自适应切换。
2、根据权利要求1所述的信号自适应滤波器组,其特征在于:根据当前信号帧包含不同暂态性度量 Z = ( Σ j = 1 N | s j - 1 N Σ j = 1 N s j | 2 + λ ) / Σ j = 1 N | s j | 2 + λ 特性,自适应切换用于编码的滤波器组结构,
对缓变信号,采用等带宽的余弦调制滤波器组;
对快变信号,采用基于余弦调制的多分辨率时频划分滤波器组;
对过渡信号,采用等带宽的余弦调制滤波器组。
3、根据权利要求2所述的信号自适应滤波器组,其特征在于:基于余弦调制的多分辨率时频划分滤波器组,可以根据 h k ( n ) = p a ( n ) 2 M cos ( π M ( k + 0.5 ) ( n + M + 1 2 ) ) - - - - ( 5 ) f k ( n ) = p s ( n ) 2 M cos ( π M ( k + 0.5 ) ( n + M + 1 2 ) ) - - - - ( 6 )
其中0≤k<M-1,0≤n<2KM-1,K为大于零的整数,构造满足不同性能要求的多分辨率滤波结构。
4、根据权利要求3所述的信号自适应滤波器组,其特征在于:多分辨率滤波结构对分析信号的时--频变换/滤波,可以将时域信号映射到时间和频率分辨率动态可调的时频域信号。
5、根据权利要求2所述的信号自适应滤波器组,其特征在于:满足不同性能要求的多分辨率滤波结构,可以根据当前信号的统计特性、掩蔽特性和/或时频特性,滤波结构的自适应调节。
6、根据权利要求2所述的信号自适应滤波器组,其特征在于:基于余弦调制的多分辨率时频划分滤波器组,在对输入信号变换/滤波时,在不同频率区间,采用不同时频分辨率的余弦调制滤波器组,获得多分辨率的时频划分,并使***满足完全重构,其完全重构条件为: Σ m = 0 2 K - 1 - 2 s p s ( mM + n ) p a ( ( m + 2 s ) M + n ) = δ ( s ) - - - - ( 10 ) Σ m = 0 2 K - 1 - 2 s ( - 1 ) m p s ( mM + n ) p a ( ( m + 2 s ) M + ( M - n - 1 ) ) = 0 - - - - ( 11 )
其中s=0,…,K-1,n=0,…,M-1。
7、根据权利要求2所述的信号自适应滤波器组,其特征在于:等带宽的余弦调制滤波器组的编、解码的结构包括:
用于缓变信号滤波的余弦调制滤波器组;
用于从缓变信号滤波器组向快变信号滤波器组过渡余弦调制滤波器组;
用于从快变信号滤波器组向缓变信号滤波器组过渡余弦调制滤波器组;
用于快变信号滤波的基于余弦调制滤波技术的多分辨率滤波,和/或不同快变信号滤波结构之间切换时的过渡滤波器组;采用过渡滤波器组,目的在于保证滤波器组切换时的完全重构性质。
8、根据权利要求2所述的信号自适应滤波器组,其特征在于:基于余弦调制的多分辨率时频划分滤波器组,利用余弦调制滤波器组技术 h k ( n ) = 2 p a ( n ) cos ( π M ( k + 0.5 ) ( n - D 2 ) + θ k ) - - - - ( 1 )
n=0,1,…,Nh-1 f k ( n ) = 2 p s ( n ) cos ( π M ( k + 0.5 ) ( n - D 2 ) - θ k ) - - - - ( 2 )
n=0,1,…,Nf-1
其中0≤k<M-1,0≤n<2KM-1,K为大于零的整数, θ k = ( - 1 ) k π 4 , 构造一个特定的多分辨率分析结构,满足利用信号统计冗余和人耳听觉的掩蔽特性压缩音频信号的要求。
9、根据权利要求2所述的信号自适应滤波器组,其特征在于:基于余弦调制的多分辨率滤波器组,低频成分利用频率分辨率较高的余弦调制滤波器组,高频成分利用较高的时间分辨率余弦调制滤波器组,使得所获得的变换/滤波系数具有多分辨率的结构特点。
10、根据权利要求9所述的信号自适应滤波器组,其特征在于:不同分辨率的余弦调制滤波器组组成的多分辨率滤波器组技术,不同分辨率余弦调制滤波器组需满足窗口约束,即在特定的编码时间段内,较高时间分辨率的余弦调制滤波器组的分析窗的时序平方和等于较高频率分辨率的余弦调制滤波器组的分析窗的平方,使整个***的自适应滤波结构可以保证完全重构性。
CNA031485154A 2003-07-01 2003-07-01 用于感知音频编码的信号自适应多分辨率滤波器组 Pending CN1471236A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CNA031485154A CN1471236A (zh) 2003-07-01 2003-07-01 用于感知音频编码的信号自适应多分辨率滤波器组

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CNA031485154A CN1471236A (zh) 2003-07-01 2003-07-01 用于感知音频编码的信号自适应多分辨率滤波器组

Publications (1)

Publication Number Publication Date
CN1471236A true CN1471236A (zh) 2004-01-28

Family

ID=34156265

Family Applications (1)

Application Number Title Priority Date Filing Date
CNA031485154A Pending CN1471236A (zh) 2003-07-01 2003-07-01 用于感知音频编码的信号自适应多分辨率滤波器组

Country Status (1)

Country Link
CN (1) CN1471236A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101290774B (zh) * 2007-01-31 2011-09-07 广州广晟数码技术有限公司 音频编码和解码***
CN101930740B (zh) * 2004-11-02 2012-05-30 杜比国际公司 使用解相关信号的多信道音频信号解码
CN101615393B (zh) * 2008-06-25 2013-01-02 汤姆森许可贸易公司 对语音和/或非语音音频输入信号编码或解码的方法和设备
CN112968688A (zh) * 2021-02-10 2021-06-15 西南电子技术研究所(中国电子科技集团公司第十研究所) 通带可选的数字滤波器实现方法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101930740B (zh) * 2004-11-02 2012-05-30 杜比国际公司 使用解相关信号的多信道音频信号解码
CN101290774B (zh) * 2007-01-31 2011-09-07 广州广晟数码技术有限公司 音频编码和解码***
CN101615393B (zh) * 2008-06-25 2013-01-02 汤姆森许可贸易公司 对语音和/或非语音音频输入信号编码或解码的方法和设备
CN112968688A (zh) * 2021-02-10 2021-06-15 西南电子技术研究所(中国电子科技集团公司第十研究所) 通带可选的数字滤波器实现方法

Similar Documents

Publication Publication Date Title
Srinivasan et al. High-quality audio compression using an adaptive wavelet packet decomposition and psychoacoustic modeling
CN1210689C (zh) 子带域中改进的频谱平移/折叠的方法和设备
CN1181467C (zh) 利用自适应噪声本底相加和噪声替换限制,增强信源编码和解码的方法和***
CN101521014B (zh) 音频带宽扩展编解码装置
CN1272911C (zh) 音频信号解码装置及音频信号编码装置
CN1527995A (zh) 编码设备和解码设备
WO2012149843A1 (zh) 音频信号编解码方法和设备
CN1310210C (zh) 使用解码信号的特征适配合成频谱分量的音频编码***
CN102473417A (zh) 频带扩展方法、频带扩展装置、程序、集成电路及音频解码装置
KR100472442B1 (ko) 웨이브렛 패킷 변환을 이용한 오디오 압축 방법 및 그시스템
JP2004206129A (ja) 時間−周波数相関性を利用した改善されたオーディオ符号化及び/または復号化方法とその装置
CN1460992A (zh) 用于感知音频编/解码的低延时、自适应的多分辨率滤波器组
Kumar et al. The optimized wavelet filters for speech compression
He et al. An enhanced psychoacoustic model based on the discrete wavelet packet transform
CN1471236A (zh) 用于感知音频编码的信号自适应多分辨率滤波器组
CN1862969A (zh) 自适应块长、常数变换音频解码方法
CN1388517A (zh) 一种基于伪小波滤波的音频编/解码技术
CN1123865C (zh) 小波音频编码信号处理中块效应消除方法
Manohar et al. Audio compression using daubechie wavelet
Aloui et al. Optimized speech compression algorithm based on wavelets techniques and its real time implementation on DSP
He et al. Psychoacoustic Music Analysis Based on the Discrete Wavelet Packet Transform.
WO2011052221A1 (ja) 符号化装置、復号装置、およびそれらの方法
Gunjal et al. Traditional Psychoacoustic Model and Daubechies Wavelets for Enhanced Speech Coder Performance
CN1127054C (zh) 用于知觉音频编码的信号处理方法
Luo et al. High quality wavelet-packet based audio coder with adaptive quantization

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
PP01 Preservation of patent right

Effective date of registration: 20051209

Pledge (preservation): Preservation

PP01 Preservation of patent right
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Open date: 20040128