CN101193090B - 信号处理方法及其装置 - Google Patents
信号处理方法及其装置 Download PDFInfo
- Publication number
- CN101193090B CN101193090B CN2006101403202A CN200610140320A CN101193090B CN 101193090 B CN101193090 B CN 101193090B CN 2006101403202 A CN2006101403202 A CN 2006101403202A CN 200610140320 A CN200610140320 A CN 200610140320A CN 101193090 B CN101193090 B CN 101193090B
- Authority
- CN
- China
- Prior art keywords
- spectrum
- evolution
- difference
- signal
- spectrum amplitude
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
本发明公开一种信号处理方法及其装置,所述信号处理方法包括:对信号在时域进行线性预测分析,得到预测的残差信号;对所述残差信号的频谱幅度或频谱幅度差异数据进行开方处理;记录所述开方处理用到的参数,并对开方后的频谱幅度或频谱幅度差异数据进行统一处理、常量或矢量量化。本发明可以高效率、较好地对信号进行平坦化。
Description
技术领域
本发明涉及一种信号处理方法及其装置。
背景技术
在信号处理领域,语音、音频信号的处理一般要经过滤波或对时域信号加窗,后进行时频变换,变换到频域进行处理,以便于进行编码或传输。
其中,音频的变换域听觉模型主要考虑两个因素,一个是听觉门限阀值,另一个是频域遮蔽效应,使用听觉门限阀值的目的是使得各个频点的量化误差低于听觉门限阀值,避免被听到,这一点比较容易实现,既可以在频域通过调整各个频点的量化步长来完成,也可以在时域用FIR滤波器加权使得频域听觉门限阀值变平坦,而在频域均匀量化来实现。频域遮蔽效应随着信号频域幅值的波动而变化,只有高过遮蔽曲线的部分才被量化,也就是说量化噪声稍稍低于遮蔽曲线即可,但计算频域各个频率点间的相互遮蔽效应是比较繁琐的事情,具有很高的处理复杂度。
变换域处理过程中,频域系数量化编码如果采用相同的信噪比,则所有量化系数的具有相同的量化有效位数;如果要采用规则的量化处理,首先要解决大问题是变换域系数的分布范围问题,然后才考虑寻找一个有效的量化方法,这是因为对分布比较集中的数据比较容易找到容易的量化方法,如果数据分布范围比较大,也就意味着分布规律复杂并难以简化处理。
如果频域信号有较大的分布范围,频谱的量化、编码有一定难度。如果能有效压缩频域信号的有效范围就可以大大提高后继编码环节的效率。现有技术提出采用频谱平坦化的方法有效压缩频域信号的有效范围,比如在活动图像专家组(MPEG4,Motion Picture Exlperts Group 4)的T/F编码工具中包含了两个标准:一个是高级语音频编码(AAC,Advance Audio Coding),另一个是变换域加权交织矢量量化(TwinVQ,Transform-domain Weighted InterleaveVector Quantization)。其中TwinVQ标准主要是采用平坦化变换系数的方法压缩频域信号,提升低码率音频信号的编码效果。TwinVQ由三个主要技术构成:
1)利用线性预测编码(LPC,Linear Predictive Coding)系数来对改进型离散余弦变换(MDCT)变换系数做平坦化,2)利用帧间向后预测的来对MDCT系数做平坦化,3)加权交织矢量量化。
TwinVQ的MDCT变换系数平坦化包含两个环节,一个是变换域MDCT系数除以LPC的频域系数,得到预测频域残差,另一个环节是计算出各个临界频带的平均功率,作为临界频带包络,各个临界频带中的多个系数除以其平均功率,使其进一步变平坦。图1是TwinVQ的具体处理流程框图,包括步骤:
101、LPC分析:计算输入信号数据的自相关系数,按列文-杜宾算法计算出滤波器系数;
102、LPC系数到(LSP)系数的转换;
103、LSP系数矢量量化;
104、量化LSP系数到LPC系数转化,然后计算出LPC的频域值;
105、对数据帧进行MDCT变换:
106、临界频带比例因子计算;
107、临界频带封包(比例因子)量化;
108、能量归一化。
以上方法是在频域对音频进行平坦化的处理,但存在以下技术问题:(1)在频域用线性预测编码系数来实现频域系数的平坦化,逐帧频域处理,会造成信号特征帧间切换时刻的不连续;(2)用临界频带平均功率做平坦化处理,要计算大量的除法,简单地用临界频带作分组划分的依据,没有考虑利用实际频谱的平坦、差异特征,平坦化效果很难做到很理想。
发明内容
为解决上述技术问题本发明提供一种提高信号平坦化水平同时较为简单的信号处理方法。
本发明还提供一种提高信号平坦化水平同时较为简单的信号处理装置。
一种信号处理方法,包括:对信号在时域进行线性预测分析,得到预测的残差信号;对所述残差信号的频谱幅度或频谱幅度差异数据进行开方处理;记录所述开方处理用到的参数,并对开方后的频谱幅度或频谱幅度差异数据进行统一处理、常量或矢量量化。
一种信号处理装置,包括:线性预测分析单元,对信号在时域进行线性预测分析,得到预测的残差信号;开方处理单元,对所述残差信号的频谱幅度或频谱幅度差异数据进行开方处理;量化单元,记录所述开方处理用到的参数,并对开方后的频谱幅度或频谱幅度差异数据进行统一处理、常量或矢量量化。
上述信号处理方法相对于现有技术在频域进行线性预测分析而导致的计算量大并且数据帧切换时刻的不连续问题,由于采用在时域进行线性预测分析的方式进行信号滤波及其他处理,信号是连续通过,不需先变换到频域而进行的计算;同时,进行线性预测分析相当于提取频域信号的包络特征,并消除其影响,可以对信号初步平坦化;又,采用对残差信号的频谱幅度进行开方处理,通过对频谱差异比值开方处理缩小谱线的差异范围,可以最大程度实现平坦化,又由于在量化过程中保留开方信息,平坦化后的数据可以很容易地恢复出来;同时相对于现有技术用临界频带平均功率做平坦化处理从而要计算大量的除法,本实施方式所有的频谱平坦化处理都在对数域处理,许多复杂的计算得以简化,解决了算法计算复杂度问题,信号处理效率大大提高;开方的处理方法非常利于后续的编码和处理,提高解码品质。
上述信号处理装置由于采用线性预测分析单元对信号在时域进行线性预测分析,因此在预测分析时信号是连续的;同时,进行线性预测分析相当于提取频域信号的包络特征,并消除其影响,可以对信号初步平坦化;由于采用开方处理单元对所述残差信号的频点幅度进行开方处理,通过对频谱差异比值开方处理缩小谱线的差异范围,可以最大程度实现平坦化,又由于在量化过程中保留开方参数,平坦化后的数据可以很容易地恢复出来;许多复杂的计算得以简化,解决了算法计算复杂度问题,信号处理效率大大提高;利于后续的编码和处理,提高解码品质。
附图说明
图1是现有技术信号平坦化方法的流程图;
图2是本发明信号处理方法实施方式的流程图;
图3是图2流程中按低频段、高频段分别进行线性预测得到的频率包络图;
图4是图2流程中对低频段进行线性预测得到的谱包络图;
图5是图2流程中对低频段频谱进行处理得到的参考曲线图;
图6是对图5中参考曲线图进行分组的示意图;
图7是对图6中参考曲线第二分组的平坦化处理效果图;
图8是对图6中参考曲线第二分组的带开方次数的平坦化处理效果图;
图9是本发明信号处理装置实施方式的结构图。
具体实施方式
本发明对信号在时域进行线性预测分析,得到预测的残差信号,并对所述残差信号的频谱幅度或频谱幅度差异数据进行开方处理,平坦化频谱。
其中的时域线性预测相当于提取频域信号的包络特征,并消除其影响,其直观处理效果是经过时域线性预测后信号的频谱形状比处理前平坦多了,如果能做到频域频谱形状完全平坦化,则此时信号的信息量降到最低,信号的所有信息就包含在使信号频谱平坦的过程中,如果能把这些处理过程所含信息提取并表示,则信号就能很好地被编码。基于这种准则,本发明出发点在于使频域信号的平坦化上,通过对频谱差异比值开方处理缩小谱线的差异范围,又保留差异信息,可以很容易地恢复出来。进一步,按信号谱线实际的范围对其进行若干次开方,可以把开方后的谱线值控制在一个较小的范围,只要合理控制开n次方的值的量化精度或者说有效量化位数,就能保证按一定的信噪比恢复原来的信号值。
本发明提供一种信号处理方法基本实施方式,所述信号处理方法包括:
对信号在时域进行线性预测分析,得到预测的残差信号;
对所述残差信号的频谱幅度或频谱幅度差异数据进行开方处理;
记录所述开方处理用到的参数,并对开方后的频谱幅度或频谱幅度差异数据进行统一处理、常量或矢量量化。
以上,相对于现有技术在频域进行线性预测分析而导致的计算量大并且数据帧切换时刻的不连续问题,由于采用在时域进行线性预测分析的方式进行信号滤波及其他处理,信号是连续通过,不需先变换到频域而进行的计算;同时,进行线性预测分析相当于提取频域信号的包络特征,并消除其影响,可以对信号初步平坦化;
又同时,采用对残差信号的频谱幅度进行开方处理,通过对频谱差异比值开方处理缩小谱线的差异范围,可以最大程度实现平坦化,又由于在量化过程中保留开方信息,平坦化后的数据可以很容易地恢复出来;
同时相对于现有技术用临界频带平均功率做平坦化处理从而要计算大量的除法,本实施方式所有的频谱平坦化处理都在对数域处理,许多复杂的计算得以简化,解决了算法计算复杂度问题,信号处理效率大大提高;
开方的处理方法非常利于后续的编码和处理,提高解码品质。
本发明还提供一种信号处理装置基本实施方式,所述信号处理装置包括:线性预测分析单元,对信号在时域进行线性预测分析,得到预测的残差信号;开方处理单元,对所述残差信号的频谱幅度或频谱幅度差异数据进行开方处理;量化单元,记录所述开方处理用到的参数,并对开方后的频谱幅度或频谱幅度差异数据进行统一处理、常量或矢量量化。
由于采用线性预测分析单元对信号在时域进行线性预测分析,因此在预测分析时信号是连续的;同时,进行线性预测分析相当于提取频域信号的包络特征,并消除其影响,可以对信号初步平坦化;由于采用开方处理单元对所述残差信号的频点幅度进行开方处理,通过对频谱差异比值开方处理缩小谱线的差异范围,可以最大程度实现平坦化,又由于在量化过程中保留开方参数,平坦化后的数据可以很容易地恢复出来;许多复杂的计算得以简化,解决了算法计算复杂度问题,信号处理效率大大提高;利于后续的编码和处理,提高解码品质。
以下结合实施方式和附图,对本发明进行详细描述。
本发明信号处理方法具体实施方式由两部分组成:一部分是线性预测分析,先对信号在时域进行LPC分析,得到预测残差信号;另一部分,也就是后续步骤对残差信号的频谱幅度或频谱幅度差异数据进行自适应开n次方处理,对开方后的频谱幅度数或频谱幅度差异数据据进行统一处理、规则的常量或矢量量化。具体步骤如下:
步骤201、每256、512或1024点样点数据为一帧,逐帧进行处理;
对输入的音频信号取样,取样方式可以是每256、512或1024点样点数据为一帧,形成多个数据帧,逐帧进行处理。
步骤202、首先对每帧数据进行时域线性预测分析,得到线性预测传递函数H(Z),用H(Z)对每帧数据进行分析滤波,得到预测残差信号e(n);
这里是对每帧数据进行得到线性预测分析得到传递函数,使用该函数对每帧数据进行分析滤波,得到预测残差信号。
步骤203、对预测残差信号e(n)做快速傅立叶变换(FFT)变换,计算所有频点的幅值A(n);
步骤204、对所有残差信号的频点的幅值A(n)求对数,得到预测残差信号频谱包络的对数表示Alg(n);
这里,可以先按低频段、高频段分别进行线性预测得到频率包络图。参阅图2,可以看出频谱包络逼近效果在低频段Fs/4附近明显比较差。
对用高通、低通滤波器分离后的低频、高频信号分别做预测分析滤波。以低频段为例进行介绍,图3显示了对低频段的一帧进行分析滤波的效果。
步骤205、求出包括所有频点幅值的整个频谱的参考曲线;
对低频段频谱进行预处理:首先统计出频谱的所有峰值点,并找出其中的最大值及其位置,最大值的位置作为进行对数域线性补偿的起始点,起始点之前以此最大值为水平参考线,从起始点到低频截止点的所有峰值点计算出其衰减斜线,所有频谱位于此斜线之下,衰减斜线尽可能接近频谱峰值点,水平参考线和衰减斜线组成低频段频谱的参考线,效果可参阅图4。
步骤206、频谱分组划分,对每个分组进行以下的处理;
频谱分组目的是把平坦度相似的频谱组合在一起,用相同或相近的参数进行平坦化处理。频谱分组方法可遵循不同的原则实现不同的划分方式,下面给出两种分组方式:1、频谱的分组划分考虑以2的幂次方个相邻系数为一组,并从左到右进行,每个组的大小单独确定;2、以局部峰值频谱为中心进行分组,相邻两个分组以中间峰谷频谱进行划分。确定组大小主要考虑两个因素,一个是幅度相对平坦的相邻谱系数的宽度,一般平坦面越宽则分布在本区域的分组就越大,另一个因素是码率的限制,整帧编码位数越少则分组尺寸越大。图5是一个分组示意图。
这里进一步提供最佳分组的优化方法:(1)首先按最小分组尺寸划分出所有分组;(2)计算出所有相邻分组的联合均方差值;(3)找出最小的联合均方差值,如果这两个分组的尺寸之和小于最大分组尺寸,则合并这两个分组,否则查找次小的联合均方差值是否符合合并的尺寸限制条件,如果没有任何相邻分组符合合并调件,则结束分组合并处理,如果有分组合并处理,则转到第二步重新开始下一轮分组合并;(4)考虑编码速率限制,根据经验门限值合并较小的分组到相邻分组。
步骤207、找出分组内最大谱值MaxAlg,计算出所有频谱与最大值处参考线值RefAlg或频谱与最大谱值MaxAlg之间的差值DiffAlg,根据最大值与参考线的距离对差值进行调整;
对每个分组都要进行频谱平坦化处理,下面以分组2为例介绍平坦化处理过程:(1)找出分组中最大频谱值,编码最大频谱值与参考线的差值;(2)计算出所有频谱与最大频谱处参考值的对数域(可以采用以2为底的对数计算)差值;(3)最大频谱幅值与参考线的对数域差值如果小于,则计算出调整到此值需要的偏移值,把此偏移值加到计算出的组中频谱系数与最大值处参考线的差值上。
步骤208、把DiffAlg(n)表示成浮点形式DiffAlg(n)=a(n)*(2^m(n)),a(n)是尾数,最佳取值的范围是0.35355339~0.5,m(n)是幂指数,取值范围是0~6;
把调整后的分组频谱的对数域差值表示为浮点数形式a(n)*(2^m(n)),a(n)是尾数,最佳取值的范围是0.35355339~0.5,m(n)是幂指数,取值范围是0~6,2^m(n)是开方的次数,m(n)是整数或小数,a(n)从对数域变换成实际值后是开方结果,此处和后面的符号n代表被处理频谱数据在当前帧的顺序号。令Sqrt_factor(n)=2^m(n)是对频谱幅值开方的次数,对组内所有频谱分别做开方处理,处理后的频谱幅度波动范围明显变小,与参考线的距离更接近了,对比效果可以参见下面一幅图。通过此处理可以明显使组内频谱平坦化,使数据分布范围控制在较小的范围,便于后续量化、编码环节的处理。
预测残差 | 预测残差(db) | 尾数 | 指数 | 尾数量化 | 开方次数 | 开方结果 |
32.837418 | 5.037269 | 0.314829 | 4 | 0.312500 | 16 | 1.241858 |
45.882641 | 5.519877 | 0.344992 | 4 | 0.343750 | 16 | 1.2691 |
24.634417 | 4.622603 | 0.288913 | 4 | 0.281250 | 16 | 1.15869 |
45.028618 | 5.492770 | 0.343298 | 4 | 0.343750 | 16 | 1.2691 |
47.592545 | 5.572664 | 0.348291 | 4 | 0.343750 | 16 | 1.269051 |
表一:部分频谱幅值的平坦化处理结果
为了频谱更加平坦,对组内的频谱处理时可以自适应地选择开方次数,但开方次数参数必须保留并编码,为了对开方次数编码率进行限制,可以把限制在0~4的范围(其对应的频谱幅度间差异已经高达50倍以上),精度可以放宽到0.5或更小的精度。频谱实际开方次次数的变化曲线如下面图所示,黑色折线表示的数据是m(n)。在低码率情况下,可能要限制对指数的编码比特数,可以考虑一个分组内的开方次数限制在一个或某几个值,那么也会相应地扩大尾数的范围。
步骤209、最后对尾数和指数部分以及相关参数分别进行量化。
有多种方法,可以是标准的矢量量化,也可以用算术编码方式进行处理。一种编码过程的步骤如下:(1)对m(n)做相邻值的差值计算,得到差分序列m’(n),m(0)不做相邻数据差分计算,而做前后帧的差分计算,对差分序列做若干维的矢量量化;(2)对尾数按二进制表示的小数点后第三位到第五位组成一个3位有效位数的b4(n),第6位到第7位组成一个2位有效位数的b2(n),对b4(n)和b2(n)做与m(n)一样的差值计算,得到b4’(n)和b2’(n),然后再同样做若干维(待分析确定)的矢量量化,在b4(n)满足信噪比精度的情况下,可以不使用b4(n)。
以上,相对于现有技术在频域进行线性预测分析而导致的计算量大并且数据帧切换时刻的不连续问题,由于在步骤202中采用在时域进行线性预测分析的方式进行信号滤波及其他处理,信号是连续通过,不需先变换到频域而进行的计算;同时,进行线性预测分析相当于提取频域信号的包络特征,并消除其影响,可以对信号初步平坦化;
又同时,在进行步骤204中采用对残差信号的频点幅度形成对数表示-也即进行开方处理,通过对频谱差异比值开方处理缩小谱线的差异范围,可以最大程度实现平坦化,又由于在量化过程中保留开方信息,平坦化后的数据可以很容易地恢复出来;
同时相对于现有技术用临界频带平均功率做平坦化处理从而要计算大量的除法,本实施方式所有的频谱平坦化处理都在对数处理,许多复杂的计算得以简化,解决了算法计算复杂度问题,信号处理效率大大提高;
由于在步骤207中计算频谱与最大值处参考线的差值,并且在步骤208中表示成浮点形式,非常利于后续的编码和处理,提高解码品质。
另外,这里提供量化编码比特数的控制方法:
控制量化编码的比特数是为适应调整编码速率的控制要求,适应不同传输通道的性能变化需求。在本实施方式中要实现控制量化编码比特数,可以从几个环节入手,一个是调节频谱分组大小,另一个是控制尾数部分量化精度和编码位数。
频谱分组大小对编码位数的影响过程如下:对当分组较大时,组内各个频谱间的差异比较大,以分组中的最大频谱为参考,则幅度较小的谱线要达到一样的平坦化程度,则需要较大的开方次数,在限制码率的情况下可以考虑限制最高开方次数,实际需要开方次数大于某一门限值时统一限制为门限值,对这些谱线(对数域表示)的指数形式表示的尾数部分也可以不编码,解码时用一个小于门限的随机值代替,这样一来就可以降低总体编码位数;如果把分组向较小的方向调节,则编码位数会增加。
尾数部分已经限制在一个较小的固定范围,比如0.35355339~0.5,在此区间内大致成均匀分布,控制在此区间内的量化层级就可以直接控制解码频谱的误差精度,同时也可以调整编码位数。如果把指数部分限制在有限的几个值中选取,则尾数部分的分布范围可能比较大一些,分布规律也会从均匀分布向正态分布变化,那么对应的后续量化、编码处理也要做相应改变,
同时考虑调整频谱分组大小和尾数部分的量化位数,就可以实现对编码速率的灵活控制。调整整频谱分组大小使得一些谱线的尾数部分完全不被编码,可以认为是粗调;控制尾数部分的量化层级和量化误差,是较为细致的控制,可以认为是细调。
为量化而记录的开方处理用到的参数,如开方次数或分组模式,需要进行编码。对频谱分组模式的编码:(1)频谱分组大小共有4、8、16、32四种情况,用两位进行编码或标示;(2)几种编码模式可以任意组合,也就是说一个分组可以与任何模式的分组相邻;(3)任一个分组对应频谱的起始位置由所有频率低于它的分组决定,也就是说从低频开始所有分组的尺寸相加即是当前分组的频谱起始位置。
参阅图9,是本发明信号处理装置具体实施方式的结构图。所述信号处理装置包括取样单元910、线性预测分析单元920、开方处理单元930以及量化单元940。
所述取样单元910对信号取样形成多个数据帧,并输入到线性预测分析单元920。所述线性预测分析单元920对信号在时域进行线性预测分析,得到预测的残差信号。所述开方处理单元930对所述残差信号的频谱幅度或频谱幅度差异数据进行开方处理,包括求对数单元931和开方单元932。所述求对数单元931对所有残差信号的频谱幅值或频谱幅度差异数据求对数,得到预测残差信号频谱包络的对数表示。所述开方单元932用于求出所有频点幅值的参考曲线,并计算出所有频点与对应频点幅值最大值处参考曲线值之间的差值,进行开方处理,或者计算出所有频谱与频谱幅值最大值的差值并进行开方处理。所述开方单元932中包括分组单元9321。
所述分组单元9321用于进行频谱自适应分组划分处理,即:以2的幂次方个相邻系数为一组,并从左到右进行,每个组的大小单独确定;或以局部峰值频谱为中心进行分组,相邻两个分组以中间峰谷频谱进行划分。
所述量化单元940记录所述开方处理用到的参数,并对开方后的幅度数据进行统一处理、常量或矢量量化。具体是把所述对数域差值表示为浮点数形式a(n)*(2^m(n)),其中a(n)是尾数,m(n)是幂指数。其中,包括差值计算单元941以及尾数处理单元942。差值计算单元941用于对m(n)做相邻值的差值计算,得到差分序列m’(n),其中m(0)只做前后帧的差分计算;对差分序列m’(n)做若干维的矢量量化;对b4(n)和b2(n)做与m(n)一样的差值计算,得到b4’(n)和b2’(n),然后再同样做若干维的矢量量化,在b4(n)满足信噪比精度的情况下,不使用b4(n)。所述尾数处理单元942用于对尾数按二进制表示的小数点后第三位到第五位组成一个3位有效位数的b4(n),第6位到第7位组成一个2位有效位数的b2(n)。
以处理音频信号为例,运作时,取样单元910每256、512或1024点取样数据为一帧,逐帧进行处理。线性预测单元则对输入的数据帧进行时域线性预测分析,得到线性预测传递函数H(Z),用H(Z)对每帧数据进行分析滤波,得到预测残差信号e(n)。开方处理单元930对预测残差信号e(n)做FFT变换,计算所有频点的幅值A(n)。然后用求对数单元931对所有频点的幅值A(n)求对数,得到预测残差信号频谱包络的对数表示Alg(n);开方单元932求出整个频谱的参考曲线,后采用分组单元9321对频谱分组。分组后的每组数据输入到量化单元940。开方单元932找出分组内最大谱值MaxAlg,计算出所有频谱与最大值处参考线值RefAlg或最大谱值MaxAlg之间的差值DiffAlg,根据最大值与参考线的距离对差值进行调整。量化单元940中的差值计算单元941,对m(n)做相邻值的差值计算,得到差分序列m’(n),其中m(0)只做前后帧的差分计算;对差分序列m’(n)做若干维的矢量量化;对b4(n)和b2(n)做与m(n)一样的差值计算,得到b4’(n)和b2’(n),然后再同样做若干维的矢量量化,在b4(n)满足信噪比精度的情况下,不使用b4(n);最后采用尾数处理单元942把DiffAlg(n)表示成浮点形式DiffAlg(n)=a(n)*(2^m(n)),a(n)是尾数,最佳取值的范围是0.35355339~0.5,m(n)是幂指数,取值范围是0~6。
以上,由于采用线性预测分析单元920对信号在时域进行线性预测分析,因此在预测分析时信号是连续的;同时,进行线性预测分析相当于提取频域信号的包络特征,并消除其影响,可以对信号初步平坦化;由于采用开方处理单元930对所述残差信号的频点幅度进行开方处理,通过对频谱差异比值开方处理缩小谱线的差异范围,可以最大程度实现平坦化,又由于在量化过程中保留开方信息,平坦化后的数据可以很容易地恢复出来;许多复杂的计算得以简化,解决了算法计算复杂度问题,信号处理效率大大提高;利于后续的编码和处理,提高解码品质。
以上对本发明所提供的一种信号处理方法及其装置进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。
Claims (19)
1.一种信号处理方法,其特征在于,包括:
对信号在时域进行线性预测分析,得到预测的残差信号;
对所述残差信号的频谱幅度或频谱幅度差异数据进行开方处理;
记录所述开方处理用到的参数,并对开方后的频谱幅度或频谱幅度差异数据进行矢量量化。
2.根据权利要求1所述的信号处理方法,其特征在于,所述对信号在时域进行线性预测分析之前包括:对信号取样,形成多个数据帧。
3.根据权利要求2所述的信号处理方法,其特征在于,所述进行线性预测分析得到预测残差信号是指:对每帧数据进行线性预测分析得到传递函数,使用该函数对信号进行时域分析滤波,得到预测残差信号。
4.根据权利要求1所述的信号处理方法,其特征在于,所述残差信号的频谱幅度采用快速傅立叶变换得到。
5.根据权利要求1所述的信号处理方法,其特征在于,所述对残差信号的频谱幅度或频谱幅度差异数据进行开方处理包括:
对残差信号的频谱幅度或频谱幅度差异数据求对数,得到预测残差信号频谱包络的对数表示;
求出频谱幅度的参考曲线;
计算出所有频谱幅度与对应频谱幅度最大值处参考曲线值之间的差值并进行开方处理,或者计算出所有频谱幅度与频谱幅度最大值的差值并进行开方处理。
6.根据权利要求5所述的信号处理方法,其特征在于,还进一步包括:在最大频谱幅度与参考曲线的对数域差值小于设定值情况下,计算出调整到此设定值需要的偏移值,把此偏移值加到计算出的频谱幅度与所述对应频谱幅度最大值处参考曲线值的差值上。
8.根据权利要求5所述的信号处理方法,其特征在于,还进一步包括:把所述差值表示为浮点数形式a(n)*(2^m(n)),其中a(n)是尾数,m(n)是幂指数,2^m(n)是开方的次数,m(n)是整数或小数,a(n)从对数域变换成实际值后是开方结果,n代表被处理频谱数据在当前帧的顺序号。
9.根据权利要求8所述的信号处理方法,其特征在于,所述对开方后的频谱幅度或频谱幅度差异数据进行矢量量化包括:
对m(n)做相邻值的差值计算,得到差分序列m’(n),m(0)不做相邻值的差值计算,而做前后帧的差分计算;对差分序列做若干维的矢量量化;
对尾数按二进制表示的小数点后第三位到第五位组成一个3位有效位数的b4(n),第6位到第7位组成一个2位有效位数的b2(n),对b4(n)和b2(n)做与m(n)一样的差值计算,得到b4’(n)和b2’(n),然后再同样做若干维的矢量量化,在b4(n)满足信噪比精度的情况下,不使用b2(n)。
10.根据权利要求8所述的信号处理方法,其特征在于,所述尾数取值的范围是0.35355339~0.5,所述幂指数取值范围是0~6。
11.根据权利要求5所述的信号处理方法,其特征在于,所述求出频谱幅度的参考曲线包括:
统计出频谱的所有峰值点,并找出其中的最大值及其位置,以最大值的位置作为进行对数域线性补偿的起始点,起始点之前以此最大值为水平参考线,从起始点到低频截止点的所有峰值点计算出其衰减斜线,所有频谱位于此斜线之下,衰减斜线尽可能接近频谱峰值点,水平参考线和衰减斜线组成所述频谱幅度的参考曲线。
12.根据权利要求5所述的信号处理方法,其特征在于,在计算出各频谱与频谱幅度最大值处参考曲线值之间的差值或各频谱与频谱幅度最大值的差值之前,包括:进行频谱自适应分组划分处理,即:
以若干个相邻系数为一组,并从左到右进行,每个组的大小单独确定,每个组包含的相邻系数的个数为2的幂次方;或以局部峰值频谱为中心进行分组,相邻两个分组以中间峰谷频谱进行划分;并且,所述组的大小考虑两个因素,一个是幅度相对平坦的相邻系数的宽度,一般平坦面越宽则分布在本区域的分组就越大,另一个因素是编码速率的限制,整帧编码位数越少则分组尺寸越大。
13.根据权利要求12所述的信号处理方法,其特征在于,所述自适应分组划分处理包括:
按最小分组尺寸划分出所有分组;
计算出所有相邻分组的联合均方差值;
找出最小的联合均方差值,如果这两个分组的尺寸之和小于最大分组尺寸,则合并这两个分组,否则查找次小的联合均方差值是否符合合并的尺寸限制条件,如果没有任何相邻分组符合合并条件,则结束分组合并处理,如果有分组合并处理,则转到步骤“计算出所有相邻分组的联合均方差值”重新开始下一轮分组合并;
根据编码速率限制和经验门限值合并较小的分组到相邻分组;
在进行分组后,计算出分组内全部频谱与该分组频谱幅度最大值处参考曲线值之间的差值或分组内全部频谱与该分组内频谱幅度最大值的差值。
14.根据权利要求1所述的信号处理方法,其特征在于,所述开方处理用到的参数是指开方的次数。
15.一种信号处理装置,其特征在于,包括:
线性预测分析单元,对信号在时域进行线性预测分析,得到预测的残差信号;
开方处理单元,用于对所述残差信号的频谱幅度或频谱幅度差异数据进行开方处理;
量化单元,用于记录所述开方处理用到的参数,并对开方后的频谱幅度或频谱幅度差异数据进行矢量量化。
16.根据权利要求15所述的信号处理装置,其特征在于,进一步包括取样单元,对信号取样形成多个数据帧,并输入到线性预测分析单元。
17.根据权利要求15所述的信号处理装置,其特征在于,所述开方处理单元包括:
求对数单元,用于对所有残差信号的频谱幅度求对数,得到预测残差信号频谱包络的对数表示;
开方单元,用于求出所有频谱幅度的参考曲线,并计算出所有频谱幅度与对应分组中频谱幅度最大值处参考曲线值之间的差值并进行开方处理,或者计算出所有频谱幅度与频谱幅度最大值的差值并进行开方处理。
18.根据权利要求17所述的信号处理装置,其特征在于,所述开方单元包括分组单元,用于进行频谱自适应分组划分处理,即:以2的幂次方个相邻系数为一组,并从左到右进行,每个组的大小单独确定;或以局部峰值频谱为中心进行分组,相邻两个分组以中间峰谷频谱进行划分。
19.根据权利要求17所述的信号处理装置,其特征在于,所述量化单元进一步用于把所述差值表示为浮点数形式a(n)*(2^m(n)),其中a(n)是尾数,m(n)是幂指数,2^m(n)是开方的次数,m(n)是整数或小数,a(n)从对数域变换成实际值后是开方结果,n代表被处理频谱数据在当前帧的顺序号,并包括:
尾数处理单元,用于对尾数按二进制表示的小数点后第三位到第五位组成一个3位有效位数的b4(n),第6位到第7位组成一个2位有效位数的b2(n);
差值计算单元,用于对m(n)做相邻值的差值计算,得到差分序列m’(n),其中m(0)只做前后帧的差分计算;对差分序列m’(n)做若干维的矢量量化;对b4(n)和b2(n)做与m(n)一样的差值计算,得到b4’(n)和b2’(n),然后再同样做若干维的矢量量化,在b4(n)满足信噪比精度的情况下,不使用b2(n)。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2006101403202A CN101193090B (zh) | 2006-11-27 | 2006-11-27 | 信号处理方法及其装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2006101403202A CN101193090B (zh) | 2006-11-27 | 2006-11-27 | 信号处理方法及其装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101193090A CN101193090A (zh) | 2008-06-04 |
CN101193090B true CN101193090B (zh) | 2011-12-28 |
Family
ID=39487843
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2006101403202A Expired - Fee Related CN101193090B (zh) | 2006-11-27 | 2006-11-27 | 信号处理方法及其装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN101193090B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105988972A (zh) * | 2015-02-03 | 2016-10-05 | 澜起科技(上海)有限公司 | 快速傅里叶变换的方法和电路 |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010258739A (ja) * | 2009-04-24 | 2010-11-11 | Sony Corp | 画像処理装置および方法、並びにプログラム |
WO2014009775A1 (en) * | 2012-07-12 | 2014-01-16 | Nokia Corporation | Vector quantization |
CN104978970B (zh) | 2014-04-08 | 2019-02-12 | 华为技术有限公司 | 一种噪声信号的处理和生成方法、编解码器和编解码*** |
CN106034274A (zh) * | 2015-03-13 | 2016-10-19 | 深圳市艾思脉电子股份有限公司 | 基于声场波合成的3d音响装置及其合成方法 |
CN110992739B (zh) * | 2019-12-26 | 2021-06-01 | 上海松鼠课堂人工智能科技有限公司 | 学生在线听写*** |
CN114025085B (zh) * | 2021-10-29 | 2022-12-13 | 浙江大华技术股份有限公司 | 一种摄像设备工作模式切换方法、装置、设备及存储介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4122432A (en) * | 1971-03-30 | 1978-10-24 | Fried. Krupp Gesellschaft Mit Beschrankter Haftung Atlas Elektronik Bremen | Device for identifying noise sources |
CN1397929A (zh) * | 2002-07-12 | 2003-02-19 | 清华大学 | 抗噪声语音识别用语音增强-特征加权-对数谱相加方法 |
CN1459962A (zh) * | 2002-05-23 | 2003-12-03 | 华为技术有限公司 | 离散多音***中时域均衡训练的快速时延优化方法 |
-
2006
- 2006-11-27 CN CN2006101403202A patent/CN101193090B/zh not_active Expired - Fee Related
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4122432A (en) * | 1971-03-30 | 1978-10-24 | Fried. Krupp Gesellschaft Mit Beschrankter Haftung Atlas Elektronik Bremen | Device for identifying noise sources |
CN1459962A (zh) * | 2002-05-23 | 2003-12-03 | 华为技术有限公司 | 离散多音***中时域均衡训练的快速时延优化方法 |
CN1397929A (zh) * | 2002-07-12 | 2003-02-19 | 清华大学 | 抗噪声语音识别用语音增强-特征加权-对数谱相加方法 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105988972A (zh) * | 2015-02-03 | 2016-10-05 | 澜起科技(上海)有限公司 | 快速傅里叶变换的方法和电路 |
CN105988972B (zh) * | 2015-02-03 | 2018-12-07 | 上海澜至半导体有限公司 | 实现快速傅里叶变换/快速傅里叶逆变换的方法和电路 |
Also Published As
Publication number | Publication date |
---|---|
CN101193090A (zh) | 2008-06-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101193090B (zh) | 信号处理方法及其装置 | |
JP7158452B2 (ja) | Hoa信号の係数領域表現からこのhoa信号の混合した空間/係数領域表現を生成する方法および装置 | |
EP2267698B1 (en) | Entropy coding by adapting coding between level and run-length/level modes. | |
CN101283407B (zh) | 变换编码装置和变换编码方法 | |
CN1866355B (zh) | 声音编码装置、声音编码方法、声音解码装置和声音解码方法 | |
US8447597B2 (en) | Audio encoding device, audio decoding device, audio encoding method, and audio decoding method | |
RU2464649C1 (ru) | Способ обработки звукового сигнала | |
KR101995694B1 (ko) | 허프만 부호화를 실행하기 위한 장치 및 방법 | |
CN1787383B (zh) | 变换、编码、逆变换和解码音频信号的方法和设备 | |
CN100459436C (zh) | 一种音频编码中比特分配的方法 | |
CN101494054B (zh) | 一种音频码率控制方法及*** | |
CN101308655B (zh) | 一种音频编解码方法与装置 | |
CN102947881A (zh) | 解码装置、编码装置和解码方法、编码方法 | |
CN105144288A (zh) | 高级量化器 | |
JP6411509B2 (ja) | 符号化方法、装置、プログラム及び記録媒体 | |
CN105957533B (zh) | 语音压缩方法、语音解压方法及音频编码器、音频解码器 | |
EP2842126B1 (en) | Audio encoding and decoding with conditional quantizers | |
JP4062971B2 (ja) | オーディオ信号符号化方法 | |
CN101308657B (zh) | 一种基于先进音频编码器的码流合成方法 | |
CN105122358A (zh) | 用于处理编码信号的装置和方法与用于产生编码信号的编码器和方法 | |
WO2006056100A1 (fr) | Procede et dispositif de codage/decodage utilisant la redondance des signaux intra-canal | |
KR100640833B1 (ko) | 디지털 오디오의 부호화 방법 | |
Wang et al. | A new bit-allocation algorithm for AAC encoder based on linear prediction |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20111228 Termination date: 20161127 |
|
CF01 | Termination of patent right due to non-payment of annual fee |