CN101436407B

CN101436407B - 音频编解码方法

Info

Publication number: CN101436407B
Application number: CN200810232760XA
Authority: CN
Inventors: 马鸿飞; 郭小川; 熊静; 徐雅俊; 吴礼仲
Original assignee: Xidian University
Current assignee: Xidian University
Priority date: 2008-12-22
Filing date: 2008-12-22
Publication date: 2011-08-24
Anticipated expiration: 2028-12-22
Also published as: CN101436407A

Abstract

本发明公开了一种音频编解码方法，主要解决目前音频编码方法压缩比低、重构音频质量差的问题。采用时频变换与频域滤波方法或时域滤波与时频变换方法，分析音频信号，得到频域残差信号；将频域残差信号分割成低频和高频残差信号，分别对低频残差信号进行直接编码和对高频残差进行参数编码；然后用解码低频残差信号和解码高频残差重构高频残差信号；再将解码低频残差信号与重构高频残差信号重组得到重构频域残差信号；最后采用频域逆滤波与时频反变换的方法或时频反变换与时域逆滤波的方法，得到重构音频信号。本发明消除了频域残差信号中的多余度，提高了音频编码的压缩比、信道利用率和音频传输质量，用于多媒体通信和消费类电子设备。

Description

音频编解码方法

技术领域

本发明涉及音频编解码技术领域，具体涉及一种基于高频残差重构的信号重构方法，用于多媒体通信和消费类电子领域。

背景技术

在多媒体通信领域，包括语音在内的音频、尤其是宽带音频已逐渐成为主要通信业务之一。但是音频信号频带较宽、编码数据量较大，这给音频信号的实时传输和有效存储带来很大的困难。虽然MP3、AAC、EAAC和EAAC+等音频编码算法已经能够较好地音频信号进行压缩编码，满足了一定应用的要求，但还无法较好地胜任目前正在发展的移动多媒体通信和各种移动平台等业务。所以有必要研究效率更高和质量更好的音频编码算法。近年来，在音频压缩编码的研究领域，音频信号高频成分的处理、压缩和重构成为相关研究的关键技术之一，如何利用低频频段的信号来重建高频信号是重要的研究内容。

现有技术利用频域低频进行频域高频重建的方法主要有两种，简单介绍如下：

现有技术1

把音频或语音的低频信号通过一个数字滤波组处理，得到一组低频子带信号；再把该组低频子带作为一个整块信号来进行高频信号的复制。整个高频频段信号的复制方法是将高频信号按照频率由低到高划分成若干频段，每段与上述整块低频信号的带宽大致相同；然后将整块低频子带组连续复制到高频频段的每一段。这样，整块低频子带组会被周期性地在高频频段使用若干次，直到整个需要恢复的高频频段都被复制完成为止。具体方式有两种：一是把整块低频子带组平移到对应的高频频段，二是把整块低频子带组先折叠，即颠倒了子带排列顺序，再把整块低频子带组平移到对应的高频频段；在复制过程中，这两种方式可能会交叉使用。这样，整块低频子带组会被周期性地使用，直到整个需要恢复的高频频段都被复制完成为止。

现有技术2

把低频信号通过低通滤波器组处理，得到一组低频子带信号。这里不再像现有技术1那样，把选取的低频子带组作为一个整体，整段地连续复制需要恢复的高频部分，而是利用低频子带组中的子带，分别对应地恢复一些离散分布的高频子带。如果在高频部分有非常丰富的谐波分量，则其谐波分量的频率可能就是其相应基频的整数倍。在此思想的指导下，现有技术2提出，如果高频部分某些子带的子带序号是2、3、4、5等自然数的整数倍，即某些高频子带和低频子带之间存在倍数的对应关系，这些子带很可能存在丰富的谐波成分，需要重点恢复。这样，用连续的低频子带组恢复离散分布的高频子带的过程就完成了。最后，对于该方法遗漏的高频子带，还要选取波形与之相近的低频子带，对遗漏的高频子带进行恢复，从而完成所有高频子带的复制。

上述两种现有技术中无论按现有技术1把低频子带作为一个整块进行周期性地平移复制或折叠复制，还是按现有技术2进行倍频复制，都是机械性地恢复谐波，没有考虑音频语音信号的多样性和变化性，另外复制时候是按照子带序号依次提取复制，由于低频子带和高频子带的波形本来就不同，所以被复制的高频子带和原始的高频子带相比，将存在较大波形差别或峰值差异，因此重建的高频信号准确性不是太高，影响重构音频信号的质量。

发明内容

本发明的目的之一是提供一种基于频域滤波和高频残差重构的音频编解码方法，目的之二是提供一种基于时域滤波和高频残差重构的音频编解码方法，以避免上述已有技术的不足，提高重建高频残差信号的准确性和音频编解码的压缩比，保证重构音频信号质量。

本发明的技术方案是这样实现的：

技术方案一：

基于频域滤波和高频残差重构的音频编解码方法，包括如下步骤：

1)在编码端，音频原始时域信号经过时频变换处理，得到原始频域信号；

2)原始频域信号经过频域感知滤波处理，得到原始频域残差信号；

3)原始频域残差信号经过频域残差分析和编码处理，得到低频残差信号编码和高频残差参数编码，并输出到传输信道或存储介质。

4)在解码端，接收来自输出到传输信道或存储介质的低频残差信号编码和高频残差参数编码，并对其进行频域残差解码和重构处理，得到重构频域残差信号；

5)重构频域残差信号经过频域感知逆滤波处理，得到重构频域信号；

6)对重构频域信号进行时频反变换处理，得到音频重构时域信号。

技术方案二：

基于时域滤波和高频残差重构的音频编解码方法，包括如下步骤：

T1)在编码端，音频原始时域信号经过时域感知滤波处理，得到原始时域残差信号；

T2)原始时域残差信号经过时频变换处理，得到原始频域残差信号；

T3)原始频域残差信号经过频域残差分析和编码处理，得到低频残差信号编码和高频残差参数编码，并输出到传输信道或存储介质。

T4)在解码端，接收来自输出到传输信道或存储介质的低频残差信号编码和高频残差参数编码，并对其进行频域残差解码和重构处理，得到重构频域残差信号；

T5)对重构频域残差信号进行时频逆变换处理，得到重构时域残差信号；

T6)将重构时域残差信号进行时域逆滤波处理，得到音频重构时域信号。

上述两种方案的音频编解码方法，其中所述的频域残差分析和编码处理，包括如下步骤：

(A1)按照等带宽频带、或临界频带、或频程频带频的带划分方法，先对原始频域残差信号进行频带划分，然后根据音频编码器设定的编码速率选择一个频带划分端点，将原始频域残差信号分割成原始低频残差信号和原始高频残差信号两部分，使这两部分各具有若干个频带；

(A2)对原始低频残差信号进行编码，得到低频残差信号编码输出；再对低频残差信号编码在编码端进行本地解码，得到解码低频残差信号；

(A3)根据解码低频残差信号与原始高频残差信号的相似性或相关性，对高频残差参数进行分析，即选择一个频带匹配策略对解码低频残差信号和原始高频残差信号进行频带匹配，并计算最佳匹配的高频残差参数，得到包括频带划分方法、最佳匹配频带频率位置、能量匹配因子、声道耦合参数和帧间扩展参数在内的原始高频残差参数；

(A4)对原始高频残差参数进行编码，得到高频残差参数编码输出。

上述两种方案的音频编解码方法，其中所述的频域残差解码和重构处理，包括如下步骤：

(C1)对接收到的低频残差信号编码进行解码，得到解码低频残差信号；

(C2)对接收到的高频残差参数编码进行解码，得到解码高频残差参数；

(C3)利用解码低频残差信号、解码高频残差参数中的最佳匹配频带频率位置和能量匹配因子，重构高频残差信号频带R_H(q₀，l)；

(C4)利用解码高频残差参数中的频带划分方法、声道耦合参数和帧间扩展参数，将得到的重构高频残差信号频带进行组合，得到重构高频残差信号；

(C5)利用解码高频残差参数中的频域残差高低频段分界频率，将解码低频残差信号与重构高频残差信号进行组合，得到重构频域残差信号。

上述两种方案的音频编解码方法，其中所述的频带匹配策略包括：高频残差信号频带在低频残差信号区域进行匹配、高频残差信号频带在低频残差信号区域及其扩展区域进行匹配、通过声道耦合进行高频残差信号匹配和通过帧间扩展进行高频残差信号匹配。

本发明由于充分考虑了频域残差信号频谱的白化特性和高频残差信号和低频残差信号之间的相关性和相似性，通过选择高频残差信号和低频残差信号的匹配策略，估算高频残差信号的重构参数，并用高频残差参数准确的重构高频残差信号，并以此为基础，实现音频信号的高效编码和解码，因而提高了音频信源编码的压缩比或编码效率，节省了传输音频信号所需传输带宽和节省存储音频信号所需存储容量，同时提高了音频压缩编码质量。

附图说明

图1基于频域滤波的音频编解码方法流程图；

图2基于时域滤波的音频编解码方法流程图；

图3频域残差信号分析和编码方法流程图；

图4频域残差信号解码和重构方法流程图；

图5高低频频域残差信号及高频残差信号重构示意图；

图6高频残差信号频带在低频残差信号区域进行匹配策略示意图；

图7高频残差信号频带在低频残差信号区域及其扩展区域进行匹配策略示意图；

图8通过声道耦合进行高频残差信号匹配策略示意图；

图9通过帧间扩展进行高频残差信号匹配策略示意图。

具体实施方式

实施例一

本实施例提供一种音频编解码的方法，该方法是基于频域滤波和高频残差重构的音频编码方法。高频残差信号是频域残差信号的高频部分，高频残差信号的分析和重构是为了有效的压缩频域残差信号的数据量，提高音频信号编码和传输效率。高频残差信号的分析和重构是按照一定的规则将频域残差信号分成低频残差信号和高频残差信号两部分，利用高频残差信号与低频残差信号的相关性或相似性，提取高频残差重构所需要的参数，丢弃高频残差信号，然后用高频残差参数来重构高频残差信号，从而重构整个频域残差信号。

参照图1，本实施例的音频编解码步骤如下：

步骤101，在编码端，音频原始时域信号经过时频变换处理，得到原始频域信号。

音频原始时域信号是包括语音信号、音频信号或任何人耳可以听到的各种声音信号的混合声音；音频信号的频率范围主要在0Hz到20kHz之间，音频信号的采样频率为96kHz、48kHz、44.1kHz、32kHz、22.05kHz、16kHz、11.025kHz和8kH；音频信号的编码通常是以音频帧为单位，常用音频帧的大小按照实际应用一般在50毫秒之内。时域变换采用但不限于修正离散余弦变换、修正重叠变换和快速傅里叶变换方法进行变换。

步骤102，原始频域信号经过频域感知滤波处理，得到原始频域残差信号。

频域感知滤波器是反映人耳听觉特性的频域滤波器，它对来步骤101的频域信号进行频域滤波，得到在感知意义上白化了的频域残差信号，如果用H_M(f)表示频域感知滤波器的传输函数，用M(f)表示由感知参数表征的感知曲线，则H_M(f)可以表示为

H_{M} (f) = \frac{1}{M (f)},

其中f表示频率，单位为Hz。

步骤103，频域残差分析和编码。

参见3所示，频域残差分析和编码的具体步骤包括：

步骤301，频带划分和高低频残差信号分割，即按照等带宽频带、或临界频带、或频程频带等方法，先对原始频域残差信号进行频带划分，然后根据音频编码器的编码速率选择其中一个划分频带的端点将原始频域残差信号分割成原始低频残差信号和原始高频残差信号两部分，使这两部分各具有若干个频带。

如图5所示，完整的频域残差信号用R表示，为了有效地对频域残差信号进行分析、编码和重构，将频域残差信号按照等带宽频带、或临界频带、或频程频带等方法进行频带划分，把具有一定属性，如听觉特性的相邻频率分量划分到相同的频带中去。设f_Ci、f_Li和f_Hi分别为第i个频带的中心频率、低端边界频率和高端边界频率，b_i为频带带宽，选择某个频带的低端边界频率f_Li或高端边界频率f_Hi为分界频率f_D，将频域残差信号在频域内分割成低频残差信号R_L和高频残差信号R_H两部分，在0到f_D之间就具有连续N_L个低频残差信号频带，在f_D与f_Z之间就具有连续N_H个高频残差信号频带，高于频率f_Z的高频残差信号频带中的信号为零。设f表示频率，单位为Hz、f_S表示采样频率，归一化频率用

\hat{f} = f / f_{S}

表示；如果用f_B表示时域音频信号的带宽，则

{\hat{f}}_{B} = f_{B} / f_{S} = 0.5 .

步骤302，对原始低频残差信号进行编码，得到低频残差信号编码输出。原始低频残差信号的编码，采用各种有失真的编码方法，如线性或非线性标量量化编码、矢量量化编码，或者同时采用各种无失真的编码方法，如Huffman编码和算术编码；

步骤303，对低频残差信号编码在编码端进行本地解码，得到解码低频残差信号和低频残差信号的编码；

步骤304，根据解码低频残差信号和原始高频残差信号的相似性或相关性，对高频残差参数进行分析，即选择一个频带匹配策略对解码低频残差信号与原始高频残差信号进行频带匹配，并计算最佳匹配的高频残差参数，得到原始高频残差参数。

如图5所示，频带匹配就是在低频残差信号内寻找与高频残差频带特性最接近的频带，目的是在解码端高质量地重构高频残差信号。频带匹配采用不同的频带匹配策略，所谓频带匹配策略是指如何在低频残差信号R_L中选择一段频域残差信号，并用它来重构高频残差信号R_H中具有相同频带宽度的高频残差信号的方法。在图5中，因为频率f_Z以上的残差信号已经归零，所以没有必要再对这部分残差进行重构。

所述频带匹配策略包括但不限于以下几种：

(P1)高频残差信号频带在低频残差信号区域进行匹配

如图6所示，将处于f_D与f_Z之间的N_H个高频残差频带分别独立地在处于0到f_D之间的低频残差信号区域R_L进行匹配，寻找误差最小或相关性最大的最佳匹配频带。这时，频带划分方法、最佳匹配频带频率位置和能量匹配因子等即为高频残差重构参数。

(P2)高频残差信号频带在低频残差信号区域及其扩展区域进行匹配

如图7所示，采用上述频带匹配策略(P1)，先将处于f_D与f_Z之间的频率最低的高频残差信号频带R_H1在处于0到f_D之间的低频残差信号区域R_L进行匹配，寻找误差最小或相关性最大的最佳匹配频带，并用此最佳匹配频带来重构频率最低的高频残差信号频带R_H1；再将这个重构的频率最低的高频残差信号频带R_H1加入原来的低频残差信号R_L，形成一个新组成的低频残差信号R_L1＝R_L+R_H1；然后，以这个新组成的低频残差信号为基础，采用上述频带匹配策略(P1)，继续重构更高频率的高频残差信号频带；依此类推，直至完成全部f_D到f_Z之间的所有高频残差信号频带的匹配和重构。这时，频带划分方法、最佳匹配频带频率位置、能量匹配因子和低频残差区域扩展参数即为高频残差重构参数。

(P3)通过声道耦合进行高频残差信号匹配

如图8所示，设音频信源是具有C(C≥2)个主声道的多声道音频信源，比如5.1声道音频就有5个主声道和一个低重音效声道，这时存在C个声道的低频残差信号。因为各声道的音频信号具有较大相关性，所以各声道的频域残差信号也具有较大相关性，因此任何一个声道不仅能够利用其所在声道的低频残差信号进行高频残差信号重构，而且还能够利用其它声道的低频残差信号进行高频残差信号重构；这样可以得到更多的匹配选择，提高高频残差信号重构质量。以第1声道为例给以说明，首先可以采用上述频带匹配策略(P1)和(P2)，利用所在声道的处在0到f_D之间的低频残差信号R_L匹配和重构处于f_D与f_Z之间的高频残差信号。除此之外，还可以利用其它声道的处在0到f_D之间的低频残差信号R_L匹配和重构第1声道内处于f_D与f_Z之间的高频残差信号。与第1声道一样，所有C个声道的频域残差信号多可以采用相同的方法进行处理。

(P4)通过帧间扩展进行高频残差信号匹配

上述频带匹配策略(P1)、(P2)和(P3)所描述的高频残差信号的匹配策略是利用当前帧的低频残差信号重构当前帧的高频残差信号。因为相邻帧音频信号之间通常存在很大的相关性，所以相邻帧的残差也具有较大的相关性。因此，当前音频帧的高频残差信号，不仅可以用当前帧的低频残差信号进行重构，也可以用当前帧之前若干帧的包括重构低频残差信号和重构高频残差信号的重构残差信号进行重构。如图9所示，采用上述频带匹配策略(P1)、(P2)和(P3)的方法利用第j帧的低频残差信号对第j帧的高频残差信号进行重构，或采用上述频带匹配策略(P1)、(P2)和(P3)的方法利用第j-1帧的低频残差信号对第j帧的高频残差信号进行重构，还可以采用上述频带匹配策略(P1)、(P2)和(P3)的方法利用第j-1帧的重构高频残差信号对第j帧的高频残差信号进行重构。此外，这些方法还可以扩展到第j-2帧、第j-3帧去。

上述各种频带匹配策略都需要在低频残差信号和高频残差信号之间寻找最佳匹配频带，这里所说的最佳，可以用误差或失真最小来表达，也可以用相关性最大来表示。具体计算最佳匹配的高频残差参数的步骤包括：

(B1)计算归一化低频残差频带信号

和归一化高频残差频带信号

设进行匹配的高频残差信号和低频残差信号的频带宽度为L个频点、R_L(p，l)，l＝0，1，…L-1为低频残差信号频带、R_H(q，l)，l＝0，1，…L-1为高频残差信号频带，其中p和q分别表示R_L(p，l)和R_H(q，l)所在频带的起始位置，p∈[0，f_D]、q∈[f_D，f_Z]，计算

和其中，

表示R_L(p，l)，l＝0，1，…L-1被其自身绝对值的最大值R_Lmax(p)进行归一化得到的归一化低频残差信号、表示R_H(p，l)，l＝0，1，…L-1被其自身绝对值的最大值R_Hmax(q)进行归一化得到的归一化高频残差信号。

(B2)计算匹配失真测度d(p，q)或匹配相关函数r(p，q)，如果用失真最小来进行匹配分析，则匹配的失真测度表示为：

d (p, q) = w (p, q) \cdot Σ_{l = 0}^{l = L - 1} w (| {\hat{R}}_{H} (q, l) |) {\cdot ({\hat{R}}_{L} (p, l) - {\hat{R}}_{H} (q, l))}^{2} - - - (1)

其中w(p，q)是频率影响因子，

是残差幅度影响因子。如果w(p，q)＝1.0，

w (| {\hat{R}}_{H} (q, l) |) = 1.0,

那么式(14)可以简化为：

d (p, q) = Σ_{l = 0}^{l = L - 1} {({\hat{R}}_{L} (p, l) - {\hat{R}}_{H} (q, l))}^{2} - - - (2)

如果用相关性最大进行匹配分析，归一化低频残差信号

和归一化高频残差信号

的相关函数表示为：

r (p, q) = w (p, q) \cdot Σ_{l = 0}^{l = L - 1} w (| {\hat{R}}_{H} (q, l) |) \cdot ({\hat{R}}_{L} (p, l) \cdot {\hat{R}}_{H} (q, l)) - - - (3)

同样，w(p，q)表示频率影响因子，

表示残差幅度影响因子。如果w(p，q)＝1.0，

w (| {\hat{R}}_{H} (q, l) |) = 1.0,

那么式(16)可以简化为：

r (p, q) = Σ_{l = 0}^{l = N - 1} {\hat{R}}_{L} (p, l) {\hat{R}}_{H} (q, l) - - - (4)

(B3)确定最佳频带匹配位置p₀和q₀，该最佳匹配就是失真测度d(p，q)的最小值或相关函数r(p，q)的最大值所对应的p和q的最佳值p₀和q₀，它们确定了高频残差与低频残差所匹配的频带。

(B4)利用如下公式计算最佳能量匹配因子：

G_{R} (p_{0}, p_{0}) = \frac{R_{H \max} (q_{0})}{R_{Lp \max} (p_{0})} - - - (5)

这样，步骤304所得到的频带划分结果、最佳匹配频带频率位置、频域残差高低频段分界频率f_D、能量匹配因子、声道耦合参数和帧间扩展参数，就是原始高频残差参数。

步骤305，高频残差参数编码。

对步骤304产生的原始高频残差参数进行编码，得到高频残差信号编码输出。原始高频残差参数的编码，采用各种有失真的编码方法，如线性或非线性标量量化编码、矢量量化编码，或者同时采用各种无失真的编码方法，如Huffman编码和算术编码。

步骤104，频域残差解码和重构。

在解码端，接收到的低频残差信号编码和高频残差参数编码经过频域残差解码和重构处理，得到重构频域残差信号，如图4所示。具体步骤包括：

步骤401，对接收到的低频残差信号编码进行解码，得到解码低频残差信号。

步骤402，对接收到的高频残差参数编码进行解码，得到解码高频残差参数，该解码高频残差参数包括频带划分结果、频域残差高低频段分界频率f_D、最佳匹配频带频率位置、能量匹配因子、声道耦合参数和帧间扩展参数。

步骤403，高频残差信号重构。

根据解码高频残差参数，利用解码低频残差信号复制和重构高频残差信号，具体步骤包括：

(D1)根据步骤401和402得到的解码低频残差信号、最佳匹配频带频率位置和能量匹配因子，用下式进行高频残差信号复制和能量匹配：

R_H(q₀，l)＝G_R(p₀，q₀)·R_L(p₀，l)，l＝0，1，…L-1(6)

得到重构高频残差信号频带R_H(q₀，l)；

(D2)根据步骤401和402得到的频带划分结果、声道耦合参数和帧间扩展参数，将所有重构高频残差信号频带进行组合，得到重构高频残差信号。

步骤404，根据解码得到的频域残差高低频段分界频率f_D，将解码低频残差信号与重构高频残差信号进行组合，得到重构频域残差信号。

步骤105，重构频域残差信号经过频域逆滤波处理，得到重构频域信号；如果用H_R(f)表示频域感知逆滤波器，则H_R(f)表示为

H_{R} (f) = \frac{1}{H_{M} (f)} = M (f),

其中f表示频率，单位为Hz。

步骤106，对重构频域信号进行时频反变换处理，得到音频重构时域信号。与时频变换相对应，时域反变换采用反向修正离散余弦变换、反向修正重叠反变换或反向快速傅里叶变换方法。

实施例二

本实施例提供一种基于时域滤波和高频残差重构的音频编解码方法。

参见图2，该方法步骤如下：

步骤201，在编码端，音频原始时域信号经过时域感知滤波处理，得到原始时域残差信号。其中，时域感知滤波器是反映人耳听觉特性的时域滤波器，它对音频原始时域信号进行时域滤波，得到在感知意义上白化了的时域残差信号；时域感知滤波器的传输函数用H_M(z)表示，时域感知滤波器采用但不限于线性预测滤波器。

步骤202，原始时域残差信号经过时频变换处理，得到原始频域残差信号，其中，时域变换采用但不限于修正离散余弦变换、修正重叠变换和快速傅里叶变换方法进行变换。

步骤203，频域残差分析和编码。

参见3所示，频域残差分析和编码的具体步骤包括：

\hat{f} = f / f_{S}

表示；如果用f_B表示时域音频信号的带宽，则

{\hat{f}}_{B} = f_{B} / f_{S} = 0.5 .

所述频带匹配策略包括但不限于以下几种：

(P1)高频残差信号频带在低频残差信号区域进行匹配

(P3)通过声道耦合进行高频残差信号匹配

(P4)通过帧间扩展进行高频残差信号匹配

(B1)计算归一化低频残差频带信号

和归一化高频残差频带信号

和

其中，表示R_L(p，l)，l＝0，1，…L-1被其自身绝对值的最大值R_Lmax(p)进行归一化得到的归一化低频残差信号、

表示R_H(p，l)，l＝0，1，…L-1被其自身绝对值的最大值R_Hmax(q)进行归一化得到的归一化高频残差信号。

d (p, q) = w (p, q) \cdot Σ_{l = 0}^{l = L - 1} w (| {\hat{R}}_{H} (q, l) |) {\cdot ({\hat{R}}_{L} (p, l) - {\hat{R}}_{H} (q, l))}^{2} - - - (1)

其中w(p，q)是频率影响因子，

是残差幅度影响因子。如果w(p，q)＝1.0，

w (| {\hat{R}}_{H} (q, l) |) = 1.0,

那么式(14)可以简化为：

d (p, q) = Σ_{l = 0}^{l = L - 1} {({\hat{R}}_{L} (p, l) - {\hat{R}}_{H} (q, l))}^{2} - - - (2)

如果用相关性最大进行匹配分析，归一化低频残差信号

和归一化高频残差信号

的相关函数表示为：

r (p, q) = w (p, q) \cdot Σ_{l = 0}^{l = L - 1} w (| {\hat{R}}_{H} (q, l) |) \cdot ({\hat{R}}_{L} (p, l) \cdot {\hat{R}}_{H} (q, l)) - - - (3)

同样，w(p，q)表示频率影响因子，

表示残差幅度影响因子。如果w(p，q)＝1.0，

w (| {\hat{R}}_{H} (q, l) |) = 1.0,

那么式(16)可以简化为：

r (p, q) = Σ_{l = 0}^{l = N - 1} {\hat{R}}_{L} (p, l) {\hat{R}}_{H} (q, l) - - - (4)

(B4)利用如下公式计算最佳能量匹配因子：

G_{R} (p_{0}, p_{0}) = \frac{R_{H \max} (q_{0})}{R_{Lp \max} (p_{0})} - - - (5)

步骤305，高频残差参数编码。

步骤204，频域残差解码和重构。

步骤403，高频残差信号重构。

R_H(q₀，l)＝G_R(p₀，q₀)·R_L(p₀，l)，l＝0，1，…L-1(6)

得到重构高频残差信号频带R_H(q₀，l)；

步骤205，重构频域残差信号经过时频反变换处理，得到重构时域残差信号；与时频变换相对应，时域反变换采用反向修正离散余弦变换、反向修正重叠反变换或反向快速傅里叶变换方法。

步骤206，对重构时域残差信号进行时域感知逆滤波处理，得到音频重构时域信号输出；如果用H_R(z)表示时域感知逆滤波器，则H_R(f)可以表示为

H_{R} (z) = \frac{1}{H_{M} (z)} .

本发明上述实施例提供的音频编码方法和解码方法，能够对包括语音信号在内的音频信号进行高效高质量的压缩编码，提高音频传效率。

以上实施例只是用于帮助理解本发明的方法及其核心思想；同时，对于本领域的一般技术人员，依据本发明的思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本发明的限制。

Claims

1.一种基于频域滤波和高频残差重构的音频编解码方法，包括如下步骤：

2.根据权利要求1所述的音频信号编解码方法，其中步骤3)所述的频域残差分析和编码处理，包括如下步骤：

(A1)按照等带宽频带、或临界频带、或频程频带的频带划分方法，先对原始频域残差信号进行频带划分，然后根据音频编码器设定的编码速率选择一个频带划分端点，将原始频域残差信号分割成原始低频残差信号和原始高频残差信号两部分，使这两部分各具有若干个频带；

(A3)根据解码低频残差信号与原始高频残差信号的相似性或相关性，对高频残差参数进行分析，即选择一个频带匹配策略对解码低频残差信号和原始高频残差信号进行频带匹配，并计算最佳匹配的高频残差参数，得到包括频带划分结果、频域残差高低频段分界频率、最佳匹配频带频率位置、能量匹配因子、声道耦合参数和帧间扩展参数在内的原始高频残差参数；

3.根据权利要求2所述的音频信号编解码方法，其中步骤(A3)所述的频带匹配策略包括：高频残差信号频带在低频残差信号区域进行匹配、高频残差信号频带在低频残差信号区域及其扩展区域进行匹配、通过声道耦合进行高频残差信号匹配和通过帧间扩展进行高频残差信号匹配。

4.根据权利要求3所述的音频信号编解码方法，其中所述的高频残差信号频带在低频残差信号区域进行匹配，是用各个高频残差信号频带在低频残差信号区域进行匹配，寻找误差最小或相关性最大的最佳匹配频带。

5.根据权利要求3所述的音频信号编解码方法，其中所述的高频残差信号频带在低频残差信号区域及其扩展区域进行匹配，是先将频率最低的高频残差信号频带在低频残差信号区域进行匹配，寻找误差最小或相关性最大的最佳匹配频带，并用此最佳匹配频带重构频率最低的高频残差信号频带；再将这个重构的频率最低的高频残差信号频带加入原来的低频残差信号，形成一个新组成的低频残差信号；然后以这个新组成的低频残差信号为基础，对更高频率的高频残差信号频带进行匹配，直至完成所有高频残差信号频带的匹配。

6.根据权利要求3所述的音频信号编解码方法，其中所述的通过声道耦合进行高频残差信号匹配，是指多声道音频信号情况下，任意一个声道的高频残差信号频带采用高频残差信号频带在低频残差信号区域进行匹配或高频残差信号频带在低频残差信号区域及其扩展区域进行匹配，利用所在声道的低频残差信号对所在声道的高频残差信号进行匹配，并采用高频残差信号频带在低频残差信号区域进行匹配或高频残差信号频带在低频残差信号区域及其扩展区域进行匹配，利用其它声道的低频残差信号对所在声道的高频残差信号进行匹配。

7.根据权利要求3所述的音频信号编解码方法，其中所述的通过帧间扩展进行高频残差信号匹配，是指当前帧的高频残差信号频带采用高频残差信号频带在低频残差信号区域进行匹配、高频残差信号频带在低频残差信号区域及其扩展区域进行匹配或通过声道耦合进行高频残差信号匹配，利用当前帧的低频残差信号对当前帧的高频残差信号进行匹配，并采用高频残差信号频带在低频残差信号区域进行匹配、高频残差信号频带在低频残差信号区域及其扩展区域进行匹配或通过声道耦合进行高频残差信号匹配，利用前一帧或前若干帧的重构频域残差信号，包括重构低频残差信号和重构高频残差信号，对当前帧的高频残差信号进行匹配。

8.根据权利要求2所述的音频信号编解码方法，其中步骤(A3)所述的计算最佳匹配的高频残差参数，包括如下步骤：

(B1)在p∈[0，f_D]、q∈[f_D，f_Z]范围，计算归一化低频残差频带信号

和归一化高频残差频带信号

其中，p和q分别表示

和

所在频带的起始位置，f_Z为残差信号不为零所对应的最高频率，f_D为低频残差信号和高频残差信号分界频率，l为频带内频点指针。

(B2)在p∈[0，f_D]、q∈[f_D，f_Z]范围，计算匹配失真测度d(p，q)或匹配相关函数r(p，q)；

(B3)在p∈[0，f_D]、q∈[f_D，f_Z]范围，将失真测度d(p，q)的最小值或相关函数r(p，q)的最大值所对应的p和q的取值p₀和q₀为最佳频带匹配位置；

(B4)计算最佳能量匹配因子G_R(p₀，q₀)。

9.根据权利要求1所述的音频信号编解码方法，其中步骤4)所述的频域残差解码和重构处理，包括如下步骤：

10.一种基于时域滤波和高频残差重构的音频编解码方法，包括如下步骤：