CN101622667A

CN101622667A - 用于分层编解码器的后置滤波器

Info

Publication number: CN101622667A
Application number: CN200780051965A
Authority: CN
Inventors: S·布鲁恩
Original assignee: Telefonaktiebolaget LM Ericsson AB
Current assignee: Telefonaktiebolaget LM Ericsson AB
Priority date: 2007-03-02
Filing date: 2007-12-14
Publication date: 2010-01-06
Anticipated expiration: 2027-12-14
Also published as: JP2010520504A; ATE548727T1; EP2132732A4; US8571852B2; EP2132732B1; US20100063801A1; CN101622667B; WO2008108701A1; JP5255575B2; EP2132732A1

Abstract

一种用于表示音频的信号的可伸缩解码器设备(50)，包括：连接至输入(40)的主解码器(21)。主解码器(21)被安排为根据所接收的参数(4)来提供主解码信号(23)。主后置滤波器(31)连接至主解码器(21)，以提供主后置滤波信号(32)。辅增强解码器(45)连接至输入(40)，并且被安排为提供辅解码增强信号(44)。所述设备还包括：组合器装置(55)，被安排为将主后置滤波信号(32)和基于辅解码增强信号(44)的信号(53)组合为要在输出(6)处提供的输出信号(6)。以来自两个信号的组成之间的可调整强度关系来进行该组合。一种以类似于所述可伸缩解码器设备(50)的方式操作的用于对表示音频的编码信号进行解码的方法。

Description

用于分层编解码器的后置滤波器

技术领域

本发明总体上涉及音频编解码器，具体涉及降低编码期间被***语音中的编码噪声。

背景技术

通常，音频编码(具体而言，语音编码)执行从模拟输入音频或语音信号到编码域中的数字表示再返回到模拟输出音频或语音信号的映射。数字表示伴随着对表示音频或语音的值或参数的量化或离散化。量化或离散化能够被看作以编码噪声干扰真实的值或参数。音频或语音编码技术关于：执行编码，以使得在给定比特率下经解码的语音中的编码噪声效应尽可能小。然而，对语音进行编码所采用的给定比特率限定了编码噪声在最佳情况下能够被减小到的理论下限。目标至少是尽可能地使编码噪声无法被听到。

可伸缩(scalable)或嵌入式编码是在层中进行编码的编码范例。基本或核心层以低比特率对信号进行编码，而位于彼此之上的附加层相对于以从核心层直到相应的前一层的所有层实现的编码提供一定的增强。每一层添加一定的附加比特率。嵌入所产生的比特流，这意味着将较低层编码的比特流嵌入至较高层的比特流中。这种属性使得可以在传输中的任意位置或在接收器中丢弃属于较高层的比特。这种经剥离的(stripped)比特流仍能够被解码至保留其比特的层。

一种有关编码噪声的恰当观点是将其假定为某种白或有色噪声。存在一类增强方法，其在解码器处对音频或语音信号进行解码后，调整编码噪声使其难以被听到，从而使音频或语音质量得以提高。这样的技术通常被称为“后置滤波(postfiltering)”，意味着增强的音频或语音信号是在实际解码器后的特定后处理中得到的。参考文献[1]-[4]是一些最基本的论文。

在本发明背景下的相关后置滤波器是音调(pitch)或精细结构后置滤波器。它们的基本工作原理为，移除至少部分的淹没了浊音语音谐波之间的谱谷的(编码)噪声。这通常是通过将经解码的语音信号的时移版本与经解码的语音信号进行加权叠加来实现的，其中时移对应于音调滞后或语音周期。优选地，还将经时移的版本包含在未来语音信号采样中。

对未来语音信号进行估计的音调后置滤波器的一个问题在于：它们需要访问经解码的音频或语音信号的一个未来的音调周期。通常，可以通过对经解码的音频或语音信号进行缓冲来使该未来信号对于后置滤波器可用。然而，在音频或语音编解码器的传统应用中，由于这会增加编解码器的算法延迟从而影响通信质量特别是交互性，因此这种方式是不合要求的。

发明内容

本发明的目的在于，从可伸缩解码器设备提供改进的音频或语音质量。本发明的另一目的在于，提供供可伸缩解码器设备使用的高效的后置滤波器装置，所述后置滤波器装置不会显著地增加任何附加的音频或语音信号延迟。

上述目的由根据所附专利权利要求的设备和方法实现。概括地说，根据第一方面，一种用于表示音频或语音的信号的解码器设备(优选为可伸缩解码器设备)包括：用于编码信号的参数的输入以及连接至该输入的主解码器。主解码器被安排为根据所述参数来提供主解码信号。主后置滤波器连接至主解码器的输出，并且被安排为提供主后置滤波信号。辅解码器连接至所述输入，并且被安排为根据所述参数来提供辅解码信号。可伸缩解码设备还包括：组合器(combiner)装置，被安排为将主后置滤波信号和基于辅解码增强信号的信号组合为输出信号。组合如此进行以使得输出信号是主后置滤波信号和基于辅解码信号的信号的加权组合。可伸缩解码设备还包括：用于输出信号的输出，其连接至所述组合器装置。

根据第二方面，一种用于对表示音频或语音的编码信号进行解码的方法，包括：接收编码信号的参数以及将所述参数主解码为主解码信号。将主解码信号主后置滤波为主后置滤波信号。还将所述参数辅解码为辅解码信号。所述方法还包括：将主后置滤波音频信号和基于辅解码信号的信号组合为输出信号。所述输出信号是主后置滤波信号和基于辅解码信号的信号的加权组合。然后，输出所述输出信号。

利用本发明可以改进可伸缩语音和音频编解码器的重构信号质量而不增加任何另外的延迟。

附图说明

通过参考以下结合附图的说明，本发明及其其他目的和优势可以得到最好地理解，附图中：

图1是具有后置滤波器的音频或语音编解码器的基本结构的图示；

图2是一般的可伸缩音频或语音编解码器***的框图；

图3是其中较高层支持对非语音音频信号的编码的另一可伸缩音频编解码器***的框图；

图4图示出根据本发明的方法的实施例的步骤的流程图；

图5图示出根据本发明的解码器设备的实施例的框图；

图6图示出根据本发明的可伸缩解码器设备的实施例的框图；

图7图示出根据本发明的可伸缩解码器设备的另一实施例的框图；

图8图示出根据本发明的方法的另一实施例的步骤的流程图；

图9图示出根据本发明的可伸缩解码器设备的另一实施例的框图；

图10图示出根据图7的方法的特定实施例的部分步骤的流程图；

图11图示出根据本发明的可伸缩解码器设备的另一实施例的框图；

图12图示出根据本发明的可伸缩解码器设备的另一实施例的框图；

图13图示出根据本发明的方法的又一实施例的步骤的流程图；以及

图14图示出根据本发明的可伸缩解码器设备的另一实施例的框图。

具体实施方式

在本公开中，将使用相同的附图标记来表示不同附图和实施例中的等同或直接对应的特征。

为了全面理解详细说明，必须更加明确地定义某些术语以避免混淆。在本公开中，将术语“参数”用作通称，代表任意种类的信号表示，包括比特或比特流。

以下还定义了与辅解码器有关的不同装置和信号。“辅解码器”是不同类型的辅决策装置的通用表示。其包括例如辅增强解码器或辅重构解码器。“辅增强解码器”涉及可伸缩编码，因而是辅解码器的子集。这样的“辅增强解码器”提供了将要被添加至例如主解码信号的某种增强信号。“辅重构解码器”指的是递送重构信号域中的输出(即经重构的语音或音频信号)的辅解码器。它可以指辅解码器生成这样的输出，或者就可伸缩编解码器而言，指根据主解码器输出和辅增强解码器的输出而得到这样的输出。从这样的辅解码器输出的信号以模拟方式进行表示。

为了理解通过本发明所获得的优势，详细描述将起始于大体上对后置滤波的简要回顾。图1图示出具有后置滤波器的音频或语音编解码器的基本结构。发送器单元1包括将传入的音频或语音信号3编码为参数4的流的编码器10。通常对参数4进行编码，并将其传输至接收器单元2。接收器单元2包括解码器20，解码器20接收表示原始音频或语音信号3的参数4，并将这些参数4解码为经解码的音频或语音信号5。经解码的音频或语音信号5应尽可能与原始音频或语音信号3相似。然而，经解码的音频或语音信号5总会在某种程度上包括编码噪声。接收器单元2还包括后置滤波器30，后置滤波器30从解码器20接收经解码的音频或语音信号5，执行后置滤波过程，并输出经后置滤波的经解码的音频或语音信号6。

后置滤波器的基本思想是对编码噪声的谱形状进行整形(shape)，使其变得不易被听到，这实质上利用了人类的声音感知特性。通常这被如此实现以使得将噪声移至语音信号具有相对较高功率的、感知上不太灵敏的频率区域(谱峰)，同时将噪声从语音信号具有低功率的区域(谱谷)中去除。存在两种基本的后置滤波器方式，短期和长期后置滤波器，两者又分别被称为共振峰滤波器和音调或精细结构滤波器。为了获得良好的性能通常使用自适应后置滤波器。

如上所述，在本发明中音调或精细结构后置滤波器是有益的。经解码的语音信号与其时移版本的叠加引起与期望语音信号有关的不相关编码噪声(尤其是语音谐波之间的不相关编码噪声)的衰减。所述效果能够通过非递归和递归滤波器结构来获得。以下给出了[4]中所描述的一个这样的通式：

H (z) = \frac{1 + α z^{- T}}{1 - β z^{- T}},

其中，T对应于语音的音调周期。

实际上，非递归滤波器结构是优选的。在公开的美国专利申请2005/0165603中描述了一种较新的非递归音调后置滤波方法，该方法被应用于3GPP(第三代伙伴计划)AMR-WB+(扩展自适应多速率宽带编解码器)[3GPP TS 26.290]和3GPP2VMR-WB(可变速率多模宽带(VMR-WB)编解码器)[3GPP2C.S0052-A：“源控制可变速率多模宽带编解码器(VMR-WB)，扩频***服务选项62和63”]音频和语音编码标准。此处，基本思想是首先根据以下关系来计算编码噪声估计r(n)：

r(n)＝y(n)-y_p(n)，

其中，y(n)是经解码的音频或语音信号，并且y_p(n)是按下式计算的预测信号：

y_p(n)＝0.5·(y(n-T)+y(n+T))。

其次，把以特定因子α进行加权的噪声估计的低通(或带通)滤波版本从语音信号中减去，产生增强的音频或语音信号：

y_enh(n)＝y(n)-α·LP{r(n)}。

如果符号反转，对经低通滤波的噪声信号的适当解释为，将其看作补偿编码噪声低频部分的增强信号。响应于预测信号与经解码的语音信号的相关性、预测信号的能量以及语音信号与预测信号之差的能量的特定时间平均，来调整(adapt)因子α。

如上所述，对以上定义的表达式y_p(n)＝0.5·(y(n-T)+y(n+T))进行评估的现有技术音调后置滤波器的一个问题在于，它们需要未来一个音调周期的经解码的语音信号y(n+T)，从而增加了算法延迟。AMR-WB+和VMR-WB通过根据可用的经解码的音频或语音信号，将经解码的音频或语音信号扩展至未来，并假设音频或语音信号将以音调周期T周期性扩展，而解决了这一问题。假定仅在时间索引n⁺之前，经解码的音频或语音信号可用，那么根据下式来计算未来的音调周期：

\hat{y} (n + T) = \{\begin{matrix} y (n + T) & n + T < n^{+} \\ y (n) & n + T &GreaterEqual; n^{+} \end{matrix} .

由于这种扩展仅仅是一种近似，因此与使用真正的未来的经解码的语音信号所获得的质量相比，质量上会有一定的下降。

本发明涉及可伸缩音频或语音编解码器设备，并且以下给出了可以与本发明的基本思想一起使用的某些***的简要回顾。图2图示出一般的可伸缩音频或语音编解码器***的框图。此处，发送器单元1包括编码器10，编码器10将传入的音频或语音信号3编码为参数4的流。整个编码发生在位于包含主编码器11的发送器中的下层7和位于包含辅编码器15的发送器单元中的上层8这两层中。可伸缩编解码器设备能够配备有附加层，但在作为模型***在本公开中使用两层解码器***。然而，本发明的原理还可以被应用于具有多于两层的可伸缩编解码器。主编码器11接收传入的音频或语音信号3，并将其编码为主参数12的流。主编码器还将主参数12解码为估计的主信号13，理想情况下估计的主信号13将对应于能够在解码器侧根据主参数12获得的信号。在比较器14中，将估计的主信号13与原始传入音频或语音信号3进行比较，在这种情况下，比较器14是减法单元。因此，差信号是主编码器11的主编码噪声信号16。主编码噪声信号16被提供至辅编码器，辅编码器将其编码为辅参数17的流。这些辅参数17能够被看作能够从主参数12解码得到的信号的优选增强的参数。主参数12和辅参数17一起形成了传入音频或语音信号3的参数4的总体流。

通常对参数4进行编码，并将其传输至接收器单元2。接收器单元2包括解码器20，解码器20接收表示原始音频或语音信号3的参数4，并将这些参数4解码为经解码的音频或语音信号5。整个解码发生在下层7和上层8这两层中。在接收器单元中，下层7包括主解码器21。类似地，上层8在接收器单元中包含辅解码器25。主解码器21接收参数4的流的传入主参数22。理想情况下，这些参数与在编码器10中创建的参数相同，然而在某些情况下，传输噪声可能会使参数发生失真。主解码器21将传入主参数22解码为经解码的主音频或语音信号23。辅解码器25类似地接收参数4的流的传入辅参数27。理想情况下，这些参数与在编码器10中创建的参数相同，然而在某些情况下，传输噪声可能会使参数发生失真。辅解码器21将传入辅参数22解码为经解码的增强音频或语音信号26。该经解码的增强音频或语音信号26意在尽可能准确地对应于主编码器11的编码噪声，从而也类似于由主解码器21引起的编码噪声。在加法器24中将经解码的主音频或语音信号23和经解码的增强音频或语音信号26相加，从而给出最终的输出信号5。

如果在接收单元2中仅接收主参数22，接收单元仅支持主解码，或者由于任何原因决定不执行辅解码，则所产生的经解码的增强音频或语音信号26将等于零，并且输出信号5将等同于经解码的主音频或语音信号23。这说明了可伸缩编解码器***的概念的灵活性。根据现有技术，通常对输出信号5执行后置滤波。

目前，最常用的可伸缩语音压缩算法是根据ITU-T建议G.711(“语音频率的脉冲编码调制(PCM)”，1988年11月)的64kbpsA/U律对数PCM编解码器。8kHz采样的G.711编解码器将12比特或13比特线性PCM(脉冲编码调制)采样转换为8比特对数采样。对数采样的有序比特表示允许偷用G.711比特流中的最低有效位(LSB)，从而使G.711编码器实际上在48、56和64kbps之间SNR(信噪比)可伸缩。出于带内控制信令的目的，将G.711编解码器的这种可伸缩特性用于电路交换通信网络中。使用该G.711伸缩特性的最近示例是3GPP-TFO协议(根据3GPP TS28.062，TFO＝自由汇接(tandem-free)操作)，该协议支持在传统64kbps PCM链路上的宽带语音建立和传输。初始使用8kbps的原始64kbps G.711流，以在不显著影响窄带服务质量的情况下兼顾宽带语音服务的呼叫建立。在呼叫建立后，宽带语音将使用16kbps的64kbps G.711流。其他支持开环可伸缩性的较早的语音编码标准为ITU-T建议G.727(“5-，4-，3-和2-比特/采样嵌入式自适应差分脉冲编码调制(ADPCM)”，1990年12月)，并且在某种程度上还有G.722(子带ADPCM)。

可伸缩语音编码技术中最近的进展是MPEG-4(MPEG＝运动图像专家组)标准(ISO/IEC-14496)，其提供MPEG-4-CELP的可伸缩性扩展。MPE基层可以通过传输附加滤波器参数信息或附加创新参数信息来得到增强。国际电信联盟-标准化部门ITU-T最近结束了针对根据ITU-T建议G.729.1(“基于G.729的嵌入式可变比特率编码器：一种可与G.729交互操作的8-32kbit/s可伸缩宽带编码器比特流”，2006年5月，别名为G.729.EV)的新的可伸缩编解码器的标准化。该可伸缩语音编解码器的比特率范围从8kbps到32kbps。该编解码器的主要用例是允许高效共享家庭或办公室网关中有限的带宽资源，例如若干VoIP(基于网际协议的语音)呼叫之间的共享xDSL 64/128kbps(DSL＝数字订户线，xDSL＝多个特定DSL方法的通称)上行链路。

可伸缩语音编码的一个最近的趋势是为高层提供对非语音音频信号(如音乐)进行编码的支持。图3示出了一种这样的方法。在这样的编解码器中，下层7只采用传统语音编码，例如，根据综合分析(AbS)范例的语音编码，其中，CELP(码激励线性预测)是综合分析(AbS)范例中的突出示例。因此，在本实施例中，主编码器11是CELP编码器18并且主解码器21是CELP解码器28。由于这样的编码仅仅极其适于语音，但不那么适用于非语音音频信号(如音乐)，因此上层8替代地根据用于音频编解码器中的编码范例来工作。因此，在本实施例中，辅编码器是音频编码器19，并且辅解码器是音频解码器29。在本实施例中，通常上层8编码对下层编码的编码误差起作用。

下面，描述转移至本发明的核心部分。本发明涉及与上述可伸缩语音或音频编解码器结构相似的编解码器。利用主解码和辅解码，并组合所产生的信号。目前，认为典型实现是可伸缩语音或音频编解码器，其中编解码器执行主下层编码，并且其中使用辅上层编解码器。该思想还利用了主编解码器通常具有比辅编解码器更低的算法延迟这一事实，如果例如主编解码器是时域语音编解码器并且如果辅编解码器例如是频域音频编解码器，则通常是上述情形。两种编码原理是不同的，因此产生了不同种类的编码噪声。如果对经解码的主音频或语音信号进行后置滤波，则两种不同的信号可用于增强信号。然后，该思想将补偿主编码噪声的最终增强信号构建为两个分量增强信号的组合。第一分量从通过后置滤波而增强的下层主解码信号得到，并且第二分量从上层辅解码信号得到。在特定实施例中，后置滤波涉及音调后置滤波器。

图4图示出根据本发明的方法的实施例的步骤的流程图。对表示音频的编码信号进行解码的方法起始于步骤200。在步骤210中，接收编码信号的参数。在步骤220中，将参数主解码为主解码信号。在步骤222中，将主解码信号主后置滤波为主后置滤波信号。在步骤230中，还并行地将编码信号的参数辅解码为辅解码信号。在本实施例中，步骤230包括两个子步骤。在步骤231中，将编码信号的参数辅增强解码为辅解码增强信号。在步骤232中，根据辅解码增强信号和主解码信号来提供辅解码重构信号。通常，这是通过将辅解码增强信号加至主解码信号来实现的，如有必要，将主解码信号延迟，延迟量等于用于获得辅解码增强信号的算法延迟。此处，应当注意的是，通常在加权语音域中对辅增强信号进行编码，从而改进编码的感知特性。实质上，通过在加权域中进行编码，对编码噪声进行谱整形，以使得其与不进行此类加权相比变得更难以被听到。因此，优选地，还需要在加上辅解码增强信号之前通过使用加权算子W来将主信号转换至加权语音域。在相加之后，使用算子W-1对和信号进行逆加权(inverselyweighted)，产生未加权的辅解码重构信号。优选地，主后置滤波的步骤利用分别由辅解码和主解码引起的延迟之间的差。在步骤240中，将主后置滤波信号和基于辅解码信号的信号组合为输出信号。在本实施例中，基于辅解码信号的信号是辅解码信号的经滤波的版本。执行组合，从而对来自主后置滤波信号和基于辅解码增强信号的信号组成(contribution)进行加权。优选地，加权是可调整的(adaptable)。优选地，组合步骤包括检测信号特性，从而响应于该检测到的特性，进行信号权重的调整。以下将进一步讨论这样的信号特性的示例。在步骤248中输出信号被输出。在步骤249中，该过程结束。

由于主解码信号通常比辅解码信号具有更低的延迟，所以用于下层和上层这二者的解码器需要补偿延迟差，以便在解码器求和点中适当地组合这两个信号。这能够简单地通过以该延迟差来延迟或缓冲主解码信号而得以实现。根据本发明，对于高质量后置滤波，利用该可用的额外延迟是有益的。这样的利用使得能够在后置滤波中利用附加信息。在层延迟补偿缓冲器中，在较大的时间索引n⁺之前，主解码信号的更多的未来部分可用。由于现在可以避免主解码信号的相应附加时间扩展，所以很明显地用于该信号的后置滤波器对于消除其中的编码噪声会表现得更好。

本发明的另一特定方面在于，辅编解码器对主编解码器的实际编码误差起作用的事实。因此，辅编解码器将根据其比特率和性能，至少在某种程度上补偿主编解码器所引入的编码噪声。换言之，存在两个可用的增强信号，这两者均旨在改进主解码音频信号。在不同的情形下，增强信号中的一个或另一个将会更好。本发明利用此事实，并将不同的增强信号和主解码音频信号组合为最终的输出信号。通过令所使用的不同增强信号的相对量依赖于实际接收信号的特性，能够提供适当的混合。在某些情形下，将仅使用辅解码器增强，在其他情形下，将仅使用经后置滤波的主解码信号，并且在另一些情形下，将存在它们之间的混合。

图5图示出根据本发明的解码器设备50的实施例的框图。用于表示音频或语音的信号的解码器设备50包括用于编码信号的参数4的输入40。主解码器21连接至输入40。主解码器21被安排为根据参数4来提供主解码信号23。主后置滤波器31连接至主解码器21的输出，并接收主解码信号23。在该实施例中，主后置滤波器31是长延迟后置滤波器33，利用分别由辅解码器25和主解码器21所引起的延迟之间的差，实现为后置滤波的目的而利用“未来”信息。由此主后置滤波器31提供主后置滤波信号32。

如上所述，解码器设备50包括连接至输入40的辅解码器25。辅解码器25被安排为根据参数4来提供辅解码信号44。在该实施例中，辅解码信号也是辅解码重构信号。

解码器设备50还包括组合器装置55，所述组合器装置55被安排为将主后置滤波信号32和基于辅解码信号44的信号53组合为输出信号6，所述输出信号6通过输出60而被输出。在本实施例中，基于辅解码信号44的信号53是辅解码信号44自身。组合器装置55包括自适应加法器56，自适应加法器56针对来自主后置滤波信号32和辅解码信号44的组成分别以β和(1-β)为权重，将主后置滤波信号32和辅解码信号44相加。

本实施例示出了一种简单的方式，用以利用单个因子β进行该组合，并将总的解码器输出构建为β倍的主后置滤波信号加(1-β)倍的辅解码信号。这样就保证了总的重构信号的功率不受加权因子的影响。在本实施例中，加权受调整控制51的控制，所述调整控制51控制因子β的幅度。因子β能够受调整控制51的控制，以采用区间0≤β≤1中的值。组合器装置55包括用于检测信号特性的装置54。在该实施例中，信号特性是包括参数4的比特流的特性。调整控制51响应于所检测到的信号特性来选择因子β的值。从而，自适应加法器56能够根据所检测到的特性来调整权重(即因子β)，从而提供两增强信号之间的适当混合。这样的信号特性还能够是例如所接收的比特流的比特率以及丢失/破坏的比特或帧的指示。特别地，能够根据接收到的比特流是否包含辅编码器比特来进行调整。

还可以想到的是响应于编码信号的特性或编解码器对信号进行适当编码的能力来进行调整。

图6示出了根据本发明的解码器设备50的另一实施例的框图。该实施例是用于表示音频或语音的信号的可伸缩解码器设备。此处，主解码器21也被安排为根据参数4来提供主解码信号23，并且具体而言根据下层参数22来提供主解码信号23。在本实施例中，这是由核心解码器41来执行的。在该特定实施例中，核心解码器41实际上本身以两层可伸缩。第一层以8kbps的速率操作，并且至第二层的编码提供12kbps的速率。

辅解码器25被安排为根据参数4来提供辅解码信号44，或者特别地根据其上层参数27来提供辅解码信号。在本实施例中，辅解码器25是辅重构解码器125。辅重构解码器125包括辅增强解码器45，辅增强解码器45被安排为根据上层参数来提供辅解码增强信号52。在本实施例中，辅增强解码器45继而包括分层辅解码器47。分层辅解码器具有给出16kbps的总速率的一层，另一层24kbps以及再一层32kbps。在该特定实施例中，辅增强解码器45还包括IMDCT 46(修正离散余弦反变换)。在本实施例中，辅解码器25还连接至主解码器21的输出，以获得主解码信号23。优选地，主解码信号23穿过加权滤波器42，以便将其变换至加权语音域，在加权语音域中，能够加上辅增强信号。如上所述，本实施例的辅增强解码器45对具有一个额外帧延迟的辅增强信号进行解码。该额外延迟可能由实际的辅解码器合成引起。然而，该额外延迟还可能是由在编码过程期间而不是解码期间的较高的延迟引起的。因此，在缓冲器43中将主解码信号23延迟一个帧。在加法器48中对辅解码增强信号52和经延迟的主解码信号求和。该求和信号通过逆滤波器49，以提供辅解码重构信号144形式的辅解码信号。在该实施例中，换言之，辅解码器25被安排为根据参数4和主解码信号23来提供辅解码信号。

能够注意到，如果辅增强解码器45不能提供经解码的增强信号，则辅解码重构信号144将等于经延迟的主解码信号。在可替换的实施例中，辅解码重构信号144可以被替代地设置为空信号，继而被组合器装置所抑制。

可伸缩解码器设备50还包括与图5所示类似的组合器装置55。此处，组合器装置55还包括用于检测信号特性的装置54。如上所述，能够根据接收到的比特流是否包含辅编码器比特来进行调整，在该实施例中辅编码器比特呈现(render)与主解码信号不同的辅解码信号。从而，该组合能够基于在所考虑的低频带中主解码信号与所述辅解码信号之间的相似性。

通常，辅解码器也将留下一定的编码噪声。图7图示出解决该事实的可伸缩解码器设备50的实施例的框图。辅编码噪声能够通过辅后置滤波器34来减少，然而目前辅后置滤波器34必须应用经解码的信号的时间扩展，以便不增加完整编解码器的编码延迟。辅后置滤波器34连接至辅重构解码器25的输出，并接收辅解码信号44(在该实施例中为辅解码重构信号144)。在该实施例中，辅后置滤波器34是上述低延迟后置滤波器36。从而，辅后置滤波器34提供辅后置滤波信号35。接着，在组合器装置55中，该辅后置滤波信号35被用作基于辅解码信号44的信号53。

图8图示出类似的解码器装置所使用的方法的实施例的流程图。除了图4中提供的步骤，加入了附加步骤234，在步骤234中，辅解码信号被辅后置滤波为辅后置滤波信号，从而辅后置滤波信号被用作基于辅解码增强信号的信号。

目前，所属领域技术人员理解，被提供给主解码信号的长延迟高质量后置滤波器具有良好的补偿编码噪声的能力。同时，优选地，结合低延迟后置滤波器的辅编解码器还补偿基本上主编码器的编码噪声。因此，这两个元件的编码噪声补偿能力相互竞争，并且不清楚是具有高质量后置滤波器的主解码器的输出还是具有低延迟后置滤波器的辅解码器的输出提供更好的总解码器输出信号。

如果辅编码器的性能低，那么通常优选具有高质量后置滤波器的主解码信号输出。例如，如果其比特率低或甚至根据没有可用的辅解码信号，则情况将是如此。如果辅编解码器能够补偿几乎全部的编码噪声，则优选具有低延迟后置滤波器的辅解码信号的输出，如果辅编解码器的性能和比特率较高，则通常情况将是如此。因此，该思想在于将解码器的总输出构建为这两个信号的线性组合，并且使该线性组合中的加权因子是自适应的。

本发明的又一方面特别涉及所使用的音调后置滤波器，并具体涉及缩放因子α，所述缩放因子α在将编码噪声估计从经解码的语音信号中减去之前对编码噪声估计进行缩放。由于高质量主后置滤波器更准确地估计编码噪声，所以与在执行准确度较低的编码噪声估计的辅后置滤波器中相比，在高质量主后置滤波器中使用较强的因子α是适当的。

图9图示出根据本发明的可伸缩解码器设备50的另一实施例。此处，根据主后置滤波器增强信号64和基于辅增强信号69的增强信号(在该实施例中为辅后置滤波器增强信号63)，来计算总解码器输出信号的经组合的增强信号65。因此，组合器装置55包括用于提取主后置滤波器增强信号64的装置。为此，在缓冲器57中将主解码信号23延迟一段时间，所述时间对应于主后置滤波器31的算法延迟。接着，通过在减法器58中将经延迟的主解码信号从高质量主后置滤波信号32中减去来获得主后置滤波器增强信号64。

类似地，获得辅后置滤波器增强信号63，即组合器装置55还包括用于提取辅后置滤波器增强信号63的装置。这是在减法器59中通过将辅解码信号44从低延迟辅后置滤波信号35中减去来执行的。接着，对这两个后置滤波器增强信号63、64进行线性组合，优选地，如以上实施例中的那样，通过使用单个控制因子β来进行线性组合。最后所得到的总的组合增强信号65被创建。

接着，优选地，在滤波器61中将组合的增强信号65低通(或带通)滤波为经低通滤波的组合增强信号66。接着，在加法器62中，将组合的增强信号65或任意基于组合的增强信号65的信号(如经低通滤波的组合增强信号66)加至基于主解码信号的信号，以提供输出信号6。在该实施例中，基于主解码信号的信号是辅解码重构信号144。这最终产生增强的总解码器输出信号6。与前述实施例相比，该实施例的优势在于：能够避免在这两个后置滤波器中可能的低通(或带通)滤波，这降低数值复杂度和数值精度。

在该实施例中，根据所考虑的后置滤波器的相关低频带中主和辅解码信号的相似度来调整主和辅后置滤波器信号的线性组合因子β。因此，在该实施例中，用于检测接收到的信号的特性的装置54被安排为检测经延迟的主68和辅44解码信号的特性。如果这些信号极其相似，则因子β取较高的值(接近于1)，这意味着优选主高质量后置滤波器增强信号的输出。由于在所考虑的低频带中主和辅解码信号的相似性意味着辅编解码器在该频带中的效果较小，并且因此高质量后置滤波器的编码噪声消除效果是更可取的，所以这是一种适当的调整。

图10图示出根据本发明的方法的实施例的相应的组合步骤的部分步骤的流程图。该组合步骤240旨在当第二解码信号和对该信号的后置滤波可用时被使用。组合步骤240包括在步骤241中提取主后置滤波增强信号。在步骤242中，提取基于辅解码信号的增强信号，在本实施例中为辅后置滤波器增强信号。在步骤243中，将主后置滤波器增强信号和基于辅解码信号的增强信号组合为组合增强信号。与前述实施例类似，通过对起作用的(contributing)信号进行加权来进行组合。在步骤244中，将组合增强信号低通滤波为基于该组合增强信号的信号。可替换地，能够对组合增强信号进行带通滤波，或者可以省略该步骤。最后，在步骤245中，将基于所述组合增强信号的信号(即在本实施例，经低通滤波的组合增强信号)加至基于主解码信号的信号，以提供输出信号。在本实施例中，基于主解码信号的信号是辅解码信号。

图11示出了根据本发明的可伸缩解码器设备50的另一实施例。该实施例与图9的实施例有些类似，并且此处将仅讨论其之间的差异。在该实施例中，将基于所述辅解码增强信号69的信号提取为辅后置滤波信号与主解码信号的延迟版本68之间的差，即总的辅增强信号67。该总的辅增强信号67代表来自辅解码器和辅后置滤波器的组合增强。在该实施例中，在低通滤波为信号66后，组合增强信号65被加至主解码信号23的延迟版本68。由于在主后置滤波器增强信号64以及辅后置滤波器增强信号67的提取中涉及了主解码信号，因此主解码信号的延迟已经是可用的。

到目前为止，在不同的实施例中，在过程的特定步骤中提供经完全解码的辅信号。然而，还可以在组合中直接使用辅解码增强信号52。图12示出了根据本发明的可伸缩解码器设备50的此类实施例。此处，基于辅解码增强信号69的增强信号是辅解码增强信号52本身。由于没有可用的完全辅解码重构信号，所以在该实施例中基于主解码信号的信号也是所述主解码信号23的延迟版本68。

图13图示出相应的流程图。与先前的流程图相比，省略了多个步骤。不执行辅重构解码，并且没有辅后置滤波。由于仅辅解码增强信号可用，所以还能够省略提取适当的辅后置滤波器增强信号的步骤。

图14图示出图12的可替换实施例。此处，辅后置滤波器34直接连接至辅增强解码器45的输出，从而基于辅解码增强信号69的增强信号是来自辅后置滤波器64的输出信号。相应的方法遵循图13，其中添加了辅后置滤波步骤。

上述实施例应被理解为本发明的少数说明性示例。所属领域技术人员将理解，可以在不背离本发明的范围的前提下对实施例进行各种修改、组合和改变。具体而言，在技术上可行的情况下，可以在其他配置中组合不同实施例中不同的部分解决方案。然而，本发明的范围由所附权利要求来限定。

参考文献

[1]P.Kroon，B.Atal，″Quantization procedures for 4.8kbps CELPcoders″，in Proc IEEE ICASSP，第1650-1654页，1987年.

[2]V.Ramamoorthy，N.S.Jayant，″Enhancement of ADPCM speechby adaptive postfiltering″，AT&T Bell Labs Tech.J.，第1465-1475页，1984年.

[3]V.Ramamoorthy，N.S.Jayant，R.Cox，M.Sondhi，″Enhancementof ADPCM speech coding with backward-adaptive algorithms forpostfiltering and noise feed-back″，IEEE J.on Selected Areas inCommunications，第SAC-6卷，第364-382页，1988年.

[4]J.H.Chen，A.Gersho，″Adaptive postfiltering for qualityenhancements of coded speech″，IEEE Trans.Speech Audio Process.，第3卷，第1期，1995年.

Claims

1.一种用于表示音频或语音的信号的解码器设备(50)，包括：

输入(40)，用于编码信号的参数(4)；

主解码器(21)，连接至所述输入(40)，被安排为根据所述参数(4)来提供主解码信号(23)；

主后置滤波器(31)，连接至所述主解码器(21)的输出，并且被安排为提供主后置滤波信号(32)；

辅解码器(25)，连接至所述输入(40)，被安排为根据所述参数(4)来提供辅解码信号(44)；

组合器装置(55)，被安排为将所述主后置滤波信号(32)和基于所述辅解码信号的信号(53)组合为输出信号(6)；

所述输出信号(6)是所述主后置滤波信号(32)和基于所述辅解码信号的所述信号(53)的加权组合；以及

输出(60)，用于所述输出信号(6)，其连接至所述组合器装置(55)。

2.根据权利要求1所述的解码器设备，其中所述组合器装置(55)被安排为调整所述加权组合。

3.根据权利要求2所述的解码器设备，其中所述组合器装置(55)包括用于检测信号特性的装置(54)，并且其中响应于所述信号特性而执行所述调整。

4.根据权利要求3所述的解码器设备，其中用于检测信号特性的所述装置(54)被安排为：检测在所考虑的低频带中所述主解码信号(23)与所述辅解码信号(44)之间的相似性。

5.根据权利要求3所述的解码器设备，其中用于检测信号特性的所述装置(54)被安排为：检测部分接收到的比特流的任何可用性，所述部分接收到的比特流呈现与主解码信号(23)不同的辅解码信号(44)。

6.根据权利要求1至4中任一项所述的解码器设备，其中所述主后置滤波器(31)是长延迟后置滤波器(33)，其利用所述主解码信号(23)与所述辅解码信号(44)之间的延迟差。

7.根据权利要求1至6中任一项所述的解码器设备，其中所述辅解码器(25)是辅重构解码器(125)，继而包括辅增强解码器(45)，并且还连接至所述主解码器(21)的输出；

所述辅增强解码器(45)被安排为：根据所述参数(4)来提供辅解码增强信号(52)，并且

所述辅重构解码器(125)被安排为：根据所述辅解码增强信号(52)和所述主解码信号(23)来提供辅解码重构信号(144)。

8.根据权利要求7所述的解码器设备，其中基于所述辅解码信号的所述信号(53)是所述辅解码重构信号(144)。

9.根据权利要求7所述的解码器设备，还包括：辅后置滤波器(34)，其连接至所述辅重构解码器(25)的输出，并且被安排为提供辅后置滤波信号(35)，由此基于所述辅解码信号的所述信号(53)是所述辅后置滤波信号(35)。

10.根据权利要求1至6中任一项所述的解码器设备，其中，

所述组合器装置(55)还包括用于提取主后置滤波器增强信号(64)的装置，

由此所述组合器装置(55)被安排为：将所述主后置滤波器增强信号(64)和基于所述辅解码信号(44)的增强信号(69)组合为组合增强信号(65)；

所述组合增强信号(65)是所述主后置滤波器增强信号(64)和基于所述辅解码信号的所述增强信号(69)的加权组合，并且

所述组合器装置(55)还包括加法装置(62)，用于将基于所述组合增强信号(65)的信号加至基于所述主解码信号(23)的信号，以提供所述输出信号(6)。

11.根据权利要求10所述的解码器设备，其中，

所述组合器装置(55)还包括低通滤波器(61)和带通滤波器之一，将所述组合增强信号(65)滤波为经滤波的信号(66)，所述经滤波的信号(66)被用作基于所述组合增强信号(65)的所述信号。

12.根据权利要求10或11所述的解码器设备，其中，

所述辅解码器(25)是辅增强解码器(45)；

所述辅增强解码器(45)被安排为：根据所述参数(4)来提供辅解码增强信号(52)。

13.根据权利要求12所述的解码器设备，其中，

基于所述辅解码信号(69)的所述增强信号是所述辅解码增强信号(52)，并且

基于所述主解码信号(32)的所述信号是所述主解码信号的延迟版本(68)。

14.根据权利要求12所述的解码器设备，还包括：辅后置滤波器(34)，其连接至所述辅增强解码器(45)的输出，

由此基于所述辅解码信号的所述增强信号(69)是来自所述辅后置滤波器(35)的输出信号，并且其中，

基于所述主解码信号(23)的所述信号是所述主解码信号的延迟版本(68)。

15.根据权利要求10或11所述的解码器设备，其中所述辅解码器(25)是辅重构解码器(125)，继而包括辅增强解码器(45)，并且还连接至所述主解码器(21)的输出；

所述辅增强解码器(45)被安排为：根据所述参数(4)来提供辅解码增强信号(52)；

所述辅重构解码器(125)被安排为：根据所述辅解码增强信号(52)和所述主解码信号(23)来提供辅解码重构信号(144)；以及

辅后置滤波器(34)，连接至所述辅解码器(25)的输出，并且被安排为提供辅后置滤波信号(35)。

16.根据权利要求15所述的解码器设备，其中，

所述组合器装置(55)还包括：提取装置，用于提取将被用作基于所述辅解码信号(44)的所述增强信号(69)的辅后置滤波器增强信号(67)，并且

基于所述主解码信号的所述信号是所述辅解码重构信号(144)。

17.根据权利要求15所述的解码器设备，其中，

所述组合器装置(55)还包括：提取装置，用于将基于所述辅解码信号的所述增强信号(69)提取为所述辅后置滤波信号(35)与所述主解码信号的延迟版本(68)之间的差，并且

18.根据权利要求1至17中任一项所述的解码器设备，其中解码器设备(50)是可伸缩解码器设备。

19.一种用于对表示音频或语音的编码信号进行解码的方法，包括：

接收(210)编码信号的参数(4)；

将所述参数(4)主解码(220)为主解码信号(23)；

将所述主解码信号(23)主后置滤波(222)为主后置滤波信号(32)；

将所述参数辅解码(230)为辅解码信号(44)；

将所述主后置滤波信号(32)和基于所述辅解码信号(44)的信号(53)组合(240)为输出信号(6)；

所述输出信号(6)是所述主后置滤波信号(32)和基于所述辅解码信号(44)的所述信号(53)的加权组合；以及

输出(248)所述输出信号(6)。

20.根据权利要求19所述的方法，其中所述组合步骤(240)包括调整所述加权组合。

21.根据权利要求20所述的方法，其中所述组合步骤(240)包括检测信号特性，并且其中响应于所述检测的信号特性而执行所述调整。

22.根据权利要求21所述的方法，其中所述检测包括：检测在所考虑的低频带中所述主解码信号(23)与所述辅解码信号(44)之间的相似性。

23.根据权利要求21所述的方法，其中所述检测包括：检测部分接收到的比特流的任何可用性，所述部分接收到的比特流呈现与主解码信号(23)不同的辅解码信号(44)。

24.根据权利要求19至23中任一项所述的方法，其中所述主后置滤波步骤利用所述主解码信号(23)与所述辅解码信号(44)之间的延迟差。

25.根据权利要求19至24中任一项所述的方法，其中所述辅解码步骤(230)包括：将所述参数(4)辅增强解码(231)为辅解码增强信号(52)的步骤；以及根据所述辅解码增强信号(52)和所述主解码信号(23)来重构(232)将被用作所述辅解码信号(44)的辅解码重构信号(144)的步骤。

26.根据权利要求25所述的方法，其中基于所述辅解码信号(44)的所述信号(53)是所述辅解码重构信号(144)。

27.根据权利要求25所述的方法，还包括步骤：将所述辅解码重构信号(144)辅后置滤波(234)为辅后置滤波信号(35)，由此所述辅后置滤波信号(35)被用作基于所述辅解码信号(44)的所述信号(53)。

28.根据权利要求19至24中任一项所述的方法，其中所述组合步骤包括：

提取(241)主后置滤波器增强信号(64)；

将所述主后置滤波器增强信号(64)和基于所述辅解码信号(44)的增强信号(69)组合(243)为组合增强信号(65)；

所述组合增强信号(65)是所述主后置滤波器增强信号(64)和基于所述辅解码信号的所述增强信号(69)的加权组合；以及

将基于所述组合增强信号(65)的信号加至(245)基于所述主解码信号(23)的信号，以提供所述输出信号(6)。

29.根据权利要求28所述的方法，其中所述组合步骤(240)还包括：以低通滤波(244)和带通滤波中的至少一个将所述组合增强信号(65)滤波为经滤波的信号(66)，所述经滤波的信号(66)将被用作基于所述组合增强信号的所述信号。

30.根据权利要求28或29所述的方法，其中所述辅解码步骤(230)包括：将所述参数(4)辅增强解码(231)为将被用作所述辅解码信号(44)的辅解码增强信号(52)的步骤。

31.根据权利要求30所述的方法，还包括延迟所述主解码信号(23)的步骤；

由此所述辅解码增强信号(52)被用作基于所述辅解码信号(44)的所述增强信号(69)，并且

所述主解码信号(23)的所述延迟版本(68)被用作基于所述主解码信号(23)的所述信号。

32.根据权利要求30所述的方法，还包括以下步骤：

延迟所述主解码信号；以及

将所述辅解码增强信号(52)辅后置滤波为辅后置滤波增强信号；

由此所述辅后置滤波增强信号被用作基于所述辅解码增强信号的所述增强信号(69)，并且

33.根据权利要求28或29所述的方法，其中所述辅解码步骤(230)包括：将所述参数(4)辅增强解码(231)为辅解码增强信号(52)的步骤；以及根据所述辅解码增强信号(52)和所述主解码信号(23)来重构(232)将被用作所述辅解码信号(44)的辅解码重构信号(144)的步骤；所述方法还包括步骤：

将所述辅解码信号(44)辅后置滤波(234)为辅后置滤波信号(35)。

34.根据权利要求33所述的方法，其中所述组合步骤(240)包括：

提取(242)将被用作基于所述辅解码信号(44)的所述增强信号(69)的辅后置滤波器增强信号；以及

将所述辅解码重构信号(144)用作基于所述主解码信号(23)的所述信号。

35.根据权利要求33所述的方法，还包括以下步骤：

延迟所述主解码信号(23)；并且

其中所述组合步骤(240)包括：

将基于所述辅解码信号的所述增强信号(69)提取(242)为所述辅后置滤波信号与所述主解码信号(23)的所述延迟版本(68)之间的差，并且

由此所述主解码信号(23)的所述延迟版本(68)被用作基于所述主解码信号的所述信号。

36.根据权利要求19至35中任一项所述的方法，其中所述参数(4)是可伸缩编码器参数。