CN101809653A

CN101809653A - 用于处理音频信号的方法和装置

Info

Publication number: CN101809653A
Application number: CN200780100852A
Authority: CN
Inventors: T·利伯成
Original assignee: LG Electronics Inc
Current assignee: LG Electronics Inc
Priority date: 2007-12-06
Filing date: 2007-12-06
Publication date: 2010-08-18
Also published as: EP2215630A4; EP2215630A1; US8577485B2; US20100235172A1; JP2011507013A; EP2215630B1; WO2009072685A1

Abstract

一种用于处理音频信号的方法，包括：接收音频信号；并处理所接收的音频信号，其中根据一种方案处理音频信号，所述方案包括：将A+1层的至少两个块的大小信息与对应于A+1层至少两个块的A层块的大小信息进行比较；并且如果A+1层的至少两个块的大小信息小于A层块的大小信息，则将A+1层的至少两个块确定为最佳块。一种用于处理音频信号的方法，包括：接收音频信号；并处理所接收的音频信号，其中根据一种方案处理音频信号，所述方案包括：将A层块的大小信息与A+1层的至少两个块的大小信息进行比较；并且如果A层块的大小信息小于A+1层的至少两个块的大小信息，则将A层块确定为最佳块。

Description

用于处理音频信号的方法和装置

技术领域

本发明涉及用于处理音频信号的方法和装置，更具体地，涉及用于对音频信号进行编码的方法和装置。

背景技术

过去已通过许多不同方法实现音频信号的存储和重放。例如，已通过留声机技术(例如录音播放器)、磁技术(例如盒式磁带)和数字技术(例如光盘)记录和保存音乐和语音。随着音频存储技术发展，需要克服许多挑战以优化音频信号的质量和可存储性。

针对音乐信号的存档和宽带传输，无损再现正在成为在借助感知的压缩中比高效率更为重要的特征，在内容保持器和广播器中存在开放和通用的压缩方案的需求。响应这种需求，已考虑采用新的无损编码方案。无损音频编码由于原始信号的完美再现而允许没有任何质量损失地压缩数字音频数据。

公开内容

技术问题

然而，在无损音频编码方法中，编码花费太多时间，需要大量资源，并具有非常高的复杂度。

技术方案

因此，本发明针对从本质上避免由关联技术的局限和缺陷造成的一个或多个问题的用于处理音频信号的方法和装置。

本发明的一个目的是提供一种用于无损音频编码的方法和装置，所述方法和装置由于原始信号的完美再现而允许没有任何质量损失的数字音频数据压缩。

本发明的另一目的是提供一种用于无损音频编码的方法和装置，从而减少编码时间、计算资源和复杂度。

将在下面的说明书中阐明本发明的其它优点、目的和特征的一部分，而另一部分将在本领域内技术人员细阅下面内容后变得明暸或可从本发明的实践中获知。本发明的目的和其它优点将由书面说明及其权利要求书以及附图中具体指出的结构来实现和达成。

有益效果

本发明提供下列效果和优势。

首先，本发明能提供一种用于无损音频编码的方法和装置以减少编码时间、计算资源和复杂度。

其次，本发明能加快音频无损编码中的块切换过程。

再者，本发明能减少音频无损编码的长期预测过程中的复杂度和计算资源。

附图说明

包含以提供对本发明进一步的理解并构成本申请的一部分的附图示出本发明的实施例，并与说明书一起用来解释本发明的原理。在附图中：

图1是根据本发明的编码器1的示例性解说。

图2是根据本发明的解码器3的示例性解说。

图3是根据本发明的包含多个通道(例如M个通道)的经压缩音频信号的位流结构的示例性解说。

图4是根据本发明第一实施例的用于处理音频信号的块切换装置的示意性方框图。

图5是根据本发明的分层块分割方法的理念图的示例性解说。

图6是根据本发明的块分割的可变组合的示例性解说。

图7是解释根据本发明一个实施例的用于处理音频信号的块切换方法的理念的示例图。

图8是根据本发明一个实施例的用于处理音频信号的块切换方法的示例性流程图。

图9是解释根据本发明另一实施例的用于处理音频信号的方法的理念的示例图。

图10是根据本发明另一实施例的用于处理音频信号的块切换方法的示例流程图。

图11是根据本发明另一实施例变化形式的用于处理音频信号的块切换方法的示例性流程图。

图12是解释图11理念的示例图。

图13是根据本发明实施例的用于处理音频信号的长期预测装置的示例性方框图。

图14是根据本发明实施例的用于处理音频信号的长期预测方法的示例性流程图。

最佳方式

为了获得根据本发明意图的这些目的和其它优势，如本文中所体现和广泛说明的那样，一种处理音频信号的方法包括：接收音频信号；并处理所接收的音频信号，其中根据一种方案处理音频信号，所述方案包括：将A+1层的至少两个块的大小信息与对应于所述A+1层的至少两个块的A层块的大小信息进行比较；且如果所述A+1层的至少两个块的大小信息小于A层块的大小信息，则将所述A+1层的至少两个块确定为最佳块，其中音频信号可分割成具有分层结构的若干个层的块。

在本发明的另一方面中，用于处理音频信号的方法包括：接收音频信号；以及处理所接收的音频信号，其中根据一种方案处理音频信号，所述方案包括：将A+1层的至少两个块的大小信息与音频信号整个帧的A层块的大小信息进行比较；并且如果所述A+1层的至少两个块的全部大小信息小于与包含在该帧中的A+1层的至少两个块对应的A层块的大小信息，则将所述A+1层的至少两个块确定为最佳块。

在本发明的另一方面，一种用于处理音频信号的方法包括：接收音频信号；并处理所接收的音频信号，其中根据一种方案处理所述音频信号，所述方案包括：将A层块的大小信息与A+1层的至少两个块的大小信息进行比较；将A+1层块的大小信息与A+2层的至少两个块的大小信息进行比较；并且如果A层块的大小信息小于A+1层的至少两个块的大小信息以及A+2层的至少四个块的大小信息，则将A层的块确定为最佳块。

在本发明的另一方面，一种用于处理音频信号的方法，包括：接收音频信号；处理所接收的音频信号；其中根据一种方案处理音频信号，所述方案包括：将A层块的大小信息与A+1层的至少两个块的大小信息进行比较；并且如果A层块的大小信息小于A+1层的至少两个块的大小信息，则将A层块确定为最佳块。

在本发明的另一方面，一种用于处理音频信号的方法，包括：接收音频信号；以及处理所接收的音频信号；其中根据一种方案处理音频信号，所述方案包括：将A层块的大小信息与对应于音频信号整个帧的A层块的A+1层的至少两个块的大小信息进行比较；并且如果A层块的全部大小信息小于对应于包含在帧中的A层块的A+1层的至少两个块的大小信息，则将A层块确定为最佳块。

在本发明的另一方面，一种用于处理音频信号的装置，包括：最初比较部件，所述最初比较部件将A+1层的至少两个块的大小信息与对应于A+1层的至少两个块的A层块的大小信息进行比较；以及条件比较部件，如果A+1层的至少两个块的大小信息小于A层块的大小信息则所述条件比较部件将所述A+1层的至少两个块确定为最佳块，其中音频信号可分割成具有若干个层的块以形成分层结构。

在本发明的另一方面，一种用于处理音频信号的装置包括：接收音频信号；以及处理所接收的音频信号；其中根据一种方案处理音频信号，所述装置包括：最初比较部件，所述最初比较部件将A层块的大小信息与A+1层的至少两个块的大小信息进行比较；以及条件比较部件，如果A层块的大小信息小于A+1层的至少两个块的大小信息则所述条件比较部件将A层块确定为最佳块。在本发明的另一方面，一种用于处理音频信号的方法，包括：接收音频信号；以及处理所接收的音频信号；其中根据一种方案处理音频信号，所述方案包括：将A+1层的至少两个块的大小信息与对应于A+1层至少两个块的A层块的大小信息进行比较；如果A+1层的至少两个块的大小信息小于A层块的大小信息，则将A+1层的至少两个块确定为最佳块；并基于包含最佳块的音频信号的自相关函数值确定滞后信息；以及基于滞后信息估计长期预测滤波器信息。在本发明的另一方面，用于处理音频信号的装置包括：最初比较部件，所述最初比较部件将A+1层的至少两个块的大小信息与对应于A+1层的至少两个块的A层块的大小信息进行比较；条件比较部件，如果A+1层的至少两个块的大小信息小于A层块的大小信息则所述条件比较部件将A+1层的至少两个块确定为最佳块；滞后信息确定部件，所述滞后信息确定部件基于包含最佳块的音频信号的自相关函数值确定滞后信息；以及滤波器信息估计部件，所述滤波器信息估计部件基于滞后信息估计长期预测滤波器信息。

要理解，本发明前面的一般说明和接下来的详细说明是示例性和阐述性的，并旨在提供本发明如权利要求书所述的进一步说明。

发明模式

现在详细参见本发明的较佳实施例，在附图中示出其实例。尽可能，在全部附图中用相同的附图标记来表示相同或相似的部件。

在开始本发明的描述前，要注意本发明公开的多数术语对应于业内公知的一般术语，但申请人已根据需要选择一些术语，并在本发明下面的描述中公开。因此，基于本发明所赋予的含义来理解由申请人定义的术语是较佳的。

在无损音频编码方法中，由于编码过程是完全可逆的而没有数据损失，可以确定性方式实现编码器和解码器两者的若干部件。

编解码器的结构

图1是根据本发明的编码器1的示例图。参见图1，块切换部件110可配置成将输入的音频信号分割成帧。可作为广播或在数字介质上接收该输入的音频信号。在一个帧内，可以有多个通道。每个通道可进一步分割成音频采样块以供进一步处理。

缓冲器120可配置成存储块和/或通过块切换部件110分割的帧采样。系数估计部件130可配置成估计每个块的系数值的最佳集。可适应地选择系数的数目，即预测器的次项。在操作中，系数估计部件130对数字音频块计算一组PARCOR(部分自相关)(下文中称其为“PARCOR”)值。PARCOR值指示预测器系数的PARCOR表征。之后，可以配置量化部件140，以对从系数估计部件130获取的PARCOR值的组进行量化。

第一熵编码部件150可配置成通过从PARCOR值减去偏置值而计算PARCOR残值，并使用由熵参数定义的熵代码对PARCOR残值进行编码。这里，从一优化表选择偏置值和熵参数选，基于数字音频块的采样速率自多个表选择该优化表。可针对供传输的优化压缩数字音频数据的多个采样速率范围预定义所述多个表。

系数转换部件160可配置成将经量化的PARCOR值转换成线性预测编码(LPC)系数。另外，短期预测器170可配置成使用线性预测编码系数从存储在缓冲器120中的之前原始采样估计当前预测值。

此外，第一减法器180可配置成使用存储在缓冲器120中的数字音频数据的原始值和在短期预测器170中估计的预测值来计算数字音频块的预测残值。长期预测器190可配置成估计滞后信息τ和LTP滤波器信息γ_j，并设定指示是否执行长期预测的标志信息，并使用滞后信息和LTP滤波器信息来产生长期预测值e^(n)。

可配置第二减法器200，以在长期预测后，使用当前预测值e(n)和长期预测值e^(n)来估计新残值e～(n)。在图13和图14中阐述长期预测器190和第二减法器200的细节。

第二熵编码部件210配置成使用不同的熵代码对预测残值编码并产生代码索引。所选代码的索引作为副(或辅助)信息传输。

预测残值的第二熵编码部件210提供具有不同复杂度的两种可选编码技术。一种是Golomb-Rice编码(在下文中简称为“Rice代码”)方法，而另一种是Block Gilbert-Moore代码(在下文中简称为“BGMC”)方法。除了复杂性低却仍然高效率的Rice代码，BGMC算术编码方案以略为增加复杂度为代价而提供好得多的压缩性。

最后，多路复用部件220可配置成对经编码的预测残值、代码索引、经编码的PARCOR残值以及其它附加信息进行多路复用以形成压缩的位流。编码器1还提供循环冗余校验(CRC)检查，提供其主要为了使解码器校验经解码的数据。在编码器侧，CRC可用来确保经压缩的数据是可无损解码的。换句话说，CRC可用来对经压缩的数据无损地解码。

附加编码选项包括灵活块切换方案、随机存取以及联合通道编码。编码器1可使用这些选项中任意项来提供若干具有不同复杂度的压缩等级。联合通道编码用来利用立体声通道或多通道信号之间的从属性。这可通过对区段中两个通道之间的差异予以编码而获得，其中可比原始通道中的一个更有效地对这种差异进行编码。

图2是根据本发明的解码器3的示例图。更具体地说，图2示出由于不执行适应而复杂度明显低于编码器的无损音频信号解码器。

多路分解部件310可配置成通过广播或在数字介质上接收音频信号并将数字音频块的编码预测残值、代码索引、经编码的PARCOR残值以及其它附加信息多路分解。

第一熵解码部件320可配置成使用由熵参数定义的熵代码对PARCOR残值进行解码，并通过将经解码的PARCOR残值加上偏置值而计算一组PARCOR值。这里，偏置值和熵参数选自一个表，基于数字音频块的采样速率由编码器从多个表中选择该表。

第二熵解码部件330可配置成使用代码索引对经多路分解的编码预测残值进行解码。长期预测器340可配置成使用滞后信息和LPT滤波器信息估计长期预测器。此外，第一加法器350可配置成使用长期预测值e^(n)和残值e～(n)来计算短期LPC残值e(n)。

系数转换部件360可配置成将熵解码的PARCOR值转换成LPC系数。此外，短期预测器370可配置成使用LPC系数估计数字音频块的预测残值。第二加法器380则配置成使用短期LPC残值e(n)和短期预测器来计算数字音频数据的预测。最后，组装部件390配置成将经解码的块组装成帧数据。

如所讨论的那样，解码器3可配置成对经编码的预测残值和PARCOR残值进行解码，将PARCOR残值转换成LPC系数，并采用逆预测滤波器计算无损再现信号。解码器3的计算能力取决于编码器1所选择的预测次项。在多数情形下，即使在低端***中实时解码也是可能的。

图3是根据本发明的包含多个通道(例如M个通道)的经压缩音频信号的位流结构的示例图。

位流由至少一个音频帧构成，该音频帧包括多个通道(例如M个通道)。使用根据本发明的块切换方案将每个通道分割成多个块，这将在下文中详细说明。每个分割的块具有不同的大小并包括根据图1的编码数据。例如，经分割的块中的编码数据包含代码索引、预测次项K、预测器系数以及编码的残值。如果在成对通道之间采用联合编码，则两个通道的块分割是相同的，并且以交织方式存储块。要不，每个通道的块分割是独立的。

在下文中，将结合下面的附图对数据切换和长期预测予以详细说明。

块切换

图4是根据本发明实施例的用于处理音频信号的块切换装置的示例方框图。如图4所示，用于处理音频的装置包括块切换部件110和缓冲器120。更具体地，分割部件110包括分割部件110a、最初比较部件110b以及条件比较部件110c。分割部件110a配置成将帧的每个通道分割成多个块，并与之前结合图1提到的切换部件110相同。此外，用于存储通过块切换部件110选择的块分割的缓冲器120类似于之前结合图1提到的缓冲器120。

分割部件110a、最初比较部件110b和条件比较部件110c的细节和过程被称为“自底向顶方法”和/或“自顶向底方法”。

首先，分割部件110a可配置成将每个通道分层次地分割成多个块。图5是根据本发明的分层次块分割方法的理念图的示例性解说。

图5示出将一个帧分层次地分割成2至32个块(例如2、4、8、16和32)的方法。当在一个帧中提供多个通道时，每个通道能分成(或分割成)多达32个块。如图所示，每个通道的经分割块构成一个帧。例如，对于层＝5，将一个帧分成32个块。此外，如前所述，可在经分割的块单元中执行预测和熵编码。

图6是示出根据本发明的分割块的多种组合的示例图。如图6所示，可在一个帧中形成块任意组合的分割N_B＝N、N/2、N/4、N/8、N/16和N/32，只要每个块是通过双倍长度的高级块的分割形成的。即，最高层块长度等于最底层块长度的32倍。

例如，如图5的示例所示，可将一个帧分割成N/4+N/4+N/2，然而无法将一个帧分割成N/4+N/2+N/4(例如图6所示的(e)和(f))。块分割方法关联于选择适当块分割的过程。在下文中，根据本发明的块分割方法被称为“自底向顶方法”以及“自顶向底方法”。

自底向顶方法

图7是根据本发明实施例的解释用于处理音频信号的块切换方法的理念的示例图。图8是根据本发明实施例的用于处理音频信号的块切换方法的示例性流程图。

参见图7，对于六个层中的每一个，a＝0……5，将N采样的音频帧分成长度N_B＝N/B＝N/2^a的B＝2^a个块。这里，认为层a＝0是最高层或顶层，而认为层a＝5是最低层或底层。此外，对于自底向顶方法，第一块对应于最低层，第二块对应于最低层之上的下一个较高层(a＝4)，第三块对应于第二块之上的下一个较高层(a＝3)，以此类推。在一些情形中，第一块、第二块和第三块可应用于层a＝4至层a＝2、层a＝3至层a＝1或层a＝2至层a＝0的块。

对一个层(或在同一层中)的所有块全部进行编码，并且经编码的块通过其各自的大小S(以位为单位)临时存储在一起。大小S对应于编码结果、位大小和编码的数据块中的一个。对每个层进行编码，从而对每个层中的每个块形成值S(a，b)，b＝0……B-1。在一些情形中，不需要对要跳过的块进行编码。

然后，从最低层a＝5开始，可将两相邻的块与较高层a＝4的至少一个块进行比较。也就是说，将层a＝5的两相邻块的位大小与相应块的位大小比较以确定哪些块需要更少的位大小。这里，相应块指就分割的长度/持续时间而言的块大小。例如，最低层a＝5的最初两个相邻块(从左面开始)对应于第二最低层a＝4的最初块(从左面开始)。

参见图4和图8，最初比较部件110b将两个第一块(底层)的位大小与第二块的位大小进行比较(S110)。两个第一块的位大小可以等于一个第一块和另一个第一块的大小之和。在底层是a＝5的情形下，步骤S110中的比较表示为下面的等式1。

等式1

S(5，2b)+S(5，2b+1)≥S(4，b)

如果两个第一块的位大小小于第二块的位大小(步骤S110中判定为“否”)，则最初比较部件110b选择最低层的两个第一块(S120)。换句话说，将这两个第一块存储在缓冲器120中，并且不将第二块存储在缓冲器120中，并且在步骤S120中将其从临时工作的缓冲器中删除，这是由于就位速率而言相比第二块没什么提高。在步骤S120后，停止比较和选择，并对下一层的相应块不再执行比较和选择。

或者，如果两个第一块的位大小等于或大于第二块的位大小(步骤S110中判定为“是”)，则条件比较部件110c将两个第二块的位大小与第三块的位大小进行比较(S130)。在一些情形下，在步骤S110中，如果两个第一块的位大小中的至少一个小于第二块的位大小，则执行步骤S130，所述第二块与一个层的所有块(b＝0……B)中的两个第一块对应。这种修正的条件可应用于下面的步骤S150和S170。如果两个第二块的位大小小于第三块的位大小(步骤S130中判定为“否”)，则条件比较部件110c选择两个第二块(S140)。在步骤S140中，层4的长块代替了来自层5的两个短块。在步骤S140后，比较和选择处理中止。

与步骤S130和S140类似，执行层a＝3的第三块和层a＝2的第四块的比较(S150)，并基于比较结果执行选择(S160)。一般来说，条件比较部件110c仅当两个第i个块(层a＝a+1)的位大小等于或大于第i+1个块(层a＝a)的位尺寸时才将两个第i块的位大小与第i+1块的位大小进行比较(S170)，并根据比较结果选择合适的块或对下一层进行比较(S180)。步骤S170表示为下面的等式2。可重复步骤S170直到到达最高层(a＝0)为止。

等式2

S(a+1，2b)+S(a+1，2b+1)≥S(a，b)

其中a＝0……5，b＝0……B-1，

“a+1”对应于第i个块的层，“a”对应于第i+1个块的层。

再次参见图7，以暗灰色示出可选择为合用块的块，以亮灰色示出无法从进一步合并中获益的块，而以白色示出必须处理的块。另外，以灰色(或半透明)示出不需要的或不使用的块，这表示可省去比较过程。从层a＝3至层a＝1不存在进步，因此不需要处理较高层a＝1和a＝0。最后，选择层a＝3的块为b＝0……7，选择层a＝4的块为b＝8……15，……，选择层a＝5的块为b＝20-21，省去其余的。

可通过下面的C类伪代码1来实现步骤S110至步骤S180，但这并不对本发明构成限制。具体地说，根据上面提到的修正条件实现伪代码1。

伪代码1

for(a＝5；a＜＝0；a-){//for all levels

B＝1＜＜a； //block length in level a

for(b＝0；b＜B；b++){//fbr all blocks

size[a][b]＝EncodeBlock(x+b＊B，buf[a][b])；//encode block and store in buf

}

if(a＜5){ //if not lowest level

improved＝0；

for(b＝0；b＜B；b++){//compare size of current block with size of two blocks in

level a+1

if(size[a][b]＞size[a+1][2*b]+size[a+1][2＊b+1]){//copy two short blocks from

level a+1 into the long block of level a

memcpy(buf[a][b]，buf[a+1][2＊b]，size[a+1][2＊b])；

memcpy(buf[a][b]+size[a+1][2＊b]，buf[a+1][2＊b+1]，size[a+1][2＊b+1])；

size[a][b]＝size[a+1][2＊b]+size[a+1][2＊b+1]； //update size of new

longblock

}

else

improved＝1；//improvement by longer blocks

}

if(limproved)

break；//stop iteration atlevel a

}

自顶向底方法

图9是根据本发明另一实施例的解释用于处理音频信号的块切换方法的理念的示例图。图10是根据本发明另一实施例的用于处理音频信号的块切换方法的示例流程图。参见图9，与自底向顶方法相同，对于六个层a＝0……5的每一层，将N个采样的音频帧分成长度N_B＝N/B＝N/2^a的B＝2^a个块。对照自底向顶方法，对自顶向底方法来说，第一块对应于最高层(a＝0)，第二块对应于最高层的下一层(a＝1)，第三块对应于第二块的下一层(a＝2)，但这并不对本发明构成限制。在一些情形中，第一块、第二块和第三块可应用于层a＝1至层a＝3、层a＝2至层a＝4或层a＝3至层a＝5的块。

自顶向底方法类似于自底向顶方法，即在下一层不导致进步的点处中止搜索，除了在顶层(a＝0)处开始并且朝向较低层进行之外。在每个层“a”处，将一个块的大小与下一层a+1的两相应块进行比较。如果这两个短块需要更少的位数，则替换(即虚拟分割)较长的层“a”块，并且算法前进至层a+1。否则，如果长块需要较少的位，则适应中止在更低的层。

参见图4和图10，最初比较部件110b将(顶层的)第一块的位大小与两个第二块的位大小进行比较(S210)。两个第二块的位大小可等于一个第二块的大小和另一第二块的大小之和。在顶层为a＝0的情形下，将步骤S210中的比较表示为下面的等式3。

等式3

S(0，b/2)≥S(1，b)+S(1，b+1)

与前面的步骤S120相同，如果第一块的位大小小于两个第二块的位大小(步骤S110中判定为“否”)，则最初比较部件110b选择两个最高层的第一块(S220)。否则，如果第一块的位大小等于或大于两个第二块的位大小(步骤S110中判定为“是”)，则条件比较部件110c将第二块的位大小与两个第三块的位大小进行比较(S230)。在一些情形下，在步骤S210，如果第一块中的至少一个的位大小小于与一个层的全部块(b＝0……B)中的第一块对应的两个第二块的位大小，则执行步骤S230。这种修正条件可适用于下面的步骤S250和S270。与步骤S140至步骤S180相同，执行步骤S240至步骤S280。表示步骤S270为下面的等式4。可重复步骤S270直到到达最低层(a＝5)为止。

等式4

S(a-1，b/2)≥S(a，b)+S(a，b+1)

其中a＝0……5，b＝0……B-1，

“a-1”对应于第i个块的层，“a”对应于第i+1个块的层。

通过下面C类伪代码2实现步骤S210至步骤S280，但这并不对本发明构成限制。

伪代码1

for(a＝0；a＜＝5；a++){ //for all levels

pbuf＝buf[0][0]； //pointer to target buffer

B＝1＜＜a； //block length in levela

for(b＝0；b＜B；b++){ //forall blocks

if(lskip[a][b]) //if block can not be skipped

size[a][b]＝EncodeBlock(x+b＊B，buf[a][b])；//encode block and store in buf

}

if(a＞0){ //if not highest level

for(b＝0；b＜B；b+＝2){

if(lskip[a][b]){//compare size of two current blocks with size of one block in level a-1

if(size[a-1][b/2]＞size[a][b]+size[a][b+1]){//copy two short blocks from current level a into

target buffer

memcpy(pbuf，buf[a][b]，size[a][b])；

memcpy(pbuf+size[a][b]，buf[a][+1]，size[a][b+1])；

pbuf+＝size[a][b]+size[a][b+1]；//increment target buffer

}

else{

pbuf+＝size[a-1][b/2]；//increment target buffer

//all subordinate shorter blocks in lower levels can be skipped

for(aa＝a+1；aa＜＝5；aa++)//for all lower levels

for(bb＝(aa-a)＊2＊b；bb＜(aa-a)＊2＊(b+1)；b++)//for all subordinate blocks

skip[aa][bb]＝1；//set skipping flag

}

else

pbuf+＝GetSkippedSize0；//increment target buffer(add size of skipped

blocks)

}

图11是根据本发明另一实施例的变化形式的用于处理音频信号的块切换方法的示例流程图，而图12是用于解释图11理念的示例图。具体地说，另一实施例的变化形式对应于扩展的自顶向底方法，该方法只有在块对两个层而不是对一个层没有进步时停止。这是与前面参照图10描述的自顶向底方法的主要区别，如果块仅对一个层不进步，图10的方法就会停止。

参见图4和图11，最初比较部件110b，如步骤S210那样，将(在顶层的)第一块的位大小与第二块的位大小进行比较(S310)。不管步骤S310的比较结果如何，最初比较部件110b将第二块的位大小与第三块的位大小进行比较(S320和S370)。如果第一块的位大小小于第二块的位大小(S310中判定为“否”)，并且第二块的位大小小于两个第三块的位大小(S320中判定为“否”)(参见图12中的“情形E”和“情形F”)，即第一块比第二块和第三块更为有益，则最初比较部件110b选择第一块作为最佳块(S330)，并且停止下一层的比较(参见图12中的“情形F”，特别要注意五角星)。否则，如果第二块的位大小等于或大于第三块的位大小(步骤S320中判定为“是”)，则最初比较部件110b基于第一块和和第三块的比较结果确定是选择第一块还是在下一层进行比较。具体地说，如果第一块比第三块更为有益(步骤S340中判定为“否”)，则最初比较部件110b选择第一块(S350)(参见图12中的“情形E”，特别要注意五角星)。否则(在步骤S340判定为“是”)，条件比较部件110c将第三块与第四块比较，并将第四块与第五块比较，然后从第三块、第四块和第五块选择最有利的块(S360)(参见图12中的“情形D”)。

同时，如果第二块的位大小等于或大于两个第三块的位大小(步骤S320中判定为“是”)，而第一块的位大小等于或大于第二块的位大小(步骤S310中判定为“是”)，并且如果第二块的位大小小于第三块(步骤S370中判定为“否”)(参见图12中的“情形B”和“情形C”)，则条件比较部件110c暂时选择第二块(参见“情形B”和“情形C”中的四角星)，并在下一层进行比较(S380)。否则，第三块小于第一块和第二块(S370中判定为“是”)(参见图12中的“情形A”)，条件比较部件110c暂时选择第三块(参见“情形A”中的四角星)，并将第三块与第四块以及第四块与第五块进行比较。

长期预测(LTP)

大多数音频信号具有源自基本频率或音乐仪器基调的谐波或周期分量。由于要求非常高的次项，短期前向适应预测器难以去除这些有距离样本相关性，从而导致不理想的副信息量。为了更有效地利用有距离样本之间的相关性，可执行长期预测。

图13是根据本发明实施例的用于处理音频信号的长期预测装置的示例性方框图，而图14是根据本发明实施例的用于处理音频信号的长期预测方法的示例性流程图。参见图13，长期预测器190包括滞后信息确定部件190a、滤波器信息估计部件190b以及决策部件190c，长期预测器190使用输入的短期残值e(n)产生长期预测值e^(n)。简言之，可根据下面的等式5计算长期预测值e^(n)和长期残值e～(n)，但这并不对本发明构成限制。

等式5

\tilde{e} (n) = e (n) - \hat{e} (n) = e (n) - Σ_{j = - 2}^{2} γ_{j} \cdot e (n - τ - j)

其中τ表示样本滞后，γ_j表示经量化的LTP滤波器系数，而e～(n)表示长期预测后的新残值。结合图13、图14说明长期预测处理。

参见图13和图14，长期预测器190跳过下面输入信号的归一化(S410)。

等式6

e_{norm} (n) = e (n) \cdot \frac{\sqrt{| e (n) |}}{1 + 5 \cdot \sqrt{\overset{&OverBar;}{| e (n) |}}},

其中|e(n)|是绝对值的算术平均数。如果省去输入值的归一化，则可减低长期预测复杂度。然而，如果采用随机存取，则归一化仍然有用，以避免非最佳压缩。

然后，滞后信息确定部件190a使用自相关函数确定滞后信息τ(S420)。使用下面等式7计算自相关函数(ACF)。

等式7

r_{ee} (τ) = Σ_{n = 0}^{N - 1} e (n) \cdot e (n - τ), forτ = K + 1 . . . K + τ_{\max}

其中K为短期预测次项，而Δτ_max是最大相对滞后，其中Δτ_max＝256(例如对于48kHz音频素材)、512(例如96kHz)或1024(例如192kHz)，这取决于采样速率。最后，使用最大绝对ACF值max|r_ee(τ)|的位置作为最佳滞后τ。此外，可以使用应用FFT(快速傅立叶变换)的快速ACF算法来代替直接ACF计算。如果在类似FFT的频域执行ACF算法，则可减小编码时间和复杂度。

然后，滤波器信息估计部件190b基于稳态使用Wiener-Hopf等式估计滤波器信息γ_j(S430)。Wiener-Hopf等式的非稳态形式是等式8。

等式8

[\begin{matrix} r (τ - 2,0) \\ r (τ - 1,0) \\ r (τ, 0) \\ r (τ + 1,0) \\ r (τ + 2,0) \end{matrix}] = [\begin{matrix} r (τ - 2, τ - 2) & r (τ - 2, τ - 1) & r (τ - 2, τ) & r (τ - 2, τ + 1) & r (τ - 2, τ + 2) \\ r (τ - 1, τ - 2) & r (τ - 1, τ - 1) & r (τ - 1, τ) & r (τ - 1, τ + 1) & r (τ - 1, τ + 2) \\ r (τ, τ - 2) & r (τ, τ - 1) & r (τ, τ) & r (τ, τ + 1) & r (τ + 1, τ + 2) \\ r (τ + 1, τ - 2) & r (τ + 1, τ - 1) & r (τ + 1, τ) & r (τ + 1, τ + 1) & r (τ + 1, τ + 2) \\ r (τ + 2, τ - 2) & r (τ + 2, τ - 1) & r (τ + 2, τ) & r (τ + 2, τ + 1) & r (τ + 2, τ + 2) \end{matrix}] \cdot [\begin{matrix} γ_{- 2} \\ γ_{- 1} \\ γ_{0} \\ γ_{1} \\ γ_{2} \end{matrix}]

因此，计算得到对于j，k＝-2……2的ACF值r_ee(τ+j，0)和r_ee(τ+j，τ+k)。由于该矩阵是对称的，因此只计算右上方的三角形(15个值)。然而，由于假设非稳态形式，因此无法再次使用在最佳滞后搜索期间计算得到的稳态r_ee(τ)值。

同时，如果是稳态的，即r(j，k)＝r(j-k)，则因此可应用Wiener-Hopf的稳态形式：

等式9

[\begin{matrix} r (τ - 2) \\ r (τ - 1) \\ r (τ) \\ r (τ + 1) \\ r (τ + 2) \end{matrix}] = [\begin{matrix} r (0) & r (1) & r (2) & r (3) & r (4) \\ r (1) & r (0) & r (1) & r (2) & r (3) \\ r (2) & r (1) & r (0) & r (1) & r (2) \\ r (3) & r (2) & r (1) & r (0) & r (1) \\ r (4) & r (3) & r (2) & r (1) & r (0) \end{matrix}] \cdot [\begin{matrix} γ_{- 2} \\ γ_{- 1} \\ γ_{0} \\ γ_{1} \\ γ_{2} \end{matrix}]

如果将直接ACF用于确定最佳滞后，则仅计算r_ee(K+1……K+τ_max)。相比而言，总是使用FFT的快速ACF计算r_ee(0……N-1)。因此，不一定要再次计算在稳态Wiener-Hopf等式中要求的值r(0……4)和r(τ-2……τ+2)，而是简单地从步骤S420中已对滞后搜索完成的快速ACF的结果中取得。

决策部件190c使用步骤S420中确定的滞后信息τ以及步骤S430中估计得到的滤波器信息γ_j来产生长期预测值e^(n)。

然后，决策部件190c在对音频信号编码前计算音频信号的位速率(S450)。换句话说，决策部件190c计算短期残值e(n)和长期残值e～(n)实际上未编码的位速率。具体地说，在计算Rice编码位速率的情形下，决策部件190c可借助函数GetRicePara()来确定残值e(n)、e～(n)的最佳代码参数，并借助函数GetRiceBits()来计算必要位数，以对通过代码参数定义的残值e(n)、e～(n)进行编码，但这并不对本发明构成限制。

决策部件190c基于步骤S450中计算的位速率来判断长期预测是否有益(S460)。根据步骤S460的判断，如果长期预测是无益的(步骤S460中判定为“否”)，则不执行长期预测，并使进程终止。相反，如果长期预测是有益的(步骤S460中判定为“是”)，则决策部件190c确定使用长期预测并输出长期预测值(S470)。此外，决策部件190c可将滞后信息τ和滤波器信息γ_j编码为副信息，并设定指示是否执行长期预测的标志信息。

本领域内技术人员应当理解，可对本发明作出多种修正和变化而不脱离本发明的精神或范围。因此，本发明旨在覆盖发明的所有修正和变化，假设它们落在所附权利要求书及其等效物的范围内。

工业应用

因此，本发明适用于音频无损(ALS)编码和解码。

Claims

1.一种用于处理音频信号的方法，包括：

接收音频信号；以及

处理所接收的音频信号；

其中根据方案处理所述音频信号，所述方案包括：将至少两个A+1层块的大小信息与对应于所述至少两个A+1层块的A层块的大小信息进行比较；且

如果所述至少两个A+1层块的大小信息小于所述A层块的大小信息，则将所述至少两个A+1层块确定为最佳块。

2.如权利要求1所述的方法，其特征在于，所述大小信息对应于编码结果、位大小和编码的数据块其中之一。

3.如权利要求1所述的方法，其特征在于，所述A层块对应于至少两个A+1层块的组合。

4.如权利要求3所述的方法，其特征在于，分层结构具有至少两个层，并且最高层的块长度对应于最低层的块长度的整数倍。

5.如权利要求4所述的方法，其特征在于，所述分层结构具有六个层，并且所述最高层的块长度对应于最低层的块长度的32倍。

6.如权利要求1所述的方法，其特征在于，至少两个A+1层块的大小信息对应于一个A+1层块的大小和下一个A+1层块的大小之和。

7.如权利要求1所述的方法，其特征在于，还包括：

如果所述至少两个A+1层块的大小信息大于所述A层块的大小信息，则将至少A层块的大小信息与A-1层块的大小信息进行比较。

8.如权利要求7所述的方法，其特征在于，还包括：

如果所述至少两个A层块的大小信息小于A-1层块的大小信息，则将所述至少两个A层块确定为最佳块。

9.如权利要求1所述的方法，其特征在于，作为广播信号接收所述音频信号。

10.如权利要求1所述的方法，其特征在于，还包括：

在数字介质上接收所述音频信号。

11.一种用于处理音频信号的方法，包括：

接收音频信号；以及

处理所接收的音频信号，

其中根据方案处理所述音频信号，所述方案包括：

将A层块的大小信息与至少两个A+1层块的大小信息进行比较；以及

如果所述A层块的大小信息小于所述至少两个A+1层块的大小信息，则将所述A层块确定为最佳块。

12.如权利要求11所述的方法，其特征在于，所述A层块对应于至少两个A+1层块的组合。

13.如权利要求11所述的方法，其特征在于，作为广播信号接收所述音频信号。

14.如权利要求11所述的方法，其特征在于，还包括：

在数字介质上接收所述音频信号。

15.一种用于处理音频信号的方法，包括：

接收音频信号；以及

处理所接收的音频信号；

其中根据方案处理所述音频信号，所述方案包括：

将A层块的大小信息与至少两个A+1层块的大小信息进行比较；

将A+1层块的大小信息与至少两个A+2层块的大小信息进行比较；以及

如果所述A层块的大小信息小于所述至少两个A+1层块的大小信息以及所述至少四个A+2层块的大小信息，则将所述A层块确定为最佳块。

16.一种用于处理音频信号的方法，包括：

接收音频信号；

处理所接收的音频信号；

其中根据方案处理所述音频信号，所述方案包括：

在所述音频信号的整个帧上，将A层块的大小信息与对应于所述A层块的至少两个A+1层块的大小信息进行比较；并且

如果所述帧中所包括的A层块的所有大小信息都小于与所述A层块对应的所述至少两个A+1层块的大小信息，则将A层块确定为最佳块。

17.一种其上存储有指令的计算机可读介质，所述指令使处理器执行操作，所述操作包括：

将至少两个A+1层块的大小信息与对应于所述至少两个A+1层个块的A层块的大小信息进行比较；以及

18.一种其上存储有指令的计算机可读介质，所述指令使处理器执行操作，所述操作包括：

19.一种用于处理音频信号的装置，包括：

最初比较部件，所述最初比较部件将至少两个A+1层块的大小信息与对应于所述至少两个A+1层块的A层块的大小信息进行比较；以及

条件比较部件，如果所述至少两个A+1层块的大小信息小于所述A层块的大小信息，则所述条件比较部件将所述至少两个A+1层块确定为最佳块。

20.一种用于处理音频信号的装置，包括：

最初比较部件，所述最初比较部件将A层块的大小信息与至少两个A+1层块的大小信息进行比较；以及

条件比较部件，如果所述A层块的大小信息小于所述至少两个A+1层块的大小信息，则所述条件比较部件将所述A层块确定为最佳块。

21.一种用于处理音频信号的方法，包括：

将至少两个A+1层块的大小信息与对应于所述至少两个A+1层块的A层块的大小信息进行比较；以及

22.一种用于处理音频信号的方法，包括：

23.一种用于处理音频信号的方法，包括：

接收音频信号；

处理所接收的音频信号；

其中根据方案处理所述音频信号，所述方案包括：

将至少两个A+1层块的大小信息与对应于所述至少两个A+1层块的A层块的大小信息进行比较；

如果所述至少两个A+1层块的大小信息小于所述A层块的大小信息，则将所述至少两个A+1层块确定为最佳块；

基于包含所述最佳块的音频信号的自相关函数来确定滞后信息；以及

基于所述滞后信息估计长期预测滤波器信息。

24.如权利要求23所述的方法，其特征在于，还包括：

在对所述音频信号进行编码前估计所述音频信号的位速率。

25.如权利要求24所述的方法，其特征在于，还包括：

基于所估计的位速率将所述滞后信息和所述长期预测滤波器信息编码为副信息。

26.如权利要求23所述的方法，其特征在于，还包括：

计算所述音频信号在频域中的自相关函数。

27.如权利要求23所述的方法，其特征在于，基于稳态进行估计长期预测滤波器信息的操作。

28.如权利要求27所述的方法，其特征在于，使用自相关函数来执行估计长期预测滤波器信息的操作。

29.如权利要求23所述的方法，其特征在于，所述音频信号对应于归一化前的音频信号。

30.如权利要求23所述的方法，其特征在于，所述音频信号是作为广播信号来接收的。

31.如权利要求23所述的方法，其特征在于，还包括：

在数字介质上接收所述音频信号。

32.一种其上存储有指令的计算机可读介质，所述指令使处理器执行操作，所述操作包括：

基于包含最佳块的音频信号的自相关函数确定滞后信息；以及

基于所述滞后信息估计长期预测滤波器信息。

33.一种用于处理音频信号的装置，包括：

最初比较部件，所述最初比较部件将至少两个A+1层块的大小信息与对应于所述至少两个A+1层块的A层块的大小信息进行比较；

条件比较部件，如果所述至少两个A+1层块的大小信息小于所述A层块的大小信息，则所述条件比较部件将所述至少两个A+1层块确定为最佳块；

滞后信息确定部件，所述滞后信息确定部件基于包含最佳块的音频信号的自相关函数确定滞后信息；以及

滤波器信息估计部件，所述滤波器信息估计部件基于所述滞后信息估计长期预测滤波器信息。

34.一种用于处理音频信号的方法，包括：

基于所述滞后信息估计长期预测滤波器信息。