CN103107863B

CN103107863B - 一种分段平均码率的数字音频信源编码方法及装置

Info

Publication number: CN103107863B
Application number: CN201310027238.9A
Authority: CN
Inventors: 闫建新
Original assignee: Shenzhen Rising Source Technology Co ltd
Current assignee: Guangdong Guangsheng Research And Development Institute Co ltd
Priority date: 2013-01-22
Filing date: 2013-01-22
Publication date: 2016-01-20
Anticipated expiration: 2033-01-22
Also published as: CN103107863A

Abstract

本发明涉及一种分段平均码率的数字音频信源编码方法及装置。所述方法包括：S1、根据数字音频广播***的信道编码和调制参数信息确定一个传输帧内包含的音频编码帧的帧数N；S2、根据数字音频广播***的信道编码和调制参数信息确定一个传输帧内包含的信道编码块的总块数；S3、根据数字音频广播***的信道编码和调制参数信息确定一个信道编码块中信源编码数据的字节数；S4、计算一个传输帧内包含的N个音频编码帧的总字节数；S5、对一个传输帧时间内连续输入的N帧音频数据进行压缩编码，基于步骤S4计算出的总字节数在N个音频编码帧间自适应地分配每个音频编码帧的字节数。本发明能在一个传输帧内获得局部最佳压缩，从而改进编码效率。

Description

一种分段平均码率的数字音频信源编码方法及装置

技术领域

本发明涉及数字音频广播***的数字音频信源编码技术，更具体地说，本发明涉及一种在考虑了数字音频广播***中信道编码及调制技术的特点而提出的分段平均码率（SegmentedAverageBitRate，S-ABR）和分层分段平均码率（Layered&SegmentedAverageBitRate，LS-ABR）的数字音频信源编码方法及装置。

背景技术

在当今的数字音频广播等应用***中，所采用信道的数字调制技术（如OFDM等）要求调制信号具有较长的符号长度，因此一个调制帧要包含多个音频编码帧以组成超帧结构；并且***中一般信道编码技术都采用LDPC（LowDensityParityCheckCode，低密度奇偶校验码）线性分组编码，这就需要将信源编码的数据组装成多个整数信息块（当采用分层编码时，每层需要构成多个整数信息块）以便于实现LDPC信道编码。

国标GB/T22726-2008《多声道数字音频编解码技术规范》，又称为DRA（DigitalRiseAudio）音频标准，提供了三种编码模式，即CBR（ConstantBitRate，常比特率）、VBR（ViableBitRate，变比特率）和ABR（AverageBitRate，平均比特率）。其中，CBR模式是指每个编码帧具有同样比字节数的长度；VBR模式是指每个编码帧都可以有任意不同字节长度（当然一般实际实现时都会限制上限，为了保证编码质量最好也设置下限）；ABR模式充分利用编码端一个具有合适大小的缓冲器（太大容易使得编码延迟增大，以及解码端缓冲存储器增大；太小不利于编码算法对编码内容平滑处理），在保证此缓冲器不产生上溢和下溢的情况下，编码输出的每帧长度都可变化，而总体平均下来却是接近一个所设定的常数，但是对于ABR模式，如果以某一整数帧组合时，一般不具有同样字节长度。

国际上的音频编码标准和设备一般也是支持以上的三种编码模式，即CBR、ABR和VBR，例如以下常见的国际编码算法：

MPEG-1和MPEG-2的层I和层II仅仅支持CBR模式；

MPEG-1和MPEG-2的层III支持VBR模式，也可支持CBR和ABR模式；

DolbyAC-3支持CBR模式；

MPEG-2和MPEG-4的AAC、以及MPEG环绕声支持CBR、VBR和ABR模式。

在CMMB（ChinaMobileMultimediaBroadcasting，***多媒体广播）应用中，仅仅可以支持CBR模式的DRA音频编码。由于每帧音频编码采用固定字节（或比特）长度，CMMB中信道编码采用LDPC分组编码，要求输入给LDPC的信源编码数据应为多个固定长度的数据块，因此CBR模式的DRA音频编码使得整个***设计简单；但是由于音频信号内容复杂多变，因此每一个信号帧（对48kHz音频的DRA帧长为21ms）范围采用同样的信息表示，容易造成每帧编码后的声音质量变动，如果在高码率下，质量变化不易被人耳察觉，但对于CMMB低码率应用，则压缩复杂音频信号时会出现编码失真，导致出现主观声音质量下降的问题。

对我国正在制定的数字音频广播（CDR，ChinaDigitalRadio）***标准，考虑到其信道编码和数字调制技术的特点、数字广播覆盖问题及信源编码码流中每帧信息的重要性并非均匀分布等，数字音频编码最好支持分层编码，即包括核心层（或基本层）和增强层；或者对于非分层音频编码，仍然可将一帧音频编码数据分割成重要（对应核心层）和非重要数据（对于增强层）两个部分。这样便于信道编码采用非等错保护技术，即对基本层给予高保护等级，而对增强层给予低保护等级，从而在复杂接收情况下，可保证用户能够正确接收到核心层（基本层）的数据，解码后可恢复核心层音频部分，保证收听基本广播声音质量。

但是，当前的数字音频编码器（或算法）一般仅提供CBR、ABR和VBR三种模式，当这三种模式应用于CMMB及未来的CDR广播***时，存在如下缺点：

1)如果采用CBR模式，受限于每个音频帧必须编码为固定的字节长度来表示实时动态变化的输入音频信号，会造成整体信源编码效率不高。

2）如果直接将编码器设置为ABR和VBR模式，又可分为两种情况：

i）当编码器为不分层编码情况时，由于每个音频编码帧的帧长（字节数）不固定（变化的），因此在一个信道传输帧时间内，若需要传输的多个音频编码帧的总数据过多，则无法在经过信道编码和调制后通过一个传输帧发送出去；或者若需要传输的多个音频编码帧的总数据过少，则使得本传输帧浪费一些码率，这本来可进一步提高本传输帧内的几个音频帧的质量。

ii）当编码器为分层编码情况时，一个传输帧内的几个音频编码帧的基本层和增强层的各自总数据更加不可控，忽高忽低，从而也会引起某个传输帧内无法全部传送、而某个传输帧又会出现浪费的情况，特别对基本层和增强层采用不等错保护编码LDPC时，会变得更加复杂。

发明内容

本发明要解决的技术问题在于，针对现有技术的上述缺陷，提供一种用于数字音频广播***中在不增加***复杂度的情况下实现最佳编码效率的分段平均码率的数字音频信源编码方法及装置。

本发明解决其技术问题所采用的技术方案是：提出一种分段平均码率的数字音频信源编码方法，包括如下步骤：

S1、根据数字音频广播***的信道编码和调制参数信息确定一个传输帧内包含的音频编码帧的帧数N；

S2、根据数字音频广播***的信道编码和调制参数信息确定一个传输帧内包含的信道编码块的总块数；

S3、根据数字音频广播***的信道编码和调制参数信息确定一个信道编码块中信源编码数据的字节数；

S4、基于步骤S2、S3计算一个传输帧内包含的N个音频编码帧的总字节数；

S5、对一个传输帧时间内连续输入的N个音频编码帧进行压缩编码，基于步骤S4计算出的总字节数在N个音频编码帧间自适应地分配每个音频编码帧的字节数。

一个实施例中，所述步骤S1通过如下方式确定一个传输帧内包含的音频编码帧的帧数：

N=T/t，

其中，N表示帧数；T表示所述数字音频广播***的一个传输帧的时间长度；t表示所述数字音频广播***的一个音频编码帧的时间长度，由所述数字音频广播***的信源编码方式决定。

一个实施例中，所述步骤S2通过如下方式确定一个传输帧内包含的信道编码块的总块数：

K=A/b，

其中，K表示总块数；A表示所述数字音频广播***的一个传输帧所能传输的总字节数，由所述数字音频广播***的调制方式和频带带宽决定；b表示一个信道编码块的总字节数，由所述数字音频广播***的信道编码方式决定。

一个实施例中，所述步骤S4通过如下方式计算一个传输帧内包含的N个音频编码帧的总字节数：

B=K*M，

其中，B表示一个传输帧内包含的N个音频编码帧的总字节数；K表示总块数；M表示一个信道编码块中信源编码数据的字节数。

一个实施例中，所述方法还包括：根据所述数字音频广播***的调制方式或信道编码方式确定是否进行分层编码；以及

在分层编码的情况下，所述步骤S2进一步包括：

基于基本层和增强层各自的信道编码方式和调制方式确定基本层的信道编码块块数和增强层的信道编码块块数，并满足：

K=K_b+K_e，

其中，K表示总块数；K_b表示基本层的块数；K_e表示增强层的块数；

所述步骤S4通过如下方式计算一个传输帧内包含的N个音频编码帧的总字节数：

B=B_b+B_e=K_b*M_b+K_e*M_e，

其中，B表示一个传输帧内包含的N个音频编码帧的总字节数；B_b表示基本层的信源编码数据的总字节数；B_e表示增强层的信源编码数据的总字节数；K_b表示基本层的块数；K_e表示增强层的块数；M_b表示基本层的信道编码块中信源编码数据的字节数；M_e表示增强层的信道编码块中信源编码数据的字节数。

一个实施例中，在分层编码的情况下，所述步骤S5进一步包括：

对一个传输帧时间内连续输入的N个音频编码帧进行分层压缩编码，基于步骤S4计算出的基本层的信源编码数据总字节数自适应地分配各音频编码帧的基本层字节数，基于步骤S4计算出的增强层的信源编码数据总字节数自适应地分配各音频编码帧的增强层字节数。

本发明为解决其技术问题还提出一种分段平均码率的数字音频信源编码装置，包括：

第一计算模块，用于根据数字音频广播***的信道编码和调制参数信息确定一个传输帧内包含的音频编码帧的帧数N；

第二计算模块，用于根据数字音频广播***的信道编码和调制参数信息确定一个传输帧内包含的信道编码块的总块数；

第三计算模块，用于根据数字音频广播***的信道编码和调制参数信息确定一个信道编码块中信源编码数据的字节数；

第四计算模块，用于基于第二计算模块和第三计算模块的结果计算一个传输帧内包含的N个音频编码帧的总字节数；

信源编码模块，用于对一个传输帧时间内连续输入的N个音频编码帧进行压缩编码，基于第四计算模块计算出的总字节数在N个音频编码帧间自适应地分配每个音频编码帧的字节数。

一个实施例中，所述第一计算模块通过如下方式确定一个传输帧内包含的音频编码帧的帧数：

N=T/t，

一个实施例中，所述第二计算模块通过如下方式确定一个传输帧内包含的信道编码块的总块数：

K=A/b，

一个实施例中，所述第四计算模块通过如下方式计算一个传输帧内包含的N个音频编码帧的总字节数：

B=K*M，

一个实施例中，所述装置还包括：

分层编码确定模块，用于根据所述数字音频广播***的调制方式或信道编码方式确定是否进行分层编码；以及在分层编码的情况下，

所述第二计算模块进一步基于基本层和增强层各自的信道编码方式和调制方式确定基本层的信道编码块块数和增强层的信道编码块块数，并满足：

K=K_b+K_e，

所述第四计算模块通过如下方式计算一个传输帧内包含的N个音频编码帧的总字节数：

B=B_b+B_e=K_b*M_b+K_e*M_e，

一个实施例中，在分层编码的情况下，所述信源编码模块进一步对一个传输帧时间内连续输入的N个音频编码帧进行分层压缩编码，基于第四计算模块计算出的基本层的信源编码数据总字节数自适应地分配各音频编码帧的基本层字节数，基于第四计算模块计算出的增强层的信源编码数据总字节数自适应地分配各音频编码帧的增强层字节数。

本发明的分段平均码率（和分层分段平均码率）的数字音频信源编码方法及装置是一种信道信源联合编码技术，具有以下有益效果：

（1）对于非分层数字音频信源编码情况，本发明在每个信道传输帧中的N个编码帧间自适应地分配每帧帧长（或字节数），确保音频编码器在一个传输帧内获得局部最佳压缩，从而使得在一个信道传输帧内主观声音质量保持一致。

（2）对于分层数字音频信源编码情况，本发明在每个信道传输帧内分别局部最佳编码压缩基本层和增强层，获得更好的编码效率。

因此，本发明与CBR编码方法相比，可以以很小的编码复杂度为代价来提供更高的编码效率；与数字音频编码中一般意义上的ABR和VBR编码方法相比，可明显降低数字音频广播***音频编码单元输出码流的复用复杂度，同时也能改善编码效率。

附图说明

下面将结合附图及实施例对本发明作进一步说明，附图中：

图1是数字音频广播***简图；

图2是本发明一个实施例的分段平均码率的数字音频信源编码方法的流程图；

图3是本发明另一实施例的分层分段平均码率的数字音频信源编码方法的流程图；

图4是本发明一个实施例的分段平均码率的数字音频信源编码装置的逻辑框图；

图5是非分层情况的N帧编码数据的结构示意图；

图6是分层情况的N帧编码数据的结构示意图；

图7是非分层情况的传输帧的信道编码块的结构示意图；

图8是分层情况的传输帧的信道编码块的结构示意图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本发明进行进一步详细说明。应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。

图1示出了数字音频广播***100的简图。如图1所示，数字音频广播***100中，数字音频经过音频编码单元101编码，与数据102、控制信息103一起经复用器104复用，然后经过信道处理单元105进行信道编码和调制等处理，再传送给射频单元106通过天线107发射到空中。

从图1中可以看到，数字音频编码单元101处于整个***的最前端，而且一般来说，信源编码不需要受到信道等部分的影响，但是为了更好的配合信道和调制单元的特点，基于信道编码和调制参数对信源编码进行一定的约束，可获得更好的编码效率。

本发明便考虑数字音频广播***中信道编码及调制技术的特点而提出一种分段平均码率（SegmentedAverageBitRate，S-ABR）和分层分段平均码率（Layered&SegmentedAverageBitRate，LS-ABR）的数字音频信源编码方法，是一种基于信道的信源编码方法，主要通过有效控制编码端输出缓冲器的码流，保证编码器输出码流在固定时间间隔内（或某一常数编码帧数内）具有一路（对应不分层情况）或多路（对应分层层数）恒定平均比特率。

本发明的数字音频信源编码方法基于信道编码及调制技术的特点来确定是否需要进行分层编码。具体来说，本发明分层编码的确定，分两种情况。

第一种情况：根据数字音频广播***所采用的调制方式来确定是否进行分层编码。如果数字音频广播***所采用的调制方式对输入的调制信号能分成多个不同的调制等级，且不同等级的数据会在接收端产生不同的误码率，从而具有类似于不等错保护的效果，此时便要求信源编码尽可能提供分层编码能力，以更好地适应于这种调制技术。当信源编码支持分层，则在信道编码等处理后，将信源编码的基本层放在调制的高等级层调制，而增强层放在低等级层调制。如果数字音频广播***所采用的调制方式对输入的调制信号没有区别处理，则认为调制不支持分层编码，此时信源编码可不进行分层编码。

第二种情况：根据数字音频广播***所采用的信道编码方式是否支持多种纠错保护来确定是否进行分层编码。分层编码时，则基本层给予高纠错保护等级，增强层给予低保护等级。

图2示出了根据本发明一个实施例的非分层情况下的分段平均码率的数字音频信源编码方法（S-ABR）200的流程图。如图2所示，该数字音频信源编码方法200包括如下步骤：

步骤210中，根据数字音频广播***的信道编码和调制参数信息确定一个传输帧内包含的音频编码帧的帧数N。数字音频广播***中，信道编码方式和调制方式确定的情况下，可以得到一个传输帧的时间长度T，例如在CDR***中，一个传输帧的时间长度为640mn。同时，对于各种不同的信源编码模式，其每个音频编码帧的时间长度也是确定的。例如采用DRA编码，即高码率时，对于48kHz音频信号，每个音频编码帧的时间长度t=(1024/48)毫秒；而对于DRA+编码，即低码率时，每个音频编码帧的时间长度为2倍DRA帧长。因此，根据数字音频广播***的一个传输帧的时间长度T，以及一个数字音频编码帧的时间长度t，可确定每个传输帧内包含的音频编码帧的帧数N，即：

N=T/t。

图5示出了非分层情况下一个传输帧中N帧编码数据的结构图，其中，参数B为一个传输帧时间长度内的N个音频编码帧的总字节数，等于各个音频编码帧的字节数B_j（j=1,2,…N）之和。

接下来步骤220中，根据数字音频广播***的信道编码和调制参数信息确定一个传输帧内包含的信道编码块的总块数K。一个传输帧内包含的信道编码块的总块数K是由一个传输帧所能传输的总数据量和信道编码算法所确定的。一个传输帧的总字节数由数字音频广播***的调制方式和频带带宽决定。一般来说，每个信道编码块（如LDPC编码）的总字节数也是确定的。这样通过一个传输帧的总数据字节数除以一个信道编码块的字节数，便可推导出一个传输帧内包含的信道编码块的总块数K，即：

K=A/b，

其中，K表示总块数，A表示一个传输帧所能传输的总字节数，b表示一个信道编码块的总字节数。

接下来步骤230中，根据数字音频广播***的信道编码和调制参数信息确定一个信道编码块中信源编码数据的字节数M。M代表每个信道编码块中被保护信息的字节数，可基于信道编码方式来确定。例如，如果采用1/2的LDPC编码，则每个LDPC块的块长为1152字节，每个LDPC块中信源编码数据部分为1152/2字节，即M=576字节。图7示出了非分层情况下一个传输帧的信道编码块的结构，由于每个信道编码块的总字节数b为常数，每个块的信源编码数据和信道保护数据应满足：

M+C=b，

其中，M表示一个信道编码块中信源编码数据的字节数，C表示一个信道编码块中信道保护数据的字节数，b表示一个信道编码块的总字节数。

接下来步骤240中，基于步骤220确定的一个传输帧内包含的信道编码块的总块数K、步骤230确定的一个信道编码块中信源编码数据的字节数M计算一个传输帧内包含的N个音频编码帧的总字节数B，即：

B=K*M。

接下来步骤250中，对一个传输帧时间T内连续输入的N帧音频数据进行压缩编码，基于步骤240计算出的总字节数B在N个音频编码帧间自适应地分配每个音频编码帧的字节数。即，根据每帧音频信号内容的不同，自适应地分配各帧的字节数，使得总的编码字节数为B，确保在一个传输帧内获得局部最佳压缩，从而使得在一个信道传输帧内主观声音质量保持一致。

图3示出了根据本发明一个实施例的分层情况下的分层分段平均码率的数字音频信源编码方法（LS-ABR）300的流程图。如图3所示，该数字音频信源编码方法300包括如下步骤：

步骤310中，根据数字音频广播***的信道编码和调制参数信息确定一个传输帧内包含的音频编码帧的帧数N。如前结合图2所述，帧数N可以根据数字音频广播***的一个传输帧的时间长度T以及一个数字音频编码帧的时间长度t来确定，即：

N=T/t。

图6示出了分层情况（基本层和增强层）的一个传输帧中N帧编码数据的结构图，其中，参数B为一个传输帧时间长度内的N个音频编码帧的总字节数，等于各个音频编码帧的基本层字节数B_jb（j=1,2,…N）和增强层字节数B_je（j=1,2,…N）之和。

接下来步骤320中，根据数字音频广播***的信道编码和调制参数信息确定一个传输帧内包含的信道编码块的总块数K。如前结合图2所示，一个传输帧内包含的信道编码块的总块数K是由一个传输帧所能传输的总数据量和信道编码算法所确定的，即：

K=A/b，

接下来步骤330中，基于基本层和增强层各自的信道编码方式和调制方式确定基本层的信道编码块块数K_b和增强层的信道编码块块数K_e。对于分层编码的情况，由于一个传输帧内每层的总字节数可能不同，另外每层使用的信道编码方式不同，使得基本层和增强层有不同的信道编码块块数K_b和K_e，并满足K=K_b+K_e。

接下来步骤340中，基于基本层和增强层各自的信道编码方式和调制方式分别确定基本层的信道编码块中信源编码数据的字节数M_b和增强层的信道编码块中信源编码数据的字节数M_e。例如，如果基本层采用1/4LDPC编码，增强层采用1/2LDPC编码，每个LDPC块的块长为1152字节，则基本层的每个LDPC块中信源编码数据部分为1152/4字节，即M_b=288字节，增强层的每个LDPC块中信源编码数据部分为1152/2字节，即M_e=576字节。图8示出了分层情况下一个传输帧的信道编码块的结构，由于每个信道编码块的总字节数b为常数，因此在分层的情况下，基本层信道编码块的M_b小于增强层信道编码块的M_e，相应地，基本层信道编码块的纠错保护信息字节数C_b大于增强层信道编码块的纠错保护信息字节数C_e。

接下来步骤350中，通过如下方式计算一个传输帧内基本层的信源编码数据的总字节数B_b、增强层的信源编码数据的总字节数B_e、以及N个音频编码帧的总字节数B：

B=B_b+B_e=K_b*M_b+K_e*M_e。

接下来步骤360中，对一个传输帧时间内连续输入的N帧音频数据进行分层压缩编码，基于步骤350计算出的基本层的信源编码数据总字节数B_b在N个音频编码帧间自适应地分配各音频编码帧的基本层字节数，基于增强层的信源编码数据总字节数B_e自适应地分配各音频编码帧的增强层字节数。也就是说，根据每帧音频信号内容的不同，自适应地分配各帧的基本层字节数和增强层字节数，使得基本层总字节数为B_b，增强层总字节数为B_e，从而在一个传输帧内分别局部最佳编码压缩基本层和增强层，获得等号的编码效率。

总之，在数字音频广播***应用中，一般要求一个传输帧内信源编码的总字节数固定，采用本发明以上介绍的S-ABR和LS-ABR编码模式，能够获得更高的编码效率。

图4是本发明一个实施例的分段平均码率的数字音频信源编码装置400的逻辑框图。如图4所示，该数字音频信源编码装置400包括第一计算模块410、第二计算模块420、第三计算模块430、第四计算模块440和信源编码模块450，用于实现前面结合图2和图3所述的数字音频信源编码方法。进一步，该数字音频信源编码装置400还包括有分层编码确定模块，用于根据数字音频广播***的调制方式或信道编码方式来确定是否需要进行分层编码。例如，如果数字音频广播***所采用的调制方式对输入的调制信号能分成多个不同的调制等级，则可采用分层信源编码，以更好地适应这种调制技术。又例如，如果数字音频广播***所采用的信道编码方式支持多种纠错保护，则可采用分层信源编码，对基本层给予高纠错保护，对增强层给予低保护等级。

进一步如图4所示，第一计算模块410用于根据数字音频广播***的信道编码和调制参数信息确定一个传输帧内包含的音频编码帧的帧数N。具体来说，第一计算模块410通过下式确定帧数N：

N=T/t，

第二计算模块420用于根据数字音频广播***的信道编码和调制参数信息确定一个传输帧内包含的信道编码块的总块数K。具体来说，第二计算模块420通过如下方式确定一个传输帧内包含的信道编码块的总块数K：

K=A/b，

在分层编码的情况下，第二计算模块420进一步基于基本层和增强层各自的信道编码方式和调制方式确定基本层的信道编码块块数K_b和增强层的信道编码块块数K_e，并满足K=K_b+K_e。

第三计算模块430用于根据数字音频广播***的信道编码和调制参数信息确定一个信道编码块中信源编码数据的字节数M。M代表每个信道编码块中被保护信息的字节数，可基于信道编码方式来确定。在分层编码的情况下，第三计算模块430基于基本层和增强层各自的信道编码方式和调制方式分别确定基本层的信道编码块中信源编码数据的字节数M_b和增强层的信道编码块中信源编码数据的字节数M_e。

第四计算模440块用于基于第二计算模块420和第三计算模块430的结果计算一个传输帧内包含的N个音频编码帧的总字节数B。在非分层编码的情况下，第四计算模块440通过如下方式计算一个传输帧内包含的N个音频编码帧的总字节数B：

B=K*M，

在分层编码的情况下，第四计算模块440通过如下方式计算一个传输帧内包含的N个音频编码帧的总字节数B：

B=B_b+B_e=K_b*M_b+K_e*M_e，

非分层编码的情况下，信源编码模块450用于对一个传输帧时间内连续输入的N帧音频数据进行压缩编码，基于第四计算模块440计算出的总字节数B在N个音频编码帧间自适应地分配每个音频编码帧的字节数，即，根据每帧音频信号内容的不同，自适应地分配各帧的字节数，使得总的编码字节数为B，确保在一个传输帧内获得局部最佳压缩，从而使得在一个信道传输帧内主观声音质量保持一致。

分层编码的情况下，信源编码模块450对一个传输帧时间内连续输入的N个音频编码帧进行分层压缩编码，基于第四计算模块440计算出的基本层的信源编码数据总字节数B_b自适应地分配各音频编码帧的基本层字节数，基于第四计算模块440计算出的增强层的信源编码数据总字节数B_e自适应地分配各音频编码帧的增强层字节数，也就是说，根据每帧音频信号内容的不同，自适应地分配各帧的基本层字节数和增强层字节数，使得基本层总字节数为B_b，增强层总字节数为B_e，从而在一个传输帧内分别局部最佳编码压缩基本层和增强层，获得更好的编码效率。

以下将以我国数字音频广播CDR（ChinaDigitalRadio，中国数字跳频广播）为例来介绍本发明数字音频信源编码方法（S-ABR和LS-ABR）的具体应用。

在CDR应用中，数字音频信源编码技术采用中国国家音频标准DRA及DRA增强编码（DRA+）技术，其中DRA+支持低码率音频编码和分层编码（包括立体声及环绕声分层编码），而信道编码采用LDPC，调制采用QPSK/QAM和OFDM技术。

表1给出了不同调制和信道编码下的有效信源编码码率，如果采用固定比特率模式，则可直接应用，但是当采用可变比特率模式时，要考虑一个传输帧的传输能力，使得***设计和控制比较复杂。

表1不同调制模式及信道编码情况下的有效净载荷

CDR***中的主要参数如下：

在CDR中，一个传输帧的时间长度T=640ms，如果仅以传输模式1&2和16QAM调制为例，则调制信号的总比特率为288kbps（对应总字节数A为23040）。在CDR中，采用DRA编码，假设DRA采用高码率编码模式，则对48kHz音频信号每个音频编码帧的时间长度t=(1024/48)ms。因此一个传输帧内包含的音频编码帧的帧数N=T/t=30；当使用低码率DRA时，N=15帧）。

在CDR中，信道编码采用LDPC，且每个信道编码块的总字节数b为1152字节，因此每个传输帧中包含20个编码块，即K=A/b=23040/1152=20。

对于非分层编码的情况，如果采用1/2LDPC编码，则每个LDPC块中信源编码数据部分为1152/2字节，即M=576字节。一个传输帧内总的信源编码压缩字节数为B=M*K=11520字节，则信源编码的平均比特率（S-ABR比特率）为144kbps。这时本发明分段平均码率S-ABR编码的意义是：在一个传输帧时间（640ms）内，通过对连续输入的30帧PCM音频数据进行DRA算法压缩，使得总编码字节数为11520字节，其中，根据每帧信号内容的不同，自适应分配各帧的字节数，从而获得局部最优编码。

对于分层编码的情况，如果基本层采用1/4LDPC编码，增强层采用1/2LDPC编码，由于总的信道编码块的块数K=20，为了简化，假定基本层块数K_b和增强层块数K_e相同，都等于10，则一个传输帧内基本层的总字节数为B_b=K_b*1152*（1/4）=2880字节，而一个传输帧内增强层的总字节数为B_e=K_e*1152*（1/2）=5760字节，最终一个传输帧内总的信源编码压缩字节数为B=B_b+B_e=（2880+5760）=8640字节，信源编码的平均比特率（LS-ABR比特率）为B*8/0.640=108kbps。这时本发明分层分段平均码率LS-ABR编码的意义是：在一个传输帧时间（640ms）内，通过对连续输入的30帧PCM音频数据进行分层DRA算法压缩，使得基本层总字节数为2880，增强层总字节数为5760，其中，根据每帧信号内容动态分配各帧的基本层字节数，根据每帧信号内容动态分配各帧的增强层字节数，从而获得局部最优编码。

以上所述仅为本发明的较佳实施例而已，并不用以限制本发明，凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等，均应包含在本发明的保护范围之内。

Claims

1.一种分段平均码率的数字音频信源编码方法，其特征在于，包括如下步骤：

S5、对一个传输帧时间内连续输入的N帧音频数据进行压缩编码，基于步骤S4计算出的总字节数在N个音频编码帧间自适应地分配每个音频编码帧的字节数；

所述方法还包括：根据所述数字音频广播***的调制方式或信道编码方式确定是否进行分层编码；以及

在分层编码的情况下，所述步骤S2进一步包括：

K＝K_b+K_e，

B＝B_b+B_e＝K_b*M_b+K_e*M_e，

2.根据权利要求1所述的方法，其特征在于，所述步骤S1通过如下方式确定一个传输帧内包含的音频编码帧的帧数：

N＝T/t，

3.根据权利要求1所述的方法，其特征在于，在非分层编码的情况下，所述步骤S2通过如下方式确定一个传输帧内包含的信道编码块的总块数：

K＝A/b，

4.根据权利要求1所述的方法，其特征在于，在非分层编码的情况下，所述步骤S4通过如下方式计算一个传输帧内包含的N个音频编码帧的总字节数：

B＝K*M，

5.根据权利要求1所述的方法，其特征在于，在分层编码的情况下，所述步骤S5进一步包括：

对一个传输帧时间内连续输入的N帧音频数据进行分层压缩编码，基于步骤S4计算出的基本层的信源编码数据总字节数自适应地分配各音频编码帧的基本层字节数，基于步骤S4计算出的增强层的信源编码数据总字节数自适应地分配各音频编码帧的增强层字节数。

6.一种分段平均码率的数字音频信源编码装置，其特征在于，包括：

信源编码模块，用于对一个传输帧时间内连续输入的N帧音频数据进行压缩编码，基于第四计算模块计算出的总字节数在N个音频编码帧间自适应地分配每个音频编码帧的字节数；

所述装置还包括：

K＝K_b+K_e，

B＝B_b+B_e＝K_b*M_b+K_e*M_e，

7.根据权利要求6所述的装置，其特征在于，所述第一计算模块通过如下方式确定一个传输帧内包含的音频编码帧的帧数：

N＝T/t，

8.根据权利要求6所述的装置，其特征在于，在分层编码的情况下，所述信源编码模块进一步对一个传输帧时间内连续输入的N帧音频数据进行分层压缩编码，基于第四计算模块计算出的基本层的信源编码数据总字节数自适应地分配各音频编码帧的基本层字节数，基于第四计算模块计算出的增强层的信源编码数据总字节数自适应地分配各音频编码帧的增强层字节数。