CN101162904A - 一种空间参数立体声编解码方法及其装置 - Google Patents

一种空间参数立体声编解码方法及其装置 Download PDF

Info

Publication number
CN101162904A
CN101162904A CNA2007100537702A CN200710053770A CN101162904A CN 101162904 A CN101162904 A CN 101162904A CN A2007100537702 A CNA2007100537702 A CN A2007100537702A CN 200710053770 A CN200710053770 A CN 200710053770A CN 101162904 A CN101162904 A CN 101162904A
Authority
CN
China
Prior art keywords
module
frequency
domain
parameter
signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA2007100537702A
Other languages
English (en)
Other versions
CN100571043C (zh
Inventor
胡瑞敏
陈水仙
艾浩军
涂卫平
曹晟
王恒
李璇
周婷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wuhan University WHU
Original Assignee
Wuhan University WHU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wuhan University WHU filed Critical Wuhan University WHU
Priority to CNB2007100537702A priority Critical patent/CN100571043C/zh
Publication of CN101162904A publication Critical patent/CN101162904A/zh
Application granted granted Critical
Publication of CN100571043C publication Critical patent/CN100571043C/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

本发明公开了空间参数立体声编解码方法及装置:编码端首先将立体声左右声道信号在时域或频域下混,然后下混信号传送到变换编码器产生单声道编码数据,同时提取包含量化误差的下混信号,并根据其短时频谱特性将其变换域划分为连续且不重叠的子带,以子带为单位提取左右声道的空间参数。解码端根据变换编码数据,生成与编码端一致的包含量化误差的下混信号并采用同样的划分方法得到子带划分,然后根据空间参数信息重建立体声左右声道子带信号,反变换输出时域立体声信号。与现有技术相比,本发明没有正反变换带来的附加延时并且可在不传送子带划分信息的条件下实现动态的时频划分,提高了空间参数立体声编解码的实时性和效率。

Description

一种空间参数立体声编解码方法及其装置
技术领域
本发明属于数字音频压缩编码领域,特别涉及一种以参数表示空间信息的立体声编解码***和装置。
背景技术
数字音频编码起源于20世纪80年代末,以MP3(MPEG-1 Layer III)和AAC(Advanced Audio Coding)为典型代表。此时编码技术在立体声的处理方面考虑声道间的相关性,采用和差(Mid/Side)立体声或强度立体声(Intensity Stereo)处理技术,然后对处理后的两路完整的音频信号采用独立的编码方法,因此码率与声道数基本成正比。
2002年C.Faller等人提出了一种基于空间心理声学的参数立体声编解码***BCC(Binaural Cue Coding)。此***在变换域提取声道间强度差ILD(Interchannel Level Difference),声道间时间差ITD(Interchannel Time Difference),和声道间相关度IC(Interchannel Coherence),其解码器根据这些参数和下混声道重建多声道的输出。2004年J.Breebaart等人提出参数立体声PS(Parametric Stereo)编解码***,2005年MPEG推出MPEG环绕声(MPEG Surround)***都是以BCC为基础发展起来的立体声/多声道编解码***,其核心架构与BCC***一致。
上述空间参数编解码***相对于只采用和差立体声和强度立体声技术的MP3/AAC等编解码***,在性能上有明显的提升:以单声道的码率达到立体声的音质,因此在对音质和码流要求严格的音频广播和移动音频中得到应用。但是这些空间参数编解码***最突出的问题是延时增加,编解码端的时频分析模块引入了至少一帧的延时,通常在20ms到40ms之间,不利于双向实时通信。因此减小空间参数立体声编解码的延时是本领域亟待解决的问题。
BCC、PS、和MPEG Surround的另一个问题是难于实现动态的时频划分。根据空间心理声学,ILD、ITD、和IC只有针对同一或空间上连续的声源才有明确的意义。上述空间参数编码***都采用子带划分的方式来区分信号中不同的声源进而提取空间参数,为了避免传送子带划分信息带来的码率增加,这种划分是静态的且独立于信号特性的。由于实际信号中各个声源的频谱范围是动态的,这种方式降低了空间参数编码的效率。因此在不增加码率的情况下实现动态的时频划分是本领域亟待解决的另一个问题。
发明内容
本发明的目的在于解决现有空间参数编解码***的不足,提供一种无附加延时且支持动态时频划分的空间参数立体声编解码方法及其装置,减少***延时并提高立体声信号压缩的效率。
本发明的编码技术解决方案包括以下步骤:
步骤1,对输入的左右两路时域音频信号进行下混,生成一路信号;
步骤2,对得到的下混信号进行变换音频编码,生成下混信号的编码数据;
步骤3,获得与下混信号的编码数据对应的下混信号的反量化频谱;
步骤4,分析频域反量化的下混信号,将频谱划分成若干连续且无重叠的子带;
步骤5,以划分的子带为单位,提取输入的左右两路信号在频域每个子带的空间参数信息,生成空间参数编码数据;
步骤6,将下混信号的编码数据和空间参数编码数据按一定格式组合成一路编码码流。
而且,步骤1所述的下混是在时域操作,即取左右两路音频信号的时域平均值作为下混信号,其中时域平均值是两路信号在同一时刻处的样点值之和的一半。
而且,步骤1所述的下混是在频域操作,即取左右两路音频信号的频域平均值或乘以增益系数,得到频域下混信号,其中频域平均值是两路信号在同一频点处的谱线值之和的一半,增益系数是为了调整下混信号能量而在平均值之上乘的一个正的实数。
而且,步骤3所述的下混信号的反量化频谱,通过对下混信号的编码数据进行解码获得;或者当变换编码过程中生成了下混信号的反量化频谱时,直接从编码过程中获得。
本发明还提供了相应的空间参数立体声解码方法,依次包含以下步骤:
步骤I,将合成码流分离成下混信号编码数据和空间参数编码数据;
步骤II,对下混信号编码数据进行变换音频解码,生成频域反量化的下混信号,同时将此信号的频谱划分成若干连续且无重叠的子带;
步骤III,根据空间参数编码数据和频域反量化的下混信号,以步骤II划分的子带为单位,生成两路包含频域音频信号,这两路频域音频信号包含空间参数编码数据给定的空间信息;
步骤IV,对两路频域音频信号,进行时频逆变换或综合滤波器组滤波,生成左右两路时域音频信号。
本发明提供了一种与空间参数立体声编码方法相应的装置,由下混模块、核心编码模块、核心解码模块、动态时频划分模块、分析滤波器组、参数提取模块和码流成型模块组成,左右两路时域音频信号输入下混模块和分析滤波器组,下混模块的输出接入核心编码器,核心编码器的输出接入核心解码模块,核心解码模块输出接入动态时频划分模块,动态时频划分模块和分析滤波器组的输出接入参数提取模块,核心编码模块的输出和参数提取模块的输出接入码流成型模块。
而且,所述核心编码模块采用AAC编码器。
本发明也提供了一种与空间参数立体声解码方法相应的装置,由码流解析模块、核心解码模块、动态时频划分模块、参数合成模块和综合滤波器组组成,合成码流输入码流解析模块后分离出核心解码数据和空间参数数据,核心解码数据输入核心解码模块,核心解码模块的输出经动态时频划分模块后和空间参数数据共同输入参数合成模块,参数合成模块的输出接入综合滤波器。
本发明将输入的立体声信号直接在时域下混或利用核心编码的时频变换工具在频域下混成一路信号作为核心编码器的输入,从而避免单独的时频正反变换带来的附加延时;基于分析综合法,空间参数的提取位于核心编码之后,并且根据编码后反量化的数据进行动态的时频划分,然后提取每个划分单元的空间参数,由于编码后反量化的数据在解码端可以精确复现,因此只要解码端采用相同的时频划分方法,无需传送划分信息,就可以得到与编码端一致的时频划分,并以每个划分单元为单位根据空间参数合成立体声左右两路信号。本发明不仅降低了空间参数编解码***的延时,而且可以实现在不传送频谱划分信息条件下的动态时频划分,使空间参数立体声的编解码实时性和效率都有显著提高。
附图说明
图1是本发明实施例空间参数编码流程,其中图1a为时域下混情况,图1b为频域下混情况;
图2是本发明实施例空间参数解码流程;
图3是本发明空间参数立体声编解码装置基本结构;
图4是本发明实施例采用AAC为核心编码的编码装置结构图;
图5是本发明实施例采用AAC为核心解码的解码装置结构图。
具体实施方式
本发明提供的空间参数立体声编码方法包括以下步骤:步骤1,对输入的左右两路时域音频信号进行下混,生成一路信号;
步骤2,对得到的下混信号进行变换音频编码,生成下混信号的编码数据;
步骤3,获得与下混信号的编码数据对应的下混信号的反量化频谱;
步骤4,分析频域反量化的下混信号,将频谱划分成若干连续且无重叠的子带;
步骤5,以划分的子带为单位,提取输入的左右两路信号在频域每个子带的空间参数信息,生成空间参数编码数据;
步骤6,将下混信号的编码数据和空间参数编码数据按一定格式组合成一路编码码流。
具体实施时一般首先对相关的左右两路时域音频信号进行可逆的时频变换或分析滤波器组滤波,生成左右两路频域音频信号,时频变换或分析滤波器组滤波这2种处理均可。所述变换音频编码一般采用感知音频编码,感知音频编码是一类基于人耳听觉特性的变换域音频编码方法的统称,执行频域下混操作时,仅需对得到的下混信号进行感知音频编码中的部分。相应进行变换解码时,也应采用感知音频解码技术。
参数立体声是一种建立在空间心理声学基础上的立体声编码方法。它最大特点是仅对一路主信号(又称为下混信号)进行编码,同时从立体声信号中分离出空间信息并参数化表示(又称为空间参数信息)。本发明给出了效果较好的下混信号取得方法:采用时域下混时,取左右两路音频信号的时域平均值作为下混信号,其中时域平均值是两路信号在同一时刻处的样点值之和的一半;频域下混操作,是指取左右两路音频信号的频域平均值或乘以增益系数,得到频域下混信号,其中频域平均值是两路信号在同一频点处的谱线值之和的一半,增益系数是为了调整下混信号能量而在平均值之上乘的一个正的实数;
具体实施时,可以通过编程程序实现全编码过程自动化,本发明提供实施例的空间参数编码流程以便实施,对于时域下混,参见图1(a):
(101)输入相关的左右两路时域音频信号,在时域下混成一路信号,去往步骤(102);
(102)对时域下混信号进行完整的感知音频编码,生成下混信号的编码数据,如果这个过程同时生成频域反量化数据,去往步骤(104),否则去往步骤(103);
(103)对下混信号的编码数据进行部分解码,生成频域反量化数据,去往步骤(104);
(104)分析频域反量化的下混信号,将频谱划分成若干连续且无重叠的子带,去往步骤(105);
(105)对输入的两路立体声时域信号分别进行分析滤波器组滤波,生成两路频域信号,去往步骤(106);
(106)以步骤(104)的子带划分为单位,提取两路频域信号每个子带的空间参数信息,并生成参数码流,去往步骤(107);
(107)将步骤(102)生成的下混信号编码数据和步骤(106)的生成的参数编码数据按一定的格式组合成单一的编码码流。
对于频域下混,参见图1(b):
(111)对输入的两路立体声时域信号分别进行分析滤波器组滤波,生成两路频域信号,去往步骤(112);
(112)对两路频域信号进行频域下混,可以采用数学平均或加权平均得到一路频域下混信号,去往步骤(113)
(113)对频域下混信号进行感知音频编码除时频变换外的处理,包括频域处理和量化熵编码,生成下混信号的编码数据,如果这个过程同时产生频域反量化数据,则去往步骤(115),否则去往步骤(114);
(114)对下混信号的编码数据进行解码,生成下混信号的频域反量化数据,去往步骤(115);
(115)分析频域反量化信号,将频谱划分成连续且无重叠的子带,去往步骤(116);
(116)以步骤(115)的子带划分为单位,提取两路频域信号每个子带的空间参数信息,并生成参数码流,去往步骤(117);
(117)将步骤(113)生成的下混信号编码数据和步骤(116)的生成的参数编码数据按一定的格式组合成单一的编码码流。
本发明实施例的空间参数编码流程,如图2所示,包含以下步骤:
(201)输入为单一的包含下混信号和空间参数信息的码流,生成分离的下混信号编码数据和空间参数编码数据;
(202)根据步骤(201)输出的下混信号的编码数据,进行感知音频解码,生成包含量化误差的频域反量化的下混信号;
(203)分析步骤(202)输出的频域反量化的下混信号,采用空间参数立体声编码的步骤(108)相同的方法,将频谱划分成若干连续且无重叠的子带,去往步骤(4);
(204)根据步骤(201)输出的空间参数编码数据和步骤(202)输出的频域反量化下混信号,以步骤(203)给出的子带为单位,生成两路包含空间参数编码数据给定的空间信息的频域音频信号;
(205)根据步骤(204)给出的两路频域音频信号,进行时频逆变换或综合滤波器组滤波,生成左右两路时域音频信号。
在编解码领域中,可软件方法实现的过程往往固化为编解码硬件产品,以便市场应用。本发明也提供了空间参数立体声编解码装置基本结构。如图3所示,其中编码端包括6个模块:下混模块301,核心编码模块302,核心解码模块303,动态时频划分模块304,分析滤波器组305,参数提取模块306,和码流成型模块307。输入的立体声左右两路信号首先经下混模块301形成一路信号并作为核心编码模块302的输入,其生成的数据经核心解码模块303恢复为包含量化误差的与原下混信号近似的信号,动态时频划分模块304根据这个信号的短时特性划分频谱,参数提取模块306以每个划分单元为基本单位提取原始左右两路信号经分析滤波器组305得到的频域两路信号间的空间参数,最后码流成型模块307将核心编码模块302和参数提取模块306的输出按一定的格式组合形成解码可识别的码流。
下混模块301的输入是时域立体声左右两路信号,输出的一路时域信号是左右两路信号的均值,又被称为下混信号。
核心编码模块302的输入是一路下混信号,这里核心编码模块可以是现有的单声道变换编码器,如MP3和AAC等。核心编码模块的输出包括两部分,下混信号的编码数据和下混信号在变换域的量化索引值,这里变换域可以是子带域,离散傅立叶DFT域或修正余弦变换MDCT域。
核心解码模块303的输入是下混信号在编码数据,输出是反量化的变换域下混信号。这里核心解码模块303是与核心编码模块302对应的单声道变换解码器,如MP3和AAC等。与通常的单声道变换解码器不同的是,这里解码过程只需进行到反量化,不需要在进行反变换得到时域信号。
动态时频划分模块304的输入是反量化变换域下混信号,根据这个信号的特性,将其变换域谱线划分成连续的子带,通常是不等带宽的。现有的空间参数编码采用的频域划分通常是按人耳的听觉特性非线性划分的Bark带,与信号的特性无关。这里以Bark带为基础,根据信号的短时时频特性,对Bark带进行细分和合并:如果一个Bark带内包含两个或多个独立声源,则将这个Bark带划分成相应的2段或多段;如果相邻的Bark带都在通一个声源的范围内,则这些Bark带合并成一段。独立声源的判断可以通过分析频谱包络、相位、和相关性得到。
分析滤波器组305的输入是原始左右两路时域信号,输出是左右两路的频域信号。分析滤波器组305可以采用多相正交调制滤波器组(PolyphaseQuadrature Modulated Filterbank,PQMF),离散傅立叶变换(Discrete FourierTransform,DFT),或修正调制余弦变换(Modified Discrete Fourier Transform,MDCT)。
参数提取模块306的输入是动态的时频划分以及原始的左右两路信号经分析滤波得到的两路频域信号,输出的是针对每个划分单元提取的空间参数,包括时间差ITD、强度差ILD、和相关度IC等。对于每个划分单元,参数提取可以采用现有的技术,如BCC、PS中参数提取的方法。
码流成型模块306的输入是下混的声道的编码数据和空间参数的编码数据,输出是解码器可识别的码流。根据给定码流的语法结构,码流成型模块将上述两部分数据组合在一起并添加给定的标识信息,如特定的比特位等。
解码端则包括5个模块:码流解析模块311,核心解码模块312,动态时频划分模块313,参数合成模块314和综合滤波器组315。解码端的输入是符合给定语法结构的码流,首先码流解析模块311对输入码流进行解析,分离出核心解码数据和空间参数数据,核心解码模块312根据核心解码数据生成量化的变换域下混信号,这个信号与编码端对应时间段的反量化变换域下混信号是精确一致的,然后与编码端完全一致的动态时频划分模块313对其进行动态时频划分,得到与编码端完全一致的时频划分,最后参数合成模块314根据时频划分和空间参数数据,重建每个划分单元左右声道的变换域信号,经综合滤波器组模块315时频逆变换得到最终的时域立体声信号输出。
码流解析模块311的输入是编码器产生的码流,输出是解析出的与解码时间段对应的核心解码数据和空间参数数据。码流解析模块根据给定的语法结构,通过特定的标识信息,如标识比特位,获得码流中各个比特序列段的数据含义,进而分离出核心解码模块和参数合成模块所需的并且同步的数据。
核心解码模块312的输入是解析出的核心解码数据,输出是反量化的变换域下混信号。这里核心解码模块是与编码端核心编码模块对应的单声道变换解码器,如MP3和AAC等。与通常的单声道变换解码器不同的是,这里解码过程只需进行到反量化,不需要在进行反变换得到时域信号。当编码码流正确传送到解码端时,核心解码模块就可以精确恢复出编码端反量化的变换域下混信号,这个信号与原始变换域下混信号的差异就是量化误差,而原始信号在解码端通常是无法精确重建的。
动态时频划分模块313的输入是核心解码模块获得的反量化的变换域下混信号,输出的依据当前信号特性的变换域子带划分。这个模块与编码端的动态时频划分模块完全一致,同时输入的反量化的变换域下混信号也是完全一致的,因此其输出的子带划分也与编码端的子带划分完全一致。
参数合成模块314的输入的反量化的变换域下混信号和子带划分以及空间参数数据,输出是重建的立体声左右两路频域信号。与编码端的参数提取模块一样,参数合成模块可以采用现有的技术,如BCC、PS等的参数合成方法。以每个动态划分的子带为单位,生成左右两个子带信号,使之具有给定的时间差ITD、强度差ILD、和相关度IC等。
综合滤波器组模块315的输入是左右两路频域信号,输出是左右两路时域信号。综合滤波器组315是分析滤波器组305的逆变换,可以是逆多相正交调制滤波器组(Inverse PQMF,IPQMF),逆离散傅立叶变换(Inverse DFT,IDFT),和逆修正余弦变换(Inverse MDCT,IMDCT)。
下面结合附图4、5对本发明的具体实施方式作进一步说明,图4给出了本发明所述空间参数立体声编码***以AAC为核心编码器的结构,与图5的空间参数立体声解码***相匹配。
以AAC为核心编码器的空间参数立体声编码***包括7个模块,心理声学分析模块401,MDCT模块402,下混模块403,AAC频域处理及量化编码模块404,动态时频划分模块405,参数提取模块406,和码流成型模块407。时域左右声道信号首先经心理声学分析模块401处理得到AAC编码所需心理声学数据和MDCT变换长度;MDCT模块402根据变换长度进行相应的时频变换得到左右声道的频域数据;经下混模块403得到一路频域数据作为AAC频域处理及量化熵编码模块404的输入;模块404是AAC核心编码,输出下混信号的编码码流和频域反量化下混信号;动态时频划分模块405根据频域反量化下混信号给出一个根据信号短时特性的频谱划分;参数提取模块406以每个划分单元为单位,提取原始频域左右声道信号间的空间参数信息并形成空间参数码流;最后码流成型模块407将AAC下混声道码流和空间参数码流组合成符合给定语法结构的码流。
心理声学分析模块401是AAC编码器的主要模块之一,输入是原始左右声道时域信号,输出是AAC编码所需的心理声学参数和MDCT变换的长度。心理声学参数包括感知熵,遮蔽门限等;MDCT变换的长度主要决定于信号的短时平稳性,对稳态信号采用长变换,对瞬态信号采用段变换。
MDCT模块402也是AAC编码器的主要模块之一,输入是原始左右声道的时域信号,输出是左右声道的频域信号。
下混模块403是本发明实施例的特有模块,输入是左右两路频域信号,输出是一路频域信号。下混可以采用简单的数学平均,也可以在数学平均的基础上引入增益控制系数,以避免左右声道频域信号在同相或反相时带来的信号相互加强或抵消。
AAC频域处理及量化熵编码模块404是AAC编码器的核心模块,输入是一路频域下混信号,输入是编码码流和频域反量化数据。具体的频域处理及量化熵编码方法在MPEG组织的标准文档里有详细描述。对本发明所述的空间参数立体声编码***,采用AAC作为核心编码的一个重要收益就是AAC编码过程本身就可以生成频域反量化数据,因此省去了单独的反量化模块。
动态时频划分模块405是本发明实施例的特有模块,输入是频域反量化数据,输出是根据信号短时特性的频谱划分。模块405与图3的动态时频划分模块304的作用和处理方法一致。
参数提取模块406是本发明实施例的特有模块,输入是频域左右声道信号以及频谱的划分,输出是空间参数信号的码流。模块406与图3的参数提取模块305的作用和处理方法一致。
码流成型模块407是编码器的主要模块之一,输入是下混信号的AAC码流和空间参数码流,输出是符合给定语法结构的完整码流。
图5给出了本发明所述空间参数立体声解码***以AAC为核心解码器的结构,与图4的空间参数立体声编码***相匹配。
以AAC为核心解码器的空间参数立体声解码***包括5个模块:码流解析模块501,AAC解码反量化以频域逆处理模块502,动态时频划分模块503,参数合成504,和IMDCT 505。图4所示编码***生成的码流传输到解码***,首先码流解析模块501将码流分离成两部分,下混信号的AAC码流和空间参数码流,分别传送到AAC解码反量化及频域逆处理模块502和参数合成模块504;模块502根据下混信号码流进行熵解码,反量化,以及与AAC编码器对应的频域逆处理,得到频域反量化的下混信号;这个信号经动态时频划分模块503分析给出根据信号短时特性的一个频谱划分,由于反量化信号和时频划分方法与编码***的精确一致,因此给出的划分也与编码***的精确一致;参数合成模块504以每个划分单元为基本单位根据空间参数信息生成左右两路频域信号;最后经IMDCT变换得到时域左右声道信号。
码流解析模块501是解码***的主要模块之一,输入是码流,输出是下混信号的AAC编码码流和空间参数码流。码流解析的过程就是根据给定语法结构将码流切分成基本码流单位。
AAC解码反量化及频域逆处理模块502是AAC解码器的核心模块,输入下混信号的码流,输出是频域反量化的下混信号。具体的熵解码,反量化,及频域逆处理方法可参照MPEG组织的AAC标准文档。这里输出的反量化信号与频域反量化信号是精确一致的。
动态时频划分模块503是本发明实施例的特有模块,输入是频域反量化的下混信号,输出是信号的频谱划分。这里模块503与模块405是精确一致的,因此其输出的频谱划分与模块405输出的也是精确一致的。
参数合成模块504是本发明实施例的特有模块,输入是空间参数码流,频域反量化的下混信号,和频谱的划分,输出是两路频域信号。模块504与图3所示***的模块314的作用和处理方法一致,输入的两路信号包含了编码***传送的空间信息。
IMDCT模块505是AAC解码器的主要模块之一,输入是两路频域信号,输出是时域左右声道信号。模块505和MDCT模块402构成一对互逆的变换。

Claims (8)

1.一种空间参数立体声编码方法,其特征在于包括以下步骤:
步骤1,对输入的左右两路时域音频信号进行下混,生成一路信号;
步骤2,对得到的下混信号进行变换音频编码,生成下混信号的编码数据;
步骤3,获得与下混信号的编码数据对应的下混信号的反量化频谱;
步骤4,分析频域反量化的下混信号,将频谱划分成若干连续且无重叠的子带;
步骤5,以划分的子带为单位,提取输入的左右两路信号在频域每个子带的空间参数信息,生成空间参数编码数据;
步骤6,将下混信号的编码数据和空间参数编码数据按一定格式组合成一路编码码流。
2.如权利要求1所述的空间参数立体声编码方法,其特征在于:步骤1所述的下混是在时域操作,即取左右两路音频信号的时域平均值作为下混信号,其中时域平均值是两路信号在同一时刻处的样点值之和的一半。
3.如权利要求1所述的空间参数立体声编码方法,其特征在于:步骤1所述的下混是在频域操作,即取左右两路音频信号的频域平均值或乘以增益系数,得到频域下混信号,其中频域平均值是两路信号在同一频点处的谱线值之和的一半,增益系数是为了调整下混信号能量而在平均值之上乘的一个正的实数。
4.如权利要求1或2或3所示的空间参数立体声编码方法,其特征在于:步骤3所述的下混信号的反量化频谱,通过对下混信号的编码数据进行解码获得;或者当变换编码过程中生成了下混信号的反量化频谱时,直接从编码过程中获得。
5.一种空间参数立体声解码方法,其特征在于:对包含下混信号和空间参数信息的合成码流进行解码,包括以下步骤:
步骤I,将合成码流分离成下混信号编码数据和空间参数编码数据;
步骤II,对下混信号编码数据进行变换音频解码,生成频域反量化的下混信号,同时将此信号的频谱划分成若干连续且无重叠的子带;
步骤III,根据空间参数编码数据和频域反量化的下混信号,以步骤II划分的子带为单位,生成两路包含频域音频信号,这两路频域音频信号包含空间参数编码数据给定的空间信息;
步骤IV,对两路频域音频信号,进行时频逆变换或综合滤波器组滤波,生成左右两路时域音频信号。
6.一种空间参数立体声编码装置,其特征在于:由下混模块、核心编码模块、核心解码模块、动态时频划分模块、分析滤波器组、参数提取模块和码流成型模块组成,左右两路时域音频信号输入下混模块和分析滤波器组,下混模块的输出接入核心编码器,核心编码器的输出接入核心解码模块,核心解码模块输出接入动态时频划分模块,动态时频划分模块和分析滤波器组的输出接入参数提取模块,核心编码模块的输出和参数提取模块的输出接入码流成型模块。
7.如权利要求6所述的空间参数立体声编码方法,其特征在于:所述核心编码模块采用AAC编码器。
8.一种空间参数立体声解码装置,其特征在于:由码流解析模块、核心解码模块、动态时频划分模块、参数合成模块和综合滤波器组组成,合成码流输入码流解析模块后分离出核心解码数据和空间参数数据,核心解码数据输入核心解码模块,核心解码模块的输出经动态时频划分模块后和空间参数数据共同输入参数合成模块,参数合成模块的输出接入综合滤波器。
CNB2007100537702A 2007-11-06 2007-11-06 一种空间参数立体声编解码方法及其装置 Expired - Fee Related CN100571043C (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CNB2007100537702A CN100571043C (zh) 2007-11-06 2007-11-06 一种空间参数立体声编解码方法及其装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CNB2007100537702A CN100571043C (zh) 2007-11-06 2007-11-06 一种空间参数立体声编解码方法及其装置

Publications (2)

Publication Number Publication Date
CN101162904A true CN101162904A (zh) 2008-04-16
CN100571043C CN100571043C (zh) 2009-12-16

Family

ID=39297757

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB2007100537702A Expired - Fee Related CN100571043C (zh) 2007-11-06 2007-11-06 一种空间参数立体声编解码方法及其装置

Country Status (1)

Country Link
CN (1) CN100571043C (zh)

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011097915A1 (zh) * 2010-02-12 2011-08-18 华为技术有限公司 立体声编码的方法、装置
CN101499280B (zh) * 2009-03-09 2011-11-02 武汉大学 基于空间感知熵判决的空间参数选取方法及其装置
CN102231868A (zh) * 2011-05-18 2011-11-02 上海大学 一种基于高阶录制方式的3d音频重发***
CN101499279B (zh) * 2009-03-06 2011-11-02 武汉大学 空间参数逐级精细的比特分配方法及其装置
WO2012058805A1 (en) * 2010-11-03 2012-05-10 Huawei Technologies Co., Ltd. Parametric encoder for encoding a multi-channel audio signal
CN102682779A (zh) * 2012-06-06 2012-09-19 武汉大学 面向3d音频的双声道编解码方法和编解码器
CN101809656B (zh) * 2008-07-29 2013-03-13 松下电器产业株式会社 音响编码装置、音响解码装置、音响编码解码装置及会议***
CN103065634A (zh) * 2012-12-20 2013-04-24 武汉大学 基于感知特性的三维音频空间参数的量化方法
CN104240712A (zh) * 2014-09-30 2014-12-24 武汉大学深圳研究院 一种三维音频多声道分组聚类编码方法及***
CN105405445A (zh) * 2015-12-10 2016-03-16 北京大学 一种基于声道间传递函数的参数立体声编码、解码方法
WO2018188424A1 (zh) * 2017-04-12 2018-10-18 华为技术有限公司 多声道信号的编解码方法和编解码器
CN109389985A (zh) * 2017-08-10 2019-02-26 华为技术有限公司 时域立体声编解码方法和相关产品

Cited By (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101809656B (zh) * 2008-07-29 2013-03-13 松下电器产业株式会社 音响编码装置、音响解码装置、音响编码解码装置及会议***
CN101499279B (zh) * 2009-03-06 2011-11-02 武汉大学 空间参数逐级精细的比特分配方法及其装置
CN101499280B (zh) * 2009-03-09 2011-11-02 武汉大学 基于空间感知熵判决的空间参数选取方法及其装置
WO2011097915A1 (zh) * 2010-02-12 2011-08-18 华为技术有限公司 立体声编码的方法、装置
US9105265B2 (en) 2010-02-12 2015-08-11 Huawei Technologies Co., Ltd. Stereo coding method and apparatus
CN102844808A (zh) * 2010-11-03 2012-12-26 华为技术有限公司 用于编码多通道音频信号的参数编码器
WO2012058805A1 (en) * 2010-11-03 2012-05-10 Huawei Technologies Co., Ltd. Parametric encoder for encoding a multi-channel audio signal
CN102844808B (zh) * 2010-11-03 2016-01-13 华为技术有限公司 用于编码多通道音频信号的参数编码器
CN102231868A (zh) * 2011-05-18 2011-11-02 上海大学 一种基于高阶录制方式的3d音频重发***
CN102682779B (zh) * 2012-06-06 2013-07-24 武汉大学 面向3d音频的双声道编解码方法和编解码器
CN102682779A (zh) * 2012-06-06 2012-09-19 武汉大学 面向3d音频的双声道编解码方法和编解码器
CN103065634A (zh) * 2012-12-20 2013-04-24 武汉大学 基于感知特性的三维音频空间参数的量化方法
CN103065634B (zh) * 2012-12-20 2014-11-19 武汉大学 基于感知特性的三维音频空间参数的量化方法
CN104240712B (zh) * 2014-09-30 2018-02-02 武汉大学深圳研究院 一种三维音频多声道分组聚类编码方法及***
CN104240712A (zh) * 2014-09-30 2014-12-24 武汉大学深圳研究院 一种三维音频多声道分组聚类编码方法及***
CN105405445A (zh) * 2015-12-10 2016-03-16 北京大学 一种基于声道间传递函数的参数立体声编码、解码方法
CN105405445B (zh) * 2015-12-10 2019-03-22 北京大学 一种基于声道间传递函数的参数立体声编码、解码方法
WO2018188424A1 (zh) * 2017-04-12 2018-10-18 华为技术有限公司 多声道信号的编解码方法和编解码器
US10827297B2 (en) 2017-04-12 2020-11-03 Huawei Technologies Co., Ltd. Multi-channel signal encoding method, multi-channel signal decoding method, encoder, and decoder
US11178505B2 (en) 2017-04-12 2021-11-16 Huawei Technologies Co., Ltd. Multi-channel signal encoding method, multi-channel signal decoding method, encoder, and decoder
US11832087B2 (en) 2017-04-12 2023-11-28 Huawei Technologies Co., Ltd. Multi-channel signal encoding method, multi-channel signal decoding method, encoder, and decoder
CN109389985A (zh) * 2017-08-10 2019-02-26 华为技术有限公司 时域立体声编解码方法和相关产品
CN109389985B (zh) * 2017-08-10 2021-09-14 华为技术有限公司 时域立体声编解码方法和相关产品
US11355131B2 (en) 2017-08-10 2022-06-07 Huawei Technologies Co., Ltd. Time-domain stereo encoding and decoding method and related product
US11900952B2 (en) 2017-08-10 2024-02-13 Huawei Technologies Co., Ltd. Time-domain stereo encoding and decoding method and related product

Also Published As

Publication number Publication date
CN100571043C (zh) 2009-12-16

Similar Documents

Publication Publication Date Title
CN100571043C (zh) 一种空间参数立体声编解码方法及其装置
US20230245667A1 (en) Stereo audio encoder and decoder
US7542896B2 (en) Audio coding/decoding with spatial parameters and non-uniform segmentation for transients
CN101933086B (zh) 处理音频信号的方法和设备
CN102460570B (zh) 用于对音频信号进行编码和解码的方法及设备
CN1774956B (zh) 音频信号合成
CN107925388A (zh) 用于增强瞬时处理的后置处理器、预处理器、音频编码器、音频解码器及相关方法
CN101149925B (zh) 一种用于参数立体声编码的空间参数选取方法
CN101253808B (zh) 用于编码和解码音频信号的装置及其方法
US10438602B2 (en) Audio decoder for interleaving signals
CN102388417A (zh) 基于自适应地可选择的左/右或中央/侧边立体声编码和参数立体声编码的组合的高级立体声编码
CN105164749B (zh) 多声道音频的混合编码
CN104838442A (zh) 用于反向兼容多重分辨率空间音频对象编码的编码器、译码器及方法
CN102165519A (zh) 处理信号的方法和装置
CN106373583A (zh) 基于理想软阈值掩模irm的多音频对象编、解码方法
CN104240712A (zh) 一种三维音频多声道分组聚类编码方法及***
US8271291B2 (en) Method and an apparatus for identifying frame type
CN101635145B (zh) 编解码方法、装置和***
CN117037816A (zh) 多声道音频编码方法、***、介质及设备

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20091216

Termination date: 20151106

EXPY Termination of patent right or utility model