CN1930914B - 对多声道音频信号进行编码和合成的方法和装置 - Google Patents
对多声道音频信号进行编码和合成的方法和装置 Download PDFInfo
- Publication number
- CN1930914B CN1930914B CN2005800070361A CN200580007036A CN1930914B CN 1930914 B CN1930914 B CN 1930914B CN 2005800070361 A CN2005800070361 A CN 2005800070361A CN 200580007036 A CN200580007036 A CN 200580007036A CN 1930914 B CN1930914 B CN 1930914B
- Authority
- CN
- China
- Prior art keywords
- frequency
- audio
- channel
- frequency range
- parametric
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Stereophonic System (AREA)
Abstract
对多声道音频信号,音频编码被应用于不同频率范围的音频输入声道的不同子集。例如,对具有五个常规声道和一个低频(LFE)声道的5.1环绕音响,双声道提示码(BCC)可被应用到所有六个声道的处于或低于指定的截止频率的子频带,而仅仅被应用到五个音频声道(排除了LFE声道)的高于截止频率的子频带。与应用到整个频率范围上的所有输入声道的参数编码技术相比,这种基于频率的声道编码可减少编码和解码处理操作的负担和/或被编码的音频比特流的大小。
Description
技术领域
本发明涉及音频信号的编码以及随后由编码后的音频数据对听觉场景的合成。
相关申请的交叉引用
本申请要求在04年3月4日以代理人卷号Faller 14-2提交的美国临时申请号60/549972的申请日的优先权。本申请的主题涉及2001年5月4日以代理人卷号Faller 5(“‘877申请”)提交的美国专利申请序号09/848877的主题,2001年11月7日以代理人卷号Baumgarte 1-6-8(“‘458申请”)提交的美国专利申请序号10/045458的主题,2002年5月24日以代理人卷号Baumgarte 2-10(“‘437申请”)提交的美国专利申请序号10/155437的主题,以及2004年4月1日以代理人卷号Baumgarte 7-12(“‘591申请”)提交的美国专利申请序号10/815591的主题,这四个专利申请的所有内容都在此并入作为参考。
背景技术
多年来电影院中的多声道环绕音响***已经得到标准化。随着技术的进步,已能够制造用于家庭使用的多声道环绕***。现今,这种***通常作为“家庭影院***”销售。按照ITU-R建议,大多数这类***提供了五个常规音频声道和一个低频超低音喇叭声道(表示低频效果或LFE声道)。这种多声道***被表示为5.1环绕***。还有其它的环绕***,如7.1(七个常规声道和一个LFE声道)和10.2(十个常规声道和两个LFE声道)环绕***。
C.Faller和F.Baumgarte的论文“Efficient representation of spatial audio coding using perceptual parametrization”,IEEE workshop on Appl.of Sig.Proc.to Audio and Acoust.,2001年10月,以及C.Faller和F.Baumgart的论文“Binaural Cue Coding Applied to Stereo and Multi-Channel Audio Compression,”Preprint 112th Conv.Aud.Eng.Soc.,2002年5月(总称为“BCC论文”)的内容均在此并入作为参考,来描述参数多声道音频编码技术(称为BCC编码)。
图1示出了根据BCC论文执行双声道提示编码(BCC)的音频处理***100的方框图。BCC***100具有一个BCC编码器102,它接收C个音频输入声道108,每个声道例如来自C个不同麦克风106中的每个麦克风。BCC编码器102具有一个下混频器110,它将C个音频输入声道转换成单音频相加信号112。
另外,BCC编码器102具有一个BCC分析器114,它为C个输入声道产生BCC提示码数据流116。该BCC提示码(也被称为听觉场景参数)包括每个输入声道的声道间电平差(ICLD)和声道间时间差(ICTD)数据。BCC分析器114执行基于频带的处理,从而为音频输入声道的一个或多个不同的子频带(例如不同的临界频带)中的每个子频带产生ICLD和ICTD数据。
BCC编码器102把相加信号112和BCC提示码数据流116(例如可以是关于该相加信号的带内或带外边信息)发送到BCC***100的BCC解码器104。BCC解码器104具有一个边信息处理器118,它对数据流116进行处理以恢复BCC提示码120(例如ICLD和ICTD数据)。BCC解码器104也具有一个BCC合成器122,它使用恢复的BCC提示码120由相加信号112合成C个音频输出声道124,从而分别通过C个扬声器126来播放。
音频处理***100可以在如5.1环绕音响的多声道音频信号的环境下实现。特别地,BCC编码器102的下混频器110将常规的5.1环绕音响的六个输入声道(即五个常规声道加一个LFE声道)转换成相加信号112。另外,编码器102的BCC分析器114将这六个输入声道变换到频域,以产生相应的BCC提示码116。类似地,BCC解码器 104的边信息处理器118从接收到的边信息流116中恢复BCC提示码120,然后解码器104的BCC合成器122(1)将接收到的相加信号112变换到频域,(2)把恢复的BCC提示码120应用到频域的相加信号以产生六个频域信号,然后(3)把这些频域信号变换到合成的5.1环绕音响的六个时域声道(即五个合成的常规声道加一个合成的LFE声道),以通过扬声器126播放。
发明内容
根据本发明,提供了:
对具有多个音频输入声道的多声道音频信号进行编码的方法,所述多声道音频信号具有多个常规声道和至少一个低频效果声道,该方法包括:应用参数音频编码技术为用于第一个频率范围的所有音频输入声道产生参数音频编码,所述第一个频率范围对应于低于指定截止频率的一个或多个子频带;以及应用参数音频编码技术仅仅为用于第二个频率范围的常规声道产生参数音频编码,所述第二个频率范围对应于高于指定截止频率的一个或多个子频带,其中:对于第一个频率范围,参数音频编码技术生成对应于所有音频输入声道的参数音频编码;以及对于第二个频率范围,参数音频编码技术生成仅仅对应于常规声道,而不针对至少一个低频效果声道的参数音频编码。
对具有多个音频输入声道的多声道音频信号进行编码的装置,所述多声道音频信号具有多个常规声道和至少一个低频效果声道,该装置包括:应用参数音频编码技术为用于第一个频率范围的所有音频输入声道产生参数音频编码的装置,所述第一个频率范围对应于低于指定截止频率的一个或多个子频带;以及应用参数音频编码技术仅仅为用于第二个频率范围的常规声道产生参数音频编码的装置,所述第二个频率范围对应于高于指定截止频率的一个或多个子频带,其中:对于第一个频率范围,参数音频编码技术生成对应于所有音频输入声道的参数音频编码;以及对于第二个频率范围,参数音频编码技术生成仅仅对应于常规声道,而不针对至少一个低频效果声道的参数音频编 码。
一种参数音频编码器,包括:适用于由多声道音频信号的多个音频输入声道产生一个或多个组合声道的下混频器,所述多声道音频信号具有多个常规声道和至少一个低频效果声道;以及分析器,用于产生:(1)用于第一个频率范围内的所有音频输入声道的参数音频编码,所述第一个频率范围对应于低于指定截止频率的一个或多个子频带;以及(2)仅仅用于第二个频率范围内的常规声道的参数音频编码,所述第二个频率范围对应于高于指定截止频率的一个或多个子频带,其中:对于第一个频率范围,分析器生成对应于所有音频输入声道的参数音频编码;以及对于第二个频率范围,分析器生成仅仅对应于常规声道,而不针对至少一个低频效果声道的参数音频编码。
对具有多个音频输出声道的多声道音频信号进行合成的方法,所述多声道音频信号具有多个常规声道和至少一个低频效果声道,该方法包括:应用参数音频解码技术产生用于第一个频率范围的所有音频输出声道,所述第一个频率范围对应于低于指定截止频率的一个或多个子频带;以及应用参数音频解码技术仅仅产生用于第二个频率范围的常规声道,所述第二个频率范围对应于高于指定截止频率的一个或多个子频带;其中:参数音频解码技术使用参数音频编码生成音频输出声道;对于第一个频率范围,参数音频编码对应于所有音频输出声道;以及对于第二个频率范围,参数音频编码仅仅对应于常规声道,而不针对至少一个低频效果声道。
对具有多个音频输出声道的多声道音频信号进行合成的装置,所述多声道音频信号具有多个常规声道和至少一个低频效果声道,该装置包括:应用参数音频解码技术产生用于第一个频率范围的所有音频输出声道的装置,所述第一个频率范围对应于低于指定截止频率的一个或多个子频带;以及应用参数音频解码技术产生仅仅用于第二个频率范围的常规声道的装置,所述第二个频率范围对应于高于指定截止频率的一个或多个子频带;其中:参数音频解码技术使用参数音频编码生成音频输出声道;对于第一个频率范围,参数音频编码对应于所有音频输出声道;以及对于第二个频率范围,参数音频编码仅仅对应于常规声道,而不针对至少一个低频效果声道。
一种参数音频解码器,用于合成具有多个音频输出声道的多声道音频信号,所述多声道音频信号具有多个常规声道和至少一个低频效果声道,所述参数音频解码器包括:边信息处理器,其适用于恢复参数音频编码,以及合成器,其适于:应用参数音频解码技术产生用于第一个频率范围的所有音频输出声道,所述第一个频率范围对应于低于指定截止频率的一个或多个子频带;以及应用参数音频解码技术产生仅仅用于第二个频率范围的常规声道,所述第二个频率范围对应于高于指定截止频率的一个或多个子频带;其中:参数音频解码技术使用参数音频编码生成音频输出声道;对于第一个频率范围,参数音频编码对应于所有音频输出声道;以及对于第二个频率范围,参数音频编码仅仅对应于常规声道,而不针对至少一个低频效果声道。
为了环绕音响的应用,本发明的实施例涉及基于BCC的参数音频编码技术,其中基于频带的BCC编码并不应用于低频超低音喇叭(LFE)声道的高于截止频率的子频带。例如,对5.1环绕音响而言,BCC编码应用于所有的六个声道(即五个常规声道加一个LFE声道)的低于截止频率的子频带,而BCC编码仅仅应用于五个常规声道(即不应用于LFE声道)的高于截止频率的子频带。通过避免BCC编码在LFE声道的“高”频上的应用,本发明的这些实施例与相应的在所有频率上处理所有六个声道的基于BCC的***相比,具有(1)减少的编码器和解码器处理负担和(2)更小的BCC码比特流。
更一般而言,本发明涉及如BCC编码等参数音频编码技术的应用,但并不局限于BCC编码,其中在两个或更多个不同的频率范围内处理输入声道的两个或更多个不同的子集。如在该说明书中所使用的,术语“子集”可指包含所有输入声道的集合以及那些包括比所有输入声道要少声道的适当的子集。本发明在5.1和其它环绕音响信号的BCC编码中的应用只是本发明的一种特例。
附图说明
本发明的其它方面、特征和优点将由下面的具体描述、所附的权利要求以及附图而更加明显,其中:
图1示出了执行双声道提示码(BCC)的音频处理***的方框图;以及
图2示出了根据本发明的一个实施例执行BCC编码的音频处理***的方框图。
具体实施方式
图2示出了根据本发明的一个实施例执行5.1环绕音响的双声道提示编码(BCC)的音频处理***200的方框图。BCC***200具有一个BCC编码器202,它接收六个音频输入声道208(即五个常规声道和一个LFE声道)。BCC编码器202具有一个下混频器210,它把音频输入声道(包括LFE声道)转换(例如取平均)为一个或多个、但少于六个的组合声道212。
另外,BCC编码器202具有一个BCC分析器214,它为输入声道产生BCC提示码数据流216。如图2所示,对处于或低于一个指定的截止频率fc的子频带,BCC分析器214在生成BCC提示码数据时使用所有的六个5.1环绕音响输入声道(包括LFE声道)。对所有其它(即高频)的子频带,BCC分析器214仅使用五个常规声道(不使用LFE声道)来产生BCC提示码数据。结果,LFE声道仅对处于或低于截止频率的BCC子频带、而不是对整个BCC频率范围贡献BCC码,从而减小了边信息比特流的整个大小。
截止频率最好被选择为使得LFE声道的有效音频带宽小于或等于fc(即LFE声道在超过截止频率时实际上没有能量或者没有实际的音频内容)。除非子频带被调整到截止频率,否则截止频率将落入特定的子频带内。这种情况下,部分子频带将超过截止频率。为了便于说明,这样的子频带被称为“处于”截止频率上。在优选的实施例中, LFE声道的整个子频带都被BCC编码,下一个较高频率的子频带为未经过BCC编码的第一高频子频带。
在一种可能的实现方式中,BCC提示码包括输入声道的声道间电平差(ICLD)、声道间时间差(ICTD)以及声道间相关(ICC)数据。BCC分析器214最好执行类似于’877和’458申请中所描述的基于频带的处理,从而为音频输入声道的不同子频带产生ICLD和ICTD数据。另外,BCC分析器214最好为不同的子频带产生作为ICC数据的相干性量度。这些相干性量度在’437和’591申请中做了更具体的描述。
BCC编码器202将一个或多个组合声道212以及BCC提示码数据流216(例如关于该组合声道的带内或带外边信息)发送到BCC***200的BCC解码器204。BCC解码器204具有一个边信息处理器218,它对数据流216进行处理,以恢复BCC提示码220(例如ICLD、ICTD和ICC数据)。BCC解码器204还具有一个BCC合成器222,它使用恢复的BCC提示码220由一个或多个组合声道212合成六个音频输出声道224,从而分别通过六个环绕音响扬声器226播放。
如图2所示,BCC合成器222对处于或低于截止频率fc的子频带执行六个声道的BCC合成,从而为所有的六个5.1环绕声道(即包括LFE声道)产生频率内容,同时对高于截止频率的子频带执行五声道BCC合成,从而仅仅为5.1环绕音响的五个常规声道产生频率内容。特别地,BCC合成器222把接收到的组合声道212分解为多个子频带(例如临界频带)。在这些子频带中应用不同的处理以获取输出音频声道的相应子频带。结果,对于LFE声道仅获取其频率处于或低于截止频率的子频带。换句话说,LFE声道仅具有处于或低于截止频率的子频带的频率内容。LFE声道的较高的子频带(即那些高于截止频率的子频带)可以用零信号来填充(如果必要的话)。
根据特别的实现方式,BCC编码器可以被设计为对所有的频率产生BCC提示码,且简单地不对特别的子频带(例如高于截止频率的子频带和/或实际上具有零能量的子频带)发送这些提示码。类似地, 相应的BCC解码器可以被设计为对所有的频率执行常规的BCC合成,其中BCC解码器对那些不具有明确传送的编码的子频带应用合适的BCC提示码值。
虽然本发明已经在应用了’877和’458申请所述的技术来合成听觉场景的BCC解码器的情况下进行了描述,但是本发明也可在应用其它技术来合成听觉场景的BCC解码器的情况下实现,而不必依赖于’877和’458申请所述的技术。例如,本发明的BCC处理的实现可无需ICTD、ICLD和/或ICC数据,可使用或不使用其它合适的例如与头部相关传递函数相关联的提示码。
在图2的实施例中,通过把六声道BCC分析应用到处于或低于截止频率的子频带以及把五声道BCC分析应用到高于截止频率的子频带来对5.1环绕音响进行编码。在另一个实施例中,本发明可应用于7.1环绕音响,其中八声道BCC分析被应用到处于或低于指定的截止频率的子频带,七声道BCC分析(排除了单个LFE声道)被应用到高于截止频率的子频带。
本发明还可应用于具有超过一个LFE声道的环绕音响。例如对于10.2环绕音响,可将十二声道BCC分析应用到处于或低于指定的截止频率的子频带,而将十声道BCC分析(排除了两个LFE声道)应用到高于截止频率的子频带。作为替代,也可以指定两个不同的截止频率:用于10.2环绕音响的第一个LFE声道的第一截止频率以及用于第二个LFE声道的第二截止频率。在这种情况下,假定第一截止频率低于第二截止频率,可将十二声道BCC分析应用到处于或低于第一截止频率的子频带,而将十一声道BCC分析(排除了第一个LFE声道)应用到(1)高于第一截至频率且(2)处于或低于第二截止频率的子频带,并将十声道BCC分析(排除了两个LFE声道)应用到高于第二截止频率的子频带。
类似地,一些消费类多声道设备被特意设计为具有不同频率范围的不同输出声道。例如,一些5.1环绕音响设备具有两个后方声道,这些后方声道被设计为仅再现低于7kHz的频率。本发明通过指定两 个截止频率可应用于这类***:一个截止频率用于LFE声道,而一个较高的用于后方声道。在这种情况下,六声道BCC分析可被应用到处于或低于LFE截止频率的子频带,五声道BCC分析(排除了LFE声道)可被应用到(1)高于LFE截止频率和(2)处于或低于后方声道截止频率的子频带,三声道BCC分析(排除了LFE声道和两个后方声道)可被应用到高于后方声道截止频率的子频带。
本发明还可进一步推广用于把参数音频编码应用于两个或更多个不同频率范围内的输入声道的两个或更多个不同的子集,其中参数音频编码可以不同于BCC编码,不同频率范围被选择为使得不同输入声道的频率内容在这些范围内反映出来。根据特定的应用,不同的声道可以以任何适当的组合被排除在不同频率范围之外。例如,低频声道可以被排除在高频区域之外和/或高频声道可以被排除在低频区域之外。甚至可以是这种情况,即任何单个频率范围都不能包含所有的输入声道。
如先前所述,尽管输入声道208可以被下混频以形成单个组合(例如单)声道212,在可选的实现方式中,根据特定的音频处理应用,多个输入声道可以被下混频从而形成两个或多个不同的“组合”声道。这种技术的更多信息可见04年1月20日提交的美国专利申请号10/762100,其内容在此并入作为参考。
在一些实现方式中,当进行下混频以产生多个组合声道时,组合声道的数据可使用常轨的音频传输技术来传送。例如,在产生两个组合声道时,能够使用常轨的立体声传输技术。在这种情况下,BCC解码器可提取并使用BCC编码从两个组合声道合成多声道信号(例如5.1环绕音响)。此外,这可以提供向下的兼容性,其中两个BCC合成声道使用常轨的(即不基于BCC的)立体声解码器来回放而忽略BCC编码。类似地,向下兼容性的实现可在产生单个BCC组合声道时用于常轨的单解码器。要注意的是,理论上讲,当有多个“组合”声道时,这些组合声道中的一个或多个实际上可基于单独的输入声道。
虽然BCC***200可具有与音频输出声道相同数目的音频输入 声道,但在作为替代的实施例中,输入声道的数目可根据特定的应用大于或小于输出声道的数目。例如,输入音频可对应于7.1环绕音响,而合成的输出音频可对应于5.1环绕音响,反之亦然。
一般来讲,本发明的BCC编码器的实现可基于这样一种情况,即把M个输入音频声道转换成N个组合声道以及一个或多个相应的BCC编码子集,其中M>N≥1。类似地,本发明的BCC解码器的实现还可基于这样一种情况,即从N个组合音频声道中产生P个输出声道以及相应的BCC编码子集,其中P>N,且P可以和M相同也可以不同。
根据特定的实现方式,图2的BCC编码器202和BCC解码器204二者接收到的以及产生的多种不同信号可以是模拟和/数字信号的任何适当的组合,包括所有的模拟信号或所有的数字信号。虽然图2中未作显示,但本领域的技术人员可以理解,一个或多个组合声道212以及BCC提示码数据流116可由BCC编码器202进行进一步的编码,并由BCC解码器204进行相应的解码,例如基于一些适当的压缩机制(例如ADPCM)进一步减小传送的数据的大小。
从BCC编码器202到BCC解码器204的数据传输的定义取决于音频处理***200的特定应用。例如,在一些实施例中,如音乐会的现场广播,传输可涉及数据的实时传输以便在远端位置立即播放。在其它的应用中,“传输”可涉及数据到CD或其它适当的存储介质的存储以用于以后的(即非实时的)播放。当然,其它的应用也是有可能的。
根据特定的实现方式,传输信道可以是有线的或无线的,可以使用定制的或标准化的协议(例如IP)。如CD、DVD、数字磁带录音机以及固态存储器等介质可用于存储。此外,传输和/或存储可以包括、但并不必须包括信道编码。类似地,虽然本发明已经基于数字音频***做了描述,但本领域的技术人员可以理解的是,本发明还可基于模拟音频***的情况来实现,如AM无线电、FM无线电以及模拟电视广播的音频部分,以上均支持附加的带内低比特率传输信道的引入。
本发明的实现还可用于许多种不同的应用,如音乐再现、广播和 电话技术。例如,本发明的实现还可用于数字无线电/电视/因特网(例如网站户播)广播,如天狼星卫星广播公司或XM卫星广播公司。其它的应用包括IP语音、PSTN或其它语音网络、模拟无线电广播和因特网广播。
根据特定的应用,可采用不同的技术把BCC编码的集合嵌入到组合声道中从而获得本发明的BCC信号。任何特定技术的可行性可能至少部分地依赖于用于BCC信号的特定的传输/存储介质。例如,数字无线电广播协议通常支持包括被常规接收机忽略的附加增强比特(例如,在数据包的包头部分)。这些附加的比特可用来表示听觉场景参数的集合以提供BCC信号。一般来说,本发明的实现中可使用任何合适的技术为音频信号做标记,其中对应于听觉场景参数集合的数据被嵌入到音频信号中从而形成BCC信号。例如,这些技术可涉及隐藏在感知遮蔽曲线下的数据或隐藏在伪随机噪声中的数据。伪随机噪声感觉起来像平缓的噪声。数据嵌入的实现还可使用类似于TDM(时分复用)传输中采用的位元抢夺方法,从而用于带内信令。另一种可能的技术是μ律LSB位翻转,其中最低有效位用来传送数据。
本发明可用基于电路的处理方式来实现,包括在单个集成电路上的可能的实现。对本领域技术人员来说很明显,电路元件的多种功能还可用软件程序中的处理步骤来实现。这样的软件例如可用于数字信号处理器、微控制器或通用计算机中。
本发明可以用这些方法以及实现这些方法的装置的形式来体现。本发明还可以用包含在如软盘、CD-ROM、硬盘或其它任何机器可读存储介质等的有形介质中的程序代码的形式来体现,其中当程序代码被加载到如计算机等的机器中并被执行时,该机器就成为实现本发明的装置。本发明还可以用程序代码的形式来体现,这些程序代码例如存储在存储介质中、加载到机器中和/或由机器执行,或者通过某些传输介质或载体来传送,如在电线或电缆上、通过光纤、或经由电磁辐射进行传送,其中当程序代码被加载到如计算机等的机器中并被执行时,该机器就成为实现本发明的装置。当在通用处理器上实现时,程序代码段与该处理器共同提供一种可类似于专用逻辑电路工作的唯一的装置。
还应理解的是,为了便于阐述本发明的本质而已经描述和展示的部件的细节、材料以及排列,都可由本领域技术人员在不违背如下面的权利要求所表述的本发明的范围的情况下加以改变。
Claims (16)
1.对具有多个音频输入声道的多声道音频信号进行编码的方法,所述多声道音频信号具有多个常规声道和至少一个低频效果声道,该方法包括:
应用参数音频编码技术为用于第一个频率范围的所有音频输入声道产生参数音频编码,所述第一个频率范围对应于低于指定截止频率的一个或多个子频带;以及
应用参数音频编码技术仅仅为用于第二个频率范围的常规声道产生参数音频编码,所述第二个频率范围对应于高于指定截止频率的一个或多个子频带,其中:
对于第一个频率范围,参数音频编码技术生成对应于所有音频输入声道的参数音频编码;以及
对于第二个频率范围,参数音频编码技术生成仅仅对应于常规声道,而不针对至少一个低频效果声道的参数音频编码。
2.根据权利要求1的方法,其中参数音频编码技术是双声道提示码BCC编码,并且所述参数音频编码是BCC码。
3.根据权利要求1的方法,其中截止频率至少是低频效果声道的有效音频带宽。
4.根据权利要求1的方法,其中多声道音频信号是5.1环绕音响信号。
5.根据权利要求1的方法,还包括传送用于第一和第二个频率范围的参数音频编码。
6.对具有多个音频输入声道的多声道音频信号进行编码的装置,所述多声道音频信号具有多个常规声道和至少一个低频效果声道,该装置包括:
应用参数音频编码技术为用于第一个频率范围的所有音频输入声道产生参数音频编码的装置,所述第一个频率范围对应于低于指定截止频率的一个或多个子频带;以及
应用参数音频编码技术仅仅为用于第二个频率范围的常规声道产生参数音频编码的装置,所述第二个频率范围对应于高于指定截止频率的一个或多个子频带,其中:
对于第一个频率范围,参数音频编码技术生成对应于所有音频输入声道的参数音频编码;以及
对于第二个频率范围,参数音频编码技术生成仅仅对应于常规声道,而不针对至少一个低频效果声道的参数音频编码。
7.一种参数音频编码器,包括:
适用于由多声道音频信号的多个音频输入声道产生一个或多个组合声道的下混频器,所述多声道音频信号具有多个常规声道和至少一个低频效果声道;以及
分析器,用于产生:
(1)用于第一个频率范围内的所有音频输入声道的参数音频编码,所述第一个频率范围对应于低于指定截止频率的一个或多个子频带;以及
(2)仅仅用于第二个频率范围内的常规声道的参数音频编码,所述第二个频率范围对应于高于指定截止频率的一个或多个子频带,其中:
对于第一个频率范围,分析器生成对应于所有音频输入声道的参数音频编码;以及
对于第二个频率范围,分析器生成仅仅对应于常规声道,而不针对至少一个低频效果声道的参数音频编码。
8.根据权利要求7的参数音频编码器,其中参数音频编码是BCC编码。
9.根据权利要求7的参数音频编码器,还包括适用于传送第一和第二个频率范围的参数音频编码。
10.对具有多个音频输出声道的多声道音频信号进行合成的方法,所述多声道音频信号具有多个常规声道和至少一个低频效果声道,该方法包括:
应用参数音频解码技术产生用于第一个频率范围的所有音频输出声道,所述第一个频率范围对应于低于指定截止频率的一个或多个子频带;以及
应用参数音频解码技术仅仅产生用于第二个频率范围的常规声道,所述第二个频率范围对应于高于指定截止频率的一个或多个子频带;其中:
参数音频解码技术使用参数音频编码生成音频输出声道;
对于第一个频率范围,参数音频编码对应于所有音频输出声道;以及
对于第二个频率范围,参数音频编码仅仅对应于常规声道,而不针对至少一个低频效果声道。
11.根据权利要求10的方法,其中参数音频解码技术是BCC解码。
12.根据权利要求10的方法,其中截止频率至少是低频效果声道的有效音频带宽。
13.根据权利要求10的方法,其中多声道音频信号是5.1环绕音响信号。
14.对具有多个音频输出声道的多声道音频信号进行合成的装置,所述多声道音频信号具有多个常规声道和至少一个低频效果声道,该装置包括:
应用参数音频解码技术产生用于第一个频率范围的所有音频输出声道的装置,所述第一个频率范围对应于低于指定截止频率的一个或多个子频带;以及
应用参数音频解码技术产生仅仅用于第二个频率范围的常规声道的装置,所述第二个频率范围对应于高于指定截止频率的一个或多个子频带;其中:
参数音频解码技术使用参数音频编码生成音频输出声道;
对于第一个频率范围,参数音频编码对应于所有音频输出声道;以及
对于第二个频率范围,参数音频编码仅仅对应于常规声道,而不针对至少一个低频效果声道。
15.一种参数音频解码器,用于合成具有多个音频输出声道的多声道音频信号,所述多声道音频信号具有多个常规声道和至少一个低频效果声道,所述参数音频解码器包括:
边信息处理器,其适用于恢复参数音频编码,以及
合成器,其适于:
应用参数音频解码技术产生用于第一个频率范围的所有音频输出声道,所述第一个频率范围对应于低于指定截止频率的一个或多个子频带;以及
应用参数音频解码技术产生仅仅用于第二个频率范围的常规声道,所述第二个频率范围对应于高于指定截止频率的一个或多个子频带;其中:
参数音频解码技术使用参数音频编码生成音频输出声道;
对于第一个频率范围,参数音频编码对应于所有音频输出声道;以及
对于第二个频率范围,参数音频编码仅仅对应于常规声道,而不针对至少一个低频效果声道。
16.根据权利要求15的参数音频解码器,其中参数音频编码是BCC编码。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US54997204P | 2004-03-04 | 2004-03-04 | |
US60/549,972 | 2004-03-04 | ||
US10/827,900 US7805313B2 (en) | 2004-03-04 | 2004-04-20 | Frequency-based coding of channels in parametric multi-channel coding systems |
US10/827,900 | 2004-04-20 | ||
PCT/US2005/005605 WO2005094125A1 (en) | 2004-03-04 | 2005-02-23 | Frequency-based coding of audio channels in parametric multi-channel coding systems |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1930914A CN1930914A (zh) | 2007-03-14 |
CN1930914B true CN1930914B (zh) | 2012-06-27 |
Family
ID=37859620
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2005800070361A Active CN1930914B (zh) | 2004-03-04 | 2005-02-23 | 对多声道音频信号进行编码和合成的方法和装置 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN1930914B (zh) |
RU (1) | RU2323551C1 (zh) |
Families Citing this family (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2144229A1 (en) * | 2008-07-11 | 2010-01-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Efficient use of phase information in audio encoding and decoding |
EP2306452B1 (en) * | 2008-07-29 | 2017-08-30 | Panasonic Intellectual Property Management Co., Ltd. | Sound coding / decoding apparatus, method and program |
CA2820199C (en) * | 2008-07-31 | 2017-02-28 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. | Signal generation for binaural signals |
JP5635502B2 (ja) | 2008-10-01 | 2014-12-03 | ジーブイビービー ホールディングス エス.エイ.アール.エル. | 復号装置、復号方法、符号化装置、符号化方法、及び編集装置 |
EP2175670A1 (en) * | 2008-10-07 | 2010-04-14 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Binaural rendering of a multi-channel audio signal |
CN102203854B (zh) * | 2008-10-29 | 2013-01-02 | 杜比国际公司 | 使用预先存在的音频增益元数据的信号削波保护 |
EP2214161A1 (en) * | 2009-01-28 | 2010-08-04 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus, method and computer program for upmixing a downmix audio signal |
ES2644974T3 (es) | 2010-07-19 | 2017-12-01 | Dolby International Ab | Procesamiento de señales de audio durante la reconstrucción de alta frecuencia |
US12002476B2 (en) | 2010-07-19 | 2024-06-04 | Dolby International Ab | Processing of audio signals during high frequency reconstruction |
US8675719B2 (en) * | 2010-09-28 | 2014-03-18 | Tektronix, Inc. | Multi-domain test and measurement instrument |
CA2880028C (en) * | 2012-08-03 | 2019-04-30 | Thorsten Kastner | Decoder and method for a generalized spatial-audio-object-coding parametric concept for multichannel downmix/upmix cases |
US9607624B2 (en) * | 2013-03-29 | 2017-03-28 | Apple Inc. | Metadata driven dynamic range control |
-
2005
- 2005-02-23 RU RU2006134979/09A patent/RU2323551C1/ru active
- 2005-02-23 CN CN2005800070361A patent/CN1930914B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN1930914A (zh) | 2007-03-14 |
RU2323551C1 (ru) | 2008-04-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1930914B (zh) | 对多声道音频信号进行编码和合成的方法和装置 | |
EP1721489B1 (en) | Frequency-based coding of audio channels in parametric multi-channel coding systems | |
CN103649706B (zh) | 三维音频音轨的编码及再现 | |
US8352280B2 (en) | Scalable multi-channel audio coding | |
RU2367033C2 (ru) | Многоканальное иерархическое аудиокодирование с компактной дополнительной информацией | |
CN101568958B (zh) | 用于处理音频信号的方法和装置 | |
US8150701B2 (en) | Method and apparatus for embedding spatial information and reproducing embedded signal for an audio signal | |
KR101283783B1 (ko) | 고품질 다채널 오디오 부호화 및 복호화 장치 | |
JP4794448B2 (ja) | オーディオエンコーダ | |
US20200013426A1 (en) | Synchronizing enhanced audio transports with backward compatible audio transports | |
KR102172279B1 (ko) | 스케일러블 다채널 오디오 신호를 지원하는 부호화 장치 및 복호화 장치, 상기 장치가 수행하는 방법 | |
US11081116B2 (en) | Embedding enhanced audio transports in backward compatible audio bitstreams | |
TWI501220B (zh) | 嵌入與擷取輔助資料 | |
Purnhagen et al. | Immersive audio delivery using joint object coding | |
US11062713B2 (en) | Spatially formatted enhanced audio data for backward compatible audio bitstreams | |
Herre | Audio coding-an all-round entertainment technology |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: DE Ref document number: 1101634 Country of ref document: HK |
|
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: GR Ref document number: 1101634 Country of ref document: HK |