CN1922654A - 音频分发***、音频编码器、音频解码器及其操作方法 - Google Patents
音频分发***、音频编码器、音频解码器及其操作方法 Download PDFInfo
- Publication number
- CN1922654A CN1922654A CNA2005800050974A CN200580005097A CN1922654A CN 1922654 A CN1922654 A CN 1922654A CN A2005800050974 A CNA2005800050974 A CN A2005800050974A CN 200580005097 A CN200580005097 A CN 200580005097A CN 1922654 A CN1922654 A CN 1922654A
- Authority
- CN
- China
- Prior art keywords
- parameter
- channel
- signal
- coding
- hyperchannel
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 19
- 238000009826 distribution Methods 0.000 title description 7
- 230000005236 sound signal Effects 0.000 claims abstract description 17
- 230000004044 response Effects 0.000 claims description 11
- 238000004590 computer program Methods 0.000 claims 2
- 230000008569 process Effects 0.000 abstract description 2
- 238000010586 diagram Methods 0.000 description 6
- 230000006870 function Effects 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 230000008030 elimination Effects 0.000 description 3
- 238000003379 elimination reaction Methods 0.000 description 3
- 238000005457 optimization Methods 0.000 description 3
- 230000009467 reduction Effects 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 230000002708 enhancing effect Effects 0.000 description 2
- 238000003384 imaging method Methods 0.000 description 2
- 238000003860 storage Methods 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 241001269238 Data Species 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000003190 augmentative effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 239000012141 concentrate Substances 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 230000007274 generation of a signal involved in cell-cell signaling Effects 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000001846 repelling effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000005728 strengthening Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Mathematical Physics (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Stereophonic System (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
一种立体声音频编码器(100),包括参量立体声编码器(115),其为输入立体声信号的至少高频部分生成单声道信号和参量立体声参数。立体声强度编码器(117)为单声道信号生成立体声强度数据。该单声道信号和强度数据根据编码标准比如MPEG层II被编码,并且输出处理器(113)把参量立体声参数包括在辅助数据部分中。因此,传统解码器(比如MPEG层II解码器)可以使用立体声强度数据来生成立体声信号,而较高复杂度的解码器可以使用参量立体声参数来生成高质量音频信号。立体声解码器(200)从编码器(100)接收编码数据。强度解码器(203)使用强度数据来生成立体声信号。这一信号被馈送到参量立体声解码器(207),参量立体声解码器(207)根据提取的参量立体声数据来处理立体声信号。
Description
技术领域
本发明涉及音频分发***、音频编码器、音频解码器及其操作方法,并且特别是涉及多通道音频编码和解码。
发明背景
近年来,数字形式的内容信号的分发和存储已经显著地增加。相应地,已经开发出大量的编码标准和协议。
对于音频信号的数字音频编码,最普遍的编码标准之一是通常称作MP3的运动图像专家组层3标准。举例来说,MP3允许一首歌曲的30或40兆字节的数字PCM(脉冲编码调制)音频记录被压缩成例如3或4兆字节的MP3文件。精确的压缩率取决于MP3编码音频的想要的质量。音频编码标准和技术的其他例子包括:MPEG AAC(高级音频编码)、ATRAC3(自适应变换声学编码)、AC-3、PAC(感知音频编码器)、DTS(数字影院***)和Ogg Vorbis。
音频编码和压缩技术比如MP3或AAC提供很有效的音频编码,该音频编码允许相当低的数据大小和相当高的质量的音频文件通过包括例如因特网的数据网络被方便地分发。
许多编码协议也提供立体声(两通道)信号的有效编码。特别地,强度立体声编码和中/侧(Mid/Side,MS)编码在本技术领域是熟知的、并且是被广泛使用的技术,该技术利用了立体声或多通道音频编码器中的通道间的冗余和不相干。使用这些技术,对于给定的声音质量来说有可能获得较低的比特速率,或者在给定的比特速率下有可能提高声音质量。采用这些技术的音频编码器的例子是MPEG层II、MPEG层III(MP3)、AAC、ATRAC3和AC-3。
相比于音频通道的独立编码,强度立体声编码允许比特速率上的很大降低。在强度立体声中,为较高频率范围的信号生成单声道音频信号。而且,为不同的通道生成单独的强度参数。典型地,强度参数为左和右比例因子的形式,所述比例因子在解码器中用来从单声道音频信号生成左和右输出信号。变化在于单个比例因子和方向参数的使用。
然而,强度立体声编码技术具有一些缺点。首先,编码器丢弃较高频率的时间和相位信息。解码器因此不能再现在原始音频材料中存在的时间或相位通道差。而且,一般而言,该编码不能保持音频通道间的相关性。相应地,由编码器生成的立体声信号的质量下降不可避免。
此外,在子带编码中,编码处理的相邻频段间的混叠消除(aliasingcancellation)依赖于用于各个子带的、通过编码器和解码器的精确的总的转移函数。因为该转移函数由于强度数据而可能在不同的子带中不同地变化,所以相邻频段间的混叠消除被破坏。类似的问题出现在使用MDCT变换的、依赖于时域混叠消除的编码器中。
另外,当比例因子被用作强度参数时,这些参数的精确度通常不足以获得高的音频质量。
尽管MS编码不受这些缺点的影响,但是MS编码的比特速率效率通常相当地低,导致高数据速率。在最差情形的情况下,与左和右通道的独立编码相比,MS编码不提供任何比特速率上的增益。
因此,已经采取有意义的研究来提供更有效的多通道编码技术。然而,由于现有编码技术的广泛传播,对于新技术来说,与现有协议后向兼容更可取。
最近开发的一种用于多通道音频信号编码的技术被称为参量立体声(PS)。此技术可以以后向兼容的方式应用在其它音频编码方案之上。特别地,PS可以生成立体声增强数据来添加到单声道MP3或AAC编码信号上。该增强数据可以被存储在MP3或AAC数据流的辅助数据部分,因此允许传统的解码器忽略添加的数据。
在PS中,立体声音频编码是通过使用例如MP3或AAC来编码仅仅单个单声道信号而获得的。而且,立体声成像参数在编码器中被确定并且被包括在数据流中作为单独的扩展数据。在解码器处,通过取决于立体声成像参数而在两个通道中不同地处理单声道编码信号,将单声道编码信道扩充成立体声通道。这些参数可以由通道间强度差(IID)、通道间时间或相位差(ITD或IPD)和通道间互相关(ICC)组成。
对于PS,只要增强参数的数据速率不超过辅助数据部分的可用容量,增强参数就可以被有效地编码成核心编码方案的辅助数据部分。可选地,为辅助数据保留的比特量可以被选择,以便所需的PS增强数据适应于它。实验表明,通过相比于单声道编码信号的仅一些额外的kbps,就有可能得到高质量的立体声编码。
传统解码器将不处理辅助数据,而只解码核心编码数据,并且以这种方式保持后向兼容性,因为音频信号可以由传统的解码器来生成。
然而,此技术的缺点是传统解码器仅再现单声道信号。因此,包含在辅助数据部分中的立体声信息被忽略。立体声信号的单声道再现代表了通常不可接受的严重的质量下降。
因此,改进的多通道音频编码/解码技术将是有益的,并且特别是提供了改进的性能、提高的质量、降低的数据速率和/或改进的后向兼容性的多通道音频编码/解码技术将是有益的。
发明内容
因而,本方面优选地寻求单个地或以任何组合的方式来减轻、减缓或消除一个或多个上述缺点。
根据本发明的第一方面,提供了一种多通道音频编码器,包括:用于接收输入多通道信号的装置;参量多通道编码器,用于为该输入多通道信号的至少第一部分生成单通道信号和多通道参数,该多通道参数包括与单通道信号有关的多通道信息;多通道强度编码器,用于响应于输入多通道信号和单通道信号来生成多通道强度数据;以及用于生成包括单通道信号、强度数据和多通道参数的编码音频输出数据的装置。
多通道强度数据可以与第一编码标准比如MP3、AAC等兼容。单通道信号可以根据同一编码标准被编码。在该应用中,术语多通道指的是两个或多个通道。多通道参数可以是参量扩展数据,并且可以特别地是参量立体声数据,该立体声数据可以被用于提供来自单通道信号并可能来自强度数据的立体声信号。在该应用中,术语立体声通道指的是两个通道并且因此立体声信号指的是两通道信号。多通道参数可以具有不包括在用于单通道信号或用于多通道强度数据的编码标准中的格式。
该编码器可提供一种信号,该信号可以使用多通道参数来提供有效的和/或高质量的多通道编码。适合的解码器可以生成高质量的多通道信号,而不能利用多通道参数的信息的解码器,例如传统解码器,仍旧可以提供多通道信号(尽管典型地处于较低的质量)。因此,本发明可以允许提高的性能和后向兼容性,并且可以特别地允许多通道信号在传统解码器中生成。
特别地,该多通道参数可以被包括在编码音频输出数据的辅助(或补充)数据部分。例如,多通道参数可以被包括在MP3或AAC数据流的辅助数据部分。这将允许多通道参数被包括在编码输出数据中而不影响传统编码器,因为这些编码器可以简单地忽略辅助数据部分。然而,合适的增强编码器可以提取多通道参数,并且使用这些参数来导出高质量多通道信号。可选地或另外地,多通道参数可以例如在***级数据流中被与编码音频输出数据相分离地传输到解码器。
编码音频输出数据可以是数据流,或者可以例如被单独传输到同一解码器中。可以从外部源和/或内部源比如从本地存储器来接收输入多通道信号。
多通道参数优选地包括:通道间强度差(IID)参数;通道间时间差(ITD)参数;和/或通道间互相关(ICC)参数。
通道间参数还可以被称为听觉间参数,并且ICC参数可以特别地被称为听觉间相关参数。
这些参数特别有益并且允许参量立体声编码多通道信号的后向兼容传输。
根据本发明的一个特征,通道间强度差(IID)参数是相对于强度数据的差参数。这可以允许导致减小数据速率的更有效的IID参数编码,和/或可以提供降低复杂性的编码或解码处理。
根据本发明的另一个特征,强度数据包括多通道的各个比例因子。这些比例因子可以以任何合适的格式来表示,例如以极性格式(polarformat)。这提供了供给强度信息的合适手段,所述强度信息可以如用于参量解码般被实际用于强度解码。
根据本发明的再一个特征,多通道参数包括相对于强度数据的各个比例因子的比例因子差值。这些差值可以例如是有极性的分量差值。这提供了实现编码和/或解码处理的便利,并且提供了多通道参数和多通道强度数据两者的数据速率有效的通信。
根据本发明的又一个特征,该多通道音频编码器还包括:用于将输入多通道信号分割成第一部分和第二部分的装置;以及用于编码第二部分以作为多个各自编码的单通道信号的装置;以及用于生成的装置,其可操作来将各自编码的单通道信号包括在编码音频输出数据中。优选地,第二部分对应于输入信号的低频段,而第一部分对应于输入信号的高频段。
这提供了适合于强度解码和参量解码的多通道音频信号的高感觉质量然而仍有效的编码。
优选地,该多通道音频编码器为立体声音频编码器。特别地,多通道参数优选地包括由输入立体声信号的参量立体声编码导出的参数。
根据本发明的又一个特征,该多通道音频编码器还包括用于将编码音频输出数据作为单个数据流传输的装置。因此,该编码器可以生成单个数据流,该数据流具有高的编码质量对数据速率比,并且其可被解码为不同类型的解码器中的多通道。因此,该编码器可以促成到增强的和传统的解码器的数据流的分发,允许两种类型的解码器生成多通道。
根据本发明的第二方面,提供了一种编码音频信号的方法,该方法包括以下步骤:接收输入多通道信号;通过参量多通道编码来为该输入多通道信号的至少第一部分生成单通道信号和多通道参数,该多通道参数包括与单通道信号有关的多通道信息;响应于输入多通道信号和单通道信号,生成多通道强度数据;以及生成包括单通道信号、强度数据和多通道参数的编码音频输出数据。
根据本发明的第三方面,提供了一种多通道音频解码器,该解码器包括:用于接收单通道信号、参量编码多通道参数和与单通道信号有关的强度编码多通道强度数据的装置,该参量编码多通道参数包括与单通道信号有关的多通道信息;用于从单通道信号和强度数据生成第一解码信号的强度解码器;以及可操作来从第一解码信号和参量编码多通道参数生成解码多通道输出信号的参量多通道解码器。
本发明因此可以提供一种适合于解码包括参量编码多通道参数和多通道强度数据的音频编码数据的低复杂性的解码器。
可以理解,上面参照编码器所描述的特征、注释和变量在适当的时候也适用于解码器。
例如,多通道强度数据可以与第一编码标准兼容,比如是MP3、AAC等等。单通道信号可以根据同一编码标准来编码。多通道参数可以是参量扩展数据,并且可以特别地是参量立体声数据,该数据可以用于提供来自于单通道信号并可能来自于强度数据的立体声信号。多通道参数可以具有不包括在用于单通道信号或用于多通道强度数据的编码标准中的格式。
多通道参数可以被包括在编码音频输出数据的辅助(或补充)数据部分。例如,多通道参数可以被包括在MP3或AAC数据流的辅助数据部分。
单通道信号、参量编码多通道参数以及与单通道信号有关的强度编码多通道强度数据可以被包括在单个数据流或文件中,其中该参量编码多通道参数包括与单通道信号有关的多通道信息。
多通道参数优选地包括通道间强度差(IID)参数、通道间时间差(ITD)参数、和/或通道间互相关(ICC)参数。优选地,IID参数是相对于强度数据的差参数。特别地,强度数据优选地包括用于多通道的各个比例因子,并且优选地多通道参数包括相对于强度数据的各个比例因子的比例因子差值。
优选地,多通道音频解码器为立体声音频解码器。
根据本发明的一个特征,第一解码信号为多通道信号,并且强度解码器可操作来响应于参量编码多通道参数的强度信息而修改强度数据。这提供了一种合适的实现,并且特别是允许使用现有的强度数据多通道解码器算法。
根据本发明的第四方面,提供了一种多通道音频解码器,该解码器包括:用于接收单通道信号、参量编码多通道参数和与单通道信号有关的强度编码多通道强度数据的装置,该参量编码多通道参数包括与单通道信号有关的多通道信息;用于从单通道信号生成第一解码信号的强度解码器;以及可操作来从第一解码信号、强度数据和参量编码多通道参数生成解码多通道输出信号的参量多通道解码器。
根据本发明的另一个特征,第一解码信号为单声道信号,并且参量多通道解码器可操作来响应于强度数据而修改参量编码多通道参数的强度信息。这提供了一种合适的实现,并且特别是允许使用简单的强度数据多通道解码器算法。
根据本发明的第五方面,提供了一种多通道音频解码方法,该方法包括以下步骤:接收单通道信号、参量编码多通道参数和与单通道信号有关的强度编码多通道强度数据,该参量编码多通道参数包括与单通道信号有关的多通道信息;通过强度解码从单通道信号和强度数据生成第一解码信号;以及通过参量多通道解码从第一解码信号和参量编码多通道参数生成解码多通道输出信号。
根据本发明的第六方面,提供了一种多通道音频信号,该音频信号包括:单通道信号数据、与单通道信号有关的强度编码多通道强度数据,该多通道强度数据根据第一编码协议被编码;以及包括与单通道信号有关的多通道信息的参量编码多通道参数,该参量编码多通道参数根据不同于第一编码协议的第二编码协议被编码。优选地,该单通道数据根据第一编码协议被编码。
本发明的这些和其它方面、特征和优点将是显而易见,并且将参照下文中描述的实施例对其进行阐述。
附图简述
将参照附图仅以示例的方式对本发明的实施例加以描述,其中:
图1示出了根据本发明的实施例的编码器框图;
图2示出了根据本发明的实施例的解码器框图;
图3示出了根据本发明的实施例的解码器框图。
具体实施例
下面的描述集中在本发明的实施例,该实施例可应用于立体声编码器和解码器,并且特别是可应用于数字音频数据的编码和解码,其中该数字音频数据包含与MPEG音频层II(mp2)编码标准兼容的音频数据并且还包含参量立体声(PS)参量扩展数据。然而,应当理解本发明并不局限于该应用,而是可以应用到许多其它形式的多通道***中。
根据所描述的实施例,强度立体声编码在编码器中被用来为质量受限的立体声信号生成信息。该强度立体声编码根据用于底层信号的编码协议来执行。特别地,使用了mp2立体声强度编码。并行地,编码器生成参量编码PS扩展数据,该数据被包括在mp2数据的辅助数据部分。
相应地,不能够利用PS扩展数据的传统解码器仍旧可以生成立体声信号,虽然其降低了质量并且具有与强度立体声编码相关联的典型缺点。然而,具有升级的或增强的解码器的用户可以接收高质量的立体声而没有典型的强度立体声的假象(artefact),因为这些解码器可以响应于PS扩展数据来处理编码信号。为了达到给定的立体声质量,传送编码数据所需的数据速率与传统***相比显著降低,因为扩展数据提供了提高很多的立体声编码。
而且,PS扩展数据大小可以通过利用立体声强度数据和PS扩展数据之间的相关性来减小。例如,立体声强度数据和PS扩展数据的通道间强度差(IID)参数之间的相关性可以在IID参数编码中被利用。特别地,IID参数可以相对于立体声强度数据被差分地编码。
在所描述的实施例中,立体声编码器接收立体声信号。较低频段(通常低于确定频率fc)被作为两个单声道信号编码。而且,立体声编码器为较高频率范围(通常高于fc)生成实际上的单声道信号。此信号随后被作为强度立体声信号通过立体声强度数据的求导来编码。而且,响应于单声道信号而生成PS立体声参数。编码器随后生成包含双单声道编码的较低频率信号、单声道信号以及强度数据与PS立体声参数的输出数据。优选地,输出数据是与允许强度立体声(比如mp2)的编码标准相兼容的数据流。参量立体声数据可以被包含在输出数据的辅助数据部分。因此,传统解码器可以使用强度数据来解码该数据流,由此生成降低质量的立体声信号。增强解码器可以使用所有可用的数据,并且可以因此生成增强质量的立体声信号。
图1示出了根据本发明实施例的编码器100的框图。
编码器100包括接收机101,其从外部或内部源103接收输入立体声信号。在该特定实施例中,输入立体声信号包括左通道脉冲编码调制信号和右通道脉冲编码调制信号。接收机101被耦合到第一和第二分割器(divider)105、107,以及左立体声通道被馈送到第一分割器105,而右立体声通道被馈送到第二分割器107。
第一分割器105将左立体声信号分割成第一和第二部分。特别地,第一部分对应于较高频率范围,而第二部分对应于较低频率范围。类似地,第二分割器107将左立体声信号分割成对应于较高和较低频率范围的第一和第二部分。
在所描述的实施例中,第一和第二分割器105、107包含用于提取较低频率信号的低通滤波器和用于提取较高频率信号的高通滤波器。可选地,作为常规mp2编码器的一部分的分解子带滤波器可以用于该目的,即较低子带构成第二部分,而较高子带构成第一部分。
第一分割器105被耦合到第一单声道音频编码器109,而第二分割器107被耦合到第二单声道音频编码器111。左较低频率信号被从第一分割器105馈送到第一单声道音频编码器109,而右较低频率信号被从第二分割器107馈送到第二单声道音频编码器111。
第一和第二单声道音频编码器109、111按照合适的编码协议(比如象mp2编码协议)来分别编码左和右通道较低频率信号。第一和第二单声道音频编码器109、111被耦合到输出处理器113,并且编码的较低频率范围右和左通道数据被馈送到输出处理器113。这样,左和右输入信号的较低频率范围作为两个单声道信号被各自编码。
第一和第二分割器105、107被进一步耦合到参量立体声编码器115。第一分割器105馈送左通道较高频率信号到参量立体声编码器115,而右分割器107馈送右通道较高频率信号到参量立体声编码器115。
参量立体声编码器115从左和右通道较高频率信号生成单声道信号。特别地,该单声道信号可以通过将所述信号加到一起来简单地生成。而且,参量立体声编码器115为输入立体声信号的较高频率范围生成多通道参数。特别地,参量立体声编码器115可以生成参量立体声(PS)多通道参数。相应地,参量立体声编码器115在本实施例中生成通道间强度差(IID)、通道间时间差(ITD)和通道间互相关(ICC)参数。
参量立体声编码器115被耦合到立体声强度编码器117,其被馈送给高频范围单声道信号。立体声强度编码器117被进一步地馈送由第一和第二分割器105、107导出的左和右通道较高频率信号。在图1的例子中,立体声强度编码器117被馈送来自立体声强度编码器117而不是直接来自第一和第二分割器105、107的左和右通道较高频率信号。
在该实施例中,立体声强度编码器117是子带编码器,其通过确定强度数据来执行左和右通道较高频率信号的强度编码,其中所述强度数据可被解码器应用到由参量立体声编码器115生成的高频范围单声道信号,以分别生成左和右信号。
在该实施例中,立体声强度编码器117还根据适当的编码协议(比如mp2)来执行单声道信号的编码。立体声强度编码器117特别地确定立体声强度数据以作为各个左和右比例因子,该比例因子应当由解码器应用到子带编码单声道信号的子带,以导出左和右通道信号。
立体声强度编码器117被耦合到输出处理器113,其被馈送子带编码单声道信号数据以及确定的强度数据(即比例因子)。因此,输出处理器113被提供以强度编码较高频率范围立体声信号,该立体声信号补充来自第一和第二单声道编码器109、111的所述两个单声道编码较低频率范围信号。输出处理器113因此接收了允许其生成mp2兼容的强度编码立体声信号的数据。
参量立体声编码器115和立体声强度编码器117还被耦合到PS立体声参数处理器119。立体声参数处理器119被馈送来自参量立体声编码器115的IID、ITD和ICC PS立体声参数,以及任选地被馈送来自立体声强度编码器117的强度数据。
立体声参数处理器119被耦合到输出处理器113,以及处理PS立体声参数并且把它们馈送到输出处理器113。在简单的实施例中,立体声参数处理器119简单地将PS立体声参数转发到输出处理器119。然而,在所描述的实施例中,立体声参数处理器119转发ITD和ICC参数但处理IID参数以生成相对于强度数据的差参数。
特别地,IID参数被作为由立体声强度编码器117确定的比例因子与那些由参量立体声编码器115确定的比例因子之间的比例因子差来确定。因为由立体声强度编码器117生成的比例因子典型地很接近那些由参量立体声编码器115生成的比例因子,所以仅相对小的差值必须被包括,由此允许增量IID值的有效编码。
在图1的实施例中,输出处理器113通过合并根据mp2要求的两个单声道编码较低频率范围信号、编码较高频率范围单声道信号和来自立体声强度编码器117的强度数据而生成单个依从mp2的比特流。而且,PS立体声参数被包括在mp2数据流的辅助数据部分。因此,生成了单个数据流,其可以在所有的传统mp2编码器中被编码为强度立体声信号,该强度立体声信号仍可以在有PS能力的解码器中提供高质量的立体声信号。此外,IID参数的差分编码导致数据速率仅稍微高于常规的PS编码信号,对于常规的PS编码信号来说可以由传统解码器生成仅仅单声道信号。
图2示出了根据本发明的实施例的立体声解码器200的框图。图2的解码器200能够从由图1的编码器生成的信号来生成高质量的立体声信号,并且将关于这一点对图2的解码器200加以描述。
解码器200包括接收机201,其接收包含由图1的编码器100生成的PS扩展数据的mp2数据流。因此,该接收机接收包括两个单声道编码较低频率范围信号、单声道较高频率范围信号、强度编码立体声数据(由立体声强度编码器117生成的mp2比例因子)和参量编码立体声参数(ICC、ITD和差IID参数)的数据流。
该接收机被耦合到可操作来按照mp2强度立体声解码算法而生成立体声信号的mp2解码处理器203。接收机201将输入数据流的mp2兼容数据馈送到mp2解码处理器203(即两个单声道编码较低频率范围信号、单声道较高频率范围信号和强度编码立体声数据)。
而且,解码器200包括参数解码器205,其被耦合到接收机201并且其接收参量编码立体声参数。参数解码器205被耦合到mp2解码处理器203,并且在图2的实施例中,参数解码器205将该差IID参数馈送到mp2解码处理器203。
差IID参数由强度解码器203使用来调整mp2比例因子以便使用更精确的比例因子。强度解码器203相应地根据mp2立体声算法但使用改进的比例因子值来生成立体声信号。
解码器200还包括参量立体声解码器207,其被耦合到参数解码器205和强度解码器203。参量立体声解码器207接收来自强度解码器203的解码立体声信号以及来自参数处理器205的ITD和ICC参数,并且按照参量立体声解码协议将这些参数应用到解码立体声信号中。这样,参量立体声解码器207通过使用接收数据流的PS扩展数据执行参量立体声解码来生成高质量的立体声信号。
在图2的实施例中,PS编码立体声信号的IID参数解码在强度解码器203中被执行,并且IIC和ITD参数解码在参量立体声解码器207中被执行。应当理解,可以应用其它的功能性分布,并且强度解码器203和参量立体声解码器207的功能性可以以任何适合的方式来划分。特别地,应当理解强度解码器203和参量立体声解码器207的功能性可以被组合为一个处理块。这可以允许该处理(的至少一部分)在子带信号上执行。
图3示出了根据本发明的不同实施例的解码器300的框图。
类似于图2的解码器200,图3的解码器300包括接收机301,其接收包括由图1的编码器100生成的PS扩展数据的mp2数据流。然而,图3的解码器300包括只生成单声道信号的强度解码器303。因此,在该实施例中,接收机301仅馈送高频单声道范围信号到强度解码器303。响应地,强度解码器303按照mp2算法生成高频范围脉冲编码调制(PCM)单声道信号。
而且,图3的解码器300包括耦合到接收机301的双单声道解码器305。双单声道解码器305接收所述两个单声道编码较低频率范围信号并且按照mp2协议解码这些信号。应当理解,单个子带解码器可以用于强度解码器303和双单声道解码器305,并且高频范围单声道信号和所述两个单声道编码较低频率范围信号可以通过这个解码器被顺序地解码。
而且,解码器300包括参数处理器307,其被耦合到接收机并且其接收强度编码立体声数据(由立体声强度编码器117生成的mp2比例因子)和参量编码立体声参数(ICC、ITD和差IID参数)。
参数处理器307响应于mp2比例因子和差IID参数来生成绝对IID参数。而且,参数处理器307可以为强度解码器303生成单声道比例因子。单声道比例因子可以由编码器生成并且作为辅助数据被传输。这些单声道比例因子然后被馈送到子带解码器来生成无混叠失真的单声道信号。
解码器300还包括参量立体声解码器309,其被耦合到强度解码器303、双单声道解码器305和参数处理器307。相应地,参量立体声解码器309接收解码的高频范围单声道信号、所述两个较低频率范围信号以及ICC、ITD和绝对IID参数。参量立体声解码器309然后通过使用接收数据流的PS扩展数据执行参量立体声解码来继续生成高质量的立体声信号。
本发明可以以任何适合的方式包括硬件、软件、固件或其任何组合来实现。然而,优选地,本发明作为在一个或多个数据处理器和/或数字信号处理器上运行的计算机软件来实现。本发明的实施例的元件和部件可以以任何适合的方式来在物理上地、在功能上地和在逻辑上地实现。实际上所述功能性可以在单个单元中、多个单元中被实现,或作为其它功能单元的一部分被实现。同样地,本发明可以在单个单元中实现,或者可以在物理上地和在功能上地被分布在不同的单元和处理器之间。
尽管已经结合优选实施例对本发明进行了描述,但并不打算把本发明限制于在此阐述的特定形式。更正确地说,本发明的范围仅由所附的权利要求来限定。在权利要求中,术语“包括”并不排斥其它元件或步骤的存在。此外,尽管多个装置、元件或方法步骤被各自列出,但是它们可以通过例如单个单元或处理器来实现。另外,尽管各个特征可能被包括在不同的权利要求中,但这些特征有可能被有益地合并,并且在不同权利要求中的包含不是意味着特征的组合是不可行的和/或是无益的。而且,单数的提及并不排斥多个。因此对“一个”、“第一”、“第二”等的提及并不排除多个。
Claims (22)
1.一种多通道音频编码器,包括:
用于接收输入多通道信号的装置(101);
参量多通道编码器(115),用于为该输入多通道信号的至少第一部分生成单通道信号和多通道参数;该多通道参数包括与单通道信号有关的多通道信息;
多通道强度编码器(117),用于响应于该输入多通道信号和单通道信号来生成多通道强度数据;以及
用于生成包括单通道信号、强度数据和多通道参数的编码音频输出数据的装置(113)。
2.权利要求1所要求的多通道音频编码器,其中多通道参数包括通道间强度差(IID)参数。
3.权利要求2所要求的多通道音频编码器,其中通道间强度差(IID)参数为相对于该强度数据的差参数。
4.权利要求1所要求的多通道音频编码器,其中多通道参数包括通道间时间差(ITD)参数。
5.权利要求1所要求的多通道音频编码器,其中多通道参数包括通道间互相关(ICC)参数。
6.权利要求1所要求的多通道音频编码器,其中强度数据包括用于多个通道的各个比例因子。
7.权利要求6所要求的多通道音频编码器,其中多通道参数包括相对于强度数据的各个比例因子的比例因子差值。
8.权利要求1所要求的多通道音频编码器,还包括:
用于将输入多通道信号分割成该第一部分和一第二部分的装置(105,107);以及
用于编码该第二部分以作为多个各自编码的单通道信号的装置(109,111);
以及其中用于生成的装置(113)可操作来将各自编码的单通道信号包括在编码音频输出数据中。
9.权利要求8所要求的多通道音频编码器,其中第二部分对应于输入信号的低频段,而第一部分对应于输入信号的高频段。
10.权利要求1所要求的多通道音频编码器,其中多通道音频编码器为立体声音频编码器。
11.权利要求1所要求的多通道音频编码器,还包括用于将编码音频输出数据作为单个数据流进行传输的装置。
12.一种编码音频信号的方法,包括以下步骤:
接收输入多通道信号;
通过参量多通道编码来为该输入多通道信号的至少第一部分生成单通道信号和多通道参数;该多通道参数包括与单通道信号有关的多通道信息;
响应于该输入多通道信号和单通道信号,生成多通道强度数据;以及
生成包括单通道信号、强度数据和多通道参数的编码音频输出数据。
13.一种多通道音频解码器,包括:
用于接收单通道信号、参量编码多通道参数和与单通道信号有关的强度编码多通道强度数据的装置(201),该参量编码多通道参数包括与单通道信号有关的多通道信息;
强度解码器(203),用于从单通道信号和强度数据生成第一解码信号;以及
参量多通道解码器(207),可操作来从第一解码信号和参量编码多通道参数生成解码多通道输出信号。
14.权利要求13所要求的多通道音频解码器,其中第一解码信号为多通道信号,并且强度解码器(203)可操作来响应于参量编码多通道参数的强度信息而修改强度数据。
15.一种多通道音频解码器,包括:
用于接收单通道信号、参量编码多通道参数和与单通道信号有关的强度编码多通道强度数据的装置(301),该参量编码多通道参数包括与单通道信号有关的多通道信息;
强度解码器(303),用于从单通道信号生成第一解码信号;以及
参量多通道解码器(309),可操作来从第一解码信号、强度数据和参量编码多通道参数生成解码多通道输出信号。
16.权利要求15所要求的多通道音频解码器,其中第一解码信号为单声道信号,并且参量多通道解码器(309)可操作来响应于强度数据而修改参量编码多通道参数的强度信息。
17.一种多通道音频解码方法,包括以下步骤:
接收单通道信号、参量编码多通道参数和与单通道信号有关的强度编码多通道强度数据,该参量编码多通道参数包括与单通道信号有关的多通道信息;
通过强度解码从单通道信号和强度数据生成第一解码信号;以及
通过参量多通道解码从第一解码信号和参量编码多通道参数生成解码多通道输出信号。
18.一种计算机程序,其使能执行根据权利要求12的方法或根据权利要求17的方法。
19.一种记录载体,其包括如权利要求18所要求的计算机程序。
20.一种多通道音频分发***,其包括根据权利要求1的多通道音频编码器和根据权利要求13或15的多通道音频解码器。
21.一种多通道音频信号,包括:
单通道信号数据,
与单通道信号有关的强度编码多通道强度数据,该多通道强度数据根据第一编码协议被编码;以及
参量编码多通道参数,其包括与单通道信号有关的多通道信息,该参量编码多通道参数根据不同于第一编码协议的第二编码协议被编码。
22.权利要求21所要求的多通道音频信号,其中单通道数据根据第一编码协议被编码。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP04100631.3 | 2004-02-17 | ||
EP04100631 | 2004-02-17 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN1922654A true CN1922654A (zh) | 2007-02-28 |
Family
ID=34896077
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNA2005800050974A Pending CN1922654A (zh) | 2004-02-17 | 2005-02-11 | 音频分发***、音频编码器、音频解码器及其操作方法 |
Country Status (6)
Country | Link |
---|---|
US (1) | US20070168183A1 (zh) |
EP (1) | EP1719115A1 (zh) |
JP (1) | JP2007528025A (zh) |
KR (1) | KR20070001139A (zh) |
CN (1) | CN1922654A (zh) |
WO (1) | WO2005083679A1 (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102150202A (zh) * | 2008-07-14 | 2011-08-10 | 三星电子株式会社 | 对音频/语音信号进行编码和解码的方法和设备 |
CN101594186B (zh) * | 2008-05-28 | 2013-01-16 | 华为技术有限公司 | 双通道信号编码中生成单通道信号的方法和装置 |
CN102197646B (zh) * | 2008-10-22 | 2013-11-06 | 索尼爱立信移动通讯有限公司 | 用便携式电子装置产生多通道音频的***和方法 |
CN110235197A (zh) * | 2017-01-31 | 2019-09-13 | 诺基亚技术有限公司 | 立体声音频信号编码器 |
Families Citing this family (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
RU2391714C2 (ru) * | 2004-07-14 | 2010-06-10 | Конинклейке Филипс Электроникс Н.В. | Преобразование аудиоканалов |
KR100857121B1 (ko) * | 2005-10-05 | 2008-09-05 | 엘지전자 주식회사 | 신호 처리 방법 및 이의 장치, 그리고 인코딩 및 디코딩방법 및 이의 장치 |
US8068569B2 (en) | 2005-10-05 | 2011-11-29 | Lg Electronics, Inc. | Method and apparatus for signal processing and encoding and decoding |
GB2453117B (en) * | 2007-09-25 | 2012-05-23 | Motorola Mobility Inc | Apparatus and method for encoding a multi channel audio signal |
US8306233B2 (en) * | 2008-06-17 | 2012-11-06 | Nokia Corporation | Transmission of audio signals |
GB2470059A (en) | 2009-05-08 | 2010-11-10 | Nokia Corp | Multi-channel audio processing using an inter-channel prediction model to form an inter-channel parameter |
CN201499288U (zh) * | 2009-09-09 | 2010-06-02 | 鸿富锦精密工业(深圳)有限公司 | 音频编/解码芯片输出电路 |
ES2644520T3 (es) | 2009-09-29 | 2017-11-29 | Dolby International Ab | Decodificador de señal de audio MPEG-SAOC, método para proporcionar una representación de señal de mezcla ascendente usando decodificación MPEG-SAOC y programa informático usando un valor de parámetro de correlación inter-objeto común dependiente del tiempo/frecuencia |
US9344050B2 (en) * | 2012-10-31 | 2016-05-17 | Maxim Integrated Products, Inc. | Dynamic speaker management with echo cancellation |
CN103413553B (zh) | 2013-08-20 | 2016-03-09 | 腾讯科技(深圳)有限公司 | 音频编码方法、音频解码方法、编码端、解码端和*** |
TWI671734B (zh) * | 2013-09-12 | 2019-09-11 | 瑞典商杜比國際公司 | 在包含三個音訊聲道的多聲道音訊系統中之解碼方法、編碼方法、解碼裝置及編碼裝置、包含用於執行解碼方法及編碼方法的指令之非暫態電腦可讀取的媒體之電腦程式產品、包含解碼裝置及編碼裝置的音訊系統 |
US11451919B2 (en) | 2021-02-19 | 2022-09-20 | Boomcloud 360, Inc. | All-pass network system for colorless decorrelation with constraints |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7292901B2 (en) * | 2002-06-24 | 2007-11-06 | Agere Systems Inc. | Hybrid multi-channel/cue coding/decoding of audio signals |
SE0202159D0 (sv) * | 2001-07-10 | 2002-07-09 | Coding Technologies Sweden Ab | Efficientand scalable parametric stereo coding for low bitrate applications |
ES2323294T3 (es) * | 2002-04-22 | 2009-07-10 | Koninklijke Philips Electronics N.V. | Dispositivo de decodificacion con una unidad de decorrelacion. |
US8498422B2 (en) * | 2002-04-22 | 2013-07-30 | Koninklijke Philips N.V. | Parametric multi-channel audio representation |
JP4322207B2 (ja) * | 2002-07-12 | 2009-08-26 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | オーディオ符号化方法 |
US7191136B2 (en) * | 2002-10-01 | 2007-03-13 | Ibiquity Digital Corporation | Efficient coding of high frequency signal information in a signal using a linear/non-linear prediction model based on a low pass baseband |
ATE348386T1 (de) * | 2002-11-28 | 2007-01-15 | Koninkl Philips Electronics Nv | Audiosignalkodierung |
US7447317B2 (en) * | 2003-10-02 | 2008-11-04 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V | Compatible multi-channel coding/decoding by weighting the downmix channel |
US7805313B2 (en) * | 2004-03-04 | 2010-09-28 | Agere Systems Inc. | Frequency-based coding of channels in parametric multi-channel coding systems |
-
2005
- 2005-02-11 CN CNA2005800050974A patent/CN1922654A/zh active Pending
- 2005-02-11 EP EP05702947A patent/EP1719115A1/en not_active Withdrawn
- 2005-02-11 WO PCT/IB2005/050533 patent/WO2005083679A1/en active Application Filing
- 2005-02-11 US US10/597,971 patent/US20070168183A1/en not_active Abandoned
- 2005-02-11 KR KR1020067016541A patent/KR20070001139A/ko not_active Application Discontinuation
- 2005-02-11 JP JP2006553737A patent/JP2007528025A/ja active Pending
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101594186B (zh) * | 2008-05-28 | 2013-01-16 | 华为技术有限公司 | 双通道信号编码中生成单通道信号的方法和装置 |
CN102150202A (zh) * | 2008-07-14 | 2011-08-10 | 三星电子株式会社 | 对音频/语音信号进行编码和解码的方法和设备 |
US8532982B2 (en) | 2008-07-14 | 2013-09-10 | Samsung Electronics Co., Ltd. | Method and apparatus to encode and decode an audio/speech signal |
US9355646B2 (en) | 2008-07-14 | 2016-05-31 | Samsung Electronics Co., Ltd. | Method and apparatus to encode and decode an audio/speech signal |
CN102150202B (zh) * | 2008-07-14 | 2016-08-03 | 三星电子株式会社 | 对音频/语音信号进行编码和解码的方法和设备 |
US9728196B2 (en) | 2008-07-14 | 2017-08-08 | Samsung Electronics Co., Ltd. | Method and apparatus to encode and decode an audio/speech signal |
CN102197646B (zh) * | 2008-10-22 | 2013-11-06 | 索尼爱立信移动通讯有限公司 | 用便携式电子装置产生多通道音频的***和方法 |
CN110235197A (zh) * | 2017-01-31 | 2019-09-13 | 诺基亚技术有限公司 | 立体声音频信号编码器 |
CN110235197B (zh) * | 2017-01-31 | 2024-01-26 | 诺基亚技术有限公司 | 立体声音频信号编码器 |
Also Published As
Publication number | Publication date |
---|---|
WO2005083679A1 (en) | 2005-09-09 |
JP2007528025A (ja) | 2007-10-04 |
US20070168183A1 (en) | 2007-07-19 |
EP1719115A1 (en) | 2006-11-08 |
KR20070001139A (ko) | 2007-01-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1922654A (zh) | 音频分发***、音频编码器、音频解码器及其操作方法 | |
RU2690885C1 (ru) | Стереофонический кодер и декодер аудиосигналов | |
CN1669359A (zh) | 音频编码 | |
TWI544479B (zh) | 音訊解碼器、音訊編碼器、用以基於已編碼表示型態提供至少四音訊聲道信號的方法、用以基於至少四音訊聲道信號提供已編碼表示型態的方法、及使用頻寬擴展的電腦程式 | |
EP1376538B1 (en) | Hybrid multi-channel/cue coding/decoding of audio signals | |
CN1947172A (zh) | 方法、装置、编码器设备、解码器设备以及音频*** | |
JP5542306B2 (ja) | オーディオ信号のスケーラブル符号化及び復号 | |
CN104285253B (zh) | 具有多个子流的多声道音频信号的有效编码和解码 | |
CN1248824A (zh) | 音频信号编码装置和方法以及解码装置和方法 | |
CN1647156A (zh) | 参数多声道音频表示 | |
CN1926610A (zh) | 基于编码的多声道音频信号合成单声道音频信号 | |
CN1914668A (zh) | 用于信号时间标度的方法及设备 | |
CN1910655A (zh) | 构造多通道输出信号或生成下混信号的设备和方法 | |
US20080004883A1 (en) | Scalable audio coding | |
CN1357136A (zh) | 不损失译码器兼容性下低比特率音频编码***的音质提高 | |
CN1748247A (zh) | 音频编码 | |
CN1647157A (zh) | 信号合成 | |
CN1756086A (zh) | 多通道音频数据编码/解码方法和设备 | |
CN1669358A (zh) | 音频编码 | |
CN1684371A (zh) | 无损音频解码/编码方法和装置 | |
CN1993733A (zh) | 用于空间音频参数的有效编码的能量相关量化 | |
CN1705980A (zh) | 参数音频编码 | |
CN1334952A (zh) | 用于改善编码通信信号性能的编码增强特性 | |
CN107610710B (zh) | 一种面向多音频对象的音频编码及解码方法 | |
CN1822508A (zh) | 对数字信号进行编码和解码的方法和设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C02 | Deemed withdrawal of patent application after publication (patent law 2001) | ||
WD01 | Invention patent application deemed withdrawn after publication |
Open date: 20070228 |