CN1947172A - 方法、装置、编码器设备、解码器设备以及音频*** - Google Patents

方法、装置、编码器设备、解码器设备以及音频*** Download PDF

Info

Publication number
CN1947172A
CN1947172A CNA200580012133XA CN200580012133A CN1947172A CN 1947172 A CN1947172 A CN 1947172A CN A200580012133X A CNA200580012133X A CN A200580012133XA CN 200580012133 A CN200580012133 A CN 200580012133A CN 1947172 A CN1947172 A CN 1947172A
Authority
CN
China
Prior art keywords
signal
parameter
transfer function
stereophonic
processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA200580012133XA
Other languages
English (en)
Other versions
CN1947172B (zh
Inventor
M·W·范卢恩
G·H·霍托
D·J·布里巴特
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Original Assignee
Koninklijke Philips Electronics NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Koninklijke Philips Electronics NV filed Critical Koninklijke Philips Electronics NV
Publication of CN1947172A publication Critical patent/CN1947172A/zh
Application granted granted Critical
Publication of CN1947172B publication Critical patent/CN1947172B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/008Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R1/00Details of transducers, loudspeakers or microphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S5/00Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation 
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/03Application of parametric coding in stereophonic audio systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/02Systems employing more than two channels, e.g. quadraphonic of the matrix type, i.e. in which input signals are combined algebraically, e.g. after having been phase shifted with respect to each other

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Health & Medical Sciences (AREA)
  • Mathematical Physics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Stereophonic System (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

一种处理立体声信号的方法,包括:将N声道音频信号编码为立体声信号(L0;R0)和空间参数(wl;wr);利用所述空间参数对该立体声信号进行处理,以便生成经处理的立体声信号(L0w;R0w)。该经处理的立体声信号的矩阵可以被描述为与滤波器矩阵(H)相乘的立体声信号的矩阵,该滤波器矩阵的元素是利用空间参数(wl;wr)和常数(a)进行运算的滤波器函数(H1,H2,H3,H4)。所述滤波器函数是时不变的,它们被选择成使得该矩阵可逆。

Description

方法、装置、编码器设备、解码器设备以及音频***
本发明涉及一种用于处理从编码器得到的立体声信号的方法和装置,该编码器将一个N声道音频信号编码为左信号、右信号和空间参数。本发明还涉及一种包括这样的编码器和这样的装置的编码器设备。
本发明还涉及一种用于处理立体声信号的方法和装置,该立体声信号是通过用于处理从编码器得到的立体声信号的所述方法和所述装置得到的。本发明还涉及一种包括用于处理立体声信号的所述装置的解码器设备。
本发明还涉及一种包括所述编码器设备和所述解码器设备的音频***。
长期以来,音乐的立体声再现(例如在家庭环境中的立体声再现)一直很盛行。在二十世纪七十年代,对于家庭音乐设备的四声道再现进行了一些实验。
在例如电影院的较大礼堂中,声音的多声道再现已经出现了很长时间。Dolby Digital以及其它***已经被开发以用于在较大礼堂中提供现实且富有感染力的声音再现。
这样的多声道***已经被引入家庭影院,并且赢得了极大关注。因此,具有五个全范围声道和一个部分范围声道或低频效果(LFE)声道的***(也就是所谓的5.1***)现在在市场上很常见。还有其它***,比如2.1、4.1、7.1甚至8.1。
随着SACD和DVD的引入,多声道音频再现正赢得进一步的关注。很多消费者已经具有在家中进行多声道重放的可能性,多声道源素材正变得流行。
由于多声道素材受欢迎程度的提高,对于多声道素材的有效编码正变得越来越重要,例如MPEG的标准化组织也认识到这一点。
以前所知的编码器通常没有应用有效的方法对多声道音频进行编码。输入声道可以基本上被单独编码(可能在矩阵化以后),由于声道数目很大因此就需要高比特率。
然而,多声道音频编码器可以生成与二声道再现***相兼容的二声道下混频,同时仍然可以在解码器端得到高质量的多声道再现。高质量再现受传输参数P的控制,P控制立体声到多声道的上混频处理。这些参数特别包含描述前端信号对存在于二声道下混频中的环绕信号的比率的信息。利用这种方法,解码器可以控制上混频处理中的前端信号相对于环绕信号的数量。换句话说,这些参数描述了空间声场的重要属性,空间声场存在于原始多声道信号中,但是由于下混频处理而在立体声混音中丢失了。
本发明涉及利用这些参数化的空间信息来应用依赖于参数的、优选地可逆的、在二声道下混频上的后处理,以便增强下混频,比如增强其感观质量或者空间属性。
本发明的一个目的是基于在多声道编码器中确定的参数在编码之后使得对于下混频的后处理成为可能,并且不受后处理的影响而仍然保持多声道解码的可能性。
这个目的通过一种用于处理从编码器得到的立体声信号的方法和装置来实现,该编码器将N声道(N>2)信号编码为左信号、右信号和空间参数。该方法包括处理所述左声道信号和右声道信号以便提供经处理的信号。所述处理依赖于所述空间参数而受到控制。其总体思想是利用从N声道到立体声编码器得到的空间参数来控制特定的后处理算法。通过这种方式,从编码器得到的立体声信号可以被处理,以便例如增强空间感染力。
在本发明的一个实施例中,所述处理受到对应于每个输入声道(即对应于每个左信号和右信号)的第一参数的控制,该第一参数依赖于所述空间参数。该第一参数可以是时间和/或频率的函数。因此,该***可以具有可变数量的后处理,其中后处理的实际数量依赖于所述空间参数。后处理可以在不同频带中单独执行。编码器为一组频带提供描述空间声像的独立的空间参数。在这种情况下,第一参数可以是依赖于频率的。
在本发明的另一个实施例中,所述后处理包括为了获得所述经处理的声道信号而添加第一、第二及第三信号。第一信号包括第一输入信号(即经第一转移函数修改的左信号或右信号),第二信号包括经第二转移函数修改的第一输入信号,第三信号包括第二输入信号(即经第三转移函数修改的右信号或左信号)。第二转移函数可以包括所述第一参数和一个第一滤波器函数。第一转移函数可以包括第二参数,其中所述第一参数和所述第二参数的和可以是1(unity)。第三转移函数可以包括第二输入信号的所述第一参数和第二滤波器函数。
所述滤波器函数可以是时不变的。
在一个特定实施例中,所述信号可以用下列等式来描述:
L 0 w R 0 w = H L 0 R 0 其中 H = ( 1 - w l ) a + ( w l ) a H 1 ( w r ) a H 3 ( w l ) a H 2 ( 1 - w r ) a + ( w r ) a H 4
其中a为常数。
使用这种表示法,滤波器函数H1、H2、H3和H4的滤波效果可以通过改变参数wl和wr而改变。如果这两个参数的值均为零,则经过后处理的信号L0w和R0w基本上与立体声输入信号对L0和R0相等。另一方面,如果所述参数为+1,则经过后处理的立体声对L0w和R0w被滤波器函数H1、H2、H3和H4完全处理。本发明使得控制实际的滤波量成为可能,也就是说,通过空间参数P控制参数wl和wr的值。
根据一个实施例,所述滤波器函数和参数被选择成使得转移函数矩阵是可逆的。这使得重建原始立体声信号成为可能。
在本发明的另一个方面中,包括一种依照上述方法处理立体声信号的装置,以及一种包括这样的装置的编码器设备。
在本发明的另一个方面中,提供一种对依照上述方法的处理进行逆处理的方法和装置,以及一种包括这样的逆处理装置的解码器设备。
在本发明的另一个方面中,还提供一种包括所述编码器设备和解码器设备的音频***。
本发明的其他目的、特征和优点将在下面结合实施例和附图并且通过对本发明的详细描述来介绍,其中:
图1示出了根据本发明的包括后处理和逆后处理的编码器/解码器音频***的示意框图。
图2示出了用于对从多声道编码器得到的立体声信号进行后处理的装置的实施例的详细框图。
图3示出了用于对从多声道解码器得到的立体声信号进行后处理的装置的另一个实施例的框图。
图4示出了用于对包括左信号和右信号的立体声信号进行逆后处理的实施例的框图。
图1是试图将本发明应用于其中的编码器/解码器***的框图。在音频***1中,N声道音频信号被提供给编码器2,其中N为大于2的整数。编码器2将该N声道音频信号变换为信号L0和R0以及参数化解码器信息P,由此解码器能够解码该信息并且估计要从解码器输出的原始N声道信号。空间参数集P优选地是依赖于时间和/或频率的。该N声道信号可以是用于5.1***的信号,其包括中央声道、两个前声道、两个环绕声道和LFE声道。
经过编码的立体声信号对L0和R0以及解码器空间信息P被以合适的方式发送给用户,例如通过CD、DVD、VHS Hi-Fi、广播、激光盘、DBS、数字电缆、因特网或者任何其它传输或分发***,如图1中的圆线4所示。由于左信号和右信号被传输,该***与大量只能再现立体声信号的接收设备相兼容。如果所述接收设备包括解码器,则该解码器可以基于立体声信号对L0和R0中的信息以及所述解码器空间信息信号或空间参数P来解码该N声道信号并且提供对它的估计。
然而,由于重放信号数目的减少,立体声信号与所述N声道信号相比缺乏空间信息或者在特定条件下所希望的其他属性。因此,根据本发明,提供一种后处理器5,其在向接收机进行传输/分发之前对立体声信号进行处理。所述后处理可以是依赖于位置的低音或混响“添加”,或者是去除人声(vocal)(在中央声道内具有人声的卡拉OK)。
后处理的其它例子有立体声基展宽,由于各单独输入信号的贡献可以通过解码器信息信号P而获知,因此可以通过利用关于原始环绕混音的成分(比如前端/后端)的知识来执行所述立体声基展宽。原理上,立体声展宽可能已经被应用在编码器中,但其通常不是可逆的,由于在解码器中只有两个信号而不是N个信号可用,因此逆处理通常是不可能的。但是除了立体声展宽之外,还有其它针对单独的多声道贡献的后处理技术是可能的。
根据本发明,如图1中的圆圈6所示,经过后处理的信号被发送到接收机。本发明的用于处理从编码器得到的立体声信号的装置包括后处理器5。根据本发明的编码器设备包括编码器2和后处理器5。
所接收到的信号可以被直接使用,例如如果接收机不包含多声道解码器的话。在通过因特网接收信号6的计算机中或者在只有两个扬声器的接收机中就可能是这种情况。所接收到的信号被感知为高质量信号,因为它改善了空间感染力或者在后处理中由编码器和后处理器确定的其他特性。
如果所述信号能被用于在传统的N声道解码器3中进行解码,则该信号必须首先被逆后处理器7进行逆处理,以便再现原始立体声信号对L0和R0,其与解码器信号或空间参数P一起产生所估计的N声道信号。根据本发明,多声道混音的这种再现是可能的,该再现几乎不受后处理的影响。此外,解码器中的后处理对于作为用户可选特征的立体声重放来说是可能的,并且不需要首先确定该多声道信号。本发明的用于处理包括左信号和右信号的立体声信号的装置包括逆后处理器7。根据本发明的解码器设备包括解码器3和逆后处理器7。
在没有后处理的情况下,下混频与标准ITU下混频相当。然而,本发明的方法可以大大改善下混频的性能。
本发明的方法可以在编码器中确定的空间参数P的帮助下确定多声道混音中的各原始声道在下混频中的贡献。这样,后处理可被应用到多声道混音中的特定声道,例如后部声道的立体声基展宽,同时其它声道不受影响。如果后处理是可逆的,则该后处理不影响最终的多声道重建。所述后处理也可以被应用来改善立体声重放而无需首先重建多声道混音。
该方法与现有的后处理技术的区别在于,其利用关于原始多声道混音的知识,即所确定的空间参数P。
编码器2以下述方式操作:
假设N声道音频信号作为编码器2的输入信号,其中z1[n],z2[n],...,zN[n]描述了N个声道的离散时间域波形。通过使用一般的分段方法对这N个信号进行分段,其中优选地利用重叠分析窗。接下来,通过使用复变换(如FFT)将每一段转换到频域。然而,复滤波器组结构可能也适于获得时间/频率贴片(tile)。这个处理得到输入信号的分段的子带表示,其将被表示为Z1[k],Z2[k],...,ZN[k],其中k表示频率索引。
从这N个声道中产生两个下混频声道,也就是L0[k]和R0[k]。每个下混频声道是N个输入信号的线性组合:
L 0 [ k ] = Σ i = 1 N α i Z i [ k ]
R 0 [ k ] = Σ i = 1 N β i Z i [ k ]
参数αi和βi被选择成使得包含L0[k]和R0[k]的立体声信号具有良好的立体声声像。在包含Lf、Rf、C、Ls、Rs(分别对应左前、右前、中央、左环绕、右环绕声道)的5声道输入信号的情况下,可以根据下式获得适当的下混频:
               L0[k]=L[k]+C[k]/
               R0[k]=R[k]+C[k]/
信号L和R可以根据下列等式获得:
               L[k]=Lf[k]+Ls[k]/
               R[k]=Rf[k]+Rs[k]/
附加地,空间参数P被提取出来,以便能够从L0和R0进行信号Lf、Rf、C、Ls、Rs的感官重建。
在一个实施例中,参数集P包含信号对(Lf,Ls)与(Rf,Rs)之间的声道间强度差(IID)以及可能地还包括声道间互相关(ICC)值。Lf和Ls这一对之间的IID和ICC根据下列等式获得:
IID L = Σ k L f [ k ] L f * [ k ] Σ k L s [ k ] L s * [ k ]
Figure A20058001213300104
这里,(*)表示复共轭。对于其它的信号对,可以使用类似的等式。这样,参数IIDl描述左前声道与左环绕声道之间的能量的相对数量,参数ICCl描述左前声道和左环绕声道之间的互相关量。这些参数实质上描述了前声道和环绕声道之间的感观上相关的参数。
存在于L0和R0中的中央信号的数量的参数化可以通过估计两个预测参数c1和c2来获得。这两个预测参数定义一个2×3的矩阵,该矩阵控制从L0、R0到L、C和R的解码器上混频处理:
L R C = M L 0 R 0
上混频矩阵M的一种实现方式由下式给出:
M = c 1 c 2 - 1 c 1 - 1 c 2 1 - c 1 1 - c 2
对于上述例子,参数集P包括对应于每个时间/频率贴片的{c1,c2,IIDl,ICCl,IIDr,ICCr}。
对于所得到的立体声信号对(L0,R0),可以用这种方式进行后处理:所述后处理主要影响Zi[k]的贡献,比如立体声混音中的LS和RS。图1示出了编解码器中的该块的位置。
图2是根据本发明一个实施例的图1中的后处理器5的详细视图。经过后处理的左信号L0w为三个信号的和,即被转移函数HA修改的左信号L0、被转移函数HB修改的左信号L0以及被转移函数HD修改的右信号R0。同样地,经过后处理的右信号R0w为三个信号的和,即被转移函数HF修改的右信号R0、被转移函数HE修改的右信号R0以及被转移函数HC修改的左信号L0。转移函数HA到HF可以被实现为FIR或IIR型滤波器,或者可以简单地是依赖于频率的(复)比例因子。此外,转移函数HA可以是具有第二参数(1-wl)的乘法,转移函数HB可以包括第一参数wl,其中该参数wl确定立体声信号的后处理的数量。
这在图3中示出。参数wl确定L0[k]的后处理的数量,wr确定R0[k]的后处理的数量。当wl等于零时,L0[k]不受影响,当wl等于1时,L0[k]的受影响程度最大。至于R0[k],wr也是同样的情况。
下列等式对于后处理参数wl和wr成立:
               wl=fl(IIDl,ICCl,c1,c2)
               wr=fr(IIDr,ICCr,c1,c2)
图3中的块H1、H2、H3和H4为滤波器函数,它们可以是各种类型的滤波器,例如如下所示的立体声展宽滤波器。
所得到的输出为:
L 0 w R 0 w = H L 0 R 0 其中 H = ( 1 - w l ) a + ( w l ) a H 1 ( w r ) a H 3 ( w l ) a H 2 ( 1 - w r ) a + ( w r ) a H 4
其中a为任意常数(例如+1)。
如果滤波器函数H1、H2、H3和H4选择得合适,转移函数矩阵H就是可逆的。此外,为了可以在解码器侧进行逆矩阵的计算,滤波器函数H1、H2、H3和H4以及参数wl和wr在解码器处应该是已知的。由于wl和wr可以通过所传输的参数计算,因此这是可能的。这样,可以再次获得原始立体声信号L0和R0,这对于多声道混音的解码来说是必需的。
另一个可能性是传输原始立体声信号并且在解码器中应用后处理,以使得改进立体声重放成为可能,而无需首先确定多声道混音。
下面将详细描述后处理的一个实施例。然而,本发明并不限于这些精确细节,而是可以在所附权利要求书所限定的本发明的范围内有所变化。
后处理参数或权重wl和wr是所传输的空间参数的函数:
                 (wl,wr)=f(P)
函数f被这样设计,即如果与左前信号或中央信号相比信号L0包含来自左环绕信号的更多能量,则wl增大。类似地,wr随着R0中的右环绕信号的相对能量的增大而增大。关于wl和wr的一种方便的表示法由下式给出:
                wl=f1(c1)f2(IIDl)
                wr=f1(c2)f2(IIDr)
其中
f 1 ( x ) = 2 x - 1 0.5 &le; x &le; 1 0 x < 0.5 1 x > 1
以及
f 2 ( x ) = x 1 + x
对于滤波器函数H1、H2、H3和H4,下列示例性函数被选取(在z变换域中):
         H1(z)=H4(z)=0.8(1.0+0.2z-1+0.2z-2)
         H2(z)=H3(z)=0.8(-1.0z-1-0.2z-2)
本发明可以被集成在多声道音频编码器设备中,该设备产生与立体声兼容的下混频。通过上述后处理方案增强的所述多声道参数化音频编码器的一般方案概述如下:
-将该多声道输入信号转换到频域,或者通过分段和变换或者通过应用滤波器组;
-提取空间参数P并且在频移中生成下混频;
-在频域中应用后处理算法;将经过后处理的信号转换到时域;
-使用传统编码技术对该立体声信号进行编码,比如在MPEG中所定义的技术;
-将立体声比特流与编码后的参数P多路复用,以便形成总的输出比特流。
一种相应的多声道解码器设备(即具有集成的后处理逆处理的解码器)可以概述如下:
-对所述参数比特流进行多路分解,以便取回参数P和编码后的立体声信号;
-解码该立体声信号;
-将解码后的立体声信号转换到频域;
-基于参数P应用后处理逆处理;
-基于参数P进行从立体声到多声道输出的上混频;
-将该多声道输出转换到时域。
由于后处理和逆后处理是在频域内进行的,因此滤波器函数H1到H4优选地通过简单的(实数值或复数)比例因子在频域内被变换或近似,所述比例因子可以是与频率有关的。
本领域技术人员应该明白,如上所述的一个或更多处理级可以组合为单个处理级。
本发明的另一个实施例是只在解码器侧对立体声信号进行后处理(即不在编码器侧进行后处理)。利用这种方法,解码器可以从未经增强的立体声信号生成增强的立体声信号。
额外信息可以被提供在比特流中,该额外信息表示是否进行了后处理、参数函数f1、f2以及哪个滤波器函数H1、H2、H3和H4已经被使用、哪个允许进行逆后处理。
滤波器函数可以被描述为频域中的乘法。由于参数对于各单独频带存在,因此本发明可以被实施为简单的复数增益而不是滤波器,所述复数增益在不同频带中被单独应用。在这种情况下,L0w、R0w的频带通过简单的(2×2)矩阵乘法从来自(L0,R0)的相应频带得到。实际的矩阵条目由滤波器函数H的参数和频域表示确定,因此包含时不变增益H和时/频变参数控制的增益wl和wr。由于所述滤波器对于每个频带是标量,所以逆处理是可能的。
编码器中的后处理可以用下面的矩阵等式来描述:
L 0 w R 0 w = H L 0 R 0
其中
H = h 11 h 12 h 21 h 22 = ( 1 - w l ) a + ( w l ) a H 1 ( w r ) a H 3 ( w l ) a H 2 ( 1 - w r ) a + ( w r ) a H 4
该矩阵等式被应用于每个频带。矩阵H包含所有标量。标量的使用使得后处理和逆后处理相对容易。
参数wl和wr是标量w,并且是参数集P的函数。这两个参数确定输入声道的后处理的数量。
参数H1......H4为复滤波器函数。
该处理的逆处理也可以通过每个频带的简单矩阵乘法来实现。下列等式被应用于每个频带:
L 0 R 0 = H - 1 L 0 w R 0 w
其中
H - 1 = k 1 k 3 k 2 k 4 = 1 h 11 h 22 - h 12 h 21 h 22 - h 12 - h 21 h 11
矩阵H-1中只包含标量。H-1中的元素k1......k4也是参数集P的函数。当矩阵H中的函数h11......h22以及参数P在解码器中是已知的时,后处理是可逆的。
执行这种逆后处理的逆后处理器3的框图被示于图4中。
当矩阵H的行列式不等于零时,这种逆处理是可能的。H的行列式等于:
det(H)=h11h22-h12h21=(1-wl)a(1-wr)a+(1-wl)awr aH4+(1-wr)awl aH1+wl awr a(H1H4-H2H3)
当选定适当的函数h11......h22时,det(H)将不等于零,于是该处理是可逆的。
应该提到的是,“包含/包括”一词并不排除其它元件或步骤,“一个”不排除多个元件。此外,权利要求中的附图标记不应当被视为是对权利要求保护范围的限定。
在上文中,参照具体实施例描述了本发明。然而,本发明并不限于所描述的各实施例,而是可以以不同方式被修改和组合,这对阅读本说明书的本领域技术人员来说是显而易见的。

Claims (20)

1、一种处理从编码器得到的立体声信号的方法,该编码器将N声道音频信号编码为左信号和右信号(L0;R0)以及空间参数(P),该方法包括:
-处理所述左信号和右信号以便提供经处理的信号(L0w;R0w),其中所述处理依赖于所述空间参数(P)而被控制。
2、权利要求1的方法,其中所述处理由对应于每个所述左信号和右信号的第一参数(wl;wr)控制,所述第一参数依赖于所述空间参数(P)。
3、权利要求2的方法,其中所述第一参数(wl;wr)是时间和/或频率的函数。
4、权利要求1、2或3的方法,其中所述处理包括利用依赖于所述空间参数(P)的转移函数对所述左信号和右信号的至少其中之一进行滤波。
5、权利要求1、2、3或4的方法,其中所述处理包括:
-添加第一、第二和第三信号以便得到所述经处理的声道信号(L0w;R0w),其中第一信号包括由第一转移函数修改的立体声信号(L0*HA;R0*HF),第二信号包括由第二转移函数修改的同一声道的立体声信号(L0*HB;R0*HE),第三信号包括由第三转移函数修改的另一声道的立体声信号(R0*HD;L0*HC)。
6、权利要求5的方法,其中所述第二转移函数(HB;HE)包括乘以所述第一参数(Wl;Wr)之后再乘以所述第一滤波器函数(H1;H4)。
7、权利要求5的方法,其中所述第一转移函数(HA;HF)包括乘以第二参数。
8、权利要求5的方法,其中所述第一转移函数(HA;HF)包括乘以第二参数,其中所述第一参数是所述第二参数的函数。
9、权利要求5、6、7或8的方法,其中所述第三转移函数(H1;HD)包括将左信号或右信号(L0;R0)乘以所述第一参数(Wl;Wr)之后再乘以第二滤波器函数(H2;H3)。
10、权利要求6、7、8或9的方法,其中所述滤波器函数(H1,H2,H3,H4)是时不变的。
11、前述权利要求中的任意一个的方法,其中所述信号由下述等式描述:
L Ow R Ow = H L O R O
其中转移函数矩阵(H)是所述空间参数(P)的函数。
12、权利要求11的方法,其中所述转移函数矩阵(H)由下述等式描述:
H = ( 1 - w l ) a + ( w l ) a H 1 ( w r ) a H 3 ( w l ) a H 2 ( 1 - w r ) a + ( w r ) a H 4
其中a是常数。
13、权利要求11或12的方法,其中所述滤波器函数(H1,H2,H3,H4)和参数(wl;wr)被选择成使得所述转移函数矩阵(H)是可逆的。
14、前述权利要求中的任意一个的方法,其中所述空间参数(P)包含描述所述N声道信号的信号电平的信息。
15、一种用于处理从编码器得到的立体声信号的装置,该编码器将N声道音频信号编码为左信号和右信号(L0;R0)以及空间参数(P),该装置包括:
-后处理器(5),其用于对所述左信号和右信号进行后处理以便提供经处理的信号(L0w;R0w),其中所述后处理依赖于所述空间参数(P)而被控制。
16、一种编码器设备,包括:
-编码器(2),用于将N声道音频信号编码为左信号和右信号(L0;R0)以及空间参数(P);以及
-根据权利要求15的装置(5),其用于依据所述空间参数(P)处理所述左信号和右信号(L0;R0)。
17、一种用于处理包含左信号和右信号(L0w;R0w)的立体声信号的方法,该方法包括对根据权利要求1-14中的任意一个的方法的处理进行逆处理。
18、一种用于处理包含左信号和右信号(L0w;R0w)的立体声信号的装置(7),该装置包括对根据权利要求1-14中的任意一个的方法的处理进行逆处理的装置。
19、一种解码器设备,包括:
-根据权利要求18的装置(7),其用于处理包含左信号和右信号(L0w;R0w)的立体声信号;以及
-用于将经处理的立体声信号(L0;R0)解码为N声道音频信号的解码器。
20、一种音频***(1),其包括根据权利要求16的编码器设备和根据权利要求19的解码器设备。
CN200580012133XA 2004-04-05 2005-03-30 方法、装置、编码器设备、解码器设备以及音频*** Active CN1947172B (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
EP04101405.1 2004-04-05
EP04101405 2004-04-05
EP04103367 2004-07-14
EP04103367.1 2004-07-14
PCT/IB2005/051065 WO2005098826A1 (en) 2004-04-05 2005-03-30 Method, device, encoder apparatus, decoder apparatus and audio system

Publications (2)

Publication Number Publication Date
CN1947172A true CN1947172A (zh) 2007-04-11
CN1947172B CN1947172B (zh) 2011-08-03

Family

ID=34962191

Family Applications (1)

Application Number Title Priority Date Filing Date
CN200580012133XA Active CN1947172B (zh) 2004-04-05 2005-03-30 方法、装置、编码器设备、解码器设备以及音频***

Country Status (12)

Country Link
US (1) US9992599B2 (zh)
EP (1) EP1735779B1 (zh)
JP (1) JP5284638B2 (zh)
KR (1) KR101183862B1 (zh)
CN (1) CN1947172B (zh)
BR (1) BRPI0509110B1 (zh)
ES (1) ES2426917T3 (zh)
MX (1) MXPA06011397A (zh)
PL (1) PL1735779T3 (zh)
RU (1) RU2396608C2 (zh)
TW (1) TWI455614B (zh)
WO (1) WO2005098826A1 (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101926094A (zh) * 2008-01-23 2010-12-22 Lg电子株式会社 用于处理音频信号的方法和设备
CN102187691A (zh) * 2008-10-07 2011-09-14 弗朗霍夫应用科学研究促进协会 多声道音频信号的双耳演示
WO2012040898A1 (en) * 2010-09-28 2012-04-05 Huawei Technologies Co., Ltd. Device and method for postprocessing decoded multi-channel audio signal or decoded stereo signal
US8615088B2 (en) 2008-01-23 2013-12-24 Lg Electronics Inc. Method and an apparatus for processing an audio signal using preset matrix for controlling gain or panning
US8615316B2 (en) 2008-01-23 2013-12-24 Lg Electronics Inc. Method and an apparatus for processing an audio signal

Families Citing this family (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ES2373728T3 (es) 2004-07-14 2012-02-08 Koninklijke Philips Electronics N.V. Método, dispositivo, aparato codificador, aparato decodificador y sistema de audio.
JP4988716B2 (ja) 2005-05-26 2012-08-01 エルジー エレクトロニクス インコーポレイティド オーディオ信号のデコーディング方法及び装置
EP1905002B1 (en) 2005-05-26 2013-05-22 LG Electronics Inc. Method and apparatus for decoding audio signal
WO2007007263A2 (en) * 2005-07-14 2007-01-18 Koninklijke Philips Electronics N.V. Audio encoding and decoding
US8626503B2 (en) 2005-07-14 2014-01-07 Erik Gosuinus Petrus Schuijers Audio encoding and decoding
JP5587551B2 (ja) * 2005-09-13 2014-09-10 コーニンクレッカ フィリップス エヌ ヴェ オーディオ符号化
KR100803212B1 (ko) * 2006-01-11 2008-02-14 삼성전자주식회사 스케일러블 채널 복호화 방법 및 장치
EP1974347B1 (en) * 2006-01-19 2014-08-06 LG Electronics Inc. Method and apparatus for processing a media signal
WO2007091850A1 (en) 2006-02-07 2007-08-16 Lg Electronics Inc. Apparatus and method for encoding/decoding signal
CN101390443B (zh) * 2006-02-21 2010-12-01 皇家飞利浦电子股份有限公司 音频编码和解码
WO2008046530A2 (en) 2006-10-16 2008-04-24 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for multi -channel parameter transformation
EP2054875B1 (en) 2006-10-16 2011-03-23 Dolby Sweden AB Enhanced coding and parameter representation of multichannel downmixed object coding
WO2008063035A1 (en) * 2006-11-24 2008-05-29 Lg Electronics Inc. Method for encoding and decoding object-based audio signal and apparatus thereof
US8855795B2 (en) 2007-01-09 2014-10-07 Mediatek Inc. Multiple output audio system
JP5511848B2 (ja) 2009-12-28 2014-06-04 パナソニック株式会社 音声符号化装置および音声符号化方法
CN102280107B (zh) * 2010-06-10 2013-01-23 华为技术有限公司 边带残差信号生成方法及装置
ES2643163T3 (es) 2010-12-03 2017-11-21 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Aparato y procedimiento para codificación de audio espacial basada en geometría
CN103329565B (zh) * 2011-01-05 2016-09-28 皇家飞利浦电子股份有限公司 音频***及其操作方法
EP2804176A1 (en) 2013-05-13 2014-11-19 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio object separation from mixture signal using object-specific time/frequency resolutions
EP2830046A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for decoding an encoded audio signal to obtain modified output signals
US9820073B1 (en) 2017-05-10 2017-11-14 Tls Corp. Extracting a common signal from multiple audio signals

Family Cites Families (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4095049A (en) * 1976-03-15 1978-06-13 National Research Development Corporation Non-rotationally-symmetric surround-sound encoding system
US4236039A (en) * 1976-07-19 1980-11-25 National Research Development Corporation Signal matrixing for directional reproduction of sound
DE4209544A1 (de) * 1992-03-24 1993-09-30 Inst Rundfunktechnik Gmbh Verfahren zum Übertragen oder Speichern digitalisierter, mehrkanaliger Tonsignale
JP2693893B2 (ja) * 1992-03-30 1997-12-24 松下電器産業株式会社 ステレオ音声符号化方法
JPH06165079A (ja) * 1992-11-25 1994-06-10 Matsushita Electric Ind Co Ltd マルチチャンネルステレオ用ダウンミキシング装置
DE4409368A1 (de) * 1994-03-18 1995-09-21 Fraunhofer Ges Forschung Verfahren zum Codieren mehrerer Audiosignale
US5727119A (en) * 1995-03-27 1998-03-10 Dolby Laboratories Licensing Corporation Method and apparatus for efficient implementation of single-sideband filter banks providing accurate measures of spectral magnitude and phase
US5642423A (en) 1995-11-22 1997-06-24 Sony Corporation Digital surround sound processor
US6697491B1 (en) 1996-07-19 2004-02-24 Harman International Industries, Incorporated 5-2-5 matrix encoder and decoder system
SG54379A1 (en) 1996-10-24 1998-11-16 Sgs Thomson Microelectronics A Audio decoder with an adaptive frequency domain downmixer
EP0990368B1 (en) 1997-05-08 2002-04-24 STMicroelectronics Asia Pacific Pte Ltd. Method and apparatus for frequency-domain downmixing with block-switch forcing for audio decoding functions
US6173061B1 (en) * 1997-06-23 2001-01-09 Harman International Industries, Inc. Steering of monaural sources of sound using head related transfer functions
US6067361A (en) * 1997-07-16 2000-05-23 Sony Corporation Method and apparatus for two channels of sound having directional cues
US7292901B2 (en) * 2002-06-24 2007-11-06 Agere Systems Inc. Hybrid multi-channel/cue coding/decoding of audio signals
SE0202159D0 (sv) * 2001-07-10 2002-07-09 Coding Technologies Sweden Ab Efficientand scalable parametric stereo coding for low bitrate applications
US7039204B2 (en) * 2002-06-24 2006-05-02 Agere Systems Inc. Equalization for audio mixing
JP4322207B2 (ja) 2002-07-12 2009-08-26 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ オーディオ符号化方法
US7447317B2 (en) * 2003-10-02 2008-11-04 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V Compatible multi-channel coding/decoding by weighting the downmix channel
US7394903B2 (en) * 2004-01-20 2008-07-01 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Apparatus and method for constructing a multi-channel output signal or for generating a downmix signal
JPWO2005081229A1 (ja) * 2004-02-25 2007-10-25 松下電器産業株式会社 オーディオエンコーダ及びオーディオデコーダ
US7805313B2 (en) * 2004-03-04 2010-09-28 Agere Systems Inc. Frequency-based coding of channels in parametric multi-channel coding systems
US20050247756A1 (en) 2004-03-31 2005-11-10 Frazer James T Connection mechanism and method
CN102122509B (zh) 2004-04-05 2016-03-23 皇家飞利浦电子股份有限公司 多信道解码器和多信道解码方法
ES2373728T3 (es) * 2004-07-14 2012-02-08 Koninklijke Philips Electronics N.V. Método, dispositivo, aparato codificador, aparato decodificador y sistema de audio.

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101926094A (zh) * 2008-01-23 2010-12-22 Lg电子株式会社 用于处理音频信号的方法和设备
CN101926094B (zh) * 2008-01-23 2013-07-17 Lg电子株式会社 用于处理音频信号的方法和设备
US8615088B2 (en) 2008-01-23 2013-12-24 Lg Electronics Inc. Method and an apparatus for processing an audio signal using preset matrix for controlling gain or panning
US8615316B2 (en) 2008-01-23 2013-12-24 Lg Electronics Inc. Method and an apparatus for processing an audio signal
US9319014B2 (en) 2008-01-23 2016-04-19 Lg Electronics Inc. Method and an apparatus for processing an audio signal
US9787266B2 (en) 2008-01-23 2017-10-10 Lg Electronics Inc. Method and an apparatus for processing an audio signal
CN102187691A (zh) * 2008-10-07 2011-09-14 弗朗霍夫应用科学研究促进协会 多声道音频信号的双耳演示
CN102187691B (zh) * 2008-10-07 2014-04-30 弗朗霍夫应用科学研究促进协会 多声道音频信号的双耳演示
WO2012040898A1 (en) * 2010-09-28 2012-04-05 Huawei Technologies Co., Ltd. Device and method for postprocessing decoded multi-channel audio signal or decoded stereo signal
CN103262158A (zh) * 2010-09-28 2013-08-21 华为技术有限公司 对解码的多声道音频信号或立体声信号进行后处理的装置和方法
CN103262158B (zh) * 2010-09-28 2015-07-29 华为技术有限公司 对解码的多声道音频信号或立体声信号进行后处理的装置和方法
US9767811B2 (en) 2010-09-28 2017-09-19 Huawei Technologies Co., Ltd. Device and method for postprocessing a decoded multi-channel audio signal or a decoded stereo signal

Also Published As

Publication number Publication date
RU2006139068A (ru) 2008-05-20
BRPI0509110A8 (pt) 2016-02-10
MXPA06011397A (es) 2006-12-20
TW200611588A (en) 2006-04-01
JP2007531916A (ja) 2007-11-08
PL1735779T3 (pl) 2014-01-31
ES2426917T3 (es) 2013-10-25
US9992599B2 (en) 2018-06-05
KR20070001205A (ko) 2007-01-03
BRPI0509110A (pt) 2007-08-28
EP1735779A1 (en) 2006-12-27
EP1735779B1 (en) 2013-06-19
CN1947172B (zh) 2011-08-03
BRPI0509110B1 (pt) 2019-07-09
TWI455614B (zh) 2014-10-01
JP5284638B2 (ja) 2013-09-11
US20070183601A1 (en) 2007-08-09
WO2005098826A1 (en) 2005-10-20
RU2396608C2 (ru) 2010-08-10
KR101183862B1 (ko) 2012-09-20

Similar Documents

Publication Publication Date Title
CN1947172A (zh) 方法、装置、编码器设备、解码器设备以及音频***
JP5442995B2 (ja) マルチチャンネルオーディオ信号のエンコーディング/デコーディングシステム、記録媒体及び方法
CN1154087C (zh) 提高低比特率音频编码***音质的方法、编码器和译码器
JP4772279B2 (ja) オーディオ信号のマルチチャネル/キュー符号化/復号化
JP5455647B2 (ja) オーディオデコーダ
TWI544479B (zh) 音訊解碼器、音訊編碼器、用以基於已編碼表示型態提供至少四音訊聲道信號的方法、用以基於至少四音訊聲道信號提供已編碼表示型態的方法、及使用頻寬擴展的電腦程式
JP5883561B2 (ja) アップミックスを使用した音声符号器
KR101158698B1 (ko) 복수-채널 인코더, 입력 신호를 인코딩하는 방법, 저장 매체, 및 인코딩된 출력 데이터를 디코딩하도록 작동하는 디코더
CN101406073B (zh) 用于多声道音频重构中的信号成形的增强的方法
RU2367033C2 (ru) Многоканальное иерархическое аудиокодирование с компактной дополнительной информацией
US8150042B2 (en) Method, device, encoder apparatus, decoder apparatus and audio system
JP4939933B2 (ja) オーディオ信号符号化装置及びオーディオ信号復号化装置
US20120063604A1 (en) Scalable multi-channel audio coding
CN1922654A (zh) 音频分发***、音频编码器、音频解码器及其操作方法
CN1647156A (zh) 参数多声道音频表示
CN1669359A (zh) 音频编码
CN1993733A (zh) 用于空间音频参数的有效编码的能量相关量化
CN1910655A (zh) 构造多通道输出信号或生成下混信号的设备和方法
CN1926610A (zh) 基于编码的多声道音频信号合成单声道音频信号
CN1816847A (zh) 保真度优化的可变帧长编码
CN1930914A (zh) 参数多声道编码***中基于频率的音频声道编码
CN105164749A (zh) 多声道音频的混合编码
CN1885724A (zh) 产生音频信号比特流方法和设备及音频编解码方法和设备
CN1424713A (zh) 高频耦合的伪小波5声道音频编/解码方法
CN1666572A (zh) 信号处理

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant