CN101578656A - 用于处理音频信号的装置和方法 - Google Patents

用于处理音频信号的装置和方法 Download PDF

Info

Publication number
CN101578656A
CN101578656A CNA2008800017518A CN200880001751A CN101578656A CN 101578656 A CN101578656 A CN 101578656A CN A2008800017518 A CNA2008800017518 A CN A2008800017518A CN 200880001751 A CN200880001751 A CN 200880001751A CN 101578656 A CN101578656 A CN 101578656A
Authority
CN
China
Prior art keywords
information
mixed
gain
multichannel
generate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA2008800017518A
Other languages
English (en)
Inventor
吴贤午
郑亮源
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
LG Electronics Inc
Original Assignee
LG Electronics Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by LG Electronics Inc filed Critical LG Electronics Inc
Publication of CN101578656A publication Critical patent/CN101578656A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Stereophonic System (AREA)

Abstract

公开了一种用于处理音频信号的方法。本发明包括:接收缩混信息、对象信息、和混合信息;使用缩混信息、对象信息、以及混合信息中的至少一个,生成和传输多信道信息;以及使用对象信息和混合信息中的至少一个,根据解码模式选择性地生成和传输第一增益信息或包括第二增益信息的额外多信道信息。

Description

用于处理音频信号的装置和方法
技术领域
本发明涉及用于处理音频信号的装置及其方法。虽然本发明适合于很宽范围的应用,但是其尤其适合于处理在数字介质、广播信号等上接收的音频信号。
背景技术
一般地,当将若干个音频对象缩混(downmix)为单声或立体声信号时,可以提取来自单独的对象信号的参数。这些参数可以被使用在音频信号的解码器中,并且通过用户的选择可以控制单独源的定位/移动(panning)。
发明内容
技术问题
然而,为了控制每个对象信号,在缩混中包括的源需要被适当地定位或移动。
此外,为了提供与信道定向解码方案的向后兼容性(backwardcompatibility),对象参数应该被灵活地转化为多信道参数。
技术解决方案
因此,本发明涉及用于处理音频信号的装置及其方法,其基本消除了由于相关技术的限制和缺点而产生的一个或多个问题。
本发明的目的在于提供用于处理音频信号的装置及其方法,通过其在没有限制的情况下可以控制对象的增益和移动。
本发明的另一目的在于提供用于处理音频信号的装置及其方法,通过其可以基于用户做出的选择来控制对象的增益和移动。
有利的效果
因此,本发明提供以下效果或优点。
首先,根据本发明,可以在没有限制的情况下控制对象的增益和移动。
第二,根据本发明,可以基于由用户做出的选择来控制对象的增益和移动。
第三,根据本发明,不管缩混信号是单声信号还是立体声信号,都可以控制对象的增益和移动。
附图说明
附图示出了本发明的实施例,并且与说明一起用于解释本发明的原理,包括所述附图以提供对本发明的进一步理解,并且附图被合并于本说明书中并构成本说明书的一部分。
在附图中:
图1是根据本发明实施例的音频信号处理装置的框图;
图2是根据本发明实施例的音频信号处理装置的信息生成单元的详细框图;以及
图3和图4是根据本发明的实施例的用于音频信号处理方法的流程图。
具体实施方式
本发明的另外特征和优点将在以下的描述中阐述,并且其部分将通过所述描述而变得明显,或者可以通过对本发明的实践而了解到。
本发明的目的和其他优点将通过在所撰写的描述和其权利要求、以及附图中指出的具体结构来实现和获得。
为了实现这些和其他的优点,并且根据本发明的目的,如所具体化和宽泛描述的,根据本发明的处理音频信号的方法包括:接收缩混信息、对象信息和混合信息;使用缩混信息、对象信息和混合信息中的至少一个,生成和传输多信道信息;以及使用对象信息和混合信息中的至少一个,根据解码模式选择性地生成和传输第一增益信息或者包括第二增益信息的额外多信道信息。
根据本发明,所述方法可以进一步包括:使用第一增益信息或者包括第二增益信息的额外多信道信息、多信道信息、以及缩混信息,生成多信道音频。
根据本发明,对象信息包括对象电平(level)信息和对象相关性信息中的至少一个。
根据本发明,多信道信息与用于将缩混信号扩混(upmix)到多信道信号中的信息相对应,并且使用对象信息和混合信息来生成多信道信息。
根据本发明,多信道信息包括信道电平信息和信道相关性信息中的至少一个。
根据本发明,按每时间子带变量来计算第一增益信息。
根据本发明,第一增益信息表示基于对象信息和混合信息而计算的用户增益与从对象信息计算的对象电平(object level)的比率。
根据本发明,多信道信息和第一增益信息一起传输。
根据本发明,额外多信道信息与用于双耳的HRTF信息相对应。
根据本发明,生成第一增益信息或者额外多信道信息包括:如果解码模式不是双耳模式,则生成第一增益信息,并且如果解码模式是双耳模式,则生成额外多信道信息。
根据本发明,HRTF信息包括HRTF参数和对象参数。
根据本发明,HRTF参数与从HRTF数据库中提取的参数相对应。
根据本发明,第二增益信息与用于控制每个对象电平的信息相对应,并且第二增益信息是基于混合信息而生成的。
根据本发明,如果缩混信号与单声信号相对应,则该方法进一步包括旁路(bypassing)缩混信号,其中,在生成第一增益信息或者额外多信道信息中,如果解码模式不是双耳模式,则生成第一增益信息,并且其中,在生成第一增益信息或者额外多信道信息中,如果解码模式是双耳模式,则生成额外多信道信息。
根据本发明,所述方法进一步包括:如果缩混信号的信道数至少为二,则使用对象信息和混合信息中的至少一个生成缩混处理信息,并且使用缩混处理信息来处理缩混信号,其中,在生成第一增益信息或者额外多信道信息中,如果解码模式是双耳模式,则生成额外多信道信息。
根据本发明,基于对象位置信息、对象增益信息和播放配置信息中的至少一个生成混合信息。
根据本发明,经由广播信号接收缩混信号。
根据本发明,在数字介质上接收缩混信号。
为了进一步实现这些和其他的优点,并且根据本发明的目的,根据本发明的计算机可读记录介质包括记录在其中的程序,其中,提供所述程序用于执行:接收缩混信息、对象信息和混合信息;使用缩混信息、对象信息、和混合信息中的至少一个,生成和传输多信道信息;并且使用对象信息和混合信息中的至少一个,根据解码模式选择性地生成和传输第一增益信息或者包括第二增益信息的额外多信道信息。
为了进一步实现这些和其他的优点,并且根据本发明的目的,根据本发明的用于处理音频信号的装置包括:信息接收单元,其接收缩混信息、对象信息和混合信息;信息生成单元,其使用缩混信息、对象信息和混合信息中的至少一个来生成多信道信息,所述信息生成单元使用对象信息和混合信息中的至少一个,根据解码模式选择性地生成第一增益信息或者包括第二增益信息的额外多信道信息;以及信息传输单元,其传输多信道信息,所述信息传输单元根据解码模式,传输第一增益信息或者包括第二增益信息的额外多信道信息。
应理解,上述一般性的描述和以下详细描述均是示例性和解释性的,并且其意图在于提供对如所要求的本发明的进一步解释。
本发明的模式
现在将详细参考本发明的优选实施例,在附图中示出其示例。
在该公开中,信息意指全面覆盖值、参数、系数、元素等的术语。因此,对每种情况对其意思可以有不同的理解。这没有对本发明做出限制。
并且,本发明的多信道音频信号应被理解为如下的概念,其包括立体声效果(3D效果、双耳效果)应用到其上的信道信号、以及3信道或更多信号。
图1是根据本发明实施例的音频信号处理装置的框图。
参考图1,根据本发明实施例的音频信号处理装置100包括信息生成单元110、缩混处理单元120、以及多信道解码器130。
信息生成单元110接收包括对象信息的边信息(side information)和混合信息。使用所接收的信息,信息生成单元110生成第一增益信息或者额外多信道信息(EMI)。在该情况下,额外多信道参数(EMI)包括用于双耳模式的HRTF(头相关传输函数)信息和第二增益信息。同时,关于对象信息(OI)、混合信息(MXI)、第一增益信息、额外多信道信息(EMI)等的细节将随后参考图2来解释。此外,在生成第一增益信息的情况下,信息生成单元110向多信道解码器130传输包括第一增益信息的多信道信息(MI)。在不生成第一增益信息的情况下,信息生成单元110向多信道解码器130传输不包括第一增益信息的多信道信息(MI)和额外多信道信息(EMI)。将随后参考图2来解释其细节。此外,信息生成单元110能够使用对象信息(OI)和混合信息(MXI)生成缩混处理信息(DPI)。
缩混处理单元120接收缩混信息(在下文中,称为“缩混信号(DMX)”),并且然后使用缩混处理信息(DPI)来处理缩混信号DMX。在缩混信号(DMX)与单声信号相对应的情况下,缩混处理单元120旁路缩混信号(DMX)而不对其进行处理。在该种情况下,为了调整缩混信号(DMX)的增益,信息生成单元110能够生成第一增益信息。同时,在缩混信号(DMX)的信道数对应于至少两个(即,缩混信号不是单声信号而是立体声或多信道信号)的情况下,用于调整对象的增益和移动的信息可以被包括在缩混处理信息(DPI)或者额外多信道信息(EMI)中,来代替被包括在第一增益信息中。将随后对此进行详细的解释。
多信道解码器130接收所处理的缩混。多信道解码器130通过使用多信道信息(MI)扩混所处理的缩混信号,生成多信道信号。在接收额外多信道信息(EMI)的情况下,多信道解码器30使用接收的额外多信道信息(EMI)修改多信道信号。
图2是根据本发明实施例的音频信号处理装置的信息生成单元的详细框图。
参考图2,信息生成单元110包括信息接收单元112、多信道信息生成单元114、第一增益信息生成单元114a、额外多信道信息生成单元116、以及信息传输单元118。同时,信息生成单元110可以包括信息接收单元112以及信息传输单元118。可选地,信息接收单元112和信息传输单元118可以对应于与信息生成单元110分离地构造的元件。此外,多信道信息生成单元114可以包括第一增益信息生成单元114a,其没有限制本发明的各种实施方式。
信息接收单元112经由广播信号、数字介质等来接收对象信息(OI)。在此情况下,对象信息(OI)可以是从上述的边信息中提取的信息。对象信息(OI)是关于包括在缩混信号中的对象的信息,并且可以包括对象电平信息、对象相关性信息等。同时,信息接收单元112经由用户接口等接收混合信息(MXI)。在此情况下,混合信息(MXI)是基于对象位置信息、对象增益信息、播放配置信息等生成的信息。具体地,对象位置信息是为用户输入的以控制每个对象的移动或位置的信息。对象增益信息是为用户输入的以控制每个对象的增益的信息。播放配置信息是包括扬声器的数目、每个扬声器的位置、环境信息(扬声器的可能(virtual)位置)等的信息。并且,播放配置信息可以由用户输入、可以事先存储或者可以从其他器件接收。
多信道信息生成单元114使用对象信息(OI)和混合信息(MXI)生成多信道信息(MI)。在此情况下,多信道信息(MI)是用于将缩混信号(DMX)扩混的信息,并且可以包括信道电平信息、信道相关性信息等。
第一增益信息生成单元114a使用对象信息(OI)和混合信息(MXI)生成第一增益信息。在此情况下,第一增益信息是用于修改缩混信号(DMX)的增益的信息,并且可以被称为增益修改因子或者任意缩混增益(ADG)。第一增益信息可以被表示为基于对象信息(OI)和混合信息(MXI)而估计的用户增益与从对象信息(OI)估计的对象电平的比率。并且,可以按每时间子带地来计算第一增益信息。如果在将缩混信号(DMX)扩混之前将第一增益信息施加到缩混信号(DMX),则可以调整每特定时间和每特定频带的缩混信号的增益。因此,可以根据用户的控制来调整每个对象的增益。
同时,在缩混信号(DMX)是单声信号的情况下,第一增益信息生成单元114a能够生成第一增益信息。此外,在缩混信号(DMX)是单声信号的情况下,当额外多信道信息生成单元116没有生成用于双耳模式的HRTF信息时,第一增益信息生成单元114a能够生成第一增益信息。在生成用于双耳模式的HRTF信息的情况下,用于调整对象增益的第二增益信息可以被包括在HRTF信息中。因此,如果生成用于调整对象的增益的第一增益信号,则增益信息的生成和传送可能会重叠。用于双耳模式等的细节将随后与额外多信道生成单元116一起解释。
额外多信道生成单元116使用对象信息(OI)、混合信息(MXI)和HRTF数据库生成额外多信道信息(EMI)。额外多信道信息(EMI)可以包括用于双耳模式的HRTF信息。在此情况下,双耳模式是用于信道定向解码方案中的3维立体声(例如,MPEG环绕)的处理模式。
同时,HRTF信息可以包括:1)第二增益信息;2)HRTF参数;以及3)对象信息。在此情况下,第二增益信息是用于控制对象增益的信息,并且可以基于混合信息(MXI)来估计。并且,HRTF参数可以是从HRTF数据库中提取的参数。因为能够对每个解码器独立地使用HRTF信息,所以可以使用HRTF信息对音频信号进行有效地解码。对象信息可以是经由信息接收单元112接收的对象信息(OI)。
此外,可以假设以公式1的方式对对象信号进行控制。
[公式1]
Lnew=a1×obj1+a2×obj2+a3×obj3+…+an×objn
Rnew=b1×obj1+b2×obj2+b3×obj3+…+bn×objn
在此情况下,Lnew和Rnew表示用户所希望的信号。并且,Objk表示代表对象特征(能量、相关性等)的信息,并且可以是从上述对象信息(OI)中提取的信息。此外,ak和bk是用于对象控制的系数,并且可以是从由用户输入的混合信息(MXI)中提取的信息。为了与ak和bk相对应,可以设置第一增益信息或者HRTF参数。
具体地,公式1也可以被表示为公式2。
[公式2]
Lnew=∑HRTF×ch
在此情况下,“HRTF”表示HRTF参数,并且“ch”表示信道信号。
此外,如下也是可以的。
[公式3]
L new = Σ HRTF ~ × ch
在此情况下,其是调整增益的因子,并且可以与第二增益信息相对应。
同时,在MPEG环绕标准中(5-1-51配置)(根据ISO/IEC FDIS23003-1:2006(E),信息技术-MPEG音频技术-部分1:MPEG环绕)中,双耳处理可以如下表示。
[公式4]
y B n , k = y L B n , k y R B n , k = H 2 n , k y m n , k D ( y m n , k ) = h 11 n , k h 12 n , k h 21 n , k h 22 n , k y m n , k D ( y m n , k ) , 0 &le; k < K
在此情况下,“yB”是输出信号,并且矩阵H是用于执行双耳处理的变换矩阵。
并且,矩阵H可以如下表示。
[公式5]
H 1 l , m = h 11 l , m h 12 l , m h 21 l , m - ( h 12 l , m ) * , 0 &le; m < M Proc , 0 &le; l < L
矩阵H的每个元素可以如下定义。
[公式6]
h 11 l , m = &sigma; L l , m ( cos ( IPD B l , m / 2 ) + j sin ( IPD B l , m / 2 ) ) ( iid l , m + ICC B l , m ) d l , m ,
h 12 l , m = &sigma; L l , m ( cos ( IPD B l , m / 2 ) + j sin ( IPD B l , m / 2 ) ) 1 - ( ( iid l , m + ICC B l , m ) d l , m ) 2
h 21 l , m = &sigma; R l , m ( cos ( IPD B l , m / 2 ) - j sin ( IPD B l , m / 2 ) ) ( 1 + iid l , m ICC B l , m ) d l , m
[公式7]
( &sigma; X l , m ) 2 = ( P X , C m ) 2 ( &sigma; C l , m ) 2 + ( P X , L m ) 2 ( &sigma; L l , m ) 2 + ( P X , Ls m ) 2 ( &sigma; Ls l , m ) 2 + ( P X , R m ) 2 ( &sigma; R l , m ) 2 + ( P X , Rs m ) 2 ( &sigma; Rs l , m ) 2 + . . .
P X , L m P X , R m &rho; L m &sigma; L l , m &sigma; R l , m ICC 3 l , m cos ( &phi; L m ) + . . .
P X , L m P X , R m &rho; R m &sigma; L l , m &sigma; R l , m ICC 3 l , m cos ( &phi; R m ) + . . .
P X , Ls m P X , Rs m &rho; Ls m &sigma; Ls l , m &sigma; Rs l , m ICC 2 l , m cos ( &phi; Ls m ) + . . .
P X , Ls m P X , Rs m &rho; Ls m &sigma; Ls l , m &sigma; Rs l , m ICC 2 l , m cos ( &phi; Rs m )
[公式8]
( &sigma; L l , m ) 2 = r 1 ( CLD 0 l , m ) r 1 ( CLD 1 l , m ) r 1 ( CLD 3 l , m )
( &sigma; R l , m ) 2 = r 1 ( CLD 0 l , m ) r 1 ( CLD 1 l , m ) r 2 ( CLD 3 l , m )
( &sigma; C l , m ) 2 = r 1 ( CLD 0 l , m ) r 2 ( CLD 1 l , m ) / g c 2
( &sigma; Ls l , m ) 2 = r 2 ( CLD 0 l , m ) r 1 ( CLD 2 l , m ) / g s 2
( &sigma; Rs l , m ) 2 = r 2 ( CLD 0 l , m ) r 2 ( CLD 2 l , m ) / g s 2
其中, r 1 ( CLD ) = 10 CLD / 10 1 + 10 CLD / 10 并且 r 2 ( CLD ) = 1 1 + 10 CLD / 10 .
在公式7中,“Px,c”、“Px,L”等是与HRTF参数相对应的因子,并且可以与公式3中的第二增益信息相对应。并且,在公式7中的“σC”,“σL”等是表示信道功率(power)的因子,并且可以与公式1中的对象功率相对应。因此,因为对应关系受到影响,所以通过使用HRTF参数可以生成由用户指定的信号。换言之,通过将HRTF参数应用到与由公式给出的每个信道相对应的值上,可以生成输出。
信息传输单元118传输多信道信息(MI)并且还传输第一增益信息或者额外多信道信息(EMI)。具体地,在通过第一增益信息生成单元114a生成第一增益信息的情况下,信息传输单元118传输包括第一增益信息的多信道信息。在通过额外多信道信息生成单元116生成额外多信道信息(EMI)的情况下,信息传输单元118传输不包括第一增益的多信道信息(MI)和额外多信道信息(EMI)。在此情况下,应理解的是可以传输默认的第一增益信息,来取代从多信道信息(MI)中排除第一增益信息信道。
同时,在包括HRTF信息的额外多信道信息(EMI)被传输的情况下,信息传输单元118传输指定HRTF参数一次,并且然后能够传输可以标识该指定HRTF参数的信息(例如,索引(index))。
在使用多信道信息(MI)和第一增益信息已经生成了匹配信道定向标准(例如,MPEG环绕)的语法的比特流之后,信息传输单元118能够传输生成的比特流。这不会对本发明的各种实施方式作出限制。
图3是用于根据本发明实施例的音频信号处理方法的流程图。
参考图3,缩混信号(DMX)、对象信息(OI)、以及混合信息(MXI)被接收[S110]。使用对象信息(OI)、以及混合信息(MXI)生成多信道信息,并且然后将其传输[S120]。如果缩混信号不是单声信道信号(在步骤S130中为“否”)(即,缩混信号是立体声信号),则执行步骤S210和S240。这将随后参考图4进行详细解释。在不管缩混信号是单声信号还是立体声信号而生成第一增益信息的情况下,当然可以省略步骤S130和步骤S210至S240。
同时,在缩混信号是单声信号(在步骤S130中为“是”)的情况下,确定是否生成用于双耳模式的信息[S140]。如果不生成用于双耳模式的信息(在步骤S140中为“否”),则生成第一增益信息,以控制对象增益[S150]。随后,包括第一增益信息的多信道信息(MI)被传输[S170]。在此情况下,第一增益信息可以与步骤S120的多信道信息一起传输。多信道解码器接收多信道信息,并且然后通过应用所接收的多信道信息可以控制缩混信号的增益。
在步骤S140中生成用于双耳模式的信息(在步骤S140中为“是”)的情况下,使用对象信息、混合信息、HRTF数据库等,生成包括第二增益信息、HRTF参数和对象参数的HRTF信息[S170]。随后,包括第二增益信息的额外多信道信息(EMI)被传输[S180]。
在步骤S130中缩混信号不是单声信号的情况下,使用对象信息(OI)和混合信息(MXI)优选生成缩混处理信息[S210]。使用在步骤S210中生成的缩混处理信息(DPI)处理缩混信号[S220]。在双耳模式(步骤S230中为“是”)的情况下,执行上述步骤S170和S180。如果不是双耳模式(步骤S230中为“否”),则结束所有的过程。
虽然在此参考本发明的优选实施例对本发明进行了描述和说明,但是对于本领域的技术人员来说明显的是,在不脱离本发明的精神和范围的情况下,可以在其中进行各种修改和变化。因此,本发明旨在覆盖落入所附权利要求和其等价物的范围内的该发明的修改和变化。
工业应用性
因此,本发明可应用于编码/解码音频信号的处理。

Claims (20)

1.一种处理音频信号的方法,包括:
接收缩混信息、对象信息、以及混合信息;
使用所述缩混信息、所述对象信息、以及所述混合信息中的至少一个,生成和传输多信道信息;以及
使用所述对象信息和所述混合信息中的至少一个,根据解码模式选择性地生成和传输第一增益信息或包括第二增益信息的额外多信道信息。
2.根据权利要求1所述的方法,进一步包括:使用所述第一增益信息或者包括所述第二增益信息的所述额外多信道信息、所述多信道信息、以及所述缩混信息,生成多信道音频。
3.根据权利要求1所述的方法,其中,所述对象信息包括对象电平信息和对象相关性信息中的至少一个。
4.根据权利要求1所述的方法,其中,所述多信道信息与用于将所述缩混信号扩混到所述多信道信号中的信息相对应,并且使用所述对象信息和所述混合信息,生成所述多信道信息。
5.根据权利要求4所述的方法,其中,所述多信道信息包括信道电平信息和信道相关性信息中的至少一个。
6.根据权利要求1所述的方法,其中,所述第一增益信息按每时间子带来计算。
7.根据权利要求1所述的方法,其中,所述第一增益信息表示基于所述对象信息和所述混合信息计算的用户增益与从所述对象信息计算的对象电平的比率。
8.根据权利要求1所述的方法,其中,所述多信道信息和所述第一增益信息被一起传输。
9.根据权利要求1所述的方法,其中,所述额外多信道信息与用于双耳的HRTF信息相对应。
10.根据权利要求9所述的方法,生成所述第一增益信息或者所述额外多信道信息,包括:
如果所述解码模式不是双耳模式,则生成所述第一增益信息;以及
如果所述解码模式是双耳模式,则生成所述额外多信道信息。
11.根据权利要求9所述的方法,其中,所述HRTF信息包括HRTF参数和所述对象信息。
12.根据权利要求11所述的方法,其中,所述HRTF参数与从HRTF数据库中提取的参数相对应。
13.根据权利要求1所述的方法,其中,所述第二增益信息与用于控制对象电平的信息相对应,并且所述第二增益信息是基于所述混合信息而生成的。
14.根据权利要求1所述的方法,如果所述缩混信号对应于单声信号,则所述方法进一步包括旁路所述缩混信号,
其中,所述生成所述第一增益信息或者所述额外多信道信息包括:
如果所述解码模式不是双耳模式,则生成所述第一增益信息,以及
如果所述解码模式是双耳模式,则生成所述额外多信道信息。
15.根据权利要求1所述的方法,进一步包括:
如果所述缩混信号的信道数至少为两个,则使用所述对象信息和所述混合信息中的至少一个,生成缩混处理信息;以及
使用所述缩混处理信息,处理所述缩混信号,
其中,所述生成所述第一增益信息或者所述额外多信道信息包括:
如果所述解码模式是双耳模式,则生成所述额外多信道信息。
16.根据权利要求1所述的方法,其中,基于对象位置信息、对象增益信息、以及播放配置信息中的至少一个,生成所述混合信息。
17.根据权利要求1所述的方法,其中,经由广播信号来接收所述缩混信息。
18.根据权利要求1所述的方法,其中,在数字介质上接收所述缩混信息。
19.一种计算机可读记录介质,包括记录在其中的程序,提供所述程序以执行:
接收缩混信息、对象信息、以及混合信息;
使用所述缩混信息、所述对象信息、以及所述混合信息中的至少一个,生成和传输多信道信息;以及
使用所述对象信息和所述混合信息中的至少一个,根据解码模式选择性地生成和传输第一增益信息或包括第二增益信息的额外多信道信息。
20.一种用于处理音频信号的装置,包括:
信息接收单元,所述信息接收单元接收缩混信息、对象信息、和混合信息;
信息生成单元,所述信息生成单元使用所述缩混信息、所述对象信息、以及所述混合信息中的至少一个,生成多信道信息,所述信息生成单元使用所述对象信息和所述混合信息中的至少一个,根据解码模式选择性地生成第一增益信息或包括第二增益信息的额外多信道信息;以及
信息传输单元,所述信息传输单元传输所述多信道信息,所述信息传输单元根据所述解码模式传输所述第一增益信息或者包括所述第二增益信息的所述额外多信道信息。
CNA2008800017518A 2007-01-05 2008-01-07 用于处理音频信号的装置和方法 Pending CN101578656A (zh)

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
US88356907P 2007-01-05 2007-01-05
US60/883,569 2007-01-05
US88404307P 2007-01-09 2007-01-09
US60/884,043 2007-01-09
US88534707P 2007-01-17 2007-01-17
US60/885,347 2007-01-17
PCT/KR2008/000073 WO2008082276A1 (en) 2007-01-05 2008-01-07 A method and an apparatus for processing an audio signal

Publications (1)

Publication Number Publication Date
CN101578656A true CN101578656A (zh) 2009-11-11

Family

ID=39588832

Family Applications (1)

Application Number Title Priority Date Filing Date
CNA2008800017518A Pending CN101578656A (zh) 2007-01-05 2008-01-07 用于处理音频信号的装置和方法

Country Status (5)

Country Link
US (1) US8463605B2 (zh)
EP (1) EP2118888A4 (zh)
JP (1) JP2010516077A (zh)
CN (1) CN101578656A (zh)
WO (1) WO2008082276A1 (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101049144B1 (ko) * 2007-06-08 2011-07-18 엘지전자 주식회사 오디오 신호 처리방법 및 장치
CN105047206B (zh) * 2010-01-06 2018-04-27 Lg电子株式会社 处理音频信号的设备及其方法
US9497560B2 (en) 2013-03-13 2016-11-15 Panasonic Intellectual Property Management Co., Ltd. Audio reproducing apparatus and method
US10225814B2 (en) * 2015-04-05 2019-03-05 Qualcomm Incorporated Conference audio management
JP7447798B2 (ja) 2018-10-16 2024-03-12 ソニーグループ株式会社 信号処理装置および方法、並びにプログラム

Family Cites Families (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2956125B2 (ja) 1990-05-09 1999-10-04 ソニー株式会社 音源情報制御装置
KR940011504B1 (ko) * 1991-12-07 1994-12-19 삼성전자주식회사 2채널 음장재생 장치 및 방법
FR2738099B1 (fr) * 1995-08-25 1997-10-24 France Telecom Procede de simulation de la qualite acoustique d'une salle et processeur audio-numerique associe
KR100350340B1 (ko) * 1997-03-12 2002-08-28 미쓰비시덴키 가부시키가이샤 음성 부호화 장치, 음성 복호 장치 및 음성 부호화 복호 장치 및 음성 부호화 방법, 음성 복호 방법 및 음성 부호화 복호 방법
US7415120B1 (en) * 1998-04-14 2008-08-19 Akiba Electronics Institute Llc User adjustable volume control that accommodates hearing
US7035417B1 (en) * 1999-04-05 2006-04-25 Packard Thomas N System for reducing noise in the reproduction of recorded sound signals
US20060072768A1 (en) * 1999-06-24 2006-04-06 Schwartz Stephen R Complementary-pair equalizer
JP3365360B2 (ja) * 1999-07-28 2003-01-08 日本電気株式会社 音声信号復号方法および音声信号符号化復号方法とその装置
EP1134724B1 (en) 2000-03-17 2008-07-23 Sony France S.A. Real time audio spatialisation system with high level control
JP2003009296A (ja) 2001-06-22 2003-01-10 Matsushita Electric Ind Co Ltd 音響処理装置および音響処理方法
US20050185806A1 (en) * 2003-02-14 2005-08-25 Salvador Eduardo T. Controlling fading and surround signal level
JP2005109914A (ja) 2003-09-30 2005-04-21 Nippon Telegr & Teleph Corp <Ntt> 高臨場感音場再生方法、頭部伝達関数データベース作成方法及び高臨場感音場再生装置
US7447317B2 (en) * 2003-10-02 2008-11-04 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V Compatible multi-channel coding/decoding by weighting the downmix channel
DE60319448T2 (de) 2003-12-09 2009-03-05 Matthew Bullock Kreuzgewebe-frachtrückhaltesystem und verfahren
US7805313B2 (en) * 2004-03-04 2010-09-28 Agere Systems Inc. Frequency-based coding of channels in parametric multi-channel coding systems
KR101120911B1 (ko) * 2004-07-02 2012-02-27 파나소닉 주식회사 음성신호 복호화 장치 및 음성신호 부호화 장치
PL1769655T3 (pl) * 2004-07-14 2012-05-31 Koninl Philips Electronics Nv Sposób, urządzenie, urządzenie kodujące, urządzenie dekodujące i system audio
US7930184B2 (en) * 2004-08-04 2011-04-19 Dts, Inc. Multi-channel audio coding/decoding of random access points and transients
US8204261B2 (en) * 2004-10-20 2012-06-19 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Diffuse sound shaping for BCC schemes and the like
KR101215868B1 (ko) 2004-11-30 2012-12-31 에이저 시스템즈 엘엘시 오디오 채널들을 인코딩 및 디코딩하는 방법, 및 오디오 채널들을 인코딩 및 디코딩하는 장치
EP1839297B1 (en) * 2005-01-11 2018-11-14 Koninklijke Philips N.V. Scalable encoding/decoding of audio signals
EP1691348A1 (en) * 2005-02-14 2006-08-16 Ecole Polytechnique Federale De Lausanne Parametric joint-coding of audio sources
US7983922B2 (en) * 2005-04-15 2011-07-19 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for generating multi-channel synthesizer control signal and apparatus and method for multi-channel synthesizing
WO2006132857A2 (en) * 2005-06-03 2006-12-14 Dolby Laboratories Licensing Corporation Apparatus and method for encoding audio signals with decoding instructions
EP1946294A2 (en) * 2005-06-30 2008-07-23 LG Electronics Inc. Apparatus for encoding and decoding audio signal and method thereof
US7957960B2 (en) * 2005-10-20 2011-06-07 Broadcom Corporation Audio time scale modification using decimation-based synchronized overlap-add algorithm
EP1640972A1 (en) 2005-12-23 2006-03-29 Phonak AG System and method for separation of a users voice from ambient sound
WO2007080225A1 (en) 2006-01-09 2007-07-19 Nokia Corporation Decoding of binaural audio signals
WO2007080211A1 (en) * 2006-01-09 2007-07-19 Nokia Corporation Decoding of binaural audio signals
WO2007080224A1 (en) * 2006-01-09 2007-07-19 Nokia Corporation Decoding of binaural audio signals

Also Published As

Publication number Publication date
EP2118888A1 (en) 2009-11-18
US20100145711A1 (en) 2010-06-10
US8463605B2 (en) 2013-06-11
WO2008082276A1 (en) 2008-07-10
JP2010516077A (ja) 2010-05-13
EP2118888A4 (en) 2010-04-21

Similar Documents

Publication Publication Date Title
CN101675471B (zh) 用于处理音频信号的方法和装置
KR102468780B1 (ko) DirAC 기반 공간 오디오 코딩과 관련된 인코딩, 디코딩, 장면 처리, 및 다른 절차를 위한 장치, 방법, 및 컴퓨터 프로그램
CN101410889B (zh) 对作为听觉事件的函数的空间音频编码参数进行控制
CN111149155B (zh) 使用多点声场描述生成经增强的声场描述的装置及方法
CN106165454B (zh) 音频信号处理方法和设备
CN101411214B (zh) 用于多信道环绕声音的解码器的方法和装置
US8280743B2 (en) Channel reconfiguration with side information
EP3122073B1 (en) Audio signal processing method and apparatus
CN101553866B (zh) 用于处理音频信号的方法和装置
CN101263742B (zh) 音频编码
CN102804747B (zh) 多通道回波对消器
KR101480258B1 (ko) 미리 계산된 참조 곡선을 이용한 입력 신호 분해 장치 및 방법
CN105917674B (zh) 用于处理音频信号的方法和移动装置
CN102597987B (zh) 用于扬声器或耳机播放的虚拟音频处理
CN102124513B (zh) 用于确定转换的空间音频信号的装置
US20070269063A1 (en) Spatial audio coding based on universal spatial cues
US20130230176A1 (en) Method and an Apparatus for Encoding/Decoding a Multichannel Audio Signal
CN105900455A (zh) 用于处理音频信号的方法和设备
CN102165797A (zh) 用于确定空间输出多声道音频信号的装置
CN102007780A (zh) 具有紧密间隔的扬声器的***中产生3d音频的装置和方法
US11350213B2 (en) Spatial audio capture
CN101578656A (zh) 用于处理音频信号的装置和方法
CN104969571B (zh) 用于渲染立体声信号的方法
EP3216235B1 (en) An audio signal processing apparatus and method
CN104853283A (zh) 一种音频信号处理的方法和装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Open date: 20091111