CN101632117A - 用于解码音频信号的方法和装置 - Google Patents

用于解码音频信号的方法和装置 Download PDF

Info

Publication number
CN101632117A
CN101632117A CN200780049392A CN200780049392A CN101632117A CN 101632117 A CN101632117 A CN 101632117A CN 200780049392 A CN200780049392 A CN 200780049392A CN 200780049392 A CN200780049392 A CN 200780049392A CN 101632117 A CN101632117 A CN 101632117A
Authority
CN
China
Prior art keywords
information
reduction
compound object
combination
mixed
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN200780049392A
Other languages
English (en)
Inventor
吴贤午
郑亮源
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
LG Electronics Inc
Original Assignee
LG Electronics Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by LG Electronics Inc filed Critical LG Electronics Inc
Publication of CN101632117A publication Critical patent/CN101632117A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/439Processing of audio elementary streams
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/20Vocoders using multiple modes using sound class specific coding, hybrid encoders or object based coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Mathematical Physics (AREA)
  • Stereophonic System (AREA)

Abstract

一种用于解码音频信号的方法,包括接收组合缩减混合、组合对象信息和混合信息,组合缩减混合是利用至少两个缩减混合信号生成的,组合对象信息是由至少两组对象信息的组合形成的;利用组合对象信息和混合信息生成缩减混合处理信息;以及利用缩减混合处理信息处理组合缩减混合。用于解码包括组合缩减混合和组合对象信息的音频信号的方法和装置可控制远程会议等中的对象增益和输出。通过减少处理时间、计算机资源从而降低类似宽带宽的资源要求来快速且高效地解码包括多对象信号的音频信号的方法和装置。

Description

用于解码音频信号的方法和装置
技术领域
本发明涉及用于解码音频信号的方法和装置,尤其涉及用于解码经由各种数字介质接收的音频信号的方法和装置。
背景技术
MCU(多点控制单元)是在远程电信会议中用于使通过电话会议从远程地点提供的信号清晰的设备。MCU在三个或更多人之间建立关于集中的音频信号(包括语音)、视频信号和数据会议的电话会议。
通常称为桥的MCU可根据每个参与者的终端的性能仅提供音频服务或提供音频、视频和数据的任意组合。常规的MCU通常使用用于远程电信会议的至少两个缩减混合信号来制作组合缩减混合信号。
发明内容
技术问题
常规的MCU不能控制构成常规MCU的缩减混合信号、输出信号的每个信号的增益和摇移(panning)。因此,为了控制各个对象信号,常规MCU的输入信号可以是包含多对象信号的音频信号。
然而,用于解码整个多对象信号的装置和方法需要宽带宽。因此,需要一种新的用于解码多对象信号的装置和方法以降低类似宽带宽的资源要求。
技术方案
因此,谨记以上问题作出本发明,且本发明涉及一种充分改进相关技术的缺点并消除相关技术的一个或多个问题的用于解码音频信号的方法和装置。
本发明的一个目的是提供一种通过使用包括对象电平信息和对象增益信息的对象信息以随着改变各个对象对各个缩减混合声道的贡献修改缩减混合信号来解码音频信号的方法或装置。
本发明的另一目的是提供一种用于解码包括组合缩减混合和组合对象信息的音频信号,以在远程会议等中控制对象增益和输出的方法和装置。
本发明的其它优点、目的和特征将在以下的说明中部分地阐述,且在本领域技术人员分析以下内容后将部分地变得显然易见,或者可从本发明的实施中获知。本发明的目的和其它优点可由书面说明书及其权利要求书和附图中具体指出的结构来实现并获得。
有益效果
本发明的各个实施例提供一种通过减少处理时间、计算机资源从而降低类似宽带宽的资源要求来快速且高效地解码包括多对象信号的音频信号的方法和装置。
附图简述
包含于此以提供对本发明进一步理解的附图示出本发明的优选实施例,并与说明书一起用来解释本发明的原理。在附图中:
图1是根据本发明的一个实施例的用于解码音频信号的装置的示例性框图。
图2是示出根据本发明实施例的音频信号解码方法的流程图。
图3是根据本发明的其它实施例的用于解码音频信号的装置的示例性框图。
图4是根据本发明的一个实施例的信息生成单元的示例性框图。
图5是根据本发明的一个实施例的对象增益信息解码单元的示例性框图。
图6是根据本发明的其它实施例的用于处理音频信号的装置的示例性框图。
图7是根据本发明的一个实施例的MCU组合单元的示例性框图。
图8是根据本发明的一个实施例的组合对象信息编码单元的示例性框图。
图9是根据本发明的一个实施例的用于处理音频信号的装置的示例性框图。
本发明的最佳实施方式
为了实现上述目的和其它优点并根据本发明的目的,如本文体现和广泛描述的,本发明的用于音频信号的解码方法包括:接收组合缩减混合、组合对象信息和混合信息,组合缩减混合是利用至少两个缩减混合信号生成的,组合对象信息是通过至少两组对象信息的组合形成的;利用组合对象信息和混合信息生成缩减混合处理信息;以及利用缩减混合处理信息处理组合缩减混合。
应理解,本发明的以上一般描述和以下详细描述是示例性和说明性的,并且旨在提供对如所要求保护的本发明的进一步解释。
本发明的实施方式
现在详细参考在附图中示出其示例的本发明的优选实施例。只要有可能,在所有附图中始终使用相同的附图标记表示相同或相似的部件。
在对本发明进行叙述之前,应当指出的是本发明中揭示的大多数术语对应于本领域内公知的一般术语,但某些术语是由本申请根据需要选择的,并且将在本发明以下的描述中予以揭示。因此,由申请人定义的术语优选基于它们在本发明中的含义来理解。
图1是根据本发明的一个实施例的用于解码音频信号的装置1000的示例性框图。图3是根据本发明的其它实施例的用于解码音频信号的装置2000的示例性框图。
装置1000和2000的两个实施例的区别在于装置1000具有多声道解码器1300而装置2000不具有多声道解码器1300。诸如参数生成单元1100和2000以及缩减混合处理单元1200和2200之类的其它元件在图1和3中是相同的。
参照图1,用于解码音频信号的装置1000(在下文中简称为‘解码器1000’)包括参数生成单元1100、缩减混合处理单元1200和多声道解码器1300。参数生成单元1100被配置成从用户控件或比特流中接收对象信息和混合信息,并生成缩减混合处理信息。
对象信息包括对象电平信息、对象相关性信息和对象增益信息。对象电平信息可通过使用对象电平之一作为基准信息归一化对应于各个对象的对象电平来生成。对象相关性信息可由两个所选对象的组合来提供。对象增益信息包括对象增益值信息或对象增益比信息。缩减混合处理信息包括用于控制对象增益和对象摇移的参数,其被输入到缩减混合处理单元1200。
缩减混合处理单元1200被配置成接收缩减混合信号以及来自信息生成单元1100的缩减混合处理信息。缩减混合处理单元1200可利用缩减混合处理信息来处理缩减混合,从而生成经处理的缩减混合信号。例如,缩减混合处理单元1200可将缩减混合处理信息施加到缩减混合信号以修改缩减混合信号,从而生成经处理的缩减混合。
经处理的缩减混合可被输入到多声道解码器1300,以便由诸如扬声器之类的输出设备扩展混合并输出。从信息生成单元输出的多声道参数也可被输入到多声道解码器1300。在本发明的某些实施例中,可将MPEG环绕解码器用于多声道解码器1300。
或者,经处理的缩减混合信号可被直接发送到如图2所示的设备2000的输出设备并由该设备输出。为了经由扬声器直接输出经处理的信号,缩减混合处理单元2200可输出信号。还能够选择是直接输出信号还是输入到多声道解码器。
图2示出本发明的流程图并且也参照图1。该方法是用于音频信号的解码方法的流程。在步骤S110,接收缩减混合信号、对象信息和混合信息。步骤120利用对象信息和混合信息生成缩减混合处理信息。在步骤S130,通过利用缩减混合处理信息处理缩减混合信号来生成经处理的缩减混合。
将参照图4至图6详细解释参数生成单元1100的配置。
1.对象信息
1.1基准信息和对象电平信息
图4是根据本发明的一个实施例的用于处理音频信号的装置的示例性框图,具体地是信息生成单元的示例性框图。参照图4,信息生成单元1100可被配置成接收对象信息,并利用该对象信息生成缩减混合处理信息。
信息生成单元1100可包括对象电平信息解码单元1110a、对象增益信息解码单元1120a和对象相关性信息解码单元1130a。
对象电平信息是通过利用基准信息归一化对象电平来生成的,且基准信息可以是对象电平之一,更具体地,基准信息可以是所有对象电平中最大的对象电平。
例如,假设缩减混合信号包括对象s_i,且各个对象s_i的对象电平是Ps_i。这里,“s_i(n)”指示第i个对象信号,且s_i(n)可以是时域信号或给定频带内的子频带信号,且Ps_i表示第i对象的电平。
可通过各种方法获得Ps_i。例如,Ps_i可以是“s_i(n)^2”或“E[s_i(n)^2]”。
然而,如果与各个对象信号对应的对象电平信息按其自身的值发送,则对象信号的对象电平可能由于动态范围变化的过度增加而难以量化。
因此,对象电平信息可利用基准信息——即所有对象电平的最大对象电平——来归一化。如果基准信息可以是Ps_r,则对象电平信息OL_i可以按以下的等式来估计:
数学演算1
OL_i=Ps_i/Ps_r
所有的对象电平信息被包括在小于或等于1的范围中。因此,动态范围可被压缩成足以编码音频信号。
另外,对象电平信息可包括默认信息、原始对象电平以用于其它信号处理。对象电平信息对应于各个对象,且对象电平信息的数目与缩减混合中对象的数目相同。
1.2对象增益信息
对象信息包括对象增益信息,对象增益信息包括对象增益值信息和对象增益比信息中的至少一个。图5是根据本发明的一个实施例的用于处理音频信号的装置的示例性框图,具体地是信息生成单元1100的对象增益信息解码单元的示例性框图。
对象增益信息解码单元1120a包括对象增益值信息生成单元1121和对象增益比信息生成单元1122。对象增益信息涉及随着改变各个对象对各个缩减混合声道的贡献修改具有一个以上声道的缩减混合信号。
1.2.1对象增益值信息
对象增益值信息包括对象的增益值以随着改变各个对象对各个缩减混合声道的贡献修改缩减混合信号。
在本发明的某些实施例中,在生成缩减混合信号时将对象增益施加到各个对象。
例如,当缩减混合信号包括多个对象时,对应于各个对象的各个对象增益值信息与各个对象信号相乘以生成各个增益对象,且将所有的增益对象相加以生成经处理的缩减混合。
数学演算2
x=sum{a_i*s_i}
其中X是将被发送到单声道的缩减混合,s_i是对象信号,且a_i是对各个声道有贡献的对象的对象增益值信息。
1.2.2对象增益比信息
对象增益信息还包括对象增益比信息以及对象增益值信息。对象增益比信息包括对缩减混合信号的各个声道有贡献的各个对象的增益之间的比值。
对象增益比信息可用于通过缩减混合处理单元1200处理缩减混合信号,从而获得将通过2个(例如立体声)和更多个声道发送的经处理的缩减混合。
在立体声声道的情形中,可利用对象增益比信息从公式3获得缩减混合信号。
数学演算3
x_1=sum{a_i*s_i}
x_2=sum{b_i*s_i}
其中x_1和x_2分别是将发送的缩减混合,s_i是对象信号,且a_i和b_i是对各个声道有贡献的对象的对象增益值信息。
数学演算4
m_i=a_i/b_i
其中m_i是各个对象的对象增益比信息。
对象增益信息,即对象增益值信息(a_i和b_i)和对象增益比信息(m_i)可按包括在比特流中的对象增益信息的各种组合被发送到信息生成单元1100。组合包括例如(a_i,b_i)、(m_i,a_i)和(m_i,b_i)。
或者,当对象增益信息以对象增益值信息(a_i,b_i)的组合被发送到信息生成单元1100时,可缩放对象增益值信息。如果有b_i缩放为1的约定,则尽管对象电平信息和仅a_i作为对象增益信息发送,信息生成单元1100可根据约定重构对象信息。通过缩放对象增益值,可减少将发送到信息生成单元1100的信息的数目。
或者,对象增益比信息(m_i)可从如公式5的各个值中获得。
数学演算5
m_i=a_i/b_i,    (1)
m_i=(a_i+α)/(b_i+β),    (2)
m_i=(a_i*s_i)/(b_i*s_i)    (3)
(α、β是防止分子和分母为0的非常小的数。)
在公式5的情形中,相同的m_i值可能不包括相同的a_i和b_i值。例如在1)a_i=0.5,b_i=0.5,2)a_i=2,b_i=2的情形中,这些情形都具有相同的m_i(=1),但这些情形具有不同的a_i、b_i值。
为了获得将通过各个声道发送的经处理的缩减混合,可使用如公式6的新方法:
数学演算6
x_1=sum{a_i′(n)*s_i′(n)},
x_2=sum{b_i′(n)*s_i′(n)}
(其中a_i′和b_i′是满足以下条件的值,
(a_i′+b_i′=C)或(a_i′^2+b_i′^2=C)或(a_i′=C或b_i′=C),
其中s_i′=g_i*s_i)
最后,可发送目标增益比信息m_i′(=a_i′/b_i′)。可减少要发送到参数生成单元1100的信息的数目。
1.3对象相关性信息
参照图4,信息解码单元1100接收对象相关性信息。对象相关性信息在两个对象之间被估计,且表示两个对象之间的相关性/相干性。
在两个对象信号是同一源的不同对象的情形中,可存在对象相关性信息。
首先,如果对象信号是立体声对象,则可利用立体声对象生成单声道对象,并利用立体声对象估计指示立体声对象的声道之间关系的子代对象信息(在下文中该方法是‘单声道方法’)。
在这种情形中,对象电平信息是利用单声道对象的对象电平生成的。
第二,立体声对象被识别为两个单独的单声道对象信号。在这种情形中,对象电平信息利用两个单独的单声道对象电平生成(在下文中,该方法是‘立体声方法’)。利用第二方法发送的信息量多于利用第一方法的信息量。
为了处理立体声对象,例如,立体声对象的第一声道信号可以是s_i,立体声对象的第二声道信号是作为各个单声道对象信号的s_j。
以上声道信号的对象电平可以是Ps_i、Ps_j。
在立体声对象的情形中,表示给定对象的L和R声道的各个对象的特性彼此相似。所以,对象相关性信息可用于表示对象信息之间的相似性。
因此,为了编码Ps_i和Ps_j,利用立体声方法的各个单声道对象被视为耦合构成的相同对象。
对象相关性信息可利用如下的表示来生成。
数学演算7
Ps_i,j/sqrt(Ps_i*Ps_j)
对象相关性信息表示对象之间的关系,对象是否是同一立体声或多声道对象的两个声道,即各个对象是同一源的不同声道。
为了减少所发送的对象信息的位,使用对象差信息是有效的。例如,对象信息包括立体声对象的左声道的对象电平和可在公式8中表示的对象差信息。可假设左声道和右声道之间的电平差不是很大,编码对象差信息比编码右声道的对象电平更有效率。
数学演算8
Ps_j′=Ps_j/Ps_i或
Ps_j′=10log10(Ps_j)-10log10(Ps_i)=10log10(Ps_j/Ps_i)
或者,对象信息可包括对象和与差信息,而不是各个声道的对象电平信息,如下:
数学演算9
M=(L+R)/2,S=(L-R)/2,
Ps_M=(Ps_L+Ps_R)/2,Ps_S=(Ps_L-Ps_R)/2
利用对象和(Ps_M)与差(Ps_S)信息可提高传输效率并易于执行量化误差的平衡。
对象相关性信息的数目根据同一源的不同对象的数目而改变。为了降低对象信息的比特率。标志信息‘相关性_标志’指示对象是否是立体声或多声道对象的一部分,并可从对象信息接收。相关性_标志可被包括在对象信息中,且由信息生成单元1100接收。
标志信息相关性_标志的含义在以下的表1中示出。
表1
相关性_标志    含义
1              相关
0              不相关
在‘相关性_标志’等于0的情形中,对象相关性信息不被发送到对象相关性信息解码单元1130a。当‘相关性_标志’未被接收到解码器1000或2000时,相关性信息的默认值可用于处理缩减混合信号。否则(‘相关性_标志’等于1),对象相关性信息被发送到对象相关性信息解码单元1130a。
此外,对象信息还单独包括基准信息。当存在基准信息时,基准信息可以是用于MCU组合器的标识符。
根据本发明的编码音频信号的方法包括接收多对象音频信号的步骤以及生成缩减混合信号与包括对象电平信息、对象增益信息和对象相关性的对象信息的步骤,对象电平信息和对象相关性信息来自多对象音频信号,对象电平信息、对象增益信息和对象相关性的特性与解码方法的特性相同。所以,根据本发明的编码音频信号的方法可以不受以上所标识的限制。
另外,根据本发明的编码音频信号的装置包括:由多对象音频信号生成缩减混合信号的缩减混合单元;以及从多对象音频信号提取包括对象电平信息、对象增益信息和对象相关性信息的对象信息的对象信息生成单元。编码音频信号的装置可以不受以上所标识的限制。
2.MCU组合器
可在常规MCU缩减混合音频信号时使用音频信号控制远程会议中的输出等。在多声道音频信号包括歌唱、钢琴、解说的情形中。在必要时,当我们仅使用或收听没有歌唱声音和解说的钢琴信号或在远程电信会议中仅与某人通信时,我们不能删除或控制特定类型的对象信号。
然而,当音频信号包括多对象信号时,使用音频信号的对象信息对控制对应于各对象信号的特性的对象增益和摇移是有效的。另外,利用对象信息的本发明的解码方法可在增强的卡拉OK***中使用。
图6是根据本发明的实施例的用于处理音频信号的装置的示例性框图。参照图6,根据实施例的用于处理音频信号的装置可包括编码器13100、编码器24100、包括MCU组合单元5100和缩减混合组合单元5200的组合单元5000。编码器13100和编码器24100可被配置成分别接收音频信号_1或音频信号_2,并在编码器13100中生成缩减混合_1和对象信息_1,并在编码器24100中生成缩减混合_2和对象信息_2。
组合单元5000可被配置成接收来自编码器13100的缩减混合_1和对象信息_1、来自编码器24100的缩减混合_2和对象信息_2、以及控制信息,并生成组合缩减混合和组合对象信息。
组合单元5000的经组合缩减混合、输出信号可由常规的缩减混合单元生成。因此,缩减混合单元5200的元件的细节将被省略。
2.1组合对象信息
图7是根据本发明的实施例的用于处理音频信号的装置的示例性框图,具体地是MCU组合单元5100的示例性框图。参照图7,MCU组合单元5100可被配置成利用对象信息_1、对象信息_2和控制信息生成组合对象信息。组合对象信息包括与来自编码器13100的缩减混合_1和来自编码器24100的缩减混合_2相对应的信息。MCU组合单元5100包括对象信息解码单元5110和组合对象信息编码单元5120。对象信息解码单元5110可被配置成接收来自编码器13100的对象信息_1和来自编码器24100的对象信息_2,并从对象信息_1解码基准值_1、对象电平信息_1和对象增益信息_1,以及基准值_2、对象电平信息_2和对象增益信息_2。基准信息、对象电平信息和对象增益信息与图1-图6的相同。因此,将省略这些信息的解码方法的细节。
并且MCU组合单元5100可被配置成从多个编码器接收至少两个对象信息,而没有输入信号的限制,并生成与组合缩减混合相对应的组合对象信息。
2.2控制信息
图8是根据本发明的实施例的用于处理音频信号的装置的示例性框图,具体地是组合对象信息编码单元5120的示例性框图。参照图8,组合对象信息编码单元5120可被配置成接收基准值_i、对象电平信息_i、对象增益信息_i和控制信息,并生成将输入解码器(未示出)的组合对象信息。
组合对象信息可由至少两组对象信息的组合来形成,例如对象信息_1和对象信息_2,指的是组合对象信息编码单元5120中的控制信息。
控制信息包括对象控制信息和增益控制信息,且增益控制信息可包括目的地信息。以下将解释对象控制信息、增益控制信息和目的地信息中的每一个。
2.2.1对象控制信息
对象控制信息可确定要被包括在组合对象信息中的对象信息的对象子集。对象控制信息可确定对象信息_1或对象信息_2的音频信号的所需子集以及它们被包括在组合对象信息中的顺序。
对象电平信息可通过组合对象电平信息编码单元5122中的对象控制信息来处理。组合对象信息可包括与根据对象控制信息确定的某些对象相对应的信息,并可根据若干目的使用。
例如,对象信息_1包括含有歌唱、钢琴、吉他对象信号的音乐,且对象信息_2包括小提琴、歌唱对象信号。为了生成包括钢琴、吉他、小提琴对象信号的音频信号,我们可利用来自用户控件的对象控制信息获得没有歌唱对象信号的组合对象信息。
2.2.2增益控制信
组合对象增益信息编码单元5123可被配置成接收来自对象信息_1的增益信息_1、来自对象信息_2的增益信息_2、增益控制信息和目的地信息,并生成组合对象增益信息。
增益控制信息可用于控制缩减混合组合单元的对象缩减混合增益。与对象控制信息相反,增益控制信息可在组合对象电平信息编码单元5122和组合对象增益信息编码单元5123中处理对象信息,利用对象控制信息在组合对象电平信息编码单元5122中选择对象信息。增益控制信息可以是0-1范围中的值。
2.2.3目的地信息
在增益控制信息的范围内,如果对应于一组对象信息_i的增益控制信息是0,则该对象信息不被包括在组合对象信息中。在增益控制信息是0或1的情形中,可将增益控制信息视为目的地信息。目的地信息可指示缩减混合信号的方向。
目的地信息可用于特定功能,例如,密谈功能、秘密会议,并用于控制对象信号的目的地。
参照图8,可将目的地信息输入到组合对象增益信息编码单元5123,并处理增益信息_1和增益信息_2以控制组合对象信息的对象增益。
2.3生成组合对象信息的过程
图8是组合对象信息编码单元5120的示例性框图。参照图8,组合对象信息编码单元5120可被配置成接收基准值_1、基准值_2、对象电平信息_1、对象电平信息_2、对象增益信息_1、对象增益信息_2、对象控制信息、增益控制信息和目的地信息,并利用对象控制信息、增益控制信息和目的地信息生成组合对象信息。
2.3.1基准信息的估计
再次参照图8,组合对象信息编码单元5120包括组合基准值估计单元5121、组合对象电平信息编码单元5122和组合对象增益信息编码单元5123。
为了生成组合对象信息,首先可估计组合对象信息的基准信息。每个对象信息_i可包括基准信息以归一化每个对象电平,并生成对象电平信息。在组合至少两组对象信息以生成组合对象信息的情形中,可利用用于生成组合对象电平信息的的对象信息的基准信息中的至少一个来以组合基准信息(新值)估计组合对象信息。
可通过若干方法确定组合基准信息。例如,组合对象信息的基准信息可以是基准信息_1,或对象信息_i的最大基准信息。
2.3.3组合对象电平信息
组合基准信息生成单元5121可按以上方法估计组合基准信息。在组合基准信息变化之前,对象电平信息_1是利用基准信息_i归一化的。
我们假设对象信息_1的对象电平信息是[公式10],且组合对象电平信息是[公式11]。
数学演算10
OL_1i=Ps_1i/Ps_1r
(其中OL_1i是对象信息_1的第i对象电平信息,Ps_1r是对象信息_1的基准信息,Ps_1i是对象信息的第i对象电平)
数学演算11
OL_ck=OL_1i*Ps_1r/Ps_cr
(其中OL_ck是组合对象信息的第k对象电平信息,Ps_cr是组合对象信息的基准信息)
2.3.3组合对象增益信息
组合对象增益信息编码单元5123可被配置成接收对象增益_1、对象增益_2、增益控制信息和目的地信息,并利用增益控制信息和目的地信息生成组合对象增益信息。可通过增益控制信息控制对象电平信息控制以将其包括在组合对象信息中。尤其是,控制缩减混合信号的方向的增益控制信息指引目的地信息。在目的地信息指示对象信息的开/关的情形中,即目的地信息是0或1,对象信息_i的对象增益信息是0或第i对象的增益。
可将目的地信息包含在对象信息中或从用户控件输入。在可包括或输入增益控制信息的情形中,可利用增益控制信息改变对象增益信息_1和对象增益信息_2。
2.3.3组合对象相关性信息
对象相关性信息指示立体声对象或多声道对象的声道之间的相似性/相异性,所以对象相关性信息可受到在MCU组合单元5100中组合对象信息的影响。
可通过若干方法确定组合对象相关性信息。使用最简单的方法,对象信息_i的对象相关性信息未受影响。
对于本领域技术人员而言,可对本发明作出各种修改和变化而不背离本发明的精神和范围是显而易见的。因此,本发明旨在涵盖本发明的更改和变化,只要它们落在所附权利要求及其等效方案的范围内即可。
工业实用性
因此,本发明适用于编码和解码音频信号。

Claims (25)

1.一种用于解码音频信号的方法,包括:
接收组合缩减混合、组合对象信息和混合信息,所述组合缩减混合是利用至少两个缩减混合信号生成的,所述组合对象信息是由至少两组对象信息的组合形成的;
利用所述组合对象信息和所述混合信息生成缩减混合处理信息;以及
利用所述缩减混合处理信息处理组合缩减混合。
2.如权利要求1所述的方法,其特征在于,基于控制信息执行所述组合。
3.如权利要求2所述的方法,其特征在于,所述控制信息包括对象控制信息。
4.如权利要求3所述的方法,其特征在于,所述对象控制信息确定要被包括在组合对象信息中的对象信息的对象子集。
5.如权利要求2所述的方法,其特征在于,所述控制信息包括增益控制信息。
6.如权利要求5所述的方法,其特征在于,所述增益控制信息确定所述缩减混合信号的缩减混合增益。
7.如权利要求5所述的方法,其特征在于,所述增益控制信息包括确定所述缩减混合的方向的目的地信息。
8.如权利要求1所述的方法,其特征在于,所述对象信息包括基准信息。
9.如权利要求2所述的方法,其特征在于,所述组合对象信息包括组合基准信息、组合对象电平信息、组合对象增益信息和组合对象相关性信息中的至少一个。
10.如权利要求9所述的方法,其特征在于,所述组合基准信息是利用所述对象信息的基准信息估计的。
11.如权利要求9所述的方法,其特征在于,所述组合基准信息包括所述对象信息的基准信息中的至少一个。
12.如权利要求9所述的方法,其特征在于,所述组合对象电平信息是利用所述组合基准信息计算的。
13.如权利要求1所述的方法,其特征在于,所述组合缩减混合是从缩减混合组合单元接收的。
14.如权利要求1所述的方法,其特征在于,所述组合对象信息是从MCU组合单元接收的。
15.如权利要求1所述的方法,其特征在于,接收所述缩减混合信号作为广播信号。
16.如权利要求1所述的方法,其特征在于,从数字介质接收所述缩减混合。
17.一种有指令存储于其上的计算机可读介质,当所述指令被解码器执行时使得所述处理器执行以下操作,包括:
接收组合缩减混合、组合对象信息和混合信息,所述组合对象信息是由至少两组关于控制信息的对象信息的组合形成的;
利用所述组合对象信息和所述混合信息生成缩减混合处理信息;以及
利用所述缩减混合处理信息处理所述组合缩减混合。
18.一种用于解码音频信号的装置,包括:
信息生成单元,其接收组合对象信息和混合信息,所述组合对象信息是由至少两组对象信息的组合形成的,且所述信息生成单元利用所述组合对象信息和所述混合信息生成缩减混合处理信息;以及
缩减混合处理单元,其接收组合缩减混合和所述缩减混合处理信息,并利用所述缩减混合处理信息处理所述组合缩减混合。
19.一种编码音频信号的方法,包括:
接收至少两组对象信息;并利用所述对象信息生成组合对象信息,所述组合对象信息是由至少两组对象信息的组合形成的。
20.如权利要求19所述的方法,其特征在于,还包括:
接收至少两个缩减混合信号;以及
由所述缩减混合信号生成组合缩减混合。
21.如权利要求19所述的方法,其特征在于,基于控制信息执行组合。
22.如权利要求21所述的方法,其特征在于,所述控制信息包括对象控制信息。
23.如权利要求21所述的方法,其特征在于,所述控制信息包括增益控制信息。
24.如权利要求19所述的方法,其特征在于,所述对象信息包括基准信息。
25.一种用于编码音频信号的装置,包括:
对象信息解码单元,其对包括基准信息、对象电平信息、对象增益信息的至少两组对象信息进行解码;以及
组合对象信息编码单元,其接收所述基准信息、所述对象电平信息、所述对象增益信息和控制信息,并利用所述控制信息生成组合对象信息。
CN200780049392A 2006-12-07 2007-12-06 用于解码音频信号的方法和装置 Pending CN101632117A (zh)

Applications Claiming Priority (13)

Application Number Priority Date Filing Date Title
US86907706P 2006-12-07 2006-12-07
US86908006P 2006-12-07 2006-12-07
US60/869,077 2006-12-07
US60/869,080 2006-12-07
US88356707P 2007-01-05 2007-01-05
US60/883,567 2007-01-05
US88971507P 2007-02-13 2007-02-13
US60/889,715 2007-02-13
US95539507P 2007-08-13 2007-08-13
US60/955,395 2007-08-13
US97052407P 2007-09-06 2007-09-06
US60/970,524 2007-09-06
PCT/KR2007/006297 WO2008069584A2 (en) 2006-12-07 2007-12-06 A method and an apparatus for decoding an audio signal

Publications (1)

Publication Number Publication Date
CN101632117A true CN101632117A (zh) 2010-01-20

Family

ID=39492744

Family Applications (1)

Application Number Title Priority Date Filing Date
CN200780049392A Pending CN101632117A (zh) 2006-12-07 2007-12-06 用于解码音频信号的方法和装置

Country Status (6)

Country Link
US (1) US8265941B2 (zh)
EP (1) EP2102855A4 (zh)
JP (3) JP5463143B2 (zh)
KR (1) KR101062353B1 (zh)
CN (1) CN101632117A (zh)
WO (1) WO2008069584A2 (zh)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101230691B1 (ko) 2008-07-10 2013-02-07 한국전자통신연구원 공간정보 기반의 다객체 오디오 부호화에서의 오디오 객체 편집 방법 및 그 장치
WO2010005264A2 (ko) * 2008-07-10 2010-01-14 한국전자통신연구원 공간정보 기반의 다객체 오디오 부호화에서의 오디오 객체 편집 방법 및 그 장치
US20100324915A1 (en) * 2009-06-23 2010-12-23 Electronic And Telecommunications Research Institute Encoding and decoding apparatuses for high quality multi-channel audio codec
US9208775B2 (en) 2013-02-21 2015-12-08 Qualcomm Incorporated Systems and methods for determining pitch pulse period signal boundaries
US9497560B2 (en) 2013-03-13 2016-11-15 Panasonic Intellectual Property Management Co., Ltd. Audio reproducing apparatus and method
USD843784S1 (en) * 2017-05-03 2019-03-26 Black + Blum Ltd. Sports bottle with strap
GB2566760B (en) * 2017-10-20 2019-10-23 Please Hold Uk Ltd Audio Signal
GB2566759B8 (en) 2017-10-20 2021-12-08 Please Hold Uk Ltd Encoding identifiers to produce audio identifiers from a plurality of audio bitstreams
JP7092047B2 (ja) * 2019-01-17 2022-06-28 日本電信電話株式会社 符号化復号方法、復号方法、これらの装置及びプログラム

Family Cites Families (70)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0079886B1 (en) 1981-05-29 1986-08-27 International Business Machines Corporation Aspirator for an ink jet printer
SG49883A1 (en) 1991-01-08 1998-06-15 Dolby Lab Licensing Corp Encoder/decoder for multidimensional sound fields
US6141446A (en) 1994-09-21 2000-10-31 Ricoh Company, Ltd. Compression and decompression system with reversible wavelets and lossy reconstruction
GB2295072B (en) 1994-11-08 1999-07-21 Solid State Logic Ltd Audio signal processing
US5838664A (en) 1997-07-17 1998-11-17 Videoserver, Inc. Video teleconferencing system with digital transcoding
US5956674A (en) 1995-12-01 1999-09-21 Digital Theater Systems, Inc. Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels
US6128597A (en) 1996-05-03 2000-10-03 Lsi Logic Corporation Audio decoder with a reconfigurable downmixing/windowing pipeline and method therefor
US5912976A (en) 1996-11-07 1999-06-15 Srs Labs, Inc. Multi-channel audio enhancement system for use in recording and playback and methods for providing same
US6131084A (en) 1997-03-14 2000-10-10 Digital Voice Systems, Inc. Dual subframe quantization of spectral magnitudes
AU740617C (en) 1997-06-18 2002-08-08 Clarity, L.L.C. Methods and apparatus for blind signal separation
US6026168A (en) 1997-11-14 2000-02-15 Microtek Lab, Inc. Methods and apparatus for automatically synchronizing and regulating volume in audio component systems
US6952677B1 (en) 1998-04-15 2005-10-04 Stmicroelectronics Asia Pacific Pte Limited Fast frame optimization in an audio encoder
US6122619A (en) 1998-06-17 2000-09-19 Lsi Logic Corporation Audio decoder with programmable downmixing of MPEG/AC-3 and method therefor
US7103187B1 (en) 1999-03-30 2006-09-05 Lsi Logic Corporation Audio calibration system
US6539357B1 (en) 1999-04-29 2003-03-25 Agere Systems Inc. Technique for parametric coding of a signal containing information
US6839438B1 (en) 1999-08-31 2005-01-04 Creative Technology, Ltd Positional audio rendering
WO2001066008A1 (en) 2000-03-03 2001-09-13 Cardiac M.R.I., Inc. Magnetic resonance specimen analysis apparatus
KR100809310B1 (ko) 2000-07-19 2008-03-04 코닌클리케 필립스 일렉트로닉스 엔.브이. 스테레오 서라운드 및/또는 오디오 센터 신호를 구동하기 위한 다중-채널 스테레오 컨버터
US7116787B2 (en) * 2001-05-04 2006-10-03 Agere Systems Inc. Perceptual synthesis of auditory scenes
US7583805B2 (en) 2004-02-12 2009-09-01 Agere Systems Inc. Late reverberation-based synthesis of auditory scenes
US7292901B2 (en) 2002-06-24 2007-11-06 Agere Systems Inc. Hybrid multi-channel/cue coding/decoding of audio signals
JP2003066994A (ja) 2001-08-27 2003-03-05 Canon Inc データ復号装置及びデータ復号方法、並びにプログラム、記憶媒体
US7032116B2 (en) 2001-12-21 2006-04-18 Intel Corporation Thermal management for computer systems running legacy or thermal management operating systems
CN1647156B (zh) 2002-04-22 2010-05-26 皇家飞利浦电子股份有限公司 参数编码方法、参数编码器、用于提供音频信号的设备、解码方法、解码器、用于提供解码后的多声道音频信号的设备
ES2323294T3 (es) 2002-04-22 2009-07-10 Koninklijke Philips Electronics N.V. Dispositivo de decodificacion con una unidad de decorrelacion.
JP4296753B2 (ja) * 2002-05-20 2009-07-15 ソニー株式会社 音響信号符号化方法及び装置、音響信号復号方法及び装置、並びにプログラム及び記録媒体
JP4013822B2 (ja) 2002-06-17 2007-11-28 ヤマハ株式会社 ミキサ装置およびミキサプログラム
DE60317203T2 (de) * 2002-07-12 2008-08-07 Koninklijke Philips Electronics N.V. Audio-kodierung
CN1669358A (zh) 2002-07-16 2005-09-14 皇家飞利浦电子股份有限公司 音频编码
US20060120534A1 (en) * 2002-10-15 2006-06-08 Jeong-Il Seo Method for generating and consuming 3d audio scene with extended spatiality of sound source
KR100542129B1 (ko) 2002-10-28 2006-01-11 한국전자통신연구원 객체기반 3차원 오디오 시스템 및 그 제어 방법
JP4084990B2 (ja) 2002-11-19 2008-04-30 株式会社ケンウッド エンコード装置、デコード装置、エンコード方法およびデコード方法
EP2665294A2 (en) 2003-03-04 2013-11-20 Core Wireless Licensing S.a.r.l. Support of a multichannel audio extension
DE10321986B4 (de) 2003-05-15 2005-07-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Pegel-Korrigieren in einem Wellenfeldsynthesesystem
JP4496379B2 (ja) 2003-09-17 2010-07-07 財団法人北九州産業学術推進機構 分割スペクトル系列の振幅頻度分布の形状に基づく目的音声の復元方法
US7447317B2 (en) * 2003-10-02 2008-11-04 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V Compatible multi-channel coding/decoding by weighting the downmix channel
US6937737B2 (en) 2003-10-27 2005-08-30 Britannia Investment Corporation Multi-channel audio surround sound from front located loudspeakers
TWI233091B (en) * 2003-11-18 2005-05-21 Ali Corp Audio mixing output device and method for dynamic range control
US7929708B2 (en) 2004-01-12 2011-04-19 Dts, Inc. Audio spatial environment engine
JP2005202248A (ja) 2004-01-16 2005-07-28 Fujitsu Ltd オーディオ符号化装置およびオーディオ符号化装置のフレーム領域割り当て回路
US7394903B2 (en) * 2004-01-20 2008-07-01 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Apparatus and method for constructing a multi-channel output signal or for generating a downmix signal
KR101079066B1 (ko) 2004-03-01 2011-11-02 돌비 레버러토리즈 라이쎈싱 코오포레이션 멀티채널 오디오 코딩
US7805313B2 (en) * 2004-03-04 2010-09-28 Agere Systems Inc. Frequency-based coding of channels in parametric multi-channel coding systems
US8843378B2 (en) 2004-06-30 2014-09-23 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Multi-channel synthesizer and method for generating a multi-channel output signal
KR100745688B1 (ko) 2004-07-09 2007-08-03 한국전자통신연구원 다채널 오디오 신호 부호화/복호화 방법 및 장치
KR100663729B1 (ko) 2004-07-09 2007-01-02 한국전자통신연구원 가상 음원 위치 정보를 이용한 멀티채널 오디오 신호부호화 및 복호화 방법 및 장치
ATE557552T1 (de) 2004-07-14 2012-05-15 Koninkl Philips Electronics Nv Verfahren, vorrichtung, kodierer, dekodierer und audiosystem
US8204261B2 (en) 2004-10-20 2012-06-19 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Diffuse sound shaping for BCC schemes and the like
SE0402650D0 (sv) 2004-11-02 2004-11-02 Coding Tech Ab Improved parametric stereo compatible coding of spatial audio
KR101215868B1 (ko) 2004-11-30 2012-12-31 에이저 시스템즈 엘엘시 오디오 채널들을 인코딩 및 디코딩하는 방법, 및 오디오 채널들을 인코딩 및 디코딩하는 장치
US7787631B2 (en) * 2004-11-30 2010-08-31 Agere Systems Inc. Parametric coding of spatial audio with cues based on transmitted channels
KR100682904B1 (ko) 2004-12-01 2007-02-15 삼성전자주식회사 공간 정보를 이용한 다채널 오디오 신호 처리 장치 및 방법
EP1691348A1 (en) 2005-02-14 2006-08-16 Ecole Polytechnique Federale De Lausanne Parametric joint-coding of audio sources
EP1693698A1 (en) 2005-02-16 2006-08-23 SONY DEUTSCHLAND GmbH A method for forming a polymer dispersed liquid crystal cell, a cell formed by such method and uses of such cell
US7573912B2 (en) * 2005-02-22 2009-08-11 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschunng E.V. Near-transparent or transparent multi-channel encoder/decoder scheme
US7983922B2 (en) * 2005-04-15 2011-07-19 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for generating multi-channel synthesizer control signal and apparatus and method for multi-channel synthesizing
KR100878371B1 (ko) * 2005-04-19 2009-01-15 돌비 스웨덴 에이비 공간적 오디오 파라미터들의 효율적인 부호화를 위한에너지 종속 양자화
KR101251426B1 (ko) 2005-06-03 2013-04-05 돌비 레버러토리즈 라이쎈싱 코오포레이션 디코딩 명령으로 오디오 신호를 인코딩하기 위한 장치 및방법
RU2414741C2 (ru) 2005-07-29 2011-03-20 ЭлДжи ЭЛЕКТРОНИКС ИНК. Способ создания многоканального сигнала
US20070083365A1 (en) 2005-10-06 2007-04-12 Dts, Inc. Neural network classifier for separating audio sources from a monophonic audio signal
EP1640972A1 (en) 2005-12-23 2006-03-29 Phonak AG System and method for separation of a users voice from ambient sound
US8027479B2 (en) * 2006-06-02 2011-09-27 Coding Technologies Ab Binaural multi-channel decoder in the context of non-energy conserving upmix rules
JP4399835B2 (ja) 2006-07-07 2010-01-20 日本ビクター株式会社 音声符号化方法及び音声復号化方法
PL2038878T3 (pl) 2006-07-07 2012-06-29 Fraunhofer Ges Forschung Urządzenie i sposób do łączenia wielu zakodowanych parametrycznie źródeł audio
KR101396140B1 (ko) 2006-09-18 2014-05-20 코닌클리케 필립스 엔.브이. 오디오 객체들의 인코딩과 디코딩
KR20090013178A (ko) * 2006-09-29 2009-02-04 엘지전자 주식회사 오브젝트 기반 오디오 신호를 인코딩 및 디코딩하는 방법 및 장치
AU2007312597B2 (en) 2006-10-16 2011-04-14 Dolby International Ab Apparatus and method for multi -channel parameter transformation
US8468280B2 (en) 2006-10-26 2013-06-18 D-Box Technologies Inc. Audio interface for controlling a motion platform
US20080269929A1 (en) * 2006-11-15 2008-10-30 Lg Electronics Inc. Method and an Apparatus for Decoding an Audio Signal
WO2008080111A1 (en) 2006-12-21 2008-07-03 Dow Global Technologies Inc. Polyolefin compositions and articles prepared therefrom, and methods for making the same

Also Published As

Publication number Publication date
EP2102855A1 (en) 2009-09-23
JP5735671B2 (ja) 2015-06-17
US8265941B2 (en) 2012-09-11
JP6010176B2 (ja) 2016-10-19
WO2008069584A2 (en) 2008-06-12
EP2102855A4 (en) 2010-07-28
KR101062353B1 (ko) 2011-09-05
JP2014090509A (ja) 2014-05-15
JP2015146641A (ja) 2015-08-13
JP5463143B2 (ja) 2014-04-09
US20110040567A1 (en) 2011-02-17
JP2010522345A (ja) 2010-07-01
KR20090087954A (ko) 2009-08-18

Similar Documents

Publication Publication Date Title
CN101536086B (zh) 用于解码音频信号的方法和装置
CN101632117A (zh) 用于解码音频信号的方法和装置
RU2460155C2 (ru) Кодирование и декодирование звуковых объектов
CN103299363B (zh) 用于处理音频信号的方法和装置
RU2407227C2 (ru) Концепция для объединения множества параметрически кодированных аудиоисточников
CN101553865B (zh) 用于处理音频信号的方法和装置
CN101542597B (zh) 用于编码和解码基于对象的音频信号的方法和装置
CN103021417B (zh) 用于可伸缩声道解码的方法和设备
CN101529504A (zh) 多通道参数转换的装置和方法
CN101506875B (zh) 用于组合多个参数编码的音频源的设备和方法
CN101361115A (zh) 解码信号的方法和装置
RU2417459C2 (ru) Способ и устройство для декодирования аудиосигнала

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C12 Rejection of a patent application after its publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20100120