CN103069481A - 音频信号合成器 - Google Patents

音频信号合成器 Download PDF

Info

Publication number
CN103069481A
CN103069481A CN2010800681703A CN201080068170A CN103069481A CN 103069481 A CN103069481 A CN 103069481A CN 2010800681703 A CN2010800681703 A CN 2010800681703A CN 201080068170 A CN201080068170 A CN 201080068170A CN 103069481 A CN103069481 A CN 103069481A
Authority
CN
China
Prior art keywords
signal
auxiliary
sound signal
correlated signals
compositor
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2010800681703A
Other languages
English (en)
Other versions
CN103069481B (zh
Inventor
富勒·克里斯托弗
维雷特·大卫
郎玥
许剑峰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Publication of CN103069481A publication Critical patent/CN103069481A/zh
Application granted granted Critical
Publication of CN103069481B publication Critical patent/CN103069481B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Stereophonic System (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

本发明涉及一个音频信号合成器,可从下混音频信号中合成多信道音频信号;音频信号合成器包含一个转换器(101),可将下混音频信号传输到频率域中以获得转换音频信号,转换音频信号表示下混音频信号频谱;一个信号生成器(103;201),可根据转换音频信号生成第一个辅助信号、第二个辅助信号和第三个辅助信号;一个解相关器(105),可从第三个辅助信号生成第一个解相关信号和第二个解相关信号,第一个解相关信号和第二个解相关信号至少部分解相关;以及一个组合器(107),可将第一个辅助信号与第一个解相关信号相结合以获得第一个音频信号,将第二个辅助信号与第二个解相关信号相结合以获得第二个音频信号;第一个音频信号和第二个音频信号形成多信道音频信号。

Description

音频信号合成器
技术领域
本发明涉及音频编码。
背景技术
根据C.Faller和F.Baumgarte在IEEE基于对音频和声学的信号处理应用的应用研讨会议(2001年10月,第199-202页)报告“使用感知参数化空间音频的高效表达”中描述的,参数立体声或多声道音频编码使用空间索引将通常下混的单音或立体声音频信号合成为有更多信道的信号。通常情况下,下混音频信号是由于多信道音频信号(例如,立体声音频信号)的多个音频信道信号叠加而成。这些较少的信道被波形编码和与原始信号信道关系有关的边信息,例如,空间索引,被添加到编码音频信道。基于解码的波形编码音频信道,解码器可使用这种边信息重新生成原始数量的音频信道。
基本参数立体声编码器可使用信道间水平差异(ILD)作为从单声道的下混音频信号中生成立体声信号所必需的索引。很多复杂的编码器还可使用信道间相关性(ICC),这种相关性可表示音频信道信号(即音频信道)之间的的相似程度。此外,当对双耳立体声信号,如3D音频或基于环绕渲染的耳机,进行编码时,信道间相位差(IPD)还可以产生重新生成信道间的相位/延迟差异的作用。
ICC索引的合成可以与大多数的音频和音乐内容相关联:重新生成氛围、立体声混响、源宽度和与空间感相关的其他感受,如J.Blauert在“空间聆听”中所述:《人声定位的心理物理学》(麻省理工学院出版社,美国马萨诸塞州剑桥,1997年)。相关性合成可以使用频率域中的解相关器来实施,如E.Schuijers、W.Oomen、B.den Brinker和J.Breebaart在“高品质音频在参数编码中的进展”(114th Conv.Aud.Eng.Soc.预印本,2003年3月)中所述。但是,用于合成多信道音频信号的已知合成方法可能会增加的复杂性。
发明内容
本发明实现的目标是为在下混音频信号中合成多信道音频信号提供有效方法。
本发明基于下列发现:多信道音频信号可以根据下混音频信号的至少三个信号副本从下混音频信号中有效合成。下混音频信号可以包括如多信道音频信号(如立体声音频信号)的左音频信道信号和右音频信道信号的总和。因此,第一个副本可以表示第一个音频信道,第二个副本可以表示散射声,第三个副本可以表示第二个音频信道。为了合成,如生成多信道音频信号,第二个副本可以用于生成两个解相关信号,该信号可分别与单个的音频信道相结合,从而合成多信道音频信号。为了获得解相关信号,第二个副本可以在频率域中进行预先存储或特定延迟。但是,解相关信号可以直接在时间域中获得。在这两种情况下,可实现复杂度较低的安排。
根据第一个实现形式,本发明涉及一个音频信号合成器,可从下混音频信号中合成多信道音频信号;音频信号合成器包括一个转换器,可将下混音频信号转换到频率域中以获得转换音频信号,转换音频信号表示下混音频信号频谱;一个信号生成器,可根据转换音频信号生成第一个辅助信号、第二个辅助信号和第三个辅助信号;一个解相关器,可从第三个辅助信号生成第一个解相关信号和第二个解相关信号,第一个解相关信号和第二个解相关信号至少部分解相关;一个组合器,将第一个辅助信号与第一个解相关信号相结合以获得第一个音频信号,将第二个辅助信号与第二个解相关信号相结合以获得第二个音频信号;第一个音频信号和第二个音频信号会形成多信道音频信号。转换器可以为傅立叶转换器或可提供下混音频信号的短时间谱表示的滤波器组。就此而言,如果这些信号之间互相关的第一个互相关值小于互关联的另一个互相关值,那么解相关信号可以看做是解相关。
依据第一个方面的实现形式,转换器包括一个傅立叶转换器或一个滤波器,可将下混音频信号转换到频率域。傅立叶转换器可以是快速傅立叶转换器。
依据第一方面的实现形式,转换的音频信号会占据频带,在频带中,第一个辅助信号、第二个辅助信号以及第三个辅助信号会共享频带的子频带。相对应地,还可处理其他频带的子带。
依据第一方面的实现形式,信号生成器包括一个信号复制器,可提供转音频信号的信号副本,第一个乘法器用于将第一个信号副本乘以第一个权重因子,从而获得第一个加权信号;第二个乘法器用于将第二个信号副本乘以第二个权重因子,从而获得第二个加权信号;第三个乘法器用于将第三个信号副本乘以第三个权重因子,从而获得第三个加权信号;其中,信号生成器可依据加权信号生成辅助信号。权重因子可用于调整或衡量各信号副本到各第一个音频信道、第二个音频信道和散射声的功率。
依据第一方面的实现形式,音频信号合成器包括一个转换器,用于将第一个加权信号转换到时间域,从而获得第一个辅助信号;将第二个加权信号转换到时间域,从而获得,第二个辅助信号;将第三个加权信号转换到时间域,从而获得第三个辅助信号。转换器还可以是一个反向的傅立叶转换器。
依据第一方面的实现形式,第一个权重因子取决于多信道音频信号的右音频信号功率,而第二个权重因子取决于多信道音频信号的左音频信道功率。因此,这两个音频信道的功率可单独进行调整。
依据第一方面的实现形式,解相关器包括一个第一存储,用于存储频率域中第三个辅助信号的第一个副本,从而获得第一个解相关信号,第二个存储用于存储频率域中第三个辅助信号的第二个副本,从而获得第二个解相关信号。为了获得解相关信号,可将第一个存储和第二个存储配置为存储不同时间段的副本信号。
依据第一方面的实现形式,解相关器包括一个第一延迟元件,可延迟第三个辅助信号的第一个副本,从而获得第一个解相关信号,第二个延迟元件可延迟第三个辅助信号的第二个副本,从而获得第二个解相关信号。延迟元件可安排在时间域中或者频率域中。
依据第一方面的实现形式,解相关器包括一个第一全通滤波器,可过滤第三个辅助信号的第一个副本,从而获得第一个解相关信号,第二个全通过滤器可过滤第三个辅助信号的第二个副本,从而获得第二个解相关信号。每个全通过滤器都可根据示例方式通过一个全通网络来形成。
依据第一方面的实现形式,解相关器包括一个第一反射器,可反射第三个辅助信号的第一个副本,从而获得第一个解相关信号,第二反射器可反射第三个辅助信号的第二个副本,从而获得第二个解相关信号。
依据第一方面的实现形式,组合器用于将第一个辅助信号和第一个解相关信号相加,从而获得第一个音频信号;将第二个辅助信号和第二个解相关信号相加,从而获得第二个音频信号。因此,组合器可包括一个用于相加各个信号的加法器。
依据第一方面的实现形式,音频信号合成器还包括一个转换器,可将第一个音频信号和第二个音频信号转换到时间域。转换器还可以是一个反向的傅立叶转换器。
依据第一方面的实现形式,第一个音频信号表示多信道音频信号的左信道,第二个音频信号表示多信道音频信号的右音频信道,而解相关信号表示散射声信号。散射音频信号可表示散射声。
依据第一方面的实现形式,音频信号合成器还包括一个能量检测器,可检测第一个解相关信号的能量和第二个解相关信号的能量;一个第一能量归一化器,可使第一个解相关信号的能量归一化化;以及第二能量归一化器,可使第二个解相关信号的能量归一化。
依据第二方面,本发明涉及用于从下混音频信号合成(如生成)多信道音频信号(如立体声音频信号)的方法;该方法包括将下混音频信号转换到频率域,从而获得转换信号,这种转换音频信号表示下混音频信号的频谱;依据此转换音频信号生成第一个辅助信号、第二个辅助信号和第三个辅助信号;根据第三个辅助信号生成第一个解相关信号,根据第三个辅助信号生成第二个解相关信号,第一个解相关信号和第二个解相关信号至少部解相关;根据第一个解相关信号合成第一个辅助信号,从而获得第一个音频信号;根据第二个解相关信号合成第二个辅助信号,从而获得第二个音频信号,然后,第一个音频信号和第二个音频信号会形成多信道音频信号。
依据部分实施例,从下混信号中生成多信道音频信号的方法可以包括以下步骤:接收下混信号,将输入下混音频信号转换到多个频带中,在子频带域中应用这些因子以生成表示目标多信道信号的相关和不相关信号的子频带信号,将生成的子频带信号转换到时间域中,解相关表示不相关信号的生成的时间域信号,以及将表示相关信号的时间域信号与解相关信号相结合。
依据第四方面,本发明涉及一项计算机程序,可在计算机上运行时执行合成多信道音频信号的方法。
附图说明
本发明的其他实施例还描述了以下图片,包括:
图1依据实施例显示音频信号合成器的框图;
图2依据实施例显示了音频信号合成器;以及
图3依据实施例显示了音频信号合成器。
具体实施方式
图1显示了音频信号合成器的框图,该合成器包含一个转换器101,可将下混音频信号x(n)转换到频率域中,从而获得转换的音频信号X(k,i),转换的音频信号表示下混音频信号的频谱。音频信号合成器还包含一个信号生成器103,可依据转换音频信号生成第一个辅助信号y1(n),第二个辅助信号y2(n)和第三个辅助信号d(n)。音频信号合成器还包含一个解相关器105,可从第三个辅助信号d(n)中生成第一个解相关信号和第二个解相关信号。音频信号合成器还包含一个组合器107,可将第一个辅助信号与第一个解相关信号相结合,从而获得第一个音频信号z1(n),将第二个辅助信号与第二个解相关信号相结合,从而获得第二个音频信号;第一个音频信号和第二个音频信号会相应地形成立体声音频信号的左音频信道和右音频信道。
转换器101可以为傅立叶转换器或任何滤波器组(FB),可进行配置以提供下混信号的短时间频谱。通过示例方式,依据所记录的立体声信号的左信道和右信道的结合,可以生成下混信号。
信号生成器103可以包含一个信号复制器109,可提供转换音频信号的三个副本。对于每个副本,音频信号合成器还可以含有一个乘法器。因此,信号生成器103可以包含一个第一乘法器111,将第一个副本乘以第一个权重因子w1;第二个乘法器113,可将第二个副本乘以第二个权重因子w3以及第三个乘法器115,可将第三个副本乘以第三个权重因子w2
依据部分实施例,相乘的副本会形成加权信号Y1(k,i)、D(k,i)和Y2(k,i),分别提供给反向转换器117、119和121。反向转换器117、119和121可以通过反向滤波器组(IFB)或反向傅立叶转换器来形成。在反向转换器117、119和121的输出上,可提供第一个、第二个和第三个辅助信号。特别是反向转向器119输出上的第三个辅助信号,可提供给含有第一个解相关元件D1和第二个解相关元件D2的解相关器105。解相关元件D1和D2可通过延迟元件、反射元件或全通过滤器来形成。举例来说,解相关元件可以延迟彼此之间的第三个辅助信号的副本,以便完成解相关。各解相关信号可提供给组合器107,该组合器可能包含一个第一加法器123,将第一解相关信号与第一个辅助信号相加,从而获得第一个音频信号,还包含一个第二加法器125,将第二个解相关信号和第二个辅助信号相加,从而获得第二个辅助信号。
如图1所述,解相关可在时间域中执行。相对应地,解相关信号和各辅助信号可在时间域中叠加。但是,解相关和叠加还可以在频率域中执行,如图2所述。
图2显示了具有不同于图1中显示的音频信号合成器结构的音频信号合成器。特别是,图2中的音频信号合成器包含一个可在频率域中操作的信号生成器201。特别是,信号生成器201包含一个可安排在频率域中的解相关器105,可使用解相关元件D1和D2使第二乘法器113的输出解相关。在图2显示的实施例中,乘法器111、113和115的输出信号会根据部分实施例分别形成第一个、第二个和第三个辅助信号。解相关元件D1和D2可通过延迟元件或存储(分别存储预先限定且不同时间段的频率域中第三个辅助信号的副本)来形成。解相关元件D1和D2的输出分别提供给组合器107与安排在频率域中的加法器123和125。加法器123和125的输出分别提供给反向转换器203和205,这可通过反向傅立叶转换器或反向滤波器组来实施,从而分别提供时间域信号z1(n)和z2(n)。
参考图1和图2,下混音频信号可以是表示为x(n)的时间信号,其中,n是离散时间指数。此信号的对应时间频率表示为X(k,i),其中k为下采样时间指数,i为参数频带指数。在不失一般性的情况下,可考虑使用信道间水平差异(ICLD)和信道间相关性(ICC)合成示例。如图1中所示,单音下混音频信号x(n)可用滤波器组(FB)或转换器换转为短时间频谱表示。例如,一个参数立体声参数带的处理如图1和图2中的详细描述。所有其他频带也可进行类似处理。表示权重因子的比例因子w1、w2和w3可应用于下混信号X(k,i)的时频表示,产生左相关声Y1(k,i)作为第一个辅助信号的实施例,产生右相关声Y2(k,i)作为第二个辅助信号的实施例,产生左右不相关声D(k,i)作为第三个辅助信号的实施例。
这三个信号Y1(k,i)、Y2(k,i)和D(k,i)所生成的时频表示可通过反向滤波器组(IFB)或反向转换器转换回时间域。举例来说,两个独立的解相关器D1和D2可应用于d(n),以生成两个至少部分独立的信号,d(n)可与y1(n)和y2(n)相加以生成最终的立体声输出左信号和右信号,即第一个音频信号和第二个音频信号:z1(n)和z2(n)。
关于权重因子的生成或计算,如果下混信号的振幅为
Figure BDA00002758331100071
L表示左信道的振幅,R表示右信道的振幅,然后在解码器中,左右信道的相关功率可依据以下公式获得(基于ICLD):
P 1 ( k , i ) = 1 1 + 10 ICLD 10
P 2 ( k , i ) = 10 ICLD 10 1 + 10 ICLD 10
在下文应该注意的是,为了符号的简洁性,指数k和i经常被忽略。
如果给定ICC(相关性),可根据以下公式计算出左右信道中的漫声量PD(k,i):
P D = P 1 + P 2 - ( P 1 + P 2 ) 2 - 4 ( 1 - ICC 2 ) P 1 P 2 2
在进一步使用之前,PD下界可以为0,上界可以为P1和P2的最小值。
计算权重因子,以便得到三个信号Y1、Y2和D,可具有等于P1、P2和PD的功率,即
w 1 = P 1 - P D g 2 P
w 2 = P 2 - P D g 2 P
w 3 = P D g 2 P
其中,下混音频信号的功率为P=1,因为P1、P2和PD可以归一化,因子g与用于下混输入信号的归一化相关。在通常情况下,如果下混信号可用和乘以0.5计算,那么g可以选为0.5。
如果下混信号的振幅为
Figure BDA00002758331100091
那么可以进行部分修改。对于c1和c2,可使用下列公式将CLD应用到解码器一侧的下混信号:
c = 10 CLD 20 = | L | | R |
c 1 = 2 c 1 + c = 2 | L | | L | + | R |
c 2 = 2 1 + c = 2 | R | | L | + | R |
c1和c2的定义可恢复左右信道的正确振幅。
P1和P2可根据先前的定义进行定义,如
P 1 ( k , i ) = 1 1 + 10 CLD 10 并且
P 2 ( k , i ) = 10 ICLD 10 1 + 10 ICLD 10
推导出:
P 1 ( k , i ) = | R | 2 | L | 2 + | R | 2
并且
P 2 ( k , i ) = | L | 2 | L | 2 + | R | 2
如上所述,PD可根据上述P1和P2进行定义。
我们可以考虑一种情况,如果ICC=1,并且下混信号的振幅可假设为
Figure BDA00002758331100102
那么可使用P1、P2和PD的定义,并应用于下混信号中,从而
| R ^ | = w 1 | M | = P 1 g 2 | M |
| R ^ | = 2 | R | 2 | L | 2 + | R | 2 | M | = 2 | R | 2 | L | 2 + | R | 2 | L | + | R | 2 = | R | ( | L | + | R | ) 2 | L | 2 + | R | 2
要取消下混计算与P1和P2因子上假设之间错误匹配的影响,上述公式可进行部分修改。
假设
c = 10 CLD 20 = | L | | R |
并且
d = 10 CLD 10 = | L | 2 | R | 2
得出
1 1 + d = | R | 2 | L | 2 + | R | 2
1 ( 1 + c ) 2 = | R | 2 ( | L | + | R | ) 2
同时
factor = 1 + d ( 1 + c ) 2 = | L | 2 + | R | 2 ( | L | + | R | ) 2
如果下混信号定义为
Figure BDA00002758331100113
那么w1、w2和w3可依据下列公式保持左右信道的能量:
w 1 = 2 ( P 1 - P d ) * factor
w 2 = 2 ( P 2 - P d ) * factor
w 3 = 2 P d * factor
如果ICC=1,w1、w2和w3的定义就可准确获得与权重因子c1和c2一样的结果。
下面描述了另一种可选的修改方法:
在基于CLD(信道差异级别)的立体声编码器中,左右信道分别有两个增益。这两个增益可进行翻倍以解码单音信号,从而生成重建的左右信道。
因此,这两个增益可根据下列方程式进行计算:
c = 10 CLD 20
c 1 = 2 c 1 + c
c 2 = 2 1 + c
这些增益因子可用于计算:
P 1 = c 1 2
P 2 = c 2 2
P=P1+P2
如上所述,这些P1、P2和P可以进一步用于计算w1、w2和w3。
因子w1、w2和w3可通过
Figure BDA00002758331100124
划分比例,然后分别应用到左信号、右信号和漫反射信号。
可替换的,与计算信号Y1、Y2和D相比,要分别求得P1、P2和PD的功率,可将维纳滤波器以最小均方的方式应用到近似于真正的信号Y1、Y2和D中。在这种情况下,维纳滤波器的系数为:
w 1 = P 1 - P D g 2 P
w 2 = P 2 - P D g 2 P
w 3 = P D g 2 P
关于解相关器,由于如何计算比例因子w1、w2和w3的方式,时间域中的散射信号在解相关d(n)之前就已经具有散射声所需的短时间功率频普。因此,我们的目的就是要使用解相关器从d(n)中生成两个信号d1(n)和d2(n),而无需更不必要更改信号功率和短时间功率频谱。
基于此目的,可能要使用两个具有统一L2规范的正交滤波器D1和D2。或者,一般情况下可能需要使用一个正交全通滤波器或反射器。例如,适用于解相关的两个正交有限脉冲响应(FIR)滤波器为:
D1(n)=w(n)n1(n)
D2(n)=w(n)n2(n)
其中,n1(n)为随机变量,如当指数为0≤n≤M或者等于零时的高斯白噪声。n2(n)类似定义为随机变量,与n1(n)无关。例如,窗口w(n)可以选择具有振幅的汉斯窗口,可满足一个具有滤波器D1(n)和D2(n)的L2规范。
图3显示了一个具有结构类似于图2中显示的音频信号合成器的音频信号合成器。滤波器组101提供的第一个辅助信号会提供给乘法器111,滤波器组101提供的第二个第二个辅助信号会提供给乘法器115,第三个辅助信号的第一个副本会提供给能量检测器301,可在延迟元件D1和D2之后检测辅助信号D(k,i)的能量。能量检测器301的输出会提供给乘法器303,可将能量检测器301的输出乘于因子w3,并将乘积值提供给乘法器123。
第三个辅助信号的第二个副本会提供给第一个延迟元件D1,其输出会提供给第一个能量归一化器305,可使第一个延迟元件D1的能量E(D1))输出归一化。第一个能量归一化器305的输出会通过乘法器307乘以乘法器303的输出,所得到的输出会提供给加法器123。
第三个辅助信号的第三个副本会提供给第二个延迟元件D2,其输出会提供给第二个能量归一化器309,可使第二个延迟元件D2的能量E(D2))输出归一化。第二个能量归一化器309的输出会通过乘法器311乘以乘法器303的输出,所得到的输出会提供给加法器125。
在图3中,描述了要应用权重函数w1、w2和w3算法的另一种解决方案。为了保持左右信道的初始能量,可定义权重函数w1、w2和w3。根据本实施例,w3可以在能量归一化化后应用在延迟信号上。在图2显示的上一个实施例中,w3可以直接应用到下混信号中。然后,延迟版本就可以使用延迟元件D1和D2来创建立体声信号的解相关部分。由于延迟元件D1和D2,添加到Y1(k,i)和Y2(k,i)的解相关部分可乘以在上一个帧中所得到的w3计算。
在图3中,第一步可计算延迟D(k,i)之后的信号E(D(k,i))能量。在第二步中,可使用计算出的能量E(D1)和E(D2)使延迟元件的输出归一化。在第三步中,归一化的D1和D2信号可乘于w3。在第四步中,能量调整后的D1和D2可在加法器12和125上添加到信号Y1(k,i)和Y2(k,i)中。
执行解相关的一个低复杂度的方式就是对D1和D2使用不同的延迟。这种方法可以利用表示解相关声d(n)的信号含有小瞬变的这一事实。举例来说,D1和D2的延迟时间可以使用10毫秒和20毫秒。

Claims (16)

1.音频信号合成器,可从下混音频信号合成多信道音频信号,其包括:
一个转换器(101),可将下混音频信号转换到频率域中,以获取转换的音频信号,转换的音频信号表示下混音频信号的频谱;
一个信号生成器(103;201),可根据转换的音频信号生成第一个辅助信号、第二个辅助信号和第三个辅助信号;
一个解相关器(105),可从第三个辅助信号中生成第一个解相关信号和第二个解相关信号,第一个解相关信号和第二个解相关信号至少部分解相关;以及
一个组合器(107),可将第一个辅助信号与第一个解相关信号相结合,以获取第一个音频信号,将第二个辅助信号与第二个解相关信号相结合,以获取第二个音频信号,第一个音频信号和第二个音频信号形成多信道音频信号。
2.如权利要求1所述的音频信号合成器,其中,转换器(101)包括一个傅立叶转换器或滤波器,可将下混音频信号转换到频率域中。
3.如权利要求1或2所述的音频信号合成器,其中,转换的音频信号占据一个频带,其中,第一个辅助信号、第二个辅助信号和第三个辅助信号会共享频带的同一频率子带。
4.如先前的任何一个权利要求所述的音频信号合成器,其中,信号生成器(103;201)包括一个信号复制器(109),可提供转音频信号的信号副本,第一个乘法器(111)用于将第一个信号副本乘以第一个权重因子,从而获得第一个加权信号;第二个乘法器(113)用于将第二个信号副本乘以第二个权重因子,从而获得第二个加权信号;第三个乘法器(115)用于将第三个信号副本乘以第三个权重因子,从而获得第三个加权信号;其中,信号生成器(103;201)可配置为依据加权信号生成辅助信号。
5.如权利要求5所述的音频信号合成器,其中,音频信号合成器(103)包括一个转换器(117,119,121),用于将第一个加权信号转换到时间域,从而获得第一个辅助信号,将第二个加权信号转换到时间域,从而获得,第二个辅助信号,将第三个加权信号转换到时间域,从而获得第三个辅助信号。
6.如权利要求5所述的音频信号合成器,其中,第一个权重因子取决于多信道音频信号的第一个音频信道功率,第二个权重因子取决于多信道音频信号的第二个音频信道功率。
7.如先前的任何一个权利要求所述的音频信号合成器,其中,解相关器(105)包括一个第一存储,用于存储频率域中第三个辅助信号的第一个副本,从而获得第一个解相关信号,第二个存储用于存储频率域中第三个辅助信号的第二个副本,从而获得第二个解相关信号。
8.如先前的任何一个权利要求所述的音频信号合成器,其中,解相关器(105)包括一个第一延迟元件(D1),用于延迟第三个辅助信号的第一个副本,从而获得第一个解相关信号,第二个延迟元件(D2)用于延迟第三个辅助信号的第二个副本,从而获得第二个解相关信号。
9.如先前的任何一个权利要求所述的音频信号合成器,其中,解相关器(105)包括一个第一全通滤波器,用于过滤第三个辅助信号的第一个副本,从而获得第一个解相关信号,第二个全通滤波器用于过滤第三个辅助信号的第二个副本,从而获得第二个解相关信号。
10.如先前的任何一个权利要求所述的音频信号合成器,其中,解相关器(105)包括一个第一反射器,用于反射第三个辅助信号的第一个副本,从而获得第一个解相关信号,第二个反射器用于反射频率域中第三个辅助信号的第二个副本,从而获得第二个解相关信号。
11.如先前的任何一个权利要求所述的音频信号合成器,其中,组合器(107)用于将第一个辅助信号和第一个解相关信号相加,从而获得第一个音频信号;将第二个辅助信号和第二个解相关信号相加,以获得第二个音频信号。
12.如先前的任何一个权利要求所述的音频信号合成器,其中,信号生成器(201)包括一个转换器(203,205),用于将第一个音频信号和第二个音频信号转换到时间域中。
13.如先前的任何一个权利要求所述的音频信号合成器,其中,第一个音频信号表示多信道音频信号,特别是立体声音频信号,的左信道,第二个音频信号表示多信道音频信号的右信道,而解相关信号表示散射音频信号。
14.如先前的任何一个权利要求所述的音频信号合成器,还包括一个能量检测器(301),可检测第一个解相关信号和第二个解相关信号的能量;第一个能量归一化器(305),可使第一个解相关信号的能量归一化;以及第二个能量归一化器(309),可使第二个解相关信号的能量归一化化。
15.用于从下混音频信号中合成多信道音频信号的方法,该方法包括:
将下混音频信号转换到频率域中,从而获得转换的音频信号,转换的音频信号表示下混音频信号的频谱;
根据转换的音频信号生成第一个辅助信号、第二个辅助信号和第三个辅助信号;
根据第三个辅助信号中生成第一个解相关信号、根据第三个解相关信号中生成第二个解相关信号,第一个解相关信号和第二个解相关信号至少部分解相关;以及
将第一个辅助信号与第一个解相关信号相结合,以获得第一个音频信号;将第二个辅助信号与第二个解相关信号想结合,以获得第二个音频信号,第一个音频信号与第二个音频信号形成多信道音频信号。
16.一种计算机程序,当在计算机上运行时,执行权利要求15中的方法。
CN201080068170.3A 2010-07-20 2010-07-20 音频信号合成器 Active CN103069481B (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/CN2010/075308 WO2012009851A1 (en) 2010-07-20 2010-07-20 Audio signal synthesizer

Publications (2)

Publication Number Publication Date
CN103069481A true CN103069481A (zh) 2013-04-24
CN103069481B CN103069481B (zh) 2014-11-05

Family

ID=45496443

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201080068170.3A Active CN103069481B (zh) 2010-07-20 2010-07-20 音频信号合成器

Country Status (5)

Country Link
US (1) US9082396B2 (zh)
EP (1) EP2586025A4 (zh)
JP (1) JP5753899B2 (zh)
CN (1) CN103069481B (zh)
WO (1) WO2012009851A1 (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104064191A (zh) * 2014-06-10 2014-09-24 百度在线网络技术(北京)有限公司 混音方法及装置
CN106796792A (zh) * 2014-07-30 2017-05-31 弗劳恩霍夫应用研究促进协会 用于增强音频信号的装置和方法、声音增强***
CN107948704A (zh) * 2017-12-29 2018-04-20 北京安云世纪科技有限公司 用于对音频数据进行动态合成的方法、***以及移动终端
CN110719564A (zh) * 2018-07-13 2020-01-21 青岛海信电器股份有限公司 音效处理方法和装置

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2830333A1 (en) * 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Multi-channel decorrelator, multi-channel audio decoder, multi-channel audio encoder, methods and computer program using a premix of decorrelator input signals
MX361115B (es) * 2013-07-22 2018-11-28 Fraunhofer Ges Forschung Descodificador de audio multicanal, codificador de audio multicanal, métodos, programa de computadora y representación de audio codificada usando una decorrelación de señales de audio renderizadas.
KR102047276B1 (ko) * 2018-07-25 2019-11-21 주식회사 이엠텍 음향 제공 장치
CN115993503B (zh) * 2023-03-22 2023-06-06 广东电网有限责任公司东莞供电局 一种变压器的运行检测方法、装置、设备及存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1781338A (zh) * 2003-04-30 2006-05-31 编码技术股份公司 基于复指数调制的滤波器组的高级处理和自适应时间信号传送方法
US20080118073A1 (en) * 2006-11-16 2008-05-22 Ryo Tsutsui Band-Selectable Stereo Synthesizer Using Strictly Complementary Filter Pair
CN101425292A (zh) * 2007-11-02 2009-05-06 华为技术有限公司 一种音频信号的解码方法及装置

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
SE0400998D0 (sv) * 2004-04-16 2004-04-16 Cooding Technologies Sweden Ab Method for representing multi-channel audio signals
US7391870B2 (en) * 2004-07-09 2008-06-24 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E V Apparatus and method for generating a multi-channel output signal
SE0402652D0 (sv) * 2004-11-02 2004-11-02 Coding Tech Ab Methods for improved performance of prediction based multi- channel reconstruction
EP1829424B1 (en) * 2005-04-15 2009-01-21 Dolby Sweden AB Temporal envelope shaping of decorrelated signals
EP1921605B1 (en) 2005-09-01 2014-03-12 Panasonic Corporation Multi-channel acoustic signal processing device
CN101278598B (zh) 2005-10-07 2011-05-25 松下电器产业株式会社 音频信号处理装置以及音频信号处理方法
KR101111520B1 (ko) 2006-12-07 2012-05-24 엘지전자 주식회사 오디오 처리 방법 및 장치
JP5608660B2 (ja) * 2008-10-10 2014-10-15 テレフオンアクチーボラゲット エル エム エリクソン(パブル) エネルギ保存型マルチチャネルオーディオ符号化

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1781338A (zh) * 2003-04-30 2006-05-31 编码技术股份公司 基于复指数调制的滤波器组的高级处理和自适应时间信号传送方法
US20080118073A1 (en) * 2006-11-16 2008-05-22 Ryo Tsutsui Band-Selectable Stereo Synthesizer Using Strictly Complementary Filter Pair
CN101425292A (zh) * 2007-11-02 2009-05-06 华为技术有限公司 一种音频信号的解码方法及装置

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104064191A (zh) * 2014-06-10 2014-09-24 百度在线网络技术(北京)有限公司 混音方法及装置
CN104064191B (zh) * 2014-06-10 2017-12-15 北京音之邦文化科技有限公司 混音方法及装置
CN106796792A (zh) * 2014-07-30 2017-05-31 弗劳恩霍夫应用研究促进协会 用于增强音频信号的装置和方法、声音增强***
CN107948704A (zh) * 2017-12-29 2018-04-20 北京安云世纪科技有限公司 用于对音频数据进行动态合成的方法、***以及移动终端
CN107948704B (zh) * 2017-12-29 2020-06-23 北京安云世纪科技有限公司 用于对音频数据进行动态合成的方法、***以及移动终端
CN110719564A (zh) * 2018-07-13 2020-01-21 青岛海信电器股份有限公司 音效处理方法和装置
CN110719564B (zh) * 2018-07-13 2021-06-08 海信视像科技股份有限公司 音效处理方法和装置

Also Published As

Publication number Publication date
EP2586025A1 (en) 2013-05-01
US20130129096A1 (en) 2013-05-23
WO2012009851A1 (en) 2012-01-26
JP2013536461A (ja) 2013-09-19
EP2586025A4 (en) 2015-03-11
CN103069481B (zh) 2014-11-05
JP5753899B2 (ja) 2015-07-22
US9082396B2 (en) 2015-07-14

Similar Documents

Publication Publication Date Title
CN103069481B (zh) 音频信号合成器
US11910182B2 (en) Method for processing an audio signal, signal processing unit, binaural renderer, audio encoder and audio decoder
CN102892070B (zh) 多声道下混对象编码的增强编码和参数表示
KR101633441B1 (ko) 공간적 오디오 처리에서 역상관기의 이용 및 최적 믹싱 행렬들
US8515759B2 (en) Apparatus and method for synthesizing an output signal
EP3025336B1 (en) Reduction of comb filter artifacts in multi-channel downmix with adaptive phase alignment
CN101406074B (zh) 解码器及相应方法、双耳解码器、包括该解码器的接收机或音频播放器及相应方法
CN102084418B (zh) 用于调整多通道音频信号的空间线索信息的设备和方法
JP5193070B2 (ja) 主成分分析に基づくマルチチャネルオーディオ信号の段階的な符号化のための装置および方法
EP2633520B1 (en) Parametric encoder for encoding a multi-channel audio signal
CN101410889A (zh) 对作为听觉事件的函数的空间音频编码参数进行控制
CN103348703A (zh) 用以利用预先算出的参考曲线来分解输入信号的装置和方法
CN102209988A (zh) 基于麦克风信号来提供空间提示集合的设备、方法和计算机程序以及用于提供双声道音频信号和空间提示集合的设备
CN101361117B (zh) 处理媒体信号的方法和装置
CN102986254B (zh) 音频信号产生装置
RU2661310C2 (ru) Концепция генерирования сигнала понижающего микширования
RU2485605C2 (ru) Усовершенствованный метод кодирования и параметрического представления кодирования многоканального объекта после понижающего микширования

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant