CN101669167A

CN101669167A - 用于在多声道音频格式之间进行转换的方法和设备

Info

Publication number: CN101669167A
Application number: CN200880009025A
Authority: CN
Inventors: V·普尔基; J·赫尔
Original assignee: Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Current assignee: Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Priority date: 2007-03-21
Filing date: 2008-02-01
Publication date: 2010-03-10
Also published as: KR101195980B1; US8290167B2; KR20090117897A; JP4993227B2; BRPI0808217B1; RU2449385C2; TW200845801A; RU2009134474A; TWI369909B; WO2008113428A1; US20080232616A1; JP2010521910A; BRPI0808217A2; EP2130204A1

Abstract

将空间音频信号的输入多声道表示转换为不同的输出多声道表示，其中导出空间音频信号的中间表示，所述中间表示具有指示空间音频信号的部分的源点方向的方向参数；以及使用空间音频信号的中间表示来产生空间音频信号的输出多声道表示。

Description

用于在多声道音频格式之间进行转换的方法和设备

技术领域

本发明涉及一种关于如何以最大可能的质量在不同的多声道音频格式之间进行转换的技术，而不限于特定的多声道表示。即本发明涉及一种允许在任意多声道格式之间进行转换的技术。

背景技术

通常，在多声道再现和收听中，收听者被多个扬声器环绕。存在捕获针对特定设置(set-up)的音频信号的各种方法。再现时的一个通常目标是再现原始记录的声音事件的空间合成，即各个音频源的源点(origin)，如管弦乐队内喇叭的位置。多个扬声器设置是相当常见的，并且可以产生不同的空间感。不使用特殊的后生产技术，通常已知的两声道立体声设置可以仅在两个扬声器之间的线上重建听觉事件。这主要通过所谓的“振幅-移动(panning)”来实现，其中取决于音频源相对于扬声器的位置，与一个音频源相关的信号的振幅分布在两个扬声器之间。这通常在记录或后续的混音期间进行。即来自相对于收听位置较远左侧的音频源将主要通过左扬声器再现，而在收听位置前面的音频源将通过这两个扬声器以相同的振幅(电平)再现。然而，不能再现从其他方向发出的声音。

因此，通过使用分布在收听者周围的更多扬声器，可以覆盖更多方向，并且可以产生更加自然的空间感。可能最公知的多声道扬声器布局是5.1标准(ITU-R775-1)，其包括5个扬声器，将这些扬声器相对于收听位置的方位角预先确定为0°、±30°和±110°。这表示在记录或混音期间，将信号调整为特定扬声器配置，而且根据该标准的再现设置的偏差将导致再现质量降低。

也提出了具有位于不同方向上的不同数目的扬声器的多个其他***。专业和专用***(尤其在影院和声音装置中)也包括不同高度的扬声器。

近年来提出了被称为DirAC的通用音频再现***，其能够记录并再现针对任意扬声器设置的声音。DirAC的目的是使用具有任意几何设置的多声道扬声器***，尽可能精确地再现现有声学环境的空间感。在记录环境中，以全向麦克风(W)和允许测量声音到达方向以及声音扩散的麦克风组来测量环境的响应(可以是连续记录的声音或脉冲响应)。在以下段落中以及在本申请中，术语“扩散”应被理解为针对声音的非方向性测量。即，以相等的强度从所有方向到达收听或记录位置的声音是最大扩散的。量化扩散的通常方式是使用来自区间[0，…，1]的扩散值，其中，值1描述了最大扩散声音，而值0描述了理想定向声音，即仅从一个可清晰辨识的方向发出的声音。一个通常已知的测量声音到达的方向的方法是应用与笛卡尔坐标轴对齐的3个八字(figure-of-eight)麦克风(XYZ)。已设计出被称作“声场麦克风”的专用麦克风，该麦克风直接产生所有期望的响应。然而，如以上所提及的，W、X、Y和Z信号也可以根据离散全向麦克风组进行计算。

近来，Goodwin和Jot提出了利用伴随的方向数据，将任意多个声道的音频格式存储至音频的一个或两个下混音声道的方法。该格式可以应用于任意的再现***。使用“Gerzon矢量(包括速度矢量和能量矢量)”来计算定向数据(即，具有与音频源的方向有关的信息的数据)。速度矢量是从收听位置指向扬声器的矢量的加权和，其中每个权重是扬声器的给定时间/频率瓦(tile)处的频谱的幅值。能量矢量是类似的加权矢量和。然而，权重是扬声器信号的短时能量估计，即其描述了稍微平滑的信号或包含在有限长度时间间隔内的信号中的信号能量的积分。具有充分根据的是，这些矢量共有的缺点是与实际的或感知的量不相关。例如，没有适当地考虑扬声器相对于彼此的相对相位。例如，这表示，如果将宽带信号馈入相反相位的收听位置之前的立体声设置的扬声器，则收听者将感知到来自周围方向的声音，收听位置中的声场将具有从一侧到另一侧(例如，从左侧到右侧)的声音能量振荡。在这种场景下，Gerzon矢量将会指向前方，显然这并不表示实际的或感知的情况。

自然地，市场上存在多个多声道格式或表示，存在能够在不同表示之间转换的需求，从而可以利用最初针对可选的多声道表示而开发的设置来再现各个表示。即例如，可能需要5.1声道与7.1或7.2声道之间的转换，以使用现有的7.1或7.2声道回放设置来回放通常在DVD上使用的5.1多声道表示。多种音频格式使音频内容生产变得困难，因为所有格式需要特定的混频和存储/传输格式。因此，用于不同再现设置上的回放的不同记录格式之间的转换是必需的。

提出了多种方法将特定音频格式的音频转换为另一音频格式。然而，总是将这些方法调整为特定多声道格式或表示。即这些仅可应用于从一个特定的预定多声道表示至另一特定的多声道表示的转换。

通常，再现声道数量的减少(所谓“下混音(downmix)”)比再现声道数量的增加(“上混音(upmix)”)更易实现。针对一些标准的扬声器再现设置，例如ITU提供了关于如何使用较少个数的再现声道下混音至再现设置的推荐。在这些所谓的“ITU”下混音等式中，将输出信号导出为输入信号的简单静态线性组合。通常，再现声道数量的减少导致所感知的空间图像的恶化，即空间音频信号的再现质量发生恶化。

为了从大量再现声道或再现扬声器中可能的获益，开发出用于特定类型转换的上混音技术。通常研究的问题是如何转换2声道立体声音频以使用5声道环绕扬声器***进行再现。这种2至5上混音的一种方式或实现是使用所谓的“矩阵”解码器。这种解码器普遍用于通过立体声传输结构(特别是早期的用于电影和家庭影院的环绕声音)来提供或上混音5.1多声道声音。基本思想是再现声音图像前的立体声信号中同相的声音分量，并将异相分量置入后扬声器。可选的2至5上混音方法提出提取立体声信号的环境分量并经由5.1设置的后扬声器再现这些分量。近来，C.Faller在“Parametric Multi-channel Audio Coding：Synthesis of Coherence Cues”，IEEE Trans.On Speech and Audio Proc.vol.14，no.1，2006年1月中提出了遵循在更加合理的基础上使用数学上更好的实现的相同基本思想的方式。

近来公开的标准MPEG环绕执行从一个或两个下混音和传输的声道至用于再现或回放的最终声道(通常是5.1)的上混音。这通过使用空间边信息(sideinformation)(与BCC技术类似的边信息)或没有边信息，或通过使用立体声下混音的两声道之间的相位关系(“非引导模式”或“增强矩阵模式”)来实现。

在前面的段落中描述的用于格式转换的所有方法特别应用于源和目的地音频再现格式的特定配置，因而并不通用。即，不能执行任意的输入多声道表示至任意的输出多声道表示的转换。即，现有的转换技术专门针对输入多声道音频表示和输出多声道表示而关于扬声器数量及其精确位置做出调整。

自然地，期望有一种针对可应用于输入和输出多声道表示的任意组合的多声道转换的概念。

发明内容

根据本发明的一实施例，一种用于将空间音频信号的输入多声道表示转换为不同的输出多声道表示的设备包括：分析器，用于导出空间音频信号的中间表示，所述中间表示具有指示空间音频信号的部分的源点方向的方向参数；以及信号编排器(composer)，用于使用空间音频信号的中间表示来产生空间音频信号的输出多声道表示。

其中使用中间表示，该中间表示具有指示空间音频信号的部分的源点方向的方向参数，只要已知输出多声道表示的扬声器配置，便可以实现任意的多声道表示之间的转换。重要的是，注意不必提前(即在转换设备的设计期间)知道输出多声道表示的扬声器配置。由于转换设备和方法是通用的，所以可以在接收侧改变提供作为输入多声道表示并针对特定扬声器设置而设计的多声道表示，以适合可用的再现设置，从而增强空间音频信号再现的再现质量。

根据本发明的另一实施例，在不同频带内分析空间音频信号的部分的源点方向。这样，针对空间音频信号的有限宽度频率部分，导出不同的方向参数。例如，为了导出有限宽度频率部分，可以使用滤波器组或傅立叶变换。根据另一实施例，选择针对其分别执行分析的频率部分或频带，以匹配人类听觉处理的频率分辨率。这些实施例可以具有以下优点：与人类听觉***本身可以确定音频信号的源点方向一样好地执行空间音频信号的部分的源点方向。因此，当重构这种被分析的信号并经由任意扬声器设置回放时，所执行的分析在确定音频对象或信号部分的源点的过程中不存在潜在的精度损失。

根据本发明的另一实施例，另外导出属于中间表示的一个或更多个下混音声道。即，从与和输入多声道表示相关联的扬声器相对应的音频声道中导出下混音声道，然后将该下混声道用于产生输出多声道表示或用于产生与和输出多声道表示相关联的扬声器相对应的音频声道。

例如，可以从普通5.1声道音频信号的5.1输入声道中产生单声道下混音声道。例如，这可以通过计算所有单独音频声道之和来执行。基于这个导出的单声道下混音声道，信号编排器可以将与所分析的输入多声道表示的部分相对应的单声道下混音声道的该部分分发给由方向参数指示的输出多声道表示的声道。即，将所分析的来自空间音频信号较远左侧的频率/时间或信号部分重新分发给输出多声道表示的扬声器，该扬声器位于相对于收听位置的左侧。

通常，本发明的一些实施例允许以如下方式来分发空间音频信号的部分：针对与更靠近所述方向参数所指示的方向的扬声器相对应的声道，以及更远离该方向的声道，前者的信号分发强度大于后者的信号分发强度。即无论在输出多声道表示中如何定义用于再现的扬声器的位置，也会尽可能好地实现适合可用的再现设置的空间重新分发。

根据本发明的一些实施例，可以利用其确定空间音频信号的部分的源点方向的空间分辨率比与输入多声道表示的单个扬声器相关联的三维空间角大得多。即，可以利用比通过将音频声道简单地从一个独特的设置重新分发至另一特定设置(如通过将5.1设置的声道重新分发给7.1或7.2设置)而实现的空间分辨率更高的精度来导出空间音频信号的部分的源点方向。

总之，本发明的一些实施例允许用于格式转换的增强方法的应用，该方法是通用的，并且不依赖于特定的期望目标扬声器布局/配置。一些实施例通过提取方向参数(与DirAC类似)，然后将该参数用于合成具有N2个声道的输出信号，而把具有N1个声道的输入多声道音频格式(表示)转换为具有N2个声道的输出多声道格式(表示)。此外，根据一些实施例，根据N1个输入信号(与根据输入多声道表示的扬声器相对应的音频声道)计算N0个下混音声道，然后将该N0个下混音声道用作使用所提取的方向参数进行解码处理的基础。

附图说明

以下将参照附图对本发明的多个实施例进行描述。

图1示出了导出指示了音频信号的部分的源点方向的方向参数的图示；

图2示出了基于5.1声道表示而导出方向参数的另一实施例；

图3示出了产生输出多声道表示的示例；

图4示出了从5.1声道设置到8.1声道设置的音频转换的示例；

图5示出了用于多声道音频格式之间的转换的本发明的设备示例。

具体实施方式

本发明的一些实施例导出了空间音频信号的中间表示，所述空间音频信号具有指示空间音频信号的部分的源点方向的方向参数。一种可能是导出指示空间音频信号的部分的源点方向的速度矢量。将参照图1，在以下段落中描述这样实施的一实施例。

在细述概念之前，应注意，可以将以下分析同时应用于下层(underlying)空间音频信号的多个单独的频率或时间部分。然而为了简单起见，将仅针对一特定频率或时间或时间/频率部分来描述该分析。该分析基于在位于坐标系中心的记录位置2处记录的声场的能量分析，如图1所示。

该坐标系是笛卡尔坐标系，具有彼此垂直的x轴4和y轴6。使用右手系，图1中未示出的z轴指向从绘图平面伸出的方向。

针对方向分析，假设记录了4个信号(被称为B格式信号)。记录一个全向信号w，即以(理想状态)相等的灵敏度接收来自所有方向的信号的信号。此外，记录三个方向信号X、Y和Z，它们具有沿笛卡尔坐标系的轴向指示的灵敏度分布。图1中给出了所使用的麦克风的可能的灵敏度图案的示例，示出了两个“八字”图案8a和8b，指向轴向。另外在图1所示坐标系的二维投影中示出了两个可能的音频源10和12。

对于方向分析，通过(1)式，针对不同频率部分(由索引i来描述)编排瞬时速度矢量(在时间索引n处)。

v(n，i)＝X(n，i)e_x+Y(n，i)e_y+Z(n，i)e_z (1)

即，所产生的矢量具有与坐标系轴相关联的麦克风的单独记录的麦克风信号作为分量。在上文和下文的等式中，通过两个索引(n，i)以时间(n)和频率(i)对量进行索引化。即

e_x，e_y和e_z表示笛卡尔单位矢量。

使用同时记录的全向信号w，将瞬时强度I计算为

I(n，i)＝w(n，i)v(n，i) (2)

根据以下公式导出瞬时能量：

E(n，i)＝w²(n，i)+||v||²(n，i)(3)

其中||||表示矢量范数。

即，导出允许两个信号间的可能干扰的强度量(由于可能出现正和负的振幅)。另外，导出能量，该能量自然不允许两个信号间的干扰，因为能量不包含允许信号抵消的负值。

有利地，可以使用强度和能量信号的这些特性来导出具有高精度的信号部分的源点方向，如以下将要解释的，保留音频声道的虚拟(virtual)相关(声道间的相对相位)。

一方面，可以将瞬时强度矢量用作指示空间音频信号的部分的源点方向的矢量。然而，该矢量可能经受快速改变，因而在信号再现中产生伪信号(artifact)。因此可选地，可以根据以下公式，使用利用汉宁窗(Hanning window)W₂的短时平均来计算瞬时方向：

D (n, i) = - Σ_{m = - M / 2}^{M / 2} I (n + m, i) W_{2} (m), - - - (4)

其中，W₂是用于短时平均D的汉宁窗。

即可选地，可以导出具有指示空间音频信号的源点方向的参数的短时平均方向矢量。

可选地，可以如下计算扩散测量值Ψ：

ψ (n, i) = 1 - \frac{\sqrt{Σ_{m = - M / 2}^{M / 2} {| | I (n + m, i | |}^{2} W_{1} (m)}}{Σ_{m = - M / 2}^{M / 2} E (n + m, i) W_{1} (m)} - - - (5)

其中，W₁(m)是在-M/2与M/2之间定义的用于短时平均的窗函数。

应再次注意，如此执行导出，从而保留音频声道的虚拟相关。即适当考虑相位信息，这并不是针对仅基于能量估计的方向估计的情况(例如Gerzon矢量)。

以下简单示例将用于对此进行更加详细的解释。考虑通过立体声***的两个扬声器回放的理想扩散信号。因为信号是扩散的(源自所有方向)，所以通过两个扬声器以相等的强度进行回放。然而，因为感知应是扩散的，所以需要180度的相移。在这种场景下，单纯基于能量的方向估计将产生恰好指向两个扬声器之间的中点位置的方向矢量，这必定是未反映现实的不期望的结果。

根据上述本发明的概念，保留音频声道的虚拟相关，同时估计方向参数(方向矢量)。在该特定示例中，方向矢量将会是零，指示声音并不源自一个独特的方向，很清楚这不是现实中的情况。相应地，等式(5)的扩散参数是1，理想地匹配了真实情况。

此外，以上等式中的汉宁窗可针对不同频带具有不同长度。

作为该分析的结果，针对频率部分的每个时间片，导出指示空间音频信号的部分的源点方向的方向矢量或方向参数，针对所述方向矢量或方向参数执行分析。可选地，可以导出指示空间音频信号的部分的方向扩散的扩散参数。如上所述，根据等式(4)导出的扩散值描述了最大扩散信号，即以相等强度源自所有方向的信号。

相反，小扩散值属于主要源自一个方向的信号部分。

图2示出了根据ITU-775-1，从具有五个声道的输入多声道表示中导出方向参数的示例。首先，通过仿真相应多声道音频设置的无回声记录，将多声道输入音频信号(即，输入多声道表示)变换为B格式。相对于具有x轴22和y轴24的笛卡尔坐标系的中心20，右后侧(RR)的扬声器26位于110°角处。右前侧(RF)扬声器28位于+30°，中心扬声器位于0°，左前侧(LF)扬声器32位于-31°，而左后侧(LR)扬声器34位于-110°。实践中，可以通过应用简单的矩阵化操作来仿真无回声记录，输入多声道表示的几何设置是已知的。

可以通过采用对所有扬声器信号(即同与输入多声道表示相关联的扬声器相对应的所有音频声道)的直接求和来获得全向信号w。通过把由扬声器和相应笛卡尔轴之间夹角的余弦而加权的扬声器信号相加，即要仿真的偶极子麦克风的最大灵敏度方向，可以形成偶极子或“八字”信号X、Y和Z。令Ln是指向第n扬声器的2维或3维笛卡尔矢量，以及V是指向与偶极子麦克风相对应的笛卡尔轴向的单位矢量。这样，加权因子是cos(angle(L_n，V))。例如，可以将方向信号X写作：

X = Σ_{n = 1}^{N} C_{n} \cdot \cos (angle (L_{n}, V)),

其中C_n表示第n声道的扬声器信号，N是声道数。术语夹角必须解释为操作符，计算两个给定矢量之间的空间夹角。也就是说，例如在图2所示的二维情况下的Y轴24和左前侧扬声器32之间的夹角40(θ)。

例如，可以如图1所示并如相应描述来执行方向参数的其他导出，即，音频信号X、Y和Z可以根据人类听觉***的频率分辨率来分为多个频带。依据每个频率声道中的时间，对声音的方向(即空间音频信号的部分的源点方向)以及(可选的)扩散进行分析。可选地，也可以使用不同于扩散的信号相异性的另一测量来替换声音扩散，例如与空间音频信号相关联的(立体声)声道之间的相干性。

作为简化的例子，如果如图2所指示存在一个音频源44，其中该源仅对特定频带内的信号有贡献，则将导出指向该音频源44的方向矢量46。通过指示源自音频源44的空间音频信号的部分的方向的方向参数(矢量分量)来表示方向矢量。在图2的再现设置中，该信号将主要通过如由与该扬声器相关联的符号波形所示的左前侧的扬声器32来再现。然而，也将从左后侧扬声器32对较小信号部分进行回放。因此，与X坐标22相关联的麦克风的方向信号将从左前侧声道32(与左前侧扬声器32相关联的音频声道)和左后侧声道34接收信号分量。

根据上述实施方式，与y轴相关联的方向信号Y也将接收由左前侧扬声器32所回放的信号部分，基于方向信号X和Y的方向分析将能够以高精度重构来自方向矢量46的声音。

为了最终转换为期望的多声道表示(多声道格式)，使用指示音频信号的部分的源点方向的方向参数。可选地，可以使用一个或更多个(N0)附加音频下混音声道。例如，该下混音声道可以是全向声道W或任何其他单声道。然而，针对空间分布，仅使用与中间表示相关联的单个声道具有小的负面影响。即，只要导出方向参数或方向数据，并且可以将它们用于重构或产生输出多声道表示，便可以使用诸如立体声混频之类的若干个下混音声道、声道W、X和Y或B格式的所有声道。可选地，也可以直接使用图2中的5个声道或与输入多声道表示相关联的声道的任意组合，作为可能的下混音声道的替换。当仅存储一个声道时，可能在扩散声音的再现中出现质量恶化。

图3示出了使用明显不同于图2的扬声器设置来再现音频源44的信号的示例，图2的扬声器设置是从中导出参数的输入多声道表示。作为示例，图3示出了沿收听位置(LP)60前的直线同等分布的六个扬声器50a至50f，如图2所介绍的，该收听位置60定义了具有x轴22和y轴24的坐标系的中心。由于前面的分析提供了描述指向音频信号源44的方向矢量46的方向的方向参数，所以可以容易地通过把要再现的空间音频信号的部分重新分发到靠近音频源44方向的扬声器，即通过靠近那些由方向参数所指方向的扬声器，来导出适于图3的扬声器设置的输出多声道表示。即，相对于与远离方向参数所指示的方向的扬声器相对应的音频声道，强化与该方向的扬声器相对应的音频声道。即，可以操作扬声器50a和50b(例如使用振幅移动)以再现信号部分，扬声器50c至50f不会再现该特定信号部分，而是可以将它们用于再现扩散声音或具有不同频带的其他信号部分。

使用利用方向参数来产生空间音频信号的输出多声道表示的信号编排器，也可以被解释为将中间信号解码为具有N2个输出声道的期望的多声道输出格式。典型地，在与分析所产生的音频下混音声道或信号所在的相同频带中对该音频下混音声道或信号进行处理。可以按照与DirAC类似的方式执行解码。在可选的扩散声音的再现中，典型地，用于表示非扩散流的音频是可选的N0个下混音声道信号之一或其线性组合。

针对可选的扩散流创建，存在若干个综合选项，以根据输出多声道表示来创建与扬声器相对应的输出信号或输出声道的扩散部分。如果仅存在一个下混音声道的传输，则必须使用该声道来为每个扬声器创建非扩散信号。如果存在更多声道的传输，则存在如何创建扩散声音的更多选项。例如，如果在转换过程中使用立体声下混音，则明显合适的方法是将左下混音声道应用至左侧的扬声器，并将右下混音声道应用至右侧的扬声器。如果使用若干下混音声道进行转换(即，N0＞1)，则可以将每个扬声器的扩散流计算为这些下混音声道的不同加权的和。例如，一种可能可以是传输B格式信号(如先前所描述的声道X、Y、Z和W)并计算每个扬声器的虚拟心形麦克风信号的信号。

下文以列表描述了将输入多声道表示转换为输出多声道表示的可能过程。在本示例中，以仿真的B格式麦克风来记录声音，然后由信号编排器进行进一步处理，以便以多声道或单声道扬声器设置进行收听或回放。参照示出5.1声道输入多声道表示至8声道输出多声道表示的转换的图4来解释单个步骤。基础是N1声道音频格式(N1在特定示例中是5)。为了将输入多声道表示转换为不同的输出多声道表示，可执行以下步骤。

1.如在记录部分70中所示出的，仿真具有N1个音频声道(5个声道)的任意多声道音频表示的无回声记录(使用布局中心72处的仿真的B格式麦克风)。

2.在分析步骤74中，仿真的麦克风信号被分至频带，并在方向分析步骤76中，导出仿真的麦克风信号的部分的源点方向。此外可选地，可以在扩散终止步骤78中确定扩散(或相干性)。

如先前所提及的，可以不使用B格式中间步骤来执行方向分析。即，通常必须基于输入多声道表示来导出空间音频信号的中间表示，其中，该中间表示具有指示空间音频信号的部分的源点方向的方向参数。

3.在下混音步骤80中，导出N0个下混音音频信号，用作输出多声道表示的转换/创建的基础。在合成步骤82中，对N0个下混音音频信号进行解码或通过适合的综合方法(例如，使用振幅移动或等同的适合技术)上混音至需要N2个音频声道的任意扬声器设置。

可以通过多声道扬声器***(例如，具有在图4的回放场景84中指示的8个扬声器)再现该结果。然而，由于概念的通用性，也可以针对单声道扬声器设置执行转换，提供了仿佛以一个单方向麦克风记录空间音频信号的效果。

图5示出了用于在多声道音频格式之间转换的设备100的示例的原理草图。

设备100用于接收输入多声道表示(representation)102。

设备100包括用于导出空间音频信号的中间表示106的分析器104，中间表示106具有指示空间音频信号的部分的源点方向的方向参数。

此外，设备100包括信号编排器108，用于使用空间音频信号的中间表示(106)产生空间音频信号的输出多声道表示110。

总之，先前描述的转换设备和转换方法的实施例提供了一些优点。首先，实际上可以以这种方式对任何输入音频格式进行处理。此外，转换过程可以产生针对任何扬声器布局(包括非标准扬声器布局/配置)的输出，而不需要针对输入扬声器布局/配置和输出扬声器布局/配置的新组合特别调整新的关系。此外，音频再现的空间分辨率在扬声器数量增加时增加，这与现有实现相反。

依据本发明方法的特定实现需求，可以以硬件或软件来实现本发明的方法。可以使用与可编程计算机***协作从而执行本发明方法的数字存储介质(尤其是其上存储有电可读控制信号的盘、DVD或CD)来执行该实现。因而通常本发明是具有存储在机器可读载体上的程序代码的计算机程序产品，该程序代码操作用于当计算机程序产品运行在计算机上时执行本发明的方法。换言之，因而本发明的方法是具有程序代码的计算机程序，用于当计算机程序在计算机上运行时执行本发明方法中的至少一种。

尽管已经参照特定实施例特别示出并描述了以上内容，但是本领域技术人员将会理解，可以在不偏离本发明的精神和范围的情况下做出形式和细节上的各种其他改变。应理解，可以在适合于不同实施例的过程中做出各种改变，而不会偏离这里所公开的、并由所附权利要求所限定的更宽的概念。

Claims

1、一种用于将空间音频信号的输入多声道表示转换为不同的输出多声道表示的设备，包括：

分析器，用于导出空间音频信号的中间表示，所述中间表示具有指示空间音频信号的部分的源点方向的方向参数；以及

信号编排器，用于使用空间音频信号的所述中间表示来产生空间音频信号的输出多声道表示。

2、如权利要求1所述的设备，其中所述分析器操作用于依据与所述输入多声道表示相关联的音频声道的虚拟相关来导出方向参数。

3、如权利要求1所述的设备，其中所述分析器操作用于导出保留了与所述输入多声道表示相关联的音频声道的相对相位信息的方向参数。

4、如权利要求1所述的设备，其中所述分析器操作用于导出针对空间音频信号的有限宽度频率部分的不同的方向参数。

5、如权利要求1所述的设备，其中所述分析器操作用于导出针对空间音频信号的有限长度时间部分的不同的方向参数。

6、如权利要求4所述的设备，其中所述分析器操作用于导出针对与频率部分相关联的空间音频信号的有限长度时间部分的不同的方向参数，其中与空间音频信号的第一频率部分相关联的第一时间部分的长度不同于与空间音频信号的第二不同频率部分相关联的第二时间部分的长度。

7、如权利要求1所述的设备，其中所述分析器操作用于导出方向参数，所述方向参数描述指向空间音频信号的部分的源点方向的矢量。

8、如权利要求1所述的设备，其中所述分析器还操作用于导出与中间表示相关联的一个或更多个音频声道。

9、如权利要求8所述的设备，其中所述分析器操作用于导出与和输入多声道表示相关联的扬声器相对应的音频声道。

10、如权利要求8所述的设备，其中所述分析器操作用于导出一个下混音声道，作为与和输入多声道表示相关联的扬声器相对应的音频声道之和。

11、如权利要求8所述的设备，其中所述分析器操作用于导出与笛卡尔坐标系的轴向相关联的至少一个音频声道。

12、如权利要求11所述的设备，其中所述分析器操作用于导出至少一个音频声道，所述至少一个音频声道构建了与和输入多声道表示相关联的扬声器相对应的音频声道的加权和。

13、如权利要求11所述的设备，其中操作所述分析器，使得能够根据以下公式，通过与和输入多声道表示相关联、并指向方向C_n的所有n个扬声器相对应的n个音频声道C_n的组合，来导出与笛卡尔坐标系的轴向V相关联的至少一个音频声道X：

X = Σ_{n = 1}^{N} C_{n} \cdot \cos (angle (L_{n}, V)) .

14、如权利要求1所述的设备，其中所述分析器还操作用于导出扩散参数，所述扩散参数指示空间音频信号的部分的源点方向的扩散。

15、如权利要求1所述的设备，其中所述信号编排器操作用于将空间音频信号的部分分发到与和输出多声道表示相关联的多个扬声器相对应的多个声道。

16、如权利要求15所述的设备，其中操作所述信号编排器，使得以如下方式来分发空间音频信号的部分：针对与更靠近所述方向参数所指示的方向的扬声器相对应的声道，其信号分发强度大于与和更远离该方向的扬声器相对应的声道的信号分发强度。

17、如权利要求14所述的设备，其中操作所述信号编排器，使得在所述扩散参数指示较高扩散时，与所述扩散参数指示较低扩散时相比较，以更加均匀的强度向与和所述输出多声道表示相关联的扬声器相对应的声道分发空间音频信号的部分。

18、如权利要求1所述的设备，还包括：输入接口，用于接收输入多声道表示。

19、如权利要求1所述的设备，还包括：

输入表示解码器，用于导出与和输入多声道表示相关联的所有扬声器相对应的多个音频声道。

20、如权利要求15所述的设备，其中所述信号编排器还包括输出声道编码器，所述输出声道编码器用于基于与和输出声道表示相关联的扬声器相对应的音频声道，导出输出多声道表示。

21、如权利要求1所述的设备，还包括用于提供输出多声道表示的输出接口。

22、一种用于将空间音频信号的输入多声道表示转换为不同的输出多声道表示的方法，所述方法包括：

导出空间音频信号的中间表示，所述中间表示具有指示空间音频信号的部分的源点方向的方向参数；以及

使用空间音频信号的中间表示来产生空间音频信号的输出多声道表示。

23、一种计算机程序，用于在计算机上运行时，实现用于将空间音频信号的输入多声道表示转换为不同的输出多声道表示的方法，所述方法包括：