CN103634733B

CN103634733B - 双耳信号的信号生成

Info

Publication number: CN103634733B
Application number: CN201310481493.0A
Authority: CN
Inventors: 哈拉尔德·蒙特; 伯恩哈德·诺伊格鲍尔; 约翰内斯·希尔珀特; 安德烈亚斯·悉塞勒; 珍·普洛斯提斯
Original assignee: Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Current assignee: Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Priority date: 2008-07-31
Filing date: 2009-07-30
Publication date: 2016-05-25
Anticipated expiration: 2029-07-30
Also published as: KR20130004372A; HK1164009A1; EP2384028B1; ES2528006T3; WO2010012478A2; EP2384029A3; CA2820208A1; KR20130004373A; CA2732079C; US20110211702A1; EP2384028A2; JP2011529650A; WO2010012478A3; CN103561378A; CN102172047A; CA2820208C; EP2384029A2; CN103634733A; ES2524391T3; EP2384028A3

Abstract

描述了一种用于基于多声道信号来产生双耳信号的设备，所述多声道信号表示多个声道并且用于由扬声器配置来再现，所述扬声器配置具有与每个声道相关联的虚拟声源位置。所述设备包括：相关性减小器，用于以不同方式处理并因此减小在所述多个声道的左声道和右声道、所述多个声道的前声道和后声道、以及所述多个声道的中心声道和非中心声道中的至少一对声道之间的相关性，以得到彼此间相似性减小的声道集合；多个方向滤波器；第一混频器，用于将对向收听者的第一耳道的声传输加以建模的方向滤波器的输出进行混频；以及第二混频器，用于将对向收听者的第二耳道的声传输加以建模的方向滤波器的输出进行混频。根据另一方面，形成彼此间相似性减小的头部相关传递函数集合。

Description

双耳信号的信号生成

本申请是申请日为2009年7月30日，申请号为200980138924.5的专利申请“双耳信号的信号生成”的分案申请。

技术领域

本发明涉及产生双耳信号的与房间反射和/或回响有关的贡献、产生双耳信号自身、以及形成彼此间相似性减小的头部相关传递函数集合。

背景技术

人类听觉***能够确定感知到的声音来自哪个或哪些方向。为此，人类听觉***评估右耳处接收到的声音与左耳处接收到的声音之间的特定差异。特定差异包括例如所谓的耳间提示，所述耳间提示是指耳朵之间的声音信号差。耳间提示是最重要的定位方法。耳朵之间的压力等级差(即，耳间声级差(ILD))是用于定位的最重要的单个提示。当声音从水平面以非零仰角到达时，该声音在每个耳朵中具有不同的声级。与未被遮挡的耳朵相比，被遮挡的耳朵具有必然受抑制的声像。用于定位的另一非常重要的特性是耳间时间差(ITD)。与未被遮挡的耳朵相比，被遮挡的耳朵离声源的距离更远，从而更晚获得声音波前。在低频下强调ITD的含义，与未被遮挡的耳朵相比，低频声音在到达被遮挡的耳朵时没有衰减很多。ITD在较高频率下不太重要，这是因为声音波长与耳朵之间的距离更接近。因此，换言之，定位利用以下事实：当声音从声源分别传播到收听者的左耳和右耳时，声音经过与收听者的头部、耳朵和肩膀的不同交互。

当人收听立体声信号时会出现问题，其中将由扩音器装置经由耳机来再现的所述立体声信号。当收听者感到声源位于头部中时，收听者很有可能认为声音不自然、难听并且烦扰。这种现象在学术上通常称作“头内”定位。长期收听“头中”声音会导致收听疲劳。由于人类听觉***在定位声源时所依赖的信息(即，耳间提示)丢失或不清楚，因此会出现这种现象。

为了呈现立体声信号或者甚至具有多于两个声道的多声道信号以实现耳机再现，可以使用方向滤波器来对这些交互进行建模。例如，从解码后的多声道信号产生耳机输出可以包括：在解码之后利用一对方向滤波器对每个信号进行滤波。这些滤波器典型地对从房间内虚拟声源向收听者耳道的声音传输进行建模，所谓的双耳房间传递函数(BRTF)。BRTF执行时间修改、声级修改和谱修改、以及对房间反射和回响进行建模。可以在时间域或频域实现方向滤波器。

然而，由于需要许多(即，N×2，其中N是解码声道的个数)滤波器，所以这些方向滤波器非常长，如，在44.1kHz下有20000个滤波器抽头，滤波过程需要非常大的计算量。因此，有时将方向滤波器减小到最小。所谓的头部相关传递函数(HRTF)包含方向信息，所述方向信息包括耳间提示。一般的处理模块用于对房间反射和回响进行建模。房间处理模块可以是在时域或频域的回响算法，并且可以对单声道或二声道输入信号起作用，其中所述单声道或二声道输入信号是通过对多声道输入信号的声道求和而从多声道输入信号得到的。例如，在WO99/14983A1中描述了这种结构。如所描述的，房间处理模块实现房间反射和/或回响。房间反射和回响对于所定位的声音是重要的，尤其相对于距离和外化(externalization)——意味着在收听者头部外面感知到声音。前述文献还建议使用方向滤波器作为在相应声道的不同地延迟的版本上工作的FIR滤波器集合，以对从声源到相应耳朵的直接路径和不同反射进行建模。此外，在对通过一对耳机提供更愉悦收听体验的多种方法的描述中，该文献还建议分别相对于左后方声道和右后方声道的和与差，对中心声道与左前方声道的混合以及中心声道与右前方声道的混合进行延迟。

然而，这样实现的收听结果仍然很大程度上缺乏双耳输出信号的空间宽度的减小以及缺乏外化。此外，已经认识到，除了上述呈现多声道信号以实现耳机再现的方法外，常常对电影对白和音乐中的语音的一部分感到不自然、有回响并且空间上不等。

发明内容

因此，本发明的目的是提供一种双耳信号生成方案，从而实现更稳定且舒适的耳机再现。

本发明所基于的第一思想是，通过以下操作可以实现用于耳机再现的更稳定且舒适的双耳信号：以不同方式处理并因此而减小在多个声道的左声道和右声道、所述多个声道的前声道和后声道、以及所述多个声道的中心声道和非中心声道中的至少一对声道之间的相似性，从而得到彼此间相似性减小的声道集合。然后将该彼此间相似性减小的声道集合馈送至多个方向滤波器，多个方向滤波器后面是分别针对左耳和右耳的相应混频器。通过减小多声道输入信号的声道的彼此间相似性，可以增大双耳输出信号的空间宽度并可以改善外化。

本发明所基于的另一思想是，通过以下操作可以实现用于耳机再现的更稳定且舒适的双耳信号：在谱变化的意义上，在所述多个声道中的至少两个声道之间，以不同方式执行相位和/或幅度修改，从而得到彼此间相似性减小的声道集合，然后可以将所述彼此间相似性减小的声道集合馈送至多个方向滤波器，所述多个方向滤波器后面是分别针对左耳和右耳的相应混频器。同样，通过减小多声道输入信号的声道的彼此间相似性，可以增大双耳输出信号的空间宽度并可以改善外化。

当通过以下方式来形成彼此间相似性减小的头部相关传递函数集合时，也可以实现上述优点：使原始的多个头部相关传递函数的脉冲响应相对于彼此而延迟，或在谱变化的意义上，相对于彼此以不同方式修改原始的多个头部相关传递函数的脉冲响应的相位响应和/或幅度响应。可以例如，响应于要使用的虚拟声源位置的指示，通过使用头部相关传递函数作为方向滤波器，作为设计步骤离线地进行形成，或者在双耳信号生成期间在线地进行形成。

本发明所基于的另一思想是，在以下情况下，电影或音乐中的一些部分产生更自然地感知的耳机再现：形成多声道信号的声道的单声道或立体声下混频，其中将对所述多声道信号应用房间处理器以产生双耳信号的与房间反射/回响有关的贡献，使得所述多个声道以在多声道信号的至少两个声道之间不同的声级处对单声道或立体声下混频作出贡献。例如，发明人意识到，典型地电影对白和音乐中的话音主要被混频到多声道信号的中心声道，并且中心声道信号在被馈送至房间处理模块时产生常常不自然的回响和在谱方面不等的感知输出。然而发明人发现，通过利用声级降低(例如3-12dB或具体地6dB的衰减)将中心声道馈送至房间处理模块，可以克服这种缺陷。

附图说明

在下文中，关于附图更详细地描述了优选实施例，附图中：

图1示出了根据实施例的用于生成双耳信号的设备的框图；

图2示出了根据另一实施例的用于形成彼此间相似性递减的头部相关传递函数集合的设备的框图；

图3示出了根据另一实施例的用于生成双耳信号的与房间反射和/或回响有关的贡献的设备；

图4a和4b示出了根据不同实施例的图3的房间处理器的框图；

图5示出了根据实施例的图3的下混频发生器发生器的框图；

图6示出了根据实施例的对使用空间音频编码的多声道信号的图示加以表示的示意图；

图7示出了根据实施例的双耳输出信号发生器；

图8示出了根据另一实施例的双耳输出信号发生器的框图；

图9示出了根据另一实施例的双耳输出信号发生器的框图；

图10示出了根据另一实施例的双耳输出信号发生器的框图；

图11示出了根据另一实施例的双耳输出信号发生器的框图；

图12示出了根据实施例的图11的双耳空间音频解码器的框图；以及

图13示出了根据实施例的图11的修改后的空间音频解码器的框图。

具体实施方式

图1示出了用于产生双耳信号的设备，所述双耳信号例如用于基于对多个声道加以表示的多声道信号的耳机再现，以及用于通过具有与每个声道相关联的虚拟声源位置的扬声器配置来再现。该设备通常以附图标记10来表示，包括相似性减小器12、多个方向滤波器14a-14h(方向滤波器14)、第一混频器16a和第二混频器16b。

相似性减小器12被配置为将表示多个声道18a-18d的多声道信号18变成声道彼此间相似性减小的声道20a-20d声道集合20。由多声道信号18表示所表示的声道18a-18d的个数可以是两个或多个。仅出于示意的目的，图1中已经明确示出了4个声道声道18a-18d。多个声道18例如可以包括中心声道、左前方声道、右前方声道、左后方声道以及右后方声道。声音设计器根据多个单独音频信号对声道18a-18d进行混频，其中所述多个单独音频信号表示例如单独指令、声乐作品或其他单独声源，假定或目的在于由扬声器装置(图1中未示出)来再现声道18a-18d，使扬声器位于与每个声道18a-18d相关联的预定虚拟声源位置。

根据图1的实施例，多个声道18a-18d至少包括左右声道对、前后声道对、或者中心与非中心声道对。当然，在多个声道18a-18d(声道18)内可以存在多于一个上述对。相似性减小器12被配置为以不同方式处理并从而减小多个声道中各个声道之间的相似性，以得到由声道20a-20d组成的彼此间相似性减小的声道集合20。根据第一方面，相似性减小器12可以减小多个声道18中的左右声道、多个声道18中的前后声道、以及多个声道18中的中心与非中心声道中至少一对声道之间的相似性，以得到由声道20a-20d组成的彼此间相似性减小声道集合20。根据第二方面，附加地/备选地，相似性减小器(12)在谱变化的情况下在多个声道中的至少两个声道之间以不同方式执行相位和/或幅度修改，以得到彼此间相似性减小声道集合20。

如以下将更详细描述的，例如，相似性减小器12可以通过使各个对相对于彼此而延迟，或通过例如在多个频带中的每个频带中将各个声道对延迟不同的量，来实现不同的处理，从而得到彼此间相关性减小声道集合20。当然，也存在其他可能来减小声道之间的相关性。换言之，相关性减小器12可以具有传递函数，根据该传递函数，每个声道的谱能量分布保持相同，即，该传递函数作为相关音频谱范围上的量值1，然而相似性减小器12以不同方式修改其子带或频率分量的相位。例如，相关性减小器12可以被配置为：同样对声道18的所有声道或一个或多个声道进行相位修改，使得针对特定的频带，使第一声道的信号相对于另一声道而延迟至少一个采样。此外，相关性减小器12可以被配置为：同样引起相位修改，使得对于多个频带，第一声道相对于另一声道的组延迟表现出至少八分之一采样的标准偏差。所考虑的频带可以是Bark频带或任何其子集或其他频带子部分(sub-division)。

减小相关性并不是防止人类听觉***遭遇头内定位的唯一途径。相关性仅仅是多种可能方式之一，通过这些方式，人类听觉***测量到达两只耳朵的声音的相似性，从而测量声音的回程方向(in-bounddirection)。相应地，相似性减小器12还可以通过例如在多个频带中的每个频带中对各个声道进行不同量的声级减小，来实现不同的处理，从而以谱形成的方式得到彼此间相似性减小声道集合20。谱形成可以例如扩大相对谱形成减小，例如由于耳朵的遮挡而引起的后声道声音相对于前声道声音的相对谱形成减小。相应地，相似性减小器12可以相对于其他声道对后声道进行谱变化声级减小。在该谱形成中，相似性减小器12可以具有在相关音频谱范围上恒定的相位响应，然而相似性减小器12以不同方式修改其子频带或频率分量的幅度。

多声道信号18表示多个声道18a-18d的方式在原则上不限于任何特定表示。例如，多声道信号18可以使用空间音频编码以压缩方式表示多个声道18a-18d。根据空间音频编码，可以利用多个声道18a-18d被下混频到的下混频信号伴随下混频信息和空间参数来表示所述多个声道18a-18d，其中所述下混频信息表示将独立声道18a-18d混频到下混频声道中所依据的混频比，所述空间参数例如利用声级/强度差、相位差、时间差和/或各个单独声道18a-18d之间的相关性/相关性的度量来描述多声道信号的空间图像。将相关性减小器12的输出分割成各个单独的声道20a-20d。可以作为时间信号、或作为光谱图(例如，谱分解到子频带中)来输出声道20a-20d。

方向滤波器14a-14h被配置为对声道20a-20d中相应的一个声道的从与相应声道相关联的虚拟声源位置向收听者相应耳道的声传播进行建模。在图1中，方向滤波器14a-14d对向例如左耳道的声传播进行建模，而方向滤波器14e-14d对向右耳道的声传输进行建模。方向滤波器可以对从室内虚拟声源位置向收听者耳道的声传输进行建模，并且可以通过执行时间、声级和谱修改并可选地对房间反射和回响进行建模，来执行该建模。可以在时域或频域实现方向滤波器18a-18h。即，方向滤波器可以是诸如滤波器、FIR滤波器之类的时域滤波器，或者可以通过将各个传递函数采样值与声道20a-20d的各个谱值相乘而在频域工作。具体地，方向滤波器14a-14h可以被选择为对相应的头部相关传递函数进行建模，所述头部相关传递函数描述了从相应的虚拟声源位置到相应耳道的相应声道信号20a-20d的交互，包括例如与人的头部、耳朵和肩膀的交互。第一混频器16a被配置为对方向滤波器14a-14d的输出进行混频，以得到用于对双耳输出信号的左声道作出贡献或者甚至就是双耳输出信号的左声道的信号22a，其中方向滤波器14a-14d对于向收听者左耳道的声传输进行建模；而第二混频器16b被配置为对方向滤波器14e-14h的输出进行混频，以得到用于对双耳输出信号的右声道作出贡献或者甚至就是双耳输出信号的右声道的信号22b，其中方向滤波器14e-14h对于向收听者右耳道的声传输进行建模。

如以下将关于各个实施例而更详细描述的，可以向信号22a和22b添加其他贡献，以考虑室内反射和/或回响。通过这种方式，可以降低方向滤波器14a-14h的复杂度。

在图1的设备中，相似性减小器12抵消对分别输入到混频器16a和16b中的相关信号进行求和的负面效应，据此，可以导致双耳输出信号22a和22b的空间宽度有很大的减小并且缺乏外化。相似性减小器12所实现的去相关减小了这些负面效应。

在进入下一实施例之前，换言之，图1示出了从例如解码后的多声道信号产生耳机输出的信号流。每个信号由方向滤波器对来滤波。例如，声道18a由方向滤波器对14a-14e来滤波。不幸地，在典型的多声道声音产生中，声道18a-18d之间存在很大的相似性(如，相关性)。这会对双耳输出信号造成负面影响。即，在用方向滤波器14a-14h处理了多声道信号之后，在混频器16a和16b中将方向滤波器14a-14h输出的中间信号相加，以形成耳机输出信号20a和20b。对相似/相关的输出信号求和会使得输出信号20a和20b的空间宽度大大减小并且缺乏外化。这对于左右信号和中心声道的相似性/相关性来说是尤为成问题的。相应地，相似性减小器12用于尽可能地减小这些信号之间的相似性。

应注意，通过去除相似性减小器12，同时将方向性滤波器修改为不仅执行前述对声传输的建模，还实现上述不相似性(如，去相关)，可以实现相似性减小器12为了减小多个声道18a-18d(声道18)中各个声道之间的相似性而执行的大多数测量。相应地，方向性传感器可以不对HRTF进行建模，而是对修改后的头部相关传递函数进行建模。

图2例如示出了设备，该设备用于形成彼此间相似性减小的头部相关传递函数集合，以对声道集合的从与相应声道相关联的虚拟声源位置向收听者耳道的声传输进行建模。通常由30来表示的设备包括HRTF提供器32和HRTF处理器34。

HRTF提供器32被配置为提供原始的多个HRTF。步骤32可以包括：使用标准仿真头部的测量，以测量从特定声位置向标准仿真收听者的耳道的头部相关传递函数。类似地，HRTF提供器32可以被配置为简单地从存储器查找或加载原始HRTF。备选地，HRTF提供器32可以被配置为例如根据感兴趣的虚拟声源位置按照预定的公式来计算HRTF。相应地，HRTF提供器32可以被配置为工作在用于设计双耳输出信号发生器的设计环境中，或者可以是这种双耳输出信号发生器信号自身的一部分，以例如响应于虚拟声源位置的选择或改变来在线提供原始HRTF。例如，设备30可以是双耳输出信号发生器的一部分，所述双耳输出信号发生器能够提供针对不同扬声器配置的多声道信号，不同扬声器布置具有与其声道相关联的不同虚拟声源位置声道。在这种情况下，HRTF提供器32可以被配置为以适于当前预期虚拟声源位置的方式来提供原始HRTF。

HRTF处理器34被配置为使至少HRTF对的脉冲响应相对于彼此而位移，或在谱变化的情况下以不同方式相对于彼此来修改HRTF对的相位和/或幅度响应。HRTF对可以对左右声道、前后声道、以及中心与非中心声道中的一对声道进行建模。实际上，可以利用应用于多声道信号中的一个或多个声道的以下技术之一或这些技术的组合来实现这一点：即，将相应声道的HRTF延迟；修改相应HRTF的相位响应和/或对相应HRTF应用诸如全通滤波器之类的去相关滤波器，从而得到彼此间相关性减小的HRTF集合；和/或在谱修改的情况下修改相应HRTF的幅度响应，从而得到至少彼此间相似性减小的HRTF集合。在任一情况下，得到的各个声道之间的去相关性/不相似性可以支持人类听觉***外部地定位声源，从而防止发生头内定位。例如，HRTF处理器34可以被配置为：同样引起声道HRTF中的全部声道、一个或多个声道的相位响应的修改，使得引入特定频带的第一HRTF的组延迟，或者将第一HRTF的特定频带相对于另一个HRTF延迟至少一个采样。此外，HRTF处理器34可以被配置为：同样引起相位响应的修改，使得针对多个频带，第一HRTF相对于另一个HRTF的组延迟表现出至少八分之一采样的标准偏差。所考虑的频带可以是Bark频带或其子频带或任何其他频带子部分。

从HRTF处理器34得到的彼此间相似性减小的HRTF集合可以用于设定图1的设备的方向滤波器14a-14h的HRTF，其中，可以存在或不存在相似性减小器12。由于修改后的HRTF的不相似性特性，即使当没有相似性减小器12时也可以类似地实现与双耳输出信号的空间宽度以及改进的外化有关的前述优点。

如上所述，图1的设备可以伴随另一通路，所述另一通路被配置为基于输入声道18a-18d中的至少一些声道的下混频，得到双耳输出信号的与房间反射和/或回响有关的贡献。这降低了方向滤波器14a-14h的复杂度。图3示出了用于产生双耳信号的这种与房间反射和/或房间回响有关的贡献的设备。设备40包括彼此串联的下混频发生器42和房间处理器44，其中房间处理器44在下混频发生器42后面。设备40可以连接在图1的设备的输入与双耳输出信号的输出之间，在图1的设备的输入处输入多声道信号18，在双耳输出信号的该输出处，将房间处理器44的左声道贡献46a添加到输出22a，将房间处理器44的右声道输出46b添加到输出22b。下混频发生器42根据多声道信号18的声道形成单声道或立体声下混频48，处理器44被配置为通过基于单声道或立体声信号48对房间反射和/或回响进行建模，来产生双耳信号的与房间反射和/或回响有关的贡献的左声道46a和右声道46b。

房间处理器44所基于的思想是，例如可以基于下混频(例如，多声道信号18的声道的简单的求和)以对收听者透明的方式来建模在房间内出现的房间反射/回响。由于与沿着从声源到耳道的直接路径或视线传播的声音相比，房间反射/回响出现较晚，所以房间处理器的脉冲响应代表或替代图1所示方向滤波器的脉冲响应的尾部。可以将方向滤波器的脉冲响应限制为收听者头部、耳朵和肩膀处出现的直接路径以及反射和衰减进行建模，从而缩短方向滤波器的脉冲响应。当然，方向滤波器所建模的内容与房间处理器44所建模的内容之间的界限可以自由改变，使得方向滤波器还可以例如对第一房间反射/回响进行建模。

图4a和4b示出了房间处理器的内部结构的可能实现。根据图 4a，为房间处理器44馈送单声道下混频信号48，房间处理器44包括两个回响滤波器50a和50b。与方向滤波器类似，回响滤波器50a和50b可以被实现为在时域或频域操作。回响滤波器50a和50b的输入都接收单声道下混频信号48。回响滤波器50a的输出提供左声道贡献输出46a，而回响滤波器50b输出右声道贡献信号46b。图4b示出了在为房间处理器44提供立体声下混频信号48的情况下，房间滤波器44的内部结构的示例。在这种情况下，房间处理器包括四个回响滤波器50a-50d。回响滤波器50a和50b的输入连接至立体声下混频48的第一声道48a，而回响滤波器50c和50d的输入连接至立体声下混频48的另一声道48b。回响滤波器50a和50c的输出连接至加法器52a的输入，加法器52a的输出提供左声道贡献46a。回响滤波器50b和50d的输出连接至另一加法器52b的输入，所述另一加法器52b的输出提供右声道贡献46b。

尽管已经描述了下混频发生器42可以简单地通过对每个声道均等地加权来对多声道信号18的声道进行求和，然而图3的实施例并不限于此。相反，图3的下混频发生器42可以被配置为形成单声道或立体声下混频48，使得多个声道，以在多声道信号18的至少两个声道之间不同的声级处，对单声道或立体声下混频作出贡献。通过这种方式，可以防止或促使被混频到多声道信号的特定的一个或多个声道中的多声道信号的特定内容(如，语音或背景音乐)受到房间处理，从而避免不自然的声音。

例如，图3的下混频发生器42可以被配置为形成单声道或立体声下混频48，使得多声道信号18的多个声道的中的中央声道以相对于多声道信号18的其他声道而言声级降低的方式对单声道或立体声下混频信号48作出贡献。例如，声级降低的量可以在3dB和12dB之间。声级降低可以均匀地分布在多声道信号18的声道的有效谱范围上，或者可以是频率相关的，如，集中在特定的谱部分(如，典型地被话音信号占用的谱部分)上。相对于其他声道而言声级降低的量可以与所有其他声道相同。即，可以以同样的声级将其他声道混频到下混频信号48中。备选地，可以以不等的声级将其他声道混频到下混频信号48中。那么可以针对其他声道的均值或者包括声级降低的那个声道在内的所有声道的均值，来测量相对于其他声道而言的声级降低的量。如果是这样，则其他声道的混频权重的标准偏差或所有声道的混频权重的标准变差可以小于等级降低的声道相对于上述均值而言混频权重的等级降低的66％。

相对于中心声道而言的等级降低的效果是：经由贡献56a和56b得到的双耳输出信号至少在以下更详细描述的一些情况下被收听者更自然地感知到，而没有声级降低。换言之，下混频发生器42形成多声道信号18的声道的加权和，其中与中心声道相关联的加权值相对于其他声道的加权值而减小。

在电影对白或音乐的话音部分期间，中心频率的声级降低是尤为有利的。由于非话音阶段中的声级降低，在这些话音部分期间得到的音频印象改善过度地补偿了微小惩罚。然而，根据备选实施例，声级降低不是恒定的。相反，下混频发生器42可以被配置为在关闭声级降低的模式与开启声级降低的模式之间进行切换。换言之，下混频发生器42可以被配置为以时间变化的方式来改变声级降低的量。变化可以是二进制形式或模拟形式的，在零与最大值之间。下混频发生器42可以被配置为根据在多声道信号18内包含的信息来执行模式切换或声级降低量变化。例如，下混频发生器42可以被配置为检测话音阶段或区分这些话音阶段与非话音阶段，或者可以为中心声道的连续帧分配对话音内容(至少是顺序量表(ordinalscale)的话音内容)进行测量的话音内容测量。例如，下混频发生器42利用话音滤波器来检测中心声道中话音的存在，并确定该滤波器的输出声级是否超过了和阈值。然而，下混频发生器42对中心声道内话音阶段的检测并不是执行上述与时间有关的声级降低量变化的模式切换的唯一方式。例如，多声道信号18可以具有与该多声道信号18相关联的辅助信息，所述辅助信息尤其用于区分话音阶段与非话音阶段，或者定量地测量话音内容。在这种情况下，下混频发生器42将响应于该辅助信息来操作。另一种可能是，下混频发生器42还可以根据例如中心声道、左声道和右声道的电流等级之间的比较，来执行上述模式切换或声级降低量变化。如果中心声道分别各自地比左声道和右声道或者比左声道与右声道之和高出特定的阈值比率，则下混频发生器42可以假定当前存在话音阶段并相应地作出动作，即，执行声级降低。类似地，下混频发生器42可以使用中心声道、左声道和右声道之间的声级差，以实现上述相依性。

除此之外，下混频发生器42可以响应于用于对多声道信号18的多个声道的空间图像加以描述的空间参数。图5中示出了这一点。图5示出了在多声道信号18利用特殊音频编码(即，通过使用多个声道被下混频到的下混频信号62，以及对多个声道的空间图像加以描述的空间参数64)来表示多个声道的情况下，下混频发生器42的示例。可选地，多声道信号18还可以包括对单独声道被混频到下混频信号62或下混频信号62的独立声道中的比值加以描述的下混频信息，因为下混频声道62可以例如是普通下混频信号62或立体声下混频信号62。图5的下混频发生器42包括解码器64和混频器66。解码器64根据空间音频解码对多声道信号18进行解码，以得到包括尤其是中心声道66和其他声道68在内的多个声道。混频器66被配置为通过执行上述声级降低，对中心声道66和其他非中心声道68进行混频，以得到单声道或立体声信号48。如虚线70所指示的，如上所述，混频器66可以被配置为使用空间参数64，以在声级降低模式与变化声级降低量的非声级降低模式之间切换。混频器66所使用的空间参数64可以例如是对可以如何可以从下混频信号62得到中心声道66、左声道或右声道加以描述的声道预测系数，其中混频器66可以附加地使用对上述左声道和右声道之间的相干性或交叉相关加以表示的声道间相干/交叉相关参数，上述左声道和右声道可以分别是是左前方声道与左后方声道的下混频以及右前方声道与右后方声道的下混频。例如，可以以固定的比率将中心声道混频到立体声下混频信号62的上述左声道和右声道中。在这种情况下，两个声道预测系数就足够确定如何从立体声下混频信号62的两个声道的相应线性组合中得到中心声道、左声道和右声道。例如，混频器66可以使用声道预测系数的和与差之间的比率，以区分话音阶段与非话音阶段。

尽管描述了关于中心声道的声级降低以示例多个声道的加权求和，使得中心声道以在多声道信号18的至少两个声道之间不同的声级，对单声道或立体声混频作出贡献，然而也存在其他示例，在所述其他示例中，有利地将其他声道相对于另一个或另一些声道进行声级降低或声级放大，这是因为，在与多声道信号中的其他内容相同但降低/提高的声级下，所述另一个或另一些声道中存在的一些声源内容将受到或不受到房间处理。

关于利用下混频信号62和空间参数64来表示多个输入声道的可能性，非常概括地说明了图5。关于图6，强化了该描述。关于图6的描述还用于理解关于图10至13而描述的以下实施例。图6示出了谱分解成多个子频带82的下混频信号62。在图6中，将子频带82示例性地示为水平延伸，子频带82被布置为使得子频带频率如频域箭头84所指示的从底部到顶部增大。沿水平方向的延伸应表示时间轴86。例如，下混频信号62包括针对每个子频带82的谱值序列88。通过采样值88来采样子频带82的时间分辨率可以由滤波器组时隙90来限定。因此，时隙90和子频带92限定了某一时间/频率分辨率或栅格。通过如图6中虚线所示将相邻的采样值88合并成时间/频率片92来限定较粗略的时间/频率栅格，这些片限定了时间/频率参数分辨率或栅格。前述空间参数62是在该时间/频率参数分辨率92下限定的。时间/频率参数分辨率92可以随时间改变。为此，可以将多声道信号62分成连续帧94。对于每一帧，可以单独地设置时间/频率参数分辨率92。在解码器64在时域接收下混频信号62的情况下，解码器64可以包括内部分析滤波器组，以得到如图6所示的下混频信号62的表示。备选地，下混频信号62以如图6所示的形式进入解码器64，在这种情况下解码器64中不需要分析滤波器组。如图5中已经提到的，对于每个片92，可以存在两个声道预测参数，所述声道预测参数关于相应的时间/频率片92揭示如何可以从立体声下混频信号62的左声道和右声道得到右声道和左声道。此外，对于片92，还可以存在声道间相干/交叉相关(ICC)参数，所述声道间相干/交叉相关(ICC)参数指示要从立体声下混频信号62得到的左声道和右声道之间的相似性，其中已将一个声道完全混频到立体声下混频信号62的一个声道中，而将另一声道完全混频到立体声下混频信号62的另一声道中。然而，对于每个片92还可以存在声道声级差(CLD)参数，所述声道声级差(CLD)参数指示上述左声道与右声道之间的声级差。可以对CLD参数应用对数标度的非均匀量化，其中当声道之间存在较大的声级差时，非均匀量化具有接近零dB的高精度以及较粗糙的分辨率。此外，在空间参数64内可以存在其他参数。这些参数可以尤其地限定用于通过混频来形成上述左声道和右声道的声道(如，左后方声道、左前方声道、右后方声道和右前方声道)有关的CLD和ICC。

应注意，上述实施例可以彼此相组合。以上已经提到了一些组合可能性。下文中将关于图7至13的实施例来描述其他可能性。此外，图1和5的前述实施例分别假定设备内实际存在中间声道20、66和68。然而，情况并不必须如此。例如，通过省去相似性减小器12，可以使用由图2的设备得到的修改后的HRTF来限定图1的方向滤波器，在这种情况下，通过在时间/频率参数分辨率92内合适地组合空间参数和修改后的HRTF，并相应地应用所得到的线性组合系数以形成双耳信号22a和22b，图1的设备可以对表示多个声道18a-18d的下混频信号(如图5所示的下混频信号62)起作用。

类似地，下混频发生器42可以被配置为适当地组合空间参数64以及针对中心声道要实现的声级降低量，以得到用于房间处理器44的单声道或立体声下混频48。图7示出了根据实施例的双耳输出信号发生器。通常以附图标记100来表示的发生器包括多声道解码器102、双耳输出104以及分别在多声道解码器102与双耳输出之间延伸的两个路径，即，直接路径106和回响路径108。在直接路径中，方向滤波器110连接至多声道解码器102的输出。直接路径还包括由加法器112组成的第一加法器组以及由加法器114组成的第二加法器组。加法器112对前一半方向滤波器110的输出信号进行求和，第二加法器114对后一半方向滤波器114的输出信号进行求和。第一加法器112和第二加法器114的求和后的输出表示双耳输出信号22a和22b的前述直接路径贡献。提供加法器116和118，以将贡献信号22a和22b与回响路径108提供的双耳贡献信号(即，信号46a和46b)相组合。在回响路径108中，混频器120和房间处理器122串联在多声道解码器102的输出与加法器116和118的相应输入之间，加法器116和118的输出限定了在输出104处输出的双耳输出信号。

为了易于理解图7的设备的以下描述，在图1至6中使用的附图标记部分地用于表示图7中与图1至6中出现的元件相对应或用于执行图1至6中出现的元件的功能的元件。在以下描述中，相应的描述将更清楚。然而应注意，为了易于以下描述，在假定相似性减小器执行相关性减小的前提下描述了以下实施例。相应地，在下文中相似性减小器是指相关性减小器。然而从上文中可以清楚看出，以下概述的实施例完全可以用于相似性减小器执行相似性降低而不是相关性减小的情况。此外，在假定用于针对房间处理产生下混频的混频器产生中心声道声级降低的情况下，起草了下述实施例，然而如上所述，这完全可以应用于备选实施例。

图7的设备使用信号流从解码后的多声道信号124在输出104处产生耳机输出。多声道解码器102根据比特流输入126处的比特流输入得到解码后的多声道124，例如通过空间音频解码来得到。在解码之后，由方向滤波器110组成的方向滤波器对对解码后的多声道信号124的每个信号或声道进行滤波。例如，方向滤波器20DirFilter(1，L)和DirFilter(1，R)对解码后的多声道信号124的第一(上)声道进行滤波，方向滤波器DirFilter(2，L)和DirFilter(2，R)对声道第二(从顶部起第二个)信号或声道进行滤波，等等。这些滤波器110可以对从房间内虚拟声源到收听者耳道的声传输(所谓的双耳房间传递函数(BRTF))进行建模。这些滤波器110可以执行时间、声级和谱修改，并且还可以部分地对房间反射和回响进行建模。可以在时域或频域实现方向滤波器110。由于可能需要许多个(N×2，其中N是解码声道的个数)滤波器110，所以如果这些方向滤波器应当对房间反射和回响完整地建模，则这些方向滤波器可以相当长，即，在44.1kHz下20000个滤波器抽头，在这种情况下滤波过程需要非常大的计算量。有利地将方向滤波器110减至最小，所谓的头部相关传递函数(HRTF)和公共处理模块122用于对房间反射和回响进行建模。房间处理模块122可以在时域或频域实现回响算法，并且可以根据一个或两个声道输入信号48进行操作，所述一个或两个声道输入信号48是通过混频器120内的混频矩阵根据解码后的多声道输入信号124来计算的。房间处理模块实现房间反射和/或回响。房间反射和回响对于定位声音来说是重要的，尤其是在距离和外化(意味着在收听者头部的外部感知到声音)方面。

典型地，产生多声道声音，使得主要声音能量包含在前声道中，即，左前、右前、中心。电影对白和音乐中的话音典型地被混频到中心声道。如果中心声道信号被馈送至房间处理模块122，则通常将合成的输出不自然地感知为回响和频谱上不等。因此，根据图7的实施例，将中心声道以显著的声级降低(如，衰减了6dB)馈送至房间处理模块122，如上所述，所述声级降低是在混频器120内执行的。到目前为止，图7的实施例包括根据图3和5的配置，其中图7的附图标记102、124、120和122分别对应于图3和5中的附图标记18、64；附图标记66和68的组合；附图标记66；和附图标记44。

图8示出了根据另一实施例的另一双耳输出信号发生器。该发生器总体上由附图标记140来表示。为了易于描述图8，使用了与图7中的附图标记相同的附图标记。为了表明混频器120并不必须具有如图3、5和7的实施例中指示的功能(即，执行关于中心声道的声级降低)，使用附图标记40’来分别表示方框102、120和122的布置。换言之，混频器122内的声级降低在图8的情况下是可选的。然而与图7不同，分别在每对方向滤波器110与针对解码后多声道信号124的相关声道的解码器102的输出之间连接去相关器。用附图标记142₁、142₂、等等来表示去相关器。去相关器142₁、142₂用作图1所示的相关减小器12。仅如图8所示，但是不必为解码后的多声道信号124的每个声道提供去相关器142₁、142₂。而是，一个去相关性就足以。去相关器142可以简单地是延迟。优选地，每个延迟142₁-142₄所引起的延迟量可以互不相同。另一种可能是，去相关器142₁-142₄还可以是全通滤波器，即，具有传递函数的滤波器，其中该传递函数的幅度恒定为1，但相应声道谱分量的相位变化。优选地去相关器142₁-142₄所引起的相位修改针对每个声道而不同。当然也可以存在其他情况。例如，去相关器142₁-142₄可以被实现为FIR滤波器等等。

因此，根据图8的实施例，元件142₁-142₄、110、112和114根据图1的设备10来操作。

类似于图8，图9示出了图7的双耳输出信号发生器的变体。因此，还使用与图7所用附图标记相同的附图标记来说明图9。与图8的实施例相类似，混频器122的声级降低仅在图9的情况下是可选的，因此图9中的附图标记是40’，而不是像图7中一样是’40。图9的实施例解决了在多声道声音产生过程中所有声道之间存在显著相关性的问题。在利用方向滤波器110处理了多声道信号之后，加法器122和144对每个滤波器对的二声道中间信号进行求和，以在输出104处形成耳机输出信号。加法器112和114对相关的输出信号进行求和导致输出104处的输出信号的空间宽度极大减小并且缺乏外化。这对于解码后的多声道信号124内左右信号和中心声道的相关性而言是尤为成问题的。根据图9的实施例，方向滤波器被配置为尽可能具有去相关的输出。为此，图9的设备包括设备30，所述设备30用于根据某一原始HRTF集合来形成要由方向滤波器110使用的彼此间相关性减小HRTF集合。如上所述，关于与解码后多声道信号124的一个或多个声道相关联的方向滤波器对的HRTF，设备30可以使用以下技术之一或以下技术的组合：

例如通过对滤波器的脉冲响应进行移位(例如通过对滤波器抽头进行移位)，对方向滤波器或相应的方向滤波器对进行延迟；

修改相应方向滤波器的相位响应；以及

对相应声道的相应方向滤波器应用诸如全通滤波器之类的去相关滤波器。这样的全通滤波器可以被实现为FIR滤波器。

如上所述，设备30可以响应于在比特流输入126处的比特流所针对的扬声器配置的改变来工作。

图7至9的实施例关注于解码后的多声道信号。以下实施例涉及麦克风的参数多声道解码。

总体来说，空间音频解码是一种多声道压缩技术，该技术采用多声道音频信号中的感知性声道间不相关性来实现更高的压缩率。可以在空间提示或空间参数(即，对多声道音频信号的空间图像加以描述的参数)方面实现这一点。空间提示典型地包括声级/强度差、相位差以及声道之间相关性/相关性的度量，并且可以以非常紧凑的方式来表示。空间音频编码的构思已被产生MPEG环绕标准(即，ISO/IEC23003-1)的MPEG所采用。空间参数(如，空间音频编码中采用的空间参数)还可以用于描述方向滤波器。通过这么做，可以将解码空间音频数据与应用方向滤波器的步骤相组合，以高效地解码并呈现用于耳机再现的多声道音频。

图10中给出了针对耳机输出的空间音频解码器的一般结构。图10的解码器一般用附图标记200来表示，并且包括双耳空间子频带修改器202，所述双耳空间子频带修改器202包括：针对立体声或单声道下混频信号204的输入、针对空间参数206的另一输入、以及针对双耳输出信号208的输出。下混频信号与空间参数206一起构成前述多声道信号18，并且表示所述多声道信号18的多个声道。

内部地，子频带修改器202包括以上述顺序连接在下混频信号输入与子频带修改器202的输出之间的分析滤波器组208、矩阵化单元或线性组合器210、以及合成滤波器组212。此外，子频带修改器202包括参数转换器214，由空间参数206和如设备30所得到的修改后的HRTF集合来馈送该参数转换器214。

在图10中，假定下混频信号之前已被解码，包括例如熵编码。为双耳空间音频解码器馈送下混频信号204。参数转换器214使用空间参数206以及以修改后HRTF参数216的形式对方向滤波器的参数描述，来形成双耳参数218。矩阵化单元210以2×2矩阵(在立体声下混频信号的情况下)以及1×2矩阵(在单声道下混频信号204的情况下)的形式在频域将这些参数218应用于分析滤波器组208(参见图6)所输出的谱值88。换言之，双耳参数218在图6所示的时间/频率参数分辨率92方面变化，并且应用于每个采样值88。可以使用内插分别将矩阵系数和双耳参数218从较粗略的时间/频率参数域92平滑到分析滤波器组208的时间/频率分辨率。即，在立体声下混频204的情况下，单元210执行的矩阵化针对由下混频信号204的左声道的采样值与下混频信号204的右声道的相应采样值组成的每一个采样值对，产生两个采样值。产生的两个采样值分别是双耳输出信号208的左声道和右声道的一部分。在单声道下混频信号204的情况下，单元210执行的矩阵化针对由单声道下混频信号204每个采样值，产生两个采样值，即，一个采样值针对双耳输出信号208的左声道，另一个采样值针对双耳输出信号208的右声道。双耳参数218限定了从下混频信号204的一个或两个采样值到双耳输出信号208的相应左声道采样值和右声道采样值的矩阵运算。双耳参数218已经反映了修改后的HRTF参数。因此，双耳参数218如上所述将多声道信号18的输入声道去相关。

因此，矩阵化单元210的输出是如图6所示的修改后的谱图。合成滤波器组212根据该修改后的光谱图来重构双耳输出信号208。换言之，合成滤波器组212将矩阵化单元210产生的二声道信号输出转换到时域。当然，这是可选的。

在图10的情况下，不分别处理房间反射和回响效应。如果有的话，必须在HRTF216中考虑这些效应。图11示出了将双耳空间音频解码器200’与单独的房间反射/回响处理相结合的双耳输出信号发生器。图11中的附图标记200’表示图11的双耳空间音频解码器200’可以使用修改后的HRTF，即，如图2所示的原始HRTF。然而可选地，图11的双耳空间音频解码器200’可以是图10所示的双耳空间音频解码器。在任何情况下，除了双耳空间解码器200’以外，图11中通常以附图标记230来表示的双耳输出信号发生器都还包括下混频音频解码器232、修改后的空间音频子频带修改器234、房间处理器122以及两个加法器116和118。下混频音频解码器232连接在比特流输入126与双耳空间解码器200’的双耳空间音频子频带修改器202之间。下混频音频解码器232被配置为对输入126处的比特流输入进行解码，以得到下混频信号214和空间参数206。除了空间参数206以外，还向双耳空间音频子频带修改器202以及修改后的空间音频子频带修改器234提供下混频信号204。修改后的空间音频子频带修改器234利用空间参数206以及修改后的参数236根据下混频信号204来计算用作房间处理器122的输入的单声道或立体声下混频48，其中所述修改后的参数236反映了上述中心声道的声级降低量。加法器116和118逐个声道地对双耳空间音频子频带修改器202和房间处理器122的贡献输出进行求和，以在输出238处产生双耳输出信号。

图12示出了图11的双耳解码器200’的功能的框图。应注意，图12没有示出图11的双耳空间解码器200’的实际内部结构，而是示出了双耳空间解码器200’得到的信号修改。已经提到过，双耳空间解码器200’的内部结构通常符合图10所示的结构，与图10所示结构的区别在于，当双耳空间解码器200’以原始HRTF来工作时，可以省略设备30。此外，图12示例性地针对双耳空间解码器200’使用由多声道信号18表示的仅三个声道以形成双耳输出信号208的情况，示出了双耳空间解码器200’的功能。具体地，“2至3”即，TTT盒(box)用于从立体声下混频204的两个声道中得到中心声道242、右声道244和左声道246。换言之，图12示例性地假定下混频204是立体声混频。TTT盒248所使用的空间参数206包括上述声道预测系数。图12中由延迟L、延迟R和延迟C来表示的三个去相关器实现了相关性减小。这三个去相关器与例如图1和7的情况下引入的去相关相对应。然而，同样已经提到过，尽管实际结构与图10所示的相对应，但图12仅示出了由双耳空间解码器200’实现的信号修改。因此，尽管相对于形成方向滤波器14的HRTF，将形成相关性减小器12的延迟示为单独的特征，然而相关性减小器12中延迟的存在可以被看作是HRTF参数的修改，其中这些HRTF参数形成图12的方向滤波器14的原始HRTF。首先，图12仅示出了双耳空间解码器200’针对耳机再现将声道去相关。通过简单的方式，即，通过在矩阵M和双耳空间解码器200’的参数处理中添加延迟模块，实现了去相关。因此，双耳空间解码器200’可以对单独的声道应用以下修改，即：

优选地将中心声道延迟至少一个采样，

在每个频带中以不同的间隔来延迟中心声道，

优选地左声道和右声道延迟至少一个采样，和/或

在每个频带中以不同的间隔来延迟左声道和右声道。

图13示出了图11的修改后的空间音频子频带修改器的结构的示例。图13的子频带修改器234包括2至3或TTT盒262、加权级264a-264e、第一加法器266a和266b、第二加法器268a和268b、针对立体声下混频204的输入、针对空间参数206的输入、针对残差信号270的另一输入、以及针对下混频48的输出，其中下混频48由房间处理器来处理，根据图13，下混频48是立体声信号。

图13在结构上限定了修改后的空间音频子频带修改器234的实施例，图13的TTT盒262仅通过使用空间参数206根据立体声下混频204来重构中心声道、右声道244和左声道246。同样已经提到过，在图12的情况下，实际上并不计算声道242-246。相反，双耳空间音频子频带修改器修改矩阵M，使得将立体声下混频信号204直接转变成反映HRTF的双耳贡献。然而，图13的TTT盒206实际上执行重构。可选地，如图13所示，当基于立体声下混频204和空间参数206来重构声道242-246时，TTT盒262可以使用反映预测残差的残差信号270，如上所述，残差信号包括声道预测系数以及可选地ICC值。第一加法器266a被配置为将声道242-246相加，以形成立体声下混频48的左声道。具体地，加法器266a和266b形成加权和，其中加权值由加权级264a、264b、264c和264e来限定，加权级264a、264b、264c和264e可以对相应的声道246至242应用相应的加权值EQ^LL、EQ^RL和EQ^CL。类似地，加法器268a和268b形成声道246至242的加权和，其中加权级264b、264d和264e形成加权值，加权和形成立体声下混频48的右声道。

如上所述，选择加权级264a-264e的参数270，使得实现立体声下混频48中的上述中心声道声级降低，从而如上所述产生关于自然声音感知的优点。

因此，换言之，图13示出了可以与图12的双耳空间解码器200’相结合应用的房间处理模块。在图13中，下混频信号204用于馈送该模块。下混频信号204包含多声道信号的所有信号，以能够提供立体声加兼容性。如上所述，希望为房间处理模块馈送仅包含减小的中心信号在内的信号。图13的修改后的空间音频子频带修改器用于执行这种声级降低。具体地，根据图13，可以使用残差信号270，以重构中心、左和右声道242-246。中心、左和右声道242-246的残差信号可以由下混频音频解码器232来解码，尽管图11中未示出。可以针对左、右和中心声道242-246将加权级264a-264e所应用的EQ参数和加权值实值化。可以存储和应用针对中心声道242的单个参数集合，根据图13，示例性地将中心声道相等地混频到立体声下混频48的左和右输出。

馈送到修改后的空间音频子频带修改器234中的EQ参数270可以具有以下特性。首先，优选地可以使中心声道信号衰减至少6dB。此外，中心声道信号可以具有低通特性。此外，可以在低频下提高其余声道的差信号。为了补偿中心声道242相对于其他声道244和246而言较低的电平，应当相应地增大在双耳空间音频子频带修改器202中使用的针对中心声道的HRTF参数的增益。

设定EQ参数的主要目的是减小在用于房间处理模块的输出中的中心声道信号。然而，仅应将中心声道抑制到有限程度：在TTT盒内从左下混频声道和右下混频声道减去中心声道信号。如果降低了中心声级，则左和右声道中的伪迹可以变得可听。因此，EQ级中的中心声级降低是在抑制与伪迹之间的折衷。能够寻求对EQ参数的固定设定，但这并不是对所有信号而言都是最优的。相应地，根据实施例，可以使用自适应算法或模块274利用以下参数之一或以下参数的组合来控制中心声级降低的量：

可以如虚线276所指示的来使用空间参数206，其中空间参数206用于在TTT盒262内根据左和右下混频声道204来解码中心声道242。

还可以如虚线278所指示的来使用中心声道、左声道和右声道的声级。

还可以如虚线278所指示的来使用中心声道、左声道和右声道242-246之间的声级差。

还可以如虚线278所指示的来使用单一类型检测算法的输出，如，话音活动性检测器。

最后，如虚线280所指示的，可以使用对音频内容加以描述的动态元数据的静态，以确定中心声级降低的量。

尽管在设备的上下文中描述了一些方面，然而应清楚，这些方面还展现了相应方法的描述，其中模块或设备与方法步骤或方法步骤的特征相对应。类似地，在方法步骤的上下文中描述的方面也展现了对相应设备的相应模块或项目或特征的描述，如，ASIC的一部分、程序代码的子例程、或已编程的可编程逻辑的一部分。

本发明的已编码音频信号可以存储在数字存储介质上，或者可以在诸如无线传输介质或有线传输介质(如，互联网)之类的传输介质上传输。

根据特定的实现需求，可以以硬件或软件的形式来实现本发明。可以使用数字存储介质(例如，软盘、DVD、CD、ROM、PROM、EPROM、EEPROM或闪存)来执行这些实现，其中所述数字存储介质上存储有电可读控制信号，所述电可读控制信号与可编程计算机***协作(或能够与可编程计算机***协作)，使得执行相应的方法。

根据本发明的一些实施例包括一种数据载体，所述数据载体具有电可读控制信号，所述电可读控制信号能够与可编程计算机***协作，使得执行本文描述的方法之一。

通常，可以将本发明的实施例实现为具有程序代码的计算机程序产品，所述程序代码操作用于在所述计算机程序产品在计算机上运行时执行方法之一。所述程序代码可以例如存储在机器可读载体上。

其他实施例包括存储在机器可读载体上的、用于执行本文描述的方法之一的计算机程序。

因此换言之，本发明方法的实施例是一种具有程序代码的计算机程序，所述程序代码用于当所述计算机程序在计算机上运行时执行本文描述的方法之一。

因此，本发明方法的另一实施例是一种数据载体(或数据存储介质、或计算机可读介质)，包括存储在该数据载体上的计算机程序，所述计算机程序用于执行本文描述的方法之一。

因此，本发明方法的另一实施例是一种数据流或信号序列，所述数据流或信号序列表示用于执行本文描述的方法之一的计算机程序。所述数据流或信号序列可以例如被配置为经由数据通信连接来传递，例如经由互联网来传递。

另一实施例包括一种处理装置，例如计算机或可编程逻辑器件，所述处理装置被配置为适于执行本文描述的方法之一。

另一实施例包括一种计算机，在所述计算机上安装有用于执行本文描述的方法之一的计算机程序。

在一些实施例中，可以使用一种可编程逻辑器件(例如，现场可编程门阵列)来执行本文描述的方法的一些或全部功能。在一些实施例中，现场可编程门阵列可以与微处理器协作，以执行本发明描述的方法之一。通常，方法优选地由任何硬件设备来执行。

上述实施例仅仅用于说明本发明的原理。应理解，对于本领域技术人员来说，对本文描述的布置和细节的修改和改变是显而易见的。因此，本发明仅由所附权利要求的范围来限定，而不由本文中通过描述和说明实施例而提供的特定细节来限定。

Claims

1.一种用于基于多声道信号来产生双耳信号的与房间反射/回响有关的贡献的设备，所述多声道信号表示多个声道并且用于由扬声器配置来再现，所述扬声器配置具有与每个声道相关联的虚拟声源位置，所述设备包括：

下混频发生器，用于形成多声道信号的声道的单声道或立体声下混频；以及

房间处理器，用于基于单声道或立体声下混频通过对房间反射/回响进行建模，来产生双耳信号的与房间反射/回响有关的贡献，

其中，下混频发生器被配置为形成单声道或立体声下混频，使得所述多个声道以在多声道信号的至少两个声道之间不同的声级，对单声道或立体声下混频作出贡献，

其中，下混频发生器被配置为形成单声道或立体声下混频，使得所述多个声道中的中心声道相对于多声道信号的其他声道而言以声级降低的方式来对单声道或立体声下混频作出贡献，

其中，下混频发生器被配置为通过空间音频编码，根据下混频信号以及对所述多个声道之间的声级差、相位差、时间差和/或相关性度量加以描述的关联空间参数，来重构所述多个声道。

2.根据权利要求1所述的设备，其中，下混频发生器被配置为执行所述形成，使得至少两个声道中的第一声道相对于该至少两个声道中的第二声道而言，声级降低的量取决于空间参数。

3.根据权利要求1所述的设备，其中，下混频发生器被配置为通过空间音频编码，根据立体声下混频信号、声道预测系数和残差信号(270)，来重构所述多个声道，其中所述声道预测系数描述如何将立体声下混频信号的声道线性地组合以预测中心声道、左声道和右声道构成的三元组，所述残差信号(270)反映了预测三元组时的预测残差。

4.一种用于基于多声道信号来产生双耳信号的与房间反射/回响有关的贡献的设备，所述多声道信号表示多个声道并且用于由扬声器配置来再现，所述扬声器配置具有与每个声道相关联的虚拟声源位置，所述设备包括：

其中，下混频发生器被配置为执行所述形成，使得至少两个声道中的第一声道相对于该至少两个声道中的第二声道而言，声级降低的量取决于所述多个声道的各个单独声道之间的声级差和/或相关性。

5.根据权利要求4所述的设备，其中，下混频发生器被配置为基于与下混频信号一起表示所述多个声道的空间参数，来获得所述多个声道的各个单独声道之间的声级差和/或相关性。

6.一种用于基于多声道信号来产生双耳信号的与房间反射/回响有关的贡献的设备，所述多声道信号表示多个声道并且用于由扬声器配置来再现，所述扬声器配置具有与每个声道相关联的虚拟声源位置，所述设备包括：

其中，下混频发生器被配置为形成单声道或立体声下混频，使得所述多个声道中的中心声道相对于多声道信号的其他声道而言以声级降低的方式来对单声道或立体声下混频作出贡献

其中，下混频发生器被配置为执行所述形成，使得至少两个声道中的第一声道相对于该至少两个声道中的第二声道而言，声级降低的量随时间变化，如在多声道信号的辅助信息内传输的时间变化指示符所指示的一样。

7.一种用于基于多声道信号来产生双耳信号的与房间反射/回响有关的贡献的设备，所述多声道信号表示多个声道并且用于由扬声器配置来再现，所述扬声器配置具有与每个声道相关联的虚拟声源位置，所述设备包括：

所述设备还包括：

信号类型检测器，用于检测多声道信号内的语音阶段和非语音阶段，其中，下混频发生器被配置为执行所述形成，使得与在非语音阶段期间相比，在语音阶段期间声级降低的量更高。

8.一种用于基于多声道信号来产生双耳信号的与房间反射/回响有关的贡献的方法，所述多声道信号表示多个声道并且用于由扬声器配置来再现，所述扬声器配置具有与每个声道相关联的虚拟声源位置，所述方法包括：

形成多声道信号的声道的单声道或立体声下混频；以及

基于单声道或立体声下混频通过对房间反射/回响进行建模，来产生双耳信号的与房间反射/回响有关的贡献，

其中，执行形成单声道或立体声下混频，使得所述多个声道中的中心声道相对于多声道信号的其他声道而言，以声级降低的方式来对单声道或立体声下混频作出贡献，

其中所述方法还包括分别向方向滤波器的输出的混频添加与房间反射/回响有关的贡献中的左声道贡献，从而对向收听者左耳道的声音传输进行建模，并向方向滤波器的输出的混频添加与房间反射/回响有关的贡献中的右声道贡献，从而对向收听者右耳道的声音传输进行建模。

9.一种用于基于多声道信号来产生双耳信号的与房间反射/回响有关的贡献的设备，所述多声道信号表示多个声道并且用于由扬声器配置来再现，所述扬声器配置具有与每个声道相关联的虚拟声源位置，所述设备包括：

其中，下混频发生器被配置为通过空间音频编码，根据下混频信号以及对所述多个声道之间的声级差、相位差、时间差和/或相关性度量加以描述的关联空间参数，来重构所述多个声道；以及

其中，下混频发生器被配置为形成单声道或立体声下混频，使得所述多个声道中的中心声道相对于多声道信号的其他声道而言，以声级降低的方式来对单声道或立体声下混频作出贡献，

其中所述设备配置为分别向方向滤波器的输出的混频添加与房间反射/回响有关的贡献中的左声道贡献，从而对向收听者左耳道的声音传输进行建模，并向方向滤波器的输出的混频添加与房间反射/回响有关的贡献中的右声道贡献，从而对向收听者右耳道的声音传输进行建模。

10.一种用于基于多声道信号来产生双耳信号的与房间反射/回响有关的贡献的设备，所述多声道信号表示多个声道并且用于由扬声器配置来再现，所述扬声器配置具有与每个声道相关联的虚拟声源位置，所述设备包括：

其中，下混频发生器被配置为执行所述形成，使得至少两个声道中的第一声道相对于该至少两个声道中的第二声道而言，声级降低的量取决于空间参数。

11.一种用于基于多声道信号来产生双耳信号的与房间反射/回响有关的贡献的方法，所述多声道信号表示多个声道并且用于由扬声器配置来再现，所述扬声器配置具有与每个声道相关联的虚拟声源位置，所述方法包括：

形成多声道信号的声道的单声道或立体声下混频；以及

其中，所述方法还包括：通过空间音频编码，根据下混频信号以及对所述多个声道之间的声级差、相位差、时间差和/或相关性度量加以描述的关联空间参数，来重构所述多个声道；以及

其中，执行所述形成，使得至少两个声道中的第一声道相对于该至少两个声道中的第二声道而言，声级降低的量取决于空间参数。

12.一种用于基于多声道信号来产生双耳信号的与房间反射/回响有关的贡献的设备，所述多声道信号表示多个声道并且用于由扬声器配置来再现，所述扬声器配置具有与每个声道相关联的虚拟声源位置，所述设备包括：

其中，下混频发生器被配置为执行所述形成，使得至少两个声道中的第一声道相对于该至少两个声道中的第二声道而言，声级降低的量取决于所述多个声道的各个单独声道之间的声级差和/或相关性，

或者使得至少两个声道中的第一声道相对于该至少两个声道中的第二声道而言，声级降低的量随时间变化，如在多声道信号的辅助信息内传输的时间变化指示符所指示的一样。

13.一种用于基于多声道信号来产生双耳信号的与房间反射/回响有关的贡献的方法，所述多声道信号表示多个声道并且用于由扬声器配置来再现，所述扬声器配置具有与每个声道相关联的虚拟声源位置，所述方法包括：

形成多声道信号的声道的单声道或立体声下混频；以及

其中，执行所述形成，使得至少两个声道中的第一声道相对于该至少两个声道中的第二声道而言，声级降低的量取决于所述多个声道的各个单独声道之间的声级差和/或相关性，

14.一种用于基于多声道信号来产生双耳信号的与房间反射/回响有关的贡献的设备，所述多声道信号表示多个声道并且用于由扬声器配置来再现，所述扬声器配置具有与每个声道相关联的虚拟声源位置，所述设备包括：

其中，所述设备还包括：

15.一种用于基于多声道信号来产生双耳信号的与房间反射/回响有关的贡献的方法，所述多声道信号表示多个声道并且用于由扬声器配置来再现，所述扬声器配置具有与每个声道相关联的虚拟声源位置，所述方法包括：

形成多声道信号的声道的单声道或立体声下混频；以及

其中，所述方法还包括：

检测多声道信号内的语音阶段和非语音阶段，其中，执行形成，使得与在非语音阶段期间相比，在语音阶段期间声级降低的量更高。