CN105409247B

CN105409247B - 用于音频信号处理的多声道直接-周围分解的装置及方法

Info

Publication number: CN105409247B
Application number: CN201380076335.5A
Authority: CN
Inventors: 克里斯蒂安·乌勒; 埃马努埃尔·哈贝茨; 帕特里克·甘普; 米夏埃尔·克拉茨
Original assignee: Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Current assignee: Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Priority date: 2013-03-05
Filing date: 2013-10-23
Publication date: 2020-12-29
Anticipated expiration: 2033-10-23
Also published as: US10395660B2; JP2016513814A; AR095026A1; SG11201507066PA; JP6385376B2; US20150380002A1; TW201444383A; KR20150132223A; BR112015021520A2; TWI639347B; CA2903900A1; MY179136A; WO2014135235A1; AU2013380608A1; JP2018036666A; RU2015141871A; PL2965540T3; CA2903900C; AU2013380608B2; EP2965540A1

Abstract

提供一种用于根据两个或更多个音频输入声道信号生成一个或多个音频输出声道信号的装置。两个或更多个音频输入声道信号中的每个包含直接信号部分及周围信号部分。该装置包含用于通过估计第一功率谱密度信息并通过估计第二功率谱密度信息来确定滤波器的滤波器确定单元(110)。此外，该装置包含用于通过将该滤波器应用于两个或更多个音频输入声道信号来生成一个或多个音频输出声道信号的信号处理器(120)。第一功率谱密度信息指示关于两个或更多个音频输入声道信号的功率谱密度信息，并且第二功率谱密度信息指示关于两个或更多个音频输入声道信号的周围信号部分的功率谱密度信息。或者，第一功率谱密度信息指示关于两个或更多个音频输入声道信号的功率谱密度信息，并且第二功率谱密度信息指示关于两个或更多个音频输入声道信号的直接信号部分的功率谱密度信息。或者，第一功率谱密度信息指示关于两个或更多个音频输入声道信号的直接信号部分的功率谱密度信息，并且第二功率谱密度信息指示关于两个或更多个音频输入声道信号的周围信号部分的功率谱密度信息。

Description

用于音频信号处理的多声道直接-周围分解的装置及方法

技术领域

本发明涉及用于音频信号处理的多声道直接-周围分解的装置及方法。

背景技术

音频信号处理变成愈来愈重要。在此领域中，将声音信号分离成直接声音信号及周围声音信号起到重要作用。

一般而言，声音由直接声与周围(或漫射)声的混合物组成。直接声由音源发出，例如乐器、歌手或扬声器，并且以最短可能路径到达接收器，例如收听者的耳道口或麦克风。

当收听直接声时感知为来自音源方向。用于定位及用于其它空间声音特性的相关听觉线索为双耳间电平差、双耳间时差及双耳间同调(interaural coherence)。造成相同的双耳间电平差及双耳间时差的直接声波被感知为来自相同方向。在无漫射声存在的情况下，到达左耳及右耳或任何其它多种传感器的信号为同调。

相反地，周围声由许多间隔音源或声音反射边界发出促成相同周围声。当声波到达室内壁面时，其部分被反射，并且在室内的全部反射的迭置(又称混迭)是周围声的杰作。其它实施例为听众声(例如掌声)、环境声(例如雨声)、及其它背景声(例如嘈杂人声)。周围声感知为漫射性，无法定位，并且由收听者造成包封印象(“浸没于声音内”)。当使用多个间隔传感器捕捉周围声场时，记录的信号至少部分为非同调。

声音后现及再现的各项应用可从音频信号分解成直接信号成分及周围信号成分获益。此种信号处理的主要挑战是针对任意数的输入声道信号及针对全部可能的输入信号特性，达成高度分离同时维持高音质。直接-周围分解(DAD)亦即音频信号分解成直接信号成分及周围信号成分许可信号成分的分开再现或修正，例如是音频信号的上混所期望的。

术语上混是指给定具有N声道的输入信号，产生具有P声道的信号的过程，其中，P>N。其主要应用在使用具有比较输入信号中可用的声道更多声道的环绕声设置以再现音频信号。通过使用改进信号处理算法再现内容，使收听者能够使用该多声道声音再现设置的全部可用声道。此种处理可将输入信号分解成有意义的信号成分(例如基于在立体影像中觉察的位置、直接声相较于周围声、单一乐器)或分解成此等信号成分衰减或加强的信号。

两个上混构思是广为人知的。

1.经引导上混：具有额外信息引导上混过程的上混。额外信息可以特定方式“编码”于该输入信号或可另行存储。

2.未经引导上混：没有任何额外信息，输出信号排它地得自音频输入信号。

就直接信号及周围信号的定位而言，改进上混法可进一步分类。可区分为“直接/周围法”及“频带内”办法。以直接/周围为基础的技术的核心成分是提取周围信号(其馈至例如多声道环绕声设置的后方声道或高度声道)。利用后方声道或高度声道再现周围信号引起收听者的包封印象(“浸没于声音内”)。此外，根据直接音源在立体全景中的觉察位置，直接音源可分散在前方声道。相反地，“频带内”办法针对将全部声音(直接声及周围声)使用全部可用的扬声器环绕该收听者定位。

将音频信号分解成直接信号及周围信号也许可例如通过缩放或滤波而分开修正周围声或直接声。一项使用情况是已经使用过高量周围声记录的音乐表演记录处理。另一项使用情况是制造音频(例如用于电影声音或音乐)，其中，在不同位置记录的及因而具有不同周围声特性的音频信号被组合。

在任何情况下，此种信号处理的要求针对任意数目的输入声道信号及针对全部可能的输入信号特性达成高度分离同时维持高音质。

先前技术针对DAD或衰减或增强直接信号成分或周围信号成分曾经提出多个办法，简短综述如下。

已知的构思系涉及语音信号的处理，目标针对从麦克风记录中去除非期望的背景噪声。

衰减来自具有两个输入声道的语音记录的混响的方法描述于[1]中。通过衰减输入信号中的不相关(或漫射)信号成分可减少混响信号成分。处理时在时频域中实现，使得子带信号系利用频谱加权法处理。实数值加权因子使用功率谱密度(PSD)计算

φ_xx(m，k)＝E{X(m，k)X^*(m，k)} (1)

φ_yy(m，k)＝E{Y(m，k)Y^*(m，k)} (2)

φ_xy(m，k)＝E{X(m，k)Y^*(m，k)} (3)

其中，X(m,k)及Y(m,k)表示时域输入信号x_t[n]及y_t[n]的时频域表示型态，E{·}为预期运算，并且X*为X的复共轭。

原作者指出当与φ_xy(m,k)成正比时，例如当使用权值等于标准化交叉相关函数(或同调函数)时，不同的频谱加权函数为可行。

根据相似的理论基础，[2]描述的方法使用频谱加权(具有在频带计算的从标准化交叉相关函数获得的权重)来提取周围信号，参考式(4)(或原作者用词“声道间短时间同调函数”)。比较[1]的差异为替代衰减漫射件号成分，直接信号成分使用(1-ρ(m,k))的单调稳定函数的该等频谱权重来衰减。

使用多声道Wiener滤波，分解应用于具有二声道之输入信号的之上混应用已经描述于[3]。处理在时频域完成。输入信号系经模型化为周围信号与一个活性直接音源(每个频带)的混合物，其中，一个声道的直接信号限于为第二声道中的直接信号成分的缩放拷贝，亦即幅值筛选(panning)。筛选系数及直接信号及周围信号的功率使用标准化交叉相关及二声道的输入信号功率估计。直接输出信号及周围输出信号系从输入信号与实数值加权系数的组合得出。施加额外后缩放使得输出信号的功率等于估计量。

[4]中描述的方法根据周围功率估值而使用频谱加权提取周围信号。周围功率为估值，根据的假设包括二声道的直接信号成分为全然相关，周围声道信号彼此及与直接信号不相关，及二声道的周围功率为相等。

用于根据指向性音频编码(DirAC)的立体声信号的上混方法描述于[5]。DirAC针对到达方向、漫射性及一声场频谱的分析及再现。为了立体声输入信号的上混，仿真输入信号的无回声B-格式记录。

使用适应性滤波算法从立体声音提取不相关混迭的方法，旨在利用最小均方(LMS)算法，使用其它声道信号预测一个声道信号中的直接信号成分描述于[6]。接着从输入信号中减去估计得的直接信号而得到周围信号。本办法的理论基础为预测只针对相关信号有用，预测误差类似不相关信号。基于LMS原理的各种适应性滤波算法存在并且可行，例如LMS或标准化LMS(NLMS)算法。

针对具有多于两个声道的输入信号的分解，一种方法描述于[7]，其中，多声道信号首先下混以获得2-声道立体声信号，并且随后应用[3]中呈示的用于处理立体声输入信号的方法。

针对单声道信号的处理，[8]描述的方法使用频谱加权提取周围信号，其中，频谱权重使用特征提取及监督学习计算。

另一种针对上混应用从单声道记录提取周围信号的方法从该输入信号的时频域表示与其压缩版本间的差获得时频域表示，较佳地使用非负矩阵因式分解来计算[9]。

已经产生混迭信号的混迭***的幅值转移函数的估计，提取与改变音频信号中的混迭信号成分的方法描述于[10]。信号成分的频域表示的幅值的估计利用递归过滤获得且可经修正。

发明内容

本发明的目的是提供用于音频信号处理的多声道直接-周围分解的改良构思。本发明的目的通过如权利要求1所述的装置、通过权利要求14所述的方法、及通过权利要求15所述的计算机程序加以解决。

提出一种用于根据两个或更多个音频输入声道信号生成一个或多个音频输出声道信号的装置。两个或更多个音频输入声道信号的每一个包含直接信号部分及周围信号部分。该装置包含用于通过估计第一功率谱密度信息及通过估计第二功率谱密度信息而确定一滤波器的滤波器确定单元。此外，该装置包含用于通过将该滤波器应用于两个或更多个音频输入声道信号来生成一个或多个音频输出声道信号的信号处理器。第一功率谱密度信息指示关于两个或更多个音频输入声道信号的功率谱密度信息，并且第二功率谱密度信息指示关于两个或更多个音频输入声道信号的周围信号部分的功率谱密度信息。或者第一功率谱密度信息指示关于两个或更多个音频输入声道信号的功率谱密度信息，并且第二功率谱密度信息指示关于两个或更多个音频输入声道信号的直接信号部分的功率谱密度信息。或者第一功率谱密度信息指示关于两个或更多个音频输入声道信号的直接信号部分的功率谱密度信息，并且第二功率谱密度信息指示关于两个或更多个音频输入声道信号的周围信号部分的功率谱密度信息。

实施例提出用于将音频输入信号分解成直接信号成分及周围信号成分的构思，其可应用于声音后现及再现。此种声音处理的主要挑战是针对任意数目的输入声道信号及针对全部可能的输入信号特性达成高度分离同时维持高音质。所提出的构思基于时频域的多声道信号处理，结果导致就均方差意义上的限制最佳解，及例如经历估计期望信号失真的限制，或残差干涉减少的限制。

提出用于将音频输入信号分解成直接信号成分及周围信号成分的实施例。此外，将提出计算周围信号成分的滤波器的导算，并且此外，描述滤波器的应用实施例。

若干实施例涉及遵照直接/周围办法的未经引导的上混，输入信号具有多于一个声道。

至于所描述分解的设想应用，关注于计算具有与输入信号等数声道的输出信号。针对此项应用，实施例就分离及音质而言提供极佳结果，原因在于其能够因应直接信号在输入声道间有时间延迟的直接信号。与其它构思相反，例如[3]提出的构思，实施例并不假设输入信号中的直接声仅通过缩放筛选(幅值筛选)，同时也在各声道的直接信号间导入差异。

此外，与只能处理有一或二个声道的输入信号的先前技术的全部其它构思相反(参见上文)，实施例能够在具有任意数声道的输入信号上操作。

实施例的其它优点是控制参数的使用、周围PSD矩阵的估计、及滤波器的进一步修正，容后详述。

有些实施例针对全部输入声音物体提供一致的周围声。当输入信号分解成直接及周围声时，有些实施例运用适当音频信号处理调适周围声特性，其它实施例利用人工混响及其它人工周围声来替代周围信号成分。

根据实施例，该装置可进一步包含分析滤波器组，其被配置为将两个或更多个音频输入声道信号从时域变换成时频域。该滤波器确定单元可被配置为根据以时频域表示的音频输入声道信号，通过估计该第一功率谱密度信息及该第二功率谱密度信息来确定该滤波器。该信号处理器可被配置为通过将该滤波器应用于以时频域表示的两个或更多个音频输入声道信号上来生成以时频域表示的一个或多个音频输出声道信号。此外，该装置可进一步包含合成滤波器组，其被配置为将以时频域表示的一个或多个音频输出声道信号从时频域变换成时域。

再者，提出一种根据两个或更多个音频输入声道信号生成一个或多个音频输出声道信号的方法。两个或更多个音频输入声道信号的每一个包含直接信号部分及周围信号部分。该方法包含：

-通过估计第一功率谱密度信息及通过估计第二功率谱密度信息来确定滤波器。以及

-通过将该滤波器应用于两个或更多个音频输入声道信号来生成一个或多个音频输出声道信号。

第一功率谱密度信息指示关于两个或更多个音频输入声道信号的功率谱密度信息，并且第二功率谱密度信息指示关于两个或更多个音频输入声道信号的周围信号部分的功率谱密度信息。或第一功率谱密度信息指示关于两个或更多个音频输入声道信号的功率谱密度信息，并且第二功率谱密度信息指示关于两个或更多个音频输入声道信号的直接信号部分的功率谱密度信息。或第一功率谱密度信息指示关于两个或更多个音频输入声道信号的直接信号部分的功率谱密度信息，并且二功率谱密度信息指示关于两个或更多个音频输入声道信号的周围信号部分的功率谱密度信息。

再者，提出当在计算机或信号处理器上执行时用于实施前述方法的一种计算机程序。

附图说明

下文中，将参考附图更加详细地描述本发明的实施例，其中：

图1示出了根据实施例的根据两个或更多个音频输入声道信号生成一个或多个音频输出声道信号的装置，

图2示出了根据实施例的古典音乐的5-声道记录的分解的输入及输出信号，具有输入信号(左栏)、周围输出信号(中栏)、及直接输出信号(右栏)，

图3描绘了根据实施例的使用周围信号估计及直接信号估计的分解的基本概述，

图4示出了根据实施例的使用直接信号估计的分解的基本概述，

图5示出了根据实施例的使用周围信号估计的分解的基本概述，

图6a示出了另一实施例的装置，其中该装置进一步包含分析滤波器组及合成滤波器组，及

图6b描绘了根据又一实施例的装置，示出了直接信号成分的提取，其中，方块AFB为N个分析滤波器组(每个声道各一个)的集合，并且其中方块SFB为合成滤波器组的集合。

具体实施方式

图1示出了根据实施例的根据两个或更多个音频输入声道信号生成一个或多个音频输出声道信号的装置。两个或更多个音频输入声道信号中的每个包含直接信号部分及周围信号部分。

该装置包含通过估计第一功率谱密度信息及通过估计第二功率谱密度信息来确定一滤波器的滤波器确定单元110。

此外，该装置包含通过将该滤波器应用于两个或更多个音频输入声道信号来生成一个或多个音频输出声道信号的信号处理器120。

第一功率谱密度信息指示关于两个或更多个音频输入声道信号的功率谱密度信息，并且第二功率谱密度信息指示关于两个或更多个音频输入声道信号的周围信号部分上的功率谱密度信息。

或者，第一功率谱密度信息指示关于两个或更多个音频输入声道信号的功率谱密度信息，并且第二功率谱密度信息指示关于两个或更多个音频输入声道信号的直接信号部分的功率谱密度信息。

或者，第一功率谱密度信息指示关于两个或更多个音频输入声道信号的直接信号部分的功率谱密度信息，并且第二功率谱密度信息指示关于两个或更多个音频输入声道信号的周围信号部分的功率谱密度信息。

描述实施例提供将音频输入信号分解成直接信号成分及周围信号成分的构思可应用声音后现及再现。此种信号处理的主要挑战为针对任意数目的输入声道信号及针对全部可能的输入信号特性达成高度分离，同时维持高音质。所提供的实施例基于在时频域内的多声道信号处理，并提供在均方差方面的最佳解，表示估计期望信号的失真有限或残差干涉的减少。

首先，描述本发明的实施例基于其的发明构思。

假设接收N个输入声道信号y_t[n]：

y_t[n]＝[y₁[n]…y_N[n]]^T. (5)

例如，N≥2。所提供的构思的目的是将输入声道信号y₁[n]...y_N[n](＝[y_i[n]]^T)分解成表示为d_t[n]＝[d₁[n]...d_N[n]]^T的N个直接信号成分及/或表示为a_t[n]＝[a₁[n]...a_N[n]]^T的N个周围信号成分。处理可施用于全部输入声道，或输入信号声道被划分成分开处理的声道子集。

根据实施例，直接信号成分d₁[n],...,d_N[n]中之一或多个及/或周围信号成分a₁[n],...,a_N[n]中之一或多个应从两个或更多个输入声道信号y₁[n],...,y_N[n]估计以获得直接信号成分d₁[n],...,d_N[n]及/或周围信号成分a₁[n],...,a_N[n]中的一个或多个估计

作为一个或多个输出声道信号。

针对N＝5，所提供的若干实施例的输出的一实施例描绘于图2。一个或多个音频输出声道信号

通过独立地估计直接信号成分及周围信号成分获得，如图3描绘。可替代地，针对两个信号(d_t[n]或a_t[n]) 中的一个的估值(或)被求出，而另一信号从输入信号减去第一结果获得。图4使出了首先估计直接信号成分d_t[n]，并通过从输入信号减去直接信号推导出周围信号成分a_t [n]的处理。同理，首先推导周围信号成分的估计，如图5的方块图所示。

依据实施例，处理例如可在时频域进行。输入音频信号的时频域表示例如可利用滤波器组(分析滤波器组)获得，例如短时间傅里叶变换(STFT)。

依据图6a示出的实施例，分析滤波器组605将音频输入声道信号y_t[n]从时域变换成时频域。此外，在图6a中，合成滤波器组625将直接信号成分的估计从时频域变换成时域以获得音频输出声道信号

在图6a的实施例中，分析滤波器组605被配置为将两个或更多个音频输入声道信号从时域变换成时频域。滤波器确定单元110被配置为根据以时频域表示的音频输入声道信号，通过估计第一功率谱密度信息及第二功率谱密度信息而确定该滤波器。信号处理器120被配置为通过将该滤波器应用于以时频域表示的两个或更多个音频输入声道信号而生成以时频域表示的一个或多个音频输出声道信号。合成滤波器组625被配置为将以时频域表示的一个或多个音频输出声道信号从时频域变换成时域。

时频域表示包括某个数目的子带信号，其随着时间演进。相邻的子带选择性地可线性组合成较宽的子带信号以减低计算复杂度。输入信号的各个子带分开处理，容后详述。时域输出信号通过应用滤波器组的反处理(亦即合成滤波器组)获得。全部信号皆假设具有零平均值，时频域信号可模型化为复随机变量。

后文中将提供定义及假设。

下列定义用于修订方法的全文说明中：具有N个声道的多声道输入信号的时频域表示给定为

y(m，k)＝[Y₁(m，k)Y₂(m，k)…Y_N(m，k)]^T， (6)

具有时间指数m及子带指数k，k＝1…K，且假设为直接信号成分d(m,k)与周围信号成分a(m,k)的加法混合物，亦即

y(m，k)＝d(m，k)+a(m，k)， (7)

具有

d(m，k)＝[D₁(m，k)D₂(m，k)…D_N(m，k)]^T (8)

a(m，k)＝[A₁(m，k)A₂(m，k)…A_N(m，k)]^T， (9)

其中，D_i(m,k)表示第i个声道的直接成分而A_i(m,k)表示周围成分。

直接-周围分解的目的是估计d(m,k)及a(m,k)。输出信号使用滤波器矩阵H_D(m,k)或H_A(m,k)或二者计算。滤波器矩阵具有N×N的大小且为复数值，或者在若干实施例中，例如可为实数值。直接信号成分及周围信号成分的N声道信号的估值得自

可替代地，可使用仅一个滤波器矩阵，及图4示出的减法分别可表示为

其中，I为N×N大小的身分矩阵，或分别如图5所示。

此处，上标^H表示一矩阵或一向量的共轭转置。滤波器矩阵H_D(m,k)用于计算直接信号

的估值。滤波器矩阵H_A(m,k)用于计算直接信号

的估值。

在前文中，式(10)至(15)，y(m,k)指示两个或更多个音频输入声道信号，

指示音频输入声道信号的周围信号部分的估计，及

指示直接信号部分的估计。

及/或

或

及/或

中的一个或多个向量成分可为一个或多个音频输出声道信号。

式(10)、(11)、(12)、(13)、(14)及(15)中的一个、部分或全部可由图1及图6a的信号处理器120以将图1及图6a的滤波器应用于音频输入声道信号上。图1及图6a的滤波器例如可为H_D(m,k)、H_A(m,k)、

[I-H_D(m,k)]或[I-H_A(m,k)]。但在其它实施例中，由滤波器确定单元110所确定的且由信号处理器120所采用的滤波器可能不是矩阵而为另一种滤波器。举例言之，在其它实施例中，该滤波器可包含定义该滤波器的一个或多个向量。在又一实施例中，该滤波器可包含定义该滤波器的多个系数。

滤波器矩阵从后述信号统计的估值计算。

更具体地，滤波器确定单元110被配置为通过估计第一功率谱密度(PSD)信息及第二PSD信息确定该滤波器。

定义：

其中，E{·}为预期操作数及X*表示X的共轭复数。对于i＝j，获得PSD，及对于i≠j，获得交叉PSD。

y(m,k)、d(m,k)及a(m,k)的协方差矩阵为

Φ_y(m，k)＝E{y(m，k)y^H(m，k)} (17)

Φ_d(m，k)＝E{d(m，k)d^H(m，k)} (18)

Φ_a(m，k)＝E{a(m，k)a^H(m，k)}. (19)

协方差矩阵Φ_y(m,k)、Φ_d(m,k)及Φ_a(m,k)在主对角线上包含针对全部声道的PSD的估值，而非对角线元素为各个声道信号的交叉PSD估值。因此，矩阵Φ_y(m,k)、Φ_d(m,k)及Φ_a(m,k)各自表示功率谱密度信息的估计。

在式(17)至(19)中，Φ_y(m,k)指示关于两个或更多个音频输入声道信号的功率谱密度信息。Φ_d(m,k)指示关于两个或更多个音频输入声道信号的直接信号成分的功率谱密度信息。Φ_a(m,k)指示关于两个或更多个音频输入声道信号的周围信号成分的功率谱密度信息。

式(17)、(18)及(19)的矩阵Φ_y(m,k)、Φ_d(m,k)及Φ_a(m,k)各自可视为功率谱密度信息。但须注意在其它实施例中，第一及第二功率谱密度信息并非矩阵，反而可以任何其它合宜形式表示。举例言之，依据实施例，第一及第二功率谱密度信息可表示为一个或多个向量。在又一实施例中，第一及第二功率谱密度信息可表示为多个系数。

假设

●D_i(m,k)与A_i(m,k)彼此为不相关：

●A_i(m,k)与A_j(m,k)彼此为不相关：

●全部声道中的周围功率相等：

结果保有Φ_y(m，k)＝Φ_d(m，k)+Φ_a(m，k)， (20)

Φ_a(m，k)＝Φ_A(m，k)I_N×N， (21)

由于式(20)的结果，接着当确定矩阵Φ_y(m,k)、Φ_d(m,k)及Φ_a(m,k)中的两个矩阵时，则矩阵中的第三个立即可得。至于又一结果，接着只确定下述即足：

-关于两个或更多个音频输入声道信号上的功率谱密度信息，及关于两个或更多个音频输入声道信号的周围信号部分的功率谱密度信息，或

-两个或更多个音频输入声道信号的功率谱密度信息，及两个或更多个音频输入声道信号的直接信号部分的功率谱密度信息，或

-两个或更多个音频输入声道信号的直接信号部分的功率谱密度信息，及两个或更多个音频输入声道信号的周围信号部分的功率谱密度信息，

原因在于第三功率谱密度信息(尚未经估计)从三种功率谱密度信息的关系变得即刻显然易知，例如通过式(20)或通过三种功率谱密度信息(完整输入信号的PSD、周围成分的PSD、及直接成分的PSD)的关系的任何其它改写，此时三种PSD信息并非表示为矩阵，反而是以另一种合宜表示获得，例如呈一个或多个向量，或例如呈多个系数等。

为了评估所修订方法的效能，定义下列信号：

●直接信号失真：

q_d(m，k)＝[I-H_D(m，k)]^Hd(m，k)，

●残差周围信号：

●周围信号失真：

q_a(m，k)＝[I-H_A(m，k)]^Ha(m，k)，

●残差直接信号：

后文中，根据图4及根据图5描述滤波器矩阵的偏差如下。为了获得更佳可读性，舍弃子带指数及时间指数。

首先，描述直接信号成分估计的实施例。

所修订方法的理论基础为计算滤波器使得残差周围信号r_a为最小化，同时限制直接信号失真q_d。者导致限制优化问题

满足

其中，

为最大容许直接信号失真。该解通过下式求出

H_D(β_i)＝[Φ_d+β_iΦ_a]^-1Φ_d. (23)

用于计算第i声道的直接输出信号的滤波器等于

h_D，i(β_i)＝[Φ_d+β_iΦ_a]^-1Φ_du_i. (24)

其中，u_i为在第i个位置具有1的长度为N的零向量。参数β_i许可残差周围信号减低与周围信号失真间的折衷。针对图4描绘的***，直接输出信号中较低残差周围电平结果导致周围输出信号中较高的周围电平。较小直接信号失真结果导致周围输出信号中直接信号成分较佳的衰减。时间及频率相依性参数β_i可针对各个声道分开设定，且可通过输入信号或因而得出的信号来控制；容后详述。

须注意通过将限制最佳问题公式化为如下可获得类似解

满足

当Φ_d为序数一时，针对第i声道信号的

与β_i间的关系推衍为

其中，

为第i声道中直接信号的PSD，及λ为多声道直接对周围比(DAR)

其中，方阵A的轨迹等于主对角线元素的和，

须注意Φ_d为序数一的陈述只是假设。无论实际上此假设是否为真，本发明的实施例采用上式(26)、(27)及(28)，即便实际上Φ_d的确切结果为Φ_d非为序数一的情况也是如此。在此等情况下，即使Φ_d为序数一的假设在实际上不是真，本发明的实施例也可获得良好结果。

后文中，描述周围信号成分的估计。

所修订方法的理论基础为计算滤波器使得残差直接信号r_d为最小化，同时限制周围信号失真q_a。这导致限制优化问题

满足

其中，

为最大容许直接信号失真。该解通过下式求出

H_A(β_i)＝[β_iΦ_d+Φ_a]^-1Φ_a， (30)

用于计算第i声道的周围输出信号的滤波器等于

h_A，i(β_i)＝[β_iΦ_d+Φ_a]^-1Φ_au_i. (31)

后文中，实施例以实现本发明的构思的细节提供。

为了确定功率谱密度信息，例如音频输入声道信号的PSD矩阵Φ_y可使用短时间移动平均或递归平均直接估计。周围PSD矩阵Φ_a例如可如下述估计。直接PSD矩阵Φ_d然后可使用式(20)求出。

后文中，再度假设各个子带中(单一直接音源)一次不多于一个直接音源为作用态(active)，并且结果Φ_d为序数一。

须注意不多于一个的直接音源为作用态并且Φ_d为序数一的陈述只是假设。无论实际上此等假设是否为真，本发明的实施例采用下式，更明确言之式(32)及(33)，即便其中，实际上不多于一个直接音源为作用态并且即便实际上，Φ_d的确切结果使得Φ_d不是序数一的情况下也是如此。在此等情况下，本发明的实施例也可提供良好结果，即使实际上不多于一个的直接音源为作用态并且Φ_d为序数一的假设不是真也是如此。

因此，假设不多于一个的直接音源为作用态，并且Φ_d为序数一，式(23)可被写成

式(33)提供式(22)的该限制优化问题的解。

在上式(32)及(33)中，Φ_a ^-1为Φ_a的逆矩阵。显然Φ_a ^-1也指示关于两个或更多个音频输入声道信号的周围信号部分的功率谱密度信息。

为了确定H_D(β_i)，必须确定Φ_a ^-1及Φ_a。当得知Φ_a时，能够立刻确定Φ_a ^-1。λ根据式(27)及(28)定义，当得知Φ_a ^-1及Φ_a时可得知λ值。除了确定Φ_a ^-1、Φ_a及λ之外，必须选定β_i的适合值。

再者，式(33)可改写(参考式(20))，使得：

并且因此使得只须确定关于音频输入声道信号的PSD信息Φ_y及关于音频输入声道信号的直接信号部分的PSD信息Φ_d。

此外，式(33)可改写(参考式(20))，使得：

并且因此使得只须确定关于音频输入声道信号的周围信号部分的PSD信息Φ_a ^-1及关于音频输入声道信号的直接信号部分的PSD信息Φ_d。

此外，式(33)可经改写使得：

并且因此使得确定H_A(β_i)。

式(33c)给式(29)的限制优化问题提供解。

同理，式(33a)及(33b)可改写为：

或改写为：

须注意通过确定H_D(β_i)，滤波器H_A(β_i)立刻可得知为：H_A(β_i)＝I_Ｎ×N-H_D(β_i)。

此外，须注意通过确定H_A(β_i)，滤波器H_D(β_i)立刻可得知为：H_D(β_i)＝I_Ｎ×N-H_A(β_i)。

如前文陈述，为了确定H_D(β_i)，例如根据式(33)，可确定Φ_y及Φ_d：

音频信号的PSD矩阵Φ_y(m,k)例如可通过使用递归平均直接估计

Φ_y(m，k)＝(1-α)y(m，k)y^H(m，k)+αΦ_y(m-1，k)， (34a)

其中，α为确定积分时间的滤波系数，或

例如通过使用短时间移动加权平均

Φ_y(m,k)＝b₀·y(m,k)y^H(m,k)+b₁·y(m-1,k)y^H(m-1,k)

+b₂·y(m-2,k)y^H(m-2,k)+...+b_L·y(m-L,k)y^H(m-L,k) (34b)

其中，L为例如用于PSD的计算的过去值的数目，并且b₀…b_L为例如于[01]的范围(例如0≤滤波系数≤1)的滤波系数，或

例如，根据式(34b)通过使用短时间移动平均，但对全部i＝0…L具有

现在描述依据实施例估计周围PSD矩阵Φ_a。

该周围PSD矩阵Φ_a由下式给定

其中，I_N×N为N×N大小的身分矩阵。

为例如一数字。

依据实施例的解为例如通过使用常数值，通过使用式(21)及设定

为实数正常数ε求得。此种办法的优点为计算复杂度为可忽略的。

在实施例中，滤波器确定单元110被配置为依据两个或更多个音频输入声道信号来确定

依据实施例，具有极低计算复杂度的一个选项是使用输入功率的分量及设定

为该输入PSD的平均值或最小值或其分量，例如

其中，参数g控制周围功率量，及0<g<1。

依据又一实施例，根据几何平均进行估算。给定结果导致式(20)及式(21)的假设，可显示PSD

可使用下式计算

虽然tr{Φ_y}可使用例如式(34a)的递归积分或使用例如式(34b)的短时间移动加权平均直接计算，但tr{Φ_d}估计为

可替代地，通过选择两个输入声道信号并且只针对一对信号声道估计

可对N>2计算PSD

当应用本程序至多于一对输入声道信号并组合其结果(例如通过求估值的总平均)时可获得更准确结果。通过先验地利用有关具有类似周围功率的声道，例如通过分开地估计5.1记录的全部前声道及全部后声道中的周围功率，可选定子集。

此外，须注意从式(20)及(35)，接着

依据若干实施例，Φ_d通过确定

(例如根据式(35)，或式(36)或根据式(37)至(40))及通过采用式(35a)以获得关于音频输入声道信号的周围信号部分的功率谱密度信息而予确定。然后，例如通过采用式(33a)可确定H_D(β_i)。

后文中，考虑参数β_i的选择。

β_i为折衷参数。折衷参数β_i为一数字。

在若干实施例中，只确定一个折衷参数β_i其针对全部音频输入声道信号为有效，并且此折衷参数然后被考虑为音频输入声道信号的折衷信息。

在其它实施例中，针对两个或更多个音频输入声道信号各自确定一个折衷参数β_i，并且然后，音频输入声道信号的两个或更多个折衷参数一起形成折衷信息。

在进一步实施例中，折衷信息可不表示为一参数，反而以不同种适当形式表示。

如前记，参数β_i允许周围信号减低与直接信号失真间的折衷。如图6b所示，其可选择为常数或信号相关的。

图6b示出根据又一实施例的装置。该装置包含分析滤波器组605用于将音频输入声道信号y_t[n]从时域变换成时频域。此外，该装置包含合成滤波器组625用于将一个或多个音频输出声道信号(例如音频输入声道信号的估计直接信号成分

)从时频域变换成时域。

多个K个β确定单元1111、…、11K1(“计算β”)确定参数β_i。此外，多个K个子滤波器确定单元1112、…、11K2确定子滤波器

根据特定实施例，多个β确定单元1111、…、11K1及多个子滤波器确定单元1112、…、11K2一起形成图1及图6a的滤波器确定单元110。根据特定实施例，多个子滤波器

一起形成图1及图6a的滤波器。

此外，图6b示出多个信号子处理器121、…、12K，其中各个信号子处理器121、…、12K被配置为将子滤波器

中的一个应用至音频输入声道信号以获得音频输出声道信号中的一个。根据特定实施例，多个信号子处理器121、…、12K一起形成图1及图6a的信号处理器。

后文中，描述利用信号分析来控制参数β_i的不同使用情况。

首先，考虑过渡信号(transient signal)。

根据实施例，滤波器确定单元110被配置为根据过渡是否存在于两个或更多个音频输入声道信号中的至少一个中来确定折衷信息(β_i,β_j)。

输入PSD矩阵的估计对静态信号的效果最佳。另一方面，过渡输入信号的分解可能导致过渡信号成分泄漏至周围输出信号中。就非静态或过渡存在机率的程度而言，利用信号分析控制β_i，使得当信号包含过渡时β_i为较小，而当应用滤波器H_D(β_i)时持久部分为较大：结果导致更为一致的输出信号。就非静态或过渡存在机率的程度而言，利用信号分析控制β_i，使得当信号包含过渡时β_i为较大，而当应用滤波器H_A(β_i)时持久部分为较小：结果导致更为一致的输出信号。

现在考虑非期望周围信号。

在实施例中，滤波器确定单元110被配置为根据加性噪声是否存在于至少一个信号声道(两个或更多个音频输入声道信号中的一个通过其传输)中来确定折衷信息(β_i,β_j)。

所提出的方法分解输入信号而与周围信号成分的本质无关。当输入信号已经通过噪声信号声道传输时，有利地地估计非期望的加性噪声存在的机率并控制β_i使得输出DAR(直接对周围比)增加。

现在描述控制输出信号的电平。

为了控制输出信号的电平，可针对第i声道分开设定β_i。计算第i声道的周围输出信号的滤波器通过式(31)给定。

针对任意两个声道，给定β_i可计算β_i使得在第i及第j输出声道的残差周围信号r_a,i及r_a,j的PSD为相等，亦即

或

(u_i-h_D，i(β_i))^HΦ_a(u_i-h_D，i(β_i))

＝(u_j-h_D，j(β_j))^HΦ_a(u_j-h_D，j(β_j)). (42)

可替代地，可计算β_i使得针对全部成对i及j的输出周围信号

及

的PSD相等。

现在考虑使用筛选信息。

对两个输入声道的情况，筛选信息定量每个子带两个声道间的电平差。可应用筛选信息以控制β_i来控制感知的输出信号宽度。

后文中，考虑等化输出周围声道信号。

所描述的处理并不确保全部输出周围声道信号具有相等子带功率。为了确保全部输出周围声道信号具有相等子带功率，针对使用前述滤波器H_D的实施例，滤波器系如后文描述修正。周围输出信号的协方差矩阵(在主对角线上包含各个声道的自动-PSD)可获得为

为了确保全部输出周围声道的PSD为相等，滤波器H_D以

置换：

其中，G为对角矩阵，其在主对角线上的元素为

针对使用前述滤波器H_A的实施例，周围输出信号的协方差矩阵(在主对角线上的包含各个声道的自动-PSD)可获得为

为了确保全部输出周围声道的PSD为相等，滤波器H_A以

置换：

虽然已经在装置的背景下描述了若干方面，但显然这些方面也表示对应方法的描述，其中，方块或装置对应于方法步骤或方法步骤的特征。同理，在方法步骤的背景下描述的方面也表示对应装置的对应方块或项目或特征的描述。

本发明的已分解信号可存储于数字储存媒体上，或可在传输媒体(诸如无线传输媒体或有线传输媒体，诸如因特网)上传输。

根据特定实施要求，本发明的实施例可以以硬件或软件实施。该实施可使用具有存储于其上的可电子读取控制信号的数字存储媒体执行，例如软盘、DVD、CD、ROM、PROM、EPROM、EEPROM、或闪存，其与可编程计算机***协作(或能够协作)以执行相应方法。

根据本发明的若干实施例包含一种具有可电子读取控制信号的非瞬时数据载体，其能够与可编程计算机***协作，使得执行本文描述的方法中的一个。

一般而言，本发明的实施例可实施为具有程序代码的计算机程序产品，当该计算机程序产品在计算机上运行时该程序代码可操作为执行方法中的一种。程序代码例如可存储于机器可读取载体上。

其它实施例包含存储于机器可读取载体上的用于执行方法中的一种的计算机程序。

因此，换言之，本发明方法的实施例为计算机程序，其具有用于当该计算机程序在计算机上运行时执行方法中的一种的程序代码。

本发明方法的又一实施例因而为数据载体(或数字储存媒体，或计算机可读取媒体)包含用于执行本文描述的方法中的一个的计算机程序。

本发明方法的又一实施例因而为一种表示用于执行本文描述的方法中的一种的计算机程序的数据流或信号序列。该数据流或信号序列例如可被配置为通过数据通信连接(例如通过因特网)传送。

又一实施例包含被配置为或适配为执行本文描述的方法中的一个的处理构件，例如计算机或可编程逻辑设备。

又一实施例包含计算机具有安装在其上的用于执行本文描述的方法中的一种的计算机程序。

在若干实施例中，可编程逻辑设备(例如现场可编程门阵列)可用于执行本文描述的方法的部分或全部功能。在若干实施例中，现场可编程门阵列可与微处理器协作以执行本文描述的方法中的一种。一般而言，这些方法优选地通过任何硬件装置来执行。

前述实施例仅为了说明本发明的原理。应理解，本文描述的布置和细节的修改和变化对于本领域技术人员而言将是显而易见的。因此，意图本发明的范围仅受待审权利要求的范围所限而不受通过本文中实施方式的描述和说明呈现的具体细节的限制。

参考文献

[1]J.B.Allen,D.A.Berkeley,和J.Blauert,"Multimicrophone signal-processing technique to remove room reverberation from speech signals",J.Acoust.Soc.Am.,vol.62,1977.

[2]C.Avendano和J.-M.Jot,"A frequency-domain approach to multi-channelupmix”,J.Audio Eng.Soc.,vol.52,2004.

[3]C.Faller,"Multiple-loudspeaker playback of stereo signals",J.AudioEng.Soc.,vol.54,2006.

[4]J.Merimaa,M.Goodwin,和J.-M.Jot,"Correlation-based ambienceextraction from stereo recordings”,in Proc.of the AES 123rd Conv.,2007.

[5]Ville Pulkki,"Directional audio coding in spatial soundreproduction and stereo upmixing",in Proc.of the AES 28th Int.Conf.,2006.

[6]J.Usher和J.Benesty,"Enhancement of spatial sound quality:A newreverberation-extraction audio upmixer",IEEE Tram.on Audio,Speech.andLanguage Processing,vol.l5,pp.2141-2150,2007.

[7]A.Walther和C.Faller,"Direct-ambient decomposition and upmix ofsurround sound signals",in Proc.of IEEE WASPAA,2011.

[8]C.Uhle,J.Herre,S.Geyersberger,F.Ridderbusch,A.Walter；和O.Moser,"Apparatus and method for extracting an ambient signal in an:apparatus andmethod for obtaining weighting coefficients for extracting an ambient signaland computer program",美国专利申请2009/0080666,2009.

[9]C.Uhle,J.Herre,A.Walther,O.Hellmuth,和C.Janssen,"Apparatus andmethod for generating an ambient signal from an audio signal,apparatus andmethod for deriving a multi-channel audio signal from an audio signal andcomputer program",美国专利申请2010/0030563,2010.

[10]G.Soulodre,"System for extracting and changing the reverberantcontent of an audio input signal",美国专利8,036,767,授权日期:2011年10月11日。

Claims

1.一种用于根据两个或更多个音频输入声道信号生成一个或多个音频输出声道信号的装置，其中，所述两个或更多个音频输入声道信号的每一个包含直接信号部分及周围信号部分，其中，所述装置包含：

滤波器确定单元(110)，被配置为通过估计第一功率谱密度信息并通过估计第二功率谱密度信息来计算一滤波器，其中，所述滤波器取决于所述第一功率谱密度信息并且取决于所述第二功率谱密度信息，其中，所述滤波器确定单元(110)被配置为根据所述两个或更多个音频输入声道信号中的至少一个通过估计所述第一功率谱密度信息、通过估计所述第二功率谱密度信息、并通过确定折衷信息(β_i,β_j)来计算所述滤波器，以及

信号处理器(120)，被配置为通过将所述滤波器应用于所述两个或更多个音频输入声道信号来确定所述一个或多个音频输出声道信号，其中，所述一个或多个音频输出声道信号取决于所述滤波器，

其中，所述第一功率谱密度信息指示关于所述两个或更多个音频输入声道信号的功率谱密度信息，并且所述第二功率谱密度信息指示关于所述两个或更多个音频输入声道信号的周围信号部分的功率谱密度信息，或者

其中，所述第一功率谱密度信息指示关于所述两个或更多个音频输入声道信号的功率谱密度信息，并且所述第二功率谱密度信息指示关于所述两个或更多个音频输入声道信号的直接信号部分的功率谱密度信息，或者

其中，所述第一功率谱密度信息指示关于所述两个或更多个音频输入声道信号的所述直接信号部分的功率谱密度信息，并且所述第二功率谱密度信息指示关于所述两个或更多个音频输入声道信号的所述周围信号部分的功率谱密度信息。

2.根据权利要求1所述的装置，

其中，所述装置进一步包含用于将所述两个或更多个音频输入声道信号从时域变换到时频域的分析滤波器组(605)，

其中，所述滤波器确定单元(110)被配置为通过根据以所述时频域表示的所述音频输入声道信号估计所述第一功率谱密度信息和所述第二功率谱密度信息来确定所述滤波器，

其中，所述信号处理器(120)被配置为通过将所述滤波器应用于以所述时频域表示的所述两个或更多个音频输入声道信号来生成以所述时频域表示的所述一个或多个音频输出声道信号，并且

其中，所述装置进一步包含用于将以所述时频域表示的所述一个或多个音频输出声道信号从所述时频域变换成所述时域的合成滤波器组(625)。

3.根据权利要求1所述的装置，其中，所述滤波器确定单元(110)被配置为根据一过渡是否存在于所述两个或更多个音频输入声道信号中的至少一个中来确定所述折衷信息(β_i,β_j)。

4.根据权利要求1所述的装置，其中，所述滤波器确定单元(110)被配置为根据加性噪声是否存在于至少一个信号声道中来确定所述折衷信息(β_i,β_j)，所述两个或更多个音频输入声道信号中的一个通过所述至少一个信号声道来传输。

5.根据权利要求1所述的装置，

其中，所述滤波器确定单元(110)被配置为根据第一矩阵(Φ_y)来确定关于所述两个或更多个音频输入声道信号的功率谱密度信息，所述第一矩阵(Φ_y)在所述第一矩阵(Φ_y)的主对角线上包含对所述两个或更多个音频输入声道信号中的每个声道信号的功率谱密度的估计，并且所述滤波器确定单元(110)被配置为根据第二矩阵(Φ_a)或根据所述第二矩阵(Φ_a)的逆矩阵(Φ_a ^-1)来确定关于所述两个或更多个音频输入声道信号的所述周围信号部分的功率谱密度信息，所述第二矩阵(Φ_a)在所述第二矩阵(Φ_a)的主对角线上包含对所述两个或更多个音频输入声道信号中的每个声道信号的所述周围信号部分的功率谱密度的估计，或者

其中，所述滤波器确定单元(110)被配置为根据所述第一矩阵(Φ_y)来确定关于所述两个或更多个音频输入声道信号的功率谱密度信息，并且被配置为根据第三矩阵(Φ_d)或根据所述第三矩阵(Φ_d)的逆矩阵(Φ_d ^-1)来确定关于所述两个或更多个音频输入声道信号的所述直接信号部分的功率谱密度信息，所述第三矩阵(Φ_d)在所述第三矩阵(Φ_d)的主对角线上包含对所述两个或更多个音频输入声道信号中的每个声道信号的所述直接信号部分的功率谱密度的估计，或者

其中，所述滤波器确定单元(110)被配置为根据所述第二矩阵(Φ_a)或根据所述第二矩阵(Φ_a)的逆矩阵(Φ_a ^-1)来确定关于所述两个或更多个音频输入声道信号的所述周围信号部分的功率谱密度信息，并且被配置为根据所述第三矩阵(Φ_d)或根据所述第三矩阵(Φ_d)的逆矩阵(Φ_d ^-1)来确定关于所述两个或更多个音频输入声道信号的所述直接信号部分的功率谱密度信息。

6.根据权利要求5所述的装置，

其中，所述滤波器确定单元(110)被配置为确定所述第一矩阵(Φ_y)以确定关于所述两个或更多个音频输入声道信号的功率谱密度信息，并且被配置为确定所述二矩阵(Φ_a)或所述第二矩阵(Φ_a)的逆矩阵(Φ_a ^-1)以确定关于所述两个或更多个音频输入声道信号的所述周围信号部分的功率谱密度信息，或者

其中，所述滤波器确定单元(110)被配置为确定所述第一矩阵(Φ_y)以确定关于所述两个或更多个音频输入声道信号的功率谱密度信息，并且被配置为确定所述第三矩阵(Φ_d)或所述第三矩阵(Φ_d)的逆矩阵(Φ_d ^-1)以确定关于所述两个或更多个音频输入声道信号的所述直接信号部分的功率谱密度信息；或者

其中，所述滤波器确定单元(110)被配置为确定所述第二矩阵(Φ_a)或所述第二矩阵(Φ_a)的逆矩阵(Φ_a ^-1)，以确定关于所述两个或更多个音频输入声道信号的周围信号部分的功率谱密度信息，并且被配置为确定所述第三矩阵(Φ_d)或所述第三矩阵(Φ_d)的逆矩阵(Φ_d ^-1)，以确定关于所述两个或更多个音频输入声道信号的所述直接信号部分的功率谱密度信息。

7.根据权利要求5所述的装置，

其中，所述滤波器确定单元(110)被配置为根据下式

或根据下式

或根据下式来确定所述滤波器为滤波器H_D(β_i)，

或者

其中，所述滤波器确定单元(110)被配置为根据下式

或根据下式

或根据下式来确定所述滤波器为滤波器H_A(β_i)

其中，Φ_y为所述第一矩阵，

其中，Φ_a为所述第二矩阵，

其中，Φ_a ^-1为所述第二矩阵的逆矩阵，

其中，Φ_d为所述第三矩阵，

其中，I_N×N为N×N大小的单位矩阵，

其中，N指示所述音频输入声道信号的数目，

其中，β_i为所述折衷信息，所述折衷信息为一数字，并且

其中，

其中，tr为轨迹操作数。

8.根据权利要求1所述的装置，其中，所述滤波器确定单元(110)被配置为针对所述两个或更多个音频输入声道信号中的每一个确定折衷参数(β_i,β_j)作为所述折衷信息(β_i,β_j)，其中，所述音频输入声道信号中的每一个的所述折衷参数(β_i,β_j)取决于所述音频输入声道信号。

9.根据权利要求7所述的装置，

其中，所述滤波器确定单元(110)被配置为针对所述两个或更多个音频输入声道信号中的每一个确定折衷参数(β_i,β_j)作为所述折衷信息(β_i,β_j)，使得对于所述音频输入声道信号的第一音频输入声道信号与所述音频输入声道信号的另一第二音频输入声道信号的每对

为真，

其中，β_i为所述第一音频输入声道信号的所述折衷参数，

其中，βj为所述第二音频输入声道信号的所述折衷参数，

其中，

h_A，i(β_i)＝[β_iΦ_d+Φ_a]^-1Φ_au_i，

其中，

为h_A,i(β_i)的共轭转置矩阵，并且

其中，u_i为在第i个位置具有1的长度为N的零向量。

10.根据权利要求7所述的装置，

其中，所述滤波器确定单元(110)被配置为根据下式确定所述第二矩阵Φ_a

或者

其中，所述滤波器确定单元(110)被配置为根据下式确定所述第三矩阵Φ_d

其中，

为一数字。

11.根据权利要求10所述的装置，其中，所述滤波器确定单元(110)被配置为根据所述两个或更多个音频输入声道信号来确定

12.根据权利要求1所述的装置，

其中，所述滤波器确定单元(110)被配置为：为提供所述两个或更多个音频输入声道信号的直接信号成分，通过估计所述第一功率谱密度信息并通过估计所述第二功率谱密度信息来确定中间滤波器矩阵H_D，并且

其中，所述滤波器确定单元(110)被配置为根据下式确定取决于所述中间滤波器矩阵H_D的滤波器

其中，I为单位矩阵，并且

其中，G为对角矩阵，

其中，所述信号处理器(120)被配置为通过将所述滤波器

应用于所述两个或更多个音频输入声道信号来生成所述一个或多个音频输出声道信号。

13.一种用于根据两个或更多个音频输入声道信号生成一个或多个音频输出声道信号的方法，其中，所述两个或更多个音频输入声道信号中的每一个包含直接信号部分及周围信号部分，其中，所述方法包含：

通过估计第一功率谱密度信息并通过估计第二功率谱密度信息来计算一滤波器，其中，所述滤波器取决于所述第一功率谱密度信息并且取决于所述第二功率谱密度信息，其中，根据所述两个或更多个音频输入声道信号中的至少一个通过估计所述第一功率谱密度信息、通过估计所述第二功率谱密度信息、并通过确定折衷信息(β_i,β_j)来计算所述滤波器，以及

通过将所述滤波器应用于所述两个或更多个音频输入声道信号来生成所述一个或多个音频输出声道信号，其中，所述一个或多个音频输出声道信号取决于所述滤波器，

14.一种计算机可读介质，包括计算机程序，当所述计算机程序在计算机或处理器上执行时用于实施如权利要求13所述的方法。