CN106887239A

CN106887239A - 用于高度相关的混合物的增强型盲源分离算法

Info

Publication number: CN106887239A
Application number: CN201610877684.2A
Authority: CN
Inventors: 王松; 迪尼希·拉马克里希南; 萨米尔·库马尔·古普塔; 埃迪·L·T·乔伊
Original assignee: Qualcomm Inc
Current assignee: Qualcomm Inc
Priority date: 2008-01-29
Filing date: 2009-01-29
Publication date: 2017-06-23
Also published as: JP5678023B2; EP2245861A1; US20090190774A1; US8223988B2; WO2009097413A1; KR20130035990A; KR20100113146A; CN101904182A; EP2245861B1; JP2011511321A; JP2013070395A

Abstract

本发明涉及用于高度相关的混合物的增强型盲源分离算法。具体来讲，提供一种增强型盲源分离技术以改善高度相关的信号混合物的分离。使用波束成形算法来预调节相关的第一和第二输入信号，以便避免通常与盲源分离相关联的不确定性问题。所述波束成形算法可将空间滤波器应用于所述第一信号和第二信号，以便放大来自第一方向的信号，同时衰减来自其它方向的信号。此方向性可用以放大所述第一信号中的所要话音信号，且衰减来自所述第二信号的所述所要话音信号。随后对波束成形器输出信号执行盲源分离以分离所述所要话音信号和周围噪声，且重构所述所要话音信号的估计。为了增强所述波束成形器和/或盲源分离的操作，可在一个或一个以上级处执行校准。

Description

用于高度相关的混合物的增强型盲源分离算法

分案申请的相关信息

本申请是国际申请号为PCT/US2009/032414、申请日为2009年1月29日、发明名称为“用于高度相关的混合物的增强型盲源分离算法”的PCT申请进入中国国家阶段后申请号为200980101391.3的中国发明专利申请的分案申请。

技术领域

至少一个方面涉及信号处理，且更特定来说，涉及结合盲源分离(BSS)技术使用的处理技术。

背景技术

一些移动通信装置可采用多个麦克风以努力改善从一个或一个以上信号源俘获的声音和/或音频信号的质量。这些音频信号常常被背景噪声、扰动、干扰、串音和其它不想要的信号破坏。因此，为了增强所要音频信号，此些通信装置通常使用高级信号处理方法来处理由多个麦克风俘获的音频信号。此过程常常称为信号增强，其在所要音频信号中提供改善的声音/语音质量、减少的背景噪声等，同时抑制其它不相关信号。在话音通信中，所要信号通常是话音信号且信号增强称为话音增强。

盲源分离(BSS)可用于信号增强。盲源分离是用以使用源信号的多个独立信号混合物来恢复独立源信号的技术。将每一传感器放置于不同位置，且每一传感器记录一信号，所述信号为源信号的混合物。BSS算法可用以通过利用信号差异来分离信号，所述差异表明由两个传感器记录的共同信息的空间分集。在话音通信处理中，不同的传感器可包括相对于正在记录的话音源放置于不同位置处的麦克风。

波束成形是用于信号增强的替代技术。波束成形器执行空间滤波以分离源自不同空间位置的信号。来自某些方向的信号经放大，同时来自其它方向的信号经衰减。因此，波束成形使用输入信号的方向性来增强所要信号。

盲源分离和波束成形两者均使用放置于不同位置的多个传感器。每一传感器记录或俘获源信号的不同混合物。这些混合物含有源信号与传感器(例如，麦克风)之间的空间关系。利用此信息以实现信号增强。

在具有紧密间隔的麦克风的通信装置中，从麦克风俘获的输入信号可由于麦克风之间的紧密接近性而高度相关。在此情况下，传统的噪声抑制方法(包含盲源分离)可能在分离所要信号与噪声方面不能良好地起作用。举例来说，在双麦克风***中，BSS算法可取得混合输入信号且产生两个输出，其含有所要话音信号和周围噪声的估计。然而，可能无法在信号分离之后确定两个输出信号中的哪一者是所要话音信号且哪一者是周围噪声。BSS算法的此固有不确定性造成重大的性能降级。

因此，需要一种在具有紧密间隔的麦克风的通信装置上改善盲源分离的性能的方式。

发明内容

提供一种用于高度相关信号混合物的盲源分离的方法。接收与第一麦克风相关联的第一输入信号。还接收与第二麦克风相关联的第二输入信号。可将波束成形技术应用于所述第一和第二输入信号以对所述第一和第二输入信号提供方向性且获得对应的第一和第二输出信号。可将盲源分离(BSS)技术应用于所述第一输出信号和第二输出信号以产生第一BSS信号和第二BSS信号。可校准所述第一和第二输入信号、所述第一和第二输出信号或所述第一和第二BSS信号中的至少一者。

所述波束成形技术可通过将空间滤波器应用于所述第一和第二输入信号来对所述第一和第二输入信号提供方向性。将空间滤波器应用于所述第一和第二输入信号可放大来自第一方向的声音信号，同时使来自其它方向的声音信号衰减。将空间滤波器应用于所述第一和第二输入信号可放大所述所得第一输出信号中的所要话音信号且使所述第二输出信号中的所述所要话音信号衰减。

在一个实例中，校准所述第一和第二输入信号中的至少一者可包括将自适应滤波器应用于所述第二输入信号，且应用所述波束成形技术可包含从所述第二输入信号减去所述第一输入信号。应用所述波束成形技术可进一步包括将所述经滤波的第二输入信号添加到所述第一输入信号。

在另一实例中，校准所述第一和第二输入信号中的至少一者可进一步包括基于所述第一输入信号和第二输入信号的能量估计的比率而产生校准因数，以及将所述校准因数应用于所述第一输入信号或所述第二输入信号中的至少一者。

在又一实例中，校准所述第一和第二输入信号中的至少一者可进一步包括基于所述第一与第二输入信号之间的交叉相关估计与所述第二输入信号的能量估计的比率而产生校准因数，以及将所述校准因数应用于所述第二输入信号。

在又一实例中，校准所述第一和第二输入信号中的至少一者可进一步包括基于所述第一与第二输入信号之间的交叉相关估计与所述第一输入信号的能量估计的比率而产生校准因数，以及将所述校准因数应用于所述第一输入信号。

在又一实例中，校准所述第一和第二输入信号中的至少一者可进一步包括基于第一与第二输入信号之间的交叉相关与所述第二输入信号的能量估计而产生校准因数，将所述第二输入信号乘以所述校准因数，以及将所述第一输入信号除以所述校准因数。

在一个实例中，将所述波束成形技术应用于所述第一和第二输入信号可进一步包括将所述第二输入信号添加到所述第一输入信号以获得经修改的第一信号，以及从所述第二输入信号减去所述第一输入信号以获得经修改的第二信号。校准所述第一和第二输入信号中的至少一者可进一步包括：(a)获得所述经修改的第一信号的第一噪声底限估计；(b)获得所述经修改的第二信号的第二噪声底限估计；(c)基于所述第一噪声底限估计与所述第二噪声底限估计的比率而产生校准因数；(d)将所述校准因数应用于所述经修改的第二信号；和/或(e)将自适应滤波器应用于所述经修改的第一信号，且从所述经修改的第二信号减去所述经滤波的经修改的第一信号。

所述用于高度相关信号混合物的盲源分离的方法还可进一步包括：(a)基于所述第一和第二输出信号获得校准因数；和/或(b)在将所述盲源分离技术应用于所述第一和第二输出信号之前校准所述第一和第二输出信号中的至少一者。

所述用于高度相关信号混合物的盲源分离的方法还可进一步包括：(a)基于所述第一和第二输出信号获得校准因数；和/或(b)基于所述校准因数修改所述盲源分离技术的操作。

所述用于高度相关信号混合物的盲源分离的方法还可进一步包括将自适应滤波器应用于所述第一BSS信号以减少所述第一BSS信号中的噪声，其中所述第二BSS信号用作对所述自适应滤波器的输入。

所述用于高度相关信号混合物的盲源分离的方法还可进一步包括：(a)通过应用基于振幅的校准或基于交叉相关的校准中的至少一者来校准所述第一和第二输入信号中的至少一者，(b)通过应用基于振幅的校准或基于交叉相关的校准中的至少一者来校准所述第一和第二输出信号中的至少一者，和/或(c)校准所述第一和第二BSS信号中的至少一者包含应用基于噪声的校准。

还提供一种通信装置，其包括：一个或一个以上麦克风，其耦合到一个或一个以上校准模块，和一盲源分离模块。第一麦克风可经配置以获得第一输入信号。第二麦克风可经配置以获得第二输入信号。校准模块经配置以对所述第一和第二输入信号执行波束成形以获得对应的第一和第二输出信号。盲源分离模块经配置以对所述第一输出信号和所述第二输出信号执行盲源分离(BSS)技术以产生第一BSS信号和第二BSS信号。至少一个校准模块可经配置以校准所述第一和第二输入信号、所述第一和第二输出信号或所述第一和第二BSS信号中的至少一者。所述通信装置还可包含后处理模块，其经配置以将自适应滤波器应用于所述第一BSS信号以减少所述第一BSS信号中的噪声，其中所述第二BSS信号用作对所述自适应滤波器的输入。

所述波束成形模块可通过将空间滤波器应用于所述第一和第二输入信号来执行波束成形，其中将空间滤波器应用于所述第一和第二输入信号放大来自第一方向的声音信号，同时使来自其它方向的声音信号衰减。将空间滤波器应用于所述第一输入信号和第二输入信号可放大所述第一输出信号中的所要话音信号且可使所述第二输出信号中的所述所要话音信号衰减。

在一个实例中，在对所述第一和第二输入信号执行波束成形时，所述波束成形模块可进一步经配置以：(a)将自适应滤波器应用于所述第二输入信号；(b)从所述第二输入信号减去所述第一输入信号；以及(c)将所述经滤波的第二输入信号添加到所述第一输入信号。

在一个实例中，在校准所述第一和第二输入信号中的至少一者时，所述校准模块可进一步经配置以：(a)基于所述第一与第二输入信号之间的交叉相关估计与所述第二输入信号的能量估计的比率而产生校准因数；和/或(b)将所述校准因数应用于所述第二输入信号。

在另一实例中，在校准所述第一和第二输入信号中的至少一者时，所述校准模块可进一步经配置以：(a)基于所述第一与第二输入信号之间的交叉相关估计与所述第一输入信号的能量估计的比率而产生校准因数；和/或(b)将所述校准因数应用于所述第一输入信号。

在另一实例中，在校准所述第一和第二输入信号中的至少一者时，所述校准模块可进一步经配置以：(a)基于第一与第二输入信号之间的交叉相关与所述第二输入信号的能量估计而产生校准因数；(b)将所述第二输入信号乘以所述校准因数；和/或(c)将所述第一输入信号除以所述校准因数。

在另一实例中，在对所述第一和第二输入信号执行波束成形时，所述波束成形模块可进一步经配置以：(a)将所述第二输入信号添加到所述第一输入信号以获得经修改的第一信号；(b)从所述第二输入信号减去所述第一输入信号以获得经修改的第二信号；(c)获得所述经修改的第一信号的第一噪声底限估计；(d)获得所述经修改的第二信号的第二噪声底限估计；且/或所述校准模块可进一步经配置以：(e)基于所述第一噪声底限估计与所述第二噪声底限估计的比率而产生校准因数；和/或(f)将所述校准因数应用于所述经修改的第二信号。

在一个实例中，所述至少一个校准模块可包含第一校准模块，其经配置以将基于振幅的校准或基于交叉相关的校准中的至少一者应用于所述第一和第二输入信号。

在另一实例中，所述至少一个校准模块可包含第二校准模块，其经配置以将基于振幅的校准或基于交叉相关的校准中的至少一者应用于所述第一和第二输出信号。

在另一实例中，所述至少一个校准模块可包含第三校准模块，其经配置以将基于噪声的校准应用于所述第一和第二BSS信号。

因此，提供一种通信装置，其包括：(a)用于接收与第一麦克风相关联的第一输入信号和与第二麦克风相关联的第二输入信号的装置；(b)用于将波束成形技术应用于所述第一和第二输入信号以对所述第一和第二输入信号提供方向性且获得对应的第一和第二输出信号的装置；(c)用于将盲源分离(BSS)技术应用于所述第一输出信号和第二输出信号以产生第一BSS信号和第二BSS信号的装置；(d)用于校准所述第一和第二输入信号、所述第一和第二输出信号或所述第一和第二BSS信号中的至少一者的装置；(e)用于将自适应滤波器应用于所述第一BSS信号以减少所述第一BSS信号中的噪声的装置，其中所述第二BSS信号用作对所述自适应滤波器的输入；(f)用于将自适应滤波器应用于所述第二输入信号的装置；(g)用于从所述第二输入信号减去所述第一输入信号的装置；(h)用于将所述经滤波的第二输入信号添加到所述第一输入信号的装置；(i)用于基于所述第一和第二输出信号获得校准因数的装置；(j)用于在将盲源分离技术应用于所述第一和第二输出信号之前校准所述第一和第二输出信号中的至少一者的装置；(k)用于基于所述第一和第二输出信号获得校准因数的装置；和/或(1)用于基于所述校准因数修改所述盲源分离技术的操作的装置。

提供一种用于增强两个或两个以上信号的盲源分离的电路，其中所述电路适于：(a)接收与第一麦克风相关联的第一输入信号和与第二麦克风相关联的第二输入信号；(b)将波束成形技术应用于所述第一和第二输入信号以对所述第一和第二输入信号提供方向性且获得对应的第一和第二输出信号；(c)将盲源分离(BSS)技术应用于所述第一输出信号和所述第二输出信号以产生第一BSS信号和第二BSS信号；和/或(d)校准所述第一和第二输入信号、所述第一和第二输出信号或所述第一和第二BSS信号中的至少一者。所述波束成形技术可将空间滤波应用于所述第一输入信号和第二输入信号，且所述空间滤波器放大来自第一方向的声音信号，同时使来自其它方向的声音信号衰减。在一个实例中，所述电路是集成电路。

还提供一种计算机可读媒体，其包括用于增强两个或两个以上信号的盲源分离的指令，所述指令在由处理器执行时可致使所述处理器：(a)获得与第一麦克风相关联的第一输入信号和与第二麦克风相关联的第二输入信号；(b)将波束成形技术应用于所述第一和第二输入信号以对所述第一和第二输入信号提供方向性且获得对应的第一和第二输出信号；(c)将盲源分离(BSS)技术应用于所述经预处理的第一信号和经预处理的第二信号以产生第一BSS信号和第二BSS信号；和/或(d)校准所述第一和第二输入信号、所述第一和第二输出信号或所述第一和第二BSS信号中的至少一者。

附图说明

从以下结合附图陈述的详细描述可更明了本发明的方面的特征、特性和优点，附图中相同参考字符始终做出相应识别。

图1说明经配置以执行信号增强的移动通信装置的实例。

图2是说明经配置以执行靠近间隔的麦克风的信号增强的移动通信装置的组件和功能的框图。

图3是根据一个实例的顺序波束成形器和盲源分离级的一个实例的框图。

图4是经配置以执行空间波束成形的波束成形模块的实例的框图。

图5是说明使用来自两个或两个以上麦克风的输入信号的校准和波束成形的第一实例的框图。

图6是说明用于获得校准因数的第一方法的流程图，可应用所述校准因数以在基于两个麦克风信号实施波束成形之前校准两个麦克风信号。

图7是说明用于获得校准因数的第二方法的流程图，可应用所述校准因数以在基于两个麦克风信号实施波束成形之前校准两个麦克风信号。

图8是说明使用来自两个或两个以上麦克风的输入信号的校准和波束成形的第二实例的框图。

图9是说明使用来自两个或两个以上麦克风的输入信号的校准和波束成形的第三实例的框图。

图10是说明使用来自两个或两个以上麦克风的输入信号的校准和波束成形的第四实例的框图。

图11是说明卷积盲源分离从多个混合输入信号恢复源信号的操作的框图。

图12是说明在波束成形预处理级之后但在盲源分离级之前可如何校准信号的第一实例的框图。

图13是说明在盲源分离之前实施信号校准的替代方案的框图。

图14是说明用以从所要话音参考信号减少噪声的后处理模块的操作的实例的框图。

图15是说明根据一个实例的增强盲源分离的方法的流程图。

具体实施方式

在以下描述中，给出具体细节以提供对配置的详尽理解。然而所属领域的技术人员将了解，可在无这些具体细节的情况下实践所述配置。举例来说，可在框图中展示电路以便不会以不必要的细节混淆所述配置。在其它例子中，可详细展示众所周知的电路、结构和技术以便不混淆所述配置。

而且应注意，所述配置可描述为一描绘为流程图、流图、结构图或框图的过程。虽然流程图可将操作描述为顺序过程，但操作中有许多可并行或同时执行。另外，操作的次序可重新布置。当过程的操作完成时过程终止。过程可对应于方法、函数、程序、子例程、子程序等。当过程对应于函数时，其终止对应于所述函数向调用函数或主函数的返回。

在一个或一个以上实例和/或配置中，所描述的功能可以硬件、软件、固件或其任何组合来实施。如果以软件实施，那么功能可作为一个或一个以上指令存储在计算机可读媒体上或经由计算机可读媒体而传输。计算机可读媒体包含计算机存储媒体和通信媒体两者，包含任何促进计算机程序从一个地方向另一地方的转移的媒体。存储媒体可为任何可由通用或专用计算机存取的可用媒体。借助于实例而非限制，此计算机可读媒体可包括RAM、ROM、EEPROM、CD-ROM或其它光盘存储装置、磁盘存储装置或其它磁性存储装置，或可用以用指令或数据结构的形式携载或存储所要程序代码装置且可由通用或专用计算机或者通用或专用处理器存取的任何其它媒体。而且，任何连接均适当地称为计算机可读媒体。举例来说，如果软件是使用同轴电缆、光纤电缆、双绞线对、数字订户线(DSL)或例如红外线、无线电和微波等无线技术从网站、服务器或其它远程源传输的，那么同轴电缆、光纤电缆、双绞线对、DSL或例如红外线、无线电和微波等无线技术包含在媒体的定义内。如本文所使用，磁盘和光盘包含压缩光盘(CD)、激光光盘、光学光盘、数字通用光盘(DVD)、软磁盘和蓝光光盘，其中磁盘通常以磁性方式再现数据，而光盘用激光以光学方式再现数据。以上各项的组合也应包含在计算机可读媒体的范围内。

而且，存储媒体可表示一个或一个以上用于存储数据的装置，包含只读存储器(ROM)、随机存取存储器(RAM)、磁盘存储媒体、光学存储媒体、快闪存储器装置和/或其它用于存储信息的机器可读媒体。

此外，各种配置可由硬件、软件、固件、中间件、微码和/或其任何组合实施。当以软件、固件、中间件或微码实施时，用以执行必要任务的程序代码或代码段可存储在计算机可读媒体中，例如存储媒体或其它存储装置。处理器可执行必要任务。代码段可表示过程、函数、子程序、程序、例程、子例程、模块、软件包、类或指令、数据结构或程序语句的任何组合。代码段可通过传递和/或接收信息、数据、自变量、参数或存储器内容而耦合到另一代码段或硬件电路。信息、自变量、参数、数据等可经由任何合适的方式传递、转发或传输，所述方式包含存储器共享、消息传递、权标传递、网络传输等。

一个特征提供预处理级，其在执行盲源分离之前预调节输入信号，进而改善盲源分离算法的性能。首先，使用校准和波束成形级来预调节麦克风信号，以便避免与盲源分离相关联的不确定性问题。随后对波束成形器输出信号执行盲源分离以分离所要话音信号和周围噪声。此特征假定使用至少两个麦克风且仅一个信号(来自至少两个麦克风信号)是待增强的所要信号。举例来说，所要信号可为源自使用通信装置的人的话音信号。

在一个实例中，可在通信装置上俘获两个麦克风信号，其中假定每一麦克风信号含有所要话音信号与周围噪声的混合。首先，使用校准和波束成形级来预调节麦克风信号。经预调节信号中的一者或一者以上可在进一步处理之前和/或之后再次经校准。举例来说，可首先校准经预调节信号，且随后使用盲源分离算法来重构原始信号。盲源分离算法可以或者可以不使用后处理模块来进一步改善信号分离性能。

虽然一些实例可使用术语“话音信号”用于说明目的，但应明了，各种特征也适用于所有类型的“声音信号”，其可包含语音、音频、音乐等。

一个方面提供了在麦克风信号记录高度相关且一个源信号是所要信号的情况下改善盲源分离性能。为了改善***的总体性能，可在后处理之后采用例如谱减法技术等非线性处理方法。非线性处理可进一步帮助区分所要信号与噪声和其它不合意的源信号。

图1说明经配置以执行信号增强的移动装置的实例。移动装置102可为移动电话、蜂窝式电话、个人助理、数字音频记录器、通信装置等，其包含至少两个麦克风104和106，所述麦克风经定位以从一个或一个以上源俘获音频信号。麦克风104和106可放置于通信装置102中的各种位置处。举例来说，麦克风104和106可在移动装置102的同一侧上彼此相当靠近地放置，使得其从所要话音源(例如，用户)俘获音频信号。两个麦克风之间的距离可例如从0.5厘米到10厘米变化。虽然此实例说明两个麦克风的配置，但其它实施方案可包含位于不同位置的额外麦克风。

在话音通信中，所要话音信号常常被包含街道噪声、多路重合噪声、汽车噪声等的周围噪声破坏。此噪声不仅降低了所要话音的可理解性，而且使得收听者不舒适。因此，期望在向通信的另一方传输话音信号之前减少周围噪声。因此，移动装置102可经配置以或适于执行信号处理以增强所俘获的声音信号的质量。

盲源分离(BSS)可用以减少周围噪声。BSS将所要话音视为一个原始源，且将周围噪声视为另一源。通过迫使经分离的信号彼此独立，其可使所要话音与周围噪声分离，即，减少话音信号中的周围噪声且减少周围噪声信号中的所要话音。大体上，所要话音是独立的源。但是，噪声可来自若干方向。因此，周围噪声信号中的话音减少可良好完成。然而，话音信号中的噪声减少可能取决于声学环境，且可比周围噪声信号中的话音减少更具挑战性。也就是说，由于周围噪声的分布式特征，使得难以出于盲源分离目的将其表示为单个源。

由于两个麦克风104与106之间的靠近定位，由两个麦克风104和106俘获的音频信号可能高度相关且信号差异可能非常小。因此，传统的盲源分离处理可能无法成功增强所要音频信号。因此，移动装置102可经配置以或适于例如通过实施校准和波束成形级然后是盲源分离级来分离所要话音与周围噪声。

图2是说明经配置以执行靠近间隔的麦克风的信号增强的移动装置的组件和功能的框图。移动装置202可包含至少两个(单向或全向)麦克风204和206，其以通信方式耦合到任选的预处理(校准)级208，之后是波束成形级211，之后是另一任选的中间处理(校准)级213，之后是盲源分离级210，且之后是任选的后处理(例如，校准)级215。至少两个麦克风204和206可从一个或一个以上声音源216、218和220俘获混合的声学信号S₁ 212和S₂ 214。举例来说，声学信号S₁ 212和S₂ 214可为来自声音源216、218和220的两个或两个以上源声音信号的S_o1、S_o2和S_oN的混合物。声音源216、218和220可表示一个或一个以上用户、背景或周围噪声等。所俘获的输入信号S′₁和S′₂可由模/数转换器207和209取样以提供经取样的声音信号s₁(t)和s₂(t)。

声学信号S₁ 212和S₂ 214可包含所要声音信号和不需要的声音信号。术语“声音信号”包含(但不限于)音频信号、话音信号、噪声信号和/或可由麦克风以声学方式传输和俘获的其它类型的信号。

预处理(校准)级208、波束成形级211和/或中间处理(校准)级213可经配置以或适于预调节俘获的经取样的信号s₁(t)和s₂(t)，以便避免与盲源分离相关联的不确定性问题。也就是说，虽然盲源分离算法可用以分离所要话音信号和周围噪声，但这些算法在信号分离之后不能确定哪一输出信号是所要话音且哪一输出信号是周围噪声。这是由于所有盲源分离算法的固有不确定性。然而，在特定假设下，一些盲源分离算法可能能够避免此不确定性。举例来说，如果所要话音在一个输入通道中比另一输入通道中强得多，那么可能盲源分离的结果是确定性的。而在使用靠近间隔的麦克风俘获信号S′₁和S′₂的情况下，此假设并不有效。因此，如果盲源分离算法直接应用于接收的信号S′₁和S′₂(或经数字化的声音信号s₁(t)和s₂(t))，那么不确定性问题可能继续存在。因此，信号S′₁和S′₂可经历预处理(例如，校准级208和/或213和/或波束成形级211)以利用两个或两个以上源声音信号S_o1、S_o2和S_oN的方向性，以便增强来自所要方向的信号接收。

波束成形级211可经配置以通过利用所接收的声音信号s₁(t)和s₂(t)的方向性来区分有用的声音信号。波束成形级211可通过线性组合由至少两个或两个以上麦克风212和214俘获的信号来执行空间滤波。空间滤波增强来自所要方向的声音信号的接收，且抑制来自其它方向的干扰信号。举例来说，在两个麦克风的***中，波束成形级211产生第一输出x₁(t)和第二输出x₂(t)。在第一输出x₁(t)中，可通过空间滤波来增强所要话音。在第二输出x₂(t)中，可抑制所要话音且可增强周围噪声信号。

举例来说，如果用户是第一声音源218，那么原始源信号S_o2是所要源声音信号(例如，所要话音信号)。因此，在第一输出x₁(t)中，波束成形级211可执行波束成形以增强从第一声音源218的接收，同时抑制来自其它声音源216和220的信号S_o1和S_oN。在第二输出x₂(t)中，校准级208和/或213和/或波束成形级211可执行空间陷波滤波以抑制所要话音信号且增强周围噪声信号。

输出信号x₁(t)和x₂(t)可通过盲源分离级210以分离所要话音信号和周围噪声。盲源分离(BSS)(也称为独立分量分析(ICA))可用以基于这些信号的多个混合物来恢复源信号。在信号分离过程期间，仅作为源声音信号S_o1、S_o2和S_oN的混合物的有限数目的信号x₁(t)和x₂(t)可用。没有关于混合过程的先前信息可用。没有对源声音信号的直接测量可用。有时，一些或所有源信号S_o1、S_o2和S_oN的先验统计信息可能可用。举例来说，源信号中的一者可为高斯分布且另一源信号可均匀分布。

盲源分离级210可提供其中噪声已经减少的第一BSS信号和其中话音已经减少的第二BSS信号因此，第一BSS信号可携载所要话音信号。第一BSS信号可随后由发射器222发射224。

图3是根据一个实例的顺序波束成形器和盲源分离级的框图。校准和波束成形模块302可经配置以预调节两个或两个以上输入信号s₁(t)、s₂(t)和s_n(t)，且提供对应的输出信号x₁(t)、x₂(t)和x_n(t)，其随后用作对盲源分离模块304的输入。两个或两个以上输入信号s₁(t)、s₂(t)和s_n(t)可相关或彼此相依。通过波束成形的信号增强可不必将两个或两个以上输入信号s₁(t)、s₂(t)和s_n(t)建模为独立的随机过程。输入信号s₁(t)、s₂(t)和s_n(t)可为经取样的离散时间信号。

波束成形级-原理

在波束成形中，可在空间和时间两者上对输入信号s_i(t)进行线性滤波以产生输出信号x_i(t)：

其中k-1是n个麦克风通道输入中的每一者中的延迟分支的数目。如果所要源信号由s_source(t)表示(例如，来自图2中的第一声音源218的源信号S_o2)，那么可选择波束成形器权重w_i(p)以使得波束成形器输出x_i(t)提供所要源信号s_source(t)的估计此现象通常称为在所要源信号s_source(t)的方向上形成波束。

波束成形器可广义地分类为两种类型：固定波束成形器和自适应波束成形器。固定波束成形器是不依赖数据的波束成形器，其采用固定滤波器权重来组合从多个麦克风获得的空间-时间样本。自适应波束成形器是依赖于数据的波束成形器，其采用输入信号的统计知识来导出波束成形器的滤波器权重。

图4是经配置以执行空间波束成形的波束成形模块的实例的框图。仅空间波束成形是空间-时间波束成形方法(即，固定波束成形器)的子集。波束成形模块402可经配置以接收多个输入信号s₁(t)、s₂(t)...s_n(t)，且提供在方向上增强的一个或一个以上输出信号和换位器404接收所述多个输入信号s₁(t)、s₂(t)...s_n(t)，且执行换位运算以获得信号向量其中上标T表示换位运算。

信号向量可随后由空间权重向量进行滤波以增强所关注信号或抑制不想要的信号。空间权重向量增强从特定方向(例如，由权重界定的波束的方向)的信号俘获，同时抑制来自其它方向的信号。

举例来说，空间噪声滤波器406可接收信号向量且通过应用n×1第一空间权重向量对其进行滤波以产生第一波束成形器输出使得

此波束成形器可利用输入信号s₁(t)、s₂(t)...s_n(t)的空间信息以提供所要(声音或话音)信号的信号增强。

在另一实例中，波束成形模块402可包含空间陷波滤波器408，其抑制来自第二波束成形器输出的所要信号。在此情况下，空间陷波滤波器408通过使用n×1空间第二权重向量而抑制来自所要方向的信号，所述n×1空间第二权重向量正交于第一空间权重向量使得

将空间陷波滤波器408应用于输入信号向量以产生第二波束成形器输出其中所要信号经最小化。

第二波束成形器输出可提供对所俘获的输入信号中的背景噪声的估计。以此方式，第二波束成形器输出可来自与第一波束成形器输出正交的方向。

由波束成形模块402提供的空间区分能力可取决于相对于传播信号的波长使用的两个或两个以上麦克风的间距。波束成形模块402的方向性/空间区分通常随着两个或两个以上麦克风之间的相对距离增加而改善。因此，对于紧密间隔的麦克风，波束成形模块402的方向性可能较弱，且可执行进一步的时间后处理以改善信号增强或抑制。然而，尽管存在波束成形模块402的此性能限制，但其仍可能提供输出信号和中的足够空间区分以改善后续盲源分离级的性能。图4的波束成形模块402中的输出信号和可为来自图3的波束成形模块302或图2的波束成形级211的输出信号x₁(t)和x₂(t)。

波束成形模块302可对输入信号实施各种额外的预处理操作。在一些例子中，在由两个麦克风俘获的信号之间可能存在显著的声级(例如，功率电平、能量级)差异。声级的此差异可使得难以执行波束成形。因此，一个方面可提供校准输入信号作为执行波束成形的一部分。对输入信号的此校准可在波束成形级(例如，图2，校准级208和213)之前和/或之后执行。在各种实施方案中，预盲源分离校准级可为基于振幅和/或基于交叉相关的校准。也就是说，在基于振幅的校准中，是通过对话音或声音输入信号的振幅彼此进行比较来对将进行校准。在基于交叉相关的校准中，是通过对话音或声音信号的交叉相关彼此进行比较来对其进行校准。

校准和波束成形-实例1

图5是说明使用来自两个或两个以上麦克风的输入信号的校准和波束成形的第一实例的框图。在此实施方案中，可在波束成形模块504执行波束成形之前由校准模块502校准第二输入信号s₂(t)。校准过程可公式化为s′₂(t)＝c₁(t)·s₂(t)。校准因数c₁(t)可缩放第二输入s₂(t)，使得s′₂(t)中的所要话音的声级接近于第一输入信号s₁(t)的所要话音的声级。

在获得校准因数c₁(t)以校准图5中的两个输入信号s₁(t)和s₂(t)时可使用各种方法。图6和7说明在获得校准因数c₁(t)时可使用的两种方法。

图6是说明用于获得校准因数的第一方法的流程图，可应用所述校准因数以在基于两个麦克风信号实施波束成形之前校准两个麦克风信号。校准因数c₁(t)可根据分别对第一输入信号s₁(t)和第二输入信号s₂(t)的短期话音能量估计获得。可针对第一输入信号s₁(t)的块而获得第一多个能量项或估计Ps₁(t)_(1...k)，其中每一块包含第一输入信号s₁(t)的多个样本(602)。类似地，可针对第二输入信号s₂(t)的块而获得第二多个能量项或估计Ps₂(t)_(1...k)，其中每一块可包含第二输入信号s₂(t)的多个样本(604)。举例来说，可使用以下方程式根据信号样本块而计算能量估计Ps₁(t)和Ps₂(t)：

可通过例如在五十(50)或一百(100)个块的能量项上搜索第一多个能量项或估计Ps₁(t)_(1...k)而获得第一最大能量估计Qs₁(t)(606)。类似地，可通过搜索第二多个能量项或估计Ps₂(t)_(1...k)而获得第二最大能量估计Qs₂(t)(608)。计算若干块上的这些最大能量估计可为在不实施话音活动检测器的情况下计算所要话音的能量的较简单方式。在一个实例中，第一最大能量估计Qs₁(t)可使用以下方程式来计算：

其中t_max对应于以最大能量估计Qs₁(t)识别的信号块。第二最大能量估计Qs₂(t)可用类似方式计算。或者，第二最大能量估计Qs₂(t)也可计算为在t_max信号块处计算的第二麦克风信号的能量估计：Qs₂(t)＝Ps₂(t_max)。也可在计算校准因数c₁(t)之前随着时间而使第一最大能量估计Qs₁(t)和第二最大能量估计Qs₂(t)平均化(平滑)(610)。举例来说，可如下执行指数平均化：

可基于第一最大能量估计Qs₁(t)和第二最大能量估计Qs₂(t)而获得校准因数c₁(t)(612)。在一个实例中，可使用以下方程式获得校准因数：

还可随着时间进一步使校准因数c₁(t)平滑(614)以过滤掉校准估计中的任何瞬变。随后可在使用第一输入信号s₁(t)和第二输入信号s₂(t)执行波束成形之前将校准因数c₁(t)应用于第二输入信号s₂(t)(616)。或者，可随着时间计算和校准因数c₁(t)的倒数并使其平滑，且随后在使用第一输入信号s₁(t)和第二输入信号s₂(t)执行波束成形之前将校准因数c₁(t)的倒数应用于第一输入信号s₁(t)(616)。

图7是说明用于获得校准因数的第二方法的流程图，可应用所述校准因数以在基于两个麦克风信号实施波束成形之前校准两个麦克风信号。在此第二方法中，可使用两个输入信号s₁(t)和s₂(t)之间的交叉相关而不是短期能量估计Ps₁(t)和Ps₂(t)。如果两个麦克风彼此靠近定位，那么两个输入信号中的所要话音(声音)信号可预期彼此高度相关。因此，可获得第一输入信号s₁(t)与第二输入信号s₂(t)之间的交叉相关估计PS₁₂(t)以校准第二麦克风信号s₂(t)中的声级。举例来说，可获得第一输入信号s₁(t)的第一多个块，其中每一块包含第一输入信号s₁(t)的多个样本(702)。类似地，可获得第二输入信号s₂(t)的第二多个块，其中每一块包含第二输入信号s₂(t)的多个样本(704)。可通过使第一和第二多个块的对应块交叉相关而获得第一输入信号s₁(t)与第二输入信号s₂(t)之间的多个交叉相关估计Ps₁₂(t)_(1...k)(706)。举例来说，可使用以下方程式来计算交叉相关估计Ps₁₂(t)：

可通过搜索所述多个交叉相关估计Ps₁₂(t)_(1...k)而获得第一输入信号s₁(t)与第二输入信号s₂(t)之间的最大交叉相关估计Qs₁₂(t)(708)。举例来说，可通过使用以下方程式而获得最大交叉相关估计Qs₁₂(t)：

可使用方程式(6)和(7)将第二最大能量估计Qs₂(t)计算为最大第二麦克风能量估计(712)。或者，第二最大能量估计也可计算为在t_max信号块处计算的第二麦克风信号的能量估计：Qs₂(t)＝Ps₂(t_max)。可例如通过使用以下方程式执行指数平均化来使最大交叉相关估计Qs₁₂(t)和最大能量估计Qs₂(t)平滑(710)：

例如使用以下方程式，基于最大交叉相关估计Qs₁₂(t)和第二最大能量估计而获得校准因数c₁(t)(714)：

因此，可基于第一输入信号s₁(t)与第二输入信号s₂(t)之间的交叉相关估计与第二输入信号s₂(t)的能量估计的比率而产生校准因数c₁(t)。随后可将校准因数c₁(t)应用于第二输入信号s₂(t)以获得经校准的第二输入信号s′₂(t)，其随后可添加到第一输入信号s₁(t)。

再次参看图5，在校准之后所得的第一输出信号x₁(t)和第二输出信号x₂(t)可由波束成形模块504相加或相减，使得：

第一输出信号x₁(t)可被视为固定空间波束成形器的输出，其形成朝向所要声音源的波束。第二输出信号x₂(t)可被视为固定陷波波束成形器的输出，其通过在所要声音源方向上形成空值而抑制所要话音信号。

在另一实例中，校准因数c₁(t)可基于第一输入信号s₁(t)与第二输入信号s₂(t)之间的交叉相关估计与第一输入信号s₁(t)的能量估计的比率而产生。校准因数c₁(t)随后应用于第一输入信号s₁(t)。随后可从第二输入信号s₂(t)减去经校准的第一输入信号。

校准和波束成形-实例2

图8是说明使用来自两个或两个以上麦克风的输入信号的校准和波束成形的第二实例的框图。在此实施方案中，不是使用校准因数来缩放第二输入信号s₂(t)(如图5中)，而是可使用校准因数c₁(t)来在波束成形之前调整输入信号s₁(t)和s₂(t)两者。用于此实施方案的校准因数c₁(t)可由校准模块802例如使用图6和7中描述的相同程序来获得。一旦获得校准因数c₁(t)，则波束成形模块804便可产生输出信号x₁(t)和x₂(t)，使得：

其中第一输出信号x₁(t)可被视为固定空间波束成形器的输出，所述固定空间波束成形器形成朝向所要声音源的波束。第二输出信号x₂(t)可被视为固定陷波波束成形器的输出，所述固定陷波波束成形器通过在所要声音源方向上形成空值而抑制所要话音信号。

在一个实例中，校准因数c₁(t)可基于第一与第二输入信号之间的交叉相关与第二输入信号s₂(t)的能量估计。可将第二输入信号s₂(t)乘以校准因数c₁(t)且添加到第一输入信号s₁(t)。可将第一输入信号s₁(t)除以校准因数c₁(t)且从第一输入信号s₁(t)减去。

校准和波束成形-实例3

图9是说明使用来自两个或两个以上麦克风的输入信号的校准和波束成形的第三实例的框图。此实施方案使图5和8中说明的校准程序一般化以包含自适应滤波器902。第二麦克风信号s₂(t)可用作自适应滤波器902的输入信号，且第一麦克风信号s₁(t)可用作参考信号。自适应滤波器902可包含权重w_t＝[w_t(0) w_t(1)…w_t(N-1)]^T，其中N为自适应滤波器902的长度。自适应滤波过程可表示为

可使用各种类型的自适应滤波算法来调适自适应滤波器902。举例来说，可如下使用最小均方(LMS)型算法来调适自适应滤波器902，

w_t＝W_t-1+2μx₂(t)s₂(t) (方程式23)

其中μ是步长大小，且是如方程式24中说明的第二输入信号向量：

自适应滤波器902可充当自适应波束成形器且抑制第二麦克风输入信号s₂(t)中的所要话音。如果将自适应滤波器长度选择为一(1)，那么此方法变为等效于图7中描述的校准方法，其中可使用两个麦克风信号之间的交叉相关来校准第二麦克风信号。

波束成形模块904处理第一麦克风信号s₁(t)和经滤波的第二麦克风信号s′₂(t)以获得第一输出信号x₁(t)和第二输出信号x₂(t)。第二输出信号x₂(t)可被视为固定陷波波束成形器的输出，所述固定陷波波束成形器通过在所要声音(话音)源方向上形成空值而抑制所要话音信号。可通过将经滤波的第二麦克风信号s′₂(t)添加到第一麦克风信号s₁(t)以获得所要声音源信号的经波束成形的输出来获得第一输出信号x₁(t)，如下：

x₁(t)＝s₁(t)+s′₂(t) (方程式25)

第一输出信号x₁(t)可以因数0.5缩放以保持x₁(t)中的话音级与s₁(t)中的话音级相同。因此，第一输出信号x₁(t)含有所要话音(声音)信号和周围噪声两者，而第二输出信号x₂(t)主要含有周围噪声和一些所要话音(声音)信号。

校准和波束成形-实例4

图10是说明使用来自两个或两个以上麦克风的输入信号的校准和波束成形的第四实例的框图。在此实施方案中，在波束成形之前不执行校准。而是，由波束成形模块1002首先执行波束成形，波束成形模块1002如下组合两个输入信号s₁(t)和s₂(t)：

在波束成形之后，波束成形器第二输出信号x′₂(t)中的噪声级可比第一输出信号x₁(t)中低得多。因此，可使用校准模块1004来缩放波束成形器第二输出信号x′₂(t)中的噪声级。校准模块1004可根据波束成形器输出信号x₁(t)和x′₂(t)的噪声底限估计获得校准因数c₁(t)。x₁(t)和x′₂(t)的短期能量估计可分别由Px₁(t)和Px′₂(t)表示，且对应的噪声底限估计可由Nx₁(t)和Nx′₂(t)表示。噪声底限估计Nx₁(t)和Nx′₂(t)可通过找到短期能量估计Px₁(t)和Nx′₂(t)在若干连续块(比如输入信号样本的50或100个块)上的最小值来获得。举例来说，噪声底限估计Nx₁(t)和Nx′₂(t)可分别使用方程式27和28来计算：

噪声底限估计Nx₁(t)和Nx′₂(t)可随着时间而平均化以平滑掉不连续性，且校准因数c₁(t)可计算为经平滑噪声底限估计的比率，使得

其中N′x₁(t)和N′x′₂(t)是x₁(t)和x′₂(t)的经平滑噪声底限估计。经波束成形的第二输出信号x′₂(t)以校准因数c₁(t)缩放以获得最终噪声参考输出信号x″₂(t)，使得：

x″₂(t)＝c₁(t)x′₂(t) (方程式30)

在校准之后，可应用自适应滤波器1006。自适应滤波器1006可如参考自适应滤波器902(图9)所述而实施。第一输出信号x₁(t)可用作对自适应滤波器1006的输入信号，且经校准的输出信号x″₂(t)可用作参考信号。自适应滤波器1006可抑制经校准的波束成形器输出信号x″₂(t)中的所要话音信号。因此，第一输出信号x₁(t)可含有所要话音和周围噪声两者，而第二输出信号x₂(t)可主要含有周围噪声和一些所要话音。因此，两个输出信号x₁(t)和x₂(t)可满足早先针对避免BSS的不确定性而提出的假设，即，其并不高度相关。

在图5到10中说明的各种实例中，校准级可对话音或声音符号实施基于振幅和/或基于交叉相关的校准。

盲源分离级

再次参看图3，来自波束成形模块302的输出信号x₁(t)、x₂(t)和x_n(t)可传递到盲源分离模块304。盲源分离模块304可处理波束成形器输出信号x₁(t)、x₂(t)和x_n(t)。信号x₁(t)、x₂(t)和x_n(t)可为源信号的混合物。盲源分离模块304分离输入混合物，且产生源信号的估计y₁(t)、y₂(t)和y_n(t)。举例来说，在仅一个源信号可为所要信号的双麦克风噪声减少的情况下，盲源分离模块304可使所要话音信号(例如，图2中的第一源声音信号S_o2)和周围噪声(例如，图2中的噪声S_o1和S_oN)解相关。

盲源分离-原理

在盲源分离或解相关中，将输入信号视为独立的随机过程。用来以盲的方式分离信号的假设是所有随机过程均彼此在统计上独立，即，所有随机过程S₁、S₂和S_m的联合概率分布P是所有个别随机过程的乘积。此假设可公式化为

其中是所有随机过程S₁，...，S_m的联合分布，且是第j个随机过程S_j的分布。

大体上，盲源分离可分类为两个类别，瞬时BSS和卷积BSS。瞬时BSS称为混合输入信号s(t)，其可建模为瞬时矩阵混合，其公式化为

x(t)＝As(t) (方程式32)

其中s(t)是m×1向量，x(t)是n×1向量。A是n×m标量矩阵。在分离过程中，计算m×n标量矩阵B且将其用以重构信号使得类似于s(t)直到任意的置换和任意的缩放。也就是说，矩阵BA可分解为PD，其中矩阵P是置换矩阵，且矩阵D是对角矩阵。置换矩阵是通过置换同一维度的单位矩阵而导出的矩阵。对角矩阵是仅在其对角线上具有非零条目的矩阵。应注意，对角矩阵D不必为单位矩阵。如果所有m个声音源彼此独立，那么在矩阵D的对角线上应不存在任何零条目。大体上，n≥m对于完全的信号分离是合意的，即，麦克风数目n大于或等于声音源数目m。

实践中，可使用瞬时混合来建模的问题很少。信号通常在由麦克风或音频传感器俘获之前行进经过非理想通道。因此，可使用卷积BSS来更好地建模输入信号。

图11是说明卷积盲源分离从多个混合输入信号恢复源信号的操作的框图。源信号s₁(t)1102和s₂(t)1104可通过一通道，在其中所述源信号经混合。经混合信号可由麦克风俘获为输入信号s′₁(t)和s′₂(t)，且通过预处理级1106，在其中所述输入信号可在通过盲源分离级1108之前经预调节(例如，波束成形)为信号x₁(t)和x₂(t)。

输入信号s′₁(t)和s′₂(t)可基于原始的源信号s₁(t)1102和s₂(t)1104以及从声音源到一个或一个以上麦克风的通道传递函数和输入的混合物来建模。举例来说，可使用卷积BSS，其中混合输入信号s′(t)可建模为

其中s_j(t)是源自第j个声音源的源信号，s′_i(t)是由第i个麦克风俘获的输入信号，h_ij(t)是第j个声音源与第i个麦克风之间的传递函数，且符号表示卷积运算。同时，对于卷积BSS，如果n≥m，即，麦克风数目n大于或等于声音源数目m，那么可实现完全分离。

在图11中，传递函数h₁₁(t)和h₁₂(t)表示从第一信号源到第一和第二麦克风的通道传递函数。类似地，传递函数h₂₁(t)和h₂₂(t)表示从第二信号源到第一和第二麦克风的通道传递函数。信号在传递到盲源分离级1108之前通过预处理级1106(波束成形)。混合输入信号s′₁(t)和s′₂(t)(如由第一和第二麦克风俘获)随后通过波束成形预处理级1106以获得信号x₁(t)和x₂(t)。

盲源分离可随后应用于混合信号x_i(t)以分离或提取对应于原始源信号s_j(t)的估计为完成此情形，可在盲源分离级1108处使用一组滤波器W_ji(z)以颠倒信号混合。为了方便，盲源分离是在Z变换域中表示。在此实例中，X₁(z)是x₁(t)的Z域型式，且X₂(z)是x₂(t)的Z域型式。

根据滤波器W_ji(z)修改信号X₁(z)和X₂(z)以获得原始源信号S(z)(等效于时域中的s(t))的估计使得

信号估计可近似原始信号S(z)直到任意的置换和任意的卷积。如果混合传递函数h_ij(t)是在Z域中表达，那么总体***传递函数可公式化为

W(z)H(z)＝PD(z) (方程式35)

其中P是置换矩阵且D(Z)是对角传递函数矩阵。D(Z)的对角线上的元素是传递函数而不是标量(如瞬时BSS中表示)。

盲源分离-解相关

再次参看图3，因为原始输入信号s₁(t)和s₂(t)可高度相关，所以第二输出x₂(t)的信号电平在波束成形模块302之后可为低。这可减少盲源分离模块304的收敛速率。为了使盲源分离模块304的收敛速率最大化，可在盲源分离之前使用第二校准。图12是说明在波束成形预处理级之后但在盲源分离级1204之前可如何校准信号的第一实例。可提供信号x₁(t)和x₂(t)作为对校准模块1202的输入。在此实例中，信号x₂(t)以标量c₂(t)缩放，如下，

标量c₂(t)可基于信号x₁(t)和x₂(t)来确定。举例来说，可如图10和方程式27、28和29中说明，使用x₁(t)和x₂(t)的噪声底限估计计算校准因数。

在校准之后，x₁(t)中的所要话音信号比中的所要话音信号强得多。于是可在使用盲源分离算法时避免不确定性。实践中，期望使用可避免信号缩放的盲源分离算法，信号缩放为盲源分离算法的另一一般性问题。

图13是说明在盲源分离之前实施信号校准的替代方案的框图。类似于图8中说明的校准过程，校准模块1302产生第二缩放因数c₂(t)以改变、配置或修改盲源分离模块1304的适应性(例如，算法、权重、因数等)而不是使用其来缩放信号x₂(t)。

盲源分离-后处理

再次参看图3，由盲源分离模块304输出的所述一个或一个以上源信号估计y₁(t)、y₂(t)和y_n(t)可进一步由后处理模块308处理，后处理模块308提供输出信号和可添加后处理模块308以进一步改善所要话音信号估计的信噪比(SNR)。在某些情况下，如果预调节校准和波束成形模块302产生周围噪声的良好估计，那么盲源分离模块304可被绕过且后处理模块308单独地可产生所要话音信号的估计。类似地，如果盲源分离模块304产生所要话音信号的良好估计，那么后处理模块308可被绕过。

在信号分离过程之后，提供信号y₁(t)和y₂(t)。信号y₁(t)可主要含有所要信号和某种程度的经衰减的周围噪声。信号y₁(t)可称为话音参考信号。周围噪声的减少依据环境和噪声的特性而变化。信号y₂(t)可主要含有周围噪声，其中所要信号已经减少。其也称为噪声参考信号。

根据校准和波束成形模块302和盲源分离模块304的各种实施方案，噪声参考信号中的所要话音信号已经大部分移除。因此，后处理模块308可着重于从话音参考信号移除噪声。

图14是说明用以从所要话音参考信号减少噪声的后处理模块的操作的实例的框图。可使用非因果自适应滤波器1402来进一步减少话音参考信号y₁(t)中的噪声。噪声参考信号y₂(t)可用作对自适应滤波器1402的输入。经延迟信号y₁(t)可用作自适应滤波器1402的参考。自适应滤波器P(z)1402可使用最小均方(LMS)型自适应滤波器或任何其它自适应滤波器来调适。因此，后处理模块可能能够提供含有具有减少噪声的所要话音参考信号的输出信号

在较一般的意义上，后处理模块308可对输出信号y₁(t)和y₂(t)执行噪声校准，如图2的后处理级215中所说明。

实例方法

图15是说明根据一个实例的增强盲源分离的方法的流程图。可接收或获得与第一麦克风相关联的第一输入信号和与第二麦克风相关联的第二输入信号(1502)。可通过校准第一和第二输入信号且应用波束成形技术以对第一和第二输入信号提供方向性且获得对应的第一和第二输出信号来预处理第一和第二输入信号(1504)。也就是说，波束成形技术可包含图4、5、6、7、8、9和/或10中说明的技术以及其它波束成形技术。举例来说，在两个麦克风的***中，波束成形技术产生第一和第二输出信号，使得来自所要方向的声音信号可在波束成形器的第一输出信号中放大，而来自所要方向的声音信号在波束成形器的第二输出信号中被抑制。

在一个实例中，波束成形技术可包含将自适应滤波器应用于第二输入信号，从第二输入信号减去第一输入信号，和/或将经过滤的第二输入信号添加到第一输入信号(如例如图9中说明)。

在另一实例中，波束成形技术可包含基于第一输入信号和第二输入信号的能量估计的比率产生校准因数，且将校准因数应用于第一输入信号或第二输入信号中的任一者(如例如图5和6中说明)。

或者，在另一实例中，波束成形技术可包含基于第一与第二输入信号之间的交叉相关估计与第二输入信号的能量估计的比率而产生校准因数，且将校准因数应用于所述第一输入信号或第二输入信号中的至少一者(如例如图5、7和8中说明)。

在又一实例中，波束成形技术可包含(a)将第二输入信号添加到第一输入信号以获得经修改的第一信号，(b)从第二输入信号减去第一输入信号以获得经修改的第二信号，(c)获得针对经修改的第一信号的第一噪声底限估计，(d)获得针对经修改的第二信号的第二噪声底限估计，(e)基于第一噪声底限估计与第二噪声底限估计的比率而产生校准因数，(f)将校准因数应用于经修改的第二信号，和/或(g)将自适应滤波器应用于经修改的第一信号且从经修改的第二信号减去经滤波的经修改的第一信号(如例如图10中说明)以获得对应的第一和第二输出信号。

盲源分离(BSS)技术随后可应用于经预处理的第一输出信号和经预处理的第二输出信号以产生第一BSS信号和第二BSS信号(1506)。在一个实例中，可通过以下操作在应用盲源分离技术之前对输出信号中的一者或一者以上执行预校准：(a)基于第一和第二输出信号获得校准因数，以及(b)在对第一和第二输出信号应用盲源分离技术之前校准第一和第二输出信号中的至少一者(如例如图12中说明)。在另一实例中，可在应用盲源分离技术之前执行的预校准包含(a)基于第一和第二输出信号获得校准因数，以及(b)基于校准因数修改盲源分离技术的操作(如例如图13中说明)。

可任选地校准第一和第二输入信号、第一和第二输出信号或第一和第二BSS信号中的至少一者(1508)。举例来说，第一校准(例如，图2中的预处理级校准208)可作为基于振幅的校准或基于交叉相关的校准而应用于第一和第二输入信号中的至少一者。另外，第二校准(例如，图2中的中间处理级校准213)可作为基于振幅的校准或基于交叉相关的校准而应用于来自波束成形级的第一和第二输出信号中的至少一者。

另外，第三校准(例如，图2中的后处理级校准215)可作为基于噪声的校准而应用于来自盲源分离级的第一和第二BSS信号中的至少一者。举例来说，自适应滤波器可应用(在后处理级校准中)于第一BSS信号以减少第一BSS信号中的噪声，其中第二BSS信号用作对自适应滤波器的输入(1508)。在后处理级校准的一个实例中，将自适应滤波器应用于第一BSS信号以减少第一BSS信号中的噪声，其中第二BSS信号用作对自适应滤波器的输入(如例如图14中说明)。

根据又一配置，移动装置中的电路可适于接收与第一麦克风相关联的第一输入信号。相同电路、不同电路或相同或不同电路的第二部分可适于接收与第二麦克风相关联的第二输入信号。另外，相同电路、不同电路或相同或不同电路的第三部分可适于将波束成形技术应用于第一和第二输入信号以向第一和第二输入信号提供方向性且获得对应的第一和第二输出信号。适于获得第一和第二输入信号的电路的部分可直接或间接耦合到向第一和第二输入信号应用波束成形的电路的部分，或其可为相同电路。相同或不同电路的第四部分可适于向第一输出信号和第二输出信号应用盲源分离(BSS)技术以产生第一BSS信号和第二BSS信号。任选地，相同或不同电路的第五部分可适于校准第一和第二输入信号、第一和第二输出信号或第一和第二BSS信号中的至少一者。波束成形技术可向第一输入信号和第二输入信号应用不同的方向性，且不同的方向性放大来自第一方向的声音信号，同时使来自其它方向(例如，来自正交或相反方向)的声音信号衰减。所属领域的技术人员将认识到，大体上，本发明中描述的大多数处理可以类似方式实施。电路或电路部分中的任一者可单独实施或作为集成电路的一部分与一个或一个以上处理器组合实施。电路中的一者或一者以上可在集成电路、高级RISC机器(ARM)处理器、数字信号处理器(DSP)、通用处理器等上实施。

图1、2、3、4、5、6、7、8、9、10、11、12、13、14和/或15中说明的组件、步骤和/或功能中的一者或一者以上可重新布置和/或组合为单个组件、步骤或功能或者在若干组件、步骤或功能中实施。也可添加额外的元件、组件、步骤和/或功能。在图1、2、3、4、5、8、9、10、11、12、13和/或14中说明的设备、装置和/或组件可经配置以执行图6、7和/或15中描述的方法、特征或步骤中的一者或一者以上。本文描述的新颖算法可有效地以软件和/或嵌入硬件来实施。

所属领域的技术人员将进一步了解，结合本文所揭示的配置而描述的各种说明性逻辑块、模块、电路和算法步骤可实施为电子硬件、计算机软件或上述两者的组合。为了清楚地说明硬件与软件的这种可互换性，上文大体上根据各种说明性组件、块、模块、电路和步骤的功能性来描述各种说明性组件、块、模块、电路和步骤。将此功能性实施为硬件还是软件取决于特定应用和强加于整个***的设计限制。

本文描述的各种特征可在不同***中实施。举例来说，波束成形级和盲源分离级可在单个电路或模块中、在单独的电路或模块上实施、由一个或一个以上处理器执行、由并入机器可读或计算机可读媒体中的计算机可读指令执行和/或在手持式装置、移动计算机和/或移动电话中实施。

应注意，上述配置仅是实例且不应解释为限制权利要求书。对配置的描述既定为说明性的，且不限制权利要求书的范围。由此，本发明的教示可容易应用于其它类型的设备，且所属领域的技术人员将明了许多替代、修改和变化。

Claims

1.一种方法，其包括：

接收与第一麦克风相关联的第一输入信号和与第二麦克风相关联的第二输入信号；

将波束成形技术应用于所述第一和第二输入信号以给所述第一和第二输入信号提供方向性且获得对应的第一和第二输出信号；

将盲源分离(BSS)技术应用于所述第一输出信号和第二输出信号以产生第一BSS信号和第二BSS信号；以及

校准以下各者中的至少一者：

应用所述波束成形技术之前的所述第一和第二输入信号，及

应用所述波束成形技术之后且在应用所述盲源分离技术之前的所述第一和第二输出信号。

2.根据权利要求1所述的方法，其中所述波束成形技术通过将空间滤波器应用于所述第一和第二输入信号来给所述第一和第二输入信号提供方向性。

3.根据权利要求2所述的方法，其中将空间滤波器应用于所述第一和第二输入信号放大来自第一方向的声音信号，同时衰减来自其它方向的声音信号。

4.根据权利要求2所述的方法，其中将空间滤波器应用于所述第一和第二输入信号放大所述所得第一输出信号中的所要话音信号且衰减所述第二输出信号中的所述所要话音信号。

5.根据权利要求1所述的方法，其中校准所述第一和第二输入信号中的至少一者包括将自适应滤波器应用于所述第二输入信号，且应用所述波束成形技术包含从所述第二输入信号中减去所述第一输入信号。

6.根据权利要求5所述的方法，其中应用所述波束成形技术进一步包括将所述经滤波的第二输入信号添加到所述第一输入信号。

7.根据权利要求1所述的方法，其中校准所述第一和第二输入信号中的至少一者进一步包括：

基于所述第一输入信号和第二输入信号的能量估计的比率而产生校准因数；以及

将所述校准因数应用于所述第一输入信号或所述第二输入信号中的至少一者。

8.根据权利要求1所述的方法，其中校准所述第一和第二输入信号中的至少一者进一步包括：

基于所述第一与第二输入信号之间的交叉相关估计与所述第二输入信号的能量估计的比率而产生校准因数；以及

将所述校准因数应用于所述第二输入信号。

9.根据权利要求1所述的方法，其中校准所述第一和第二输入信号中的至少一者进一步包括：

基于所述第一与第二输入信号之间的交叉相关估计与所述第一输入信号的能量估计的比率而产生校准因数；以及

将所述校准因数应用于所述第一输入信号。

10.根据权利要求1所述的方法，其中校准所述第一和第二输入信号中的至少一者进一步包括：

基于第一与第二输入信号之间的交叉相关和所述第二输入信号的能量估计而产生校准因数；

将所述第二输入信号乘以所述校准因数；以及

将所述第一输入信号除以所述校准因数。

11.根据权利要求1所述的方法，其中将所述波束成形技术应用于所述第一和第二输入信号进一步包括：

将所述第二输入信号添加到所述第一输入信号以获得经修改的第一信号；以及

从所述第二输入信号中减去所述第一输入信号以获得经修改的第二信号。

12.根据权利要求11所述的方法，其中校准所述第一和第二输入信号中的至少一者进一步包括：

获得所述经修改的第一信号的第一噪声底限估计；

获得所述经修改的第二信号的第二噪声底限估计；

基于所述第一噪声底限估计与所述第二噪声底限估计的比率而产生校准因数；以及

将所述校准因数应用于所述经修改的第二信号。

13.根据权利要求12所述的方法，其进一步包括：

将自适应滤波器应用于所述经修改的第一信号，且从所述经修改的第二信号中减去所述经滤波的经修改的第一信号。

14.根据权利要求1所述的方法，其进一步包括：

基于所述第一和第二输出信号获得校准因数；以及

在将所述盲源分离技术应用于所述第一和第二输出信号之前校准所述第一和第二输出信号中的至少一者。

15.根据权利要求1所述的方法，其进一步包括：

基于所述第一和第二输出信号获得校准因数；以及

基于所述校准因数修改所述盲源分离技术的操作。

16.根据权利要求1所述的方法，其进一步包括：

将自适应滤波器应用于所述第一BSS信号以减少所述第一BSS信号中的噪声，其中将所述第二BSS信号用作对所述自适应滤波器的输入。

17.根据权利要求1所述的方法，其中校准所述第一和第二输入信号中的至少一者包含应用基于振幅的校准或基于交叉相关的校准中的至少一者。

18.根据权利要求1所述的方法，其中校准所述第一和第二输出信号中的至少一者包含应用基于振幅的校准或基于交叉相关的校准中的至少一者。

19.根据权利要求1所述的方法，其中校准所述第一和第二BSS信号中的至少一者包含应用基于噪声的校准。

20.一种通信装置，其包括：

第一麦克风，其经配置以获得第一输入信号；

第二麦克风，其经配置以获得第二输入信号；

波束成形模块，其经配置以对所述第一和第二输入信号执行波束成形以获得对应的第一和第二输出信号；

盲源分离模块，其经配置以对所述第一输出信号和所述第二输出信号执行盲源分离(BSS)技术以产生第一BSS信号和第二BSS信号；以及

至少一个校准模块，其经配置以校准以下各者中的至少一者：

执行所述波束成形技术之前的所述第一和第二输入信号，及

执行所述波束成形技术之后且在执行所述盲源分离技术之前的所述第一和第二输出信号。

21.根据权利要求20所述的通信装置，其中所述波束成形模块通过将空间滤波器应用于所述第一和第二输入信号来执行波束成形，其中将空间滤波器应用于所述第一和第二输入信号放大来自第一方向的声音信号，同时衰减来自其它方向的声音信号。

22.根据权利要求21所述的通信装置，其中将空间滤波器应用于所述第一输入信号和第二输入信号放大所述第一输出信号中的所要话音信号且衰减所述第二输出信号中的所述所要话音信号。

23.根据权利要求20所述的通信装置，其中对所述第一和第二输入信号执行波束成形，所述波束成形模块进一步经配置以：

将自适应滤波器应用于所述第二输入信号；

从所述第二输入信号中减去所述第一输入信号；以及

将所述经滤波的第二输入信号添加到所述第一输入信号。

24.根据权利要求20所述的通信装置，其中校准所述第一和第二输入信号中的至少一者，所述校准模块进一步经配置以：

将所述校准因数应用于所述第二输入信号。

25.根据权利要求20所述的通信装置，其中校准所述第一和第二输入信号中的至少一者，所述校准模块进一步经配置以：

将所述校准因数应用于所述第一输入信号。

26.根据权利要求20所述的通信装置，其中校准所述第一和第二输入信号中的至少一者，所述校准模块进一步经配置以：

将所述第二输入信号乘以所述校准因数；以及

将所述第一输入信号除以所述校准因数。

27.根据权利要求20所述的通信装置，其中对所述第一和第二输入信号执行波束成形，所述波束成形模块进一步经配置以：

将所述第二输入信号添加到所述第一输入信号以获得经修改的第一信号；

从所述第二输入信号中减去所述第一输入信号以获得经修改的第二信号；

获得所述经修改的第一信号的第一噪声底限估计；

获得所述经修改的第二信号的第二噪声底限估计；且

所述校准模块进一步经配置以：

将所述校准因数应用于所述经修改的第二信号。

28.根据权利要求20所述的通信装置，其进一步包括：

后处理模块，其经配置以将自适应滤波器应用于所述第一BSS信号以减少所述第一BSS信号中的噪声，其中所述第二BSS信号用作对所述自适应滤波器的输入。

29.根据权利要求20所述的通信装置，其中所述至少一个校准模块包含第一校准模块，所述第一校准模块经配置以将基于振幅的校准或基于交叉相关的校准中的至少一者应用于所述第一和第二输入信号。

30.根据权利要求20所述的通信装置，其中所述至少一个校准模块包含第二校准模块，所述第二校准模块经配置以将基于振幅的校准或基于交叉相关的校准中的至少一者应用于所述第一和第二输出信号。

31.根据权利要求20所述的通信装置，其中所述至少一个校准模块包含第三校准模块，所述第三校准模块经配置以将基于噪声的校准应用于所述第一和第二BSS信号。

32.一种通信装置，其包括：

用于接收与第一麦克风相关联的第一输入信号和与第二麦克风相关联的第二输入信号的装置；

用于将波束成形技术应用于所述第一和第二输入信号以给所述第一和第二输入信号提供方向性且获得对应的第一和第二输出信号的装置；

用于将盲源分离(BSS)技术应用于所述第一输出信号和第二输出信号以产生第一BSS信号和第二BSS信号的装置；以及

用于校准以下各者中的至少一者的装置：

应用所述波束成形技术之前的所述第一和第二输入信号，及

33.根据权利要求32所述的通信装置，其进一步包括：

用于将自适应滤波器应用于所述第一BSS信号以减少所述第一BSS信号中的噪声的装置，其中所述第二BSS信号用作对所述自适应滤波器的输入。

34.根据权利要求32所述的通信装置，其进一步包括：

用于将自适应滤波器应用于所述第二输入信号的装置；

用于从所述第二输入信号中减去所述第一输入信号的装置；以及

用于将所述经滤波的第二输入信号添加到所述第一输入信号的装置。

35.根据权利要求32所述的通信装置，其进一步包括：

用于基于所述第一和第二输出信号获得校准因数的装置；以及

用于在将盲源分离技术应用于所述第一和第二输出信号之前校准所述第一和第二输出信号中的至少一者的装置。

36.根据权利要求32所述的通信装置，其进一步包括：

用于基于所述校准因数修改所述盲源分离技术的操作的装置。

37.一种用于增强两个或两个以上信号的盲源分离的电路，其中所述电路适于：

将盲源分离(BSS)技术应用于所述第一输出信号和所述第二输出信号以产生第一BSS信号和第二BSS信号；以及

校准以下各者中的至少一者：

应用所述波束成形技术之前的所述第一和第二输入信号，及

38.根据权利要求37所述的电路，其中所述波束成形技术将空间滤波应用于所述第一输入信号和第二输入信号，且所述空间滤波器放大来自第一方向的声音信号，同时衰减来自其它方向的声音信号。

39.根据权利要求37所述的电路，其中所述电路是集成电路。

40.一种计算机可读媒体，其包括用于增强两个或两个以上信号的盲源分离的指令，所述指令在由处理器执行时致使所述处理器：

获得与第一麦克风相关联的第一输入信号和与第二麦克风相关联的第二输入信号；

将盲源分离(BSS)技术应用于所述经预处理的第一信号和经预处理的第二信号以产生第一BSS信号和第二BSS信号；以及

校准以下各者中的至少一者：

所述第一和第二输入信号、应用所述波束成形技术之前的信号，及

所述第一和第二输出信号或应用所述波束成形技术之后且在应用所述盲源分离技术之前的所述第一和第二BSS信号。