CN113875264A

CN113875264A - 用于眼镜装置的麦克风配置、***、设备和方法

Info

Publication number: CN113875264A
Application number: CN202080038007.6A
Authority: CN
Inventors: 樊大申; 陈曦
Original assignee: Solos Technology Ltd
Current assignee: Solos Technology Ltd
Priority date: 2019-05-22
Filing date: 2020-05-21
Publication date: 2021-12-31
Also published as: JP2022533391A; WO2021048632A3; GB2597009B; GB2597009A; JP7350092B2; WO2021048632A2; GB202115400D0

Abstract

描述了从戴在用户头部的设备中提取所需声音信号的***和方法。设备包括头戴式装置和具有至少三个麦克风的阵列。所述至少三个麦克风沿多个至少两个非平行的轴设置。选择逻辑被配置为从所述多个非平行的轴中识别被选定的轴，以及从形成所述被选定轴的阵列中识别两个麦克风。波束形成器被配置为接收来自所述两个麦克风的信号作为输入，并输出主麦克风通道和参考麦克风通道。

Description

用于眼镜装置的麦克风配置、***、设备和方法

本专利申请是2015年10月18日提交的，名称为“具有噪声消除麦克风几何形状设备的头戴式声学***及方法”，序列号为14/886，077的美国非临时专利申请的部分延续案，该美国非临时专利申请是2014年3月12日提交的，名称为“用于所需信号提取的双级降噪结构”，序列号为14/207，163的美国非临时专利申请的部分延续案，序列号为14/207，163的美国非临时专利申请要求2013年3月13日提交的，名称为“噪声消除麦克风设备”，序列号为61/780，108的美国临时专利申请的优先权以及2014年2月18日提交的名称为“用于处理声音信号的***和方法”，序列号为61/941，088的美国临时专利申请的优先权。

专利申请序列号14/886，077也是2014年2月14日提交的，名称为“具有麦克风阵列的眼镜”，序列号为14/180，994的美国非临时专利申请的部分延续案，序列号为14/180，994的美国非临时专利申请要求2013年3月13日提交的序列号为61/780，108的美国临时专利申请的优先权以及2013年6月25日提交的序列号为61/839，211的美国临时专利申请的优先权以及2013年6月25日提交的序列号为61/839，227的美国临时专利申请的优先权以及2013年12月6日提交的序列号为61/912，844的美国临时专利申请的优先权。

本专利申请还要求2019年2月5日提交的，名称为“用于眼镜装置设备和方法的麦克风配置”，序列号为62/801，618的美国临时专利申请的优先权。

美国临时专利申请序列号为62/801，618的文献在此通过参考引入。美国临时专利申请序列号为61/780，108的文献在此通过参考引入。美国临时专利申请序列号为61/941，088的文献在此通过参考引入。美国非临时专利申请序列号为14/207，163的文献在此通过参考引入。美国非临时专利申请序列号为14/180，994的文献在此通过参考引入。美国临时专利申请序列号为61/839，211的文献在此通过参考引入。美国临时专利申请序列号为61/839，227的文献在此通过参考引入。美国临时专利申请序列号为61/912，844的文献在此通过参考引入。

技术领域

本发明总体上涉及检测和处理声音信号数据的可穿戴装置，更具体地涉及降低头戴式声学***中的噪声并辅助用户听力。

背景技术

声学***采用麦克风等声音传感器接收音频信号。通常，这些***用于现实世界的环境中，这些环境会同时向接收麦克风提供所需声音信号和非所需声音信号(也称之为噪声)。这种接收麦克风是各种***的一部分，如：移动电话、手持式麦克风、助听器等等。这些***通常对接收到的声音信号进行语音识别处理。同时接收所需声音信号和非所需声音信号会对所需声音信号的质量产生不良影响。所需声音信号的质量下降会导致输出到用户的所需声音信号难以被用户理解。在语音识别(SR)或自动语音识别(ASR)等算法中使用劣化的所需声音信号会导致错误率增加，这会使重建的语音难以理解。其中任何一个都会带来问题。

手持***需要用户的手指来抓握和/或操作其中实现有该手持***的装置。例如以移动电话为例。占用用户的手指会阻止用户执行任务关键功能。这会带来一些问题。

非所需声音信号(噪声)可能来自多种源，这些源不是所需声音信号的源。因此，非所需声音信号的源在统计上与所需声音信号无相关性。这些源可以是非平稳源，也可以来自平稳源。平稳的情况适用于声音信号的振幅、频率和方向没有明显变化的时间和空间。例如，在汽车环境中，恒速时的发动机噪声是平稳的，道路噪声或风噪等也是如此。在非平稳信号的情况下，声音信号的噪声振幅、频率分布和方向随着时间和/或空间的变化而变化。非平稳噪声源自例如汽车音响，源自诸如撞击、开门或关门等的转瞬即逝的噪声，诸如车辆后座中的闲聊这样的背景对话等等。非所需声音信号的平稳和非平稳源存在于办公环境、音乐厅、足球场、飞机客舱、用户使用声学***的任何地方(如，移动电话、平板电脑等配备有麦克风、耳机、耳塞式麦克风等)有时候，声学***使用的环境是混响的，从而导致噪声在环境中回荡，利用非所需声音信号的多条路径到达麦克风位置。任何一个噪声源，即，非平稳或平稳的非所需声音信号都会增加语音识别算法如SR或ASR的错误率，或者会容易使***难以向用户输出可理解的所需声音信号。所有这些都会带来问题。

各种噪声消除方法已被采用以降低来自稳定和非稳定源的噪声。现有的噪声消除方法在噪声的强度小于所需声音信号的强度的环境中工作得较好，例如在相对低噪声的环境中。频谱减法用于降低语音识别算法和各种声学***，如助听器，中的噪声。

当在自动语音识别(ASR)应用中使用时，当非所需声音信号的强度变大时，采用频谱减法的***会产生不可接受的错误率。这会带来问题。

此外，现有算法，如频谱减法等，采用声音信号频谱减法的非线性处理。声音信号的非线性处理导致输出与输入不成比例相关。语音识别(SR)算法是使用安静无噪声的环境下记录的语音信号开发的。因此，当通过非线性信号处理在语音处理过程中引入非线性失真时，语音识别算法(在安静无噪声的环境中开发的)会产生高错误率。声音信号的非线性处理会导致所需声音信号的非线性失真，这扰乱了语音识别所需的特征提取，这会导致高错误率。所有这些都会带来问题。

各种方法已被使用以尝试从声学***，例如在语音识别(SR)或自动语音识别(ASR)应用中，抑制或移除非所需声音信号。一种被称为语音活动检测器(VAD)的方法。VAD尝试检测何时存在所需语音以及何时存在非所需语音。从而仅接受所需语音，并通过不传输非所需语音而将其视为噪声。传统的语音活动检测仅适用于单个声源或强度相对于所需声音信号的强度较小的平稳噪声(非所需声音信号)。因此，传统的语音活动检测使VAD在嘈杂的环境中表现不佳。此外，当所需声音信号和非所需声音信号同时到达接收麦克风时，使用VAD来移除非所需声音信号效果不佳。这会带来一些问题。

在嘈杂环境中使用的具有单个麦克风的声学***存在一个问题，即所需声音信号和非所需声音信号在单个通道上被同时接收。非所需声音信号会使所需声音信号对于人类用户或对于被设计为使用接收的语音的算法，例如语音识别(SR)或自动语音识别(ASR)算法来说，是难以理解的。这会带来一些问题。多通道已经被用来解决同时接收所需和非所需声音信号的问题。因此，在一个通道上，接收所需声音信号和非所需声音信号，而在另一个通道上，接收也包含了所需声音信号和非所需声音信号的声音信号。随着时间的推移，各个通道的灵敏度可能会发生漂移，从而导致非所需声音信号在通道之间变得不平衡。漂移通道灵敏度会导致无法将非所需声音信号从所需声音信号中准确移除。原始所需声音信号的非线性失真可能是由于处理从灵敏度随时间漂移的通道获得的声音信号而导致的。这会带来一些问题。

附图说明

通过参考用于说明本发明各实施例的以下描述及附图，可获得对本发明的最佳理解。本发明通过在各实施例中以示例的方式进行说明，并且不被附图所限制，在附图中，相同的附图标记指示类似的元件。

图1是根据本发明实施例的一种在头戴式装置上配置麦克风的通用流程的示意图。

图2是根据本发明实施例的麦克风布局几何形状的示意图。

图3A是根据本发明实施例的主麦克风位于第一位置的通用麦克风布局的示意图。

图3B是根据本发明实施例的图3A中的主麦克风的信噪比差的测量值的示意图。

图3C是根据本发明实施例的图3B中所示数据的信噪比差与增加麦克风声学分割距离的示意图。

图4A是根据本发明实施例的主麦克风位于第二位置的通用麦克风布局的示意图。

图4B是根据本发明实施例的图4A中的主麦克风的信噪比差的测量值的示意图。

图4C是根据本发明实施例的图4B中所示数据的信噪比差与增加麦克风声学分割距离的示意图。

图5A是根据本发明实施例的主麦克风位于第三位置的通用麦克风布局的示意图。

图5B是根据本发明实施例的图5A中的主麦克风的信噪比差的测量值的示意图。

图5C是根据本发明实施例的图5B中所示数据的信噪比差与增加麦克风声学分割距离的示意图。

图6是根据本发明实施例的麦克风指向性图案的示意图。

图7是根据本发明实施例的一种未对准的参考麦克风响应轴的示意图。

图8是本发明一实施例中的具有两个嵌入式麦克风的眼镜的示意图。

图9是本发明一实施例中的具有三个嵌入式麦克风的眼镜的示意图。

图10是本发明另一实施例中利用在四个声学端口使用的四个全向麦克风代替两个双向麦克风的示意图。

图11是采用放置在由眼镜的前框架限定的镜片开口的斜对角的两个全向麦克风的本发明的眼镜的示意图。

图12是采用了沿眼镜框架的顶部和底部放置的四个全向麦克风的本发明的另一个实施例的示意图。

图13是本发明的另一个实施例的示意图，其中麦克风们被放置在眼镜的镜腿部分且面朝内，以及眼镜的前框架的下中心角且面朝下。

图14是本发明的另一个实施例的示意图，其中麦克风们被放置在眼镜的镜腿部分且面朝内，以及眼镜的前框架的下中心角且面朝下。

图15是根据本发明实施例的一种具有内置声学噪声消除***的眼镜的示意图。

图16是根据本发明实施例的来自图15的头戴式装置中的主麦克风位置的示意图。

图17是根据本发明实施例的一种具有内置声学噪声消除***的护目镜的示意图。

图18是根据本发明实施例的一种具有内置声学噪声消除***的遮阳帽的示意图。

图19是根据本发明实施例的一种具有内置声学噪声消除***的头盔的示意图。

图20是根据本发明实施例的一种提取所需声音信号的流程的示意图。

图21是根据本发明实施例的***架构的示意图。

图22是根据本发明实施例的滤波器控制的示意图。

图23是根据本发明实施例的***架构的另一示意图。

图24A是根据本发明实施例的包含自动平衡的***架构的另一示意图。

图24B是根据本发明实施例的降噪流程的示意图。

图25A是根据本发明实施例的波束形成的示意图。

图25B是根据本发明实施例的波束形成的另一个示意图。

图25C是根据本发明实施例的利用共享声学元件的波束形成的示意图。

图26是根据本发明实施例的多通道自适应滤波的示意图。

图27是根据本发明实施例的单通道滤波的示意图。

图28A是根据本发明实施例的所需语音活动检测的示意图。

图28B是根据本发明实施例的一种归一化语音阈值比较器的示意图。

图28C是根据本发明实施例的使用多个参考通道的所需语音活动检测的示意图。

图28D是根据本发明实施例的使用压缩的流程的示意图。

图28E是根据本发明实施例的用于提供压缩的不同函数的示意图。

图29A是根据本发明实施例的一种自动平衡架构的示意图。

图29B是根据本发明实施例的自动平衡的示意图。

图29C是根据本发明实施例的滤波的示意图。

图30是根据本发明实施例的一种用于自动平衡的流程的示意图。

图31是根据本发明实施例的一种语音信号处理***的示意图。

图32A是根据本发明实施例的头戴式装置上的麦克风配置的透视图。

图32B是根据本发明实施例的与图32A对应的头戴式装置上的麦克风配置的俯视图。

图32C是根据本发明实施例的与图32A对应的头戴式装置上的麦克风配置的仰视图。

图32D是根据本发明实施例的头戴式装置上的另一组麦克风布局的透视图。

图32E是根据本发明实施例的与图32D对应的头戴式装置上的麦克风布局的仰视图。

图33是根据本发明实施例的来自图32A-D的相对于不同声源的头戴式装置的示意图。

图34是根据本发明实施例的对来自配置有头戴式装置的麦克风阵列的声音信号进行处理的示意图。

具体实施方式

在以下本发明多个实施例的详细说明中，参考了多个附图，在这些附图中相似的附图标记指示相似的元件，且在附图中以说明的方式示出了可以实践本发明的特定实施例。这些实施例得到了充分详细的描述，以使得所属领域技术人员能够实践本发明。在其他实例中，公知的电路、结构以及技术未被详细示出，以避免模糊对本说明书的理解。因此，以下的详细描述将不被理解为限制意义，本发明的范围仅由附加的权利要求限定。

本文描述了用于在头戴式装置内检测和处理包含所需声音信号和非所需声音信号的声信号的设备和方法。在一个或多个实施例中，噪声消除结构结合了多通道噪声消除和单通道噪声消除，以从非所需声音信号中提取所需声音信号。在一个或多个实施例中，多通道声音信号压缩被用于所需语音活动检测。在一个或多个实施例中，声道是自动平衡的。在一个或多个实施例中，***从可能的麦克风阵列中自动选择麦克风的子集用于声音信号提取。在一个或多个实施例中，向用户提供助听，以利于听到来自本地环境的声音。

图1根据本发明实施例由100示出了一种在头戴式装置上配置麦克风的通用流程。参考图1，流程开始于块102。在块104，使用一个或多个麦克风在头戴式装置上创建“主”或“主要”麦克风通道。主麦克风被安装以优化所需声音信号的接收，从而增强与主麦克风相关联的第一信噪比，表示为SNR_M。在块106，使用一个或多个麦克风在头戴式装置上创建参考麦克风通道。参考麦克风位于头戴式装置上，以提供对于来自于用户的所需声音信号的检测的较低信噪比，从而产生表示为SNR_R的第二信噪比。因此，在块108处通过头戴式装置上的麦克风的布局几何形状实现信噪比差，从而导致第一信噪比SNR_M大于第二信噪比SNR_R。

在块110，通过为主麦克风通道和参考麦克风通道创建不同的响应图案(指向性图案)，藉由波束形成来实现信噪比差。下面结合附图对利用不同的指向性图案产生信噪比差进行更详细地描述。

在各种实施例中，在块112，通过麦克风布局几何形状、波束形成以及对主通道和参考通道使用不同的指向性图案中的一个或多个的组合实现信噪比差。流程结束于块114。

图2根据本发明实施例总体上由200示出了麦克风布局几何形状。参考图200，所需声音信号204从所需声音信号源，202所示的用户嘴巴发出。源202向安装在头戴式装置上的麦克风提供所需声音信号204。第一麦克风206位于距离源202的由d₁ 208所示的距离处。第二麦克风210位于距离源202的由d₂ 212所示的距离处。***200也受到218所示的非所需声音信号的影响。

关于源202，如214处的ΔL所示，第一麦克风206和第二麦克风210距离源202的声学距离不同。该声学距离的差异ΔL 214由公式216给出。如在实施例的描述中所使用的，距离d₁和d₂表示声波分别到达麦克风206和210的路径。因此，根据头戴式装置上的麦克风的具***置及其感兴趣的声音频率，这些距离可以是线性的，也可以是弯曲的。为了说明清楚，用直线表示这些路径和对应的距离，但这并不意味着限制。

非所需声音信号218通常由位于比距离d₁和d₂更远的距离处的各种源产生。例如，建筑噪声、汽车噪声、飞机噪声等，所有这些都发源于通常比d₁和d₂大数个数量级的距离处。因此，非所需声音信号218在麦克风位置206和210处基本上相互关联影响，或者至少在每个位置以相当均匀的水平被接收。由于各种机制，相对于第一麦克风208，214处的声学距离上的差异ΔL减小了在第二麦克风210处接收的所需声音信号204的振幅。一种这样的机制是，例如，球面扩散，其导致所需声音信号随着1/r²的变化而衰减。其中r是源(例如202)和接收位置(例如206或210)之间的距离(例如208或212)。第二麦克风位置210处的所需声音信号的减少相对于206降低了210处的信噪比，因为噪声振幅在每个位置处基本上是相同的，但是信号振幅在210处相对于206处接收到的振幅减小。与路径长度相关的另一个机制是沿着一条路径的声阻抗与沿着另一条路径的声阻抗的差异，从而导致弯曲的声学路径而不是直线路径。总体上，这些机制相结合以相对于主麦克风位置降低在参考麦克风位置处接收的所需声音信号的振幅。因此，布局几何形状被用于提供噪声消除***所使用的两个麦克风位置之间的信噪比差，对此将在下面进一步描述，以减少来自主麦克风通道的非所需声音信号。

麦克风布局几何形状允许用于主要麦克风和参考麦克风的放置的各种配置。在各种实施例中，下面结合图3A至图5C描述和呈现了一种通用麦克风布局方法，该方法允许麦克风被放置在头饰装置上的不同位置。

图3A根据本发明实施例，总体上由300示出了主要麦克风位于第一位置的通用麦克风布局。参考图3A，示出了一种头戴式装置302。如在本实施例的详细描述中所使用的，头戴式装置可以是被配置为戴在用户头部的任何装置，例如但不限于眼镜、护目镜、头盔、遮阳帽、头带等。在下面结合图3A至图5C给出的讨论中，可以认识到，该讨论同样适用于任何头戴装置，如图8至图19所示的那些，以及本文的图中没有具体示出的那些头戴式装置。因此，本发明实施例可适用于尚未被命名或尚未发明的头戴式装置。

返回参考图3A，在一个实施例中，头戴式装置具有框架302、镜片308以及镜片310，框架302具有附接的镜腿304和镜腿306。在各种实施例中，头戴式装置302是佩戴在用户头部的一副眼镜。多个麦克风位于头戴式装置302上，例如麦克风1、麦克风2、麦克风3、麦克风4、麦克风5、麦克风6、麦克风7、麦克风8以及可选的麦克风9和麦克风10。在各种实施例中，如图所示的包括框架302/镜腿304和306的头戴式装置可被设定尺寸，以包括如下文所进一步描述的用于信号处理的电子器件318。电子器件318向安装在头戴式装置302上的麦克风提供电连接。

头戴式装置302具有由其结构限定的内部体积，电子器件318可以安装在该内部体积内。可选地，电子器件318可以安装在该结构的外部。在一个或多个实施例中，提供入口面板以接入电子器件318。在其他实施例中，没有明确提供出入门，但是电子器件318可以包含在头戴式装置302的体积内。在这种情况下，电子器件318可以在组装头戴式装置之前被嵌入，其中一个或多个部件互锁在一起，从而形成将电子器件318捕获在其中的外壳。在其他实施例中，头戴式装置被模制在电子器件318的周围，从而将电子器件318封装在头戴式装置302的体积内。在各种非限制性实施例中，电子器件318包括自适应噪声消除单元、单通道噪声消除单元、滤波器控制器、电源、所需语音活动检测器、滤波器等。电子器件118的其他组件在下面的附图中进行描述。

头戴式装置302可以包括开关(未示出)，该开关用于给头戴式装置302通电或断电。

头戴式装置302可以在其体积内包含数据处理***，用于处理由与其相关联的麦克风接收的声音信号。该数据处理***可以包含图31所示***中的一个或多个元件，下面将进一步描述。因此，图3A至图5C的图示并不限制本发明实施例。

图3A的头饰装置说明麦克风可以被放置在装置上的任何位置。附图中所选择的用于说明的十个位置仅仅是为了说明布局几何形状的一般原理而选择的，其并不构成对本发明实施例的限制。因此，可以将麦克风用在所示位置以外的不同位置，并且不同的麦克风可被用于不同的位置。出于说明的目的且没有任何限制的，结合图3A至图5C所示进行的测量使用的是全向麦克风。在其他实施例中，使用定向麦克风。在用于信噪比测量的示例性配置中，每一个麦克风都安装在一个外壳内，每一个外壳都有一个通向环境的端口。箭头1b示出了与麦克风1相关联的端口的方向。箭头2b示出了与麦克风2相关联的端口的方向。箭头3b示出了与麦克风3相关联的端口的方向。箭头4b示出了与麦克风4相关联的端口的方向。箭头5b示出了与麦克风5相关联的端口的方向。箭头6b示出了与麦克风6相关联的端口的方向。箭头7b示出了与麦克风7相关联的端口的方向。箭头8b示出了与麦克风8相关联的端口的方向。

用户嘴巴由312示出且类似于图2中由202所示的所需声音信号的源。从用户嘴巴312到各麦克风的声学路径长度(在此称之为声学距离或距离)由从用户嘴巴312到相应麦克风位置的箭头示出。例如，d₁表示从用户嘴巴312到麦克风1的声学距离。d₂表示从用户嘴巴312到麦克风2的声学距离。d₃表示从用户嘴巴312到麦克风3的声学距离。d₄表示从用户嘴巴312到麦克风4的声学距离。d₅表示从用户嘴巴312到麦克风5的声学距离。d₆表示从用户嘴巴312到麦克风6的声学距离。d₇表示从用户嘴巴312到麦克风7的声学距离。d₈表示从用户嘴巴312到麦克风8的声学距离。同样的，可选的麦克风9和麦克风10也具有声学距离；然而，为保持图中的清晰度，它们没有被如此标记。

在图3A中，麦克风1、2、3和6以及用户嘴巴312大体上落在一个X-Z平面上(见坐标系316)，对应的声学距离d₁、d₂、d₃以及d₆大体上用直线来表示。到达麦克风4、5、7和8的路径，即，d₄、d₅、d₇以及d₈被表示为弯曲路径，这反映了用户的头部对声场来说是不透明的这一事实。因此，在这种情况下，声学路径有一些弯曲。总体而言，所需声音信号的源与头戴式装置上的麦克风之间的声学路径可以是线性的或弯曲的。只要主麦克风和参考麦克风之间的路径长度的差异足够大，就会获得噪声消除***所需的必要的信噪比差，以实现可接受的噪声消除水平。

为了进行图3B和图3C所示的测量，声学测试设备被用于测量主要麦克风和参考麦克风位置之间的信噪比差。测试设施包括一个内置扬声器的人体模型，用于模拟佩戴了头戴式装置的用户。位于用户嘴部位置的扬声器用于产生所需声音信号。人体模型被放置在声学测试设备的消声室内。背景噪声在具有扬声器阵列的消声室内产生。测量过程中使用了粉红噪声频谱；然而，频率中的其他加权可以用于背景噪声场。在这些测量过程中，背景噪声的频谱振幅电平被设置为75dB/upa/Hz。头戴式装置被放置在人体模型上。在测试过程中，麦克风位于头戴式装置上的图3A所示的位置。选择用于主或主要通道的麦克风作为用于第一测量序列的麦克风1，如下图3B和图3C所示。

所需音频信号由单词“Camera”构成。这个词通过人体模型中的扬声器被传递。与麦克风1处的单词“Camera”对应的接收信号通过噪声消除***进行处理(如下面的附图中所描述的)，及时选通，并对其进行平均，以产生与麦克风1相对应的“信号”振幅。在位置2、3、4、5、6、7和8处的每一个其他麦克风处依次测量对应于单词“Camera”的对应信号。同样的，在每个麦克风位置，测量背景噪声频谱电平。通过这些测量，在每个麦克风位置计算信噪比，然后计算麦克风对的信噪比差，如下图所示。

图3B根据本发明实施例总体上由320示出了图3A中的主麦克风的信噪比差的测量值。参照图3B和图3A，在314处，麦克风1被用作主或主要麦克风。然后利用各种位置放置参考麦克风，如麦克风2、麦克风3、麦克风6、麦克风4、麦克风5、麦克风7、以及麦克风8。在图3B中，列322表示用于一组测量的麦克风对。列324表示列322的给定麦克风对之间的声学路径长度的近似差。近似声学路径长度差～ΔL由图2中的公式216给出。列326列出了用于信噪比测量的七个不同麦克风对的无量纲数范围1至7。列328列出了列322中列出的给定麦克风对的信噪比差。每一行330、332、334、336、338、340和342列出不同的麦克风对，其中虽然主麦克风314作为麦克风1保持不变，但参考麦克风发生了改变。请注意，如等式344所示，各种麦克风对的声学路径长度中的近似差可以按递增顺序排列。根据等式344，麦克风对已被以增加近似声学路径长度差324的方式布置在行330～342中。信噪比差从用于麦克风2用作参考麦克风的5.55dB变为当麦克风8被用作参考麦克风时的10.48dB。

图3C根据本发明实施例总体上由350示出了用于图3B所示数据的信噪比差与增加麦克风声学分割距离。参考图3C，在由352所示的垂直轴上绘制信噪比差，并在由354所示的水平轴上绘制来自列326(图3B)的无量纲X值。请注意，如上所述，无量纲X值代表近似声学路径长度差～ΔL。X轴354与～ΔL不完全对应，但它与～ΔL有关，因为该数据是以增大近似声学路径长度差～ΔL的方式排列和绘制的。这种数据排序有助于说明以上结合图2描述的信噪比差的特征，即，信噪比差将随着主麦克风和参考麦克风之间的声学路径长度差的增加而增加。这种行为通过利用曲线356观察信噪比差随着～ΔL的变化而增大而被识别，曲线356绘制来自列328的数据作为来自列326的数据的函数(图3B)。

图4A根据本发明实施例总体上由420示出了主要麦克风位于第二位置的通用麦克风布局。在图4A中，用于主麦克风414的第二位置是麦克风2所在的位置。使用麦克风2作为主麦克风重复上述测试且参考麦克风位置可替换地是麦克风6、麦克风3、麦克风4、麦克风5、麦克风7以及麦克风8所在的位置。下面结合图4B和图4C对这些数据进行说明。

图4B根据本发明实施例示出了图4A中的主麦克风的信噪比差的测量值。参照图4B和图4A，麦克风2被用作主或主要麦克风414。然后利用各种位置放置参考麦克风，如麦克风6、麦克风3、麦克风4、麦克风5、麦克风7以及麦克风8。在图4B中，列422表示用于一组测量的麦克风对。列424表示列422的给定麦克风对之间的声学路径长度的近似差。近似声学路径长度差～ΔL由图2中的公式216给出。列426列出了用于信噪比测量的六个不同麦克风对的无量纲数范围1至6。列428列出了列422中列出的给定麦克风对的信噪比差。每一行430、432、434、336、438和440列出不同的麦克风对，其中虽然主麦克风414作为麦克风2保持不变但参考麦克风发生了改变。请注意，如等式442所示，各种麦克风对的声学路径长度中的近似差可以按递增顺序排列。根据等式442，麦克风对已被以增加近似声学路径长度差424的方式布置在行430～440中。信噪比差从用于麦克风6用作参考麦克风的1.2dB变为当麦克风8被用作参考麦克风时的5.2dB。

图4C根据本发明实施例示出了图4B中所示数据的信噪比差与增加麦克风声学分割距离。参考图4C，在由452所示的垂直轴上绘制信噪比差，并在由454所示的水平轴上绘制来自列426(图4B)的无量纲X值。请注意，如上所述，无量纲X值代表近似声学路径长度差～ΔL。X轴454与～ΔL不完全对应，但它与～ΔL有关，因为该数据是以增大近似声学路径长度差～ΔL的方式排列和绘制的。这种数据排序有助于说明以上结合图2描述的信噪比差的特征，即，信噪比差将随着主麦克风和参考麦克风之间的声学路径长度差的增加而增加。这种行为通过利用曲线456观察信噪比差随着～ΔL的变化而增大而被识别，曲线456绘制来自列428的数据作为来自列426的数据的函数(图4B)。

图5A根据本发明实施例示出了主要麦克风位于第三位置的通用麦克风布局。在图5A中，用于主麦克风514的第三位置是麦克风3所在的位置。使用麦克风3作为主麦克风重复上述测试且参考麦克风位置可替换地是麦克风6、麦克风4、麦克风5、麦克风7、以及麦克风8所在的位置。下面结合图5B和图5C对这些数据进行说明。

图5B根据本发明实施例示出了图5A中的主麦克风的信噪比差的测量值。参照图5B和图5A，麦克风3被用作主或主要麦克风514。然后利用各种位置放置参考麦克风，如麦克风6、麦克风4、麦克风5、麦克风7以及麦克风8所在的位置。在图5B中，列522表示用于一组测量的麦克风对。列524表示列522的给定麦克风对之间的声学路径长度的近似差。近似声学路径长度差～ΔL由图2中的公式216给出。列526列出了用于信噪比测量的五个不同麦克风对的无量纲数范围1至5。列528列出了列522中列出的给定麦克风对的信噪比差。每一行530、532、534、536和538列出不同的麦克风对，其中虽然主麦克风514作为麦克风3保持不变但参考麦克风发生了改变。请注意，各种麦克风对的声学路径长度中的近似差可以如等式540所示，按递增顺序排列。根据等式540，麦克风对已被以增加近似声学路径长度差524的方式布置在行530-538中。信噪比差从用于麦克风6用作参考麦克风的0dB变为当麦克风7被用作参考麦克风时的5.16dB。

图5C根据本发明实施例示出了图5B中所示数据的信噪比差与增加麦克风声学分割距离。参考图5C，在由552所示的垂直轴上绘制信噪比差，并在由554所示的水平轴上绘制来自列526(图5B)的无量纲X值。请注意，如上所述，无量纲X值代表近似声学路径长度差～ΔL。X轴554与～ΔL不完全对应，但它与～ΔL有关，因为该数据是以增大近似声学路径长度差～ΔL的方式排列和绘制的。这种数据排序有助于说明以上结合图2描述的信噪比差的特征，即，信噪比差将随着主麦克风和参考麦克风之间的声学路径长度差的增加而增加。这种行为通过利用曲线556观察信噪比差随着～ΔL的变化而增大而被识别，曲线556绘制来自列528的数据作为来自列526的数据的函数(图5B)。

请注意，在上图中呈现的视图中，麦克风的具***置之所以这样选择仅仅是出于说明的目的。这些位置不构成对本发明实施例的限定。在其他实施例中使用头戴式装置上的麦克风的其他位置。

因此，如以上结合图1块108和图2到图5C所描述的那样，在各种实施例中，麦克风布局几何形状用于在两个麦克风之间产生声学路径长度差，并在主麦克风和参考麦克风之间产生对应的信噪比差。信噪比差也可以通过对主麦克风和参考麦克风使用不同的指向性图案来实现。在一些实施例中，波束形成用于为主通道和参考通道创建不同的指向性图案。例如，在图5A中，声学路径长度d₃和d₆的值过于相似，因此主麦克风和参考麦克风的这种位置选择没有产生足够的信噪比差(在图5B的列528行530处为0dB)。在这种情况下，麦克风指向性图案(一个或两个麦克风)和/或波束形成的变化可用于在主通道和参考通道之间产生所需的信噪比差。

定向麦克风可用于减少所需声音信号的接收和/或增加非所需声音信号的接收，从而降低第二麦克风(参考麦克风)的信噪比，这会导致主要麦克风和参考麦克风之间的信噪比差增大。图3A中示出了一种使用第二麦克风(未示出)以及下文图6和图7中教授的技术的示例。在一些实施例中，第二麦克风可以大体上与麦克风1共同处于相同的位置。在其他实施例中，第二麦克风与源312的距离等于第一麦克风与源312的距离。在一些实施例中，第二麦克风是定向麦克风，其主响应轴大体上垂直于(或等效于未对准)声学路径d₁。因此，在所需声音信号d₁的方向上存在第二麦克风对来自312的所需声音信号零响应或较小响应的方向。结果导致第二麦克风的信噪比降低，且计算出的第一麦克风和第二麦克风之间的信噪比差增加。请注意，这两个麦克风可以放置在头戴式装置302上的任何位置，包括如上所述的相同的位置。在其他实施例中，将一个或多个麦克风元件用作波束形成器的输入，结果导致主通道和参考通道具有不同的指向性图案并在它们之间产生信噪比差。

图6根据本发明实施例总体上由600示出了麦克风指向性图案。参考图6，全向麦克风指向性图案由圆圈602示出，圆圈602具有恒定半径604，恒定半径604表示作为从参考606测量的由608表示的角度α(α)的函数的均匀的灵敏度。

图620内示出了具有心形指向性图案622的定向麦克风的一个示例，其中心形指向性图案622具有由624指示的峰值灵敏度轴和由626指示的零位。心形指向性图案可以由两个全向麦克风形成，或由一个全向麦克风和该麦克风的适当的安装结构形成。

图640内示出了具有双指向性图案642/644的定向麦克风的一个示例，其中双指向性图案的第一瓣642具有由648指示的第一峰值灵敏度轴，第二瓣644具有由646指示的第二峰值灵敏度轴。第一零位存在于方向650，且第二零位存在于方向652。

图660内示出了具有超心形指向性图案的定向麦克风的一个示例，其中超心形指向性图案664/665具有由方向662指示的峰值灵敏度轴，由方向666指示的短灵敏度轴以及由方向668和670指示的零位。

图7根据本发明实施例总体上由700示出了一种未对准的参考麦克风响应轴。参考图7，麦克风由702表示。麦克风702是具有主响应轴706以及在其指向性图案中由704表示的零值的定向麦克风。入射声场被指示为从方向708到达。在各种实施例中，麦克风702例如是如图6所示的双向麦克风。被适当地放置在头戴式装置上的定向麦克风702，在被用作参考麦克风时，通过限制对来自方向708的所需声音信号的响应的同时，对来自方向710的非所需声音信号进行响应，来降低信噪比。如上所述，定向麦克风702的响应将使信噪比差增大。

因此，在本文给出的实施例的教导范围内，一个或多个主麦克风以及一个或多个参考麦克风被放置在头戴式装置上的多个位置，以获得主麦克风和参考麦克风之间的合适的信噪比差。这样的信噪比差使得能够从包含所需声音信号和非所需声音信号的声学信号中提取所需声音信号，如以下结合下面的附图所描述的那样。麦克风可以放置在头戴式装置上的不同位置，包括将主麦克风和参考麦克风共同放置在头戴式装置上的公共位置上。

在一些实施例中，根据块112(图1)，将麦克风布局几何形状的技术与在麦克风电平或通过波束形成获得的不同指向性图案结合在一起，以在主通道和参考通道之间产生信噪比差。

在各种实施例中，头戴式装置是如以下结合以下附图所描述的眼镜装置。图8是本发明一实施例中的眼镜装置800的示例图。如图中所示，眼镜装置800包括具有嵌入式麦克风的眼镜802。眼镜802具有两个麦克风804和806。第一麦克风804设置在眼镜802框架的中间。第二麦克风806设置在眼镜802框架的侧面。麦克风804和806可以是双向或单向的压力梯度麦克风元件。在一个或多个实施例中，各麦克风804和806是橡胶套内的麦克风组件。橡胶套在麦克风的正面和背面提供了带有声学导管的声学端口。两个麦克风804和806以及它们各自的护套可以是相同的。麦克风804和806可以被气密地密封(例如，全密封)。声学导管填充了挡风玻璃材料。端口用机织织物层密封。下部和上部声学端口用防水膜密封。麦克风可以内置在眼镜框架的结构中。每个麦克风都具有顶部孔和底部孔，作为声学端口，在一个实施例中，可以是压力梯度麦克风元件的麦克风804和806可以各自由两个全向麦克风代替。

图9是本发明实施例的另一个例子的示意图。如图9所示，眼镜装置900包括具有三个嵌入式麦克风的眼镜952。图9中的眼镜952类似于图8中的眼镜802，但其替代地采用的是三个麦克风而不是两个麦克风。图9中的眼镜952具有设置在眼镜952中间的第一麦克风954，设置在眼镜952左侧的第二麦克风956，以及设置在眼镜952右侧的第三麦克风958。这三个麦克风可用于上述三麦克风的实施例中。

图10是本发明一实施例中的眼镜1000的示意图，其中例如将图8中所示的两个双向麦克风替换为四个全向麦克风1002、1004、1006、1008以及电子波束调向。将两个双向麦克风替换为四个全向麦克风为眼镜框架的设计者们提供了更多的灵活性和可制造性。在具有四个全向麦克风的示例性的实施例中，四个全向麦克风可以位于眼镜框架上的任何位置，优选地，麦克风对围绕镜片垂直排列。在本实施例中，全向麦克风1002和1004是用于检测要与干扰分离的主要声音的主麦克风；麦克风1004、1008是用于检测要从主要声音中分离的背景噪声的参考麦克风。麦克风阵列可以是全向麦克风，其中全向麦克风可以是以下麦克风的任意组合：驻极体电容麦克风、模拟微机电***(MEMS)麦克风、或数字MEMS麦克风。

本发明另一个示例性的实施例，如图11所示，包括具有噪声消除麦克风阵列的眼镜装置，该眼镜装置包括镜框1100，连接至该镜框的麦克风阵列，该麦克风阵列包括至少一个第一麦克风1102和一个第二麦克风1104，该第一麦克风连接至镜腿区域附近的镜框上，该镜腿区域可以大致位于镜片开口的顶角和支撑臂之间，并提供第一声道输出，该第二麦克风连接至镜片开口的内下角附近的镜框上，并提供第二声道输出。该第二麦克风位于镜片开口1106的对角线上，但它可被设置在沿着镜片的内框的任意地方，例如下角、上角或内框边缘。进一步的，该第二麦克风可以沿着鼻梁左侧或右侧的镜片内边缘设置。

在本发明的又一实施例中，可以使用至少一个柔性印刷电路板(PCB)条将麦克风阵列连接至镜框，如图12所示。在本实施例中，本发明的眼镜装置1200包括：包括第一麦克风1204和第四麦克风1206的上柔性PCB条1202，和包括第二麦克风1210和第三麦克风1212的下柔性PCB条1208。

在进一步的示例性实施例中，镜框还可以包括对应于麦克风阵列的通风孔阵列。麦克风阵列可以是底部端口或顶部端口微机电***(MEMS)麦克风。如图13所示，图13是图12的眼镜的麦克风组件，MEMS麦克风组件1300包括贴在柔性印刷电路板(PCB)1304上的MEMS麦克风1302。垫圈1306将柔性PCB1304与装置外壳1308分开。通风孔1310由柔性PCB1304、垫圈1306和装置外壳1308限定，通风孔1310是一个将声波引导至MEMS麦克风1302的音频通道。第一和第四MEMS麦克风可被连接至上柔性PCB条，第二和第三MEMS麦克风可被连接至下柔性PCB条，MEMS麦克风阵列可以被布置成使得底部端口或顶部端口通过对应的通风孔接收声音信号。

图14示出了眼镜1400的另一替代性的实施例，其中麦克风1402、1404分别被放置在镜腿区域1406和前框架1408处。

图15根据本发明实施例总体上由1500示出了一种具有内置声学噪声消除***的眼镜。参考图15，头戴式装置1502包括用于主声道的一个或多个麦克风和用于参考声道的一个或多个麦克风。头戴式装置1502被配置为作为具有信息显示器1504的可佩戴计算机。在各种实施例中，在1506和/或1508包括电子器件。在各种实施例中，该电子器件可以包括噪声消除电子器件，下面将结合附图对其进行更全面的描述。在其他实施例中，噪声消除电子器件不与头戴式装置1502处于相同位置，而是位于头戴式装置1502的外部。这些实施例中提供无线通信链路，例如与

协议、

等兼容的链路，以将从麦克风接收的声音信号发送到外部位置，以便通过噪声消除电子器件进行处理。

图16根据本发明实施例总体上由1600示出了来自图15的头戴式装置中的主要麦克风位置。参考图16，主麦克风位置由1602示出。

图17根据本发明实施例总体上由1700示出了一种具有内置声学噪声消除***的护目镜。参考图17，护目镜1702形式的头戴式装置在位置1704处配置有一个主麦克风，并在位置1706处配置有一个参考麦克风。在各种实施例中，护目镜1702中包括噪声消除电子器件。下面将结合附图对噪声消除电子器件进行更全面的描述。在其他实施例中，噪声消除电子器件不与头戴式装置1702处于相同位置，而是位于头戴式装置1702的外部。这些实施例中提供无线通信链路，例如与

协议、

协议等兼容的链路，以将从麦克风接收的声音信号发送到外部位置，以便通过噪声消除电子器件进行处理。

图18根据本发明实施例总体上由1800示出了一种具有内置声学噪声消除***的遮阳帽。参考图18，遮阳帽1802形式的头戴式装置具有一个主麦克风1804和一个参考麦克风1806。在各种实施例中，遮阳帽1802中包括噪声消除电子器件。下面将结合附图对噪声消除电子器件进行更全面的描述。在其他实施例中，噪声消除电子器件不与头戴式装置1802处于相同位置，而是位于头戴式装置1802的外部。这些实施例中提供无线通信链路，例如与

协议、

图19根据本发明实施例总体上由1900示出了一种具有内置声学噪声消除***的头盔。参考图19，头盔1902形式的头戴式装置具有一个主麦克风1904和一个参考麦克风1906。在各种实施例中，头盔1902中包括噪声消除电子器件。下面将结合附图对噪声消除电子器件进行更全面的描述。在其他实施例中，噪声消除电子器件不与头戴式装置1902处于相同位置，而是位于头戴式装置1902的外部。这些实施例中提供无线通信链路，例如与

协议、

图20根据本发明实施例总体上由2000示出了一种提取所需声音信号的流程。参考图20，流程开始于块2002。在块2004，从位于头戴式装置上的主麦克风接收主声音信号。在块2006，从位于头戴式装置上的参考麦克风接收参考声音信号。在块2008，形成归一化的主声音信号。在各种实施例中，如下图中所描述的，使用一个或多个参考声信号形成归一化的主声音信号。在块2010，该归一化的主声音信号被用于利用头戴式装置内包含的声音信号处理***控制噪声消除。该流程停止于块2012。

图21根据本发明实施例总体上由2100示出了一种***架构。参考图21，两个声道被输入到一个自适应噪声消除单元2106。本文中被称为主通道2102的第一声道，在本实施例的描述中，同义地被称为“主要”或“主”通道。主通道2102包含所需声音信号和非所需声音信号。如以下附图中详细描述的那样，主通道2102上的声音信号输入由一个或多个声学元件上的所需声音信号和非所需声音信号的存在而产生。根据用于主通道的一个或多个麦克风的配置，麦克风元件可以输出模拟信号。利用模数转换器(AD)(未示出)将模拟信号转换成数字信号。此外，放大器可以位于麦克风元件或AD转换器附近。本文中被称为参考通道2104的第二声道，提供也由所需声音信号和非所需声音信号的存在而产生的声音信号。可选的，可将第二参考通道2104b输入到自适应噪声消除单元2106。类似于主通道，根据用于参考通道的一个或多个麦克风的配置，麦克风元件可以输出模拟信号。利用模数转换器(AD)(未示出)将模拟信号转换成数字信号。此外，放大器可以位于麦克风元件或AD转换器附近。在一些实施例中，麦克风作为数字麦克风被实现。

在一些实施例中，主通道2102具有全向响应，且参考通道2104具有全向响应。在一些实施例中，主通道2102和参考通道2104的声学元件的声束图案不同。在其他实施例中，主通道2102和参考通道2104的声学元件的波束图案相同。然而，主通道2102上接收的所需声音信号不同于参考通道2104上接收的所需声音信号。因此，主通道2102的信噪比不同于参考通道2104的信噪比。总体而言，参考通道的信噪比小于主通道的信噪比。在各种实施例中，作为非限制性的示例，主通道信噪比与参考通道信噪比之间的差大约为1或2分贝(dB)或更大。在其他非限制性的实施例中，主通道信噪比与参考通道信噪比之间的差大约为1分贝(dB)或更小。因此，本发明实施例适用于可以导致相对于所需声音信号的低信噪比的高噪声环境，和可以具有更高信噪比的低噪声环境。如在实施例的描述中所使用的，信噪比意味着一个通道中的所需声音信号与非所需声音信号的比率。进一步的，术语“主通道信噪比”与术语“主信噪比”互换使用。同样的，术语“参考通道信噪比”与术语“参考信噪比”互换使用。

主通道2102、参考通道2104以及可选的第二参考通道2104b向自适应噪声消除单元2106提供输入。虽然图中示出了第二参考通道，但在各种实施例中，使用两个以上的参考通道。自适应噪声消除单元2106对来自主通道2102的非所需声音信号进行滤波，从而提供具有多个声道输入的第一阶段的滤波。在各种实施例中，自适应噪声消除单元2106利用自适应有限脉冲响应(FIR)滤波器。使用本发明实施例中的环境可以呈现混响声场。因此，自适应噪声消除单元2106包括足以近似于***使用环境的脉冲响应的针对主通道的延迟。所用延迟的大小取决于***设计的具体应用，包括是否在设计中必须考虑混响。在一些实施例中，对于非常紧密地放置在一起的麦克风通道(混响不明显的地方)，延迟的大小可以是几分之一毫秒。要注意的是，在可用于延迟的值的范围的低端，通道之间的声传播时间可表示最小延迟值。因此，但在各种实施例中，根据应用的不同，延迟值的范围可以从大约几分之一毫秒到大约500毫秒或更长。以下结合下面的附图提供对自适应噪声消除单元1106以及与其关联的组件的进一步说明。

自适应噪声消除单元2106的输出2107被输入到单通道噪声消除单元2118。单通道噪声消除单元2118对输出2107进行滤波并进一步减少来自输出2107的非所需声音信号，从而提供第二阶段的滤波。单通道噪声消除单元2118对非所需声音信号的滤波主要是平稳作用。单通道噪声消除单元2118包括线性滤波器，例如维纳滤波器，最小均方误差(MMSE)滤波器实现，线性平稳噪声滤波器，或者使用关于待估计参数的先验信息的其他贝叶斯滤波方法。下面将结合附图对单通道噪声消除单元2118使用的滤波器进行更全面的描述。

来自主通道2102的声音信号在2108处被输入到滤波器控制器2112中。同样的，来自参考通道2104的声音信号在2110处被输入到滤波器控制器2112中。可选的第二参考通道在2108b处被输入到滤波器控制2112中。滤波器控制2112为自适应噪声消除单元2106提供控制信号2114，并为单通道噪声消除单元2118提供控制信号2116。在各种实施例中，以下将结合附图对滤波器控制器2112的操作进行更全面的描述。单通道噪声消除单元2118的输出端2120提供一个声音信号，该声音信号主要包含大部分的所需声音信号和减量的非所需声音信号。

根据本发明各实施例，图21所示的***架构可以应用在用于处理声音信号的各种不同的***中。不同声学***的一些例子是，但不限于是，移动通讯，手持式麦克风、悬挂式麦克风、麦克风耳机助听器、免提麦克风装置、嵌入眼镜框架中的可穿戴***，近眼式(NTE)耳机显示器或耳机计算装置，一般配置的头戴式装置，例如但不限于眼镜护目镜、遮阳帽、头带、头盔等。使用这些声学***的环境可以具有入射到声学元件上的多个声能源，这些声学元件为主通道2102和参考通道2104提供声音信号。在各种实施例中，所需声音信号通常是用户自己声音的结果(参见上图2)。在各种实施例中，非所需声音信号通常是由入射到主通道和参考通道的声学元件上的多个声源的非所需声能结合的结果。因此，非所需声音信号在统计上与所需声音信号无相关性。此外，主通道中的非所需声音信号与参考通道中的非所需声音信号之间存在非因果关系。在这种情况下，由于非因果关系，并且由于除了感兴趣的信号(所需声音信号)之外，没有对纯噪声信号(非所需声音信号)的测量，回声消除不起作用。在回声消除降噪***中，产生声音信号的扬声器提供纯噪声信号的度量。在这里描述的***实施例的上下文中，没有可以从中提取纯噪声信号的扬声器或噪声源。

图22根据本发明实施例总体上由2112示出了一种滤波器控制器。参考图22，来自主通道2102的声音信号在2108处被输入到所需语音活动检测单元2202中。主通道活动检测器2206对2108处的声音信号进行监控，以创建与主通道2102上的活动相关联的标志(图21)。可选的，第二参考通道活动检测器(未示出)对2110b处的声音信号进行监控，以创建与第二参考通道上的活动相关联的标志。可选的，第二参考通道活动检测器的输出被连接至禁止控制逻辑2214。参考通道活动检测器2208对2110处的声音信号进行监控，以创建与参考通道2104上的活动相关联的标志(图21)。所需语音活动检测单元2202利用来自2110、2108和可选的2110b的声音信号输入来产生所需语音活动信号2204。以下将在下面的附图中对所需语音活动检测单元2202的操作进行更完整的描述。

在各种实施例中，禁止逻辑单元2214在2210处接收关于主通道活动的信息、在2212处接收关于参考通道活动的信息、以及在2204处接收关于是否存在所需声音信号的信息作为输入。在各种实施例中，禁止逻辑2214输出滤波器控制信号2114/2116，该信号例如被发送到图21的自适应噪声消除单元2106和单通道噪声消除单元2118。主通道活动检测器2206的实现和操作，参考通道活动检测器2208和禁止逻辑2214在名称为“具有基于所需零位的声学装置、***和方法的心形波束”的美国专利US 7386135中有更全面的描述，该专利通过参考并入本文。

在操作中，在各种实施例中，当自适应噪声消除单元2106和单通道噪声消除单元2118应用连续的滤波阶段时，图21的***和图22的滤波器控制器提供对来自主通道2102的非所需声音信号的滤波和去除。在一个或多个实施例中，在整个***中，信号处理的应用是线性应用。在线性信号处理中，输出与输入线性相关。因此，改变输入值会导致输出的成比例变化。信号处理过程对信号的线性应用保持了所需声音信号的质量和保真度，从而基本上消除了或最小化了所需声音信号的任何非线性失真。保持所需声音信号的信号质量对用户是有用的，因为语音的准确再现有助于促进信息的准确传递。

此外，用于处理语音的算法，例如语音识别(SR)算法或自动语音识别(ASR)算法，得益于基本上没有非线性失真的声音信号的精准呈现。因此，通过本发明实施例，消除了由于非线性信号处理过程的应用而可能产生的失真。本发明实施例教导的线性噪声消除算法对所需声音信号进行的改动，对语音识别引擎使用的SR和ASR算法的操作来说是透明的。因此，通过本发明实施例的应用，大大降低了语音识别引擎的错误率。

图23根据本发明实施例总体上由2300示出了另一个***架构图。参考图23，在此处呈现的***架构中，在2302处，第一通道提供来自第一麦克风的声音信号(图中名义上被标记为MIC 1)。在2304处，第二通道提供来自第二麦克风的声音信号(图中名义上被标记为MIC 2)。在各种实施例中，一个或多个麦克风可被用于创建来自第一麦克风2302的信号。在各种实施例中，一个或多个麦克风可被用于创建来自第二麦克风2304的信号。在一些实施例中，一个或多个声学元件可被用来创建对来自第一麦克风2302的信号和来自第二麦克风2304的信号有用的信号(参见以下描述的图25C)。因此，一个声学元件可以由2302和2304共享。在各种实施例中，以下结合下面的附图对在2302、2304处提供信号的声学元件的布置、主通道以及参考通道进行说明。

波束形成器2305接收来自第一麦克风2302的信号和来自第二麦克风2304的信号以及可选地来自第三麦克风2304b(图中名义上被标记为MIC 3)的信号作为输入。波束形成器2305使用信号2302、2304以及可选的2304b，创建包含所需声音信号和非所需声音信号的主通道2308a。波束形成器2305还使用信号2302、2304和可选的2304b，创建一个或多个参考通道2310a和可选的2311a。参考通道包含所需声音信号和非所需声音信号。主通道的信噪比，被称为“主通道信噪比”大于参考通道的信噪比，在此称为“参考通道信噪比”。波束形成器2305和/或用于MIC1和MIC2的声学元件的布置提供大于参考通道信噪比的主通道信噪比。

波束形成器2305被连接至自适应噪声消除单元2306和滤波器控制单元2312。主通道信号在2308a处被从波束形成器2305输出，并且被输入到自适应噪声消除单元2306。同样的，参考通道信号在2310a处被从波束形成器2305输出，并且被输入到自适应噪声消除单元2306。主通道信号还被从波束形成器2305输出，并且在2308b处被输入到滤波器控制器2312。同样的，参考通道信号被从波束形成器2305输出，并且在2310b处被输入到滤波器控制器2312。可选的，第二参考通道信号在2311a被输出，并且被输入到自适应噪声消除单元2306，并且可选的第二参考通道信号在2311b被输出，并且被输入到滤波器控制器2012。

滤波器控制器2312使用输入2308b、2310b以及可选的2311b产生通道活动标志和所需语音活动检测，以将滤波器控制信号2314提供给自适应噪声消除单元2306，并将滤波器控制信号2316提供给单通道降噪单元2318。

在2307处，自适应噪声消除单元2306提供多通道滤波，并在第一阶段的滤波期间对来自主通道2308a的第一数量的非所需声音信号进行滤波，以输出滤波后的主通道。单通道降噪单元2318接收滤波后的主通道2307作为输入并提供第二阶段的滤波，从而进一步减少来自2307的非所需声音信号。单通道降噪单元2318在2320处输出最需要的声音信号。

在各种实施例中，不同类型的麦克风可被用来提供本文中呈现的本发明实施例所需的声音信号。将声波转换成电信号的任何换能器都适合与本文所教导的本发明实施例一起使用。麦克风的一些非限制性示例是，但不限于是，动圈式麦克风、电容式麦克风、驻极体电容麦克风(ECM)、以及微机电***(MEMS)麦克风。在其他实施例中，使用电容式麦克风(CM)。在其他实施例中，使用微机械麦克风。基于压电薄膜的麦克风与其他实施例一起使用。压电元件由陶瓷材料、塑料材料、或薄膜制成。在其他实施例中，使用微机械麦克风阵列。在其他实施例中，使用硅或多晶硅微机械麦克风。在一些实施例中，双向压力梯度麦克风用于提供多个声道。包括本文所描述的***的各种麦克风或麦克风阵列可以安装在诸如眼镜或耳机之类的结构上或内部。

图24A根据本发明实施例总体上由2400示出了包含自动平衡的另一个***架构图。参考图24A，在此处呈现的***架构中，在2402处，第一通道提供来自第一麦克风的声音信号(图中名义上被标记为MIC 1)。在2404处，第二通道提供来自第二麦克风的声音信号(图中名义上被标记为MIC 2)。在各种实施例中，一个或多个麦克风可被用来创建来自第一麦克风2402的信号。在各种实施例中，一个或多个麦克风可被用来创建来自第二麦克风2404的信号。在一些实施例中，如以上结合前面的附图所描述的那样，一个或多个声学元件可被用来创建信号，该信号成为来自第一麦克风2402的信号和来自第二麦克风2404的信号的一部分。在各种实施例中，以下结合下面的附图对在2302、2304处提供信号的声学元件的布置、主通道以及参考通道进行说明。

波束形成器2405接收来自第一麦克风2402的信号以及来自第二麦克风2404的信号作为输入。波束形成器2405使用信号2402和2404创建既包含所需声音信号又包含非所需声音信号的主通道。波束形成器2405还使用信号2402和2404创建参考通道。可选的，在2404b处，第三通道提供来自第三麦克风的声音信号(图中名义上被标记为MIC 3)。该信号被输入波束形成器2405。在各种实施例中，一个或多个麦克风可被用来创建来自第三麦克风的信号2404b。参考通道既包含所需声音信号又包含非所需声音信号。主通道的信噪比，被称为“主通道信噪比”大于参考通道的信噪比，在此称为“参考通道信噪比”。波束形成器2405和/或用于MIC1、MIC2和可选的MIC3的声学元件的布置，提供大于参考通道信噪比的主通道信噪比。在一些实施例中，双向压力梯度麦克风元件提供信号2402、2404、以及可选的2404b。

波束形成器2405被连接至自适应噪声消除单元2406和所需语音活动检测器2412(滤波器控制器)。主通道信号在2408a处被从波束形成器2405输出，并且被输入到自适应噪声消除单元2406。同样的，参考通道信号在2410a处被从波束形成器2405输出，并且被输入到自适应噪声消除单元2406。主通道信号还被从波束形成器2405输出，并且在2408b处被输入到所需语音活动检测器2412。同样的，参考通道信号被从波束形成器2405输出，并且在2410b处被输入到所需语音活动检测器2412。可选的，第二参考通道信号在2409a处被从波束形成器2405输出，并且被输入到自适应噪声消除单元2406，第二参考通道信号在2409b处被从波束形成器2405输出，并且被输入到所需语音活动检测器2412。

所需语音活动检测器2412使用输入2408b、2410b以及可选的2409b产生用于自适应噪声消除单元2408的滤波器控制信号2414和用于单通道降噪单元2418的滤波器控制信号2416。在2407处，自适应噪声消除单元2406提供多通道滤波，并在第一阶段的滤波期间对来自主通道2408a的第一数量的非所需声音信号进行滤波，以输出滤波后的主通道。单通道降噪单元2418接收滤波后的主通道2407作为输入并提供第二阶段的滤波，从而进一步减少来自2407的非所需声音信号。单通道降噪单元2418在2420处输出最需要的声音信号。

所需语音活动检测器2412为自动平衡单元2424提供控制信号2422。自动平衡单元2424在2426处被连接至第一麦克风2402的信号路径。自动平衡单元2424还在2428处被连接至第二麦克风2404的信号路径。可选的，自动平衡单元2424还在2429处被连接至第三麦克风2404b的信号路径。自动平衡单元2424在***的使用寿命内平衡麦克风对远场信号的响应。保持麦克风通道平衡可以提高***性能，并通过防止麦克风灵敏度漂移来保持高水平的性能。下面将结合以下附图对自动平衡单元进行更全面的描述。

图24B根据本发明实施例总体上在2450处示出了降噪的流程。参考图24B，流程开始于块2452。在块2454处，通过***接收主声音信号。主声音信号例如可以是，在各种实施例中，如由2102(图21)、2302/2308a/2308b(图23)，或2402/2408a/2408b(图24A)所表示的信号。在块2456处，通过***接收参考声音信号。参考声音信号例如可以是，在各种实施例中，如由2104以及可选的2104b(图21)、2304/2310a/2310b以及可选的2304b/2311a/2311b(图23)、或者2404/2410a/2410b以及可选的2404b/2409a/2409b(图24A)所表示的信号。在块2458，利用多个输入通道执行自适应滤波，例如利用自适应滤波单元2106(图21)、2306(图23)和2406(图24A)提供如2107(图21)、2307(图23)和2407(图24A)所表示的滤波后的声音信号。在块2460处，使用单通道单元对由块2458的处理产生的滤波后的声音信号进行滤波。单通道单元可以是例如，在各种实施例中，如由2118(图21)、2318(图23)、或2418(图24A)所表示的单元。该流程停止于块2462。

在各种实施例中，自适应噪声消除单元，诸如2106(图21)、2306(图23)以及2406(图24A)，在集成电路装置中实现，该集成电路装置可包括：包含集成电路的集成电路封装。在一些实施例中，自适应噪声消除单元2106或2306或2406在单个集成电路管芯中实现。在其他实施例中，自适应噪声消除单元2106或2306或2406在集成电路装置的不止一个集成电路管芯中实现，该集成电路装置可包括：包含该集成电路的多芯片封装。

在各种实施例中，单通道噪声消除单元、诸如2018(图21)、2318(图23)、以及2418(图24A)，在集成电路装置中实现，该集成电路装置可包括：包含集成电路的集成电路封装。在一些实施例中，单通道噪声消除单元2118或2318或2418在单个集成电路管芯中实现。在其他实施例中，单通道噪声消除单元2118或2318或2418在集成电路装置的不止一个集成电路管芯中实现，该集成电路装置可包括：包含该集成电路的多芯片封装。

在各种实施例中，滤波器控制器，诸如2112(图21和22)或2312(图23)，在集成电路装置中实现，该集成电路装置可包括：包含集成电路的集成电路封装。在一些实施例中，滤波器控制器2112或2312在单个集成电路管芯中实现。在其他实施例中，滤波器控制器2112或2312在集成电路装置的不止一个集成电路管芯中实现，该集成电路装置可包括：包含该集成电路的多芯片封装。

在各种实施例中，波束形成器，诸如2305(图23)或2405(图24A)，在集成电路装置中实现，该集成电路装置可包括：包含集成电路的集成电路封装。在一些实施例中，波束形成器2305或2405在单个集成电路管芯中实现。在其他实施例中，波束形成器2305或2405在集成电路装置的不止一个集成电路管芯中实现，该集成电路装置可包括：包含该集成电路的多芯片封装。

图25A根据本发明实施例总体上由2500示出了波束形成。参考图25A，波束形成模块被应用于两个麦克风输入2502和2504。在一个或多个实施例中，麦克风输入2502可以源自第一定向麦克风，麦克风输入2504可以源自第二定向麦克风，或者麦克风信号2502和2504可以源自全向麦克风。在其他实施例中，麦克风信号2502和2504由双向压力梯度麦克风的输出提供。可以使用各种定向麦克风，例如但不限于，具有心形波束图案、偶极子波束图案、全向波束图案、或用户定义的波束图案的麦克风。在一些实施例中，一个或多个声学元件被配置为提供麦克风输入2502和2504。

在各种实施例中，波束形成模块2506包括滤波器2508。依赖于所使用的麦克风的类型和具体应用，滤波器2508可以提供直流(DC)阻塞滤波器，该滤波器对麦克风输入2502的DC和甚低频分量进行滤波。在滤波器2508之后，在一些实施例中，通过滤波器2510提供额外的滤波。一些麦克风具有作为频率函数的非平坦响应。在这种情况下，可能需要利用去加重滤波器来平坦麦克风的频率响应。滤波器2510可以提供去加重，从而使麦克风的频率响应变平。在通过滤波器2510进行去加重滤波之后，主麦克风通道，在2512a处被提供给自适应噪声消除单元，并在2512b处被提供给所需语音活动检测器。

麦克风输入2504被输入波束形成模块2506中，并且在一些实施例中由滤波器2512对其进行滤波。依赖于所使用的麦克风的类型和具体应用，滤波器2512可以提供直流(DC)阻塞滤波器，该滤波器对麦克风输入2504的DC和甚低频分量进行滤波。滤波器2514对从滤波器2512输出的声音信号进行滤波。滤波器2514调节增益、相位，并且还可以决定声音信号的频率响应的形成。在滤波器2514之后，在一些实施例中，通过滤波器2516提供额外的滤波。一些麦克风具有作为频率函数的非平坦响应。在这种情况下，可能需要利用去加重滤波器来平坦麦克风的频率响应。滤波器2516可以提供去加重，从而使麦克风的频率响应变平。在通过滤波器2516进行去加重滤波之后，参考麦克风通道，在2518a处被提供给自适应噪声消除单元，并在2518b处被提供给所需语音活动检测器。

可选的，第三麦克风通道在2504b处被输入波束形成模块2506中。类似于上述用于通道2504的信号路径，滤波器2512b对第三麦克风通道进行滤波。依赖于所使用的麦克风的类型和具体应用，滤波器2512b可以提供直流(DC)阻塞滤波器，该滤波器对麦克风输入2504b的DC和甚低频分量进行滤波。滤波器2514b对从滤波器2512b输出的声音信号进行滤波。滤波器2514b调节增益、相位，并且还可以决定声音信号的频率响应的形成。在滤波器2514b之后，在一些实施例中，通过滤波器2516b提供额外的滤波。一些麦克风具有作为频率函数的非平坦响应。在这种情况下，可能需要利用去加重滤波器来平坦麦克风的频率响应。滤波器2516b可以提供去加重，从而使麦克风的频率响应变平。在通过滤波器2516b进行去加重滤波之后，第二参考麦克风通道，在2520a处被提供给自适应噪声消除单元，并在2520b处被提供给所需语音活动检测器。

图25B根据本发明实施例总体上由2530给出了波束形成的另一个示意图。参考图25B，利用第一麦克风2532和第二麦克风2538为主通道创建波束图案。从第一麦克风2532输出的信号2534被输入到加法器2536。从第二麦克风2538输出的信号2540，其振幅在块2542处被调整，并且其相位通过在块2544处施加一个延迟而被调整，从而产生输入到加法器2536的信号2546。加法器2536从另一个信号中减去一个信号，从而得到输出信号2548。根据麦克风2532和2538的初始波束图案和在2542处施加的增益以及在2544处施加的延迟，输出信号2548具有可以呈现多种形式的波束图案。作为非限制性的示例，波束图案可以包括心形、偶极子等。

利用第三麦克风2552和第四麦克风2558为参考通道创建波束图案。从第三麦克风2552输出的信号2554被输入到加法器2556。从第四麦克风2558输出的信号2560，其振幅在块2562处被调整，并且其相位通过在块2564处施加一个延迟而被调整，从而产生输入到加法器2556的信号2566。加法器2556从另一个信号中减去一个信号，从而得到输出信号2568。根据麦克风2552和2558的初始波束图案和在2562处施加的增益以及在2564处施加的延迟，输出信号2568具有可以呈现多种形式的波束图案。作为非限制性的示例，波束图案可以包括心形、偶极子等。

图25C根据本发明实施例总体上由2570示出了利用共享声学元件的波束形成。参考图25C，麦克风2552被在主声道和参考声道之间共享。来自麦克风2552的输出被拆分并在2572处传送到增益2574和延迟2576，然后在2586处被输入加法器2536。可以选择2574处的适当增益和2576处的延迟，以等效地实现来自加法器2536的输出2578，该输出等效于来自加法器2536的输出2548(图25B)。类似地，增益2582和延迟2584可被调整，以提供等效于2568(图25B)的输出信号2588。作为非限制性的示例，波束图案可以包括心形、偶极子等。

图26根据本发明实施例总体上由2600示出了多通道自适应滤波。参考图26，自适应滤波单元的实施例被示出为具有输入到延迟元件2606的主通道2604(包含麦克风信号)。参考通道2602(包含麦克风信号)被输入到自适应滤波器2608。在各种实施例中，自适应滤波器2608可以是被设计为实现归一化最小均方自适应(NLMS)或另一种算法的自适应FIR滤波器。本发明实施例不限于NLMS自适应。自适应FIR滤波器从参考信号2602对估计的所需声音信号进行滤波。在一个或多个实施例中，自适应滤波器2608的输出2609被输入到加法器2610。延迟后的主通道信号2607被输入到加法器2610，并且输出2609被从延迟后的主通道信号2607中减去。加法器2616的输出提供包含具有数量减少的非所需声音信号的所需声音信号的信号。

使用本发明实施例的声学***的许多情况是被用于存在混响的条件下。混响导致一种形式的噪声，并导致非所需声音信号，即本文所述的滤波和信号提取的对象。在各种实施例中，由2600所示的双通道自适应FIR滤波模拟了两个通道之间的混响以及它们所应用的环境。因此，非所需声音信号沿着直接路径和需要自适应FIR滤波器模拟环境的脉冲响应的混响路径传播。根据所需的精确度，可以对环境的脉冲响应进行各种近似模拟。在一非限制性的例子中，延迟量约等于环境的脉冲响应时间。在一非限制性的例子中，延迟量大于环境的脉冲响应。在一实施例中，延迟量约等于环境的脉冲响应时间的n倍，其中，n例如可以等于2或3或更多。或者，延迟量不是脉冲响应时间的整数倍，例如，0.5、1.4、2.75等。例如，在一个实施例中，滤波器长度约等于为2606选择的延迟的两倍。因此，如果使用具有200个抽头的自适应滤波器，延迟2606的长度将约等于100个抽头的时间延迟。之所以提供相当于通过100个抽头的传播时间的时间延迟仅仅是为了说明，这并不意味着对本发明实施例的任何形式的限制。

本发明实施例可被用于具有一系列脉冲响应时间的各种环境中。脉冲响应时间的一些例子仅出于说明的目的作为非限制性示例给出，其并构成对本发明实施例的限制。例如，办公室环境通常具有大约100毫秒至200毫秒的脉冲响应时间。车厢内部可以提供30毫秒至60毫秒的脉冲响应时间。总体而言，本发明实施例用于脉冲响应时间可以是从几毫秒到500毫秒或更长的范围的环境中。

自适应滤波单元2600在2614处与禁止逻辑例如禁止逻辑2214和滤波器控制信号2114(图22)通信。由禁止逻辑2214控制的信号2614被用于控制由滤波器2608执行的滤波以及滤波器系数的自适应。自适应滤波单元2600的输出2616被输入到诸如上述前面的图中描述的单通道噪声消除单元，例如，2118(图21)、2318(图23)、以及2418(图24A)。第一电平的非所需声音信号已经被从主声道中提取，从而导致输出2616。在各种运行条件下，噪声即非所需声音信号的电平相对于感兴趣的信号即所需声音信号来说，可能非常大。本发明实施例在主通道和参考通道之间的信噪比存在一定差异的情况下是可操作的。在一些实施例中，信噪比的差异大约在1分贝(dB)或更小的数量级。在其他实施例中，信噪比的差异大约在1分贝(dB)或更大的数量级。输出2616被额外地滤波，以在随后使用单通道降噪单元的过程中减少其中包含的非所需声音信号的数量。

上面图22中所述的包括信号2614(图26)的禁止逻辑提供滤波器2608的实质上的不工作以及在主通道或参考通道被确定为不活动时的滤波器系数的不自适应。在这种情况下，存在于主通道2604上的信号在2616处被输出。

如果主通道和参考通道是活动的且检测到所需声音信号或尚未达到暂停阈值，则禁用自适应，并冻结滤波器系数，且参考通道2602上的信号被通过滤波器2608进行滤波，并被利用加法器2610从主通道2607中减去，再被在2616处输出。

如果主通道和参考通道是活动的且没有检测到所需声音信号并且超过了暂停阈值(也称为暂停时间)，则调整滤波器系数。暂停阈值取决于应用。例如，在一非限制性的例子中，在自动语音识别(ASR)的情况下，暂停阈值可以大约为几分之一秒。

图27根据本发明实施例总体上由2700示出了单通道滤波。参考图27，单通道降噪单元利用具有单通道输入的线性滤波器。适合在其中使用的滤波器的例子有维纳滤波器、采用最小均方误差(MMSE)的滤波器等。来自自适应噪声消除单元(如上图所述)的输出在2704处被输入到滤波器2702。输入信号2704包含所需声音信号和噪声分量即，非所需声音信号，在等式2714中表示为总功率

滤波器2702将由2714所示的等式应用于输入信号2704。总功率

的估计值是等式2714的分子中的一项，并且从滤波器2704的输入中获得。当信号2704中缺少所需声音信号时，获得噪声的估计值

即，非所需声音信号。噪声估计值

是分子中被从总功率

中减去的另一项。总功率是方程式2714的分母中的项。噪声的估计值

(在缺少所需声音信号时获得)是从输入信号2704中获得的，该输入信号由从禁止逻辑，如禁止逻辑2214(图22)，接收的信号2716通知，该禁止逻辑指示何时存在所需声音信号以及何时不存在所需声音信号。当信号2704上不存在所需声音信号时，更新噪声估计值。当存在所需声音信号时，噪声估计值被冻结，并使用先前当所需声音信号不存在时在最后间隔期间确定的噪声估计值进行滤波。

图28A根据本发明实施例总体上由2800示出了所需语音活动检测。参考图28A，在2806处示出了双输入所需语音检测器。来自主通道的声音信号在2802处被从例如波束形成器或从上面结合前面的附图所述的主声道输入到双输入所需语音检测器2806的第一信号路径2807a。第一信号路径2807a包括语音频带滤波器2808。语音频带滤波器2808捕获主声道2802中的大部分所需语音能量。在各种实施例中，语音频带滤波器2808是带通滤波器，其特征在于具有下拐角频率、上拐角频率和从上拐角频率的滚降。在各种实施例中，根据应用的不同，下拐角频率的范围可以从50至300Hz。例如，在宽带电话中，下拐角频率约为50Hz。在标准电话中，下拐角频率约为300Hz。选择上拐角频率以允许滤波器通过由麦克风的频率响应的相对平坦部分拾取的大部分语音能量。因此，根据应用的不同，上拐角频率可以被设置在不同的位置。一个位置的非限制性例子是2500Hz。上拐角频率的另一个非限制性位置是4000Hz。

第一信号路径2807a包括短期功率计算器2810。短期功率计算器2810在各种实施例中作为均方根(RMS)测量、功率检测器、能量检测器等被实现。短期功率计算器2810可以被同义地称为短时功率计算器2810。短期功率检测器2810近似地计算滤波信号中的瞬时功率。短期功率检测器2810(Y1)的输出被输入到信号压缩器2812。在各种实施例中，压缩器2812将信号转换到Log₂域、Log₁₀域等。在其他实施例中，压缩器2812对信号Y1执行用户定义的压缩算法。

类似于上述第一信号路径，来自参考通道的声音信号在2804处被从例如波束形成器或从上面结合前面的附图所述的参考声道输入到双输入所需语音检测器2806的第二信号路径2807b。第二信号路径2807b包括语音频带滤波器2816。语音频带滤波器2816捕获参考声道2804中的大部分所需语音能量。在各种实施例中，语音频带滤波器2816是带通滤波器，其特征在于具有如上述用于第一信号路径和语音频带滤波器2808的下拐角频率、上拐角频率和从上拐角频率的滚降。

第二信号路径2807b包括短期功率计算器2818。短期功率计算器2818在各种实施例中作为均方根(RMS)测量、功率检测器、能量检测器等被实现。短期功率计算器2818可以被同义地称为短时功率计算器2818。短期功率检测器2818近似地计算滤波信号中的瞬时功率。短期功率检测器2818(Y2)的输出被输入到信号压缩器2820。在各种实施例中，压缩器2820将信号转换到Log₂域、Log₁₀域等。在其他实施例中，压缩器2820对信号Y2执行用户定义的压缩算法。

在减法器2824处，来自第二信号路径2822的压缩信号被从来自第一信号路径2814的压缩信号中减去，这导致在2826(Z)处产生归一化的主信号。在其他实施例中，在2812和2820处应用不同的压缩函数，这导致信号在2826处的不同归一化。在其他实施例中，当没有实现对数压缩时，除法运算可被在2824处应用以完成归一化。例如当基于平方根函数的压缩被实现时。

归一化的主信号2826被输入到单通道归一化语音阈值比较器(SC-NVTC)2828中，结果产生归一化的所需语音活动检测信号2830。请注意，双通道语音活动检测器的架构使用基于两个输入通道的信噪比的总体差异的归一化的所需语音活动检测信号2830来提供所需语音的检测。因此，归一化的所需语音活动检测信号2830基于的是语音频带中的能量的积分而不是特定频点中的能量，从而保持了上述噪声消除单元内的线性。压缩信号2814和2822，使用对数压缩，在2826(Z)处提供输入，该输入具有可以采用从低于零到高于零变化的值的噪声基底(参见下图28E中的第2895c列、第2895d列、或第2895e列)，而不像未压缩的单通道输入，其噪声基底总是高于零(参见下图28E中的列2895b)。

图28B根据本发明实施例总体上由2850示出了一种单通道归一化语音阈值比较器(SC-NVTC)。参考图28B，归一化的主信号2826被输入长期归一化功率估计器2832。长期归一化功率估计器2832提供归一化的主信号2826的运行估计。运行估计为所需声音信号提供下限。在加法器2836中将偏移值2834与长期归一化功率估计器2832的输出的运行估计相加。加法器2838的输出被输入比较器2840。归一化的主信号2826的瞬时估计2842被输入比较器2840。比较器2840包含将2842处的瞬时值与2838处的运行比加上偏移量进行比较的逻辑。如果2842处的值大于2838处的值，则所需声音信号被检测到，一个标记被相应地设置并被作为归一化的所需语音活动检测信号2830的一部分传送。如果2842处的值小于2838处的值，则所需声音信号未被检测到，一个标记被相应地设置并被作为归一化的所需语音活动检测信号2830的一部分传送。长期归一化功率估计器2832在足够长的时间长度内对归一化的主信号2826进行平均，以便减缓振幅波动的变化。因此，振幅波动在2833处缓慢变化。平均时间可以从几分之一秒到几分钟不等，作为非限制性的示例。在各种实施例中，平均时间被选择以在2832的输出处提供缓慢变化的振幅波动。

图28C根据本发明实施例总体上由2846示出了使用多个参考通道的所需语音活动检测。参考图28C，在2848处示出了所需语音检测器。所需语音检测器2848包括作为输入的主通道2802和第一信号路径2807a(以上结合图28A描述过)以及参考通道2804和第二信号路径2807b(以上也结合图28A描述过)。除此之外，还有被输入到所需语音检测器2848且是第三信号路径2807c的一部分的第二参考声道2850。类似于第二信号路径2807b(上述)，来自第二参考声道的声音信号在2850处被从例如波束形成器或从上面结合前面的附图所述的第二参考声道输入到多输入所需语音检测器2848的第三信号路径2807b。第三信号路径2807b包括语音频带滤波器2852。语音频带滤波器2852捕获第二参考声道2850中的大部分所需语音能量。在各种实施例中，语音频带滤波器2852是带通滤波器，其特征在于具有如上述用于第二信号路径和语音频带滤波器2808的下拐角频率、上拐角频率和从上拐角频率的滚降。

第三信号路径2807c包括短期功率计算器2854。短期功率计算器2854在各种实施例中作为均方根(RMS)测量、功率检测器、能量检测器等实现。短期功率计算器2854可以被同义地称为短时功率计算器2854。短期功率检测器2854近似地计算滤波信号中的瞬时功率。短期功率检测器2854的输出被输入到信号压缩器2856。在各种实施例中，压缩器2856将信号转换到Log₂域、Log₁₀域等。在其他实施例中，压缩器2854对信号Y3执行用户定义的压缩算法。

在减法器2860处，来自第三信号路径2858的压缩信号被从来自第一信号路径2814的压缩信号中减去，这导致在2862(Z2)处产生归一化的主信号。在其他实施例中，在2856和2812处应用不同的压缩函数，这导致信号在2862处的不同归一化。在其他实施例中，当没有实现对数压缩时，除法运算可被在2860处应用。例如当基于平方根函数的压缩被实现时。

归一化的主信号2862被输入到单通道归一化语音阈值比较器(SC-NVTC)2864中，结果产生归一化的所需语音活动检测信号2868。请注意，多通道语音活动检测器的架构使用基于两个输入通道的信噪比的总体差异的归一化的所需语音活动检测信号2868来提供所需语音的检测。因此，归一化的所需语音活动检测信号2868基于的是语音频带中的能量的积分而不是特定频点中的能量，从而保持了上述噪声消除单元内的线性。压缩信号2814和2858，使用对数压缩，在2862(Z2)处提供输入，该输入具有可以采用从低于零到高于零变化的值的噪声基底(参见下图28E中的列2895c、列2895d、或列2895e)，而不像未压缩的单通道输入，其噪声基底总是高于零(参见下图28E中的列2895b)。

所需语音检测器2848，具有使用至少两个参考通道输入的多通道输入，提供用于输出所需话音活动信号2874的两个归一化的所需语音活动检测信号2868和2870。在一实施例中，归一化的所需语音活动检测信号2868和2870被输入到逻辑或门2872。逻辑或门根据其输入2868和2870输出所需语音活动信号2874。在其他实施例中，可将附加的参考通道添加到所需语音检测器2848。各附加的参考通道用于创建另一归一化主通道，该归一化主通道被输入到另一单通道归一化语音阈值比较器(SC-NVTC)(未示出)。来自附加的单通道归一化话音阈值比较器(SC-NVTC)(未示出)的输出通过附加的异或门(也未示出)(在一个实施例中)与2874结合，以提供所需语音活动信号，该信号如以上结合前面的图所述的那样被输出。在多通道所需语音检测器中利用附加的参考通道，如上所述，因为通过多个参考通道获得了关于噪声场的更多信息，结果产生了对所需语音信号的更稳健的检测。

图28D根据本发明实施例总体上由2880示出了使用压缩的一种流程。参考图28D，流程开始于块2882。使用如结合图28A或图28C所示的，例如Log₁₀压缩或用户定义的压缩，在块2884处压缩主通道。使用如结合图28A或图28C所示的，例如Log₁₀压缩或用户定义的压缩，在块2886处压缩参考通道。在块2888处创建归一化的主声音信号。在块2890利用归一化的声音信号检测所需语音。该流程停止于块2892。

图28E根据本发明实施例总体上由2893示出了用于提供压缩的不同函数。参考图28E，出于说明的目的，表2894展示了几个压缩函数，但这并不意味着限制。第2895a列包含变量x的六个样本值。在本示例中，如2896所示，变量X的取值范围从0.01至1000.0。第2895b列示出了无压缩，其中Y＝X。第2895c列示出了基数为10的对数压缩，其中压缩值Y＝log10(X)。第2895d列示出了ln(X)压缩，其中压缩值Y＝ln(X)。第2895e列示出了基数为2的对数压缩，其中Y＝Log2(X)。还可以根据需要实现用户定义的压缩(未示出)，以提供比2895c、2895d或2895e更多或更少的压缩。利用2812和2820处的压缩函数(图28A)对短期功率检测器2810和2818的结果进行压缩，减小了输入到单通道归一化语音阈值比较器(SC-NVTC)2828的2826(Z)处的归一化的主信号的动态范围。类似地，利用2812、2820和2856处的压缩函数(图28C)对短期功率检测器2810、2818和2854的结果进行压缩，减小了分别输入到SC-NVTC828和SC-NVTC 864的2826(Z)处的和2862(Z2)处的归一化的主信号的动态范围。通过压缩实现的减小的动态范围，可以导致对所需声音信号的存在的更精确地检测，因此通过本文中给出的本发明实施例可以实现更大程度的降噪。

在各种实施例中，如图28A、图28B、图28C、图28D以及图28E所示的多输入所需语音检测器的组件在集成电路装置中实现，该集成电路装置可包括：包含集成电路的集成电路封装。在一些实施例中，多输入所需语音检测器在单个集成电路管芯中实现。在其他实施例中，多输入所需语音检测器在集成电路装置的不止一个集成电路管芯中实现，该集成电路装置可包括：包含该集成电路的多芯片封装。

图29A根据本发明实施例总体上由2900示出了一种自动平衡架构。参考图29A，自动平衡组件2903具有第一信号路径2905a和第二信号路径2905b。在2902b处，第一声道2902a(MIC 1)被连接至第一信号路径2905a。在2904b处，第二声道2904a被连接至第二信号路径2905b。声音信号在2902b处被输入语音频带滤波器2906。语音频带滤波器2906捕获第一声道2902a中的大部分所需语音能量。在各种实施例中，语音频带滤波器1906是带通滤波器，其特征在于具有下拐角频率、上拐角频率和从上拐角频率的滚降。在各种实施例中，根据应用的不同，下拐角频率的范围可以从50至300Hz。例如，在宽带电话中，下拐角频率约为50Hz。在标准电话中，下拐角频率约为300Hz。选择上拐角频率以允许滤波器通过由麦克风的频率响应的相对平坦部分拾取的大部分语音能量。因此，根据应用的不同，上拐角频率可以被设置在不同的位置。一个位置的非限制性例子是2500Hz。上拐角频率的另一个非限制性位置是4000Hz。

第一信号路径2905a包括长期功率计算器2908。长期功率计算器2908在各种实施例中作为均方根(RMS)测量、功率检测器、能量检测器等被实现。长期功率计算器2908可以被同义地称为长时功率计算器2908。长期功率检测器2908近似地计算滤波信号中的运行平均长期功率。长期功率检测器2908的输出2909被输入到除法器2917。控制信号2914在2916处被输入到长期功率计算器2908。控制信号2914提供如以上结合所需声音信号检测器所描述的信号，如图28A、图28B、图28C，其指示所需声音信号何时存在以及所需声音信号何时不存在。第一通道2902b上的具有所需声音信号存在的声音信号的片段，被从2908处产生的长期功率平均中排除。

声音信号在2904b处被输入第二信号路径2905b的语音频带滤波器2910。语音频带滤波器2910捕获第二声道2904a中的大部分所需语音能量。在各种实施例中，语音频带滤波器2910是带通滤波器，其特征在于具有下拐角频率、上拐角频率和从上拐角频率的滚降。在各种实施例中，根据应用的不同，下拐角频率的范围可以从50至300Hz。例如，在宽带电话中，下拐角频率约为50Hz。在标准电话中，下拐角频率约为300Hz。选择上拐角频率以允许滤波器通过由麦克风的频率响应的相对平坦部分拾取的大部分语音能量。因此，根据应用的不同，上拐角频率可以被设置在不同的位置。一个位置的非限制性例子是2500Hz。上拐角频率的另一个非限制性位置是4000Hz。

第二信号路径2905b包括长期功率计算器2912。长期功率计算器2912在各种实施例中作为均方根(RMS)测量、功率检测器、能量检测器等被实现。长期功率计算器2912可以被同义地称为长时功率计算器2912。长期功率检测器2912近似地计算滤波信号中的运行平均长期功率。长期功率检测器2912的输出2913被输入到除法器2917。控制信号2914在2916处被输入到长期功率计算器2912。控制信号2914提供如以上结合所需声音信号检测器所描述的信号，如图28A、图28B、图28C，其指示所需声音信号何时存在以及所需声音信号何时不存在。第二通道2904b上的具有所需声音信号存在的声音信号的片段，被从2912处产生的长期功率平均值中排除。

在一实施例中，输出2909在2917处通过输出2913被归一化，以产生振幅校正信号2918。在一实施例中，除法器被在2917处使用。振幅校正信号2918在乘法器2920处乘以2904a上的第二麦克风信号的瞬时值，以在2922处产生校正的第二麦克风信号。

在另一个实施例中，或者，输出2913在2917处通过输出2909被归一化，以产生振幅校正信号2918。在一实施例中，除法器被在2917处使用。使用连接至2902a(未示出)的乘法器，将振幅校正信号2918乘以1902a上的第一麦克风信号的瞬时值，以产生用于第一麦克风通道2902a的校正的第一麦克风信号。因此，在各种实施例中，或者第二麦克风信号相对于第一麦克风信号自动平衡，或者可选择的，第一麦克风信号相对于第二麦克风信号自动平衡。

应当注意的是，当所需声音信号不存在时，执行在2908和2912处计算的长期平均功率。因此，平均功率表示通常在远场产生的非所需声音信号的平均值。在各种实施例中，作为非限制性的示例，在一些实施例中，长期功率计算器的持续时间的范围从大约几分之一秒，例如，二分之一秒到五秒到几分钟，并且取决于应用。

图29B根据本发明实施例总体上由2950示出了自动平衡。参考图29B，自动平衡组件2952被配置为接收主声道2954a和参考声道2956a作为输入。平衡函数类似于以上结合图29A使用第一声道2902a(MIC 1)和第二声道2904a(MIC 2)所给出的描述继续执行。

参考图29B，自动平衡组件2952具有第一信号路径2905a和第二信号路径2905b。在2954b处，第一声道2954a(主)被连接至第一信号路径2905a。在2956b处，第二声道2956a被连接至第二信号路径2905b。声音信号在2954b处被输入语音频带滤波器2906。语音频带滤波器2906捕获第一声道2954a中的大部分所需语音能量。在各种实施例中，语音频带滤波器2906是带通滤波器，其特征在于具有下拐角频率、上拐角频率和从上拐角频率的滚降。在各种实施例中，根据应用的不同，下拐角频率的范围可以从50至300Hz。例如，在宽带电话中，下拐角频率约为50Hz。在标准电话中，下拐角频率约为300Hz。选择上拐角频率以允许滤波器通过由麦克风的频率响应的相对平坦部分拾取的大部分语音能量。因此，根据应用的不同，上拐角频率可以被设置在不同的位置。一个位置的非限制性例子是2500Hz。上拐角频率的另一个非限制性位置是4000Hz。

第一信号路径2905a包括长期功率计算器2908。长期功率计算器2908在各种实施例中作为均方根(RMS)测量、功率检测器、能量检测器等被实现。长期功率计算器2908可以被同义地称为长时功率计算器2908。长期功率检测器2908近似地计算滤波信号中的运行平均长期功率。长期功率检测器2908的输出2909b被输入到除法器2917。控制信号2914在2916处被输入到长期功率计算器2908。控制信号2914提供如以上结合所需声音信号检测器所描述的信号，如图28A、图28B、图28C，其指示所需声音信号何时存在以及所需声音信号何时不存在。第一通道2954b上的具有所需声音信号存在的声音信号的片段，被从2908处产生的长期功率平均中排除。

声音信号在2956b处被输入第二信号路径2905b的语音频带滤波器2910。语音频带滤波器2910捕获第二声道2956a中的大部分所需语音能量。在各种实施例中，语音频带滤波器2910是带通滤波器，其特征在于具有下拐角频率、上拐角频率和从上拐角频率的滚降。在各种实施例中，根据应用的不同，下拐角频率的范围可以从50至300Hz。例如，在宽带电话中，下拐角频率约为50Hz。在标准电话中，下拐角频率约为300Hz。选择上拐角频率以允许滤波器通过由麦克风的频率响应的相对平坦部分拾取的大部分语音能量。因此，根据应用的不同，上拐角频率可以被设置在不同的位置。一个位置的非限制性例子是2500Hz。上拐角频率的另一个非限制性位置是4000Hz。

第二信号路径2905b包括长期功率计算器2912。长期功率计算器2912在各种实施例中作为均方根(RMS)测量、功率检测器、能量检测器等被实现。长期功率计算器2912可以被同义地称为长时功率计算器2912。长期功率检测器2912近似地计算滤波信号中的运行平均长期功率。长期功率检测器2912的输出2913b被输入到除法器2917。控制信号2914在2916处被输入到长期功率计算器2912。控制信号2916提供如以上结合所需声音信号检测器所描述的信号，如图28A、图28B、图28C，其指示所需声音信号何时存在以及所需声音信号何时不存在。第二通道2956b上的具有所需声音信号存在的声音信号的片段，被从2912处产生的长期功率平均中排除。

在一实施例中，输出2909b在2917处通过输出2913b被归一化，以产生振幅校正信号2918b。在一实施例中，除法器被在2917处使用。振幅校正信号2918b在乘法器2920处乘以2956a上的第二麦克风信号的瞬时值，以在2922b处产生校正的第二麦克风信号。

在另一个实施例中，或者输出2913b在2917处通过输出2909b被归一化，以产生振幅校正信号2918b。在一实施例中，除法器被在2917处使用。使用连接至2954a(未示出)的乘法器，将振幅校正信号2918b乘以2954a上的第一麦克风信号的瞬时值，以产生用于第一麦克风信道2954a的校正的第一麦克风信号。因此，在各种实施例中，或者第二麦克风信号相对于第一麦克风信号自动平衡，或者可选择的，第一麦克风信号相对于第二麦克风信号自动平衡。

自动平衡组件2902或2952的实施例被配置为用于自动平衡多个麦克风通道，如图24A所示。在这样的配置中，多个通道(例如多个参考通道)相对于主通道是平衡的。或者多个参考通道和一个主通道相对于如以上结合图29A或图29B所描述的一个特定的参考通道是平衡的。

图29C根据本发明实施例示出了滤波。参考图29C，2960a示出了两个麦克风信号2966a和2968a，其具有被绘制为频率2964的函数的振幅2962。在一些实施例中，麦克风不具有作为频率的函数的恒定灵敏度。例如，麦克风响应2966a可以表示一个具有通过频率平坦的宽带激励被激发的非平坦频率响应的麦克风输出(响应)。麦克风响应2966a包括非平坦区域2974和平坦区域2970。对于该示例，产生响应2968a的麦克风具有相对于频率的均匀的灵敏度；因此，响应于频率平坦的宽带激励，2968a总体上是平坦的。在一些实施例中，平衡麦克风响应的平坦区域2970是有意义的。在这种情况下，非平坦区域2974被滤除，以使得非平坦区域2974中的能量不会影响到麦克风自动平衡程序。令人关心的是两个麦克风响应的平坦区域之间的差异2972。

在2960b中，滤波函数2978a被示出并被利用作为频率2964的函数绘制的振幅2976绘制。在各种实施例中，滤波函数被选择以消除麦克风响应的非平坦部分2974。滤波函数2978a的特征在于具有下拐角频率2978b和上拐角频率2978c。2960b的滤波函数被应用于两个麦克风信号2966a和2968a，其结果在2960c中被示出。

在2960c中，麦克风信号2966a和2968a的滤波后的表现2966c和2968c被作为振幅2980和频率2966的函数绘制。差异2972表现了两个滤波后的麦克风信号2966c和2968c之间的灵敏度差异。通过以上结合图29A和图29B所描述的***，两个麦克风响应之间的这种差异得到平衡。返回参考图29A和图29B，在各种实施例中，语音频带滤波器2906和2910，在一非限制性的例子中，可以将2960b中所示的滤波函数应用于麦克风通道2902b和2904b(图29A)或主通道和参考通道2954b和2956b(图29B)。通过以上图29A或图29B中描述的自动平衡程序，可以最小化或消除两个麦克风通道之间的差异2972。

图30根据本发明实施例总体上由3000示出了一种自动平衡的流程。参考图30，流程开始于块3002。在块3004，计算第一麦克风通道中的平均长期功率。为第一麦克风通道计算的平均长期功率不包括当存在所需声音信号时出现的麦克风信号的片段。来自所需语音活动检测器的输入被用于排除所需声音信号的相关部分。在块3006，计算第二麦克风通道中的平均功率。为第二麦克风通道计算的平均长期功率不包括当存在所需声音信号时出现的麦克风信号的片段。来自所需语音活动检测器的输入被用于排除所需声音信号的相关部分。在块3008，使用在块3004和块3006中计算的平均值，计算振幅校正信号。

在各种实施例中，自动平衡组件2903或2952的组件在集成电路装置中被实现，该集成电路装置可包括：包含集成电路的集成电路封装。在一些实施例中，自动平衡组件2903或2952在单个集成电路管芯中实现。在其他实施例中，自动平衡组件2903或2952在集成电路装置的不止一个集成电路管芯中实现，该集成电路装置可包括：包含该集成电路的多芯片封装。

图31总体上由3100示出了一种声音信号处理***，其中可使用本发明实施例。方框图是高级概念表示，可以用各种方式和各种体系结构来实现。参考图31，总线***3102互连中央处理单元(CPU)3104、只读存储器(ROM)3106、随机存取存储器(RAM)3108、存储器3110、显示器3120、音频3122、键盘3124、指针3126、数据采集单元(DAU)3128和通信3130。总线***3102可以是例如***总线、***组件互连(PCI)、高级图形端口(AGP)、小型计算机***接口(SCSI)、电气与电子工程师协会(IEEE)标准编号1394(火线)、通用串行总线(USB)或为定制应用而设计的专用总线等这些总线中的一个或多个。CPU 3104可以是单个、多个、或者甚至是分布式计算资源或数字信号处理(DSP)芯片。存储器3110可以是光盘(CD)、数字多功能盘(DVD)、硬盘(HD)、光盘、磁带、闪存、记忆棒、录像机等。声音信号处理***3100可被用于接收从多个麦克风(例如，第一麦克风、第二麦克风等)输入的，或者来自如以上结合前面的附图所述的主声道和多个参考声道的声音信号。请注意，根据声音信号处理***的实际实现方式的不同，该声音信号处理***可以包括框图中的组件的一些、全部、更多或重新排列。在一些实施例中，***3100的各方面在软件中执行，而在一些实施例中，***3100的各方面在诸如数字信号处理(DSP)芯片等专用硬件中执行，以及在本领域普通技术人员公知和理解的专用硬件和软件的组合中执行。

因此，在各种实施例中，声音信号数据被在3129处接收，以通过声音信号处理***3100进行处理。这类数据可以在3132处经由通信接口3130传输，用于在远程位置做进一步处理。如本领域技术人员所认识到的，通过3132获得与诸如内联网或互联网的网络的连接，这使得声音信号处理***3100能够与远程位置上的其他数据处理装置或***进行通信。

例如，本发明实施例可在被配置为台式计算机或工作站的计算机***3100上实现，例如运行诸如

XP Home或

XP Professional、Linux、Unix等操作***的兼容

的计算机，以及来自苹果电脑公司的运行有OS X等操作***的计算机等。或者，结合这样的实施方式，本发明实施例可以配置为具有诸如扬声器、耳机、视频监视器等被配置为与蓝牙通信通道一起使用的装置。在其他实施方式中，本发明实施例被配置为由移动装置诸如智能电话，平板电脑，可穿戴装置诸如眼镜，近眼式(NTE)耳机，一般配置的头戴式装置诸如但不限于眼镜、护目镜、遮阳帽、头带、头盔等，或类似装置实现。

在一个或多个实施例中，向用户提供助听，以利于听到来自本地环境的声音。

图32A根据本发明实施例总体上由3200示出了头戴式装置上的麦克风配置。图32B根据本发明实施例总体上由3220示出了与图32A对应的头戴式装置上的麦克风配置的俯视图。图32C根据本发明实施例总体上由3240示出了与图32A对应的头戴式装置上的麦克风配置的仰视图。图33根据本发明实施例总体上由3300示出了来自图32A的相对于不同声源的头戴式装置。同时参考图32A至图33，头戴式装置3201以在三维空间中使用的眼镜的形状被呈现。三维空间由3301处的X、Y、Z轴表示(图33)。用本领域已知的笛卡尔坐标系来表示三维空间。然而，这并不意味着限制。可以用另一个坐标系来表示三维空间。在其他实施例中，头戴式装置是护目镜等的形状，这并不意味着限制。此处，术语“眼镜”或“眼镜装置”与头戴式装置同义。头戴式装置3201具有前框架，该前框架包含一个或多个由玻璃或塑料制成的镜片，左框架3214，以及右框架3212。左框架和右框架在本领域中也被称为镜腿。头戴式装置被示出为具有四个麦克风，麦克风0(3202)、麦克风1(3204)、麦克风2(3206)以及麦克风3(3210)。在一个或多个实施例中，麦克风0(3202)位于左侧框架3214的底部下方，麦克风1(3204)和麦克风2(3206)位于左侧框架3214的顶部。麦克风3(3210)位于右侧框架3212的顶部。或者，麦克风0(3202)、麦克风1(3204)、以及麦克风2(3206)位于右侧框架3212上，且麦克风3(3210)位于左侧框架3214上。

在各种实施例中，该眼镜装置包括连接到至少一个侧框架构件的麦克风阵列。该麦克风阵列包括至少一个第一、和第二麦克风。在一个或多个实施例中，第一麦克风和第二麦克风，例如3202和3204，位于靠近前框架构件的侧框架构件3214处。如3209处的L2所示，第一和第二麦克风与前框架构件的距离大约在5mm到30mm之间，且可以是约15mm(图32B)。第一麦克风(麦克风0(3202))位于侧框架构件3214的底侧，并且第二麦克风(麦克风1(3204))位于侧构件3214的顶侧且恰好或接近侧框架构件3214的顶部。在另一个实施例中，第三麦克风(麦克风2(3206))位于侧框架构件3214上且远离前框架构件。如3208处的L₁所示，第三麦克风(麦克风2(3206))距离第一和/或第二麦克风(3202/3204)的位置大约在10mm至20mm之间，且可以是约15mm。如果距离L₁太长，则第三麦克风(麦克风2(3206))可以靠近被嵌入侧框架构件且位于佩戴者耳朵附近的扬声器。在这种情况下，从扬声器到麦克风2可能会有回声(3206)。对于特定实施方式，这种回声通过减小距离L₁被解决。距离L₁的减小增加了麦克风2(3206)和扬声器3350之间的间隔距离，从而减少任何回声。

在另一个实施例中，第四麦克风(麦克风3(3210))位于另一侧框架构件3212上。麦克风3(3210)被示为靠近前框架构件，但也可以是沿着框架构件3212的其他位置。麦克风1(3204)和麦克风3(3210)之间的距离由眼镜框架的宽度决定，并且该距离对于***来说大到足以检测来自两个麦克风的信号电平差。麦克风1(3204)和麦克风3(3210)之间的距离不是个定数，而是通常由头戴式装置的几何形状和尺寸提供。同样的，麦克风0(3202)和麦克风3(3210)之间的距离不是个定数，而是通常由头戴式装置的几何形状和尺寸提供。

图32D根据本发明实施例总体上由3260示出了头戴式装置上的另一组麦克风布局的透视图。图32E根据本发明实施例总体上由3280示出了与图32D对应的头戴式装置上的麦克风布局的仰视图。参考图32D，麦克风0(3202)和麦克风1(3204)位于镜腿3212的内表面上。麦克风2(3206)位于右镜腿3212的底表面上，并且从麦克风0(3202)/麦克风1(3204)后缩与如上所述的L₁相等的量。麦克风0(3202)/麦克风1(3204)和前框架之间的距离如上所述的L₂(图32B)。返回参考图32D，麦克风3(3210)位于镜腿3210的底侧。或者，麦克风2(3206)和麦克风3(3210)中的一个或两个可以位于它们各自镜腿的顶部表面上。

在一个可选择的实施例中，图32D/32E中所示的麦克风布局可以相对于镜腿颠倒。例如，麦克风0(3202)、麦克风1(3204)、麦克风2(3206)可以位于左镜腿3214的内表面上，且麦克风3(3210)可以位于右镜腿3212上。

这四个麦克风支持三个或更多麦克风组合，这些组合用于这里被描述为使用麦克风0和麦克风1的配置1，使用麦克风1和麦克风2的配置2，以及使用麦克风1和麦克风3的配置3的不同使用场景。在一些实施例中，软件接口被用于控制这些麦克风组合之间的切换以及配置之间的排序。

在各种实施例中，眼镜将具有多于四个的麦克风或少于四个的麦克风。四个麦克风用于说明本文中描述的一个或多个实施例，且不构成对本发明实施例的限制。以下描述了麦克风的三种配置，用于为头戴式装置的用户的使用，接收和处理声音信号以辅助用户听力，并且在某些情况下通过例如语音识别、命令和控制、由另一用户接收和收听的方式用于远程使用，以及通过嵌入式语音识别在本地使用等。以下描述的配置可以被用于提供上述噪声消除***中所使用的主要声音信号和参考声音信号。

配置1

在一个或多个实施例中，当用户佩戴了头戴式装置101并同时进行讲话时，麦克风0和麦克风1被用于处理声音信号。在配置1中，从麦克风0和麦克风1输出的信号被波束形成以使主声音信号响应处于沿着轴3302向下的位置。轴3302在用户嘴巴3310的标称的方向上，但不需要与之精确对齐。麦克风0和麦克风1具有到用户嘴巴3320的不同的声学距离，其中麦克风0的声学距离小于麦克风1的声学距离。从用户嘴巴3310发出的声音信号3312，相对于麦克风对麦克风0和麦克风1，以对用户3310的方向的最大声学灵敏度被接收。将这样获得的声音信号用作输入到多通道噪声消除***的主要信号。通过波束形成具有被转向180度远离声源3310的主响应的麦克风对麦克风0和麦克风1，获得主要包含的是噪声(主要是非所需声音信号)的参考信号。因此，参考信号是在沿着轴3302向上仰望的方向获得的，该方向远离用户嘴巴3310，并朝向潜在的噪声源，例如由3360表示的噪声源，其发出噪声3362(非所需声音信号)。将像这样躲开用户嘴巴3310获得的信号用作输入上述多通道噪声消除***的参考信号。应用于参考信号的波束形成最小化了对来自用户嘴巴3310的信号的声学灵敏度3，并最大化了对远离用户嘴巴的方向产生的噪声的灵敏度。因此，麦克风0和麦克风1之间的信噪比差被最大化，从而用于通过噪声消除的后续应用降低主要信号中的噪声。

降低感兴趣信号(所需声音信号)中的噪声(非所需声音信号)的处理，允许麦克风0和麦克风1的组合，以帮助增强嘈杂环境中打电话时的用户语音。它还有助于提高当在嘈杂环境中使用时的***的指挥和控制性能。在嘈杂的环境中，用户的语音被隐藏在背景噪声中，在通话过程中很难被远端听众理解，也很难被语音引擎识别。麦克风0和麦克风1的组合使用波束形成技术，以提高用户语音相对于背景噪声的信噪比(SNR)(以及增加麦克风0和麦克风1之间的信噪比差)，从而提高了用于噪声消除的语音活动检测的准确性。即使是在具有90-dB或更大背景噪声振幅的极其嘈杂的环境中，这种组合也能提供有用的性能增益。如上所述，麦克风0和麦克风1可利用全向麦克风实现。

配置2

在一个或多个实施例中，当用户正在接听远程声源，如3330，并同时佩戴了头戴式装置3201时，麦克风1和麦克风2被用于处理声音信号。在配置2中，从麦克风1和麦克风2输出的信号被波束形成以使主声音信号响应处于沿着轴3304向前的位置，从而借助被引导到相对于麦克风对麦克风1和麦克风2的声源3330的方向的最大声学灵敏度，接收由3330所示的声源发出的声音信号3332。将像这样获得的信号用作输入多通道噪声消除***的主要信号。主要包含的是噪声的参考信号可被从具有或不具有波束形成的麦克风2获得。当全向麦克风被用于麦克风1和麦克风2时，对麦克风1和麦克风2进行波束形成以获得主要信号，同时只使用麦克风2用于参考信号，没有麦克风1的波束形成，相对于麦克风2独自对源3330的灵敏度，将波束形成的对在源3330方向上的灵敏度增加了约6dB。这种处理在麦克风1和麦克风2之间提供了有利于噪声消除性能的明显的信噪比差。轴3304指向用户前方的标称的方向，但不需要与之精确对齐。麦克风1和麦克风2具有到位于用户前方的声源，例如3330，的不同的声学距离。声源3330与麦克风1之间的声学距离小于麦克风2与声源3330之间的声学距离。因此，麦克风1和麦克风2可以灵活地设置在头戴式装置上，以相对于位于头戴式装置前方的声源提供不同的声学距离，而不必直接指向声源3330。

在可选择的实施例中，对具有被转向180度远离声源3330的主响应的麦克风对麦克风1和麦克风2进行波束形成，可被用于提供参考信号(主要是非所需声音信号)。请注意，获得的与之组合的参考信号最好具有最少量的所需声音信号。可根据两种方法获得参考信号，将其进行比较，然后可以基于最佳***性能做出选择。因此，通过任一方法获得的参考信号，其具有的信噪比小于主要信号的信噪比。因此，获得针对与源自标称是头戴式装置3201的前方，例如3330/3332，的感兴趣信号有关的麦克风1/麦克风2对的信噪比差。通过上述任一方法躲开声源3330获得的信号，被用作输入多通道噪声消除***的参考信号。用于参考信号的波束形成被选择，以对来自用户前方，例如源3330，的信号(所需声音信号)提供最小声学灵敏度，并最大化对从源3330以外的方向产生的噪声的灵敏度。因此，麦克风1和麦克风2之间的信噪比差被最大化，从而用于通过噪声消除的后续应用减少主要信号中的噪声。

噪声消除***的输出随后被提供给扬声器3350，以帮助用户听到来自声源3330的声音。扬声器3350被结合到眼镜3201的一个或两个侧框架中。因此，在各种实施例中，麦克风1、麦克风2的组合被用于例如在一些诸如看电视或与佩戴眼镜3201的用户前面的人对话的活动期间，增强用户的听力。一些具有听力困难的人不能清楚地理解声音信号，尤其是在嘈杂的环境中。组合2应用波束形成技术，通过在空间上消除背景噪声，帮助用户聚焦于感兴趣的声音信号。

配置3

在一个或多个实施例中，当用户正在接听来自一侧或另一侧的远程声源，例如3320或3340，或与其交互，并同时佩戴了头戴式装置3201时，麦克风1和麦克风3被用于处理声音信号。或者，麦克风3和麦克风2被用于为配置3处理信号，或者使用麦克风3和麦克风0。以下关于配置3的描述以麦克风3和麦克风1的形式提供，并不由此含有限制的意思。在配置3中，比较从麦克风1和麦克风3输出的声能，以确定最大的声音来自用户的哪一侧。这种信息是有用的，因为在会议中例如，人们围坐在桌子边上，不同的人会时不时地讲话，从而相对于戴着眼镜3201的用户产生不同的到达方向。在配置3中，从所选定的一对麦克风输出的信号被处理，以使主声音信号响应处于沿着轴3306的位置，轴3306在声源的标称的方向上，但不需要与之精确对齐。所选定的一对麦克风例如，麦克风3和麦克风0，麦克风3和麦克风1，或者麦克风3和麦克风2，其中之一，具有到声源的不同的声学距离。

按照一种操作方法，主要麦克风是来自具有最大声能输出的麦克风1，麦克风3对的麦克风。麦克风1，麦克风3对中的另一个麦克风随后被指定为参考麦克风。在确定哪个麦克风输出的声能最大之后，可以进行主要信号和参考信号的交替处理。例如，在一个或多个实施例中，波束形成被应用于麦克风1和麦克风3输出的信号。在一个例子中，当波束形成过程中的主响应轴被转向被测量的最大声能的一侧(方向)时，获得主要信号。在该例子中，通过将波束形成过程中的主响应轴转向与主要响应轴相反的一侧，获得参考信号。

该过程的一个变化是利用波束形成获得主要信号，即，波束形成麦克风1和麦克风3的输出(被转向麦克风1和麦克风3中测量到最大声能的那一个的那一侧，同时将具有较低声能的麦克风的未波束形成的输出用于参考信号。

该过程的另一个变化是利用波束形成获得参考信号，即，波束形成麦克风1和麦克风3的输出(被转向麦克风1和麦克风3中测量到最小声能的那一个的那一侧，同时将具有最大声能的麦克风的未波束形成的输出用于主要信号。

在一非限制性的例子中，参考图33，当声源3320比声源3340更大声时，存在一个假设的使用场景。在一个或多个实施例中，该***被设计为选择麦克风3作为接收主要信号的一侧。接收主要信号可以通过上面直接描述的任一种方法被完成，例如对麦克风1和麦克风3进行波束形成，同时将主响应轴3306置于声源3320的方向上。或者，可将麦克风3的输出用作主要信号，而无需波束形成。通过对麦克风1和麦克风3进行波束形成，同时将主响应轴3306置于与声源3320相反的方向上，可得到参考信号。或者，可将麦克风1的输出用作参考信号，而无需波束形成。

在一些实施例中，一种***通过上述方法被实现以进行排序，例如，波束形成以选择主要信号或参考信号与将麦克风的未波束形成的输出用于主要信号或参考信号。计算每一种方法的性能度量，例如主要信号和参考信号之间的信噪比差，并且具有最大信噪比差的方法是用于处理来自麦克风1和麦克风3的信号的方法。可以在开始信号处理时执行通过这些方法进行的排序，或者可以连续执行该排序以监视性能度量，然后基于该性能度量的发展变化，可以动态更新该方法。因此，在配置3的实现过程中，可以使用许多不同的方法。噪声消除***的输出随后被提供给一个或多个扬声器3350，以帮助用户听到来自声源3320的声音。扬声器3350被结合到眼镜3201的一个或两个侧框架(镜腿)中。

当相对于麦克风3上接收的声能级，声源3340在麦克风1上产生了更大的声能3342时，实现类似的过程。在这种情况下，该***可以使用波束形成过程以在声源3340的方向上调整麦克风对的主响应轴的方向。

麦克风1和麦克风3对通过比较从麦克风1和麦克风3拾取的声能，帮助用户在谈话期间从用户周围，特别是从左侧和右侧，拾取更强的声音，在小组会议或聊天期间，语音信号可能来自用户的不同方向(右侧或左侧)。配置3比较两个麦克风中的每一个上的声音信号能量，以便确定声音信号来自哪一侧，从而帮助用户在谈话期间将注意力集中在发言积极的人身上。噪声消除***的输出随后被提供给扬声器3350，以帮助用户听到来自声源3320或3340的声音。扬声器3350被结合到眼镜3201的一个或两个侧框架中。

配置切换和扫描

在各种实施例中，***可以配置为在两种、三种或更多种配置之间切换。扫描配置或扫描由结合在头戴式装置的麦克风阵列形成的不同波束(或被选定的麦克风对)，也可以通过头戴式装置内置的信号处理(硬件或硬件和软件的结合)自动完成。因此，在一些实施例中，实现了一种通过相对于用户的多个方向的扫描，从而形成波束(或处理被选定的麦克风对)，并在呈现给本地或远端的用户之前，利用已经接收并经过波束形成、噪声消除、和/或音量调节中的一个或多个改善过的声音信号向用户提供帮助的***。

例如，当同时看电视和打电话时，***可被配置为在配置1(拨打电话)和配置2(观看电视)之间切换。用于切换到配置1(电话功能)的度量可以与检测到麦克风0上的声能改变有关。

配置切换的另一个例子可以是在谈话期间从配置3切换到配置2。例如，在会议中，坐在佩戴了眼镜3201的用户右边的人开始发言。这样的几何形状被由输出声能3322的源3320和麦克风3的输出表示，其中麦克风3的输出大于麦克风1的输出。此时，***在配置3下运行。当用户倾听并意识到发言者在右边时，用户可能会将他或她的头转向右边以面对发言者。现在面对发言者3320，麦克风1和麦克风3上接收到的声能之间的差异减小了，同时麦克风1上的声能增加了。在这种情况下，***切换到上述配置2。

在一种操作模式中，用户不必在会议中将头从一侧转到另一侧以面对发言者。随着积极发言的人从一个位置到另一个位置的变化，例如，从位置3320(相对于眼镜3201的右侧)到位置3340(相对于眼镜3201的左侧)到位置3330(眼镜3201的前面)到位置3380(眼镜3201的后面)。***将在麦克风对和方向之间切换，以选择发言者的方向上的主要麦克风(单独或波束形成的输出)和噪声方向上的参考麦克风(单独或波束形成的输出)(主要是非所需声音信号)。

因此，本发明实施例通过在配置1、2和3(或其任何子集)之间切换的***实现，配置1、2和3(或其任何子集)的切换可通过机械切换、音频切换来操作，或者通过智能设计来操作，智能设计可通过分析一个或多个性能度量来操作，所述性能度量例如但不限于包括最大信噪比差、来自麦克风或波束形成输出的最大声能输出等。

对于利用三个或四个麦克风的三种配置，已经在上面结合附图进行了说明。请注意，四个以上的麦克风可以与头戴式装置一起使用，以提供用于处理声信号的大致n个数量的方向(轴)和可能的配置。同样，波束形成可以利用两个以上的麦克风来执行。

图34根据本发明实施例总体上由3400示出了处理来自配置有头戴式装置的麦克风阵列的声音信号。参考图34，流程开始于块3402。在块3404，扫描作为附接到头戴式装置的麦克风阵列的一部分的麦克风。扫描包括分析来自麦克风的声音信号，以得到信号振幅电平以及在某些情况下的其他参数。在块3406，基于来自块3404的扫描选择配置。在一些实施例中，选择逻辑用于在利用给定麦克风阵列可获得的配置之间进行选择。在块3408，对来自在块3406处被选定的配置的声音信号进行处理，以改善声音信号。改善声音信号可以包括将声音信号输入噪声消除模块，以从主要声道移除底部声音信号。改善声音信号可以包括放大声音信号，并在与头戴式装置结合的扬声器上将放大后的声信号呈现给头戴式装置的用户。该流程停止于块3412。

出于讨论和理解本发明实施例的目的，应当理解的是，本领域技术人员使用各种术语来描述技术和方法。此外，在描述的过程中，出于解释的目的，阐述了许多具体细节，以便提供对本发明实施例的透彻理解。然而，对于本领域普通技术人员来说，很显然的是，实施例可以在没有这些具体细节的情况下实施。在一些实例中，公知的结构和装置以框图形式示出，而不是详细示出，以避免混淆本发明。这些实施例被充分详细地描述以使得本领域技术人员能够实践本发明，并且应当理解的是，可以利用其它实施例并且可以在不偏离本发明的范围的情况下进行逻辑上、机械上、电学上以及其它的改变。

描述的某些部分可以用算法和对例如计算机存储器中的数据位的操作的符号表示来表示。这些算法描述和表示是数据处理领域的普通技术人员用来最有效地将他们工作的实质传达给本领域其他普通技术人员的手段。本文的算法通常是指得到期望结果的行为的自洽序列。这些行为需要对物理量进行物理操作。通常，尽管不是必须的，这些量采取能够被存储、传输、组合、比较和以其他方式操纵的电信号或磁信号的形式。已证明主要是出于通用的原因，将这些信号称作位、值、元素、符号、字符、项、数、波形、数据、时间序列等时常是方便的。

然而，应该铭记的是，所有这些和类似的术语将与适当的物理量相关联，并且仅仅是应用于这些量的方便的标签。除非特别说明，否则从讨论中显而易见的是，在整个描述中，使用诸如“处理”或“估算”或“计算”或“确定”或“显示”等术语的讨论可以指计算机***或类似的电子计算装置的动作和过程，该计算机***或类似的电子计算装置，控制计算机***寄存器和存储器中表示为物理(电子)量的数据，并将其转换为计算机***存储器或寄存器或其它这种信息存储器、传输或显示器件中的表示为物理(电子)量的其他类似数据。

用于执行本文中的操作的设备可以实现本发明。此设备可针对所需目的而特定构造，或者其可包括通过存储在计算机中的计算机程序选择性激活或重新配置的通用计算机。该计算机程序可以存储在计算机可读存储介质上，例如但不限于任何类型的磁盘，包括软盘、硬盘、光盘、光盘只读存储器(CD-ROMs)、以及磁光盘、只读存储器(ROMs)、随机存取存储器(RAMs)、电可编程序只读存储器(EPROM)、电可擦编程只读存储器(EEPROMs)、闪存、磁性或光学卡等等，或者适用于存储计算机本地或远程电子指令的任何类型的介质。

本文中提出的算法与显示并不内在地与任何特定计算机或其它设备相关。根据本文中的说明，各种通用***可以与程序一起使用，或者构造更专用的设备来执行所需的方法被证明是方便的。例如，根据本发明的任何方法可以通过对通用处理器进行编程而得到的硬连线电路实现，或者可通过硬件和软件的任何组合来实现。本领域的技术人员将会理解，本发明可以通过描述之外的其他计算机***配置来实现，该计算机***配置包括：手持装置、多处理器***、基于微处理器的或可编程消费电子器件、数字信号处理(DSP)装置、网络个人计算机、小型计算机、大型计算机等。这些实施例也可以在分布式计算环境中实施，其中任务由通过通信网络链接的远程处理装置来执行。在其他示例中，可以使用片上***(SOC)、蓝牙芯片、数字信号处理(DSP)芯片、带集成电路的编解码器(ICs)或其他硬件和软件实现来实现上述图1至图31中所述的本发明实施例。

本发明的方法可以使用计算机软件实现。如果使用符合公认标准的编程语言编写，则可以编译为实现这些方法而设计的指令序列，以便在各种硬件平台上执行，并与各种操作***接口。此外，本发明没有参考任何特定的编程语言来描述。应当理解的是，可以使用各种编程语言来实现本文中描述的实施例。另外，在本领域中经常将一种形式或另一种形式(例如，程序、流程、应用程序、驱动程序……)的软件说成是采取某一动作或导致某一结果。这些表达仅仅是对计算机执行软件使得计算机的处理器执行动作或产生结果的一种简短说法。

应当理解的是，本领域技术人员使用各种术语和技术来描述通信、协议、应用、实现、机制等。一种类似技术是用算法或数学表达式来描述技术的实现。即，尽管技术可以例如被实现为执行计算机上的代码，然而该技术的表达可以更合适并且简洁地转达或传达为公式、算法、数学表达式、框图或流程图。因此，本领域普通技术人员将会认识到，将A+B＝C表示为加法函数的块，其在硬件和/或软件中的实现将采用两个输入(A和B)并产生一个求和输出(C)。因此，公式、算法或数学表达式作为描述的使用应被理解为至少在硬件和/或软件(例如，计算机***，本发明的技术可以在该计算机***中作为实施例实施和实现)中具有物理实施例。

非暂时性机器可读介质被理解为包括以机器(例如计算机)可读的形式存储信息的任何机制。例如，机器可读介质，同义地称为计算机可读介质，包括只读存储器(ROM)；随机存取存储器(RAM)；磁盘存储介质；光学存储介质；闪存装置；除了通过传播信号(例如，载波、红外信号、数字信号等)传输信息的电、光、声或其他形式的信息传输；等等。

如在本说明书中所使用的，“一个实施例”或“实施例”或类似短语意味着所描述的特征被包括在本发明的至少一个实施例中。本描述中提及的“一个实施例”不一定指同一实施例，然而这些实施例并不互相排斥。“一个实施例”也不意味着本发明只有一个实施例。例如，在“一个实施例”中描述的如，特征、结构、动作等，也可以包括在其他实施例中。因此，本发明可以包括本文中描述的实施例的各种组合和/或集成。

因此，本发明实施例可用于从处理和传送所述声音信号的声学***中减少或消除的非所需声音信号。***的一些非限制性示例可以，但不限于是，在短臂耳机中使用，例如适用于企业呼叫中心、工业和一般移动用途的电话音频耳机，具有安装在眼镜框架上或框架之内的输入线(电线、电缆或其他连接器)的直插式“耳塞式”耳机、近眼式(NTE)耳机显示器或耳机计算装置，用于工业、军事和航空应用等高噪音环境的长臂耳机，以及可用于提供剧院或交响乐厅类型的音质的音响效果的无需结构成本的鹅颈台式麦克风。本发明的其他实施例容易在具有一般配置的头戴式装置中实现，例如但不限于眼镜、护目镜、遮阳帽、头带、头盔等。

虽然已经依据数个实施例描述了本发明，但是本领域技术人员将认识到，本发明不限于所描述的实施例，而是可以通过在所附权利要求的精神和范围内进行修改和变更来实施。因此，本描述应被视为说明性的，而不是限制性的。

Claims

1.一种戴在用户头部的设备，其特征在于，包括：

头戴式装置；

具有至少三个麦克风的阵列，所述至少三个麦克风沿多个至少两个非平行的轴设置；

选择逻辑，所述选择逻辑被配置为从所述多个非平行的轴中识别被选定的轴，以及从形成所述被选定轴的阵列中识别两个麦克风；以及

波束形成器，所述波束形成器被配置为接收来自所述两个麦克风的信号作为输入，并输出主麦克风通道和参考麦克风通道。

2.根据权利要求1所述的设备，其特征在于，所述选择逻辑使用度量识别所述被选定的轴。

3.根据权利要求2所述的设备，其特征在于，所述度量包括麦克风，所述麦克风接收最大声压级。

4.根据权利要求3所述的设备，其特征在于，所述度量包括麦克风，所述麦克风接收最小声压级。

5.根据权利要求2所述的设备，其特征在于，所述选择逻辑被配置为监控所述度量，并基于所述度量的新值从所述多个非平行的轴中选择新的被选定的轴。

6.根据权利要求2所述的设备，其特征在于，所述度量是所述两个麦克风的最大信噪比差。

7.根据权利要求1所述的设备，其特征在于，还包括：

开关，基于所述开关的状态选择所述被选定的轴。

8.根据权利要求1所述的设备，其特征在于，

所述主麦克风通道和所述参考麦克风通道被输入到两级噪声消除模块。

9.根据权利要求1所述的设备，其特征在于，还包括：

扬声器，所述扬声器被连接至所述头戴式装置且被配置为提供所述用户能够听到的信号。

10.根据权利要求9所述的设备，其特征在于，当所述被选定的轴不指向所述用户的嘴时，所述主麦克风通道和所述参考麦克风通道用于创建输入所述扬声器的信号。

11.根据权利要求1所述的设备，其特征在于，所述阵列的第一麦克风、第二麦克风以及第三麦克风位于所述头戴式装置的第一镜腿上。

12.根据权利要求11所述的设备，其特征在于，所述第一麦克风和所述第二麦克风位于所述第一镜腿的内表面上。

13.根据权利要求11所述的设备，其特征在于，所述阵列还包括：

第四麦克风，所述第四麦克风位于所述头戴式装置的第二镜腿上且所述第一麦克风和所述第四麦克风形成第三轴，所述第二麦克风和所述第四麦克风形成第四轴且所述第三轴不同于所述第四轴，所述选择逻辑从至少是所述第一轴、所述第二轴以及所述第三轴中的一个选择活动方向。

14.一种戴在用户头部的设备，其特征在于，包括：

头戴式装置，所述头戴式装置进一步包括：

具有三个麦克风的阵列，所述阵列被连接至所述头戴式装置，其中所述阵列的第一麦克风和第二麦克风限定第一轴；所述第二麦克风和第三麦克风限定第二轴；以及

扬声器，所述扬声器被连接至所述头戴式装置且被配置为提供所述用户能够听到的信号；以及

选择逻辑，所述选择逻辑从所述第一轴和所述第二轴之中选择活动方向，当所述活动方向为所述第一轴时；

a、来自所述第一麦克风和所述第二麦克风的输出将被处理，以从所述头戴式装置传输；当所述活动方向为所述第二轴时；

b、来自所述第二麦克风和所述第三麦克风的输出将被处理，以用作所述扬声器的输入。

15.根据权利要求14所述的设备，其特征在于，所述第一麦克风、所述第二麦克风以及第三麦克风位于所述头戴式装置的第一镜腿上。

16.根据权利要求15所述的设备，其特征在于，所述第一麦克风和所述第二麦克风位于所述第一镜腿的内表面上，且所述第三麦克风位于所述第一镜腿的底部表面。

17.根据权利要求15所述的设备，其特征在于，所述阵列还包括：

18.一种用于选择在戴在用户头部的装置上接收的声音信号的方法，其特征在于，包括：

比较来自具有至少三个麦克风的阵列的声音信号，其中所述至少三个麦克风的位置限定三个非平行的轴；

从所述阵列中选择第一麦克风对，其中所述第一麦克风对包括第一麦克风和第二麦克风；

从所述第一麦克风对形成主要麦克风信号；以及

从所述第一麦克风对形成参考麦克风信号；其中，所述主要麦克风信号和所述参考麦克风信号被输入噪声消除模块，以减少来自所述主要麦克风信号的噪声。

19.根据权利要求18所述的方法，其特征在于，所述比较从所述阵列中形成至少三个麦克风对，从每一个麦克风对中识别出潜在的主要麦克风和潜在的参考麦克风，为每一个麦克风对计算信噪比差，且所述第一麦克风对是具有最大SNR差的麦克风对。

20.根据权利要求18所述的方法，其特征在于，所述形成所述主要麦克风信号是通过对所述第一麦克风对进行波束形成实现的，且形成所述参考麦克风信号不是通过对所述第一麦克风对进行波束形成实现的。

21.根据权利要求18所述的方法，其特征在于，所述形成所述主要麦克风信号不是通过对所述第一麦克风对进行波束形成实现的，且形成所述参考麦克风信号是通过对所述第一麦克风对进行波束形成实现的。

22.根据权利要求19所述的方法，其特征在于，在比较声音信号期间，对麦克风对执行波束形成。

23.一种戴在用户头部的设备，其特征在于，包括：

头戴式装置，所述头戴式装置被配置为戴在所述用户的头部；

第一麦克风，所述第一麦克风被连接至所述头戴式装置，以接收来自声源的第一声音信号；

第二麦克风，所述第二麦克风被连接至所述头戴式装置，以接收来自所述声源的第二声音信号；以及

波束形成器，所述波束形成器进一步包括：

第一输入，所述第一输入被配置为接收所述第一声音信号；

第二输入，所述第二输入被配置为接收所述第二声音信号；

主信号输出，所述波束形成器被配置为从所述第一声音信号和所述第二声音信号形成主信号，其中所述主信号通过在第一方向上引导主响应轴形成，所述主信号被从所述主信号输出输出；以及

参考信号输出，所述波束形成器被配置为从所述第一声音信号和所述第二声音信号形成参考信号，其中所述参考信号通过在第二方向上引导参考响应轴形成，其中，所述第一方向与所述第二方向不同，所述参考信号被从所述参考信号输出输出。

24.根据权利要求23所述的设备，其特征在于，当所述头戴式装置戴在所述用户的头上时，形成于所述第一麦克风和所述第二麦克风之间的第一轴指向所述用户的嘴。

25.根据权利要求24所述的设备，其特征在于，当所述头戴式装置戴在所述用户的头上时，形成于所述第一麦克风和所述第二麦克风之间的第二轴指向所述用户的前方。

26.根据权利要求25所述的设备，其特征在于，当所述头戴式装置戴在所述用户的头上时，形成于所述第一麦克风和所述第二麦克风之间的第三轴指向所述用户的一侧。

27.根据权利要求26所述的设备，其特征在于，还包括：

选择逻辑，所述选择逻辑被配置为基于预定义的标准，从所述第一轴、所述第二轴和所述第三轴中的一个选择所述第一方向。

28.根据权利要求23所述的设备，其特征在于，所述主信号作为主通道被输入两级噪声消除单元，所述参考信号作为参考通道被输入所述两级噪声消除单元。

29.一种戴在用户头部的设备，其特征在于，包括：

第一麦克风，所述第一麦克风被连接至所述头戴式装置的第一镜腿，以接收来自声源的第一声音信号，所述第一麦克风距离所述声源第一距离；

第二麦克风，所述第二麦克风被连接至所述头戴式装置的第一镜腿，以接收来自所述声源的第二声音信号，所述第二麦克风距离所述声源第二距离；以及

波束形成器，所述波束形成器进一步包括：

第一输入，所述第一输入被配置为接收所述第一声音信号；

第二输入，所述第二输入被配置为接收所述第二声音信号；

参考信号，所述第二声音信号用于所述参考信号，所述第二距离大于所述第一距离。