CN114128307A

CN114128307A - 用于个人听取设备中的自适应声音均衡的***和方法

Info

Publication number: CN114128307A
Application number: CN202080050041.5A
Authority: CN
Inventors: M·M·古德温; M·沃尔什
Original assignee: DTS Inc
Current assignee: DTS Inc
Priority date: 2019-06-07
Filing date: 2020-06-07
Publication date: 2022-03-01
Also published as: JP2022535299A; EP3981167A1; KR20220018540A; WO2020247892A1; US20220166396A1

Abstract

公开了用于个人听取设备中的自适应声音均衡的***和方法的实施例。在一些实施例中，个人听取设备中的麦克风接收来自收听者的环境的声音。然后分析声音以确定一个或多个期望的目标，例如响度级别或频谱平衡。所确定的目标然后被用于控制由麦克风接收的声音的自适应处理以生成感知上改善的声音以向收听者渲染。

Description

用于个人听取设备中的自适应声音均衡的***和方法

相关申请和优先权要求

本申请与2019年6月7日提交的标题为“ACTIVE AND PASSIVE NOISE CANCELATIONWITH ACTIVE EQUALIZATION”的美国临时申请No.62/858,469相关并要求其优先权，上述临时申请通过引用整体并入本文。

背景技术

诸如音乐会之类的一些收听体验在感知上可以是次优的。例如，大型场地中的流行音乐会可能以极为响亮的音量渲染，这可能既不符合收听者的口味，又可能对收听者的听力有害。此外，音乐可能以不利的频谱不平衡渲染，例如低音过大。此类问题也出现在其它场景中，并且是收听体验的常见障碍。例如，收听者可能希望在嘈杂的环境(诸如飞机)中或在使用公共交通工具时更清楚地听到交谈。在另一个示例中，城市街道上的骑自行车者可能希望他们的收听设备为了安全起见是透声的，同时仍然限制来自过往车辆或道路工程的过度噪音污染的有害影响。关于电平和均衡的偏好可能因人而异，并且可能取决于收听环境。因此，收听者期望能够基于收听者的个人喜好来控制和定制收听者所体验的声音场景的响度和频谱均衡这两者。

在诸如音乐会之类的嘈杂收听环境中降低响度和保护听力的常用方法是使用泡沫耳塞。使用泡沫耳塞的目的是通过物理堵塞耳道来减弱到达耳膜的声音。虽然这确实减少了到达耳膜的声音，但这种耳塞不成比例地比低频内容更多地减少了高频内容。这会对收听者的声音的频谱平衡产生负面影响。消费者收听者可用的当前解决方案没有解决频谱平衡问题。

发明内容

提供本发明内容是为了以简化的形式介绍下面在具体实施方式中进一步描述的概念的选择。本发明内容不旨在识别所要求保护主题的关键特征或必要特征，也不旨在用于限制所要求保护主题的范围。

在现场音乐会和其它场景中的收听体验在感知上可以是次优的。例如，它们可能被渲染在对于收听者的舒适度或听觉健康来说太大的级别，并且具有与收听者的偏好不匹配的频谱平衡。本发明的实施例既解决响度问题又解决频谱平衡问题以改善收听体验。

本文公开的***和方法的实施例使用新颖的技术来集成被动声音抑制和自适应声音均衡，以在个人可听设备中实时处理传入音频信号。本文描述的***和方法的实施例包括主动监视和调整“现实世界”的听觉事件(诸如音乐表演)的频谱平衡、动力学和响度特点以便自适应地匹配目标性能准则的新技术。这是任何其它产品或应用都没有尝试过的，并且解决了在诸如现场声学表演之类的场景中与有效的听力保护和改善的声音质量的结合有关的常见问题。

本发明的实施例在使用耳塞时将耳塞形状因数(form factor)用于级别衰减。在一些实施例中，本发明使用声学密封的头戴式受话器。在一些实施例中，收听者使用一对耳塞，每只耳朵一个。在其它实施例中，每个耳塞包括用于接收传入声音的外部麦克风、用于处理传入声音的内部信号处理单元，以及用于将经处理的声音呈现给收听者的换能器。在一些实施例中，每个耳塞还包括内部麦克风以监视向收听者渲染的声音。本发明的其它实施例使用具有声学密封耳罩的头戴式耳机形状因数。在一些实施例中，头戴式耳机在每只耳朵处包括用于接收传入声音的外部麦克风。在一些实施例中，在每只耳朵处还包括内部麦克风以监视向收听者渲染的声音。

收听者的偏好可以根据收听环境而变化。例如，在纯粹嘈杂的环境中，收听者的偏好可以是听不到环境中的任何声音。在其它情况下，收听者的偏好可以是从环境中听到声音，但处于衰减级别，例如维持对环境的某种意识。在其它情况下，收听者的偏好可以是听到环境声音，但具有改善的频谱平衡。在其它情况下，收听者的偏好可以是选择性地听到环境声音的方面。在一些情况下，环境声音可以随时间变化，使得不断满足收听者的偏好可能要求对环境进行一些适配。因此，自适应地控制传入声音的级别和频谱平衡以改善收听体验是受到关注的。在一些实施例中，传入声音的自适应处理被配置为实现目标级别。在一些实施例中，传入声音的自适应处理被配置为实现目标频谱平衡。

本发明的一些实施例部分地基于用户偏好来建立用于渲染声音的目标响度。本发明的一些实施例部分地基于强制的听力保护指南来建立用于渲染声音的目标响度。一些实施例部分地基于用户设置来建立用于渲染传入的声音的目标频谱平衡。一些实施例通过分析传入声音以根据分析结果确定频谱平衡来建立目标频谱平衡。例如，分析可以确定传入声音是爵士音乐，使得用户对爵士音乐的优选均衡应当通知目标平衡的选择。

公开了用于个人听取设备中的自适应声音均衡的***和方法的实施例。在一些实施例中，一种用于处理传入音频信号的方法对传入音频信号应用主动均衡以获得均衡的音频信号。然后将这个均衡的音频信号调谐到目标均衡以获得输出音频信号。输出音频信号被渲染以回放给收听者。输出音频信号是传入音频信号的感知改善版本，至少对于为其调谐目标均衡的特定收听者而言是这样。

在一些实施例中，该方法包括基于艺术家的录音(recording)的知识来确定目标均衡。通常，这是其录音包含在传入音频信号中的音乐艺术家。在一些实施例中，使用一种或多种机器学习技术来分析包含艺术家的录音的数据库。这允许***和方法的实施例基于艺术家的录音的数据库来确定目标均衡。在一些实施例中，有源滤波器被用于将均衡的音频信号调谐到目标均衡。

本发明的实施例还包括一种用于处理传入音频信号的方法，包括主动监视传入音频信号的音频特点并提供包含目标性能准则的目标数据。在一些情况下，这个目标数据包括收听者的听力图或测得的听力损失曲线。这允许对传入的音频进行调谐或适配，使得可以放大收听者可能有听力障碍的某些频率。在一些实施例中，该方法包括强调对话频带以获得经适配的音频特点。这允许收听者听到否则收听者可能难以听到的电视节目或电影中的对话。

该方法的实施例还包括使传入音频信号的音频特点适配目标性能准则以获得传入音频信号的经适配的音频特点。在一些实施例中，通过基于目标性能准则更新自适应滤波器来实现音频特点的适配。在输出信号中渲染经适配的音频特点。与传入音频信号相比，这为收听者提供了更好的来自输出信号的收听体验。在一些实施例中，在个人听取设备上渲染音频信号中的经适配的音频特点。

在一些实施例中，个人听取设备中的麦克风从收听者的环境接收声音。然后分析声音以确定一个或多个期望的目标，例如响度级别或频谱平衡。所确定的目标然后被用于控制由麦克风接收到的声音的自适应处理以生成感知上改善的声音以向收听者渲染。

该方法的实施例还包括识别传入音频信号中的歌曲以获得识别出的歌曲并基于识别出的歌曲确定目标数据。其它实施例包括识别传入音频信号中的歌曲的流派以获得识别出的流派并基于识别出的流派确定目标数据。其它实施例包括识别传入音频信号中不想要的声音的音频特点并基于不想要的声音的音频特点确定目标数据。

实施例还包括一种用于处理传入音频信号的可听设备。该可听设备包括处理器和存储指令的存储器。这些指令在由处理器执行时配置可听设备以主动监视传入音频信号的音频特点。听取设备还被配置为提供包含目标性能准则的目标数据并且使传入音频信号的音频特点适配目标性能准则以获得传入音频信号的经适配的音频特点。这些经适配的音频特点在输出信号中被渲染为收听者的改善的听觉体验。

出于总结本公开的目的，本文已经描述了本发明的某些方面、优点和新颖特征。应该理解的是，根据本文公开的本发明的任何特定实施例，不一定能实现所有这些优点。因此，本文公开的发明可以以实现或优化如本文所教导的一个优点或一组优点的方式实施或执行，而不必实现如本文教导或建议的其它优点。

应当注意的是，替代实施例是可能的，并且本文讨论的步骤和元素可以根据特定实施例而改变、添加或消除。在不脱离本发明的范围的情况下，这些替代实施例包括可使用的替代步骤和替代元素，以及可做出的结构改变。

附图说明

在整个附图中，附图标记被重用以指示参考元素之间的对应关系。提供附图是为了说明本文描述的本发明的实施例，而不是限制其范围。

图1图示了根据本发明的实施例的耳塞形状因数的个人听取设备的第一示例性实施例。

图2图示了根据本发明的实施例的耳塞形状因数的个人听取设备的第二示例性实施例。

图3是根据本发明的实施例的图1中所示的音频处理器的***框图。

图4是根据本发明的实施例的图3中所示的中央处理器的框图。

图5是根据本发明的实施例的图4中所示的目标确定模块的框图。

图6是根据本发明的第一实施例的图4中所示的自适应处理模块的框图。

图7是根据本发明的第二实施例的图4中所示的自适应处理模块的框图。

图8是图示本发明的第一实施例集合的方法的一般流程图。

图9是图示本发明的第二实施例集合的方法的一般流程图。

具体实施方式

如以上背景技术和发明内容中所述，现实世界收听体验可能因极端的响度、差的频谱平衡或其它因素而在感知上降级。因此，有用的解决方案将解决响度降低和保持优选频谱平衡的两个目标。2014年有3200万人参加了至少一个现场音乐节(根据Nielsen)，很明显有大量***可以从改善的现场音乐收听体验中受益。

降级的收听体验的一个示例是大型舞台音乐会。典型摇滚音乐会的收听者可能暴露于平均120dB SPL的声音级别，这会导致诸如耳鸣之类的短期听力问题和诸如永久性听力损失之类的长期听力问题。作为收听体验的进一步降级，场地的大型低音炮和低频声学模式可以造成明显的频谱不平衡和表演清晰度的损失。此类降级可以取决于座椅位置。降级的收听体验的另一个示例是大片电影，影院中的声音级别可以响亮得构成危险。在诸如音乐会或电影之类的场景中，收听者可能更喜欢将响度限制在期望的级别。收听者可能更喜欢以期望的频谱平衡来渲染声音。在一些情况下，收听者可以选择频谱平衡目标来补偿收听者的听力图或强调对话的频谱平衡。在一些情况下，收听者可能更喜欢用原始节目材料的频谱平衡来渲染声音，而不招致收听环境的降级的频谱效果。因而，本发明的实施例在个人听取设备中提供自适应声音均衡和级别调整以解决此类偏好。

收听者可能更喜欢在除上述场景之外的其它收听场景中在个人听取设备中自适应地再现外部声音。例如，在诸如飞机或公共交通之类的嘈杂环境中进行交谈时，收听者可能更喜欢在增强语音的同时减弱背景噪声。作为另一个示例，使用个人听取设备(例如，耳塞或头戴式耳机)收听音乐的收听者可能无法听到来自外部环境的潜在重要声音，例如车辆交通的声音或公共广播的声音。这种外部声音可以被渲染给收听者，同时限制收听者暴露于可能令收听者反感或对收听者听力有害的过高声音级别。因而，本发明的实施例在个人听取设备中提供自适应声音均衡和级别调整，以使得能够改善收听者感兴趣的外部声音的渲染。

本发明的实施例还包括耳塞形状因数的个人听取设备。由于耳道的物理闭塞，耳塞形状因数对来自用户的环境的传入的声音提供了某种衰减(或被动抑制)。本发明的实施例还包括头戴式耳机形状因数的个人听取设备，其可以类似地提供来自用户的环境的声音的被动衰减。

使用耳塞进行被动响度衰减在音乐会上是常见的。一些有源个人听取设备被配置为对来自收听者的环境的声音应用固定增益或固定均衡。本发明的实施例通过使向收听者渲染的声音适配特定响度级别来改善先前的方法，该特定响度级别可以由收听者指定或根据安全收听级别的指南来指定。本发明的实施例通过适配向收听者渲染的声音以实现指定的频谱平衡来改善先前的方法，该频谱平衡可以由收听者指定或根据与要渲染的声音相关联的数据来指定。

根据本发明的一些实施例，图1图示了本发明的第一示例性实施例，作为个人听取设备100，其形状因数为被***收听者的耳道中的耳塞(earplug)或耳筒(earbud)。所描绘的设备包括用于接收传入声音的外部麦克风、用于处理接收到的声音的音频处理器、以及用于向收听者渲染声音的内部换能器。应当注意的是，“外部麦克风”是指对外部收听环境开放的麦克风。相比之下，“内部麦克风”是对收听者的耳朵开放的麦克风。类似地，“内部扬声器”是对收听者的耳朵开放的扬声器。通常，外部麦克风和内部麦克风之间存在某种类型的物理声学屏障。虽然该图示示出了单个元件，但在典型的实施例中，这种设备用于收听者的每个耳朵中。

参考图1，个人听取设备100的形状被设计为提供收听者耳道的闭塞，使得物理地阻止外部声音到达耳道。安装的麦克风102对外部环境开放以接收传入的声学信号。换句话说，声音从收听者的环境声学传播到收听者。安装的麦克风102将接收的声学信号换能成电形式。经换能的电信号被提供给音频处理器104，音频处理器104进而将经处理的信号提供给装入耳道的扬声器106。扬声器106将经处理的信号换能成声信号，以便通过用户的耳道传送到用户的耳膜。

根据本发明的一些实施例，图2图示了本发明的第二示例性实施例，作为个人听取设备200，其形状因数为被***收听者的耳道中的耳塞或耳筒。虽然该图示示出了单个元件，但在典型的实施例中，这种设备用于收听者的每个耳朵中。个人听取设备200包括用于接收传入的声音的外部麦克风、用于处理接收的声音的音频处理器、用于向收听者渲染声音的内部换能器、以及用于监视向收听者渲染的声音的内部麦克风。由内部麦克风接收的信号也被提供给处理器。

参考图2，个人听取设备200的形状被设计为提供耳道的闭塞，使得物理地阻止外部声音到达耳道。安装的麦克风202对外部环境开放以接收传入的声学信号。麦克风将接收的声学信号换能成电形式。经换能的电信号被提供给音频处理器204，音频处理器204进而将经处理的信号提供给扬声器206，扬声器206被装入耳道。扬声器206将经处理的信号换能成声学信号，以便通过用户的耳道传送到用户的耳膜。

安装的麦克风208对耳道开放以将内部声学信号换能成电形式。电形式的信号被提供给音频处理器204以监视耳道中的声学信号，该声学信号是由扬声器206渲染的声学信号和物理传播到内部的任何外部声音的组合。例如，外部声音可能不会被个人听取设备200的耳道闭塞物完全阻挡，因此可能部分地传播到耳道。

图3是根据本发明的一些实施例的图1中所示的音频处理器104的框图。音频处理器104从麦克风(未示出)接收输出信号作为线路302上的输入。模拟/数字转换器304将信号302从模拟信号转换成数字信号，该数字信号作为输入被提供给处理器306。

处理器306输出经处理的数字信号，该数字信号由数模转换器308从数字信号转换成模拟信号。数字/模拟转换器的输出在线路310上提供，以便随后由扬声器(未示出)换能。本领域普通技术人员将认识到的是，图2中所示的音频处理器204(或用于本发明的其它实施例的音频处理器)将包括与针对音频处理器104所描述的组件相似的组件。例如，使用音频处理器204的实施例将包括第二麦克风输入、第二模拟/数字转换器和到中央处理器的第二数字输入。

在图3中所示的框图中，中央处理器306连接到存储器单元312。在一些实施例中，中央处理器306将信息存储在存储器单元312中并从存储器单元312检索信息。在一些实施例中，存储器单元312包括控制逻辑314。在一些实施例中，存储器单元312包括数据单元316。数据单元316存储由中央处理器306导出的数据，例如输入音频信号的多个频带的能量量度。在一些实施例中，数据单元316存储将由中央处理器306使用的数据。在一些实施例中，数据单元316存储要向收听者渲染的声音的目标响度级别。在一些实施例中，目标响度被中央处理器306用来至少部分地确定所需的对处理器输入信号的处理以确定处理器输出信号。在一些实施例中，数据单元316存储用于向收听者渲染声音的目标频谱平衡，有时称为频谱均衡。在一些实施例中，目标频谱平衡被中央处理器306用来至少部分地确定所需的对处理器输入信号的处理以确定处理器输出信号。

如上所述，在一些实施例中，数据单元316存储目标数据以供中央处理器316用来确定输入信号所需的处理以生成输出信号。目标数据可以包括输出信号的目标平均响度级别。目标数据可以包括输出信号的目标峰值响度级别。目标数据可以包括输出信号的目标频谱平衡或均衡。目标数据可以包括目标响度级别或目标频谱平衡以外的信息。在本发明的一些实施例中，目标数据与默认设置对应。在一些实施例中，目标数据至少部分地基于用户选择的预设置。在一些实施例中，目标数据可以是固定的。在某些情况下，目标数据可以是时变的。在一些实施例中，目标数据至少部分地基于用户输入。例如，用户选择目标响度级别或建立目标频谱平衡。在一些实施例中，目标数据至少部分地基于对由外部麦克风(诸如图1中所示的麦克风102或图2中所示的麦克风202)换能的信号的分析。换句话说，目标数据可以至少部分地基于对收听者的环境中的声音的分析。

例如，在现场音乐会场景中，输入信号或输入信号的某些特征可以被流传输到音乐识别应用，音乐识别应用可以识别歌曲并返回与那首歌曲相关的目标数据，例如目标响度或目标频谱平衡。这个数据可以被用于至少部分地确定由中央处理器316使用的目标数据。在其它情况下，例如当此类数据不可用作为音乐识别服务的一部分时，此类特定于歌曲的目标数据可以使用用户自己的内容库在本地离线预先计算，例如通过分析库的相关部分的频谱平衡和响度特点，例如特定艺术家的歌曲或特定流派的歌曲。

图4是根据本发明的实施例的图3中所示的中央处理器306的处理框图。参考图4，中央处理器306包括自适应处理模块404和提供数据以至少部分地控制自适应处理模块404的操作的目标确定模块408。中央处理器306接收数字音频信号作为线路402上的输入。数字音频信号由自适应处理模块404处理，自适应处理模块404提供数字音频信号作为线路406上的输出。线路402上的数字音频信号进一步作为输入被提供给目标确定模块408。在一些实施例中，目标确定模块408至少部分地基于线路402上的输入数字音频信号来确定要在线路410上提供给自适应处理模块404的目标数据。在一些实施例中，自适应处理模块404在线路412上向目标确定模块408提供数据。在一些实施例中，目标确定模块408使用线路412上的数据来至少部分地确定目标数据以在线路410上提供给自适应处理模块404。

在一些实施例中，自适应模块404被配置为不向目标确定模块408提供数据。在一些实施例中，目标确定模块408被配置为不接收线路402上的数字音频信号。本领域的普通技术人员将理解和认识的是，可以对中央处理器306的配置进行变化。例如，本发明的一些实施例包括根据音频处理器204将第二数字音频输入信号结合到处理器中，如图2中所示。

图5是根据本发明的实施例的图4中所示的目标确定模块408的框图。在一些实施例中，目标确定模块408接收数字音频信号作为线路402上的输入。在一些实施例中，目标确定模块408在线路412上从自适应处理模块404接收数据。

在一些实施例中，特征确定模块502至少部分地基于线路402上的数字音频信号确定与收听者的环境中的声音相关的特征。在一些实施例中，特征确定模块502至少部分地基于在线路412上提供的来自自适应处理模块404的数据来确定与收听者的环境中的声音相关的特征。特征确定模块502将特征输出到特征映射模块504。特征映射模块504至少部分地基于由特征确定模块502提供的特征来确定目标数据。特征映射模块504在线路410上向自适应处理模块404提供目标数据。

在一些实施例中，特征映射模块504包括用于与听取设备200的在听取设备100外部的设备或***通信的组件。例如，这些组件包括个人设备(诸如智能电话)或基于云的***(诸如数据服务器)。特征映射模块504将特征传送到外部设备或***。外部设备或***使用这些特征来确定目标数据。外部设备或***将目标数据传送到特征映射模块504。

在一些实施例中，外部设备或***使用这些特征来识别在收听者的环境中正在播放的歌曲并根据识别出的歌曲来确定目标数据。在一些实施例中，外部设备或***使用这些特征来识别在收听者的环境中播放的音乐的流派并且还根据识别出的流派来确定目标数据。在一些实施例中，外部设备使用这些特征来确定收听者的环境中不想要的声音(诸如背景噪声)的特点并且根据所确定的特点来确定目标数据。

图6是根据本发明的第一实施例的图4中所示的自适应处理模块404的框图。如图6中所示，自适应处理器模块404在线路402上接收输入信号X(ω)，该输入信号X(ω)与由听取设备的外部安装的麦克风(例如图1中所示的麦克风102)接收的信号的数字形式对应。输入信号X(ω)作为输入被提供给自适应滤波器602。自适应滤波器602的传递函数在图6中用H(ω)表示。输入信号进一步作为输入被提供给适配控制模块606和泄漏模型604。泄漏模型604至少部分地包括传递函数L(ω)。泄漏模型604的输出L(ω)X(ω)与通过听取设备(例如图1中所示的个人听取设备100)的闭塞物泄漏到收听者的耳道中的来自收听者的环境的声音的估计对应。本领域普通技术人员将理解的是，ω是频率变量并且本文的信号和***是在频域中考虑的。例如，X(ω)是输入信号的频域表示。本领域普通技术人员将理解的是，例如在处理器306中，可以通过结合频域处理之前的适当正向变换和频域处理之后的适当逆变换来在频域中执行数字信号处理，例如，滑动窗口短时傅立叶变换作为正向变换，以及带有重叠相加的逆短时傅立叶变换作为逆变换。

在一些示例性实施例中，在适配控制模块606中考虑这种泄漏。在线路410上将目标数据T(ω)提供给适配控制模块606。适配控制模块606在线路608上向自适应滤波器602提供控制数据。例如，该自适应滤波器602可以根据适配控制模块606的一个或多个输入来更新。

在一些实施例中，适配控制模块606被配置为确定滤波器使得由收听者接收的声音具有目标频谱平衡T(ω)。对于这种数学发展，由收听者接收的声音被表示为自适应滤波器602的输出与外部声音通过个人听取设备100的闭塞物进入收听者耳道的泄漏之和。

这在数学上表示为：

Y(ω)＝H(ω)X(ω)+L(ω)X(ω) (1)其中Y(ω)表示由收听者接收的声音，H(ω)X(ω)是自适应滤波器的输出，并且L(ω)X(ω)是泄漏的估计。

通过最小化输出频谱Y(ω)与目标T(ω)的差异的量度来确定滤波器H(ω)。在一些实施例中，平方误差度量被用作差异的量度，特别地，

∈(ω)＝|Y(ω)-T(ω)|². (2)使用等式(1)，平方误差度量的最优滤波器

被确定为

或者，就统计量度而言，

等式(3)和(4)中的频谱和统计量度可以随时间变化，因此最优滤波器可能随时间变化。可以如下将时间依赖性包括在等式(4)中：

在适当的时间尺度上估计分别与输入和目标之间的互相关以及输入的自相关对应的统计量度R_XT(ω,t)和R_XX(ω,t)(在频率ω和时间t)，如本领域普通技术人员将理解的。本领域普通技术人员将进一步理解的是，统计量度可以随着输入信号、目标或这两者的改变而随时间改变。在一些实施例中，在处理时间t，自适应滤波器602根据其先前处理时间t-1的滤波器设置和由适配控制块606针对时间t提供的最优滤波器的组合而被适配，例如作为

其中a是适当选择的遗忘因子。

图7是根据本发明的第二实施例的图4中所示的自适应处理模块404的框图。参考图7，自适应处理器模块404在线路402上接收输入信号X(ω)，该输入信号X(ω)与由听取设备的在外部安装的麦克风(诸如图2中所示的个人听取设备200的麦克风202)接收的信号的数字形式对应。输入信号X(ω)作为输入被提供给自适应滤波器702。自适应滤波器702的传递函数由H(ω)表示。

信号Y(ω)作为输入在线路710上被提供给适配控制模块706。信号Y(ω)与由监视收听者的耳道中的声音的内部麦克风(诸如图2中所示的个人听取设备200的在内部安装的麦克风208)接收和换能的信号对应。目标数据T(ω)在线路410上被提供给适配控制模块706。适配控制模块706在线路708上向自适应滤波器702提供控制数据，例如根据适配控制模块706的一个或多个输入确定的经更新的滤波器。

在一些实施例中，适配控制模块706根据平方误差度量确定最优滤波器，例如

其中统计量度R_XZ(ω)与输入和泄漏信号Z(ω)之间的互相关(计算为Y(ω)-H(ω)X(ω))对应。本领域的普通技术人员将认识到的是，时间相关性可以结合到等式(7)中，如等式(5)中那样，导致：

图8是根据本发明的第一实施例集合的流程图。该方法开始于在外部麦克风处接收声学信号(方框802)。例如，这个外部麦克风可以是个人听取设备100中的外部安装的麦克风102，图1中所示。接下来，声学信号被外部麦克风换能成电形式，然后例如被模数转换器304转换成数字形式(方框804)。由模数转换器生成的数字输入信号然后由处理器(例如处理器306)接收(方框806)。

例如在特征确定模块502中确定数字输入信号的特征(方框808)。特征确定模块502是目标确定模块408的组件，目标确定模块408是处理器306的组件。接下来，例如在图5中所示的特征映射模块504中，目标数据至少部分地由所确定的信号特征来确定(方框810)。特征映射模块504是目标确定模块408的组件，目标确定模块408是处理器306的组件。

该过程通过诸如在图6中所示的泄漏模块604中确定外部声学信号泄漏到收听者的耳道中的估计继续进行(方框812)。泄漏模块604是自适应处理模块404的组件，自适应处理模块404是处理器306的组件。在方框806中由处理器接收的数字输入信号、在方框810中确定的目标数据和在方框814中确定的泄漏估计被提供给适配控制模块(诸如适配控制模块606)(方框814)。适配控制模块606是自适应处理模块404的组件，自适应处理模块404是处理器306的组件。

该过程通过更新自适应滤波器继续进行(方框816)。在一些实施例中，适配控制模块606计算更新后的自适应滤波器，例如根据等式(5)，并且在线路608上向自适应滤波器602提供更新后的自适应滤波器。接下来，自适应滤波器被应用于数字输入信号以生成数字输出信号(方框818)。例如，在自适应处理模块404中，自适应滤波器602被应用于线路402上的输入信号以生成线路406上的输出信号。最后，数字输出信号被转换成模拟形式(方框820)。例如，这可以由数模转换器308进行。然后模拟信号被换能成声学形式，例如通过个人听取设备100中的内部安装的扬声器106。

图9是根据本发明的第二实施例集合的流程图。该过程开始于在外部麦克风(例如个人听取设备200中的外部安装的麦克风202)处接收声学信号(方框902)，如图2中所示。接下来，声学信号被外部麦克风换能成电形式，然后例如被模数转换器304转换成数字形式(方框904)。由模数转换器生成的数字输入信号然后由处理器(例如图3中所示的处理器306)接收(方框906)。

该过程通过例如在图5中所示的特征确定模块502中确定数字输入信号的特征继续进行(方框908)。特征确定模块502是目标确定模块408的组件，目标确定模块408是处理器306的组件。目标数据至少部分地由所确定的信号特征来确定(方框910)，例如在图5中所示的特征映射模块504中。特征映射模块504是目标确定模块408的组件，目标确定模块408是处理器306的组件。接下来，在内部麦克风(例如个人听取设备200中的内部安装的麦克风208)处接收声学信号，该声学信号被内部麦克风换能成电形式，然后由模数转换器转换成数字形式(方框912)。这个信号可以被称为监视信号，因为它用来监视收听者的耳道中的声音。

在方框912中确定的数字监视信号和在方框910中确定的目标数据被提供给适配控制模块(例如图7中所示的适配控制模块706)(方框914)。适配控制模块706是自适应处理模块404的组件，自适应处理模块404是处理器306的组件。目标数据然后在线路410上被提供给适配控制模块706并且数字监视信号在线路710上被提供给适配控制模块706。然后更新自适应滤波器(方框916)。在一些实施例中，适配控制模块706计算更新后的自适应滤波器，例如根据等式(8)，并在线路708上将更新后的自适应滤波器提供给自适应滤波器702。然后自适应滤波器被应用于数字输入信号以生成数字输出信号(方框918)。例如，在自适应处理模块404中，自适应滤波器702被应用于线路402上的输入信号以生成线路406上的输出信号。最后，数字输出信号被转换成模拟形式(方框920)。例如，这可以由数模转换器308来执行。然后，例如通过个人听取设备200中的内部安装的扬声器206，模拟信号被换能成声学形式。

替代实施例和示例性操作环境

与本文所述的那些变化不同的许多其它变化将从本文档显而易见。例如，取决于实施例，本文所述的任何方法和算法的某些动作、事件或功能可以以不同的次序来执行，可以被添加、合并，或完全去掉(诸如，不是所有描述的动作或事件对方法和算法的实践都是必需的)。而且，在某些实施例中，动作或事件可以同时执行，诸如通过多线程处理、中断处理或者多个处理器或处理器核心或者在其它并行体系架构上，而不是顺序地。此外，不同的任务或过程可以由可以一起发挥作用的不同机器和计算***来执行。

结合本文公开的实施例描述的各种说明性逻辑块、模块、方法和算法过程和序列可以被实现为电子硬件、计算机软件、或两者的组合。为了清楚地说明硬件和软件的这种可互换性，各种说明性的组件、块、模块和过程操作已经在上面就其功能性一般地进行了描述。这种功能被实现为硬件还是软件取决于特定的应用和强加到整个***上的设计限制。对于每个特定的应用，所描述的功能可以以不同的方式来实现，但是这种实现决定不应当被解释为造成从本文档的范围的偏离。

联系本文公开的实施例描述的各种说明性逻辑块和模块可以由机器实现或执行，诸如通用处理器、处理设备、具有一个或多个处理设备的计算设备、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)或其它可编程逻辑器件、分立门或晶体管逻辑、分立硬件组件，或者被设计为执行本文描述的功能的其任意组合。通用处理器和处理设备可以是微处理器，但在备选方案中，处理器可以是控制器、微控制器或状态机、它们的组合，等等。处理器也可以被实现为计算设备，诸如DSP和微处理器的组合、多个微处理器、与DSP核心结合的一个或多个微处理器，或者任何其它此类配置。

本文描述的***和方法的实施例可在多种类型的通用或专用计算***环境或配置中操作。一般而言，计算环境可以包括任何类型的计算机***，包括但不限于基于一个或多个微处理器的计算机***、大型计算机、数字信号处理器、便携式计算设备、个人组织器、设备控制器、电器中的计算引擎、移动电话、台式计算机、移动计算机、平板计算机、智能电话、以及具有嵌入式计算机的电器，等等。

此类计算设备通常可以在具有至少某个最小计算能力的设备中找到，包括但不限于个人计算机、服务器计算机、手持式计算设备、膝上型或移动计算机、诸如手机和PDA的通信设备、多处理器***、基于微处理器的***、机顶盒、可编程消费电子产品、网络PC、小型计算机、大型计算机、音频或视频媒体播放器，等等。在一些实施例中，计算设备将包括一个或多个处理器。每个处理器可以是专用微处理器，诸如数字信号处理器(DSP)、非常长指令字(VLIW)或其它微控制器，或者可以是具有一个或多个处理核心的常规中央处理单元(CPU)，包括多核CPU中的基于专用图形处理单元(GPU)的核心。

联系本文公开的实施例描述的方法、过程或算法的处理动作或操作可以直接实施在硬件中、在由处理器执行的软件模块中、或者在这两者的任意组合中。软件模块可以被包含在能够由计算设备访问的计算机可读介质中。计算机可读介质既包括易失性的和非易失性的介质，是可移动的或者不可移动的、或者其某种组合。计算机可读介质用于存储信息，诸如计算机可读或计算机可执行指令、数据结构、程序模块或其它数据。作为示例而非限制，计算机可读介质可以包括计算机存储介质和通信介质。

计算机存储介质包括但不限于：计算机或机器可读介质或存储设备，诸如蓝光盘(BD)、数字多功能盘(DVD)、压缩盘(CD)、软盘，带式驱动器、硬驱、光驱、固态存储器设备、RAM存储器、ROM存储器、EPROM存储器、EEPROM存储器、闪速存储器或其它存储器技术、磁带盒、磁带、磁盘存储或其它磁存储设备，或者可以用于存储期望的信息并可被一个或多个计算设备访问的任何其它设备。

软件模块可以驻留在RAM存储器、闪存、ROM存储器、EPROM存储器、EEPROM存储器、寄存器、硬盘、可移动盘、CD-ROM、或任何其它形式的非暂态计算机可读存储介质、媒体，或本领域中已知的物理计算机储存器。示例性的存储介质可以耦合到处理器，使得处理器可以从/向存储介质读/写信息。在替代方案中，存储介质可以是处理器的组成部分。处理器和存储介质可以驻留在专用集成电路(ASIC)中。ASIC可以驻留在用户终端中。可替代地，处理器和存储介质可以作为分立元件驻留在用户终端中。

如在本文档中所使用的，短语“非暂态”是指“持久或长寿的”。短语“非暂态计算机可读介质”包括任何和所有计算机可读介质，唯一例外是暂态传播信号。作为示例而非限制，这包括非暂态计算机可读介质，诸如寄存器存储器、处理器高速缓存和随机存取存储器(RAM)。

短语“音频信号”是表示物理声音的信号。

诸如计算机可读或计算机可执行指令、数据结构、程序模块等信息的保持也可以通过使用多种通信介质来编码一个或多个调制的数据信号、电磁波(诸如载波)或其它传输机制或通信协议来实现，并且包括任何有线或无线信息输送机制。一般而言，这些通信介质是指其一个或多个特征以在信号中编码信息或指令的方式被设置或改变的信号。例如，通信介质包括有线介质(诸如携带一个或多个调制的数据信号的有线网络或直接连线连接)，以及无线介质(诸如声学、射频(RF)、红外线、激光，以及用于发送和/或接收一个或多个调制的数据信号或电磁波的其它无线介质)。以上所述的任意组合也应当包括在通信介质的范围内。

另外，实施本文描述的***和方法的各种实施例中的一些或全部的软件、程序、计算机程序产品的一个或任意组合或者其部分可以以计算机可执行指令或其它数据结构的形式从计算机或机器可读介质或存储设备以及通信介质的任何期望的组合存储、接收、发送或读取。

本文描述的***和方法的实施例可以在由计算设备执行的计算机可执行指令(诸如程序模块)的一般上下文中进一步描述。一般而言，程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等。本文描述的实施例还可以在其中任务由一个或多个远程处理设备执行的分布式计算环境中或者在通过一个或多个通信网络链接的一个或多个设备的云内实践。在分布式计算环境中，程序模块可以位于包括介质存储设备的本地和远程计算机存储介质中。更进一步，上述指令可以部分或全部地被实现为可以或可以不包括处理器的硬件逻辑电路。

除非另有说明或者如在所使用的上下文中以其它方式理解的，否则本文所使用的条件性语言(诸如“能够”、“可能”、“可以”、“例如”等)一般意在传达某些实施例包括、而其它实施例不包括某些特征、元件和/或状态。因此，这种条件语言一般不意在暗示特征、元件和/或状态以任何方式是一个或多个实施例所需的或者一个或多个实施例必需包括用于在有或没有作者输入或提示的情况下决定这些特征、元件和/或状态包括在或者要在任何特定实施例中执行的逻辑。术语“包括”、“具有”等是同义的并且以开放的方式被包含性地使用，并且不排除附加的元件、特征、动作、操作，等等。而且，术语“或者”是在其包含的意义上(而不是在其排他的意义上)使用的，使得在用于例如连接元件的列表时，术语“或”是指列表中的一个、一些或所有元素。

虽然以上详细描述已经示出、描述并指出了如应用到各种实施例的新颖特征，但是将理解的是，在不背离本公开内容的范围的情况下，可以进行所示出的设备或算法的形式和细节的各种省略、替换和变化。如将认识到的，本文描述的本发明的某些实施例可以在不提供本文阐述的所述特征和优点的形式中体现，因为一些特征可以与其它特征分开使用或实践。

Claims

1.一种用于处理传入音频信号的方法，包括：

对传入音频信号应用主动均衡以获得均衡的音频信号；

将均衡的音频信号调谐到目标均衡以获得输出音频信号；以及

渲染输出音频信号以向收听者回放。

2.如权利要求1所述的方法，还包括基于对艺术家的录音的知识来确定目标均衡。

3.如权利要求2所述的方法，还包括使用机器学习技术来分析包含艺术家的录音的数据库。

4.如权利要求1所述的方法，还包括使用有源滤波器将均衡的音频信号调谐到目标均衡。

5.一种用于处理传入音频信号的方法，包括：

主动监视传入音频信号的音频特点；

提供包含目标性能准则的目标数据；

使传入音频信号的音频特点适配目标性能准则以获得所述传入音频信号的经适配的音频特点；以及

在输出信号中渲染经适配的音频特点。

6.如权利要求5所述的方法，还包括在个人听取设备上渲染音频信号的经适配的音频特点。

7.如权利要求5所述的方法，其中所述目标数据包括收听者的听力图或测得的听力损失曲线。

8.如权利要求7所述的方法，其中适配传入音频信号的音频特点还包括针对收听者的听力图或测得的听力损失曲线进行补偿。

9.如权利要求5所述的方法，其中适配传入音频信号的音频特点还包括强调对话频带以获得经适配的音频特点。

10.如权利要求5所述的方法，其中适配音频信号的音频特点还包括基于目标性能准则来更新自适应滤波器。

11.如权利要求5所述的方法，还包括：

识别传入音频信号中的歌曲以获得识别出的歌曲；以及

基于识别出的歌曲来确定目标数据。

12.如权利要求5所述的方法，还包括：

识别传入音频信号中的歌曲的流派以获得识别出的流派；以及

基于识别出的流派来确定目标数据。

13.如权利要求5所述的方法，还包括：

识别传入音频信号中的不想要的声音的音频特点；以及

基于不想要的声音的音频特点来确定目标数据。

14.一种用于处理传入音频信号的可听设备，该可听设备包括：

处理器；以及

存储指令的存储器，指令在被处理器执行时将可听设备配置为：

主动监视传入音频信号的音频特点；

提供包含目标性能准则的目标数据；

使传入音频信号的音频特点适配目标性能准则以获得传入音频信号的经适配的音频特点；以及

在输出信号中渲染经适配的音频特点。