CN104464732A - 基于情境的音频滤波器选择 - Google Patents

基于情境的音频滤波器选择 Download PDF

Info

Publication number
CN104464732A
CN104464732A CN201410440313.9A CN201410440313A CN104464732A CN 104464732 A CN104464732 A CN 104464732A CN 201410440313 A CN201410440313 A CN 201410440313A CN 104464732 A CN104464732 A CN 104464732A
Authority
CN
China
Prior art keywords
type
receipt
receiving process
response
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201410440313.9A
Other languages
English (en)
Other versions
CN104464732B (zh
Inventor
约翰·迈尔斯·亨特
约翰·韦尔东·尼克尔森
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Lenovo Singapore Pte Ltd
Original Assignee
Lenovo Singapore Pte Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Lenovo Singapore Pte Ltd filed Critical Lenovo Singapore Pte Ltd
Publication of CN104464732A publication Critical patent/CN104464732A/zh
Application granted granted Critical
Publication of CN104464732B publication Critical patent/CN104464732B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Telephonic Communication Services (AREA)
  • Telephone Function (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

本发明涉及基于情境的音频滤波器选择。对于该基于情境的音频滤波器选择,类型模块确定音频信号的接收进程的接收类型。该接收类型包括人类目标接收类型和语音识别接收类型。滤波器模块响应于该接收类型来选择音频滤波器。

Description

基于情境的音频滤波器选择
技术领域
本文所公开的主题涉及音频滤波器选择,更具体地,涉及基于情境的音频滤波器选择。
背景技术
电子设备在将音频信号传送至接收进程之前经常将音频滤波器应用于音频信号。不幸的是,不同的接收进程与不同的音频滤波器协作会更好。
发明内容
公开了一种用于基于情境的音频滤波器选择的装置。该装置包括:麦克风阵列、处理器以及存储器。该存储器存储可由处理器执行的计算机可读代码。计算机可读代码包括类型模块和滤波器模块。类型模块确定来自麦克风阵列的音频信号的接收进程的接收类型。接收类型包括人类目标接收类型和语音识别接收类型。滤波器模块响应于接收类型来选择音频滤波器。还公开了执行该装置的功能的一种方法和一种计算机程序。
附图说明
将参考在附图中例示的具体实施例来给出在上面简略描述的实施例的更具体的说明。应理解的是,这些图仅描绘了一些实施例,并因此不看作是对范围的限制,将通过使用附图利用附加的特征和细节来描述和解释实施例,图中:
图1是例示音频处理的一个实施例的示意性框图;
图2A-图2B是例示电子设备的实施例的透视图;
图3是例示音频处理的一个替代实施例的示意性框图;
图4是例示音频滤波器的一个实施例的示意性框图;
图5是例示许可(permission)的一个实施例的示意性框图;
图6是例示简档映射(profile mapping)的一个实施例的示意性框图;
图7是例示通信数据的实施例的曲线图;
图8是例示通信数据的一个实施例的示意性框图;
图9是例示电子设备的一个实施例的示意性框图;
图10是例示选择装置的一个实施例的示意性框图;以及
图11是例示音频滤波器选择方法的一个实施例的示意性流程图。
具体实施方式
如本领域中的技术人员将会理解的,实施例的各个方面可以体现为***、方法或程序产品。因此,实施例可采用这样的形式:完全是硬件的实施例、完全是软件的实施例(包括固件、常驻软件、微代码等)或者结合了软件方面和硬件方面的实施例,在本文中它们可统称为“电路”、“模块”或“***”。此外,实施例可以采用程序产品的形式,该程序产品实现为存储有计算机可读代码的一个或更多个计算机可读存储设备。该存储设备可以是有形的、非暂时的和/或非传输的。
在本说明书中描述的许多功能单元被称为模块,以特别强调其实现独立性。例如,模块可以实现为硬件电路,其包括定制的VLSI电路或门阵列、现成半导体,诸如逻辑芯片、三极管或其他分立部件。模块也可以在可编程硬件设备(例如现场可编程门阵列、可编程逻辑阵列、可编程逻辑设备等)中实现。
模块还可以由各种处理器执行的计算机可读代码和/或软件来实现。例如,计算机可读代码的标识模块可包括例如可组织为对象、工序或功能的可执行代码的一个或更多个物理块或逻辑块。然而,标识模块的可执行文件无需在物理上放在一起,而是可以包括存储在不同位置的不同指令,这些指令当在逻辑上结合在一起时构成模块并且实现该模块的所述目的。
实际上,计算机可读代码的模块可以是单个指令或者许多指令,并且甚至可以在几个不同代码分段中、在不同程序中、以及在几个存储设备中分布。类似地,此处操作数据可在模块内标识和例示,可以以任意合适的形式体现并在任意合适类型的数据结构内组织。操作数据可以被收集为单个数据集,或者可以分布在不同的位置(包括在不同的计算机可读存储设备上)以及可以至少部分地仅作为电信号存在于***或网络上。在模块或者模块的一些部分以软件来实现的情况下,软件部分存储在一个或更多个计算机可读存储设备上。
可以实现一个或更多个计算机可读介质的任意组合。计算机可读介质可以是计算机可读信号介质或计算机可读存储介质。计算机可读存储介质可以是存储有计算机可读代码的存储设备。例如,存储设备可以是但不限于是电子的、磁的、光的、电磁的、红外线的、全息的、微机械的或半导体的***、装置或设备,或者前述设备的任意合适组合。
存储设备的更具体示例(非穷举性列举)包括如下:具有一条或更多条线的电连接、便携式计算机软盘、硬盘、随机存取存储器(RAM,randomaccess memory)、只读存储器(ROM,read-only memory)、可擦除可编程只读存储器(EPROM(erasable programmable read-only memory)或闪存)、便携式光盘只读存储器(CD-ROM,portable compact discread-only memory)、光学存储设备、磁存储设备或前述设备的任意合适组合。在本文的情境中,计算机可读存储介质可以是能够包含或存储由指令执行***、装置或设备使用或结合指令执行***、装置或设备来使用的程序的任何有形介质。
计算机可读信号介质可包括例如在基带中的或作为载波的一部分的传播数据信号,该传播数据信号包含有计算机可读代码。这种传播信号可采用多种形式中的任意一种,所述多种形式包括但不限于电磁的、光的,或者其任意合适组合。计算机可读信号介质可以是以下任意存储设备:其不是计算机可读存储介质并且能够传送、传播或者传输由指令执行***、装置或设备使用的或者结合指令执行***、装置或设备来使用的程序。可利用任意合适介质来传输在存储设备上包含的计算机可读代码,所述任意合适介质包括但不限于无线、有线、光纤线缆、射频(RF,RadioFrequency)等,或上述介质的任意合适组合。
可以以一种或更多种编程语言的任意组合来写入用于执行实施例的操作的计算机可读代码,该编程语言包括面向对象的程序设计语言,例如Java、Smalltalk、C++等,以及传统的过程编程语言,例如“C”编程或类似编程语言。计算机可读代码可作为独立软件包完全地在用户的计算机上执行,部分地在用户的计算机上执行,部分地在用户的计算机上并且部分地在远程计算机上执行,或完全地在远程计算机或服务器上执行。在后一种情况中,远程计算机可通过任意类型的网络(包括局域网(LAN,localarea network)或广域网(WAN,wide area network))连接至用户的计算机,或者可以(例如,通过使用因特网服务提供商的因特网)实现至外部计算机的连接。
在本说明书的全文中引用的“一个实施例”、“实施例”或类似语言意指,结合实施例描述的特定特征、结构或特性被包括在至少一个实施例中。因此,在本说明书的全文中出现的短语“在一个实施例中”、“在实施例中”和类似语言可以但不必一定都指相同实施例,而是意指“一个或更多个但不是所有的实施例”,除非明确说明另有所指。术语“包括(including)”、“包含(comprising)”、“具有”以及其变形意指“包括但不限于”,除非明确说明另有所指。列举的项目列表并不意味着任意项目或所有项目是相互排斥的,除非明确说明另有所指。术语“一个(a)”、“一个(an)”以及“该(the)”还指“一个或更多个”,除非明确说明另有所指。
此外,实施例的所述特征、结构或特性可以以任意合适的方式组合。在下列描述中,提供了大量具体细节,例如,编程、软件模块、用户选择、网络事务、数据库查询、数据库结构、硬件模块、硬件电路、硬件芯片等的示例,以提供对实施例的透彻理解。然而,本领域的技术人员将认识到,可以在没有一个或更多个具体细节的情况下,或者利用其他方法、部件、材料等来实践这些实施例。在其他情况中,没有详细地示出或描述众所周知的结构、材料或操作,以避免使实施例的方面不清楚。
下面参考根据实施例的方法、装置、***以及程序产品的示意性流程图和/或示意性框图来描述实施例的各方面。将理解的是,示意性流程图和/或示意性框图中的每个块,以及在示意性流程图和/或示意性框图中的块的组合可通过计算机可读代码来实现。可将这些计算机可读代码提供至通用计算机、专用计算机或其他可编程数据处理装置的处理器以产生机器,使得经由计算机或其他可编程数据处理装置的处理器执行的指令创建用于实现在示意性流程图和/或示意性框图的块或多个块中所指定的功能/动作的装置。
也可将计算机可读代码存储在能够指挥计算机、其他可编程数据处理装置或其他设备以特定方式起作用的存储设备中,使得在存储设备中所存储的指令产生以下制品:其包括实现在示意性流程图和/或示意性框图的块或多个块中所指定的功能/动作的指令。
还可将计算机可读代码加载在计算机、其他可编程数据处理装置或其他设备上,以使一系列操作步骤在计算机、其他可编程装置或其他设备上执行,以产生计算机实现的处理,使得在计算机或其他可编程装置上执行的程序代码提供用于实现在流程图和/或框图的块或多个块中所指定的功能/动作的处理。
在附图中的示意性流程图和/或示意性框图例示了根据各种实施例的装置、***、方法以及程序产品的可能实现方式的架构、功能以及操作。在这一点上,示意性流程图和/或示意性框图中的每个块可表示代码的模块、片段或部分,其包括用于实现所指定的逻辑功能的程序代码的一条或更多条可执行指令。
还应注意的是,在某些替代实施方式中,在块中所示的功能可以与图中所示的顺序不同的顺序出现。例如,相继示出的两个块实际上可以基本上同时地执行,或者一些块有时可以根据所涉及的功能以相反的顺序执行。可以构想在功能、逻辑或效果上与例示的附图中的一个或更多个块或部分等价的其他步骤和方法。
尽管在流程图和/或框图中可以采用各种箭头式样和线式样,但不应当将它们理解为限制相应实施例的范围。实际上,一起箭头或其他连接符可用于指示所描绘的实施例的仅一个逻辑流程。例如,箭头可以指示在所描绘的实施例的所列举步骤之间的、具有未指定的时长的等待或监视时段。还应当注意,框图和/或流程图的每个块,以及在框图和/或流程图中的块的组合可以通过执行指定功能或动作的基于专用硬件的***来实现或专用硬件和计算机可读代码的组合来实现。
附图的描述可涉及在前述的图中所描述的元件,图中相同的附图标记表示相同的元件。
图1是例示音频处理100的一个实施例的示意性框图。通过麦克风阵列115、电子设备110以及接收进程105来执行音频处理100。麦克风阵列115可以接收声音信号。麦克风阵列115将声音信号转换成音频信号125。音频信号125可以是模拟电信号。替代地,音频信号125可以是数字信号值。
电子设备110可对音频信号125进行过滤。例如,电子设备110可过滤音频信号125以改善音频信号125的信噪比。另外,电子设备110可将经过滤的音频信号120传送至接收进程105。接收进程105可以是通信进程、语音识别进程等。
不幸的是,不同的接收进程105与已通过不同音频滤波器滤波的音频信号125协作会更好。例如,将滤波后音频信号120提供至人类听众的接收进程105与已通过波束形成滤波器滤波的滤波后音频信号120协作会更好。然而,解释人类语音的接收进程105(诸如语音识别程序)与已用发音滤波器(diction filter)滤波的滤波后音频信号120协作会更好。
如在下文中将描述的,本文所描述的实施例确定接收进程105的接收类型并且响应于该接收类型来选择音频滤波器。结果,电子设备110对音频信号125应用更兼容的音频滤波器,从而接收进程105更有效地处理滤波后音频信号120。因此,如果接收进程105是人类目标接收类型,则这些实施例选择与人类目标接收类型兼容的音频滤波器,例如波束形成滤波器。另外,如果接收进程105是语音识别接收类型,则这些实施例选择与语音识别接收类型兼容的音频滤波器,例如发音滤波器。
图2A至图2B是例示电子设备110的实施例的透视图。图2A描绘了膝上型计算机电子设备110a。图2B描绘了移动电话电子设备110b。本领域的技术人员将认识到:可采用其他电子设备110,包括但不限于平板计算机、眼镜计算机(eyeglass computer)、可穿戴计算机、计算机工作站等。膝上型计算机电子设备110a和移动电话电子设备110b均可包括麦克风阵列115。
每个电子设备110可在麦克风阵列115处接收声音信号并且将音频信号125传送至接收进程105,例如产生适于人类听众的声音信号的语音识别程序或通信程序。
图3是例示音频处理170的一个替代实施例的示意性框图。通过包括但不限于麦克风阵列115、模拟-数字转换器130、音频滤波器135、许可145、简档映射155、选择装置140、通信信道150以及接收进程105的元件来执行音频处理170。
麦克风阵列115接收声音信号并且将模拟音频信号125a传送至模拟-数字转换器130。模拟-数字转换器130将模拟音频信号125a转换成数字信号值音频信号125b。音频滤波器135对数字信号值音频信号125b进行滤波以产生经滤波的音频信号120。然后将经滤波的音频信号120通过通信信道150传送至一个或更多个接收进程105。
通信信道150可在电子设备110内部。例如,通信信道150可包括内部总线。替代地,通信信道150可以是存储数字信号值的存储器或缓存。另外,通信信道150可包括外部通信信道,例如,因特网、Wi-Fi网络、移动电话网络、局域网、广域网、或者它们的组合。
选择装置140可从许可145、简档映射155以及通信信道150收集信息,以在音频滤波器135中选择如下文中所描述的将应用于数字信号值音频信号125b的音频滤波器。
图4是例示音频滤波器135的一个实施例的示意性框图。在所描绘的实施例中,音频滤波器135包括滤波器选择器175、波束形成滤波器180a、发音滤波器180b以及混用滤波器180c。滤波器选择器175采用波束形成滤波器180a、发音滤波器180b或混用滤波器180c中的一个以对数字信号值音频信号125b进行滤波并且产生经滤波的数字信号120。
图5是例示许可145的一个实施例的示意性框图。可针对每个接收进程105保持许可145。许可145包括但不限于麦克风访问205和网络访问210。
麦克风访问205可指示接收进程105是否能访问麦克风阵列115。网络访问210可指示是否允许接收进程105访问外部通信信道150,例如因特网和/或移动电话网络。网络访问210可指定允许接收进程105访问的每个外部通信信道150。
如果麦克风访问205指示允许接收进程105访问麦克风阵列115,则这些实施例可确定接收进程105的接收类型。另外,如果麦克风访问205指示允许接收进程105访问麦克风阵列115并且网络访问210指示接收进程105可访问外部通信信道150,则这些实施例可确定接收进程105的接收类型。因此,如果允许进程访问麦克风阵列115和外部通信信道150,则实施例将确定因特网电话进程或因特网语音识别进程的接收类型。
图6是例示简档映射155的一个实施例的示意性框图。可在表格、数据库、平面文件、链接数据结构等中构建简档映射155。可将简档映射155存储在存储器中。在所描绘的实施例中,简档映射155包括多个条目223。每个条目223可包括接收进程标识符220、接收类型270以及音频滤波器标识符225中的一个或更多个。
接收进程标识符220标识接收进程105。接收类型270指定接收进程105的接收类型,该接收类型包括但不限于人类目标接收类型275、语音识别接收类型280、或混用接收类型255。另外,音频滤波器标识符255指定与接收类型270和/或接收进程标识符220一起使用的音频滤波器180。波束形成滤波器标识符235可标识波束形成滤波器180a,发音滤波器标识符245可标识发音滤波器180b,混用滤波器标识符256可标识混用滤波器180c。
条目223e-223g没有指定接收进程标识符220。简档映射155还可以将没有被标识但已确定接收类型270的接收进程105与音频滤波器标识符225相关联。例如,在条目223e中,人类目标接收类型275与波束形成滤波器标识符235相关联,在条目233f中,语音识别接收类型280与发音滤波器标识符245相关联,以及在条目233g中,混用接收类型255与混用滤波器标识符256相关联。
图7是例示通信数据715、720的一个实施例的曲线图。该曲线图示出了从通信信道150传送的以及在通信信道150处接收的数据随时间变化的量,其中通信数据量705在垂直轴上并且时间710在水平轴上。被传送的数据量715描绘为具有高的通信数据量705。高的通信数据量705可表示正在传送音频数据。
另外,还示出了被接收的两个数据量720。被接收的第一数据量720a示出为相对高的通信数据量705,而被接收的第二数据量720b示出为相对低的通信数据量705。被接收的第一数据量720可例示音频数据,例如来自因特网电话接收进程105的音频数据。被接收的第二数据量720b可例示文本数据,例如来自语音识别接收进程105的文本数据。
图8是例示通信数据700的一个实施例的示意性框图。在一个实施例中,针对每个接收进程105组织通信数据700。通信数据700可在数据库、平面文件、被链接的数据结构等中构建,并且可存储进存储器中。
通信数据700包括在接收进程105中的传送数据量715和接收数据量720。在一个实施例中,在多个特定时间710处存储传送数据量715和接收数据量720。替代地,传送数据量715和接收数据量720是在特定的时间间隔内(例如1至10秒内)的数据量总和。
数据比例725可计算为传送数据量715除以接收数据量720。在一个实施例中,将在每个特定的时间710处的传送数据量715除以在每个特定的时间710处的接收数据量720,并且通过该结果的平均来计算数据比例725。替代地,可将传送数据量715的总和除以接收数据量720的总和以计算数据比例725。
通信数据700还包括接收通信类型730。接收通信类型730可指定来自接收进程105的通信是否是音频通信。接收通信类型730可响应于来自接收进程105的包括会话开始协议(SIP,session initiation protocol)业务的通信来指定来自接收进程105的通信是音频通信。
图9是例示电子设备110的一个实施例的示意性框图。电子设备110包括处理器305、存储器310以及通信硬件315。存储器310可包括半导体存储设备、硬盘驱动、光存储设备、微机械存储设备,或其组合。存储器310可存储计算机可读代码。处理器305可执行该计算机可读代码。通信硬件315可与其他设备通信。例如,通信硬件315可与外部通信信道150通信。
图10是例示选择装置140的一个实施例的示意性框图。装置140可包含在电子设备110中。装置140包括类型模块405和过滤器模块410。类型模块405和过滤器模块410可包含在诸如存储器310等计算机可读存储介质中。计算机可读存储介质可存储计算机可读代码,该计算机可读代码在由处理器305执行时执行类型模块405和滤波器模块410的功能。
类型模块405确定音频信号125的接收进程105的接收类型。接收类型270可以是人类目标接收类型275或语音识别接收类型280。在某些实施例中,接收类型270还可以是混用接收类型255。如将在下文中更详细地描述的,滤波器模块410可响应于接收类型270来选择音频滤波器180。
图11是例示音频滤波器选择方法500的一个实施例的示意性流程图。方法500可执行电子设备110和装置140的功能。该方法可由处理器305来执行。替代地,该方法可由程序产品来执行。该程序产品可包括计算机可读存储介质,例如,存储计算机可读代码的存储器310。处理器305可执行计算机可读代码以执行方法500。
方法500开始,并且在一个实施例中,麦克风阵列115产生505音频信号125。麦克风阵列115可根据声音信号产生音频信号。
类型模块405还可访问510许可145。例如,类型模块405可确定哪个接收进程105具有麦克风访问205和网络访问210。
另外,类型模块405可识别515通过通信信道150接收音频信号125的一个或更多个接收进程105。在一个实施例中,类型模块405可检查承载了音频信号125的数据包,以识别515接收进程105。替代地,类型模块405可检查注册或进程列表,以识别515接收进程105。
在一个实施例中,类型模块405响应于接收进程105的许可145来识别515接收进程105。例如,类型模块405可用麦克风访问205和网络访问210来识别515每个进程。
在一个实施例中,类型模块405监视520与接收进程105的通信。类型模块405可监视520传送至接收进程105的数据量715和从接收进程105接收的数据量720。另外,类型模块405可分析承载音频信号125的数据包,以确定目的地地址、通信协议等。
在一个实施例中,类型模块405确定525音频信号125的接收进程105的接收类型270。类型模块405可响应于传送至接收进程105的数据量715与从接收进程105接收的数据量720的数据比例超过数据比例范围来确定525接收类型270是语音识别接收类型280。
数据比例范围可以在0.75与1.25之间。替代地,数据比例范围可以在0.5与1.5之间。类型模块405可响应于数据比例725在数据比例范围内来确定525接收类型270是人类目标接收类型275。例如,如果数据比例725是1.1,则类型模块405可确定525接收类型270是人类目标接收类型275。
替代地,类型模块405可响应于数据比例725超过数据比例范围来确定525接收类型270是语音识别接收类型280。例如,如果数据比例725是3.3,则类型模块405可确定525接收类型270是语音识别接收类型280。
类型模块405可响应于接收来自接收进程105的音频通信来确定525接收类型270是人类目标接收类型275。例如,如果类型模块405监视到520来自接收进程105的音频通信,则类型模块405可确定525接收类型270是人类目标接收类型275。类型模块405可响应于来自接收进程105的SIP业务来检测音频通信。
在一个实施例中,类型模块405根据简档映射155来确定525接收类型270。例如,在简档映射155中,接收进程105的接收进程标识符220可与接收类型270相关联。类型模块405可使用接收进程105的接收进程标识符220来访问与接收进程标识符220对应的接收类型270。
滤波器模块410还可使用接收类型270来访问530简档映射155,以识别与接收类型270对应的音频滤波器标识符225。在一个实施例中,滤波器模块410利用接收进程105的接收进程标识符220来访问530简档映射155,以识别与接收进程105对应的音频滤波器标识符225。
滤波器模块410可选择535由与接收类型270对应的音频滤波器标识符225标识的音频滤波器180。在一个实施例中,响应于人类目标接收类型275来选择波束形成滤波器180a。替代地,可响应于语音识别接收类型280来选择发音滤波器180b。在某个实施例中,如果类型模块405不能确定接收类型270或确定出接收类型270是混用接收类型255,则可选择混用滤波器180c。
音频滤波器135可使用所选择的音频滤波器180来对音频信号125进行滤波540,并且方法500结束。通过确定音频信号125的接收进程105的接收类型270,可选择用于接收进程105的最合适和/或最有效的音频滤波器。结果,语音识别接收进程105接收通过诸如发音滤波器180b等适当滤波器180滤波540的音频信号125,而人类目标接收进程105接收通过诸如波束形成滤波器180a等适当滤波器180滤波540的经滤波音频信号120。
可以以其他特定形式来实践这些实施例。认为所描述的实施例在所有方面都是例示性的而不是限制性的。因此,本发明的范围由所附权利要求书来表示而不是由前面的描述来表示。在权利要求的等价含义和范围内的所有变换都包括在权利要求的范围内。

Claims (15)

1.一种装置,包括:
麦克风阵列;
处理器;
存储器,所述存储器存储能够由所述处理器执行的计算机可读代码,所述计算机可读代码包括:
类型模块,所述类型模块确定来自所述麦克风阵列的音频信号的接收进程的接收类型,其中,所述接收类型包括人类目标接收类型和语音识别接收类型;以及
滤波器模块,所述滤波器模块响应于所述接收类型来选择音频滤波器。
2.根据权利要求1所述的装置,其中,响应于传送至所述接收进程的数据量与从所述接收进程接收的数据量的数据比例超过数据比例范围,来将所述接收类型确定为所述语音识别接收类型,并且响应于所述数据比例在所述数据比例范围内,来将所述接收类型确定为所述人类目标接收类型。
3.根据权利要求1所述的装置,其中,响应于接收来自所述接收进程的音频通信,将所述接收类型确定为所述人类目标接收类型。
4.根据权利要求3所述的装置,其中,响应于来自所述接收进程的会话开始协议业务来检测来自所述接收进程的音频通信。
5.根据权利要求1所述的装置,其中,在简档映射中,所述接收进程与所述接收类型相关联。
6.根据权利要求1所述的装置,其中,响应于所述人类目标接收类型来选择波束形成滤波器。
7.根据权利要求1所述的装置,其中,响应于所述语音识别接收类型来选择发音滤波器。
8.一种方法,包括:
通过使用处理器来确定音频信号的接收进程的接收类型,其中,所述接收类型包括人类目标接收类型和语音识别接收类型;以及
响应于所述接收类型来选择音频滤波器。
9.根据权利要求8所述的方法,其中,响应于传送至所述接收进程的数据量与从所述接收进程接收的数据量的数据比例超过数据比例范围,来将所述接收类型确定为所述语音识别接收类型,并且响应于所述数据比例在所述数据比例范围内,来将所述接收类型确定为所述人类目标接收类型。
10.根据权利要求8所述的方法,其中,响应于接收来自所述接收进程的音频通信,来将所述接收类型确定为所述人类目标接收类型。
11.根据权利要求10所述的方法,其中,响应于来自所述接收进程的会话开始协议业务来检测来自所述接收进程的音频通信。
12.根据权利要求8所述的方法,还包括响应于所述接收进程的许可来识别所述接收进程。
13.根据权利要求8所述的方法,其中,在简档映射中,所述接收进程与所述接收类型相关联。
14.根据权利要求8所述的方法,其中,响应于所述人类目标接收类型来选择波束形成滤波器。
15.根据权利要求8所述的方法,其中,响应于所述语音识别接收类型来选择发音滤波器。
CN201410440313.9A 2013-09-20 2014-09-01 基于情境的音频滤波器选择 Active CN104464732B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US14/032,973 US9361890B2 (en) 2013-09-20 2013-09-20 Context-based audio filter selection
US14/032,973 2013-09-20

Publications (2)

Publication Number Publication Date
CN104464732A true CN104464732A (zh) 2015-03-25
CN104464732B CN104464732B (zh) 2017-10-31

Family

ID=52623718

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410440313.9A Active CN104464732B (zh) 2013-09-20 2014-09-01 基于情境的音频滤波器选择

Country Status (3)

Country Link
US (1) US9361890B2 (zh)
CN (1) CN104464732B (zh)
DE (1) DE102014107434B4 (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1488319A (zh) * 2002-10-08 2004-04-14 合世股份有限公司 多功能电子听诊器
CN1842147A (zh) * 2005-04-01 2006-10-04 晶发科技股份有限公司 利用节目内容信息进行音频修改的装置与方法
EP2088520A1 (en) * 2008-02-11 2009-08-12 Avaya Inc. Context based filter method and apparatus
CN102185586A (zh) * 2011-02-25 2011-09-14 华为技术有限公司 一种基于场景的滤波方法及自适应滤波器
CN102246537A (zh) * 2008-12-09 2011-11-16 皇家飞利浦电子股份有限公司 调节来自显示设备的声学输出的方法
CN102934159A (zh) * 2010-06-30 2013-02-13 英特尔公司 语音音频处理

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6523001B1 (en) * 1999-08-11 2003-02-18 Wayne O. Chase Interactive connotative thesaurus system
CA2316074A1 (en) * 1999-08-30 2001-02-28 Lucent Technologies, Inc. Telephone with sound customizable to audiological profile of user
US20050065779A1 (en) 2001-03-29 2005-03-24 Gilad Odinak Comprehensive multiple feature telematics system
US7778425B2 (en) * 2003-12-24 2010-08-17 Nokia Corporation Method for generating noise references for generalized sidelobe canceling
US7565288B2 (en) * 2005-12-22 2009-07-21 Microsoft Corporation Spatial noise suppression for a microphone array
US8145493B2 (en) * 2006-09-11 2012-03-27 Nuance Communications, Inc. Establishing a preferred mode of interaction between a user and a multimodal application

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1488319A (zh) * 2002-10-08 2004-04-14 合世股份有限公司 多功能电子听诊器
CN1842147A (zh) * 2005-04-01 2006-10-04 晶发科技股份有限公司 利用节目内容信息进行音频修改的装置与方法
EP2088520A1 (en) * 2008-02-11 2009-08-12 Avaya Inc. Context based filter method and apparatus
CN102246537A (zh) * 2008-12-09 2011-11-16 皇家飞利浦电子股份有限公司 调节来自显示设备的声学输出的方法
CN102934159A (zh) * 2010-06-30 2013-02-13 英特尔公司 语音音频处理
CN102185586A (zh) * 2011-02-25 2011-09-14 华为技术有限公司 一种基于场景的滤波方法及自适应滤波器

Also Published As

Publication number Publication date
CN104464732B (zh) 2017-10-31
US9361890B2 (en) 2016-06-07
DE102014107434A1 (de) 2015-03-26
US20150088512A1 (en) 2015-03-26
DE102014107434B4 (de) 2023-03-30

Similar Documents

Publication Publication Date Title
US9159323B2 (en) Deriving geographic distribution of physiological or psychological conditions of human speakers while preserving personal privacy
US11043207B2 (en) System and method for array data simulation and customized acoustic modeling for ambient ASR
CN105120528B (zh) 一种设备间进行配置性设置的方法、装置及***
CN103294447B (zh) 一种生成随机数的方法和装置
CN103890735B (zh) 用于测试事务应用的方法和***
JP6587742B2 (ja) サウンド混合処理方法および装置、装置、並びに記憶媒体
CN109819375A (zh) 调节音量的方法与装置、存储介质、电子设备
CN104766608A (zh) 一种语音控制方法及装置
CN103347070B (zh) 推送语音数据的方法、终端、服务器及***
CN110085241A (zh) 数据编码方法、装置、计算机存储介质及数据编码设备
JP6487569B2 (ja) チャネル間時間差パラメータを決定するための方法および装置
CN110428835A (zh) 一种语音设备的调节方法、装置、存储介质及语音设备
CN106448688B (zh) 音频编码方法及相关装置
CN103178878B (zh) 一种用于连接无线设备的方法和***
CN107437967A (zh) 基于声波的数据传输方法、发送设备和接收设备
CN110267163A (zh) 一种定向声音虚拟低频增强方法、***、介质和设备
CN110018806A (zh) 一种语音处理方法和装置
CN109410920A (zh) 用于获取信息的方法及装置
CN104464732A (zh) 基于情境的音频滤波器选择
CN105657203B (zh) 智能设备语音通话中的降噪方法及***
CN109215668A (zh) 一种声道间相位差参数的编码方法及装置
CN106464288B (zh) 一种实现对讲的方法及智能手环
CN112002339B (zh) 语音降噪方法和装置、计算机可读的存储介质及电子装置
CN109215688A (zh) 同场景音频处理方法、装置、计算机可读存储介质及***
CN105050021B (zh) 耳机音质检测方法、***及终端

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant