CN110033783A - 声学环境中的声学信号的基于上下文的消除和放大 - Google Patents

声学环境中的声学信号的基于上下文的消除和放大 Download PDF

Info

Publication number
CN110033783A
CN110033783A CN201811581209.6A CN201811581209A CN110033783A CN 110033783 A CN110033783 A CN 110033783A CN 201811581209 A CN201811581209 A CN 201811581209A CN 110033783 A CN110033783 A CN 110033783A
Authority
CN
China
Prior art keywords
acoustic signal
footprint
signal
acoustic
logic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201811581209.6A
Other languages
English (en)
Inventor
P·马齐维斯基
蒋大明
S·马尔科维奇戈兰
S·卡尔
V·穆尔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Intel Corp
Original Assignee
Intel Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Intel Corp filed Critical Intel Corp
Publication of CN110033783A publication Critical patent/CN110033783A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10KSOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
    • G10K11/00Methods or devices for transmitting, conducting or directing sound in general; Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
    • G10K11/16Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
    • G10K11/175Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10KSOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
    • G10K11/00Methods or devices for transmitting, conducting or directing sound in general; Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
    • G10K11/16Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
    • G10K11/175Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound
    • G10K11/178Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound by electro-acoustically regenerating the original acoustic waves in anti-phase
    • G10K11/1781Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound by electro-acoustically regenerating the original acoustic waves in anti-phase characterised by the analysis of input or output signals, e.g. frequency range, modes, transfer functions
    • G10K11/17821Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound by electro-acoustically regenerating the original acoustic waves in anti-phase characterised by the analysis of input or output signals, e.g. frequency range, modes, transfer functions characterised by the analysis of the input signals only
    • G10K11/17827Desired external signals, e.g. pass-through audio such as music or speech
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10KSOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
    • G10K11/00Methods or devices for transmitting, conducting or directing sound in general; Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
    • G10K11/16Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
    • G10K11/175Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound
    • G10K11/178Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound by electro-acoustically regenerating the original acoustic waves in anti-phase
    • G10K11/1783Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound by electro-acoustically regenerating the original acoustic waves in anti-phase handling or detecting of non-standard events or conditions, e.g. changing operating modes under specific operating conditions
    • G10K11/17837Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound by electro-acoustically regenerating the original acoustic waves in anti-phase handling or detecting of non-standard events or conditions, e.g. changing operating modes under specific operating conditions by retaining part of the ambient acoustic environment, e.g. speech or alarm signals that the user needs to hear
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0316Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0316Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
    • G10L21/0324Details of processing therefor
    • G10L21/034Automatic adjustment
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R29/00Monitoring arrangements; Testing arrangements
    • H04R29/001Monitoring arrangements; Testing arrangements for loudspeakers
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10KSOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
    • G10K2210/00Details of active noise control [ANC] covered by G10K11/178 but not provided for in any of its subgroups
    • G10K2210/30Means
    • G10K2210/301Computational
    • G10K2210/3056Variable gain
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/21Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being power information
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2227/00Details of public address [PA] systems covered by H04R27/00 but not provided for in any of its subgroups
    • H04R2227/001Adaptation of signal processing in PA systems in dependence of presence of noise
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2430/00Signal processing covered by H04R, not provided for in its groups
    • H04R2430/01Aspects of volume control, not necessarily automatic, in sound systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2460/00Details of hearing devices, i.e. of ear- or headphones covered by H04R1/10 or H04R5/033 but not provided for in any of their subgroups, or of hearing aids covered by H04R25/00 but not provided for in any of its subgroups
    • H04R2460/01Hearing devices using active noise cancellation

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Signal Processing (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Quality & Reliability (AREA)
  • Otolaryngology (AREA)
  • Telephone Function (AREA)
  • User Interface Of Digital Computer (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

根据一个实施例,描述一种用于促进声学环境中的声学信号的基于上下文的消除和放大的机构。本文所描述的实施例的装置包括:检测和识别逻辑,用于检测声学信号源所发射的声学信号;评估、估计和足迹逻辑,用于将声学信号分类为紧急声学信号或非紧急声学信号,其中,分类基于与声学信号关联的足迹或足迹标识(ID);声学信号消除逻辑,用于如果声学信号基于足迹或足迹ID被看作非紧急声学信号,则消除声学信号;以及声学信号放大逻辑,用于如果声学信号基于足迹或足迹ID被分类为紧急声学信号,则放大声学信号。

Description

声学环境中的声学信号的基于上下文的消除和放大
技术领域
本文所描述的实施例总体上涉及数据处理,更具体地说,涉及促进声学环境中的声学信号的基于上下文的消除和放大。
背景技术
环境声学信号的范围可以从对人类健康的简单妨害到显著有害。预期并非所有形式的声学信号(例如,噪声)是等同的,例如,来自紧急报警的声学信号(例如,鸣笛)将看作比来自邻居的狗的吠叫的噪声重要得多。然而,以往的噪声掩蔽技术严重受限于其使用和应用,因为它们已知用于掩蔽所有形式和方式的声学信号并且并非足够智能以在不同声学信号之间基于它们的值、重要性等进行区分。
附图说明
在类似标号指代相似要素的附图的图中,通过示例的方式而不是限制的方式示出实施例。
图1示出根据一个实施例的掌控智能声学信号消除和放大机构的计算设备。
图2示出根据一个实施例的图1的智能声学信号消除和放大机构。
图3A示出说明根据一个实施例的关于声学信号消除和放大的使用情况情形的***设置。
图3B-图3C示出说明根据一个实施例的与狗吠叫有关的波形和声压级读数的图线。
图4示出根据一个实施例的用于声学信号的智能消除和放大的方法。
图5示出根据一个实施例的能够支持并且实现一个或多个实施例的计算机设备。
图6示出根据一个实施例的能够支持并且实现一个或多个实施例的计算环境的实施例。
具体实施方式
在以下描述中,阐述大量具体细节。然而,可以在没有这些具体细节的情况下实践本文所描述的实施例。在其他实例中,尚未详细示出公知电路、结构和技术,以免模糊该描述的理解。
提供用于在放大重要声学信号的同时智能地衰减或掩蔽不想要的环境声学信号(例如,噪声、声音、信号、鸣笛等)的新颖技术的实施例。例如,基于特定噪声的噪声源所生成的该噪声的足迹(footprint)消除该噪声、掩蔽具有未知足迹的噪声,以及识别和放大重要声学信号。
预期的是,并且要注意,实施例不限于特定噪声或鸣笛,并且实施例应用于所有形式和等级的声学信号。还预期术语像“噪声”、“话语”、“声音”、“鸣笛”、“信号”等,是声学信号的示例,并且因此与术语“声学信号”可互换地引用。
预期贯穿本文献可以可互换地引用例如“请求”、“询问”、“作业”、“工作”、“工作项”和“工作量”的术语。相似地,“应用”或“代理”可以指代或包括通过应用编程接口(API)(例如,免费渲染API(例如,开放图形库11、12等))提供的计算机程序、软件应用、游戏、工作站应用等,其中,“调度(dispatch)”可以可互换地称为“工作单元”或“绘制”,并且相似地,“应用”可以可互换地称为“工作流”或简单地“代理”。例如,工作量(例如,三维(3D)游戏的工作量)可以包括并且发出任何数量和类型的“帧”,其中,每个帧可以表示图像(例如,帆船、人脸)。此外,每个帧可以包括并且提供任何数量和类型的工作单元,其中,每个工作单元可以表示其对应帧所表示的图像(例如,帆船、人脸)的一部分(例如,帆船的桅杆、人脸的额头)。然而,为了一致性,贯穿本文献,每个条目可以由单个项(例如,“调度”、“代理”等)引用。
在一些实施例中,可以可互换地使用指代显示设备的可视部分的例如“显示屏幕”和“显示表面”的术语,而显示设备的其余部分可以嵌入到计算设备(例如,智能电话、可穿戴设备等)中。预期并且注意,实施例并非限于任何特定计算设备、软件应用、硬件组件、显示设备、显示屏幕或表面、协议、标准等。例如,实施例可以应用于并且用以任何数量和类型的计算机(例如,台式计算机、膝上型计算机、平板计算机、智能电话、头戴式显示器和其他可穿戴设备等)上的任何数量和类型的实时应用。此外,例如,用于使用该新颖技术的高效性能的渲染情形可以范围从简单情形(例如,桌面合成)到复杂情形(例如,3D游戏、增强现实应用等)。
要注意,贯穿本文献,可以可互换地引用例如卷积神经网络(CNN)、CNN、神经网络(NN)、NN、深度神经网络(DNN)、DNN、递归神经网络(RNN)、RNN等的术语或缩写。此外,贯穿本文献可以可互换地引用例如“自主机器”或简单地“机器”、“自主车辆”或简单地“车辆”、“自主代理”或简单地“代理”、“自主设备”或“计算设备”、“机器人”等的术语。
图1示出根据一个实施例的采用智能声学信号消除和放大机构(“声学机构”)110的计算设备100。作为初始内容,如上所述,“噪声”可以看作声学信号的示例,并且其贯穿本文献与“声学信号”可互换地使用,并且此外,实施例可应用于所有形式的声学信号(例如,任何类型和等级的声音、话语、信号、鸣笛等),而不仅限于噪声。计算设备100表示包括或表示(但不限于)移动设备(例如,智能电话、平板计算机等)、游戏设备、手持设备、可穿戴设备(例如,智能手表、智能手镯等)、虚拟现实(VR)设备、头戴式显示器(HMD)、物联网(IoT)设备、膝上型计算机、台式计算机、服务器计算机、机顶盒(例如,基于互联网的有线电视机顶盒等)、基于全球定位***(GPS)的设备等)的通信和数据处理设备。计算设备100可以还包括启用语音的设备(VED)、语音命令设备(VCD)(例如(但不限于)智能命令设备或智能个人助理(例如,Amazon.等)、家庭/办公室自动化***、家庭电器(例如,洗衣机、电视机等))。
在一些实施例中,计算设备100包括或工作于或嵌入在或促进任何数量和类型的其他智能设备(例如(但不限于)自主机器或人工智能代理(例如,机械代理或机器、电子代理或机器、虚拟代理或机器、机电代理或机器等))。自主机器或人工智能代理的示例可以包括(但不限于)机器人、自主车辆(例如,自动驾驶汽车、自动飞行飞机、自动航行船只等)、自主设备(自动操作建筑车辆、自动操作医疗设备等)等。此外,“自主车辆”不限于汽车,而是它们可以包括任何数量和类型的自主机器(例如,机器人、自主设备、家用自主设备等),并且与这些自主机器有关的任何一个或多个任务或操作可以与自主驾驶可互换地引用。
此外,例如,计算设备100可以包括掌控在单个芯片上集成各种硬件和/或软件组件的集成电路(“IC”)的计算机平台(例如,片上***(“SoC”或“SOC”))。
如所示,在一个实施例中,计算设备100可以包括任何数量和类型的硬件和/或软件组件,例如(但不限于)图形处理单元(“GPU”或简单地“图形处理器”)114、图形驱动器(又称为“GPU驱动器”、“图形驱动器逻辑”、“驱动器逻辑”、用户模式驱动器(UMD)、UMD、用户模式驱动器框架(UMDF)、UMDF或简单地“驱动器”)116、中央处理单元(“CPU”或简单地“应用处理器”)112、存储器108、网络设备、驱动器等以及输入/输出(I/O)源104(例如,触摸屏、触摸板、触摸盘、虚拟或常规键盘、虚拟或常规鼠标、端口、连接器等)。计算设备100可以包括操作***(OS)106,其充当计算机设备100的硬件和/或物理资源与用户之间的接口。
应理解,对于特定实现方式,比上述示例更少或更多的所装配的***可以是优选的。因此,取决于大量因素(例如,价格约束、性能要求、技术改进或其他情况),计算设备100的配置可以随着实现方式而变化。
实施例可以实现为任何以下项或其组合:使用主板互连的一个或多个微芯片或集成电路、硬引线逻辑、存储器设备所存储的并且由微处理器执行的软件、固件、专用集成电路(ASIC)和/或现场可编程门阵列(FPGA)。此外,术语“逻辑”、“模块”、“组件”、“引擎”和“机构”可以通过示例的方式包括软件或硬件和/或其组合(例如,固件)。
在一个实施例中,如所示,声学机构110可以由与计算设备100的I/O源104(例如,麦克风)进行通信的操作***106掌控。在另一实施例中,声学机构110可以由图形驱动器116掌控或促进。在又一实施例中,声学机构110可以由图形处理单元(“GPU”或简单地“图形处理器”)114或图形处理器114的固件掌控或成为其部分。例如,声学机构110可以嵌入或实现为图形处理器114的处理硬件的部分。相似地,在又一实施例中,声学机构110可以由中央处理单元(“CPU”或简单地“应用处理器”)112掌控或成为其部分。例如,声学机构110可以嵌入或实现为应用处理器112的处理硬件的部分。
在又一实施例中,声学机构110可以由任何数量和类型的计算设备100的组件掌控或成为其部分,例如,声学机构110的一部分可以由操作***116掌控或成为其部分,另一部分可以由图形处理器114掌控或成为其部分,另一部分可以由应用处理器112掌控或成为其部分,而声学机构110的一个或多个部分可以由计算设备1500的操作***116和/或任何数量和类型的设备掌控或成为其部分。预期实施例不限于声学机构110的任何实现方式或掌控,并且声学机构110的一个或多个部分或组件可以采用或实现为硬件、软件或其任何组合(例如,固件)。
计算设备100可以掌控网络接口,以提供对网络(例如,LAN、广域网(WAN)、城域网(MAN)、个域网(PAN)、蓝牙、云网络、移动网络(例如,第3代(3G)、第4代(4G)等)、内部网、互联网等)的接入。网络接口可以包括例如具有天线(其可以表示一个或多个天线)的无线网络接口。网络接口可以还包括例如有线网络接口,以经由网络缆线(其可以是例如以太网缆线、同轴缆线、光纤缆线、串行缆线或并行缆线)与远程设备进行通信。
实施例可以提供为例如计算机程序产品,其可以包括一个或多个机器可读介质,其上存储有机器可执行指令,其当由一个或多个机器(例如,计算机、计算机的网络或其他电子设备)执行时可以使得一个或多个机器执行根据本文所描述的操作。机器可读介质可以包括但不限于软盘、光盘、CD-ROM(压缩盘-只读存储器)以及磁光盘、ROM、RAM、EPROM(可擦除可编程只读存储器)、EEPROM(电可擦除可编程只读存储器)、磁或光卡、闪存、或适合于存储机器可执行指令的其他类型的介质/机器可读介质。
此外,实施例可以下载为计算机程序产品,其中,程序可以经由通信链路(例如,调制解调器和/或网络连接)通过载波或其他传输介质中实施的和/或调制的一个或多个数据信号的方式从远程计算机(例如,服务器)传送到请求计算机(例如,客户机)。
贯穿本文献,术语“用户”可以可互换地称为“观看者”、“观测者”、“说话者”、“人”、“个人”、“终端用户”等。要注意,贯穿本文献,例如“图形域”的术语可以与“图形处理单元”、“图形处理器”或简单地“GPU”可互换地引用,并且相似地,“CPU域”或“主机域”可以与“计算机处理单元”、“应用处理器”或简单地“CPU”可互换地引用。
要注意,贯穿本文献,可以可互换地使用例如“节点”、“计算机节点”、“服务器”、“服务器设备”、“云计算机”、“云服务器”、“云服务器计算机”、“机器”、“主机机器”、“设备”、“计算设备”、“计算机”、“计算***”等的术语。还要注意,贯穿本文献可以可互换地使用例如“应用”、“软件应用”、“程序”、“软件程序”、“包”、“软件包”等的术语。此外,贯穿本文献可以可互换地使用例如“作业”、“输入”、“请求”、“消息”等的术语。
图2示出根据一个实施例的图1的智能声学信号消除和放大机构110。为了简明,下文中不重复或讨论已经参照图1描述的很多细节。在一个实施例中,声学机构110可以包括任何数量和类型的组件,例如(但不限于):检测和识别逻辑201;评估、估计和足迹逻辑203;声学信号消除逻辑205;声学信号放大逻辑207;和通信/兼容性逻辑209。
计算设备100还示为包括用户接口219(例如,基于图形用户接口(GUI)的用户接口、Web浏览器、基于云的平台用户接口、基于软件应用的用户接口、其他用户或应用编程接口(API)等)。计算设备100可以还包括I/O源108,其具有捕获/感测组件231(例如,相机242(例如RealSenseTM相机)、传感器、麦克风241等)以及输出组件233(例如,显示设备或简单地显示器244(例如,集成显示器、张量显示器、投影屏幕、显示屏幕等)、扬声器设备或简单地扬声器243等)。
计算设备100还示为具有通过一个或多个通信介质230(例如,网络(例如,云网络、接近度网络、互联网)等)对一个或多个数据库225和/或一个或多个其他计算设备的接入和/或与之进行通信。
在一些实施例中,数据库225可以包括存储介质或设备、库、数据源等中的一个或多个,其具有与任何数量和类型的应用有关的任何量或类型的信息(例如,数据、元数据等)(例如,与一个或多个用户、物理位置或区域、适用的法律、政策和/或规章、用户偏好和/或简档、安全和/或鉴权数据、历史和/或偏好细节等有关的数据和/或元数据)。
如前述,计算设备100可以掌控包括捕获/感测组件231和输出组件233的I/O源108。在一个实施例中,捕获/感测组件231可以包括传感器阵列,其包括但不限于麦克风241(例如,超声麦克风))、相机242(例如,二维(2D)相机、三维(3D)相机、红外(IR)相机、深度感测相机等)、电容器、无线电组件、雷达组件等、扫描仪、和/或加速计等。相似地,输出组件233可以包括任何数量和类型的显示设备或屏幕、投影仪、扬声器、发光二极管(LED)、扬声器243和/或振动电机等。
例如,如所示,捕获/感测组件231可以包括任何数量和类型的麦克风241(例如,多个麦克风或麦克风阵列(例如,超声麦克风、动态麦克风、光纤麦克风、激光麦克风等))。预期麦克风241中的一个或多个充当用于接受或接收进入计算设备100的音频输入(例如,人类语音)并且将该音频或声音转换为电信号的一个或多个输入设备。相似地,预期相机242中的一个或多个充当用于检测和捕获场景、对象等的图像和/或视频的一个或多个输入设备,并且将所捕获的视频提供为进入计算设备100的视频输入。
预期实施例不限于任何数量或类型的麦克风241、相机243、扬声器243、显示器244等。例如,如检测和识别逻辑201所促进的那样,麦克风241中的一个或多个可以用以检测来自一个或多个声学信号源250(又称为“声学信号源”、“噪声或信号制造方”、“噪声或信号发射方等”(例如,人类、动物、工具、车辆、自然等))的声学信号(例如,话语、声音、噪声、鸣笛等),如参照图3A进一步显示的那样。为了简明并且清楚,声学信号(例如,话语、声音、鸣笛、噪声等)可以贯穿本文献联合地或可互换地称为“噪声”。
相似地,如所示,输出组件233可以包括任何数量和类型的扬声器设备或扬声器243,以充当输出设备,以用于出于任何数量或类型的原因(例如,人类收听或消费)从计算设备100输出或发出音频。例如,扬声器243工作得与麦克风241相反,其中,扬声器243将电信号转换为声音。相似地,输出组件233可以包括显示设备或显示器244,用于呈现视觉图像或视频流等。
如上所述,来自环境声学信号或噪声的声学信号污染可能具有对人类健康和心理的极大负面影响,范围从简单的妨害或烦扰到听力的丧失以及其他严重的健康后果。虽然已经进行若干尝试以掩蔽声学信号,但这些尝试严重受限于其方法和应用,因为它们并非足够智能以在想要的和不想要的噪声、重要的和不重要的声音、警告和仅烦扰等之间进行区分。
例如,如参照图3A进一步描述的那样,对于普通个人,手提钻的声音当与个人的哭叫婴儿的声音比较时将是相当不重要的。换言之,取决于声学信号源250的性质及其与听者的相关性,所发射的声学信号可以对于个人是有价值的或可以是没有任何价值的。例如,当声学信号源250是婴儿或狗时,如果婴儿或狗是收听的个人自己的,则婴儿的哭叫声音或狗的吠叫噪声对于他们可以是有较大价值的。
相似地,例如,作为紧急车辆或声音制造方(例如,载有患者的救护车、驶向火灾的消防车、探测黄褐色报警(amber alert)的移动设备等)的声学信号源250对于所有收听者可以是同等重要或价值的,因为这些方式或类型的声学信号被看作为了公众的普遍好处而公开宣告。
实施例提供用于在评估和放大重要声学信号的同时识别和消除不重要的声学信号的新颖技术。实施例还提供将足迹与特定声学信号一起应用和使用,以更好地评估每个声学信号并且在关于是消除、掩蔽、减少还是放大特定声学信号进行的判断中使用该评估。例如,基于对应声学信号源250(例如,手提钻)所生成的噪声(手提钻噪声)的足迹消除噪声,识别和放大对应声学信号源250(例如,救护车)所发射的重要声学信号(例如,紧急信号),以及掩蔽对应声学信号源250(例如,狗)所发射的具有未知或丢失的足迹的声学信号(例如,狗吠叫)等。
返回参照声学机构110,一旦检测和识别逻辑201检测到并且识别出声学信号,其就可以由评估、估计和足迹逻辑203关于与声学信号关联的足迹、声学信号的性质、声学信号的声学信号源250中的一个或多个进行评估。足迹指代与声学信号关联的测量标识,其中,可以使用足迹容易地识别使用声学信号。例如,特定声学信号关于它们的形式、频率、音调中的一个或多个看作良好已知的和/或一致的,并且因此,这些声学信号可以被分派足迹,其可以然后用以识别这些声学信号,如评估、估计和足迹逻辑203所促进的那样。
如文献中稍后将进一步讨论的那样,在一个实施例中,关于足迹所揭示的声学信号的任何标识可以然后由评估、估计和足迹逻辑203用于进一步评估声学信号,以确定声学信号的类型,声学信号的一个或多个声学信号源250以及声学信号由声学信号消除逻辑205掩蔽、减少或消除还是由声学信号放大逻辑207增加或放大。
例如,一旦已经被分派足迹的声学信号由其对应声学信号源250生成并发射,声学信号就可以然后由检测和识别逻辑201检测并识别,该操作然后后接评估、估计和足迹逻辑203进行的足迹的检测和评估,以识别声学信号的噪声分量。如果例如足迹将声学信号揭示为妨害、不重要的等(例如,手提钻噪声等),则声学信号消除逻辑205可以然后被触发,以消除或掩蔽来自声学信号源250所发射的声学信号的所识别的噪声分量。相似地,如果足迹将声学信号揭示为重要的、紧急的等(例如,救护车信号等),则声学信号放大逻辑207可以被触发以增加或放大声学信号,使得它可以由有关个人听到。
实施例还提供并未被分派(或不能被分派)足迹的声学信号的消除和/或放大。例如,虽然未被分派足迹,但特定声学信号(例如,婴儿哭叫、狗吠叫、防盗警报等)可以被分派预定重要性声学信号(“重要性信号”),其可以然后由评估、估计和足迹逻辑203评估。在评估时,如果重要性信号指示声学信号的高重要性(例如,防盗警报),则放大声学信号,如声学信号放大逻辑207所促进的那样。相似地,如果重要性信号指示声学信号的低重要性(例如,狗吠叫),则可以消除噪声,如声学信号消除逻辑205所促进的那样。
在一些实施例中,可以关于声学信号的烦扰测量声学信号,如评估、估计和足迹逻辑203所促进的那样。例如,当既未分派给声学信号足迹(例如,狗吠叫),声学信号的重要性信号也并非是已知时,评估、估计和足迹逻辑203可以于是估计声学信号的烦扰等级,如果烦扰等级被确定为高的,则可以然后通过掩蔽声学信号的噪声分量来消除或显著减少或缓解声学信号,如声学信号消除逻辑205所促进的那样。然而,如果发现声学信号的烦扰等级是低的或不显著的,则声学信号可以于是保持不变。
如参照图3A进一步示出的那样,相对已知的并且一致形式的声学信号(例如,手提钻或工具噪声、救护车或其他紧急鸣笛、闹钟或移动电话闹钟、飞机或其他电机声音等)可以被分派可以揭示关于这些声学信号的标识和其他相似属性的足迹。与之对比,相对未知的或不一致形式的声学信号(例如,婴儿或孩童哭叫、人交谈或尖叫、狗吠叫或其他动物发出噪声、下雨或打雷、波浪撞击岩石或水落下等),并且因此这些声学信号可以不被分派足迹。
在一个实施例中,足迹可以在制造声学信号的声学信号源250之时分派给声学信号,例如,闹钟的制造商可以将足迹分派给来自该闹钟的告警的噪声等。在另一实施例中,评估、估计和足迹逻辑203可以实时分派足迹。例如,计算设备100附近的特定声学信号可以由评估、估计和足迹逻辑203连续地观测和评估,并且在具有与声学信号有关的足够的历史和属性时,当声学信号再次由检测和识别逻辑201检测到和/或识别出时,该声学信号可以然后由评估、估计和足迹逻辑203评估和分派足迹。
在一个实施例中,任何足迹可以存储和保存在评估、估计和足迹逻辑203经过一个或多个通信介质(例如,云网络、接近度网络、互联网等)通过通信/兼容性逻辑209可访问的一个或多个数据库225处。例如,如果足迹先前例如在制造之时被分派给声学信号,则该足迹已经存储在一个或多个数据库225处并且可供从一个或多个数据库225访问。相似地,如果足迹例如由评估、估计和足迹逻辑203实时分派给声学信号,则在分派足迹时,评估、估计和足迹逻辑203可以引导足迹经过一个或多个通信介质230存储在数据库225中的一个或多个处。在一些实施例中,与足迹一样,重要性信号也可以存储和保存在一个或多个数据库225处,并且对于评估、估计和足迹逻辑203可经过一个或多个通信介质230访问。
此外,在一个实施例中,检测和识别逻辑201可以用以在检测可以正生成声压级(SPL)的声学信号源250中的任何一个或多个中监控与各个声学信号源250关联的声学环境。如果发现声学信号源250中的该声学信号源,假设所发现的声学信号源所发射的声学信号具有足迹,则通信/兼容性逻辑209可以于是被触发以将检测和识别逻辑201的发现报告回到噪声源,并且请求声学信号源和/或其操作者限制声学信号。例如,如果发出声学信号的声学信号源250的设备是智能的(例如,智能设备、智能车辆等),则消息可以直接传递到设备和/或操作设备的人(例如,人的移动设备)。在一些实施例中,例如,在露天音乐会、深夜或早晨时间施工、具有响亮音乐或谈天的晚时邻居派对的情况下,通信/兼容性逻辑209可以用以向合适的个人或甚至法定官方报告事故。
捕获/感测组件231可以还包括已知用于捕获用于媒体(例如,个人媒体)的静止和/或视频红绿蓝(RGB)和/或RGB深度(RGB-D)图像的任何数量和类型的相机(例如,深度感测相机或捕获设备(例如,RealSenseTM深度感测相机))。具有深度信息的这些图像已经有效地用于各种计算机视觉和计算摄影效果(例如(但不限于)场景理解、重新聚焦、合成、影院图形等)。相似地,例如,显示器可以包括任何数量和类型的显示器(例如,集成显示器、张量显示器、立体显示器等),包括(但不限于)嵌入式或连接式显示屏幕、显示设备、投影仪等。
捕获/感测组件231可以还包括以下中的一个或多个:振动组件、触觉组件、传导元件、生物计量传感器、化学检测器、信号检测器、脑电图、功能近红外光谱法、波检测器、力传感器(例如,加速计)、照射器、眼部跟踪或注视跟踪***,头部跟踪***等,其可以用于捕获任何量和类型的视觉数据(例如,图像(例如,照片、视频、电影、音频/视频流等))以及非视觉数据(例如,音频流或信号(例如,声音、噪声、振动、超声等)、无线电波(例如,无线信号(例如,具有数据、元数据、符号等的无线信号))、化学改变或性质(例如,湿度、体温等)、生物计量读数(例如,指纹等)、脑波、脑血循环、环境/气象状况、地图等)。预期贯穿本文献可以互换地引用“传感器”和“检测器”。还预期一个或多个捕获/感测组件231可以还包括用于捕获和/或感测数据的支持或补充设备(例如,照射器(例如,IR照射器)、灯夹具、发生器、声音阻挡器等)中的一个或多个。
还预期在一个实施例中,捕获/感测组件231可以还包括任何数量和类型的上下文传感器(例如,线性加速计),以用于感测或检测任何数量和类型的上下文(例如,估计与移动计算设备等有关的水平、线性加速等)。例如,捕获/感测组件231可以包括任何数量和类型的传感器,例如(但不限于):加速计(例如,线性加速计,用于测量线性加速度等);惯性设备(例如,惯性加速计、惯性陀螺仪、微电机***(MEMS)陀螺仪、惯性导航仪等);以及重力梯度计,用于研究和测量因重力而导致的重力加速度的变化等。
此外,例如,捕获/感测组件231可以包括(但不限于):音频/视觉设备(例如,相机麦克风、扬声器等);上下文意识传感器(例如,温度传感器、通过音频/视觉设备的一个或多个相机工作的面部表情和特征测量传感器、环境传感器(例如,用于感测背景色彩、光等);生物计量传感器(例如,用于检测指纹等)、日历维护和读取设备等);全球定位***(GPS)传感器;资源请求器;和/或TEE逻辑。TEE逻辑可以被分离地采用,或成为资源请求器和/或I/O子***等的部分。捕获/感测组件231可以还包括语音识别设备、照片识别设备、面部和其他身体识别组件、语音到文本转换组件等。
相似地,输出组件233可以包括具有触觉效应器的动态触觉触摸屏作为呈现触摸的可视化的示例,其中,其实施例可以是超声发生器,其可以在空间中发送信号,信号当到达例如人手指时可以在手指上产生触觉感受或类似感觉。此外,例如,并且在一个实施例中,输出组件233可以包括(但不限于)以下项中的一个或多个:光源、显示设备和/或屏幕、音频扬声器、触觉组件、传导元件、骨传导扬声器、嗅觉或气味视觉和/或非/视觉呈现设备、触感或触摸视觉和/或非视觉呈现设备、动画显示设备、生物计量显示设备、X射线显示设备、高分辨率显示器、高动态范围显示器、多视图显示器以及用于虚拟现实(VR)和增强现实(AR)中的至少一个的头戴式显示器(HMD)等。
预期实施例不限于任何特定数量或类型的使用情况情形、架构放置或组件设置;然而,为了简明和清楚,为了示例性的目的贯穿本文献提供并且讨论说明和描述,但实施例不限于此。此外,贯穿本文献,“用户”可以指代具有对一个或多个计算设备(例如,计算设备100)的存取的某人,并且可以与“人”、“个人”、“人类”、“他”、“她”、“孩子”、“成人”、“观看者”、“玩家”、“比赛者”、“开发者”、“编程者”等可互换地引用。
在确保与改变中的技术、参数、协议、标准等的兼容性的同时,通信/兼容性逻辑209可以用以促进各种组件、网络、计算设备、数据库225和/或通信介质230等与任何数量和类型的其他计算设备(例如,可穿戴计算设备、移动计算设备、台式计算机、服务器计算设备等)、处理设备(例如,中央处理单元(CPU)、图形处理单元(GPU)等)、捕获/感测组件(例如,非视觉数据传感器/检测器(例如,音频传感器、嗅觉传感器、触感传感器、信号传感器、振动传感器、化学检测器、无线电波检测器、力传感器、气象/温度传感器、身体/生物计量传感器、扫描仪等)以及视觉数据传感器/检测器(例如,相机等))、用户/上下文意识组件和/或标识/验证传感器/设备(例如,生物计量传感器/检测器、扫描仪等)、存储器或存储设备、数据源和/或数据库(例如,数据存储设备、硬驱、固态驱动器、硬盘、存储卡或设备、存储器电路等)、网络(例如,云网络、互联网、物联网、内部网、蜂窝网络、接近度网络(例如,蓝牙、蓝牙低能量(BLE)、蓝牙智能、Wi-Fi接近度、无线电频率标识、近场通信、体域网等))、无线或有线通信和有关协议(例如,WiMAX、以太网等)、连接和位置管理技术、软件应用/网站(例如,社交和/或商业连网网站、商业应用、游戏和其他娱乐应用等)、编程语言等之间的动态通信和兼容性。
贯穿本文献,例如“逻辑”、“组件”、“模块”、“框架”、“引擎”、“工具”、“电路”等的术语可以可互换地使用,并且通过示例的方式包括软件、硬件和/或软件和硬件的任何组合(例如,固件)。在一个示例中,“逻辑”可以指代或包括能够工作于计算设备(例如,计算设备100)的操作***、图形驱动器等中的一个或多个的软件组件。在另一示例中,“逻辑”可以指代或包括能够连同一个或多个计算设备(例如,计算设备100)的***硬件元件(例如,应用处理器、图形处理器等)一起以物理方式安装的或成为其部分的硬件组件。在又一实施例中,“逻辑”可以指代或包括能够成为计算设备(例如,计算设备100)的***固件(例如,应用处理器或图形处理器等的固件)的部分的固件组件。
此外,特定品牌、词语、术语、短语、名称和/或缩写(例如,“声学信号”、“声学信号源”、“噪声”、“噪声源”、“信号”、“声音”、“话语”、“鸣笛”、“足迹”、“重要性信号”、“烦扰”、“妨害”、“消除”、“掩蔽”、“缓解”、“放大”、“增加”、“RealSenseTM相机”、“实时”、“自动化”、“动态”、“用户接口”、“相机”、“传感器”、“麦克风”、“显示屏幕”、“扬声器”、“验证”、“鉴权”、“隐私”、“用户”、“用户简档”、“用户偏好”、“发送器”、“接收器”、“个人设备”、“智能设备”、“移动计算机”、“可穿戴设备”、“IoT设备”、“接近度网络”、“云网络”、“服务器计算机”等)的任何使用不应解读为将实施例限制为在产品中或在本文献之外的文献中携带该标记的软件设备。
预期可以向声学机构110添加和/或从其移除任何数量和类型的组件,以促进包括添加、移除和/或增强特定特征的各种实施例。为了简明、清楚并且易于理解声学机构110,在此并未示出或讨论很多标准和/或公知组件(例如,计算设备的组件)。预期本文所描述的实施例不限于任何技术、拓扑、***、架构和/或标准,并且是动态得足以适应和适于任何未来的变化。
图3A示出说明根据一个实施例的用于声学信号消除和放大的使用情况情形的***设置300。为了简明,下文中可以不讨论或重复先前参照图1-图2描述的很多细节。任何处理或事务可以由处理逻辑执行,处理逻辑可以包括硬件(例如,电路、专用逻辑、可编程逻辑等)、软件(例如,处理设备上运行的指令)或其组合,如图1的声学机构110所促进的那样。在陈述中为了简明和清楚可以按线性顺序示出或陈述与该说明关联的任何处理或事务;然而,预期可以按并行、异步或不同顺序执行任何数量的它们。
所示实施例公开两种类型的声学信号(例如,噪声、信号、鸣笛等):1)具有足迹的声学信号(例如,手提钻/汽锤噪声327和救护车信号325);以及2)没有任何足迹的声学信号(例如,婴儿哭叫噪声321和狗吠叫噪声323)。在继续于进一步讨论之前,预期并且要注意,在简明、清楚并且易于理解的情况下,实施例不限于该说明或任何其组件、参与方、声学信号等,并且提供该说明以突显新颖技术,如声学机构110所促进的那样。
返回参照先前所讨论的***设置300,足迹可以包含噪声321、323、325、327和/或声学信号源311、313、315、317的特定声学性质(例如,位置和其他特性(例如,物理模型))。例如,这些特性可以包括(但不限于)频谱、时间和方向性特性、当前SPL、SPL限制、地理坐标等,其中,SPL又称为声压级,其为声音相对于参考值的有效压力的对数测度。
如上所述,在一个实施例中,可以在生产或制造充当声学信号源的设备(例如救护车315、手提钻317等)期间创建并且分派足迹的声学部分,其中,可以在设备生产的最终阶段之一时执行足迹的创建和分派的该处理。可以由设备制造商、第三方实体(例如,公司、实验室等)等中的任一关于精度而测量这些足迹,然后将它们分派给对应设备,对应设备可以于是充当声学信号源(例如,救护车315、手提钻317等)。每个足迹可以对于其对应声学信号源315、317是唯一的,或在一些情况下,处于多个设备要求的范围内并且更接近特定模型。在一个实施例中,如果例如足迹的对应设备(例如,声学信号源315、317)看作能够广播足迹,则足迹可以存储在该设备的存储介质/设备处。在另一实施例中,足迹可以存储在数据库225处。
在一个实施例中,可以通过能够通过一个或多个通信介质230(例如云网络、互联网等)访问的各种方式(基于云的、面向对象的等)组织并且访问数据库225(又称为足迹数据库)。此外,在一个实施例中,具有声学机构110的计算设备100可以充当上下文意识声学信号消除和放大***(CANCAS)设备,其可以使用足迹标识(ID)询问数据库225,并且从数据库225接收对应足迹作为输出。如上所述,足迹也可以存储在计算设备100或单独声学信号源315、317处。
此外,例如,足迹的地理坐标部分可以由作为声学信号源(例如,救护车315和手提钻317)的其对应设备服务使用位置检测技术(例如,全球定位***(GPS)等)基于其方位而生成。该位置或地理坐标信息然后添加到对应足迹,这样于是产生声学信号源特定足迹。此外,具有足迹的声学信号源315、317可以连同分别发射其噪声325、327一起发送它们的足迹或足迹ID。足迹或足迹ID的这种生成可以是超声的,而它们的方向性质和等级可以与它们的相应设备(例如,声学信号源315、317)所发射的声学信号(例如噪声325、327)相似。
此外,具有足迹(或足迹ID)的发射噪声325、327的声学信号源315、317可以通过各种侧信道或通信介质230(例如,互联网、蜂窝电话网络(3G、LTE等))同时广播它们的噪声325、327以及足迹和/或足迹ID。在一个实施例中,声学机构110的评估、估计和足迹逻辑203可以利用足迹或ID来识别位置附近的声学信号存在性,使得语音可以取决于通过那些足迹或足迹ID获得的信息受衰减或放大。此外,在一些实施例中,当计算设备100确定为能够发现和接收广播时,声学信号源315、317广播足迹,如声学机构110所促进的那样。
在一个实施例中,可以在两个或更多个接收设备之间在空中广播足迹以用于促进通信,例如,用户的移动设备可以使用通信介质230(例如,侧信道(例如,互联网))传递待由其他移动设备接收的有关足迹。此外,在一个实施例中,在以数字方式映射周围以发现来自其对应声学信号源315、317的声学信号关于其主机设备(例如,计算设备100)是否潜在地可由声学机构110注意的同时,声学机构110可以将地理位置隐藏在噪声325、327的足迹中。
如参照图2所示出并且讨论的那样,具有声学机构110的计算设备100充当具有与数字信号处理器(DSP)单元303通信的麦克风、外放扬声器等的上下文意识声学信号消除和放大***,数字信号处理器(DSP)单元303可以允许通过声学机构110的声学信号的本地分析。取决于噪声321、323、325、327的分析和评估,如声学机构110的图2的评估、估计和足迹逻辑203所促进的那样,可以完全消除具有足迹的噪声327,可以放大噪声321、325的特定重要声学信号,而可以掩蔽没有足迹的噪声323,或其任何组合,如声学机构110的图2的声学信号消除逻辑205和/或声学信号放大逻辑207所促进的那样。
如上所述,预期虽然该***设置300涉及可能具有生成噪声消除信号等的外放扬声器的家庭/办公室环境,但实施例不限于此,并且能够用在各种环境设置中。例如,在一些实施例中,可以既在室内又在室外使用噪声消除头戴式耳机,以实现最终噪声消除。例如,当考虑图4的方法时,该情况下的差异仅可以是使得噪声消除信号通过头戴式耳机渲染,而不是外放扬声器。
图3B-图3C示出说明根据一个实施例的与狗吠叫有关的波形和SPL读数的图线350、360。为了简明,下文中可以不讨论或重复先前参照图1-图3A描述的很多细节。在陈述中为了简明和清楚可以按线性顺序示出或陈述与该说明关联的任何处理或事务;然而,预期可以按并行、异步或不同顺序执行任何数量的它们。
如所示,图线350反映看作烦扰声音的远处狗吠叫的波形方面的结果。该声音烦扰(SA)可以由图2的评估、估计和足迹逻辑203基于图线360所示的SPL读数估计,而SPL读数也可以由图2的评估、估计和足迹逻辑203例如通过使用频率加权或权重测量。预期在一个实施例中,在已经检测并且移除所有足迹之后计算SA,使得使用SA算法来比较任何所测得的SPL读数与人类听力阈值(HT),并且如果声音比HT更响,则可以计算SA,如评估、估计和足迹逻辑203所促进的那样。在此,可以应用不同策略,例如,SA可以估计为SPL动态(dynamic),其中,冲击声音可以暴露得相当动态,如图线350、360中所描述的那样(例如,图线350的远处狗吠叫波形以及图线360中的从20dB改变到60dB的其SPL读数)。
图4示出根据一个实施例的用于声学信号的智能消除和放大的方法400。为了简明,下文中可以不讨论或重复先前参照图1-图3C描述的很多细节。任何处理或事务可以由处理逻辑执行,处理逻辑可以包括硬件(例如,电路、专用逻辑、可编程逻辑等)、软件(例如处理设备上运行的指令)或其组合,如图1的声学机构110所促进的那样。在陈述中为了简明和清楚可以按线性顺序示出或陈述与该说明关联的任何处理或事务;然而,预期可以按并行、异步或不同顺序执行任何数量的它们。
方法400开始于:在方框401,麦克风241检测来自声学信号源的声学信号,其中,可以(可选地)预处理麦克风241中的一个或多个接收到的声学信号(例如,噪声)。在一个实施例中,在方框403,该预处理可以然后带来足迹监视(lookout),从而确定声学信号是否具有与之关联的任何足迹(或足迹ID),其中,可以通过搜索进入或访问存储和保存与各种声学信号关联的足迹的数据库225来执行该监视。在另一实施例中,在402,足迹可以通过一个或多个通信介质或网络(例如,云网络、互联网等)广播到数据库225中。在又一实施例中,如参照图2所描述的那样,足迹/足迹ID可以实时分派给或关联于声学信号,如图2的评估、估计和足迹逻辑203所促进的那样,其中,这些足迹/足迹ID可以然后存储在数据库225中的一个或多个处。
此外,在一个实施例中,一旦在方框403关于足迹扫描声学信号,方法400就可以允许通过检查以查看数据库225是否可以包括与声学信号关联或有关的足迹,来关于足迹对声学信号进行双重检查。在一个实施例中,数据库225通过使得足迹通过一个或多个网络(例如,互联网)从声学信号源、制造商、操作者等传递到数据库225得以填充。此外,数据库225处的每个足迹可以被分类为紧急足迹或噪声足迹,如图2的评估、估计和足迹逻辑203所促进的那样。
在一个实施例中,使用通过这些足迹提供的或与这些足迹关联的信息(例如,紧急鸣笛、灾难告警、犯罪警戒等)进一步增强紧急足迹,使得在保持这些紧急足迹的时间顺序的同时,当需要时可以放大它们的声学频率。可以例如基于频谱减除从检测到的麦克风/声学信号减除任何所发现的紧急信号,以便不干扰它们的连续分析。相似地,可以通过生成低频率声学信号以及一些反相信号衰减具有所识别的足迹或足迹ID的噪声(但非紧急)信号(例如,出自重型施工设备(例如,手提钻等)的噪声)。在这些情况下,足迹典型地提供关于声学信号源的频谱和时间性质的必要信息。至于紧急信号,使用频谱减除从检测到的麦克风信号减除任何所发现的信号,以便不干扰它们的连续分析。
如上所述,麦克风241如图2的检测和识别逻辑201所促进的那样可以用以在其声学环境内连续地监控各种声学信号及其对应声学信号源。例如,装配有附加音频处理技术(例如,方框401的预处理技术)的麦克风241中的一个或多个可以用于监控声学信号和/或声学信号源的目的。此外,使用预处理技术的麦克风阵列(例如,麦克风241)可以用以实现麦克风信号的高质量处理,其更好地适合于图2的评估、估计和足迹逻辑203进行的随后分析和评估。
此外,在一个实施例中,麦克风241如图2的检测和识别逻辑201所促进的那样可以用以扫描声学或音频信号,以使用一个或多个事件检测技术或组件(例如,声学事件检测器(ACA))确定或识别特定事件(例如,婴儿哭叫、玻璃破碎等)。此外,如图2的检测和识别逻辑201所促进的那样,可以使用特定分类算法(例如,通过理解为并且看作紧急信号模型的使用先前训练的或预先训练的分类器的包括深度学习神经网络(DNN)的深度学习模型)执行该事件检测。此外,可以基于频谱减除从任何检测到的麦克风声学信号减除一个或多个事件检测技术或组件(例如,ACA)所分类的任何声学信号,以便不干扰它们的连续分析。
如以下将参照图4进一步描述的那样,未识别的或不包括足迹或足迹ID或保持不受ACA识别的声学信号,于是图2的评估、估计和足迹逻辑203可以估计与检测到的声学信号关联的声音烦扰等级。如果例如声学信号的声音烦扰等级足够高(例如,势必打扰或危害公众,如通过与已知的dB额定及其后果进行比较所确定的那样),则图2的信号消除逻辑205可以被触发以掩蔽声学信号,以限制该声学信号的影响和感知。
现返回参照方法400,在一个实施例中,方法400继续于方框405,其中,关于是否存在与声学信号关联的任何足迹进行确定。如果(例如在来自图3A的救护车信号、防盗警报等的情况下)在信号中检测到紧急足迹,则检测到的信号在方框413从麦克风信号被移除并且发送到方框407以用于生成放大的紧急信号,其可以进一步被携带回到方框417,以用于生成声学信号消除信号,并且然后在任一情况下,通过方框409去往在方框411的信号的(可选)后处理,然后通过一个或多个扬声器243(例如,外放扬声器、房间扬声器、嵌入式计算机或电视扬声器、收音机扬声器、有线或无线耳机等)广播。然而,如果并未检测到紧急足迹,则在方框415,关于是否存在与声学信号关联出现的任何声学信号足迹进行另一确定。
如果在方框415存在声学信号足迹,则在方框419从麦克风信号移除检测到的信号,并且发送到方框417,生成声学信号消除信号,然后通过方框409去往在块411的信号的(可选)后处理,然后通过一个或多个扬声器243广播。然而,如果并未发现声学信号足迹,则方法400继续于在方框421的紧急信号检测。
在方框421,执行声学信号的紧急检测,包括:在方框423使用声学事件检测技术/组件(例如,使用ACA等),在方框425使用和接收来自基于深度学习的紧急信号模型的反馈等,如图2的评估、估计和足迹逻辑203所促进的那样。然后,使用该所获取的和/或所估计的信息,在方框427,关于是否检测到任何事件(例如,来自图3A的婴儿哭叫)进行确定。如果检测到事件,则在方框431从麦克风信号移除信号,并且方法400继续于方框429,其中,生成放大的紧急信号,然后通过方框409,信号发送到方框411上,以用于通过一个或多个扬声器243的(可选)后处理和广播。
然而,如果在声学信号并未看作紧急信号的同时并未检测到事件,如在方框427所确定的那样,则方法400继续于在方框433的烦扰估计,如图2的评估、估计和足迹逻辑203所促进的那样。如所示,计算声音烦扰指代与声学信号(例如,在图3A的狗吠叫的情况下的噪声)关联的烦扰或妨害等级的简单估计,并且可以包括:执行在方框435的例如频率加权的处理,以确定声学信号正被中继得多频繁(例如,在狗吠叫的情况下每隔几秒,使用鞭炮的每隔几分钟等)。
在方框437,关于从方框435确定的频率是否违反预定听力阈值(HT)进行确定。如果频率等于或加权不大于HT,则声学信号可以看作对人类是安全的或可容忍的,并且被允许继续,并且从而方法400结束于方框445。然而,如果频率受加权大于HT,则可以在方框439计算SPL动态。在一个实施例中,在方框441,关于所计算的SPL是否大于预定SPL阈值进行另一确定。如果所估计的SPL等于或小于SPL,则声学信号可以看作对人类是安全的或可容忍的,并且被允许继续,并且从而方法400结束于方框445。然而,如果SPL估计确定为大于SPL阈值,则声学信号可以看作具有足够高的烦扰或妨害,从而可以在方框443掩蔽声学信号。该掩蔽的声学信号可以然后传递到方框409,并且进一步传递到方框411上,以用于(可选)信号后处理,其中,可以然后通过一个或多个扬声器243广播掩蔽的噪声。
图5示出根据一个实现方式的计算设备500。所示的计算设备500可以与图1的计算设备100相同或相似。计算设备500容纳***板502。板502可以包括多个组件,包括但不限于处理器504以及至少一个通信包506。通信包耦合到一个或多个天线516。处理器504以物理方式和电气方式耦合到板502。
取决于其应用,计算设备500可以包括可以通过物理方式和电气方式耦合到或不耦合到板502的其他组件。这些其他组件包括但不限于易失性存储器(例如DRAM)508、非易失性存储器(例如ROM)509、闪存(未示出)、图形处理器512、数字信号处理器(未示出)、加密处理器(未示出)、芯片组514、天线516、显示器518(例如,触摸屏显示器)、触摸屏控制器520、电池522、音频编解码器(未示出)、视频编解码器(未示出)、功率放大器524、全球定位***(GPS)设备526、罗盘528、加速计(未示出)、陀螺仪(未示出)、扬声器530、相机532、麦克风阵列534以及海量存储设备(例如,硬盘驱动器)510、压缩盘(CD)(未示出)、数字多功能盘(DVD)(未示出)等。这些组件可以连接到***板502,安装到***板,或与任何其他组件组合。
通信包506使得能够进行无线和/或有线通信,以用于数据去往以及来自计算设备500的传送。术语“无线”及其派生词可以用以描述可以通过使用通过非固体介质的调制电磁辐射来传递数据的电路、设备、***、方法、技术、通信信道等。虽然在一些实施例中关联设备可以不包含任何引线,但该术语并非暗指它们不包含任何引线。通信包506可以实现任何数量的无线或有线标准或协议,包括但不限于WiFi(IEEE 802.11族)、WiMAX(IEEE802.16族)、IEEE 802.20、长期演进(LTE)、Ev-DO、HSPA+、HSDPA+、HSUPA+、EDGE、GSM、GPRS、CDMA、TDMA、DECT、蓝牙、以太网其衍生以及指定为3G、4G、5G以及更高的任何其他无线和有线协议。计算设备500可以包括多个通信包506。例如,第一通信包506可以专用于较短距离无线通信(例如,Wi-Fi和蓝牙),而第二通信包506可以专用于较长距离无线通信(例如,GPS、EDGE、GPRS、CDMA、WiMAX、LTE、LTE-A、Ev-DO等)。
包括任何深度传感器或接近度传感器的相机532耦合到可选图像处理器536,以执行本文所描述的转换、分析、降噪、比较、深度或距离分析、图像理解和其他处理。处理器504耦合到图像处理器,以通过图像处理器和相机的中断、设置参数以及控制操作驱动处理。可以改为在处理器504、图形CPU 512、相机532中或在任何其他设备中执行图像处理。
在各个实现方式中,计算设备500可以是膝上型设备、上网本、笔记本、超级本、智能电话、平板、个人数字助理(PDA)、超级移动PC、移动电话、台式计算机、服务器、机顶盒、娱乐控制单元、数字相机、便携式音乐播放器或数字视频记录器。计算设备可以是固定的、便携的或可穿戴的。在其他实现方式中,计算设备500可以是处理数据或记录数据以用于其他处理的任何其他电子设备。
可以使用一个或多个存储器芯片、控制器、CPU(中央处理单元)、使用主板互连的微芯片或集成电路、专用集成电路(ASIC)和/或现场可编程门阵列(FPGA)实现实施例。术语“逻辑”可以通过示例的方式包括软件或硬件和/或软件和硬件的组合。
对“一个实施例”、“实施例”、“示例实施例”、“各个实施例”等的引用指示所描述的实施例可以包括特定特征、结构或特性,但并非每一实施例必须包括该特定特征、结构或特性。此外,一些实施例可以具有关于其他实施例所描述的一些特征、所有特征,或者没有其特征。
在以下描述和权利要求中,可以使用术语“耦合”连同其派生词。“耦合”用以指示两个或更多个元件彼此共同操作或交互,但它们可以具有或没有它们之间的介入物理或电子组件。
如权利要求中所使用的那样,除非另外指定,用于描述共同要素的序数形容词“第一”、“第二”、“第三”等的使用仅指示相同要素的不同实例被指代,而非旨在暗指所描述的要素在时间上、空间上、等级上或以任何其他方式必须是给定的顺序。
附图和前面的描述给出实施例的示例。本领域技术人员应理解,所描述要素中的一个或多个可以良好地组合为单个功能要素。替代地,特定要素可以划分为多个功能要素。来自一个实施例的要素可以添加到另一实施例。例如,本文所描述的处理的顺序可以改变,而不限于本文所描述的方式。此外,无需按所示的顺序实现任何流程图的动作;也不一定需要执行所有动作。此外,并非依赖于其他动作的那些动作可以与其他动作并行地得以执行。然而,实施例的范围绝非受限于这些特定示例。无论在说明书中是否明确地给出,大量变形(例如,结构、尺寸和材料用途的差异)都是可能的。实施例的范围至少如所附权利要求所给出的那样宽泛。
实施例可以提供为例如计算机程序产品,其可以包括一个或多个瞬时性或非瞬时性机器可读存储介质,其上存储有机器可执行指令,其当由一个或多个机器(例如,计算机、计算机的网络或其他电子设备)执行时可以使得一个或多个机器执行根据本文所描述的操作。机器可读介质可以包括但不限于软盘、光盘、CD-ROM(压缩盘-只读存储器)以及磁光盘、ROM、RAM、EPROM(可擦除可编程只读存储器)、EEPROM(电可擦除可编程只读存储器)、磁或光卡、闪存、或适合于存储机器可执行指令的其他类型的介质/机器可读介质。
图6示出能够支持以上所讨论的操作的计算环境600的实施例。可以通过包括图5所示的各种不同硬件架构以及形数实现模块和***。
命令执行模块601包括中央处理单元,以缓存和执行命令并且在所示的其他模块与***之间分发任务。它可以包括指令栈、用于存储中间和最终结果的缓存存储器以及用于存储应用和操作***的海量存储器。命令执行模块也可以充当用于***的中央协调和任务分派单元。
屏幕渲染模块621在一个或多个屏幕上绘制对象,以用于用户观看。它可以适于从虚拟对象行为模块604接收数据,如下所述,并且在适当的一个或多个屏幕上渲染虚拟对象以及任何其他对象和力。因此,来自虚拟对象行为模块的数据将确定虚拟对象的位置和动态以及关联手势、力和对象,例如,并且屏幕渲染模块将相应地在屏幕上描述虚拟对象以及关联对象和环境。屏幕渲染模块可以还适于从相邻屏幕透视模块607接收数据,如下所述,如果虚拟对象可以移动到相邻屏幕透视模块关联于的设备的显示器,则描绘用于虚拟对象的目标着陆区域。因此,例如,如果虚拟对象正从主屏幕移动到辅屏幕,则相邻屏幕透视模块2可以将数据发送到屏幕渲染模块,以例如在对用户的手移动或眼移动的该跟踪时以阴影形式暗示用于虚拟对象的一个或多个目标着陆区域。
对象和手势识别模块622可以适于识别和跟踪用户的手和臂姿势。该模块可以用以识别手、手指、手指姿势、手移动以及手相对于显示器的位置。例如,对象和手势识别模块可以例如确定用户作出身体部分手势以将虚拟对象投掷或抛掷到多个屏幕中的一个或另一个上,或用户作出身体部分手势以将虚拟对象移动到多个屏幕中的一个或另一个的边框。对象和手势识别***可以耦合到相机或相机阵列、麦克风或麦克风阵列、触摸屏幕或触摸表面、或指点设备、或这些项的某种组合,以检测来自用户的手势和命令。
对象和手势识别***的触摸屏幕或触摸表面可以包括触摸屏传感器。来自传感器的数据可以馈送到硬件、软件、固件或其组合,以将屏幕或表面上的用户的手的触摸手势映射到虚拟对象的对应动态行为。传感器日期可以用以动量和惯性因子,以允许基于来自用户的手的输入(例如,用户的手指相对于屏幕的扫动速率)的用于虚拟对象的各种动量行为。捏夹手势可以解释为用于从显示屏幕提升虚拟对象或用于开始生成与虚拟对象关联的虚拟绑定或用于在显示器上进行放大或缩小的命令。对象和手势识别***可以使用一个或多个相机生成相似命令,而非借助触摸表面。
关注方向模块623可以装配有相机或其他传感器,以跟踪用户的面部或手的位置或定向。当发出手势或语音命令时,***可以确定用于手势的适当屏幕。在一个示例中,相机安装在每个显示器附近,以检测用户是否正面对该显示器。如果是,则关注方向模块信息提供给对象和手势识别模块622,以确保手势或命令与用于有效显示器的适当库关联。相似地,如果用户并非看着所有屏幕,则可以省略命令。
设备接近度检测模块625可以使用接近度传感器、罗盘、GPS(全球定位***)接收机、个域网无线电以及其他类型的传感器连同三角测量法和其他技术一起确定其他设备的接近度。一旦检测到附近设备,其就可以注册到***,并且其类型可以确定为输入设备或显示设备或二者。对于输入设备,接收到的数据可以于是应用于对象手势和识别模块622。对于显示设备,其可以由相邻屏幕透视模块607考虑。
虚拟对象行为模块604适于从对象速度和方向模块接收输入,并且将该输入应用于显示器中正显示的虚拟对象。因此,例如,对象和手势识别***将解释用户手势,并且通过将所捕获的用户的手的移动映射为识别的移动,虚拟对象***模块将把虚拟对象的位置和移动关联于对象和手势识别***识别的移动,对象和速度和方向模块将捕获虚拟对象的移动的动态,并且虚拟对象行为模块将从对象和速度和方向模块接收输入,以生成将指引虚拟对象的移动以与来自对象和速度和方向模块的输入对应的数据。
虚拟对象***模块606另一方面可以适于基于来自对象和手势识别模块的输入跟踪虚拟对象应位于显示器附近的三维空间中的何处以及用户的哪个身体部分正握持虚拟对象。虚拟对象***模块606可以例如随着虚拟对象穿过屏幕并且在屏幕之间移动而跟踪虚拟对象,并且跟踪用户的哪个身体部分正握持该虚拟对象。跟踪正握持虚拟对象的身体部分允许连续获知身体部分的空中移动,并且因此最终获知虚拟对象是否已经释放到一个或多个屏幕上。
手势到视图和屏幕同步模块608从关注方向模块623接收视图或屏幕或二者的选择,并且在一些情况下,语音命令以确定哪个视图是有效视图以及哪个屏幕是有效屏幕。其然后使得加载相关手势库,以用于对象和手势识别模块622。一个或多个屏幕上的应用的各种视图可以与用于给定视图的替选手势库或一组手势模板关联。
可以包括或耦合到设备接近度检测模块625的相邻屏幕透视模块607可以适于确定一个显示器相对于另一显示器的角度和位置。投影显示器包括例如投影到墙壁或屏幕上的图像。可以例如要么通过红外发射机和接收机要么电磁或光检测感测能力实现用于检测附近屏幕的接近度以及从其投影的对应角度或定向的能力。对于允许具有触摸输入的投影显示器的技术,可以分析到来视频,以确定所投影的显示器的位置并且按某角度校正显示所产生的失真。加速计、磁力计、罗盘或相机可以用以确定正握持设备的角度,而红外发射机和相机可以允许结合相邻设备上的传感器确定屏幕设备的定向。相邻屏幕透视模块607可以以此方式确定相邻屏幕相对于其自身的屏幕坐标的坐标。因此,相邻屏幕透视模块可以确定哪些设备彼此接近以及用于跨屏幕移动一个或多个虚拟对象的其他潜在目标。相邻屏幕透视模块可以还允许将屏幕的位置与表示所有现有对象和虚拟对象的三维空间的模型相关。
对象和速度和方向模块603可以适于通过从虚拟对象***模块接收输入估计正移动的虚拟对象的动态(例如,其轨迹(线性的还是有角度的)、动量(线性还是有角度的)等)。对象和速度和方向模块可以还适于通过例如估计虚拟绑定的加速度、偏转、伸展程度等以及一旦用户的身体部分释放就通过虚拟对象的动态行为估计任何物理力的动态。对象和速度和方向模块也可以使用图像运动、大小和角度改变以估计对象的速度(例如,手和手指的速度)。
动量和惯性模块602可以使用图像平面中或三维空间中的对象的图像运动、图像大小和角度改变来估计空间中或显示器上的对象的速度和方向。动量和惯性模块耦合到对象和手势识别模块622,以估计手、手指以及其他身体部分执行的手势的速度,并且然后将那些估计应用于确定将要受手势影响的虚拟对象的动量和速度。
3D图像交互和效果模块605跟踪用户与显现为延伸出一个或多个屏幕的3D图像的交互。可以连同这些对象对彼此的相对影响一起计算对象在z轴中(朝向以及离开屏幕的平面)的影响。例如,在虚拟对象到达屏幕的平面之前,用户手势所抛掷的对象可以受前景中的3D对象影响。对象可以改变抛射的方向或速度或完全毁灭它。3D图像交互和效果模块可以在显示器中的一个或多个上的前景中渲染对象。如所示,各个组件(例如,组件601、602、603、604、605、606、607和608)经由互连或总线(例如总线609)连接。
以下条款和/或示例属于其他实施例或示例。示例中的细节可以用在一个或多个实施例中的任何地方。不同实施例或示例的各个特征可以与所包括的一些特征以及所排除的其他特征多样地组合,以适于各种不同应用。示例可以包括主题,例如方法、用于执行方法的动作的模块、包括指令的至少一个机器可读介质,所述指令当由机器执行时使得机器执行所述方法或根据本文所描述的实施例和示例的用于促进混合通信的装置或***的动作。
一些实施例属于示例1,包括:一种用于促进声学环境中的声学信号的基于上下文的消除和放大的装置,所述装置包括:检测和识别逻辑,用于检测声学信号源所发射的声学信号;评估、估计和足迹逻辑,用于将所述声学信号分类为紧急声学信号或非紧急声学信号,其中,所述分类基于与所述声学信号关联的足迹或足迹标识(ID);声学信号消除逻辑,用于如果所述声学信号基于所述足迹或所述足迹ID被看作所述非紧急声学信号,则消除所述声学信号;以及声学信号放大逻辑,用于如果所述声学信号基于所述足迹或所述足迹ID被分类为所述紧急声学信号,则放大所述声学信号。
示例2包括如示例1所述的主题,其中,所述足迹包括与所述声学信号有关的描述,其中,所述足迹ID包括映射到所述描述的数字、字母或字符中的一个或多个,其中,所述足迹、足迹ID和所述描述被存储在一个或多个数据库处。
示例3包括如示例1-2所述的主题,其中,所述足迹或所述足迹ID在制造所述声学信号源期间与所述声学信号关联,其中,所述评估、估计和足迹逻辑还用于将所述足迹或所述足迹ID实时分派给所述声学信号。
示例4包括如示例1-3所述的主题,其中,所述评估、估计和足迹逻辑用于:如果所述声学信号未被分派所述足迹或所述足迹ID,则评估所述声学信号,以用于检测与所述声学信号关联的紧急信号,其中,如果发现所述紧急信号与所述声学信号关联,则将所述声学信号看作所述紧急声学信号,并且其中,所述声学信号放大逻辑用于放大基于所述紧急信号被分类为所述紧急声学信号的声学信号,并且其中,所述声学信号消除逻辑用于消除或掩蔽基于所述紧急信号被分类为所述非紧急声学信号的声学信号。
示例5包括如示例1-4所述的主题,其中,所述评估、估计和足迹逻辑用于:如果所述声学信号缺少所述足迹、所述足迹ID和所述紧急信号,则估计与所述声学信号关联的烦扰等级,其中,所述烦扰等级与听力阈值和声压级(SPL)中的至少一个比较,以确定声学信号被看作对人类是可容忍的还是不可容忍的,其中,所述烦扰等级被估计为随时间的SPL动态改变,并且其中,所述声学信号消除逻辑用于:如果所述声学信号基于所述烦扰等级被看作不可容忍的,则消除或掩蔽所述声学信号。
示例6包括如示例1-5所述的主题,还包括通信/兼容性逻辑,用于向声学信号源、所述声学信号源的操作者以及政府官员中的一个或多个发出请求、投诉和报警中的一个或多个,其中,所述声学信号源包括人类、动物、设备、工具、装备、车辆和自然中的一个或多个。
示例7包括如示例1-6所述的主题,其中,所述装置包括一个或多个处理器,其包括图形处理器,所述图形处理器与应用处理器共同位于公共半导体封装上。
一些实施例属于示例8,其包括:一种促进声学环境中的声学信号的基于上下文的消除和放大的方法,所述方法包括:由计算设备的麦克风检测声学信号源所发射的声学信号;将所述声学信号分类为紧急声学信号或非紧急声学信号,其中,所述分类基于与所述声学信号关联的足迹或足迹标识(ID);如果所述声学信号基于所述足迹或所述足迹ID被看作所述非紧急声学信号,则消除所述声学信号;以及如果所述声学信号基于所述足迹或所述足迹ID被分类为所述紧急声学信号,则放大所述声学信号。
示例9包括如示例8所述的主题,其中,所述足迹包括与所述声学信号有关的描述,其中,所述足迹ID包括映射到所述描述的数字、字母或字符中的一个或多个,其中,所述足迹、足迹ID和所述描述被存储在一个或多个数据库处。
示例10包括如示例8-9所述的主题,其中,所述足迹或所述足迹ID在制造所述声学信号源期间与所述声学信号关联,其中,将所述足迹或所述足迹ID实时分派给所述声学信号。
示例11包括如示例8-10所述的主题,还包括:如果所述声学信号未被分派所述足迹或所述足迹ID,则评估所述声学信号,以用于检测与所述声学信号关联的紧急信号,其中,如果发现所述紧急信号与所述声学信号关联,则将所述声学信号看作所述紧急声学信号;放大基于所述紧急信号被分类为所述紧急声学信号的声学信号;以及消除或掩蔽基于所述紧急信号被分类为所述非紧急声学信号的声学信号。
示例12包括如示例8-11所述的主题,还包括:如果所述声学信号缺少所述足迹、所述足迹ID和所述紧急信号,则估计与所述声学信号关联的烦扰等级,其中,所述烦扰等级与听力阈值和声压级(SPL)中的至少一个比较,以确定声学信号看作对人类是可容忍的还是不可容忍的,其中,所述烦扰等级被估计为随时间的SPL动态改变;以及如果所述声学信号基于所述烦扰等级被看作不可容忍的,则消除或掩蔽所述声学信号。
示例13包括如示例8-12所述的主题,还包括:向声学信号源、所述声学信号源的操作者以及政府官员中的一个或多个发出请求、投诉和报警中的一个或多个,其中,所述声学信号源包括人类、动物、设备、工具、装备、车辆和自然中的一个或多个。
示例14包括如示例8-13所述的主题,其中,所述计算设备包括一个或多个处理器,其包括图形处理器,所述图形处理器与应用处理器共同位于公共半导体封装上。
一些实施例属于示例15,其包括:一种数据处理***,其包括计算***,所述计算***具有耦合到处理设备的存储器设备,所述处理设备用于:经由麦克风检测声学信号源所发射的声学信号;将所述声学信号分类为紧急声学信号或非紧急声学信号,其中,所述分类基于与所述声学信号关联的足迹或足迹标识(ID);如果所述声学信号基于所述足迹或所述足迹ID被看作所述非紧急声学信号,则消除所述声学信号;以及如果所述声学信号基于所述足迹或所述足迹ID被分类为所述紧急声学信号,则放大所述声学信号。
示例16包括如示例15所述的主题,其中,所述足迹包括与所述声学信号有关的描述,其中,所述足迹ID包括映射到所述描述的数字、字母或字符中的一个或多个,其中,所述足迹、足迹ID和所述描述被存储在一个或多个数据库处。
示例17包括如示例15-16所述的主题,其中,所述足迹或所述足迹ID在制造所述声学信号源期间与所述声学信号关联,其中,将所述足迹或所述足迹ID实时分派给所述声学信号。
示例18包括如示例15-17所述的主题,其中,所述处理设备还用于:如果所述声学信号未被分派所述足迹或所述足迹ID,则评估所述声学信号,以用于检测与所述声学信号关联的紧急信号,其中,如果发现所述紧急信号与所述声学信号关联,则将所述声学信号看作所述紧急声学信号;放大基于所述紧急信号被分类为所述紧急声学信号的声学信号;以及消除或掩蔽基于所述紧急信号被分类为所述非紧急声学信号的声学信号。
示例19包括如示例15-17所述的主题,其中,所述处理设备还用于:如果所述声学信号缺少所述足迹、所述足迹ID和所述紧急信号,则估计与所述声学信号关联的烦扰等级,其中,所述烦扰等级与听力阈值和声压级(SPL)中的至少一个比较,以确定声学信号看作对人类是可容忍的还是不可容忍的,其中,所述烦扰等级被估计为随时间的SPL动态改变;以及如果所述声学信号基于所述烦扰等级看作不可容忍的,则消除或掩蔽所述声学信号。
示例20包括如示例15-19所述的主题,其中,所述处理设备还用于:向声学信号源、所述声学信号源的操作者以及政府官员中的一个或多个发出请求、投诉和报警中的一个或多个,其中,所述声学信号源包括人类、动物、设备、工具、装备、车辆和自然中的一个或多个。
示例21包括如示例15-20所述的主题,其中,所述处理设备包括图形处理器,所述图形处理器与应用处理器共同位于公共半导体封装上。
一些实施例属于示例22,其包括:一种用于促进声学环境中的声学信号的基于上下文的消除和放大的装置,所述装置包括:用于经由麦克风检测声学信号源所发射的声学信号的模块;用于将所述声学信号分类为紧急声学信号或非紧急声学信号的模块,其中,所述分类基于与所述声学信号关联的足迹或足迹标识(ID);用于如果所述声学信号基于所述足迹或所述足迹ID被看作所述非紧急声学信号则消除所述声学信号的模块;以及用于如果所述声学信号基于所述足迹或所述足迹ID被分类为所述紧急声学信号则放大所述声学信号的模块。
示例23包括如示例22所述的主题,其中,所述足迹包括与所述声学信号有关的描述,其中,所述足迹ID包括映射到所述描述的数字、字母或字符中的一个或多个,其中,所述足迹、足迹ID和所述描述被存储在一个或多个数据库处。
示例24包括如示例22-23所述的主题,其中,所述足迹或所述足迹ID在制造所述声学信号源期间与所述声学信号关联,其中,将所述足迹或所述足迹ID实时分派给所述声学信号。
示例25包括如示例22-24所述的主题,还包括:用于如果所述声学信号未被分派所述足迹或所述足迹ID则评估所述声学信号以用于检测与所述声学信号关联的紧急信号的模块,其中,如果发现所述紧急信号与所述声学信号关联,则将所述声学信号看作所述紧急声学信号;用于放大基于所述紧急信号被分类为所述紧急声学信号的声学信号的模块;以及用于消除或掩蔽基于所述紧急信号被分类为所述非紧急声学信号的声学信号的模块。
示例26包括如示例22-25所述的主题,还包括:用于如果所述声学信号缺少所述足迹、所述足迹ID和所述紧急信号则估计与所述声学信号关联的烦扰等级的模块,其中,所述烦扰等级与听力阈值和声压级(SPL)中的至少一个比较,以确定声学信号看作对人类是可容忍的还是不可容忍的,其中,所述烦扰等级被估计为随时间的SPL动态改变;以及用于如果所述声学信号基于所述烦扰等级被看作不可容忍的则消除或掩蔽所述声学信号的模块。
示例27包括如示例22-26所述的主题,还包括:用于向声学信号源、所述声学信号源的操作者以及政府官员中的一个或多个发出请求、投诉和报警中的一个或多个的模块,其中,所述声学信号源包括人类、动物、设备、工具、装备、车辆和自然中的一个或多个。
示例28包括如示例22-27所述的主题,其中,所述装置包括一个或多个处理器,其包括图形处理器,所述图形处理器与应用处理器共同位于公共半导体封装上。
示例29包括至少一种非瞬时性或有形机器可读介质,包括多个指令,其当在计算设备上执行时用于实现或执行如示例8-14中任一项所述的方法。
示例30包括至少一种机器可读介质,包括多个指令,其当在计算设备上执行时用于实现或执行如示例8-14中任一项所述的方法。
示例31包括一种***,包括用于实现或执行如示例8-14中任一项所述的方法的机构。
示例32包括一种装置,包括用于执行如示例8-14中任一项所述的方法的模块。
示例33包括一种计算设备,被布置为实现或执行如示例8-14中任一项所述的方法。
示例34包括一种通信设备,被布置为实现或执行如示例8-14中任一项所述的方法。
示例35包括至少一种机器可读介质,包括多个指令,其当在计算设备上执行时用于实现或执行如任何前述示例所述的方法或实现如任何前述示例所述的装置。
示例36包括至少一种非瞬时性或有形机器可读介质,包括多个指令,其当在计算设备上执行时用于实现或执行如任何前述示例所述的方法或实现如任何前述示例所述的装置。
示例37包括一种***,包括用于实现或执行如任何前述示例中所述的方法或实现如任何前述示例中所述的装置的机构。
示例38包括一种装置,包括用于执行如任何前述示例中所述的方法的模块。
示例39包括一种计算设备,被布置为实现或执行如任何前述示例中所述的方法或实现如任何前述示例中所述的装置。
示例40包括一种通信设备,被布置为实现或执行如任何前述示例中所述的方法或实现如任何前述示例中所述的装置。
附图和前面的描述给出实施例的示例。本领域技术人员应理解,所描述要素中的一个或多个可以良好地组合为单个功能要素。替代地,特定要素可以划分为多个功能要素。来自一个实施例的要素可以添加到另一实施例。例如,本文所描述的处理的顺序可以改变,而不限于本文所描述的方式。此外,无需按所示的顺序实现任何流程图的动作;也不一定需要执行所有动作。此外,并非依赖于其他动作的那些动作可以与其他动作并行地得以执行。然而,实施例的范围绝非受限于这些特定示例。无论在说明书中是否明确地给出,大量变形(例如,结构、尺寸和材料用途的差异)都是可能的。实施例的范围至少如所附权利要求所给出的那样宽泛。

Claims (19)

1.一种用于促进声学环境中的声学信号的基于上下文的消除和放大的装置,所述装置包括:
检测和识别逻辑,用于:检测声学信号源所发射的声学信号;
评估、估计和足迹逻辑,用于:将所述声学信号分类为紧急声学信号或非紧急声学信号,其中,所述分类基于与所述声学信号关联的足迹或足迹标识(ID);
声学信号消除逻辑,用于:如果所述声学信号基于所述足迹或所述足迹ID被看作所述非紧急声学信号,则消除所述声学信号;以及
声学信号放大逻辑,用于:如果所述声学信号基于所述足迹或所述足迹ID被分类为所述紧急声学信号,则放大所述声学信号。
2.如权利要求1所述的装置,其中,所述足迹包括与所述声学信号有关的描述,其中,所述足迹ID包括映射到所述描述的数字、字母或字符中的一个或多个,其中,所述足迹、足迹ID和所述描述被存储在一个或多个数据库处。
3.如权利要求2所述的装置,其中,所述足迹或所述足迹ID在制造所述声学信号源期间与所述声学信号关联,其中,所述评估、估计和足迹逻辑还用于:将所述足迹或所述足迹ID实时分派给所述声学信号。
4.如权利要求1所述的装置,其中,所述评估、估计和足迹逻辑用于:如果所述声学信号未被分派所述足迹或所述足迹ID,则评估所述声学信号,以用于检测与所述声学信号关联的紧急信号,其中,如果发现所述紧急信号与所述声学信号关联,则将所述声学信号看作所述紧急声学信号,并且
其中,所述声学信号放大逻辑用于:放大基于所述紧急信号被分类为所述紧急声学信号的声学信号,并且
其中,所述声学信号消除逻辑用于:消除或掩蔽基于所述紧急信号被分类为所述非紧急声学信号的声学信号。
5.如权利要求1所述的装置,其中,所述评估、估计和足迹逻辑用于:如果所述声学信号缺少所述足迹、所述足迹ID和所述紧急信号,则估计与所述声学信号关联的烦扰等级,其中,所述烦扰等级与听力阈值和声压级(SPL)中的至少一个比较,以确定声学信号被看作对人类是可容忍的还是不可容忍的,其中,所述烦扰等级被估计为随时间的SPL动态改变,并且
其中,所述声学信号消除逻辑用于:如果所述声学信号基于所述烦扰等级被看作不可容忍的,则消除或掩蔽所述声学信号。
6.如权利要求1所述的装置,还包括:通信/兼容性逻辑,用于向声学信号源、所述声学信号源的操作者以及政府官员中的一个或多个发出请求、投诉和报警中的一个或多个,其中,所述声学信号源包括人类、动物、设备、工具、装备、车辆和自然中的一个或多个。
7.如权利要求1所述的装置,其中,所述装置包括一个或多个处理器,所述处理器包括图形处理器,所述图形处理器与应用处理器共同位于公共半导体封装上。
8.一种用于促进声学环境中的声学信号的基于上下文的消除和放大的方法,所述方法包括:
由计算设备的麦克风检测声学信号源所发射的声学信号;
将所述声学信号分类为紧急声学信号或非紧急声学信号,其中,所述分类基于与所述声学信号关联的足迹或足迹标识(ID);
如果所述声学信号基于所述足迹或所述足迹ID被看作所述非紧急声学信号,则消除所述声学信号;以及
如果所述声学信号基于所述足迹或所述足迹ID被分类为所述紧急声学信号,则放大所述声学信号。
9.如权利要求8所述的方法,其中,所述足迹包括与所述声学信号有关的描述,其中,所述足迹ID包括映射到所述描述的数字、字母或字符中的一个或多个,其中,所述足迹、足迹ID和所述描述被存储在一个或多个数据库处。
10.如权利要求9所述的方法,其中,所述足迹或所述足迹ID在制造所述声学信号源期间与所述声学信号关联,其中,将所述足迹或所述足迹ID实时分派给所述声学信号。
11.如权利要求8所述的方法,还包括:
如果所述声学信号未被分派所述足迹或所述足迹ID,则评估所述声学信号,以用于检测与所述声学信号关联的紧急信号,其中,如果发现所述紧急信号与所述声学信号关联,则将所述声学信号看作所述紧急声学信号;
放大基于所述紧急信号被分类为所述紧急声学信号的声学信号;以及
消除或掩蔽基于所述紧急信号被分类为所述非紧急声学信号的声学信号。
12.如权利要求8所述的方法,还包括:
如果所述声学信号缺少所述足迹、所述足迹ID和所述紧急信号,则估计与所述声学信号关联的烦扰等级,其中,所述烦扰等级与听力阈值和声压级(SPL)中的至少一个比较,以确定声学信号被看作对人类是可容忍的还是不可容忍的,其中,所述烦扰等级被估计为随时间的SPL动态改变;以及
如果所述声学信号基于所述烦扰等级被看作不可容忍的,则消除或掩蔽所述声学信号。
13.如权利要求8所述的方法,还包括:
向声学信号源、所述声学信号源的操作者以及政府官员中的一个或多个发出请求、投诉和报警中的一个或多个,其中,所述声学信号源包括人类、动物、设备、工具、装备、车辆和自然中的一个或多个。
14.如权利要求8所述的方法,其中,所述计算设备包括一个或多个处理器,所述处理器包括图形处理器,所述图形处理器与应用处理器共同位于公共半导体封装上。
15.至少一种机器可读介质,包括多个指令,所述指令当在计算设备上执行时用于实现或执行如权利要求8-14中任一项所述的方法。
16.一种***,包括用于实现或执行如权利要求8-14中任一项所述的方法的机构。
17.一种装置,包括用于执行如权利要求8-14中任一项所述的方法的模块。
18.一种计算设备,被布置为实现或执行如权利要求8-14中任一项所述的方法。
19.一种通信设备,被布置为实现或执行如权利要求8-14中任一项所述的方法。
CN201811581209.6A 2017-12-27 2018-12-24 声学环境中的声学信号的基于上下文的消除和放大 Pending CN110033783A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US15/855,169 2017-12-27
US15/855,169 US10339913B2 (en) 2017-12-27 2017-12-27 Context-based cancellation and amplification of acoustical signals in acoustical environments

Publications (1)

Publication Number Publication Date
CN110033783A true CN110033783A (zh) 2019-07-19

Family

ID=65038903

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811581209.6A Pending CN110033783A (zh) 2017-12-27 2018-12-24 声学环境中的声学信号的基于上下文的消除和放大

Country Status (3)

Country Link
US (1) US10339913B2 (zh)
CN (1) CN110033783A (zh)
DE (1) DE102018130115B4 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114501236A (zh) * 2022-01-25 2022-05-13 中核安科锐(天津)医疗科技有限责任公司 降噪拾音设备和降噪拾音方法

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10909847B1 (en) * 2018-09-19 2021-02-02 All Turtles Corporation Building urban area noise pollution maps and mitigating noise from emergency vehicles
EP3963581A4 (en) * 2019-05-01 2022-12-14 Harman International Industries, Incorporated ACTIVE OPEN NOISE CANCELLATION SYSTEM
US20220208189A1 (en) * 2019-05-08 2022-06-30 Sony Group Corporation Information processing device and information processing method
US10964304B2 (en) * 2019-06-20 2021-03-30 Bose Corporation Instability mitigation in an active noise reduction (ANR) system having a hear-through mode
US11687778B2 (en) 2020-01-06 2023-06-27 The Research Foundation For The State University Of New York Fakecatcher: detection of synthetic portrait videos using biological signals
JP2021113888A (ja) * 2020-01-17 2021-08-05 Tvs Regza株式会社 環境音出力装置、システム、方法およびプログラム
US20200184987A1 (en) * 2020-02-10 2020-06-11 Intel Corporation Noise reduction using specific disturbance models
DE102020107775A1 (de) 2020-03-20 2021-09-23 Bayerische Motoren Werke Aktiengesellschaft Erkennung und Interpretation akustischer Signale und Ereignisse im Fahrzeugaußen- und/oder Innenraum
TWI749623B (zh) * 2020-07-07 2021-12-11 鉭騏實業有限公司 遠端警示音源之探取裝置及其方法
CN113411276B (zh) * 2021-06-21 2022-04-08 电子科技大学 用于异步认知物联网的时间结构干扰消除方法
FR3138592A1 (fr) * 2022-07-28 2024-02-02 Uss Sensivic Procédé de traitement en temps réel d'un signal sonore et dispositif de captation de signal sonore

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20010046304A1 (en) * 2000-04-24 2001-11-29 Rast Rodger H. System and method for selective control of acoustic isolation in headsets
US20020141599A1 (en) 2001-04-03 2002-10-03 Philips Electronics North America Corp. Active noise canceling headset and devices with selective noise suppression
US20080130908A1 (en) * 2006-12-05 2008-06-05 Searete Llc, A Limited Liability Corporation Of The State Of Delaware Selective audio/sound aspects
US9544692B2 (en) * 2012-11-19 2017-01-10 Bitwave Pte Ltd. System and apparatus for boomless-microphone construction for wireless helmet communicator with siren signal detection and classification capability
US9171450B2 (en) * 2013-03-08 2015-10-27 Qualcomm Incorporated Emergency handling system using informative alarm sound
US9716939B2 (en) 2014-01-06 2017-07-25 Harman International Industries, Inc. System and method for user controllable auditory environment customization

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114501236A (zh) * 2022-01-25 2022-05-13 中核安科锐(天津)医疗科技有限责任公司 降噪拾音设备和降噪拾音方法

Also Published As

Publication number Publication date
DE102018130115A1 (de) 2019-06-27
US20190035381A1 (en) 2019-01-31
DE102018130115B4 (de) 2024-03-28
US10339913B2 (en) 2019-07-02

Similar Documents

Publication Publication Date Title
CN110033783A (zh) 声学环境中的声学信号的基于上下文的消除和放大
US11010601B2 (en) Intelligent assistant device communicating non-verbal cues
CN109658435A (zh) 用于视频捕获和创建的无人机云
US11127210B2 (en) Touch and social cues as inputs into a computer
US10542118B2 (en) Facilitating dynamic filtering and local and/or remote processing of data based on privacy policies and/or user preferences
CN105378801B (zh) 全息图快照网格
CN109840586A (zh) 自主机器中对有问题的传感器的基于深度学习的实时检测和校正
US9390561B2 (en) Personal holographic billboard
US9153195B2 (en) Providing contextual personal information by a mixed reality device
TWI581178B (zh) 混合實境顯示器中使用者控制的真實物件的消失
CN102708120B (zh) 生活流式传输
US10438588B2 (en) Simultaneous multi-user audio signal recognition and processing for far field audio
US20130177296A1 (en) Generating metadata for user experiences
US20190156558A1 (en) Virtual reality system
US10440497B2 (en) Multi-modal dereverbaration in far-field audio systems
US20180309955A1 (en) User interest-based enhancement of media quality
CN107211226A (zh) 具有远程扬声器的空间音频
KR20160113666A (ko) 오디오 탐색 지원
CN110010152A (zh) 针对多设备***中的改进的自动语音识别的可靠混响估计
EP4254353A1 (en) Augmented reality interaction method and electronic device
CN107111363B (zh) 用于监视的方法、装置和***
US20210374615A1 (en) Training a Model with Human-Intuitive Inputs
US10244013B2 (en) Managing drop-ins on focal points of activities
US20230199297A1 (en) Selectively using sensors for contextual data
CN111982293B (zh) 体温测量方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination