CN116803100A - 用于具有anc的耳机的方法和*** - Google Patents
用于具有anc的耳机的方法和*** Download PDFInfo
- Publication number
- CN116803100A CN116803100A CN202180090307.3A CN202180090307A CN116803100A CN 116803100 A CN116803100 A CN 116803100A CN 202180090307 A CN202180090307 A CN 202180090307A CN 116803100 A CN116803100 A CN 116803100A
- Authority
- CN
- China
- Prior art keywords
- vad flag
- vad
- flag
- snr
- anc
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 70
- 238000001514 detection method Methods 0.000 claims abstract description 44
- 230000007704 transition Effects 0.000 claims abstract description 28
- 230000000694 effects Effects 0.000 claims abstract description 13
- 238000010586 diagram Methods 0.000 description 20
- 230000006870 function Effects 0.000 description 7
- 230000007246 mechanism Effects 0.000 description 6
- 230000008901 benefit Effects 0.000 description 4
- 210000000613 ear canal Anatomy 0.000 description 4
- 238000004590 computer program Methods 0.000 description 3
- 208000032370 Secondary transmission Diseases 0.000 description 2
- 210000000988 bone and bone Anatomy 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000002238 attenuated effect Effects 0.000 description 1
- 230000001815 facial effect Effects 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R1/00—Details of transducers, loudspeakers or microphones
- H04R1/10—Earpieces; Attachments therefor ; Earphones; Monophonic headphones
- H04R1/1041—Mechanical or electronic switches, or control elements
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/165—Management of the audio stream, e.g. setting of volume, audio stream path
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2460/00—Details of hearing devices, i.e. of ear- or headphones covered by H04R1/10 or H04R5/033 but not provided for in any of their subgroups, or of hearing aids covered by H04R25/00 but not provided for in any of its subgroups
- H04R2460/01—Hearing devices using active noise cancellation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Headphones And Earphones (AREA)
Abstract
本公开提供了一种用于具有主动噪声消除(ANC)的耳机的方法和***。耳机可包括至少一个前馈传声器和至少一个反馈传声器或传感器。方法包括从耳机的反馈传声器或传感器接收反馈信号;基于所接收的反馈信号来确定反馈(FB)语音活动检测(VAD)标志;基于所确定的FB VAD标志的值来生成控制信号;以及基于控制信号来自动调整耳机在ANC模式与通透模式之间的转换。
Description
技术领域
本公开涉及一种用于具有主动噪声消除(ANC)的耳机的方法和***,并且具体地涉及一种用于对具有ANC的耳机进行基于混合VAD的智能环境声音控制的方法和***。
背景技术
耳机产品被广泛使用,这些耳机产品中最流行的类型是入耳式、挂耳式和头戴式。随着人们关注噪声对个人健康的影响,具有ANC的耳机在消费市场上变得流行。如果耳机装配有ANC***,则该耳机可以显著减小低频噪声,这为用户创造了安静的环境,但同时引起了不方便的问题,尤其是在佩戴耳机(headphone)/入耳式耳机(earphone)/耳塞(earbud)的用户需要注意环境声音的一些场景中。例如,在对话场景中,用户必须在与他人交谈之前摘下耳机,因为ANC***消除了环境声音中的人类话音,并且降低了对话中的话音清晰度。
因此,有必要提供改进的技术,以使得用户能够获得良好的听觉效果以及方便的体验。
发明内容
根据本公开的一个或多个实施方案,提供了一种用于具有ANC的耳机的方法。所述耳机可以包括至少一个前馈传声器和至少一个反馈传声器或传感器。所述方法可以包括:从耳机的反馈传声器或传感器接收反馈信号;基于所接收的反馈信号来确定反馈(FB)语音活动检测(VAD)标志;基于所确定的FB VAD标志的值来生成控制信号;以及基于控制信号来自动调整耳机在ANC模式与通透模式之间的转换。根据一个或多个实施方案,所述方法还可以包括从耳机的前馈传声器接收前馈信号;基于所接收的反馈信号来确定前馈(FF)语音活动检测(VAD)标志;以及基于FF VAD标志和FB VAD标志来确定组合VAD标志。
根据本公开的一个或多个实施方案,提供了一种用于具有ANC的耳机的***。所述耳机可以包括至少一个前馈传声器和至少一个反馈传声器或传感器。所述***可以包括处理器。所述处理器可以被配置成:从耳机的反馈传声器或传感器接收反馈信号;基于所接收的反馈信号来确定反馈(FB)语音活动检测(VAD)标志;基于所确定的FB VAD标志的值来生成控制信号;以及基于控制信号来自动调整耳机在ANC模式与通透模式之间的转换。根据一个或多个实施方案,所述处理器可以被进一步配置成:从耳机的前馈传声器接收前馈信号;基于所接收的反馈信号来确定前馈(FF)语音活动检测(VAD)标志;以及基于FF VAD标志和FB VAD标志来确定组合VAD标志。
本公开中描述的***和方法可以基于对用户语音的存在或不存在的估计而自动调整耳机的ANC模块、功能或操作,这给用户带来了更方便的使用体验。此外,本公开的方法和***所提供的VAD检测机制可以提高在嘈杂环境中对用户语音的判断准确度。另外,本公开的方法和***可以使耳机在不同操作模式之间(诸如在ANC模式与通透模式之间)相对平滑地切换,并且改善了用户的听感体验。
附图说明
图1示出了根据本公开的一个或多个实施方案的示意图。
图2示出了根据本公开的一个或多个实施方案的示意图。
图3示出了根据本公开的一个或多个实施方案的对应于图2的VAD机制的示意图。
图4示出了根据本公开的一个或多个实施方案的方法的流程图。
图5示出了根据本公开的一个或多个实施方案的方法的流程图。
图6示出了根据本公开的一个或多个实施方案的方法的流程图。
图7示出了根据本公开的一个或多个实施方案的方法的流程图。
图8示出了根据本公开的一个或多个实施方案的方法的流程图。
图9示出了根据本公开的一个或多个实施方案的方法的流程图。
为有助于理解,已尽可能使用相同的附图标号来指代附图中通用的相同元件。可设想,一个实施方案中公开的元件可在无需特别指明的情况下有利地在另一个实施方案中使用。这里所指的附图不应理解成按比例绘制的,除非特别注明。而且,为了清除地说明和解释,通常将附图简化并将细节或部件省略。附图和讨论用于解释下面讨论的原理,其中相同的名称表示相同的元件。
具体实施方式
下面将提供示例进行说明。对各种示例的描述将出于说明目的而呈现,而非旨在详尽或限于所公开的实施方案。在不脱离所描述的实施方案的范围和精神的情况下,许多修改和变化对于本领域普通技术人员来说是显而易见的。
图1示出了根据本公开的一个或多个实施方案的一般操作概念的示意图。通常,在正常环境中,包括人类话音和背景噪声的环境声音存在于用户周围。耳机中的ANC模块、功能或操作可以反转环境声音信号的相位,随后使用相位反转的信号来消除噪声。本公开中的术语“耳机”可以包括入耳耳机(in-ear headphone)、挂耳耳机(on-ear headphone)、头戴耳机(over-the ear headphone),并且可以由词语“入耳式耳机”、“耳塞”或“头戴式耳机”等效地代替。耳机可以是无线或有线耳机。
在一般概念中,本公开提供了一种方法和***,其可以基于对用户语音的存在和不存在的估计来调整耳机的ANC模块、功能或操作,用户语音由佩戴耳机并且正在说话的人产生。出于简单解释的目的,图1示出了一种操作场景,其中可以采用语音活动检测(VAD)模块、功能或技术来检测用户语音,并且检测结果可用于调整耳机的ANC。常规VAD***在安静的环境中工作,但在SNR(信噪比)下降的嘈杂环境中较困难。本公开提供的方法和***在耳机中包含附加的传声器和/或传感器(为简单起见,图1仅示出了传感器),以使用附加的次级传输路径来捕获用户语音。附加传声器和/或传感器可以布置在耳机的面向耳道并靠近耳道的一侧。附加传声器是但不限于作为ANC***的一部分的反馈传声器。附加传感器是但不限于加速度计、骨传导传感器或其他通用振动传感器。使用本公开的方法和***,可以增加信号的SNR,因为耳道可以耦接到用户语音的除了声学路径之外的附加次级传输路径,同时耳道中的噪声已通过ANC衰减。由于SNR增加,因而即使在嘈杂环境中,VAD***的检测结果的准确度也可以提高。
随后,例如,如果检测结果指示用户语音是活跃的,则可以生成控制信号以将耳机从ANC模式切换到通透模式来操作,该通透模式完全或部分地允许环境声音到达用户耳朵。这意味着耳机的操作模式可以从ANC模式转换到通透模式。此外,例如,如果用户停止说话达一段时间,则检测结果指示用户语音不活跃,则可以生成控制信号以将耳机从通透模式切换到ANC模式来操作,在该ANC模式中,可以消除或减小环境声音。
图2示出了根据本公开的另一个或多个实施方案的另一一般操作概念的示意图。如可以注意到,图2与图1的不同之处在于,VAD检测是基于附加的传声器和/或传感器的输入以及来自至少一个传声器(诸如前馈传声器)的输入两者。在图2中,从用户到VAD的箭头可以理解为从前馈传声器到VAD的输入。下文将参考图3描述关于其VAD检测机制的细节。
图3示出了根据本公开的一个或多个实施方案的对应于图2的VAD检测机制的示意图。如图3中所示,耳机可以包括前馈传声器(FF mic)和反馈传声器(FB mic)。图3仅示出一个示例,以用于说明VAD检测机制的原理。本领域的普通技术人员将理解,在实践时可以布置多于一个FF传声器和多于一个FB传声器,并且FB传声器可以由传感器代替或者与传感器组合。传感器可以包括但不限于加速度计、骨传导传感器、其他通用振动传感器或它们的组合。FF传声器布置在耳机的朝向外部环境的一侧,并且FB传声器布置在耳机的面向并靠近耳道的一侧。
当用户正在说话时,FF传声器和FB传声器都可以分别捕获用户语音作为FF信号和FB信号。随后,可以基于来自FF传声器的FF信号以及来自FB传声器的FB信号来分别执行FFVAD检测和FB VAD检测。可以获得FF VAD标志和FB VAD标志作为FF VAD检测和FB VAD检测的结果。FF VAD标志和FB VAD标志分别基于FF信号和FB信号来指示佩戴耳机的用户正在说话的可能性。基于FF VAD标志和FB VAD标志,可以将组合VAD确定为指示佩戴耳机的用户正在说话的可能性的最终检测结果。根据由组合VAD标志指示的最终检测结果,生成控制信号以自动调整ANC模式与通透模式之间的转换。可以一起或分别对FF传声器和FB传声器执行调整。例如,根据控制信号,可以针对FF传声器和FB传声器两者关闭ANC模块/功能/操作(下文中简称为ANC),即从ANC模式到通透模式的转换。因此,环境声音可以被传递给用户。例如,根据另一控制信号,可以仅针对FF传声器关闭ANC,并且可以将FB的ANC维持在开启状态。例如,根据另一控制信号,可以针对FF传声器关闭ANC,并且可以针对FB传声器以特定比率关闭ANC。在相反的转换中,即在从通透模式到ANC模式的转换中,也可以分别针对FF传声器和FB传声器执行调整。
图4示出了根据本公开的一个或多个实施方案的用于控制具有ANC的耳机的方法的流程图,该流程图也可以结合图1来理解。
如图4中所示的方法,在S401处,从耳机的反馈(FB)传声器和/或传感器接收FB信号。例如,FB信号可以包括由FB传声器捕获的声音和/或由传感器捕获的振动。
在S402处,可以基于所接收的FB信号,例如基于所接收的FB信号的SNR来确定FBVAD标志。FB VAD标志可以是值大于或等于0且小于或等于1的变量,并且表示佩戴耳机的用户正在说话的可能性。如果FB VAD标志被确定为0,则检测结果指示用户语音不存在,即佩戴耳机的用户没有说话。如果FB VAD标志被确定为1,则检测结果指示用户语音存在,即佩戴耳机的用户正在说话。如果FB VAD标志被确定为0与1之间的值,则检测结果指示用户语音存在的可能性。
在S403处,基于所确定的FB VAD标志的值来生成对应控制信号。在S404处,根据控制信号,可以执行对应调整。例如,如果FB VAD标志指示用户语音存在,则执行从ANC模式到通透模式的转换。ANC可以完全或部分关闭,使得用户可以听到环境声音。在此调整之后,如果FB VAD标志变为0,这指示用户语音不存在,则执行从通透模式到ANC模式的转换,即开启ANC。
图5示出了根据本公开的另一个或多个实施方案的用于控制具有ANC的耳机的方法的流程图,该流程图也可以结合图2至图3来理解。
如图5中示出的方法,在S501处,从耳机的前馈(FF)传声器接收FF信号。例如,FF信号可以包括由FF传声器捕获的声音。在S502处,从耳机的反馈(FB)传声器或传感器接收FB信号。例如,FB信号可以包括由FB传声器捕获的声音和/或由传感器捕获的振动。
在S503处,可以基于所接收的FF信号,例如基于所接收的FF信号的SNR来确定FFVAD标志。FF VAD标志指示检测结果,该检测结果可以是值大于或等于0且小于或等于1的变量,并且该FF VAD标志表示佩戴耳机的用户正在说话的可能性。如果FF VAD标志被确定为0,则检测结果指示用户语音不存在,即佩戴耳机的用户没有说话。如果FF VAD标志被确定为1,则检测结果指示用户语音存在,即佩戴耳机的用户正在说话。如果FF VAD标志被确定为0与1之间的值,则检测结果指示用户语音存在的可能性。
在S504处,可以基于所接收的FB信号,例如基于所接收的FB信号的SNR来确定FBVAD标志。FB VAD标志可以是值大于或等于0且小于或等于1的变量,并且表示佩戴耳机的用户正在说话的可能性。如果FB VAD标志被确定为0,则检测结果指示用户语音不存在,即佩戴耳机的用户没有说话。如果FB VAD标志被确定为1,则检测结果指示用户语音存在,即佩戴耳机的用户正在说话。如果FB VAD标志被确定为0与1之间的值,则检测结果指示用户语音存在的可能性。
可以理解,SNR是表征传声器信号的度量的一个示例,而没有特定限制,可表征传声器信号的任何其他度量(诸如信号的幅度、信号的能量、信号的频率响应等)都可以用于本文公开的***或方法中。
在S505处,可以基于FB VAD标志和FF VAD标志来确定组合VAD标志。组合VAD标志表示最终VAD检测结果。另外,组合VAD标志可以是值大于或等于0且小于或等于1的变量,并且表示佩戴耳机的用户正在说话的可能性。如果组合VAD标志被确定为0,则最终检测结果指示用户语音不存在,即佩戴耳机的用户没有说话。如果组合VAD标志被确定为1,则检测结果指示用户语音存在,即佩戴耳机的用户正在说话。如果组合VAD标志被确定为0与1之间的值,则检测结果指示用户语音存在的可能性。
在S506处,基于所确定的组合VAD标志的值来生成对应控制信号。在S507处,根据控制信号,可以执行对应调整。例如,如果组合VAD标志指示用户语音存在,则执行从ANC模式到通透模式的转换。ANC可以完全或部分关闭,使得用户可以听到环境声音。在此调整之后,如果组合VAD标志变为0,这指示用户语音不存在,则执行从通透模式到ANC模式的转换,即开启ANC。
图6示出了根据本公开的一个或多个实施方案的方法的流程图,该流程图示出了如何确定FF VAD标志。在S601处,计算来自FF传声器的FF信号的SNR。如上所述,FF传声器可以捕获用户语音和环境声音,其中环境声音可以被视为相对于用户语音的噪声。因此,FF信号的所计算的SNR可以是用于确定佩戴耳机的用户是否正在说话以及/或者用于确定用户语音存在的可能性的度量。
可以设置针对FF信号的SNR的预定阈值区间,该预定阈值区间由高阈值THH和低阈值THL限定。与单个阈值相比,使用阈值区间可以提高容错率,并且减少误判。在S602处,将FF信号的SNR与高阈值进行比较。如果SNR大于或等于高阈值THH,则流程进行到S603,其中将FF VAD标志设置为1。如果不是,则该方法进行到S604。
在S604处,将FF信号的SNR与低阈值THL进行比较。如果SNR小于或等于低阈值,则该方法进行到S605,其中将FF VAD标志设置为0。如果不是,则该方法进行到S606,其中将FFVAD标志设置为0与1之间的值。标志的值越接近1,用户正在说话的可能性越高,并且标志的值越接近0,用户正在说话的可能性越低。
图7示出了根据本公开的一个或多个实施方案的方法的流程图,该流程图示出了如何确定FB VAD标志。在S701处,计算来自FB传声器的FB信号的SNR。如上文所描述,FB传声器可以捕获用户语音和环境声音中的一些环境声音,其中环境声音可以被视为相对于用户语音的噪声。因此,FB信号的所计算的SNR可以是用于确定佩戴耳机的用户是否正在说话以及/或者用于确定用户语音存在的可能性的度量。
可以设置针对FB信号的SNR的预定阈值区间,该预定阈值区间由高阈值THH和低阈值THL限定。与单个阈值相比,使用阈值区间可以提高容错率,并且减少误判。在S702处,将FB信号的SNR与高阈值进行比较。如果SNR大于或等于高阈值,则该方法进行到S703,其中将FB VAD标志设置为1。如果不是,则该方法进行到S704。
在S704处,将FF信号的SNR与低阈值进行比较。如果SNR小于或等于低阈值,则该方法进行到S705,其中将FF VAD标志设置为0。如果不是,则该方法进行到S706,其中将FF VAD标志设置为0与1之间的值。标志的值越接近1,用户正在说话的可能性越高,并且标志的值越接近0,用户正在说话的可能性越低。
根据一个实施方案,针对FF信号的SNR的阈值区间可以与针对FB信号的SNR的阈值区间相同。根据另一实施方案,针对FF信号的SNR的阈值区间可以不同于针对FB信号的SNR的阈值区间。考虑到与FF信号相比,FB信号受噪声的影响相对较小,因此FB信号的低阈值和高阈值可以分别被设置为高于FB信号的低阈值和高阈值。这样做的优点是可以进一步减少由用户非语音声音或面部动作造成的误判。
图8示出了根据本公开的一个或多个实施方案的方法的流程图,该流程图示出了如何基于FF VAD标志和FB VAD标志来确定组合VAD标志。
在S801处,可以如参考图6和图7所描述的那样来获得FF VAD标志和FB VAD标志。在S802处,该方法确定FF VAD标志和FB VAD标志的值是否都为0。如果是,则该方法进行到S803。在S803处,将组合VAD标志设置为0。如果不是,则该方法进行到S804。在S804处,该方法确定FF VAD标志和FB VAD标志的值是否都为1。如果是,则该方法进行到S805。在S805处,将组合VAD标志设置为1。如果不是,则该方法进行到S806。
在S806处,基于FF VAD标志的值和FB VAD标志的值使用权重参数来计算组合VAD标志,诸如使用以下等式:
组合VAD标志=α*FB VAD标志+(1-α)*FF VAD标志
其中α是与FB信号的SNR相关的权重参数,并且是0与1之间的值。例如,α值随着FB信号的SNR的增大而增大。替代地,α值可以取决于表示环境的噪声水平的噪声比。α值随着噪声比的增大而增大。例如,如果环境更嘈杂,则基于FB信号的VAD检测结果更可靠。随后,α值应被选择为更大的值,即更接近1的值。替代地,α值可以进一步取决于FB信号的SNR与噪声比的组合。
在确定组合VAD标志后,生成对应的控制信号来调整耳机的ANC。图9示出了根据本公开的一个或多个实施方案的方法的流程图,该流程图示出了如何基于组合VAD标志来调整ANC。
如果确定了组合VAD标志,如在S901处示出,则该方法进行到S902。在S902处,该方法确定组合VAD标志是否等于1。如果该VAD标志等于1,则在S903处生成对应的控制信号来关闭ANC。在一个示例中,可以针对FF传声器和FB传声器两者执行关闭ANC的调整。在另一示例中,可以仅针对FF传声器执行关闭ANC的调整,并且维持FB传声器的ANC状态。根据一个或多个实施方案,在关闭ANC的调整之前,可以首先确定ANC的当前状态。如果ANC的当前状态是OFF,则可以忽略控制信号,因为ANC已处于OFF状态。如果ANC的当前状态是ON,则可以立即开始从ANC模式到通透模式的转换。在一个示例中,可以根据实践要求针对从ANC模式(ANC开启)到通透模式(ANC关闭)的转换设置延迟时间dton-off。通常,延迟时间dton-off可以被设置为非常小的值,例如数微秒或数毫秒的量级。
如果组合VAD标志不等于1,则该方法进行到S904。在S904处,该方法确定组合VAD标志是否等于0。如果组合VAD标志等于0,则在S905处生成对应控制信号以开启ANC。在一个示例中,可以针对FF传声器和FB传声器两者执行开启ANC的调整。根据一个或多个实施方案,在开启ANC的调整之前,可以首先确定ANC的当前状态。如果ANC的当前状态是ON,则可以忽略控制信号,因为ANC已处于ON状态。如果ANC的当前状态是OFF,则可以开始从通透模式到ANC模式的转换。在一个示例中,可以针对从通透模式(ANC关闭)到ANC模式(ANC开启)的转换设置延迟时间dtoff-on。这意味着,转换在一段时间之后开始,例如在延迟时间dtoff-on的时段之后开始。延迟时间dtoff-on的使用可以避免由对话中的短暂停顿引起的错误转换。延迟时间dtoff-on可以大于上述延迟时间dton-off。例如,延迟时间dtoff-on可以是数秒的量级。
如果组合VAD标志不等于0,则该方法进行到S906。在S906处,生成对应控制信号以根据组合VAD标志的值以特定比率开启或关闭ANC。例如,控制信号可以包括指示转换的程度/水平(诸如转换的百分比)的调整因子。调整因子可以是0与1之间的值,并且可以随着组合VAD标志的值而变化。因此,ANC根据包括在控制信号中的调整因子以特定比率开启或关闭。
根据一个或多个实施方案,可以提供一种用于具有主动噪声消除(ANC)的耳机的***,其中该耳机包括至少一个前馈传声器和至少一个反馈传声器或传感器。该***可以包括处理器,该处理器可以被配置成从耳机的反馈传声器或传感器接收反馈信号;基于所接收的反馈信号来确定反馈(FB)语音活动检测(VAD)标志;基于所确定的FB VAD标志的值来生成控制信号;以及基于控制信号来自动调整耳机在ANC模式与通透模式之间的转换。
此外,处理器被进一步配置成从耳机的前馈传声器接收前馈信号;基于所接收的反馈信号来确定前馈(FF)语音活动检测(VAD)标志;以及基于FF VAD标志和FB VAD标志来确定组合VAD标志。
此外,该处理器可以被进一步配置成计算所接收的前馈信号的第一SNR;基于第一SNR来获得所接收的前馈信号的FF VAD标志;计算所接收的反馈信号的第二SNR;基于第二SNR来获得所接收的反馈信号的FB VAD标志;以及基于FF VAD标志和FB VAD标志来确定组合VAD标志。
此外,该处理器可以被进一步配置成:将第一SNR分别与第一高阈值和第一低阈值进行比较;如果第一SNR大于或等于第一高阈值,则将FF VAD标志设置为1;如果第一SNR小于或等于第一低阈值,则将FF VAD标志设置为0;以及如果第一SNR大于第一低阈值并且小于第一高阈值,则将FF VAD标志设置为0与1之间的值。
该处理器可以被进一步配置成:将第二SNR与第二高阈值和第二低阈值进行比较;如果第二SNR大于或等于第二高阈值,则将FB VAD标志设置为1;如果第二SNR小于或等于第二低阈值,则将FB VAD标志设置为0;以及如果第二SNR大于第二低阈值并且小于第二高阈值,则将FB VAD标志设置为0与1之间的值。
该处理器可以被进一步配置成:如果FF VAD标志和FB VAD标志的值均为0,则将组合VAD标志设置为0;如果FF VAD标志和FB VAD标志的值均为1,则将组合VAD标志设置为1;以及如果FF VAD标志的值和FB VAD标志的值中的一者不等于1,则基于FF VAD标志的值和FB VAD标志的值使用权重参数来计算组合VAD标志。
该处理器可以是被配置成处理数据以及执行软件应用程序的任何技术上可行的硬件单元,包括而不限于中央处理单元(CPU)、微控制器单元(MCU)、专用集成电路(ASIC)、数字信号处理器(DSP)芯片等。处理器可以集成在耳机中。
本公开还包括一种存储程序指令的非暂时性计算机可读介质,该程序指令在由处理器执行时使得处理器执行以下步骤:从耳机的反馈传声器或传感器接收反馈信号;基于所接收的反馈信号来确定反馈(FB)语音活动检测(VAD)标志;基于所确定的FB VAD标志的值来生成控制信号;以及基于控制信号来自动调整耳机在ANC模式与通透模式之间的转换。
本公开中描述的***和方法可以基于对用户语音的存在和不存在的估计而自动调整耳机的ANC模块/功能,这给用户带来了更方便的使用体验。此外,本公开的方法和***所提供的VAD检测机制可以提高在嘈杂环境中对用户语音判断的准确度。另外,本公开的方法和***可以使耳机在不同操作模式之间相对平滑地切换,并且改善了用户的听感体验。
对各种实施方案的描述已出于说明目的而呈现,但并不旨在详尽或限于所公开的实施方案。在不脱离所描述的实施方案的范围和精神的情况下,许多修改和变化对于本领域普通技术人员来说是显而易见的。选择本文使用的术语是为了最好地解释实施方案的原理,对市场上发现的技术的实际应用或技术上的改进,或者使本领域的其他普通技术人员能够理解本文公开的实施方案。
在前述内容中,针对本公开中呈现的实施方案制作了附图标记。然而,本公开的范围不限于特定描述的实施方案。替代地,无论是否与不同的实施方案相关,前述特征和元件的任何组合都被设想为实现和实践所设想的实施方案。此外,尽管本文中公开的实施方案可以实现优于其他可能的解决方案或优于现有技术的优点,但给定实施方案是否实现特定优点并不限制本公开的范围。因此,前述方面、特征、实施方案和优点仅仅是说明性的,并且除了在权利要求中明确叙述的情况之外不被视为所附权利要求的要素或限制。
本公开的各方面可以采取完全硬件实施方案、完全软件实施方案(包括固件、常驻软件、微代码等)或结合软件和硬件方面的实施方案的形式,所述各实施方案在本文中一般都可称为“电路”、“模块”或“***”。
可利用一个或多个计算机可读介质的任何组合。计算机可读介质可以是计算机可读信号介质或计算机可读存储介质。计算机可读存储介质可以是例如但不限于电子、磁性、光学、电磁、红外或半导体***、设备或装置或前述介质的任何合适组合。计算机可读存储介质的更具体示例(非详尽列表)将包括以下项:具有一根或多根导线的电气连接、便携式计算机软盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦可编程只读存储器(EPROM或快闪存储器)、光纤、便携式光盘只读存储器(CD-ROM)、光学存储装置、磁性存储装置或前述介质的任何合适的组合。在本文档的语境中,计算机可读存储介质可以是可含有或存储供指令执行***、设备或装置使用或与其联用的程序的任何有形介质。
参考根据本公开的实施方案的方法、设备(***)和计算机程序产品的流程图图解和/或框图来描述本公开的各方面。应理解,流程图图解和/或框图中的每个框以及流程图图解和/或框图中的框的组合能够通过计算机程序指令来实现。这些计算机程序指令可以被提供给通用计算机、专用计算机或其他可编程数据处理设备的处理器以生成机器,使得经由计算机或其他可编程数据处理设备的处理器执行的指令能够实施流程图和/或框图的一个或多个框中指定的功能/动作。此类处理器可以是但不限于通用处理器、专用处理器、应用特定的处理器或现场可编程处理器。
虽然前述内容针对本公开的实施方案,但是可在不脱离本公开的基本范围的情况下设计出本公开的其他和更多实施方案,且所述范围由所附权利要求确定。
Claims (20)
1.一种用于具有主动噪声消除(ANC)的耳机的方法,所述耳机包括至少一个前馈传声器和至少一个反馈传声器或传感器,所述方法包括:
从所述耳机的所述反馈传声器或传感器接收反馈信号;
基于所接收的反馈信号来确定反馈(FB)语音活动检测(VAD)标志;
基于所确定的FB VAD标志的值来生成控制信号;以及
基于所述控制信号来自动调整所述耳机在ANC模式与通透模式之间的转换。
2.根据权利要求1所述的方法,其还包括:
从所述耳机的所述前馈传声器接收前馈信号;
基于所接收的反馈信号来确定前馈(FF)语音活动检测(VAD)标志;以及
基于所述FF VAD标志和所述FB VAD标志来确定组合VAD标志。
3.根据权利要求1或权利要求2所述的方法,其还包括:
计算所接收的前馈信号的第一SNR;
基于所述第一SNR来获得所接收的前馈信号的所述FF VAD标志;
计算所接收的反馈信号的第二SNR;
基于所述第二SNR来获得所接收的反馈信号的FB VAD标志;以及
基于所述FF VAD标志和所述FB VAD标志来确定组合VAD标志。
4.根据权利要求1至3中任一项所述的方法,其中
所述FF VAD标志、所述FB VAD标志和所述组合VAD标志中的每一者是大于或等于0且小于或等于1的值,并且
所述FF VAD标志、所述FB VAD标志和所述组合VAD标志中的每一者表示佩戴所述耳机的用户正在讲话的可能性。
5.根据权利要求3或4所述的方法,基于所述第一SNR来获得所述FF VAD标志还包括:
将所述第一SNR分别与第一高阈值和第一低阈值进行比较;
如果所述第一SNR大于或等于所述第一高阈值,则将所述FF VAD标志设置为1;
如果所述第一SNR小于或等于所述第一低阈值,则将所述FF VAD标志设置为0;以及
如果所述第一SNR大于所述第一低阈值并且小于所述第一高阈值,则将所述FF VAD标志设置为0与1之间的值。
6.根据权利要求3至5中任一项所述的方法,基于所述第二SNR来获得所述FB VAD标志还包括:
将所述第二SNR与第二高阈值和第二低阈值进行比较;
如果所述第二SNR大于或等于所述第二高阈值,则将所述FB VAD标志设置为1;
如果所述第二SNR小于或等于所述第二低阈值,则将所述FB VAD标志设置为0;以及
如果所述第二SNR大于所述第二低阈值并且小于所述第二高阈值,则将所述FB VAD标志设置为0与1之间的值。
7.根据权利要求1至6中任一项所述的方法,基于所述FF VAD标志和所述FB VAD标志来确定组合VAD标志还包括:
如果所述FF VAD标志和所述FB VAD标志的所述值均为0,则将所述组合VAD标志设置为0;
如果所述FF VAD标志和所述FB VAD标志的所述值均为1,则将所述组合VAD标志设置为1;以及
如果所述FF VAD标志的所述值和所述FB VAD标志的所述值中的一者不等于1,则基于所述FF VAD标志的所述值和所述FB VAD标志的所述值使用权重参数来计算所述组合VAD标志。
8.根据权利要求7所述的方法,其中所述权重参数取决于所述反馈信号的所述第二SNR。
9.根据权利要求7所述的方法,其中所述权重参数取决于噪声比,所述噪声比使用所述前馈信号来计算并且表示佩戴所述耳机的所述用户所处的环境的噪声水平。
10.根据权利要求1至9中任一项所述的方法,其中所述自动调整所述耳机在所述ANC模式与通透模式之间的所述转换包括:对所述前馈信号和所述反馈信号执行相同ANC调整或不同ANC调整;其中所述耳机的所述ANC在所述ANC模式下开启,并且所述耳机的所述ANC在所述通透模式下开启。
11.根据权利要求1至10中任一项所述的方法,其还包括:
基于所述组合VAD标志来确定对应调整因子;以及
使用所述调整因子来自动调整所述耳机在所述ANC模式与所述通透模式之间的所述转换。
12.根据权利要求11所述的方法,其中所述调整因子表示从所述ANC模式到所述通透模式或者从所述通透模式到所述ANC模式的所述转换的水平。
13.根据权利要求11所述的方法,其还包括基于所述调整因子来调整在所述通透模式下传递通过所述耳机的环境声音的强度。
14.根据权利要求1至13中任一项所述的方法,其还包括:
预先确定从所述ANC模式到所述通透模式的所述转换的第一时间阈值,所述第一时间阈值表示从所述ANC模式到所述通透模式的所述转换的开始时间;以及
预先确定从所述通透模式到所述ANC模式的所述转换的第二时间阈值,所述第二时间阈值表示从所述通透模式到所述ANC模式的所述转换的开始时间;
其中所述第一时间阈值小于所述第二时间阈值。
15.一种用于具有主动噪声消除(ANC)的耳机的***,所述耳机包括至少一个前馈传声器和至少一个反馈传声器或传感器,其中所述***包括处理器,所述处理器被配置成:
从所述耳机的所述反馈传声器或传感器接收反馈信号;
基于所接收的反馈信号来确定反馈(FB)语音活动检测(VAD)标志;
基于所确定的FB VAD标志的值来生成控制信号;以及
基于所述控制信号来自动调整所述耳机在ANC模式与通透模式之间的转换。
16.根据权利要求15所述的***,其中所述处理器被进一步配置成:
从所述耳机的所述前馈传声器接收前馈信号;
基于所接收的反馈信号来确定前馈(FF)语音活动检测(VAD)标志;以及
基于所述FF VAD标志和所述FB VAD标志来确定组合VAD标志。
17.根据权利要求15或权利要求16所述的***,其中所述处理器被进一步配置成:
计算所接收的前馈信号的第一SNR;
基于所述第一SNR来获得所接收的前馈信号的所述FF VAD标志;
计算所接收的反馈信号的第二SNR;
基于所述第二SNR来获得所接收的反馈信号的FB VAD标志;
基于所述FF VAD标志和所述FB VAD标志来确定组合VAD标志。
18.根据权利要求15至17中任一项所述的***,其中所述处理器被进一步配置成:
将所述第一SNR分别与第一高阈值和第一低阈值进行比较;
如果所述第一SNR大于或等于所述第一高阈值,则将所述FF VAD标志设置为1;
如果所述第一SNR小于或等于所述第一低阈值,则将所述FF VAD标志设置为0;以及
如果所述第一SNR大于所述第一低阈值并且小于所述第一高阈值,则将所述FF VAD标志设置为0与1之间的值。
19.根据权利要求15至17中任一项所述的***,其中所述处理器被进一步配置成:
将所述第二SNR与第二高阈值和第二低阈值进行比较;
如果所述第二SNR大于或等于所述第二高阈值,则将所述FB VAD标志设置为1;
如果所述第二SNR小于或等于所述第二低阈值,则将所述FB VAD标志设置为0;以及
如果所述第二SNR大于所述第二低阈值并且小于所述第二高阈值,则将所述FB VAD标志设置为0与1之间的值。
20.根据权利要求15至19中任一项所述的***,其中所述处理器被进一步配置成:
如果所述FF VAD标志和所述FB VAD标志的所述值均为0,则将所述组合VAD标志设置为0;
如果所述FF VAD标志和所述FB VAD标志的所述值均为1,则将所述组合VAD标志设置为1;以及
如果所述FF VAD标志的所述值和所述FB VAD标志的所述值中的一者不等于1,则基于所述FF VAD标志的所述值和所述FB VAD标志的所述值使用权重参数来计算所述组合VAD标志。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/CN2021/071768 WO2022151156A1 (en) | 2021-01-14 | 2021-01-14 | Method and system for headphone with anc |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116803100A true CN116803100A (zh) | 2023-09-22 |
Family
ID=82447790
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202180090307.3A Pending CN116803100A (zh) | 2021-01-14 | 2021-01-14 | 用于具有anc的耳机的方法和*** |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN116803100A (zh) |
WO (1) | WO2022151156A1 (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117641172A (zh) * | 2022-08-09 | 2024-03-01 | 北京小米移动软件有限公司 | 耳机控制方法及装置、电子设备、存储介质 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10564925B2 (en) * | 2017-02-07 | 2020-02-18 | Avnera Corporation | User voice activity detection methods, devices, assemblies, and components |
CN108882092A (zh) * | 2018-07-03 | 2018-11-23 | 歌尔智能科技有限公司 | 一种耳机降噪方法及反馈降噪*** |
DK180471B1 (en) * | 2019-04-03 | 2021-05-06 | Gn Audio As | Headset with active noise cancellation |
US10714073B1 (en) * | 2019-04-30 | 2020-07-14 | Synaptics Incorporated | Wind noise suppression for active noise cancelling systems and methods |
-
2021
- 2021-01-14 CN CN202180090307.3A patent/CN116803100A/zh active Pending
- 2021-01-14 WO PCT/CN2021/071768 patent/WO2022151156A1/en active Application Filing
Also Published As
Publication number | Publication date |
---|---|
WO2022151156A1 (en) | 2022-07-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10810989B2 (en) | Method and device for acute sound detection and reproduction | |
JP7098771B2 (ja) | ノイズ低減のためのオーディオ信号処理 | |
CN111800690B (zh) | 具有主动降噪的耳麦 | |
CN112334972B (zh) | 耳机***、个人声学设备以及用于检测反馈不稳定性的方法 | |
US8315400B2 (en) | Method and device for acoustic management control of multiple microphones | |
JP4530051B2 (ja) | 音声信号送受信装置 | |
US20090016541A1 (en) | Method and Device for Acoustic Management Control of Multiple Microphones | |
WO2021047115A1 (zh) | 一种无线耳机降噪方法、装置及无线耳机和存储介质 | |
US11438711B2 (en) | Hearing assist device employing dynamic processing of voice signals | |
EP3213527A1 (en) | Self-voice occlusion mitigation in headsets | |
WO2022140928A1 (zh) | 用于抑制回声的音频信号处理方法和*** | |
CN116803100A (zh) | 用于具有anc的耳机的方法和*** | |
JP4941579B2 (ja) | 音声信号送受信装置 | |
CN114697846A (zh) | 包括反馈控制***的助听器 | |
US11696065B2 (en) | Adaptive active noise cancellation based on movement | |
WO2021242571A1 (en) | Hearing device with motion sensor used to detect feedback path instability | |
CN115668370A (zh) | 听力设备自带的语音检测器 | |
CN116709116A (zh) | 声音信号的处理方法及耳机设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |