CN110415719B - 用于在音频信号中进行噪音抑制的方法 - Google Patents

用于在音频信号中进行噪音抑制的方法 Download PDF

Info

Publication number
CN110415719B
CN110415719B CN201910359478.6A CN201910359478A CN110415719B CN 110415719 B CN110415719 B CN 110415719B CN 201910359478 A CN201910359478 A CN 201910359478A CN 110415719 B CN110415719 B CN 110415719B
Authority
CN
China
Prior art keywords
signal
audio signal
predicted
components
audio
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910359478.6A
Other languages
English (en)
Other versions
CN110415719A (zh
Inventor
T.D.罗森克兰兹
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sivantos Pte Ltd
Original Assignee
Sivantos Pte Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sivantos Pte Ltd filed Critical Sivantos Pte Ltd
Publication of CN110415719A publication Critical patent/CN110415719A/zh
Application granted granted Critical
Publication of CN110415719B publication Critical patent/CN110415719B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L21/0232Processing in the frequency domain
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R1/00Details of transducers, loudspeakers or microphones
    • H04R1/10Earpieces; Attachments therefor ; Earphones; Monophonic headphones
    • H04R1/1083Reduction of ambient noise
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L21/0224Processing in the time domain
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0264Noise filtering characterised by the type of parameter measurement, e.g. correlation techniques, zero crossing techniques or predictive techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0272Voice signal separating
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/12Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being prediction coefficients
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2225/00Details of deaf aids covered by H04R25/00, not provided for in any of its subgroups
    • H04R2225/43Signal processing in hearing aids to enhance the speech intelligibility
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2410/00Microphones
    • H04R2410/07Mechanical or electrical reduction of wind noise generated by wind passing a microphone

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Quality & Reliability (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

本发明涉及一种用于在音频信号中进行噪声抑制的方法,其中,对于多个预测时间点(t1、t2),分别根据预测时间点(t1、t2)之前的音频信号(1)的信号成分(2n1、2n2),对预测时间点(t1、t2)之后的信号成分(2t1、2t2)进行预测,其中,分别由预测时间点(t1、t2)之后的信号成分(2t1、2t2)形成预测的音频信号(8、8a‑c),并且其中,根据预测的音频信号(8、8a‑c)产生噪声被抑制的音频信号(10、10a‑f)。

Description

用于在音频信号中进行噪音抑制的方法
技术领域
本发明涉及一种用于在音频信号中进行噪音抑制的方法。
背景技术
在许多音频应用中,尤其是在处理麦克风信号时,出现噪声,应当在应用的过程中抑制噪声。在此,实际期望的有用信号通常与经常难以确定的噪声叠加。在此,噪声可能部分在很大程度上影响信号的可感知性。
在助听器中,有用信号经常存在于助听器的用户的对话伙伴的语音信号中。同样被助听器的麦克风接收并且相应地一起被进一步处理的周围环境的背景噪声,可能对用户产生干扰或者分散用户的注意力,因此为了识别语音贡献,可能需要明显更大的努力、尤其是集中注意力。为了抑制噪声,在许多助听器中,将助听器的内部信号划分到不同的频带中,并且为了抑制噪声,对于确定了特别高的噪声成分的频带,通过增益因子来减小信号。
然而,所描述的方法基于对于各个频带统一的增益因子相同地处理相关频带中的所有信号分量。现在,如果在一个频带中,实际期望的高的有用信号成分与明显的噪声叠加,则通过所描述的方法,由于根据高的噪声成分减小增益因子,因此有用信号成分也一起减弱。因此,这种噪声抑制甚至可能使信噪比(SNR)变差。
在许多情况下,期望的有用信号通过语音信号给出。语音信号的特征在于各个信号分量的特殊的谐波结构。由于这种谐波结构,对于语音信号的两个谐波分量之间的噪声的抑制,需要以如下频率分辨率对整个音频信号进行滤波,该频率分辨率将不同的谐波分量映射到不同的、优选不相邻的频带中。然而,由于由此在助听器中的信号处理中形成的长的等待时间和相应的时间延迟,由于对于谐波分量常见的频率和频率间隔而这样高的频率分辨率是不期望的。
发明内容
因此,本发明要解决的技术问题在于,提供一种用于在音频信号中进行噪声抑制的方法,其尤其是针对与噪声叠加的音调(tonales)有用信号提供尽可能好的SNR。
根据本发明,所提到的技术问题通过用于在音频信号中进行噪声抑制的方法来解决,其中,针对多个预测时间点,分别根据预测时间点之前的音频信号的信号成分,对预测时间点之后的信号成分进行预测,其中,分别由预测时间点之后的信号成分形成预测的音频信号,并且其中,根据预测的音频信号产生噪声被抑制的音频信号。部分本身被视为具有创造性的有利的设计方案是从属权利要求和下面的描述的主题。
尤其是根据预测的音频信号,通过将预测的音频信号与音频信号或者与音频信号的经过预处理的信号成分混合或者叠加,来产生噪声被抑制的音频信号,其中,作为预处理,尤其是包括与频带相关的放大。
在此,预测时间点尤其是应当理解为音频信号的时间基准(Zeitreferenz)的范围内的时间点。这意味着,预测时间点之前的信号成分具有更早的时间基准,并且预测时间点之后的信号成分具有更晚的时间基准。分别预测之后的信号成分的多个预测时间点,因此在音频信号的时间基准的范围内形成时间序列。
优选选择预测时间点和在相应的预测时间点之后要预测的信号成分,使得这些信号成分覆盖直到下一个预测时间点的完整的时间段,也就是说,使得可以将直到下一个预测时间点的每一个时间点与预测的信号成分相关联,该预测的信号成分根据当前最后的预测时间点之前的信号成分被预测。这种关联尤其是也可以离散化地进行,从而在预测时间点之后的每个时间点,也一起存在表示相关的时间基准的音频样本(也称为音频采样值)。
尤其是也可以以如下方式形成预测的音频信号,即,使用多个预测时间点的针对特定的时间基准预测的信号成分。如果例如通过作为信号成分的各个音频样本进行预测,则可以相对于具体的时间基准,通过对相同的时间基准的分别在不同的预测时间点预测的多个音频样本进行加权平均,形成预测的音频信号的相应的音频样本。因此,在具体的时间基准中,作为多个叠加的信号成分的加权平均值,形成预测的音频信号,这些叠加的信号成分分别在不同的预测时间点被预测,但是总体上具有相同的时间基准。
也就是说,一般使用一个预测时间点之前的各个信号成分,来根据这些信号成分对该预测时间点处和/或之后的信号成分进行预测。因此,通过在时间上错开预测时间点,得到时间基准优选彼此相邻或者重叠的预测的信号成分,从而可以根据这些信号成分,与其各自的时间基准对应地形成独立的预测的音频信号。
在此,一方面利用如下情况,即,根据音频信号中的相关性(Korrelation),根据音频信号的已经存在的信号成分,来预测未来的信号成分,并且另一方面,音频信号中的常见的有用信号成分大多具有高的相关性。音频信号的相关的信号分量因此原则上是可预测的,而不相关的分量、例如统计分布的噪声原则上是不可预测的。因此,与初始的音频信号相比,预测的音频信号具有明显更高的成分的相关的信号分量,由此可以抑制音频信号中的不相关的噪声成分。
在此,应当考虑,在许多应用中,要处理的音频信号的有用信号经常非常强地相关。因此,例如音乐的音调分量具有非常高的相关性,因为音乐的音调分量基本上由基频和表示一个音调的声音的谐波泛音谱(harmonischen Obertonspektrum)构成,谐波泛音谱由基频的整数倍形成。语音的浊音(stimmhaften)分量、因此音调分量也在该频率范围内也具有这种谐波结构。在此,所述固定的频率分量、即基频和其谐波相应地导致有用信号成分的相应的周期性,这种周期性以信号成分的相应的相关性表现出来,由此通过预测可以特别好地采集这些有用信号分量,因此也对这些有用信号分量进行预测。因此,在进行预测时,与这些固定的频率分量叠加的不相关的噪声得到抑制。
优选对于一个预测时间点之前的音频信号的信号成分,相应地使用该预测时间点之前的多个音频样本。在此,尤其是首先可以将音频信号分解到各个频带中,并且作为要对信号成分进行预测的每个频带的各个信号成分,使用多个音频样本,使得通过相关频带中的多个音频样本,再现该频带中的音频信号的信号成分。在此,特别优选作为信号成分,使用在音频信号的相应的频带中或者(在宽带预测的情况下)在音频信号中紧接在相关预测时间点之前的无间隙的音频样本序列。然后,可以使用这些音频样本,通过尤其是离散的线性预测滤波器,来预测之后的信号成分。尤其是,在选择预测要使用的音频样本时,也可以一起使用将音频信号划分到各个频带中的滤波器组的过采样,从而在一个频带中,以尽可能没有不是初始的音频信号固有的相关性通过过采样一起进入信号成分的方式,选择音频样本作为与预测有关的信号成分。
适宜地,作为预测时间点之后的信号成分,分别预测一定数量的音频样本,其分别与相关预测时间点之后的时间基准相关联。在此,尤其是预测可以按照频带进行,从而针对进行预测的频带,分别在预测时间点之后产生具有相同的时间基准的不同的音频样本。在此,优选针对每个相关的频带或者(在宽带预测的情况下)在一个预测时间点总是仅预测一个音频样本,从而总是可以根据音频信号的当前最新的音频样本来预测每个预测的音频样本。
有利地,借助线性预测滤波器,根据预测时间点之前的音频信号的信号成分,来相应地对预测时间点之后的信号成分进行预测。即使原则上也可以以其它方式对相关的信号成分进行预测,除了低的数值复杂度和低的实现复杂度之外,线性预测滤波器还具有其它优点,即,线性预测滤波器特别是可以动态地匹配于当前的音频信号的情况。因此,当在音频信号中存在多个有用信号分量时,例如可以改变、尤其是增加滤波器长度、即要使用的音频样本以及相应的滤波系数的数量。由此可以改善预测的质量、即各个有用信号分量的“滤出”。
此外,可以根据音频信号和预测的音频信号单独改变滤波系数,从而预测滤波器总是使用最佳的滤波系数。在此,优选自适应地(adaptiv)根据预测的音频信号与音频信号的偏差来确定线性预测滤波器的滤波系数。也就是说,对于小的偏差来说,存在良好的预测,因此存在“正确的”滤波系数。在偏差增大时,可以相应地针对该偏差的最小化改变和调整滤波系数。
进一步证明有利的是,将音频信号分解到多个频带中,其中,相应地按照频带,根据预测时间点之前的音频信号的信号成分,预测相应的预测时间点之后的信号成分。在此,优选分别按照频带,在完全要进行预测的频带中,使用预测使用的预测时间点之前的信号成分。然后,针对相应的频带,根据音频信号的这些按照频带的信号成分,对预测时间点之后的信号成分进行预测。在此,原则上可能有利的是,预测仅局限于特定频带。
如果例如有用信号通过语音信号给出,则预测的音频信号中的噪声抑制尤其是在低频带中由于语音信号的谐波分量的高的相关性而提供特别好的结果。对于较高的频带,语音信号的分量也不再具有与低频带的谐波分量一样高的相关性,从而在此预测也可能抑制有用信号成分。现在,可以通过在较高的频带中以其它方式进行噪声抑制,来防止消除噪声被抑制的音频信号中的重要的有用信号分量。在这种情况下,在较高的频带中可以不进行预测。
在此,优选为了产生噪声被抑制的音频信号,将预测的音频信号与音频信号的信号成分按照频带混合,其中,根据相应的频带中的谐波分量的贡献和/或不相关的分量的贡献确定混合比。这尤其是可以在存在高份额的谐波分量的低频和实际上不再存在谐波分量的高频之间的过渡区域中进行。频带中的谐波分量的贡献的份额越高,则借助预测的噪声抑制通常在SNR方面越好。在过渡区域中,除了例如表示清音(stimmlose)语音(例如硬辅音)的其它分量之外,谐波分量也可以共存。如果仅根据预测的音频信号形成噪声被抑制的音频信号,则可能在进行预测时同样一起抑制所述有用信号的非谐波分量。所描述的根据谐波分量的混合在此使得能够进行补偿。
在此,尤其是可以预先通过按照频带的与噪声有关的增益因子,对要与预测的音频信号混合的音频信号的信号成分进行一般的噪声抑制。如果存在高份额的不相关的分量,则尤其是可以假设不相关的分量由噪声引起,而不是来自有用信号。在此,如果同时不存在谐波分量的贡献或者存在谐波分量的小的贡献,则可以优先主要通过所述一般的噪声抑制来处理相关频带。
在此,为了有利地产生噪声被抑制的音频信号,将预测的音频信号与音频信号的信号成分按照频带混合,其中,相应地按照频带对混合之前的音频信号的信号成分应用噪声抑制系数,并且其中,根据在预测的音频信号中相对于音频信号进行的噪声抑制,确定相应的频带中的噪声抑制系数。这意味着,为了产生用于一般的噪声抑制的按照频带的、与噪声相关的增益因子,检查在相关频带的预测的音频信号中由于预测而进行的噪声抑制有多大。现在,可以将一般的噪声抑制的增益因子减小该贡献,因为已经通过预测实现了该噪声抑制。在此,例如可以通过简单地比较频带中的音频信号和预测的音频信号的信号水平,来估计通过预测进行的噪声抑制,因为假设信号水平正是由于噪声抑制而降低的。
适宜地,对于多个频带,估计多个谐波分量的存在,其中,根据频带中的多个谐波分量,选择线性预测滤波器的滤波器长度。尤其是在语音作为有用信号的情况下,由于谐波分量的常见的间距(其总是在可听见的声音的频率范围内移动的基频的整数倍),并且由于频带的常见的宽度,可能出现如下情况,即,两个或者更多个谐波分量也落入一个频带中。这些谐波分量在该频带的信号成分中叠加。对于这种情况,优选使用更长的滤波器。这考虑到如下情况,即,在这些谐波分量叠加时,产生可能更复杂的周期特性,因此更长的滤波器、因此更多信号成分(例如更多音频样本)的使用对于预测是有利的。然而,如果仅存在一个谐波分量,则少量的信号成分对于预测可能已经足够了,并且为了降低计算的复杂度,可以相应地减小预测滤波器的长度。
此外,本发明涉及一种针对助听器进行噪声抑制的方法,其中,通过助听器的输入转换器,从周围环境的声音信号产生输入声音信号,其中,通过前面描述的用于在音频信号中进行噪声抑制的方法来抑制输入信号中和/或由输入信号导出的中间信号中的噪声,并且其中,根据由此产生的噪声被抑制的信号形成助听器的再现信号。此外,本发明涉及一种助听器,助听器具有用于产生输入信号的输入转换器以及信号处理单元,信号处理单元被配置为用于执行前面描述的用于在音频信号中进行噪声抑制的方法。在此,针对所述方法和针对其扩展方案给出的优点,同样可以转用于针对助听器进行噪声抑制的方法和助听器。尤其是,助听器被设置并且被配置为用于,通过在信号处理单元中对输入信号进行相应的处理,来校正助听器的用户的听力障碍。为此,优选在信号处理单元中与频带相关地,特别优选根据用户的听力图,对输入信号进行放大。用于在音频信号中进行噪声抑制的方法在这种助听器中的使用中是特别有利的。
由输入信号导出的中间信号在此尤其是包括通过与其它信号、例如用于抑制声音反馈的补偿信号、输入信号的总和或者差产生的信号,并且还包括通过根据用户的听觉预给定参数进行的与频率相关的放大和/或通过动态压缩由输入信号得出的信号。
附图说明
下面,根据附图详细说明本发明的实施例。在此分别示意性地:
图1相对于时间轴示出了根据音频信号的多个先前的音频样本对音频样本的预测,
图2示出了借助根据图1的预测在音频信号中进行噪声抑制的方法,
图3示出了具有语音作为有用信号的有噪声的音频信号以及相同的音频信号在通过根据图2的方法进行噪声抑制之后的频谱,以及
图4以框图示出了助听器。
在所有附图中,彼此相应的部分和参量分别设有相同的附图标记。
具体实施方式
在图1中示意性地相对于时间轴t绘出了音频信号1。在此,音频信号1以数字化的形式、即以音频样本2的形式存在。在此,各个音频样本2的幅值近似地描述了正弦曲线4,其中,与正弦曲线4的偏差是相对于有用信号的附加的噪声,有用信号通过与正弦曲线4对应的声音给出。在此,音频信号1的音频样本2仅在预测时间点t1之前存在。现在,使用通过预测时间点t1之前的最后N个音频样本2给出的音频信号1的信号成分2n1,来预测紧接在预测时间点t1之后的音频样本2t1。这通过长度为N的线性预测滤波器来进行。在此,线性预测根据在预测使用的信号成分2n1中存在的相关性来确定随后的音频样本2t1。在此,可以不预测不相关的统计噪声。
在此,所述相关性通过正弦曲线4给出,从而根据正弦曲线4预测随后的音频样本2t1,其中,附加的噪声由于没有相关性而在预测中仅产生很少的贡献,由于附加的噪声,在预测时间点t1之前的音频样本2中,幅值与正弦曲线4有偏差。对于预测的音频样本2t1,结果几乎是正弦曲线4的幅值的值,其中,相对于该值的很小的偏差由有限的滤波器长度N以及附加的噪声中的残留相关性造成。
现在,在音频样本2t1结束时,选择接下来的预测时间点t2,并且以刚刚描述的方式根据重新通过预测时间点t2之前的最后N个音频样本2给出的信号成分2n2,来对预测时间点t2之后的音频样本2t2进行预测。
现在,由预测的音频样本2t1、2t2形成预测的音频信号8,其走向与音频信号1相比明显更好地再现了正弦曲线4。因此,音频信号1中的附加的噪声由于预测而明显减小。如果假设在音频信号1中,有用信号分量是充分相关的,因此在借助预测进行噪声抑制时没有抑制实际期望的信号分量,则预测的音频信号8现在可以直接用作噪声被抑制的音频信号。然而,如果假设音频信号1中的有用信号成分也具有不相关的分量,则为了进行补偿,可以将预测的音频信号8与音频信号1的成分混合,以产生噪声被抑制的音频信号。由此强调音频信号1的在时间上相关的、即尤其是音调的有用信号分量,而不完全消除不相关的有用信号分量。此外,通过这种提升,仍然对不相关的噪声进行抑制。
图2示意性地以框图示出了用于借助根据图1的预测对音频信号1进行噪声抑制的方法。首先,通过滤波器组12将音频信号1分解到各个频带1a-f中。对于音频信号1的频带1a-f,现在一方面确定噪声抑制系数13a-f,对于一般的按照频带的噪声抑制,分别将噪声抑制系数13a-f与单个频带1a-f中的信号成分相乘。根据前三个频带1a-c中的信号成分,借助根据图1示出的通过预测进行噪声抑制的方法分别产生预测的音频信号8a-c。
在此,预测的音频信号8a-c的产生可以局限于下方的频带1a-c,因为随着频率升高,作为有用信号的语音信号的谐波成分减小,并且表示清音语音、例如相应的辅音的信号分量越来越占主导。然而,这种信号分量不再以谐波结构分布在频谱上,从而根据图1所示的方法所需的相关性不再以与在低频率范围内的谐波分量中相同的程度存在。在这种背景下,为了避免人为影响,如在图1中示出的借助减小来进行噪声抑制的方法的使用,被限制为所述方法以足够高的可靠性提供明显的优点的频带。
这在图2中借助频带1a-c示出,其中,所述方法的相应的使用一般不保持被限制为前3个频带,而是因此与滤波器组12的结构和由此产生的频带的实际的数量相关,此外,也可以动态地根据各个频带中的信号成分,尤其是根据其谐波信号分量的份额,来确定相应的使用。
在此,自适应地根据预测的音频信号8a-c与频带1a-c中的相应的初始的音频信号的相应的偏差,确定用来产生预测的音频信号8a-c的预测滤波器14a-c的滤波系数。此外,对于分别产生预测的音频信号8a-c的各个频带1a-c,确定相应的频带中的谐波分量的贡献16a的份额。在此,这针对第一频带1a象征性地示出,然而,这尤其是可以针对产生预测的音频信号8a-c的所有频带1a-c进行。可以根据谐波分量的贡献16a来改变预测滤波器14a的长度。在此,优选对于具有更大数量的谐波分量的频带,使用更长的滤波器。这考虑到如下情况,即,一个频带中的多个谐波分量导致这些谐波分量与可能更复杂的周期特性的叠加,因此更长的滤波器、因此更多音频样本的使用对于预测是有利的。然而,如果仅存在一个谐波分量,则少量的音频样本对于预测可能已经足够了,并且为了降低计算的复杂度,可以相应地减小预测滤波器14a的长度。
此外,针对预测的音频信号8a-c,分别确定在相应的预测的音频信号8a-c中相对于频带1a-c中的相应的音频信号进行的噪声抑制的度量(Maβ)18a。在此,这针对第一频带1a象征性地示出。在此,度量18a例如可以通过简单地比较预测的音频信号8a和频带1a中的音频信号的信号水平来实现,因为假设刚好通过噪声抑制来降低信号水平。现在,度量18a可以用于校正噪声抑制系数13a,因为可以假设已经通过预测的音频信号8a以度量18a抑制了频带1中的音频信号中的噪声,并且因此在一般的按照频带的噪声抑制的过程中不需要通过噪声抑制系数13a相应地附加地减小增益。在此,可以针对如下频带1a-c进行所描述的对噪声抑制系数13a的校正,针对这些频带,产生预测的音频信号8a-c,并且相应地可以确定通过预测进行的噪声抑制的度量。
在应用噪声抑制系数13a-c之后,可以将相关频带1a-c中的音频信号与相应的预测的音频信号8a-c混合,由此在相应的频带中产生噪声被抑制的音频信号10a-c。在此,尤其是可以根据相应的频带中的谐波分量的贡献16a,来确定多少份额的预测的音频信号8a-c在此进入噪声被抑制的音频信号10a-c的混合比,这在此针对第一频带1a象征性地示出,然而,优选这可以针对产生预测的音频信号8a-c的所有频带1a-c进行。最后,可以通过合成滤波器组20,将噪声被抑制的音频信号10a-c以及根据噪声抑制系数13d-f进行了噪声抑制的频带1d-f的音频信号,变换为时域中的唯一的噪声被抑制的音频信号10。
图3相对于频率轴f示出了有噪声的音频信号1的频谱(虚线),在音频信号1中,有用信号成分通过语音信号给出。在音频信号1中通过不相关的宽带的噪声叠加该语音信号。在此,在使用根据图1示出的进行抑制噪声的方法之后产生预测的音频信号8(实线)。可以明显地看到谐波分量22,其在音频信号1和预测的音频信号8中基本上提供相同的贡献。然而,对于谐波分量22之间的频率范围,在预测的音频信号8中证明了对噪声的明显的抑制。
图4示意性地以框图示出了助听器30。在此构造为麦克风的助听器30的输入转换器32从周围环境的声音信号34产生输入信号36。将输入信号36输送至信号处理单元38,并且在那里根据助听器30的用户的听力预给定参数进行处理,在此尤其是与频带有关地进行放大。信号处理单元38产生再现信号40,其通过助听器30的输出转换器42转换为输出声音信号44。在此,输出转换器42构造为扬声器。现在,可以在信号处理单元38中将根据图2描述的对音频信号进行噪声抑制的方法尤其是应用于作为音频信号1的输入信号36,或者也可以应用于由输入信号36导出的中间信号,例如中间信号可以通过对输入信号36进行预处理或者通过未详细示出的对声音反馈的抑制产生。
虽然在细节上通过优选的实施例详细说明和描述了本发明,但是本发明不局限于该实施例。本领域技术人员可以从中导出其它变形方案,而不脱离本发明的保护范围。
附图标记列表
1 音频信号
1a-f 频带
2 音频样本
2n1、2n2 信号成分
2t1、2t2 预测的音频样本
4 正弦曲线
8、8a-c 预测的音频信号
10、10a-f 噪声被抑制的音频信号
12 滤波器组
13a-f 噪声抑制系数
14a-c 线性预测滤波器
16a 贡献
18a 度量
20 合成滤波器组
22 谐波分量
30 助听器
32 输入转换器
34 声音信号
36 输入信号
38 信号处理单元
40 再现信号
42 输出转换器
44 输出声音信号
f 频率
N 样本的数量
t 时间
t1、t2 预测时间点

Claims (9)

1.一种用于在音频信号(1)中进行噪声抑制的方法,所述方法包括如下步骤:
将音频信号(1)分解到多个频带(1a-f)中;
对于多个预测时间点(t1、t2),分别根据预测时间点(t1、t2)之前的音频信号(1)的信号成分(2n1、2n2),对预测时间点(t1、t2)之后的信号成分(2t1、2t2)进行预测,
其中,分别按照频带,根据预测时间点(t1、t2)之前的音频信号(1)的信号成分(2n1、2n2),对相应的预测时间点(t1、t2)之后的信号成分(2t1、2t2)进行预测;
分别由预测时间点(t1、t2)之后的信号成分(2t1、2t2)形成预测的音频信号(8、8a-c);
根据预测的音频信号(8、8a-c)产生噪声被抑制的音频信号(10、10a-f);
为了产生噪声被抑制的音频信号(10、10a-f),将预测的音频信号(8a-c)与音频信号(1)的信号成分按照频带混合;以及
根据相应的频带(1a-c)中的谐波分量(22)的贡献(16a)和/或不相关的分量的贡献来确定混合比。
2.根据权利要求1所述的方法,
其中,对于预测时间点(t1、t2)之前的音频信号(1)的信号成分(2n1、2n2),分别使用预测时间点(t1、t2)之前的多个音频样本(2)。
3.根据权利要求1所述的方法,
其中,作为预测时间点(t1、t2)之后的信号成分(2t1、2t2),分别预测一定数量的音频样本,其分别与相关预测时间点(t1、t2)之后的时间基准相关联。
4.根据权利要求1至3中任一项所述的方法,
其中,借助线性预测滤波器(14a-c),根据预测时间点(t1、t2)之前的音频信号(1)的信号成分(2n1、2n2),相应地对预测时间点(t1、t2)之后的信号成分(2t1、2t2)进行预测。
5.根据权利要求4所述的方法,
其中,自适应地根据预测的音频信号(8a-c)与音频信号(1)的偏差,来确定线性预测滤波器(14a-c)的滤波系数。
6.根据权利要求1所述的方法,
其中,为了产生噪声被抑制的音频信号(10、10a-c),将预测的音频信号(8a-c)与音频信号(1)的信号成分按照频带混合,
其中,相应地按照频带对混合之前的音频信号(1)的信号成分应用噪声抑制系数(13a-c),并且
其中,在相应的频带中,根据在预测的音频信号(8a-c)中相对于音频信号(1)进行的噪声抑制,确定噪声抑制系数(13a-c)。
7.根据权利要求4所述的方法,
其中,为了产生噪声被抑制的音频信号(10、10a-c),将预测的音频信号(8a-c)与音频信号(1)的信号成分按照频带混合,
其中,相应地按照频带对混合之前的音频信号(1)的信号成分应用噪声抑制系数(13a-c),并且
其中,在相应的频带中,根据在预测的音频信号(8a-c)中相对于音频信号(1)进行的噪声抑制,确定噪声抑制系数(13a-c),
其中,针对频带(1a-c)的数量估计谐波分量(22)的数量,并且其中,
根据频带(1a-c)中的谐波分量(22)的数量选择线性预测滤波器(14a-c)的滤波器长度。
8.一种针对助听器(30)进行噪声抑制的方法,
其中,通过助听器(30)的输入转换器(32),根据周围环境的声音信号(34)产生输入声音信号(36),
其中,通过根据权利要求1至7中任一项所述的用于在音频信号中进行噪声抑制的方法,来抑制输入信号(36)中和/或由输入信号(36)导出的中间信号中的噪声,并且
其中,根据由此产生的噪声被抑制的信号,形成助听器(30)的再现信号(40)。
9.一种助听器(30),其具有用于产生输入信号(36)的输入转换器(32)以及信号处理单元(38),所述信号处理单元被配置为用于执行根据权利要求1至7中任一项所述的方法。
CN201910359478.6A 2018-04-30 2019-04-30 用于在音频信号中进行噪音抑制的方法 Active CN110415719B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
DE102018206689.2 2018-04-30
DE102018206689.2A DE102018206689A1 (de) 2018-04-30 2018-04-30 Verfahren zur Rauschunterdrückung in einem Audiosignal

Publications (2)

Publication Number Publication Date
CN110415719A CN110415719A (zh) 2019-11-05
CN110415719B true CN110415719B (zh) 2023-07-04

Family

ID=66217765

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910359478.6A Active CN110415719B (zh) 2018-04-30 2019-04-30 用于在音频信号中进行噪音抑制的方法

Country Status (5)

Country Link
US (1) US10991378B2 (zh)
EP (1) EP3565270B1 (zh)
CN (1) CN110415719B (zh)
DE (1) DE102018206689A1 (zh)
DK (1) DK3565270T3 (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102020214329A1 (de) 2020-11-13 2022-05-19 Sivantos Pte. Ltd. Verfahren zur Unterstützung bei der Nutzung eines Hörgerätes und Hörgerät
US11683634B1 (en) * 2020-11-20 2023-06-20 Meta Platforms Technologies, Llc Joint suppression of interferences in audio signal
DE102021205251A1 (de) * 2021-05-21 2022-11-24 Sivantos Pte. Ltd. Verfahren und Vorrichtung zur frequenzselektiven Verarbeitung eines Audiosignals mit geringer Latenz

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016018186A1 (en) * 2014-07-29 2016-02-04 Telefonaktiebolaget L M Ericsson (Publ) Estimation of background noise in audio signals
CN106982409A (zh) * 2016-01-19 2017-07-25 西万拓私人有限公司 减小滤波器组延迟时间的方法和低延迟运行助听器的方法

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5742694A (en) * 1996-07-12 1998-04-21 Eatwell; Graham P. Noise reduction filter
JP2001175298A (ja) * 1999-12-13 2001-06-29 Fujitsu Ltd 騒音抑圧装置
GB2446966B (en) * 2006-04-12 2010-07-07 Wolfson Microelectronics Plc Digital circuit arrangements for ambient noise-reduction
US8239190B2 (en) * 2006-08-22 2012-08-07 Qualcomm Incorporated Time-warping frames of wideband vocoder
JP4849023B2 (ja) * 2007-07-13 2011-12-28 ヤマハ株式会社 雑音抑圧装置
JP6109927B2 (ja) * 2012-05-04 2017-04-05 カオニックス ラブス リミテッド ライアビリティ カンパニー 源信号分離のためのシステム及び方法
US10497381B2 (en) * 2012-05-04 2019-12-03 Xmos Inc. Methods and systems for improved measurement, entity and parameter estimation, and path propagation effect measurement and mitigation in source signal separation
DK2864983T3 (en) * 2012-06-20 2018-03-26 Widex As PROCEDURE FOR SOUND HEARING IN A HEARING AND HEARING
JP6696424B2 (ja) * 2014-07-16 2020-05-20 日本電気株式会社 雑音抑圧システムと雑音抑圧方法及びプログラム
US20170061978A1 (en) * 2014-11-07 2017-03-02 Shannon Campbell Real-time method for implementing deep neural network based speech separation
DK3311591T3 (da) * 2015-06-19 2021-11-08 Widex As Fremgangsmåde til at betjene et høreapparatsystem og et høreapparatsystem
DK3118851T3 (da) * 2015-07-01 2021-02-22 Oticon As Forbedring af støjende tale baseret på statistiske tale- og støjmodeller
EP3217399B1 (en) * 2016-03-11 2018-11-21 GN Hearing A/S Kalman filtering based speech enhancement using a codebook based approach
US10251002B2 (en) * 2016-03-21 2019-04-02 Starkey Laboratories, Inc. Noise characterization and attenuation using linear predictive coding
DK3252766T3 (da) * 2016-05-30 2021-09-06 Oticon As Audiobehandlingsanordning og fremgangsmåde til estimering af signal-til-støj-forholdet for et lydsignal
JP6572937B2 (ja) * 2016-06-13 2019-09-11 株式会社デンソー 騒音低減装置、騒音低減方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016018186A1 (en) * 2014-07-29 2016-02-04 Telefonaktiebolaget L M Ericsson (Publ) Estimation of background noise in audio signals
CN106982409A (zh) * 2016-01-19 2017-07-25 西万拓私人有限公司 减小滤波器组延迟时间的方法和低延迟运行助听器的方法

Also Published As

Publication number Publication date
EP3565270A1 (de) 2019-11-06
EP3565270B1 (de) 2021-12-15
US20190333530A1 (en) 2019-10-31
US10991378B2 (en) 2021-04-27
DK3565270T3 (da) 2022-02-21
DE102018206689A1 (de) 2019-10-31
CN110415719A (zh) 2019-11-05

Similar Documents

Publication Publication Date Title
CN110415719B (zh) 用于在音频信号中进行噪音抑制的方法
JP6243536B2 (ja) エコー打ち消し
JP6281336B2 (ja) 音声復号化装置及びプログラム
EP2226794B1 (en) Background noise estimation
US8538052B2 (en) Generation of probe noise in a feedback cancellation system
JP2008176328A (ja) 拡張帯域幅を有する音響信号を提供する方法および装置
KR20070000995A (ko) 고조파 신호의 주파수 확장 방법 및 시스템
JP2007183306A (ja) 雑音抑制装置、雑音抑制方法、及びコンピュータプログラム
DK2394442T3 (en) Spectral band substitution to avoid the sheath and suboscillation
JPWO2006046293A1 (ja) 雑音抑圧装置
JP2013190470A (ja) 音響信号処理装置および音響信号処理方法
US8422708B2 (en) Adaptive long-term prediction filter for adaptive whitening
US9418677B2 (en) Noise suppressing device, noise suppressing method, and a non-transitory computer-readable recording medium storing noise suppressing program
JP6305694B2 (ja) 信号処理装置及び信号処理方法
JP5086442B2 (ja) 雑音抑圧方法及び装置
JP5377167B2 (ja) 悲鳴検出装置および悲鳴検出方法
US10652668B2 (en) Method and hearing aid for the frequency distortion of an audio signal
JP2008072600A (ja) 音響信号処理装置、音響信号処理プログラム、音響信号処理方法
JP2007310298A (ja) 帯域外信号生成装置及び周波数帯域拡張装置
CN111312261A (zh) 突发帧错误处理
JP2002175099A (ja) 雑音抑制方法および雑音抑制装置
JP5458057B2 (ja) 信号広帯域化装置、信号広帯域化方法、及びそのプログラム
Vashkevich et al. Petralex: A smartphone-based real-time digital hearing aid with combined noise reduction and acoustic feedback suppression
EP2127075B1 (en) Method and device for reducing ringing in a filter output signal
JP5056654B2 (ja) 雑音抑制装置、及び雑音抑制方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant