CN101369427B - 用于音频信号处理的方法和装置 - Google Patents

用于音频信号处理的方法和装置 Download PDF

Info

Publication number
CN101369427B
CN101369427B CN2008101473859A CN200810147385A CN101369427B CN 101369427 B CN101369427 B CN 101369427B CN 2008101473859 A CN2008101473859 A CN 2008101473859A CN 200810147385 A CN200810147385 A CN 200810147385A CN 101369427 B CN101369427 B CN 101369427B
Authority
CN
China
Prior art keywords
signal
wave beam
microphone
noise contribution
power density
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN2008101473859A
Other languages
English (en)
Other versions
CN101369427A (zh
Inventor
马库斯·巴克
托拜厄斯·沃尔夫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nuance Communications Inc
Original Assignee
Nuance Communications Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nuance Communications Inc filed Critical Nuance Communications Inc
Publication of CN101369427A publication Critical patent/CN101369427A/zh
Application granted granted Critical
Publication of CN101369427B publication Critical patent/CN101369427B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/005Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/20Speech recognition techniques specially adapted for robustness in adverse environments, e.g. in noise, of stress induced speech
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/14Picture signal circuitry for video frequency region
    • H04N5/21Circuitry for suppressing or minimising disturbance, e.g. moiré or halo
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2430/00Signal processing covered by H04R, not provided for in its groups
    • H04R2430/20Processing of the output signals of the acoustic transducers of an array for obtaining a desired directivity characteristic
    • H04R2430/25Array processing for suppression of unwanted side-lobes in directivity characteristics, e.g. a blocking matrix

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Otolaryngology (AREA)
  • General Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Quality & Reliability (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Obtaining Desirable Characteristics In Audible-Bandwidth Transducers (AREA)
  • Diaphragms For Electromechanical Transducers (AREA)
  • Orthopedics, Nursing, And Contraception (AREA)

Abstract

本发明涉及用于音频信号处理的方法,包括通过麦克风阵列检测音频信号以获得麦克风信号(ym);通过波束形成装置(11)处理麦克风信号(ym)以获得波束形成的信号(A);通过阻塞矩阵装置(12)处理麦克风信号(ym)以获得每个麦克风信号(ym)的噪声成分的功率密度(Um);处理每个麦克风信号(ym)的噪声成分的功率密度(Um)以从每个麦克风信号(ym)的噪声成分(Um)获得平均短时功率密度(V);基于从每个麦克风信号(ym)的噪声成分的功率密度(Um)获得的平均短时功率密度(V),估计波束形成的信号(A)的噪声成分(An)的功率密度并且基于波束形成的信号(A)的噪声成分(An)的估计的功率密度(
Figure D2008101473859A00011
),对波束形成的信号(A)进行后滤波以获得增强的波束形成的信号(P)。

Description

用于音频信号处理的方法和装置
技术领域
本发明涉及电子辅助通信环境中的音频信号的降噪技术。具体而言,本发明涉及麦克风信号的波束形成和波束形成的信号的后滤波以获得增强的声学信号,尤其是语音信号。 
背景技术
相互发射和接收音频信号,尤其是语音信号的双方双向语音通信通常遭受背景噪声引起的音频信号的质量的衰减。噪声环境中的背景噪声可能严重影响声音交流的质量和可理解性,且在最坏情况,可能导致通信的完全中断。 
一个突出的示例是交通工具中的免持语音通信。免持电话提供尤其用于机动车辆的舒适和安全的通信***。在免持电话的情况下,强制抑制噪声以确保通信。例如由于车辆的速度和道路噪声,噪声信号的幅度和频率是随时间变化的。 
在现有技术中,采用谱减法的单通道降噪方法是公知的。例如,语音信号通过某些子带滤波装置被分割成子带,且降噪算法被应用于每一个子带。然而,这些方法(大多数)限制于平稳噪声扰动(stationarynoise perturbation)和正信噪距离(positive signal-to-noise distance)。因为根据这些方法,扰动不能消除,而是抑制了被噪声影响的频谱分量,所以处理的语音信号失真。因而语音信号的可理解性通常不能得到充分改善。 
在远距离谈话语音获取中改善信号质量的另一方法是利用多通道***,即麦克风阵列,例如,如在“Microphone Arrays:Signal ProcessingTechniques and Applications”,eds.Brandstein,M.and Ward,D.,Springer,Berlin 2001中所描述的麦克风阵列。执行多个麦克风信号的波束形成以获得增强的声学信号。 
当前的多通道***主要使用所谓的“广义旁瓣相消器”(GSC), 例如,见“An alternative approach to linearly constrained adaptivebeamforming”,by Griffiths,L.J.and Jim,C.W.,IEEE Transactions onAntennas and Propagation,vol.30.,p.27,1982。GSC包括两个信号处理路径:具有阻塞矩阵和自适应噪声相消装置的第一(或下)自适应路径以及具有固定波束形成器的第二(或上)非自适应路径。 
固定波束形成器例如使用固定波束图案通过用于时间延迟补偿的装置改善预处理的信号。自适应处理方法的特征在于***操作过程中诸如滤波器系数之类的处理参数的持久自适应。GSC的下信号处理路径被优化以产生用于减去固定波束形成器的输出信号的残余噪声的噪声参考信号。降噪信号处理路径通常包括接收语音信号且用于产生噪声参考信号的阻塞矩阵。在最简单的实现中,阻塞矩阵执行对接收的信号的相邻通道的减法。 
然而,由于用于自适应所需的有限的收敛时间,自适应波束形成器在随时间高度变换的扰动的情况中并不是很成功。另一方面,非平稳扰动在真实生活应用中是极其普遍的。 
因而,需要用于在麦克风信号的波束形成的环境中进行降噪的改进的方法和***。 
发明内容
鉴于上述情况,在本发明中,提供一种用于音频信号处理的方法,包括: 
通过麦克风阵列检测音频信号,尤其是语音信号,以获得麦克风信号(ym); 
通过波束形成装置(11)处理麦克风信号(ym)以获得波束形成的信号(A); 
通过阻塞矩阵装置(12)处理麦克风信号(ym)以获得每个麦克风信号(ym)的噪声成分(noise contribution)的(频谱)功率密度(Um); 
处理每个麦克风信号(ym)的噪声成分的功率密度(Um)以从每个麦克风信号(ym)的噪声成分的功率密度(Um)获得平均短时功率密度(V); 
基于从每个麦克风信号(ym)的噪声成分的功率密度(Um)获得 的平均短时功率密度(V),估计波束形成的信号(A)的噪声成分(An)的(频谱)功率密度;以及 
基于波束形成的信号(A)的噪声成分(An)的估计的(频谱)功率密度( 
Figure G2008101473859D00031
),对波束形成的信号(A)进行后滤波以获得增强的波束形成的信号(P)。 
麦克风阵列包括很多(M个)麦克风,具体而言,方向性麦克风。每个麦克风检测声音,例如,口头说话,并产生麦克风信号ym(m=1,..,M)。本发明的目的是通过降噪增强这些麦克风信号。为了获得该目的,麦克风信号被波束形成装置(例如本领域中已知的固定(非自适应)波束形成器)波束形成,且被设计成获得噪声信号的阻塞矩阵装置处理,所述噪声信号代表麦克风信号中存在的噪声。 
在下面的描述中,假设在子带域中而不是离散时间域中执行信号处理。然而,原则上,本发明可应用于时间和频谱信号表达二者。对于子带体制中的处理,麦克风信号(ym)可通过分析滤波器组分成子带以获得在时间k用于频率子带Ωμ的子带信号 
Figure G2008101473859D00032
(虚数单元由j表示)。类似地,增强的波束形成的信号(P)可以被合成滤波器组滤波以获得增强的音频信号,例如,降噪的语音信号。 
如本领域已知的,子带域中的波束形成的信号代表在时间k用于频率子带Ωμ的离散傅立叶变换系数 
Figure G2008101473859D00033
波束形成装置的这个输出信号被后滤波以用于降噪。注意,波束形成的信号 
Figure G2008101473859D00034
可以是已经通过阻塞矩阵装置获得的每个麦克风信号(ym)的(功率密度)噪声成分的方式而获得的降噪的信号。例如,当通过采用延迟求和(delay-and-sum)的波束形成器的广义旁瓣相消器(GSC)实现时,对于获得的波束形成的信号 
Figure G2008101473859D00035
每个麦克风信号的噪声成分已经被减去。在这种情况下,后滤波处理移除了在通过GSC对麦克风信号进行处理之后仍存在的残余噪声。 
而且,可以采用自适应加权求和波束形成器,其组合M个麦克风的时间校准信号(time aligned signal)ym,以通过采用滤波(波束形成)权重获得一个输出信号,该滤波权重不是在固定波束形成器情况下的与时间无关的权重,但是如有需要,该自适应加权求和波束形成器必须被重复地计算以例如维持所需方向中的灵敏度且最小化噪声源方向 中的灵敏度。 
本发明的一个本质特征在于基于波束形成的信号(A)的噪声成分(An)的估计的(频谱)功率密度( )实施波束形成的信号(A)的后滤波处理,其中基于获得的每个麦克风信号(ym)的噪声成分的短时功率密度(V)获得估计的(频谱)功率密度( 
Figure G2008101473859D00042
),即 
V ( e jΩ μ , k ) = 1 M Σ m = 1 M U m ( e jΩ μ , k ) U * m ( e jΩ μ , k )
其中M表示麦克风的数目且星号表示共轭复数。在每个子带中, 
Figure G2008101473859D00044
表示麦克风信号ym(l)中存在的噪声成分的(频谱)功率密度(在麦克风信号的子带滤波之后)。 
与现有技术提出的解决方案相比,用于对波束形成的信号进行滤波的波束形成的信号的噪声成分的功率密度的估计的每个麦克风信号的噪声成分的平均短时功率密度的使用导致显著增强(降噪)的波束形成的信号。 
对波束形成装置的输出进行后滤波的步骤优选地可以通过某些维纳类滤波器(Wiener like filter)实现。这种滤波器的滤波特征根据波束形成信号的噪声成分的估计的功率密度进行适应。 
使用每个麦克风信号的噪声成分的平均短时功率密度以获得用于对波束形成装置的输出信号进行滤波的后滤波装置的滤波系数的有效方法是将每个麦克风信号(ym)的噪声成分的短时功率密度(V)与在k时刻用于频带Ωμ的实数因子 
Figure G2008101473859D00045
相乘,其中实数因子 
Figure G2008101473859D00046
被适应以满足期望值E的关系。 
E { A ~ n ( e jΩ μ , k ) } = E { | A ( e jΩ μ , k ) | 2 A s ( e jΩ μ , k ) = 0 }
其中 
Figure G2008101473859D00048
和 
Figure G2008101473859D00049
分别表示波束形成的信号(A)的噪声成分(An)的估计的功率密度 
Figure G2008101473859D000410
波束形成信号(A)的噪声成分以及波束形成装置的期望输出信号的部分(A=An+As)。如果处理的被麦克风阵列的M个麦克风探测的音频信号是语音信号,实数系数 
Figure G2008101473859D000411
的适应优选地仅在语音停顿,即理想地满足 
Figure G2008101473859D000412
=0的时段中实施。 
如上所述,对波束形成的信号(A)进行后滤波的步骤可以包括(或 由以下步骤组成)通过维纳滤波装置 对波束形成的信号(A)进行滤波以根据 P = ( e jΩ μ ) = H ( e jΩ μ , k ) A ( e jΩ μ , k ) 获得增强的波束形成的信号(P),其中 
H ( e jΩ μ , k ) = 1 - Y ^ a ( e jΩ μ , k ) - 1 ,
其中 
Figure G2008101473859D00054
表示用于 
Figure G2008101473859D00055
的估计,其中 是k时刻用于频率子带Ωμ的波束形成的信号 
Figure G2008101473859D00057
的噪声成分。而 可以容易地从波束形成装置的输出获得,如上所述(也参见下面的详细描述)获得 
Figure G2008101473859D00059
的估计(即 
Figure G2008101473859D000510
)。这样设计的维纳滤波器的采用导致具有稳定收敛特征的非常有效和可靠的后滤波。此外,通过上述维纳类滤波器的这种后滤波装置的实现在处理器负载和时间消耗方面是有利的。 
根据一个优选实施例,根据最大后验估计,通过优化获得 
Figure G2008101473859D000511
即用于 
Figure G2008101473859D000512
的估计。最大后验估计的方法与最大似然方法密切相关并且在现有技术中已知(例如,见M.DeGroot,“OptimalStatistical Decisions”,McGraw-Hill,1970)。最大后验估计导致非常有效地减小波束形成的信号中存在的(残余)噪声的维纳滤波特性。而用于滤波器特性的第一估计由 
Figure G2008101473859D000513
给出,其中 Y ~ a ( e jΩ μ , k ) = A ( e jΩ μ , k ) | 2 / β ( e jΩ μ , k ) V ( e jΩ μ , k ) (参见上面和下面的详细描述),如下所述, 
Figure G2008101473859D000516
能够通过最大后验估计的过程的方式进行优化。 
在对数表达中,有: 
Γ ~ a ( e jΩ μ , k ) = 10 log Y ~ a ( e jΩ μ , k ) = Γ a ( e jΩ μ , k ) + Δ ( e jΩ μ , k )
其中估计的实际比率为 Γ a ( e jΩ μ , k ) = 10 log { | A ( e jΩ μ , k ) | 2 | A n ( e jΩ μ , k ) | - 2 } , 且估计误差 Δ ( e jΩ μ , k ) = 10 log { | A n ( e jΩ μ , k ) | / A ~ n ( e jΩ μ , k ) } 是波束形成信号 
Figure G2008101473859D000520
的噪声成分的估计的功率密度的测量。在语音停顿  ( Γ a ( e jΩ μ , k ) = 0 ) 期间,估计误差 导致所谓的音乐噪声(musicalnoise)形式的伪迹。通过最大后验估计过程的方式获得估计 
Figure G2008101473859D000523
以 减小音乐噪声。该过程的细节在下面的详细描述中描述。 
本发明还提供计算机程序产品,该计算机程序产品包括一个或多个计算机可读媒介,该计算机可读媒介具有用于执行上述发明方法的示例的步骤的计算机可执行指令。 
而且,此处提供一种信号处理装置,包括: 
麦克风阵列,包括至少两个麦克风,所述至少两个麦克风被配置以获得检测的麦克风信号(ym); 
波束形成装置,被配置成处理所述麦克风信号(ym)以获得波束形成的信号(A); 
阻塞矩阵装置,被配置成处理所述麦克风信号(ym)以获得每个麦克风信号(ym)的噪声成分的功率密度(Um); 
处理装置,被配置成处理每个麦克风信号(ym)的噪声成分的功率密度(Um)以从每个麦克风信号(ym)的噪声成分的功率密度(Um)获得平均短时功率密度(V); 
处理装置,被配置成基于从每个麦克风信号(ym)的噪声成分的功率密度(Um)获得的平均短时功率密度(V),估计波束形成的信号(A)的噪声成分(An)的功率密度;以及 
后滤波装置,被配置成基于所述波束形成的信号(A)的噪声成分(An)的估计的功率密度( 
Figure G2008101473859D00061
),对所述波束形成的信号(A)进行滤波以获得增强的波束形成的信号(P)。 
信号处理装置还可以包括分析滤波器组,被配置成对麦克风信号(ym)进行滤波以获得k时刻用于频率子带Ωμ的子带信号 
Figure G2008101473859D00062
以及合成滤波器组,被配置成对增强的波束形成的信号(P)进行滤波以获得增强的音频信号(p)。 
具体而言,信号可以包括广义旁瓣相消器,该广义旁瓣相消器包括波束形成装置、阻塞矩阵和处理装置,该处理装置被配置成输出通过阻塞矩阵装置的方式获得的降噪的波束形成的信号。 
应当注意,信号处理装置也可以被配置成通过每个麦克风信号(ym)的噪声成分的短时功率密度(V)与k时刻用于频率子带Ωμ的实数因子 
Figure G2008101473859D00063
的乘积估计波束形成的信号(A)的噪声成分(An)的功率密度,该实数因子 
Figure G2008101473859D00064
被适应以满足期望值E的关系 
E { A ~ n ( e jΩ μ , k ) } = E { | A ( e jΩ μ , k ) | 2 A s ( e jΩ μ , k ) = 0 }
其中 
Figure G2008101473859D00072
和 
Figure G2008101473859D00073
分别表示波束形成的信号(A)的噪声成分(An)的估计的功率密度、波束形成的信号(A)的噪声成分以及波束形成装置的期望输出信号的部分。 
后滤波装置可以有利地是维纳类滤波器 H ( e j Ω μ , k ) = 1 - Y ^ a ( e jΩ μ , k ) - 1 , 其中 
Figure G2008101473859D00075
表示用于 
Figure G2008101473859D00076
的估计,其中 
Figure G2008101473859D00077
是k时刻用于频率子带Ωμ的波束形成的信号 
Figure G2008101473859D00078
的噪声成分。具体而言,根据最大后验估计,可以通过优化获得 
Figure G2008101473859D00079
此处揭示的信号处理装置的示例可以有利地用在各种电子通信设备中。因而,提供包括信号处理装置的上述示例之一的语音识别或语音对话装置。此外,提供包括信号处理装置的上述示例之一的免持电话机。 
将参考附图描述本发明的附加特征和优点。在描述中,对附图做出引用,附图旨在说明本发明的优选实施例。应当理解这些实施例不代表本发明的全部范围。 
附图说明
图1示出此处揭示的方法的实例的基本步骤,该方法用于包括GSC处理和后滤波标量(post-filter scalar)的估计的降噪; 
图2示出了根据包括GSC、MAP优化装置和后滤波装置的本发明的示例的信号处理装置的组成。 
具体实施方式
如图1所示,通过麦克风阵列的M个麦克风(具体而言,方向性麦克风)获得的麦克风信号ym(I),m=1,..,M被GSC(广义旁瓣相消器)处理1,其中I表示离散时间索引。GSC包括两个信号处理路径:具有阻塞矩阵和自适应噪声相消装置的第一自适应路径以及具有使用固定波束图案改善例如通过时间延迟补偿的方式进行预处理的信号的 固定波束形成器的第二路径。所述阻塞矩阵被优化以产生用于减去固定波束形成器的输出信号的(残余)噪声的噪声参考信号。 
如现有技术中已知的,通过GSC的方式,获得在k时刻用于频率子带Ωμ的离散傅立叶变换(DFT)系数,即子带信号, 
Figure G2008101473859D00081
(虚数单元由j表示)。而且,对于每个通道m,获得作为被包括在使用的GSC中的阻塞矩阵所输出的子带信号的麦克风信号ym(l)的噪声部分 
Figure G2008101473859D00082
本发明的基本特征在于基于阻塞矩阵的输出 
Figure G2008101473859D00083
和用于对GSC的输出 
Figure G2008101473859D00084
进行后滤波3的GSC的输出 
Figure G2008101473859D00085
确定2后滤波标量 
Figure G2008101473859D00086
以获得降噪的DFT系数 
Figure G2008101473859D00087
且最终获得降噪的音频信号(期望信号)p(l)。本发明尤其考虑 
Figure G2008101473859D00088
的有效和可靠的确定。下面,参考图2描述信号处理和本发明的信号处理装置的示例的细节。 
麦克风信号ym(l)被分析滤波器组10处理以获得适于进一步处理的子带信号 
Figure G2008101473859D00089
分析滤波器组例如可以实现汉宁窗(Hanningwindowing)、汉明窗(Hamming windowing)或高斯窗(Gaussianwindowing)。子带信号 被输入在GSC中,该GSC包括波束形成器11和阻塞矩阵12以及降噪装置13,该降噪装置13从子带信号 
Figure G2008101473859D000811
减去阻塞矩阵12获得的估计的噪声以获得降噪的离散傅立叶变换(DFT)系数 
Figure G2008101473859D000812
阻塞矩阵12是自适应型滤波装置。阻塞矩阵输出的所得的噪声信号将理想地完全阻隔输入信号内所需的或有用的信号。可以使用Walsh-Hadamard型阻塞矩阵或Griffiths-Jim阻塞矩阵。对于包括M=2n个麦克风的阵列,尤其可以建立Walsh-Hadamard阻塞矩阵。 
根据本发明,GSC的输出将经过某种处理以进一步减小残余噪声。后滤波器装置14可以以维纳滤波器或谱减法滤波器的形式实现。维纳类滤波器的滤波特性为: 
H ( e jΩ ) = 1 - ( S a s a s ( Ω ) + S a n a n ( Ω ) S a n a n ( Ω ) ) - 1
其中 
Figure G2008101473859D000814
和 分别表示期望信号的自动功率密度谱和 GSC的输出 
Figure G2008101473859D00091
中包含的噪声扰动。而且,假设期望信号和噪声扰动不相关。 
上述公式的括号中给出的后验信噪比(SNR)通常通过本技术领域中已知的用于平稳扰动的时间平均进行估计。然而,本发明涉及时间相关的扰动的抑制。因而,必须获得用于后滤波标量的时间相关估计 
Y a ( e jΩ μ , k ) = | A ( e jΩ μ , k ) | 2 | A n ( e jΩ μ , k ) | 2
(其中An表示A的噪声部分),以用于GSC的输出 
Figure G2008101473859D00093
的后滤波。 
为了获得用于 
Figure G2008101473859D00094
的估计 必须通过估计An获得发声方向的信息。注意A可以直接从GSC的输出获得。An从阻塞矩阵12的输出信号获得。为了更加精确,根据本示例,通过图2的阶段15获得阻塞矩阵的输出信号的平均短时功率密度 
Figure G2008101473859D00096
V ( e jΩ μ , k ) = 1 M Σ m = 1 M U m ( e jΩ μ , k ) U * m ( e jΩ μ , k )
其中星号表示复数共轭。通过实数因子 
Figure G2008101473859D00098
可以获得用于 
Figure G2008101473859D00099
的估计 
Figure G2008101473859D000910
即, A ~ n ( e jΩ μ , k ) = β ( e jΩ μ , k ) V ( e jΩ μ , k ) . 根据本示例,实数因子 被适应以满足用于期望值E的关系 
E { A ~ n ( e jΩ μ , k ) } = E { | A ( e jΩ μ , k ) | 2 A s ( e jΩ μ , k ) = 0 }
其中 
Figure G2008101473859D000914
是GSC的输出 的期望信号的部分。因而得到 
Y ~ a ( e jΩ μ , k ) = | A ( e jΩ μ , k ) | 2 | A ~ n ( e jΩ μ , k ) | 2
通过因子 
Figure G2008101473859D000917
获得GSC的输出的功率密度的功率自适应16和阻塞矩阵。在图2的阶段17中确定后滤波标量的估计 
Figure G2008101473859D000918
在阶段18中执行后滤波标量的优化。下面描述优化处理。 
根据图2所示的本示例,后滤波装置14将基于噪声功率谱密度的最大后验(MAP)估计进行自适应。MAP估计能够容易地在对数表达 中获得,且因而,用于后滤波标量的对数估计可以以公式表达为: 
Γ ~ a ( e jΩ μ , k ) = 10 log Y ~ a ( e jΩ μ , k ) = 10 log | A ( e jΩ μ , k ) | 2 | A n ( e jΩ μ , k ) | 2 + 10 log | A n ( e jΩ μ , k ) | 2 | A ~ n ( e jΩ μ , k ) | 2
= 10 log Y a ( e jΩ μ , k ) + 10 log δ ( e jΩ μ , k )
= Γ a ( e jΩ μ , k ) + Δ ( e jΩ μ , k )
其中 
Figure G2008101473859D00104
代表估计误差。估计误差导致语音停顿期间所谓的音乐噪声伪迹。很明显,希望对该估计误差 
Figure G2008101473859D00105
进行最小化。 
如下获得估计误差 
Figure G2008101473859D00106
的最小化。应当注意,假设 
Figure G2008101473859D00107
和 
Figure G2008101473859D00108
为随机变量表达。 
对于给定的可观察量,即 
Figure G2008101473859D00109
数量被估计的概率,即 
Figure G2008101473859D001010
假设通过条件密度 
Figure G2008101473859D001011
(为简单起见,下面忽略自变量 
Figure G2008101473859D001012
)给出特定值。根据MAP的原理(细节参见E. 
Figure G2008101473859D001013
“Statistische Signale”,Springer Verlag,Berlin(Germany),2001),我们必须选择最大化 的Γa的值。 
Γ ^ a = arg max ρ ( Γ a | Γ ~ a ) Γ a
通过贝叶斯准则(Bayes rule),条件密度ρ可以表达为: 
ρ ( Γ a | Γ ~ a ) = ρ ( Γ ~ a | Γ a ) ρ ( Γ a ) ρ ( Γ ~ a )
其中ρ(Γa)已知为先验密度。最大化要求: 
∂ ρ ( Γ ~ a | Γ a ) ρ ( Γ a ) ∂ Γ a = 0
基于经验研究,条件密度可以通过使用变量ψΔ的高斯分布来模拟: 
ρ ( Γ ~ a | Γ a ) = 1 2 π ψ Δ exp ( - ( Γ ~ a - Γ a ) 2 2 ψ Δ ) .
然后,假设期望信号和扰动的实数和虚数部分可以描述为平均自由高斯(average-free Gaussians),同一变量ρ(Γa)可以通过下式进行近似: 
ρ ( Γ a ) = 1 2 π ψ Γ a ( ξ ) exp ( - ( Γ a - μ Γ a ( ξ ) ) 2 2 ψ Γ a ( ξ ) )
其中先验SNR为ξ=Ψsn ψ Γ a ( ξ ) = Kξ / ( 1 + ξ ) μ Γ a ( ξ ) = 10 log ( ξ + 1 ) , 其中K是变量 
Figure G2008101473859D00115
的上限。实验显示例如使用K=50可以获得满意的结果。 
上述最大化需求的解导致: 
Γ ^ a = Kξ Γ ~ a + ( ξ + 1 ) ψ Δ 10 log ( ξ + 1 ) Kξ + ( ξ + 1 ) ψ Δ
从该公式可以容易得出标量估计 Y ^ a = 10 Γ ^ a / 10 .
在上述等式中,即时后验SNR被表达为干扰测量值 
Figure G2008101473859D00118
前验SNRξ以及变量ΨΔ的函数(注意,对于ΨΔ=0, Γ ^ a = Γ ~ a )。注意在ΨΔ→∞的极限中,获得标准维纳特性的滤波权重。而且,如果例如在语音停顿期间前验SNRξ可忽略,滤波器将被关闭以避免音乐噪声伪迹。 
因此,为每个时刻k以及频率***点Ωμ获得用于后滤波装置14的上述维纳特性,如下: 
H ( e jΩ μ , k ) = 1 - Y ^ a - 1 ( e jΩ μ , k ) .
GSC的输出,即,DFT系数 
Figure G2008101473859D001111
被如上所述的自适应的后滤波装置14滤波。该滤波导致降噪的DFT系数 P ( e jΩ μ , k ) = H ( e jΩ μ , k ) A ( e jΩ μ , k ) . 最后,采用合成滤波器组19以获得全带降噪音频信号p(l)。 
为了实现上述方法,必须确定参数ξ、ΨΔ和K。对于变量 
Figure G2008101473859D001114
的上限K,已经证明约50的值是成功的。确定先验SNRξ的已知方法是以下论文中介绍的所谓的直接决定方法:Ephraim and Malah,“SpeechEnhancement Using a Minimum Mean-Square Error Short-Time SpectralAmplitude Estimator”,IEEE Transactions on Acoustics,Speech and SignalProcessing,vol.ASSP-32,No.6,December,1984。根据该方法,ξ可以估计为: 
ξ ( k ) = a ξ P ( k - 1 ) ψ ^ n ( 1 - a ξ ) F [ | A ( k ) | 2 ψ ^ n - 1 ] , 其中 
F [ x ] = x , ifx > 0 0 , else , 且P(k-1)表示时间k-1时后滤波装置14的输出的 DFT系数的平方幅度。实数因子aξ是近似1的平滑因子,例如为0.98。 
在语音停顿中不通过时间平滑的方式确定干扰 的变量的估计。而是通过递归确定 
Figure G2008101473859D00122
为 
ψ ^ n ( k ) = a n ψ ^ n ( k - 1 ) + ( 1 - a n ) A ~ n ( k )
使用关于干扰的方向的空间信息。平滑因子an可以选自0.6至0.8。 
最后,在语音停顿(即Ψs=0)的过程中,根据 
ψ ^ Δ ( k ) = a Δ ( k ) ψ ^ Δ ( k - 1 ) + ( 1 - a Δ ( k ) ) ( Γ ~ a ( k ) ) ) 2 , 其中 
a Δ ( k ) = a 0 , if ψ s = 0 0 , else ,
Figure G2008101473859D00126
也被递归地确定,平滑因子an可以选自0.6至0.8。 
所有上述实施例并不旨在限制目的,而是用作说明本发明的特征和优点的示例。应当理解某些或所有上述特征可以以不同的方式组合。 

Claims (11)

1.用于音频信号处理的方法,包括:
通过麦克风阵列检测音频信号以获得麦克风信号(ym);
通过波束形成装置(11)处理麦克风信号(ym)以获得波束形成的信号(A);
通过阻塞矩阵装置(12)处理麦克风信号(ym)以获得每个麦克风信号(ym)的噪声成分的功率密度(Um);
处理每个麦克风信号(ym)的噪声成分的功率密度(Um)以从每个麦克风信号(ym)的噪声成分的功率密度(Um)获得平均短时功率密度(V);
基于从每个麦克风信号(ym)的噪声成分的功率密度(Um)获得的平均短时功率密度(V),估计波束形成的信号(A)的噪声成分(An)的功率密度;以及
基于波束形成的信号(A)的噪声成分(An)的估计的功率密度
Figure FSB00000732998700011
对波束形成的信号(A)进行后滤波以获得增强的波束形成的信号(P)。
2.根据权利要求1所述的方法,其中波束形成的信号(A)是通过阻塞矩阵装置获得的每个麦克风信号(ym)的噪声成分而获得的降噪信号。
3.根据权利要求1或2所述的方法,还包括:
通过分析滤波器组对麦克风信号(ym)进行滤波以获得在k时刻用于频率子带Ωμ的子带信号
Figure FSB00000732998700012
以及
通过合成滤波器组对增强的波束形成的信号(P)进行滤波以获得增强的音频信号(p)。
4.根据权利要求1或2所述的方法,其中通过从每个麦克风信号(ym)的噪声成分的功率密度(Um)获得的平均短时功率密度(V)与在k时刻用于频率子带Ωμ的实数因子
Figure FSB00000732998700013
的乘积,估计波束形成的信号
Figure FSB00000732998700021
的噪声成分(An)的功率密度,实数因子
Figure FSB00000732998700022
被适应以满足期望值E的以下关系:
E { A ~ n ( e j Ω μ , k ) } = E { | A ( e j Ω μ , k ) | 2 A s ( e j Ω μ , k ) = 0 }
其中
Figure FSB00000732998700024
Figure FSB00000732998700025
分别表示波束形成的信号(A)的噪声成分(An)的估计的功率密度、波束形成的信号(A)的噪声成分以及波束形成装置的期望输出信号的部分。
5.根据权利要求1或2所述的方法,其中对波束形成的信号(A)进行后滤波的步骤包括通过维纳滤波装置
Figure FSB00000732998700026
对波束形成的信号(A)进行滤波以根据
Figure FSB00000732998700027
获得增强的波束形成的信号(P),其中
H ( e j Ω μ , k ) = 1 - y ^ a ( e j Ω μ , k ) - 1 ,
其中
Figure FSB00000732998700029
表示用于的估计,其中
Figure FSB000007329987000211
是在k时刻用于频率子带Ωμ的波束形成的信号
Figure FSB000007329987000212
的噪声成分。
6.根据权利要求5所述的方法,其中根据最大后验估计,通过优化获得
Figure FSB000007329987000213
即用于
Figure FSB000007329987000214
的估计。
7.信号处理装置,包括:
麦克风阵列,包括至少两个麦克风,该至少两个麦克风被配置以获得检测的麦克风信号(ym);
波束形成装置(11),被配置成处理麦克风信号(ym)以获得波束形成的信号(A):
阻塞矩阵装置(12),被配置成处理麦克风信号(ym)以获得每个麦克风信号(ym)的噪声成分的功率密度(Um);
第一处理装置(15),被配置成处理每个麦克风信号(ym)的噪声成分的功率密度(Um)以从每个麦克风信号(ym)的噪声成分的功率密度(Um)获得平均短时功率密度(V);
第二处理装置(16),被配置成基于从每个麦克风信号(ym)的噪声成分的功率密度(Um)获得的平均短时功率密度(V),估计波束形成的信号(A)的噪声成分(An)的功率密度;以及
后滤波装置(14),被配置成基于波束形成的信号(A)的噪声成分(An)的估计的功率密度
Figure FSB00000732998700031
对波束形成的信号(A)进行滤波以获得增强的波束形成的信号(P)。
8.根据权利要求7所述的信号处理装置,还包括:
分析滤波器组(10),被配置成对麦克风信号(ym)进行滤波以获得在k时刻用于频率子带Ωμ的子带信号
Figure FSB00000732998700032
以及
合成滤波器组(19),被配置成对增强的波束形成的信号(P)进行滤波以获得增强的音频信号(p)。
9.根据权利要求7或8所述的信号处理装置,包括广义旁瓣相消器,该广义旁瓣相消器包括波束形成装置(11)、阻塞矩阵装置(12)和第三处理装置(13),该第三处理装置(13)被配置成输出通过阻塞矩阵装置(12)获得的降噪的波束形成的信号。
10.语音识别或语音会话装置,包括根据权利要求7-9中的一个所述的信号处理装置。
11.免持电话机,包括根据权利要求7-9中的一个所述的信号处理装置。
CN2008101473859A 2007-08-13 2008-08-13 用于音频信号处理的方法和装置 Expired - Fee Related CN101369427B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP07015908.2 2007-08-13
EP07015908A EP2026597B1 (en) 2007-08-13 2007-08-13 Noise reduction by combined beamforming and post-filtering

Publications (2)

Publication Number Publication Date
CN101369427A CN101369427A (zh) 2009-02-18
CN101369427B true CN101369427B (zh) 2012-07-04

Family

ID=38982719

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2008101473859A Expired - Fee Related CN101369427B (zh) 2007-08-13 2008-08-13 用于音频信号处理的方法和装置

Country Status (8)

Country Link
US (1) US8180069B2 (zh)
EP (1) EP2026597B1 (zh)
JP (1) JP5436814B2 (zh)
KR (1) KR101526932B1 (zh)
CN (1) CN101369427B (zh)
AT (1) ATE448649T1 (zh)
CA (1) CA2638469A1 (zh)
DE (1) DE602007003220D1 (zh)

Families Citing this family (48)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8296135B2 (en) * 2008-04-22 2012-10-23 Electronics And Telecommunications Research Institute Noise cancellation system and method
WO2011047887A1 (en) 2009-10-21 2011-04-28 Dolby International Ab Oversampling in a combined transposer filter bank
KR101581885B1 (ko) * 2009-08-26 2016-01-04 삼성전자주식회사 복소 스펙트럼 잡음 제거 장치 및 방법
US9215527B1 (en) * 2009-12-14 2015-12-15 Cirrus Logic, Inc. Multi-band integrated speech separating microphone array processor with adaptive beamforming
JP5678445B2 (ja) * 2010-03-16 2015-03-04 ソニー株式会社 音声処理装置、音声処理方法およびプログラム
US8538035B2 (en) * 2010-04-29 2013-09-17 Audience, Inc. Multi-microphone robust noise suppression
US8473287B2 (en) 2010-04-19 2013-06-25 Audience, Inc. Method for jointly optimizing noise reduction and voice quality in a mono or multi-microphone system
US8781137B1 (en) 2010-04-27 2014-07-15 Audience, Inc. Wind noise detection and suppression
CA3160488C (en) 2010-07-02 2023-09-05 Dolby International Ab Audio decoding with selective post filtering
CN101976565A (zh) * 2010-07-09 2011-02-16 瑞声声学科技(深圳)有限公司 基于双麦克风语音增强装置及方法
US8447596B2 (en) 2010-07-12 2013-05-21 Audience, Inc. Monaural noise suppression based on computational auditory scene analysis
CN102376309B (zh) * 2010-08-17 2013-12-04 骅讯电子企业股份有限公司 降低环境噪音的***、方法与应用的装置
JP5573517B2 (ja) 2010-09-07 2014-08-20 ソニー株式会社 雑音除去装置および雑音除去方法
US8861756B2 (en) 2010-09-24 2014-10-14 LI Creative Technologies, Inc. Microphone array system
US9078077B2 (en) 2010-10-21 2015-07-07 Bose Corporation Estimation of synthetic audio prototypes with frequency-based input signal decomposition
US8675881B2 (en) 2010-10-21 2014-03-18 Bose Corporation Estimation of synthetic audio prototypes
CN102509552B (zh) * 2011-10-21 2013-09-11 浙江大学 一种基于联合抑制的麦克风阵列语音增强方法
CN103295582B (zh) * 2012-03-02 2016-04-20 联芯科技有限公司 噪声抑制方法及其***
CN102664023A (zh) * 2012-04-26 2012-09-12 南京邮电大学 一种麦克风阵列语音增强的优化方法
US9538285B2 (en) * 2012-06-22 2017-01-03 Verisilicon Holdings Co., Ltd. Real-time microphone array with robust beamformer and postfilter for speech enhancement and method of operation thereof
EP2701145B1 (en) 2012-08-24 2016-10-12 Retune DSP ApS Noise estimation for use with noise reduction and echo cancellation in personal communication
CN103730123A (zh) * 2012-10-12 2014-04-16 联芯科技有限公司 噪声抑制中衰减因子的估计方法和装置
TWI524705B (zh) * 2013-05-15 2016-03-01 瑞昱半導體股份有限公司 通訊系統校正方法以及通訊系統校正裝置
US20180317019A1 (en) 2013-05-23 2018-11-01 Knowles Electronics, Llc Acoustic activity detecting microphone
US9978387B1 (en) * 2013-08-05 2018-05-22 Amazon Technologies, Inc. Reference signal generation for acoustic echo cancellation
TW201507489A (zh) * 2013-08-09 2015-02-16 Nat Univ Tsing Hua 利用陣列麥克風消除迴聲的方法
US9437212B1 (en) * 2013-12-16 2016-09-06 Marvell International Ltd. Systems and methods for suppressing noise in an audio signal for subbands in a frequency domain based on a closed-form solution
US10043532B2 (en) * 2014-03-17 2018-08-07 Nec Corporation Signal processing apparatus, signal processing method, and signal processing program
JP2016042132A (ja) * 2014-08-18 2016-03-31 ソニー株式会社 音声処理装置、音声処理方法、並びにプログラム
US9953646B2 (en) 2014-09-02 2018-04-24 Belleau Technologies Method and system for dynamic speech recognition and tracking of prewritten script
CN107112012B (zh) 2015-01-07 2020-11-20 美商楼氏电子有限公司 用于音频处理的方法和***及计算机可读存储介质
KR101649198B1 (ko) 2015-06-19 2016-08-18 국방과학연구소 빔형성 정보 기반 최적 스무딩 필터를 이용한 객체 궤적 추정 방법 및 장치
CN106328154B (zh) * 2015-06-30 2019-09-17 芋头科技(杭州)有限公司 一种前端音频处理***
CN105427860B (zh) * 2015-11-11 2019-09-03 百度在线网络技术(北京)有限公司 远场语音识别方法和装置
EP3171613A1 (en) * 2015-11-20 2017-05-24 Harman Becker Automotive Systems GmbH Audio enhancement
US9721582B1 (en) 2016-02-03 2017-08-01 Google Inc. Globally optimized least-squares post-filtering for speech enhancement
CN106710601B (zh) * 2016-11-23 2020-10-13 合肥美的智能科技有限公司 一种语音信号降噪拾音处理方法和装置及冰箱
EP3529986A1 (en) * 2016-12-23 2019-08-28 Huawei Technologies Co., Ltd. Low complexity mixed domain collaborative in-loop filter for lossy video coding
WO2018219582A1 (en) * 2017-05-29 2018-12-06 Harman Becker Automotive Systems Gmbh Sound capturing
JP6973484B2 (ja) 2017-06-12 2021-12-01 ヤマハ株式会社 信号処理装置、遠隔会議装置、および信号処理方法
DE102018117557B4 (de) * 2017-07-27 2024-03-21 Harman Becker Automotive Systems Gmbh Adaptives nachfiltern
US10325583B2 (en) * 2017-10-04 2019-06-18 Guoguang Electric Company Limited Multichannel sub-band audio-signal processing using beamforming and echo cancellation
WO2019223650A1 (zh) * 2018-05-22 2019-11-28 出门问问信息科技有限公司 一种波束成形方法、多波束成形方法、装置及电子设备
CN111261178A (zh) * 2018-11-30 2020-06-09 北京京东尚科信息技术有限公司 波束形成方法和装置
CN111863000A (zh) * 2019-04-30 2020-10-30 北京嘀嘀无限科技发展有限公司 音频处理方法、装置、电子设备及可读存储介质
EP3994867A4 (en) 2019-07-03 2023-07-26 The Board Of Trustees Of The University Of Illinois SEPARATION OF SPACE-TIME SIGNALS WITH MOVING AND ASYNCHRONOUS ARRAYS
JP6854967B1 (ja) * 2019-10-09 2021-04-07 三菱電機株式会社 雑音抑圧装置、雑音抑圧方法、及び雑音抑圧プログラム
CN110782913A (zh) * 2019-10-30 2020-02-11 通用微(深圳)科技有限公司 一种基于通用mcu的波束成形语音增强算法的实现

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5353376A (en) * 1992-03-20 1994-10-04 Texas Instruments Incorporated System and method for improved speech acquisition for hands-free voice telecommunication in a noisy environment
CN1523573A (zh) * 2003-09-12 2004-08-25 中国科学院声学研究所 一种采用后置滤波器的多通道语音增强方法
CN1753094A (zh) * 2004-09-23 2006-03-29 精碟科技股份有限公司 光信息储存媒体的制造方法
EP1771034A2 (de) * 2005-09-30 2007-04-04 Siemens Audiologische Technik GmbH Mikrofonkalibrierung bei einem RGSC-Beamformer
CN1947171A (zh) * 2004-04-28 2007-04-11 皇家飞利浦电子股份有限公司 自适应波束形成器、旁瓣抑制器、自动语音通信设备

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6415253B1 (en) * 1998-02-20 2002-07-02 Meta-C Corporation Method and apparatus for enhancing noise-corrupted speech
CN1320522C (zh) * 2002-01-09 2007-06-06 皇家飞利浦电子股份有限公司 具有与频谱功率比值相关的处理器的音频增强***
EP1475997A3 (en) 2003-05-09 2004-12-22 Harman/Becker Automotive Systems GmbH Method and system for communication enhancement in a noisy environment
ATE487332T1 (de) * 2003-07-11 2010-11-15 Cochlear Ltd Verfahren und einrichtung zur rauschverminderung
EP1640971B1 (en) 2004-09-23 2008-08-20 Harman Becker Automotive Systems GmbH Multi-channel adaptive speech signal processing with noise reduction
JP4671303B2 (ja) * 2005-09-02 2011-04-13 国立大学法人北陸先端科学技術大学院大学 マイクロホンアレイ用ポストフィルタ

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5353376A (en) * 1992-03-20 1994-10-04 Texas Instruments Incorporated System and method for improved speech acquisition for hands-free voice telecommunication in a noisy environment
CN1523573A (zh) * 2003-09-12 2004-08-25 中国科学院声学研究所 一种采用后置滤波器的多通道语音增强方法
CN1947171A (zh) * 2004-04-28 2007-04-11 皇家飞利浦电子股份有限公司 自适应波束形成器、旁瓣抑制器、自动语音通信设备
CN1753094A (zh) * 2004-09-23 2006-03-29 精碟科技股份有限公司 光信息储存媒体的制造方法
EP1771034A2 (de) * 2005-09-30 2007-04-04 Siemens Audiologische Technik GmbH Mikrofonkalibrierung bei einem RGSC-Beamformer

Also Published As

Publication number Publication date
EP2026597A1 (en) 2009-02-18
US20090067642A1 (en) 2009-03-12
US8180069B2 (en) 2012-05-15
CN101369427A (zh) 2009-02-18
EP2026597B1 (en) 2009-11-11
DE602007003220D1 (de) 2009-12-24
JP5436814B2 (ja) 2014-03-05
ATE448649T1 (de) 2009-11-15
KR101526932B1 (ko) 2015-06-08
CA2638469A1 (en) 2009-02-13
KR20090017435A (ko) 2009-02-18
JP2009049998A (ja) 2009-03-05

Similar Documents

Publication Publication Date Title
CN101369427B (zh) 用于音频信号处理的方法和装置
CN110085248B (zh) 个人通信中降噪和回波消除时的噪声估计
EP2081189B1 (en) Post-filter for beamforming means
EP2245861B1 (en) Enhanced blind source separation algorithm for highly correlated mixtures
Benesty et al. Speech enhancement in the STFT domain
Gannot et al. Adaptive beamforming and postfiltering
EP2237271B1 (en) Method for determining a signal component for reducing noise in an input signal
CN101510426A (zh) 一种噪声消除方法及***
WO2007026827A1 (ja) マイクロホンアレイ用ポストフィルタ
Reindl et al. A stereophonic acoustic signal extraction scheme for noisy and reverberant environments
Song et al. An integrated multi-channel approach for joint noise reduction and dereverberation
Freudenberger et al. Microphone diversity combining for in-car applications
Hashemgeloogerdi et al. Joint beamforming and reverberation cancellation using a constrained Kalman filter with multichannel linear prediction
Kim et al. Probabilistic spectral gain modification applied to beamformer-based noise reduction in a car environment
Buck et al. A compact microphone array system with spatial post-filtering for automotive applications
Kim et al. Hybrid probabilistic adaptation mode controller for generalized sidelobe canceller-based target-directional speech enhancement
CN102598128A (zh) 信号处理方法、信息处理装置及用于存储信号处理程序的存储介质
Martın-Donas et al. A postfiltering approach for dual-microphone smartphones
Malek et al. Informed generalized sidelobe canceler utilizing sparsity of speech signals
Kim et al. Generalized optimal multi-microphone speech enhancement using sequential minimum variance distortionless response (MVDR) beamforming and postfiltering
CN111863017B (zh) 一种基于双麦克风阵列的车内定向拾音方法及相关装置
Ito et al. A blind noise decorrelation approach with crystal arrays on designing post-filters for diffuse noise suppression
Vicinus et al. Voice Activity Detection within the Nearfield of an Array of Distributed Microphones
Nordholm¹ et al. 10 Adaptive Microphone Array Employing Spatial Quadratic Soft Constraints and Spectral Shaping
Kim Interference suppression using principal subspace modification in multichannel Wiener filter and its application to speech recognition

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
ASS Succession or assignment of patent right

Owner name: NUANCE COMMUNICATIONS INC.

Free format text: FORMER OWNER: HARMANBECKER AUTOMOTIVE ELECTRONIC SYSTEMS CO,. LTD.

Effective date: 20100421

C41 Transfer of patent application or patent right or utility model
COR Change of bibliographic data

Free format text: CORRECT: ADDRESS; FROM: KARLSBAD, GERMANY TO: MASSACHUSETTS, U.S.A.

TA01 Transfer of patent application right

Effective date of registration: 20100421

Address after: Massachusetts, USA

Applicant after: Nuance Communications Inc

Address before: Carlsbad

Applicant before: Harman Becker Automotive Sys

C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20120704

Termination date: 20200813

CF01 Termination of patent right due to non-payment of annual fee