CN101071566B - 小阵列麦克风***、噪声抑制装置及其抑制方法 - Google Patents
小阵列麦克风***、噪声抑制装置及其抑制方法 Download PDFInfo
- Publication number
- CN101071566B CN101071566B CN2007101028377A CN200710102837A CN101071566B CN 101071566 B CN101071566 B CN 101071566B CN 2007101028377 A CN2007101028377 A CN 2007101028377A CN 200710102837 A CN200710102837 A CN 200710102837A CN 101071566 B CN101071566 B CN 101071566B
- Authority
- CN
- China
- Prior art keywords
- signal
- noise
- detection signal
- sound
- voice
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 13
- 238000001514 detection method Methods 0.000 claims abstract description 86
- 230000004913 activation Effects 0.000 claims description 27
- 230000001629 suppression Effects 0.000 claims description 11
- 230000002401 inhibitory effect Effects 0.000 claims description 4
- 230000005764 inhibitory process Effects 0.000 claims description 4
- 239000000203 mixture Substances 0.000 claims description 3
- 238000004364 calculation method Methods 0.000 description 13
- 238000001914 filtration Methods 0.000 description 10
- 238000005516 engineering process Methods 0.000 description 8
- 238000012545 processing Methods 0.000 description 7
- 238000006243 chemical reaction Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 5
- 238000009499 grossing Methods 0.000 description 5
- 101100129500 Caenorhabditis elegans max-2 gene Proteins 0.000 description 3
- 238000005070 sampling Methods 0.000 description 3
- 230000011218 segmentation Effects 0.000 description 3
- 230000000052 comparative effect Effects 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- NAWXUBYGYWOOIX-SFHVURJKSA-N (2s)-2-[[4-[2-(2,4-diaminoquinazolin-6-yl)ethyl]benzoyl]amino]-4-methylidenepentanedioic acid Chemical compound C1=CC2=NC(N)=NC(N)=C2C=C1CCC1=CC=C(C(=O)N[C@@H](CC(=C)C(O)=O)C(O)=O)C=C1 NAWXUBYGYWOOIX-SFHVURJKSA-N 0.000 description 1
- 230000002159 abnormal effect Effects 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000006735 deficit Effects 0.000 description 1
- 201000001098 delayed sleep phase syndrome Diseases 0.000 description 1
- 208000033921 delayed sleep phase type circadian rhythm sleep disease Diseases 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 238000000465 moulding Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000004549 pulsed laser deposition Methods 0.000 description 1
- 238000012797 qualification Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R3/00—Circuits for transducers, loudspeakers or microphones
- H04R3/005—Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/04—Segmentation; Word boundary detection
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Multimedia (AREA)
- General Health & Medical Sciences (AREA)
- Otolaryngology (AREA)
- Signal Processing (AREA)
- Circuit For Audible Band Transducer (AREA)
- Measurement Of Velocity Or Position Using Acoustic Or Ultrasonic Waves (AREA)
Abstract
小阵列麦克风***,具有一阵列麦克风,其具有多个麦克风,每一麦克风可提供一接收信号。第一语音启动检测器利用所述接收信号提供第一语音检测信号,用以代表在音束内的所需语音是否存在。一第二语音启动检测器利用所述接收信号提供第二语音检测信号,用以表示当在音束内的所需语音不存在时,在音束外的噪声是否存在。参考信号产生器根据该第一语音检测信号、所述接收信号以及音束成型信号,提供参考信号,其中该参考信号的所需语音已被抑制。空间滤波器根据该第二语音检测信号、该参考信号以及所述接收信号,提供该音束成型信号。多通道噪声抑制器用以抑制该音束成型的噪声并提供一输出信号。语音可靠度检测器提供可靠度检测信号,用以表示每一次频带的可靠度。
Description
技术领域
本发明涉及一种信号处理,特别是涉及一种抑制使用声音识别装置的小阵列麦克风***的噪声的方法及装置。
背景技术
近年来,在许多***(例如免持麦克风、遥控器、汽车定位***以及电话服务器服务)中,语音控制、语音输入及语音启动应用变得愈来愈受欢迎。然而,在现实环境中,由于噪声及干扰的影响,降低了语音识别装置的效能,而使得现行的语音识别技术无法达到最佳化。为了解决这个问题,已知技术使用前端噪声抑制程序,提高语音信号,再将提高后的信号输入至语音识别***。由于单一麦克风无法有效地处理噪声,特别是频率响应随时间而改变的噪声,例如其它的声音或是音乐,因此,已知技术利用阵列麦克风(arraymicrophone),改善语音识别***在不良环境中的效能。阵列麦克风不仅使用短暂的光谱信息,还利用空间信息。通过抑制噪声及干扰,使得语音更加清晰,并提供语音识别装置更精确的声音变化检测。
图1示出了已知适用于语音识别应用的阵列麦克风***的示意图。***100包括设置在不同位置的麦克风112a-112n。为了方便操作,麦克风112a-112n需相隔距离D。距离D最好是重要信号的频带波长的一半。麦克风112a-112n接收所需的语音启动、所在环境的噪声以及有害的干扰。放大器114a-114n用以放大麦克风112a-112n所接收的N个信号。模拟数字转换器(ADC)116a-116n转换放大器114a-114n所放大的N个信号,因而产生N个数字信号s1(n)-sN(N)。
麦克风112a-112n所接收的N个信号是由不同位置输入的,其代表麦克风的相对位置。N个数字信号s1(n)-sN(N)输入至空间滤波器(beamformer)118,并通过语音启动检测器122提高单一通道语音。被提高的单一通道语音信号输入至适应性噪声抑制滤波器120以及语音识别装置124。适应性噪声抑制滤波器120降低多通道的数字信号s1(n)-sN(N)的噪声成分,用以提高语音成分的信号噪声比(signal to noise ratio;SNR)。空间滤波器118用以抑制噪声及外部光线的干扰,并提高光线中所需的语音。空间滤波器118可为一固定的空间滤波器(如delay-and-sum beamformer;延迟总和空间滤波器)或是适应性空间滤波器(如adaptive sidelobe cancellationbeamformer;适应性旁瓣消除空间滤波器)。所述型式的空间滤波器均为本领域技术人员所熟知。
已知具有语音识别装置的阵列麦克风***100具有许多缺点,因而降低效能。第一种缺点为,阵列麦克风***100无法提供音束内(in-beam)及音束外(out-of-beam)信号给语音启动检测器。第二种缺点为,麦克风彼此之间的距离需维持在一最小距离。第三种缺点为,阵列麦克风***100不具有噪声抑制控制单元,用以抑制来自不同方向的噪声。第四种缺点为,对于四散的噪声无法达到最佳效能。
因此,能够有效地消除语音识别***的噪声的技术,是很令人期待的。
发明内容
本发明提供一种小阵列麦克风***,用于一语音识别装置,包括:一阵列麦克风,具有多个麦克风,每一麦克风提供一接收信号;一第一语音启动检测器,利用所述接收信号提供一第一语音检测信号,用以代表在音束内的所需语音是否存在;以及一第二语音启动检测器,利用所述接收信号提供一第二语音检测信号,用以表示当在音束内的所需语音不存在时,在音束外的噪声是否存在;一参考信号产生器,根据该第一语音检测信号、所述接收信号以及一音束成型信号,提供一参考信号,其中该参考信号的所需语音已被抑制;一空间滤波器,根据该第二语音检测信号、该参考信号以及所述接收信号,提供该音束成型信号,其中该音束成型信号的噪声已被抑制;一多通道噪声抑制器,用以抑制该音束成型信号的噪声并提供一输出信号;以及一语音可靠度检测器,提供一可靠度检测信号,用以表示该输出信号的每一次频带的可靠度,其中,该语音识别装置接收该第一语音检测信号、第二语音检测信号、该可靠度检测信号以及该输出信号。
本发明还提供一种噪声抑制装置,包括一用以得到一阵列麦克风中的多个麦克风所接收到的信号的装置、一根据所述接收信号而提供一第一语音检测信号的装置,用以表示在音束内的所需语音是否存在、一根据所述接收信号而提供一第二语音检测信号的装置,用以表示当音束内的所需语音不存在时,在音束外的噪声是否存在、一根据该第一语音检测信号、所述接收信号以及一音束成型信号而提供一参考信号的装置,其中该参考信号的所需语音已被抑制、一根据该第二语音检测信号、该参考信号以及所述接收信号而提供该音束成型信号的装置,其中该音束成型信号的噪声已被抑制、一用以抑制该音束成型信号的额外噪声的装置,用以提供一输出信号、以及一用以提供一可靠度检测信号的装置,该可靠度检测信号表示该输出信号的每一次频带的可靠度。
本发明还提供一种用以抑制一小阵列麦克风***的噪声及干扰的方法,该方法包括:由该小阵列麦克风***的多个麦克风中,得到多个接收信号;产生一第一及第二语音检测信号,其中该第一语音检测信号根据所述接收信号而被产生,用以代表在音束内的所需语音是否存在,该第二语音检测信号根据所述接收信号而被产生,用以代表当音束内的所需语音不存在时,音束外的噪声是否存在;根据该第一语音检测信号、所述接收信号以及一音束成型信号而产生一参考信号,其中该参考信号所需语音已抑制;根据该第二语音检测信号、该参考信号以及所述接收信号而产生该音束成型信号,其中该音束成型信号的噪声已被抑制;利用一多通道噪声抑制器抑制该音束成型信号的噪声,以产生一输出信号;产生一可靠度检测信号,代表该输出信号的每一次频带的可靠度;及提供该第一语音检测信号、该第二语音检测信号、该可靠度检测信号以及该输出信号给一语音识别装置。
为让本发明的上述和其它目的、特征、和优点能更明显易懂,下文特举出较佳实施例,并结合附图详细说明如下:
附图说明
图1示出了已知适用于语音识别应用的阵列麦克风***的示意图。
图2示出了本发明的小阵列麦克风***的示意图。
图3为语音启动检测器的一可能实施例。
图4为语音启动检测器的另一可能实施例。
图5为多通道噪声抑制器的一可能实施例。
图6为语音识别检测器的一可能实施例。
图7为小阵列麦克风***的另一可能实施例。
图8为输出信号b(n)的格式。
图9为小阵列麦克风***的另一可能实施例。
图10为具有小阵列麦克风***的***。
附图符号说明
112a-112n:麦克风;
114a-114n、214a、214b、714a、714b、914.1-914.n:放大器;
116a-116n、216a、216b、716a、716b、916.1-916.n:模拟数字转换器;
120:适应性噪声抑制滤波器;
118、250、750、950:空间滤波器;
122、220、230、720、730、920、930:语音启动检测器;
124、280、780、980、1050:语音识别装置;
212a、712a、1012a:单指向麦克风;
212b、712b、912.1-912.n、1012b:全指向麦克风;
240、740、940:参考产生器;
260、760、960:噪声抑制控制器;
270、770、970:多通道噪声抑制器;
790:混合器;
909:主信号形成单元;
910:次信号形成单元;
1020:模拟处理单元;
1030:数字信号处理器;
1040:存储器;
410:栅极;
412、414:预处理单元;
416、418:功率计算单元;
420、670:分割单元;
422、650、660:平滑滤波器;
424:临界计算单元;
426、680:比较器;
510:多通道快速付里叶转换单元;
520、530:噪声估计器;
540:语音可靠度检测器;
550:噪声抑制增益计算单元;
560:延迟单元;
580:反向快速付里叶转换;
610、620:频带分割单元;
630、640:频带功率计算单元。
具体实施方式
为方便起见,以下许多信号及控制为用小写或大写符号符号表示。时间差异信号及控制标示“n”及“m”,其中n表示取样时间,而m表示音帧索引。一个音帧是由L次取样而得到的。频率差异信号及控制标示为(k,m),其中k代表频率。小写符号(如s(n)及d(m))均代表时域信号,而大写符号(如B(k,m))代表频域信号。此处所提到的”噪声”,不管其来源为何,均指所有不好的信号,可能包含随机噪声、其它来源的语音、及/或来自其它音源的干扰。
本发明所述的噪声消除技术为处理一声音信号。该声音信号是由阵列麦克风所接收,并包含所需的语音及有害的噪声。通过多个不同位置或是不同极性图案的麦克风所提供的空间信息,可使阵列麦克风形成一音束(beam)。音束指向所需的语音,用以提高所需的语音,并且抑制所有来自音束以外的音源。相较于单一麦克风***或是已知技术,本发明的技术在吵杂的环境中,对于语音识别装置而言,更能改善语音识别。在本实施例中,提供一改善的噪声抑制***,其可适用在不同的环境、声音品质以及语音辨别方面。对于语音输入、免持通讯、及声音控制应用而言,本发明所提供的改善是很令人满意的。
图2示出了本发明的小阵列麦克风***的示意图。如图所示,小阵列麦克风***200具有多个麦克风。在本实施例中,小阵列麦克风***200里的麦克风彼此之间的距离可小于已知阵列麦克风***100的距离D。此外,小阵列麦克风***200里的麦克风可为全指向麦克风(omni-directionalmicrophone)及单指向麦克风(uni-directional microphone)的任何组合。全指向麦克风可撷取来自不同方向的信号及噪声,而单指向麦克风只能撷取其主要旁瓣方向的信号及噪声。
举例而言,若小阵列麦克风***200具有两个麦克风,一可为单指向麦克风,面向所需的音源,另一为全指向麦克风。两麦克风可轮流面向所需的音源。在另一实施例中,亦可利用两全指向麦克风。举例而言,假设,阵列麦克风***200里的两麦克风分别为单指向麦克风以及全指向麦克风时,单指向麦克风可为取样单指向麦克风,或是由两全指向麦克风组成。当两全指向麦克风构成单指向麦克风时,两全指向麦克风被排成一直线,并指向所需的音源。此两全指向麦克风之间具有一适当的距离。将设置在前方的全指向麦克风所接收到的信号减去后方的全指向麦克风所接收到的信号后,便可等效成单指向麦克风所接收到的信号。举例而言,由两全指向麦克风所构成的单指向麦克风可看作以本实施例所述的单指向麦克风,而设置在前方或后方的全指向麦克风可看作本实施例所述的全指向麦克风。在本实施例中,面向所需音源的单指向麦克风可作为第一通道,而全指向麦克风可作为第二通道。
简单来说,以下的小阵列麦克风***具有两个麦克风。
如图2所示,小阵列麦克风***200具有由麦克风212a及212b所构成的阵列麦克风。更明确地说,小阵列麦克风***200具有一全指向麦克风212b以及一单指向麦克风212a。如上所述,单指向麦克风212a可能由两个以上的全指向麦克风所构成。在一实施例中,全指向麦克风212b可以是另一全指向麦克风或是构成单指向麦克风212a的多个全指向麦克风的一者。在本实施例中,单指向麦克风212a作为参考麦克风,不但撷取所需声音信号,也会撷取噪声及干扰。单指向麦克风212a为主要麦克风,其主要旁瓣面向说话者,用以撷取所需的语音信号。
单指向麦克风212a以及全指向麦克风212b所接收到的信号分别提供给放大器214a及214b。模拟数字转换器216a接收并数字化放大器214a所放大的信号,以提供主信号s1(n)。模拟数字转换器216b接收并数字化放大器214b所放大的信号,以提供次信号a(n)。然而,在其它实施例中,主信号可能由面向所需音源的一单指向麦克风所提供,而次信号可能由面向所需音源的一单指向麦克风所提供。另外,主信号可能由全指向麦克风所提供,而次信号由面向所需音源的至少一单指向麦克风所提供。
语音启动检测器220接收主信号s1(n)及次信号a(n)。语音启动检测器220检测音束内的前端语音,其中音束取决于既定的总功率,总功率大于噪声功率。以下将会说明噪声功率。语音启动检测器220提供一在音束内的语音检测信号d1(n),其代表是否检测到前端语音。
语音启动检测器230接收主信号s1(n)、次信号a(n)以及在音束内的语音检测信号d1(n)。语音启动检测器230检测所缺少的前端语音以及在音束外的现有噪声/干扰,其中音束取决于主信号及所需语音信号之间的既定相互关系,既定相互关系大于总功率。语音启动检测器230提供音束外的噪声检测信号d2(n),其代表当前端语音不存在时,音束外是否存在噪声/干扰。
参考产生器240接收主信号s1(n)、次信号a(n)、音束内的语音检测信号d1(n)以及音束成型信号b1(n)。参考产生器240根据音束内的语音检测信号d1(n),更新本身的系数、并检测在主信号s1(n)、次信号a(n)以及音束成型信号b1(n)内的所需语音、并消除来自次信号a(n)的所需语音、以提供一参考信号r1(n)。参考信号r1(n)包含大部分的噪声及干扰。
空间滤波器250接收主信号s1(n)、次信号a(n)、参考信号r1(n)、以及音束外的噪声检测信号d2(n)。空间滤波器250根据音束外的噪声检测信号d2(n),更新本身的系数、并检测次信号a(n)以及参考信号r1(n)内的噪声及干扰、并消除来自主信号s1(n)的噪声及干扰以及提供音束成型信号b1(n)。音束成型信号b1(n)包含大部分的所需语音。
噪声抑制控制器260接收音束内的语音检测信号d1(n)、音束外的噪声检测信号d2(n)、参考信号r1(n)以及音束成型信号b1(n)。
多通道噪声抑制器270接收音束成型信号b1(n)以及参考信号r1(n)。多通道噪声抑制器270利用快速付里叶转换(Fast Fourier Transform;FFT),将音束成型信号b1(n)以及参考信号r1(n)由时域转换成具有L点快速付里叶转换频域,用以产生频域音束成型信号B(k,m)以及频域参考信号R(k,m)。音束内的语音检测信号d1(n)以及音束外的噪声检测信号d2(n)被转换成音帧索引(如音束内的语音检测信号d1(m)以及音束外的噪声检测信号d2(m)),用以代替多通道噪声抑制器270内的取样索引n。
多通道噪声抑制器270还会抑制频域音束成型信号B(k,m)内的噪声及干扰,并提供频域输出信号Bo(k,m),其具有大部分被抑制的噪声及干扰。在多通道噪声抑制器270内的反向快速付里叶转换接收频域输出信号Bo(k,m),并将频域输出信号Bo(k,m)由频域转换成时域,然后提供一对应时域的输出信号bo(n)。此外,一语音可靠度检测器产生一检测信号m(j),用以表示每一次频带(frequency subband)的可靠度。
输出信号bo(n)可以数字格式提供给语音识别***、或是被转换(如由数字信号转换成模拟信号)、被放大、被滤波...等,再提供给语音识别装置280。在本实施例中,语音识别装置280接收噪声已被抑制的语音信号bo(n)、检测信号m(j)、音束内的语音检测信号d1(n)以及音束外的噪声检测信号d2(n),用以执行语音识别功能。
图3为语音启动检测器的一可能实施例。如图所示,语音启动检测器300根据1.主信号s1(n)的功率、2.主信号s1(n)减去次信号a(n)后的噪声功率、以及3.上述1.2.之间的功率比,检测目前音束内的前端所需语音。
在语音启动检测器300中,减法单元310将主信号s1(n)减去次信号a(n),并产生一第一差异信号e1(n),其中e1(n)=s1(n)-a(n)。第一差异信号e1(n)包含大部分的噪声及干扰。预处理单元312及314分别接收主信号s1(n)及第一差异信号e1(n),利用相同的滤除系数,滤除对应信号的低频成分,并分别提供滤除后的信号及然后,功率计算单元316及318分别接收信号及用以计算所接收到的信号的功率,并分别提供计算后的结果ps1(n)以及pe1(n)。功率计算单元316及318还能计算结果ps1(n)以及pe1(n)的平均值。在本实施例中,平均值的计算方式如下式所示:
其中α1为一系数(0<α1<1),用以决定平均值的总合。较大的α1对应较大的平均值。ps1(n)不但具有音束内所需语音的功率,也具有噪声及干扰的功率。pe1(n)包含大部分的噪声及干扰。
分割单元320然后接收平均功率ps1(n)及pe1(n),并计算平均功率ps1(n)及pe1(n)的比例h1(n)。比例h1(n)的计算方式如下式所示:
比例h1(n)具有相对于噪声功率的大部分总功率。比例h1(n)的值愈大时,若音束内的前端所需语音存在时,表示相对于噪声功率的总功率愈大。较大的比例h1(n)表示音束内具有前端所需语音。
平滑滤波器(smoothing filter)322接收并平滑或滤除比例h1(n),并提供一平滑比例hs1(n)。平滑比例hs1(n)如下式所示:
hs1(n)=αh1·hs1(n-1)+(1-αh1)·h1(n).................................(3)
其中,αh1为一常数(0<α1<1),用以决定平滑的量。
临界计算单元324接收实时的比例h1(n)、平滑比例hs1(n)以及一临界值q1(n)。为了得到临界值q1(n),需先计算原始临界值q’1(n)。
其中,β1(β1>0)为一常数,在式(4)中,若实时的比例h1(n)大于β1hs1,则利用与平滑比例hs1(n)相同的手法,根据实时的比例h1(n),计算原始临界值q’1(n)。除此之外,对应于之前的取样周期,原始临界值会被维持住,并且原始临界值q’1(n)并不会根据比例h1(n)而被更新。如此,便可防止临界值在不正常的情况下,根据很小的比例h1(n)而被更新。
还可将原始临界值q’1(n)限制在范围Qmax1-Qmin1中。然后,临界值q1(n)被设定成等于原始临界值q’1(n)。设定的方式如下:
其中Qmax1与Qmin1均为常数。
因此,临界值q1(n)会根据比例h1(n)的平均值而被计算,其中较小的比例h1(n)会被排除。另外,还可将临界值q1(n)限制在范围Qmax1-Qmin1中。因此,可依据操作环境,适当地计算临界值q1(n)。
比较器326接收并比较比例h1(n)以及临界值q1(n),再根据比较结果提供音束内的语音检测信号d1(n)。比较方式如下式所示:
当音束内的语音检测信号d1(n)被设成定成1时,表示在音束内的前端所需语音已被检测到。当音束内的语音检测信号d1(n)被设成定0时,表示在音束内的前端所需语音未被检测到。
图4为语音启动检测器的另一可能实施例。如图所示,语音启动检测器400根据1.音束内的语音检测信号d1(n)、2.主信号s1(n)的总功率、3.主信号s1(n)与信号e1(n)之间的相互关系(e1(n)=s1(n)-a(n))、以及4.大于上述2.的上述3.的计算结果,检测缺少的前端所需语音,以及在音束外所存在的干扰及噪声。
语音启动检测器400具有栅极410,其接收音束内的语音检测信号d1(n),用以执行下列判断条件:
当音束内的所需语音被检测到时,音束内的语音检测信号d1(n)=1;当音束外的语音检测并未产生时,音束外的噪声检测信号d2(n)=0。当音束内的所需语音未被检测到,并且语音启动检测器已被启动时,音束内的语音检测信号d1(n)=0。
预处理单元412及414分别接收主信号s1(n)及第一差异信号e1(n),利用相同的滤除系数,滤除对应信号的低频成分,并分别提供滤除后的信号及预处理单元412及414的滤除参数可与预处理单元312及314相同或不同。
功率计算单元416接收信号用以计算所接收到的信号的功率,并提供计算后的结果Ps2(n)。功率计算单元418接收信号用以计算所接收到的信号的功率,并提供计算后的结果pse(n)。功率计算单元416及418还能计算结果Ps2(n)以及Pe2(n)的平均值。在本实施例中,功率计算单元416及418所计算出来的平均值如下式所示:
其中α2为一常数(0<α2<1),其可等于或不等于α1。
分割单元420然后接收平均功率ps2(n)及pse(n),并计算平均功率ps1(n)及pe1(n)的比例h2(n)。比例h2(n)的计算方式如下式所示:
平滑滤波器422接收并滤除或平滑比例h2(n),并提供一平滑比例hs2(n)。平滑比例hs2(n)如下式所示:
hs2(n)=αh2·hs2(n-1)+(1-αh2)·h2(n)..............................(9)
其中,αh2为一常数(0<α2<1),其可等于或不等于αh1。
临界计算单元424接收实时的比例h2(n)、平滑比例hs2(n)以及一临界值q2(n)。为了得到临界值q2(n),需先计算原始临界值q’2(n)。
其中,β2(β2>0)为一常数,其可等于或不等于β1。在式(10)中,若实时的比例h2(n)大于β2hs2,则利用与平滑比例hs2(n)相同的手法,根据实时的比例h2(n),计算原始临界值q’2(n)。除此之外,对应于之前的取样周期,原始临界值会被维持住。
还可将原始临界值q’2(n)限制在范围Qmax2-Qmin2中。然后,临界值q2(n)被设定成等于原始临界值q’2(n)。设定的方式如下:
其中Qmax2与Qmin2均为常数,例如Qmax2大于Qmin2。
比较器426接收并比较比例h2(n)以及临界值q2(n),再根据比较结果提供音束外的噪声检测信号d2(n)。比较方式如下式所示:
当音束外的噪声检测信号d2(n)被设成定1时,表示在音束外的干扰及噪声是存在的,而前端所需语音并不存在。
图5为多通道噪声抑制器的一可能实施例。多通道噪声抑制器500由噪声抑制控制信号c(m)所控制。噪声抑制控制信号c(m)由时域的噪声抑制控制信号c(n)转换而来的。
在多通道噪声抑制器500中,多通道快速付里叶转换单元510将空间滤波器250所输出的音束成型信号b1(n)、参考产生器240所输出的参考信号r1(n)转换成频域,因此可得到频域音束成型信号B(k,m)以及频域参考信号R(k,m)。噪声估计器520接收频域音束成型信号B(k,m),并估计在频域音束成型信号B(k,m)内的噪声量,并提供频域噪声信号N1(k,m)。噪声估计器可根据技术人员所深知的最小统计数据进行估计。举例而言,其中一种方式为R.Martin在1994年的European Signal Processing Conference(EUSIPCO)的第1182-1185页曾提出”利用最小统计数据估计光谱的减损”。噪声估计器530接收频域噪声信号N1(k,m)、频域参考信号R(k,m)、以及音束外的噪声检测信号d2(m),其中将音束外的噪声检测信号d2(n)由时域转换至频域后,便可得到音束外的噪声检测信号d2(m)。噪声估计器530决定频域音束成型信号B(k,m)的最后估计,并提供最终噪声估计N2(k,m)。最终噪声估计N2(k,m)的计算方式如下式所示:
其中,γa1、γa2、γb1及γb2为常数,其中,γa1>γb1>0,而γb2>γa2>0。如式(13)所示,最终噪声估计N2(k,m)被设定成等于第一标准噪声估计γx1·N1(k,m)与第二标准噪声估计γx2·|R(k,m)|的总合,其中,γx可等于γa或γb。常数γs1,γs2,γb1及γb2按比例方式排列,当音束外的噪声检测信号d2(m)=0,即表示音束外的噪声及干扰已被检测到,则最终噪声估计N2(k,m)具有大部分的噪声信号N1(k,m)以及少部分的参考信号量|R(k,m)|。相反的,当音束外的噪声检测信号d2(m)=1,即表示音束外的噪声及干扰未被检测到,则最终噪声估计N2(k,m)具有少部分的噪声信号N1(k,m)以及大部分的参考信号量|R(k,m)|。
噪声抑制增益计算单元550接收频域音束成型信号B(k,m)、最终噪声估计N2(k,m)、以及延迟单元560所提供的频域输出信号Bo(k,m-1)。噪声制增益计算单元550计算噪声抑制增益G(k,m),其用以抑制频域音束成型信号B(k,m)的额外噪声及干扰。
为了定义噪声抑制增益G(k,m),对于频域音束成型信号B(k,m)的信号噪声比估计G’SNR,B(k,m)要先得知,其得知方法如下式所示:
然后,如下式所示,信号噪声比估计G’SNR,B(k,m)会被限定成正值或于零。
接着,如下式所示,信号噪声比估计GSNR(k,m)将会被求得。
其中,λ为一正常数,例如1>λ>0。如式(16)所示,最终的信号噪声比估计GSNR(k,m)具有两成分,一是对于先前画面的输出信号的信号噪声比估计的标准版本(如λ·|Bo(k,m-1)|/N2(k,m)),另一是对于成型信号的被限制信号噪声比估计的标准版本(如(1-λ)·GDNR,B(k,m))。常数λ决定两成分的比重,以得到最终的信号噪声比估计GSNR(k,m)。
增益Go(k,m)计算如下所示:
增益Go(k,m)为一实值,其大小代表噪声抑制的结果。更进一步而言,当增益Go(k,m)的值愈小时,则噪声抑制量愈大;而当增益Go(k,m)的值愈大时,则噪声抑制量愈小。
最终增益G(k,m)的计算如下式所示:
其中,σ为正值,且大于1。当噪声抑制控制信号c(m)=1时,则最终增益G(k,m)更符合大量噪声的抑制。当噪声抑制控制信号c(m)=0时,最终增益G(k,m)等于增益Go(k,m)。乘法器570将频域音束成型信号B(k,m)与最终增益G(k,m)相乘,以得到频域输出信号Bo(k,m),其计算方式如下:
Bo(k,m)=B(k,m)·G(k,m).......................................(19)
反向快速付里叶转换580接收频域输出信号Bo(k,m),以产生被处理的语音信号bo(n)。
图6为语音识别检测器的一可能实施例。语音识别检测器600与语音识别检测器540相同。语音识别检测器600用以得知语音识别装置所撷取出的语音特色的每一次频带的可靠度。频带分割单元610及620分别接收最终噪声估计N2(k,m)以及频域输出信号Bo(k,m),并根据由语音识别装置所撷取出的语音特色分割频带。频带分割单元610及620分别产生输出信号及其中,j表示次频带的索引。频带功率计算单元630及640分别计算输出信号及的功率,以产生功率信号PN(j,m)及PB(j,m)。平滑滤波器650及660分别平均化功率信号PN(j,m)及PB(j,m),其平均化方式如下所示
其中,αN及αB均为常数,其决定平均化的量,并可被设定成0<αN,αB<1。当αN及αB的值较大时,表示具有较大的平均化及平滑量
分割器670利用平滑功率及以得到功率比D(j,m)。然后,比较功率比D(j,m)与预决定临界值T(j,m),以得到检测信号m(j),其表示每一次频带的可靠度。检测信号m(j)可被传送至语音识别***中,以改善撷取的特征。
图7为小阵列麦克风***的另一可能实施例。小阵列麦克风***700具有麦克风712a及712b、放大器714a及714b、模拟数字转换器716a及716b、语音启动检测器720、730、参考产生器740、空间滤波器750、多通道噪声抑制器770、噪声抑制控制器760、语音识别装置780、以及混合器790。
图7与图2不同之处在于,图7具有混合器790,用以混合语音信号bo(n)、检测信号m(j)、音束内的语音检测信号d1(n)、以及音束外的噪声检测信号d2(n),以产生具有特殊格式的输出信号b(n)。图8为输出信号b(n)的格式。在奇数数据b(n)(n=1,3,5...)中,最高的14位表示语音的实际声音数据。倒数第二个位用以放置检测信号m(j)。最后一个位用以放置音束内的语音检测信号d1(n)。在偶数数据b(n)(n=2,4,6...)中,最高的14位表示语音的实际声音数据。倒数第二个位用以放置检测信号m(j)。最后一个位用以放置音束外的噪声检测信号d2(n)。
图9为小阵列麦克风***的另一可能实施例。如图所示,小阵列麦克风***900具有语音启动检测器920、930、参考产生器940、空间滤波器950、多通道噪声抑制器970、噪声抑制控制器960、以及语音识别装置980。图9不同于图2之处在于,图9具有麦克风912.1-912.n,放大器914.1-914.n、模拟数字转换器916.1-916.n、主信号形成单元909以及次信号形成单元910,用以产生主信号s1(n)以及次信号a(n)。
图10为具有小阵列麦克风***的***。在此实施例中,***1000具有麦克风1012a及1012b、模拟处理单元1020、数字信号处理器(DSP)1030、存储器1040、以及语音识别装置1050。麦克风1012a及1012b可对应图2中的212a及212b。模拟处理单元1020执行模拟处理,并可具有如图2所示的放大器214a、214b以及模拟数字转换器216a及216b。数字信号处理器1030可改善用以抑制噪声及干扰的不同处理单元,如图2所示的语音启动检测器220、230、参考产生器240、空间滤波器250、多通道噪声抑制器270、噪声抑制控制器260、以及语音识别装置280。存储器1040用以储存程序代码及数字信号处理器1030所需的数据。
可利用不同的装置改善阵列麦克风及噪声抑制的技术。举例而言,所述技术可用硬件、软件或是软硬件来改善。若利用硬件改善,则可利用特定用途集成电路(application specific integrated circuits;ASICs)、数字信号处理器(DSPs)、数字信号处理装置(DSPDs)、可程序逻辑装置(PLDs)、现场可编程逻辑阵列(field programmable gate arrays;FPGAs)、处理器、控制器、微控制器、微处理器、其它上述的电子单元或上述组件的组合。
若利用软件改善,则可利用模块(如传统的做法等)执行上述的功能。软件的程序代码可储存在一存储器单元(如图10所示的存储器单元140)中,并可由处理器(如图10所示的DSP 1030)所执行。
虽然本发明已以较佳实施例披露如上,但其并非用以限定本发明,任何本领域技术人员,在不脱离本发明的精神和范围的前提下,当可作若干的更改与修饰,因此本发明的保护范围当以权利要求为准。
Claims (20)
1.一种小阵列麦克风***,用于一语音识别装置,包括:
一阵列麦克风,具有多个麦克风,每一麦克风提供一接收信号;
一第一语音启动检测器,利用所述接收信号提供一第一语音检测信号,用以代表在音束内的所需语音是否存在;以及
一第二语音启动检测器,利用所述接收信号提供一第二语音检测信号,用以表示当在音束内的所需语音不存在时,在音束外的噪声是否存在;
一参考信号产生器,根据该第一语音检测信号、所述接收信号以及一音束成型信号,提供一参考信号,其中该参考信号的所需语音已被抑制;
一空间滤波器,根据该第二语音检测信号、该参考信号以及所述接收信号,提供该音束成型信号,其中该音束成型信号的噪声已被抑制;
一多通道噪声抑制器,用以抑制该音束成型信号的噪声并提供一输出信号;以及
一语音可靠度检测器,提供一可靠度检测信号,用以表示该输出信号的每一次频带的可靠度,其中,该语音识别装置接收该第一语音检测信号、第二语音检测信号、该可靠度检测信号以及该输出信号。
2.如权利要求1所述的小阵列麦克风***,其中该第一语音检测信号取决于所述接收信号的总功率,所述接收信号的总功率大于噪声功率。
3.如权利要求1所述的小阵列麦克风***,其中该音束成型信号具有所需语音。
4.如权利要求1所述的小阵列麦克风***,其中所述接收信号具有一主信号以及至少一次信号。
5.如权利要求4所述的小阵列麦克风***,其中该主信号由一朝向一所需音源的单指向麦克风所提供,该次信号由至少一全指向麦克风所提供。
6.如权利要求4所述的小阵列麦克风***,其中该主信号由一单指向麦克风所提供,该次信号由至少一单指向麦克风所提供,提供该主信号的该单指向麦克风朝向一所需音源,提供该次信号的该单指向麦克风不朝向该所需音源。
7.如权利要求4所述的小阵列麦克风***,其中将一后方全指向麦克风所提供的信号减去一前方全指向麦克风所提供的信号,便可得到该主信号,该次信号为该后方全指向麦克风或该前方全指向麦克风所提供。
8.如权利要求4所述的小阵列麦克风***,其中该主信号由一全指向麦克风所提供,该次信号由至少一单指向麦克风提供,该单指向麦克风朝向一所需音源。
9.如权利要求1所述的小阵列麦克风***,其中该参考信号具有噪声。
10.如权利要求1所述的小阵列麦克风***,还包括一噪声抑制控制器,用以控制该多通道噪声抑制器的抑制功率。
11.如权利要求1所述的小阵列麦克风***,其中该参考信号产生器及该空间滤波器处理时域信号,该多通道噪声抑制器处理频域信号。
12.如权利要求1所述的小阵列麦克风***,还包括一混合器,用以提供一具有特殊格式的混合输出信号给该语音识别装置,该语音识别装置使用该混合输出信号、该可靠度检测信号以及该第一及第二语音检测信号。
13.一种噪声抑制装置,包括:
一用以得到一阵列麦克风中的多个麦克风所接收到的信号的装置;
一根据所述接收信号而提供一第一语音检测信号的装置,用以表示在音束内的所需语音是否存在;
一根据所述接收信号而提供一第二语音检测信号的装置,用以表示当音束内的所需语音不存在时,在音束外的噪声是否存在;
一根据该第一语音检测信号、所述接收信号以及一音束成型信号而提供一参考信号的装置,其中该参考信号的所需语音已被抑制;
一根据该第二语音检测信号、该参考信号以及所述接收信号而提供该音束成型信号的装置,其中该音束成型信号的噪声已被抑制;
一用以抑制该音束成型信号的额外噪声的装置,用以提供一输出信号;以及
一用以提供一可靠度检测信号的装置,该可靠度检测信号表示该输出信号的每一次频带的可靠度。
14.如权利要求13所述的噪声抑制装置,还包括一用以控制噪声抑制能力的装置。
15.如权利要求13所述的噪声抑制装置,其中该第一语音检测信号、该第二语音检测信号、该可靠度检测信号以及该输出信号均被提供至一语音识别装置中。
16.如权利要求15所述的噪声抑制装置,还包括一用以提供一混合信号给该语音识别装置的装置,该混合信号具有特殊格式。
17.一种用以抑制一小阵列麦克风***的噪声及干扰的方法,该方法包括:
由该小阵列麦克风***的多个麦克风中,得到多个接收信号;
产生一第一及第二语音检测信号,其中该第一语音检测信号根据所述接收信号而被产生,用以代表在音束内的所需语音是否存在,该第二语音检测信号根据所述接收信号而被产生,用以代表当音束内的所需语音不存在时,音束外的噪声是否存在;
根据该第一语音检测信号、所述接收信号以及一音束成型信号而产生一参考信号,其中该参考信号所需语音已被抑制;
根据该第二语音检测信号、该参考信号以及所述接收信号而产生该音束成型信号,其中该音束成型信号的噪声已被抑制;
利用一多通道噪声抑制器抑制该音束成型信号的噪声,以产生一输出信号;
产生一可靠度检测信号,代表该输出信号的每一次频带的可靠度;及
提供该第一语音检测信号、该第二语音检测信号、该可靠度检测信号以及该输出信号给一语音识别装置。
18.如权利要求17所述的方法,其中该第一语音检测信号取决于大于噪声功率的该接收信号的总功率。
19.如权利要求17所述的方法,还包括产生一噪声抑制控制信号的步骤,用以控制该多通道噪声抑制器的噪声抑制功率。
20.如权利要求17所述的方法,还包括一混合步骤,用以混合该输出信号、该可靠度检测信号以及该第一及第二语音检测信号,以产生一混合信号。
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US74678306P | 2006-05-09 | 2006-05-09 | |
US60/746,783 | 2006-05-09 | ||
US11/620,573 US8068619B2 (en) | 2006-05-09 | 2007-01-05 | Method and apparatus for noise suppression in a small array microphone system |
US11/620,573 | 2007-01-05 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101071566A CN101071566A (zh) | 2007-11-14 |
CN101071566B true CN101071566B (zh) | 2012-11-07 |
Family
ID=38898760
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2007101028377A Active CN101071566B (zh) | 2006-05-09 | 2007-05-09 | 小阵列麦克风***、噪声抑制装置及其抑制方法 |
Country Status (3)
Country | Link |
---|---|
US (1) | US8068619B2 (zh) |
CN (1) | CN101071566B (zh) |
TW (1) | TWI346934B (zh) |
Families Citing this family (91)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8019091B2 (en) | 2000-07-19 | 2011-09-13 | Aliphcom, Inc. | Voice activity detector (VAD) -based multiple-microphone acoustic noise suppression |
US9066186B2 (en) | 2003-01-30 | 2015-06-23 | Aliphcom | Light-based detection for acoustic applications |
US9099094B2 (en) | 2003-03-27 | 2015-08-04 | Aliphcom | Microphone array with rear venting |
JP4873913B2 (ja) * | 2004-12-17 | 2012-02-08 | 学校法人早稲田大学 | 音源分離システムおよび音源分離方法、並びに音響信号取得装置 |
EP1989777A4 (en) | 2006-03-01 | 2011-04-27 | Softmax Inc | SYSTEM AND METHOD FOR GENERATING A SEPARATE SIGNAL |
US8611560B2 (en) * | 2007-04-13 | 2013-12-17 | Navisense | Method and device for voice operated control |
US11217237B2 (en) | 2008-04-14 | 2022-01-04 | Staton Techiya, Llc | Method and device for voice operated control |
US11317202B2 (en) | 2007-04-13 | 2022-04-26 | Staton Techiya, Llc | Method and device for voice operated control |
US8625819B2 (en) | 2007-04-13 | 2014-01-07 | Personics Holdings, Inc | Method and device for voice operated control |
US8837746B2 (en) * | 2007-06-13 | 2014-09-16 | Aliphcom | Dual omnidirectional microphone array (DOMA) |
US8954324B2 (en) * | 2007-09-28 | 2015-02-10 | Qualcomm Incorporated | Multiple microphone voice activity detector |
US8121311B2 (en) * | 2007-11-05 | 2012-02-21 | Qnx Software Systems Co. | Mixer with adaptive post-filtering |
US9392360B2 (en) | 2007-12-11 | 2016-07-12 | Andrea Electronics Corporation | Steerable sensor array system with video input |
WO2009076523A1 (en) * | 2007-12-11 | 2009-06-18 | Andrea Electronics Corporation | Adaptive filtering in a sensor array system |
US8150054B2 (en) * | 2007-12-11 | 2012-04-03 | Andrea Electronics Corporation | Adaptive filter in a sensor array system |
CN101471970B (zh) * | 2007-12-27 | 2012-05-23 | 深圳富泰宏精密工业有限公司 | 便携式电子装置 |
TW200826062A (en) * | 2008-01-15 | 2008-06-16 | Asia Vital Components Co Ltd | System of inhibiting broadband noise of communication equipment room |
JP5156934B2 (ja) * | 2008-03-07 | 2013-03-06 | 学校法人日本大学 | 音響測定装置 |
US8812309B2 (en) * | 2008-03-18 | 2014-08-19 | Qualcomm Incorporated | Methods and apparatus for suppressing ambient noise using multiple audio signals |
WO2009130388A1 (en) * | 2008-04-25 | 2009-10-29 | Nokia Corporation | Calibrating multiple microphones |
US8244528B2 (en) | 2008-04-25 | 2012-08-14 | Nokia Corporation | Method and apparatus for voice activity determination |
US8275136B2 (en) * | 2008-04-25 | 2012-09-25 | Nokia Corporation | Electronic device speech enhancement |
KR101340520B1 (ko) * | 2008-07-22 | 2013-12-11 | 삼성전자주식회사 | 잡음을 제거하는 장치 및 방법 |
US9129291B2 (en) | 2008-09-22 | 2015-09-08 | Personics Holdings, Llc | Personalized sound management and method |
TWI396190B (zh) * | 2009-11-03 | 2013-05-11 | Ind Tech Res Inst | 降噪系統及降噪方法 |
US9838784B2 (en) | 2009-12-02 | 2017-12-05 | Knowles Electronics, Llc | Directional audio capture |
CN101827146A (zh) * | 2009-12-29 | 2010-09-08 | 中兴通讯股份有限公司 | 具有终端通话噪声抑制功能的装置、方法及通讯终端 |
US8626498B2 (en) * | 2010-02-24 | 2014-01-07 | Qualcomm Incorporated | Voice activity detection based on plural voice activity detectors |
CN101807404B (zh) * | 2010-03-04 | 2012-02-08 | 清华大学 | 一种电子耳蜗前端指向性语音增强的预处理*** |
US8798290B1 (en) | 2010-04-21 | 2014-08-05 | Audience, Inc. | Systems and methods for adaptive signal equalization |
US9203489B2 (en) | 2010-05-05 | 2015-12-01 | Google Technology Holdings LLC | Method and precoder information feedback in multi-antenna wireless communication systems |
US9558755B1 (en) * | 2010-05-20 | 2017-01-31 | Knowles Electronics, Llc | Noise suppression assisted automatic speech recognition |
KR101791444B1 (ko) * | 2010-11-29 | 2017-10-30 | 뉘앙스 커뮤니케이션즈, 인코포레이티드 | 동적 마이크로폰 신호 믹서 |
CN103354937B (zh) * | 2011-02-10 | 2015-07-29 | 杜比实验室特许公司 | 包括噪声抑制增益的中值滤波的后处理 |
US8929564B2 (en) | 2011-03-03 | 2015-01-06 | Microsoft Corporation | Noise adaptive beamforming for microphone arrays |
CN102307271A (zh) * | 2011-05-05 | 2012-01-04 | 上海博超科技有限公司 | 网络数字一体对讲***及其传输方法 |
US8934587B2 (en) * | 2011-07-21 | 2015-01-13 | Daniel Weber | Selective-sampling receiver |
US9173025B2 (en) | 2012-02-08 | 2015-10-27 | Dolby Laboratories Licensing Corporation | Combined suppression of noise, echo, and out-of-location signals |
US8712076B2 (en) | 2012-02-08 | 2014-04-29 | Dolby Laboratories Licensing Corporation | Post-processing including median filtering of noise suppression gains |
US8892046B2 (en) * | 2012-03-29 | 2014-11-18 | Bose Corporation | Automobile communication system |
US9966067B2 (en) | 2012-06-08 | 2018-05-08 | Apple Inc. | Audio noise estimation and audio noise reduction using multiple microphones |
US9640194B1 (en) | 2012-10-04 | 2017-05-02 | Knowles Electronics, Llc | Noise suppression for speech processing based on machine-learning mask estimation |
CZ304330B6 (cs) * | 2012-11-23 | 2014-03-05 | Technická univerzita v Liberci | Způsob potlačení šumu a zvýraznění řečového signálu pro mobilní telefon se dvěma nebo více mikrofony |
US9813262B2 (en) | 2012-12-03 | 2017-11-07 | Google Technology Holdings LLC | Method and apparatus for selectively transmitting data using spatial diversity |
US9591508B2 (en) | 2012-12-20 | 2017-03-07 | Google Technology Holdings LLC | Methods and apparatus for transmitting data between different peer-to-peer communication groups |
US9979531B2 (en) | 2013-01-03 | 2018-05-22 | Google Technology Holdings LLC | Method and apparatus for tuning a communication device for multi band operation |
US10347269B2 (en) * | 2013-03-12 | 2019-07-09 | Hear Ip Pty Ltd | Noise reduction method and system |
US10229697B2 (en) * | 2013-03-12 | 2019-03-12 | Google Technology Holdings LLC | Apparatus and method for beamforming to obtain voice and noise signals |
US20140268016A1 (en) | 2013-03-13 | 2014-09-18 | Kopin Corporation | Eyewear spectacle with audio speaker in the temple |
US9312826B2 (en) | 2013-03-13 | 2016-04-12 | Kopin Corporation | Apparatuses and methods for acoustic channel auto-balancing during multi-channel signal extraction |
US10306389B2 (en) | 2013-03-13 | 2019-05-28 | Kopin Corporation | Head wearable acoustic system with noise canceling microphone geometry apparatuses and methods |
KR102282366B1 (ko) | 2013-06-03 | 2021-07-27 | 삼성전자주식회사 | 음성 향상 방법 및 그 장치 |
GB2553683B (en) * | 2013-06-26 | 2018-04-18 | Cirrus Logic Int Semiconductor Ltd | Speech recognition |
US9697831B2 (en) | 2013-06-26 | 2017-07-04 | Cirrus Logic, Inc. | Speech recognition |
JP6206003B2 (ja) * | 2013-08-30 | 2017-10-04 | 沖電気工業株式会社 | 音源分離装置、音源分離プログラム、収音装置及び収音プログラム |
US9386542B2 (en) | 2013-09-19 | 2016-07-05 | Google Technology Holdings, LLC | Method and apparatus for estimating transmit power of a wireless device |
US9286897B2 (en) | 2013-09-27 | 2016-03-15 | Amazon Technologies, Inc. | Speech recognizer with multi-directional decoding |
US9532138B1 (en) * | 2013-11-05 | 2016-12-27 | Cirrus Logic, Inc. | Systems and methods for suppressing audio noise in a communication system |
US9549290B2 (en) | 2013-12-19 | 2017-01-17 | Google Technology Holdings LLC | Method and apparatus for determining direction information for a wireless device |
US9491007B2 (en) | 2014-04-28 | 2016-11-08 | Google Technology Holdings LLC | Apparatus and method for antenna matching |
US9467779B2 (en) | 2014-05-13 | 2016-10-11 | Apple Inc. | Microphone partial occlusion detector |
US9478847B2 (en) | 2014-06-02 | 2016-10-25 | Google Technology Holdings LLC | Antenna system and method of assembly for a wearable electronic device |
KR102208477B1 (ko) | 2014-06-30 | 2021-01-27 | 삼성전자주식회사 | 마이크 운용 방법 및 이를 지원하는 전자 장치 |
US9799330B2 (en) | 2014-08-28 | 2017-10-24 | Knowles Electronics, Llc | Multi-sourced noise suppression |
DE112015004185T5 (de) | 2014-09-12 | 2017-06-01 | Knowles Electronics, Llc | Systeme und Verfahren zur Wiederherstellung von Sprachkomponenten |
CN105791509A (zh) * | 2014-12-17 | 2016-07-20 | 中兴通讯股份有限公司 | 终端的搜索方法及装置 |
CN105848062B (zh) * | 2015-01-12 | 2018-01-05 | 芋头科技(杭州)有限公司 | 多声道的数字麦克风 |
DE112016000545B4 (de) | 2015-01-30 | 2019-08-22 | Knowles Electronics, Llc | Kontextabhängiges schalten von mikrofonen |
DK3057340T3 (da) * | 2015-02-13 | 2019-08-19 | Oticon As | Partnermikrofonenhed og et høresystem, der omfatter en partnermikrofonenhed |
WO2016156595A1 (en) * | 2015-04-02 | 2016-10-06 | Sivantos Pte. Ltd. | Hearing apparatus |
TWI573133B (zh) * | 2015-04-15 | 2017-03-01 | 國立中央大學 | 音訊處理系統及方法 |
US10186276B2 (en) * | 2015-09-25 | 2019-01-22 | Qualcomm Incorporated | Adaptive noise suppression for super wideband music |
US9691413B2 (en) | 2015-10-06 | 2017-06-27 | Microsoft Technology Licensing, Llc | Identifying sound from a source of interest based on multiple audio feeds |
US11631421B2 (en) | 2015-10-18 | 2023-04-18 | Solos Technology Limited | Apparatuses and methods for enhanced speech recognition in variable environments |
CN105242556A (zh) * | 2015-10-28 | 2016-01-13 | 小米科技有限责任公司 | 智能设备的语音控制方法、装置、控制设备及智能设备 |
EP3171613A1 (en) * | 2015-11-20 | 2017-05-24 | Harman Becker Automotive Systems GmbH | Audio enhancement |
CN106935246A (zh) * | 2015-12-31 | 2017-07-07 | 芋头科技(杭州)有限公司 | 一种基于麦克风阵列的人声获取方法及电子设备 |
US10482899B2 (en) | 2016-08-01 | 2019-11-19 | Apple Inc. | Coordination of beamformers for noise estimation and noise suppression |
US10564925B2 (en) | 2017-02-07 | 2020-02-18 | Avnera Corporation | User voice activity detection methods, devices, assemblies, and components |
CN108109631A (zh) * | 2017-02-10 | 2018-06-01 | 深圳市启元数码科技有限公司 | 一种小体积双麦克风语音采集降噪模组及其降噪方法 |
CN207744142U (zh) * | 2017-02-10 | 2018-08-17 | 深圳市启元数码科技有限公司 | 一种多功能骨传导助听*** |
JP2018191145A (ja) * | 2017-05-08 | 2018-11-29 | オリンパス株式会社 | 収音装置、収音方法、収音プログラム及びディクテーション方法 |
EP3425923B1 (en) * | 2017-07-06 | 2024-05-08 | GN Audio A/S | Headset with reduction of ambient noise |
US10405082B2 (en) | 2017-10-23 | 2019-09-03 | Staton Techiya, Llc | Automatic keyword pass-through system |
DK179837B1 (en) * | 2017-12-30 | 2019-07-29 | Gn Audio A/S | MICROPHONE APPARATUS AND HEADSET |
TWI665661B (zh) * | 2018-02-14 | 2019-07-11 | 美律實業股份有限公司 | 音頻處理裝置及音頻處理方法 |
US10957338B2 (en) * | 2018-05-16 | 2021-03-23 | Synaptics Incorporated | 360-degree multi-source location detection, tracking and enhancement |
CN111194040B (zh) * | 2018-11-15 | 2023-03-28 | 成都华为技术有限公司 | 波束上报的方法与装置 |
US11650625B1 (en) * | 2019-06-28 | 2023-05-16 | Amazon Technologies, Inc. | Multi-sensor wearable device with audio processing |
US20220392479A1 (en) * | 2021-06-04 | 2022-12-08 | Samsung Electronics Co., Ltd. | Sound signal processing apparatus and method of processing sound signal |
EP4156182A1 (en) * | 2021-09-28 | 2023-03-29 | GN Audio A/S | Audio device with distractor attenuator |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4523185A (en) * | 1982-03-15 | 1985-06-11 | Albert Roth | Zoned intrusion display with series-connected sensors |
US4586195A (en) * | 1984-06-25 | 1986-04-29 | Siemens Corporate Research & Support, Inc. | Microphone range finder |
CN1288223A (zh) * | 1999-09-14 | 2001-03-21 | 德国汤姆森-布兰特有限公司 | 用于语音控制的适应方向性特征的装置 |
CN1288222A (zh) * | 1999-09-14 | 2001-03-21 | 德国汤姆森-布兰特有限公司 | 具有麦克风阵列的语音控制*** |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
FI115867B (fi) * | 1996-12-20 | 2005-07-29 | Nokia Corp | Menetelmä ja järjestelmä puhelun tallentamiseksi muistivälineelle |
US6295364B1 (en) * | 1998-03-30 | 2001-09-25 | Digisonix, Llc | Simplified communication system |
US7565288B2 (en) * | 2005-12-22 | 2009-07-21 | Microsoft Corporation | Spatial noise suppression for a microphone array |
-
2007
- 2007-01-05 US US11/620,573 patent/US8068619B2/en active Active
- 2007-04-27 TW TW096115064A patent/TWI346934B/zh not_active IP Right Cessation
- 2007-05-09 CN CN2007101028377A patent/CN101071566B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4523185A (en) * | 1982-03-15 | 1985-06-11 | Albert Roth | Zoned intrusion display with series-connected sensors |
US4586195A (en) * | 1984-06-25 | 1986-04-29 | Siemens Corporate Research & Support, Inc. | Microphone range finder |
CN1288223A (zh) * | 1999-09-14 | 2001-03-21 | 德国汤姆森-布兰特有限公司 | 用于语音控制的适应方向性特征的装置 |
CN1288222A (zh) * | 1999-09-14 | 2001-03-21 | 德国汤姆森-布兰特有限公司 | 具有麦克风阵列的语音控制*** |
Also Published As
Publication number | Publication date |
---|---|
US20080317259A1 (en) | 2008-12-25 |
TWI346934B (en) | 2011-08-11 |
US8068619B2 (en) | 2011-11-29 |
TW200743096A (en) | 2007-11-16 |
CN101071566A (zh) | 2007-11-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101071566B (zh) | 小阵列麦克风***、噪声抑制装置及其抑制方法 | |
US10602267B2 (en) | Sound signal processing apparatus and method for enhancing a sound signal | |
US10251005B2 (en) | Method and apparatus for wind noise detection | |
Sondhi | New methods of pitch extraction | |
CN101430882B (zh) | 一种抑制风噪声的方法及装置 | |
US8355511B2 (en) | System and method for envelope-based acoustic echo cancellation | |
US9467775B2 (en) | Method and a system for noise suppressing an audio signal | |
Habets | Multi-channel speech dereverberation based on a statistical model of late reverberation | |
CN101751918B (zh) | 新型消音装置及消音方法 | |
CN111429939B (zh) | 一种双声源的声音信号分离方法和拾音器 | |
US20070104335A1 (en) | Acoustic feedback suppression for audio amplification systems | |
CN1331552A (zh) | 用于移动终端和其他设备的声音接近检测 | |
CN103238182A (zh) | 具有远程噪声检测器的降噪*** | |
EP3245795B1 (en) | Reverberation suppression using multiple beamformers | |
TW202117706A (zh) | 具多麥克風之語音增強裝置及方法 | |
CN101315772A (zh) | 基于维纳滤波的语音混响消减方法 | |
CN107863099A (zh) | 一种新型双麦克风语音检测和增强方法 | |
EP2752848A1 (en) | Method and apparatus for generating a noise reduced audio signal using a microphone array | |
KR20170063618A (ko) | 전자 장치 및 이의 잔향 제거 방법 | |
CN103905656A (zh) | 残留回声的检测方法及装置 | |
EP1793645A2 (en) | Acoustical feedback suppression for audio amplification systems | |
CN110689905B (zh) | 一种用于视频会议***的语音活动检测*** | |
CN110133572B (zh) | 一种基于Gammatone滤波器和直方图的多声源定位方法 | |
CN101826328A (zh) | 嵌入式无线可视门铃中的回音抵消方法 | |
Zhu et al. | Modified complementary joint sparse representations: a novel post-filtering to MVDR beamforming |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant |