JP2000047699A - 雑音抑圧処理装置および雑音抑圧処理方法 - Google Patents
雑音抑圧処理装置および雑音抑圧処理方法Info
- Publication number
- JP2000047699A JP2000047699A JP10217519A JP21751998A JP2000047699A JP 2000047699 A JP2000047699 A JP 2000047699A JP 10217519 A JP10217519 A JP 10217519A JP 21751998 A JP21751998 A JP 21751998A JP 2000047699 A JP2000047699 A JP 2000047699A
- Authority
- JP
- Japan
- Prior art keywords
- noise
- input
- frequency
- beamformer
- target sound
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims description 103
- 238000012937 correction Methods 0.000 claims abstract description 100
- 230000003044 adaptive effect Effects 0.000 claims abstract description 97
- 238000004458 analytical method Methods 0.000 claims abstract description 95
- 238000004364 calculation method Methods 0.000 claims abstract description 88
- 238000012545 processing Methods 0.000 claims description 213
- 238000001228 spectrum Methods 0.000 claims description 82
- 230000008569 process Effects 0.000 claims description 70
- 230000001629 suppression Effects 0.000 claims description 48
- 230000035945 sensitivity Effects 0.000 claims description 43
- 230000005236 sound signal Effects 0.000 claims description 38
- 238000001914 filtration Methods 0.000 claims description 11
- 230000009467 reduction Effects 0.000 claims description 2
- 230000003595 spectral effect Effects 0.000 description 48
- 239000000284 extract Substances 0.000 description 21
- 230000010363 phase shift Effects 0.000 description 14
- 238000006243 chemical reaction Methods 0.000 description 12
- 238000010586 diagram Methods 0.000 description 8
- 230000000694 effects Effects 0.000 description 7
- 230000008859 change Effects 0.000 description 6
- 238000012544 monitoring process Methods 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 230000003111 delayed effect Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 238000009434 installation Methods 0.000 description 2
- 238000003672 processing method Methods 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 102100033040 Carbonic anhydrase 12 Human genes 0.000 description 1
- 102100032566 Carbonic anhydrase-related protein 10 Human genes 0.000 description 1
- 101000867855 Homo sapiens Carbonic anhydrase 12 Proteins 0.000 description 1
- 101000867836 Homo sapiens Carbonic anhydrase-related protein 10 Proteins 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000000903 blocking effect Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L2021/02161—Number of inputs available containing the signal or the noise to be suppressed
- G10L2021/02166—Microphone arrays; Beamforming
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Circuit For Audible Band Transducer (AREA)
- Obtaining Desirable Characteristics In Audible-Bandwidth Transducers (AREA)
- Filters That Use Time-Delay Elements (AREA)
- Measurement Of Velocity Or Position Using Acoustic Or Ultrasonic Waves (AREA)
Abstract
にすること。 【解決手段】話者音声を異なる複数位置で検出する手段
11と、この受音位置別音声信号毎に周波数分析して各チ
ャンネル(ch)別の周波数成分を得る分析手段12と、この
各chの周波数成分について所望方向外の感度が低くなる
ように計算したフィルタ(F)係数によるフィルタ(F)処理
により話者方向の雑音を抑圧し、目的音声成分を得る第
1ビームフォーマ処理手段(B1)13と、分析手段にて得た
複数chの周波数成分について所望方向外を低感度化する
F処理により話者音声を抑圧し、雑音成分を得る第2ビ
ームフォーマ処理手段(B2)16と、B1のF係数から雑音方
向を推定し、B2のF係数から目的音方向を推定する推定
手段17,18と、B1において入力対象となる目的音の到来
方向である第1入力方向を、推定手段の推定目的音方向
に基づき修正し、B2において入力対象とする雑音の到来
方向である第2入力方向を、推定手段の推定雑音方向に
基づき修正する修正手段14,15を具備する。
Description
を用いて雑音を抑圧し、目的の音声を取り出す雑音抑圧
装置に関する。
ら、マイクロホンで音声信号を取り込む場合において
も、周囲から紛れ込む雑音を避けることは難しい。しか
し、雑音が混入した音声信号を再生すると、目的の音声
が聴き辛いものとなるから、雑音成分の低減処理が必要
となる。
術として、従来より知られているものに、複数のマイク
ロホンを用いて雑音を抑圧する技術がある。そして、こ
のマイクロホン処理技術は、音声認識装置やテレビ会議
装置などの音声入力を目的として従来から多くの研究者
によって技術開発に力が注がれている。中でも、少ない
マイクロホン数で大きな効果が得られる適応ビームフォ
ーマ処理技術を利用したマイクロホンアレイに関して
は、文献1(電子情報通信学会編:音響システムとデジ
タル処理)あるいは文献2(Heykin著;Adaptive Filt
er Theory(Plentice Hall))に述べられているよう
に、一般化サイドロープキャンセラ(GSC)、フロス
ト型ビームフォーマ、参照信号法など、種々の方法が知
られている。
は、一般には、妨害雑音の到来方向に死角を形成したフ
ィルタにより雑音を抑圧する処理である。しかしなが
ら、この適応ビームフォーマ処理技術においては、実際
の目的信号の到来方向が、仮定した到来方向と異なる場
合、その目的信号が雑音と見做されて除去されてしまう
ことから、性能が劣化するという問題を抱えている。
(宝珠山他:“ブロッキング行列にリーク適応フィルタ
を用いたロバスト一般化サイドローブキャンセラ”、電
子情報通信学会論文誌 A Vol.J79−A N
o.9 pp1516−1524(1996.9))に
開示されているように、仮定した到来方向と実際の到来
方向とのずれを許容するような技術が開発されている
が、この場合、目的信号の除去は軽減されても、実際の
到来方向と仮定した到来方向とのずれにより、目的信号
が歪むおそれがある。
号公報において、複数のビームフォーマを用いて、話者
方向を逐次検知してその方向にビームフォーマの入力方
向を修正することで、話者の方向を追尾し、目的信号の
歪みを小さくする方法も開示されている。
に開示されている方法は、時間領域の適応フィルタ処理
を行っているため、フィルタ係数から話者方向を推定す
る際、時間領域のフィルタ係数から周波数領域への変換
が必要であり、計算量が大きくなる。
技術として、複数本のマイクロホンを用い、これらのマ
イクロホンで、話者の音声を取り込むと共に、妨害雑音
の到来方向に死角を形成したフィルタを通すことによ
り、雑音成分を抑圧する適応ビームフォーマ処理技術が
ある。
は、実際の目的信号の到来方向、すなわち、話者のいる
方向が、予め仮定した到来方向と異なる場合、目的信号
が雑音と見做されて除去され、音声収集性能が劣化する
という問題を抱えている。
方向と実際の到来方向とのずれを許容するような技術が
開発されているが、この場合、目的信号の除去は軽減さ
れても、実際の到来方向と仮定した到来方向とのずれに
より、目的信号が歪む心配があり、得られる音声の品質
の問題を残している。
方向を逐次検知してその方向にビームフォーマの入力方
向を修正することで、話者の方向を追尾し、目的信号の
歪みを小さくする方法も提案されている。しかしなが
ら、この方法は、時間領域の適応フィルタ処理を行って
いるため、フィルタ係数から話者方向を推定する際、時
間領域のフィルタ係数から周波数領域への変換が必要で
あり、計算量が大きくなるという問題があった。
り、高品位に目的信号を収集できると共に、処理時間も
短時間で済むようなビームフォーマ処理技術の開発が嘱
望されている。
周波数領域で動作するビームフォーマを用いることで、
計算量を大幅に削減する雑音抑圧処理装置および雑音抑
圧処理方法を提供することにある。
め、本発明は次のように構成する。
少なくとも異なる2箇所以上の位置で受音する音声入力
手段と、前記受音位置に対応する音声信号のチャネル毎
に周波数分析を行って複数チャネルの周波数成分を出力
する周波数分析手段と、この周波数分析手段にて得られ
る前記複数チャネルの周波数成分について、所望方向外
の感度が低くなるように計算したフィルタ係数を用いて
の適応フィルタ処理を施すことにより前記話者方向から
の音声以外の音声を抑圧する到来雑音抑圧処理を行い、
目的音声成分を得る第1のビームフォーマ処理手段と、
前記周波数分析手段にて得られる前記複数チャネルの周
波数成分について、所望方向外の感度が低くなるように
計算したフィルタ係数を用いての適応フィルタ処理を施
すことにより前記話者方向からの音声を抑圧し、雑音成
分を得る第2のビームフォーマ処理手段と、前記第1の
ビームフォーマ処理手段で計算されるフィルタ係数から
雑音方向を推定する雑音方向推定手段と、前記第2のビ
ームフォーマ処理手段で計算されるフィルタ係数から目
的音方向を推定する目的音方向推定手段と、前記第1の
ビームフォーマにおいて入力対象となる目的音の到来方
向である第1の入力方向を、前記目的音方向推定手段で
推定された目的音方向に基づいて逐次修正する目的音方
向修正手段と、前記第2のビームフォーマにおいて入力
対象とする雑音の到来方向である第2の入力方向を、前
記雑音方向推定手段で推定された雑音方向に基づいて逐
次修正する雑音方向修正手段とを具備する。
発声した音声を少なくとも異なる2箇所以上の位置で受
音する音声入力手段と、前記受音位置に対応する音声信
号のチャネル毎に周波数分析を行って複数チャネルの周
波数成分を出力する周波数分析手段と、この周波数分析
手段にて得られる前記複数チャネルの周波数成分につい
て、所望方向外の感度が低くなるように計算したフィル
タ係数を用いての適応フィルタ処理を施すことにより前
記話者方向からの音声以外の音声を抑圧する到来雑音抑
圧処理を行い、目的音声成分を得る第1のビームフォー
マ処理手段と、前記周波数分析手段にて得られる前記複
数チャネルの周波数成分について、所望方向外の感度が
低くなるように計算したフィルタ係数を用いての適応フ
ィルタ処理を施すことにより前記話者方向からの音声を
抑圧し、第1の雑音成分を得る第2のビームフォーマ処
理手段と、前記周波数分析手段にて得られる前記複数チ
ャネルの周波数成分について、所望方向外の感度が低く
なるように計算したフィルタ係数を用いての適応フィル
タ処理を施すことにより前記話者方向からの音声を抑圧
し、第2の雑音成分を得る第2のビームフォーマ処理手
段と、前記第1のビームフォーマ処理手段で計算される
フィルタ係数から雑音方向を推定する雑音方向推定手段
と、前記第2のビームフォーマ処理手段で計算されるフ
ィルタ係数から第1の目的音方向を推定する第1の目的
音方向推定手段と、前記第3の適応ビームフォーマ処理
手段で計算されるフィルタ係数から第2の目的音方向を
推定する第2の目的音方向推定手段と、前記第1のビー
ムフォーマにおいて入力対象とする目的音の到来方向で
ある第1の入力方向を、前記第1の目的音方向推定手段
で推定された第1の目的音方向と、第2の目的音方向推
定手段で推定された第2の目的音方向のいずれか一方ま
たは両方に基づいて逐次修正する第1の入力方向修正手
段と、前記雑音方向修正手段で推定された雑音方向が所
定の第1の範囲にある場合に、前記第2のビームフォー
マにおいて入力対象とする雑音の到来方向である第2の
入力方向を該雑音方向に基づいて逐次修正する第2の入
力方向修正手段と、前記雑音方向修正手段で推定された
雑音方向が所定の第2の範囲にある場合に、前記第3の
ビームフォーマにおいて入力対象とする雑音の到来方向
である第3の入力方向を該雑音方向に基づいて逐次修正
する第3の入力方向修正手段と、前記雑音方向推定手段
で推定された雑音方向が所定の第1の範囲から到来した
か所定の第2の範囲から到来したかに基づいて前記第1
の出力雑音と前記第2の出力雑音のいずれか一方を真の
雑音出力と決定していずれか一方の雑音を出力すると同
時に、第1の音声方向推定手段と第2の音声方向推定手
段のいずれの推定結果が有効であるかを決定していずれ
か一方の音声方向推定結果を第1の入力方向修正手段へ
出力する有効雑音決定手段とを具備する。
[1]項または[2]項いずれかに記載の雑音抑圧装置
において、前記得られた音声周波数を、周波数帯域毎に
分割して帯域毎の音声パワーを計算する音声帯域パワー
計算手段と、前記得られた雑音周波数成分を、周波数帯
域毎に分割して帯域毎の雑音パワーを計算する雑音帯域
パワー計算手段と、前記音声帯域パワー計算手段と雑音
帯域パワー計算手段とから得られる音声と雑音の周波数
帯域パワーに基き、音声信号の周波数帯域毎に重みをか
けて背景雑音を抑圧するスペクトル減算手段とからなる
スペクトル減算雑音抑圧手段をさらに具備することを特
徴とする。
[1]項または[2]項いずれかに記載の雑音抑圧装置
において、前記得られた音声周波数を、周波数帯域毎に
分割して帯域毎の音声パワーを計算する音声帯域パワー
計算手段と、前記得られた雑音周波数成分を、周波数帯
域毎に分割して帯域毎の雑音パワーを計算する雑音帯域
パワー計算手段と、前記音声入力手段から得られた入力
信号を周波数分析した入力信号の周波数成分を周波数帯
域毎に分割し、帯域毎の入カパワーを計算する入力帯域
パワー計算手段と、前記入力帯域パワーと音声帯域パワ
ーと雑音帯域パワーとに基き、音声信号の周波数帯域毎
に重みをかけて背景雑音を抑圧する修正スペクトル減算
手段を具備することを特徴とする。
発声した音声を異なる2箇所以上の位置で音声入力手段
は受音し、周波数分析手段では、これを前記受音位置に
対応する音声信号のチャネル毎に周波数分析して複数チ
ャネルの周波数成分を出力する。そして、第1のビーム
フォーマ処理手段はこの周波数分析手段にて得られる前
記複数チャネルの周波数成分について、所望方向外の感
度が低くなるように計算したフィルタ係数を用いての適
応フィルタ処理を施すことにより前記話者方向からの音
声以外の音声を抑圧する到来雑音抑圧処理を行い、目的
音声成分を得、また、第2のビームフォーマ処理手段
は、前記周波数分析手段にて得られる前記複数チャネル
の周波数成分について、所望方向外の感度が低くなるよ
うに計算したフィルタ係数を用いての適応フィルタ処理
を施すことにより前記話者方向からの音声を抑圧し、雑
音成分を得る。そして、雑音方向推定手段は、前記第1
のビームフォーマ処理手段で計算されるフィルタ係数か
ら雑音方向を推定し、目的音方向推定手段は、前記第2
のビームフォーマ処理手段で計算されるフィルタ係数か
ら目的音方向を推定する。目的音方向修正手段は、前記
第1のビームフォーマにおいて入力対象となる目的音の
到来方向である第1の入力方向を、前記目的音方向推定
手段で推定された目的音方向に基づいて逐次修正するの
で、第1のビームフォーマは第1の入力方向以外から到
来する雑音成分を抑圧して話者の音声成分を低雑音で抽
出することになる。また、雑音方向修正手段は、前記第
2のビームフォーマにおいて入力対象とする雑音の到来
方向である第2の入力方向を、前記雑音方向推定手段で
推定された雑音方向に基づいて逐次修正するので、第2
のビームフォーマは第2の入力方向以外から到来する成
分を抑圧して話者の音声成分を抑圧した残りの雑音成分
を抽出することになる。
た音声周波数成分と、音声成分を抑圧した雑音周波数成
分とを別々に得ることができるが、この発明の最大の特
徴は、第1及び第2のビームフォーマとして、周波数領
域で動作するビームフォーマを用いるようにした点にあ
る。そして、このことによって、計算量を大幅に削減す
ることができるようにしている。
処理量が大幅に低減されるのに加え、入力音声に対する
周波数分析以外の周波数分析処理を省略することがで
き、かつ、フィルタ演算時に必要であった時間領域から
周波数領域ヘの変換処理も不要となり、全体の演算量を
大幅に削減することができる。
で抑圧できない拡散性雑音の抑圧処理のために、スペク
トルサブトラクション(以後、SSと略称する)処理
を、ビームフォーマ処理の後に行うようにしており、こ
のSSは周波数スペクトルを入力とするため、FFT
(高速フーリエ変換)などの周波数分析が従来必要であ
ったが、周波数領域で動作するビームフォーマを用いる
と当該ビームフォーマからは周波数スペクトルが出力さ
れるため、これをSSに流用できるので、特別にSSの
ためのFFTを実施する従来のFFT処理工程は省略す
ることができる。故に、全体の演算量を大幅に削減する
ことができる。
方向推定の際に必要であった時間領域から周波数領域へ
の変換処理も不要となり、全体の演算量を大幅に削減す
ることができる。
た音声を異なる2箇所以上の位置で音声入力手段は受音
し、周波数分析手段では、これを前記受音位置に対応す
る音声信号のチャネル毎に周波数分析して複数チャネル
の周波数成分を出力する。そして、第1のビームフォー
マ処理手段はこの周波数分析手段にて得られる前記複数
チャネルの周波数成分について、所望方向外の感度が低
くなるように計算したフィルタ係数を用いての適応フィ
ルタ処理を施すことにより前記話者方向からの音声以外
の音声を抑圧する到来雑音抑圧処理を行い、目的音声成
分を得、また、第2のビームフォーマ処理手段は、前記
周波数分析手段にて得られる前記複数チャネルの周波数
成分について、所望方向外の感度が低くなるように計算
したフィルタ係数を用いての適応フィルタ処理を施すこ
とにより前記話者方向からの音声を抑圧し、雑音成分を
得る。そして、雑音方向推定手段は、前記第1のビーム
フォーマ処理手段で計算されるフィルタ係数から雑音方
向を推定し、目的音方向推定手段は、前記第2のビーム
フォーマ処理手段で計算されるフィルタ係数から目的音
方向を推定する。
2のビームフォーマ処理手段で計算されるフィルタ係数
から第1の目的音方向を推定し、第2の目的音方向推定
手段は、前記第3の適応ビームフォーマ処理手段で計算
されるフィルタ係数から第2の目的音方向を推定する。
ームフォーマにおいて入力対象とする目的音の到来方向
である第1の入力方向を、前記第1の目的音方向推定手
段で推定された第1の目的音方向と、第2の目的音方向
推定手段で推定された第2の目的音方向のいずれか一方
または両方に基づいて逐次修正する。そして、第2の入
力方向修正手段は、前記雑音方向修正手段で推定された
雑音方向が所定の第1の範囲にある場合に、前記第2の
ビームフォーマにおいて入力対象とする雑音の到来方向
である第2の入力方向を該雑音方向に基づいて逐次修正
し、第3の入力方向修正手段は、前記雑音方向修正手段
で推定された雑音方向が所定の第2の範囲にある場合
に、前記第3のビームフォーマにおいて入力対象とする
雑音の到来方向である第3の入力方向を該雑音方向に基
づいて逐次修正する。従って、第2の入力方向修正手段
の出力により第2の入力方向を修正される第2のビーム
フォーマは第2の入力方向以外から到来する成分を抑圧
して残りの雑音成分を抽出することになり、また、第3
の入力方向修正手段の出力により第3の入力方向を修正
される第3のビームフォーマは第3の入力方向以外から
到来する成分を抑圧して残りの雑音成分を抽出すること
になる。
向推定手段で推定された雑音方向が所定の第1の範囲か
ら到来したか所定の第2の範囲から到来したかに基づい
て前記第1の出力雑音と前記第2の出力雑音のいずれか
一方を真の雑音出力と決定していずれか一方の雑音を出
力すると同時に、第1の音声方向推定手段と第2の音声
方向推定手段のいずれの推定結果が有効であるかを決定
して有効な方の音声方向推定結果を第1の入力方向修正
手段へ出力する。この結果、目的音方向修正手段は、前
記第1のビームフォーマにおいて入力対象となる目的音
の到来方向である第1の入力方向を、前記決定した方の
目的音方向推定手段で得た目的音方向に基づいて逐次修
正するので、第1のビームフォーマは第1の入力方向以
外から到来する雑音成分を抑圧して話者の音声成分を低
雑音で抽出することになる。
た音声周波数成分と、音声成分を抑圧した雑音周波数成
分とを別々に得ることができるが、この発明の最大の特
徴は、第1及び第2のビームフォーマとして、周波数領
域で動作するビームフォーマを用いるようにした点にあ
る。そして、このことによって、計算量を大幅に削減す
ることができるようにしている。
処理量が大幅に低減されるのに加え、入力音声に対する
周波数分析以外の周波数分析処理を省略することがで
き、かつ、フィルタ演算時に必要であった時間領域から
周波数領域ヘの変換処理も不要となり、全体の演算量を
大幅に削減することができる。
全く異ならせた雑音追尾用のビームフォーマを設けてあ
り、それぞれの出力からそれぞれ音声方向を推定させる
と共に、それぞれの推定結果からいずれが有効な雑音追
尾をしているかを判断して、有効と判断された方のビー
ムフォーマのフィルタ係数による音声方向の推定結果を
第1の目的音方向修正手段に与えることで第1の目的音
方向修正手段は、前記第1のビームフォーマにおいて入
力対象となる目的音の到来方向である第1の入力方向
を、前記目的音方向推定手段で推定された目的音方向に
基づいて逐次修正するので、第1のビームフォーマは第
1の入力方向以外から到来する雑音成分を抑圧して話者
の音声成分を低雑音で抽出することができ、雑音源が移
動してもこれを見失うことなく追尾して抑圧することが
できるようになるものである。
2本のマイクロホンだけでも目的音源の追尾を可能とす
べく、雑音追尾用のビームフォーマを雑音抑圧のビーム
フォーマとは別に1個用いるが、例えば、雑音源が目的
音の方向を横切って移動したような場合、雑音の追尾精
度が低下することがあった。
ムフォーマを複数用いて各々別個の追尾範囲を受け持つ
ようにしたことにより、上記のような場合でも追尾精度
の低下を抑止できるようになる。
ワー計算手段は、得られた音声周波数のスペクトル成分
を、周波数帯域毎に分割して帯域毎の音声パワーを計算
し、雑音帯域パワー計算手段は、前記得られた雑音周波
数のスペクトル成分を、周波数帯域毎に分割して帯域毎
の雑音パワーを計算する。そして、スペクトル減算手段
は、前記音声帯域パワー計算手段と雑音帯域パワー計算
手段とから得られる音声と雑音の周波数帯域パワーに基
き、音声信号の周波数帯域毎に重みをかけて背景雑音を
抑圧する。
圧できない方向性のない雑音(背景雑音)は、本発明シ
ステムのビームフォーマで得ることのできる目的音声成
分と雑音成分を利用し、これをスペクトルサブトラクシ
ョン処理することで抑圧する。すなわち、本システムで
は、ビームフォーマとして目的音声成分抽出用と雑音成
分抽出用の2つのビームフォーマを備えているが、これ
らのビームフォーマの出力である目的音声成分と雑音成
分を利用してスペクトルサブトラクション処理すること
により、方向性のない背景雑音成分の抑圧を行う。スペ
クトルサブトラクション(SS)処理は雑音抑圧処理と
して知られるが、一般的に行われるスペクトルサブトラ
クション(SS)処理は、1チャンネルのマイクロホン
(つまり、1本のマイクロホン)を用い、このマイクロ
ホンの出力から音声のない区間において雑音のパワーを
推定するため、非定常な雑音が音声に重畳している場合
には対処できない。また、2チャンネルのマイクロホン
(つまり、2本のマイクロホン)を用いて、一方を雑音
収集用、片方を雑音重畳音声収集用とする場合にも、両
マイクロホンの設置場所を離す必要があり、その結果、
音声に重畳する雑音と、雑音収集用マイクロホンで取り
込む雑音との位相がずれ、スペクトルサブトラクション
処理しても雑音抑圧の改善効果は大きく上がらない。
ビームフォーマを用意して、このビームフォーマの出力
を用いるようにしたため、位相のずれは補正されてお
り、従って、非定常雑音の場合でも高精度なスペクトル
サブトラクション処理を実現できる。さらに、周波数領
域のビームフォーマの出力を利用しているため、周波数
分析を省略してスペクトルサブトラクションが可能であ
り、従来より少ない演算量で非定常雑音を抑圧できる。
の雑音抑圧装置において、音声入力手段から得られた入
力信号を周波数分析した入力信号の周波数成分を周波数
帯域毎に分割し、帯域毎の入カパワーを計算する入力帯
域パワー計算手段を設けて、スペクトル減算手段には、
入力帯域パワーと音声帯域パワーと雑音帯域パワーとに
基き、音声信号の周波数帯域毎に重みをかけて背景雑音
を抑圧する処理を実施させるようにしており、この構成
の場合、音声帯域パワー計算手段は、得られた音声周波
数のスペクトル成分を、周波数帯域毎に分割して帯域毎
の音声パワーを計算し、雑音帯域パワー計算手段は、前
記得られた雑音周波数のスペクトル成分を、周波数帯域
毎に分割して帯域毎の雑音パワーを計算する。また、入
力帯域パワー計算手段があり、この入力帯域パワー計算
手段は、音声入力手段から得られた入力信号を周波数分
析して得た入力音声の周波数スペクトル成分を受けて、
これを周波数帯域毎に分割し、帯域毎の入カパワーを計
算する。そして、スペクトル減算手段は、前記音声帯域
パワー計算手段と雑音帯域パワー計算手段とから得られ
る音声と雑音の周波数帯域パワーに基き、音声信号の周
波数帯域毎に重みをかけて背景雑音を抑圧する。
の発明におけるスペクトルサブトラクション(SS)処
理において、更に雑音成分についてそのパワーを修正す
るようにしたことにより、一層高精度に雑音抑圧を行う
ことを可能とするものである。すなわち、[3]項の発
明では雑音源のパワ−Nが小さいという仮定をおいたた
め、スペクトルサブトラクション(SS)処理を行うと
雑音源の成分が音声に重畳している部分では歪みが大き
くなる可能性が残るが、ここでは入力信号のパワーを用
いて第3の発明でのスペクトルサブトラクション処理に
おける帯域重みの計算を修正するようにした。これによ
り、方向を持つ雑音成分および方向のない雑音成分を抑
圧した歪みの少い音声成分のみの抽出ができるようにな
る。
図面を参照して説明する。
説明する。この実施例1は請求項1の内容に相当する。
ブロック図であって、本発明の一実施形態に係る雑音抑
圧装置の基本構成を示すブロック図である。本発明は、
マイクロホン数が2ch(ch;チャンネル)すなわ
ち、2本と云った最小の場合でも話者追尾可能とするた
めの技術であるため、ここでは2chで説明するが、3
ch以上となった場合でも処理の方法は同様である。
周波数解析部、13は第1のビームフォーマ、14は第
1の入力方向修正部、15は第2の入力方向修正部、1
6は第2のビームフォーマ、17は雑音方向推定部、1
8は目的音方向推定部(音声方向推定部)である。
ば、音声収集対象である話者の発声した音声(目的音
声)を異なる2箇所以上の位置で受音するためのもので
あり、具体的にはそれぞれ地点を異ならせて設置した2
本のマイクロホンを用いて音声を取り込み、電気信号に
変換するものである。また、周波数分析部12は、前記
マイクロホンの受音位置に対応する音声信号のチャネル
毎に周波数分析を行って複数チャネルの周波数成分を出
力するものであり、具体的にはここでは第1のマイクロ
ホンのとらえた音声信号(第1チャンネル1chの音声
信号)および第2のマイクロホンのとらえた音声信号
(第2チャンネル2chの音声信号)を、それぞれ別々
に高速フーリエ変換するなどして時間領域の信号成分か
ら周波数領域の成分のデータにに変換することにより、
各チャンネル別に周波数スペクトルのデータに変換して
出力するものである。
分析部12からの複数チャンネルの周波数成分出力、こ
の場合、1ch,2chの音声信号を用いて、これより
目的音声の周波数分を抽出するためのものであって、前
記1ch,2chそれぞれの周波数成分(周波数スペク
トルデータ)を用いて適応フィルタ処理により目的の音
声以外の到来雑音の抑圧処理を行うことにより、目的と
する音源方向からの周波数成分を抽出するといったこと
を行う処理手段であり、第2のビームフォーマ16は、
周波数分析部12からの複数チャンネルの周波数成分出
力、この場合、1ch,2chの音声信号を用いて、こ
れより雑音源方向からの周波数成分を抽出するためのも
のであって、前記1ch,2chそれぞれの周波数成分
(周波数スペクトルデータ)を用いて適応フィルタ処理
により雑音音源方向からの音声以外の成分の抑圧処理を
行うことにより、雑音源方向からの周波数スペクトル成
分のデータを抽出するといったことを行う処理手段であ
る。
ビームフォーマ13で計算されるフィルタ係数から雑音
方向を推定すると云った処理を行うものであって、具体
的には前記第1のビームフォーマ13の適応フィルタか
ら得られるフィルタリング処理用のフィルタ係数などの
パラメータを用いて雑音方向を推定し、その推定量対応
のデータを出力し、また、目的音方向推定部(音声方向
推定部)18は、前記第2のビームフォーマ16で計算
されるフィルタ係数から目的音方向を推定すると云った
処理を行うものであって、具体的には前記第2のビーム
フォーマ16の適応フィルタで用いられているフィルタ
係数などのパラメータから雑音方向を推定し、その推定
量対応のデータを出力するものである。
の目的音方向にビームフォーマの入力方向を修正するた
めのものであって、前記第1のビームフォーマ13にお
いて、入力対象とする目的音の到来方向である第1の入
力方向を、前記目的音方向推定部18で推定された目的
音方向に基づいて逐次方向修正するための出力を発生
し、第1のビームフォーマ13に与えるものである。具
体的には、第1の入力方向修正部14は、目的音方向推
定部18の出力する推定量対応のデータを現在の目的と
する音源方向の角度情報αに変換して目標角度情報αと
して第1のビームフォーマ13に出力するものである。
フォーマ16の入力方向を雑音方向に修正するためのも
のであって、前記第2のビームフォーマ16において、
入力対象とする雑音の到来方向である第2の入力方向
を、前記雑音方向推定部17で推定された雑音方向に基
づいて逐次方向修正するための出力を発生し、第2のビ
ームフォーマ14に与えるものである。具体的には、第
2の入力方向修正部15は、雑音方向推定部17の出力
する推定量対応のデータを現在の目的とする雑音源方向
の角度情報に変換して目標角度情報αとして第2のビー
ムフォーマ16に出力するものである。
を示しておく。 <ビームフォーマの構成例>本発明システムで用いるビ
ームフォーマ13,16は、図2(a)に示すような構
成となる。すなわち、本発明システムにおいて用いられ
るビームフォーマ13,16は、入力音声中から抽出し
たい対象となる信号成分を得ることができるようにする
ために、抽出したい対象となる信号成分の到来方向に、
ビームフォーマの入力方向を設定するための移相部10
0と、抽出したい対象となる信号成分の到来方向以外の
方向からの成分を抑圧するビームフォーマ本体101と
から構成される。
aと乗算手段100b,100cとから構成され、ビー
ムフォーマ本体101は加算手段101a,101b,
101cと適応フィルタ101dとから構成される。
正部14または15からの角度情報αを入力方向の情報
として受けて、これよりα対応の補正ベクトルを生成す
るものであり、乗算手段100bは周波数分析部12か
ら出力されるch1の周波数スペクトル成分のデータに
対して補正ベクトル分を乗算して出力するものであり、
乗算手段100cは周波数分析部12から出力されるc
h2の周波数スペクトル成分のデータに対して補正ベク
トル分を乗算して出力するものである。
bの出力と加算手段100cの出力を加算して出力する
ものであり、加算手段101bは乗算手段100bの出
力と加算手段100cの出力の差分を出力するものであ
り、加算手段101cは加算手段101aの出力に対す
る適応フィルタ101dの出力の差分をビームフォーマ
の出力として出力するものであり、適応フィルタ101
dは加算手段101bの出力に対してフィルタリング演
算処理して出力するためのデジタルフィルタであって、
加算手段101cの出力が最小となるようにフィルタ係
数(パラメータ)が逐次変更される構成である。
本、すなわち、第1及び第2のマイクロホンm1,m2
を用いる収集音声2チャンネル(ch1,ch2)構成
のシステムとしており、この場合、ビームフォーマの入
力方向の設定とは、図2(b)に示すように、入力対象
の存在する方向からの音声信号が等価的に同時に両マイ
クロホンm1,m2に到着したと見做せるように、ch
1,ch2の2つの音声チャンネルの周波数成分に対し
て遅延を施し、位相を揃える(整相)ようにすることを
指す。これは、図2の構成の場合、入力方向修正部1
4,15の出力する角度情報α対応に移相部100で移
相調整することによって実現している。
0は補正したい入力方向(角度情報α)対応の補正ベク
トルを補正ベクトル生成部100aで生成するようにし
ており、この補正ベクトルを1ch,2chの各チャン
ネルの信号にそれぞれ乗算する乗算手段100b,10
0cで乗算する構成とした移相部100により次のよう
にして位相を揃える。
して示すような無指向性マイクロホン配置であって、P
1点に居る目的音源である話者が、あたかもP2点に居
るかのように信号に位相補正することを考えてみる。こ
のような場合には、距離dだけ離れた第1のマイクロホ
ンm1で検出した話者音声信号(ch1)の位相と第2
のマイクロホンm2で検出した話者音声信号(ch2)
の位相が同じになるように、第1のマイクロホンm1の
話者音声信号(ch1)に伝搬時間差τ τ=r・c=r・sinα r=d・sinα に相当する複素数W1 W1=( cos jωτ,sin jωτ) の複素共役をかける。ここで、cは音速、dはマイクロ
ホン間距離、αはマイクロホンm1から見た目的音の音
源である話者の移動した角度、jは虚数、ωは角周波数
である。
り、αなる角度に移動した目的音源の音声について注目
すれば、第1のマイクロホンm1でとらえた信号(ch
1)が、第2のマイクロホンm2でとらえた信号と同位
相となるように移相制御したことになる。
2)には、複素数W2=(1,0)の複素共役をかける
ものとする。つまり、これは第2のマイクロホンm2の
信号(ch2)には、角度補正をしないことを意味す
る。
ベクトル{W1,W2}は、一般に方向ベクトルと呼ば
れ、この{W1,W2}における複素共役のベクトル共
役{W1*,W2*}を、補正ベクトルと呼ぶ。
せ、ch1,ch2の周波数スペクトル成分に対してこ
の補正ベクトルを乗算すれば、第1のマイクロホンm1
の出力は、音源がP1よりP2に移動したにもかかわら
ず、第2のマイクロホンm2の位相と同じになるように
補正されたことになり、第1のマイクロホンm1に関す
る限り、第2のマイクロホンm1,m2のP2位置音源
に対する距離はあたかも等しいかたちになる。
が、これら2つあるビームフォーマのうち、第1のビー
ムフォーマ13はその移相部100により目的音の音源
方向を入力対象方向とするように、ch1(もしくはc
h2)の周波数成分に上述の手法で遅延を施し、第2の
ビームフォーマ16はその移相部100により雑音源方
向を入力対象方向とするように、ch1(もしくはch
2)の周波数成分に上述の手法で遅延を施してそれぞれ
両者の位相を揃える。ただし、目的音Sの到来方向以外
からの音成分、すなわち、雑音成分Nについては第1お
よび第2のマイクロホンm1,m2ともに位相は全く無
修正であるから、第1のマイクロホンm1と第2のマイ
クロホンm2で検出されるタイミングに時間差がある。
向の音源からの検出される音声信号について位相修正し
た第1のマイクロホンm1の出力(目的音声成分Sと雑
音分Nからなるch1の周波数スペクトルデータ)およ
び修正の加えられない第2のマイクロホンm2の出力
(目的音声成分Sと雑音分N′からなるch2の周波数
スペクトルデータ)は、それぞれ加算手段101a,1
01bに入力される。そして、加算手段101aではc
h1の出力とch2の出力が加算されることによって目
的音声Sの2倍の信号と雑音成分N+N′についてのパ
ワー成分が求められ、加算手段101bではch1の出
力(S+N)とch2の出力(S+N′)の差分((S
+N)−(S+N′)=N−N′)、つまり、ノイズ分
のパワー成分が求められる。そして、加算手段101c
で加算手段101aの出力に対する適応フィルタ101
dの出力の差分を求め、これをビームフォーマの出力と
すると共に、適応フィルタ101dにフィードバックす
る。
の出力に対して現在の探査方向対応の方向から到来した
音の成分の周波数スペクトルが抽出されるようフィルタ
リング演算処理して出力するためのデジタルフィルタで
あり、逐次、角度1°刻みに到来信号の探査角度を可変
していて、入力される信号方向に探査角度が一致したと
き最大の出力を出す。従って、到来信号の入射方向と探
査角度が一致すれば適応フィルタ101dの出力(N−
N′)は最大になる。そして、適応フィルタ101dの
出力(N−N′)は雑音成分のパワーであるから、それ
が最大のときの出力を加算手段101cに与え、加算手
段101aからの出力(2S+N+N′)から差し引け
ば、雑音成分Nが最大限キャンセルされて雑音抑圧が成
される。故に、この状態のときは、加算手段101cの
出力は最小である。
段101cの出力が最小となるように角度1°刻みの信
号到来方向探査角度(角度1°刻みの方向別感度)とフ
ィルタ係数(パラメータ)を逐次変更させることによ
り、到来信号の入射方向と探査角度(到来信号の入射方
向とその方向に対する感度)が一致することになるか
ら、適応フィルタ101dはこれらを制御しつつ、加算
手段101cの出力が最小となるようにする。
音声成分をビームフォーマは抽出できることになる。ま
た、雑音成分を目的音として抽出する場合には、上述の
目的音を雑音と見做すようにしたかたちで、上記制御を
施すようにすればよい。
は、一般化サイドローブキャンセラ(GSC)の他に、
フロスト型ビームフォーマなど種々のものが上述同様の
考え方で適用可能であり、従って、本発明では特に限定
はされない。
する。本システムは、目的音の音声周波数成分と雑音周
波数成分とを別々に抽出出力する構成としていることを
特徴としている。
部11、この例では第1及び第2の計2本のマイクロホ
ンm1,m2を持つ音声入力部11でch1,ch2の
音声を取り込む。そして、この音声入力部11から入力
された2チャンネル分の音声の信号ch1,ch2(す
なわち、第1チャンネルch1は第1のマイクロホンm
1からの音声、第2チャンネルch2は第2のマイクロ
ホンm2からの音声に該当する)は、周波数分析部12
に送られ、ここで例えば高速フーリエ変換(FFT)等
の処理を行うことによって、それぞれのチャンネル別に
周波数成分(周波数スペクトル)が求められる。
ャンネル別の周波数成分は、それぞれ第1及び第2のビ
ームフォーマ13,16に与えられる。
ネル分の周波数成分入力について、目的音の方向対応に
位相を合わせた上で、周波数領域の適応フィルタにより
上述のようにして処理することで雑音を抑圧し、目的音
の方向の周波数成分を出力する。
向修正部14は第1のビームフォーマ13に対して次の
ような角度情報(α)を与える。つまり、第1の入力方
向修正部14は、与えられる音声方向推定部18からの
出力を用い、目的音の方向があたかもマイクロホンの正
面方向となるよう、上記2チャンネルの周波数成分の入
力位相を整えるに必要な角度情報(α)を入力方向修正
量として第1のビームフォーマ13に対して与える。
の修正量(α)対応に目的音方向を修正し、当該目的音
方向以外の方向から到来する音声を抑圧させるようにす
ることで、雑音成分を抑圧し、目的音を抽出する。
分を抽出するための第2のビームフォーマ16における
適応フィルタのパラメータを用いて雑音源方向を知り、
それを反映させた出力を出し、第1の入力方向修正部1
4ではこの目的音方向推定部18からの出力対応に入力
方向修正量(α)を発生してこの修正量(α)対応に第
1のビームフォーマ13における目的音方向を修正し、
これによって第1のビームフォーマ13に当該目的音方
向以外の方向から到来する音声を抑圧させるようにする
ことで、雑音成分を抑圧し、目的音を抽出する。
合、雑音が目的音であるから、雑音に位相を合わせてい
る。その結果、第2のビームフォーマ16では話者の音
源は雑音源として扱われ、ビームフォーマの内蔵する適
応フィルタは話者音源からの音を抽出する処理をするこ
とになるので、当該第2のビームフォーマ16の適応フ
ィルタのパラメータからは話者音源の方向を反映した出
力が得られる。従って、目的音方向推定部18により、
第2のビームフォーマ16における適応フィルタのパラ
メータを用いて雑音源方向を知れば、それは目的音であ
る話者音源の方向を反映させたものである。従って、目
的音方向推定部18により、第2のビームフォーマ16
における適応フィルタのパラメータを反映させた出力を
出し、第1の入力方向修正部14でこの目的音方向推定
部18からの出力対応に入力方向修正量(α)を発生
し、この修正量対応に第1のビームフォーマ13におけ
る目的音方向を修正すれば、第1のビームフォーマ13
に当該目的音方向以外の方向から到来する音声を抑圧さ
せることができる。
チャンネル分の周波数成分入力に対して、周波数領域の
適応フィルタにより目的音を抑圧し、雑音の方向の周波
数成分を出力する。ここでは、具体的には雑音の方向を
マイクロホンの正面と仮定し、2つのマイクロホンに対
して雑音が同時に到着したと見做せるように、雑音方向
推定部17からの出力を用いて第2の入力方向修正部5
で位相を整える操作(整相)を行う。
音声成分を抽出するための第1のビームフォーマ13に
おける適応フィルタのパラメータを用いて雑音音源方向
を知り、それを反映させた出力を出し、第2の入力方向
修正部15では雑音方向推定部17からの出力対応に入
力方向修正量(α)を発生させて第2のビームフォーマ
16に与えることによって、当該第2のビームフォーマ
16に当該修正量対応に雑音方向を修正させるように
し、この方向以外の方向から到来する音声を抑圧するこ
とで雑音成分のみを抽出する。
ビームフォーマ13の適応フィルタから雑音方向を推定
し、目的音方向推定部18では、第2のビームフォーマ
16の適応フィルタから目的音方向を推定する。なお、
これらの処理は、例えば、8[msec]等の短い固定時
間毎に行われる。以降固定時間をフレームと呼ぶ。
3により、目的音(話者)の音声成分を抽出することが
でき、また、第2のビームフォーマ16により、雑音成
分を抽出することができる。
り、この会議室にテレビ会議システム設置して当該テレ
ビ会議システムの話者音声抽出のために使用していると
するならば、除去しなければならない雑音と云っても、
そう問題のある大きな妨害音ではないと考えられるの
で、このような場合、第1のビームフォーマ13によ
り、抽出された目的音(話者)の成分を逆フーリエ変換
して時間領域に戻すことで音声信号に戻し、これをスピ
ーカなどで音声として出力させたり、送信するなどすれ
ば、低雑音化された話者音声として利用できる。
について触れておく。
部17,18の処理手順を示す。
初期設定をする(ステップS1)。この初期設定内容と
しては図3に点線枠で囲んで示してあるように、“目的
音の追尾範囲”を“0゜±θr(例えば、20゜)”と
し、それ以外の範囲を雑音の探索範囲として設定する。
S2の処理に移る。このステップS2では方向ベクトル
を生成する処理を行う。そして、方向別感度計算を行っ
た後、方向別感度周波数累積を行う(ステップS3,S
4)。
て、実施した後、最小値であるものを求めて、その最小
値となった累積値を持つものの方向を信号到来方向とす
る(ステップS5,S6)。
4においては、フィルタ係数W(k)と方向べクトルS
(k,θ)との内積を各周波数成分毎に1゜刻みで所定
の範囲の方向について計算し、対応する方向への感度を
求め、次に、全周波数成分についてその感度を加算する
と云う処理を行う。そして、ステップS7,S8におい
ては、全周波数成分についてその感度を加算した結果と
して得られる各方向別の累積値のうち、その値が最小値
である方向を、信号到来方向とすると云う処理をする。
この図3に示した処理手順は、雑音方向推定部17およ
び目的音推定部18ともに同様のものとなる。
音方向の推定を行い、また、目的音推定部18は目的音
方向の推定を行う。そして、この推定結果はそれぞれの
対応する入力方向修正部14,15に与える。
力方向修正部14は、前フレームまでの入力方向と現フ
レームの方向推定結果を平均化し、新たな入力方向を計
算してビームフォーマの移相部100へ出力し、また、
目的音推定結果を受け取った第2の入力方向修正部15
もまた、前フレームまでの入力方向と現フレームの方向
推定結果を平均化し、新たな入力方向を計算してビーム
フォーマの移相部100へ出力する。
うに行う。
+E(n)・β ここで、θ1は音の入力方向、nは処理フレームの番
号、Eは現フレームの方向推定結果である。なお、係数
βはビームフォーマの出力パワーに基づいて可変にして
もよい。
来、方向推定の際、時間領域のフィルタ係数から周波数
領域への変換が必要であったが、本発明ではGSCの適
応フィルタが周波数スペクトルに対して方向性感度を以
てフィルタ演算処理し、目的方向外の成分を抽出すると
云った処理をするものを用いており、フィルタ演算処理
に使用するフィルタ係数は、もともと周波数領域で得ら
れるため、従来のように、時間領域のフィルタ係数から
周波数領域への変換と云う処理は不要となる。従って、
本発明システムではGSCは使用していても、時間領域
のフィルタ係数から周波数領域への変換が不要である
分、処理の高速化が可能となる。
システムの全体の処理手順を示す。この処理はフレーム
毎に行われる。
初期設定内容としては、目的音方向の追尾範囲を0゜±
θr(例えばθr=20゜)とし、雑音方向推定部の探
索範囲を θr < φ1 < 180゜−θr , −180゜+θr < φ1 <−θr とし、目的音方向推定部18の探索範囲を −θr < φ2 < θr とする。
=0゜、雑音の入力方向の初期値をθ2=90°とす
る。
ームフォーマ13の処理を行い(ステップS12)、雑
音方向を推定し(ステップS13)、雑音方向がφ2の
範囲内であれば、第2のビームフォーマ16の入力方向
を修正し(ステップS14,S15)、そうでなければ
修正しない(ステップS14)。
進み(ステップS16)、目的音の方向を推定する(ス
テップS17)。そして、この推定した目的音の方向が
φ1の範囲内ならば、第1のビームフォーマ13の入力
方向を修正し(ステップS18,S19)、そうでなけ
れば何もせずに、次のフレームの処理に移る。
マとして周波数領域で動作するビームフォーマを用いる
ようにしたことを特徴としており、これによって計算量
を大幅に削減することができるようにしたことを特徴と
している。
も異なる2箇所以上の位置で受音する音声入力手段と、
前記受音位置に対応する音声信号のチャネル毎に周波数
分析を行って複数チャネルの周波数成分を出力する周波
数分析手段と、この周波数分析手段にて得られる前記複
数チャネルの周波数成分について、所望方向外の感度が
低くなるように計算したフィルタ係数を用いての適応フ
ィルタ処理を施すことにより前記話者方向からの音声以
外の音声を抑圧する到来雑音抑圧処理を行い、目的音声
成分を得る第1のビームフォーマ処理手段と、前記周波
数分析手段にて得られる前記複数チャネルの周波数成分
について、所望方向外の感度が低くなるように計算した
フィルタ係数を用いての適応フィルタ処理を施すことに
より前記話者方向からの音声を抑圧し、雑音成分を得る
第2のビームフォーマ処理手段と、前記第1のビームフ
ォーマ処理手段で計算されるフィルタ係数から雑音方向
を推定する雑音方向推定手段と、前記第2のビームフォ
ーマ処理手段で計算されるフィルタ係数から目的音方向
を推定する目的音方向推定手段と、前記第1のビームフ
ォーマにおいて入力対象となる目的音の到来方向である
第1の入力方向を、前記目的音方向推定手段で推定され
た目的音方向に基づいて逐次修正する目的音方向修正手
段と、前記第2のビームフォーマにおいて入力対象とす
る雑音の到来方向である第2の入力方向を、前記雑音方
向推定手段で推定された雑音方向に基づいて逐次修正す
る雑音方向修正手段とを具備する。
所以上の位置で音声入力手段は受音し、周波数分析手段
では、これを前記受音位置に対応する音声信号のチャネ
ル毎に周波数分析して複数チャネルの周波数成分を出力
する。そして、第1のビームフォーマ処理手段はこの周
波数分析手段にて得られる前記複数チャネルの周波数成
分について、所望方向外の感度が低くなるように計算し
たフィルタ係数を用いての適応フィルタ処理を施すこと
により前記話者方向からの音声以外の音声を抑圧する到
来雑音抑圧処理を行い、目的音声成分を得、また、第2
のビームフォーマ処理手段は、前記周波数分析手段にて
得られる前記複数チャネルの周波数成分について、所望
方向外の感度が低くなるように計算したフィルタ係数を
用いての適応フィルタ処理を施すことにより前記話者方
向からの音声を抑圧し、雑音成分を得る。そして、雑音
方向推定手段は、前記第1のビームフォーマ処理手段で
計算されるフィルタ係数から雑音方向を推定し、目的音
方向推定手段は、前記第2のビームフォーマ処理手段で
計算されるフィルタ係数から目的音方向を推定する。目
的音方向修正手段は、前記第1のビームフォーマにおい
て入力対象となる目的音の到来方向である第1の入力方
向を、前記目的音方向推定手段で推定された目的音方向
に基づいて逐次修正するので、第1のビームフォーマは
第1の入力方向以外から到来する雑音成分を抑圧して話
者の音声成分を低雑音で抽出することになる。また、雑
音方向修正手段は、前記第2のビームフォーマにおいて
入力対象とする雑音の到来方向である第2の入力方向
を、前記雑音方向推定手段で推定された雑音方向に基づ
いて逐次修正するので、第2のビームフォーマは第2の
入力方向以外から到来する成分を抑圧して話者の音声成
分を抑圧した残りの雑音成分を抽出することになる。
た音声周波数成分と、音声成分を抑圧した雑音周波数成
分とを別々に得ることができるが、この発明の最大の特
徴は、第1及び第2のビームフォーマとして、周波数領
域で動作するビームフォーマを用いるようにした点にあ
る。そして、このことによって、計算量を大幅に削減す
ることができるようにしている。
処理量が大幅に低減されるのに加え、入力音声に対する
周波数分析以外の周波数分析処理を省略することがで
き、かつ、フィルタ演算時に必要であった時間領域から
周波数領域ヘの変換処理も不要となり、全体の演算量を
大幅に削減することができる。
で抑圧できない拡散性雑音の抑圧処理のために、スペク
トルサブトラクション(以後、SSと略称する)処理
を、ビームフォーマ処理の後に行うようにしており、こ
のSSは周波数スペクトルを入力とするため、FFT
(高速フーリエ変換)などの周波数分析が従来必要であ
ったが、周波数領域で動作するビームフォーマを用いる
と当該ビームフォーマからは周波数スペクトルが出力さ
れるため、これをSSに流用できるので、特別にSSの
ためのFFTを実施する従来のFFT処理工程は省略す
ることができる。故に、全体の演算量を大幅に削減する
ことができる。
方向推定の際に必要であった時間領域から周波数領域へ
の変換処理も不要となり、全体の演算量を大幅に削減す
ることができる。
て移動した場合にも追尾が高精度で行えるようにした例
を実施例2として説明する。
ついて説明する。これは、請求項2の発明に相当する。
切って移動した場合にも追尾が高精度で行えるように、
雑音を追尾するビームフォーマを2つ用いる場合の例に
ついて説明する。全体構成を図4に示す。図4におい
て、11は音声入力部、12は周波数解析部、13は第
1のビームフォーマ、14は第1の入力方向修正部、1
5は第2の入力方向修正部、16は第2のビームフォー
マ、17は雑音方向推定部、18は第1の音声方向推定
部(目的音方向推定部)、そして、21は第3の入力方
向修正部、22は第3のビームフォーマ、23は第2の
音声方向推定部、24は有効雑音決定部である。
は、第3のビームフォーマ22の入力方向を雑音方向に
修正するためのものであって、第3のビームフォーマ2
2において、入力対象とする雑音の到来方向である第3
の入力方向を、前記雑音方向推定部17で推定された雑
音方向に基づいて逐次方向修正するための出力を発生
し、第3のビームフォーマ22に与えるものである。具
体的には、第3の入力方向修正部21は、雑音方向推定
部17の出力する推定量対応のデータを現在の目的とす
る雑音源方向の角度情報に変換して目標角度情報αとし
て第3のビームフォーマ22に出力するものである。
部12からの複数チャンネルの周波数成分出力、この場
合、1ch,2chの音声信号の周波数スペクトルを用
いて、これより雑音源方向からの周波数スペクトル成分
を抽出するためのものであって、前記1ch,2chそ
れぞれの周波数成分(周波数スペクトルデータ)に対し
て方向別感度調整を施した適応フィルタ処理により雑音
音源方向以外の周波数スペクトル成分の抑圧処理を行う
ことで、雑音音源方向からの周波数スペクトル成分のデ
ータを抽出するといったことを行う処理手段である。こ
の第3のビームフォーマ22も第1及び第2のビームフ
ォーマ13,16同様、図2で説明した如きの構成を採
用している。
定部(音声方向推定部)18と同様のものであって、前
記第3のビームフォーマ22で計算されるフィルタ係数
から目的音方向を推定すると云った処理を行うものであ
り、具体的には前記第3のビームフォーマ22の適応フ
ィルタから音声方向を推定し、その推定量対応のデータ
を出力するものである。
8,23および雑音方向推定部17の推定する音声方向
および雑音方向の情報に基づき、第2のビームフォーマ
16と第3のビームフォーマ22のいずれが雑音を有効
に追尾しているかを判断し、有効に追尾していると判断
した方のビームフォーマの出力を、雑音成分として出力
するものである。なお、その他、図1の構成と同一符号
を付したものは同一物を示しているので、詳細は先の説
明を参照することとし、ここでは改めて説明はしない。
施例1との違いは、第3の入力方向修正部21と、第3
のビームフォーマ22と、第2の音声方向推定部23、
および有効雑音決定部24を追加した点である。
6,22の出力、及び、雑音方向推定部17の出力、及
び、第1及び第2の音声方向推定部18,23の出力を
有効雑音決定部24に渡し、有効雑音決定部24の出力
を第1の入力方向修正部14に渡す構成としてある。
する。まず、複数のマイクロホンを持つ音声入力部1
1、この例では第1及び第2の計2本のマイクロホンm
1,m2を持つ音声入力部11でch1,ch2の音声
を取り込む。そして、この音声入力部11から入力され
た2チャンネル分の音声の信号ch1,ch2(すなわ
ち、第1チャンネルch1は第1のマイクロホンm1か
らの音声、第2チャンネルch2は第2のマイクロホン
m2からの音声に該当する)は、周波数分析部12に送
られ、ここで例えば高速フーリエ変換(FFT)等の処
理を行うことによって、それぞれのチャンネル別に周波
数成分(周波数スペクトル)が求められる。
ャンネル別の周波数成分は、それぞれ第1、第2及び第
3のビームフォーマ13,16,22に与えられる。
ネル分の周波数成分入力について、目的音の方向対応に
位相を合わせた上で、周波数領域の適応フィルタにより
上述のようにして処理することで雑音を抑圧し、目的音
の方向の周波数成分を出力する。ここで、具体的に説明
すると第1の入力方向修正部14は第1のビームフォー
マ13に対して次のような角度情報(α)を与える。つ
まり、第1の入力方向修正部14は、有効雑音決定部2
4を介して与えられる音声方向推定部18若しくは音声
方向推定部23からの出力を用い、目的音の方向があた
かもマイクロホンの正面方向となるよう、上記2チャン
ネルの周波数成分の入力位相を整えるに必要な角度情報
(α)を入力方向修正量として第1のビームフォーマ1
3に対して与える。
の修正量(α)対応に目的音方向を修正し、当該目的音
方向以外の方向から到来する音声を抑圧させるようにす
ることで、雑音成分を抑圧し、目的音を抽出する。
16,22の場合、雑音が目的音であるから、雑音に位
相を合わせている。その結果、第2,第3のビームフォ
ーマ16,22では話者の音源は雑音源として扱われ、
各ビームフォーマの内蔵する適応フィルタは話者音源か
らの音を抽出する処理をすることになるので、当該第
2,第3のビームフォーマ16,22の適応フィルタの
パラメータからは話者音源の方向を反映した情報が得ら
れることになる。
18または23により、第2または第3のビームフォー
マ16または22における適応フィルタのパラメータを
用いて雑音源方向を知れば、それは目的音である話者音
源の方向を反映させたものである。従って、第1または
第2の音声方向推定部18または23により、第2また
は第3のビームフォーマ16または22における適応フ
ィルタのパラメータを反映させた出力を出し、第1の入
力方向修正部14でこの出力対応に入力方向修正量
(α)を発生し、この修正量対応に第1のビームフォー
マ13における目的音方向を修正すれば、第1のビーム
フォーマ13は当該目的音方向以外の方向から到来する
音声を抑圧するので、この場合、話者音源からの成分を
抽出できることになる。
ィルタでは雑音成分が抽出されるようにパラメータが制
御されているので、このパラメータから雑音方向推定部
17では、雑音方向を推定し、その情報を第2及び第3
の入力方向修正部15,21と有効雑音決定部24に与
えることになる。
力を受けた第2の入力方向修正部15では、当該雑音方
向推定部17からの出力対応に入力方向修正量(α)を
発生し、この修正量対応に第2のビームフォーマ16に
おける目的音方向を修正すれば、第2のビームフォーマ
16は当該目的音方向以外の方向から到来する音声を抑
圧するので、この場合、話者音源以外からの成分である
雑音成分を抽出できることになる。
応フィルタでは目的音である話者音声成分が抽出される
ようにパラメータが制御されているので、このパラメー
タから第1の音声方向推定部18では、話者音声方向を
推定することができる。そして、第1の音声方向推定部
18はその推定した情報を有効雑音決定部24に与え
る。
3の入力方向修正部21にも与えられているが、これを
受けた第3の入力方向修正部21では、当該雑音方向推
定部17からの出力対応に入力方向修正量(α)を発生
に、第3のビームフォーマ22に与える。これにより、
第3のビームフォーマ22はこの与えられた修正量対応
に、自己における目的音方向を修正する。
当該目的音方向以外の方向から到来する音声を抑圧する
ので、この場合、話者音源以外からの成分、つまり、雑
音成分を抽出できることになる。このとき、第3のビー
ムフォーマ22の適応フィルタでは目的音である話者音
声成分が抽出されるようにパラメータが制御されている
ので、このパラメータから第2の音声方向推定部23で
は、話者音声方向を推定できる。そして、この推定した
情報は有効雑音決定部24に与えることになる。
の音声方向推定部18,23から与えられた話者音声方
向の推定情報と、雑音方向推定部17から与えられた雑
音方向の推定情報とをもとに、第2のビームフォーマ1
6と第3のビームフォーマ22のいずれが雑音を有効に
追尾しているかを判断する。そして、この判断結果に基
づき、有効に追尾していると判断した方のビームフォー
マにおける適応フィルタのパラメータを第1の入力方向
修正部14に与える。
は、当該パラメータを反映させた出力を出し、第1の入
力方向修正部14でこの出力対応に入力方向修正量
(α)を発生し、この修正量対応に第1のビームフォー
マ13における目的音方向を修正するので、第1のビー
ムフォーマ13は当該目的音方向以外の方向から到来す
る音声を抑圧することになって、この場合、話者音源か
らの成分を抽出でき、しかも、広く移動する雑音源から
の雑音を対象とする場合に、その移動する雑音源を見失
うことなく、確実にとらえて雑音除去することが可能と
なる。
音声周波数成分の抽出用として第1のビームフォーマ1
3が設けてあり、また、雑音周波数成分の抽出用として
第2および第3のビームフォーマ16,22が設けてあ
る。そして、観測点から見て図6に示すように、話者が
0°方向に位置していて0°±θの角度範囲で監視すれ
ば良いとすると、当該話者の音声周波数成分を抽出する
ために設けた第1のビームフォーマ13の変化範囲φ
1、すなわち、適応フィルタにおける感度を高くする方
向についての1°刻み変化範囲はせいぜい −θ < φ1 < θ に設定してこの範囲でフィルタリングに用いることにな
る。この場合、雑音周波数成分を抽出するために設けた
第2および第3のビームフォーマ16,22のうち、第
2のビームフォーマ16の変化範囲φ2は −180゜+θ < φ2 < −θ そして、第3のビームフォーマ22の変化範囲φ3は θ < φ3 < 180゜−θ に設定することになる。但し、180°は中心点を介し
て0°の対向位置、−は0°位置から見て図における反
時計方向回り、+は時計方向回りを示す。
ォーマ16と第3のビームフォーマ22は、目的音到来
範囲φ1を挟んで各々別々の範囲から到来する雑音を追
尾することになる。そのため、φ2の範囲にあった雑音
源がφ1の範囲を横切ってφ3の範囲に急に移動した場
合でも、φ3の領域を持ち場とする第3のビームフォー
マ22が当該移動して来た雑音源を直ちに捕えることが
できるため、雑音方向を見失うことがなくなる。
6の出力と、第3のビームフォーマビーム22の出力の
計2つの出力が、雑音の出力として得られるが、雑音方
向推定部17の結果に基づき、有効雑音決定部24にお
いて、第2のビームフォーマ16と第3のビームフォー
マ22のいずれが雑音を有効に追尾しているかを判断
し、この判断結果に基づき、有効に追尾して方の出力を
雑音成分として用いることになる。
上の処理の全体の流れを図7に示しておく。この処理は
フレーム毎に行われる。各ビームフォーマの変化範囲お
よび入力方向の初期値を設定した後に(ステップS3
1)、第1のビームフォーマ13の処理を行い(ステッ
プS32)、雑音方向を推定した後に(ステップS3
3)、該雑音方向を入力として有効雑音決定部24にお
いて、雑音方向がφ2にあるか、φ3にあるかの判定を
実施し、第2のビームフォーマ16と第3のビームフォ
ーマ22のどちらを選択するかを決定する(ステップS
34)。
方向修正部15あるいは第3の入力方向修正部21のど
ちらかに送られ、雑音方向が修正され、選択されたビー
ムフォーマの処理が実行される。
域であれば雑音方向が第2の入力方向修正部15に送ら
れ、雑音方向が修正され、第2のビームフォーマ16の
処理が実行され、目的音方向が推定される(ステップS
34,S35,S36,S37)。また、推定された雑
音方向がφ3の領域であれば雑音方向が第3の入力方向
修正部21に送られ、雑音方向が修正され、第3のビー
ムフォーマ22の処理が実行され、目的音方向が推定さ
れる(ステップS34,S38,S39,S40,S4
1)。
定された音声方向(目的音方向)がφ1の範囲内かどう
か判断され、範囲内の場合は、推定された音声方向が第
1のビームフォーマ13の第1の入力方向修正部14に
送られ、入力方向の修正が実行される(ステップS4
2,S43)。範囲外の場合は修正処理が実行されず、
次のフレームに対する処理に進む(ステップS42,S
31)。
び雑音方向を追尾しながら、雑音抑圧が行われる。
音声を少なくとも異なる2箇所以上の位置で受音する音
声入力手段と、前記受音位置に対応する音声信号のチャ
ネル毎に周波数分析を行って複数チャネルの周波数成分
を出力する周波数分析手段と、この周波数分析手段にて
得られる前記複数チャネルの周波数成分について、所望
方向外の感度が低くなるように計算したフィルタ係数を
用いての適応フィルタ処理を施すことにより前記話者方
向からの音声以外の音声を抑圧する到来雑音抑圧処理を
行い、目的音声成分を得る第1のビームフォーマ処理手
段と、前記周波数分析手段にて得られる前記複数チャネ
ルの周波数成分について、所望方向外の感度が低くなる
ように計算したフィルタ係数を用いての適応フィルタ処
理を施すことにより前記話者方向からの音声を抑圧し、
第1の雑音成分を得る第2のビームフォーマ処理手段
と、前記周波数分析手段にて得られる前記複数チャネル
の周波数成分について、所望方向外の感度が低くなるよ
うに計算したフィルタ係数を用いての適応フィルタ処理
を施すことにより前記話者方向からの音声を抑圧し、第
2の雑音成分を得る第2のビームフォーマ処理手段と、
前記第1のビームフォーマ処理手段で計算されるフィル
タ係数から雑音方向を推定する雑音方向推定手段と、前
記第2のビームフォーマ処理手段で計算されるフィルタ
係数から第1の目的音方向を推定する第1の目的音方向
推定手段と、前記第3の適応ビームフォーマ処理手段で
計算されるフィルタ係数から第2の目的音方向を推定す
る第2の目的音方向推定手段と、前記第1のビームフォ
ーマにおいて入力対象とする目的音の到来方向である第
1の入力方向を、前記第1の目的音方向推定手段で推定
された第1の目的音方向と、第2の目的音方向推定手段
で推定された第2の目的音方向のいずれか一方または両
方に基づいて逐次修正する第1の入力方向修正手段と、
前記雑音方向修正手段で推定された雑音方向が所定の第
1の範囲にある場合に、前記第2のビームフォーマにお
いて入力対象とする雑音の到来方向である第2の入力方
向を該雑音方向に基づいて逐次修正する第2の入力方向
修正手段と、前記雑音方向修正手段で推定された雑音方
向が所定の第2の範囲にある場合に、前記第3のビーム
フォーマにおいて入力対象とする雑音の到来方向である
第3の入力方向を該雑音方向に基づいて逐次修正する第
3の入力方向修正手段と、前記雑音方向推定手段で推定
された雑音方向が所定の第1の範囲から到来したか所定
の第2の範囲から到来したかに基づいて前記第1の出力
雑音と前記第2の出力雑音のいずれか一方を真の雑音出
力と決定していずれか一方の雑音を出力すると同時に、
第1の音声方向推定手段と第2の音声方向推定手段のい
ずれの推定結果が有効であるかを決定していずれか一方
の音声方向推定結果を第1の入力方向修正手段へ出力す
る有効雑音決定手段とを具備して構成したものである。
声した音声を異なる2箇所以上の位置で音声入力手段は
受音し、周波数分析手段では、これを前記受音位置に対
応する音声信号のチャネル毎に周波数分析して複数チャ
ネルの周波数成分を出力する。そして、第1のビームフ
ォーマ処理手段はこの周波数分析手段にて得られる前記
複数チャネルの周波数成分について、所望方向外の感度
が低くなるように計算したフィルタ係数を用いての適応
フィルタ処理を施すことにより前記話者方向からの音声
以外の音声を抑圧する到来雑音抑圧処理を行い、目的音
声成分を得、また、第2のビームフォーマ処理手段は、
前記周波数分析手段にて得られる前記複数チャネルの周
波数成分について、所望方向外の感度が低くなるように
計算したフィルタ係数を用いての適応フィルタ処理を施
すことにより前記話者方向からの音声を抑圧し、雑音成
分を得る。そして、雑音方向推定手段は、前記第1のビ
ームフォーマ処理手段で計算されるフィルタ係数から雑
音方向を推定し、目的音方向推定手段は、前記第2のビ
ームフォーマ処理手段で計算されるフィルタ係数から目
的音方向を推定する。また、第1の目的音方向推定手段
は前記第2のビームフォーマ処理手段で計算されるフィ
ルタ係数から第1の目的音方向を推定し、第2の目的音
方向推定手段は、前記第3の適応ビームフォーマ処理手
段で計算されるフィルタ係数から第2の目的音方向を推
定する。
1のビームフォーマにおいて入力対象とする目的音の到
来方向である第1の入力方向を、前記第1の目的音方向
推定手段で推定された第1の目的音方向と、第2の目的
音方向推定手段で推定された第2の目的音方向のいずれ
か一方または両方に基づいて逐次修正する。そして、第
2の入力方向修正手段は、前記雑音方向修正手段で推定
された雑音方向が所定の第1の範囲にある場合に、前記
第2のビームフォーマにおいて入力対象とする雑音の到
来方向である第2の入力方向を該雑音方向に基づいて逐
次修正し、第3の入力方向修正手段は、前記雑音方向修
正手段で推定された雑音方向が所定の第2の範囲にある
場合に、前記第3のビームフォーマにおいて入力対象と
する雑音の到来方向である第3の入力方向を該雑音方向
に基づいて逐次修正する。従って、第2の入力方向修正
手段の出力により第2の入力方向を修正される第2のビ
ームフォーマは第2の入力方向以外から到来する成分を
抑圧して残りの雑音成分を抽出することになり、また、
第3の入力方向修正手段の出力により第3の入力方向を
修正される第3のビームフォーマは第3の入力方向以外
から到来する成分を抑圧して残りの雑音成分を抽出する
ことになる。
向推定手段で推定された雑音方向が所定の第1の範囲か
ら到来したか所定の第2の範囲から到来したかに基づい
て前記第1の出力雑音と前記第2の出力雑音のいずれか
一方を真の雑音出力と決定していずれか一方の雑音を出
力すると同時に、第1の音声方向推定手段と第2の音声
方向推定手段のいずれの推定結果が有効であるかを決定
して有効な方の音声方向推定結果を第1の入力方向修正
手段へ出力する。この結果、目的音方向修正手段は、前
記第1のビームフォーマにおいて入力対象となる目的音
の到来方向である第1の入力方向を、前記決定した方の
目的音方向推定手段で得た目的音方向に基づいて逐次修
正するので、第1のビームフォーマは第1の入力方向以
外から到来する雑音成分を抑圧して話者の音声成分を低
雑音で抽出することになる。
た音声周波数成分と、音声成分を抑圧した雑音周波数成
分とを別々に得ることができるが、この発明の最大の特
徴は、第1乃至第3のビームフォーマとして、周波数領
域で動作するビームフォーマを用いるようにした点にあ
る。そして、このことによって、計算量を大幅に削減す
ることができるようにしている。
処理量が大幅に低減されるのに加え、入力音声に対する
周波数分析以外の周波数分析処理を省略することがで
き、かつ、フィルタ演算時に必要であった時間領域から
周波数領域ヘの変換処理も不要となり、全体の演算量を
大幅に削減することができる。
全く異ならせた雑音追尾用のビームフォーマを設けてあ
り、それぞれの出力からそれぞれ音声方向を推定させる
と共に、それぞれの推定結果からいずれが有効な雑音追
尾をしているかを判断して、有効と判断された方のビー
ムフォーマのフィルタ係数による音声方向の推定結果を
第1の目的音方向修正手段に与えることで第1の目的音
方向修正手段は、前記第1のビームフォーマにおいて入
力対象となる目的音の到来方向である第1の入力方向
を、前記目的音方向推定手段で推定された目的音方向に
基づいて逐次修正するので、第1のビームフォーマは第
1の入力方向以外から到来する雑音成分を抑圧して話者
の音声成分を低雑音で抽出することができ、雑音源が移
動してもこれを見失うことなく追尾して抑圧することが
できるようになるものである。
2本のマイクロホンだけでも目的音源の追尾を可能とす
べく、雑音追尾用のビームフォーマを雑音抑圧のビーム
フォーマとは別に1個用いるが、例えば、雑音源が目的
音の方向を横切って移動したような場合、雑音の追尾精
度が低下することがあった。
ムフォーマを複数用いて各々別個の追尾範囲を受け持つ
ようにしたことにより、上記のような場合でも追尾精度
の低下を抑止できるようになる。
は、演算負荷の軽減を図りつつ、主として方向を持つ雑
音について抑圧できるようにした例を示した。そして、
この場合、テレビ会議システムなどのように、話者音源
の配置がわかっていて、しかも、環境的に雑音が少ない
ような環境下での利用に適しているが、レベルも特性も
まちまちで雑多な雑音の影響を受ける屋外や、大勢の人
の集まる店舗や駅と云った所で使用するには不十分であ
ると考えられる。
抑制できるようにした実施例を次に説明する。
項3に対応する。ここでは、方向性のある雑音はビーム
フォーマにより抑圧し、方向性のない背景雑音はスペク
トルサブトラクション(SS)処理により、抑圧するよ
うにした高精度の雑音抑圧が可能なシステムを説明す
る。
構成のシステムの後段に、更に図8の構成のスペクトル
サブトラクション(SS)処理部30を接続して構成す
る。スペクトルサブトラクション(SS)処理部30は
図に示すように、音声帯域パワー計算部31、雑音帯域
パワー計算部32、帯域重み計算部33、スペクトル減
算部34から構成されている。
は、前記ビームフォーマ13により得られた音声周波数
を、周波数帯域毎に分割して帯域毎の音声パワーを計算
するものであり、雑音帯域パワー計算部32は、前記ビ
ームフォーマ16により得られた雑音周波数成分(また
はビームフォーマ16,22によりそれぞれ得られ、有
効雑音決定部24により選択されて出力された雑音周波
数成分)を、周波数帯域毎に分割して帯域毎の雑音パワ
ーを計算するものである。
れた音声の平均帯域パワーPv(k)と雑音の平均帯域パ
ワーPn(k)を用い、帯域毎の帯域重み係数W(k)を
計算するものであり、修正スペクトル減算部34は、前
記入力帯域パワー計算部31にて計算された入力帯域パ
ワーと、音声帯域パワー計算部31で計算された音声帯
域パワーとに基き、音声信号の周波数帯域毎に重みをか
けて背景雑音を抑圧するものである。
波数成分と、雑音帯域パワー計算部32で用いる雑音周
波数成分は、いずれも実施例1あるいは実施例2のビー
ムフォーマの2つの出力である目的音声成分と雑音成分
を利用する。そして、一般に、スペクトルサブトラクシ
ョン(SS)として知られる雑音抑圧処理により、方向
性のない背景雑音成分の抑圧を行う。
ョン(SS)は、1チャンネルのマイクロホン(つま
り、1本のマイクロホン)を用い、このマイクロホンの
出力から音声のない区間において雑音のパワーを推定す
るため、非定常な雑音が音声に重畳している場合には対
処できない。
り、2本のマイクロホン)を用いて、一方を雑音収集
用、片方を雑音重畳音声収集用とする場合にも、両マイ
クロホンの設置場所を離す必要があり、その結果、音声
に重畳する雑音と、雑音収集用マイクロホンで取り込む
雑音との位相がずれ、スペクトルサブトラクションして
も雑音抑圧の改善効果は大きく上がらなかった。
フォーマを用意して、このビームフォーマの出力を用い
るようにしたため、実施例1および実施例2で述べたよ
うに、位相のずれが補正され、非定常雑音の場合でも高
精度なスペクトルサブトラクション(SS)を実現でき
る。
力を利用しているため、周波数分析を省略してスペクト
ルサブトラクションが可能であり、従来より少ない演算
量で非定常雑音を抑圧できる。
ン(SS)方法について述べる。
原理>まず、スペクトルサブトラクションの原理につい
て説明する。目的音声用ビームフォーマ(第1のビーム
フォーマ13)の出力をPv、雑音用ビームフォーマ
(第2または第3のビームフォーマ16または22)の
出力をPnとすると、 Pv=V+B′ Pn=N+B″ と表すことができる。ここで、Vは音声成分のパワー、
B′は音声出力に含まれる背景雑音のパワーであり、N
は雑音源成分のパワー、B″は雑音出力に含まれる背景
雑音のパワーである。これらのうち、音声出力成分に含
まれる背景雑音成分を、スペクトルサブトラクション処
理により抑圧する。
のB″と同等であり、雑音源成分のパワーNも音声成分
のパワーVに比べて小さいとすると、B′=Pnと考え
ることができ、スペクトルサブトラクション(SS)処
理用の重み係数Wは以下のように求めることができる。
すなわち、Wは W=(Pv−Pn)/Pv 〜 V/(V+B′) となり、 V 〜 Pv*W として音声成分を近似的に求めることができる。
S)処理に必要な構成を、また、図9にスペクトルサブ
トラクション処理手順を示す。
22)からの出力として音声周波数成分と雑音周波数成
分が得られる。ビームフォーマ13からの出力である音
声周波数成分を用いて音声帯域パワー計算が実施され
(ステップS51)、ビームフォーマ15(または2
2)からの出力である雑音周波数成分を用いて雑音帯域
パワー計算が実施される(ステップS52)。ここでの
パワー計算は、実施例1および実施例2で説明した本発
明システムの音声周波数成分と雑音周波数成分を利用し
ており、これらはビームフォーマの処理を周波数領域で
行っていることから、周波数分析なしに、そのまま音声
および雑音の周波数成分の各帯域毎にパワーの計算を実
行できる。
均化し、帯域毎に平均パワーを求める(ステップS5
3)。帯域重み計算部33では、帯域k毎に、得られた
音声の平均帯域パワーPv(k)と雑音の平均帯域パワー
Pn(k)を用い、次式により、帯域毎の帯域重み係数W
(k)を計算する。
り、Wminの値は例えば“0.01”等とする。
計算部23で計算された帯域毎の重み係数W(k)を用
い、入力の音声周波数成分Pv(k)に重みをかけ、雑音
成分を抑圧した音声周波数成分Pv(k)′を求める(ス
テップS54)。
ション(SS)処理により、抑圧され、方向を持つ雑音
は前述のビームフォーマにより抑圧されて、結果的に高
精度の雑音抑圧が可能となる。
1または実施例2の音抑圧装置において得られた音声周
波数成分と雑音周波数成分を用いるようにしたものであ
り、前記周波数帯域毎に分割して帯域毎の音声パワーを
計算する音声帯域パワー計算手段と、前記得られた雑音
周波数成分を、周波数帯域毎に分割して帯域毎の雑音パ
ワーを計算する雑音帯域パワー計算手段と、前記音声帯
域パワー計算手段と雑音帯域パワー計算手段とから得ら
れる音声と雑音の周波数帯域パワーに基き、音声信号の
周波数帯域毎に重みをかけて背景雑音を抑圧するスペク
トル減算手段とからなるスペクトル減算雑音抑圧手段を
前記実施例1または実施例2の音抑圧装置にさらに具備
して構成したものである。
は、得られた音声周波数のスペクトル成分を、周波数帯
域毎に分割して帯域毎の音声パワーを計算し、雑音帯域
パワー計算手段は、前記得られた雑音周波数のスペクト
ル成分を、周波数帯域毎に分割して帯域毎の雑音パワー
を計算する。そして、スペクトル減算手段は、前記音声
帯域パワー計算手段と雑音帯域パワー計算手段とから得
られる音声と雑音の周波数帯域パワーに基き、音声信号
の周波数帯域毎に重みをかけて背景雑音を抑圧する。
圧できない方向性のない雑音(背景雑音)は、本発明シ
ステムのビームフォーマで得ることのできる目的音声成
分と雑音成分を利用し、これをスペクトルサブトラクシ
ョン処理することで抑圧する。すなわち、本システムで
は、ビームフォーマとして目的音声成分抽出用と雑音成
分抽出用の2つのビームフォーマを備えているが、これ
らのビームフォーマの出力である目的音声成分と雑音成
分を利用してスペクトルサブトラクション処理すること
により、方向性のない背景雑音成分の抑圧を行う。スペ
クトルサブトラクション(SS)処理は雑音抑圧処理と
して知られるが、一般的に行われるスペクトルサブトラ
クション(SS)処理は、1チャンネルのマイクロホン
(つまり、1本のマイクロホン)を用い、このマイクロ
ホンの出力から音声のない区間において雑音のパワーを
推定するため、非定常な雑音が音声に重畳している場合
には対処できない。また、2チャンネルのマイクロホン
(つまり、2本のマイクロホン)を用いて、一方を雑音
収集用、片方を雑音重畳音声収集用とする場合にも、両
マイクロホンの設置場所を離す必要があり、その結果、
音声に重畳する雑音と、雑音収集用マイクロホンで取り
込む雑音との位相がずれ、スペクトルサブトラクション
処理しても雑音抑圧の改善効果は大きく上がらない。
ビームフォーマを用意して、このビームフォーマの出力
を用いるようにしたため、位相のずれは補正されてお
り、従って、非定常雑音の場合でも高精度なスペクトル
サブトラクション処理を実現できる。さらに、周波数領
域のビームフォーマの出力を利用しているため、周波数
分析を省略してスペクトルサブトラクションが可能であ
り、従来より少ない演算量で非定常雑音を抑圧できる。
できるようにした例を実施例4として次に説明する。
4に対応する。本実施例は、実施例3のスペクトルサブ
トラクション(SS)において、雑音成分のパワーを修
正することにより、さらに高精度に雑音抑圧を行うこと
を可能とするものである。すなわち、実施例3では雑音
源のパワーNが小さいという仮定をおいたため、スペク
トルサブトラクション(SS)処理を行うと雑音源の成
分が音声に重畳している部分では歪みが大きくなる懸念
が拭えないという問題がある。
て実施例3のスペクトルサブトラクションの帯域重みの
計算を修正するようにする。
パワーをV、音声出力に含まれる背景雑音パワーを
B′、雑音出力パワーをPn、雑音源成分のパワーを
N、雑音出力に含まれる背景雑音成分をB″、どの信号
も抑圧されていない入力信号のパワーをPxとすると、 Px=V+N+B Pv=V+B′ Pn=N+B″ ここで、ここで、B 〜 B′ 〜 B″と仮定する
と、真の背景雑音成分のパワーPbは、 Pb=Pv+Pn−Px =V+B′+N+B″−(V+N+B) =B′+B″−B =B となる。この雑音パワーを用いたスペクトルサブトラク
ション(SS)の重みは、 W=(Pv−Pb)/Pv =(Px−Pn)/Pv と計算でき、背景雑音が非定常でかつ、Nが大きい場合
でも歪みの少いSS処理を行うことができる。
れを図11に示す。図10中、31は音声帯域パワー計
算部、32は雑音帯域パワー計算部、34はスペクトル
減算部、35は入力信号帯域パワー計算部である。
は、前記ビームフォーマ13により得られた音声周波数
を、周波数帯域毎に分割して帯域毎の音声パワーを計算
するものであり、雑音帯域パワー計算部32は、前記ビ
ームフォーマ16または22により得られ、有効雑音決
定部24により選択されて出力された雑音周波数成分
を、周波数帯域毎に分割して帯域毎の雑音パワーを計算
するものである。
分析部12から得られた入力信号の周波数スペクトル成
分を周波数帯域毎に分割し、帯域毎の入力パワーを計算
するものであり、スペクトル減算部34は、前記入力帯
域パワー計算部35にて計算された入力帯域パワーと、
音声帯域パワー計算部31で計算された音声帯域パワー
と、雑音帯域パワー計算部32で計算された雑音帯域パ
ワーとに基き、音声信号の周波数帯域ごとに重みをかけ
て背景雑音を抑圧するものである。
トラクション(SS)部30の構成と、実施例3でのス
ペクトルサブトラクション(SS)部30の構成との差
は、実施例4においては何も抑圧されていない入力信号
の周波数成分を更に用いる点である。
号帯域パワー計算部35では、ビームフォーマからの音
声周波数成分あるいは雑音周波数成分と同様に、帯域ご
とにパワーを計算する(ステップS61)。
ォーマ13,15(または22)からの出力として音声
周波数成分と雑音周波数成分が与えられるので、音声帯
域パワー計算部31ではビームフォーマ13からの出力
である音声周波数成分を用いて音声帯域パワー計算を実
施し(ステップS62)、雑音帯域パワー計算部32で
はビームフォーマ15(または22)からの出力である
雑音周波数成分を用いて雑音帯域パワー計算を実施する
(ステップS63)。
上述したように重み係数を求めた後に、重み付けを行う
(ステップS64,S65)。これにより、方向を持つ
雑音成分および方向のない雑音成分を抑圧した歪みの少
い音声成分のみの抽出ができるようになる。
雑音抑圧装置において、音声入力手段から得られた入力
信号を周波数分析した入力信号の周波数成分を周波数帯
域毎に分割し、帯域毎の入カパワーを計算する入力帯域
パワー計算手段を設けて、スペクトル減算手段には、入
力帯域パワーと音声帯域パワーと雑音帯域パワーとに基
き、音声信号の周波数帯域毎に重みをかけて背景雑音を
抑圧する処理を実施させるように構成したことを特徴と
するものである。
は、得られた音声周波数のスペクトル成分を、周波数帯
域毎に分割して帯域毎の音声パワーを計算し、雑音帯域
パワー計算手段は、前記得られた雑音周波数のスペクト
ル成分を、周波数帯域毎に分割して帯域毎の雑音パワー
を計算する。また、入力帯域パワー計算手段があり、こ
の入力帯域パワー計算手段は、音声入力手段から得られ
た入力信号を周波数分析して得た入力音声の周波数スペ
クトル成分を受けて、これを周波数帯域毎に分割し、帯
域毎の入カパワーを計算する。そして、スペクトル減算
手段は、前記音声帯域パワー計算手段と雑音帯域パワー
計算手段とから得られる音声と雑音の周波数帯域パワー
に基き、音声信号の周波数帯域毎に重みをかけて背景雑
音を抑圧する。
におけるスペクトルサブトラクション処理において、更
に雑音成分についてそのパワーを修正するようにしたこ
とにより、一層高精度に雑音抑圧を行うことを可能とす
るものである。すなわち、第3の発明では雑音源のパワ
−Nが小さいという仮定をおいたため、スペクトルサブ
トラクション処理を行うと雑音源の成分が音声に重畳し
ている部分では歪みが大きくなることが避けられない
が、ここでは入力信号のパワーを用いて第3の発明での
スペクトルサブトラクション処理における帯域重みの計
算を修正するようにした。これにより、方向を持つ雑音
成分および方向のない雑音成分を抑圧した歪みの少い音
声成分のみの抽出ができるようになるものである。
は第1には、話者の発声した音声を少なくとも異なる2
箇所以上の位置で受音する音声入力手段と、前記受音位
置に対応する音声信号のチャネル毎に周波数分析を行っ
て複数チャネルの周波数成分を出力する周波数分析手段
と、この周波数分析手段にて得られる前記複数チャネル
の周波数成分について、所望方向外の感度が低くなるよ
うに計算したフィルタ係数を用いての適応フィルタ処理
を施すことにより前記話者方向からの音声以外の音声を
抑圧する到来雑音抑圧処理を行い、目的音声成分を得る
第1のビームフォーマ処理手段と、前記周波数分析手段
にて得られる前記複数チャネルの周波数成分について、
所望方向外の感度が低くなるように計算したフィルタ係
数を用いての適応フィルタ処理を施すことにより前記話
者方向からの音声を抑圧し、雑音成分を得る第2のビー
ムフォーマ処理手段と、前記第1のビームフォーマ処理
手段で計算されるフィルタ係数から雑音方向を推定する
雑音方向推定手段と、前記第2のビームフォーマ処理手
段で計算されるフィルタ係数から目的音方向を推定する
目的音方向推定手段と、前記第1のビームフォーマにお
いて入力対象となる目的音の到来方向である第1の入力
方向を、前記目的音方向推定手段で推定された目的音方
向に基づいて逐次修正する目的音方向修正手段と、前記
第2のビームフォーマにおいて入力対象とする雑音の到
来方向である第2の入力方向を、前記雑音方向推定手段
で推定された雑音方向に基づいて逐次修正する雑音方向
修正手段とを具備して構成したものである。
声を異なる2箇所以上の位置で音声入力手段は受音し、
周波数分析手段では、これを前記受音位置に対応する音
声信号のチャネル毎に周波数分析して複数チャネルの周
波数成分を出力する。そして、第1のビームフォーマ処
理手段はこの周波数分析手段にて得られる前記複数チャ
ネルの周波数成分について、所望方向外の感度が低くな
るように計算したフィルタ係数を用いての適応フィルタ
処理を施すことにより前記話者方向からの音声以外の音
声を抑圧する到来雑音抑圧処理を行い、目的音声成分を
得、また、第2のビームフォーマ処理手段は、前記周波
数分析手段にて得られる前記複数チャネルの周波数成分
について、所望方向外の感度が低くなるように計算した
フィルタ係数を用いての適応フィルタ処理を施すことに
より前記話者方向からの音声を抑圧し、雑音成分を得
る。そして、雑音方向推定手段は、前記第1のビームフ
ォーマ処理手段で計算されるフィルタ係数から雑音方向
を推定し、目的音方向推定手段は、前記第2のビームフ
ォーマ処理手段で計算されるフィルタ係数から目的音方
向を推定する。目的音方向修正手段は、前記第1のビー
ムフォーマにおいて入力対象となる目的音の到来方向で
ある第1の入力方向を、前記目的音方向推定手段で推定
された目的音方向に基づいて逐次修正するので、第1の
ビームフォーマは第1の入力方向以外から到来する雑音
成分を抑圧して話者の音声成分を低雑音で抽出すること
になる。また、雑音方向修正手段は、前記第2のビーム
フォーマにおいて入力対象とする雑音の到来方向である
第2の入力方向を、前記雑音方向推定手段で推定された
雑音方向に基づいて逐次修正するので、第2のビームフ
ォーマは第2の入力方向以外から到来する成分を抑圧し
て話者の音声成分を抑圧した残りの雑音成分を抽出する
ことになる。
た音声周波数成分と、音声成分を抑圧した雑音周波数成
分とを別々に得ることができるが、この発明の第1の特
徴は、第1及び第2のビームフォーマとして、周波数領
域で動作するビームフォーマを用いるようにした点にあ
る。そして、このことによって、計算量を大幅に削減す
ることができるようにしている。そしてこの発明による
と、適応フィルタの処理量が大幅に低減されるのに加
え、入力音声に対する周波数分析以外の周波数分析処理
を省略することができ、かつ、フィルタ演算時に必要で
あった時間領域から周波数領域ヘの変換処理も不要とな
り、全体の演算量を大幅に削減することができる。
で抑圧できない拡散性雑音の抑圧処理のために、スペク
トルサブトラクション処理を、ビームフォーマ処理の後
に行うようにしており、このスペクトルサブトラクショ
ン処理は周波数スペクトルを入力とするため、FFT
(高速フーリエ変換)などの周波数分析が従来必要であ
ったが、周波数領域で動作するビームフォーマを用いる
と当該ビームフォーマからは周波数スペクトルが出力さ
れるため、これをスペクトルサブトラクション処理に流
用できるので、特別にスペクトルサブトラクション処理
のためのFFTを実施する従来のFFT処理工程は省略
することができる。故に、全体の演算量を大幅に削減す
ることができる。
方向推定の際に必要であった時間領域から周波数領域へ
の変換処理も不要となり、全体の演算量を大幅に削減す
ることができる。
音声を少なくとも異なる2箇所以上の位置で受音する音
声入力手段と、前記受音位置に対応する音声信号のチャ
ネル毎に周波数分析を行って複数チャネルの周波数成分
を出力する周波数分析手段と、この周波数分析手段にて
得られる前記複数チャネルの周波数成分について、所望
方向外の感度が低くなるように計算したフィルタ係数を
用いての適応フィルタ処理を施すことにより前記話者方
向からの音声以外の音声を抑圧する到来雑音抑圧処理を
行い、目的音声成分を得る第1のビームフォーマ処理手
段と、前記周波数分析手段にて得られる前記複数チャネ
ルの周波数成分について、所望方向外の感度が低くなる
ように計算したフィルタ係数を用いての適応フィルタ処
理を施すことにより前記話者方向からの音声を抑圧し、
第1の雑音成分を得る第2のビームフォーマ処理手段
と、前記周波数分析手段にて得られる前記複数チャネル
の周波数成分について、所望方向外の感度が低くなるよ
うに計算したフィルタ係数を用いての適応フィルタ処理
を施すことにより前記話者方向からの音声を抑圧し、第
2の雑音成分を得る第2のビームフォーマ処理手段と、
前記第1のビームフォーマ処理手段で計算されるフィル
タ係数から雑音方向を推定する雑音方向推定手段と、前
記第2のビームフォーマ処理手段で計算されるフィルタ
係数から第1の目的音方向を推定する第1の目的音方向
推定手段と、前記第3の適応ビームフォーマ処理手段で
計算されるフィルタ係数から第2の目的音方向を推定す
る第2の目的音方向推定手段と、前記第1のビームフォ
ーマにおいて入力対象とする目的音の到来方向である第
1の入力方向を、前記第1の目的音方向推定手段で推定
された第1の目的音方向と、第2の目的音方向推定手段
で推定された第2の目的音方向のいずれか一方または両
方に基づいて逐次修正する第1の入力方向修正手段と、
前記雑音方向修正手段で推定された雑音方向が所定の第
1の範囲にある場合に、前記第2のビームフォーマにお
いて入力対象とする雑音の到来方向である第2の入力方
向を該雑音方向に基づいて逐次修正する第2の入力方向
修正手段と、前記雑音方向修正手段で推定された雑音方
向が所定の第2の範囲にある場合に、前記第3のビーム
フォーマにおいて入力対象とする雑音の到来方向である
第3の入力方向を該雑音方向に基づいて逐次修正する第
3の入力方向修正手段と、前記雑音方向推定手段で推定
された雑音方向が所定の第1の範囲から到来したか所定
の第2の範囲から到来したかに基づいて前記第1の出力
雑音と前記第2の出力雑音のいずれか一方を真の雑音出
力と決定していずれか一方の雑音を出力すると同時に、
第1の音声方向推定手段と第2の音声方向推定手段のい
ずれの推定結果が有効であるかを決定していずれか一方
の音声方向推定結果を第1の入力方向修正手段へ出力す
る有効雑音決定手段とを具備して構成する。
声を異なる2箇所以上の位置で音声入力手段は受音し、
周波数分析手段では、これを前記受音位置に対応する音
声信号のチャネル毎に周波数分析して複数チャネルの周
波数成分を出力する。そして、第1のビームフォーマ処
理手段はこの周波数分析手段にて得られる前記複数チャ
ネルの周波数成分について、所望方向外の感度が低くな
るように計算したフィルタ係数を用いての適応フィルタ
処理を施すことにより前記話者方向からの音声以外の音
声を抑圧する到来雑音抑圧処理を行い、目的音声成分を
得、また、第2のビームフォーマ処理手段は、前記周波
数分析手段にて得られる前記複数チャネルの周波数成分
について、所望方向外の感度が低くなるように計算した
フィルタ係数を用いての適応フィルタ処理を施すことに
より前記話者方向からの音声を抑圧し、雑音成分を得
る。そして、雑音方向推定手段は、前記第1のビームフ
ォーマ処理手段で計算されるフィルタ係数から雑音方向
を推定し、目的音方向推定手段は、前記第2のビームフ
ォーマ処理手段で計算されるフィルタ係数から目的音方
向を推定する。
2のビームフォーマ処理手段で計算されるフィルタ係数
から第1の目的音方向を推定し、第2の目的音方向推定
手段は、前記第3の適応ビームフォーマ処理手段で計算
されるフィルタ係数から第2の目的音方向を推定する。
ームフォーマにおいて入力対象とする目的音の到来方向
である第1の入力方向を、前記第1の目的音方向推定手
段で推定された第1の目的音方向と、第2の目的音方向
推定手段で推定された第2の目的音方向のいずれか一方
または両方に基づいて逐次修正する。そして、第2の入
力方向修正手段は、前記雑音方向修正手段で推定された
雑音方向が所定の第1の範囲にある場合に、前記第2の
ビームフォーマにおいて入力対象とする雑音の到来方向
である第2の入力方向を該雑音方向に基づいて逐次修正
し、第3の入力方向修正手段は、前記雑音方向修正手段
で推定された雑音方向が所定の第2の範囲にある場合
に、前記第3のビームフォーマにおいて入力対象とする
雑音の到来方向である第3の入力方向を該雑音方向に基
づいて逐次修正する。従って、第2の入力方向修正手段
の出力により第2の入力方向を修正される第2のビーム
フォーマは第2の入力方向以外から到来する成分を抑圧
して残りの雑音成分を抽出することになり、また、第3
の入力方向修正手段の出力により第3の入力方向を修正
される第3のビームフォーマは第3の入力方向以外から
到来する成分を抑圧して残りの雑音成分を抽出すること
になる。
向推定手段で推定された雑音方向が所定の第1の範囲か
ら到来したか所定の第2の範囲から到来したかに基づい
て前記第1の出力雑音と前記第2の出力雑音のいずれか
一方を真の雑音出力と決定していずれか一方の雑音を出
力すると同時に、第1の音声方向推定手段と第2の音声
方向推定手段のいずれの推定結果が有効であるかを決定
して有効な方の音声方向推定結果を第1の入力方向修正
手段へ出力する。この結果、目的音方向修正手段は、前
記第1のビームフォーマにおいて入力対象となる目的音
の到来方向である第1の入力方向を、前記決定した方の
目的音方向推定手段で得た目的音方向に基づいて逐次修
正するので、第1のビームフォーマは第1の入力方向以
外から到来する雑音成分を抑圧して話者の音声成分を低
雑音で抽出することになる。
た音声周波数成分と、音声成分を抑圧した雑音周波数成
分とを別々に得ることができるが、この発明の最大の特
徴は、第1及び第2のビームフォーマとして、周波数領
域で動作するビームフォーマを用いるようにした点にあ
る。そして、このことによって、計算量を大幅に削減す
ることができるようにしている。
処理量が大幅に低減されるのに加え、入力音声に対する
周波数分析以外の周波数分析処理を省略することがで
き、かつ、フィルタ演算時に必要であった時間領域から
周波数領域ヘの変換処理も不要となり、全体の演算量を
大幅に削減することができる。
全く異ならせた雑音追尾用のビームフォーマを設けてあ
り、それぞれの出力からそれぞれ音声方向を推定させる
と共に、それぞれの推定結果からいずれが有効な雑音追
尾をしているかを判断して、有効と判断された方のビー
ムフォーマのフィルタ係数による音声方向の推定結果を
第1の目的音方向修正手段に与えることで第1の目的音
方向修正手段は、前記第1のビームフォーマにおいて入
力対象となる目的音の到来方向である第1の入力方向
を、前記目的音方向推定手段で推定された目的音方向に
基づいて逐次修正するので、第1のビームフォーマは第
1の入力方向以外から到来する雑音成分を抑圧して話者
の音声成分を低雑音で抽出することができ、雑音源が移
動してもこれを見失うことなく追尾して抑圧することが
できるようになるものである。
2本のマイクロホンだけでも目的音源の追尾を可能とす
べく、雑音追尾用のビームフォーマを雑音抑圧のビーム
フォーマとは別に1個用いるが、例えば、雑音源が目的
音の方向を横切って移動したような場合、雑音の追尾精
度が低下することがあった。
ムフォーマを複数用いて各々別個の追尾範囲を受け持つ
ようにしたことにより、上記のような場合でも追尾精度
の低下を抑止できるようになる。
第2の音抑圧装置において、前記得られた音声周波数
を、周波数帯域毎に分割して帯域毎の音声パワーを計算
する音声帯域パワー計算手段と、前記得られた雑音周波
数成分を、周波数帯域毎に分割して帯域毎の雑音パワー
を計算する雑音帯域パワー計算手段と、前記音声帯域パ
ワー計算手段と雑音帯域パワー計算手段とから得られる
音声と雑音の周波数帯域パワーに基き、音声信号の周波
数帯域毎に重みをかけて背景雑音を抑圧するスペクトル
減算手段とからなるスペクトル減算雑音抑圧手段をさら
に具備することを特徴とする。
は、得られた音声周波数のスペクトル成分を、周波数帯
域毎に分割して帯域毎の音声パワーを計算し、雑音帯域
パワー計算手段は、前記得られた雑音周波数のスペクト
ル成分を、周波数帯域毎に分割して帯域毎の雑音パワー
を計算する。そして、スペクトル減算手段は、前記音声
帯域パワー計算手段と雑音帯域パワー計算手段とから得
られる音声と雑音の周波数帯域パワーに基き、音声信号
の周波数帯域毎に重みをかけて背景雑音を抑圧する。
圧できない方向性のない雑音(背景雑音)は、本発明シ
ステムのビームフォーマで得ることのできる目的音声成
分と雑音成分を利用し、これをスペクトルサブトラクシ
ョン処理することで抑圧する。すなわち、本システムで
は、ビームフォーマとして目的音声成分抽出用と雑音成
分抽出用の2つのビームフォーマを備えているが、これ
らのビームフォーマの出力である目的音声成分と雑音成
分を利用してスペクトルサブトラクション処理すること
により、方向性のない背景雑音成分の抑圧を行う。スペ
クトルサブトラクション(SS)処理は雑音抑圧処理と
して知られるが、一般的に行われるスペクトルサブトラ
クション(SS)処理は、1チャンネルのマイクロホン
(つまり、1本のマイクロホン)を用い、このマイクロ
ホンの出力から音声のない区間において雑音のパワーを
推定するため、非定常な雑音が音声に重畳している場合
には対処できない。また、2チャンネルのマイクロホン
(つまり、2本のマイクロホン)を用いて、一方を雑音
収集用、片方を雑音重畳音声収集用とする場合にも、両
マイクロホンの設置場所を離す必要があり、その結果、
音声に重畳する雑音と、雑音収集用マイクロホンで取り
込む雑音との位相がずれ、スペクトルサブトラクション
処理しても雑音抑圧の改善効果は大きく上がらない。
ビームフォーマを用意して、このビームフォーマの出力
を用いるようにしたため、位相のずれは補正されてお
り、従って、非定常雑音の場合でも高精度なスペクトル
サブトラクション処理を実現できる。さらに、周波数領
域のビームフォーマの出力を利用しているため、周波数
分析を省略してスペクトルサブトラクションが可能であ
り、従来より少ない演算量で非定常雑音を抑圧できる。
の雑音抑圧装置において、音声入力手段から得られた入
力信号を周波数分析した入力信号の周波数成分を周波数
帯域毎に分割し、帯域毎の入カパワーを計算する入力帯
域パワー計算手段を設けて、スペクトル減算手段には、
入力帯域パワーと音声帯域パワーと雑音帯域パワーとに
基き、音声信号の周波数帯域毎に重みをかけて背景雑音
を抑圧する処理を実施させるようにすることを特徴とす
る。
は、得られた音声周波数のスペクトル成分を、周波数帯
域毎に分割して帯域毎の音声パワーを計算し、雑音帯域
パワー計算手段は、前記得られた雑音周波数のスペクト
ル成分を、周波数帯域毎に分割して帯域毎の雑音パワー
を計算する。また、入力帯域パワー計算手段があり、こ
の入力帯域パワー計算手段は、音声入力手段から得られ
た入力信号を周波数分析して得た入力音声の周波数スペ
クトル成分を受けて、これを周波数帯域毎に分割し、帯
域毎の入カパワーを計算する。そして、スペクトル減算
手段は、前記音声帯域パワー計算手段と雑音帯域パワー
計算手段とから得られる音声と雑音の周波数帯域パワー
に基き、音声信号の周波数帯域毎に重みをかけて背景雑
音を抑圧する。
スペクトルサブトラクション(SS)処理において、更
に雑音成分についてそのパワーを修正するようにしたこ
とにより、一層高精度に雑音抑圧を行うことを可能とす
るものである。すなわち、第3の発明では雑音源のパワ
−Nが小さいという仮定をおいたため、スペクトルサブ
トラクション(SS)処理を行うと雑音源の成分が音声
に重畳している部分では歪みが大きくなることが避けら
れないが、ここでは入力信号のパワーを用いて第3の発
明でのスペクトルサブトラクション処理における帯域重
みの計算を修正するようにした。これにより、方向を持
つ雑音成分および方向のない雑音成分を抑圧した歪みの
少い音声成分のみの抽出ができるようになるものであ
る。
ものではなく、種々変形して実施可能である。
ば、全体の演算量を大幅に削減することができ、また、
ビームフォーマのフィルタを用いた方向推定の際に必要
であった時間領域から周波数領域への変換処理も不要と
なり、全体の演算量を大幅に削減することができると云
う効果が得られる。
ームフォーマを用意して、このビームフォーマの出力を
用いるようにしたため、位相のずれは補正されており、
従って、非定常雑音の場合でも高精度なスペクトルサブ
トラクション処理を実現できる。さらに、周波数領域の
ビームフォーマの出力を利用しているため、周波数分析
を省略してスペクトルサブトラクションが可能であり、
従来より少ない演算量で非定常雑音を抑圧できて、方向
性のある雑音成分ばかりか、方向性のない雑音成分(背
景雑音)も抑圧できて歪みの少い音声成分の抽出ができ
るようになると云う効果が得られる。
である。
作例を説明する図である。
説明するためのフローチャートである。
明するためのフローチャートである。
である。
尾範囲を説明するための図である。
明するためのフローチャートである。
である。
明するためのフローチャートである。
図である。
説明するためのフローチャートである。
Claims (8)
- 【請求項1】話者の発声した音声を2箇所以上の異なっ
た位置で受音する音声入力手段と、 前記受音位置に対応する音声信号のチャネルごとに周波
数分析を行って複数チャネルの周波数成分を出力する周
波数分析手段と、 前記複数チャネルの周波数成分を用いて適応フィルタ処
理により目的の音声以外の到来雑音の抑圧処理を行って
目的音声を出力する第1のビームフォーマ処理手段と、 前記複数チャネルの周波数成分を用いて適応フィルタ処
理により目的の音声の抑圧処理を行って雑音を出力する
第2のビームフォーマ処理手段と、 前記第1のビームフォーマ処理手段で計算されるフィル
タ係数から雑音方向を推定する雑音方向推定手段と、 前記第2のビームフォーマ処理手段で計算されるフィル
タ係数から目的音方向を推定する目的音方向推定手段
と、 前記第1のビームフォーマにおいて入力対象となる目的
音の到来方向である第1の入力方向を、前記目的音方向
推定手段で推定された目的音方向に基づいて逐次修正す
る目的音方向修正手段と、 前記第2のビームフォーマにおいて入力対象とする雑音
の到来方向である第2の入力方向を、前記雑音方向推定
手段で推定された雑音方向に基づいて逐次修正する雑音
方向修正手段とを具備し、 逐次、音声周波数成分と雑音周波数成分とを別々に出力
することを特徴とする雑音抑圧装置。 - 【請求項2】話者の発声した音声を少なくとも異なる2
箇所以上の位置で受音する音声入力手段と、前記受音位
置に対応する音声信号のチャネル毎に周波数分析を行っ
て複数チャネルの周波数成分を出力する周波数分析手段
と、この周波数分析手段にて得られる前記複数チャネル
の周波数成分について、所望方向外の感度が低くなるよ
うに計算したフィルタ係数を用いての適応フィルタ処理
を施すことにより前記話者方向からの音声以外の音声を
抑圧する到来雑音抑圧処理を行い、目的音声成分を得る
第1のビームフォーマ処理手段と、 前記周波数分析手段にて得られる前記複数チャネルの周
波数成分について、所望方向外の感度が低くなるように
計算したフィルタ係数を用いての適応フィルタ処理を施
すことにより前記話者方向からの音声を抑圧し、第1の
雑音成分を得る第2のビームフォーマ処理手段と、 前記周波数分析手段にて得られる前記複数チャネルの周
波数成分について、所望方向外の感度が低くなるように
計算したフィルタ係数を用いての適応フィルタ処理を施
すことにより前記話者方向からの音声を抑圧し、第2の
雑音成分を得る第2のビームフォーマ処理手段と、 前記第1のビームフォーマ処理手段で計算されるフィル
タ係数から雑音方向を推定する雑音方向推定手段と、 前記第2のビームフォーマ処理手段で計算されるフィル
タ係数から第1の目的音方向を推定する第1の目的音方
向推定手段と、 前記第3の適応ビームフォーマ処理手段で計算されるフ
ィルタ係数から第2の目的音方向を推定する第2の目的
音方向推定手段と、 前記第1のビームフォーマにおいて入力対象とする目的
音の到来方向である第1の入力方向を、前記第1の目的
音方向推定手段で推定された第1の目的音方向と、第2
の目的音方向推定手段で推定された第2の目的音方向の
いずれか一方または両方に基づいて逐次修正する第1の
入力方向修正手段と、 前記雑音方向修正手段で推定された雑音方向が所定の第
1の範囲にある場合に、前記第2のビームフォーマにお
いて入力対象とする雑音の到来方向である第2の入力方
向を該雑音方向に基づいて逐次修正する第2の入力方向
修正手段と、 前記雑音方向修正手段で推定された雑音方向が所定の第
2の範囲にある場合に、前記第3のビームフォーマにお
いて入力対象とする雑音の到来方向である第3の入力方
向を該雑音方向に基づいて逐次修正する第3の入力方向
修正手段と、 前記雑音方向推定手段で推定された雑音方向が所定の第
1の範囲から到来したか所定の第2の範囲から到来した
かに基づいて前記第1および第2の出力雑音のいずれか
一方を真の雑音出力と決定していずれか一方の雑音を出
力すると同時に、第1の音声方向推定手段と第2の音声
方向推定手段のいずれの推定結果が有効であるかを決定
していずれか一方の音声方向推定結果を第1の入力方向
修正手段へ出力する有効雑音決定手段と、 を具備し、逐次、音声周波数成分と雑音周波数成分とを
別々に出力することを特徴とする雑音抑圧装置。 - 【請求項3】請求項1または2いずれか1項に記載の雑
音抑圧装置において、 前記得られた音声周波数を、周波数帯域毎に分割して帯
域毎の音声パワーを計算する音声帯域パワー計算手段
と、 前記得られた雑音周波数成分を、周波数帯域毎に分割し
て帯域毎の雑音パワーを計算する雑音帯域パワー計算手
段と、 前記音声帯域パワー計算手段と雑音帯域パワー計算手段
とから得られる音声と雑音の周波数帯域パワーに基き、
音声信号の周波数帯域毎に重みをかけて背景雑音を抑圧
するスペクトル減算手段と、からなるスペクトル減算雑
音抑圧手段をさらに具備することを特徴とする雑音抑圧
装置。 - 【請求項4】請求項1または2いずれか1項に記載の雑
音抑圧装置において、 前記得られた音声周波数を、周波数帯域毎に分割して帯
域毎の音声パワーを計算する音声帯域パワー計算手段
と、 前記得られた雑音周波数成分を、周波数帯域毎に分割し
て帯域毎の雑音パワーを計算する雑音帯域パワー計算手
段と、 前記音声入力手段から得られた入力信号を周波数分析し
た入力信号の周波数成分を周波数帯域毎に分割し、帯域
毎の入カパワーを計算する入力帯域パワー計算手段と、 前記入力帯域パワーと音声帯域パワーと雑音帯域パワー
とに基き、音声信号の周波数帯域毎に重みをかけて背景
雑音を抑圧する修正スペクトル減算手段を具備すること
を特徴とする雑音抑圧装置。 - 【請求項5】話者の発声した音声を2箇所以上の異なっ
た位置でそれぞれ受音してそれぞれ別チャンネルの音声
信号として得るステップと、 この各チャンネル毎の音声信号を周波数分析してそれぞ
れチャネル別に周波数スペクトル成分を得る周波数分析
ステップと、 周波数分析ステップにて得られた各チャネルの周波数成
分を用いて適応フィルタ処理により目的の音声以外の到
来雑音を抑圧処理し、目的音声を得る第1のビームフォ
ーマ処理ステップと、 前記各チャネルの周波数成分を用いて適応フィルタ処理
により目的の音声の抑圧処理を行って雑音成分を得る第
2のビームフォーマ処理ステップと、 前記第1のビームフォーマ処理ステップで計算される適
応フィルタで使用したフィルタ係数から雑音方向を推定
する雑音方向推定ステップと、 前記第2のビームフォーマ処理ステップで計算される適
応フィルタで使用したフィルタ係数から目的音方向を推
定する目的音方向推定ステップと、 前記第1のビームフォーマ処理ステップにおいて入力対
象となる目的音の到来方向である第1の入力方向を、前
記目的音方向推定手段で推定された目的音方向に基づい
て逐次修正する目的音方向修正ステップと、 前記第2のビームフォーマ処理ステップにおいて入力対
象とする雑音の到来方向である第2の入力方向を、前記
雑音方向推定ステップで推定された雑音方向に基づいて
逐次修正する雑音方向修正ステップとを具備し、 逐次、音声周波数成分と雑音周波数成分とを別々に求め
ることを特徴とする雑音抑圧方法。 - 【請求項6】話者の発声した音声を2箇所以上の異なっ
た位置でそれぞれ受音してそれぞれ別チャンネルの音声
信号として得るステップと、 この各チャンネル毎の音声信号を周波数分析してそれぞ
れチャネル別に周波数スペクトル成分を得る周波数分析
ステップと、 周波数分析ステップにて得られた各チャネルの周波数成
分を用いて前記複数チャネルの周波数成分について、所
望方向外の感度が低くなるようにしたフィルタ係数を用
いての適応フィルタ処理を施すことにより前記話者方向
からの音声以外の音声を抑圧する到来雑音抑圧処理を行
い、目的音声成分を得る第1のビームフォーマ処理ステ
ップと、 周波数分析ステップにて得られた各チャネルの周波数成
分を用いて前記複数チャネルの周波数成分について、所
望方向外の感度が低くなるように計算したフィルタ係数
を用いての適応フィルタ処理を施すことにより前記話者
方向からの音声を抑圧し、第1の雑音成分を得る第2の
ビームフォーマ処理ッステップと、 周波数分析ステップにて得られた各チャネルの周波数成
分を用いて前記複数チャネルの周波数成分について、所
望方向外の感度が低くなるようにしたフィルタ係数を用
いての適応フィルタ処理を施すことにより前記話者方向
からの音声を抑圧し、第2の雑音成分を得る第2のビー
ムフォーマ処理ステップと、 前記第1のビームフォーマ処理ステップで計算されるフ
ィルタ係数から雑音方向を推定する雑音方向推定ステッ
プと、 前記第2のビームフォーマ処理ステップで計算されるフ
ィルタ係数から第1の目的音方向を推定する第1の目的
音方向推定ステップと、 前記第3の適応ビームフォーマ処理ステップで計算され
るフィルタ係数から第2の目的音方向を推定する第2の
目的音方向推定ステップと、 前記第1のビームフォーマにおいて入力対象とする目的
音の到来方向である第1の入力方向を、前記第1の目的
音方向推定手段で推定された第1の目的音方向と、第2
の目的音方向推定手段で推定された第2の目的音方向の
いずれか一方または両方に基づいて逐次修正する第1の
入力方向修正ステップと、 前記雑音方向修正ステップで推定された雑音方向が所定
の第1の範囲にある場合に、前記第2のビームフォーマ
処理ステップにおいて入力対象とする雑音の到来方向で
ある第2の入力方向を該雑音方向に基づいて逐次修正す
る第2の入力方向修正ステップと、 前記雑音方向修正ステップで推定された雑音方向が所定
の第2の範囲にある場合に、前記第3のビームフォーマ
処理ステップにおいて入力対象とする雑音の到来方向で
ある第3の入力方向を該雑音方向に基づいて逐次修正す
る第3の入力方向修正ステップと、 前記雑音方向推定ステップで推定された雑音方向が所定
の第1の範囲から到来したか所定の第2の範囲から到来
したかに基づいて前記第1および第2の出力雑音のいず
れか一方を真の雑音出力と決定していずれか一方の雑音
を出力すると同時に、第1の音声方向推定手段と第2の
音声方向推定手段のいずれの推定結果が有効であるかを
決定していずれか一方の音声方向推定結果を第1の入力
方向修正ステップで使用する音声方向推定結果として与
える有効雑音決定ステップと、を具備することを特徴と
する雑音抑圧方法。 - 【請求項7】請求項5または6いずれか1項に記載の雑
音抑圧方法において、 前記得られた音声周波数を、周波数帯域毎に分割して帯
域毎の音声パワーを計算する音声帯域パワー計算ステッ
プと、 前記得られた雑音周波数成分を、周波数帯域毎に分割し
て帯域毎の雑音パワーを計算する雑音帯域パワー計算ス
テップと、 前記音声帯域パワー計算ステップにて得られる音声の周
波数帯域パワーと、雑音帯域パワー計算ステップにて得
られる雑音の周波数帯域パワーとに基き、音声信号の周
波数帯域毎に重みをかけて背景雑音を抑圧するスペクト
ル減算ステップと、をさらに具備することを特徴とする
雑音抑圧方法。 - 【請求項8】請求項5または6いずれか1項に記載の雑
音抑圧方法において、 前記得られた音声周波数を、周波数帯域毎に分割して帯
域毎の音声パワーを計算する音声帯域パワー計算ステッ
プと、 前記得られた雑音周波数成分を、周波数帯域毎に分割し
て帯域毎の雑音パワーを計算する雑音帯域パワー計算ス
テップと、 前記周波数分析ステップにて得られた入力信号の周波数
スペクトル成分を周波数帯域毎に分割し、帯域毎の入カ
パワーを計算する入力帯域パワー計算ステップと、 前記入力帯域パワーと音声帯域パワーと雑音帯域パワー
とに基き、音声信号の周波数帯域毎に重みをかけて背景
雑音を抑圧する修正スペクトル減算ステップと、を具備
することを特徴とする雑音抑圧方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP21751998A JP4163294B2 (ja) | 1998-07-31 | 1998-07-31 | 雑音抑圧処理装置および雑音抑圧処理方法 |
US09/363,843 US6339758B1 (en) | 1998-07-31 | 1999-07-30 | Noise suppress processing apparatus and method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP21751998A JP4163294B2 (ja) | 1998-07-31 | 1998-07-31 | 雑音抑圧処理装置および雑音抑圧処理方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2000047699A true JP2000047699A (ja) | 2000-02-18 |
JP4163294B2 JP4163294B2 (ja) | 2008-10-08 |
Family
ID=16705520
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP21751998A Expired - Fee Related JP4163294B2 (ja) | 1998-07-31 | 1998-07-31 | 雑音抑圧処理装置および雑音抑圧処理方法 |
Country Status (2)
Country | Link |
---|---|
US (1) | US6339758B1 (ja) |
JP (1) | JP4163294B2 (ja) |
Cited By (33)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005121581A (ja) * | 2003-10-20 | 2005-05-12 | Mitsubishi Electric Corp | レーダ装置 |
JP2005354223A (ja) * | 2004-06-08 | 2005-12-22 | Toshiba Corp | 音源情報処理装置、音源情報処理方法、音源情報処理プログラム |
JP2006094522A (ja) * | 2004-09-23 | 2006-04-06 | Harman Becker Automotive Systems Gmbh | ノイズ低減による多重チャンネル適応の音声信号処理 |
WO2006077745A1 (ja) * | 2005-01-20 | 2006-07-27 | Nec Corporation | 信号除去方法、信号除去システムおよび信号除去プログラム |
JP2007065122A (ja) * | 2005-08-30 | 2007-03-15 | Aisin Seiki Co Ltd | 車載用音声認識装置の雑音抑圧装置 |
JP2007215163A (ja) * | 2006-01-12 | 2007-08-23 | Kobe Steel Ltd | 音源分離装置,音源分離装置用のプログラム及び音源分離方法 |
US7274794B1 (en) | 2001-08-10 | 2007-09-25 | Sonic Innovations, Inc. | Sound processing system including forward filter that exhibits arbitrary directivity and gradient response in single wave sound environment |
JP2008070372A (ja) * | 2006-09-15 | 2008-03-27 | Vlsi Solution Oy | 物体追跡装置 |
JP2008295010A (ja) * | 2007-04-26 | 2008-12-04 | Kobe Steel Ltd | 目的音抽出装置,目的音抽出プログラム,目的音抽出方法 |
WO2009001886A1 (ja) * | 2007-06-27 | 2008-12-31 | Nec Corporation | 信号分析装置と、信号制御装置と、そのシステム、方法及びプログラム |
US7478041B2 (en) | 2002-03-14 | 2009-01-13 | International Business Machines Corporation | Speech recognition apparatus, speech recognition apparatus and program thereof |
JP2009506363A (ja) * | 2005-08-26 | 2009-02-12 | ステップ・コミュニケーションズ・コーポレーション | センサアレイにおけるデバイスおよび/または信号のミスマッチに適応するための方法および装置 |
US7577262B2 (en) | 2002-11-18 | 2009-08-18 | Panasonic Corporation | Microphone device and audio player |
WO2009131066A1 (ja) * | 2008-04-21 | 2009-10-29 | 日本電気株式会社 | 信号分析制御及び信号制御のシステム、装置、方法及びプログラム |
JP2010071920A (ja) * | 2008-09-22 | 2010-04-02 | Institute Of Nuclear Safety System Inc | 超音波探傷法、該方法に用いる超音波探傷プログラム、及び該プログラムを記録した記録媒体 |
JP2011139378A (ja) * | 2009-12-28 | 2011-07-14 | Fujitsu Ltd | 信号処理装置、マイクロホン・アレイ装置、信号処理方法、および信号処理プログラム |
US8112272B2 (en) | 2005-08-11 | 2012-02-07 | Asashi Kasei Kabushiki Kaisha | Sound source separation device, speech recognition device, mobile telephone, sound source separation method, and program |
JP2012208406A (ja) * | 2011-03-30 | 2012-10-25 | Nikon Corp | 信号処理装置、撮像装置、および、信号処理プログラム |
KR101203926B1 (ko) | 2011-04-15 | 2012-11-22 | 한양대학교 산학협력단 | 다중 빔포머를 이용한 잡음 방향 탐지 방법 |
JP2013168857A (ja) * | 2012-02-16 | 2013-08-29 | Jvc Kenwood Corp | ノイズ低減装置、音声入力装置、無線通信装置、およびノイズ低減方法 |
JP2013178110A (ja) * | 2012-02-28 | 2013-09-09 | Nippon Telegr & Teleph Corp <Ntt> | 音源距離推定装置、直間比推定装置、雑音除去装置、それらの方法、及びプログラム |
JP2013543987A (ja) * | 2010-10-22 | 2013-12-09 | クゥアルコム・インコーポレイテッド | 遠距離場マルチ音源追跡および分離のためのシステム、方法、装置およびコンピュータ可読媒体 |
KR101364543B1 (ko) * | 2011-11-17 | 2014-02-19 | 한양대학교 산학협력단 | 휴대 단말기를 이용한 음향 수신 장치 및 방법 |
JP2015039208A (ja) * | 2011-12-30 | 2015-02-26 | ジーエヌ リザウンド エー/エスGn Resound A/S | 信号強調機能を有する補聴器 |
JPWO2013140733A1 (ja) * | 2012-03-23 | 2015-08-03 | パナソニック インテレクチュアル プロパティ コーポレーション オブアメリカPanasonic Intellectual Property Corporation of America | 帯域パワー算出装置及び帯域パワー算出方法 |
CN105679329A (zh) * | 2016-02-04 | 2016-06-15 | 厦门大学 | 可适应强烈背景噪声的麦克风阵列语音增强装置 |
JP2016131343A (ja) * | 2015-01-15 | 2016-07-21 | 日本電信電話株式会社 | 収音装置、その方法及びプログラム |
JP2017111230A (ja) * | 2015-12-15 | 2017-06-22 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America | 音声音響信号符号化装置、音声音響信号復号装置、音声音響信号符号化方法、及び、音声音響信号復号方法 |
WO2018016044A1 (ja) * | 2016-07-21 | 2018-01-25 | 三菱電機株式会社 | 雑音除去装置、エコーキャンセリング装置、異音検出装置および雑音除去方法 |
WO2020147642A1 (zh) * | 2019-01-15 | 2020-07-23 | 北京地平线机器人技术研发有限公司 | 语音信号处理方法、装置、计算机可读介质及电子设备 |
JP2020141160A (ja) * | 2019-02-26 | 2020-09-03 | 国立大学法人 筑波大学 | 音情報処理装置及びプログラム |
US10951978B2 (en) | 2017-03-21 | 2021-03-16 | Fujitsu Limited | Output control of sounds from sources respectively positioned in priority and nonpriority directions |
JPWO2022215199A1 (ja) * | 2021-04-07 | 2022-10-13 |
Families Citing this family (111)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1192838B2 (de) * | 1999-06-02 | 2013-09-04 | Siemens Audiologische Technik GmbH | Hörhilfsgerät mit richtmikrofonsystem sowie verfahren zum betrieb eines hörhilfsgeräts |
JP2001069597A (ja) * | 1999-06-22 | 2001-03-16 | Yamaha Corp | 音声処理方法及び装置 |
DE60108752T2 (de) * | 2000-05-26 | 2006-03-30 | Koninklijke Philips Electronics N.V. | Verfahren zur rauschunterdrückung in einem adaptiven strahlformer |
DE10118653C2 (de) * | 2001-04-14 | 2003-03-27 | Daimler Chrysler Ag | Verfahren zur Geräuschreduktion |
JP3940662B2 (ja) * | 2001-11-22 | 2007-07-04 | 株式会社東芝 | 音響信号処理方法及び音響信号処理装置及び音声認識装置 |
US7315623B2 (en) * | 2001-12-04 | 2008-01-01 | Harman Becker Automotive Systems Gmbh | Method for supressing surrounding noise in a hands-free device and hands-free device |
JP2003271191A (ja) * | 2002-03-15 | 2003-09-25 | Toshiba Corp | 音声認識用雑音抑圧装置及び方法、音声認識装置及び方法並びにプログラム |
DE10220520A1 (de) * | 2002-05-08 | 2003-11-20 | Sap Ag | Verfahren zur Erkennung von Sprachinformation |
US7809145B2 (en) * | 2006-05-04 | 2010-10-05 | Sony Computer Entertainment Inc. | Ultra small microphone array |
US7613310B2 (en) * | 2003-08-27 | 2009-11-03 | Sony Computer Entertainment Inc. | Audio input system |
US8073157B2 (en) * | 2003-08-27 | 2011-12-06 | Sony Computer Entertainment Inc. | Methods and apparatus for targeted sound detection and characterization |
US7783061B2 (en) * | 2003-08-27 | 2010-08-24 | Sony Computer Entertainment Inc. | Methods and apparatus for the targeted sound detection |
US7970147B2 (en) * | 2004-04-07 | 2011-06-28 | Sony Computer Entertainment Inc. | Video game controller with noise canceling logic |
US8947347B2 (en) * | 2003-08-27 | 2015-02-03 | Sony Computer Entertainment Inc. | Controlling actions in a video game unit |
US7803050B2 (en) | 2002-07-27 | 2010-09-28 | Sony Computer Entertainment Inc. | Tracking device with sound emitter for use in obtaining information for controlling game program execution |
US8139793B2 (en) * | 2003-08-27 | 2012-03-20 | Sony Computer Entertainment Inc. | Methods and apparatus for capturing audio signals based on a visual image |
US9174119B2 (en) | 2002-07-27 | 2015-11-03 | Sony Computer Entertainement America, LLC | Controller for providing inputs to control execution of a program when inputs are combined |
US8160269B2 (en) | 2003-08-27 | 2012-04-17 | Sony Computer Entertainment Inc. | Methods and apparatuses for adjusting a listening area for capturing sounds |
US8233642B2 (en) * | 2003-08-27 | 2012-07-31 | Sony Computer Entertainment Inc. | Methods and apparatuses for capturing an audio signal based on a location of the signal |
US7174022B1 (en) * | 2002-11-15 | 2007-02-06 | Fortemedia, Inc. | Small array microphone for beam-forming and noise suppression |
KR100493172B1 (ko) * | 2003-03-06 | 2005-06-02 | 삼성전자주식회사 | 마이크로폰 어레이 구조, 이를 이용한 일정한 지향성을갖는 빔 형성방법 및 장치와 음원방향 추정방법 및 장치 |
DE10313331B4 (de) * | 2003-03-25 | 2005-06-16 | Siemens Audiologische Technik Gmbh | Verfahren zur Bestimmung einer Einfallsrichtung eines Signals einer akustischen Signalquelle und Vorrichtung zur Durchführung des Verfahrens |
EP1524879B1 (en) * | 2003-06-30 | 2014-05-07 | Nuance Communications, Inc. | Handsfree system for use in a vehicle |
US20070223732A1 (en) * | 2003-08-27 | 2007-09-27 | Mao Xiao D | Methods and apparatuses for adjusting a visual image based on an audio signal |
US20060147063A1 (en) * | 2004-12-22 | 2006-07-06 | Broadcom Corporation | Echo cancellation in telephones with multiple microphones |
US20060133621A1 (en) * | 2004-12-22 | 2006-06-22 | Broadcom Corporation | Wireless telephone having multiple microphones |
US20070116300A1 (en) * | 2004-12-22 | 2007-05-24 | Broadcom Corporation | Channel decoding for wireless telephones with multiple microphones and multiple description transmission |
US8509703B2 (en) * | 2004-12-22 | 2013-08-13 | Broadcom Corporation | Wireless telephone with multiple microphones and multiple description transmission |
US7983720B2 (en) * | 2004-12-22 | 2011-07-19 | Broadcom Corporation | Wireless telephone with adaptive microphone array |
US8126159B2 (en) * | 2005-05-17 | 2012-02-28 | Continental Automotive Gmbh | System and method for creating personalized sound zones |
US7287309B2 (en) * | 2005-05-27 | 2007-10-30 | Brazil Lawrence J | Heavy duty clutch installation and removal tool |
US8345890B2 (en) | 2006-01-05 | 2013-01-01 | Audience, Inc. | System and method for utilizing inter-microphone level differences for speech enhancement |
US9185487B2 (en) * | 2006-01-30 | 2015-11-10 | Audience, Inc. | System and method for providing noise suppression utilizing null processing noise subtraction |
US8744844B2 (en) | 2007-07-06 | 2014-06-03 | Audience, Inc. | System and method for adaptive intelligent noise suppression |
US8204252B1 (en) | 2006-10-10 | 2012-06-19 | Audience, Inc. | System and method for providing close microphone adaptive array processing |
US8194880B2 (en) | 2006-01-30 | 2012-06-05 | Audience, Inc. | System and method for utilizing omni-directional microphones for speech enhancement |
US8204253B1 (en) | 2008-06-30 | 2012-06-19 | Audience, Inc. | Self calibration of audio device |
US8934641B2 (en) * | 2006-05-25 | 2015-01-13 | Audience, Inc. | Systems and methods for reconstructing decomposed audio signals |
US8949120B1 (en) | 2006-05-25 | 2015-02-03 | Audience, Inc. | Adaptive noise cancelation |
US8849231B1 (en) | 2007-08-08 | 2014-09-30 | Audience, Inc. | System and method for adaptive power control |
US8150065B2 (en) | 2006-05-25 | 2012-04-03 | Audience, Inc. | System and method for processing an audio signal |
JP4867516B2 (ja) * | 2006-08-01 | 2012-02-01 | ヤマハ株式会社 | 音声会議システム |
JP5070873B2 (ja) * | 2006-08-09 | 2012-11-14 | 富士通株式会社 | 音源方向推定装置、音源方向推定方法、及びコンピュータプログラム |
US8259926B1 (en) | 2007-02-23 | 2012-09-04 | Audience, Inc. | System and method for 2-channel and 3-channel acoustic echo cancellation |
US8189766B1 (en) | 2007-07-26 | 2012-05-29 | Audience, Inc. | System and method for blind subband acoustic echo cancellation postfiltering |
JP5070993B2 (ja) * | 2007-08-27 | 2012-11-14 | 富士通株式会社 | 音処理装置、位相差補正方法及びコンピュータプログラム |
US8428661B2 (en) * | 2007-10-30 | 2013-04-23 | Broadcom Corporation | Speech intelligibility in telephones with multiple microphones |
US9520061B2 (en) * | 2008-06-20 | 2016-12-13 | Tk Holdings Inc. | Vehicle driver messaging system and method |
US9302630B2 (en) * | 2007-11-13 | 2016-04-05 | Tk Holdings Inc. | System and method for receiving audible input in a vehicle |
US8143620B1 (en) | 2007-12-21 | 2012-03-27 | Audience, Inc. | System and method for adaptive classification of audio sources |
US8180064B1 (en) | 2007-12-21 | 2012-05-15 | Audience, Inc. | System and method for providing voice equalization |
JP4957810B2 (ja) * | 2008-02-20 | 2012-06-20 | 富士通株式会社 | 音処理装置、音処理方法及び音処理プログラム |
US8194882B2 (en) | 2008-02-29 | 2012-06-05 | Audience, Inc. | System and method for providing single microphone noise suppression fallback |
US8355511B2 (en) | 2008-03-18 | 2013-01-15 | Audience, Inc. | System and method for envelope-based acoustic echo cancellation |
US8521530B1 (en) | 2008-06-30 | 2013-08-27 | Audience, Inc. | System and method for enhancing a monaural audio signal |
US8774423B1 (en) | 2008-06-30 | 2014-07-08 | Audience, Inc. | System and method for controlling adaptivity of signal modification using a phantom coefficient |
KR101597752B1 (ko) | 2008-10-10 | 2016-02-24 | 삼성전자주식회사 | 잡음 추정 장치 및 방법과, 이를 이용한 잡음 감소 장치 |
CN101510426B (zh) * | 2009-03-23 | 2013-03-27 | 北京中星微电子有限公司 | 一种噪声消除方法及*** |
FR2948484B1 (fr) * | 2009-07-23 | 2011-07-29 | Parrot | Procede de filtrage des bruits lateraux non-stationnaires pour un dispositif audio multi-microphone, notamment un dispositif telephonique "mains libres" pour vehicule automobile |
KR101581885B1 (ko) * | 2009-08-26 | 2016-01-04 | 삼성전자주식회사 | 복소 스펙트럼 잡음 제거 장치 및 방법 |
JP5304571B2 (ja) * | 2009-09-24 | 2013-10-02 | 沖電気工業株式会社 | 集音装置、音響通信システム及びプログラム |
KR101129220B1 (ko) * | 2009-11-03 | 2012-03-26 | 중앙대학교 산학협력단 | 레인지 영상의 노이즈 제거장치 및 방법 |
DE102009052992B3 (de) * | 2009-11-12 | 2011-03-17 | Institut für Rundfunktechnik GmbH | Verfahren zum Abmischen von Mikrofonsignalen einer Tonaufnahme mit mehreren Mikrofonen |
US9008329B1 (en) | 2010-01-26 | 2015-04-14 | Audience, Inc. | Noise reduction using multi-feature cluster tracker |
JP5678445B2 (ja) | 2010-03-16 | 2015-03-04 | ソニー株式会社 | 音声処理装置、音声処理方法およびプログラム |
US9203489B2 (en) | 2010-05-05 | 2015-12-01 | Google Technology Holdings LLC | Method and precoder information feedback in multi-antenna wireless communication systems |
US9558755B1 (en) | 2010-05-20 | 2017-01-31 | Knowles Electronics, Llc | Noise suppression assisted automatic speech recognition |
KR101702561B1 (ko) * | 2010-08-30 | 2017-02-03 | 삼성전자 주식회사 | 음원출력장치 및 이를 제어하는 방법 |
JP5594133B2 (ja) * | 2010-12-28 | 2014-09-24 | ソニー株式会社 | 音声信号処理装置、音声信号処理方法及びプログラム |
WO2012096073A1 (ja) * | 2011-01-13 | 2012-07-19 | 日本電気株式会社 | 音声処理装置及びその制御方法とその制御プログラムを格納した記憶媒体、該音声処理装置を備えた車両、情報処理装置及び情報処理システム |
WO2012096072A1 (ja) * | 2011-01-13 | 2012-07-19 | 日本電気株式会社 | 音声処理装置及びその制御方法とその制御プログラムを格納した記憶媒体、該音声処理装置を備えた車両、情報処理装置及び情報処理システム |
GB2490092B (en) * | 2011-02-16 | 2018-04-11 | Skype | Processing audio signals |
JP5643686B2 (ja) * | 2011-03-11 | 2014-12-17 | 株式会社東芝 | 音声判別装置、音声判別方法および音声判別プログラム |
GB2493327B (en) | 2011-07-05 | 2018-06-06 | Skype | Processing audio signals |
US20130054233A1 (en) * | 2011-08-24 | 2013-02-28 | Texas Instruments Incorporated | Method, System and Computer Program Product for Attenuating Noise Using Multiple Channels |
US9031259B2 (en) * | 2011-09-15 | 2015-05-12 | JVC Kenwood Corporation | Noise reduction apparatus, audio input apparatus, wireless communication apparatus, and noise reduction method |
US9711127B2 (en) | 2011-09-19 | 2017-07-18 | Bitwave Pte Ltd. | Multi-sensor signal optimization for speech communication |
GB2495278A (en) | 2011-09-30 | 2013-04-10 | Skype | Processing received signals from a range of receiving angles to reduce interference |
GB2495130B (en) | 2011-09-30 | 2018-10-24 | Skype | Processing audio signals |
GB2495472B (en) | 2011-09-30 | 2019-07-03 | Skype | Processing audio signals |
GB2495131A (en) | 2011-09-30 | 2013-04-03 | Skype | A mobile device includes a received-signal beamformer that adapts to motion of the mobile device |
GB2495128B (en) | 2011-09-30 | 2018-04-04 | Skype | Processing signals |
GB2495129B (en) * | 2011-09-30 | 2017-07-19 | Skype | Processing signals |
GB2496660B (en) | 2011-11-18 | 2014-06-04 | Skype | Processing audio signals |
GB201120392D0 (en) | 2011-11-25 | 2012-01-11 | Skype Ltd | Processing signals |
GB2497343B (en) | 2011-12-08 | 2014-11-26 | Skype | Processing audio signals |
US10107887B2 (en) | 2012-04-13 | 2018-10-23 | Qualcomm Incorporated | Systems and methods for displaying a user interface |
KR101987966B1 (ko) * | 2012-09-03 | 2019-06-11 | 현대모비스 주식회사 | 차량용 어레이 마이크의 음성 인식 향상 시스템 및 그 방법 |
US9640194B1 (en) | 2012-10-04 | 2017-05-02 | Knowles Electronics, Llc | Noise suppression for speech processing based on machine-learning mask estimation |
US9078057B2 (en) * | 2012-11-01 | 2015-07-07 | Csr Technology Inc. | Adaptive microphone beamforming |
US9813262B2 (en) | 2012-12-03 | 2017-11-07 | Google Technology Holdings LLC | Method and apparatus for selectively transmitting data using spatial diversity |
US9591508B2 (en) | 2012-12-20 | 2017-03-07 | Google Technology Holdings LLC | Methods and apparatus for transmitting data between different peer-to-peer communication groups |
JP6074263B2 (ja) * | 2012-12-27 | 2017-02-01 | キヤノン株式会社 | 雑音抑圧装置及びその制御方法 |
US9979531B2 (en) | 2013-01-03 | 2018-05-22 | Google Technology Holdings LLC | Method and apparatus for tuning a communication device for multi band operation |
US10229697B2 (en) * | 2013-03-12 | 2019-03-12 | Google Technology Holdings LLC | Apparatus and method for beamforming to obtain voice and noise signals |
US9338551B2 (en) * | 2013-03-15 | 2016-05-10 | Broadcom Corporation | Multi-microphone source tracking and noise suppression |
US9536540B2 (en) | 2013-07-19 | 2017-01-03 | Knowles Electronics, Llc | Speech signal separation and synthesis based on auditory scene analysis and speech modeling |
US11199906B1 (en) | 2013-09-04 | 2021-12-14 | Amazon Technologies, Inc. | Global user input management |
US9386542B2 (en) | 2013-09-19 | 2016-07-05 | Google Technology Holdings, LLC | Method and apparatus for estimating transmit power of a wireless device |
US9549290B2 (en) | 2013-12-19 | 2017-01-17 | Google Technology Holdings LLC | Method and apparatus for determining direction information for a wireless device |
US9554208B1 (en) * | 2014-03-28 | 2017-01-24 | Marvell International Ltd. | Concurrent sound source localization of multiple speakers |
US9491007B2 (en) | 2014-04-28 | 2016-11-08 | Google Technology Holdings LLC | Apparatus and method for antenna matching |
US9478847B2 (en) | 2014-06-02 | 2016-10-25 | Google Technology Holdings LLC | Antenna system and method of assembly for a wearable electronic device |
CN106797512B (zh) | 2014-08-28 | 2019-10-25 | 美商楼氏电子有限公司 | 多源噪声抑制的方法、***和非瞬时计算机可读存储介质 |
US9747920B2 (en) * | 2015-12-17 | 2017-08-29 | Amazon Technologies, Inc. | Adaptive beamforming to create reference channels |
US11017793B2 (en) * | 2015-12-18 | 2021-05-25 | Dolby Laboratories Licensing Corporation | Nuisance notification |
US9640197B1 (en) * | 2016-03-22 | 2017-05-02 | International Business Machines Corporation | Extraction of target speeches |
CN106710601B (zh) * | 2016-11-23 | 2020-10-13 | 合肥美的智能科技有限公司 | 一种语音信号降噪拾音处理方法和装置及冰箱 |
US10638224B2 (en) * | 2017-01-03 | 2020-04-28 | Koninklijke Philips N.V. | Audio capture using beamforming |
US10229698B1 (en) * | 2017-06-21 | 2019-03-12 | Amazon Technologies, Inc. | Playback reference signal-assisted multi-microphone interference canceler |
CN115631764A (zh) * | 2022-10-21 | 2023-01-20 | 深圳看到科技有限公司 | 分布式麦克风的音频同步方法、装置和存储介质 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3279612B2 (ja) * | 1991-12-06 | 2002-04-30 | ソニー株式会社 | 雑音低減装置 |
US5511128A (en) * | 1994-01-21 | 1996-04-23 | Lindemann; Eric | Dynamic intensity beamforming system for noise reduction in a binaural hearing aid |
JP2758846B2 (ja) * | 1995-02-27 | 1998-05-28 | 埼玉日本電気株式会社 | ノイズキャンセラ装置 |
JPH10105191A (ja) * | 1996-09-30 | 1998-04-24 | Toshiba Corp | 音声認識装置及びマイクロホン周波数特性変換方法 |
JP2950260B2 (ja) * | 1996-11-22 | 1999-09-20 | 日本電気株式会社 | 雑音抑圧送話装置 |
JP3795610B2 (ja) | 1997-01-22 | 2006-07-12 | 株式会社東芝 | 信号処理装置 |
US6049607A (en) * | 1998-09-18 | 2000-04-11 | Lamar Signal Processing | Interference canceling method and apparatus |
-
1998
- 1998-07-31 JP JP21751998A patent/JP4163294B2/ja not_active Expired - Fee Related
-
1999
- 1999-07-30 US US09/363,843 patent/US6339758B1/en not_active Expired - Lifetime
Cited By (47)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7274794B1 (en) | 2001-08-10 | 2007-09-25 | Sonic Innovations, Inc. | Sound processing system including forward filter that exhibits arbitrary directivity and gradient response in single wave sound environment |
US7720679B2 (en) | 2002-03-14 | 2010-05-18 | Nuance Communications, Inc. | Speech recognition apparatus, speech recognition apparatus and program thereof |
US7478041B2 (en) | 2002-03-14 | 2009-01-13 | International Business Machines Corporation | Speech recognition apparatus, speech recognition apparatus and program thereof |
US7577262B2 (en) | 2002-11-18 | 2009-08-18 | Panasonic Corporation | Microphone device and audio player |
JP2005121581A (ja) * | 2003-10-20 | 2005-05-12 | Mitsubishi Electric Corp | レーダ装置 |
JP2005354223A (ja) * | 2004-06-08 | 2005-12-22 | Toshiba Corp | 音源情報処理装置、音源情報処理方法、音源情報処理プログラム |
US8194872B2 (en) | 2004-09-23 | 2012-06-05 | Nuance Communications, Inc. | Multi-channel adaptive speech signal processing system with noise reduction |
JP2006094522A (ja) * | 2004-09-23 | 2006-04-06 | Harman Becker Automotive Systems Gmbh | ノイズ低減による多重チャンネル適応の音声信号処理 |
US7925504B2 (en) | 2005-01-20 | 2011-04-12 | Nec Corporation | System, method, device, and program for removing one or more signals incoming from one or more directions |
WO2006077745A1 (ja) * | 2005-01-20 | 2006-07-27 | Nec Corporation | 信号除去方法、信号除去システムおよび信号除去プログラム |
US8112272B2 (en) | 2005-08-11 | 2012-02-07 | Asashi Kasei Kabushiki Kaisha | Sound source separation device, speech recognition device, mobile telephone, sound source separation method, and program |
JP2009506363A (ja) * | 2005-08-26 | 2009-02-12 | ステップ・コミュニケーションズ・コーポレーション | センサアレイにおけるデバイスおよび/または信号のミスマッチに適応するための方法および装置 |
JP2007065122A (ja) * | 2005-08-30 | 2007-03-15 | Aisin Seiki Co Ltd | 車載用音声認識装置の雑音抑圧装置 |
JP2007215163A (ja) * | 2006-01-12 | 2007-08-23 | Kobe Steel Ltd | 音源分離装置,音源分離装置用のプログラム及び音源分離方法 |
JP2008070372A (ja) * | 2006-09-15 | 2008-03-27 | Vlsi Solution Oy | 物体追跡装置 |
JP4519900B2 (ja) * | 2007-04-26 | 2010-08-04 | 株式会社神戸製鋼所 | 目的音抽出装置,目的音抽出プログラム,目的音抽出方法 |
JP2008295010A (ja) * | 2007-04-26 | 2008-12-04 | Kobe Steel Ltd | 目的音抽出装置,目的音抽出プログラム,目的音抽出方法 |
JP5556175B2 (ja) * | 2007-06-27 | 2014-07-23 | 日本電気株式会社 | 信号分析装置と、信号制御装置と、そのシステム、方法及びプログラム |
WO2009001886A1 (ja) * | 2007-06-27 | 2008-12-31 | Nec Corporation | 信号分析装置と、信号制御装置と、そのシステム、方法及びプログラム |
US9905242B2 (en) | 2007-06-27 | 2018-02-27 | Nec Corporation | Signal analysis device, signal control device, its system, method, and program |
WO2009131066A1 (ja) * | 2008-04-21 | 2009-10-29 | 日本電気株式会社 | 信号分析制御及び信号制御のシステム、装置、方法及びプログラム |
US8509092B2 (en) | 2008-04-21 | 2013-08-13 | Nec Corporation | System, apparatus, method, and program for signal analysis control and signal control |
JP2010071920A (ja) * | 2008-09-22 | 2010-04-02 | Institute Of Nuclear Safety System Inc | 超音波探傷法、該方法に用いる超音波探傷プログラム、及び該プログラムを記録した記録媒体 |
JP2011139378A (ja) * | 2009-12-28 | 2011-07-14 | Fujitsu Ltd | 信号処理装置、マイクロホン・アレイ装置、信号処理方法、および信号処理プログラム |
JP2013543987A (ja) * | 2010-10-22 | 2013-12-09 | クゥアルコム・インコーポレイテッド | 遠距離場マルチ音源追跡および分離のためのシステム、方法、装置およびコンピュータ可読媒体 |
US9100734B2 (en) | 2010-10-22 | 2015-08-04 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for far-field multi-source tracking and separation |
JP2012208406A (ja) * | 2011-03-30 | 2012-10-25 | Nikon Corp | 信号処理装置、撮像装置、および、信号処理プログラム |
US9734840B2 (en) | 2011-03-30 | 2017-08-15 | Nikon Corporation | Signal processing device, imaging apparatus, and signal-processing program |
KR101203926B1 (ko) | 2011-04-15 | 2012-11-22 | 한양대학교 산학협력단 | 다중 빔포머를 이용한 잡음 방향 탐지 방법 |
KR101364543B1 (ko) * | 2011-11-17 | 2014-02-19 | 한양대학교 산학협력단 | 휴대 단말기를 이용한 음향 수신 장치 및 방법 |
JP2015039208A (ja) * | 2011-12-30 | 2015-02-26 | ジーエヌ リザウンド エー/エスGn Resound A/S | 信号強調機能を有する補聴器 |
JP2013168857A (ja) * | 2012-02-16 | 2013-08-29 | Jvc Kenwood Corp | ノイズ低減装置、音声入力装置、無線通信装置、およびノイズ低減方法 |
JP2013178110A (ja) * | 2012-02-28 | 2013-09-09 | Nippon Telegr & Teleph Corp <Ntt> | 音源距離推定装置、直間比推定装置、雑音除去装置、それらの方法、及びプログラム |
JPWO2013140733A1 (ja) * | 2012-03-23 | 2015-08-03 | パナソニック インテレクチュアル プロパティ コーポレーション オブアメリカPanasonic Intellectual Property Corporation of America | 帯域パワー算出装置及び帯域パワー算出方法 |
JP2016131343A (ja) * | 2015-01-15 | 2016-07-21 | 日本電信電話株式会社 | 収音装置、その方法及びプログラム |
JP2017111230A (ja) * | 2015-12-15 | 2017-06-22 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America | 音声音響信号符号化装置、音声音響信号復号装置、音声音響信号符号化方法、及び、音声音響信号復号方法 |
CN105679329A (zh) * | 2016-02-04 | 2016-06-15 | 厦门大学 | 可适应强烈背景噪声的麦克风阵列语音增强装置 |
CN105679329B (zh) * | 2016-02-04 | 2019-08-06 | 厦门大学 | 可适应强烈背景噪声的麦克风阵列语音增强装置 |
WO2018016044A1 (ja) * | 2016-07-21 | 2018-01-25 | 三菱電機株式会社 | 雑音除去装置、エコーキャンセリング装置、異音検出装置および雑音除去方法 |
US10951978B2 (en) | 2017-03-21 | 2021-03-16 | Fujitsu Limited | Output control of sounds from sources respectively positioned in priority and nonpriority directions |
WO2020147642A1 (zh) * | 2019-01-15 | 2020-07-23 | 北京地平线机器人技术研发有限公司 | 语音信号处理方法、装置、计算机可读介质及电子设备 |
US11817112B2 (en) | 2019-01-15 | 2023-11-14 | Beijing Horizon Robotics Technology Research And Development Co., Ltd. | Method, device, computer readable storage medium and electronic apparatus for speech signal processing |
JP2020141160A (ja) * | 2019-02-26 | 2020-09-03 | 国立大学法人 筑波大学 | 音情報処理装置及びプログラム |
JP7182168B2 (ja) | 2019-02-26 | 2022-12-02 | 国立大学法人 筑波大学 | 音情報処理装置及びプログラム |
JPWO2022215199A1 (ja) * | 2021-04-07 | 2022-10-13 | ||
WO2022215199A1 (ja) * | 2021-04-07 | 2022-10-13 | 三菱電機株式会社 | 情報処理装置、出力方法、及び出力プログラム |
JP7270869B2 (ja) | 2021-04-07 | 2023-05-10 | 三菱電機株式会社 | 情報処理装置、出力方法、及び出力プログラム |
Also Published As
Publication number | Publication date |
---|---|
US6339758B1 (en) | 2002-01-15 |
JP4163294B2 (ja) | 2008-10-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2000047699A (ja) | 雑音抑圧処理装置および雑音抑圧処理方法 | |
JP2001100800A (ja) | 雑音成分抑圧処理装置および雑音成分抑圧処理方法 | |
EP0954850B1 (en) | Audio processing arrangement with multiple sources | |
US7577262B2 (en) | Microphone device and audio player | |
US7289586B2 (en) | Signal processing apparatus and method | |
CN110140360B (zh) | 使用波束形成的音频捕获的方法和装置 | |
US8965003B2 (en) | Signal processing using spatial filter | |
CN110249637B (zh) | 使用波束形成的音频捕获装置和方法 | |
US10887691B2 (en) | Audio capture using beamforming | |
KR20040044982A (ko) | 선택적인 사운드 증강 | |
JP3582712B2 (ja) | 収音方法および収音装置 | |
JP2004187283A (ja) | マイクロホン装置および再生装置 | |
WO2009042385A1 (en) | Method and apparatus for generating an audio signal from multiple microphones | |
WO2007123047A1 (ja) | 適応アレイ制御装置、方法、プログラム、及びこれを利用した適応アレイ処理装置、方法、プログラム | |
JP3677143B2 (ja) | 音声処理方法および装置 | |
JP6943120B2 (ja) | 収音装置、プログラム及び方法 | |
JP6840302B2 (ja) | 情報処理装置、プログラム及び情報処理方法 | |
JP3540988B2 (ja) | 発音体指向性補正方法およびその装置 | |
JP5170465B2 (ja) | 音源分離装置、方法及びプログラム | |
JP6624255B1 (ja) | 収音装置、プログラム及び方法 | |
JPS6214139B2 (ja) | ||
JP2024027617A (ja) | 音声認識装置、音声認識プログラム、音声認識方法、収音装置、収音プログラム及び収音方法 | |
Ozawa et al. | Noise reduction using an eyeglass-frame microphone array based on DOA estimation by LASSO |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20050311 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20070827 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20071106 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20071226 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20080722 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20080724 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110801 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110801 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110801 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120801 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120801 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130801 Year of fee payment: 5 |
|
LAPS | Cancellation because of no payment of annual fees |