JP2000047699A - 雑音抑圧処理装置および雑音抑圧処理方法 - Google Patents

雑音抑圧処理装置および雑音抑圧処理方法

Info

Publication number
JP2000047699A
JP2000047699A JP10217519A JP21751998A JP2000047699A JP 2000047699 A JP2000047699 A JP 2000047699A JP 10217519 A JP10217519 A JP 10217519A JP 21751998 A JP21751998 A JP 21751998A JP 2000047699 A JP2000047699 A JP 2000047699A
Authority
JP
Japan
Prior art keywords
noise
input
frequency
beamformer
target sound
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP10217519A
Other languages
English (en)
Other versions
JP4163294B2 (ja
Inventor
Hiroshi Kanazawa
博史 金澤
Masami Akamine
政巳 赤嶺
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP21751998A priority Critical patent/JP4163294B2/ja
Priority to US09/363,843 priority patent/US6339758B1/en
Publication of JP2000047699A publication Critical patent/JP2000047699A/ja
Application granted granted Critical
Publication of JP4163294B2 publication Critical patent/JP4163294B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L2021/02161Number of inputs available containing the signal or the noise to be suppressed
    • G10L2021/02166Microphone arrays; Beamforming

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Obtaining Desirable Characteristics In Audible-Bandwidth Transducers (AREA)
  • Filters That Use Time-Delay Elements (AREA)
  • Measurement Of Velocity Or Position Using Acoustic Or Ultrasonic Waves (AREA)

Abstract

(57)【要約】 【課題】計算量を大幅に削減できる雑音抑圧処理を可能
にすること。 【解決手段】話者音声を異なる複数位置で検出する手段
11と、この受音位置別音声信号毎に周波数分析して各チ
ャンネル(ch)別の周波数成分を得る分析手段12と、この
各chの周波数成分について所望方向外の感度が低くなる
ように計算したフィルタ(F)係数によるフィルタ(F)処理
により話者方向の雑音を抑圧し、目的音声成分を得る第
1ビームフォーマ処理手段(B1)13と、分析手段にて得た
複数chの周波数成分について所望方向外を低感度化する
F処理により話者音声を抑圧し、雑音成分を得る第2ビ
ームフォーマ処理手段(B2)16と、B1のF係数から雑音方
向を推定し、B2のF係数から目的音方向を推定する推定
手段17,18と、B1において入力対象となる目的音の到来
方向である第1入力方向を、推定手段の推定目的音方向
に基づき修正し、B2において入力対象とする雑音の到来
方向である第2入力方向を、推定手段の推定雑音方向に
基づき修正する修正手段14,15を具備する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は複数のマイクロホン
を用いて雑音を抑圧し、目的の音声を取り出す雑音抑圧
装置に関する。
【0002】
【従来の技術】環境下には種々の雑音源があることか
ら、マイクロホンで音声信号を取り込む場合において
も、周囲から紛れ込む雑音を避けることは難しい。しか
し、雑音が混入した音声信号を再生すると、目的の音声
が聴き辛いものとなるから、雑音成分の低減処理が必要
となる。
【0003】ところで、音声に紛れる雑音の低減処理技
術として、従来より知られているものに、複数のマイク
ロホンを用いて雑音を抑圧する技術がある。そして、こ
のマイクロホン処理技術は、音声認識装置やテレビ会議
装置などの音声入力を目的として従来から多くの研究者
によって技術開発に力が注がれている。中でも、少ない
マイクロホン数で大きな効果が得られる適応ビームフォ
ーマ処理技術を利用したマイクロホンアレイに関して
は、文献1(電子情報通信学会編:音響システムとデジ
タル処理)あるいは文献2(Heykin著;Adaptive Filt
er Theory(Plentice Hall))に述べられているよう
に、一般化サイドロープキャンセラ(GSC)、フロス
ト型ビームフォーマ、参照信号法など、種々の方法が知
られている。
【0004】なお、適応ビームフォーマ処理と云うの
は、一般には、妨害雑音の到来方向に死角を形成したフ
ィルタにより雑音を抑圧する処理である。しかしなが
ら、この適応ビームフォーマ処理技術においては、実際
の目的信号の到来方向が、仮定した到来方向と異なる場
合、その目的信号が雑音と見做されて除去されてしまう
ことから、性能が劣化するという問題を抱えている。
【0005】そこで、これを改善すべく、例えば文献3
(宝珠山他:“ブロッキング行列にリーク適応フィルタ
を用いたロバスト一般化サイドローブキャンセラ”、電
子情報通信学会論文誌 A Vol.J79−A N
o.9 pp1516−1524(1996.9))に
開示されているように、仮定した到来方向と実際の到来
方向とのずれを許容するような技術が開発されている
が、この場合、目的信号の除去は軽減されても、実際の
到来方向と仮定した到来方向とのずれにより、目的信号
が歪むおそれがある。
【0006】これに対し、例えば、特開平9‐9794
号公報において、複数のビームフォーマを用いて、話者
方向を逐次検知してその方向にビームフォーマの入力方
向を修正することで、話者の方向を追尾し、目的信号の
歪みを小さくする方法も開示されている。
【0007】しかしながら、特開平9‐9794号公報
に開示されている方法は、時間領域の適応フィルタ処理
を行っているため、フィルタ係数から話者方向を推定す
る際、時間領域のフィルタ係数から周波数領域への変換
が必要であり、計算量が大きくなる。
【0008】
【発明が解決しようとする課題】音声の雑音を抑圧する
技術として、複数本のマイクロホンを用い、これらのマ
イクロホンで、話者の音声を取り込むと共に、妨害雑音
の到来方向に死角を形成したフィルタを通すことによ
り、雑音成分を抑圧する適応ビームフォーマ処理技術が
ある。
【0009】この適応ビームフォーマ処理技術において
は、実際の目的信号の到来方向、すなわち、話者のいる
方向が、予め仮定した到来方向と異なる場合、目的信号
が雑音と見做されて除去され、音声収集性能が劣化する
という問題を抱えている。
【0010】そこで、これを改善すべく、仮定した到来
方向と実際の到来方向とのずれを許容するような技術が
開発されているが、この場合、目的信号の除去は軽減さ
れても、実際の到来方向と仮定した到来方向とのずれに
より、目的信号が歪む心配があり、得られる音声の品質
の問題を残している。
【0011】また、複数のビームフォーマを用い、話者
方向を逐次検知してその方向にビームフォーマの入力方
向を修正することで、話者の方向を追尾し、目的信号の
歪みを小さくする方法も提案されている。しかしなが
ら、この方法は、時間領域の適応フィルタ処理を行って
いるため、フィルタ係数から話者方向を推定する際、時
間領域のフィルタ係数から周波数領域への変換が必要で
あり、計算量が大きくなるという問題があった。
【0012】故に、従来の技術はいずれも一長一短であ
り、高品位に目的信号を収集できると共に、処理時間も
短時間で済むようなビームフォーマ処理技術の開発が嘱
望されている。
【0013】そこで、この発明の目的とするところは、
周波数領域で動作するビームフォーマを用いることで、
計算量を大幅に削減する雑音抑圧処理装置および雑音抑
圧処理方法を提供することにある。
【0014】
【課題を解決するための手段】上記目的を達成するた
め、本発明は次のように構成する。
【0015】[1] 第1には、話者の発声した音声を
少なくとも異なる2箇所以上の位置で受音する音声入力
手段と、前記受音位置に対応する音声信号のチャネル毎
に周波数分析を行って複数チャネルの周波数成分を出力
する周波数分析手段と、この周波数分析手段にて得られ
る前記複数チャネルの周波数成分について、所望方向外
の感度が低くなるように計算したフィルタ係数を用いて
の適応フィルタ処理を施すことにより前記話者方向から
の音声以外の音声を抑圧する到来雑音抑圧処理を行い、
目的音声成分を得る第1のビームフォーマ処理手段と、
前記周波数分析手段にて得られる前記複数チャネルの周
波数成分について、所望方向外の感度が低くなるように
計算したフィルタ係数を用いての適応フィルタ処理を施
すことにより前記話者方向からの音声を抑圧し、雑音成
分を得る第2のビームフォーマ処理手段と、前記第1の
ビームフォーマ処理手段で計算されるフィルタ係数から
雑音方向を推定する雑音方向推定手段と、前記第2のビ
ームフォーマ処理手段で計算されるフィルタ係数から目
的音方向を推定する目的音方向推定手段と、前記第1の
ビームフォーマにおいて入力対象となる目的音の到来方
向である第1の入力方向を、前記目的音方向推定手段で
推定された目的音方向に基づいて逐次修正する目的音方
向修正手段と、前記第2のビームフォーマにおいて入力
対象とする雑音の到来方向である第2の入力方向を、前
記雑音方向推定手段で推定された雑音方向に基づいて逐
次修正する雑音方向修正手段とを具備する。
【0016】[2]また、第2には、本発明は、話者の
発声した音声を少なくとも異なる2箇所以上の位置で受
音する音声入力手段と、前記受音位置に対応する音声信
号のチャネル毎に周波数分析を行って複数チャネルの周
波数成分を出力する周波数分析手段と、この周波数分析
手段にて得られる前記複数チャネルの周波数成分につい
て、所望方向外の感度が低くなるように計算したフィル
タ係数を用いての適応フィルタ処理を施すことにより前
記話者方向からの音声以外の音声を抑圧する到来雑音抑
圧処理を行い、目的音声成分を得る第1のビームフォー
マ処理手段と、前記周波数分析手段にて得られる前記複
数チャネルの周波数成分について、所望方向外の感度が
低くなるように計算したフィルタ係数を用いての適応フ
ィルタ処理を施すことにより前記話者方向からの音声を
抑圧し、第1の雑音成分を得る第2のビームフォーマ処
理手段と、前記周波数分析手段にて得られる前記複数チ
ャネルの周波数成分について、所望方向外の感度が低く
なるように計算したフィルタ係数を用いての適応フィル
タ処理を施すことにより前記話者方向からの音声を抑圧
し、第2の雑音成分を得る第2のビームフォーマ処理手
段と、前記第1のビームフォーマ処理手段で計算される
フィルタ係数から雑音方向を推定する雑音方向推定手段
と、前記第2のビームフォーマ処理手段で計算されるフ
ィルタ係数から第1の目的音方向を推定する第1の目的
音方向推定手段と、前記第3の適応ビームフォーマ処理
手段で計算されるフィルタ係数から第2の目的音方向を
推定する第2の目的音方向推定手段と、前記第1のビー
ムフォーマにおいて入力対象とする目的音の到来方向で
ある第1の入力方向を、前記第1の目的音方向推定手段
で推定された第1の目的音方向と、第2の目的音方向推
定手段で推定された第2の目的音方向のいずれか一方ま
たは両方に基づいて逐次修正する第1の入力方向修正手
段と、前記雑音方向修正手段で推定された雑音方向が所
定の第1の範囲にある場合に、前記第2のビームフォー
マにおいて入力対象とする雑音の到来方向である第2の
入力方向を該雑音方向に基づいて逐次修正する第2の入
力方向修正手段と、前記雑音方向修正手段で推定された
雑音方向が所定の第2の範囲にある場合に、前記第3の
ビームフォーマにおいて入力対象とする雑音の到来方向
である第3の入力方向を該雑音方向に基づいて逐次修正
する第3の入力方向修正手段と、前記雑音方向推定手段
で推定された雑音方向が所定の第1の範囲から到来した
か所定の第2の範囲から到来したかに基づいて前記第1
の出力雑音と前記第2の出力雑音のいずれか一方を真の
雑音出力と決定していずれか一方の雑音を出力すると同
時に、第1の音声方向推定手段と第2の音声方向推定手
段のいずれの推定結果が有効であるかを決定していずれ
か一方の音声方向推定結果を第1の入力方向修正手段へ
出力する有効雑音決定手段とを具備する。
【0017】[3]更に第3には、本発明は、上記
[1]項または[2]項いずれかに記載の雑音抑圧装置
において、前記得られた音声周波数を、周波数帯域毎に
分割して帯域毎の音声パワーを計算する音声帯域パワー
計算手段と、前記得られた雑音周波数成分を、周波数帯
域毎に分割して帯域毎の雑音パワーを計算する雑音帯域
パワー計算手段と、前記音声帯域パワー計算手段と雑音
帯域パワー計算手段とから得られる音声と雑音の周波数
帯域パワーに基き、音声信号の周波数帯域毎に重みをか
けて背景雑音を抑圧するスペクトル減算手段とからなる
スペクトル減算雑音抑圧手段をさらに具備することを特
徴とする。
【0018】[4]更に第4には、本発明は、上記
[1]項または[2]項いずれかに記載の雑音抑圧装置
において、前記得られた音声周波数を、周波数帯域毎に
分割して帯域毎の音声パワーを計算する音声帯域パワー
計算手段と、前記得られた雑音周波数成分を、周波数帯
域毎に分割して帯域毎の雑音パワーを計算する雑音帯域
パワー計算手段と、前記音声入力手段から得られた入力
信号を周波数分析した入力信号の周波数成分を周波数帯
域毎に分割し、帯域毎の入カパワーを計算する入力帯域
パワー計算手段と、前記入力帯域パワーと音声帯域パワ
ーと雑音帯域パワーとに基き、音声信号の周波数帯域毎
に重みをかけて背景雑音を抑圧する修正スペクトル減算
手段を具備することを特徴とする。
【0019】そして、上記[1]の構成の場合、話者の
発声した音声を異なる2箇所以上の位置で音声入力手段
は受音し、周波数分析手段では、これを前記受音位置に
対応する音声信号のチャネル毎に周波数分析して複数チ
ャネルの周波数成分を出力する。そして、第1のビーム
フォーマ処理手段はこの周波数分析手段にて得られる前
記複数チャネルの周波数成分について、所望方向外の感
度が低くなるように計算したフィルタ係数を用いての適
応フィルタ処理を施すことにより前記話者方向からの音
声以外の音声を抑圧する到来雑音抑圧処理を行い、目的
音声成分を得、また、第2のビームフォーマ処理手段
は、前記周波数分析手段にて得られる前記複数チャネル
の周波数成分について、所望方向外の感度が低くなるよ
うに計算したフィルタ係数を用いての適応フィルタ処理
を施すことにより前記話者方向からの音声を抑圧し、雑
音成分を得る。そして、雑音方向推定手段は、前記第1
のビームフォーマ処理手段で計算されるフィルタ係数か
ら雑音方向を推定し、目的音方向推定手段は、前記第2
のビームフォーマ処理手段で計算されるフィルタ係数か
ら目的音方向を推定する。目的音方向修正手段は、前記
第1のビームフォーマにおいて入力対象となる目的音の
到来方向である第1の入力方向を、前記目的音方向推定
手段で推定された目的音方向に基づいて逐次修正するの
で、第1のビームフォーマは第1の入力方向以外から到
来する雑音成分を抑圧して話者の音声成分を低雑音で抽
出することになる。また、雑音方向修正手段は、前記第
2のビームフォーマにおいて入力対象とする雑音の到来
方向である第2の入力方向を、前記雑音方向推定手段で
推定された雑音方向に基づいて逐次修正するので、第2
のビームフォーマは第2の入力方向以外から到来する成
分を抑圧して話者の音声成分を抑圧した残りの雑音成分
を抽出することになる。
【0020】このように本システムは雑音成分を抑圧し
た音声周波数成分と、音声成分を抑圧した雑音周波数成
分とを別々に得ることができるが、この発明の最大の特
徴は、第1及び第2のビームフォーマとして、周波数領
域で動作するビームフォーマを用いるようにした点にあ
る。そして、このことによって、計算量を大幅に削減す
ることができるようにしている。
【0021】そしてこの発明によると、適応フィルタの
処理量が大幅に低減されるのに加え、入力音声に対する
周波数分析以外の周波数分析処理を省略することがで
き、かつ、フィルタ演算時に必要であった時間領域から
周波数領域ヘの変換処理も不要となり、全体の演算量を
大幅に削減することができる。
【0022】すなわち、従来技術では、ビームフォーマ
で抑圧できない拡散性雑音の抑圧処理のために、スペク
トルサブトラクション(以後、SSと略称する)処理
を、ビームフォーマ処理の後に行うようにしており、こ
のSSは周波数スペクトルを入力とするため、FFT
(高速フーリエ変換)などの周波数分析が従来必要であ
ったが、周波数領域で動作するビームフォーマを用いる
と当該ビームフォーマからは周波数スペクトルが出力さ
れるため、これをSSに流用できるので、特別にSSの
ためのFFTを実施する従来のFFT処理工程は省略す
ることができる。故に、全体の演算量を大幅に削減する
ことができる。
【0023】また、ビームフォーマのフィルタを用いた
方向推定の際に必要であった時間領域から周波数領域へ
の変換処理も不要となり、全体の演算量を大幅に削減す
ることができる。
【0024】また、[2]の構成の場合、話者の発声し
た音声を異なる2箇所以上の位置で音声入力手段は受音
し、周波数分析手段では、これを前記受音位置に対応す
る音声信号のチャネル毎に周波数分析して複数チャネル
の周波数成分を出力する。そして、第1のビームフォー
マ処理手段はこの周波数分析手段にて得られる前記複数
チャネルの周波数成分について、所望方向外の感度が低
くなるように計算したフィルタ係数を用いての適応フィ
ルタ処理を施すことにより前記話者方向からの音声以外
の音声を抑圧する到来雑音抑圧処理を行い、目的音声成
分を得、また、第2のビームフォーマ処理手段は、前記
周波数分析手段にて得られる前記複数チャネルの周波数
成分について、所望方向外の感度が低くなるように計算
したフィルタ係数を用いての適応フィルタ処理を施すこ
とにより前記話者方向からの音声を抑圧し、雑音成分を
得る。そして、雑音方向推定手段は、前記第1のビーム
フォーマ処理手段で計算されるフィルタ係数から雑音方
向を推定し、目的音方向推定手段は、前記第2のビーム
フォーマ処理手段で計算されるフィルタ係数から目的音
方向を推定する。
【0025】また、第1の目的音方向推定手段は前記第
2のビームフォーマ処理手段で計算されるフィルタ係数
から第1の目的音方向を推定し、第2の目的音方向推定
手段は、前記第3の適応ビームフォーマ処理手段で計算
されるフィルタ係数から第2の目的音方向を推定する。
【0026】第1の入力方向修正手段は、前記第1のビ
ームフォーマにおいて入力対象とする目的音の到来方向
である第1の入力方向を、前記第1の目的音方向推定手
段で推定された第1の目的音方向と、第2の目的音方向
推定手段で推定された第2の目的音方向のいずれか一方
または両方に基づいて逐次修正する。そして、第2の入
力方向修正手段は、前記雑音方向修正手段で推定された
雑音方向が所定の第1の範囲にある場合に、前記第2の
ビームフォーマにおいて入力対象とする雑音の到来方向
である第2の入力方向を該雑音方向に基づいて逐次修正
し、第3の入力方向修正手段は、前記雑音方向修正手段
で推定された雑音方向が所定の第2の範囲にある場合
に、前記第3のビームフォーマにおいて入力対象とする
雑音の到来方向である第3の入力方向を該雑音方向に基
づいて逐次修正する。従って、第2の入力方向修正手段
の出力により第2の入力方向を修正される第2のビーム
フォーマは第2の入力方向以外から到来する成分を抑圧
して残りの雑音成分を抽出することになり、また、第3
の入力方向修正手段の出力により第3の入力方向を修正
される第3のビームフォーマは第3の入力方向以外から
到来する成分を抑圧して残りの雑音成分を抽出すること
になる。
【0027】そして、有効雑音決定手段は、前記雑音方
向推定手段で推定された雑音方向が所定の第1の範囲か
ら到来したか所定の第2の範囲から到来したかに基づい
て前記第1の出力雑音と前記第2の出力雑音のいずれか
一方を真の雑音出力と決定していずれか一方の雑音を出
力すると同時に、第1の音声方向推定手段と第2の音声
方向推定手段のいずれの推定結果が有効であるかを決定
して有効な方の音声方向推定結果を第1の入力方向修正
手段へ出力する。この結果、目的音方向修正手段は、前
記第1のビームフォーマにおいて入力対象となる目的音
の到来方向である第1の入力方向を、前記決定した方の
目的音方向推定手段で得た目的音方向に基づいて逐次修
正するので、第1のビームフォーマは第1の入力方向以
外から到来する雑音成分を抑圧して話者の音声成分を低
雑音で抽出することになる。
【0028】このように本システムは雑音成分を抑圧し
た音声周波数成分と、音声成分を抑圧した雑音周波数成
分とを別々に得ることができるが、この発明の最大の特
徴は、第1及び第2のビームフォーマとして、周波数領
域で動作するビームフォーマを用いるようにした点にあ
る。そして、このことによって、計算量を大幅に削減す
ることができるようにしている。
【0029】そしてこの発明によると、適応フィルタの
処理量が大幅に低減されるのに加え、入力音声に対する
周波数分析以外の周波数分析処理を省略することがで
き、かつ、フィルタ演算時に必要であった時間領域から
周波数領域ヘの変換処理も不要となり、全体の演算量を
大幅に削減することができる。
【0030】また、本発明では、雑音追尾に監視領域を
全く異ならせた雑音追尾用のビームフォーマを設けてあ
り、それぞれの出力からそれぞれ音声方向を推定させる
と共に、それぞれの推定結果からいずれが有効な雑音追
尾をしているかを判断して、有効と判断された方のビー
ムフォーマのフィルタ係数による音声方向の推定結果を
第1の目的音方向修正手段に与えることで第1の目的音
方向修正手段は、前記第1のビームフォーマにおいて入
力対象となる目的音の到来方向である第1の入力方向
を、前記目的音方向推定手段で推定された目的音方向に
基づいて逐次修正するので、第1のビームフォーマは第
1の入力方向以外から到来する雑音成分を抑圧して話者
の音声成分を低雑音で抽出することができ、雑音源が移
動してもこれを見失うことなく追尾して抑圧することが
できるようになるものである。
【0031】従来技術においては、2ch、すなわち、
2本のマイクロホンだけでも目的音源の追尾を可能とす
べく、雑音追尾用のビームフォーマを雑音抑圧のビーム
フォーマとは別に1個用いるが、例えば、雑音源が目的
音の方向を横切って移動したような場合、雑音の追尾精
度が低下することがあった。
【0032】しかし、本発明では、雑音を追尾するビー
ムフォーマを複数用いて各々別個の追尾範囲を受け持つ
ようにしたことにより、上記のような場合でも追尾精度
の低下を抑止できるようになる。
【0033】また、[3]項の構成の場合、音声帯域パ
ワー計算手段は、得られた音声周波数のスペクトル成分
を、周波数帯域毎に分割して帯域毎の音声パワーを計算
し、雑音帯域パワー計算手段は、前記得られた雑音周波
数のスペクトル成分を、周波数帯域毎に分割して帯域毎
の雑音パワーを計算する。そして、スペクトル減算手段
は、前記音声帯域パワー計算手段と雑音帯域パワー計算
手段とから得られる音声と雑音の周波数帯域パワーに基
き、音声信号の周波数帯域毎に重みをかけて背景雑音を
抑圧する。
【0034】この構成によれば、ビームフォーマでは抑
圧できない方向性のない雑音(背景雑音)は、本発明シ
ステムのビームフォーマで得ることのできる目的音声成
分と雑音成分を利用し、これをスペクトルサブトラクシ
ョン処理することで抑圧する。すなわち、本システムで
は、ビームフォーマとして目的音声成分抽出用と雑音成
分抽出用の2つのビームフォーマを備えているが、これ
らのビームフォーマの出力である目的音声成分と雑音成
分を利用してスペクトルサブトラクション処理すること
により、方向性のない背景雑音成分の抑圧を行う。スペ
クトルサブトラクション(SS)処理は雑音抑圧処理と
して知られるが、一般的に行われるスペクトルサブトラ
クション(SS)処理は、1チャンネルのマイクロホン
(つまり、1本のマイクロホン)を用い、このマイクロ
ホンの出力から音声のない区間において雑音のパワーを
推定するため、非定常な雑音が音声に重畳している場合
には対処できない。また、2チャンネルのマイクロホン
(つまり、2本のマイクロホン)を用いて、一方を雑音
収集用、片方を雑音重畳音声収集用とする場合にも、両
マイクロホンの設置場所を離す必要があり、その結果、
音声に重畳する雑音と、雑音収集用マイクロホンで取り
込む雑音との位相がずれ、スペクトルサブトラクション
処理しても雑音抑圧の改善効果は大きく上がらない。
【0035】しかし、本発明では、雑音成分を取り出す
ビームフォーマを用意して、このビームフォーマの出力
を用いるようにしたため、位相のずれは補正されてお
り、従って、非定常雑音の場合でも高精度なスペクトル
サブトラクション処理を実現できる。さらに、周波数領
域のビームフォーマの出力を利用しているため、周波数
分析を省略してスペクトルサブトラクションが可能であ
り、従来より少ない演算量で非定常雑音を抑圧できる。
【0036】更に[4]項の発明は、上記[3]の発明
の雑音抑圧装置において、音声入力手段から得られた入
力信号を周波数分析した入力信号の周波数成分を周波数
帯域毎に分割し、帯域毎の入カパワーを計算する入力帯
域パワー計算手段を設けて、スペクトル減算手段には、
入力帯域パワーと音声帯域パワーと雑音帯域パワーとに
基き、音声信号の周波数帯域毎に重みをかけて背景雑音
を抑圧する処理を実施させるようにしており、この構成
の場合、音声帯域パワー計算手段は、得られた音声周波
数のスペクトル成分を、周波数帯域毎に分割して帯域毎
の音声パワーを計算し、雑音帯域パワー計算手段は、前
記得られた雑音周波数のスペクトル成分を、周波数帯域
毎に分割して帯域毎の雑音パワーを計算する。また、入
力帯域パワー計算手段があり、この入力帯域パワー計算
手段は、音声入力手段から得られた入力信号を周波数分
析して得た入力音声の周波数スペクトル成分を受けて、
これを周波数帯域毎に分割し、帯域毎の入カパワーを計
算する。そして、スペクトル減算手段は、前記音声帯域
パワー計算手段と雑音帯域パワー計算手段とから得られ
る音声と雑音の周波数帯域パワーに基き、音声信号の周
波数帯域毎に重みをかけて背景雑音を抑圧する。
【0037】この[4]項の発明においては、[3]項
の発明におけるスペクトルサブトラクション(SS)処
理において、更に雑音成分についてそのパワーを修正す
るようにしたことにより、一層高精度に雑音抑圧を行う
ことを可能とするものである。すなわち、[3]項の発
明では雑音源のパワ−Nが小さいという仮定をおいたた
め、スペクトルサブトラクション(SS)処理を行うと
雑音源の成分が音声に重畳している部分では歪みが大き
くなる可能性が残るが、ここでは入力信号のパワーを用
いて第3の発明でのスペクトルサブトラクション処理に
おける帯域重みの計算を修正するようにした。これによ
り、方向を持つ雑音成分および方向のない雑音成分を抑
圧した歪みの少い音声成分のみの抽出ができるようにな
る。
【0038】
【発明の実施の形態】以下、本発明の実施の形態につき
図面を参照して説明する。
【0039】(実施例1)はじめに、実施例1について
説明する。この実施例1は請求項1の内容に相当する。
【0040】図1は実施例1のシステムの構成例を示す
ブロック図であって、本発明の一実施形態に係る雑音抑
圧装置の基本構成を示すブロック図である。本発明は、
マイクロホン数が2ch(ch;チャンネル)すなわ
ち、2本と云った最小の場合でも話者追尾可能とするた
めの技術であるため、ここでは2chで説明するが、3
ch以上となった場合でも処理の方法は同様である。
【0041】図1において、11は音声入力部、12は
周波数解析部、13は第1のビームフォーマ、14は第
1の入力方向修正部、15は第2の入力方向修正部、1
6は第2のビームフォーマ、17は雑音方向推定部、1
8は目的音方向推定部(音声方向推定部)である。
【0042】これらのうち、音声入力部11は、例え
ば、音声収集対象である話者の発声した音声(目的音
声)を異なる2箇所以上の位置で受音するためのもので
あり、具体的にはそれぞれ地点を異ならせて設置した2
本のマイクロホンを用いて音声を取り込み、電気信号に
変換するものである。また、周波数分析部12は、前記
マイクロホンの受音位置に対応する音声信号のチャネル
毎に周波数分析を行って複数チャネルの周波数成分を出
力するものであり、具体的にはここでは第1のマイクロ
ホンのとらえた音声信号(第1チャンネル1chの音声
信号)および第2のマイクロホンのとらえた音声信号
(第2チャンネル2chの音声信号)を、それぞれ別々
に高速フーリエ変換するなどして時間領域の信号成分か
ら周波数領域の成分のデータにに変換することにより、
各チャンネル別に周波数スペクトルのデータに変換して
出力するものである。
【0043】第1のビームフォーマ13は、この周波数
分析部12からの複数チャンネルの周波数成分出力、こ
の場合、1ch,2chの音声信号を用いて、これより
目的音声の周波数分を抽出するためのものであって、前
記1ch,2chそれぞれの周波数成分(周波数スペク
トルデータ)を用いて適応フィルタ処理により目的の音
声以外の到来雑音の抑圧処理を行うことにより、目的と
する音源方向からの周波数成分を抽出するといったこと
を行う処理手段であり、第2のビームフォーマ16は、
周波数分析部12からの複数チャンネルの周波数成分出
力、この場合、1ch,2chの音声信号を用いて、こ
れより雑音源方向からの周波数成分を抽出するためのも
のであって、前記1ch,2chそれぞれの周波数成分
(周波数スペクトルデータ)を用いて適応フィルタ処理
により雑音音源方向からの音声以外の成分の抑圧処理を
行うことにより、雑音源方向からの周波数スペクトル成
分のデータを抽出するといったことを行う処理手段であ
る。
【0044】また、雑音方向推定部17は、前記第1の
ビームフォーマ13で計算されるフィルタ係数から雑音
方向を推定すると云った処理を行うものであって、具体
的には前記第1のビームフォーマ13の適応フィルタか
ら得られるフィルタリング処理用のフィルタ係数などの
パラメータを用いて雑音方向を推定し、その推定量対応
のデータを出力し、また、目的音方向推定部(音声方向
推定部)18は、前記第2のビームフォーマ16で計算
されるフィルタ係数から目的音方向を推定すると云った
処理を行うものであって、具体的には前記第2のビーム
フォーマ16の適応フィルタで用いられているフィルタ
係数などのパラメータから雑音方向を推定し、その推定
量対応のデータを出力するものである。
【0045】また、第1の入力方向修正部14は、本来
の目的音方向にビームフォーマの入力方向を修正するた
めのものであって、前記第1のビームフォーマ13にお
いて、入力対象とする目的音の到来方向である第1の入
力方向を、前記目的音方向推定部18で推定された目的
音方向に基づいて逐次方向修正するための出力を発生
し、第1のビームフォーマ13に与えるものである。具
体的には、第1の入力方向修正部14は、目的音方向推
定部18の出力する推定量対応のデータを現在の目的と
する音源方向の角度情報αに変換して目標角度情報αと
して第1のビームフォーマ13に出力するものである。
【0046】第2の入力方向修正部15は第2のビーム
フォーマ16の入力方向を雑音方向に修正するためのも
のであって、前記第2のビームフォーマ16において、
入力対象とする雑音の到来方向である第2の入力方向
を、前記雑音方向推定部17で推定された雑音方向に基
づいて逐次方向修正するための出力を発生し、第2のビ
ームフォーマ14に与えるものである。具体的には、第
2の入力方向修正部15は、雑音方向推定部17の出力
する推定量対応のデータを現在の目的とする雑音源方向
の角度情報に変換して目標角度情報αとして第2のビー
ムフォーマ16に出力するものである。
【0047】ここでビームフォーマ13,16の構成例
を示しておく。 <ビームフォーマの構成例>本発明システムで用いるビ
ームフォーマ13,16は、図2(a)に示すような構
成となる。すなわち、本発明システムにおいて用いられ
るビームフォーマ13,16は、入力音声中から抽出し
たい対象となる信号成分を得ることができるようにする
ために、抽出したい対象となる信号成分の到来方向に、
ビームフォーマの入力方向を設定するための移相部10
0と、抽出したい対象となる信号成分の到来方向以外の
方向からの成分を抑圧するビームフォーマ本体101と
から構成される。
【0048】移相部100は補正ベクトル生成部100
aと乗算手段100b,100cとから構成され、ビー
ムフォーマ本体101は加算手段101a,101b,
101cと適応フィルタ101dとから構成される。
【0049】補正ベクトル生成部100aは入力方向修
正部14または15からの角度情報αを入力方向の情報
として受けて、これよりα対応の補正ベクトルを生成す
るものであり、乗算手段100bは周波数分析部12か
ら出力されるch1の周波数スペクトル成分のデータに
対して補正ベクトル分を乗算して出力するものであり、
乗算手段100cは周波数分析部12から出力されるc
h2の周波数スペクトル成分のデータに対して補正ベク
トル分を乗算して出力するものである。
【0050】また、加算手段101aは乗算手段100
bの出力と加算手段100cの出力を加算して出力する
ものであり、加算手段101bは乗算手段100bの出
力と加算手段100cの出力の差分を出力するものであ
り、加算手段101cは加算手段101aの出力に対す
る適応フィルタ101dの出力の差分をビームフォーマ
の出力として出力するものであり、適応フィルタ101
dは加算手段101bの出力に対してフィルタリング演
算処理して出力するためのデジタルフィルタであって、
加算手段101cの出力が最小となるようにフィルタ係
数(パラメータ)が逐次変更される構成である。
【0051】ここで、本例ではマイクロホン構成が2
本、すなわち、第1及び第2のマイクロホンm1,m2
を用いる収集音声2チャンネル(ch1,ch2)構成
のシステムとしており、この場合、ビームフォーマの入
力方向の設定とは、図2(b)に示すように、入力対象
の存在する方向からの音声信号が等価的に同時に両マイ
クロホンm1,m2に到着したと見做せるように、ch
1,ch2の2つの音声チャンネルの周波数成分に対し
て遅延を施し、位相を揃える(整相)ようにすることを
指す。これは、図2の構成の場合、入力方向修正部1
4,15の出力する角度情報α対応に移相部100で移
相調整することによって実現している。
【0052】すなわち、図2の構成の場合、移相部10
0は補正したい入力方向(角度情報α)対応の補正ベク
トルを補正ベクトル生成部100aで生成するようにし
ており、この補正ベクトルを1ch,2chの各チャン
ネルの信号にそれぞれ乗算する乗算手段100b,10
0cで乗算する構成とした移相部100により次のよう
にして位相を揃える。
【0053】例えば、図2(b)に符号m1,m2を付
して示すような無指向性マイクロホン配置であって、P
1点に居る目的音源である話者が、あたかもP2点に居
るかのように信号に位相補正することを考えてみる。こ
のような場合には、距離dだけ離れた第1のマイクロホ
ンm1で検出した話者音声信号(ch1)の位相と第2
のマイクロホンm2で検出した話者音声信号(ch2)
の位相が同じになるように、第1のマイクロホンm1の
話者音声信号(ch1)に伝搬時間差τ τ=r・c=r・sinα r=d・sinα に相当する複素数W1 W1=( cos jωτ,sin jωτ) の複素共役をかける。ここで、cは音速、dはマイクロ
ホン間距離、αはマイクロホンm1から見た目的音の音
源である話者の移動した角度、jは虚数、ωは角周波数
である。
【0054】つまり、W1の複素共役をかけたことによ
り、αなる角度に移動した目的音源の音声について注目
すれば、第1のマイクロホンm1でとらえた信号(ch
1)が、第2のマイクロホンm2でとらえた信号と同位
相となるように移相制御したことになる。
【0055】尚、第2のマイクロホンm2の信号(ch
2)には、複素数W2=(1,0)の複素共役をかける
ものとする。つまり、これは第2のマイクロホンm2の
信号(ch2)には、角度補正をしないことを意味す
る。
【0056】ここで、複素数W1と複素数W2を並べた
ベクトル{W1,W2}は、一般に方向ベクトルと呼ば
れ、この{W1,W2}における複素共役のベクトル共
役{W1*,W2*}を、補正ベクトルと呼ぶ。
【0057】角度情報α対応に補正ベクトルを生成さ
せ、ch1,ch2の周波数スペクトル成分に対してこ
の補正ベクトルを乗算すれば、第1のマイクロホンm1
の出力は、音源がP1よりP2に移動したにもかかわら
ず、第2のマイクロホンm2の位相と同じになるように
補正されたことになり、第1のマイクロホンm1に関す
る限り、第2のマイクロホンm1,m2のP2位置音源
に対する距離はあたかも等しいかたちになる。
【0058】本実施例では、ビームフォーマは2つある
が、これら2つあるビームフォーマのうち、第1のビー
ムフォーマ13はその移相部100により目的音の音源
方向を入力対象方向とするように、ch1(もしくはc
h2)の周波数成分に上述の手法で遅延を施し、第2の
ビームフォーマ16はその移相部100により雑音源方
向を入力対象方向とするように、ch1(もしくはch
2)の周波数成分に上述の手法で遅延を施してそれぞれ
両者の位相を揃える。ただし、目的音Sの到来方向以外
からの音成分、すなわち、雑音成分Nについては第1お
よび第2のマイクロホンm1,m2ともに位相は全く無
修正であるから、第1のマイクロホンm1と第2のマイ
クロホンm2で検出されるタイミングに時間差がある。
【0059】このように移相部100により、目的音方
向の音源からの検出される音声信号について位相修正し
た第1のマイクロホンm1の出力(目的音声成分Sと雑
音分Nからなるch1の周波数スペクトルデータ)およ
び修正の加えられない第2のマイクロホンm2の出力
(目的音声成分Sと雑音分N′からなるch2の周波数
スペクトルデータ)は、それぞれ加算手段101a,1
01bに入力される。そして、加算手段101aではc
h1の出力とch2の出力が加算されることによって目
的音声Sの2倍の信号と雑音成分N+N′についてのパ
ワー成分が求められ、加算手段101bではch1の出
力(S+N)とch2の出力(S+N′)の差分((S
+N)−(S+N′)=N−N′)、つまり、ノイズ分
のパワー成分が求められる。そして、加算手段101c
で加算手段101aの出力に対する適応フィルタ101
dの出力の差分を求め、これをビームフォーマの出力と
すると共に、適応フィルタ101dにフィードバックす
る。
【0060】適応フィルタ101dは加算手段101b
の出力に対して現在の探査方向対応の方向から到来した
音の成分の周波数スペクトルが抽出されるようフィルタ
リング演算処理して出力するためのデジタルフィルタで
あり、逐次、角度1°刻みに到来信号の探査角度を可変
していて、入力される信号方向に探査角度が一致したと
き最大の出力を出す。従って、到来信号の入射方向と探
査角度が一致すれば適応フィルタ101dの出力(N−
N′)は最大になる。そして、適応フィルタ101dの
出力(N−N′)は雑音成分のパワーであるから、それ
が最大のときの出力を加算手段101cに与え、加算手
段101aからの出力(2S+N+N′)から差し引け
ば、雑音成分Nが最大限キャンセルされて雑音抑圧が成
される。故に、この状態のときは、加算手段101cの
出力は最小である。
【0061】そのため、適応フィルタ101dは加算手
段101cの出力が最小となるように角度1°刻みの信
号到来方向探査角度(角度1°刻みの方向別感度)とフ
ィルタ係数(パラメータ)を逐次変更させることによ
り、到来信号の入射方向と探査角度(到来信号の入射方
向とその方向に対する感度)が一致することになるか
ら、適応フィルタ101dはこれらを制御しつつ、加算
手段101cの出力が最小となるようにする。
【0062】つまり、この制御の結果、目的方向からの
音声成分をビームフォーマは抽出できることになる。ま
た、雑音成分を目的音として抽出する場合には、上述の
目的音を雑音と見做すようにしたかたちで、上記制御を
施すようにすればよい。
【0063】なお、ビームフォーマ本体101に関して
は、一般化サイドローブキャンセラ(GSC)の他に、
フロスト型ビームフォーマなど種々のものが上述同様の
考え方で適用可能であり、従って、本発明では特に限定
はされない。
【0064】このような構成の本システムの作用を説明
する。本システムは、目的音の音声周波数成分と雑音周
波数成分とを別々に抽出出力する構成としていることを
特徴としている。
【0065】まず、複数のマイクロホンを持つ音声入力
部11、この例では第1及び第2の計2本のマイクロホ
ンm1,m2を持つ音声入力部11でch1,ch2の
音声を取り込む。そして、この音声入力部11から入力
された2チャンネル分の音声の信号ch1,ch2(す
なわち、第1チャンネルch1は第1のマイクロホンm
1からの音声、第2チャンネルch2は第2のマイクロ
ホンm2からの音声に該当する)は、周波数分析部12
に送られ、ここで例えば高速フーリエ変換(FFT)等
の処理を行うことによって、それぞれのチャンネル別に
周波数成分(周波数スペクトル)が求められる。
【0066】周波数分析部12でそれぞれ求められたチ
ャンネル別の周波数成分は、それぞれ第1及び第2のビ
ームフォーマ13,16に与えられる。
【0067】第1のビームフォーマ13では、2チャン
ネル分の周波数成分入力について、目的音の方向対応に
位相を合わせた上で、周波数領域の適応フィルタにより
上述のようにして処理することで雑音を抑圧し、目的音
の方向の周波数成分を出力する。
【0068】ここで、具体的に説明すると第1の入力方
向修正部14は第1のビームフォーマ13に対して次の
ような角度情報(α)を与える。つまり、第1の入力方
向修正部14は、与えられる音声方向推定部18からの
出力を用い、目的音の方向があたかもマイクロホンの正
面方向となるよう、上記2チャンネルの周波数成分の入
力位相を整えるに必要な角度情報(α)を入力方向修正
量として第1のビームフォーマ13に対して与える。
【0069】この結果、第1のビームフォーマ13はこ
の修正量(α)対応に目的音方向を修正し、当該目的音
方向以外の方向から到来する音声を抑圧させるようにす
ることで、雑音成分を抑圧し、目的音を抽出する。
【0070】すなわち、目的音方向推定部18は雑音成
分を抽出するための第2のビームフォーマ16における
適応フィルタのパラメータを用いて雑音源方向を知り、
それを反映させた出力を出し、第1の入力方向修正部1
4ではこの目的音方向推定部18からの出力対応に入力
方向修正量(α)を発生してこの修正量(α)対応に第
1のビームフォーマ13における目的音方向を修正し、
これによって第1のビームフォーマ13に当該目的音方
向以外の方向から到来する音声を抑圧させるようにする
ことで、雑音成分を抑圧し、目的音を抽出する。
【0071】つまり、第2のビームフォーマ16の場
合、雑音が目的音であるから、雑音に位相を合わせてい
る。その結果、第2のビームフォーマ16では話者の音
源は雑音源として扱われ、ビームフォーマの内蔵する適
応フィルタは話者音源からの音を抽出する処理をするこ
とになるので、当該第2のビームフォーマ16の適応フ
ィルタのパラメータからは話者音源の方向を反映した出
力が得られる。従って、目的音方向推定部18により、
第2のビームフォーマ16における適応フィルタのパラ
メータを用いて雑音源方向を知れば、それは目的音であ
る話者音源の方向を反映させたものである。従って、目
的音方向推定部18により、第2のビームフォーマ16
における適応フィルタのパラメータを反映させた出力を
出し、第1の入力方向修正部14でこの目的音方向推定
部18からの出力対応に入力方向修正量(α)を発生
し、この修正量対応に第1のビームフォーマ13におけ
る目的音方向を修正すれば、第1のビームフォーマ13
に当該目的音方向以外の方向から到来する音声を抑圧さ
せることができる。
【0072】また、第2のビームフォーマ16では、2
チャンネル分の周波数成分入力に対して、周波数領域の
適応フィルタにより目的音を抑圧し、雑音の方向の周波
数成分を出力する。ここでは、具体的には雑音の方向を
マイクロホンの正面と仮定し、2つのマイクロホンに対
して雑音が同時に到着したと見做せるように、雑音方向
推定部17からの出力を用いて第2の入力方向修正部5
で位相を整える操作(整相)を行う。
【0073】すなわち、雑音方向推定部17では、話者
音声成分を抽出するための第1のビームフォーマ13に
おける適応フィルタのパラメータを用いて雑音音源方向
を知り、それを反映させた出力を出し、第2の入力方向
修正部15では雑音方向推定部17からの出力対応に入
力方向修正量(α)を発生させて第2のビームフォーマ
16に与えることによって、当該第2のビームフォーマ
16に当該修正量対応に雑音方向を修正させるように
し、この方向以外の方向から到来する音声を抑圧するこ
とで雑音成分のみを抽出する。
【0074】ここで、雑音方向推定部17では、第1の
ビームフォーマ13の適応フィルタから雑音方向を推定
し、目的音方向推定部18では、第2のビームフォーマ
16の適応フィルタから目的音方向を推定する。なお、
これらの処理は、例えば、8[msec]等の短い固定時
間毎に行われる。以降固定時間をフレームと呼ぶ。
【0075】このようにして、第1のビームフォーマ1
3により、目的音(話者)の音声成分を抽出することが
でき、また、第2のビームフォーマ16により、雑音成
分を抽出することができる。
【0076】本装置の設置環境が、静かな会議室であ
り、この会議室にテレビ会議システム設置して当該テレ
ビ会議システムの話者音声抽出のために使用していると
するならば、除去しなければならない雑音と云っても、
そう問題のある大きな妨害音ではないと考えられるの
で、このような場合、第1のビームフォーマ13によ
り、抽出された目的音(話者)の成分を逆フーリエ変換
して時間領域に戻すことで音声信号に戻し、これをスピ
ーカなどで音声として出力させたり、送信するなどすれ
ば、低雑音化された話者音声として利用できる。
【0077】ここで、方向推定部17,18の処理手順
について触れておく。
【0078】<方向推定部の処理手順>図3に方向推定
部17,18の処理手順を示す。
【0079】この処理はフレーム毎に行われる。まず、
初期設定をする(ステップS1)。この初期設定内容と
しては図3に点線枠で囲んで示してあるように、“目的
音の追尾範囲”を“0゜±θr(例えば、20゜)”と
し、それ以外の範囲を雑音の探索範囲として設定する。
【0080】初期設定が終わったならば、次にステップ
S2の処理に移る。このステップS2では方向ベクトル
を生成する処理を行う。そして、方向別感度計算を行っ
た後、方向別感度周波数累積を行う(ステップS3,S
4)。
【0081】そして、これを全ての周波数と方向につい
て、実施した後、最小値であるものを求めて、その最小
値となった累積値を持つものの方向を信号到来方向とす
る(ステップS5,S6)。
【0082】すなわち、具体的にはステップS2からS
4においては、フィルタ係数W(k)と方向べクトルS
(k,θ)との内積を各周波数成分毎に1゜刻みで所定
の範囲の方向について計算し、対応する方向への感度を
求め、次に、全周波数成分についてその感度を加算する
と云う処理を行う。そして、ステップS7,S8におい
ては、全周波数成分についてその感度を加算した結果と
して得られる各方向別の累積値のうち、その値が最小値
である方向を、信号到来方向とすると云う処理をする。
この図3に示した処理手順は、雑音方向推定部17およ
び目的音推定部18ともに同様のものとなる。
【0083】このようにして、雑音方向推定部17は雑
音方向の推定を行い、また、目的音推定部18は目的音
方向の推定を行う。そして、この推定結果はそれぞれの
対応する入力方向修正部14,15に与える。
【0084】雑音方向の推定結果を受け取った第1の入
力方向修正部14は、前フレームまでの入力方向と現フ
レームの方向推定結果を平均化し、新たな入力方向を計
算してビームフォーマの移相部100へ出力し、また、
目的音推定結果を受け取った第2の入力方向修正部15
もまた、前フレームまでの入力方向と現フレームの方向
推定結果を平均化し、新たな入力方向を計算してビーム
フォーマの移相部100へ出力する。
【0085】平均化は例えば、係数βを用いて次式のよ
うに行う。
【0086】θ1(n)=θ1(n−1)・(1−α)
+E(n)・β ここで、θ1は音の入力方向、nは処理フレームの番
号、Eは現フレームの方向推定結果である。なお、係数
βはビームフォーマの出力パワーに基づいて可変にして
もよい。
【0087】ビームフォーマがGSCである場合に、従
来、方向推定の際、時間領域のフィルタ係数から周波数
領域への変換が必要であったが、本発明ではGSCの適
応フィルタが周波数スペクトルに対して方向性感度を以
てフィルタ演算処理し、目的方向外の成分を抽出すると
云った処理をするものを用いており、フィルタ演算処理
に使用するフィルタ係数は、もともと周波数領域で得ら
れるため、従来のように、時間領域のフィルタ係数から
周波数領域への変換と云う処理は不要となる。従って、
本発明システムではGSCは使用していても、時間領域
のフィルタ係数から周波数領域への変換が不要である
分、処理の高速化が可能となる。
【0088】<全体の処理手順>図4に実施例1に係る
システムの全体の処理手順を示す。この処理はフレーム
毎に行われる。
【0089】まず、初期設定する(ステップS11)。
初期設定内容としては、目的音方向の追尾範囲を0゜±
θr(例えばθr=20゜)とし、雑音方向推定部の探
索範囲を θr < φ1 < 180゜−θr , −180゜+θr < φ1 <−θr とし、目的音方向推定部18の探索範囲を −θr < φ2 < θr とする。
【0090】そして、目的音の入力方向の初期値をθ1
=0゜、雑音の入力方向の初期値をθ2=90°とす
る。
【0091】初期設定が済んだならば、まず、第1のビ
ームフォーマ13の処理を行い(ステップS12)、雑
音方向を推定し(ステップS13)、雑音方向がφ2の
範囲内であれば、第2のビームフォーマ16の入力方向
を修正し(ステップS14,S15)、そうでなければ
修正しない(ステップS14)。
【0092】次に,第2のビームフォーマ16の処理に
進み(ステップS16)、目的音の方向を推定する(ス
テップS17)。そして、この推定した目的音の方向が
φ1の範囲内ならば、第1のビームフォーマ13の入力
方向を修正し(ステップS18,S19)、そうでなけ
れば何もせずに、次のフレームの処理に移る。
【0093】以上、実施例1においては、ビームフォー
マとして周波数領域で動作するビームフォーマを用いる
ようにしたことを特徴としており、これによって計算量
を大幅に削減することができるようにしたことを特徴と
している。
【0094】すなわち、話者の発声した音声を少なくと
も異なる2箇所以上の位置で受音する音声入力手段と、
前記受音位置に対応する音声信号のチャネル毎に周波数
分析を行って複数チャネルの周波数成分を出力する周波
数分析手段と、この周波数分析手段にて得られる前記複
数チャネルの周波数成分について、所望方向外の感度が
低くなるように計算したフィルタ係数を用いての適応フ
ィルタ処理を施すことにより前記話者方向からの音声以
外の音声を抑圧する到来雑音抑圧処理を行い、目的音声
成分を得る第1のビームフォーマ処理手段と、前記周波
数分析手段にて得られる前記複数チャネルの周波数成分
について、所望方向外の感度が低くなるように計算した
フィルタ係数を用いての適応フィルタ処理を施すことに
より前記話者方向からの音声を抑圧し、雑音成分を得る
第2のビームフォーマ処理手段と、前記第1のビームフ
ォーマ処理手段で計算されるフィルタ係数から雑音方向
を推定する雑音方向推定手段と、前記第2のビームフォ
ーマ処理手段で計算されるフィルタ係数から目的音方向
を推定する目的音方向推定手段と、前記第1のビームフ
ォーマにおいて入力対象となる目的音の到来方向である
第1の入力方向を、前記目的音方向推定手段で推定され
た目的音方向に基づいて逐次修正する目的音方向修正手
段と、前記第2のビームフォーマにおいて入力対象とす
る雑音の到来方向である第2の入力方向を、前記雑音方
向推定手段で推定された雑音方向に基づいて逐次修正す
る雑音方向修正手段とを具備する。
【0095】そして、話者の発声した音声を異なる2箇
所以上の位置で音声入力手段は受音し、周波数分析手段
では、これを前記受音位置に対応する音声信号のチャネ
ル毎に周波数分析して複数チャネルの周波数成分を出力
する。そして、第1のビームフォーマ処理手段はこの周
波数分析手段にて得られる前記複数チャネルの周波数成
分について、所望方向外の感度が低くなるように計算し
たフィルタ係数を用いての適応フィルタ処理を施すこと
により前記話者方向からの音声以外の音声を抑圧する到
来雑音抑圧処理を行い、目的音声成分を得、また、第2
のビームフォーマ処理手段は、前記周波数分析手段にて
得られる前記複数チャネルの周波数成分について、所望
方向外の感度が低くなるように計算したフィルタ係数を
用いての適応フィルタ処理を施すことにより前記話者方
向からの音声を抑圧し、雑音成分を得る。そして、雑音
方向推定手段は、前記第1のビームフォーマ処理手段で
計算されるフィルタ係数から雑音方向を推定し、目的音
方向推定手段は、前記第2のビームフォーマ処理手段で
計算されるフィルタ係数から目的音方向を推定する。目
的音方向修正手段は、前記第1のビームフォーマにおい
て入力対象となる目的音の到来方向である第1の入力方
向を、前記目的音方向推定手段で推定された目的音方向
に基づいて逐次修正するので、第1のビームフォーマは
第1の入力方向以外から到来する雑音成分を抑圧して話
者の音声成分を低雑音で抽出することになる。また、雑
音方向修正手段は、前記第2のビームフォーマにおいて
入力対象とする雑音の到来方向である第2の入力方向
を、前記雑音方向推定手段で推定された雑音方向に基づ
いて逐次修正するので、第2のビームフォーマは第2の
入力方向以外から到来する成分を抑圧して話者の音声成
分を抑圧した残りの雑音成分を抽出することになる。
【0096】このように本システムは雑音成分を抑圧し
た音声周波数成分と、音声成分を抑圧した雑音周波数成
分とを別々に得ることができるが、この発明の最大の特
徴は、第1及び第2のビームフォーマとして、周波数領
域で動作するビームフォーマを用いるようにした点にあ
る。そして、このことによって、計算量を大幅に削減す
ることができるようにしている。
【0097】そしてこの発明によると、適応フィルタの
処理量が大幅に低減されるのに加え、入力音声に対する
周波数分析以外の周波数分析処理を省略することがで
き、かつ、フィルタ演算時に必要であった時間領域から
周波数領域ヘの変換処理も不要となり、全体の演算量を
大幅に削減することができる。
【0098】すなわち、従来技術では、ビームフォーマ
で抑圧できない拡散性雑音の抑圧処理のために、スペク
トルサブトラクション(以後、SSと略称する)処理
を、ビームフォーマ処理の後に行うようにしており、こ
のSSは周波数スペクトルを入力とするため、FFT
(高速フーリエ変換)などの周波数分析が従来必要であ
ったが、周波数領域で動作するビームフォーマを用いる
と当該ビームフォーマからは周波数スペクトルが出力さ
れるため、これをSSに流用できるので、特別にSSの
ためのFFTを実施する従来のFFT処理工程は省略す
ることができる。故に、全体の演算量を大幅に削減する
ことができる。
【0099】また、ビームフォーマのフィルタを用いた
方向推定の際に必要であった時間領域から周波数領域へ
の変換処理も不要となり、全体の演算量を大幅に削減す
ることができる。
【0100】次に、雑音源が目的音方向の範囲を横切っ
て移動した場合にも追尾が高精度で行えるようにした例
を実施例2として説明する。
【0101】(実施例2)本発明に係る第2の実施例に
ついて説明する。これは、請求項2の発明に相当する。
【0102】本例では、雑音源が目的音方向の範囲を横
切って移動した場合にも追尾が高精度で行えるように、
雑音を追尾するビームフォーマを2つ用いる場合の例に
ついて説明する。全体構成を図4に示す。図4におい
て、11は音声入力部、12は周波数解析部、13は第
1のビームフォーマ、14は第1の入力方向修正部、1
5は第2の入力方向修正部、16は第2のビームフォー
マ、17は雑音方向推定部、18は第1の音声方向推定
部(目的音方向推定部)、そして、21は第3の入力方
向修正部、22は第3のビームフォーマ、23は第2の
音声方向推定部、24は有効雑音決定部である。
【0103】これらのうち、第3の入力方向修正部21
は、第3のビームフォーマ22の入力方向を雑音方向に
修正するためのものであって、第3のビームフォーマ2
2において、入力対象とする雑音の到来方向である第3
の入力方向を、前記雑音方向推定部17で推定された雑
音方向に基づいて逐次方向修正するための出力を発生
し、第3のビームフォーマ22に与えるものである。具
体的には、第3の入力方向修正部21は、雑音方向推定
部17の出力する推定量対応のデータを現在の目的とす
る雑音源方向の角度情報に変換して目標角度情報αとし
て第3のビームフォーマ22に出力するものである。
【0104】第3のビームフォーマ22は、周波数分析
部12からの複数チャンネルの周波数成分出力、この場
合、1ch,2chの音声信号の周波数スペクトルを用
いて、これより雑音源方向からの周波数スペクトル成分
を抽出するためのものであって、前記1ch,2chそ
れぞれの周波数成分(周波数スペクトルデータ)に対し
て方向別感度調整を施した適応フィルタ処理により雑音
音源方向以外の周波数スペクトル成分の抑圧処理を行う
ことで、雑音音源方向からの周波数スペクトル成分のデ
ータを抽出するといったことを行う処理手段である。こ
の第3のビームフォーマ22も第1及び第2のビームフ
ォーマ13,16同様、図2で説明した如きの構成を採
用している。
【0105】第2の音声方向推定部23は、目的音声推
定部(音声方向推定部)18と同様のものであって、前
記第3のビームフォーマ22で計算されるフィルタ係数
から目的音方向を推定すると云った処理を行うものであ
り、具体的には前記第3のビームフォーマ22の適応フ
ィルタから音声方向を推定し、その推定量対応のデータ
を出力するものである。
【0106】有効雑音決定部24は、音声方向推定部1
8,23および雑音方向推定部17の推定する音声方向
および雑音方向の情報に基づき、第2のビームフォーマ
16と第3のビームフォーマ22のいずれが雑音を有効
に追尾しているかを判断し、有効に追尾していると判断
した方のビームフォーマの出力を、雑音成分として出力
するものである。なお、その他、図1の構成と同一符号
を付したものは同一物を示しているので、詳細は先の説
明を参照することとし、ここでは改めて説明はしない。
【0107】図からわかるように実施例2において、実
施例1との違いは、第3の入力方向修正部21と、第3
のビームフォーマ22と、第2の音声方向推定部23、
および有効雑音決定部24を追加した点である。
【0108】そして、第2及び第3のビームフォーマ1
6,22の出力、及び、雑音方向推定部17の出力、及
び、第1及び第2の音声方向推定部18,23の出力を
有効雑音決定部24に渡し、有効雑音決定部24の出力
を第1の入力方向修正部14に渡す構成としてある。
【0109】このような構成の本システムの作用を説明
する。まず、複数のマイクロホンを持つ音声入力部1
1、この例では第1及び第2の計2本のマイクロホンm
1,m2を持つ音声入力部11でch1,ch2の音声
を取り込む。そして、この音声入力部11から入力され
た2チャンネル分の音声の信号ch1,ch2(すなわ
ち、第1チャンネルch1は第1のマイクロホンm1か
らの音声、第2チャンネルch2は第2のマイクロホン
m2からの音声に該当する)は、周波数分析部12に送
られ、ここで例えば高速フーリエ変換(FFT)等の処
理を行うことによって、それぞれのチャンネル別に周波
数成分(周波数スペクトル)が求められる。
【0110】周波数分析部12でそれぞれ求められたチ
ャンネル別の周波数成分は、それぞれ第1、第2及び第
3のビームフォーマ13,16,22に与えられる。
【0111】第1のビームフォーマ13では、2チャン
ネル分の周波数成分入力について、目的音の方向対応に
位相を合わせた上で、周波数領域の適応フィルタにより
上述のようにして処理することで雑音を抑圧し、目的音
の方向の周波数成分を出力する。ここで、具体的に説明
すると第1の入力方向修正部14は第1のビームフォー
マ13に対して次のような角度情報(α)を与える。つ
まり、第1の入力方向修正部14は、有効雑音決定部2
4を介して与えられる音声方向推定部18若しくは音声
方向推定部23からの出力を用い、目的音の方向があた
かもマイクロホンの正面方向となるよう、上記2チャン
ネルの周波数成分の入力位相を整えるに必要な角度情報
(α)を入力方向修正量として第1のビームフォーマ1
3に対して与える。
【0112】この結果、第1のビームフォーマ13はこ
の修正量(α)対応に目的音方向を修正し、当該目的音
方向以外の方向から到来する音声を抑圧させるようにす
ることで、雑音成分を抑圧し、目的音を抽出する。
【0113】つまり、第2および第3のビームフォーマ
16,22の場合、雑音が目的音であるから、雑音に位
相を合わせている。その結果、第2,第3のビームフォ
ーマ16,22では話者の音源は雑音源として扱われ、
各ビームフォーマの内蔵する適応フィルタは話者音源か
らの音を抽出する処理をすることになるので、当該第
2,第3のビームフォーマ16,22の適応フィルタの
パラメータからは話者音源の方向を反映した情報が得ら
れることになる。
【0114】従って、第1または第2の音声方向推定部
18または23により、第2または第3のビームフォー
マ16または22における適応フィルタのパラメータを
用いて雑音源方向を知れば、それは目的音である話者音
源の方向を反映させたものである。従って、第1または
第2の音声方向推定部18または23により、第2また
は第3のビームフォーマ16または22における適応フ
ィルタのパラメータを反映させた出力を出し、第1の入
力方向修正部14でこの出力対応に入力方向修正量
(α)を発生し、この修正量対応に第1のビームフォー
マ13における目的音方向を修正すれば、第1のビーム
フォーマ13は当該目的音方向以外の方向から到来する
音声を抑圧するので、この場合、話者音源からの成分を
抽出できることになる。
【0115】一方、第1のビームフォーマ13の適応フ
ィルタでは雑音成分が抽出されるようにパラメータが制
御されているので、このパラメータから雑音方向推定部
17では、雑音方向を推定し、その情報を第2及び第3
の入力方向修正部15,21と有効雑音決定部24に与
えることになる。
【0116】そして、当該雑音方向推定部17からの出
力を受けた第2の入力方向修正部15では、当該雑音方
向推定部17からの出力対応に入力方向修正量(α)を
発生し、この修正量対応に第2のビームフォーマ16に
おける目的音方向を修正すれば、第2のビームフォーマ
16は当該目的音方向以外の方向から到来する音声を抑
圧するので、この場合、話者音源以外からの成分である
雑音成分を抽出できることになる。
【0117】このとき、第2のビームフォーマ16の適
応フィルタでは目的音である話者音声成分が抽出される
ようにパラメータが制御されているので、このパラメー
タから第1の音声方向推定部18では、話者音声方向を
推定することができる。そして、第1の音声方向推定部
18はその推定した情報を有効雑音決定部24に与え
る。
【0118】また、雑音方向推定部17からの出力が第
3の入力方向修正部21にも与えられているが、これを
受けた第3の入力方向修正部21では、当該雑音方向推
定部17からの出力対応に入力方向修正量(α)を発生
に、第3のビームフォーマ22に与える。これにより、
第3のビームフォーマ22はこの与えられた修正量対応
に、自己における目的音方向を修正する。
【0119】これにより、第3のビームフォーマ22は
当該目的音方向以外の方向から到来する音声を抑圧する
ので、この場合、話者音源以外からの成分、つまり、雑
音成分を抽出できることになる。このとき、第3のビー
ムフォーマ22の適応フィルタでは目的音である話者音
声成分が抽出されるようにパラメータが制御されている
ので、このパラメータから第2の音声方向推定部23で
は、話者音声方向を推定できる。そして、この推定した
情報は有効雑音決定部24に与えることになる。
【0120】有効雑音決定部24では、第1および第2
の音声方向推定部18,23から与えられた話者音声方
向の推定情報と、雑音方向推定部17から与えられた雑
音方向の推定情報とをもとに、第2のビームフォーマ1
6と第3のビームフォーマ22のいずれが雑音を有効に
追尾しているかを判断する。そして、この判断結果に基
づき、有効に追尾していると判断した方のビームフォー
マにおける適応フィルタのパラメータを第1の入力方向
修正部14に与える。
【0121】そのため、第1の入力方向修正部14で
は、当該パラメータを反映させた出力を出し、第1の入
力方向修正部14でこの出力対応に入力方向修正量
(α)を発生し、この修正量対応に第1のビームフォー
マ13における目的音方向を修正するので、第1のビー
ムフォーマ13は当該目的音方向以外の方向から到来す
る音声を抑圧することになって、この場合、話者音源か
らの成分を抽出でき、しかも、広く移動する雑音源から
の雑音を対象とする場合に、その移動する雑音源を見失
うことなく、確実にとらえて雑音除去することが可能と
なる。
【0122】すなわち、この実施例においては、話者の
音声周波数成分の抽出用として第1のビームフォーマ1
3が設けてあり、また、雑音周波数成分の抽出用として
第2および第3のビームフォーマ16,22が設けてあ
る。そして、観測点から見て図6に示すように、話者が
0°方向に位置していて0°±θの角度範囲で監視すれ
ば良いとすると、当該話者の音声周波数成分を抽出する
ために設けた第1のビームフォーマ13の変化範囲φ
1、すなわち、適応フィルタにおける感度を高くする方
向についての1°刻み変化範囲はせいぜい −θ < φ1 < θ に設定してこの範囲でフィルタリングに用いることにな
る。この場合、雑音周波数成分を抽出するために設けた
第2および第3のビームフォーマ16,22のうち、第
2のビームフォーマ16の変化範囲φ2は −180゜+θ < φ2 < −θ そして、第3のビームフォーマ22の変化範囲φ3は θ < φ3 < 180゜−θ に設定することになる。但し、180°は中心点を介し
て0°の対向位置、−は0°位置から見て図における反
時計方向回り、+は時計方向回りを示す。
【0123】故に、このようにすると、第2のビームフ
ォーマ16と第3のビームフォーマ22は、目的音到来
範囲φ1を挟んで各々別々の範囲から到来する雑音を追
尾することになる。そのため、φ2の範囲にあった雑音
源がφ1の範囲を横切ってφ3の範囲に急に移動した場
合でも、φ3の領域を持ち場とする第3のビームフォー
マ22が当該移動して来た雑音源を直ちに捕えることが
できるため、雑音方向を見失うことがなくなる。
【0124】この構成の場合、第2のビームフォーマ1
6の出力と、第3のビームフォーマビーム22の出力の
計2つの出力が、雑音の出力として得られるが、雑音方
向推定部17の結果に基づき、有効雑音決定部24にお
いて、第2のビームフォーマ16と第3のビームフォー
マ22のいずれが雑音を有効に追尾しているかを判断
し、この判断結果に基づき、有効に追尾して方の出力を
雑音成分として用いることになる。
【0125】<実施例2における全体の処理の流れ>以
上の処理の全体の流れを図7に示しておく。この処理は
フレーム毎に行われる。各ビームフォーマの変化範囲お
よび入力方向の初期値を設定した後に(ステップS3
1)、第1のビームフォーマ13の処理を行い(ステッ
プS32)、雑音方向を推定した後に(ステップS3
3)、該雑音方向を入力として有効雑音決定部24にお
いて、雑音方向がφ2にあるか、φ3にあるかの判定を
実施し、第2のビームフォーマ16と第3のビームフォ
ーマ22のどちらを選択するかを決定する(ステップS
34)。
【0126】そして、推定された雑音方向が第2の入力
方向修正部15あるいは第3の入力方向修正部21のど
ちらかに送られ、雑音方向が修正され、選択されたビー
ムフォーマの処理が実行される。
【0127】すなわち、推定された雑音方向がφ2の領
域であれば雑音方向が第2の入力方向修正部15に送ら
れ、雑音方向が修正され、第2のビームフォーマ16の
処理が実行され、目的音方向が推定される(ステップS
34,S35,S36,S37)。また、推定された雑
音方向がφ3の領域であれば雑音方向が第3の入力方向
修正部21に送られ、雑音方向が修正され、第3のビー
ムフォーマ22の処理が実行され、目的音方向が推定さ
れる(ステップS34,S38,S39,S40,S4
1)。
【0128】次に、選択されたビームフォーマにより推
定された音声方向(目的音方向)がφ1の範囲内かどう
か判断され、範囲内の場合は、推定された音声方向が第
1のビームフォーマ13の第1の入力方向修正部14に
送られ、入力方向の修正が実行される(ステップS4
2,S43)。範囲外の場合は修正処理が実行されず、
次のフレームに対する処理に進む(ステップS42,S
31)。
【0129】この処理がフレーム毎に行われ、音声およ
び雑音方向を追尾しながら、雑音抑圧が行われる。
【0130】このように、実施例2は、話者の発声した
音声を少なくとも異なる2箇所以上の位置で受音する音
声入力手段と、前記受音位置に対応する音声信号のチャ
ネル毎に周波数分析を行って複数チャネルの周波数成分
を出力する周波数分析手段と、この周波数分析手段にて
得られる前記複数チャネルの周波数成分について、所望
方向外の感度が低くなるように計算したフィルタ係数を
用いての適応フィルタ処理を施すことにより前記話者方
向からの音声以外の音声を抑圧する到来雑音抑圧処理を
行い、目的音声成分を得る第1のビームフォーマ処理手
段と、前記周波数分析手段にて得られる前記複数チャネ
ルの周波数成分について、所望方向外の感度が低くなる
ように計算したフィルタ係数を用いての適応フィルタ処
理を施すことにより前記話者方向からの音声を抑圧し、
第1の雑音成分を得る第2のビームフォーマ処理手段
と、前記周波数分析手段にて得られる前記複数チャネル
の周波数成分について、所望方向外の感度が低くなるよ
うに計算したフィルタ係数を用いての適応フィルタ処理
を施すことにより前記話者方向からの音声を抑圧し、第
2の雑音成分を得る第2のビームフォーマ処理手段と、
前記第1のビームフォーマ処理手段で計算されるフィル
タ係数から雑音方向を推定する雑音方向推定手段と、前
記第2のビームフォーマ処理手段で計算されるフィルタ
係数から第1の目的音方向を推定する第1の目的音方向
推定手段と、前記第3の適応ビームフォーマ処理手段で
計算されるフィルタ係数から第2の目的音方向を推定す
る第2の目的音方向推定手段と、前記第1のビームフォ
ーマにおいて入力対象とする目的音の到来方向である第
1の入力方向を、前記第1の目的音方向推定手段で推定
された第1の目的音方向と、第2の目的音方向推定手段
で推定された第2の目的音方向のいずれか一方または両
方に基づいて逐次修正する第1の入力方向修正手段と、
前記雑音方向修正手段で推定された雑音方向が所定の第
1の範囲にある場合に、前記第2のビームフォーマにお
いて入力対象とする雑音の到来方向である第2の入力方
向を該雑音方向に基づいて逐次修正する第2の入力方向
修正手段と、前記雑音方向修正手段で推定された雑音方
向が所定の第2の範囲にある場合に、前記第3のビーム
フォーマにおいて入力対象とする雑音の到来方向である
第3の入力方向を該雑音方向に基づいて逐次修正する第
3の入力方向修正手段と、前記雑音方向推定手段で推定
された雑音方向が所定の第1の範囲から到来したか所定
の第2の範囲から到来したかに基づいて前記第1の出力
雑音と前記第2の出力雑音のいずれか一方を真の雑音出
力と決定していずれか一方の雑音を出力すると同時に、
第1の音声方向推定手段と第2の音声方向推定手段のい
ずれの推定結果が有効であるかを決定していずれか一方
の音声方向推定結果を第1の入力方向修正手段へ出力す
る有効雑音決定手段とを具備して構成したものである。
【0131】そして、このような構成の場合、話者の発
声した音声を異なる2箇所以上の位置で音声入力手段は
受音し、周波数分析手段では、これを前記受音位置に対
応する音声信号のチャネル毎に周波数分析して複数チャ
ネルの周波数成分を出力する。そして、第1のビームフ
ォーマ処理手段はこの周波数分析手段にて得られる前記
複数チャネルの周波数成分について、所望方向外の感度
が低くなるように計算したフィルタ係数を用いての適応
フィルタ処理を施すことにより前記話者方向からの音声
以外の音声を抑圧する到来雑音抑圧処理を行い、目的音
声成分を得、また、第2のビームフォーマ処理手段は、
前記周波数分析手段にて得られる前記複数チャネルの周
波数成分について、所望方向外の感度が低くなるように
計算したフィルタ係数を用いての適応フィルタ処理を施
すことにより前記話者方向からの音声を抑圧し、雑音成
分を得る。そして、雑音方向推定手段は、前記第1のビ
ームフォーマ処理手段で計算されるフィルタ係数から雑
音方向を推定し、目的音方向推定手段は、前記第2のビ
ームフォーマ処理手段で計算されるフィルタ係数から目
的音方向を推定する。また、第1の目的音方向推定手段
は前記第2のビームフォーマ処理手段で計算されるフィ
ルタ係数から第1の目的音方向を推定し、第2の目的音
方向推定手段は、前記第3の適応ビームフォーマ処理手
段で計算されるフィルタ係数から第2の目的音方向を推
定する。
【0132】また、第1の入力方向修正手段は、前記第
1のビームフォーマにおいて入力対象とする目的音の到
来方向である第1の入力方向を、前記第1の目的音方向
推定手段で推定された第1の目的音方向と、第2の目的
音方向推定手段で推定された第2の目的音方向のいずれ
か一方または両方に基づいて逐次修正する。そして、第
2の入力方向修正手段は、前記雑音方向修正手段で推定
された雑音方向が所定の第1の範囲にある場合に、前記
第2のビームフォーマにおいて入力対象とする雑音の到
来方向である第2の入力方向を該雑音方向に基づいて逐
次修正し、第3の入力方向修正手段は、前記雑音方向修
正手段で推定された雑音方向が所定の第2の範囲にある
場合に、前記第3のビームフォーマにおいて入力対象と
する雑音の到来方向である第3の入力方向を該雑音方向
に基づいて逐次修正する。従って、第2の入力方向修正
手段の出力により第2の入力方向を修正される第2のビ
ームフォーマは第2の入力方向以外から到来する成分を
抑圧して残りの雑音成分を抽出することになり、また、
第3の入力方向修正手段の出力により第3の入力方向を
修正される第3のビームフォーマは第3の入力方向以外
から到来する成分を抑圧して残りの雑音成分を抽出する
ことになる。
【0133】そして、有効雑音決定手段は、前記雑音方
向推定手段で推定された雑音方向が所定の第1の範囲か
ら到来したか所定の第2の範囲から到来したかに基づい
て前記第1の出力雑音と前記第2の出力雑音のいずれか
一方を真の雑音出力と決定していずれか一方の雑音を出
力すると同時に、第1の音声方向推定手段と第2の音声
方向推定手段のいずれの推定結果が有効であるかを決定
して有効な方の音声方向推定結果を第1の入力方向修正
手段へ出力する。この結果、目的音方向修正手段は、前
記第1のビームフォーマにおいて入力対象となる目的音
の到来方向である第1の入力方向を、前記決定した方の
目的音方向推定手段で得た目的音方向に基づいて逐次修
正するので、第1のビームフォーマは第1の入力方向以
外から到来する雑音成分を抑圧して話者の音声成分を低
雑音で抽出することになる。
【0134】このように本システムは雑音成分を抑圧し
た音声周波数成分と、音声成分を抑圧した雑音周波数成
分とを別々に得ることができるが、この発明の最大の特
徴は、第1乃至第3のビームフォーマとして、周波数領
域で動作するビームフォーマを用いるようにした点にあ
る。そして、このことによって、計算量を大幅に削減す
ることができるようにしている。
【0135】そしてこの発明によると、適応フィルタの
処理量が大幅に低減されるのに加え、入力音声に対する
周波数分析以外の周波数分析処理を省略することがで
き、かつ、フィルタ演算時に必要であった時間領域から
周波数領域ヘの変換処理も不要となり、全体の演算量を
大幅に削減することができる。
【0136】また、本発明では、雑音追尾に監視領域を
全く異ならせた雑音追尾用のビームフォーマを設けてあ
り、それぞれの出力からそれぞれ音声方向を推定させる
と共に、それぞれの推定結果からいずれが有効な雑音追
尾をしているかを判断して、有効と判断された方のビー
ムフォーマのフィルタ係数による音声方向の推定結果を
第1の目的音方向修正手段に与えることで第1の目的音
方向修正手段は、前記第1のビームフォーマにおいて入
力対象となる目的音の到来方向である第1の入力方向
を、前記目的音方向推定手段で推定された目的音方向に
基づいて逐次修正するので、第1のビームフォーマは第
1の入力方向以外から到来する雑音成分を抑圧して話者
の音声成分を低雑音で抽出することができ、雑音源が移
動してもこれを見失うことなく追尾して抑圧することが
できるようになるものである。
【0137】従来技術においては、2ch、すなわち、
2本のマイクロホンだけでも目的音源の追尾を可能とす
べく、雑音追尾用のビームフォーマを雑音抑圧のビーム
フォーマとは別に1個用いるが、例えば、雑音源が目的
音の方向を横切って移動したような場合、雑音の追尾精
度が低下することがあった。
【0138】しかし、本発明では、雑音を追尾するビー
ムフォーマを複数用いて各々別個の追尾範囲を受け持つ
ようにしたことにより、上記のような場合でも追尾精度
の低下を抑止できるようになる。
【0139】以上の実施例1及び実施例2のシステム
は、演算負荷の軽減を図りつつ、主として方向を持つ雑
音について抑圧できるようにした例を示した。そして、
この場合、テレビ会議システムなどのように、話者音源
の配置がわかっていて、しかも、環境的に雑音が少ない
ような環境下での利用に適しているが、レベルも特性も
まちまちで雑多な雑音の影響を受ける屋外や、大勢の人
の集まる店舗や駅と云った所で使用するには不十分であ
ると考えられる。
【0140】そこで、方向性の無い背景雑音も効果的に
抑制できるようにした実施例を次に説明する。
【0141】(実施例3)この実施例3は本発明の請求
項3に対応する。ここでは、方向性のある雑音はビーム
フォーマにより抑圧し、方向性のない背景雑音はスペク
トルサブトラクション(SS)処理により、抑圧するよ
うにした高精度の雑音抑圧が可能なシステムを説明す
る。
【0142】実施例3のシステムは、図1または図5の
構成のシステムの後段に、更に図8の構成のスペクトル
サブトラクション(SS)処理部30を接続して構成す
る。スペクトルサブトラクション(SS)処理部30は
図に示すように、音声帯域パワー計算部31、雑音帯域
パワー計算部32、帯域重み計算部33、スペクトル減
算部34から構成されている。
【0143】これらのうち、音声帯域パワー計算部31
は、前記ビームフォーマ13により得られた音声周波数
を、周波数帯域毎に分割して帯域毎の音声パワーを計算
するものであり、雑音帯域パワー計算部32は、前記ビ
ームフォーマ16により得られた雑音周波数成分(また
はビームフォーマ16,22によりそれぞれ得られ、有
効雑音決定部24により選択されて出力された雑音周波
数成分)を、周波数帯域毎に分割して帯域毎の雑音パワ
ーを計算するものである。
【0144】帯域重み計算部33は、帯域k毎に、得ら
れた音声の平均帯域パワーPv(k)と雑音の平均帯域パ
ワーPn(k)を用い、帯域毎の帯域重み係数W(k)を
計算するものであり、修正スペクトル減算部34は、前
記入力帯域パワー計算部31にて計算された入力帯域パ
ワーと、音声帯域パワー計算部31で計算された音声帯
域パワーとに基き、音声信号の周波数帯域毎に重みをか
けて背景雑音を抑圧するものである。
【0145】音声帯域パワー計算部31で用いる音声周
波数成分と、雑音帯域パワー計算部32で用いる雑音周
波数成分は、いずれも実施例1あるいは実施例2のビー
ムフォーマの2つの出力である目的音声成分と雑音成分
を利用する。そして、一般に、スペクトルサブトラクシ
ョン(SS)として知られる雑音抑圧処理により、方向
性のない背景雑音成分の抑圧を行う。
【0146】一般的に行われるスペクトルサブトラクシ
ョン(SS)は、1チャンネルのマイクロホン(つま
り、1本のマイクロホン)を用い、このマイクロホンの
出力から音声のない区間において雑音のパワーを推定す
るため、非定常な雑音が音声に重畳している場合には対
処できない。
【0147】また、2チャンネルのマイクロホン(つま
り、2本のマイクロホン)を用いて、一方を雑音収集
用、片方を雑音重畳音声収集用とする場合にも、両マイ
クロホンの設置場所を離す必要があり、その結果、音声
に重畳する雑音と、雑音収集用マイクロホンで取り込む
雑音との位相がずれ、スペクトルサブトラクションして
も雑音抑圧の改善効果は大きく上がらなかった。
【0148】本実施例では、雑音成分を取り出すビーム
フォーマを用意して、このビームフォーマの出力を用い
るようにしたため、実施例1および実施例2で述べたよ
うに、位相のずれが補正され、非定常雑音の場合でも高
精度なスペクトルサブトラクション(SS)を実現でき
る。
【0149】さらに、周波数領域のビームフォーマの出
力を利用しているため、周波数分析を省略してスペクト
ルサブトラクションが可能であり、従来より少ない演算
量で非定常雑音を抑圧できる。
【0150】以下、具体的なスペクトルサブトラクショ
ン(SS)方法について述べる。
【0151】<スペクトルサブトラクション(SS)の
原理>まず、スペクトルサブトラクションの原理につい
て説明する。目的音声用ビームフォーマ(第1のビーム
フォーマ13)の出力をPv、雑音用ビームフォーマ
(第2または第3のビームフォーマ16または22)の
出力をPnとすると、 Pv=V+B′ Pn=N+B″ と表すことができる。ここで、Vは音声成分のパワー、
B′は音声出力に含まれる背景雑音のパワーであり、N
は雑音源成分のパワー、B″は雑音出力に含まれる背景
雑音のパワーである。これらのうち、音声出力成分に含
まれる背景雑音成分を、スペクトルサブトラクション処
理により抑圧する。
【0152】音声出力成分中のB′は、雑音出力成分中
のB″と同等であり、雑音源成分のパワーNも音声成分
のパワーVに比べて小さいとすると、B′=Pnと考え
ることができ、スペクトルサブトラクション(SS)処
理用の重み係数Wは以下のように求めることができる。
すなわち、Wは W=(Pv−Pn)/Pv V/(V+B′) となり、 V Pv*W として音声成分を近似的に求めることができる。
【0153】図8にスペクトルサブトラクション(S
S)処理に必要な構成を、また、図9にスペクトルサブ
トラクション処理手順を示す。
【0154】2つのビームフォーマ13,15(または
22)からの出力として音声周波数成分と雑音周波数成
分が得られる。ビームフォーマ13からの出力である音
声周波数成分を用いて音声帯域パワー計算が実施され
(ステップS51)、ビームフォーマ15(または2
2)からの出力である雑音周波数成分を用いて雑音帯域
パワー計算が実施される(ステップS52)。ここでの
パワー計算は、実施例1および実施例2で説明した本発
明システムの音声周波数成分と雑音周波数成分を利用し
ており、これらはビームフォーマの処理を周波数領域で
行っていることから、周波数分析なしに、そのまま音声
および雑音の周波数成分の各帯域毎にパワーの計算を実
行できる。
【0155】次に、計算されたパワー値を時間方向に平
均化し、帯域毎に平均パワーを求める(ステップS5
3)。帯域重み計算部33では、帯域k毎に、得られた
音声の平均帯域パワーPv(k)と雑音の平均帯域パワー
Pn(k)を用い、次式により、帯域毎の帯域重み係数W
(k)を計算する。
【0156】 帯域重みは最大値1.0と最小値Wminの間の値をと
り、Wminの値は例えば“0.01”等とする。
【0157】次にスペクトル減算部24では、帯域重み
計算部23で計算された帯域毎の重み係数W(k)を用
い、入力の音声周波数成分Pv(k)に重みをかけ、雑音
成分を抑圧した音声周波数成分Pv(k)′を求める(ス
テップS54)。
【0158】Pv(k)′=Pv(k)*W(k) こうして、方向のない背景雑音はスペクトルサブトラク
ション(SS)処理により、抑圧され、方向を持つ雑音
は前述のビームフォーマにより抑圧されて、結果的に高
精度の雑音抑圧が可能となる。
【0159】以上、この実施例3によれば、前記実施例
1または実施例2の音抑圧装置において得られた音声周
波数成分と雑音周波数成分を用いるようにしたものであ
り、前記周波数帯域毎に分割して帯域毎の音声パワーを
計算する音声帯域パワー計算手段と、前記得られた雑音
周波数成分を、周波数帯域毎に分割して帯域毎の雑音パ
ワーを計算する雑音帯域パワー計算手段と、前記音声帯
域パワー計算手段と雑音帯域パワー計算手段とから得ら
れる音声と雑音の周波数帯域パワーに基き、音声信号の
周波数帯域毎に重みをかけて背景雑音を抑圧するスペク
トル減算手段とからなるスペクトル減算雑音抑圧手段を
前記実施例1または実施例2の音抑圧装置にさらに具備
して構成したものである。
【0160】この構成の場合、音声帯域パワー計算手段
は、得られた音声周波数のスペクトル成分を、周波数帯
域毎に分割して帯域毎の音声パワーを計算し、雑音帯域
パワー計算手段は、前記得られた雑音周波数のスペクト
ル成分を、周波数帯域毎に分割して帯域毎の雑音パワー
を計算する。そして、スペクトル減算手段は、前記音声
帯域パワー計算手段と雑音帯域パワー計算手段とから得
られる音声と雑音の周波数帯域パワーに基き、音声信号
の周波数帯域毎に重みをかけて背景雑音を抑圧する。
【0161】この構成によれば、ビームフォーマでは抑
圧できない方向性のない雑音(背景雑音)は、本発明シ
ステムのビームフォーマで得ることのできる目的音声成
分と雑音成分を利用し、これをスペクトルサブトラクシ
ョン処理することで抑圧する。すなわち、本システムで
は、ビームフォーマとして目的音声成分抽出用と雑音成
分抽出用の2つのビームフォーマを備えているが、これ
らのビームフォーマの出力である目的音声成分と雑音成
分を利用してスペクトルサブトラクション処理すること
により、方向性のない背景雑音成分の抑圧を行う。スペ
クトルサブトラクション(SS)処理は雑音抑圧処理と
して知られるが、一般的に行われるスペクトルサブトラ
クション(SS)処理は、1チャンネルのマイクロホン
(つまり、1本のマイクロホン)を用い、このマイクロ
ホンの出力から音声のない区間において雑音のパワーを
推定するため、非定常な雑音が音声に重畳している場合
には対処できない。また、2チャンネルのマイクロホン
(つまり、2本のマイクロホン)を用いて、一方を雑音
収集用、片方を雑音重畳音声収集用とする場合にも、両
マイクロホンの設置場所を離す必要があり、その結果、
音声に重畳する雑音と、雑音収集用マイクロホンで取り
込む雑音との位相がずれ、スペクトルサブトラクション
処理しても雑音抑圧の改善効果は大きく上がらない。
【0162】しかし、本発明では、雑音成分を取り出す
ビームフォーマを用意して、このビームフォーマの出力
を用いるようにしたため、位相のずれは補正されてお
り、従って、非定常雑音の場合でも高精度なスペクトル
サブトラクション処理を実現できる。さらに、周波数領
域のビームフォーマの出力を利用しているため、周波数
分析を省略してスペクトルサブトラクションが可能であ
り、従来より少ない演算量で非定常雑音を抑圧できる。
【0163】次に、実施例3を更に高精度化することが
できるようにした例を実施例4として次に説明する。
【0164】(実施例4)本実施例4は本発明の請求項
4に対応する。本実施例は、実施例3のスペクトルサブ
トラクション(SS)において、雑音成分のパワーを修
正することにより、さらに高精度に雑音抑圧を行うこと
を可能とするものである。すなわち、実施例3では雑音
源のパワーNが小さいという仮定をおいたため、スペク
トルサブトラクション(SS)処理を行うと雑音源の成
分が音声に重畳している部分では歪みが大きくなる懸念
が拭えないという問題がある。
【0165】そこで、ここでは入力信号のパワーを用い
て実施例3のスペクトルサブトラクションの帯域重みの
計算を修正するようにする。
【0166】まず、音声出力パワーをPv、音声成分の
パワーをV、音声出力に含まれる背景雑音パワーを
B′、雑音出力パワーをPn、雑音源成分のパワーを
N、雑音出力に含まれる背景雑音成分をB″、どの信号
も抑圧されていない入力信号のパワーをPxとすると、 Px=V+N+B Pv=V+B′ Pn=N+B″ ここで、ここで、B B′ B″と仮定する
と、真の背景雑音成分のパワーPbは、 Pb=Pv+Pn−Px =V+B′+N+B″−(V+N+B) =B′+B″−B =B となる。この雑音パワーを用いたスペクトルサブトラク
ション(SS)の重みは、 W=(Pv−Pb)/Pv =(Px−Pn)/Pv と計算でき、背景雑音が非定常でかつ、Nが大きい場合
でも歪みの少いSS処理を行うことができる。
【0167】本実施例の構成を図10に示し、処理の流
れを図11に示す。図10中、31は音声帯域パワー計
算部、32は雑音帯域パワー計算部、34はスペクトル
減算部、35は入力信号帯域パワー計算部である。
【0168】これらのうち、音声帯域パワー計算部31
は、前記ビームフォーマ13により得られた音声周波数
を、周波数帯域毎に分割して帯域毎の音声パワーを計算
するものであり、雑音帯域パワー計算部32は、前記ビ
ームフォーマ16または22により得られ、有効雑音決
定部24により選択されて出力された雑音周波数成分
を、周波数帯域毎に分割して帯域毎の雑音パワーを計算
するものである。
【0169】入力帯域パワー計算部35は、前記周波数
分析部12から得られた入力信号の周波数スペクトル成
分を周波数帯域毎に分割し、帯域毎の入力パワーを計算
するものであり、スペクトル減算部34は、前記入力帯
域パワー計算部35にて計算された入力帯域パワーと、
音声帯域パワー計算部31で計算された音声帯域パワー
と、雑音帯域パワー計算部32で計算された雑音帯域パ
ワーとに基き、音声信号の周波数帯域ごとに重みをかけ
て背景雑音を抑圧するものである。
【0170】図10に示す実施例4でのスペクトルサブ
トラクション(SS)部30の構成と、実施例3でのス
ペクトルサブトラクション(SS)部30の構成との差
は、実施例4においては何も抑圧されていない入力信号
の周波数成分を更に用いる点である。
【0171】この入力信号周波数成分について、入力信
号帯域パワー計算部35では、ビームフォーマからの音
声周波数成分あるいは雑音周波数成分と同様に、帯域ご
とにパワーを計算する(ステップS61)。
【0172】また、実施例3と同様に、2つのビームフ
ォーマ13,15(または22)からの出力として音声
周波数成分と雑音周波数成分が与えられるので、音声帯
域パワー計算部31ではビームフォーマ13からの出力
である音声周波数成分を用いて音声帯域パワー計算を実
施し(ステップS62)、雑音帯域パワー計算部32で
はビームフォーマ15(または22)からの出力である
雑音周波数成分を用いて雑音帯域パワー計算を実施する
(ステップS63)。
【0173】そして、スペクトル減算部34において、
上述したように重み係数を求めた後に、重み付けを行う
(ステップS64,S65)。これにより、方向を持つ
雑音成分および方向のない雑音成分を抑圧した歪みの少
い音声成分のみの抽出ができるようになる。
【0174】このように、実施例4は、上記実施例3の
雑音抑圧装置において、音声入力手段から得られた入力
信号を周波数分析した入力信号の周波数成分を周波数帯
域毎に分割し、帯域毎の入カパワーを計算する入力帯域
パワー計算手段を設けて、スペクトル減算手段には、入
力帯域パワーと音声帯域パワーと雑音帯域パワーとに基
き、音声信号の周波数帯域毎に重みをかけて背景雑音を
抑圧する処理を実施させるように構成したことを特徴と
するものである。
【0175】この構成の場合、音声帯域パワー計算手段
は、得られた音声周波数のスペクトル成分を、周波数帯
域毎に分割して帯域毎の音声パワーを計算し、雑音帯域
パワー計算手段は、前記得られた雑音周波数のスペクト
ル成分を、周波数帯域毎に分割して帯域毎の雑音パワー
を計算する。また、入力帯域パワー計算手段があり、こ
の入力帯域パワー計算手段は、音声入力手段から得られ
た入力信号を周波数分析して得た入力音声の周波数スペ
クトル成分を受けて、これを周波数帯域毎に分割し、帯
域毎の入カパワーを計算する。そして、スペクトル減算
手段は、前記音声帯域パワー計算手段と雑音帯域パワー
計算手段とから得られる音声と雑音の周波数帯域パワー
に基き、音声信号の周波数帯域毎に重みをかけて背景雑
音を抑圧する。
【0176】この実施例4においては、実施例3の構成
におけるスペクトルサブトラクション処理において、更
に雑音成分についてそのパワーを修正するようにしたこ
とにより、一層高精度に雑音抑圧を行うことを可能とす
るものである。すなわち、第3の発明では雑音源のパワ
−Nが小さいという仮定をおいたため、スペクトルサブ
トラクション処理を行うと雑音源の成分が音声に重畳し
ている部分では歪みが大きくなることが避けられない
が、ここでは入力信号のパワーを用いて第3の発明での
スペクトルサブトラクション処理における帯域重みの計
算を修正するようにした。これにより、方向を持つ雑音
成分および方向のない雑音成分を抑圧した歪みの少い音
声成分のみの抽出ができるようになるものである。
【0177】以上、種々の実施例を説明したが、本発明
は第1には、話者の発声した音声を少なくとも異なる2
箇所以上の位置で受音する音声入力手段と、前記受音位
置に対応する音声信号のチャネル毎に周波数分析を行っ
て複数チャネルの周波数成分を出力する周波数分析手段
と、この周波数分析手段にて得られる前記複数チャネル
の周波数成分について、所望方向外の感度が低くなるよ
うに計算したフィルタ係数を用いての適応フィルタ処理
を施すことにより前記話者方向からの音声以外の音声を
抑圧する到来雑音抑圧処理を行い、目的音声成分を得る
第1のビームフォーマ処理手段と、前記周波数分析手段
にて得られる前記複数チャネルの周波数成分について、
所望方向外の感度が低くなるように計算したフィルタ係
数を用いての適応フィルタ処理を施すことにより前記話
者方向からの音声を抑圧し、雑音成分を得る第2のビー
ムフォーマ処理手段と、前記第1のビームフォーマ処理
手段で計算されるフィルタ係数から雑音方向を推定する
雑音方向推定手段と、前記第2のビームフォーマ処理手
段で計算されるフィルタ係数から目的音方向を推定する
目的音方向推定手段と、前記第1のビームフォーマにお
いて入力対象となる目的音の到来方向である第1の入力
方向を、前記目的音方向推定手段で推定された目的音方
向に基づいて逐次修正する目的音方向修正手段と、前記
第2のビームフォーマにおいて入力対象とする雑音の到
来方向である第2の入力方向を、前記雑音方向推定手段
で推定された雑音方向に基づいて逐次修正する雑音方向
修正手段とを具備して構成したものである。
【0178】このような構成の場合、話者の発声した音
声を異なる2箇所以上の位置で音声入力手段は受音し、
周波数分析手段では、これを前記受音位置に対応する音
声信号のチャネル毎に周波数分析して複数チャネルの周
波数成分を出力する。そして、第1のビームフォーマ処
理手段はこの周波数分析手段にて得られる前記複数チャ
ネルの周波数成分について、所望方向外の感度が低くな
るように計算したフィルタ係数を用いての適応フィルタ
処理を施すことにより前記話者方向からの音声以外の音
声を抑圧する到来雑音抑圧処理を行い、目的音声成分を
得、また、第2のビームフォーマ処理手段は、前記周波
数分析手段にて得られる前記複数チャネルの周波数成分
について、所望方向外の感度が低くなるように計算した
フィルタ係数を用いての適応フィルタ処理を施すことに
より前記話者方向からの音声を抑圧し、雑音成分を得
る。そして、雑音方向推定手段は、前記第1のビームフ
ォーマ処理手段で計算されるフィルタ係数から雑音方向
を推定し、目的音方向推定手段は、前記第2のビームフ
ォーマ処理手段で計算されるフィルタ係数から目的音方
向を推定する。目的音方向修正手段は、前記第1のビー
ムフォーマにおいて入力対象となる目的音の到来方向で
ある第1の入力方向を、前記目的音方向推定手段で推定
された目的音方向に基づいて逐次修正するので、第1の
ビームフォーマは第1の入力方向以外から到来する雑音
成分を抑圧して話者の音声成分を低雑音で抽出すること
になる。また、雑音方向修正手段は、前記第2のビーム
フォーマにおいて入力対象とする雑音の到来方向である
第2の入力方向を、前記雑音方向推定手段で推定された
雑音方向に基づいて逐次修正するので、第2のビームフ
ォーマは第2の入力方向以外から到来する成分を抑圧し
て話者の音声成分を抑圧した残りの雑音成分を抽出する
ことになる。
【0179】このように本システムは雑音成分を抑圧し
た音声周波数成分と、音声成分を抑圧した雑音周波数成
分とを別々に得ることができるが、この発明の第1の特
徴は、第1及び第2のビームフォーマとして、周波数領
域で動作するビームフォーマを用いるようにした点にあ
る。そして、このことによって、計算量を大幅に削減す
ることができるようにしている。そしてこの発明による
と、適応フィルタの処理量が大幅に低減されるのに加
え、入力音声に対する周波数分析以外の周波数分析処理
を省略することができ、かつ、フィルタ演算時に必要で
あった時間領域から周波数領域ヘの変換処理も不要とな
り、全体の演算量を大幅に削減することができる。
【0180】すなわち、従来技術では、ビームフォーマ
で抑圧できない拡散性雑音の抑圧処理のために、スペク
トルサブトラクション処理を、ビームフォーマ処理の後
に行うようにしており、このスペクトルサブトラクショ
ン処理は周波数スペクトルを入力とするため、FFT
(高速フーリエ変換)などの周波数分析が従来必要であ
ったが、周波数領域で動作するビームフォーマを用いる
と当該ビームフォーマからは周波数スペクトルが出力さ
れるため、これをスペクトルサブトラクション処理に流
用できるので、特別にスペクトルサブトラクション処理
のためのFFTを実施する従来のFFT処理工程は省略
することができる。故に、全体の演算量を大幅に削減す
ることができる。
【0181】また、ビームフォーマのフィルタを用いた
方向推定の際に必要であった時間領域から周波数領域へ
の変換処理も不要となり、全体の演算量を大幅に削減す
ることができる。
【0182】また、第2には本発明は、話者の発声した
音声を少なくとも異なる2箇所以上の位置で受音する音
声入力手段と、前記受音位置に対応する音声信号のチャ
ネル毎に周波数分析を行って複数チャネルの周波数成分
を出力する周波数分析手段と、この周波数分析手段にて
得られる前記複数チャネルの周波数成分について、所望
方向外の感度が低くなるように計算したフィルタ係数を
用いての適応フィルタ処理を施すことにより前記話者方
向からの音声以外の音声を抑圧する到来雑音抑圧処理を
行い、目的音声成分を得る第1のビームフォーマ処理手
段と、前記周波数分析手段にて得られる前記複数チャネ
ルの周波数成分について、所望方向外の感度が低くなる
ように計算したフィルタ係数を用いての適応フィルタ処
理を施すことにより前記話者方向からの音声を抑圧し、
第1の雑音成分を得る第2のビームフォーマ処理手段
と、前記周波数分析手段にて得られる前記複数チャネル
の周波数成分について、所望方向外の感度が低くなるよ
うに計算したフィルタ係数を用いての適応フィルタ処理
を施すことにより前記話者方向からの音声を抑圧し、第
2の雑音成分を得る第2のビームフォーマ処理手段と、
前記第1のビームフォーマ処理手段で計算されるフィル
タ係数から雑音方向を推定する雑音方向推定手段と、前
記第2のビームフォーマ処理手段で計算されるフィルタ
係数から第1の目的音方向を推定する第1の目的音方向
推定手段と、前記第3の適応ビームフォーマ処理手段で
計算されるフィルタ係数から第2の目的音方向を推定す
る第2の目的音方向推定手段と、前記第1のビームフォ
ーマにおいて入力対象とする目的音の到来方向である第
1の入力方向を、前記第1の目的音方向推定手段で推定
された第1の目的音方向と、第2の目的音方向推定手段
で推定された第2の目的音方向のいずれか一方または両
方に基づいて逐次修正する第1の入力方向修正手段と、
前記雑音方向修正手段で推定された雑音方向が所定の第
1の範囲にある場合に、前記第2のビームフォーマにお
いて入力対象とする雑音の到来方向である第2の入力方
向を該雑音方向に基づいて逐次修正する第2の入力方向
修正手段と、前記雑音方向修正手段で推定された雑音方
向が所定の第2の範囲にある場合に、前記第3のビーム
フォーマにおいて入力対象とする雑音の到来方向である
第3の入力方向を該雑音方向に基づいて逐次修正する第
3の入力方向修正手段と、前記雑音方向推定手段で推定
された雑音方向が所定の第1の範囲から到来したか所定
の第2の範囲から到来したかに基づいて前記第1の出力
雑音と前記第2の出力雑音のいずれか一方を真の雑音出
力と決定していずれか一方の雑音を出力すると同時に、
第1の音声方向推定手段と第2の音声方向推定手段のい
ずれの推定結果が有効であるかを決定していずれか一方
の音声方向推定結果を第1の入力方向修正手段へ出力す
る有効雑音決定手段とを具備して構成する。
【0183】この第2の構成の場合、話者の発声した音
声を異なる2箇所以上の位置で音声入力手段は受音し、
周波数分析手段では、これを前記受音位置に対応する音
声信号のチャネル毎に周波数分析して複数チャネルの周
波数成分を出力する。そして、第1のビームフォーマ処
理手段はこの周波数分析手段にて得られる前記複数チャ
ネルの周波数成分について、所望方向外の感度が低くな
るように計算したフィルタ係数を用いての適応フィルタ
処理を施すことにより前記話者方向からの音声以外の音
声を抑圧する到来雑音抑圧処理を行い、目的音声成分を
得、また、第2のビームフォーマ処理手段は、前記周波
数分析手段にて得られる前記複数チャネルの周波数成分
について、所望方向外の感度が低くなるように計算した
フィルタ係数を用いての適応フィルタ処理を施すことに
より前記話者方向からの音声を抑圧し、雑音成分を得
る。そして、雑音方向推定手段は、前記第1のビームフ
ォーマ処理手段で計算されるフィルタ係数から雑音方向
を推定し、目的音方向推定手段は、前記第2のビームフ
ォーマ処理手段で計算されるフィルタ係数から目的音方
向を推定する。
【0184】また、第1の目的音方向推定手段は前記第
2のビームフォーマ処理手段で計算されるフィルタ係数
から第1の目的音方向を推定し、第2の目的音方向推定
手段は、前記第3の適応ビームフォーマ処理手段で計算
されるフィルタ係数から第2の目的音方向を推定する。
【0185】第1の入力方向修正手段は、前記第1のビ
ームフォーマにおいて入力対象とする目的音の到来方向
である第1の入力方向を、前記第1の目的音方向推定手
段で推定された第1の目的音方向と、第2の目的音方向
推定手段で推定された第2の目的音方向のいずれか一方
または両方に基づいて逐次修正する。そして、第2の入
力方向修正手段は、前記雑音方向修正手段で推定された
雑音方向が所定の第1の範囲にある場合に、前記第2の
ビームフォーマにおいて入力対象とする雑音の到来方向
である第2の入力方向を該雑音方向に基づいて逐次修正
し、第3の入力方向修正手段は、前記雑音方向修正手段
で推定された雑音方向が所定の第2の範囲にある場合
に、前記第3のビームフォーマにおいて入力対象とする
雑音の到来方向である第3の入力方向を該雑音方向に基
づいて逐次修正する。従って、第2の入力方向修正手段
の出力により第2の入力方向を修正される第2のビーム
フォーマは第2の入力方向以外から到来する成分を抑圧
して残りの雑音成分を抽出することになり、また、第3
の入力方向修正手段の出力により第3の入力方向を修正
される第3のビームフォーマは第3の入力方向以外から
到来する成分を抑圧して残りの雑音成分を抽出すること
になる。
【0186】そして、有効雑音決定手段は、前記雑音方
向推定手段で推定された雑音方向が所定の第1の範囲か
ら到来したか所定の第2の範囲から到来したかに基づい
て前記第1の出力雑音と前記第2の出力雑音のいずれか
一方を真の雑音出力と決定していずれか一方の雑音を出
力すると同時に、第1の音声方向推定手段と第2の音声
方向推定手段のいずれの推定結果が有効であるかを決定
して有効な方の音声方向推定結果を第1の入力方向修正
手段へ出力する。この結果、目的音方向修正手段は、前
記第1のビームフォーマにおいて入力対象となる目的音
の到来方向である第1の入力方向を、前記決定した方の
目的音方向推定手段で得た目的音方向に基づいて逐次修
正するので、第1のビームフォーマは第1の入力方向以
外から到来する雑音成分を抑圧して話者の音声成分を低
雑音で抽出することになる。
【0187】このように本システムは雑音成分を抑圧し
た音声周波数成分と、音声成分を抑圧した雑音周波数成
分とを別々に得ることができるが、この発明の最大の特
徴は、第1及び第2のビームフォーマとして、周波数領
域で動作するビームフォーマを用いるようにした点にあ
る。そして、このことによって、計算量を大幅に削減す
ることができるようにしている。
【0188】そしてこの発明によると、適応フィルタの
処理量が大幅に低減されるのに加え、入力音声に対する
周波数分析以外の周波数分析処理を省略することがで
き、かつ、フィルタ演算時に必要であった時間領域から
周波数領域ヘの変換処理も不要となり、全体の演算量を
大幅に削減することができる。
【0189】また、本発明では、雑音追尾に監視領域を
全く異ならせた雑音追尾用のビームフォーマを設けてあ
り、それぞれの出力からそれぞれ音声方向を推定させる
と共に、それぞれの推定結果からいずれが有効な雑音追
尾をしているかを判断して、有効と判断された方のビー
ムフォーマのフィルタ係数による音声方向の推定結果を
第1の目的音方向修正手段に与えることで第1の目的音
方向修正手段は、前記第1のビームフォーマにおいて入
力対象となる目的音の到来方向である第1の入力方向
を、前記目的音方向推定手段で推定された目的音方向に
基づいて逐次修正するので、第1のビームフォーマは第
1の入力方向以外から到来する雑音成分を抑圧して話者
の音声成分を低雑音で抽出することができ、雑音源が移
動してもこれを見失うことなく追尾して抑圧することが
できるようになるものである。
【0190】従来技術においては、2ch、すなわち、
2本のマイクロホンだけでも目的音源の追尾を可能とす
べく、雑音追尾用のビームフォーマを雑音抑圧のビーム
フォーマとは別に1個用いるが、例えば、雑音源が目的
音の方向を横切って移動したような場合、雑音の追尾精
度が低下することがあった。
【0191】しかし、本発明では、雑音を追尾するビー
ムフォーマを複数用いて各々別個の追尾範囲を受け持つ
ようにしたことにより、上記のような場合でも追尾精度
の低下を抑止できるようになる。
【0192】更に第3には、本発明は、上記第1または
第2の音抑圧装置において、前記得られた音声周波数
を、周波数帯域毎に分割して帯域毎の音声パワーを計算
する音声帯域パワー計算手段と、前記得られた雑音周波
数成分を、周波数帯域毎に分割して帯域毎の雑音パワー
を計算する雑音帯域パワー計算手段と、前記音声帯域パ
ワー計算手段と雑音帯域パワー計算手段とから得られる
音声と雑音の周波数帯域パワーに基き、音声信号の周波
数帯域毎に重みをかけて背景雑音を抑圧するスペクトル
減算手段とからなるスペクトル減算雑音抑圧手段をさら
に具備することを特徴とする。
【0193】この構成の場合、音声帯域パワー計算手段
は、得られた音声周波数のスペクトル成分を、周波数帯
域毎に分割して帯域毎の音声パワーを計算し、雑音帯域
パワー計算手段は、前記得られた雑音周波数のスペクト
ル成分を、周波数帯域毎に分割して帯域毎の雑音パワー
を計算する。そして、スペクトル減算手段は、前記音声
帯域パワー計算手段と雑音帯域パワー計算手段とから得
られる音声と雑音の周波数帯域パワーに基き、音声信号
の周波数帯域毎に重みをかけて背景雑音を抑圧する。
【0194】この構成によれば、ビームフォーマでは抑
圧できない方向性のない雑音(背景雑音)は、本発明シ
ステムのビームフォーマで得ることのできる目的音声成
分と雑音成分を利用し、これをスペクトルサブトラクシ
ョン処理することで抑圧する。すなわち、本システムで
は、ビームフォーマとして目的音声成分抽出用と雑音成
分抽出用の2つのビームフォーマを備えているが、これ
らのビームフォーマの出力である目的音声成分と雑音成
分を利用してスペクトルサブトラクション処理すること
により、方向性のない背景雑音成分の抑圧を行う。スペ
クトルサブトラクション(SS)処理は雑音抑圧処理と
して知られるが、一般的に行われるスペクトルサブトラ
クション(SS)処理は、1チャンネルのマイクロホン
(つまり、1本のマイクロホン)を用い、このマイクロ
ホンの出力から音声のない区間において雑音のパワーを
推定するため、非定常な雑音が音声に重畳している場合
には対処できない。また、2チャンネルのマイクロホン
(つまり、2本のマイクロホン)を用いて、一方を雑音
収集用、片方を雑音重畳音声収集用とする場合にも、両
マイクロホンの設置場所を離す必要があり、その結果、
音声に重畳する雑音と、雑音収集用マイクロホンで取り
込む雑音との位相がずれ、スペクトルサブトラクション
処理しても雑音抑圧の改善効果は大きく上がらない。
【0195】しかし、本発明では、雑音成分を取り出す
ビームフォーマを用意して、このビームフォーマの出力
を用いるようにしたため、位相のずれは補正されてお
り、従って、非定常雑音の場合でも高精度なスペクトル
サブトラクション処理を実現できる。さらに、周波数領
域のビームフォーマの出力を利用しているため、周波数
分析を省略してスペクトルサブトラクションが可能であ
り、従来より少ない演算量で非定常雑音を抑圧できる。
【0196】更に第4には、本発明は、上記第3の発明
の雑音抑圧装置において、音声入力手段から得られた入
力信号を周波数分析した入力信号の周波数成分を周波数
帯域毎に分割し、帯域毎の入カパワーを計算する入力帯
域パワー計算手段を設けて、スペクトル減算手段には、
入力帯域パワーと音声帯域パワーと雑音帯域パワーとに
基き、音声信号の周波数帯域毎に重みをかけて背景雑音
を抑圧する処理を実施させるようにすることを特徴とす
る。
【0197】この構成の場合、音声帯域パワー計算手段
は、得られた音声周波数のスペクトル成分を、周波数帯
域毎に分割して帯域毎の音声パワーを計算し、雑音帯域
パワー計算手段は、前記得られた雑音周波数のスペクト
ル成分を、周波数帯域毎に分割して帯域毎の雑音パワー
を計算する。また、入力帯域パワー計算手段があり、こ
の入力帯域パワー計算手段は、音声入力手段から得られ
た入力信号を周波数分析して得た入力音声の周波数スペ
クトル成分を受けて、これを周波数帯域毎に分割し、帯
域毎の入カパワーを計算する。そして、スペクトル減算
手段は、前記音声帯域パワー計算手段と雑音帯域パワー
計算手段とから得られる音声と雑音の周波数帯域パワー
に基き、音声信号の周波数帯域毎に重みをかけて背景雑
音を抑圧する。
【0198】この第4の発明においては、第3の発明の
スペクトルサブトラクション(SS)処理において、更
に雑音成分についてそのパワーを修正するようにしたこ
とにより、一層高精度に雑音抑圧を行うことを可能とす
るものである。すなわち、第3の発明では雑音源のパワ
−Nが小さいという仮定をおいたため、スペクトルサブ
トラクション(SS)処理を行うと雑音源の成分が音声
に重畳している部分では歪みが大きくなることが避けら
れないが、ここでは入力信号のパワーを用いて第3の発
明でのスペクトルサブトラクション処理における帯域重
みの計算を修正するようにした。これにより、方向を持
つ雑音成分および方向のない雑音成分を抑圧した歪みの
少い音声成分のみの抽出ができるようになるものであ
る。
【0199】尚、本発明は上述した実施例に限定される
ものではなく、種々変形して実施可能である。
【0200】
【発明の効果】以上、詳述したように、本発明によれ
ば、全体の演算量を大幅に削減することができ、また、
ビームフォーマのフィルタを用いた方向推定の際に必要
であった時間領域から周波数領域への変換処理も不要と
なり、全体の演算量を大幅に削減することができると云
う効果が得られる。
【0201】また、本発明では、雑音成分を取り出すビ
ームフォーマを用意して、このビームフォーマの出力を
用いるようにしたため、位相のずれは補正されており、
従って、非定常雑音の場合でも高精度なスペクトルサブ
トラクション処理を実現できる。さらに、周波数領域の
ビームフォーマの出力を利用しているため、周波数分析
を省略してスペクトルサブトラクションが可能であり、
従来より少ない演算量で非定常雑音を抑圧できて、方向
性のある雑音成分ばかりか、方向性のない雑音成分(背
景雑音)も抑圧できて歪みの少い音声成分の抽出ができ
るようになると云う効果が得られる。
【図面の簡単な説明】
【図1】本発明の実施例1の全体構成を示すブロック図
である。
【図2】本発明で使用するビームフォーマの構成例と動
作例を説明する図である。
【図3】本発明の実施例1における方向推定部の作用を
説明するためのフローチャートである。
【図4】本発明の実施例1におけるシステムの作用を説
明するためのフローチャートである。
【図5】本発明の実施例2の全体構成を示すブロック図
である。
【図6】本発明の実施例2におけるビームフォーマの追
尾範囲を説明するための図である。
【図7】本発明の実施例2におけるシステムの作用を説
明するためのフローチャートである。
【図8】本発明の実施例3の要部構成を示すブロック図
である。
【図9】本発明の実施例2におけるシステムの作用を説
明するためのフローチャートである。
【図10】本発明の実施例4の要部構成を示すブロック
図である。
【図11】本発明の実施例2におけるシステムの作用を
説明するためのフローチャートである。
【符号の説明】
11…音声入力部 12…周波数解析部 13…第1のビームフォーマ 14…第1の入力方向修正部 15…第2の入力方向修正部 16…第2のビームフォーマ 17…雑音方向推定部 18…第1の音声方向推定部(目的音方向推定部) 21…第3の入力方向修正部 22…第3のビームフォーマ 23…第2の音声方向推定部 24…有効雑音決定部 30…スペクトルサブトラクション(SS)処理部 31…音声帯域パワー計算部 32…雑音帯域パワー計算部 33…帯域重み計算部 34…スペクトル減算部 35…入力信号帯域パワー計算部
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.7 識別記号 FI テーマコート゛(参考) H03H 21/00 Fターム(参考) 5D015 CC02 CC14 DD02 EE05 5J023 DA05 DB02 DC06 DC08 DD03 5J083 AA05 AB10 AC07 AC15 AC18 AC30 AD15 BC01 BE12 BE14 BE18 BE43 BE53 BE58 CA10 CA12

Claims (8)

    【特許請求の範囲】
  1. 【請求項1】話者の発声した音声を2箇所以上の異なっ
    た位置で受音する音声入力手段と、 前記受音位置に対応する音声信号のチャネルごとに周波
    数分析を行って複数チャネルの周波数成分を出力する周
    波数分析手段と、 前記複数チャネルの周波数成分を用いて適応フィルタ処
    理により目的の音声以外の到来雑音の抑圧処理を行って
    目的音声を出力する第1のビームフォーマ処理手段と、 前記複数チャネルの周波数成分を用いて適応フィルタ処
    理により目的の音声の抑圧処理を行って雑音を出力する
    第2のビームフォーマ処理手段と、 前記第1のビームフォーマ処理手段で計算されるフィル
    タ係数から雑音方向を推定する雑音方向推定手段と、 前記第2のビームフォーマ処理手段で計算されるフィル
    タ係数から目的音方向を推定する目的音方向推定手段
    と、 前記第1のビームフォーマにおいて入力対象となる目的
    音の到来方向である第1の入力方向を、前記目的音方向
    推定手段で推定された目的音方向に基づいて逐次修正す
    る目的音方向修正手段と、 前記第2のビームフォーマにおいて入力対象とする雑音
    の到来方向である第2の入力方向を、前記雑音方向推定
    手段で推定された雑音方向に基づいて逐次修正する雑音
    方向修正手段とを具備し、 逐次、音声周波数成分と雑音周波数成分とを別々に出力
    することを特徴とする雑音抑圧装置。
  2. 【請求項2】話者の発声した音声を少なくとも異なる2
    箇所以上の位置で受音する音声入力手段と、前記受音位
    置に対応する音声信号のチャネル毎に周波数分析を行っ
    て複数チャネルの周波数成分を出力する周波数分析手段
    と、この周波数分析手段にて得られる前記複数チャネル
    の周波数成分について、所望方向外の感度が低くなるよ
    うに計算したフィルタ係数を用いての適応フィルタ処理
    を施すことにより前記話者方向からの音声以外の音声を
    抑圧する到来雑音抑圧処理を行い、目的音声成分を得る
    第1のビームフォーマ処理手段と、 前記周波数分析手段にて得られる前記複数チャネルの周
    波数成分について、所望方向外の感度が低くなるように
    計算したフィルタ係数を用いての適応フィルタ処理を施
    すことにより前記話者方向からの音声を抑圧し、第1の
    雑音成分を得る第2のビームフォーマ処理手段と、 前記周波数分析手段にて得られる前記複数チャネルの周
    波数成分について、所望方向外の感度が低くなるように
    計算したフィルタ係数を用いての適応フィルタ処理を施
    すことにより前記話者方向からの音声を抑圧し、第2の
    雑音成分を得る第2のビームフォーマ処理手段と、 前記第1のビームフォーマ処理手段で計算されるフィル
    タ係数から雑音方向を推定する雑音方向推定手段と、 前記第2のビームフォーマ処理手段で計算されるフィル
    タ係数から第1の目的音方向を推定する第1の目的音方
    向推定手段と、 前記第3の適応ビームフォーマ処理手段で計算されるフ
    ィルタ係数から第2の目的音方向を推定する第2の目的
    音方向推定手段と、 前記第1のビームフォーマにおいて入力対象とする目的
    音の到来方向である第1の入力方向を、前記第1の目的
    音方向推定手段で推定された第1の目的音方向と、第2
    の目的音方向推定手段で推定された第2の目的音方向の
    いずれか一方または両方に基づいて逐次修正する第1の
    入力方向修正手段と、 前記雑音方向修正手段で推定された雑音方向が所定の第
    1の範囲にある場合に、前記第2のビームフォーマにお
    いて入力対象とする雑音の到来方向である第2の入力方
    向を該雑音方向に基づいて逐次修正する第2の入力方向
    修正手段と、 前記雑音方向修正手段で推定された雑音方向が所定の第
    2の範囲にある場合に、前記第3のビームフォーマにお
    いて入力対象とする雑音の到来方向である第3の入力方
    向を該雑音方向に基づいて逐次修正する第3の入力方向
    修正手段と、 前記雑音方向推定手段で推定された雑音方向が所定の第
    1の範囲から到来したか所定の第2の範囲から到来した
    かに基づいて前記第1および第2の出力雑音のいずれか
    一方を真の雑音出力と決定していずれか一方の雑音を出
    力すると同時に、第1の音声方向推定手段と第2の音声
    方向推定手段のいずれの推定結果が有効であるかを決定
    していずれか一方の音声方向推定結果を第1の入力方向
    修正手段へ出力する有効雑音決定手段と、 を具備し、逐次、音声周波数成分と雑音周波数成分とを
    別々に出力することを特徴とする雑音抑圧装置。
  3. 【請求項3】請求項1または2いずれか1項に記載の雑
    音抑圧装置において、 前記得られた音声周波数を、周波数帯域毎に分割して帯
    域毎の音声パワーを計算する音声帯域パワー計算手段
    と、 前記得られた雑音周波数成分を、周波数帯域毎に分割し
    て帯域毎の雑音パワーを計算する雑音帯域パワー計算手
    段と、 前記音声帯域パワー計算手段と雑音帯域パワー計算手段
    とから得られる音声と雑音の周波数帯域パワーに基き、
    音声信号の周波数帯域毎に重みをかけて背景雑音を抑圧
    するスペクトル減算手段と、からなるスペクトル減算雑
    音抑圧手段をさらに具備することを特徴とする雑音抑圧
    装置。
  4. 【請求項4】請求項1または2いずれか1項に記載の雑
    音抑圧装置において、 前記得られた音声周波数を、周波数帯域毎に分割して帯
    域毎の音声パワーを計算する音声帯域パワー計算手段
    と、 前記得られた雑音周波数成分を、周波数帯域毎に分割し
    て帯域毎の雑音パワーを計算する雑音帯域パワー計算手
    段と、 前記音声入力手段から得られた入力信号を周波数分析し
    た入力信号の周波数成分を周波数帯域毎に分割し、帯域
    毎の入カパワーを計算する入力帯域パワー計算手段と、 前記入力帯域パワーと音声帯域パワーと雑音帯域パワー
    とに基き、音声信号の周波数帯域毎に重みをかけて背景
    雑音を抑圧する修正スペクトル減算手段を具備すること
    を特徴とする雑音抑圧装置。
  5. 【請求項5】話者の発声した音声を2箇所以上の異なっ
    た位置でそれぞれ受音してそれぞれ別チャンネルの音声
    信号として得るステップと、 この各チャンネル毎の音声信号を周波数分析してそれぞ
    れチャネル別に周波数スペクトル成分を得る周波数分析
    ステップと、 周波数分析ステップにて得られた各チャネルの周波数成
    分を用いて適応フィルタ処理により目的の音声以外の到
    来雑音を抑圧処理し、目的音声を得る第1のビームフォ
    ーマ処理ステップと、 前記各チャネルの周波数成分を用いて適応フィルタ処理
    により目的の音声の抑圧処理を行って雑音成分を得る第
    2のビームフォーマ処理ステップと、 前記第1のビームフォーマ処理ステップで計算される適
    応フィルタで使用したフィルタ係数から雑音方向を推定
    する雑音方向推定ステップと、 前記第2のビームフォーマ処理ステップで計算される適
    応フィルタで使用したフィルタ係数から目的音方向を推
    定する目的音方向推定ステップと、 前記第1のビームフォーマ処理ステップにおいて入力対
    象となる目的音の到来方向である第1の入力方向を、前
    記目的音方向推定手段で推定された目的音方向に基づい
    て逐次修正する目的音方向修正ステップと、 前記第2のビームフォーマ処理ステップにおいて入力対
    象とする雑音の到来方向である第2の入力方向を、前記
    雑音方向推定ステップで推定された雑音方向に基づいて
    逐次修正する雑音方向修正ステップとを具備し、 逐次、音声周波数成分と雑音周波数成分とを別々に求め
    ることを特徴とする雑音抑圧方法。
  6. 【請求項6】話者の発声した音声を2箇所以上の異なっ
    た位置でそれぞれ受音してそれぞれ別チャンネルの音声
    信号として得るステップと、 この各チャンネル毎の音声信号を周波数分析してそれぞ
    れチャネル別に周波数スペクトル成分を得る周波数分析
    ステップと、 周波数分析ステップにて得られた各チャネルの周波数成
    分を用いて前記複数チャネルの周波数成分について、所
    望方向外の感度が低くなるようにしたフィルタ係数を用
    いての適応フィルタ処理を施すことにより前記話者方向
    からの音声以外の音声を抑圧する到来雑音抑圧処理を行
    い、目的音声成分を得る第1のビームフォーマ処理ステ
    ップと、 周波数分析ステップにて得られた各チャネルの周波数成
    分を用いて前記複数チャネルの周波数成分について、所
    望方向外の感度が低くなるように計算したフィルタ係数
    を用いての適応フィルタ処理を施すことにより前記話者
    方向からの音声を抑圧し、第1の雑音成分を得る第2の
    ビームフォーマ処理ッステップと、 周波数分析ステップにて得られた各チャネルの周波数成
    分を用いて前記複数チャネルの周波数成分について、所
    望方向外の感度が低くなるようにしたフィルタ係数を用
    いての適応フィルタ処理を施すことにより前記話者方向
    からの音声を抑圧し、第2の雑音成分を得る第2のビー
    ムフォーマ処理ステップと、 前記第1のビームフォーマ処理ステップで計算されるフ
    ィルタ係数から雑音方向を推定する雑音方向推定ステッ
    プと、 前記第2のビームフォーマ処理ステップで計算されるフ
    ィルタ係数から第1の目的音方向を推定する第1の目的
    音方向推定ステップと、 前記第3の適応ビームフォーマ処理ステップで計算され
    るフィルタ係数から第2の目的音方向を推定する第2の
    目的音方向推定ステップと、 前記第1のビームフォーマにおいて入力対象とする目的
    音の到来方向である第1の入力方向を、前記第1の目的
    音方向推定手段で推定された第1の目的音方向と、第2
    の目的音方向推定手段で推定された第2の目的音方向の
    いずれか一方または両方に基づいて逐次修正する第1の
    入力方向修正ステップと、 前記雑音方向修正ステップで推定された雑音方向が所定
    の第1の範囲にある場合に、前記第2のビームフォーマ
    処理ステップにおいて入力対象とする雑音の到来方向で
    ある第2の入力方向を該雑音方向に基づいて逐次修正す
    る第2の入力方向修正ステップと、 前記雑音方向修正ステップで推定された雑音方向が所定
    の第2の範囲にある場合に、前記第3のビームフォーマ
    処理ステップにおいて入力対象とする雑音の到来方向で
    ある第3の入力方向を該雑音方向に基づいて逐次修正す
    る第3の入力方向修正ステップと、 前記雑音方向推定ステップで推定された雑音方向が所定
    の第1の範囲から到来したか所定の第2の範囲から到来
    したかに基づいて前記第1および第2の出力雑音のいず
    れか一方を真の雑音出力と決定していずれか一方の雑音
    を出力すると同時に、第1の音声方向推定手段と第2の
    音声方向推定手段のいずれの推定結果が有効であるかを
    決定していずれか一方の音声方向推定結果を第1の入力
    方向修正ステップで使用する音声方向推定結果として与
    える有効雑音決定ステップと、を具備することを特徴と
    する雑音抑圧方法。
  7. 【請求項7】請求項5または6いずれか1項に記載の雑
    音抑圧方法において、 前記得られた音声周波数を、周波数帯域毎に分割して帯
    域毎の音声パワーを計算する音声帯域パワー計算ステッ
    プと、 前記得られた雑音周波数成分を、周波数帯域毎に分割し
    て帯域毎の雑音パワーを計算する雑音帯域パワー計算ス
    テップと、 前記音声帯域パワー計算ステップにて得られる音声の周
    波数帯域パワーと、雑音帯域パワー計算ステップにて得
    られる雑音の周波数帯域パワーとに基き、音声信号の周
    波数帯域毎に重みをかけて背景雑音を抑圧するスペクト
    ル減算ステップと、をさらに具備することを特徴とする
    雑音抑圧方法。
  8. 【請求項8】請求項5または6いずれか1項に記載の雑
    音抑圧方法において、 前記得られた音声周波数を、周波数帯域毎に分割して帯
    域毎の音声パワーを計算する音声帯域パワー計算ステッ
    プと、 前記得られた雑音周波数成分を、周波数帯域毎に分割し
    て帯域毎の雑音パワーを計算する雑音帯域パワー計算ス
    テップと、 前記周波数分析ステップにて得られた入力信号の周波数
    スペクトル成分を周波数帯域毎に分割し、帯域毎の入カ
    パワーを計算する入力帯域パワー計算ステップと、 前記入力帯域パワーと音声帯域パワーと雑音帯域パワー
    とに基き、音声信号の周波数帯域毎に重みをかけて背景
    雑音を抑圧する修正スペクトル減算ステップと、を具備
    することを特徴とする雑音抑圧方法。
JP21751998A 1998-07-31 1998-07-31 雑音抑圧処理装置および雑音抑圧処理方法 Expired - Fee Related JP4163294B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP21751998A JP4163294B2 (ja) 1998-07-31 1998-07-31 雑音抑圧処理装置および雑音抑圧処理方法
US09/363,843 US6339758B1 (en) 1998-07-31 1999-07-30 Noise suppress processing apparatus and method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP21751998A JP4163294B2 (ja) 1998-07-31 1998-07-31 雑音抑圧処理装置および雑音抑圧処理方法

Publications (2)

Publication Number Publication Date
JP2000047699A true JP2000047699A (ja) 2000-02-18
JP4163294B2 JP4163294B2 (ja) 2008-10-08

Family

ID=16705520

Family Applications (1)

Application Number Title Priority Date Filing Date
JP21751998A Expired - Fee Related JP4163294B2 (ja) 1998-07-31 1998-07-31 雑音抑圧処理装置および雑音抑圧処理方法

Country Status (2)

Country Link
US (1) US6339758B1 (ja)
JP (1) JP4163294B2 (ja)

Cited By (33)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005121581A (ja) * 2003-10-20 2005-05-12 Mitsubishi Electric Corp レーダ装置
JP2005354223A (ja) * 2004-06-08 2005-12-22 Toshiba Corp 音源情報処理装置、音源情報処理方法、音源情報処理プログラム
JP2006094522A (ja) * 2004-09-23 2006-04-06 Harman Becker Automotive Systems Gmbh ノイズ低減による多重チャンネル適応の音声信号処理
WO2006077745A1 (ja) * 2005-01-20 2006-07-27 Nec Corporation 信号除去方法、信号除去システムおよび信号除去プログラム
JP2007065122A (ja) * 2005-08-30 2007-03-15 Aisin Seiki Co Ltd 車載用音声認識装置の雑音抑圧装置
JP2007215163A (ja) * 2006-01-12 2007-08-23 Kobe Steel Ltd 音源分離装置,音源分離装置用のプログラム及び音源分離方法
US7274794B1 (en) 2001-08-10 2007-09-25 Sonic Innovations, Inc. Sound processing system including forward filter that exhibits arbitrary directivity and gradient response in single wave sound environment
JP2008070372A (ja) * 2006-09-15 2008-03-27 Vlsi Solution Oy 物体追跡装置
JP2008295010A (ja) * 2007-04-26 2008-12-04 Kobe Steel Ltd 目的音抽出装置,目的音抽出プログラム,目的音抽出方法
WO2009001886A1 (ja) * 2007-06-27 2008-12-31 Nec Corporation 信号分析装置と、信号制御装置と、そのシステム、方法及びプログラム
US7478041B2 (en) 2002-03-14 2009-01-13 International Business Machines Corporation Speech recognition apparatus, speech recognition apparatus and program thereof
JP2009506363A (ja) * 2005-08-26 2009-02-12 ステップ・コミュニケーションズ・コーポレーション センサアレイにおけるデバイスおよび/または信号のミスマッチに適応するための方法および装置
US7577262B2 (en) 2002-11-18 2009-08-18 Panasonic Corporation Microphone device and audio player
WO2009131066A1 (ja) * 2008-04-21 2009-10-29 日本電気株式会社 信号分析制御及び信号制御のシステム、装置、方法及びプログラム
JP2010071920A (ja) * 2008-09-22 2010-04-02 Institute Of Nuclear Safety System Inc 超音波探傷法、該方法に用いる超音波探傷プログラム、及び該プログラムを記録した記録媒体
JP2011139378A (ja) * 2009-12-28 2011-07-14 Fujitsu Ltd 信号処理装置、マイクロホン・アレイ装置、信号処理方法、および信号処理プログラム
US8112272B2 (en) 2005-08-11 2012-02-07 Asashi Kasei Kabushiki Kaisha Sound source separation device, speech recognition device, mobile telephone, sound source separation method, and program
JP2012208406A (ja) * 2011-03-30 2012-10-25 Nikon Corp 信号処理装置、撮像装置、および、信号処理プログラム
KR101203926B1 (ko) 2011-04-15 2012-11-22 한양대학교 산학협력단 다중 빔포머를 이용한 잡음 방향 탐지 방법
JP2013168857A (ja) * 2012-02-16 2013-08-29 Jvc Kenwood Corp ノイズ低減装置、音声入力装置、無線通信装置、およびノイズ低減方法
JP2013178110A (ja) * 2012-02-28 2013-09-09 Nippon Telegr & Teleph Corp <Ntt> 音源距離推定装置、直間比推定装置、雑音除去装置、それらの方法、及びプログラム
JP2013543987A (ja) * 2010-10-22 2013-12-09 クゥアルコム・インコーポレイテッド 遠距離場マルチ音源追跡および分離のためのシステム、方法、装置およびコンピュータ可読媒体
KR101364543B1 (ko) * 2011-11-17 2014-02-19 한양대학교 산학협력단 휴대 단말기를 이용한 음향 수신 장치 및 방법
JP2015039208A (ja) * 2011-12-30 2015-02-26 ジーエヌ リザウンド エー/エスGn Resound A/S 信号強調機能を有する補聴器
JPWO2013140733A1 (ja) * 2012-03-23 2015-08-03 パナソニック インテレクチュアル プロパティ コーポレーション オブアメリカPanasonic Intellectual Property Corporation of America 帯域パワー算出装置及び帯域パワー算出方法
CN105679329A (zh) * 2016-02-04 2016-06-15 厦门大学 可适应强烈背景噪声的麦克风阵列语音增强装置
JP2016131343A (ja) * 2015-01-15 2016-07-21 日本電信電話株式会社 収音装置、その方法及びプログラム
JP2017111230A (ja) * 2015-12-15 2017-06-22 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America 音声音響信号符号化装置、音声音響信号復号装置、音声音響信号符号化方法、及び、音声音響信号復号方法
WO2018016044A1 (ja) * 2016-07-21 2018-01-25 三菱電機株式会社 雑音除去装置、エコーキャンセリング装置、異音検出装置および雑音除去方法
WO2020147642A1 (zh) * 2019-01-15 2020-07-23 北京地平线机器人技术研发有限公司 语音信号处理方法、装置、计算机可读介质及电子设备
JP2020141160A (ja) * 2019-02-26 2020-09-03 国立大学法人 筑波大学 音情報処理装置及びプログラム
US10951978B2 (en) 2017-03-21 2021-03-16 Fujitsu Limited Output control of sounds from sources respectively positioned in priority and nonpriority directions
JPWO2022215199A1 (ja) * 2021-04-07 2022-10-13

Families Citing this family (111)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1192838B2 (de) * 1999-06-02 2013-09-04 Siemens Audiologische Technik GmbH Hörhilfsgerät mit richtmikrofonsystem sowie verfahren zum betrieb eines hörhilfsgeräts
JP2001069597A (ja) * 1999-06-22 2001-03-16 Yamaha Corp 音声処理方法及び装置
DE60108752T2 (de) * 2000-05-26 2006-03-30 Koninklijke Philips Electronics N.V. Verfahren zur rauschunterdrückung in einem adaptiven strahlformer
DE10118653C2 (de) * 2001-04-14 2003-03-27 Daimler Chrysler Ag Verfahren zur Geräuschreduktion
JP3940662B2 (ja) * 2001-11-22 2007-07-04 株式会社東芝 音響信号処理方法及び音響信号処理装置及び音声認識装置
US7315623B2 (en) * 2001-12-04 2008-01-01 Harman Becker Automotive Systems Gmbh Method for supressing surrounding noise in a hands-free device and hands-free device
JP2003271191A (ja) * 2002-03-15 2003-09-25 Toshiba Corp 音声認識用雑音抑圧装置及び方法、音声認識装置及び方法並びにプログラム
DE10220520A1 (de) * 2002-05-08 2003-11-20 Sap Ag Verfahren zur Erkennung von Sprachinformation
US7809145B2 (en) * 2006-05-04 2010-10-05 Sony Computer Entertainment Inc. Ultra small microphone array
US7613310B2 (en) * 2003-08-27 2009-11-03 Sony Computer Entertainment Inc. Audio input system
US8073157B2 (en) * 2003-08-27 2011-12-06 Sony Computer Entertainment Inc. Methods and apparatus for targeted sound detection and characterization
US7783061B2 (en) * 2003-08-27 2010-08-24 Sony Computer Entertainment Inc. Methods and apparatus for the targeted sound detection
US7970147B2 (en) * 2004-04-07 2011-06-28 Sony Computer Entertainment Inc. Video game controller with noise canceling logic
US8947347B2 (en) * 2003-08-27 2015-02-03 Sony Computer Entertainment Inc. Controlling actions in a video game unit
US7803050B2 (en) 2002-07-27 2010-09-28 Sony Computer Entertainment Inc. Tracking device with sound emitter for use in obtaining information for controlling game program execution
US8139793B2 (en) * 2003-08-27 2012-03-20 Sony Computer Entertainment Inc. Methods and apparatus for capturing audio signals based on a visual image
US9174119B2 (en) 2002-07-27 2015-11-03 Sony Computer Entertainement America, LLC Controller for providing inputs to control execution of a program when inputs are combined
US8160269B2 (en) 2003-08-27 2012-04-17 Sony Computer Entertainment Inc. Methods and apparatuses for adjusting a listening area for capturing sounds
US8233642B2 (en) * 2003-08-27 2012-07-31 Sony Computer Entertainment Inc. Methods and apparatuses for capturing an audio signal based on a location of the signal
US7174022B1 (en) * 2002-11-15 2007-02-06 Fortemedia, Inc. Small array microphone for beam-forming and noise suppression
KR100493172B1 (ko) * 2003-03-06 2005-06-02 삼성전자주식회사 마이크로폰 어레이 구조, 이를 이용한 일정한 지향성을갖는 빔 형성방법 및 장치와 음원방향 추정방법 및 장치
DE10313331B4 (de) * 2003-03-25 2005-06-16 Siemens Audiologische Technik Gmbh Verfahren zur Bestimmung einer Einfallsrichtung eines Signals einer akustischen Signalquelle und Vorrichtung zur Durchführung des Verfahrens
EP1524879B1 (en) * 2003-06-30 2014-05-07 Nuance Communications, Inc. Handsfree system for use in a vehicle
US20070223732A1 (en) * 2003-08-27 2007-09-27 Mao Xiao D Methods and apparatuses for adjusting a visual image based on an audio signal
US20060147063A1 (en) * 2004-12-22 2006-07-06 Broadcom Corporation Echo cancellation in telephones with multiple microphones
US20060133621A1 (en) * 2004-12-22 2006-06-22 Broadcom Corporation Wireless telephone having multiple microphones
US20070116300A1 (en) * 2004-12-22 2007-05-24 Broadcom Corporation Channel decoding for wireless telephones with multiple microphones and multiple description transmission
US8509703B2 (en) * 2004-12-22 2013-08-13 Broadcom Corporation Wireless telephone with multiple microphones and multiple description transmission
US7983720B2 (en) * 2004-12-22 2011-07-19 Broadcom Corporation Wireless telephone with adaptive microphone array
US8126159B2 (en) * 2005-05-17 2012-02-28 Continental Automotive Gmbh System and method for creating personalized sound zones
US7287309B2 (en) * 2005-05-27 2007-10-30 Brazil Lawrence J Heavy duty clutch installation and removal tool
US8345890B2 (en) 2006-01-05 2013-01-01 Audience, Inc. System and method for utilizing inter-microphone level differences for speech enhancement
US9185487B2 (en) * 2006-01-30 2015-11-10 Audience, Inc. System and method for providing noise suppression utilizing null processing noise subtraction
US8744844B2 (en) 2007-07-06 2014-06-03 Audience, Inc. System and method for adaptive intelligent noise suppression
US8204252B1 (en) 2006-10-10 2012-06-19 Audience, Inc. System and method for providing close microphone adaptive array processing
US8194880B2 (en) 2006-01-30 2012-06-05 Audience, Inc. System and method for utilizing omni-directional microphones for speech enhancement
US8204253B1 (en) 2008-06-30 2012-06-19 Audience, Inc. Self calibration of audio device
US8934641B2 (en) * 2006-05-25 2015-01-13 Audience, Inc. Systems and methods for reconstructing decomposed audio signals
US8949120B1 (en) 2006-05-25 2015-02-03 Audience, Inc. Adaptive noise cancelation
US8849231B1 (en) 2007-08-08 2014-09-30 Audience, Inc. System and method for adaptive power control
US8150065B2 (en) 2006-05-25 2012-04-03 Audience, Inc. System and method for processing an audio signal
JP4867516B2 (ja) * 2006-08-01 2012-02-01 ヤマハ株式会社 音声会議システム
JP5070873B2 (ja) * 2006-08-09 2012-11-14 富士通株式会社 音源方向推定装置、音源方向推定方法、及びコンピュータプログラム
US8259926B1 (en) 2007-02-23 2012-09-04 Audience, Inc. System and method for 2-channel and 3-channel acoustic echo cancellation
US8189766B1 (en) 2007-07-26 2012-05-29 Audience, Inc. System and method for blind subband acoustic echo cancellation postfiltering
JP5070993B2 (ja) * 2007-08-27 2012-11-14 富士通株式会社 音処理装置、位相差補正方法及びコンピュータプログラム
US8428661B2 (en) * 2007-10-30 2013-04-23 Broadcom Corporation Speech intelligibility in telephones with multiple microphones
US9520061B2 (en) * 2008-06-20 2016-12-13 Tk Holdings Inc. Vehicle driver messaging system and method
US9302630B2 (en) * 2007-11-13 2016-04-05 Tk Holdings Inc. System and method for receiving audible input in a vehicle
US8143620B1 (en) 2007-12-21 2012-03-27 Audience, Inc. System and method for adaptive classification of audio sources
US8180064B1 (en) 2007-12-21 2012-05-15 Audience, Inc. System and method for providing voice equalization
JP4957810B2 (ja) * 2008-02-20 2012-06-20 富士通株式会社 音処理装置、音処理方法及び音処理プログラム
US8194882B2 (en) 2008-02-29 2012-06-05 Audience, Inc. System and method for providing single microphone noise suppression fallback
US8355511B2 (en) 2008-03-18 2013-01-15 Audience, Inc. System and method for envelope-based acoustic echo cancellation
US8521530B1 (en) 2008-06-30 2013-08-27 Audience, Inc. System and method for enhancing a monaural audio signal
US8774423B1 (en) 2008-06-30 2014-07-08 Audience, Inc. System and method for controlling adaptivity of signal modification using a phantom coefficient
KR101597752B1 (ko) 2008-10-10 2016-02-24 삼성전자주식회사 잡음 추정 장치 및 방법과, 이를 이용한 잡음 감소 장치
CN101510426B (zh) * 2009-03-23 2013-03-27 北京中星微电子有限公司 一种噪声消除方法及***
FR2948484B1 (fr) * 2009-07-23 2011-07-29 Parrot Procede de filtrage des bruits lateraux non-stationnaires pour un dispositif audio multi-microphone, notamment un dispositif telephonique "mains libres" pour vehicule automobile
KR101581885B1 (ko) * 2009-08-26 2016-01-04 삼성전자주식회사 복소 스펙트럼 잡음 제거 장치 및 방법
JP5304571B2 (ja) * 2009-09-24 2013-10-02 沖電気工業株式会社 集音装置、音響通信システム及びプログラム
KR101129220B1 (ko) * 2009-11-03 2012-03-26 중앙대학교 산학협력단 레인지 영상의 노이즈 제거장치 및 방법
DE102009052992B3 (de) * 2009-11-12 2011-03-17 Institut für Rundfunktechnik GmbH Verfahren zum Abmischen von Mikrofonsignalen einer Tonaufnahme mit mehreren Mikrofonen
US9008329B1 (en) 2010-01-26 2015-04-14 Audience, Inc. Noise reduction using multi-feature cluster tracker
JP5678445B2 (ja) 2010-03-16 2015-03-04 ソニー株式会社 音声処理装置、音声処理方法およびプログラム
US9203489B2 (en) 2010-05-05 2015-12-01 Google Technology Holdings LLC Method and precoder information feedback in multi-antenna wireless communication systems
US9558755B1 (en) 2010-05-20 2017-01-31 Knowles Electronics, Llc Noise suppression assisted automatic speech recognition
KR101702561B1 (ko) * 2010-08-30 2017-02-03 삼성전자 주식회사 음원출력장치 및 이를 제어하는 방법
JP5594133B2 (ja) * 2010-12-28 2014-09-24 ソニー株式会社 音声信号処理装置、音声信号処理方法及びプログラム
WO2012096073A1 (ja) * 2011-01-13 2012-07-19 日本電気株式会社 音声処理装置及びその制御方法とその制御プログラムを格納した記憶媒体、該音声処理装置を備えた車両、情報処理装置及び情報処理システム
WO2012096072A1 (ja) * 2011-01-13 2012-07-19 日本電気株式会社 音声処理装置及びその制御方法とその制御プログラムを格納した記憶媒体、該音声処理装置を備えた車両、情報処理装置及び情報処理システム
GB2490092B (en) * 2011-02-16 2018-04-11 Skype Processing audio signals
JP5643686B2 (ja) * 2011-03-11 2014-12-17 株式会社東芝 音声判別装置、音声判別方法および音声判別プログラム
GB2493327B (en) 2011-07-05 2018-06-06 Skype Processing audio signals
US20130054233A1 (en) * 2011-08-24 2013-02-28 Texas Instruments Incorporated Method, System and Computer Program Product for Attenuating Noise Using Multiple Channels
US9031259B2 (en) * 2011-09-15 2015-05-12 JVC Kenwood Corporation Noise reduction apparatus, audio input apparatus, wireless communication apparatus, and noise reduction method
US9711127B2 (en) 2011-09-19 2017-07-18 Bitwave Pte Ltd. Multi-sensor signal optimization for speech communication
GB2495278A (en) 2011-09-30 2013-04-10 Skype Processing received signals from a range of receiving angles to reduce interference
GB2495130B (en) 2011-09-30 2018-10-24 Skype Processing audio signals
GB2495472B (en) 2011-09-30 2019-07-03 Skype Processing audio signals
GB2495131A (en) 2011-09-30 2013-04-03 Skype A mobile device includes a received-signal beamformer that adapts to motion of the mobile device
GB2495128B (en) 2011-09-30 2018-04-04 Skype Processing signals
GB2495129B (en) * 2011-09-30 2017-07-19 Skype Processing signals
GB2496660B (en) 2011-11-18 2014-06-04 Skype Processing audio signals
GB201120392D0 (en) 2011-11-25 2012-01-11 Skype Ltd Processing signals
GB2497343B (en) 2011-12-08 2014-11-26 Skype Processing audio signals
US10107887B2 (en) 2012-04-13 2018-10-23 Qualcomm Incorporated Systems and methods for displaying a user interface
KR101987966B1 (ko) * 2012-09-03 2019-06-11 현대모비스 주식회사 차량용 어레이 마이크의 음성 인식 향상 시스템 및 그 방법
US9640194B1 (en) 2012-10-04 2017-05-02 Knowles Electronics, Llc Noise suppression for speech processing based on machine-learning mask estimation
US9078057B2 (en) * 2012-11-01 2015-07-07 Csr Technology Inc. Adaptive microphone beamforming
US9813262B2 (en) 2012-12-03 2017-11-07 Google Technology Holdings LLC Method and apparatus for selectively transmitting data using spatial diversity
US9591508B2 (en) 2012-12-20 2017-03-07 Google Technology Holdings LLC Methods and apparatus for transmitting data between different peer-to-peer communication groups
JP6074263B2 (ja) * 2012-12-27 2017-02-01 キヤノン株式会社 雑音抑圧装置及びその制御方法
US9979531B2 (en) 2013-01-03 2018-05-22 Google Technology Holdings LLC Method and apparatus for tuning a communication device for multi band operation
US10229697B2 (en) * 2013-03-12 2019-03-12 Google Technology Holdings LLC Apparatus and method for beamforming to obtain voice and noise signals
US9338551B2 (en) * 2013-03-15 2016-05-10 Broadcom Corporation Multi-microphone source tracking and noise suppression
US9536540B2 (en) 2013-07-19 2017-01-03 Knowles Electronics, Llc Speech signal separation and synthesis based on auditory scene analysis and speech modeling
US11199906B1 (en) 2013-09-04 2021-12-14 Amazon Technologies, Inc. Global user input management
US9386542B2 (en) 2013-09-19 2016-07-05 Google Technology Holdings, LLC Method and apparatus for estimating transmit power of a wireless device
US9549290B2 (en) 2013-12-19 2017-01-17 Google Technology Holdings LLC Method and apparatus for determining direction information for a wireless device
US9554208B1 (en) * 2014-03-28 2017-01-24 Marvell International Ltd. Concurrent sound source localization of multiple speakers
US9491007B2 (en) 2014-04-28 2016-11-08 Google Technology Holdings LLC Apparatus and method for antenna matching
US9478847B2 (en) 2014-06-02 2016-10-25 Google Technology Holdings LLC Antenna system and method of assembly for a wearable electronic device
CN106797512B (zh) 2014-08-28 2019-10-25 美商楼氏电子有限公司 多源噪声抑制的方法、***和非瞬时计算机可读存储介质
US9747920B2 (en) * 2015-12-17 2017-08-29 Amazon Technologies, Inc. Adaptive beamforming to create reference channels
US11017793B2 (en) * 2015-12-18 2021-05-25 Dolby Laboratories Licensing Corporation Nuisance notification
US9640197B1 (en) * 2016-03-22 2017-05-02 International Business Machines Corporation Extraction of target speeches
CN106710601B (zh) * 2016-11-23 2020-10-13 合肥美的智能科技有限公司 一种语音信号降噪拾音处理方法和装置及冰箱
US10638224B2 (en) * 2017-01-03 2020-04-28 Koninklijke Philips N.V. Audio capture using beamforming
US10229698B1 (en) * 2017-06-21 2019-03-12 Amazon Technologies, Inc. Playback reference signal-assisted multi-microphone interference canceler
CN115631764A (zh) * 2022-10-21 2023-01-20 深圳看到科技有限公司 分布式麦克风的音频同步方法、装置和存储介质

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3279612B2 (ja) * 1991-12-06 2002-04-30 ソニー株式会社 雑音低減装置
US5511128A (en) * 1994-01-21 1996-04-23 Lindemann; Eric Dynamic intensity beamforming system for noise reduction in a binaural hearing aid
JP2758846B2 (ja) * 1995-02-27 1998-05-28 埼玉日本電気株式会社 ノイズキャンセラ装置
JPH10105191A (ja) * 1996-09-30 1998-04-24 Toshiba Corp 音声認識装置及びマイクロホン周波数特性変換方法
JP2950260B2 (ja) * 1996-11-22 1999-09-20 日本電気株式会社 雑音抑圧送話装置
JP3795610B2 (ja) 1997-01-22 2006-07-12 株式会社東芝 信号処理装置
US6049607A (en) * 1998-09-18 2000-04-11 Lamar Signal Processing Interference canceling method and apparatus

Cited By (47)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7274794B1 (en) 2001-08-10 2007-09-25 Sonic Innovations, Inc. Sound processing system including forward filter that exhibits arbitrary directivity and gradient response in single wave sound environment
US7720679B2 (en) 2002-03-14 2010-05-18 Nuance Communications, Inc. Speech recognition apparatus, speech recognition apparatus and program thereof
US7478041B2 (en) 2002-03-14 2009-01-13 International Business Machines Corporation Speech recognition apparatus, speech recognition apparatus and program thereof
US7577262B2 (en) 2002-11-18 2009-08-18 Panasonic Corporation Microphone device and audio player
JP2005121581A (ja) * 2003-10-20 2005-05-12 Mitsubishi Electric Corp レーダ装置
JP2005354223A (ja) * 2004-06-08 2005-12-22 Toshiba Corp 音源情報処理装置、音源情報処理方法、音源情報処理プログラム
US8194872B2 (en) 2004-09-23 2012-06-05 Nuance Communications, Inc. Multi-channel adaptive speech signal processing system with noise reduction
JP2006094522A (ja) * 2004-09-23 2006-04-06 Harman Becker Automotive Systems Gmbh ノイズ低減による多重チャンネル適応の音声信号処理
US7925504B2 (en) 2005-01-20 2011-04-12 Nec Corporation System, method, device, and program for removing one or more signals incoming from one or more directions
WO2006077745A1 (ja) * 2005-01-20 2006-07-27 Nec Corporation 信号除去方法、信号除去システムおよび信号除去プログラム
US8112272B2 (en) 2005-08-11 2012-02-07 Asashi Kasei Kabushiki Kaisha Sound source separation device, speech recognition device, mobile telephone, sound source separation method, and program
JP2009506363A (ja) * 2005-08-26 2009-02-12 ステップ・コミュニケーションズ・コーポレーション センサアレイにおけるデバイスおよび/または信号のミスマッチに適応するための方法および装置
JP2007065122A (ja) * 2005-08-30 2007-03-15 Aisin Seiki Co Ltd 車載用音声認識装置の雑音抑圧装置
JP2007215163A (ja) * 2006-01-12 2007-08-23 Kobe Steel Ltd 音源分離装置,音源分離装置用のプログラム及び音源分離方法
JP2008070372A (ja) * 2006-09-15 2008-03-27 Vlsi Solution Oy 物体追跡装置
JP4519900B2 (ja) * 2007-04-26 2010-08-04 株式会社神戸製鋼所 目的音抽出装置,目的音抽出プログラム,目的音抽出方法
JP2008295010A (ja) * 2007-04-26 2008-12-04 Kobe Steel Ltd 目的音抽出装置,目的音抽出プログラム,目的音抽出方法
JP5556175B2 (ja) * 2007-06-27 2014-07-23 日本電気株式会社 信号分析装置と、信号制御装置と、そのシステム、方法及びプログラム
WO2009001886A1 (ja) * 2007-06-27 2008-12-31 Nec Corporation 信号分析装置と、信号制御装置と、そのシステム、方法及びプログラム
US9905242B2 (en) 2007-06-27 2018-02-27 Nec Corporation Signal analysis device, signal control device, its system, method, and program
WO2009131066A1 (ja) * 2008-04-21 2009-10-29 日本電気株式会社 信号分析制御及び信号制御のシステム、装置、方法及びプログラム
US8509092B2 (en) 2008-04-21 2013-08-13 Nec Corporation System, apparatus, method, and program for signal analysis control and signal control
JP2010071920A (ja) * 2008-09-22 2010-04-02 Institute Of Nuclear Safety System Inc 超音波探傷法、該方法に用いる超音波探傷プログラム、及び該プログラムを記録した記録媒体
JP2011139378A (ja) * 2009-12-28 2011-07-14 Fujitsu Ltd 信号処理装置、マイクロホン・アレイ装置、信号処理方法、および信号処理プログラム
JP2013543987A (ja) * 2010-10-22 2013-12-09 クゥアルコム・インコーポレイテッド 遠距離場マルチ音源追跡および分離のためのシステム、方法、装置およびコンピュータ可読媒体
US9100734B2 (en) 2010-10-22 2015-08-04 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for far-field multi-source tracking and separation
JP2012208406A (ja) * 2011-03-30 2012-10-25 Nikon Corp 信号処理装置、撮像装置、および、信号処理プログラム
US9734840B2 (en) 2011-03-30 2017-08-15 Nikon Corporation Signal processing device, imaging apparatus, and signal-processing program
KR101203926B1 (ko) 2011-04-15 2012-11-22 한양대학교 산학협력단 다중 빔포머를 이용한 잡음 방향 탐지 방법
KR101364543B1 (ko) * 2011-11-17 2014-02-19 한양대학교 산학협력단 휴대 단말기를 이용한 음향 수신 장치 및 방법
JP2015039208A (ja) * 2011-12-30 2015-02-26 ジーエヌ リザウンド エー/エスGn Resound A/S 信号強調機能を有する補聴器
JP2013168857A (ja) * 2012-02-16 2013-08-29 Jvc Kenwood Corp ノイズ低減装置、音声入力装置、無線通信装置、およびノイズ低減方法
JP2013178110A (ja) * 2012-02-28 2013-09-09 Nippon Telegr & Teleph Corp <Ntt> 音源距離推定装置、直間比推定装置、雑音除去装置、それらの方法、及びプログラム
JPWO2013140733A1 (ja) * 2012-03-23 2015-08-03 パナソニック インテレクチュアル プロパティ コーポレーション オブアメリカPanasonic Intellectual Property Corporation of America 帯域パワー算出装置及び帯域パワー算出方法
JP2016131343A (ja) * 2015-01-15 2016-07-21 日本電信電話株式会社 収音装置、その方法及びプログラム
JP2017111230A (ja) * 2015-12-15 2017-06-22 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America 音声音響信号符号化装置、音声音響信号復号装置、音声音響信号符号化方法、及び、音声音響信号復号方法
CN105679329A (zh) * 2016-02-04 2016-06-15 厦门大学 可适应强烈背景噪声的麦克风阵列语音增强装置
CN105679329B (zh) * 2016-02-04 2019-08-06 厦门大学 可适应强烈背景噪声的麦克风阵列语音增强装置
WO2018016044A1 (ja) * 2016-07-21 2018-01-25 三菱電機株式会社 雑音除去装置、エコーキャンセリング装置、異音検出装置および雑音除去方法
US10951978B2 (en) 2017-03-21 2021-03-16 Fujitsu Limited Output control of sounds from sources respectively positioned in priority and nonpriority directions
WO2020147642A1 (zh) * 2019-01-15 2020-07-23 北京地平线机器人技术研发有限公司 语音信号处理方法、装置、计算机可读介质及电子设备
US11817112B2 (en) 2019-01-15 2023-11-14 Beijing Horizon Robotics Technology Research And Development Co., Ltd. Method, device, computer readable storage medium and electronic apparatus for speech signal processing
JP2020141160A (ja) * 2019-02-26 2020-09-03 国立大学法人 筑波大学 音情報処理装置及びプログラム
JP7182168B2 (ja) 2019-02-26 2022-12-02 国立大学法人 筑波大学 音情報処理装置及びプログラム
JPWO2022215199A1 (ja) * 2021-04-07 2022-10-13
WO2022215199A1 (ja) * 2021-04-07 2022-10-13 三菱電機株式会社 情報処理装置、出力方法、及び出力プログラム
JP7270869B2 (ja) 2021-04-07 2023-05-10 三菱電機株式会社 情報処理装置、出力方法、及び出力プログラム

Also Published As

Publication number Publication date
US6339758B1 (en) 2002-01-15
JP4163294B2 (ja) 2008-10-08

Similar Documents

Publication Publication Date Title
JP2000047699A (ja) 雑音抑圧処理装置および雑音抑圧処理方法
JP2001100800A (ja) 雑音成分抑圧処理装置および雑音成分抑圧処理方法
EP0954850B1 (en) Audio processing arrangement with multiple sources
US7577262B2 (en) Microphone device and audio player
US7289586B2 (en) Signal processing apparatus and method
CN110140360B (zh) 使用波束形成的音频捕获的方法和装置
US8965003B2 (en) Signal processing using spatial filter
CN110249637B (zh) 使用波束形成的音频捕获装置和方法
US10887691B2 (en) Audio capture using beamforming
KR20040044982A (ko) 선택적인 사운드 증강
JP3582712B2 (ja) 収音方法および収音装置
JP2004187283A (ja) マイクロホン装置および再生装置
WO2009042385A1 (en) Method and apparatus for generating an audio signal from multiple microphones
WO2007123047A1 (ja) 適応アレイ制御装置、方法、プログラム、及びこれを利用した適応アレイ処理装置、方法、プログラム
JP3677143B2 (ja) 音声処理方法および装置
JP6943120B2 (ja) 収音装置、プログラム及び方法
JP6840302B2 (ja) 情報処理装置、プログラム及び情報処理方法
JP3540988B2 (ja) 発音体指向性補正方法およびその装置
JP5170465B2 (ja) 音源分離装置、方法及びプログラム
JP6624255B1 (ja) 収音装置、プログラム及び方法
JPS6214139B2 (ja)
JP2024027617A (ja) 音声認識装置、音声認識プログラム、音声認識方法、収音装置、収音プログラム及び収音方法
Ozawa et al. Noise reduction using an eyeglass-frame microphone array based on DOA estimation by LASSO

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050311

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20070827

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20071106

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20071226

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20080722

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20080724

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110801

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110801

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110801

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120801

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120801

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130801

Year of fee payment: 5

LAPS Cancellation because of no payment of annual fees