JP2000047699A

JP2000047699A - 雑音抑圧処理装置および雑音抑圧処理方法

Info

Publication number: JP2000047699A
Application number: JP10217519A
Authority: JP
Inventors: Hiroshi Kanazawa; 博史金澤; Masami Akamine; 政巳赤嶺
Original assignee: Toshiba Corp
Current assignee: Toshiba Corp
Priority date: 1998-07-31
Filing date: 1998-07-31
Publication date: 2000-02-18
Anticipated expiration: 2018-07-31
Also published as: US6339758B1; JP4163294B2

Abstract

(57)【要約】【課題】計算量を大幅に削減できる雑音抑圧処理を可能
にすること。【解決手段】話者音声を異なる複数位置で検出する手段
11と、この受音位置別音声信号毎に周波数分析して各チ
ャンネル(ch)別の周波数成分を得る分析手段12と、この
各chの周波数成分について所望方向外の感度が低くなる
ように計算したフィルタ(F)係数によるフィルタ(F)処理
により話者方向の雑音を抑圧し、目的音声成分を得る第
１ビームフォーマ処理手段(B1)13と、分析手段にて得た
複数chの周波数成分について所望方向外を低感度化する
Ｆ処理により話者音声を抑圧し、雑音成分を得る第２ビ
ームフォーマ処理手段(B2)16と、B1のＦ係数から雑音方
向を推定し、B2のＦ係数から目的音方向を推定する推定
手段17,18と、B1において入力対象となる目的音の到来
方向である第１入力方向を、推定手段の推定目的音方向
に基づき修正し、B2において入力対象とする雑音の到来
方向である第２入力方向を、推定手段の推定雑音方向に
基づき修正する修正手段14,15を具備する。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は複数のマイクロホン
を用いて雑音を抑圧し、目的の音声を取り出す雑音抑圧
装置に関する。

【０００２】

【従来の技術】環境下には種々の雑音源があることか
ら、マイクロホンで音声信号を取り込む場合において
も、周囲から紛れ込む雑音を避けることは難しい。しか
し、雑音が混入した音声信号を再生すると、目的の音声
が聴き辛いものとなるから、雑音成分の低減処理が必要
となる。

【０００３】ところで、音声に紛れる雑音の低減処理技
術として、従来より知られているものに、複数のマイク
ロホンを用いて雑音を抑圧する技術がある。そして、こ
のマイクロホン処理技術は、音声認識装置やテレビ会議
装置などの音声入力を目的として従来から多くの研究者
によって技術開発に力が注がれている。中でも、少ない
マイクロホン数で大きな効果が得られる適応ビームフォ
ーマ処理技術を利用したマイクロホンアレイに関して
は、文献１（電子情報通信学会編：音響システムとデジ
タル処理）あるいは文献２（Heykin著；Adaptive Filt
er Theory（Plentice Hall））に述べられているよう
に、一般化サイドロープキャンセラ（ＧＳＣ）、フロス
ト型ビームフォーマ、参照信号法など、種々の方法が知
られている。

【０００４】なお、適応ビームフォーマ処理と云うの
は、一般には、妨害雑音の到来方向に死角を形成したフ
ィルタにより雑音を抑圧する処理である。しかしなが
ら、この適応ビームフォーマ処理技術においては、実際
の目的信号の到来方向が、仮定した到来方向と異なる場
合、その目的信号が雑音と見做されて除去されてしまう
ことから、性能が劣化するという問題を抱えている。

【０００５】そこで、これを改善すべく、例えば文献３
（宝珠山他：“ブロッキング行列にリーク適応フィルタ
を用いたロバスト一般化サイドローブキャンセラ”、電
子情報通信学会論文誌ＡＶｏｌ．Ｊ７９−ＡＮ
ｏ．９ｐｐ１５１６−１５２４（１９９６．９））に
開示されているように、仮定した到来方向と実際の到来
方向とのずれを許容するような技術が開発されている
が、この場合、目的信号の除去は軽減されても、実際の
到来方向と仮定した到来方向とのずれにより、目的信号
が歪むおそれがある。

【０００６】これに対し、例えば、特開平９‐９７９４
号公報において、複数のビームフォーマを用いて、話者
方向を逐次検知してその方向にビームフォーマの入力方
向を修正することで、話者の方向を追尾し、目的信号の
歪みを小さくする方法も開示されている。

【０００７】しかしながら、特開平９‐９７９４号公報
に開示されている方法は、時間領域の適応フィルタ処理
を行っているため、フィルタ係数から話者方向を推定す
る際、時間領域のフィルタ係数から周波数領域への変換
が必要であり、計算量が大きくなる。

【０００８】

【発明が解決しようとする課題】音声の雑音を抑圧する
技術として、複数本のマイクロホンを用い、これらのマ
イクロホンで、話者の音声を取り込むと共に、妨害雑音
の到来方向に死角を形成したフィルタを通すことによ
り、雑音成分を抑圧する適応ビームフォーマ処理技術が
ある。

【０００９】この適応ビームフォーマ処理技術において
は、実際の目的信号の到来方向、すなわち、話者のいる
方向が、予め仮定した到来方向と異なる場合、目的信号
が雑音と見做されて除去され、音声収集性能が劣化する
という問題を抱えている。

【００１０】そこで、これを改善すべく、仮定した到来
方向と実際の到来方向とのずれを許容するような技術が
開発されているが、この場合、目的信号の除去は軽減さ
れても、実際の到来方向と仮定した到来方向とのずれに
より、目的信号が歪む心配があり、得られる音声の品質
の問題を残している。

【００１１】また、複数のビームフォーマを用い、話者
方向を逐次検知してその方向にビームフォーマの入力方
向を修正することで、話者の方向を追尾し、目的信号の
歪みを小さくする方法も提案されている。しかしなが
ら、この方法は、時間領域の適応フィルタ処理を行って
いるため、フィルタ係数から話者方向を推定する際、時
間領域のフィルタ係数から周波数領域への変換が必要で
あり、計算量が大きくなるという問題があった。

【００１２】故に、従来の技術はいずれも一長一短であ
り、高品位に目的信号を収集できると共に、処理時間も
短時間で済むようなビームフォーマ処理技術の開発が嘱
望されている。

【００１３】そこで、この発明の目的とするところは、
周波数領域で動作するビームフォーマを用いることで、
計算量を大幅に削減する雑音抑圧処理装置および雑音抑
圧処理方法を提供することにある。

【００１４】

【課題を解決するための手段】上記目的を達成するた
め、本発明は次のように構成する。

【００１５】［１］第１には、話者の発声した音声を
少なくとも異なる２箇所以上の位置で受音する音声入力
手段と、前記受音位置に対応する音声信号のチャネル毎
に周波数分析を行って複数チャネルの周波数成分を出力
する周波数分析手段と、この周波数分析手段にて得られ
る前記複数チャネルの周波数成分について、所望方向外
の感度が低くなるように計算したフィルタ係数を用いて
の適応フィルタ処理を施すことにより前記話者方向から
の音声以外の音声を抑圧する到来雑音抑圧処理を行い、
目的音声成分を得る第１のビームフォーマ処理手段と、
前記周波数分析手段にて得られる前記複数チャネルの周
波数成分について、所望方向外の感度が低くなるように
計算したフィルタ係数を用いての適応フィルタ処理を施
すことにより前記話者方向からの音声を抑圧し、雑音成
分を得る第２のビームフォーマ処理手段と、前記第１の
ビームフォーマ処理手段で計算されるフィルタ係数から
雑音方向を推定する雑音方向推定手段と、前記第２のビ
ームフォーマ処理手段で計算されるフィルタ係数から目
的音方向を推定する目的音方向推定手段と、前記第１の
ビームフォーマにおいて入力対象となる目的音の到来方
向である第１の入力方向を、前記目的音方向推定手段で
推定された目的音方向に基づいて逐次修正する目的音方
向修正手段と、前記第２のビームフォーマにおいて入力
対象とする雑音の到来方向である第２の入力方向を、前
記雑音方向推定手段で推定された雑音方向に基づいて逐
次修正する雑音方向修正手段とを具備する。

【００１６】［２］また、第２には、本発明は、話者の
発声した音声を少なくとも異なる２箇所以上の位置で受
音する音声入力手段と、前記受音位置に対応する音声信
号のチャネル毎に周波数分析を行って複数チャネルの周
波数成分を出力する周波数分析手段と、この周波数分析
手段にて得られる前記複数チャネルの周波数成分につい
て、所望方向外の感度が低くなるように計算したフィル
タ係数を用いての適応フィルタ処理を施すことにより前
記話者方向からの音声以外の音声を抑圧する到来雑音抑
圧処理を行い、目的音声成分を得る第１のビームフォー
マ処理手段と、前記周波数分析手段にて得られる前記複
数チャネルの周波数成分について、所望方向外の感度が
低くなるように計算したフィルタ係数を用いての適応フ
ィルタ処理を施すことにより前記話者方向からの音声を
抑圧し、第１の雑音成分を得る第２のビームフォーマ処
理手段と、前記周波数分析手段にて得られる前記複数チ
ャネルの周波数成分について、所望方向外の感度が低く
なるように計算したフィルタ係数を用いての適応フィル
タ処理を施すことにより前記話者方向からの音声を抑圧
し、第２の雑音成分を得る第２のビームフォーマ処理手
段と、前記第１のビームフォーマ処理手段で計算される
フィルタ係数から雑音方向を推定する雑音方向推定手段
と、前記第２のビームフォーマ処理手段で計算されるフ
ィルタ係数から第１の目的音方向を推定する第１の目的
音方向推定手段と、前記第３の適応ビームフォーマ処理
手段で計算されるフィルタ係数から第２の目的音方向を
推定する第２の目的音方向推定手段と、前記第１のビー
ムフォーマにおいて入力対象とする目的音の到来方向で
ある第１の入力方向を、前記第１の目的音方向推定手段
で推定された第１の目的音方向と、第２の目的音方向推
定手段で推定された第２の目的音方向のいずれか一方ま
たは両方に基づいて逐次修正する第１の入力方向修正手
段と、前記雑音方向修正手段で推定された雑音方向が所
定の第１の範囲にある場合に、前記第２のビームフォー
マにおいて入力対象とする雑音の到来方向である第２の
入力方向を該雑音方向に基づいて逐次修正する第２の入
力方向修正手段と、前記雑音方向修正手段で推定された
雑音方向が所定の第２の範囲にある場合に、前記第３の
ビームフォーマにおいて入力対象とする雑音の到来方向
である第３の入力方向を該雑音方向に基づいて逐次修正
する第３の入力方向修正手段と、前記雑音方向推定手段
で推定された雑音方向が所定の第１の範囲から到来した
か所定の第２の範囲から到来したかに基づいて前記第１
の出力雑音と前記第２の出力雑音のいずれか一方を真の
雑音出力と決定していずれか一方の雑音を出力すると同
時に、第１の音声方向推定手段と第２の音声方向推定手
段のいずれの推定結果が有効であるかを決定していずれ
か一方の音声方向推定結果を第１の入力方向修正手段へ
出力する有効雑音決定手段とを具備する。

【００１７】［３］更に第３には、本発明は、上記
［１］項または［２］項いずれかに記載の雑音抑圧装置
において、前記得られた音声周波数を、周波数帯域毎に
分割して帯域毎の音声パワーを計算する音声帯域パワー
計算手段と、前記得られた雑音周波数成分を、周波数帯
域毎に分割して帯域毎の雑音パワーを計算する雑音帯域
パワー計算手段と、前記音声帯域パワー計算手段と雑音
帯域パワー計算手段とから得られる音声と雑音の周波数
帯域パワーに基き、音声信号の周波数帯域毎に重みをか
けて背景雑音を抑圧するスペクトル減算手段とからなる
スペクトル減算雑音抑圧手段をさらに具備することを特
徴とする。

【００１８】［４］更に第４には、本発明は、上記
［１］項または［２］項いずれかに記載の雑音抑圧装置
において、前記得られた音声周波数を、周波数帯域毎に
分割して帯域毎の音声パワーを計算する音声帯域パワー
計算手段と、前記得られた雑音周波数成分を、周波数帯
域毎に分割して帯域毎の雑音パワーを計算する雑音帯域
パワー計算手段と、前記音声入力手段から得られた入力
信号を周波数分析した入力信号の周波数成分を周波数帯
域毎に分割し、帯域毎の入カパワーを計算する入力帯域
パワー計算手段と、前記入力帯域パワーと音声帯域パワ
ーと雑音帯域パワーとに基き、音声信号の周波数帯域毎
に重みをかけて背景雑音を抑圧する修正スペクトル減算
手段を具備することを特徴とする。

【００１９】そして、上記［１］の構成の場合、話者の
発声した音声を異なる２箇所以上の位置で音声入力手段
は受音し、周波数分析手段では、これを前記受音位置に
対応する音声信号のチャネル毎に周波数分析して複数チ
ャネルの周波数成分を出力する。そして、第１のビーム
フォーマ処理手段はこの周波数分析手段にて得られる前
記複数チャネルの周波数成分について、所望方向外の感
度が低くなるように計算したフィルタ係数を用いての適
応フィルタ処理を施すことにより前記話者方向からの音
声以外の音声を抑圧する到来雑音抑圧処理を行い、目的
音声成分を得、また、第２のビームフォーマ処理手段
は、前記周波数分析手段にて得られる前記複数チャネル
の周波数成分について、所望方向外の感度が低くなるよ
うに計算したフィルタ係数を用いての適応フィルタ処理
を施すことにより前記話者方向からの音声を抑圧し、雑
音成分を得る。そして、雑音方向推定手段は、前記第１
のビームフォーマ処理手段で計算されるフィルタ係数か
ら雑音方向を推定し、目的音方向推定手段は、前記第２
のビームフォーマ処理手段で計算されるフィルタ係数か
ら目的音方向を推定する。目的音方向修正手段は、前記
第１のビームフォーマにおいて入力対象となる目的音の
到来方向である第１の入力方向を、前記目的音方向推定
手段で推定された目的音方向に基づいて逐次修正するの
で、第１のビームフォーマは第１の入力方向以外から到
来する雑音成分を抑圧して話者の音声成分を低雑音で抽
出することになる。また、雑音方向修正手段は、前記第
２のビームフォーマにおいて入力対象とする雑音の到来
方向である第２の入力方向を、前記雑音方向推定手段で
推定された雑音方向に基づいて逐次修正するので、第２
のビームフォーマは第２の入力方向以外から到来する成
分を抑圧して話者の音声成分を抑圧した残りの雑音成分
を抽出することになる。

【００２０】このように本システムは雑音成分を抑圧し
た音声周波数成分と、音声成分を抑圧した雑音周波数成
分とを別々に得ることができるが、この発明の最大の特
徴は、第１及び第２のビームフォーマとして、周波数領
域で動作するビームフォーマを用いるようにした点にあ
る。そして、このことによって、計算量を大幅に削減す
ることができるようにしている。

【００２１】そしてこの発明によると、適応フィルタの
処理量が大幅に低減されるのに加え、入力音声に対する
周波数分析以外の周波数分析処理を省略することがで
き、かつ、フィルタ演算時に必要であった時間領域から
周波数領域ヘの変換処理も不要となり、全体の演算量を
大幅に削減することができる。

【００２２】すなわち、従来技術では、ビームフォーマ
で抑圧できない拡散性雑音の抑圧処理のために、スペク
トルサブトラクション（以後、ＳＳと略称する）処理
を、ビームフォーマ処理の後に行うようにしており、こ
のＳＳは周波数スペクトルを入力とするため、ＦＦＴ
（高速フーリエ変換）などの周波数分析が従来必要であ
ったが、周波数領域で動作するビームフォーマを用いる
と当該ビームフォーマからは周波数スペクトルが出力さ
れるため、これをＳＳに流用できるので、特別にＳＳの
ためのＦＦＴを実施する従来のＦＦＴ処理工程は省略す
ることができる。故に、全体の演算量を大幅に削減する
ことができる。

【００２３】また、ビームフォーマのフィルタを用いた
方向推定の際に必要であった時間領域から周波数領域へ
の変換処理も不要となり、全体の演算量を大幅に削減す
ることができる。

【００２４】また、［２］の構成の場合、話者の発声し
た音声を異なる２箇所以上の位置で音声入力手段は受音
し、周波数分析手段では、これを前記受音位置に対応す
る音声信号のチャネル毎に周波数分析して複数チャネル
の周波数成分を出力する。そして、第１のビームフォー
マ処理手段はこの周波数分析手段にて得られる前記複数
チャネルの周波数成分について、所望方向外の感度が低
くなるように計算したフィルタ係数を用いての適応フィ
ルタ処理を施すことにより前記話者方向からの音声以外
の音声を抑圧する到来雑音抑圧処理を行い、目的音声成
分を得、また、第２のビームフォーマ処理手段は、前記
周波数分析手段にて得られる前記複数チャネルの周波数
成分について、所望方向外の感度が低くなるように計算
したフィルタ係数を用いての適応フィルタ処理を施すこ
とにより前記話者方向からの音声を抑圧し、雑音成分を
得る。そして、雑音方向推定手段は、前記第１のビーム
フォーマ処理手段で計算されるフィルタ係数から雑音方
向を推定し、目的音方向推定手段は、前記第２のビーム
フォーマ処理手段で計算されるフィルタ係数から目的音
方向を推定する。

【００２５】また、第１の目的音方向推定手段は前記第
２のビームフォーマ処理手段で計算されるフィルタ係数
から第１の目的音方向を推定し、第２の目的音方向推定
手段は、前記第３の適応ビームフォーマ処理手段で計算
されるフィルタ係数から第２の目的音方向を推定する。

【００２６】第１の入力方向修正手段は、前記第１のビ
ームフォーマにおいて入力対象とする目的音の到来方向
である第１の入力方向を、前記第１の目的音方向推定手
段で推定された第１の目的音方向と、第２の目的音方向
推定手段で推定された第２の目的音方向のいずれか一方
または両方に基づいて逐次修正する。そして、第２の入
力方向修正手段は、前記雑音方向修正手段で推定された
雑音方向が所定の第１の範囲にある場合に、前記第２の
ビームフォーマにおいて入力対象とする雑音の到来方向
である第２の入力方向を該雑音方向に基づいて逐次修正
し、第３の入力方向修正手段は、前記雑音方向修正手段
で推定された雑音方向が所定の第２の範囲にある場合
に、前記第３のビームフォーマにおいて入力対象とする
雑音の到来方向である第３の入力方向を該雑音方向に基
づいて逐次修正する。従って、第２の入力方向修正手段
の出力により第２の入力方向を修正される第２のビーム
フォーマは第２の入力方向以外から到来する成分を抑圧
して残りの雑音成分を抽出することになり、また、第３
の入力方向修正手段の出力により第３の入力方向を修正
される第３のビームフォーマは第３の入力方向以外から
到来する成分を抑圧して残りの雑音成分を抽出すること
になる。

【００２７】そして、有効雑音決定手段は、前記雑音方
向推定手段で推定された雑音方向が所定の第１の範囲か
ら到来したか所定の第２の範囲から到来したかに基づい
て前記第１の出力雑音と前記第２の出力雑音のいずれか
一方を真の雑音出力と決定していずれか一方の雑音を出
力すると同時に、第１の音声方向推定手段と第２の音声
方向推定手段のいずれの推定結果が有効であるかを決定
して有効な方の音声方向推定結果を第１の入力方向修正
手段へ出力する。この結果、目的音方向修正手段は、前
記第１のビームフォーマにおいて入力対象となる目的音
の到来方向である第１の入力方向を、前記決定した方の
目的音方向推定手段で得た目的音方向に基づいて逐次修
正するので、第１のビームフォーマは第１の入力方向以
外から到来する雑音成分を抑圧して話者の音声成分を低
雑音で抽出することになる。

【００２８】このように本システムは雑音成分を抑圧し
た音声周波数成分と、音声成分を抑圧した雑音周波数成
分とを別々に得ることができるが、この発明の最大の特
徴は、第１及び第２のビームフォーマとして、周波数領
域で動作するビームフォーマを用いるようにした点にあ
る。そして、このことによって、計算量を大幅に削減す
ることができるようにしている。

【００２９】そしてこの発明によると、適応フィルタの
処理量が大幅に低減されるのに加え、入力音声に対する
周波数分析以外の周波数分析処理を省略することがで
き、かつ、フィルタ演算時に必要であった時間領域から
周波数領域ヘの変換処理も不要となり、全体の演算量を
大幅に削減することができる。

【００３０】また、本発明では、雑音追尾に監視領域を
全く異ならせた雑音追尾用のビームフォーマを設けてあ
り、それぞれの出力からそれぞれ音声方向を推定させる
と共に、それぞれの推定結果からいずれが有効な雑音追
尾をしているかを判断して、有効と判断された方のビー
ムフォーマのフィルタ係数による音声方向の推定結果を
第１の目的音方向修正手段に与えることで第１の目的音
方向修正手段は、前記第１のビームフォーマにおいて入
力対象となる目的音の到来方向である第１の入力方向
を、前記目的音方向推定手段で推定された目的音方向に
基づいて逐次修正するので、第１のビームフォーマは第
１の入力方向以外から到来する雑音成分を抑圧して話者
の音声成分を低雑音で抽出することができ、雑音源が移
動してもこれを見失うことなく追尾して抑圧することが
できるようになるものである。

【００３１】従来技術においては、２ｃｈ、すなわち、
２本のマイクロホンだけでも目的音源の追尾を可能とす
べく、雑音追尾用のビームフォーマを雑音抑圧のビーム
フォーマとは別に１個用いるが、例えば、雑音源が目的
音の方向を横切って移動したような場合、雑音の追尾精
度が低下することがあった。

【００３２】しかし、本発明では、雑音を追尾するビー
ムフォーマを複数用いて各々別個の追尾範囲を受け持つ
ようにしたことにより、上記のような場合でも追尾精度
の低下を抑止できるようになる。

【００３３】また、［３］項の構成の場合、音声帯域パ
ワー計算手段は、得られた音声周波数のスペクトル成分
を、周波数帯域毎に分割して帯域毎の音声パワーを計算
し、雑音帯域パワー計算手段は、前記得られた雑音周波
数のスペクトル成分を、周波数帯域毎に分割して帯域毎
の雑音パワーを計算する。そして、スペクトル減算手段
は、前記音声帯域パワー計算手段と雑音帯域パワー計算
手段とから得られる音声と雑音の周波数帯域パワーに基
き、音声信号の周波数帯域毎に重みをかけて背景雑音を
抑圧する。

【００３４】この構成によれば、ビームフォーマでは抑
圧できない方向性のない雑音（背景雑音）は、本発明シ
ステムのビームフォーマで得ることのできる目的音声成
分と雑音成分を利用し、これをスペクトルサブトラクシ
ョン処理することで抑圧する。すなわち、本システムで
は、ビームフォーマとして目的音声成分抽出用と雑音成
分抽出用の２つのビームフォーマを備えているが、これ
らのビームフォーマの出力である目的音声成分と雑音成
分を利用してスペクトルサブトラクション処理すること
により、方向性のない背景雑音成分の抑圧を行う。スペ
クトルサブトラクション（ＳＳ）処理は雑音抑圧処理と
して知られるが、一般的に行われるスペクトルサブトラ
クション（ＳＳ）処理は、１チャンネルのマイクロホン
（つまり、１本のマイクロホン）を用い、このマイクロ
ホンの出力から音声のない区間において雑音のパワーを
推定するため、非定常な雑音が音声に重畳している場合
には対処できない。また、２チャンネルのマイクロホン
（つまり、２本のマイクロホン）を用いて、一方を雑音
収集用、片方を雑音重畳音声収集用とする場合にも、両
マイクロホンの設置場所を離す必要があり、その結果、
音声に重畳する雑音と、雑音収集用マイクロホンで取り
込む雑音との位相がずれ、スペクトルサブトラクション
処理しても雑音抑圧の改善効果は大きく上がらない。

【００３５】しかし、本発明では、雑音成分を取り出す
ビームフォーマを用意して、このビームフォーマの出力
を用いるようにしたため、位相のずれは補正されてお
り、従って、非定常雑音の場合でも高精度なスペクトル
サブトラクション処理を実現できる。さらに、周波数領
域のビームフォーマの出力を利用しているため、周波数
分析を省略してスペクトルサブトラクションが可能であ
り、従来より少ない演算量で非定常雑音を抑圧できる。

【００３６】更に［４］項の発明は、上記［３］の発明
の雑音抑圧装置において、音声入力手段から得られた入
力信号を周波数分析した入力信号の周波数成分を周波数
帯域毎に分割し、帯域毎の入カパワーを計算する入力帯
域パワー計算手段を設けて、スペクトル減算手段には、
入力帯域パワーと音声帯域パワーと雑音帯域パワーとに
基き、音声信号の周波数帯域毎に重みをかけて背景雑音
を抑圧する処理を実施させるようにしており、この構成
の場合、音声帯域パワー計算手段は、得られた音声周波
数のスペクトル成分を、周波数帯域毎に分割して帯域毎
の音声パワーを計算し、雑音帯域パワー計算手段は、前
記得られた雑音周波数のスペクトル成分を、周波数帯域
毎に分割して帯域毎の雑音パワーを計算する。また、入
力帯域パワー計算手段があり、この入力帯域パワー計算
手段は、音声入力手段から得られた入力信号を周波数分
析して得た入力音声の周波数スペクトル成分を受けて、
これを周波数帯域毎に分割し、帯域毎の入カパワーを計
算する。そして、スペクトル減算手段は、前記音声帯域
パワー計算手段と雑音帯域パワー計算手段とから得られ
る音声と雑音の周波数帯域パワーに基き、音声信号の周
波数帯域毎に重みをかけて背景雑音を抑圧する。

【００３７】この［４］項の発明においては、［３］項
の発明におけるスペクトルサブトラクション（ＳＳ）処
理において、更に雑音成分についてそのパワーを修正す
るようにしたことにより、一層高精度に雑音抑圧を行う
ことを可能とするものである。すなわち、［３］項の発
明では雑音源のパワ−Ｎが小さいという仮定をおいたた
め、スペクトルサブトラクション（ＳＳ）処理を行うと
雑音源の成分が音声に重畳している部分では歪みが大き
くなる可能性が残るが、ここでは入力信号のパワーを用
いて第３の発明でのスペクトルサブトラクション処理に
おける帯域重みの計算を修正するようにした。これによ
り、方向を持つ雑音成分および方向のない雑音成分を抑
圧した歪みの少い音声成分のみの抽出ができるようにな
る。

【００３８】

【発明の実施の形態】以下、本発明の実施の形態につき
図面を参照して説明する。

【００３９】（実施例１）はじめに、実施例１について
説明する。この実施例１は請求項１の内容に相当する。

【００４０】図１は実施例１のシステムの構成例を示す
ブロック図であって、本発明の一実施形態に係る雑音抑
圧装置の基本構成を示すブロック図である。本発明は、
マイクロホン数が２ｃｈ（ｃｈ；チャンネル）すなわ
ち、２本と云った最小の場合でも話者追尾可能とするた
めの技術であるため、ここでは２ｃｈで説明するが、３
ｃｈ以上となった場合でも処理の方法は同様である。

【００４１】図１において、１１は音声入力部、１２は
周波数解析部、１３は第１のビームフォーマ、１４は第
１の入力方向修正部、１５は第２の入力方向修正部、１
６は第２のビームフォーマ、１７は雑音方向推定部、１
８は目的音方向推定部（音声方向推定部）である。

【００４２】これらのうち、音声入力部１１は、例え
ば、音声収集対象である話者の発声した音声（目的音
声）を異なる２箇所以上の位置で受音するためのもので
あり、具体的にはそれぞれ地点を異ならせて設置した２
本のマイクロホンを用いて音声を取り込み、電気信号に
変換するものである。また、周波数分析部１２は、前記
マイクロホンの受音位置に対応する音声信号のチャネル
毎に周波数分析を行って複数チャネルの周波数成分を出
力するものであり、具体的にはここでは第１のマイクロ
ホンのとらえた音声信号（第１チャンネル１ｃｈの音声
信号）および第２のマイクロホンのとらえた音声信号
（第２チャンネル２ｃｈの音声信号）を、それぞれ別々
に高速フーリエ変換するなどして時間領域の信号成分か
ら周波数領域の成分のデータにに変換することにより、
各チャンネル別に周波数スペクトルのデータに変換して
出力するものである。

【００４３】第１のビームフォーマ１３は、この周波数
分析部１２からの複数チャンネルの周波数成分出力、こ
の場合、１ｃｈ，２ｃｈの音声信号を用いて、これより
目的音声の周波数分を抽出するためのものであって、前
記１ｃｈ，２ｃｈそれぞれの周波数成分（周波数スペク
トルデータ）を用いて適応フィルタ処理により目的の音
声以外の到来雑音の抑圧処理を行うことにより、目的と
する音源方向からの周波数成分を抽出するといったこと
を行う処理手段であり、第２のビームフォーマ１６は、
周波数分析部１２からの複数チャンネルの周波数成分出
力、この場合、１ｃｈ，２ｃｈの音声信号を用いて、こ
れより雑音源方向からの周波数成分を抽出するためのも
のであって、前記１ｃｈ，２ｃｈそれぞれの周波数成分
（周波数スペクトルデータ）を用いて適応フィルタ処理
により雑音音源方向からの音声以外の成分の抑圧処理を
行うことにより、雑音源方向からの周波数スペクトル成
分のデータを抽出するといったことを行う処理手段であ
る。

【００４４】また、雑音方向推定部１７は、前記第１の
ビームフォーマ１３で計算されるフィルタ係数から雑音
方向を推定すると云った処理を行うものであって、具体
的には前記第１のビームフォーマ１３の適応フィルタか
ら得られるフィルタリング処理用のフィルタ係数などの
パラメータを用いて雑音方向を推定し、その推定量対応
のデータを出力し、また、目的音方向推定部（音声方向
推定部）１８は、前記第２のビームフォーマ１６で計算
されるフィルタ係数から目的音方向を推定すると云った
処理を行うものであって、具体的には前記第２のビーム
フォーマ１６の適応フィルタで用いられているフィルタ
係数などのパラメータから雑音方向を推定し、その推定
量対応のデータを出力するものである。

【００４５】また、第１の入力方向修正部１４は、本来
の目的音方向にビームフォーマの入力方向を修正するた
めのものであって、前記第１のビームフォーマ１３にお
いて、入力対象とする目的音の到来方向である第１の入
力方向を、前記目的音方向推定部１８で推定された目的
音方向に基づいて逐次方向修正するための出力を発生
し、第１のビームフォーマ１３に与えるものである。具
体的には、第１の入力方向修正部１４は、目的音方向推
定部１８の出力する推定量対応のデータを現在の目的と
する音源方向の角度情報αに変換して目標角度情報αと
して第１のビームフォーマ１３に出力するものである。

【００４６】第２の入力方向修正部１５は第２のビーム
フォーマ１６の入力方向を雑音方向に修正するためのも
のであって、前記第２のビームフォーマ１６において、
入力対象とする雑音の到来方向である第２の入力方向
を、前記雑音方向推定部１７で推定された雑音方向に基
づいて逐次方向修正するための出力を発生し、第２のビ
ームフォーマ１４に与えるものである。具体的には、第
２の入力方向修正部１５は、雑音方向推定部１７の出力
する推定量対応のデータを現在の目的とする雑音源方向
の角度情報に変換して目標角度情報αとして第２のビー
ムフォーマ１６に出力するものである。

【００４７】ここでビームフォーマ１３，１６の構成例
を示しておく。＜ビームフォーマの構成例＞本発明システムで用いるビ
ームフォーマ１３，１６は、図２（ａ）に示すような構
成となる。すなわち、本発明システムにおいて用いられ
るビームフォーマ１３，１６は、入力音声中から抽出し
たい対象となる信号成分を得ることができるようにする
ために、抽出したい対象となる信号成分の到来方向に、
ビームフォーマの入力方向を設定するための移相部１０
０と、抽出したい対象となる信号成分の到来方向以外の
方向からの成分を抑圧するビームフォーマ本体１０１と
から構成される。

【００４８】移相部１００は補正ベクトル生成部１００
ａと乗算手段１００ｂ，１００ｃとから構成され、ビー
ムフォーマ本体１０１は加算手段１０１ａ，１０１ｂ，
１０１ｃと適応フィルタ１０１ｄとから構成される。

【００４９】補正ベクトル生成部１００ａは入力方向修
正部１４または１５からの角度情報αを入力方向の情報
として受けて、これよりα対応の補正ベクトルを生成す
るものであり、乗算手段１００ｂは周波数分析部１２か
ら出力されるｃｈ１の周波数スペクトル成分のデータに
対して補正ベクトル分を乗算して出力するものであり、
乗算手段１００ｃは周波数分析部１２から出力されるｃ
ｈ２の周波数スペクトル成分のデータに対して補正ベク
トル分を乗算して出力するものである。

【００５０】また、加算手段１０１ａは乗算手段１００
ｂの出力と加算手段１００ｃの出力を加算して出力する
ものであり、加算手段１０１ｂは乗算手段１００ｂの出
力と加算手段１００ｃの出力の差分を出力するものであ
り、加算手段１０１ｃは加算手段１０１ａの出力に対す
る適応フィルタ１０１ｄの出力の差分をビームフォーマ
の出力として出力するものであり、適応フィルタ１０１
ｄは加算手段１０１ｂの出力に対してフィルタリング演
算処理して出力するためのデジタルフィルタであって、
加算手段１０１ｃの出力が最小となるようにフィルタ係
数（パラメータ）が逐次変更される構成である。

【００５１】ここで、本例ではマイクロホン構成が２
本、すなわち、第１及び第２のマイクロホンｍ１，ｍ２
を用いる収集音声２チャンネル（ｃｈ１，ｃｈ２）構成
のシステムとしており、この場合、ビームフォーマの入
力方向の設定とは、図２（ｂ）に示すように、入力対象
の存在する方向からの音声信号が等価的に同時に両マイ
クロホンｍ１，ｍ２に到着したと見做せるように、ｃｈ
１，ｃｈ２の２つの音声チャンネルの周波数成分に対し
て遅延を施し、位相を揃える（整相）ようにすることを
指す。これは、図２の構成の場合、入力方向修正部１
４，１５の出力する角度情報α対応に移相部１００で移
相調整することによって実現している。

【００５２】すなわち、図２の構成の場合、移相部１０
０は補正したい入力方向（角度情報α）対応の補正ベク
トルを補正ベクトル生成部１００ａで生成するようにし
ており、この補正ベクトルを１ｃｈ，２ｃｈの各チャン
ネルの信号にそれぞれ乗算する乗算手段１００ｂ，１０
０ｃで乗算する構成とした移相部１００により次のよう
にして位相を揃える。

【００５３】例えば、図２（ｂ）に符号ｍ１，ｍ２を付
して示すような無指向性マイクロホン配置であって、Ｐ
１点に居る目的音源である話者が、あたかもＰ２点に居
るかのように信号に位相補正することを考えてみる。こ
のような場合には、距離ｄだけ離れた第１のマイクロホ
ンｍ１で検出した話者音声信号（ｃｈ１）の位相と第２
のマイクロホンｍ２で検出した話者音声信号（ｃｈ２）
の位相が同じになるように、第１のマイクロホンｍ１の
話者音声信号（ｃｈ１）に伝搬時間差τ τ＝ｒ・ｃ＝ｒ・sinα ｒ＝ｄ・sinα に相当する複素数Ｗ１Ｗ１＝（ cos ｊωτ，sin ｊωτ）の複素共役をかける。ここで、ｃは音速、ｄはマイクロ
ホン間距離、αはマイクロホンｍ１から見た目的音の音
源である話者の移動した角度、ｊは虚数、ωは角周波数
である。

【００５４】つまり、Ｗ１の複素共役をかけたことによ
り、αなる角度に移動した目的音源の音声について注目
すれば、第１のマイクロホンｍ１でとらえた信号（ｃｈ
１）が、第２のマイクロホンｍ２でとらえた信号と同位
相となるように移相制御したことになる。

【００５５】尚、第２のマイクロホンｍ２の信号（ｃｈ
２）には、複素数Ｗ２＝（１，０）の複素共役をかける
ものとする。つまり、これは第２のマイクロホンｍ２の
信号（ｃｈ２）には、角度補正をしないことを意味す
る。

【００５６】ここで、複素数Ｗ１と複素数Ｗ２を並べた
ベクトル｛Ｗ１，Ｗ２｝は、一般に方向ベクトルと呼ば
れ、この｛Ｗ１，Ｗ２｝における複素共役のベクトル共
役｛Ｗ１*，Ｗ２*｝を、補正ベクトルと呼ぶ。

【００５７】角度情報α対応に補正ベクトルを生成さ
せ、ｃｈ１，ｃｈ２の周波数スペクトル成分に対してこ
の補正ベクトルを乗算すれば、第１のマイクロホンｍ１
の出力は、音源がＰ１よりＰ２に移動したにもかかわら
ず、第２のマイクロホンｍ２の位相と同じになるように
補正されたことになり、第１のマイクロホンｍ１に関す
る限り、第２のマイクロホンｍ１，ｍ２のＰ２位置音源
に対する距離はあたかも等しいかたちになる。

【００５８】本実施例では、ビームフォーマは２つある
が、これら２つあるビームフォーマのうち、第１のビー
ムフォーマ１３はその移相部１００により目的音の音源
方向を入力対象方向とするように、ｃｈ１（もしくはｃ
ｈ２）の周波数成分に上述の手法で遅延を施し、第２の
ビームフォーマ１６はその移相部１００により雑音源方
向を入力対象方向とするように、ｃｈ１（もしくはｃｈ
２）の周波数成分に上述の手法で遅延を施してそれぞれ
両者の位相を揃える。ただし、目的音Ｓの到来方向以外
からの音成分、すなわち、雑音成分Ｎについては第１お
よび第２のマイクロホンｍ１，ｍ２ともに位相は全く無
修正であるから、第１のマイクロホンｍ１と第２のマイ
クロホンｍ２で検出されるタイミングに時間差がある。

【００５９】このように移相部１００により、目的音方
向の音源からの検出される音声信号について位相修正し
た第１のマイクロホンｍ１の出力（目的音声成分Ｓと雑
音分Ｎからなるｃｈ１の周波数スペクトルデータ）およ
び修正の加えられない第２のマイクロホンｍ２の出力
（目的音声成分Ｓと雑音分Ｎ′からなるｃｈ２の周波数
スペクトルデータ）は、それぞれ加算手段１０１ａ，１
０１ｂに入力される。そして、加算手段１０１ａではｃ
ｈ１の出力とｃｈ２の出力が加算されることによって目
的音声Ｓの２倍の信号と雑音成分Ｎ＋Ｎ′についてのパ
ワー成分が求められ、加算手段１０１ｂではｃｈ１の出
力（Ｓ＋Ｎ）とｃｈ２の出力（Ｓ＋Ｎ′）の差分（（Ｓ
＋Ｎ）−（Ｓ＋Ｎ′）＝Ｎ−Ｎ′）、つまり、ノイズ分
のパワー成分が求められる。そして、加算手段１０１ｃ
で加算手段１０１ａの出力に対する適応フィルタ１０１
ｄの出力の差分を求め、これをビームフォーマの出力と
すると共に、適応フィルタ１０１ｄにフィードバックす
る。

【００６０】適応フィルタ１０１ｄは加算手段１０１ｂ
の出力に対して現在の探査方向対応の方向から到来した
音の成分の周波数スペクトルが抽出されるようフィルタ
リング演算処理して出力するためのデジタルフィルタで
あり、逐次、角度１°刻みに到来信号の探査角度を可変
していて、入力される信号方向に探査角度が一致したと
き最大の出力を出す。従って、到来信号の入射方向と探
査角度が一致すれば適応フィルタ１０１ｄの出力（Ｎ−
Ｎ′）は最大になる。そして、適応フィルタ１０１ｄの
出力（Ｎ−Ｎ′）は雑音成分のパワーであるから、それ
が最大のときの出力を加算手段１０１ｃに与え、加算手
段１０１ａからの出力（２Ｓ＋Ｎ＋Ｎ′）から差し引け
ば、雑音成分Ｎが最大限キャンセルされて雑音抑圧が成
される。故に、この状態のときは、加算手段１０１ｃの
出力は最小である。

【００６１】そのため、適応フィルタ１０１ｄは加算手
段１０１ｃの出力が最小となるように角度１°刻みの信
号到来方向探査角度（角度１°刻みの方向別感度）とフ
ィルタ係数（パラメータ）を逐次変更させることによ
り、到来信号の入射方向と探査角度（到来信号の入射方
向とその方向に対する感度）が一致することになるか
ら、適応フィルタ１０１ｄはこれらを制御しつつ、加算
手段１０１ｃの出力が最小となるようにする。

【００６２】つまり、この制御の結果、目的方向からの
音声成分をビームフォーマは抽出できることになる。ま
た、雑音成分を目的音として抽出する場合には、上述の
目的音を雑音と見做すようにしたかたちで、上記制御を
施すようにすればよい。

【００６３】なお、ビームフォーマ本体１０１に関して
は、一般化サイドローブキャンセラ（ＧＳＣ）の他に、
フロスト型ビームフォーマなど種々のものが上述同様の
考え方で適用可能であり、従って、本発明では特に限定
はされない。

【００６４】このような構成の本システムの作用を説明
する。本システムは、目的音の音声周波数成分と雑音周
波数成分とを別々に抽出出力する構成としていることを
特徴としている。

【００６５】まず、複数のマイクロホンを持つ音声入力
部１１、この例では第１及び第２の計２本のマイクロホ
ンｍ１，ｍ２を持つ音声入力部１１でｃｈ１，ｃｈ２の
音声を取り込む。そして、この音声入力部１１から入力
された２チャンネル分の音声の信号ｃｈ１，ｃｈ２（す
なわち、第１チャンネルｃｈ１は第１のマイクロホンｍ
１からの音声、第２チャンネルｃｈ２は第２のマイクロ
ホンｍ２からの音声に該当する）は、周波数分析部１２
に送られ、ここで例えば高速フーリエ変換（ＦＦＴ）等
の処理を行うことによって、それぞれのチャンネル別に
周波数成分（周波数スペクトル）が求められる。

【００６６】周波数分析部１２でそれぞれ求められたチ
ャンネル別の周波数成分は、それぞれ第１及び第２のビ
ームフォーマ１３，１６に与えられる。

【００６７】第１のビームフォーマ１３では、２チャン
ネル分の周波数成分入力について、目的音の方向対応に
位相を合わせた上で、周波数領域の適応フィルタにより
上述のようにして処理することで雑音を抑圧し、目的音
の方向の周波数成分を出力する。

【００６８】ここで、具体的に説明すると第１の入力方
向修正部１４は第１のビームフォーマ１３に対して次の
ような角度情報（α）を与える。つまり、第１の入力方
向修正部１４は、与えられる音声方向推定部１８からの
出力を用い、目的音の方向があたかもマイクロホンの正
面方向となるよう、上記２チャンネルの周波数成分の入
力位相を整えるに必要な角度情報（α）を入力方向修正
量として第１のビームフォーマ１３に対して与える。

【００６９】この結果、第１のビームフォーマ１３はこ
の修正量（α）対応に目的音方向を修正し、当該目的音
方向以外の方向から到来する音声を抑圧させるようにす
ることで、雑音成分を抑圧し、目的音を抽出する。

【００７０】すなわち、目的音方向推定部１８は雑音成
分を抽出するための第２のビームフォーマ１６における
適応フィルタのパラメータを用いて雑音源方向を知り、
それを反映させた出力を出し、第１の入力方向修正部１
４ではこの目的音方向推定部１８からの出力対応に入力
方向修正量（α）を発生してこの修正量（α）対応に第
１のビームフォーマ１３における目的音方向を修正し、
これによって第１のビームフォーマ１３に当該目的音方
向以外の方向から到来する音声を抑圧させるようにする
ことで、雑音成分を抑圧し、目的音を抽出する。

【００７１】つまり、第２のビームフォーマ１６の場
合、雑音が目的音であるから、雑音に位相を合わせてい
る。その結果、第２のビームフォーマ１６では話者の音
源は雑音源として扱われ、ビームフォーマの内蔵する適
応フィルタは話者音源からの音を抽出する処理をするこ
とになるので、当該第２のビームフォーマ１６の適応フ
ィルタのパラメータからは話者音源の方向を反映した出
力が得られる。従って、目的音方向推定部１８により、
第２のビームフォーマ１６における適応フィルタのパラ
メータを用いて雑音源方向を知れば、それは目的音であ
る話者音源の方向を反映させたものである。従って、目
的音方向推定部１８により、第２のビームフォーマ１６
における適応フィルタのパラメータを反映させた出力を
出し、第１の入力方向修正部１４でこの目的音方向推定
部１８からの出力対応に入力方向修正量（α）を発生
し、この修正量対応に第１のビームフォーマ１３におけ
る目的音方向を修正すれば、第１のビームフォーマ１３
に当該目的音方向以外の方向から到来する音声を抑圧さ
せることができる。

【００７２】また、第２のビームフォーマ１６では、２
チャンネル分の周波数成分入力に対して、周波数領域の
適応フィルタにより目的音を抑圧し、雑音の方向の周波
数成分を出力する。ここでは、具体的には雑音の方向を
マイクロホンの正面と仮定し、２つのマイクロホンに対
して雑音が同時に到着したと見做せるように、雑音方向
推定部１７からの出力を用いて第２の入力方向修正部５
で位相を整える操作（整相）を行う。

【００７３】すなわち、雑音方向推定部１７では、話者
音声成分を抽出するための第１のビームフォーマ１３に
おける適応フィルタのパラメータを用いて雑音音源方向
を知り、それを反映させた出力を出し、第２の入力方向
修正部１５では雑音方向推定部１７からの出力対応に入
力方向修正量（α）を発生させて第２のビームフォーマ
１６に与えることによって、当該第２のビームフォーマ
１６に当該修正量対応に雑音方向を修正させるように
し、この方向以外の方向から到来する音声を抑圧するこ
とで雑音成分のみを抽出する。

【００７４】ここで、雑音方向推定部１７では、第１の
ビームフォーマ１３の適応フィルタから雑音方向を推定
し、目的音方向推定部１８では、第２のビームフォーマ
１６の適応フィルタから目的音方向を推定する。なお、
これらの処理は、例えば、８［ｍsec］等の短い固定時
間毎に行われる。以降固定時間をフレームと呼ぶ。

【００７５】このようにして、第１のビームフォーマ１
３により、目的音（話者）の音声成分を抽出することが
でき、また、第２のビームフォーマ１６により、雑音成
分を抽出することができる。

【００７６】本装置の設置環境が、静かな会議室であ
り、この会議室にテレビ会議システム設置して当該テレ
ビ会議システムの話者音声抽出のために使用していると
するならば、除去しなければならない雑音と云っても、
そう問題のある大きな妨害音ではないと考えられるの
で、このような場合、第１のビームフォーマ１３によ
り、抽出された目的音（話者）の成分を逆フーリエ変換
して時間領域に戻すことで音声信号に戻し、これをスピ
ーカなどで音声として出力させたり、送信するなどすれ
ば、低雑音化された話者音声として利用できる。

【００７７】ここで、方向推定部１７，１８の処理手順
について触れておく。

【００７８】＜方向推定部の処理手順＞図３に方向推定
部１７，１８の処理手順を示す。

【００７９】この処理はフレーム毎に行われる。まず、
初期設定をする（ステップＳ１）。この初期設定内容と
しては図３に点線枠で囲んで示してあるように、“目的
音の追尾範囲”を“０゜±θｒ（例えば、２０゜）”と
し、それ以外の範囲を雑音の探索範囲として設定する。

【００８０】初期設定が終わったならば、次にステップ
Ｓ２の処理に移る。このステップＳ２では方向ベクトル
を生成する処理を行う。そして、方向別感度計算を行っ
た後、方向別感度周波数累積を行う（ステップＳ３，Ｓ
４）。

【００８１】そして、これを全ての周波数と方向につい
て、実施した後、最小値であるものを求めて、その最小
値となった累積値を持つものの方向を信号到来方向とす
る（ステップＳ５，Ｓ６）。

【００８２】すなわち、具体的にはステップＳ２からＳ
４においては、フィルタ係数Ｗ（ｋ）と方向べクトルＳ
（ｋ，θ）との内積を各周波数成分毎に１゜刻みで所定
の範囲の方向について計算し、対応する方向への感度を
求め、次に、全周波数成分についてその感度を加算する
と云う処理を行う。そして、ステップＳ７，Ｓ８におい
ては、全周波数成分についてその感度を加算した結果と
して得られる各方向別の累積値のうち、その値が最小値
である方向を、信号到来方向とすると云う処理をする。
この図３に示した処理手順は、雑音方向推定部１７およ
び目的音推定部１８ともに同様のものとなる。

【００８３】このようにして、雑音方向推定部１７は雑
音方向の推定を行い、また、目的音推定部１８は目的音
方向の推定を行う。そして、この推定結果はそれぞれの
対応する入力方向修正部１４，１５に与える。

【００８４】雑音方向の推定結果を受け取った第１の入
力方向修正部１４は、前フレームまでの入力方向と現フ
レームの方向推定結果を平均化し、新たな入力方向を計
算してビームフォーマの移相部１００へ出力し、また、
目的音推定結果を受け取った第２の入力方向修正部１５
もまた、前フレームまでの入力方向と現フレームの方向
推定結果を平均化し、新たな入力方向を計算してビーム
フォーマの移相部１００へ出力する。

【００８５】平均化は例えば、係数βを用いて次式のよ
うに行う。

【００８６】θ１（ｎ）＝θ１（ｎ−１）・（１−α）
＋Ｅ（ｎ）・β ここで、θ１は音の入力方向、ｎは処理フレームの番
号、Ｅは現フレームの方向推定結果である。なお、係数
βはビームフォーマの出力パワーに基づいて可変にして
もよい。

【００８７】ビームフォーマがＧＳＣである場合に、従
来、方向推定の際、時間領域のフィルタ係数から周波数
領域への変換が必要であったが、本発明ではＧＳＣの適
応フィルタが周波数スペクトルに対して方向性感度を以
てフィルタ演算処理し、目的方向外の成分を抽出すると
云った処理をするものを用いており、フィルタ演算処理
に使用するフィルタ係数は、もともと周波数領域で得ら
れるため、従来のように、時間領域のフィルタ係数から
周波数領域への変換と云う処理は不要となる。従って、
本発明システムではＧＳＣは使用していても、時間領域
のフィルタ係数から周波数領域への変換が不要である
分、処理の高速化が可能となる。

【００８８】＜全体の処理手順＞図４に実施例１に係る
システムの全体の処理手順を示す。この処理はフレーム
毎に行われる。

【００８９】まず、初期設定する（ステップＳ１１）。
初期設定内容としては、目的音方向の追尾範囲を０゜±
θｒ（例えばθｒ＝２０゜）とし、雑音方向推定部の探
索範囲を θｒ＜ φ１＜ 180゜−θｒ， −180゜＋θｒ＜ φ１＜−θｒとし、目的音方向推定部１８の探索範囲を −θｒ＜ φ２＜ θｒとする。

【００９０】そして、目的音の入力方向の初期値をθ１
＝０゜、雑音の入力方向の初期値をθ２＝９０°とす
る。

【００９１】初期設定が済んだならば、まず、第１のビ
ームフォーマ１３の処理を行い（ステップＳ１２）、雑
音方向を推定し（ステップＳ１３）、雑音方向がφ２の
範囲内であれば、第２のビームフォーマ１６の入力方向
を修正し（ステップＳ１４，Ｓ１５）、そうでなければ
修正しない（ステップＳ１４）。

【００９２】次に，第２のビームフォーマ１６の処理に
進み（ステップＳ１６）、目的音の方向を推定する（ス
テップＳ１７）。そして、この推定した目的音の方向が
φ１の範囲内ならば、第１のビームフォーマ１３の入力
方向を修正し（ステップＳ１８，Ｓ１９）、そうでなけ
れば何もせずに、次のフレームの処理に移る。

【００９３】以上、実施例１においては、ビームフォー
マとして周波数領域で動作するビームフォーマを用いる
ようにしたことを特徴としており、これによって計算量
を大幅に削減することができるようにしたことを特徴と
している。

【００９４】すなわち、話者の発声した音声を少なくと
も異なる２箇所以上の位置で受音する音声入力手段と、
前記受音位置に対応する音声信号のチャネル毎に周波数
分析を行って複数チャネルの周波数成分を出力する周波
数分析手段と、この周波数分析手段にて得られる前記複
数チャネルの周波数成分について、所望方向外の感度が
低くなるように計算したフィルタ係数を用いての適応フ
ィルタ処理を施すことにより前記話者方向からの音声以
外の音声を抑圧する到来雑音抑圧処理を行い、目的音声
成分を得る第１のビームフォーマ処理手段と、前記周波
数分析手段にて得られる前記複数チャネルの周波数成分
について、所望方向外の感度が低くなるように計算した
フィルタ係数を用いての適応フィルタ処理を施すことに
より前記話者方向からの音声を抑圧し、雑音成分を得る
第２のビームフォーマ処理手段と、前記第１のビームフ
ォーマ処理手段で計算されるフィルタ係数から雑音方向
を推定する雑音方向推定手段と、前記第２のビームフォ
ーマ処理手段で計算されるフィルタ係数から目的音方向
を推定する目的音方向推定手段と、前記第１のビームフ
ォーマにおいて入力対象となる目的音の到来方向である
第１の入力方向を、前記目的音方向推定手段で推定され
た目的音方向に基づいて逐次修正する目的音方向修正手
段と、前記第２のビームフォーマにおいて入力対象とす
る雑音の到来方向である第２の入力方向を、前記雑音方
向推定手段で推定された雑音方向に基づいて逐次修正す
る雑音方向修正手段とを具備する。

【００９５】そして、話者の発声した音声を異なる２箇
所以上の位置で音声入力手段は受音し、周波数分析手段
では、これを前記受音位置に対応する音声信号のチャネ
ル毎に周波数分析して複数チャネルの周波数成分を出力
する。そして、第１のビームフォーマ処理手段はこの周
波数分析手段にて得られる前記複数チャネルの周波数成
分について、所望方向外の感度が低くなるように計算し
たフィルタ係数を用いての適応フィルタ処理を施すこと
により前記話者方向からの音声以外の音声を抑圧する到
来雑音抑圧処理を行い、目的音声成分を得、また、第２
のビームフォーマ処理手段は、前記周波数分析手段にて
得られる前記複数チャネルの周波数成分について、所望
方向外の感度が低くなるように計算したフィルタ係数を
用いての適応フィルタ処理を施すことにより前記話者方
向からの音声を抑圧し、雑音成分を得る。そして、雑音
方向推定手段は、前記第１のビームフォーマ処理手段で
計算されるフィルタ係数から雑音方向を推定し、目的音
方向推定手段は、前記第２のビームフォーマ処理手段で
計算されるフィルタ係数から目的音方向を推定する。目
的音方向修正手段は、前記第１のビームフォーマにおい
て入力対象となる目的音の到来方向である第１の入力方
向を、前記目的音方向推定手段で推定された目的音方向
に基づいて逐次修正するので、第１のビームフォーマは
第１の入力方向以外から到来する雑音成分を抑圧して話
者の音声成分を低雑音で抽出することになる。また、雑
音方向修正手段は、前記第２のビームフォーマにおいて
入力対象とする雑音の到来方向である第２の入力方向
を、前記雑音方向推定手段で推定された雑音方向に基づ
いて逐次修正するので、第２のビームフォーマは第２の
入力方向以外から到来する成分を抑圧して話者の音声成
分を抑圧した残りの雑音成分を抽出することになる。

【００９６】このように本システムは雑音成分を抑圧し
た音声周波数成分と、音声成分を抑圧した雑音周波数成
分とを別々に得ることができるが、この発明の最大の特
徴は、第１及び第２のビームフォーマとして、周波数領
域で動作するビームフォーマを用いるようにした点にあ
る。そして、このことによって、計算量を大幅に削減す
ることができるようにしている。

【００９７】そしてこの発明によると、適応フィルタの
処理量が大幅に低減されるのに加え、入力音声に対する
周波数分析以外の周波数分析処理を省略することがで
き、かつ、フィルタ演算時に必要であった時間領域から
周波数領域ヘの変換処理も不要となり、全体の演算量を
大幅に削減することができる。

【００９８】すなわち、従来技術では、ビームフォーマ
で抑圧できない拡散性雑音の抑圧処理のために、スペク
トルサブトラクション（以後、ＳＳと略称する）処理
を、ビームフォーマ処理の後に行うようにしており、こ
のＳＳは周波数スペクトルを入力とするため、ＦＦＴ
（高速フーリエ変換）などの周波数分析が従来必要であ
ったが、周波数領域で動作するビームフォーマを用いる
と当該ビームフォーマからは周波数スペクトルが出力さ
れるため、これをＳＳに流用できるので、特別にＳＳの
ためのＦＦＴを実施する従来のＦＦＴ処理工程は省略す
ることができる。故に、全体の演算量を大幅に削減する
ことができる。

【００９９】また、ビームフォーマのフィルタを用いた
方向推定の際に必要であった時間領域から周波数領域へ
の変換処理も不要となり、全体の演算量を大幅に削減す
ることができる。

【０１００】次に、雑音源が目的音方向の範囲を横切っ
て移動した場合にも追尾が高精度で行えるようにした例
を実施例２として説明する。

【０１０１】（実施例２）本発明に係る第２の実施例に
ついて説明する。これは、請求項２の発明に相当する。

【０１０２】本例では、雑音源が目的音方向の範囲を横
切って移動した場合にも追尾が高精度で行えるように、
雑音を追尾するビームフォーマを２つ用いる場合の例に
ついて説明する。全体構成を図４に示す。図４におい
て、１１は音声入力部、１２は周波数解析部、１３は第
１のビームフォーマ、１４は第１の入力方向修正部、１
５は第２の入力方向修正部、１６は第２のビームフォー
マ、１７は雑音方向推定部、１８は第１の音声方向推定
部（目的音方向推定部）、そして、２１は第３の入力方
向修正部、２２は第３のビームフォーマ、２３は第２の
音声方向推定部、２４は有効雑音決定部である。

【０１０３】これらのうち、第３の入力方向修正部２１
は、第３のビームフォーマ２２の入力方向を雑音方向に
修正するためのものであって、第３のビームフォーマ２
２において、入力対象とする雑音の到来方向である第３
の入力方向を、前記雑音方向推定部１７で推定された雑
音方向に基づいて逐次方向修正するための出力を発生
し、第３のビームフォーマ２２に与えるものである。具
体的には、第３の入力方向修正部２１は、雑音方向推定
部１７の出力する推定量対応のデータを現在の目的とす
る雑音源方向の角度情報に変換して目標角度情報αとし
て第３のビームフォーマ２２に出力するものである。

【０１０４】第３のビームフォーマ２２は、周波数分析
部１２からの複数チャンネルの周波数成分出力、この場
合、１ｃｈ，２ｃｈの音声信号の周波数スペクトルを用
いて、これより雑音源方向からの周波数スペクトル成分
を抽出するためのものであって、前記１ｃｈ，２ｃｈそ
れぞれの周波数成分（周波数スペクトルデータ）に対し
て方向別感度調整を施した適応フィルタ処理により雑音
音源方向以外の周波数スペクトル成分の抑圧処理を行う
ことで、雑音音源方向からの周波数スペクトル成分のデ
ータを抽出するといったことを行う処理手段である。こ
の第３のビームフォーマ２２も第１及び第２のビームフ
ォーマ１３，１６同様、図２で説明した如きの構成を採
用している。

【０１０５】第２の音声方向推定部２３は、目的音声推
定部（音声方向推定部）１８と同様のものであって、前
記第３のビームフォーマ２２で計算されるフィルタ係数
から目的音方向を推定すると云った処理を行うものであ
り、具体的には前記第３のビームフォーマ２２の適応フ
ィルタから音声方向を推定し、その推定量対応のデータ
を出力するものである。

【０１０６】有効雑音決定部２４は、音声方向推定部１
８，２３および雑音方向推定部１７の推定する音声方向
および雑音方向の情報に基づき、第２のビームフォーマ
１６と第３のビームフォーマ２２のいずれが雑音を有効
に追尾しているかを判断し、有効に追尾していると判断
した方のビームフォーマの出力を、雑音成分として出力
するものである。なお、その他、図１の構成と同一符号
を付したものは同一物を示しているので、詳細は先の説
明を参照することとし、ここでは改めて説明はしない。

【０１０７】図からわかるように実施例２において、実
施例１との違いは、第３の入力方向修正部２１と、第３
のビームフォーマ２２と、第２の音声方向推定部２３、
および有効雑音決定部２４を追加した点である。

【０１０８】そして、第２及び第３のビームフォーマ１
６，２２の出力、及び、雑音方向推定部１７の出力、及
び、第１及び第２の音声方向推定部１８，２３の出力を
有効雑音決定部２４に渡し、有効雑音決定部２４の出力
を第１の入力方向修正部１４に渡す構成としてある。

【０１０９】このような構成の本システムの作用を説明
する。まず、複数のマイクロホンを持つ音声入力部１
１、この例では第１及び第２の計２本のマイクロホンｍ
１，ｍ２を持つ音声入力部１１でｃｈ１，ｃｈ２の音声
を取り込む。そして、この音声入力部１１から入力され
た２チャンネル分の音声の信号ｃｈ１，ｃｈ２（すなわ
ち、第１チャンネルｃｈ１は第１のマイクロホンｍ１か
らの音声、第２チャンネルｃｈ２は第２のマイクロホン
ｍ２からの音声に該当する）は、周波数分析部１２に送
られ、ここで例えば高速フーリエ変換（ＦＦＴ）等の処
理を行うことによって、それぞれのチャンネル別に周波
数成分（周波数スペクトル）が求められる。

【０１１０】周波数分析部１２でそれぞれ求められたチ
ャンネル別の周波数成分は、それぞれ第１、第２及び第
３のビームフォーマ１３，１６，２２に与えられる。

【０１１１】第１のビームフォーマ１３では、２チャン
ネル分の周波数成分入力について、目的音の方向対応に
位相を合わせた上で、周波数領域の適応フィルタにより
上述のようにして処理することで雑音を抑圧し、目的音
の方向の周波数成分を出力する。ここで、具体的に説明
すると第１の入力方向修正部１４は第１のビームフォー
マ１３に対して次のような角度情報（α）を与える。つ
まり、第１の入力方向修正部１４は、有効雑音決定部２
４を介して与えられる音声方向推定部１８若しくは音声
方向推定部２３からの出力を用い、目的音の方向があた
かもマイクロホンの正面方向となるよう、上記２チャン
ネルの周波数成分の入力位相を整えるに必要な角度情報
（α）を入力方向修正量として第１のビームフォーマ１
３に対して与える。

【０１１２】この結果、第１のビームフォーマ１３はこ
の修正量（α）対応に目的音方向を修正し、当該目的音
方向以外の方向から到来する音声を抑圧させるようにす
ることで、雑音成分を抑圧し、目的音を抽出する。

【０１１３】つまり、第２および第３のビームフォーマ
１６，２２の場合、雑音が目的音であるから、雑音に位
相を合わせている。その結果、第２，第３のビームフォ
ーマ１６，２２では話者の音源は雑音源として扱われ、
各ビームフォーマの内蔵する適応フィルタは話者音源か
らの音を抽出する処理をすることになるので、当該第
２，第３のビームフォーマ１６，２２の適応フィルタの
パラメータからは話者音源の方向を反映した情報が得ら
れることになる。

【０１１４】従って、第１または第２の音声方向推定部
１８または２３により、第２または第３のビームフォー
マ１６または２２における適応フィルタのパラメータを
用いて雑音源方向を知れば、それは目的音である話者音
源の方向を反映させたものである。従って、第１または
第２の音声方向推定部１８または２３により、第２また
は第３のビームフォーマ１６または２２における適応フ
ィルタのパラメータを反映させた出力を出し、第１の入
力方向修正部１４でこの出力対応に入力方向修正量
（α）を発生し、この修正量対応に第１のビームフォー
マ１３における目的音方向を修正すれば、第１のビーム
フォーマ１３は当該目的音方向以外の方向から到来する
音声を抑圧するので、この場合、話者音源からの成分を
抽出できることになる。

【０１１５】一方、第１のビームフォーマ１３の適応フ
ィルタでは雑音成分が抽出されるようにパラメータが制
御されているので、このパラメータから雑音方向推定部
１７では、雑音方向を推定し、その情報を第２及び第３
の入力方向修正部１５，２１と有効雑音決定部２４に与
えることになる。

【０１１６】そして、当該雑音方向推定部１７からの出
力を受けた第２の入力方向修正部１５では、当該雑音方
向推定部１７からの出力対応に入力方向修正量（α）を
発生し、この修正量対応に第２のビームフォーマ１６に
おける目的音方向を修正すれば、第２のビームフォーマ
１６は当該目的音方向以外の方向から到来する音声を抑
圧するので、この場合、話者音源以外からの成分である
雑音成分を抽出できることになる。

【０１１７】このとき、第２のビームフォーマ１６の適
応フィルタでは目的音である話者音声成分が抽出される
ようにパラメータが制御されているので、このパラメー
タから第１の音声方向推定部１８では、話者音声方向を
推定することができる。そして、第１の音声方向推定部
１８はその推定した情報を有効雑音決定部２４に与え
る。

【０１１８】また、雑音方向推定部１７からの出力が第
３の入力方向修正部２１にも与えられているが、これを
受けた第３の入力方向修正部２１では、当該雑音方向推
定部１７からの出力対応に入力方向修正量（α）を発生
に、第３のビームフォーマ２２に与える。これにより、
第３のビームフォーマ２２はこの与えられた修正量対応
に、自己における目的音方向を修正する。

【０１１９】これにより、第３のビームフォーマ２２は
当該目的音方向以外の方向から到来する音声を抑圧する
ので、この場合、話者音源以外からの成分、つまり、雑
音成分を抽出できることになる。このとき、第３のビー
ムフォーマ２２の適応フィルタでは目的音である話者音
声成分が抽出されるようにパラメータが制御されている
ので、このパラメータから第２の音声方向推定部２３で
は、話者音声方向を推定できる。そして、この推定した
情報は有効雑音決定部２４に与えることになる。

【０１２０】有効雑音決定部２４では、第１および第２
の音声方向推定部１８，２３から与えられた話者音声方
向の推定情報と、雑音方向推定部１７から与えられた雑
音方向の推定情報とをもとに、第２のビームフォーマ１
６と第３のビームフォーマ２２のいずれが雑音を有効に
追尾しているかを判断する。そして、この判断結果に基
づき、有効に追尾していると判断した方のビームフォー
マにおける適応フィルタのパラメータを第１の入力方向
修正部１４に与える。

【０１２１】そのため、第１の入力方向修正部１４で
は、当該パラメータを反映させた出力を出し、第１の入
力方向修正部１４でこの出力対応に入力方向修正量
（α）を発生し、この修正量対応に第１のビームフォー
マ１３における目的音方向を修正するので、第１のビー
ムフォーマ１３は当該目的音方向以外の方向から到来す
る音声を抑圧することになって、この場合、話者音源か
らの成分を抽出でき、しかも、広く移動する雑音源から
の雑音を対象とする場合に、その移動する雑音源を見失
うことなく、確実にとらえて雑音除去することが可能と
なる。

【０１２２】すなわち、この実施例においては、話者の
音声周波数成分の抽出用として第１のビームフォーマ１
３が設けてあり、また、雑音周波数成分の抽出用として
第２および第３のビームフォーマ１６，２２が設けてあ
る。そして、観測点から見て図６に示すように、話者が
０°方向に位置していて０°±θの角度範囲で監視すれ
ば良いとすると、当該話者の音声周波数成分を抽出する
ために設けた第１のビームフォーマ１３の変化範囲φ
１、すなわち、適応フィルタにおける感度を高くする方
向についての１°刻み変化範囲はせいぜい −θ ＜ φ１＜ θ に設定してこの範囲でフィルタリングに用いることにな
る。この場合、雑音周波数成分を抽出するために設けた
第２および第３のビームフォーマ１６，２２のうち、第
２のビームフォーマ１６の変化範囲φ２は −180゜＋θ ＜ φ２＜ −θ そして、第３のビームフォーマ２２の変化範囲φ３は θ ＜ φ３＜ 180゜−θ に設定することになる。但し、１８０°は中心点を介し
て０°の対向位置、−は０°位置から見て図における反
時計方向回り、＋は時計方向回りを示す。

【０１２３】故に、このようにすると、第２のビームフ
ォーマ１６と第３のビームフォーマ２２は、目的音到来
範囲φ１を挟んで各々別々の範囲から到来する雑音を追
尾することになる。そのため、φ２の範囲にあった雑音
源がφ１の範囲を横切ってφ３の範囲に急に移動した場
合でも、φ３の領域を持ち場とする第３のビームフォー
マ２２が当該移動して来た雑音源を直ちに捕えることが
できるため、雑音方向を見失うことがなくなる。

【０１２４】この構成の場合、第２のビームフォーマ１
６の出力と、第３のビームフォーマビーム２２の出力の
計２つの出力が、雑音の出力として得られるが、雑音方
向推定部１７の結果に基づき、有効雑音決定部２４にお
いて、第２のビームフォーマ１６と第３のビームフォー
マ２２のいずれが雑音を有効に追尾しているかを判断
し、この判断結果に基づき、有効に追尾して方の出力を
雑音成分として用いることになる。

【０１２５】＜実施例２における全体の処理の流れ＞以
上の処理の全体の流れを図７に示しておく。この処理は
フレーム毎に行われる。各ビームフォーマの変化範囲お
よび入力方向の初期値を設定した後に（ステップＳ３
１）、第１のビームフォーマ１３の処理を行い（ステッ
プＳ３２）、雑音方向を推定した後に（ステップＳ３
３）、該雑音方向を入力として有効雑音決定部２４にお
いて、雑音方向がφ２にあるか、φ３にあるかの判定を
実施し、第２のビームフォーマ１６と第３のビームフォ
ーマ２２のどちらを選択するかを決定する（ステップＳ
３４）。

【０１２６】そして、推定された雑音方向が第２の入力
方向修正部１５あるいは第３の入力方向修正部２１のど
ちらかに送られ、雑音方向が修正され、選択されたビー
ムフォーマの処理が実行される。

【０１２７】すなわち、推定された雑音方向がφ２の領
域であれば雑音方向が第２の入力方向修正部１５に送ら
れ、雑音方向が修正され、第２のビームフォーマ１６の
処理が実行され、目的音方向が推定される（ステップＳ
３４，Ｓ３５，Ｓ３６，Ｓ３７）。また、推定された雑
音方向がφ３の領域であれば雑音方向が第３の入力方向
修正部２１に送られ、雑音方向が修正され、第３のビー
ムフォーマ２２の処理が実行され、目的音方向が推定さ
れる（ステップＳ３４，Ｓ３８，Ｓ３９，Ｓ４０，Ｓ４
１）。

【０１２８】次に、選択されたビームフォーマにより推
定された音声方向（目的音方向）がφ１の範囲内かどう
か判断され、範囲内の場合は、推定された音声方向が第
１のビームフォーマ１３の第１の入力方向修正部１４に
送られ、入力方向の修正が実行される（ステップＳ４
２，Ｓ４３）。範囲外の場合は修正処理が実行されず、
次のフレームに対する処理に進む（ステップＳ４２，Ｓ
３１）。

【０１２９】この処理がフレーム毎に行われ、音声およ
び雑音方向を追尾しながら、雑音抑圧が行われる。

【０１３０】このように、実施例２は、話者の発声した
音声を少なくとも異なる２箇所以上の位置で受音する音
声入力手段と、前記受音位置に対応する音声信号のチャ
ネル毎に周波数分析を行って複数チャネルの周波数成分
を出力する周波数分析手段と、この周波数分析手段にて
得られる前記複数チャネルの周波数成分について、所望
方向外の感度が低くなるように計算したフィルタ係数を
用いての適応フィルタ処理を施すことにより前記話者方
向からの音声以外の音声を抑圧する到来雑音抑圧処理を
行い、目的音声成分を得る第１のビームフォーマ処理手
段と、前記周波数分析手段にて得られる前記複数チャネ
ルの周波数成分について、所望方向外の感度が低くなる
ように計算したフィルタ係数を用いての適応フィルタ処
理を施すことにより前記話者方向からの音声を抑圧し、
第１の雑音成分を得る第２のビームフォーマ処理手段
と、前記周波数分析手段にて得られる前記複数チャネル
の周波数成分について、所望方向外の感度が低くなるよ
うに計算したフィルタ係数を用いての適応フィルタ処理
を施すことにより前記話者方向からの音声を抑圧し、第
２の雑音成分を得る第２のビームフォーマ処理手段と、
前記第１のビームフォーマ処理手段で計算されるフィル
タ係数から雑音方向を推定する雑音方向推定手段と、前
記第２のビームフォーマ処理手段で計算されるフィルタ
係数から第１の目的音方向を推定する第１の目的音方向
推定手段と、前記第３の適応ビームフォーマ処理手段で
計算されるフィルタ係数から第２の目的音方向を推定す
る第２の目的音方向推定手段と、前記第１のビームフォ
ーマにおいて入力対象とする目的音の到来方向である第
１の入力方向を、前記第１の目的音方向推定手段で推定
された第１の目的音方向と、第２の目的音方向推定手段
で推定された第２の目的音方向のいずれか一方または両
方に基づいて逐次修正する第１の入力方向修正手段と、
前記雑音方向修正手段で推定された雑音方向が所定の第
１の範囲にある場合に、前記第２のビームフォーマにお
いて入力対象とする雑音の到来方向である第２の入力方
向を該雑音方向に基づいて逐次修正する第２の入力方向
修正手段と、前記雑音方向修正手段で推定された雑音方
向が所定の第２の範囲にある場合に、前記第３のビーム
フォーマにおいて入力対象とする雑音の到来方向である
第３の入力方向を該雑音方向に基づいて逐次修正する第
３の入力方向修正手段と、前記雑音方向推定手段で推定
された雑音方向が所定の第１の範囲から到来したか所定
の第２の範囲から到来したかに基づいて前記第１の出力
雑音と前記第２の出力雑音のいずれか一方を真の雑音出
力と決定していずれか一方の雑音を出力すると同時に、
第１の音声方向推定手段と第２の音声方向推定手段のい
ずれの推定結果が有効であるかを決定していずれか一方
の音声方向推定結果を第１の入力方向修正手段へ出力す
る有効雑音決定手段とを具備して構成したものである。

【０１３１】そして、このような構成の場合、話者の発
声した音声を異なる２箇所以上の位置で音声入力手段は
受音し、周波数分析手段では、これを前記受音位置に対
応する音声信号のチャネル毎に周波数分析して複数チャ
ネルの周波数成分を出力する。そして、第１のビームフ
ォーマ処理手段はこの周波数分析手段にて得られる前記
複数チャネルの周波数成分について、所望方向外の感度
が低くなるように計算したフィルタ係数を用いての適応
フィルタ処理を施すことにより前記話者方向からの音声
以外の音声を抑圧する到来雑音抑圧処理を行い、目的音
声成分を得、また、第２のビームフォーマ処理手段は、
前記周波数分析手段にて得られる前記複数チャネルの周
波数成分について、所望方向外の感度が低くなるように
計算したフィルタ係数を用いての適応フィルタ処理を施
すことにより前記話者方向からの音声を抑圧し、雑音成
分を得る。そして、雑音方向推定手段は、前記第１のビ
ームフォーマ処理手段で計算されるフィルタ係数から雑
音方向を推定し、目的音方向推定手段は、前記第２のビ
ームフォーマ処理手段で計算されるフィルタ係数から目
的音方向を推定する。また、第１の目的音方向推定手段
は前記第２のビームフォーマ処理手段で計算されるフィ
ルタ係数から第１の目的音方向を推定し、第２の目的音
方向推定手段は、前記第３の適応ビームフォーマ処理手
段で計算されるフィルタ係数から第２の目的音方向を推
定する。

【０１３２】また、第１の入力方向修正手段は、前記第
１のビームフォーマにおいて入力対象とする目的音の到
来方向である第１の入力方向を、前記第１の目的音方向
推定手段で推定された第１の目的音方向と、第２の目的
音方向推定手段で推定された第２の目的音方向のいずれ
か一方または両方に基づいて逐次修正する。そして、第
２の入力方向修正手段は、前記雑音方向修正手段で推定
された雑音方向が所定の第１の範囲にある場合に、前記
第２のビームフォーマにおいて入力対象とする雑音の到
来方向である第２の入力方向を該雑音方向に基づいて逐
次修正し、第３の入力方向修正手段は、前記雑音方向修
正手段で推定された雑音方向が所定の第２の範囲にある
場合に、前記第３のビームフォーマにおいて入力対象と
する雑音の到来方向である第３の入力方向を該雑音方向
に基づいて逐次修正する。従って、第２の入力方向修正
手段の出力により第２の入力方向を修正される第２のビ
ームフォーマは第２の入力方向以外から到来する成分を
抑圧して残りの雑音成分を抽出することになり、また、
第３の入力方向修正手段の出力により第３の入力方向を
修正される第３のビームフォーマは第３の入力方向以外
から到来する成分を抑圧して残りの雑音成分を抽出する
ことになる。

【０１３３】そして、有効雑音決定手段は、前記雑音方
向推定手段で推定された雑音方向が所定の第１の範囲か
ら到来したか所定の第２の範囲から到来したかに基づい
て前記第１の出力雑音と前記第２の出力雑音のいずれか
一方を真の雑音出力と決定していずれか一方の雑音を出
力すると同時に、第１の音声方向推定手段と第２の音声
方向推定手段のいずれの推定結果が有効であるかを決定
して有効な方の音声方向推定結果を第１の入力方向修正
手段へ出力する。この結果、目的音方向修正手段は、前
記第１のビームフォーマにおいて入力対象となる目的音
の到来方向である第１の入力方向を、前記決定した方の
目的音方向推定手段で得た目的音方向に基づいて逐次修
正するので、第１のビームフォーマは第１の入力方向以
外から到来する雑音成分を抑圧して話者の音声成分を低
雑音で抽出することになる。

【０１３４】このように本システムは雑音成分を抑圧し
た音声周波数成分と、音声成分を抑圧した雑音周波数成
分とを別々に得ることができるが、この発明の最大の特
徴は、第１乃至第３のビームフォーマとして、周波数領
域で動作するビームフォーマを用いるようにした点にあ
る。そして、このことによって、計算量を大幅に削減す
ることができるようにしている。

【０１３５】そしてこの発明によると、適応フィルタの
処理量が大幅に低減されるのに加え、入力音声に対する
周波数分析以外の周波数分析処理を省略することがで
き、かつ、フィルタ演算時に必要であった時間領域から
周波数領域ヘの変換処理も不要となり、全体の演算量を
大幅に削減することができる。

【０１３６】また、本発明では、雑音追尾に監視領域を
全く異ならせた雑音追尾用のビームフォーマを設けてあ
り、それぞれの出力からそれぞれ音声方向を推定させる
と共に、それぞれの推定結果からいずれが有効な雑音追
尾をしているかを判断して、有効と判断された方のビー
ムフォーマのフィルタ係数による音声方向の推定結果を
第１の目的音方向修正手段に与えることで第１の目的音
方向修正手段は、前記第１のビームフォーマにおいて入
力対象となる目的音の到来方向である第１の入力方向
を、前記目的音方向推定手段で推定された目的音方向に
基づいて逐次修正するので、第１のビームフォーマは第
１の入力方向以外から到来する雑音成分を抑圧して話者
の音声成分を低雑音で抽出することができ、雑音源が移
動してもこれを見失うことなく追尾して抑圧することが
できるようになるものである。

【０１３７】従来技術においては、２ｃｈ、すなわち、
２本のマイクロホンだけでも目的音源の追尾を可能とす
べく、雑音追尾用のビームフォーマを雑音抑圧のビーム
フォーマとは別に１個用いるが、例えば、雑音源が目的
音の方向を横切って移動したような場合、雑音の追尾精
度が低下することがあった。

【０１３８】しかし、本発明では、雑音を追尾するビー
ムフォーマを複数用いて各々別個の追尾範囲を受け持つ
ようにしたことにより、上記のような場合でも追尾精度
の低下を抑止できるようになる。

【０１３９】以上の実施例１及び実施例２のシステム
は、演算負荷の軽減を図りつつ、主として方向を持つ雑
音について抑圧できるようにした例を示した。そして、
この場合、テレビ会議システムなどのように、話者音源
の配置がわかっていて、しかも、環境的に雑音が少ない
ような環境下での利用に適しているが、レベルも特性も
まちまちで雑多な雑音の影響を受ける屋外や、大勢の人
の集まる店舗や駅と云った所で使用するには不十分であ
ると考えられる。

【０１４０】そこで、方向性の無い背景雑音も効果的に
抑制できるようにした実施例を次に説明する。

【０１４１】（実施例３）この実施例３は本発明の請求
項３に対応する。ここでは、方向性のある雑音はビーム
フォーマにより抑圧し、方向性のない背景雑音はスペク
トルサブトラクション（ＳＳ）処理により、抑圧するよ
うにした高精度の雑音抑圧が可能なシステムを説明す
る。

【０１４２】実施例３のシステムは、図１または図５の
構成のシステムの後段に、更に図８の構成のスペクトル
サブトラクション（ＳＳ）処理部３０を接続して構成す
る。スペクトルサブトラクション（ＳＳ）処理部３０は
図に示すように、音声帯域パワー計算部３１、雑音帯域
パワー計算部３２、帯域重み計算部３３、スペクトル減
算部３４から構成されている。

【０１４３】これらのうち、音声帯域パワー計算部３１
は、前記ビームフォーマ１３により得られた音声周波数
を、周波数帯域毎に分割して帯域毎の音声パワーを計算
するものであり、雑音帯域パワー計算部３２は、前記ビ
ームフォーマ１６により得られた雑音周波数成分（また
はビームフォーマ１６，２２によりそれぞれ得られ、有
効雑音決定部２４により選択されて出力された雑音周波
数成分）を、周波数帯域毎に分割して帯域毎の雑音パワ
ーを計算するものである。

【０１４４】帯域重み計算部３３は、帯域ｋ毎に、得ら
れた音声の平均帯域パワーＰv（k）と雑音の平均帯域パ
ワーＰn（k）を用い、帯域毎の帯域重み係数Ｗ（ｋ）を
計算するものであり、修正スペクトル減算部３４は、前
記入力帯域パワー計算部３１にて計算された入力帯域パ
ワーと、音声帯域パワー計算部３１で計算された音声帯
域パワーとに基き、音声信号の周波数帯域毎に重みをか
けて背景雑音を抑圧するものである。

【０１４５】音声帯域パワー計算部３１で用いる音声周
波数成分と、雑音帯域パワー計算部３２で用いる雑音周
波数成分は、いずれも実施例１あるいは実施例２のビー
ムフォーマの２つの出力である目的音声成分と雑音成分
を利用する。そして、一般に、スペクトルサブトラクシ
ョン（ＳＳ）として知られる雑音抑圧処理により、方向
性のない背景雑音成分の抑圧を行う。

【０１４６】一般的に行われるスペクトルサブトラクシ
ョン（ＳＳ）は、１チャンネルのマイクロホン（つま
り、１本のマイクロホン）を用い、このマイクロホンの
出力から音声のない区間において雑音のパワーを推定す
るため、非定常な雑音が音声に重畳している場合には対
処できない。

【０１４７】また、２チャンネルのマイクロホン（つま
り、２本のマイクロホン）を用いて、一方を雑音収集
用、片方を雑音重畳音声収集用とする場合にも、両マイ
クロホンの設置場所を離す必要があり、その結果、音声
に重畳する雑音と、雑音収集用マイクロホンで取り込む
雑音との位相がずれ、スペクトルサブトラクションして
も雑音抑圧の改善効果は大きく上がらなかった。

【０１４８】本実施例では、雑音成分を取り出すビーム
フォーマを用意して、このビームフォーマの出力を用い
るようにしたため、実施例１および実施例２で述べたよ
うに、位相のずれが補正され、非定常雑音の場合でも高
精度なスペクトルサブトラクション（ＳＳ）を実現でき
る。

【０１４９】さらに、周波数領域のビームフォーマの出
力を利用しているため、周波数分析を省略してスペクト
ルサブトラクションが可能であり、従来より少ない演算
量で非定常雑音を抑圧できる。

【０１５０】以下、具体的なスペクトルサブトラクショ
ン（ＳＳ）方法について述べる。

【０１５１】＜スペクトルサブトラクション（ＳＳ）の
原理＞まず、スペクトルサブトラクションの原理につい
て説明する。目的音声用ビームフォーマ（第１のビーム
フォーマ１３）の出力をＰｖ、雑音用ビームフォーマ
（第２または第３のビームフォーマ１６または２２）の
出力をＰｎとすると、Ｐｖ＝Ｖ＋Ｂ′ Ｐｎ＝Ｎ＋Ｂ″ と表すことができる。ここで、Ｖは音声成分のパワー、
Ｂ′は音声出力に含まれる背景雑音のパワーであり、Ｎ
は雑音源成分のパワー、Ｂ″は雑音出力に含まれる背景
雑音のパワーである。これらのうち、音声出力成分に含
まれる背景雑音成分を、スペクトルサブトラクション処
理により抑圧する。

【０１５２】音声出力成分中のＢ′は、雑音出力成分中
のＢ″と同等であり、雑音源成分のパワーＮも音声成分
のパワーＶに比べて小さいとすると、Ｂ′＝Ｐｎと考え
ることができ、スペクトルサブトラクション（ＳＳ）処
理用の重み係数Ｗは以下のように求めることができる。
すなわち、ＷはＷ＝（Ｐv−Ｐn）／Ｐv 〜Ｖ／（Ｖ＋Ｂ′）となり、Ｖ〜Ｐｖ＊Ｗとして音声成分を近似的に求めることができる。

【０１５３】図８にスペクトルサブトラクション（Ｓ
Ｓ）処理に必要な構成を、また、図９にスペクトルサブ
トラクション処理手順を示す。

【０１５４】２つのビームフォーマ１３，１５（または
２２）からの出力として音声周波数成分と雑音周波数成
分が得られる。ビームフォーマ１３からの出力である音
声周波数成分を用いて音声帯域パワー計算が実施され
（ステップＳ５１）、ビームフォーマ１５（または２
２）からの出力である雑音周波数成分を用いて雑音帯域
パワー計算が実施される（ステップＳ５２）。ここでの
パワー計算は、実施例１および実施例２で説明した本発
明システムの音声周波数成分と雑音周波数成分を利用し
ており、これらはビームフォーマの処理を周波数領域で
行っていることから、周波数分析なしに、そのまま音声
および雑音の周波数成分の各帯域毎にパワーの計算を実
行できる。

【０１５５】次に、計算されたパワー値を時間方向に平
均化し、帯域毎に平均パワーを求める（ステップＳ５
３）。帯域重み計算部３３では、帯域ｋ毎に、得られた
音声の平均帯域パワーＰv（k）と雑音の平均帯域パワー
Ｐn（k）を用い、次式により、帯域毎の帯域重み係数Ｗ
（ｋ）を計算する。

【０１５６】帯域重みは最大値１．０と最小値Ｗminの間の値をと
り、Ｗminの値は例えば“０．０１”等とする。

【０１５７】次にスペクトル減算部２４では、帯域重み
計算部２３で計算された帯域毎の重み係数Ｗ（k）を用
い、入力の音声周波数成分Ｐv（k）に重みをかけ、雑音
成分を抑圧した音声周波数成分Ｐv（k）′を求める（ス
テップＳ５４）。

【０１５８】Ｐv（k）′＝Ｐv（k）＊Ｗ（k）こうして、方向のない背景雑音はスペクトルサブトラク
ション（ＳＳ）処理により、抑圧され、方向を持つ雑音
は前述のビームフォーマにより抑圧されて、結果的に高
精度の雑音抑圧が可能となる。

【０１５９】以上、この実施例３によれば、前記実施例
１または実施例２の音抑圧装置において得られた音声周
波数成分と雑音周波数成分を用いるようにしたものであ
り、前記周波数帯域毎に分割して帯域毎の音声パワーを
計算する音声帯域パワー計算手段と、前記得られた雑音
周波数成分を、周波数帯域毎に分割して帯域毎の雑音パ
ワーを計算する雑音帯域パワー計算手段と、前記音声帯
域パワー計算手段と雑音帯域パワー計算手段とから得ら
れる音声と雑音の周波数帯域パワーに基き、音声信号の
周波数帯域毎に重みをかけて背景雑音を抑圧するスペク
トル減算手段とからなるスペクトル減算雑音抑圧手段を
前記実施例１または実施例２の音抑圧装置にさらに具備
して構成したものである。

【０１６０】この構成の場合、音声帯域パワー計算手段
は、得られた音声周波数のスペクトル成分を、周波数帯
域毎に分割して帯域毎の音声パワーを計算し、雑音帯域
パワー計算手段は、前記得られた雑音周波数のスペクト
ル成分を、周波数帯域毎に分割して帯域毎の雑音パワー
を計算する。そして、スペクトル減算手段は、前記音声
帯域パワー計算手段と雑音帯域パワー計算手段とから得
られる音声と雑音の周波数帯域パワーに基き、音声信号
の周波数帯域毎に重みをかけて背景雑音を抑圧する。

【０１６１】この構成によれば、ビームフォーマでは抑
圧できない方向性のない雑音（背景雑音）は、本発明シ
ステムのビームフォーマで得ることのできる目的音声成
分と雑音成分を利用し、これをスペクトルサブトラクシ
ョン処理することで抑圧する。すなわち、本システムで
は、ビームフォーマとして目的音声成分抽出用と雑音成
分抽出用の２つのビームフォーマを備えているが、これ
らのビームフォーマの出力である目的音声成分と雑音成
分を利用してスペクトルサブトラクション処理すること
により、方向性のない背景雑音成分の抑圧を行う。スペ
クトルサブトラクション（ＳＳ）処理は雑音抑圧処理と
して知られるが、一般的に行われるスペクトルサブトラ
クション（ＳＳ）処理は、１チャンネルのマイクロホン
（つまり、１本のマイクロホン）を用い、このマイクロ
ホンの出力から音声のない区間において雑音のパワーを
推定するため、非定常な雑音が音声に重畳している場合
には対処できない。また、２チャンネルのマイクロホン
（つまり、２本のマイクロホン）を用いて、一方を雑音
収集用、片方を雑音重畳音声収集用とする場合にも、両
マイクロホンの設置場所を離す必要があり、その結果、
音声に重畳する雑音と、雑音収集用マイクロホンで取り
込む雑音との位相がずれ、スペクトルサブトラクション
処理しても雑音抑圧の改善効果は大きく上がらない。

【０１６２】しかし、本発明では、雑音成分を取り出す
ビームフォーマを用意して、このビームフォーマの出力
を用いるようにしたため、位相のずれは補正されてお
り、従って、非定常雑音の場合でも高精度なスペクトル
サブトラクション処理を実現できる。さらに、周波数領
域のビームフォーマの出力を利用しているため、周波数
分析を省略してスペクトルサブトラクションが可能であ
り、従来より少ない演算量で非定常雑音を抑圧できる。

【０１６３】次に、実施例３を更に高精度化することが
できるようにした例を実施例４として次に説明する。

【０１６４】（実施例４）本実施例４は本発明の請求項
４に対応する。本実施例は、実施例３のスペクトルサブ
トラクション（ＳＳ）において、雑音成分のパワーを修
正することにより、さらに高精度に雑音抑圧を行うこと
を可能とするものである。すなわち、実施例３では雑音
源のパワーＮが小さいという仮定をおいたため、スペク
トルサブトラクション（ＳＳ）処理を行うと雑音源の成
分が音声に重畳している部分では歪みが大きくなる懸念
が拭えないという問題がある。

【０１６５】そこで、ここでは入力信号のパワーを用い
て実施例３のスペクトルサブトラクションの帯域重みの
計算を修正するようにする。

【０１６６】まず、音声出力パワーをＰv、音声成分の
パワーをＶ、音声出力に含まれる背景雑音パワーを
Ｂ′、雑音出力パワーをＰn、雑音源成分のパワーを
Ｎ、雑音出力に含まれる背景雑音成分をＢ″、どの信号
も抑圧されていない入力信号のパワーをＰxとすると、Ｐx＝Ｖ＋Ｎ＋ＢＰv＝Ｖ＋Ｂ′ Ｐn＝Ｎ＋Ｂ″ ここで、ここで、Ｂ〜Ｂ′ 〜Ｂ″と仮定する
と、真の背景雑音成分のパワーＰbは、Ｐb＝Ｐv＋Ｐn−Ｐx ＝Ｖ＋Ｂ′＋Ｎ＋Ｂ″−（Ｖ＋Ｎ＋Ｂ）＝Ｂ′＋Ｂ″−Ｂ＝Ｂとなる。この雑音パワーを用いたスペクトルサブトラク
ション（ＳＳ）の重みは、Ｗ＝（Ｐv−Ｐb）／Ｐｖ＝（Ｐx−Ｐn）／Ｐv と計算でき、背景雑音が非定常でかつ、Ｎが大きい場合
でも歪みの少いＳＳ処理を行うことができる。

【０１６７】本実施例の構成を図１０に示し、処理の流
れを図１１に示す。図１０中、３１は音声帯域パワー計
算部、３２は雑音帯域パワー計算部、３４はスペクトル
減算部、３５は入力信号帯域パワー計算部である。

【０１６８】これらのうち、音声帯域パワー計算部３１
は、前記ビームフォーマ１３により得られた音声周波数
を、周波数帯域毎に分割して帯域毎の音声パワーを計算
するものであり、雑音帯域パワー計算部３２は、前記ビ
ームフォーマ１６または２２により得られ、有効雑音決
定部２４により選択されて出力された雑音周波数成分
を、周波数帯域毎に分割して帯域毎の雑音パワーを計算
するものである。

【０１６９】入力帯域パワー計算部３５は、前記周波数
分析部１２から得られた入力信号の周波数スペクトル成
分を周波数帯域毎に分割し、帯域毎の入力パワーを計算
するものであり、スペクトル減算部３４は、前記入力帯
域パワー計算部３５にて計算された入力帯域パワーと、
音声帯域パワー計算部３１で計算された音声帯域パワー
と、雑音帯域パワー計算部３２で計算された雑音帯域パ
ワーとに基き、音声信号の周波数帯域ごとに重みをかけ
て背景雑音を抑圧するものである。

【０１７０】図１０に示す実施例４でのスペクトルサブ
トラクション（ＳＳ）部３０の構成と、実施例３でのス
ペクトルサブトラクション（ＳＳ）部３０の構成との差
は、実施例４においては何も抑圧されていない入力信号
の周波数成分を更に用いる点である。

【０１７１】この入力信号周波数成分について、入力信
号帯域パワー計算部３５では、ビームフォーマからの音
声周波数成分あるいは雑音周波数成分と同様に、帯域ご
とにパワーを計算する（ステップＳ６１）。

【０１７２】また、実施例３と同様に、２つのビームフ
ォーマ１３，１５（または２２）からの出力として音声
周波数成分と雑音周波数成分が与えられるので、音声帯
域パワー計算部３１ではビームフォーマ１３からの出力
である音声周波数成分を用いて音声帯域パワー計算を実
施し（ステップＳ６２）、雑音帯域パワー計算部３２で
はビームフォーマ１５（または２２）からの出力である
雑音周波数成分を用いて雑音帯域パワー計算を実施する
（ステップＳ６３）。

【０１７３】そして、スペクトル減算部３４において、
上述したように重み係数を求めた後に、重み付けを行う
（ステップＳ６４，Ｓ６５）。これにより、方向を持つ
雑音成分および方向のない雑音成分を抑圧した歪みの少
い音声成分のみの抽出ができるようになる。

【０１７４】このように、実施例４は、上記実施例３の
雑音抑圧装置において、音声入力手段から得られた入力
信号を周波数分析した入力信号の周波数成分を周波数帯
域毎に分割し、帯域毎の入カパワーを計算する入力帯域
パワー計算手段を設けて、スペクトル減算手段には、入
力帯域パワーと音声帯域パワーと雑音帯域パワーとに基
き、音声信号の周波数帯域毎に重みをかけて背景雑音を
抑圧する処理を実施させるように構成したことを特徴と
するものである。

【０１７５】この構成の場合、音声帯域パワー計算手段
は、得られた音声周波数のスペクトル成分を、周波数帯
域毎に分割して帯域毎の音声パワーを計算し、雑音帯域
パワー計算手段は、前記得られた雑音周波数のスペクト
ル成分を、周波数帯域毎に分割して帯域毎の雑音パワー
を計算する。また、入力帯域パワー計算手段があり、こ
の入力帯域パワー計算手段は、音声入力手段から得られ
た入力信号を周波数分析して得た入力音声の周波数スペ
クトル成分を受けて、これを周波数帯域毎に分割し、帯
域毎の入カパワーを計算する。そして、スペクトル減算
手段は、前記音声帯域パワー計算手段と雑音帯域パワー
計算手段とから得られる音声と雑音の周波数帯域パワー
に基き、音声信号の周波数帯域毎に重みをかけて背景雑
音を抑圧する。

【０１７６】この実施例４においては、実施例３の構成
におけるスペクトルサブトラクション処理において、更
に雑音成分についてそのパワーを修正するようにしたこ
とにより、一層高精度に雑音抑圧を行うことを可能とす
るものである。すなわち、第３の発明では雑音源のパワ
−Ｎが小さいという仮定をおいたため、スペクトルサブ
トラクション処理を行うと雑音源の成分が音声に重畳し
ている部分では歪みが大きくなることが避けられない
が、ここでは入力信号のパワーを用いて第３の発明での
スペクトルサブトラクション処理における帯域重みの計
算を修正するようにした。これにより、方向を持つ雑音
成分および方向のない雑音成分を抑圧した歪みの少い音
声成分のみの抽出ができるようになるものである。

【０１７７】以上、種々の実施例を説明したが、本発明
は第１には、話者の発声した音声を少なくとも異なる２
箇所以上の位置で受音する音声入力手段と、前記受音位
置に対応する音声信号のチャネル毎に周波数分析を行っ
て複数チャネルの周波数成分を出力する周波数分析手段
と、この周波数分析手段にて得られる前記複数チャネル
の周波数成分について、所望方向外の感度が低くなるよ
うに計算したフィルタ係数を用いての適応フィルタ処理
を施すことにより前記話者方向からの音声以外の音声を
抑圧する到来雑音抑圧処理を行い、目的音声成分を得る
第１のビームフォーマ処理手段と、前記周波数分析手段
にて得られる前記複数チャネルの周波数成分について、
所望方向外の感度が低くなるように計算したフィルタ係
数を用いての適応フィルタ処理を施すことにより前記話
者方向からの音声を抑圧し、雑音成分を得る第２のビー
ムフォーマ処理手段と、前記第１のビームフォーマ処理
手段で計算されるフィルタ係数から雑音方向を推定する
雑音方向推定手段と、前記第２のビームフォーマ処理手
段で計算されるフィルタ係数から目的音方向を推定する
目的音方向推定手段と、前記第１のビームフォーマにお
いて入力対象となる目的音の到来方向である第１の入力
方向を、前記目的音方向推定手段で推定された目的音方
向に基づいて逐次修正する目的音方向修正手段と、前記
第２のビームフォーマにおいて入力対象とする雑音の到
来方向である第２の入力方向を、前記雑音方向推定手段
で推定された雑音方向に基づいて逐次修正する雑音方向
修正手段とを具備して構成したものである。

【０１７８】このような構成の場合、話者の発声した音
声を異なる２箇所以上の位置で音声入力手段は受音し、
周波数分析手段では、これを前記受音位置に対応する音
声信号のチャネル毎に周波数分析して複数チャネルの周
波数成分を出力する。そして、第１のビームフォーマ処
理手段はこの周波数分析手段にて得られる前記複数チャ
ネルの周波数成分について、所望方向外の感度が低くな
るように計算したフィルタ係数を用いての適応フィルタ
処理を施すことにより前記話者方向からの音声以外の音
声を抑圧する到来雑音抑圧処理を行い、目的音声成分を
得、また、第２のビームフォーマ処理手段は、前記周波
数分析手段にて得られる前記複数チャネルの周波数成分
について、所望方向外の感度が低くなるように計算した
フィルタ係数を用いての適応フィルタ処理を施すことに
より前記話者方向からの音声を抑圧し、雑音成分を得
る。そして、雑音方向推定手段は、前記第１のビームフ
ォーマ処理手段で計算されるフィルタ係数から雑音方向
を推定し、目的音方向推定手段は、前記第２のビームフ
ォーマ処理手段で計算されるフィルタ係数から目的音方
向を推定する。目的音方向修正手段は、前記第１のビー
ムフォーマにおいて入力対象となる目的音の到来方向で
ある第１の入力方向を、前記目的音方向推定手段で推定
された目的音方向に基づいて逐次修正するので、第１の
ビームフォーマは第１の入力方向以外から到来する雑音
成分を抑圧して話者の音声成分を低雑音で抽出すること
になる。また、雑音方向修正手段は、前記第２のビーム
フォーマにおいて入力対象とする雑音の到来方向である
第２の入力方向を、前記雑音方向推定手段で推定された
雑音方向に基づいて逐次修正するので、第２のビームフ
ォーマは第２の入力方向以外から到来する成分を抑圧し
て話者の音声成分を抑圧した残りの雑音成分を抽出する
ことになる。

【０１７９】このように本システムは雑音成分を抑圧し
た音声周波数成分と、音声成分を抑圧した雑音周波数成
分とを別々に得ることができるが、この発明の第１の特
徴は、第１及び第２のビームフォーマとして、周波数領
域で動作するビームフォーマを用いるようにした点にあ
る。そして、このことによって、計算量を大幅に削減す
ることができるようにしている。そしてこの発明による
と、適応フィルタの処理量が大幅に低減されるのに加
え、入力音声に対する周波数分析以外の周波数分析処理
を省略することができ、かつ、フィルタ演算時に必要で
あった時間領域から周波数領域ヘの変換処理も不要とな
り、全体の演算量を大幅に削減することができる。

【０１８０】すなわち、従来技術では、ビームフォーマ
で抑圧できない拡散性雑音の抑圧処理のために、スペク
トルサブトラクション処理を、ビームフォーマ処理の後
に行うようにしており、このスペクトルサブトラクショ
ン処理は周波数スペクトルを入力とするため、ＦＦＴ
（高速フーリエ変換）などの周波数分析が従来必要であ
ったが、周波数領域で動作するビームフォーマを用いる
と当該ビームフォーマからは周波数スペクトルが出力さ
れるため、これをスペクトルサブトラクション処理に流
用できるので、特別にスペクトルサブトラクション処理
のためのＦＦＴを実施する従来のＦＦＴ処理工程は省略
することができる。故に、全体の演算量を大幅に削減す
ることができる。

【０１８１】また、ビームフォーマのフィルタを用いた
方向推定の際に必要であった時間領域から周波数領域へ
の変換処理も不要となり、全体の演算量を大幅に削減す
ることができる。

【０１８２】また、第２には本発明は、話者の発声した
音声を少なくとも異なる２箇所以上の位置で受音する音
声入力手段と、前記受音位置に対応する音声信号のチャ
ネル毎に周波数分析を行って複数チャネルの周波数成分
を出力する周波数分析手段と、この周波数分析手段にて
得られる前記複数チャネルの周波数成分について、所望
方向外の感度が低くなるように計算したフィルタ係数を
用いての適応フィルタ処理を施すことにより前記話者方
向からの音声以外の音声を抑圧する到来雑音抑圧処理を
行い、目的音声成分を得る第１のビームフォーマ処理手
段と、前記周波数分析手段にて得られる前記複数チャネ
ルの周波数成分について、所望方向外の感度が低くなる
ように計算したフィルタ係数を用いての適応フィルタ処
理を施すことにより前記話者方向からの音声を抑圧し、
第１の雑音成分を得る第２のビームフォーマ処理手段
と、前記周波数分析手段にて得られる前記複数チャネル
の周波数成分について、所望方向外の感度が低くなるよ
うに計算したフィルタ係数を用いての適応フィルタ処理
を施すことにより前記話者方向からの音声を抑圧し、第
２の雑音成分を得る第２のビームフォーマ処理手段と、
前記第１のビームフォーマ処理手段で計算されるフィル
タ係数から雑音方向を推定する雑音方向推定手段と、前
記第２のビームフォーマ処理手段で計算されるフィルタ
係数から第１の目的音方向を推定する第１の目的音方向
推定手段と、前記第３の適応ビームフォーマ処理手段で
計算されるフィルタ係数から第２の目的音方向を推定す
る第２の目的音方向推定手段と、前記第１のビームフォ
ーマにおいて入力対象とする目的音の到来方向である第
１の入力方向を、前記第１の目的音方向推定手段で推定
された第１の目的音方向と、第２の目的音方向推定手段
で推定された第２の目的音方向のいずれか一方または両
方に基づいて逐次修正する第１の入力方向修正手段と、
前記雑音方向修正手段で推定された雑音方向が所定の第
１の範囲にある場合に、前記第２のビームフォーマにお
いて入力対象とする雑音の到来方向である第２の入力方
向を該雑音方向に基づいて逐次修正する第２の入力方向
修正手段と、前記雑音方向修正手段で推定された雑音方
向が所定の第２の範囲にある場合に、前記第３のビーム
フォーマにおいて入力対象とする雑音の到来方向である
第３の入力方向を該雑音方向に基づいて逐次修正する第
３の入力方向修正手段と、前記雑音方向推定手段で推定
された雑音方向が所定の第１の範囲から到来したか所定
の第２の範囲から到来したかに基づいて前記第１の出力
雑音と前記第２の出力雑音のいずれか一方を真の雑音出
力と決定していずれか一方の雑音を出力すると同時に、
第１の音声方向推定手段と第２の音声方向推定手段のい
ずれの推定結果が有効であるかを決定していずれか一方
の音声方向推定結果を第１の入力方向修正手段へ出力す
る有効雑音決定手段とを具備して構成する。

【０１８３】この第２の構成の場合、話者の発声した音
声を異なる２箇所以上の位置で音声入力手段は受音し、
周波数分析手段では、これを前記受音位置に対応する音
声信号のチャネル毎に周波数分析して複数チャネルの周
波数成分を出力する。そして、第１のビームフォーマ処
理手段はこの周波数分析手段にて得られる前記複数チャ
ネルの周波数成分について、所望方向外の感度が低くな
るように計算したフィルタ係数を用いての適応フィルタ
処理を施すことにより前記話者方向からの音声以外の音
声を抑圧する到来雑音抑圧処理を行い、目的音声成分を
得、また、第２のビームフォーマ処理手段は、前記周波
数分析手段にて得られる前記複数チャネルの周波数成分
について、所望方向外の感度が低くなるように計算した
フィルタ係数を用いての適応フィルタ処理を施すことに
より前記話者方向からの音声を抑圧し、雑音成分を得
る。そして、雑音方向推定手段は、前記第１のビームフ
ォーマ処理手段で計算されるフィルタ係数から雑音方向
を推定し、目的音方向推定手段は、前記第２のビームフ
ォーマ処理手段で計算されるフィルタ係数から目的音方
向を推定する。

【０１８４】また、第１の目的音方向推定手段は前記第
２のビームフォーマ処理手段で計算されるフィルタ係数
から第１の目的音方向を推定し、第２の目的音方向推定
手段は、前記第３の適応ビームフォーマ処理手段で計算
されるフィルタ係数から第２の目的音方向を推定する。

【０１８５】第１の入力方向修正手段は、前記第１のビ
ームフォーマにおいて入力対象とする目的音の到来方向
である第１の入力方向を、前記第１の目的音方向推定手
段で推定された第１の目的音方向と、第２の目的音方向
推定手段で推定された第２の目的音方向のいずれか一方
または両方に基づいて逐次修正する。そして、第２の入
力方向修正手段は、前記雑音方向修正手段で推定された
雑音方向が所定の第１の範囲にある場合に、前記第２の
ビームフォーマにおいて入力対象とする雑音の到来方向
である第２の入力方向を該雑音方向に基づいて逐次修正
し、第３の入力方向修正手段は、前記雑音方向修正手段
で推定された雑音方向が所定の第２の範囲にある場合
に、前記第３のビームフォーマにおいて入力対象とする
雑音の到来方向である第３の入力方向を該雑音方向に基
づいて逐次修正する。従って、第２の入力方向修正手段
の出力により第２の入力方向を修正される第２のビーム
フォーマは第２の入力方向以外から到来する成分を抑圧
して残りの雑音成分を抽出することになり、また、第３
の入力方向修正手段の出力により第３の入力方向を修正
される第３のビームフォーマは第３の入力方向以外から
到来する成分を抑圧して残りの雑音成分を抽出すること
になる。

【０１８６】そして、有効雑音決定手段は、前記雑音方
向推定手段で推定された雑音方向が所定の第１の範囲か
ら到来したか所定の第２の範囲から到来したかに基づい
て前記第１の出力雑音と前記第２の出力雑音のいずれか
一方を真の雑音出力と決定していずれか一方の雑音を出
力すると同時に、第１の音声方向推定手段と第２の音声
方向推定手段のいずれの推定結果が有効であるかを決定
して有効な方の音声方向推定結果を第１の入力方向修正
手段へ出力する。この結果、目的音方向修正手段は、前
記第１のビームフォーマにおいて入力対象となる目的音
の到来方向である第１の入力方向を、前記決定した方の
目的音方向推定手段で得た目的音方向に基づいて逐次修
正するので、第１のビームフォーマは第１の入力方向以
外から到来する雑音成分を抑圧して話者の音声成分を低
雑音で抽出することになる。

【０１８７】このように本システムは雑音成分を抑圧し
た音声周波数成分と、音声成分を抑圧した雑音周波数成
分とを別々に得ることができるが、この発明の最大の特
徴は、第１及び第２のビームフォーマとして、周波数領
域で動作するビームフォーマを用いるようにした点にあ
る。そして、このことによって、計算量を大幅に削減す
ることができるようにしている。

【０１８８】そしてこの発明によると、適応フィルタの
処理量が大幅に低減されるのに加え、入力音声に対する
周波数分析以外の周波数分析処理を省略することがで
き、かつ、フィルタ演算時に必要であった時間領域から
周波数領域ヘの変換処理も不要となり、全体の演算量を
大幅に削減することができる。

【０１８９】また、本発明では、雑音追尾に監視領域を
全く異ならせた雑音追尾用のビームフォーマを設けてあ
り、それぞれの出力からそれぞれ音声方向を推定させる
と共に、それぞれの推定結果からいずれが有効な雑音追
尾をしているかを判断して、有効と判断された方のビー
ムフォーマのフィルタ係数による音声方向の推定結果を
第１の目的音方向修正手段に与えることで第１の目的音
方向修正手段は、前記第１のビームフォーマにおいて入
力対象となる目的音の到来方向である第１の入力方向
を、前記目的音方向推定手段で推定された目的音方向に
基づいて逐次修正するので、第１のビームフォーマは第
１の入力方向以外から到来する雑音成分を抑圧して話者
の音声成分を低雑音で抽出することができ、雑音源が移
動してもこれを見失うことなく追尾して抑圧することが
できるようになるものである。

【０１９０】従来技術においては、２ｃｈ、すなわち、
２本のマイクロホンだけでも目的音源の追尾を可能とす
べく、雑音追尾用のビームフォーマを雑音抑圧のビーム
フォーマとは別に１個用いるが、例えば、雑音源が目的
音の方向を横切って移動したような場合、雑音の追尾精
度が低下することがあった。

【０１９１】しかし、本発明では、雑音を追尾するビー
ムフォーマを複数用いて各々別個の追尾範囲を受け持つ
ようにしたことにより、上記のような場合でも追尾精度
の低下を抑止できるようになる。

【０１９２】更に第３には、本発明は、上記第１または
第２の音抑圧装置において、前記得られた音声周波数
を、周波数帯域毎に分割して帯域毎の音声パワーを計算
する音声帯域パワー計算手段と、前記得られた雑音周波
数成分を、周波数帯域毎に分割して帯域毎の雑音パワー
を計算する雑音帯域パワー計算手段と、前記音声帯域パ
ワー計算手段と雑音帯域パワー計算手段とから得られる
音声と雑音の周波数帯域パワーに基き、音声信号の周波
数帯域毎に重みをかけて背景雑音を抑圧するスペクトル
減算手段とからなるスペクトル減算雑音抑圧手段をさら
に具備することを特徴とする。

【０１９３】この構成の場合、音声帯域パワー計算手段
は、得られた音声周波数のスペクトル成分を、周波数帯
域毎に分割して帯域毎の音声パワーを計算し、雑音帯域
パワー計算手段は、前記得られた雑音周波数のスペクト
ル成分を、周波数帯域毎に分割して帯域毎の雑音パワー
を計算する。そして、スペクトル減算手段は、前記音声
帯域パワー計算手段と雑音帯域パワー計算手段とから得
られる音声と雑音の周波数帯域パワーに基き、音声信号
の周波数帯域毎に重みをかけて背景雑音を抑圧する。

【０１９４】この構成によれば、ビームフォーマでは抑
圧できない方向性のない雑音（背景雑音）は、本発明シ
ステムのビームフォーマで得ることのできる目的音声成
分と雑音成分を利用し、これをスペクトルサブトラクシ
ョン処理することで抑圧する。すなわち、本システムで
は、ビームフォーマとして目的音声成分抽出用と雑音成
分抽出用の２つのビームフォーマを備えているが、これ
らのビームフォーマの出力である目的音声成分と雑音成
分を利用してスペクトルサブトラクション処理すること
により、方向性のない背景雑音成分の抑圧を行う。スペ
クトルサブトラクション（ＳＳ）処理は雑音抑圧処理と
して知られるが、一般的に行われるスペクトルサブトラ
クション（ＳＳ）処理は、１チャンネルのマイクロホン
（つまり、１本のマイクロホン）を用い、このマイクロ
ホンの出力から音声のない区間において雑音のパワーを
推定するため、非定常な雑音が音声に重畳している場合
には対処できない。また、２チャンネルのマイクロホン
（つまり、２本のマイクロホン）を用いて、一方を雑音
収集用、片方を雑音重畳音声収集用とする場合にも、両
マイクロホンの設置場所を離す必要があり、その結果、
音声に重畳する雑音と、雑音収集用マイクロホンで取り
込む雑音との位相がずれ、スペクトルサブトラクション
処理しても雑音抑圧の改善効果は大きく上がらない。

【０１９５】しかし、本発明では、雑音成分を取り出す
ビームフォーマを用意して、このビームフォーマの出力
を用いるようにしたため、位相のずれは補正されてお
り、従って、非定常雑音の場合でも高精度なスペクトル
サブトラクション処理を実現できる。さらに、周波数領
域のビームフォーマの出力を利用しているため、周波数
分析を省略してスペクトルサブトラクションが可能であ
り、従来より少ない演算量で非定常雑音を抑圧できる。

【０１９６】更に第４には、本発明は、上記第３の発明
の雑音抑圧装置において、音声入力手段から得られた入
力信号を周波数分析した入力信号の周波数成分を周波数
帯域毎に分割し、帯域毎の入カパワーを計算する入力帯
域パワー計算手段を設けて、スペクトル減算手段には、
入力帯域パワーと音声帯域パワーと雑音帯域パワーとに
基き、音声信号の周波数帯域毎に重みをかけて背景雑音
を抑圧する処理を実施させるようにすることを特徴とす
る。

【０１９７】この構成の場合、音声帯域パワー計算手段
は、得られた音声周波数のスペクトル成分を、周波数帯
域毎に分割して帯域毎の音声パワーを計算し、雑音帯域
パワー計算手段は、前記得られた雑音周波数のスペクト
ル成分を、周波数帯域毎に分割して帯域毎の雑音パワー
を計算する。また、入力帯域パワー計算手段があり、こ
の入力帯域パワー計算手段は、音声入力手段から得られ
た入力信号を周波数分析して得た入力音声の周波数スペ
クトル成分を受けて、これを周波数帯域毎に分割し、帯
域毎の入カパワーを計算する。そして、スペクトル減算
手段は、前記音声帯域パワー計算手段と雑音帯域パワー
計算手段とから得られる音声と雑音の周波数帯域パワー
に基き、音声信号の周波数帯域毎に重みをかけて背景雑
音を抑圧する。

【０１９８】この第４の発明においては、第３の発明の
スペクトルサブトラクション（ＳＳ）処理において、更
に雑音成分についてそのパワーを修正するようにしたこ
とにより、一層高精度に雑音抑圧を行うことを可能とす
るものである。すなわち、第３の発明では雑音源のパワ
−Ｎが小さいという仮定をおいたため、スペクトルサブ
トラクション（ＳＳ）処理を行うと雑音源の成分が音声
に重畳している部分では歪みが大きくなることが避けら
れないが、ここでは入力信号のパワーを用いて第３の発
明でのスペクトルサブトラクション処理における帯域重
みの計算を修正するようにした。これにより、方向を持
つ雑音成分および方向のない雑音成分を抑圧した歪みの
少い音声成分のみの抽出ができるようになるものであ
る。

【０１９９】尚、本発明は上述した実施例に限定される
ものではなく、種々変形して実施可能である。

【０２００】

【発明の効果】以上、詳述したように、本発明によれ
ば、全体の演算量を大幅に削減することができ、また、
ビームフォーマのフィルタを用いた方向推定の際に必要
であった時間領域から周波数領域への変換処理も不要と
なり、全体の演算量を大幅に削減することができると云
う効果が得られる。

【０２０１】また、本発明では、雑音成分を取り出すビ
ームフォーマを用意して、このビームフォーマの出力を
用いるようにしたため、位相のずれは補正されており、
従って、非定常雑音の場合でも高精度なスペクトルサブ
トラクション処理を実現できる。さらに、周波数領域の
ビームフォーマの出力を利用しているため、周波数分析
を省略してスペクトルサブトラクションが可能であり、
従来より少ない演算量で非定常雑音を抑圧できて、方向
性のある雑音成分ばかりか、方向性のない雑音成分（背
景雑音）も抑圧できて歪みの少い音声成分の抽出ができ
るようになると云う効果が得られる。

【図面の簡単な説明】

【図１】本発明の実施例１の全体構成を示すブロック図
である。

【図２】本発明で使用するビームフォーマの構成例と動
作例を説明する図である。

【図３】本発明の実施例１における方向推定部の作用を
説明するためのフローチャートである。

【図４】本発明の実施例１におけるシステムの作用を説
明するためのフローチャートである。

【図５】本発明の実施例２の全体構成を示すブロック図
である。

【図６】本発明の実施例２におけるビームフォーマの追
尾範囲を説明するための図である。

【図７】本発明の実施例２におけるシステムの作用を説
明するためのフローチャートである。

【図８】本発明の実施例３の要部構成を示すブロック図
である。

【図９】本発明の実施例２におけるシステムの作用を説
明するためのフローチャートである。

【図１０】本発明の実施例４の要部構成を示すブロック
図である。

【図１１】本発明の実施例２におけるシステムの作用を
説明するためのフローチャートである。

【符号の説明】

１１…音声入力部１２…周波数解析部１３…第１のビームフォーマ１４…第１の入力方向修正部１５…第２の入力方向修正部１６…第２のビームフォーマ１７…雑音方向推定部１８…第１の音声方向推定部（目的音方向推定部）２１…第３の入力方向修正部２２…第３のビームフォーマ２３…第２の音声方向推定部２４…有効雑音決定部３０…スペクトルサブトラクション（ＳＳ）処理部３１…音声帯域パワー計算部３２…雑音帯域パワー計算部３３…帯域重み計算部３４…スペクトル減算部３５…入力信号帯域パワー計算部

───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.⁷ 識別記号ＦＩテーマコート゛(参考）Ｈ０３Ｈ 21/00 Ｆターム(参考） 5D015 CC02 CC14 DD02 EE05 5J023 DA05 DB02 DC06 DC08 DD03 5J083 AA05 AB10 AC07 AC15 AC18 AC30 AD15 BC01 BE12 BE14 BE18 BE43 BE53 BE58 CA10 CA12

Claims

【特許請求の範囲】

【請求項１】話者の発声した音声を２箇所以上の異なっ
た位置で受音する音声入力手段と、前記受音位置に対応する音声信号のチャネルごとに周波
数分析を行って複数チャネルの周波数成分を出力する周
波数分析手段と、前記複数チャネルの周波数成分を用いて適応フィルタ処
理により目的の音声以外の到来雑音の抑圧処理を行って
目的音声を出力する第１のビームフォーマ処理手段と、前記複数チャネルの周波数成分を用いて適応フィルタ処
理により目的の音声の抑圧処理を行って雑音を出力する
第２のビームフォーマ処理手段と、前記第１のビームフォーマ処理手段で計算されるフィル
タ係数から雑音方向を推定する雑音方向推定手段と、前記第２のビームフォーマ処理手段で計算されるフィル
タ係数から目的音方向を推定する目的音方向推定手段
と、前記第１のビームフォーマにおいて入力対象となる目的
音の到来方向である第１の入力方向を、前記目的音方向
推定手段で推定された目的音方向に基づいて逐次修正す
る目的音方向修正手段と、前記第２のビームフォーマにおいて入力対象とする雑音
の到来方向である第２の入力方向を、前記雑音方向推定
手段で推定された雑音方向に基づいて逐次修正する雑音
方向修正手段とを具備し、逐次、音声周波数成分と雑音周波数成分とを別々に出力
することを特徴とする雑音抑圧装置。
【請求項２】話者の発声した音声を少なくとも異なる２
箇所以上の位置で受音する音声入力手段と、前記受音位
置に対応する音声信号のチャネル毎に周波数分析を行っ
て複数チャネルの周波数成分を出力する周波数分析手段
と、この周波数分析手段にて得られる前記複数チャネル
の周波数成分について、所望方向外の感度が低くなるよ
うに計算したフィルタ係数を用いての適応フィルタ処理
を施すことにより前記話者方向からの音声以外の音声を
抑圧する到来雑音抑圧処理を行い、目的音声成分を得る
第１のビームフォーマ処理手段と、前記周波数分析手段にて得られる前記複数チャネルの周
波数成分について、所望方向外の感度が低くなるように
計算したフィルタ係数を用いての適応フィルタ処理を施
すことにより前記話者方向からの音声を抑圧し、第１の
雑音成分を得る第２のビームフォーマ処理手段と、前記周波数分析手段にて得られる前記複数チャネルの周
波数成分について、所望方向外の感度が低くなるように
計算したフィルタ係数を用いての適応フィルタ処理を施
すことにより前記話者方向からの音声を抑圧し、第２の
雑音成分を得る第２のビームフォーマ処理手段と、前記第１のビームフォーマ処理手段で計算されるフィル
タ係数から雑音方向を推定する雑音方向推定手段と、前記第２のビームフォーマ処理手段で計算されるフィル
タ係数から第１の目的音方向を推定する第１の目的音方
向推定手段と、前記第３の適応ビームフォーマ処理手段で計算されるフ
ィルタ係数から第２の目的音方向を推定する第２の目的
音方向推定手段と、前記第１のビームフォーマにおいて入力対象とする目的
音の到来方向である第１の入力方向を、前記第１の目的
音方向推定手段で推定された第１の目的音方向と、第２
の目的音方向推定手段で推定された第２の目的音方向の
いずれか一方または両方に基づいて逐次修正する第１の
入力方向修正手段と、前記雑音方向修正手段で推定された雑音方向が所定の第
１の範囲にある場合に、前記第２のビームフォーマにお
いて入力対象とする雑音の到来方向である第２の入力方
向を該雑音方向に基づいて逐次修正する第２の入力方向
修正手段と、前記雑音方向修正手段で推定された雑音方向が所定の第
２の範囲にある場合に、前記第３のビームフォーマにお
いて入力対象とする雑音の到来方向である第３の入力方
向を該雑音方向に基づいて逐次修正する第３の入力方向
修正手段と、前記雑音方向推定手段で推定された雑音方向が所定の第
１の範囲から到来したか所定の第２の範囲から到来した
かに基づいて前記第１および第２の出力雑音のいずれか
一方を真の雑音出力と決定していずれか一方の雑音を出
力すると同時に、第１の音声方向推定手段と第２の音声
方向推定手段のいずれの推定結果が有効であるかを決定
していずれか一方の音声方向推定結果を第１の入力方向
修正手段へ出力する有効雑音決定手段と、を具備し、逐次、音声周波数成分と雑音周波数成分とを
別々に出力することを特徴とする雑音抑圧装置。
【請求項３】請求項１または２いずれか１項に記載の雑
音抑圧装置において、前記得られた音声周波数を、周波数帯域毎に分割して帯
域毎の音声パワーを計算する音声帯域パワー計算手段
と、前記得られた雑音周波数成分を、周波数帯域毎に分割し
て帯域毎の雑音パワーを計算する雑音帯域パワー計算手
段と、前記音声帯域パワー計算手段と雑音帯域パワー計算手段
とから得られる音声と雑音の周波数帯域パワーに基き、
音声信号の周波数帯域毎に重みをかけて背景雑音を抑圧
するスペクトル減算手段と、からなるスペクトル減算雑
音抑圧手段をさらに具備することを特徴とする雑音抑圧
装置。
【請求項４】請求項１または２いずれか１項に記載の雑
音抑圧装置において、前記得られた音声周波数を、周波数帯域毎に分割して帯
域毎の音声パワーを計算する音声帯域パワー計算手段
と、前記得られた雑音周波数成分を、周波数帯域毎に分割し
て帯域毎の雑音パワーを計算する雑音帯域パワー計算手
段と、前記音声入力手段から得られた入力信号を周波数分析し
た入力信号の周波数成分を周波数帯域毎に分割し、帯域
毎の入カパワーを計算する入力帯域パワー計算手段と、前記入力帯域パワーと音声帯域パワーと雑音帯域パワー
とに基き、音声信号の周波数帯域毎に重みをかけて背景
雑音を抑圧する修正スペクトル減算手段を具備すること
を特徴とする雑音抑圧装置。
【請求項５】話者の発声した音声を２箇所以上の異なっ
た位置でそれぞれ受音してそれぞれ別チャンネルの音声
信号として得るステップと、この各チャンネル毎の音声信号を周波数分析してそれぞ
れチャネル別に周波数スペクトル成分を得る周波数分析
ステップと、周波数分析ステップにて得られた各チャネルの周波数成
分を用いて適応フィルタ処理により目的の音声以外の到
来雑音を抑圧処理し、目的音声を得る第１のビームフォ
ーマ処理ステップと、前記各チャネルの周波数成分を用いて適応フィルタ処理
により目的の音声の抑圧処理を行って雑音成分を得る第
２のビームフォーマ処理ステップと、前記第１のビームフォーマ処理ステップで計算される適
応フィルタで使用したフィルタ係数から雑音方向を推定
する雑音方向推定ステップと、前記第２のビームフォーマ処理ステップで計算される適
応フィルタで使用したフィルタ係数から目的音方向を推
定する目的音方向推定ステップと、前記第１のビームフォーマ処理ステップにおいて入力対
象となる目的音の到来方向である第１の入力方向を、前
記目的音方向推定手段で推定された目的音方向に基づい
て逐次修正する目的音方向修正ステップと、前記第２のビームフォーマ処理ステップにおいて入力対
象とする雑音の到来方向である第２の入力方向を、前記
雑音方向推定ステップで推定された雑音方向に基づいて
逐次修正する雑音方向修正ステップとを具備し、逐次、音声周波数成分と雑音周波数成分とを別々に求め
ることを特徴とする雑音抑圧方法。
【請求項６】話者の発声した音声を２箇所以上の異なっ
た位置でそれぞれ受音してそれぞれ別チャンネルの音声
信号として得るステップと、この各チャンネル毎の音声信号を周波数分析してそれぞ
れチャネル別に周波数スペクトル成分を得る周波数分析
ステップと、周波数分析ステップにて得られた各チャネルの周波数成
分を用いて前記複数チャネルの周波数成分について、所
望方向外の感度が低くなるようにしたフィルタ係数を用
いての適応フィルタ処理を施すことにより前記話者方向
からの音声以外の音声を抑圧する到来雑音抑圧処理を行
い、目的音声成分を得る第１のビームフォーマ処理ステ
ップと、周波数分析ステップにて得られた各チャネルの周波数成
分を用いて前記複数チャネルの周波数成分について、所
望方向外の感度が低くなるように計算したフィルタ係数
を用いての適応フィルタ処理を施すことにより前記話者
方向からの音声を抑圧し、第１の雑音成分を得る第２の
ビームフォーマ処理ッステップと、周波数分析ステップにて得られた各チャネルの周波数成
分を用いて前記複数チャネルの周波数成分について、所
望方向外の感度が低くなるようにしたフィルタ係数を用
いての適応フィルタ処理を施すことにより前記話者方向
からの音声を抑圧し、第２の雑音成分を得る第２のビー
ムフォーマ処理ステップと、前記第１のビームフォーマ処理ステップで計算されるフ
ィルタ係数から雑音方向を推定する雑音方向推定ステッ
プと、前記第２のビームフォーマ処理ステップで計算されるフ
ィルタ係数から第１の目的音方向を推定する第１の目的
音方向推定ステップと、前記第３の適応ビームフォーマ処理ステップで計算され
るフィルタ係数から第２の目的音方向を推定する第２の
目的音方向推定ステップと、前記第１のビームフォーマにおいて入力対象とする目的
音の到来方向である第１の入力方向を、前記第１の目的
音方向推定手段で推定された第１の目的音方向と、第２
の目的音方向推定手段で推定された第２の目的音方向の
いずれか一方または両方に基づいて逐次修正する第１の
入力方向修正ステップと、前記雑音方向修正ステップで推定された雑音方向が所定
の第１の範囲にある場合に、前記第２のビームフォーマ
処理ステップにおいて入力対象とする雑音の到来方向で
ある第２の入力方向を該雑音方向に基づいて逐次修正す
る第２の入力方向修正ステップと、前記雑音方向修正ステップで推定された雑音方向が所定
の第２の範囲にある場合に、前記第３のビームフォーマ
処理ステップにおいて入力対象とする雑音の到来方向で
ある第３の入力方向を該雑音方向に基づいて逐次修正す
る第３の入力方向修正ステップと、前記雑音方向推定ステップで推定された雑音方向が所定
の第１の範囲から到来したか所定の第２の範囲から到来
したかに基づいて前記第１および第２の出力雑音のいず
れか一方を真の雑音出力と決定していずれか一方の雑音
を出力すると同時に、第１の音声方向推定手段と第２の
音声方向推定手段のいずれの推定結果が有効であるかを
決定していずれか一方の音声方向推定結果を第１の入力
方向修正ステップで使用する音声方向推定結果として与
える有効雑音決定ステップと、を具備することを特徴と
する雑音抑圧方法。
【請求項７】請求項５または６いずれか１項に記載の雑
音抑圧方法において、前記得られた音声周波数を、周波数帯域毎に分割して帯
域毎の音声パワーを計算する音声帯域パワー計算ステッ
プと、前記得られた雑音周波数成分を、周波数帯域毎に分割し
て帯域毎の雑音パワーを計算する雑音帯域パワー計算ス
テップと、前記音声帯域パワー計算ステップにて得られる音声の周
波数帯域パワーと、雑音帯域パワー計算ステップにて得
られる雑音の周波数帯域パワーとに基き、音声信号の周
波数帯域毎に重みをかけて背景雑音を抑圧するスペクト
ル減算ステップと、をさらに具備することを特徴とする
雑音抑圧方法。
【請求項８】請求項５または６いずれか１項に記載の雑
音抑圧方法において、前記得られた音声周波数を、周波数帯域毎に分割して帯
域毎の音声パワーを計算する音声帯域パワー計算ステッ
プと、前記得られた雑音周波数成分を、周波数帯域毎に分割し
て帯域毎の雑音パワーを計算する雑音帯域パワー計算ス
テップと、前記周波数分析ステップにて得られた入力信号の周波数
スペクトル成分を周波数帯域毎に分割し、帯域毎の入カ
パワーを計算する入力帯域パワー計算ステップと、前記入力帯域パワーと音声帯域パワーと雑音帯域パワー
とに基き、音声信号の周波数帯域毎に重みをかけて背景
雑音を抑圧する修正スペクトル減算ステップと、を具備
することを特徴とする雑音抑圧方法。