JP3812887B2

JP3812887B2 - 信号処理システムおよび方法

Info

Publication number: JP3812887B2
Application number: JP2001390189A
Authority: JP
Inventors: 健太郎村瀬; 拓也野田; 一宏渡辺
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 2001-12-21
Filing date: 2001-12-21
Publication date: 2006-08-23
Anticipated expiration: 2021-12-21
Also published as: US20030120485A1; US7203640B2; JP2003195882A

Description

【０００１】
【発明の属する技術分野】
本発明は、例えば、光、音、超音波、電磁波などに代表される媒質中を伝搬する波動信号から検出対象となる目的信号区間と雑音信号区間とを検出する信号処理システムおよび方法に関する。ここで言う「媒質」とは、波動が伝搬する媒体、空間、場の全てを包含する概念とする。
【０００２】
【従来の技術】
目的とする波源から到達した波動信号を受信して得た入力信号には、目的信号以外の雑音信号が混入していることが多い。雑音のレベルが大きいと目的信号の処理精度を劣化させる。特に、音声認識を用いるアプリケーションでは、雑音のレベルが大きいと目的信号である音声信号が正しく認識できない。そこで、従来から音声信号処理において目的信号区間と目的信号区間以外の雑音信号区間とを検出して切り分ける処理が重要とされている。
【０００３】
従来技術において、目的信号区間と雑音信号区間の切り分け処理として、入力音声信号のパワーの変化に注目した切り分け処理が多く用いられている。その基本原理は、入力された音声信号のパワーを調べ、そのパワーがある閾値を超えた時に目的信号区間とみなして切り分けるというものである。
【０００４】
他の目的信号区間と雑音信号区間の切り分け処理として、入力信号の到来方向を検出し、目的信号を発している波源があると想定している方向と当該入力信号の到来方向が一致していれば、当該入力信号を目的信号区間とみなして切り分けるというものである。波源があると想定している方向以外の方向から到来する入力信号は全て雑音信号とみなす。従来技術において、入力信号の到来方向を検出する方法としては、相互相関法を用いた遅延時間検出処理などが知られている。
【０００５】
次に、電話や音声認識装置では、上記の目的信号区間と雑音信号区間の検出処理だけでなく、聞きやすさや音声認識率を向上させるため、雑音抑制処理を付加することも多い。従来技術における雑音抑制処理としては、スペクトルサブトラクション処理が広く知られている。スペクトルサブトラクション処理とは、入力信号をフーリエ変換で周波数領域上のスペクトルに変換した後、雑音信号区間で雑音スペクトルモデルを推定し、推定した雑音スペクトルを目的信号区間で入力信号のスペクトルから減算して雑音信号を除き、逆フーリエ変換により再び時間領域上の信号へ戻す処理である。
【０００６】
【発明が解決しようとする課題】
しかし、上記従来の目的信号区間と雑音信号区間の検出処理には以下の問題がある。
【０００７】
まず、従来の入力音声信号のパワーの変化に注目した目的信号区間と雑音信号区間の検出処理では、雑音信号のレベルが目的信号に近い場合、正確に目的信号と雑音信号を検出することが困難であるという問題がある。
【０００８】
図１３は、従来の入力信号のパワーに基づく信号区間検出処理とスペクトルサブトラクションによる雑音抑制処理によって雑音を抑制するシステムを説明する図である。特に、扱う信号が音声信号の場合を説明する。
【０００９】
５１０はマイクロフォンである。５２０はパワー信号区間検出部であり、従来の入力信号のパワーと所定の閾値を比較して目的信号区間と雑音信号区間を切り分けて検出する処理を実行する部分である。５３０はスペクトルサブトラクション部であり、従来のスペクトルサブトラクションによる雑音信号の抑制処理を行なう部分である。
【００１０】
マイクロフォン５１０に入力する音は、話者の音声信号５０１と、雑音信号５０２とする。雑音信号５０２は定常雑音信号に非定常雑音信号が混入しているものとする。マイクロフォンへの入力信号５０３はこれら音声信号５０１と雑音信号５０２が重畳加算されたものであり、定常雑音信号区間である信号区間▲１▼▲４▼▲６▼と、非定常雑音信号区間である信号区間▲２▼▲５▼と、音声信号区間である信号区間▲３▼からなる。
【００１１】
パワー信号区間検出部５２０は上記の入力信号を受け、入力信号のパワーに基づく信号区間検出処理を実行し、信号区間検出結果５０４を得る。パワー信号区間検出部５２０は、閾値を下回る信号区間▲１▼▲４▼▲６▼を雑音信号区間と判定し、閾値を超える信号区間▲２▼▲３▼▲５▼は全て音声区間と判定する。
【００１２】
しかし、本来、信号区間▲２▼▲５▼は非定常な雑音信号区間であり、信号区間検出に失敗していることが分かる。
【００１３】
このように従来の入力信号のパワーに基づく信号区間検出では、音声信号と同等レベルの非定常な雑音信号区間を音声信号区間と誤判定することがあり、正確な信号区間検出が実行できない場合がある。また、雑音源が他者音声である場合、相関関数などパワー以外の特徴量を用いても、雑音である他者音声を目的音声と誤判定してしまう恐れがある。
【００１４】
更に、スペクトルサブトラクション部５３０による雑音抑制結果５０５を見ると、定常雑音信号区間である▲１▼▲４▼▲６▼と音声信号区間▲３▼では定常雑音の除去により、正しくかつ効果的に雑音信号成分が抑制されているが、非定常雑音信号区間▲２▼▲５▼では、信号区間検出結果５０４において音声信号区間と誤判定されているため、定常的な雑音信号成分しか除去されておらず、大部分の非定常雑音信号成分が消えずに残っている。
【００１５】
このように、従来の入力信号のパワーに基づく信号区間検出処理では、非定常な雑音信号区間を音声信号区間と誤って検出する場合があるため、正確な信号区間検出処理を行なうことができず、さらに、雑音信号の抑制に関しても、非定常な雑音信号成分の抑制ができない。
【００１６】
次に、従来における、入力信号の到来方向に基づく目的信号区間と雑音信号区間の切り分け処理では、目的音を発する波源と同じ方向に雑音源がある場合、正確に目的信号と雑音信号を切り分けることが困難であるという問題がある。つまり、目的信号区間と検出した信号区間において、実際には雑音信号区間であるものが混入している可能性がある。
【００１７】
また、雑音信号区間と検出した信号区間に関しては、当該信号区間が定常雑音信号区間であるのか、非定常雑音信号区間であるのかを区別することはできないという問題がある。
【００１８】
図１４は、従来の入力信号の到来方向に基づく信号区間検出処理とスペクトルサブトラクションによる雑音抑制処理によって雑音を抑制するシステムを説明する図である。
【００１９】
マイクロフォン５１０およびスペクトルサブトラクション部５２０は、図１３と同様のものである。
【００２０】
５３０は到来方向検出部であり、入力信号の到来方向の検出し、到来方向に基づいて目的信号区間と雑音信号区間を切り分ける処理を実行する部分である。到来方向検出処理は、相互相関法による遅延時間検出により行なうものとする。
【００２１】
マイクロフォン５１０に入力する音は、図１３と同様、音声信号５０１と、雑音信号５０２とする。雑音信号５０２は定常雑音に非定常な雑音が混入しているものとする。マイクロフォンへの入力信号５０３はこれら音声信号５０１と雑音信号５０２が重畳加算されたものであり、定常雑音信号区間である信号区間▲１▼▲４▼▲６▼と、非定常雑音信号区間である信号区間▲２▼▲５▼と、音声信号区間である信号区間▲３▼からなる。
【００２２】
到来方向検出部５３０は上記の入力信号を受け、入力信号の到来方向に基づく信号区間検出処理を実行し、信号区間検出結果５０６に示す結果を得る。到来方向検出部５３０では、予め設定しておいた目的音の到来方向（話者方向）と入力音の到来方向が一致する区間▲３▼のみを音声区間と判定し、それ以外の区間▲１▼▲２▼▲４▼▲５▼▲６▼を雑音信号区間と判定する。
【００２３】
しかし、到来方向検出部５３０のみでは、雑音信号区間▲１▼▲２▼▲４▼▲５▼▲６▼が、定常雑音信号区間であるのか、非定常雑音信号区間であるのかを区別することはできない。
【００２４】
スペクトルサブトラクション部５３０による雑音抑制は、スペクトルサブトラクションは本来定常的な雑音のみを推定し抑制する手法である。到来方向に基づく区間検出処理を用いた場合、検出された雑音信号区間が定常雑音信号区間であるか非定常雑音信号区間であるかは区別されていないため、各々の雑音信号区間▲１▼▲２▼▲４▼▲５▼▲６▼に基づいて雑音モデルの推定を行なうこととなる。そのため、音声信号区間▲３▼の直前にある非定常雑音信号区間▲２▼においても雑音モデルを推定してしまう。その結果、実際には音声信号区間▲３▼に存在していない雑音成分を重畳した雑音モデルに基づいて推定した雑音スペクトルを入力スペクトルから減じてしまうこととなり、音声信号区間▲３▼の信号が歪んでしまう。
【００２５】
本発明は、上記問題点を解決するべく、入力信号を目的信号区間と雑音信号区間に分類するだけでなく、雑音信号区間を複数の性質の異なる区間に分類し、更に、検出した各信号区間の性質に応じた雑音抑制処理を適用することを目的とする。特に、定常雑音と非定常雑音が混在する入力環境において、両者を正しく区別し、定常雑音に対する適切な雑音抑制処理および非定常雑音に対する適切な雑音抑制処理を実行することを目的とする。
【００２６】
【課題を解決するための手段】
上記目的を達成するため、本発明の信号処理システムは、入力信号を入力する入力部と、前記入力信号から検出対象となる目的信号が記録されている信号区間の候補である目的信号区間候補と当該目的信号区間候補以外の雑音信号区間候補を検出する複数の信号区間候補検出部であって、それぞれが用いる目的信号区間候補および雑音信号区間候補の検出アルゴリズムが異なる信号区間候補検出部と、前記複数の信号区間候補検出部から各信号区間候補に対する各々の検出結果の通知を受け、当該検出結果の組み合わせにより、各信号区間候補を分類する信号区間分類部を備えたことを特徴とする。
【００２７】
ここで、前記信号区間分類部による分類において、前記複数の信号区間候補検出部のすべてにおいて目的信号区間候補と検出された信号区間候補を目的信号区間とし、前記複数の信号区間候補検出部のすべてにおいて雑音信号区間候補と検出された信号区間候補を第１種雑音信号区間とし、前記複数の信号区間候補検出部のいずれかにおいて目的信号区間候補と検出され、かつ、いずれかにおいて雑音信号区間候補と検出された信号区間候補を第２種雑音信号区間として分類することが好ましい。
【００２８】
上記構成により、入力信号を目的信号区間と雑音信号区間に分類するだけでなく、雑音信号区間を複数の性質の異なる雑音信号区間に分類することができる。
【００２９】
また、前記信号区間分類部において、前記第１種雑音信号区間を定常雑音のみが現れている定常雑音信号区間と分類し、前記第２種雑音信号区間を定常雑音と非定常雑音が重畳して現れている非定常雑音信号区間と分類すれば、雑音信号区間を適切に定常雑音信号区間と非定常雑音信号区間に分類することができる。
【００３０】
ここで、前記信号区間候補検出部のうち、少なくとも一つが、前記入力された信号のパワーの変化に基づいて前記目的信号区間候補と前記雑音信号区間候補とを検出するアルゴリズムを用いるものであるとし、また、前記信号区間候補検出部のうち、少なくとも一つが、前記入力された信号の到来方向を検出し、当該到来方向に基づいて前記目的信号区間候補と前記雑音信号区間候補とを検出するアルゴリズムを用いるものであるとすると、適切に雑音信号区間候補を複数の性質の異なる雑音信号区間候補に分類することができる。
【００３１】
上記のパワーの変化に基づく信号区間候補検出処理および到来方向に基づく信号区間候補検出処理を実行するため、本発明の信号処理システムにおいて、入力部を介して入力される信号が、少なくとも２箇所の観測地点から得た複数の入力信号であり、前記複数の入力信号から任意に選んだ２つの入力信号の相互相関関数に基づいて遅延時間を求める遅延時間検出部と、前記遅延時間検出部が検出した遅延時間に基づいて、前記任意に選んだ２つの入力信号の入力地点に対する、前記入力信号の到来方向を検出する方向検出部を備えている。
【００３２】
ここで、上記の到来方向に基づく信号区間候補検出処理を簡便に実行する工夫とし、本発明の信号処理システムは、前記入力部を介して入力される信号が、少なくとも２箇所の観測地点から得た複数の入力信号であり、前記複数の入力信号から任意に選んだ２つの入力信号の差分信号を演算する差分信号演算部と、前記任意に選んだ２つの入力信号のうちの１つの入力信号の微分信号を演算する微分信号演算部と、前記差分信号を前記微分信号で除算した除算信号を演算する除算信号演算部と、前記除算信号を前記任意に選んだ２つの入力信号間の遅延時間とする遅延時間検出部と、前記遅延時間検出部が検出した遅延時間に基づいて、前記任意に選んだ２つの入力信号の観測地点に対する、前記入力信号の到来方向を検出する方向検出部を備えるものとする。
【００３３】
上記構成により、相互相関法など演算量の多いアルゴリズムに基づく処理に変え、各１回の差分演算、微分演算、除算演算のみで近似的に遅延時間および到来方向を得ることが可能となる。
【００３４】
雑音抑制処理に関して、本発明の信号処理システムは、前記目的信号区間候補および前記雑音信号区間候補のすべてに対して同一の雑音抑制処理を適用する、または、前記信号区間分類部による分類結果に応じて適用する雑音抑制処理を選択して適用する雑音抑制部を備える。また、前記目的信号区間の信号に対して雑音抑制処理を行なわず、前記定常雑音信号区間の信号および前記非定常雑音信号区間の信号に対して、１より小さい重み付けの雑音抑制処理を行なう雑音抑制部を備えるものでも良い。さらに、前記定常雑音信号区間と分類された信号区間においてのみ定常雑音モデルの推定処理を実行し、前記目的信号区間および非定常雑音信号区間と分類された信号区間において雑音モデルの推定処理を停止する雑音モデル推定部を備え、前記雑音抑制部は、前記雑音モデル推定部が推定した雑音モデルに基づき、雑音抑制を行うものでも良い。
【００３５】
上記構成により、定常雑音に対する適切な雑音抑制処理および非定常雑音に対する適切な雑音抑制処理を実行することができる。
【００３６】
なお、目的信号区間の音声信号に対する音声認識を行う音声認識部を備えれば、精度の高い音声認識処理が可能となる。
【００３７】
また、上記処理をプログラムとして提供すれば、本発明の波動信号処理をコンピュータ上で実行することができる。
【００３８】
【発明の実施の形態】
以下、図面を参照しつつ、本発明の信号処理システムおよび信号処理方法の実施形態を説明する。
【００３９】
（実施形態１）
実施形態１にかかる本発明の信号処理システムを説明する。
【００４０】
実施形態１の信号処理システムは、入力信号から検出対象となる目的信号が記録されている信号区間の候補である目的信号区間候補と雑音信号区間候補を検出する複数の信号区間候補検出部と、前記複数の信号区間候補検出部から各信号区間候補に対する各々の検出結果の通知を受け、当該検出結果の組み合わせにより、各信号区間候補を分類する信号区間分類部を備える構成のものである。
【００４１】
本発明の信号処理システムは、入力信号を目的信号区間候補と雑音信号区間候補を検出するだけでなく、検出された雑音信号区間候補を複数の性質の異なる雑音信号区間候補に区別する情報を得るため、異なるアルゴリズムにより入力信号から検出対象となる目的信号区間候補と雑音信号区間候補とを検出する複数の信号区間候補検出部を用いるものである。
【００４２】
図１は、実施形態１にかかる信号処理システムの構成を示す図である。
【００４３】
図１において、１０は入力部、２０は信号区間候補検出部、３０は信号区間分類部である。
【００４４】
入力部１０は信号を入力する部分である。例えば、マイクロフォン、光センサなど、入力対象となる波動信号を受信する各種入力デバイスである。また、外部で採取され、記録された信号を入力するデータ入力デバイスであっても良い。
【００４５】
信号区間候補検出部２０は、入力部１０を介して入力された信号から、検出対象となる目的信号区間候補と当該目的信号区間候補以外の雑音信号区間候補とを検出する複数の信号区間候補検出処理を実行するものである。図１には、第１の信号区間候補検出から第Ｎの信号区間候補検出部までが示されている。ここでＮは２以上の整数である。以下の信号区間候補検出処理の説明では便宜上、３つの信号区間候補検出部２０ａ〜２０ｃについて説明する。
【００４６】
ここで、各々の信号区間候補検出部２０ａ〜２０ｃはそれぞれ異なったアルゴリズムにより、信号から検出対象となる目的信号区間候補と当該目的信号区間候補以外の雑音信号区間候補とを検出するものである。
【００４７】
このように、本発明の信号処理システムは、異なったアルゴリズムにより信号区間候補を検出するので、雑音信号区間候補を複数の性質の異なる雑音信号区間候補に分類する情報を得ることができる。
【００４８】
信号区間分類部３０は、複数の信号区間候補検出部２０から各信号区間候補に対する各々の検出結果の通知を受け、当該検出結果の組み合わせにより、各信号区間候補を分類する部分である。
【００４９】
当該実施形態１において、信号区間分類部３０の当該分類処理は、以下の第１から第３の基準により行われる。
【００５０】
第１の基準は、複数の信号区間候補検出部２０のすべてにおいて目的信号区間候補と検出された信号区間候補を目的信号区間と分類する基準である。
【００５１】
第２の基準は、複数の信号区間候補検出部２０のすべてにおいて雑音信号区間候補と検出された信号区間候補を第１種雑音信号区間と分類する基準である。
【００５２】
第３の基準は、複数の信号区間候補検出部２０のいずれかにおいて目的信号区間候補と検出され、かつ、いずれかにおいて雑音信号区間候補と検出された信号区間候補を第２種雑音信号区間として分類する基準である。
【００５３】
上記の第１の基準は、複数の信号区間候補検出部２０のすべてにおいて目的信号区間候補と検出された信号区間候補を目的信号区間と分類するものである。当該第１の基準により分類された信号区間候補は、すべての信号区間候補検出部２０（この例では２０ａから２０ｃ）のすべてのアルゴリズムによって目的信号区間候補と検出された信号区間候補であり、目的信号区間と想定されるすべての条件を満たす信号区間候補となっている。
【００５４】
次に、上記第２の基準は、複数の信号区間候補検出部２０のすべてにおいて雑音信号区間候補と検出された信号区間候補を第１種雑音信号区間と分類するものである。当該第２の基準により分類された信号区間候補は、すべての信号区間候補検出部２０（この例では２０ａから２０ｃ）のすべてのアルゴリズムによって雑音信号区間候補と検出された信号区間候補であり、雑音信号区間と想定されるすべての条件を満たす信号区間候補となっている。
【００５５】
次に、上記第３の基準は、複数の信号区間候補検出部２０のいずれかにおいて目的信号区間候補と検出され、かつ、いずれかにおいて雑音信号区間候補と検出された信号区間候補を第２種雑音信号区間として分類するものである。当該第３の基準により分類された信号区間候補は、それぞれの信号区間候補検出部２０（この例では２０ａから２０ｃ）において、検出結果が異なっている信号区間候補である。いずれかのアルゴリズムによって雑音信号区間候補であると検出されているので、当該信号区間候補を雑音信号区間候補と扱われる一方、当該信号区間候補は他のアルゴリズムでは目的信号区間候補と検出されており、目的信号区間候補となる条件を満たす側面を有しているものであり、上記の第１種雑音信号区間候補のようにすべてのアルゴリズムにおいて雑音信号区間としての条件を満たすものではない。そこで、第２種雑音信号区間とする。
【００５６】
次に、図１に示した信号処理システムの各部分における信号処理結果を追いつつ、本発明の信号処理システムの処理の流れを説明する。
【００５７】
図２は、入力信号および信号処理システムの各部分における信号を示す図である。この例でも、信号区間候補検出部２０は、第１の信号区間候補検出部２０ａから第３の信号区間候補検出部２０ｃの３つの信号区間候補検出部を用いた構成とする。
【００５８】
図２において、１００は入力部１０から入力された入力信号、１１０が第１の信号区間候補検出部２０ａによる信号区間候補の検出結果を示すグラフ、１２０が第２の信号区間候補検出部２０ｂによる信号区間候補の検出結果を示すグラフ、１３０が第３の信号区間候補検出部２０ｃによる信号区間候補の検出結果を示すグラフ、１４０が信号区間分類部３０による信号区間候補の分類結果を示すグラフである。
【００５９】
なお、上記グラフ１１０、グラフ１２０、グラフ１３０において、横軸は時間を表わしている。
【００６０】
入力信号１００は、時系列に、第１の信号区間１０１、第２の信号区間１０２、第３の信号区間１０３、第４の信号区間１０４の４つの信号区間が並んだ信号となっている。
【００６１】
この例では、入力信号１００の各信号区間は、第１の信号区間候補検出部２０ａにより、第１の信号区間１０１は雑音信号区間候補、第２の信号区間１０２は雑音信号区間候補、第３の信号区間１０３は雑音信号区間候補、第４の信号区間１０４は目的信号区間候補と検出されている。
【００６２】
また、入力信号１００の各信号区間は、第２の信号区間候補検出部２０ｂにより、第１の信号区間１０１は雑音信号区間候補、第２の信号区間１０２は雑音信号区間候補、第３の信号区間１０３は目的信号区間候補、第４の信号区間１０４は目的信号区間候補と検出されている。
【００６３】
また、入力信号１００の各信号区間は、第３の信号区間候補検出部２０ｃにより、第１の信号区間１０１は雑音信号区間候補、第２の信号区間１０２は目的信号区間候補、第３の信号区間１０３は目的信号区間候補、第４の信号区間１０４は目的信号区間候補と検出されている。
【００６４】
信号区間分類部３０は、第１の信号区間候補検出部２０ａ〜第３の信号区間候補検出部２０ｃから信号区間候補の検出結果の通知を受け、上記第１から第３の基準により各信号区間候補を分類する。
【００６５】
第１の信号区間１０１は第２の基準により第１種雑音信号区間と分類される。
【００６６】
第２の信号区間１０２は第３の基準により第２種雑音信号区間と分類される。
【００６７】
第３の信号区間１０３も同様に第３の基準により第２種雑音信号区間と分類される。
【００６８】
第４の信号区間１０４は第１の基準により目的信号区間と分類される。
【００６９】
ここで、上記第２の信号区間１０２および第３の信号区間１０３ともに、第２種雑音信号区間と分類されるが、さらに細かく分類することができる。なぜならば、第２の信号区間１０２は、第２の信号区間候補検出部２０ｂが用いるアルゴリズムにより雑音信号区間候補と検出されるものであり、一方、第３の信号区間１０３は第２の信号区間候補検出部２０ｂが用いるアルゴリズムにより目的信号区間候補と検出されるものであり、その性質が異なるものであるからである。
【００７０】
そこで、信号区間分類部３０は、雑音信号区間をさらに細かく分類し、第２の信号区間１０２を第１の第２種雑音信号区間と分類し、第３の信号区間１０３を第２の第２種雑音信号区間と分類することもできる。
【００７１】
以上、実施形態１の信号処理システムによれば、入力信号を目的信号区間と雑音信号区間に分類するだけでなく、雑音信号区間を複数の性質の異なる雑音信号区間に分類することができる。また、このように分類された雑音信号区間に対して後述する実施形態５から７の雑音抑制処理を実行したり、分類された目的信号区間に対して実施形態８の音声認識処理などを実行することが可能となる。
【００７２】
（実施形態２）
実施形態２は、入力信号から検出した雑音信号区間候補を、定常雑音信号区間と非定常雑音信号区間に分類する信号処理システムである。
【００７３】
ここで、定常雑音信号とは、入力信号の振幅や周波数スペクトルの時間変動が少なく安定している雑音信号である。例えば、入力信号の入力環境において一定の回転数で作動しているファンから発せられる機械音などである。
【００７４】
非定常雑音信号とは、入力信号の振幅や周波数スペクトルの時間変動が大きく、非定常的に存在する雑音源や非定常的に雑音を発する雑音源から入力される雑音信号である。例えば、入力信号の入力環境内を通過する車から発せられる雑音信号や、入力信号の入力環境内に存在する時計が時報として発する点鐘音の雑音信号などである。
【００７５】
実施形態２の信号処理システムの構成は図１と同様で良いので図示は省略する。
【００７６】
信号区間分類部３０は、実施形態１と同様に、複数の信号区間候補検出部２０から各信号区間候補に対する各々の検出結果の通知を受け、当該検出結果の組み合わせにより、各信号区間候補を分類する部分であり、実施形態１と同様、実施形態１で説明した第１から第３の基準により行われるが、実施形態２の信号処理システムでは、第２の基準により分類された第１種雑音信号区間を定常雑音のみが現れている定常雑音信号区間と分類し、第３の基準により分類された第２種雑音信号区間を定常雑音と非定常雑音が重畳して現れている非定常雑音信号区間と分類する。
【００７７】
定常雑音は、音響的性質が時間的に変化せずに安定している雑音信号であるので、信号区間候補検出部２０が用いるアルゴリズムが適切なものであれば、いずれのアルゴリズムによっても雑音信号区間候補と検出されると想定できるからである。一方、非定常雑音は、その音響的性質が時間的に変化する雑音信号であり、いずれかのアルゴリズムによって雑音信号区間候補と検出されるが、他のいずれかのアルゴリズムによって目的信号区間候補と検出されると想定できるからである。
【００７８】
次に、本実施形態２の信号処理システムの各部分における信号処理結果を追いつつ処理の流れを説明する。
【００７９】
図３は、実施形態２における入力信号および信号処理システムの各部分における信号を示す図である。この例は、信号区間候補検出部２０は、第１の信号区間候補検出部２０ａと第２の信号区間候補検出部２０ｂの２つの信号区間候補検出部を用いた構成とする。
【００８０】
図３において、２００は入力部１０から入力された入力信号、２１０が第１の信号区間候補検出部２０ａによる信号区間候補の検出結果を示すグラフ、２２０が第２の信号区間候補検出部２０ｂによる信号区間候補の検出結果を示すグラフ、２３０が信号区間分類部３０による信号区間候補の分類結果を示すグラフである。
【００８１】
この例では、入力信号２００は、時系列に、第１の信号区間２０１、第２の信号区間２０２、第３の信号区間２０３、第４の信号区間２０４の４つの信号区間が並んだ信号となっている。
【００８２】
この例では、入力信号２００の各信号区間は、第１の信号区間候補検出部２０ａにより、第１の信号区間２０１は雑音信号区間候補、第２の信号区間２０２は目的信号区間候補、第３の信号区間２０３は雑音信号区間候補、第４の信号区間２０４は目的信号区間候補と検出されている。
【００８３】
また、入力信号２００の各信号区間は、第２の信号区間候補検出部２０ｂにより、第１の信号区間２０１は雑音信号区間候補、第２の信号区間２０２は雑音信号区間候補、第３の信号区間２０３は目的信号区間候補、第４の信号区間２０４は目的信号区間候補と検出されている。
【００８４】
信号区間分類部３０は、第１の信号区間候補検出部２０ａおよび第２の信号区間候補検出部２０ｂから信号区間候補の検出結果の通知を受け、第１から第３の基準により各信号区間候補を分類する。
【００８５】
第１の信号区間２０１は第２の基準により第１種雑音信号区間と分類される。
【００８６】
第２の信号区間２０２は第３の基準により第２種雑音信号区間と分類される。
【００８７】
第３の信号区間２０３も第３の基準により第２種雑音信号区間と分類される。
【００８８】
第４の信号区間２０４は第１の基準により目的信号区間と分類される。
【００８９】
本実施形態２では、さらに、信号区間分類部３０は、第１の信号区間２０１を定常雑音信号区間と分類し、第２の信号区間２０２を非定常雑音信号区間と分類し、第３の信号区間２０３を非定常雑音信号区間と分類し、第４の信号区間２０４を目的信号区間と分類する。
【００９０】
以上、実施形態２の信号処理システムによれば、入力信号から検出した雑音信号区間候補を、定常雑音信号区間と非定常雑音信号区間に分類することができる。また、このように分類された雑音信号区間に対して後述する実施形態５から７の雑音抑制処理を実行したり、分類された目的信号区間に対して実施形態８の音声認識処理などを実行することが可能となる。
【００９１】
（実施形態３）
実施形態３の信号処理システムは、信号区間候補検出部が用いるアルゴリズムを、入力信号のパワーの変化に基づいて目的信号区間候補と雑音信号区間候補とを検出するアルゴリズムと、入力信号の到来方向に基づいて目的信号区間候補と雑音信号区間候補とを検出するアルゴリズムとの組み合わせとした例である。
【００９２】
図４は、実施形態３の信号処理システムの構成を示す図である。図４において、入力部１０、信号区間分類部３０は図１と同様である。
【００９３】
第１の信号区間候補検出部２０ａ’は、パワー計算部２１を備えており、入力信号のパワーの変化に基づいて目的信号区間候補と雑音信号区間候補とを検出するアルゴリズムを用いるものである。
【００９４】
目的信号は、入力のターゲットとされている信号であり、その入力環境において当該目的信号のレベルが大きくなるように設定されているので、目的信号のパワーは大きいと想定される。そこで、当該パワーの変化に基づくアルゴリズムは、信号区間候補においてパワー変動が所定値以上であるものを目的信号区間候補と検出し、パワー変動が所定値に満たないものを雑音信号区間候補と検出するものである。
【００９５】
パワー計算部２１は、入力信号のパワーを計算する。パワー計算処理の一例を以下に示す。入力音をｆ（ｔ）としてある時間区間ＴのパワーＰ（ｔ）を以下の（数１）により計算する。
【００９６】
【数１】

【００９７】
第１の信号区間候補検出部２０ａ’は、パワー計算部２１で得たパワーの時間的変動を示す微分値Ｐ’（ｔ）を監視し、当該変動量がある閾値Ａｔｈ以上である場合に目的信号区間候補と判定し、閾値Ａｔｈを下回っている場合には雑音信号区間候補と判定する。閾値Ａｔｈはあらかじめ与えていても良く、また、入力音Ｐ’（ｔ）の移動平均をとるなどして決めても良い。
【００９８】
第２の信号区間候補検出部２０ｂ’は、到来方向検知部２２を備え、入力信号の到来方向に基づいて目的信号区間候補と雑音信号区間候補とを検出するアルゴリズムを用いるものである。なお、入力部１０を介して入力される信号が、少なくとも２箇所の観測地点から得た複数の入力信号とする。
【００９９】
目的信号は、入力のターゲットとされている信号であり、その入力環境において当該目的信号の到来方向を所定方向、例えば正面方向と設定して入力するので、目的信号の到来方向が想定される。そこで、到来方向に基づくアルゴリズムは、信号区間候補において入力信号の到来方向が所定方向であるものを目的信号区間候補と検出し、到来方向がが所定方向でないものを雑音信号区間候補と検出するものである。
【０１００】
なお、到来方向検知部２２の詳細構成例として、次の２つの構成を説明する。
【０１０１】
到来方向検知部２２の第１の構成例は、図５（ａ）に示すように、複数の入力信号から任意に選んだ２つの入力信号の相互相関関数に基づいて遅延時間を求める遅延時間計算部２３ａを備えている。
【０１０２】
遅延時間計算部は、複数の入力信号から任意に選んだ第１および第２の入力信号ｆ（ｔ）、ｇ（ｔ）の相互相関関数Ｒ（τ）を（数２）により計算する。
【０１０３】
【数２】

【０１０４】
遅延時間計算部は、計算した相互相関関数Ｒ（τ）を最大にするτを第１の入力信号と第２の入力信号間の遅延時間Δτとみなす。
【０１０５】
次に、到来方向検知部２２の第２の構成例は、複数の入力信号から任意に選んだ２つの入力信号の差分値を、２つの入力信号の一方の微分値で除算した値に基づいて近似遅延時間を求める遅延時間計算部２３ｂを備えている。
【０１０６】
まず、最初に複数の入力信号から任意に選んだ２つの入力信号の差分値を、２つの入力信号の一方の微分値で除算した値に基づいて近似遅延時間を求める原理を説明する。
【０１０７】
図６は、２つのセンサにおける受信信号間の遅延時間を説明する図である。
【０１０８】
図６に示すように、センサ１とセンサ２が、距離ｄ離れて配置されているとする。いま、波源から、波動信号が、センサ１とセンサ２に対して角度θの方向から到来したとする。波動信号をそれぞれＷ１とＷ２とする。センサ１とセンサ２はそれぞれ検知した波動信号を電気信号に変換し、２つの受信信号を得る。ここでは、便宜上、第１の受信信号ｆ１（ｔ）と第２の受信信号ｆ２（ｔ）とする。
【０１０９】
センサ１とセンサ２の配置と波源方向の関係から、図６に示すように、波動信号Ｗ１がセンサ１に到達するまでの伝搬行路と、波動信号Ｗ２がセンサ２に到達するまでの伝搬行路には行路差Ｌが存在する。この行路差Ｌのために、第１の受信信号ｆ１（ｔ）と第２の受信信号ｆ２（ｔ）の間には遅延時間Δｔが生じる。ここで、両者の波形は同じであるので、第１の受信信号ｆ１（ｔ）と第２の受信信号ｆ２（ｔ）は、時間軸を揃えて表現すると、ｆ（ｔ）とｆ（ｔ＋Δｔ）と表現でき、図６のような関係にある。
【０１１０】
ここで、第２の受信信号ｆ（ｔ＋Δｔ）に注目すると、第２の受信信号ｆ（ｔ＋Δｔ）は（数３）のようにテーラー展開することが可能である。
【０１１１】
【数３】

【０１１２】
波動信号の速度が十分速く、センサ１とセンサ２の間が十分小さいものであれば、遅延時間Δｔは極めて小さい値であるので、Δｔの高次項、つまり、（数３）の第３項以降を無視して（数４）のように近似しても、（数３）の値の精度は高く保たれる。
【０１１３】
【数４】

【０１１４】
なお、（数４）の右辺のΔｔは近似遅延時間を表わしている。
【０１１５】
（数４）を変形すると（数５）が得られる。
【０１１６】
【数５】

【０１１７】
（数５）により、近似遅延時間は、ｆ（ｔ＋Δｔ）−ｆ（ｔ）をｆ’（ｔ）で除算したもの、つまり、第１の受信信号と第２の受信信号の差分信号を、第１の受信信号の微分信号で除算したものとなる。つまり、書き換えれば（数６）のように表現できる。
【０１１８】
【数６】

【０１１９】
なお、上記演算では、便宜上、遅延受信信号（Δｔの遅延がある受信信号）を第２の受信信号としたが、遅延受信信号（Δｔの遅延がある受信信号）を第１の受信信号としても良い。さらに、微分信号を第１の受信信号の微分演算により求めたが、第２の受信信号の微分演算により求めても良い。
【０１２０】
以上、上記（数６）による遅延時間検出演算によれば、演算処理が、第１の受信信号および第２の受信信号間の１回の差分演算と、第１の受信信号の１回の微分演算と、差分演算結果を微分演算結果で除算する１回の除算演算のみとなるので、従来の相互相関法を用いた場合の演算処理に比べると、演算量が少なくて済むので高速処理が可能となることが分かる。
【０１２１】
遅延時間計算部は、以上の原理により、近似遅延時間を求める。
【０１２２】
遅延時間計算部２３ｂは、図５（ｂ）に示すように、複数の入力信号から任意に選んだ２つの入力信号の差分信号を演算する差分信号演算部２４と、任意に選んだ２つの入力信号のうちの１つの入力信号の微分信号を演算する微分信号演算部２５と、差分信号を微分信号で除算した除算信号を演算する除算信号演算部２６を備え、除算信号を前記任意に選んだ２つの入力信号間の遅延時間とする。到来方向検知部２２は、遅延時間検出部２３ｂが検出した遅延時間に基づいて、任意に選んだ２つの入力信号の観測地点に対する、入力信号の到来方向を検出するものである。
【０１２３】
差分信号演算部２４は、複数の入力信号から任意に選んだ第１および第２の入力信号ｆ（ｔ）、ｇ（ｔ）の差分演算を（数７）により求める。
【０１２４】
【数７】

【０１２５】
微分信号演算部２５は、第１または第２の入力信号の微分値を演算するものであり、ここでは、例えば、第１の入力信号の微分値を（数８）により求める。
【０１２６】
【数８】

【０１２７】
除算信号演算部２６は、（数９）により、差分信号演算部２４で得た差分値を微分信号演算部２５で得た微分値で除算して遅延時間Δτを求める。
【０１２８】
【数９】

【０１２９】
到来方向検知部２２は、遅延時間検出部２３ｂが検出した遅延時間Δτと、遅延時間計算の対象となった２つのセンサ間の距離ｄから任意に選んだ２つの入力信号の入力地点に対する入力信号の到来方向θを計算する。その原理を図６を用いて説明する。
【０１３０】
図６において，センサ間の距離ｄ、入力音の到来方向θ、信号源から２つのマイクへの行路差Ｌ、遅延時間Δτの間には、信号の伝播速度をｖとおくと（数１０）の関係がある。
【０１３１】
【数１０】

【０１３２】
従って、入力音の到来方向θは（数１１）のように計算できる。
【０１３３】
【数１１】

【０１３４】
第２の信号区間候補検出部２０ｂ’は、到来方向検知部２２で得た到来方向θと、予め設定した目的信号の到来方向θ₀との差の絶対値がΔθ以内の場合は目的音区間候補と判定し、差の絶対値がΔθより大きい場合は雑音区間候補と判定する。
【０１３５】
以上、実施形態３の信号処理システムは、信号区間候補検出部２０において、入力信号のパワーの変化に基づいて目的信号区間候補と雑音信号区間候補とを検出するアルゴリズムと、入力信号の到来方向に基づいて目的信号区間候補と雑音信号区間候補とを検出するアルゴリズムにより目的信号区間候補と雑音信号区間候補を検出する。
【０１３６】
なお、信号区間候補検出部２０により検出したこれら目的信号区間候補と雑音信号区間候補の分類処理は、実施形態１または実施形態２と同様の処理により実行する。
【０１３７】
（実施形態４）
実施形態４の信号処理システムは、信号区間候補検出部が用いるアルゴリズムとして、入力信号のパワーの変化に基づいて目的信号区間候補と雑音信号区間候補とを検出するアルゴリズムと、入力信号のパワー比に基づいて入力信号の到来方向を検出し、到来方向に基づいて目的信号区間候補と雑音信号区間候補とを検出するアルゴリズムとの組み合わせとした例である。
【０１３８】
図７は、実施形態４の信号処理システムの構成を示す図である。図７において、入力部１０、信号区間分類部３０は図１と同様である。
【０１３９】
第２の信号区間候補検出部２０ｂ’’は、パワー比計算部２７を備えており、入力信号のパワー比に基づいて入力信号の到来方向を検出し、到来方向に基づいて目的信号区間候補と雑音信号区間候補とを検出するアルゴリズムを用いるものである。
【０１４０】
パワー比計算部２７では第１および第２の入力信号のパワー比を計算する。到来方向検知部２２ａは、パワー比計算部２７で得たパワー比から入力信号の到来方向を計算する。つまり、両信号のパワー比が等しい場合、２つの入力センサに正対した方向から信号が到来しており、パワー比が最大であれば、２つの入力センサに対して平行の方向から信号が到来していることが分かる。このようにパワー比を解析することにより入力信号の到来方向を検知することができる。
【０１４１】
パワー比の計算量は、相関関数係数の計算などに比べて、少ない計算量で求めることができ、信号処理システムのリソースの負荷を小さくすることが可能となる。
【０１４２】
なお、第２の信号区間候補検出部２０ｂ’’において、入力信号のパワー比に基づいて入力信号の到来方向を検出し、到来方向に基づいて目的信号区間候補と雑音信号区間候補とを検出するアルゴリズムを採用する点以外は、実施形態３で説明した処理と同様であるので、それら処理に関する説明は省略する。
【０１４３】
（実施形態５）
実施形態５の信号処理システムは、目的信号区間および雑音信号区間検出とともに、雑音信号抑制処理を実行するものである。
【０１４４】
図８は、実施形態５の信号処理システムの構成を示す図である。
【０１４５】
入力部１０、信号区間候補検出部２０、信号区間分類部３０は、実施形態１で示した図１と同様のもので良く、ここでの詳しい説明は省略する。なお、信号区間候補検出部２０は、実施形態１で示したものに限られず、実施形態３で示した図４の第１の信号区間候補検出部２０ａ’または第２の信号区間候補検出部２０ｂ’、実施形態４で示した図７の第２の信号区間候補検出部２０ｂ’’と同様のものとしても良い。
【０１４６】
実施形態５の信号処理システムは、雑音抑制部４０を備えている。
【０１４７】
雑音抑制部４０は、入力部１０から少なくとも１つの入力信号を処理対象として入力し、信号区間分類部３０によって分類された各信号区間の性質に応じて、抑制量を変化させながら入力信号のレベルを抑制する。例えば、雑音抑制部４０は、雑音信号区間に対して重みづけを行って信号レベルを低下させる。
【０１４８】
ここで、重み係数は線形係数、非線形係数、２値係数など自由に用いることができる。以下に、実施形態２で説明した定常雑音信号区間と非定常雑音信号区間に対する重み係数の一例を示す。
【０１４９】
定常雑音信号区間に対する重み係数をＷａ、非定常雑音信号区間に対する重み係数をＷｂ、目的信号区間の重み係数をＷｃとし、定常雑音信号区間の平均パワーをＰｓ、非定常雑音信号区間の平均パワーをＰｎｓとし、各重み係数を各信号区間の信号パワーに応じて（数１２）に従って設定する。
【０１５０】
【数１２】

【０１５１】
これら各信号区間に応じた重み係数を入力信号ｆ（ｔ）に乗じることにより、定常雑音信号区間と非定常雑音信号区間の雑音レベルを同様に抑制することができ、定常雑音信号を除去するとともに、非定常雑音信号の低減も可能となる。
【０１５２】
（実施形態６）
実施形態６の信号処理システムは、実施形態５と同様、目的信号区間および雑音信号区間検出とともに、雑音信号抑制処理を実行するものである。
【０１５３】
実施形態６の信号処理システムは、雑音モデルを用いて雑音信号抑制処理を実行する。
【０１５４】
特に、実施形態２で説明したように、雑音信号区間候補を定常雑音信号区間と非定常雑音信号区間に分類し、定常雑音信号区間と分類された信号区間において雑音モデル推定を実行し、目的信号区間および非定常雑音信号区間と分類された信号区間において雑音モデル推定を実行せずに、雑音モデルを推定する雑音モデル推定部と、雑音モデル推定部が推定した雑音モデルに基づき、雑音抑制を行う雑音抑制部を備えた構成としている。
【０１５５】
図９は、実施形態６の信号処理システムの構成を示す図である。
【０１５６】
入力部１０、信号区間候補検出部２０、信号区間分類部３０は、実施形態５で示した図８と同様のもので良く、ここでの説明は省略する。
【０１５７】
雑音抑制部４０ａは、雑音モデル推定部４１を備え、雑音モデル推定部４１が推定した雑音モデルに基づき、雑音抑制を行う。
【０１５８】
ここで、雑音モデル推定部４１は、定常雑音信号区間と分類された信号区間において雑音モデル推定を実行し、目的信号区間および非定常雑音信号区間と分類された信号区間において雑音モデル推定を実行せずに、雑音モデルを推定する。
【０１５９】
雑音モデル推定部４１の推定処理を定常雑音信号区間のみで実行することにより雑音抑制性能を高く維持することができる。その理由は以下のように説明できる。つまり、本実施形態６の信号処理システムでは、定常雑音信号区間のみで雑音モデル推定を実行するので、雑音モデルは定常雑音信号のみに対するものとなる。もし、非定常雑音信号区間において雑音モデルの推定を実行する構成とすると、当該非定常雑音信号区間のみに有効な非定常雑音信号成分が繰り込まれてしまい、定常雑音信号区間や他の非定常雑音信号区間に対応しない非定常雑音信号成分を抑制することとなり、かえって雑音抑制性能を劣化させる結果を招くからである。
【０１６０】
（実施形態７）
実施形態７の信号処理システムは、実施形態５と同様、目的信号区間および雑音信号区間検出とともに、雑音信号抑制処理を実行するものである。
【０１６１】
実施形態７の信号処理システムは、定常雑音信号区間には、スペクトルサブトラクションによる雑音抑制処理を適用し、非定常雑音信号区間には非定常雑音信号区間の性質に応じた雑音抑制処理を適用するものである。
【０１６２】
図１０は、実施形態７の信号処理システムの構成を示す図である。
【０１６３】
入力部１０、信号区間候補検出部２０、信号区間分類部３０は、実施形態５で示した図８と同様のもので良く、ここでの説明は省略する。
【０１６４】
図１０において、雑音抑制部４０ｂは、フーリエ変換部４２、雑音モデル推定部４３、雑音スペクトル抑制部４４、逆フーリエ変換部４５を備えている。
【０１６５】
フーリエ変換部４２は、入力部１０から少なくとも１つの入力信号を入力し、当該入力信号に対して窓関数により窓掛け処理を施した後、フーリエ変換により入力スペクトル信号を求める部分である。
【０１６６】
雑音モデル推定部４３は、定常雑音信号区間と分類された信号区間の信号を入力し、そのスペクトルを計算し、定常雑音信号区間の雑音スペクトル信号を推定する部分である。
【０１６７】
雑音スペクトル抑制部４４は、フーリエ変換部４２から入力スペクトル信号を入力し、また、雑音モデル推定部４３から雑音スペクトル信号を入力し、当該入力スペクトル信号から当該雑音スペクトル信号を差分演算し、雑音スペクトル信号成分を除去する部分である。
【０１６８】
逆フーリエ変換部４５は、周波数領域上のスペクトル信号を逆フーリエ変換により時間領域上の信号に戻す部分である。
【０１６９】
以上の構成により、雑音抑制部４０ｂは、定常雑音信号区間に対して、スペクトルサブトラクションによる雑音抑制処理を適用することができる。
【０１７０】
なお、非定常雑音信号区間には非定常雑音信号区間の性質に応じた雑音抑制方式を適用することにより、適切に非定常雑音信号区間の非定常雑音信号または定常雑音信号と非定常雑音信号との重畳信号成分を取り除くことができるため、雑音抑制処理を効果的に実行できる。
【０１７１】
（実施形態８）
実施形態８の信号処理システムは、処理対象の信号を音声信号とし、入力信号である音声信号に対する目的信号区間検出処理、雑音信号区間検出処理、雑音信号抑制処理とともに、当該目的信号の音声認識処理を実行するものである。
【０１７２】
図１１は、実施形態８の信号処理システムの構成を示す図である。
【０１７３】
入力部１０、信号区間候補検出部２０、信号区間分類部３０、雑音抑制部４０は、実施形態５で示したものと同様のもので良く、ここでの詳しい説明は省略する。
【０１７４】
なお、雑音抑制部４０は、実施形態５で示したものに限られず、実施形態６で示した雑音抑制部４０ａ、または、実施形態７で示した雑音抑制部４０ｂと同様のものとしても良い。
【０１７５】
実施形態８の信号処理システムは、音声認識部５０を備えている。
【０１７６】
音声認識部５０は、雑音抑制部４０から雑音抑制処理後の入力信号を入力し、目的信号区間の信号に対して音声認識処理を行う部分である。
【０１７７】
なお、音声認識部５０における音声認識処理アルゴリズムは、従来技術におけるもので良い。例えば、目的信号を音素単位に分け、各音素ごと音声モデルとのパターンマッチングにより音声を認識する。
【０１７８】
以上、本実施形態８の信号処理システムによれば、非定常雑音が存在する入力環境下で得られた入力信号に対して本発明の雑音抑圧処理を前処理として実行し、音声認識処理を実行することにより音声認識精度を向上することができる。
【０１７９】
（実施形態９）
本発明の波動信号処理は、上記に説明した処理を実現するステップを記述したプログラムとして記述することができ、当該プログラムをコンピュータに読み取らせることにより、本発明の波動信号処理を実行することができる。本発明の信号処理システムを実現する処理ステップを備えたプログラムは、図１２に図示した例のように、ＣＤ−ＲＯＭ１００２やフレキシブルディスク１００３等の可搬型記録媒体１００１だけでなく、ネットワーク上にある記録装置内の記録媒体１０００や、コンピュータのハードディスクやＲＡＭ等の記録媒体１００５に格納して提供することができ、ネットワークからダウンロードすることもできる。プログラム実行時には、プログラムはコンピュータ１００４上にローディングされ、主メモリ上で実行される。
【０１８０】
なお、上記実施形態１〜８において説明した、目的信号区間検出処理、雑音信号区間検出処理、雑音抑制処理、音声認識処理は、適宜組み合わせて用いても良い。
【０１８１】
本発明の信号処理システムおよび方法について、さらに以下の項を開示する。
【０１８２】
（付記１）入力信号を入力する入力部と、
前記入力信号から検出対象となる目的信号が記録されている信号区間の候補である目的信号区間候補と当該目的信号区間候補以外の雑音信号区間候補を検出する複数の信号区間候補検出部であって、それぞれが用いる目的信号区間候補および雑音信号区間候補の検出アルゴリズムが異なる信号区間候補検出部と、
前記複数の信号区間候補検出部から各信号区間候補に対する各々の検出結果の通知を受け、当該検出結果の組み合わせにより、各信号区間候補を分類する信号区間分類部を備えたことを特徴とする信号処理システム（１）。
【０１８３】
（付記２）前記信号区間分類部は、
前記複数の信号区間候補検出部のすべてにおいて目的信号区間候補と検出された信号区間候補を目的信号区間とし、
前記複数の信号区間候補検出部のすべてにおいて雑音信号区間候補と検出された信号区間候補を第１種雑音信号区間とし、
前記複数の信号区間候補検出部のいずれかにおいて目的信号区間候補と検出され、かつ、いずれかにおいて雑音信号区間候補と検出された信号区間候補を第２種雑音信号区間として分類する付記１に記載の信号処理システム（２）。
【０１８４】
（付記３）前記信号区間分類部の分類処理において、前記第１種雑音信号区間を定常雑音のみが現れている定常雑音信号区間と分類し、前記第２種雑音信号区間を定常雑音と非定常雑音が重畳して現れている非定常雑音信号区間と分類する付記２に記載の信号処理システム（３）。
【０１８５】
（付記４）前記複数の信号区間候補検出部のうち、少なくとも一つが、前記入力された信号のパワーの変化に基づいて前記目的信号区間候補と前記雑音信号区間候補とを検出するアルゴリズムを用いるものであり、少なくとも他の一つが、前記入力された信号の到来方向を検出し、当該到来方向に基づいて前記目的信号区間候補と前記雑音信号区間候補とを検出するアルゴリズムを用いるものである付記１に記載の信号処理システム（４）。
【０１８６】
（付記５）前記目的信号区間候補および前記雑音信号区間候補のすべてに対して同一の雑音抑制処理を適用する、または、前記信号区間分類部による分類結果に応じて適用する雑音抑制処理を選択して適用する雑音抑制部を備えた付記１に記載の信号処理システム（５）。
【０１８７】
（付記６）前記目的信号区間の信号に対して雑音抑制処理を行なわず、前記定常雑音信号区間の信号および前記非定常雑音信号区間の信号に対して、１より小さい重み付けの雑音抑制処理を行なう雑音抑制部を備えた付記３に記載の信号処理システム（６）。
【０１８８】
（付記７）前記定常雑音信号区間と分類された信号区間においてのみ定常雑音モデルの推定処理を実行し、前記目的信号区間および非定常雑音信号区間と分類された信号区間において雑音モデルの推定処理を停止する雑音モデル推定部を備え、
前記雑音抑制部は、前記雑音モデル推定部が推定した雑音モデルに基づき、雑音抑制を行う付記５または６に記載の信号処理システム（７）。
【０１８９】
（付記８）前記定常雑音信号区間と分類された信号区間においてのみ定常雑音モデルの推定処理を実行し、前記目的信号区間および非定常雑音信号区間と分類された信号区間において雑音モデルの推定処理を停止する雑音モデル推定部を備え、
前記雑音抑制部は、前記雑音モデル推定部が推定した雑音モデルに基づき、雑音抑制処理を行い、さらに、当該雑音抑制処理後の非定常雑音信号区間の信号レベルを当該雑音抑制処理後の定常雑音信号区間の平均信号レベルまで抑制する雑音抑制処理を行なう付記５または６に記載の信号処理システム。
【０１９０】
（付記９）前記入力部を介して入力される信号が、少なくとも２箇所の観測地点から得た複数の入力信号であり、
前記到来方向に基づいて前記目的信号区間候補と前記雑音信号区間候補とを検出するアルゴリズムを用いる信号区間候補検出部が、
前記複数の入力信号から任意に選んだ２つの入力信号の相互相関関数に基づいて遅延時間を求める遅延時間検出部と、
前記遅延時間検出部が検出した遅延時間に基づいて、前記任意に選んだ２つの入力信号の入力地点に対する、前記入力信号の到来方向を検出する方向検出部を備えた付記４に記載の信号処理システム。
【０１９１】
（付記１０）前記入力部を介して入力される信号が、少なくとも２箇所の観測地点から得た複数の入力信号であり、
前記到来方向に基づいて前記目的信号区間候補と前記雑音信号区間候補とを検出するアルゴリズムを用いる信号区間候補検出部が、
前記複数の入力信号から任意に選んだ２つの入力信号の差分信号を演算する差分信号演算部と、
前記任意に選んだ２つの入力信号のうちの１つの入力信号の微分信号を演算する微分信号演算部と、
前記差分信号を前記微分信号で除算した除算信号を演算する除算信号演算部と、
前記除算信号を前記任意に選んだ２つの入力信号間の遅延時間とする遅延時間検出部と、
前記遅延時間検出部が検出した遅延時間に基づいて、前記任意に選んだ２つの入力信号の観測地点に対する、前記入力信号の到来方向を検出する方向検出部を備えた付記４に記載の信号処理システム。
【０１９２】
（付記１１）前記入力信号が音声信号であり、
前記目的信号区間の音声信号に対する音声認識を行う音声認識部を備えた付記１〜１０のいずれかに記載の信号処理システム（８）。
【０１９３】
（付記１２）入力信号を入力し、
前記入力信号から検出対象となる目的信号が記録されている信号区間の候補である目的信号区間候補と当該目的信号区間候補以外の雑音信号区間候補を検出する複数の信号区間候補検出処理であって、それぞれが用いる目的信号区間候補および雑音信号区間候補の検出アルゴリズムが異なるものを用いて、目的信号区間候補および雑音信号区間候補を検出し、
前記複数の信号区間候補検出処理から各信号区間候補に対する各々の検出結果の通知を受け、当該検出結果の組み合わせにより、各信号区間候補を分類することを特徴とする信号処理方法（９）。
【０１９４】
（付記１３）前記信号区間候補の分類処理において
前記複数の信号区間候補検出処理のすべてにおいて目的信号区間候補と検出された信号区間候補を目的信号区間とし、
前記複数の信号区間候補検出処理のすべてにおいて雑音信号区間候補と検出された信号区間候補を第１種雑音信号区間とし、
前記複数の信号区間候補検出処理のいずれかにおいて目的信号区間候補と検出され、かつ、いずれかにおいて雑音信号区間候補と検出された信号区間候補を第２種雑音信号区間として分類する付記１２に記載の信号処理方法。
【０１９５】
（付記１４）信号区間検出処理を実行するコンピュータで実行可能なプログラムであって、
入力信号を入力する入力ステップと、
前記入力信号から検出対象となる目的信号が記録されている信号区間の候補である目的信号区間候補と当該目的信号区間候補以外の雑音信号区間候補を検出する複数の信号区間候補検出処理ステップであって、それぞれが用いる目的信号区間候補および雑音信号区間候補の検出アルゴリズムが異なるものを用いて、目的信号区間候補および雑音信号区間候補を検出するステップと、
前記複数の信号区間候補検出処理ステップから各信号区間候補に対する各々の検出結果の通知を受け、当該検出結果の組み合わせにより、各信号区間候補を分類する処理ステップを備えたことを特徴とするプログラム（１０）。
【０１９６】
（付記１５）信号区間検出処理を実行するコンピュータで実行可能なプログラムであって、
前記信号区間候補の分類処理ステップにおいて、
前記複数の信号区間候補検出処理ステップのすべてにおいて目的信号区間候補と検出された信号区間候補を目的信号区間とし、
前記複数の信号区間候補検出処理ステップのすべてにおいて雑音信号区間候補と検出された信号区間候補を第１種雑音信号区間とし、
前記複数の信号区間候補検出処理ステップのいずれかにおいて目的信号区間候補と検出され、かつ、いずれかにおいて雑音信号区間候補と検出された信号区間候補を第２種雑音信号区間として分類する付記１４に記載のプログラム。
【０１９７】
【発明の効果】
本発明の信号処理システムによれば、入力信号を目的信号区間と雑音信号区間に分類するだけでなく、雑音信号区間を複数の性質の異なる雑音信号区間に分類することができる。
【０１９８】
また、本発明の信号処理システムによれば、すべてのアルゴリズムにおいて雑音信号区間候補と検出された雑音信号区間候補を、第１種雑音信号区間と、いずれかのアルゴリズムにおいて雑音信号区間候補とされ、いずれかのアルゴリズムにおいて雑音信号区間候補とされた第２種雑音信号区間に分類することができ、さらに、当該第１種雑音信号区間を定常雑音のみが現れている定常雑音信号区間と分類し、当該第２種雑音信号区間を定常雑音と非定常雑音が重畳して現れている非定常雑音信号区間と分類し、雑音信号区間を適切に定常雑音信号区間と非定常雑音信号区間に分類することができる。
【０１９９】
本発明の信号処理システムによれば、上記のように分類された雑音信号区間に対して雑音抑制処理を実行することが可能となる。また、雑音抑制処理に関して、定常雑音信号区間と非定常雑音信号区間それぞれの信号区間に対する適切な雑音抑制処理を実行することができる。
【０２００】
本発明の信号処理システムによれば、分類された目的信号区間に対して音声認識処理などを実行することができる。なお、上記雑音抑制処理後の信号に対して音声認識を行えば、さらに高い認識精度を得ることができる。
【図面の簡単な説明】
【図１】本発明の実施形態１にかかる信号処理システムの構成を示す図
【図２】本発明の実施形態１にかかる入力信号および信号処理システムの各部分における信号を示す図
【図３】本発明の実施形態２における入力信号および信号処理システムの各部分における信号を示す図
【図４】本発明の実施形態３の信号処理システムの構成を示す図
【図５】遅延時間計算部を中心とした構成の詳細を示す図
【図６】２つのセンサにおける受信信号間の遅延時間を説明する図
【図７】本発明の実施形態４の信号処理システムの構成を示す図
【図８】本発明の実施形態５の信号処理システムの構成を示す図
【図９】本発明の実施形態６の信号処理システムの構成を示す図
【図１０】本発明の実施形態７の信号処理システムの構成を示す図
【図１１】本発明の実施形態８の信号処理システムの構成を示す図
【図１２】実施形態９にかかる、本発明の信号処理システムを実現する処理ステップを記録した記録媒体の例を示す図
【図１３】従来の入力信号のパワーに基づく信号区間検出処理とスペクトルサブトラクションによる雑音抑制処理によって雑音を抑制するシステムを説明する図
【図１４】従来の入力信号の到来方向に基づく信号区間検出処理とスペクトルサブトラクションによる雑音抑制処理によって雑音を抑制するシステムを説明する図
【符号の説明】
１０入力部
２０、２０ａ、２０ｂ、２０ｃ信号区間候補検出部
２０ａ’ 第１の信号区間候補検出部
２０ｂ’，２０ｂ’’ 第２の信号区間候補検出部
２１パワー計算部
２２到来方向検知部
２２１，２２２遅延時間計算部
２２２−１差分信号演算部
２２２−２微分信号演算部
２２２−３除算信号演算部
２３パワー比計算部
３０信号区間分類部
４０，４０ａ，４０ｂ雑音抑制部
４１雑音モデル推定部
４２フーリエ変換部
４３雑音モデル推定部
４４雑音スペクトル抑制部
４５逆フーリエ変換部
５０音声認識部
１０００回線先のハードディスク等の記録媒体
１００１ＣＤ−ＲＯＭやフレキシブルディスク等の可搬型記録媒体
１００２ＣＤ−ＲＯＭ
１００３フレキシブルディスク
１００４コンピュータ
１００５コンピュータ上のＲＡＭ／ハードディスク等の記録媒体

Claims

入力信号を入力する入力部と、
前記入力信号から検出対象となる目的信号が記録されている信号区間の候補である目的信号区間候補と当該目的信号区間候補以外の雑音信号区間候補を検出する複数の信号区間候補検出部であって、それぞれが用いる目的信号区間候補および雑音信号区間候補の検出アルゴリズムが異なる信号区間候補検出部と、
前記複数の信号区間候補検出部から各信号区間候補に対する各々の検出結果の通知を受け、当該検出結果の組み合わせにより、各信号区間候補を分類する信号区間分類部と、
前記信号区間分類部によって分類された各信号区間の性質に応じて、抑制量を変化させながら入力信号のレベルを抑制する雑音抑制部とを備え、
前記信号区間分類部は、
前記複数の信号区間候補検出部のすべてにおいて目的信号区間候補と検出された信号区間候補を目的信号区間とし、
前記複数の信号区間候補検出部のすべてにおいて雑音信号区間候補と検出された信号区間候補を定常雑音信号区間とし、
前記複数の信号区間候補検出部のいずれかにおいて目的信号区間候補と検出され、かつ、いずれかにおいて雑音信号区間候補と検出された信号区間候補を非定常雑音信号区間として分類し、
前記雑音抑制部は、前記目的信号区間の信号に対して雑音抑制処理を行わず、前記定常雑音信号区間の信号および前記非定常雑音信号区間の信号に対して、１より小さい重み付けの雑音抑制処理を行う、信号処理システム。
前記複数の信号区間候補検出部のうち、少なくとも一つが、前記入力された信号のパワーの変化に基づいて前記目的信号区間候補と前記雑音信号区間候補とを検出するアルゴリズムを用いるものであり、少なくとも他の一つが、前記入力された信号の到来方向を検出し、当該到来方向に基づいて前記目的信号区間候補と前記雑音信号区間候補とを検出するアルゴリズムを用いるものである請求項１に記載の信号処理システム。
入力信号を入力する入力部と、
前記入力信号から検出対象となる目的信号が記録されている信号区間の候補である目的信号区間候補と当該目的信号区間候補以外の雑音信号区間候補を検出する複数の信号区間候補検出部であって、それぞれが用いる目的信号区間候補および雑音信号区間候補の検出アルゴリズムが異なる信号区間候補検出部と、
前記複数の信号区間候補検出部から各信号区間候補に対する各々の検出結果の通知を受け、当該検出結果の組み合わせにより、各信号区間候補を分類する信号区間分類部と、
前記信号区間分類部による分類結果に応じて適用する雑音抑制処理を選択して適用する雑音抑制部とを備え、
前記信号区間分類部は、
前記複数の信号区間候補検出部のすべてにおいて目的信号区間候補と検出された信号区間候補を目的信号区間とし、
前記複数の信号区間候補検出部のすべてにおいて雑音信号区間候補と検出された信号区間候補を定常雑音信号区間とし、
前記複数の信号区間候補検出部のいずれかにおいて目的信号区間候補と検出され、かつ、いずれかにおいて雑音信号区間候補と検出された信号区間候補を非定常雑音信号区間として分類する、信号処理システム。
前記定常雑音信号区間と分類された信号区間においてのみ定常雑音モデルの推定処理を実行し、前記目的信号区間および非定常雑音信号区間と分類された信号区間において雑音モデルの推定処理を停止する雑音モデル推定部を備え、
前記雑音抑制部は、前記雑音モデル推定部が推定した雑音モデルに基づき、雑音抑制を行う請求項１または３に記載の信号処理システム。
前記入力信号が音声信号であり、
前記目的信号区間の音声信号に対する音声認識を行う音声認識部を備えた請求項１〜４のいずれかに記載の信号処理システム。
入力信号を入力する入力工程と、
前記入力信号から検出対象となる目的信号が記録されている信号区間の候補である目的信号区間候補と当該目的信号区間候補以外の雑音信号区間候補を検出する複数の信号区間候補検出処理であって、それぞれが用いる目的信号区間候補および雑音信号区間候補の検出アルゴリズムが異なるものを用いて、目的信号区間候補および雑音信号区間候補を検出する検出工程と、
前記複数の信号区間候補検出処理から各信号区間候補に対する各々の検出結果の通知を受け、当該検出結果の組み合わせにより、各信号区間候補を分類する分類工程と、
前記信号区間分類工程で分類された各信号区間の性質に応じて、抑制量を変化させながら入力信号のレベルを抑制する雑音抑制工程とを含み、
前記信号区間分類工程では、
前記複数の信号区間候補検出処理のすべてにおいて目的信号区間候補と検出された信号区間候補が目的信号区間とされ、
前記複数の信号区間候補検出処理のすべてにおいて雑音信号区間候補と検出された信号区間候補が定常雑音信号区間とされ、
前記複数の信号区間候補検出処理のいずれかにおいて目的信号区間候補と検出され、かつ、いずれかにおいて雑音信号区間候補と検出された信号区間候補が非定常雑音信号区間として分類され、
前記雑音抑制工程では、前記目的信号区間の信号に対して雑音抑制処理は行われず、前記定常雑音信号区間の信号および前記非定常雑音信号区間の信号に対して、１より小さい重み付けの雑音抑制処理が行われる、信号処理方法。
信号区間検出処理をコンピュータに実行させる信号処理プログラムであって、
入力信号を入力する入力処理と、
前記入力信号から検出対象となる目的信号が記録されている信号区間の候補である目的信号区間候補と当該目的信号区間候補以外の雑音信号区間候補を検出する複数の信号区間候補検出処理であって、それぞれが用いる目的信号区間候補および雑音信号区間候補の検出アルゴリズムが異なるものを用いて、目的信号区間候補および雑音信号区間候補を検出する検出処理と、
前記複数の信号区間候補検出処理から各信号区間候補に対する各々の検出結果の通知を受け、当該検出結果の組み合わせにより、各信号区間候補を分類する分類処理と、
前記信号区間分類処理によって分類された各信号区間の性質に応じて、抑制量を変化させながら入力信号のレベルを抑制する雑音抑制処理とをコンピュータに実行させ、
前記信号区間分類処理は、
前記複数の信号区間候補検出処理のすべてにおいて目的信号区間候補と検出された信号区間候補を目的信号区間とし、
前記複数の信号区間候補検出処理のすべてにおいて雑音信号区間候補と検出された信号区間候補を定常雑音信号区間とし、
前記複数の信号区間候補検出処理のいずれかにおいて目的信号区間候補と検出され、かつ、いずれかにおいて雑音信号区間候補と検出された信号区間候補を非定常雑音信号区間として分類する処理であって、
前記雑音抑制処理は、前記目的信号区間の信号に対して雑音抑制を行わず、前記定常雑音信号区間の信号および前記非定常雑音信号区間の信号に対して、１より小さい重み付けの雑音抑制を行う処理である、信号処理プログラム。