JP3812887B2 - 信号処理システムおよび方法 - Google Patents
信号処理システムおよび方法 Download PDFInfo
- Publication number
- JP3812887B2 JP3812887B2 JP2001390189A JP2001390189A JP3812887B2 JP 3812887 B2 JP3812887 B2 JP 3812887B2 JP 2001390189 A JP2001390189 A JP 2001390189A JP 2001390189 A JP2001390189 A JP 2001390189A JP 3812887 B2 JP3812887 B2 JP 3812887B2
- Authority
- JP
- Japan
- Prior art keywords
- signal section
- signal
- noise
- candidate
- section candidate
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims description 66
- 238000001514 detection method Methods 0.000 claims abstract description 221
- 230000001629 suppression Effects 0.000 claims description 94
- 230000005236 sound signal Effects 0.000 claims description 12
- 238000003672 processing method Methods 0.000 claims description 4
- 238000004364 calculation method Methods 0.000 description 40
- 238000001228 spectrum Methods 0.000 description 29
- 238000010586 diagram Methods 0.000 description 26
- 238000005314 correlation function Methods 0.000 description 7
- 230000003595 spectral effect Effects 0.000 description 5
- 230000003111 delayed effect Effects 0.000 description 2
- 230000004069 differentiation Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 230000001902 propagating effect Effects 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L2021/02161—Number of inputs available containing the signal or the noise to be suppressed
- G10L2021/02166—Microphone arrays; Beamforming
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Noise Elimination (AREA)
- Circuit For Audible Band Transducer (AREA)
Description
【発明の属する技術分野】
本発明は、例えば、光、音、超音波、電磁波などに代表される媒質中を伝搬する波動信号から検出対象となる目的信号区間と雑音信号区間とを検出する信号処理システムおよび方法に関する。ここで言う「媒質」とは、波動が伝搬する媒体、空間、場の全てを包含する概念とする。
【0002】
【従来の技術】
目的とする波源から到達した波動信号を受信して得た入力信号には、目的信号以外の雑音信号が混入していることが多い。雑音のレベルが大きいと目的信号の処理精度を劣化させる。特に、音声認識を用いるアプリケーションでは、雑音のレベルが大きいと目的信号である音声信号が正しく認識できない。そこで、従来から音声信号処理において目的信号区間と目的信号区間以外の雑音信号区間とを検出して切り分ける処理が重要とされている。
【0003】
従来技術において、目的信号区間と雑音信号区間の切り分け処理として、入力音声信号のパワーの変化に注目した切り分け処理が多く用いられている。その基本原理は、入力された音声信号のパワーを調べ、そのパワーがある閾値を超えた時に目的信号区間とみなして切り分けるというものである。
【0004】
他の目的信号区間と雑音信号区間の切り分け処理として、入力信号の到来方向を検出し、目的信号を発している波源があると想定している方向と当該入力信号の到来方向が一致していれば、当該入力信号を目的信号区間とみなして切り分けるというものである。波源があると想定している方向以外の方向から到来する入力信号は全て雑音信号とみなす。従来技術において、入力信号の到来方向を検出する方法としては、相互相関法を用いた遅延時間検出処理などが知られている。
【0005】
次に、電話や音声認識装置では、上記の目的信号区間と雑音信号区間の検出処理だけでなく、聞きやすさや音声認識率を向上させるため、雑音抑制処理を付加することも多い。従来技術における雑音抑制処理としては、スペクトルサブトラクション処理が広く知られている。スペクトルサブトラクション処理とは、入力信号をフーリエ変換で周波数領域上のスペクトルに変換した後、雑音信号区間で雑音スペクトルモデルを推定し、推定した雑音スペクトルを目的信号区間で入力信号のスペクトルから減算して雑音信号を除き、逆フーリエ変換により再び時間領域上の信号へ戻す処理である。
【0006】
【発明が解決しようとする課題】
しかし、上記従来の目的信号区間と雑音信号区間の検出処理には以下の問題がある。
【0007】
まず、従来の入力音声信号のパワーの変化に注目した目的信号区間と雑音信号区間の検出処理では、雑音信号のレベルが目的信号に近い場合、正確に目的信号と雑音信号を検出することが困難であるという問題がある。
【0008】
図13は、従来の入力信号のパワーに基づく信号区間検出処理とスペクトルサブトラクションによる雑音抑制処理によって雑音を抑制するシステムを説明する図である。特に、扱う信号が音声信号の場合を説明する。
【0009】
510はマイクロフォンである。520はパワー信号区間検出部であり、従来の入力信号のパワーと所定の閾値を比較して目的信号区間と雑音信号区間を切り分けて検出する処理を実行する部分である。530はスペクトルサブトラクション部であり、従来のスペクトルサブトラクションによる雑音信号の抑制処理を行なう部分である。
【0010】
マイクロフォン510に入力する音は、話者の音声信号501と、雑音信号502とする。雑音信号502は定常雑音信号に非定常雑音信号が混入しているものとする。マイクロフォンへの入力信号503はこれら音声信号501と雑音信号502が重畳加算されたものであり、定常雑音信号区間である信号区間▲1▼▲4▼▲6▼と、非定常雑音信号区間である信号区間▲2▼▲5▼と、音声信号区間である信号区間▲3▼からなる。
【0011】
パワー信号区間検出部520は上記の入力信号を受け、入力信号のパワーに基づく信号区間検出処理を実行し、信号区間検出結果504を得る。パワー信号区間検出部520は、閾値を下回る信号区間▲1▼▲4▼▲6▼を雑音信号区間と判定し、閾値を超える信号区間▲2▼▲3▼▲5▼は全て音声区間と判定する。
【0012】
しかし、本来、信号区間▲2▼▲5▼は非定常な雑音信号区間であり、信号区間検出に失敗していることが分かる。
【0013】
このように従来の入力信号のパワーに基づく信号区間検出では、音声信号と同等レベルの非定常な雑音信号区間を音声信号区間と誤判定することがあり、正確な信号区間検出が実行できない場合がある。また、雑音源が他者音声である場合、相関関数などパワー以外の特徴量を用いても、雑音である他者音声を目的音声と誤判定してしまう恐れがある。
【0014】
更に、スペクトルサブトラクション部530による雑音抑制結果505を見ると、定常雑音信号区間である▲1▼▲4▼▲6▼と音声信号区間▲3▼では定常雑音の除去により、正しくかつ効果的に雑音信号成分が抑制されているが、非定常雑音信号区間▲2▼▲5▼では、信号区間検出結果504において音声信号区間と誤判定されているため、定常的な雑音信号成分しか除去されておらず、大部分の非定常雑音信号成分が消えずに残っている。
【0015】
このように、従来の入力信号のパワーに基づく信号区間検出処理では、非定常な雑音信号区間を音声信号区間と誤って検出する場合があるため、正確な信号区間検出処理を行なうことができず、さらに、雑音信号の抑制に関しても、非定常な雑音信号成分の抑制ができない。
【0016】
次に、従来における、入力信号の到来方向に基づく目的信号区間と雑音信号区間の切り分け処理では、目的音を発する波源と同じ方向に雑音源がある場合、正確に目的信号と雑音信号を切り分けることが困難であるという問題がある。つまり、目的信号区間と検出した信号区間において、実際には雑音信号区間であるものが混入している可能性がある。
【0017】
また、雑音信号区間と検出した信号区間に関しては、当該信号区間が定常雑音信号区間であるのか、非定常雑音信号区間であるのかを区別することはできないという問題がある。
【0018】
図14は、従来の入力信号の到来方向に基づく信号区間検出処理とスペクトルサブトラクションによる雑音抑制処理によって雑音を抑制するシステムを説明する図である。
【0019】
マイクロフォン510およびスペクトルサブトラクション部520は、図13と同様のものである。
【0020】
530は到来方向検出部であり、入力信号の到来方向の検出し、到来方向に基づいて目的信号区間と雑音信号区間を切り分ける処理を実行する部分である。到来方向検出処理は、相互相関法による遅延時間検出により行なうものとする。
【0021】
マイクロフォン510に入力する音は、図13と同様、音声信号501と、雑音信号502とする。雑音信号502は定常雑音に非定常な雑音が混入しているものとする。マイクロフォンへの入力信号503はこれら音声信号501と雑音信号502が重畳加算されたものであり、定常雑音信号区間である信号区間▲1▼▲4▼▲6▼と、非定常雑音信号区間である信号区間▲2▼▲5▼と、音声信号区間である信号区間▲3▼からなる。
【0022】
到来方向検出部530は上記の入力信号を受け、入力信号の到来方向に基づく信号区間検出処理を実行し、信号区間検出結果506に示す結果を得る。到来方向検出部530では、予め設定しておいた目的音の到来方向(話者方向)と入力音の到来方向が一致する区間▲3▼のみを音声区間と判定し、それ以外の区間▲1▼▲2▼▲4▼▲5▼▲6▼を雑音信号区間と判定する。
【0023】
しかし、到来方向検出部530のみでは、雑音信号区間▲1▼▲2▼▲4▼▲5▼▲6▼が、定常雑音信号区間であるのか、非定常雑音信号区間であるのかを区別することはできない。
【0024】
スペクトルサブトラクション部530による雑音抑制は、スペクトルサブトラクションは本来定常的な雑音のみを推定し抑制する手法である。到来方向に基づく区間検出処理を用いた場合、検出された雑音信号区間が定常雑音信号区間であるか非定常雑音信号区間であるかは区別されていないため、各々の雑音信号区間▲1▼▲2▼▲4▼▲5▼▲6▼に基づいて雑音モデルの推定を行なうこととなる。そのため、音声信号区間▲3▼の直前にある非定常雑音信号区間▲2▼においても雑音モデルを推定してしまう。その結果、実際には音声信号区間▲3▼に存在していない雑音成分を重畳した雑音モデルに基づいて推定した雑音スペクトルを入力スペクトルから減じてしまうこととなり、音声信号区間▲3▼の信号が歪んでしまう。
【0025】
本発明は、上記問題点を解決するべく、入力信号を目的信号区間と雑音信号区間に分類するだけでなく、雑音信号区間を複数の性質の異なる区間に分類し、更に、検出した各信号区間の性質に応じた雑音抑制処理を適用することを目的とする。特に、定常雑音と非定常雑音が混在する入力環境において、両者を正しく区別し、定常雑音に対する適切な雑音抑制処理および非定常雑音に対する適切な雑音抑制処理を実行することを目的とする。
【0026】
【課題を解決するための手段】
上記目的を達成するため、本発明の信号処理システムは、入力信号を入力する入力部と、前記入力信号から検出対象となる目的信号が記録されている信号区間の候補である目的信号区間候補と当該目的信号区間候補以外の雑音信号区間候補を検出する複数の信号区間候補検出部であって、それぞれが用いる目的信号区間候補および雑音信号区間候補の検出アルゴリズムが異なる信号区間候補検出部と、前記複数の信号区間候補検出部から各信号区間候補に対する各々の検出結果の通知を受け、当該検出結果の組み合わせにより、各信号区間候補を分類する信号区間分類部を備えたことを特徴とする。
【0027】
ここで、前記信号区間分類部による分類において、前記複数の信号区間候補検出部のすべてにおいて目的信号区間候補と検出された信号区間候補を目的信号区間とし、前記複数の信号区間候補検出部のすべてにおいて雑音信号区間候補と検出された信号区間候補を第1種雑音信号区間とし、前記複数の信号区間候補検出部のいずれかにおいて目的信号区間候補と検出され、かつ、いずれかにおいて雑音信号区間候補と検出された信号区間候補を第2種雑音信号区間として分類することが好ましい。
【0028】
上記構成により、入力信号を目的信号区間と雑音信号区間に分類するだけでなく、雑音信号区間を複数の性質の異なる雑音信号区間に分類することができる。
【0029】
また、前記信号区間分類部において、前記第1種雑音信号区間を定常雑音のみが現れている定常雑音信号区間と分類し、前記第2種雑音信号区間を定常雑音と非定常雑音が重畳して現れている非定常雑音信号区間と分類すれば、雑音信号区間を適切に定常雑音信号区間と非定常雑音信号区間に分類することができる。
【0030】
ここで、前記信号区間候補検出部のうち、少なくとも一つが、前記入力された信号のパワーの変化に基づいて前記目的信号区間候補と前記雑音信号区間候補とを検出するアルゴリズムを用いるものであるとし、また、前記信号区間候補検出部のうち、少なくとも一つが、前記入力された信号の到来方向を検出し、当該到来方向に基づいて前記目的信号区間候補と前記雑音信号区間候補とを検出するアルゴリズムを用いるものであるとすると、適切に雑音信号区間候補を複数の性質の異なる雑音信号区間候補に分類することができる。
【0031】
上記のパワーの変化に基づく信号区間候補検出処理および到来方向に基づく信号区間候補検出処理を実行するため、本発明の信号処理システムにおいて、入力部を介して入力される信号が、少なくとも2箇所の観測地点から得た複数の入力信号であり、前記複数の入力信号から任意に選んだ2つの入力信号の相互相関関数に基づいて遅延時間を求める遅延時間検出部と、前記遅延時間検出部が検出した遅延時間に基づいて、前記任意に選んだ2つの入力信号の入力地点に対する、前記入力信号の到来方向を検出する方向検出部を備えている。
【0032】
ここで、上記の到来方向に基づく信号区間候補検出処理を簡便に実行する工夫とし、本発明の信号処理システムは、前記入力部を介して入力される信号が、少なくとも2箇所の観測地点から得た複数の入力信号であり、前記複数の入力信号から任意に選んだ2つの入力信号の差分信号を演算する差分信号演算部と、前記任意に選んだ2つの入力信号のうちの1つの入力信号の微分信号を演算する微分信号演算部と、前記差分信号を前記微分信号で除算した除算信号を演算する除算信号演算部と、前記除算信号を前記任意に選んだ2つの入力信号間の遅延時間とする遅延時間検出部と、前記遅延時間検出部が検出した遅延時間に基づいて、前記任意に選んだ2つの入力信号の観測地点に対する、前記入力信号の到来方向を検出する方向検出部を備えるものとする。
【0033】
上記構成により、相互相関法など演算量の多いアルゴリズムに基づく処理に変え、各1回の差分演算、微分演算、除算演算のみで近似的に遅延時間および到来方向を得ることが可能となる。
【0034】
雑音抑制処理に関して、本発明の信号処理システムは、前記目的信号区間候補および前記雑音信号区間候補のすべてに対して同一の雑音抑制処理を適用する、または、前記信号区間分類部による分類結果に応じて適用する雑音抑制処理を選択して適用する雑音抑制部を備える。また、前記目的信号区間の信号に対して雑音抑制処理を行なわず、前記定常雑音信号区間の信号および前記非定常雑音信号区間の信号に対して、1より小さい重み付けの雑音抑制処理を行なう雑音抑制部を備えるものでも良い。さらに、前記定常雑音信号区間と分類された信号区間においてのみ定常雑音モデルの推定処理を実行し、前記目的信号区間および非定常雑音信号区間と分類された信号区間において雑音モデルの推定処理を停止する雑音モデル推定部を備え、前記雑音抑制部は、前記雑音モデル推定部が推定した雑音モデルに基づき、雑音抑制を行うものでも良い。
【0035】
上記構成により、定常雑音に対する適切な雑音抑制処理および非定常雑音に対する適切な雑音抑制処理を実行することができる。
【0036】
なお、目的信号区間の音声信号に対する音声認識を行う音声認識部を備えれば、精度の高い音声認識処理が可能となる。
【0037】
また、上記処理をプログラムとして提供すれば、本発明の波動信号処理をコンピュータ上で実行することができる。
【0038】
【発明の実施の形態】
以下、図面を参照しつつ、本発明の信号処理システムおよび信号処理方法の実施形態を説明する。
【0039】
(実施形態1)
実施形態1にかかる本発明の信号処理システムを説明する。
【0040】
実施形態1の信号処理システムは、入力信号から検出対象となる目的信号が記録されている信号区間の候補である目的信号区間候補と雑音信号区間候補を検出する複数の信号区間候補検出部と、前記複数の信号区間候補検出部から各信号区間候補に対する各々の検出結果の通知を受け、当該検出結果の組み合わせにより、各信号区間候補を分類する信号区間分類部を備える構成のものである。
【0041】
本発明の信号処理システムは、入力信号を目的信号区間候補と雑音信号区間候補を検出するだけでなく、検出された雑音信号区間候補を複数の性質の異なる雑音信号区間候補に区別する情報を得るため、異なるアルゴリズムにより入力信号から検出対象となる目的信号区間候補と雑音信号区間候補とを検出する複数の信号区間候補検出部を用いるものである。
【0042】
図1は、実施形態1にかかる信号処理システムの構成を示す図である。
【0043】
図1において、10は入力部、20は信号区間候補検出部、30は信号区間分類部である。
【0044】
入力部10は信号を入力する部分である。例えば、マイクロフォン、光センサなど、入力対象となる波動信号を受信する各種入力デバイスである。また、外部で採取され、記録された信号を入力するデータ入力デバイスであっても良い。
【0045】
信号区間候補検出部20は、入力部10を介して入力された信号から、検出対象となる目的信号区間候補と当該目的信号区間候補以外の雑音信号区間候補とを検出する複数の信号区間候補検出処理を実行するものである。図1には、第1の信号区間候補検出から第Nの信号区間候補検出部までが示されている。ここでNは2以上の整数である。以下の信号区間候補検出処理の説明では便宜上、3つの信号区間候補検出部20a〜20cについて説明する。
【0046】
ここで、各々の信号区間候補検出部20a〜20cはそれぞれ異なったアルゴリズムにより、信号から検出対象となる目的信号区間候補と当該目的信号区間候補以外の雑音信号区間候補とを検出するものである。
【0047】
このように、本発明の信号処理システムは、異なったアルゴリズムにより信号区間候補を検出するので、雑音信号区間候補を複数の性質の異なる雑音信号区間候補に分類する情報を得ることができる。
【0048】
信号区間分類部30は、複数の信号区間候補検出部20から各信号区間候補に対する各々の検出結果の通知を受け、当該検出結果の組み合わせにより、各信号区間候補を分類する部分である。
【0049】
当該実施形態1において、信号区間分類部30の当該分類処理は、以下の第1から第3の基準により行われる。
【0050】
第1の基準は、複数の信号区間候補検出部20のすべてにおいて目的信号区間候補と検出された信号区間候補を目的信号区間と分類する基準である。
【0051】
第2の基準は、複数の信号区間候補検出部20のすべてにおいて雑音信号区間候補と検出された信号区間候補を第1種雑音信号区間と分類する基準である。
【0052】
第3の基準は、複数の信号区間候補検出部20のいずれかにおいて目的信号区間候補と検出され、かつ、いずれかにおいて雑音信号区間候補と検出された信号区間候補を第2種雑音信号区間として分類する基準である。
【0053】
上記の第1の基準は、複数の信号区間候補検出部20のすべてにおいて目的信号区間候補と検出された信号区間候補を目的信号区間と分類するものである。当該第1の基準により分類された信号区間候補は、すべての信号区間候補検出部20(この例では20aから20c)のすべてのアルゴリズムによって目的信号区間候補と検出された信号区間候補であり、目的信号区間と想定されるすべての条件を満たす信号区間候補となっている。
【0054】
次に、上記第2の基準は、複数の信号区間候補検出部20のすべてにおいて雑音信号区間候補と検出された信号区間候補を第1種雑音信号区間と分類するものである。当該第2の基準により分類された信号区間候補は、すべての信号区間候補検出部20(この例では20aから20c)のすべてのアルゴリズムによって雑音信号区間候補と検出された信号区間候補であり、雑音信号区間と想定されるすべての条件を満たす信号区間候補となっている。
【0055】
次に、上記第3の基準は、複数の信号区間候補検出部20のいずれかにおいて目的信号区間候補と検出され、かつ、いずれかにおいて雑音信号区間候補と検出された信号区間候補を第2種雑音信号区間として分類するものである。当該第3の基準により分類された信号区間候補は、それぞれの信号区間候補検出部20(この例では20aから20c)において、検出結果が異なっている信号区間候補である。いずれかのアルゴリズムによって雑音信号区間候補であると検出されているので、当該信号区間候補を雑音信号区間候補と扱われる一方、当該信号区間候補は他のアルゴリズムでは目的信号区間候補と検出されており、目的信号区間候補となる条件を満たす側面を有しているものであり、上記の第1種雑音信号区間候補のようにすべてのアルゴリズムにおいて雑音信号区間としての条件を満たすものではない。そこで、第2種雑音信号区間とする。
【0056】
次に、図1に示した信号処理システムの各部分における信号処理結果を追いつつ、本発明の信号処理システムの処理の流れを説明する。
【0057】
図2は、入力信号および信号処理システムの各部分における信号を示す図である。この例でも、信号区間候補検出部20は、第1の信号区間候補検出部20aから第3の信号区間候補検出部20cの3つの信号区間候補検出部を用いた構成とする。
【0058】
図2において、100は入力部10から入力された入力信号、110が第1の信号区間候補検出部20aによる信号区間候補の検出結果を示すグラフ、120が第2の信号区間候補検出部20bによる信号区間候補の検出結果を示すグラフ、130が第3の信号区間候補検出部20cによる信号区間候補の検出結果を示すグラフ、140が信号区間分類部30による信号区間候補の分類結果を示すグラフである。
【0059】
なお、上記グラフ110、グラフ120、グラフ130において、横軸は時間を表わしている。
【0060】
入力信号100は、時系列に、第1の信号区間101、第2の信号区間102、第3の信号区間103、第4の信号区間104の4つの信号区間が並んだ信号となっている。
【0061】
この例では、入力信号100の各信号区間は、第1の信号区間候補検出部20aにより、第1の信号区間101は雑音信号区間候補、第2の信号区間102は雑音信号区間候補、第3の信号区間103は雑音信号区間候補、第4の信号区間104は目的信号区間候補と検出されている。
【0062】
また、入力信号100の各信号区間は、第2の信号区間候補検出部20bにより、第1の信号区間101は雑音信号区間候補、第2の信号区間102は雑音信号区間候補、第3の信号区間103は目的信号区間候補、第4の信号区間104は目的信号区間候補と検出されている。
【0063】
また、入力信号100の各信号区間は、第3の信号区間候補検出部20cにより、第1の信号区間101は雑音信号区間候補、第2の信号区間102は目的信号区間候補、第3の信号区間103は目的信号区間候補、第4の信号区間104は目的信号区間候補と検出されている。
【0064】
信号区間分類部30は、第1の信号区間候補検出部20a〜第3の信号区間候補検出部20cから信号区間候補の検出結果の通知を受け、上記第1から第3の基準により各信号区間候補を分類する。
【0065】
第1の信号区間101は第2の基準により第1種雑音信号区間と分類される。
【0066】
第2の信号区間102は第3の基準により第2種雑音信号区間と分類される。
【0067】
第3の信号区間103も同様に第3の基準により第2種雑音信号区間と分類される。
【0068】
第4の信号区間104は第1の基準により目的信号区間と分類される。
【0069】
ここで、上記第2の信号区間102および第3の信号区間103ともに、第2種雑音信号区間と分類されるが、さらに細かく分類することができる。なぜならば、第2の信号区間102は、第2の信号区間候補検出部20bが用いるアルゴリズムにより雑音信号区間候補と検出されるものであり、一方、第3の信号区間103は第2の信号区間候補検出部20bが用いるアルゴリズムにより目的信号区間候補と検出されるものであり、その性質が異なるものであるからである。
【0070】
そこで、信号区間分類部30は、雑音信号区間をさらに細かく分類し、第2の信号区間102を第1の第2種雑音信号区間と分類し、第3の信号区間103を第2の第2種雑音信号区間と分類することもできる。
【0071】
以上、実施形態1の信号処理システムによれば、入力信号を目的信号区間と雑音信号区間に分類するだけでなく、雑音信号区間を複数の性質の異なる雑音信号区間に分類することができる。また、このように分類された雑音信号区間に対して後述する実施形態5から7の雑音抑制処理を実行したり、分類された目的信号区間に対して実施形態8の音声認識処理などを実行することが可能となる。
【0072】
(実施形態2)
実施形態2は、入力信号から検出した雑音信号区間候補を、定常雑音信号区間と非定常雑音信号区間に分類する信号処理システムである。
【0073】
ここで、定常雑音信号とは、入力信号の振幅や周波数スペクトルの時間変動が少なく安定している雑音信号である。例えば、入力信号の入力環境において一定の回転数で作動しているファンから発せられる機械音などである。
【0074】
非定常雑音信号とは、入力信号の振幅や周波数スペクトルの時間変動が大きく、非定常的に存在する雑音源や非定常的に雑音を発する雑音源から入力される雑音信号である。例えば、入力信号の入力環境内を通過する車から発せられる雑音信号や、入力信号の入力環境内に存在する時計が時報として発する点鐘音の雑音信号などである。
【0075】
実施形態2の信号処理システムの構成は図1と同様で良いので図示は省略する。
【0076】
信号区間分類部30は、実施形態1と同様に、複数の信号区間候補検出部20から各信号区間候補に対する各々の検出結果の通知を受け、当該検出結果の組み合わせにより、各信号区間候補を分類する部分であり、実施形態1と同様、実施形態1で説明した第1から第3の基準により行われるが、実施形態2の信号処理システムでは、第2の基準により分類された第1種雑音信号区間を定常雑音のみが現れている定常雑音信号区間と分類し、第3の基準により分類された第2種雑音信号区間を定常雑音と非定常雑音が重畳して現れている非定常雑音信号区間と分類する。
【0077】
定常雑音は、音響的性質が時間的に変化せずに安定している雑音信号であるので、信号区間候補検出部20が用いるアルゴリズムが適切なものであれば、いずれのアルゴリズムによっても雑音信号区間候補と検出されると想定できるからである。一方、非定常雑音は、その音響的性質が時間的に変化する雑音信号であり、いずれかのアルゴリズムによって雑音信号区間候補と検出されるが、他のいずれかのアルゴリズムによって目的信号区間候補と検出されると想定できるからである。
【0078】
次に、本実施形態2の信号処理システムの各部分における信号処理結果を追いつつ処理の流れを説明する。
【0079】
図3は、実施形態2における入力信号および信号処理システムの各部分における信号を示す図である。この例は、信号区間候補検出部20は、第1の信号区間候補検出部20aと第2の信号区間候補検出部20bの2つの信号区間候補検出部を用いた構成とする。
【0080】
図3において、200は入力部10から入力された入力信号、210が第1の信号区間候補検出部20aによる信号区間候補の検出結果を示すグラフ、220が第2の信号区間候補検出部20bによる信号区間候補の検出結果を示すグラフ、230が信号区間分類部30による信号区間候補の分類結果を示すグラフである。
【0081】
この例では、入力信号200は、時系列に、第1の信号区間201、第2の信号区間202、第3の信号区間203、第4の信号区間204の4つの信号区間が並んだ信号となっている。
【0082】
この例では、入力信号200の各信号区間は、第1の信号区間候補検出部20aにより、第1の信号区間201は雑音信号区間候補、第2の信号区間202は目的信号区間候補、第3の信号区間203は雑音信号区間候補、第4の信号区間204は目的信号区間候補と検出されている。
【0083】
また、入力信号200の各信号区間は、第2の信号区間候補検出部20bにより、第1の信号区間201は雑音信号区間候補、第2の信号区間202は雑音信号区間候補、第3の信号区間203は目的信号区間候補、第4の信号区間204は目的信号区間候補と検出されている。
【0084】
信号区間分類部30は、第1の信号区間候補検出部20aおよび第2の信号区間候補検出部20bから信号区間候補の検出結果の通知を受け、第1から第3の基準により各信号区間候補を分類する。
【0085】
第1の信号区間201は第2の基準により第1種雑音信号区間と分類される。
【0086】
第2の信号区間202は第3の基準により第2種雑音信号区間と分類される。
【0087】
第3の信号区間203も第3の基準により第2種雑音信号区間と分類される。
【0088】
第4の信号区間204は第1の基準により目的信号区間と分類される。
【0089】
本実施形態2では、さらに、信号区間分類部30は、第1の信号区間201を定常雑音信号区間と分類し、第2の信号区間202を非定常雑音信号区間と分類し、第3の信号区間203を非定常雑音信号区間と分類し、第4の信号区間204を目的信号区間と分類する。
【0090】
以上、実施形態2の信号処理システムによれば、入力信号から検出した雑音信号区間候補を、定常雑音信号区間と非定常雑音信号区間に分類することができる。また、このように分類された雑音信号区間に対して後述する実施形態5から7の雑音抑制処理を実行したり、分類された目的信号区間に対して実施形態8の音声認識処理などを実行することが可能となる。
【0091】
(実施形態3)
実施形態3の信号処理システムは、信号区間候補検出部が用いるアルゴリズムを、入力信号のパワーの変化に基づいて目的信号区間候補と雑音信号区間候補とを検出するアルゴリズムと、入力信号の到来方向に基づいて目的信号区間候補と雑音信号区間候補とを検出するアルゴリズムとの組み合わせとした例である。
【0092】
図4は、実施形態3の信号処理システムの構成を示す図である。図4において、入力部10、信号区間分類部30は図1と同様である。
【0093】
第1の信号区間候補検出部20a’は、パワー計算部21を備えており、入力信号のパワーの変化に基づいて目的信号区間候補と雑音信号区間候補とを検出するアルゴリズムを用いるものである。
【0094】
目的信号は、入力のターゲットとされている信号であり、その入力環境において当該目的信号のレベルが大きくなるように設定されているので、目的信号のパワーは大きいと想定される。そこで、当該パワーの変化に基づくアルゴリズムは、信号区間候補においてパワー変動が所定値以上であるものを目的信号区間候補と検出し、パワー変動が所定値に満たないものを雑音信号区間候補と検出するものである。
【0095】
パワー計算部21は、入力信号のパワーを計算する。パワー計算処理の一例を以下に示す。入力音をf(t)としてある時間区間TのパワーP(t)を以下の(数1)により計算する。
【0096】
【数1】
【0097】
第1の信号区間候補検出部20a’は、パワー計算部21で得たパワーの時間的変動を示す微分値P’(t)を監視し、当該変動量がある閾値Ath以上である場合に目的信号区間候補と判定し、閾値Athを下回っている場合には雑音信号区間候補と判定する。閾値Athはあらかじめ与えていても良く、また、入力音P’(t)の移動平均をとるなどして決めても良い。
【0098】
第2の信号区間候補検出部20b’は、到来方向検知部22を備え、入力信号の到来方向に基づいて目的信号区間候補と雑音信号区間候補とを検出するアルゴリズムを用いるものである。なお、入力部10を介して入力される信号が、少なくとも2箇所の観測地点から得た複数の入力信号とする。
【0099】
目的信号は、入力のターゲットとされている信号であり、その入力環境において当該目的信号の到来方向を所定方向、例えば正面方向と設定して入力するので、目的信号の到来方向が想定される。そこで、到来方向に基づくアルゴリズムは、信号区間候補において入力信号の到来方向が所定方向であるものを目的信号区間候補と検出し、到来方向がが所定方向でないものを雑音信号区間候補と検出するものである。
【0100】
なお、到来方向検知部22の詳細構成例として、次の2つの構成を説明する。
【0101】
到来方向検知部22の第1の構成例は、図5(a)に示すように、複数の入力信号から任意に選んだ2つの入力信号の相互相関関数に基づいて遅延時間を求める遅延時間計算部23aを備えている。
【0102】
遅延時間計算部は、複数の入力信号から任意に選んだ第1および第2の入力信号f(t)、g(t)の相互相関関数R(τ)を(数2)により計算する。
【0103】
【数2】
【0104】
遅延時間計算部は、計算した相互相関関数R(τ)を最大にするτを第1の入力信号と第2の入力信号間の遅延時間Δτとみなす。
【0105】
次に、到来方向検知部22の第2の構成例は、複数の入力信号から任意に選んだ2つの入力信号の差分値を、2つの入力信号の一方の微分値で除算した値に基づいて近似遅延時間を求める遅延時間計算部23bを備えている。
【0106】
まず、最初に複数の入力信号から任意に選んだ2つの入力信号の差分値を、2つの入力信号の一方の微分値で除算した値に基づいて近似遅延時間を求める原理を説明する。
【0107】
図6は、2つのセンサにおける受信信号間の遅延時間を説明する図である。
【0108】
図6に示すように、センサ1とセンサ2が、距離d離れて配置されているとする。いま、波源から、波動信号が、センサ1とセンサ2に対して角度θの方向から到来したとする。波動信号をそれぞれW1とW2とする。センサ1とセンサ2はそれぞれ検知した波動信号を電気信号に変換し、2つの受信信号を得る。ここでは、便宜上、第1の受信信号f1(t)と第2の受信信号f2(t)とする。
【0109】
センサ1とセンサ2の配置と波源方向の関係から、図6に示すように、波動信号W1がセンサ1に到達するまでの伝搬行路と、波動信号W2がセンサ2に到達するまでの伝搬行路には行路差Lが存在する。この行路差Lのために、第1の受信信号f1(t)と第2の受信信号f2(t)の間には遅延時間Δtが生じる。ここで、両者の波形は同じであるので、第1の受信信号f1(t)と第2の受信信号f2(t)は、時間軸を揃えて表現すると、f(t)とf(t+Δt)と表現でき、図6のような関係にある。
【0110】
ここで、第2の受信信号f(t+Δt)に注目すると、第2の受信信号f(t+Δt)は(数3)のようにテーラー展開することが可能である。
【0111】
【数3】
【0112】
波動信号の速度が十分速く、センサ1とセンサ2の間が十分小さいものであれば、遅延時間Δtは極めて小さい値であるので、Δtの高次項、つまり、(数3)の第3項以降を無視して(数4)のように近似しても、(数3)の値の精度は高く保たれる。
【0113】
【数4】
【0114】
なお、(数4)の右辺のΔtは近似遅延時間を表わしている。
【0115】
(数4)を変形すると(数5)が得られる。
【0116】
【数5】
【0117】
(数5)により、近似遅延時間は、f(t+Δt)−f(t)をf’(t)で除算したもの、つまり、第1の受信信号と第2の受信信号の差分信号を、第1の受信信号の微分信号で除算したものとなる。つまり、書き換えれば(数6)のように表現できる。
【0118】
【数6】
【0119】
なお、上記演算では、便宜上、遅延受信信号(Δtの遅延がある受信信号)を第2の受信信号としたが、遅延受信信号(Δtの遅延がある受信信号)を第1の受信信号としても良い。さらに、微分信号を第1の受信信号の微分演算により求めたが、第2の受信信号の微分演算により求めても良い。
【0120】
以上、上記(数6)による遅延時間検出演算によれば、演算処理が、第1の受信信号および第2の受信信号間の1回の差分演算と、第1の受信信号の1回の微分演算と、差分演算結果を微分演算結果で除算する1回の除算演算のみとなるので、従来の相互相関法を用いた場合の演算処理に比べると、演算量が少なくて済むので高速処理が可能となることが分かる。
【0121】
遅延時間計算部は、以上の原理により、近似遅延時間を求める。
【0122】
遅延時間計算部23bは、図5(b)に示すように、複数の入力信号から任意に選んだ2つの入力信号の差分信号を演算する差分信号演算部24と、任意に選んだ2つの入力信号のうちの1つの入力信号の微分信号を演算する微分信号演算部25と、差分信号を微分信号で除算した除算信号を演算する除算信号演算部26を備え、除算信号を前記任意に選んだ2つの入力信号間の遅延時間とする。到来方向検知部22は、遅延時間検出部23bが検出した遅延時間に基づいて、任意に選んだ2つの入力信号の観測地点に対する、入力信号の到来方向を検出するものである。
【0123】
差分信号演算部24は、複数の入力信号から任意に選んだ第1および第2の入力信号f(t)、g(t)の差分演算を(数7)により求める。
【0124】
【数7】
【0125】
微分信号演算部25は、第1または第2の入力信号の微分値を演算するものであり、ここでは、例えば、第1の入力信号の微分値を(数8)により求める。
【0126】
【数8】
【0127】
除算信号演算部26は、(数9)により、差分信号演算部24で得た差分値を微分信号演算部25で得た微分値で除算して遅延時間Δτを求める。
【0128】
【数9】
【0129】
到来方向検知部22は、遅延時間検出部23bが検出した遅延時間Δτと、遅延時間計算の対象となった2つのセンサ間の距離dから任意に選んだ2つの入力信号の入力地点に対する入力信号の到来方向θを計算する。その原理を図6を用いて説明する。
【0130】
図6において,センサ間の距離d、入力音の到来方向θ、信号源から2つのマイクへの行路差L、遅延時間Δτの間には、信号の伝播速度をvとおくと(数10)の関係がある。
【0131】
【数10】
【0132】
従って、入力音の到来方向θは(数11)のように計算できる。
【0133】
【数11】
【0134】
第2の信号区間候補検出部20b’は、到来方向検知部22で得た到来方向θと、予め設定した目的信号の到来方向θ0との差の絶対値がΔθ以内の場合は目的音区間候補と判定し、差の絶対値がΔθより大きい場合は雑音区間候補と判定する。
【0135】
以上、実施形態3の信号処理システムは、信号区間候補検出部20において、入力信号のパワーの変化に基づいて目的信号区間候補と雑音信号区間候補とを検出するアルゴリズムと、入力信号の到来方向に基づいて目的信号区間候補と雑音信号区間候補とを検出するアルゴリズムにより目的信号区間候補と雑音信号区間候補を検出する。
【0136】
なお、信号区間候補検出部20により検出したこれら目的信号区間候補と雑音信号区間候補の分類処理は、実施形態1または実施形態2と同様の処理により実行する。
【0137】
(実施形態4)
実施形態4の信号処理システムは、信号区間候補検出部が用いるアルゴリズムとして、入力信号のパワーの変化に基づいて目的信号区間候補と雑音信号区間候補とを検出するアルゴリズムと、入力信号のパワー比に基づいて入力信号の到来方向を検出し、到来方向に基づいて目的信号区間候補と雑音信号区間候補とを検出するアルゴリズムとの組み合わせとした例である。
【0138】
図7は、実施形態4の信号処理システムの構成を示す図である。図7において、入力部10、信号区間分類部30は図1と同様である。
【0139】
第2の信号区間候補検出部20b’’は、パワー比計算部27を備えており、入力信号のパワー比に基づいて入力信号の到来方向を検出し、到来方向に基づいて目的信号区間候補と雑音信号区間候補とを検出するアルゴリズムを用いるものである。
【0140】
パワー比計算部27では第1および第2の入力信号のパワー比を計算する。到来方向検知部22aは、パワー比計算部27で得たパワー比から入力信号の到来方向を計算する。つまり、両信号のパワー比が等しい場合、2つの入力センサに正対した方向から信号が到来しており、パワー比が最大であれば、2つの入力センサに対して平行の方向から信号が到来していることが分かる。このようにパワー比を解析することにより入力信号の到来方向を検知することができる。
【0141】
パワー比の計算量は、相関関数係数の計算などに比べて、少ない計算量で求めることができ、信号処理システムのリソースの負荷を小さくすることが可能となる。
【0142】
なお、第2の信号区間候補検出部20b’’において、入力信号のパワー比に基づいて入力信号の到来方向を検出し、到来方向に基づいて目的信号区間候補と雑音信号区間候補とを検出するアルゴリズムを採用する点以外は、実施形態3で説明した処理と同様であるので、それら処理に関する説明は省略する。
【0143】
(実施形態5)
実施形態5の信号処理システムは、目的信号区間および雑音信号区間検出とともに、雑音信号抑制処理を実行するものである。
【0144】
図8は、実施形態5の信号処理システムの構成を示す図である。
【0145】
入力部10、信号区間候補検出部20、信号区間分類部30は、実施形態1で示した図1と同様のもので良く、ここでの詳しい説明は省略する。なお、信号区間候補検出部20は、実施形態1で示したものに限られず、実施形態3で示した図4の第1の信号区間候補検出部20a’または第2の信号区間候補検出部20b’、実施形態4で示した図7の第2の信号区間候補検出部20b’’と同様のものとしても良い。
【0146】
実施形態5の信号処理システムは、雑音抑制部40を備えている。
【0147】
雑音抑制部40は、入力部10から少なくとも1つの入力信号を処理対象として入力し、信号区間分類部30によって分類された各信号区間の性質に応じて、抑制量を変化させながら入力信号のレベルを抑制する。例えば、雑音抑制部40は、雑音信号区間に対して重みづけを行って信号レベルを低下させる。
【0148】
ここで、重み係数は線形係数、非線形係数、2値係数など自由に用いることができる。以下に、実施形態2で説明した定常雑音信号区間と非定常雑音信号区間に対する重み係数の一例を示す。
【0149】
定常雑音信号区間に対する重み係数をWa、非定常雑音信号区間に対する重み係数をWb、目的信号区間の重み係数をWcとし、定常雑音信号区間の平均パワーをPs、非定常雑音信号区間の平均パワーをPnsとし、各重み係数を各信号区間の信号パワーに応じて(数12)に従って設定する。
【0150】
【数12】
【0151】
これら各信号区間に応じた重み係数を入力信号f(t)に乗じることにより、定常雑音信号区間と非定常雑音信号区間の雑音レベルを同様に抑制することができ、定常雑音信号を除去するとともに、非定常雑音信号の低減も可能となる。
【0152】
(実施形態6)
実施形態6の信号処理システムは、実施形態5と同様、目的信号区間および雑音信号区間検出とともに、雑音信号抑制処理を実行するものである。
【0153】
実施形態6の信号処理システムは、雑音モデルを用いて雑音信号抑制処理を実行する。
【0154】
特に、実施形態2で説明したように、雑音信号区間候補を定常雑音信号区間と非定常雑音信号区間に分類し、定常雑音信号区間と分類された信号区間において雑音モデル推定を実行し、目的信号区間および非定常雑音信号区間と分類された信号区間において雑音モデル推定を実行せずに、雑音モデルを推定する雑音モデル推定部と、雑音モデル推定部が推定した雑音モデルに基づき、雑音抑制を行う雑音抑制部を備えた構成としている。
【0155】
図9は、実施形態6の信号処理システムの構成を示す図である。
【0156】
入力部10、信号区間候補検出部20、信号区間分類部30は、実施形態5で示した図8と同様のもので良く、ここでの説明は省略する。
【0157】
雑音抑制部40aは、雑音モデル推定部41を備え、雑音モデル推定部41が推定した雑音モデルに基づき、雑音抑制を行う。
【0158】
ここで、雑音モデル推定部41は、定常雑音信号区間と分類された信号区間において雑音モデル推定を実行し、目的信号区間および非定常雑音信号区間と分類された信号区間において雑音モデル推定を実行せずに、雑音モデルを推定する。
【0159】
雑音モデル推定部41の推定処理を定常雑音信号区間のみで実行することにより雑音抑制性能を高く維持することができる。その理由は以下のように説明できる。つまり、本実施形態6の信号処理システムでは、定常雑音信号区間のみで雑音モデル推定を実行するので、雑音モデルは定常雑音信号のみに対するものとなる。もし、非定常雑音信号区間において雑音モデルの推定を実行する構成とすると、当該非定常雑音信号区間のみに有効な非定常雑音信号成分が繰り込まれてしまい、定常雑音信号区間や他の非定常雑音信号区間に対応しない非定常雑音信号成分を抑制することとなり、かえって雑音抑制性能を劣化させる結果を招くからである。
【0160】
(実施形態7)
実施形態7の信号処理システムは、実施形態5と同様、目的信号区間および雑音信号区間検出とともに、雑音信号抑制処理を実行するものである。
【0161】
実施形態7の信号処理システムは、定常雑音信号区間には、スペクトルサブトラクションによる雑音抑制処理を適用し、非定常雑音信号区間には非定常雑音信号区間の性質に応じた雑音抑制処理を適用するものである。
【0162】
図10は、実施形態7の信号処理システムの構成を示す図である。
【0163】
入力部10、信号区間候補検出部20、信号区間分類部30は、実施形態5で示した図8と同様のもので良く、ここでの説明は省略する。
【0164】
図10において、雑音抑制部40bは、フーリエ変換部42、雑音モデル推定部43、雑音スペクトル抑制部44、逆フーリエ変換部45を備えている。
【0165】
フーリエ変換部42は、入力部10から少なくとも1つの入力信号を入力し、当該入力信号に対して窓関数により窓掛け処理を施した後、フーリエ変換により入力スペクトル信号を求める部分である。
【0166】
雑音モデル推定部43は、定常雑音信号区間と分類された信号区間の信号を入力し、そのスペクトルを計算し、定常雑音信号区間の雑音スペクトル信号を推定する部分である。
【0167】
雑音スペクトル抑制部44は、フーリエ変換部42から入力スペクトル信号を入力し、また、雑音モデル推定部43から雑音スペクトル信号を入力し、当該入力スペクトル信号から当該雑音スペクトル信号を差分演算し、雑音スペクトル信号成分を除去する部分である。
【0168】
逆フーリエ変換部45は、周波数領域上のスペクトル信号を逆フーリエ変換により時間領域上の信号に戻す部分である。
【0169】
以上の構成により、雑音抑制部40bは、定常雑音信号区間に対して、スペクトルサブトラクションによる雑音抑制処理を適用することができる。
【0170】
なお、非定常雑音信号区間には非定常雑音信号区間の性質に応じた雑音抑制方式を適用することにより、適切に非定常雑音信号区間の非定常雑音信号または定常雑音信号と非定常雑音信号との重畳信号成分を取り除くことができるため、雑音抑制処理を効果的に実行できる。
【0171】
(実施形態8)
実施形態8の信号処理システムは、処理対象の信号を音声信号とし、入力信号である音声信号に対する目的信号区間検出処理、雑音信号区間検出処理、雑音信号抑制処理とともに、当該目的信号の音声認識処理を実行するものである。
【0172】
図11は、実施形態8の信号処理システムの構成を示す図である。
【0173】
入力部10、信号区間候補検出部20、信号区間分類部30、雑音抑制部40は、実施形態5で示したものと同様のもので良く、ここでの詳しい説明は省略する。
【0174】
なお、雑音抑制部40は、実施形態5で示したものに限られず、実施形態6で示した雑音抑制部40a、または、実施形態7で示した雑音抑制部40bと同様のものとしても良い。
【0175】
実施形態8の信号処理システムは、音声認識部50を備えている。
【0176】
音声認識部50は、雑音抑制部40から雑音抑制処理後の入力信号を入力し、目的信号区間の信号に対して音声認識処理を行う部分である。
【0177】
なお、音声認識部50における音声認識処理アルゴリズムは、従来技術におけるもので良い。例えば、目的信号を音素単位に分け、各音素ごと音声モデルとのパターンマッチングにより音声を認識する。
【0178】
以上、本実施形態8の信号処理システムによれば、非定常雑音が存在する入力環境下で得られた入力信号に対して本発明の雑音抑圧処理を前処理として実行し、音声認識処理を実行することにより音声認識精度を向上することができる。
【0179】
(実施形態9)
本発明の波動信号処理は、上記に説明した処理を実現するステップを記述したプログラムとして記述することができ、当該プログラムをコンピュータに読み取らせることにより、本発明の波動信号処理を実行することができる。本発明の信号処理システムを実現する処理ステップを備えたプログラムは、図12に図示した例のように、CD−ROM1002やフレキシブルディスク1003等の可搬型記録媒体1001だけでなく、ネットワーク上にある記録装置内の記録媒体1000や、コンピュータのハードディスクやRAM等の記録媒体1005に格納して提供することができ、ネットワークからダウンロードすることもできる。プログラム実行時には、プログラムはコンピュータ1004上にローディングされ、主メモリ上で実行される。
【0180】
なお、上記実施形態1〜8において説明した、目的信号区間検出処理、雑音信号区間検出処理、雑音抑制処理、音声認識処理は、適宜組み合わせて用いても良い。
【0181】
本発明の信号処理システムおよび方法について、さらに以下の項を開示する。
【0182】
(付記1) 入力信号を入力する入力部と、
前記入力信号から検出対象となる目的信号が記録されている信号区間の候補である目的信号区間候補と当該目的信号区間候補以外の雑音信号区間候補を検出する複数の信号区間候補検出部であって、それぞれが用いる目的信号区間候補および雑音信号区間候補の検出アルゴリズムが異なる信号区間候補検出部と、
前記複数の信号区間候補検出部から各信号区間候補に対する各々の検出結果の通知を受け、当該検出結果の組み合わせにより、各信号区間候補を分類する信号区間分類部を備えたことを特徴とする信号処理システム(1)。
【0183】
(付記2) 前記信号区間分類部は、
前記複数の信号区間候補検出部のすべてにおいて目的信号区間候補と検出された信号区間候補を目的信号区間とし、
前記複数の信号区間候補検出部のすべてにおいて雑音信号区間候補と検出された信号区間候補を第1種雑音信号区間とし、
前記複数の信号区間候補検出部のいずれかにおいて目的信号区間候補と検出され、かつ、いずれかにおいて雑音信号区間候補と検出された信号区間候補を第2種雑音信号区間として分類する付記1に記載の信号処理システム(2)。
【0184】
(付記3) 前記信号区間分類部の分類処理において、前記第1種雑音信号区間を定常雑音のみが現れている定常雑音信号区間と分類し、前記第2種雑音信号区間を定常雑音と非定常雑音が重畳して現れている非定常雑音信号区間と分類する付記2に記載の信号処理システム(3)。
【0185】
(付記4) 前記複数の信号区間候補検出部のうち、少なくとも一つが、前記入力された信号のパワーの変化に基づいて前記目的信号区間候補と前記雑音信号区間候補とを検出するアルゴリズムを用いるものであり、少なくとも他の一つが、前記入力された信号の到来方向を検出し、当該到来方向に基づいて前記目的信号区間候補と前記雑音信号区間候補とを検出するアルゴリズムを用いるものである付記1に記載の信号処理システム(4)。
【0186】
(付記5) 前記目的信号区間候補および前記雑音信号区間候補のすべてに対して同一の雑音抑制処理を適用する、または、前記信号区間分類部による分類結果に応じて適用する雑音抑制処理を選択して適用する雑音抑制部を備えた付記1に記載の信号処理システム(5)。
【0187】
(付記6) 前記目的信号区間の信号に対して雑音抑制処理を行なわず、前記定常雑音信号区間の信号および前記非定常雑音信号区間の信号に対して、1より小さい重み付けの雑音抑制処理を行なう雑音抑制部を備えた付記3に記載の信号処理システム(6)。
【0188】
(付記7) 前記定常雑音信号区間と分類された信号区間においてのみ定常雑音モデルの推定処理を実行し、前記目的信号区間および非定常雑音信号区間と分類された信号区間において雑音モデルの推定処理を停止する雑音モデル推定部を備え、
前記雑音抑制部は、前記雑音モデル推定部が推定した雑音モデルに基づき、雑音抑制を行う付記5または6に記載の信号処理システム(7)。
【0189】
(付記8) 前記定常雑音信号区間と分類された信号区間においてのみ定常雑音モデルの推定処理を実行し、前記目的信号区間および非定常雑音信号区間と分類された信号区間において雑音モデルの推定処理を停止する雑音モデル推定部を備え、
前記雑音抑制部は、前記雑音モデル推定部が推定した雑音モデルに基づき、雑音抑制処理を行い、さらに、当該雑音抑制処理後の非定常雑音信号区間の信号レベルを当該雑音抑制処理後の定常雑音信号区間の平均信号レベルまで抑制する雑音抑制処理を行なう付記5または6に記載の信号処理システム。
【0190】
(付記9) 前記入力部を介して入力される信号が、少なくとも2箇所の観測地点から得た複数の入力信号であり、
前記到来方向に基づいて前記目的信号区間候補と前記雑音信号区間候補とを検出するアルゴリズムを用いる信号区間候補検出部が、
前記複数の入力信号から任意に選んだ2つの入力信号の相互相関関数に基づいて遅延時間を求める遅延時間検出部と、
前記遅延時間検出部が検出した遅延時間に基づいて、前記任意に選んだ2つの入力信号の入力地点に対する、前記入力信号の到来方向を検出する方向検出部を備えた付記4に記載の信号処理システム。
【0191】
(付記10) 前記入力部を介して入力される信号が、少なくとも2箇所の観測地点から得た複数の入力信号であり、
前記到来方向に基づいて前記目的信号区間候補と前記雑音信号区間候補とを検出するアルゴリズムを用いる信号区間候補検出部が、
前記複数の入力信号から任意に選んだ2つの入力信号の差分信号を演算する差分信号演算部と、
前記任意に選んだ2つの入力信号のうちの1つの入力信号の微分信号を演算する微分信号演算部と、
前記差分信号を前記微分信号で除算した除算信号を演算する除算信号演算部と、
前記除算信号を前記任意に選んだ2つの入力信号間の遅延時間とする遅延時間検出部と、
前記遅延時間検出部が検出した遅延時間に基づいて、前記任意に選んだ2つの入力信号の観測地点に対する、前記入力信号の到来方向を検出する方向検出部を備えた付記4に記載の信号処理システム。
【0192】
(付記11) 前記入力信号が音声信号であり、
前記目的信号区間の音声信号に対する音声認識を行う音声認識部を備えた付記1〜10のいずれかに記載の信号処理システム(8)。
【0193】
(付記12) 入力信号を入力し、
前記入力信号から検出対象となる目的信号が記録されている信号区間の候補である目的信号区間候補と当該目的信号区間候補以外の雑音信号区間候補を検出する複数の信号区間候補検出処理であって、それぞれが用いる目的信号区間候補および雑音信号区間候補の検出アルゴリズムが異なるものを用いて、目的信号区間候補および雑音信号区間候補を検出し、
前記複数の信号区間候補検出処理から各信号区間候補に対する各々の検出結果の通知を受け、当該検出結果の組み合わせにより、各信号区間候補を分類することを特徴とする信号処理方法(9)。
【0194】
(付記13) 前記信号区間候補の分類処理において
前記複数の信号区間候補検出処理のすべてにおいて目的信号区間候補と検出された信号区間候補を目的信号区間とし、
前記複数の信号区間候補検出処理のすべてにおいて雑音信号区間候補と検出された信号区間候補を第1種雑音信号区間とし、
前記複数の信号区間候補検出処理のいずれかにおいて目的信号区間候補と検出され、かつ、いずれかにおいて雑音信号区間候補と検出された信号区間候補を第2種雑音信号区間として分類する付記12に記載の信号処理方法。
【0195】
(付記14) 信号区間検出処理を実行するコンピュータで実行可能なプログラムであって、
入力信号を入力する入力ステップと、
前記入力信号から検出対象となる目的信号が記録されている信号区間の候補である目的信号区間候補と当該目的信号区間候補以外の雑音信号区間候補を検出する複数の信号区間候補検出処理ステップであって、それぞれが用いる目的信号区間候補および雑音信号区間候補の検出アルゴリズムが異なるものを用いて、目的信号区間候補および雑音信号区間候補を検出するステップと、
前記複数の信号区間候補検出処理ステップから各信号区間候補に対する各々の検出結果の通知を受け、当該検出結果の組み合わせにより、各信号区間候補を分類する処理ステップを備えたことを特徴とするプログラム(10)。
【0196】
(付記15) 信号区間検出処理を実行するコンピュータで実行可能なプログラムであって、
前記信号区間候補の分類処理ステップにおいて、
前記複数の信号区間候補検出処理ステップのすべてにおいて目的信号区間候補と検出された信号区間候補を目的信号区間とし、
前記複数の信号区間候補検出処理ステップのすべてにおいて雑音信号区間候補と検出された信号区間候補を第1種雑音信号区間とし、
前記複数の信号区間候補検出処理ステップのいずれかにおいて目的信号区間候補と検出され、かつ、いずれかにおいて雑音信号区間候補と検出された信号区間候補を第2種雑音信号区間として分類する付記14に記載のプログラム。
【0197】
【発明の効果】
本発明の信号処理システムによれば、入力信号を目的信号区間と雑音信号区間に分類するだけでなく、雑音信号区間を複数の性質の異なる雑音信号区間に分類することができる。
【0198】
また、本発明の信号処理システムによれば、すべてのアルゴリズムにおいて雑音信号区間候補と検出された雑音信号区間候補を、第1種雑音信号区間と、いずれかのアルゴリズムにおいて雑音信号区間候補とされ、いずれかのアルゴリズムにおいて雑音信号区間候補とされた第2種雑音信号区間に分類することができ、さらに、当該第1種雑音信号区間を定常雑音のみが現れている定常雑音信号区間と分類し、当該第2種雑音信号区間を定常雑音と非定常雑音が重畳して現れている非定常雑音信号区間と分類し、雑音信号区間を適切に定常雑音信号区間と非定常雑音信号区間に分類することができる。
【0199】
本発明の信号処理システムによれば、上記のように分類された雑音信号区間に対して雑音抑制処理を実行することが可能となる。また、雑音抑制処理に関して、定常雑音信号区間と非定常雑音信号区間それぞれの信号区間に対する適切な雑音抑制処理を実行することができる。
【0200】
本発明の信号処理システムによれば、分類された目的信号区間に対して音声認識処理などを実行することができる。なお、上記雑音抑制処理後の信号に対して音声認識を行えば、さらに高い認識精度を得ることができる。
【図面の簡単な説明】
【図1】 本発明の実施形態1にかかる信号処理システムの構成を示す図
【図2】 本発明の実施形態1にかかる入力信号および信号処理システムの各部分における信号を示す図
【図3】 本発明の実施形態2における入力信号および信号処理システムの各部分における信号を示す図
【図4】 本発明の実施形態3の信号処理システムの構成を示す図
【図5】 遅延時間計算部を中心とした構成の詳細を示す図
【図6】 2つのセンサにおける受信信号間の遅延時間を説明する図
【図7】 本発明の実施形態4の信号処理システムの構成を示す図
【図8】 本発明の実施形態5の信号処理システムの構成を示す図
【図9】 本発明の実施形態6の信号処理システムの構成を示す図
【図10】 本発明の実施形態7の信号処理システムの構成を示す図
【図11】 本発明の実施形態8の信号処理システムの構成を示す図
【図12】 実施形態9にかかる、本発明の信号処理システムを実現する処理ステップを記録した記録媒体の例を示す図
【図13】 従来の入力信号のパワーに基づく信号区間検出処理とスペクトルサブトラクションによる雑音抑制処理によって雑音を抑制するシステムを説明する図
【図14】 従来の入力信号の到来方向に基づく信号区間検出処理とスペクトルサブトラクションによる雑音抑制処理によって雑音を抑制するシステムを説明する図
【符号の説明】
10 入力部
20、20a、20b、20c 信号区間候補検出部
20a’ 第1の信号区間候補検出部
20b’,20b’’ 第2の信号区間候補検出部
21 パワー計算部
22 到来方向検知部
221,222 遅延時間計算部
222−1 差分信号演算部
222−2 微分信号演算部
222−3 除算信号演算部
23 パワー比計算部
30 信号区間分類部
40,40a,40b 雑音抑制部
41 雑音モデル推定部
42 フーリエ変換部
43 雑音モデル推定部
44 雑音スペクトル抑制部
45 逆フーリエ変換部
50 音声認識部
1000 回線先のハードディスク等の記録媒体
1001 CD−ROMやフレキシブルディスク等の可搬型記録媒体
1002 CD−ROM
1003 フレキシブルディスク
1004 コンピュータ
1005 コンピュータ上のRAM/ハードディスク等の記録媒体
Claims (7)
- 入力信号を入力する入力部と、
前記入力信号から検出対象となる目的信号が記録されている信号区間の候補である目的信号区間候補と当該目的信号区間候補以外の雑音信号区間候補を検出する複数の信号区間候補検出部であって、それぞれが用いる目的信号区間候補および雑音信号区間候補の検出アルゴリズムが異なる信号区間候補検出部と、
前記複数の信号区間候補検出部から各信号区間候補に対する各々の検出結果の通知を受け、当該検出結果の組み合わせにより、各信号区間候補を分類する信号区間分類部と、
前記信号区間分類部によって分類された各信号区間の性質に応じて、抑制量を変化させながら入力信号のレベルを抑制する雑音抑制部とを備え、
前記信号区間分類部は、
前記複数の信号区間候補検出部のすべてにおいて目的信号区間候補と検出された信号区間候補を目的信号区間とし、
前記複数の信号区間候補検出部のすべてにおいて雑音信号区間候補と検出された信号区間候補を定常雑音信号区間とし、
前記複数の信号区間候補検出部のいずれかにおいて目的信号区間候補と検出され、かつ、いずれかにおいて雑音信号区間候補と検出された信号区間候補を非定常雑音信号区間として分類し、
前記雑音抑制部は、前記目的信号区間の信号に対して雑音抑制処理を行わず、前記定常雑音信号区間の信号および前記非定常雑音信号区間の信号に対して、1より小さい重み付けの雑音抑制処理を行う、信号処理システム。 - 前記複数の信号区間候補検出部のうち、少なくとも一つが、前記入力された信号のパワーの変化に基づいて前記目的信号区間候補と前記雑音信号区間候補とを検出するアルゴリズムを用いるものであり、少なくとも他の一つが、前記入力された信号の到来方向を検出し、当該到来方向に基づいて前記目的信号区間候補と前記雑音信号区間候補とを検出するアルゴリズムを用いるものである請求項1に記載の信号処理システム。
- 入力信号を入力する入力部と、
前記入力信号から検出対象となる目的信号が記録されている信号区間の候補である目的信号区間候補と当該目的信号区間候補以外の雑音信号区間候補を検出する複数の信号区間候補検出部であって、それぞれが用いる目的信号区間候補および雑音信号区間候補の検出アルゴリズムが異なる信号区間候補検出部と、
前記複数の信号区間候補検出部から各信号区間候補に対する各々の検出結果の通知を受け、当該検出結果の組み合わせにより、各信号区間候補を分類する信号区間分類部と、
前記信号区間分類部による分類結果に応じて適用する雑音抑制処理を選択して適用する雑音抑制部とを備え、
前記信号区間分類部は、
前記複数の信号区間候補検出部のすべてにおいて目的信号区間候補と検出された信号区間候補を目的信号区間とし、
前記複数の信号区間候補検出部のすべてにおいて雑音信号区間候補と検出された信号区間候補を定常雑音信号区間とし、
前記複数の信号区間候補検出部のいずれかにおいて目的信号区間候補と検出され、かつ、いずれかにおいて雑音信号区間候補と検出された信号区間候補を非定常雑音信号区間として分類する、信号処理システム。 - 前記定常雑音信号区間と分類された信号区間においてのみ定常雑音モデルの推定処理を実行し、前記目的信号区間および非定常雑音信号区間と分類された信号区間において雑音モデルの推定処理を停止する雑音モデル推定部を備え、
前記雑音抑制部は、前記雑音モデル推定部が推定した雑音モデルに基づき、雑音抑制を行う請求項1または3に記載の信号処理システム。 - 前記入力信号が音声信号であり、
前記目的信号区間の音声信号に対する音声認識を行う音声認識部を備えた請求項1〜4のいずれかに記載の信号処理システム。 - 入力信号を入力する入力工程と、
前記入力信号から検出対象となる目的信号が記録されている信号区間の候補である目的信号区間候補と当該目的信号区間候補以外の雑音信号区間候補を検出する複数の信号区間候補検出処理であって、それぞれが用いる目的信号区間候補および雑音信号区間候補の検出アルゴリズムが異なるものを用いて、目的信号区間候補および雑音信号区間候補を検出する検出工程と、
前記複数の信号区間候補検出処理から各信号区間候補に対する各々の検出結果の通知を受け、当該検出結果の組み合わせにより、各信号区間候補を分類する分類工程と、
前記信号区間分類工程で分類された各信号区間の性質に応じて、抑制量を変化させながら入力信号のレベルを抑制する雑音抑制工程とを含み、
前記信号区間分類工程では、
前記複数の信号区間候補検出処理のすべてにおいて目的信号区間候補と検出された信号区間候補が目的信号区間とされ、
前記複数の信号区間候補検出処理のすべてにおいて雑音信号区間候補と検出された信号区間候補が定常雑音信号区間とされ、
前記複数の信号区間候補検出処理のいずれかにおいて目的信号区間候補と検出され、かつ、いずれかにおいて雑音信号区間候補と検出された信号区間候補が非定常雑音信号区間として分類され、
前記雑音抑制工程では、前記目的信号区間の信号に対して雑音抑制処理は行われず、前記定常雑音信号区間の信号および前記非定常雑音信号区間の信号に対して、1より小さい重み付けの雑音抑制処理が行われる、信号処理方法。 - 信号区間検出処理をコンピュータに実行させる信号処理プログラムであって、
入力信号を入力する入力処理と、
前記入力信号から検出対象となる目的信号が記録されている信号区間の候補である目的信号区間候補と当該目的信号区間候補以外の雑音信号区間候補を検出する複数の信号区間候補検出処理であって、それぞれが用いる目的信号区間候補および雑音信号区間候補の検出アルゴリズムが異なるものを用いて、目的信号区間候補および雑音信号区間候補を検出する検出処理と、
前記複数の信号区間候補検出処理から各信号区間候補に対する各々の検出結果の通知を受け、当該検出結果の組み合わせにより、各信号区間候補を分類する分類処理と、
前記信号区間分類処理によって分類された各信号区間の性質に応じて、抑制量を変化させながら入力信号のレベルを抑制する雑音抑制処理とをコンピュータに実行させ、
前記信号区間分類処理は、
前記複数の信号区間候補検出処理のすべてにおいて目的信号区間候補と検出された信号区間候補を目的信号区間とし、
前記複数の信号区間候補検出処理のすべてにおいて雑音信号区間候補と検出された信号区間候補を定常雑音信号区間とし、
前記複数の信号区間候補検出処理のいずれかにおいて目的信号区間候補と検出され、かつ、いずれかにおいて雑音信号区間候補と検出された信号区間候補を非定常雑音信号区間として分類する処理であって、
前記雑音抑制処理は、前記目的信号区間の信号に対して雑音抑制を行わず、前記定常雑音信号区間の信号および前記非定常雑音信号区間の信号に対して、1より小さい重み付けの雑音抑制を行う処理である、信号処理プログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2001390189A JP3812887B2 (ja) | 2001-12-21 | 2001-12-21 | 信号処理システムおよび方法 |
US10/283,238 US7203640B2 (en) | 2001-12-21 | 2002-10-30 | System and method for determining an intended signal section candidate and a type of noise section candidate |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2001390189A JP3812887B2 (ja) | 2001-12-21 | 2001-12-21 | 信号処理システムおよび方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2003195882A JP2003195882A (ja) | 2003-07-09 |
JP3812887B2 true JP3812887B2 (ja) | 2006-08-23 |
Family
ID=19188348
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2001390189A Expired - Fee Related JP3812887B2 (ja) | 2001-12-21 | 2001-12-21 | 信号処理システムおよび方法 |
Country Status (2)
Country | Link |
---|---|
US (1) | US7203640B2 (ja) |
JP (1) | JP3812887B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPWO2021117219A1 (ja) * | 2019-12-13 | 2021-06-17 |
Families Citing this family (27)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4000095B2 (ja) * | 2003-07-30 | 2007-10-31 | 株式会社東芝 | 音声認識方法、装置及びプログラム |
JP4162604B2 (ja) | 2004-01-08 | 2008-10-08 | 株式会社東芝 | 雑音抑圧装置及び雑音抑圧方法 |
JP4873913B2 (ja) * | 2004-12-17 | 2012-02-08 | 学校法人早稲田大学 | 音源分離システムおよび音源分離方法、並びに音響信号取得装置 |
JP2006304125A (ja) * | 2005-04-25 | 2006-11-02 | V-Cube Inc | 音声信号補正装置および音声信号補正方法 |
US8849231B1 (en) | 2007-08-08 | 2014-09-30 | Audience, Inc. | System and method for adaptive power control |
JP4910568B2 (ja) * | 2006-08-25 | 2012-04-04 | 株式会社日立製作所 | 紙擦れ音除去装置 |
US20090027648A1 (en) * | 2007-07-25 | 2009-01-29 | Asml Netherlands B.V. | Method of reducing noise in an original signal, and signal processing device therefor |
US8468019B2 (en) * | 2008-01-31 | 2013-06-18 | Qnx Software Systems Limited | Adaptive noise modeling speech recognition system |
US8798289B1 (en) * | 2008-08-05 | 2014-08-05 | Audience, Inc. | Adaptive power saving for an audio device |
US20100083134A1 (en) * | 2008-09-29 | 2010-04-01 | International Business Machines Corporation | Delegation of calendar functions |
WO2010092913A1 (ja) * | 2009-02-13 | 2010-08-19 | 日本電気株式会社 | 多チャンネル音響信号処理方法、そのシステム及びプログラム |
WO2010092915A1 (ja) * | 2009-02-13 | 2010-08-19 | 日本電気株式会社 | 多チャンネル音響信号処理方法、そのシステム及びプログラム |
KR101737824B1 (ko) * | 2009-12-16 | 2017-05-19 | 삼성전자주식회사 | 잡음 환경의 입력신호로부터 잡음을 제거하는 방법 및 그 장치 |
CN102111697B (zh) * | 2009-12-28 | 2015-03-25 | 歌尔声学股份有限公司 | 一种麦克风阵列降噪控制方法及装置 |
JP5387459B2 (ja) * | 2010-03-11 | 2014-01-15 | 富士通株式会社 | 雑音推定装置、雑音低減システム、雑音推定方法、及びプログラム |
EP2375410B1 (en) | 2010-03-29 | 2017-11-22 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | A spatial audio processor and a method for providing spatial parameters based on an acoustic input signal |
US10218327B2 (en) * | 2011-01-10 | 2019-02-26 | Zhinian Jing | Dynamic enhancement of audio (DAE) in headset systems |
GB2493327B (en) * | 2011-07-05 | 2018-06-06 | Skype | Processing audio signals |
US8705598B2 (en) * | 2011-12-15 | 2014-04-22 | Tektronix, Inc. | Signal-sensitive data compression |
JP5929154B2 (ja) * | 2011-12-15 | 2016-06-01 | 富士通株式会社 | 信号処理装置、信号処理方法および信号処理プログラム |
US9263040B2 (en) | 2012-01-17 | 2016-02-16 | GM Global Technology Operations LLC | Method and system for using sound related vehicle information to enhance speech recognition |
WO2014112023A1 (ja) * | 2013-01-17 | 2014-07-24 | 日本電気株式会社 | 雑音除去システム、音声検出システム、音声認識システム、雑音除去方法および雑音除去プログラム |
JP6158006B2 (ja) * | 2013-09-17 | 2017-07-05 | 株式会社東芝 | 音声処理装置、方法、及びプログラム |
WO2015143205A1 (en) * | 2014-03-19 | 2015-09-24 | University Of Houston System | Method for measuring physiological parameters of physical activity |
JP6536320B2 (ja) * | 2015-09-28 | 2019-07-03 | 富士通株式会社 | 音声信号処理装置、音声信号処理方法及びプログラム |
US10564256B2 (en) * | 2016-04-01 | 2020-02-18 | Rockwell Collins, Inc. | Beam sharpening radar system and method |
US11011182B2 (en) * | 2019-03-25 | 2021-05-18 | Nxp B.V. | Audio processing system for speech enhancement |
Family Cites Families (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4277645A (en) * | 1980-01-25 | 1981-07-07 | Bell Telephone Laboratories, Incorporated | Multiple variable threshold speech detector |
JP3074952B2 (ja) | 1992-08-18 | 2000-08-07 | 日本電気株式会社 | 雑音除去装置 |
JPH06332492A (ja) * | 1993-05-19 | 1994-12-02 | Matsushita Electric Ind Co Ltd | 音声検出方法および検出装置 |
SE501305C2 (sv) * | 1993-05-26 | 1995-01-09 | Ericsson Telefon Ab L M | Förfarande och anordning för diskriminering mellan stationära och icke stationära signaler |
US5828997A (en) * | 1995-06-07 | 1998-10-27 | Sensimetrics Corporation | Content analyzer mixing inverse-direction-probability-weighted noise to input signal |
JP3677143B2 (ja) | 1997-07-31 | 2005-07-27 | 株式会社東芝 | 音声処理方法および装置 |
US20020138254A1 (en) * | 1997-07-18 | 2002-09-26 | Takehiko Isaka | Method and apparatus for processing speech signals |
JP3499113B2 (ja) | 1997-09-26 | 2004-02-23 | シャープ株式会社 | 雑音除去装置 |
JP2000163099A (ja) | 1998-11-25 | 2000-06-16 | Brother Ind Ltd | 雑音除去装置、音声認識装置および記憶媒体 |
JP2000322074A (ja) | 1999-05-13 | 2000-11-24 | Denso Corp | 音声入力区間判定装置,音声データ抽出装置,音声認識装置,車両用ナビゲーション装置及び入力用マイク |
US6424960B1 (en) * | 1999-10-14 | 2002-07-23 | The Salk Institute For Biological Studies | Unsupervised adaptation and classification of multiple classes and sources in blind signal separation |
US6889187B2 (en) * | 2000-12-28 | 2005-05-03 | Nortel Networks Limited | Method and apparatus for improved voice activity detection in a packet voice network |
US6937980B2 (en) * | 2001-10-02 | 2005-08-30 | Telefonaktiebolaget Lm Ericsson (Publ) | Speech recognition using microphone antenna array |
-
2001
- 2001-12-21 JP JP2001390189A patent/JP3812887B2/ja not_active Expired - Fee Related
-
2002
- 2002-10-30 US US10/283,238 patent/US7203640B2/en not_active Expired - Fee Related
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPWO2021117219A1 (ja) * | 2019-12-13 | 2021-06-17 | ||
WO2021117219A1 (ja) * | 2019-12-13 | 2021-06-17 | 三菱電機株式会社 | 情報処理装置、検出方法、及び検出プログラム |
JP7012917B2 (ja) | 2019-12-13 | 2022-01-28 | 三菱電機株式会社 | 情報処理装置、検出方法、及び検出プログラム |
Also Published As
Publication number | Publication date |
---|---|
US20030120485A1 (en) | 2003-06-26 |
US7203640B2 (en) | 2007-04-10 |
JP2003195882A (ja) | 2003-07-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3812887B2 (ja) | 信号処理システムおよび方法 | |
US7246058B2 (en) | Detecting voiced and unvoiced speech using both acoustic and nonacoustic sensors | |
KR100486736B1 (ko) | 두개의 센서를 이용한 목적원별 신호 분리방법 및 장치 | |
JP4906908B2 (ja) | 目的音声抽出方法、目的音声抽出装置、及び目的音声抽出プログラム | |
JP4195267B2 (ja) | 音声認識装置、その音声認識方法及びプログラム | |
US20070233479A1 (en) | Detecting voiced and unvoiced speech using both acoustic and nonacoustic sensors | |
US9818428B2 (en) | Extraction of target speeches | |
JPWO2008056649A1 (ja) | 音源位置検知装置 | |
JP6203714B2 (ja) | 位相スペクトルを使った音源定位 | |
WO2015129760A1 (ja) | 信号処理装置、方法及びプログラム | |
JP5629249B2 (ja) | 音源定位システム及び音源定位方法 | |
WO2002098169A1 (en) | Detecting voiced and unvoiced speech using both acoustic and nonacoustic sensors | |
JP5994639B2 (ja) | 有音区間検出装置、有音区間検出方法、及び有音区間検出プログラム | |
JPWO2004084187A1 (ja) | 対象音検出方法、信号入力遅延時間検出方法及び音信号処理装置 | |
EP1415505A1 (en) | Detecting voiced and unvoiced speech using both acoustic and nonacoustic sensors | |
Rudzyn et al. | Real time robot audition system incorporating both 3D sound source localisation and voice characterisation | |
Barnard et al. | Speech enhancement and recognition using Kalman filter modified via radial basis function | |
JP5147012B2 (ja) | 目的信号区間推定装置、目的信号区間推定方法、目的信号区間推定プログラム及び記録媒体 | |
WO2019178802A1 (en) | Method and device for estimating direction of arrival and electronics apparatus | |
WO2023228785A1 (ja) | 音響信号処理装置、音響信号処理方法及びプログラム | |
JP5134477B2 (ja) | 目的信号区間推定装置、目的信号区間推定方法、目的信号区間推定プログラム及び記録媒体 | |
Lipar et al. | Identification of machinery sounds | |
EP3852099B1 (en) | Keyword detection apparatus, keyword detection method, and program | |
Mao et al. | An improved accumulated cross-power spectrum phase method for time delay estimation | |
Yoshioka et al. | Statistical models for speech dereverberation |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20040115 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20051202 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20051213 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20060213 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20060307 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20060502 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20060525 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20060526 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100609 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110609 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120609 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120609 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130609 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140609 Year of fee payment: 8 |
|
LAPS | Cancellation because of no payment of annual fees |