JPH11168791A - 音声源を検出する装置及び方法 - Google Patents

音声源を検出する装置及び方法

Info

Publication number
JPH11168791A
JPH11168791A JP10249875A JP24987598A JPH11168791A JP H11168791 A JPH11168791 A JP H11168791A JP 10249875 A JP10249875 A JP 10249875A JP 24987598 A JP24987598 A JP 24987598A JP H11168791 A JPH11168791 A JP H11168791A
Authority
JP
Japan
Prior art keywords
arrival
source
signal
audio
estimated
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP10249875A
Other languages
English (en)
Other versions
JP4624503B2 (ja
Inventor
Paeivi Valve
バルブ パイビ
Juha Haekkinen
ハッキネン ユハ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nokia Oyj
Original Assignee
Nokia Mobile Phones Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nokia Mobile Phones Ltd filed Critical Nokia Mobile Phones Ltd
Publication of JPH11168791A publication Critical patent/JPH11168791A/ja
Application granted granted Critical
Publication of JP4624503B2 publication Critical patent/JP4624503B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M9/00Arrangements for interconnection not involving centralised switching
    • H04M9/08Two-way loud-speaking telephone systems with means for conditioning the signal, e.g. for suppressing echoes for one or both directions of traffic
    • H04M9/082Two-way loud-speaking telephone systems with means for conditioning the signal, e.g. for suppressing echoes for one or both directions of traffic using echo cancellers
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/005Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L2021/02161Number of inputs available containing the signal or the noise to be suppressed
    • G10L2021/02165Two microphones, one receiving mainly the noise signal and the other one mainly the speech signal
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2201/00Details of transducers, loudspeakers or microphones covered by H04R1/00 but not provided for in any of its subgroups
    • H04R2201/40Details of arrangements for obtaining desired directional characteristic by combining a number of identical transducers covered by H04R1/40 but not provided for in any of its subgroups
    • H04R2201/403Linear arrays of transducers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2499/00Aspects covered by H04R or H04S not otherwise provided for in their subgroups
    • H04R2499/10General applications
    • H04R2499/13Acoustic transducers and sound field adaptation in vehicles

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Acoustics & Sound (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Multimedia (AREA)
  • General Health & Medical Sciences (AREA)
  • Otolaryngology (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Telephone Function (AREA)
  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
  • Measurement Of Velocity Or Position Using Acoustic Or Ultrasonic Waves (AREA)

Abstract

(57)【要約】 本発明の範囲は音声信号を受信するマイクロフォン手段
(2;2a,2b,2M)と、受信した音声信号から音
声を検出するための検出手段とからなる音声源を検出す
る装置である。この装置は受信した信号の到達方向を判
定する手段(15,17)と、ある特定の源の音声の推
定された到達方向を記憶する手段(17)と、前記受信
した信号の到達方向と前記推定された到達方向とを比較
する手段(18)とを備えている。この装置は更に、前
記比較によって前記受信した信号の到達方向が前記推定
された到達方向とある許容差の範囲内で一致することが
判明した場合には、前記音声源が前記ある特定の源であ
ることを表示する手段(18)とを備えている。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は音声信号を受信する
ためのマイクロフォン手段と、受信した音声信号内の音
声を検出する検出手段とを備えてなる音声源検出方法と
検出装置に関する。
【0002】
【従来の技術】電話での会話はエコーによって妨害され
ることが多い。これは特に、以下の異なる4通りの、す
なわち、アイドル、近端(near−end)通話、遠
端(far−end)通話、およびダブルトーク(do
uble−talk)の通話状態を有する全二重電話の
場合である。エコーは通常は、通話が遠端から入り、受
信した遠端信号がスピーカで再生され、マイクロフォン
を介して遠端に戻される場合に発生する。エコー問題は
特に、スピーカが高音量の音声を周囲に対して再生し、
そのようにしてスピーカからの音声がマイクロフォンに
容易に戻されるようなハンドフリーの通話方法で発生す
る。
【0003】エコーを除去するために適応化された信号
処理が採用される。ハンドフリーの移動電話の応用例で
は、公知のエコーキャンセラおよびエコー抑制器を使用
して、スピーカからマイクロフォンへの妨害が多い音響
フィードバック、すなわち音響エコーを有効に除去する
ことが可能である。エコーキャンセラは、出信号からの
エコー信号、すなわち受信側に遠端信号が存在する場合
に、通常は遠端から来た信号を抑制する適応ディジタル
・フィルタを利用して実施することができる。このよう
にして、遠端信号が遠端に戻ることを防止するための努
力がなされている。適応フィルタの各パラメータは通常
は、何らかの状況の条件をできる限り正確に考慮に入れ
るために、遠端通話が生じた時に常に更新される。エコ
ー抑制器については、送信される近端信号を減衰するた
めに使用される。
【0004】近端通話と遠端通話が同時に生ずるような
状況はダブルトーク状況と呼ばれている。ダブルトーク
中、エコーキャンセラはエコー信号を有効に除去するこ
とができない。その理由は、エコー信号は送信される近
端信号内で加算され、その場合、エコーキャンセラは除
去されるべきエコー信号の正確なモデルを形成できない
からである。このような場合、エコーキャンセラの適応
フィルタはスピーカとマイクロフォンとの間の空間の音
響応答に適正に適応することができず、従って、近端通
話信号が存在する場合は、送信される信号から音響エコ
ーを除去することができない。そのため、エコーキャン
セラに対するダブルトークの妨害作用を除去するため
に、ダブルトーク検出器が使用されることが多い。通常
は、ダブルトーク状況は遠端通話と同時に近端通話が存
在しているか否かを検出することによって検知される。
ダブルトーク中、エコーキャンセラの適応フィルタの各
パラメータは更新されないが、適応フィルタの更新は近
端の人が通話している間は中断されなければならない。
エコー抑制器はまた、近端の人が通話している間に送信
される信号を不適切に(過度に)減衰しないように、近
端の通話者の通話活性に関する情報が必要である。
【0005】GMS移動電話で使用される割り込み可能
な送信にはエコーキャンセリングおよび抑制に加えて、
近端通話活性に関する情報が必要である。割り込み可能
な送信の概念とは、通話活動中だけに通話信号を送信す
ること、すなわち、近端の通話者が休止している間は、
電力を節減するために近端信号は送信されないというこ
とである。割り込み可能な送信に起因するバックグラウ
ンドノイズ・レベルが過度に変動することを避けるた
め、アイドル状態である種の快適なノイズを送信し、し
かも送信中に必要なビットを節減することが可能であ
る。そのために、GSMの割り込み可能な送信によって
送信される通話の音質を低下させないようにするため、
近端通話活性は正確、迅速かつ確実に検知されなければ
ならない。
【0006】図1はエコーキャンセリングおよびダブル
トーク検出のための従来から公知の構成1を示してい
る。近端信号3はマイクロフォン2から届き、近端通話
活性検出器4,VAD(音声活性検出器)を用いてそれ
が検出される。遠端信号5は入力接続部Iから届き(こ
れはハンドフリーの装置では入力コネクタ、定置電話の
場合はワイヤ・コネクタ、および移動電話の場合はアン
テナから電話の受信ブランチへの経路でよい)、遠端通
話活性検出器6,VAD内で検出され、最後にスピーカ
7で再生される。近端信号3と遠端信号5は双方ともダ
ブルトークを検出するためのダブルトーク検出器8と、
エコー経路13の音響応答に適応するための適応フィル
タ9とに送られる。ダブルトーク中にフィルタに適応し
ないため(パラメタが更新されないため)に、適応フィ
ルタ9は入力としてダブルトーク検出器8の出力をも受
ける。エコーキャンセリングを行うために、適応フィル
タによって形成されるモデル10は加算/減算装置11
で近端信号3から減算される。(ハンドフリーの装置で
は出力コネクタ、定置電話ではワイヤ・コネクタ、およ
び移動電話では送信ブランチからアンテナへの経路でよ
い)出力接続部Oには、エコーキャンセラ出力信号12
が送られ、そこからエコー(のある部分)は既にキャン
セルされている。図1に示したエコーキャンセラを(例
えばハンドフリーのスピーカ呼出し用にスピーカとマイ
クロフォンとからなる)電話に統合してもよく、又は別
個のハンドフリー装置で実施することもできる。
【0007】ダブルトークを検出するための方法は幾つ
か提案されている。しかし、それらの多くは極めて単純
であり、一部は信頼性に欠ける。ほとんどのダブルトー
ク検出器はスピーカ信号及び/又はマイクロフォン信号
及び/又はエコーキャンセラの後の信号相互間のパワー
比に基づいている。これらの検出器の利点は簡略さと迅
速さであり、それらの欠点は信頼性に欠けることであ
る。
【0008】スピーカ信号及び/又はマイクロフォン信
号及び/又はエコーキャンセラの後の信号相互間を相関
させることに基づく検出器も公知である。これらの検出
器は、スピーカおよびマイクロフォン内の単なるエコー
信号(エコーキャンセラを経た後の信号)が強く相関さ
れるという構想に基づくものであるが、近端信号がマイ
クロフォン信号に加算されると相関関係は低減する。こ
れらの検出器の欠点は検出速度が遅いこと、近端信号と
遠端信号との(一部は正しくない)非相関関係が想定さ
れること、エコー経路に起因するスピーカ信号に変化の
影響があること、近端信号がない場合でも相関関係が低
下することである。
【0009】また同じ信号の自動相関の比較に基づくダ
ブルトーク検出器も公知であり、この場合は検出器が近
端信号内の音声を認識し、ひいては近端信号の存在を検
出することができる。このような検出器の計算に要する
パワーは少ないが、検出器が相関に基づいているので上
記と同じ問題点が生ずる。
【0010】Kuo S.M., Pan Z.著の文献
「大規模ビデオ会議用の音響エコーを消去するマイクロ
フォン・システム」ICSPAT’94会報、1994
年刊、7−12ページでは、ノイズおよび音響エコーを
除去し、冒頭に述べた異なる通話状況を認識するための
反対方向に向けられた2個のマイクロフォンを使用して
いる。しかし、上記の方法は単にエコーキャンセラの出
力パワーによってのみ実施されるダブルトークの認識に
特別の改善をもたらすものではない。
【0011】Affes S., Grenier Y.
著の文献「ダブルトーク状況のためのマイクロフォンの
音源サブスペース・トラッキングアレイ」,ICSPA
T’96会報,第2巻,1996年刊,909−912
ページでは、マイクロフォン・ベクトル構造のエコーお
よびバックグラウンドノイズキャンセラが提案されてい
る。提案されているエコーキャンセラは所望の方向から
到達する信号を保持しつつ、空間的に選択された方向か
ら到達する信号を濾波するものである。上記のエコーキ
ャンセラはダブルトーク状況の間も動作することができ
る。しかし、上記の文献は(マイクロフォン・ベクトル
とも呼ばれる)多重マイクロフォンによる解決方法を利
用した近端通話活性の検出も、ダブルトーク検出も提示
していない。
【0012】
【発明が解決しようとする課題】ここに近端通話活性を
検出し、かつダブルトーク状況を認識するための方法と
装置の発明がなされた。
【0013】
【課題を解決するための手段】本発明は近端通話信号が
到達する方向に基づいてその信号を検出する構想に基づ
いている。スピーカ信号が近端の通話者の通話信号の方
向とは明確に異なる方向から到達するハンドフリーの応
用例では、近端通話信号をその到達角度に基づいてスピ
ーカ信号と区別することができる。本発明では、異なる
方向及び/又は異なる地点からの音声をピックアップす
る幾つかのマイクロフォン(マイクロフォン・ベクト
ル)を利用して検出が行われる。
【0014】マイクロフォン・ベクトルの出力は先ず帯
域フィルタにかけられて狭帯域信号にされ、濾波された
信号によって形成される信号マトリクス上で到達方向の
角度が推定される。この推定によって空間スペクトルが
復元され、そこからスペクトル内に生ずるピークに基づ
いて到達方向のトラッキングが行われる。近端通話信号
の到達方向とスピーカ信号の到達方向とは得られた(判
明した)到達方向に基づいて更新される。到達方向のこ
れらの推定値によって最終的なVADの決定がより容易
になる。到達方向推定装置が近端通話信号の推定到達方
向に充分に近い到達方向に充分に強いスペクトル・ピー
クを検出すると、近端通話者は通話しているものと見な
される。すなわち近端通話活性を検出することができ
る。
【0015】ダブルトークの判定には、近端通話活性に
加えて、遠端通話活性に関する情報が必要である。この
情報は、例えばパワーレベルに基づく音声活性検出器の
ような公知の音声活性検出器を用いて検出することがで
きる。
【0016】本発明による装置は、受信した信号の到達
方向を判定する手段と、ある特定の源の音声の推定され
た到達方向を記憶する手段と、前記受信した信号の到達
方向と前記推定された到達方向とを比較する手段と、前
記比較によって前記受信した信号の到達方向が前記推定
された到達方向とある許容差の範囲内で一致した場合に
は、前記音声が前記ある特定の源で発生されたことを表
示する手段とを備えてなることを特徴としている。
【0017】
【発明の実施の形態】次に本発明を図面を参照して詳細
に説明する。
【0018】図2は近端音声活性を検出し、かつダブル
トークを認識するための、本発明による検出器のブロッ
ク図を示している。本発明ではマイクロフォン2として
幾つかのマイクロフォン2a,2b,...,2Mが使
用され、それらのマイクロフォンは好適にはいわゆるマ
イクロフォン・ベクトル2として接続されている。ベク
トルは少なくとも2個のマイクロフォンを有している
が、3個または4個またはそれ以上であることが好適で
ある。各マイクロフォンは単一の信号3a,3
b,...,3Mを発生し、M個のマイクロフォン(M
は整数)が使用される場合、時間領域内で変化可能なM
個の信号が得られ、これらが時間領域内で変化可能なM
個の要素からなる1つの信号ベクトルを形成する。
【0019】マイクロフォン・ベクトル2の出力3a,
3b,...,3Mは先ず帯域フィルタ14内で帯域濾
波されて狭帯域信号19a,19b,...,19Mに
される。超分解能のスペクトルの正確な推定方法は狭帯
域信号にのみ作用するので、方向角度の推定のために帯
域濾波が行われる。帯域濾波は例えば急速フーリエ変換
(FFT)、ウインドゥイング及びインタリービングを
利用して実現することができる。帯域フィルタの周波数
範囲はマイクロフォン・ベクトル内の各マイクロフォン
間の距離に基づいて判定される。ナイキスト・サンプリ
ング理論に従って、空間サンプリング周波数は信号の空
間周波数の少なくとも2倍でなければならないので、帯
域フィルタ14の帯域周波数(ポイント周波数)として
下記が得られる:f=C/2d,但し、Cは空中での音
の速度(20℃で343m/s)であり、dは各マイク
ロフォン間の距離である。
【0020】濾波された信号19a,19b,...,
19Mによって形成される信号マトリクス上の方向角度
(すなわち到達方向)の推定は、例えばMUSIC(多
重信号分類(Multiple Signal Classification))のよ
うなある種の公知の推定方法を利用して推定装置15で
行われる。
【0021】この推定方法は空間スペクトルを復元し、
そこからスペクトル内に生ずるピークに基づいて信号の
到達方向が判定される。図3はそのようなマイクロフォ
ン・ベクトル信号の空間スペクトルの例を示している。
到達方向は例えばスペクトル曲線の微分係数を吟味する
ことによって図3に示したスペクトル図から判定するこ
とができる。微分係数のそのようなゼロ点は到達方向と
して復元される。ゼロ点では微分係数は正から負に変化
し、それは公知のように、曲線内の各ピーク位置を示
す。このように図3では、2つの信号がマイクロフォン
・ベクトルに到達する。すなわち1つは10°の方向か
ら、またはもう1つは40°の方向からの信号である。
更に、到達方向であると見なされるスペクトル・ピーク
がある特定の最小振幅(例えば5dB)を有することを
要求できる。図面では、スペクトルの有効範囲(カバレ
ージ)は90°として示されている。実際には、±90
°の範囲で検出することができる。微分係数の計算と、
振幅の最小条件が満たされているか否かのチェックは好
適には、ディジタル信号プロセッサを利用して(プログ
ラミングによって)実施されなければならない。推定装
置15はその出力として信号の到達方向16を付与(推
定)する。
【0022】近端通話信号3とスピーカ信号5の推定到
達方向は得られた(判明した)到達方向に基づいてブロ
ック17で更新される。可能性がある到達方向はスペク
トル・ピークから得られた到達方向を平均化することに
よって評価される。どの方向から信号が到達したのかが
ほぼ判明した場合は、その時点で空間スペクトルに生ず
るエラー・ピークの影響を最小限にすることができる。
エラー・ピークが推定到達方向で生じない限り、それが
注記されることはない。図4は車内での通常のハンドフ
リー装置のマイクロフォン2とスピーカ7の配置を示し
ており、スピーカは通常は0°±40°の方向でむしろ
マイクロフォン・ベクトル2の直前にある。スピーカの
位置はマイクロフォン・ベクトルに対して大幅に変更し
てもよい。マイクロフォン・ベクトル2のマイクロフォ
ン2a,2b,...,2Mは互いにある特定の方向に
ある特定の距離を隔てて配置される。距離と方向は以下
に説明する到達方向推定アルゴリズムによって判定され
なければならない。以下に、信号源位置、方向判定ブロ
ック17で実行される遠端と近端の双方の到達方向の平
均化についてより詳細に説明する。
【0023】遠端到達方向の推定はスペクトル推定装置
15から得られる到達角度16の平均化に基づいて行わ
れる。平均化は、遠端に通話がある場合にのみ行われ、
これはその出力が判定ブロック17に送られる遠端VA
D6の出力を用いて判定される。平均化は好適には例え
ばIIR−濾波を用いて時間領域内で実行される。異な
る方向から到達する2つの信号源、すなわち近端信号3
と遠端信号5が存在するということが基本的に想定され
ている。更に、前記信号の到達方向は実行される観測の
頻度と比較して比較的ゆっくりと変化すると想定されて
いる。スペクトル推定装置15がその出力として到達方
向ベクトルdoa(度での)を発すると、遠端到達方向
ベクトルの推定値fdoa(度での)は平均化によっ
て、各々の新たな方向推定値が最も近いfdoaの成分
に影響を及ぼすように更新される。更新には、関連する
成分に近いほど検出された方向がfdoa成分を更新す
るように重み付けが行われる。スピーカ信号の方向及び
それによってスペクトル内に誘発される残響(reve
rberation)信号の方向は極めて僅かしか変化
せず、その場合、上記の重み付けによってスペクトル内
の偶発的な、エラー・ピークの影響が低減される。同時
に問題のfdoa成分が発生する確率、pdoaは、当
該の方向推定値に新たな値が近いければ近いほど更新さ
れる。加えて、当該のfdoa成分の強さ、powdo
aは、それに対応するスペクトル・ピークのパワーに基
づいて更新される。この場合、遠端到達方向推定ベクト
ルfdoaは(M−1)個の信号の到達角度の方向を有
する。成分pdoaは、範囲〔0,1〕での対応する到
達方向の確率と、powdoaに対応する範囲〔0,
1〕での標準化された強度からなっている。
【0024】ここで、遠端信号5の到達方向はそれに対
応する確率と強度が最高であり、一方、最後に判定され
た遠端信号到達方向に最も近い遠端到達方向ベクトル推
定値fdoaの成分であるものと想定することができ
る。推定は通話が遠端に存在する場合にのみ更新される
ので、近端信号3(この場合はダブルトーク)が時間の
50%未満で発生するものと想定することができる。従
って基本的に想定されることは、ダブルトークが遠端通
話活性時間の半分未満で発生するということである。遠
端信号到達方向(スピーカの方向)は、到達方向に対応
するスペクトル・ピークのパワーに基づいて残響される
スピーカ信号の到達方向から分離されうる。マイクロフ
ォンに直接到達する信号によって通常は残響経路で減衰
される信号よりも強いピークが空間スペクトル内に生ず
る。
【0025】以下は図7を参照した到達方向を推定する
アルゴリズムの説明である。段階100では、以下を判
定することからなる初期化が行われる。fdoa,pd
oa及びpowdoaが(M−1)個の成分を含んでい
る。doaがL個の成分(1≦L≦M−1)を含んでい
る。fdoa成分が異なる値を用いて初期化される。 fdoa(n)=−90+n* 180/M;(1≦n≦
M−1)
【0026】段階101:検出された到達方向(do
a)に対応して以下のように推定値(fdoaの各成
分)をトラッキングする。各推定値からの各到達方向の
距離を計算する。距離が最短の推定値doa(i)及び
それに対応する最も近い推定値fdoa(n)を選択す
る。
【0027】段階102:到達方向doa(i)の推定
値にどれだけ近いかに応じて推定値fdoa(n)を更
新する。近ければ近いほど、検出された方向は推定値を
変更する。すなわち、fdoa(n)=α0 * fdoa
(n)+(1−α0 ) * doa(i),但しα0 は例え
ば距離の一次関数、または指数関数である(一次(線
形)の依存性については図5を参照)。更新係数α0
び距離dの上限と下限、α0 _max,α 0 min及
びd max,d minを調整することによって、更
新の迅速さだけではなく、どの距離に位置するピークが
推定値に影響を与えるかにも影響を及ぼすことができ
る。例えば、距離の最大値が40°に保たれ(d mi
n=0°,d max=40°)、更新係数の最大値が
1に保たれている場合(α 0 min=0.99,α 0
max=1.0)、40°以上遠いスペクトル・エラー
のピーク値は推定値を更新せず、ひいてはエラーを全く
誘発しない。このようにして、推定値に及ぼす上記の偽
信号の影響を除去することが可能である。
【0028】段階103:再び到達方向が推定値にどの
程度近いかに応じて推定値の発生の確率、pdoaを高
める。以下では、距離の関数は一次関数であるものと想
定されている。例えば指数関数のようなその他の関数で
も可能である。 pdoa(n)=α1 * pdoa(n)+(1−α1)
(1−dist/180) 但し、α1 は例えば0.9であり、distは〔0,1
80〕の範囲内での観測値と推定値との間の距離であ
る。
【0029】段階104:以下のように検出されたスペ
クトル・ピークのパワーを用いて推定値のパワーpow
doaをも更新する。 powdoa(n)=α3 * powdoa(n)+(1
−α3 ) * Pow/Powmax 但し、α3 は例えば0.9であり、Powはスペクトル
・ピークのパワーであり、Powmaxは最大のパワー
である。
【0030】段階105では、その他の到達方向と推定
値を見出しうるか否かが判定され、イエスである場合は
残りの到達方向と推定値のペアについて段階101−1
04を繰り返す。 段階106:例えばdist=180及びPow=0に
設定することによって、到達方向が検出されなかった推
定値の発生頻度とパワーを低減する。
【0031】その後、段階107で、例えば以下の式を
最大にすることによって、スピーカの方向に関して、そ
の方向が最大の発生確率とパワーを有し、かつスピーカ
の方向の最新の評定値に最も近い推定値の方向を選択す
る。 a* pdoa(k)+b* powdoa(k)+c* distance(k) ;K=1...M−1, (1) 但し、a,bおよびcは重み付け係数、例えば1/3で
あり、distance(k)は推定値fdoa(k)
とそれまで(以前に)評定されたスピーカの方向との間
の「度」で表した距離である。
【0032】これまで遠端通話信号の到達方向の推定に
ついて説明してきた。以下に近端通話信号の到達方向の
推定について説明する。近端信号の到達方向の推定は上
記に説明した手順とアルゴリズムに従って行われ、従っ
て近端の到達方向の推定値ndoaは上記アルゴリズム
でfdoaをndoaと置き換えることによって得られ
る。遠端通話活性検出器6が、遠端から到達する通話が
ないことを表示した場合に推定は行われる。推定装置1
5内でこのスペクトルを検出する場合、予期されるピー
ク(到達角度の方向)がないか、又は近端信号及び/又
は偽信号及び残響の方向に従って1から(M−1)個の
ピークがある。近端の通話者の方向として、前述のよう
に最も頻繁に反復され、かつ最も強力である空間スペク
トルによって示される方向が選択される。更に、近端の
通話者はマイクロフォン・ベクトルに対して約0°±3
0°の方向に座っているものと想定され、その場合、近
端の通話者の方向推定値の初期値を0°と設定でき、方
向の選択に際してはそれまでに(以前に)評定された方
向が強力に重み付けされることができる。
【0033】これらの想定された到達方向値fdoa,
ndoaは最終的な検出を行う検出ブロック18に採り
入れられる。そのピークが近端通話信号の想定到達方向
に充分に近い到達方向での充分に強いスペクトル・ピー
クを到達方向推定装置15が検出すると、近端の通話者
が通話していることが判明する。すなわち、近端通話活
性が検出される。この比較はブロック15及び17から
到達する信号に基づいて検出器18で行われる。近端通
話活性の最終的な決定は、スペクトル・ピーク及び到達
方向の推定(平均化)を利用して行われる。いずれかの
スペクトル・ピークが遠端の推定値よりも近端の到達方
向の推定値(又はその残響の推定値)に近く、更に所定
のエラー許容差よりも近端推定値に近い場合は、近端に
通話が存在することが検出される。許容差の値は例えば
10度である。
【0034】ダブルトークの判定には、近端通話活性に
加えて、遠端通話活性に関する情報が必要である。この
情報は遠端通話活性検出器6からダブルトーク検出器1
8へと送られ、このようにしてこの検出器18は、(前
述の)近端通話活性検出器が通話を検出し、かつ遠端通
話活性検出器6が同時に通話を検出すると、ダブルトー
ク状況を検出する。遠端信号に関する限り、通話活性の
検出にはどのVADアルゴリズムを用いてもよい。ダブ
ルトークの結果は、近端および遠端通話活性の値につい
ての簡単なAND演算、すなわち、1(通話中)及び0
(非通話中)を用いて得られる。
【0035】以下に、図2を参照して、過渡状態(遷
移)検出器TDの機能を説明する。この検出器は本発明
による通話活性検出器/ダブルトーク検出器ではオプシ
ョンであり、従って図面では点線を用いて示してある。
到達方向の推定は狭帯域信号で行われるので、急激な近
端信号の変化(過渡状態)の検出は困難である。そのた
め、過渡状態の検出用に最適化された並列の検出器TD
を使用することが可能である。各々の過渡位置が検出さ
れた後、判定の正確さをチェックするために到達方向検
出器が使用される。本発明による検出器が例えば20m
s未満の充分に急激な信号変化を検出するならば、過渡
状態検出器TDを使用する必要はない。
【0036】原則的に、過渡状態検出器として通常のV
ADを使用することができる。しかし、多重マイクロフ
ォン構造によってある特定の到達方向角度を減衰させる
ことが可能であるので、推定されたスピーカ信号の方向
が減衰されるような態様で過渡状態検出器TDを実現す
ることができる。この場合、検出された過渡状態が近端
信号に結びついている確率が高くなる。スピーカ方向で
の減衰は多くの異なる方法で実現できる。最も容易な方
法は2個の適応性マイクロフォン構造を使用することで
ある。原則的に、これらの2個のマイクロフォンとし
て、例えば互いに最も遠く離れたマイクロフォンのよう
な、マイクロフォン・ベクトル2のマイクロフォン2
a,2b,...,2Mのうちの任意の2個を使用する
ことができる。減衰を実現するためには、2個のマイク
ロフォン信号があれば充分である。到達方向推定装置の
判定を利用して適応化が制御される場合(すなわち、遠
端信号だけがある場合だけ適応化が行われる)、所望の
方向での減衰が得られる。(例えば1KHz−2KHz
のような)ある特定の周波数範囲で検出が行われれば、
適応はより容易になる。過渡状態検出器内で、例えばF
FT又は帯域フィルタを使用して、マイクロフォンから
得られる信号に対して直接周波数分割を実施することが
できる。
【0037】実際の過渡状態検出器TDは瞬間nにおけ
る信号の瞬間パワーP(n)をノイズ推定値N(n)と
比較する。但し、P(n)はマイクロフォン信号のパワ
ー(又はスピーカ信号の方向が減衰されたマイクロフォ
ン信号のパワー)であり、ノイズ推定値N(n)はその
以前の値を用いて平均化され、通話が全くない場合には
システム全体の判定によって制御される、対応するパワ
ーである。通話がない瞬間に関する情報はブロック18
から過渡状態検出器TDへと取り出すことができる(点
線の矢印)。関連する値P(n)及びN(n)はマイク
ロフォンから到達する信号に基づいて過渡状態検出器を
用いて計算することができる。(信号出力値P(n)と
N(n)の計算方法は公知であり、例えばIIR(無限
インパルス応答)フィルタを用いて過渡状態検出器TD
内で実行できる。その差が充分に大きい場合は、過渡状
態が検出されたものと判定される。ノイズ推定値N
(n)を更新するには反復的平均化、N(n+1)=α
N(n)+(1−α)P(n)が用いられる。但しαは
平均化を制御する時定数(一般的には約0.9)であ
る。
【0038】過渡状態検出器は本発明による空間検出器
の機能を補足するものである。過渡状態検出器TDで近
端の通話そのものを検出することも可能であるが、確実
な検出は到達方向推定装置15による方向判定によって
得られる。単なるエコー源(近端信号ではない)での正
しくない過渡状態の検出は到達方向推定装置15での方
向によって修正することができる。方向の減衰が充分に
有効に動作するならば、近端通話中にエコーによって誘
発される過渡状態に留意する必要はない。エコー中に開
始される近端通話は再び明確な過渡状態として検出する
ことができ、その結果を到達方向検出器を用いてチェッ
クすることができる。過渡状態検出器TDの出力はブロ
ック18に採り入れられる(点線)。
【0039】近端通話活性とダブルトークはまた到達方
向推定装置15の出力に基づいて統計的パターン認識ア
プローチによっても判定することができる。このアプロ
ーチによれば、到達方向(DOA)角度推定に基づく通
話活性の検出は、統計的情報を利用して改良することが
できよう。ニューラル・ネットワークおよびヒドン・マ
ルコフ・モデル(HMM)のようなパターン認識技術は
これまで多くの類似の課題に適用されて成果が上げられ
ている。パターン認識方法の強みはトレーニングが可能
なことである。充分な量のトレーニング・データが与え
られると、システムの各々の状態(近端通話、遠端通
話、ダブルトーク、無音)に対するモデルを推定するこ
とができる。次にこれらのモデルを利用して、システム
の状態を最適に検出することができる。検出プロセスは
モデリングの想定が適正である場合に限り最適であるこ
とは言うまでもない。
【0040】以下に、HMMを多重マイクロフォン通話
活性の検出に利用する態様を概略的に説明する。システ
ムへの入力は依然として空間スペクトルから導出される
ので、信号(単数または複数)のDOA角度は依然とし
て本発明に基づく決定的な要因である。その上、上記に
説明した過渡状態検出部品(基準TD)をこれまでと同
様に利用することができる。
【0041】HMMを利用したパターン認識の第1のス
テップはモデル・ネットワークを規定することである。
前述したように、全二重電話システムには4つの状態
(モデル)、すなわち近端通話、遠端通話、ダブルトー
ク、無音がある。各モデルは多重状態HMMでモデリン
グすることができるが、出発点としては単一状態のHM
Mを使用できる。その他の改良の可能性としては、各状
態間での発振を防止するため、各状態上での最小限の強
制期間を使用することがある。
【0042】理論上は、過渡状態は任意の2つのモデル
間に生じ得るが、実際には、無音とダブルトークモデル
との間、及び近端モデルと遠端モデルとの間の直接的な
過渡状態は無視することができるので、実際の過渡状態
は図8に示したとおりである。
【0043】モデル構造が定義されると、どのような種
類の確率分布を用いるかを決定しなければならない。音
声認識の標準的なアプローチはガウス確率密度関数(p
df)によって各状態をモデリングすることであり、こ
れは本実施例においても好ましい出発点である。その代
わりに任意のpdfを用いることもできよう。モデルp
dfのトレーニングは図9に示すような(システムが所
定の瞬間にどの状態にあるかを知ることができる)ラベ
ルを付されたトレーニング・データから公算が最も高い
パラメータを推定することによって理想的に行われる。
代替方法としては、ある特定の基本モデルから出発し、
非監視トレーニング(unsupervised tr
aining)と呼ばれるオンラインにシステムを適応
させる方法がある。再び音声認識に言及すると、これに
適用できるオンライン通話者適応技術が幾つかある。要
約すると、現行のデータを用いて、最大の公算を生ずる
状態が最大の重み付けで適応される。適応データが多い
ほど、更新に際してより多くの重み付けが加えられる。
非監視トレーニングの明確な問題点は、分類ミスの場合
に正しくないモデルを適応する危険があることである。
初期パラメタを少数の監視トレーニング・サンプルで推
定することができれば、適応がより良好に行われる公算
が高くなる。更に、遠端チャネル(スピーカ)が残りの
チャネルから分離され、この情報を利用することができ
る。遠端活性がある場合は、遠端及びダブルトークモデ
ルだけを適応することができ、以下同様である。
【0044】実際の検出(認識)は極めて簡単である。
公算が最も高いモデルを随時選択するだけである。勿
論、遠端通話活性のような追加情報を利用して、検出性
能を更に高めることができる。この代替アプローチの論
理的な改良方法は、幾つかの状態でHMMを利用するこ
とである。例えば、各システム状態を表すHMMは3つ
の状態からなっている。すなわち、モデルへの過渡状
態、モデルの静止部分を表す状態、及びモデルから外れ
る過渡状態である。また、pdfモデリングの精度を高
めるためにガウスpdfsを併用することもできよう。
【0045】本発明による検出器を車内のハンドフリー
の用途に使用する場合、信号の最終の残響の方向を考慮
に入れるような方法で過渡状態検出器を変更することが
できる。そのような場合は、過渡状態の検出はスピーカ
の1つの推定到達方向ではなく、スピーカの幾つかの推
定到達方向を減衰させることによって改良することがで
きる。
【0046】本発明による空間通話活性検出器の従来の
方法と比較した利点は、ダブルトーク状況と近端通話活
性の双方を認識することができること、その迅速さ及び
信頼性にある。通話信号の到達方向に基づく本発明の検
出器はその主要な特徴によって極めて信頼性が高い。各
通話信号のパワーレベル間の相違は結果に大きな影響を
及ぼさないが、検出器はスピーカ信号よりもパワーが大
幅に低い近端通話信号をも認識する。それに加えて、決
定の結果は適応性エコーキャンセラの動作のような、別
個の装置の動作による影響を受けない。ダブルトーク検
出器では、通話信号及び周囲のノイズレベルに応じたし
きい値レベルがしばしば存在し、そのしきい値レベルに
基づいてダブルトーク状況があるか否かが判定される。
この検出器のパラメータは主要部分では一定であり、従
って上記のような問題点は存在しない。オプションの過
渡状態検出器を使用することによって、認識の迅速さを
高めることができる。
【0047】このハンドフリー設備ではいずれにせよ、
本発明による空間検出器に必要な、遠端通話活性の検出
及び周囲ノイズの推定のような多くの動作が実施され、
従って既に実施された計算動作を本発明による検出器で
利用することができる。
【0048】本発明による検出器は、ハンドフリー設備
に、例えば移動電話の車内搭載キット又は自動車電話の
ハンドフリー設備に(例えばエコーキャンセラ及び伝送
論理の一部として)使用することができる。本発明はま
た、ハンドフリー設備が電話内に含まれている、いわゆ
るハンドフリー電話の応用例などで使用するにも適して
いる。
【0049】図6は本発明による空間的近端通話/ダブ
ルトーク検出器80が使用されている、本発明に基づく
移動局を一例として示している。マイクロフォン・ベク
トル2から出て送信されるべき通話信号はA/D変換器
20でサンプリングされ、その後で(例えば音声の符号
化、チャネルの符号化、インタリービングのような)ベ
ース周波数信号の処理、無線周波数へのミキシングと変
調、及びブロックTXへの送信が行われる。ブロックT
Xから、信号はデュプレックスフィルタDPLX及びア
ンテナANTを経て空中経路へと発信される。例えばエ
コーキャンセラを制御し、又は断続的な送信で送信TX
を制御するために検出器80を利用することができる。
受信側では復調、インタリーブのキャンセル、チャネル
復号、及び音声復号のような受信機ブランチRXの通常
の動作が行われ、その後、検出器6で遠端通話活性が検
出され、信号はD/A変換器23でアナログ形式に変換
され、スピーカ7によって再生される。図6に記載のブ
ロック2,7,20,23及び80を入力、出力及び制
御信号(30,50,近端VAD,DT)用の移動局用
の接続を有するセパレート形のハンドフリー装置に設置
することによって、本発明をセパレート形のハンドフリ
ー装置で実施することが可能である。本発明は更に、会
議での発呼用に卓上での1個以上のマイクロフォンとス
ピーカとを備えた会議での発呼装置に、または例えば、
マンクロフォンとスピーカを例えばビデオ表示装置に内
蔵できる、インターネット回線網を介して発呼するため
のコンピュータと接続して使用することができる。この
ように、本発明はあらゆる種類のハンドフリー形式の装
置に適している。
【0050】これまで実施例を用いて本発明の実現方法
と実施態様を説明してきた。本発明は上記に提示した実
施例の細部に限定されるものではなく、かつ本発明はそ
の特徴から逸脱することなく他の実施例でも実現できる
ことは当業者には自明であろう。開示した実施例は例示
的のものであり、限定的なものではないものと見なされ
るべきである。従って、本発明を実施し、利用する可能
性は特許請求の範囲の各請求項によってのみ限定される
ものである。従って、各請求項によって特定された本発
明の異なる実施例、及び同等の実施例は本発明の範囲に
含まれるものである。
【図面の簡単な説明】
【図1】従来から公知のエコーキャンセラのブロック図
である。
【図2】本発明による検出器のブロック図である。
【図3】マイクロフォン・ベクトル信号の空間スペクト
ル図である。
【図4】自動車内のマイクロフォンおよびスピーカの設
置図である。
【図5】距離の関数として到達方向を(度の単位で)推
定するために用いられる更新係数を示す図である。
【図6】本発明による移動局を示す図である。
【図7】到達方向の推定を流れ図の形式で示す図であ
る。
【図8】代替実施例における異なる状態間の遷移状態を
示す図である。
【図9】ラベル付けされたトレーニング・データを示す
図である。
【符号の説明】
2…マイクロフォン・ベクトル 3…近端信号 5…遠端信号 6…遠端通話活性検出器 7…スピーカ 14…帯域フィルタ 15…到達方向推定装置 17…到達方向判定ブロック 18…ダブルトーク検出器 TD…過渡状態検出器

Claims (10)

    【特許請求の範囲】
  1. 【請求項1】 音声信号を受信するマイクロフォン手段
    (2;2a,2b,2M)と、受信した音声信号から音
    声を検出するための手段とからなる音声源を検出する装
    置において、受信した信号の到達方向を判定する手段
    (15,17)と、ある特定の音声の源の推定された到
    達方向を記憶する手段(17)と、前記受信した信号の
    到達方向と前記推定された到達方向とを比較する手段
    (18)と、前記比較によって前記受信した信号の到達
    方向が前記推定された到達方向とある許容差の範囲内で
    一致することが判明した場合には、前記音声の源が前記
    ある特定の源であることを表示する手段(18)とを備
    えてなることを特徴とする音声源を検出する装置。
  2. 【請求項2】 前記マイクロフォン手段(2;2a,2
    b,2M)がM(個の)マイクロフォン(2a,2b)
    を備えてなり、ここでMは整数であり、前記マイクロフ
    ォンが出力としてM個のマイクロフォン信号を生成する
    ように配置されるとともに、前記装置が前記マイクロフ
    ォン信号に基づいて空間スペクトルを形成し、かつ前記
    スペクトル内で生ずるピークに基づいて前記スペクトル
    内での前記到達方向を判定するための手段(15)を備
    えてなることを特徴とする請求項1に記載の装置。
  3. 【請求項3】 前記スペクトル曲線の微分係数を計算
    し、かつ該微分係数が正から負に変化する微分係数のゼ
    ロ点を復元することによって前記到達方向を判定する手
    段(15)を備えてなることを特徴とする請求項2に記
    載の装置。
  4. 【請求項4】 前記マイクロフォン手段(2;2a,2
    b,2M)に対するある方向で音声を再生するための音
    声再生手段(7)を備えてなるとともに、ある源の推定
    された到達方向を記憶する前記手段(17)は、第1の
    源が装置のユーザであり、第2の源が前記音声再生手段
    (7)である場合に、少なくとも2つの異なる源からの
    前記音声の推定された到達方向を記憶するように構成さ
    れ、その場合、第1の推定された到達方向は第1の源か
    らの音声の推定された到達方向であり、第2の推定され
    た到達方向は第2の源からの音声の推定された到達方向
    であり、かつ、音声源を検出する手段(18)は、前記
    比較の結果、前記受信した信号の到達方向が前記第2の
    推定された到達方向よりも第1の推定された到達方向に
    近いことが判明した場合には、前記装置のユーザが前記
    音声源であることを表示するように構成されたことを特
    徴とする請求項2に記載の装置。
  5. 【請求項5】 音声源を検出する前記手段は、音声が前
    記第1の源及び前記第2の源から同時に入るような状況
    を表示するように構成されたことを特徴とする請求項4
    に記載の装置。
  6. 【請求項6】 双方向音声伝送のための手段を備えてな
    り、その際に前記第1の源からの音声は伝送されるべき
    近端通話であり、前記第2の源からの音声は音声再生手
    段(7)を用いて再生されるように構成された受信され
    た遠端通話であることを特徴とする請求項4又は5に記
    載の装置。
  7. 【請求項7】 音声信号が受信され、受信された音声信
    号から音声が検出されるようにした音声源を検出する方
    法において、受信した信号の到達方向が判定され、ある
    特定の源からの音声の推定された到達方向が記憶され、
    前記受信した信号の到達方向と前記推定された到達方向
    とが比較され、前記比較の結果、前記受信した信号の到
    達方向が前記推定された到達方向とある許容差の範囲内
    で一致することが判明した場合には、前記音声源が前記
    ある特定の源であるものと表示されることを特徴とする
    音声源を検出する方法。
  8. 【請求項8】 音声信号がM個のマイクロフォン(2
    a,2b)から受信され、ここでMは整数であり、M個
    のマイクロフォン信号が各マイクロフォンの出力として
    供給され、前記マイクロフォン信号に基づいて到達方向
    の空間スペクトルが生成され、かつ前記スペクトル内で
    生ずるピークに基づいて前記スペクトルから前記到達方
    向が判定されることを特徴とする請求項7に記載の方
    法。
  9. 【請求項9】 前記到達方向が前記スペクトル曲線の微
    分係数を計算し、かつ該微分係数が正から負に変化する
    微分係数のゼロ点を復元することによって判定されるこ
    とを特徴とする請求項7に記載の方法。
  10. 【請求項10】 空間スペクトルの各ピークが前記源の
    到達方向を記述するパラメータ(fdoa)と、前記到
    達方向が出現する確率を記述するパラメータ(pdo
    a)及びパラメータ(powdoa)からなり、前記源
    からの音声の強度と前記源の前記到達方向とが各パラメ
    ータ(fdoa,pdoa,powdoa)を個々に平
    均化することによって判定されることを特徴とする請求
    項8に記載の方法。
JP24987598A 1997-09-04 1998-09-03 音声源を検出する装置及び方法 Expired - Fee Related JP4624503B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
FI973596A FI114422B (fi) 1997-09-04 1997-09-04 Lähteen puheaktiviteetin tunnistus
FI973596 1997-09-04

Publications (2)

Publication Number Publication Date
JPH11168791A true JPH11168791A (ja) 1999-06-22
JP4624503B2 JP4624503B2 (ja) 2011-02-02

Family

ID=8549474

Family Applications (1)

Application Number Title Priority Date Filing Date
JP24987598A Expired - Fee Related JP4624503B2 (ja) 1997-09-04 1998-09-03 音声源を検出する装置及び方法

Country Status (5)

Country Link
US (1) US6707910B1 (ja)
EP (1) EP0901267B1 (ja)
JP (1) JP4624503B2 (ja)
DE (1) DE69840119D1 (ja)
FI (1) FI114422B (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001245382A (ja) * 2000-01-13 2001-09-07 Nokia Mobile Phones Ltd スピーカをトラッキングする方法およびシステム
JP2008216273A (ja) * 2007-02-28 2008-09-18 Nippon Telegr & Teleph Corp <Ntt> 通話区間検出装置、その方法、プログラム及び記録媒体
JP2009031604A (ja) * 2007-07-27 2009-02-12 Nippon Telegr & Teleph Corp <Ntt> 音声区間検出装置、方法、プログラムおよびこれを記録した記録媒体
JP2015019185A (ja) * 2013-07-10 2015-01-29 日本電信電話株式会社 音声スイッチ装置、音声スイッチ方法、及びそのプログラム
JP2015059794A (ja) * 2013-09-18 2015-03-30 株式会社小野測器 音源探査装置

Families Citing this family (82)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2358557B (en) * 2000-01-18 2002-05-08 Motorola Ltd Digital communications system
US6993126B1 (en) 2000-04-28 2006-01-31 Clearsonics Pty Ltd Apparatus and method for detecting far end speech
GB2364121B (en) * 2000-06-30 2004-11-24 Mitel Corp Method and apparatus for locating a talker
US8280072B2 (en) 2003-03-27 2012-10-02 Aliphcom, Inc. Microphone array with rear venting
US8019091B2 (en) 2000-07-19 2011-09-13 Aliphcom, Inc. Voice activity detector (VAD) -based multiple-microphone acoustic noise suppression
US20030004720A1 (en) * 2001-01-30 2003-01-02 Harinath Garudadri System and method for computing and transmitting parameters in a distributed voice recognition system
JP4195267B2 (ja) 2002-03-14 2008-12-10 インターナショナル・ビジネス・マシーンズ・コーポレーション 音声認識装置、その音声認識方法及びプログラム
US6987992B2 (en) * 2003-01-08 2006-01-17 Vtech Telecommunications, Limited Multiple wireless microphone speakerphone system and method
US9066186B2 (en) 2003-01-30 2015-06-23 Aliphcom Light-based detection for acoustic applications
US9099094B2 (en) 2003-03-27 2015-08-04 Aliphcom Microphone array with rear venting
US7343284B1 (en) * 2003-07-17 2008-03-11 Nortel Networks Limited Method and system for speech processing for enhancement and detection
US8275147B2 (en) 2004-05-05 2012-09-25 Deka Products Limited Partnership Selective shaping of communication signals
US20060147063A1 (en) * 2004-12-22 2006-07-06 Broadcom Corporation Echo cancellation in telephones with multiple microphones
US20060133621A1 (en) * 2004-12-22 2006-06-22 Broadcom Corporation Wireless telephone having multiple microphones
US8509703B2 (en) * 2004-12-22 2013-08-13 Broadcom Corporation Wireless telephone with multiple microphones and multiple description transmission
US20060245601A1 (en) * 2005-04-27 2006-11-02 Francois Michaud Robust localization and tracking of simultaneously moving sound sources using beamforming and particle filtering
US7362654B2 (en) * 2005-05-24 2008-04-22 Charly Bitton System and a method for detecting the direction of arrival of a sound signal
JP4955676B2 (ja) * 2005-07-06 2012-06-20 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 音響ビーム形成装置及び方法
US7689248B2 (en) * 2005-09-27 2010-03-30 Nokia Corporation Listening assistance function in phone terminals
DE102005050790A1 (de) * 2005-10-24 2007-04-26 Robert Bosch Gmbh Fahrerinformationssystem mit Freisprecheinrichtung für Funkgeräte, insbesondere Mobiltelefone
US8295475B2 (en) * 2006-01-13 2012-10-23 Microsoft Corporation Selective glitch detection, clock drift compensation, and anti-clipping in audio echo cancellation
US7773743B2 (en) * 2006-04-28 2010-08-10 Microsoft Corporation Integration of a microphone array with acoustic echo cancellation and residual echo suppression
US7831035B2 (en) * 2006-04-28 2010-11-09 Microsoft Corporation Integration of a microphone array with acoustic echo cancellation and center clipping
JP4912036B2 (ja) * 2006-05-26 2012-04-04 富士通株式会社 指向性集音装置、指向性集音方法、及びコンピュータプログラム
US8103011B2 (en) * 2007-01-31 2012-01-24 Microsoft Corporation Signal detection using multiple detectors
WO2008157421A1 (en) 2007-06-13 2008-12-24 Aliphcom, Inc. Dual omnidirectional microphone array
CN101394679B (zh) * 2007-09-17 2012-09-19 深圳富泰宏精密工业有限公司 声源定位***及方法
TWI404967B (zh) * 2007-10-19 2013-08-11 Chi Mei Comm Systems Inc 聲源定位系統及方法
US8428661B2 (en) * 2007-10-30 2013-04-23 Broadcom Corporation Speech intelligibility in telephones with multiple microphones
US8380253B2 (en) * 2008-02-15 2013-02-19 Microsoft Corporation Voice switching for voice communication on computers
JP2009290825A (ja) * 2008-06-02 2009-12-10 Yamaha Corp 音響エコーキャンセラ
US8369251B2 (en) * 2008-06-20 2013-02-05 Microsoft Corporation Timestamp quality assessment for assuring acoustic echo canceller operability
JP5274130B2 (ja) 2008-07-15 2013-08-28 キヤノン株式会社 像振れ補正装置及び光学機器、撮像装置並びに像振れ補正装置の制御方法
US8392185B2 (en) * 2008-08-20 2013-03-05 Honda Motor Co., Ltd. Speech recognition system and method for generating a mask of the system
FR2948484B1 (fr) * 2009-07-23 2011-07-29 Parrot Procede de filtrage des bruits lateraux non-stationnaires pour un dispositif audio multi-microphone, notamment un dispositif telephonique "mains libres" pour vehicule automobile
KR101251045B1 (ko) * 2009-07-28 2013-04-04 한국전자통신연구원 오디오 판별 장치 및 그 방법
US8442198B2 (en) * 2009-10-20 2013-05-14 Broadcom Corporation Distributed multi-party conferencing system
EP2517478B1 (en) 2009-12-24 2017-11-01 Nokia Technologies Oy An apparatus
EP2594059A4 (en) * 2010-07-15 2017-02-22 Aliph, Inc. Wireless conference call telephone
JP5668553B2 (ja) * 2011-03-18 2015-02-12 富士通株式会社 音声誤検出判別装置、音声誤検出判別方法、およびプログラム
US20120245927A1 (en) * 2011-03-21 2012-09-27 On Semiconductor Trading Ltd. System and method for monaural audio processing based preserving speech information
GB2491173A (en) * 2011-05-26 2012-11-28 Skype Setting gain applied to an audio signal based on direction of arrival (DOA) information
FR2976111B1 (fr) * 2011-06-01 2013-07-05 Parrot Equipement audio comprenant des moyens de debruitage d'un signal de parole par filtrage a delai fractionnaire, notamment pour un systeme de telephonie "mains libres"
US9258653B2 (en) 2012-03-21 2016-02-09 Semiconductor Components Industries, Llc Method and system for parameter based adaptation of clock speeds to listening devices and audio applications
BR112015004625B1 (pt) 2012-09-03 2021-12-07 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Aparelho e método para fornecer uma estimativa de probabilidade de presença de voz multicanal informada.
US10049658B2 (en) * 2013-03-07 2018-08-14 Nuance Communications, Inc. Method for training an automatic speech recognition system
US9312826B2 (en) 2013-03-13 2016-04-12 Kopin Corporation Apparatuses and methods for acoustic channel auto-balancing during multi-channel signal extraction
US10306389B2 (en) 2013-03-13 2019-05-28 Kopin Corporation Head wearable acoustic system with noise canceling microphone geometry apparatuses and methods
US11646918B2 (en) 2013-03-15 2023-05-09 Digital Global Systems, Inc. Systems, methods, and devices for electronic spectrum management for identifying open space
US10299149B2 (en) 2013-03-15 2019-05-21 DGS Global Systems, Inc. Systems, methods, and devices for electronic spectrum management
US10257727B2 (en) 2013-03-15 2019-04-09 DGS Global Systems, Inc. Systems methods, and devices having databases and automated reports for electronic spectrum management
US9622041B2 (en) 2013-03-15 2017-04-11 DGS Global Systems, Inc. Systems, methods, and devices for electronic spectrum management
US8798548B1 (en) 2013-03-15 2014-08-05 DGS Global Systems, Inc. Systems, methods, and devices having databases for electronic spectrum management
US10219163B2 (en) 2013-03-15 2019-02-26 DGS Global Systems, Inc. Systems, methods, and devices for electronic spectrum management
US10257729B2 (en) 2013-03-15 2019-04-09 DGS Global Systems, Inc. Systems, methods, and devices having databases for electronic spectrum management
US10122479B2 (en) 2017-01-23 2018-11-06 DGS Global Systems, Inc. Systems, methods, and devices for automatic signal detection with temporal feature extraction within a spectrum
US8787836B1 (en) 2013-03-15 2014-07-22 DGS Global Systems, Inc. Systems, methods, and devices having databases and automated reports for electronic spectrum management
US10257728B2 (en) 2013-03-15 2019-04-09 DGS Global Systems, Inc. Systems, methods, and devices for electronic spectrum management
US10237770B2 (en) 2013-03-15 2019-03-19 DGS Global Systems, Inc. Systems, methods, and devices having databases and automated reports for electronic spectrum management
US8750156B1 (en) 2013-03-15 2014-06-10 DGS Global Systems, Inc. Systems, methods, and devices for electronic spectrum management for identifying open space
US10244504B2 (en) 2013-03-15 2019-03-26 DGS Global Systems, Inc. Systems, methods, and devices for geolocation with deployable large scale arrays
US10271233B2 (en) 2013-03-15 2019-04-23 DGS Global Systems, Inc. Systems, methods, and devices for automatic signal detection with temporal feature extraction within a spectrum
US10231206B2 (en) 2013-03-15 2019-03-12 DGS Global Systems, Inc. Systems, methods, and devices for electronic spectrum management for identifying signal-emitting devices
US8805292B1 (en) 2013-03-15 2014-08-12 DGS Global Systems, Inc. Systems, methods, and devices for electronic spectrum management for identifying signal-emitting devices
KR102282366B1 (ko) 2013-06-03 2021-07-27 삼성전자주식회사 음성 향상 방법 및 그 장치
EP2911149B1 (en) * 2014-02-19 2019-04-17 Nokia Technologies OY Determination of an operational directive based at least in part on a spatial audio property
US9716946B2 (en) 2014-06-01 2017-07-25 Insoundz Ltd. System and method thereof for determining of an optimal deployment of microphones to achieve optimal coverage in a three-dimensional space
KR102208477B1 (ko) * 2014-06-30 2021-01-27 삼성전자주식회사 마이크 운용 방법 및 이를 지원하는 전자 장치
US9930462B2 (en) 2014-09-14 2018-03-27 Insoundz Ltd. System and method for on-site microphone calibration
US11631421B2 (en) * 2015-10-18 2023-04-18 Solos Technology Limited Apparatuses and methods for enhanced speech recognition in variable environments
US9813810B1 (en) * 2016-01-05 2017-11-07 Google Inc. Multi-microphone neural network for sound recognition
US10269375B2 (en) * 2016-04-22 2019-04-23 Conduent Business Services, Llc Methods and systems for classifying audio segments of an audio signal
US10459020B2 (en) 2017-01-23 2019-10-29 DGS Global Systems, Inc. Systems, methods, and devices for automatic signal detection based on power distribution by frequency over time within a spectrum
US10498951B2 (en) 2017-01-23 2019-12-03 Digital Global Systems, Inc. Systems, methods, and devices for unmanned vehicle detection
US10700794B2 (en) 2017-01-23 2020-06-30 Digital Global Systems, Inc. Systems, methods, and devices for automatic signal detection based on power distribution by frequency over time within an electromagnetic spectrum
US10529241B2 (en) 2017-01-23 2020-01-07 Digital Global Systems, Inc. Unmanned vehicle recognition and threat management
US11133036B2 (en) 2017-03-13 2021-09-28 Insoundz Ltd. System and method for associating audio feeds to corresponding video feeds
CN109859749A (zh) 2017-11-30 2019-06-07 阿里巴巴集团控股有限公司 一种语音信号识别方法和装置
US11172319B2 (en) 2017-12-21 2021-11-09 Insoundz Ltd. System and method for volumetric sound generation
CN110164423B (zh) 2018-08-06 2023-01-20 腾讯科技(深圳)有限公司 一种方位角估计的方法、设备及存储介质
US10943461B2 (en) 2018-08-24 2021-03-09 Digital Global Systems, Inc. Systems, methods, and devices for automatic signal detection based on power distribution by frequency over time
CN110261816B (zh) * 2019-07-10 2020-12-15 苏州思必驰信息科技有限公司 语音波达方向估计方法及装置

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB1458663A (en) 1972-12-15 1976-12-15 Ard Anstalt Microphone circuits
US5299148A (en) * 1988-10-28 1994-03-29 The Regents Of The University Of California Self-coherence restoring signal extraction and estimation of signal direction of arrival
FI83576C (fi) 1989-02-10 1991-07-25 Nokia Mobira Oy Foerfarande och kopplingsarrangemang foer reglering av ljudstyrkan vid en mobiltelefon.
FR2687496B1 (fr) * 1992-02-18 1994-04-01 Alcatel Radiotelephone Procede de reduction de bruit acoustique dans un signal de parole.
US5410595A (en) * 1992-11-12 1995-04-25 Motorola, Inc. Apparatus and method for noise reduction for a full-duplex speakerphone or the like
FI108830B (fi) 1993-12-23 2002-03-28 Nokia Corp Menetelmä ja laite kaiun vaimentamiseksi puhelinlaitteessa
FI98163C (fi) 1994-02-08 1997-04-25 Nokia Mobile Phones Ltd Koodausjärjestelmä parametriseen puheenkoodaukseen
US5828997A (en) * 1995-06-07 1998-10-27 Sensimetrics Corporation Content analyzer mixing inverse-direction-probability-weighted noise to input signal
AU6841396A (en) 1995-08-21 1997-03-12 Telefonaktiebolaget Lm Ericsson (Publ) Echo cancelling using signal preprocessing in an acoustic environment
US6002776A (en) * 1995-09-18 1999-12-14 Interval Research Corporation Directional acoustic signal processor and method therefor
US5959667A (en) * 1996-05-09 1999-09-28 Vtel Corporation Voice activated camera preset selection system and method of operation
US5867574A (en) * 1997-05-19 1999-02-02 Lucent Technologies Inc. Voice activity detection system and method

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001245382A (ja) * 2000-01-13 2001-09-07 Nokia Mobile Phones Ltd スピーカをトラッキングする方法およびシステム
JP4694700B2 (ja) * 2000-01-13 2011-06-08 ノキア コーポレーション 話者の方向をトラッキングする方法およびシステム
JP2008216273A (ja) * 2007-02-28 2008-09-18 Nippon Telegr & Teleph Corp <Ntt> 通話区間検出装置、その方法、プログラム及び記録媒体
JP2009031604A (ja) * 2007-07-27 2009-02-12 Nippon Telegr & Teleph Corp <Ntt> 音声区間検出装置、方法、プログラムおよびこれを記録した記録媒体
JP2015019185A (ja) * 2013-07-10 2015-01-29 日本電信電話株式会社 音声スイッチ装置、音声スイッチ方法、及びそのプログラム
JP2015059794A (ja) * 2013-09-18 2015-03-30 株式会社小野測器 音源探査装置

Also Published As

Publication number Publication date
JP4624503B2 (ja) 2011-02-02
EP0901267B1 (en) 2008-10-15
FI114422B (fi) 2004-10-15
DE69840119D1 (de) 2008-11-27
FI973596A0 (fi) 1997-09-04
EP0901267A2 (en) 1999-03-10
EP0901267A3 (en) 2000-05-17
US6707910B1 (en) 2004-03-16
FI973596A (fi) 1999-03-05

Similar Documents

Publication Publication Date Title
JP4624503B2 (ja) 音声源を検出する装置及び方法
KR100836522B1 (ko) 에코 소거 회로용 다운링크 활동 및 더블 토크 확률 검출기및 방법
CN110741434B (zh) 用于具有可变麦克风阵列定向的耳机的双麦克风语音处理
EP1879180B1 (en) Reduction of background noise in hands-free systems
US9589556B2 (en) Energy adjustment of acoustic echo replica signal for speech enhancement
KR100790770B1 (ko) 에코 소거기 회로 및 이중 대화 활동 검출 방법
US7003099B1 (en) Small array microphone for acoustic echo cancellation and noise suppression
EP0914721B1 (en) Echo canceler for non-linear circuits
JP4568439B2 (ja) エコー抑圧装置
US6192126B1 (en) Double talk detector, method for double talk detection and device incorporating such a detector
US8116448B2 (en) Acoustic echo canceler
US10978086B2 (en) Echo cancellation using a subset of multiple microphones as reference channels
US5734715A (en) Process and device for adaptive identification and adaptive echo canceller relating thereto
US5764753A (en) Half-duplex controller
WO2008041878A2 (en) System and procedure of hands free speech communication using a microphone array
EP2101480B1 (en) Echo canceller and echo cancelling method
KR20070050058A (ko) 향상된 잡음 억제를 구비한 전화통신 디바이스
JP2003500936A (ja) エコー抑止システムにおけるニアエンド音声信号の改善
JP3047300B2 (ja) ハンズフリー会話機能を有する通話装置
US8009825B2 (en) Signal processing
WO2019169272A1 (en) Enhanced barge-in detector
US5621724A (en) Echo cancelling device capable of coping with deterioration of acoustic echo condition in a short time
Hamidia et al. A new structure for acoustic echo cancellation in double-talk scenario using auxiliary filter
JPH01198155A (ja) 拡声電話機
US20080298577A1 (en) Method and system for processing communication signals in a communication system

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050721

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050729

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A712

Effective date: 20050729

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080115

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20080414

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20080417

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080509

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20080603

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080930

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20081016

A912 Re-examination (zenchi) completed and case transferred to appeal board

Free format text: JAPANESE INTERMEDIATE CODE: A912

Effective date: 20081107

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20101104

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131112

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees