JP5746717B2 - 音源位置決め - Google Patents

音源位置決め Download PDF

Info

Publication number
JP5746717B2
JP5746717B2 JP2012553430A JP2012553430A JP5746717B2 JP 5746717 B2 JP5746717 B2 JP 5746717B2 JP 2012553430 A JP2012553430 A JP 2012553430A JP 2012553430 A JP2012553430 A JP 2012553430A JP 5746717 B2 JP5746717 B2 JP 5746717B2
Authority
JP
Japan
Prior art keywords
parameter
value
sound source
estimation
circuit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2012553430A
Other languages
English (en)
Other versions
JP2013520858A (ja
JP2013520858A5 (ja
Inventor
レネ マルチヌス マリア デルクス
レネ マルチヌス マリア デルクス
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Original Assignee
Koninklijke Philips NV
Koninklijke Philips Electronics NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Koninklijke Philips NV, Koninklijke Philips Electronics NV filed Critical Koninklijke Philips NV
Publication of JP2013520858A publication Critical patent/JP2013520858A/ja
Publication of JP2013520858A5 publication Critical patent/JP2013520858A5/ja
Application granted granted Critical
Publication of JP5746717B2 publication Critical patent/JP5746717B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01SRADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
    • G01S3/00Direction-finders for determining the direction from which infrasonic, sonic, ultrasonic, or electromagnetic waves, or particle emission, not having a directional significance, are being received
    • G01S3/80Direction-finders for determining the direction from which infrasonic, sonic, ultrasonic, or electromagnetic waves, or particle emission, not having a directional significance, are being received using ultrasonic, sonic or infrasonic waves
    • G01S3/802Systems for determining direction or deviation from predetermined direction
    • G01S3/803Systems for determining direction or deviation from predetermined direction using amplitude comparison of signals derived from receiving transducers or transducer systems having differently-oriented directivity characteristics
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01SRADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
    • G01S3/00Direction-finders for determining the direction from which infrasonic, sonic, ultrasonic, or electromagnetic waves, or particle emission, not having a directional significance, are being received
    • G01S3/80Direction-finders for determining the direction from which infrasonic, sonic, ultrasonic, or electromagnetic waves, or particle emission, not having a directional significance, are being received using ultrasonic, sonic or infrasonic waves
    • G01S3/802Systems for determining direction or deviation from predetermined direction
    • G01S3/803Systems for determining direction or deviation from predetermined direction using amplitude comparison of signals derived from receiving transducers or transducer systems having differently-oriented directivity characteristics
    • G01S3/8034Systems for determining direction or deviation from predetermined direction using amplitude comparison of signals derived from receiving transducers or transducer systems having differently-oriented directivity characteristics wherein the signals are derived simultaneously
    • G01S3/8036Systems for determining direction or deviation from predetermined direction using amplitude comparison of signals derived from receiving transducers or transducer systems having differently-oriented directivity characteristics wherein the signals are derived simultaneously derived directly from separate directional systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/005Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Remote Sensing (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Otolaryngology (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Measurement Of Velocity Or Position Using Acoustic Or Ultrasonic Waves (AREA)
  • Obtaining Desirable Characteristics In Audible-Bandwidth Transducers (AREA)

Description

本発明は、音源位置決めに関し、排他的ではないが特に、複数の音源の方向を決定するために3つ又は4つのマイクロホンを持つマイクロホンアレイを使用する音源位置決めに関する。
音声信号の先進の処理は、例えば通信、コンテンツ配信等を含む多くの領域で益々重要になった。例えば、ハンズフリー通信及び音声制御システムのような幾つかの用途では、複数のマイクロホンからの入力の複雑な処理は、マイクロホンを有するマイクロホンアレイに対する構成可能な方向感度を提供するために用いられてきた。他の例として、通信会議アプリケーションは、スピーカを選択し分離するため音声ビームステアリングを使用する。特に、マイクロホンアレイからの信号の処理は、個々のマイクロホン信号の結合の特性を単に変えることにより変更できる方向を持つ音声ビームを生成できる。
先進の音声処理アプリケーションの益々重要な機能は、様々な音源の位置の推定である。実際、音声処理が益々複雑な音声環境において使われて来ているので、2つ同時の音源の方向を推定可能なことが、しばしば望ましい。例えば、通信会議シナリオにおいて、2台のスピーカは、同時にアクティブである。斯様な方向推定は、例えば、所望の方向に音声ビームを向けるか、又は干渉する音源に対応する方向にノッチを提供するために用いられる。幾つかのシナリオでは、音源分離は、重要であり、2つの音源の推定された方向に基づいている。
しかしながら、単一の主要な音源に対して方向を推定するより同時に2つの音源に対して方向を推定することは、通常はかなり困難である。斯様なアプリケーションの重要な課題は、異なるマイクロホン信号の異なる音源からの寄与をどうやって切り離すかということである。従来の解決策は、2つの信号の時間又は周波数特性の差に基づいて信号を区別することに基づきがちである。例えば、2つの音源の一方が特定の時間間隔で優位であることを知っている場合、この音源に対する方向推定は斯様な時間間隔の間でだけ生成される。他のアプローチは、2つの音源の周波数差を利用することである。例えば、高速フーリエ変換(FFT)が信号に適用され、音源の一方が各サブバンドにおいて優位であると仮定される。従って、単一の方向推定は各サブバンドに対して生成され、方向推定は各音源に属しているサブバンドを平均化することにより生成される。
しかしながら、斯様なアプローチは、多くのシナリオにおいて次善又は信頼できない傾向がある。特に、当該アプローチは、有意な時間差又は周波数差を持つ2つの音源音声信号に依存し、従って同様の特性を持つ信号に対しては崩れる傾向がある。比較的異なる音声信号に対してさえ、どの音声信号が各周波数及び/又は時間間隔で優位かを決定することが困難であるので、重要な劣化が起こる。例えば、異なる音声信号に対してさえ、各サブバンドにおける優位な1つの音源の仮定は、低い割合のサブバンドに対して適当なだけである。更にまた、従来の音源位置決めアプローチは、複雑でリソース要求がある傾向がある。
従って、音源位置決めのための改良されたアプローチが有利であり、特に、改善された正確さ、音声信号の類似の特性に対する低い感度、増大した柔軟性、容易な実行、少ないリソース消費、異なる動作シナリオに対する改善されたパフォーマンス及び/又は、改良されたパフォーマンスを可能にするアプローチが有利である。
従って、本発明は、上述の不利な点の一つ以上の単独又は任意の組合せを、好ましくは緩和し、軽減し又は除去しようとする。
本発明の一態様によると、少なくとも3つのマイクロホンを有する少なくとも二次元のマイクロホンアレイから信号を受信するための受信回路と、異なる方向特性を持つ少なくとも3つの基準ビームをマイクロホン信号から生成するための基準回路と、2つの音源に対する同時の方向推定を生成するための推定回路とを有する音源位置決め装置であって、前記推定回路は、前記少なくとも3つの基準ビームの信号を結合することにより、結合信号に対する音声ビームフォームの形状を反映するビーム形状パラメータと、前記結合信号に対する音声ビームフォームの方向を反映するビーム方向パラメータとを持つ前記結合信号を生成するための回路と、前記結合信号のエネルギー尺度を示すコスト尺度を生成するための回路と、コスト尺度に対する局所的最小に対応するビーム方向パラメータのビーム方向パラメータ値とビーム形状パラメータのビーム形状パラメータ値とを推定するための回路と、前記ビーム形状パラメータ値及び前記ビーム方向パラメータ値の関数として、第1の音源の第1の方向推定と第2の音源の第2の方向推定とを決定するための回路とを有する、音源位置決め装置が提供される。
本発明は、多くのシナリオ及びアプリケーションで2つ同時の音源に対する改良された音源位置決めを提供する。2つの方向推定の決定は、多くのシナリオで、より正確である。特に、当該アプローチは、2つの音源からの音声の類似に対する減少した感度を提供する。特に、当該アプローチは、空間特性に基づく方向の決定を可能にし、よって非常に類似の特性を持つ2つの音源からの音声信号に対してさえ方向を決定可能にする。更にまた、当該アプローチは、低い複雑さ及び/又は低い計算リソース要求で実行される。
当該アプローチは、音声信号の波長がマイクロホンアレイのサイズより大幅に大きいシステムに特に適している。
基準ビームは、非適応で、捕捉信号及び/又は音声状況から独立していてもよい。基準ビームは、一定であり、少なくとも3つのマイクロホンからの信号の一定/非適応な結合により生成される。基準ビームは、具体的には、固有ビーム又は直交ビームである。一つの基準ビームはモノポールであり、残りの基準ビームはダイポールである。ダイポールは、実質的に互いに直交している。
ビーム形状パラメータは、無指向性基準ビームに対する方向基準ビームの相対的な加重を表す。ビーム方向パラメータは、異なる方向基準ビームの相対的な加重を表す。基準ビームの異なる方向特性は、例えば主ゲイン方向又はメインローブの平均方向により測定されるような、異なるビーム形状及び/又は異なるビーム方向を反映する。
本発明の任意の特徴によると、前記推定回路は、前記結合信号、ビーム形状パラメータの現在の値及びビーム方向パラメータの現在の値に応じてビーム形状パラメータ及びビーム方向パラメータの少なくとも第1のパラメータに対する更新値を繰り返し決定し、第1のパラメータの現在の値及び前記更新値から第1のパラメータに対する新規な値を生成する。
これは、高性能を維持しながら、容易な実行及び/又は減少した複雑さを提供する。特に、これは、計算リソース使用を低減する。更にまた、これは、音源の動きを追跡するために実用的なシステムを可能にする。
本発明の任意の特徴によると、更新値は、第1のパラメータに関するコスト尺度の微分値に依存する。
これは、ビーム形状パラメータ値及びビーム方向パラメータ値の改良された決定を提供する。特に、これは、更新値の適当な符号の効果的な決定を可能にし、幾つかの実施例で、更新値の適切な大きさの有利な決定を提供する。
本発明の任意の特徴によると、前記推定回路は、ビーム形状パラメータ及びビーム方向パラメータ両方の更新値を独立して決定する。
これは、ビーム形状パラメータ値及びビーム方向パラメータ値のより効率的及び/又は改良された更新を提供する。パラメータの1つに対する現在の繰り返しの更新値が他のパラメータに対する現在の繰り返しの更新値に依存していないという点で、この決定は独立している。
本発明の任意の特徴によると、推定回路は、ビーム形状パラメータ及びビーム方向パラメータのうちの少なくとも1つに対する勾配探索プロセスを使用して、局所的最小を推定する。
これは、高性能を維持しながら、容易にされた実行及び/又は減少した複雑さを提供する。特に、これは、計算リソース使用を低減する。更にまた、これは、音源の動きを追跡するための実用的なシステムを可能にする。
本発明の任意の特徴によると、推定回路は、前記少なくとも3つの基準ビームの第2及び第3の基準ビームの結合加重より小さな前記少なくとも3つの基準ビームの第1の基準ビームの最大加重に対応する減少した動作間隔までビーム形状パラメータを制限する。
これは、第1及び第2の方向推定の改良された決定を提供する。
本発明の任意の特徴によると、第1の方向推定及び第2の方向推定が平面内の2次元の方向推定であり、推定回路は、平面外の前記音源の仰角に対して第1の方向推定及び第2の方向推定を補償する。
これは、第1及び第2の方向推定の改良された決定を提供する。補償は、例えば、平面上の音源の推定及び/又は予め定められた仰角値に基づく。
本発明の任意の特徴によると、マイクロホンアレイが少なくとも4つのマイクロホンを有する3次元マイクロホンアレイであり、前記基準回路は更に第4の基準ビームを生成し、前記推定回路は、更に、第4の基準ビームと前記少なくとも3つの基準ビームの少なくとも2つの他の基準ビームとの信号を結合することにより他の結合信号を生成する回路であって、前記他の結合信号は、前記他の結合信号に対する音声ビームフォームの形状を反映する他のビーム形状パラメータと、前記他の結合信号に対する他の音声ビームフォームの方向を反映する他のビーム方向パラメータとを持つ前記他の結合信号を生成する回路と、前記他の結合信号のエネルギー尺度を示す他のコスト尺度を生成する回路と、前記他のコスト尺度に対する局所的最小に対応する、前記他のビーム形状パラメータの他のビーム形状パラメータ値と、前記ビーム方向パラメータの他のビーム方向パラメータ値とを推定する回路とを有し、第1の方向推定及び第2の方向推定を決定するための回路は、前記他のビーム形状パラメータ値及び前記他のビーム方向パラメータ値に応じて、更に第1の方向推定及び第2の方向推定を決定する。
これは、より正確な方向推定を生成可能にする。特に、これは、三次元方向推定を生成可能にし、及び/又は二次元の方向推定の平面から推定された仰角が補償されるので、より正確な二次元の方向推定を生成可能にする。基準ビームの1つのセットに基づいて1つの平面内の2つの方向推定を決定するための同じアプローチが、基準ビームの異なるセットを使用して、他の平面おそらく垂直面内の追加の2つの方向推定を決定するために使われる。
第4の基準ビームは、具体的にはダイポールであり、基準ビームの他のダイポールに対して直交している。
本発明の任意の特徴によると、ビーム形状パラメータ値及びビーム方向パラメータ値は、前記ビーム形状パラメータ及び前記ビーム方向パラメータのうちの少なくとも1つに関するコスト尺度の微分値がゼロである3次元ポイントの第1のセットを特徴づけ、前記他のビーム形状パラメータ値及び前記他のビーム方向パラメータ値は、前記他のビーム形状パラメータ及び前記他のビーム方向パラメータのうちの少なくとも1つに関する他のコスト尺度の微分値がゼロである3次元ポイントの第2のセットを特徴づけ、前記推定回路は、3次元ポイントの第1のセット及び3次元ポイントの第2のセット両方に含まれる少なくとも2つの3次元ポイントに対する方向推定として、第1の方向推定及び第2の方向推定を決定する。
これは、三次元方向推定の正確な及び/又は低い複雑さの決定を可能にする。
本発明の任意の特徴によると、推定回路は、前記少なくとも2つの3次元ポイントが予め定められたゲイン値に対応するという要求に応じて前記少なくとも2つの3次元ポイントを選択する。
これは、三次元方向推定の正確な及び/又は低い複雑さの決定を可能にする。予め定められたゲイン値は、具体的には、正規化されたゲイン値に対応し、2つの3次元ポイントは、三次元ポイントのセットと、ユニット球体との両方に属しているポイントとして選択される。
本発明の任意の特徴によると、推定回路は、ビーム形状パラメータ値及びビーム方向パラメータ値に対して、前記ビーム形状パラメータ及び前記ビーム方向パラメータのうちの少なくとも1つに関するコスト関数の解析的微分値がゼロであることに対応する方向推定として、第1の方向推定及び第2の方向推定を決定する。
これは、関連するコスト関数についての解析知識で信号値の実際的なアルゴリズムの最小化を利用することにより、2つ同時の音源の方向の有利な決定を可能にする。本発明は、2つ同時の音源に対する方向推定のリソース効率的な計算を提供するために結合信号のエネルギー測定に関するコスト関数の実際的及び解析的推測を利用する。
方向推定は、ビーム形状パラメータに関する微分値及びビーム方向パラメータに関する微分値両方がゼロであるという基準の下で決定される。
本発明の任意の特徴によると、少なくとも3つの基準ビームの第1の基準ビームがモノポールであり、前記少なくとも3つの基準ビームの少なくとも第2の基準ビーム及び第3の基準ビームは、異なる方向のダイポールである。
これは、特に有利なパフォーマンスを提供し、空間要件だけに基づいて2つの同時の方向推定に対する方向推定の効果的及び正確な決定を可能にする。第2及び第3の基準ビームは、互いに直交している。
本発明の任意の特徴によると、ビーム方向パラメータが第3の基準ビームに対する第2の基準ビームの加重を反映し、前記ビーム形状パラメータが第2及び第3の基準ビームに対する第1の基準ビームの加重を反映する。
これは、簡略分析評価を可能にし、ビーム形状パラメータ値及びビーム方向パラメータ値から方向推定を決定するための複雑さが減少した機能に結果としてなる結合信号の特に効果的な生成を提供する。
本発明の任意の特徴によると、結合は、
y[k]=αm[k]+(1−α)[cos(φ)d[k]+sin(φ)d[k]]
により実質的に与えられ、ここで、y[k]が前記結合信号のサンプルkを表し、m[k]が第1の基準ビームのサンプルkを表し、d[k]が第2の基準信号のサンプルkを表し、d[k]は第3の基準信号のサンプルkを表し、αがビーム形状パラメータであり、φがビーム方向パラメータである。
これは、特に有利なパフォーマンスを提供し、空間状況に基づいて2つの同時の方向推定に対する方向推定の効果的及び正確な決定を可能にする。
本発明の態様によると、少なくとも3つのマイクロホンを有する少なくとも2次元のマイクロホンアレイからマイクロホン信号を受信するステップと、前記マイクロホン信号から異なる方向特性を持つ少なくとも3つの基準ビームを生成するステップと、以下のステップを実施することにより、2つの音源に対する同時の方向推定を生成するステップとを有し、前記以下のステップは、前記少なくとも3つの基準ビームの信号を結合することにより、結合信号に対する音声ビームフォームの形状を反映するビーム形状パラメータと、前記結合信号に対する音声ビームフォームの方向を反映するビーム方向パラメータとを持つ前記結合信号を生成するステップと、前記結合信号のエネルギー尺度を示すコスト尺度を生成するステップと、コスト尺度に対する局所的最小に対応するビーム方向パラメータのビーム方向パラメータ値とビーム形状パラメータのビーム形状パラメータ値とを推定するステップと、前記ビーム形状パラメータ値及び前記ビーム方向パラメータ値の関数として、第1の音源の第1の方向推定と第2の音源の第2の方向推定とを決定するステップとである、音源位置決めの方法が提供される。
本発明のこれら及び他の態様、特徴並びに利点は、これ以降説明される実施例を参照して、明らかに説明されるだろう。
本発明の実施例は、単なる例示として図面を参照して説明されるだろう。
図1は、本発明の幾つかの実施例による2つ同時の音源に対する音源位置決めのための装置の要素の例を例示する。 図2は、マイクロホンアレイのためのマイクロホン構成の一例を示す。 図3は、図1の装置により生成される固有ビームの一例を示す。 図4は、図1の装置用の方向推定プロセッサの要素の一例を示す。 図5は、請求項1の装置により生成される方向推定結果の一例を示す。 図6は、請求項1の装置により生成される方向推定結果の一例を示す。 図7は、請求項1の装置により生成される音声ビームの一例を示す。 図8は、請求項1の装置による方向推定に対する収束の一例を示す。 図9は、図1の装置により生成される固有ビームの例を示す。
図1は、本発明の幾つかの実施例による2つ同時の音源に対する音源位置決めのための装置の一例を示す。システムは、マイクロホンから2つ同時の異なる音源までの方向を推定するために、複数のマイクロホンからの信号を処理する。方向推定は、空間考察に基づいて決定され、2つの音源からの音声信号に対する異なる時間的又はスペクトル特性に依存しない。
図1のシステムは、具体例では二次元のマイクロホンアレイであるマイクロホンアレイ101を有する。マイクロホンアレイ101は、単一の一次元ラインに並べられていない少なくとも3つのマイクロホンを有する。多くの実施例では、1つのマイクロホンから他の2つのマイクロホンを通るラインまでの最短距離は、これらの2つのマイクロホンの間の距離の少なくとも1/5はある。
具体例では、マイクロホンアレイ101は、図2に図示されるように、円上に同一の間隔で置かれる3つのマイクロホンを有する。
よって、この例では、平面ジオメトリー内に少なくとも3つの(無指向性又は片方向)センサの円形のアレイが使われる。他の実施例では、マイクロホンの他のアレンジメントが使われてもよいことは理解されるだろう。3つより多いマイクロホンが用いられる実施例に対しては、これらはおそらく非平面ジオメトリーで配置される、すなわち、マイクロホンアレイが三次元マイクロホンアレイであることも理解されるだろう。しかしながら、以下の説明は、アジマス(方位角)平面に配置された等距離の3つのマイクロホンの円形のアレイに焦点を当てる。
マイクロホンアレイ101は、マイクロホン信号を受信する受信回路103に結合される。図1の例では、受信回路103は、当業者に良く知られているように、マイクロホン信号を増幅し、フィルタリングし、デジタル化するように設けられる。
受信回路103は、マイクロホン信号から少なくとも3つの基準ビームを生成するように設けられる基準プロセッサ105に結合される。基準ビームは、適合されるのではなく、受信回路103からデジタル化されたマイクロホン信号の固定した結合により生成される一定ビームである。図1の例では、3つの直交固有ビームが、基準プロセッサ105により生成される。
この例では、マイクロホンアレイの3つのマイクロホンは、指向性マイクであり、特に、マイクロホンの位置を接合することにより形成される周辺部から外向きに(よって、具体例では円形のアレイの環の外向きに)主ゲインがポインティングしているように配置されるカージオイド形のマイクロホンである。カージオイド形のマイクロホンの使用は、センサノイズ及びセンサ―ミスマッチに対する感度が非常に減らされるという利点を供給する。しかしながら、他のシナリオで、無指向性マイクロホンのような他のマイクロホンタイプが使用されてもよいことは理解されるだろう。
3つのカージオイド形のマイクロホンの応答は、それぞれΦ=0、2π/3、4π/3でメインローブを持つE (r、θ、φ)、E (r、θ、φ)及びE (r、θ、φ)としてそれぞれ示され、ここで、θ及びΦは標準球面座標角度である。センサ―ノイズがないと仮定すると、n番目のカージオイド形マイクロホン応答は以下により理想的に与えられる。
Figure 0005746717
n番目のカージオイド形マイクロホンのマグニチュード応答A及び位相応答Ψは以下により理想的に与えられる。
Figure 0005746717
ここで、
Figure 0005746717
上記の式では、cは音速であり、x及びyはn番目のマイクロホンのx及びy座標である。
rが円の半径とし、以下の式、
Figure 0005746717
及び
Figure 0005746717
を使用して、
以下の式のように書ける。
Figure 0005746717
3つのカージオイド形のマイクロホンから、3つの直交固有ビームは、入力として3つのマイクロホンを持つ3ポイントの離散フーリエ変換(DFT)を使用して生成できる。このDFTは、i=1,2,3で3つのフェーズモードP(r、θ、φ)を作る。
Figure 0005746717
Figure 0005746717
ここで、
Figure 0005746717
であり、*は複素共役オペレータを示す。
これらの関数は、モノポール
(r、θ、φ)=2・P(r、θ、φ)
と2つの直交ダイポール
(r、θ、φ)=2・[P(r、θ、φ)+P(r、θ、φ)]
(r、θ、φ)=2j・[P(r、θ、φ)−P(r、θ、φ)]
からなる3つの基準ビームを生成するために使用できる。
マトリックス表記では、これは、以下の式により表される。
Figure 0005746717
アレイのサイズより大きい波長に対して、カージオイド形の応答の位相成分は無視でき、結果的に以下の固有ビーム応答になる。
=1
(θ、φ)=cosφsinθ
(θ、φ)=cos(φ−π/2)sinθ
これら固有ビームの指向性パターンは、図3に図示される。
ゼロ次の固有ビームEは球体に対応するモノポール応答を表すのに対し、他の固有ビームは図3に図示されるように、ダブル球体に対応する1次の固有ビームを表す。よって、2つの1次の固有ビームは、直交ダイポールである。
よって、基準プロセッサ105は、3つの入力信号(3つのサンプルシーケンスの形で)を受信して、これらから3つの基準ビームを生成する。3つ基準ビームは例では異なる方向特性を持ち、第1の基準ビームは実質的に無指向性であるのに対し、第2及び第3の基準ビームは指向的であり、同じビーム形状を持つが異なる方向に向けられている。
各サンプル時間で、信号サンプルは、マイクロホン信号サンプルから各基準ビームに対して生成される。よって、以下の説明は、時間インデックスkを持つ時間離散的信号(サンプリングされた)を考慮する。基準プロセッサ105は、3つのカージオイド形のマイクロホン信号c[k]、c[k]、c[k]からモノポール信号m[k]と2つの直交ダイポール信号d[k]、d[k]とを生成する。
Figure 0005746717
マイクロホン信号から基準ビーム信号を生成するために必要とされる処理は低い複雑さとなり、低い計算リソース要求を表すことに留意されたい。
3つの基準ビーム信号m[k]、d[k]、d[k]は、基準ビーム信号に基づいて2つ同時の音源に対する方向推定を生成するように設けられる推定プロセッサ107へ供給される。図4は、本発明の幾つかの実施例による詳細な推定プロセッサ107の要素を例示する。
推定プロセッサ107は、基準ビーム信号m[k]、d[k]、d[k]を受信し、これらを結合信号へ結合する結合器401を有する。結合は、単に基準ビーム信号の加重総和、すなわち以下の式となる。
y[k]=z・m[k]+z・d[k]+z・d[k]
[k]及びd[k]は方向性基準ビームに対応するのに対し、m[k]は無指向性基準ビームに対応する例では、この式は、以下のように書き直される。
y[k]=z・m[k]+z・(z・d[k]+z・d[k])
ここで、z・z=z及びz・z=zであり、z及びzは基準(z+(z=1を満たすスカラー値である。よって、この例では、(z=(z+(z及びz=z/z、z=z/zである。
従って、2つの方向基準ビームが方向以外同一である具体例では、パラメータz及びzは、メインローブの方向を制御する、すなわち3つの基準ビームの結合により形成される音声ビームと同様に、2つの方向基準ビームの結合により形成される音声ビームで最も大きいゲインの方向を制御する。更にまた、3つの基準ビームの結合により形成される結果として生じる音声ビームの形状は、パラメータz及びzにより制御される。
よって、基準ビーム加重結合は、結果的に結合ビームのビーム形状及び方向それぞれを反映する/示す(少なくとも一つの)ビーム方向パラメータ及び(少なくとも一つの)ビーム形状パラメータとなることが分かる。
具体例では、結合は、以下の結合により、特に表される。
y[k]=αm[k]+(1−α)[cos(φ)d[k]+sin(φ)d[k]]
よって、具体例では、z=α、z=1−α、z=cos(φ)及びz=sin(φ)である。
第2及び第3の基準ビームがユニティゲインダイポールである例では、中括弧の和は、単にφの方向のユニティダイポールの生成に対応する。更に、第1の基準ビームがユニティモノポールであるので、z及びzに対する規制は、結果として生じる音声ビームがユニティゲイン音声ビームであることを確実にする。音声ビームの形状は、パラメータαにより制御される。特に、α=1に対して、結果として生じる音声ビームはユニティモノポールであり、α=0に対して、結果として生じるビームは、方向φのユニティダイポールである。
実際、結果として生じる音声ビームパターンは、以下の式により与えられる。
(θ、φ)=α+(1−α)cos(φ−φ)sin(θ)
ここで、αは、1次のビームパターン形状を制御するビーム形状パラメータであり、φは、アジマス平面内でビームパターンを回転させるビーム方向パラメータである。
よって、例では、第3の基準ビームに対する第2の基準ビームの加重(ダイポールの相対的な加重)を設定するビーム方向パラメータφと、第2及び第3の基準ビームに対する(すなわち結合ダイポールに対する)第1の基準ビーム(モノポール)の加重を設定するビーム形状パラメータαとに応じて、明確な結合が作られる。
しかしながら、幾つかの実施例では、ビーム形状パラメータ及びビーム方向パラメータは、ビーム形状及び方向それぞれを反映する間接的なパラメータでもよいことは理解されるだろう。よって、結合は、ビーム形状及びビーム方向両方の特性に各々影響を及ぼす異なる加重値に基づく。例えば、結合オペレーションは、加重値z、z、zを直接使用する。よって、ビーム形状パラメータ及びビーム方向パラメータは、明確に使われる必要がなく、結合で明確に使用される特定の物理的加重値から導出できる仮想的、理論的又は間接的なパラメータを表してもよい。よって、ビーム形状パラメータ及びビーム方向パラメータは、結合加重の関数である。
結合器は、結合信号からコスト尺度を生成するコストプロセッサ403に結合される。コスト尺度は、結合信号のエネルギーの指標、特に結合信号の電力の指標として生成される。具体例では、コスト尺度は、単に結合信号の電力として計算される。
J[k]=y[k]
多くの実施例では、コスト尺度は、ローパスフィルタリング値として決定され、具体的には、適切な数のサンプルの平均値であることは理解されるだろう。
コストプロセッサ403は、コスト尺度に対する局所的最小に対応するビーム方向パラメータのビーム方向パラメータ値と、ビーム形状パラメータのビーム形状パラメータ値とを推定するように設けられる最小化プロセッサ405に結合される。よって、最小化プロセッサ405は、局所的最小を達成するコスト関数に結果としてなるビーム方向パラメータ及びビーム形状パラメータの値を決定する。幾つかのシナリオでは、局所的最小は、ビーム形状パラメータ値及びビーム方向パラメータ値がコスト尺度の最小値、よって結合信号の最小電力に結果としてなるように決定されるシナリオに対応する全体的な最小でもある。
2つだけの音源があるシナリオでは、最小値は、しばしば、2つの音源の完全な減衰に対応し、よって結合信号のゼロ電力に対応する。しかしながら、実際的なシナリオでは、コスト尺度は、通常はノイズ、音反射等のため高くなるだろう。
特定の場合に、最小化プロセッサ405は、結合器401に更に結合され、結合のために使われるビーム形状パラメータ及びビーム方向パラメータ値を直接制御する。よって、この例では、コスト関数の最小化は、基準ビーム信号を結合するために用いられるパラメータ値を制御する最小化プロセッサ405により達成される。
コスト関数の最小値に結果としてなるパラメータ値を決定する種々異なるアプローチが用いられてもよいことは理解されるだろう。例えば、最小化プロセッサ405は、パラメータの値の大きいセットを生成し、これらを結合器401へ供給して、結果として生じるコスト尺度を監視する。
例えば、サンプル時間ごとに、最小化プロセッサ405は、ビーム形状パラメータ値及びビーム方向パラメータ値を有する多数のパラメータセットを生成する。例えば、離散的シーケンス0、0.01、0.02、0.03...0.99からαの値及び離散的シーケンス0、π/100、2π/100、3π/100...99π/100からφの値を持つ全ての可能なセットが生成される。これらのセットの各々に対して、結合は実施され、コスト尺度が計算される。最小化プロセッサ405は、その時、最小値を見つけるために、コスト尺度値を通じて検索できる。このとき、所望のビーム形状パラメータ値及びビーム方向パラメータ値は、このセットに対する値として与えられる。
最小化プロセッサ405は、ビーム形状パラメータ値及びビーム方向パラメータ値を受信する方向推定器407に結合される。方向推定器407は、受信ビーム形状パラメータ値及びビーム方向パラメータ値の関数として、第1の音源に対する第1の方向推定及び第2の音源に対する第2の方向推定を決定するように処理する。
方向推定器407は、コスト尺度の最小に結果としてなるビーム形状パラメータ及びビーム方向パラメータの値が、また、ビーム形状パラメータ及びビーム方向パラメータに関するコスト関数のゼロの微分値に結果としてなるという事実に特に基づく。この事実は、ビーム形状パラメータ及びビーム方向パラメータの関数として、音源の方向を表わす関数を得るためにコスト関数を解析的/理論的に分析可能にする。よって、方向推定器407は、特定の測定されたコスト尺度を最小化する特定のアプローチを、このオペレーションが、方向推定に対する解析関数を理論的なコスト関数から計算可能にするという事実と組み合わせる。
よって、システムにおいて、第1の方向推定及び第2の方向推定は、ビーム形状パラメータ値及びビーム方向パラメータ値に対して、ビーム形状パラメータ及びビーム方向パラメータの少なくとも1つに関するコスト関数の解析的微分値がゼロであることに対応する方向推定として計算される。
例示的な解析的微分値は、この例、すなわち
y[k]=αm[k]+(1−α)[cos(φ)d[k]+sin(φ)d[k]]
の特定の結合に対して以下に説明されるだろう。
しかしながら、同じアプローチが他の結合及び他のパラメータに適用できることは理解されるだろう。
この例では、アジマス平面内に(すなわちマイクロホンアレイの平面内に)位置される2つの異なる音源が存在すると仮定される。
コスト関数は、以下のように規定される。
J(α、φ)=ε{y[k]}
ここで、ε{}は、平均化(又はローパスフィルタリング)オペレーションを示す。
アジマス角φniでi=1,2の2つの方向源n[k]を仮定すると、結合信号値は以下の式により与えられる。
Figure 0005746717
音声信号が無相関であると仮定すると、これは以下の式を生じる。
Figure 0005746717
ここで、σn1 及びσn2 は音源の偏差である。
このとき、コスト関数は、ビーム形状パラメータα及びビーム方向パラメータφに関する微分により分析され、以下の式を生じる。
Figure 0005746717
ここで、
=cos(φni−φ
及び
Figure 0005746717
であり、
=sin(φni−φ
である。
コスト尺度の局所的最小に対して、コスト関数の微分値はゼロである。上記式でわかるように、これは以下の場合である。もし、C=1ならば、φn1=φn2=φを生じる。
しかしながら、斯様な解は、単一の音源方向に対応するのに対し、シナリオでは2つの音源があると仮定されている。更にまた、この解は、鞍点であることが示され、従って安定解ではない。従って、この解は無視される。
以下の式のとき、コスト関数微分値がゼロであることも分かる。
Figure 0005746717
これは、以下の結果となる。
Figure 0005746717
これは、以下の式の場合だけ満足する。
Figure 0005746717
このように、上記式は、コスト関数がゼロであるビーム形状パラメータ値及びビーム方向パラメータ値の関数として音源の方向を表す。コスト関数が局所的最小に対してゼロであるので、従って、コスト尺度の最小に結果としてなるように決定されるビーム形状パラメータ値及びビーム方向パラメータ値は、コスト関数微分値がゼロであるパラメータ値に対応する。従って、これらの値は、2つの音源に対する方向推定を提供するために、上記式に挿入できる。
上記式は±オペレーションに起因する曖昧性を招くが、両方のオプションが有効であることに留意されたい。実際、オプション間の切換えは、単に2つの音源間で方向推定を切り換えること(すなわち、指標iが関係する音源間の切換え)に対応するだけである。
よって、図1のシステムは、2つ同時の音源に対する効果的な方向推定を提供する。このアプローチは、正確な結果で、低い複雑さ及びリソース要件を持つ非常に有利なパフォーマンスを提供することがわかった。
上記の具体例では、コスト尺度の最小に対応するパラメータ値を決定するための計算的に比較的厳しいアプローチが使われた。以下では、計算的により効率的であるが、非常に正確及び信頼性が高いアプローチが説明される。
以下の実施例では、コスト尺度の局所的最小は、ビーム形状パラメータ値及びビーム方向パラメータ値の反復的な更新により、特に決定される。よって、現在の値に基づいて、更新値は、新しいサンプル時間ごとに決定され、後続のサンプル時間の結合のために使われるパラメータ値を生成するために、現在の値に加えられる。このように、1つの結合結果だけが各サンプルに対して決定され、現在の値に基づいて、新しいパラメータ値が、後続のサンプル時間の間に決定される。よって、当該アプローチは、最初に正しいパラメータ値を提供しなくても、正しい値へ収束する。
特定のアプローチは、ビーム形状パラメータ及びビーム方向パラメータ両方に対する勾配探索プロセスを使用するが、勾配検索がパラメータの1つだけに原則として適用されることは理解されるだろう。
よって、例では、更新値は、コスト関数の微分値に依存している。特に、ビーム形状パラメータに対する更新値は、ビーム形状パラメータに関係するコスト関数の微分値に依存し、ビーム方向パラメータに対する更新値は、ビーム方向パラメータに関係するコスト関数の微分値に依存する。
更に詳細には、値α及びφの推定は、最速降下法更新に基づく適応アルゴリズムにより生成され、ここで、更新ステップはコスト関数の表面とは反対側の方向にある。よって、以下の式となる。
Figure 0005746717
及び
Figure 0005746717
ここで、^が推定値を示し、∇が変数qに対する勾配を示し、μは適応アルゴリズムの動的な応答を制御しているステップサイズである。
微分値(勾配)は、以下のように決定される。
Figure 0005746717
及び

Figure 0005746717
ここで、前述のy[k]は、以下の式により決定される。
Figure 0005746717
勾配計算が基準ビーム信号m[k]、d[k]、d[k]のエネルギーに依存するので、更新式を正規化することは、しばしば有益である。これは、以下の式となる。
Figure 0005746717
及び
Figure 0005746717
ここで、
Figure 0005746717
は、適合を正規化するために含まれる無指向性応答の電力推定であり、εは0による割り算を防止するための小さな値である。
このアプローチは、2つのパラメータに対する更新された値の独立決定を可能にすることに留意されたい。特に、1つのパラメータに対する現在の更新値は、他のパラメータに対する現在の更新値に依存するのではなく、以前の値にだけ依存する。
このアプローチは非常に効率的なアプローチを提供し、方向推定を決定するための結合及び特定のゼロ微分値に基づくアプローチと勾配検索と組み合わせは、方向推定を決定するための正確なアプローチに結果としてなるが、低い複雑さ及び低い計算リソース要件を依然維持する。
例えば、3セットの音源位置をフォローするための適応アルゴリズムがシミュレーションされた。
Figure 0005746717
音源の各セットに対して、パラメータ値に対する2つの最適解が有効である(両方ともゼロのコスト関数値を持つ)。1つの最適解は、αの正の値であるのに対し、他の最適解はαの負の値である。しかしながら、両方の解は、2つの音源に対する同じ方向推定に結果としてなる。
シミュレーションでは、ユニット偏差を持つ2つの無相関のガウスノイズシーケンス源が使われた。また、無相関のノイズは、モノポール信号及び2つの直交ダイポール信号に、モノポールに対して0.0001及びダイポールに対して0.000058の偏差で(球状等方性ノイズフィールドに対応して)加えられた。
方向推定φniの推定値に対する(10000以上の独立実行による)アンサンブルの平均化された結果が、図5及び図6に図示されている。音源の3つのセットに対する結合信号に対応するビームパターンが、図7に図示されている。見てわかるように、ヌルが正しいアジマス角度で配置される。更に、セット#1のビームパターンの形状がスケールファクタを別にしてセット#3のものと類似していることが明らかである。このスケールファクタは、セット#1のビームパターンが、αの正の値から作られるのに対し、セット#3のビームパターンが、αの負の値から作られるという事実により生じる。0から1の間のαの値に対して、ビームパターンのメインローブは、ユニティゲインファクタを持つ。図8は、アンサンブルの平均化されたコスト尺度の収束を例示する。
幾つかの実施例では、推定プロセッサ107は、ビーム形状パラメータを減少した動作間隔に制限するように設けられる。当該間隔は、具体的には、少なくとも3つの基準ビームの第2及び第3の基準ビームの結合加重の加重より小さな第1の基準ビームの最大加重まで結果的に値を制限する。具体例では、これは、単にα<1/2を要求することにより達成される。
2つの個々の基準ビームダイポールの結合から生じるダイポールより小さなモノポールの加重までのビーム形状値の制限は、少なくとも2つのノッチがアジマス平面内に存在することを確実にする。
以前の説明では、2つの音源がアジマス平面内に位置されると仮定された。特に、基準ビーム式
=1
(θ、φ)=cosφsinθ
(θ、φ)=cos(φ−π/2)sinθ
は、仰角パラメータθがπ/2に等しく、よってsin(θ)=1と仮定することにより単純化された。しかしながら、幾つかの実施例では、音源の仰角を考慮することが有利である。この場合には、結合信号のビーム形状は、以下により表される。
(θ、φ)=αE+(1−α)[cosφ (θ、φ)+sinφ (θ、φ)]
Figure 0005746717
を持つコスト関数
J(α、φ)=ε{y[k]}
を使用することは、
Figure 0005746717
を生じ、
ここで、音源の各々に対する仰角角度は
Figure 0005746717
により表される。
ビーム形状パラメータα及びビーム方向パラメータφに関してこの関数を微分することは、
Figure 0005746717

Figure 0005746717
を生じ、
Figure 0005746717

Figure 0005746717
を生じる。
よって、導関数は、二次元の場合に対して決定されるが、仰角パラメータ
Figure 0005746717
を考慮して変更される関数に対応する。特に、
Figure 0005746717
を設定することは、結果的に上記式を前に導出した式に減少させる。
前述のように、微分値がゼロであることの要求は、C=1
よって、φn1=φn2=φに対応する不安定な解を供給する。
この解決策を無視することにより、以下の解を供給する。
Figure 0005746717
このように、見て分かるように、微分値がゼロである要求は、(音源がアジマス平面内にあると仮定される)二次元の場合に対するパラメータ値から方向推定を決定するための対応する式に結果としてなる。しかしながら、図示されるように、方向推定は、また、仰角にも依存して変更される。アジマス平面外の音源の仰角(マイクロホンアレイの仰角)は、以前の簡略化された二次元の式が用いられる場合、二次元の平面におけるエラーの導入に結果としてなることに留意されたい。
幾つかの実施例では、従って、二次元の方向推定は、平面外の音源の仰角に対して補償される。単純な例として、ユーザは、マイクロホンアレイに対するポテンシャル源の仰角角度を手動で決定し、仰角角度を手動で入力する。例えば、マイクロホンアレイが会議用テーブルの中心に位置する会議アプリケーションに対して、テーブル周辺に座っている人々の典型的な話す高さに対応する仰角角度が決定され、装置へ供給される。このとき、この仰角角度は、上記の式の一定の予め定められた較正値として使われる。
斯様なアプローチは、決定された方向推定の正確さを改善する。しかしながら、多くの実用的なアプリケーションに対して、音源の仰角により導入される誤差は重要ではなく、単に無視されてもよいことは理解されるだろう。
幾つかの実施例では、装置は、2つの方向推定に対する3次元方向推定を生成するように更に設けられる。特にアジマス角に加えて、仰角角度も決定される。
幾つかの実施例では、基準プロセッサ105は、第2及び第3の基準ビームのピークゲインにより形成される平面から外へ延在する方向にピークゲインを持つ方向ビームとして第4の基準ビームを生成するように更に設けられる。斯様なビームは、具体的には、三次元マイクロホンアレイを使用して生成される。例えば、x,y平面(図2を参照)の3つのマイクロホンM、M、Mに加えて、マイクロホンアレイは、z方向に位置がずれた、すなわちz≠0に第4のマイクロホンを更に有する。
具体例では、マイクロホンアレイは、正四面体の頂点に配置される4つのマイクロホンを有する。よって、対称形の球面マイクロホンアレンジメントが使われる。平面マイクロホンアレイと同様に、球面マイクロホンアレイの指向性(例えばカージオイド形)マイクロホンを使用することは、センサノイズ及びセンサミスマッチに対する感度が非常に低減されるという利点を持つ。
更にまた、例では、基準プロセッサ105は、第2及び第3の基準ビームのダイポールと同様の形状を持つダイポールである第4の基準ビームを生成するために、信号を結合する。特に、ダイポールは、互いに直交し、向き(方向)以外は同一である。特に、基準プロセッサ105は、以下の基準ビームを生成する。
=1
(θ、φ)=cosφsinθ
(θ、φ)=sinφcosθ
(θ、φ)=cosθ
ここで、θは仰角角度であり、Φはアジマス角である。よって、以前の二次元の例の3つの基準ビームに加えて、z軸に沿って目指す第3のダイポールが生成される。基準ビームは、図9に図示されている。
このとき、装置は、最初の3つの基準ビームに基づいて、すなわちE、E 及びE に基づいて、前述されたような2次元の方向推定プロセスを最初に実施する。
上で示されたように、以下の式
Figure 0005746717
のとき、微分値はゼロである。
よって、最初の3つの基準ビームに基づく方向推定は、3D空間の一組のポイントを識別する。上記の式は、特に、座標系の中央から生じる(回転対称の)円錐の周辺に対応する一組のポイントを定める。円錐の周辺上のポイントに位置する全ての音源は、結果的にゼロ微分値となる。x―y平面と交差する円錐周辺のポイントは、以前の2次元の推定に対応する。
装置は、更に第1、第2及び第4の基準ビームに基づいて、すなわちE、E 及びE に基づいて正確な同じオペレーションを実施する。よって、コスト関数に対して結果的にゼロ微分値となるビーム形状パラメータ値及びビーム方向パラメータ値の第2のセットが、これら3つの基準ビームに対して決定される。処理は、x―y平面に対するものに等しいが、x―z平面に対応する。よって、決定されたビーム形状パラメータ値及びビーム方向パラメータ値は、可能な音源位置決めの第2の円錐を定める。
その後、装置は、両方のプロセスに基づいて、よってx―y平面に対するビーム形状パラメータ値及びビーム方向パラメータ値と、x―z平面に対するビーム形状パラメータ値及びビーム方向パラメータ値との両方に基づいて、三次元推定を決定する。
特に、x―y平面評価は、x―y平面に対するコスト関数の微分値がゼロである3次元ポイントの第1のセットに結果としてなり(第1の円錐)、x―z平面評価は、x―z平面に対するコスト関数の微分値がゼロである3次元ポイントの第2のセットに結果としてなる(第2の円錐)。音源位置が両方の要件を満たさなければならないので、可能な音源位置のセットは、ポイントの両方のセットに含まれるポイントに対応する。よって、可能性がある音源位置のセットは、2つの円錐の交差に対応する。従って、可能性がある音源位置のセットは、両方とも座標系の中央から発する3次元空間の2本のラインを定める。
交差する点の間の選択は、これらが予め定められたゲイン値に対応する、すなわち、これらが座標系の中央までの特定の距離にあるという要求に基づいてなされる。特に、全ての基準ビームがユニティゲインビームである例では、音源ポイントは、ユニティ球体との可能な音源位置のセットの交差により見つけられる。これは、決定される2つの特定のポイントに結果としてなる。i=1,2を持つ2つのポイント(x、y、z)は、球面座標、
Figure 0005746717
及び
Figure 0005746717
に変換できる。
ここで、arctan[]は、4象限アークタンジェントオペレータである。
よって、第4の基準ビームの使用及び2つの平面における等価な処理は、三次元方向推定を決定するために用いられる。
説明されたアプローチは、3つの平面の任意の2つを使用でき、すなわち、三次元方向推定は、択一的に、E、E 、E 及びE、E 、E の基準ビームセット、又は、E、E 、E 及びE、E 、E の基準ビームセットに基づくことも理解されるだろう。
幾つかの実施例では、アルゴリズムは、全3つの平面に対して実施される。そのとき、方向推定は、平面の推定された角度の違いが最も大きい2つの平面に基づく。これは、(それぞれの平面で観察される)2つの音源の角度の違いが小さくなるとき(例えば、αが1/2近くになるとき)、アルゴリズムの適応挙動が悪くなることが知られているからである。従って、α/(α−1)が最もゼロ(0)に近くなる2つの平面を選択する。
方向推定は、多くのシナリオで、多くのアプリケーションで好適に使われることは理解されるだろう。例えば、これは、方向推定に応じて制御される例えば指向性ビーム又はゼロで用いられる音源分離の基礎を形成する。例えば、2つのビームが、(音源が所望の信号を表すとき)音源の推定された方向に形成され、又は、2つのゼロが、(音源が所望されない信号を表すとき)任意の適切なビーム形成技術を使用して音源の推定された方向に形成される。
明確さのため上記記載は、種々異なる機能的ユニット及びプロセッサを参照して、本発明の実施例を説明したことが理解されるだろう。しかしながら、異なる機能的ユニット又はプロセッサ間の機能の適当な配給が本発明から逸脱することなく使用されてもよいことは明らかである。例えば、別個のプロセッサ又はコントローラにより実施されるべき例示された機能は、同一のプロセッサ又はコントローラにより実施されてもよい。従って、特定の機能的ユニットの参照は、厳密な論理、物理的構造、又は組織を示すよりはむしろ、説明した機能を供給するための適当な手段の参照としてのみ見られるべきである。
本発明は、ハードウェア、ソフトウェア、ファームウェア又はこれらの組み合わせを含む適当な形式で実行できる。本発明は、オプション的に、一つ以上のデータプロセッサ及び/又はデジタル信号プロセッサを走らせるコンピュータソフトウェアとして少なくとも部分的に実行できる。本発明の実施例の要素及び部品は、適当な態様で物理的に、機能的に、及び論理的に実行されてもよい。実際に、機能は、単一のユニット、複数のユニット又は他の機能ユニットの一部で実行できる。このように、本発明は、単一のユニットで実行されてもよいし、異なるユニット及びプロセッサ間で物理的に、及び機能的に分配されてもよい。
回路、プロセッサ、コントローラ等の用語は、特定の構成又は実行を暗示するものではなく、任意の適切な形式で実行される。特に、回路は、例えば、実行可能なプロセッサでの実行コードとして実行される処理アルゴリズムでもよい。
本発明は幾つかの実施例と関連して説明されたが、ここで説明した特定の形式に限定する意図はない。むしろ、本発明の範囲は、添付の請求項によってのみ限定される。加えて、特徴が特定の実施例と関連して説明されるように見えるが、当業者は、説明された実施例の様々な特徴が本発明に従って組み合わされてもよいことを認識するだろう。請求項において、「有する」という用語は、他の要素又はステップの存在を排除しない。
更に、個別にリストされているが、複数の手段、要素、又は方法のステップは、例えば単一のユニット又はプロセッサにより実行されてもよい。加えて、個別の特徴が異なる請求項に含まれているが、これらは好適に結合でき、異なる請求項に含まれるものは、特徴の組み合わせが実行可能及び/又は有益であるのではないということを意味しない。また、一つのカテゴリの請求項に特徴を含めることは、このカテゴリの制限を意味するのではなく、むしろ特徴が適当に他の請求項カテゴリに等しく適用可能であることを示す。更に、請求項の特徴の順番は、特徴が働かなければならない特定の順番を意味するのではなく、特に方法の請求項の個別のステップの順番は、ステップがこの順番で実施されなければならないことを意味しない。むしろ、ステップは適当な順番で実施されてもよい。加えて、単一の引用は複数を排除しない。よって、引用「a」、[an」、「第1の」、「第2の」等は、複数を排除しない。請求項内の参照符号は、単に例を明白にするものとして提供されるのであって、何れにおいても請求項の範囲を制限するものとして解釈されるべきではない。

Claims (15)

  1. 少なくとも3つのマイクロホンを有する少なくとも二次元のマイクロホンアレイからマイクロホン信号を受信するための受信回路と、異なる方向特性を持つ少なくとも3つの基準ビームの信号をマイクロホン信号から生成するための基準回路と、2つの音源に対する同時の方向推定を生成するための推定回路とを有する音源位置決め装置であって、前記推定回路は、前記少なくとも3つの基準ビームの前記信号を結合することにより、結合信号に対する音声ビームフォームの形状を反映するビーム形状パラメータと、前記結合信号に対する音声ビームフォームの方向を反映するビーム方向パラメータとを持つ前記結合信号を生成するための回路と、前記結合信号のエネルギー尺度を示すコスト尺度を生成するための回路と、前記コスト尺度に対する局所的最小に対応するビーム方向パラメータのビーム方向パラメータ値とビーム形状パラメータのビーム形状パラメータ値とを推定するための回路と、前記ビーム形状パラメータ値及び前記ビーム方向パラメータ値の関数として、第1の音源の第1の方向推定と第2の音源の第2の方向推定とを決定するための回路とを有する、音源位置決め装置。
  2. 前記推定回路は、前記結合信号、ビーム形状パラメータの現在の値及びビーム方向パラメータの現在の値に応じてビーム形状パラメータ及びビーム方向パラメータの少なくとも第1のパラメータに対する更新値を繰り返し決定し、第1のパラメータの現在の値及び前記更新値から第1のパラメータに対する新規な値を生成する、請求項1に記載の音源位置決め装置。
  3. 前記更新値が第1のパラメータに関するコスト尺度の微分値に依存する、請求項2に記載の音源位置決め装置。
  4. 前記推定回路が、ビーム形状パラメータ及びビーム方向パラメータ両方の更新値を独立して決定する、請求項2に記載の音源位置決め装置。
  5. 前記推定回路が、ビーム形状パラメータ及びビーム方向パラメータのうちの少なくとも1つに対する勾配探索プロセスを使用して、局所的最小を推定する、請求項1に記載の音源位置決め装置。
  6. 前記推定回路は、前記少なくとも3つの基準ビームの第2及び第3の基準ビームの結合加重より小さな前記少なくとも3つの基準ビームの第1の基準ビームの最大加重となる値にビーム形状パラメータを制限する、請求項1に記載の音源位置決め装置。
  7. 第1の方向推定及び第2の方向推定が平面内の2次元の方向推定であり、前記推定回路が、平面外の前記音源の仰角に対して第1の方向推定及び第2の方向推定を補償する、請求項1に記載の音源位置決め装置。
  8. 前記マイクロホンアレイが少なくとも4つのマイクロホンを有する3次元マイクロホンアレイであり、前記基準回路は更に第4の基準ビームを生成し、前記推定回路は、第4の基準ビームと前記少なくとも3つの基準ビームの少なくとも2つの他の基準ビームとの信号を結合することにより他の結合信号を生成する回路であって、前記他の結合信号は、前記他の結合信号に対する音声ビームフォームの形状を反映する他のビーム形状パラメータと、前記他の結合信号に対する他の音声ビームフォームの方向を反映する他のビーム方向パラメータとを持つ前記他の結合信号を生成する回路と、前記他の結合信号のエネルギー尺度を示す他のコスト尺度を生成する回路と、前記他のコスト尺度に対する局所的最小に対応する、前記他のビーム形状パラメータの他のビーム形状パラメータ値と、前記ビーム方向パラメータの他のビーム方向パラメータ値とを推定する回路とを有し、第1の方向推定及び第2の方向推定を決定するための回路は、前記他のビーム形状パラメータ値及び前記他のビーム方向パラメータ値に応じて、更に第1の方向推定及び第2の方向推定を決定する、請求項1に記載の音源位置決め装置。
  9. 前記ビーム形状パラメータ値及び前記ビーム方向パラメータ値は、前記ビーム形状パラメータ及び前記ビーム方向パラメータのうちの少なくとも1つに関する前記コスト尺度の微分値がゼロである3次元ポイントの第1のセットを特徴づけ、前記他のビーム形状パラメータ値及び前記他のビーム方向パラメータ値は、前記他のビーム形状パラメータ及び前記他のビーム方向パラメータのうちの少なくとも1つに関する前記他のコスト尺度の微分値がゼロである3次元ポイントの第2のセットを特徴づけ、前記推定回路は、3次元ポイントの第1のセット及び3次元ポイントの第2のセット両方に含まれる少なくとも2つの3次元ポイントに対する方向推定として、第1の方向推定及び第2の方向推定を決定する、請求項8に記載の音源位置決め装置。
  10. 前記推定回路は、前記少なくとも2つの3次元ポイントが予め定められたゲイン値に対応するという要求に応じて前記少なくとも2つの3次元ポイントを選択する、請求項9に記載の音源位置決め装置。
  11. 前記推定回路は、前記ビーム形状パラメータ値及び前記ビーム方向パラメータ値に対して、前記ビーム形状パラメータ及び前記ビーム方向パラメータのうちの少なくとも1つに関するコスト関数の解析的微分値がゼロである方向推定として、第1の方向推定及び第2の方向推定を決定する、請求項1に記載の音源位置決め装置。
  12. 前記少なくとも3つの基準ビームの第1の基準ビームがモノポールであり、前記少なくとも3つの基準ビームの少なくとも第2の基準ビーム及び第3の基準ビームは、異なる方向のダイポールである、請求項1に記載の音源位置決め装置。
  13. 前記ビーム方向パラメータが第3の基準ビームに対する第2の基準ビームの加重を示し、前記ビーム形状パラメータが第2及び第3の基準ビームに対する第1の基準ビームの加重を示し、請求項11に記載の音源位置決め装置。
  14. 前記結合は、
    y[k]=αm[k]+(1−α)[cos(φ)d[k]+sin(φ)d[k]]
    により実質的に与えられ、ここで、y[k]が前記結合信号のサンプルkを表し、m[k]が第1の基準ビームのサンプルkを表し、d[k]が第2の基準信号のサンプルkを表し、d[k]は第3の基準信号のサンプルkを表し、αがビーム形状パラメータであり、φがビーム方向パラメータである、請求項1に記載の音源位置決め装置。
  15. 少なくとも3つのマイクロホンを有する少なくとも2次元のマイクロホンアレイからマイクロホン信号を受信するステップと、
    前記マイクロホン信号から異なる方向特性を持つ少なくとも3つの基準ビームの信号を生成するステップと、以下のステップを実施することにより、2つの音源に対する同時の方向推定を生成するステップとを有し、前記以下のステップは、
    前記少なくとも3つの基準ビームの前記信号を結合することにより、結合信号に対する音声ビームフォームの形状を反映するビーム形状パラメータと、前記結合信号に対する音声ビームフォームの方向を反映するビーム方向パラメータとを持つ前記結合信号を生成するステップと、前記結合信号のエネルギー尺度を示すコスト尺度を生成するステップと、前記コスト尺度に対する局所的最小に対応するビーム方向パラメータのビーム方向パラメータ値とビーム形状パラメータのビーム形状パラメータ値とを推定するステップと、前記ビーム形状パラメータ値及び前記ビーム方向パラメータ値の関数として、第1の音源の第1の方向推定と第2の音源の第2の方向推定とを決定するステップとである、音源位置決めの方法。
JP2012553430A 2010-02-23 2011-02-16 音源位置決め Active JP5746717B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP10154387 2010-02-23
EP10154387.4 2010-02-23
PCT/IB2011/050643 WO2011104655A1 (en) 2010-02-23 2011-02-16 Audio source localization

Publications (3)

Publication Number Publication Date
JP2013520858A JP2013520858A (ja) 2013-06-06
JP2013520858A5 JP2013520858A5 (ja) 2014-04-03
JP5746717B2 true JP5746717B2 (ja) 2015-07-08

Family

ID=43924418

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012553430A Active JP5746717B2 (ja) 2010-02-23 2011-02-16 音源位置決め

Country Status (7)

Country Link
US (1) US9025415B2 (ja)
EP (1) EP2540094B1 (ja)
JP (1) JP5746717B2 (ja)
CN (1) CN102804809B (ja)
RU (1) RU2565338C2 (ja)
TR (1) TR201808448T4 (ja)
WO (1) WO2011104655A1 (ja)

Families Citing this family (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102804809B (zh) * 2010-02-23 2015-08-19 皇家飞利浦电子股份有限公司 音频源定位
CN103608854B (zh) * 2011-05-30 2016-12-28 皇家飞利浦有限公司 用于在睡眠时检测身体姿势的设备和方法
CN103235286B (zh) * 2013-04-09 2015-01-28 国家电网公司 一种对电噪声源的高精度定位方法
US9571941B2 (en) 2013-08-19 2017-02-14 Knowles Electronics, Llc Dynamic driver in hearing instrument
US9532138B1 (en) 2013-11-05 2016-12-27 Cirrus Logic, Inc. Systems and methods for suppressing audio noise in a communication system
JP6472144B2 (ja) * 2014-11-17 2019-02-20 国立研究開発法人産業技術総合研究所 脳波による類似度の評価方法、評価装置、評価システム及びプログラム
JP6539846B2 (ja) * 2015-07-27 2019-07-10 株式会社オーディオテクニカ マイクロホン及びマイクロホン装置
US10674255B2 (en) 2015-09-03 2020-06-02 Sony Corporation Sound processing device, method and program
US9401158B1 (en) 2015-09-14 2016-07-26 Knowles Electronics, Llc Microphone signal fusion
GB201518004D0 (en) * 2015-10-12 2015-11-25 Microsoft Technology Licensing Llc Audio signal processing
WO2017075127A1 (en) * 2015-10-30 2017-05-04 Hornet Industries, Llc System and method to locate and identify sound sources in a noisy environment
EP3389285B1 (en) 2015-12-10 2021-05-05 Sony Corporation Speech processing device, method, and program
US9830930B2 (en) 2015-12-30 2017-11-28 Knowles Electronics, Llc Voice-enhanced awareness mode
US9779716B2 (en) 2015-12-30 2017-10-03 Knowles Electronics, Llc Occlusion reduction and active noise reduction based on seal quality
US9812149B2 (en) 2016-01-28 2017-11-07 Knowles Electronics, Llc Methods and systems for providing consistency in noise reduction during speech and non-speech periods
CN106093848B (zh) * 2016-05-25 2019-01-11 深圳市豪恩声学股份有限公司 声音定向方法及装置
ITUA20164622A1 (it) * 2016-06-23 2017-12-23 St Microelectronics Srl Procedimento di beamforming basato su matrici di microfoni e relativo apparato
US10779084B2 (en) * 2016-09-29 2020-09-15 Dolby Laboratories Licensing Corporation Automatic discovery and localization of speaker locations in surround sound systems
CN107644650B (zh) * 2017-09-29 2020-06-05 山东大学 一种基于渐进串行正交化盲源分离算法的改进声源定位方法及其实现***
US11245981B2 (en) * 2017-11-15 2022-02-08 Mitsubishi Electric Corporation Sound collection and playback apparatus, and recording medium
EP3949179A1 (en) 2019-04-05 2022-02-09 TLS Corp. Distributed audio mixing
US20220366918A1 (en) * 2019-09-17 2022-11-17 Nokia Technologies Oy Spatial audio parameter encoding and associated decoding
CN111256238A (zh) * 2020-01-21 2020-06-09 金文睿 负离子发生仪的方向调整方法、***及负离子发生仪***
EP4404196A1 (en) * 2021-11-09 2024-07-24 Samsung Electronics Co., Ltd. Electronic device for controlling beamforming and operation method thereof
US11856147B2 (en) 2022-01-04 2023-12-26 International Business Machines Corporation Method to protect private audio communications

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4305141A (en) * 1978-06-09 1981-12-08 The Stoneleigh Trust Low-frequency directional sonar systems
US4198705A (en) * 1978-06-09 1980-04-15 The Stoneleigh Trust, Donald P. Massa and Fred M. Dellorfano, Trustees Directional energy receiving systems for use in the automatic indication of the direction of arrival of the received signal
AU2000262575A1 (en) * 2000-08-11 2000-11-21 Phonak Ag Method for localising direction and localisation arrangement
US6687187B2 (en) * 2000-08-11 2004-02-03 Phonak Ag Method for directional location and locating system
WO2006110230A1 (en) 2005-03-09 2006-10-19 Mh Acoustics, Llc Position-independent microphone system
KR100493172B1 (ko) * 2003-03-06 2005-06-02 삼성전자주식회사 마이크로폰 어레이 구조, 이를 이용한 일정한 지향성을갖는 빔 형성방법 및 장치와 음원방향 추정방법 및 장치
RU2274873C2 (ru) * 2004-02-09 2006-04-20 Тульский государственный университет Акустический пеленгатор
US8873768B2 (en) * 2004-12-23 2014-10-28 Motorola Mobility Llc Method and apparatus for audio signal enhancement
US20060245601A1 (en) * 2005-04-27 2006-11-02 Francois Michaud Robust localization and tracking of simultaneously moving sound sources using beamforming and particle filtering
FI20055261A0 (fi) * 2005-05-27 2005-05-27 Midas Studios Avoin Yhtioe Akustisten muuttajien kokoonpano, järjestelmä ja menetelmä akustisten signaalien vastaanottamista tai toistamista varten
CN101238511B (zh) * 2005-08-11 2011-09-07 旭化成株式会社 声源分离装置、音频识别装置、移动电话机、声源分离方法
US7324042B2 (en) * 2005-11-15 2008-01-29 The Boeing Company Monostatic radar beam optimization
JP2008070339A (ja) * 2006-09-15 2008-03-27 Univ Of Tokyo 音源定位方法及び音源定位装置
US8934640B2 (en) 2007-05-17 2015-01-13 Creative Technology Ltd Microphone array processor based on spatial analysis
WO2009034524A1 (en) 2007-09-13 2009-03-19 Koninklijke Philips Electronics N.V. Apparatus and method for audio beam forming
CN102804809B (zh) * 2010-02-23 2015-08-19 皇家飞利浦电子股份有限公司 音频源定位

Also Published As

Publication number Publication date
US9025415B2 (en) 2015-05-05
US20130128701A1 (en) 2013-05-23
EP2540094B1 (en) 2018-04-11
RU2012140488A (ru) 2014-03-27
WO2011104655A1 (en) 2011-09-01
JP2013520858A (ja) 2013-06-06
CN102804809B (zh) 2015-08-19
RU2565338C2 (ru) 2015-10-20
TR201808448T4 (tr) 2018-07-23
EP2540094A1 (en) 2013-01-02
CN102804809A (zh) 2012-11-28

Similar Documents

Publication Publication Date Title
JP5746717B2 (ja) 音源位置決め
CN109997375B (zh) 同心圆差分麦克风阵列及相关波束形成
US9291697B2 (en) Systems, methods, and apparatus for spatially directive filtering
JP5777616B2 (ja) 音声ビーム形成
CN108549052B (zh) 一种时频-空域联合加权的圆谐域伪声强声源定位方法
JPWO2004079388A1 (ja) 位置情報推定装置、その方法、及びプログラム
Jo et al. Direction of arrival estimation using nonsingular spherical ESPRIT
JP2002511591A (ja) センサアレイを用いての電波源の方向決定
JP2013520858A5 (ja)
WO2020014812A1 (en) Flexible geographically-distributed differential microphone array and associated beamformer
Song et al. Closed-form direction finding using collocated but orthogonally oriented higher order acoustic sensors
Wang et al. High-order superdirectivity of circular sensor arrays mounted on baffles
Calmes et al. Azimuthal sound localization using coincidence of timing across frequency on a robotic platform
Haneda et al. Design of multipole loudspeaker array based on spherical harmonic expansion
CN113491137B (zh) 具有分数阶的灵活差分麦克风阵列
Zavala et al. Generalized inverse beamforming investigation and hybrid estimation
WO2024108515A1 (en) Concentric circular microphone arrays with 3d steerable beamformers
Cao et al. MVDR beamformer analysis of acoustic vector sensor with single directional interference
Lübeck et al. A Real-Time Application for Sound Source Localization Inside a Spherical Microphone Array
Kwon et al. SOUND SOURCE LOCALIZATION IN THE NON FREE-FIELD CONDITION: SPERICAL PLATFORM: SPERICAL PLATFORM
Wu et al. A New Speech Source Locating System Using Orthocenter Locating Algorithm

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140212

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20140212

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20140212

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20150220

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20150413

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20150508

R150 Certificate of patent or registration of utility model

Ref document number: 5746717

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: R3D02

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250