JP2009052928A - 位置推定装置、その方法、そのプログラム、およびその記録媒体 - Google Patents

位置推定装置、その方法、そのプログラム、およびその記録媒体 Download PDF

Info

Publication number
JP2009052928A
JP2009052928A JP2007217924A JP2007217924A JP2009052928A JP 2009052928 A JP2009052928 A JP 2009052928A JP 2007217924 A JP2007217924 A JP 2007217924A JP 2007217924 A JP2007217924 A JP 2007217924A JP 2009052928 A JP2009052928 A JP 2009052928A
Authority
JP
Japan
Prior art keywords
sound
delay time
time difference
distance
emission
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2007217924A
Other languages
English (en)
Other versions
JP5226989B2 (ja
Inventor
Kazunori Kobayashi
和則 小林
Kenichi Furuya
賢一 古家
Akitoshi Kataoka
章俊 片岡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2007217924A priority Critical patent/JP5226989B2/ja
Publication of JP2009052928A publication Critical patent/JP2009052928A/ja
Application granted granted Critical
Publication of JP5226989B2 publication Critical patent/JP5226989B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Measurement Of Velocity Or Position Using Acoustic Or Ultrasonic Waves (AREA)

Abstract

【課題】高精度に信号源などの位置を推定する。
【解決手段】K個(Kは1以上の整数)の放出手段12から放出される放出信号CとN個(Nは1以上の整数)の信号源17から発せられる信号源信号AとをM個(Mは2以上の整数)の収音手段11が収音したMチャネルの収音信号Bを用いて、当該Mチャネルの収音信号B間の遅延時間差である測定収音間遅延時間差τijnを測定し(15、S2)、K個の放出手段12に入力されるKチャネルの入力信号EとMチャネルの収音信号Bを用いて、Kチャネルの放出信号CのそれぞれとMチャネルの収音信号Bのそれぞれとの間の遅延時間差である測定収音放出間遅延時間差δkmを測定し、測定収音間遅延時間差τijnと、測定収音放出間遅延時間差δkmとを用いて収音手段11の位置、放出手段12の位置、信号源Aの位置を推定する。
【選択図】図2

Description

この発明は、例えば、複数の収音手段を用いた雑音抑圧収音や話者位置に自動追従するテレビカメラ制御に利用するための位置推定装置、その方法、そのプログラム、およびその記録媒体に関する。
図1に従来の位置推定装置10の機能構成例を示す。位置推定装置10は、収音間遅延時間差測定部13と推定部161とで構成され、必要に応じて収音手段間距離入力部61も備える。従来の位置推定装置10は、N個(Nは1以上の整数)の信号源17(n=1,...,N)の位置と、信号源よりの信号源信号を収音するM個(Mは1以上の整数)の収音手段11(m=1,...,M)の位置を推定する。ここで、信号源とは例えば、音源のことである。音源とは、例えばTV会議での音声を発する人間のことであり、信号源信号とは、例えば音源信号であり、収音手段とは、音声を収音するマイクロホンなどである。なお、以下の説明では、収音手段11をマイクロホン11として説明する。また、複数のマイクロホンがフレームで固定されている場合は、それら固定されているマイクロホンの間の距離は既知である。2個のマイクロホンの間の距離を収音手段間距離とし、Q個(Qは1以上の整数)の収音手段間距離が既知である場合は、収音手段間距離入力部61が備えられ、収音手段間距離は事前に収音手段間距離入力部61に入力される。以下の説明では、Q個の収音手段間距離が既知であり、収音手段間距離入力部61が備えられている場合を説明する。
まず、収音間遅延時間差測定部13はM個のマイクロホン11で収音されたMチャネルの収音信号間の遅延時間差である測定収音間遅延時間差を測定する。ここで、音源17から発せられた音源信号について、i番目(i=1,...,M−1)のマイクロホン11とj番目(i=1,...,M)のマイクロホン11との間で、収音間遅延時間差測定部13により測定される遅延時間差である測定収音間遅延時間差をτijnとする。収音間遅延時間差測定部13はN個の全ての音源について、測定収音間遅延時間差τijnを求める。収音間遅延時間差測定部13による測定収音間遅延時間差τijnの求め方は[発明の実施をするための最良の形態]で詳細に説明する。
推定部161は、M個のマイクロホンの位置とN個の音源の位置を推定する。ここで、求めるべきマイクロホンの推定位置を(x^、y^、z^)(m=1,...,M)とし、求めるべき音源の推定位置を(X^、Y^、Z^)(=1,...,N)する。ここで、全てのマイクロホンの位置、全ての音源の位置が未知であるので、座標の基準位置を設ける。ここでは、1番目のマイクロホン11を原点(0、0、0)とし2番目のマイクロホン11と3番目のマイクロホン11を通る平面をxy平面として座標を定義する。このように設定すれば、x^=0、y^=0、z^=0、y^=0、z^=0、z^=0となり、これらを定数とすることが出来る。マイクロホンの推定位置、音源の推定位置から求められる推定収音間遅延時間差τ^ijn(P)は以下のように表される。
Figure 2009052928
ただしcは音速であり、Pは3M+3N−6個の要素を持つマイクロホンと音源との推定位置のベクトルであり、
P=(x^,...,x^,y^,...,y^,z^,...,x^
X^,...,X^,Y^,...,Y^,Z^,...,Z^)で表される。
また、イメージで記載した式では(例えば式(1))、記号(例えば、x)の真上に「^」を付しており、テキストで記載した式では記号の右上に「^」を付しているが、これらは同値であることに留意されたい。
収音間遅延時間差測定部13で求められた測定収音間遅延時間差をτijnと式(1)で表される推定収音間遅延時間差τ^ijn(P)に音速cを乗じ距離に換算したものをそれぞれ測定収音手段間距離dijnと推定収音手段間距離d^ijn(P)との二乗誤差の和e’(P)を求めれば、式(2)となる。なお、推定収音手段間距離d^ijn(P)は推定収音間遅延時間差τ^ijn(P)にcを乗算するのではなく、直接、推定収音手段間距離d^ijn(P)を求めても良い。
Figure 2009052928
また、上述のように、収音手段間距離入力部61に収音手段間距離が入力される。ここで、マイクロホン番号F(q)であるマイクロホン11F(q)と、マイクロホン番号G(q)であるマイクロホン11G(q)との測定された距離を収音手段間距離DF(q)G(q)とする。DF(q)G(q)の測定の仕方として、人間が測定などをすれば良い。推定位置ベクトルPから計算される推定収音手段間距離をD^F(q)G(q)(P)とする。DF(q)G(q)とD^F(q)G(q)(P)との関係は以下の式(3)で表される。
Figure 2009052928
ここで、マイクロホンの位置を音源の位置を推定するには、式(3)の制約条件下で式(2)を最小化すればよい。そこで、式(2)と式(3)を変形して、1つの最小化問題に置き換えれば、式(4)になる。
Figure 2009052928
ただし、λは重み係数であり、事前に設定される。λが大きいほど、式(4)が厳密に満たされるPが求められる。e(P)を最小化するPを求めることで、測定収音間遅延時間差τijnと推定収音間遅延時間差τ^ijn(P)との誤差が最小となる推定音源位置、推定されるマイクロホンの位置を求めることができる。ただし、式(4)は非線形連立方程式であり、解析的に解くことは困難である。ここでは、逐次修正を用いた数値解析で求める。式(4)を最小化する推定されるマイクロホンの位置(x^、y^、z^)と推定音源位置(X^、Y^、z^)を求めるには、ある点における勾配を求め、誤差e(P)が小さくなる方向に、推定されるマイクロホンの位置、推定音源位置を修正していき、勾配が0になる点を求めればよい。従って、修正式は式(5)のようになる。
Figure 2009052928
Figure 2009052928
Figure 2009052928
以上、示した方法により、音源の位置(x^、y^、z^)とマイクロホンの位置(X^、Y^、z^)を推定できる。
特開2007−81455号
従来の位置推定装置10では、マイクロホン11の配置が1箇所に集中している場合に収音間遅延時間差測定部13で生じる推定誤差の影響を受けやすく、収音手段の位置と信号源(音源)の位置の推定を大きく誤る。何故なら、マイクロホンの配置が1箇所に集中しているということは、dijn、d^ijn(P)が小さいということであり、誤った点で式(5)による勾配が0になってしまうからである。
本発明は、マイクロホンの配置が1箇所に集中している場合であっても、収音手段、信号源の位置を正しく推定する位置推定装置、その方法、そのプログラム、およびその記録媒体を提供することを目的とする。
この発明は、収音間遅延時間差測定部と、収音放出間遅延時間差測定部と、推定部と、を備える位置推定装置。収音間遅延時間差測定部は、K個(Kは1以上の整数)の放出手段から放出される放出信号とN個(Nは1以上の整数)の信号源から発せられる信号源信号とをM個(Mは2以上の整数)の収音手段が収音したMチャネルの収音信号を用いて、当該Mチャネルの収音信号間の遅延時間差である測定収音間遅延時間差を測定する。収音放出間遅延時間差測定部は、K個の放出手段に入力されるKチャネルの入力信号とMチャネルの収音信号を用いて、Kチャネルの放出信号のそれぞれとMチャネルの収音信号のそれぞれとの間の遅延時間差である測定収音放出間遅延時間差を測定する。推定部は、測定収音間遅延時間差と、測定収音放出間遅延時間差と、を用いて、収音手段の位置、放出手段の位置、信号源の位置を推定する。
上記の構成により、更にK個の放出手段を設け、K個の放出手段に入力されるKチャネルの入力信号とMチャネルの収音信号を用いて、Kチャネルの放出信号のそれぞれとMチャネルの収音信号のそれぞれとの間の遅延時間差である測定収音放出間遅延時間差を測定する。そして収音間遅延時間差のみではなく測定収音放出間遅延時間差も用いる。こうすることで、信号源の位置推定、収音手段の位置推定に用いる情報量を増加させることができる。従って、どのような環境下にあっても、収音手段、信号源の位置を高精度に推定でき、更には、拡声手段の位置も推定できる。
以下に、発明を実施するための最良の形態を示す。なお、同じ機能を持つ構成部や同じ処理を行う過程には同じ番号を付し、重複説明を省略する。
図2に位置推定装置50−1の機能構成例を示し、図3に位置推定装置50−1の主な処理の流れを示す。以下の説明では、信号源を音源とし、信号源信号を音源信号とし、収音手段をマイクロホンとし、拡声手段をスピーカとする。また、スピーカの数はK個(Kは1以上の整数)であり、12(k=1,...,K)と示し、M個(Mは1以上の整数)のマイクロホンを11(m=1,...,M)と示し、N個(Nは1以上の整数)の音源を17(n=1,...,N)と示す。位置推定装置50−1は、信号発生部14、収音間遅延時間差測定部13、収音放出間遅延時間差測定部15、推定部16、により構成される。
信号発生部14は、スピーカ12とマイクロホン11の間の距離を測定するための信号を発生する。当該信号のチャネル数は、スピーカの数Kと同じである。また信号発生部14よりの信号は、同時刻には1チャネルしか存在しないようにチャネル毎に順番に発生される。信号の種類は、例えば、白色雑音、TSP(Time stretched pulse)信号、M系列信号などである。信号発生部14で発生された信号は入力信号Eとして、スピーカ12に入力され、スピーカ12から放出信号Cとして、放出される。
M個のマイクロホン11は、スピーカ12よりの放出信号Cと音源17よりの音源信号AとをMチャネルの収音信号Bとして収音する。収音間遅延時間差測定部13は、Mチャネルの収音信号Bを用いて、当該Mチャネルの収音信号間の遅延時間差である測定収音間遅延時間差τijnを測定する(ステップS2)。ここで、測定収音間遅延時間差τijnは、n番目の音源17よりの音源信号Aについて、i番目(i=1,...,M−1)のマイクロホン11とj番目(i=1,...,M)のマイクロホン11との間の遅延時間差である。測定収音間遅延時間差τijnの測定の仕方の一例を示す。
図4に、収音間遅延時間差測定部13の機能構成例を示す。収音間遅延時間差測定部13は、M個のFFT手段21と、M個の白色化手段22と、収音手段対選択手段23、共役化手段40、乗算手段24、IFFT手段25、最大ピーク検出手段26、により構成される。M個のFFT手段21は対応するマイクロホン11に接続されている。マイクロホン11よりの収音信号Bは対応するFFT手段21に入力される。FFT手段21は時間領域の収音信号Bから周波数領域の収音信号B’に変換する。周波数領域への変換の手法は、例えば公知のフーリエ変換などで行えばよい。白色化手段22は、収音信号B’を白色化(フラット)して白色化収音信号WB’を生成する。次に、収音手段対選択手段23は、スイッチを切替えて、白色化収音信号WB’のうち2つを選択する。このとき、全てのマイクロホンのペアの組み合わせについて以下の処理が実施されるように、収音手段対選択手段23のスイッチの切り替えが行われる。この2つの白色化収音信号をWB’とWB’とする。選択された2つの白色化収音信号WB’とWB’のうち、WB’が共役化手段40により共役がとられる。そして、乗算手段24は、共役をとられた白色化収音信号WB’ と共役をとられていない白色化収音信号WB’とを周波数領域ごとに乗算してクロススペクトルを求める。そして、乗算手段24よりの出力信号は、IFFT手段25により時間領域に変換され。白色化相互相関が求められる。次に、最大ピーク検出手段26で、IFFT手段25よりの白色化相互相関の最大ピークを検出し、最大ピークの地点の時間差が測定収音間遅延時間差τijnとして、出力される。
収音放出間遅延時間差測定部15は、K個のスピーカ12に入力されるKチャネルの入力信号EとMチャネルの収音信号Bを用いて、Kチャネルの放出信号CのそれぞれとMチャネルの収音信号Bのそれぞれとの間の遅延時間差である測定収音放出間遅延時間差δkmを測定する(ステップS4)。換言すれば、測定収音放出間遅延時間差δkmは、k番目のスピーカ12からm番目のマイクロホン11までの音が到達するのにかかる時間である。測定収音放出間遅延時間差δkmの測定の手法の一例を説明する。
図5に収音放出間遅延時間差測定部15の機能構成例を示す。収音放出間遅延時間差測定部15は、M個のFFT手段21(m=1,...,M)、M個の白色化手段32(m=1,...,M)、収音手段選択手段33、K個のFFT手段34(k=1,...,K)、K個の白色化手段35(k=1,...,K)、放出手段選択手段36、共役化手段40、乗算手段37、IFFT手段38、最大ピーク検出手段39、により構成される。
マイクロホン11よりの収音信号Bは対応するFFT手段31に入力される。FFT手段31は、時間領域の収音信号Bを、例えばフーリエ変換などにより、周波数領域の収音信号B’に変換する。白色化手段32は、周波数領域の収音信号B’を白色化(フラット)して白色化収音信号WB’を生成する。
一方、スピーカ12に入力される入力信号Eは、対応するFFT手段34に入力される。FFT手段34は、時間領域の入力信号Eを、例えばフーリエ変換などにより、周波数領域の入力信号E’に変換する。白色化手段35は、周波数領域の入力信号E’を白色化(フラット)して白色化入力信号WD’を生成する。次に、収音手段選択手段33は白色化手段32の出力信号のうち1つを選択する。また、放出手段選択手段36は白色化手段35の出力信号のうち1つを選択する。このとき、全てのM個のマイクロホン11と全てのK個のスピーカ12の組み合わせについて、以下の処理が実施されるように収音手段選択手段33と放出手段選択手段36のスイッチの切り替えは行われる
そして、収音手段選択手段33で選択された白色化収音信号WB’は、共役化手段40により、共役をとられ、WB’ が生成される。乗算手段37は、共役をとられた白色化収音信号WB’ と共役をとられていない白色化入力信号WD’を周波数領域毎に乗算させ、クロススペクトルを求める。IFFT手段38は、乗算手段37の出力信号を、逆フーリエ変換などで、周波数領域から時間領域に戻して、白色化相関関を求める。最大ピーク検出手段39は、IFFT手段38よりの白色化相関関の最大ピークを検出し、その最大ピークの時間差を測定収音放出間遅延時間差δkmとして出力する。
説明を図2に戻す。推定部16は、収音間遅延時間差測定部13よりの測定収音間遅延時間差τijnと、収音放出間遅延時間差測定部15よりの測定収音放出間遅延時間差δkmと、を用いて、位置推定装置50−1の目的である、マイクロホン11の位置、音源17の位置、スピーカ12の位置を推定する(ステップS6)。ここで推定されるマイクロホン11の位置を(x^、y^、z^)とし、推定される音源17の位置を(X^、Y^、Z^)とし、推定されるスピーカ12の位置を(X’^、Y’^、Z’^)とする。ただし、全てのマイクロホンの位置、全ての音源の位置、全てのスピーカの位置が未知であるので、座標の基準位置を設ける。ここでは、1番目のマイクロホン11を原点(0、0、0)とし2番目のマイクロホン11と3番目のマイクロホン11を通る平面をxy平面として座標を定義する。このように設定すれば、x^=0、y^=0、z^=0、y^=0、z^=0、z^=0となり、これらを定数とすることが出来る。マイクロホンの推定位置、音源の推定位置から求められる推定収音間遅延時間差τ^ijn(P)は以下のように表される。
Figure 2009052928
ただしcは音速であり、Pは3M+3N+3K−6個の要素を持つマイクロホンと音源との推定位置のベクトルであり、
P=(x^,...,x^,y^,...,y^,z^,...,x^
X^,...,X^,Y^,...,Y^,Z^,...,Z^
X’^,...,X’^,Y’^,...,Y’^,Z’^,...,Z’^)で表される。
次に、推定されるスピーカの位置と推定されるマイクロホンの位置から推定される推定収音放出間遅延時間差δ^km(P)は以下の式(21)になる。
Figure 2009052928
測定収音間遅延時間差τijn、推定収音間遅延時間差τ^ijn(P)に音速cを乗じたものをそれぞれ測定収音手段間距離dijn、推定収音手段間距離d^ijn(P)とする。そして、測定収音手段間距離dijn、推定収音手段間距離d^ijn(P)の二乗誤差の和e’(P)を求めれば、以下の式(22)になる。
Figure 2009052928
次に、測定収音放出間遅延時間差δkm、推定収音放出間遅延時間差δ^km(P)に音速cを乗じ、距離に換算したものをそれぞれ測定収音放出間距離Lkm、推定収音放出間距離L^km(P)とし、測定収音放出間距離Lkm、推定収音放出間距離L^km(P)の二乗誤差の和e’’(P)を求めれば、以下の式(23)になる。なお、推定収音手段間距離d^ijn(P)を求める際に、推定収音間遅延時間差τ^ijn(P)にcを乗算するのではなく、直接、推定収音手段間距離d^ijn(P)を求めても良い。
Figure 2009052928
ここで、マイクロホンの位置、音源の位置、スピーカの位置、を推定するには、式(22)と式(23)を重みつきして結合させて、1つの最小化問題に置き換えればよい。置き換えた結果は以下の式(24)である。
Figure 2009052928
ただし、βは重み係数であり、事前に設定される。βが大きいほど、式(23)の誤差を最小化する重みが大きくなる。Lkmの測定誤差がdijnの測定誤差に比べ小さい場合は、βを1よりも大きな値に設定すると、より精度の高い推定値に対する重みを大きくでき、より高精度な位置の推定をできる。
式(24)に示したe(P)を最小化する解を求めることで、dijnとd^ijn(P)との誤差、Lkm、とL^km(P)との誤差が最小となるマイクロホン11の位置、音源17の位置、スピーカ12の位置を求めることができる。ただし、式(24)は非線形連立方程式であり、解析的に解くことは困難である。ここでは、逐次修正を用いた数値解析で求める。式(24)を最小化する推定収音手段位置(x^、y^、z^)(a=1,...,M)と推定音源位置(X^、Y^、Z^)(b=1,...,N)と推定音源位置(X’^、Y’^、Z’^)(c=1,...,K)を求めるには、ある点における勾配を求め、誤差e(P)が小さくなる方向に、推定される収音手段の位置、推定される音源の位置、推定されるスピーカの位置を修正していき、勾配が0になる点を求めればよい。従って、修正式は式(25)のようになる。ただし、逐次修正では、勾配が完全に0にはならないので、勾配が事前に設定した十分小さい値の閾値以下となった場合に推定位置の修正を停止する。閾値については後述する。
Figure 2009052928
Figure 2009052928
式(25)を用いた位置推定処理の詳細を説明する。図6に推定部16の機能構成例を示し、図7に推定部16の主な処理の流れを示す。図6の例では、推定部16は、更新手段41、初期値設定手段42、信号源位置記憶手段43、収音手段位置記憶手段44、放出手段位置記憶手段45、判定手段46により構成されている。以下の説明では、u回修正後の推定されるマイクロホンの位置をA(u)=(x^(u)、y^(u)、z^(u))とし、推定される音源の位置をB(u)=(X^(u)、Y^(u)、Z^(u))とし、推定されるスピーカの位置をC(u)=(X’^(u)、Y’^(u)、Z’^(u))とする。
まず、更新手段41は、測定収音放出間遅延時間差δkmと、測定収音間遅延時間差τijnとを読み込む(ステップS100)。そして、初期値設定手段42は、推定収音手段位置の初期値、推定音源位置の初期値、推定放出手段位置の初期値、つまり、0回修正後のそれぞれの値A(0)=(x^(0)、y^(0)、z^(0))、B(0)=(X^(0)、Y^(0)、Z^(0))、C(0)=(X’^(0)、Y’^(0)、Z’^(0))を設定する。これらの初期値は任意の値でよい。次に、A(0)は収音手段位置記憶手段44に、B(0)は信号源位置記憶手段に、C(0)は放出手段位置記憶手段45に、記憶される。そして、式(25)により、A(0)、B(0)、C(0)、δkm、τijn、とを用いて、ベクトルP、つまり、N個の信号源の位置、M個の収音手段の位置、K個の放出手段の位置を式(25)により更新する(ステップS104)。更新後の推定収音手段位置、推定音源位置、推定音源位置は更新の都度、収音手段位置記憶手段44に、信号源位置記憶手段43に、放出手段位置記憶手段45に、記憶される。
また、逐次修正では、勾配が完全に0にはならない。従って、判定手段46が、これら更新が終了したと判定すると(ステップS106)、例えば、更新停止信号を生成し、更新処理を停止させる。以下に、判定手段46の判定処理の一例を説明する。
判定手段46が、更新手段41の更新処理に用いる式(25)中の更新量grad e(P)が十分に小さいか否かを判定し、十分小さければ、更新が終了したと判定する。例えば、更新量grad e(P)の総和Σ│grad e(P)│と、事前に設定された閾値Tcとを比較し、Tc>Σ│grad e(P)│になれば、判定手段46が更新が終了したと判定する。ここで、Σ│grad e(P)│は、ベクトルPで規定される全ての位置についての「grad e(P)」の合計である。その他、Tc≧Σ│grad e(P)│になった場合や、修正回数uが予め定められた閾値以上になった場合に、判定手段46が更新が終了したと判定するようにしても良い。そして、修正後の音源の位置、マイクロホンの位置、スピーカの位置が推定された音源の位置、推定されたマイクロホンの位置、推定されたスピーカの位置として、推定部16から出力される(ステップS108)。
従来の位置推定装置10は、測定収音間遅延時間差τijnを用いて、位置を推定していた。マイクロホンが1箇所に集中している等の場合、式(2)に示すe’(P)が小さくなる。また、式(3)に示す値DF(q)G(q)は、固定値である。従って、式(4)に示すe(P)の値は小さくなり、結果として、式(5)による逐次修正において、誤った点で勾配が0になってしまい、正しい位置を推定できなかった。
しかし、位置推定装置50−1は、測定収音間遅延時間差τijnのみではなく、測定収音放出間遅延時間差δkmをも用いて、音源の位置、マイクロホンの位置、スピーカの位置を推定する。従って、マイクロホンが1箇所に集中している等の場合、式(22)に示すe’(P)は小さくなるが、式(23)に示すe’’(P)は小さくはならない。よって、式(24)に示すe(P)は小さくならず、式(25)による逐次修正において、正しい点で勾配が0に近づき、正しい位置を推定できるようになった。
また、信号発生部14は、上述の通り、同時刻には1チャネルしか存在しない入力信号Eを発生する。もし、信号発生部14がG(G≧2)チャネルの入力信号Eを発生すると、Gチャネルの放出信号が放出され、G−1チャネルの放出信号が雑音信号として収音信号Bに混ざってしまい、収音間遅延時間差測定部13、収音放出間遅延時間差測定部15の処理が正確に行われなくなる。また、G−1チャネルの入力信号Eが収音放出間遅延時間差測定部15に入力されると、収音放出間遅延時間差測定部15の処理が正確に行われなくなる。従って、信号発生部14が同時刻には1チャネルしか存在しない入力信号Eを発生することで、収音間遅延時間差測定部13、収音放出間遅延時間差測定部15は処理を正確に行うことができる。
なお、いくつかのスピーカやマイクロホンがフレーム等で固定されている場合は、(1)2つのマイクロホンの間の距離である収音手段間距離、(2)2つのスピーカの間の距離である放出手段間距離、(3)マイクロホンとスピーカの間の距離である収音手段放出手段間距離、が既知である。また、音源がテープレコーダーの場合など、固定されており、当該音源がフレームで固定されている場合は、(4)2つの音源の間の距離である信号源間距離、(5)信号源とマイクロホンとの間の距離である信号源収音手段間距離、(6)信号源とスピーカとの間の距離である信号源放出手段間距離、が既知である。
これら6つの距離の少なくとも1つを固有パラメータと定義する。以下で説明する実施例2〜実施例7の推定部16は、測定収音間遅延時間差τijnと、測定収音放出間遅延時間差δkmの他に、固有パラメータを用いて推定をする。
実施例2では、2つのマイクロホンの間の距離である収音手段間距離が既知である場合を説明する。図8に実施例2の位置推定装置50−2の機能構成例を示す。位置推定装置50−2は位置推定装置50−1と比較して、収音手段間距離入力部61を備える点で異なる。収音手段間距離を用いることで、位置推定装置50−1と比較して、情報量が増え、更に、高精度な位置を推定できる。Q個(Qは1以上の整数)の収音手段間距離が既知である場合は、収音手段間距離入力部61が備えられ、収音手段間距離は事前に収音手段間距離入力部61に入力される。マイクロホン番号F(q)(q=1,...,Q)であるマイクロホン11F(q)と、マイクロホン番号G(q)であるマイクロホン11G(q)との測定された距離を収音手段間距離DF(q)G(q)とする。DF(q)G(q)の測定の仕方として、人間が測定などをすれば良い。推定される位置ベクトルPから計算される推定収音手段間距離をD^F(q)G(q)(P)とする。DF(q)G(q)とD^F(q)G(q)(P)との関係は以下の式(38)で表される。
Figure 2009052928
ここで、マイクロホンの位置と音源の位置とスピーカの位置を推定するには、式(38)の制約条件下で式(24)中のeを最小化すればよい。そこで、式(38)を二乗誤差の形式に変形して、式(24)に追加し、1つの最小化問題に置き換えれば、式(39)になる。
Figure 2009052928
ただし、λは、重み係数であり、事前に設定される。λが大きいほど、式(38)が厳密に満たされる解が求まる。
式(39)に示したe(P)を最小化する解を求めることで、dijnとd^ijn(P)との誤差、Lkm、とL^km(P)との誤差が最小となるマイクロホン11の位置、音源17の位置、スピーカ12の位置を求めることができる。ただし、式(39)は非線形連立方程式であり、解析的に解くことは困難である。ここでは、逐次修正を用いた数値解析で求める。式(39)を最小化する推定されるマイクロホンの位置(x^、y^、z^)(a=1,...,M)と推定される音源の位置(X^、Y^、Z^)(b=1,...,N)と推定されるスピーカの位置(X’^、Y’^、Z’^)(c=0,...,K)を求めるには、ある点における勾配を求め、誤差e(P)が小さくなる方向に、推定されるマイクロホンの位置、推定される音源の位置、推定されるスピーカの位置を修正していき、勾配が0になる点を求めればよい。従って、修正式は式(40)のようになる。
Figure 2009052928
Figure 2009052928
Figure 2009052928
推定部16は、式(41)〜式(53)を用いて、音源の位置、マイクロホンの位置、放出手段の位置を推定する。
このように、位置推定装置50−2は位置推定装置50−1と比較して、収音手段間距離DF(q)G(q)と推定収音手段間距離をD^F(q)G(q)を用いることで、使用する情報量を更に増やすことができ、結果として、より高精度な位置を推定できる。
実施例3では、2つのスピーカの間の距離である放出手段間距離が既知である場合を説明する。図9に実施例3の位置推定装置50−3の機能構成例を示す。位置推定装置50−3は位置推定装置50−2と比較して、放出手段間距離入力部71を備える点で異なる。放出手段間距離を用いることで、位置推定装置50−2と比較して、情報量が増え、更に高精度に位置を推定できる。R個(Rは1以上の整数)の放出手段間距離が既知である場合は、放出手段間距離入力部71が備えられ、放出手段間距離は事前に放出手段間距離入力部71に入力される。スピーカ番号V(r)(r=1,...,R)であるスピーカ12V(r)と、スピーカ番号W(r)であるスピーカ12W(r)との測定された距離を放出手段間距離ΨV(r)W(r)とする。ΨV(r)W(r)の測定の仕方として、人間が測定などをすれば良い。推定される位置ベクトルPから計算される推定放出手段間距離をΨ^V(r)W(r)(P)とする。ΨV(r)W(r)とΨ^V(r)W(r)(P)との関係は以下の式(54)で表される。
Figure 2009052928
ここで、マイクロホンの位置と音源の位置とスピーカの位置を推定するには、式(54)の制約条件と式(38)の制約条件を満たすように、式(24)のeを最小化すればよい。そこで、式(38)と式(54)を二乗誤差の形式に変形して、式(24)に追加し、1つの最小化問題に置き換えれば、式(55)になる。
Figure 2009052928
ただし、λは、重み係数であり、事前に設定される。λが大きいほど、式(54)が厳密に満たされる解が求まる。
式(55)に示したe(P)を最小化する解を求めることで、dijnとd^ijn(P)との誤差、Lkm、とL^km(P)との誤差が最小となるマイクロホン11の位置、音源17の位置、スピーカ12の位置を求めることができる。ただし、式(55)は非線形連立方程式であり、解析的に解くことは困難である。ここでは、逐次修正を用いた数値解析で求める。式(55)を最小化する推定されるマイクロホンの位置(x^、y^、z^)(a=1,...,M)と推定される音源位置(X^、Y^、Z^)(b=1,...,N)と推定されるスピーカの位置(X’^、Y’^、Z’^)(c=0,...,K)を求めるには、ある点における勾配を求め、誤差e(P)が小さくなる方向に、推定されるマイクロホンの位置、推定される音源の位置、推定されるスピーカの位置を修正していき、勾配が0になる点を求めればよい。従って、修正式は式(56)のようになる。
Figure 2009052928
Figure 2009052928
Figure 2009052928
推定部16は、式(56)〜式(69)を用いて、音源の位置、マイクロホンの位置、スピーカの位置を推定する。
このように、位置推定装置50−3は位置推定装置50−2と比較して、放出手段間距離ΨF(q)G(q)と推定放出手段間距離をΨ^F(q)G(q)(P)を用いることで、情報量を更に増やすことができ、結果として、より高精度に位置を推定できる。また、放出手段間距離入力部51を実施例1で説明した位置推定装置50−1(図2参照)に追加しても、実施できる。
実施例4では、マイクロホンとスピーカの間の距離である収音手段放出手段間距離が既知である場合を説明する。図10に実施例4の位置推定装置50−4の機能構成例を示す。位置推定装置50−4は位置推定装置50−3と比較して、収音手段放出手段間距離入力部81を備える点で異なる。収音手段放出手段間距離を用いることで、位置推定装置50−3と比較して、情報量が増え、更に、高精度な位置を推定できる。S個(Sは1以上の整数)の収音手段放出手段間距離が既知である場合は、収音手段放出手段間距離入力部81が備えられ、収音手段放出手段間距離は事前に収音手段放出手段間距離入力部81に入力される。スピーカ番号T(s)(s=1,...,S)であるスピーカ12T(s)と、マイクロホン番号U(s)であるスピーカ11U(s)との測定された距離を収音手段放出手段間距離ΦT(s)U(s)とする。ΦT(s)U(s)の測定の仕方として、人間が測定などをすれば良い。推定される位置ベクトルPから計算される推定収音手段放出手段間距離をΦ^T(s)U(s)(P)とする。ΦT(s)U(s)とΦ^T(s)U(s)(P)との関係は以下の式(70)で表される。
Figure 2009052928
ここで、マイクロホンの位置と音源の位置とスピーカの位置を推定するには、式(38)、式(54)、式(70)の制約条件を満たすように、式(24)中のeを最小化すればよい。そこで、式(38)、式(54)、式(70)を二乗誤差の形式に変形して、式(24)に追加し、1つの最小化問題に置き換えれば、式(71)になる。
Figure 2009052928
ただし、ξは、重み係数であり、事前に設定される。ξが大きいほど、式(70)が厳密に満たされる解が求まる。
式(71)に示したe(P)を最小化する解を求めることで、dijnとd^ijn(P)との誤差、Lkm、とL^km(P)との誤差が最小となるマイクロホン11の位置、音源17の位置、スピーカ12の位置を求めることができる。ただし、式(71)は非線形連立方程式であり、解析的に解くことは困難である。ここでは、逐次修正を用いた数値解析で求める。式(71)を最小化する推定されるマイクロホンの位置(x^、y^、z^)(a=1,...,M)と推定音源位置(X^、Y^、z^)(b=1,...,N)と推定音源位置(X’^、Y’^、z’^)(c=0,...,K)を求めるには、ある点における勾配を求め、誤差e(P)が小さくなる方向に、推定されるマイクロホンの位置、推定される音源の位置、推定されるスピーカの位置を修正していき、勾配が0になる点を求めればよい。従って、修正式は式(72)のようになる。
Figure 2009052928
Figure 2009052928
Figure 2009052928
Figure 2009052928
推定部16は、式(73)〜式(85)を用いて、音源の位置、マイクロホンの位置、スピーカの位置を推定する。
このように、位置推定装置50−4は位置推定装置50−3と比較して、収音手段放出手段間距離ΦT(s)U(s)と推定収音手段放出手段間距離Φ^T(s)U(s)(P)を用いることで、情報量を更に増やすことができ、結果として、より高精度な位置を推定できる。また、収音手段放出手段間距離入力部81は、位置推定装置50−1(図2参照)や位置推定装置50−2(図8参照)に設けてもよい。
実施例5では、2つの音源の間の距離である信号源間距離が既知である場合を説明する。図11に、実施例5の位置推定装置50−5を示す。位置推定装置50−5は位置推定装置50−4と比較して、信号源間距離入力部91を備える点で異なる。信号源間距離は事前に測定され、信号源間距離入力部91に入力される。そのほかの処理は実施例2〜4で説明したものと同様である。
このように、信号源間距離を用いることで、位置推定装置50−4と比較して、情報量を更に増やすことができ、結果として、より高精度に位置を推定できる。
また、信号源間距離入力部91は、位置推定装置50−1、50−2、50−3以下で説明する50−6、50−7に備えても良い。
実施例6では、音源とマイクロホンの間の距離である信号源収音手段間距離が既知である場合を説明する。図12に、実施例61の位置推定装置50−6を示す。位置推定装置50−6は位置推定装置50−5と比較して、信号源収音手段間距離入力部101を備える点で異なる。信号源収音手段間距離は事前に測定され、信号源収音手段間距離入力部101に入力される。そのほかの処理は実施例2〜4で説明したものと同様である。
このように、信号源収音手段間距離を用いることで、位置推定装置50−5と比較して、情報量を更に増やすことができ、結果として、より高精度な位置を推定できる。信号源収音手段間距離入力部101は、位置推定装置50−1、50−2、50−3、50−4、に備えても良い。
実施例7では、音源とスピーカの間の距離である信号源放出手段間距離が既知である場合を説明する。図13に、実施例7の位置推定装置50−7を示す。位置推定装置50−7は位置推定装置50−6と比較して、信号源放出手段間距離入力部111を備える点で異なる。信号源放出手段間距離は事前に測定され、信号源放出手段間距離入力部111に入力される。そのほかの処理は実施例2〜4で説明したものと同様である。
このように、信号源放出手段間距離を用いることで、位置推定装置50−6と比較して、情報量を更に増やすことができ、結果として、より高精度な位置を推定できる。信号源放出手段間距離入力部111は、位置推定装置50−1、50−2、50−3、50−4、50―5に備えても良い。
図14に、実施例8の位置推定装置50−8の推定部16’の機能構成例を示す。推定部16’は、位置推定装置50−1〜50−7が有する推定部16(図6参照)と比較して、設定手段121を有する点で異なる。また、位置推定装置50−8は、実施例2〜4で説明した式(39)や式(55)や式(71)に示すように、更新手段41が、収音手段間距離、放出手段間距離、収音手段放出手段間距離、のうち少なくとも1つに重み係数(λ、γ、ξ)を乗算したものを用いて、更新量を計算する場合に適用できる。
設定手段121は、収音手段間距離、放出手段間距離、収音手段放出手段間距離のうち重み係数が乗算されたものが重視されるように、更新量の値が小さくなるに従って、乗算で用いられる重み係数を大きくする。重み係数(λ、γ、ξ)は設定手段121により、逐次設定される。以下の処理の詳細について説明する。
測定収音手段間距離dijn、測定収音放出間距離Lkmは誤差を含むが、測定された収音手段間距離DF(q)G(q)、測定された放出手段間距離ΨV(r)W(r)、測定された収音手段放出手段間距離ΦT(s)U(s)、はフレーム等で固定された距離なので、ほとんど誤差を含まない。従って、式(39)や式(55)や式(71)に含まれる重み係数λ、γ、ξを大きな値に設定して、式(38)、式(54)、式(70)の条件を満たすような推定位置Pを求めることが望ましい。ただし、逐次修正の初期段階からλ、γ、ξを大きな値に設定すると、dijnとd^ijn(P)との誤差、Lkm、とL^km(P)との誤差が最小化することが十分行われないうちに、更新が終了したとみなされてしまう可能性がある。そこで、更新の終了に近づくにつれて、λ、γ、ξを、大きな値に設定するようにすればよい。式(25)、式(40)、式(56)、式(72)記載のe〜eをまとめてeALLとすると、更新量gradeALL(P)の総和Σ│gradeALL(P)│と、複数の閾値T(i)(i=1,...,Iとし、Iは2以上の整数)とを比較して、T(i)>Σ│gradeALL(P)│になった場合に、もしくは、T(i)≧Σ│gradeALL(P)│になった場合に、λ(i)、γ(i)、ξ(i)を設定する。ここで、λ(i)、γ(i)、ξ(i)は、T(i)が小さくなるほど、大きくなるように事前に設定する。
このように、重み係数λ、γ、ξを逐次的に修正することで、正確な情報である収音手段間距離DF(q)G(q)、放出手段間距離ΨV(r)W(r)、収音手段放出手段間距離ΦT(s)U(s)を重視して、位置推定装置50−8は位置を推定でき、結果として推定精度を向上できる。
図15に実施例9の位置推定装置50−9の機能構成例を示す。位置推定装置50−9は音源17が大きく移動する場合などに有効である。図15記載の位置推定装置50−9は、位置推定装置50−1と比較して、収音間遅延時間差記憶部131と、第1新信号源検出部132を有する点で異なる。また、以下の説明では、収音間遅延時間差測定部13が、過去に測定した収音間遅延時間差をτijn、OLDとし、現在、測定した収音間遅延時間差をτijn、NEWとする。収音間遅延時間差記憶部131は、新たな位置にある(移動した)音源の測定収音間遅延時間差を記憶する。新たな位置にある音源の認定は第1新信号源検出部132が行う。新たな位置にある音源の認定の方法として、収音間遅延時間差測定部が測定した現在の測定収音間遅延時間差τijn、NEWと、収音間遅延時間差記憶部131に記憶されている過去の測定収音間遅延時間差τijn、OLDと、の距離を求める。そして当該距離が予め定められた閾値以上もしくは閾値を超えれば新たな位置にある音源と認定する。ここで、距離とは、τijn、NEWやτijn、OLDとを引き数とする距離関数の関数値や、τijn、NEWやτijn、OLDとの類似度などのことである。距離関数とは、X=τijn、NEWとY=τijn、OLDとすると、X−Y、X/Y、(X−Y)の2乗平均などである。そしてこの関数値が大きいということは、過去の測定収音間遅延時間差τijn、OLDについての音源と、現在の測定収音間遅延時間差τijn、NEWについての音源とが離れているということである。また、類似度が小さい場合も同様のことが言える。従って、τijn、OLDについての音源とτijn、NEWについての音源とが離れている場合に、第1新信号源検出部132はτijn、NEWについての音源を、新たな位置にある音源と認定する。以下の説明では、「距離に関する関数」とは、(X−Y)の2乗平均の場合を説明する。
図16に第1新信号源検出部132の機能構成例を示す。第1新信号源検出部132は、二乗誤差計算手段141、閾値比較手段142で構成されている。例えば、二乗誤差計算手段141は、収音間遅延時間差測定部13よりの現在の収音間遅延時間差τijn、NEWから、収音間遅延時間差記憶部131に記憶されている過去の収音間遅延時間差τijn、OLDを減算して二乗平均する。二乗誤差計算手段141は、例えば以下の式を演算する。
Figure 2009052928
閾値比較手段142の比較によりe<Tの場合は、τijn、NEWについての音源が新たな位置にある音源でない、つまり、音源が(あまり)移動していないと認識する。また、e<Tではなくe≦Tの場合でも、τijn、NEWについての音源は新たな位置にある音源ではない、つまり、音源が(あまり)移動していないと認識してもよい。
また、閾値比較手段142の比較により、e≧Tの場合もしくはe>Tの場合、τijn、NEWについての音源を新た位置にある音源でない、つまり、音源が移動していると認識する。そして、閾値比較手段142が、音源が移動していると認識すると、記憶命令信号を生成出力して、現在の収音間遅延時間差τijn、NEWを収音間遅延時間差記憶部131に記憶させる
そして、推定部16は、収音間遅延時間差記憶部131に記憶されている全ての収音間遅延時間差と、測定収音放出間遅延時間差とを用いて推定する。
位置推定装置50−9のような構成にして、現在の収音間遅延時間差τijn、NEWを用いることで、音源が移動したとても、高精度に位置を推定できる。また、過去の収音間遅延時間差τijn、OLDを用いることで、移動する前の音源の位置を推定することもできる。なお、収音間遅延時間差記憶部131と第1新信号源検出部132は位置推定装置50−2〜8に追加しても良い。
次に、実施例10の位置推定装置50−10を図15を用いて説明する。位置推定装置50−10は、第1新信号源検出部132が第1新信号源検出部132’に代替されている点で、位置推定装置50−9と異なる。図17に、第1新信号源検出部132’の機能構成例を示す。第1新信号源検出部132’は、平均計算手段143を有する点で、第1新信号源検出部132’と異なる。式(86)記載のeについて、e<Tの場合もしくはe≦Tは、上述したとおり、音源位置が(あまり)移動していないと、第1新信号源検出部132中の閾値比較手段142が認識する。この場合は、平均計算手段143が、収音間遅延時間差τijn、NEWと過去の収音間遅延時間差τijn、OLDの平均収音間遅延時間差τijn、AVGを計算する。そして過去の収音間遅延時間差τijn、OLDが平均収音間遅延時間差τijn、AVGに更新される。
このように、音源が移動していないと認識された場合に、収音間遅延時間差τijn、OLDを平均収音間遅延時間差τijn、AVGに更新することで、記憶されていた収音間遅延時間差の正確性が増すので、位置推定装置50−10は、より高精度に位置を推定できる。なお、位置推定装置50−1〜9に第1新信号源検出部132’と収音間遅延時間差記憶部131とを追加してもよい。
次に、実施例11の位置推定装置50−11を図15を用いて説明する。位置推定装置50−11は、収音間遅延時間差記憶部131が収音間遅延時間差記憶部131’に代替されている点で、位置推定装置50−9と異なる。収音間遅延時間差記憶部131’は記憶する収音間遅延時間差τijnの個数について、上限が与えられる。上限をG個とすると、収音間遅延時間差記憶部131’はG個の収音間遅延時間差τijnを記憶する。そして、G+1個目の収音間遅延時間差τijnを記憶する際に、最も古く記憶された収音間遅延時間差τijnは破棄される。このようにして、収音間遅延時間差記憶部131’が、G+1個以上の収音間遅延時間差τijnを記憶しないことで、収音間遅延時間差記憶部131を少ないメモリで構成できる。
図18に、変形例4の位置推定装置50−12の機能構成例を示す。位置推定装置50−12は、収音放出間遅延時間差記憶部133と第2新信号源検出部134を有する点で位置推定装置50−1と異なる。位置推定装置50−9中の第1新信号源検出部132は、実施例8で説明したように、現在の収音間遅延時間差τijn、NEWと、過去の収音間遅延時間差τijn、OLDとを用いる。位置推定装置50−10中の第2新信号源検出部134は、現在の収音放出間遅延時間差δkm、NEWと、過去の収音放出間遅延時間差δkm、OLDとを用いて、音源の移動を検出する。過去の収音放出間遅延時間差δkm、OLDは収音放出間遅延時間差記憶部133に記憶される。収音放出間遅延時間差記憶部133、第2新信号源検出部134の処理はそれぞれ、収音間遅延時間差記憶部131、第1新信号源検出部132と同様なので、ここでは省略する。
また、第2新信号源検出部134を第2新信号源検出部134’と代替してもよい。第2新信号源検出部134’は、音源があまり移動していないと認定すると、収音間遅延時間差τijn、NEWと過去の収音間遅延時間差τijn、OLDの平均収音間遅延時間差τijn、AVGを計算し、τijn、OLDをτijn、AVGに更新するようにしてもよい(第1新信号源検出部132’の構成と同様)。また、収音放出間遅延時間差記憶部133を収音放出間遅延時間差記憶部133’と代替してもよい。収音放出間遅延時間差記憶部133’は記憶する測定収音放出間遅延時間差の個数について上限を有する(収音間遅延時間差記憶部131’と同様)。
なお、収音放出間遅延時間差記憶部133と新信号源検出部134とを位置推定装置50−2〜12に追加させても良い。
図19に、実施例13の位置推定装置50−13の機能構成例を示す。位置推定装置50−13は、有音区間検出部151を有する点で、位置推定装置50−1と異なる。
有音区間検出部151は、収音信号B中の有音区間を検出する。検出方法の一例を示す。収音信号B(m=1,...,M)を全て加算した信号を加算信号x(t)とする。tは時間を示す。この加算信号を短時間平均したものをX(t)とする。X(t)の雑音信号N(t)のレベルはX(t)に対してディップホールド処理することで推定でき、例えば、以下の式(87)を用いて、計算される。
N(t)=X(t) N(t−1)≧X(t)
N(t)=u・N(t−1)+(1−u)X(t) N(t−1)<X(t)
(87)
ここで、uは推定される雑音信号N(t)のレベル上昇時の平滑化定数であり、0<u<1の値をとる。uが1に近いと緩やかな雑音信号のレベルの上昇となり、ディップホールドの効果が得られる。
次に、有音区間検出部151は、有音区間と雑音区間の検出は、雑音信号N(t)のレベルに予め設定した定数を乗じた閾値TN(t)とX(t)を比較することで行う。有音区間検出部151は、TN(t)≦X(t)であれば、雑音区間と検出し、TN(t)>X(t)であれば、有音区間と検出する。ここで雑音区間とは、音源以外の雑音源が存在した場合に、当該雑音源よりの雑音信号を含む区間である。
収音間遅延時間差測定部13は、有音区間と検出された収音信号について測定収音間遅延時間差τijnを測定する。このような構成にすることで、より正確に測定収音間遅延時間差τijnを測定できるという効果と雑音の位置を推定しなくなるという効果を得ることができる。
なお、図19に破線で示すように、収音放出間遅延時間差測定部15は、入力信号Eと収音信号B中の検出された有音区間とを用いて処理を行うこともできる。このようにすることで、収音放出間遅延時間差測定部15は、より正確に、測定収音放出間遅延時間差δkmを測定できる。有音区間検出部151は、位置推定装置50−2〜12に追加することもできる。
図20に実施例14の位置推定装置50−14の機能構成例を示す。位置推定装置50−14は、信号発生部14がない点で位置推定装置50−1と異なる。TV会議などで位置推定装置50−14を使用する場合、遠隔地からの音声が受信される。この遠隔地からの音声をスピーカ12の入力信号Eとする。このような構成にすることで、信号発生部14を省略できる。信号発生部14を省略する構成は、位置推定装置50−2〜13にも適用できる。
[実験結果]
図21に、実験を行ったときのマイクロホン、スピーカ、音源の配置を示す。ただし、グループ1とグループ2(破線で囲まれている)は、マイクロホンとスピーカがフレームで固定されており、マイクロホン間の距離(収音手段間距離)、スピーカ間の距離(放出手段間距離)、マイクロホンとスピーカとのの間の距離(収音手段放出手段間距離)は既知である。この配置はTV会議を想定しており、グループ1がテレビカメラなどが設置されているTV会議装置を想定していて、グループ2が収音用のテーブル置きマイクである。図22は実験のグループ1のマイク数、グループ2のマイク数、グループ1のスピーカ数、話者数を示したものである。以下の説明では、(グループ1のマイク数、グループ2のマイク数、グループ1のスピーカ数、話者数)とする。従来技術1〜4は、位置推定装置10を用いた場合であり、従来技術1は(4、0、0、1)、従来技術2は(8、0、0、1)、従来技術3は(4、5、0、1)、従来技術4は(4、4、0、2)である。また、本発明1とは位置推定装置50−2を用いた場合であり、本発明1は(4、4、1、1)、本発明2は(4、4、2、1)である。図23は実験結果を示した折れ線グラフを示す。横軸は、収音間遅延時間差の実測値に含まれる誤差の標準偏差と収音放出手段間遅延時間の実測値に含まれる誤差の標準偏差である。ただし誤差はガウス分布するように与えた。縦軸は位置推定結果の推定誤差であり、誤差が小さいほど高精度な推定が行われているということである。この結果より、どの従来技術よりも本発明の位置推定装置のほうが推定誤差が大幅に小さく、精度良い推定が行われていることが確認できる。
従来の位置推定装置の機能構成例を示す図。 実施例1の位置推定装置の機能構成例を示す図。 位置推定装置の主な処理の流れを示す図。 収音間遅延時間差測定部の機能構成例を示す図。 収音放出間遅延時間差測定部の機能構成例を示す図。 推定部の機能構成例を示す図。 推定部の主な処理の流れを示す図。 実施例2の位置推定装置の機能構成例を示す図。 実施例3の位置推定装置の機能構成例を示す図。 実施例4の位置推定装置の機能構成例を示す図。 実施例5の位置推定装置の機能構成例を示す図。 実施例6の位置推定装置の機能構成例を示す図。 実施例7の位置推定装置の機能構成例を示す図。 実施例8の位置推定装置の推定部の機能構成例を示す図。 実施例9〜11の位置推定装置の機能構成例を示す図。 第1新信号源検出部の機能構成例を示す図。 実施例11の第1新信号源検出部の機能構成例を示す図。 実施例12の位置推定装置の機能構成例を示す図。 実施例13の位置推定装置の機能構成例を示す図。 実施例14の位置推定装置の機能構成例を示す図。 シミュレーションの配置を示す図。 シミュレーションの条件を示す図。 シミュレーション結果を示す図。

Claims (20)

  1. K個(Kは1以上の整数)の放出手段から放出される放出信号とN個(Nは1以上の整数)の信号源から発せられる信号源信号とをM個(Mは2以上の整数)の収音手段が収音したMチャネルの収音信号を用いて、当該Mチャネルの収音信号間の遅延時間差である測定収音間遅延時間差を測定する収音間遅延時間差測定部と、
    前記K個の放出手段に入力されるKチャネルの入力信号と前記Mチャネルの収音信号を用いて、前記Kチャネルの放出信号のそれぞれと前記Mチャネルの収音信号のそれぞれとの間の遅延時間差である測定収音放出間遅延時間差を測定する収音放出間遅延時間差測定部と、
    前記測定収音間遅延時間差と、前記測定収音放出間遅延時間差と、を用いて、前記収音手段の位置、前記放出手段の位置、前記信号源の位置を推定する推定部と、を有する位置推定装置。
  2. 請求項1記載の位置推定装置であって、
    更に、
    同時刻には1チャネルしか存在しない信号を前記入力信号を発生する信号発生部と、を備えることを特徴とする位置推定装置。
  3. 請求項1または2記載の位置推定装置であって、
    固有パラメータが入力される入力部を備え、
    前記推定部は、前記測定収音間遅延時間差と、前記測定収音放出間遅延時間差と、前記固有パラメータと、を用いるものであり、
    前記固有パラメータは、2つの前記収音手段の間の距離である収音手段間距離、2つの前記放出手段の間の距離である放出手段間距離、2つの前記信号源の間の距離である信号源間距離、収音手段と放出手段の間の距離である収音手段放出手段間距離、信号源と収音手段との間の距離である信号源収音手段間距離、信号源と放出手段との間の距離である信号源放出手段間距離、のうち少なくとも1つであることを特徴とする位置推定装置。
  4. 請求項1〜3何れかに記載の位置推定装置であって、
    前記推定部は、
    前記N個の信号源の位置の初期値、前記M個の収音手段の位置の初期値、前記K個の放出手段の位置の初期値、を設定する初期値設定手段と、
    前記測定収音間遅延時間差と、前記測定収音放出間遅延時間差と、を用いて、前記N個の信号源の位置、前記M個の収音手段の位置、前記K個の放出手段の位置、を更新する更新手段と、
    前記N個の信号源の位置の初期値と前記更新された前記N個の信号源の位置とを記憶する信号源位置記憶手段と、
    前記M個の収音手段の位置の初期値と前記更新された前記M個の収音手段の位置とを記憶する収音手段位置記憶手段と、
    前記K個の放出手段の位置の初期値と前記更新された前記K個の放出手段の位置とを記憶する放出手段位置記憶手段と、
    前記更新が終了したと判定すると、前記更新を停止させる判定手段と、
    を有することを特徴とする位置推定装置。
  5. 請求項4記載の位置推定装置であって、
    前記更新手段は、前記収音手段間距離、前記放出手段間距離、前記収音手段放出手段間距離、のうち少なくとも1つに重み係数を乗算したものを用いて、前記更新をするものであり、
    前記推定部は、前記収音手段間距離、前記放出手段間距離、前記収音手段放出手段間距離のうち前記重み係数が乗算されたものが重視されるように、前記更新量の値が小さくなるに従って、前記乗算で用いられる重み係数を大きくする設定手段を有することを特徴とする位置推定装置。
  6. 請求項1〜5何れかに記載の位置推定装置であって、
    更に、
    新たな位置にある音源の前記測定収音間遅延時間差を記憶する収音間遅延時間差記憶部と、
    前記収音間遅延時間差測定部が測定した現在の測定収音間遅延時間差と、前記収音間遅延時間差記憶部に記憶されている過去の測定収音間遅延時間差と、の距離が予め定められた閾値以上もしくは閾値を超えれば、現在の測定収音間遅延時間差についての音源を前記新たな位置にある音源と認定する第1新信号源検出部と、を有し、
    前記推定部は、前記収音間遅延時間差記憶部に記憶されている全ての測定収音間遅延時間差と、前記測定収音放出間遅延時間差とを用いて推定するものであることを特徴とする位置推定装置。
  7. 請求項1〜6何れかに記載の位置推定装置であって、
    更に、
    前記測定収音放出間遅延時間差を記憶する収音放出間遅延時間差記憶部と、
    前記収音放出間遅延時間差測定部が測定した現在の測定収音放出間遅延時間差と、前記収音放出間遅延時間差記憶部に記憶されている過去の測定収音放出間遅延時間差との距離が予め定められた閾値以上もしくは閾値を超えれば、現在の測定収音間遅延時間差についての音源を前記新たな位置にある音源と認定する第2新信号源検出部と、を有し、
    前記推定部は、前記収音放出間遅延時間差記憶部に記憶されている全ての測定収音放出間遅延時間差と、前記測定収音間遅延時間差とを用いて推定するものであることを特徴とする位置推定装置。
  8. 請求項6または7記載の位置推定装置であって、
    前記収音間遅延時間差記憶部と前記収音放出間遅延時間差記憶部のうち少なくとも1つは、記憶する測定収音間遅延時間差の個数もしくは記憶する測定収音放出間遅延時間差の個数について上限を有することを特徴とする位置推定装置。
  9. 請求項1〜8いずれかに記載の位置推定装置であって、
    更に、
    前記収音信号中の有音区間を検出する有音区間検出部を有し、
    前記収音間遅延時間差測定部と前記収音放出間遅延時間差測定部のうち少なくとも一方は、前記有音区間と検出された収音信号について、収音間遅延時間差もしくは、収音放出間遅延時間差を測定するものであることを特徴とする位置推定装置。
  10. K個(Kは1以上の整数)の放出手段から放出される放出信号とN個(Nは1以上の整数)の信号源から発せられる信号源信号とをM個(Mは2以上の整数)の収音手段が収音したMチャネルの収音信号を用いて、当該Mチャネルの収音信号間の遅延時間差である測定収音間遅延時間差を測定する収音間遅延時間差測定過程と、
    前記K個の放出手段に入力されるKチャネルの入力信号と前記Mチャネルの収音信号を用いて、前記Kチャネルの放出信号のそれぞれと前記Mチャネルの収音信号のそれぞれとの間の遅延時間差である測定収音放出間遅延時間差を測定する収音放出間遅延時間差測定過程と、
    前記測定収音間遅延時間差と、前記測定収音放出間遅延時間差と、を用いて、前記収音手段の位置、前記放出手段の位置、前記信号源の位置を推定する推定過程と、を有する位置推定方法。
  11. 請求項10記載の位置推定方法であって、
    更に、
    同時刻には1チャネルしか存在しない信号を前記入力信号を発生する信号発生過程と、を備えることを特徴とする位置推定方法。
  12. 請求項10または11記載の位置推定方法であって、
    固有パラメータが入力される入力過程を備え、
    前記推定過程は、前記測定収音間遅延時間差と、前記測定収音放出間遅延時間差と、前記固有パラメータと、を用いる過程であり、
    前記固有パラメータは、2つの前記収音手段の間の距離である収音手段間距離、2つの前記放出手段の間の距離である放出手段間距離、2つの前記信号源の間の距離である信号源間距離、収音手段と放出手段の間の距離である収音手段放出手段間距離、信号源と収音手段との間の距離である信号源収音手段間距離、信号源と放出手段との間の距離である信号源放出手段間距離、のうち少なくとも1つであることを特徴とする位置推定方法。
  13. 請求項10〜12何れかに記載の位置推定方法であって、
    前記推定過程は、
    前記N個の信号源の位置の初期値、前記M個の収音手段の位置の初期値、前記K個の放出手段の位置の初期値、を設定する初期値設定ステップと、
    前記測定収音間遅延時間差と、前記測定収音放出間遅延時間差と、を用いて、前記N個の信号源の位置、前記M個の収音手段の位置、前記K個の放出手段の位置、を更新する更新ステップと、
    前記N個の信号源の位置の初期値と前記更新された前記N個の信号源の位置とを記憶する信号源位置記憶ステップと、
    前記M個の収音手段の位置の初期値と前記更新された前記M個の収音手段の位置とを記憶する収音手段位置記憶ステップと、
    前記K個の放出手段の位置の初期値と前記更新された前記K個の放出手段の位置とを記憶する放出手段位置記憶ステップと、
    前記更新が終了したと判定すると、前記更新を停止させる判定ステップと、
    を有することを特徴とする位置推定方法。
  14. 請求項13記載の位置推定方法であって、
    前記更新ステップは、前記収音手段間距離、前記放出手段間距離、前記収音手段放出手段間距離、のうち少なくとも1つに重み係数を乗算したものを用いて、前記更新をする過程であり、
    前記推定過程は、
    更に、
    前記収音手段間距離、前記放出手段間距離、前記収音手段放出手段間距離のうち前記重み係数が乗算されたものが重視されるように、前記更新量の値が小さくなるに従って、前記乗算で用いられる重み係数を大きくする設定ステップを有することを特徴とする位置推定方法。
  15. 請求項10〜14何れかに記載の位置推定方法であって、
    更に、
    新たな位置にある音源の前記測定収音間遅延時間差を記憶する収音間遅延時間差記憶過程と、
    前記収音間遅延時間差測定過程で測定された現在の測定収音間遅延時間差と、前記収音間遅延時間差記憶過程で記憶された過去の測定収音間遅延時間差との距離が予め定められた閾値以上もしくは閾値を超えれば、現在の測定収音間遅延時間差についての音源を前記新たな位置にある音源と認定する第1新信号源検出過程と、を有し、
    前記推定過程は、前記収音間遅延時間差記憶過程で記憶された全ての測定収音間遅延時間差と、前記測定収音放出間遅延時間差とを用いて推定する過程であることを特徴とするあることを特徴とする位置推定方法。
  16. 請求項10〜15何れかに記載の位置推定方法であって、
    更に、
    前記測定収音放出間遅延時間差を記憶する収音放出間遅延時間差記憶過程と、
    前記収音放出間遅延時間差測定過程で測定された現在の測定収音放出間遅延時間差と、前記収音放出間遅延時間差記憶部で記憶された過去の測定収音放出間遅延時間差と、の距離が予め定められた閾値以上もしくは閾値を超えれば、現在の測定収音間遅延時間差についての音源を前記新たな位置にある音源と認定する第2新信号源検出過程と、を有し、
    前記推定過程は、前記収音放出間遅延時間差記憶過程で記憶された全ての測定収音放出間遅延時間差と、前記測定収音間遅延時間差とを用いて推定する過程であることを特徴とする位置推定方法。
  17. 請求項15または16記載の位置推定方法であって、
    前記収音間遅延時間差記憶過程と前記収音放出間遅延時間差記憶過程のうち少なくとも1つは、記憶する測定収音間遅延時間差もしくは記憶する測定収音放出間遅延時間差について上限を有することを特徴とする位置推定方法。
  18. 請求項10〜17いずれかに記載の位置推定方法であって、
    更に、
    前記収音信号中の有音区間を検出する有音区間検出過程を有し、
    前記収音間遅延時間差測定部と前記収音放出間遅延時間差測定部のうち少なくとも一方は、前記有音区間と検出された収音信号について、収音間遅延時間差もしくは、収音放出間遅延時間差を測定する過程であることを特徴とする位置推定方法。
  19. 請求項10〜18何れかに記載の位置推定方法の各過程をコンピュータに実行させるための位置推定プログラム。
  20. 請求項19記載の位置推定プログラムを記録したコンピュータ読み取り可能な記録媒体。
JP2007217924A 2007-08-24 2007-08-24 位置推定装置、その方法、そのプログラム、およびその記録媒体 Expired - Fee Related JP5226989B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007217924A JP5226989B2 (ja) 2007-08-24 2007-08-24 位置推定装置、その方法、そのプログラム、およびその記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007217924A JP5226989B2 (ja) 2007-08-24 2007-08-24 位置推定装置、その方法、そのプログラム、およびその記録媒体

Publications (2)

Publication Number Publication Date
JP2009052928A true JP2009052928A (ja) 2009-03-12
JP5226989B2 JP5226989B2 (ja) 2013-07-03

Family

ID=40504147

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007217924A Expired - Fee Related JP5226989B2 (ja) 2007-08-24 2007-08-24 位置推定装置、その方法、そのプログラム、およびその記録媒体

Country Status (1)

Country Link
JP (1) JP5226989B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010252331A (ja) * 2009-04-16 2010-11-04 Advantest Corp 検出装置、算出装置、測定装置、検出方法、算出方法、伝送システム、プログラム、および、記録媒体

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10253745A (ja) * 1997-03-07 1998-09-25 Oki Tec:Kk 話者位置推定方法
JPH11304906A (ja) * 1998-04-20 1999-11-05 Nippon Telegr & Teleph Corp <Ntt> 音源位置推定方法およびそのプログラムを記録した記録媒体
JP2005156250A (ja) * 2003-11-21 2005-06-16 National Institute Of Advanced Industrial & Technology 3次元位置同定処理方法、3次元位置同定処理プログラムおよび3次元位置同定処理プログラムを記録した記録媒体
JP2005181088A (ja) * 2003-12-19 2005-07-07 Advanced Telecommunication Research Institute International モーションキャプチャシステム及びモーションキャプチャ方法
JP2007081455A (ja) * 2005-09-09 2007-03-29 Nippon Telegr & Teleph Corp <Ntt> 音源位置・受音位置推定方法、その装置、そのプログラム、およびその記録媒体

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10253745A (ja) * 1997-03-07 1998-09-25 Oki Tec:Kk 話者位置推定方法
JPH11304906A (ja) * 1998-04-20 1999-11-05 Nippon Telegr & Teleph Corp <Ntt> 音源位置推定方法およびそのプログラムを記録した記録媒体
JP2005156250A (ja) * 2003-11-21 2005-06-16 National Institute Of Advanced Industrial & Technology 3次元位置同定処理方法、3次元位置同定処理プログラムおよび3次元位置同定処理プログラムを記録した記録媒体
JP2005181088A (ja) * 2003-12-19 2005-07-07 Advanced Telecommunication Research Institute International モーションキャプチャシステム及びモーションキャプチャ方法
JP2007081455A (ja) * 2005-09-09 2007-03-29 Nippon Telegr & Teleph Corp <Ntt> 音源位置・受音位置推定方法、その装置、そのプログラム、およびその記録媒体

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010252331A (ja) * 2009-04-16 2010-11-04 Advantest Corp 検出装置、算出装置、測定装置、検出方法、算出方法、伝送システム、プログラム、および、記録媒体

Also Published As

Publication number Publication date
JP5226989B2 (ja) 2013-07-03

Similar Documents

Publication Publication Date Title
JP6335985B2 (ja) マルチセンサ音源定位
JP5702685B2 (ja) 音源方向推定装置及び音源方向推定方法
JP6584930B2 (ja) 情報処理装置、情報処理方法およびプログラム
JP6580990B2 (ja) オーディオ干渉推定のための方法及び装置
JP5724125B2 (ja) 音源定位装置
JP5897343B2 (ja) 残響除去パラメータ推定装置及び方法、残響・エコー除去パラメータ推定装置、残響除去装置、残響・エコー除去装置、並びに、残響除去装置オンライン会議システム
US9378752B2 (en) Sound processing device, sound processing method, and sound processing program
US9668046B2 (en) Noise reduction control device and control method
JP2012512413A (ja) パーティクルフィルタリングを利用した音源位置の推定
JP6078461B2 (ja) 音響処理装置、音響処理方法、及び音響処理プログラム
JP2008236077A (ja) 目的音抽出装置,目的音抽出プログラム
JP4422662B2 (ja) 音源位置・受音位置推定方法、その装置、そのプログラム、およびその記録媒体
JP6888627B2 (ja) 情報処理装置、情報処理方法及びプログラム
JP3878892B2 (ja) 収音方法、収音装置、および収音プログラム
Rabinkin et al. Estimation of wavefront arrival delay using the cross-power spectrum phase technique
JP5226989B2 (ja) 位置推定装置、その方法、そのプログラム、およびその記録媒体
JP5459220B2 (ja) 発話音声検出装置
JP2014194437A (ja) 音声処理装置、音声処理方法および音声処理プログラム
JP2004325127A (ja) 音源検出方法、音源分離方法、およびこれらを実施する装置
JP6361680B2 (ja) 音場制御システム、解析装置、音響装置、音場制御システムの制御方法、解析装置の制御方法、音響装置の制御方法、プログラム、記録媒体
JP3720795B2 (ja) 音源受音位置推定方法、装置、およびプログラム
JP3588576B2 (ja) 収音装置および収音方法
JP5235723B2 (ja) 発話向き推定装置、方法及びプログラム
JP6961545B2 (ja) 音信号処理装置、音信号処理方法、およびプログラム
JP2010206392A (ja) 発話向き推定装置、方法及びプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090729

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20110812

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110914

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120221

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120412

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130305

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130315

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20160322

Year of fee payment: 3

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees