JPH11304906A - 音源位置推定方法およびそのプログラムを記録した記録媒体 - Google Patents

音源位置推定方法およびそのプログラムを記録した記録媒体

Info

Publication number
JPH11304906A
JPH11304906A JP10109738A JP10973898A JPH11304906A JP H11304906 A JPH11304906 A JP H11304906A JP 10109738 A JP10109738 A JP 10109738A JP 10973898 A JP10973898 A JP 10973898A JP H11304906 A JPH11304906 A JP H11304906A
Authority
JP
Japan
Prior art keywords
time difference
microphones
sound source
estimated time
microphone
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP10109738A
Other languages
English (en)
Inventor
Masafumi Tanaka
雅史 田中
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP10109738A priority Critical patent/JPH11304906A/ja
Publication of JPH11304906A publication Critical patent/JPH11304906A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Studio Devices (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Stereophonic Arrangements (AREA)
  • Measurement Of Velocity Or Position Using Acoustic Or Ultrasonic Waves (AREA)

Abstract

(57)【要約】 【課題】 耐雑音性能に優れ、かつ、演算量の少ない音
源位置推定方法およびその記録媒体を提供すること。 【解決手段】 本発明では、複数のマイクロホンで受音
した信号を処理し、音源の位置を推定する方法におい
て、まず、受音信号の相互相関関数を全てのマイクロホ
ンの組について計算し、次に、上記相互相関関数につい
て、基準マイクロホンと他のマイクロホンとの間の相互
相関関数の最大値を与える時間差を求め、これを予備推
定時間差とし、そして、全てのマイクロホンについての
遅延和のパワーを最大にする時間差を上記予備推定時間
差の近傍で探索して、これを推定時間差とし、最後に、
上記推定時間差に基づいて音源位置を計算する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】この方法は、話者自動追従カ
メラ、話者自動追従指向性集音装置等において、複数の
マイクロホン(以下、単に「マイク」と記載する場合あ
り)により受信した信号を用いて音源の位置を推定する
方法およびその記録媒体に関する。
【0002】
【従来の技術】この節では、まず、音源位置推定の原理
を説明し、次に従来の音源位置推定法である遅延和法と
相互相関法について説明し、最後にそれら従来法の問題
点を述べる。
【0003】§1. 予備的説明 まず、音源位置を推定できるための必要条件について説
明する。音源位置を複数のマイクロホンで受音した信号
から推定するということは、基本的には三角形の合同条
件により、空間内に、音源を共通の頂点とした3つ以上
の三角形を同定することに等しい。ここで、個々の三角
形は、二つのマイクロホンを通る直線上に一辺をとり、
その辺に相対する頂点に音源がある。三角形の合同条件
は、三辺相等、二角挟辺相等、そして、二辺挟角相等の
三つである。これら全ての条件は、必ず、一辺の長さが
必要であるが、音源位置推定においては、マイクロホン
の位置関係は既知なので、二つ以上のマイクロホンが通
る直線にこの辺をとる。いま、簡単のために、音源があ
る平面上にある場合について、これらの合同条件と位置
推定の関係を考える。
【0004】三辺相等 この条件は三辺の長さがわかれば、三角形は一意に決ま
るということを意味している。この場合、三角形の頂点
は音源と二つのマイクロホンであり、それらの間の距離
が三辺の長さに対応する。
【0005】二角挟辺相等 この条件は二つの角とそれらに挟まれる辺の長さがわか
れば、三角形が一意に決まるということを意味してい
る。この条件を使う場合、三つのマイクロホンを一直線
に並べ、この直線上に挟辺をとり、挟辺の二つの端点を
中央のマイクロホンとその左右のマイクロホンの中点と
考える。また、残りの頂点は音源である。そうすると、
条件中の二角は、右と中央のマイクロホン、と、左と中
央のマイクロホンから音源を見込む角度になる。
【0006】二辺挟角相等 この条件は二辺とその二辺に挟まれた角がわかれば、三
角形が一意に決まるということを意味している。二辺の
うち、一辺は二つのマイクロホンを結ぶ直線上にとり、
その端点は二つのマイクロホンの中点と片方のマイクロ
ホンである。もう一辺は、音源とマイクロホンの中点を
端点とするものである。
【0007】次に、従来法の説明に必要となる記号の定
義等を行う。図4は複数のマイクロホンにより音波を受
音する様子を説明する図であって、11は音源を、12
−1〜12−Mはマイクロホンを、13はA/D変換器
を、s(k)は時刻kの音源信号を、Mはマイクロホン
の総数を、d(m)、(m=1,2,...,M)は音源
とm番目のマイクロホンの間の距離を、また、x(m,
k)は時刻kでのm番目のマイクロホンの受音信号を表
わす。本明細書では、時間(時刻)の表現は離散時間と
して、整数kで時間を表わすものとする。通常、音源か
らマイクロホンに直接到達する音の他に、壁、床等に反
射した後にマイクロホンに達する反射音が存在するが、
説明を簡単にするために図4の説明では直接音のみを考
慮する。また、マイクロホン12−1〜12−Mの位置
は既知であるとする。
【0008】さて、音速をサンプリング周波数で除した
量を正規化音速と呼び、cで表わすと、時刻kでのm番
目のマイクロホンの受音信号x(m,k)はd(m)/
c時間前の音源信号に等しいので、次の式(1)が成立
する。 x(m,k)=s(k−d(m)/c) ・・・(1)
【0009】この式(1)は、音源とマイクロホンの距
離が音源信号とマイクロホンでの受音信号の時間差に変
換されることを示している。つまり、時間差が分かれ
ば、音源までの距離が分かり、距離から音源の位置が知
られる。また、ある基準になるマイクロホン(本明細書
ではマイクロホン12−1)を決め、そのマイクロホン
の受音信号を遅れた音源信号とすれば、 x(m,k)=s(k−d(m)/c) =s(k−d(m)/c+d(1)/c−d(1)/c) =s(k−d(1)/c−(d(m)−d(1))/c) =x(1,k−(d(m)−d(1))/c) ・・・(2) とかける。式(1)では、音源信号と各々のマイクロホ
ンの受音信号の時間差が未知数であったが、式(2)で
は、マイクロホン1と音源の時間差と、マイクロホン1
と他のマイクロホンとの時間差が未知数である。
【0010】図5は二つのマイクロホンに平面波が入射
する様子を示しており、二つのマイクロホンの信号の時
間差が幾何的に何を意味しているかを説明するものであ
る。図5において、破線21は音波の等位相面を表わ
し、入射音波がまずマイクロホン12−1に、遅れてマ
イクロホン12−2に到達する様子を描いている。図5
より、次式(3)のように、音波の到達時間差はマイク
ロホンの間隔と入射角度θの余角の積を正規化音速で除
したものになる。 音波到達時間差=マイクロホン間隔cos(θ)/c ・・・(3) 式(3)を変形すると、 θ=arccos(c音波到達時間差/マイクロホン間隔) ・・・(4) となる。従って、音波到達時間差とマイクロホン間隔が
分かると入射角θが計算できることがわかる。
【0011】§2.従来の音源位置推定法 音源位置の推定法には、様々あるが、本明細書では、そ
の中でも最も簡単な部類に属する二つの方法、遅延和法
と相互相関法を説明する。
【0012】(従来法1)遅延和法 遅延和法は先の分類によれば、三辺相等を利用する方式
である。あらかじめ、音源がありそうな位置を複数個仮
定しておき、その中である規範に尤もよく適合したもの
を音源位置とする。規範の計算には、マイクロホンと音
源の間の距離そのものではなく、基準マイクロホンと他
のマイクロホンの音波到来の時間差を使用する。式
(2)によると、すべてのマイクロホンでの受音信号は
基準マイクロホンの受音信号が時間的にずれたものであ
る。これらの信号を遅らせたり、進ませたりした後に加
算した信号を考えると、その加算した信号のパワーが最
大となるのは、マイクロホンm(m=1,2,...,
M)の信号を(d(m)−d(1))/cだけ進ませ
(または、(d(1)−d(m))/cだけ遅らせ)、
すべてのマイクロホンの信号がx(1,k)と同位相に
なる場合である。実際には、信号を進ませることはでき
ないから、x(1,k)をDsup(>d(m)−d
(1))だけ遅らせたx(1,k−Dsup/c)と同位
相になるように、すべてのマイクロホンの信号を遅らせ
る。このように、遅延和法は、受音信号を遅延し加算し
た信号のパワーを規範とし、その値を適合度とし、受音
した信号に対して、用意しておいた遅延を適用して、最
大の加算信号パワーを与えた遅延の組に対応する位置を
音源位置とする。以下により具体的な位置推定手順を説
明する。
【0013】図6は遅延和法の信号の流れを説明する図
であって、31は遅延器を、32は加算器を、D(i,
m)、(i=1,2,…,I)は次式(5)で定義され
るように、i番目の音源仮定位置に音源がある場合に全
てのマイクロホンの信号が同相になるようなm番目のマ
イクロホンの遅延量を、Iはあらかじめ仮定した音源位
置の数を、y(i,k)は遅延D(i,m)に対応した
加算器の出力信号を表わし、遅延和と呼ぶ。 D(m,i)=Dsup+d(i,m)/c ・・・(5) ただし、d(i,m)は、i番目の音源仮定位置とマイ
クロホンmの距離である。
【0014】マイクロホン12で受音された信号x
(m,k)は遅延器31でD(i,m)だけ遅延させら
れた後、加算器32で加算され、出力信号y(i,k)
となる。この出力信号y(i,k)は、次式(6)で計
算される。 y(i,k)=Σx(m,k−D(i,m)) ・・・(6) ただし、Σはマイクロホン番号mに関するものである。
推定音源位置は、
【数1】 となるiに対応する位置である。ただし、
【数2】 はaの二乗を、E[a]はaの平均をとることを意味す
る。これらの計算手順を図7に示す。
【0015】(従来法2)相互相関法 相互相関法は先の分類によれば、二角挟辺相等を利用す
る方式である。相互相関法では、基準マイクロホンと他
のマイクロホンの信号との時間差を相互相関関数の最大
値を与える時間差とみなし、その時間差とマイクロホン
間隔から入射角を得る。基準マイクロホン12−1とマ
イクロホン12−mの信号の相互相関関数r(τ,m)
は次式(8)で定義される。 r(τ,1,m)=E[x(1,k)x(m,k+τ)]・・・(8) マイクロホン間隔/正規化音速以上の時間差が生じるこ
とはないので、時間差τが、−(マイクロホン間隔/正
規化音速)から+(マイクロホン間隔/正規化音速)ま
での範囲で相互相関関数を求める。雑音が無ければ、相
互相関関数はτ(m)=(d(m)−d(1))/cの
ときに最大値
【数3】 をとるので、相互相関関数の最大値を与える時間差をマ
イクロホン間の音波到来時間差とみなすことができる。
相互相関法を使う時には、特別なマイクロホンの配置を
選び、音源位置が簡単に計算できるようにする。例え
ば、一般に三角法と呼ばれている方法を図8で説明す
る。三角法では図8にあるように、三つのマイクロホン
を一直線上に配置する。マイクロホン12−1を基準マ
イクロホンとし、基準マイクロホンとマイクロホン12
−2,12−3の信号の遅れ時間を相互相関関数から決
定し、次に、式(4)より、この二つの遅れ時間から、
それぞれ、マイクロホン12−1,12−2に関する音
源からの音波の入射角θ2と、マイクロホン12−1,
12−3に関する入射角θ3を計算する。すると、音
源、マイクロホン12−1と12−2の中点、マイクロ
ホン12−1と12−3の中点を結んでできる三角形は
二角とその挟辺が決定するので、一意に三角形が決定さ
れ、音源位置が決定する。以上の手順を図9に示す。
【0016】§3.従来法間の比較 従来法である遅延和法と相互相関法について、演算量と
耐雑音性能について比較する。まず、平均操作を除いた
演算量を比較する。遅延和法の主な計算は式(6)の遅
延和y(i,k)、(i=1,2,...,I)を計算す
る部分であるから、演算量は、マイクロホンの数Mと仮
定した音源位置の数Iの積と見積もられる。一方、相互
相関法では、計算の主要部分は、式(8)であり、その
演算量は(マイクロホンの数−1)と、平均的マイクロ
ホン間隔を正規化音速で除したものと、の積の二倍程度
と見積もられる。この二つの方法の演算量を比較する
と、どちらも、ほぼ、マイクロホンの数に比例する点は
同じであり、相違点は、遅延和法では、仮定した音源位
置数Iに、相互相関法では、マイクロホン間隔を正規化
音速で除した数に比例する点である。
【0017】仮定する音源位置数は、用途によっても異
なるが、話者の位置にカメラを向けたり、話者の音声を
選択的に集音する用途では、高い位置の分解能が要求さ
れるので、数千から数万になる。例えば、話者追従カメ
ラの場合、カメラを中心として、水平角を1度の分解能
で120度の範囲、仰角を1度の分解能で30度の範
囲、距離を50cmの分解能で5mの範囲で話者の位置
を探索すると、およそI=120×30×(5/0.
5)=36000となる。
【0018】他方、相互相関法のマイクロホン間隔を正
規化音速で除した数は、高々100程度である。例え
ば、マイクロホンの間隔が50cmで、サンプリング周
波数が16kHz、音速が340m/sのとき、2*
0.5/(340/16000)=47である。以上よ
り、遅延和法の演算量は相互相関法の演算量の100か
ら1000倍であることがわかる。
【0019】次に、耐雑音性能を比較する。図4では考
慮しなかったが、実際に音源位置の推定を行う場合に
は、部屋の残響や暗騒音が存在し位置推定性能が劣化す
る。これら音源からの直接音以外をまとめて雑音とし
て、n(m,k)と表わすと、改めて、マイクロホンm
の時刻kでの受音信号は、 x(m,k)=s(k−d(m)/c)+n(m,k) ・・・(9) と、表わすことができる。
【0020】雑音耐性は、マイクロホン配置や音源の周
波数帯域にも依存するので、一概には言いにくいが、こ
こでは、正しくマイクロホンの遅延時間を設定したとき
の、式(6)のyと式(8)のrにおける音源信号sの
パワーとそれ以外の成分の絶対値の比で議論することと
する。遅延和法の場合、式(6)において、D(i,
m)=Dsup−d(m)/cとすると、音源信号sが次
式(10)のように同相になる。
【数4】
【0021】このとき、遅延和のパワー
【数5】 は、
【数6】 と、かける。ただし、
【数7】 は音源信号sのパワーであり、2行目第4項のΣΣはマ
イクロホン番号m、m’(m≠m’)に関するものであ
り、それ以外のΣはmに関するものである。
【0022】上式(11)の右辺について、詳しくみて
いく。まず、第1項は音源信号のパワーを
【数8】 倍したものであり、雑音がなければ、この項だけしか現
れない。第2項は音源信号と雑音の相関を意味してい
る。雑音の中には残響など、音源と相関のある成分があ
り、この相関の平均値E[s(k−Dsup)n(m,k
−D(i,m))]をηsnと表わす。第3項は各マイ
クロホンの雑音のパワーの和を意味する項である。各マ
イクロホンの雑音のパワーは、音源位置i=1,
2,...,Iに関して一定であるので、第3項は位置の
推定には影響を与えない。最後に、第4項は雑音の相互
相関の平均を意味しており、これをηnnと表わす。
【0023】以上の議論を踏まえて、式(11)右辺の
意味のある部分は、次のように書き直すことができる。
【数9】 従って、
【数10】 中の音源信号sのパワーとそれ以外の絶対値の比は、
【数11】 となる。ただし、abs(x)はxの絶対値を表わす。
この式(13)から、マイクロホンの個数Mに比例して
音源信号sのパワーの比率が大きくなっていくことがわ
かる。
【0024】他方、相互相関法では、r(τ,1,m)
において、雑音が存在しない場合にはτ=(d(m)−
d(1))/cのときに、sが同相になり、rが最大に
なった。雑音がある状況下で、τ=(d(m)−d
(1))/cのときのrは、
【数12】 となる。遅延和法と同様に、
【数13】 となり、r中の音源信号sのパワーとそれ以外の絶対値
の比は、
【数14】 となる。この値はマイクロホンの数Mには依存せず、M
=2の場合の遅延和法と同じ値である。従って、遅延和
法と相互相関法を比較すると、遅延和法の方がマイクロ
ホンの数M/2だけ、音源信号sの比率が大きく、雑音
耐性に優れていることがわかる。
【0025】
【発明が解決しようとする課題】以上説明したように、
従来法の遅延和法では、演算量が多いという問題点があ
り、また、相互相関法は、遅延和法に比べて耐雑音性能
が劣るという問題点がある。この発明は、相互相関法に
より音源位置を予備推定して音源位置探索範囲を狭める
ことによって、遅延和法の上記問題を解決し、耐雑音性
能を保ったままで、遅延和法と同一の音源位置推定性能
を得ることを可能にするものである。
【0026】
【課題を解決するための手段】この発明によれば、複数
のマイクロホンで受音した信号を処理し、音源の位置を
推定する方法において、上記受音信号の相互相関関数を
全てのマイクロホンの組について計算する第1ステップ
と、上記相互相関関数について、基準マイクロホンと他
のマイクロホンとの間の相互相関関数の最大値を与える
時間差を求め、これを予備推定時間差とする第2ステッ
プと、全てのマイクロホンについての遅延和のパワーを
最大にする時間差を上記予備推定時間差の近傍で探索し
て、これを推定時間差とする第3ステップと、上記推定
時間差に基づいて音源位置を計算する第4ステップとを
具備することを特徴とする。
【0027】
【発明の実施の形態】以下にこの発明を詳細に説明す
る。説明の出発点として、遅延和法の計算式を再掲す
る。この計算式は、
【数15】 と展開できる。ただし、2行目第2項のΣΣはマイクロ
ホン番号m、m’(m≠m’)に関するものであり、そ
れ以外のΣはmに関するものである。式(19)におい
て、右辺第1項はm番目のマイクロホンの信号のパワー
であり、音源位置iに関して共通であり、
【数16】 の最大値をみつける式(18)の結果に影響しないので
計算の必要はない。
【0028】また、右辺第2項はM(M−1)/2個の
相互相関関数の和であり、個々の相互相関関数E[x
(m,k−D(i,m))x(m’,k−D(i,
m’))]は音源位置iを変化させたときにD(i,
m)−D(i,m’)がとりうる範囲、即ち、最大で
も、−(マイクロホンmとm’との間の距離/正規化音
速)から+(マイクロホンmとm’との間の距離/正規
化音速)までの範囲、で計算しておけば、その中に必ず
存在する。このように、
【数17】 は相互相関関数の和で評価できることがわかる。
【0029】さて、遅延和法の演算量が多い原因は、十
分な性能を得るために、仮定する音源位置の数が多くな
るというところにあった。そこで、この発明では、その
問題を解決するために、まず、相互相関関数によってマ
イクロホン間の時間差を推定することで、時間差(つま
り音源位置)を大まかに推定し、次に、その時間差の近
傍で遅延和法と同じように遅延和のパワー
【数18】 を最大にする時間差を探索する。最後に、求められた時
間差から位置を逆算する。
【0030】具体的には、 手順1:相互相関関数を計算する。 手順2:相互相関法により、マイクロホン12−1とマ
イクロホン12−mとの間の音波の到来時間差を推定す
る。マイクロホン12−1とマイクロホン12−mの時
間差をτ(m)と表わすことにする。 手順3:手順2で求めた遅延時間の近傍、 τ(m)−δτ(m)≦t(m)≦τ(m)+δτ(m) (但し、δτ(m)>0) ・・・(20) で、次式(21)を最大にするt(m)を探索する。δ
τの典型的な値は1から5の間である。 ΣΣE[x(m,k−t(m))x(m’,k−t(m’))] ・・・(21) 手順4:手順3で求められた音波到来時間差t(m)に
基づいて、音源位置を求める。この時間差と位置の変換
は、相互相関法で説明した三角法や位置に関する連立方
程式を立てて、それを解くことで行う。
【0031】以上の手順を図1に示す。なお、本発明の
実行手段は、一例として、後述する音源位置推定部71
0(図2,3参照)として構成される。この音源位置推
定部710は、具体的には、CPU(中央処理装置)お
よびその周辺回路からなるコンピュータ装置である。ま
た、図1に示す手順は、音源位置推定部710内におい
て、制御プログラムとして、半導体メモリ(ROM,R
AM等)またはその他の記録媒体(磁気ディスク等)に
格納されている。そして、音源位置推定部710のCP
Uは、上記制御プログラムに基づいて、本発明による音
源位置推定方法を実行する。
【0032】式(21)は式(19)の右辺第2項にお
いて、係数の2を省き、D(i,m)とD(i,m’)
をそれぞれ、t(m)とt(m’)に置き換えた式であ
る。式(19)では、仮定音源位置iが変数であった
が、式(21)では、遅延時間t(m)が変数となる。
従来法の比較でも述べたように、仮定音源位置の個数は
数千から数万である。一方、式(21)では、遅延時間
の個数は
【数19】 で、M=4程度では、高々数千である。
【0033】この発明の演算量と耐雑音性能について述
べる。この発明の演算量を見積もると、まず、手順1で
の相互相関関数の計算に、M(M−1)倍と平均的マイ
クロホン間隔を正規化音速で除したものとの積程度の演
算が必要である。また、音源位置推定のために、手順2
〜4を実行するが、これには、およそ
【数20】 の演算が必要である。この演算量を遅延和法のそれと比
較してみる。例えば、M=4、δτ(m)=2、他の条
件は「§3.従来法間の比較」の例と同じ場合、遅延和
法では、36000M=14000、この発明では、
【数21】 であり、遅延和法の約100分の1である。耐雑音性能
については、この発明は遅延和法と同じく遅延和のパワ
ーを評価しているので、遅延和法と同一の耐雑音性能が
あり、相互相関法より優れている。
【0034】以下には、この発明の実施にあたっての補
足事項を述べる。 相互相関関数などで、時間差はサンプリング周波数
の逆数を一単位とする整数時間として説明してきたが、
整数時間では十分な分解能が得られない場合がある。こ
のような場合には、相互相関関数を補間して、手順2、
3を繰り返す。補間するには、補間する相互相関の値の
周りの相互相関の値も必要となるので、相互相関を計算
する範囲を補間の際に使用するぶんだけ伸ばす必要があ
る。
【0035】 この発明の演算量に大きく寄与してい
るのが
【数22】 である。手順2で、より正確なτ(m)が求まれば、δ
τ(m)を小さく選べるので演算量を低減できる。手順
2でより正確なτ(m)を求めるために、基準マイクロ
ホン以外のマイクロホンを2つ以上のグループに分け
て、その各々のグループと基準マイクロホンで、遅延和
法やこの発明の手順2、3を用いることができる。
【0036】 約300〜500Hz以下の周波数の
音波は、波長が長いために、それ以上の周波数の音波に
比べて、同じ到来時間差でも振幅の変化が小さく、故
に、方向推定に有用な情報が少ない。それにも関わら
ず、音源(音声)は、この帯域でパワーが大きく、か
つ、減衰時間の長い部屋の低次の共振周波数と重なるの
で、鳴き竜現象と同様に、壁や天井など音源以外の方向
から到来する反射音波が増加し、音源方向推定誤差につ
ながる。以上の理由によって、相互相関関数の計算に利
用する信号の周波数帯域は約300〜500Hz以上と
する。
【0037】以上、この発明の実施形態を図面を参照し
て詳述してきたが、具体的な構成はこの実施形態に限ら
れるものではなく、この発明の要旨を逸脱しない範囲の
設計の変更等があってもこの発明に含まれる。
【0038】
【実施例】第1の実施例は、話者自動追従指向性集音装
置である。図2にこの発明の方法を適用した話者自動追
従指向性装置の機能構成を示す。入力信号x(k,m)
として音声信号が音源位置推定部710と遅延器31に
供給され、遅延器31の出力は荷重720で振幅を変化
させられた後に加算器32で加算され、話者自動追従指
向性集音装置の出力y(k)となる。音源位置推定部7
10は音源の位置を推定し、得られた推定音源位置を遅
延・荷重計算部730に送り、遅延・荷重計算部730
は、出力y(k)の信号対雑音比が最大になるように、
遅延時間と荷重を決定する。
【0039】話者自動追従指向性集音装置はテレビ会議
システム等の拡声通話形において、話者の音声だけを選
択的に集音するための装置である。従来の机上のマイク
ロホンでは、邪魔になる、机と紙やペンとが衝突す
る音などの不快な音が混入しやすい、という問題があ
り、壁、天井、ディスプレイの周囲などに配置したマイ
クロホンによる集音が求められている。この際、マイク
ロホンが話者から離れることにより、マイクロホン一つ
当たりの信号対雑音比が低滅する。これを補うために複
数のマイクロホンで受音し、それらの信号を適切に遅
延、重み付けして加算することが必要となり、その適切
な遅延時間と荷重を求めるために音源位置を推定する必
要がある。
【0040】このとき、推定音源位置が不正確だと、出
力音声の高域のパワーが低下し、こもった感じのする音
になるという問題が生じるので、より正確な音源位置推
定が必要とされる。この発明によれば、従来法である遅
延和法に対しては、演算量が格段に少なく、同じ処理装
置ならば、より分解能を高くすることができるので、よ
り正確な音源位置の推定が行える。また、同じく従来法
である相互相関法により、優れた耐雑音性能を有するの
で、より正確な音源位置推定が行える。その結果とし
て、この発明の方法を用いることで従来法を用いるより
高品質の音声が受音できる。
【0041】第2の実施例は話者自動追従ビデオカメラ
である。図3にこの発明の方法を適用した話者自動追従
ビデオカメラの機能構成を示す。入力信号x(k,m)
として音声信号が音源位置推定部710に供給され、音
源位置推定部710は音源の位置を推定し、得られた推
定音源位置をカメラ制御部810に送り、カメラ制御部
810はビデオカメラ820に制御信号を出し、その制
御信号に応じてビデオカメラ820が水平角、仰角やズ
ームを変更する。
【0042】話者自動追従ビデオカメラはテレビ会議シ
ステム等において、自動的に話者をビデオカメラの視野
に適切に収めるための装置である。複数の人との会議
で、従来の固定式のビデオカメラでは、話者が誰なのか
がわからないことが有るという問題がある。また、人が
ビデオカメラを操作する場合には、手間が必要であると
いう問題がある。このような理由から、自動的に話者に
追従するビデオカメラが必要とされている。人をビデオ
カメラの視野に適切に収めるには、音源位置を高い精度
で知ることが要求される。推定音源位置が不正確だと、
画面からはみ出したり、ズームを引きすぎて話者の映像
が小さすぎたりし、目的を果たせないという問題が生じ
る。
【0043】この発明によれば、従来法である遅延和法
に対しては、演算量が格段に少なく、同じ処理装置なら
ば、より分解能を高くすることができるので、より正確
な音源位置の推定が行える。また、同じく従来法である
相互相関法により、優れた耐雑音性能を有するので、よ
り正確な音源位置推定が行える。その結果、この発明の
方法を用いることで、従来法を用いるより適切に話者を
ビデオカメラの視野に収めることができる。
【0044】第3の実施例は、異常音自動追尾監視カメ
ラである。この実施例は、第2の実施例において話者が
異常音発生源に置き換わったものなので、詳細は略す。
【0045】
【発明の効果】この発明により、従来法である遅延和法
と比べ、音源推定精度を保ったまま、演算量を低減でき
るという効果が生じる。言い換えると、同じ演算装置が
与えられた場合、この発明により、より分解能をあげる
ことで正確な位置推定ができ、音源探索範囲を広げられ
るという効果が生じる。
【図面の簡単な説明】
【図1】 本発明の一実施形態による音源位置推定方法
の手順を示すフローチャートである。
【図2】 本発明の第1実施例による話者自動追従指向
性集音装置の構成を示すブロック図である。
【図3】 本発明の第2実施例による話者自動追従ビデ
オカメラの構成を示すブロック図である。
【図4】 複数のマイクロホンを用いて音波を受音する
場合の一例を示す説明図である。
【図5】 2つのマイクロホンに音波が到達する際の到
達時間差を示す説明図である。
【図6】 遅延和法を用いた場合の信号を流れを示す説
明図である。
【図7】 遅延和法の手順を示すフローチャートであ
る。
【図8】 三角法の原理を示す説明図である。
【図9】 相互相関法の手順を示すフローチャートであ
る。
【符号の説明】
11……音源 12−1,12−2,12−m,12−M……マイクロ
ホン(マイク) 13……A/D変換器

Claims (6)

    【特許請求の範囲】
  1. 【請求項1】 複数のマイクロホンで受音した信号を処
    理し、音源の位置を推定する方法において、 上記受音信号の相互相関関数を全てのマイクロホンの組
    について計算する第1ステップと、 上記相互相関関数について、基準マイクロホンと他のマ
    イクロホンとの間の相互相関関数の最大値を与える時間
    差を求め、これを予備推定時間差とする第2ステップ
    と、 全てのマイクロホンについての遅延和のパワーを最大に
    する時間差を上記予備推定時間差の近傍で探索して、こ
    れを推定時間差とする第3ステップと、 上記推定時間差に基づいて音源位置を計算する第4ステ
    ップとを具備することを特徴とする音源位置推定方法。
  2. 【請求項2】 複数のマイクロホンで受音した信号を処
    理し、音源の位置を推定する方法において、 上記受音信号の相互相関関数を全てのマイクロホンの組
    について計算する第1ステップと、 基準マイクロホンと一部の他のマイクロホンについての
    遅延和が最大になる時間差を遅延和法により求め、これ
    を予備推定時間差とする第2ステップと、 全てのマイクロホンについての遅延和のパワーを最大に
    する時間差を上記予備推定時間差の近傍で探索して、こ
    れを推定時間差とする第3ステップと、 上記推定時間差に基づいて音源位置を計算する第4ステ
    ップとを具備することを特徴とする音源位置推定方法。
  3. 【請求項3】 複数のマイクロホンで受音した信号を処
    理し、音源の位置を推定する方法において、 上記受音信号の相互相関関数を全てのマイクロホンの組
    について計算する第1ステップと、 上記相互相関関数について、基準マイクロホンと一部の
    他のマイクロホンとの間の相互相関関数の最大値を与え
    る時間差を求め、これを第1予備推定時間差とする第2
    ステップと、 基準マイクロホンと一部の他のマイクロホンについての
    遅延和のパワーを最大にする時間差を上記第1予備推定
    時間差の近傍で探索して、これを第2予備推定時間差と
    する第3ステップと、 全てのマイクロホンについての遅延和のパワーを最大に
    する時間差を上記第2予備推定時間差の近傍で探索し
    て、これを推定時間差とする第4ステップと、 上記推定時間差に基づいて音源位置を計算する第5ステ
    ップとを具備することを特徴とする音源位置推定方法。
  4. 【請求項4】 複数のマイクロホンで受音した信号を処
    理し、音源の位置を推定するプログラムを記録した記録
    媒体であって、 コンピュータに、 上記受音信号の相互相関関数を全てのマイクロホンの組
    について計算する第1ステップと、 上記相互相関関数について、基準マイクロホンと他のマ
    イクロホンとの間の相互相関関数の最大値を与える時間
    差を求め、これを予備推定時間差とする第2ステップ
    と、 全てのマイクロホンについての遅延和のパワーを最大に
    する時間差を上記予備推定時間差の近傍で探索して、こ
    れを推定時間差とする第3ステップと、 上記推定時間差に基づいて音源位置を計算する第4ステ
    ップとを実行させるためのプログラムを記録した記録媒
    体。
  5. 【請求項5】 複数のマイクロホンで受音した信号を処
    理し、音源の位置を推定するプログラムを記録した記録
    媒体であって、 コンピュータに、 上記受音信号の相互相関関数を全てのマイクロホンの組
    について計算する第1ステップと、 基準マイクロホンと一部の他のマイクロホンについての
    遅延和が最大になる時間差を遅延和法により求め、これ
    を予備推定時間差とする第2ステップと、 全てのマイクロホンについての遅延和のパワーを最大に
    する時間差を上記予備推定時間差の近傍で探索して、こ
    れを推定時間差とする第3ステップと、 上記推定時間差に基づいて音源位置を計算する第4ステ
    ップとを実行させるためのプログラムを記録した記録媒
    体。
  6. 【請求項6】 複数のマイクロホンで受音した信号を処
    理し、音源の位置を推定するプログラムを記録した記録
    媒体であって、 コンピュータに、 上記受音信号の相互相関関数を全てのマイクロホンの組
    について計算する第1ステップと、 上記相互相関関数について、基準マイクロホンと一部の
    他のマイクロホンとの間の相互相関関数の最大値を与え
    る時間差を求め、これを第1予備推定時間差とする第2
    ステップと、 基準マイクロホンと一部の他のマイクロホンについての
    遅延和のパワーを最大にする時間差を上記第1予備推定
    時間差の近傍で探索して、これを第2予備推定時間差と
    する第3ステップと、 全てのマイクロホンについての遅延和のパワーを最大に
    する時間差を上記第2予備推定時間差の近傍で探索し
    て、これを推定時間差とする第4ステップと、 上記推定時間差に基づいて音源位置を計算する第5ステ
    ップとを実行させるためのプログラムを記録した記録媒
    体。
JP10109738A 1998-04-20 1998-04-20 音源位置推定方法およびそのプログラムを記録した記録媒体 Pending JPH11304906A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP10109738A JPH11304906A (ja) 1998-04-20 1998-04-20 音源位置推定方法およびそのプログラムを記録した記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP10109738A JPH11304906A (ja) 1998-04-20 1998-04-20 音源位置推定方法およびそのプログラムを記録した記録媒体

Publications (1)

Publication Number Publication Date
JPH11304906A true JPH11304906A (ja) 1999-11-05

Family

ID=14518006

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10109738A Pending JPH11304906A (ja) 1998-04-20 1998-04-20 音源位置推定方法およびそのプログラムを記録した記録媒体

Country Status (1)

Country Link
JP (1) JPH11304906A (ja)

Cited By (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000341658A (ja) * 1999-05-27 2000-12-08 Nec Eng Ltd 話者方向検出システム
WO2002008782A1 (de) * 2000-07-20 2002-01-31 Robert Bosch Gmbh Verfahren zur akustischen ortung von personen in einem detektionsraum
JP2003043143A (ja) * 2001-07-31 2003-02-13 Amano Corp 車両等の検出装置
JP2003514412A (ja) * 1999-11-05 2003-04-15 ウェーブメーカーズ・インコーポレーテッド 音源が一対のマイクロフォンから近いか遠いかを判断する方法
KR20030046727A (ko) * 2001-12-06 2003-06-18 박규식 서브밴드 씨피에스피 알고리듬을 이용한 음원위치추정방법및 그 시스템
JP2004086541A (ja) * 2002-08-27 2004-03-18 P To Pa:Kk 回答文検索装置、回答文検索方法及びプログラム
JP2004086542A (ja) * 2002-08-27 2004-03-18 P To Pa:Kk 回答文検索装置、回答文検索方法及びプログラム
JP2004126941A (ja) * 2002-10-02 2004-04-22 P To Pa:Kk 画像表示装置、画像表示方法及びプログラム
JP2004126784A (ja) * 2002-09-30 2004-04-22 P To Pa:Kk 画像表示装置、画像表示方法及びプログラム
JP2004257877A (ja) * 2003-02-26 2004-09-16 Seiko Epson Corp 音源検出方法、音源検出装置及びロボット
JP2005077205A (ja) * 2003-08-29 2005-03-24 Advanced Telecommunication Research Institute International 音源方向推定装置、信号の時間遅延推定装置及びコンピュータプログラム
JP2005136709A (ja) * 2003-10-30 2005-05-26 Nippon Telegr & Teleph Corp <Ntt> 収音方法、装置、プログラム、および記録媒体
WO2007052726A1 (ja) * 2005-11-02 2007-05-10 Yamaha Corporation 遠隔会議装置
JP2008259000A (ja) * 2007-04-06 2008-10-23 Sony Corp テレビ会議装置、制御方法、およびプログラム
JP2008543196A (ja) * 2005-06-03 2008-11-27 フランス テレコム 視野方向の動きを制御する方法及び装置、ビデオ会議システム、端末、並びに、この方法を実装するプログラム
JP2009052928A (ja) * 2007-08-24 2009-03-12 Nippon Telegr & Teleph Corp <Ntt> 位置推定装置、その方法、そのプログラム、およびその記録媒体
WO2009075085A1 (ja) * 2007-12-10 2009-06-18 Panasonic Corporation 収音装置、収音方法、収音プログラム、および集積回路
JP2010071757A (ja) * 2008-09-17 2010-04-02 Furukawa Co Ltd 測位装置および測位方法
JP2010517047A (ja) * 2007-01-26 2010-05-20 マイクロソフト コーポレーション マルチセンサ音源定位
ES2343931A1 (es) * 2008-09-25 2010-08-12 Universitat Politecnica De Catalunya Sistema para la medida de ruido y localizacion de una fuente movil en presencia de ruido de fondo.
JP2011517547A (ja) * 2008-04-07 2011-06-09 ドルビー・ラボラトリーズ・ライセンシング・コーポレーション マイクロホン配列からのサラウンド・サウンド生成
JP2013121078A (ja) * 2011-12-07 2013-06-17 Fuji Xerox Co Ltd 対面角度出力装置、対面角度出力システムおよびプログラム
US8634547B2 (en) 2009-05-13 2014-01-21 Oki Electric Industry Co., Ltd. Echo canceller operative in response to fluctuation on echo path
US20140163671A1 (en) * 2011-04-01 2014-06-12 W. L. Gore & Associates, Inc. Leaflet and valve apparatus
WO2014113739A1 (en) * 2013-01-18 2014-07-24 Syracuse University Spatial localization of intermittent noise sources by acoustic antennae
CN104360315A (zh) * 2014-10-16 2015-02-18 河北工业大学 基于LabVIEW的麦克风阵列声源定位方法及装置
WO2017216999A1 (ja) * 2016-06-15 2017-12-21 日本電気株式会社 波源方向推定装置、波源方向推定システム、波源方向推定方法および波源方向推定プログラム
CN109192213A (zh) * 2018-08-21 2019-01-11 平安科技(深圳)有限公司 庭审语音实时转写方法、装置、计算机设备及存储介质
CN112104810A (zh) * 2020-07-28 2020-12-18 苏州触达信息技术有限公司 全景拍照装置、全景拍照方法和计算机可读存储介质
CN112649788A (zh) * 2020-12-30 2021-04-13 华东理工大学 可适应运动声源的分布式汽车鸣笛声源实时快速定位方法、***、装置、处理器及存储介质

Cited By (39)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000341658A (ja) * 1999-05-27 2000-12-08 Nec Eng Ltd 話者方向検出システム
JP2003514412A (ja) * 1999-11-05 2003-04-15 ウェーブメーカーズ・インコーポレーテッド 音源が一対のマイクロフォンから近いか遠いかを判断する方法
US7224809B2 (en) 2000-07-20 2007-05-29 Robert Bosch Gmbh Method for the acoustic localization of persons in an area of detection
WO2002008782A1 (de) * 2000-07-20 2002-01-31 Robert Bosch Gmbh Verfahren zur akustischen ortung von personen in einem detektionsraum
JP2003043143A (ja) * 2001-07-31 2003-02-13 Amano Corp 車両等の検出装置
KR20030046727A (ko) * 2001-12-06 2003-06-18 박규식 서브밴드 씨피에스피 알고리듬을 이용한 음원위치추정방법및 그 시스템
JP2004086541A (ja) * 2002-08-27 2004-03-18 P To Pa:Kk 回答文検索装置、回答文検索方法及びプログラム
JP2004086542A (ja) * 2002-08-27 2004-03-18 P To Pa:Kk 回答文検索装置、回答文検索方法及びプログラム
JP2004126784A (ja) * 2002-09-30 2004-04-22 P To Pa:Kk 画像表示装置、画像表示方法及びプログラム
JP2004126941A (ja) * 2002-10-02 2004-04-22 P To Pa:Kk 画像表示装置、画像表示方法及びプログラム
JP2004257877A (ja) * 2003-02-26 2004-09-16 Seiko Epson Corp 音源検出方法、音源検出装置及びロボット
JP2005077205A (ja) * 2003-08-29 2005-03-24 Advanced Telecommunication Research Institute International 音源方向推定装置、信号の時間遅延推定装置及びコンピュータプログラム
JP2005136709A (ja) * 2003-10-30 2005-05-26 Nippon Telegr & Teleph Corp <Ntt> 収音方法、装置、プログラム、および記録媒体
JP2008543196A (ja) * 2005-06-03 2008-11-27 フランス テレコム 視野方向の動きを制御する方法及び装置、ビデオ会議システム、端末、並びに、この方法を実装するプログラム
WO2007052726A1 (ja) * 2005-11-02 2007-05-10 Yamaha Corporation 遠隔会議装置
US8243950B2 (en) 2005-11-02 2012-08-14 Yamaha Corporation Teleconferencing apparatus with virtual point source production
JP2010517047A (ja) * 2007-01-26 2010-05-20 マイクロソフト コーポレーション マルチセンサ音源定位
JP2008259000A (ja) * 2007-04-06 2008-10-23 Sony Corp テレビ会議装置、制御方法、およびプログラム
JP2009052928A (ja) * 2007-08-24 2009-03-12 Nippon Telegr & Teleph Corp <Ntt> 位置推定装置、その方法、そのプログラム、およびその記録媒体
WO2009075085A1 (ja) * 2007-12-10 2009-06-18 Panasonic Corporation 収音装置、収音方法、収音プログラム、および集積回路
US8249269B2 (en) 2007-12-10 2012-08-21 Panasonic Corporation Sound collecting device, sound collecting method, and collecting program, and integrated circuit
US8582783B2 (en) 2008-04-07 2013-11-12 Dolby Laboratories Licensing Corporation Surround sound generation from a microphone array
JP2011517547A (ja) * 2008-04-07 2011-06-09 ドルビー・ラボラトリーズ・ライセンシング・コーポレーション マイクロホン配列からのサラウンド・サウンド生成
JP2010071757A (ja) * 2008-09-17 2010-04-02 Furukawa Co Ltd 測位装置および測位方法
ES2343931A1 (es) * 2008-09-25 2010-08-12 Universitat Politecnica De Catalunya Sistema para la medida de ruido y localizacion de una fuente movil en presencia de ruido de fondo.
US8634547B2 (en) 2009-05-13 2014-01-21 Oki Electric Industry Co., Ltd. Echo canceller operative in response to fluctuation on echo path
US20140163671A1 (en) * 2011-04-01 2014-06-12 W. L. Gore & Associates, Inc. Leaflet and valve apparatus
JP2013121078A (ja) * 2011-12-07 2013-06-17 Fuji Xerox Co Ltd 対面角度出力装置、対面角度出力システムおよびプログラム
US20150362582A1 (en) * 2013-01-18 2015-12-17 Syracuse University Spatial Localization of Intermittent Noise Sources By Acoustic Antennae
WO2014113739A1 (en) * 2013-01-18 2014-07-24 Syracuse University Spatial localization of intermittent noise sources by acoustic antennae
US9423490B2 (en) 2013-01-18 2016-08-23 Syracuse University Spatial localization of intermittent noise sources by acoustic antennae
CN104360315A (zh) * 2014-10-16 2015-02-18 河北工业大学 基于LabVIEW的麦克风阵列声源定位方法及装置
WO2017216999A1 (ja) * 2016-06-15 2017-12-21 日本電気株式会社 波源方向推定装置、波源方向推定システム、波源方向推定方法および波源方向推定プログラム
US11454694B2 (en) 2016-06-15 2022-09-27 Nec Corporation Wave source direction estimation apparatus, wave source direction estimation system, wave source direction estimation method, and wave source direction estimation program
CN109192213A (zh) * 2018-08-21 2019-01-11 平安科技(深圳)有限公司 庭审语音实时转写方法、装置、计算机设备及存储介质
CN109192213B (zh) * 2018-08-21 2023-10-20 平安科技(深圳)有限公司 庭审语音实时转写方法、装置、计算机设备及存储介质
CN112104810A (zh) * 2020-07-28 2020-12-18 苏州触达信息技术有限公司 全景拍照装置、全景拍照方法和计算机可读存储介质
CN112649788A (zh) * 2020-12-30 2021-04-13 华东理工大学 可适应运动声源的分布式汽车鸣笛声源实时快速定位方法、***、装置、处理器及存储介质
CN112649788B (zh) * 2020-12-30 2023-11-17 华东理工大学 可适应运动声源的分布式汽车鸣笛声源实时快速定位方法

Similar Documents

Publication Publication Date Title
JPH11304906A (ja) 音源位置推定方法およびそのプログラムを記録した記録媒体
US7039198B2 (en) Acoustic source localization system and method
US7254241B2 (en) System and process for robust sound source localization
US8403105B2 (en) Estimating a sound source location using particle filtering
Raykar et al. Position calibration of microphones and loudspeakers in distributed computing platforms
US9984702B2 (en) Extraction of reverberant sound using microphone arrays
US7039199B2 (en) System and process for locating a speaker using 360 degree sound source localization
US9622003B2 (en) Speaker localization
US9191738B2 (en) Sound enhancement method, device, program and recording medium
Huang et al. Microphone arrays for video camera steering
Huleihel et al. Spherical array processing for acoustic analysis using room impulse responses and time-domain smoothing
JP2008203474A (ja) 多信号強調装置、方法、プログラム及びその記録媒体
Daniel et al. Echo-enabled direction-of-arrival and range estimation of a mobile source in ambisonic domain
JP3862685B2 (ja) 音源方向推定装置、信号の時間遅延推定装置及びコンピュータプログラム
JP2015037207A (ja) 音場収音再生装置、方法及びプログラム
Huang et al. Source localization
JP2001313992A (ja) 収音装置および収音方法
Raykar et al. Self localization of acoustic sensors and actuators on distributed platforms
JP5713933B2 (ja) 音源距離測定装置、音響直間比推定装置、雑音除去装置、それらの方法、及びプログラム
JPH0693017B2 (ja) パツシブレンジングシステム
KR101534781B1 (ko) 음원 방향 추정 장치
US11533559B2 (en) Beamformer enhanced direction of arrival estimation in a reverberant environment with directional noise
WO2021251182A1 (ja) 信号処理装置および方法、並びにプログラム
KR20210122669A (ko) 고주파 위상차를 이용한 지연 분포 모형 기반의 음향 신호 처리 시스템 및 방법
Rush A Framework for Practical Acoustic Source Localization