JP2001296343A - 音源方位設定装置及びそれを備えた撮像装置、送信システム - Google Patents

音源方位設定装置及びそれを備えた撮像装置、送信システム

Info

Publication number
JP2001296343A
JP2001296343A JP2000109693A JP2000109693A JP2001296343A JP 2001296343 A JP2001296343 A JP 2001296343A JP 2000109693 A JP2000109693 A JP 2000109693A JP 2000109693 A JP2000109693 A JP 2000109693A JP 2001296343 A JP2001296343 A JP 2001296343A
Authority
JP
Japan
Prior art keywords
microphones
microphone
microphone set
sound source
speaker
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2000109693A
Other languages
English (en)
Inventor
Kensuke Hayashi
建輔 林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2000109693A priority Critical patent/JP2001296343A/ja
Priority to US09/820,342 priority patent/US6516066B2/en
Publication of JP2001296343A publication Critical patent/JP2001296343A/ja
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/005Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones

Landscapes

  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Otolaryngology (AREA)
  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Stereophonic Arrangements (AREA)
  • Measurement Of Velocity Or Position Using Acoustic Or Ultrasonic Waves (AREA)

Abstract

(57)【要約】 【課題】 第1のマイクロホンセットを、音源に正しく
向けられるように制御する。 【解決手段】 少なくとも2つの第1マイクロホン12
0a,120bを装備し、それらマイクロホン120
a,120bが位置する走査面に対して直交する回転軸
回りで回動可能に支持された第1マイクロホンセット1
60と、第1マイクロホン120a,120bを走査面
上で移動するように第1マイクロホンセット160を回
転軸回りで回動する駆動手段140と、音源からの音が
第1マイクロホン120a,120bの各々に到達する
までの所要時間の差を算定し、第1マイクロホンセット
160について、時間差を縮小し、設定値へ収斂するよ
うに、駆動手段140を制御する制御手段130,15
0とを具備することを特徴とする。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、音源方位設定装置
及びそれを備えた撮像装置、さらに、この撮像装置を用
いたテレビ会議装置、テレビ電話システムなどの送信シ
ステムに関する。
【0002】
【従来の技術】従来、テレビ会議システム等では、話者
の音声をマイクロホンセットに設けた複数のマイクロホ
ンにより集音して、これらの各マイクロホンを用いて、
マイクロホンセットに対する話者の方位を検出する技術
が、たとえば特開平4−049756号公報、特開平4
−249991号公報、特開平6−351015号公
報、特開平7−140527号公報、特開平11−04
1577号公報に記載されている。
【0003】マイクロホンによって、話者の方位が検出
できるのは、各マイクロホンに話者の音声が到達するま
での時間が若干異なるため、その時間差に基づいて相互
相関係数を以下に説明するように算出して、相互相関係
数を最大にする時間差を探索し、その時間情報を角度情
報に変換すれば、音声の出所の角度を検出できるからで
ある。
【0004】図4は、従来のテレビ会議装置の構成図で
ある。図4には、話者を撮像するためのカメラレンズ1
03を有する画像入力部200と、話者の音声を集音す
るマイクロホン110a,110bを有するマイクロホ
ンセット170とを、回転手段101で接続してなるテ
レビ会議装置100を示している。
【0005】テレビ会議装置100は、以下に説明する
ように、各マイクロホン110a,110bから話者の
音声を集音するとともに、その音声から話者方位方向を
検出する。そして、その検出結果に基づいてカメラレン
ズ103を、話者の方向に向けるように制御し、そこ
で、カメラレンズ103を介して話者の画像を入力し
て、それを集音した音声とともに、他のテレビ会議装置
へ送信している。
【0006】図5は、各マイクロホン110a,110
bによって話者方位方向を検出する原理の説明図であ
る。図5には、2つのマイクロホン110a,110b
と、話者及び話者の音声とを示しているが、話者の音声
は、各マイクロホン110a,110bに到達するまで
に要する時間に差がある。
【0007】この時間差は、次のようにしてカメラレン
ズ103の回動制御の値として算出される。すなわち、
マイクロホン110a,110b間の距離をL、マイク
ロホン110a,110bを結ぶカメラレンズ103の
走査面において、話者とマイクロホン110a,110
bとを結ぶ各直線と最初のカメラレンズ103の指向線
とのなす角度をそれぞれθ、音速をV、サンプリング周
波数をFsとすると、 θ= SIN-1(V[m/s]/(Fs[Hz]×L
[m])) という数式で表すことができる。
【0008】
【発明が解決しようとする課題】しかし、各マイクロホ
ンを結ぶカメラレンズ103の走査面において話者と各
マイクロホンと最初のカメラレンズ103の指向線のな
す角度θは、SIN-1関数に従うため、話者が各マイク
ロホンとほぼ等距離に位置し角度θの差が小さく各マイ
クロホンに到達する音声の時間差が小さい場合と、そう
でなく角度θの差が大きく各マイクロホンに到達する音
声の時間差が大きい場合とでは角度精度が異なる。具体
的には、角度θが大きくなるほど、検出精度が低くなる
ので、その改善が望まれていた。
【0009】また、話者が発した音声は、直接、各マイ
クロホンに集音されるものだけでなく、壁、床その他の
音響空間に反射してから集音される場合がある。さら
に、各マイクロホンに集音されるものには、話者の音声
以外に、背景雑音などがある。そのため、各マイクロホ
ン間の相互相関係数は、背景雑音などの影響により、ば
らつきを有することが考えられ、その結果、話者方位の
検出を誤ることが考えられる。
【0010】そこで、本発明は、上記のような事情を考
慮してカメラレンズなどを含む撮像装置の指向方向を、
話者などの音源に正しく向けられるように制御できる音
源方位設定装置を提供することを課題とする。
【0011】また、本発明は、音源の移動あるいは切り
替えに早急に対応して移動先などの音源に対して正しく
向けられるように制御できる音源方位設定装置を提供す
ることを課題とする。
【0012】さらに、本発明は、反射特性等の影響を受
けにくい話者方位設定装置を提供することを課題とす
る。
【0013】
【課題を解決するための手段】上記課題を解決するため
に、本発明は、少なくとも2つの第1マイクロホンを装
備し、それらマイクロホンが位置する走査面に対して直
交する回転軸回りで回動可能に支持された第1マイクロ
ホンセットと、前記第1マイクロホンを前記走査面上で
移動するように前記第1マイクロホンセットを前記回転
軸回りで回動する駆動手段と、音源からの音が前記第1
マイクロホンの各々に到達するまでの所要時間の差を算
定し、前記第1マイクロホンセットについて、時間差を
縮小し、設定値へ収斂するように、前記駆動手段を制御
する制御手段とを具備することを特徴とする。
【0014】なお、前記走査面と平行に配置された、少
なくとも2つの第2マイクロホンを装備した第2マイク
ロホンセットを備え、前記制御手段は、前記音源からの
音が前記第1及び第2マイクロホンの各々に到達するま
での所要時間の差を算出し、前記第1マイクロホンセッ
トについては、時間差を縮小し、設定値へ収斂するよう
に、前記駆動手段を制御することが好ましい。
【0015】この場合には、前記制御手段は、前記第1
及び第2マイクロホンセットの前記第1及び第2マイク
ロホンの各々によって集音された音の相互相関係数を算
出する算出手段と、前記相互相関係数に基づいて前記時
間差を算出する時間差算出手段と、算出した前記時間差
を角度情報に変換する手段とを具備していて、前記角度
情報で、少なくとも、前記駆動手段の回転方向を設定す
る。さらに、前記算出手段は、前記第1及び第2マイク
ロホンセットの前記第1及び第2マイクロホンの各々に
よって集音された音を、幾つかの周波数帯域に分割し、
各周波数帯域について、前記音の周波数成分の相互相関
係数を算出する。また、第2マイクロホンセットにおけ
る前記第2マイクロホンの各々で集音した情報で、前記
制御手段は、その時間差の変化を、音源移動あるいは切
換として捉え、前記第1マイクロホンセットの回動方
向、角度情報を補正あるいは変更すればよい。
【0016】さらに、本発明の撮像装置は、上記のよう
な音源方位設定装置において、前記第1マイクロホンセ
ットに、その回転軸またはその近傍に位置して、前記第
1マイクロホンセットの第1マイクロホンの各々で集音
された音に時間差がない時の、音源の方位に撮像レンズ
を向けて、前記マイクロホンセットに装備した撮像手段
を備えることを特徴とする。
【0017】また、本発明の送信システムは、上記撮像
装置で撮影した音源の画像を、同時にマイクロホンで収
録した音とともに所要のモニタ及びスピーカに送信する
送信手段を装備したことを特徴とする。
【0018】さらにまた、本発明の送信システムは、請
求項7に記載の送信システムによって、マイクロホン、
モニタ及びスピーカを会議席のそれぞれに備えたテレビ
会議装置を構成することを特徴とする。
【0019】また、本発明の送信システムは、マイクロ
ホン、モニタ及びスピーカを通話者のそれぞれに備える
通信回線を用いたテレビ電話システムを構成することを
特徴とする。
【0020】
【発明の実施の形態】以下、本発明の実施形態について
図面を参照して説明する。
【0021】図1(a)は、本発明の実施形態の音源方
位設定装置を備えたテレビ会議装置の平面図である。図
1(b)は、図1(a)の上面図である。図1(c)
は、図1(a),図1(b)に示すテレビ会議装置の内
部構成図である。
【0022】図1(a),図1(b)には、音源である
ところの話者を撮像するためのカメラレンズ103及び
話者の音声などを集音するマイクロホン120a,12
0bを有する第1のマイクロホンセットであるところの
マイクロホンセット160と、話者の音声などを集音す
るマイクロホン110a,110bを有する第1のマイ
クロホンセットであるところのマイクロホンセット17
0とを、回転手段101で接続してなるテレビ会議装置
100を示している。
【0023】また、マイクロホン110a,110b,
120a,120bの各々は、たとえば50Hz〜7k
Hz程度の周波数域の音を集音できるものを用いてい
る。
【0024】また。図1(c)には、マイクロホンセッ
ト170で集音された音声などに基づいて話者方位を検
出する制御手段であるところの話者方位検出手段130
と、マイクロホンセット160で集音された音声に基づ
いて話者方位を検出する制御手段であるところの話者方
位検出手段150と、話者方位検出手段130,150
により検出された話者方位情報をテレビ会議装置100
側にフィードバックして回転手段110を駆動する駆動
手段140とを示している。なお、ここでは、たとえば
駆動手段140は、話者方位検出手段130,150の
いずれかからの信号を入力するようにしている。
【0025】図2は、マイクロホンセット170及び話
者方位検出手段130の構成図である。図2には、各マ
イクロホン110a,110bで集音した音声をたとえ
ば16kHzの周波数でサンプリングしてディジタル信
号に変換するA/D変換手段210a,210bと、タ
イマを内蔵しこのタイマを用いてマイクロホン110
a,110bから入力された音が話者の音声であるか否
か検出する音声検出手段250とを示している。
【0026】また、図2には、所定の周波数帯域のディ
ジタル信号のみ通過するバンドパスフィルタ220a,
220b,220a’,220b’…と、通過したディ
ジタル信号の相互相関係数を算出する算出手段230,
230'…と、算出された相互相関係数を積分する積分
手段240,240'…と、積分した各相互相関係数を
最大にするようなマイクロホン110a,110b間の
時間差を検出する検出手段260,260'…とを示し
ている。
【0027】これらの各手段220a〜260等はそれ
ぞれたとえば7組備えており、バンドパスフィルタ22
0a,220bはたとえば50Hz〜1kHz、バンド
パスフィルタ220a’,220b’はたとえば1kH
z〜2kHz、図示しない複数のバンドパスフィルタ
は、たとえば2kHz〜3kHz,…,6kHz〜7k
Hzというように、それぞれ割り当てられた周波数帯域
のディジタル信号だけを通過させるように設定してい
る。
【0028】さらに、図2には、検出されたマイクロホ
ン110a,110b間の各時間差に予め定めている固
有の係数を加味してマイクロホン110a,110b間
の全体の時間差を算出する時間差算出手段270と、算
出した遅延時間を角度情報に変換する変換手段280と
を示している。なお、話者方位検出手段150も話者方
位検出手段130と同様に構成している。
【0029】つづいて、図1(a)〜図1(c)及び図
2の動作を説明する。まず、話者の音声が各マイクロホ
ン110a〜120bによって集音され、話者方位検出
手段130,150へそれぞれ出力される。話者方位検
出手段130,150では、A/D変換手段210a,
210bにより音声がディジタル信号に変換される。こ
のディジタル信号は、音声検出手段250及びバンドパ
スフィルタ220a,220b,220a’,220
b’等にパラレルに出力される。
【0030】ここで、各バンドパスフィルタ220a,
220b,220a’,220b’等は、上記のよう
に、それぞれたとえば50Hz〜1kHz,1kHz〜
2kHz,2kHz〜3kHz,…,6kHz〜7kH
zのそれぞれの周波数帯域を通過するように設定してい
るため、各バンドパスフィルタ220a,220b,2
20a’,220b’等では設定されている周波数低域
のディジタル信号だけが通過する。
【0031】バンドパスフィルタ220a,220b,
220a’,220b’等を通過したディジタル信号
は、算出手段230,230'等へ各々出力される。算
出手段230,230'等では、入力したディジタル信
号の相互相関係数を算出する。算出された相互相関係数
は、積分手段240,240'等へ各々出力され、ここ
で積分される。
【0032】一方、音声検出手段250では、ディジタ
ル信号が音声に係るものであるかどうか判定され、判定
結果は積分手段240,240'等へ出力される。積分
手段240、240’等の各々では、音声検出手段25
0の判定結果に基づいて、ディジタル信号が音声に係る
ものであれば積分した相互相関係数が検出手段260へ
出力され、そうでない場合には積分した相互相関係数を
クリアする。
【0033】ここで、図3は、音声検出手段250の動
作を示すフローチャートであり、音声検出手段250で
は、以下説明する手順により音声と背景雑音などとを区
別する。すなわち、音声検出手段250は、まず、タイ
マを0にセットした状態で、常時、ディジタル信号のレ
ベルを測定している(ステップS1)。そして、任意の
時刻Tでサンプリングされたディジタル信号のレベルと
時刻T−1でサンプリングされたディジタル信号のレベ
ルとのレベル比Aが求められる(ステップS2)。
【0034】そして、レベル比Aと所定のしきい値との
いずれが大きいかが判定される(ステップS3)。レベ
ル比Aの方がしきい値よりも大きい場合には、ステップ
S4へ移行し、そうでない場合には、ステップS8へ移
行する。ここで、レベル比Aと比較される所定のしきい
値とは、いずれかのマイクロホンで集音された音が音声
の周波数帯域内にあるかどうかを判定するためのもので
あり、たとえば100Hz程度としている。
【0035】つづいて、ステップS4ではタイマがオン
され、そして、ステップS5に移行して、タイマの測定
時間と所定のしきい値との大きさが比較される。ここ
で、タイマの測定時間と比較されるしきい値は、たとえ
ば会議参加者が書類等を落とすことにより生じた音と話
者の音声とを区別するためのものであり、たとえば0.
5秒程度としている。
【0036】そして、ステップS5で、タイマの測定時
間の方が所定のしきい値よりも大きい場合には、ステッ
プS6へ移行し、そうでない場合には、ステップS8へ
移行する。ステップS6では、いずれかのマイクロホン
で集音された音は音声であると判定され、一方、ステッ
プS8では、いずれかのマイクロホンで集音された音は
音声でないと判定される。そして、ステップS7へ移行
し、タイマを0にリセットする。実際には、音声検出手
段250は、図3に示す各ステップを、常時、繰り返し
行っている。
【0037】また、図2では、検出手段260におい
て、積分された各相互相関係数を最大にするようなマイ
クロホン110a,110b間及びマイクロホン120
a,120b間の音声の到達時間の時間差D1〜D7が検
出され、時間差算出手段270へ出力される。そして、
時間差算出手段270では、検出されたマイクロホン1
10a,110b間の各時間差D1〜D7に、予め定めて
いる固有の係数A1〜A7を加味してマイクロホン110
a,110b間の全体の時間差dを算出する。
【0038】時間差dは、 d=[D1,D2,…,D7][A1,A2,…,A7T
(ΣAi=1(i=0・・・7)) と示すことができる。
【0039】ここで、音が壁や床などにより反射する場
合に、周波数が高いほど壁や床などで反射するときに拡
散して反射するが、周波数が低いほど入射角と出射角と
の和が90度に近くなることが知られている。そのた
め、音声の周波数が低いほど、壁や床で反射した音声
が、各マイクロホンで直接集音される音声と干渉等が生
じ、話者方位の特定に影響を及ぼしやすい。
【0040】そのため、たとえばD1を50Hz〜1k
Hzの周波数帯域を通過するようなバンドパスフィルタ
220a等を通過したディジタル信号に基づいて検出し
た時間差、D2を1kHz〜2kHzの周波数帯域を通
過するようなバンドパスフィルタ220a’等を通過し
たディジタル信号に基づいて検出した時間差、D3
…、D7を6kHz〜7kHzの周波数帯域を通過する
ようなバンドパスフィルタを通過したディジタル信号に
基づいて検出した時間差とすると、各係数A1等は、 A1<A2<…<A7、ΣAi=1 (i=0・・・
7) となるように係数が決定される。
【0041】そして、上記のように、これらの係数A1
〜A7と各時間差D1〜D7との内積が算出され、時間差
dが求められる。このように、周波数が低いほど小さい
値の係数が内積され、周波数が高いほど大きい値の係数
が内積され、壁や床などでの反射の影響を受けにくくし
ている。
【0042】算出された時間差dは、変換手段280へ
出力される。変換手段280は、以下の数式を用いて、
時間情報を角度情報に変換する。
【0043】θd= SIN-1((d×V[m/s])/
(Fs[Hz]×L[m])) (ここで、V:音速 Fs:サンプリング周波数 L:マイクロホン110a,110b等の間の距離) 変換されて得られた角度情報は、駆動手段140へ出力
される。駆動手段140では、後述するように、話者方
位検出手段130,150のいずれかの出力信号を選択
して、その選択した信号に基づいて回転手段101を駆
動する。
【0044】具体的には、まず、話者方位検出手段13
0から出力される角度情報信号に基づいて、話者が各マ
イクロホン120a,120bに対して等距離に位置す
るように回転手段101により、マイクロホンセット1
60を回転させる。つづいて、検出手段150から出力
される角度情報信号に基づいて、話者が各マイクロホン
120a,120bに対して等距離に位置するように微
調整を行う。
【0045】すなわち、まず、たとえば各マイクロホン
110a,110bで集音した音声に基づいて算出した
上記の角度θが角度θd1の場合には、この角度θd1が0
となるように、回転手段101を駆動する。このとき、
実際には、上記数式を用いたことによる誤差があるた
め、話者が各マイクロホン120a,120bに対して
等距離には位置していない。
【0046】そこで、つづいて、各マイクロホン120
a,120bで集音した音声に基づいて算出した上記の
角度θが角度θd2の場合には、この角度θd2が0となる
ように、回転手段101を駆動する。このとき、角度θ
d2は角度θd1に比して、かなり小さいため、高精度でマ
イクロホンセット160を話者に方向に向けることがで
きる。
【0047】そして、たとえば話者が変わった場合に
は、角度θd1が変化するため、同様に、角度θd1が0と
なるように回転手段101を駆動し、その後、角度θd2
が0となるように回転手段101を駆動する。
【0048】以上説明したように、本実施形態では、マ
イクロホンセット160のみならず、マイクロホンセッ
ト170にもマイクロホン110a,110bを備える
場合を例に説明したが、マイクロホンセット160にの
みマイクロホン120a,120bを設け、音源からの
音がマイクロホンの各々に到達するまでに要する時間の
時間差を測定して、この時間差がなくなるようにマイク
ロホンセット160を、回転手段101の回転軸を中心
に回転させることにより、マイクロホンセット160の
回転角により、音源の方位を検出してもよい。
【0049】ただし、通常、マイクロホンセット170
は、複数の会議参加者の中心に対して向けて置かれるた
め、マイクロホンセット170にもマイクロホン110
a,110bを備える方が、話者が変わった場合に、早
くそちら側へマイクロホンセット160の向きを回転さ
せることができる。
【0050】すなわち、たとえば、話者が変わったた
め、マイクロホン160を90度回転させなければなら
ないような場合には、マイクロホンセット160のマイ
クロホン120a,120bにより話者の方位を算出し
ながら、マイクロホンセット160を回転させるより
も、マイクロホンセット170により話者の方位を特定
する方が、マイクロホン110a,110bと話者とが
なす角度が小さいため、誤差が少なく検出することがで
きるからである。
【0051】また、本実施形態では、話者方位検出装置
を用いたテレビ会議装置について説明したが、このテレ
ビ会議装置相互を、たとえば総合ディジタル通信網(I
SDN回線)などの通信回線により接続し、さらに他の
テレビ会議装置から送信される音声情報及び画像情報を
出力するスピーカ及びモニタを備えれば、テレビ会議シ
ステムを構成することができる。
【0052】さらに、本実施形態の話者方位検出装置
は、話者をはじめとする音源の画像を撮像する撮像装
置、さらにまた、その撮像装置を用いたテレビ電話装置
として用いることもできる。
【0053】
【発明の効果】以上、説明したように、本発明は、第1
マイクロホンセットに備えた少なくとも2つの第1マイ
クロホンの各々に、音源からの音が到達するまでの所要
時間の差を算定し、その時間差を縮小し、設定値へ収斂
するように、第1マイクロホンセットを回動させるた
め、音源に対して正しく第1マイクロホンセットを向け
ることができる。
【0054】また、本発明は、第2マイクロホンの各々
で集音した情報で、時間差の変化を、音源移動あるいは
切換として捉え、第1マイクロホンセットの回動方向、
角度情報を補正あるいは変更するため、音源の移動ある
いは切り替えに早急に対応して移動先などの音源に対し
て正しく向けられる。
【0055】さらに、本発明は、第1及び第2マイクロ
ホンの各々によって集音された音の相互相関係数に基づ
いて時間差を算出する。そして、たとえばその時間情報
を角度情報に変換し、その角度情報で、少なくとも、第
1マイクロホンセットの回転方向を設定するため、反射
特性等の影響を受けにくい。
【図面の簡単な説明】
【図1】本発明の実施形態のテレビ会議装置の外観図及
び構成図である。
【図2】図1のマイクロホンセット及び話者方位検出手
段の構成図である。
【図3】図1のテレビ会議装置の音声検出手段の動作を
示すフローチャートである。
【図4】従来技術のテレビ電話装置の構成図である。
【図5】話者方位を検出する原理の説明図である。
【符号の説明】
100 テレビ会議装置 103 カメラレンズ 110a,110b,120a,120b マイクロホ
ン 130,150 話者方位検出手段 140 駆動手段 160,170 マイクロホンセット 210a,210b A/D変換手段 220 バンドパスフィルタ 230 算出手段 240 積分手段 250 音声検出手段 260 検出手段 270 時間差算出手段 280 変換手段
───────────────────────────────────────────────────── フロントページの続き Fターム(参考) 5C064 AA02 AC04 AC09 AC16 AD09 5D011 AB01 5D015 AA06 BB01 DD02 5J083 AA05 AB20 AC29 AD18 AE08 AF00 BE10 BE45 CA07 CA10 CA40 9A001 BB02 BB06 CC02 EE05 GG03 GG05 HH15 HZ34 JJ23 JJ24 KK32

Claims (9)

    【特許請求の範囲】
  1. 【請求項1】 少なくとも2つの第1マイクロホンを装
    備し、それらマイクロホンが位置する走査面に対して直
    交する回転軸回りで回動可能に支持された第1マイクロ
    ホンセットと、 前記第1マイクロホンを前記走査面上で移動するように
    前記第1マイクロホンセットを前記回転軸回りで回動す
    る駆動手段と、 音源からの音が前記第1マイクロホンの各々に到達する
    までの所要時間の差を算定し、前記第1マイクロホンセ
    ットについて、時間差を縮小し、設定値へ収斂するよう
    に、前記駆動手段を制御する制御手段とを具備すること
    を特徴とする音源方位設定装置。
  2. 【請求項2】 前記走査面と平行に配置された、少なく
    とも2つの第2マイクロホンを装備した第2マイクロホ
    ンセットを備え、 前記制御手段は、前記音源からの音が前記第1及び第2
    マイクロホンの各々に到達するまでの所要時間の差を算
    出し、前記第1マイクロホンセットについては、時間差
    を縮小し、設定値へ収斂するように、前記駆動手段を制
    御することを特徴とする音源方位設定装置。
  3. 【請求項3】 前記制御手段は、少なくとも前記第1マ
    イクロホンセットの前記第1マイクロホンの各々によっ
    て集音された音の相互相関係数を算出する算出手段と、
    前記相互相関係数に基づいて前記時間差を算出する時間
    差算出手段と、算出した前記時間差を角度情報に変換す
    る手段とを具備していて、前記角度情報で、少なくと
    も、前記駆動手段の回転方向を設定することを特徴とす
    る請求項1又は2に記載の音源方位設定装置。
  4. 【請求項4】 前記算出手段は、少なくとも前記第1マ
    イクロホンセットの前記第1マイクロホンの各々によっ
    て集音された音を、幾つかの周波数帯域に分割し、各周
    波数帯域について、前記音の周波数成分の相互相関係数
    を算出することを特徴とする請求項3に記載の音源方位
    設定装置。
  5. 【請求項5】 第2マイクロホンセットにおける前記第
    2マイクロホンの各々での集音した情報で、前記制御手
    段は、その時間差の変化を、音源移動あるいは切換とし
    て捉え、前記第1マイクロホンセットの回動方向、角度
    情報を補正あるいは変更することを特徴とする請求項2
    に記載の音源方位設定装置。
  6. 【請求項6】 請求項1から5の何れか1項に記載の音
    源方位設定装置において、前記第1マイクロホンセット
    に、その回転軸又はその近傍に位置して、前記第1マイ
    クロホンセットの第1マイクロホンの各々で集音された
    音に時間差がない時の、音源の方位に撮像レンズを向け
    て、前記マイクロホンセットに装備した撮像手段を備え
    ることを特徴とする撮像装置。
  7. 【請求項7】 請求項6に記載された撮像装置で撮影し
    た音源の画像を、同時にマイクロホンで収録した音とと
    もに所要のモニタ及びスピーカに送信する送信手段を装
    備したことを特徴とする送信システム。
  8. 【請求項8】 請求項7に記載の送信システムによっ
    て、マイクロホン、モニタ及びスピーカを会議席のそれ
    ぞれに備えたテレビ会議装置を構成することを特徴とす
    る送信システム。
  9. 【請求項9】 請求項7に記載の送信システムによっ
    て、マイクロホン、モニタ及びスピーカを通話者のそれ
    ぞれに備える通信回線を用いたテレビ電話システムを構
    成することを特徴とする送信システム。
JP2000109693A 2000-04-11 2000-04-11 音源方位設定装置及びそれを備えた撮像装置、送信システム Pending JP2001296343A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2000109693A JP2001296343A (ja) 2000-04-11 2000-04-11 音源方位設定装置及びそれを備えた撮像装置、送信システム
US09/820,342 US6516066B2 (en) 2000-04-11 2001-03-29 Apparatus for detecting direction of sound source and turning microphone toward sound source

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000109693A JP2001296343A (ja) 2000-04-11 2000-04-11 音源方位設定装置及びそれを備えた撮像装置、送信システム

Publications (1)

Publication Number Publication Date
JP2001296343A true JP2001296343A (ja) 2001-10-26

Family

ID=18622345

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000109693A Pending JP2001296343A (ja) 2000-04-11 2000-04-11 音源方位設定装置及びそれを備えた撮像装置、送信システム

Country Status (2)

Country Link
US (1) US6516066B2 (ja)
JP (1) JP2001296343A (ja)

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007322416A (ja) * 2006-05-31 2007-12-13 Honda Research Inst Europe Gmbh 音源の位置を推定するための、聴覚手がかりを位置に変換するオンライン補正の方法
WO2009006004A1 (en) * 2007-06-28 2009-01-08 Microsoft Corporation Microphone array for a camera speakerphone
WO2009119844A1 (ja) * 2008-03-27 2009-10-01 ヤマハ株式会社 音声処理装置
WO2010021154A1 (ja) * 2008-08-22 2010-02-25 ヤマハ株式会社 録音再生装置
US8165416B2 (en) 2007-06-29 2012-04-24 Microsoft Corporation Automatic gain and exposure control using region of interest detection
CN102592601A (zh) * 2011-01-10 2012-07-18 华为技术有限公司 一种信号处理方法和装置
WO2012124422A1 (ja) 2011-03-11 2012-09-20 三洋電機株式会社 録音装置
US8330787B2 (en) 2007-06-29 2012-12-11 Microsoft Corporation Capture device movement compensation for speaker indexing
US8559647B2 (en) 2007-09-21 2013-10-15 Yamaha Corporation Sound emitting and collecting apparatus
US10951859B2 (en) 2018-05-30 2021-03-16 Microsoft Technology Licensing, Llc Videoconferencing device and method
CN112684411A (zh) * 2020-11-26 2021-04-20 哈尔滨工程大学 一种基于改进到达频率差的水下目标定位方法

Families Citing this family (43)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8189825B2 (en) * 1994-05-09 2012-05-29 Breed David S Sound management techniques for vehicles
JP3771812B2 (ja) * 2001-05-28 2006-04-26 インターナショナル・ビジネス・マシーンズ・コーポレーション ロボットおよびその制御方法
US20030072456A1 (en) * 2001-10-17 2003-04-17 David Graumann Acoustic source localization by phase signature
US6792118B2 (en) * 2001-11-14 2004-09-14 Applied Neurosystems Corporation Computation of multi-sensor time delays
JP3627058B2 (ja) * 2002-03-01 2005-03-09 独立行政法人科学技術振興機構 ロボット視聴覚システム
NO318096B1 (no) * 2003-05-08 2005-01-31 Tandberg Telecom As Arrangement og fremgangsmate for lokalisering av lydkilde
JP4839838B2 (ja) * 2003-12-12 2011-12-21 日本電気株式会社 情報処理システム、情報処理方法および情報処理用プログラム
NO328311B1 (no) * 2004-10-01 2010-01-25 Tandberg Telecom As Skrivebordterminalfot og skrivebordsystem
JP4311402B2 (ja) * 2005-12-21 2009-08-12 ヤマハ株式会社 拡声システム
US8345890B2 (en) 2006-01-05 2013-01-01 Audience, Inc. System and method for utilizing inter-microphone level differences for speech enhancement
US8194880B2 (en) 2006-01-30 2012-06-05 Audience, Inc. System and method for utilizing omni-directional microphones for speech enhancement
US9185487B2 (en) 2006-01-30 2015-11-10 Audience, Inc. System and method for providing noise suppression utilizing null processing noise subtraction
US8744844B2 (en) 2007-07-06 2014-06-03 Audience, Inc. System and method for adaptive intelligent noise suppression
US8204252B1 (en) 2006-10-10 2012-06-19 Audience, Inc. System and method for providing close microphone adaptive array processing
WO2007099908A1 (ja) * 2006-02-27 2007-09-07 Matsushita Electric Industrial Co., Ltd. ウェアラブル端末、および、携帯撮像収音装置、およびそれらを実現する装置、方法、プログラム
US8949120B1 (en) 2006-05-25 2015-02-03 Audience, Inc. Adaptive noise cancelation
US8934641B2 (en) * 2006-05-25 2015-01-13 Audience, Inc. Systems and methods for reconstructing decomposed audio signals
US8150065B2 (en) 2006-05-25 2012-04-03 Audience, Inc. System and method for processing an audio signal
US8849231B1 (en) 2007-08-08 2014-09-30 Audience, Inc. System and method for adaptive power control
US8204253B1 (en) 2008-06-30 2012-06-19 Audience, Inc. Self calibration of audio device
US8259926B1 (en) 2007-02-23 2012-09-04 Audience, Inc. System and method for 2-channel and 3-channel acoustic echo cancellation
US20080255840A1 (en) * 2007-04-16 2008-10-16 Microsoft Corporation Video Nametags
CN101690149B (zh) * 2007-05-22 2012-12-12 艾利森电话股份有限公司 用于群组声音远程通信的方法和装置
US8189766B1 (en) 2007-07-26 2012-05-29 Audience, Inc. System and method for blind subband acoustic echo cancellation postfiltering
JP5228407B2 (ja) * 2007-09-04 2013-07-03 ヤマハ株式会社 放収音装置
JP4872871B2 (ja) * 2007-09-27 2012-02-08 ソニー株式会社 音源方向検出装置、音源方向検出方法及び音源方向検出カメラ
US8180064B1 (en) 2007-12-21 2012-05-15 Audience, Inc. System and method for providing voice equalization
US8143620B1 (en) 2007-12-21 2012-03-27 Audience, Inc. System and method for adaptive classification of audio sources
US8194882B2 (en) 2008-02-29 2012-06-05 Audience, Inc. System and method for providing single microphone noise suppression fallback
US8355511B2 (en) 2008-03-18 2013-01-15 Audience, Inc. System and method for envelope-based acoustic echo cancellation
US8521530B1 (en) 2008-06-30 2013-08-27 Audience, Inc. System and method for enhancing a monaural audio signal
US8774423B1 (en) 2008-06-30 2014-07-08 Audience, Inc. System and method for controlling adaptivity of signal modification using a phantom coefficient
US8390665B2 (en) * 2009-09-03 2013-03-05 Samsung Electronics Co., Ltd. Apparatus, system and method for video call
KR101081752B1 (ko) * 2009-11-30 2011-11-09 한국과학기술연구원 인공귀 및 이를 이용한 음원 방향 검지 방법
US9008329B1 (en) 2010-01-26 2015-04-14 Audience, Inc. Noise reduction using multi-feature cluster tracker
TW201208335A (en) * 2010-08-10 2012-02-16 Hon Hai Prec Ind Co Ltd Electronic device
KR101750338B1 (ko) * 2010-09-13 2017-06-23 삼성전자주식회사 마이크의 빔포밍 수행 방법 및 장치
US9640194B1 (en) 2012-10-04 2017-05-02 Knowles Electronics, Llc Noise suppression for speech processing based on machine-learning mask estimation
US9536540B2 (en) 2013-07-19 2017-01-03 Knowles Electronics, Llc Speech signal separation and synthesis based on auditory scene analysis and speech modeling
DE112015003945T5 (de) 2014-08-28 2017-05-11 Knowles Electronics, Llc Mehrquellen-Rauschunterdrückung
US9542603B2 (en) * 2014-11-17 2017-01-10 Polycom, Inc. System and method for localizing a talker using audio and video information
CN105931451B (zh) * 2016-06-24 2021-12-07 南京紫米网络科技有限公司 一种基于声波编码的语音控制传感器
KR102549465B1 (ko) * 2016-11-25 2023-06-30 삼성전자주식회사 마이크 파라미터를 조절하는 전자 장치

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0449756A (ja) 1990-06-18 1992-02-19 Nippon Telegr & Teleph Corp <Ntt> 会議通話装置
JPH04249991A (ja) 1990-12-20 1992-09-04 Fujitsu Ltd テレビ会議装置
JPH06351015A (ja) 1993-06-10 1994-12-22 Olympus Optical Co Ltd テレビジョン会議システム用の撮像システム
JP3555151B2 (ja) 1993-11-16 2004-08-18 松下電器産業株式会社 カメラ撮影制御装置
JPH09238374A (ja) 1996-02-29 1997-09-09 Kokusai Electric Co Ltd 受信機
US6072522A (en) * 1997-06-04 2000-06-06 Cgc Designs Video conferencing apparatus for group video conferencing
JPH1141577A (ja) 1997-07-18 1999-02-12 Fujitsu Ltd 話者位置検出装置

Cited By (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007322416A (ja) * 2006-05-31 2007-12-13 Honda Research Inst Europe Gmbh 音源の位置を推定するための、聴覚手がかりを位置に変換するオンライン補正の方法
WO2009006004A1 (en) * 2007-06-28 2009-01-08 Microsoft Corporation Microphone array for a camera speakerphone
KR101495937B1 (ko) 2007-06-28 2015-02-25 마이크로소프트 코포레이션 카메라 스피커폰을 위한 마이크로폰 어레이
US8526632B2 (en) 2007-06-28 2013-09-03 Microsoft Corporation Microphone array for a camera speakerphone
US8165416B2 (en) 2007-06-29 2012-04-24 Microsoft Corporation Automatic gain and exposure control using region of interest detection
US8749650B2 (en) 2007-06-29 2014-06-10 Microsoft Corporation Capture device movement compensation for speaker indexing
US8330787B2 (en) 2007-06-29 2012-12-11 Microsoft Corporation Capture device movement compensation for speaker indexing
US8559647B2 (en) 2007-09-21 2013-10-15 Yamaha Corporation Sound emitting and collecting apparatus
CN101981943A (zh) * 2008-03-27 2011-02-23 雅马哈株式会社 声音处理装置
JP2009260948A (ja) * 2008-03-27 2009-11-05 Yamaha Corp 音声処理装置
WO2009119844A1 (ja) * 2008-03-27 2009-10-01 ヤマハ株式会社 音声処理装置
CN102124754A (zh) * 2008-08-22 2011-07-13 雅马哈株式会社 记录/再现设备
WO2010021154A1 (ja) * 2008-08-22 2010-02-25 ヤマハ株式会社 録音再生装置
JP2010074827A (ja) * 2008-08-22 2010-04-02 Yamaha Corp 録音再生装置
US8811626B2 (en) 2008-08-22 2014-08-19 Yamaha Corporation Recording/reproducing apparatus
US9519619B2 (en) 2011-01-10 2016-12-13 Huawei Technologies Co., Ltd. Data processing method and device for processing speech signal or audio signal
CN102592601A (zh) * 2011-01-10 2012-07-18 华为技术有限公司 一种信号处理方法和装置
US9996503B2 (en) 2011-01-10 2018-06-12 Huawei Technologies Co., Ltd. Signal processing method and device
WO2012124422A1 (ja) 2011-03-11 2012-09-20 三洋電機株式会社 録音装置
JPWO2012124422A1 (ja) * 2011-03-11 2014-07-17 三洋電機株式会社 録音装置
US10951859B2 (en) 2018-05-30 2021-03-16 Microsoft Technology Licensing, Llc Videoconferencing device and method
CN112684411A (zh) * 2020-11-26 2021-04-20 哈尔滨工程大学 一种基于改进到达频率差的水下目标定位方法
CN112684411B (zh) * 2020-11-26 2022-06-03 哈尔滨工程大学 一种基于改进到达频率差的水下目标定位方法

Also Published As

Publication number Publication date
US20010028719A1 (en) 2001-10-11
US6516066B2 (en) 2003-02-04

Similar Documents

Publication Publication Date Title
JP2001296343A (ja) 音源方位設定装置及びそれを備えた撮像装置、送信システム
JP4296197B2 (ja) 音源追跡のための配置及び方法
JP2687712B2 (ja) 一体型ビデオカメラ
US6185152B1 (en) Spatial sound steering system
CN101218853B (zh) 音频传输***及通信会议装置
EP2046032B1 (en) A method and an apparatus for obtaining acoustic source location information and a multimedia communication system
JP4965707B2 (ja) 音識別方法および装置
WO2012083989A1 (en) Method of controlling audio recording and electronic device
JP2000165983A (ja) マイクロフォンの感度の制御のための方法
CN205621437U (zh) 一种声像联合定位的远距离语音采集装置
JPH06351015A (ja) テレビジョン会議システム用の撮像システム
EP1257146A2 (en) Method and system of sound processing
JP2006304124A (ja) 音源方向確定装置および音源方向確定方法
JP2004120459A (ja) 音声出力装置
JP2004513591A (ja) 指向性マイクロフォン
JP3531084B2 (ja) 指向性マイクロフォン装置
JPS6292687A (ja) ビデオカメラ
CN112367473A (zh) 一种基于声纹到达相位的可旋转摄像装置及其控制方法
EP1526755A2 (en) Detecting acoustic echoes using microphone arrays
JPS63262576A (ja) マイクロホン装置
WO2012142793A1 (zh) 一种视频通讯终端及视频通讯方法
JP3739673B2 (ja) ズーム推定方法、装置、ズーム推定プログラム、および同プログラムを記録した記録媒体
EP1266538B1 (en) Spatial sound steering system
JPH05308553A (ja) ビデオカメラの録音装置
US20240223986A1 (en) Directional sound emission method, device and apparatus

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20040303