JP2003008974A - ズーム推定方法、装置、ズーム推定プログラム、および同プログラムを記録した記録媒体 - Google Patents

ズーム推定方法、装置、ズーム推定プログラム、および同プログラムを記録した記録媒体

Info

Publication number
JP2003008974A
JP2003008974A JP2001189571A JP2001189571A JP2003008974A JP 2003008974 A JP2003008974 A JP 2003008974A JP 2001189571 A JP2001189571 A JP 2001189571A JP 2001189571 A JP2001189571 A JP 2001189571A JP 2003008974 A JP2003008974 A JP 2003008974A
Authority
JP
Japan
Prior art keywords
speaker
power
estimation
noise
estimating
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2001189571A
Other languages
English (en)
Other versions
JP3739673B2 (ja
JP2003008974A5 (ja
Inventor
Kazunori Kobayashi
和則 小林
Kenichi Furuya
賢一 古家
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2001189571A priority Critical patent/JP3739673B2/ja
Publication of JP2003008974A publication Critical patent/JP2003008974A/ja
Publication of JP2003008974A5 publication Critical patent/JP2003008974A5/ja
Application granted granted Critical
Publication of JP3739673B2 publication Critical patent/JP3739673B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2201/00Details of transducers, loudspeakers or microphones covered by H04R1/00 but not provided for in any of its subgroups
    • H04R2201/40Details of arrangements for obtaining desired directional characteristic by combining a number of identical transducers covered by H04R1/40 but not provided for in any of its subgroups
    • H04R2201/403Linear arrays of transducers

Landscapes

  • Circuit For Audible Band Transducer (AREA)
  • Closed-Circuit Television Systems (AREA)
  • Studio Devices (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

(57)【要約】 【課題】 話者位置が正確に分からない場合でも、話者
を画面内に収め、話者音声を劣化なしに収音する。 【解決手段】 話者位置推定部12は、マイクロホン
111〜11Mで収音された信号を用いて話者19の位置
と話者音声のパワーを推定する。雑音パワー推定部13
はマイクロホン111〜11Mで収音された信号より雑音
パワーを推定する。精度推定部14は推定された雑音パ
ワーと推定された話者音声パワーと推定話者位置より話
者位置推定精度を演算する。話者範囲設定部15は推定
話者位置と話者位置推定精度から話者範囲を求める。カ
メラ方向・ズーム計算部16は話者範囲全体が画面内に
入るようにテレビカメラ18の方向とズームを計算し、
テレビカメラ18を制御する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、通信会議、遠隔講
義、監視装置等において、複数のマイクロホン等の収音
手段で収集された話者音声により話者位置を推定し、テ
レビカメラを話者位置に向け、話者のクローズアップ映
像を取得する、または話者位置を推定し、指向性を自動
的に話者位置に向け、話者の音声を取得するズーム推定
方法および装置に関する。
【0002】
【従来の技術】図10は従来の話者追従撮像・収音装置
の構成を示している。
【0003】この話者追従撮像・収音装置はマイクロホ
ン111〜11Mと話者位置推定部12と遅延量・ゲイン
計算部51と指向性形成部23とカメラ方向・ズーム計
算部16とテレビカメラ18とを有する。
【0004】話者位置推定部12は複数のマイクロホン
111〜11Mで収音された信号を用いて、話者19の位
置を推定する。指向性形成部23は推定された話者位置
に対する感度が高くなるように指向性21を形成する。
指向性形成部23は、各マイクロホン111〜11Mでの
収音信号を遅延させ、ゲインをかけてから加算する構成
となっており、遅延量およびゲインは、遅延量・ゲイン
計算部51で計算される。遅延量は、各マイクロホン1
1〜11Mで観測された話者音声が同位相となるよう
に、推定話者位置とマイクロホン位置と音速より求めら
れ、ゲインは、指向性形成部23の出力の信号対雑音の
パワー比が最大となるように求められる。このようにし
て、推定された話者位置にテレビカメラ18が向くよう
に、カメラ方向・ズーム計算部16はカメラ方向とズー
ム量を計算し、テレビカメラ18を制御する。これによ
り、話者位置にテレビカメラ18を追従させることが可
能となる。
【0005】また、推定された話者位置に鋭い指向性を
向けることにより、低雑音で話者音声を収音することが
可能となる(例えば、特開平9―261792公報「受
音方法及びその装置」)。
【0006】この公報に記載された方法では、第i番目
のマイクロホンの出力信号に対して、焦点からi番目の
マイクロホンまでの距離に応じて時間遅延を与えるとと
もに、前記距離の累乗値の逆数を乗算し、それらの乗算
した信号を加算し、加算した信号に含まれる焦点位置に
置かれた音源の直接音成分のパワーと残響音成分のパワ
ーの和に応じて加算結果を正規化した後出力する。
【0007】
【発明が解決しようとする課題】しかし、一般的な部屋
で話者位置推定を行った場合、雑音や残響で推定誤差が
生じるため、正確な話者位置にテレビカメラや指向性を
向けることはできない。このため、従来技術では、図1
1に示すように話者が画面からはみ出したり、図12に
示すように話者位置から指向性21がずれ、収音した話
者音声に劣化が生じたりするといった問題が生じる。
【0008】従来の話者追従撮像・収音方法では、雑音
や残響のある環境において話者位置推定精度が低く、話
者が画面からはみ出したり、話者位置から指向性がず
れ、収音した話者音声に劣化が生じたりするという問題
がある。
【0009】本発明の目的は、話者位置が正確に分から
ない場合でも、話者を画面内に収め、話者音声を劣化な
しで収音するズーム推定方法および装置を提供すること
である。
【0010】本発明の他の目的は、音声劣化なしに話者
音声を収音するズーム推定方法および装置を提供するこ
とにある。
【0011】
【課題を解決するための手段】本発明の第1の態様によ
れば、ズーム推定方法は、複数の収音手段の各々で収音
された収音信号により話者音声パワーと話者位置を推定
する話者位置推定段階と、前記収音信号より雑音パワー
を推定する雑音パワー推定段階と、前記話者音声パワー
と話者位置と雑音パワーより話者位置推定精度を演算す
る精度推定段階と、話者位置と話者位置推定精度によ
り、話者が存在する範囲である話者範囲を設定する話者
範囲推定段階と、前記話者範囲より、話者が画面に入る
ようにテレビカメラの方向およびズーム量を決定するカ
メラ方向・ズーム計算段階とを有する。
【0012】本発明の第2の態様によれば、ズーム推定
方法は、複数の収音手段の各々で収音された収音信号に
より話者音声パワーと話者位置を推定する話者位置推定
段階と、前記収音信号より雑音パワーを推定する雑音パ
ワー推定段階と、話者音声パワーと話者位置と雑音パワ
ーより、話者位置精度を演算する精度推定段階と、話者
位置と話者位置推定精度により、話者が存在する範囲で
ある話者範囲を設定する話者範囲推定段階と、話者範囲
に対する感度が、それ以外の位置に対する感度よりも高
くなるように、複数の収音手段を用いて指向性を形成す
るための遅延量とフィルタ係数を、前記話者範囲と各収
音手段の位置より算出する遅延量・フィルタ係数計算段
階と、各収音信号を遅延量とフィルタ係数を用いて処理
し、音声出力を得る指向性形成段階とを有する。
【0013】本発明は、話者位置推定精度を推定し、話
者位置推定精度にあわせて、テレビカメラのズーム量、
もしくは指向性の鋭さを変化させることにより、話者を
画面内に収めること、もしくは話者音声の劣化を防ぐこ
とを実現するものである。
【0014】
【発明の実施の形態】図1を参照すると、本発明の第1
の実施形態のズーム推定装置は、マイクロホン111
11Mと話者位置推定部12と雑音パワー推定部13と
精度推定部14と話者範囲設定部15とカメラ方向・ズ
ーム計算部16とによって構成されている。
【0015】本実施形態のズーム推定装置は、話者位置
を推定し、テレビカメラ18を話者位置に向け、話者1
9のクローズアップ映像を取得し、また、話者位置精度
を推定し、話者位置推定精度にあわせてテレビカメラ1
8のズーム量を変化させることで、話者位置推定精度が
低い場合でも、話者を画面内に収めることを実現する装
置である。
【0016】話者位置推定部12は、マイクロホン11
1〜11Mで収音された信号を用いて話者19の位置と話
者音声のパワーを推定する。話者位置推定部12は、例
えば図2に示すように指向性走査部121とパワー分布
計算部122と最大パワー位置検出部123により構成
される。指向性走査部121は、各マイクロホン出力に
遅延di (x, y, z)とゲインgi (x, y, z)を与え加算する
ことにより鋭い指向性を形成し、その指向性を話者が存
在可能な範囲で走査する。ここで、「走査」とは後述す
るように各チャネルからの音声信号から距離減衰、遅延
を施して計算されたパワーが最大になる位置(x, y, z)
を、予め準備された候補となる位置(x, y, z)から選ぶ
ことである。
【0017】走査位置(x, y, z)の場合に、i番目のマイ
クロホン11iに与えられる遅延量di (x, y,z)は、走査
位置(x,y,z)から発せられた音が同位相となるように、
走査位置(x, y, z)とi番目のマイクロホン位置(xi, yi,
zi)と音速cより、式(1)および式(2)を用いて求
められる。
【0018】
【数1】
【0019】ただし、Dは固定遅延量であり、信号を進
ませることができないという因果性を満足させるため
に、di(x, y, z)が必ず正となるように与えられる定数
であり、ri (x, y, z)は、走査位置(x, y, z)とi番目の
マイクロホン位置(xi, yi, zi)間の距離である。
【0020】また、走査位置 (x, y, z)の場合に、i番
目のマイクロホン11iに与えられるゲインgi (x, y,
z)は、信号対雑音比が最大となり、各走査位置に対する
利得が一定となるように、式(3)で与えられる。
【0021】
【数2】
【0022】ただし、Vは部屋の体積(m3)であり、TR
は残響時間(s)である。
【0023】走査位置(x, y, z)に対し得られる指向
性走査部121の出力y (t, x, y, z)は、各マイクロホ
ン111〜11Mで受音された信号xi (t)に、遅延di (x,
y,z)とゲインgi (x, y, z)を与え加算した信号であり、
式(4)で表される。
【0024】
【数3】
【0025】ただし、xi (t)はi番目のマイクロホンで
収音された信号であり、tは時刻である。
【0026】次に、パワー分布計算部122は指向性走
査部121の出力信号y (t, x, y,z)の短時間平均パワ
ーを走査位置毎に計算する。走査位置毎に計算されたパ
ワーP (x, y, z)(パワー分布)は、式(5)で表され
る。
【0027】
【数4】
【0028】ただし、Tは、短時間平均パワーを求める
ための平均時間であり0.1〜1s程度の値である。
【0029】式(5)のパワー分布は、走査位置に鋭い
指向性を向けた場合に収音された音のパワーであるの
で、その位置にある音源のパワーの推定値となってい
る。すなわち、パワー分布のうち、大きいパワーを有す
る位置には音源があり、大きいパワーの位置を検出する
ことにより話者位置の推定が可能となる。最大パワー位
置検出部123では、最大パワーを持つ走査位置を検出
し、最も大きい音を発する音源位置を検出する。以上の
方法により、話者位置の検出が可能となる。ただし、パ
ワー分布には、雑音の影響によるパワーが加算されてい
ることにより、位置の推定誤差が生じる。
【0030】雑音パワー推定部13では、マイクロホン
111〜11Mで収音された信号より雑音パワーを推定す
る。雑音パワー推定部13は、例えば図3に示すよう
に、パワー変動検出部131と長時間平均パワー計算部
132により構成される。パワー変動検出部131は、
マイクロホン111〜11Mで収音された信号の短時間平
均パワー(0.1〜1s程度)を監視し、パワー変動が大
きい場合にパワー変動ありとして検出する。パワー変動
の検出は、例えば短時間平均パワーの標準偏差が、予め
設定した閾値を超えた場合に、パワー変動ありと検出す
る。長時間平均パワー計算部132は、パワー変動検出
部131による検出結果がパワー変動なしである場合
に、マイクロホン111〜11Mで収音した信号の長時間
平均パワー(1s〜10s程度)を計算する。このように
パワー変動のない期間の長時間平均パワーを計算するこ
とにより、雑音パワーを推定することが可能となる。
【0031】精度推定部14では、推定された雑音パワ
ーと推定された話者音声パワーと推定話者位置より話者
位置推定精度を演算する。精度推定部14は、例えば図
2に示すように、雑音パワー分布計算部142とパワー
分布記憶部141と精度計算部143とにより構成され
る。まず、雑音パワー分布計算部142では、雑音パワ
ー推定部13により推定された雑音パワーP'Nより、パ
ワー分布にどの程度の雑音が含まれているか(雑音パワ
ー分布)を計算する。各マイクロホン111〜11Mに互
いに無相関で平均パワーがP'Nである雑音N1 (t)〜N
M (t)が到来していると仮定すれば、雑音パワー分布PN
(x, y, z)は式(6)により求めることができる。
【0032】
【数5】
【0033】次に、指向性走査部121とパワー分布計
算部122により計算されたパワー分布P (x, y, z)
は、パワー分布記憶部141に記憶される。精度計算部
143では、記憶されたパワー分布P (x, y, z)と雑音
パワー分布PN (x, y, z)と推定話者位置(xt, yt, zt)よ
り精度を求める。求め方の説明は、図4を用いて行う。
図4において、縦軸は線形である。パワー分布P(x, y,
z)は雑音の影響を含んでおり、雑音パワー分布はPN(x,
y, z)であるので、雑音がなかった場合のパワー分布Ps
(x, y, z)は、式(7)の値の範囲をとり得る。
【0034】
【数6】
【0035】このとき、Ps (x, y, z)で最大値となる可
能性のある位置は、式(8)に示す条件を満たす位置の
みである。
【0036】
【数7】
【0037】ただし、PMAXはP (x, y, z)の最大値であ
る。
【0038】図4においては(最大パワー)―(雑音パ
ワー分布)の曲線を超えるパワー分布を持つ範囲がPs
(x, y, z)で最大値となる可能性のある位置であり、誤
差の範囲となる。したがって、誤差の範囲のうち、推定
話者位置より最も離れた位置までの距離が話者位置推定
精度となる。
【0039】話者範囲設定部15は、推定話者位置と話
者位置推定精度から、話者が存在する範囲(話者範囲)
を求める。具体的には、推定話者位置を中心とし、話者
位置推定精度を半径rとした球内が話者範囲となる。
【0040】この話者範囲内に話者がいるわけであるか
ら、話者範囲全体が画面内に入るようにテレビカメラ1
8を制御すれば、図5に示すように画面内から話者がは
み出すことはない。
【0041】話者範囲全体が画面内に入るようにするに
は、テレビカメラ方向とズーム量を適切に決定する必要
がある。図6は、テレビカメラ方向とズーム量を決定す
る方法を説明する図であり、x, y, zの直交座標系で位
置を表すものとする。テレビカメラ位置は座標(xc, yc,
zc)であり、推定話者位置(xt, yt, zt)であり、話者範
囲は半径rの球形である。また、話者が最も中心座標よ
りずれた場合でも画面からはみ出さないように、50cm
〜100cm程度のマージンδを設け、その球体を画面範
囲とした。
【0042】まず、テレビカメラ方向は推定話者位置(x
t, yt, zt) とカメラ位置(xc, yc,zc)より決定すること
が可能であり、テレビカメラ18の水平回転角θHは式
(9)により求めることができ、垂直回転角θVは式
(10)により求めることができる。
【0043】
【数8】
【0044】テレビカメラ18の視野角φは、テレビカ
メラ18から推定話者位置までの距離と話者範囲の半径
rおよびマージンδより求められる。これは式(11)
で計算される。
【0045】
【数9】
【0046】また、ズームの倍率が1倍であるときの視
野角をφ0とすれば、ズームの倍率Zは、式(12)で表
される。
【0047】
【数10】
【0048】以上の計算式により、話者範囲全体が画面
内に入るテレビカメラ方向とズーム量を計算することが
でき、話者位置推定精度が低くても画面内から話者がは
み出すことなく、適切なテレビカメラ制御が可能とな
る。
【0049】図7を参照すると、本発明の第2の実施形
態のズーム推定装置は、マイクロホン111〜11Mと話
者位置推定部12と雑音パワー推定部13と精度推定部
14と話者範囲設定部15と遅延量・フィルタ係数計算
部22と指向性形成部23とによって構成されている。
【0050】本実施形態のズーム推定装置は、話者位置
を推定し、指向性を自動的に話者位置に向け、話者の音
声を取得する。また、話者位置推定精度を演算し、図8
に示すように話者位置推定精度にあわせて指向性の鋭さ
を自動的に変化させることで、話者位置推定精度が低い
場合でも、話者音声の劣化を防ぐことを実現する装置で
ある。
【0051】話者位置推定部12と雑音パワー推定部1
3と精度推定部14と話者範囲設定部15とは第1の実
施形態と同じであるので説明を省略する。
【0052】話者範囲全体に対して感度が高くなるよう
に指向性を制御する方法について説明する。指向性形成
部23は、図9に示すように各マイクロホン111〜1
Mで収音された信号を、各遅延器2311〜231M
より遅延し、フィルタ2321〜232Mによりフィルタ
リングしてから、加算器233により加算することで、
話者範囲全体に対する感度が高くなるよう指向性21を
形成する。遅延量およびフィルタ係数は、遅延量・フィ
ルタ係数計算部22で計算される。
【0053】i番目のマイクロホン11iに与えられる遅
延量di (xt, yt, zt)は、各マイクロホン111〜11M
で観測された話者音声が同位相となるように、話者範囲
の中心位置(xt, yt, zt)とi番目のマイクロホン位置
(xi, yi, zi)と音速cより、式(13)を用いて求めら
れる。
【0054】
【数11】
【0055】ただし、Dは固定遅延量であり、信号を進
ませることができないという因果性を満足させるため
に、di(xt, yt, zt)が必ず正となるように与えられる
定数である。
【0056】フィルタ係数は、話者範囲設定部15によ
り求められた話者範囲全体の感度が高くなるように指向
性の幅を調整するように求められ、例えば、特許願20
00―118069「収音方法および収音装置」の方法
により求めることができる。すなわち、話者範囲に分布
(一様分布、正規分布等)する音源を仮定し、音源から
指向性形成部23の出力までの直接波成分の応答を求
め、音声信号の劣化量と信号対雑音のパワー比を求め
る。劣化量が話者範囲の感度の高さの評価基準となり、
信号対雑音のパワー比が話者範囲外の感度の低さの評価
基準となるので、この二つの評価基準のバランスのとれ
たフィルタを求めることにより、話者範囲全体の感度を
高くし、雑音を抑圧するフィルタ係数を求めることがで
きる。
【0057】以上の方法により、話者範囲全体に対する
感度が高くなるような指向性が自動的に形成され、音質
劣化のない音声の収音が可能となる。
【0058】なお、以上説明したズーム装置の処理は、
該処理をフロッピィ・ディスク、CD―ROM、光磁気ディ
スク等の可搬の記録媒体あるいはハードディスクに記録
して、パソコン等のコンピュータで実行することもでき
る。
【0059】
【発明の効果】以上説明したように、本発明によれば、
話者位置推定精度が低くても、画面内から話者がはみ出
すことなくクローズアップ映像を自動制御で得ること、
もしくは、音質劣化が生じることなく話者音声を収音す
ることができる。
【図面の簡単な説明】
【図1】本発明の第1の実施形態のズーム装置の構成を
示すブロック図である。
【図2】話者位置推定部12と精度推定部14の構成を
示すブロック図である。
【図3】雑音パワー推定部13の構成を示すブロック図
である。
【図4】本発明の第1の実施形態のズーム装置において
話者位置推定精度を求める方法を説明する図である。
【図5】ズーム装置の指向性を示す図である。
【図6】テレビカメラ方向とズーム量を決定する方法を
説明する図である。
【図7】本発明の第2の実施形態のズーム装置の構成を
示すブロック図である。
【図8】ズーム装置の映像を示す図である。
【図9】指向性形成部23の1つの具体例を示す図であ
る。
【図10】従来のズーム装置の構成を示す図である。
【図11】図10のズーム装置の映像を示す図である。
【図12】図10のズーム装置の指向性を示す図であ
る。
【符号の説明】
111〜11M マイクロホン 12 話者位置推定部 13 雑音パワー推定部 14 精度推定部 15 話者範囲設定部 16 カメラ方向・ズーム計算部 18 テレビカメラ 19 話者 21 指向性 22 遅延量・フィルタ係数計算部 23 指向性形成部 121 指向性走査部 122 パワー分布計算部 123 最大パワー位置検出部 131 パワー変動検出部 132 長時間平均パワー計算部 141 パワー分布記憶部 142 雑音パワー分布計算部 143 精度計算部 51 遅延量・ゲイン計算部 2311〜231M 遅延器 2321〜232M フィルタ 233 加算器
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.7 識別記号 FI テーマコート゛(参考) H04R 3/00 320 G10L 3/00 511 Fターム(参考) 5C022 AB63 AB66 AC69 AC72 5C054 AA01 CC02 CG00 CG07 CH01 EA01 HA18 5D015 DD02 5D020 BB04

Claims (14)

    【特許請求の範囲】
  1. 【請求項1】 複数の収音手段の各々で収音された収音
    信号により話者音声パワーと話者位置を推定する話者位
    置推定段階と、 前記収音信号より雑音パワーを推定する雑音パワー推定
    段階と、 前記音声パワーと前記話者位置と前記雑音パワーより話
    者位置推定精度を演算する精度推定段階と、 前記話者位置と前記話者位置推定精度により、話者が存
    在する範囲である話者範囲を設定する話者範囲推定段階
    と、 前記話者範囲より、話者が画面に入るようにテレビカメ
    ラの方向およびズーム量を決定するカメラ方向・ズーム
    計算段階とを有するズーム推定方法。
  2. 【請求項2】 複数の収音手段の各々で収音された収音
    信号により話者音声パワーと話者位置を推定する話者位
    置推定段階と、 前記収音信号より雑音パワーを推定する雑音パワー推定
    段階と、 前記音声パワーと前記話者位置と前記雑音パワーより話
    者位置推定精度を演算する精度推定段階と、 前記話者位置と前記話者位置推定精度により、話者が存
    在する範囲である話者範囲を設定する話者範囲推定段階
    と、 前記話者範囲に対する感度が、それ以外の位置に対する
    感度よりも高くなるように、前記複数の収音手段を用い
    て指向性を形成するための遅延量とフィルタ係数を、前
    記話者範囲と前記収音手段の位置より算出する遅延量・
    フィルタ係数計算段階と、 前記各収音信号を前記遅延量と前記フィルタ係数を用い
    て処理し、音声出力を得る指向性形成段階とを有するズ
    ーム推定方法。
  3. 【請求項3】 前記話者位置推定段階は、 全ての収音手段で収音された収音信号が同位相となるよ
    うな遅延と、信号対雑音比が最大となり、各走査位置に
    対する利得が一定となるようなゲインを各収音手段の出
    力に加算する指向性走査段階と、 前記指向性走査段階の出力信号の短時間平均パワーを、
    走査位置毎に計算するパワー分布計算手段と、 最大パワーを持つ走査位置を検出することにより話者位
    置を推定する最大パワー位置検出段階を有する、請求項
    1または2記載の方法。
  4. 【請求項4】 前記雑音パワー推定段階は、 前記各収音手段で収音された信号の短時間平均パワーを
    監視し、パワー変動が大きい場合にパワー変動ありとし
    て検出するパワー変動検出段階と、 前記パワー変動検出手段による検出結果がパワー変動な
    しである場合に、前記複数の収音手段で収音された信号
    の長時間平均パワーを計算する段階を有する、請求項1
    から3のいずれか1項記載の方法。
  5. 【請求項5】 前記精度推定段階は、 前記雑音パワー推定手段により推定された雑音パワーよ
    りパワー分布にどの程度の雑音が含まれているかを示す
    雑音パワー分布を計算する雑音パワー分布計算段階と、 前記話者位置推定段階で推定された話者音声パワーを記
    憶するパワー分布記憶段階と、 前記パワー分布記憶段階で記憶された話者音声パワー
    と、前記雑音パワー分布と、前記話者位置推定段階で求
    められた推定話者位置より前記話者音声位置推定精度を
    演算する精度計算手段を有する、請求項1から4のいず
    れか1項記載の方法。
  6. 【請求項6】 前記指向性形成段階は、 各収音手段で収音された収音信号を、全ての収音信号が
    同位相となるようにそれぞれ遅延する遅延段階と、 話者範囲全体に対する感度が高くなるように各遅延段階
    の出力をフィルタリングするフィルタリング段階と、 複数のフィルタリング結果を加算する加算段階を有す
    る、請求項2記載の方法。
  7. 【請求項7】 複数の収音手段の各々で収音された収音
    信号により話者音声パワーと話者位置を推定する話者位
    置推定手段と、 前記収音信号より雑音パワーを推定する雑音パワー推定
    手段と、 前記音声パワーと前記話者位置と前記雑音パワーより話
    者位置推定精度を演算する精度推定手段と、 前記話者位置と前記話者位置推定精度により、話者が存
    在する範囲である話者範囲を設定する話者範囲推定手段
    と、 前記話者範囲より、話者が画面に入るようにテレビカメ
    ラの方向およびズーム量を決定するカメラ方向・ズーム
    計算手段とを有するズーム推定装置。
  8. 【請求項8】 複数の収音手段の各々で収音された収音
    信号により話者音声パワーと話者位置を推定する話者位
    置推定手段と、 前記収音信号より雑音パワーを推定する雑音パワー推定
    手段と、 前記音声パワーと前記話者位置と前記雑音パワーより話
    者位置推定精度を演算する精度推定手段と、 前記話者位置と前記話者位置推定精度により、話者が存
    在する範囲である話者範囲を設定する話者範囲推定段手
    段と、 前記話者範囲に対する感度が、それ以外の位置に対する
    感度よりも高くなるように、前記複数の収音手段を用い
    て指向性を形成するための遅延量とフィルタ係数を、前
    記話者範囲と前記収音手段の位置より算出する遅延量・
    フィルタ係数計算手段と、 前記各収音信号を前記遅延量と前記フィルタ係数を用い
    て処理し、音声出力を得る指向性形成手段とを有するズ
    ーム推定装置。
  9. 【請求項9】 前記話者位置推定手段は、 全ての収音手段で収音された収音信号が同位相となるよ
    うな遅延と、信号対雑音比が最大となり、各走査位置に
    対する利得が一定となるようなゲインを各収音手段の出
    力に加算する指向性走査手段と、 前記指向性走査手段の出力信号の短時間平均パワーを、
    走査位置毎に計算するパワー分布計算手段と、 最大パワーを持つ走査位置を検出することにより話者位
    置を推定する最大パワー位置検出手段を有する、請求項
    7または8記載の装置。
  10. 【請求項10】 前記雑音パワー推定手段は、 前記各収音手段で収音された信号の短時間平均パワーを
    監視し、パワー変動が大きい場合にパワー変動ありとし
    て検出するパワー変動検出手段と、 前記パワー変動検出手段による検出結果がパワー変動な
    しである場合に、前記複数の収音手段で収音された信号
    の長時間平均パワーを計算する手段を有する、請求項7
    から9のいずれか1項記載の装置。
  11. 【請求項11】 前記精度推定手段は、 前記雑音パワー推定手段により推定された雑音パワーよ
    りパワー分布にどの程度の雑音が含まれているかを示す
    雑音パワー分布を計算する雑音パワー分布計算手段と、 前記話者位置推定手段で推定された話者音声パワーを記
    憶するパワー分布記憶手段と、 前記パワー分布記憶手段に記憶された話者音声パワー
    と、前記雑音パワー分布と、前記話者位置推定手段で求
    められた推定話者位置より前記話者音声位置推定精度を
    演算する精度計算手段を有する、請求項7から10のい
    ずれか1項記載の装置。
  12. 【請求項12】 前記指向性形成手段は、 各収音手段で収音された収音信号を、全ての収音信号が
    同位相となるようにそれぞれ遅延する複数の遅延手段
    と、 話者範囲全体に対する感度が高くなるように各遅延手段
    の出力をフィルタリングする複数のフィルタ手段と、 複数のフィルタ手段の出力を加算する加算手段を有す
    る、請求項8記載の装置。
  13. 【請求項13】 請求項1から6のいずれか1項に記載
    のズーム推定方法をコンピュータに実行させるズーム推
    定プログラム。
  14. 【請求項14】 請求項1から6のいずれか1項に記載
    のズーム推定方法をコンピュータに実施させるズーム推
    定プログラムを記録した記録媒体。
JP2001189571A 2001-06-22 2001-06-22 ズーム推定方法、装置、ズーム推定プログラム、および同プログラムを記録した記録媒体 Expired - Fee Related JP3739673B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001189571A JP3739673B2 (ja) 2001-06-22 2001-06-22 ズーム推定方法、装置、ズーム推定プログラム、および同プログラムを記録した記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001189571A JP3739673B2 (ja) 2001-06-22 2001-06-22 ズーム推定方法、装置、ズーム推定プログラム、および同プログラムを記録した記録媒体

Publications (3)

Publication Number Publication Date
JP2003008974A true JP2003008974A (ja) 2003-01-10
JP2003008974A5 JP2003008974A5 (ja) 2005-11-04
JP3739673B2 JP3739673B2 (ja) 2006-01-25

Family

ID=19028471

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001189571A Expired - Fee Related JP3739673B2 (ja) 2001-06-22 2001-06-22 ズーム推定方法、装置、ズーム推定プログラム、および同プログラムを記録した記録媒体

Country Status (1)

Country Link
JP (1) JP3739673B2 (ja)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005354223A (ja) * 2004-06-08 2005-12-22 Toshiba Corp 音源情報処理装置、音源情報処理方法、音源情報処理プログラム
WO2007122729A1 (ja) * 2006-04-18 2007-11-01 Hitachi, Ltd. 通信システム、通信装置及び音源方向特定装置
JP2008103824A (ja) * 2006-10-17 2008-05-01 Yamaha Corp 音声会議装置及び音声会議システム
JP2008205690A (ja) * 2007-02-19 2008-09-04 Ntt Docomo Inc 監視システム及び監視カメラ装置
US8064618B2 (en) 2007-07-31 2011-11-22 Sony Corporation Direction detection apparatus, direction detection method and direction detection program, and direction control apparatus, direction control method, and direction control program
JP5939341B1 (ja) * 2015-07-14 2016-06-22 パナソニックIpマネジメント株式会社 モニタリングシステム及びモニタリング方法
US10909384B2 (en) 2015-07-14 2021-02-02 Panasonic Intellectual Property Management Co., Ltd. Monitoring system and monitoring method

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09140000A (ja) * 1995-11-15 1997-05-27 Nippon Telegr & Teleph Corp <Ntt> 会議用拡聴器
JPH10145763A (ja) * 1996-11-15 1998-05-29 Mitsubishi Electric Corp 会議システム
JPH10191290A (ja) * 1996-12-27 1998-07-21 Kyocera Corp マイクロホン内蔵型ビデオカメラ
JPH10207490A (ja) * 1997-01-22 1998-08-07 Toshiba Corp 信号処理装置
JPH1118191A (ja) * 1997-06-23 1999-01-22 Nippon Telegr & Teleph Corp <Ntt> 収音方法およびその装置
JPH1118194A (ja) * 1997-06-26 1999-01-22 Fujitsu Ltd マイクロホンアレイ装置
JPH1118192A (ja) * 1997-06-23 1999-01-22 Nippon Telegr & Teleph Corp <Ntt> 収音方法およびその装置

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09140000A (ja) * 1995-11-15 1997-05-27 Nippon Telegr & Teleph Corp <Ntt> 会議用拡聴器
JPH10145763A (ja) * 1996-11-15 1998-05-29 Mitsubishi Electric Corp 会議システム
JPH10191290A (ja) * 1996-12-27 1998-07-21 Kyocera Corp マイクロホン内蔵型ビデオカメラ
JPH10207490A (ja) * 1997-01-22 1998-08-07 Toshiba Corp 信号処理装置
JPH1118191A (ja) * 1997-06-23 1999-01-22 Nippon Telegr & Teleph Corp <Ntt> 収音方法およびその装置
JPH1118192A (ja) * 1997-06-23 1999-01-22 Nippon Telegr & Teleph Corp <Ntt> 収音方法およびその装置
JPH1118194A (ja) * 1997-06-26 1999-01-22 Fujitsu Ltd マイクロホンアレイ装置

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005354223A (ja) * 2004-06-08 2005-12-22 Toshiba Corp 音源情報処理装置、音源情報処理方法、音源情報処理プログラム
WO2007122729A1 (ja) * 2006-04-18 2007-11-01 Hitachi, Ltd. 通信システム、通信装置及び音源方向特定装置
JPWO2007122729A1 (ja) * 2006-04-18 2009-08-27 株式会社日立製作所 通信システム、通信装置及び音源方向特定装置
JP2008103824A (ja) * 2006-10-17 2008-05-01 Yamaha Corp 音声会議装置及び音声会議システム
JP2008205690A (ja) * 2007-02-19 2008-09-04 Ntt Docomo Inc 監視システム及び監視カメラ装置
JP4667407B2 (ja) * 2007-02-19 2011-04-13 株式会社エヌ・ティ・ティ・ドコモ 監視システム及び監視カメラ装置
US8064618B2 (en) 2007-07-31 2011-11-22 Sony Corporation Direction detection apparatus, direction detection method and direction detection program, and direction control apparatus, direction control method, and direction control program
JP5939341B1 (ja) * 2015-07-14 2016-06-22 パナソニックIpマネジメント株式会社 モニタリングシステム及びモニタリング方法
JP2017022664A (ja) * 2015-07-14 2017-01-26 パナソニックIpマネジメント株式会社 モニタリングシステム及びモニタリング方法
US10909384B2 (en) 2015-07-14 2021-02-02 Panasonic Intellectual Property Management Co., Ltd. Monitoring system and monitoring method

Also Published As

Publication number Publication date
JP3739673B2 (ja) 2006-01-25

Similar Documents

Publication Publication Date Title
EP1004204B1 (en) Videoconferencing system with audio source location
EP2472511B1 (en) Audio signal processing device, audio signal processing method, and program
US8139793B2 (en) Methods and apparatus for capturing audio signals based on a visual image
JP4449987B2 (ja) 音声処理装置、音声処理方法およびプログラム
JP4296197B2 (ja) 音源追跡のための配置及び方法
US8233642B2 (en) Methods and apparatuses for capturing an audio signal based on a location of the signal
US20070223732A1 (en) Methods and apparatuses for adjusting a visual image based on an audio signal
EP3542549A1 (en) Distributed audio capture and mixing controlling
WO2016028448A1 (en) Method and apparatus for estimating talker distance
JP2006222618A (ja) カメラ装置、カメラ制御プログラム及び記録音声制御方法
US9781509B2 (en) Signal processing apparatus and signal processing method
JP2003270034A (ja) 音情報解析方法、装置、プログラム、および記録媒体
JP3739673B2 (ja) ズーム推定方法、装置、ズーム推定プログラム、および同プログラムを記録した記録媒体
JPH06351015A (ja) テレビジョン会議システム用の撮像システム
JP5998483B2 (ja) 音声信号処理装置、音声信号処理方法、プログラム及び記録媒体
US11889260B2 (en) Determination of sound source direction
JP2001352530A (ja) 通信会議装置
JPH1155784A (ja) 場内拡声方法およびその装置
JP2000278581A (ja) ビデオカメラ
JP7245034B2 (ja) 信号処理装置、信号処理方法およびプログラム
CN118102155B (zh) 麦克风的增益方法及***
EP3566464B1 (en) Sound leveling in multi-channel sound capture system
JP3332144B2 (ja) 目的音源領域検出方法およびその装置
WO2023228713A1 (ja) 音声処理装置および方法、情報処理装置、並びにプログラム
WO2018129086A1 (en) Sound leveling in multi-channel sound capture system

Legal Events

Date Code Title Description
RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20050610

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050913

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20051020

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20051026

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20051102

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091111

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101111

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101111

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111111

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111111

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121111

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121111

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131111

Year of fee payment: 8

LAPS Cancellation because of no payment of annual fees