JP2001352530A - 通信会議装置 - Google Patents

通信会議装置

Info

Publication number
JP2001352530A
JP2001352530A JP2000172960A JP2000172960A JP2001352530A JP 2001352530 A JP2001352530 A JP 2001352530A JP 2000172960 A JP2000172960 A JP 2000172960A JP 2000172960 A JP2000172960 A JP 2000172960A JP 2001352530 A JP2001352530 A JP 2001352530A
Authority
JP
Japan
Prior art keywords
speaker
time
visual field
delay time
utterance
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2000172960A
Other languages
English (en)
Inventor
Masafumi Tanaka
雅史 田中
Kenichi Furuya
賢一 古家
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2000172960A priority Critical patent/JP2001352530A/ja
Publication of JP2001352530A publication Critical patent/JP2001352530A/ja
Withdrawn legal-status Critical Current

Links

Landscapes

  • Studio Devices (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

(57)【要約】 【課題】 話者交代にからビデオカメラの視野移動が開
始すまでの遅延時間を適応的に決定する。 【解決手段】 位置推定部10で話者位置を推定して、
その結果に応じて位置履歴管理部201により位置履歴
データベース202を更新し、その位置履歴に基づいて
視野決定部203で視野を決定し、位置履歴、視野、視
野履歴から遅延部204の遅延時間を決定し、前記視野
決定の時点から該遅延時間が経過することにより機器制
御部30でビデオカメラの視野方向と視野角を制御す
る。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、ビデオカメラの視
野やマイクロホンの指向性等を過去の話者位置の位置履
歴と新しい話者位置から決定する通信会議装置に関し、
特に話者位置の変化に伴ってカメラの視野変更やマイク
ロホンの指向性変更の開始までの遅延時間を適応的に制
御する技術に関するものである。
【0002】
【従来の技術】図8は従来の通信会議装置に使用されて
いるビデオカメラの話者自動追従システムの要部を説明
するための図である。10は話者の位置を推定する位置
推定部、20’は選択性制御部である。選択性制御部2
0’では、位置推定部10で得られた話者の位置情報を
受け取り、位置履歴管理部201において話者の位置履
歴データベース202の更新を行い、位置履歴データベ
ース202の位置履歴情報を視野決定部203に入力さ
せてそこで視野を決定し、得られた視野情報を機器制御
部30に出力してビデオカメラの視野角(ズーム)と視
野方向(左右方向)を制御するものである。
【0003】
【発明が解決しようとする課題】従って、従来の技術で
は、視野決定部203で視野が決定されると、直ちにあ
るいは固定の遅延時間の後に、ビデオカメラの移動が開
始する。このようにビデオカメラが動き出すまでの遅延
時間が固定であるために、次のような不都合が生じるこ
とがある。
【0004】まず、話者交代があったときは、前記遅延
時間が長いと、交代した話者の発言が終わってしまうこ
とがある。一方、話者の交代が頻繁な場合には、その交
代に合わせてビデオカメラが速く動き出すように遅延時
間を短くしておくと、映像が乱れ、視聴者に不快感を与
える問題がある。
【0005】また、ビデオカメラの視野方向が大きく移
動する場合には、その視野方向の移動に時間がかかるの
で、その移動時間中に別の話者への交代が起きてビデオ
カメラが迷走することがあり、これを予防するために、
上記遅延時間をその移動が小さい場合よりも長く設定す
る必要がある。しかしこのようにすると、視野移動開始
が常時遅くなるという問題が起こる。
【0006】一方、話者交代に伴うマイクロホンの指向
性変更タイミングについても、ビデオカメラの視野変更
タイミングと大きくずれることは好ましくない。
【0007】本発明の目的は、話者交代によってビデオ
カメラの視野移動やマイクロホンの指向性変更が開始す
るまでの遅延時間を適応的に決定し、上記した問題を解
決した通信会議装置を提供することである。
【0008】
【課題を解決するための手段】上記課題を解決するため
の第1の発明は、映像信号又は少なくとも2以上の音声
信号から話者位置を推定する位置推定手段(10)と、
前記位置推定手段(10)で得られた話者位置を記録し
て位置履歴(202)を更新する位置履歴管理手段(2
01)と、前記位置履歴(202)に基づいて前記映像
信号を収録する撮像手段の視野又は前記音声信号を収録
する集音手段の指向性を決定する視野又は指向性決定手
段(203)と、前記決定された視野又は指向性の情報
を遅延させる遅延手段(204)と、該遅延手段(20
4)に対して可変の遅延時間を設定する遅延時間決定手
段(205)と、前記遅延手段(204)で遅延された
前記視野又は指向性の情報により、前記撮像手段の視野
又は前記集音手段の指向性を新しい話者位置に合わすよ
う設定する機器制御手段(30)と、を有するよう構成
した。
【0009】第2の発明は、第1の発明において、前記
話者位置履歴(202)は、話者位置、発話時刻、発話
時間の組からなり、前記遅延時間決定手段(205)
は、前記発話時間から求められる前の話者の発話継続時
間、新しい話者の累積発話時間から前の話者の累積発話
時間を差し引いた累積発話時間差、及び前の話者位置か
ら新しい話者位置への変化量のうちから選択した少なく
とも1以上により、前記遅延時間を設定するよう構成し
た。
【0010】第3の発明は、第2の発明において、話者
位置の履歴は話者毎に記録され、該話者は映像信号又は
少なくとも2以上の音声信号から判定され、前記判定さ
れた話者の履歴から前記遅延時間を設定するよう構成し
た。
【0011】
【発明の実施の形態】図1は本発明の通信会議装置の実
施形態のブロック図である。10はビデオカメラの映像
信号やマイクロホンの音声信号から話者位置を推定する
位置推定部(位置推定手段)、20は位置推定部10で
得られた話者位置情報に基づきビデオカメラの視野情報
を作成して出力する選択性制御部、30は選択性制御部
20からの視野情報に基づきビデオカメラの視野方向と
視野角を制御する機器制御部(機器制御手段)である。
【0012】位置推定部10は、撮像した画像から1又
は2以上の動物体を判定し、それらの動物体に予め特徴
を設定した人物の頭部が存在するか否かで人物を判定
し、さらにその人物の***が動いているか否かで1人の
話者の位置を推定する。あるいは、複数設置したマイク
ロホンから入力する音声信号を処理して1人の話者の位
置を推定する。
【0013】選択性制御部20において、201は位置
推定部10で得られた話者位置情報を受け取り、位置履
歴データベース202の更新を行う位置履歴管理部、2
03は位置履歴情報を入力して処理することにより当該
話者位置に視野角と視野方向を合わせるようビデオカメ
ラの視野情報を作成する視野決定部(視野決定手段)、
204は視野決定部203で得られた視野情報を遅延さ
せる遅延部(遅延手段)、205はビデオカメラの移動
遅延時間を決める移動遅延時間決定部(遅延時間決定手
段)、206はビデオカメラの視野情報の履歴を管理す
る視野履歴管理部、207は視野履歴データベースであ
る。
【0014】位置履歴データベース202には、話者位
置(各話者は特定の位置から移動しないものとし、その
位置を直交座標又は極座標で登録する)、発話時刻、発
話時間の組からなる話者毎のデータを格納する。話者交
代があり、話者の発話開始や発話終了が検出される毎に
その発話時刻、発話時間、発話者が記録更新される。ま
た、視野履歴データベース207にも、視野情報(視野
角、視野方向)を話者に対応して格納する。
【0015】移動遅延時間決定部205により遅延部2
04の遅延時間を設定する手法として次のような手法が
ある。すなわち、図2に示すように、新しく検出された
話者位置と過去の話者位置履歴から得られる2つの量、
つまり、前の話者の「発話継続時間」と、新しい話者の
累積発話時間(本装置の動作開始からの累積発話時間)
から前の話者の累積発話時間を差し引いた「累積発話時
間差」とによって、遅延時間を設定する。
【0016】「発話継続時間」が長い発話者は、報告や
講演などを行っている場合が多く、他の話者の短い発言
の後に再び発話することが多いと考えられるので、不快
感を招く頻繁なビデオカメラの視野移動を防止するた
め、「発話継続時間」が長い話者から他の話者へ話者交
代があった場合には、「発話継続時間」が短い話者から
他の話者への話者交代があった場合に比べて、遅延時間
を長く設定する。一方、複数人による討論の場合には、
司会者の累積発話時間が短いなど、参加者の累積発話時
間に差が生じることが多い。このように累積発話時間に
差がある状況で話者交代が起こった場合には、前記「累
積発話時間差」が正のとき(新しい話者の累積発話時間
が前の話者の累積発話時間より大きいとき)には、「平
均発話継続時間」が長い話者から短い話者への話者交代
があったことを示すので、「累積発話時間差」が負であ
るような「平均発話継続時間」が短い話者から長い話者
への話者交代の場合に比較して、話者交代が引き続き起
こる可能性が高い。したがって、ビデオカメラの視野の
頻繁な移動を予防するために、「累積発話時間差」が正
のときは負のときよりもビデオカメラの移動遅延時間を
長くする。以上から、図2に示すように「発話継続時
間」が長いほど、また「累積発話時間差」が正で大きい
ほど、ビデオカメラの移動遅延時間を長く設定する。
【0017】さらに、本発明では移動遅延時間決定部2
05での遅延時間の決定要素に視野情報も考慮する。す
なわち、図3に示すように、前の視野から新しい視野へ
の「視野移動量」が小さい場合には、ビデオカメラの視
野の変化が小さいので映像の乱れが小さく、映像の乱れ
よりは素早い視野の追従が優先できるため、遅延時間を
短く設定する。逆に、「視野移動量」が長い場合には、
画像が乱れる危険性を小さくすることに重点をおいて、
ビデオカメラの移動遅延時間を長く設定する。
【0018】具体的な遅延時間の決定手法としては、上
記した「発話継続時間」、「累積発話時間差」、「視野
移動量」の要素から遅延時間を設定するようテーブルを
作成して利用する手法がある。この場合のテーブル内容
は話者交代がある度に更新するようにする。
【0019】又別に、Tをビデオカメラの移動開始まで
の遅延時間、t1を「発話継続時間」、t2を「累積発
話時間差」、wを「視野移動量」とし、a,b,c,d
を正の係数とするとき、 T=f(a・t1+b・t2+c・w+d) のような式により演算によって求めることもできる。こ
の関数f( )は値域の最小値が0以上でかつ上に有界な
単調増加関数であり、その例としては、 tanh(x)+1=2exp(x)/{exp(x)+exp(-x)} あるいは、ステップ関数 s(x)=1 (x>しきい値) =0 (x≦しきい値) がある。
【0020】以上のように、ビデオカメラの視野決定が
なされてからビデオカメラの移動開始までの遅延時間
を、「発話継続時間」、「累積発話時間差」、「視野移
動量」の内の少なくとも1つを利用して決めることによ
り、視野情報が作成されてからビデオカメラの移動が開
始するまでの遅延時間が適応的に調整される。このた
め、ビデオカメラが動き出すまでの時間が固定されてい
る場合に比べて、頻繁に話者が交代する場合は遅延時間
を長くして映像の乱れを防いだり、視野が大きく移動す
る場合は遅延時間を小さく迅速な視野変更を実現するこ
とができる。なお、遅延時間が長いためその遅延時間が
満了する前に話者交代があった場合は、前回の遅延時間
をリセットして、新たな話者に応じた遅延時間を設定す
る。
【0021】図4は位置推定部10の具体的な一例を示
す図で、ビデオカメラで撮像した画像を処理して話者位
置を推定する場合についてのものである。ここでは、画
像の輝度信号YをA/D変換器101によりディジタル
信号に変換してから動きエリア検出部102でフレーム
間の差分をとることにより動きエリアを検出し、A/D
変換器101の出力信号から作成したしきい値により2
値変換部103においてその動きエリアを示す差分情報
を2値化する。次に、この2値化差分情報を水平方向動
エリア抽出部104に取り込み、時間的に及び水平方向
(画像の横方向)に空間的にその2値化差分情報を累積
加算することにより動物体の水平方向の位置座標を動物
体毎に求めて、動エリア選択部105に送る。この動エ
リア選択部105では、もとめた複数の動物体の水平方
向の位置座標から1つの動物体の位置座標を選択して、
頭頂抽出部106と顔幅抽出部107に送る。頭頂抽出
部106では2値変換部103で得られた2値化差分情
報と動エリア選択部106で得られた動物体の位置座標
から1つの動物体の頭頂の座標を求める。顔幅抽出部1
07では2値変換部103で得られた2値化差分情報と
エッジ検出部108で得られた画像のエッジ(輪郭)情
報と頭頂抽出部106で得られた頂部座標とから動物体
(人物)の頭部の左右の座標により頭部情報作成し、顔
特徴抽出部109に送る。この顔特徴抽出部109で
は、人物の顔特徴量の1つである頬の縦線と眉毛や目等
の横線に相当する情報が含まれているか否かにより人物
の頭部か否かを判定し、頭部であると判定したときその
情報を発言者判定部110に送る。この発言者判定部1
10では、頭部の左右の座標と頭頂座標から***の位置
する領域を判定し、その***領域の所定時間毎の変化量
を検出して***が上下に動いているか否かにより、当該
人物が話者か否かを判定する。このようにして、画像情
報から話者位置を推定する(参考文献:特開平7−22
5841)。
【0022】一方、図5は位置推定部10の別の具体的
な一例を示す図で、複数のマイクロホンで得られる複数
の音声信号を処理して話者位置を推定する場合について
のものである。ここでは、受信した音声信号の相互相関
関数をすべてのマイクロホンの組み合わせについて計算
し、得られた相互相関関数について、予め決めた1つの
基準マイクロホンと他のマイクロホンとの間の相互相関
関数の最大値を与える時間差を求め、これを予備推定時
間差とし、全てのマイクロホンについての遅延和パワー
を最大にする時間差を上記予備推定時間差の近傍で探索
して、これを推定時間差とし、この推定時間差に基づい
て音源位置を計算するものである(参考文献:特開平1
1−304906)。なお、この他の複数マイクロホン
で得られる複数の信号を処理して話者位置を推定する方
法は、文献「音響システムと信号処理」、大賀他、電子
情報通信学会の第7章に詳述されている。
【0023】前記した機器制御部30では、選択性制御
部20からの視野情報に基づきビデオカメラの視野方向
と視野角を制御するが、視野方向については推定された
話者位置の方向を向く視野方向となるようビデオカメラ
の上下左右の向きを制御すればよく、視野角については
例えば個々の話者位置に応じた視野角を予めテーブルに
格納しておいて、推定された話者位置に応じてそのテー
ブルから視野角を読み出してビデオカメラのズームを広
角側或いは望遠側等に制御すればよい。
【0024】なお、得られた視野情報に基づきビデオカ
メラの視野方向や視野角の制御と共にマイクロホンの指
向性を制御するようにすることもできる。このときは、
前記視野情報で決定される視野方向からの音声に対する
複数のマイクロホンの出力音声信号が同相となるように
それぞれのマイクロホンの音声信号に時間遅延を与え所
定の重み係数をかけてから加算処理する。これにより、
決定された視野方向から伝搬してくる音声信号以外は互
いに打ち消しあって減衰し、視野方向に対する鋭い指向
性を実現することができる。
【0025】図6は本発明の装置を通信会議装置の話者
自動追従システムに適用した実施形態を示したものであ
る。話者60が発した音声をマイクロホンアレー50で
集音し、集音した複数チャネルの音声信号から位置推定
部10において話者の位置を推定し、その推定した話者
位置の情報を選択性制御部20に入力して視野情報を
得、この視野情報により機器制御部30によりビデオカ
メラ40の視野方向や視野角を制御するものである。
【0026】図7は本発明の装置を通信会議装置の話者
自動追従指向性集音システムに適用した実施形態を示し
たものである。話者60が発した音声をマイクロホンア
レー50で集音し、集音した複数チャネルの音声信号か
ら位置推定部10において話者位置を推定し、推定した
話者位置から選択性制御部20において集音領域(つま
り視野)を決定し、機器制御部30において指向性の向
き、指向性の幅を計算し、アレー信号処理装置70にお
いて複数チャネルの音声信号から集音領域のみの音声信
号を出力するようにしたものである。
【0027】
【発明の効果】以上から本発明によれば、話者の位置履
歴に加えて視野履歴を用いるので、視野決定や指向性決
定からビデオカメラの視野変更開始やマイクロホンの指
向性変更開始までの時間を適応的に制御することがで
き、話者交代に適切に対応することができる利点があ
る。
【図面の簡単な説明】
【図1】 本発明の通信会議装置の要部のブロック図で
ある。
【図2】 話者の発話に適応させたビデオカメラの移動
遅延時間設定手法の説明図である。
【図3】 ビデオカメラの視野移動量に適応させたビデ
オカメラの移動遅延時間の設定手法の説明図である。
【図4】 画像を利用した位置推定部の説明図である。
【図5】 音声を利用した位置推定部の説明図である。
【図6】 話者自動追従ビデオカメラシステムの説明図
である。
【図7】 話者自動追従指向性集音システムの説明図で
ある。
【図8】 従来の通信会議装置の要部のブロック図であ
る。
【符号の説明】
10:位置推定部、101:A/D変換器、102:動
きエリア検出部、103:2値変換部、104:水平方
向動エリア検出部、105:動エリア選択部、106:
頭頂抽出部、107:顔幅抽出部、108:エッジ検出
部、109:顔特徴抽出判定部、110:話者判定部 20:選択性制御部、201:位置履歴管理部、20
2:位置履歴データベース、203:視野決定部、20
4:遅延部、205:移動遅延時間決定部、206:視
野履歴管理部、207:視野履歴データベース 30:機器制御部 40:ビデオカメラ 50:マイクロホンアレー 60:話者 70:アレー信号処理装置
───────────────────────────────────────────────────── フロントページの続き Fターム(参考) 5C022 AA12 AB36 AB62 AB63 AB66 AC41 AC69 AC72 5C064 AA02 AB04 AC04 AC09 AC12 AC22 AD14 5D020 BB03 BB04

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】映像信号又は少なくとも2以上の音声信号
    から話者位置を推定する位置推定手段と、 前記位置推定手段で得られた話者位置を記録して位置履
    歴を更新する位置履歴管理手段と、 前記位置履歴に基づいて前記映像信号を収録する撮像手
    段の視野又は前記音声信号を収録する集音手段の指向性
    を決定する視野又は指向性決定手段と、 前記決定された視野又は指向性の情報を遅延させる遅延
    手段と、 該遅延手段に対して可変の遅延時間を設定する遅延時間
    決定手段と、 前記遅延手段で遅延された前記視野又は指向性の情報に
    より、前記撮像手段の視野又は前記集音手段の指向性を
    新しい話者位置に合わすよう設定する機器制御手段と、 を有することを特徴とする通信会議装置。
  2. 【請求項2】請求項1において、 前記話者位置履歴は、話者位置、発話時刻、発話時間の
    組からなり、 前記遅延時間決定手段は、前記発話時間から求められる
    前の話者の発話継続時間、新しい話者の累積発話時間か
    ら前の話者の累積発話時間を差し引いた累積発話時間
    差、及び前の話者位置から新しい話者位置への変化量の
    うちから選択した少なくとも1以上により、前記遅延時
    間を設定することを特徴とする通信会議装置。
  3. 【請求項3】請求項2において、 話者位置の履歴は話者毎に記録され、 該話者は映像信号又は少なくとも2以上の音声信号から
    判定され、 前記判定された話者の履歴から前記遅延時間を設定する
    ことを特徴とする通信会議装置。
JP2000172960A 2000-06-09 2000-06-09 通信会議装置 Withdrawn JP2001352530A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000172960A JP2001352530A (ja) 2000-06-09 2000-06-09 通信会議装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000172960A JP2001352530A (ja) 2000-06-09 2000-06-09 通信会議装置

Publications (1)

Publication Number Publication Date
JP2001352530A true JP2001352530A (ja) 2001-12-21

Family

ID=18675269

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000172960A Withdrawn JP2001352530A (ja) 2000-06-09 2000-06-09 通信会議装置

Country Status (1)

Country Link
JP (1) JP2001352530A (ja)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1377057A2 (en) * 2002-06-27 2004-01-02 Microsoft Corporation Speaker detection and tracking using audiovisual data
JP2004193661A (ja) * 2002-12-06 2004-07-08 Sony Corp 双方向コミュニケーションシステム,映像通信装置,および映像通信装置の撮影処理制御方法
JP2005354223A (ja) * 2004-06-08 2005-12-22 Toshiba Corp 音源情報処理装置、音源情報処理方法、音源情報処理プログラム
WO2008105252A1 (ja) * 2007-02-28 2008-09-04 Konica Minolta Holdings, Inc. 常時接続型コミュニケーション装置及びその制御方法
JP2010517047A (ja) * 2007-01-26 2010-05-20 マイクロソフト コーポレーション マルチセンサ音源定位
US8547416B2 (en) 2005-06-28 2013-10-01 Sony Corporation Signal processing apparatus, signal processing method, program, and recording medium for enhancing voice
US9894320B2 (en) 2015-09-14 2018-02-13 Ricoh Company, Ltd. Information processing apparatus and image processing system
KR20180073168A (ko) * 2016-12-22 2018-07-02 상명대학교산학협력단 다자간 회의에서의 화자 인식 및 화자 추적 방법
CN113360223A (zh) * 2020-03-06 2021-09-07 株式会社日立制作所 讲话辅助装置、讲话辅助方法及记录介质

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1377057A2 (en) * 2002-06-27 2004-01-02 Microsoft Corporation Speaker detection and tracking using audiovisual data
EP1377057A3 (en) * 2002-06-27 2004-08-11 Microsoft Corporation Speaker detection and tracking using audiovisual data
JP2004193661A (ja) * 2002-12-06 2004-07-08 Sony Corp 双方向コミュニケーションシステム,映像通信装置,および映像通信装置の撮影処理制御方法
JP2005354223A (ja) * 2004-06-08 2005-12-22 Toshiba Corp 音源情報処理装置、音源情報処理方法、音源情報処理プログラム
US8547416B2 (en) 2005-06-28 2013-10-01 Sony Corporation Signal processing apparatus, signal processing method, program, and recording medium for enhancing voice
JP2010517047A (ja) * 2007-01-26 2010-05-20 マイクロソフト コーポレーション マルチセンサ音源定位
WO2008105252A1 (ja) * 2007-02-28 2008-09-04 Konica Minolta Holdings, Inc. 常時接続型コミュニケーション装置及びその制御方法
US9894320B2 (en) 2015-09-14 2018-02-13 Ricoh Company, Ltd. Information processing apparatus and image processing system
KR20180073168A (ko) * 2016-12-22 2018-07-02 상명대학교산학협력단 다자간 회의에서의 화자 인식 및 화자 추적 방법
KR101884446B1 (ko) * 2016-12-22 2018-08-30 상명대학교산학협력단 다자간 회의에서의 화자 인식 및 화자 추적 방법
CN113360223A (zh) * 2020-03-06 2021-09-07 株式会社日立制作所 讲话辅助装置、讲话辅助方法及记录介质

Similar Documents

Publication Publication Date Title
US8248448B2 (en) Automatic camera framing for videoconferencing
US9392221B2 (en) Videoconferencing endpoint having multiple voice-tracking cameras
US9723260B2 (en) Voice tracking camera with speaker identification
JP6651989B2 (ja) 映像処理装置、映像処理方法、及び映像処理システム
JP5594133B2 (ja) 音声信号処理装置、音声信号処理方法及びプログラム
US20100033585A1 (en) System and method for controlling an image collecting device to carry out a target location
CN101223786A (zh) 带有视频时间上变换的处理方法和设备
JP2004515982A (ja) テレビ会議及び他の適用においてイベントを予測する方法及び装置
JP2015104016A (ja) 被写体検出装置、撮像装置、被写体検出装置の制御方法、被写体検出装置の制御プログラムおよび記憶媒体
JP2003533140A (ja) ビデオ会議及び他のアプリケーションに於ける適応的位置決定のための方法及び装置
JP2019186931A (ja) カメラ撮影制御方法、装置、インテリジェント装置およびコンピュータ記憶媒体
JP2001352530A (ja) 通信会議装置
JP7334536B2 (ja) 情報処理装置、情報処理方法、およびプログラム
US11875800B2 (en) Talker prediction method, talker prediction device, and communication system
JP2002034092A (ja) 収音装置
KR100711950B1 (ko) 하이브리드 광학 및 가상 주밍 장치를 사용한 관심있는물체의 실시간 트래킹
JP3739673B2 (ja) ズーム推定方法、装置、ズーム推定プログラム、および同プログラムを記録した記録媒体
JP2009060220A (ja) コミュニケーションシステム及びコミュニケーションプログラム
CN112788278B (zh) 视频流的生成方法、装置、设备及存储介质
JP2022135674A (ja) 電子機器、情報処理装置、制御方法、学習方法、プログラム
WO2023228713A1 (ja) 音声処理装置および方法、情報処理装置、並びにプログラム
AU2011201881B2 (en) Voice tracking camera with speaker indentification
EP4050888A1 (en) Method and system for automatic speaker framing in video applications
JPH08181960A (ja) 遠隔会議映像表示システム
KR20170105727A (ko) 음성분석을 통해 화자를 추적하여 빌딩의 보안을 증강하는 방법 그를 이용한 시스템

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20070904