JP6500625B2 - 検知装置、検知システム、検知方法及びプログラム - Google Patents
検知装置、検知システム、検知方法及びプログラム Download PDFInfo
- Publication number
- JP6500625B2 JP6500625B2 JP2015121246A JP2015121246A JP6500625B2 JP 6500625 B2 JP6500625 B2 JP 6500625B2 JP 2015121246 A JP2015121246 A JP 2015121246A JP 2015121246 A JP2015121246 A JP 2015121246A JP 6500625 B2 JP6500625 B2 JP 6500625B2
- Authority
- JP
- Japan
- Prior art keywords
- user
- detection
- utterance
- unit
- tracking
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Television Signal Processing For Recording (AREA)
- Studio Devices (AREA)
Description
また、近時、音をトリガに、その音を発した音源(例えば、発声したユーザ)をトラッキングする技術もカメラなどで使用されている(例えば、特許文献1など)。
このようなことから、ユーザの発声タイミングを事前に検知する技術が望まれている。
ユーザの喉の震えの大きさの経時的変化を示す波形を周波数変換して得られた周波数波形と、予め学習しておいた発声前の周波数の特徴を示す特徴波形と、の比較に基づいて、前記ユーザの発声に先立つ喉の震えを検知する検知手段と、
前記検知手段の検知結果に基づき、所定処理を実行する実行手段と、
を備えたことを特徴とする検知装置を提供するものである。
図1は、本発明の実施形態に係る検知システム10の構成を示す図である。この検知システム10は、検知装置(センシングデバイス)100と、追尾装置(Webカメラ)200と、から構成される。検知装置100は、ウェアラブル装置であってユーザに装着される。この実施形態においては、ユーザの発声前の喉の震えを検知する関係上、検知装置100は首に着ける装身具であって、例えば、ネックレスである。
この検知の後、検知装置100は、ユーザIDを無線送信する。次に、追尾装置200は、受信したユーザIDのユーザを追尾する。以上が自動追尾の流れである。
また、追尾装置200が写す映像はリアルタイムにPC(Personal Computer)300に転送され、そのPC300のディスプレイ301にライブビューが表示されている前提で説明する。また、図1のユーザはユーザAと称して説明し、ユーザAを特段特定する必要がなければ上位概念としてユーザと称して説明する。
制御部120は機能として、検知部121と特定部122と送信部123を備える。
制御部220は、例えばCPUやROM、RAMなどにより構成される。制御部220は、ROMに記憶されたプログラムに従って制御することにより、各部(受信部221、追尾部222、実行部223)の機能を実現する。
サーボモータ250は、サーボ機構によって位置・速度制御を行うモータである。このサーボモータ250により、追尾装置200の撮像部230は、上下左右に回動可能である。
操作部260は、電源ボタンなどの各種ボタンによって構成される。
マイク280は、外部音声を収音する音声入力部である。
制御部220は、機能として受信部221、追尾部222、実行部223を備える。
検知装置100は、以上の検知処理を、生理的な挙動を検知する都度、反復して実行する。
ユーザIDと時間情報を受信すると、追尾部222は、ユーザIDのユーザを追尾する(ステップS22)。具体的には、追尾部222は、上述した要領で、追尾用テーブルからユーザIDAに対応する顔画像A1を特定し、その特定した顔画像A1に基づいて、ユーザAを追尾する。
また、検知装置100は、学習しておいた発声前波形131における特徴波形と、リアルタイムに周波数変換して得られる周波数波形と、を比較することでユーザの喉の震えを検知する。このため、精度よく発声前の生理的な挙動を検知することができる。
この利用例によれば、会議などのライブチャットにおいて、複数のユーザが互いのしゃべり始める瞬間を逃さず見ることができるので、会話の齟齬を減らすことができる。このように、検知システム10は、複数人で使用する場合に好適である。なお、図11の例の場合、発声タイミングにおいて所定処理(上述した実施形態において動画録画を開始するなど)を実行するのは必須ではない。
これによれば、ユーザAの顔が半分フレームアウトしたとしてもネックレスが映っている限りユーザAをトラッキングできるとともに、顔画像とあわせて追尾を行えば追尾精度を上げることができる。
上述した実施形態においてはユーザが追尾装置200の画角内に入っている場合、すなわちフレームアウトしていない場合を前提に説明した。しかし、実際にはユーザがフレームアウトする場合も想定される。そこで、この変形例1においては、ユーザがフレームアウトした場合に備えた検知システムについて説明する。図13に変形例1に係る検知装置100’の構成を示す。この検知装置100’は、上述した実施形態の検知装置100と比べて、GPS(Global Positioning System)111を備えた点、特定部122が位置特定を行う点、が異なる。以下ではこの異なる点を中心に説明する。
特定部122は、検知部121がユーザの喉の震えを検知すると、ユーザの位置情報をGPS111に基づいて特定する。例えば、特定部122は、図1のユーザAの緯度X、経度YをGPS111に基づいて特定する。送信部123は、ユーザIDAと、特定した位置情報と、を無線送信する。
上述した変形例1においては、ユーザがフレームアウトした場合に備えて、検知装置100’が位置情報を特定して無線送信するようにしたが、これに限られない。この変形例2においては、追尾装置200’が発声前のユーザ位置を推定して探索する点について説明する。図14に変形例2に係る追尾装置200’を示す。この追尾装置200’は、推定部224を備えた点が上述した実施形態の追尾装置200と異なる。以下ではこの異なる点を中心に説明する。
上述した実施形態及び各変形例においては、追尾装置200(Webカメラ)が発声前のユーザを追尾する場合を例にとって説明したが、これに限られない。例えば、追尾装置200に代えて、録音装置500(ICレコーダー)を用いてもよい。この場合の検知システム20を図15に示す。
なお、録音装置も音を追尾するのであるから、録音装置は追尾装置の一形態である。
一方で、録音装置500の受信部221は、送信部123から無線送信された時間情報を受信する。そして、録音部225は、受信部221が受信した時間情報が示す発声までにかかる時間に基づいて、発声のタイミングでユーザAの声の録音を開始する。具体的には、録音部225は、発声のタイミングでマイク280をONにしてユーザAの声を収音して記憶部240に記憶する。その後、録音部225は、マイク280からの音声信号が途絶えて所定時間経過するとマイク280をOFFする。
この場合、ユーザは、音声検索を開始するための開始指示をしなくとも、ユーザの発声に先立ってスマートフォンのマイクが自動でONになる。すなわち、ユーザが着けた検知装置100がユーザの喉の震えを検知して、発声までにかかる時間情報を無線送信する。そして、スマートフォンが受信した時間情報に基づいて、ユーザの発声のタイミングでマイクを自動でONにしてユーザの声の録音を開始する。
従って、本変形例の録音装置500は、ICレコーダやスマートフォンなどのボイスレコーダに適用すると好適である。
なお、上述した実施形態及び各変形例においては、検知装置100がユーザの発声タイミングを検知する前提で説明したが、これに限られない。例えば、検知装置100(ネックレス)は、ジャイロセンサ110でユーザの喉が震え始めたことを検知すると、即座に検知した信号を送信して、受信側装置(追尾装置200又は録音装置500)でユーザの発声タイミングを検知してもよい。なお、受信側装置は、送信側の検知装置100の信号に基づいて、ユーザの発声タイミングを検知するので検知装置ともいえる。すなわち、この変形例4において追尾装置200又は録音装置500は、実質的に検知装置として機能する。
そして、実行部223は、検知部290が検知した発声のタイミングで所定処理(例えば、ユーザを被写体とする動画の録画又はユーザの音声の録音の開始)を実行する。
なお、検知装置100”の実行部223は、受信部221が喉が震えたことを示す信号を受信すると、撮影又は録音のスタンバイを行ってもよい。撮影のスタンバイとしては、例えば、追尾部222がユーザをトラッキングするなどである。録音のスタンバイとしては、例えば、マイク280のスイッチをONするなどである。
具体的には、上記実施形態では、各装置が行う各処理(検知処理、追尾処理)のプログラムが、各装置の制御部120、220のROMに予め記憶されているものとして説明した。しかし、各処理のプログラムを、フレキシブルディスク、CD−ROM(Compact Disc Read Only Memory)、DVD(Digital Versatile Disc)及びMO(Magneto-Optical Disc)等のコンピュータ読み取り可能な記録媒体に格納して配布し、そのプログラムをコンピュータにインストールすることにより、上述の各部の機能を実現することができるコンピュータを構成してもよい。
ユーザの発声に先立つ生理的な挙動を検知する検知手段と、
前記検知手段の検知結果に基づき、所定処理を実行する実行手段と、
を備えたことを特徴とする検知装置。
前記検知手段は、前記ユーザの喉の震えの大きさの経時的変化を示す波形を周波数変換して得られた周波数波形と、予め学習しておいた発声前の周波数の特徴を示す特徴波形と、の比較に基づいて、前記ユーザの発声に先立つ喉の震えを検知する、
ことを特徴とする付記1に記載の検知装置。
前記実行手段は、前記所定処理として、前記ユーザのユーザ識別情報、該ユーザの発声までにかかる時間を示す時間情報又は該ユーザの位置情報のうち、何れか1つの情報を出力する、
ことを特徴とする付記1又は2に記載の検知装置。
ユーザの発声に先立つ生理的な挙動を示す信号を受信する受信手段と、
前記受信手段が受信した信号に基づいて所定処理を実行する実行手段と、
を備えたことを特徴とする検知装置。
前記実行手段は、前記所定処理として、撮影又は録音のスタンバイを行う、
ことを特徴とする付記4に記載の検知装置。
前記受信手段が受信した信号に基づいて、前記ユーザの発声のタイミングを検知する検知手段を備え、
前記実行手段は、前記所定処理として、前記検知手段が検知した発声のタイミングで所定処理を実行する、
ことを特徴とする付記4に記載の検知装置。
ユーザの発声に先立つ生理的な挙動を検知する検知手段と、
前記検知手段が前記生理的な挙動を検知すると、前記ユーザのユーザ識別情報を送信する送信手段と、を備えた検知装置と、
前記送信手段から送信されたユーザ識別情報を受信する受信手段と、
前記受信手段が受信したユーザ識別情報のユーザを追尾する追尾手段と、を備えた追尾装置と、
を備えたことを特徴とする検知システム。
前記検知手段は、前記ユーザの喉の震えの大きさの経時的変化を示す波形を周波数変換して得られた周波数波形と、予め学習しておいた発声前の周波数の特徴を示す特徴波形と、の比較に基づいて、前記ユーザの発声に先立つ喉の震えを検知する、
ことを特徴とする付記7に記載の検知システム。
前記追尾手段は、撮像手段によって前記ユーザの顔又は該ユーザが装着する前記検知装置の形状を認識後、該撮像手段の向きが前記顔又は前記形状の方向になるように制御して該ユーザを追尾する、
ことを特徴とする付記7又は8に記載の検知システム。
前記検知装置は、さらに、
前記検知手段が前記生理的な挙動を検知すると、前記発声までにかかる時間を示す時間情報を特定する時間特定手段を備え、
前記送信手段は、前記ユーザ識別情報に加え、前記時間情報を送信し、
前記追尾装置は、さらに、
前記時間情報が示す発声までにかかる時間に基づいて、該発声のタイミングで前記追尾手段が追尾中のユーザに関連する所定処理を実行する実行手段を備えた、
ことを特徴とする付記7乃至9の何れか一つに記載の検知システム。
前記実行手段は、前記所定処理として、前記発声のタイミングで前記ユーザを被写体とする動画の録画又は該ユーザの声の録音を開始する、
ことを特徴とする付記10に記載の検知システム。
前記実行手段は、前記所定処理として、前記発声のタイミングで前記ユーザに応じた撮影モードに切り替える、
ことを特徴とする付記10に記載の検知システム。
前記検知装置は、さらに、
前記検知手段が前記生理的な挙動を検知すると、前記ユーザの位置情報を特定する位置特定手段を備え、
前記送信手段は、前記ユーザ識別情報に加え、前記ユーザの位置情報を送信し、
前記追尾手段は、前記ユーザの位置情報に基づいて、撮像手段の向きを制御して該ユーザを探索後、該探索したユーザを追尾する、
ことを特徴とする付記7乃至12の何れか一つに記載の検知システム。
前記追尾装置は、さらに、
前記受信手段が受信したユーザ識別情報の受信信号強度と、該ユーザ識別情報が送信された方向と、に基づいて、該ユーザ識別情報のユーザの位置情報を推定する推定手段を備え、
前記追尾手段は、前記ユーザの位置情報に基づいて、撮像手段の向きを制御して該ユーザを探索後、該探索したユーザを追尾する、
ことを特徴とする付記7乃至12の何れか一つに記載の検知システム。
前記検知装置は、前記ユーザが身体に装着するウェアラブル装置である、
ことを特徴とする付記7乃至14の何れか一つに記載の検知システム。
ユーザの発声に先立つ生理的な挙動を検知する検知手段と、
前記検知手段が前記生理的な挙動を検知すると、前記発声までにかかる時間を示す時間情報を特定する時間特定手段と、
前記時間特定手段が特定した前記時間情報を送信する送信手段と、を備えた検知装置と、
前記送信手段から送信された時間情報を受信する受信手段と、
前記受信手段が受信した前記時間情報が示す発声までにかかる時間に基づいて、該発声のタイミングで前記ユーザの声の録音を開始する録音手段と、を備えた録音装置と、
を備えたことを特徴とする検知システム。
ユーザの発声に先立つ生理的な挙動を検知する検知ステップと、
前記検知ステップの検知結果に基づき、所定処理を実行する実行ステップと、
を備えたことを特徴とする検知方法。
コンピュータを、
ユーザの発声に先立つ生理的な挙動を検知する検知手段、
前記検知手段の検知結果に基づき、所定処理を実行する実行手段、
として機能させるためのプログラム。
Claims (15)
- ユーザの喉の震えの大きさの経時的変化を示す波形を周波数変換して得られた周波数波形と、予め学習しておいた発声前の周波数の特徴を示す特徴波形と、の比較に基づいて、前記ユーザの発声に先立つ喉の震えを検知する検知手段と、
前記検知手段の検知結果に基づき、所定処理を実行する実行手段と、
を備えたことを特徴とする検知装置。 - 前記実行手段は、前記所定処理として、前記ユーザのユーザ識別情報、該ユーザの発声までにかかる時間を示す時間情報又は該ユーザの位置情報のうち、何れか1つの情報を出力する、
ことを特徴とする請求項1に記載の検知装置。 - ユーザの喉の震えの大きさの経時的変化を示す波形を周波数変換して得られた周波数波形と、予め学習しておいた発声前の周波数の特徴を示す特徴波形と、の比較に基づいて、前記ユーザの発声のタイミングを検知する検知手段と、
前記検知手段が検知した発声のタイミングで所定処理を実行する実行手段と、
を備えたことを特徴とする検知装置。 - 前記実行手段は、前記所定処理として、撮影又は録音のスタンバイを行う、
ことを特徴とする請求項3に記載の検知装置。 - ユーザの喉の震えの大きさの経時的変化を示す波形を周波数変換して得られた周波数波形と、予め学習しておいた発声前の周波数の特徴を示す特徴波形と、の比較に基づいて、前記ユーザの発声に先立つ喉の震えを検知する検知手段と、
前記検知手段が前記ユーザの発声に先立つ喉の震えを検知すると、前記ユーザのユーザ識別情報を送信する送信手段と、を備えた検知装置と、
前記送信手段から送信されたユーザ識別情報を受信する受信手段と、
前記受信手段が受信したユーザ識別情報のユーザを追尾する追尾手段と、を備えた追尾装置と、
を備えたことを特徴とする検知システム。 - 前記追尾手段は、撮像手段によって前記ユーザの顔又は該ユーザが装着する前記検知装置の形状を認識後、該撮像手段の向きが前記顔又は前記形状の方向になるように制御して該ユーザを追尾する、
ことを特徴とする請求項5に記載の検知システム。 - 前記検知装置は、さらに、
前記検知手段が前記喉の震えを検知すると、前記発声までにかかる時間を示す時間情報を特定する時間特定手段を備え、
前記送信手段は、前記ユーザ識別情報に加え、前記時間情報を送信し、
前記追尾装置は、さらに、
前記時間情報が示す発声までにかかる時間に基づいて、該発声のタイミングで前記追尾手段が追尾中のユーザに関連する所定処理を実行する実行手段を備えた、
ことを特徴とする請求項5又は6に記載の検知システム。 - 前記実行手段は、前記所定処理として、前記発声のタイミングで前記ユーザを被写体とする動画の録画又は該ユーザの声の録音を開始する、
ことを特徴とする請求項7に記載の検知システム。 - 前記実行手段は、前記所定処理として、前記発声のタイミングで前記ユーザに応じた撮影モードに切り替える、
ことを特徴とする請求項7に記載の検知システム。 - 前記検知装置は、さらに、
前記検知手段が前記ユーザの発声に先立つ喉の震えを検知すると、前記ユーザの位置情報を特定する位置特定手段を備え、
前記送信手段は、前記ユーザ識別情報に加え、前記ユーザの位置情報を送信し、
前記追尾手段は、前記ユーザの位置情報に基づいて、撮像手段の向きを制御して該ユーザを探索後、該探索したユーザを追尾する、
ことを特徴とする請求項5乃至9の何れか一項に記載の検知システム。 - 前記追尾装置は、さらに、
前記受信手段が受信したユーザ識別情報の受信信号強度と、該ユーザ識別情報が送信された方向と、に基づいて、該ユーザ識別情報のユーザの位置情報を推定する推定手段を備え、
前記追尾手段は、前記ユーザの位置情報に基づいて、撮像手段の向きを制御して該ユーザを探索後、該探索したユーザを追尾する、
ことを特徴とする請求項5乃至9の何れか一項に記載の検知システム。 - 前記検知装置は、前記ユーザが身体に装着するウェアラブル装置である、
ことを特徴とする請求項5乃至11の何れか一項に記載の検知システム。 - ユーザの喉の震えの大きさの経時的変化を示す波形を周波数変換して得られた周波数波形と、予め学習しておいた発声前の周波数の特徴を示す特徴波形と、の比較に基づいて、前記ユーザの発声に先立つ喉の震えを検知する検知手段と、
前記検知手段が前記ユーザの発声に先立つ喉の震えを検知すると、前記発声までにかかる時間を示す時間情報を特定する時間特定手段と、
前記時間特定手段が特定した前記時間情報を送信する送信手段と、を備えた検知装置と、
前記送信手段から送信された時間情報を受信する受信手段と、
前記受信手段が受信した前記時間情報が示す発声までにかかる時間に基づいて、該発声のタイミングで前記ユーザの声の録音を開始する録音手段と、を備えた録音装置と、
を備えたことを特徴とする検知システム。 - ユーザの喉の震えの大きさの経時的変化を示す波形を周波数変換して得られた周波数波形と、予め学習しておいた発声前の周波数の特徴を示す特徴波形と、の比較に基づいて、前記ユーザの発声に先立つ喉の震えを検知する検知ステップと、
前記検知ステップの検知結果に基づき、所定処理を実行する実行ステップと、
を備えたことを特徴とする検知方法。 - コンピュータを、
ユーザの喉の震えの大きさの経時的変化を示す波形を周波数変換して得られた周波数波形と、予め学習しておいた発声前の周波数の特徴を示す特徴波形と、の比較に基づいて、前記ユーザの発声に先立つ喉の震えを検知する検知手段、
前記検知手段の検知結果に基づき、所定処理を実行する実行手段、
として機能させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015121246A JP6500625B2 (ja) | 2015-06-16 | 2015-06-16 | 検知装置、検知システム、検知方法及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015121246A JP6500625B2 (ja) | 2015-06-16 | 2015-06-16 | 検知装置、検知システム、検知方法及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2017011321A JP2017011321A (ja) | 2017-01-12 |
JP6500625B2 true JP6500625B2 (ja) | 2019-04-17 |
Family
ID=57763799
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015121246A Active JP6500625B2 (ja) | 2015-06-16 | 2015-06-16 | 検知装置、検知システム、検知方法及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6500625B2 (ja) |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA2473195C (en) * | 2003-07-29 | 2014-02-04 | Microsoft Corporation | Head mounted multi-sensory audio input system |
JP4713111B2 (ja) * | 2003-09-19 | 2011-06-29 | 株式会社エヌ・ティ・ティ・ドコモ | 発話区間検出装置、音声認識処理装置、送信システム、信号レベル制御装置、発話区間検出方法 |
-
2015
- 2015-06-16 JP JP2015121246A patent/JP6500625B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2017011321A (ja) | 2017-01-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11729487B2 (en) | Image pickup apparatus and control method therefor | |
US11250247B2 (en) | Information processing device, information processing system, and program | |
CN104092936A (zh) | 自动对焦方法及装置 | |
KR20170023699A (ko) | 동영상 촬영 방법, 그 장치, 프로그램 및 기록매체 | |
US20230362472A1 (en) | Image pickup apparatus and control method therefor | |
JP7233162B2 (ja) | 撮像装置及びその制御方法、プログラム、記憶媒体 | |
EP3186599B1 (en) | Feedback provision system | |
JP7267686B2 (ja) | 撮像装置及びその制御方法 | |
US20220368825A1 (en) | Image capturing apparatus, method for controlling the same, and storage medium | |
US20230005471A1 (en) | Responding to a user query based on captured images and audio | |
JP2019040005A (ja) | 読み上げシステム及び読み上げ方法 | |
US11996093B2 (en) | Information processing apparatus and information processing method | |
JP2009177480A (ja) | 撮影装置 | |
JP2009239346A (ja) | 撮影装置 | |
JP6950793B2 (ja) | 電子機器およびプログラム | |
CN107087208B (zh) | 一种全景视频播放方法、***及存储装置 | |
CN105447199B (zh) | 音频信息获取方法及装置 | |
JP6500625B2 (ja) | 検知装置、検知システム、検知方法及びプログラム | |
JP2019095523A (ja) | ロボットおよびロボット制御方法 | |
JP2018099416A (ja) | 運動解析装置、運動解析方法及びプログラム | |
JP7199808B2 (ja) | 撮像装置およびその制御方法 | |
JP2016082356A (ja) | 電子機器およびプログラム | |
WO2015105075A1 (ja) | 情報処理装置及び電子機器 | |
JP2021111960A (ja) | 撮像装置、撮像装置の制御方法、プログラム | |
JP5712599B2 (ja) | 撮像装置及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20180416 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20181225 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20190115 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190201 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20190219 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20190304 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6500625 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |