JP2015115911A - 行動記録装置、入出力装置、行動記録プログラムおよび行動記録方法 - Google Patents
行動記録装置、入出力装置、行動記録プログラムおよび行動記録方法 Download PDFInfo
- Publication number
- JP2015115911A JP2015115911A JP2013258842A JP2013258842A JP2015115911A JP 2015115911 A JP2015115911 A JP 2015115911A JP 2013258842 A JP2013258842 A JP 2013258842A JP 2013258842 A JP2013258842 A JP 2013258842A JP 2015115911 A JP2015115911 A JP 2015115911A
- Authority
- JP
- Japan
- Prior art keywords
- information
- moving image
- unit
- voice
- input
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Information Transfer Between Computers (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
Abstract
【課題】簡便に自然な入出力方法により情報公開をする技術を提供する。【解決手段】行動記録装置であって、動画情報を格納する動画情報記憶部と、動画情報に含まれる音声情報を認識してテキスト情報を生成する音声認識部と、外部の装置から動画情報を受け付けると、動画情報に含まれる音声情報について音声認識部により生成されたテキスト情報を記録するテキストファイルを生成して動画情報に関連付けて動画情報記憶部へ格納する動画記録制御部と、所定の公開装置に対する公開指示を受け付けると、動画情報およびテキストファイルを公開するよう公開装置へ送信する公開装置連携部と、を備えることを特徴とする。【選択図】図1
Description
本発明は、行動記録に関するものである。
従来、クライアント端末と、クライアント端末のユーザーにて編集されたブログを公開するブログサーバーと、動画配信サーバーとが、通信可能に接続される動画投稿サイト連携システムであって、クライアント端末が、ユーザーによるブログに掲載するためのテキストデータと動画データとからなるブログデータの投稿指示を受け付ける投稿受付手段と、ブログデータをブログサーバーに送信すると共に、ブログデータのネットワークアドレスと、ブログデータに含まれるテキストデータを動画データの再生時に出力可能な状態で、動画データと共に動画配信サーバーに送信する投稿手段と、を備えるシステムに係る技術がある。特許文献1には、このような技術について記載されている。
上記技術では、動画を伴うブログの記事の投稿が可能であるが、投稿のためには、投稿までの間に、公開する動画やテキストを編集可能な装置を用いて、投稿しようとする者が編集するとともに、投稿のための操作(ブラウザの立ち上げ、投稿サイトへのアクセス、投稿のための指示を与える打鍵、クリック、タップ等の入力操作)には一定程度のリテラシーと時間と装備とが必要であることを考慮すると、簡便に自然な入出力方法で公開できるとまではいいがたい。
本発明の目的は、簡便に自然な入出力方法により情報公開をする技術を提供することにある。
本願は、上記課題の少なくとも一部を解決する手段を複数含んでいるが、その例を挙げるならば、以下のとおりである。上記課題を解決すべく、本発明に係る行動記録装置は、動画情報を格納する動画情報記憶部と、上記動画情報に含まれる音声情報を認識してテキスト情報を生成する音声認識部と、外部の装置から上記動画情報を受け付けると、上記動画情報に含まれる音声情報について上記音声認識部により生成されたテキスト情報を記録するテキストファイルを生成して上記動画情報に関連付けて上記動画情報記憶部へ格納する動画記録制御部と、所定の公開装置に対する公開指示を受け付けると、上記動画情報および上記テキストファイルを公開するよう上記公開装置へ送信する公開装置連携部と、を備えることを特徴とする。
また、上記の行動記録装置においては、上記公開装置連携部は、上記外部の装置が受け付けた音声を上記音声認識部により認識して公開対象の上記公開装置を特定する、ことを特徴とするものであってもよい。
また、上記の行動記録装置においては、上記公開装置連携部は、公開対象の動画の特定にあたり、公開する候補の上記音声情報の一部または全部を上記外部の装置に音声出力させ、公開指示を受け取った際に出力されていた音声情報に関連する動画を公開する対象とする、ことを特徴とするものであってもよい。
また、上記の行動記録装置においては、上記外部の装置は、音声情報を含む動画情報を取得するために撮像装置を制御する撮像制御部と、上記動画情報を上記動画記録制御部へ送信する通信部と、を備える動物型の入出力端末である、ことを特徴とするものであってもよい。
また、上記の行動記録装置においては、上記入出力端末は、鳥の外形を模した形状を備え、利用者の体の一部に着脱可能に取り付けられる、ことを特徴とするものであってもよい。
また、本発明に係る入出力装置は、鳥の外形を模した形状を備え、周囲の音声の入力を受け付ける音声入力部と、利用者から上記音声入力部を介して撮像の開始と終了の指示を受け付けると、上記音声入力部を介して受け付けた周囲の音声情報を含めて上記撮像の開始の指示を受け付けてから終了の指示を受け付けるまでの間に撮像した動画情報を生成する撮像制御部と、上記動画情報を所定の他の装置へ送信する通信部と、を備えることを特徴とする。
また、上記の入出力装置においては、音声を出力する音声出力部を備え、上記通信部は、上記他の装置から音声出力情報を受け付けると、当該音声出力情報を上記音声出力部に出力させるとともに、当該音声出力を行っている期間において上記音声入力部が受け付けた音声の入力を上記他の装置へ送信する、ことを特徴とするものであってもよい。
また、本発明に係る行動記録プログラムは、コンピューターに、行動を記録する手順を実行させるプログラムであって、上記コンピューターを、制御手段と、動画情報を格納する動画情報記憶手段として機能させ、上記制御手段に対して、上記動画情報に含まれる音声情報を認識してテキスト情報を生成する音声認識ステップと、外部の装置から上記動画情報を受け付けると、上記動画情報に含まれる音声情報について上記音声認識ステップにより生成されたテキスト情報を記録するテキストファイルを生成して上記動画情報に関連付けて上記動画情報記憶手段へ格納する動画記録制御ステップと、所定の公開装置に対する公開指示を受け付けると、上記動画情報および上記テキストファイルを公開するよう上記公開装置へ送信する公開装置連携ステップと、を実行させることを特徴とする。
また、本発明に係る行動記録方法は、コンピューターを用いて行動を記録する手順を実施する行動記録方法であって、上記コンピューターは、制御手段と、動画情報を格納する動画情報記憶手段と、を備え、上記動画情報に含まれる音声情報を認識してテキスト情報を生成する音声認識ステップと、外部の装置から上記動画情報を受け付けると、上記動画情報に含まれる音声情報について上記音声認識ステップにより生成されたテキスト情報を記録するテキストファイルを生成して上記動画情報に関連付けて上記動画情報記憶手段へ格納する動画記録制御ステップと、所定の公開装置に対する公開指示を受け付けると、上記動画情報および上記テキストファイルを公開するよう上記公開装置へ送信する公開装置連携ステップと、を実行することを特徴とする。
上記した以外の課題、構成および効果は、以下の実施形態の説明により明らかにされる。
本発明によると、簡便に自然な入出力方法により情報公開をする技術を提供することができる。
以下に、本発明に係る第一の実施形態を適用したライフログシステム1を用いた実施形態について、図面を参照して説明する。
図1は、本発明の第一の実施形態におけるライフログシステム1の概要を示す図である。本実施形態において想定するライフログシステム1においては、行動記録装置100と、通信端末200と、入出力端末300と、が利用される。また、行動記録装置100において記録された情報をWebページ等により公開する公開装置400は、ネットワーク10を介して少なくとも行動記録装置100と、通信可能に接続される。
ここで、行動記録装置100および公開装置400は、例えば、いわゆるサーバー装置である。しかし、これに限られず、行動記録装置100は、パソコンやスマートフォン、ワークステーション、PDA(Personal Data Assistant)、タブレット装置等各種の情報処理装置であってもよい。
通信端末200は、例えば、いわゆる携帯電話や、無線通信装置である。しかし、これに限られず、通信端末200は、パソコンやスマートフォン、ワークステーション、PDA、タブレット装置等各種の情報処理装置であってもよい。
入出力端末300は、利用者が利用する音声あるいは光学映像の入出力端末であり、例えばパーソナルコンピューターや、タブレットパソコン、マイコン等の情報処理装置である。なお、本実施形態においては、入出力端末300は、例えば、利用者の肩等に、フックやアーム等により保持されて着脱可能に取り付けられる機構を備える動物型(例えば、インコやカナリア等の愛玩用の鳥を模した造形)の装置であるとする。
当該システムにおいては、利用者は、入出力端末300に対して音声により入出力を行うものとする。また、入出力端末300と、通信端末200とは、所定のプロトコル(例えば、Bluetooth(登録商標)や無線LAN等)の所定の無線通信路を介して互いに通信可能に接続される。
また、通信端末200は、行動記録装置100とネットワーク10を介して相互に通信が可能である。当該システムにおいては、入出力端末300を介して受け付けた音声による命令等を、通信端末200が行動記録装置100へ送信すると、行動記録装置100において音声認識がなされ、公開装置400への公開その他の命令と認識されると、行動記録装置100において当該命令が実行される。すなわち、通信端末200は、無線通信により入出力端末300と通信を行いつつ、通信部により行動記録装置100と通信を行うことが可能であるものとする。
入出力端末300は、利用者から入力された音声を受け付け、出力される音声を発生させる。また、入出力端末300は、通信端末200との間で無線通信を行う。また、入出力端末300は、所定の範囲を視野角に収める動画および静止画を撮像する。また、入出力端末300は、衛星電波(例えば、GPS:Global Positioning SystemまたはGLONASS:Global Navigation Satellite System等の電波)を受信して、入出力端末300と衛星間の距離と距離の変化率とを3個以上の衛星に対して測定することで入出力端末300の現在地、進行速度および進行方位および時刻を測定する。
公開装置400は、さまざまな運営者により運営される各種のウェブログ(いわゆるブログ)サービスを提供するサーバー装置等である。公開装置400は、例えば、ブログのアカウントごとに、テキストファイル等の文章、写真等の静止画、動画等の公開要求を受け付けると、要求に応じてウェブページを構成し、アクセスしてきた装置に対して当該ウェブページを提供する。
ネットワーク10は、LAN(Local Area Network)、WAN(Wide Area Network)、インターネット、携帯電話網等の通信網である。なお、携帯電話通信網等の無線通信網上のVPN(Virtual Private Network)等であってもよい。
行動記録装置100には、制御部110と、記憶部120と、通信部130と、が含まれる。制御部110には、音声記録制御部111と、静止画記録制御部112と、動画記録制御部113と、音声認識部114と、公開装置連携部115と、が含まれる。記憶部120には、音声情報記憶部121と、静止画情報記憶部122と、動画情報記憶部123と、テキスト情報記憶部124と、公開装置利用情報記憶部125と、が含まれる。
図2は、音声情報記憶部121の構成例を示す図である。音声情報記憶部121には、音声記録識別子121Aと、位置情報121Bと、録音終了時刻情報121Cと、音声ファイル121Dと、が対応付けられている。
音声記録識別子121Aは、音声記録を識別する情報である。位置情報121Bは、音声記録が録音された位置を特定する情報である。例えば、緯度経度等による座標により表される。
録音終了時刻情報121Cは、音声記録を終えた時刻を特定する情報である。音声ファイル121Dは、音声を再生可能に記録されたファイルを特定する情報である。
図3は、静止画情報記憶部122の構成例を示す図である。静止画情報記憶部122には、静止画記録識別子122Aと、位置情報122Bと、撮影終了時刻情報122Cと、静止画ファイル122Dと、が対応付けられている。
静止画記録識別子122Aは、静止画を識別する情報である。位置情報122Bは、静止画が撮影された位置を特定する情報である。例えば、緯度経度等による座標により表される。
撮影終了時刻情報122Cは、撮影を終えた時刻を特定する情報である。静止画ファイル122Dは、静止画を再生可能に記録されたファイルを特定する情報である。
図4は、動画情報記憶部123の構成例を示す図である。動画情報記憶部123には、動画記録識別子123Aと、位置情報123Bと、撮影終了時刻情報123Cと、動画ファイル123Dと、が対応付けられている。
動画記録識別子123Aは、動画を識別する情報である。位置情報123Bは、動画が撮影された位置(例えば、撮影終了時の位置)を特定する情報である。例えば、緯度経度等による座標により表される。
撮影終了時刻情報123Cは、撮影を終えた時刻を特定する情報である。動画ファイル123Dは、動画を再生可能に記録されたファイルを特定する情報である。
図5は、テキスト情報記憶部124の構成例を示す図である。テキスト情報記憶部124には、テキスト識別子124Aと、元音声記録識別子124Bと、アップロードサイン124Cと、テキストファイル124Dと、が対応付けられている。
テキスト識別子124Aは、テキストを識別する情報である。元音声記録識別子124Bは、テキストの元となった動画あるいは音声ファイルを特定する識別子である。
アップロードサイン124Cは、公開装置400への投稿すなわちアップロードの処理を終えたか否かを特定する情報である。テキストファイル124Dは、テキストを再生可能に記録されたファイルを特定する情報である。
図6は、公開装置利用情報記憶部125の構成例を示す図である。公開装置利用情報記憶部125には、公開装置識別子125Aと、公開装置投稿アドレス125Bと、ユーザー認証情報125Cと、公開指示ワード125Dと、が対応付けられている。
公開装置識別子125Aは、公開装置400を識別する情報である。公開装置投稿アドレス125Bは、公開装置400においてユーザーが設けているブログサイト等における記事の投稿用アドレスを特定する識別子である。
ユーザー認証情報125Cは、公開装置400への投稿すなわちアップロード時に公開装置400から要求されるユーザー認証を通過するために必要な認証情報である。公開指示ワード125Dは、公開装置400を特定して記事の投稿を行う命令となるワードである。例えば、公開装置と投稿アドレス、ユーザー認証情報との組み合わせを特定するワードとして、「1で公開」というワードが格納される。
図1の説明に戻る。音声記録制御部111は、入出力端末300により取得した音声情報を記録する。具体的には、音声記録制御部111は、音声記録の開始指示を受け付けると、入出力端末300の音声入出力制御部312により取得した音声情報の記録を開始する。また、音声記録制御部111は、音声記録の終了指示を受け付けると、音声記録を音声ファイルとして生成し、音声情報記憶部121に格納する。
静止画記録制御部112は、入出力端末300により取得した静止画情報を記録する。具体的には、静止画記録制御部112は、静止画の記録指示を受け付けると、入出力端末300の撮像制御部313により取得した映像を静止画ファイルとして生成し、静止画情報記憶部122に格納する。
動画記録制御部113は、入出力端末300により取得した動画情報を記録する。具体的には、動画記録制御部113は、動画記録の開始指示を受け付けると、入出力端末300の撮像制御部313および音声入出力制御部312により取得した映像および音声情報の記録を開始する。また、動画記録制御部113は、動画記録の終了指示を受け付けると、動画情報を動画ファイルとして生成し、動画情報記憶部123へ格納し、音声認識部114により音声のテキストファイル化を行い、テキスト情報記憶部124に格納する。
音声認識部114は、入出力端末300により取得した音声情報を音声認識処理し、音声の内容に応じてテキスト化する。また、音声認識部114は、テキスト化した音声の内容をテキストファイルに固定する。
また、音声認識部114は、音声認識の開始指示を受け付けると、入出力端末300の音声入出力制御部312により取得した音声の情報の記録を開始する。また、音声認識部114は、音声記録の終了指示を受け付けると、音声記録を音声ファイルとして生成し、音声情報記憶部121に格納する。
また、音声認識部114は、音声認識処理の結果得られた音声が所定の選択肢の選択あるいは所定のコマンドである場合には、当該選択肢またはコマンドを制御部110に実行させるべく受け渡す。
公開装置連携部115は、公開装置400に対して、公開対象のファイルを投稿する。その際、公開装置連携部115は、公開装置利用情報記憶部125に格納されている認証情報やアドレス等を用いて投稿する。
通信部130は、ネットワーク10を介して他の装置、例えば通信端末200との通信を行う。
通信端末200には、制御部210と、通信部220と、接続部230と、が含まれる。制御部210には、通信制御部211と、入出力装置接続部212と、が含まれる。
通信制御部211は、通信部220を介して行動記録装置100との通信を制御する。例えば、通信制御部211は、音声情報や映像情報を、行動記録装置100へ送信する。
入出力装置接続部212は、接続部230を介して、入出力端末300との通信を制御する。
通信部220は、ネットワーク10を介して他の装置、例えば行動記録装置100との通信を行う。
接続部230は、Bluetooth等の無線通信接続を介して、入出力端末300と通信を行う。
入出力端末300には、制御部310と、衛星電波受信部320と、接続部330と、が含まれる。制御部310には、通信端末接続制御部311と、音声入出力制御部312と、撮像制御部313と、位置特定部314と、が含まれる。
通信端末接続制御部311は、接続部330を介して通信端末200との通信を制御する。例えば、通信端末接続制御部311は、音声情報や映像情報を、通信端末200へ送信する。
音声入出力制御部312は、図示しないマイク等の音声入力装置を介して、音声情報の入力を受け付ける。また、音声入出力制御部312は、図示しないスピーカ等の音声出力装置を介して、音声情報の出力を行う。
撮像制御部313は、図示しないカメラ等の撮像装置を介して、映像情報の入力を受け付ける。
位置特定部314は、衛星電波受信部320を介して人工衛星からの電波を受信し、衛星電波受信部320が含まれる入出力端末300の位置および現在時刻を特定する。
衛星電波受信部320は、GPS、GLONASS等の人工衛星から送信される所定の電波を受信する。
接続部330は、Bluetooth等の無線通信接続を介して、通信端末200と通信を行う。
図7は、行動記録装置100のハードウェア構成例を示す図である。行動記録装置100は、演算装置102と、外部記憶装置103と、主記憶装置104と、出力装置105と、通信装置106と、各装置をつなぐバス107と、を少なくとも備える。また、他に、行動記録装置100は、入力装置101を備える。
演算装置102は、例えばCPU(Central Processing Unit)などの演算装置である。
外部記憶装置103は、デジタル情報を記憶可能な、いわゆるハードディスク(Hard Disk Drive)やSSD(Solid State Drive)あるいはフラッシュメモリなどの不揮発性記憶装置である。
主記憶装置104は、例えばRAM(Random Access Memory)などのメモリ装置である。
出力装置105は、例えば液晶ディスプレイや、有機EL(Electro Luminescence)ディスプレイ等の表示装置である。
通信装置106は、ネットワーク10等を介して通信端末200等の他の装置と通信経路を確立し、情報を送受信するネットワークカード等の装置である。
入力装置101は、キーボードやマウス、タッチパネル等の各種入力装置である。
入力装置101と、演算装置102と、外部記憶装置103と、主記憶装置104と、出力装置105と、通信装置106とは、バス107等の接続導線により互いに接続される。
上記した行動記録装置100の音声記録制御部111と、静止画記録制御部112と、動画記録制御部113と、音声認識部114と、公開装置連携部115とは、演算装置102に処理を行わせるプログラムによって実現される。このプログラムは、主記憶装置104、外部記憶装置103または図示しないROM装置内に記憶され、実行にあたって主記憶装置104上にロードされ、演算装置102により実行される。
また、行動記録装置100の記憶部120は、主記憶装置104及び外部記憶装置103により実現される。また、行動記録装置100の通信部130は、通信装置106により実現される。以上が、行動記録装置100のハードウェア構成例である。
図8は、通信端末200のハードウェア構成例を示す図である。通信端末200は、演算装置202と、主記憶装置204と、通信装置206と、各装置をつなぐバス207と、近距離無線通信装置208と、を少なくとも備える。また、他に、通信端末200は、入力装置201と、外部記憶装置203と、出力装置205と、を備える。
演算装置202は、例えばCPUなどの演算装置である。
主記憶装置204は、例えばRAMなどのメモリ装置である。
通信装置206は、ネットワーク10等を介して行動記録装置100等の他の装置と通信経路を確立し、情報を送受信するネットワークカード等の装置である。
近距離無線通信装置208は、Bluetooth等の所定の通信種別に応じた無線通信を行う他の装置と通信経路を確立し、情報を送受信するアンテナモジュール等の装置である。
入力装置201は、キーボードやマウス、タッチパネル等の各種入力装置である。
外部記憶装置203は、デジタル情報を記憶可能な、いわゆるハードディスクやSSDあるいはフラッシュメモリなどの不揮発性記憶装置である。
出力装置205は、例えば液晶ディスプレイや、有機ELディスプレイ等の表示装置である。
入力装置201と、演算装置202と、外部記憶装置203と、主記憶装置204と、出力装置205と、通信装置206と、近距離無線通信装置208とは、バス207等の接続導線により互いに接続される。
上記した通信端末200の通信制御部211と、入出力装置接続部212とは、演算装置202に処理を行わせるプログラムによって実現される。このプログラムは、主記憶装置204、外部記憶装置203または図示しないROM装置内に記憶され、実行にあたって主記憶装置204上にロードされ、演算装置202により実行される。
また、通信端末200の通信部220は、通信装置206により実現される。また、通信端末200の接続部230は、近距離無線通信装置208により実現される。以上が、通信端末200のハードウェア構成例である。
図9は、入出力端末300のハードウェア構成例を示す図である。入出力端末300は、音声入出力装置301と、演算装置302と、外部記憶装置303と、主記憶装置304と、撮像装置305と、近距離無線通信装置306と、各装置をつなぐバス307と、衛星電波受信装置308と、を少なくとも備える。
音声入出力装置301は、マイクロフォン等の音声入力装置、スピーカ、イヤフォン等の音声出力装置、のいずれをも含む各種の音声入出力装置である。なお、音声入出力装置301は、独立して動作するマイクロフォン、スピーカ、イヤフォン等の組み合わせであってもよいし、いずれかについての集合物(マイクアレイ装置等)の組み合わせであってもよいし、いずれかが他に従属して動作するものであってもよい。
演算装置302は、例えばCPUなどの演算装置である。
外部記憶装置303は、デジタル情報を記憶可能な、いわゆるハードディスクやSSDあるいはフラッシュメモリなどの不揮発性記憶装置である。
主記憶装置304は、例えばRAMなどのメモリ装置である。
撮像装置305は、所定の画角あるいは所定の範囲内の画角(いわゆるズーム)について、光学系を介して映像を取得する装置である。
近距離無線通信装置306は、Bluetooth等の所定の通信種別に応じた無線通信を行う他の装置と通信経路を確立し、情報を送受信するアンテナモジュール等の装置である。
衛星電波受信装置308は、GPS、GLONASSのいずれか又は両方による衛星からの電波を受信して、入出力端末の位置を、座標により特定する。また、衛星電波受信装置308は、現在時刻の特定を行う。
音声入出力装置301と、演算装置302と、外部記憶装置303と、主記憶装置304と、撮像装置305と、近距離無線通信装置306と、衛星電波受信装置308とは、バス307等の接続導線により互いに接続される。
上記した入出力端末300の通信端末接続制御部311と、音声入出力制御部312と、撮像制御部313と、位置特定部314とは、演算装置302に処理を行わせるプログラムによって実現される。このプログラムは、主記憶装置304、外部記憶装置303または図示しないROM装置内に記憶され、実行にあたって主記憶装置304上にロードされ、演算装置302により実行される。
また、入出力端末300の衛星電波受信部320は、衛星電波受信装置308により実現される。また、入出力端末300の接続部330は、近距離無線通信装置306により実現される。以上が、入出力端末300のハードウェア構成例である。
行動記録装置100、通信端末200、入出力端末300のそれぞれの構成は、処理内容に応じて、さらに多くの構成要素に分類することもできる。また、1つの構成要素がさらに多くの処理を実行するように分類することもできる。
また、各制御部は、ハードウェア(ASIC、GPUなど)により構築されてもよい。また、各制御部の処理が一つのハードウェアで実行されてもよいし、複数のハードウェアで実行されてもよい。
[動作の説明]次に、本実施形態におけるライフログシステム1の動作を説明する。図10は、本実施形態における静止画撮像処理のフロー図である。
静止画撮像処理は、入出力端末300の撮像制御部313により取得された映像情報を、通信端末200およびネットワーク10を介して行動記録装置100にて取得し、記録する処理である。静止画撮像処理は、行動記録装置100、通信端末200および入出力端末300の稼動が開始され、互いに通信可能となった状態において、入出力端末300において音声による開始指示を受け付けると、開始される。
まず、静止画記録制御部112は、定期的(例えば、30分の1秒ごと)に撮像素子から得た画像内に人間の顔の存在を特徴点のマッチングにより検索する(ステップS001)。具体的には、静止画記録制御部112は、入出力端末300の静止画記録制御部112から、撮像装置305の撮像素子から得た映像情報を受け付けて、所定の特徴点とのパターンマッチング等により人間の顔を検出する。
次に、静止画記録制御部112は、人間の顔を検出したか否かを判定する(ステップS002)。具体的には、ステップS001により、画像内に人間の顔を所定の期間(例えば、1秒)にわたり連続して検出したか否かを判定する。
人間の顔を検出しなかった場合(ステップS002にて「No」の場合)には、静止画記録制御部112は、後述するステップS005に制御を進める。
人間の顔を検出した場合(ステップS002にて「Yes」の場合)には、静止画記録制御部112は、撮影許可を求める音声出力を行う(ステップS003)。具体的には、静止画記録制御部112は、音声入出力制御部312に対して、「撮影してもよいですか」等、撮影許可を求める音声出力を指示する。
そして、静止画記録制御部112は、音声入力された回答は許可であるか否かを判定する(ステップS004)。具体的には、静止画記録制御部112は、音声認識部114が、音声入力装置により受け付けた音声入力を認識して、「はい」、「良いです」、「いいよ」、「オーケー」、「問題ない」等所定の許可を示す回答を得たか否かを判定する。許可を示す回答ではなかった場合には、静止画記録制御部112は、静止画撮像処理を終了させる。
回答が許可である場合(ステップS004にて「Yes」の場合)には、静止画記録制御部112は、静止画情報として撮像素子から保存する画像を生成する(ステップS005)。具体的には、静止画記録制御部112は、撮像制御部313を介して、撮像装置305の出力から画像情報を取得し、所定の静止画(ビットマップあるいは圧縮されたJPEGやPNG等の画像ファイル)を生成する。あるいは、撮像装置305から出力される画像ファイルを取得する。
そして、静止画記録制御部112は、位置情報と時刻情報を取得して画像とともに保存する(ステップS006)。具体的には、静止画記録制御部112は、入出力端末300の位置特定部314により取得した位置を特定する情報と、現在時刻を特定する情報とを取得して、ステップS005において生成または取得した静止画と関連付けて、静止画情報記憶部122に格納する。
以上が、静止画撮像処理の処理フローである。静止画撮像処理によれば、人物が被写体に含まれる場合には、撮影許可を得た後、そうでない場合には撮像指示を受けた後、入出力端末300を介して取得した静止画の情報を、行動記録装置100において記憶することができる。
図11は、本実施形態における動画撮像処理のフロー図である。
動画撮像処理は、入出力端末300の撮像制御部313により取得された映像情報および音声情報を、通信端末200およびネットワーク10を介して行動記録装置100にて取得し、動画情報として記録する処理である。動画撮像処理は、行動記録装置100、通信端末200および入出力端末300の稼動が開始され、互いに通信可能となった状態において、入出力端末300において音声による開始指示を受け付けると、開始される。
まず、動画記録制御部113は、記録開始指示を受け付け付けると(ステップS101)、動画と音声を所定時間記録する(ステップS102)。具体的には、動画記録制御部113は、入出力端末300において音声による開始指示を受け付けると、動画記録制御部113において撮像制御部313から取得される映像情報と、音声記録制御部111において音声入出力制御部312から取得される音声情報と、を受け付ける。そして、動画記録制御部113は、これを記録終了指示を受け付けるまで所定の時間(例えば、1秒間等)行う。
そして、動画記録制御部113は、記録終了指示を受け付けたか否かを判定する(ステップS103)。具体的には、動画記録制御部113は、入出力端末300において音声による終了指示を受け付けたか否かを判定する。
記録終了指示を受け付けた場合(ステップS103にて「Yes」の場合)には、動画記録制御部113は、動画情報と、音声記録制御部111から保存する音声情報とを、それぞれ取得して動画ファイルを生成する(ステップS104)。
そして、動画記録制御部113は、位置情報と時刻情報を取得して動画像に関連付ける(ステップS105)。具体的には、動画記録制御部113は、入出力端末300の位置特定部314により取得した位置を特定する情報と、現在時刻を特定する情報とを取得して、ステップS104において生成した動画像と関連付けて、動画情報記憶部123に格納する。
そして、音声認識部114は、音声情報から音声認識を行い、テキストファイルとして生成し、アップロードサインを未済としてエントリする(ステップS106)。具体的には、音声認識部114は、ステップS104にて生成された音声情報を読み込んで音声認識を行い、認識したテキスト情報をテキストファイルとして生成し、テキスト情報記憶部124に格納しつつ、アップロードサイン124Cについては「未済」であることを示す情報を付加する。
以上が、動画撮像処理の処理フローである。動画撮像処理によれば、撮像指示を受けた後、終了指示を受け付けるまで、入出力端末300を介して取得した動画および音声の情報を、行動記録装置100において記憶することができる。
図12は、本実施形態における公開処理のフロー図である。
公開処理は、入出力端末300の音声入出力制御部312を介した音声による入力に基づき、音声情報を含む動画情報を公開装置400にて公開する処理である。なお、公開処理は、音声情報を含まない動画情報を公開するものであってもよいし、静止画を公開するものであってもよいし、音声情報を公開するものであってもよい。公開処理は、行動記録装置100、通信端末200および入出力端末300、公開装置400の稼動が開始され、互いに通信可能となった状態において、入出力端末300において音声による開始指示を受け付けると、開始される。
まず、公開装置連携部115は、アップロードサインが「済」となっている最後のエントリの次のエントリを特定し元音声の先頭部分を音声出力する(ステップS201)。具体的には、公開装置連携部115は、テキスト情報記憶部124を参照して、アップロードサイン124Cが「済」となっている最後のエントリの次のエントリを特定する。そして、公開装置連携部115は、特定したエントリについて元音声記録識別子124Bを特定し、元音声記録識別子に対応する音声情報記憶部121の音声記録識別子121Aに関連付けられている音声ファイル121Dを読み出す。そして、公開装置連携部115は、読み出した音声ファイルの一部または全部、例えば先頭から所定時間を再生するよう入出力端末300の音声入出力制御部312に指示する。
そして、公開装置連携部115は、音声出力中に公開指示ワードの音声入力を受け付けたか否かを判定する(ステップS202)。具体的には、公開装置連携部115は、音声認識部114が、音声入出力装置301の音声入力装置により受け付けた音声入力を認識して、公開指示ワードを示す入力を得たか否かを判定する。公開指示ワードを示す入力がなかった場合には、公開装置連携部115は、ステップS205へ制御を進める。
音声出力中に公開指示ワードの音声入力を受け付けた場合(ステップS202にて「Yes」の場合)には、公開装置連携部115は、公開指示ワードに関連する公開装置の投稿アドレスへテキストおよび動画を送信する(ステップS203)。具体的には、公開装置連携部115は、入力された公開指示ワードに該当する公開指示ワード125Dを公開装置利用情報記憶部125から特定し、対応する公開装置投稿アドレス125Bおよびユーザー認証情報125Cを読み出す。そして、公開装置連携部115は、読み出した公開装置投稿アドレス125Bに対して、動画情報と音声情報を送信する。その際、ユーザー認証情報125Cを併せて送信することで、投稿者が正当なユーザーであることを担保する。
そして、公開装置連携部115は、送信した動画に関するエントリのアップロードサインを「済」とする(ステップS204)。具体的には、公開装置連携部115は、送信した動画に関する音声情報をテキスト化したテキストファイルが格納されているテキスト情報記憶部124のエントリについて、アップロードサイン124Cの値を、「済」に更新する。
そして、公開装置連携部115は、次のエントリがあるか否かを判定する(ステップS205)。エントリが無ければ、公開装置連携部115は、公開処理を終了させる。エントリがある場合には、公開装置連携部115は、ステップS201に制御を戻す。
以上が、公開処理の処理フローである。公開処理によれば、入出力端末300を介して公開指示を受けると、未公開の動画、静止画、音声情報について、内容を音声出力しながら公開の実施および公開先の装置の音声入力による指定を受け付けて、指定された公開先に投稿することができる。
以上、本発明に係る第一の実施形態を適用したライフログシステム1について説明した。当該実施形態によると、利用者は、簡便に自然な入出力方法により情報公開をすることができる。
本発明は、上記の第一の実施形態に制限されない。上記の第一の実施形態は、本発明の技術的思想の範囲内で様々な変形が可能である。例えば、上記の第一の実施形態においては、入出力端末300は、鳥型等の動物型をしているが、これに限られない。例えば、犬、猫、蛇、蝶、魚等の他の動物型であってもよい。または、動物に限られるものでもなく、植物、車等の人工物、恒星、惑星等の形状であってもよいし、さらには想像上の存在であるとされる竜、悪魔、妖怪、怪獣、アニメのキャラクター、マスコットキャラクター等であってもよい。
また例えば、入出力端末300は、上記の第一の実施形態においては、利用者の肩等に、フックやアーム等により保持されて着脱可能に取り付けられる機構を備えるものであるが、これに限られない。例えば、自立可能なオートバランス機構を備えるものであってもよい。または、入出力端末300は、飛行のための動力源を備え、自律的に飛行するものあるいは操作装置から飛行を制御されるものであってもよい。このようにすることで、より自然に入出力端末300を扱うことができるため、利用者だけでなくその周囲の者にも、違和感を感じさせにくいものとすることができる。
また例えば、入出力端末300は、上記の第一の実施形態においては、入出力端末300と、通信端末200との間の接続に用いる無線通信は、Bluetooth等の無線通信接続であるが、これに限られるものではない。例えば、IEEE802.11等に準拠した無線通信接続であってもよいし、有線接続であってもよい。あるいは、入出力端末300が通信端末200と同様の機能を包含し、行動記録装置100と通信可能なものであってもよい。このようにすることで、行動記録装置100に接続しうる端末の自由度を高めることができる。
また、上記した実施形態の技術的要素は、単独で適用されてもよいし、プログラム部品とハードウェア部品のような複数の部分に分けられて適用されるようにしてもよい。
以上、本発明について、実施形態を中心に説明した。
1・・・ライフログシステム、10・・・ネットワーク、100・・・行動記録装置、110・・・制御部、111・・・音声記録制御部、112・・・静止画記録制御部、113・・・動画記録制御部、114・・・音声認識部、115・・・公開装置連携部、120・・・記憶部、121・・・音声情報記憶部、122・・・静止画情報記憶部、123・・・動画情報記憶部、124・・・テキスト情報記憶部、125・・・公開装置利用情報記憶部、130・・・通信部、200・・・通信端末、210・・・制御部、211・・・通信制御部、212・・・入出力装置接続部、220・・・通信部、230・・・接続部、300・・・入出力端末、310・・・制御部、311・・・通信端末接続制御部、312・・・音声入出力制御部、313・・・撮像制御部、314・・・位置特定部、320・・・衛星電波受信部、330・・・接続部、400・・・公開装置
Claims (9)
- 動画情報を格納する動画情報記憶部と、
前記動画情報に含まれる音声情報を認識してテキスト情報を生成する音声認識部と、
外部の装置から前記動画情報を受け付けると、前記動画情報に含まれる音声情報について前記音声認識部により生成されたテキスト情報を記録するテキストファイルを生成して前記動画情報に関連付けて前記動画情報記憶部へ格納する動画記録制御部と、
所定の公開装置に対する公開指示を受け付けると、前記動画情報および前記テキストファイルを公開するよう前記公開装置へ送信する公開装置連携部と、
を備えることを特徴とする行動記録装置。 - 請求項1に記載の行動記録装置であって、
前記公開装置連携部は、前記外部の装置が受け付けた音声を前記音声認識部により認識して公開対象の前記公開装置を特定する、
ことを特徴とする行動記録装置。 - 請求項1または2に記載の行動記録装置であって、
前記公開装置連携部は、公開対象の動画の特定にあたり、公開する候補の前記音声情報の一部または全部を前記外部の装置に音声出力させ、公開指示を受け取った際に出力されていた音声情報に関連する動画を公開する対象とする、
ことを特徴とする行動記録装置。 - 請求項1〜3のいずれか一項に記載の行動記録装置であって、
前記外部の装置は、音声情報を含む動画情報を取得するために撮像装置を制御する撮像制御部と、前記動画情報を前記動画記録制御部へ送信する通信部と、を備える動物型の入出力端末である、
ことを特徴とする行動記録装置。 - 請求項4に記載の行動記録装置であって、
前記入出力端末は、鳥の外形を模した形状を備え、利用者の体の一部に着脱可能に取り付けられる、
ことを特徴とする行動記録装置。 - 鳥の外形を模した形状を備え、
周囲の音声の入力を受け付ける音声入力部と、
利用者から前記音声入力部を介して撮像の開始と終了の指示を受け付けると、前記音声入力部を介して受け付けた周囲の音声情報を含めて前記撮像の開始の指示を受け付けてから終了の指示を受け付けるまでの間に撮像した動画情報を生成する撮像制御部と、
前記動画情報を所定の他の装置へ送信する通信部と、
を備えることを特徴とする入出力装置。 - 請求項6に記載の入出力装置であって、
音声を出力する音声出力部を備え、
前記通信部は、前記他の装置から音声出力情報を受け付けると、当該音声出力情報を前記音声出力部に出力させるとともに、当該音声出力を行っている期間において前記音声入力部が受け付けた音声の入力を前記他の装置へ送信する、
ことを特徴とする入出力装置。 - コンピューターに、行動を記録する手順を実行させるプログラムであって、
前記コンピューターを、制御手段と、動画情報を格納する動画情報記憶手段として機能させ、
前記制御手段に対して、
前記動画情報に含まれる音声情報を認識してテキスト情報を生成する音声認識ステップと、
外部の装置から前記動画情報を受け付けると、前記動画情報に含まれる音声情報について前記音声認識ステップにより生成されたテキスト情報を記録するテキストファイルを生成して前記動画情報に関連付けて前記動画情報記憶手段へ格納する動画記録制御ステップと、
所定の公開装置に対する公開指示を受け付けると、前記動画情報および前記テキストファイルを公開するよう前記公開装置へ送信する公開装置連携ステップと、
を実行させることを特徴とする行動記録プログラム。 - コンピューターを用いて行動を記録する手順を実施する行動記録方法であって、
前記コンピューターは、
制御手段と、動画情報を格納する動画情報記憶手段と、を備え、
前記動画情報に含まれる音声情報を認識してテキスト情報を生成する音声認識ステップと、
外部の装置から前記動画情報を受け付けると、前記動画情報に含まれる音声情報について前記音声認識ステップにより生成されたテキスト情報を記録するテキストファイルを生成して前記動画情報に関連付けて前記動画情報記憶手段へ格納する動画記録制御ステップと、
所定の公開装置に対する公開指示を受け付けると、前記動画情報および前記テキストファイルを公開するよう前記公開装置へ送信する公開装置連携ステップと、
を実行することを特徴とする行動記録方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013258842A JP2015115911A (ja) | 2013-12-16 | 2013-12-16 | 行動記録装置、入出力装置、行動記録プログラムおよび行動記録方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013258842A JP2015115911A (ja) | 2013-12-16 | 2013-12-16 | 行動記録装置、入出力装置、行動記録プログラムおよび行動記録方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2015115911A true JP2015115911A (ja) | 2015-06-22 |
Family
ID=53529299
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013258842A Pending JP2015115911A (ja) | 2013-12-16 | 2013-12-16 | 行動記録装置、入出力装置、行動記録プログラムおよび行動記録方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2015115911A (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20170034315A (ko) * | 2015-09-18 | 2017-03-28 | 가시오게산키 가부시키가이샤 | 전자 기기, 시스템, 보존 제어 방법 및 프로그램 |
CN107452381A (zh) * | 2016-05-30 | 2017-12-08 | ***通信有限公司研究院 | 一种多媒体语音识别装置及方法 |
-
2013
- 2013-12-16 JP JP2013258842A patent/JP2015115911A/ja active Pending
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20170034315A (ko) * | 2015-09-18 | 2017-03-28 | 가시오게산키 가부시키가이샤 | 전자 기기, 시스템, 보존 제어 방법 및 프로그램 |
KR102653751B1 (ko) * | 2015-09-18 | 2024-04-01 | 가시오게산키 가부시키가이샤 | 전자 기기, 시스템, 보존 제어 방법 및 프로그램 |
CN107452381A (zh) * | 2016-05-30 | 2017-12-08 | ***通信有限公司研究院 | 一种多媒体语音识别装置及方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102180994B1 (ko) | 적응적 인공 신경 네트워크 선택 기법들 | |
US8768693B2 (en) | Automatic tag extraction from audio annotated photos | |
CN109091869A (zh) | 虚拟对象的动作控制方法、装置、计算机设备及存储介质 | |
CN107111492A (zh) | 跨诸设备缩放数字个人助理代理 | |
CN107209668A (zh) | 反应型代理开发环境 | |
CN103918284B (zh) | 语音控制装置、语音控制方法和程序 | |
JP2014112302A (ja) | 所定領域管理システム、通信方法、及びプログラム | |
CN112699258A (zh) | 作品生成和编辑方法、装置、终端、服务器和*** | |
WO2021185375A1 (zh) | 一种分享数据的方法及设备 | |
KR102153990B1 (ko) | 증강현실 영상 마커 장치 | |
CN108572969A (zh) | 提供地理信息点介绍信息的方法及装置 | |
CN104025626A (zh) | 用于动态设备配置的周期性外界波形分析 | |
CN110709807A (zh) | 用于语音驱动的动态菜单的方法和*** | |
JP2021511562A (ja) | 資金フローレポート生成方法および装置、ならびに電子デバイス | |
WO2020098431A1 (zh) | 一种构建地图模型的方法及装置 | |
CN109785229B (zh) | 基于区块链实现的智能合影方法、装置、设备和介质 | |
CN112154411A (zh) | 使用音频数据进行设备控制 | |
CN114445500B (zh) | 增强现实场景构建方法、装置、终端设备和存储介质 | |
CN110536075A (zh) | 视频生成方法和装置 | |
CN102959934A (zh) | 用于共享图像的方法和装置 | |
US9442956B2 (en) | Waypoints generation systems and methods | |
KR20230031921A (ko) | 콘텐츠를 발생시키기 위한 카메라 사용자 인터페이스 | |
JP2015115911A (ja) | 行動記録装置、入出力装置、行動記録プログラムおよび行動記録方法 | |
EP3173943A1 (en) | System, method and computer program product for transferring three-dimensional models | |
JP2016194784A (ja) | 画像管理システム、通信端末、通信システム、画像管理方法、及びプログラム |