JP7280495B2

JP7280495B2 - 情報処理システム、コンテンツ生成装置、コンテンツ提示装置、コンテンツ生成方法、コンテンツ提示方法およびプログラム

Info

Publication number: JP7280495B2
Application number: JP2019070141A
Authority: JP
Inventors: 和宮川; 真吾木下; 健也鈴木; 聡佐久間; 龍也松井
Original assignee: Nippon Telegraph and Telephone Corp
Current assignee: Nippon Telegraph and Telephone Corp
Priority date: 2019-04-01
Filing date: 2019-04-01
Publication date: 2023-05-24
Anticipated expiration: 2039-04-01
Also published as: US11995861B2; WO2020203368A1; US20220148215A1; JP2020170903A

Description

本発明は、情報処理システム、コンテンツ生成装置、コンテンツ提示装置、コンテンツ生成方法、コンテンツ提示方法およびプログラムに関する。

バーチャルリアリティ（ＶＲ：Virtual Reality）技術とは、現実あるいは実物に近しい疑似的な環境を提供する技術である。ＶＲ技術を用いることで、例えば、遠隔地にいるプレイヤとの疑似レースゲームを行ったり、様々な景勝地を再現した疑似観光を行ったりすることができる。そのため、ＶＲ技術は、娯楽あるいは教育を始めとした様々な分野で活用されつつある。

非特許文献１には、ヘッドマウンテッドディスプレイを用いた仮想的な三次元映像、音響、扇風機による風および可動式の模擬サーフボードを用いて、現実世界でのサーフィンを模したシミュレータが記載されている。このようなシミュレータによれば、海へ行くことなく、手軽にサーフィンを体験可能な環境を提供することができる。

多くのＶＲ技術は、現実世界に近い環境を提供することを目的としており、そのために用いられる情報は、現実世界をシミュレーションすることにより取得、利用されている。上述した疑似サーフィンの場合、波の動きに関する情報は、サーフィンを行う上での理想的な波の形状をシミュレーションすることで取得される。そして、取得した情報に基づき、表示する映像および疑似サーフボードの動きなどを制御することで、あたかも現実にサーフィンを行っているような疑似体験をユーザに提供することができる。

擬似体験を提供するにあたり、ＶＲ技術では必ずしも、現実に即した情報を用いる必要はない。例えば、娯楽性の観点から「人の波」という比喩表現を考えた場合、「海の波をサーフィンする」のではなく、「人の波をサーフィンする」という、現実にはありえない体験を提供することが可能となる。この場合、例えば、交差点を渡る人々を「人の波」と見立てると、混合ガウスモデルおよび最尤推定法といった従来技術を用いることにより、人の粗密から波のような形状を取得することができる（非特許文献２参照）。

「VR Surfing Simulator Rental NYC-Nj-CT-Philly」、［online］、［２０１９年３月２０日検索］、インターネット＜ＵＲＬ：http://nextgeneventco.com/vr-surfing-simulator-ny-nj-ct-pa/＞「混合ガウスモデル(Gaussian Mixture Model, GMM)～クラスタリングするだけでなく、データセットの確率密度分布を得るにも重宝します～」、［online］、［２０１９年３月２０日検索］、インターネット＜ＵＲＬ：https://datachemeng.com/gaussianmixturemodel/＞

上述したように、非特許文献２に記載されている技術を用いることで、人の粗密、すなわち、オブジェクト（人）の位置情報を用いて、波の形状を取得することができる。しかしながら、オブジェクトの位置情報を用いるだけでは、波の形状（起伏）は表現することはできても、波の表情を表現することができない。ここで言う「波の表情」とは、うねりあるいは波しぶきなどの激しい動きを伴う「荒波」、波が穏やかな起伏を繰り返す「凪」、南海に見られる「エメラルドブルー」などの、提示対象（波）の形状だけでは表現できない、提示対象の特性を示す情報を指す。

上記のような問題点に鑑みてなされた本発明の目的は、位置情報に基づき得られる提示対象の形状だけでは表現できない情報を表現することで、より表現豊かな疑似体験用のコンテンツを提示することができる情報処理システム、コンテンツ生成装置、コンテンツ提示装置、コンテンツ生成方法、コンテンツ提示方法およびプログラムを提供することにある。

上記課題を解決するため、本発明に係る情報処理システムは、ＶＲ技術を用いてコンテンツの提示に関するコンテンツ情報を生成するコンテンツ生成装置と、ＶＲ技術を用いてコンテンツの提示を制御するコンテンツ提示装置とを備える情報処理システムであって、前記コンテンツ生成装置は、入力映像を取得する映像入力部と、前記映像入力部が取得した入力映像から、第１オブジェクトの位置情報を検出する映像検出部と、前記映像入力部が取得した入力映像から、前記映像検出部が検出した第１オブジェクトの属性情報を抽出する属性抽出部と、前記映像検出部が検出した位置情報と、前記属性抽出部が抽出した属性情報とを用いて、前記第１オブジェクトとは異なる第２オブジェクトの動きを示すコンテンツ情報を生成する情報生成部と、を備え、前記コンテンツ提示装置は、前記情報生成部により生成されたコンテンツ情報に応じて、コンテンツを提示するコンテンツ提示部によるコンテンツの提示を制御する提示制御部を備える。

また、上記課題を解決するため、本発明に係るコンテンツ生成装置は、ＶＲ技術を用いてコンテンツの提示に関するコンテンツ情報を生成するコンテンツ生成装置であって、入力映像を取得する映像入力部と、前記映像入力部が取得した入力映像から、第１オブジェクトの位置情報を検出する映像検出部と、前記映像入力部が取得した入力映像から、前記映像検出部が検出した第１オブジェクトの属性情報を抽出する属性抽出部と、前記映像検出部が検出した位置情報と、前記属性抽出部が抽出した属性情報とを用いて、前記第１オブジェクトとは異なる第２オブジェクトの動きを示すコンテンツ情報を生成する情報生成部と、を備える。

また、上記課題を解決するため、本発明に係るコンテンツ提示装置は、ＶＲ技術を用いてコンテンツの提示を制御するコンテンツ提示装置であって、入力映像に含まれる第１オブジェクトの位置情報と、前記オブジェクトの属性情報とを用いて生成された、前記第１オブジェクトとは異なる第２オブジェクトの動きを示すコンテンツ情報に応じて、コンテンツを提示するコンテンツ提示部によるコンテンツの提示を制御する提示制御部を備える。

また、上記課題を解決するため、本発明に係るコンテンツ生成方法は、ＶＲ技術を用いてコンテンツの提示に関するコンテンツ情報を生成するコンテンツ生成装置におけるコンテンツ生成方法であって、入力映像を取得するステップと、前記取得した入力映像から、第１オブジェクトの位置情報を検出するステップと、前記取得した入力映像から、前記検出した第１オブジェクトの属性情報を抽出するステップと、前記検出した位置情報と、前記抽出した属性情報とを用いて、前記第１オブジェクトとは異なる第２オブジェクトの動きを示すコンテンツ情報を生成するステップと、を含む。

また、上記課題を解決するため、本発明に係るコンテンツ提示方法は、ＶＲ技術を用いてコンテンツの提示を制御するコンテンツ提示装置におけるコンテンツ提示方法であって、入力映像に含まれるオブジェクトの位置情報と、前記第１オブジェクトの属性情報とを用いて生成された、前記第１オブジェクトとは異なる第２オブジェクトの動きを示すコンテンツ情報に応じて、コンテンツを提示するコンテンツ提示部によるコンテンツの提示を制御するステップを含む。

また、上記課題を解決するため、本発明に係るプログラムは、コンピュータを、上記のコンテンツ生成装置として機能させる。

また、上記課題を解決するため、本発明に係るプログラムは、コンピュータを、上記のコンテンツ提示装置として機能させる。

本発明に係る情報処理システム、コンテンツ生成装置、コンテンツ提示装置、コンテンツ生成方法、コンテンツ提示方法およびプログラムによれば、位置情報に基づき得られる提示対象の形状だけでは表現できない情報を表現することで、より表現豊かな疑似体験用のコンテンツを提示することができる。

本発明の一実施形態に係る情報処理システムの構成例を示す図である。図１に示す映像検出部によるオブジェクトの検出結果を模式的に示す図である。図１に示す映像検出部によるオブジェクトの位置情報の検出結果の一例を示す図である。図１に示す属性抽出部による属性情報の抽出結果の一例を示す図である。図１に示す管理サーバの動作の一例を示すフローチャートである。図１に示すクライアント端末の動作の一例を示すフローチャートである。

以下、本発明を実施するための形態について、図面を参照しながら説明する。

図１は、本発明の一実施形態に係る情報処理システム１の構成例を示す図である。以下では、本実施形態に係る情報処理システム１は、ユーザに疑似的にサーフィンをしているような体験を提供するシステムである例を用いて説明する。なお、本発明は、上述した例に限られるものではなく、ＶＲ技術を用いてユーザに疑似的な体験を提供する種々のシステムに適用可能である。

図１に示す情報処理システム１は、サーバクライアント型システムであり、管理サーバ１０と、クライアント端末２０とを備える。管理サーバ１０とクライアント端末２０とは所定のネットワークを介して通信可能である。管理サーバ１０は、コンテンツ生成装置の一例である。クライアント端末２０は、コンテンツ提示装置の一例である。

管理サーバ１０は、コンテンツの提示に関するコンテンツ情報を生成する。管理サーバ１０は、例えば、交差点を撮影するカメラ２により撮影された映像を取得し、取得した映像を解析して、解析結果に応じたコンテンツ情報を生成する。

クライアント端末２０は、管理サーバ１０が生成したコンテンツ情報を取得し、取得したコンテンツ情報に応じて、コンテンツを提示するコンテンツ提示部３によるコンテンツの提示を制御する。コンテンツ提示部３は、例えば、ユーザの頭部に装着されるヘッドマウンテッドディスプレイ３ａおよび可動式の疑似サーフボード３ｂなどを含むが、これらに限られるものではない。コンテンツ情報は、ヘッドマウンテッドディスプレイ３ａに表示する映像、ヘッドマウンテッドディスプレイ３ａで出力する音などを示す情報である。また、コンテンツ情報は、疑似サーフボードの動きを示す情報である。クライアント端末２０は、コンテンツ情報に基づき、ヘッドマウンテッドディスプレイ３ａでユーザに視聴させる映像および音を制御する。また、クライアント端末２０は、コンテンツ情報に基づき、疑似サーフボード３ｂの動きを制御する。

次に、管理サーバ１０およびクライアント端末２０の構成について、図１を参照して説明する。まず、管理サーバ１０の構成について説明する。

図１に示す管理サーバ１０は、映像入力部１１と、映像検出部１２と、属性抽出部１３と、情報生成部１４とを備える。映像入力部１１、映像検出部１２、属性抽出部１３および情報生成部１４の各機能は、例えば、管理サーバ１０が有するメモリに記憶されたプログラムを、プロセッサなどで実行することで実現可能である。本実施形態において、「メモリ」は、例えば、半導体メモリ、磁気メモリまたは光メモリなどであるが、これらに限られない。また、本実施形態において、「プロセッサ」は、汎用のプロセッサ、特定の処理に特化したプロセッサなどであるが、これらに限られない。

映像入力部１１は、交差点を撮影するカメラ２により撮影された映像を取得する。映像入力部１１は、例えば、カメラ２により撮影された映像をリアルタイムに取得する。

映像検出部１２は、映像入力部１１により取得された映像（入力映像）から、所定のオブジェクト（本実施形態では、人）の位置情報を検出する。具体的には、映像検出部１２は、入力映像における、オブジェクトが存在する領域を検出する。入力映像におけるオブジェクトの検出には、テンプレートマッチング技術、機械学習を用いた技術など既存の技術を用いることができる。映像検出部１２は、例えば、図２に示すように、入力映像に含まれるオブジェクト（図２では、人）ごとに、そのオブジェクトが存在する領域α，β，γ・・・を矩形の領域として検出する。

映像検出部１２は、検出した領域ごとに位置情報を取得する。例えば、映像検出部１２は、図３に示すように、検出した領域ごとに、入力映像の画面上の座標（ｘ、ｙ）およびサイズ（ｗ、ｈ）を検出する。また、映像検出部１２は、カメラ２の位置と撮影場所との位置関係に基づき、検出した領域ごとに、奥行方向の座標（ｚ）を検出してもよい。

属性抽出部１３は、映像入力部１１により取得された入力映像から、映像検出部１２により検出されたオブジェクトの属性情報を抽出する。属性抽出部１３は、オブジェクトの属性情報として、性別、年齢層、人種、身長、服装および移動ベクトルなど、入力映像における画像の特徴から抽出可能な付加的な情報を抽出する。個々人を識別可能な程度に入力映像の解像度が高く、かつ、個人の氏名、住所などが記録されたデータベースが用意されている場合には、属性抽出部１３は、属性情報として、オブジェクト（人）の氏名および住所などの情報をデータベースから抽出してもよい。属性情報の抽出には、既存の技術を用いることができる。

属性抽出部１３は、図４に示すように、映像検出部１２により検出された領域ごとに、その領域に存在するオブジェクトの属性情報を抽出する。図４では、属性情報として、性別（Ｇ）、年齢層（Ｙ）、身長（Ｔ）、服装（Ｃ）および移動ベクトル（Ｖ）に関する情報を抽出した例を示している。

情報生成部１４は、映像検出部１２が検出した位置情報と、属性抽出部１３が抽出した属性情報とに対応するコンテンツ情報を生成し、クライアント端末２０に送信する。情報生成部１４によるコンテンツ情報の生成の詳細については後述する。

次に、クライアント端末２０の構成について説明する。

図１に示すクライアント端末２０は、映像生成部２１と、音響生成部２２と、機器制御部２３とを備える。映像生成部２１、音響生成部２２および機器制御部２３は、提示制御部２４を構成する。映像生成部２１、音響生成部２２および機器制御部２３の各機能は、例えば、クライアント端末２０が有するメモリに記憶されたプログラムを、プロセッサなどで実行することで実現可能である。

映像生成部２１は、管理サーバ１０から送信されたコンテンツ情報を取得し、取得したコンテンツ情報に応じた映像を生成し、生成した映像をヘッドマウンテッドディスプレイ３ａに表示させる。

音響生成部２２は、管理サーバ１０から送信されたコンテンツ情報を取得し、取得したコンテンツ情報に応じた音を生成し、生成した音をヘッドマウンテッドディスプレイ３ａに出力させる。

機器制御部２３は、管理サーバ１０から送信されたコンテンツ情報を取得し、取得したコンテンツ情報に応じて、疑似サーフボード３ｂの動きを制御する。

上述したように、映像生成部２１、音響生成部２２および機器制御部２３は、提示制御部２４を構成する。したがって、提示制御部２４は、情報生成部１４により生成されたコンテンツ情報に応じて、コンテンツ提示部３によるコンテンツの提示を制御する。

次に、情報生成部１４によるコンテンツ情報の生成について説明する。以下では、情報生成部１４が、提示対象である「人の波」を表現するコンテンツ情報を生成する例を用いて説明する。

情報生成部１４は、映像検出部１２により検出された、オブジェクトが存在する領域ごとの位置情報に基づき、波の形状を生成する。情報生成部１４は、波の形状を生成するために、例えば、混合ガウスモデルと最尤推定法とを用いて、式（１）に示される確率密度関数ｐ（ｘ｜π，μ，Ｍ）を求める。

式（１）において、ｘは各領域の位置情報であり、πは混合係数であり、μは平均ベクトルであり、Ｍは共分散行列であり、Ｎは正規分布であり、Ｋはクラスタ数である。クラスタ数Ｋは既知として扱う。そのため、クラスタ数Ｋは、一定数、あるいは、検出された領域の総数に応じて変動する、事前に定義された定数（例えば、領域の数が１０未満なら２、領域の数が２５未満なら３、領域の数が２５以上なら４）とする。確率密度関数ｐは、Ｋ個の正規分布の重なり合いとして表現される。確率密度関数ｐは、波の形状を決定する関数である。以下では、確率密度関数ｐを形状関数ｐと称する。

属性情報に応じたコンテンツ情報の生成には、種々の方法を用いることができる。

情報生成部１４は、例えば、属性情報として性別を用いる場合、男性の総数が女性の総数を超える場合は１、逆の場合は０．５を返す指示関数ｇを用いる。指示関数ｇによれば、女性が多い場合に、起伏が和らいだ穏やかな波が生成される。指示関数ｇは、波の穏やかさという、波の形状だけでは表現できない特性（表情）を決定する関数である。以下では、指示関数ｇを表情関数ｇと称する。

また、情報生成部１４は、例えば、属性情報として年齢層を用いる場合、年齢層を形状に対する係数に置き換える。情報生成部１４は、例えば、年齢層に応じた係数と平滑化関数ｓとを用いる。具体的には、情報生成部１４は、年齢層（０～２０歳、２０～４０歳、４０～６０歳、６０～歳）に対して、係数ａ＝｛１．２，２．０，１．５，１．０｝を割り振る。映像検出部１２により検出された領域ごとに、位置情報（図３）および年齢層（図４）が求められているため、情報生成部１４は、一定の面積を有する２次元ウィンドウを座標軸上でずらしながら、ウィンドウ内の係数平均ａを求める関数ｓ_ａを定義する。関数ｓ_ａによれば、年齢構成が多様になるほど、高低差が際立つ、うねるような波が生成される。関数ｓ_ａは、波のうねりという、波の形状だけでは表現できない特性（表情）を決定する関数である。以下では、関数ｓ_ａを表情関数ｓ_ａと称する。

また、情報生成部１４は、例えば、属性情報として身長を用いる場合、映像検出部１２により検出された領域ごとに抽出された身長の絶対値に対して、表情関数ｓ_ａと同様の関数ｓ_ｔを定義する。関数ｓ_ｔによれば、身長が高い人が多いほど、高い波が生成される。関数ｓ_ｔは、波高という波の形状だけでは表現できない特性（表情）を決定する関数である。以下では、関数ｓ_ｔを表情関数ｓ_ｔと称する。

また、情報生成部１４は、例えば、属性情報として服装を用いる場合、一定範囲内の色平均を求める平滑化関数ｓ_ｃを定義する。平滑化関数ｓ_ｃによれば、暖かい季節には華やかな、寒い季節には穏やかな水面が生成される。

また、情報生成部１４は、例えば、属性情報として移動ベクトルを用いる場合、ウィンドウ内のベクトル長平均を求める平滑化関数ｓ_ｖを定義する。平滑化関数ｓ_ｖによれば、波の勢いを表現することができ、例えば、波しぶきなどの演出に利用することができる。

情報生成部１４は、形状関数ｐ、表情関数ｇ，ｓ_ａ，ｓ_ｔを用いて、以下の式（２）に基づき最終的な波ｗを決定し、コンテンツ情報としてクライアント端末２０に送信する。
ｗ＝ｐｇｓ_ａｓ_ｔ・・・式（２）

また、情報生成部１４は、平滑化関数ｓ_ｃおよび平滑化関数ｓ_ｖをコンテンツ情報としてクライアント端末２０に送信する。平滑化関数ｓ_ｃは、３次元映像を生成する際のテクスチャとして用いることができる。また、平滑化関数ｓ_ｖは、波しぶき、波音および風などの演出に用いることができる。

次に、管理サーバ１０およびクライアント端末２０の動作について説明する。

図５は、管理サーバ１０の動作を示すフローチャートであり、管理サーバ１０におけるコンテンツ生成方法について説明するための図である。

映像入力部１１は、カメラ２により撮影された入力映像を取得する（ステップＳ１１）。

映像検出部１２は、映像入力部１１が取得した入力映像から、オブジェクトの位置情報を検出する（ステップＳ１２）。

属性抽出部１３は、映像入力部１１が取得した入力映像から、映像検出部１２により検出されたオブジェクトの属性情報を抽出する（ステップＳ１３）。

情報生成部１４は、映像検出部１２により検出された位置情報と、属性抽出部１３により抽出された属性情報とに対応するコンテンツ情報を生成する（ステップＳ１４）。

図６は、クライアント端末２０の動作を示すフローチャートであり、クライアント端末２０におけるコンテンツ提示方法について説明するための図である。

提示制御部２４は、管理サーバ１０により生成されたコンテンツ情報を取得する（ステップＳ２１）。すなわち、映像生成部２１、音響生成部２２および機器制御部２３はぞれぞれ、コンテンツ情報を取得する。

次に、提示制御部２４は、取得したコンテンツ情報に応じて、コンテンツ提示部３によるコンテンツの提示を制御する（ステップＳ２２）。具体的には、映像生成部２１は、コンテンツ情報に応じた映像を生成し、ヘッドマウンテッドディスプレイ３ａに表示させる。また、音響生成部２２は、コンテンツ情報に応じた音を生成し、ヘッドマウンテッドディスプレイ３ａに出力させる。また、機器制御部２３は、コンテンツ情報に応じて疑似サーフボード３ｂの動きを制御する。

このように本実施形態においては、管理サーバ１０は、入力映像を取得する映像入力部１１と、入力映像からオブジェクトの位置情報を検出する映像検出部１２と、入力映像からオブジェクトの属性情報を抽出する属性抽出部１３と、映像検出部１２が検出した位置情報と、属性抽出部１３が抽出した属性情報とに対応するコンテンツ情報を生成する情報生成部１４と、を備える。また、クライアント端末２０は、情報生成部１４により生成されたコンテンツ情報に応じて、コンテンツ提示部３によるコンテンツの提示を制御する提示制御部２４を備える。

オブジェクトの位置情報のみに基づく形状表現では表現することができない、提示対象の特性を示す情報を、オブジェクトの属性情報を用いて表現することができるので、より表現豊かな疑似体験用のコンテンツを提示することができる。

以上、管理サーバ１０（コンテンツ生成装置）およびクライアント端末２０（コンテンツ提示装置）について説明したが、管理サーバ１０（コンテンツ生成装置）およびクライアント端末２０（コンテンツ提示装置）として機能させるために、コンピュータを用いることも可能である。そのようなコンピュータは、管理サーバ１０（コンテンツ生成装置）およびクライアント端末２０（コンテンツ提示装置）の各機能を実現する処理内容を記述したプログラムを、該コンピュータの記憶部に格納しておき、該コンピュータのＣＰＵによってこのプログラムを読み出して実行させることで、コンピュータを管理サーバ１０（コンテンツ生成装置）およびクライアント端末２０（コンテンツ提示装置）として動作させることができる。

また、プログラムは、コンピュータが読取り可能な記録媒体に記録されていてもよい。このような記録媒体を用いれば、プログラムをコンピュータにインストールすることが可能である。ここで、プログラムが記録された記録媒体は、非一過性の記録媒体であってもよい。非一過性の記録媒体は、特に限定されるものではないが、例えば、ＣＤ－ＲＯＭあるいはＤＶＤ－ＲＯＭなどの記録媒体であってもよい。

上述の実施形態は代表的な例として説明したが、本発明の趣旨及び範囲内で、多くの変更および置換が可能であることは当業者に明らかである。したがって、本発明は、上述の実施形態によって制限するものと解するべきではなく、特許請求の範囲から逸脱することなく、種々の変形および変更が可能である。例えば、実施形態の構成図に記載の複数の構成ブロックを１つに組み合わせたり、あるいは１つの構成ブロックを分割したりすることが可能である。

１情報処理システム
１０管理サーバ（コンテンツ生成装置）
１１映像入力部
１２映像検出部
１３属性抽出部
１４情報生成部
２０クライアント端末（コンテンツ提示装置）
２１映像生成部
２２音響生成部
２３機器制御部
２４提示制御部

Claims

ＶＲ技術を用いてコンテンツの提示に関するコンテンツ情報を生成するコンテンツ生成装置と、ＶＲ技術を用いてコンテンツの提示を制御するコンテンツ提示装置とを備える情報処理システムであって、
前記コンテンツ生成装置は、
入力映像を取得する映像入力部と、
前記映像入力部が取得した入力映像から、第１オブジェクトの位置情報を検出する映像検出部と、
前記映像入力部が取得した入力映像から、前記映像検出部が検出した第１オブジェクトの属性情報を抽出する属性抽出部と、
前記映像検出部が検出した位置情報と、前記属性抽出部が抽出した属性情報とを用いて、前記第１オブジェクトとは異なる第２オブジェクトの動きを示すコンテンツ情報を生成する情報生成部と、を備え、
前記コンテンツ提示装置は、
前記情報生成部により生成されたコンテンツ情報に応じて、コンテンツを提示するコンテンツ提示部によるコンテンツの提示を制御する提示制御部を備える、情報処理システム。
ＶＲ技術を用いてコンテンツの提示に関するコンテンツ情報を生成するコンテンツ生成装置であって、
入力映像を取得する映像入力部と、
前記映像入力部が取得した入力映像から、第１オブジェクトの位置情報を検出する映像検出部と、
前記映像入力部が取得した入力映像から、前記映像検出部が検出した第１オブジェクトの属性情報を抽出する属性抽出部と、
前記映像検出部が検出した位置情報と、前記属性抽出部が抽出した属性情報とを用いて、前記第１オブジェクトとは異なる第２オブジェクトの動きを示すコンテンツ情報を生成する情報生成部と、を備えるコンテンツ生成装置。
前記コンテンツ情報は、前記位置情報に基づいて決定された形状関数と、前記属性情報に基づいて決定された表情関数とを用いて生成される、請求項２に記載のコンテンツ生成装置。
ＶＲ技術を用いてコンテンツの提示を制御するコンテンツ提示装置であって、
入力映像に含まれる第１オブジェクトの位置情報と、前記オブジェクトの属性情報とを用いて生成された、前記第１オブジェクトとは異なる第２オブジェクトの動きを示すコンテンツ情報に応じて、コンテンツを提示するコンテンツ提示部によるコンテンツの提示を制御する提示制御部を備える、コンテンツ提示装置。
ＶＲ技術を用いてコンテンツの提示に関するコンテンツ情報を生成するコンテンツ生成装置におけるコンテンツ生成方法であって、
入力映像を取得するステップと、
前記取得した入力映像から、第１オブジェクトの位置情報を検出するステップと、
前記取得した入力映像から、前記検出した第１オブジェクトの属性情報を抽出するステップと、
前記検出した位置情報と、前記抽出した属性情報とを用いて、前記第１オブジェクトとは異なる第２オブジェクトの動きを示すコンテンツ情報を生成するステップと、を含むコンテンツ生成方法。
前記コンテンツ情報は、前記位置情報に基づいて決定された形状関数と、前記属性情報に基づいて決定された表情関数とを用いて生成される、請求項５に記載のコンテンツ生成方法。
ＶＲ技術を用いてコンテンツの提示を制御するコンテンツ提示装置におけるコンテンツ提示方法であって、
入力映像に含まれる第１オブジェクトの位置情報と、前記第１オブジェクトの属性情報とを用いて生成された、前記第１オブジェクトとは異なる第２オブジェクトの動きを示すコンテンツ情報に応じて、コンテンツを提示するコンテンツ提示部によるコンテンツの提示を制御するステップを含む、コンテンツ提示方法。
コンピュータを、請求項２又は３に記載のコンテンツ生成装置として動作させるプログラム。
コンピュータを、請求項４に記載のコンテンツ提示装置として動作させるプログラム。