WO2020234939A1

WO2020234939A1 - 情報処理装置、情報処理方法、およびプログラム

Info

Publication number: WO2020234939A1
Application number: PCT/JP2019/019776
Authority: WO
Inventors: 健司徳武
Original assignee: ソニー株式会社
Priority date: 2019-05-17
Filing date: 2019-05-17
Publication date: 2020-11-26
Also published as: EP3972241A1; EP3972241A4; US20220171202A1; CN113875227A; US11846783B2

Abstract

現実空間と融合したＡＲコンテンツをより安全に視聴する。ユーザの眼前に配置される表示装置によるＡＲコンテンツの表示を制御する制御部、を備え、前記制御部は、オリジナルコンテンツが表示される場合と比較して前記ユーザによる現実空間の視認レベルの低下度合いが軽減されるように、前記ＡＲコンテンツの表示態様を制御する、情報処理装置が提供される。また、プロセッサが、ユーザの眼前に配置される表示装置によるＡＲコンテンツの表示を制御すること、を含み、前記制御することは、オリジナルコンテンツが表示される場合と比較して前記ユーザによる現実空間の視認レベルの低下度合いが軽減されるように、前記ＡＲコンテンツの表示態様を制御すること、をさらに含む、情報処理方法が提供される。

Description

情報処理装置、情報処理方法、およびプログラム

　本開示は、情報処理装置、情報処理方法、およびプログラムに関する。

　近年、ＡＲ（Ａｕｇｍｅｎｔｅｄ　Ｒｅａｌｉｔｙ）技術を活用したサービスや、当該サービスを実現するための装置が開発されている。例えば、特許文献１には、ＡＲ技術を実現するためのヘッドマウントディスプレイが開示されている。

特開２０１１－２７５３号公報

　ところで、特許文献１に開示されるようなヘッドマウントディスプレイを装着したユーザが、歩行などの動作を行いながらＡＲコンテンツを視聴する場合、表示されるＡＲコンテンツにより現実空間に存在する物体等の視認レベルが低下する可能性がある。

　本開示によれば、ユーザの眼前に配置される表示装置によるＡＲコンテンツの表示を制御する制御部、を備え、前記制御部は、オリジナルコンテンツが表示される場合と比較して前記ユーザによる現実空間の視認レベルの低下度合いが軽減されるように、前記ＡＲコンテンツの表示態様を制御する、情報処理装置が提供される。

　また、本開示によれば、プロセッサが、ユーザの眼前に配置される表示装置によるＡＲコンテンツの表示を制御すること、を含み、前記制御することは、オリジナルコンテンツが表示される場合と比較して前記ユーザによる現実空間の視認レベルの低下度合いが軽減されるように、前記ＡＲコンテンツの表示態様を制御すること、をさらに含む、情報処理方法が提供される。

　また、本開示によれば、コンピュータを、ユーザの眼前に配置される表示装置によるＡＲコンテンツの表示を制御する制御部、を備え、前記制御部は、オリジナルコンテンツが表示される場合と比較して前記ユーザによる現実空間の視認レベルの低下度合いが軽減されるように、前記ＡＲコンテンツの表示態様を制御する、情報処理装置、として機能させるためのプログラムが提供される。

一般的なヘッドマウントディスプレイによるＡＲコンテンツの表示について説明するための図である。本開示の一実施形態に係るＡＲコンテンツ表示の一例を示す図である。同実施形態に係る情報処理システムの構成例を示す図である。同実施形態に係る情報処理端末１０とヘッドマウントディスプレイ２０の機能構成例を示すブロック図である。同実施形態に係るヘッドマウントディスプレイ２０が単独でＡＲコンテンツの表示制御を行う場合の詳細構成の一例を示すブロック図である。同実施形態に係るＳＬＡＭを実現するソフトウェアの構成例を示す図である。同実施形態に係るＳＬＡＭおよびＡＲコンテンツの表示制御を情報処理端末１０が行う場合の詳細構成の一例を示すブロック図である。同実施形態に係る主要被写体を含む再生シーンに応じたＡＲコンテンツの表示制御について説明するための図である。同実施形態に係る再生シーンごとの代表画像に対応するＡＲコンテンツの表示制御について説明するための図である。同実施形態に係る再生シーンやユーザの動作状況に基づくＡＲコンテンツの表示位置制御について説明するための図である。同実施形態に係る楽曲データに基づく再生シーン特性の特定と再生シーン特性に基づくＡＲコンテンツの表示制御の流れを示すフローチャートである。同実施形態に係る楽曲データに基づくクラスタリングの一例を示す図である。同実施形態に係る現実空間に存在する物体の認識結果に基づくＡＲコンテンツの表示制御について説明するための図である。同実施形態に係るユーザのジェスチャに基づくＡＲコンテンツの表示制御の一例を示す図である。同実施形態に係るユーザのジェスチャに基づくＡＲコンテンツの表示制御の一例を示す図である。同実施形態に係るＶＲコンテンツに基づくＡＲコンテンツの生成について説明するための図である。同実施形態に係るＡＲコンテンツに基づくＶＲコンテンツの生成について説明するための図である。同実施形態に係る画像情報のＶＲフォーマット保存について説明するための図である。同実施形態に係る画像情報のＶＲフォーマット保存について説明するための図である。本開示の一実施形態に係るハードウェア構成例を示す図である。

　以下に添付図面を参照しながら、本開示の好適な実施の形態について詳細に説明する。なお、本明細書及び図面において、実質的に同一の機能構成を有する構成要素については、同一の符号を付することにより重複説明を省略する。

　なお、説明は以下の順序で行うものとする。
　１．実施形態
　　１．１．概要
　　１．２．システム構成例
　　１．３．機能構成例
　　１．４．詳細構成例
　　１．５．ＡＲコンテンツの表示制御
　２．まとめ

　＜１．実施形態＞
　＜＜１．１．概要＞＞
　まず、本開示の一実施形態の概要について述べる。上述したように、近年においては、ＡＲ技術を活用したサービスや、当該サービスを実現するための装置が多く開発されている。上記のような装置には、例えば、特許文献１に開示されるようなヘッドマウントディスプレイが挙げられる。

　ユーザは、特許文献１に開示されるような、透過型（ビデオ透過型、光学透過型を含む）ヘッドマウントディスプレイにより現実空間を視認しながら、ディスプレイ上に表示されるＡＲコンテンツを視聴することが可能である。

　しかし、例えば、歩行時などユーザが移動を行いながらＡＲコンテンツを視聴する場合、表示されるＡＲコンテンツにより現実空間に存在する物体等の視認レベルが低下する可能性がある。

　図１は、一般的なヘッドマウントディスプレイによるＡＲコンテンツの表示について説明するための図である。図１には、一般的なヘッドマウントディスプレイ９０を装着するユーザの視野の一例が示されている。なお、図１に示す一例では、ユーザは、ヘッドマウントディスプレイ９０を用いて、動画配信サービスが提供する動画コンテンツをＡＲコンテンツＣとして視聴している。

　ここで、図１に示す一例のように、ヘッドマウントディスプレイ９０がユーザの視野の中央部にＡＲコンテンツＣを表示する場合、ユーザの視野の大部分がＡＲコンテンツＣに占められることから、ユーザによる現実空間（すなわち、透過型のディスプレイを介して視認可能な物体や景色など）の視認レベルは著しく低下することとなる。

　ここで、ユーザが歩行などの運動や車両の運転などを行っている場合、ユーザがＡＲコンテンツＣの表示に妨害されて移動方向に存在する物体や地形などを視認することができず、衝突や転倒などが発生する可能性がある。

　本開示に係る技術思想は上記の点に着目して発想されたものであり、現実空間と融合したＡＲコンテンツをより安全に視聴することを可能とする。このために、本開示の一実施形態に係る情報処理装置は、ユーザの眼前に配置される表示装置によるＡＲコンテンツの表示を制御する制御部、を備える。また、本開示の一実施形態に係る制御部は、オリジナルコンテンツが表示される場合と比較して上記ユーザによる現実空間の視認レベルの低下度合いが軽減されるように、上記ＡＲコンテンツの表示態様を制御すること、を特徴の一つとする。

　図２は、本実施形態に係るＡＲコンテンツ表示の一例を示す図である。図２には、本実施形態に係るヘッドマウントディスプレイ２０を装着するユーザの視野の一例が示されている。なお、ヘッドマウントディスプレイは、本開示における情報処理装置の一例である。

　また、図２の場合も、図１の場合と同様に、ユーザは、動画配信サービスが提供する動画コンテンツをＡＲコンテンツとして視聴している。一方、図２に示す一例の場合、本実施形態に係るヘッドマウントディスプレイ２０は、上記の動画コンテンツ（オリジナルコンテンツ、と称する）から、３人の人物に対応する主要被写体ＭＳ１～ＭＳ３を除く背景を除去したＡＲコンテンツＣを表示している。

　上記のような制御によれば、ＡＲコンテンツＣを現実空間に重畳させる領域を縮小することができ、ユーザによる現実空間の視認レベルの低下度合いを効果的に抑えることが可能となる。

　また、本実施形態に係る主要被写体とは、例えば、動画コンテンツなどのオリジナルコンテンツにおいて、ユーザがより注目を行うと想定される被写体であってよい。例えば、オリジナルコンテンツが楽曲をプロモーションビデオや、ドラマや映画などである場合、本実施形態に係る主要被写体は、図２に示すように人物（演者）であり得る。

　このように、本実施形態に係る情報処理方法によれば、オリジナルコンテンツから、ユーザがより注目すると想定される被写体、すなわちユーザがより視聴したいことが想定される被写体に対応する領域を抽出して、当該領域をＡＲコンテンツとして表示することができる。

　これによれば、ＡＲコンテンツを現実空間に重畳する領域を縮小し安全性を向上させると共に、ユーザの興味を維持した表示を実現することができ、品質の高いＡＲ体験を提供することが可能となる。

　なお、図２に示した表示制御はあくまで一例であり、本実施形態に係るＡＲコンテンツの表示制御は係る例に限定されない。以下、本実施形態に係る表示制御の具体例と、各種の表示制御を実現するための構成について詳細に説明する。

　＜＜１．２．システム構成例＞＞
　まず、本実施形態に係る情報処理システムの構成例について説明する。図３は、本実施形態に係る情報処理システムの構成例を示す図である。図３に示すように、本実施形態に係る情報処理システムは、情報処理端末１０およびヘッドマウントディスプレイ２０を備える。また、情報処理端末１０とヘッドマウントディスプレイ２０は、ネットワーク３０を介して互いに通信が可能なように接続される。

　（情報処理端末１０）
　情報処理端末１０は、本実施形態に係る情報処理方法を実現する情報処理装置の一例である。本実施形態に係る情報処理端末１０は、ネットワーク３０を介してヘッドマウントディスプレイ２０によるＡＲ表示を制御する。本実施形態に係る情報処理端末１０は、例えば、スマートフォンなどの、持ち運びに適した小型の電子機器であってよい。一方、本実施形態に係る情報処理端末１０は、サーバであってもよい。

　（ヘッドマウントディスプレイ２０）
　本実施形態に係るヘッドマウントディスプレイ２０は、透過型のディスプレイを備え、ユーザによる現実空間の視認とＡＲコンテンツの視聴とを可能とする装置である。本実施形態に係るヘッドマウントディスプレイ２０は、例えば、情報処理端末１０による制御に基づいて、ＡＲコンテンツの表示を行ってもよい。

　本実施形態に係るヘッドマウントディスプレイ２０は、例えば、眼鏡型や防止型の装置であってもよい。また、ヘッドマウントディスプレイ２０は、例えば、通常の眼鏡などに装着が可能な外付け型の装置であってもよい。

　（ネットワーク３０）
　ネットワーク３０は、情報処理端末１０とヘッドマウントディスプレイ２０とを接続する機能を有する。ネットワーク３０は、Ｗｉ－Ｆｉ（登録商標）、Ｂｌｕｅｔｏｏｔｈ（登録商標）など無線通信網を含んでもよい。また、ネットワーク３０は、ＬＴＥ（Ｌｏｎｇ　Ｔｅｒｍ　Ｅｖｏｌｕｔｉｏｎ）などの移動体通信網を含んでもよい。

　以上、本実施形態に係る情報処理システムの構成例について述べた。なお、図３を用いて説明した上記の構成はあくまで一例であり、本実施形態に係る情報処理システムの構成は係る例に限定されない。例えば、上記では、情報処理端末１０がネットワーク３０を介してヘッドマウントディスプレイ２０によるＡＲコンテンツの表示を制御する場合を例に述べた。一方、情報処理端末１０による制御は必ずしも必要なく、本実施形態に係るヘッドマウントディスプレイ２０は、単独で本実施形態に係る情報処理方法を実現することも可能である。

　＜＜１．３．機能構成例＞＞
　次に、本実施形態に係る情報処理端末１０とヘッドマウントディスプレイ２０の機能構成例について述べる。図４は、本実施形態に係る情報処理端末１０とヘッドマウントディスプレイ２０の機能構成例を示すブロック図である。なお、以下では、情報処理端末１０がヘッドマウントディスプレイ２０によるＡＲ表示を制御する場合を主な例として説明を行う。

　（情報処理端末１０）
　（（撮影部１１０））
　本実施形態に係る撮影部１１０は、現実空間を撮影する機能を有する。例えば、ヘッドマウントディスプレイ２０が撮影機能を有しない場合、後述する制御部１３０は、撮影部１１０が撮影した現実空間の画像情報に基づいてヘッドマウントディスプレイ２０によるＡＲ表示を制御してもよい。この場合、撮影部１１０は、ヘッドマウントディスプレイ２０を介してユーザが現実空間を視認する方向と同一の方向を撮影可能なように配置される。

　（（センサ部１２０））
　本実施形態に係るセンサ部１２０は、加速度や角速度などの各種のセンサ情報を収集する機能を有する。例えば、ヘッドマウントディスプレイ２０が上記のようなセンサ情報に係る収集機能を有しない場合、後述する制御部１３０は、センサ部１２０が収集したセンサ情報に基づいてヘッドマウントディスプレイ２０によるＡＲ表示を制御してもよい。

　（（制御部１３０））
　本実施形態に係る制御部１３０は、情報処理端末１０が備える各構成を全体的に制御する。また、本実施形態に係る制御部１３０は、撮影された画像情報や収集されたセンサ情報に基づいて、ヘッドマウントディスプレイ２０によるＡＲ表示を制御する機能を有する。この際、本実施形態に係る制御部１３０は、ヘッドマウントディスプレイ２０の出力部２４０によりオリジナルコンテンツが表示される場合と比較して、ユーザによる現実空間の視認レベルの低下度合いが軽減されるように、出力部２４０によるＡＲコンテンツの表示態様を制御すること、を特徴の一つとする。

　例えば、図２に示したように、本実施形態に係る制御部１３０は、オリジナルコンテンツから主要被写体を除く背景を除去したＡＲコンテンツを出力部２４０に表示させてもよい。

　なお、上記の表示態様は、ＡＲコンテンツの表示内容、表示位置、表示タイミングなどを含んでよい。本実施形態に係る制御部１３０が有する機能の詳細については別途後述する。

　（（出力部１４０））
　本実施形態に係る出力部１４０は、制御部１３０による制御に基づいて、各種の情報を出力する。このために、本実施形態に係る出力部１４０は、表示装置やスピーカなどを備える。

　（（通信部１５０））
　本実施形態に係る通信部１５０は、ネットワーク３０を介してヘッドマウントディスプレイ２０との情報通信を行う。

　（（ヘッドマウントディスプレイ２０））
　（（撮影部２１０））
　本実施形態に係る撮影部２１０は、現実空間を撮影する機能を有する。本実施形態に係る撮影部２１０は、後述する出力部２４０を介してユーザが現実空間を視認する方向と同一方向を撮影可能なように配置される。

　（（センサ部２２０））
　本実施形態に係るセンサ部２２０は、加速度や角速度などの各種のセンサ情報を収集する機能を有する。

　（（制御部２３０））
　本実施形態に係る制御部２３０は、ヘッドマウントディスプレイ２０が備える各構成を全体的に制御する。また、制御部２３０は、情報処理端末１０による制御に基づいて、ＡＲコンテンツの表示に係る処理を行う。例えば、制御部２３０は、情報処理端末１０の制御部１３０が生成したＡＲコンテンツに係る画像情報や制御信号などを出力部２４０に引き渡してもよい。

　また、ヘッドマウントディスプレイ２０が情報処理端末１０による制御に依らず単独でＡＲコンテンツの表示を行う場合、本実施形態に係る制御部２３０は、情報処理端末１０の制御部１３０と同等の表示制御機能を有してよい。すなわち、この場合、制御部２３０は、オリジナルコンテンツが表示される場合と比較して、ユーザによる現実空間の視認レベルの低下度合いが低減されるように、ＡＲコンテンツの表示態様を制御してよい。

　（（出力部２４０））
　本実施形態に係る出力部２４０は、制御部１３０や制御部２３０による制御に基づいてＡＲコンテンツを表示する。このために、本実施形態に係る出力部２４０は、ヘッドマウントディスプレイ２０の装着時にユーザの眼前に配置される表示装置を少なくとも備える。また、出力部２４０は、ＡＲコンテンツに付随する音声を出力するためのスピーカなどを備えてよい。

　（（通信部２５０））
　本実施形態に係る通信部１５０は、ネットワーク３０を介して情報処理端末１０との情報通信を行う。

　以上、本実施形態に係る情報処理端末１０およびヘッドマウントディスプレイ２０の機能構成例について述べた。なお、図４を用いて説明した上記の構成はあくまで一例であり、本実施形態に係る情報処理端末１０およびヘッドマウントディスプレイ２０の機能構成は係る例に限定されない。上述したように、本実施形態に係るヘッドマウントディスプレイ２０は、情報処理端末１０による制御に依らず、単独でＡＲコンテンツの表示を行うことも可能である。

　＜＜１．４．詳細構成例＞＞
　続いて、本実施形態に係る情報処理端末１０およびヘッドマウントディスプレイ２０の詳細構成について具体例を挙げて説明する。

　上述したように、本実施形態に係るヘッドマウントディスプレイ２０は、単独で、あるいは情報処理端末１０による制御に基づいてＡＲコンテンツの表示を実現することができる。まず、本実施形態に係るヘッドマウントディスプレイ２０が、単独でＡＲコンテンツの表示を行う場合の詳細構成例について述べる。図５は、本実施形態に係るヘッドマウントディスプレイ２０が単独でＡＲコンテンツの表示制御を行う場合の詳細構成の一例を示すブロック図である。

　この場合、制御部２３０は、ＳｏＣ（Ｓｙｓｔｅｍ　ｏｎ　Ｃｈｉｐ）、ＯＳ、ＡＲフレームワーク、アプリケーションなどから構成される。制御部２３０は、撮影部２１０が備えるカメラが撮影した画像情報とセンサ部２２０が備えるＩＭＵ（Ｉｎｅｒｔｉａｌ　Ｍｅａｓｕｒｅｍｅｎｔ　Ｕｎｉｔ）から受信するセンサ情報（加速度情報および角速度情報）に基づいて、ＳＬＡＭ（Ｓｉｍｕｌｔａｎｅｏｕｓ　Ｌｏｃａｌｉｚａｔｉｏｎ　ａｎｄ　Ｍａｐｐｉｎｇ）を行い、環境マップとポーズグラフ（姿勢グラフ）を生成する。

　すなわち、制御部２３０は、画像情報やセンサ情報に基づいて、物体を含む空間（環境マップ）を認識し、また認識した空間におけるカメラの位置と姿勢（ポーズグラフ）を把握することができる。

　ここで、ＳＬＡＭを実現するソフトウェア構成の一例について詳細に説明する。図６は、本実施形態に係るＳＬＡＭを実現するソフトウェアの構成例を示す図である。図６に示すように、本実施形態に係るＳＬＡＭを実現するソフトウェアは、フロントエンドとバックエンドに分かれて構成されてもよい。

　フロントエンドでは、撮影部２１０が取得した画像情報とセンサ部２２０が取得したセンサ情報とが逐次入力され、データの対応付け、環境マップのリアルタイム更新、およびポーズグラフの生成が行われる。

　また、ＳＬＡＭはセンサ情報に基づく推定技術であるため、環境マップが大きくなるにつれ誤差が累積する。このことから、同一経路をループして同じ点を観測した場合、当該ループを検出し、ループの閉じ込みを行うことで累積誤差を大幅に削減することが重要となる。このため、フロントエンドでは、上記のようなループを検出するループ検出が実行されてよい。

　また、バックエンドにおいては、環境マップをサーバと同期するなど、環境マップを大きく更新する一括処理が実行される。また、バックエンドでは、ループ検出に伴うポーズ補正などが実行される。環境マップの更新や利用は演算量が大きくなるため、ヘッドマウントディスプレイ２０の動きを基に位置を推定するポーズグラフを用いることで、演算量を低減し性能を確保することができる。なお、バックエンドはフロンドエンドとは別スレッドで実行されてよい。これによれば、実時間性に影響を与えずに処理を行うことが可能となる。

　制御部２３０は、上記のように生成した環境マップおよびポーズグラフに基づいて、ＡＲコンテンツの表示内容や表示位置、大きさ、表示タイミングなどの表示態様を決定し、出力部２４０が備える表示装置に出力させることができる。

　上記のような構成によれば、ヘッドマウントディスプレイ２０単体でＡＲコンテンツの表示を実現することが可能となる。一方、この場合、ＳＬＡＭおよびＡＲコンテンツの表示制御に係る処理を制御部２３０がすべて行うことから、制御部２３０に豊富な演算リソースを備える必要があり、ひいてはヘッドマウントディスプレイ２０が大型化することとなる。

　このため、本実施形態に係る情報処理方法では、ＳＬＡＭおよびＡＲコンテンツの表示制御に係る処理を情報処理端末１０で行うことで、ヘッドマウントディスプレイ２０側の処理負担を軽減し、ヘッドマウントディスプレイ２０をより小型化することが可能である。

　図７は、本実施形態に係るＳＬＡＭおよびＡＲコンテンツの表示制御を情報処理端末１０が行う場合の詳細構成の一例を示すブロック図である。

　この場合、図７に示すように、制御部１３０は、図５に示した制御部２３０と同等の構成を備える。この際、制御部１３０は、通信部１５０および通信部２５０が備える無線通信装置を介して、ヘッドマウントディスプレイ２０の撮影部２１０およびセンサ部２２０からそれぞれ画像情報とセンサ情報を受信し、ＳＬＡＭおよびＡＲコンテンツ表示に係る処理を実行することができる。

　なお、この際、制御部２３０は、ジェスチャ認識器を用いて、受信した画像情報からユーザのジェスチャを認識し、認識の結果に基づいてＡＲコンテンツの表示を制御してもよい。本実施形態に係る制御部２３０が有するジェスチャ認識機能については別途後述する。

　また、この場合、ヘッドマウントディスプレイ２０の制御部２３０は、モーション検出器を用いて撮影部２１０から時系列で入力される画像情報間の差分を検出し、差分が検出された場合、すなわち画像情報に変化が生じている場合にのみ、画像情報を情報処理端末１０に送信してもよい。係る制御によれば、通信する画像情報の量を低減し、トラフィックを効果的に抑制することができる。

　＜＜１．５．ＡＲコンテンツの表示制御＞＞
　次に、本実施形態に係るＡＲコンテンツの表示制御について具体例を挙げながら詳細に説明する。図２では、本実施形態に係るヘッドマウントディスプレイ２０が、オリジナルコンテンツから主要被写体を除く背景を除去したＡＲコンテンツを表示する場合を例に述べたが、本実施形態に係るヘッドマウントディスプレイ２０は上記の例に限定されず、種々の表示態様を有するＡＲコンテンツを表示することが可能である。なお、以下では、情報処理端末１０の制御部１３０がヘッドマウントディスプレイ２０の出力部２４０によるＡＲコンテンツの表示を制御する場合を主な例として説明する。

　例えば、オリジナルコンテンツが動画コンテンツである場合、本実施形態に係る制御部１３０は、オリジナルコンテンツの再生シーンに応じてＡＲコンテンツの表示態様を制御してもよい。例えば、本実施形態に係る制御部１３０は、オリジナルコンテンツの再生シーンが主要被写体を含む場合にのみ、当該再生シーンに対応するＡＲコンテンツを出力部２４０に表示させてもよい。

　図８は、本実施形態に係る主要被写体を含む再生シーンに応じたＡＲコンテンツの表示制御について説明するための図である。例えば、楽曲のプロモーションビデオなどの動画コンテンツには、アーティストなどの主要被写体を含まない再生シーンが多用される場合も多く見受けられる。ここで、上記のような動画コンテンツをそのままＡＲコンテンツとして表示し続ける場合、ユーザが頻繁に変化する再生シーンに気を取られ、現実空間の視認がおろそかになる状況も想定される。

　このため、本実施形態に係る制御部１３０は、図８に示すように、再生シーンが主要被写体ＭＳを含む場合にのみ、当該再生シーンに応じたＡＲコンテンツＣを出力部２４０に表示させてもよい。係る制御によれば、ＡＲコンテンツＣの表示内容をユーザが注視したい対象に限定することでＡＲコンテンツのＣの表示時間を短縮し、ユーザによる現実空間の視認レベルの低下度合いを効果的に抑えることが可能となる。

　なお、制御部１３０は、例えば、動画コンテンツ中に登場する人物を主要被写体とし、顔検出処理などを行うことで、主要被写体を含む再生シーンを抽出してもよい。また、制御部１３０は、動画コンテンツに付随するメタデータに基づいて主要被写体を含む再生シーンを抽出することも可能である。例えば、メタデータに再生シーン（フレーム）ごとの被写体情報が含まれる場合、ユーザは、自身が視聴したい主要被写体（例えば、人物のうちヴォーカルのみ、など）を指定することができてもよい。

　また、本実施形態に係る制御部１３０は、オリジナルの動画コンテンツから再生シーンごとの代表画像を抽出し、当該代表画像をＡＲコンテンツとして出力部２４０に出力させてもよい。図９は、本実施形態に係る再生シーンごとの代表画像に対応するＡＲコンテンツの表示制御について説明するための図である。

　上述したように、楽曲のプロモーションビデオなど表示内容の変化が激しい動画コンテンツをそのままＡＲコンテンツとして表示した場合、ユーザが頻繁に変化する再生シーンに気を取られる可能性がある。

　このため、本実施形態に係る制御部１３０は、再生シーンごとに代表画像（静止画）を抽出し、同一の再生シーンが継続している間は、当該代表画像をＡＲコンテンツとして出力部２４０に出力させ続けてよい。

　例えば、図９に示す一例の場合、再生シーン「イントロ」が継続している間、制御部１３０は、「イントロ」の代表画像をＡＲコンテンツＣ１として出力部２４０に表示させ続ける。

　一方、再生シーンが「Ａメロ（Ｖｅｒｓｅ）」に切り替わった場合、制御部１３０は、「Ａメロ」の代表画像をＡＲコンテンツＣとして出力部２４０に表示させ、当該表示を「Ａメロ」の終了まで継続させる。

　上記のような表示制御によれば、ＡＲコンテンツの変化の頻度を抑えることで、ユーザによる現実空間の視認レベルの低下度合いを軽減しながら、再生シーンを代表する視覚情報をユーザに提示することで、ユーザの満足度を確保することが可能となる。

　次に、本実施形態に係る再生シーンやユーザの動作状況に応じたＡＲコンテンツの表示制御について説明する。制御部１３０は、通常時においては、例えば、図８や図９に示すように、ＡＲコンテンツＣをユーザの視野の周辺時に表示させてもよい。係る表示制御によれば、ユーザの視野の中央部を塞がないことで、ユーザによる現実空間の視認レベルの低下度合いを軽減することができる。

　一方、上記のような表示が始終行われる場合、ＡＲコンテンツを視聴したいユーザの満足度が低下することも想定される。このため、本実施形態に係る制御部１３０は、動画コンテンツの再生シーンや、ユーザの動作状況に基づいて、ＡＲコンテンツの表示位置を動的に制御してよい。

　図１０は、本実施形態に係る再生シーンやユーザの動作状況に基づくＡＲコンテンツの表示位置制御について説明するための図である。

　図１０の上段には、ユーザが歩行などの動作を行っている場合におけるＡＲコンテンツの表示例が示されている。この際、制御部１３０は、上述したように、ＡＲコンテンツＣをユーザの視野の周辺部に表示させてもよい。係る表示制御によれば、ユーザの視野の中央部を開放し、ユーザによる現実空間の視認レベルの低下度合いを低減することができる。

　なお、この際、図示するように、ＡＲコンテンツＣが複数の主要被写体ＭＳ１～ＭＳ３を含む場合、制御部１３０は、主要被写体ＭＳ１～ＭＳ３がユーザの視野の周辺部に分離して表示されるよう制御を行ってもよい。

　一方、図１０の下段には、ユーザが静止している場合や、再生シーンがオリジナルコンテンツにおける主要シーンである場合におけるＡＲコンテンツの表示例が示されている。

　例えば、ユーザが静止している場合、図示するように、ユーザの視野の中央部にＡＲコンテンツＣを表示してもユーザが他の物体に衝突したり、地形につまずいたりする可能性は著しく低いことが想定される。

　このため、本実施形態に係る制御部１３０は、ユーザが移動している場合には、ＡＲコンテンツをユーザの視野の周辺部に表示させ、ユーザが静止している場合には、ＡＲコンテンツをユーザの視野の中央部に表示させてもよい。

　また、例えば、楽曲のプロモーションビデオにおけるコーラス部分など、再生シーンがオリジナルコンテンツにおける主要シーンである場合、ユーザが他の再生シーンと比較して視聴をより望むことが想定される。

　このため、本実施形態に係る制御部１３０は、再生シーンがオリジナルコンテンツにおける主要シーンではない場合には、ＡＲコンテンツをユーザの視野の周辺部に表示させ、再生シーンがオリジナルコンテンツにおける主要シーンである場合には、ＡＲコンテンツをユーザの視野の中央部に表示させてもよい。

　以上説明したように、本実施形態に係る制御部１３０は、オリジナルコンテンツの再生シーンや、ユーザの動作状況に基づいて、ＡＲコンテンツの表示位置を動的に制御することが可能である。係る制御によれば、状況に応じてユーザの視野を確保とＡＲコンテンツ視聴との優先度合いを変化させることで、より質の高いＡＲ体験を実現することが可能となる。

　なお、制御部１３０は、オリジナルコンテンツを解析することで、当該オリジナルコンテンツが含む各再生シーンの特性を特定することが可能である。例えば、オリジナルコンテンツが楽曲のプロモーションビデオである場合、制御部１３０は、オリジナルコンテンツに含まれる楽曲データに基づいて各再生シーンの特性を特定してもよい。

　図１１は、本実施形態に係る楽曲データに基づく再生シーン特性の特定と再生シーン特性に基づくＡＲコンテンツの表示制御の流れを示すフローチャートである。

　図１１を参照すると、まず、制御部１３０は、オリジナルコンテンツのロードを行う（Ｓ１１０１）。

　次に、制御部１３０は、コンテンツの再生が一回目か否かを判定する（Ｓ１１０２）。

　ここで、コンテンツの再生が一回目である場合（Ｓ１１０１：ＹＥＳ）、制御部１３０は、続いて、楽曲データが存在するか否かを判定する（Ｓ１１０３）。

　ここで、楽曲データが存在しない場合（Ｓ１１０３：ＮＯ）、制御部１３０は、一例の処理を終了する。

　一方、楽曲データが存在する場合（Ｓ１１０３：ＹＥＳ）、制御部１３０は、楽曲データのデコードを行う（Ｓ１１０４）。

　次に、制御部１３０は、ステップＳ１１０４におけるデコードにより取得したＰＣＭ（Ｐｕｌｓｅ　Ｃｏｄｅ　Ｍｏｄｕｌａｔｉｏｎ）データを出力部２４０が備えるスピーカに出力させる（１１０５）。

　また、制御部１３０は、ＰＣＭデータに対するフーリエ変換を行い、取得したパワースペクトログラムに基づくクラスタリングを実行する（Ｓ１１０６）。

　上記のクラスタリングによれば、例えば、各楽器やヴォーカルの出力有無、また曲調やテンポなどが類似するパートをクラスタ、すなわち再生シーンとして分類することが可能となる。

　図１２は、本実施形態に係る楽曲データに基づくクラスタリングの一例を示す図である。図１２の上段には、ある楽曲「ＡＢＣ」のパート構成が示されている。図１２に示す一例の場合、楽曲ＡＢＣは、イントロ、Ａメロ（ｖｅｒｓｅ）、Ｂメロ（ｂｒｉｄｇｅ）、コーラス、間奏、アウトロを含んで構成されている。

　ここで、上述したクラスタリングを実行した場合、楽曲データ「ＡＢＣ」の再生シーンは、例えば、図中下段に示すように分類が可能である。なお、図中の数字はコンテンツ冒頭からの経過時間を示している。このようなクラスタリングデータは、コンテンツの２回目以降の再生に利用されてよい。

　再び図１１を参照して、再生シーンの特性に基づくＡＲコンテンツの表示制御の流れについて説明する。ステップＳ１１０２において、コンテンツの再生が一回目でない場合、すなわち再生が２回目以降である場合、制御部１３０は、楽曲データが存在するか否かを判定する（Ｓ１１０７）。

　ここで、楽曲データが存在しない場合（Ｓ１１０７：ＮＯ）、制御部１３０は、一連の処理を終了する。

　一方、楽曲データが存在する場合（Ｓ１１０７：ＹＥＳ）、制御部１３０は、楽曲データのデコードを行う（Ｓ１１０８）。

　次に、制御部１３０は、ステップＳ１１０８におけるデコードにより取得したＰＣＭデータを出力部２４０が備えるスピーカに出力させる（１１０９）。

　また、制御部１３０は、コンテンツの一回目の再生時にステップＳ１１０６において取得したクラスタリングデータに基づいて、ＡＲコンテンツの表示を制御する（Ｓ１１１０）。

　例えば、再生シーンがクラスタ「スピード：速い、音：声」に該当する場合、制御部１３０は、当該再生シーンがオリジナルコンテンツにおける主要シーンであると判定し、図１０の下段に示すように、ＡＲコンテンツＣをユーザの視野の中央部に表示させてもよい。このように、本実施形態に係るクラスタリングによれば、楽曲の速度に応じてＡＲコンテンツの動きを変化させたり、音の性質に応じてＡＲコンテンツの表現を変化させることが可能である。例えば、「音：声」の場合には、人物の抜き出しを中心とした重畳表示を行ってもよいし、「音：楽器」の場合には、背景へのエフェクト効果を中心とすることで、ミュージックシーンの表現力向上のインプットとすることができる。

　以上説明したように、本実施形態に係る制御部１３０は、楽曲データなどの解析を行うことで、オリジナルコンテンツが含む再生シーンの特性を特定し、当該特性に基づいて、ＡＲコンテンツの表示制御を行うことが可能である。なお、上記はあくまで一例であり、再生シーンに係る解析手法はオリジナルコンテンツの種別に応じて適宜選択されてよい。また、制御部１３０は、オリジナルコンテンツに付随するメタデータなどから再生シーンの特性を取得することも可能である。

　また、上記では、楽曲データのクラスタリングを情報処理端末１０で実施する場合の例を述べたが、楽曲データのクラスタリングは、別途に設けられるサーバにより実施されてもよい。この場合、予めサーバにおいて楽曲データのクラスタリングを行い、クラスタリングデータを保存する。各ユーザは、ＡＲコンテンツを再生する際に、サーバと通信して上記のクラスタリングデータを受信することで、再生シーンの特性に応じたＡＲコンテンツを視聴することが可能である。

　なお、この場合、楽曲データを含むすべてのコンテンツについて予めクラスタリングデータを生成するのではなく、代表的なコンテンツについてのみクラスタリングデータを用意しておいてもよい。この際、例えば、ユーザ全体の総再生回数が所定回数以上のコンテンツを代表的なコンテンツとしてもよいし、所定期間において総再生回数が上位のコンテンツを代表的なコンテンツとしてもよい。

　次に、本実施形態に係る現実空間に存在する物体の認識結果に基づくＡＲコンテンツの表示制御について説明する。本実施形態に係る制御部１３０は、例えば、現実空間に存在する広告媒体が認識された場合、当該広告媒体に対応する位置にＡＲコンテンツを表示させてもよい。

　図１３は、本実施形態に係る現実空間に存在する物体の認識結果に基づくＡＲコンテンツの表示制御について説明するための図である。図１３には、現実空間に存在するビルＢ１～Ｂ３が示されている。ここで、ビルＢ１およびＢ２には、それぞれ広告媒体Ａ１およびＡ２が設置されている。広告媒体Ａ１は、例えば、看板広告であってもよいし、広告媒体Ａ２は、例えば、大型のディスプレイであってもよい。

　この際、制御部１３０は、ヘッドマウントディスプレイ２０の撮影部２１０が撮影した画像情報に基づいて広告媒体Ａ１およびＡ２を認識することが可能である。制御部１３０は、例えば、矩形領域を検出する検出器を用いて広告媒体Ａ１およびＡ２を認識してもよい。

　この場合、制御部１３０は、認識した広告媒体Ａ１およびＡ２に対応する位置にＡＲコンテンツＣ１およびＣ２をそれぞれ表示させることができる。係る制御によれば、現実空間に存在する広告媒体をＡＲコンテンツの表示媒体として転用することができ、ユーザの視野を狭めることなく、かつ風景に溶け込んだ自然なＡＲ表示を実現することが可能となる。

　なお、制御部１３０は、広告媒体に限らず、各種の矩形領域をＡＲコンテンツの表示に利用してよい。制御部１３０は、例えば、ビルＢ３が有する複数の窓を矩形領域として検出し、当該矩形領域にＡＲコンテンツを表示させることも可能である。

　また、本実施形態に係る制御部１３０は、ユーザの前方に存在する壁などの平面を検出したことに基づいてＡＲコンテンツの表示を制御してもよい。例えば、図１４に示す一例の場合、制御部１３０は、ヘッドマウントディスプレイ２０の撮影部２１０が撮影した画像情報に基づいて、ユーザの前方に壁Ｗを検出している。

　この場合、制御部１３０は、壁Ｗの検出前に受信していたメッセージの通知に係るＡＲコンテンツＣ１を壁Ｗの上に重畳表示させてもよい。

　例えば、歩行時にＳＮＳなどのメッセージを受信した場合において、状況に鑑みず当該メッセージに係る通知を即時ＡＲコンテンツとして表示すると、必要以上にユーザの注意を惹き、ユーザによる現実空間の視認レベルが低下する可能がある。

　このため、制御部１３０が壁やスクリーンなどの平面を検出し、かつユーザが歩行を停止した場合にメッセージの通知に係るＡＲ表示を行うことで、より安全な状況でユーザがメッセージを確認することが可能となる。

　また、例えば、ビデオ通話などについても同様に、壁Ｗなどの平面を検出した場合には、検出前においてユーザの視野の周辺部に表示させていたＡＲコンテンツＣ２をユーザの視野の中央部に拡大して表示させてもよい。このように、本実施形態に係る制御部１３０は、現実空間に存在する各種の物体の認識結果に基づいて、ＡＲコンテンツの表示態様を制御することができる。

　なお、上記のような制御の他、制御部１３０は、例えば、認識した物体や平面の色などに基づいてＡＲコンテンツの表示態様を制御することも可能である。例えば、ＡＲコンテンツは、背景が黒い場合は視認がしやすいが、背景色が薄い色である場合には視認しづらい傾向がある。このため、制御部１３０は、例えば、認識した物体や平面の輝度に対してＡＲコンテンツが視認しやすいように画像全体を補正してもよいし、より見えやすい位置にＡＲコンテンツを表示させてもよい。

　次に、本実施形態に係るジェスチャ認識に基づくＡＲコンテンツの表示制御について説明する。本実施形態に係る制御部１３０は、ヘッドマウントディスプレイ２０の撮影部２１０が撮影した画像情報に基づいてユーザのジェスチャを認識し、当該ジェスチャに基づいてＡＲコンテンツの表示態様を制御してもよい。

　例えば、図１４に示す一例の場合、ユーザは、手ＵＨを用いてＡＲコンテンツＣ１をつまむようなジェスチャを行っている。この場合、制御部１３０は、例えば、情報処理端末１０におけるタップ操作と同様の入力と判定し、当該入力に応じてＡＲコンテンツＣ１の表示態様を制御してもよい。

　また、例えば、ユーザがＡＲコンテンツＣ１をつまんで上下左右などに手ＵＨを移動させた場合、制御部１３０は、情報処理端末１０におけるドラッグ操作と同様の入力と判定し、当該入力に応じてＡＲコンテンツＣ１の表示態様を制御してもよい。

　上記のような制御によれば、ユーザが、都度、情報処理端末１０を取り出さずともアプリケーションの操作を気軽かつ直感的に行うことができ、より利便性の高いＡＲ体験を提供することができる。

　さらには、本実施形態に係る制御部１３０は、ユーザによるキー入力に対応するジェスチャを受け付けるためのＡＲコンテンツを出力部１４０に表示させることも可能である。例えば、図１５に示す一例の場合、制御部１３０は、ユーザが手ＵＨを注視したことを認識し、手ＵＨに数字キーの入力を受け付けるためのＡＲコンテンツＣを表示させている。

　この場合、ユーザは、自身の手ＵＨに重畳表示されるＡＲコンテンツＣを他方の手で押下するジェスチャを行うことで、押下位置に係る触覚的なフィードバックを得ながら任意の数字を入力することができてよい。この際、制御部１３０は、ＡＲコンテンツＣの表示位置とユーザのジェスチャ位置とを対応付け、ユーザが入力を望む数字を特定することが可能である。

　以上、本実施形態に係るジェスチャ認識に基づくＡＲコンテンツの表示制御について説明した。次に、本実施形態に係るＶＲ（Ｖｉｒｔｕａｌ　Ｒｅａｌｉｔｙ）コンテンツに基づくＡＲコンテンツの生成について説明する。

　ＡＲコンテンツとは異なり、ＶＲコンテンツはユーザの視野のすべてに画像表示を行うため、ＶＲコンテンツを屋外において移動しながら楽しむことは非常に困難といえる。このため、本実施形態では、ＶＲコンテンツをＡＲコンテンツとして再構成することで、ユーザがお気に入りのコンテンツを気軽に屋外で楽しむことを可能とする。

　図１６は、本実施形態に係るＶＲコンテンツに基づくＡＲコンテンツの生成について説明するための図である。図１６の左側には、ユーザＵがＶＲ機器４０を用いて３６０度対応のＶＲコンテンツＶＣを視聴する様子が示されている。

　この際、制御部１３０は、例えば、ＶＲコンテンツＶＣから動きのあるオブジェクトを抽出し、当該オブジェクトを除く背景を除去する。次に、制御部１３０は、図中右側に示すように、視野ＦＶ上において、抽出した上記オブジェクトをユーザのＶＲコンテンツＶＣ上の配置方向に合わせてＡＲコンテンツＣとして重畳表示させる。

　上記のような制御によれば、ユーザがお気に入りのコンテンツを気軽に屋外で楽しむことが可能となる。このように、本実施形態に係るオリジナルコンテンツは、ＶＲコンテンツであってもよい。

　また、反対に本実施形態に係る制御部１３０は、ＡＲコンテンツに基づいてＶＲコンテンツを生成することも可能である。図１７は、本実施形態に係るＡＲコンテンツに基づくＶＲコンテンツの生成について説明するための図である。

　図１７の左側には、ユーザＵがヘッドマウントディスプレイ２０により視野ＦＶ上に重畳表示されるＡＲコンテンツＣを視聴している様子が示されている。この際、制御部１３０は、ヘッドマウントディスプレイ２０の撮影部２１０が撮影した画像情報と、出力部２４０に表示させるＡＲコンテンツＣの画像情報を表示位置情報（ヘッドマウントディスプレイ２０の姿勢情報）と共にＶＲフォーマットで保存する。

　また、図１７の右側には、ユーザＵが、ＶＲ機器４０を用いて上記のように保存されたＶＲコンテンツＶＣを視聴する様子が示されている。この際、ＶＲ機器４０は、ヘッドマウントディスプレイ２０の撮影部２１０により撮影されていない方向の画像情報に関しては、例えば、機械学習手法を用いた画像生成器などを用いて補完してもよい。

　ここで、ユーザの視野ＦＶに係る画像情報をＶＲフォーマットで保存する処理について、より詳細に説明する。図１８および図１９は、本実施形態に係る画像情報のＶＲフォーマット保存について説明するための図である。

　図１８の上段に示すように、制御部１３０は、まず、コンテンツの分析を行う。この際、制御部１３０は、初めにヘッドマウントディスプレイ２０の撮影部２１０から入力される画像に対し分離処理を行う。具体的には、制御部１３０は、画像に含まれる要素を、背景などの静止物体、人などを含む動体に分離する。また、制御部１３０は、抜き出した静止物体からさらに地面などの平面を検出する。

　次に、制御部１３０は、検出した動体と平面の距離を測定すると共に、平面の位置やサイズを推定する。

　続いて、制御部１３０は、測定した動体と平面の距離、推定した平面の位置とサイズから、平面と動体間における位置とサイズの関連付けを行う。

　次に、制御部１３０は、図１８の下段に示すように、上記のように取得した動体をＶＲコンテンツ用の背景画像に配置する処理を行う。

　この際、制御部１３０は、まず背景画像から平面を検出し、平面の位置とサイズを推定する。次に、制御部１３０は、推定した平面の位置とサイズ、および上記のコンテンツ分析において取得した平面と動体間における位置とサイズの関係に基づいて、背景画像上に動体を配置する。係る処理によれば、人などの動体の位置やサイズを背景の位置やサイズに対して自然に位置することが可能である。

　続いて、制御部１３０は、図１９の上段に示すように、配置した動体のボクセル化とデータ圧縮を行う。この際、制御部１３０は、動体の位置情報と画像情報との関連付けを行い、ボクセル化を実行する。ここで、ボクセルとは、３次元空間における正規格子データを指す。すなわち、制御部１３０は、動体の画像情報を３Ｄ点群データに変換する。また、制御部１３０は、３Ｄ点群データを滑らかにするためのシェーダを生成する。

　次に、制御部１３０は、上記のように取得した３Ｄ点群データ、シェーダ、位置情報、色情報をデータ圧縮して保存する。このように、本実施形態に係る制御部１３０は、ＡＲコンテンツと現実空間を撮影した画像情報とに基づくＶＲコンテンツを生成することが可能である。

　続いて、ＶＲ機器４０によるＶＲコンテンツの再生について説明する。ＶＲ機器４０は、図中下段に示すように、まず圧縮されたデータの伸長処理を行う。次に、ＶＲ機器４０は、ボクセルを解除し、シェーダを利用してレンダリング処理を行うことで、動体に係る位置情報と画像情報とを取得し、Ｖｏｌｕｍｅｔｒｉｃ空間において動体を表現することができる。

　次に、本実施形態に係るＡＲクラウドを利用したＡＲ体験の共有について述べる。上記では、主にユーザが個人でＡＲコンテンツを楽しむ場合の構成や制御について説明した。一方、本実施形態に係る情報処理方法によれば、現実空間上の物体に係る情報をクラウド経由で共有することで、複数のユーザの間でＡＲ体験を共有することも可能である。

　図２０は、本実施形態に係るＡＲクラウドによるＡＲ体験の共有を実現するシステム構成の一例を示す図である。図２０には、ＡＲクラウドによるＡＲ体験の共有を実現するためのシステム構成が、デバイス、プラットフォーム、およびアプリケーションの３つの層に分かれて示されている。

　ここで、デバイス層はＡＲコンテンツの表示に係る入出力を担う層であり、例えば、モデムやＧＮＳＳ信号受信機、ＩＭＵや地磁気センサ、カメラ（ＲＧＢ、ＴｏＦ）、ディスプレイ、ＧＰＵなどを含む。

　また、プラットフォーム層は、デバイス層とアプリケーション層との中継を行う層であり、各種のサービスを含む。

　また、アプリケーション層は、ＳＬＡＭとＡＲコンテンツの表示制御を担う層であり、またＡＲクラウドに保存されるデータとローカルで保管するデータとの対応付けを行う。具体的には、アプリケーション層では、ＡＲクラウドに保存される３次元空間の点群データとローカルで取得したＳＬＡＭデータとの対応付けを行い、当該３次元空間上における自端末の位置と姿勢を特定する。

　これによれば、自端末が表示するＡＲコンテンツの上記３次元空間上における座標を精度高く取得し、取得した座標情報をＡＲクラウドにアップロードすることで、他の端末による上記ＡＲコンテンツの表示を実現することができる。

　また、反対に他の端末からＡＲクラウドにアップロードされたＡＲコンテンツの画像情報と座標情報とをダウンロードし、当該座標情報と自端末のＳＬＡＭデータとを対応づけることで、他の端末がアップロードしたＡＲコンテンツを正確な位置に表示することができる。

　このように、本実施形態に係る情報処理方法によれば、現実空間上の物体に係る情報をクラウド経由で共有することで、複数のユーザの間でＡＲ体験を共有することが可能となる。

　＜２．まとめ＞
　以上説明したように、本開示の一実施形態に係る情報処理装置は、ユーザの眼前に配置される表示装置によるＡＲコンテンツの表示を制御する制御部、を備える。また、本開示の一実施形態に係る制御部は、オリジナルコンテンツが表示される場合と比較して上記ユーザによる現実空間の視認レベルの低下度合いが軽減されるように、上記ＡＲコンテンツの表示態様を制御すること、を特徴の一つとする。係る構成によれば、現実空間と融合したＡＲコンテンツをより安全に視聴することが可能となる。

　以上、添付図面を参照しながら本開示の好適な実施形態について詳細に説明したが、本開示の技術的範囲はかかる例に限定されない。本開示の技術分野における通常の知識を有する者であれば、請求の範囲に記載された技術的思想の範疇内において、各種の変更例または修正例に想到し得ることは明らかであり、これらについても、当然に本開示の技術的範囲に属するものと了解される。

　また、本明細書に記載された効果は、あくまで説明的または例示的なものであって限定的ではない。つまり、本開示に係る技術は、上記の効果とともに、または上記の効果に代えて、本明細書の記載から当業者には明らかな他の効果を奏しうる。

　また、コンピュータに内蔵されるＣＰＵ、ＲＯＭおよびＲＡＭなどのハードウェアに、情報処理端末１０やヘッドマウントディスプレイ２０が有する構成と同等の機能を発揮させるためのプログラムも作成可能であり、当該プログラムを記録した、コンピュータに読み取り可能な非一過性の記録媒体も提供され得る。

　また、本明細書の情報処理端末１０の処理に係る各ステップは、必ずしもフローチャートに記載された順序に沿って時系列に処理される必要はない。例えば、情報処理端末１０の処理に係る各ステップは、フローチャートに記載された順序と異なる順序で処理されても、並列的に処理されてもよい。

　なお、以下のような構成も本開示の技術的範囲に属する。
（１）
　ユーザの眼前に配置される表示装置によるＡＲコンテンツの表示を制御する制御部、
　を備え、
　前記制御部は、オリジナルコンテンツが表示される場合と比較して前記ユーザによる現実空間の視認レベルの低下度合いが軽減されるように、前記ＡＲコンテンツの表示態様を制御する、
情報処理装置。
（２）
　前記表示態様は、表示内容、表示位置、表示タイミングのうち少なくとも１つを含む、
前記（１）に記載の情報処理装置。
（３）
　前記制御部は、前記オリジナルコンテンツから主要被写体を除く背景を除去した前記ＡＲコンテンツを前記表示装置に表示させる、
前記（２）に記載の情報処理装置。
（４）
　前記制御部は、前記ＡＲコンテンツを前記ユーザの視野の周辺部に表示させる、
前記（２）または（３）に記載の情報処理装置。
（５）
　前記制御部は、前記オリジナルコンテンツが複数の前記主要被写体を含む場合、複数の前記主要被写体が前記ユーザの視野の周辺部に分離して表示されるように制御する、
前記（３）に記載の情報処理装置。
（６）
　前記制御部は、前記ユーザの動作状態に基づいて、前記ＡＲコンテンツの表示位置を制御する、
前記（２）～（５）のいずれかに記載の情報処理装置。
（７）
　前記制御部は、前記ユーザが移動している場合、前記ＡＲコンテンツを前記ユーザの視野の周辺部に表示させ、前記ユーザが静止している場合、前記ＡＲコンテンツを前記ユーザの視野の中央部に表示させる、
前記（６）に記載の情報処理装置。
（８）
　前記オリジナルコンテンツは、動画コンテンツであり、
　前記制御部は、前記オリジナルコンテンツの再生シーンに応じて前記ＡＲコンテンツの前記表示態様を制御する、
前記（２）～（７）のいずれかに記載の情報処理装置。
（９）
　前記制御部は、前記再生シーンが主要被写体を含む場合にのみ、前記再生シーンに対応する前記ＡＲコンテンツを表示させる、
前記（８）に記載の情報処理装置。
（１０）
　前記制御部は、前記再生シーンごとの代表画像を前記ＡＲコンテンツとして表示させる、
前記（８）に記載の情報処理装置。
（１１）
　前記制御部は、前記再生シーンが前記オリジナルコンテンツにおける主要シーンではない場合、前記ＡＲコンテンツを前記ユーザの視野の周辺部に表示させ、前記再生シーンが前記オリジナルコンテンツにおける主要シーンである場合、前記ＡＲコンテンツを前記ユーザの視野の中央部に表示させる、
前記（８）に記載の情報処理装置。
（１２）
　前記制御部は、前記現実空間に存在する物体の認識結果に基づいて、前記ＡＲコンテンツの前記表示態様を制御する、
前記（２）～（１１）のいずれかに記載の情報処理装置。
（１３）
　前記制御部は、前記現実空間に存在する矩形領域が検出された場合、前記矩形領域に対応する位置に前記ＡＲコンテンツを表示させる、
前記（１２）に記載の情報処理装置。
（１４）
　前記制御部は、前記現実空間に存在する広告媒体が認識された場合、前記広告媒体に対応する位置に前記ＡＲコンテンツを表示させる、
前記（１２）または（１３）に記載の情報処理装置。
（１５）
　前記オリジナルコンテンツは、ＶＲコンテンツである、
前記（３）に記載の情報処理装置。
（１６）
　前記制御部は、前記ユーザのジェスチャに基づいて、前記ＡＲコンテンツの表示態様を制御する、
前記（２）～（１５）のいずれかに記載の情報処理装置。
（１７）
　前記制御部は、前記ＡＲコンテンツと前記現実空間を撮影した画像情報とに基づくＶＲコンテンツを生成する、
前記（２）～（１６）のいずれかに記載の情報処理装置。
（１８）
　ヘッドマウントディスプレイとの無線通信を行う通信部、
　をさらに備え、
　前記通信部は、前記ヘッドマウントディスプレイが備える撮影部が撮影した前記現実空間の画像情報と、前記ヘッドマウントディスプレイが備えるセンサ部が取得したセンサ情報とを受信し、
　前記制御部は、前記画像情報と前記センサ情報に基づいて、前記ＡＲコンテンツを前記ヘッドマウントディスプレイが備える前記表示装置に前記ＡＲコンテンツを表示させる、
前記（１）～（１７）のいずれかに記載の情報処理装置。
（１９）
　プロセッサが、ユーザの眼前に配置される表示装置によるＡＲコンテンツの表示を制御すること、
　を含み、
　前記制御することは、オリジナルコンテンツが表示される場合と比較して前記ユーザによる現実空間の視認レベルの低下度合いが軽減されるように、前記ＡＲコンテンツの表示態様を制御すること、
　をさらに含む、
情報処理方法。
（２０）
　コンピュータを、
　ユーザの眼前に配置される表示装置によるＡＲコンテンツの表示を制御する制御部、
　を備え、
　前記制御部は、オリジナルコンテンツが表示される場合と比較して前記ユーザによる現実空間の視認レベルの低下度合いが軽減されるように、前記ＡＲコンテンツの表示態様を制御する、
　情報処理装置、
として機能させるためのプログラム。

　１０　　　情報処理端末
　１３０　　制御部
　１５０　　通信部
　２０　　　ヘッドマウントディスプレイ
　２１０　　撮影部
　２２０　　センサ部
　２３０　　制御部
　２４０　　出力部
　２５０　　通信部

Claims

　ユーザの眼前に配置される表示装置によるＡＲコンテンツの表示を制御する制御部、
　を備え、
　前記制御部は、オリジナルコンテンツが表示される場合と比較して前記ユーザによる現実空間の視認レベルの低下度合いが軽減されるように、前記ＡＲコンテンツの表示態様を制御する、
情報処理装置。
　前記表示態様は、表示内容、表示位置、表示タイミングのうち少なくとも１つを含む、
請求項１に記載の情報処理装置。
　前記制御部は、前記オリジナルコンテンツから主要被写体を除く背景を除去した前記ＡＲコンテンツを前記表示装置に表示させる、
請求項２に記載の情報処理装置。
　前記制御部は、前記ＡＲコンテンツを前記ユーザの視野の周辺部に表示させる、
請求項２に記載の情報処理装置。
　前記制御部は、前記オリジナルコンテンツが複数の前記主要被写体を含む場合、複数の前記主要被写体が前記ユーザの視野の周辺部に分離して表示されるように制御する、
請求項３に記載の情報処理装置。
　前記制御部は、前記ユーザの動作状態に基づいて、前記ＡＲコンテンツの表示位置を制御する、
請求項２に記載の情報処理装置。
　前記制御部は、前記ユーザが移動している場合、前記ＡＲコンテンツを前記ユーザの視野の周辺部に表示させ、前記ユーザが静止している場合、前記ＡＲコンテンツを前記ユーザの視野の中央部に表示させる、
請求項６に記載の情報処理装置。
　前記オリジナルコンテンツは、動画コンテンツであり、
　前記制御部は、前記オリジナルコンテンツの再生シーンに応じて前記ＡＲコンテンツの前記表示態様を制御する、
請求項２に記載の情報処理装置。
　前記制御部は、前記再生シーンが主要被写体を含む場合にのみ、前記再生シーンに対応する前記ＡＲコンテンツを表示させる、
請求項８に記載の情報処理装置。
　前記制御部は、前記再生シーンごとの代表画像を前記ＡＲコンテンツとして表示させる、
請求項８に記載の情報処理装置。
　前記制御部は、前記再生シーンが前記オリジナルコンテンツにおける主要シーンではない場合、前記ＡＲコンテンツを前記ユーザの視野の周辺部に表示させ、前記再生シーンが前記オリジナルコンテンツにおける主要シーンである場合、前記ＡＲコンテンツを前記ユーザの視野の中央部に表示させる、
請求項８に記載の情報処理装置。
　前記制御部は、前記現実空間に存在する物体の認識結果に基づいて、前記ＡＲコンテンツの前記表示態様を制御する、
請求項２に記載の情報処理装置。
　前記制御部は、前記現実空間に存在する矩形領域が検出された場合、前記矩形領域に対応する位置に前記ＡＲコンテンツを表示させる、
請求項１２に記載の情報処理装置。
　前記制御部は、前記現実空間に存在する広告媒体が認識された場合、前記広告媒体に対応する位置に前記ＡＲコンテンツを表示させる、
請求項１２に記載の情報処理装置。
　前記オリジナルコンテンツは、ＶＲコンテンツである、
請求項３に記載の情報処理装置。
　前記制御部は、前記ユーザのジェスチャに基づいて、前記ＡＲコンテンツの表示態様を制御する、
請求項２に記載の情報処理装置。
　前記制御部は、前記ＡＲコンテンツと前記現実空間を撮影した画像情報とに基づくＶＲコンテンツを生成する、
請求項２に記載の情報処理装置。
　ヘッドマウントディスプレイとの無線通信を行う通信部、
　をさらに備え、
　前記通信部は、前記ヘッドマウントディスプレイが備える撮影部が撮影した前記現実空間の画像情報と、前記ヘッドマウントディスプレイが備えるセンサ部が取得したセンサ情報とを受信し、
　前記制御部は、前記画像情報と前記センサ情報に基づいて、前記ＡＲコンテンツを前記ヘッドマウントディスプレイが備える前記表示装置に前記ＡＲコンテンツを表示させる、
請求項１に記載の情報処理装置。
　プロセッサが、ユーザの眼前に配置される表示装置によるＡＲコンテンツの表示を制御すること、
　を含み、
　前記制御することは、オリジナルコンテンツが表示される場合と比較して前記ユーザによる現実空間の視認レベルの低下度合いが軽減されるように、前記ＡＲコンテンツの表示態様を制御すること、
　をさらに含む、
情報処理方法。
　コンピュータを、
　ユーザの眼前に配置される表示装置によるＡＲコンテンツの表示を制御する制御部、
　を備え、
　前記制御部は、オリジナルコンテンツが表示される場合と比較して前記ユーザによる現実空間の視認レベルの低下度合いが軽減されるように、前記ＡＲコンテンツの表示態様を制御する、
　情報処理装置、
として機能させるためのプログラム。