WO2020261690A1

WO2020261690A1 - 情報処理装置、情報処理方法、再生処理装置及び再生処理方法

Info

Publication number: WO2020261690A1
Application number: PCT/JP2020/014888
Authority: WO
Inventors: 遼平高橋; 平林　光浩
Original assignee: ソニー株式会社
Priority date: 2019-06-28
Filing date: 2020-03-31
Publication date: 2020-12-30
Also published as: US20220247991A1; CN114009054A

Abstract

アトラス処理部は、３次元データを所定の視点位置から複数の投影方向に投影して形成される各投影方向に対応する基準２次元画像及び所定の視点位置から限定範囲内で移動させた視点位置に基づく移動２次元画像を基準２次元画像から生成するための補完画像を形成するテクスチャ画像と、テクスチャ画像に対応するデプス画像とを対応付けるアトラス識別情報、並びに、テクスチャ画像における補完画像が格納される"３ＤｏＦ＋"領域の情報であることを示す第１ポストデコーディング情報を含む、各基準２次元画像及び各移動２次元画像をレンダリングするためのそれぞれのポストデコーディング情報を生成する。符号化部は、テクスチャ画像及びデプス画像を符号化してテクスチャレイヤ及びデプスレイヤを生成する。ファイル生成部は、テクスチャレイヤ、デプスレイヤ、アトラス識別情報及びポストデコーディング情報を含むファイルを生成する。

Description

情報処理装置、情報処理方法、再生処理装置及び再生処理方法

　本発明は、情報処理装置、情報処理方法、再生処理装置及び再生処理方法に関する。

　ＨＴＴＰ（Hypertext　Transfer　Protocol）によるアダプティブなコンテンツ配信技術の標準化規格として、ＭＰＥＧ－ＤＡＳＨ（Moving　Picture　Experts　Group-Dynamic　Adaptive　Streaming　over　HTTP）が存在する。また、ＭＰＥＧ－ＤＡＳＨのファイルフォーマットにおける動画圧縮の国際標準技術である「ＭＰＥＧ－４」のファイルコンテナ仕様として、ＩＳＯＢＭＦＦ（International　Organization　for　Standardization　Base　Media　File　Format）がある。

　ところで、全天球映像のように、水平方向の周囲３６０度および垂直方向の周囲１８０度の画像を立体構造に投影した画像である立体構造画像を、平面画像にマッピングした全天球画像を再生する映像がある。全天球映像は３ＤｏＦ映像とも呼ばれ、全天球画像は投影平面画像や３ＤｏＦ（Degrees　of　Freedom）画像とも呼ばれる。ＭＰＥＧ－Ｉ　ＯＭＡＦ（Omnidirectional　Media　Format）では、全天球画像を形成する立体構造画像の配信へのＭＰＥＧ－ＤＡＳＨの利用が検討されている。

　さらに近年、３ＤｏＦ映像において実行可能な３軸周りの周囲見回しに加えて、限定範囲内での視点平行移動を伴う映像視聴体験を提供することができる”３ＤｏＦ＋”（Degrees　of　Freedom　Plus）映像の配信も検討されている。ＭＰＥＧ－Ｉ　Phase　1b　requirementにおいては、”３ＤｏＦ＋”に関連する要件として、ＯＭＡＦ　edition.1規格に準拠するplayer（ＯＭＡＦ　ed.1　player）への後方互換性の提供がリストアップされており、この要件を満たす技術開発が進められている。

　”３ＤｏＦ＋”の映像視聴体験を提供するデータは、”３ＤｏＦ＋”ストリームと呼ばれる。”３ＤｏＦ＋”ストリームは、テクスチャレイヤ（texture　Layer）、デプスレイヤdepth　Layer及び”３ＤｏＦ＋”メタデータを構成要素として含む。テクスチャレイヤは、”３ＤｏＦ＋”映像をレンダリングするためのテクスチャのパッチの集合である。また、デプスレイヤは、”３ＤｏＦ＋”映像をレンダリングするためのデプスのパッチの集合である。また、”３ＤｏＦ＋”メタデータは、各パッチが見える視点位置情報などを含む。クライアント装置は、”３ＤｏＦ＋”メタデータを基に、テクスチャレイヤ及びデプスレイヤから視聴映像のレンダリングに用いるパッチを選択してレンダリングすることで”３ＤｏＦ＋”映像の再生を行う。

　また、”３ＤｏＦ＋”ストリームにおけるテクスチャレイヤは、３ＤｏＦ領域と呼ばれる３ＤｏＦ視聴が可能な領域と、３ＤｏＦ領域に追加することで”３ＤｏＦ＋”視聴が可能となる”３ＤｏＦ＋”領域とを有する。このようなテクスチャレイヤを有することで、”３ＤｏＦ＋”ストリームのテクスチャレイヤのうちの３ＤｏＦ領域をレンダリングして３ＤｏＦ画像を生成することが可能となる。すなわち、”３ＤｏＦ＋”映像の再生能力は有さないが３ＤｏＦレンダリング機能を備えたクライアント装置であっても、”３ＤｏＦ＋”ストリームから３ＤｏＦ映像を生成するという利用方法が考えられる。

"ISO/IEC　14496-12:2015",　Information　technology.　Coding　of　audio-visual　objects.　Part12:ISO　base　media　file　format,　2015-12

　しかしながら、”３ＤｏＦ＋”ストリームにおける３ＤｏＦ領域をレンダリングする場合、クライアント装置は、”３ＤｏＦ＋”全体のレンダリングの処理を行った上で、特定視点位置から見た３ＤｏＦ映像を出力する処理を行う。そのため、実際には、”３ＤｏＦ＋”映像の再生能力は有さないが３ＤｏＦレンダリング機能を備えたクライアント装置では、”３ＤｏＦ＋”ストリームを用いて３ＤｏＦ映像を再生することは困難である。そのため、利用者の視聴体験は制限を受けることになる。

　そこで、本開示では、利用者の視聴体験を拡大することができる情報処理装置、情報処理方法、再生処理装置及び再生処理方法を提供する。

　本開示によれば、アトラス処理部は、３次元データを所定の視点位置から複数の投影方向に投影して形成される各前記投影方向に対応する基準２次元画像及び前記所定の視点位置から限定範囲内で移動させた視点位置に基づく移動２次元画像を前記基準２次元画像から生成するための補完画像を形成するテクスチャ画像と、前記テクスチャ画像に対応するデプス画像とを対応付けるアトラス識別情報、並びに、前記テクスチャ画像における前記補完画像が格納される”３ＤｏＦ＋”領域の情報であることを示す第１ポストデコーディング情報を含む、各前記基準２次元画像及び各前記移動２次元画像をレンダリングするためのそれぞれのポストデコーディング情報を生成する。符号化部は、テクスチャ画像及びデプス画像を符号化してテクスチャレイヤ及びデプスレイヤを生成する。ファイル生成部は、前記テクスチャレイヤ、前記デプスレイヤ、前記アトラス識別情報及び前記ポストデコーディング情報を含むファイルを生成する。

配信システムの一例のシステム構成図である。ファイル生成装置のブロック図である。テクスチャ画像及びデプス画像を表す図である。テクスチャ画像の詳細を説明するための図である。ビデオストリームの一例を表す図である。 scalability_mask及びdimension_identifierの拡張例を示す図である。アトラスＩＤの紐付けを説明するための図である。サンプルグループを説明するための図である。 oinfサンプルグループの一例を表す図である。 linfサンプルグル―プの一例を表す図である。ポストデコーディング情報の格納を説明するための図である。 ProjectedOmniVideoForParallaxBoxのシンタックスの一例を表す図である。 ProjectionInfoBoxのシンタックスの一例を表す図である。 ProjectionInfoBoxにおけるCameraPosStruct、DepthQuantizationStruct、ProjectionFormatStruct、RotationStruct及びRefionWisePackingStructのシンタックスの一例を示す図である。 ProjectionInfoBox及びRegionWisePackingStructのシンタックスの他の例を表す図である。３ＤｏＦレンダリングが可能な視点位置を示すように拡張したProjectionInfoBoxのシンタックスの一例を示す図である。クライアント装置のブロック図である。ファイル処理部、復号化処理部及び表示情報生成部の詳細を表すブロック図である。第１の実施形態に係るファイル生成装置によるファイル生成処理のフローチャートである。第１の実施形態に係るクライアント装置により実行される再生処理のフローチャートである。第１の実施形態の変形例に係るＩＳＯＢＭＦＦファイルの一例を表す図である。第２の実施形態に係るＩＳＯＢＭＦＦＦファイルの一例を表す図である。第３の実施形態に係るＩＳＯＢＭＦＦＦファイルの一例を表す図である。第３の実施形態の変形例（１）に係るsub-picture　track　groupingのシンタックスの一例を示す図である。 Matroska　Media　Containerのフォーマットを表す図である。

　以下に、本開示の実施形態について図面に基づいて詳細に説明する。なお、以下の各実施形態において、同一の部位には同一の符号を付することにより重複する説明を省略する。また、本技術で開示される範囲は、実施形態の内容に限定されるものではなく、出願当時において公知となっている以下の非特許文献に記載されている内容も含まれる。

　非特許文献１：（上述）
　非特許文献２："ISO/IEC　14496-15:2017",　Information　technology.　Coding　of　audio-visual　objects.　Part15:Carriage　of　network　abstraction　layer(NAL)　unit　structure　video　in　the　ISO　base　media　file　format　2017-02
　非特許文献３："ISO/IEC　23090-2:2019",　Information　technology.　Coded　representation　of　immersive　media,　Part2:Omnidirecrional　media　format,　2019-01
　非特許文献４：N17331,　Requirements　MPEG-I　phase　1b,　version　1,　2018-02-22
　非特許文献５：M48024,　Strawman　Design　for　”3DoF+”,　version　2,　2019-03-28
　非特許文献６：M47544,　Extensions　to　Technicolor　Intel　Response　to　”3DoF”　CfP,　version　2,　2019-03-22
　非特許文献７：N18464,　Working　Draft　1　of　Metadata　for　Immersive　Media　(Video),　version　1,　2019-04-26
　非特許文献８：”Matroska　Media　Container”,　[令和2年2月27日検索],　インターネット　<URL　:　https://www.matroska.org/>

　つまり、上述の非特許文献に記載されている内容も、参照により本明細書に組み込まれる。つまり、上述の非特許文献に記載されている内容もサポート要件を判断する際の根拠となる。例えば、非特許文献１～３及び８に記載されているFile　Structureや、非特許文献５～７に記載されている”３ＤｏＦ＋”ストリーム構造で用いられている用語が発明の詳細な説明において直接的な記載がない場合でも、本技術の開示範囲内であり、請求の範囲のサポート要件を満たすものとする。また、例えば、パース（Parsing）、シンタックス（Syntax）、セマンティクス（Semantics）等の技術用語についても同様に、発明の詳細な説明において直接的に定義されていない場合でも、本技術の開示範囲内であり、請求の範囲のサポート要件を満たすものとする。
　また、以下に示す項目順序に従って本開示を説明する。

　　１．第１の実施形態
　　　１．１　第１の実施形態の変形例
　　２．第２の実施形態
　　　２．１　第２の実施形態の変形例
　　３．第３の実施形態
　　　３．１　第３の実施形態の変形例（１）
　　　３．２　第３の実施形態の変形例（２）
　　４．第４の実施形態

［１．第１の実施形態］
　”３ＤｏＦ＋”ストリームは、テクスチャレイヤ、デプスレイヤ及び”３ＤｏＦ＋”メタデータを含む。”３ＤｏＦ＋”メタデータは、詳しくは、カメラパラメータ及びアトラスパラメータリストメタデータを有する。カメラパラメータは、各パッチが見える視点位置情報である。また、アトラスパラメータリストメタデータは、パッチ毎の表示位置とコーデックピクチャ上の位置間のマッピング情報を表す。対応するテクスチャレイヤ及びデプスレイヤの組となるレイヤペアがアトラスと呼ばれる。

　そして、”３ＤｏＦ＋”ストリームのテクスチャレイヤは、３ＤｏＦ領域と”３ＤｏＦ＋”領域を含む。”３ＤｏＦ＋”領域には、細かいパッチが格納されており、各パッチには３ＤｏＦ領域をレンダリングして形成される画像の別の角度からの映像に用いる情報が含まれる。

　”３ＤｏＦ＋”ストリームは、マルチレイヤ（Multi-layer）ＨＥＶＣ（High　Efficiency　Video　Codec）で符号化される。マルチレイヤＨＥＶＣは、１つのストリームの中に低解像度のレイヤと高解像度のレイヤとのように複数のレイヤを含む符号化方法である。”３ＤｏＦ＋”メタデータは、例えばＳＥＩ（Supplemental　Enhancement　Information）としてビットストリーム（bitstream）に格納される。ビットストリームは、”３ＤｏＦ＋”ストリームを形成する”３ＤｏＦ＋”画像のデータである。そして、ＨＥＶＣのメタデータの１種であるＶＰＳ（Video　Parameter　Set）が拡張され、各レイヤにアトラスフラグが付与されることで、アトラスを構成するレイヤペアを識別することが可能となる。

　ここで、再生処理装置が３ＤｏＦレンダリング機能を備えるが”３ＤｏＦ＋”映像の再生能力は有さない場合について考える。以下では、３ＤｏＦレンダリング機能を備えるが”３ＤｏＦ＋”映像の再生能力は有さない再生処理装置を、３ＤｏＦ再生処理装置という。３ＤｏＦ再生処理装置には、いくつか種類が考えられる。例えば、”３ＤｏＦ＋”ストリームをデコードできるが、レンダリング能力や機能の制約から３ＤｏＦレンダリングは行えるが、”３ＤｏＦ＋”映像のレンダリングには対応していない３ＤｏＦ再生処理装置がある。また、例えば、ＯＭＡＦ　ed.1　playerなどの”３ＤｏＦ＋”ストリームのデコード及びレンダリングのいずれの機能も有さない３ＤｏＦ再生処理装置がある。

　”３ＤｏＦ＋”ストリームのテクスチャレイヤは、３ＤｏＦ領域及び”３ＤｏＦ＋”領域を含むため、３ＤｏＦ再生処理装置は、”３ＤｏＦ＋”ストリームのテクスチャレイヤのうちの３ＤｏＦ領域に限定してレンダリングを行うという場合が考えられる。このような処理を行うことが可能であれば、再生能力の異なる再生処理装置でも、同一の”３ＤｏＦ＋”ストリームを再生能力に合わせて適切に再生することができ、再生処理装置の再生能力毎にストリームを用意しなくてもよくなる。これにより、例えば、配信時の配信サーバが有するＣＤＮ（Content　Delivery　Network）ストレージを節約でき、且つ、再生処理装置が再生可能なコンテンツを増やすことができる。なおＭＰＥＧ－Ｉ　Phase　1bの”３ＤｏＦ＋”に関する技術要件においても、この場合の対応が求められている。

　しかしながら、”３ＤｏＦ＋”ストリームに含まれる３ＤｏＦ領域をレンダリングする場合、３ＤｏＦ対応のクライアント装置２は、一度”３ＤｏＦ＋”でレンダリングを行い、その上で、特定視点位置から見た３ＤｏＦ映像のみを出力する処理を行うことになる。これは、３ＤｏＦ対応のクライアント装置２では、”３ＤｏＦ＋”ストリームの処理が困難であることを意味する。すなわち、今までの”３ＤｏＦ＋”コンテンツの配信システムでは、上述したメリットを享受することが困難である。そこで、以下に、３ＤｏＦ再生処理装置が配信された”３ＤｏＦ＋”コンテンツを再生可能となる配信システムについて説明する。

[第１の実施形態に係るシステムの構成]
　図１は、配信システムの一例のシステム構成図である。配信システム１００は、情報処理装置であるファイル生成装置１、再生処理装置であるクライアント装置２及びＷｅｂサーバ３を含む。ファイル生成装置１、クライアント装置２及びＷｅｂサーバ３は、ネットワーク４に接続される。そして、ファイル生成装置１、クライアント装置２及びＷｅｂサーバ３は、ネットワーク４を介して相互に通信可能である。ここで、図１においては、各装置を１台ずつ示しているが、配信システム１００は、ファイル生成装置１及びクライアント装置２をそれぞれ複数台含んでもよい。

　ファイル生成装置１は、”３ＤｏＦ＋”映像を提供するデータである”３ＤｏＦ＋”ストリームを生成する。ファイル生成装置１は、生成した”３ＤｏＦ＋”ストリームをＷｅｂサーバ３にアップロードする。ここで、本実施形態では、Ｗｅｂサーバ３が”３ＤｏＦ＋”ストリームをクライアント装置２に提供する構成について説明するが、配信システム１００は他の構成を採ることも可能である。例えば、ファイル生成装置１が、Ｗｅｂサーバ３の機能を含み、生成した”３ＤｏＦ＋”ストリームを自装置内に格納し、クライアント装置２に提供する構成であってもよい。

　Ｗｅｂサーバ３は、ファイル生成装置１からアップロードされた”３ＤｏＦ＋”ストリームを保持する。そして、Ｗｅｂサーバ３は、クライアント装置２からの要求にしたがい指定された”３ＤｏＦ＋”ストリームを提供する。

　クライアント装置２は、”３ＤｏＦ＋”ストリームの送信要求をＷｅｂサーバ３へ送信する。そして、クライアント装置２は、送信要求で指定した”３ＤｏＦ＋”ストリームをＷｅｂサーバ３から取得する。そして、クライアント装置２は、”３ＤｏＦ＋”ストリームをデコードして映像を生成して、その映像をモニタなどの表示装置に表示させる。

［第１の実施形態に係るファイル生成装置の構成］
　次に、ファイル生成装置１の詳細について説明する。図２は、ファイル生成装置のブロック図である。情報処理装置であるファイル生成装置１は、図２に示すように、生成処理部１０及び制御部１１を有する。制御部１１は、生成処理部１０の制御に関する処理を実行する。例えば、制御部１１は、生成処理部１０の各部の動作タイミングなどの統括制御を行う。生成処理部１０は、データ入力部１０１、アトラス処理部１０２、符号化部１０３、ビットストリーム生成部１０４、ファイル生成部１０５及び送信部１０６を有する。

　データ入力部１０１は、”３ＤｏＦ＋”映像の画像データ及び”３ＤｏＦ＋”メタデータなどの入力を受け付ける。”３ＤｏＦ＋”メタデータには、画像の時刻、位置情報及び視点位置情報などの視点に関する情報が含まれる。データ入力部１０１は、取得した画像データをアトラス処理部１０２へ出力する。また、データ入力部１０１は、メタ情報を符号化部１０３へ出力する。

　アトラス処理部１０２は、”３ＤｏＦ＋”映像の画像データの入力をデータ入力部１０１から受ける。そして、アトラス処理部１０２は、画像データからテクスチャ画像のデータ及びデプス画像のデータを生成する。テクスチャ画像は、”３ＤｏＦ＋”映像は、３次元データを決められた視点位置から複数の投影方向に投影して形成される各投影方向に対応する画像である。デプス画像は、テクスチャ画像上の各点の３次元空間における位置を表す画像である。

　図３は、テクスチャ画像及びデプス画像を表す図である。図３における画像３０１が、テクスチャ画像である。そして、領域３１１が３ＤｏＦ領域であり、領域３１２が”３ＤｏＦ＋”領域である。”３ＤｏＦ＋”領域には、３ＤｏＦ領域における視点位置から少しずれた角度から見た画像を生成するための補正画像であるパッチが含まれる。また、画像３０２が、デプス画像である。そして、アトラス処理部１０２は、対応するテクスチャ画像のデータとデプス画像のデータとを組み合わせてアトラスを生成する。また、アトラス処理部１０２は、アトラスを全天球映像として表示するためのアトラス配置パラメータを生成する。

　さらに、アトラスを構成するテクスチャ画像及びデプス画像のペア識別子であるアトラスＩＤを生成して各アトラスに割り当てる。また、アトラス処理部１０２は、２次元のデータから全天球映像を作るためのメタデータであるポストデコーディング情報を生成する。

　ここで、ポストデコーディング情報を説明するためにテクスチャ画像の詳細について、図４を参照して説明する。図４は、テクスチャ画像の詳細を説明するための図である。テクスチャ画像３３０は、３ＤｏＦ領域３３１及び”３ＤｏＦ＋”領域３３２を有する。そして、テクスチャ画像３３０は、座標空間３４０における視点ｏ、視点ａ、視点ｂ及び視点ｃから見た全天球映像の元となる画像を含む。３ＤｏＦ領域３３１には、基本カメラのprojected　pictureである視点ｏの位置における画像３３３が格納される。この基本カメラによる視点位置が「所定の視点位置」一例にあたる。そして、画像３３３が、「基準２次元画像」の一例にあたる。

　また、”３ＤｏＦ＋”領域３３２には、視点ａの位置における画像３３４、視点ｂの位置における画像３３５及び視点ｃの位置における画像３３６といった限定範囲内の任意カメラ位置のprojected　pictureを生成するための補完画像であるパッチが格納される。この限定範囲内の任意カメラによる視点位置が、「所定の視点位置から移動させた視点位置」の一例にあたる。そして、画像３３４～３３６が、「移動２次元画像」の一例にあたる。デプス画像についても、テクスチャ画像の各projected　pictureの情報に相当するデプスマップが格納される。

　アトラス処理部１０２は、各視点位置からの画像、すなわち視点ｏ及びａ～ｃからの画像３３３～３３６をテクスチャ画像３３０から生成するためのポストデコーディング情報を生成する。アトラス処理部１０２は、このポストデコーディング情報に、各画像がテクスチャ画像の３ＤｏＦ領域の画像か、テクスチャ画像の”３ＤｏＦ＋”領域を用いて生成される画像かの情報を含ませる。その後、アトラス処理部１０２は、アトラスとともに、アトラス配置パラメータ、アトラスＩＤ及びポストデコーディング情報を含む”３ＤｏＦ＋”メタデータを符号化部１０３へ出力する。

　符号化部１０３は、アトラスの入力をアトラス処理部１０２から受ける。また、符号化部１０３は、アトラス配置パラメータ、アトラスＩＤ及びポストデコーディング情報を含む”３ＤｏＦ＋”メタデータの入力をデータ入力部１０１から受ける。次に、符号化部１０３は、アトラス及び”３ＤｏＦ＋”メタデータをマルチレイヤＨＥＶＣで符号化する。符号化部１０３は、テクスチャ画像を符号化することで、テクスチャレイヤを生成する。また、符号化部１０３は、デプス画像を符号化することでデプスレイヤを生成する。すなわち、符号化されたアトラスは、テクスチャレイヤ及びデプスレイヤを含む。そして、符号化部１０３は、符号化したアトラス及び”３ＤｏＦ＋”メタデータをビットストリーム生成部１０４へ出力する。

　ビットストリーム生成部１０４は、符号化されたアトラス及び”３ＤｏＦ＋”メタデータの入力を符号化部１０３から受ける。そして、ビットストリーム生成部１０４は、アトラスを時系列に並べ且つ対応する”３ＤｏＦ＋”メタデータを組み合わせてビットストリームを生成する。図５は、ビデオストリームの一例を表す図である。ビデオストリームには、テクスチャレイヤ３０３とデプスレイヤ３０４との組であるアトラスが時系列で格納される。ビデオストリームに含まれる１つのアトラスを構成するデータの単位は、アクセスユニット（ＡＵ：access　unit）と呼ばれる。そして、ビットストリーム生成部１０４は、生成したビットストリームをファイル生成部１０５へ出力する。

　ファイル生成部１０５は、ビットストリームの入力をビットストリーム生成部１０４から受ける。そして、ファイル生成部１０５は、取得したビットストリームをセグメント毎にＩＳＯＢＭＦＦファイルに格納することでファイル化して、ビットストリームのセグメントファイルを生成する。以下にＩＳＯＢＭＦＦファイルへの格納について説明する。

　ファイル生成部１０５は、１トラックにアトラスを構成するテクスチャレイヤ及びデプスレイヤが格納されていることを示す情報をＩＳＯＢＭＦＦファイルに格納する。具体的には、ファイル生成部１０５は、Operating　Point　Information　sample　group（oinf）を拡張し、scalability_mask及びdimension_identifierをＨＥＶＣのＶＰＳと同様に格納することで、アトラスを構成するテクスチャ及びデプスレイヤのペア識別子であるアトラスＩＤを定義する。図６は、scalability_mask及びdimension_identifierの拡張例を示す図である。ファイル生成部１０５は、例えば、図６に示すようにscalability_maskの５番目のビットを、アトラスＩＤに割り当てる。

　そして、ファイル生成部１０５は、ビットストリームをＩＳＯＢＭＦＦファイルに格納する際にアトラスＩＤを各テクスチャレイヤ及び各デプスレイヤに割り当てられたレイヤＩＤに紐づける。図７は、アトラスＩＤの紐付けを説明するための図である。”３ＤｏＦ＋”のビットストリームをＩＳＯＢＭＦＦファイルに格納する場合、Ｌ－ＨＥＶＣストレージ（ISO/IEC　14496-15参照）が利用可能であり、その場合、ビットストリームは、図６に示すようにＩＳＯＢＭＦＦファイルに格納される。ビットストリームの各アクセスユニットは、ＩＳＯＢＭＦＦファイルでは、それぞれsampleEntryとして扱われる。この場合、ファイル生成部１０５は、マルチメディアＨＥＶＣで符号化した際にストリームの一部として”３ＤｏＦ＋”メタデータを送る。

　ここで、ファイル生成部１０５は、Sampleをグループ化し、ＩＳＯＢＭＦＦファイル内でサンプルグループを用いて、グループ毎にメタデータを紐づける。ファイル生成部１０５は、サンプルグループをＩＳＯＢＭＦＦファイルのMoovに格納する。図８は、サンプルグループを説明するための図である。ＩＳＯＢＭＦＦファイル内で、各サンプルグループは、図８に示すSampleTableBoxにより定義される。図８に示すように、Sample　To　Group　Boxのgrouping_Typeは、紐づけられるSample　Group　Description　BoxのGrouping_Typeを示す。また、Sample　To　Group　Boxでは、１エントリにつき、sample_count及びGroup_description_indexが登録される。group_description_indexは、紐付くGroupEntryのindexを示す。また、sample_countは、そのGroupEntryに属するsample数を示す。

　そして、ファイル生成部１０５は、サンプルグループとして、図７に示すoperating　points　information（oinf）サンプルグループ３０５及びLayer　Information(linf)サンプルグループ３０６を生成する。

　図９は、oinfサンプルグループの一例を表す図である。ファイル生成部１０５は、シンタックス３２１によりOperating　Pointに含まれるレイヤと各レイヤのprofile、level及びtierをoinfサンプルグループに登録する。また、ファイル生成部１０５は、シンタックス３２２によりwidth及びheightの最大及び最小の情報、フレームレート及びビットレートの関連情報などのOperating　pointに含まれる情報をoinfサンプルグループに登録する。さらに、ファイル生成部１０５は、シンタックス３２３により、非ベースレイヤの依存関係と種類の情報をoinfサンプルグループに登録する。ここで、ファイル生成部１０５は、図６に示したscalability_maskとdimention_identifierとを用いて種類を表す。ファイル生成部１０５は、この種類としてアトラスＩＤを格納する。すなわち、ファイル生成部１０５は、アトラスＩＤをsgpd’oinf’と表されるoinfサンプルグループに格納する。このように、oinfサンプルグループ３０５は、同じ属性のSampleをまとめる情報が格納される。

　ファイル生成部１０５は、oinfサンプルグループ内でアトラスＩＤとレイヤＩＤとを対応付けることで、図７に示すように、各アトラスＩＤとテクスチャレイヤ及びデプスレイヤとを紐づける。図７において、「０」のアトラスＩＤは、レイヤＩＤが「０」のテクスチャレイヤ及びレイヤＩＤが「１」のデプスレイヤに紐づけられる。また、「１」のアトラスＩＤは、レイヤＩＤが「２」のテクスチャレイヤ及びレイヤＩＤが「３」のデプスレイヤに紐づけられる。

　このように、テクスチャレイヤ及びデプスレイヤを有するアトラスが格納されていることを示す情報をoinfサンプルグループに格納することで、クライアント装置２は、ＥＳのデコードをする前にテクスチャレイヤ及びデプスレイヤを把握できる。すなわち、クライアント装置２は、自装置でレンダリング可能なレイヤを選択してデコードすることができるようになり、処理オーバヘッドを削減することができる。例えば、”３ＤｏＦ＋”ストリームのデコードは可能、且つ、３ＤｏＦレンダリングは可能であるが、”３ＤｏＦ＋”レンダリングには対応してないクライアント装置２は、テクスチャレイヤを容易に選択することができる。

　また、ファイル生成部１０５は、linfサンプルグループ３０６に、トラックに含まれるレイヤのレイヤＩＤ及びレイヤＩＤで示されるレイヤの内のどのサブレイヤが含まれるかを示す情報を格納する。図１０は、linfサンプルグル―プの一例を表す図である。図１０においてlayer_idがレイヤＩＤを表し、この値が各Sampleにおけるnuh_layer_idに対応する。

　さらに、ファイル生成部１０５は、２次元のデータから全天球映像を作るためのメタデータであるポストデコーディング情報をＩＳＯＢＭＦＦファイルに格納する。このＩＳＯＢＭＦＦファイルに格納されたポストデコーディング情報を用いることで、クライアント装置２は”３ＤｏＦ＋”もしくは３ＤｏＦのレンダリングを行うことができる。

　例えば、ファイル生成部１０５は、図１１に示すように、ポストデコーディング情報を格納する。図１１は、ポストデコーディング情報の格納を説明するための図である。ファイル生成部１０５は、図１１に示すように、SchemeTypeBox３４１においてscheme_type=’povp’としてトラックに格納されたコンテンツが”３ＤｏＦ＋”ストリームであることを示す。これ以外にも、ファイル生成部１０５は、”３ＤｏＦ＋”ストリームであることを示す新規フラグを定義してSampleEntryに格納してもよい。さらに、ファイル生成部１０５は、例えば、SchemeInformationBoxに視点位置毎のポストデコーディング情報を持つ新規Box３４２としてProjectedOmniVideoForParallaxBoxを定義する。

　図１２は、ProjectedOmniVideoForParallaxBoxのシンタックスの一例を表す図である。図１２に示すように、ファイル生成部１０５は、視点位置の数分のポストデコーディング情報を登録するためのProjectedOmniVideoForParallaxBoxにProjectionInfoBoxを格納する。”３ＤｏＦ＋”領域を用いた画像であることを表すポストデコーディング情報が、「第１ポストデコーディング情報」の一例にあたり、そのポストデコーディング情報を格納するProjectionInfoBoxが、「第１のBox」の一例にあたる。この３ＤｏＦ領域の画像であることを表すポストデコーディング情報が、「第２ポストデコーディング情報」の一例にあたり、そのポストデコーディング情報を格納するProjectionInfoBoxが、「第２のBox」の一例にあたる。

　図１３は、ProjectionInfoBoxのシンタックスの一例を表す図である。さらに、図１４は、ProjectionInfoBoxにおけるCameraPosStruct、DepthQuantizationStruct、ProjectionFormatStruct、RotationStruct及びRefionWisePackingStructのシンタックスの一例を示す図である。

　ProjectionInfoBoxは、図１４に示すシンタックス３５１～３５５で表される、CameraPosStruct、DepthQuantizationStruct、ProjectionFormatStruct、RotationStruct及びRegionWisePackingStructを呼び出す。ファイル生成部１０５は、CameraPosStruct及びDepthQuantizationStructを新しく定義する。CameraPosStructは、視点位置を格納する。CameraPosStructとしては、ViewpointPosStructを利用してもよい。DepthQuantizationStructは、デプス量子化パラメータを格納する。ファイル生成部１０５は、ProjectionFormatStructにおけるProjection_typeを表３５７に示すようにPerspective　projectionを含むように拡張する。RegionWisePackingStructは、シンタックス３５６で表されるRectRegionPackingを呼び出す。RegionWisePackingStructは、アトラスのパッチ位置情報を格納する。すなわち、RegionWisePackingStructは、各パッチがどのテクスチャレイヤに含まれるかを示す情報である。

　ProjectionInfoBoxにおけるCameraPosStruct、ProjectionFormatStruct及びRotationStructは、動的に変化しないことが想定されるため、”３ＤｏＦ＋”ストリーム中でなく、ＩＳＯＢＭＦＦファイルにメタデータとして格納することで、冗長な記述を回避できビット数の削減が可能となる。また、ProjectionInfoBoxにおけるRegionWisePackingStruct及びDepthQuantizationStructについては、動的に変化しない場合には、ＩＳＯＢＭＦＦファイルにメタデータとして格納することで、冗長な記述を回避できビット数の削減が可能となる。また、RegionWisePackingStruct及びDepthQuantizationStructが動的に変化する場合には、ファイル生成部１０５は、ＩＳＯＢＭＦＦファイルに初期値を格納する。さらに、ファイル生成部１０５は、ProjectionFormatStruct()及びDepthQuantizationStruct()それぞれが視点間で同一か否か示すフラグを追加して、同一で有る場合には、num_camerasのループの外に登録することで、ビット数を削減することも可能である。

　ここで、ファイル生成部１０５は、ProjectionInfoBox及びRegionWisePackingStructを図１５に示すように生成してもよい。図１５は、ProjectionInfoBox及びRegionWisePackingStructのシンタックスの他の例を表す図である。図１５のシンタックス３６１で示されるProjectionInfoBoxの場合、シンタックス３６２で示されるRegionWisePackingStructが呼び出される。このRegionWisePackingStructでは、unsigned_int(8)　atlas_idにより、特定のテクスチャレイヤの所定の位置にアトラスＩＤを書き込むことができる。

　さらに、ファイル生成部１０５は、ProjectionInfoBoxを図１６のように拡張して、３ＤｏＦレンダリングが可能な視点位置を示す。図１６は、３ＤｏＦレンダリングが可能な視点位置を示すように拡張したProjectionInfoBoxのシンタックスの一例を示す図である。図１６に示すシンタックスでは、is_3DoF_compatibleの値が０であれば、３ＤｏＦレンダリングに対応しておらず、値が１であれば３ＤｏＦレンダリングが可能である。すなわち、クライアント装置２は、num_camerasの値を有する視点位置各視点位置のうちどの視点位置が３ＤｏＦレンダリング可能かをこのProjectionInfoBoxにより確認できる。これにより、３ＤｏＦレンダリングは可能であるが、”３ＤｏＦ＋”レンダリングには対応してないクライアント装置２が”３ＤｏＦ＋”ストリームのうち３ＤｏＦ領域をレンダリングすることが可能となる。

　図２に戻って説明を続ける。ファイル生成部１０５は、以上に説明したProjectionInfoBoxにより各視点位置におけるポストデコーディング情報及びレイヤＩＤに紐づけられたアトラスＩＤを格納したＩＳＯＢＭＦＦファイルを送信部１０６へ出力する。

　送信部１０６は、ProjectionInfoBoxにより各視点位置におけるポストデコーディング情報及びレイヤＩＤに紐づけられたアトラスＩＤを格納したＩＳＯＢＭＦＦファイルの入力をファイル生成部１０５から受ける。そして、送信部１０６は、取得したＩＳＯＢＭＦＦファイルをＷｅｂサーバ３に送信してアップロードする。

［第１の実施形態に係るクライアント装置の構成］
　図１７は、クライアント装置のブロック図である。また、図１８は、ファイル処理部、復号化処理部及び表示情報生成部の詳細を表すブロック図である。

　図１７に示すように、クライアント装置２は、再生処理部２０及び制御部２１を有する。制御部２１は、再生処理部２０の各部の動作を制御する。例えば、制御部２１は、再生処理部２０の各部の動作のタイミングを統括制御する。再生処理部２０は、ファイル取得部２０１、ファイル処理部２０２、復号処理部２０３、表示情報生成部２０４及び表示部２０５を有する。

　ファイル取得部２０１は、Ｗｅｂサーバ３にアクセスして表示する６ＤｏＦコンテンツのシーンディスクリプションが格納されたＩＳＯＢＭＦＦのファイルを取得する。そして、ファイル取得部２０１は、シーンディスクリプションが格納されたＩＳＯＢＭＦＦのファイルをファイル処理部２０２へ出力する。

　ファイル取得部２０１は、Ｗｅｂサーバ３にアクセスして表示する”３ＤｏＦ＋”ストリームが格納されたＩＳＯＢＭＦＦファイルを取得する。そして、ファイル取得部２０１は、”３ＤｏＦ＋”ストリームが格納されたＩＳＯＢＭＦＦファイルをファイル処理部２０２へ出力する。

　ファイル処理部２０２は、図１８に示すように、抽出部２２０を有する。ファイル処理部２０２は、”３ＤｏＦ＋”ストリームが格納されたＩＳＯＢＭＦＦファイルの入力をファイル取得部２０１から受ける。そして、ファイル処理部２０２の抽出部２２０は、ＩＳＯＢＭＦＦファイルをパースして、ビットストリームのデータを抽出する。その後、抽出部２２０は、ビットストリームのデータを復号処理部２０３へ出力する。

　ここで、ファイル処理部２０２は、取得したＩＳＯＢＭＦＦファイルのパースにより、トラックに格納されたコンテンツが”３ＤｏＦ＋”ストリームか否かを判定する。例えば、ファイル処理部２０２は図１１におけるSchemeTyepBoxのscheme_typeを確認して”３ＤｏＦ＋”ストリームか否かを判定する。そして、復号処理部２０３が”３ＤｏＦ＋”ストリームのデコードに対応していない場合、ファイル処理部２０２は、トラックに格納されたコンテンツが”３ＤｏＦ＋”ストリームであればエラーを通知して処理を中止する。

　また、復号処理部２０３が”３ＤｏＦ＋”ストリームのデコードに対応しているが、表示情報生成部２０４が”３ＤｏＦ＋”のレンダリングに対応していない場合、ファイル処理部２０２は、３ＤｏＦレンダリングが可能な視点位置を取得する。そして、ファイル処理部２０２は、テクスチャレイヤのデコードを復号処理部２０３に指示するとともに、３ＤｏＦレンダリングが可能な視点位置及びその視点位置のポストデコーディング情報を送信する。

　復号処理部２０３は、図１８に示すように、複数のデコーダ２３０を有する。復号処理部２０３は、ビットストリームデータの入力をファイル処理部２０２から受ける。そして、復号処理部２０３は、デコーダ２３０を用いて取得したビットストリームのデータに対して復号処理を施す。その後、復号処理部２０３は、復号化したビットストリームのデータを表示情報生成部２０４へ出力する。

　また、復号処理部２０３は、表示情報生成部２０４が”３ＤｏＦ＋”レンダリングに対応していない場合、テクスチャレイヤのデコードの指示を復号処理部２０３から受ける。また、復号処理部２０３は、３ＤｏＦレンダリングが可能な視点位置及びその視点位置のポストデコーディング情報を受信する。そして、復号処理部２０３は、”３ＤｏＦ＋”ストリームのテクスチャレイヤのデコードを行う。その後、復号処理部２０３は、デコードしたテクスチャレイヤ、３ＤｏＦレンダリングが可能な視点位置及びその視点位置のポストデコーディング情報を表示情報生成部２０４へ出力する。

　表示情報生成部２０４は、図１８に示すように、アトラス分解部２４１及び表示処理部２４２を有する。表示情報生成部２０４は、復号化されたビットストリームの入力を復号処理部２０３から受ける。そして、表示情報生成部２０４のアトラス分解部２４１は、復号化された各アトラスのテクスチャレイヤとデプスレイヤとを分解する。そして、アトラス分解部２４１は、分解したアトラスを表示処理部２４２へ出力する。

　また、”３ＤｏＦ＋”レンダリングに対応していない場合、表示情報生成部２０４は、デコードされたたテクスチャレイヤ、３ＤｏＦレンダリングが可能な視点位置及びその視点位置のポストデコーディング情報の入力を復号処理部２０３から受ける。そして、アトラス分解部２４１は、デコードされたテクスチャレイヤ、３ＤｏＦレンダリングが可能な視点位置及びその視点位置のポストデコーディング情報を表示処理部２４２へ出力する。

　表示処理部２４２は、分解されたアトラスの入力をアトラス分解部２４１から受ける。さらに、表示処理部２４２は、視点位置及び視線方向の入力を図示しない入力装置から受ける。そして、表示処理部２４２は、入力された視点位置及び視線方向にしたがって、”３ＤｏＦ＋”レンダリングを行い表示用の”３ＤｏＦ＋”画像を生成する。その後、表示処理部２４２は、生成した表示用の”３ＤｏＦ＋”画像を表示部２０７に供給する。

　また、”３ＤｏＦ＋”レンダリングに対応していない場合、表示処理部２４２は、コードされたテクスチャレイヤ、３ＤｏＦレンダリングが可能な視点位置及びその視点位置のポストデコーディング情報の入力をアトラス分解部２４１から受ける。さらに、表示処理部２４２は、視点位置及び視線方向の入力を図示しない入力装置から受ける。そして、表示処理部２４２は、入力された視点位置に対応するテクスチャレイヤの３ＤｏＦ領域からデータを取得し、視線方向にしたがって３ＤｏＦレンダリングを行い表示用の３ＤｏＦ画像を生成する。その後、表示処理部２４２は、生成した表示用の３ＤｏＦ画像を表示部２０７に供給する。

　表示部２０５は、モニタなどの表示装置を有する。表示部２０５は、表示情報生成部２０４により生成された表示用の画像の入力を受ける。そして、表示部２０５は、取得した表示用の画像を表示装置に表示させる。

［第１の実施形態に係るファイル生成手順］
　次に、図１９を参照して、第１の実施形態に係るファイル生成装置１によるファイル生成処理の流れについて詳細に説明する。図１９は、第１の実施形態に係るファイル生成装置によるファイル生成処理のフローチャートである。

　アトラス処理部１０２は、”３ＤｏＦ＋”映像の画像データ及び”３ＤｏＦ＋”メタデータの入力をデータ入力部１０１から受ける。そして、アトラス処理部１０２は、”３ＤｏＦ＋”映像の画像データ及び”３ＤｏＦ＋”メタデータからアトラス及びアトラス配置パラメータを生成する（ステップＳ１０１）。また、アトラス処理部１０２は、アトラスＩＤ及びポストデコーディング情報を生成する。そして、アトラス処理部１０２は、アトラス、並びに、アトラスＩＤ、ポストデコーディング情報及びアトラス配置パラメータを含む”３ＤｏＦ＋”メタデータを符号化部１０３へ出力する。

　符号化部１０３は、アトラス、並びに、アトラスＩＤ、ポストデコーディング情報及びアトラス配置パラメータを含む”３ＤｏＦ＋”メタデータをエンコードしてビットストリーム生成部１０４へ出力する。ビットストリーム生成部１０４は、エンコードされたアトラス及び”３ＤｏＦ＋”メタデータを用いて”３ＤｏＦ＋”のビットストリームを生成する（ステップＳ１０２）。その後、符号化部１０３は、生成したビットストリームをファイル生成部１０５へ出力する。

　次に、ファイル生成部１０５は、アトラスＩＤとレイヤＩＤとを紐づける情報、視点位置毎のポストデコーディング情報及びビットストリームをＩＳＯＢＭＦＦファイルに格納する（ステップＳ１０３）。その後、ファイル生成部１０５は、ＩＳＯＢＭＦＦファイルを送信部１０６へ出力する。送信部１０６は、ファイル生成部１０５により生成されたＩＳＯＢＭＦＦファイルをＷｅｂサーバ３へ出力する。

［第１の実施形態に係る再生処理手順］
　次に、図２０を参照して、本実施形態に係るクライアント装置２により実行される再生処理の流れを説明する。図２０は、第１の実施形態に係るクライアント装置により実行される再生処理のフローチャートである。ここでは、復号処理部２０３が”３ＤｏＦ＋”ストリームのデコードが可能である場合で説明する。

　ファイル処理部２０２は、ファイル取得部２０１を介して再生する”３ＤｏＦ＋”ストリームに対応するＩＳＯＢＭＦＦファイルをＷｅｂサーバ３から取得する。次に、ファイル処理部２０２は、自装置の表示情報生成部２０４が”３ＤｏＦ＋”レンダリングに対応しているか否かを判定する（ステップＳ２０１）。

　自装置の表示情報生成部２０４が”３ＤｏＦ＋”レンダリングに対応している場合（ステップＳ２０１：肯定）、ファイル処理部２０２は、ＩＳＯＢＭＦＦファイルをパースして、３ＤｏＦ及び”３ＤｏＦ＋”のポストデコーディング情報を取得する（ステップＳ２０２）。さらに、ファイル処理部２０２は、”３ＤｏＦ＋”のビットストリームをＩＳＯＢＭＦＦファイルから抽出する。そして、ファイル処理部２０２は、抽出した”３ＤｏＦ＋”のビットストリーム、並びに、３ＤｏＦ及び”３ＤｏＦ＋”のポストデコーディング情報を復号処理部２０３へ出力する。

　復号処理部２０３は、”３ＤｏＦ＋”のビットストリーム、並びに、３ＤｏＦ及び”３ＤｏＦ＋”のポストデコーディング情報の入力をファイル処理部２０２から受ける。そして、復号処理部２０３は、”３ＤｏＦ＋”のビットストリームをデコードする（ステップＳ２０３）。その後、復号処理部２０３は、デコードしたビットストリームのデータ及びポストデコーディング情報を表示情報生成部２０４へ出力する。

　表示情報生成部２０４は、ビットストリームのデータ、並びに、３ＤｏＦ及び”３ＤｏＦ＋”のポストデコーディング情報の入力を復号処理部２０３から受ける。さらに、表示情報生成部２０４は、視点位置及び視線方向の入力を入力装置から受ける。そして。表示情報生成部２０４は、ポストデコーディング情報、視点位置及び視線方向の情報を用いて”３ＤｏＦ＋”レンダリングを実行して表示用の”３ＤｏＦ＋”画像を生成する（ステップＳ２０４）。その後、表示情報生成部２０４は、”３ＤｏＦ＋”画像を送信して表示部２０５に表示させる視聴処理を実行する。

　これに対して、自装置の表示情報生成部２０４が”３ＤｏＦ＋”レンダリングに対応していない場合（ステップＳ２０１：否定）、ファイル処理部２０２は、ＩＳＯＢＭＦＦファイルをパースして、３ＤｏＦのポストデコーディング情報を取得する（ステップＳ２０５）。さらに、ファイル処理部２０２は、”３ＤｏＦ＋”のビットストリームをＩＳＯＢＭＦＦファイルから抽出する。そして、ファイル処理部２０２は、抽出した”３ＤｏＦ＋”のビットストリーム及び３ＤｏＦのポストデコーディング情報を復号処理部２０３へ出力し、テクスチャレイヤのエンコードを指示する。

　復号処理部２０３は、”３ＤｏＦ＋”のビットストリーム及び３ＤｏＦのポストデコーディング情報の入力をファイル処理部２０２から受ける。そして、復号処理部２０３は、”３ＤｏＦ＋”のビットストリームの３ＤｏＦレンダリングに用いる部分をデコードする（ステップＳ２０６）。すなわち、復号処理部２０３は、”３ＤｏＦ＋”のビットストリームのテクスチャレイヤをデコードする。その後、復号処理部２０３は、デコードしたビットストリームのデータ及び３ＤｏＦのポストデコーディング情報を表示情報生成部２０４へ出力する。

　表示情報生成部２０４は、ビットストリームのデータ及び３ＤｏＦのポストデコーディング情報の入力を復号処理部２０３から受ける。さらに、表示情報生成部２０４は、視点位置及び視線方向の入力を入力装置から受ける。そして。表示情報生成部２０４は、ポストデコーディング情報、視点位置及び視線方向の情報を用いて３ＤｏＦレンダリングを実行して表示用の３ＤｏＦ画像を生成する（ステップＳ２０７）。その後、表示情報生成部２０４は、３ＤｏＦ画像を送信して表示部２０５に表示させる視聴処理を実行する。

　以上に説明したように、本実施形態に係るファイル生成装置は、テクスチャレイヤ及びデプスレイヤを有するアトラスが格納されていることを表す情報をＩＳＯＢＭＦＦファイルに格納する。また、ファイル生成装置は、格納されたコンテンツが”３ＤｏＦ＋”ストリームか否かの情報及び視点位置毎のポストデコーディング情報をＩＳＯＢＭＦＦファイルに格納する。ポストデコーディング情報には、３ＤｏＦレンダリングが可能な視点位置を表す情報が格納される。これにより、クライアント装置は、”３ＤｏＦ＋”ストリームか否かを判定して、自装置の能力に対応したレイヤのデータを容易に取得できる。さらに、”３ＤｏＦ＋”レンダリングに対応していない場合、クライアント装置は、３ＤｏＦレンダリングにより表示用画像を生成することができる。したがって、クライアント装置の表示処理能力に応じた画像を提供して表示させることができ、利用者の視聴体験を拡大することができる。

［１．１　第１の実施形態の変形例］
　本変形例に係るファイル生成装置は、３ＤｏＦ領域と”３ＤｏＦ＋”領域とのそれぞれに関するポストデコーディング情報を個別のボックスに格納することが第１の実施形態と異なる。図２１は、第１の実施形態の変形例に係るＩＳＯＢＭＦＦファイルの一例を表す図である。

　ファイル生成部１０５は、図２１においてボックス３７１に示すようにSchemeTypeBoxにscheme_type=’podv’を格納する。これにより、ＯＭＡＦ　ed.1の構造に近づけることができる。そして、ファイル生成部１０５は、podvに３ＤｏＦ領域のポストデコーディング情報を格納する。このように構成することで、scheme_type=’podv’により、３ＤｏＦ領域のポストデコーディング情報が格納されていることが示される。さらに、ファイル生成部１０５は、podvにおけるrwpkを用いて３ＤｏＦ領域のレンダリングを可能とするための情報を格納する。

　また、ファイル生成部１０５は、ボックス３７２に示すようにCompatibleSchemeTypeBoxにscheme_type=’ecpp’を格納する。そして、ファイル生成部１０５は、ecppに”３ＤｏＦ＋”領域のポストデコーディング情報を格納する。さらに、ファイル生成部１０５は、povpにおけるpinfを用いて”３ＤｏＦ＋”領域のレンダリングを可能とする情報を格納する。ただし、ファイル生成部１０５は、povpにおけるpinfには、３ＤｏＦ領域及び”３ＤｏＦ＋”領域の両方のポストデコーディング情報を格納してもよい。

　以上に説明したように、本実施例に係るファイル生成装置は、３ＤｏＦ領域のポストコーディング情報と”３ＤｏＦ＋”領域のポストコーディング情報を異なるボックスに格納する。これにより、テクスチャレイヤが再生可能で”３ＤｏＦ＋”ストリームのデコードに対応しない場合にも、デプスレイヤを無視できるファイル生成装置であれば、３ＤｏＦ領域に制限してデコード及びレンダリングを行うことが可能となる。

［２．第２の実施形態］
　本実施形態に係るファイル生成装置は、テクスチャレイヤとデプスレイヤとを個別のトラックに格納することが第１の実施形態と異なる。本実施形態に係るファイル生成装置も、図２のブロック図で表される。以下の説明では、第１の実施形態と同様の各部の動作については説明を省略する場合がある。

　ファイル生成部１０５は、Ｌ－ＨＥＶＣ　storageの技術を利用して、テクスチャレイヤとデプスレイヤとを個別のトラックに格納する。図２２は、第２の実施形態に係るＩＳＯＢＭＦＦＦファイルの一例を表す図である。

　具体期には、ファイル生成部１０５は、ボックス４０１で示されるid=1のtrack　boxにテクスチャレイヤを格納する。また、ファイル生成部１０５は、ボックス４０２で示されるid=2のtrack　boxにデプスチャレイヤを格納する。そして、ファイル生成部１０５は、Track　referenceを用いて、ボックス４０２のデプスレイヤトラックから、ボックス４０１のテクスチャトラックが参照できるようにする。

　そして、ファイル生成部１０５は、ボックス４０１のテクスチャレイヤトラックにおいて、SchemeTyeBoxにscheme　type=’podv’を格納する。さらに、ファイル生成部１０５は、povdに３ＤｏＦ領域のポストデコーディング情報を格納する。この３ＤｏＦ領域のポストデコーディング情報が、「第１識別情報」の一例にあたる。このように構成することで、scheme_type=’podv’により、３ＤｏＦ領域のポストデコーディング情報が格納されていることが示される。さらに、ファイル生成部１０５は、rwpkを用いて３ＤｏＦ領域のレンダリングを可能とする情報を格納する。

　また、ファイル生成部１０５は、ボックス４０１のテクスチャレイヤトラックにおいて、CompatibleSchemeTyeBoxにscheme　type=’ecpp’を格納する。さらに、ファイル生成部１０５は、ボックス４０２のデプスレイヤトラックにscheme　type=’povp’を格納する。そして、ファイル生成部１０５は、povpに”３ＤｏＦ＋”領域のポストデコーディング情報を格納する。この”３ＤｏＦ＋”のポストデコーディング情報が、「第２識別情報」の一例にあたる。例えば、ファイル生成部１０５は、ボックス４０１のテクスチャレイヤトラックのpovpにおけるpinfに”３ＤｏＦ＋”領域のポストデコーディング情報を格納する。また、ファイル生成部１０５は、ボックス４０２のデプスレイヤトラックのpovpにおけるpinfに３ＤｏＦ領域及び”３ＤｏＦ＋”領域のポストデコーディング情報を格納する。

　クライアント装置２のファイル処理部２０２は、”３ＤｏＦ＋”ストリームのデコード及びレンダリングが可能な場合、テクスチャレイヤトラック及びデプスレイヤトラックの双方を用いて”３ＤｏＦ＋”映像の再生を行う。この場合、ファイル処理部２０２は、ボックス４０１のテクスチャレイヤトラックにおけるschiに格納されたpovpを参照して、”３ＤｏＦ＋””領域のポストデコーディング情報を取得する。

　一方、”３ＤｏＦ＋”ストリームのデコードに対応していない場合、ファイル処理部２０２は、テクスチャレイヤトラックに格納された３ＤｏＦ領域及び３ＤｏＦ領域のポストデコーディング情報を用いて３ＤｏＦ映像の再生を行う。

　以上に説明したように、本実施例に係るファイル生成装置は、テクスチャレイヤとデプスレイヤとを個別のトラックに格納する。これにより、”３ＤｏＦ＋”ストリームのデコードには対応していないクライアント装置であっても、テクスチャレイヤのトラックを使用して３ＤｏＦの全天球映像を再生することが可能となる。

［２．１　第２の実施形態の変形例］
　本変形例に係る配信システムでは、クライアント装置２が”３ＤｏＦ＋”レンダリングの際にデプスレイヤトラックにおけるschiに格納されたpropを参照することが第２の実施形態と異なる。以下に、本変形例に係るファイル生成装置１について説明する。

　ファイル生成装置１のファイル生成部１０５は、”３ＤｏＦ＋”レンダリングを行う場合にデプスレイヤトラックにおけるschiに格納されたpovpの参照を示すscheme_typeを新しく定義する。そして、ファイル生成部１０５は、テクスチャレイヤトラックにおけるCompatibleSchemeTypeBoxのscheme_typeとして新しく定義したscheme_typeを格納する。

　クライアント装置２のファイル処理部２０２は、”３ＤｏＦ＋”ストリームのデコード及びレンダリングが可能な場合、テクスチャレイヤトラック及びデプスレイヤトラックの双方を用いて”３ＤｏＦ＋”映像の再生を行う。この場合、ファイル処理部２０２は、テクスチャレイヤトラックにおけるCompatibleSchemeTypeBoxのsheme_typeを参照してデプスレイヤトラックにおけるschiに格納されたpovpの参照の指示を確認する。そして、ファイル処理部２０２は、デプスレイヤトラックにおけるschiに格納されたpovpを参照して、”３ＤｏＦ＋”領域のポストデコーディング情報を取得する。

　以上に説明したように、本実施例に係る配信システムでは、クライアント装置は、デプスレイヤトラックにおけるschiに格納されたpropを参照して”３ＤｏＦ＋”領域のポストデコーディング情報を取得し、”３ＤｏＦ＋”レンダリングを行う。これにより、ＯＭＡＦ　ed.1で規定されるprofileを満たすことが可能となる。

［３．第３の実施形態］
　本実施形態に係るファイル生成装置は、テクスチャレイヤの”３ＤｏＦ＋”領域と３ＤｏＦ領域とを分割してそれぞれ個別に１トラックに格納することが第２の実施形態と異なる。本実施形態に係るファイル生成装置も、図２のブロック図で表される。以下の説明では、第１及び第２の実施形態と同様の各部の動作については説明を省略する場合がある。

　ファイル生成部１０５は、テクスチャレイヤの”３ＤｏＦ＋”領域と３ＤｏＦ領域とを分割する。さらに、ファイル生成部１０５は、デプスレイヤにおけるテクスチャレイヤの”３ＤｏＦ＋”領域に対応する領域と３ＤｏＦ領域に対応する領域とを分割する。以下では、デプスレイヤにおけるテクスチャレイヤの”３ＤｏＦ＋”領域に対応する領域と３ＤｏＦ領域に対応する領域とを、それぞれ「デプスレイヤの”３ＤｏＦ＋”領域」及び「デプスレイヤの３ＤｏＦ領域」と呼ぶ。ファイル生成部１０５は、Track　referenceを用いて、テクスチャレイヤの”３ＤｏＦ＋”領域と３ＤｏＦ領域とを紐づける。また、ファイル生成部１０５は、Track　referenceを用いて、デプスレイヤの”３ＤｏＦ＋”領域と３ＤｏＦ領域とを紐づける。

　そして、ファイル生成部１０５は、図２３に示すように、テクスチャレイヤの”３ＤｏＦ＋”領域と３ＤｏＦ領域とをそれぞれの個別のトラック５０１及び５０３のMoovBoxに格納する。さらに、ファイル生成部１０５は、デプスレイヤの”３ＤｏＦ＋”領域と３ＤｏＦ領域とをそれぞれ個別のトラック５０２及び５０４のMoovBoxに格納する。図２３は、第３の実施形態に係るＩＳＯＢＭＦＦＦファイルの一例を表す図である。

　次に、ファイル生成部１０５は、各レイヤの分割情報を、他のトラックグループ５１０であるsub-picture　track　groupingに格納する。この場合、ファイル生成部１０５は、tile　base　track/tile　trackの仕組みにより、各レイヤの分割情報を格納してもよい。また、ファイル生成部１０５は、sub-picture　track　groupingには、元となるトラックであるベーストラックの一覧を登録する。例えば、トラック５０１及び５０３のテクスチャレイヤトラックをベーストラックとする場合、ファイル生成部１０５は、sub-picture　track　groupingにトラック５０１及び５０３のテクスチャレイヤトラックの情報を登録する。この場合、トラック５０１のテクスチャトラックにおけるSchemeTypeBoxのScheme_type=’podv’により、トラック５０１がテクスチャレイヤの３ＤｏＦ領域を格納したトラックであることが識別可能である。このScheme_type=’podv’によって表される３ＤｏＦ領域の情報であることを示す情報が「第１識別情報」の一例にあたる。また、このScheme_type=’povp’によって表される”３ＤｏＦ＋”領域の情報であることを示す情報が「第２識別情報」の一例にあたる。Scheme_type=’povp’は、アトラス処理部１０２により例えば、ポストデコーディング情報に含まれるようにアトラス処理部１０２により生成される。

　クライアント装置２のファイル処理部２０２は、”３ＤｏＦ＋”ストリームのデコード及びレンダリングが可能な場合、sub-picture　track　groupingを参照して、各レイヤの分割情報を取得し対応するトラックを特定する。そして、ファイル処理部２０２は、”３ＤｏＦ＋”領域及び３ＤｏＦ領域のテクスチャレイヤトラック及びデプスレイヤトラックを用いて”３ＤｏＦ＋”映像の再生を行う。

　一方、”３ＤｏＦ＋”ストリームのデコードに対応していない場合、ファイル処理部２０２は、トラック５０１のテクスチャトラックにおけるSchemeTypeBoxのScheme_type=’podv’を確認して、トラック５０１がテクスチャレイヤの３ＤｏＦ領域を格納したトラックと確認する。そして、ファイル処理部２０２は、トラック５０１の３ＤｏＦ領域のテクスチャレイヤトラックに格納された３ＤｏＦ領域及び３ＤｏＦ領域のポストデコーディング情報を用いて３ＤｏＦ映像の再生を行う。

　ここで、本実施例ではデプスレイヤも”３ＤｏＦ＋”領域及び３ＤｏＦ領域に分けたが、ファイル生成部１０５は、デプスレイヤを領域毎に分割せずに１トラックにまとめてもよい。

　他にも、ファイル生成部１０５は、デプスレイヤの”３ＤｏＦ＋”領域及び３ＤｏＦ領域とテクスチャレイヤの”３ＤｏＦ＋”領域とを１つのトラックにまとめてもよい。この場合、ファイル生成部１０５は、デプスレイヤの”３ＤｏＦ＋”領域及び３ＤｏＦ領域とテクスチャレイヤの”３ＤｏＦ＋”領域とをまとめたトラックに、テクスチャレイヤ用とデプスレイヤ用との２つのProjectionInfoBoxを格納する。

　さらに、ファイル生成部１０５は、”３ＤｏＦ＋”領域を、各視点位置を構成するパッチ群毎に分割して、個別にトラックに格納することもできる。この場合、ファイル生成部１０５は、各トラックにViewingSpaceBoxを格納し、トラックが格納するストリーム視聴時の視点の移動可能範囲を登録することも可能である。

　以上に説明したように、本実施例に係るファイル生成装置は、テクスチャレイヤの”３ＤｏＦ＋”領域と３ＤｏＦ領域とを分割してそれぞれ個別に１トラックに格納する。これにより、”３ＤｏＦ＋”ストリームのデコードには対応していないクライアント装置であっても、テクスチャレイヤの３ＤｏＦ領域を格納したトラックを使用して３ＤｏＦの全天球映像を再生することが可能となる。また、ＯＭＡＦ　ed.1で規定されるprofileを満たすことが可能となる。

［３．１　第３の実施形態の変形例（１）］
　本変形例に係る配信システムでは、sub-picture　track　groupingに各トラックに格納されたストリームがテクスチャレイヤの３ＤｏＦ領域か否かを表す情報することが第２の実施形態と異なる。以下に、本変形例に係るファイル生成装置１について説明する。

　図２４は、第３の実施形態の変形例（１）に係るsub-picture　track　groupingのシンタックスの一例を示す図である。ファイル生成部１０５は、図２４に示すように、sub-picture　track　groupingにおいて、格納されたストリームがテクスチャレイヤの３ＤｏＦ領域であることを表すThreeDoFCompatibleBox()を格納する。ThreeDoFCompatibleBox()は空であり、このThreeDoFCompatibleBox()が存在するトラックが格納するストリームがテクスチャレイヤの３ＤｏＦ領域であることを表す。

　ここで、本変形例では、ThreeDoFCompatibleBox()を用いてトラックが格納するストリームがテクスチャレイヤの３ＤｏＦ領域であることを表したが、ファイル生成部１０５は、新規フィールドを定義して、そのフィールドに同様の情報を格納してもよい。

［３．２　第３の実施形態の変形例（２）］
　さらに、第３の実施形態及びその変形例（１）では、符号化部１０３は、マルチレイヤＨＥＶＣを用いて符号化を行ったが、ＨＥＶＣ／ＡＶＣ（Advanced　Video　Coding）を用いてテクスチャレイヤ及びデプスレイヤを符号化することも可能である。これは、第２の実施形態及びその変形例についても同様である。この場合、各ストリームに対する”３ＤｏＦ＋”メタデータをtimed　metadataとして表し、個別のtrackに格納し、テクスチャレイヤ及びデプスレイヤを格納するトラックにtrack　referenceによって紐づける。

　ファイル生成部１０５は、テクスチャレイヤ及びデプスレイヤの識別情報、アトラスを構成するレイヤペアの関連付け情報を、ＩＳＯＢＭＦＦ／Elementary　Stream（ＳＥＩ）を拡張して格納する。これにより、Ｌ－ＨＥＶＣ　storageにおいてoinf/oref/sbasにより格納されていた情報が、ＨＥＶＣ／ＡＶＣに適用可能となる。ファイル生成部１０５は、その他の情報については、ＨＥＶＣ／ＡＶＣにおいてもＬ－ＨＥＶＣ　storageと同様に格納可能である。

　以上に説明したように、ＨＥＶＣ／ＡＶＣを用いることで、一般的に市場で流通するデコーダを利用することが可能となる。また、”３ＤｏＦ＋”ストリームのデコードに対応していないクライアント装置であっても、テクスチャレイヤトラックのデコード及びレンダリングを行うことができる。

［４．第４の実施形態］
　以上に説明した各実施形態及びそれらの各変形例では、ビットストリームを格納するフォーマットとしてＩＳＯＢＭＦＦを用いたが、これ以外のフォーマットを用いることも可能である。

　例えば、ファイル生成部１０５は、図２５に示すフォーマットを有するMatroska　Media　Containerを用いることも可能である。図２５は、Matroska　Media　Containerのフォーマットを表す図である。この場合、ファイル生成部１０５は、テクスチャレイヤ及びデプスレイヤの識別情報及びアトラスＩＤとレイヤペアとを紐づける情報を、Trak　Entry　elementの下の新たに定義したelementとして格納する。さらに、ファイル生成部１０５は、ＩＳＯＢＭＦＦファイルにおいてProjectionInfoBox()に格納されるポストデコーディング情報も、Trak　Entry　elementの下の新たに定義したelementとして格納する。

　このように、ＩＳＯＢＭＦＦ以外のフォーマットを用いてもセグメントファイルを生成することが可能であり、その場合でも、各実施形態及びそれらの各変形例と同様の効果を得ることが可能である。

　以上、本開示の実施形態について説明したが、本開示の技術的範囲は、上述の実施形態そのままに限定されるものではなく、本開示の要旨を逸脱しない範囲において種々の変更が可能である。また、異なる実施形態及び変形例にわたる構成要素を適宜組み合わせてもよい。

　なお、本明細書に記載された効果はあくまで例示であって限定されるものではなく、また他の効果があってもよい。

　なお、本技術は以下のような構成を取ることもできる。

（１）３次元データを所定の視点位置から複数の投影方向に投影して形成される各前記投影方向に対応する基準２次元画像及び前記所定の視点位置から限定範囲内で移動させた視点位置に基づく移動２次元画像を前記基準２次元画像から生成するための補完画像を形成するテクスチャ画像と、前記テクスチャ画像に対応するデプス画像とを対応付けるアトラス識別情報、並びに、前記テクスチャ画像における前記補完画像が格納される”３ＤｏＦ＋”領域の情報であることを示す第１ポストデコーディング情報を含む、各前記基準２次元画像及び各前記移動２次元画像をレンダリングするためのそれぞれのポストデコーディング情報を生成するアトラス処理部と、
　テクスチャ画像及びデプス画像を符号化してテクスチャレイヤ及びデプスレイヤを生成する符号化部と、
　前記テクスチャレイヤ、前記デプスレイヤ、前記アトラス識別情報及び前記ポストデコーディング情報を含むファイルを生成するファイル生成部と
　を備えた情報処理装置。
（２）前記ファイル生成部は、前記アトラス識別情報を、ＩＳＯＢＭＦＦファイルにおけるMoovのsgpd’oinf’に格納する付記（１）に記載の情報処理装置。
（３）前記ファイル生成部は、前記テクスチャレイヤ及び前記デプスレイヤにＩＳＯＢＭＦＦファイルのトラックを割り当て、前記テクスチャレイヤ及び前記デプスレイヤに割り当てた前記トラックにおける第１のBoxに前記第１ポストデコーディング情報を格納する付記（１）又は（２）に記載の情報処理装置。
（４）前記アトラス処理部は、前記テクスチャ画像における前記基準２次元画像が格納される３ＤｏＦ領域の情報を含む第２ポストデコーディング情報を前記ポストデコーディング情報に含ませる付記（３）に記載の情報処理装置。
（５）前記アトラス処理部は、前記第２ポストデコーディング情報に前記３ＤｏＦ領域の情報であることを示す情報を含ませる付記（４）に記載の情報処理装置。
（６）前記ファイル生成部は、前記第２ポストデコーディング情報を、前記ＩＳＯＢＭＦＦファイルにおける前記第１のBoxが割り当てられた前記トラックにおける前記第１のBoxとは異なる第２のBoxに格納する付記（３）に記載の情報処理装置。
（７）前記ファイル生成部は、前記テクスチャレイヤと前記デプスレイヤとをそれぞれＩＳＯＢＭＦＦファイルの異なるトラックに割り当て、且つ、各前記トラックはTrack　referenceで紐づけられる付記（１）又は（２）に記載の情報処理装置。
（８）前記アトラス処理部は、前記テクスチャ画像における前記基準２次元画像が格納される３ＤｏＦ領域の情報が前記レンダリングの対象に含まれるか否かを示す第１識別情報を前記ポストデコーディング情報に含ませる付記（７）に記載の情報処理装置。
（９）前記ファイル生成部は、前記第１識別情報を前記テクスチャレイヤが割り当てられた前記トラックにおけるScheme　Type　Boxに格納する付記（８）に記載の情報処理装置。
（１０）前記アトラス処理部は、前記”３ＤｏＦ＋”領域の情報が前記レンダリングの対象に含まれるか否かを示す第２識別情報を前記ポストデコーディング情報に含ませる付記（７）に記載の情報処理装置。
（１１）前記ファイル生成部は、前記第２識別情報を前記テクスチャレイヤが割り当てられた前記トラックにおけるCompatible　Scheme　Type　Boxに格納する付記（１０）に記載の情報処理装置。
（１２）前記ファイル生成部は、前記テクスチャ画像における前記基準２次元画像が格納される３ＤｏＦ領域と、前記”３ＤｏＦ＋”領域と、前記３ＤｏＦ領域に対応する前記デプス画像の第１領域と、前記”３ＤｏＦ＋”領域に対応する前記デプス画像の第２領域とのそれぞれに、ＩＳＯＢＭＦＦファイルにおける異なるトラックを割り当て、前記３ＤｏＦ領域と前記”３ＤｏＦ＋”領域とが割り当てられた各前記トラックそれぞれ、及び、前記第１領域と前記第２領域とが割り当てられた各前記トラックそれぞれに、”３ＤｏＦ＋”メタデータを格納するトラックをTrack　referenceで紐付ける付記（１）又は（２）に記載の情報処理装置。
（１３）前記アトラス処理部は、前記レンダリングの対象が前記３ＤｏＦ領域の情報であることを表す第１識別情報を前記ポストデコーディング情報に含ませる付記（１２）に記載の情報処理装置。
（１４）前記ファイル生成部は、前記アトラス識別情報のうちの前記３ＤｏＦ領域に関する情報を前記テクスチャレイヤの前記３ＤｏＦ領域に割り当てられたトラックにおけるMoov　Boxに格納する付記（１３）に記載の情報処理装置。
（１５）前記ファイル生成部は、前記第１識別情報を前記テクスチャレイヤが割り当てられたトラックにおけるSchemeTypeBoxに格納する付記（１３）に記載の情報処理装置。
（１６）前記アトラス処理部は、前記レンダリングの対象が前記”３ＤｏＦ＋”領域の情報であることを表す第２識別情報を前記ポストデコーディング情報に含ませる付記（１２）に記載の情報処理装置。
（１７）前記ファイル生成部は、前記アトラス識別情報のうちの前記”３ＤｏＦ＋”領域に関する情報を前記テクスチャレイヤの前記”３ＤｏＦ＋”領域に割り当てられたトラックにおけるMoov　Boxに格納する付記（１６）に記載の情報処理装置。
（１８）前記ファイル生成部は、前記第２識別情報を前記テクスチャレイヤが割り当てられたトラックにおけるSchemeTypeBoxに格納する付記（１６）に記載の情報処理装置。
（１９）３次元データを所定の視点位置から複数の投影方向に投影した場合の前記投影方向に対応する基準２次元画像及び前記所定の視点位置から移動させた視点位置に基づく移動２次元画像を前記基準２次元画像から生成するための補正画像におけるテクスチャ画像とデプス画像との対応付けを表すアトラス識別情報、及び、前記テクスチャ画像における前記補正画像が格納される”３ＤｏＦ＋”領域の情報である第１ポストデコーディング情報を含む前記基準２次元画像及び前記移動２次元画像をレンダリングするためのポストデコーディング情報を生成し、
　テクスチャ画像及びデプス画像を符号化してテクスチャレイヤ及びデプスレイヤを生成し、
　前記テクスチャレイヤ、前記デプスレイヤ、前記アトラス識別情報及び前記テクスチャ画像における前記ポストデコーディング情報を含むファイルを生成する
　処理をコンピュータに実行させる情報処理方法。
（２０）３次元データを所定の視点位置から複数の投影方向に投影した場合の前記投影方向に対応する基準２次元画像及び前記所定の視点位置から移動させた視点位置に基づく移動２次元画像を前記基準２次元画像から生成するための補正画像におけるテクスチャ画像とデプス画像との対応付けを表すアトラス識別情報、及び、前記テクスチャ画像における前記補正画像が格納される”３ＤｏＦ＋”領域の情報である第１ポストデコーディング情報を含む前記基準２次元画像及び前記移動２次元画像をレンダリングするためのポストデコーディング情報、前記テクスチャ画像が符号化されたテクスチャレイヤ、並びに、前記デプス画像が符号化されたデプスレイヤを含むファイルを取得するファイル取得部と、
　前記ファイルから前記アトラス識別情報及び前記ポストデコーディング情報を取得し、取得した前記アトラス識別情報及び前記ポストデコーディング情報を基に、自装置の処理能力に応じた画像生成方法を決定するファイル処理部と、
　前記ファイル処理部により決定された前記画像生成方法に応じて前記テクスチャレイヤ及び前記デプスレイヤの双方又は前記テクスチャレイヤを復号化して前記テクスチャ画像及び前記デプス画像の双方又は前記テクスチャ画像を生成する復号処理部と、
　前記復号処理部により生成された画像を基に、前記画像生成方法にしたがって表示画像を生成する表示情報生成部と
　を備えた再生処理装置。
（２１）３次元データを所定の視点位置から複数の投影方向に投影した場合の前記投影方向に対応する基準２次元画像及び前記所定の視点位置から移動させた視点位置に基づく移動２次元画像を前記基準２次元画像から生成するための補正画像におけるテクスチャ画像とデプス画像との対応付けを表すアトラス識別情報、及び、前記テクスチャ画像における前記補正画像が格納される”３ＤｏＦ＋”領域の情報である第１ポストデコーディング情報を含む前記基準２次元画像及び前記移動２次元画像をレンダリングするためのポストデコーディング情報、前記テクスチャ画像が符号化されたテクスチャレイヤ、並びに、前記デプス画像が符号化されたデプスレイヤを含むファイルを取得し、
　前記ファイルから前記アトラス識別情報及び前記ポストデコーディング情報を取得し、取得した前記アトラス識別情報及び前記ポストデコーディング情報を基に、自装置の処理能力に応じた画像生成方法を決定し、
　決定した前記画像生成方法に応じて前記テクスチャレイヤ及び前記デプスレイヤの双方又は前記テクスチャレイヤを復号化して前記テクスチャ画像及び前記デプス画像の双方又は前記テクスチャ画像を生成し、
　生成した画像を基に、前記画像生成方法にしたがって表示画像を生成する
　処理をコンピュータに実行させる再生処理方法。

　１　ファイル生成装置
　２　クライアント装置
　３　Ｗｅｂサーバ
　４　ネットワーク
　１０　生成処理部
　１１　制御部
　２０　再生処理部
　２１　制御部
　１０１　データ入力部
　１０２　アトラス処理部
　１０３　符号化部
　１０４　ビットストリーム生成部
　１０５　ファイル生成部
　１０６　送信部
　２０１　ファイル取得部
　２０２　ファイル処理部
　２０３　復号処理部
　２０４　表示情報生成部
　２０５　表示部
　２２０　抽出部
　２３０　デコーダ
　２４１　アトラス分解部
　２４２　表示処理部

Claims

　３次元データを所定の視点位置から複数の投影方向に投影して形成される各前記投影方向に対応する基準２次元画像及び前記所定の視点位置から限定範囲内で移動させた視点位置に基づく移動２次元画像を前記基準２次元画像から生成するための補完画像を形成するテクスチャ画像と、前記テクスチャ画像に対応するデプス画像とを対応付けるアトラス識別情報、並びに、前記テクスチャ画像における前記補完画像が格納される”３ＤｏＦ＋”領域の情報であることを示す第１ポストデコーディング情報を含む、各前記基準２次元画像及び各前記移動２次元画像をレンダリングするためのそれぞれのポストデコーディング情報を生成するアトラス処理部と、
　テクスチャ画像及びデプス画像を符号化してテクスチャレイヤ及びデプスレイヤを生成する符号化部と、
　前記テクスチャレイヤ、前記デプスレイヤ、前記アトラス識別情報及び前記ポストデコーディング情報を含むファイルを生成するファイル生成部と
　を備えた情報処理装置。
　前記ファイル生成部は、前記アトラス識別情報を、ＩＳＯＢＭＦＦファイルにおけるMoovのsgpd’oinf’に格納する請求項１に記載の情報処理装置。
　前記ファイル生成部は、前記テクスチャレイヤ及び前記デプスレイヤにＩＳＯＢＭＦＦファイルのトラックを割り当て、前記テクスチャレイヤ及び前記デプスレイヤに割り当てた前記トラックにおける第１のBoxに前記第１ポストデコーディング情報を格納する請求項１に記載の情報処理装置。
　前記アトラス処理部は、前記テクスチャ画像における前記基準２次元画像が格納される３ＤｏＦ領域の情報を含む第２ポストデコーディング情報を前記ポストデコーディング情報に含ませる請求項３に記載の情報処理装置。
　前記アトラス処理部は、前記第２ポストデコーディング情報に前記３ＤｏＦ領域の情報であることを示す情報を含ませる請求項４に記載の情報処理装置。
　前記ファイル生成部は、前記第２ポストデコーディング情報を、前記ＩＳＯＢＭＦＦファイルにおける前記第１のBoxが割り当てられた前記トラックにおける前記第１のBoxとは異なる第２のBoxに格納する請求項３に記載の情報処理装置。
　前記ファイル生成部は、前記テクスチャレイヤと前記デプスレイヤとをそれぞれＩＳＯＢＭＦＦファイルの異なるトラックに割り当て、且つ、各前記トラックはTrack　referenceで紐づけられる請求項１に記載の情報処理装置。
　前記アトラス処理部は、前記テクスチャ画像における前記基準２次元画像が格納される３ＤｏＦ領域の情報が前記レンダリングの対象に含まれるか否かを示す第１識別情報を前記ポストデコーディング情報に含ませる請求項７に記載の情報処理装置。
　前記ファイル生成部は、前記第１識別情報を前記テクスチャレイヤが割り当てられた前記トラックにおけるScheme　Type　Boxに格納する請求項８に記載の情報処理装置。
　前記アトラス処理部は、前記”３ＤｏＦ＋”領域の情報が前記レンダリングの対象に含まれるか否かを示す第２識別情報を前記ポストデコーディング情報に含ませる請求項７に記載の情報処理装置。
　前記ファイル生成部は、前記第２識別情報を前記テクスチャレイヤが割り当てられた前記トラックにおけるCompatible　Scheme　Type　Boxに格納する請求項１０に記載の情報処理装置。
　前記ファイル生成部は、前記テクスチャ画像における前記基準２次元画像が格納される３ＤｏＦ領域と、前記”３ＤｏＦ＋”領域と、前記３ＤｏＦ領域に対応する前記デプス画像の第１領域と、前記”３ＤｏＦ＋”領域に対応する前記デプス画像の第２領域とのそれぞれに、ＩＳＯＢＭＦＦファイルにおける異なるトラックを割り当て、前記３ＤｏＦ領域と前記”３ＤｏＦ＋”領域とが割り当てられた各前記トラックそれぞれ、及び、前記第１領域と前記第２領域とが割り当てられた各前記トラックそれぞれに、”３ＤｏＦ＋”メタデータを格納するトラックをTrack　referenceで紐付ける請求項１に記載の情報処理装置。
　前記アトラス処理部は、前記レンダリングの対象が前記３ＤｏＦ領域の情報であることを表す第１識別情報を前記ポストデコーディング情報に含ませる請求項１２に記載の情報処理装置。
　前記ファイル生成部は、前記アトラス識別情報のうちの前記３ＤｏＦ領域に関する情報を前記テクスチャレイヤの前記３ＤｏＦ領域に割り当てられたトラックにおけるMoov　Boxに格納する請求項１３に記載の情報処理装置。
　前記ファイル生成部は、前記第１識別情報を前記テクスチャレイヤが割り当てられたトラックにおけるSchemeTypeBoxに格納する請求項１３に記載の情報処理装置。
　前記アトラス処理部は、前記レンダリングの対象が前記”３ＤｏＦ＋”領域の情報であることを表す第２識別情報を前記ポストデコーディング情報に含ませる請求項１２に記載の情報処理装置。
　前記ファイル生成部は、前記アトラス識別情報のうちの前記”３ＤｏＦ＋”領域に関する情報を前記テクスチャレイヤの前記”３ＤｏＦ＋”領域に割り当てられたトラックにおけるMoov　Boxに格納する請求項１６に記載の情報処理装置。
　前記ファイル生成部は、前記第２識別情報を前記テクスチャレイヤが割り当てられたトラックにおけるSchemeTypeBoxに格納する請求項１６に記載の情報処理装置。
　３次元データを所定の視点位置から複数の投影方向に投影した場合の前記投影方向に対応する基準２次元画像及び前記所定の視点位置から移動させた視点位置に基づく移動２次元画像を前記基準２次元画像から生成するための補正画像におけるテクスチャ画像とデプス画像との対応付けを表すアトラス識別情報、及び、前記テクスチャ画像における前記補正画像が格納される”３ＤｏＦ＋”領域の情報である第１ポストデコーディング情報を含む前記基準２次元画像及び前記移動２次元画像をレンダリングするためのポストデコーディング情報を生成し、
　テクスチャ画像及びデプス画像を符号化してテクスチャレイヤ及びデプスレイヤを生成し、
　前記テクスチャレイヤ、前記デプスレイヤ、前記アトラス識別情報及び前記テクスチャ画像における前記ポストデコーディング情報を含むファイルを生成する
　処理をコンピュータに実行させる情報処理方法。
　３次元データを所定の視点位置から複数の投影方向に投影した場合の前記投影方向に対応する基準２次元画像及び前記所定の視点位置から移動させた視点位置に基づく移動２次元画像を前記基準２次元画像から生成するための補正画像におけるテクスチャ画像とデプス画像との対応付けを表すアトラス識別情報、及び、前記テクスチャ画像における前記補正画像が格納される”３ＤｏＦ＋”領域の情報である第１ポストデコーディング情報を含む前記基準２次元画像及び前記移動２次元画像をレンダリングするためのポストデコーディング情報、前記テクスチャ画像が符号化されたテクスチャレイヤ、並びに、前記デプス画像が符号化されたデプスレイヤを含むファイルを取得するファイル取得部と、
　前記ファイルから前記アトラス識別情報及び前記ポストデコーディング情報を取得し、取得した前記アトラス識別情報及び前記ポストデコーディング情報を基に、自装置の処理能力に応じた画像生成方法を決定するファイル処理部と、
　前記ファイル処理部により決定された前記画像生成方法に応じて前記テクスチャレイヤ及び前記デプスレイヤの双方又は前記テクスチャレイヤを復号化して前記テクスチャ画像及び前記デプス画像の双方又は前記テクスチャ画像を生成する復号処理部と、
　前記復号処理部により生成された画像を基に、前記画像生成方法にしたがって表示画像を生成する表示情報生成部と
　を備えた再生処理装置。
　３次元データを所定の視点位置から複数の投影方向に投影した場合の前記投影方向に対応する基準２次元画像及び前記所定の視点位置から移動させた視点位置に基づく移動２次元画像を前記基準２次元画像から生成するための補正画像におけるテクスチャ画像とデプス画像との対応付けを表すアトラス識別情報、及び、前記テクスチャ画像における前記補正画像が格納される”３ＤｏＦ＋”領域の情報である第１ポストデコーディング情報を含む前記基準２次元画像及び前記移動２次元画像をレンダリングするためのポストデコーディング情報、前記テクスチャ画像が符号化されたテクスチャレイヤ、並びに、前記デプス画像が符号化されたデプスレイヤを含むファイルを取得し、
　前記ファイルから前記アトラス識別情報及び前記ポストデコーディング情報を取得し、取得した前記アトラス識別情報及び前記ポストデコーディング情報を基に、自装置の処理能力に応じた画像生成方法を決定し、
　決定した前記画像生成方法に応じて前記テクスチャレイヤ及び前記デプスレイヤの双方又は前記テクスチャレイヤを復号化して前記テクスチャ画像及び前記デプス画像の双方又は前記テクスチャ画像を生成し、
　生成した画像を基に、前記画像生成方法にしたがって表示画像を生成する
　処理をコンピュータに実行させる再生処理方法。