WO2015053287A1

WO2015053287A1 - 画像復号装置、画像符号化装置、および、符号化データ変換装置

Info

Publication number: WO2015053287A1
Application number: PCT/JP2014/076853
Authority: WO
Inventors: 山本　智幸; 知宏猪飼; 健史筑波
Original assignee: シャープ株式会社
Priority date: 2013-10-08
Filing date: 2014-10-07
Publication date: 2015-04-16
Also published as: EP3057327A1; CN105580370A; JPWO2015053287A1; EP3057327A4; US10225567B2; JP6363088B2; US20160255354A1; HK1223471A1

Abstract

　対象レイヤである上位レイヤの画素に対応する参照レイヤの画素の位置を正確に導出するための情報を階層符号化データに含めることで、予測画像の正確さを向上して階層符号化データの符号量を低減する。　階層動画像復号装置（１）は、パラメータセットを復号するパラメータセット復号部（１２）と、参照レイヤピクチャの復号画素を参照して、レイヤ間予測により予測画像を生成する予測画像生成部（１４）を備えている。　パラメータセット復号部（１２）は、対象レイヤ画素と該対象レイヤ画素に対応する参照レイヤピクチャ上の位置に係る情報であるレイヤ間位相対応情報を復号する。予測画像生成部（１４）は、前記レイヤ間位相対応情報に基づいて予測画像を生成する。

Description

画像復号装置、画像符号化装置、および、符号化データ変換装置

　本発明は、画像が階層的に符号化された階層符号化データを復号する画像復号装置、画像を階層的に符号化することによって階層符号化データを生成する画像符号化装置、および、階層符号化データを変換する符号化データ変換装置に関する。

　通信システムで伝送される情報、あるいは蓄積装置に記録される情報の１つに画像あるいは動画像がある。従来、これらの画像（以降、動画像を含む）の伝送・蓄積のため、画像を符号化する技術が知られている。

　動画像符号化方式としては、AVC（H.264/MPEG-4 Advanced Video Coding）や、その後継コーデックであるHEVC（High-Efficiency Video Coding）が知られている（非特許文献１）。

　これらの動画像符号化方式では、通常、入力画像を符号化／復号することによって得られる局所復号画像に基づいて予測画像が生成され、当該予測画像を入力画像（原画像）から減算して得られる予測残差（「差分画像」または「残差画像」と呼ぶこともある）が符号化される。また、予測画像の生成方法としては、画面間予測（インター予測）、および、画面内予測（イントラ予測）が挙げられる。

　イントラ予測では、同一ピクチャ内の局所復号画像に基づいて、当該ピクチャにおける予測画像が順次生成される。

　インター予測では、ピクチャ間の動き補償により予測画像が生成される。インター予測で予測画像生成に用いられる復号済のピクチャは参照ピクチャと呼ばれる。

　また、複数の相互に関連性のある動画像をレイヤ（階層）に分けて符号化することで、複数の動画像から符号化データを生成する技術も知られており、階層符号化技術と呼ばれる。階層符号化技術により生成される符号化データは階層符号化データとも呼ばれる。

　代表的な階層符号化技術としてHEVCを基礎とするSHVC（Scalable HEVC）が知られている（非特許文献２）。

　SHVCでは、空間スケーラビリティ、時間スケーラビリティ、SNRスケーラビリティをサポートする。例えば空間スケーラビリティの場合、複数の異なる解像度の動画像をレイヤに分けて符号化して階層符号化データを生成する。例えば、原画像から所望の解像度にダウンサンプリングした画像を下位レイヤとして符号化する。次に原画像をレイヤ間の冗長性を除去するためにレイヤ間予測を適用した上で、上位レイヤとして符号化する。

　別の代表的な階層符号化技術としてHEVCを基礎とするMV-HEVC（Multi View HEVC）が知られている（非特許文献３）。

　MV-HEVCではビュースケーラビリティをサポートする。ビュースケーラビリティでは、複数の異なる視点（ビュー）に対応する動画像をレイヤに分けて符号化して階層符号化データを生成する。例えば、基本となる視点（ベースビュー）に対応する動画像を下位レイヤとして符号化する。次に、異なる視点に対応する動画像を、レイヤ間予測を適用した上で、上位レイヤとして符号化する。

　SHVCやMV-HEVCにおけるレイヤ間予測には、レイヤ間画像予測とレイヤ間動き予測がある。レイヤ間画像予測では、下位レイヤの復号画像を利用して、予測画像を生成する。レイヤ間動き予測では、下位レイヤの動き情報を利用して、動き情報の予測値を導出する。レイヤ間予測において予測に用いられるピクチャはレイヤ間参照ピクチャと呼ばれる。また、レイヤ間参照ピクチャを含むレイヤは参照レイヤと呼ばれる。なお、以下では、インター予測に用いられる参照ピクチャと、レイヤ間予測に用いられる参照ピクチャを総称して単に参照ピクチャと呼称する。

　SHVCやMV-HEVCでは、予測画像の生成に、インター予測、イントラ予測、レイヤ間画像予測のいずれかを利用できる。

　SHVCやMV-HEVCを利用するアプリケーションの一つに、注目領域を考慮した映像アプリケーションがある。例えば、映像再生端末において、通常は全領域の映像を比較的低解像度で再生する。映像再生端末の視聴者が表示されている映像の一部を注目領域として指定した場合、当該注目領域が高解像度で再生端末に表示される。

　前記のような注目領域を考慮した映像アプリケーションは、全領域の比較的低解像度の映像を下位レイヤの符号化データとして、注目領域の高解像度映像を上位レイヤの符号化データとして符号化した階層符号化データを用いて実現できる。すなわち、全領域を再生する場合は下位レイヤの符号化データのみを復号して再生し、注目領域の高解像度映像を再生する場合は、上位レイヤの符号化データを前記下位レイヤの符号化データに追加して伝送することで、低解像度映像に対する符号化データと高解像度映像に対する符号化データを両方送る場合に較べて少ない伝送帯域で前記アプリケーションが実現できる。

「Recommendation H.265 (04/13)」, ITU-T (２０１３年６月７日公開) JCT3V-E1004_v6 「MV-HEVC Draft Text 5」, Joint CollaborativeTeam on 3D Video Coding Extension Development of ITU-T SG 16 WP 3 and ISO/IEC JTC 1/SC 29/WG 115th Meeting: Vienna, AT, 27 Jul. -2 Aug. 2013 (２０１３年８月７日公開) JCTVC-N1008_v1 「SHVC Draft 3」, Joint Collaborative Team onVideo Coding (JCT-VC) of ITU-T SG 16 WP 3 and ISO/IEC JTC 1/SC 29/WG 11 14th Meeting: Vienna, AT, 25 July - 2 Aug. 2013 （２０１３年８月２０日公開）

　しかしながら、注目領域に係らず全領域の高解像度映像に相当する上位レイヤの符号化データを伝送する場合、下位レイヤのみの符号化データを伝送する場合に較べて符号量が大きく増大するという課題があった。

　また、注目領域のみを含むような上位レイヤの符号化データを生成する場合、生成に要する処理量が多いという課題があった。例えば、ユーザ毎に異なる注目領域が指定される場合、ユーザ毎に異なる上位レイヤの符号化データを生成する必要があるが、そのような上位レイヤの符号化データの生成に要する処理量が大きい場合、多数のユーザに対して注目領域に相当する上位レイヤの符号化データを生成して送信することが困難であるという課題があった。

　また、注目領域のみを含む上位レイヤの符号化データを生成する場合であって、上位レイヤのピクチャサイズを注目領域に合わせて変更する場合、上位レイヤの画素と下位レイヤの画素の位置関係が変化し、その結果、下位レイヤの画素値に基づく上位レイヤの画素値を予測する場合の予測の正確さが低下するという課題があった。

　本発明は、上記問題に鑑みてされたものであり、その目的は、階層符号化方式において、全領域に相当する上位レイヤの符号化データと注目領域に相当する上位レイヤの符号化データのいずれも符号化／復号可能な画像符号化装置および画像復号装置を実現することにある。

　加えて、本発明の目的は、注目領域のみを含む上位レイヤの符号化データであって、上位レイヤの画素と下位レイヤの画素の位置関係が正しく関連付けられている符号化データを符号化／復号可能な画像符号化装置および画像復号装置を実現することにある。

　加えて、本発明の目的は、全領域に相当する上位レイヤの符号化データから注目領域に相当する上位レイヤの符号化データを、復号画像を生成することなく生成可能な符号化データのデータ構造、および、前記上位レイヤの符号化データから前記注目領域に相当する上位レイヤの符号化データを生成する符号化データ変換装置を実現することにある。

　上記課題を解決するために、本発明に係る画像復号装置は、階層符号化された符号化データに含まれる上位レイヤの符号化データを復号し、対象レイヤである上位レイヤの復号ピクチャを復元する画像復号装置であって、パラメータセットを復号するパラメータセット復号部と、参照レイヤピクチャの復号画素を参照して、レイヤ間予測により予測画像を生成する予測画像生成部を備え、前記パラメータセット復号部は、対象レイヤ画素と該対象レイヤ画素に対応する参照レイヤピクチャ上の位置に係る情報であるレイヤ間位相対応情報を復号することを特徴とする。

　上記課題を解決するために、本発明に係る画像符号化装置は、入力画像から上位レイヤの符号化データを生成する画像符号化装置であって、パラメータセットを復号するパラメータセット復号部と、参照レイヤピクチャの復号画素を参照して、レイヤ間予測により予測画像を生成する予測画像符号化部を備え、前記パラメータセット復号部は、対象レイヤ画素と該対象レイヤ画素に対応する参照レイヤピクチャ上の位置に係る情報であるレイヤ間位相対応情報を符号化し、前記予測画像符号化部は、レイヤ間予測実行時に、前記レイヤ間位相対応情報に基づいて、予測対象画素に対応する参照レイヤ位置を導出する対応参照位置導出処理を実行することを特徴とする。

　上記課題を解決するために、本発明に係る階層符号化データ変換装置は、入力される階層符号化データを入力される注目領域情報に基づいて変換し、変換後の階層符号化データを出力する階層符号化データ変換装置であって、入力の階層符号化データから修正前パラメータセットを復号するパラメータセット復号部と、入力の注目領域情報に基づいて修正前パラメータセットを修正して修正後パラメータセットを生成するパラメータセット修正部と、タイル情報と前記注目領域情報に基づいて出力階層符号化データに含める符号化レイヤＮＡＬを選択するＮＡＬ選択部を備え、前記ＮＡＬ選択部は、前記注目領域情報の示す注目領域と少なくとも一部の領域が重複するタイルを抽出対象タイルとし、該抽出対象タイルに含まれるスライスに対応するビデオ符号化レイヤＮＡＬを変換後の階層符号化データに含めるビデオ符号化レイヤＮＡＬとして選択し、前記パラメータセット修正部は、前記抽出対象タイルに基づいて、パラメータセットに含まれるピクチャサイズとタイル情報を修正することを特徴とする。

　本発明に係る画像復号装置は、階層符号化された符号化データに含まれる上位レイヤの符号化データを復号し、対象レイヤである上位レイヤの復号ピクチャを復元する画像復号装置であって、パラメータセットを復号するパラメータセット復号部と、参照レイヤピクチャの復号画素を参照して、レイヤ間予測により予測画像を生成する予測画像生成部を備えており、前記パラメータセット復号部は、対象レイヤ画素と該対象レイヤ画素に対応する参照レイヤピクチャ上の位置に係る情報であるレイヤ間位相対応情報を復号する。

　したがって、本発明に係る画像復号装置は、前記レイヤ間位相対応情報を用いて、予測対象画素に対応する参照レイヤピクチャ上の正確な位置を導出できるため、補間処理により生成される予測画素の正確さが向上する。そのため、従来より少ない符号量の符号化データを復号して、上位レイヤの復号ピクチャを出力できる。

対応参照位置導出処理のフロー図である。本発明の実施形態に係る階層符号化データのレイヤ構造を説明するための図であって、（ａ）は、階層動画像符号化装置側について示しており、（ｂ）は、階層動画像復号装置側について示している。本発明の実施形態に係る階層符号化データの構成を説明するための図であって、（ａ）は、シーケンスＳＥＱを規定するシーケンスレイヤを示しており、（ｂ）は、ピクチャＰＩＣＴを規定するピクチャレイヤを示しており、（ｃ）は、スライスＳを規定するスライスレイヤを示しており、（ｄ）は、符号化ツリーユニットＣＴＵを規定するＣＴＵレイヤを示しており、（ｅ）は、符号化ツリーユニットＣＴＵに含まれる符号化単位（Coding Unit；ＣＵ）を規定するＣＵレイヤを示している。本発明の実施形態に係る階層符号化データにおけるピクチャとタイル・スライスの関係を説明する図であり、（ａ）はピクチャをタイル・スライスにより分割する場合の分割領域を例示しており、（ｂ）は符号化データの構成におけるタイルとスライスの関係を例示している。本実施形態に係る、階層動画像復号装置、階層動画像符号化装置、および、符号化データ変換装置を組み合わせて実現する階層動画像の伝送と再生を行うシステムを例示する図である。上記階層動画像復号装置の概略的構成を示す機能ブロック図である。上記階層動画像復号装置に含まれるベース復号部の構成を例示する機能ブロック図である。 SPS復号時に参照されるシンタックス表の一部であって、ピクチャ情報に係る部分である。 SPS復号時に参照されるシンタックス表の一部であって、表示領域情報に係る部分である。ピクチャ内の部分領域である表示領域と表示領域位置情報の関係を例示する図である。 SPS復号時に参照されるシンタックス表の一部であって、レイヤ間画素対応情報に係る部分である。対象レイヤのピクチャ、参照レイヤのピクチャ、および、レイヤ間画素対応オフセットの関係を例示する図であり、（ａ）は、参照レイヤのピクチャ全体が対象レイヤのピクチャの一部に対応する場合の例を示し、（ｂ）は、参照レイヤのピクチャの一部が対象レイヤのピクチャ全体に対応する場合の例を示す。 SPS復号時に参照されるシンタックス表の一部であって、レイヤ間位相対応情報に係る部分である。対象レイヤ画素と参照レイヤ画素の対応と位相差の関係を例示する図である。 SPS復号時に参照されるシンタックス表の一部であって、レイヤ間位相対応情報に係る部分の別の例である。 PPSの復号時に参照されるシンタックス表の一部であって、タイル情報に係る部分である。ピクチャをタイル分割した場合のタイル行とタイル列を例示した図である。上記階層動画像復号装置に含まれるスライス復号部の構成を例示する機能ブロック図である。スライスヘッダ復号時に参照されるシンタックス表の一部であって、スライス位置情報に係る部分である。参照レイヤクロップオフセットを用いて位相オフセットを計算する場合の計算に用いる点や量の水平成分の関係を例示する図である。本発明の一実施形態に係る階層動画像符号化装置の概略的構成を示す機能ブロック図である。上記階層動画像符号化装置に含まれるスライス符号化部の構成を例示する機能ブロック図である。本発明の一実施形態に係る階層符号化データ変換装置の概略的構成を示した機能ブロック図である。変換前後の階層符号化データにおけるピクチャ、注目領域、および、タイルの関係を例示した図である。上記階層動画像復号装置、階層動画像符号化装置、及び、階層符号化データ変換装置の組み合わせにより実現する注目領域表示システムの構成を示したブロック図である。上記階層動画像符号化装置を搭載した送信装置、および、上記階層動画像復号装置を搭載した受信装置の構成を示した図である。（ａ）は、階層動画像符号化装置を搭載した送信装置を示しており、（ｂ）は、階層動画像復号装置を搭載した受信装置を示している。上記階層動画像符号化装置を搭載した記録装置、および、上記階層動画像復号装置を搭載した再生装置の構成を示した図である。（ａ）は、階層動画像符号化装置を搭載した記録装置を示しており、（ｂ）は、階層動画像復号装置を搭載した再生装置を示している。

　図１～図２７に基づいて、本発明の一実施形態に係る階層動画像復号装置１、階層動画像符号化装置２、および符号化データ変換装置３を説明すれば以下のとおりである。

　〔概要〕
　本実施の形態に係る階層動画像復号装置（画像復号装置）１は、階層動画像符号化装置（画像符号化装置）２によって階層符号化された符号化データを復号する。階層符号化とは、動画像を低品質のものから高品質のものにかけて階層的に符号化する符号化方式のことである。階層符号化は、例えば、SVCやSHVCにおいて標準化されている。なお、ここでいう動画像の品質とは、主観的および客観的な動画像の見栄えに影響する要素のことを広く意味する。動画像の品質には、例えば、“解像度”、“フレームレート”、“画質”、および、“画素の表現精度”が含まれる。よって、以下、動画像の品質が異なるといえば、例示的には、“解像度”等が異なることを指すが、これに限られない。例えば、異なる量子化ステップで量子化された動画像の場合（すなわち、異なる符号化雑音により符号化された動画像の場合）も互いに動画像の品質が異なるといえる。

　階層符号化技術は、階層化される情報の種類の観点から、（１）空間スケーラビリティ、（２）時間スケーラビリティ、（３）ＳＮＲ（Signal to Noise Ratio）スケーラビリティ、および（４）ビュースケーラビリティに分類されることもある。空間スケーラビリティとは、解像度や画像のサイズにおいて階層化する技術である。時間スケーラビリティとは、フレームレート（単位時間のフレーム数）において階層化する技術である。ＳＮＲスケーラビリティは、符号化雑音において階層化する技術である。また、ビュースケーラビリティは、各画像に対応付けられた視点位置において階層化する技術である。

　また、本実施形態に係る符号化データ変換装置３は、階層動画像符号化装置２によって階層符号化された符号化データを変換し、所定の注目領域に関する符号化データを（注目領域符号化データ）を生成する。注目領域符号化データは、本実施形態に係る階層動画像復号装置１で復号できる。

　本実施形態に係る階層動画像符号化装置２、階層動画像復号装置１、及び階層符号化データ変換装置３の詳細な説明に先立って、まず（１）階層動画像符号化装置２または階層符号化データ変換装置３によって生成され、階層動画像復号装置１によって復号される階層符号化データのレイヤ構造を説明し、次いで（２）各レイヤで採用できるデータ構造の具体例について説明を行う。

　〔階層符号化データのレイヤ構造〕
　ここで、図２を用いて、階層符号化データの符号化および復号について説明すると次のとおりである。図２は、動画像を、下位階層Ｌ３、中位階層Ｌ２、および上位階層Ｌ１の３階層により階層的に符号化／復号する場合について模式的に表す図である。つまり、図２（ａ）および（ｂ）に示す例では、３階層のうち、上位階層Ｌ１が最上位層となり、下位階層Ｌ３が最下位層となる。

　以下において、階層符号化データから復号され得る特定の品質に対応する復号画像は、特定の階層の復号画像（または、特定の階層に対応する復号画像）と称される（例えば、上位階層Ｌ１の復号画像ＰＯＵＴ＃Ａ）。

　図２（ａ）は、入力画像ＰＩＮ＃Ａ～ＰＩＮ＃Ｃをそれぞれ階層的に符号化して符号化データＤＡＴＡ＃Ａ～ＤＡＴＡ＃Ｃを生成する階層動画像符号化装置２＃Ａ～２＃Ｃを示している。図２（ｂ）は、階層的に符号化された符号化データＤＡＴＡ＃Ａ～ＤＡＴＡ＃Ｃをそれぞれ復号して復号画像ＰＯＵＴ＃Ａ～ＰＯＵＴ＃Ｃを生成する階層動画像復号装置１＃Ａ～１＃Ｃを示している。

　まず、図２（ａ）を用いて、符号化装置側について説明する。符号化装置側の入力となる入力画像ＰＩＮ＃Ａ、ＰＩＮ＃Ｂ、およびＰＩＮ＃Ｃは、原画は同じだが、画像の品質（解像度、フレームレート、および画質等）が異なる。画像の品質は、入力画像ＰＩＮ＃Ａ、ＰＩＮ＃Ｂ、およびＰＩＮ＃Ｃの順に低くなる。

　下位階層Ｌ３の階層動画像符号化装置２＃Ｃは、下位階層Ｌ３の入力画像ＰＩＮ＃Ｃを符号化して下位階層Ｌ３の符号化データＤＡＴＡ＃Ｃを生成する。下位階層Ｌ３の復号画像ＰＯＵＴ＃Ｃを復号するのに必要な基本情報が含まれる（図２において“Ｃ”にて示している）。下位階層Ｌ３は、最下層の階層であるため、下位階層Ｌ３の符号化データＤＡＴＡ＃Ｃは、基本符号化データとも称される。

　また、中位階層Ｌ２の階層動画像符号化装置２＃Ｂは、中位階層Ｌ２の入力画像ＰＩＮ＃Ｂを、下位階層の符号化データＤＡＴＡ＃Ｃを参照しながら符号化して中位階層Ｌ２の符号化データＤＡＴＡ＃Ｂを生成する。中位階層Ｌ２の符号化データＤＡＴＡ＃Ｂには、符号化データＤＡＴＡ＃Ｃに含まれる基本情報“Ｃ”に加えて、中位階層の復号画像ＰＯＵＴ＃Ｂを復号するのに必要な付加的情報（図２において“Ｂ”にて示している）が含まれる。

　また、上位階層Ｌ１の階層動画像符号化装置２＃Ａは、上位階層Ｌ１の入力画像ＰＩＮ＃Ａを、中位階層Ｌ２の符号化データＤＡＴＡ＃Ｂを参照しながら符号化して上位階層Ｌ１の符号化データＤＡＴＡ＃Ａを生成する。上位階層Ｌ１の符号化データＤＡＴＡ＃Ａには、下位階層Ｌ３の復号画像ＰＯＵＴ＃Ｃを復号するのに必要な基本情報“Ｃ”および中位階層Ｌ２の復号画像ＰＯＵＴ＃Ｂを復号するのに必要な付加的情報“Ｂ”に加えて、上位階層の復号画像ＰＯＵＴ＃Ａを復号するのに必要な付加的情報（図２において“Ａ”にて示している）が含まれる。

　このように上位階層Ｌ１の符号化データＤＡＴＡ＃Ａは、異なる複数の品質の復号画像に関する情報を含む。

　次に、図２（ｂ）を参照しながら復号装置側について説明する。復号装置側では、上位階層Ｌ１、中位階層Ｌ２、および下位階層Ｌ３それぞれの階層に応じた復号装置１＃Ａ、１＃Ｂ、および１＃Ｃが、符号化データＤＡＴＡ＃Ａ、ＤＡＴＡ＃Ｂ、およびＤＡＴＡ＃Ｃを復号して復号画像ＰＯＵＴ＃Ａ、ＰＯＵＴ＃Ｂ、およびＰＯＵＴ＃Ｃを出力する。

　なお、上位の階層符号化データの一部の情報を抽出して、より下位の特定の復号装置において、当該抽出した情報を復号することで特定の品質の動画像を再生することもできる。

　例えば、中位階層Ｌ２の階層復号装置１＃Ｂは、上位階層Ｌ１の階層符号化データＤＡＴＡ＃Ａから、復号画像ＰＯＵＴ＃Ｂを復号するのに必要な情報（すなわち、階層符号化データＤＡＴＡ＃Ａに含まれる“Ｂ”および“Ｃ”）を抽出して、復号画像ＰＯＵＴ＃Ｂを復号してもよい。言い換えれば、復号装置側では、上位階層Ｌ１の階層符号化データＤＡＴＡ＃Ａに含まれる情報に基づいて、復号画像ＰＯＵＴ＃Ａ、ＰＯＵＴ＃Ｂ、およびＰＯＵＴ＃Ｃを復号できる。

　なお、以上の３階層の階層符号化データに限られず、階層符号化データは、２階層で階層符号化されていてもよいし、３階層よりも多い階層数にて階層符号化されていてもよい。

　また、特定の階層の復号画像に関する符号化データの一部または全部を他の階層とは独立して符号化し、特定の階層の復号の際に、他の階層の情報を参照しなくても済むように階層符号化データを構成してもよい。例えば、図２（ａ）および（ｂ）を用いて上述した例では、復号画像ＰＯＵＴ＃Ｂの復号に“Ｃ”および“Ｂ”を参照すると説明したが、これに限られない。復号画像ＰＯＵＴ＃Ｂが“Ｂ”だけを用いて復号できるように階層符号化データを構成することも可能である。例えば、復号画像ＰＯＵＴ＃Ｂの復号に、“Ｂ”だけから構成される階層符号化データと、復号画像ＰＯＵＴ＃Ｃを入力とする階層動画像復号装置も構成できる。

　なお、ＳＮＲスケーラビリティを実現する場合、入力画像ＰＩＮ＃Ａ、ＰＩＮ＃Ｂ、およびＰＩＮ＃Ｃとして同一の原画を用いた上で、復号画像ＰＯＵＴ＃Ａ、ＰＯＵＴ＃Ｂ、およびＰＯＵＴ＃Ｃが異なる画質となるよう階層符号化データを生成することもできる。その場合、下位階層の階層動画像符号化装置が、上位階層の階層動画像符号化装置に較べて、より大きい量子化幅を用いて予測残差を量子化することで階層符号化データを生成する。

　本書では、説明の便宜上、次のとおり用語を定義する。以下の用語は、特に断りがなければ、下記の技術的事項のことを表わすのに用いる。

　上位レイヤ　：　ある階層よりも上位に位置する階層のことを、上位レイヤと称する。例えば、図２において、下位階層Ｌ３の上位レイヤは、中位階層Ｌ２および上位階層Ｌ１である。また、上位レイヤの復号画像とは、より品質の高い（例えば、解像度が高い、フレームレートが高い、画質が高い等）復号画像のことをいう。

　下位レイヤ　：　ある階層よりも下位に位置する階層のことを、下位レイヤと称する。例えば、図２において、上位階層Ｌ１の下位レイヤは、中位階層Ｌ２および下位階層Ｌ３である。また、下位レイヤの復号画像とは、より品質の低い復号画像のことをいう。

　対象レイヤ　：　復号または符号化の対象となっている階層のことをいう。なお、対象レイヤに対応する復号画像を対象レイヤピクチャと呼ぶ。また、対象レイヤピクチャを構成する画素を対象レイヤ画素と呼ぶ。

　参照レイヤ（reference layer）　：　対象レイヤに対応する復号画像を復号するのに参照される特定の下位レイヤのことを参照レイヤと称する。なお、参照レイヤに対応する復号画像を参照レイヤピクチャと呼ぶ。また、参照レイヤを構成する画素を参照レイヤ画素と呼ぶ。

　図２（ａ）および（ｂ）に示した例では、上位階層Ｌ１の参照レイヤは、中位階層Ｌ２および下位階層Ｌ３である。しかしながら、これに限られず、特定の上記レイヤの復号において、下位レイヤのすべてを参照しなくてもよいように階層符号化データを構成することもできる。例えば、上位階層Ｌ１の参照レイヤが、中位階層Ｌ２および下位階層Ｌ３のいずれか一方となるように階層符号化データを構成することも可能である。

　基本レイヤ（base layer；ベースレイヤ）　：　最下層に位置する階層のことを基本レイヤと称する。基本レイヤの復号画像は、符号化データから復号され得るもっとも低い品質の復号画像であり、基本復号画像と呼称される。別の言い方をすれば、基本復号画像は、最下層の階層に対応する復号画像のことである。基本復号画像の復号に必要な階層符号化データの部分符号化データは基本符号化データと呼称される。例えば、上位階層Ｌ１の階層符号化データＤＡＴＡ＃Ａに含まれる基本情報“Ｃ”が基本符号化データである。

　拡張レイヤ　：　基本レイヤの上位レイヤは、拡張レイヤと称される。

　レイヤ識別子　：　レイヤ識別子は、階層を識別するためのものであり、階層と１対１に対応する。階層符号化データには特定の階層の復号画像の復号に必要な部分符号化データを選択するために用いられる階層識別子が含まれる。特定のレイヤに対応するレイヤ識別子に関連付けられた階層符号化データの部分集合は、レイヤ表現とも呼称される。

　一般に、特定の階層の復号画像の復号には、当該階層のレイヤ表現、および／または、当該階層の下位レイヤに対応するレイヤ表現が用いられる。すなわち、対象レイヤの復号画像の復号においては、対象レイヤのレイヤ表現、および／または、対象レイヤの下位レイヤに含まれる１つ以上階層のレイヤ表現が用いられる。

　レイヤ間予測　：　レイヤ間予測とは、対象レイヤのレイヤ表現と異なる階層（参照レイヤ）のレイヤ表現に含まれるシンタックス要素値、シンタックス要素値より導出される値、および復号画像に基づいて、対象レイヤのシンタックス要素値や対象レイヤの復号に用いられる符号化パラメータ等を予測することである。動き予測に関する情報を参照レイヤの情報から予測するレイヤ間予測のことを動き情報予測と称することもある。また、下位レイヤの復号画像から予測するレイヤ間予測のことをレイヤ間画像予測（あるいはレイヤ間テクスチャ予測）と称することもある。なお、レイヤ間予測に用いられる階層は、例示的には、対象レイヤの下位レイヤである。また、参照レイヤを用いず対象レイヤ内で予測を行うことをレイヤ内予測と称することもある。

　なお、以上の用語は、飽くまで説明の便宜上のものであり、上記の技術的事項を別の用語にて表現してもかまわない。

　〔階層符号化データのデータ構造について〕
　以下、各階層の符号化データを生成する符号化方式として、HEVCおよびその拡張方式を用いる場合について例示する。しかしながら、これに限られず、各階層の符号化データを、MPEG-2や、H.264/AVCなどの符号化方式により生成してもよい。

　また、下位レイヤと上位レイヤとが異なる符号化方式によって符号化されていてもよい。また、各階層の符号化データは、互いに異なる伝送路を介して階層動画像復号装置１に供給されてもよいし、同一の伝送路を介して階層動画像復号装置１に供給されてもよい。

　例えば、超高精細映像（動画像、４Ｋ映像データ）を基本レイヤおよび１つの拡張レイヤによりスケーラブル符号化して伝送する場合、基本レイヤは、４Ｋ映像データをダウンスケーリングし、インタレース化した映像データをMPEG-2またはH.264/AVCにより符号化してテレビ放送網で伝送し、拡張レイヤは、４Ｋ映像（プログレッシブ）をHEVCにより符号化して、インターネットで伝送してもよい。

　（基本レイヤ）
　図３は、基本レイヤにおいて採用できる符号化データ（図２の例でいえば、階層符号化データＤＡＴＡ＃Ｃ）のデータ構造を例示する図である。階層符号化データＤＡＴＡ＃Ｃは、例示的に、シーケンス、およびシーケンスを構成する複数のピクチャを含む。

　階層符号化データＤＡＴＡ＃Ｃにおけるデータの階層構造を図３に示す。図３の（ａ）～（ｅ）は、それぞれ、シーケンスＳＥＱを規定するシーケンスレイヤ、ピクチャＰＩＣＴを規定するピクチャレイヤ、スライスＳを規定するスライスレイヤ、符号化ツリーユニット（Coding Tree Unit；ＣＴＵ）を規定するＣＴＵレイヤ、符号化ツリーユニットＣＴＵに含まれる符号化単位（Coding Unit；ＣＵ）を規定するＣＵレイヤを示す図である。

　　（シーケンスレイヤ）
　シーケンスレイヤでは、処理対象のシーケンスＳＥＱ（以下、対象シーケンスとも称する）を復号するために階層動画像復号装置１が参照するデータの集合が規定されている。シーケンスＳＥＱは、図３の（ａ）に示すように、ビデオパラメータセットＶＰＳ（Video Parameter Set）、シーケンスパラメータセットＳＰＳ（Sequence Parameter Set）、ピクチャパラメータセットＰＰＳ（Picture Parameter Set）、ピクチャＰＩＣＴ_１～ＰＩＣＴ_NP（ＮＰはシーケンスＳＥＱに含まれるピクチャの総数）、及び、付加拡張情報ＳＥＩ（Supplemental Enhancement Information）を含んでいる。

　ビデオパラメータセットＶＰＳでは、符号化データに含まれるレイヤ数、レイヤ間の依存関係が規定されている。

　シーケンスパラメータセットＳＰＳでは、対象シーケンスを復号するために階層動画像復号装置１が参照する符号化パラメータの集合が規定されている。ＳＰＳは符号化データ内に複数存在してもよい。その場合、対象シーケンス毎に復号に用いられるＳＰＳが複数の候補から選択される。特定シーケンスの復号に使用されるＳＰＳは、アクティブＳＰＳとも呼ばれる。以下では、特に断りがなければ、対象シーケンスに対するアクティブＳＰＳを意味する。

　ピクチャパラメータセットＰＰＳでは、対象シーケンス内の各ピクチャを復号するために階層動画像復号装置１が参照する符号化パラメータの集合が規定されている。なお、ＰＰＳは符号化データ内に複数存在してもよい。その場合、対象シーケンス内の各ピクチャから複数のＰＰＳの何れかを選択する。特定ピクチャの復号に使用されるＰＰＳはアクティブＰＰＳとも呼ばれる。以下では、特に断りがなければ、ＰＰＳは対象ピクチャに対するアクティブＰＰＳを意味する。

　なお、アクティブＳＰＳおよびアクティブＰＰＳは、レイヤ毎に異なるＳＰＳやＰＰＳに設定してもよい。

　　（ピクチャレイヤ）
　ピクチャレイヤでは、処理対象のピクチャＰＩＣＴ（以下、対象ピクチャとも称する）を復号するために階層動画像復号装置１が参照するデータの集合が規定されている。ピクチャＰＩＣＴは、図３の（ｂ）に示すように、スライスヘッダＳＨ₁～ＳＨ_NS、及び、スライスＳ₁～Ｓ_NSを含んでいる（ＮＳはピクチャＰＩＣＴに含まれるスライスの総数）。

　なお、以下、スライスヘッダＳＨ₁～ＳＨ_NSやスライスＳ₁～Ｓ_NSのそれぞれを区別する必要が無い場合、符号の添え字を省略して記述することがある。また、以下に説明する階層符号化データＤＡＴＡ＃Ｃに含まれるデータであって、添え字を付している他のデータも同様である。

　スライスヘッダＳＨ_kには、対応するスライスＳ_kの復号方法を決定するために階層動画像復号装置１が参照する符号化パラメータ群が含まれている。例えば、ＳＰＳを指定するＳＰＳ識別子（seq_parameter_set_id）や、ＰＰＳを指定するＰＰＳ識別子（pic_parameter_set_id）が含まれる。また、スライスタイプを指定するスライスタイプ指定情報（slice_type）は、スライスヘッダＳＨに含まれる符号化パラメータの一例である。

　スライスタイプ指定情報により指定可能なスライスタイプとしては、（１）符号化の際にイントラ予測のみを用いるＩスライス、（２）符号化の際に単方向予測、又は、イントラ予測を用いるＰスライス、（３）符号化の際に単方向予測、双方向予測、又は、イントラ予測を用いるＢスライスなどが挙げられる。

　　（スライスレイヤ）
　スライスレイヤでは、処理対象のスライスＳ（対象スライスとも称する）を復号するために階層動画像復号装置１が参照するデータの集合が規定されている。スライスＳは、図３の（ｃ）に示すように、符号化ツリーユニットＣＴＵ₁～ＣＴＵ_NC（ＮＣはスライスＳに含まれるＣＴＵの総数）を含んでいる。

　　（ＣＴＵレイヤ）
　ＣＴＵレイヤでは、処理対象の符号化ツリーユニットＣＴＵ（以下、対象ＣＴＵとも称する）を復号するために階層動画像復号装置１が参照するデータの集合が規定されている。なお、符号化ツリーユニットのことを符号化ツリーブロック（CTB: Coding Tree block）、または、最大符号化単位（LCU:Largest Cording Unit）と呼ぶこともある。

　符号化ツリーユニットＣＴＵは、ＣＴＵヘッダＣＴＵＨと、符号化単位情報ＣＵ_１～ＣＵ_ＮＬ（ＮＬはＣＴＵに含まれる符号化単位情報の総数）とを含む。ここで、まず、符号化ツリーユニットＣＴＵと、符号化単位情報ＣＵとの関係について説明すると次のとおりである。

　符号化ツリーユニットＣＴＵは、イントラ予測またはインター予測、および、変換の各処理ためのブロックサイズを特定するための単位に分割される。

　符号化ツリーユニットＣＴＵの上記単位は、再帰的な４分木分割により分割されている。この再帰的な４分木分割により得られる木構造のことを以下、符号化ツリー（coding tree）と称する。

　以下、符号化ツリーの末端のノードであるリーフ（leaf）に対応する単位を、符号化ノード（coding node）として参照する。また、符号化ノードは、符号化処理の基本的な単位となるため、以下、符号化ノードのことを、符号化単位（ＣＵ）とも称する。

　つまり、符号化単位情報（以下、ＣＵ情報と称する）ＣＵ_１～ＣＵ_ＮＬは、符号化ツリーユニットＣＴＵを再帰的に４分木分割して得られる各符号化ノード（符号化単位）に対応する情報である。

　また、符号化ツリーのルート（root）は、符号化ツリーユニットＣＴＵに対応付けられる。換言すれば、符号化ツリーユニットＣＴＵは、複数の符号化ノードを再帰的に含む４分木分割の木構造の最上位ノードに対応付けられる。

　なお、各符号化ノードのサイズは、当該符号化ノードの親ノードとなる符号化ノード（すなわち、当該符号化ノードの１階層上位のノード）のサイズの縦横とも半分である。

　また、符号化ツリーユニットＣＴＵのサイズ、および、各符号化ユニットのとり得るサイズは、シーケンスパラメータセットＳＰＳに含まれる、最小符号化ノードのサイズ指定情報、および最大符号化ノードと最小符号化ノードの階層深度の差分に依存する。例えば、最小符号化ノードのサイズが８×８画素であって、最大符号化ノードと最小符号化ノードの階層深度の差分が３である場合、符号化ツリーユニットＣＴＵのサイズが６４×６４画素であって、符号化ノードのサイズは、４種類のサイズ、すなわち、６４×６４画素、３２×３２画素、１６×１６画素、および、８×８画素の何れかをとり得る。

　　（ＣＴＵヘッダ）
　ＣＴＵヘッダＣＴＵＨには、対象ＣＴＵの復号方法を決定するために階層動画像復号装置１が参照する符号化パラメータが含まれる。具体的には、図３の（ｄ）に示すように、対象ＣＴＵの各ＣＵへの分割パターンを指定するＣＴＵ分割情報ＳＰ＿ＣＴＵ、および、量子化ステップの大きさを指定する量子化パラメータ差分Δｑｐ（qp_delta）が含まれる。

　ＣＴＵ分割情報ＳＰ＿ＣＴＵは、ＣＴＵを分割するための符号化ツリーを表す情報であり、具体的には、対象ＣＴＵに含まれる各ＣＵの形状、サイズ、および、対象ＣＴＵ内での位置を指定する情報である。

　なお、ＣＴＵ分割情報ＳＰ＿ＣＴＵは、ＣＵの形状やサイズを明示的に含んでいなくてもよい。例えばＣＴＵ分割情報ＳＰ＿ＣＴＵは、対象ＣＴＵ全体またはＣＴＵの部分領域を四分割するか否かを示すフラグの集合であってもよい。その場合、ＣＴＵの形状やサイズを併用することで各ＣＵの形状やサイズを特定できる。

　また、量子化パラメータ差分Δｑｐは、対象ＣＴＵにおける量子化パラメータｑｐと、当該対象ＣＴＵの直前に符号化されたＣＴＵにおける量子化パラメータｑｐ’との差分ｑｐ－ｑｐ’である。

　　（ＣＵレイヤ）
　ＣＵレイヤでは、処理対象のＣＵ（以下、対象ＣＵとも称する）を復号するために階層動画像復号装置１が参照するデータの集合が規定されている。

　ここで、ＣＵ情報ＣＵに含まれるデータの具体的な内容の説明をする前に、ＣＵに含まれるデータの木構造について説明する。符号化ノードは、予測ツリー（prediction tree；ＰＴ）および変換ツリー（transform tree；ＴＴ）のルートのノードとなる。予測ツリーおよび変換ツリーについて説明すると次のとおりである。

　予測ツリーにおいては、符号化ノードが１または複数の予測ブロックに分割され、各予測ブロックの位置とサイズとが規定される。換言すれば、予測ブロックは、符号化ノードを構成する１または複数の重複しない領域である。また、予測ツリーは、上述の分割により得られた１または複数の予測ブロックを含む。

　予測処理は、この予測ブロックごとに行われる。以下、予測の単位である予測ブロックのことを、予測単位（prediction unit；ＰＵ）とも称する。

　予測ツリーにおける分割（以下、ＰＵ分割と略称する）の種類は、大まかにいえば、イントラ予測の場合と、インター予測の場合との２つがある。

　イントラ予測の場合、分割方法は、２Ｎ×２Ｎ（符号化ノードと同一サイズ）と、Ｎ×Ｎとがある。

　また、インター予測の場合、分割方法は、２Ｎ×２Ｎ（符号化ノードと同一サイズ）、２Ｎ×Ｎ、２Ｎ×ｎＵ、２Ｎ×ｎＤ、Ｎ×２Ｎ、ｎＬ×２Ｎ、および、ｎＲ×２Ｎなどがある。

　また、変換ツリーにおいては、符号化ノードが１または複数の変換ブロックに分割され、各変換ブロックの位置とサイズとが規定される。換言すれば、変換ブロックは、符号化ノードを構成する１または複数の重複しない領域のことである。また、変換ツリーは、上述の分割より得られた１または複数の変換ブロックを含む。

　変換ツリーにおける分割には、符号化ノードと同一のサイズの領域を変換ブロックとして割り付けるものと、上述したツリーブロックの分割と同様、再帰的な４分木分割によるものがある。

　変換処理は、この変換ブロックごとに行われる。以下、変換の単位である変換ブロックのことを、変換単位（transform unit；ＴＵ）とも称する。

　　（ＣＵ情報のデータ構造）
　続いて、図３（ｅ）を参照しながらＣＵ情報ＣＵに含まれるデータの具体的な内容を説明する。図３（ｅ）に示すように、ＣＵ情報ＣＵは、具体的には、スキップフラグＳＫＩＰ、予測ツリー情報（以下、ＰＴ情報と略称する）ＰＴＩ、および、変換ツリー情報（以下、ＴＴ情報と略称する）ＴＴＩを含む。

　スキップフラグＳＫＩＰは、対象のＰＵについて、スキップモードが適用されているか否かを示すフラグであり、スキップフラグＳＫＩＰの値が１の場合、すなわち、対象ＣＵにスキップモードが適用されている場合、そのＣＵ情報ＣＵにおけるＰＴ情報ＰＴＩの一部、および、ＴＴ情報ＴＴＩは省略される。なお、スキップフラグＳＫＩＰは、Ｉスライスでは省略される。

　　［ＰＴ情報］
　ＰＴ情報ＰＴＩは、ＣＵに含まれる予測ツリー（以下、ＰＴと略称する）に関する情報である。言い換えれば、ＰＴ情報ＰＴＩは、ＰＴに含まれる１または複数のＰＵそれぞれに関する情報の集合であり、階層動画像復号装置１により予測画像を生成する際に参照される。ＰＴ情報ＰＴＩは、図３（ｅ）に示すように、予測タイプ情報ＰＴｙｐｅ、および、予測情報ＰＩｎｆｏを含んでいる。

　予測タイプ情報ＰＴｙｐｅは、対象ＰＵについての予測画像生成方法を指定する情報である。ベースレイヤにおいては、イントラ予測を用いるのか、または、インター予測を用いるのかを指定する情報である。

　予測情報ＰＩｎｆｏは、予測タイプ情報ＰＴｙｐｅで指定される予測方法において用いられる予測情報である。ベースレイヤにおいては、イントラ予測の場合にイントラ予測情報PP_Intraが含まれる。また、インター予測の場合にはインター予測情報PP_Interを含む。

　インター予測情報PP_Interは、階層動画像復号装置１が、インター予測によってインター予測画像を生成する際に参照される予測情報を含む。より具体的には、インター予測情報PP_Interは、対象ＣＵの各インターＰＵへの分割パターンを指定するインターＰＵ分割情報、および、各インターＰＵについてのインター予測パラメータ（動き補償パラメータ）を含む。インター予測パラメータとしては、例えば、マージフラグ（merge_flag）、マージインデックス（merge_idx）、推定動きベクトルインデックス（mvp_idx）、参照ピクチャインデックス（ref_idx）、インター予測フラグ（inter_pred_flag）、および動きベクトル残差（mvd）を含む。

　イントラ予測情報PP_Intraは、階層動画像復号装置１が、イントラ予測によってイントラ予測画像を生成する際に参照される符号化パラメータを含む。より具体的には、イントラ予測情報PP_Intraには、対象ＣＵの各イントラＰＵへの分割パターンを指定するイントラＰＵ分割情報、および、各イントラＰＵについてのイントラ予測パラメータが含まれる。イントラ予測パラメータは、各イントラＰＵについてのイントラ予測方法（予測モード）を指定するためのパラメータである。

　ここで、イントラ予測パラメータは、各イントラＰＵについてのイントラ予測（予測モード）を復元するためのパラメータである。予測モードを復元するためのパラメータには、ＭＰＭ（Most Probable Mode、以下同様）に関するフラグであるmpm_flag、ＭＰＭを選択するためのインデックスであるmpm_idx、および、ＭＰＭ以外の予測モードを指定するためのインデックスであるrem_idxが含まれる。ここで、ＭＰＭとは、対象パーティションで選択される可能性が高い推定予測モードである。例えば、対象パーティションの周辺のパーティションに割り付けられた予測モードに基づいて推定された推定予測モードや、一般的に発生確率の高いＤＣモードやＰｌａｎａｒモードがＭＰＭに含まれ得る。

　また、以下において、単に“予測モード”と表記する場合、特にことわりのない限り、輝度予測モードのことを指すものとする。色差予測モードについては、“色差予測モード”と表記し、輝度予測モードと区別する。また、予測モードを復元するパラメータには、色差予測モードを指定するためのパラメータであるchroma_modeが含まれる。

　　［ＴＴ情報］
　ＴＴ情報ＴＴＩは、ＣＵに含まれる変換ツリー（以下、ＴＴと略称する）に関する情報である。言い換えれば、ＴＴ情報ＴＴＩは、ＴＴに含まれる１または複数の変換ブロックそれぞれに関する情報の集合であり、階層動画像復号装置１により残差データを復号する際に参照される。

　ＴＴ情報ＴＴＩは、図３（ｅ）に示すように、対象ＣＵの各変換ブロックへの分割パターンを指定するＴＴ分割情報ＳＰ＿ＴＴ、および、量子化予測残差ＱＤ₁～ＱＤ_NT（ＮＴは、対象ＣＵに含まれるブロックの総数）を含んでいる。

　ＴＴ分割情報ＳＰ＿ＴＴは、具体的には、対象ＣＵに含まれる各変換ブロックの形状、および、対象ＣＵ内での位置を決定するための情報である。例えば、ＴＴ分割情報ＳＰ＿ＴＴは、対象ノードの分割を行うのか否かを示す情報（split_transform_unit_flag）と、その分割の深度を示す情報（trafoDepth）とから実現できる。

　また、例えば、ＣＵサイズが、６４×６４の場合、分割により得られる各変換ブロックは、３２×３２画素から４×４画素までのサイズをとり得る。

　各量子化予測残差ＱＤは、階層動画像符号化装置２が以下の処理１～３を、処理対象の変換ブロックである対象ブロックに施すことによって生成した符号化データである。

　処理１：符号化対象画像から予測画像を減算した予測残差を周波数変換（例えば、ＤＣＴ変換（Discrete Cosine Transform）およびＤＳＴ変換（Discrete Sine Transform）等）する；
　処理２：処理１にて得られた変換係数を量子化する；
　処理３：処理２にて量子化された変換係数を可変長符号化する；
　なお、上述した量子化パラメータｑｐは、階層動画像符号化装置２が変換係数を量子化する際に用いた量子化ステップＱＰの大きさを表す（ＱＰ＝２^qp/6）。

　　（ＰＵ分割情報）
　ＰＵ分割情報によって指定されるＰＵ分割タイプには、対象ＣＵのサイズを２Ｎ×２Ｎ画素とすると、次の合計８種類のパターンがある。すなわち、２Ｎ×２Ｎ画素、２Ｎ×Ｎ画素、Ｎ×２Ｎ画素、およびＮ×Ｎ画素の４つの対称的分割（symmetric splittings）、並びに、２Ｎ×ｎＵ画素、２Ｎ×ｎＤ画素、ｎＬ×２Ｎ画素、およびｎＲ×２Ｎ画素の４つの非対称的分割（asymmetric splittings）である。なお、Ｎ＝２^ｍ（ｍは１以上の任意の整数）を意味している。以下、対象ＣＵを分割して得られる予測単位のことを予測ブロック、または、パーティションと称する。

　（拡張レイヤ）
　拡張レイヤのレイヤ表現に含まれる符号化データ（以下、拡張レイヤ符号化データ）についても、例えば、図３に示すデータ構造とほぼ同様のデータ構造を採用できる。ただし、拡張レイヤ符号化データでは、以下のとおり、付加的な情報を追加したり、パラメータを省略できる。

　スライスレイヤでは、空間スケーラビリティ、時間スケーラビリティ、および、ＳＮＲスケーラビリティ、ビュースケーラビリティの階層の識別情報（それぞれ、dependency_id、temporal_id、quality_id、および、view_id）が符号化されていてもよい。

　また、ＣＵ情報ＣＵに含まれる予測タイプ情報ＰＴｙｐｅは、対象ＣＵについての予測画像生成方法がイントラ予測、インター予測、または、レイヤ間画像予測のいずれかを指定する情報である。予測タイプ情報ＰＴｙｐｅには、レイヤ間画像予測モードの適用有無を指定するフラグ（レイヤ間画像予測フラグ）を含む。なお、レイヤ間画像予測フラグは、texture_rl_flag、inter_layer_pred_flag、または、base_mode_flagと呼ばれることもある。

　拡張レイヤにおいて、対象ＣＵのＣＵタイプが、イントラＣＵ、レイヤ間ＣＵ、インターＣＵ、スキップＣＵのいずれであるかが指定されていてもよい。

　イントラＣＵは、ベースレイヤにおけるイントラＣＵと同様に定義できる。イントラＣＵでは、レイヤ間画像予測フラグが“０”に、予測モードフラグが“０”に設定される。

　レイヤ間ＣＵは、参照レイヤのピクチャの復号画像を予測画像生成に用いるＣＵと定義できる。レイヤ間ＣＵでは、レイヤ間画像予測フラグが“１”に、予測モードフラグが“０”に設定される。

　スキップＣＵは、上述のHEVC方式の場合と同様に定義できる。例えば、スキップＣＵでは、スキップフラグに“１”が設定される。

　インターＣＵは、非スキップかつ動き補償（MC；Motion Compensation）を適用するＣＵと定義されていてもよい。インターＣＵでは、例えば、スキップフラグに“０”が設定され、予測モードフラグに“１”が設定される。

　また、上述のとおり拡張レイヤの符号化データを、下位レイヤの符号化方式と異なる符号化方式により生成しても構わない。すなわち、拡張レイヤの符号化・復号処理は、下位レイヤのコーデックの種類に依存しない。

　下位レイヤが、例えば、MPEG-2や、H.264/AVC方式によって符号化されていてもよい。

　拡張レイヤ符号化データでは、VPSが拡張されて、レイヤ間の参照構造を表すパラメータが含まれていてもよい。

　また、拡張レイヤ符号化データでは、SPS、PPS、スライスヘッダが拡張されて、レイヤ間画像予測に用いる参照レイヤの復号画像に係る情報（例えば、後述のレイヤ間参照ピクチャセット、レイヤ間参照ピクチャリスト、ベース制御情報等を直接、または、間接的に導出するためのシンタックス）が含まれていてもよい。

　なお、以上に説明したパラメータは、単独で符号化されていてもよいし、複数のパラメータが複合的に符号化されていてもよい。複数のパラメータが複合的に符号化される場合は、そのパラメータの値の組み合わせに対してインデックスが割り当てられ、割り当てられた当該インデックスが符号化される。また、パラメータが、別のパラメータや、復号済みの情報から導出可能であれば、当該パラメータの符号化を省略できる。

　〔ピクチャ、タイル、スライスの関係〕
　次に、本発明に係る重要な概念であるピクチャ、タイル、スライスについて、相互の関係および符号化データとの関係を図４を参照して説明する。図４は、階層符号化データにおけるピクチャとタイル・スライスの関係を説明する図である。タイルは、ピクチャ内の矩形の部分領域、および、該部分領域に係る符号化データに対応付けられる。スライスはピクチャ内の部分領域、および、該部分領域に係る符号化データ、すなわち、該部分領域に係るスライスヘッダおよびスライスデータに対応付けられる。

　図４（ａ）はピクチャをタイル・スライスにより分割する場合の分割領域を例示している。図４（ａ）では、ピクチャは矩形の６個のタイル（T00、T01、T02、T10、T11、T12）に分割されている。タイルT00、タイルT02、タイルT10、タイルT12は、それぞれ１個のスライス（順にスライスS00、スライスS02、スライスS10、スライスS12）を含む。一方、タイルT01は2個のスライス（スライスS01aとスライスS01b）を含み、タイルT11は2個のスライス（スライスS11aとスライスS11b）を含んでいる。

　図４（ｂ）は符号化データの構成におけるタイルとスライスの関係を例示している。まず、符号化データは、複数のVCL（Video Coding Layer；ビデオ符号化レイヤ）NALユニットと非VCL（non-VCL）NALユニットから構成される。１枚のピクチャの相当するビデオ符号化レイヤの符号化データは、複数のVCL NALから構成される。ピクチャがタイルに分割される場合、ピクチャに相当する符号化データには、タイルのラスタ順にタイルに相当する符号化データが含まれている。すなわち、図４（ａ）で示したようにピクチャがタイルに分割される場合、タイルT00、T01、T02、T10、T11、T12の順にタイルに相当する符号化データが含まれる。タイルが複数のスライスに分割される場合、スライス先頭のCTUが、タイル内でのCTUラスタスキャン順で先に位置するスライスから順に、スライスに相当する符号化データがタイルに相当する符号化データに含まれる。例えば、図４（ａ）で示したようにタイルT01がスライスS01aとS01bを含む場合、スライスS01a、スライスS01bの順にスライスに相当する符号化データがタイルT01に相当する符号化データに順に含まれる。

　以上の説明から分かるように、ピクチャ内の特定のタイルに相当する符号化データには、１以上のスライスに対応する符号化データが関連付けられている。そのため、タイルに関連付けられるスライスの復号画像を生成できれば、該タイルに対応するピクチャ内の部分領域の復号画像を生成できる。

　以下では、特に追加の説明がなければ、上記のようなピクチャ、タイル、スライスと符号化データの関係を前提として説明を行う。

　〔復号装置、符号化装置、および変換装置を組み合わせたシステム〕
　本実施形態に係る階層動画像復号装置１、階層動画像符号化装置２、および、符号化データ変換装置３の説明に先立って、階層動画像復号装置１、階層動画像符号化装置２、および、符号化データ変換装置３を組み合わせて実現できるシステムの例を図５を参照して説明しておく。図５は、階層動画像復号装置１、階層動画像符号化装置２、および、符号化データ変換装置３を組み合わせて実現できる階層動画像の伝送と再生を行うシステムSYS_ROI1を例示している。

　システムSYS_ROI1は、入力される低品質の入力画像PIN#Lと高品質の入力画像PIN#Hを階層動画像符号化装置２#Lと階層動画像符号化装置２#Hで階層符号化して階層符号化データBSALLを生成する。

　階層符号化データBSALLは、上位レイヤ（拡張レイヤ）の階層符号化データとして、高品質の入力画像PIN#Hの全体に対応する符号化データを含んでいる。また、階層符号化データBSALLは、下位レイヤ（ベースレイヤ）の階層符号化データとして、低品質の入力画像PIN#Lの全体に対応する符号化データを含んでいる。階層符号化データBSALLが階層動画像復号装置１＃Ａに入力される場合、高品質の再生画像DOUT#Hと低品質の再生画像DOUT#Lが出力される。

　階層符号化データBSALLが符号化データ変換装置３に入力された場合、入力される注目領域ROIに基づいて、階層符号化データBSROIが生成される。階層符号化データBSROIは、上位レイヤ（拡張レイヤ）の階層符号化データとして、高品質の入力画像PIN#Hの注目領域ROIに相当する部分の符号化データを含んでいる。また、階層符号化データBSROIは、下位レイヤ（ベースレイヤ）の階層符号化データとして、低品質の入力画像PIN#Lの全体に対応する符号化データを含んでいる。階層符号化データBSROIを階層動画像復号装置１#Rに入力した場合、高品質の入力画像PIN#Hに対応し、かつ、注目領域ROIに対応する復号画像DROI#Hが出力される。加えて、低品質の入力画像PIN#Lに対応する復号画像DOUT#Lが出力される。

　以下の階層動画像復号装置１、階層動画像符号化装置２、および、符号化データ変換装置３の説明においては、上記システムSYS_ROI1での利用を想定して説明を行う場合があるが、必ずしも各装置の用途は上記システムSYS_ROI1に限定されない。

　〔階層動画像復号装置〕
　以下では、本実施形態に係る階層動画像復号装置１の構成について、図１～図２０を参照して説明する。

　（階層動画像復号装置の構成）
　図６を用いて、階層動画像復号装置１の概略的構成を説明すると次のとおりである。図６は、階層動画像復号装置１の概略的構成を示した機能ブロック図である。階層動画像復号装置１は、階層符号化データＤＡＴＡ（階層動画像符号化装置２から提供される階層符号化データＤＡＴＡＦ、または、符号化データ変換装置３から提供される階層符号化データＤＡＴＡＲ）を復号して、対象レイヤの復号画像ＰＯＵＴ＃Ｔを生成する。なお、以下では、対象レイヤは基本レイヤを参照レイヤとする拡張レイヤであるとして説明する。そのため、対象レイヤは、参照レイヤに対する上位レイヤでもある。逆に、参照レイヤは、対象レイヤに対する下位レイヤでもある。

　図６に示すように階層動画像復号装置１は、ＮＡＬ逆多重化部１１、パラメータセット復号部１２、タイル設定部１３、スライス復号部１４、ベース復号部１５、復号ピクチャ管理部１６を含む。

　ＮＡＬ逆多重化部１１は、NAL（Network Abstraction Layer）におけるNALユニット単位で伝送される階層符号化データＤＡＴＡを逆多重化する。

　NALは、VCL（Video Coding Layer）と、符号化データを伝送・蓄積する下位システムとの間における通信を抽象化するために設けられる層である。

　VCLは、動画像符号化処理を行う層のことであり、VCLにおいて符号化が行われる。一方、ここでいう、下位システムは、H.264/AVCおよびHEVCのファイルフォーマットや、MPEG-2システムに対応する。

　なお、NALでは、VCLで生成されたビットストリームが、NALユニットという単位で区切られて、宛先となる下位システムへ伝送される。NALユニットには、VCLで符号化された符号化データ、および、当該符号化データが宛先の下位システムに適切に届けられるためのヘッダが含まれる。また、各階層における符号化データは、NALユニット格納されることでNAL多重化されて階層動画像復号装置１に伝送される。

　階層符号化データＤＡＴＡには、VCLにより生成されたNALの他に、パラメータセット（VPS、SPS、PPS）やSEI等を含むNALが含まれる。それらのNALはVCL NALに対して非VCL NALと呼ばれる。

　ＮＡＬ逆多重化部１１は、階層符号化データＤＡＴＡを逆多重化して、対象レイヤ符号化データＤＡＴＡ＃Ｔおよび参照レイヤ符号化データＤＡＴＡ＃Ｒを取り出す。また、ＮＡＬ逆多重化部１１は、対象レイヤ符号化データＤＡＴＡ＃Ｔに含まれるNALのうち、非VCL NALをパラメータセット復号部１２に、VCL NALをスライス復号部１４にそれぞれ供給する。

　パラメータセット復号部１２は、入力される非VCL NALからパラメータセット、すなわち、ＶＰＳ、ＳＰＳ、および、ＰＰＳを復号してタイル設定部１３とスライス復号部１４に供給する。なお、パラメータセット復号部１２における本発明との関連性の高い処理の詳細について後述する。

　タイル設定部１３は、入力されるパラメータセットに基づいてピクチャのタイル情報を導出してスライス復号部１４に供給する。タイル情報は、少なくともピクチャのタイル分割情報を含む。タイル設定部１３の詳細な説明は後述する。

　スライス復号部１４は、入力されるVCL NAL、パラメータセット、タイル情報、および、参照ピクチャに基づいて復号ピクチャ、または、復号ピクチャの部分領域を生成して復号ピクチャ管理部１６内のバッファに記録する。スライス復号部の詳細な説明は後述する。

　復号ピクチャ管理部１６は、入力される復号ピクチャやベース復号ピクチャを内部の復号ピクチャバッファ（DPB: Decoded Picture Buffer）に記録するとともに、参照ピクチャリスト生成や出力ピクチャ決定を行う。また、復号ピクチャ管理部１６は、DPBに記録されている復号ピクチャを、所定のタイミングで出力ピクチャＰＯＵＴ＃Ｔとして外部に出力する。

　ベース復号部１５は、参照レイヤ符号化データＤＡＴＡ＃Ｒからベース復号ピクチャを復号する。ベース復号ピクチャは、対象レイヤの復号ピクチャ復号時に利用される参照レイヤの復号ピクチャである。ベース復号部１５は、復号したベース復号ピクチャを復号ピクチャ管理部１６内のDPBに記録する。

　図７を用いて、ベース復号部１５の詳細構成を説明する。図７は、ベース復号部１５の構成について例示した機能ブロック図である。

　図７に示すように、ベース復号部１５は、ベースNAL逆多重化部１５１、ベースパラメータセット復号部１５２、ベースタイル設定部１５３、ベーススライス復号部１５４、ベース復号ピクチャ管理部１５６を備える。

　ベースNAL逆多重化部１５１は、参照レイヤ符号化データＤＡＴＡ＃Ｒを逆多重化して、VCL NALと非VCL NALを抽出し、非VCL NALをベースパラメータセット復号部１５２に、VCL NALをベーススライス復号部１５４にそれぞれ供給する。

　ベースパラメータセット復号部１５２は、入力される非VCL NALからパラメータセット、すなわち、VPS、SPS、および、PPSを復号してベースタイル設定部１５３とベーススライス復号部１５４に供給する。

　ベーススタイル設定部１５３は、入力されるパラメータセットに基づいてピクチャのタイル情報を導出してベーススライス復号部１５４に供給する。

　ベーススライス復号部１５４は、入力されるVCL NAL、パラメータセット、タイル情報、および、参照ピクチャに基づいて復号ピクチャ、または、復号ピクチャの部分領域を生成してベース復号ピクチャ管理部１５６内のバッファに記録する。

　ベース復号ピクチャ管理部１５６は、入力される復号ピクチャを内部のDPBに記録するとともに、参照ピクチャリスト生成や出力ピクチャ決定を行う。また、ベース復号ピクチャ管理部１５６は、DPBに記録されている復号ピクチャを、所定のタイミングでベース復号ピクチャとして出力する。

　（パラメータセット復号部１２）
　パラメータセット復号部１２は、入力される対象レイヤの符号化データから、対象レイヤの復号に用いられるパラメータセット（VPS、SPS、PPS）を復号して出力する。一般に、パラメータセットの復号は既定のシンタックス表に基づいて実行される。すなわち、シンタックス表の定める手順に従って符号化データからビット列を読み出して、シンタックス表に含まれるシンタックスのシンタックス値を復号する。また、必要に応じて、復号したシンタックス値に基づいて導出した変数を導出して、出力するパラメータセットに含めてもよい。したがって、パラメータセット復号部１２から出力されるパラメータセットは、符号化データに含まれるパラメータセット（VPS、SPS、PPS）に係るシンタックスのシンタックス値、および、該シンタックス値より導出される変数の集合と表現することもできる。

　以下では、パラメータセット復号部１２において復号に使用されるシンタックス表のうち、本発明との関連性が高い、ピクチャ情報、および、レイヤ間位置対応情報に係るシンタックス表の一部について詳しく説明する。

　　（ピクチャ情報）
　パラメータセット復号部１２は、入力される対象レイヤ符号化データからピクチャ情報を復号する。ピクチャ情報は、概略的には、対象レイヤの復号ピクチャのサイズを定める情報である。例えば、ピクチャ情報は、対象レイヤの復号ピクチャの幅や高さを表わす情報を含んでいる。

　ピクチャ情報は、例えば、SPSに含まれており、図８に示すシンタックス表に従って復号される。図８は、パラメータセット復号部１２がSPS復号時に参照するシンタックス表の一部であって、表示領域情報に係る部分である。

　SPSから復号されるピクチャ情報には、復号ピクチャの幅（pic_width_in_luma_samples）と復号ピクチャの高さ（pic_height_in_luma_samples）が含まれている。シンタックスpic_width_in_luma_samplesの値は、輝度画素単位での復号ピクチャの幅に対応する。また、シンタックスpic_height_in_luma_samplesの値は、輝度画素単位での復号ピクチャの高さに対応する。

　　（表示領域情報）
　パラメータセット復号部１２は、入力される対象レイヤ符号化データから表示領域情報を復号する。表示領域情報は、例えば、SPSに含まれており、図９に示すシンタックス表に従って復号される。図９は、パラメータセット復号部１２がSPS復号時に参照するシンタックス表の一部であって、表示領域情報に係る部分である。

　SPSから復号される表示領域情報は、表示領域フラグ（conformance_flag）を含む。表示領域フラグは表示領域の位置を表わす情報（表示領域位置情報）が追加でSPSに含まれるか否かを示す。すなわち、表示領域フラグが１の場合、表示領域位置情報が追加で含まれることを示し、表示領域フラグが０の場合、表示領域位置情報が追加で含まれないことを示す。

　SPSから復号される表示領域情報は、表示領域フラグが１の場合、さらに表示領域位置情報として表示領域左オフセット（conf_win_left_offset）、表示領域右オフセット（conf_win_right_offset）、表示領域上オフセット（conf_win_top_offset）、表示領域下オフセット（conf_win_bottom_offset）を含む。

　表示領域は、表示領域フラグが０の場合には、ピクチャ全体が設定される。一方、表示領域フラグが１の場合には、表示領域位置情報が示すピクチャ内の部分領域が設定される。なお、表示領域は、コンフォーマンス窓（conformance window）とも呼称される。

　図１０を参照して表示領域位置情報と表示領域の関係を説明する。図１０は、ピクチャ内の部分領域である表示領域と表示領域位置情報の関係を例示する図である。図に示したように、表示領域はピクチャ内に包含されており、表示領域上オフセットはピクチャ上辺と表示領域上辺の距離、表示領域左オフセットはピクチャ左辺と表示領域左辺の距離、表示領域右オフセットはピクチャ右辺と表示領域右辺の距離、表示領域下オフセットはピクチャ下辺と表示領域下辺の距離をそれぞれ表わしている。したがって、上記の表示領域位置情報により、表示領域のピクチャ内の位置およびサイズが一意に特定できる。なお、表示領域情報は、表示領域のピクチャ内の位置およびサイズが一意に特定できる他の情報であっても構わない。

　　（レイヤ間位置対応情報）
　パラメータセット復号部１２は、入力される対象レイヤ符号化データからレイヤ間位置対応情報を復号する。レイヤ間位置対応情報は、概略的には、対象レイヤと参照レイヤの対応する領域の位置関係を示す。例えば、対象レイヤのピクチャと参照レイヤのピクチャにある物体（物体Ａ）が含まれる場合、対象レイヤのピクチャ上の物体Ａに対応する領域と、参照レイヤのピクチャ上の物体Ａに対応する領域が、前記対象レイヤと参照レイヤの対応する領域に相当する。なお、レイヤ間位置対応情報は、必ずしも上記の対象レイヤと参照レイヤの対応する領域の位置関係を正確に示す情報でなくてもよいが、一般的には、レイヤ間予測の正確性を高めるために正確な対象レイヤと参照レイヤの対応する領域の位置関係を示している。

　レイヤ間位置対応情報は、レイヤ間画素対応情報とレイヤ間位相対応情報を含む。レイヤ間画素対応情報は、参照レイヤのピクチャ上の画素と、対応する対象レイヤのピクチャ上の画素との位置関係を示す情報である。レイヤ間位相対応情報は、前記レイヤ間画素対応情報で対応が示された画素の位相差を表わす情報である。

　　　（レイヤ間画素対応情報）
　レイヤ間画素対応情報は、例えば、上位レイヤのSPSの一部であるSPS拡張（sps_estension）に含まれており、図１１に示すシンタックス表に従って復号される。図１１は、パラメータセット復号部１２がSPS復号時に参照するシンタックス表の一部であって、レイヤ間画素対応情報に係る部分である。

　SPSから復号されるレイヤ間画素対応情報には、SPS拡張に含まれるレイヤ間画素対応情報の個数（num_scaled_ref_layer_offsets）が含まれる。加えて、レイヤ間画素対応情報には、前記レイヤ間画素対応情報の個数分のレイヤ間画素対応オフセットが含まれる。レイヤ間画素対応オフセットには、スケール後参照レイヤ左オフセット（scaled_ref_layer_left_offset[i]）、スケール後参照レイヤ上オフセット（scaled_ref_layer_top_offset[i]）、スケール後参照レイヤ右オフセット（scaled_ref_layer_right_offset[i]）、および、スケール後参照レイヤ下オフセット（scaled_ref_layer_bottom_offset[i]）が含まれる。

　レイヤ間画素対応オフセットに含まれる各オフセットの意味を、図１２を参照して説明する。図１２は、対象レイヤのピクチャ、参照レイヤのピクチャ、および、レイヤ間画素対応オフセットの関係を例示する図である。

　図１２（ａ）は、参照レイヤのピクチャ全体が対象レイヤのピクチャの一部に対応する場合の例を示す。この場合、参照レイヤピクチャ全体に対応する対象レイヤ上の領域（対象レイヤ対応領域）は、対象レイヤピクチャの内部に含まれている。図１２（ｂ）は、参照レイヤのピクチャの一部が対象レイヤのピクチャ全体に対応する場合の例を示す。この場合、参照レイヤ対応領域の内部に対象レイヤピクチャが含まれている。なお、対象レイヤピクチャ全体にオフセッと含まれている。

　図１２に示したように、スケール後参照レイヤ左オフセット（図ではSRL左オフセット）は、参照レイヤ対象領域左辺の対象レイヤピクチャ左辺に対するオフセットを表わす。なお、SRL左オフセットが０より大きい場合、参照レイヤ対象領域左辺が対象レイヤピクチャ左辺の右側に位置することを表わす。

　スケール後参照レイヤ上オフセット（図ではSRL上オフセット）は、参照レイヤ対象領域上辺の対象レイヤピクチャ上辺に対するオフセットを表わす。なお、SRL上オフセットが０より大きい場合、参照レイヤ対象領域上辺が対象レイヤピクチャ上辺の下側に位置することを表わす。

　スケール後参照レイヤ右オフセット（図ではSRL右オフセット）は、参照レイヤ対象領域右辺の対象レイヤピクチャ右辺に対するオフセットを表わす。なお、SRL右オフセットが０より大きい場合、参照レイヤ対象領域右辺が対象レイヤピクチャ右辺の左側に位置することを表わす。

　スケール後参照レイヤ下オフセット（図ではSRL下オフセット）は、参照レイヤ対象領域下辺の対象レイヤピクチャ下辺に対するオフセットを表わす。なお、SRL下オフセットが０より大きい場合、参照レイヤ対象領域下辺が対象レイヤピクチャ下辺の上側に位置することを表わす。

　　　（レイヤ間位相対応情報）
　レイヤ間位相対応情報は、例えば、上位レイヤのSPSの一部であるSPS拡張に含まれており、図１３に示すシンタックス表に従って復号される。図１３は、パラメータセット復号部１２がSPS復号時に参照するシンタックス表の一部であって、レイヤ間位相対応情報に係る部分である。

　SPSから復号されるレイヤ間位相対応情報には、参照レイヤ位相オフセット数（num_ref_layer_phase_offsets）が含まれる。加えて、レイヤ間位相対応情報には、参照レイヤ位相オフセット数の個数の参照レイヤ位相オフセットが含まれる。参照レイヤ位相オフセットは、左位相オフセット（ref_layer_left_phase_offset）と上位相オフセット（ref_layer_top_phase_offset）の組み合わせにより表現される。

　左位相オフセットは、参照レイヤ対応領域の左上画素と参照レイヤピクチャ左上画素の間の水平方向の位相オフセットを表わす。同様に、上位相オフセットは、参照レイヤ対応領域の左上画素と参照レイヤピクチャ左上画素の間の垂直方向の位相オフセットを表わす。

　ここで、参照レイヤ対応領域の左上画素は対象レイヤピクチャ内の画素である。対象レイヤピクチャ内の画素（対象レイヤ画素）と参照レイヤピクチャ内の画素（参照レイヤ画素）の位相オフセットは、参照レイヤ画素に対応する対象レイヤ上の点の、参照レイヤ画素に対応する対象レイヤ画素に対する画素単位未満のずれを表わす量である。

　対象レイヤ画素と参照レイヤ画素の位相差の例を、図１４を参照して説明する。図１４は、対象レイヤ画素と参照レイヤ画素の対応と位相差の関係を例示する図である。図１４では、拡大率１．５倍の空間スケーラビリティが用いられる場合の参照レイヤのピクチャの一部と、対応する対象レイヤ上の参照レイヤ対応領域を一次元（水平方向または垂直方向に対応する次元）で表現しており、対象レイヤ上の６個の画素（左から順にPEL1、PEL2、PEL3、PEL4、PEL5、PEL6）、参照レイヤ上の４個の画素（左から順にPRL1、PRL2、PRL3、PRL4）が図示されている。画素PEL1と画素PRL1、画素PEL6と画素PRL4がそれぞれ対応する位置にある。この場合、例えば、画素PEL2の位相オフセットは、画素PEL2に対応する参照レイヤ上の点PEL2’と、画素PEL2に対応する参照レイヤ画素（画素PEL1）に対する位置のずれである。図の例では、画素PEL2の位相オフセットは、参照レイヤの画素単位で3/5となる。一般に、対象レイヤ画素PELに対応する参照レイヤ画素の位置をInt(PEL)、対象レイヤ画素PELの位相オフセットをPhaseEL、対象レイヤ画素に対応する参照レイヤ上の点の位置をPEL’とする場合、以下の関係が成り立つ。

　　Int(PEL) + PhaseEL = PEL'
つまり、対象レイヤ画素PELに対応する参照レイヤ画素の位置に、位相オフセットを加算した値が、対象レイヤ画素に対応する参照レイヤ上の点の位置と一致する。

　なお、必ずしも厳密な参照レイヤ位相オフセットの値がパラメータセットに含まれている必要はなく、近似値が含まれていてもよい。また、参照レイヤ位相オフセットの単位は、必ずしも参照レイヤの画素単位である必要はない。例えば、参照レイヤの１６画素を単位として表現した値を、整数精度で近似した値を参照レイヤ位相オフセットとして用いてもよい。

　　　（レイヤ間位相対応情報２）
　上記の図１３を参照して説明した例では、参照レイヤ位相オフセットが直接SPSに含まれていたが、それに限らない。例えば、参照レイヤ位相オフセットが導出可能な別のパラメータが含まれていても構わない。そのような例を、図１５に示すシンタックス表を参照して説明する。図１５は、パラメータセット復号部１２がSPS復号時に参照するシンタックス表の一部であって、レイヤ間位相対応情報に係る部分の別の例である。

　上記例において、SPSから復号されるレイヤ間位相対応情報には、参照レイヤクロップオフセット数（num_cropped_ref_layer_offsets）が含まれる。加えて、レイヤ間位相対応情報には、参照レイヤクロップオフセット数の個数の参照レイヤ位相オフセットが含まれる。参照レイヤ位相オフセットは、左クロップオフセット（cropped_ref_layer_left_offset）と上クロップオフセット（cropped_ref_layer_top_offset）の組み合わせにより表現される。

　左クロップオフセットは、基準対象レイヤ画素に対する参照レイヤ対応領域の左上画素の水平方向の位置のずれを表わす。ここで、基準対象レイヤ画素は、参照レイヤ対応領域の左上画素の左上（水平位置が一致するか左、かつ、垂直位置が一致するか上）に位置する画素であって、対応する参照レイヤ上の点の位置が参照レイヤ上の画素単位で整数位置にある画素である。例えば、図１４の例では、画素PEL2の基準対象レイヤ画素として画素PEL1が利用できる。同様に、上クロップオフセットは、基準対象レイヤ画素に対する参照レイヤ対応領域の左上画素の垂直方向の位置のずれを表わす。

　上記参照レイヤクロップオフセットより参照レイヤ位相オフセットに相当する情報が導出できる理由は次の通りである。

　対象レイヤ左上画素PELTLに対応する参照レイヤ画素の位置をInt(PELTL)、対象レイヤ画素PELTLの位相オフセットをPhaseELTL、基準対象レイヤ画素をPELBASE、基準対象レイヤ画素PELBASEに対応する参照レイヤ上の画素をInt(PELBASE)とした場合、次の関係が成り立つ。

　　scale * (PELTL - PELBASE) = PhaseELTL + Int(PELTL) - Int(PELBASE)
　ここで、scaleは空間スケーラビリティの倍率であり、参照レイヤのピクチャをscaleの示す倍率で拡大した領域が参照レイヤ対応領域となる。

　つまり、対象レイヤ上での画素PELBTLと画素PELBASE間の距離に空間スケーラビリティの倍率を乗じた値は、参照レイヤ上での画素PELTLに対応する画素と、画素PELBASEに対応する画素との間の距離に位相オフセットを加算した値に一致する。この関係から、画素PELBASEの位置に基づいて、位相オフセットPhaseELTLを導出できる。なお、上記の関係が成り立つのは、対象レイヤ上の画素PELBASEが対応する参照レイヤ上の点PELBASE’と、画素PELBASEが対応する参照レイヤ上の画素Int(PELBASE)が一致するためである。

　（タイル設定部１３）
　タイル設定部１３は、入力されるパラメータセットに基づいてピクチャのタイル情報を導出して出力する。

　本実施形態において、タイル設定部１３により生成されるタイル情報は、概略的には、タイル構造情報とタイル依存情報を含む。

　タイル構造情報は、ピクチャ内のタイルの個数と各タイルの大きさが示す情報である。なお、タイルがピクチャを格子状に分割して得られる部分領域に対応付ける場合、ピクチャ内のタイルの個数は、水平方向に含まれるタイルの個数と垂直方向に含まれるタイルの個数の積に等しい。

　タイル依存情報は、ピクチャ内のタイル復号時の依存性を示す情報である。ここで、タイル復号時の依存性は、タイルがタイル外の領域に係る復号画素やシンタックス値に依存する程度を示す。なお、タイル外の領域には、対象ピクチャ上のタイル外の領域、参照ピクチャ上のタイル外の領域、ベース復号ピクチャ上のタイル外の領域が含まれる。

　以下、タイル設定部１３により生成されるタイル情報の詳細について、入力されるパラメータセットに基づく導出過程を含めて説明する。

　タイル情報は、パラメータセットに含まれるSPSやPPSに含まれるタイル情報に係るシンタックスの値に基づいて導出される。タイル情報に係るシンタックスについて図１６を参照して説明する。

　　（PPSタイル情報）
　図１６はパラメータセットに含まれるPPSの復号時にパラメータ復号部１２により参照されるシンタックス表の一部であって、タイル情報に係る部分である。

　PPSに含まれるタイル情報に係るシンタックス（PPSタイル情報）には、複数タイル有効フラグ（tiles_enabled_flag）が含まれる。複数タイル有効フラグの値が１の場合、ピクチャが２個以上のタイルから構成されることを示す。当該フラグの値が０の場合、ピクチャが１個のタイルから構成される、すなわちピクチャとタイルが一致することを示す。

　複数タイルが有効（tiles_enabled_flagが真）である場合、PPSタイル情報には、タイル列数を示す情報（num_tile_columns_minus1）、タイル行数を示す情報（num_tiles_rows_minus1）、および、タイルサイズの均等性を示すフラグ（uniform_spacing_flag）が追加で含まれる。

　num_tile_columns_minus1は、ピクチャの水平方向に含まれるタイルの数から１を引いた値に相当するシンタックスである。また、num_tile_rows_minus1は、ピクチャの垂直方向に含まれるタイルの数から１を引いた値に相当するシンタックスである。したがって、ピクチャに含まれるタイル数NumTilesInPicは次式により計算される。

　　NumTilesInPic = (num_tile_columns_minus1+1) * (num_tile_rows_minus1+1)
　uniform_spacing_flagの値が１の場合、ピクチャに含まれるタイルサイズが均等、すなわち、各タイルの幅と高さが等しいことを示す。uniform_spacing_flagの値が０の場合、ピクチャに含まれるタイルサイズが不均等、すなわち、ピクチャに含まれるタイルの幅や高さが必ずしも一致しないことを示す。

　ピクチャに含まれるタイルサイズが不均等（uniform_spacing_flagが０）の場合、PPSタイル情報には、ピクチャに含まれる各タイル列に対して、タイル幅を示す情報（column_width_minus1[i]）、および、ピクチャに含まれる各タイル行に対して、タイルの高さを示す情報（row_height_minus1[i]）が追加で含まれる。

　また、複数タイルが有効である場合、PPSタイル情報には、タイル境界をまたぐループフィルタの適用有無を示すフラグ（loop_filter_across_tiles_enabled_flag）を追加で含む。

　ここで、図１７を参照して、タイル行、タイル列とピクチャの関係を説明しておく。図１７は、ピクチャをタイル分割した場合のタイル行とタイル列を例示した図である。図１７の例では、ピクチャは４個のタイル列と３個のタイル行により分割されており、計１２個のタイルを含んでいる。例えば、タイル列０（TileCol0）は、タイルＴ００、Ｔ１０、Ｔ２０を含んでいる。また、例えば、タイル行０（TileRow0）は、タイルＴ００、Ｔ０１、Ｔ０２、Ｔ０３を含んでいる。タイル列ｉの幅はCTU単位でColWidth[i]と表記される。タイル行ｊの高さはCTU単位でRowHeight[j]と表記される。したがって、タイル行ｉに属し、かつ、タイル列ｊに属するタイルの幅はColWidth[i]、高さはRowHeight[j]となる。

　上記のPPSタイル情報に基づいて、タイル設定部１３は、タイル構造情報を導出する。タイル構造情報には、ラスタスキャンCTBアドレスからタイルスキャンCTBアドレスを導出する配列（CtbAddrRsToTs[ctbAddrRs]）、タイルスキャンCTBアドレスからラスタスキャンCTBアドレスを導出する配列（CtbAddrTsToRs[ctbAddrTs]）、タイルスキャンCTBアドレス毎のタイル識別子（TileId[ctbAddrTs]）、各タイル列の幅（ColumnWidthInLumaSamples[i]）、および、各タイル行の高さ（RowHeightInLumaSamples[j]）が含まれる。

　uniform_spacing_flagが１の場合、ピクチャサイズとピクチャ内のタイル数に基づいて各タイル列の幅が計算される。例えば、次式によりｉ番目のタイル列の幅（ColumnWidthInLumaSamples[i]）が計算される。なお、PicWidthInCtbsYは、ピクチャの水平方向に含まれるCTUの数を表す。

　　ColWidth[i] = ( (i+1) * PicWidthInCtbsY ) / ( num_tile_columns_minus1 + 1 ) - ( i * PicWidthInCtbsY ) / ( num_tile_columns_minus1 + 1 )
　つまり、ピクチャをタイル列数で等分して得られる（i+1）番目とi番目の境界位置の差分として、ｉ番目のタイル列のCTU単位の幅であるColWidth[i]が計算される。

　一方、uniform_spacing_flagが０の場合、（column_width_minus1[i]+1）の値がｉ番目のタイル列のCTU単位の幅ColWidth[i]に設定される。

　ColumnWidthInLumaSamples[i]の値は、ColWidth[i]にCTUの画素単位の幅を乗じて得られる値を設定する。

　なお、タイル行のCTU単位の高さRowHeight[j]についても、上記タイル列の幅と同様の方法で計算される。PicWidthInCtbsYの代わりにPicHeightInCtbsY（ピクチャの垂直方向に含まれるCTU数)、num_tiles_columns_minus1の代わりにnum_tiles_row_minus1、column_width_minus1[i]の代わりにrow_height_minus1[i]を用いる。

　RowHeightInLumaSamples[j]の値は、RowHeight[j]にCTUの画素単位の高さを乗じて得られる値を設定する。

　次に、タイルスキャンCTBアドレスからラスタスキャンCTBアドレスを導出する配列（CtbAddrTsToRs[ctbAddrTs]）の導出方法を説明する。

　まず、ｉ番目のタイル列の境界位置を示すcolBd[i]、および、ｊ番目のタイル行の境界位置を示すrowBd[j]を次式により計算する。なお、colBd[0]とrowBd[0]の値は０とする。

　　colBd[i+1] = colBd[i] + colWidth[i]
　　rowBd[j+1] = rowBd[j] + rowHeight[j]
　続いて、ピクチャに含まれるラスタスキャンCTUアドレス（ctbAddrRs）で識別されるCTUに関連付けられるタイルスキャンCTUアドレスを以下の手順で導出する。

　対象CTUのピクチャ内CTU単位での位置（tbX、tbY）をctbAddrRsから次式により計算する。ここで演算子「%」は剰余演算子であり、「A % B」は整数Aを整数Bで割った余りを意味する。

　　tbX = ctbAddrRs % PicWidthInCtbsY
　　tbY = ctbAddrRs / PicWidthInCtbsY
　続いて、対象CTUを含むタイルのピクチャ内のタイル単位の位置（tileX、tileY）を導出する。tileXには、評価式（tbX >= colBd[i]）が真となる最大のｉの値が設定される。同様に、tileYには、評価式（tbY >= rowBd[j]）が真となる最大のｊの値が設定される。

　CtbAddrRsToTs[ctbAddrRs]の値には、(tileX、tileY）のタイルよりもタイルスキャン順で先行するタイルに含まれるCTUの和と、（tileX、tileY）のタイル内で（tbX - colBd[tileX]、tbY - rowBd[tileY]）に位置するCTUの当該タイル内ラスタスキャン順の位置を加算した値が設定される。

　CtbAddrTsToRs[ctbAddrTs]の値には、CtbAddrRsToTs[k]がctbAddrTsと一致する場合のkの値が設定される。

　TileId[ctbAddrTs]の値には、ctbAddrTsで示されるCTUが属するタイルのタイル識別子が設定される。ピクチャ内でタイル単位で（tileX、tileY）の位置にあるタイルのタイル識別子tileId(tileX、tileY)は、次式により計算される。

　tileId(tileX,tileY) = (tileY * (num_tile_cols_minus1 + 1)) + tileX
　（スライス復号部１４）
　スライス復号部１４は、入力されるVCL NAL、パラメータセット、および、タイル情報に基づいて復号ピクチャを生成して出力する。

　図１８を用いて、スライス復号部１４の概略的構成を説明する。図１８は、スライス復号部１４の概略的構成を示した機能ブロック図である。

　スライス復号部１４は、スライスヘッダ復号部１４１、スライス位置設定部１４２、CTU復号部１４４を備えている。CTU復号部１４４は、さらに、予測残差復元部１４４１、予測画像生成部１４４２、および、CTU復号画像生成部１４４３を含んでいる。

　　（スライスヘッダ復号部）
　スライスヘッダ復号部１４１は、入力されるVCL NALとパラメータセットに基づいてスライスヘッダを復号し、スライス位置設定部１４２、および、CTU復号部１４４に出力する。

　スライスヘッダには、ピクチャ内のスライス位置に係る情報（SHスライス位置情報）が含まれる。以下、スライスヘッダ復号部１４１がスライスヘッダ復号時に参照するシンタックス表を例示して説明する。

　図１９は、スライスヘッダ復号時にスライスヘッダ復号部１４１により参照されるシンタックス表の一部であって、スライス位置情報に係る部分である。

　スライスヘッダには、スライス位置情報として、ピクチャ内先頭スライスフラグ（first_slice_segment_in_pic_flag）が含まれる。ピクチャ内先頭スライスフラグが１の場合、対象スライスが復号順でピクチャ内の先頭に位置することを示す。ピクチャ内先頭スライスフラグが０の場合は、対象スライスが復号順でピクチャ内の先頭に位置しないことを示す。

　また、スライスヘッダには、スライス位置情報として、スライスPPS識別子（slice_pic_parameter_set_id）が含まれる。スライスPPS識別子は、対象スライスに関連付けられるPPSの識別子であり、当該PPS識別子を介して、対象スライスに関連付けるべきタイル情報が特定される。

　　（スライス位置設定部）
　スライス位置設定部１４２は、入力されるスライスヘッダとタイル情報に基づいてピクチャ内のスライス位置を特定してCTU復号部１４４に出力する。

　スライス内のｉ番目のCTUのピクチャ内での位置をCTU単位で（ctbX[i],ctbY[i])、タイルスキャンによるアドレスをctbAddrTs[i]と記載する場合、スライスの先頭CTU、すなわち０番目のCTU、のピクチャ内の位置（ctbX[0]、ctbY[0]）、タイルスキャンによるアドレスctbAddrTsは次式により計算される。

　　ctbAddrTs[0] = CtbAddrRsToTs[slice_segment_address]
　　ctbX[0] = slice_segment_address % PicWidthInCtbsY
　　ctbY[0] = slice_segment_address / PicWidthInCtbsY
ここで、CtbAddrRsToTs[X]はラスタスキャンのアドレスをタイルスキャンのアドレスに変換する配列であり、スライス位置設定部に入力されるタイル情報に含まれている。

　また、スライス内ｉ番目（ｉ＞０）のCTUのピクチャ内での位置（ctbX[i],ctbY[i])は次式により計算される。

　　ctbAddrTs[i] = ctbAddrTs[i-1] + 1
　　ctbX[i] = CtbAddrTsToRs[ctbAddrTs[i]] % PicWidthInCtbsY
　　ctbY[i] = CtbAddrTsToRs[ctbAddrTs[i]] / PicWidthInCtbsY
つまり、対象CTUのタイルスキャンのアドレスは、直前に先行するCTUのタイルスキャンのアドレスに1加算した値に設定される。そして、得られたタイルスキャンのアドレスを、タイル情報に含まれる変換配列CtbAddrTsToRsを用いてラスタスキャンのアドレスに変換する。ラスタスキャンのアドレスとCTU単位のピクチャの幅によりCTUのピクチャ内での位置（ctbX[i],ctbY[i]）が導出される。

　なお、（ctbX[i],ctbY[i]）からCTUのピクチャ内輝度画素単位での位置（ctbXInLumaPixels[i],ctbYInLumaPixels[i])を計算するには、各要素にCTUサイズを乗ずる計算をすればよい。例えば、輝度画素単位のCTU幅の２の対数であるCtbLog2SizeYを用いて、次のように計算できる。

　　ctbXInLumaPixels[i] = ctbX[i] << CtbLog2SizeY
　　ctbYInLumaPixels[i] = ctbY[i] << CtbLog2SizeY
以上の処理により、スライス位置設定部１４２は、スライスに含まれる各CTUのピクチャ内での位置を計算して出力する。

　　（CTU復号部）
　CTU復号部１４４は、概略的には、入力されるスライスヘッダ、スライスデータ、および、パラメータセットに基づいて、スライスに含まれる各ＣＴＵに対応する領域の復号画像を復号することで、スライスの復号画像を生成する。スライスの復号画像は、入力されるスライス位置の示す位置に、復号ピクチャの一部として出力される。CTUの復号画像は、CTU復号部１４４内部の予測残差復元部１４４１、予測画像生成部１４４２、および、CTU復号画像生成部１４４３により生成される。予測残差復元部１４４１は、入力のスライスデータに含まれる予測残差情報（ＴＴ情報）を復号して対象CTUの予測残差を生成して出力する。予測画像生成部１４４２は、入力のスライスデータに含まれる予測情報（ＰＴ情報）の示す予測方法と予測パラメータに基づいて予測画像を生成して出力する。その際、必要に応じて、参照ピクチャの復号画像や符号化らメータが利用される。CTU復号画像生成部１４４３は、入力される予測画像と予測残差を加算して対象CTUの復号画像を生成して出力する。

　　　（予測画像生成部の詳細）
　前述の予測画像生成部１４４２による予測画像生成処理のうち、レイヤ間画像予測が選択された場合の予測画像生成処理の詳細を説明する。

　レイヤ間画像予測が適用される対象CTUに含まれる対象画素の予測画素値の生成処理は次の手順で実行される。まず、参照ピクチャ位置導出処理を実行し、対応参照位置を導出する。ここで、対応参照位置とは、対象レイヤピクチャ上の対象画素に対応する参照レイヤ上の位置である。なお、対象レイヤと参照レイヤの画素は必ずしも１対１に対応しないため、対応参照位置は、参照レイヤにおける画素単位未満の精度で表現される。次に、導出した対応参照位置を入力として補間フィルタ処理を実行することで、対象画素の予測画素値が生成される。

　対応参照位置導出処理では、パラメータセットに含まれるピクチャ情報、レイヤ間画素対応情報、および、レイヤ間位相対応情報に基づいて、対応参照位置を導出する。対応参照位置導出処理の詳細手順について、図１を参照して説明する。図１は、対応参照位置導出処理のフロー図である。対応参照位置導出処理は、以下のＳ１０１～Ｓ１０４の処理を順次実行することで実現される。

　（Ｓ１０１）対象レイヤピクチャサイズ、参照レイヤピクチャサイズ、レイヤ間画素対応情報に基づいて参照レイヤ対応領域サイズと、レイヤ間サイズ比率（参照レイヤ対応領域サイズに対する参照レイヤピクチャサイズの比率）を計算する。まず、参照レイヤ対応領域の幅SRLWと高さSRLH、レイヤ間サイズ比率の水平成分scaleXと水平成分scaleYが次式により計算される。

　　SRLW = currPicW - SRLLeftOffset - SRLRightOffset
　　SRLH = currPicH - SRLTopOffset - SRLBottomOffset
　　scaleX = refPicW ÷ SRLW
　　scaleY = refPicH ÷ SRLH
ここで、currPicWとcurrPicHは対象ピクチャの高さと幅であり、対応参照位置導出処理の対象が輝度画素の場合は、対象レイヤにおけるSPSのピクチャ情報に含まれるpic_width_in_luma_samplesとpic_height_in_luma_samplesの各シンタックス値と一致する。対象が色差の場合は、色フォーマットの種類に応じて前記シンタックス値を変換した値を使用する。例えば色フォーマットが4:2:2の場合、各シンタックス値の半分の値を使用する。また、refPicWとrefPicHは参照ピクチャの高さと幅であり、対象が輝度画素の場合、参照レイヤにおけるSPSのピクチャ情報に含まれるpic_width_in_luma_samplesとpic_height_in_luma_samplesの各シンタックス値と一致する。また、SRLLeftOffset、SRLRightOffset、SRLTopOffset、SRLBottomOffsetは、図１２を参照して説明したレイヤ間画素対応オフセットである。

　（Ｓ１０２）レイヤ間画素対応情報とレイヤ間サイズ比率に基づいて暫定参照位置を計算する。対象レイヤ画素に対応する暫定参照位置の水平成分xRefTmpと垂直成分yRefTmpは次式により計算される。なお、xRefTmpは参照レイヤピクチャの左上画素を基準とする水平方向の位置を、yRefTmpは同左上画素を基準とする垂直方向の位置をそれぞれ参照レイヤピクチャの画素単位で表わす。

　　xRefTmp = (xP - SRLLeftOffset) * scaleX
　　yRefTmp = (yP - SRLTopOffset) * scaleY
ここで、xPとyPは対象レイヤピクチャ左上画素を基準とする対象レイヤ画素の水平成分と垂直成分をそれぞれ対象レイヤピクチャの画素単位で表わす。また、実数Xに対してFloor(X)は、Xを超えない最大の整数を意味する。

　上記の式では、参照レイヤ対応領域の左上画素に対する対象画素の位置をレイヤ間サイズ比率によりスケールした値を暫定参照位置としている。なお、上記の計算を整数表現による近似演算により計算しても構わない。例えば、scaleXとscaleYを実際の倍率の値に所定の値（例えば１６）を乗算した整数として計算し、その整数値を用いてxRefTmpやyRefTmpを計算しても構わない。また、対象が色差の画素である場合に、輝度と色差の位相差を考慮した補正を行っても構わない。

　（Ｓ１０３）位相オフセットをパラメターセットに含まれるレイヤ間位相対応情報に基づいて計算する。図１３を参照して説明したレイヤ間位相対応情報を用いる場合、レイヤ間位相対応情報に含まれる参照レイヤ位相オフセットref_layer_left_phase_offset[i]とref_layer_top_phase_offset[i]に基づいて、位相オフセットの水平成分phaseOffsetXと垂直成分phaseOffsetYは次式により計算される。

　　phaseOffsetX = ref_layer_left_phase_offset[rlIdx] ÷ 8
　　phaseOffsetY = ref_layer_left_phase_offset[rlIdx] ÷ 8
ここで、rlIdxは対応参照位置導出処理の時点での参照レイヤを選択するインデックスである。上記の式では、位相オフセットphaseOffsetXとphaseOffsetYが画素単位、参照レイヤ位相オフセットref_layer_left_phase_offset[rlIdx]とref_layer_top_phase_offset[rlIdx]が８分の１画素単位であるため、後者を８で除算した値を位相オフセットの値に設定している。なお、位相オフセットと参照レイヤ位相オフセットがそれぞれ別の単位で表現される場合は、適宜単位の違いに合わせた調整を行うべきであって、必ずしも常に上記式の通りに位相オフセットを設定する必要はない。

　（Ｓ１０４）対象画素(xP,yP)に対する対応参照位置の水平成分xRefと垂直成分yRefは、Ｓ１０２で導出した暫定参照画素位置とＳ１０３で導出した位相オフセットに基づいて計算される。なお、xRefとyRefは参照ピクチャ左上画素を基準とする画素単位での対応参照画素の水平方向、または、垂直方向の位置をそれぞれ表わす。

　　xRef = xRefTmp + phaseOffsetX
　　yRef = yRefTmp + phaseOffsetY
つまり、暫定参照画素位置に位相オフセットを加えた値を対応参照位置として導出している。なお、暫定参照画素位置、位相オフセット、対応参照位置が異なる単位で表現されている場合は、必ずしも上記式に従って対応参照位置を計算する必要はなく、適宜単位を合わせる調整を行うべきである。

　なお、上記式では対応参照位置を画素単位で計算したが、それに限らない。例えば、対応参照位置の整数表現による１６分の１画素単位の値（xRef16,yRef16)を以下の式により計算してもよい。

　　xRef16 = Floor ((xRefTmp + phaseOffestX) * 16)
　　yRef16 = Floor ((yRefTmp + phaseOffsetY) * 16)
　一般に、フィルタ処理の適用に好ましい単位や表現で対応参照位置を導出することが好ましい。例えば、補間フィルタが参照する最小単位と一致する精度の整数表現により対象参照位置を導出することが好ましい。

　以上説明した対応参照位置導出処理により、対象レイヤピクチャ上の対象画素に対応する参照レイヤピクチャ上の位置を対応参照位置として導出できる。

　なお、図１５を参照して説明したレイヤ間位相対応情報を用いる場合、上記の対応参照位置導出処理の手順Ｓ１０３の代わりに下記手順Ｓ１０３ａを実行する。

　（Ｓ１０３ａ）レイヤ間位相対応情報に含まれる参照レイヤクロップオフセットcropped_ref_layer_left_offset[i]とcropped_ref_layer_top_ offset[i]に基づいて、位相オフセットの水平成分phaseOffsetXと垂直成分phaseOffsetYは次式により計算される。

　　croppedOffsetX = (- cropped_ref_layer_left_offset[i] << 1)
　　croppedOffsetY = (- cropped_ref_layer_top_offset[i] << 1)
　　phaseOffsetX = Frac ((xP - croppedOffsetX) * scaleX)
　　phaseOffsetY = Frac ((yP - croppedOffsetY) * scaleY)
ここで、Frac(X)は、Xの小数部分を意味し、Frac(X) = X - Floor(X)の関係がある。

　上記計算式の意味について、図２０を参照して説明する。以下では水平成分についてのみ説明するが、垂直成分についても同じ議論が成り立つ。図２０は参照レイヤクロップオフセットを用いて位相オフセットを計算する場合の計算に用いる点や量の水平成分の関係を例示する図である。

　図２０では、対象レイヤ上に対象画素xP、参照レイヤ対応領域の左上画素xO、対象レイヤ基準画素xBaseがある。xBaseは、x0から参照レイヤクロップオフセットcroppedOffsetX左側の位置にある。参照レイヤ上には、xBaseに対応する画素xBaseRef、xPに対応する画素の位置xRefInt、xPに対応する参照位置（対応参照位置）xRefがある。図に示すように、xRefとxBaseRefの距離Dは、(xP - croppedOffsetX) * scaleXにより計算される。つまり、距離Dは、xPとxBaseの距離である(xP - croppedOffsetX)に、参照レイヤ比率scaleXを乗算して導出される。ここで、xBaseRefは画素、すなわち、整数位置にあることが仮定されているため、xRefIntとxBaseRefの間の距離は距離Dの整数成分（Floor(D)）となる。位相オフセットphaseOffsetX、つまり、xRefとxRefIntの距離は１画素未満であるため、距離Dの小数部分（Frac(D)）の値がphaseOffsetXの値となる。

　レイヤ間位相対応情報に含まれる参照レイヤクロップオフセットを用いて上記Ｓ１０３ａの処理により位相オフセットを導出する場合、対象画素毎に位相オフセットが計算されるため、対象画素位置に依存せず参照レイヤ位相オフセットの値に基づいて位相オフセットを導出するＳ１０３の処理を適用する場合に較べて、対応参照位置導出処理の処理量は増加するが、特に位相オフセットを整数表現による近似値で表現する場合により正確な位相オフセットを導出できるという利点がある。

　補間フィルタ処理では、上記対応参照位置導出処理で導出した対応参照位置に相当する位置の画素値を、参照レイヤピクチャ上の、前記対応参照位置近傍の画素の復号画素に補間フィルタを適用することで生成する。

　（動画像復号装置１の効果）
　以上説明した本実施形態に係る階層動画像復号装置１（階層画像復号装置）は、階層符号化された符号化データに含まれる上位レイヤの符号化データを復号し、対象レイヤである上位レイヤの復号ピクチャを復元する画像復号装置であって、パラメータセットを復号するパラメータセット復号部１２と、参照レイヤピクチャの復号画素を参照して、レイヤ間予測により予測画像を生成する予測画像生成部１４４２を備えており、前記パラメータセット復号部１２は、対象レイヤ画素と該対象レイヤ画素に対応する参照レイヤピクチャ上の位置に係る情報であるレイヤ間位相対応情報を復号する。

　したがって、上記階層動画像復号装置１は、前記レイヤ間位相対応情報を用いて、予測対象画素に対応する参照レイヤピクチャ上の正確な位置を導出できるため、補間処理により生成される予測画素の正確さが向上する。そのため、従来より少ない符号量の符号化データを復号して、上位レイヤの復号ピクチャを出力できる。

　（階層動画像符号化装置の構成）
　図２１を用いて、階層動画像符号化装置２の概略構成を説明する。図２１は、階層動画像符号化装置２の概略的構成を示した機能ブロック図である。階層動画像符号化装置２は、対象レイヤの入力画像ＰＩＮ＃Ｔを、参照レイヤ符号化データＤＡＴＡ＃Ｒを参照しながら符号化して、対象レイヤの階層符号化データＤＡＴＡを生成する。なお、参照レイヤ符号化データＤＡＴＡ＃Ｒは、参照レイヤに対応する階層動画像符号化装置において符号化済みであるとする。

　図２１に示すように階層動画像符号化装置２は、NAL多重化部２１、パラメータセット符号化部２２、タイル設定部２３、スライス符号化部１４、復号ピクチャ管理部１６、および、ベース復号部１５を備える。

　ＮＡＬ多重化部２１は、入力される対象レイヤ符号化データＤＡＴＡ＃Ｔと、参照レイヤ符号化データＤＡＴＡ＃ＲとをＮＡＬユニットに格納することでＮＡＬ多重化した階層動画像符号化データＤＡＴＡを生成し、外部に出力する。

　パラメータセット符号化部２２は、入力されるタイル情報と入力画像に基づいて、入力画像の符号化に用いるパラメータセット（VPS、SPS、および、PPS）を設定して、対象レイヤ符号化データＤＡＴＡ＃Ｔの一部としてVCL NALの形式でパケット化してNAL多重化部２１に供給する。

　パラメータセット符号化部２２が符号化するパラメータセットには、階層動画像復号装置１に関連して説明したピクチャ情報、表示領域情報、および、レイヤ間画素対応情報が少なくとも含まれる。

　タイル設定部２３は、入力画像に基づいてピクチャのタイル情報を設定して、パラメータセット符号化部２２とスライス符号化部２４に供給する。例えば、ピクチャサイズをＭ×Ｎ個のタイルに分割することを示すタイル情報を設定する。ここで、Ｍ、Ｎは任意の正の整数である。また、例えば、ピクチャが所定サイズのタイル（例えば１２８画素×１２８画素のタイル）に分割されるようにタイル情報を設定してもよい。

　スライス符号化部２４は、入力される入力画像、パラメータセット、タイル情報、および、復号ピクチャ管理部１６に記録されている参照ピクチャに基づいて、ピクチャを構成するスライスに対応する入力画像の一部を符号化して、当該部分の符号化データを生成し、対象レイヤ符号化データＤＡＴＡ＃Ｔの一部としてNAL多重化部２１に供給する。スライス符号化部２４の詳細な説明は後述する。

　復号ピクチャ管理部１６は、既に説明した階層動画像復号装置１の備える復号ピクチャ管理部１６と同一の構成要素である。ただし、階層動画像符号化装置２の備える復号ピクチャ管理部１６では、内部のDPBに記録されたピクチャを出力ピクチャとして出力する必要はないため、当該出力は省略できる。なお、階層動画像復号装置１の復号ピクチャ管理部１６の説明において「復号」として説明した記載は「符号化」と置き換えることで、階層動画像符号化装置２の復号ピクチャ管理部１６にも適用できる。

　ベース復号部１５は、既に説明した階層動画像復号装置１の備えるベース復号部１５と同一の構成要素であり、詳細説明は省略する。

　（スライス符号化部）
　次に図２２を参照して、スライス符号化部２４の構成の詳細を説明する。図２２は、スライス符号化部２４の概略的構成を示した機能ブロック図である。

　図２２に示すように、スライス符号化部２４は、スライスヘッダ設定部２４１、スライス位置設定部２４２、CTU符号化部２４４を含む。CTU符号化部２４４は、内部に予測残差符号化部２４４１、予測画像符号化部２４４２、CTU復号画像生成部１４４３を含む。

　スライスヘッダ設定部２４１は、入力されるパラメータセットとスライス位置情報に基づいてスライス単位で入力される入力画像の符号化に用いるスライスヘッダを生成する。生成されたスライスヘッダは、スライス符号化データの一部として出力されるとともに、入力画像と合わせてCTU符号化部２４４に供給される。

　スライスヘッダ設定部２４１で生成されるスライスヘッダには、図１９を参照して説明したSHスライス位置情報が少なくとも含まれる。

　スライス位置設定部２４２は、入力されるタイル情報に基づいてピクチャ内のスライス位置を決定してスライスヘッダ設定部２４１に供給する。

　CTU符号化部２４４は、入力されるパラメータセット、スライスヘッダに基づいて、入力画像（対象スライス部分）をCTU単位で符号化して、対象スライスに係るスライスデータおよび復号画像（復号ピクチャ）を生成して出力する。CTUの符号化は、予測画像符号化部２４４２、予測残差符号化部２４４１、CTU復号画像生成部により実行される。

　予測画像符号化部２４４１は、対象スライスに含まれる対象CTUの予測方式および予測パラメータを決定し、決定した予測方式に基づいて予測画像を生成して予測残差符号化部２４４１とCTU復号画像生成部１４４３に出力する。予測方式や予測パラメータの情報は予測情報（ＰＴ情報）として可変長符号化されて、スライス符号化データに含まれるスライスデータの一部として出力される。予測画像符号化部２４４１で選択可能な予測方式には、少なくともレイヤ間画像予測が含まれている。

　予測画像符号化部２４４１は、予測方式としてレイヤ間画像予測が選択された場合、対応参照位置導出処理を実行して、予測対象画素に対応する参照レイヤ画素位置を決定し、該位置に基づく補間処理により予測画素値を決定する。対応参照位置導出処理としては、階層動画像復号装置１の予測画像生成部１４４２について説明した各処理が適用できる。例えば、図１を参照して説明した処理が適用できる。

　予測残差符号化部２４４１は、入力される入力画像と予測画像の差分画像を、変換・量子化して得られる量子化変換係数（ＴＴ情報）を、スライス符号化データに含まれるスライスデータの一部として出力する。また、量子化変換係数に逆変換・逆量子化を適用して予測残差を復元し、復元した予測残差をCTU復号画像生成部１４４３に出力する。

　CTU復号画像生成部１４４３は、階層動画像復号装置１の同名の構成要素と同じ機能を有しているため、同一の符号を付与して説明を省略する。

　（動画像符号化装置２の効果）
　以上説明した本実施形態に係る階層動画像符号化装置２は、入力画像から上位レイヤの符号化データを生成する画像符号化装置であって、パラメータセットを復号するパラメータセット符号化部２２と、参照レイヤピクチャの復号画素を参照して、レイヤ間予測により予測画像を生成する予測画像符号化部２４４２を備え、前記パラメータセット符号化部２２は、対象レイヤ画素と該対象レイヤ画素に対応する参照レイヤピクチャ上の位置に係る情報であるレイヤ間位相対応情報を符号化し、前記予測画像符号化部２４４２は、レイヤ間予測実行時に、前記レイヤ間位相対応情報に基づいて、予測対象画素に対応する参照レイヤ位置を導出する対応参照位置導出処理を実行する。

　したがって、上記階層動画像符号化装置２は、前記レイヤ間位相対応情報を用いて、予測対象画素に対応する参照レイヤピクチャ上の正確な位置を導出できるため、補間処理により生成される予測画素の正確さが向上する。そのため、従来より少ない符号量で符号化データを生成して出力できる。

　〔階層符号化データ変換装置３〕
　図２３を用いて、階層符号化データ変換装置３の概略構成を説明する。図２３は、階層符号化データ変換装置３の概略的構成を示した機能ブロック図である。階層符号化データ変換装置３は、入力される階層符号化データＤＡＴＡを変換して、入力される注目領域情報に係る階層符号化データＤＡＴＡ－ＲＯＩを生成する。なお、階層符号化データＤＡＴＡは階層動画像符号化装置２により生成された階層符号化データである。また、階層符号化データＤＡＴＡ－ＲＯＩを階層動画像復号装置１に入力することで注目領域情報に係る上位レイヤの動画像を再生できる。

　図２３に示すように、階層符号化データ変換装置３は、NAL逆多重化部１１、NAL多重化部２１、パラメータセット復号部１２、タイル設定部１３、パラメータセット修正部３２、NAL選択部３４を含む。

　NAL逆多重化部１１、パラメータセット復号部１２、タイル設定部１３は、それぞれ、階層動画像復号装置１が含む同名の構成要素と同じ機能を有するため、同一の符号を付与して説明を省略する。

　NAL多重化部２１は、階層動画像符号化装置２が含む同名の構成要素と同じ機能を有するため、同一の符号を付与して説明を省略する。

　パラメータセット修正部３２は、入力される注目領域情報とタイル情報に基づいて、入力されるパラメータセット情報を修正して出力する。パラメータセット修正部３４は、概略的には、パラメータセットに含まれるピクチャ情報、表示領域情報、レイヤ間画素対応情報、レイヤ間位相対応情報、PPSタイル情報を修正する。

　注目領域情報は、動画像を構成するピクチャにおいて、ユーザー（例えば再生動画像の視聴者）が指定するピクチャの部分領域である。注目領域情報は、例えば矩形の領域で指定される。その場合、例えば、注目領域を表わす矩形の上辺、下辺、左辺、右辺のピクチャ全体の対応する辺（上辺、下辺、左辺、または、右辺）からの位置のオフセットを注目領域情報として指定できる。なお、矩形以外の形状の領域（例えば、円、多角形、物体抽出により抽出した物体を示す領域）を注目領域として使用してもよいが、以下では説明の簡単のため矩形の注目領域を想定する。なお、矩形以外の領域に対して、以下に記載する内容を適用する場合、例えば、注目領域を包含する面積最小の矩形を以下の説明における注目領域とみなして適用できる。

　　（変換処理の概略）
　始めに、階層符号化データ変換装置３による変換処理によるパラメータセット修正の概略について、図２４を参照して説明する。図２４は、変換前後の階層符号化データにおけるピクチャ、注目領域、および、タイルの関係を例示した図である。図２４（ａ）は変換前の階層符号化データにおけるピクチャ、注目領域、および、タイルの関係を示している。変換前の階層符号化データのパラメータセットは、ピクチャ（変換前）は垂直、水平方向に各３個、計９個のタイルから構成される（左上からラスタスキャン順にタイルT00、T01、T02、T10、T11、T12、T20、T21、T22）。注目領域はピクチャ右上部分に設定されており、タイルT01、T02、T11、T12と重複する領域を持つ。図２４（ｂ）は変換後の階層符号化データにおけるピクチャ、注目領域、および、タイルの関係を示している。変換後の階層符号化データのパラメータセットは、ピクチャ（変換後）は垂直、水平方向に各２個（タイルT01、T02、T11、T12）、計４個のタイルから構成される。つまり、変換前のピクチャにあったタイルであって、注目領域と重複領域を持たないタイル（タイルT00、T10、T20、T21、T22）は、変換後のピクチャには含まれない。

　概略的には、階層符号化データ変換装置３は、入力される変換前の階層符号化データから、注目領域と重複領域を持たないタイルを取り除き、関連するパラメータセットを修正することで、変換後の階層符号化データを生成する。階層動画像復号装置は、変換後の階層符号化データを入力として、注目領域に係る復号画像を生成できる。

　　（タイル情報の修正）
　パラメータセット修正部３２は、入力される注目領域情報とタイル情報を参照して、対応する領域の一部が注目領域と重複するタイル（抽出対象タイル）のみを含むようPPSタイル情報を更新する。抽出対象タイルの情報に基づいて、PPSタイル情報を更新する。まず、抽出対象タイルが１個の場合、tiles_enabled_flagを０に修正する。なお、抽出対象タイルが２個以上の場合は修正処理は省略できる。次に、ピクチャの水平方向と垂直方向に含まれる抽出対象タイルの個数に基づいて、タイル行数を表わす(nu_tile_columns_minus1）とタイル列数を表わす（num_tile_rows_minus1）を修正する。次に、タイルサイズが不均等（uniform_spacing_flagが０）の場合には、抽出対象タイルを含まないタイル列の幅、抽出対象タイルを含まないタイル行の高さに係るシンタックスに対応するビット列をパラメータセットから削除する。

　　（ピクチャ情報の修正）
　パラメータセット修正部３２は、抽出対象タイルの集合に対応する領域を変換後のピクチャサイズとしてピクチャ情報を修正する。図２４に示した例では、タイルT01、T02をそれぞれ含むタイル列の和を修正後の対象レイヤのピクチャ幅pic_width_in_luma_samplesとして設定する。また、タイルT01、T11をそれぞれ含むタイル行の高さの和を対象レイヤのピクチャの高さpic_height_in_luma_samplesとして設定する。

　　（レイヤ間画素対応情報の修正）
　パラメータセット修正部３２は、ピクチャサイズの変更を踏まえて、パラメータセットに含まれるレイヤ間画素対応情報を修正する。具体的には、レイヤ間画素対応情報に含まれる全てのレイヤ間画素対応オフセットを修正する。レイヤ間画素対応オフセットを構成する、スケール後参照レイヤ左オフセット（scaled_ref_layer_left_offset[i]）は、注目領域より左にあるタイル列であって、抽出対象タイルを含まないタイル列の幅の和が加算される。例えば、図２４の例では、タイルT00を含むタイル列の幅が加算される。同様に、スケール後参照レイヤ上オフセット（scaled_ref_layer_top_offset[i]）は、注目領域より上にあるタイル行であって、抽出対象タイルを含まないタイル行の高さの和が加算される。同様に、スケール後参照レイヤ右オフセット（scaled_ref_layer_right_offset[i]）には、注目領域より右にあるタイル列であって、抽出対象タイルを含まないタイル列の幅の和が加算される。同様に、スケール後参照レイヤ下オフセット（scaled_ref_layer_bottom_offset[i]）には、注目領域より下にあるタイル行であって、抽出対象タイルを含まないタイル行の高さの和が加算される。

　　（レイヤ間位相対応情報の修正）
　パラメータセット修正部３２は、ピクチャサイズの変更を踏まえて、パラメータセットに含まれるレイヤ間位相対応情報を修正する。レイヤ間位相対応情報の修正は、概略的には、変換後のピクチャの左上画素の位相が、変換前の同じ画素の位相と一致するように修正される。言い換えると、変換前の抽出対象領域の左上画素（抽出対象タイルの中で最も左上に位置するタイルの左上画素）において、対応参照位置導出処理で導出される位相が、変換後のピクチャの左上画素において、対象参照位置導出処理で導出される位相と一致するように修正される。なお、必ずしも完全に一致するように修正される必要はなく、修正を行わない場合に較べて、位相が近くなるように修正すれば本発明による効果は得られる。

　レイヤ間位相対応情報として、参照レイヤ位相オフセットを用いる場合、具体的な修正処理は次の通りである。まず、上位レイヤピクチャの抽出対象領域の左上画素xLO、yL0に対する対応参照位置xLORef、yL0Refを計算する。対象参照位置の導出には、例えば、修正前のパラメータセットを参照して、階層動画像復号装置の予測画像生成部１４４２で説明した対応参照位置導出処理を適用すればよい。次に、変換後の上位レイヤピクチャの左上画素xLA、yLAに対する暫定対応参照位置xLARefTmp、yLARefTmpを、参照レイヤ位相オフセットを０に設定した修正後のパラメータセットを参照して導出する。修正後の参照レイヤ左位相オフセットをphaseLAft、参照レイヤ上位相オフセットをphaseTAftとすると、修正後の参照レイヤオフセットは次式により決定できる。

　　phaseLAft = Frac(Frac(xLORef)- Frac(xLARefTmp))
　　phaseTAft = Frac(Frac(yLORef) - Frac(yLARefTmp))
上記の式は、修正後の参照レイヤ位相オフセットと、変換後のピクチャ左上画素の参照レイヤ位相オフセットが０の場合の対応参照位置の和の小数部分が、変換前の抽出対応領域の左上画素の対応参照位置の小数部分に一致することから、導かれた式である。

　　（表示領域情報の修正）
　パラメータセット修正部３２は、入力される注目領域情報の示す注目領域と一致するように、入力されるパラメータセットに含まれるSPSの表示領域情報を書き換える。SPSの表示領域情報として図９を参照して説明したシンタックスを用いる場合、表示領域情報は次のＳ３０１からＳ３０３の手順で書き換えられる。

　（Ｓ３０１）注目領域がピクチャ全体と一致するか否かを判定する。一致する場合、Ｓ３０２に進み、一致しない場合、Ｓ３０３に進む。

　（Ｓ３０２）上書き前の表示領域フラグの値が１であった場合には、当該表示領域フラグの値を０に上書きし、かつ、表示領域オフセット（conf_win_left_offset、conf_win_right_offset、conf_win_top_offset、conf_win_bottom_offset）をSPSから取り除いて処理を終了する。

　（Ｓ３０３）表示領域フラグの値を１に上書きする。表示領域オフセットの各オフセットを注目領域を表わす矩形の各辺のピクチャの対応する辺との位置のオフセットの値に設定する。例えば、注目領域上辺のピクチャ上辺に対する位置オフセットを表示領域上オフセット（conf_win_top_offset）の値に設定する。なお、書き換え前の表示領域フラグの値が１であった場合には、上記設定した注目領域オフセットの値を用いて、元の注目領域オフセットの値を上書きする。書き換え前の表示領域フラグの値が１であった場合には、上記設定した注目領域オフセットをSPSの表示領域フラグの直後に挿入する。

　NAL選択部３４は、入力される注目領域情報とタイル情報に基づいて、入力されるビデオ符号化レイヤNAL（VCL NAL）の選択を行う。選択されたVCL NALはNAL多重化部２１に順次出力され、選択されなかったVCL NALは破棄される。

　NAL選択部３４で選択されるVCL NALは、抽出対象タイルに含まれるスライスに関するスライスヘッダおよびスライスデータを含むVCL NALである。抽出対象タイルは、図２４を参照して説明したように、注目領域情報とタイル情報に基づいて決定される。NAL選択部３４は、スライスヘッダに含まれるスライスアドレスとタイル情報から、スライスが抽出対象タイルに含まれているかを判定し、含まれている場合は当該スライスを含むVCL NALを選択し、含まれていない場合は該VCL NALを破棄する。

　　（階層符号化データ変換処理フロー）
　階層符号化データ変換装置３による階層符号化データ変換処理は、Ｓ５０１～Ｓ５０６に示す手順を順次実行することで実現される。

　（Ｓ５０１）NAL逆多重化部１１は、入力された階層符号化データＤＡＴＡを逆多重化する。得られた対象レイヤ符号化データＤＡＴＡ＃Ｔのうち、パラメータセットに係る部分（非VCL NAL）をパラメータ復号部１２に出力し、スライスレイヤ（スライスヘッダ、スライスデータ）に係る部分であるビデオ符号化レイヤNAL（VCL NAL）をNAL選択部３４に出力する。得られた参照レイヤ符号化データＤＡＴＡ＃ＲはNAL逆多重化部２１に出力される。

　（Ｓ５０２）パラメータセット復号部１２は、入力された非VCL NALからパラメータセット（VPS、SPS、PPS）を復号して、パラメータセット修正部３２とタイル設定部１３に出力する。

　（Ｓ５０３）タイル設定部１３は、入力されるパラメータセットからタイル情報を導出してパラメータセット修正部３２とNAL選択部３４に出力する。

　（Ｓ５０４）パラメータセット修正部３２は、入力される注目領域情報とタイル情報に基づいて入力されるパラメータセットを修正して出力する。

　（Ｓ５０５）NAL選択部３４は、入力されるタイル情報と注目領域情報に基づいて、入力されるVCL NALの一部を選択し、選択したVCL NALをNAL多重化部２１に出力する。

　（Ｓ５０６）NAL多重化部２１は、入力される修正後のパラメータセットと修正後のスライスヘッダとスライスデータを修正後の対象レイヤの符号化データとして、入力される参照レイヤ符号化データＤＡＴＡ＃Ｒと多重化して階層符号化データＤＡＴＡ－ＲＯＩとして外部に出力する。

　（階層符号化データ変換装置３の効果）
　以上説明した本実施形態に係る階層符号化データ変換装置３は、対象レイヤ（上位レイヤ）の符号化データに含まれるビデオレイヤの符号化データ（VCL NAL）の一部を注目領域情報に基づいて修正するＮＡＬ選択部３４と、階層符号化データ変換装置３はパラメータセット修正部３２を備えている。ＮＡＬ選択部３４は、注目領域情報の示す注目領域に基づいて、注目領域と重複する領域をもつタイルを抽出対象タイルとして選択し、前記選択した抽出対象タイルに含まれるスライスに係るビデオレイヤの符号化データが変換後の階層符号化データに含まれる。パラメータセット修正部３２は、注目領域情報とタイル情報に基づいて、ピクチャ情報、PPSタイル情報、表示情報、レイヤ間画素対応情報、および、レイヤ間位相対応情報を修正する。

　上記の階層符号化データ変換装置３によれば、入力された階層符号化データを変換して、上位レイヤにおいて抽出対象タイル（注目領域と重複した領域を持つタイル）に係るVCL NALを抽出して、変換後の階層符号化データを構成できる。注目領域と重複領域を持たないタイルに係るVCL NALは破棄されるため、変換後の階層符号化データの符号量は、変換前の階層符号化データに較べて少ない。また、上記の階層符号化データ変換装置３によれば、パラメータセットを、抽出対象タイルに合わせてピクチャ情報、PPSタイル情報、表示情報を修正するため、変換後の階層符号化データは階層動画像復号装置により復号でき、注目領域に係る復号ピクチャを表示できる。加えて、レイヤ間画素対応情報とレイヤ間位相対応情報が修正されるため、変換前後の符号化データで上位レイヤの画素と参照レイヤの画素の対応関係が維持される。そのため、変換前の符号化データにより生成されるレイヤ間予測の予測画像と変換後の符号化データにより生成されるレイヤ間予測の予測画像が同程度に維持できる。

　〔注目領域表示システム〕
　上述した階層動画像復号装置１、階層動画像符号化装置２、及び、階層符号化データ変換装置３を組み合わせて、注目領域情報を表示するシステム（注目領域表示システムＳＹＳ）を構成できる。

　図２５に基づいて、上述した階層動画像復号装置１、階層動画像符号化装置２、及び、階層符号化データ変換装置３の組み合わせにより、注目領域表示システムが構成できることを説明する。図２５は、階層動画像復号装置１、階層動画像符号化装置２、及び、階層符号化データ変換装置３の組み合わせによる注目領域表示システムの構成を示したブロック図である。注目領域表示システムＳＹＳは、概略的には、品質の異なる入力画像を階層符号化して蓄積しておき、ユーザーからの注目領域情報に応じて蓄積された階層符号化データを変換して提供し、変換した階層符号化データを復号することで注目領域（ＲＯＩ）に係る高品質の再生画像を表示する。

　図２５に示すように、注目領域表示システムＳＹＳは、階層動画像符号化部ＳＹＳ１Ａ、階層動画像符号化部ＳＹＳ１Ｂ、階層符号化データ蓄積部ＳＹＳ２、階層符号化データ変換部ＳＹＳ３、階層動画像復号部ＳＹＳ４、表示制御部ＳＹＳ５、ＲＯＩ表示部ＳＹＳ６、全体表示部ＳＹＳ７、ＲＯＩ通知部ＳＹＳ８を構成要素として含む。

　階層動画像符号化部ＳＹＳ１Ａ、ＳＹＳ１Ｂには、前述の階層動画像符号化装置２を利用できる。

　階層符号化データ蓄積部ＳＹＳ２は、階層符号化データを蓄積し、要求に応じて階層符号化データを供給する。階層符号化データ蓄積部ＳＹＳ２として、記録媒体（メモリ、ハードディスク、光学ディスク）を備えたコンピュータが利用できる。

　階層符号化データ変換部ＳＹＳ３には、前述の階層符号化データ変換部３が利用できる。

　階層動画像復号部ＳＹＳ４には、前述の階層動画像復号装置１が利用できる。

　表示制御部ＳＹＳ５は、注目領域情報に基づいて、復号ピクチャをＲＯＩ表示画像としてＲＯＩ表示部ＳＹＳ６に提供するか、または、復号ピクチャを全体表示画像として全体表示部ＳＹＳ７に供給する。

　表示制御部ＳＹＳ５は、注目領域情報で注目領域が指定されている場合、階層動画像復号部から入力される復号ピクチャであって、下位レイヤの復号ピクチャを全体表示画像として全体表示部ＳＹＳ７に供給する一方で、ＲＯＩ表示部ＳＹＳ６には、階層動画像復号部から入力される復号ピクチャであって、上位レイヤの復号ピクチャをＲＯＩ表示画像としてＲＯＩ表示部ＳＹＳ６に供給する。なお、注目領域情報で注目領域が指定されていない場合、ＲＯＩ表示部ＳＹＳ６にはＲＯＩ表示画像は供給されない。

　表示制御部ＳＹＳ５は、注目領域情報で注目領域が指定されている場合、階層動画像復号部から入力される復号ピクチャであって、下位レイヤの復号ピクチャを全体表示画像として全体表示部ＳＹＳ７に供給する一方で、ＲＯＩ表示部ＳＹＳ６には復号ピクチャを供給しない。

　なお、表示制御部ＳＹＳ５は、注目領域情報が変更された場合に、当該注目領域情報に係る階層符号化データの上位レイヤの復号ピクチャが階層動画像復号部ＳＹＳ４から供給されるまでの間、階層符号化データの下位レイヤの復号ピクチャの部分領域であって、注目領域に対応する部分をＲＯＩ表示画像としてＲＯＩ表示部ＳＹＳ６に供給しても構わない。下位レイヤの復号ピクチャの部分領域であって、注目領域に対応する部分は、該注目領域に係る上位レイヤの復号ピクチャに較べて画質は低いが、ユーザーが注目領域の指定後に、階層符号化データ変換部への通知及び変換処理に伴う遅延を待たずに注目領域をＲＯＩ表示部ＳＹＳ６に表示ができるという利点がある。

　ＲＯＩ表示部ＳＹＳ６は、ＲＯＩ表示画像を所定の表示領域の所定の表示位置に表示する。例えば、表示領域はテレビの画面であり、表示位置はその部分領域（例えば右上隅の矩形領域）である。また、例えば、表示領域は携帯型端末（スマートフォンやタブレット型コンピュータ）のディスプレイであり、表示位置はその全体である。

　全体表示部ＳＹＳ７は、全体表示画像を所定の表示領域の所定の表示位置に表示する。例えば、表示領域はテレビの画面であり、表示位置はその全体である。なお、全体表示部ＳＹＳ７とＲＯＩ表示部ＳＹＳ６の表示領域が同じ場合、ＲＯＩ表示画像を全体表示画像の上に重ねるように表示することが好ましい。なお、ＲＯＩ表示部ＳＹＳ６および全体表示部ＳＹＳ７は、入力される画像を表示領域のサイズに一致するサイズに拡大または縮小して表示しても構わない。

　ＲＯＩ通知部ＳＹＳ８は、所定の方法でユーザーが指定した注目領域情報を通知する。例えば、ユーザーは全体表示画像が表示された表示領域上で、注目領域に相当する領域を指定することでＲＯＩ通知部に注目領域を伝えることができる。なお、ＲＯＩ通知部ＳＹＳ８は、ユーザーの指定がない場合は、注目領域が無いことを示す情報を注目領域情報として通知する。

　　（注目領域表示システムのフロー）
　注目領域表示システムによる処理は、階層符号化データ生成蓄積処理と注目領域データ生成再生処理に分けることができる。

　階層符号化データ生成蓄積処理では、異なる品質の入力画像から階層符号化データを生成して蓄積する。階層符号化データ生成蓄積処理は、Ｔ１０１からＴ１０３の手順で実行される。

　（Ｔ１０１）階層動画像符号化部ＳＹＳ１Ｂは、入力される低品質の入力画像を符号化し、生成された階層符号化データを階層動画像符号化部ＳＹＳ１Ａに供給する。つまり、階層動画像符号化部ＳＹＳ１Ｂは、入力画像から、階層動画像符号化部ＳＹＳ１Ａにおいて参照レイヤ（下位レイヤ）として使用される階層符号化データを生成して出力する。

　（Ｔ１０２）階層動画像符号化部ＳＹＳ１Ａは、入力される高品質の入力画像を、入力された階層符号化データを参照レイヤの符号化データとして符号化し、階層符号化データを生成して階層符号化データ蓄積部ＳＹＳ２に出力する。

　（Ｔ１０３）階層符号化データ蓄積部ＳＹＳ２は、入力された階層符号化データに適切なインデックスを付けて内部の記録媒体に記録する。

　注目領域データ生成再生処理では、階層符号化データ蓄積部ＳＹＳ２から階層符号化データを読み出し、注目領域に相当する階層符号化データに変換し、変換した階層符号化データを復号して再生及び表示する。注目領域データ生成再生処理は、以下のＴ２０１～Ｔ２０７の手順で実行される。

　（Ｔ２０１）ユーザーの選択した動画像に関する階層符号化データが階層符号化データ蓄積部ＳＹＳ２から階層符号化データ変換部ＳＹＳ３に供給される。

　（Ｔ２０２）ＲＯＩ通知部ＳＹＳ８は、ユーザーの指定した注目領域情報を階層符号化データ変換部ＳＹＳ３、および、表示制御部ＳＹＳ５に通知する。

　（Ｔ２０３）階層符号化データ変換部ＳＹＳ３は、入力された注目領域情報に基づいて、入力された階層符号化データを変換して、階層動画像復号部ＳＹＳ４に出力する。

　（Ｔ２０４）階層動画像復号部ＳＹＳ４は、入力された階層動画像符号化データ（変換後）を復号して、再生された上位レイヤおよび下位レイヤの復号ピクチャを表示制御部ＳＹＳ５に出力する。

　（Ｔ２０５）表示制御部ＳＹＳ５は、入力された注目領域情報に基づいて、入力された復号ピクチャをＲＯＩ表示部ＳＹＳ６および全体表示部ＳＹＳ７に出力する。

　（Ｔ２０６）全体表示部ＳＹＳ７は、入力された全体表示画像を表示する。

　（Ｔ２０７）ＲＯＩ表示部ＳＹＳ６は、入力されたＲＯＩ表示画像を表示する。

　　（注目領域表示システムＳＹＳの効果）
　以上説明した本実施形態に係る注目領域表示システムＳＹＳは、注目領域情報を供給する注目領域通知部（ＲＯＩ通知部ＳＹＳ８）と、前記注目領域情報に基づいて階層符号化データを変換して変換後階層符号化データを生成する階層符号化データ変換部ＳＹＳ３と、上記変換後階層符号化データを復号して上位レイヤ及び下位レイヤの復号ピクチャを出力する階層動画像復号部ＳＹＳ４と、表示制御部ＳＹＳ５、注目領域表示部（ＲＯＩ表示部ＳＹＳ６），および、全体表示部ＳＹＳ７を備えている。前記表示制御部ＳＹＳ５は、前記下位レイヤの復号ピクチャを全体表示部ＳＹＳ７に供給し、かつ、前記上位レイヤの復号ピクチャを注目領域表示部に供給する。

　上記の注目領域表示システムＳＹＳによれば、下位レイヤの復号ピクチャの全体を表示し、かつ、注目領域情報により指定された領域の復号ピクチャを表示できる。その際、注目領域情報により指定された領域の復号ピクチャは、階層符号化データの上位レイヤの符号化データを用いて復号されるため、画質が高い。加えて、注目領域に基づいて変換された階層符号化データは、変換前の階層符号化データよりも符号量が少ない。したがって、上記の注目領域表示システムＳＹＳを用いることで、階層符号化データの転送に要する帯域を削減しつつ、注目領域に係る画質の高い復号ピクチャを再生できる。

　（他の階層動画像符号化／復号システムへの適用例）
　上述した階層動画像符号化装置２及び階層動画像復号装置１は、動画像の送信、受信、記録、再生を行う各種装置に搭載して利用できる。なお、動画像は、カメラ等により撮像された自然動画像であってもよいし、コンピュータ等により生成された人工動画像（ＣＧおよびＧＵＩを含む）であってもよい。

　図２６に基づいて、上述した階層動画像符号化装置２および階層動画像復号装置１を、動画像の送信および受信に利用できることを説明する。図２６の（ａ）は、階層動画像符号化装置２を搭載した送信装置ＰＲＯＤ＿Ａの構成を示したブロック図である。

　図２６の（ａ）に示すように、送信装置ＰＲＯＤ＿Ａは、動画像を符号化することによって符号化データを得る符号化部ＰＲＯＤ＿Ａ１と、符号化部ＰＲＯＤ＿Ａ１が得た符号化データで搬送波を変調することによって変調信号を得る変調部ＰＲＯＤ＿Ａ２と、変調部ＰＲＯＤ＿Ａ２が得た変調信号を送信する送信部ＰＲＯＤ＿Ａ３とを備えている。上述した階層動画像符号化装置２は、この符号化部ＰＲＯＤ＿Ａ１として利用される。

　送信装置ＰＲＯＤ＿Ａは、符号化部ＰＲＯＤ＿Ａ１に入力する動画像の供給源として、動画像を撮像するカメラＰＲＯＤ＿Ａ４、動画像を記録した記録媒体ＰＲＯＤ＿Ａ５、動画像を外部から入力するための入力端子ＰＲＯＤ＿Ａ６、及び、画像を生成または加工する画像処理部Ａ７を更に備えていてもよい。図２６の（ａ）においては、これら全てを送信装置ＰＲＯＤ＿Ａが備えた構成を例示しているが、一部を省略しても構わない。

　なお、記録媒体ＰＲＯＤ＿Ａ５は、符号化されていない動画像を記録したものであってもよいし、伝送用の符号化方式とは異なる記録用の符号化方式で符号化された動画像を記録したものであってもよい。後者の場合、記録媒体ＰＲＯＤ＿Ａ５と符号化部ＰＲＯＤ＿Ａ１との間に、記録媒体ＰＲＯＤ＿Ａ５から読み出した符号化データを記録用の符号化方式に従って復号する復号部（不図示）を介在させるとよい。

　図２６の（ｂ）は、階層動画像復号装置１を搭載した受信装置ＰＲＯＤ＿Ｂの構成を示したブロック図である。図２６の（ｂ）に示すように、受信装置ＰＲＯＤ＿Ｂは、変調信号を受信する受信部ＰＲＯＤ＿Ｂ１と、受信部ＰＲＯＤ＿Ｂ１が受信した変調信号を復調することによって符号化データを得る復調部ＰＲＯＤ＿Ｂ２と、復調部ＰＲＯＤ＿Ｂ２が得た符号化データを復号することによって動画像を得る復号部ＰＲＯＤ＿Ｂ３とを備えている。上述した階層動画像復号装置１は、この復号部ＰＲＯＤ＿Ｂ３として利用される。

　受信装置ＰＲＯＤ＿Ｂは、復号部ＰＲＯＤ＿Ｂ３が出力する動画像の供給先として、動画像を表示するディスプレイＰＲＯＤ＿Ｂ４、動画像を記録するための記録媒体ＰＲＯＤ＿Ｂ５、及び、動画像を外部に出力するための出力端子ＰＲＯＤ＿Ｂ６を更に備えていてもよい。図２６の（ｂ）においては、これら全てを受信装置ＰＲＯＤ＿Ｂが備えた構成を例示しているが、一部を省略しても構わない。

　なお、記録媒体ＰＲＯＤ＿Ｂ５は、符号化されていない動画像を記録するためのものであってもよいし、伝送用の符号化方式とは異なる記録用の符号化方式で符号化されたものであってもよい。後者の場合、復号部ＰＲＯＤ＿Ｂ３と記録媒体ＰＲＯＤ＿Ｂ５との間に、復号部ＰＲＯＤ＿Ｂ３から取得した動画像を記録用の符号化方式に従って符号化する符号化部（不図示）を介在させるとよい。

　なお、変調信号を伝送する伝送媒体は、無線であってもよいし、有線であってもよい。また、変調信号を伝送する伝送態様は、放送（ここでは、送信先が予め特定されていない送信態様を指す）であってもよいし、通信（ここでは、送信先が予め特定されている送信態様を指す）であってもよい。すなわち、変調信号の伝送は、無線放送、有線放送、無線通信、及び有線通信の何れによって実現してもよい。

　例えば、地上デジタル放送の放送局（放送設備など）／受信局（テレビジョン受像機など）は、変調信号を無線放送で送受信する送信装置ＰＲＯＤ＿Ａ／受信装置ＰＲＯＤ＿Ｂの一例である。また、ケーブルテレビ放送の放送局（放送設備など）／受信局（テレビジョン受像機など）は、変調信号を有線放送で送受信する送信装置ＰＲＯＤ＿Ａ／受信装置ＰＲＯＤ＿Ｂの一例である。

　また、インターネットを用いたＶＯＤ（Video On Demand）サービスや動画共有サービスなどのサーバ（ワークステーションなど）／クライアント（テレビジョン受像機、パーソナルコンピュータ、スマートフォンなど）は、変調信号を通信で送受信する送信装置ＰＲＯＤ＿Ａ／受信装置ＰＲＯＤ＿Ｂの一例である（通常、ＬＡＮにおいては伝送媒体として無線又は有線の何れかが用いられ、ＷＡＮにおいては伝送媒体として有線が用いられる）。ここで、パーソナルコンピュータには、デスクトップ型ＰＣ、ラップトップ型ＰＣ、及びタブレット型ＰＣが含まれる。また、スマートフォンには、多機能携帯電話端末も含まれる。

　なお、動画共有サービスのクライアントは、サーバからダウンロードした符号化データを復号してディスプレイに表示する機能に加え、カメラで撮像した動画像を符号化してサーバにアップロードする機能を有している。すなわち、動画共有サービスのクライアントは、送信装置ＰＲＯＤ＿Ａ及び受信装置ＰＲＯＤ＿Ｂの双方として機能する。

　図２７に基づいて、上述した階層動画像符号化装置２および階層動画像復号装置１を、動画像の記録および再生に利用できることを説明する。図２７の（ａ）は、上述した階層動画像符号化装置２を搭載した記録装置ＰＲＯＤ＿Ｃの構成を示したブロック図である。

　図２７の（ａ）に示すように、記録装置ＰＲＯＤ＿Ｃは、動画像を符号化することによって符号化データを得る符号化部ＰＲＯＤ＿Ｃ１と、符号化部ＰＲＯＤ＿Ｃ１が得た符号化データを記録媒体ＰＲＯＤ＿Ｍに書き込む書込部ＰＲＯＤ＿Ｃ２と、を備えている。上述した階層動画像符号化装置２は、この符号化部ＰＲＯＤ＿Ｃ１として利用される。

　なお、記録媒体ＰＲＯＤ＿Ｍは、（１）ＨＤＤ（Hard Disk Drive）やＳＳＤ(Solid State Drive)等のように、記録装置ＰＲＯＤ＿Ｃに内蔵されるタイプのものであってもよいし、（２）ＳＤメモリカードやＵＳＢ（Universal Serial Bus）フラッシュメモリ等のように、記録装置ＰＲＯＤ＿Ｃに接続されるタイプのものであってもよいし、（３）ＤＶＤ（Digital Versatile Disc）やＢＤ（Blu-ray Disc:登録商標）等のように、記録装置ＰＲＯＤ＿Ｃに内蔵されたドライブ装置（不図示）に装填されるものであってもよい。

　また、記録装置ＰＲＯＤ＿Ｃは、符号化部ＰＲＯＤ＿Ｃ１に入力する動画像の供給源として、動画像を撮像するカメラＰＲＯＤ＿Ｃ３、動画像を外部から入力するための入力端子ＰＲＯＤ＿Ｃ４、動画像を受信するための受信部ＰＲＯＤ＿Ｃ５、及び、画像を生成または加工する画像処理部Ｃ６を更に備えていてもよい。図２７の（ａ）においては、これら全てを記録装置ＰＲＯＤ＿Ｃが備えた構成を例示しているが、一部を省略しても構わない。

　なお、受信部ＰＲＯＤ＿Ｃ５は、符号化されていない動画像を受信するものであってもよいし、記録用の符号化方式とは異なる伝送用の符号化方式で符号化された符号化データを受信するものであってもよい。後者の場合、受信部ＰＲＯＤ＿Ｃ５と符号化部ＰＲＯＤ＿Ｃ１との間に、伝送用の符号化方式で符号化された符号化データを復号する伝送用復号部（不図示）を介在させるとよい。

　このような記録装置ＰＲＯＤ＿Ｃとしては、例えば、ＤＶＤレコーダ、ＢＤレコーダ、ＨＤＤ（Hard Disk Drive）レコーダなどが挙げられる（この場合、入力端子ＰＲＯＤ＿Ｃ４又は受信部ＰＲＯＤ＿Ｃ５が動画像の主な供給源となる）。また、カムコーダ（この場合、カメラＰＲＯＤ＿Ｃ３が動画像の主な供給源となる）、パーソナルコンピュータ（この場合、受信部ＰＲＯＤ＿Ｃ５又は画像処理部Ｃ６が動画像の主な供給源となる）、スマートフォン（この場合、カメラＰＲＯＤ＿Ｃ３又は受信部ＰＲＯＤ＿Ｃ５が動画像の主な供給源となる）なども、このような記録装置ＰＲＯＤ＿Ｃの一例である。

　図２７の（ｂ）は、上述した階層動画像復号装置１を搭載した再生装置ＰＲＯＤ＿Ｄの構成を示したブロックである。図２７の（ｂ）に示すように、再生装置ＰＲＯＤ＿Ｄは、記録媒体ＰＲＯＤ＿Ｍに書き込まれた符号化データを読み出す読出部ＰＲＯＤ＿Ｄ１と、読出部ＰＲＯＤ＿Ｄ１が読み出した符号化データを復号することによって動画像を得る復号部ＰＲＯＤ＿Ｄ２と、を備えている。上述した階層動画像復号装置１は、この復号部ＰＲＯＤ＿Ｄ２として利用される。

　なお、記録媒体ＰＲＯＤ＿Ｍは、（１）ＨＤＤやＳＳＤなどのように、再生装置ＰＲＯＤ＿Ｄに内蔵されるタイプのものであってもよいし、（２）ＳＤメモリカードやＵＳＢフラッシュメモリなどのように、再生装置ＰＲＯＤ＿Ｄに接続されるタイプのものであってもよいし、（３）ＤＶＤやＢＤなどのように、再生装置ＰＲＯＤ＿Ｄに内蔵されたドライブ装置（不図示）に装填されるものであってもよい。

　また、再生装置ＰＲＯＤ＿Ｄは、復号部ＰＲＯＤ＿Ｄ２が出力する動画像の供給先として、動画像を表示するディスプレイＰＲＯＤ＿Ｄ３、動画像を外部に出力するための出力端子ＰＲＯＤ＿Ｄ４、及び、動画像を送信する送信部ＰＲＯＤ＿Ｄ５を更に備えていてもよい。図２７の（ｂ）においては、これら全てを再生装置ＰＲＯＤ＿Ｄが備えた構成を例示しているが、一部を省略しても構わない。

　なお、送信部ＰＲＯＤ＿Ｄ５は、符号化されていない動画像を送信するものであってもよいし、記録用の符号化方式とは異なる伝送用の符号化方式で符号化された符号化データを送信するものであってもよい。後者の場合、復号部ＰＲＯＤ＿Ｄ２と送信部ＰＲＯＤ＿Ｄ５との間に、動画像を伝送用の符号化方式で符号化する符号化部（不図示）を介在させるとよい。

　このような再生装置ＰＲＯＤ＿Ｄとしては、例えば、ＤＶＤプレイヤ、ＢＤプレイヤ、ＨＤＤプレイヤなどが挙げられる（この場合、テレビジョン受像機等が接続される出力端子ＰＲＯＤ＿Ｄ４が動画像の主な供給先となる）。また、テレビジョン受像機（この場合、ディスプレイＰＲＯＤ＿Ｄ３が動画像の主な供給先となる）、デジタルサイネージ（電子看板や電子掲示板等とも称され、ディスプレイＰＲＯＤ＿Ｄ３又は送信部ＰＲＯＤ＿Ｄ５が動画像の主な供給先となる）、デスクトップ型ＰＣ（この場合、出力端子ＰＲＯＤ＿Ｄ４又は送信部ＰＲＯＤ＿Ｄ５が動画像の主な供給先となる）、ラップトップ型又はタブレット型ＰＣ（この場合、ディスプレイＰＲＯＤ＿Ｄ３又は送信部ＰＲＯＤ＿Ｄ５が動画像の主な供給先となる）、スマートフォン（この場合、ディスプレイＰＲＯＤ＿Ｄ３又は送信部ＰＲＯＤ＿Ｄ５が動画像の主な供給先となる）なども、このような再生装置ＰＲＯＤ＿Ｄの一例である。

　（ハードウェア的実現およびソフトウェア的実現について）
　最後に、階層動画像復号装置１、階層動画像符号化装置２の各ブロックは、集積回路（ＩＣチップ）上に形成された論理回路によってハードウェア的に実現してもよいし、ＣＰＵ（Central Processing Unit）を用いてソフトウェア的に実現してもよい。

　後者の場合、上記各装置は、各機能を実現する制御プログラムの命令を実行するＣＰＵ、上記プログラムを格納したＲＯＭ（Read Only Memory）、上記プログラムを展開するＲＡＭ（Random Access Memory）、上記プログラムおよび各種データを格納するメモリ等の記憶装置（記録媒体）などを備えている。そして、本発明の目的は、上述した機能を実現するソフトウェアである上記各装置の制御プログラムのプログラムコード（実行形式プログラム、中間コードプログラム、ソースプログラム）をコンピュータで読み取り可能に記録した記録媒体を、上記各装置に供給し、そのコンピュータ（またはＣＰＵやＭＰＵ（Micro Processing Unit））が記録媒体に記録されているプログラムコードを読み出し実行することによっても、達成可能である。

　上記記録媒体としては、例えば、磁気テープやカセットテープ等のテープ類、フロッピー（登録商標）ディスク／ハードディスク等の磁気ディスクやＣＤ－ＲＯＭ（Compact Disc Read-Only Memory）／ＭＯ（Magneto-Optical）／ＭＤ（Mini Disc）／ＤＶＤ（Digital Versatile Disk）／ＣＤ－Ｒ（CD Recordable）等の光ディスクを含むディスク類、ＩＣカード（メモリカードを含む）／光カード等のカード類、マスクＲＯＭ／ＥＰＲＯＭ（Erasable Programmable Read-only Memory）／ＥＥＰＲＯＭ（登録商標）（ElectricallyErasable and Programmable Read-only Memory）／フラッシュＲＯＭ等の半導体メモリ類、あるいはＰＬＤ（Programmable Logic Device）やＦＰＧＡ（Field Programmable Gate Array）等の論理回路類などを用いることができる。

　また、上記各装置を通信ネットワークと接続可能に構成し、上記プログラムコードを通信ネットワークを介して供給してもよい。この通信ネットワークは、プログラムコードを伝送可能であればよく、特に限定されない。例えば、インターネット、イントラネット、エキストラネット、ＬＡＮ（Local Area Network）、ＩＳＤＮ（Integrated Services Digital Network）、ＶＡＮ（Value-Added Network）、ＣＡＴＶ（Community Antenna Television）通信網、仮想専用網（Virtual Private Network）、電話回線網、移動体通信網、衛星通信網等が利用可能である。また、この通信ネットワークを構成する伝送媒体も、プログラムコードを伝送可能な媒体であればよく、特定の構成または種類のものに限定されない。例えば、ＩＥＥＥ（Institute of Electrical and Electronic Engineers）１３９４、ＵＳＢ、電力線搬送、ケーブルＴＶ回線、電話線、ＡＤＳＬ（Asymmetric DigitalSubscriber Line）回線等の有線でも、ＩｒＤＡ（Infrared Data Association）やリモコンのような赤外線、Ｂｌｕｅｔｏｏｔｈ（登録商標）、ＩＥＥＥ８０２．１１無線、ＨＤＲ（High Data Rate）、ＮＦＣ（Near Field Communication）、ＤＬＮＡ（Digital Living Network Alliance）（登録商標）、携帯電話網、衛星回線、地上波デジタル網等の無線でも利用可能である。なお、本発明は、上記プログラムコードが電子的な伝送で具現化された、搬送波に埋め込まれたコンピュータデータ信号の形態でも実現され得る。

　本発明は上述した各実施形態に限定されるものではなく、請求項に示した範囲で種々の変更が可能であり、異なる実施形態にそれぞれ開示された技術的手段を適宜組み合わせて得られる実施形態についても本発明の技術的範囲に含まれる。さらに、各実施形態にそれぞれ開示された技術的手段を組み合わせることにより、新しい技術的特徴を形成することができる。

　〔付記事項〕
　上記課題を解決するために、本発明に係る画像復号装置は、階層符号化された符号化データに含まれる上位レイヤの符号化データを復号し、対象レイヤである上位レイヤの復号ピクチャを復元する画像復号装置であって、パラメータセットを復号するパラメータセット復号部と、参照レイヤピクチャの復号画素を参照して、レイヤ間予測により予測画像を生成する予測画像生成部を備え、前記パラメータセット復号部は、対象レイヤ画素と該対象レイヤ画素に対応する参照レイヤピクチャ上の位置に係る情報であるレイヤ間位相対応情報を復号することを特徴としている。

　また、上記画像復号装置において、前記レイヤ間位相対応情報は、参照レイヤ対応領域の左上画素と、該参照レイヤ対応領域の左上画素に対応する対応参照位置の間の差分を表わす量である参照レイヤ位相オフセットを含む、ことが好ましい。

　また、上記画像復号装置において、前記レイヤ間位相対応情報は、パラメータセットに含まれる前記参照レイヤ位相オフセット数を示す量である参照レイヤ位相オフセット数を含む、ことが好ましい。

　また、上記画像復号装置において、前記参照レイヤ位相オフセットがパラメータセットから復号されない場合、前記参照レイヤ位相オフセットの各値は０に設定される、ことが好ましい。

　また、上記画像復号装置において、前記レイヤ間位相対応情報は、参照レイヤ対応領域の左上画素に対する上位レイヤ上の基準画素の位置を表わす量である基準画素オフセットを含む、ことが好ましい。

　また、上記画像復号装置において、前記基準画素オフセットの示す基準画素は、水平方向の位置が前記参照レイヤ対応領域の左上画素と同じか左側であり、かつ、垂直方向の位置が前記参照レイヤ対応領域の左上画素と同じか上側にある画素であって、該基準画素に対応する参照例レイヤ位置は画素単位で整数位置である、ことが好ましい。

　また、上記画像復号装置において、前記予測画像生成部は、レイヤ間予測実行時に、予測対象画素に対応する参照レイヤ位置を導出する対応参照位置導出処理を実行し、前記対応参照位置導出処理は、前記レイヤ間位相対応情報に基づいて、参照レイヤ位置を導出する、ことが好ましい。

　また、上記画像復号装置において、前記対応参照位置導出処理は、予測対象画素に対応する参照レイヤ画素の位置に相当する暫定参照位置を導出する処理と、前記レイヤ間位相対応情報に基づいて、位相オフセットを導出する処理とを含むこと、ことが好ましい。

　また、上記画像復号装置において、前記対応参照位置導出処理は、両者の単位が一致するよう変換を適用した上で、前記暫定参照位置に前記位相オフセットを加算することで、前記位相オフセットを導出する、ことが好ましい。

　上記課題を解決するために、本発明に係る画像符号化装置は、入力画像から上位レイヤの符号化データを生成する画像符号化装置であって、パラメータセットを復号するパラメータセット復号部と、参照レイヤピクチャの復号画素を参照して、レイヤ間予測により予測画像を生成する予測画像符号化部を備え、前記パラメータセット復号部は、対象レイヤ画素と該対象レイヤ画素に対応する参照レイヤピクチャ上の位置に係る情報であるレイヤ間位相対応情報を符号化し、前記予測画像符号化部は、レイヤ間予測実行時に、前記レイヤ間位相対応情報に基づいて、予測対象画素に対応する参照レイヤ位置を導出する対応参照位置導出処理を実行することを特徴としている。

　上記課題を解決するために、本発明に係る符号化データ変換装置は、入力される階層符号化データを入力される注目領域情報に基づいて変換し、変換後の階層符号化データを出力する階層符号化データ変換装置であって、入力の階層符号化データから修正前パラメータセットを復号するパラメータセット復号部と、入力の注目領域情報に基づいて修正前パラメータセットを修正して修正後パラメータセットを生成するパラメータセット修正部と、前記タイル情報と前記注目領域情報に基づいて出力階層符号化データに含める符号化レイヤＮＡＬを選択するＮＡＬ選択部を備え、前記ＮＡＬ選択部は、前記注目領域情報の示す注目領域と少なくとも一部の領域が重複するタイルを抽出対象タイルとし、該抽出対象タイルに含まれるスライスに対応するビデオ符号化レイヤＮＡＬを変換後の階層符号化データに含めるビデオ符号化レイヤＮＡＬとして選択し、前記パラメータセット修正部は、前記抽出タイルに基づいて、パラメータセットに含まれるピクチャサイズとタイル情報を修正することを特徴としている。

　また、上記画像復号装置において、前記パラメータセット修正部は、パラメータセットに含まれる表示領域情報を注目領域情報と一致するよう修正する、ことが好ましい。

　また、上記画像復号装置において、前記パラメータセットはレイヤ間画素対応情報とレイヤ間位相対応情報をさらに含み、前記パラメータセット修正部は、変換後の階層符号化データにおける上位レイヤの画素と対応する参照レイヤ上の位置が、変換前の階層符号化データにおける上位レイヤの画素と対応する参照レイヤ位置に近くなるように、前記レイヤ間画素対応情報と前記レイヤ間位相対応情報を修正する、ことが好ましい。

　本発明は、画像データが階層的に符号化された符号化データを復号する階層画像復号装置、および、画像データが階層的に符号化された符号化データを生成する階層画像符号化装置に好適に適用できる。また、階層画像符号化装置によって生成され、階層画像復号装置によって参照される階層符号化データのデータ構造に好適に適用できる。

　１　　　　　階層動画像復号装置（画像復号装置）
　１１　　　　ＮＡＬ逆多重化部
　１２　　　　パラメータセット復号部
　１３　　　　タイル設定部
　１４　　　　スライス復号部
　１４１　　　スライスヘッダ復号部
　１４２　　　スライス位置設定部
　１４４　　　ＣＴＵ復号部
　１４４１　　予測残差復元部
　１４４２　　予測画像生成部
　１４４３　　ＣＴＵ復号画像生成部
　１５　　　　ベース復号部
　１５１　　　可変長復号部
　１５２　　　ベースパラメータセット復号部
　１５３　　　ベースピクチャ復号部
　１５４　　　ベーススライス復号部
　１５６　　　ベース復号ピクチャ管理部
　１６　　　　復号ピクチャ管理部
　２　　　　　階層動画像符号化装置（画像符号化装置）
　２１　　　　ＮＡＬ多重化部
　２２　　　　パラメータセット符号化部
　２３　　　　タイル設定部
　２４　　　　スライス符号化部
　２４１　　　スライスヘッダ設定部
　２４２　　　スライス位置設定部
　２４４　　　ＣＴＵ符号化部
　２４４１　　予測残差符号化部
　２４４２　　予測画像符号化部
　３　　　　　階層符号化データ変換装置（符号化データ変換装置）
　３２　　　　パラメータセット修正部
　３４　　　　ＮＡＬ選択部

Claims

　階層符号化された符号化データに含まれる上位レイヤの符号化データを復号し、対象レイヤである上位レイヤの復号ピクチャを復元する画像復号装置であって、
　パラメータセットを復号するパラメータセット復号部と、
　参照レイヤピクチャの復号画素を参照して、レイヤ間予測により予測画像を生成する予測画像生成部を備え、
　前記パラメータセット復号部は、対象レイヤ画素と該対象レイヤ画素に対応する参照レイヤピクチャ上の位置に係る情報であるレイヤ間位相対応情報を復号することを特徴とする画像復号装置。
　前記パラメータセット復号部は、対象レイヤピクチャの各辺を基準とする参照レイヤ対応領域の各辺のオフセットを示すレイヤ間画素対応オフセットを復号し、
前記予測画像生成部は、前記レイヤ間画素対応オフセットを用いて導出される参照レイヤ対応領域の第１の画素を基準とする対象レイヤ画素の位置を、レイヤ間サイズ比率を用いてスケールすることで暫定参照位置を導出し、
　前記レイヤ間位相対応情報から導出される参照レイヤ位相オフセットと、前記暫定参照位置とを用いて、対応参照位置を導出することを特徴とする、請求項１に記載の画像復号装置。
　前記レイヤ間位相対応情報は、パラメータセットに含まれる参照レイヤ位相オフセット数を示す量である参照レイヤ位相オフセット数を含むことを特徴とする、請求項２に記載の画像復号装置。
　前記パラメータセット復号部は、レイヤ間位相対応情報として参照レイヤクロップオフセットを復号し、
　前記予測画像生成部は、前記参照レイヤクロップオフセットとレイヤ間サイズ比率を用いて、前記参照レイヤ位相オフセットを導出することを特徴とする、請求項２に記載の画像復号装置。
　入力画像から上位レイヤの符号化データを生成する画像符号化装置であって、
　パラメータセットを復号するパラメータセット復号部と、
　参照レイヤピクチャの復号画素を参照して、レイヤ間予測により予測画像を生成する予測画像符号化部を備え、
　前記パラメータセット復号部は、対象レイヤ画素と該対象レイヤ画素に対応する参照レイヤピクチャ上の位置に係る情報であるレイヤ間位相対応情報を符号化し、
　前記予測画像符号化部は、レイヤ間予測実行時に、前記レイヤ間位相対応情報に基づいて、予測対象画素に対応する参照レイヤ位置を導出する対応参照位置導出処理を実行することを特徴とする画像符号化装置。
　入力される階層符号化データを入力される注目領域情報に基づいて変換し、変換後の階層符号化データを出力する階層符号化データ変換装置であって、
　入力の階層符号化データから修正前パラメータセットを復号するパラメータセット復号部と、
　入力の注目領域情報に基づいて修正前パラメータセットを修正して修正後パラメータセットを生成するパラメータセット修正部と、
　タイル情報と前記注目領域情報に基づいて出力階層符号化データに含める符号化レイヤＮＡＬを選択するＮＡＬ選択部を備え、
　前記ＮＡＬ選択部は、前記注目領域情報の示す注目領域と少なくとも一部の領域が重複するタイルを抽出対象タイルとし、該抽出対象タイルに含まれるスライスに対応するビデオ符号化レイヤＮＡＬを変換後の階層符号化データに含めるビデオ符号化レイヤＮＡＬとして選択し、
　前記パラメータセット修正部は、前記抽出対象タイルに基づいて、パラメータセットに含まれるピクチャサイズとタイル情報を修正することを特徴とする階層符号化データ変換装置。
　前記パラメータセット修正部は、パラメータセットに含まれる表示領域情報を注目領域情報と一致するよう修正することを特徴とする、請求項６に記載の階層符号化データ変換装置。
　前記パラメータセットはレイヤ間画素対応情報とレイヤ間位相対応情報をさらに含み、
　前記パラメータセット修正部は、変換後の階層符号化データにおける上位レイヤの画素と対応する参照レイヤ上の位置が、変換前の階層符号化データにおける上位レイヤの画素と対応する参照レイヤ位置に近くなるように、前記レイヤ間画素対応情報と前記レイヤ間位相対応情報を修正することを特徴とする、請求項６または請求項７に記載の階層符号化データ変換装置。