JP6345650B2

JP6345650B2 - 画像処理装置及び画像処理方法

Info

Publication number: JP6345650B2
Application number: JP2015509983A
Authority: JP
Inventors: 佐藤　数史; 数史佐藤
Original assignee: Saturn Licensing LLC
Current assignee: Saturn Licensing LLC
Priority date: 2013-04-05
Filing date: 2014-03-14
Publication date: 2018-06-20
Anticipated expiration: 2034-03-14
Also published as: CN104380739B; MX344000B; RU2014148134A; RU2665308C2; US9838716B2; MX2014014491A; BR112014029917A2; US20150103901A1; JPWO2014162849A1; CN104380739A; WO2014162849A1; EP2843951B1; RU2014148134A3; EP2843951A4; EP2843951A1

Description

本開示は、画像処理装置及び画像処理方法に関する。

現在、Ｈ．２６４／ＡＶＣよりも符号化効率をさらに向上することを目的として、ＩＴＵ−ＴとＩＳＯ／ＩＥＣとの共同の標準化団体であるＪＣＴＶＣ（Joint Collaboration Team-Video Coding）により、ＨＥＶＣ（High Efficiency Video Coding）と呼ばれる画像符号化方式の標準化が進められている（例えば、非特許文献１参照）。

ＨＥＶＣは、ＭＰＥＧ２及びＡＶＣ（Advanced Video Coding）などの既存の画像符号化方式と同様、シングルレイヤの符号化のみならず、スケーラブル符号化をも提供する。ＨＥＶＣのスケーラブル符号化技術を、ＳＨＶＣ（Scalable HEVC）ともいう（例えば、非特許文献２参照）。

スケーラブル符号化とは、一般には、粗い画像信号を伝送するレイヤと精細な画像信号を伝送するレイヤとを階層的に符号化する技術をいう。スケーラブル符号化において階層化される典型的な属性は、主に次の３種類である。
−空間スケーラビリティ：空間解像度あるいは画像サイズが階層化される。
−時間スケーラビリティ：フレームレートが階層化される。
−ＳＮＲ（Signal to Noise Ratio）スケーラビリティ：ＳＮ比が階層化される。
さらに、標準規格で未だ採用されていないものの、ビット深度スケーラビリティ及びクロマフォーマットスケーラビリティもまた議論されている。

さらに、非特許文献３において、色域（Color Gamut）を階層化する色域スケーラビリティが議論されている。例えば、高精細（ＨＤ）テレビジョンでは、通常、１９２０×１０８０画素の画像サイズ、ＩＴＵ−ＲＢＴ．７０９の色域、８ビットのビット深度が使用される。これに対し、超高精細（ＵＨＤ）テレビジョンでは、４０００×２０００画素又は８０００×４０００画素の画像サイズ、ＩＴＵ−ＲＢＴ．２０２０の色域、１０ビット又は１２ビットのビット深度が使用されることが検討されている。一般には、色域の変換は３次元の画素ベクトルに対する行列演算を要する。しかし、非特許文献３は、ＢＴ．７０９とＢＴ．２０２０との間の関係を色成分ごとに独立した線型的な関係に近似できることに着目し、ベースレイヤにおいてＢＴ．７０９、エンハンスメントレイヤにおいてＢＴ．２０２０がそれぞれ使用される場合に、簡略的な手法でベースレイヤの画素値からエンハンスメントレイヤの画素値を予測することを提案している。

Benjamin Bross, Woo-Jin Han, Gary J. Sullivan, Jens-Rainer Ohm, Gary J. Sullivan, Ye-Kui Wang, Thomas Wiegand, "High Efficiency Video Coding (HEVC) text specification draft 10 (for FDIS & Consent)"（JCTVC-L1003_v4, 2013年1月14-23日） Jianle Chen, el. al, "Description of scalable video coding technology proposal by Qualcomm (configuration 2)"（JCTVC-K0036， 2012年10月10-19日） Louis Kerofsky, el. al, "Color Gamut Scalable Video Coding: New Results"（JCTVC-L0334， 2013年1月14-23日）

しかしながら、非特許文献３において提案されている手法では、高い予測精度を達成可能な適応パラメータモードにおいて、各色成分についてのゲイン及びオフセットがピクチャごとに符号化されるため、符号量が増加する。ビットシフトモード及び固定パラメータモードでは、追加的な符号化パラメータは発生しないが、予測精度がやや劣る。

従って、色域スケーラビリティにおいて高い予測精度を達成しながら符号量の増加を抑制することのできる新たな仕組みが提供されることが望ましい。

本開示によれば、第１レイヤとは異なる色域を有する第２レイヤの画像を前記第１レイヤの画像から予測する際に使用される予測パラメータの過去の値からの差分を復号する復号部と、前記復号部により復号される前記差分を用いて計算される前記予測パラメータを用いて、前記第１レイヤの画像から前記第２レイヤの画像を予測する予測部と、を備える画像処理装置が提供される。

上記画像処理装置は、典型的には、画像を復号する画像復号装置として実現され得る。

また、本開示によれば、第１レイヤとは異なる色域を有する第２レイヤの画像を前記第１レイヤの画像から予測する際に使用される予測パラメータの過去の値からの差分を復号することと、復号される前記差分を用いて計算される前記予測パラメータを用いて、前記第１レイヤの画像から前記第２レイヤの画像を予測することと、を含む画像処理方法が提供される。

また、本開示によれば、第１レイヤとは異なる色域を有する第２レイヤの画像を復号する際に参照される前記第１レイヤの画像から、前記第２レイヤの画像を予測する予測部と、前記予測部により使用される予測パラメータの過去の値からの差分を符号化する符号化部と、を備える画像処理装置が提供される。

上記画像処理装置は、典型的には、画像を符号化する画像符号化装置として実現され得る。

また、本開示によれば、第１レイヤとは異なる色域を有する第２レイヤの画像を復号する際に参照される前記第１レイヤの画像から、前記第２レイヤの画像を予測することと、前記第２レイヤの画像を予測するために使用される予測パラメータの過去の値からの差分を符号化することと、を含む画像処理方法が提供される。

本開示に係る技術によれば、色域スケーラビリティにおいて、高い予測精度を達成しながら符号量の増加を抑制することができる。

スケーラブル符号化について説明するための説明図である。ＢＴ．７０９及びＢＴ．２０２０により表現される色域について説明するための説明図である。ＪＣＴＶＣ−Ｌ０３３４により提案されている色域予測のための予測モードを示す表である。ＪＣＴＶＣ−Ｌ０３３４により提案されている予測パラメータのシンタックスについて説明するための第１の説明図である。ＪＣＴＶＣ−Ｌ０３３４により提案されている予測パラメータのシンタックスについて説明するための第２の説明図である。一実施形態に係る画像符号化装置の概略的な構成を示すブロック図である。一実施形態に係る画像復号装置の概略的な構成を示すブロック図である。図４に示したＥＬ符号化部の構成の一例を示すブロック図である。図６に示した色域予測部の構成の一例を示すブロック図である。色域予測のための符号化パラメータのシンタックスの一例について説明するための説明図である。ゲイン及びオフセットの差分の基礎となるパラメータ値について説明するための説明図である。スライスごとのゲイン及びオフセットの符号化の用途の一例について説明するための説明図である。重み付け予測関連パラメータの既存のシンタックスについて説明するための説明図である。画素値が属するバンドに応じた予測パラメータの選択的な使用について説明するための説明図である。図１２を用いて説明した手法によって実現される予測モデルを輝度成分について簡略的に表現するグラフである。図１２を用いて説明した手法に関連するシンタックスの一例について説明するための説明図である。画素が属する画像領域に応じた予測パラメータの選択的な使用について説明するための説明図である。図１５を用いて説明した手法に関連するシンタックスの一例について説明するための説明図である。ＪＣＴＶＣ−Ｏ０１９４において提案された、インターレイヤ予測の処理コストを抑制するための手法について説明するための第１の説明図である。ＪＣＴＶＣ−Ｏ０１９４において提案された、インターレイヤ予測の処理コストを抑制するための手法について説明するための第２の説明図である。ＪＣＴＶＣ−Ｏ０１９４において提案された、インターレイヤ予測の処理コストを抑制するための手法について説明するための第３の説明図である。インターレイヤ予測の処理コストを抑制するための新たな手法について説明するための第１の説明図である。インターレイヤ予測の処理コストを抑制するための新たな手法について説明するための第２の説明図である。インターレイヤ予測の処理コストを抑制するための新たな手法について説明するための第３の説明図である。図１８Ａ〜図１８Ｃを用いて説明した手法に関連するシンタックスの一例について説明するための説明図である。一実施形態に係る符号化時の概略的な処理の流れの一例を示すフローチャートである。エンハンスメントレイヤの符号化処理における色域予測処理の流れの第１の例を示すフローチャートである。エンハンスメントレイヤの符号化処理における色域予測処理の流れの第２の例を示すフローチャートである。エンハンスメントレイヤの符号化処理における色域予測処理の流れの第３の例を示すフローチャートである。エンハンスメントレイヤの符号化処理における色域予測処理の流れの第４の例を示すフローチャートである。既存のインターレイヤ予測の処理順序の一例について説明するための説明図である。新たなインターレイヤ予測の処理順序の一例について説明するための説明図である。図５に示したＥＬ復号部の構成の一例を示すブロック図である。図２６に示した色域予測部の構成の一例を示すブロック図である。一実施形態に係る復号時の概略的な処理の流れの一例を示すフローチャートである。エンハンスメントレイヤの復号処理における色域予測処理の流れの第１の例を示すフローチャートである。エンハンスメントレイヤの復号処理における色域予測処理の流れの第２の例を示すフローチャートである。エンハンスメントレイヤの復号処理における色域予測処理の流れの第３の例を示すフローチャートである。エンハンスメントレイヤの復号処理における色域予測処理の流れの第４の例を示すフローチャートである。テレビジョン装置の概略的な構成の一例を示すブロック図である。携帯電話機の概略的な構成の一例を示すブロック図である。記録再生装置の概略的な構成の一例を示すブロック図である。撮像装置の概略的な構成の一例を示すブロック図である。スケーラブル符号化の用途の第１の例について説明するための説明図である。スケーラブル符号化の用途の第２の例について説明するための説明図である。スケーラブル符号化の用途の第３の例について説明するための説明図である。マルチビューコーデックについて説明するための説明図である。マルチビューコーデックのための画像符号化装置の概略的な構成を示すブロック図である。マルチビューコーデックのための画像復号装置の概略的な構成を示すブロック図である。

以下に添付図面を参照しながら、本開示の好適な実施の形態について詳細に説明する。なお、本明細書及び図面において、実質的に同一の機能構成を有する構成要素については、同一の符号を付することにより重複説明を省略する。

また、以下の順序で説明を行う。
１．概要
１−１．スケーラブル符号化
１−２．色域スケーラビリティ
１−３．エンコーダの基本的な構成例
１−４．デコーダの基本的な構成例
２．一実施形態に係るＥＬ符号化部の構成例
２−１．全体的な構成
２−２．色域予測部の詳細な構成
２−３．シンタックスの例
３．一実施形態に係る符号化時の処理の流れ
３−１．概略的な流れ
３−２．色域予測処理
４．一実施形態に係るＥＬ復号部の構成例
４−１．全体的な構成
４−２．色域予測部の詳細な構成
５．一実施形態に係る復号時の処理の流れ
５−１．概略的な流れ
５−２．色域予測処理
６．応用例
６−１．様々な製品への応用
６−２．スケーラブル符号化の様々な用途
６−３．その他
７．まとめ

＜１．概要＞
［１−１．スケーラブル符号化］
スケーラブル符号化においては、一連の画像をそれぞれ含む複数のレイヤが符号化される。ベースレイヤ（base layer）は、最初に符号化される、最も粗い画像を表現するレイヤである。ベースレイヤの符号化ストリームは、他のレイヤの符号化ストリームを復号することなく、独立して復号され得る。ベースレイヤ以外のレイヤは、エンハンスメントレイヤ（enhancement layer）と呼ばれる、より精細な画像を表現するレイヤである。エンハンスメントレイヤの符号化ストリームは、ベースレイヤの符号化ストリームに含まれる情報を用いて符号化される。従って、エンハンスメントレイヤの画像を再現するためには、ベースレイヤ及びエンハンスメントレイヤの双方の符号化ストリームが復号されることになる。スケーラブル符号化において扱われるレイヤの数は、２つ以上のいかなる数であってもよい。３つ以上のレイヤが符号化される場合には、最下位のレイヤがベースレイヤ、残りの複数のレイヤがエンハンスメントレイヤである。より上位のエンハンスメントレイヤの符号化ストリームは、より下位のエンハンスメントレイヤ又はベースレイヤの符号化ストリームに含まれる情報を用いて符号化され及び復号され得る。

図１は、スケーラブル符号化される３つのレイヤＬ１、Ｌ２及びＬ３を示している。レイヤＬ１はベースレイヤであり、レイヤＬ２及びＬ３はエンハンスメントレイヤである。レイヤＬ２のレイヤＬ１に対する空間解像度の比は、２：１である。レイヤＬ３のレイヤＬ１に対する空間解像度の比は、４：１である。なお、ここでの解像度比は一例に過ぎず、例えば１．５：１などの非整数の解像度比が使用されてもよい。レイヤＬ１のブロックＢ１は、ベースレイヤのピクチャ内の符号化処理の処理単位である。レイヤＬ２のブロックＢ２は、ブロックＢ１と共通するシーンを映したエンハンスメントレイヤのピクチャ内の符号化処理の処理単位である。ブロックＢ２は、レイヤＬ１のブロックＢ１に対応する。レイヤＬ３のブロックＢ３は、ブロックＢ１及びＢ２と共通するシーンを映したより上位のエンハンスメントレイヤのピクチャ内の符号化処理の処理単位である。ブロックＢ３は、レイヤＬ１のブロックＢ１及びレイヤＬ２のブロックＢ２に対応する。

［１−２．色域スケーラビリティ］
図１に例示したレイヤ構造において、画像のテクスチャは、共通するシーンを映したレイヤ間で類似する。即ち、レイヤＬ１内のブロックＢ１、レイヤＬ２内のブロックＢ２、及びレイヤＬ３内のブロックＢ３のテクスチャは類似する。従って、例えばブロックＢ１を参照ブロックとして用いてブロックＢ２又はブロックＢ３の画素を予測し、又はブロックＢ２を参照ブロックとして用いてブロックＢ３の画素を予測すれば、高い予測精度が得られる可能性がある。このようなレイヤ間の予測を、インターレイヤ予測という。非特許文献２では、インターレイヤ予測のためのいくつかの手法が提案されている。それら手法のうち、イントラＢＬ予測では、ベースレイヤの復号画像（リコンストラクト画像）が、エンハンスメントレイヤの復号画像を予測するための参照画像として使用される。イントラ残差予測及びインター残差予測では、ベースレイヤの予測誤差（残差）画像が、エンハンスメントレイヤの予測誤差画像を予測するための参照画像として使用される。

ここで、例えばレイヤＬ１の画像がＨＤテレビジョン画像であり、レイヤＬ２の画像がＵＨＤテレビジョン画像であるものとする。図２は、ＢＴ．７０９及びＢＴ．２０２０により表現される色域について説明するための説明図である。図２を参照すると、所定の拘束条件を用いて３次元の色空間を２次元平面へマッピングした色域グラフが示されている。グラフ中の十字マークは、白色がマッピングされる位置を示す。グラフ中の破線は、ＢＴ．７０９が表現することのできる色の範囲を示す。グラフ中の実線は、ＢＴ．２０２０が表現することのできる色の範囲を示す。グラフ中の点線は、人間の視覚が識別することのできる色の範囲を示す。図２から理解されるように、ＢＴ．２０２０は、ＢＴ．７０９よりも多彩な色を表現することができる。レイヤＬ１の各画素がＢＴ．７０９で表現され、レイヤＬ２の各画素がＢＴ．２０２０で表現される場合、インターレイヤ予測に際して、参照画像（レイヤＬ１の画像）についての解像度の変換（即ち、アップサンプリング）及び色域の変換が行われる。通常は、色域の変換は、３次元の画素ベクトルに３行３列の変換行列を乗算することにより行われる。しかし、非特許文献３において説明されているように、ＢＴ．７０９とＢＴ．２０２０との間の関係を、色成分ごとに独立した線型的な関係に近似することができる。そこで、非特許文献３は、色域の変換に要する計算の複雑性及び時間を低減するための簡略化された手法を提案している。

図３Ａは、非特許文献３により提案されている色域予測のための予測モードを示す表である。図３Ａを参照すると、予測モードの番号は「０」、「１」及び「２」のいずれかであり、即ち３種類の予測モードの候補が存在する。予測モード番号＝「０」の場合、次の式（１）〜式（３）ように、ビットシフト（ビットインクリメント）によって各色成分のＢＴ．７０９の画素値（Ｙ_７０９，Ｕ_７０９，Ｖ_７０９）からＢＴ．２０２０の画素値（Ｙ_２０２０，Ｕ_２０２０，Ｖ_２０２０）が予測される。このような予測モードを、本明細書ではビットシフトモードという。

予測モード番号＝「１」ｏｒ「２」の場合、次の式（４）〜式（６）のように、ゲインｇ_ｉ及びオフセットｏ_ｉ（ｉ＝１，２，３）を用いた線形的な変換によって、各色成分について、ＢＴ．７０９の画素値からＢＴ．２０２０の画素値が予測される。

予測モード番号＝「１」の場合、ゲイン及びオフセットの値として予め仕様化される固定値が使用される。予測モード番号＝「１」の予測モードを、本明細書では固定パラメータモードという。予測モード番号＝「２」の場合、ゲイン及びオフセットの値として適応的に指定される可変値が使用される。予測モード番号＝「２」の予測モードを、本明細書では適応パラメータモードという。適応パラメータモードが選択される場合、６種類の予測パラメータ（３つのゲイン及び３つのオフセット）が予測パラメータとして追加的に符号化される。

図３Ｂ及び図３Ｃは、非特許文献３より提案されている予測パラメータのシンタックスについて説明するための説明図である。図３Ｂの第１行の“pps_extension_flag”は、ＰＰＳ（Picture Parameter Set）が色域予測のための拡張されたシンタックスを含むか否かを示すフラグである。図３Ｂの第５行の“color_pred_data()”は、色域スケーラビリティ用のシンタックスの関数であり、その内容は図３Ｃに示されている。図３Ｃの第１行の“color_prediction_model”は選択される予測モードを示すパラメータであり、図３Ａに例示した「０」、「１」及び「２」のいずれかの値をとる。適応パラメータモード（“color_prediction_model=2”）の場合、第３行においてゲインの分母に対応するビット数（“numFractionBits”）が、第５行においてＩ番目の色成分についてのゲインの分子（“color_prediction_gain[I]”）が、第６行においてＩ番目の色成分についてのオフセット（“color_prediction_offset[I]”）がそれぞれ指定される。

適応パラメータモードは、３通りの予測モードの中で、最も高い予測精度を期待することのできるモードである。しかしながら、適応パラメータモードにおいてピクチャごとに上述した予測パラメータが符号化されるとすれば、符号量が増加する。そこで、以下に説明する実施形態において、符号量の増加を抑制するために、色域スケーラビリティにおけるこれら予測パラメータをより効率的に符号化するための仕組みを説明する。

［１−３．エンコーダの基本的な構成例］
図４は、スケーラブル符号化をサポートする、一実施形態に係る画像符号化装置１０の概略的な構成を示すブロック図である。図４を参照すると、画像符号化装置１０は、ベースレイヤ（ＢＬ）符号化部１ａ、エンハンスメントレイヤ（ＥＬ）符号化部１ｂ、共通メモリ２及び多重化部３を備える。

ＢＬ符号化部１ａは、ベースレイヤ画像を符号化し、ベースレイヤの符号化ストリームを生成する。ＥＬ符号化部１ｂは、エンハンスメントレイヤ画像を符号化し、エンハンスメントレイヤの符号化ストリームを生成する。共通メモリ２は、レイヤ間で共通的に利用される情報を記憶する。多重化部３は、ＢＬ符号化部１ａにより生成されるベースレイヤの符号化ストリームと、ＥＬ符号化部１ｂにより生成される１つ以上のエンハンスメントレイヤの符号化ストリームとを多重化し、マルチレイヤの多重化ストリームを生成する。

［１−４．デコーダの基本的な構成例］
図５は、スケーラブル符号化をサポートする、一実施形態に係る画像復号装置６０の概略的な構成を示すブロック図である。図５を参照すると、画像復号装置６０は、逆多重化部５、ベースレイヤ（ＢＬ）復号部６ａ、エンハンスメントレイヤ（ＥＬ）復号部６ｂ及び共通メモリ７を備える。

逆多重化部５は、マルチレイヤの多重化ストリームをベースレイヤの符号化ストリーム及び１つ以上のエンハンスメントレイヤの符号化ストリームに逆多重化する。ＢＬ復号部６ａは、ベースレイヤの符号化ストリームからベースレイヤ画像を復号する。ＥＬ復号部６ｂは、エンハンスメントレイヤの符号化ストリームからエンハンスメントレイヤ画像を復号する。共通メモリ７は、レイヤ間で共通的に利用される情報を記憶する。

図４に例示した画像符号化装置１０において、ベースレイヤの符号化のためのＢＬ符号化部１ａの構成と、エンハンスメントレイヤの符号化のためのＥＬ符号化部１ｂの構成とは、互いに類似する。ＢＬ符号化部１ａにより生成され又は取得されるいくつかのパラメータ及び画像は、共通メモリ２を用いてバッファリングされ、ＥＬ符号化部１ｂにより再利用され得る。次節では、そのようなＥＬ符号化部１ｂの構成について詳細に説明する。

同様に、図５に例示した画像復号装置６０において、ベースレイヤの復号のためのＢＬ復号部６ａの構成と、エンハンスメントレイヤの復号のためのＥＬ復号部６ｂの構成とは、互いに類似する。ＢＬ復号部６ａにより生成され又は取得されるいくつかのパラメータ及び画像は、共通メモリ７を用いてバッファリングされ、ＥＬ復号部６ｂにより再利用され得る。さらに次の節では、そのようなＥＬ復号部６ｂの構成について詳細に説明する。

＜２．一実施形態に係るＥＬ符号化部の構成例＞
［２−１．全体的な構成］
図６は、図４に示したＥＬ符号化部１ｂの構成の一例を示すブロック図である。図６を参照すると、ＥＬ符号化部１ｂは、並び替えバッファ１１、減算部１３、直交変換部１４、量子化部１５、可逆符号化部１６、蓄積バッファ１７、レート制御部１８、逆量子化部２１、逆直交変換部２２、加算部２３、ループフィルタ２４、フレームメモリ２５、セレクタ２６及び２７、イントラ予測部３０、インター予測部３５並びに色域予測部４０を備える。

並び替えバッファ１１は、一連の画像データに含まれる画像を並び替える。並び替えバッファ１１は、符号化処理に係るＧＯＰ（Group of Pictures）構造に応じて画像を並び替えた後、並び替え後の画像データを減算部１３、イントラ予測部３０、インター予測部３５及び色域予測部４０へ出力する。

減算部１３には、並び替えバッファ１１から入力される画像データ、及び後に説明するイントラ予測部３０又はインター予測部３５から入力される予測画像データが供給される。減算部１３は、並び替えバッファ１１から入力される画像データと予測画像データとの差分である予測誤差データを計算し、計算した予測誤差データを直交変換部１４へ出力する。

直交変換部１４は、減算部１３から入力される予測誤差データについて直交変換を行う。直交変換部１４により実行される直交変換は、例えば、離散コサイン変換（Discrete Cosine Transform：ＤＣＴ）又はカルーネン・レーベ変換などであってよい。ＨＥＶＣにおいて、直交変換は、ＴＵ（変換単位：Transform Unit）と呼ばれるブロックごとに実行される。ＴＵは、ＣＵ（符号化単位：Coding Unit）を分割することにより形成されるブロックである。直交変換部１４は、直交変換処理により取得される変換係数データを量子化部１５へ出力する。

量子化部１５には、直交変換部１４から入力される変換係数データ、及び後に説明するレート制御部１８からのレート制御信号が供給される。量子化部１５は、レート制御信号に従って決定される量子化ステップで変換係数データを量子化する。量子化部１５は、量子化後の変換係数データ（以下、量子化データという）を可逆符号化部１６及び逆量子化部２１へ出力する。

可逆符号化部１６は、量子化部１５から入力される量子化データについて可逆符号化処理を行うことにより、エンハンスメントレイヤの符号化ストリームを生成する。また、可逆符号化部１６は、符号化ストリームを復号する際に参照される様々なパラメータを符号化して、符号化されたパラメータを符号化ストリームのヘッダ領域に挿入する。可逆符号化部１６により符号化されるパラメータは、後に説明するイントラ予測に関する情報及びインター予測に関する情報を含み得る。色域の予測に関連する予測パラメータもまた符号化され得る。そして、可逆符号化部１６は、生成した符号化ストリームを蓄積バッファ１７へ出力する。

蓄積バッファ１７は、可逆符号化部１６から入力される符号化ストリームを半導体メモリなどの記憶媒体を用いて一時的に蓄積する。そして、蓄積バッファ１７は、蓄積した符号化ストリームを、伝送路の帯域に応じたレートで、図示しない伝送部（例えば、通信インタフェース又は周辺機器との接続インタフェースなど）へ出力する。

レート制御部１８は、蓄積バッファ１７の空き容量を監視する。そして、レート制御部１８は、蓄積バッファ１７の空き容量に応じてレート制御信号を生成し、生成したレート制御信号を量子化部１５へ出力する。例えば、レート制御部１８は、蓄積バッファ１７の空き容量が少ない時には、量子化データのビットレートを低下させるためのレート制御信号を生成する。また、例えば、レート制御部１８は、蓄積バッファ１７の空き容量が十分大きい時には、量子化データのビットレートを高めるためのレート制御信号を生成する。

逆量子化部２１、逆直交変換部２２及び加算部２３は、ローカルデコーダを構成する。逆量子化部２１は、量子化部１５により使用されたものと同じ量子化ステップで、エンハンスメントレイヤの量子化データを逆量子化し、変換係数データを復元する。そして、逆量子化部２１は、復元した変換係数データを逆直交変換部２２へ出力する。

逆直交変換部２２は、逆量子化部２１から入力される変換係数データについて逆直交変換処理を行うことにより、予測誤差データを復元する。直交変換と同様、逆直交変換は、ＴＵごとに実行される。そして、逆直交変換部２２は、復元した予測誤差データを加算部２３へ出力する。

加算部２３は、逆直交変換部２２から入力される復元された予測誤差データとイントラ予測部３０又はインター予測部３５から入力される予測画像データとを加算することにより、復号画像データ（エンハンスメントレイヤのリコンストラクト画像）を生成する。そして、加算部２３は、生成した復号画像データをループフィルタ２４及びフレームメモリ２５へ出力する。

ループフィルタ２４は、画質の向上を目的とするフィルタ群を含む。デブロックフィルタ（ＤＦ）は、画像の符号化時に生じるブロック歪みを軽減するフィルタである。サンプル適応オフセット（ＳＡＯ）フィルタは、各画素値に適応的に決定されるオフセット値を加えるフィルタである。適応ループフィルタ（ＡＬＦ）は、ＳＡＯ後の画像と原画像との誤差を最小化するフィルタである。ループフィルタ２４は、加算部２３から入力される復号画像データをフィルタリングし、フィルタリング後の復号画像データをフレームメモリ２５へ出力する。

フレームメモリ２５は、加算部２３から入力されるエンハンスメントレイヤの復号画像データ、ループフィルタ２４から入力されるエンハンスメントレイヤのフィルタリング後の復号画像データ、及び色域予測部４０から入力されるベースレイヤの参照画像データを記憶媒体を用いて記憶する。

セレクタ２６は、イントラ予測のために使用されるフィルタリング前の復号画像データをフレームメモリ２５から読み出し、読み出した復号画像データを参照画像データとしてイントラ予測部３０に供給する。また、セレクタ２６は、インター予測のために使用されるフィルタリング後の復号画像データをフレームメモリ２５から読み出し、読み出した復号画像データを参照画像データとしてインター予測部３５に供給する。さらに、イントラ予測部３０又はインター予測部３５においてインターレイヤ予測が実行される場合、セレクタ２６は、ベースレイヤの参照画像データをイントラ予測部３０又はインター予測部３５へ供給する。

セレクタ２７は、イントラ予測モードにおいて、イントラ予測部３０から出力されるイントラ予測の結果としての予測画像データを減算部１３へ出力すると共に、イントラ予測に関する情報を可逆符号化部１６へ出力する。また、セレクタ２７は、インター予測モードにおいて、インター予測部３５から出力されるインター予測の結果としての予測画像データを減算部１３へ出力すると共に、インター予測に関する情報を可逆符号化部１６へ出力する。セレクタ２７は、イントラ予測モードとインター予測モードとを、コスト関数値の大きさに応じて切り替える。

イントラ予測部３０は、エンハンスメントレイヤの原画像データ及び復号画像データに基づいて、ＨＥＶＣのＰＵ（予測単位：Prediction Unit）ごとにイントラ予測処理を行う。例えば、イントラ予測部３０は、予測モードセット内の各候補モードによる予測結果を所定のコスト関数を用いて評価する。次に、イントラ予測部３０は、コスト関数値が最小となる予測モード、即ち圧縮率が最も高くなる予測モードを、最適な予測モードとして選択する。また、イントラ予測部３０は、当該最適な予測モードに従ってエンハンスメントレイヤの予測画像データを生成する。イントラ予測部３０は、エンハンスメントレイヤにおける予測モードセットに、インターレイヤ予測の一種であるイントラＢＬ予測を含めてもよい。イントラＢＬ予測では、エンハンスメントレイヤ内の予測対象ブロックに対応するベースレイヤ内のコロケーテッドブロックが参照ブロックとして使用され、当該参照ブロックの復号画像に基づいて予測画像が生成される。また、イントラ予測部３０は、インターレイヤ予測の一種であるイントラ残差予測を含めてもよい。イントラ残差予測では、ベースレイヤ内のコロケーテッドブロックである参照ブロックの予測誤差画像に基づいてイントラ予測の予測誤差が予測され、予測された予測誤差の加算された予測画像が生成される。イントラ予測部３０は、選択した最適な予測モードを表す予測モード情報を含むイントラ予測に関する情報、コスト関数値、及び予測画像データを、セレクタ２７へ出力する。

インター予測部３５は、エンハンスメントレイヤの原画像データ及び復号画像データに基づいて、ＨＥＶＣのＰＵごとにインター予測処理を行う。例えば、インター予測部３５は、予測モードセット内の各候補モードによる予測結果を所定のコスト関数を用いて評価する。次に、インター予測部３５は、コスト関数値が最小となる予測モード、即ち圧縮率が最も高くなる予測モードを、最適な予測モードとして選択する。また、インター予測部３５は、当該最適な予測モードに従ってエンハンスメントレイヤの予測画像データを生成する。インター予測部３５は、エンハンスメントレイヤにおける予測モードセットに、インターレイヤ予測の一種であるインター残差予測を含めてもよい。インター残差予測では、ベースレイヤ内のコロケーテッドブロックである参照ブロックの予測誤差画像に基づいてインター予測の予測誤差が予測され、予測された予測誤差の加算された予測画像が生成される。インター予測部３５は、選択した最適な予測モードを表す予測モード情報と動き情報とを含むインター予測に関する情報、コスト関数値、及び予測画像データを、セレクタ２７へ出力する。

色域予測部４０は、共通メモリ２によりバッファリングされるベースレイヤの画像（復号画像又は予測誤差画像）を、ベースレイヤとエンハンスメントレイヤとの間の解像度比に従ってアップサンプリングする。また、色域予測部４０は、ベースレイヤの画像とは異なる色域をエンハンスメントレイヤの画像が有する場合に、アップサンプリングしたベースレイヤの画像の色域を、エンハンスメントレイヤの画像と同等の色域に変換する。本実施形態において、色域予測部４０は、ベースレイヤ及びエンハンスメントレイヤの色域の間の色成分ごとに独立した線型的な関係を前提とし、ベースレイヤの画像からエンハンスメントレイヤの画像を近似的に予測することにより、色域を変換する。色域予測部４０により色域の変換されたベースレイヤの画像は、フレームメモリ２５に格納され、イントラ予測部３０又はインター予測部３５により、インターレイヤ予測において参照画像として使用され得る。また、色域予測部４０は、色域の予測のために使用されるいくつかのパラメータを生成する。色域予測部４０により生成されるパラメータは、例えば、予測モードを示す予測モードパラメータを含む。また、予測モードとして適応パラメータモードが選択される場合には、色域予測部４０により生成されるパラメータは、色成分ごとの予測パラメータ、即ちゲイン及びオフセットを含む。色域予測部４０は、さらに予測パラメータの過去の値からの差分を計算し、計算した差分を可逆符号化部１６へ出力する。予測モードパラメータ及び予測パラメータの差分は、可逆符号化部１６により符号化され得る。

［２−２．色域予測部の詳細な構成］
図７は、図６に示した色域予測部４０の構成の一例を示すブロック図である。図７を参照すると、色域予測部４０は、アップサンプリング部４１、予測モード設定部４２、パラメータ計算部４３及び色域変換部４４を有する。

（１）アップサンプリング部
アップサンプリング部４１は、共通メモリ２から取得されるベースレイヤの画像を、ベースレイヤとエンハンスメントレイヤとの間の解像度比に従ってアップサンプリングする。より具体的には、アップサンプリング部４１は、解像度比に応じて順に走査される補間画素の各々について、予め定義されるフィルタ係数でベースレイヤの画像をフィルタリングすることにより補間画素値を計算する。それにより、参照ブロックとして使用されるベースレイヤの画像の空間解像度が、エンハンスメントレイヤと同等の解像度まで高められる。アップサンプリング部４１は、アップサンプリング後の画像をパラメータ計算部４３及び色域変換部４４へ出力する。

（２）予測モード設定部
予測モード設定部４２は、色域予測のための予測モードの候補のうち、予め定義され又は動的に選択される予測モードを、色域予測部４０に設定する。予測モードの候補は、上述したビットシフトモード、固定パラメータモード及び適応パラメータモードを含み得る。ある実施例において、予測モード設定部４２は、ピクチャごとに最適な予測モードを設定し得る。他の実施例において、予測モード設定部４２は、スライスごとに最適な予測モードを設定し得る。１つのピクチャは、１つ以上のスライスを有し得る。また別の実施例において、予測モード設定部４２は、シーケンスごとに予測モードを設定し、１つのシーケンス内の複数のピクチャ及び複数のスライスにわたって同じ予測モードを維持し得る。予測モード設定部４２は、予測モードの各候補について符号化効率又は予測精度を評価し、最適な予測モードを選択してもよい。予測モード設定部４２は、設定した予測モードを示す予測モードパラメータを、可逆符号化部１６へ出力する。

（３）パラメータ計算部
パラメータ計算部４３は、予測モード設定部４２により適応パラメータモードが設定された場合に、又は予測モード設定部４２により適応パラメータモードの符号化効率若しくは予測精度が評価される場合に、適応パラメータモードにおいて使用されるべき予測パラメータを計算する。当該予測パラメータは、式（４）〜式（６）に示したゲインｇ_ｉ及びオフセットｏ_ｉ（ｉ＝１，２，３）を含む。ここで、下付き文字のｉは、３種類の色成分の各々を意味する。ゲインｇ_ｉは、ベースレイヤの画素値に乗算される係数である。オフセットｏ_ｉは、ベースレイヤの画素値とゲインｇ_ｉとの積に加算される数値である。パラメータ計算部４３は、例えば、アップサンプリング部４１から入力されるアップサンプリング後のベースレイヤの画像を並び替えバッファ１１から入力される原画像に最も近付けることのできるようなゲイン及びオフセットを、色成分ごとに計算し得る。

さらに、パラメータ計算部４３は、予測モード設定部４２により予測モードとして適応パラメータモードが設定された場合に、ゲイン及びオフセットの過去の値からの差分を計算する。ここでの過去の値とは、例えば、ピクチャごとにゲイン及びオフセットが計算される場合には、前回のピクチャについて計算された値であってよい。スライスごとにゲイン及びオフセットが計算される場合には、前回のピクチャの同じ位置のスライス（co-located slice）について計算された値であってよい。パラメータ計算部４３は、前回のピクチャ又は前回のピクチャの同じ位置のスライスにビットシフトモードが設定された場合には、ビットシフト量に対応するゲイン及びオフセットの値を差分の基礎として使用し得る。また、パラメータ計算部４３は、前回のピクチャ又は前回のピクチャの同じ位置のスライスに固定パラメータモードが設定された場合には、予め定義される固定的なゲイン及びオフセットの値を差分の基礎として使用し得る。パラメータ計算部４３は、計算したゲイン及びオフセットの差分を、可逆符号化部１６へ出力する。なお、ゲインの値は、小数値を含み得る。そこで、予測モード設定部４２は、ゲインの値を分母及び分子に分解し、分母及び分子の差分をそれぞれ計算して可逆符号化部１６へ出力してよい。また、予測モード設定部４２は、符号化効率を高め及び計算コストを低減するために、ゲインの分母の値を２の整数乗のみに制限してもよい。この場合、分母の値の２を底とする対数が、予測パラメータとして使用されてもよい。

（４）色域変換部
色域変換部４４は、予測モード設定部４２により設定される予測モードに従って、アップサンプリング部４１から入力されるアップサンプリング後のベースレイヤの画像の色域を、エンハンスメントレイヤの画像と同等の色域に変換する。例えば、色域変換部４４は、ビットシフトモードが設定された場合には、式（１）〜式（３）に従って、アップサンプリング後のベースレイヤの画素値を所定のビットシフト量ｎ_{ｓｈｉｆｔ}だけ左方へシフトさせることにより、予測画素値を計算する。ビットシフト量ｎ_{ｓｈｉｆｔ}は、例えばＨＤテレビジョン画像からＵＨＤテレビジョン画像への変換の場合には、２又は４であってよい。また、色域変換部４４は、固定パラメータモードが設定された場合には、式（４）〜式（６）に従って、アップサンプリング後のベースレイヤの画素値に固定的なゲインを乗算し、さらに固定的なオフセットを加算することにより、予測画素値を計算する。また、色域変換部４４は、適応パラメータモードが設定された場合には、固定的なゲイン及びオフセットの代わりに、パラメータ計算部４３により適応的に計算されるゲイン及びオフセットを用いて、予測画素値を計算する。それにより、インターレイヤ予測のための参照画像が生成される。色域変換部４４は、このように生成されるインターレイヤ予測のための参照画像（色域の変換されたベースレイヤの画像）を、フレームメモリ２５に格納する。

［２−３．シンタックスの例］
（１）基本的な例
予測モード設定部４２から出力される予測モードパラメータ及びパラメータ計算部４３から出力される予測パラメータ（色成分ごとのゲイン及びオフセット）の差分は、図６に示した可逆符号化部１６により符号化され、エンハンスメントレイヤの符号化ストリームに挿入され得る。図８は、色域予測のためのこれら符号化パラメータのシンタックスの一例について説明するための説明図である。

図８に示したシンタックスは、例えばＰＰＳに含まれてもよく、又はスライスヘッダに含まれてもよい。シンタックスの第１行の“color_gamut_prediction_flag”は、当該ＰＰＳ又は当該スライスヘッダが色域予測のための拡張されたシンタックスを含むか否かを示すフラグである。第３行の“color_prediction_model”は、予測モード設定部４２により設定された予測モードを示す予測モードパラメータである。図３Ａを用いて説明したように、予測モードパラメータが「０」に等しい場合、予測モードはビットシフトモードである。予測モードパラメータが「１」に等しい場合、予測モードは固定パラメータモードである。予測モードパラメータが「２」に等しい場合、予測モードは適応パラメータモードである。なお、これら例に限定されず、他の種類の予測モードが採用されてもよい。第５行以降の予測パラメータは、予測モードパラメータが適応パラメータモードを示す場合に符号化される。第１０行の“delta_luma_log2_gain_denom”は、輝度成分のゲインの分母の値の２を底とする対数の、過去の値からの差分である。第１１行の“delta_luma_gain_color_gamut”は、輝度成分のゲインの分子の値の、過去の値からの差分である。第１２行の“delta_luma_offset_color_gamut”は、輝度成分のオフセットの値の、過去の値からの差分である。なお、第５行の“luma_gain_color_gamut_flag”がゼロを示す場合、これら輝度成分の予測パラメータの差分の符号化は省略されてよい。この場合、予測パラメータの過去の値がそのまま最新のピクチャ又はスライスにおいても使用され得る（即ち、差分ゼロ）。第１５行の“delta_chroma_log2_gain_denom”は、色差成分のゲインの分母の値の２を底とする対数の、過去の値からの差分である。なお、図８では２つの色差成分について共通の分母が使用される例を示しているが、２つの色差成分について別個の分母が使用されてもよく、又は輝度成分のゲインの分母と色差成分のゲインの分母とが共通化されてもよい。第１７行の“delta_chroma_gain_color_gamut[j]”は、ｊ番目（ｊ＝１，２）の色差成分のゲインの分子の値の、過去の値からの差分である。第１８行の“delta_chroma_offset_color_gamut[j]”は、ｊ番目の色差成分のオフセットの値の、過去の値からの差分である。なお、第７行の“chroma_gain_color_gamut_flag”がゼロを示す場合、これら色差成分の予測パラメータの差分の符号化は省略されてよい。この場合、予測パラメータの過去の値がそのまま最新のピクチャ又はスライスにおいても使用され得る（即ち、差分ゼロ）。

図８の例では、ＰＰＳ又はスライスヘッダごとに予測モードパラメータ“color_prediction_model”が符号化される。この場合、最新のピクチャ又はスライスの予測モードパラメータが適応パラメータモードを示す場合であっても、差分の基礎となる前回のピクチャ又は前回のピクチャの同じ位置のスライスについて、予測モードパラメータが適応パラメータモードを示していたとは限らない。例えば、前回の予測モードパラメータがビットシフトモードを示す場合、図８のシンタックスにおいて“delta_”というプレフィックスの付された差分パラメータは、予測パラメータの最新の値（ゲイン又はオフセット）からビットシフト量に対応するパラメータ値を減算することにより計算される差分をそれぞれ表す。例えば、ビットシフト量ｎ_{ｓｈｉｆｔ}が２に等しい場合には、対応するゲインの値は、２^２＝４である。ビットシフト量ｎ_{ｓｈｉｆｔ}に関わらず、対応するオフセットの値はゼロであってよい。また、前回の予測モードパラメータが固定パラメータモードを示す場合、図８のシンタックスにおける差分パラメータは、予測パラメータの最新の値（ゲイン又はオフセット）から固定的なパラメータ値（ゲインｇ_{ｉ＿ｆｉｘｅｄ}又はオフセットｏ_{ｉ＿ｆｉｘｅｄ}）を減算することにより計算される差分をそれぞれ表す。ゲインｇ_{ｉ＿ｆｉｘｅｄ}及びオフセットｏ_{ｉ＿ｆｉｘｅｄ}は、符号化されず、エンコーダ及びデコーダにおいて予め記憶される。前回の予測モードパラメータが適応パラメータモードを示す場合、図８のシンタックスにおける差分パラメータは、予測パラメータの最新の値（ゲイン又はオフセット）から前回のパラメータ値（ゲインｇ_{ｉ＿ｐｒｅｖ}又はオフセットｏ_{ｉ＿ｐｒｅｖ}）を減算することにより計算される差分をそれぞれ表す。図９は、ここで説明したゲイン及びオフセットの差分の基礎を、表形式で示している。なお、シーケンスの先頭などにおいて、過去の値が存在しない場合には、差分の基礎は、ゼロであってもよく又は固定的なパラメータ値（ゲインｇ_{ｉ＿ｆｉｘｅｄ}若しくはオフセットｏ_{ｉ＿ｆｉｘｅｄ}）であってもよい。

（２）シーケンスごとの予測モードパラメータの符号化
なお、図８の第１行の拡張フラグ“color_gamut_prediction_flag”及び第３行の予測モードパラメータ“color_prediction_model”は、シーケンスごとに符号化され、ＳＰＳ（Sequence Parameter Set）に挿入されてもよい。この場合、１つのシーケンス内では同じ予測モードが維持される。１つのシーケンス内で予測モードが変更されなければ、図９に例示したような前回の予測モードに依存する差分の基礎の切替えが不要となるため、差分計算の複雑さが緩和され、装置の実装が容易となる。また、拡張フラグ及び予測モードパラメータのための符号量を削減することもできる。

（３）スライスごとの予測パラメータの符号化
図３Ｂ及び図３Ｃを用いて説明したように、既存の手法において、色域予測のための予測モードパラメータ及び予測パラメータは、ピクチャごとに符号化され、ＰＰＳへ挿入される。しかし、画像の部分領域ごとに異なる色域が使用される用途を想定すると、予測モードパラメータ及び予測パラメータの差分をスライスごとに符号化することが有益である。例えば、図１０に示した例において、ベースレイヤ画像ＩＭ_Ｂ１は、４つのタイルＴ_Ｂ１、Ｔ_Ｂ２、Ｔ_Ｂ３及びＴ_Ｂ４に分割される。エンハンスメントレイヤ画像ＩＭ_Ｅ１は、４つのタイルＴ_Ｅ１、Ｔ_Ｅ２、Ｔ_Ｅ３及びＴ_Ｅ４に分割される。４つのタイルは、それぞれ異なるカメラにより撮像される映像を映し出す。例えば、ベースレイヤ画像ＩＭ_Ｂ１は４つの地点に設置されるカメラからの合成映像の低解像度バージョンであり、エンハンスメントレイヤ画像ＩＭ_Ｅ１は同じ合成映像の高解像度バージョンであり得る。そして、例えばタイルＴ_Ｅ２及びタイルＴ_Ｅ４は色域としてＢＴ．２０２０を使用し、その他のベースレイヤ及びエンハンスメントレイヤのタイルは色域としてＢＴ．７０９を使用するものとする。この場合、タイルＴ_Ｅ２及びタイルＴ_Ｅ４に相当するスライスのスライスヘッダにおいてそれぞれ予測モードパラメータ及び予測パラメータを符号化することにより、タイルごとに最適な色域予測を可能とし、符号化効率を高めることができる。

（４）重み付け予測のためのシンタックスの再利用
図８に例示した色域予測の予測パラメータのシンタックスは、ＨＥＶＣにおいて導入される重み付け予測（Weighted Prediction）に関連するパラメータのシンタックスに類似する。重み付け予測は、フェードイン及びフェードアウトなどのエフェクトが適用される映像についてインター予測の予測精度を改善するために導入される技術である。図１１は、重み付け予測関連パラメータについて非特許文献１により定義されているシンタックスを示している。

図１１の第２行の“luma_log2_weight_denom”及び第４行の“delta_chroma_log2_weight_denom”は、それぞれ輝度成分及び色差成分の重みの分母の値を、重み付け予測において使用され得るＬ０参照フレーム及びＬ１参照フレームについて共通的に特定する。第５行から第２０行は、Ｌ０参照フレームについての残りの重み付け予測関連パラメータを特定する。第２１行から第３８行は、双予測（bi-prediction）が可能である場合に、Ｌ１参照フレームについての残りの重み付け予測関連パラメータを特定する。なお、個々のパラメータの意味は非特許文献１に記載されている。

次の表１は、図１１に示した重み付け予測関連パラメータと、図８に例示した色域予測のパラメータとの間のマッピングの一例を示している。表１から理解されるように、図８に例示した色域予測のパラメータのうち、拡張フラグ“color_gamut_prediction_flag”及び予測モードパラメータ“color_prediction_model”以外の全てのパラメータは、重み付け予測のためのいずれかのパラメータにマッピング可能である。個々のパラメータの役割は例えば重み付け予測関連パラメータの値が必ずしも過去の値からの差分を意味しない点で相違し得るものの、互いにマッピングされるパラメータの型は同等である。色域予測では参照フレームが１つのみ（ベースレイヤ画像）であるため、参照フレーム番号に相当する引数ｉ及び変数“num_ref_idx_l0_active_minus1”は不要となる。

そこで、ある実施例において、可逆符号化部１６は、例えば、重み付け予測関連パラメータと共用されるシンタックスを有するヘッダ（スライスヘッダ）内に、色域予測の予測パラメータの差分を符号化してもよい。それにより、新たなシンタックスを定義することが不要となり、シンタックスの冗長性が低減され、エンコーダ及びデコーダの実装及びバージョンアップの際の互換性の確保が容易となる。なお、拡張フラグ“color_gamut_prediction_flag”及び予測モードパラメータ“color_prediction_model”は、ＳＰＳ、ＰＰＳ又はスライスヘッダにおいて別途符号化され得る。また、重み付け予測関連パラメータ及び色域予測のためのパラメータのいずれが符号化されているかを示すフラグが追加的に符号化されてもよい。

なお、フェードイン及びフェードアウトなどのエフェクトは、通常、ベースレイヤ及びエンハンスメントレイヤの双方に同じように適用される。従って、符号化効率を高めるために、レイヤ間で重み付け予測関連パラメータを再利用することが有益である。エンハンスメントレイヤにおいてベースレイヤの重み付け予測関連パラメータが再利用される場合、可逆符号化部１６は、エンハンスメントレイヤ固有の重み付け予測関連パラメータを符号化しない。この場合、非特許文献１により定義されている図１１のシンタックスは、エンハンスメントレイヤにおいて重み付け予測のために使用されない。そこで、重み付け予測関連パラメータの代わりに、同じシンタックスで色域予測の予測パラメータの差分を符号化することにより、シンタックスの定義を効率的に活用することができる。この場合、Ｌ１参照フレームのパラメータのためのシンタックス（図１１の第２１行から第３８行）は使用されなくてよい。また、参照フレーム数（マイナス１）に対応する変数“num_ref_idx_l0_active_minus1”の値は、ゼロである（即ち、色域を変換すべきベースレイヤ画像の数が１である）と見なされてよい。

また、別の実施例において、エンハンスメントレイヤでも重み付け予測関連パラメータが符号化され、その一部が色域予測のために再利用されてもよい。例えば、輝度成分及び色差成分のゲインの分母として、図１１に示した“luma_log2_weight_denom”及び“delta_chroma_log2_weight_denom”により特定される分母が再利用され得る。この場合、可逆符号化部１６は、図８に示した“delta_luma_log2_gain_denom”及び“delta_chroma_log2_gain_denom”を符号化しない。それにより、色域予測のために追加的に必要とされる符号量を削減し、符号化効率を高めることができる。

（５）予測パラメータの２つのバージョンの提供
前項では、重み付け予測関連パラメータのシンタックスを色域予測の予測パラメータのために再利用する際に、Ｌ１参照フレームのパラメータのためのシンタックスは使用されなくてもよいと説明した。しかしながら、ある変形例において、Ｌ０参照フレームの及びＬ１参照フレームのパラメータのためのシンタックスの双方を再利用して、色域予測の予測パラメータの２つのバージョンが提供されてもよい。

例えば、色域予測部４０のパラメータ計算部４３は、予測モード設定部４２により適応パラメータモードが設定され又は適応パラメータモードの符号化効率若しくは予測精度が評価される場合に、ゲインｇ_ｉ及びオフセットｏ_ｉ（ｉ＝１，２，３）の第１のバージョンを計算する。また、パラメータ計算部４３は、ゲインｇ_ｉ及びオフセットｏ_ｉ（ｉ＝１，２，３）の第２のバージョンも計算する。そして、色域変換部４４は、エンハンスメントレイヤの画像を予測するために、即ちインターレイヤ予測のための参照画像を生成するために、これら予測パラメータの第１のバージョン及び第２のバージョンを選択的に使用する。さらに、パラメータ計算部４３は、予測パラメータの第１のバージョンについての過去の値からの差分と、予測パラメータの第２のバージョンについての過去の値からの差分とを計算してもよい。可逆符号化部１６は、第１のバージョンについて計算される差分を、重み付け予測関連パラメータと共用されるシンタックスのＬ０参照フレーム用の部分へ符号化する。また、可逆符号化部１６は、第２のバージョンについて計算される差分を、重み付け予測関連パラメータと共用されるシンタックスのＬ１参照フレーム用の部分へ符号化する。

以下、エンハンスメントレイヤの画像を予測する際に使用すべきバージョンを切り替えるための２つの例示的な手法について説明する。

（５−１）第１の手法
第１の手法において、予測パラメータの第１のバージョン及び第２のバージョンは、画素値が属するバンドに応じて選択的に使用される。ここでの画素値のバンドとは、限定ではないものの、輝度成分については明るさ、色差成分については鮮やかさに相当し得る。

図１２は、画素値が属するバンドに応じた予測パラメータの選択的な使用について説明するための説明図である。図１２には、輝度成分（Ｙ）及び色差成分（Ｃｂ／Ｃｒ）の画素値のレンジを表現する２本のバーが示されており、ビット深度が８ビットである場合にはこれらレンジは０から２５５までである。輝度成分のレンジは、境界値を基準に下側のバンドＰｂ１１及び上側のバンドＰｂ１２に区分されており、図１２の例では輝度成分の境界値は１２８（即ち、レンジの中央）に等しい。そして、色域変換部４４は、（例えば、アップサンプリング画像の）輝度成分の画素値がバンドＰｂ１１に属する場合には、当該画素値から予測画素値を計算する際に、予測パラメータの第１のバージョンを使用し得る。また、色域変換部４４は、輝度成分の画素値がバンドＰｂ１２に属する場合には、当該画素値から予測画素値を計算する際に、予測パラメータの第２のバージョンを使用し得る。また、色差成分のレンジは、２つの境界値を基準に内側のバンドＰｂ２１及び外側のバンドＰｂ２２に区分されており、図１２の例では色差成分の境界値は６４及び１９１（即ち、レンジの１／４の値及び３／４の値）に等しい。そして、色域変換部４４は、（例えば、アップサンプリング画像の）色差成分の画素値がバンドＰｂ２１に属する場合には、当該画素値から予測画素値を計算する際に、予測パラメータの第１のバージョンを使用し得る。また、色域変換部４４は、色差成分の画素値がバンドＰｂ２２に属する場合には、当該画素値から予測画素値を計算する際に、予測パラメータの第２のバージョンを使用し得る。

使用すべきバージョンの切替えのための上記境界値は、予めエンコーダ及びデコーダの双方にとって既知であってもよい。その代わりに、可逆符号化部１６は、上記境界値を特定する境界情報をさらに符号化してもよい。境界情報は、例えば、輝度成分について、レンジの中央の基準値（例えば、ビット深度が８ビットであれば１２８）に加算される輝度成分用の調整値を示し得る。また、境界情報は、色差成分について、レンジの１／４に等しい第１の基準値から減算され及びレンジの３／４に等しい第２の基準値に加算される、色差成分用の調整値を示し得る。

図１３は、第１の手法によって実現される予測モデルを輝度成分について簡略的に表現するグラフである。図１３のグラフの横軸はベースレイヤの輝度成分の画素値に対応し、当該画素値は例えばＢＴ．７０９で表現される。縦軸はエンハンスメントレイヤの輝度成分の画素値に対応し、当該画素値は例えばＢＴ．２０２０で表現される。太線は、ベースレイヤの画素値から適応パラメータモードのゲイン及びオフセットを用いて予測されるエンハンスメントレイヤの予測画素値の軌跡を示している。この軌跡は、横軸上の境界値Ｙ_{ｂｏｒｄｅｒ}の左側のバンドＰｂ１１及び右側のバンドＰ１２において、異なる傾きと切片とを有し、折れ線状を呈する。このような折れ線状の軌跡を描く予測モデルが利用可能となれば、予測モデルが完全に線形（即ち、直線状の軌跡）である既存の手法と比較して、色域予測の予測誤差を低減し、符号化効率を向上させることが可能となる。境界値Ｙ_{ｂｏｒｄｅｒ}は、ベースレイヤの輝度成分の画素値の最大値Ｙ_ｍａｘの半分（Ｙ_ｍａｘ／２）に等しくてもよく、Ｙ_ｍａｘ／２に調整値ｄＹを加算した値に等しくてもよい。調整値ｄＹの追加的な符号化は、境界値Ｙ_{ｂｏｒｄｅｒ}が適応的に制御され得ることを意味する。この場合、色域予測の予測モデルの柔軟性が拡張される結果として、予測精度を一層高めることが可能となる。

図１４は、図１２を用いて説明した手法に関連するシンタックスの一例について説明するための説明図である。図１４に示したシンタックスにおける行番号は、図１１に示した重み付け予測関連パラメータのシンタックスの行番号に対応する。なお、重み付け予測関連パラメータのシンタックスのうちのＬ１参照フレームのパラメータのための部分は、説明の簡明さのために図から省略されている。図１４を参照すると、第２行の後に、追加的なフラグ“inter_layer_pred_flag”が定義されている。当該フラグ“inter_layer_pred_flag”は、このシンタックスが色域予測パラメータのために利用される場合に真（True）に設定される。第１３行の後のパラメータ“delta_pix_value_luma[i]”は、輝度成分についての上述した境界情報である。一例として、パラメータ“delta_pix_value_luma[i]”は、輝度成分について、レンジの中央の基準値に加算される輝度成分用の調整値を特定する。第１８行の後のパラメータ“delta_pix_value_chroma[i][j]”は、色差成分についての上述した境界情報である。一例として、パラメータ“delta_pix_value_chroma[i][j]”は、色差成分について、レンジの１／４に等しい第１の基準値から減算され及びレンジの３／４に等しい第２の基準値に加算される、色差成分用の調整値を特定する。なお、図１４に示したこれら追加的なパラメータは、スライスヘッダではなくスライスヘッダの拡張（extension）に含まれてもよい。

（５−２）第２の手法
第２の手法において、予測パラメータの第１のバージョン及び第２のバージョンは、画素が属する画像領域に応じて選択的に使用される。ここでの画像領域とは、ピクチャ、スライス又はタイルをセグメント化することにより形成され得る個々の領域に相当し得る。

図１５は、画素が属する画像領域に応じた予測パラメータの選択的な使用について説明するための説明図である。図１５を参照すると、画像ＩＭ_２が示されている。画像ＩＭ_２は、例えばアップサンプリング部４１から出力され得るアップサンプリング画像であってよい。画像ＩＭ_２は、上方の画像領域ＰＡ１及び下方の画像領域ＰＡ２にセグメント化されている。色域変換部４４は、例えば画像領域ＰＡ１に属する画素について予測画素値を計算する際に予測パラメータの第１のバージョンを使用し、画像領域ＰＡ２に属する画素について予測画素値を計算する際に予測パラメータの第２のバージョンを使用し得る。

使用すべきバージョンの切替えのための領域境界は、予めエンコーダ及びデコーダの双方にとって既知であってもよい（例えば、ピクチャ、スライス又はタイルを２つに等分する境界、など）。その代わりに、可逆符号化部１６は、上記領域境界を特定する境界情報をさらに符号化してもよい。境界情報は、例えば、ラスタスキャン順で領域境界の後に続く最初のＬＣＵ（図中のＬＣＵＬ_{ｂｏｒｄｅｒ}）を指定する情報であってもよい。領域境界の後に続く最初のＬＣＵは、ピクチャ、スライス又はタイルの所定の場所からカウントされるＬＣＵの数で指定されてもよく、又は当該最初のＬＣＵのヘッダに含められるフラグで指定されてもよい。前者の場合における所定の場所とは、ピクチャ、スライス若しくはタイルの先頭であってもよく、又はそれらの中間点（例えば、総ＬＣＵ数のちょうど半分の場所）であってもよい。後者の場合には、１ビットのフラグのみを符号化パラメータに追加するだけで、２つのバージョンの予測パラメータの切替えのための領域境界を適応的に制御することが可能となる。なお、ＨＥＶＣの既存の仕様において、スライスのサイズを直接的に示すサイズ情報は符号化されない。よって、デコーダは、通常、スライスを復号している最中に（当該スライスの復号が完了する前に）当該スライスのサイズを認識しない。従って、領域境界を特定する境界情報を追加的に符号化することは、領域境界が固定的（例えば、スライスを２つに等分する境界、など）であるケースでも有益である。

図１６は、図１５を用いて説明した手法に関連するシンタックスの一例について説明するための説明図である。図１６に示したシンタックスにおける行番号は、図１１に示した重み付け予測関連パラメータのシンタックスの行番号に対応する。なお、重み付け予測関連パラメータのシンタックスのうちのＬ１参照フレームのパラメータのための部分は、説明の簡明さのために図から省略されている。図１６を参照すると、第２行の後に、図１４に示したものと同様の追加的なフラグ“inter_layer_pred_flag”が定義されている。当該フラグ“inter_layer_pred_flag”は、このシンタックスが色域予測パラメータのために利用される場合に真（True）に設定される。当該フラグの後のパラメータ“delta_num_ctb”は、上述した境界情報である。パラメータ“delta_num_ctb”は、ラスタスキャン順で領域境界の後に続く最初のＬＣＵを、ＬＣＵの数で指定する情報である。ＬＣＵの数がピクチャ、スライス又はタイルの中間点からカウントされる場合には、パラメータ“delta_num_ctb”は正又は負の整数を示し得る。なお、図１６に示したこれら追加的なパラメータもまた、スライスヘッダではなくスライスヘッダの拡張（extension）に含まれてもよい。

このように画像領域ごとに異なるバージョンの予測パラメータが利用可能となれば、それぞれの画像領域において最適な予測モデルを色域予測に適用することが可能となる。例えば風景画像中の青空領域とそれ以外の領域とで、ゲイン及びオフセットの最適な組合せは異なる。そのような場合に、領域ごとに最適化されたゲイン及びオフセットを色域予測のために使用することで、色域予測の予測誤差を低減し、符号化効率を向上させることができる。領域境界を特定する境界情報の追加的な符号化は、領域境界の場所が適応的に制御され得ることを意味する。この場合、画像の内容に合わせて領域境界を移動させて色域予測の予測誤差をより一層低減することが可能となる。

（５−３）色成分ごとの制御
一変形例において、予測パラメータの２つのバージョンを提供するという本項で述べた手法は、輝度成分にのみ適用され、色差成分には適用されなくてもよい。この場合、色差成分の色域予測のために、画素値が属するバンド又は画素が属する画像領域に関わらず、重み付け予測関連パラメータのシンタックスのうちのＬ０参照フレームのための部分に符号化され及び当該部分から復号され得る予測パラメータ（典型的には、ゲイン及びオフセット）が利用される。Ｌ１参照フレームのための部分に含まれる色差成分についてのパラメータは、可変長符号化によって最も短い符号語にマッピングされ得る任意の値（例えばゼロ）に設定されてよい（その値は、色差成分の色域予測において無視され得る）。一般的に、主観的な画質への色差成分の寄与は輝度成分の寄与と比較してより小さいため、このように色差成分の色域予測の精度を選択的に抑制することで、わずかな画質の犠牲を伴うだけで予測パラメータの符号量を削減することができる。

また、色差成分の解像度が輝度成分の解像度と等しいことをクロマフォーマットが示す場合には輝度成分及び色差成分の双方について予測パラメータの２つのバージョンが提供され、色差成分の解像度が輝度成分の解像度よりも低いことをクロマフォーマットが示す場合には色差成分について予測パラメータの１つのバージョンのみが提供されてもよい。例えば、クロマフォーマットが４：２：０の場合、色差成分の解像度は、垂直方向及び水平方向の双方において輝度成分よりも低い。クロマフォーマットが４：２：２の場合、色差成分の解像度は、水平方向において輝度成分よりも低い。これらケースでは、色域予測の予測精度の低下が符号化効率に与える影響は、輝度成分と比較してより小さい。よって、これらケースにおいて色差成分についてのみ色域予測をより粗く実行することで、予測パラメータの符号量を効果的に低減することができる。

（６）ビットシフトを実行するタイミングの制御
上述したように、高精細（ＨＤ）テレビジョンと超高精細（ＵＨＤ）テレビジョンとの間では、画像サイズ、色域及びビット深度が異なる。これら３つの属性を変換する処理がそれぞれ別個に実行されるとすれば、インターレイヤの処理全体のために要する処理コストは非常に大きくなる。そこで、ＪＣＴＶＣ−Ｏ０１９４（“SCE4: Test 5.1 results on bit-depth and color-gamut scalability”，Alireza Aminlou， el. al, 2013年10月23-11月1日）は、アップサンプリングのフィルタ演算の中にビットシフト演算を組み込むことで、処理コストを抑制することを提案している。

図１７Ａ〜図１７Ｃは、ＪＣＴＶＣ−Ｏ０１９４において提案された手法について説明するための説明図である。図１７Ａの例において、ベースレイヤの画像サイズは２Ｋ（例えば、１９２０×１０８０画素）、色域はＢＴ．７０９、ビット深度は８ビットである。エンハンスメントレイヤの画像サイズは４Ｋ（例えば、３８４０×２１６０画素）、色域はＢＴ．２０２０、ビット深度は１０ビットである。インターレイヤ予測において、アップサンプリング部４１は、アップサンプリングと共にビットシフトを実行する（ステップＳ１）。例えば、フィルタ演算における２つの項の加算は１ビット分の左シフトに、４つの項の加算は２ビット分の左シフトに相当し得る。従って、ビットシフトは、実質的にはアップサンプリングと同時に行われ得る。その後、色域変換部４４は、アップサンプリング部４１から入力されるアップサンプリング後の画像の色域を変換する（ステップＳ３）。ここでの色域の変換は、重み付け予測に類似する線形的な変換であってよい。

図１７Ｂの例において、ベースレイヤの画像サイズは２Ｋ、色域はＢＴ．７０９、ビット深度は８ビットである。エンハンスメントレイヤの画像サイズは２Ｋ、色域はＢＴ．２０２０、ビット深度は１０ビットである。インターレイヤ予測において、アップサンプリング部４１は、レイヤ間で解像度が同じであるため、ビットシフトのみを実行する（ステップＳ２）。その後、色域変換部４４は、アップサンプリング部４１から入力されるアップサンプリング後の画像の色域を変換する（ステップＳ３）。

図１７Ｃの例において、ベースレイヤの画像サイズは２Ｋ、色域はＢＴ．７０９、ビット深度は８ビットである。エンハンスメントレイヤの画像サイズは４Ｋ、色域はＢＴ．７０９、ビット深度は１０ビットである。インターレイヤ予測において、アップサンプリング部４１は、アップサンプリングと共にビットシフトを実行する（ステップＳ１）。レイヤ間で色域は同じであるため、色域変換部４４は、色域変換を実行しない。

図１７Ａ及び図１７Ｃのケースでは、アップサンプリングとビットシフトとが同時に実行されるため、これらが別個に実行されるケースと比較して、インターレイヤ予測のために要する処理コストが抑制される。一方で、図１７Ｂのケースでは、色域変換自体がビットシフトに類似する演算を含んでいるにも関わらず、ビットシフトが色域変換から独立して実行されるため、処理コストの観点で改善の余地がある。

そこで、一実施例において、色域変換部４４が色域変換の演算においてビットシフトを併せて実行することを可能とする。特に重み付け予測のためのシンタックスが再利用されることを想定すると、色域変換の演算は、次のように表現され得る。

式（７）において、Ｘ_ｋはｋ番目の色成分の変換前の画素値、Ｘ_{ｋ，Ｐｒｅｄ}はｋ番目の色成分の変換後の画素値である。ｗ_ｋ、ｎ_ｋ及びｏ_ｋは、ｋ番目の色成分に適用される、それぞれ重み（ゲイン）の分子、２を底とする重みの分母の対数、及びオフセットである。ここで、レイヤ間のビット深度の差をｍビットとすると、色域変換部４４がｍビット分のビットシフト（左シフト）を色域変換と同時に実行する際の演算は、次のように表現され得る。

ビットシフトをアップサンプリングと同時に実行することも、ビットシフトを色域変換と同時に実行することも可能である場合、ビットシフトを実行するタイミングがエンコーダとデコーダとで（又は別々の実装を有するデコーダの間で）異なってしまう可能性が生じる。例えば、エンコーダが色域変換と同時にビットシフトを実行したにも関わらず、デコーダがアップサンプリングと同時にビットシフトを実行すると、インターレイヤ予測の精度が低下する。そこで、本実施例において、可逆符号化部１６は、ビットシフトの実行タイミングを制御するビットシフト制御フラグをさらに符号化する。ビットシフト制御フラグは、例えば、エンハンスメントレイヤのビット深度がベースレイヤのビット深度よりも大きい場合に、インターレイヤ予測の際のビットシフトを色域変換と同時に実行すべきか、又はアップサンプリングと同時に実行すべきか、を示す制御パラメータである。

図１８Ａ〜図１８Ｃは、インターレイヤ予測の処理コストを抑制するための新たな手法について説明するための説明図である。図１８Ａの例におけるベースレイヤ及びエンハンスメントレイヤの属性は、図１７Ａと同様である。但し、ビットシフト制御フラグは“１”（重み付け予測と同時にビットシフトを実行）を示す。この場合、インターレイヤ予測において、アップサンプリング部４１は、ビット深度を高めるためのビットシフトを行うことなく、アップサンプリングを実行する（ステップＳ４）。その後、色域変換部４４は、上の式（８）のように、アップサンプリング部４１から入力されるアップサンプリング後の画像の色域を変換すると同時に、ビットシフトを実行する（ステップＳ６）。

図１８Ｂの例におけるベースレイヤ及びエンハンスメントレイヤの属性は、図１７Ｂと同様である。但し、ビットシフト制御フラグは“１”（重み付け予測と同時にビットシフトを実行）を示す。この場合、インターレイヤ予測において、アップサンプリング部４１は、ビットシフトもアップサンプリングも実行しない。色域変換部４４は、上の式（８）のように、ベースレイヤの画像の色域を変換すると同時に、ビットシフトを実行する（ステップＳ６）。

図１８Ｃの例におけるベースレイヤ及びエンハンスメントレイヤの属性は、図１７Ｃと同様である。但し、ビットシフト制御フラグは“０”（アップサンプリングと同時にビットシフトを実行）を示す。この場合、インターレイヤ予測において、アップサンプリング部４１は、アップサンプリングと共にビットシフトを実行する（ステップＳ５）。レイヤ間で色域は同じであるため、色域変換部４４は、色域変換を実行しない。

図１７Ａ〜図１７Ｃと図１８Ａ〜図１８Ｃとを対比すると、特に画像サイズがレイヤ間で変化しない第２の例（図１７Ｂ及び図１８Ｂ）に関し、新たな手法で処理ステップが削減されていることが理解される。また、新たな手法では、ビットシフト制御フラグの存在が、ビットシフトを実行するタイミングを適応的に切り替えてインターレイヤ予測の処理ステップ数を最小化することを可能としている。

図１９は、図１８Ａ〜図１８Ｃを用いて説明した手法に関連するシンタックスの一例について説明するための説明図である。図１９に示したシンタックスにおける行番号は、図１１に示した重み付け予測関連パラメータのシンタックスの行番号に対応する。なお、重み付け予測関連パラメータのシンタックスのうちのＬ１参照フレームのパラメータのための部分は、説明の簡明さのために図から省略されている。図１９を参照すると、第１行の後に、レイヤＩＤがゼロでない（即ち、当該レイヤがエンハンスメントレイヤである）場合に符号化される、２つの符号化パラメータ“weighted_prediction_and_bit_shift_luma_flag”及び“weighted_prediction_and_bit_shift_chroma_flag”が定義されている。このうち、前者は、輝度成分のビットシフトの実行タイミングを制御するためのビットシフト制御フラグである。後者は、色差成分のビットシフトの実行タイミングを制御するためのビットシフト制御フラグである。これらフラグは、ビットシフトを色域変換と同時に実行すべき場合には真（True）に、ビットシフトをアップサンプリングと同時に実行すべき場合には偽（False）に設定される。画像サイズ及びビット深度は色成分ごとに異なるように定義され得るため、輝度成分及び色差成分について別々にビットシフト制御フラグを符号化することで、それら属性の定義に合せてビットシフトの実行タイミングを柔軟に制御することが可能となる。なお、ここでの例に限定されず、輝度成分及び色差成分の双方について単一のビットシフト制御フラグが符号化されてもよい。また、レイヤ間でビット深度が同じである場合には、ビットシフト制御フラグの符号化は省略されてもよく、又はフラグが特定の値（例えば、ゼロ）に設定されてもよい。また、インターレイヤ予測ではなくレイヤ内のインター予測における重み付け予測のために図１９のシンタックスが利用される場合にも、ビットシフト制御フラグの符号化は省略されてもよく、又はフラグが特定の値（例えば、ゼロ）に設定されてもよい。

＜３．一実施形態に係る符号化時の処理の流れ＞
［３−１．概略的な流れ］
図２０は、一実施形態に係る符号化時の概略的な処理の流れの一例を示すフローチャートである。なお、説明の簡明さのために、本開示に係る技術に直接的に関連しない処理ステップは、図から省略されている。

図２０を参照すると、まず、ＢＬ符号化部１ａは、ベースレイヤの符号化処理を実行し、ベースレイヤの符号化ストリームを生成する（ステップＳ１１）。

共通メモリ２は、ベースレイヤの符号化処理において生成されるベースレイヤの画像（復号画像及び予測誤差画像の一方又は双方）及びレイヤ間で再利用されるパラメータをバッファリングする（ステップＳ１２）。レイヤ間で再利用されるパラメータは、重み付け予測関連パラメータを含んでもよい。

次に、ＥＬ符号化部１ｂは、エンハンスメントレイヤの符号化処理を実行し、エンハンスメントレイヤの符号化ストリームを生成する（ステップＳ１３）。ここで実行されるエンハンスメントレイヤの符号化処理において、共通メモリ２によりバッファリングされているベースレイヤの画像は、色域予測部４０によりアップサンプリングされ、その色域は変換される。そして、色域変換後のベースレイヤの画像は、インターレイヤ予測において参照画像として使用され得る。

次に、多重化部３は、ＢＬ符号化部１ａにより生成されるベースレイヤの符号化ストリームと、ＥＬ符号化部１ｂにより生成されるエンハンスメントレイヤの符号化ストリームとを多重化し、マルチレイヤの多重化ストリームを生成する（ステップＳ１４）。

［３−２．色域予測処理］
（１）第１の例
図２１は、エンハンスメントレイヤの符号化処理における色域予測処理の流れの第１の例を示すフローチャートである。ここで説明する色域予測処理は、ピクチャ又はスライスごとに繰り返される。

図２１を参照すると、まず、アップサンプリング部４１は、共通メモリ２から取得されるベースレイヤの画像を、ベースレイヤとエンハンスメントレイヤとの間の解像度比に従ってアップサンプリングする（ステップＳ２０）。

次に、予測モード設定部４２は、色域予測のための予測モードの候補のうちのいずれかの予測モードを、ピクチャ（又はスライス）に設定する（ステップＳ２２）。予測モード設定部４２は、予め定義される予測モードを設定してもよく、又は予測モードの各候補についての符号化効率若しくは予測精度の評価に基づいて動的に選択される予測モードを設定してもよい。

次に、可逆符号化部１６は、予測モード設定部４２により設定された予測モードを示す予測モードパラメータを符号化する（ステップＳ２５）。可逆符号化部１６により符号化された予測モードパラメータは、例えばＰＰＳ又はスライスヘッダへ挿入される。

その後の処理は、予測モード設定部４２により設定された予測モードに依存して分岐する（ステップＳ２６、Ｓ２８）。例えば、設定された予測モードが適応パラメータモードである場合、パラメータ計算部４３は、色域の予測（変換）のために使用すべき最適なゲイン及びオフセットの値を計算する（ステップＳ３０）。また、パラメータ計算部４３は、計算した最適なゲイン及びオフセットの値の過去の値からの差分を計算する。そして、可逆符号化部１６は、パラメータ計算部４３により計算されたゲイン及びオフセットの差分を符号化する（ステップＳ３２）。可逆符号化部１６により符号化されたこれら予測パラメータの差分は、例えばＰＰＳ又はスライスヘッダへ挿入される。

設定された予測モードが適応パラメータモード又は固定パラメータモードである場合、色域変換部４４は、式（４）〜式（６）に従って、アップサンプリング後のベースレイヤの画素値に適応的に計算された又は固定的なゲインを乗算し、さらにオフセットを加算することにより、各画素の予測画素値を計算する（ステップＳ３４）。

設定された予測モードがビットシフトモードである場合、色域変換部４４は、式（１）〜式（３）に従って、アップサンプリング後のベースレイヤの画素値を所定のビットシフト量だけ左方へシフトさせることにより、各画素の予測画素値を計算する（ステップＳ３６）。

処理対象のピクチャ又はスライス内の全ての予測画素値が計算されると、色域変換部４４は、色域変換後のベースレイヤの画像、即ち色域予測の結果としての予測画像を、フレームメモリ２５に格納する（ステップＳ３８）。

その後、未処理の次のピクチャ又はスライスが存在する場合には、処理はステップＳ２０へ戻り、次のピクチャ又はスライスについて上述した処理が繰り返される（ステップＳ４０）。

（２）第２の例
図２２は、エンハンスメントレイヤの符号化処理における色域予測処理の流れの第２の例を示すフローチャートである。

図２２を参照すると、まず、予測モード設定部４２は、色域予測のための予測モードの候補のうちのいずれかの予測モードを、シーケンスに設定する（ステップＳ２１）。次に、可逆符号化部１６は、予測モード設定部４２により設定された予測モードを示す予測モードパラメータを符号化する（ステップＳ２３）。可逆符号化部１６により符号化された予測モードパラメータは、ＳＰＳへ挿入される。

ステップＳ２４〜ステップＳ４０の処理は、シーケンス内のピクチャ又はスライスごとに繰り返される。

アップサンプリング部４１は、共通メモリ２から取得されるベースレイヤの画像を、ベースレイヤとエンハンスメントレイヤとの間の解像度比に従ってアップサンプリングする（ステップＳ２４）。

さらに、予測モード設定部４２により設定された予測モードに依存して、処理は分岐する（ステップＳ２６、Ｓ２８）。例えば、設定された予測モードが適応パラメータモードである場合、パラメータ計算部４３は、色域の予測（変換）のために使用すべき最適なゲイン及びオフセットの値を計算する（ステップＳ３０）。また、パラメータ計算部４３は、計算した最適なゲイン及びオフセットの値の過去の値からの差分を計算する。そして、可逆符号化部１６は、パラメータ計算部４３により計算されたゲイン及びオフセットの差分を符号化する（ステップＳ３２）。可逆符号化部１６により符号化されたこれら予測パラメータの差分は、例えばＰＰＳ又はスライスヘッダへ挿入される。

その後、シーケンス内に未処理の次のピクチャ又はスライスが存在する場合には、処理はステップＳ２４へ戻り、次のピクチャ又はスライスについてアップサンプリング及び色域変換が繰り返される（ステップＳ４０）。また、シーケンス内の全てのピクチャ又は全てのスライスについて色域変換が終了した場合には、次のシーケンスが存在するかがさらに判定される（ステップＳ４２）。そして、次のシーケンスが存在する場合には、処理はステップＳ２１へ戻り、次のシーケンスについて上述した処理が繰り返される。

（３）第３の例
図２３は、エンハンスメントレイヤの符号化処理における色域予測処理の流れの第３の例を示すフローチャートである。

図２３を参照すると、まず、予測モード設定部４２は、色域予測のための予測モードの候補のうちのいずれかの予測モードを、シーケンスに設定する（ステップＳ２１）。次に、可逆符号化部１６は、予測モード設定部４２により設定された予測モードを示す予測モードパラメータを符号化する（ステップＳ２３）。可逆符号化部１６により符号化された予測モードパラメータは、ＳＰＳへ挿入される。

ステップＳ２４〜ステップＳ４１の処理は、シーケンス内のスライスごとに繰り返される。

アップサンプリング部４１は、共通メモリ２から取得されるベースレイヤの画像を、ベースレイヤとエンハンスメントレイヤとの間の解像度比に従ってアップサンプリングする（ステップＳ２４）。ここでのアップサンプリングのフィルタ演算は、インターレイヤ予測のためのビットシフトを含んでもよく、又は含まなくてもよい。

さらに、予測モード設定部４２により設定された予測モードに依存して、処理は分岐する（ステップＳ２６、Ｓ２８）。例えば、設定された予測モードが適応パラメータモードである場合、パラメータ計算部４３は、色域の予測（変換）のために使用すべき最適なゲイン及びオフセットの値を計算する（ステップＳ３０）。また、パラメータ計算部４３は、計算した最適なゲイン及びオフセットの値の過去の値からの差分を計算する。そして、可逆符号化部１６は、計算されたゲイン及びオフセットの差分を、重み付け予測関連パラメータのシンタックスを再利用することにより符号化する（ステップＳ３３）。可逆符号化部１６により符号化されたこれら予測パラメータの差分は、スライスヘッダへ挿入される。上述したビットシフト制御フラグがシンタックスにおいて採用される場合には、符号化されたビットシフト制御フラグもまた、ここでスライスヘッダへ挿入され得る。

設定された予測モードが適応パラメータモード又は固定パラメータモードである場合、色域変換部４４は、式（４）〜式（６）に従って、アップサンプリング後のベースレイヤの画素値に適応的に計算された又は固定的なゲインを乗算し、さらにオフセットを加算することにより、各画素の予測画素値を計算する（ステップＳ３４）。ステップＳ２４においてビットシフトが行われていない場合には、ここでの予測画素値の計算がビットシフトを含んでもよい。

処理対象のスライス内の全ての予測画素値が計算されると、色域変換部４４は、色域変換後のベースレイヤの画像、即ち色域予測の結果としての予測画像を、フレームメモリ２５に格納する（ステップＳ３８）。

その後、シーケンス内に未処理の次のスライスが存在する場合には、処理はステップＳ２４へ戻り、次のスライスについてアップサンプリング及び色域変換が繰り返される（ステップＳ４１）。また、シーケンス内の全てのスライスについて色域変換が終了した場合には、次のシーケンスが存在するかがさらに判定される（ステップＳ４２）。そして、次のシーケンスが存在する場合には、処理はステップＳ２１へ戻り、次のシーケンスについて上述した処理が繰り返される。

（４）第４の例
図２４は、エンハンスメントレイヤの符号化処理における色域予測処理の流れの第４の例を示すフローチャートである。

図２４を参照すると、まず、予測モード設定部４２は、色域予測のための予測モードの候補のうちのいずれかの予測モードを、シーケンスに設定する（ステップＳ２１）。次に、可逆符号化部１６は、予測モード設定部４２により設定された予測モードを示す予測モードパラメータを符号化する（ステップＳ２３）。可逆符号化部１６により符号化された予測モードパラメータは、ＳＰＳへ挿入される。

さらに、予測モード設定部４２により設定された予測モードに依存して、処理は分岐する（ステップＳ２６、Ｓ２８）。例えば、設定された予測モードが適応パラメータモードである場合、パラメータ計算部４３は、色域の予測（変換）のために使用すべきゲイン及びオフセットの第１のバージョンを計算する（ステップＳ３１ａ）。同様に、パラメータ計算部４３は、ゲイン及びオフセットの第２のバージョンを計算する（ステップＳ３１ｂ）。これら第１のバージョン及び第２のバージョンは、それぞれ、画素値のレンジのうちの第１のバンド及び第２のバンドのために使用すべき最適な値のセットを含んでもよい。その代わりに、これら第１のバージョン及び第２のバージョンは、それぞれ、第１の画像領域及び第２の画像領域のために使用すべき最適な値のセットを含んでもよい。また、パラメータ計算部４３は、第１のバージョン及び第２のバージョンについて、ゲイン及びオフセットの値の過去の値からの差分をそれぞれ計算する。そして、可逆符号化部１６は、重み付け予測関連パラメータのシンタックスのＬ０参照フレーム用の部分及びＬ１参照フレーム用の部分へ、第１のバージョン及び第２のバージョンについて計算された予測パラメータの差分をそれぞれ符号化する（ステップＳ３３ｂ）。可逆符号化部１６により符号化されたこれら予測パラメータの差分は、スライスヘッダへ挿入される。上述したビットシフト制御フラグがシンタックスにおいて採用される場合には、符号化されたビットシフト制御フラグもまた、ここでスライスヘッダへ挿入され得る。

その後の処理の流れは、画素値が属するバンド又は画素が属する画像領域に応じた予測パラメータのバージョンの切替えがステップＳ３４において行われ得ることを除き、図２３を用いて説明した第３の例と同様であってよい。なお、可逆符号化部１６は、ステップＳ３３ｂにおいて、予測パラメータのバージョンの切替えのためのバンド間の境界値又は画像領域間の領域境界を特定する境界情報を、例えばスライスヘッダ又はスライスヘッダの拡張へ、追加的に符号化してもよい。

（５）処理順序の変形例
既存の手法によれば、インターレイヤ予測において、色域変換は、アップサンプリング（及び必要に応じてビットシフト）が実行された後に実行される。図２１〜図２４のフローチャートも、そのような処理順序を踏襲している。しかしながら、色域変換の処理コストは変換対象の画素数に比例するため、アップサンプリングによって増加した画素を対象として色域変換を実行することは、処理コストの観点で最適とは言えない。また、ビットシフト後の拡張されたビット深度を有する画素を対象として色域変換を実行することは、色域変換の演算に要する処理リソース（例えば、レジスタの所要ビット数）もより多くなることを意味する。そこで、一変形例として、色域予測部４０は、エンハンスメントレイヤの空間解像度（画像サイズ）がベースレイヤの空間解像度よりも高い場合に、ベースレイヤ画像の色域を変換した後、変換された当該画像をアップサンプリングすることにより、エンハンスメントレイヤ画像を予測してもよい。

図２５Ａは、既存のインターレイヤ予測の処理順序の一例について説明するための説明図である。図２５Ａには、一例として図１７Ａと同様の２つの処理ステップが示されている。まず、ベースレイヤのスライスデータに含まれる画像の画像サイズ及びビット深度（例えば、２Ｋ／８ビット）は、アップサンプリング及びビットシフトによってそれぞれ（例えば、４Ｋ／１０ビットに）高められる。次に、アップサンプリング後の画像の色域が、予測パラメータに従ってエンハンスメントレイヤの色域に変換される。

図２５Ｂは、一変形例における新たなインターレイヤ予測の処理順序の一例について説明するための説明図である。本変形例において、まず、色域予測部４０は、ベースレイヤのスライスデータに含まれる画像の色域を、予測パラメータに従ってエンハンスメントレイヤの色域に変換する。次に、色域予測部４０は、色域変換後の画像の画像サイズ（例えば、２Ｋ）を、アップサンプリングによって（例えば、４Ｋに）高める。ビットシフトは、色域変換と同時に実行されてもよく、又はアップサンプリングと同時に実行されてもよい。ビットシフトを実行すべきタイミングが、ビットシフト制御フラグによって指定されてもよい。このような新たな処理順序によれば、色域変換の変換対象の画素数及びビット深度が既存の処理順序のケースと比較して低減されるため、インターレイヤ予測の処理コストが一層抑制される。

＜４．一実施形態に係るＥＬ復号部の構成例＞
［４−１．全体的な構成］
図２６は、図５に示したＥＬ復号部６ｂの構成の一例を示すブロック図である。図２６を参照すると、ＥＬ復号部６ｂは、蓄積バッファ６１、可逆復号部６２、逆量子化部６３、逆直交変換部６４、加算部６５、ループフィルタ６６、並び替えバッファ６７、Ｄ／Ａ（Digital to Analogue）変換部６８、フレームメモリ６９、セレクタ７０及び７１、イントラ予測部８０、インター予測部８５並びに色域予測部９０を備える。

蓄積バッファ６１は、逆多重化部５から入力されるエンハンスメントレイヤの符号化ストリームを記憶媒体を用いて一時的に蓄積する。

可逆復号部６２は、蓄積バッファ６１から入力されるエンハンスメントレイヤの符号化ストリームから、符号化の際に使用された符号化方式に従ってエンハンスメントレイヤの量子化データを復号する。また、可逆復号部６２は、符号化ストリームのヘッダ領域に挿入されている情報を復号する。可逆復号部６２により復号される情報は、例えば、イントラ予測に関する情報及びインター予測に関する情報を含み得る。色域予測のためのパラメータもまた、エンハンスメントレイヤにおいて復号され得る。可逆復号部６２は、量子化データを逆量子化部６３へ出力する。また、可逆復号部６２は、イントラ予測に関する情報をイントラ予測部８０へ出力する。また、可逆復号部６２は、インター予測に関する情報をインター予測部８５へ出力する。また、可逆復号部６２は、色域予測のためのパラメータを色域予測部９０へ出力する。

逆量子化部６３は、可逆復号部６２から入力される量子化データを、符号化の際に使用されたものと同じ量子化ステップで逆量子化し、エンハンスメントレイヤの変換係数データを復元する。逆量子化部６３は、復元した変換係数データを逆直交変換部６４へ出力する。

逆直交変換部６４は、符号化の際に使用された直交変換方式に従い、逆量子化部６３から入力される変換係数データについて逆直交変換を行うことにより、予測誤差データを生成する。逆直交変換部６４は、生成した予測誤差データを加算部６５へ出力する。

加算部６５は、逆直交変換部６４から入力される予測誤差データと、セレクタ７１から入力される予測画像データとを加算することにより、復号画像データを生成する。そして、加算部６５は、生成した復号画像データをループフィルタ６６及びフレームメモリ６９へ出力する。

ループフィルタ６６は、ＥＬ符号化部１ｂのループフィルタ２４と同様、ブロック歪みを軽減するデブロックフィルタ、各画素値にオフセット値を加えるサンプル適応オフセットフィルタ、及び原画像との誤差を最小化する適応ループフィルタを含む。ループフィルタ６６は、加算部６５から入力される復号画像データをフィルタリングし、フィルタリング後の復号画像データを並び替えバッファ６７及びフレームメモリ６９へ出力する。

並び替えバッファ６７は、ループフィルタ６６から入力される画像を並び替えることにより、時系列の一連の画像データを生成する。そして、並び替えバッファ６７は、生成した画像データをＤ／Ａ変換部６８へ出力する。

Ｄ／Ａ変換部６８は、並び替えバッファ６７から入力されるデジタル形式の画像データをアナログ形式の画像信号に変換する。そして、Ｄ／Ａ変換部６８は、例えば、画像復号装置６０と接続されるディスプレイ（図示せず）にアナログ画像信号を出力することにより、エンハンスメントレイヤの画像を表示させる。

フレームメモリ６９は、加算部６５から入力されるフィルタリング前の復号画像データ、ループフィルタ６６から入力されるフィルタリング後の復号画像データ、及び色域予測部９０から入力されるベースレイヤの参照画像データを記憶媒体を用いて記憶する。

セレクタ７０は、可逆復号部６２により取得されるモード情報に応じて、画像内のブロックごとに、フレームメモリ６９からの画像データの出力先をイントラ予測部８０とインター予測部８５との間で切り替える。例えば、セレクタ７０は、イントラ予測モードが指定された場合には、フレームメモリ６９から供給されるフィルタリング前の復号画像データを参照画像データとしてイントラ予測部８０へ出力する。また、セレクタ７０は、インター予測モードが指定された場合には、フィルタリング後の復号画像データを参照画像データとしてインター予測部８５へ出力する。さらに、イントラ予測部８０又はインター予測部８５においてインターレイヤ予測が実行される場合、セレクタ７０は、ベースレイヤの参照画像データをイントラ予測部８０又はインター予測部８５へ供給する。

セレクタ７１は、可逆復号部６２により取得されるモード情報に応じて、加算部６５へ供給すべき予測画像データの出力元をイントラ予測部８０とインター予測部８５との間で切り替える。例えば、セレクタ７１は、イントラ予測モードが指定された場合には、イントラ予測部８０から出力される予測画像データを加算部６５へ供給する。また、セレクタ７１は、インター予測モードが指定された場合には、インター予測部８５から出力される予測画像データを加算部６５へ供給する。

イントラ予測部８０は、可逆復号部６２から入力されるイントラ予測に関する情報とフレームメモリ６９からの参照画像データとに基づいてエンハンスメントレイヤのイントラ予測処理を行い、予測画像データを生成する。イントラ予測処理は、ＰＵごとに実行される。イントラ予測部８０は、イントラ予測モードとしてイントラＢＬ予測又はイントラ残差予測が指定された場合には、予測対象ブロックに対応するベースレイヤ内のコロケーテッドブロックを参照ブロックとして使用する。イントラＢＬ予測の場合、イントラ予測部８０は、参照ブロックの復号画像に基づいて予測画像を生成する。イントラ残差予測の場合、イントラ予測部８０は、参照ブロックの予測誤差画像に基づいてイントラ予測の予測誤差を予測し、予測した予測誤差の加算された予測画像を生成する。イントラ予測部８０は、生成したエンハンスメントレイヤの予測画像データをセレクタ７１へ出力する。

インター予測部８５は、可逆復号部６２から入力されるインター予測に関する情報とフレームメモリ６９からの参照画像データとに基づいてエンハンスメントレイヤのインター予測処理（動き補償処理）を行い、予測画像データを生成する。インター予測処理は、ＰＵごとに実行される。インター予測部８５は、インター予測モードとしてインター残差予測が指定された場合には、予測対象ブロックに対応するベースレイヤ内のコロケーテッドブロックを参照ブロックとして使用する。インター残差予測の場合、インター予測部８５は、参照ブロックの予測誤差画像に基づいてインター予測の予測誤差を予測し、予測した予測誤差の加算された予測画像を生成する。インター予測部８５は、生成したエンハンスメントレイヤの予測画像データをセレクタ７１へ出力する。

色域予測部９０は、共通メモリ７によりバッファリングされるベースレイヤの画像（復号画像又は予測誤差画像）を、ベースレイヤとエンハンスメントレイヤとの間の解像度比に従ってアップサンプリングする。また、色域予測部９０は、ベースレイヤの画像とは異なる色域をエンハンスメントレイヤの画像が有する場合に、アップサンプリングしたベースレイヤの画像の色域を、エンハンスメントレイヤの画像と同等の色域に変換する。本実施形態において、色域予測部９０は、ベースレイヤ及びエンハンスメントレイヤの色域の間の色成分ごとに独立した線型的な関係を前提とし、ベースレイヤの画像からエンハンスメントレイヤの画像を近似的に予測することにより、色域を変換する。色域予測部９０により色域の変換されたベースレイヤの画像は、フレームメモリ６９に格納され、イントラ予測部８０又はインター予測部８５により、インターレイヤ予測において参照画像として使用され得る。色域予測部９０は、色域の予測のための予測モードを示す予測モードパラメータを、可逆復号部６２から取得する。また、色域予測部９０は、予測モードパラメータが適応パラメータモードを示す場合には、予測パラメータの過去の値からの差分を、可逆復号部６２からさらに取得する。そして、色域予測部９０は、可逆復号部６２から取得されるこれらパラメータを用いて、アップサンプリング後のベースレイヤの画像からエンハンスメントレイヤの画像を予測する。

［４−２．色域予測部の詳細な構成］
図２７は、図２６に示した色域予測部９０の構成の一例を示すブロック図である。図２７を参照すると、色域予測部９０は、アップサンプリング部９１、予測モード設定部９２、パラメータ計算部９３及び色域変換部９４を有する。

（１）アップサンプリング部
アップサンプリング部９１は、共通メモリ７から取得されるベースレイヤの画像を、ベースレイヤとエンハンスメントレイヤとの間の解像度比に従ってアップサンプリングする。より具体的には、アップサンプリング部９１は、解像度比に応じて順に走査される補間画素の各々について、予め定義されるフィルタ係数でベースレイヤの画像をフィルタリングすることにより補間画素値を計算する。それにより、参照ブロックとして使用されるベースレイヤの画像の空間解像度が、エンハンスメントレイヤと同等の解像度まで高められる。アップサンプリング部９１は、アップサンプリング後の画像を色域変換部９４へ出力する。

（２）予測モード設定部
予測モード設定部９２は、色域予測のための予測モードの候補のうち、可逆復号部６２により復号される予測モードパラメータにより示される予測モードを、色域予測部９０に設定する。予測モードの候補は、上述したビットシフトモード、固定パラメータモード及び適応パラメータモードを含み得る。ある実施例において、予測モード設定部９２は、ＰＰＳから復号される予測モードパラメータに従って、予測モードを設定し得る。他の実施例において、予測モード設定部９２は、スライスヘッダから復号される予測モードパラメータに従って、予測モードを設定し得る。また別の実施例において、予測モード設定部９２は、ＳＰＳから復号される予測モードパラメータに従って、予測モードを設定し得る。ＳＰＳから予測モードパラメータが復号される場合、１つのシーケンス内で同じ予測モードが維持され得る。

（３）パラメータ計算部
パラメータ計算部９３は、予測モード設定部９２により適応パラメータモードが設定された場合に、色域予測のために使用されるべき予測パラメータを、可逆復号部６２により復号される予測パラメータの差分を用いて計算する。ここでの予測パラメータは、式（４）〜式（６）に示したゲインｇ_ｉ及びオフセットｏ_ｉ（ｉ＝１，２，３）を含む。

より具体的には、パラメータ計算部９３は、適応パラメータモードにおいて、可逆復号部６２から取得されるゲイン及びオフセットの差分を、それぞれゲイン及びオフセットの過去の値に加算することにより、ゲイン及びオフセットの最新の値を計算する。ここでの過去の値とは、例えば、ピクチャごとにゲイン及びオフセットが計算される場合には、前回のピクチャについて計算された値であってよい。スライスごとにゲイン及びオフセットが計算される場合には、前回のピクチャの同じ位置のスライスについて計算された値であってよい。パラメータ計算部９３は、最新の予測モードパラメータが適応パラメータモードを示し、前回の予測モードパラメータがビットシフトモードを示す場合には、可逆復号部６２により復号される差分を、ビットシフト量に対応する予測パラメータ値に加算する。また、パラメータ計算部９３は、最新の予測モードパラメータが適応パラメータモードを示し、前回の予測モードパラメータが固定パラメータモードを示す場合には、可逆復号部６２により復号される差分を、予め定義される固定的な予測パラメータ値に加算する。ゲイン及びオフセットの差分をどのような過去の値（即ち、差分の基礎）にそれぞれ加算すべきかは、図９に示されている。パラメータ計算部９３は、計算したゲイン及びオフセットの最新の値を、色域変換部９４へ出力する。なお、ゲインの値は、小数値を含み得るため、その分母及び分子の差分が別々に復号され得る。従って、パラメータ計算部９３は、復号された差分からゲインの分母及び分子をそれぞれ計算し得る。色域変換部９４によるゲインの乗算は、実際には、整数である分子の乗算と、分母での除算に相当するシフト演算とにより行われ得る。ゲインの分母の値の範囲は、計算コストを低減するために２の整数乗のみに制限されてもよい。この場合、分母の値の２を底とする対数が、予測パラメータとして使用されてもよい。

（４）色域変換部
色域変換部９４は、予測モード設定部９２により設定される予測モードに従って、アップサンプリング部９１から入力されるアップサンプリング後のベースレイヤの画像の色域を、エンハンスメントレイヤの画像と同等の色域に変換する。例えば、色域変換部９４は、ビットシフトモードが設定された場合には、式（１）〜式（３）に従って、アップサンプリング後のベースレイヤの画素値を所定のビットシフト量ｎ_{ｓｈｉｆｔ}だけ左方へシフトさせることにより、予測画素値を計算する。また、色域変換部９４は、固定パラメータモードが設定された場合には、式（４）〜式（６）に従って、アップサンプリング後のベースレイヤの画素値に固定的なゲインを乗算し、さらに固定的なオフセットを加算することにより、予測画素値を計算する。また、色域変換部９４は、適応パラメータモードが設定された場合には、固定的なゲイン及びオフセットの代わりに、パラメータ計算部９３により適応的に計算されるゲイン及びオフセットを用いて、予測画素値を計算する。それにより、インターレイヤ予測のための参照画像が生成される。色域変換部９４は、このように生成されるインターレイヤ予測のための参照画像（色域の変換されたベースレイヤの画像）を、フレームメモリ６９に格納する。

可逆復号部６２により復号される予測モードパラメータ及び予測パラメータ（色成分ごとのゲイン及びオフセット）の差分のシンタックスの例は、図８に示されている。これらパラメータは、可逆復号部６２によりエンハンスメントレイヤの符号化ストリームから復号され得る。図８に示したシンタックスは、例えばＰＰＳに含まれてもよく、又はスライスヘッダに含まれてもよい。上述したように、予測モードパラメータ及び予測パラメータの差分がスライスヘッダから復号される例は、画像の部分領域ごとに異なる色域が使用される用途において有益である。また、拡張フラグ“color_gamut_prediction_flag”及び予測モードパラメータ“color_prediction_model”は、シーケンスごとにＳＰＳから復号されてもよい。この場合、１つのシーケンス内では同じ予測モードが維持される。

さらに、ある実施例において、可逆復号部６２は、表１に示したマッピングに従い、重み付け予測関連パラメータと共用されるシンタックスを有するヘッダ（スライスヘッダ）から、色域予測の予測パラメータの差分を復号してもよい。このようなシンタックスの再利用により、シンタックスの冗長性が低減され、エンコーダ及びデコーダの実装及びバージョンアップの際の互換性の確保が容易となる。但し、拡張フラグ“color_gamut_prediction_flag”及び予測モードパラメータ“color_prediction_model”は、ＳＰＳ、ＰＰＳ又はスライスヘッダから別途復号されてよい。また、可逆復号部６２は、重み付け予測関連パラメータ及び色域予測のためのパラメータのいずれが符号化されているかを示すフラグを復号し、復号した当該フラグに応じて色域予測のためのパラメータを復号してもよい。レイヤ間で重み付け予測関連パラメータが再利用される場合には、可逆復号部６２は、エンハンスメントレイヤ固有の重み付け予測関連パラメータを復号せず、その代わりに同じシンタックスで色域予測の予測パラメータの差分を復号し得る。この場合、Ｌ１参照フレームのパラメータのためのシンタックス（図１１の第２１行から第３８行）は使用されなくてよい。また、参照フレーム数（マイナス１）に対応する変数“num_ref_idx_l0_active_minus1”の値は、ゼロである（即ち、色域を変換すべきベースレイヤ画像の数が１である）と見なされてよい。

また、別の実施例において、可逆復号部６２は、重み付け予測関連パラメータの一部を色域予測のために再利用してもよい。例えば、輝度成分及び色差成分のゲインの分母として、図１１に示した“luma_log2_weight_denom”及び“delta_chroma_log2_weight_denom”により特定される分母が再利用され得る。この場合、可逆復号部６２は、図８に示した“delta_luma_log2_gain_denom”及び“delta_chroma_log2_gain_denom”を復号しない。

また、ある変形例において、可逆復号部６２は、重み付け予測関連パラメータと共用されるシンタックスのＬ０参照フレーム用の部分から色域予測の予測パラメータの第１のバージョンの差分を復号し、及び当該シンタックスのＬ１参照フレーム用の部分から色域予測の予測パラメータの第２のバージョンの差分を復号してもよい。この場合、パラメータ計算部９３は、色域予測の予測パラメータの第１のバージョンを当該第１のバージョンについて復号された差分を用いて計算し、色域予測の予測パラメータの第２のバージョンを当該第２のバージョンについて復号された差分を用いて計算する。そして、色域変換部９４は、予測パラメータの第１のバージョン及び第２のバージョンを、エンハンスメントレイヤの画像を予測するために、即ちインターレイヤ予測のための参照画像を生成するために選択的に使用する。

上記変形例において、色域変換部９４は、例えば、画素値が属するバンドに応じて、予測パラメータの第１のバージョン及び第２のバージョンのうち使用すべきバージョンを選択してもよい。使用すべきバージョンの切替えのためのバンド間の境界に対応する境界値は、予めエンコーダ及びデコーダの双方にとって既知であってもよく、又は適応的に設定されてもよい。境界値が適応的に設定される場合、色域変換部９４は、可逆復号部６２によりさらに復号され得る境界情報により特定される境界値に従って、画素値が属するバンドを判定する。そして、色域変換部９４は、その判定結果に基づいて、予測パラメータの第１のバージョン又は第２のバージョンのうち使用すべきバージョンを選択し得る。

その代わりに、上記変形例において、色域変換部９４は、例えば、画素が属する画像領域に応じて、予測パラメータの第１のバージョン及び第２のバージョンのうち使用すべきバージョンを選択してもよい。使用すべきバージョンの切替えのための領域境界は、予めエンコーダ及びデコーダの双方にとって既知であってもよく、又は適応的に設定されてもよい。領域境界が適応的に設定される場合、色域変換部９４は、可逆復号部６２によりさらに復号され得る境界情報により特定される領域境界に従って、画素が属する画像領域を判定する。そして、色域変換部９４は、その判定結果に基づいて、予測パラメータの第１のバージョン又は第２のバージョンのうち使用すべきバージョンを選択し得る。

このような変形例によれば、既存の手法と比較して色域予測の予測誤差が低減され、予測誤差データの符号量は減少する。その結果として、符号化効率が高められる。予測パラメータの２つのバージョンを提供するという手法は、上述したように、輝度成分にのみ適用され、色差成分には適用されなくてもよい。

また、一実施例において、色域変換部９４は、エンハンスメントレイヤのビット深度がベースレイヤのビット深度よりも大きい場合に、エンハンスメントレイヤの画像を予測する際のビットシフトを色域変換と同時に実行することを、可能とされる。可逆復号部６２は、エンハンスメントレイヤの制御パラメータとして、インターレイヤ予測の際のビットシフトを色域変換と同時に実行すべきかを示すビットシフト制御フラグを復号する。そして、色域変換部９４は、ビットシフトを色域変換と同時に実行すべきであることをビットシフト制御フラグが示す場合にはビットシフトを色域変換と同時に実行し、そうでない場合にはビットシフトを例えばアップサンプリングと同時に実行する。それにより、ビットシフトを実行するタイミングを適応的に切り替えて、インターレイヤ予測の処理ステップ数を最小化することが可能となる。その結果、既存の手法と比較して、インターレイヤ予測の処理コストが抑制され得る。可逆復号部６２は、輝度成分及び色差成分について別々にビットシフト制御フラグを復号してもよい。この場合、色成分ごとの設定（画像サイズ及びビット深度の設定）に合わせたより柔軟な制御が可能となる。ビットシフト制御フラグは、典型的には、図１９に例示したように、スライスヘッダから復号され得る。しかしながら、かかる例に限定されず、ビットシフト制御フラグは、ＳＰＳ又はＰＰＳなどの他の場所から復号されてもよい。

＜５．一実施形態に係る復号時の処理の流れ＞
［５−１．概略的な流れ］
図２８は、一実施形態に係る復号時の概略的な処理の流れの一例を示すフローチャートである。なお、説明の簡明さのために、本開示に係る技術に直接的に関連しない処理ステップは、図から省略されている。

図２８を参照すると、まず、逆多重化部５は、マルチレイヤの多重化ストリームをベースレイヤの符号化ストリーム及びエンハンスメントレイヤの符号化ストリームに逆多重化する（ステップＳ６０）。

次に、ＢＬ復号部６ａは、ベースレイヤの復号処理を実行し、ベースレイヤの符号化ストリームからベースレイヤ画像を再構築する（ステップＳ６１）。

共通メモリ７は、ベースレイヤの復号処理において生成されるベースレイヤの画像（復号画像及び予測誤差画像の一方又は双方）及びレイヤ間で再利用されるパラメータをバッファリングする（ステップＳ６２）。レイヤ間で再利用されるパラメータは、重み付け予測関連パラメータを含んでもよい。

次に、ＥＬ復号部６ｂは、エンハンスメントレイヤの復号処理を実行し、エンハンスメントレイヤ画像を再構築する（ステップＳ６３）。ここで実行されるエンハンスメントレイヤの復号処理において、共通メモリ７によりバッファリングされているベースレイヤの画像は、色域予測部９０によりアップサンプリングされ、その色域は変換される。そして、色域変換後のベースレイヤの画像は、インターレイヤ予測において参照画像として使用され得る。

［５−２．色域予測処理］
（１）第１の例
図２９は、エンハンスメントレイヤの復号処理における色域予測処理の流れの第１の例を示すフローチャートである。ここで説明する色域予測処理は、ピクチャ又はスライスごとに繰り返される。

図２９を参照すると、まず、アップサンプリング部９１は、共通メモリ７から取得されるベースレイヤの画像を、ベースレイヤとエンハンスメントレイヤとの間の解像度比に従ってアップサンプリングする（ステップＳ７０）。

また、可逆復号部６２は、色域予測のために設定されるべき予測モードを示す予測モードパラメータを、ＰＰＳ又はスライスヘッダから復号する（ステップＳ７２）。そして、予測モード設定部９２は、復号された予測モードパラメータにより示される予測モードを、ピクチャ（又はスライス）に設定する（ステップＳ７５）。

その後の処理は、予測モード設定部９２により設定された予測モードに依存して分岐する（ステップＳ７６、Ｓ７８）。例えば、設定された予測モードが適応パラメータモードである場合、可逆復号部６２は、ＰＰＳ又はスライスヘッダからゲイン及びオフセットの値の過去の値からの差分を復号する（ステップＳ８０）。そして、パラメータ計算部９３は、復号されたゲイン及びオフセットの差分をゲイン及びオフセットの過去の値に加算することにより、最新のピクチャ又はスライスについて使用すべきゲイン及びオフセットを計算する（ステップＳ８２）。

設定された予測モードが適応パラメータモード又は固定パラメータモードである場合、色域変換部９４は、式（４）〜式（６）に従って、アップサンプリング後のベースレイヤの画素値に適応的に計算された又は固定的なゲインを乗算し、さらにオフセットを加算することにより、各画素の予測画素値を計算する（ステップＳ８４）。

設定された予測モードがビットシフトモードである場合、色域変換部９４は、式（１）〜式（３）に従って、アップサンプリング後のベースレイヤの画素値を所定のビットシフト量だけ左方へシフトさせることにより、各画素の予測画素値を計算する（ステップＳ８６）。

処理対象のピクチャ又はスライス内の全ての予測画素値が計算されると、色域変換部９４は、色域変換後のベースレイヤの画像、即ち色域予測の結果としての予測画像を、フレームメモリ６９に格納する（ステップＳ８８）。

その後、未処理の次のピクチャ又はスライスが存在する場合には、処理はステップＳ７０へ戻り、次のピクチャ又はスライスについて上述した処理が繰り返される（ステップＳ９０）。

（２）第２の例
図３０は、エンハンスメントレイヤの復号処理における色域予測処理の流れの第２の例を示すフローチャートである。

図３０を参照すると、まず、可逆復号部６２は、色域予測のために設定されるべき予測モードを示す予測モードパラメータを、ＳＰＳから復号する（ステップＳ７１）。そして、予測モード設定部９２は、復号された予測モードパラメータにより示される予測モードを、シーケンスに設定する（ステップＳ７３）。

ステップＳ７４〜ステップＳ９０の処理は、シーケンス内のピクチャ又はスライスごとに繰り返される。

アップサンプリング部９１は、共通メモリ７から取得されるベースレイヤの画像を、ベースレイヤとエンハンスメントレイヤとの間の解像度比に従ってアップサンプリングする（ステップＳ７４）。

さらに、予測モード設定部９２により設定された予測モードに依存して、処理は分岐する（ステップＳ７６、Ｓ７８）。例えば、設定された予測モードが適応パラメータモードである場合、可逆復号部６２は、ＰＰＳ又はスライスヘッダからゲイン及びオフセットの値の過去の値からの差分を復号する（ステップＳ８０）。そして、パラメータ計算部９３は、復号されたゲイン及びオフセットの差分をゲイン及びオフセットの過去の値にそれぞれ加算することにより、最新のピクチャ又はスライスについて使用すべきゲイン及びオフセットを計算する（ステップＳ８２）。

その後、シーケンス内に未処理の次のピクチャ又はスライスが存在する場合には、処理はステップＳ７４へ戻り、次のピクチャ又はスライスについてアップサンプリング及び色域変換が繰り返される（ステップＳ９０）。また、シーケンス内の全てのピクチャ又は全てのスライスについて色域変換が終了した場合には、次のシーケンスが存在するかがさらに判定される（ステップＳ９２）。そして、次のシーケンスが存在する場合には、処理はステップＳ７１へ戻り、次のシーケンスについて上述した処理が繰り返される。

（３）第３の例
図３１は、エンハンスメントレイヤの復号処理における色域予測処理の流れの第３の例を示すフローチャートである。

図３１を参照すると、まず、可逆復号部６２は、色域予測のために設定されるべき予測モードを示す予測モードパラメータを、ＳＰＳから復号する（ステップＳ７１）。そして、予測モード設定部９２は、復号された予測モードパラメータにより示される予測モードを、シーケンスに設定する（ステップＳ７３）。

ステップＳ７４〜ステップＳ９１の処理は、シーケンス内のスライスごとに繰り返される。

さらに、予測モード設定部９２により設定された予測モードに依存して、処理は分岐する（ステップＳ７６、Ｓ７８）。例えば、設定された予測モードが適応パラメータモードである場合、可逆復号部６２は、重み付け予測関連パラメータのシンタックスを再利用することにより符号化されているゲイン及びオフセットの値の過去の値からの差分を、スライスヘッダから復号する（ステップＳ８１）。そして、パラメータ計算部９３は、復号されたゲイン及びオフセットの差分をゲイン及びオフセットの過去の値にそれぞれ加算することにより、最新のスライスについて使用すべきゲイン及びオフセットを計算する（ステップＳ８２）。

設定された予測モードが適応パラメータモード又は固定パラメータモードである場合、色域変換部９４は、式（４）〜式（６）に従って、アップサンプリング後のベースレイヤの画素値に適応的に計算された又は固定的なゲインを乗算し、さらにオフセットを加算することにより、各画素の予測画素値を計算する（ステップＳ８４）。なお、符号化ストリームから復号され得るビットシフト制御フラグに従って、ここでの予測画素値の計算が、インターレイヤ予測のためのビットシフトを含んでもよい。また、ビットシフトは、ステップＳ７４におけるアップサンプリングのフィルタ演算に含まれてもよい。

処理対象のスライス内の全ての予測画素値が計算されると、色域変換部９４は、色域変換後のベースレイヤの画像、即ち色域予測の結果としての予測画像を、フレームメモリ６９に格納する（ステップＳ８８）。

その後、シーケンス内に未処理の次のスライスが存在する場合には、処理はステップＳ７４へ戻り、次のスライスについてアップサンプリング及び色域変換が繰り返される（ステップＳ９１）。また、シーケンス内の全てのスライスについて色域変換が終了した場合には、次のシーケンスが存在するかがさらに判定される（ステップＳ９２）。そして、次のシーケンスが存在する場合には、処理はステップＳ７１へ戻り、次のシーケンスについて上述した処理が繰り返される。

（４）第４の例
図３２は、エンハンスメントレイヤの復号処理における色域予測処理の流れの第４の例を示すフローチャートである。

図３２を参照すると、まず、可逆復号部６２は、色域予測のために設定されるべき予測モードを示す予測モードパラメータを、ＳＰＳから復号する（ステップＳ７１）。そして、予測モード設定部９２は、復号された予測モードパラメータにより示される予測モードを、シーケンスに設定する（ステップＳ７３）。

さらに、予測モード設定部９２により設定された予測モードに依存して、処理は分岐する（ステップＳ７６、Ｓ７８）。例えば、設定された予測モードが適応パラメータモードである場合、可逆復号部６２は、重み付け予測関連パラメータのシンタックスのＬ０参照フレーム用の部分及びＬ１参照フレーム用の部分から、予測パラメータの第１のバージョン及び第２のバージョンについての差分をそれぞれ復号する（ステップＳ８１ｂ）。そして、パラメータ計算部９３は、第１のバージョンについて復号されたゲイン及びオフセットの差分をゲイン及びオフセットの過去の値にそれぞれ加算することにより、最新のスライスについて使用すべき予測パラメータの第１のバージョンを計算する（ステップＳ８３ａ）。同様に、パラメータ計算部９３は、第２のバージョンについて復号されたゲイン及びオフセットの差分をゲイン及びオフセットの過去の値にそれぞれ加算することにより、最新のスライスについて使用すべき予測パラメータの第２のバージョンを計算する（ステップＳ８３ｂ）。これら第１のバージョン及び第２のバージョンは、それぞれ、画素値のレンジのうちの第１のバンド及び第２のバンドのために使用すべき最適な値のセットを含んでもよい。その代わりに、これら第１のバージョン及び第２のバージョンは、それぞれ、第１の画像領域及び第２の画像領域のために使用すべき最適な値のセットを含んでもよい。

その後の処理の流れは、画素値が属するバンド又は画素が属する画像領域に応じた予測パラメータのバージョンの切替えがステップＳ８４において行われ得ることを除き、図３１を用いて説明した第３の例と同様であってよい。なお、可逆復号部６２は、ステップＳ８１ｂにおいて、予測パラメータのバージョンの切替えのためのバンド間の境界値又は画像領域間の領域境界を特定する境界情報を、例えばスライスヘッダ又はスライスヘッダの拡張から、追加的に復号してもよい。

（５）処理順序の変形例
図２９〜図３２のフローチャートは、アップサンプリングの実行後に色域変換が実行される例を示している。しかしながら、図２５Ａ及び図２５Ｂを用いて説明したように、一変形例として、色域予測部９０は、エンハンスメントレイヤの空間解像度（画像サイズ）がベースレイヤの空間解像度よりも高い場合に、ベースレイヤ画像の色域を変換した後、変換された当該画像をアップサンプリングすることにより、エンハンスメントレイヤ画像を予測してもよい。そのような処理順序によれば、色域変換の変換対象の画素数及びビット深度が既存の処理順序のケースと比較して低減されるため、インターレイヤ予測の処理コストを一層抑制することができる。

＜６．応用例＞
［６−１．様々な製品への応用］
上述した実施形態に係る画像符号化装置１０及び画像復号装置６０は、衛星放送、ケーブルＴＶなどの有線放送、インターネット上での配信、及びセルラー通信による端末への配信などにおける送信機若しくは受信機、光ディスク、磁気ディスク及びフラッシュメモリなどの媒体に画像を記録する記録装置、又は、これら記憶媒体から画像を再生する再生装置などの様々な電子機器に応用され得る。以下、４つの応用例について説明する。

（１）第１の応用例
図３３は、上述した実施形態を適用したテレビジョン装置の概略的な構成の一例を示している。テレビジョン装置９００は、アンテナ９０１、チューナ９０２、デマルチプレクサ９０３、デコーダ９０４、映像信号処理部９０５、表示部９０６、音声信号処理部９０７、スピーカ９０８、外部インタフェース９０９、制御部９１０、ユーザインタフェース９１１、及びバス９１２を備える。

チューナ９０２は、アンテナ９０１を介して受信される放送信号から所望のチャンネルの信号を抽出し、抽出した信号を復調する。そして、チューナ９０２は、復調により得られた符号化ビットストリームをデマルチプレクサ９０３へ出力する。即ち、チューナ９０２は、画像が符号化されている符号化ストリームを受信する、テレビジョン装置９００における伝送手段としての役割を有する。

デマルチプレクサ９０３は、符号化ビットストリームから視聴対象の番組の映像ストリーム及び音声ストリームを分離し、分離した各ストリームをデコーダ９０４へ出力する。また、デマルチプレクサ９０３は、符号化ビットストリームからＥＰＧ（Electronic Program Guide）などの補助的なデータを抽出し、抽出したデータを制御部９１０に供給する。なお、デマルチプレクサ９０３は、符号化ビットストリームがスクランブルされている場合には、デスクランブルを行ってもよい。

デコーダ９０４は、デマルチプレクサ９０３から入力される映像ストリーム及び音声ストリームを復号する。そして、デコーダ９０４は、復号処理により生成される映像データを映像信号処理部９０５へ出力する。また、デコーダ９０４は、復号処理により生成される音声データを音声信号処理部９０７へ出力する。

映像信号処理部９０５は、デコーダ９０４から入力される映像データを再生し、表示部９０６に映像を表示させる。また、映像信号処理部９０５は、ネットワークを介して供給されるアプリケーション画面を表示部９０６に表示させてもよい。また、映像信号処理部９０５は、映像データについて、設定に応じて、例えばノイズ除去などの追加的な処理を行ってもよい。さらに、映像信号処理部９０５は、例えばメニュー、ボタン又はカーソルなどのＧＵＩ（Graphical User Interface）の画像を生成し、生成した画像を出力画像に重畳してもよい。

表示部９０６は、映像信号処理部９０５から供給される駆動信号により駆動され、表示デバイス（例えば、液晶ディスプレイ、プラズマディスプレイ又はＯＬＥＤなど）の映像面上に映像又は画像を表示する。

音声信号処理部９０７は、デコーダ９０４から入力される音声データについてＤ／Ａ変換及び増幅などの再生処理を行い、スピーカ９０８から音声を出力させる。また、音声信号処理部９０７は、音声データについてノイズ除去などの追加的な処理を行ってもよい。

外部インタフェース９０９は、テレビジョン装置９００と外部機器又はネットワークとを接続するためのインタフェースである。例えば、外部インタフェース９０９を介して受信される映像ストリーム又は音声ストリームが、デコーダ９０４により復号されてもよい。即ち、外部インタフェース９０９もまた、画像が符号化されている符号化ストリームを受信する、テレビジョン装置９００における伝送手段としての役割を有する。

制御部９１０は、ＣＰＵ（Central Processing Unit）などのプロセッサ、並びにＲＡＭ（Random Access Memory）及びＲＯＭ（Read Only Memory）などのメモリを有する。メモリは、ＣＰＵにより実行されるプログラム、プログラムデータ、ＥＰＧデータ、及びネットワークを介して取得されるデータなどを記憶する。メモリにより記憶されるプログラムは、例えば、テレビジョン装置９００の起動時にＣＰＵにより読み込まれ、実行される。ＣＰＵは、プログラムを実行することにより、例えばユーザインタフェース９１１から入力される操作信号に応じて、テレビジョン装置９００の動作を制御する。

ユーザインタフェース９１１は、制御部９１０と接続される。ユーザインタフェース９１１は、例えば、ユーザがテレビジョン装置９００を操作するためのボタン及びスイッチ、並びに遠隔制御信号の受信部などを有する。ユーザインタフェース９１１は、これら構成要素を介してユーザによる操作を検出して操作信号を生成し、生成した操作信号を制御部９１０へ出力する。

バス９１２は、チューナ９０２、デマルチプレクサ９０３、デコーダ９０４、映像信号処理部９０５、音声信号処理部９０７、外部インタフェース９０９及び制御部９１０を相互に接続する。

このように構成されたテレビジョン装置９００において、デコーダ９０４は、上述した実施形態に係る画像復号装置６０の機能を有する。それにより、テレビジョン装置９００が色域の互いに異なるレイヤについて色域予測を実行する際に、高い予測精度を達成しながら符号量の増加を抑制することができる。

（２）第２の応用例
図３４は、上述した実施形態を適用した携帯電話機の概略的な構成の一例を示している。携帯電話機９２０は、アンテナ９２１、通信部９２２、音声コーデック９２３、スピーカ９２４、マイクロホン９２５、カメラ部９２６、画像処理部９２７、多重分離部９２８、記録再生部９２９、表示部９３０、制御部９３１、操作部９３２、及びバス９３３を備える。

アンテナ９２１は、通信部９２２に接続される。スピーカ９２４及びマイクロホン９２５は、音声コーデック９２３に接続される。操作部９３２は、制御部９３１に接続される。バス９３３は、通信部９２２、音声コーデック９２３、カメラ部９２６、画像処理部９２７、多重分離部９２８、記録再生部９２９、表示部９３０、及び制御部９３１を相互に接続する。

携帯電話機９２０は、音声通話モード、データ通信モード、撮影モード及びテレビ電話モードを含む様々な動作モードで、音声信号の送受信、電子メール又は画像データの送受信、画像の撮像、及びデータの記録などの動作を行う。

音声通話モードにおいて、マイクロホン９２５により生成されるアナログ音声信号は、音声コーデック９２３に供給される。音声コーデック９２３は、アナログ音声信号を音声データへ変換し、変換された音声データをＡ／Ｄ変換し圧縮する。そして、音声コーデック９２３は、圧縮後の音声データを通信部９２２へ出力する。通信部９２２は、音声データを符号化及び変調し、送信信号を生成する。そして、通信部９２２は、生成した送信信号をアンテナ９２１を介して基地局（図示せず）へ送信する。また、通信部９２２は、アンテナ９２１を介して受信される無線信号を増幅し及び周波数変換し、受信信号を取得する。そして、通信部９２２は、受信信号を復調及び復号して音声データを生成し、生成した音声データを音声コーデック９２３へ出力する。音声コーデック９２３は、音声データを伸張し及びＤ／Ａ変換し、アナログ音声信号を生成する。そして、音声コーデック９２３は、生成した音声信号をスピーカ９２４に供給して音声を出力させる。

また、データ通信モードにおいて、例えば、制御部９３１は、操作部９３２を介するユーザによる操作に応じて、電子メールを構成する文字データを生成する。また、制御部９３１は、文字を表示部９３０に表示させる。また、制御部９３１は、操作部９３２を介するユーザからの送信指示に応じて電子メールデータを生成し、生成した電子メールデータを通信部９２２へ出力する。通信部９２２は、電子メールデータを符号化及び変調し、送信信号を生成する。そして、通信部９２２は、生成した送信信号をアンテナ９２１を介して基地局（図示せず）へ送信する。また、通信部９２２は、アンテナ９２１を介して受信される無線信号を増幅し及び周波数変換し、受信信号を取得する。そして、通信部９２２は、受信信号を復調及び復号して電子メールデータを復元し、復元した電子メールデータを制御部９３１へ出力する。制御部９３１は、表示部９３０に電子メールの内容を表示させると共に、電子メールデータを記録再生部９２９の記憶媒体に記憶させる。

記録再生部９２９は、読み書き可能な任意の記憶媒体を有する。例えば、記憶媒体は、ＲＡＭ又はフラッシュメモリなどの内蔵型の記憶媒体であってもよく、ハードディスク、磁気ディスク、光磁気ディスク、光ディスク、ＵＳＢメモリ、又はメモリカードなどの外部装着型の記憶媒体であってもよい。

また、撮影モードにおいて、例えば、カメラ部９２６は、被写体を撮像して画像データを生成し、生成した画像データを画像処理部９２７へ出力する。画像処理部９２７は、カメラ部９２６から入力される画像データを符号化し、符号化ストリームを記録再生部９２９の記憶媒体に記憶させる。

また、テレビ電話モードにおいて、例えば、多重分離部９２８は、画像処理部９２７により符号化された映像ストリームと、音声コーデック９２３から入力される音声ストリームとを多重化し、多重化したストリームを通信部９２２へ出力する。通信部９２２は、ストリームを符号化及び変調し、送信信号を生成する。そして、通信部９２２は、生成した送信信号をアンテナ９２１を介して基地局（図示せず）へ送信する。また、通信部９２２は、アンテナ９２１を介して受信される無線信号を増幅し及び周波数変換し、受信信号を取得する。これら送信信号及び受信信号には、符号化ビットストリームが含まれ得る。そして、通信部９２２は、受信信号を復調及び復号してストリームを復元し、復元したストリームを多重分離部９２８へ出力する。多重分離部９２８は、入力されるストリームから映像ストリーム及び音声ストリームを分離し、映像ストリームを画像処理部９２７、音声ストリームを音声コーデック９２３へ出力する。画像処理部９２７は、映像ストリームを復号し、映像データを生成する。映像データは、表示部９３０に供給され、表示部９３０により一連の画像が表示される。音声コーデック９２３は、音声ストリームを伸張し及びＤ／Ａ変換し、アナログ音声信号を生成する。そして、音声コーデック９２３は、生成した音声信号をスピーカ９２４に供給して音声を出力させる。

このように構成された携帯電話機９２０において、画像処理部９２７は、上述した実施形態に係る画像符号化装置１０及び画像復号装置６０の機能を有する。それにより、携帯電話機９２０が色域の互いに異なるレイヤについて色域予測を実行する際に、高い予測精度を達成しながら符号量の増加を抑制することができる。

（３）第３の応用例
図３５は、上述した実施形態を適用した記録再生装置の概略的な構成の一例を示している。記録再生装置９４０は、例えば、受信した放送番組の音声データ及び映像データを符号化して記録媒体に記録する。また、記録再生装置９４０は、例えば、他の装置から取得される音声データ及び映像データを符号化して記録媒体に記録してもよい。また、記録再生装置９４０は、例えば、ユーザの指示に応じて、記録媒体に記録されているデータをモニタ及びスピーカ上で再生する。このとき、記録再生装置９４０は、音声データ及び映像データを復号する。

記録再生装置９４０は、チューナ９４１、外部インタフェース９４２、エンコーダ９４３、ＨＤＤ（Hard Disk Drive）９４４、ディスクドライブ９４５、セレクタ９４６、デコーダ９４７、ＯＳＤ（On-Screen Display）９４８、制御部９４９、及びユーザインタフェース９５０を備える。

チューナ９４１は、アンテナ（図示せず）を介して受信される放送信号から所望のチャンネルの信号を抽出し、抽出した信号を復調する。そして、チューナ９４１は、復調により得られた符号化ビットストリームをセレクタ９４６へ出力する。即ち、チューナ９４１は、記録再生装置９４０における伝送手段としての役割を有する。

外部インタフェース９４２は、記録再生装置９４０と外部機器又はネットワークとを接続するためのインタフェースである。外部インタフェース９４２は、例えば、ＩＥＥＥ１３９４インタフェース、ネットワークインタフェース、ＵＳＢインタフェース、又はフラッシュメモリインタフェースなどであってよい。例えば、外部インタフェース９４２を介して受信される映像データ及び音声データは、エンコーダ９４３へ入力される。即ち、外部インタフェース９４２は、記録再生装置９４０における伝送手段としての役割を有する。

エンコーダ９４３は、外部インタフェース９４２から入力される映像データ及び音声データが符号化されていない場合に、映像データ及び音声データを符号化する。そして、エンコーダ９４３は、符号化ビットストリームをセレクタ９４６へ出力する。

ＨＤＤ９４４は、映像及び音声などのコンテンツデータが圧縮された符号化ビットストリーム、各種プログラム及びその他のデータを内部のハードディスクに記録する。また、ＨＤＤ９４４は、映像及び音声の再生時に、これらデータをハードディスクから読み出す。

ディスクドライブ９４５は、装着されている記録媒体へのデータの記録及び読み出しを行う。ディスクドライブ９４５に装着される記録媒体は、例えばＤＶＤディスク（ＤＶＤ−Ｖｉｄｅｏ、ＤＶＤ−ＲＡＭ、ＤＶＤ−Ｒ、ＤＶＤ−ＲＷ、ＤＶＤ＋Ｒ、ＤＶＤ＋ＲＷ等）又はＢｌｕ−ｒａｙ（登録商標）ディスクなどであってよい。

セレクタ９４６は、映像及び音声の記録時には、チューナ９４１又はエンコーダ９４３から入力される符号化ビットストリームを選択し、選択した符号化ビットストリームをＨＤＤ９４４又はディスクドライブ９４５へ出力する。また、セレクタ９４６は、映像及び音声の再生時には、ＨＤＤ９４４又はディスクドライブ９４５から入力される符号化ビットストリームをデコーダ９４７へ出力する。

デコーダ９４７は、符号化ビットストリームを復号し、映像データ及び音声データを生成する。そして、デコーダ９４７は、生成した映像データをＯＳＤ９４８へ出力する。また、デコーダ９０４は、生成した音声データを外部のスピーカへ出力する。

ＯＳＤ９４８は、デコーダ９４７から入力される映像データを再生し、映像を表示する。また、ＯＳＤ９４８は、表示する映像に、例えばメニュー、ボタン又はカーソルなどのＧＵＩの画像を重畳してもよい。

制御部９４９は、ＣＰＵなどのプロセッサ、並びにＲＡＭ及びＲＯＭなどのメモリを有する。メモリは、ＣＰＵにより実行されるプログラム、及びプログラムデータなどを記憶する。メモリにより記憶されるプログラムは、例えば、記録再生装置９４０の起動時にＣＰＵにより読み込まれ、実行される。ＣＰＵは、プログラムを実行することにより、例えばユーザインタフェース９５０から入力される操作信号に応じて、記録再生装置９４０の動作を制御する。

ユーザインタフェース９５０は、制御部９４９と接続される。ユーザインタフェース９５０は、例えば、ユーザが記録再生装置９４０を操作するためのボタン及びスイッチ、並びに遠隔制御信号の受信部などを有する。ユーザインタフェース９５０は、これら構成要素を介してユーザによる操作を検出して操作信号を生成し、生成した操作信号を制御部９４９へ出力する。

このように構成された記録再生装置９４０において、エンコーダ９４３は、上述した実施形態に係る画像符号化装置１０の機能を有する。また、デコーダ９４７は、上述した実施形態に係る画像復号装置６０の機能を有する。それにより、記録再生装置９４０が色域の互いに異なるレイヤについて色域予測を実行する際に、高い予測精度を達成しながら符号量の増加を抑制することができる。

（４）第４の応用例
図３６は、上述した実施形態を適用した撮像装置の概略的な構成の一例を示している。撮像装置９６０は、被写体を撮像して画像を生成し、画像データを符号化して記録媒体に記録する。

撮像装置９６０は、光学ブロック９６１、撮像部９６２、信号処理部９６３、画像処理部９６４、表示部９６５、外部インタフェース９６６、メモリ９６７、メディアドライブ９６８、ＯＳＤ９６９、制御部９７０、ユーザインタフェース９７１、及びバス９７２を備える。

光学ブロック９６１は、撮像部９６２に接続される。撮像部９６２は、信号処理部９６３に接続される。表示部９６５は、画像処理部９６４に接続される。ユーザインタフェース９７１は、制御部９７０に接続される。バス９７２は、画像処理部９６４、外部インタフェース９６６、メモリ９６７、メディアドライブ９６８、ＯＳＤ９６９、及び制御部９７０を相互に接続する。

光学ブロック９６１は、フォーカスレンズ及び絞り機構などを有する。光学ブロック９６１は、被写体の光学像を撮像部９６２の撮像面に結像させる。撮像部９６２は、ＣＣＤ又はＣＭＯＳなどのイメージセンサを有し、撮像面に結像した光学像を光電変換によって電気信号としての画像信号に変換する。そして、撮像部９６２は、画像信号を信号処理部９６３へ出力する。

信号処理部９６３は、撮像部９６２から入力される画像信号に対してニー補正、ガンマ補正、色補正などの種々のカメラ信号処理を行う。信号処理部９６３は、カメラ信号処理後の画像データを画像処理部９６４へ出力する。

画像処理部９６４は、信号処理部９６３から入力される画像データを符号化し、符号化データを生成する。そして、画像処理部９６４は、生成した符号化データを外部インタフェース９６６又はメディアドライブ９６８へ出力する。また、画像処理部９６４は、外部インタフェース９６６又はメディアドライブ９６８から入力される符号化データを復号し、画像データを生成する。そして、画像処理部９６４は、生成した画像データを表示部９６５へ出力する。また、画像処理部９６４は、信号処理部９６３から入力される画像データを表示部９６５へ出力して画像を表示させてもよい。また、画像処理部９６４は、ＯＳＤ９６９から取得される表示用データを、表示部９６５へ出力する画像に重畳してもよい。

ＯＳＤ９６９は、例えばメニュー、ボタン又はカーソルなどのＧＵＩの画像を生成して、生成した画像を画像処理部９６４へ出力する。

外部インタフェース９６６は、例えばＵＳＢ入出力端子として構成される。外部インタフェース９６６は、例えば、画像の印刷時に、撮像装置９６０とプリンタとを接続する。また、外部インタフェース９６６には、必要に応じてドライブが接続される。ドライブには、例えば、磁気ディスク又は光ディスクなどのリムーバブルメディアが装着され、リムーバブルメディアから読み出されるプログラムが、撮像装置９６０にインストールされ得る。さらに、外部インタフェース９６６は、ＬＡＮ又はインターネットなどのネットワークに接続されるネットワークインタフェースとして構成されてもよい。即ち、外部インタフェース９６６は、撮像装置９６０における伝送手段としての役割を有する。

メディアドライブ９６８に装着される記録媒体は、例えば、磁気ディスク、光磁気ディスク、光ディスク、又は半導体メモリなどの、読み書き可能な任意のリムーバブルメディアであってよい。また、メディアドライブ９６８に記録媒体が固定的に装着され、例えば、内蔵型ハードディスクドライブ又はＳＳＤ（Solid State Drive）のような非可搬性の記憶部が構成されてもよい。

制御部９７０は、ＣＰＵなどのプロセッサ、並びにＲＡＭ及びＲＯＭなどのメモリを有する。メモリは、ＣＰＵにより実行されるプログラム、及びプログラムデータなどを記憶する。メモリにより記憶されるプログラムは、例えば、撮像装置９６０の起動時にＣＰＵにより読み込まれ、実行される。ＣＰＵは、プログラムを実行することにより、例えばユーザインタフェース９７１から入力される操作信号に応じて、撮像装置９６０の動作を制御する。

ユーザインタフェース９７１は、制御部９７０と接続される。ユーザインタフェース９７１は、例えば、ユーザが撮像装置９６０を操作するためのボタン及びスイッチなどを有する。ユーザインタフェース９７１は、これら構成要素を介してユーザによる操作を検出して操作信号を生成し、生成した操作信号を制御部９７０へ出力する。

このように構成された撮像装置９６０において、画像処理部９６４は、上述した実施形態に係る画像符号化装置１０及び画像復号装置６０の機能を有する。それにより、撮像装置９６０が色域の互いに異なるレイヤについて色域予測を実行する際に、高い予測精度を達成しながら符号量の増加を抑制することができる。

［６−２．スケーラブル符号化の様々な用途］
上述したスケーラブル符号化の利点は、様々な用途において享受され得る。以下、３つの用途の例について説明する。

（１）第１の例
第１の例において、スケーラブル符号化は、データの選択的な伝送のために利用される。図３７を参照すると、データ伝送システム１０００は、ストリーム記憶装置１００１及び配信サーバ１００２を含む。配信サーバ１００２は、ネットワーク１００３を介して、いくつかの端末装置と接続される。ネットワーク１００３は、有線ネットワークであっても無線ネットワークであってもよく、又はそれらの組合せであってもよい。図３７には、端末装置の例として、ＰＣ（Personal Computer）１００４、ＡＶ機器１００５、タブレット装置１００６及び携帯電話機１００７が示されている。

ストリーム記憶装置１００１は、例えば、画像符号化装置１０により生成される多重化ストリームを含むストリームデータ１０１１を記憶する。多重化ストリームは、ベースレイヤ（ＢＬ）の符号化ストリーム及びエンハンスメントレイヤ（ＥＬ）の符号化ストリームを含む。配信サーバ１００２は、ストリーム記憶装置１００１に記憶されているストリームデータ１０１１を読み出し、読み出したストリームデータ１０１１の少なくとも一部分を、ネットワーク１００３を介して、ＰＣ１００４、ＡＶ機器１００５、タブレット装置１００６、及び携帯電話機１００７へ配信する。

端末装置へのストリームの配信の際、配信サーバ１００２は、端末装置の能力又は通信環境などの何らかの条件に基づいて、配信すべきストリームを選択する。例えば、配信サーバ１００２は、端末装置が扱うことのできる画質を上回るほど高い画質を有する符号化ストリームを配信しないことにより、端末装置における遅延、オーバフロー又はプロセッサの過負荷の発生を回避してもよい。また、配信サーバ１００２は、高い画質を有する符号化ストリームを配信しないことにより、ネットワーク１００３の通信帯域が占有されることを回避してもよい。一方、配信サーバ１００２は、これら回避すべきリスクが存在しない場合、又はユーザとの契約若しくは何らかの条件に基づいて適切だと判断される場合に、多重化ストリームの全てを端末装置へ配信してもよい。

図３７の例では、配信サーバ１００２は、ストリーム記憶装置１００１からストリームデータ１０１１を読み出す。そして、配信サーバ１００２は、高い処理能力を有するＰＣ１００４へ、ストリームデータ１０１１をそのまま配信する。また、ＡＶ機器１００５は低い処理能力を有するため、配信サーバ１００２は、ストリームデータ１０１１から抽出されるベースレイヤの符号化ストリームのみを含むストリームデータ１０１２を生成し、ストリームデータ１０１２をＡＶ機器１００５へ配信する。また、配信サーバ１００２は、高い通信レートで通信可能であるタブレット装置１００６へストリームデータ１０１１をそのまま配信する。また、携帯電話機１００７は低い通信レートでしか通信できないため、配信サーバ１００２は、ベースレイヤの符号化ストリームのみを含むストリームデータ１０１２を携帯電話機１００７へ配信する。

このように多重化ストリームを用いることにより、伝送されるトラフィックの量を適応的に調整することができる。また、個々のレイヤがそれぞれ単独に符号化されるケースと比較して、ストリームデータ１０１１の符号量は削減されるため、ストリームデータ１０１１の全体が配信されるとしても、ネットワーク１００３に掛かる負荷は抑制される。さらに、ストリーム記憶装置１００１のメモリリソースも節約される。

端末装置のハードウエア性能は、装置ごとに異なる。また、端末装置において実行されるアプリケーションのケイパビリティも様々である。さらに、ネットワーク１００３の通信容量もまた様々である。データ伝送のために利用可能な容量は、他のトラフィックの存在に起因して、時々刻々と変化し得る。そこで、配信サーバ１００２は、ストリームデータの配信を開始する前に、配信先の端末装置との間のシグナリングを通じて、端末装置のハードウエア性能及びアプリケーションケイパビリティなどに関する端末情報と、ネットワーク１００３の通信容量などに関するネットワーク情報とを取得してもよい。そして、配信サーバ１００２は、取得した情報に基づいて、配信すべきストリームを選択し得る。

なお、復号すべきレイヤの抽出は、端末装置において行われてもよい。例えば、ＰＣ１００４は、受信した多重化ストリームから抽出され復号されるベースレイヤ画像をその画面に表示してもよい。また、ＰＣ１００４は、受信した多重化ストリームからベースレイヤの符号化ストリームを抽出してストリームデータ１０１２を生成し、生成したストリームデータ１０１２を記憶媒体に記憶させ、又は他の装置へ転送してもよい。

図３７に示したデータ伝送システム１０００の構成は一例に過ぎない。データ伝送システム１０００は、いかなる数のストリーム記憶装置１００１、配信サーバ１００２、ネットワーク１００３、及び端末装置を含んでもよい。

（２）第２の例
第２の例において、スケーラブル符号化は、複数の通信チャネルを介するデータの伝送のために利用される。図３８を参照すると、データ伝送システム１１００は、放送局１１０１及び端末装置１１０２を含む。放送局１１０１は、地上波チャネル１１１１上で、ベースレイヤの符号化ストリーム１１２１を放送する。また、放送局１１０１は、ネットワーク１１１２を介して、エンハンスメントレイヤの符号化ストリーム１１２２を端末装置１１０２へ送信する。

端末装置１１０２は、放送局１１０１により放送される地上波放送を受信するための受信機能を有し、地上波チャネル１１１１を介してベースレイヤの符号化ストリーム１１２１を受信する。また、端末装置１１０２は、放送局１１０１と通信するための通信機能を有し、ネットワーク１１１２を介してエンハンスメントレイヤの符号化ストリーム１１２２を受信する。

端末装置１１０２は、例えば、ユーザからの指示に応じて、ベースレイヤの符号化ストリーム１１２１を受信し、受信した符号化ストリーム１１２１からベースレイヤ画像を復号してベースレイヤ画像を画面に表示してもよい。また、端末装置１１０２は、復号したベースレイヤ画像を記憶媒体に記憶させ、又は他の装置へ転送してもよい。

また、端末装置１１０２は、例えば、ユーザからの指示に応じて、ネットワーク１１１２を介してエンハンスメントレイヤの符号化ストリーム１１２２を受信し、ベースレイヤの符号化ストリーム１１２１とエンハンスメントレイヤの符号化ストリーム１１２２とを多重化することにより多重化ストリームを生成してもよい。また、端末装置１１０２は、エンハンスメントレイヤの符号化ストリーム１１２２からエンハンスメントレイヤ画像を復号してエンハンスメントレイヤ画像を画面に表示してもよい。また、端末装置１１０２は、復号したエンハンスメントレイヤ画像を記憶媒体に記憶させ、又は他の装置へ転送してもよい。

上述したように、多重化ストリームに含まれる各レイヤの符号化ストリームは、レイヤごとに異なる通信チャネルを介して伝送され得る。それにより、個々のチャネルに掛かる負荷を分散させて、通信の遅延若しくはオーバフローの発生を抑制することができる。

また、何らかの条件に応じて、伝送のために使用される通信チャネルが動的に選択されてもよい。例えば、データ量が比較的多いベースレイヤの符号化ストリーム１１２１は帯域幅の広い通信チャネルを介して伝送され、データ量が比較的少ないエンハンスメントレイヤの符号化ストリーム１１２２は帯域幅の狭い通信チャネルを介して伝送され得る。また、特定のレイヤの符号化ストリーム１１２２が伝送される通信チャネルが、通信チャネルの帯域幅に応じて切り替えられてもよい。それにより、個々のチャネルに掛かる負荷をより効果的に抑制することができる。

なお、図３８に示したデータ伝送システム１１００の構成は一例に過ぎない。データ伝送システム１１００は、いかなる数の通信チャネル及び端末装置を含んでもよい。また、放送以外の用途において、ここで説明したシステムの構成が利用されてもよい。

（３）第３の例
第３の例において、スケーラブル符号化は、映像の記憶のために利用される。図３９を参照すると、データ伝送システム１２００は、撮像装置１２０１及びストリーム記憶装置１２０２を含む。撮像装置１２０１は、被写体１２１１を撮像することにより生成される画像データをスケーラブル符号化し、多重化ストリーム１２２１を生成する。多重化ストリーム１２２１は、ベースレイヤの符号化ストリーム及びエンハンスメントレイヤの符号化ストリームを含む。そして、撮像装置１２０１は、多重化ストリーム１２２１をストリーム記憶装置１２０２へ供給する。

ストリーム記憶装置１２０２は、撮像装置１２０１から供給される多重化ストリーム１２２１を、モードごとに異なる画質で記憶する。例えば、ストリーム記憶装置１２０２は、通常モードにおいて、多重化ストリーム１２２１からベースレイヤの符号化ストリーム１２２２を抽出し、抽出したベースレイヤの符号化ストリーム１２２２を記憶する。これに対し、ストリーム記憶装置１２０２は、高画質モードにおいて、多重化ストリーム１２２１をそのまま記憶する。それにより、ストリーム記憶装置１２０２は、高画質での映像の記録が望まれる場合にのみ、データ量の多い高画質のストリームを記録することができる。そのため、画質の劣化のユーザへの影響を抑制しながら、メモリリソースを節約することができる。

例えば、撮像装置１２０１は、監視カメラであるものとする。撮像画像に監視対象（例えば侵入者）が映っていない場合には、通常モードが選択される。この場合、撮像画像は重要でない可能性が高いため、データ量の削減が優先され、映像は低画質で記録される（即ち、ベースレイヤの符号化ストリーム１２２２のみが記憶される）。これに対し、撮像画像に監視対象（例えば、侵入者である被写体１２１１）が映っている場合には、高画質モードが選択される。この場合、撮像画像は重要である可能性が高いため、画質の高さが優先され、映像は高画質で記録される（即ち、多重化ストリーム１２２１が記憶される）。

図３９の例では、モードは、例えば画像解析結果に基づいて、ストリーム記憶装置１２０２により選択される。しかしながら、かかる例に限定されず、撮像装置１２０１がモードを選択してもよい。後者の場合、撮像装置１２０１は、通常モードにおいて、ベースレイヤの符号化ストリーム１２２２をストリーム記憶装置１２０２へ供給し、高画質モードにおいて、多重化ストリーム１２２１をストリーム記憶装置１２０２へ供給してもよい。

なお、モードを選択するための選択基準は、いかなる基準であってもよい。例えば、マイクロフォンを通じて取得される音声の大きさ又は音声の波形などに応じて、モードが切り替えられてもよい。また、周期的にモードが切り替えられてもよい。また、ユーザからの指示に応じてモードが切り替えられてもよい。さらに、選択可能なモードの数は、階層化されるレイヤの数を超えない限り、いかなる数であってもよい。

図３９に示したデータ伝送システム１２００の構成は一例に過ぎない。データ伝送システム１２００は、いかなる数の撮像装置１２０１を含んでもよい。また、監視カメラ以外の用途において、ここで説明したシステムの構成が利用されてもよい。

［６−３．その他］
（１）マルチビューコーデックへの応用
マルチビューコーデックは、マルチレイヤコーデックの一種であり、いわゆる多視点映像を符号化し及び復号するための画像符号化方式である。図４０は、マルチビューコーデックについて説明するための説明図である。図４０を参照すると、３つの視点においてそれぞれ撮影される３つのビューのフレームのシーケンスが示されている。各ビューには、ビューＩＤ（view_id）が付与される。これら複数のビューのうちいずれか１つのビューが、ベースビュー（base view）に指定される。ベースビュー以外のビューは、ノンベースビューと呼ばれる。図４０の例では、ビューＩＤが“０”であるビューがベースビューであり、ビューＩＤが“１”又は“２”である２つのビューがノンベースビューである。これらビューが階層的に符号化される場合、各ビューがレイヤに相当し得る。図中に矢印で示したように、ノンベースビューの画像は、ベースビューの画像を参照して符号化され及び復号される（他のノンベースビューの画像も参照されてよい）。

図４１は、マルチビューコーデックをサポートする画像符号化装置１０ｖの概略的な構成を示すブロック図である。図４１を参照すると、画像符号化装置１０ｖは、第１レイヤ符号化部１ｃ、第２レイヤ符号化部１ｄ、共通メモリ２及び多重化部３を備える。

第１レイヤ符号化部１ｃの機能は、入力としてベースレイヤ画像の代わりにベースビュー画像を受け取ることを除き、図４を用いて説明したＢＬ符号化部１ａの機能と同等である。第１レイヤ符号化部１ｃは、ベースビュー画像を符号化し、第１レイヤの符号化ストリームを生成する。第２レイヤ符号化部１ｄの機能は、入力としてエンハンスメントレイヤ画像の代わりにノンベースビュー画像を受け取ることを除き、図４を用いて説明したＥＬ符号化部１ｂの機能と同等である。第２レイヤ符号化部１ｄは、ノンベースビュー画像を符号化し、第２レイヤの符号化ストリームを生成する。共通メモリ２は、レイヤ間で共通的に利用される情報を記憶する。多重化部３は、第１レイヤ符号化部１ｃにより生成される第１レイヤの符号化ストリームと、第２レイヤ符号化部１ｄにより生成される第２レイヤの符号化ストリームとを多重化し、マルチレイヤの多重化ストリームを生成する。

図４２は、マルチビューコーデックをサポートする画像復号装置６０ｖの概略的な構成を示すブロック図である。図４２を参照すると、画像復号装置６０ｖは、逆多重化部５、第１レイヤ復号部６ｃ、第２レイヤ復号部６ｄ及び共通メモリ７を備える。

逆多重化部５は、マルチレイヤの多重化ストリームを第１レイヤの符号化ストリーム及び第２レイヤの符号化ストリームに逆多重化する。第１レイヤ復号部６ｃの機能は、入力としてベースレイヤ画像の代わりにベースビュー画像が符号化された符号化ストリームを受け取ることを除き、図５を用いて説明したＢＬ復号部６ａの機能と同等である。第１レイヤ復号部６ｃは、第１レイヤの符号化ストリームからベースビュー画像を復号する。第２レイヤ復号部６ｄの機能は、入力としてエンハンスメントレイヤ画像の代わりにノンベースビュー画像が符号化された符号化ストリームを受け取ることを除き、図５を用いて説明したＥＬ復号部６ｂの機能と同等である。第２レイヤ復号部６ｄは、第２レイヤの符号化ストリームからノンベースビュー画像を復号する。共通メモリ７は、レイヤ間で共通的に利用される情報を記憶する。

マルチビューの画像データを符号化し又は復号する際、ビュー間で色域が異なる場合には、本開示に係る技術に従って、ビュー間の色域の変換が制御されてもよい。それにより、スケーラブル符号化のケースと同様に、マルチビューコーデックにおいても、色域予測の高い予測精度を達成しながら符号量の増加を抑制することができる。

（２）ストリーミング技術への応用
本開示に係る技術は、ストリーミングプロトコルに適用されてもよい。例えば、ＭＰＥＧ−ＤＡＳＨ（Dynamic Adaptive Streaming over HTTP）では、解像度などのパラメータが互いに異なる複数の符号化ストリームがストリーミングサーバにおいて予め用意される。そして、ストリーミングサーバは、複数の符号化ストリームからストリーミングすべき適切なデータをセグメント単位で動的に選択し、選択したデータを配信する。このようなストリーミングプロトコルにおいて、本開示に係る技術に従って、符号化ストリーム間の色域の予測が制御されてもよい。

＜７．まとめ＞
ここまで、図１〜図４２を用いて、本開示に係る技術の実施形態について詳細に説明した。上述した実施形態によれば、第１レイヤ（例えば、ベースレイヤ）とは異なる色域を有する第２レイヤ（例えば、エンハンスメントレイヤ）の画像を第１レイヤの画像から予測する際に使用される予測パラメータの過去の値からの差分が、符号化ストリームから復号される。そして、復号された当該差分を用いて上記予測パラメータが計算され、計算された予測パラメータを用いて第２レイヤの画像が予測される。色域の予測（変換）のために最適な予測パラメータが動的に変化するとしても、そのパラメータ値のフレームごとの変化は小さいと考えられる。従って、予測パラメータ値そのものを符号化する手法と比較して、上述した差分を符号化し及び復号する手法により、色域スケーラビリティにおいて高い予測精度を達成しながら符号量の増加を抑制することができる。

また、上述した実施形態によれば、色域の予測のために使用される上記予測パラメータは、第１レイヤの色成分ごとの画素値に乗算されるゲイン、及びオフセットを含む。これらゲイン及びオフセットの最適値は、フレームごとに大きく変化しない。よって、上述した差分を符号化し及び復号する手法をこれらゲイン及びオフセットに適用することが有益である。なお、かかる例に限定されず、ゲイン及びオフセットの一方についてのみ差分が符号化され及び復号されてもよい。また、ゲインに対応する分母及び分子の一方について差分が計算されてもよく、又はその双方について差分が計算されてもよい。

また、上述した実施形態によれば、予測モードパラメータが適応パラメータモードを示す場合に、上記差分を用いて計算される予測パラメータを用いて、第２レイヤの画像が予測される。従って、本開示に係る技術は、適応パラメータモードのみが使用されるケースのみならず、ビットシフトモード及び固定パラメータモードなどを含む複数の予測モードの候補から予測モードが選択されるケースにも適用可能である。

また、ある実施例によれば、前回のフレームと最新のフレームとの間で予測モードが異なる場合にも、差分の基礎としてビットシフト量に対応する予測パラメータ値又は固定的な予測パラメータ値が使用され得る。従って、フレームごとに最適な予測モードを選択しつつ、先頭のフレーム以外の全てのフレームで、上記予測パラメータの差分を符号化することができる。

また、ある実施例によれば、シーケンスごとに予測モードパラメータが符号化され及び復号され得る。この場合、１つのシーケンス内で予測モードが変化しないため、差分計算の複雑さを緩和することができる。その結果、装置の実装が容易となる。また、予測モードパラメータのための符号量を削減することができる。

また、ある実施例によれば、スライスごとに上記予測パラメータの差分が復号され得る。この場合、画像の部分領域ごとに異なる色域が使用される用途において、部分領域ごとに最適な色域予測を可能とし、符号化効率を高めることができる。

また、ある実施例によれば、重み付け予測関連パラメータと共用されるシンタックスを有するヘッダから、上記予測パラメータの差分が復号される。この場合、シンタックスの冗長性が低減され、エンコーダ及びデコーダの実装及びバージョンアップの際の互換性の確保が容易となる。また、ある変形例によれば、重み付け予測関連パラメータのシンタックスのＬ０参照フレーム用の部分及びＬ１参照フレーム用の部分の双方を活用して、色域予測のための予測パラメータの２つのバージョンが符号化され及び復号され得る。この場合、より柔軟で予測精度の高い色域予測モデルを用いることが可能となるため、色域スケーラビリティの符号化効率を向上させることができる。

また、ある実施例によれば、インターレイヤ予測の際のビットシフトを色域変換と同時に実行すべきかを示す制御パラメータが符号化され、及び復号され得る。この場合、ビットシフトを実行するタイミング（例えば、アップサンプリングと同時、又は色域変換と同時）を適応的に切り替えて、インターレイヤ予測の処理コストを抑制することが可能となる。また、一変形例によれば、アップサンプリングの実行前に、色域変換が実行され得る。この場合、色域変換の変換対象の画素数が少なくなるため、色域変換の処理コストが一層低減され得る。

なお、本明細書に記述したＣＵ、ＰＵ及びＴＵとの用語は、ＨＥＶＣにおいて、個々のブロックに関連付けられるシンタックスをも含む論理的な単位を意味する。画像の一部分としての個々のブロックのみに着目する場合、これらは、ＣＢ（Coding Block）、ＰＢ（Prediction Block）及びＴＢ（Transform Block）との用語にそれぞれ置き換えられてもよい。ＣＢは、ＣＴＢ（Coding Tree Block）を四分木（Quad-Tree）状に階層的に分割することにより形成される。１つの四分木の全体がＣＴＢに相当し、ＣＴＢに対応する論理的な単位はＣＴＵ（Coding Tree Unit）と呼ばれる。ＨＥＶＣにおけるＣＴＢ及びＣＢは、符号化処理の処理単位である点でＨ．２６４／ＡＶＣにおけるマクロブロックに類似する役割を有する。但し、ＣＴＢ及びＣＢは、そのサイズが固定的でない点でマクロブロックと異なる（マクロブロックのサイズは常に１６×１６画素である）。ＣＴＢのサイズは１６×１６画素、３２×３２画素及び６４×６４画素から選択され、符号化ストリーム内でパラメータにより指定される。ＣＢのサイズは、ＣＴＢの分割の深さによって変化し得る。

また、本明細書では、色域予測の制御に関する情報が、符号化ストリームのヘッダに多重化されて、符号化側から復号側へ伝送される例について主に説明した。しかしながら、これら情報を伝送する手法はかかる例に限定されない。例えば、これら情報は、符号化ビットストリームに多重化されることなく、符号化ビットストリームと関連付けられた別個のデータとして伝送され又は記録されてもよい。ここで、「関連付ける」という用語は、ビットストリームに含まれる画像（スライス若しくはブロックなど、画像の一部であってもよい）と当該画像に対応する情報とを復号時にリンクさせ得るようにすることを意味する。即ち、情報は、画像（又はビットストリーム）とは別の伝送路上で伝送されてもよい。また、情報は、画像（又はビットストリーム）とは別の記録媒体（又は同一の記録媒体の別の記録エリア）に記録されてもよい。さらに、情報と画像（又はビットストリーム）とは、例えば、複数フレーム、１フレーム、又はフレーム内の一部分などの任意の単位で互いに関連付けられてよい。

以上、添付図面を参照しながら本開示の好適な実施形態について詳細に説明したが、本開示の技術的範囲はかかる例に限定されない。本開示の技術分野における通常の知識を有する者であれば、特許請求の範囲に記載された技術的思想の範疇内において、各種の変更例または修正例に想到し得ることは明らかであり、これらについても、当然に本開示の技術的範囲に属するものと了解される。

なお、以下のような構成も本開示の技術的範囲に属する。
（１）
第１レイヤとは異なる色域を有する第２レイヤの画像を前記第１レイヤの画像から予測する際に使用される予測パラメータの過去の値からの差分を復号する復号部と、
前記復号部により復号される前記差分を用いて計算される前記予測パラメータを用いて、前記第１レイヤの画像から前記第２レイヤの画像を予測する予測部と、
を備える画像処理装置。
（２）
前記予測パラメータは、前記第１レイヤの画素値に乗算されるゲイン、及びオフセットを含む、前記（１）に記載の画像処理装置。
（３）
前記復号部は、予測モードを示す予測モードパラメータをさらに復号し、
前記予測部は、前記予測モードパラメータが適応パラメータモードを示す場合に、前記予測パラメータを用いて前記第２レイヤの画像を予測する、
前記（１）又は前記（２）に記載の画像処理装置。
（４）
前記復号部は、スライスごとに前記予測パラメータの前記差分を復号する、前記（３）に記載の画像処理装置。
（５）
前記予測部は、最新の予測モードパラメータが前記適応パラメータモードを示し、前回の予測モードパラメータがビットシフトモードを示す場合には、前記復号部により復号される前記差分をビットシフト量に対応する予測パラメータ値に加算することにより、最新の前記予測パラメータを計算する、前記（３）又は前記（４）に記載の画像処理装置。
（６）
前記予測部は、最新の予測モードパラメータが前記適応パラメータモードを示し、前回の予測モードパラメータが固定パラメータモードを示す場合には、前記復号部により復号される前記差分を予め定義される固定的な予測パラメータ値に加算することにより、最新の前記予測パラメータを計算する、前記（３）〜（５）のいずれか１項に記載の画像処理装置。
（７）
前記復号部は、シーケンスごとに前記予測モードパラメータを復号する、前記（３）又は前記（４）に記載の画像処理装置。
（８）
前記復号部は、重み付け予測関連パラメータと共用されるシンタックスを有するヘッダから、前記差分を復号する、前記（１）〜（７）のいずれか１項に記載の画像処理装置。
（９）
前記復号部は、前記第２レイヤにおいて前記重み付け予測関連パラメータを復号せず、
前記第２レイヤにおいて前記第１レイヤの前記重み付け予測関連パラメータが再利用される、
前記（８）に記載の画像処理装置。
（１０）
前記予測パラメータの第１のバージョンが、前記重み付け予測関連パラメータと共用される前記シンタックスのＬ０参照フレーム用の部分から復号される差分を用いて計算され、
前記予測パラメータの第２のバージョンが、前記重み付け予測関連パラメータと共用される前記シンタックスのＬ１参照フレーム用の部分から復号される差分を用いて計算され、
前記予測部は、前記予測パラメータの前記第１のバージョン及び前記予測パラメータの前記第２のバージョンを、前記第２レイヤの画像を予測するために選択的に使用する、
前記（８）又は前記（９）に記載の画像処理装置。
（１１）
前記予測部は、画素値が属するバンドに応じて、前記予測パラメータの前記第１のバージョン及び前記予測パラメータの前記第２のバージョンのうち使用すべきバージョンを選択する、前記（１０）に記載の画像処理装置。
（１２）
前記復号部は、前記使用すべきバージョンの切替えのための境界値を特定する境界情報をさらに復号する、前記（１１）に記載の画像処理装置。
（１３）
前記予測部は、画素が属する画像領域に応じて、前記予測パラメータの前記第１のバージョン及び前記予測パラメータの前記第２のバージョンのうち使用すべきバージョンを選択する、前記（１０）に記載の画像処理装置。
（１４）
前記復号部は、前記使用すべきバージョンの切替えのための領域境界を特定する境界情報をさらに復号する、前記（１３）に記載の画像処理装置。
（１５）
前記復号部は、前記第２レイヤのビット深度が前記第１レイヤのビット深度よりも大きい場合に、前記第２レイヤの画像を予測する際のビットシフトを色域変換と同時に実行すべきかを示す制御パラメータ、をさらに復号し、
前記予測部は、前記第２レイヤの画像を予測する際の前記ビットシフトを色域変換と同時に実行すべきであることを前記制御パラメータが示す場合に、前記ビットシフトをアップサンプリングではなく色域変換と同時に実行する、
前記（１）〜（１４）のいずれか１項に記載の画像処理装置。
（１６）
前記復号部は、輝度成分及び色差成分について別々に前記制御パラメータを復号する、前記（１５）に記載の画像処理装置。
（１７）
前記予測部は、前記第２レイヤの空間解像度が前記第１レイヤの空間解像度よりも高い場合に、前記第１レイヤの画像の色域を前記予測パラメータを用いて変換した後、変換された当該画像をアップサンプリングすることにより、前記第２レイヤの画像を予測する、前記（１）〜（１６）のいずれか１項に記載の画像処理装置。
（１８）
第１レイヤとは異なる色域を有する第２レイヤの画像を前記第１レイヤの画像から予測する際に使用される予測パラメータの過去の値からの差分を復号することと、
復号される前記差分を用いて計算される前記予測パラメータを用いて、前記第１レイヤの画像から前記第２レイヤの画像を予測することと、
を含む画像処理方法。
（１９）
第１レイヤとは異なる色域を有する第２レイヤの画像を復号する際に参照される前記第１レイヤの画像から、前記第２レイヤの画像を予測する予測部と、
前記予測部により使用される予測パラメータの過去の値からの差分を符号化する符号化部と、
を備える画像処理装置。
（２０）
前記予測パラメータは、前記第１レイヤの画素値に乗算されるゲイン、及びオフセットを含む、前記（１９）に記載の画像処理装置。
（２１）
前記符号化部は、前記差分に基づいて前記第２レイヤの画像が予測される場合に、予測モードとして適応パラメータモードを示す予測モードパラメータをさらに符号化する、前記（１９）又は前記（２０）に記載の画像処理装置。
（２２）
前記符号化部は、スライスごとに前記予測パラメータの前記差分を符号化する、前記（２１）に記載の画像処理装置。
（２３）
前記符号化部は、最新の予測モードパラメータが前記適応パラメータモードを示し、前回の予測モードパラメータがビットシフトモードを示す場合には、前記予測パラメータの最新の値からビットシフト量に対応するパラメータ値を減算することにより計算される前記差分を符号化する、前記（２１）又は前記（２２）に記載の画像処理装置。
（２４）
前記符号化部は、最新の予測モードパラメータが前記適応パラメータモードを示し、前回の予測モードパラメータが固定パラメータモードを示す場合には、前記予測パラメータの最新の値から予め定義される固定的なパラメータ値を減算することにより計算される前記差分を符号化する、前記（２１）〜（２３）のいずれか１項に記載の画像処理装置。
（２５）
前記符号化部は、シーケンスごとに前記予測モードパラメータを符号化する、前記（２１）又は前記（２２）に記載の画像処理装置。
（２６）
前記符号化部は、重み付け予測関連パラメータと共用されるシンタックスを有するヘッダにおいて前記差分を符号化する、前記（１９）〜（２５）のいずれか１項に記載の画像処理装置。
（２７）
前記符号化部は、前記第２レイヤにおいて前記重み付け予測関連パラメータを符号化せず、
前記第２レイヤにおいて前記第１レイヤの前記重み付け予測関連パラメータが再利用される、
前記（２６）に記載の画像処理装置。
（２８）
前記予測部は、前記予測パラメータの第１のバージョン及び前記予測パラメータの第２のバージョンを、前記第２レイヤの画像を予測するために選択的に使用し、
前記符号化部は、前記予測パラメータの前記第１のバージョンについて計算される前記差分を、前記重み付け予測関連パラメータと共用される前記シンタックスのＬ０参照フレーム用の部分へ符号化し、前記予測パラメータの前記第２のバージョンについて計算される前記差分を、前記重み付け予測関連パラメータと共用される前記シンタックスのＬ１参照フレーム用の部分へ符号化する、
前記（２６）又は前記（２７）に記載の画像処理装置。
（２９）
前記予測部は、画素値が属するバンドに応じて、前記予測パラメータの前記第１のバージョン及び前記予測パラメータの前記第２のバージョンのうち使用すべきバージョンを選択する、前記（２８）に記載の画像処理装置。
（３０）
前記符号化部は、前記使用すべきバージョンの切替えのための境界値を特定する境界情報をさらに符号化する、前記（２９）に記載の画像処理装置。
（３１）
前記予測部は、画素が属する画像領域に応じて、前記予測パラメータの前記第１のバージョン及び前記予測パラメータの前記第２のバージョンのうち使用すべきバージョンを選択する、前記（２８）に記載の画像処理装置。
（３２）
前記符号化部は、前記使用すべきバージョンの切替えのための領域境界を特定する境界情報をさらに符号化する、前記（３１）に記載の画像処理装置。
（３３）
前記符号化部は、前記第２レイヤのビット深度が前記第１レイヤのビット深度よりも大きい場合に、前記第２レイヤの画像を予測する際のビットシフトを色域変換と同時に実行すべきかを示す制御パラメータ、をさらに符号化する、前記（１９）〜（３２）のいずれか１項に記載の画像処理装置。
（３４）
前記符号化部は、輝度成分及び色差成分について別々に前記制御パラメータを符号化する、前記（３３）に記載の画像処理装置。
（３５）
前記予測部は、前記第２レイヤの空間解像度が前記第１レイヤの空間解像度よりも高い場合に、前記第１レイヤの画像の色域を前記予測パラメータを用いて変換した後、変換された当該画像をアップサンプリングすることにより、前記第２レイヤの画像を予測する、前記（１９）〜（３４）のいずれか１項に記載の画像処理装置。
（３６）
第１レイヤとは異なる色域を有する第２レイヤの画像を復号する際に参照される前記第１レイヤの画像から、前記第２レイヤの画像を予測することと、
前記第２レイヤの画像を予測するために使用される予測パラメータの過去の値からの差分を符号化することと、
を含む画像処理方法。

１０，１０ｖ画像符号化装置（画像処理装置）
１６可逆符号化部
４０色域予測部
６０，６０ｖ画像復号装置（画像処理装置）
６２可逆復号部
９０色域予測部

Claims

第１レイヤとは異なる色域を有する第２レイヤの画像を前記第１レイヤの画像から予測する際に使用される予測パラメータの過去の値からの差分を復号する復号部と、
前記復号部により復号される前記差分を用いて計算される前記予測パラメータを用いて、前記第１レイヤの画像から前記第２レイヤの画像を予測する予測部と、
を備え、
前記復号部は、前記第２レイヤのビット深度が前記第１レイヤのビット深度よりも大きい場合に、前記第２レイヤの画像を予測する際のビットシフトを色域変換と同時に実行すべきかを示す制御パラメータ、をさらに復号する、
画像処理装置。
前記予測パラメータは、前記第１レイヤの画素値に乗算されるゲイン、及びオフセットを含む、請求項１に記載の画像処理装置。
前記復号部は、スライスごとに前記予測パラメータの前記差分を復号する、請求項１に記載の画像処理装置。
前記復号部は、重み付け予測関連パラメータと共用されるシンタックスを有するヘッダから、前記差分を復号する、請求項１に記載の画像処理装置。
前記予測パラメータの第１のバージョンが、前記重み付け予測関連パラメータと共用される前記シンタックスのＬ０参照フレーム用の部分から復号される差分を用いて計算され、
前記予測パラメータの第２のバージョンが、前記重み付け予測関連パラメータと共用される前記シンタックスのＬ１参照フレーム用の部分から復号される差分を用いて計算され、
前記予測部は、前記予測パラメータの前記第１のバージョン及び前記予測パラメータの前記第２のバージョンを、前記第２レイヤの画像を予測するために選択的に使用する、
請求項４に記載の画像処理装置。
前記予測部は、画素値が属するバンドに応じて、前記予測パラメータの前記第１のバージョン及び前記予測パラメータの前記第２のバージョンのうち使用すべきバージョンを選択する、請求項５に記載の画像処理装置。
前記予測部は、画素が属する画像領域に応じて、前記予測パラメータの前記第１のバージョン及び前記予測パラメータの前記第２のバージョンのうち使用すべきバージョンを選択する、請求項５に記載の画像処理装置。
前記予測部は、前記第２レイヤの画像を予測する際の前記ビットシフトを色域変換と同時に実行すべきであることを前記制御パラメータが示す場合に、前記ビットシフトをアップサンプリングではなく色域変換と同時に実行する、
請求項１に記載の画像処理装置。
前記予測部は、前記第２レイヤの空間解像度が前記第１レイヤの空間解像度よりも高い場合に、前記第１レイヤの画像の色域を前記予測パラメータを用いて変換した後、変換された当該画像をアップサンプリングすることにより、前記第２レイヤの画像を予測する、請求項１に記載の画像処理装置。
第１レイヤとは異なる色域を有する第２レイヤの画像を前記第１レイヤの画像から予測する際に使用される予測パラメータの過去の値からの差分を復号することと、
復号される前記差分を用いて計算される前記予測パラメータを用いて、前記第１レイヤの画像から前記第２レイヤの画像を予測することと、
を含み、
前記第２レイヤのビット深度が前記第１レイヤのビット深度よりも大きい場合に、前記第２レイヤの画像を予測する際のビットシフトを色域変換と同時に実行すべきかを示す制御パラメータ、がさらに復号される、
画像処理方法。
第１レイヤとは異なる色域を有する第２レイヤの画像を復号する際に参照される前記第１レイヤの画像から、前記第２レイヤの画像を予測する予測部と、
前記予測部により使用される予測パラメータの過去の値からの差分を符号化する符号化部と、
を備え、
前記符号化部は、前記第２レイヤのビット深度が前記第１レイヤのビット深度よりも大きい場合に、前記第２レイヤの画像を予測する際のビットシフトを色域変換と同時に実行すべきかを示す制御パラメータ、をさらに符号化する、
画像処理装置。
前記予測パラメータは、前記第１レイヤの画素値に乗算されるゲイン、及びオフセットを含む、請求項１１に記載の画像処理装置。
前記符号化部は、スライスごとに前記予測パラメータの前記差分を符号化する、請求項１１に記載の画像処理装置。
前記符号化部は、重み付け予測関連パラメータと共用されるシンタックスを有するヘッダにおいて前記差分を符号化する、請求項１１に記載の画像処理装置。
前記予測部は、前記予測パラメータの第１のバージョン及び前記予測パラメータの第２のバージョンを、前記第２レイヤの画像を予測するために選択的に使用し、
前記符号化部は、前記予測パラメータの前記第１のバージョンについて計算される前記差分を、前記重み付け予測関連パラメータと共用される前記シンタックスのＬ０参照フレーム用の部分へ符号化し、前記予測パラメータの前記第２のバージョンについて計算される前記差分を、前記重み付け予測関連パラメータと共用される前記シンタックスのＬ１参照フレーム用の部分へ符号化する、
請求項１４に記載の画像処理装置。
前記予測部は、画素値が属するバンドに応じて、前記予測パラメータの前記第１のバージョン及び前記予測パラメータの前記第２のバージョンのうち使用すべきバージョンを選択する、請求項１５に記載の画像処理装置。
前記予測部は、画素が属する画像領域に応じて、前記予測パラメータの前記第１のバージョン及び前記予測パラメータの前記第２のバージョンのうち使用すべきバージョンを選択する、請求項１５に記載の画像処理装置。
前記予測部は、前記第２レイヤの空間解像度が前記第１レイヤの空間解像度よりも高い場合に、前記第１レイヤの画像の色域を前記予測パラメータを用いて変換した後、変換された当該画像をアップサンプリングすることにより、前記第２レイヤの画像を予測する、請求項１１に記載の画像処理装置。
第１レイヤとは異なる色域を有する第２レイヤの画像を復号する際に参照される前記第１レイヤの画像から、前記第２レイヤの画像を予測することと、
前記第２レイヤの画像を予測するために使用される予測パラメータの過去の値からの差分を符号化することと、
前記第２レイヤのビット深度が前記第１レイヤのビット深度よりも大きい場合に、前記第２レイヤの画像を予測する際のビットシフトを色域変換と同時に実行すべきかを示す制御パラメータ、をさらに符号化することと、
を含む画像処理方法。