JP2014082729A - 画像復号装置、および画像符号化装置 - Google Patents

画像復号装置、および画像符号化装置 Download PDF

Info

Publication number
JP2014082729A
JP2014082729A JP2012283956A JP2012283956A JP2014082729A JP 2014082729 A JP2014082729 A JP 2014082729A JP 2012283956 A JP2012283956 A JP 2012283956A JP 2012283956 A JP2012283956 A JP 2012283956A JP 2014082729 A JP2014082729 A JP 2014082729A
Authority
JP
Japan
Prior art keywords
prediction
unit
image
intra
layer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2012283956A
Other languages
English (en)
Inventor
Tomoyuki Yamamoto
智幸 山本
Masanobu Yasugi
将伸 八杉
Kenji Tsukuba
健史 筑波
Tomohiro Igai
知宏 猪飼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP2012283956A priority Critical patent/JP2014082729A/ja
Publication of JP2014082729A publication Critical patent/JP2014082729A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

【課題】階層符号化における符号化効率を向上させる。
【解決手段】対象予測単位の周辺領域の復号画像を参照してレイヤ内イントラ予測画像を生成するレイヤ内イントラ予測手段と、補正単位分割手段により補正単位に分割されたレイヤ内予測画像から低周波成分抽出手段により抽出した低周波成分を、補正単位分割手段により補正単位に分割された下位レイヤ復号画像から低周波成分抽出手段により抽出した低周波成分に置き換えることで予測画像を生成するハイブリッド予測手段を備え、空間予測モードに応じて上記2つの予測手段を切り替える画像符号化装置および画像復号装置。
【選択図】図1

Description

本発明は、画像が階層的に符号化された階層符号化データを復号する画像復号装置、および画像を階層的に符号化することによって階層符号化データを生成する画像符号化装置に関する。
通信システムで伝送される情報、あるいは蓄積装置に記録される情報の1つに画像あるいは動画像がある。従来、これらの画像(以降、動画像を含む)の伝送・蓄積のため、画像を符号化する技術が知られている。
動画像符号化方式としては、AVC(H.264/MPEG-4 Advanced Video Coding)や、その後継コーデックであるHEVC(High-Efficiency Video Coding)が知られている(非特許文献1)。
これらの動画像符号化方式では、通常、入力画像を符号化/復号することによって得られる局所復号画像に基づいて予測画像が生成され、当該予測画像を入力画像(原画像)から減算して得られる予測残差(「差分画像」または「残差画像」と呼ぶこともある)が符号化される。また、予測画像の生成方法としては、画面間予測(インター予測)、および、画面内予測(イントラ予測)が挙げられる。
イントラ予測においては、同一フレーム内の局所復号画像に基づいて、当該フレームにおける予測画像が順次生成される。
インター予測については、フレーム間の動き補償により予測画像が生成される。動き補償に関する情報(動き補償パラメータ)は、たいていの場合、符号量の削減のため直接符号化されない。そこで、インター予測では、対象ブロック周辺の復号状況等に基づく動き補償パラメータの推定が行われる。
また、近年、必要なデータレートに従って、画像を階層的に符号化する階層符号化技術が提案されている。
階層符号化の方式としては、ISO/IECとITU-Tの標準としてSVC(H.264/AVC Annex G Scalable Video Coding)が挙げられる。
SVCでは空間スケーラビリティ、時間スケーラビリティ、SNRスケーラビリティをサポートする。例えば空間スケーラビリティの場合、原画像から所望の解像度にダウンサンプリングした画像を下位レイヤとしてAVCで符号化する。次に上位レイヤではレイヤ間の冗長性を除去するためにレイヤ間予測を行う。
レイヤ間予測としては、動き予測に関する情報を同時刻の下位レイヤの情報から予測する動き情報予測、あるいは同時刻の下位レイヤの復号画像をアップサンプリングした画像から予測するテクスチャ予測がある(非特許文献2)。上記動き情報予測では、参照レイヤの動き情報を推定値として動き情報が符号化される。
SVCでは、予測画像の生成に、インター予測、レイヤ内イントラ予測、レイヤ間イントラ予測(レイヤ間テクスチャ予測)のいずれかを利用できる。
「High efficiency video coding (HEVC) text specification draft 8 (JCTVC-J1003_d7)」, Joint Collaborative Team on Video Coding (JCT-VC) of ITU-T SG16 WP3 and ISO/IEC JTC1/SC29/WG11 11th Meeting: Stockholm, SE, 11-20 July 2012 (2012年7月28日公開) ITU-T H.264 「Advanced video coding for generic audiovisual services」(2007年11月公開)
しかしながら、従来技術として挙げたHEVCにおけるイントラ予測、または、SVCにおけるレイヤ内イントラ予測では、予測対象領域の周辺領域の復号画素値を利用して予測画像を生成するため、予測対象領域内の低周波成分が正しく予測できない場合があるという課題があった。また、SVCにおけるレイヤ間イントラ予測では、下位レイヤの復号画像をアップサンプルして得られる画素値を用いて予測画像を生成するため、予測対象領域内の低周波成分は比較的正確に推定できるが、予測対象領域内の高周波成分が正しく推定できないという課題があった。
本発明は、上記問題に鑑みてされたものであり、その目的は、階層符号化方式において、高周波成分と低周波成分の両方を従来の予測方式に比べて正確に推定することで、より効果的に符号化効率の向上を図ることのできる画像復号装置および画像符号化装置を実現することにある。
上記課題を解決するために、本発明に係る画像復号装置は、階層符号化された符号化データに含まれる上位レイヤの符号化データを復号し、下位レイヤの復号画像を参照して生成した上位レイヤの予測画像を用いて上位レイヤの復号画像を復元する画像復号装置であって、上位レイヤの復号画像を参照してレイヤ内予測画像を生成するレイヤ内予測画像生成手段と、レイヤ内予測画像の低周波成分を下位レイヤの復号画像の低周波成分により置き換えることで予測画像を生成するハイブリッド予測手段を備えることを特徴としている。
また、上記画像復号装置において、上記レイヤ内予測画像、および、上記下位レイヤ復号画像を補正単位に分割する補正単位分割手段と、上記補正単位で、上記レイヤ内予測画像、および、上記下位レイヤ復号画像の低周波成分を抽出する低周波成分抽出手段を備え、上記ハイブリッド予測手段は、上記補正単位分割手段により補正単位に分割された上記レイヤ内予測画像から上記低周波成分抽出手段により抽出した低周波成分を、上記補正単位分割手段により補正単位に分割された上記下位レイヤ復号画像から上記低周波成分抽出手段により抽出した低周波成分に置き換えることで、予測画像を生成する、ことが好ましい。
また、上記画像復号装置において、予測情報に係るシンタックス値を復号する可変長復号手段と、上記予測情報に係るシンタックス値に基づいて、空間予測モードを含む予測パラメータを復元する予測パラメータ復元手段を備え、上記空間予測モードの示す予測方法で、対象予測単位の周辺領域の復号画像を参照してレイヤ内イントラ予測画像を生成するレイヤ内イントラ予測手段を備え、上記レイヤ内予測画像は、上記レイヤ内イントラ予測画像である、ことが好ましい。
また、上記画像復号装置において、上記低周波成分抽出手段は、上記補正単位の画素値の平均値を上記低周波成分として抽出する、ことが好ましい。
また、上記画像復号装置において、上記イントラ予測選択手段は、上記空間予測モードと対象予測単位のサイズの組み合わせに基づいて、対象予測単位において、上記ハイブリッド予測と上記レイヤ内イントラ予測の何れを適用するかを示すハイブリッド予測フラグを導出する、ことが好ましい。
また、上記画像復号装置において、上記イントラ予測選択手段は、上記空間予測モードがDC予測である場合に上記レイヤ内イントラ予測を適用することを示し、上記空間予測モードがPlanar予測、または、方向予測である場合に上記ハイブリッド予測を適用することを示すハイブリッド予測フラグを導出する、ことが好ましい。
また、上記画像復号装置において、上記補正単位分割手段における補正単位サイズを決定する補正単位決定手段を備え、上記補正単位決定手段は、上記空間予測モードと対象予測単位のサイズの組み合わせに基づいて、補正単位サイズを決定する、ことが好ましい。
また、上記画像復号装置において、上記補正単位決定手段は、上記空間予測モードが水平方向に近い方向に対応する方向予測である場合に縦長矩形の補正単位を選択し、上記空間予測モードが垂直方向に近い方向に対応する方向予測である場合に横長矩形の補正単位を選択する、ことが好ましい。
また、上記画像復号装置において、上記補正単位決定手段は、上記空間予測モードがPlanar予測またはDC予測である場合、上記縦長矩形の補正単位または上記横長矩形の補正単位を選択する、ことが好ましい。
また、上記画像復号装置において、上記補正単位は、対象符号化単位のサイズに依存せず一定である、ことが好ましい。
また、上記画像復号装置において、上記補正単位は、予測単位の最小サイズに等しいこと、が好ましい。
また、上記画像復号装置において、上記レイヤ内イントラ予測画像の生成処理には、予測画像生成に用いる参照領域へ既定の低域フィルタを適用する参照画素フィルタ適用処理を含み、上記予測タイプがレイヤ内イントラ予測を示す場合は、上記参照画像フィルタ適用処理を実行し、上記予測タイプがハイブリッド予測を示す場合は、上記参照画像フィルタ適用処理の実行を省略する、ことが好ましい。
また、上記画像復号装置において、対象予測単位に対応する位置のベース参照画像の画素値に基づいて予測画像を生成するレイヤ間イントラ予測手段を備え、上記予測情報に係るシンタックスにはレイヤ間予測フラグがさらに含まれ、上記イントラ予測選択手段は、上記レイヤ間予測フラグがレイヤ間予測を行うことを示し、かつ、上記空間予測モードがDC予測モードである場合に、上記予測タイプとしてレイヤ間イントラ予測を選択し、上記レイヤ間予測フラグがレイヤ間予測を行うことを示し、かつ、上記空間予測モードがDC予測モード以外である場合に、上記予測タイプとしてハイブリッド予測を選択し、上記レイヤ間予測フラグがレイヤ間予測を行わないことを示す場合、上記予測タイプとしてレイヤ内イントラ予測を選択する、ことが好ましい。
本発明に係る画像符号化装置は、原画像から下位レイヤの復号画像を参照して生成した上位レイヤの予測画像を減算して得られる残差を階層符号化して上位レイヤの符号化データを生成する画像符号化装置であって、予め定められた複数の予測モードの少なくとも一部を含む予測モード群から、一つの予測モードを選択する選択手段と、上記選択手段によって選択された予測モードに基づいて、上位レイヤにおける対象予測単位の予測画像を生成する予測画像生成手段とを備え、上記予測画像生成手段は、該対象予測単位の予測画像として、上位レイヤの復号画像を参照して生成されるレイヤ内予測画像、または上記レイヤ内予測画像の低周波成分を下位レイヤの復号画像の低周波成分により置き換えることで生成されるハイブリッド予測画像を生成する、ことを特徴とする。
本発明に係る画像復号装置は、空間予測画像の高周波成分と、ベース参照画像の低周波成分を組み合わせてハイブリッド予測画像を生成するハイブリッド予測部を備えている。したがって、動画像復号装置1は、ハイブリッド予測画像を用いることで生成された従来より少ない符号量の符号化データを復号して、復号画像を再生できる。
本発明に係る画像復号装置は、空間予測画像の高周波成分と、ベース参照画像の低周波成分を組み合わせてハイブリッド予測画像を生成するハイブリッド予測部を備えている。したがって、動画像符号化装置2は、ハイブリッド予測画像を用いることで従来より少ない符号量で符号化データを生成できる。
本発明の一実施形態に係る階層動画像復号装置に含まれるハイブリッド予測部の構成について例示する機能ブロック図である。 本発明の実施形態に係る階層符号化データのレイヤ構造を説明するための図であって、(a)は、階層動画像符号化装置側について示しており、(b)は、階層動画像復号装置側について示している。 本発明の実施形態に係る階層符号化データの構成を説明するための図であって、(a)は、シーケンスSEQを規定するシーケンスレイヤを示しており、(b)は、ピクチャPICTを規定するピクチャレイヤを示しており、(c)は、スライスSを規定するスライスレイヤを示しており、(d)は、符号化ツリーブロックCTBを規定するCTBレイヤを示しており、(e)は、符号化ツリーブロックCTBに含まれる符号化単位(Coding Unit;CU)を規定するCUレイヤを示している。 PU分割タイプのパターンを示す図であり、(a)〜(h)は、それぞれ、PU分割タイプが、2N×N、2N×N、2N×nU、2N×nD、2N×N、2N×nU、2N×nD、および、N×Nの場合のパーティション形状について示している。 上記階層動画像復号装置の概略的構成を示す機能ブロック図である。 上記階層動画像復号装置に含まれる可変長復号部12がCU単位の予測情報復号時に参照するシンタックス表の一部を示している。 上記階層動画像復号装置に含まれる可変長復号部12がPU単位の予測情報復号時に参照するシンタックス表の一部を示している。 上記階層動画像復号装置に含まれるテクスチャ復元部の構成について例示する機能ブロック図である。 上記階層動画像復号装置に含まれるベース復号部の構成について例示する機能ブロック図である。 上記階層動画像復号装置において利用可能な空間予測の方向について示す図である。 空間予測モードと、当該空間予測モードに対応付けられている名前とを示す図である。 上記階層動画像復号装置による空間予測(レイヤ内イントラ予測)において用いられる対象PUに対する参照領域を示す図である。 上記階層動画像復号装置によるイントラレイヤ間予測を模式的に示す図である。 変形例7のハイブリッド予測部の構成について例示する機能ブロック図である。 上記階層動画像復号装置に含まれる予測パラメータ復号部の構成について例示する機能ブロック図である。 レイヤ間予測フラグとイントラ予測モードの組み合わせと、予測タイプの関係を示す図である。 本発明の一実施形態に係る階層動画像符号化装置の概略的構成を示す機能ブロック図である。 上記階層動画像符号化装置に含まれる予測情報生成部の構成について例示する機能ブロック図である。 上記階層動画像符号化装置に含まれるテクスチャ情報生成部の構成について例示する機能ブロック図である。 上記階層動画像符号化装置を搭載した送信装置、および、上記階層動画像復号装置を搭載した受信装置の構成について示した図である。(a)は、階層動画像符号化装置を搭載した送信装置を示しており、(b)は、階層動画像復号装置を搭載した受信装置を示している。 上記階層動画像符号化装置を搭載した記録装置、および、上記階層動画像復号装置を搭載した再生装置の構成について示した図である。(a)は、階層動画像符号化装置を搭載した記録装置を示しており、(b)は、階層動画像復号装置を搭載した再生装置を示している。

本発明の第2の実施形態に係る階層動画像復号装置の概略的構成を示す機能ブロック図である。 上記階層動画像復号装置に含まれる可変長復号部32が予測情報復号時に参照するシンタックス表の一部を示している。 上記階層動画像復号装置に含まれる予測パラメータ復元部の構成について例示する機能ブロック図である。 レイヤ間予測フラグとハイブリッド予測フラグの組み合わせと、予測タイプの関係を示す図である。 予測ブロックタイプとイントラ予測モードの組み合わせと、ハイブリッド予測フラグの関係を示す図である。 上記階層動画像復号装置に含まれるテクスチャ復元部の構成について例示する機能ブロック図である。 上記階層動画像復号装置に含まれるハイブリッド予測部の構成について例示する機能ブロック図である。 補正単位決定部352H5において参照されるイントラ予測モードと補正単位の関係を示す図である。 変形例8における、予測ブロックタイプとイントラ予測モードの組み合わせと、ハイブリッド予測フラグの関係を示す図である。 変形例8における、予測ブロックタイプとイントラ予測モードの組み合わせと、ハイブリッド予測フラグの関係の別の例を示す図である。 変形例9における、イントラ予測モードと、補正単位サイズの関係を示す図である。 変形例10における、予測ブロック幅とイントラ予測モードの組み合わせと、補正単位サイズの関係を示す図である。 変形例11における、予測ブロック幅とイントラ予測モードの組み合わせと、補正単位サイズの関係を示す図である。 変形例11における、予測ブロック幅とイントラ予測モードの組み合わせと、補正単位サイズの関係の別の例を示す図である。 変形例12における、予測ブロック幅とイントラ予測モードの組み合わせと、補正単位サイズの関係を示す図である。 本発明の第2の実施形態に係る階層動画像符号化装置の概略的構成を示す機能ブロック図である。 上記階層動画像符号化装置に含まれる予測情報生成部の構成について例示する機能ブロック図である。 上記階層動画像符号化装置に含まれるテクスチャ情報生成部の構成について例示する機能ブロック図である。
図1〜図21に基づいて、本発明の一実施形態に係る階層動画像復号装置1および階層動画像符号化装置2について説明すれば以下のとおりである。
〔概要〕
本実施の形態に係る階層動画像復号装置(画像復号装置)1は、階層動画像符号化装置(画像符号化装置)2によって階層符号化された符号化データを復号する。階層符号化とは、動画像を低品質のものから高品質のものにかけて階層的に符号化する符号化方式のことである。階層符号化は、例えば、SVCにおいて標準化されている。なお、ここでいう動画像の品質とは、主観的および客観的な動画像の見栄えに影響する要素のことを広く意味する。動画像の品質には、例えば、“解像度”、“フレームレート”、“画質”、および、“画素の表現精度”が含まれる。よって、以下、動画像の品質が異なるといえば、例示的には、“解像度”等が異なることを指すが、これに限られない。例えば、異なる量子化ステップで量子化された動画像の場合(すなわち、異なる符号化雑音により符号化された動画像の場合)も互いに動画像の品質が異なるといえる。
また、SVCは、階層化される情報の種類の観点から、(1)空間スケーラビリティ、(2)時間スケーラビリティ、および(3)SNR(Signal to Noise Ratio)スケーラビリティに分類されることもある。空間スケーラビリティとは、解像度や画像のサイズにおいて階層化する技術である。時間スケーラビリティとは、フレーム・レート(単位時間のフレーム数)において階層化する技術である。また、SNRスケーラビリティは、符号化雑音において階層化する技術である。
本実施形態に係る階層動画像符号化装置2及び階層動画像復号装置1の詳細な説明に先立って、まず(1)階層動画像符号化装置2によって生成され、階層動画像復号装置1によって復号される階層符号化データのレイヤ構造について説明し、次いで(2)各レイヤで採用できるデータ構造の具体例について説明を行う。
〔階層符号化データのレイヤ構造〕
ここで、図2を用いて、階層符号化データの符号化および復号について説明すると次のとおりである。図2は、動画像を、下位階層L3、中位階層L2、および上位階層L1の3階層により階層的に符号化/復号する場合について模式的に表す図である。つまり、図2(a)および(b)に示す例では、3階層のうち、上位階層L1が最上位層となり、下位階層L3が最下位層となる。
以下において、階層符号化データから復号され得る特定の品質に対応する復号画像は、特定の階層の復号画像(または、特定の階層に対応する復号画像)と称される(例えば、上位階層L1の復号画像POUT#A)。
図2(a)は、入力画像PIN#A〜PIN#Cをそれぞれ階層的に符号化して符号化データDATA#A〜DATA#Cを生成する階層動画像符号化装置2#A〜2#Cを示している。図2(b)は、階層的に符号化された符号化データDATA#A〜DATA#Cをそれぞれ復号して復号画像POUT#A〜POUT#Cを生成する階層動画像復号装置1#A〜1#Cを示している。
まず、図2(a)を用いて、符号化装置側について説明する。符号化装置側の入力となる入力画像PIN#A、PIN#B、およびPIN#Cは、原画は同じだが、画像の品質(解像度、フレームレート、および画質等)が異なる。画像の品質は、入力画像PIN#A、PIN#B、およびPIN#Cの順に低くなる。
下位階層L3の階層動画像符号化装置2#Cは、下位階層L3の入力画像PIN#Cを符号化して下位階層L3の符号化データDATA#Cを生成する。下位階層L3の復号画像POUT#Cを復号するのに必要な基本情報が含まれる(図2において“C”にて示している)。下位階層L3は、最下層の階層であるため、下位階層L3の符号化データDATA#Cは、基本符号化データとも称される。
また、中位階層L2の階層動画像符号化装置2#Bは、中位階層L2の入力画像PIN#Bを、下位階層の符号化データDATA#Cを参照しながら符号化して中位階層L2の符号化データDATA#Bを生成する。中位階層L2の符号化データDATA#Bには、符号化データDATA#Cに含まれる基本情報“C”に加えて、中位階層の復号画像POUT#Bを復号するのに必要な付加的情報(図2において“B”にて示している)が含まれる。
また、上位階層L1の階層動画像符号化装置2#Aは、上位階層L1の入力画像PIN#Aを、中位階層L2の符号化データDATA#Bを参照しながら符号化して上位階層L1の符号化データDATA#Aを生成する。上位階層L1の符号化データDATA#Aには、下位階層L3の復号画像POUT#Cを復号するのに必要な基本情報“C”および中位階層L2の復号画像POUT#Bを復号するのに必要な付加的情報“B”に加えて、上位階層の復号画像POUT#Aを復号するのに必要な付加的情報(図2において“A”にて示している)が含まれる。
このように上位階層L1の符号化データDATA#Aは、異なる複数の品質の復号画像に関する情報を含む。
次に、図2(b)を参照しながら復号装置側について説明する。復号装置側では、上位階層L1、中位階層L2、および下位階層L3それぞれの階層に応じた復号装置1#A、1#B、および1#Cが、符号化データDATA#A、DATA#B、およびDATA#Cを復号して復号画像POUT#A、POUT#B、およびPOUT#Cを出力する。
なお、上位の階層符号化データの一部の情報を抽出して、より下位の特定の復号装置において、当該抽出した情報を復号することで特定の品質の動画像を再生することもできる。
例えば、中位階層L2の階層復号装置1#Bは、上位階層L1の階層符号化データDATA#Aから、復号画像POUT#Bを復号するのに必要な情報(すなわち、階層符号化データDATA#Aに含まれる“B”および“C”)を抽出して、復号画像POUT#Bを復号してもよい。言い換えれば、復号装置側では、上位階層L1の階層符号化データDATA#Aに含まれる情報に基づいて、復号画像POUT#A、POUT#B、およびPOUT#Cを復号することができる。
なお、以上の3階層の階層符号化データに限られず、階層符号化データは、2階層で階層符号化されていてもよいし、3階層よりも多い階層数にて階層符号化されていてもよい。
また、特定の階層の復号画像に関する符号化データの一部または全部を他の階層とは独立して符号化し、特定の階層の復号の際に、他の階層の情報を参照しなくても済むように階層符号化データを構成してもよい。例えば、図2(a)および(b)を用いて上述した例では、復号画像POUT#Bの復号に“C”および“B”を参照すると説明したが、これに限られない。復号画像POUT#Bが“B”だけを用いて復号できるように階層符号化データを構成することも可能である。例えば、復号画像POUT#Bの復号に、“B”だけから構成される階層符号化データと、復号画像POUT#Cを入力とする階層動画像復号装置も構成できる。
なお、SNRスケーラビリティを実現する場合、入力画像PIN#A、PIN#B、およびPIN#Cとして同一の原画を用いた上で、復号画像POUT#A、POUT#B、およびPOUT#Cが異なる画質となるよう階層符号化データを生成することもできる。その場合、下位階層の階層動画像符号化装置が、上位階層の階層動画像符号化装置に較べて、より大きい量子化幅を用いて予測残差を量子化することで階層符号化データを生成する。
本書では、説明の便宜上、次のとおり用語を定義する。以下の用語は、特に断りがなければ、下記の技術的事項のことを表わすのに用いる。
上位レイヤ : ある階層よりも上位に位置する階層のことを、上位レイヤと称する。例えば、図2において、下位階層L3の上位レイヤは、中位階層L2および上位階層L1である。また、上位レイヤの復号画像とは、より品質の高い(例えば、解像度が高い、フレームレートが高い、画質が高い等)復号画像のことをいう。
下位レイヤ : ある階層よりも下位に位置する階層のことを、下位レイヤと称する。例えば、図2において、上位階層L1の下位レイヤは、中位階層L2および下位階層L3である。また、下位レイヤの復号画像とは、より品質の低い復号画像のことをいう。
対象レイヤ : 復号または符号化の対象となっている階層のことをいう。
参照レイヤ(reference layer) : 対象レイヤに対応する復号画像を復号するのに参照される特定の下位レイヤのことを参照レイヤと称する。
図2(a)および(b)に示した例では、上位階層L1の参照レイヤは、中位階層L2および下位階層L3である。しかしながら、これに限られず、特定の上記レイヤの復号において、下位レイヤのすべてを参照しなくてもよいように階層符号化データを構成することもできる。例えば、上位階層L1の参照レイヤが、中位階層L2および下位階層L3のいずれか一方となるように階層符号化データを構成することも可能である。
基本レイヤ(base layer) : 最下層に位置する階層のことを基本レイヤと称する。基本レイヤの復号画像は、符号化データから復号され得るもっとも低い品質の復号画像であり、基本復号画像と呼称される。別の言い方をすれば、基本復号画像は、最下層の階層に対応する復号画像のことである。基本復号画像の復号に必要な階層符号化データの部分符号化データは基本符号化データと呼称される。例えば、上位階層L1の階層符号化データDATA#Aに含まれる基本情報“C”が基本符号化データである。
拡張レイヤ : 基本レイヤの上位レイヤは、拡張レイヤと称される。
レイヤ識別子 : レイヤ識別子は、階層を識別するためのものであり、階層と1対1に対応する。階層符号化データには特定の階層の復号画像の復号に必要な部分符号化データを選択するために用いられる階層識別子が含まれる。特定のレイヤに対応するレイヤ識別子に関連付けられた階層符号化データの部分集合は、レイヤ表現とも呼称される。
一般に、特定の階層の復号画像の復号には、当該階層のレイヤ表現、および/または、当該階層の下位レイヤに対応するレイヤ表現が用いられる。すなわち、対象レイヤの復号画像の復号においては、対象レイヤのレイヤ表現、および/または、対象レイヤの下位レイヤに含まれる1つ以上階層のレイヤ表現が用いられる。
レイヤ間予測 : レイヤ間予測とは、対象レイヤのレイヤ表現と異なる階層(参照レイヤ)のレイヤ表現に含まれるシンタックス要素値、シンタックス要素値より導出される値、および復号画像に基づいて、対象レイヤのシンタックス要素値や対象レイヤの復号に用いられる符号化パラメータ等を予測することである。動き予測に関する情報を(同時刻の)参照レイヤの情報から予測するレイヤ間予測のことを動き情報予測と称することもある。また、(同時刻の)下位レイヤの復号画像をアップサンプリングした画像から予測するレイヤ間予測のことをテクスチャ予測(あるいはレイヤ間イントラ予測)と称することもある。なお、レイヤ間予測に用いられる階層は、例示的には、対象レイヤの下位レイヤである。また、参照レイヤを用いず対象レイヤ内で予測を行うことをレイヤ内予測と称することもある。
なお、以上の用語は、飽くまで説明の便宜上のものであり、上記の技術的事項を別の用語にて表現してもかまわない。
〔階層符号化データのデータ構造について〕
以下、各階層の符号化データを生成する符号化方式として、HEVCおよびその拡張方式を用いる場合について例示する。しかしながら、これに限られず、各階層の符号化データを、MPEG−2や、H.264/AVCなどの符号化方式により生成してもよい。
また、下位レイヤと上位レイヤとが異なる符号化方式によって符号化されていてもよい。また、各階層の符号化データは、互いに異なる伝送路を介して階層動画像復号装置1に供給されるものであってもよいし、同一の伝送路を介して階層動画像復号装置1に供給されるものであってもよい。
例えば、超高精細映像(動画像、4K映像データ)を基本レイヤおよび1つの拡張レイヤによりスケーラブル符号化して伝送する場合、基本レイヤは、4K映像データをダウンスケーリングし、インタレース化した映像データをMPEG−2またはH.264/AVCにより符号化してテレビ放送網で伝送し、拡張レイヤは、4K映像(プログレッシブ)をHEVCにより符号化して、インターネットで伝送してもよい。
(基本レイヤ)
図3は、基本レイヤにおいて採用することができる符号化データ(図2の例でいえば、階層符号化データDATA#C)のデータ構造について例示する図である。階層符号化データDATA#Cは、例示的に、シーケンス、およびシーケンスを構成する複数のピクチャを含む。
階層符号化データDATA#Cにおけるデータの階層構造を図3に示す。図3の(a)〜(e)は、それぞれ、シーケンスSEQを規定するシーケンスレイヤ、ピクチャPICTを規定するピクチャレイヤ、スライスSを規定するスライスレイヤ、符号化ツリーブロック(Coding Tree block;CTB)を規定するCTBレイヤ、符号化ツリーブロックCTBに含まれる符号化単位(Coding Unit;CU)を規定するCUレイヤを示す図である。
(シーケンスレイヤ)
シーケンスレイヤでは、処理対象のシーケンスSEQ(以下、対象シーケンスとも称する)を復号するために階層動画像復号装置1が参照するデータの集合が規定されている。シーケンスSEQは、図3の(a)に示すように、シーケンスパラメータセットSPS(Sequence Parameter Set)、ピクチャパラメータセットPPS(Picture Parameter Set)、ピクチャPICT〜PICTNP(NPはシーケンスSEQに含まれるピクチャの総数)、及び、付加拡張情報SEI(Supplemental Enhancement Information)を含んでいる。
シーケンスパラメータセットSPSでは、対象シーケンスを復号するために階層動画像復号装置1が参照する符号化パラメータの集合が規定されている。
ピクチャパラメータセットPPSでは、対象シーケンス内の各ピクチャを復号するために階層動画像復号装置1が参照する符号化パラメータの集合が規定されている。なお、PPSは複数存在してもよい。その場合、対象シーケンス内の各ピクチャから複数のPPSの何れかを選択する。
(ピクチャレイヤ)
ピクチャレイヤでは、処理対象のピクチャPICT(以下、対象ピクチャとも称する)を復号するために階層動画像復号装置1が参照するデータの集合が規定されている。ピクチャPICTは、図3の(b)に示すように、ピクチャヘッダPH、及び、スライスS1〜SNSを含んでいる(NSはピクチャPICTに含まれるスライスの総数)。
なお、以下、スライスS1〜SNSのそれぞれを区別する必要が無い場合、符号の添え字を省略して記述することがある。また、以下に説明する階層符号化データDATA#Cに含まれるデータであって、添え字を付している他のデータについても同様である。
ピクチャヘッダPHには、対象ピクチャの復号方法を決定するために階層動画像復号装置1が参照する符号化パラメータ群が含まれている。なお、符号化パラメータ群は、必ずしもピクチャヘッダPH内に直接含んでいる必要はなく、例えばピクチャパラメータセットPPSへの参照を含むことで、間接的に含めても良い。
(スライスレイヤ)
スライスレイヤでは、処理対象のスライスS(対象スライスとも称する)を復号するために階層動画像復号装置1が参照するデータの集合が規定されている。スライスSは、図3の(c)に示すように、スライスヘッダSH、及び、符号化ツリーブロックCTB1〜CTBNC(NCはスライスSに含まれるCTBの総数)のシーケンスを含んでいる。
スライスヘッダSHには、対象スライスの復号方法を決定するために階層動画像復号装置1が参照する符号化パラメータ群が含まれる。スライスタイプを指定するスライスタイプ指定情報(slice_type)は、スライスヘッダSHに含まれる符号化パラメータの一例である。
スライスタイプ指定情報により指定可能なスライスタイプとしては、(1)符号化の際にイントラ予測のみを用いるIスライス、(2)符号化の際に単方向予測、又は、イントラ予測を用いるPスライス、(3)符号化の際に単方向予測、双方向予測、又は、イントラ予測を用いるBスライスなどが挙げられる。
なお、スライスヘッダSHには、上記シーケンスレイヤに含まれる、ピクチャパラメータセットPPSへの参照(pic_parameter_set_id)を含んでいても良い。
(CTBレイヤ)
CTBレイヤでは、処理対象の符号化ツリーブロックCTB(以下、対象CTBとも称する)を復号するために階層動画像復号装置1が参照するデータの集合が規定されている。なお、符号化ツリーブロックのことをツリーブロック(TB: Tree block)、または、最大符号化単位(LCU:Largest Cording Unit)と呼ぶこともある。
符号化ツリーブロックCTBは、CTBヘッダCTBHと、符号化単位情報CU〜CUNL(NLはCTBに含まれる符号化単位情報の総数)とを含む。ここで、まず、符号化ツリーブロックCTBと、符号化単位情報CUとの関係について説明すると次のとおりである。
符号化ツリーブロックCTBは、イントラ予測またはインター予測、および、変換の各処理ためのブロックサイズを特定するためのパーティションに分割される。
符号化ツリーブロックCTBの上記パーティションは、再帰的な4分木分割により分割されている。この再帰的な4分木分割により得られる木構造のことを以下、符号化ツリー(coding tree)と称する。
以下、符号化ツリーの末端のノードであるリーフ(leaf)に対応するパーティションを、符号化ノード(coding node)として参照する。また、符号化ノードは、符号化処理の基本的な単位となるため、以下、符号化ノードのことを、符号化単位(CU)とも称する。なお、符号化ノードは、符号化ブロック(CB: Coding Block)と呼ぶこともある。
つまり、符号化単位情報(以下、CU情報と称する)CU〜CUNLは、ツリーブロックTBLKを再帰的に4分木分割して得られる各符号化ノード(符号化単位)に対応する情報である。
また、符号化ツリーのルート(root)は、符号化ツリーブロックCTBに対応付けられる。換言すれば、符号化ツリーブロックCTBは、複数の符号化ノードを再帰的に含む4分木分割の木構造の最上位ノードに対応付けられる。
なお、各符号化ノードのサイズは、当該符号化ノードが直接に属する符号化ノード(すなわち、当該符号化ノードの1階層上位のノードのパーティション)のサイズの縦横とも半分である。
また、符号化ツリーブロックCTBのサイズ、および、各符号化ノードのとり得るサイズは、階層符号化データDATA#CのシーケンスパラメータセットSPSに含まれる、最小符号化ノードのサイズ指定情報、および最大符号化ノードと最小符号化ノードの階層深度の差分に依存する。例えば、最小符号化ノードのサイズが8×8画素であって、最大符号化ノードと最小符号化ノードの階層深度の差分が3である場合、符号化ツリーブロックCTBのサイズが64×64画素であって、符号化ノードのサイズは、4種類のサイズ、すなわち、64×64画素、32×32画素、16×16画素、および、8×8画素の何れかをとり得る。
(CTBヘッダ)
CTBヘッダCTBHには、対象CTBの復号方法を決定するために階層動画像復号装置1が参照する符号化パラメータが含まれる。具体的には、図3の(d)に示すように、対象CTBの各CUへの分割パターンを指定するCTB分割情報SP_CTB、および、量子化ステップの大きさを指定する量子化パラメータ差分Δqp(qp_delta)が含まれる。
CTB分割情報SP_CTBは、CTBを分割するための符号化ツリーを表す情報であり、具体的には、対象CTBに含まれる各CUの形状、サイズ、および、対象CTB内での位置を指定する情報である。
なお、CTB分割情報SP_CTBは、CUの形状やサイズを明示的に含んでいなくてもよい。例えばCTB分割情報SP_TBLKは、対象CTB全体またはCTBの部分領域を四分割するか否かを示すフラグの集合であってもよい。その場合、CTBの形状やサイズを併用することで各CUの形状やサイズを特定できる。
また、量子化パラメータ差分Δqpは、対象CTBにおける量子化パラメータqpと、当該対象CTBの直前に符号化されたCTBにおける量子化パラメータqp’との差分qp−qp’である。
(CUレイヤ)
CUレイヤでは、処理対象のCU(以下、対象CUとも称する)を復号するために階層動画像復号装置1が参照するデータの集合が規定されている。
ここで、CU情報CUに含まれるデータの具体的な内容の説明をする前に、CUに含まれるデータの木構造について説明する。符号化ノードは、予測ツリー(prediction tree;PT)および変換ツリー(transform tree;TT)のルートのノードとなる。予測ツリーおよび変換ツリーについて説明すると次のとおりである。
予測ツリーにおいては、符号化ノードが1または複数の予測ブロックに分割され、各予測ブロックの位置とサイズとが規定される。別の表現でいえば、予測ブロックは、符号化ノードを構成する1または複数の重複しない領域である。また、予測ツリーは、上述の分割により得られた1または複数の予測ブロックを含む。
予測処理は、この予測ブロックごとに行われる。以下、予測の単位である予測ブロックのことを、予測単位(prediction unit;PU)とも称する。
予測ツリーにおける分割(以下、PU分割と略称する)の種類は、大まかにいえば、イントラ予測の場合と、インター予測の場合との2つがある。
イントラ予測の場合、分割方法は、2N×2N(符号化ノードと同一サイズ)と、N×Nとがある。
また、インター予測の場合、分割方法は、2N×2N(符号化ノードと同一サイズ)、2N×N、2N×nU、2N×nD、N×2N、nL×2N、および、nR×2Nなどがある。
また、変換ツリーにおいては、符号化ノードが1または複数の変換ブロックに分割され、各変換ブロックの位置とサイズとが規定される。別の表現でいえば、変換ブロックは、符号化ノードを構成する1または複数の重複しない領域のことである。また、変換ツリーは、上述の分割より得られた1または複数の変換ブロックを含む。
変換ツリーにおける分割には、符号化ノードと同一のサイズの領域を変換ブロックとして割り付けるものと、上述したツリーブロックの分割と同様、再帰的な4分木分割によるものがある。
変換処理は、この変換ブロックごとに行われる。以下、変換の単位である変換ブロックのことを、変換単位(transform unit;TU)とも称する。
(CU情報のデータ構造)
続いて、図3(e)を参照しながらCU情報CUに含まれるデータの具体的な内容について説明する。図3(e)に示すように、CU情報CUは、具体的には、スキップフラグSKIP、予測ツリー情報(以下、PT情報と略称する)PTI、および、変換ツリー情報(以下、TT情報と略称する)TTIを含む。
スキップフラグSKIPは、対象のPUについて、スキップモードが適用されているか否かを示すフラグであり、スキップフラグSKIPの値が1の場合、すなわち、対象CUにスキップモードが適用されている場合、そのCU情報CUにおけるPT情報PTIの一部、および、TT情報TTIは省略される。なお、スキップフラグSKIPは、Iスライスでは省略される。
[PT情報]
PT情報PTIは、CUに含まれる予測ツリー(以下、PTと略称する)に関する情報である。言い換えれば、PT情報PTIは、PTに含まれる1または複数のPUそれぞれに関する情報の集合であり、階層動画像復号装置1により予測画像を生成する際に参照される。PT情報PTIは、図3(e)に示すように、予測タイプ情報PType、および、予測情報PInfoを含んでいる。
予測タイプ情報PTypeは、対象PUについての予測画像生成方法を指定する情報である。ベースレイヤにおいては、イントラ予測を用いるのか、または、インター予測を用いるのかを指定する情報である。
予測情報PInfoは、予測タイプ情報PTypeで指定される予測方法において用いられる予測情報である。ベースレイヤでは、イントラ予測の場合にイントラ予測情報PP_Intraが含まれる。また、インター予測の場合にはインター予測情報PP_Interを含む。
インター予測情報PP_Interは、階層動画像復号装置1が、インター予測によってインター予測画像を生成する際に参照される予測情報を含む。より具体的には、インター予測情報PP_Interは、対象CUの各インターPUへの分割パターンを指定するインターPU分割情報、および、各インターPUについてのインター予測パラメータ(動き補償パラメータ)を含む。インター予測パラメータとしては、例えば、マージフラグ(merge_flag)、マージインデックス(merge_idx)、推定動きベクトルインデックス(mvp_idx)、参照画像インデックス(ref_idx)、インター予測フラグ(inter_pred_flag)、および動きベクトル残差(mvd)を含む。
イントラ予測情報PP_Intraは、階層動画像復号装置1が、イントラ予測によってイントラ予測画像を生成する際に参照される符号化パラメータを含む。より具体的には、イントラ予測情報PP_Intraには、対象CUの各イントラPUへの分割パターンを指定するイントラPU分割情報、および、各イントラPUについてのイントラ予測パラメータが含まれる。イントラ予測パラメータは、各イントラPUについてのイントラ予測方法(予測モード)を指定するためのパラメータである。
ここで、イントラ予測パラメータは、各イントラPUについてのイントラ予測(予測モード)を復元するためのパラメータである。予測モードを復元するためのパラメータには、MPM(Most Probable Mode、以下同様)に関するフラグであるmpm_flag、MPMを選択するためのインデックスであるmpm_idx、および、MPM以外の予測モードを指定するためのインデックスであるrem_idxが含まれる。ここで、MPMとは、対象パーティションで選択される可能性が高い推定予測モードである。例えば、対象パーティションの周辺のパーティションに割り付けられた予測モードに基づいて推定された推定予測モードや、一般的に発生確率の高いDCモードやPlanarモードがMPMに含まれ得る。
また、イントラ予測パラメータは、イントラレイヤ間予測モードを用いるのか否かを指定するフラグintra_layer_pred_flagを更に含む構成とすることもできる。
また、イントラ予測パラメータは、複数種類のイントラレイヤ間予測モードの何れかを指定するためのフラグintra_layer_pred_modeを更に含む構成とすることもできる。
また、以下において、単に“予測モード”と表記する場合、特にことわりのない限り、輝度予測モードのことを指すものとする。色差予測モードについては、“色差予測モード”と表記し、輝度予測モードと区別する。また、予測モードを復元するパラメータには、色差予測モードを指定するためのパラメータであるchroma_modeが含まれる。
なお、mpm_flag、mpm_idx、rem_idx、およびchroma_modeのパラメータの詳細については、後述する。また、mpm_flagおよびrem_idxは、それぞれ、例えば、非特許文献1における“prev_intra_luma_pred_flag”および“rem_intra_luma_pred_mode”に対応している。また、chroma_modeは、“intra_chroma_pred_mode”に対応している。
[TT情報]
TT情報TTIは、CUに含まれる変換ツリー(以下、TTと略称する)に関する情報である。言い換えれば、TT情報TTIは、TTに含まれる1または複数のTUそれぞれに関する情報の集合であり、階層動画像復号装置1により残差データを復号する際に参照される。なお、以下、TUのことをブロックと称することもある。
TT情報TTIは、図3(e)に示すように、対象CUの各変換ブロックへの分割パターンを指定するTT分割情報SP_TT、および、量子化予測残差QD1〜QDNT(NTは、対象CUに含まれるブロックの総数)を含んでいる。
TT分割情報SP_TTは、具体的には、対象CUに含まれる各TUの形状、サイズ、および、対象CU内での位置を決定するための情報である。例えば、TT分割情報SP_TTは、対象となるノードの分割を行うのか否かを示す情報(split_transform_unit_flag)と、その分割の深度を示す情報(trafoDepth)とから実現することができる。
また、例えば、CUのサイズが、64×64の場合、分割により得られる各TUは、32×32画素から4×4画素までのサイズをとり得る。
各量子化予測残差QDは、階層動画像符号化装置2が以下の処理1〜3を、処理対象のブロックである対象ブロックに施すことによって生成した符号化データである。
処理1:符号化対象画像から予測画像を減算した予測残差を周波数変換(例えば、DCT変換(Discrete Cosine Transform)およびDST変換(Discrete Sine Transform)等)する;
処理2:処理1にて得られた変換係数を量子化する;
処理3:処理2にて量子化された変換係数を可変長符号化する;
なお、上述した量子化パラメータqpは、階層動画像符号化装置2が変換係数を量子化する際に用いた量子化ステップQPの大きさを表す(QP=2qp/6)。
(PU分割情報)
PU分割情報によって指定されるPU分割タイプには、対象CUのサイズを2N×2N画素とすると、次の合計8種類のパターンがある。すなわち、2N×2N画素、2N×N画素、N×2N画素、およびN×N画素の4つの対称的分割(symmetric splittings)、並びに、2N×nU画素、2N×nD画素、nL×2N画素、およびnR×2N画素の4つの非対称的分割(asymmetric splittings)である。なお、N=2(mは1以上の任意の整数)を意味している。以下、対象CUを分割して得られる領域のことをパーティションとも称する。
図4(a)〜(h)に、それぞれの分割タイプについて、CUにおけるPU分割の境界の位置を具体的に図示している。
図4(a)は、CUの分割を行わない2N×2NのPU分割タイプを示している。また、図4(b)、(c)、および(d)は、それぞれ、PU分割タイプが、2N×N、2N×nU、および、2N×nDである場合のパーティションの形状について示している。また、図4(e)、(f)、および(g)は、それぞれ、PU分割タイプが、N×2N、nL×2N、および、nR×2Nである場合のパーティションの形状について示している。また、図4(h)は、PU分割タイプが、N×Nである場合のパーティションの形状を示している。
また、図4(a)〜(h)において、各領域に付した番号は、領域の識別番号を示しており、この識別番号順に、領域に対して処理が行われる。すなわち、当該識別番号は、領域のスキャン順を表している。
[インター予測の場合の分割タイプ]
インターPUでは、上記8種類の分割タイプのうち、N×N(図4(h))以外の7種類が定義されている。
また、Nの具体的な値は、当該PUが属するCUのサイズによって規定され、nU、nD、nL、および、nRの具体的な値は、Nの値に応じて定められる。例えば、32×32画素のインターCUは、32×32画素、32×16画素、16×32画素、32×16画素、32×8画素、32×24画素、8×32画素、および、24×32画素のインターPUへ分割できる。
[イントラ予測の場合の分割タイプ]
イントラPUでは、次の2種類の分割パターンが定義されている。対象CUを分割しない、すなわち対象CU自身が1つのPUとして取り扱われる分割パターン2N×2Nと、対象CUを、4つのPUへと対称的に分割するパターンN×Nと、である。
したがって、イントラPUでは、図4に示した例でいえば、(a)および(h)の分割パターンを取ることができる。
例えば、32×32画素のイントラCUは、32×32画素、および、16×16画素のイントラPUへ分割できる。
(拡張レイヤ)
拡張レイヤの符号化データについても、例えば、図3に示すデータ構造とほぼ同様のデータ構造を採用することができる。ただし、拡張レイヤの符号化データでは、以下のとおり、付加的な情報を追加したり、パラメータを省略したりすることができる。
SPSには階層符号化を示す情報が符号化されていてもよい。
また、スライスレイヤでは、空間スケーラビリティ、時間スケーラビリティ、および、SNRスケーラビリティの階層の識別情報(それぞれ、dependency_id、temporal_id、および、quality_id)が符号化されていてもよい。
また、CU情報CUでは、スキップフラグ(skip_flag)、レイヤ間予測フラグ(inter_layer_pred_flag)および予測モードフラグ(pred_mode_flag)が符号化されていてもよい。
また、これらのフラグにより対象CUのCUタイプが、レイヤ内イントラCU、レイヤ間イントラCU、インターCU、スキップCUのいずれであるかが指定されていてもよい。
レイヤ内イントラCUは、ベースレイヤにおけるイントラCUと同様に定義できる。レイヤ内イントラCUでは、レイヤ間予測フラグが“0”に、予測モードフラグが“0”に設定される。
レイヤ間イントラCUは、対象ピクチャと同時刻の参照レイヤのピクチャの復号画像を予測画像生成に用いるCUと定義できる。レイヤ間イントラCUでは、レイヤ間予測フラグが“1”に、予測モードフラグが“0”に設定される。
スキップCUは、上述のHEVC方式の場合と同様に定義できる。例えば、スキップCUでは、スキップフラグに“1”が設定される。
インターCUは、非スキップかつ動き補償(MC;Motion Compensation)を適用するCUと定義されていてもよい。インターCUでは、例えば、スキップフラグに“0”が設定され、予測モードフラグに“1”が設定される。
また、上述のとおり拡張レイヤの符号化データを、下位レイヤの符号化方式と異なる符号化方式により生成しても構わない。すなわち、拡張レイヤの符号化・復号処理は、下位レイヤのコーデックの種類に依存しない。
下位レイヤが、例えば、MPEG−2や、H.264/AVC方式によって符号化されていてもよい。
対象レイヤと参照レイヤとが異なる符号化方式によって符号化されている場合、参照レイヤのパラメータを、対象レイヤの対応するパラメータ、または、類似のパラメータに変換することでレイヤ間における相応の互換性を保つことができる。例えば、MPEG−2や、H.264/AVC方式におけるマクロブロックは、HEVCにおけるCTBに読み替えて解釈することが可能である。
なお、以上に説明したパラメータは、単独で符号化されていてもよいし、複数のパラメータが複合的に符号化されていてもよい。複数のパラメータが複合的に符号化される場合は、そのパラメータの値の組み合わせに対してインデックスが割り当てられ、割り当てられた当該インデックスが符号化される。また、パラメータが、別のパラメータや、復号済みの情報から導出可能であれば、当該パラメータの符号化を省略することができる。
〔階層動画像復号装置〕
以下では、本実施形態に係る階層動画像復号装置1の構成について、図5〜図16を参照して説明する。
(階層動画像復号装置の構成)
図5を用いて、階層動画像復号装置1の概略的構成について説明すると次のとおりである。図5は、階層動画像復号装置1の概略的構成について示した機能ブロック図である。階層動画像復号装置1は、階層動画像符号化装置2から供給される階層符号化データDATAを復号して、対象レイヤの復号画像POUT#Tを生成する。
図5に示すように階層動画像復号装置1は、NAL逆多重化部11、可変長復号部12(可変長復号手段)、予測パラメータ復元部14、テクスチャ復元部15(予測画像生成手段)、およびベース復号部16を備える。
NAL逆多重化部11は、NAL(Network Abstraction Layer)におけるNALユニット単位で伝送される階層符号化データDATAを逆多重化する。
NALは、VCL(Video Coding Layer)と、符号化データを伝送・蓄積する下位システムとの間における通信を抽象化するために設けられる層である。
VCLは、動画像符号化処理を行う層のことであり、VCLにおいて符号化が行われる。一方、ここでいう、下位システムは、H.264/AVCおよびHEVCのファイルフォーマットや、MPEG−2システムに対応する。以下に示す例では、下位システムは、対象レイヤおよび参照レイヤにおける復号処理に対応する。
なお、NALでは、VCLで生成されたビットストリームが、NALユニットという単位で区切られて、宛先となる下位システムへ伝送される。NALユニットには、VCLで符号化された符号化データ、および、当該符号化データが宛先の下位システムに適切に届けられるためのヘッダが含まれる。また、各階層における符号化データは、NALユニット格納されることでNAL多重化されて階層動画像復号装置1に伝送される。
NAL逆多重化部11は、階層符号化データDATAを逆多重化して、対象レイヤ符号化データDATA#Tおよび参照レイヤ符号化データDATA#Rを取り出す。また、NAL逆多重化部11は、対象レイヤ符号化データDATA#Tを可変長復号部12に供給するとともに、参照レイヤ符号化データDATA#Rをベース復号部16に供給する。
可変長復号部12は、対象レイヤ符号化データDATA#Tに含まれるバイナリから各種のシンタックス値を復号する。復号されたシンタックス値は、分類されて出力される。シンタックス値の分類には、図3(e)のPTIに相当する予測情報、図3(e)のTTIに相当する変換係数情報が含まれる。
また、可変長復号部12は、CU情報を符号化データDATA#Tから復号する。CU情報には、CUの形状、サイズ、位置を特定するための情報が含まれる。
可変長復号部12は、復号した予測情報およびCU情報を予測パラメータ復元部14に供給する。
また、可変長復号部12は、復号した変換係数情報およびCU情報をテクスチャ復元部15に供給する。
可変長復号部12におけるイントラ予測に係る予測情報の復号処理について図6と図7を参照して説明する。
図6は、可変長復号部12がCU単位の予測情報復号時に参照するシンタックス表の一部を示す。可変長復号部12は、まず、非Iスライスである場合(slice_type!=Iの場合)、CU予測モードフラグpred_mode_flagを復号する。pred_mode_flagが0の場合、対象CUは「イントラCU」であり、対象CUのCU予測モード(PredMode[x0][y0])の値はMODE_INTRAに設定される。pred_mode_flagが1の場合、対象CUは「インターCU」であり、対象CUのCU予測モードの値はMODE_INTERに設定される。なお、Iスライスでは、PredMode[x0][y0]は初期値であるMODE_INTRAに設定される。続いて、対象CUがイントラCUの場合(PredMode[x0][y0]==MODE_IONTRA)、レイヤ間予測フラグinter_layer_pred_flagを復号する。なお、対象CUがイントラCUの場合、inter_layer_pred_flagは復号されず、初期値である0に設定される。
なお、inter_layer_pred_flagはCABAC(Context Adaptive Binary Arithmatic Coding;コンテキスト適応算術符号化)により復号されてもよい。CABACによる復号には単一のコンテキストを用いる。具体的には、inter_layer_pred_flagに単一のコンテキストインデックスを割り当て、当該コンテキストインデックスに関連付けられて記録および更新されている確立状態変数の値に基づいて算術復号を行うことでinter_layer_pred_flagを復号する。なお、スライスタイプに応じて異なるコンテキストインデックスを割り当てるようにしても構わない。
図7は、可変長復号部12が、イントラCU内のPU単位の予測情報復号時に参照するシンタックス表の一部を示す。可変長復号部12は、MPMフラグprev_intra_luma_pred_flag(以下mpm_flagとも呼ぶ)を復号する。続いて、prev_intra_luma_pred_flagの値が1の場合、MPMインデックスmpm_idxを復号する。それ以外(mpm_flagの値が0)の場合、残余予測モードrem_intra_luma_pred_mode(以下rem_idxとも呼ぶ)を復号する。
ベース復号部16は、参照レイヤ符号化データDATA#Rから、対象レイヤに対応する復号画像を復号する際に参照される参照レイヤの復号画像であるベース復号画像を復号する。ベース復号部16は、復号したベース復号画像をテクスチャ復元部15に供給する。
なお、ベース復号部16は、参照レイヤ符号化データ#Rから、参照レイヤにおける予測パラメータに相当するベース予測パラメータを復号して予測パラメータ復元部14に供給してもよい。
予測パラメータ復元部14は、CU情報と予測情報を用いて、予測パラメータを復元する。予測パラメータ復元部14は、復元した予測パラメータを、テクスチャ復元部15に供給する。なお、予測パラメータ復元部14は、予測パラメータを復元する際に、テクスチャ復元部15が備えるフレームメモリ155(後述)に格納された動き情報を参照することができる。
テクスチャ復元部15は、CU情報、変換係数情報、ベース復号画像および予測パラメータを用いて、復号画像POUT#Tを生成し、外部に出力する。なお、テクスチャ復元部15では、復元された復号画像に関する情報が、内部に備えるフレームメモリ155(後述)に格納される。
以下において、テクスチャ復元部14、予測パラメータ復元部15、およびベース復号部16それぞれの詳細について説明する。
(テクスチャ復元部)
図8を用いて、テクスチャ復元部15の詳細構成について説明する。図8は、テクスチャ復元部15の構成について例示した機能ブロック図である。
図8に示すように、テクスチャ復元部15は、逆直交変換・逆量子化部151、テクスチャ予測部152、加算器153、ループフィルタ部154、フレームメモリ155を備える。
逆直交変換・逆量子化部151は、(1)可変長復号部12から供給される変換係数情報に含まれる量子化予測残差QDを逆量子化し、(2)逆量子化によって得られたDCT係数を逆直交変換(例えば、DCT(Discrete Cosine Transform)変換)し、(3)逆直交変換によって得られた予測残差Dを加算器153に供給する。なお、予測残差Dの生成は、ブロック(変換単位)を単位として行われる。
テクスチャ予測部152は、予測パラメータに応じて、ベース復号情報に含まれるベース復号画像(ベース参照画像とも呼ぶ)またはフレームメモリに格納されている復号済みの復号画像を参照し、予測画像を生成する。
テクスチャ予測部152は、より詳細には、インター予測部152T、レイヤ内イントラ予測部152S(レイヤ内イントラ予測手段)、レイヤ間イントラ予測部152B(レイヤ間イントラ予測手段)、および、ハイブリッド予測部152H(ハイブリッド予測手段)を備える。
テクスチャ予測部152は、インター予測部152T、レイヤ内イントラ予測部152S、レイヤ間イントラ予測部152B、または、ハイブリッド予測部152Hが生成した予測画像を加算器153に供給する。
インター予測部152Tは、各PUの予測画像をインター予測により生成する。具体的には、予測パラメータに含まれる動き情報を用いた動き補償予測により、参照画像から予測画像を生成する。
レイヤ内イントラ予測部152Sは、各イントラ予測パーティションに関する予測画像をレイヤ内イントラ予測により生成する。具体的には、レイヤ内イントラ予測情報復元部144Sから予測パラメータとして供給される空間予測モードを用いて、対象PUの復号済周辺画素値を参照する空間予測により、予測画像を生成する。
空間予測モードについて、図10に基づいて、定義の一例を説明する。図10は、空間予測モードの定義の一例を示す。同図に示す例においては、36種類の予測モードが定義されており、それぞれの予測モードは、「0」〜「35」の番号(IntraPredModeまたはIntraPredModeCの各値であり、イントラ予測モードインデックスとも呼称することがある)により特定される。また、図11に示すように、各予測モードには次の名称が割り当てられている。すなわち、「0」は、“Intra Planar(プラナー予測モード、平面予測モード)”であり、「1」は、“Intra DC(イントラDC予測モード)”であり、「2」〜「34」は、“Intra Angular(方向予測)”であり、「35」は、“Intra From Luma”である。
「35」は、色差予測モード固有のものであり、輝度の予測に基づいて色差の予測を行うモードである。言い換えれば、色差予測モード「35」は、輝度画素値と色差画素値との相関を利用した予測モードである。色差予測モード「35」はLMモードとも称する。予測モード数(intraPredModeNum)は、対象ブロックのサイズによらず「36」である。
レイヤ内イントラ予測部152Sにおいて、対象PUのレイヤ内イントラ予測画像の生成は、以下のS101〜S106cの手順で実行される。
(S101)対象PUに隣接する領域の局所復号画像を参照して、予測画像生成に用いる参照領域を設定する。例えば、図12に示すように、対象PU(CURR_PU)の左側隣接領域(REFREG_L)上の画素と、対象PUの上側隣接領域(REFREG_U)上の画素を合わせ得て参照領域(REFREG)とする。
(S102)局所復号画像が存在しない、または、利用できない参照領域上の画素の画素値を、近傍の局所復号画像の画素値のコピーまたは、既定の値(例えば127)を代入により設定する。
(S103)参照領域上の画素値に対してフィルタ(参照画素フィルタ)を適用する。参照画素フィルタには、低域通過フィルタ(例えば、[1、2、1]のフィルタ係数により表現されるフィルタ)が利用できる。また、参照画素フィルタは、空間予測モードに応じて適用有無を切り替えてもよい。また、空間予測モードに応じて異なるフィルタ係数を用いてもよい。
(S104)空間予測モードの種類に応じて、S105a〜S105cのいずれかを選択して、レイヤ内予測画像を生成する。
(S105a)空間予測モードが方向予測の場合、予測画像の各画素値を、予測方向の示す位置の参照領域上の画素値を参照して生成する。なお、空間予測モードに対応する予測方向は、図10で説明した通りとなる。
(S105b)空間予測モードがイントラDC予測モードの場合、参照領域上の画素値の平均値を計算して参照領域のDC値を導出する。予測画像の各画素の値は、導出したDC値に設定する。
(S106c)空間予測モードがプラナー予測モードの場合、予測画像の各画素値は、当該画素の上方に位置する参照領域の画素値と、当該画素の左方に位置する参照画素の画素値との距離を考慮した加重平均により導出される。
レイヤ間イントラ予測部152Bは、各PUの予測画像をレイヤ間イントラ予測により生成する。具体的には、レイヤ間イントラ予測情報復元部144Bから予測パラメータとして供給されるレイヤ間予測モードに基づいて、ベース復号画像を参照して予測画像を生成する。
図13を参照して、ベースレイヤの復号画像(ベース復号画像)を用いたレイヤ間イントラ予測について説明する。図13は、ベースレイヤの復号画像を用いたレイヤ間イントラ予測を概略的に示す模式図である。
図13に示すように、レイヤ間イントラ予測では、拡張レイヤの対象ブロック(復号される予測ブロックのことを指す(以下同様))のイントラ予測画像が、ベースレイヤにおいて、時間的に該対象ブロックと同時刻に位置するブロックであって、空間的に該対象ブロックに対応する位置に配置されたブロックである参照ブロック(参照される予測ブロックのことを指す(以下同様))の復号画像に基づいて生成される。
なお、対象ブロックと、参照ブロックとで、画素数が異なる場合はアップサンプルを行う構成とすればよい。また、必要に応じて、参照ブロックの復号画像に対してフィルタリング(サンプル適応オフセット(Sample Adaptive Offset;SAO)、適応ループフィルタ(Adaptive Loop Filter;ALF)、エッジ強調、ノイズ除去、インタレース解除など)を適用したベース復号画像を参照してイントラ予測画像を生成する構成としてもよい。
ハイブリッド予測部152Hは、各イントラ予測パーティションの予測画像をハイブリッド予測により生成する。ハイブリッド予測は、レイヤ内イントラ予測部152Sで生成されるレイヤ内イントラ予測画像を、ベース参照画像の画素値に基づいて修正する。ハイブリッド予測部152Hによるハイブリッド予測詳細については後述する。
加算器153は、テクスチャ予測部152から供給された予測画像と、逆直交変換・逆量子化部151から供給された予測残差Dとを加算することによって復号画像を生成する。
ループフィルタ部154は、加算器153から供給される復号画像に対し、デブロッキング処理や、適応フィルタパラメータによるフィルタ処理を施すものである。
フレームメモリ155は、ループフィルタ部154によるフィルタ済み復号画像を格納する。
(ベース復号部)
図9を用いて、ベース復号部16の詳細構成について説明する。図9は、ベース復号部16の構成について例示した機能ブロック図である。
図9に示すように、ベース復号部16は、可変長復号部161、ベース予測パラメータ復元部162、ベース変換係数復元部163、およびベーステクスチャ復元部164を備える。
可変長復号部161は、参照レイヤ符号化データDATA#Rに含まれるバイナリから各種のシンタックス値を復号する。
具体的には、可変長復号部161は、予測情報および変換係数情報を符号化データDATA#Rから復号する。可変長復号部161が復号する予測情報および変換係数のシンタックスは、可変長復号部12と同様であるのでここではその詳細な説明を省略する。
可変長復号部161は、復号した予測情報をベース予測パラメータ復元部162に供給するとともに、復号した変換係数情報をベース変換係数復元部163に供給する。
ベース予測パラメータ復元部162は、可変長復号部161から供給される予測情報に基づいて、ベース予測パラメータを復元する。ベース予測パラメータ復元部162が、ベース予測パラメータを復元する方法については、予測パラメータ復元部14と同様であるので、ここではその詳細な説明を省略する。ベース予測パラメータ復元部162は、復元したベース予測パラメータを、ベーステクスチャ復元部164に供給する。
ベース変換係数復元部163は、可変長復号部161から供給される変換係数情報に基づいて、変換係数を復元する。ベース変換係数復元部163が変換係数を復元する方法については、逆直交変換・逆量子化部151と同様であるので、ここではその詳細な説明を省略する。ベース変換係数復元部163は、復元したベース変換係数を、ベーステクスチャ復元部164に供給する。
ベーステクスチャ復元部164は、ベース予測パラメータ復元部162から供給されるベース予測パラメータと、ベース変換係数復元部163から供給されるベース変換係数とを用いて、復号画像を生成する。具体的には、ベーステクスチャ復元部164は、ベース予測パラメータに基づき、テクスチャ予測部152と同様のテクスチャ予測を行って、予測画像を生成する。また、ベーステクスチャ復元部164は、ベース変換係数に基づいて予測残差を生成し、生成した予測残差と、テクスチャ予測により生成した予測画像とを加算することでベース復号画像を生成する。
なお、ベーステクスチャ復元部164は、ベース復号画像に対して、ループフィルタ部154と同様のフィルタ処理を施してもよい。また、ベーステクスチャ復元部164は、復号済みのベース復号画像を格納するためのフレームメモリを備えていてもよく、テクスチャ予測においてフレームメモリに格納されている復号済みのベース復号画像を参照してもよい。
(予測パラメータ復元部)
図15を用いて、予測パラメータ復元部14の詳細構成について説明する。図15は、予測パラメータ復元部14の構成について例示した機能ブロック図である。
図15に示すように、予測パラメータ復元部14は、イントラインター選択部141、イントラ予測選択部142、イントラ予測モード復元部143、イントラ情報復元部144、および、動き情報復元部145を備える。
イントラ情報復元部144は、内部にハイブリッド予測情報復元部144H、レイヤ内イントラ予測情報復元部144S、および、レイヤ間イントラ予測情報復元部144Bをさらに含む
イントラインター選択部141は、対象CUがイントラCUかインターCUかを入力される予測情報に含まれるpred_mode_flagの値から判定する。pred_mode_flagの値が0の場合、対象CUはイントラCUと判定される。pred_mode_flagの値が1の場合、対象CUはインターCUと判定される。対象CUがイントラCUの場合、イントラCUの予測パラメータ復元に係る各構成要素、ここでは、イントラ予測選択部142、イントラ予測モード復元部143、および、イントラ情報復元部144にそれぞれ予測情報を出力する。対象CUがインターCUの場合、インターCUの予測パラメータ復元に係る各構成要素、ここでは、動き情報復元部145に予測情報を出力する。
イントラ予測選択部142は、対象CU、または、対象CUを構成する各PUに適用されるイントラ予測の種類を、予測情報に含まれるシンタックス値に基づいて判定して、判定結果をイントラ情報復元部144に出力する。
上記判定は、図16に基づいて実行される。図16は、シンタックス値inter_layer_pred_flagの値と空間予測モードの組み合わせから、予測タイプを一意に特定する表である。図16ではinter_layer_pred_flagの値が0の場合、イントラ予測モードの種類に関わらず、対象CUおよび対象PUの予測タイプを「レイヤ内イントラ予測」と判定する。inter_layer_pred_flagの値が1、かつ、イントラ予測モードが1(イントラ予測モードがDC予測を示す)場合、対象PUの予測タイプを「レイヤ間イントラ予測」と判定する。inter_layer_pred_flagの値が1、かつ、イントラ予測モードが0、2〜34のいずれかの場合(イントラ予測モードが非DC予測を示す場合)、対象PUの予測タイプを「ハイブリッド予測」と判定する。
イントラ予測モード復元部143は、入力される予測情報に基づいて、対象CUを構成する各PUの空間予測モード(イントラ予測モードとも呼ぶ)を復元して、イントラ情報復元部144(ハイブリッド予測情報復元部144H、レイヤ内イントラ予測情報復元部144S)に出力する。
イントラ予測モード復元部143における対象PUの空間予測モード(IntraPredMode[xB][yB])復元処理の詳細を説明する。
イントラ予測モード復元部143は、予測情報に含まれる対象PUの空間予測モードに係るシンタックス、mpm_flag、mpm_idx、rem_idxの各値に基づいて、対象PUの空間予測モードを復元する。空間予測モード復元の手順は、S201〜S202に示した通りである。
(S201)対象PUの周辺PUの空間予測モード、つまり、対象PUの左に隣接するPU、および、対象PUの上に隣接するPUの空間予測モードに基づいて、3つのMPM候補を含むMPM候補リストを生成する。次にS202を実行する。
(S202)mpm_flagの値が1の場合、S203を実行する。そうでなければ(mpm_flagの値が0の場合)、S204を実行する。
(S203)mpm_idxが示すMPM候補をMPM候補リストから選択して、対象PUの空間予測モードとして処理を終了する。
(S204)mpm_flagの値が0の場合、残余予測モードリストを生成してS205を実行する。残余予測モードリストは、対象PUで選択可能な空間予測モードのうち、MPM候補リストに含まれる空間予測モードを除外して生成される空間予測モードのリストである。
(S205)rem_idxが示す予測モードを残余予測モードリストから選択して対象PUの空間予測モードとして処理を終了する。
イントラ情報復元部144は、入力されたPU予測タイプに対応する予測パラメータを導出して、外部に出力する。PU予測タイプがハイブリッド予測の場合、ハイブリッド予測情報復元部144Hにより予測パラメータを導出する。PU予測タイプがレイヤ内イントラ予測の場合、レイヤ内イントラ予測情報復元部144Sにより予測パラメータを導出する。PU予測タイプがレイヤ間イントラ予測の場合、レイヤ間イントラ予測復元部144Bにより予測パラメータを導出する。
ハイブリッド予測情報復元部144Hは、「ハイブリッド予測」に設定された対象PUの予測タイプと、入力された空間予測モードを合わせて対象PUの予測パラメータとして出力する。
レイヤ内イントラ予測情報復元部144Sは、「レイヤ内イントラ予測」に設定された対象PUの予測タイプを対象PUの予測パラメータと、入力された空間予測モードを合わせて対象PUの予測パラメータとしてとして出力する。
レイヤ間イントラ予測情報復元部144Bは、「レイヤ間イントラ予測」に設定された対象PUの予測タイプを予測パラメータとして出力する。なお、レイヤ内イントラ予測に2以上の予測方法が含まれる場合は、予測情報から何れの予測方法を用いるかの情報を読出し、対象PUの予測パラメータに追加して出力してもよい。
動き情報復元部145は、入力された予測情報から動き補償パラメータを復元するとともに、「動き補償予測」に設定された対象PUの予測タイプを対象PUの予測パラメータとして出力する。
ここで、動き補償パラメータは、動き補償予測に用いるパラメータである。動き補償パラメータには、例えば、動きベクトル(mv)、インター予測フラグ(inter_pred_flag)および、参照画像インデックス(refIdx)が含まれる。
<<ハイブリッド予測>
以下では、ハイブリッド予測部152Hの詳細を説明する。
前述の通り、ハイブリッド予測部152Hは、対象PUの予測画像をハイブリッド予測により生成する。ハイブリッド予測は、概略的には、レイヤ内イントラ予測部152Sで生成されるレイヤ内イントラ予測画像を、ベース参照画像の画素値に基づいて修正する。
ハイブリッド予測部152Hは、テクスチャ予測部152に入力される予測パラメータが、対象PUの予測タイプがハイブリッド予測であることを示す場合に起動される。その際、予測パラメータに含まれる空間予測モードに基づいてレイヤ内イントラ予測部152Sで生成された予測画像(レイヤ内イントラ予測画像)がハイブリッド予測部152Hへ入力される。また、対象PUの位置に対応するベース復号画像(ベース参照画像)が入力される。ハイブリッド予測部152Hは、入力されるレイヤ内イントラ予測画像とベース参照画像に基づいてハイブリッド予測画像を生成して、対象PUの予測画像として出力する。
図1を参照してハイブリッド予測部152Hの詳細構成を説明する。図1は、ハイブリッド予測部152Hの概略的構成を示した機能ブロック図である。ハイブリッド予測部152Hは、補正単位分割部152H1B、補正単位分割部152H1E、低周波成分抽出部152H2B、低周波成分抽出部152H2E、加算器152H3、および、加算器152H4を備える。
補正単位分割部152H1Bと補正単位分割部152H1Eは、入力される画像上の対象PUに対応する領域(PU対応領域)を1以上の補正単位に分割する。PU対応領域に対応する画像に、当該領域の補正単位分割を示す情報(補正分割情報)を付加して出力する。
なお、補正単位分割部152H1Bは、入力された対象PUに対応するベース復号画像を補正単位に分割する。一方、補正単位分割部152H1Eは、入力された対象PUに対応する空間予測画像を補正単位に分割する。本実施形態では、両者は同一の機能を有するとし、補正単位分割部152H1(補正単位分割手段)と総称する。また、補正単位分割部152H1に入力される画像(レイヤ内イントラ予測画像、ベース参照画像)を分割対象画像と総称し、出力を分割後画像と総称する。
補正単位分割部152H1は、分割対象画像を4×4画素から構成される補正単位に分割する。例えば、対象PUのサイズが32×32画素である場合、32×32画素の分割対象画像は、8×8個の補正単位(各補正単位は4×4画素)に分割される。
低周波成分抽出部152H2Bと低周波成分抽出部152H2Eは、入力される画像のPU対応領域を、同じく入力される補正単位情報に基づいて分割して得られる各補正単位毎に低周波成分を抽出する。各補正単位から抽出した低周波成分から、対象PU単位の画像を構成して低周波画像として出力する。本実施形態では、低周波成分抽出部152H2Bと低周波成分抽出部152H2Eは同一の機能を有するとして、両者を低周波成分抽出部152H2(低周波成分抽出手段)と総称する。
レイヤ内イントラ予測画像を補正単位分割部152H1Eと低周波成分抽出部152H2Eに順次入力して得られる低周波画像をレイヤ内イントラ低周波画像と呼ぶ。また、ベース参照画像を補正単位分割部152H1Bと低周波成分抽出部152H2Bに順次入力して得られる低周波画像をベース参照低周波画像と呼ぶ。
なお、補正単位における低周波成分の抽出は、例えば、補正単位の画素値の平均を導出する処理である。言い換えると、補正単位のDC成分を抽出する低周波成分としてもよい。この場合、低周波成分抽出部が出力する低周波画像の各画素値は、当該画素位置を含む補正単位の画素値平均となる。
なお、DC成分以外の低周波成分を抽出してもよい。例えば、次のS301〜S303の手順で低周波画像を生成してもよい。
(S301)補正単位毎に周波数変換を適用して補正単位変換係数を導出する。
(S302)補正単位変換係数のうち、高周波成分に相当する変換係数を0に置き換えることで、補正単位低周波変換係数を導出する。
(S303)補正単位低周波変換係数に逆周波数変換を適用して補正単位の低周波画像とする。
上記周波数変換としては、例えば、DCT変換、DST変換、アダマール変換、KLT等の直交変換を用いることができる。
加算記152H3は、入力されるレイヤ内イントラ予測画像から、入力されるレイヤ内イントラ予測低周波画像を引いてレイヤ内イントラ予測高周波画像として出力する。
加算記152H4は、入力されるレイヤ内イントラ予測高周波画像と、入力されるベース参照低周波画像を加算してハイブリッド予測画像として出力する。
次に、ハイブリッド予測部152Hにおける予測画像生成処理の手順(S401〜S406)を説明する。ここでは、対象PUに対するレイヤ内イントラ予測画像とベース参照画像を入力として、対象PUのハイブリッド予測画像をハイブリッド予測部152Hの各構成要素を用いて導出する処理である。
(S401)補正単位分割部152H1Eは、入力される空間予測画像を補正単位に分割し、空間予測画像と分割情報を合わせて低周波成分抽出部152H2Eに出力する。
(S402)低周波成分抽出部152H2Eは、入力された分割情報に基づいて空間予測画像を分割し、得られる分割単位毎に空間予測画像の低周波成分を抽出して、レイヤ内イントラ予測低周波画像を生成して、加算器152H3に出力する。
(S403)加算器152H3は、入力される空間予測画像から、低周波成分抽出部152H2Eから入力される空間予測低周波画像を減算して、空間予測高周画像を生成して、加算記152H4へ入力する。
(S404)補正単位分割部152H1Bは、入力されたベース参照画像を補正単位に分割し、ベース参照画像と分割情報を合わせて低周波成分抽出部152H2Bへ出力する。
(S405)低周波成分抽出部152H2Bは、入力された分割情報に基づいてベース参照画像を分割し、得られる分割単位毎にベース参照画像の低周波成分を抽出して、ベース参照低周波画像を生成して、加算器152H4に出力する。
(S406)加算器152H4は、加算器152H3から入力されたレイヤ内イントラ予測高周波画像と、低周波成分抽出部152H2Bから入力された参照レイヤ低周波画像とを加算してハイブリッド予測画像を生成して、対象PUの予測画像として外部に出力する。
なお、上記のハイブリッド予測部152Hでは、まず、レイヤ内イントラ予測低周波画像をレイヤ内イントラ予測画像から減算し、その後にベース参照低周波画像を加算することでハイブリッド予測画像を生成することを示したが、加算や減算の順序を変えてもよいし、また、途中の高周波画像や低周波画像に対して画素値の範囲を制限するクリップ処理を設けていてもよい。例えば、まず、ベース参照低周波画像からレイヤ内イントラ予測低周波画像を減算し、得られた差分低周波画像をレイヤ内イントラ予測画像に加算することでハイブリッド予測画像を生成してもよい。
上記ハイブリッド予測画像の導出手順によれば、対象PUにおけるレイヤ内イントラ予測画像(空間予測画像)を複数の補正単位に分割し、補正単位毎に空間予測画像の低周波成分を、ベース参照画像の低周波成分に置き換えることができる。言い換えると、補正単位毎に、空間予測画像の高周波成分と、ベース参照画像の低周波成分とを組み合わせたハイブリッド予測画像が生成できる。ハイブリッド予測画像は、空間予測画像や参照レイヤ画像よりも高精度の(入力画像に類似の)予測画像となる可能性が高い。したがって、ハイブリッド予測画像を予測画像として用いることで、予測残差の符号量を減らして、動画像符号化データの符号量を削減できる。
ここで、ハイブリッド予測画像が、高精度の予測画像となる理由を説明する。
一般に、対象PUにおける高周波成分の予測には、対象レイヤの局所復号画像を用いて生成される空間予測画像の高周波成分を用いる方が、ベース参照画像の画素値を用いて生成されるレイヤ間イントラ予測画像の高周波成分を用いる場合に比べて、入力画像の高周波成分に類似の成分が得られるため好適な場合が多い。
これは、対象レイヤの局所復号画像には、ベース参照画像に較べてより多くの高周波成分が含まれているためである。言い換えると、ベース参照画像の生成に用いる参照レイヤが対象レイヤに対する下位レイヤであるためである。例えば、空間スケーラビリティを用いる場合、参照レイヤの解像度は対象レイヤの解像度に較べて低い。したがって、ベース参照画像は参照レイヤの局所復号画像にアップサンプルを適用して生成されるため、高周波成分が十分に含まれていない。
また、一般に、対象PUにおける低周波成分の予測には、ベース参照画像の画素値を用いて生成されるレイヤ間イントラ予測画像の低周波成分を用いる方が、対象レイヤの局所復号画像を用いて生成される空間予測画像の低周波成分を用いる場合に比べて、入力画像の低周波成分に類似の成分が得られて好適な場合が多い。
これは、対象レイヤの局所復号画像を用いる場合とは異なり、参照レイヤの局所復号画像を用いる場合は、対象PUと空間内の同一位置であり、かつ、時間的に同一時刻の情報を利用できるためである。対象レイヤの局所復号画像を用いて生成される空間予測画像と、参照レイヤの局所復号画像を用いて生成されるレイヤ間イントラ予測画像とは、共に低周波成分を有している。しかし、前述の通り空間内の同一位置、かつ、時間的に同一時刻の情報を利用できるという利点により、レイヤ間イントラ予測画像の低周波成分の方が正確である可能性が高い。
(動画像復号装置1の効果)
以上説明した本実施形態に係る動画像復号装置1は、空間予測画像の高周波成分と、ベース参照画像の低周波成分を組み合わせてハイブリッド予測画像を生成するハイブリッド予測部を備えている。したがって、従来より、動画像復号装置1は、ハイブリッド予測画像を用いることで生成された少ない符号量の符号化データを復号して、復号画像を再生できる。
<付記事項1:補正単位のサイズ>
ハイブリッド予測部152Hの説明では、ベース参照画像の低周波成分を用いた補正処理について、補正単位のサイズを4×4画素とする例を記載した。この例では、4×4画素の予測単位を用いる場合には、予測単位と同一サイズの補正単位を用いる。一方で、予測単位のサイズが8×8画素以上の場合に、予測単位より小さい補正単位を用いている。この例に示すように、補正単位のサイズは、予測単位のサイズが一定より大きい場合(予測単位のサイズが4×4より大きい場合)には、予測単位よりも小さい所定のサイズの補正単位(4×4画素の補正単位)を用いることが好ましい。
特定の低周波成分に係る空間予測画像の誤差を補償する方法は、ベース参照画像の低周波性成分を用いた補正処理の他に、予測残差の変換係数として復号した値の利用がある。一般に、大きい予測単位が適用されるCUでは、大きい変換ブロックが適用される可能性が高い。例えば、予測単位と同サイズの変換ブロックが設定される可能性が高い。その場合、予測単位と同サイズの範囲の低周波成分の補正は、予測残差の変換係数を復号することで比較的少ない符号量の増加で実現できる。一方、予測単位よりも小さい単位での低周波成分の補正は、予測残差の変換係数による補正では実現できない。そこで、ベース参照画像の低周波成分による補正を予測単位よりも小さい単位で実行することで、従来実現不可能であった単位で低周波成分を補正できるため、予測残差の符号量を削減できる。
上記の例は次のように言い換えられる。すなわち、最小の予測単位よりも大きい予測単位が用いられる場合、最小の予測単位と等しいサイズの補正単位で補正処理を行うことでハイブリッド予測画像を生成してもよい。
また、上記の例では、予測単位のサイズに関わらず共通の補正単位のサイズを用いている。それにより、ハードウェアまたはソフトウェアによる補正処理の実行において、予測単位のサイズに関わらず共通のモジュールを利用できるため、復号装置の実装が簡略化できるという効果を奏する。
一方で、予測単位のサイズに応じて異なる補正単位を用いる構成が有効である場合もある。例えば、大きい予測単位における補正単位を、小さい予測単位における補正単位以上のサイズとする構成が好ましい。大きい予測単位ほど、低周波成分を補正するためにより大きい補正単位が必要となるため、上記のような構成をとることで、実装の複雑度は上昇するが、より好適な補正単位を選択できる可能性が高まるという効果を奏する。
なお、上記のような予測単位よりも小さい単位での補正は、低周波成分の補正として、DC成分による補正を用いる時に特に好適である。補正単位が予測単位に比べて小さい場合、補正単位におけるDC成分を除く低周波成分は、予測単位では比較的高周波成分となる場合がある。そこでDC成分のみを用いて補正を行うことで、より好適な補正を行える可能性を高めることができ、それにより符号化効率を向上できる。
<変形例1:ハイブリッド予測の条件付適用>
本実施形態では、全てのイントラCUにおいてハイブリッド予測を選択可能であるとして説明したが、それに限らない。特定の条件を満たすイントラCUにおいて、ハイブリッド予測を選択しないようにしてもよい。具体的には、CUサイズが所定のサイズ(例えば32×32)以上のイントラCUにおいて、レイヤ内イントラ予測、及び、レイヤ間イントラ予測を選択可能とし、ハイブリッド予測を選択不可とする構成を用いてもよい。ハイブリッド予測を選択不可とする場合、図6で復号されるinter_layer_pred_flagが1である場合、図7で説明した空間予測モードに係るシンタックス(prev_intra_luma_pred_flag、mpm_idx、および、rem_intra_luma_pred_mode)の復号を省略できる。
ハイブリッド予測は、小さい予測単位に対してより有効である。そのため、入力画像によっては、大きい予測単位でハイブリッド予測を選択不可とすることで、予測情報の符号量が低減できるという効果を奏する。
<変形例2:非正方形の補正単位>
予測単位を複数の正方形の補正単位に分割して補正処理を行う例を記載したが、それに限らない。非正方形の補正単位、例えば横長矩形、または、縦長矩形の補正単位を用いてもよい。特に、垂直方向のエッジが多く含まれる入力画像では、縦長矩形の補正単位を用いることが好ましい。これは、エッジと垂直な方向に補正単位を設定した場合、エッジの影響により補正に適さない低周波成分が検出される可能性が高いためである。エッジと平行な方向に長い矩形の補正単位を設定することで、補正に適した低周波成分を検出できる可能性が高まるため、予測に好適なハイブリッド予測画像が生成できる可能性を高められる。それにより、予測残差の符号量を削減して符号化効率を高められるという効果を奏する。
<変形例3:空間予測モードに応じた補正形状選択>
補正単位の形状を、対象CUまたは対象PUに係る予測情報に基づいて適応的に選択する構成を用いてもよい。例えば、対象PUの空間予測モードに応じて、補正単位の形状を選択する構成としてもよい。具体例として、16×16画素のCUにおいて、4×4画素、8×2画素、2×8画素の補正単位から選択可能である場合に、以下のS501〜S503に示した手順で補正単位の形状を選択してもよい。
(S501)空間予測モードが垂直方向に近い場合、縦長矩形(8×2画素)の補正単位を選択する。
(S502)それ以外の場合であって、空間予測モードが水平方向に近い場合、横長矩形(2×8画素)の補正単位を選択する。
(S503)それ以外の場合、正方形(4×4画素)の補正単位を選択する。
ここで、空間予測モードが垂直方向に近い場合とは、例えば、図10の空間予測モード定義において、24〜28に対応する方向の空間予測モードである場合である。空間予測モードが垂直方向に近い場合とは、例えば、図10の空間予測モード定義において、8〜12に対応する方向の空間予測モードである場合である。
<変形例4:インター予測とのハイブリッド予測>
本実施形態では、ハイブリッド予測部152Hは、ベース参照画像の低周波成分を用いて、レイヤ内イントラ予測の予測画像を補正する例を示した。しかしながら、補正対象の予測画像は、レイヤ内イントラ予測に限らず、ベース参照画像に較べて高周波成分を多く含む他の予測画像を用いてもよい。例えば、インター予測画像を用いてもよい。その場合、図8に示したテクスチャ復元部の構成において、ハイブリッド予測部152Hへレイヤ内イントラ予測部152Sから出力されるレイヤ内イントラ予測画像を入力する代わりに、インター予測部152Tから出力されるインター予測画像を入力すればよい。
インター予測画像もレイヤ内イントラ予測画像と同様に、対象レイヤと同一レイヤのピクチャの局所復号画像を参照して予測画像を生成する。そのため、対象レイヤの下位レイヤのピクチャの局所復号画像に基づいて生成されるベース参照画像に較べて高周波成分を多く含んでいる。したがって、ハイブリッド予測部152Hにおいて、インター予測画像の低周波成分をベース参照画像の低周波成分で置き換える補正を適用することで、予測に適したハイブリッド予測画像を生成できる。それにより、予測残差の符号量を削減でき、符号化効率を向上できるという効果を奏する。
<変形例5:参照画素フィルタリングの制御>
レイヤ内イントラ予測部152Sにおけるレイヤ内予測画像の生成処理において、参照領域フィルタを適用すると説明した。レイヤ内イントラ予測部152Sの出力をハイブリッド予測部152Hへの入力として用いる場合には、参照領域フィルタを省略してもよい。
参照領域フィルタは、局所復号画像に存在する高周波ノイズを除去することで、レイヤ内予測画像を直接用いる場合に好適な予測画像を生成することを意図して用いられる。しかしながら、ハイブリッド予測部152Hにおいては、入力されるレイヤ内予測画像の高周波成分を主としてハイブリッド予測画像の生成に用いるため、レイヤ内予測画像にはより多くの高周波成分が存在していることが好ましい。そのため、レイヤ内予測画像を直接予測画像として用いる場合には、レイヤ内予測画像生成時に参照領域フィルタを適用し、ハイブリッド予測画像を用いる場合には、レイヤ内予測画像生成時に参照領域フィルタを適用しないことが好ましい。これにより、より多くの高周波成分を含むレイヤ内予測画像を用いてハイブリッド予測画像を生成できるため、予測残差の符号量を低減できる。
<変形例6:補正オンオフ適応選択>
本実施形態のハイブリッド予測部152Hでは、空間予測モードの値に関わらず補正処理を適用する例を説明したが、それに限らない。特定の空間予測モードが選択されたPUにおいて補正処理を省略する構成であっても構わない。
具体的には、空間予測モードが水平方向(空間予測モード10)、垂直方向(空間予測モード26)、または、プラナー予測モード(空間予測モード0)の場合のみ補正処理を実行し、それ以外の場合(水平と垂直を除く方向予測モード)、補正処理を省略する構成としてもよい。
水平方向予測、垂直方向予測、および、プラナー予測による予測画像生成処理は、その他の空間予測モードによる予測画像生成処理に較べて処理量が少ない。そのため、比較的処理量が少ない、水平方向予測、垂直方向予測、および、プラナー予測によりレイヤ内イントラ予測画像が生成される場合のみ補正処理を行うことで、ハイブリッド予測の利用による最悪処理量の、レイヤ内イントラ予測の最悪処理量に対する増加を最小限に抑制することができるという効果を奏する。
<変形例7:ハイブリッド予測部152Hの別の例>
本実施形態のハイブリッド予測部152Hでは、レイヤ内イントラ予測画像の低周波成分を導出し、導出した低周波成分画像をレイヤ内イントラ予測画像から減算することで、レイヤ内イントラ予測画像の高周波成分を抽出する例を示したが、それに限らない。例えば、レイヤ内イントラ予測画像の高周波成分を直接抽出する手段を設けてもよい。
図14は、レイヤ内イントラ予測画像の高周波成分を直接抽出する場合のハイブリッド予測部152HR1を示す。ハイブリッド予測部152HR1は、補正単位分割部152HR1、高周波成分抽出部152H5、補正単位分割部152H1B、低周波成分抽出部152HB、および加算器152H4を備える。以外の構成要素は、図1で説明したハイブリッド予測部152Hに含まれる対応する構成要素と同一であり説明を省略する。
高周波成分抽出部152H5は、入力される画像のPU対応領域を、同じく入力される補正単位情報に基づいて分割して得られる各補正単位毎に高周波成分を抽出する。各補正単位から抽出した高周波成分から、対象PU単位の画像を構成して高周波画像として出力する。
ハイブリッド予測部152Hでは、低周波成分抽出部152H2Eの出力であるレイヤ内イントラ予測低周波画像を、レイヤ内イントラ予測画像から減算することで、レイヤ内イントラ予測高周波画像を生成する。一方、ハイブリッド予測部15HR1では、高周波成分抽出部152H5の出力として、直接レイヤ内イントラ予測高周波画像を生成する。
ハイブリッド予測部152HR1を用いて構成した階層動画像復号装置も、ハイブリッド予測部152Hを用いて構成した階層動画像復号装置1と同等の符号化効率を実現できる。
〔階層動画像符号化装置〕
以下では、本実施形態に係る階層動画像符号化装置2の構成について、図17〜図19を参照して説明する。
(階層動画像符号化装置の構成)
図17を用いて、階層動画像符号化装置2の概略的構成について説明すると次のとおりである。図17は、階層動画像符号化装置2の概略的構成について示した機能ブロック図である。階層動画像符号化装置2は、対象レイヤの入力画像PIN#Tを、参照レイヤ符号化データDATA#Rを参照しながら符号化して、対象レイヤの階層符号化データDATAを生成する。なお、参照レイヤ符号化データDATA#Rは、参照レイヤに対応する階層動画像符号化装置において符号化済みであるとする。
図17に示すように階層動画像符号化装置2は、予測パラメータ決定部21、予測情報生成部22、ベース復号部23、テクスチャ情報生成部24、可変長符号化部25、およびNAL多重化部26を備える。
予測パラメータ決定部21は、入力画像PIN#Tに基づいて、予測画像の予測に用いられる予測パラメータおよびその他の符号化の設定を決定する。
予測パラメータ決定部21は、予測パラメータをはじめとする符号化の設定を、以下のとおり行う。
まず、予測パラメータ決定部21は、入力画像PIN#Tを、スライス単位、CTB単位、CU単位に順次分割することにより、対象CUについてのCU画像を生成する。
また、予測パラメータ決定部21は、分割処理の結果に基づいて、符号化情報(ヘッダ情報とも称されることがある)を生成する。 符号化情報は、(1)対象スライスに属するCTBのサイズ、形状および対象スライス内での位置についての情報であるCTB情報と、(2)各CTBに属するCUのサイズ、形状および対象ツリーブロック内での位置についての情報であるCU情報とを含んでいる。
さらに、予測パラメータ決定部21は、CU画像、CTB情報、およびCU情報を参照して、対象CUのCU予測タイプ、対象CUのPUへの分割情報、および、予測パラメータ(対象CUがイントラCUであればレイヤ間予測フラグと空間予測モード、インターCUであれば動き補償パラメータ)を導出する。
予測パラメータ決定部21は、(1)対象CUの予測タイプ、(2)対象CUの各PUへの可能な分割パターン、および、(3)各PUに割り付ける可能な予測モード(対象CUがイントラCUであればレイヤ間予測フラグと空間予測モード、インターCUであれば動き補償パラメータ)、の全ての組み合わせについて、コストを算出し、最低コストの予測タイプ、分割パターン、および、予測モードを決定する。
予測パラメータ決定部21は、符号化情報および予測パラメータを予測情報生成部22およびテクスチャ情報生成部24に供給する。なお、説明の簡便のため図示しないが、予測パラメータ決定部21において決定された上記の符号化の設定は、階層動画像符号化装置2の各部において参照可能とする。
予測情報生成部22は、予測パラメータ決定部21から供給される予測パラメータに基づいて予測パラメータに関するシンタックス値を含む予測情報を生成する。予測情報生成部22は、生成した予測情報を可変長符号化部25に供給する。なお、予測情報生成部22は、予測パラメータを復元する際に、テクスチャ情報生成24が備えるフレームメモリ247(後述)に格納された予測パラメータを参照することができる。
ベース復号部23は、階層動画像復号装置1のベース復号部16と同様であるので、ここではその説明を省略する。
テクスチャ情報生成部24は、入力画像PIN#Tから予測画像を減算して得られる予測残差を、直交変換・量子化した変換係数を含む変換係数情報を生成する。テクスチャ情報生成部24は、生成した変換係数情報を可変長符号化部25に供給する。なお、テクスチャ情報生成24では、復元された復号画像に関する情報が、内部に備えるフレームメモリ247(後述)に格納される。
可変長符号化部25は、予測情報生成部22から供給される予測情報およびテクスチャ情報生成部24から供給される変換係数情報を可変長符号化して対象レイヤ符号化データDATA#Tを生成する。可変長符号化部25は、生成した対象レイヤ符号化データDATA#TをNAL多重化部26に供給する。
NAL多重化部26は、可変長符号化部25から供給される対象レイヤ符号化データDATA#Tと、参照レイヤ符号化データDATA#RとをNALユニットに格納することでNAL多重化した階層動画像符号化データDATAを生成し、外部に出力する。
以下において、予測情報生成部22、およびテクスチャ情報生成部24それぞれの詳細について説明する。
(予測情報生成部)
図18を用いて、予測情報生成部22の詳細構成について説明する。図18は、予測情報生成部22の構成について例示した機能ブロック図である。
図18に示すように、予測情報生成部22は、イントラインター予測情報設定部221、空間予測モード予測情報設定部223、イントラ予測情報設定部224、および動き補償予測情報設定部225を備える。イントラ予測情報設定部224は、ハイブリッド予測情報設定部224H、レイヤ内イントラ予測情報設定部224S、およびレイヤ間イントラ予測情報設定部224Bを内部に備える。
イントラインター予測情報設定部221は、予測パラメータがイントラCUとインターCUの何れを示すかに基づいて、CU予測モードフラグpred_mode_flagを対応する値に設定して予測情報の一部として出力する。
空間予測モード予測情報設定部223は、予測パラメータが対象PUにおいてハイブリッド予測またはレイヤ内イントラ予測を適用することを示す場合、予測パラメータに含まれる空間予測モードと、フレームメモリに記録されている対象PUの隣接領域におけえる空間予測モードを参照して、MPMフラグprev_intra_luma_pred_flag、MPMインデックスmpm_idx、および残余予測モードrem_intra_luma_pred_modeの各シンタックス値を設定する。
イントラ予測情報設定部224は、入力される予測パラメータの示すイントラ予測方法に関する予測情報を設定して出力する。
ハイブリッド予測情報設定部224Hは、イントラ予測方法がハイブリッド予測である場合に選択され、レイヤ間予測フラグinter_layer_pred_flagの値を1(レイヤ間予測を利用する)に設定し、入力される空間予測モードに係るシンタックス値と合わせて予測情報として出力する。
レイヤ内イントラ予測情報設定部224Sは、イントラ予測方法がレイヤ内イントラ予測である場合に選択され、レイヤ間予測フラグinter_layer_pred_flagの値を0(レイヤ間予測を利用しない)に設定して予測情報として出力する。
レイヤ間イントラ予測情報設定部224Bは、イントラ予測方法がレイヤ内イントラ予測である場合に選択され、レイヤ間予測フラグinter_layer_pred_flagの値を1(レイヤ間予測を利用する)に設定し、入力される空間予測モードに係るシンタックス値と合わせて予測情報として出力する。
動き補償予測情報設定部225は、予測パラメータに含まれる動き情報と、フレームメモリに記録されている動き情報を参照して、動き情報に係る各シンタックス値(skip_flag、merge_flag、merge_idx、inter_pred_flag、ref_idx、mvd、mvp_idx)を設定して予測情報として出力する。
(テクスチャ情報生成部)
図19を用いて、テクスチャ情報生成部24の詳細構成について説明する。図19は、テクスチャ情報生成部24の構成について例示した機能ブロック図である。
図19に示すように、テクスチャ情報生成部24は、テクスチャ予測部241、減算器242、直交変換・量子化部243、逆直交変換・逆量子化部244、加算器245、ループフィルタ部246、およびフレームメモリ247を備える。
減算器242は、入力画像PIN#Tからテクスチャ予測部241から供給される予測画像を減算することによって、予測残差Dを生成する。減算器242は、生成した予測残差Dを、変換・量子化部243に供給する。
直交変換・量子化部243は、予測残差Dに対して、直交変換および量子化を行うことで量子化予測残差を生成する。なお、ここで直交変換とは、画素領域から周波数領域への直交変換のことをさす。また、直交変換の例としては、DCT変換(Discrete Cosine Transform)、およびDST変換(Discrete Sine Transform)等が挙げられる。また、具体的な量子化過程については、すでに説明した通りであるので、ここではその説明を省略する。直交変換・量子化部243は、生成した量子化予測残差を含む変換係数情報を逆変換・逆量子化部244および可変長符号化部25に供給する。
テクスチャ予測部241、逆直交変換・逆量子化部244、加算器245、ループフィルタ部246、およびフレームメモリ247は、それぞれ、階層動画像復号装置1に含まれるテクスチャ予測部152、逆直交変換・逆量子化部151、加算器153、ループフィルタ部154、およびフレームメモリ155と同様であるので、ここではその説明は省略する。ただし、テクスチャ予測部241は、加算器245だけでなく減算器242にも予測画像を供給する。
〔第2の実施形態〕
図22〜図36に基づいて、本発明の一実施形態(第2の実施形態)に係る階層動画像復号装置3および階層動画像符号化装置4について説明すれば以下のとおりである。
本実施形態に係る階層動画像復号装置(画像復号装置)3は、階層動画像符号化装置(画像符号化装置)4によって階層符号化された符号化データを復号する。
〔階層動画像復号装置(第2の実施形態)〕
以下では、本実施形態に係る階層動画像復号装置3の構成について、図22〜図36を参照して説明する。
(階層動画像復号装置の構成)
図22を用いて、階層動画像復号装置3の概略的構成について説明すると次のとおりである。図22は、階層動画像復号装置3の概略的構成について示した機能ブロック図である。階層動画像復号装置3は、階層動画像符号化装置4から供給される階層符号化データDATAを復号して、対象レイヤの復号画像POUT#Tを生成する。
図22に示すように階層動画像復号装置3は、NAL逆多重化部11、可変長復号部32(可変長復号手段)、予測パラメータ復元部34、テクスチャ復元部35(予測画像生成手段)、およびベース復号部16を備える。なお、階層動画像復号装置1と共通の構成要素については、同一の符号を付与して説明を省略する。
(可変長復号部32)
可変長復号部32は、対象レイヤ符号化データDATA#Tに含まれるバイナリから各種のシンタックス値を復号する。復号されたシンタックス値は、分類されて出力される。
また、可変長復号部32は、CU情報を符号化データDATA#Tから復号する。CU情報には、CUの形状、サイズ、位置を特定するための情報が含まれる。
可変長復号部32は、復号した予測情報およびCU情報を予測パラメータ復元部34に供給する。
また、可変長復号部32は、復号した変換係数情報およびCU情報をテクスチャ復元部35に供給する。
可変長復号部32におけるイントラ予測に係る予測情報の復号処理について図23を参照して説明する。
図23は、可変長復号部32がCU単位の予測情報復号時に参照するシンタックス表の一部を示す。可変長復号部32は、まず、レイヤ間予測フラグinter_layer_pred_flagを復号する。続いて、inter_layer_pred_flagが0の場合、CU予測モードフラグpred_mode_flag、PU分割情報part_mode、輝度予測モードに係るシンタックス(MPMフラグprev_intra_luma_pred_flag、MPMインデックスmpm_idx、残余予測モードrem_intra_luma_pred_mode)、色差イントラ予測モードintra_chroma_pred_modeを順に復号する。なお、pred_mode_flagは、非Iスライス(slice_type != I)の場合に復号される。part_modeは、対象CUが「インターCU」である場合(PredMode[x0][y0] == MODE_INTER)、または、対象CUのサイズが最小である場合(log2CbSize == Log2MinCbSizeY)に復号される。輝度予測モードに係るシンタックスは、対象CUが「イントラCU」である場合に、対象CU内の各予測単位毎に復号される。
inter_layer_pred_flagはCABAC(Context Adaptive Binary Arithmatic Coding;コンテキスト適応算術符号化)により復号される。CABACによる復号には対象CUのサイズに応じて決定されるコンテキストを用いる。具体的には、inter_layer_pred_flagに単一のコンテキストインデックスを割り当て、当該コンテキストインデックスに関連付けられて記録および更新されている確立状態変数の値に基づいて算術復号を行うことでinter_layer_pred_flagを復号する。なお、階層動画像復号装置1の可変長復号部12で用いた方法を含め、別の方法により決定したコンテキストを用いてinter_layer_pred_flagを復号してもよい。
(予測パラメータ復元部34)
図24を用いて、予測パラメータ復元部34の詳細構成について説明する。図24は、予測パラメータ復元部34の構成について例示した機能ブロック図である。
図24に示すように、予測パラメータ復元部34は、イントラインター選択部141、イントラ予測選択部342、イントラ予測モード選択部143、イントラ情報復元部144、および、動き情報復元部145を備える。なお、階層動画像復号装置1の予測パラメータ復元部14(図15)と共通の構成要素については、同一の符号を付与して説明を省略する。
イントラ予測モード復元部143は、階層動画像復号装置1の予測パラメータ復元部14に含まれるイントラ予測モード復元部と同じ構成要素だが、予測パラメータ復元部34においては、生成された空間予測モード(イントラ予測モード)が、イントラ予測選択部342にも追加で出力される。
イントラインター選択部341は、対象CUがイントラCUかインターCUかを入力される予測情報に含まれるinter_layer_pred_flagおよびpred_mode_flagの値から判定する。inter_layer_pred_flagが0の場合、または、pred_mode_flagの値が0の場合、対象CUはイントラCUと判定される。それ以外の場合、対象CUはインターCUと判定される。対象CUがイントラCUの場合、イントラCUの予測パラメータ復元に係る各構成要素、ここでは、イントラ予測選択部342、イントラ予測モード復元部143、および、イントラ情報復元部144にそれぞれ予測情報を出力する。対象CUがインターCUの場合、インターCUの予測パラメータ復元に係る各構成要素、ここでは、動き情報復元部145に予測情報を出力する。
イントラ予測選択部342は、対象CU、または、対象CUを構成する各PUに適用されるイントラ予測の種類を、予測情報に含まれるシンタックス値に基づいて判定して、判定結果をイントラ情報復元部144に出力する。
上記判定は、図25に基づいて実行される。図25は、シンタックス値inter_layer_pred_flagの値と変数hybridPredFlagの組み合わせから、予測タイプを一意に特定する表である。ここで、変数hybridPredFlag(ハイブリッド予測フラグ)は対象CUにハイブリッド予測を適用するか、レイヤ内イントラ予測を適用するかを示すフラグである。hybridPredFlagの具体的な導出方法は後述する。inter_layer_pred_flagが1の場合、hybridPredFlagは参照されず、対象CUおよび対象PUの予測タイプを「レイヤ間イントラ予測」と判定する。inter_layer_pred_flagの値が0、かつ、hybridPredFlagが0(ハイブリッド予測未適用)の場合、対象CUおよび対象PUの予測タイプを「レイヤ内イントラ予測」と判定する。inter_layer_pred_flagの値が0、かつ、hybridPredFlagが1(ハイブリッド予測適用)の場合、対象CUおよび対象PUの予測タイプを「ハイブリッド予測」と判定する。
<ハイブリッド予測フラグhybridPredFlagの決定方法>
図26を参照して、ハイブリッド予測フラグhybridPredFlagの具体的導出方法について説明する。hybridPredFlagは、対象PUのタイプを表す変数predBlkTypeと対象PUのイントラ予測モード(IntraPredMode)の組み合わせにより決定される。変数predBlkTypeは、次式により導出される。
predBlkType = cuDepth + (partMode==2Nx2N) ? 0 : 1
ここで、cuDepthは対象PUを含むCUのデプスであり、最大CUの幅の2の対数をlog2MaxCuWidth、CUの幅の2の対数をlog2CuWidthと表した場合、次式で定義される。
cuDepth = log2MaxCuWidth - log2CuWidth
また、partModeはPU分割タイプであり、評価式「partMode==2Nx2N」は、対象CUのPU分割タイプが2N×2Nの場合に真となる。上記式により導出される変数predBlkTypeは、対象PUのサイズ(面積)が小さいほど小さい値を取り、加えて、変数predBlkTypeは、対象PUのサイズが等しい場合、対象PUを含むCUのサイズが小さいほど大きい値を取るという性質を有している。
図26によると、predBlkTypeが1以上であって、かつ、イントラ予測モードがDC(DC予測)以外の場合にhybridPredFlagを1(ハイブリッド予測を適用する)に設定する。それ以外の場合には、hybridPredFlagを0(ハイブリッド予測を適用しない)に設定する。
CTBサイズ(最大CUサイズ)が64×64の場合、次のように言い換えることができる。CUサイズが32×32以下であって、かつ、イントラ予測モードがDC以外の場合にhybridPredFlagを1に設定し、それ以外の場合にhybridPredFlagを0に設定する。
より一般的には、次のように言い換えることができる。CUサイズが所定のサイズ以下であって、かつ、イントラ予測イントラが非DC予測の場合にハイブリッド予測を適用し、それ以外の場合にハイブリッド予測を適用しないことを示すようhybridPredFlagの値を設定する。
上記hybridPredFlagの決定は、ハイブリッド予測およびレイヤ内イントラ予測に係る以下の性質から有用である。
(性質1)ハイブリッド予測は、小さいCUに含まれる領域に対して、大きいCUに含まれる領域に較べて有効である。ハイブリッド予測では特定の補正単位毎にDC成分を補正することで予測画像を入力画像に近づけるが、大きいCUに含まれる領域(大きいCUが選択される領域)は一般的に空間相関が高く、DC成分を補正単位毎に補正することによる効果が小さい。したがって、所定CUサイズよりも小さいCUに含まれる予測単位ではハイブリッド予測を適用し、所定CUサイズ以上のCUに含まれる予測単位ではハイブリッド予測を適用しないことが好ましい。
(性質2)CTBサイズが64×64であり、最大変換サイズが32×32の場合、CUサイズが64×64と32×32の何れのCUにおいても、32×32のPUサイズ(予測単位)が適用される。つまり、予測画像生成に適用されるイントラ予測モードが同一であれば、64×64CUの場合と32×32CUの場合で同一の予測画像が生成される。したがって、64×64CUでハイブリッド予測を適用せず、32×32CUでハイブリッド予測を適用することで、異なる予測画像が生成でき、予測画像の選択肢が増えるため好ましい。したがって、32×32CUでハイブリッド予測を適用し、64×64CUでハイブリッド予測を適用しないことが好ましい。
(性質3)ハイブリッド予測は、DC予測に比べて方向予測(Angular予測)に対してより有効である。これは、DC予測が方向予測に比べて空間相関の比較的高い領域で選択されるためである。ハイブリッド予測では、参照レイヤ上の対象PUと同一位置にある復号画素値を参照して予測画像を補正する。そのため、空間相関が比較的低い領域に適用される方向予測による予測画像に対して適用することで、DC予測による予測画像に適用する場合に較べて予測画像を入力画像に近づける効果が大きい。したがって、方向予測に対してハイブリッド予測を適用し、DC予測に対してハイブリッド予測を適用しないことが好ましい。
(性質4)DC予測は、Planar予測や方向予測に較べて、予測画像生成の処理量が小さい。DC予測にハイブリッド予測を適用しない場合、階層動画像復号装置における最小の処理量をハイブリッド予測方式を採用しない階層動画像復号装置と同一にできる。そのため、Planar予測とDC予測は共に空間相関が比較的高い領域で選択されるが、Planar予測に対してハイブリッド予測を適用し、DC予測に対してハイブリッド予測を適用しないことが好ましい。
(テクスチャ復元部35)
図27を参照して、テクスチャ復元部35の詳細構成を説明する。図27は、テクスチャ復元部35の構成を例示した機能ブロック図である。
図27に示すように、テクスチャ復元部35は、逆直交変換・逆量子化部151、テクスチャ予測部352、加算器153、ループフィルタ部154、フレームメモリ155を備える。なお、階層動画像復号装置1のテクスチャ復元部15(図8)と共通の構成要素については、同一の符号を付与して説明を省略する。
テクスチャ予測部352は、予測パラメータに応じて、ベース復号情報に含まれるベース復号画像(ベース参照画像とも呼ぶ)またはフレームメモリに格納されている復号済みの復号画像を参照し、予測画像を生成する。
テクスチャ予測部352は、より詳細には、インター予測部152T、レイヤ内イントラ予測部152S(レイヤ内イントラ予測手段)、レイヤ間イントラ予測部152B(レイヤ間イントラ予測手段)、および、ハイブリッド予測部352H(ハイブリッド予測手段)を備える。これらの構成要素のうち、ハイブリッド予測部352Hを除く構成要素はテクスチャ予測部152に含まれる構成要素と同じであり、同一の符号を付与して説明を省略する。
テクスチャ予測部352は、インター予測部152T、レイヤ内イントラ予測部152S、レイヤ間イントラ予測部152B、または、ハイブリッド予測部352Hが生成した予測画像を加算器153に供給する。
<ハイブリッド予測>
(予測方向と垂直な長方形補正単位の効果)
ハイブリッド予測部352Hは、各イントラ予測パーティションの予測画像をハイブリッド予測により生成する。ハイブリッド予測は、レイヤ内イントラ予測部152Sで生成されるレイヤ内イントラ予測画像を、ベース参照画像の画素値に基づいて修正する。
ハイブリッド予測部352Hは、テクスチャ予測部352に入力される予測パラメータが、対象PUの予測タイプがハイブリッド予測であることを示す場合に起動される。その際、予測パラメータに含まれる空間予測モードに基づいてレイヤ内イントラ予測部152Sで生成された予測画像(レイヤ内イントラ予測画像)がハイブリッド予測部352Hへ入力される。また、対象PUの位置に対応するベース復号画像(ベース参照画像)が入力される。ハイブリッド予測部352Hは、入力されるレイヤ内イントラ予測画像、イントラ予測モード、及び、ベース参照画像に基づいてハイブリッド予測画像を生成して、対象PUの予測画像として出力する。
以下の説明において、ハイブリッド予測部352Hに入力されるベース復号画像は、対象レイヤ上の対象PUに対して空間上の同一位置に対応する参照レイヤ上の領域の復号画像を、対象レイヤと参照レイヤの解像度の比に基づいて補正して得られる画像とする。すなわち、空間スケーラビリティが用いられる場合であって、対象レイヤと参照レイヤの解像度が異なる場合、対象PUに対応する参照レイヤ上の領域の復号画像を解像度の比を考慮してアップサンプルすることで得られる画像をベース復号画像(ベース参照画像)とする。
図28を参照してハイブリッド予測部352Hの詳細構成を説明する。図28は、ハイブリッド予測部352Hの概略的構成を示した機能ブロック図である。ハイブリッド予測部352Hは、補正単位分割部352H1B、補正単位分割部352H1E、DC成分抽出部352H2B、DC成分抽出部352H2E、加算器352H3、加算器352H4、および、補正単位決定部352H5を備える。
補正単位分割部352H1Bと補正単位分割部352H1Eは、入力される画像上の対象PUに対応する領域(PU対応領域)を、入力される補正単位サイズを単位として1以上の補正単位に分割する。PU対応領域に対応する画像に、当該領域の補正単位分割を示す情報(補正分割情報)を付加して出力する。なお、補正単位分割部352H1Bは、入力された対象PUに対応するベース復号画像を補正単位に分割する。一方、補正単位分割部352H1Eは、入力された対象PUに対応する空間予測画像を補正単位に分割する。本実施形態では、両者は同一の機能を有するとし、補正単位分割部352H1(補正単位分割手段)と総称する。また、補正単位分割部352H1に入力される画像(レイヤ内イントラ予測画像、ベース参照画像)を分割対象画像と総称し、出力を分割後画像と総称する。
補正単位分割部352H1は、分割対象画像を補正単位決定部352H5より入力される補正単位サイズの補正単位に分割する。
DC成分抽出部352H2BとDC成分抽出部352H2Eは、入力される画像のPU対応領域を、同じく入力される補正単位情報に基づいて分割して得られる各補正単位毎にDC成分を抽出する。各補正単位から抽出したDC成分から、対象PU単位の画像を構成してDC画像として出力する。本実施形態では、DC成分抽出部352H2BとDC成分抽出部352H2Eは同一の機能を有するとして、両者をDC成分抽出部352H2(DC成分抽出手段)と総称する。
レイヤ内イントラ予測画像を補正単位分割部352H1EとDC成分抽出部352H2Eに順次入力して得られる低周波画像をレイヤ内イントラ低周波画像と呼ぶ。また、ベース参照画像を補正単位分割部352H1BとDC成分抽出部152H2Bに順次入力して得られる低周波画像をベース参照低周波画像と呼ぶ。
なお、補正単位におけるDC成分の抽出は、例えば、補正単位の画素値の平均を導出する処理である。この場合、DC成分抽出部が出力する低周波画像の各画素値は、当該画素位置を含む補正単位の画素値平均となる。
加算記352H3は、入力されるレイヤ内イントラ予測低周波画像から、入力されるベース参照低周波画像を引いて低周波差分画像として出力する。なお、低周波差分画像の画素値の絶対値が所定の値(例えば5)以下となるようクリップ処理を適用してもよい。
加算記352H4は、入力されるレイヤ内イントラ予測画像と、入力される低周波差分画像を加算してハイブリッド予測画像として出力する。なお、レイヤ内イントラ予測画像と低周波差分画像の加算後に、各画素値を復号画素の画素値が取り得る値の範囲内となるようクリップすることが好ましい。例えば、復号画像の画素値が取り得る範囲が0〜255である場合、0以下の画素値を0、255以上の画素値を255とするクリップ処理を適用することが好ましい。
<補正単位決定部>
補正単位決定部352H5は、入力されるイントラ予測モードに基づいて補正単位サイズを決定し、補正単位分割部352H1Bおよび補正単位分割部352H1Eにそれぞれ出力する。
補正単位サイズの決定方法について、図29を参照して説明する。図29は対象PUのイントラ予測モードに対応する補正単位サイズを示す表である。対象PUのイントラ予測モードがPlanar予測(IntraPredModeが0)の場合、補正単位サイズ(adjustUnitSize)を4×1(4画素×1画素)に設定する。イントラ予測モードが水平方向に近い方向の方向予測(IntraPredModeが2以上17以下)の場合、補正単位サイズを1×4に設定する。イントラ予測モードが垂直方向に近い方向の方向予測(IntraPredModeが18以上34以下)の場合、補正単位サイズを4×1に設定する。なお、イントラ予測モードがDC予測の場合、本実施形態ではハイブリッド予測が適用されないため、図29では、適用付加を意味する「na」を記載している。
上記のようなイントラ予測モードに応じた補正単位サイズの決定は、ハイブリッド予測およびレイヤ内イントラ予測に係る以下の性質から有用である。
(性質4)方向予測をハイブリッド予測により補正する場合、予測方向に沿った方向により小さい単位で補正することで、予測画像を入力画像に近づけられる。これは、方向予測は、概略的には、対象PU周辺の復号済画像の画素値を指定された予測方向に外挿することで予測画像を生成することから、予測方向に沿った方向の変化を予測することができないという性質に起因する。補正単位を予測方向に沿って小さく設定してハイブリッド予測による補正を適用することで、予測方向に沿った方向の画素値の変化を、ベース参照画像の情報を用いて推定することができるため、予測画像をより入力画像に近づけることができる。したがって、水平方向に近い方向予測に対して縦長矩形(垂直方向に長い矩形)の補正単位サイズを選択し、垂直方向に近い方向予測に対して横長矩形(水平方向に長い矩形)の補正単位サイズを選択することが好ましい。
(性質5)ハイブリッド予測による補正単位のサイズの数を少なくすることで、階層動画像復号装置を実装する際の回路規模を低減できる。また、したがって、方向予測以外のイントラ予測モードに対応する補正単位のサイズとして、方向予測に適用される補正単位のサイズのうちの何れかを適用することが好ましい。
補正単位決定部352H5では、上記2つの性質を考慮して、図29に示した対応関係でイントラ予測モードから補正単位サイズを決定したが、いずれか一方の性質のみを利用した対応関係で補正サイズを決定してもよい。
<ハイブリッド予測画像生成処理>
次に、ハイブリッド予測部352Hにおける予測画像生成処理の手順(S601〜S406)を説明する。ここでは、対象PUに対するレイヤ内イントラ予測画像とベース参照画像を入力として、対象PUのハイブリッド予測画像をハイブリッド予測部352Hの各構成要素を用いて導出する処理である。
(S601)補正単位決定部352H5は、入力されるイントラ予測モードに基づいて補正単位サイズを決定し、補正単位分割部352H1Eと補正単位分割部352H1Bに出力する。
(S602)補正単位分割部352H1Eは、入力される空間予測画像を入力される補正単位サイズで補正単位に分割し、空間予測画像と分割情報を合わせてDC成分抽出部352H2Eに出力する。
(S603)DC成分抽出部352H2Eは、入力された分割情報に基づいて空間予測画像を分割し、得られる分割単位毎に空間予測画像の低周波成分を抽出して、レイヤ内イントラ予測低周波画像を生成して、加算器352H3に出力する。
(S604)補正単位分割部352H1Bは、入力されたベース参照画像を入力される補正単位サイズで補正単位に分割し、ベース参照画像と分割情報を合わせてDC成分抽出部352H2Bへ出力する。
(S605)DC成分抽出部352H2Bは、入力された分割情報に基づいてベース参照画像を分割し、得られる分割単位毎にベース参照画像の低周波成分を抽出して、ベース参照低周波画像を生成して、加算器352H3に出力する。
(S606)加算器352H3は、入力されるベース参照低周波画像から、入力されるレイヤ内イントラ予測低周波画像を引いて低周波差分画像を生成して加算器352H4に出力する。
(S607)加算器352H4は、入力されるレイヤ内イントラ予測画像と、加算器152H3から入力される低周波差分画像とを加算してハイブリッド予測画像を生成して、対象PUの予測画像として外部に出力する。
上記ハイブリッド予測画像の導出手順によれば、対象PUにおけるレイヤ内イントラ予測画像(空間予測画像)を複数の補正単位に分割し、補正単位毎に空間予測画像の低周波成分を、ベース参照画像の低周波成分に置き換えることができる。言い換えると、補正単位毎に、空間予測画像の高周波成分と、ベース参照画像の低周波成分とを組み合わせたハイブリッド予測画像が生成できる。ハイブリッド予測画像は、空間予測画像や参照レイヤ画像よりも高精度の(入力画像に類似の)予測画像となる可能性が高い。したがって、ハイブリッド予測画像を予測画像として用いることで、予測残差の符号量を減らして、動画像符号化データの符号量を削減できる。
(階層動画像復号装置3の効果)
以上説明した本実施形態に係る動画像復号装置3は、空間予測画像の高周波成分と、ベース参照画像の低周波成分を組み合わせてハイブリッド予測画像を生成するハイブリッド予測部を備えている。したがって、動画像復号装置1は、ハイブリッド予測画像を用いることで生成された少ない符号量の符号化データを復号して、復号画像を再生できる。
<変形例8:DC/Planarへの適用省略>
予測パラメータ復元部34の説明では、図26を参照して、ハイブリッド予測フラグhybridPredFlagの決定方法を示したが、異なる決定方法でhybridPredFlagを決定してもよい。例えば、図30や図31に示す決定方法でhybridPredFlagを決定できる。
図30は、方向予測にハイブリッド予測を適用し、DC予測およびPlanar予測にハイブリッド予測を適用しない場合のhybridPredFlagの決定方法を示している。
図31は、一部の方向予測に対してハイブリッド予測を適用し、それ以外の方向予測、DC予測、およびPlanar予測に対してはハイブリッド予測を適用しない場合のhybridPredModeの決定方法を示している。具体的には、方向予測が水平方向または垂直方向のいずれかに近い場合にハイブリッド予測を適応している。図31では、イントラ予測モードが7以上13以下の範囲内(水平方向に対応するイントラ予測モード10から±3の範囲)にある場合に水平方向に近いと判定し、23以上29以下の範囲内(垂直方向に対応するイントラ予測モード26から±3の範囲)にある場合に垂直方向に近いと判定してhybridPredFlagを1に設定する。
なお、図30、図31ともに、predBlkTypeに依存せずhybridPredFlagを決定しているが、図26で説明したようにpredBlkTypeに依存してhybridPredFlagを決定するようにしてもよい。
<変形例9:DC/Planarへ4x4の補正単位を適用>
補正単位決定部352H5の説明では、図29を参照して、補正単位サイズの決定方法を示したが、異なる決定方法で補正単位サイズを決定してもよい。例えば、図32に示した方法で補正単位サイズを決定できる。
図32に示す補正単位サイズ決定方法によれば、対象PUのイントラ予測モードがPlanar予測(IntraPredModeが0)の場合、補正単位サイズ(adjustUnitSize)を4×4(4画素×4画素)に設定する。イントラ予測モードがDC予測の場合、ハイブリッド予測は適用されない(「na」)。イントラ予測モードが水平方向に近い方向の方向予測(IntraPredModeが2以上17以下)の場合、補正単位サイズを1×4に設定する。イントラ予測モードが垂直方向に近い方向の方向予測(IntraPredModeが18以上34以下)の場合、補正単位サイズを4×1に設定する。
上記補正単位サイズ決定方法によれば、図29に示す補正単位サイズ決定方法に比べて、補正単位サイズの種類が増加するため実装負荷が増加するが、方向性を持たないPlanar予測に対して、方向性を持たない正方形の補正単位を用いてハイブリッド予測を適用することで入力画像に近い予測画像を生成できる可能性が高まるという効果を奏する。
なお、DC予測に対してもハイブリッド予測を適用する構成である場合、DC予測に対して4×4の補正単位サイズを適用することでも、同様の効果が得られる。
上記の例は、より一般化すると、次のように換言できる。イントラ予測モードに応じてハイブリッド予測に用いる補正単位を決定する際、イントラ予測モードが特定の方向性と関連付けられている予測(Angular予測、方向予測)である場合には、関連付けられている方向と垂直な方向に長い矩形の補正単位を選択し、イントラ予測モードが特定の方向性と関連付けられていない予測(Planar予測、DC予測)である場合には、正方形の補正単位を選択する。
<変形例10:長方形補正単位のバリエーション>
補正単位決定部352H5の説明では、補正単位として横長矩形(4×1画素)、および、縦長矩形(1×4画素)を用いた処理を説明したが、異なる横長矩形や縦長矩形の補正単位により処理を実行してもよい。例えば、横長矩形として8×2画素、縦長矩形として2×8画素の補正単位を用いても良い。
図33を参照して、横長矩形の補正単位として4×1と8×2、縦長矩形の補正単位として1×4と2×8の補正単位を併用する例を挙げる。図33に示す補正単位サイズ決定方法では、対象PUのイントラ予測モードがPlanar予測(IntraPredModeが0)、または、垂直方向の方向予測(IntraPredModeが18〜34)の場合、横長矩形の補正単位サイズを設定する。より詳細には、予測単位の幅(predBlkWidth)が8以上の場合に8×2の補正単位を、予測単位の幅が8未満の場合に4×1の補正単位を選択する。一方、水平方向の方向予測(IntraPredModeが2〜17)の場合、縦長矩形の補正単位サイズを選択する。より詳細には、予測単位の幅が8以上の場合に2×8の補正単位を、予測単位の幅が8未満の場合に1×4の補正単位を選択する。なお、イントラ予測モードがDC予測の場合、ハイブリッド予測は適用されない(「na」)。
上記補正単位サイズ決定方法によれば、図29に示す補正単位サイズ決定方法に比べて、予測単位の大きさに適した大きさの横長矩形または縦長矩形の補正単位を適用できる。一般に、小さい補正単位は、予測画像をより入力画像に近づけられる可能性が高い一方で、大きい補正単位に比べて複雑度が増加する。大きい予測単位が選択される領域では空間相関は比較的高いため、そのような領域では大きい補正単位を用いても小さい補正単位を用いる場合に近い予測画像が生成できる。したがって、本変形例で説明したように、大きい予測単位に対して、小さい予測単位に比べてより大きい横長矩形または縦長矩形の補正単位を用いることで、ハイブリッド予測による予測画像を入力画像に近づけつつ、予測画像生成処理の複雑度低減を実現できる効果を奏する。
<変形例11:最小予測単位で4×4>
図29を参照して説明した、補正単位決定部352H5における補正単位サイズの決定方法では、全ての方向予測に対して縦長矩形または横長矩形の補正単位を選択する例を示したが、特定の条件で方向予測に対して正方形の補正単位を適用してもよい。
例えば、図34に示すように、予測単位のサイズが小さい場合に正方形の補正単位を適用してもよい。図34に示す補正単位サイズ決定方法では、対象PUのイントラ予測モードがPlanar予測(IntraPredModeが0)、または、垂直方向の方向予測(IntraPredModeが18〜34)の場合、横長矩形または正方形の補正単位サイズを設定する。より詳細には、予測単位の幅(predBlkWidth)が8以上の場合に4×1の補正単位を、予測単位の幅が8未満の場合(予測単位が最小の場合)に4×4の補正単位を選択する。一方、水平方向の方向予測(IntraPredModeが2〜17)の場合、縦長矩形または正方形の補正単位サイズを選択する。より詳細には、予測単位の幅が8以上の場合に1×4の補正単位を、予測単位の幅が8未満の場合(予測単位が最小の場合)に4×4の補正単位を選択する。なお、イントラ予測モードがDC予測の場合、ハイブリッド予測は適用されない(「na」)。
上記補正単位サイズ決定方法では、最小の予測単位に対して正方形の補正単位、それ以外の予測単位に対して縦長矩形または横長矩形の補正単位が選択されている。イントラ予測による予測画像生成処理は、一般に予測単位が小さいほど複雑度が増加する。また、4×4単位での補正処理は、4×1や1×4単位での補正処理に較べて複雑度が小さい。そのため、上記補正単位サイズ決定方法では、複雑度の比較的大きい小さい予測単位に対してハイブリッド予測を適用する場合、比較的複雑度の小さい正方形の補正単位を選択することで、最悪の場合の複雑度増加を抑えつつ、ハイブリッド予測による入力画像に近い予測画像を生成する効果を得られる。
また、例えば、図35に示すように、方向予測の予測方向が水平または垂直から離れている場合(予測方向が対角方向に近い場合)、縦長矩形や横長矩形の補正単位ではなく正方形の補正単位を選択してもよい。図35に示す補正単位サイズ決定方法では、対象PUのイントラ予測モードがPlanar予測(IntraPredModeが0)、または、垂直方向に近い方向予測(IntraPredModeが7〜13)の場合、横長矩形の補正単位サイズを設定する。一方、水平方向に近い方向予測(IntraPredModeが23〜29)の場合、縦長矩形の補正単位サイズを選択する。一方、方向予測であって、予測方向が水平方向と垂直方向のいずれからも離れている方向予測(IntraPredModeが2〜6、14〜22、30〜34)の場合、正方形の補正単位サイズを設定する。なお、イントラ予測モードがDC予測の場合、ハイブリッド予測は適用されない(「na」)。
上記補正単位サイズ決定方法では、方向予測の予測方向が水平または垂直から一定以上離れている場合(予測方向が対角方向に近い場合)、正方形の補正単位を選択している。長方形の補正単位による補正は、その長方形が予測方向と垂直である場合に特に有効である。予測方向が対角方向に近い場合、予測方向と補正単位の長方形の方向のなす角度が垂直から遠くなるため、長方形の補正単位を適用する効果が小さい。したがって、そのような場合に正方形の予測単位を選択することで、予測画像をより入力画像に近づける効果を奏する。
<変形例12:倍率に応じた補正単位の切り替え>
上記第2の実施形態の説明では、ハイブリッド予測フラグhybridPredFlagの決定方法や補正単位サイズの決定方法において、CUサイズ、予測単位サイズ、イントラ予測モードの組み合わせに基づいて所定の判定基準によりハイブリッド予測の適用可否や、補正単位サイズを決定する方法を説明した。前記判定基準は、複雑度低減の観点からは一種類であることが好ましいが、2以上の判定基準を設け条件により切り替えて利用しても構わない。特に、ベースレイヤ(参照レイヤ)の復号画像の解像度と対象レイヤの復号画像の解像度の比率に応じて異なる判定基準を設けることが好ましい。
例えば、ベースレイヤの復号画像の解像度に対して、対象レイヤの復号画像の解像度が高いほどより大きい補正単位が適用されるよう、補正単位選択の判定基準を切り替えてもよい。具体的には、対象レイヤとベースレイヤの復号画像の解像度が等しい場合、図29で説明した方法で補正単位を選択し、ベースレイヤに較べて対象レイヤの復号画像の解像度が高い場合、図36に示す方法で補正単位を選択してもよい。図36では、予測単位の幅(predBlkWidth)が4の場合、図29と同じ補正単位サイズを選択する。一方、予測単位の幅が8以上の場合、対象PUのイントラ予測モードがPlanar予測(IntraPredModeが0)、または、垂直方向に近い方向の方向予測(IntraPredModeが18以上34以下)の場合、補正単位サイズを8×1に設定する。それ以外で、イントラ予測モードが水平方向に近い方向の方向予測(IntraPredModeが2以上17以下)の場合、補正単位サイズを1×8に設定する。
対象レイヤとベースレイヤの復号画像の解像度が等しい場合、解像度が異なる場合に比べて、ベースレイヤの復号画像から対象レイヤにおける対応する領域の入力画像をより正確に推定できる。そのため、対象レイヤとベースレイヤの復号画像の解像度が異なる場合に比べて、対象レイヤとベースレイヤの復号画像の解像度が等しい場合に、より小さい補正単位を用いて補正を行うことで、より入力画像に近い予測画像をハイブリッド予測により生成できる効果を奏する。
<変形例13:フィルタ適用前の画素値を利用した補正>
上記第2の実施形態において、ハイブリッド予測部352Hへ入力されるベース復号画像として、対象PUに対応する領域のベースレイヤの復号画像をアップサンプルして得られる画像を用いると説明したが、アップサンプルを適用せずにベースレイヤの復号画像を入力するようハイブリッド予測部352Hを構成することもできる。
例えば、ベースレイヤの解像度に対して、対象レイヤの解像度が縦横各2倍の場合に、4×4画素の補正単位を用いてハイブリッド予測を適用する処理は、以下の手順で実行される。
(S701)空間予測画像を4×4の補正単位に分割し、補正単位毎にDC成分を算出する。
(S702)ベース参照画像(対象PUに対応するベースレイヤの復号画像)を2×2の補正単位に分割し、補正単位毎にDC成分を算出する。
(S703)空間予測画像の各補正単位において、ベース参照画像のDC成分から当該補正単位のDC成分を減算した値を、当該補正単位内の各画素値に加算してハイブリッド予測画像を生成する。
上記手順では、対象レイヤと参照レイヤの解像度の違いを考慮して、対象レイヤの補正単位(4×4)より小さい補正単位(2×2)でDC成分(低周波成分)を計算している。アップサンプル適用後のベースレイヤ復号画像を入力としてハイブリッド予測画像を生成する場合に比べて、アップサンプル処理が省略でき、加えて、ベースレイヤの補正単位の面積が小さいため、DC成分の計算処理が少ないため、予測画像生成処理の複雑度を低減する効果を奏する。
〔階層動画像符号化装置(第2の実施形態)〕
以下では、本実施形態に係る階層動画像符号化装置4の構成について、図37〜図39を参照して説明する。
(階層動画像符号化装置の構成)
図37を用いて、階層動画像符号化装置4の概略的構成について説明すると次のとおりである。図37は、階層動画像符号化装置4の概略的構成について示した機能ブロック図である。階層動画像符号化装置4は、対象レイヤの入力画像PIN#Tを、参照レイヤ符号化データDATA#Rを参照しながら符号化して、対象レイヤの階層符号化データDATAを生成する。なお、参照レイヤ符号化データDATA#Rは、参照レイヤに対応する階層動画像符号化装置において符号化済みであるとする。
図37に示すように階層動画像符号化装置4は、予測パラメータ決定部21、予測情報生成部42、ベース復号部23、テクスチャ情報生成部44、可変長符号化部45、およびNAL多重化部26を備える。階層動画像符号化装置2(図17)の構成要素と同じ機能を有する階層動画像符号化装置4の構成要素に対して、同一の符号を付与して説明を省略する。
予測情報生成部42は、予測パラメータ決定部21から供給される予測パラメータに基づいて予測パラメータに関するシンタックス値を含む予測情報を生成する。予測情報生成部42は、生成した予測情報を可変長符号化部45に供給する。なお、予測情報生成部42は、予測パラメータを復元する際に、テクスチャ情報生成44が備えるフレームメモリ247に格納された予測パラメータを参照することができる。
テクスチャ情報生成部44は、入力画像PIN#Tから予測画像を減算して得られる予測残差を、直交変換・量子化した変換係数を含む変換係数情報を生成する。テクスチャ情報生成部44は、生成した変換係数情報を可変長符号化部45に供給する。なお、テクスチャ情報生成44では、復元された復号画像に関する情報が、内部に備えるフレームメモリ247に格納される。
可変長符号化部45は、予測情報生成部42から供給される予測情報およびテクスチャ情報生成部44から供給される変換係数情報を可変長符号化して対象レイヤ符号化データDATA#Tを生成する。可変長符号化部45は、生成した対象レイヤ符号化データDATA#TをNAL多重化部26に供給する。
(予測情報生成部)
図38を参照して、予測情報生成部42の詳細構成を説明する。図38は、予測情報生成部42の構成を例示した機能ブロック図である。
図38に示すように、予測情報生成部42は、イントラインター予測情報設定部221、空間予測モード予測情報設定部223、イントラ予測情報設定部424、および動き補償予測情報設定部225を備える。イントラ予測情報設定部424は、ハイブリッド予測情報設定部424H、レイヤ内イントラ予測情報設定部424S、およびレイヤ間イントラ予測情報設定部424Bを内部に備える。なお、予測情報生成部22の構成要素と同じ機能の構成要素には同一の符号を付与して説明を省略する。
イントラ予測情報設定部424は、入力される予測パラメータの示すイントラ予測方法に関する予測情報を設定して出力する。
ハイブリッド予測情報設定部424Hは、イントラ予測方法がハイブリッド予測である場合に選択され、レイヤ間予測フラグinter_layer_pred_flagの値を0、hybridPredFlagを1に設定し、入力される空間予測モードに係るシンタックス値と合わせて予測情報として出力する。
レイヤ内イントラ予測情報設定部424Sは、イントラ予測方法がレイヤ内イントラ予測である場合に選択され、レイヤ間予測フラグinter_layer_pred_flagの値を0、hybridPredFlagを0に設定して予測情報として出力する。
レイヤ間イントラ予測情報設定部424Bは、イントラ予測方法がレイヤ内イントラ予測である場合に選択され、レイヤ間予測フラグinter_layer_pred_flagの値を1に設定し、入力される空間予測モードに係るシンタックス値と合わせて予測情報として出力する。
(テクスチャ情報生成部)
図39を用いて、テクスチャ情報生成部44の詳細構成について説明する。図39は、テクスチャ情報生成部44の構成について例示した機能ブロック図である。
図39に示すように、テクスチャ情報生成部44は、テクスチャ予測部441、減算器242、直交変換・量子化部243、逆直交変換・逆量子化部244、加算器245、ループフィルタ部246、およびフレームメモリ247を備える。テクスチャ予測部441は、内部にインター予測部441T、レイヤ内イントラ予測部441S、レイヤ間イントラ予測部441B、ハイブリッド予測部441Hを備える。なお、テクスチャ情報生成部24(図19)の構成要素と同じ機能の構成要素には同一の符号を付与して説明を省略する。
テクスチャ予測部441、逆直交変換・逆量子化部244、加算器245、ループフィルタ部246、およびフレームメモリ247は、それぞれ、階層動画像復号装置3に含まれるテクスチャ予測部352、逆直交変換・逆量子化部151、加算器153、ループフィルタ部154、およびフレームメモリ155と同様であるので、ここではその説明は省略する。ただし、テクスチャ予測部441は、加算器245だけでなく減算器242にも予測画像を供給する。
(他の階層動画像符号化/復号システムへの適用例)
上述した階層動画像符号化装置2及び階層動画像復号装置1は、動画像の送信、受信、記録、再生を行う各種装置に搭載して利用することができる。なお、動画像は、カメラ等により撮像された自然動画像であってもよいし、コンピュータ等により生成された人工動画像(CGおよびGUIを含む)であってもよい。
図20に基づいて、上述した階層動画像符号化装置2および階層動画像復号装置1を、動画像の送信および受信に利用できることを説明する。図20の(a)は、階層動画像符号化装置2を搭載した送信装置PROD_Aの構成を示したブロック図である。
図20の(a)に示すように、送信装置PROD_Aは、動画像を符号化することによって符号化データを得る符号化部PROD_A1と、符号化部PROD_A1が得た符号化データで搬送波を変調することによって変調信号を得る変調部PROD_A2と、変調部PROD_A2が得た変調信号を送信する送信部PROD_A3とを備えている。上述した階層動画像符号化装置2は、この符号化部PROD_A1として利用される。
送信装置PROD_Aは、符号化部PROD_A1に入力する動画像の供給源として、動画像を撮像するカメラPROD_A4、動画像を記録した記録媒体PROD_A5、動画像を外部から入力するための入力端子PROD_A6、及び、画像を生成または加工する画像処理部A7を更に備えていてもよい。図20の(a)においては、これら全てを送信装置PROD_Aが備えた構成を例示しているが、一部を省略しても構わない。
なお、記録媒体PROD_A5は、符号化されていない動画像を記録したものであってもよいし、伝送用の符号化方式とは異なる記録用の符号化方式で符号化された動画像を記録したものであってもよい。後者の場合、記録媒体PROD_A5と符号化部PROD_A1との間に、記録媒体PROD_A5から読み出した符号化データを記録用の符号化方式に従って復号する復号部(不図示)を介在させるとよい。
図20の(b)は、階層動画像復号装置1を搭載した受信装置PROD_Bの構成を示したブロック図である。図20の(b)に示すように、受信装置PROD_Bは、変調信号を受信する受信部PROD_B1と、受信部PROD_B1が受信した変調信号を復調することによって符号化データを得る復調部PROD_B2と、復調部PROD_B2が得た符号化データを復号することによって動画像を得る復号部PROD_B3とを備えている。上述した階層動画像復号装置1は、この復号部PROD_B3として利用される。
受信装置PROD_Bは、復号部PROD_B3が出力する動画像の供給先として、動画像を表示するディスプレイPROD_B4、動画像を記録するための記録媒体PROD_B5、及び、動画像を外部に出力するための出力端子PROD_B6を更に備えていてもよい。図20の(b)においては、これら全てを受信装置PROD_Bが備えた構成を例示しているが、一部を省略しても構わない。
なお、記録媒体PROD_B5は、符号化されていない動画像を記録するためのものであってもよいし、伝送用の符号化方式とは異なる記録用の符号化方式で符号化されたものであってもよい。後者の場合、復号部PROD_B3と記録媒体PROD_B5との間に、復号部PROD_B3から取得した動画像を記録用の符号化方式に従って符号化する符号化部(不図示)を介在させるとよい。
なお、変調信号を伝送する伝送媒体は、無線であってもよいし、有線であってもよい。また、変調信号を伝送する伝送態様は、放送(ここでは、送信先が予め特定されていない送信態様を指す)であってもよいし、通信(ここでは、送信先が予め特定されている送信態様を指す)であってもよい。すなわち、変調信号の伝送は、無線放送、有線放送、無線通信、及び有線通信の何れによって実現してもよい。
例えば、地上デジタル放送の放送局(放送設備など)/受信局(テレビジョン受像機など)は、変調信号を無線放送で送受信する送信装置PROD_A/受信装置PROD_Bの一例である。また、ケーブルテレビ放送の放送局(放送設備など)/受信局(テレビジョン受像機など)は、変調信号を有線放送で送受信する送信装置PROD_A/受信装置PROD_Bの一例である。
また、インターネットを用いたVOD(Video On Demand)サービスや動画共有サービスなどのサーバ(ワークステーションなど)/クライアント(テレビジョン受像機、パーソナルコンピュータ、スマートフォンなど)は、変調信号を通信で送受信する送信装置PROD_A/受信装置PROD_Bの一例である(通常、LANにおいては伝送媒体として無線又は有線の何れかが用いられ、WANにおいては伝送媒体として有線が用いられる)。ここで、パーソナルコンピュータには、デスクトップ型PC、ラップトップ型PC、及びタブレット型PCが含まれる。また、スマートフォンには、多機能携帯電話端末も含まれる。
なお、動画共有サービスのクライアントは、サーバからダウンロードした符号化データを復号してディスプレイに表示する機能に加え、カメラで撮像した動画像を符号化してサーバにアップロードする機能を有している。すなわち、動画共有サービスのクライアントは、送信装置PROD_A及び受信装置PROD_Bの双方として機能する。
図21に基づいて、上述した階層動画像符号化装置2および階層動画像復号装置1を、動画像の記録および再生に利用できることを説明する。図21の(a)は、上述した階層動画像符号化装置2を搭載した記録装置PROD_Cの構成を示したブロック図である。
図21の(a)に示すように、記録装置PROD_Cは、動画像を符号化することによって符号化データを得る符号化部PROD_C1と、符号化部PROD_C1が得た符号化データを記録媒体PROD_Mに書き込む書込部PROD_C2と、を備えている。上述した階層動画像符号化装置2は、この符号化部PROD_C1として利用される。
なお、記録媒体PROD_Mは、(1)HDD(Hard Disk Drive)やSSD(Solid State Drive)等のように、記録装置PROD_Cに内蔵されるタイプのものであってもよいし、(2)SDメモリカードやUSB(Universal Serial Bus)フラッシュメモリ等のように、記録装置PROD_Cに接続されるタイプのものであってもよいし、(3)DVD(Digital Versatile Disc)やBD(Blu-ray Disc:登録商標)等のように、記録装置PROD_Cに内蔵されたドライブ装置(不図示)に装填されるものであってもよい。
また、記録装置PROD_Cは、符号化部PROD_C1に入力する動画像の供給源として、動画像を撮像するカメラPROD_C3、動画像を外部から入力するための入力端子PROD_C4、動画像を受信するための受信部PROD_C5、及び、画像を生成または加工する画像処理部C6を更に備えていてもよい。図21の(a)においては、これら全てを記録装置PROD_Cが備えた構成を例示しているが、一部を省略しても構わない。
なお、受信部PROD_C5は、符号化されていない動画像を受信するものであってもよいし、記録用の符号化方式とは異なる伝送用の符号化方式で符号化された符号化データを受信するものであってもよい。後者の場合、受信部PROD_C5と符号化部PROD_C1との間に、伝送用の符号化方式で符号化された符号化データを復号する伝送用復号部(不図示)を介在させるとよい。
このような記録装置PROD_Cとしては、例えば、DVDレコーダ、BDレコーダ、HDD(Hard Disk Drive)レコーダなどが挙げられる(この場合、入力端子PROD_C4又は受信部PROD_C5が動画像の主な供給源となる)。また、カムコーダ(この場合、カメラPROD_C3が動画像の主な供給源となる)、パーソナルコンピュータ(この場合、受信部PROD_C5又は画像処理部C6が動画像の主な供給源となる)、スマートフォン(この場合、カメラPROD_C3又は受信部PROD_C5が動画像の主な供給源となる)なども、このような記録装置PROD_Cの一例である。
図21の(b)は、上述した階層動画像復号装置1を搭載した再生装置PROD_Dの構成を示したブロックである。図21の(b)に示すように、再生装置PROD_Dは、記録媒体PROD_Mに書き込まれた符号化データを読み出す読出部PROD_D1と、読出部PROD_D1が読み出した符号化データを復号することによって動画像を得る復号部PROD_D2と、を備えている。上述した階層動画像復号装置1は、この復号部PROD_D2として利用される。
なお、記録媒体PROD_Mは、(1)HDDやSSDなどのように、再生装置PROD_Dに内蔵されるタイプのものであってもよいし、(2)SDメモリカードやUSBフラッシュメモリなどのように、再生装置PROD_Dに接続されるタイプのものであってもよいし、(3)DVDやBDなどのように、再生装置PROD_Dに内蔵されたドライブ装置(不図示)に装填されるものであってもよい。
また、再生装置PROD_Dは、復号部PROD_D2が出力する動画像の供給先として、動画像を表示するディスプレイPROD_D3、動画像を外部に出力するための出力端子PROD_D4、及び、動画像を送信する送信部PROD_D5を更に備えていてもよい。図21の(b)においては、これら全てを再生装置PROD_Dが備えた構成を例示しているが、一部を省略しても構わない。
なお、送信部PROD_D5は、符号化されていない動画像を送信するものであってもよいし、記録用の符号化方式とは異なる伝送用の符号化方式で符号化された符号化データを送信するものであってもよい。後者の場合、復号部PROD_D2と送信部PROD_D5との間に、動画像を伝送用の符号化方式で符号化する符号化部(不図示)を介在させるとよい。
このような再生装置PROD_Dとしては、例えば、DVDプレイヤ、BDプレイヤ、HDDプレイヤなどが挙げられる(この場合、テレビジョン受像機等が接続される出力端子PROD_D4が動画像の主な供給先となる)。また、テレビジョン受像機(この場合、ディスプレイPROD_D3が動画像の主な供給先となる)、デジタルサイネージ(電子看板や電子掲示板等とも称され、ディスプレイPROD_D3又は送信部PROD_D5が動画像の主な供給先となる)、デスクトップ型PC(この場合、出力端子PROD_D4又は送信部PROD_D5が動画像の主な供給先となる)、ラップトップ型又はタブレット型PC(この場合、ディスプレイPROD_D3又は送信部PROD_D5が動画像の主な供給先となる)、スマートフォン(この場合、ディスプレイPROD_D3又は送信部PROD_D5が動画像の主な供給先となる)なども、このような再生装置PROD_Dの一例である。
(ハードウェア的実現およびソフトウェア的実現について)
最後に、階層動画像復号装置1、階層動画像符号化装置2の各ブロックは、集積回路(ICチップ)上に形成された論理回路によってハードウェア的に実現してもよいし、CPU(Central Processing Unit)を用いてソフトウェア的に実現してもよい。
後者の場合、上記各装置は、各機能を実現する制御プログラムの命令を実行するCPU、上記プログラムを格納したROM(Read Only Memory)、上記プログラムを展開するRAM(Random Access Memory)、上記プログラムおよび各種データを格納するメモリ等の記憶装置(記録媒体)などを備えている。そして、本発明の目的は、上述した機能を実現するソフトウェアである上記各装置の制御プログラムのプログラムコード(実行形式プログラム、中間コードプログラム、ソースプログラム)をコンピュータで読み取り可能に記録した記録媒体を、上記各装置に供給し、そのコンピュータ(またはCPUやMPU(Micro Processing Unit))が記録媒体に記録されているプログラムコードを読み出し実行することによっても、達成可能である。
上記記録媒体としては、例えば、磁気テープやカセットテープ等のテープ類、フロッピー(登録商標)ディスク/ハードディスク等の磁気ディスクやCD−ROM(Compact Disc Read-Only Memory)/MO(Magneto-Optical)/MD(Mini Disc)/DVD(Digital Versatile Disk)/CD−R(CD Recordable)等の光ディスクを含むディスク類、ICカード(メモリカードを含む)/光カード等のカード類、マスクROM/EPROM(Erasable Programmable Read-only Memory)/EEPROM(登録商標)(Electrically Erasable and Programmable Read-only Memory)/フラッシュROM等の半導体メモリ類、あるいはPLD(Programmable Logic Device)やFPGA(Field Programmable Gate Array)等の論理回路類などを用いることができる。
また、上記各装置を通信ネットワークと接続可能に構成し、上記プログラムコードを通信ネットワークを介して供給してもよい。この通信ネットワークは、プログラムコードを伝送可能であればよく、特に限定されない。例えば、インターネット、イントラネット、エキストラネット、LAN(Local Area Network)、ISDN(Integrated Services Digital Network)、VAN(Value-Added Network)、CATV(Community Antenna Television)通信網、仮想専用網(Virtual Private Network)、電話回線網、移動体通信網、衛星通信網等が利用可能である。また、この通信ネットワークを構成する伝送媒体も、プログラムコードを伝送可能な媒体であればよく、特定の構成または種類のものに限定されない。例えば、IEEE(Institute of Electrical and Electronic Engineers)1394、USB、電力線搬送、ケーブルTV回線、電話線、ADSL(Asymmetric Digital Subscriber Line)回線等の有線でも、IrDA(Infrared Data Association)やリモコンのような赤外線、Bluetooth(登録商標)、IEEE802.11無線、HDR(High Data Rate)、NFC(Near Field Communication)、DLNA(Digital Living Network Alliance)、携帯電話網、衛星回線、地上波デジタル網等の無線でも利用可能である。なお、本発明は、上記プログラムコードが電子的な伝送で具現化された、搬送波に埋め込まれたコンピュータデータ信号の形態でも実現され得る。
本発明は上述した各実施形態に限定されるものではなく、請求項に示した範囲で種々の変更が可能であり、異なる実施形態にそれぞれ開示された技術的手段を適宜組み合わせて得られる実施形態についても本発明の技術的範囲に含まれる。
本発明は、画像データが階層的に符号化された符号化データを復号する階層画像復号装置、および、画像データが階層的に符号化された符号化データを生成する階層画像符号化装置に好適に適用することができる。また、階層画像符号化装置によって生成され、階層画像復号装置によって参照される階層符号化データのデータ構造に好適に適用することができる。
1、3 階層動画像復号装置(画像復号装置)
11 NAL逆多重化部
12、32 可変長復号部(可変長復号手段)
14、34 予測パラメータ復元部
15、35 テクスチャ復元部
16 ベース復号部
141、341 イントラインター選択部
142、342 イントラ予測選択部
143、343 イントラ予測モード復元部
144 イントラ情報復元部
144H ハイブリッド予測情報復元部
144S レイヤ内イントラ予測情報復元部
144B レイヤ間イントラ予測情報復元部
145 動き情報復元部
151 逆直行変換・逆量子化部
152、352 テクスチャ予測部(予測画像生成手段)
152T インター予測部(レイヤ内予測画像生成手段)
152S レイヤ内イントラ予測部(レイヤ内イントラ予測手段、レイヤ内予測画像生成手段)
152B レイヤ間イントラ予測部(レイヤ間イントラ予測手段)
152H、352H ハイブリッド予測部
152H1E、152H1B 補正単位分割部(補正単位分割手段)
152H2E、152H2B 低周波成分抽出部(低周波成分抽出手段)
161 可変長復号部
162 ベース予測パラメータ復元部
163 ベース変換係数復号部
164 ベーステクスチャ復元部
2 階層動画像符号化装置(画像符号化装置)
21 予測パラメータ決定部
22、42 予測情報生成部
221 イントラインター予測情報設定部
223 空間予測モード予測情報設定部
224、424 イントラ予測情報設定部
224H、424H ハイブリッド予測情報設定部
224S、424S レイヤ内イントラ予測情報設定部
224B、424B レイヤ間イントラ予測情報設定部
225 動き補償予測情報設定部
23、43 ベース復号部
24、44 テクスチャ情報生成部
241、441 テクスチャ予測部
241T、441T インター予測部
241S、441S レイヤ内イントラ予測部
241B、441B レイヤ間イントラ予測部
241H、441H ハイブリッド予測部
25 可変長符号化部
26 NAL多重化部
352H1E、352H1B 補正単位分割部(補正単位分割手段)
352H2E、352H2B 低周波成分抽出部(低周波成分抽出手段)
352H5 補正単位決定部(補正単位決定手段)

Claims (13)

  1. 階層符号化された符号化データに含まれる上位レイヤの符号化データを復号し、下位レイヤの復号画像を参照して生成した上位レイヤの予測画像を用いて上位レイヤの復号画像を復元する画像復号装置であって、
    上位レイヤの復号画像を参照してレイヤ内予測画像を生成するレイヤ内予測画像生成手段と、
    レイヤ内予測画像の低周波成分を下位レイヤの復号画像の低周波成分により置き換えることで予測画像を生成するハイブリッド予測手段を備えることを特徴とする画像復号装置。
  2. 上記レイヤ内予測画像、および、上記下位レイヤ復号画像を補正単位に分割する補正単位分割手段と、
    上記補正単位で、上記レイヤ内予測画像、および、上記下位レイヤ復号画像の低周波成分を抽出する低周波成分抽出手段を備え、
    上記ハイブリッド予測手段は、上記補正単位分割手段により補正単位に分割された上記レイヤ内予測画像から上記低周波成分抽出手段により抽出した低周波成分を、上記補正単位分割手段により補正単位に分割された上記下位レイヤ復号画像から上記低周波成分抽出手段により抽出した低周波成分に置き換えることで、予測画像を生成することを特徴とする請求項1に記載の画像復号装置。
  3. 予測情報に係るシンタックス値を復号する可変長復号手段と、
    上記予測情報に係るシンタックス値に基づいて、空間予測モードを含む予測パラメータを復元する予測パラメータ復元手段を備え、
    上記空間予測モードの示す予測方法で、対象予測単位の周辺領域の復号画像を参照してレイヤ内イントラ予測画像を生成するレイヤ内イントラ予測手段を備え、
    上記レイヤ内予測画像は、上記レイヤ内イントラ予測画像であることを特徴とする請求項1から請求項2に記載の画像復号装置。
  4. 上記低周波成分抽出手段は、上記補正単位の画素値の平均値を上記低周波成分として抽出することを特徴とする請求項2および請求項3に記載の画像復号装置。
  5. 上記イントラ予測選択手段は、上記空間予測モードと対象予測単位のサイズの組み合わせに基づいて、対象予測単位において、上記ハイブリッド予測と上記レイヤ内イントラ予測の何れを適用するかを示すハイブリッド予測フラグを導出することを特徴とする請求項1から請求項4に記載の画像復号装置。
  6. 上記イントラ予測選択手段は、上記空間予測モードがDC予測である場合に上記レイヤ内イントラ予測を適用することを示し、上記空間予測モードがPlanar予測、または、方向予測である場合に上記ハイブリッド予測を適用することを示すハイブリッド予測フラグを導出することを特徴とする請求項5に記載の画像復号装置。
  7. 上記補正単位分割手段における補正単位サイズを決定する補正単位決定手段を備え、
    上記補正単位決定手段は、上記空間予測モードと対象予測単位のサイズの組み合わせに基づいて、補正単位サイズを決定することを特徴とする請求項2に記載の画像復号装置。
  8. 上記補正単位決定手段は、上記空間予測モードが水平方向に近い方向に対応する方向予測である場合に縦長矩形の補正単位を選択し、上記空間予測モードが垂直方向に近い方向に対応する方向予測である場合に横長矩形の補正単位を選択することを特徴とする請求項7に記載の画像復号装置。
  9. 上記補正単位決定手段は、上記空間予測モードがPlanar予測またはDC予測である場合、上記縦長矩形の補正単位または上記横長矩形の補正単位を選択することを特徴とする請求項7に記載の画像復号装置。
  10. 上記補正単位は、対象符号化単位のサイズに依存せず一定であることを特徴とする請求項2に記載の画像復号装置。
  11. 上記補正単位は、予測単位の最小サイズに等しいことを特徴とする請求項10に記載の画像復号装置。
  12. 上記レイヤ内イントラ予測画像の生成処理には、予測画像生成に用いる参照領域へ既定の低域フィルタを適用する参照画素フィルタ適用処理を含み、
    上記予測タイプがレイヤ内イントラ予測を示す場合は、上記参照画像フィルタ適用処理を実行し、
    上記予測タイプがハイブリッド予測を示す場合は、上記参照画像フィルタ適用処理の実行を省略することを特徴とする請求項4に記載の画像復号装置。
  13. 原画像から下位レイヤの復号画像を参照して生成した上位レイヤの予測画像を減算して得られる残差を階層符号化して上位レイヤの符号化データを生成する画像符号化装置であって、
    予め定められた複数の予測モードの少なくとも一部を含む予測モード群から、一つの予測モードを選択する選択手段と、
    上記選択手段によって選択された予測モードに基づいて、上位レイヤにおける対象予測単位の予測画像を生成する予測画像生成手段とを備え、
    上記予測画像生成手段は、該対象予測単位の予測画像として、
    上位レイヤの復号画像を参照して生成されるレイヤ内予測画像、または
    上記レイヤ内予測画像の低周波成分を下位レイヤの復号画像の低周波成分により置き換えることで生成されるハイブリッド予測画像を生成することを特徴とする画像符号化装置。
JP2012283956A 2012-09-28 2012-12-27 画像復号装置、および画像符号化装置 Pending JP2014082729A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2012283956A JP2014082729A (ja) 2012-09-28 2012-12-27 画像復号装置、および画像符号化装置

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2012215915 2012-09-28
JP2012215915 2012-09-28
JP2012283956A JP2014082729A (ja) 2012-09-28 2012-12-27 画像復号装置、および画像符号化装置

Publications (1)

Publication Number Publication Date
JP2014082729A true JP2014082729A (ja) 2014-05-08

Family

ID=50786515

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012283956A Pending JP2014082729A (ja) 2012-09-28 2012-12-27 画像復号装置、および画像符号化装置

Country Status (1)

Country Link
JP (1) JP2014082729A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110246093A (zh) * 2019-05-05 2019-09-17 北京大学 一种解码图像增强方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110246093A (zh) * 2019-05-05 2019-09-17 北京大学 一种解码图像增强方法
CN110246093B (zh) * 2019-05-05 2021-05-04 北京大学 一种解码图像增强方法

Similar Documents

Publication Publication Date Title
JP6284661B2 (ja) 画像符号化装置、および画像符号化方法
JP6456535B2 (ja) 画像符号化装置、画像符号化方法および記録媒体
US10136151B2 (en) Image decoding device and image decoding method
US10841600B2 (en) Image decoding device, an image encoding device and a decoding method
JP6352248B2 (ja) 画像復号装置、および画像符号化装置
WO2014007131A1 (ja) 画像復号装置、および画像符号化装置
WO2013161690A1 (ja) 画像復号装置および画像符号化装置
JP2014176039A (ja) 画像復号装置、および画像符号化装置
WO2014104242A1 (ja) 画像復号装置、および画像符号化装置
JP2014013975A (ja) 画像復号装置、符号化データのデータ構造、および画像符号化装置
WO2013161689A1 (ja) 動画像復号装置、および動画像符号化装置
JP2014082729A (ja) 画像復号装置、および画像符号化装置
WO2014050554A1 (ja) 画像復号装置、および画像符号化装置
JP2013251827A (ja) 画像フィルタ装置、画像復号装置、画像符号化装置、およびデータ構造
JP2014013976A (ja) 画像復号装置、および画像符号化装置
JP2015076807A (ja) 画像復号装置、画像符号化装置、および符号化データのデータ構造

Legal Events

Date Code Title Description
RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20150423