JP2023087039A

JP2023087039A - インター予測を利用した映像復号化方法、映像復号化装置及び非一時的なコンピュータ可読媒体

Info

Publication number: JP2023087039A
Application number: JP2023076009A
Authority: JP
Inventors: ウォンカン，ゼ; Je Won Kang; ヒョパク，サン; Sang Hyo Park; ウクパク，スン; Seung Wook Park; ピョンイム，ファ; Wha Pyeong Lim
Original assignee: Hyundai Motor Co; Industry Collaboration Foundation of Ewha University; Kia Corp
Current assignee: Hyundai Motor Co; Industry Collaboration Foundation of Ewha University; Kia Corp
Priority date: 2019-06-14
Filing date: 2023-05-02
Publication date: 2023-06-22
Also published as: JP2023093748A; US11190761B2; EP3979649A4; JP2023087040A; KR20200143296A; US11683483B2; EP3979649A1; JP2022536400A; US20210266531A1; US20210409694A1; US20210409695A1; US11683481B2; JP2023087041A; US11677937B2; US11683482B2; US20210409692A1; CN114128285A; US20210409693A1; JP7275326B2; CN114128285B

Abstract

【課題】並進モーションだけでなく、客体の様々な動きに対する補償が可能なコーディングツールを提供する。【解決手段】コーディングしたピクチャのシーケンスのブロック単位の復号化において、ビットストリームから第１のハイレベルシンタックス要素を復号化してアフィン動き予測が許容されるか否かをシーケンスレベルで決定し、第１のハイレベルシンタックス要素に依存し、ビットストリームからコーディングツールに対する第２のハイレベルシンタックス要素を抽出して、コーディングツールの各々が許容されるか否かをピクチャレベルで決定する。コーディングツールは、アフィン動き予測サンプルのサンプル単位調整を含む。映像復号化装置は、対象ブロックに対するアフィン動き予測およびアフィン動き予測サンプルのサンプル単位調整を実行する。【選択図】図５

Description

本発明は、映像（ビデオ）の符号化及び復号化に係り、特に、インター予測の圧縮性能を改善するコーディングツール（ｃｏｄｉｎｇｔｏｏｌ）に関する。

ビデオデータは、音声データや静止画データなどに比べて多くのデータ量を有するため、圧縮のための処理なしにそれ自体を保存又は伝送するためにはメモリを含む多くのハードウェアリソースを必要とする。

したがって、通常、ビデオデータを保存又は送信する際には、符号化器を用いてビデオデータを圧縮して保存又は送信し、復号化器では圧縮したビデオデータを受信して圧縮を解除して再生する。このようなビデオ圧縮技術としては、Ｈ．２６４／ＡＶＣをはじめ、Ｈ．２６４／ＡＶＣに比べて約４０％程度の符号化効率を向上させたＨＥＶＣ（ＨｉｇｈＥｆｆｉｃｉｅｎｃｙＶｉｄｅｏＣｏｄｉｎｇ）が存在する。

しかし、映像のサイズ及び解像度、フレームレートが徐々に増加しており、それによって符号化すべきデータ量も増加しているため、従来の圧縮技術よりも符号化効率が良く、画質改善効果も高い新しい圧縮技術が要求される。

映像（ビデオ）符号化では、圧縮性能の改善のために予測符号化を主に使用する。現在ピクチャ内の既復元したサンプルを使用して符号化しようとする対象ブロックを予測するイントラ予測と、先に復元した参照ピクチャ内を用いて現在ブロックを予測するインター予測が存在する。特に、インター予測は、イントラ予測と比較して圧縮性能に優れ、ビデオ符号化に多く用いられる。

本発明は、既存のインター予測の圧縮性能を改善するコーディングツールを提案する。

本発明は、インター予測の圧縮性能を改善するコーディングツールに係り、一側面として、並進モーション（ｔｒａｎｓｌａｔｉｏｎｍｏｔｉｏｎ）だけでなく、客体の様々な動きに対する補償が可能なコーディングツールに関する。

本発明の一側面は、符号化したピクチャ（ｃｏｄｅｄｐｉｃｔｕｒｅｓ）のシーケンス（ｓｅｑｕｅｎｃｅ）をブロック単位で復号化する画像復号方法を提供する。前記方法は、ビットストリームから第１のハイレベルシンタックス要素を復号化することによってアフィンモーション予測（ａｆｆｉｎｅｍｏｔｉｏｎｐｒｅｄｉｃｔｉｏｎ）が許容されるか否かをシーケンスレベルで設定するステップと、前記第１のハイレベルシンタックス要素に依存して前記ビットストリームから少なくとも１つのコーディングツールの各々に対する１つ以上の第２のハイレベルシンタックス要素を復号化することによって、少なくとも１つのコーディングツールのそれぞれが許容されるか否かをピクチャレベルで設定するステップと、を含み、ここで、前記少なくとも１つのコーディングツールは、アフィンモーション予測サンプルのサンプル単位調整（ｓａｍｐｌｅ－ｂｙ－ｓａｍｐｌｅａｄｊｕｓｔｍｅｎｔ）を含み、さらに前記シーケンスレベルの設定が、前記アフィンモーション予測が許可されることを示すとき、前記アフィンモーション予測を用いて符号化した対象ブロックの複数の制御点動きベクトル（ｃｏｎｔｒｏｌｐｏｉｎｔｍｏｔｉｏｎｖｅｃｔｏｒ）を決定し、前記制御点動きベクトルを用いてサブブロック単位のアフィンモーション予測を実行して、前記対象ブロック内の各サブブロックに対するアフィン予測サンプルを生成するステップと、前記ピクチャレベルの設定に基づいて、前記対象ブロックを含む現在ピクチャに対して前記アフィンモーション予測サンプルのサンプル単位調整が許可されることを識別したとき、前記対象ブロックの制御点動きベクトルに基づいて前記各サブブロック内のサンプルの位置に応じた動きを補償することで前記アフィン予測サンプルのサンプル値を修正するステップと、を含む。

本開示の他側面は、コーディングしたピクチャ（ｃｏｄｅｄｐｉｃｔｕｒｅｓ）のシーケンス（ｓｅｑｕｅｎｃｅ）をブロック単位で復号化する画像復号装置を提供する。前記装置は、ビットストリームから第１のハイレベルシンタックス要素を復号化することによってアフィンモーション予測（ａｆｆｉｎｅｍｏｔｉｏｎｐｒｅｄｉｃｔｉｏｎ）が許可されるか否かをシーケンスレベルで設定し、前記第１のハイレベルシンタックス要素に依存して前記ビットストリームから少なくとも１つのコーディングツールの各々に対する１つ以上の第２のハイレベルシンタックス要素を復号化することによって、前記少なくとも１つのコーディングツールの各々が許容されるか否かをピクチャレベルで設定する復号化部を含む。ここで、前記少なくとも１つのコーディングツールは、アフィンモーション予測サンプルのサンプル単位調整（ｓａｍｐｌｅ－ｂｙ－ｓａｍｐｌｅａｄｊｕｓｔｍｅｎｔ）を含む。さらに、前記装置は、前記シーケンスレベルの決定が、前記アフィンモーション予測が許容されることを示すとき、前記アフィンモーション予測を利用して符号化した対象ブロックの複数の制御点動きベクトル（ｃｏｎｔｒｏｌｐｏｉｎｔｍｏｔｉｏｎｖｅｃｔｏｒ）を決定し、前記制御点動きベクトルを利用して前記サブブロック単位のアフィンモーション予測を実行することによって、前記対象ブロック内の各サブブロックに対するアフィン予測サンプルを生成する予測部を含む。前記予測部は、前記ピクチャレベルの設定に基づいて、前記対象ブロックを含む現在ピクチャに前記アフィンモーション予測サンプルのサンプル単位調整が許可されることを識別したとき、前記対象ブロックの前記制御点動きベクトルに基づき、前記各サブブロック内のサンプル位置に応じた動きを補償することで、前記アフィン予測サンプルのサンプル値を修正する。

本開示のまた他の側面は、ピクチャ（ｃｏｄｅｄｐｉｃｔｕｒｅｓ）のシーケンス（ｓｅｑｕｅｎｃｅ）をブロック単位で符号化する方法を提供する。前記方法は、アフィンモーション予測（ａｆｆｉｎｅｍｏｔｉｏｎｐｒｅｄｉｃｔｉｏｎ）及び少なくとも１つのコーディングツールのすべてがディセーブル（ｄｉｓａｂｌｅ）になるか否かを示すためのシーケンスレベルの第１の高レベルシンタックス要素を前記シーケンスのヘッダに符号化するステップを含み、ここで、前記少なくとも１つのコーディングツールは、アフィンモーション予測サンプルのサンプル単位調整（ｓａｍｐｌｅ－ｂｙ－ｓａｍｐｌｅａｄｊｕｓｔｍｅｎｔ）を含み、さらに前記第１のハイレベルシンタックス要素に依存し、前記少なくとも１つのコーディングツールの各々に対して前記コーディングツールが許容されるか否かについてのシーケンスレベル又はピクチャレベルの設定を示すための１つ以上の第２のハイレベルシンタックス要素を符号化するステップと、第１のハイレベルシンタックス要素が、前記少なくとも１つのコーディングツールの全てがディセーブル（ｄｉｓａｂｌｅ）にならないことを示す場合、符号化しようとする対象ブロックに対する制御点動きベクトル（ｃｏｎｔｒｏｌｐｏｉｎｔｍｏｔｉｏｎｖｅｃｔｏｒ）を決定し、前記制御点動きベクトルを利用してサブブロック単位のアフィンモーション予測を実行することで、各サブブロックに対するアフィン予測サンプルを生成するステップと、前記対象ブロックを含む現在ピクチャに対して前記アフィンモーション予測サンプルのサンプル単位調整が許容される場合、前記対象ブロックの制御点動きベクトルに基づいて前記各サブブロック内のサンプル位置に応じた動きを補償することで、前記アフィン予測サンプルのサンプル値を修正するステップと、を含む。

本発明の技術を具現できる映像符号化装置についての例示的なブロック図である。ＱＴＢＴＴＴ構造を用いてブロックを分割する方法を説明するための図である。複数のイントラ予測モードを示す図である。現在ブロックの周辺ブロックについての例示図である。本発明の技術を具現できる映像復号化装置の例示的なブロック図である。本発明が提供する双方向オプティカルフロー（ｂｉ－ｐｒｅｄｉｃｔｉｏｎｏｐｔｉｃａｌｆｌｏｗ）の概念を説明するための例示図である。双方向オプティカルフローにてブロック境界サンプルに対する勾配（ｇｒａｄｉｅｎｔ）を導出する方法を説明するための例示図である。本発明が提供するアフィンモーション予測（ａｆｆｉｎｅｍｏｔｉｏｎｐｒｅｄｉｃｔｉｏｎ）を説明するための例示図である。本発明が提供するアフィンモーション予測（ａｆｆｉｎｅｍｏｔｉｏｎｐｒｅｄｉｃｔｉｏｎ）を説明するための例示図である。周辺ブロックの並進モーションベクトル（ｔｒａｎｓｌａｔｉｏｎｍｏｔｉｏｎｖｅｃｔｏｒ）からアフィンモーション予測のためのマージ候補を導出する方法を説明するための例示図である。本発明が提供する照明補償の一実施例に係る照明補償パラメータを導出する方法を説明するための例示図である。本発明が提供する照明補償の一実施例に係る照明補償パラメータを導出する方法を説明するための例示図である。本発明が提供する照明補償の一実施例に係る照明補償パラメータを導出する方法を説明するための例示図である。本発明が提供する照明補償の他の実施例に係り、対象ブロックを複数の領域に分割する方法を説明するための例示図である。本発明が提供する照明補償の他の実施例に係り、対象ブロックを４つの領域に分割した場合に補償パラメータを導出するために使用する参照サンプルを決定する方法を説明するための例示図である。本発明が提供する照明補償の他の実施例に係り、対象ブロックを４つの領域に分割した場合、４つの領域に対する照明補償パラメータを用いて照明補償を実行する方法を説明するための例示図である。本発明が提供する照明補償の他の実施例に係り、対象ブロックを４つの領域に分割した場合、４つの領域に対する照明補償パラメータを用いて照明補償を実行する方法を説明するための例示図である。本発明が提供する照明補償の他の実施例に係り、対象ブロックを２つの領域に分割した場合に各領域に対する照明補償を実行する方法を説明するための例示図である。本発明が提供する照明補償の他の実施例に係り、対象ブロックを２つの領域に分割した場合に各領域に対する照明補償を実行する方法を説明するための例示図である。本発明が提供する照明補償の他の実施例に係り、対象ブロックが４つ以上の複数個の領域に分割した場合に、各領域に対する照明補償を行う方法を説明するための例示図である。

以下、本発明の一部の実施例を例示的な図面を通して詳しく説明する。各図面の構成要素に識別符号を付加する際に、同一の構成要素に対しては、たとえ他の図面に表示されても可能な限り同一の符号を有するようにしていることに留意しなければならない。なお、本発明の説明にて、関連する公知の構成又は機能についての具体的な説明が本発明の要旨を曖昧にすると判断する場合には、その詳しい説明は省く。

図１は、本開示の技術を具現する映像符号化装置についての例示的なブロック図である。以下では、図１を参照し、映像符号化装置と、この装置のサブ構成について説明する。

映像符号化装置は、ピクチャー分割部１１０、予測部１２０、減算器１３０、変換部１４０、量子化部１４５、並べ替え部１５０、エントロピー符号化部１５５、逆量子化部１６０、逆変換部１６５、加算器１７０、ループフィルタ部１８０、及びメモリ１９０を含んで構成する。

映像符号化装置の各構成要素は、ハードウェア又はソフトウェアで具現してもよく、ハードウェア及びソフトウェアの組み合わせで具現してもよい。さらに、各構成要素の機能がソフトウェアで具現され、マイクロプロセッサが各構成要素に対応するソフトウェアの機能を実行するように具現してもよい。

１つの画像（ビデオ）は、複数のピクチャを含む１つ以上のシーケンスで構成する。各ピクチャは複数の領域に分割され、各領域毎に符号化が行われる。例えば、１つのピクチャは、１つ以上のタイル（Ｔｉｌｅ）又は／及びスライス（Ｓｌｉｃｅ）に分割する。ここで、１つ以上のタイルをタイルグループ（ＴｉｌｅＧｒｏｕｐ）として定義する。各タイル又は／及びスライスは、１つ以上のＣＴＵ（ＣｏｄｉｎｇＴｒｅｅＵｎｉｔ）に分割する。そして、各ＣＴＵは、ツリー構造によって１つ以上のＣＵ（ＣｏｄｉｎｇＵｎｉｔ）に分割する。各ＣＵに適用する情報はＣＵのシンタックスとして符号化され、１つのＣＴＵに含まれるＣＵに共通に適用する情報はＣＴＵのシンタックスとして符号化する。また、１つのスライス内のすべてのブロックに共通に適用する情報は、スライスヘッダのシンタックスとして符号化され、１つ以上のピクチャを構成するすべてのブロックに適用する情報は、ピクチャパラメータセット（ＰＰＳ、ＰｉｃｔｕｒｅＰａｒａｍｅｔｅｒＳｅｔ）又はピクチャヘッダに符号化する。さらに、複数のピクチャからなるシーケンスに共通に参照する情報は、シーケンスパラメータセット（ＳＰＳ、ＳｅｑｕｅｎｃｅＰａｒａｍｅｔｅｒＳｅｔ）に符号化する。さらに、１つのタイル又はタイルグループに共通に適用する情報は、タイル又はタイルグループヘッダのシンタックスとして符号化してもよい。ＳＰＳ、ＰＰＳ、スライスヘッダ、タイル又はタイルグループヘッダに含まれるシンタックスは、ハイレベル（ｈｉｇｈｌｅｖｅｌ）シンタックスと称する。

ピクチャー分割部１１０は、ＣＴＵ（ＣｏｄｉｎｇＴｒｅｅＵｎｉｔ）の大きさを決定する。ＣＴＵのサイズに関する情報（ＣＴＵｓｉｚｅ）は、ＳＰＳ又はＰＰＳのシンタックスとして符号化して映像復号化装置に伝達する。

ピクチャー分割部１１０は、映像を構成する各ピクチャを予め決めた大きさを有する複数のＣＴＵ（ＣｏｄｉｎｇＴｒｅｅＵｎｉｔ）に分割した後に、ツリー構造（ｔｒｅｅｓｔｒｕｃｔｕｒｅ）を用いてＣＴＵを繰り返し（ｒｅｃｕｒｓｉｖｅｌｙ）分割する。ツリー構造におけるリーフノード（ｌｅａｆｎｏｄｅ）が符号化の基本単位であるＣＵ（ｃｏｄｉｎｇｕｎｉｔ）となる。

ツリー構造では、上位ノード（あるいは親ノード）が同じサイズの４つの下位ノード（あるいは子ノード）に分割するマスクワッドツリー（ＱｕａｄＴｒｅｅ，ＱＴ）、又は上位ノードが２つの下位ノードに分割するバイナリツリー（ＢｉｎａｒｙＴｒｅｅ，ＢＴ）、又は上位ノードが１：２：１の比率で３つの下位ノードに分割するターナリーツリー（ＴｅｒｎａｒｙＴｒｅｅ，ＴＴ）、又はこれらのＱＴ構造、ＢＴ構造、及びＴＴ構造のうちの２つ以上を混用した構造である。例えば、ＱＴＢＴ（ＱｕａｄＴｒｅｅｐｌｕｓＢｉｎａｒｙＴｒｅｅ）構造を使用することができ、又はＱＴＢＴＴＴ（ＱｕａｄＴｒｅｅｐｌｕｓＢｉｎａｒｙＴｒｅｅＴｅｒｎａｒｙＴｒｅｅ）構造を使用する。ここで、ＢＴＴＴを合わせてＭＴＴ（Ｍｕｌｔｉｐｌｅ－ＴｙｐｅＴｒｅｅ）と称する。

図２は、ＱＴＢＴＴＴ分割ツリー構造を示す。図２に示すように、ＣＴＵはまずＱＴ構造に分割するマスクワッドツリー分割は、分割ブロック（ｓｐｌｉｔｔｉｎｇｂｌｏｃｋ）のサイズがＱＴで許容されるリーフノードの最小ブロックサイズ（ＭｉｎＱＴＳｉｚｅ）に達するまで繰り返す。ＱＴ構造の各ノードが下位レイヤーの４つのノードに分割するか否かを指示する第１のフラグ（ＱＴ＿ｓｐｌｉｔ＿ｆｌａｇ）は、エントロピー符号化部１５５によって符号化され、映像復号化装置にシグナリングされる。ＱＴのリーフノードがＢＴで許容されるルートノードの最大ブロックサイズ（ＭａｘＢＴＳｉｚｅ）よりも大きくない場合、ＢＴ構造又はＴＴ構造のうちのいずれか１つ以上にさらに分割する。ＢＴ構造及び／又はＴＴ構造では、複数の分割方向が存在する。例えば、該当ノードのブロックが横に分割する方向と縦に分割する方向の２つが存在する。図２に示すように、ＭＴＴ分割を開始すると、ノードを分割したか否かを指示する第２のフラグ（ｍｔｔ＿ｓｐｌｉｔ＿ｆｌａｇ）と、分割した場合には追加に分割方向（ｖｅｒｔｉｃａｌ又はｈｏｒｉｚｏｎｔａｌ）を示すフラグ及び／又は分割タイプ（ＢｉｎａｒｙもしくはＴｅｒｎａｒｙ）を示すフラグが、エントロピー符号化部１５５によって符号化され、映像復号化装置にシグナリングされる。対案して、各ノードを下位レイヤーの４つのノードに分割するか否かを指示する第１のフラグ（ＱＴ＿ｓｐｌｉｔ＿ｆｌａｇ）を符号化する前に、そのノードを分割するか否かを指示するＣＵ分割フラグ（ｓｐｌｉｔ＿ｃｕ＿ｆｌａｇ）が符号化されてもよい。ＣＵ分割フラグ（ｓｐｌｉｔ＿ｃｕ＿ｆｌａｇ）値を分割にならないことを指示する場合、該当ノードのブロックが分割ツリー構造におけるリーフノード（ｌｅａｆｎｏｄｅ）となり、符号化の基本単位であるＣＵ（ｃｏｄｉｎｇｕｎｉｔ）となる。ＣＵ分割フラグ（ｓｐｌｉｔ＿ｃｕ＿ｆｌａｇ）値を分割することを指示する場合、映像符号化装置は、前述したように第１のフラグから符号化を開始する。

ツリー構造の他の例としてＱＴＢＴを使用する場合、該当ノードのブロックを同一サイズの２つのブロックに横に分割するタイプ（すなわち、ｓｙｍｍｅｔｒｉｃｈｏｒｉｚｏｎｔａｌｓｐｌｉｔｔｉｎｇ）と縦に分割するタイプ（すなわち、ｓｙｍｍｅｔｒｉｃｖｅｒｔｉｃａｌｓｐｌｉｔｔｉｎｇ）の２つがある。ＢＴ構造の各ノードを下位レイヤーのブロックに分割するか否かを指示する分割フラグ（ｓｐｌｉｔ＿ｆｌａｇ）、及び分割するタイプを指示する分割タイプ情報がエントロピー符号化部１５５によって符号化されて映像復号化装置に伝達される。一方、該当ノードのブロックを互いに非対称型の２つのブロックに分割するタイプが追加でさらに存在してもよい。非対称型には、該当ノードのブロックを１：３のサイズ比率を有する２つの長方形ブロックに分割する形態を含んでもよく、あるいは、該当ノードのブロックを対角線方向に分割する形態を含んでもよい。

ＣＵは、ＣＴＵからのＱＴＢＴ又はＱＴＢＴＴＴ分割によって様々なサイズを有する。以下では、符号化又は復号化しようとするＣＵ（すなわち、ＱＴＢＴＴＴのリーフノード）に該当するブロックを「現在ブロック」と称する。ＱＴＢＴＴＴ分割の採用によって現在ブロックの形状は正方形だけでなく長方形でもよい。

予測部１２０は、現在ブロックを予測して予測ブロックを生成する。予測部１２０は、イントラ予測部１２２とインター予測部１２４を含む。

イントラ予測部１２２は、現在ブロックを含む現在ピクチャ内で現在ブロックの周辺に位置するサンプル（参照サンプル）を用いて現在ブロック内のサンプルを予測する。予測方向によって複数のイントラ予測モードが存在する。例えば、図３に示すように、複数のイントラ予測モードは、プラナー（ｐｌａｎａｒ）モードとＤＣモードを含む２つの非方向性モードと６５個の方向性モードを含む。各予測モードによって使用する周辺サンプルと演算式が異なるように定義する。

イントラ予測部１２２は、現在ブロックを符号化するために使用するイントラ予測モードを決定する。一部の例で、イントラ予測部１２２は、いろんなイントラ予測モードを使用して現在ブロックを符号化し、テストしたモードから使用する適切なイントラ予測モードを選択してもよい。例えば、イントラ予測部１２２は、いろいろテストしたイントラ予測モードに対するレートディストーション（ｒａｔｅ－ｄｉｓｔｏｒｔｉｏｎ）分析を用いてレート歪み値を演算し、テストしたモードの中で最良のレート歪み特徴を有するイントラ予測モードを選択してもよい。

イントラ予測部１２２は、複数のイントラ予測モードの中から１つのイントラ予測モードを選択し、選択したイントラ予測モードによって決定する周辺サンプル（参照サンプル）と演算式を用いて現在ブロックを予測する。選択したイントラ予測モードに関する情報は、エントロピー符号化部１５５によって符号化されて映像復号化装置に伝達される。

インター予測部１２４は、動き補償過程を通じて現在ブロックに対する予測ブロックを生成する。インター予測部１２４は、現在ピクチャよりも前に符号化及び復号化した参照ピクチャ内で現在ブロックと最も類似したブロックを探索し、その探索したブロックを用いて現在ブロックに対する予測ブロックを生成する。そして、現在ピクチャ内の現在ブロックと参照ピクチャ内の予測ブロックとの間の変位（ｄｉｓｐｌａｃｅｍｅｎｔ）に該当する動きベクトル（ｍｏｔｉｏｎｖｅｃｔｏｒ）を生成する。一般に、動き推定はルマ（ｌｕｍａ）成分に対して行われ、ルマ成分に基づいて演算したモーションベクトルはルマ成分及びクロマ成分の両方に対して使用する。現在ブロックを予測するために用いる参照ピクチャに関する情報及び動きベクトルに関する情報を含む動き情報は、エントロピー符号化部１５５によって符号化されて映像復号化装置に伝達される。

インター予測部１２４は、予測の精度を高めるために、参照ピクチャ又は参照ブロックに対する補間を行ってもよい。すなわち、連続する２つの整数サンプル間のサブサンプルは、その２つの整数サンプルを含む連続した複数の整数サンプルにフィルタ係数を適用して補間する。補間した参照ピクチャに対して現在ブロックと最も類似したブロックを探索する過程を実行すると、動きベクトルは整数サンプル単位の精度（ｐｒｅｃｉｓｉｏｎ）ではなく小数単位の精度まで表現する。動きベクトルの精度又は解像度（ｒｅｓｏｌｕｔｉｏ）は、符号化しようとする対象領域、例えばスライス、タイル、ＣＴＵ、ＣＵなどの単位ごとに異なるように設定する。このような適応的動きベクトル解像度を適用する場合、各対象領域に適用する動きベクトル解像度に関する情報は、対象領域ごとにシグナリングしなければならない。例えば、対象領域がＣＵである場合、各ＣＵ毎に適用した動きベクトル解像度に関する情報をシグナリングする。動きベクトル解像度に関する情報は、後述する差分動きベクトルの精度を示す情報である。

一方、インター予測部１２４は、双方向予測（ｂｉ－ｐｒｅｄｉｃｔｉｏｎ）を用いてインター予測を行う。双方向予測の場合、２つの参照ピクチャと各参照ピクチャ内で現在ブロックと最も類似したブロック位置を表す２つの動きベクトルを使用する。インター予測部１２４は参照ピクチャリスト０（ＲｅｆＰｉｃＬｉｓｔ０）及び参照ピクチャリスト１（ＲｅｆＰｉｃＬｉｓｔ１）からそれぞれ第１の参照ピクチャ及び第２の参照ピクチャを選択し、各参照ピクチャ内で現在ブロックと類似のブロックを探索して第１の参照ブロックと第２の参照ブロックを作成する。そして、第１の参照ブロックと第２の参照ブロックを平均又は加重平均して現在ブロックに対する予測ブロックを生成する。そして、現在ブロックを予測するために使用した２つの参照ピクチャに関する情報及び２つの動きベクトルに関する情報を含む動き情報をコーディングユニット１５０に伝達する。ここで、参照ピクチャリスト０は、既復元ピクチャのうちからディスプレイ順で現在ピクチャより前のピクチャで構成し、参照ピクチャリスト１は、既復元のピクチャのうちからディスプレイ順で現在ピクチャ以降のピクチャで構成してもよい。しかしながら、必ずしもこれに限定せず、ディスプレイ順序上で現在ピクチャより後の既復元ピクチャを参照ピクチャリスト０に追加でさらに含み、逆に現在ピクチャより前の既復元ピクチャを参照ピクチャリスト１に追加でさらに含んでもよい。

動き情報を符号化するのに所要のビット量を最小化するために様々な方法を使用する。

例えば、現在ブロックの参照ピクチャと動きベクトルが周辺ブロックの参照ピクチャ及び動きベクトルと同一場合には、その周辺ブロックを識別できる情報を符号化することで、現在ブロックの動き情報を復号化装置に伝達できる。このような方法を「マージモード（ｍｅｒｇｅｍｏｄｅ）」とする。

マージモードで、インター予測部１２４は、現在ブロックの周辺ブロックから既に決定した個数のマージ候補ブロック（以下、「マージ候補」とする）を選択する。

マージ候補を誘導するための周辺ブロックとしては、図４に示すように、現在ピクチャ内で現在ブロックに隣接する左側ブロックＬ、上段ブロックＡ、右上段ブロックＡＲ、左下段ブロックＢＬ、左上段ブロックＡＬのうち、全部又は一部を用いる。さらに、現在ブロックが位置する現在ピクチャではなく参照ピクチャ（現在ブロックを予測するために使用した参照ピクチャと同じでも異なってもよい）内に位置するブロックをマージ候補として使用してもよい。例えば、参照ピクチャ内で現在ブロックと同じ位置にあるブロック（ｃｏ－ｌｏｃａｔｅｄｂｌｏｃｋ）、又はその同じ位置のブロックに隣接するブロックを、マージ候補として追加でさらに使用する。

インター予測部１２４は、このような周辺ブロックを用いて予め決まった個数のマージ候補を含むマージリストを構成する。マージリストに含まれるマージ候補の中から現在ブロックの動き情報として使用するマージ候補を選択し、選択した候補を識別するためのマージインデックス情報を生成する。生成したマージインデックス情報は、エントロピー符号化部１５５によって符号化されて復号化装置に伝達される。

動き情報を符号化するためのまた他の方法はＡＭＶＰモードである。

ＡＭＶＰモードでは、インター予測部１２４は、現在ブロックの周辺ブロックを用いて現在ブロックの動きベクトルに対する予測動きベクトル候補を導出する。予測動きベクトル候補を導くために使用する周辺ブロックとしては、図４に示す現在ピクチャ内で現在ブロックに隣接する左側ブロックＬ、上段ブロックＡ、右上段ブロックＡＲ、左下段ブロックＢＬ、左上段ブロックＡＬのうち、全部又は一部を用いる。さらに、現在ブロックが位置する現在ピクチャではなく、参照ピクチャ（現在ブロックを予測するために使用した参照ピクチャと同じでも異なっていてもよい）内に位置するブロックを、予測動きベクトル候補を導出するために使用する周辺ブロックとして使用してもよい。例えば、参照ピクチャ内の現在ブロックと同じ位置にあるブロック（ｃｏ－ｌｏｃａｔｅｄｂｌｏｃｋ）、又はその同じ位置のブロックに隣接するブロックを使用する。

インター予測部１２４は、この周辺ブロックの動きベクトルを用いて予測動きベクトル候補を導き出し、予測動きベクトル候補を用いて現在ブロックの動きベクトルに対する予測動きベクトルを決定する。そして、現在ブロックの動きベクトルから予測動きベクトルを減算して差分動きベクトルを算出する。

予測動きベクトルは、予測動きベクトル候補に予め定義した関数（例えば、中央値、平均値演算など）を適用して求める。この場合、映像復号化装置も予め定義した関数を知っている。また、予測動きベクトル候補を導出するために使用する周辺ブロックは既に符号化及び復号化が完了したブロックであるため、映像復号化装置もその周辺ブロックの動きベクトルも既に知っている。したがって、映像符号化装置は、予測動きベクトル候補を識別するための情報を符号化する必要がない。したがって、この場合、差分動きベクトルに関する情報と現在ブロックを予測するために使用した参照ピクチャに関する情報を符号化する。

一方、予測動きベクトルは、予測動きベクトル候補のうちのいずれか１つを選択する方法で決定してもよい。この場合、差分動きベクトルに関する情報及び現在ブロックを予測するために使用した参照ピクチャに関する情報と共に、選択した予測動きベクトル候補を識別するための情報を追加で符号化する。

減算器１３０は、現在ブロックからイントラ予測部１２２又はインター予測部１２４によって生成した予測ブロックを減算して残差ブロックを生成する。

変換部１４０は、残差ブロックを１つ以上のサブブロックに分割し、変換を１つ以上のサブブロックに適用して変換ブロックの残差値をサンプルドメインから周波数ドメインに変換する。周波数ドメインで、変換したブロックは、１つ以上の変換係数値を含む係数ブロック（ｃｏｅｆｆｉｃｉｅｎｔｂｌｏｃｋ）又は変換ブロック（ｔｒａｎｓｆｏｒｍｂｌｏｃｋ）と称する。変換には二次元変換カーネルを使用してもよく、横方向変換と縦方向にそれぞれ一次元変換カーネルを使用してもよい。変換カーネルは、離散コサイン変換（ＤＣＴ）、離散サイン変換（ＤＳＴ）などに基づく。

変換部１４０は、残差ブロックの全体サイズを変換単位として用いて残差ブロック内の残差信号を変換する。あるいは、残差ブロックを複数個のサブブロックに分割し、そのサブブロックを変換単位として使用してサブブロック内の残差信号を変換してもよい。

一方、変換部１４０は、残差ブロックに対して横方向と縦方向に個別に変換を行う。変換のために、様々なタイプの変換関数又は変換マトリックスを使用する。例えば、横方向変換と縦方向変換のための変換関数のペアをＭＴＳ（ＭｕｌｔｉｐｌｅＴｒａｎｓｆｏｒｍＳｅｔ）と定義する。変換部１４０は、ＭＴＳのうち、変換効率が最も良い１つの変換関数ペアを選択し、横方向及び縦方向にそれぞれ残差ブロックを変換する。ＭＴＳの中から選択した変換関数ペアに関する情報（ｍｔｓ＿ｉｄｘ）は、エントロピー符号化部１５５によって符号化され、映像復号化装置にシグナリングされる。

量子化部１４５は、変換部１４０から出力する変換係数を量子化パラメータを用いて量子化し、量子化した変換係数をエントロピー符号化部１５５に出力する。量子化部１４５は、任意のブロック又はフレームに対して変換なしに、関連する残差ブロックを直ちに量子化してもよい。量子化部１４５は、変換ブロック内の変換係数の位置によって互いに異なる量子化係数（スケーリング値）を適用してもよい。二次元に配列した量子化した変換係数に適用する量子化係数の行列は、符号化されて映像復号化装置にシグナリングされる。

並べ替え部１５０は、量子化した残差値に対して係数値の並べ替えを行う。並べ替え部１５０は、係数スキャニング（ｃｏｅｆｆｉｃｉｅｎｔｓｃａｎｎｉｎｇ）を介して２次元の係数アレイを１次元の係数シーケンスに変更する。例えば、並べ替え部１５０では、千鳥状スキャン（Ｚｉｇ－ＺａｇＳｃａｎ）又は対角線スキャン（ＤｉａｇｏｎａｌＳｃａｎ）を用いてＤＣ係数から高周波領域の係数までスキャンして１次元の係数シーケンスを出力する。変換単位のサイズ及びイントラ予測モードによって、千鳥状スキャンの代わりに２次元の係数アレイを列方向にスキャンする垂直スキャン、２次元のブロック形状係数を行方向にスキャンする水平スキャンを使用してもよい。すなわち、変換単位のサイズ及びイントラ予測モードによって、千鳥状スキャン、対角線スキャン、垂直スキャン、及び水平スキャンの中から使用するスキャン方法を決定してもよい。

エントロピー符号化部１５５は、ＣＡＢＡＣ（Ｃｏｎｔｅｘｔ－ｂａｓｅｄＡｄａｐｔｉｖｅＢｉｎａｒｙＡｒｉｔｈｍｅｔｉｃＣｏｄｅ）、指数ゴロム（ＥｘｐｏｎｅｎｔｉａｌＧｏｌｏｍｂ）などの様々な符号化方式を用いて、並べ替え部１５０から出力した１次元の量子化した変換係数のシーケンスを符号化することによってビットストリームを生成する。

また、エントロピー符号化部１５５は、ブロック分割に関するＣＴＵサイズ、ＣＵ分割フラグ、ＱＴ分割フラグ、ＭＴＴ分割タイプ、ＭＴＴ分割方向などの情報を符号化し、映像復号化装置が映像符号化装置と同じようにブロックを分割できるようにする。また、エントロピー符号化部１５５は、現在ブロックをイントラ予測によって符号化したのか、それともインター予測によって符号化したかの如何を指示する予測タイプに関する情報を符号化し、予測タイプによってイントラ予測情報（すなわち、イントラ予測モードに関する情報）又はインター予測情報（マージモードの場合はマージインデックス、ＡＭＶＰモードの場合は参照ピクチャインデックス及び差分動きベクトルに関する情報）を符号化する。また、エントロピー符号化部１５５は、量子化に関する情報、すなわち量子化パラメータに関する情報及び量子化行列に関する情報を符号化する。

逆量子化部１６０は、量子化部１４５から出力する量子化した変換係数を逆量子化して変換係数を生成する。逆変換部１６５は、逆量子化部１６０から出力する変換係数を周波数ドメインから空間ドメインに変換して残差ブロックを復元する。

加算部１７０は、復元した残差ブロックと予測部１２０によって生成した予測ブロックを加算して現在ブロックを復元する。復元した現在ブロック内のサンプルは、次の順序のブロックをイントラ予測するときの参照サンプルとして使用する。

ループフィルタ部１８０は、ブロックベースの予測及び変換／量子化によって発生するブロッキングアーチファクト（ｂｌｏｃｋｉｎｇａｒｔｉｆａｃｔｓ）、リンギングアーチファクト（ｒｉｎｇｉｎｇａｒｔｉｆａｃｔｓ）、ぼかしアーチファクト（ｂｌｕｒｒｉｎｇａｒｔｉｆａｃｔｓ）等を低減するために復元したサンプルに対するフィルタリングを実行する。ループフィルタ部１８０は、デブロッキングフィルタ１８２、ＳＡＯ（ＳａｍｐｌｅＡｄａｐｔｉｖｅＯｆｆｓｅｔ）フィルタ１８４、ＡＬＦ（ＡｄａｐｔｉｖｅＬｏｏｐＦｉｌｔｅｒ）１８６のうちの１つ以上を含む。

デブロッキングフィルタ１８２は、ブロック単位の符号化／復号化によって発生するブロッキング現象（ｂｌｏｃｋｉｎｇａｒｔｉｆａｃｔ）を除去するために復元したブロック間の境界をフィルタリングし、ＳＡＯフィルタ１８４はデブロッキングフィルタリングした画像に対して追加のフィルタリングを実行する。ＳＡＯフィルタ１８４は、損失符号化（ｌｏｓｓｙｃｏｄｉｎｇ）によって発生する復元したサンプルと元本サンプルとの間の差を補償するために使用するフィルタであり、各復元したサンプルにそれに対応するオフセットに加算される方式で実行する。ＡＬＦ１８６は、フィルタリングを実行する対象サンプル及びその対象サンプルの周囲サンプルにフィルタ係数を適用して対象サンプルに対するフィルタリングを実行する。ＡＬＦ１８６は、画像に含まれるサンプルを所定のグループに分割した後、該当グループに適用する１つのフィルタを決定してグループ毎に差別的にフィルタリングを行う。ＡＬＦに使用するフィルタ係数に関する情報は符号化され、映像復号化装置にシグナリングされる。

ループフィルタ部１８０を介してフィルタリングした復元ブロックは、メモリ１９０に保存する。１つのピクチャ内のすべてのブロックが復元すると、復元したピクチャは、後で符号化しようとするピクチャ内のブロックをインター予測するための参照ピクチャとして使用される。

図５は、本開示の技術を具現する映像復号化装置の例示的な機能ブロック図である。以下では、図５を参照し、映像復号化装置とこの装置の下位構成について説明する。

映像復号化装置は、エントロピー復号化部５１０、並べ替え部５１５、逆量子化部５２０、逆変換部５３０、予測部５４０、加算器５５０、ループフィルタ部５６０、及びメモリ５７０を含むように構成する。

図１の映像符号化装置と同様に、映像復号化装置の各構成要素は、ハードウェア又はソフトウェアで具現するか、ハードウェア及びソフトウェアの組み合わせで具現する。さらに、各構成要素の機能をソフトウェアで具現し、マイクロプロセッサが各構成要素に対応するソフトウェアの機能を実行するように具現してもよい。

エントロピー復号化部５１０は、映像符号化装置によって生成したビットストリームを復号化してブロック分割に関する情報を抽出することにより復号化しようとする現在ブロックを決定し、現在ブロックを復元するために必要な予測情報と残差信号に関する情報などを抽出する。

エントロピー復号化部５１０は、ＳＰＳ（ＳｅｑｕｅｎｃｅＰａｒａｍｅｔｅｒＳｅｔ）又はＰＰＳ（ＰｉｃｔｕｒｅＰａｒａｍｅｔｅｒＳｅｔ）からＣＴＵサイズに関する情報を抽出してＣＴＵのサイズを決定し、ピクチャを決定したサイズのＣＴＵに分割する。そして、ＣＴＵをツリー構造の最上位レイヤー、すなわちルートノードとして決定し、ＣＴＵの分割情報を抽出することにより、ツリー構造を用いてＣＴＵを分割する。

例えば、ＱＴＢＴＴＴ構造を用いてＣＴＵを分割する場合、まずＱＴの分割に関連する第１のフラグ（ＱＴ＿ｓｐｌｉｔ＿ｆｌａｇ）を抽出して各ノードを下位レイヤーの４つのノードに分割する。そして、ＱＴのリーフノードに該当するノードについては、ＭＴＴの分割に関連する第２のフラグ（ＭＴＴ＿ｓｐｌｉｔ＿ｆｌａｇ）及び分割方向（ｖｅｒｔｉｃａｌ／ｈｏｒｉｚｏｎｔａｌ）及び／又は分割タイプ（ｂｉｎａｒｙ／ｔｅｒｎａｒｙ）情報を抽出して当該リーフノードをＭＴＴ構造に分割する。これにより、ＱＴのリーフノード以下の各ノードをＢＴ又はＴＴ構造に繰り返し（ｒｅｃｕｒｓｉｖｅｌｙ）分割する。

また他の例として、ＱＴＢＴＴＴ構造を用いてＣＴＵを分割する場合、まずＣＵを分割するか否かを指示するＣＵ分割フラグ（ｓｐｌｉｔ＿ｃｕ＿ｆｌａｇ）を抽出し、該当ブロックが分割した場合、第１のフラグ（ＱＴ＿ｓｐｌｉｔ＿ｆｌａｇ）を抽出してもよい。分割の過程で、各ノードは、０回以上の繰り返しのＱＴ分割後に０回以上の繰り返しのＭＴＴ分割が発生する。例えば、ＣＴＵはすぐにＭＴＴ分割が発生するか、逆に複数回のＱＴ分割のみが発生し得る。

他の例として、ＱＴＢＴ構造を用いてＣＴＵを分割する場合、ＱＴの分割に関連する第１のフラグ（ＱＴ＿ｓｐｌｉｔ＿ｆｌａｇ）を抽出して各ノードを下位レイヤーの４つのノードに分割する。そして、ＱＴのリーフノードに該当するノードについては、ＢＴにさらに分割するか否かを指示する分割フラグ（ｓｐｌｉｔ＿ｆｌａｇ）及び分割方向情報を抽出する。

一方、エントロピー復号化部５１０は、ツリー構造の分割を通じて復号化しようとする現在ブロックを決定すると、現在ブロックがイントラ予測したか、それともインター予測したかを指示する予測タイプに関する情報を抽出する。予測タイプ情報がイントラ予測を指示する場合、エントロピー復号化部５１０は、現在ブロックのイントラ予測情報（イントラ予測モード）に対するシンタックス要素（ｅｌｅｍｅｎｅｔ）を抽出する。予測タイプ情報がインター予測を指示する場合、エントロピー復号化部５１０は、インター予測情報に対するシンタックス要素、すなわち動きベクトル及びその動きベクトルが参照する参照ピクチャを示す情報を抽出する。

また、エントロピー復号化部５１０は、量子化に関する情報、及び残差信号に関する情報として現在ブロックの量子化した変換係数に関する情報を抽出する。

並べ替え部５１５は、映像符号化装置によって実行した係数スキャニング順序の逆順で、エントロピー復号化部５１０でエントロピー復号化した１次元の量子化した変換係数のシーケンスを再び２次元の係数アレイ（つまり、ブロック）に変更する。

逆量子化部５２０は、量子化パラメータを用いて量子化した変換係数を逆量子化する。逆量子化部５２０は、２次元に配列した量子化した変換係数に対して互いに異なる量子化係数（スケーリング値）を適用してもよい。逆量子化部５２０は、映像符号化装置から量子化係数（スケーリング値）の行列を量子化した変換係数の２次元アレイに適用して逆量子化を行う。

逆変換部５３０は、逆量子化した変換係数を周波数ドメインから空間ドメインに逆変換して残差信号を復元することにより、現在ブロックに対する復元した残差ブロックを生成する。また、ＭＴＳが適用した場合、逆変換部５３０は、映像符号化装置からシグナリングされたＭＴＳ情報（ｍｔｓ＿ｉｄｘ）を用いて、横及び縦方向にそれぞれ適用する変換関数又は変換行列を決定し、決定した変換関数を用いて横方向及び縦方向に変換ブロック内の変換係数に対して逆変換を実行する。

予測部５４０は、イントラ予測部５４２及びインター予測部５４４を含む。イントラ予測部５４２は、現在ブロックの予測タイプがイントラ予測であるときに活性化し、インター予測部５４４は、現在ブロックの予測タイプがインター予測であるときに活性化する。

イントラ予測部５４２は、エントロピー復号化部５１０から抽出したイントラ予測モードに対するシンタックス要素から複数のイントラ予測モードのうち、現在ブロックのイントラ予測モードを決定し、イントラ予測モードによって現在ブロック周囲の参照サンプルを利用して現在ブロックを予測する。

インター予測部５４４は、エントロピー復号化部５１０から抽出したイントラ予測モードに対するシンタックス要素を用いて現在ブロックの動きベクトルとその動きベクトルが参照する参照ピクチャを決定し、動きベクトルと参照ピクチャを利用して現在ブロックを予測する。

加算器５５０は、逆変換部から出力する残差ブロックと、インター予測部又はイントラ予測部から出力する予測ブロックを加算して現在ブロックを復元する。復元した現在ブロック内のサンプルは、後で復号化するブロックをイントラ予測する際の参照サンプルとして活用する。

ループフィルタ部５６０は、デブロッキングフィルタ５６２、ＳＡＯフィルタ５６４、及びＡＬＦ５６６のうちの少なくとも１つを含む。デブロッキングフィルタ５６２は、ブロック単位の復号化によって発生するブロッキング現象（ｂｌｏｃｋｉｎｇａｒｔｉｆａｃｔ）を除去するために、復元したブロック間の境界をデブロッキングフィルタリングする。ＳＡＯフィルタ５６４は、損失符号化（ｌｏｓｓｙｃｏｄｉｎｇ）によって発生する復元したサンプルと原本サンプルとの間の差を補償するために、デブロッキングフィルタリング後の復元したブロックにそれに対応するオフセットに加算される方式でフィルタリングを実行する。ＡＬＦ５６６は、フィルタリングを実行する対象サンプル及びその対象サンプルの周囲サンプルにフィルタ係数を適用し、対象サンプルに対するフィルタリングを実行する。ＡＬＦ５６６は、画像に含まれるサンプルを所定のグループに分割した後に、該当グループに適用する１つのフィルタを決定してグループ毎に差別的にフィルタリングを行う。ＡＬＦのフィルタ係数は、ビットストリームから復号化したフィルタ係数に関する情報を利用して決定される。

ループフィルタ部５６０を介してフィルタリングした復元ブロックはメモリ５７０に保存する。１つのピクチャ内のすべてのブロックが復元すると、復元したピクチャは、後で符号化しようとするピクチャ内のブロックをインター予測するための参照ピクチャとして使用する。

以下の開示は、インター予測の圧縮性能を向上させるためのコーディングツールと関連し、映像符号化装置のインター予測部１２４及び映像復号化装置のインター予測部５４４で行う。以下で使用する「対象ブロック（ｔａｒｇｅｔｂｌｏｃｋ）」という用語は、上で使用した現在ブロック又はコーディングユニットＣＵと同じ意味で使用し、又はコーディングユニットの一部の領域を意味してもよい。

Ｉ．双方向オプティカルフロー（Ｂｉ－ｄｉｒｅｃｔｉｏｎａｌＯｐｔｉｃａｌＦｌｏｗ）
双方向オプティカルフローは、映像を構成するサンプル又は客体が一定の速度で移動し、サンプル値の変化がほとんどないという仮定に基づき、双方向動き予測を用いて予測したサンプルの動きをさらに補償する技術である。

図６は、ＢＩＯの基本的な概念を説明するための参照図である。

対象ブロックに対する（通常の）双方向動き予測によって参照ピクチャＲｅｆ０とＲｅｆ１で現在ピクチャの符号化する対象ブロックと最も類似した対応領域（すなわち、参照ブロック）を指す双方向の動きベクトルＭＶ_０、ＭＶ_１が決定したと仮定する。該当の２つの動きベクトルは、対象ブロック全体の動きを表す値である。図６の例で、対象ブロック内のサンプルＰに対応するものとして動きベクトルＭＶ_０が指す参照ピクチャＲｅｆ_０内のサンプルはＰ_０であり、対象ブロック内のサンプルＰに対応する動きベクトルＭＶ_１が指す参照ピクチャＲｅｆ_１内のサンプルはＰ_１である。そして、図６でサンプルＰに対する動きが対象ブロックの全体的な動きとは少し異なると仮定する。例えば、図６のＲｅｆ_０内のサンプルＡに位置する物体が現在ピクチャの対象ブロック内のサンプルＰを通過してＲｅｆ_１内のサンプルＢに移動したとすると、サンプルＡ及びサンプルＢはかなり類似した値を有する。なお、この場合、対象ブロック内のサンプルＰと最も類似したＲｅｆ_０内の地点は、双方向動きベクトルＭＶ_０が指すＰ_０ではなく、Ｐ_０を所定の変位ベクトルｖ_ｘｔ_０、ｖ_ｙｔ_１だけ移動させたＡであり、対象ブロック内のサンプルＰと最も類似したＲｅｆ_１内の地点は、双方向動きベクトルＭＶ_１が指すＰ_１ではなく、Ｐ_１を所定の変位ベクトル－ｖ_ｘｔ_０、－ｖ_ｙｔ_１だけ移動させたＢである。ｔ_０とｔ_１は、現在ピクチャに基づいてそれぞれＲｅｆ_０とＲｅｆ_１に対する時間軸距離を意味し、ＰＯＣ（ＰｉｃｔｕｒｅＯｒｄｅｒＣｏｕｎｔ）に基づいて算出する。以下では、（ｖ_ｘ、ｖ_ｙ）を「オプティカルフロー（ｏｐｔｉｃａｌｆｌｏｗ）」と称する。

現在ピクチャ内対象ブロックのサンプルＰ値を予測する際に、２つの参照サンプルＡ、Ｂの値を用いると、双方向動きベクトルＭＶ_０、ＭＶ_１が指す参照サンプルＰ_０、Ｐ_１を利用するよりも、もっと正確な予測が可能である。

対象ブロック内サンプルｉ，ｊに対応するもので動きベクトルＭＶ０が指す参照ピクチャＲｅｆ_０内サンプルの値をＩ^（０）（ｉ，ｊ）と定義し、対象ブロック内サンプルｉ，ｊに対応するものとして動きベクトルＭＶ_１が指す参照ピクチャＲｅｆ_１内のサンプルの値をＩ^（１）（ｉ，ｊ）と定義する。

ＢＩＯ動きベクトルｖ_ｘ、ｖ_ｙが対象ブロック内のサンプルに対応することを指す参照ピクチャＲｅｆ_０内のサンプルＡの値はＩ^（０）（ｉ＋ｖ_ｘｔ_０、ｊ＋ｖ_ｙｔ_０）と定義することができ、参照ピクチャＲｅｆ_１内のサンプルＢの値は、Ｉ^（１）（ｉ‐ｖ_ｘｔ_１、ｊ‐ｖ_ｙｔ_１）として定義する。ここで、テイラー級数の一次項のみを用いて線形近似（ｌｉｎｅａｒａｐｐｒｏｘｉｍａｔｉｏｎ）を行うと、ＡとＢを［数１］のように表現する。

ここで、Ｉ_ｘ ^（ｋ）とＩ_ｙ ^（ｋ）（ｋ＝０，１）はＲｅｆ_０及びＲｅｆ_１の（ｉ，ｊ）位置における横及び縦方向の勾配値を示す。ｔ_０及びｔ_１は、現在ピクチャに基づいてそれぞれＲｅｆ_０及びＲｅｆ_１に対する時間軸距離を意味し、ＰＯＣ（ＰｉｃｔｕｒｅＯｒｄｅｒＣｏｕｎｔ）に基づいて算出する。式でｔ_０＝ＰＯＣ（ｃｕｒｒｅｎｔ）‐ＰＯＣ（Ｒｅｆ_０），ｔ_１＝ＰＯＣ（Ｒｅｆ_１）‐ＰＯＣ（ｃｕｒｒｅｎｔ）である。

ブロック内の各サンプルの双方向オプティカルフロー（ｖ_ｘ、ｖ_ｙ）は、サンプルＡとサンプルＢの差値として定義するΔを最小化する解として決定する。［数１］で導き出したＡとＢの線形近似を用いてΔを［数２］で定義する。

簡略に表記するために、上記［数２］の各項におけるサンプルの位置（ｉ，ｊ）は省く。

より堅牢な（ｒｏｂｕｓｔ）オプティカルフロー推定のために、動きが局所的に周囲のサンプルと一貫しているという仮定を導入する。現在予測しようとするサンプル（ｉ，ｊ）に対するＢＩＯ動きベクトルは、サンプル（ｉ，ｊ）を中心とする一定サイズのマスクΩ内に存在するすべてのサンプル（ｉ’、ｊ’）に対する［数２］の差分値△を考慮する。すなわち、現在のサンプル（ｉ，ｊ）に対するオプティカルフローは、次の［数３］のように、マスクΩ内の各サンプルに対して得られた差分値Δ［ｉ’，ｊ’］の二乗和である目的関数Φ（ｖｘ，ｖｙ）を最小にするベクトルとして決定する。

本開示の双方向オプティカルフローは、双方向予測に使用する２つの参照ピクチャのうちの１つは現在ピクチャよりもディスプレイ順序上先行し、もう１つは現在ピクチャよりも遅く、２つの参照ピクチャから現在ピクチャまでの距離が互いに同一、すなわち、各参照ピクチャと現在ピクチャとの間のＰＯＣ（ｐｉｃｔｕｒｅｏｒｄｅｒｃｏｕｎｔ）の差が同じの場合に適用する。したがって、ｔ_０とｔ_１は無視できる。

さらに、本開示の双方向オプティカルフローは、ルマ（ｌｕｍａ）成分にのみ適用してもよい。

本開示の双方向オプティカルフローは、双方向予測を適用する対象ブロックに対してピクセルベースではなくサブブロックベースで実行する。サブブロックのサイズは、２×２、４×４、８×８など多様なサイズを有するが、以下では説明の便宜のためにサブブロックのサイズを４×４と仮定する。

オプティカルフローを実行する前に、映像符号化装置のインター予測部１２４は、前述した双方向予測を用いて対象ブロックに対する２つの参照ブロックを生成する。２つの参照ブロックのうちの第１の参照ブロックは、対象ブロックの第１の動きベクトルＭＶ_０を用いて参照ピクチャＲｅｆ_０から生成した予測サンプルからなるブロックを意味し、第２の参照ブロックは対象ブロックの第２の動きベクトルＭＶ_１を用いて参照ピクチャＲｅｆ_１から生成した予測サンプルからなるブロックを意味する。

インター予測部１２４は、第１の参照ブロックと第２の参照ブロック内の予測サンプルの横及び縦方向勾配値を用い、対象ブロックを構成する４×４サブブロックのそれぞれに対してオプティカルフローと称する（ｖ_ｘ、ｖ_ｙ）を演算する。オプティカルフロー（ｖ_ｘ、ｖ_ｙ）は、参照ピクチャＲｅｆ_０から予測サンプルと参照ピクチャＲｅｆ_１からの予測サンプル間の差が最小になるように決定する。インター予測部１２４は、４×４サブブロックに対して算出した（ｖ_ｘ、ｖ_ｙ）とは、４×４サブブロック内の予測サンプルの勾配を用い、サブブロックに対する双方向予測サンプルを修正するためのサンプルオフセットを導出する。

具体的には、インター予測部１２４は、［数４］を用いて（ｉ，ｊ）位置のサンプル値の横及び縦方向勾配を演算する。

ｋは０又は１であり、Ｉ^（０）（ｉ，ｊ）及びＩ^（１）（ｉ，ｊ）はそれぞれ第１の参照ブロック及び第２の参照ブロック内（ｉ，ｊ）位置のサンプル値を意味する。Ｓｈｉｆｔ１は、ｓｈｉｆｔ１＝ｍａｘ（６，ｂｉｔＤｅｐｔｈ－６）のように、ルマ成分に対するビット－デプス（ｂｉｔ－ｄｅｐｔｈ）から導出する値である。

各参照ブロックの境界に位置するサンプルの勾配を導くために、第１の参照ブロックと第２の参照ブロックの境界の外郭のサンプルが必要である。したがって、図６に示すように、各参照ブロックは、左右にそれぞれ１列ずつ、そして上下にそれぞれ１行ずつ拡張する。演算量を減らすために、拡張した部分の各サンプルは、参照ブロック内の最も近い位置のサンプル又は整数サンプルでパディングする。さらに、各参照ブロックの境界の外郭のサンプル位置における勾配も、最も近い位置のサンプルに該当する勾配でパディングする。

インター予測部１２４は、図７に示すような４×４サブブロックをカバーする６×６ウィンドウ内の横及び縦の勾配を用い、勾配の自己相関（ａｕｔｏ－ｃｏｒｒｅｌａｔｉｏｎ）と交差相関（ｃｒｏｓｓ－ｃｏｒｒｅｌａｔｉｏｎ）に該当するＳ１、Ｓ２、Ｓ３、Ｓ５、Ｓ６を演算する。

ここで、Ωはサブブロックをカバーするウィンドウを意味する。また、下の［数６］に示すように、Ψ_ｘ（ｉ，ｊ）は、第１の参照ブロックと第２の参照ブロック内の（ｉ，ｊ）位置における横方向勾配値の和を、Ψ_ｙ（ｉ，ｊ）は、第１の参照ブロックと第２の参照ブロック内の（ｉ，ｊ）位置における縦方向勾配値の和を意味し、θ（ｉ，ｊ）は第２の参照ブロック内の（ｉ，ｊ）位置のサンプル値と第１の参照ブロック内の（ｉ，ｊ）位置のサンプル値との差を意味する。

ここで、ｎ_ａとｎ_ｂはビットデプスから導出する値で、ｍｉｎ（１，ｂｉｔＤｅｐｔｈ－１１）及びｍｉｎ（４，ｂｉｔＤｅｐｔｈ－８）の値を有する。

インター予測部１２４は、Ｓ１、Ｓ２、Ｓ３、Ｓ５、Ｓ６を用いて、［数７］を介して、４×４サブブロックに対するオプティカルフロー（ｖｘ、ｖｙ）を演算する。

ここで、

、

である。

は切捨て関数である。

である。

対象ブロックの４×４サブブロック内の各サンプル位置（ｘ，ｙ）における予測サンプルを修正するためのサンプルオフセットは、［数８］のように、その４×４サブブロックに対して演算したオプティカルフロー及びサンプル位置（ｘ、ｙ）における勾配値を用いて演算する。式８にて、ｒｎｄ（）は四捨五入（ｒｏｕｎｄ－ｏｆｆ）演算を意味する。

インター予測部１２４は、（ｘ，ｙ）位置におけるサンプルオフセットｂ（ｘ，ｙ）と、第１の参照ブロック及び第２の参照ブロック内の予測サンプルＩ^（０）（ｘ，ｙ）及びＩ^（１）（ｘ，ｙ）を用いて［数９］のように最終予測サンプルｐｒｅｄ（ｘ，ｙ）を生成する。

ここで、ｓｈｉｆｔはＭａｘ（３，１５‐ＢｉｔＤｅｐｔｈ）であり、Ｏ_{ｏｆｆｓｅｔ}は四捨五入演算のための値でｓｈｉｆｔの半分である。

上で説明したように、双方向オプティカルフロー技法は、双方向予測に使用した動き情報（２つの動きベクトル及び２つの参照ピクチャ）を利用して予測した予測サンプルの値を用いる。したがって、映像復号化装置のインター予測部５４４も、映像符号化装置から受信した双方向予測に使用する動き情報（動きベクトル、参照ピクチャ）を用いて映像符号化装置と同一の方式で双方向オプティカルフローを行う。映像符号化装置から映像復号化装置への、双方向オプティカルフロープロセスのための追加情報のシグナリングは要求されない。

ＩＩ．アフィンモーション予測（ＡｆｆｉｎｅＭｏｔｉｏｎＰｒｅｄｉｃｔｉｏｎ）
これまで述べたインター予測は並進モーション（ｔｒａｎｓｌａｔｉｏｎｍｏｔｉｏｎ）モデルを反映した動き予測である。すなわち、横方向（ｘ軸方向）及び縦方向（ｙ軸方向）への動きを予測する技法である。しかしながら、実際には、並進モーションの以外に、回転（ｒｏｔａｔｉｏｎ）、ズームイン（ｚｏｏｍ－ｉｎ）、又はズームアウト（ｚｏｏｍ－ｏｕｔ）のような多様な形態の動きが存在する。本開示の一側面は、このような様々な形態の動きをカバーするアフィンモーション予測を提供する。

図８は、アフィンモーション予測を説明するための例示図である。

アフィンモーション予測のための２つのタイプのモデルが存在する。１つは、図８（Ａ）に示すように、現在符号化しようとする対象ブロックの左上角（ｔｏｐ－ｌｅｆｔｃｏｒｎｅｒ）と右上角（ｔｏｐ－ｒｉｇｈｔｃｏｒｎｅｒ）の２つの制御点（ｃｏｎｔｒｏｌｐｏｉｎｔ）の動きベクトル、すなわち、４個のパラメータを利用するモデルである。もう１つは、図８（Ｂ）に示すように、対象ブロックの左上角、右上角、左下角（ｂｏｔｔｏｍ－ｌｅｆｔｃｏｒｎｅｒ）の３つの制御点の動きベクトル、すなわち、６つのパラメータを用いるモデルである。

４パラメータアフィンモデルは、［数１０］のように表現する。対象ブロック内のサンプル位置（ｘ、ｙ）における動きは、［数１０］によって演算する。ここで、対象ブロックの左上段サンプルの位置を（０，０）と仮定する。

６パラメータアフィンモデルは、［数１１］のように表現する。対象ブロック内のサンプル位置（ｘ、ｙ）における動きは、［数１１］によって演算する。

ここで、（ｍｖ_０ｘ、ｍｖ_０ｙ）は左上角制御点の動きベクトル、（ｍｖ_１ｘ、ｍｖ_１ｙ）は右上角制御点の動きベクトル、（ｍｖ_２ｘ、ｍｖ_２ｙ）は左下角制御点の動きベクトルである。Ｗは対象ブロックの横長から決定する定数、Ｈは対象ブロックの縦長から決定する定数である。

アフィンモーション予測は、対象ブロック内の各サンプル毎に、［数１０］又は［数１１］を介して演算した動きベクトルを用いて実行する。

代案として、演算の複雑さを減らすために、図９に示すように、対象ブロックから分割したサブブロック単位で行われてもよい。例示的に、サブブロックのサイズは４×４であってもよいし、又は２×２や８×８であってもよい。以下では、対象ブロックに対して４×４サブブロック単位でアフィンモーション予測を行うことを例に説明する。この例は説明の便宜のためだけのものであり、本発明を限定するものではない。

サブブロック単位アフィンモーション予測にて、各サブブロックの動きベクトル（アフィンモーションベクトル）は、［数１０］又は［数１１］の（ｘ、ｙ）に各サブブロックの中心位置を代入することで演算する。ここで、中心位置は、サブブロックの実際の中心点（ｃｅｎｔｅｒｐｏｉｎｔ）であってもよく、その中心点の右下段のサンプル位置であってもよい。例えば、左下段のサンプルの座標が（０，０）である４×４サブブロックの場合、サブブロックの中心位置は（１．５、１．５）でもよく、（２，２）でもよい。各サブブロックに対する予測ブロックは、該当サブブロックのアフィンモーションベクトル（ｍｖ_ｘ、ｍｖ_ｙ）を用いて生成する。

動きベクトル（ｍｖ_ｘ、ｍｖ_ｙ）は、１／１６サンプル精度（ｐｒｅｃｉｓｉｏｎ）を有するように設定する。この場合、［数１］又は［数２］を介して算出した動きベクトル（ｍｖ_ｘ、ｍｖ_ｙ）は１／１６サンプル単位に四捨五入する。一方、アフィンモーション予測でも、一般インター予測と同様に適応的動きベクトル解像度を適用する。この場合、対象ブロックの動きベクトル解像度、すなわち動きベクトルの精度に関する情報は、対象ブロックごとにシグナリングする。

アフィンモーション予測は、輝度（ｌｕｍａ）成分だけでなく色差（ｃｈｒｏｍａ）成分に対しても実行する。４：２：０ビデオフォーマットの場合、輝度成分に対して４×４サブブロック単位のアフィンモーション予測が行われたら、色差成分に対するアフィンモーション予測は２×２サブブロック単位で行われる。色差成分の各サブブロックの動きベクトル（ｍｖ_ｘ、ｍｖ_ｙ）は、対応する輝度成分の動きベクトルから導き出す。代案として、色差成分のアフィンモーション予測のためのサブブロックのサイズは、輝度成分の場合と同一であってもよい。輝度成分に対して４×４サブブロック単位でアフィンモーション予測が行われたら、色差成分に対しても４×４サブブロックサイズでアフィンモーション予測が行われる。この場合、色差成分に対する４×４サイズのサブブロックは、輝度成分に対する４つの４×４サブブロックに対応するので、色差成分のサブブロックに対する動きベクトル（ｍｖｘ、ｍｖｙ）は、対応する輝度成分の４つのサブブロックの動きベクトルの平均演算を通じて算出する。

映像符号化装置は、イントラ予測、インター予測（並進モーション予測）、アフィンモーション予測などを行い、ＲＤ（ｒａｔｅ－ｄｉｓｔｏｒｔｉｏｎ）コスト（ｃｏｓｔ）を演算して最適な予測方法を選択する。アフィンモーション予測を行うために、映像符号化装置のインター予測部１２４は、２つのタイプのモデルのうち、どのタイプを使用するかを決定し、決定したタイプによって２つ又は３つの制御点を決定する。インター予測部１２１４は、制御点の動きベクトルを用いて対象ブロック内の４×４サブブロックのそれぞれに対する動きベクトル（ｍｖｘ、ｍｖｙ）を演算する。そして、各サブブロックの動きベクトル（ｍｖｘ、ｍｖｙ）を用いてサブブロック単位で参照ピクチャ内で動き補償を行うことで、対象ブロック内の各サブブロックに対する予測ブロックを生成する。

映像符号化装置のエントロピー符号化部１５５は、対象ブロックにアフィンモーション予測が適用されたか否かを示すフラグ、アフィンモデルのタイプを示すタイプ情報、及び各制御点の動きベクトルを示す動き情報等を含むアフィン関連シンタックス要素を符号化して映像復号化装置に伝達する。タイプ情報と制御点の動き情報は、アフィンモーション予測が行われる場合にシグナリングされ、制御点の動きベクトルはタイプ情報によって決定した個数だけシグナリングされる。また、適応的動きベクトル解像度を適用する場合、対象ブロックのアフィンモーションベクトルに対する動きベクトル解像度情報がシグナリングされる。

映像復号化装置は、シグナリングしたシンタックスを用いてアフィンモデルのタイプと制御点動きベクトル（ｃｏｎｔｒｏｌｐｏｉｎｔｍｏｔｉｏｎｖｅｃｔｏｒ）を決定し、［数１０］又は［数１１］を用いて対象ブロック内の各４×４サブブロックに対する動きベクトル（ｍｖ_ｘ、ｍｖ_ｙ）を演算する。もし、対象ブロックのアフィンモーションベクトルに対する動きベクトル解像度情報がシグナリングされた場合、動きベクトル（ｍｖ_ｘ、ｍｖ_ｙ）は、四捨五入などの演算に通じて動きベクトル解像度情報によって識別される精度で修正する。

映像復号化装置は、各サブブロックに対する動きベクトル（ｍｖ_ｘ、ｍｖ_ｙ）を用いて参照ピクチャ内で動き補償を行うことで、各サブブロックに対する予測ブロックを生成する。

制御点の動きベクトルを符号化するための所要のビット量を減らすために、前記の一般的なイントラ予測（並進モーション予測）のような方式を適用する。

一例として、マージモードの場合、映像符号化装置のインター予測部１２４は、対象ブロックの周辺ブロックから各制御点の動きベクトルを導出する。インター予測部１２４は、例えば、図４に示す対象ブロックの周辺サンプルＬ、ＢＬ、Ａ、ＡＲ、ＡＬから予め定義した個数のマージ候補を導き出すことで、マージ候補リストを生成する。リストに含まれるマージ候補のそれぞれは、２つ又は３つの制御点の動きベクトルのペアに対応する。

まず、インター予測部１２４は、アフィンモードで決定した周辺ブロックのうち、アフィンモードで予測した周辺ブロックの制御点動きベクトルからマージ候補を導出する。一部の実施例で、アフィンモードで予測した周辺ブロックから導出するマージ候補の個数は制限される。例えば、インター予測部１２４は、Ｌ及びＢＬのうちの１つ、ならびにＡ、ＡＲ、及びＡＬのうちの１つ、合計２つのマージ候補をアフィンモードで予測した周辺ブロックから導出する。優先順位は、Ｌ、ＢＬの順、及びＡ、ＡＲ、ＡＬの順である。

一方、マージ候補の総数が３個以上の場合、インター予測部１２４は周辺ブロックの並進モーションベクトル（ｔｒａｎｓｌａｔｉｏｎａｌｍｏｔｉｏｎｖｅｃｔｏｒ）から不十分な数だけのマージ候補を導出する。

図１０は、周辺ブロックの並進モーションベクトル（ｔｒａｎｓｌａｔｉｏｎｍｏｔｉｏｎｖｅｃｔｏｒ）からアフィンモーション予測のためのマージ候補を導出する方法を説明するための例示図である。

インター予測部１２４は、周辺ブロックグループ｛Ｂ２、Ｂ３、Ａ２｝、周辺ブロックグループ｛Ｂ１、Ｂ０｝、周辺ブロックグループ｛Ａ１、Ａ０｝からそれぞれ１つずつの制御点動きベクトルＣＰＭＶ１、ＣＰＭＶ２、ＣＰＭＶ３を導出する。一例として、各周辺ブロックグループ内の優先順位は、Ｂ２、Ｂ３、Ａ２の順、Ｂ１、Ｂ０の順、そしてＡ１、Ａ０の順である。また、参照ピクチャ内の同じ位置ブロック（ｃｏｌｌｏｃａｔｅｄｂｌｏｃｋ）Ｔからまた１つの制御点動きベクトルＣＰＭＶ４を導出する。インター予測部１２４は、４つの制御点動きベクトルのうち、２つ又は３つの制御点動きベクトルを組み合わせて不足する個数だけのマージ候補を生成する。組み合わせの優先順位は下の通りである。各グループ内の要素は、左上角、右上角、左下角制御点の動きベクトルの順で並ぶ。

｛ＣＰＭＶ１、ＣＰＭＶ２、ＣＰＭＶ３｝、｛ＣＰＭＶ１、ＣＰＭＶ２、ＣＰＭＶ４｝、｛ＣＰＭＶ１、ＣＰＭＶ３、ＣＰＭＶ４｝、
｛ＣＰＭＶ２、ＣＰＭＶ３、ＣＰＭＶ４｝、｛ＣＰＭＶ１、ＣＰＭＶ２｝、｛ＣＰＭＶ１、ＣＰＭＶ３｝

インター予測部１２４は、マージ候補リストからマージ候補を選択して対象ブロックに対するアフィンモーション予測を行う。選択した候補が２つの制御点動きベクトルからなる場合、４パラメータモデルを用いてアフィンモーション予測を行う。一方、選択した候補が３つの制御点動きベクトルからなる場合、６パラメータモデルを用いてアフィンモーション予測を行う。映像符号化装置のエントロピー符号化部１５５は、マージ候補リスト内のマージ候補のうち、選択したマージ候補を示すインデックス情報を符号化して映像復号装置にシグナリングする。

映像復号化装置のエントロピー復号化部５１０は、映像符号化装置からシグナリングしたインデックス情報を復号化する。映像復号化装置のインター予測部５４４は、映像符号化装置と同様の方式でマージ候補リストを構成し、インデックス情報によって指示されるマージ候補に対応する制御点動きベクトルを用いてアフィンモーション予測を行う。

他の例として、ＡＭＶＰモードの場合、映像符号化装置のインター予測部１２４は、対象ブロックに対するアフィンモデルのタイプと制御点動きベクトルを決定する。そして、対象ブロックの実際の制御点動きベクトルと各制御点の予測動きベクトルとの差である差分動きベクトル（ｍｏｔｉｏｎｖｅｃｔｏｒｄｉｆｆｅｒｅｎｃｅ）を演算し、各制御点に対する差分動きベクトルを符号化して伝送する。このために、映像符号化装置のインター予測部１２４は、予め定義した個数のアフィンＡＭＶＰリストを構成する。対象ブロックが４パラメータタイプの場合、リストに含まれる候補はそれぞれ２つの制御点動きベクトルのペアからなる。一方、対象ブロックが６パラメータタイプの場合、リストに含まれる候補はそれぞれ３つの制御点動きベクトルのペアからなる。アフィンＡＭＶＰリストは、前述のマージ候補リストを構成する方法と類似した、周辺ブロックの制御点動きベクトル又は並進モーションベクトルを用いて導出する。

しかしながら、アフィンＡＭＶＰリストに含まれる候補を導出するために、図４の周辺ブロックのうち、対象ブロックと同じ参照ピクチャを参照する周辺ブロックのみを考慮する制約事項が存在する。

また、ＡＭＶＰモードでは対象ブロックのアフィンモデルタイプを考慮しなければならない。映像符号化装置は、対象ブロックのアフィンモデルタイプが４パラメータタイプの場合、周辺ブロックのアフィンモデルを用いて２つの制御点動きベクトル（対象ブロックの左上角及び右上角制御点動きベクトル）を導出する。対象ブロックのアフィンモデルタイプが６パラメータタイプの場合、周辺ブロックのアフィンモデルを用いて３つの制御点動きベクトル（対象ブロックの左上角、右上角及び左下角制御点動きベクトル）を導出する。

周辺ブロックが４パラメータタイプの場合、周辺ブロックの２つの制御点動きベクトルを用い、対象ブロックのアフィンモデルタイプによって２つ又は３つの制御点動きベクトルを予測する。例えば、［数１０］で表す周辺ブロックのアフィンモデルを使用する。［数１０］にて、（ｍｖ_０ｘ、ｍｖ_０ｙ）及び（ｍｖ_１ｘ、ｍｖ_１ｙ）は、それぞれ周辺ブロックの左上角（ｔｏｐ－ｌｅｆｔｃｏｒｎｅｒ）及び右上角制御点の動きベクトルに置き換わる。Ｗは周辺ブロックの横方向の長さに置き換わる。対象ブロックの各制御点に対する予測動きベクトルは、（ｘ、ｙ）に対象ブロックの該当制御点の位置と周辺ブロックの左上角位置との間の差を入力することによって導出する。

周辺ブロックが６パラメータタイプの場合、周辺ブロックの３つの制御点動きベクトルを用い、対象ブロックのアフィンモデルタイプによって２つ又は３つの制御点動きベクトルを予測する。例えば、［数１１］で表す周辺ブロックのアフィンモデルを用いる。［数１１］にて、（ｍｖ_０ｘ、ｍｖ_０ｙ）、（ｍｖ_１ｘ、ｍｖ_１ｙ）、及び（ｍｖ_２ｘ、ｍｖ_２ｙ）は、それぞれ周辺ブロックの左上角、右上角及び左下角の制御点動きベクトルに置き換わる。Ｗ及びＨは、それぞれ周辺ブロックの横長及び縦長に置き換わる。対象ブロックの各制御点に対する予測動きベクトルは、（ｘ、ｙ）に対象ブロックの該当制御点の位置と周辺ブロックの左上角位置との間の差を入力することで導出する。

映像符号化装置のインター予測部１２４は、アフィンＡＭＶＰリストから１つの候補を選択し、実際各制御点の動きベクトルと選択した候補の対応する制御点の予測動きベクトルとの間の差分動きベクトルを生成する。映像符号化装置のエントロピー符号化部１５５は、対象ブロックのアフィンモデルタイプを示すタイプ情報、アフィンＡＭＶＰリスト内の候補の中から選択した候補を指示するインデックス情報、及び各制御点に対応する差分動きベクトルを符号化して映像復号化装置に伝達する。

映像復号化装置のインター予測部５４４は、映像符号化装置からシグナリングした情報を用いてアフィンモデルタイプを決定し、各制御点の差分動きベクトルを生成する。そして、映像符号化装置と同様の方式でアフィンＡＭＶＰリストを生成し、アフィンＡＭＶＰリスト内でシグナリングしたインデックス情報によって指示される候補を選択する。映像復号化装置のインター予測部５４４は、選択した候補の各制御点の予測動きベクトルと対応する差分動きベクトルを加算して各制御点の動きベクトルを算出する。

ＩＩＩ．アフィンモーション予測サンプルのサンプル単位の調整
対象ブロックに対するサブブロック単位アフィンモーション予測を述べた。本開示のまた他の側面は、サブブロック単位アフィンモーション予測から生成した予測サンプルのサンプル値をサンプル単位に調整することに関連する。アフィンモーション予測が行われた単位であるサブブロック内で、各サンプルの位置に応じた動きを追加で補償する。

対象ブロックに対するサブブロック単位アフィンモーション予測の結果として生成したいずれか１つのサブブロック内のサンプル値をＩ（ｘ，ｙ）とするとき、映像符号化装置は各サンプル位置における横方向及び縦方向勾配ｇ_ｘ（ｉ，ｊ）とｇ_ｙ（ｉ，ｊ）を計算する。勾配演算のために［数１２］を使用する。

予測サンプルを調整するためのサンプルオフセット（ｓａｍｐｌｅｏｆｆｓｅｔ）ΔＩ（ｉ，ｊ）は、次の式のように演算する。

ここで、Δｍｖ（ｉ，ｊ）は、サンプル（ｉ，ｊ）におけるアフィンモーションベクトルとサブブロックの中心位置におけるアフィンモーションベクトルとの間の差、すなわち、動きオフセットを意味し、対象ブロックのアフィンモデルタイプによって、［数１０］又は［数１１］を適用して演算する。すなわち、［数１０］又は［数１１］の（ｘ、ｙ）＝（ｉ，ｊ）を入力したときの動きベクトルから（ｘ、ｙ）にサブブロック中心位置を入力したときの動きベクトルを減算して計算する。言い換えると、Δｍｖ（ｉ，ｊ）は、［数１０］及び［数１１］の（ｘ、ｙ）をサブブロックの中心位置からサンプル位置（ｉ，ｊ）までの横方向及び縦方向のオフセットで置き換え、最後の項である「＋ｍｖ_０ｘ」と「＋ｍｖ_０ｙ」を除き、式を通じて演算する。中心位置は、サブブロックの実際の中心点（ｃｅｎｔｅｒｐｏｉｎｔ）であってもよく、その中心点の右下段のサンプル位置であってもよい。

一方、Δｍｖ（ｉ，ｊ）の演算に用いられる対象ブロックの各制御点の動きベクトル及び、サンプル位置（ｉ，ｊ）とサブブロック中心位置との間の差は、全てのサブブロックに対して同一である。したがって、Δｍｖ（ｉ，ｊ）値は、１つのサブブロック、例えば、一番目のサブブロックに対してのみ演算され、他のサブブロックに対して再使用され得る。

本開示の技法は、物体が一定の速度で移動し、サンプル値の変化が一定（ｓｍｏｏｔｈ）であるという仮定に基づく。したがって、Δｍｖ（ｉ，ｊ）のｘ成分（Δｍｖ_ｘ）とｙ成分（Δｍｖ_ｙ）にそれぞれ横方向及び縦方向でサンプル勾配値を乗じて横方向へのサンプル変化量と縦方向へのサンプル変化量を求め、２つの変化量を加えてサンプルオフセットΔＩ（ｉ，ｊ）を計算する。

最後に予測サンプルの値は次のように演算する。

アフィンモーション予測サンプルに対するサンプル単位調整を適用する場合、映像符号化装置のインター予測部１２４及び映像復号化装置のインター予測部５４４は、前述したような処理を行ってアフィンモーション予測を通じて生成した予測サンプルのサンプル値を修正する。勾配値は、アフィンモーション予測に通じて生成した予測サンプルから導出し、Δｍｖ（ｉ，ｊ）は対象ブロックの制御点動きベクトルから導出する。したがって、映像符号化装置から映像復号化装置への本技法のプロセスのための追加的な情報のシグナリングは要求されない。

ＩＶ．アフィンモーション予測サンプルに対する地域照明補償（ＬｏｃａｌＩｌｌｕｍｉｎａｔｉｏｎＣｏｍｐｅｎｓａｔｉｏｎ）
地域照明補償技術は、現在ブロックと予測ブロックの照明変化に関する線形モデルを用いて変化量を補償する符号化技術である。映像符号化装置のインター予測部１２４は、対象ブロックの動きベクトル（並進モーションベクトル）を用いて参照ピクチャ内で参照ブロックを決定し、参照ブロックの周辺（上側と左側）の既復元のサンプル及び対象ブロックの周囲（上側と左側）の既復元のサンプルを用いて照明補償のための線形モデルのパラメータを求める。

参照ブロック周辺の既復元のサンプルをｘ、対象ブロック周辺の対応する既復元のサンプルをｙとするとき、［数１５］のようにｙと（Ａｘ＋ｂ）の差の二乗和を最小にするパラメータ（Ａ，ｂ）を導出する。

最終予測サンプルは、［数１６］のように、対象ブロックの動きベクトルによって生成した予測ブロック（参照ブロック）内のサンプルにＡの重みとｂのオフセットを適用して生成する。［数１６］にて、ｐｒｅｄ［ｘ］［ｙ］は対象ブロックの動きベクトルによって生成した（ｘ，ｙ）位置の予測サンプルであり、ｐｒｅｄＬＩＣ［ｘ］［ｙ］は照明補償後の最終予測サンプルである。

本開示のまた他の側面は、このような照明補償技術をアフィンモーション予測と結合する技術に関連する。

前述したように、対象ブロックに対してサブブロック単位アフィンモーション予測を適用する場合、サブブロックそれぞれに対して動きベクトルを生成する。各サブブロックごとに該当動きベクトルを利用して照明補償パラメータを導出して照明補償を実行する場合、演算の複雑さが増加するだけでなく、深刻な遅延問題も発生する。各サブブロック内の復元したサンプルは、次回のサブブロックの照明補償のために必要であるため、隣接するサブブロックが復元するまで（すなわち、サブブロックに対する予測ブロックと残差ブロックの両方を復元するまで）、次回のサブブロックに対する照明補償プロセスを保留しなければならないからである。本開示は、このような問題の改善に関する。

図１１ａ～ｃは、本開示の一実施例による照明補償パラメータを導出するために参照ブロックの位置を決定する様々な例を示す。本実施例は、対象ブロックに対して１つの照明補償パラメータセット（Ａ、ｂ）を導出し、対象ブロック内の全てのサブブロックに対して同じパラメータを適用する。すなわち、対象ブロック全体を１つの照明補償パラメータを介して修正する。

図１１ａに示すように、映像符号化装置のインター予測部１２４は、対象ブロック内の左上段に位置するサブブロックのアフィンモーションベクトル又は対象ブロックの左上角制御点動きベクトルを用いて参照ピクチャ内の参照ブロックの位置を決定する。決定した参照ブロックの周りの既復元のサンプルがパラメータの導出に使用される。代案として、図１１ｂに示すように、対象ブロック内の中央サブブロックのアフィンモーションベクトルを用いて参照ブロックの位置を決定する。参照ブロックの位置を決定すると、参照ブロックの上側と左側に隣接する既復元のサンプル及び対象ブロックの上側と左側に隣接する対応する既復元のサンプルを用いて照明補償パラメータを導出する。

また他の例として、対象ブロック内の複数のサブブロックを使用してもよい。図１１ｃのように、インター予測部１２４は、対象ブロック内の境界に位置するサブブロック（境界サブブロック）のアフィンモーションベクトルを用いて境界サブブロックのそれぞれに対応する参照サブブロックを決定する。照明補償パラメータを導出するためのサンプルは、対象ブロック内の境界サブブロック及びそれに対応する参照サブブロックにそれぞれ隣接する既復元のサンプルから抽出する。対象ブロック内の上側境界に位置するサブブロック及びそれに対応する参照サブブロックに対しては、上側に隣接する既復元のサンプルから抽出し、対象ブロック内の左側境界に位置するサブブロック及びそれに対応する参照サブブロックに対しては、左側に隣接する既復元のサンプルから抽出する。

本実施例は、対象ブロック周辺の既復元のサンプルと参照ブロック周辺の既復元のサンプルを用いて照明補償パラメータが導出されるため、前述した遅延問題を解決できる。しかしながら、サブブロック単位のアフィンモーション予測を適用した対象ブロックにただ１つの照明補償パラメータを適用することは、符号化効率を潜在的に低下させ得る。下で説明する別の実施例は、わずかな複雑さの増加に対するトレードオフ（ｔｒａｄｅｏｆｆ）として符号化効率の増加をもたらす。

本開示の他の実施例によると、映像符号化装置のインター予測部１２４は、対象ブロックを複数の領域（ｒｅｇｉｏｎ）に分割する。各領域は、アフィンモーション予測を実行した単位であるサブブロックを１つ以上含む。インター予測部１２４は、複数の領域に対する照明補償パラメータを算出し、算出した照明補償パラメータを用いて対象ブロック内の領域又はサブブロック単位で照明補償を行う。

１．対象ブロック分割
映像符号化装置のインター予測部１２４は、対象ブロックをアフィンモーション予測が行われた単位であるサブブロックを１つ以上含む複数の領域に分割する。

対象ブロックは、その対象ブロックの制御点動きベクトルを用いて分割する。図１２は、制御点動きベクトルを用いた対象ブロック分割の例である。図１２（Ａ）を参照すると、対象ブロックの左上角制御点動きベクトルＭＶ_０と右上角制御点動きベクトルＭＶ_１との間の角度が鈍角であると（９０度より大きいと）、対象ブロックは縦方向に分割する。例えば、対象ブロックは２つの領域に二等分する。そうでなければ、対象ブロックは縦方向に分割されない。また、図１２（Ｂ）を参照すると、左上角制御点動きベクトルＭＶ_０と左下角制御点動きベクトルＭＶ_２との間の角度が鈍角であると、対象ブロックは横方向に分割、例えば二等分に分割する。そうでなければ、対象ブロックは横方向に分割されない。もし、対象ブロックのアフィンモデルタイプが４パラメータの場合、左下角制御点動きベクトルＭＶ_２は、［数１］の（ｘ，ｙ）に対象ブロックの左下角サンプル座標を入力して導出する。

このように制御点動きベクトルがなす角度に基づき、インター予測部１２４は対象ブロックを分割しないか、２つの領域（横分割の場合は左側領域と右側領域、縦分割の場合は上側領域と下側領域）、又は４つの領域に分割する。２つのベクトルの内積が０より小さいと鈍角であるので、インター予測部１２４は、制御点動きベクトル間の角度が鈍角であるか否かを２つのベクトル間の内積演算を通じて判断する。

前記の例では、２つの制御点動きベクトル間の角度が鈍角の場合、対象ブロックを分割するものとして例示したが、逆に鋭角（９０度より小さい角度）の場合に分割してもよい。

また、対象ブロックの分割のために対象ブロックのサイズを考慮する。例えば、横方向の長さが予め設定の閾値を超えると、対象ブロックを縦方向に分割し、縦長が予め設定の閾値を超えると、対象ブロックを横方向に分割する。対象ブロックを分割するために、対象ブロックのサイズと制御点動きベクトルとの間の角度と共に対象ブロックの分割に用いてもよい。例えば、映像符号化装置は、対象ブロックの横長及び／又は縦長が予め設定の閾値より大きい場合にのみ、制御点動きベクトル間の角度を使用して分割の如何を決定してもよい。他の例として、映像符号化装置は、横長が予め設定の閾値を超える場合に、対象ブロックの左上角及び右上角制御点動きベクトルの間の角度を用いて縦方向への分割の如何を決定する。そして、縦長が予め設定の閾値を超える場合に、対象ブロックの左上角及び左下角制御点動きベクトルの間の角度を用いて縦方向への分割の如何を決定する。

一方、対象ブロックの制御点動きベクトルを用いて対象ブロックを複数の領域に分割するものとして説明したが、本発明はこれに限定されない。例えば、左上角制御点動きベクトルＭＶ_０、右上角制御点動きベクトルＭＶ_１、及び左下角制御点動きベクトルＭＶ_２の代わりに、対象ブロック内の左上段サブブロック、右上段サブブロック及び左下段サブブロックのアフィンモーションベクトルを用いてもよい。

図１２では、対象ブロックが横方向又は縦方向に二等分することを例示したが、本発明がこれに限定するものではない。例えば、対象ブロックは、横方向に複数個及び／又は縦方向に複数個（ｎは１以上）に分割してもよい。あるいは、対象ブロックは、アフィンモーション予測が行われたサブブロック単位に分割してもよい。この場合、１つのサブブロックが１つの領域を構成する。

対象ブロックから分割した各領域は、アフィンモーション予測が行われたサブブロックのサイズ以上でなければならない。つまり、各領域は１つ以上のサブブロックで構成しなければならない。例えば、サブブロックのサイズが４×４の場合、領域のサイズは２ｍ×２ｎ（ｍとｎは２以上の整数）である。

対象ブロックが分割されない場合には、前述した第１の実施例に従って照明補償パラメータを導出する。以下では、対象ブロックが分割した場合に照明補償パラメータを導出する方法を説明する。

２．照明補償パラメータ誘導及び照明補償
映像符号化装置は、複数の領域に対する照明補償パラメータを算出する。複数の照明補償パラメータを用い、対象ブロック内の領域又はサブブロック単位で照明補償を行う。映像符号化装置は、複数の領域のそれぞれに対し、補償パラメータを導出するために使用する現在ピクチャ及び参照ピクチャ内の既復元のサンプル（参照サンプル）を決定する。現在ピクチャ内の参照サンプルは、対象ブロックに隣接する既復元のサンプルから選択する。対象ブロックの左側の境界から離間している領域の場合、対象ブロックの左側に隣接する既復元のサンプルを参照サンプルとして選択する。対象ブロックの上側境界から離間している領域の場合、対象ブロックの上側に隣接する既復元のサンプルを参照サンプルとして選択する。

一方、参照ピクチャ内の参照サンプルは、対象ブロックの制御点動きベクトル又はその制御点動きベクトルから導出した１つ以上の動きベクトルを利用して選択する。以下では、対象ブロックの様々な分割形態によって照明補償パラメータを導出して照明補償を行う方法を説明する。

２．１対象ブロックの４つの領域に分割した場合
まず、横長及び縦長がそれぞれＷ、Ｈである対象ブロックが横方向及び縦方向にそれぞれ分割されて合計４つの領域で構成する場合を例に説明する。

映像符号化装置は、各領域に対する補償パラメータを導出するために使用する現在ピクチャ及び参照ピクチャ内の既復元のサンプル（参照サンプル）を決定する。

図１３は、補償パラメータを導出するために使用する参照サンプルを決定する方法を説明するための例示図である。

対象ブロック内左上段領域の場合、映像符号化装置は現在ピクチャ内で左上段領域の上側に隣接するＴ_０～Ｔ_{ｗ／２‐１}と左側に隣接するＬ_０～Ｌ_{Ｈ／２‐１}を、補償パラメータを誘導するための参照サンプルとして選択する。そして、左上段領域の代表動きベクトルを用いて参照ピクチャ内で左上段領域に対応する参照領域を決定し、その参照領域の上側及び左側に隣接する既復元のサンプルを参照サンプルとして選択する。ここで、左上段領域の代表動きベクトルとしては、対象ブロックの左上角制御点動きベクトルＭＶ_０である。

右上段領域の場合、映像符号化装置は、右上段領域の上側に隣接するＴ_ｗ／２～Ｔ_ｗ－１を、補償パラメータを導くための少なくとも一部の参照サンプルとして選択する。また、対象ブロックの左側に隣接するＬ_０～Ｌ_{Ｈ／２－１}を参照サンプルとして追加で選択する。右上段領域の左側に隣接する既復元のサンプルは存在しないので、対象ブロックの左側のＬ_０～Ｌ_{Ｈ／２－１}を右上段領域の左側の参照サンプルとしてパディングする。そして、映像符号化装置は、右上段領域の代表動きベクトルを用いて参照ピクチャ内で右上段領域に対応する参照領域を決定し、その参照領域の上側に隣接する既復元のサンプルを補償パラメータの導出のための参照サンプルとして選択する。また、対象ブロックの左側に隣接するＬ_０～Ｌ_{Ｈ／２－１}を追加で選択する場合、映像符号化装置は、その参照領域の左側に隣接する既復元のサンプルを参照サンプルとして追加で選択する。ここで、右上段領域の代表動きベクトルは、対象ブロックの右上角制御点動きベクトルＭＶ１である。

左下段領域の場合、映像符号化装置は、左下段領域の左側に隣接するＬ_Ｈ／２～Ｌ_Ｈ‐１を少なくとも一部の参照サンプルとして選択する。また、対象ブロックの上側に隣接するＴ_０～Ｔ_{ｗ／２－１}を追加でさらに選択する。そして、映像符号化装置は、左下段領域の代表動きベクトルを用いて、参照ピクチャ内で左下段領域に対応する参照領域を決定し、その参照領域の左側に隣接する既復元のサンプルを参照サンプルとして選択する。対象ブロックの上側に隣接するＴ_０～Ｔ_{ｗ／２－１}が追加でさらに選択された場合、映像符号化装置は、その参照領域の上側に隣接する既復元のサンプルを追加で選択することができる。ここで、左上段領域の代表動きベクトルは、対象ブロックの左下角制御点動きベクトルＭＶ１である。

対象ブロック内の左上段、右上段、及び左下段領域それぞれに対する参照サンプルを決定すると、映像符号化装置は、［数１５］を用い、ｘに参照ピクチャから選択した参照サンプル、ｙに現在ピクチャから選択した参照サンプルを入力して各領域に対する照明補償パラメータを導出する。

右下段領域の照明補償パラメータは、左上段、右上段、及び左下段領域の照明補償パラメータから導出する。例えば、右下段領域の照明補償パラメータは、右上段領域と左下段領域の照明補償パラメータの平均値に設定する。

あるいは、映像符号化装置は、右下段領域に対する代表動きベクトルを決定し、その代表動きベクトルを用いて右下段領域の照明補償パラメータを導出してもよい。右下段領域に対する代表動きベクトルは、対象ブロックの右下角制御点動きベクトルである。映像符号化装置は、［数１０］又は［数１１］の（ｘ，ｙ）に対象ブロック内の右下角サンプル（右下段の領域の右下角サンプル）の座標（Ｗ‐１，Ｈ‐１）を代入することで、対象ブロックの右下角制御点の移動ベクトルを誘導することができる。対象ブロックの右下段領域に隣接する既復元のサンプルは存在しない。したがって、対象ブロックの上側及び左側にそれぞれ隣接するＴ_ｗ／２～Ｔ_ｗ‐１及びＬ_Ｈ／２～Ｌ_Ｈ‐１を補償パラメータ導出のための参照サンプルとして用いる。そして、対象ブロックの右下角制御点動きベクトルを用いて参照ピクチャ内の参照領域を決定し、その参照領域の上側と左側に隣接する既復元のサンプルを参照サンプルとして選択する。映像符号化装置は、選択した参照サンプルを用い、［数１５］を介して右下段領域に対する照明補償パラメータを導出する。

上の例では、補償パラメータ導出のための参照ピクチャ内の参照サンプルを決定するために、各領域の代表動きベクトルを用い、その例として対象ブロックの制御点動きベクトル（すなわち、アフィンモーション予測のためのパラメータ）を使用した。しかしながら、本発明はこれに限定されず、各領域の代表動きベクトルは、対象ブロックの制御点の動きベクトルから導出した動きベクトルであってもよい。

一例として、各領域の代表動きベクトルは、対象ブロックの制御点の動きベクトルから導出した、予め定義した位置の動きベクトルである。一例として、アフィンモーション予測で予め生成した対象ブロック内の左上段、右上段、左下段、及び右下段の４×４サブブロックのアフィンモーションベクトルを、左上段、右上段、左下段、及び右下段領域の代表動きベクトルとしてそれぞれ使用する。他の例として、左上段、右上段、左下段、及び右下段領域のそれぞれの中心点におけるアフィンモーションベクトルを各領域の代表動きベクトルとして使用してもよい。各領域の中心点におけるアフィンモーションベクトルは、［数１０］又は［数１１］の（ｘ、ｙ）に各領域の中心位置を代入することによって生成する。

他の例として、各領域内のサブブロックのアフィンモーションベクトルの平均値を該当領域の代表動きベクトルとして使用してもよい。

一方、補償パラメータ導出のために使用する参照ピクチャ内の参照サンプルを決定するための方法として、各領域の代表動きベクトルの代わりに各領域内のサブブロックのアフィンモーションベクトルを使用してもよい。すなわち、各領域の４×４サブブロックのアフィンモーションベクトルが指示する位置の４×４参照ブロックを参照ピクチャ内で決定し、４×４参照ブロックの上側と左側に隣接する既復元ピクセルを参照ピクセルとして選択する。

図１４は、対象ブロックの４つの領域に対する照明補償パラメータを用いて照明補償を行う方法を説明するための例示図である。

各領域は、アフィン変換が行われる単位であるサブブロックを１つ以上含む。図１４の例では、対象ブロックの左上段領域ＴＬ、右上段領域ＴＲ、左下段領域ＢＬ、右下段領域ＢＲがそれぞれ４つのサブブロック（４×４サブブロック）を含む。映像符号化装置は、各領域の照明補償パラメータを用い、当該領域内の予測サンプル（アフィンモーション予測を通じて生成した予測サンプル）に対して照明補償を行う。各サブブロックは、自分が属する領域の照明補償パラメータを用いて補償する。例えば、左上段領域に含まれる４つのサブブロックは、左上段領域の照明補償パラメータ（Ａ_０、ｂ_０）を用いて補償する。

一部の他の実施例では、映像符号化装置は、４つの領域（ＴＬ、ＴＲ、ＢＬ、ＢＲ）の照明補償パラメータを用いて各領域内のサブブロックに対応する照明補償パラメータを補間し、補間した照明補償パラメータを使用して各サブブロックに対して照明補償を実行してもよい。前述のように、各領域の照明補償パラメータは、該当領域の代表動きベクトルから導き出す。しかしながら、代表動きベクトルは、該当領域内のすべてのサブブロックの動きを反映できない場合がある。例えば、各領域の照明補償パラメータは、対象ブロックの左上角、右上角、左下角、及び右下角の制御点動きベクトル、又は対象ブロックの左上段、右上段、左下段、及び右下段の４×４サブブロックのアフィンモーションベクトルとして導出する。この場合、左上段、右上段、左下段、及び右下段の４×４サブブロックの動きは、照明補償パラメータの導出にさらに多くの影響を及ぼし得る。したがって、映像符号化装置は、各領域の照明補償パラメータを用いた補間を通じて各サブブロックの照明補償パラメータを導出してもよい。

図１５は、各領域の照明補償パラメータを用いてサブブロックの照明補償パラメータを補間する方法を説明するための例示図である。

（Ａ_０、ｂ_０）から（Ａ_３、ｂ_３）はそれぞれ対象ブロックの左上角、右上角、左下角、及び右下角の制御点動きベクトル、又は対象ブロックの左上段、右上段、左下段、及び右下段の４ｘ４サブブロックのアフィンモーションベクトルから導出した各領域の照明補償パラメータである。（Ａ_０、ｂ_０）は、対象ブロックの左上段領域内の左上段４×４サブブロックの照明補償パラメータであると仮定する。同様に、（Ａ_１、ｂ_１）から（Ａ_３、ｂ_３）は、それぞれ右上段領域内の右上段４×４サブブロックの照明補償パラメータ、左下段領域内の左下段４×４サブブロックの照明補償パラメータ、右下段領域内の右下段４×４サブブロックの照明補償パラメータと仮定する。すなわち、（Ａ_０、ｂ_０）から（Ａ_３、ｂ_３）は、対象ブロックの４つのコーナー（ｃｏｒｎｅｒ）サブブロックの補償パラメータであると仮定する。

映像符号化装置は、４つのコーナー（ｃｏｒｎｅｒ）サブブロックの補償パラメータを用いて他のサブブロックの補償パラメータを補間する。４つのコーナー（ｃｏｒｎｅｒ）サブブロックを用いた二次元補間（ｂｉ－ｌｉｎｅａｒｉｎｔｅｒｐｏｌａｔｉｏｎ）を使用してもよく、又は一次元補間を使用してもよい。例えば、対象ブロック内の最初行のサブブロックは、（Ａ_０、ｂ_０）及び（Ａ_１、ｂ_１）を使用して補間する。対象ブロック内の最初列のサブブロックは、（Ａ_０、ｂ_０）及び（Ａ_２、ｂ_２）を使用して補間する。このような方式で、すべてのサブブロックの補償パラメータを導出する。

ここで、補間に使用するフィルタ係数又は重みは、コーナーサブブロックの位置と対象サブブロックの位置との間の差（又は、コーナーサブブロックと対象サブブロックとの間の距離）に従って設定する。位置差が小さいほど大きな重みが与えられる。

代案として、補間に使用するフィルタ係数又は重みは、コーナーサブブロックの補償パラメータを導出するために使用した動きベクトル（対象ブロックの左上角、右上角、左下角、及び右下角の制御点動きベクトル、又は対象ブロックの左上段、右上段、左下段、及び右下段の４×４サブブロックのアフィンモーションベクトル）と対象サブブロックのアフィンモーションベクトルとの間の差によって設定してもよい。動きベクトル間の差が小さいほど大きな重みが与えられる。

２．２対象ブロックを２つの領域に分割した場合
対象ブロックを２つの領域に分割した場合でも、４つの領域に分割した場合と同様の方式で、各領域の照明補償パラメータを導出する。例えば、図１６を参照すると、映像符号化装置は、上段領域の補償パラメータを導出するための現在ピクチャ内の参照サンプルとして、上段領域の上側に隣接する既復元のサンプルＴ_０～Ｔ_ｗ－１及び上段領域の左側に隣接する既復元のサンプル（Ｌ_０～Ｌ_{Ｈ／２－１}）を選択する。そして、上段領域の代表動きベクトルを用いて参照ピクチャ内の参照領域を決定し、その参照領域の上側と左側に隣接する既復元のサンプルを参照サンプルとして選択する。

上段領域の代表動きベクトルは、対象ブロックの左上角制御点動きベクトルである。代案として、対象ブロックの制御点動きベクトルから導出した動きベクトルである。例えば、上段領域内の左上段４×４サブブロックのアフィンモーションベクトルを用いてもよく、又は上段領域の中心点に該当するアフィンモーションベクトルである。他の例として、各領域内のサブブロックのアフィンモーションベクトルの平均値は該当領域の代表動きベクトルとして使用してもよい。

映像符号化装置は、下段領域の補償パラメータを導出するための現在ピクチャ内の参照サンプルとして、対象ブロックの上側に隣接する既復元のサンプルＴ_０～Ｔ_ｗ‐１及び下段領域の左側に隣接する既復元のサンプル（Ｌ_Ｈ／２～Ｌ_Ｈ－１）を選択する。そして、下段領域の代表動きベクトルを用いて参照ピクチャ内の参照領域を決定し、その参照領域の上側と左側に隣接する既復元のサンプルを参照サンプルとして選択する。

下段領域の代表動きベクトルは、対象ブロックの左下角制御点動きベクトルである。代案として、対象ブロックの制御点動きベクトルから導出した動きベクトルである。例えば、下段領域内の左下段４×４サブブロックのアフィンモーションベクトルを使用してもよく、又は下段領域の中心点に該当するアフィンモーションベクトルである。他の例として、下段領域内のサブブロックのアフィンモーションベクトルの平均値を下段領域の代表動きベクトルとして使用してもよい。

以上では、補償パラメータ導出するために使用する参照ピクチャ内の参照サンプルを決定するための方法として、各領域の代表動きベクトルを用いたが、各領域の代表動きベクトルの代わりに各領域内のサブブロックのアフィンモーションベクトルを用いてもよい。すなわち、各領域に対し、４×４サブブロックのアフィンモーションベクトルが指示する位置の４×４参照ブロックを参照ピクチャ内で決定し、４×４参照ブロックの上側と左側に隣接する既復元のピクセルを参照ピクセルとして選択する。

映像符号化装置は、各領域に対し、参照ピクチャ内で選択した参照サンプル及び現在ピクチャ内で選択した参照サンプルをそれぞれ［数１５］のｘ及びｙに入力して各領域の補償パラメータを導出する。そして、映像符号化装置は、各領域の照明補償パラメータを用い、当該領域内の予測サンプル（アフィンモーション予測を通じて生成した予測サンプル）に対して照明補償を行う。各サブブロックは、自分が属する領域の照明補償パラメータを使用して補償する。

代案として、映像符号化装置は、対象ブロックの４つの領域に分割した場合と同様に、各領域の照明補償パラメータを用いて各サブブロックの照明補償パラメータを補間し、補間したパラメータを各サブブロックに対して照明補償を実行してもよい。

補償パラメータを導出するために使用した各領域の代表動きベクトルが各領域の特定の位置に関連する場合に補間を適用する。例えば、対象ブロックの左上角及び左下角の制御点動きベクトル、又は対象ブロックの左上段及び左下段の４×４サブブロックのアフィンモーションベクトル等が代表動きベクトルとして用いられる場合である。この場合、２つの領域の補償パラメータは、図１７に示すように、対象ブロック内の左上段及び左下段コーナーサブブロックＴＬ、ＢＬの照明補償パラメータと見なす。

映像符号化装置は、上段領域の補償パラメータ（Ａ_０、ｂ_０）と下段領域の補償パラメータ（Ａ_２、ｂ_２）に重みを適用して対象サブブロックの補償パラメータを補間する。このとき、重みは、対象ブロック内の左上段及び左下段コーナーサブブロックと対象サブブロックとの間の距離によって割り当てる。あるいは、２つの領域の補償パラメータを導出するために使用する動きベクトル（対象ブロックの左上角及び左下角の制御点動きベクトル、又は対象ブロックの左上段及び左下段４×４サブブロックのアフィンモーションベクトル）と対象サブブロックのアフィンモーションベクトルとの間の差異によって設定してもよい。動きベクトル間の差異が小さいほど大きな重みが与えられる。

対象ブロックが縦方向に２つの領域に分割した場合でも、横方向に２つの領域に分割した場合と同様の方式を適用する。この場合、２つの領域（左側領域と右側領域）の代表動きベクトルは、一例として、対象ブロックの左上角及び右上角制御点動きベクトル、又は対象ブロックの左上段及び右上段４×４サブブロックのアフィンモーションベクトルである。代案として、各領域の中心点のアフィンモーションベクトル、又は各領域のサブブロックのアフィンモーションベクトルの平均値などを各領域の代表動きベクトルとして使用してもよい。その他の動作は、前述した横方向分割の場合と同様であるか、それから自明に導出が可能であるため、これ以上の詳しい説明は省く。

２．３対象ブロックを４個より多いサブブロックに分割する場合
前述したように、対象ブロックは、横方向及び縦方向にそれぞれ２ｍ及び２ｎ（ｍ及びｎは２以上の整数）に分割してもよい。あるいは、対象ブロックのアフィンモーション予測が行われる単位であるサブブロックに分割してもよい。このような例は図１８に示す。

図１８を参照すると、映像符号化装置は、対象ブロックが左上段領域ＴＬ、右上段領域ＴＲ、左下段領域ＢＬ及び右下段領域ＢＲに対し、２．１で説明したような方式で、照明補償パラメータを導出する。

この４つの領域を除いた残りの領域に対しては、２．１で説明した補間を適用してその残りの領域の照明補償パラメータを導出する。

代案として、残りの領域に対しても、左上段領域ＴＬ、右上段領域ＴＲ、左下段領域ＢＬ及び右下段領域ＢＲの場合と同様の方式で、照明補償パラメータを導出できるだろう。例えば、Ａ領域の場合、映像符号化装置は、Ａ領域の上側に位置し、対象ブロックに隣接する既復元サンプルとＡ領域の左側に位置し、対象ブロックに隣接する既復元サンプルを現在ピクチャ内の参照ピクセルで選択する。そして、Ａ領域の左上角制御点動きベクトル、Ａ領域の左上段に位置する４×４サブブロックのアフィンモーションベクトル、又はＡ領域の中心点のアフィンモーションベクトルなどを用いて参照ピクチャ内の参照サンプルを選択する。選択した参照サンプルを用いてＡ領域の照明補償パラメータを導出する。

上で説明した照明補償技法は、既復元のサンプルとアフィンモーション予測を通じて獲得可能な動きベクトルを利用する技法である。したがって、映像復号化装置も映像符号化装置と同様の方式で照明補償を行う。映像符号化装置から映像復号化装置への照明補償プロセスのための追加情報のシグナリングは要求されない。

一方、前述の照明補償技法は、アフィンモーション予測以外に、対象ブロックに対してサブブロック単位で動きを補償する他のコーディングツールと共に使用してもよい。例えば、双方向オプティカルフローに適用が可能である。映像符号化装置及び映像復号化装置は、対象ブロックに対してサブブロック単位双方向オプティカルフローを実行して各サブブロックに対する予測サンプルを生成し、対象ブロック内の予測サンプルに前述したような照明補償技法を追加で実行する。双方向オプティカルフローに適用する照明補償技法は、次を除いて前述の照明補償技法と同じである。

前述した照明補償技法では、対象ブロックの分割及び対象ブロックから分割した各領域の代表動きベクトル演算のために、対象ブロックの制御点動きベクトル、又はサブブロックのアフィンモーションベクトルを利用した。しかしながら、双方向オプティカルフローの場合には、制御点動きベクトルやアフィンモーションベクトルは存在しない。したがって、双方向オプティカルフローに適用する照明補償技法では、制御点動きベクトル又はサブブロックのアフィンモーションベクトルの代わりにサブブロックのオプティカルフロー（ｖｘ、ｖｙ）を使用する。

Ｖ．シンタックスシグナリング
本開示のまた他の側面は、前述の様々なツールのオン／オフを制御するためのハイレベル（ｈｉｇｈ－ｌｅｖｅｌ）シンタックスのシグナリング技法に関連する。

前述のアフィンモーション予測、アフィンモーション予測サンプルに対するサンプル単位調整、適応的動きベクトル解像度、及び照明補償は、映像符号化の効率を向上させるためのコーディングツールである。しかしながら、例えばスクリーンコンテンツの場合のような、特定のコンテンツの場合には、前述の様々なコーディングツールは圧縮性能の向上に寄与しない可能性がある。したがって、符号化しようとする各コーディングユニット毎に各コーディングツールが適用できるか否かをシグナリングするか、又は適用の如何を決定することは、むしろ符号化効率を低下させるか、演算の複雑さを増加させる。本開示は、前記のコーディングツールを効率的に制御するためのシグナリング技法を提供する。

映像符号化装置は、ピクチャのシーケンスを符号化するために、前述した複数のコーディングツールの全てをディセーブル（ｄｉｓａｂｌｅ）するか否かを示すためのシーケンスレベルの第１のハイレベルシンタックス要素（ｓｙｎｔａｘｅｌｅｍｅｎｔ）を符号化する。第１のハイレベルシンタックス要素は、シーケンスのヘッダ、すなわちＳＰＳ内で符号化される。ここで、複数のコーディングツールは、アフィンモーション予測を含み、また、アフィンモーション予測サンプルに対するサンプル単位調整、適応的動きベクトル解像度、及び照明補償のうちの少なくとも１つを含む。

第１のハイレベルシンタックス要素（ｓｙｎｔａｘｅｌｅｍｅｎｔ）が、複数のコーディングツールすべてがディセーブルになることを示す場合、いかなるコーディングツールも該当シーケンスの符号化に適用されない。つまり、シーケンス内のすべてのピクチャに前述のコーディングツールは適用されない。

第１のハイレベルシンタックス要素（ｓｙｎｔａｘｅｌｅｍｅｎｔ）が、複数のコーディングツールがディセーブルにならないことを示すとき、該当シーケンスの符号化のために複数のコーディングツールを使用できる。例えば、アフィンモーション予測はシーケンス内の全てのピクチャに適用可能である。したがって、映像符号化装置は、コーディングユニットの各々に対してアフィンモーション予測を用いた符号化の適用如何を示すコーディングユニットフラグを符号化して映像復号化装置に伝達する。映像復号化装置は、コーディングユニットフラグによって当該コーディングユニットにアフィンモーション予測が適用されたことを指示した場合、そのコーディングユニットに対して前述したアフィンモーション予測を行う。

一方、映像符号化装置は、第１のハイレベルシンタックス要素（ｓｙｎｔａｘｅｌｅｍｅｎｔ）が、複数のコーディングツールがディセーブルされないことを示すとき、複数のコーディングツールのうち、少なくとも一部に対して各コーディングツールがシーケンスレベル又はピクチャレベルで許容されるか否かを示す１つ以上の第２のハイレベルシンタックス要素を符号化する。

１つ以上の第２のハイレベルシンタックス要素を符号化するための一部の実施例で、映像符号化装置は、各コーディングツールに対し、該当コーディングツールが許容されるか否かを示すシーケンスレベルフラグをＳＰＳ内に符号化する。そのシーケンスレベルフラグが、該当コーディングツールが許容されないことを示す場合、該当コーディングツールは、シーケンスに属するピクチャの符号化に使用されない。そして、映像符号化装置は、シーケンスレベルフラグの値に依存し、前記シーケンスに属するピクチャそれぞれのピクチャヘッダ（すなわち、ＰＰＳ）内に該当コーディングツールが許容されるか否かを示すピクチャレベルフラグを符号化する。例えば、シーケンスレベルフラグは、シーケンスレベルで該当コーディングツールが許可されることを示す場合、該当コーディングツールのピクチャレベルでの許容如何を示すためのピクチャレベルフラグを符号化する。もし、第１のハイレベルシンタックス要素（ｓｙｎｔａｘｅｌｅｍｅｎｔ）が、複数のコーディングツールのすべてがディスエーブルであることを示す場合、又は、シーケンスレベルフラグが、該当コーディングツールがシーケンスレベルで、許容されないことを示す場合、ピクチャレベルフラグは別途符号化されない。この場合、映像復号化装置は、ピクチャレベルフラグを該当コーディングツールが許容されないことを示す値に自動的に設定する。

一方、アフィンモーション予測以外の他のコーディングツールに対するピクチャレベルフラグは、アフィンモーション予測に対するピクチャレベルフラグに依存してシグナリングされてもよい。アフィンモーション予測に対するピクチャレベルフラグが、アフィンモーション予測がピクチャレベルで許容されないことを示すとき、他のコーディングツールに対するピクチャレベルフラグは符号化されず、他のコーディングツールはピクチャレベルでは許可されない。映像復号化装置は、他のコーディングツールに対するピクチャレベルフラグがビットストリームに含まれていないと、それぞれのピクチャレベルフラグを、該当コーディングツールがピクチャレベルで許容されないことを示す値に設定する。

映像復号化装置は、映像符号化装置からシグナリングされたピクチャーレベルフラグ又はその値を自動設定したピクチャーレベルフラグから該当コーディングツールの許容可否をピクチャーレベルで設定できる。

一方、アフィンモーション予測に対する第２のハイレベルシンタックス要素は省略してもよい。この場合、アフィンモーション予測は、第１のハイレベルシンタックスによってシーケンスレベルで許容の如何が制御される。映像復号化装置は、映像符号化装置から第１のハイレベルシンタックスを復号化した後、シーケンスレベルでアフィンモーション予測の許容如何を決定する。

前述したシンタックス構造によると、映像符号化装置は、シーケンスレベルとピクチャレベルの中から適応的にコーディングツールの許容如何を決定する。また、映像復号化装置は、映像符号化装置からシグナリングしたシンタックスを復号化することで、シーケンスレベルとピクチャレベルの中から適応的にコーディングツールの許容可否を決定する。

１つ以上の第２のハイレベルシンタックス要素を符号化するための一部他の実施例で、前述の実施例のピクチャレベルフラグはスライスレベルフラグに置き換わってもよい。即ち、映像符号化装置は、シーケンスレベルフラグが、シーケンスレベルで該当コーディングツールが許容されることを示すとき、当該コーディングツールのスライスレベルでの許容如何を示すためのスライスレベルフラグをスライスヘッダ内に符号化する。シーケンスレベルフラグが、該当コーディングツールが許容されないことを示すとき、スライスレベルフラグは符号化されない。映像符号化装置は、コーディングツールの許容可否をシーケンスレベルとスライスレベルの中から適応的に決定できる。映像復号化装置は、スライスレベルフラグを介して各ツールの許容如何をスライスレベルで決定できる。

１つ以上の第２のハイレベルシンタックス要素を符号化するための一部のまた他の実施例で、シーケンスレベルフラグは省いてもよい。ピクチャレベルフラグ又はスライスレベルフラグは、第１のハイレベルシンタックス要素に依存してシグナリングされる。第１のハイレベルシンタックス要素が複数のコーディングツールが許容されることを示すとき、ピクチャレベルフラグ又はスライスレベルフラグはピクチャヘッダ又はスライスヘッダ内で符号化される。

以上の説明での例示的な実施例は、多くの異なる方式で具現できることを理解しなければならない。１つ以上の例で説明した機能は、ハードウェア、ソフトウェア、ファームウェア、又はこれらの任意の組み合わせで具現できる。本明細書で説明した機能的コンポーネントは、それらの具現独立性を特に強調するために「…部（ｕｎｉｔ）」とラベル付けされていることを理解すべきである。

一方、本開示で説明した様々な機能又は方法は、１つ以上のプロセッサによって読み取って実行できる非一時的記録媒体に保存した命令で具現したもよい。非一時的記録媒体は、例えば、コンピュータシステムによって読み取り可能な形式でデータを保存するあらゆる種類の記録装置を含む。例えば、非一時的記録媒体は、ＥＰＲＯＭ（ｅｒａｓａｂｌｅｐｒｏｇｒａｍｍａｂｌｅｒｅａｄｏｎｌｙｍｅｍｏｒｙ）、フラッシュドライブ、光学ドライブ、磁気ハードドライブ、ソリッドステートドライブ（ＳＳＤ）などのような保存媒体を含む。

以上の説明は、本実施例の技術思想を例示的に説明したものに過ぎず、本実施例が属する技術分野で通常の知識を有する者であれば、本実施例の本質的な特性から逸脱しない範囲で多様な修正及び変形が可能であるだろう。したがって、本実施例は、本実施例の技術思想を限定するものではなく説明するためのものであり、このような実施例によって本実施例の技術思想の範囲を限定するものではない。本実施例の保護範囲は、特許請求の範囲によって解釈するべきであり、それと同等の範囲内にある全ての技術思想は、本実施例の権利範囲に含まれるものと解釈するべきである。

優先権の主張
本特許出願は、本明細書にその全体が参考として含まれる、２０１９年６月１４日付で韓国に出願した特許出願番号第１０－２０１９－００７０６３３号、２０１９年７月８日付で韓国に出願した特許出願番号第１０－２０１９－００８２０１０号、及び２０２０年６月１５日付で韓国に出願した特許出願番号第１０－２０２０－００７２３３２号に対して優先権を主張する。

１１０ピクチャー分割部
１２０、５４０予測部
１２２、５４２イントラ予測部
１２４、５４４インター予測部
１３０減算器
１４０変換部
１４５量子化部
１５０、５１５並べ替え部
１５５エントロピー符号化部
１６０、５２０逆量子化部
１６５、５３０逆変換部
１７０、５５０加算器
１８０、５６０ループフィルタ部
１８２、５６２デブロッキングフィルタ
１８４、５６４ＳＡＯフィルタ
１８６、５６６ＡＬＦ
１９０、５７０メモリ
５１０エントロピー復号化部

Claims

符号化したピクチャ（ｃｏｄｅｄｐｉｃｔｕｒｅｓ）のシーケンス（ｓｅｑｕｅｎｃｅ）をブロック単位で復号化する映像復号化方法において、
ビットストリームから第１のハイレベルシンタックス要素を復号化することで、アフィンモーション予測（ａｆｆｉｎｅｍｏｔｉｏｎｐｒｅｄｉｃｔｉｏｎ）が許容されるか否かをシーケンスレベルで設定するステップと、
前記第１のハイレベルシンタックス要素に依存し、前記ビットストリームから少なくとも１つのコーディングツールのそれぞれに対する１つ以上の第２のハイレベルシンタックス要素を復号化することで、前記少なくとも１つのコーディングツールの各々が許容されるか否かをピクチャレベルで設定するステップと、を含み、
ここで、前記少なくとも１つのコーディングツールは、アフィンモーション予測サンプルのサンプル単位調整（ｓａｍｐｌｅ－ｂｙ－ｓａｍｐｌｅａｄｊｕｓｔｍｅｎｔ）を含み、
さらに、前記シーケンスレベルの設定が、前記アフィンモーション予測が許容されることを示すとき、前記アフィンモーション予測を用いて符号化した対象ブロックの複数の制御点動きベクトル（ａｆｆｉｎｅｍｏｔｉｏｎｐｒｅｄｉｃｔｉｏｎ）を決定し、前記制御点動きベクトルを用いてサブブロック単位のアフィンモーション予測を実行して、前記対象ブロック内の各サブブロックに対するアフィン予測サンプルを生成するステップと、
前記ピクチャレベルの設定に基づき、前記対象ブロックを含む現在ピクチャに対して前記アフィンモーション予測サンプルのサンプル単位調整が許容されることが識別したとき、前記対象ブロックの前記制御点動きベクトルに基づいて前記各サブブロック内のサンプル位置に応じた動きを補償することで前記アフィン予測サンプルのサンプル値を修正するステップと、を含むことを特徴とする映像復号化方法。
前記第１のハイレベルシンタックス要素は、前記シーケンスのヘッダから復号化することを特徴とする請求項１に記載の映像復号化方法。
前記アフィンモーション予測サンプルのサンプル単位調整に対する前記１つ以上の第２のハイレベルシンタックス要素を復号化することは、
前記第１のハイレベルシンタックス要素が、前記アフィンモーション予測が許容されることを示すとき、前記シーケンスのヘッダから前記アフィンモーション予測サンプルに対するサンプル単位調整が許容されるか否かを示すシーケンスレベルフラグを復号化するステップ、及び、
前記シーケンスレベルフラグに依存し、前記シーケンスに属するピクチャそれぞれのピクチャヘッダから前記アフィンモーション予測サンプルに対するサンプル単位調整が許容されるか否かを示すピクチャレベルフラグを復号化するステップを含むことを特徴とする請求項２に記載の映像復号化方法。
前記第１のハイレベルシンタックス要素が前記アフィンモーション予測が許容されないことを示す、あるいは、前記シーケンスレベルフラグが前記サンプル単位調整が許容されないことを示すとき、前記ピクチャレベルフラグは前記ピクチャヘッダから復号化されず、前記サンプル単位調整が許容されないことを示す値に設定されることを特徴とする請求項３に記載の映像復号化方法。
前記第１のハイレベルシンタックス要素が、前記アフィンモーション予測が許容されないことを示すとき、前記アフィンモーション予測及び前記少なくとも１つのコーディングツールのすべては前記シーケンス内のすべてのピクチャに対して許容されないことを特徴とする請求項１に記載の映像復号化方法。
前記アフィン予測サンプルのサンプル値を修正するステップは、
前記対象ブロックの制御点動きベクトルを用い、修正しようとする対象サブブロック内のサンプル位置及び前記対象サブブロックの中心との間の差に起因する動きオフセットを生成するステップと、
前記対象サブブロック内のサンプル位置に対する横方向及び縦方向の勾配（ｇｒａｄｉｅｎｔ）を生成するステップと、
前記横方向及び縦方向の勾配及び前記動きオフセットを用い、前記対象サブブロック内のサンプル位置に対応するアフィン予測サンプルに対するサンプルオフセットを生成するステップと、
前記サンプル位置に対応するアフィン予測サンプルのサンプル値に前記サンプルオフセットを加算するステップと、を含むことを特徴とする請求項１に記載の映像復号化方法。
前記対象サブブロック内のサンプル位置に対して生成した前記動きオフセットは、前記対象ブロックの他のサブブロック内の同一サンプル位置に対する動きオフセットとして再利用されることを特徴とする請求項６に記載の映像復号化方法。
コーディングしたピクチャ（ｃｏｄｅｄｐｉｃｔｕｒｅｓ）のシーケンス（ｓｅｑｕｅｎｃｅ）をブロック単位で復号化する画像復号装置において、
ビットストリームから第１のハイレベルシンタックス要素を復号化することでアフィンモーション予測（ａｆｆｉｎｅｍｏｔｉｏｎｐｒｅｄｉｃｔｉｏｎ）が許容されるか否かをシーケンスレベルで設定し、前記第１のハイレベルシンタックス要素に依存して前記ビットストリームから少なくとも１つのコーディングツールのそれぞれに対する１つ以上の第２のハイレベルシンタックス要素を復号化することで、前記少なくとも１つのコーディングツールの各々が許容されるか否かをピクチャレベルで設定する復号化部を含み、
ここで、前記少なくとも１つのコーディングツールはアフィンモーション予測サンプルのサンプル単位調整（ｓａｍｐｌｅ－ｂｙ－ｓａｍｐｌｅａｄｊｕｓｔｍｅｎｔ）を含み、
さらに、前記シーケンスレベルの決定が、前記アフィンモーション予測が許容されることを示すとき、前記アフィンモーション予測を用いて符号化した対象ブロックの複数の制御点動きベクトル（ｃｏｎｔｒｏｌｐｏｉｎｔｍｏｔｉｏｎｖｅｃｔｏｒ）を決定し、前記制御点動きベクトルを用いてサブブロック単位の前記アフィンモーション予測を実行することで、前記対象ブロック内の各サブブロックに対するアフィン予測サンプルを生成する予測部、を含み、
前記予測部は、
前記ピクチャレベルの設定に基づき、前記対象ブロックを含む現在ピクチャに前記アフィンモーション予測サンプルのサンプル単位調整が許容されることを識別したとき、前記対象ブロックの前記制御点動きベクトルに基づいて前記各サブブロック内のサンプル位置に応じた動きを補償することで、前記アフィン予測サンプルのサンプル値を修正することを特徴とする映像復号化装置。
前記第１のハイレベルシンタックス要素は、前記シーケンスのヘッダから復号化されることを特徴とする請求項８に記載の映像復号化装置。
前記復号化部は、
前記第１のハイレベルシンタックス要素が、前記アフィンモーション予測が許容されることを示すとき、前記シーケンスのヘッダから前記アフィンモーション予測サンプルのサンプル単位調整が許容されるか否かを示すシーケンスレベルフラグを復号化し、
前記シーケンスレベルフラグに依存し、前記シーケンスに属するピクチャそれぞれのピクチャヘッダから前記アフィンモーション予測サンプルのサンプル単位調整が許容されるか否かを示すピクチャレベルフラグを復号化することで、
前記アフィンモーション予測サンプルのサンプル単位調整に対する前記１つ以上の第２のハイレベルシンタックス要素を復号化することを特徴とする請求項９に記載の映像復号化装置。
前記復号化部は、
前記第１のハイレベルシンタックス要素が、前記アフィンモーション予測が許容されないことを示す、あるいは、前記シーケンスレベルフラグが前記サンプル単位調整が許容されないことを示すとき、前記ピクチャレベルフラグは前記ピクチャヘッダから復号化されず、前記サンプル単位調整が許容されないことを示す値に設定することを特徴とする請求項１０に記載の映像復号化装置。
前記予測部は、
前記対象ブロックの制御点動きベクトルを用い、修正しようとする対象サブブロック内のサンプル位置及び前記対象サブブロックの中心との差に起因する動きオフセットを生成し、
前記対象サブブロック内のサンプル位置に対する横方向及び縦方向の勾配（ｇｒａｄｉｅｎｔ）を生成し、
前記横方向及び縦方向の勾配及び前記動きオフセットを用い、前記対象サブブロック内のサンプル位置に対応するアフィン予測サンプルに対するサンプルオフセットを生成し、
前記サンプル位置に対応するアフィン予測サンプルのサンプル値に前記サンプルオフセットを加算することで、
前記アフィン予測サンプルのサンプル値を修正することを特徴とする請求項８に記載の映像復号化装置。
前記対象サブブロック内のサンプル位置に対して生成した前記動きオフセットを前記対象ブロックの他のサブブロック内の同一サンプル位置に対する動きオフセットとして再利用することを特徴とする請求項１２に記載の映像復号化装置。
ピクチャ（ｃｏｄｅｄｐｉｃｔｕｒｅｓ）のシーケンス（ｓｅｑｕｅｎｃｅ）をブロック単位で符号化する方法において、
アフィンモーション予測（ａｆｆｉｎｅｍｏｔｉｏｎｐｒｅｄｉｃｔｉｏｎ）及び少なくとも１つのコーディングツールのすべてがディセーブル（ｄｉｓａｂｌｅ）されるか否かを示すためのシーケンスレベルの第１のハイレベルシンタックス要素を前記シーケンスのヘッダに符号化するステップを含み、
ここで、前記少なくとも１つのコーディングツールは、アフィンモーション予測サンプルのサンプル単位調整（ｓａｍｐｌｅ－ｂｙ－ｓａｍｐｌｅａｄｊｕｓｔｍｅｎｔ）を含み、
さらに、前記第１のハイレベルシンタックス要素に依存し、前記少なくとも１つのコーディングツールの各々に対し、前記コーディングツールが許容されるか否かに対するシーケンスレベル又はピクチャレベルの設定を示すための１つ以上の第２のハイレベルシンタックス要素を符号化するステップと、
第１のハイレベルシンタックス要素が、前記少なくとも１つのコーディングツールの全てがディセーブル（ｄｉｓａｂｌｅ）にならないことを示すとき、符号化しようとする対象ブロックに対する制御点動きベクトル（ｃｏｎｔｒｏｌｐｏｉｎｔｍｏｔｉｏｎｖｅｃｔｏｒ）を決定し、前記制御点動きベクトルを用いてサブブロック単位のアフィンモーション予測を実行することで、各サブブロックに対するアフィン予測サンプルを生成するステップと、
前記対象ブロックを含む現在ピクチャに対して前記アフィンモーション予測サンプルのサンプル単位調整が許容されるとき、前記対象ブロックの制御点動きベクトルに基づいて前記各サブブロック内のサンプル位置に応じた動きを補償することで、前記アフィン予測サンプルのサンプル値を修正するステップと、を含むことを特徴とする映像符号化方法。
前記アフィンモーション予測サンプルのサンプル単位調整に対する前記１つ以上の第２のハイレベルシンタックス要素を符号化することは、
前記第１のハイレベルシンタックス要素が、前記アフィンモーション予測が許容されることを示すとき、前記アフィンモーション予測サンプルに対するサンプル単位調整が許容されるか否かを示すシーケンスレベルフラグを前記シーケンスのヘッダに符号化するステップ、及び、
前記シーケンスレベルフラグに依存し、前記シーケンスに属するピクチャそれぞれのピクチャヘッダに前記サンプル単位調整が許容されるか否かを示すピクチャレベルフラグを符号化するステップ、を含むことを特徴とする請求項１４に記載の映像符号化方法。
前記アフィン予測サンプルのサンプル値を修正するステップは、
前記対象ブロックの制御点動きベクトルを用い、修正しようとする対象サブブロック内のサンプル位置及び前記対象サブブロックの中心との間の差に起因する動きオフセットを生成するステップと、
前記対象サブブロック内のサンプル位置に対する横方向及び縦方向の勾配（ｇｒａｄｉｅｎｔ）を生成するステップと、
前記横方向及び縦方向の勾配及び前記動きオフセットを用い、前記対象サブブロック内のサンプル位置に対応するアフィン予測サンプルに対するサンプルオフセットを生成するステップ、及び、
前記サンプル位置に対応するアフィン予測サンプルのサンプル値に前記サンプルオフセットを加算するステップと、を含むことを特徴とする請求項１４に記載の映像符号化方法。