JP5703942B2

JP5703942B2 - 動画像符号化装置、動画像符号化方法及び動画像符号化プログラム

Info

Publication number: JP5703942B2
Application number: JP2011101951A
Authority: JP
Inventors: 福島　茂; 茂福島; 西谷　勝義; 勝義西谷; 上田　基晴; 基晴上田; 徹熊倉
Original assignee: JVCKenwood Corp
Current assignee: JVCKenwood Corp
Priority date: 2011-04-28
Filing date: 2011-04-28
Publication date: 2015-04-22
Anticipated expiration: 2031-04-28
Also published as: JP2012235279A

Description

本発明は、動画像の符号化技術に関し、特に動き補償予測を利用した動画像の符号化技術に関する。

ＭＰＥＧ（Moving Picture Experts Group）に代表される、ピクチャを矩形ブロックに分割し、ピクチャ間でブロック単位に動き推定、補償を行う動画像符号化方式では、各ブロックで生成される動きベクトルの符号量を削減する為に、動きベクトルに対して予測処理が行われる。ＭＰＥＧ−２では、マクロブロック単位に検出される動きベクトルは、直前に符号化されたマクロブロックの動きベクトルとの差分がとられ、その差分ベクトルを符号化することで、符号量を削減している。

ＭＰＥＧ−４ＡＶＣ／Ｈ．２６４では、動きベクトルが周囲の隣接ブロックの動きベクトルと強い相関があることを利用して、周囲の隣接ブロックからの予測を行い、その差分ベクトルを符号化することによって符号量を削減している。具体的には、処理対象のブロックの左、上及び右上の隣接ブロックの動きベクトルから中央値を算出し、その中央値との差分をとることで動きベクトルの予測を実現している。

この予測により、動きベクトルの符号量は削減されるものの、他の動き情報は処理対象のブロック毎に符号化されるので、周囲の隣接ブロックと同一の動き情報を有していても、重複して符号化されることになり、効率的な符号化に至っていないという課題があった。この課題に対して、特許文献１や最近のＩＳＯ／ＩＥＣ及びＩＴＵ−Ｔにおける動画像符号化の規格作業の中で、処理対象のブロックと周囲の既符号化済みの隣接ブロックの動き情報が同一であれば、処理対象のブロックは自身の動き情報を符号化せずに、隣接ブロックの動き情報を符号化に使用することにし、参照する動き情報を備える隣接ブロックを指定する付加情報を符号化することで、動き情報の符号量を削減することが試みられている。このような手法は、マージ（ｍｅｒｇｅ）と呼ばれ、動き情報の符号量削減の一手法として注目されている。

ISO/IEC 13818-2 Information technology -- Generic coding of moving pictures and associated audio information: Video ISO/IEC 14496-10 Information technology -- Coding of audio-visual objects -- Part 10: Advanced Video Coding 特開平１０−２７６４３９号公報

上述したマージ手法の一例として、処理対象のブロックに対して、既に符号化済みの左に隣接するブロック或いは真上に隣接するブロックの動き情報を参照するモデルが挙げられる。この場合、ブロック毎に付加情報として、動きベクトル検出により検出された処理対象のブロック自身の動き情報を使用するか、或いはマージ手法により隣接ブロックの動き情報を使用するかを指定する１ｂｉｔのフラグ（以下、ｍｅｒｇｅ＿ｆｌａｇと呼ぶ）と、マージ手法を適用する場合に、隣接ブロックのうち左或いは真上のどちらを参照するかを指定する１ｂｉｔのフラグ（以下、ｍｅｒｇｅ＿ｌｕ＿ｆｌａｇと呼ぶ）を定義する。これらのフラグに対して算術符号によるエントロピー符号化が行われる。一般に、エントロピー符号化では出現率の高いデータに短い符号、逆に出現率が低いデータに長い符号を割り当ててデータ圧縮を行い符号量の削減を行う。しかしながら、フラグｍｅｒｇｅ＿ｌｕ＿ｆｌａｇは画面内のテクスチャにも因るが、参照先の隣接ブロックとして左或いは上を選択に予め符号を割り当てているので、参照先選択の発生頻度に偏りがある場合であっても、等確率で符号化してしまうために十分な符号量削減がなされないという課題があった。

本発明はこうした状況に鑑みてなされたものであり、その目的は、動き情報の参照先を表すフラグの符号量の削減を図って符号化効率を向上させる技術を提供することにある。

上記課題を解決するために、本発明のある態様の動画像符号化装置は、動画像の各ピクチャを分割したブロック単位で動きベクトルを用いて前記動画像を符号化する動画像符号化装置であって、符号化対象ブロックに隣接する複数の符号化済みの隣接ブロックの中から、前記符号化対象ブロックと前記隣接ブロックとの隣接条件に基づいて判定されるいずれか一つの隣接ブロックを、動き情報を参照するための参照先ブロックとして指定する参照先指定部（１１３）と、画像内予測、符号化対象ブロックの動きベクトルを利用した画像間予測、および隣接ブロックの動きベクトルを利用した画像間予測の中から、予測方法として、隣接ブロックの動きベクトルを利用した画像間予測が選択された場合、選択された予測方法により参照される隣接ブロックと前記参照先指定部により指定された前記参照先ブロックとが一致するか否かを表す参照先有効情報と選択された予測方法を示す情報とを動き情報に代わって生成する予測選択部（１１２）とを含む。前記参照先指定部は、前記隣接条件として、前記隣接ブロックの隣接する辺の長さが前記符号化対象ブロックの高さまたは幅と同じであるか否かを判定することにより、隣接する辺の長さが前記符号化対象ブロックの高さまたは幅と同じである隣接ブロックを選択し、選択された隣接ブロックを参照先ブロックとして指定する。
本発明の別の態様は、動画像符号化装置である。この装置は、動画像の各ピクチャを分割したブロック単位で動きベクトルを用いて前記動画像を符号化する動画像符号化装置であって、符号化対象ブロックに隣接する複数の符号化済みの隣接ブロックの中から、前記符号化対象ブロックと前記隣接ブロックとの隣接条件に基づいて判定されるいずれか一つの隣接ブロックを、動き情報を参照するための参照先ブロックとして指定する参照先指定部（１１３）と、画像内予測、符号化対象ブロックの動きベクトルを利用した画像間予測、および隣接ブロックの動きベクトルを利用した画像間予測の中から、予測方法として、隣接ブロックの動きベクトルを利用した画像間予測が選択された場合、選択された予測方法により参照される隣接ブロックと前記参照先指定部により指定された前記参照先ブロックとが一致するか否かを表す参照先有効情報と選択された予測方法を示す情報とを動き情報に代わって生成する予測選択部（１１２）とを含む。前記参照先指定部は、前記隣接条件として、前記符号化対象ブロックと前記隣接ブロックの互いに隣接する辺の共通部分の長さの大小関係を判定することにより、隣接する辺の共通部分の長さが大きい方の隣接ブロックを選択し、選択された隣接ブロックを参照先ブロックとして指定する。

本発明のさらに別の態様は、動画像符号化方法である。この方法は、動画像の各ピクチャを分割したブロック単位で動きベクトルを用いて前記動画像を符号化する動画像符号化方法であって、符号化対象ブロックに隣接する複数の符号化済みの隣接ブロックの中から、前記符号化対象ブロックと前記隣接ブロックとの隣接条件に基づいて判定されるいずれか一つの隣接ブロックを、動き情報を参照するための参照先ブロックとして指定する参照先指定ステップと、画像内予測、符号化対象ブロックの動きベクトルを利用した画像間予測、および隣接ブロックの動きベクトルを利用した画像間予測の中から、予測方法として、隣接ブロックの動きベクトルを利用した画像間予測が選択された場合、選択された予測方法により参照される隣接ブロックと前記参照先指定ステップにより指定された前記参照先ブロックとが一致するか否かを表す参照先有効情報と選択された予測方法を示す情報とを動き情報に代わって生成する予測選択ステップとを含む。前記参照先指定ステップは、前記隣接条件として、前記隣接ブロックの隣接する辺の長さが前記符号化対象ブロックの高さまたは幅と同じであるか否かを判定することにより、隣接する辺の長さが前記符号化対象ブロックの高さまたは幅と同じである隣接ブロックを選択し、選択された隣接ブロックを参照先ブロックとして指定する。
本発明のさらに別の態様は、動画像符号化方法である。この方法は、動画像の各ピクチャを分割したブロック単位で動きベクトルを用いて前記動画像を符号化する動画像符号化方法であって、符号化対象ブロックに隣接する複数の符号化済みの隣接ブロックの中から、前記符号化対象ブロックと前記隣接ブロックとの隣接条件に基づいて判定されるいずれか一つの隣接ブロックを、動き情報を参照するための参照先ブロックとして指定する参照先指定ステップと、画像内予測、符号化対象ブロックの動きベクトルを利用した画像間予測、および隣接ブロックの動きベクトルを利用した画像間予測の中から、予測方法として、隣接ブロックの動きベクトルを利用した画像間予測が選択された場合、選択された予測方法により参照される隣接ブロックと前記参照先指定ステップにより指定された前記参照先ブロックとが一致するか否かを表す参照先有効情報と選択された予測方法を示す情報とを動き情報に代わって生成する予測選択ステップとを含む。前記参照先指定ステップは、前記隣接条件として、前記符号化対象ブロックと前記隣接ブロックの互いに隣接する辺の共通部分の長さの大小関係を判定することにより、隣接する辺の共通部分の長さが大きい方の隣接ブロックを選択し、選択された隣接ブロックを参照先ブロックとして指定する。

なお、以上の構成要素の任意の組合せ、本発明の表現を方法、装置、システム、記録媒体、コンピュータプログラムなどの間で変換したものもまた、本発明の態様として有効である。

本発明によれば、動き情報の参照先を表すフラグの符号量の削減を図って符号化効率を向上させることができる。

実施の形態に係る動き情報の参照先予測方法を具備した動画像符号化装置の構成を示すブロック図である。実施の形態に係る動き情報の参照先予測方法を具備した動画像復号装置の構成を示すブロック図である。実施の形態における符号化ブロックを説明する為の図である。実施の形態における予測ブロックの形状の種類を説明する為の図である。実施の形態における動き情報の参照先予測方法の処理対象となるパーティションの位置を説明する為の図である。実施の形態における動き情報の参照先予測方法の処理対象となるパーティションの周辺を説明する為の図である。実施の形態における動き情報の参照先予測方法をシーケンスレベルで実行するか否かを決定するビットストリームのシンタックスパターンを示す図である。実施の形態における動き情報の参照先予測方法を予測ブロックレベルで実行するか否かを決定するビットストリームのシンタックスパターンを示す図である。図１の参照先指定部の動作を説明するフローチャートである。図１０（ａ）は、図９の候補数ＮｕｍＭｅｒｇｅＣａｎｄｉｄａｔｅｓの算出処理の詳細を示すフローチャートであり、図１０（ｂ）は、処理対象のパーティションに隣接する参照先パーティションの例を示す図である。図１の予測選択部の動作を説明するフローチャートである。図２の動き情報選択部の動作を説明するフローチャートである。図１３（ａ）、図１３（ｂ）は、予測された参照先を示すフラグの値に応じて実行される処理を説明するフローチャートである。本実施の形態における動き情報の参照先予測方法の第１の実施例の動作を説明するフローチャートである。図１４の隣接するパーティションとの境界判定の詳細動作を説明するフローチャートである。処理対象のパーティションと隣接するパーティションの配置と定義を説明する図である。隣接するパーティションが複数配置された場合の動き境界の定義を説明する図である。図１４の隣接するパーティションとの隣接辺長比較の詳細動作を説明するフローチャートである。処理対象パーティションと隣接するパーティションの隣接条件に基づいて判定される参照先パーティションを説明する図である。処理対象パーティションと隣接するパーティションの隣接条件の一例を示す図である。処理対象パーティションと隣接するパーティションの隣接条件の別の例を示す図である。動き情報の参照先予測方法の第２の実施例の動作を説明するフローチャートである。隣接するパーティションの境界残差を算出する画素領域を示す図である。隣接するパーティションの境界残差に基づく参照先パーティションの判定の動作を説明するフローチャートである。動き情報の参照先予測方法の第３の実施例において、予測ブロックレベルで実行するか否かを決定するビットストリームのシンタックスパターンを示す図である。動き情報の参照先予測方法の第３の実施例の動作を説明するフローチャートである。第３の実施例の動き情報選択部の動作を説明するフローチャートである。

本発明の実施の形態は、動画像の符号化技術に関し、特にピクチャを矩形ブロックに分割し、ピクチャ間でブロック単位に動き推定、補償を行う動画像符号化における動き情報の符号化効率を向上させる為に、処理対象のブロックの周囲の符号化済みの隣接ブロックの動きベクトルや参照先ピクチャ番号等の動き情報を処理対象のブロックの動き情報として使用することで、処理対象のブロックの動き情報を符号化せず、参照する隣接ブロックを示す付加情報を符号化することによって符号量を削減する技術に関する。

本発明の実施の形態では、等しい頻度で発生する上述のフラグｍｅｒｇｅ＿ｌｕ＿ｆｌａｇに代わり、動き情報の参照先を周辺の隣接ブロックのサイズや予測モード等の情報を用いて予測を行い、その予測により判定された参照先の隣接ブロックと、実際に符号化によって選択された隣接ブロックとの一致を表すフラグｍｅｒｇｅ＿ｐｒｏｂａｂｌｅ＿ｆｌａｇを定義する。予測による判定率が高ければ、フラグｍｅｒｇｅ＿ｐｒｏｂａｂｌｅ＿ｆｌａｇで表されるビットの発生確率が高くなるので、フラグを表すビット数が小さくなり、発生符号量を削減することが可能となる。

更に、本発明の別の実施の形態では、参照先の予測による参照先となる隣接ブロックの判定の一致精度が高いものとして、前述の参照先の予測との一致を表すフラグｍｅｒｇｅ＿ｐｒｏｂａｂｌｅ＿ｆｌａｇそのものを定義せず、参照先の予測により得られた判定結果で参照先の隣接ブロックを示し、参照先の予測が不定の場合にのみｍｅｒｇｅ＿ｌｕ＿ｆｌａｇと同様の機能を有するフラグｍｅｒｇｅ＿ｄｉｒｅｃ＿ｆｌａｇで参照先の隣接ブロックを示すことで、フラグｍｅｒｇｅ＿ｄｉｒｅｃ＿ｆｌａｇによる符号量の増加をフラグｍｅｒｇｅ＿ｐｒｏｂａｂｌｅ＿ｆｌａｇに要する符号量の削減で相殺し、相対的に符号化効率を向上させることも可能である。

以下、本発明の実施の形態に係る動画像符号化装置及び動画像復号装置について図面を参照して説明する。

図１は実施の形態に係る動画像符号化装置の構成を示すブロックである。実施の形態の動画像符号化装置は、動きベクトル検出部１０１、減算部１０２、直交変換・量子化部１０３、可変長符号化部１０４、逆量子化・逆直交変換部１０５、動き補償部１０６、重み付き予測部１０７、加算部１０８、デブロッキング・フィルタ部１０９、メモリ１１０、画面内予測部１１１、予測選択部１１２、および参照先指定部１１３を備える。

画面内予測部１１１は、入力される符号化対象ブロックと、メモリ１１０に格納された符号化対象ブロックに隣接する符号化済みの復号ブロック画像とから、面内予測を行い、面内予測ブロックを出力する。

参照先指定部１１３は、メモリ１１０に格納された符号化対象ブロックに隣接する複数の隣接ブロックのいずれか一つを、マージ処理を行う場合の参照先の隣接ブロックとして指定し、その参照先隣接ブロックの動きベクトルを動き補償部１０６に与える。

動きベクトル検出部１０１は、入力された画像信号と、メモリ１１０に格納された参照画像信号とを参照して、ピクチャ間でブロック単位にマッチングを行い動きベクトルを検出し、検出された動きベクトルを動き補償部１０６に与える。

動き補償部１０６は、動きベクトル検出部１０１により検出された符号化対象ブロックの動きベクトルまたは参照先指定部１１３により指定された隣接ブロックの動きベクトルを用いて予測画像を生成する。重み付き予測部１０７は、動き補償部１０６により生成された予測画像に適応的に重み係数を掛け算して最終的な予測画像を生成し、予測選択部１１２に与える。

予測選択部１１２は、画面内予測部１１１による画面内予測、動き補償部１０６による符号化対象ブロックの動きベクトルを利用した画像間予測、および参照先指定部１１３により指定された参照先隣接ブロックの動きベクトルを利用した画像間予測の中から、符号量が最小となる予測方法を一つ選択し、選択された予測方法による予測画像を減算部１０２と加算部１０８に与える。

符号量が最小となる予測方法として、参照先隣接ブロックの動きベクトルを利用した画像間予測が予測選択部１１２によって選択された場合、参照先指定部１１３は、マージ処理の参照先の隣接ブロックを予測する処理を実行し、マージ参照先の予測結果を予測選択部１１２に与える。予測選択部１１２は、参照先指定部１１３により予測された参照先隣接ブロックと、実際に選択された予測方法で利用された参照先隣接ブロックとが一致するかどうかを判定し、参照先隣接ブロックの予測結果の有効性を示す参照先有効情報を、選択された予測方法を示す情報とともに可変長符号化部１０４に供給する。

減算部１０２は、符号化する画像と予測画像との引き算を行い残差信号を生成し、直交変換・量子化部１０３に与える。直交変換・量子化部１０３は、残差信号に対して直交変換及び量子化を行い変換信号を生成し、可変長符号化部１０４と逆量子化・逆直交変換部１０５に与える。可変長符号化部１０４は、直交変換及び量子化された残差信号をエントロピー符号化する。可変長符号化部１０４は、予測選択部１１２によって生成される参照先有効情報と選択された予測方法を示す情報も符号化し、符号化画像を含むビットストリームを出力する。

逆量子化・逆直交変換部１０５は、直交変換・量子化部１０３から受け取った変換信号を逆量子化及び逆直交変換して元の残差信号に戻す。加算部１０８は、予測画像と残差信号を加算して復号画像を生成し、デブロッキング・フィルタ部１０９に与える。デブロッキング・フィルタ部１０９は、復号画像に対して符号化によるブロック歪を減少させる処理を施し、メモリ１１０に格納する。メモリ１１０は、復号画像や既に符号化された画像の情報を記憶する。

図２は図１の動画像符号化装置に対応した実施の形態に係る動画像復号装置の構成を示すブロックである。実施の形態の動画像復号装置は、可変長復号部２０１、逆量子化・逆直交変換部２０２、動き補償部２０３、重み付き予測部２０４、加算部２０５、デブロッキング・フィルタ部２０６、メモリ２０７、画面内予測部２０８、画面内／画面間予測選択部２０９、および動き情報選択部２１０を備える。

図２の動画像復号装置の復号処理は、図１の動画像符号化装置の内部に設けられている復号処理に対応するものであるから、図２の逆量子化・逆直交変換部２０２、動き補償部２０３、重み付き予測部２０４、加算部２０５、デブロッキング・フィルタ部２０６、メモリ２０７、および画面内予測部２０８の各構成は、図１の動画像符号化装置の逆量子化・逆直交変換部１０５、動き補償部１０６、重み付き予測部１０７、加算部１０８、デブロッキング・フィルタ部１０９、メモリ１１０、および画面内予測部１１１の各構成とそれぞれ対応する機能を有する。

可変長復号部２０１は、ビットストリームを復号して予測残差信号、動きベクトルに関する情報を出力し、予測残差信号を逆量子化・逆直交変換部２０２に与え、動きベクトルに関する情報を動き情報選択部２１０に、符号化モードに関する情報を画面内／画面間予測選択部２０９に与える。

逆量子化・逆直交変換部２０２は、可変長復号部２０１で復号された予測残差信号に対して逆直交変換及び逆量子化を行う。加算部２０５は、逆量子化・逆直交変換部２０２により逆変換された予測残差成分と、重み付き予測部２０４により算出された予測画像とを加算することにより、画像信号を復号し、デブロッキング・フィルタ部２０６に与える。デブロッキング・フィルタ部２０６は、復号画像に対して符号化によるブロック歪を減少させる処理を施し、メモリ２０７に格納する。

画面内／画面間予測選択部２０９は、符号化モードが画面内予測か画面間予測かを判定し、画面内予測であれば、画面内予測部２０８に画面内予測処理を実行するよう指示し、画面間予測であれば、動き情報選択部２１０に画面間予測処理を実行するよう指示する。

動き情報選択部２１０は、動きベクトルなどの動き情報がマージ処理によるものであるか否かを選択し、マージ処理によるものである場合、参照先有効情報にもとづいて、所定の隣接条件にもとづいて判定される隣接ブロックを参照先ブロックとして指定できるかどうかを判定する。

画面内予測部２０８は、入力される復号対象ブロックと、メモリ２０７に格納された復号対象ブロックに隣接する復号ブロック画像とから、面内予測を行い、面内予測ブロックを加算部２０５に渡す。

動き補償部２０３は、画面間予測がマージ処理でない、すなわち通常の動きベクトル検出処理によるものである場合、復号対象ブロックの復号された動きベクトルを用いて予測画像を生成する。動き補償部２０３は、画面間予測がマージ処理によるものであり、参照先有効情報が肯定的である場合、動き情報の参照先予測により予測される参照先の隣接ブロックの動きベクトルを用いて予測画像を生成する。

重み付き予測部２０４は、動き補償部２０３により生成された予測画像に適応的に重み係数を掛け算して最終的な予測画像を生成し、加算部２０５に与える。

実施の形態に係る参照先の隣接ブロックの予測方法は、図１の動画像符号化装置の予測選択部１１２及び図２の動画像復号装置の動き情報選択部２１０において実施される。

動画像符号化装置の予測選択部１１２では、通常の動きベクトル検出処理により検出された動き情報またはマージ処理により選択された隣接ブロックの動き情報に基づく画面間予測、および画面内予測の中から、発生符号量が最も少ないか、画質が最も良い、あるいはその両方を満たす符号化モードが一つ選択される。さらに、選択された符号化モードが画面間予測であれば、動き情報が通常の動きベクトル検出処理により検出されたものであるか、マージ処理により選択されたものであるかを判定し、マージ処理の場合は、動き情報の参照先予測が行われ、予測された参照先の隣接ブロックとマージ処理により選択された隣接ブロックとの同一性を判定し、その結果が参照先有効情報として符号化・伝送される。マージ処理でない場合は、通常の動きベクトルの予測が行われ、動きベクトルと予測動きベクトルとの差分動きベクトルとその他の動き情報が符号化・伝送される。

一方、動画像復号装置の動き情報選択部２１０では、可変長復号部２０１にてビットストリームから復号された符号化モードや動き情報に基づいて、画面内／画面間予測選択部２０９にて画面間予測と判定された場合、更にその画面間予測がマージ処理によるものか否かが判定され、マージ処理によるものであると判定された場合、動き情報の参照先予測が行われ、この予測方法により予測された参照先の隣接ブロックと復号された付加情報で指定される隣接ブロックとの同一性を判定することで動き情報を取得する。以下の実施例では、動き情報の参照先予測の詳細について説明する。

［実施例１］
動き情報の参照先予測方法の実施例を説明する前に、本実施例において使用する用語を説明しておく。

（符号化ブロックについて）
実施の形態では、図３に示されるように、画面内を同一サイズの正方の矩形ブロックにて均等分割する。このブロックを符号化ブロックと呼び、符号化及び復号を行う際の処理の基本となる。符号化ブロックは画面内のテクスチャに応じて、符号化処理を最適にすべく、符号化ブロック内を４分割して、ブロックサイズの小さい符号化ブロックにすることが出来る。図３で示される画面内を均等サイズで分割される符号化ブロックを最大符号化ブロックと呼び、その内部を符号化条件に応じて４分割したものを総じて符号化ブロックとする。符号化ブロックをこれ以上４分割出来ない最小のサイズとなる符号化ブロックを最小符号化ブロックと呼ぶこととする。

（予測ブロックについて）
画面内をブロックに分割して動き補償を行う場合、動き補償のブロックサイズをより小さくした方が、よりきめ細かい予測を行うことが出来ることから、いくつかのブロックサイズの中から最適なものを選択して、ブロック内部を分割して動き補償を行う仕組みを取り入れている。この動き補償を行うブロックを予測ブロックと呼ぶ。予測ブロックは符号化ブロックと同一のサイズで表され、動き補償に応じて、予測ブロック内部を分割せず１ブロックとみなす場合を最大とし、水平或いは垂直方向に２分割したもの、水平と垂直の均等分割により４分割したものに分けられる。分割後のサイズに応じて、分割タイプに対応したモードが定義されており、図４に示される。

（パーティションについて）
予測ブロックを分割した個々の領域はパーティションと呼ばれる。予測ブロック内部において、パーティションを管理する為に、０から開始する番号を、予測ブロック内部に存在するパーティションに対してジグザグスキャン順に割り当てる。この番号はパーティション番号と呼ばれ、ｐｕＰａｒｔＩｄｘで表される。図４の予測ブロックのパーティションの中に記述された数字は、そのパーティションのパーティション番号を表す。

実施の形態による動き情報の参照先予測方法を図面を用いて説明する。動き情報の参照先予測方法は、予測ブロックを構成するパーティション単位に、符号化及び復号の処理の何れでも実施される。

図５に示されるように、同一ピクチャ内の符号化ブロック内部を動き補償する為に定義される予測ブロックのパーティション（図５中の処理対象のパーティション）に隣接する周囲のパーティションから動き情報の参照先となるパーティションを選択する。

参照先となるパーティションは、復号においても使用することから、処理対象のパーティションの符号化の前に既に符号化されたパーティションが候補となる。符号化は画面の左上から右下にラスタスキャン順にブロック単位で行うことから、ここでは原則的に処理対象のパーティションの周囲に隣接する左或いは真上のパーティションを参照先の候補として考えることとし、以下断りが無い限りこの仮定を前提として説明することとする。

図５中の太点線の円内で表される領域を拡大したものが図６である。

図６は、処理対象のパーティションとそれに隣接するパーティションを示す。予測動きベクトルの候補は、処理対象のパーティションの左側に隣接するパーティションＡｋ（ｋ＝０，…，ｎＡ−１）から構成されるパーティション群Ａ、および真上に隣接するパーティションＢｋ（ｋ＝０，…，ｎＢ−１）から構成されるパーティション群Ｂの２つのパーティション群からそれぞれ動き情報の参照先となるパーティションを選択する。ここで、ｎＡは左に隣接するパーティション群の総数、ｎＢは真上に隣接するパーティション群の総数を表す。

パーティションのサイズは動き補償によって変わるため、図６に示されるように、処理対象のパーティションとその周囲に隣接するパーティションのサイズが異なる場合は、次の規則に基づいて左或いは真上の参照先の候補となるパーティションを決定する。

・処理対象のパーティションに対して左に複数の隣接するパーティションが存在する場合は、その中の一番上のパーティションＡ０を参照先の候補とする。
・処理対象のパーティションに対して真上に複数の隣接するパーティションが存在する場合は、その中の一番左のパーティションＢ０を参照先の候補とする。

（シンタックスについて）
まず、本実施例に係る動き情報の参照先予測方法を備える動画像符号化装置により符号化される動画像のビットストリームのシンタックスについて説明する。

図７は動画像のビットストリームのシーケンス・パラメータ・セット（ＳＰＳ）に記述される第１のシンタックスパターンを示す。シーケンス・パラメータ・セットはシーケンス全体の符号化に関わる情報が記述されるヘッダーであり、シーケンス全体に渡って、画面間予測を行う場合、本実施の形態に係る動き情報の参照先予測方法を適用するかどうかを示す第１フラグｉｎｔｅｒ＿ｍｅｒｇｅ＿ｆｌａｇが設置される。

図８はスライスの中の予測ブロック単位に記述される第２のシンタックスパターンを示す。予測ブロックの予測モードが画面間予測（ＭＯＤＥ＿ＩＮＴＥＲ）の場合、予測ブロック内のパーティション毎に、周囲に隣接する有効なパーティションの数ＮｕｍＭｅｒｇｅＣａｎｄｉｄａｔｅｓが求められ、ＮｕｍＭｅｒｇｅＣａｎｄｉｄａｔｅｓが０を超える場合に、このパーティションにてマージを適用するか否かを表す第２フラグｍｅｒｇｅ＿ｆｌａｇ［ｉ］が設置される。ここで、ｉは予測ブロックの中のパーティション番号を表す。第２フラグｍｅｒｇｅ＿ｆｌａｇ［ｉ］は本実施の形態に係る動き情報の参照先予測方法が適用されない場合、即ち、ｉｎｔｅｒ＿ｍｅｒｇｅ＿ｆｌａｇが偽（０）の場合には符号化されず、ビットストリーム中に記述されない。

次に、第２フラグｍｅｒｇｅ＿ｆｌａｇ［ｉ］が真（１）で且つＮｕｍＭｅｒｇｅＣａｎｄｉｄａｔｅｓが１を超える場合に、本実施の形態に係る動き情報の参照先予測方法にて選択される参照先の隣接パーティションが正しいか否かを表す第３フラグｍｅｒｇｅ＿ｐｒｏｂａｂｌｅ＿ｆｌａｇ［ｉ］が設置される。第３フラグｍｅｒｇｅ＿ｐｒｏｂａｂｌｅ＿ｆｌａｇ［ｉ］はマージを適用しない場合、即ちｍｅｒｇｅ＿ｆｌａｇ［ｉ］が偽（０）の場合は、通常の動きベクトル検出にて検出された動き情報を使用するので、第３フラグｍｅｒｇｅ＿ｐｒｏｂａｂｌｅ＿ｆｌａｇ［ｉ］にて判定する必要が無い。また、ＮｕｍＭｅｒｇｅＣａｎｄｉｄａｔｅｓが１の場合にも符号化されない。周囲に隣接する有効なパーティションの数が１つであれば、その１つが参照先のパーティションとなるので、ｍｅｒｇｅ＿ｐｒｏｂａｂｌｅ＿ｆｌａｇ［ｉ］を伝送せずとも参照先するパーティションの動き情報が確定する為である。

尚、ＮｕｍＭｅｒｇｅＣａｎｄｉｄａｔｅｓの算出については、後述する。

以下では説明を簡単にする為に、第２フラグ及び第３フラグの配列部分を取り除いた変数を使用することとする。

（符号化における動き情報の参照先予測）
上述のシンタックスに基づき、動画像のビットストリームを符号化する動画像符号化装置における、実施の形態に係る動き情報の参照先予測方法の動作を説明する。動き情報の参照先予測方法をシーケンス全体に渡って、画面間予測に適用する場合には、シーケンス・パラメータ・セット（ＳＰＳ）に記載される第１フラグｉｎｔｅｒ＿ｍｅｒｇｅ＿ｆｌａｇが真（１）に設定される。次に、スライスの中の予測モードが画面間予測（ＭＯＤＥ＿ＩＮＴＥＲ）である予測ブロックのパーティション毎に、本実施の形態に係る動き情報の参照先予測方法の適用／不適用が切り替えられる。

参照先指定部１１３は、処理対象のパーティションの左及び真上に隣接するパーティションをマージ処理の参照先として使用するか否かの判定を行う。図９のフローチャートを参照して参照先指定部１１３の動作を説明する。まず、処理対象のパーティションに隣接する周辺のパーティションの候補数ＮｕｍＭｅｒｇｅＣａｎｄｉｄａｔｅｓを算出する（Ｓ１０１）。

図１０（ａ）は、候補数ＮｕｍＭｅｒｇｅＣａｎｄｉｄａｔｅｓの算出処理の詳細を示すフローチャートである。最初にＮｕｍＭｅｒｇｅＣａｎｄｉｄａｔｅｓを０に設定する（Ｓ２０１）。次に参照先パーティションとして処理対象のパーティションの左に位置するパーティションを設定する（Ｓ２０２）。処理対象のパーティションの画面内の位置情報から参照先パーティションが画面内に存在するかどうかを判定する（Ｓ２０３）。

図１０（ｂ）は、処理対象のパーティション（図中の灰色矩形）に隣接する参照先パーティション（図中の斜線で表される矩形）の例を示す。同図に示すように、処理対象のパーティションが左上に位置する場合には参照先パーティションは存在せず、画面上端に位置する場合は左のみ、画面左端に位置する場合は上のみ、その他の位置では左と上に存在する。参照先パーティションが画面内に存在しない場合（Ｓ２０３のＮｏ）、以降の処理を飛ばしてステップＳ２０７に進む。

参照先パーティションが画面内に存在する場合（Ｓ２０３のＹｅｓ）、参照先指定部１１３は、参照先パーティションの動き情報を取得する（Ｓ２０４）。参照先指定部１１３は、メモリ１１０から参照先パーティションに対応する符号化済みの動き情報を読み出す。読み出された参照先パーティションの動き情報に基づき、参照先指定部１１３は、参照先パーティションの符号化モードがイントラか否かを判定する（Ｓ２０５）。イントラの場合はＳ２０７に進み、イントラでない場合はＮｕｍＭｅｒｇｅＣａｎｄｉｄａｔｅｓを１加算する（Ｓ２０６）。

参照先パーティションの設定が処理対象のパーティションの上であるかどうかを判定する（Ｓ２０７）。参照先パーティションが処理対象のパーティションの上に設定されている場合は終了し、ＮｕｍＭｅｒｇｅＣａｎｄｉｄａｔｅｓを出力する。参照先パーティションが処理対象のパーティションの上に設定されていない場合は、参照先パーティションを処理対象のパーティションの上に設定し直して、ステップＳ２０３以降の判定処理を継続する（Ｓ２０８）。

以上のようにして、候補数ＮｕｍＭｅｒｇｅＣａｎｄｉｄａｔｅｓが算出される。

次に、図９に戻り、算出された候補数ＮｕｍＭｅｒｇｅＣａｎｄｉｄａｔｅｓが０個より大きいか否かの判定が行われる（Ｓ１０２）。候補数ＮｕｍＭｅｒｇｅＣａｎｄｉｄａｔｅｓが０の場合、マージ処理の参照先となる隣接するパーティションが存在しないので、マージ処理により選択された動き情報に基づく動き補償は行わないこととする。候補数ＮｕｍＭｅｒｇｅＣａｎｄｉｄａｔｅｓが０より大きい場合、次のステップＳ１０３の判定に進む。

候補数ＮｕｍＭｅｒｇｅＣａｎｄｉｄａｔｅｓが１より大きいか否かの判定が行われる（Ｓ１０３）。候補数ＮｕｍＭｅｒｇｅＣａｎｄｉｄａｔｅｓが１個の場合（Ｓ１０３のＮｏ）、その１個がマージ処理の参照先パーティションとなるので、参照先指定部１１３は、その参照先パーティションの動き情報をメモリ１１０から取得する（Ｓ１０５）。参照先指定部１１３は、取得した参照先パーティションの動き情報を動き補償部１０６に供給し、動き補償部１０６は、指定された参照先パーティションの動き情報にもとづいて処理対象パーティションの動き補償を行う。

ＮｕｍＭｅｒｇｅＣａｎｄｉｄａｔｅｓが１より大きい、即ち２の場合（Ｓ１０３のＹｅｓ）、参照先指定部１１３は、処理対象のパーティションの左と上に隣接するパーティションの動き情報をメモリ１１０から読み出し、取得する（Ｓ１０４）。

参照先指定部１１３は、取得された左と上に隣接するパーティションの動き情報を比較する（Ｓ１０６）。具体的には、動き情報を構成する予測方向、参照ピクチャ番号及び動きベクトルを比較する。左と上に隣接するパーティションの動き情報が全く同一の場合（Ｓ１０６のＹｅｓ)、候補数ＮｕｍＭｅｒｇｅＣａｎｄｉｄａｔｅｓを１に変更して（Ｓ１０７）、参照先指定部１１３は、左または上のどちらか一方の隣接するパーティションの動き情報を参照先パーティションの動き情報として動き補償部１０６に供給する。ここでは、左に隣接するパーティションの動き情報を選択することにする。左と上に隣接するパーティションの動き情報が異なる場合（Ｓ１０６のＹｅｓ)、参照先指定部１１３は、２個の動き情報をそれぞれ動き補償部１０６に供給する。

以上のように、参照先指定部１１３は、マージ処理により選択された参照先ブロックのパーティションの動き情報を動き補償部１０６に供給し、動き補償部１０６は、指定された参照先ブロックのパーティションの動き情報に基づいて動き補償を行う。また、動き補償部１０６は、動きベクトル検出部１０１により検出された予測ブロックのパーティション毎の動きベクトルにもとづいて通常の動き補償を行う。また、画面内予測部１１１は、画面内の画素相関を利用して面内予測を行う。これら３つの予測方法により生成される予測画像が予測選択部１１２に入力される。

予測選択部１１２は、符号化する画像と入力された３つの予測画像との差分により生成される残差画像と動き情報等の付加情報の発生符号量を計算し、符号量が最小となる予測方法を選択する。

ここで、マージ処理により選択された参照先パーティションの動き情報に基づく動き補償による予測方法が選択された場合について説明する。この時、予測選択部１１２は、マージ処理により選択された参照先パーティションの動き情報として左または上のどちらを使用したかを示すフラグｍｅｒｇｅ＿ｄｉｒｅｃ＿ｆｌａｇを設定する。ｍｅｒｇｅ＿ｄｉｒｅｃ＿ｆｌａｇが１の場合は左に隣接するパーティションの動き情報を、０の場合は上に隣接するパーティションの動き情報を選択することとして、以下説明する。

予測選択部１１２は、マージ処理による予測方法を選択した場合、上述したシンタックスで定義されるマージ処理用のフラグを設定する。図１１は、予測選択部１１２がマージ処理用のフラグを設定する手順を説明するフローチャートである。

最初に予測選択部１１２により選択された予測方法がマージ処理で選択された動き情報に基づく予測であるか否かの判定が行われる（Ｓ３０１）。画像内予測や通常の動きベクトル検出を用いた画面間予測の場合（Ｓ３０１のＮｏ）、ｍｅｒｇｅ＿ｆｌａｇを０に設定して、終了する（Ｓ３０３）。

マージ処理で選択された動き情報に基づく予測であれば（Ｓ３０１のＹｅｓ）、ｍｅｒｇｅ＿ｆｌａｇを１に設定する（Ｓ３０２）。次に、マージ処理で選択された動き情報の数を調べる（Ｓ３０４）。具体的には、上述した参照先指定部１１３が指定する参照先となる隣接するパーティションの候補数ＮｕｍＭｅｒｇｅＣａｎｄｉｄａｔｅｓが１より大きいか否かの判定を行う。

候補数ＮｕｍＭｅｒｇｅＣａｎｄｉｄａｔｅｓが１以下の場合（Ｓ３０４のＮｏ）、マージ処理を選択していることが前提であり、必ず有効な参照先の隣接するパーティションが１つ存在し、左または上のどちらか一方に特定することができるため、ｍｅｒｇｅ＿ｆｌａｇのみを設定し、終了する。

候補数ＮｕｍＭｅｒｇｅＣａｎｄｉｄａｔｅｓが１より大きい場合、即ち２個の隣接するパーティションの動き情報の候補があった場合（Ｓ３０４のＹｅｓ）、参照先パーティションの予測に進む（Ｓ３０５）。ここで、参照先パーティションの予測では、後述する動き情報の参照先予測方法が用いられる。処理対象のパーティションの左及び上に隣接するパーティションのサイズや、処理対象パーティションと隣接パーティションが互いに接している辺の長さ等の情報に基づいて、参照先パーティションの予測が行われ、予測された参照先パーティションを示すフラグｐｒｅｄ＿ｄｉｒｅｃ＿ｆｌａｇが出力される。

予測された参照先パーティションを示すフラグｐｒｅｄ＿ｄｉｒｅｃ＿ｆｌａｇはｍｅｒｇｅ＿ｄｉｒｅｃ＿ｆｌａｇと同様に、参照先の隣接するパーティションとして左（１）或いは上（０）で選択先を表すとともに、予測によって参照先パーティションが選択できなかった場合は、不定（２）が設定される。

次に、このようにして設定された、予測された参照先パーティションを示すフラグｐｒｅｄ＿ｄｉｒｅｃ＿ｆｌａｇの判定を行う（Ｓ３０６）。予測された参照先パーティションを示すフラグｐｒｅｄ＿ｄｉｒｅｃ＿ｆｌａｇが２となるのは参照先パーティションの予測において予測不可の場合であり（Ｓ３０６のＹｅｓ)、この時、実際に発生符号量が最小となる予測方法として選択されたマージ処理による予測で用いた動き情報の参照先パーティションを表すｍｅｒｇｅ＿ｄｉｒｅｃ＿ｆｌａｇを、参照先有効情報を示すフラグｍｅｒｇｅ＿ｐｒｏｂａｂｌｅ＿ｆｌａｇに設定して、終了する（Ｓ３０７）。この場合、参照先有効情報を示すフラグｍｅｒｇｅ＿ｐｒｏｂａｂｌｅ＿ｆｌａｇは、マージ処理において従来と同様に参照先のパーティションを直接示すことになる。

予測された参照先パーティションを示すフラグｐｒｅｄ＿ｄｉｒｅｃ＿ｆｌａｇが２でない場合（Ｓ３０６のＮｏ)、フラグｍｅｒｇｅ＿ｄｉｒｅｃ＿ｆｌａｇとｐｒｅｄ＿ｄｉｒｅｃ＿ｆｌａｇの比較を行う（Ｓ３０８）。ｍｅｒｇｅ＿ｄｉｒｅｃ＿ｆｌａｇは実際に発生符号量が最小となる予測方法として選択されたマージ処理による予測で用いた動き情報の参照先パーティションを表し、参照先パーティションの予測が当たっていればｐｒｅｄ＿ｄｉｒｅｃ＿ｆｌａｇは同一の値になるので、その場合フラグｍｅｒｇｅ＿ｐｒｏｂａｂｌｅ＿ｆｌａｇを１に設定する（Ｓ３０９）。一方、参照先パーティションの予測が外れていればｐｒｅｄ＿ｄｉｒｅｃ＿ｆｌａｇは異なる値になるので、その場合フラグｍｅｒｇｅ＿ｐｒｏｂａｂｌｅ＿ｆｌａｇを０に設定する（Ｓ３１０）。

マージ先パーティションの予測の成否を示すｍｅｒｇｅ＿ｐｒｏｂａｂｌｅ＿ｆｌａｇを用いると、マージ先パーティションの予測が当たった場合、ｍｅｒｇｅ＿ｐｒｏｂａｂｌｅ＿ｆｌａｇは１となり、予測がはずれた場合のみｍｅｒｇｅ＿ｐｒｏｂａｂｌｅ＿ｆｌａｇは０となる。つまり、マージ先パーティションの予測が当たるほどｍｅｒｇｅ＿ｐｒｏｂａｂｌｅ＿ｆｌａｇは１である確率が高く、ｍｅｒｇｅ＿ｐｒｏｂａｂｌｅ＿ｆｌａｇが１である確率が高いことを利用した算術符号化を用いることにより、より少ない情報量でｍｅｒｇｅ＿ｐｒｏｂａｂｌｅ＿ｆｌａｇを伝送することができる。

以上のようにして、パーティション毎にマージ処理により選択された隣接するパーティションの動き情報に基づく動き補償予測が選択された場合、ＳＰＳのヘッダーに記載される第１フラグｉｎｔｅｒ＿ｍｅｒｇｅ＿ｆｌａｇ、予測ブロックに記載される第２フラグｍｅｒｇｅ＿ｆｌａｇ及び第３フラグｍｅｒｇｅ＿ｐｒｏｂａｂｌｅ＿ｆｌａｇが設定され、符号化される。

（復号における動き情報の参照先予測）
上述のシンタックスに基づき、上記の動画像符号化装置により符号化された動画像のビットストリームを復号する動画像復号装置における、実施の形態に係る動き情報の参照先予測方法の動作を説明する。

最初に、可変長復号部２０１により復号されるビットストリームのＳＰＳに記述されているフラグｉｎｔｅｒ＿ｍｅｒｇｅ＿ｆｌａｇから、ビットストリームのシーケンス全体に対して、本実施の形態に係る動き情報の参照先予測方法を使用したマージ処理による画面間予測が適用されるか否かを判定する。ｉｎｔｅｒ＿ｍｅｒｇｅ＿ｆｌａｇが真（１）の場合、マージ処理が適用され、ｉｎｔｅｒ＿ｍｅｒｇｅ＿ｆｌａｇが偽（０）の場合、マージ処理が無視され、従来通りのビットストリームから復号された動き情報に基づく画面間予測が実施される。以下、ｉｎｔｅｒ＿ｍｅｒｇｅ＿ｆｌａｇが真（１）、即ち、本実施の形態に係る動き情報の参照先予測方法を使用したマージ処理が適用されているものとして説明する。

次に、画面内／画面間予測選択部２０９により、スライスの中の予測ブロック毎に予測モードを参照して画面内または画面間予測の何れを選択するかが判定される。画面内予測（ＭＯＤＥ＿ＩＮＴＲＡ）が選択された場合は画面内予測部２０８の処理に進み、画面間予測（ＭＯＤＥ＿ＩＮＴＥＲ）が選択された場合は動き情報選択部２１０の処理に進む。

ここで、動き情報選択部２１０は、予測ブロックのパーティション毎にビットストリームから復号された情報として、符号化の動きベクトル検出にて検出された動き情報、或いはマージ処理により選択された参照先パーティションの動き情報のどちらか一方を選択し、選択された動き情報を動き補償部２０３に出力する。

図１２は、動き情報選択部２１０の選択手順を示すフローチャートであり、この図を参照して説明する。まず、処理対象のパーティションに隣接する周辺のパーティションの候補数ＮｕｍＭｅｒｇｅＣａｎｄｉｄａｔｅｓが算出される（Ｓ４０１）。算出手順は符号化におけるＳ１０１と同様であるので割愛する。

算出された候補数ＮｕｍＭｅｒｇｅＣａｎｄｉｄａｔｅｓが０個より大きいか否かが判定される（Ｓ４０２）。０個の場合、マージ処理の参照先となる隣接するパーティションが存在しないので、動き情報選択部２１０は、従来同様ビットストリームから復号された動き情報を出力する。０個より大きい場合は、可変長復号部２０１により復号されたｍｅｒｇｅ＿ｆｌａｇが読み込まれ（Ｓ４０３）、ｍｅｒｇｅ＿ｆｌａｇに基づき動き情報の選択を判定する（Ｓ４０４）。ｍｅｒｇｅ＿ｆｌａｇが偽（０）の場合、動き情報選択部２１０は、従来同様ビットストリームから復号された動き情報を出力する。ｍｅｒｇｅ＿ｆｌａｇが真（１）の場合、マージ処理での参照先パーティションの動き情報を選択する為の処理に移る。

再度、候補数ＮｕｍＭｅｒｇｅＣａｎｄｉｄａｔｅｓが１個より大きいか否かの判定が行われる（Ｓ４０５）。候補数ＮｕｍＭｅｒｇｅＣａｎｄｉｄａｔｅｓが１個の場合、その１個がマージ処理の参照先パーティションとなるので、その参照先パーティションの動き情報を、復号済み情報が記録されているメモリ２０７から取得する（Ｓ４０７）。取得された動き情報は動き補償部２０３に供給され、その動き情報にもとづいて動き補償が行われる。

候補数ＮｕｍＭｅｒｇｅＣａｎｄｉｄａｔｅｓが１個より大きい場合、即ち２個の場合、処理対象のパーティションの左と上に隣接するパーティションの動き情報をメモリ２０７から読み出し、取得する（Ｓ４０６）。取得された左と上に隣接するパーティションの動き情報を比較する（Ｓ４０８）。具体的には、動き情報を構成する予測方向、参照ピクチャ番号及び動きベクトルを比較する。動き情報が全く同一の場合、左或いは上のどちらか一方の隣接するパーティションの動き情報を取得して、動き補償部２０３に供給する（Ｓ４１０）。ここでは、符号化と同様に左に隣接するパーティションの動き情報を選択することにする。

動き情報が異なる場合は参照先パーティションの予測に進む（Ｓ４０９）。参照先パーティションの予測は、符号化と同様に、後述する動き情報の参照先予測方法が使用される。処理対象のパーティションと周辺の左及び上に隣接するパーティションのサイズや、処理対象パーティションと隣接パーティションが互いに接している辺の長さ等の情報に基づいて、参照先パーティションの予測が行われ、予測された参照先パーティションを示すフラグｐｒｅｄ＿ｄｉｒｅｃ＿ｆｌａｇが出力される。

予測された参照先パーティションを示すフラグｐｒｅｄ＿ｄｉｒｅｃ＿ｆｌａｇは、符号化と同様に参照先の隣接するパーティションが選択される場合は左（１）或いは上（０）で表され、予測によって参照先パーティションが選択出来なかった場合は不定（２）が設定される。

次に出力されたｐｒｅｄ＿ｄｉｒｅｃ＿ｆｌａｇの判定を行う（Ｓ４１１）。ｐｒｅｄ＿ｄｉｒｅｃ＿ｆｌａｇが２となるのは参照先パーティションの予測で予測不可の場合であり、この時、ｃａｓｅ１の処理に進む（Ｓ４１２）。一方、ｐｒｅｄ＿ｄｉｒｅｃ＿ｆｌａｇが２でない場合は、ｃａｓｅ２の処理に進む（Ｓ４１３）。

図１３（ａ）は、ステップＳ４１２のｃａｓｅ１の処理のフローチャートを示す。ｃａｓｅ１では参照先パーティションの予測では予測結果が不定であり、参照先の予測結果が示されない。そこで、従来と同様にｍｅｒｇｅ＿ｐｒｏｂａｂｌｅ＿ｆｌａｇで示される左或いは上に隣接するパーティションを参照先パーティションとして選択する。この場合、符号化側でｍｅｒｇｅ＿ｐｒｏｂａｂｌｅ＿ｆｌａｇには、実際の参照先パーティションを示すｍｅｒｇｅ＿ｄｉｒｅｃ＿ｆｌａｇが設定されているからである。

可変長復号部２０１により復号されたｍｅｒｇｅ＿ｐｒｏｂａｂｌｅ＿ｆｌａｇが読み込まれ（Ｓ４２１）、ｍｅｒｇｅ＿ｐｒｏｂａｂｌｅ＿ｆｌａｇに基づき参照先パーティションを選択する（Ｓ４２２）。ｐｒｅｄ＿ｄｉｒｅｃ＿ｆｌａｇが１の場合、左に隣接するパーティション（Ｓ４２３）、ｍｅｒｇｅ＿ｐｒｏｂａｂｌｅ＿ｆｌａｇが０の場合、上に隣接するパーティションを参照先パーティションとして選択する（Ｓ４２４）。

図１３（ｂ）は、ステップＳ４１３のｃａｓｅ２の処理のフローチャートを示す。ｃａｓｅ２の処理の場合、予測された参照先パーティションを示すフラグｐｒｅｄ＿ｄｉｒｅｃ＿ｆｌａｇの確からしさは、参照先有効性を示すフラグｍｅｒｇｅ＿ｐｒｏｂａｂｌｅ＿ｆｌａｇによって表される。即ち、ｐｒｅｄ＿ｄｉｒｅｃ＿ｆｌａｇで示される参照先パーティションの選択が正しければｍｅｒｇｅ＿ｐｒｏｂａｂｌｅ＿ｆｌａｇは１（真）で表され、正しくなければｍｅｒｇｅ＿ｐｒｏｂａｂｌｅ＿ｆｌａｇは０（偽）で表されることになる。

可変長復号部２０１により復号されたｍｅｒｇｅ＿ｐｒｏｂａｂｌｅ＿ｆｌａｇが読み込まれ（Ｓ４３１）、ｍｅｒｇｅ＿ｐｒｏｂａｂｌｅ＿ｆｌａｇに基づき参照先パーティションの選択を判定する（Ｓ４３２）。ｍｅｒｇｅ＿ｐｒｏｂａｂｌｅ＿ｆｌａｇが１の場合、参照先パーティションの予測で判定されたｐｒｅｄ＿ｄｉｒｅｃ＿ｆｌａｇの示す値のパーティションを参照先パーティションとして選択される（Ｓ４３３）。ｍｅｒｇｅ＿ｐｒｏｂａｂｌｅ＿ｆｌａｇが０の場合、ｐｒｅｄ＿ｄｉｒｅｃ＿ｆｌａｇの示す値と逆のパーティションを参照先パーティションとして選択する。例えば、ｐｒｅｄ＿ｄｉｒｅｃ＿ｆｌａｇが０（左）であれば、上に隣接するパーティションを参照先パーティションとする（Ｓ４３４）。

図１２に戻り、ｃａｓｅ１及びｃａｓｅ２の処理で選択された参照先パーティションの動き情報が取得され（Ｓ４１５）、動き補償部２０３に供給され、終了する。

以上のように、可変長復号部２０１により復号された各フラグと復号過程での演算結果に応じてマージ処理による画面間予測が選択された場合、後述する動き情報の参照先予測方法によって、参照先パーティションを選択する。選択された参照先パーティションの動き情報から動き補償により生成される予測画像とビットストリームから復号された残差信号とを加算することで復号画像が生成される。

（動き情報の参照先予測方法）
図１４は、本実施の形態に係る動き情報の参照先予測方法を説明するフローチャートである。図１４に示される処理過程は、パーティション単位で実施される。各過程で処理対象のパーティションに対して動き情報を参照するパーティションの判定が行われ、参照先としてパーティションが決定された場合には次の過程の判定に進まず、終了する。以下、各過程を順を追って説明する。

まず、処理対象のパーティションの左或いは上に隣接する周囲のパーティションとの境界判定を行う（Ｓ５００）。図１５は、ステップＳ５００の隣接する周囲のパーティションとの境界判定処理を示すフローチャートである。この図を用いて処理の詳細を説明する。

最初に処理対象のパーティションとその周囲に隣接するパーティションの動き境界検出を行う（Ｓ５０１）。

図１６は、処理対象のパーティションをＸとし、左及び上に隣接するパーティションをそれぞれＡ及びＢとした場合の配置例を示す。処理対象のパーティションの矩形サイズを幅ｗｘ、高さｈｘで表し、隣接する左のパーティションの高さをｐａ、隣接する上のパーティションの幅をｐｂで表す。

処理対象のパーティションと左および上に隣接するパーティションの境界の判定は、処理対象のパーティションの高さｈｘと隣接する左のパーティションの高さｐａの比較、及び処理対象のパーティションの幅ｗｘと隣接する上のパーティションの幅ｐｂの比較により実施される。

隣接するパーティションが処理対象のパーティションと隣接する辺を「動き境界」と呼ぶ。ここで、動き境界とは、単に隣接する左或いは上の一つのパーティションの高さ或いは幅だけを評価するだけでなく、図１７に示されるように、例えば処理対象のパーティションの上に隣接するパーティションが複数存在する場合、参照先の候補となる一番左にあるパーティションＢ０とその右隣のパーティションＢ１の動き情報が全く同一であると判定されたなら、動き境界をパーティションＢ１の位置まで延長し、更に右隣のパーティションＢｋ（ｋ＝２，３，．．．ｎＢ−１）について同様の判定を行い、動き情報が同一でないと判定されたパーティションの一つ前のパーティションの位置までの幅を加算した値を動き境界の長さとして定義する。

図１７に示される一例では、Ｂ０とＢ１が同一の動き情報を備えるものと判定された場合であり、結果として上に隣接するパーティションの動き境界の長さは、Ｂ０とＢ１の各パーティションの幅を加算したもの、即ちｐｂ＝ｐｂ０＋ｐｂ１となる。こうして求められた動き境界の長さが処理対象のパーティションの高さまたは幅と一致するか否かを判定する。

まず、隣接する左のパーティションＡと上のパーティションＢと両方の動き境界の長さが処理対象のパーティションＸの高さまたは幅と一致するか否かの判定を行う（Ｓ５０２）。両方とも一致する場合は参照先パーティションを判定することができないので、次の判定ステップＳ５１０に進む。両方とも一致しない場合は、ＡまたはＢのどちらか一方が一致するか否かの判定を行う（Ｓ５０３）。Ａ，Ｂともに一致しない場合は判定が出来ないので、次の判定ステップＳ５１０に進む。ＡまたはＢのどちらか一方の動き境界の長さが処理対象のパーティションＸの高さまたは幅と一致する場合、一致するパーティションを参照先として選択し（Ｓ５０４）、次の判定ステップＳ５１０には進まずに終了する。これは、動き境界の長さが処理対象のパーティションＸの高さまたは幅に一致する場合、その隣接するパーティションと処理対象のパーティションとは動き情報が同一である確率が高いことを利用した参照先パーティションの予測である。

次に、図１４に戻り、処理対象のパーティションと隣接する左或いは上のパーティションの互いに隣接する辺の共通部分の長さ（以下、「隣接辺長」と呼ぶ）による判定を行う（Ｓ５１０）。処理対象のパーティションは、隣接辺長が長いパーティションの動きとの相関性が高いとの推定に基づき判定する。図１８は、ステップＳ５１０の隣接するパーティションとの隣接辺長比較処理を示すフローチャートである。この図を用いて処理の詳細を説明する。

最初に、処理対象のパーティションが隣接する左或いは上のパーティションと接している隣接辺長を算出する（Ｓ５１１）。図１６で示されるように、左のパーティションＡとの隣接辺長はＬ（Ａ）、上のパーティションＢとの隣接辺長はＬ（Ｂ）で表される（図１６中の斜線部が隣接部を表す）。左のパーティションＡとの隣接辺長Ｌ（Ａ）は処理対象のパーティションＸの高さｈｘと左のパーティションの高さｐａとのうち小さい方の長さとなり、次式で表される。
Ｌ（Ａ）＝ｍｉｎ（ｐａ，ｈｘ）
ここで、関数ｍｉｎ（ａ，ｂ）はａ或いはｂのうち小さい方を選択する関数である。一方、上のパーティションＢとの隣接辺長Ｌ（Ｂ）は処理対象のパーティションＸの幅ｗｘと上のパーティションの高さｐｂとのうち小さい方の長さとなり、次式で表される。
Ｌ（Ｂ）＝ｍｉｎ（ｐｂ，ｗｘ）
但し、ｐａ及びｐｂはステップＳ５００にて求められた動き境界の長さである。

求められた隣接辺長Ｌ（Ａ）とＬ（Ｂ）の比較を行い、参照先のパーティションを選択する（Ｓ５１２）。Ｌ（Ａ）とＬ（Ｂ）とが等しい場合、参照先のパーティションを判定することができないので、参照先のパーティションを選択せず不定とし（Ｓ５１３）、終了する。Ｌ（Ａ）とＬ（Ｂ）とが等しくない場合、Ｌ（Ａ）とＬ（Ｂ）の大小比較を行う（Ｓ５１４）。Ｌ（Ａ）がＬ（Ｂ）より大きい場合、Ａを選択し（Ｓ５１５）、終了する。Ｌ（Ａ）がＬ（Ｂ）より小さい場合、Ｂを選択し（Ｓ５１６）、終了する。

以上述べた隣接パーティションとの境界判定／（Ｓ５００）及び隣接辺長比較（Ｓ５１０）により、処理対象のパーティションと隣接する左及び上のパーティションの動き境界や辺長の条件で場合分けした判定結果を纏めたものを図１９の表に示す。図１９の表中の選択欄が参照先となるパーティションを示しており、記号”−”は参照先パーティションが不定の場合を表す。

ここでは、図１９の表の中の条件に基づく判定の例を幾つか説明する。例えば、図１９の５つ目の境界比較条件”ｐｂ＜ｗｘ且つｐａ＜ｈｘ”は、図２０に示されるような配置で、隣接するパーティションＡ，Ｂの動き境界の長さがともに処理対象のパーティションの幅および高さと一致していない場合である。この場合、動き境界一致による判定は出来ないので、処理対象のパーティションに接している隣接辺長の長さの比較により参照先を判定する。隣接するパーティションＡ及びＢの隣接辺長Ｌ（Ａ）及びＬ（Ｂ）はそれぞれ処理対象のパーティションＸに接している辺ｐａ及びｐｂとなるので、ｐａとｐｂの比較により、参照先のパーティションが判定される。

また、図１９の９つ目の境界比較条件”ｐｂ＞ｗｘ且つｐａ＞ｈｘ”も、隣接するパーティションＡ，Ｂの動き境界の長さがともに処理対象のパーティションの幅および高さと一致していない場合である。この場合も、動き境界一致による判定は出来ないので、処理対象のパーティションに接している隣接辺長の長さの比較により参照先を判定する。図２１は境界比較条件”ｐｂ＞ｗｘ且つｐａ＞ｈｘ”での処理対象及び隣接するパーティションの配置の一例を示したものである。図４に示されるように、予測ブロック内部のパーティションのサイズや形状は定義されている為、図２１で示される境界比較条件”ｐｂ＞ｗｘ且つｐａ＞ｈｘ”に合致するパーティションのサイズや形状は限定される。この場合、隣接するパーティションに形状に関わらず、処理対象のパーティションはＮ×Ｎに限定される。その為、隣接するパーティションＡ及びＢの隣接辺長Ｌ（Ａ）及びＬ（Ｂ）はともにＮとなる。Ｌ（Ａ）＝Ｌ（Ｂ）＝Ｎになり、隣接辺長による比較からは判定が出来ないので、不定と判定する。

こうして、判定された参照先パーティションの予測結果を、符号化及び復号過程において予測された参照先パーティションを示すフラグｐｒｅｄ＿ｄｉｒｅｃ＿ｆｌａｇとして出力する。ｐｒｅｄ＿ｄｉｒｅｃ＿ｆｌａｇは、ｍｅｒｇｅ＿ｄｉｒｅｃ＿ｆｌａｇと同様に、参照先の隣接するパーティションとして選択される場合は”１（左）”或いは”０（上）”で参照先を表し、予測によって参照先パーティションが選択出来なかった場合は”２（不定）”と設定される。

以上述べたように、第１の実施例によれば、マージ処理における参照先ブロックを予測することで、参照先の指定に使用するフラグｍｅｒｇｅ＿ｐｒｏｂａｂｌｅ＿ｆｌａｇで表されるビットの発生確率を偏らせ、発生する符号量を削減することが可能となり、符号化効率を向上させることができる。従来は左或いは上の隣接ブロックを参照先として指定する場合、参照先フラグは１／２の頻度になり算術符号化を活かせないでいたが、第１の実施例によれば、予測された参照先の確からしさを表すフラグｍｅｒｇｅ＿ｐｒｏｂａｂｌｅ＿ｆｌａｇを用いることで、予測が的中すればフラグのビット頻度を偏らせることが可能であり、算術符号化においては発生符号量を削減することができる。また、符号化対象ブロックのサイズと一致する隣接ブロックや、隣接している辺の長さが長い隣接ブロックの方が符号化対象ブロックとの相関性が高いことを使用して、参照先のブロックを予測するようにしたことで予測の精度を高めることができる。

［実施例２］
本発明の実施の形態による動き情報の参照先予測方法の第２の実施例について説明する。第１の実施例との違いは、参照先予測の判定条件として、処理対象のパーティションに隣接する左或いは上のパーティションの残差信号に基づく判定処理が追加される点である。

図２２は、動き情報の参照先予測方法の第２の実施例の動作を説明するフローチャートである。図２２に示されるステップＳ６００及びＳ６１０の処理は、図１４に示される第１の実施例のステップＳ５００及びＳ５１０の処理と同一である。処理対象のパーティションの左或いは上に隣接する周囲のパーティションとの境界判定を行い（Ｓ６００）、処理対象のパーティションと隣接する左或いは上のパーティションの互いに隣接する辺の共通部分の長さ（「隣接辺長」）による判定を行う（Ｓ６１０）。

処理対象のパーティションと隣接する左或いは上のパーティションとの隣接辺長による判定（Ｓ６１０）の後、参照先としてパーティションが決定されなかった場合、残差信号に基づく判定（Ｓ６２０）に進む。

ここで、残差信号に基づく判定処理を実施する際のパラメータについて説明する。図２３は、隣接するパーティションの境界残差を算出する画素領域を示す図である。図２３に示されるように、処理対象のパーティションＸに対して隣接する左のパーティションをＡ、上のパーティションをＢとする。それぞれのパーティションＡ，Ｂは、符号化過程における動き補償予測後の画素の残差信号、或いは復号過程における逆量子化・逆直交変換後の画素の残差信号で構成されているものとする。

パーティションＡの画素でパーティションＸに接している画素領域は、パーティションＸの左側の境界に位置する高さがｍｉｎ（ｈａ，ｈｘ）、幅が１ピクセルの領域で表され、その画素の残差信号の絶対値の総和をδ（Ａ）とすると、δ（Ａ）は次式で表される。

ここで、ａｉはパーティションＸに隣接しているパーティションＡの画素の残差信号を表す。パーティションＸに隣接しているパーティションＡの画素数は、パーティションＡの高さを表す画素数ｈａとパーティションＸの高さｈｘとの小さい方であり、関数ｍｉｎ（ｈａ，ｈｘ）で表される。

同様に、パーティションＢの画素でパーティションＸに接している画素領域は、パーティションＸの上側の境界に位置する幅がｍｉｎ（ｗｂ，ｗｘ）、高さが１ピクセルの領域で表され、その画素の残差信号絶対値の総和をδ（Ｂ）とすると、δ（Ｂ）は次式で表される。

ここで、ｂｉはパーティションＸに隣接しているパーティションＢの画素の残差信号を表す。パーティションＸに隣接しているパーティションＢの画素数は、パーティションＢの幅を表す画素数ｗｂとパーティションＸの幅ｗｘとの小さい方であり、関数ｍｉｎ（ｗｂ，ｗｘ）で表される。

図２４は、隣接するパーティションの境界残差に基づく参照先パーティションの判定の動作を説明するフローチャートである。まず、処理対象のパーティションＸに隣接する左或いは上のパーティションのパーティションＸとの境界残差として、上述した画素の残差信号絶対値の総和が算出される（Ｓ６２１）。

次に算出された境界残差の正規化を行う（Ｓ６２２）。図２３に示されるように、パーティションＸに隣接しているパーティションＡ及びＢの隣接辺長が異なる場合、パーティションＡの境界残差とパーティションＢの境界残差を直接比較することは適切ではないため、次式のように、パーティションＡ、Ｂの境界残差をそれぞれパーティションＡ、Ｂの隣接辺長で割ることにより正規化する。

パーティションＡおよびＢの正規化された境界残差を比較する。まず、パーティションＡの境界残差δ（Ａ）とパーティションＢの境界残差δ（Ｂ）とが等しい場合か否かを判定する（Ｓ６２３）。δ（Ａ）とδ（Ｂ）とが等しくない場合はδ（Ａ）とδ（Ｂ）とで大小関係が成立するので、大小比較を行う。ここでは、δ（Ａ）がδ（Ｂ）より小さいか否かを判定する（Ｓ６２４）。処理対象のパーティションＸに隣接する画素領域で動き補償予測で算出される残差が小さくなる動き情報を選択してパーティションＸに適用した方が、パーティションＸの予測誤差を小さくすることができると推測される。そこで、δ（Ａ）がδ（Ｂ）より小さい場合はパーティションＡを参照先として選択し（Ｓ６２５）、そうでない場合はパーティションＢを参照先として選択する（Ｓ６２６）。

パーティションＡの境界残差δ（Ａ）とパーティションＢの境界残差δ（Ｂ）とが等しい場合は、境界残差による参照先の判定はできないので、残差比の算出に進む（Ｓ６２７）。ここで、パーティションＡ、Ｂの残差比Δ（Ａ），Δ（Ｂ）とは、ステップＳ６２１にて算出されたパーティションＡ、Ｂの正規化前の境界残差δ（Ａ）、δ（Ｂ）のパーティションＡ、Ｂの総残差に対する比として次式で表される。

ここで、Ａｉ及びＢｉはパーティションＸに隣接しているパーティションＡ及びＢの画素の残差信号であり、ｎＡ及びｎＢはパーティションＡ及びＢの画素の総数である。但し、処理対象のパーティションＸに隣接していない領域については対象とはならない。例えば、図２３のパーティションＡにおいて、ｈａ＞ｈｘの場合、隣接辺長はｍｉｎ（ｈａ，ｈｘ）＝ｈｘであるから、パーティションＡの高さｈｘまでの上側の矩形領域の画素が計算の対象であり、それを超える高さ（ｈａ−ｈｘ）のパーティションＡの下側の矩形領域の画素は対象外とする。更に、パーティションＡの幅を表す画素数ｗａとパーティションＢの高さを表す画素数ｈｂとを比較し、小さい方を対象領域の幅として定義する。図２３で示される例では、対象領域の幅はｍｉｎ（ｗａ，ｈｂ）＝ｈｂとなる。したがって、対象領域は、幅ｈｂ、高さｈｘの斜線で示される領域であり、パーティションＡの対象領域の画素数ｎＡは次式で与えられる。

同様に、パーティションＢの対象領域の幅はパーティションＢの隣接辺長ｍｉｎ（ｗｂ，ｗｘ）＝ｗｂであり、高さはパーティションＡの幅を表す画素数ｗａとパーティションＢの高さを表す画素数ｈｂの小さい方であるからｍｉｎ（ｗａ，ｈｂ）＝ｈｂである。パーティションＢの対象領域の画素数ｎＢは次式で与えられる。

ｎＡは、図２３のパーティションＡ内の太点線内の薄灰色で示される矩形領域が対象となり、Δ（Ａ）の算出式の分母は、この矩形領域内の画素の残差信号の絶対値の総和として表される。一方、ｎＢは図２３のパーティションＢの全領域が対象となり、Δ（Ｂ）の算出式の分母部はパーティションＢ内の画素の残差信号の絶対値の総和として表される。正規化前の境界残差δ（Ａ）及びδ（Ｂ）はそれぞれパーティションＸに隣接する画素の残差信号の絶対値の総和であり、それぞれパーティションＸに隣接する画素数はｍｉｎ（ｈａ，ｈｘ）＝ｈｘ、ｍｉｎ（ｗｂ，ｗｘ）＝ｗｂであるので、残差比Δ（Ａ）及びΔ（Ｂ）は同率の画素数比で算出され、Δ（Ａ）及びΔ（Ｂ）はパーティションＸと隣接する画素の残差信号がパーティションＡ及びＢの画素の残差信号に占める比率を表すことになる。この比率が高いということは、パーティションＸと隣接する画素付近の動き補償予測が当たっていない、即ち、動き補償予測に使用した動き情報がパーティションＸと隣接する画素付近の予測に用いるには適切でないことを意味する。即ち、残差比が高い方の隣接するパーティションの動き情報を参照しないと判定することになる。

こうして算出された残差比の比較を行う。Δ（Ａ）とΔ（Ｂ）とが等しい場合か否かを判定する（Ｓ６２８）。Δ（Ａ）とΔ（Ｂ）とが等しくない場合はΔ（Ａ）とΔ（Ｂ）とで大小関係が成立するので、大小比較を行う。ここでは、Δ（Ａ）がΔ（Ｂ）より小さいか否かを判定する（Ｓ６２９）。Δ（Ａ）がΔ（Ｂ）より小さい場合はＡを選択し（Ｓ６３０）、そうでない場合はＢを選択する（Ｓ６３１）。Δ（Ａ）とΔ（Ｂ）とが等しい場合は、どちらを選択しても発生する残差に差が無いので、Ａを選択することとして（Ｓ６３２）、終了する。

以上のようにして、判定された参照先パーティションの予測結果を、符号化及び復号過程にフラグｐｒｅｄ＿ｄｉｒｅｃ＿ｆｌａｇとして出力する。ｐｒｅｄ＿ｄｉｒｅｃ＿ｆｌａｇはｍｅｒｇｅ＿ｄｉｒｅｃ＿ｆｌａｇと同様に、参照先の隣接するパーティションとして選択される場合は”１（左）”或いは”０（上）”で参照先を表す。ステップＳ６３２での選択をＡとしたのは、本実施例にてＡ（左）がビット”１”に割り当てられたためである。これは、動き情報の参照先パーティションの予測として、ｐｒｅｄ＿ｄｉｒｅｃ＿ｆｌａｇの発生頻度を”１”に偏らせることで、符号化において発生符号量を削減するためである。

尚、実施例２にて、図２４で示されるステップＳ６２３において、境界残差δ（Ａ）とδ（Ｂ）とが等しい場合か否かの厳密な判定を、δ（Ａ）とδ（Ｂ）との絶対値差分｜δ（Ａ）−δ（Ｂ）｜が閾値ε未満か否かとして判定を変更してもよい。δ（Ａ）及びδ（Ｂ）の値が大きい場合の絶対値差分と小さい場合の絶対値差分とでは同じ差分値になったとしても、その意味合いは異なる。例えば、δ（Ａ）＝１０００、δ（Ｂ）＝１００１の場合とδ（Ａ）＝８、δ（Ｂ）＝７の場合とでは、共に絶対値差分は１となるが、前者の個々の境界残差の値から見れば誤差に等しい値を意味することになる。そこで、境界残差δ（Ａ）とδ（Ｂ）の値の比較において、δ（Ａ）とδ（Ｂ）との絶対値差分｜δ（Ａ）−δ（Ｂ）｜と閾値εとの比較を行うことで、従来の境界残差δ（Ａ）とδ（Ｂ）とが等しいか否かの場合（ε＝０と等価）を含めるようにして、判定を拡張することが可能である。ここで、εは固定値としてもよいし、例えば量子化パラメータＱｐの値に応じて変更される可変値としてもよい。

更に、実施例２では境界残差及び残差比の２つの差分判定を順に実施したが、境界残差と残差比をそれぞれで判定を行い、それらの結果から最終的な参照先パーティションの選択をしても良い。また、境界残差及び残差比を纏めて新たな評価基準を生成し、判定しても良い。例えば、次式のように境界残差と残差比との組み合わせによって生成される評価値に基づいて判定してもよい。

ここで、変数ｘはＡ若しくはＢであり、αは重み付け係数である。αは固定値としてもよいし、パーティションやスライス単位、或いはスライスタイプ等に応じて可変値として設定してもよい。

以上述べたように、第２の実施例によれば、符号化対象のブロックの周囲に隣接するブロックの残差信号の大きさに基づいて、参照先のブロックを予測することで参照先の予測の精度をさらに高めることができる。

［実施例３］
本発明の実施の形態による動き情報の参照先予測方法の第３の実施例について説明する。第１の実施例との違いは、参照先パーティションの予測により判定され出力されるフラグｐｒｅｄ＿ｄｉｒｅｃ＿ｆｌａｇで表されるパーティションを参照先パーティションとして選定する点である。参照先パーティションの予測によるフラグｐｒｅｄ＿ｄｉｒｅｃ＿ｆｌａｇが０或いは１の場合は、参照先の隣接するパーティションとして左（ｐｒｅｄ＿ｄｉｒｅｃ＿ｆｌａｇが”１”）或いは上（ｐｒｅｄ＿ｄｉｒｅｃ＿ｆｌａｇが”０”）が選択される。

参照先パーティションの予測において不定として判定された場合、即ちｐｒｅｄ＿ｄｉｒｅｃ＿ｆｌａｇが”２”の場合は、実際に発生符号量が最小となる予測方法として選択されたマージ処理による予測で用いた動き情報の参照先パーティションを表すフラグｍｅｒｇｅ＿ｄｉｒｅｃ＿ｆｌａｇを、参照先のパーティションを表すものとして用いる。この条件をシンタックスとして表現すると図２５となる。パーティション単位にマージするか否かを判定するｍｅｒｇｅ＿ｆｌａｇの後に続いて、『マージ処理を実行し、且つ周囲に隣接する有効なパーティションの数ＮｕｍＭｅｒｇｅＣａｎｄｉｄａｔｅｓが１よりも大きく、且つ参照先パーティションの予測で不定』である場合に、参照先パーティションを表すフラグｍｅｒｇｅ＿ｄｉｒｅｃ＿ｆｌａｇが設定される。マージ処理による予測が選択された場合、上述したシンタックスで定義されるマージ処理用のフラグが設定される。図２６のフローチャートを使って、符号化における動き情報の参照先予測方法の第３の実施例の動作を説明する。

図２６はマージ処理用のフラグを設定する手順を説明するフローチャートである。最初に予測選択部１１２により選択された予測方法がマージ処理で選択された動き情報に基づく予測であるか否かの判定が行われる（Ｓ７０１）。画像内予測や通常の動きベクトル検出を用いた画面間予測の場合はｍｅｒｇｅ＿ｆｌａｇを０に設定して、終了する（Ｓ７０３）。マージ処理で選択された動き情報に基づく予測であれば、ｍｅｒｇｅ＿ｆｌａｇを１に設定する（Ｓ７０２）。

次に、マージ処理で選択された動き情報の数を調べる（Ｓ７０４）。参照先指定部１１３が指定する参照先となる隣接するパーティションの候補数ＮｕｍＭｅｒｇｅＣａｎｄｉｄａｔｅｓが１より大きいか否かの判定が行われる。候補数ＮｕｍＭｅｒｇｅＣａｎｄｉｄａｔｅｓが１以下の場合、マージ処理を選択していることが前提であり、必ず有効な参照先の隣接するパーティションが１つ存在し、左或いは上のどちらか一方を特定することができるので、ｍｅｒｇｅ＿ｆｌａｇのみを設定し、終了する。

候補数ＮｕｍＭｅｒｇｅＣａｎｄｉｄａｔｅｓが１より大きい場合、即ち２個の隣接するパーティションの動き情報の候補があった場合は参照先パーティションの予測に進む（Ｓ７０５）。ここで、参照先パーティションの予測では、第１の実施例にて説明した動き情報の参照先予測方法が使用される。処理対象のパーティションの左及び上に隣接するパーティションのサイズや、処理対象パーティションと隣接パーティションが互いに接している辺の長さ等の情報に基づいて、参照先パーティションの予測が行われ、フラグｐｒｅｄ＿ｄｉｒｅｃ＿ｆｌａｇが出力される。

予測された参照先パーティションを示すフラグｐｒｅｄ＿ｄｉｒｅｃ＿ｆｌａｇはｍｅｒｇｅ＿ｄｉｒｅｃ＿ｆｌａｇと同様に、参照先の隣接するパーティションとして左（１）或いは上（０）で選択先を表されるとともに、予測によって参照先パーティションが選択できなかった場合の不定（２）が設定される。

次に、このようにして設定された、予測された参照先パーティションを示すフラグｐｒｅｄ＿ｄｉｒｅｃ＿ｆｌａｇの判定を行う（Ｓ７０６）。予測された参照先パーティションを示すフラグｐｒｅｄ＿ｄｉｒｅｃ＿ｆｌａｇが２となるのは参照先パーティションの予測において予測不可の場合であり、この時、実際に発生符号量が最小となる予測方法として選択されたマージ処理による動き補償予測で用いた動き情報の参照先パーティションを表すｍｅｒｇｅ＿ｄｉｒｅｃ＿ｆｌａｇを設定して、終了する（Ｓ７０７）。一方、ｐｒｅｄ＿ｄｉｒｅｃ＿ｆｌａｇが２でない場合は、ｐｒｅｄ＿ｄｉｒｅｃ＿ｆｌａｇが参照先のパーティションを直接示すことになり、”０”の場合は上を、”１”の場合は左に隣接するパーティションを選択する。

参照先パーティションの予測の成否を示すフラグｐｒｅｄ＿ｄｉｒｅｃ＿ｆｌａｇにより、参照先パーティションの予測が当たり、参照先として隣接するパーティションが選択される確率が高い程、参照先パーティションを示すフラグｍｅｒｇｅ＿ｄｉｒｅｃ＿ｆｌａｇを伝送する必要性がなくなるので、符号化効率が向上することになる。

以上のようにして、パーティション毎にマージ処理により選択された隣接するパーティションの動き情報に基づく動き補償予測が選択された場合、ＳＰＳのヘッダーに記載される第１フラグｉｎｔｅｒ＿ｍｅｒｇｅ＿ｆｌａｇ、予測ブロックに記載される第２フラグｍｅｒｇｅ＿ｆｌａｇ及び第３フラグｍｅｒｇｅ＿ｄｉｒｅｃ＿ｆｌａｇが設定され、符号化される。

次に、上述のシンタックスに基づき、符号化された動画像のビットストリームを復号する場合の参照先予測方法の動作を説明する。

図２７は、動き情報選択部２１０の選択手順を示すフローチャートであり、この図を参照して説明する。まず、処理対象のパーティションに隣接する周辺のパーティションの候補数ＮｕｍＭｅｒｇｅＣａｎｄｉｄａｔｅｓが算出される（Ｓ８０１）。算出手順は符号化におけるＳ７０１と同様であるので割愛する。

算出された候補数ＮｕｍＭｅｒｇｅＣａｎｄｉｄａｔｅｓが０個より大きいか否かが判定される（Ｓ８０２）。０個の場合、マージ処理の参照先となる隣接するパーティションが存在しないので、動き情報選択部２１０は、従来同様ビットストリームから復号された動き情報を出力する。０個より大きい場合は、可変長復号部２０１により復号されたｍｅｒｇｅ＿ｆｌａｇが読み込まれ（Ｓ８０３）、ｍｅｒｇｅ＿ｆｌａｇに基づき動き情報の選択を判定する（Ｓ８０４）。ｍｅｒｇｅ＿ｆｌａｇが偽（０）の場合、動き情報選択部２１０は、従来同様ビットストリームから復号された動き情報を出力する。ｍｅｒｇｅ＿ｆｌａｇが真（１）の場合、マージ処理での参照先パーティションの動き情報を選択する為の処理に移る。

再度、候補数ＮｕｍＭｅｒｇｅＣａｎｄｉｄａｔｅｓが１個より大きいか否かの判定が行われる（Ｓ８０５）。候補数ＮｕｍＭｅｒｇｅＣａｎｄｉｄａｔｅｓが１個の場合、その１個がマージ処理の参照先パーティションとなるので、その参照先パーティションの動き情報を、復号済み情報が記録されているメモリ２０７から取得する（Ｓ８０７）。取得された動き情報は動き補償部２０３に供給され、その動き情報にもとづいて動き補償が行われる。

候補数ＮｕｍＭｅｒｇｅＣａｎｄｉｄａｔｅｓが１個より大きい場合、即ち２個の場合、処理対象のパーティションの左と上に隣接するパーティションの動き情報をメモリ２０７から読み出し、取得する（Ｓ８０６）。取得された左と上に隣接するパーティションの動き情報を比較する（Ｓ８０８）。具体的には、動き情報を構成する予測方向、参照ピクチャ番号及び動きベクトルを比較する。動き情報が全く同一の場合、左或いは上のどちらか一方の隣接するパーティションの動き情報を取得して、動き補償部２０３に出力する（Ｓ８１０）。ここでは、符号化と同様に左に隣接するパーティションの動き情報を選択することにする。

動き情報が異なる場合は参照先パーティションの予測に進む（Ｓ８０９）。参照先パーティションの予測は、符号化と同様に、実施例１にて説明された動き情報の参照先予測方法が使用される。処理対象のパーティションと周辺の左及び上に隣接するパーティションのサイズや、処理対象パーティションと隣接パーティションが互いに接している辺の長さ等の情報に基づいて、参照先パーティションの予測が行われ、予測された参照先パーティションを示すフラグｐｒｅｄ＿ｄｉｒｅｃ＿ｆｌａｇが出力される。

次に出力されたｐｒｅｄ＿ｄｉｒｅｃ＿ｆｌａｇの判定を行う（Ｓ８１１）。ｐｒｅｄ＿ｄｉｒｅｃ＿ｆｌａｇが２となるのは参照先パーティションの予測で予測不可の場合であり、参照先パーティションの判定は行えない。そこで、可変長復号部２０１により復号されたｍｅｒｇｅ＿ｄｉｒｅｃ＿ｆｌａｇが読み込まれる（Ｓ８１２）。ｍｅｒｇｅ＿ｄｉｒｅｃ＿ｆｌａｇに基づき、参照先パーティションの選択を判定する（Ｓ８１３）。ｍｅｒｇｅ＿ｄｉｒｅｃ＿ｆｌａｇが１の場合、左に隣接するパーティション（Ｓ８１４）、ｍｅｒｇｅ＿ｄｉｒｅｃ＿ｆｌａｇが０の場合、上に隣接するパーティションを参照先パーティションとして選択する（Ｓ８１５）。

一方、ｐｒｅｄ＿ｄｉｒｅｃ＿ｆｌａｇが２でない場合はｐｒｅｄ＿ｄｉｒｅｃ＿ｆｌａｇで示される値が直接参照先の隣接パーティションを示す。即ち、ｐｒｅｄ＿ｄｉｒｅｃ＿ｆｌａｇが１の場合、左に隣接するパーティション、ｍｅｒｇｅ＿ｐｒｏｂａｂｌｅ＿ｆｌａｇが０の場合、上に隣接するパーティションを参照先パーティションとして選択する。こうして選択された参照先パーティションの動き情報が取得され、動き補償部２０３に供給され、終了する。

以上のように、可変長復号部２０１により復号された各フラグと復号過程での演算結果に応じてマージ処理による画面間予測が選択された場合、前述した動き情報の参照先予測方法によって、参照先パーティションを選択する。選択された参照先パーティションの動き情報から動き補償により生成される予測画像とビットストリームから復号された残差信号と加算されることで復号画像が生成される。

更に、第２の実施例にて説明した処理対象のパーティションに隣接する左或いは上のパーティションの残差信号に基づく判定処理を同様に適用することも可能である。

以上述べたように、第３の実施例によれば、参照先の予測による参照先となる隣接ブロックの判定の一致精度が高いものとして、ｍｅｒｇｅ＿ｐｒｏｂａｂｌｅ＿ｆｌａｇそのものを定義せず、参照先の予測により得られた判定結果で参照先の隣接ブロックを示し、参照先の予測が不定の場合にのみフラグｍｅｒｇｅ＿ｄｉｒｅｃ＿ｆｌａｇで参照先の隣接ブロックを示してもよい。この場合、ｍｅｒｇｅ＿ｄｉｒｅｃ＿ｆｌａｇによる符号量の増加をｍｅｒｇｅ＿ｐｒｏｂａｂｌｅ＿ｆｌａｇに要する符号量の削減で相殺し、相対的に符号化効率を向上させることができる。

更に、上述した第３の実施例において、参照先パーティションの予測で必ず左或いは上に隣接するパーティションを参照先パーティションとして指定するようにして、参照先パーティションの予測により不定と判定されることを無くしてもよい。参照先パーティションの予測で不定として判定されていた場合に、左或いは上の隣接パーティションを一意に指定することを予め既定しておくことで、符号化における動き情報の参照先予測方法では、参照先パーティションの予測により不定判定された場合に参照先パーティションを表すフラグｍｅｒｇｅ＿ｄｉｒｅｃ＿ｆｌａｇを符号化、伝送する必要性が無くなるので、符号化効率を向上させることができる。符号化に対応した復号における動き情報の参照先予測方法では、符号化側と同じ参照先パーティションの予測を行い、参照先パーティションの予測で判定された左或いは上に隣接するパーティションを参照先パーティションとして選択する。

以上述べた実施の形態の動画像符号化装置が出力する動画像の符号化ストリームは、実施の形態で用いられた符号化方法に応じて復号することができるように特定のデータフォーマットを有しており、動画像符号化装置に対応する動画像復号装置がこの特定のデータフォーマットの符号化ストリームを復号することができる。

動画像符号化装置と動画像復号装置の間で符号化ストリームをやりとりするために、有線または無線のネットワークが用いられる場合、符号化ストリームを通信路の伝送形態に適したデータ形式に変換して伝送してもよい。その場合、動画像符号化装置が出力する符号化ストリームを通信路の伝送形態に適したデータ形式の符号化データに変換してネットワークに送信する動画像送信装置と、ネットワークから符号化データを受信して符号化ストリームに復元して動画像復号装置に供給する動画像受信装置とが設けられる。

動画像送信装置は、動画像符号化装置が出力する符号化ストリームをバッファするメモリと、符号化ストリームをパケット化するパケット処理部と、パケット化された符号化データをネットワークを介して送信する送信部とを含む。動画像受信装置は、パケット化された符号化データをネットワークを介して受信する受信部と、受信された符号化データをバッファするメモリと、符号化データをパケット処理して符号化ストリームを生成し、動画像復号装置に提供するパケット処理部とを含む。

以上の符号化及び復号に関する処理は、ハードウェアを用いた伝送、蓄積、受信装置として実現することができるのは勿論のこと、ＲＯＭ（リード・オンリ・メモリ）やフラッシュメモリ等に記憶されているファームウェアや、コンピュータ等のソフトウェアによっても実現することができる。そのファームウェアプログラム、ソフトウェアプログラムをコンピュータ等で読み取り可能な記録媒体に記録して提供することも、有線あるいは無線のネットワークを通してサーバから提供することも、地上波あるいは衛星ディジタル放送のデータ放送として提供することも可能である。

以上、本発明を実施の形態をもとに説明した。実施の形態は例示であり、それらの各構成要素や各処理プロセスの組合せにいろいろな変形例が可能なこと、またそうした変形例も本発明の範囲にあることは当業者に理解されるところである。

１０１動きベクトル検出部、１０２減算部、１０３直交変換・量子化部、１０４可変長符号化部、１０５逆量子化・逆直交変換部、１０６動き補償部、１０７重み付き予測部、１０８加算部、１０９デブロッキング・フィルタ部、１１０メモリ、１１１画面内予測部、１１２予測選択部、１１３参照先指定部、２０１可変長復号部、２０２逆量子化・逆直交変換部、２０３動き補償部、２０４重み付き予測部、２０５加算部、２０６デブロッキング・フィルタ部、２０７メモリ、２０８画面内予測部、２０９画面内／画面間予測選択部、２１０動き情報選択部。

Claims

動画像の各ピクチャを分割したブロック単位で動きベクトルを用いて前記動画像を符号化する動画像符号化装置であって、
符号化対象ブロックに隣接する複数の符号化済みの隣接ブロックの中から、前記符号化対象ブロックと前記隣接ブロックとの隣接条件に基づいて判定されるいずれか一つの隣接ブロックを、動き情報を参照するための参照先ブロックとして指定する参照先指定部と、
画像内予測、符号化対象ブロックの動きベクトルを利用した画像間予測、および隣接ブロックの動きベクトルを利用した画像間予測の中から、予測方法として、隣接ブロックの動きベクトルを利用した画像間予測が選択された場合、選択された予測方法により参照される隣接ブロックと前記参照先指定部により指定された前記参照先ブロックとが一致するか否かを表す参照先有効情報と選択された予測方法を示す情報とを動き情報に代わって生成する予測選択部とを含み、
前記参照先指定部は、前記隣接条件として、前記隣接ブロックの隣接する辺の長さが前記符号化対象ブロックの高さまたは幅と同じであるか否かを判定することにより、隣接する辺の長さが前記符号化対象ブロックの高さまたは幅と同じである隣接ブロックを選択し、選択された隣接ブロックを参照先ブロックとして指定することを特徴とする動画像符号化装置。
動画像の各ピクチャを分割したブロック単位で動きベクトルを用いて前記動画像を符号化する動画像符号化装置であって、
符号化対象ブロックに隣接する複数の符号化済みの隣接ブロックの中から、前記符号化対象ブロックと前記隣接ブロックとの隣接条件に基づいて判定されるいずれか一つの隣接ブロックを、動き情報を参照するための参照先ブロックとして指定する参照先指定部と、
画像内予測、符号化対象ブロックの動きベクトルを利用した画像間予測、および隣接ブロックの動きベクトルを利用した画像間予測の中から、予測方法として、隣接ブロックの動きベクトルを利用した画像間予測が選択された場合、選択された予測方法により参照される隣接ブロックと前記参照先指定部により指定された前記参照先ブロックとが一致するか否かを表す参照先有効情報と選択された予測方法を示す情報とを動き情報に代わって生成する予測選択部とを含み、
前記参照先指定部は、前記隣接条件として、前記符号化対象ブロックと前記隣接ブロックの互いに隣接する辺の共通部分の長さの大小関係を判定することにより、隣接する辺の共通部分の長さが大きい方の隣接ブロックを選択し、選択された隣接ブロックを参照先ブロックとして指定することを特徴とする動画像符号化装置。
前記参照先指定部は、前記符号化対象ブロックのいずれかの辺に動き情報が同一である複数の前記隣接ブロックが連続して並んでいる場合、前記隣接する辺の長さは、これらの連続する前記隣接ブロックの辺の長さを加算したものとして、前記隣接条件を判定することを特徴とする請求項１または２に記載の動画像符号化装置。
動画像の各ピクチャを分割したブロック単位で動きベクトルを用いて前記動画像を符号化する動画像符号化方法であって、
符号化対象ブロックに隣接する複数の符号化済みの隣接ブロックの中から、前記符号化対象ブロックと前記隣接ブロックとの隣接条件に基づいて判定されるいずれか一つの隣接ブロックを、動き情報を参照するための参照先ブロックとして指定する参照先指定ステップと、
画像内予測、符号化対象ブロックの動きベクトルを利用した画像間予測、および隣接ブロックの動きベクトルを利用した画像間予測の中から、予測方法として、隣接ブロックの動きベクトルを利用した画像間予測が選択された場合、選択された予測方法により参照される隣接ブロックと前記参照先指定ステップにより指定された前記参照先ブロックとが一致するか否かを表す参照先有効情報と選択された予測方法を示す情報とを動き情報に代わって生成する予測選択ステップとを含み、
前記参照先指定ステップは、前記隣接条件として、前記隣接ブロックの隣接する辺の長さが前記符号化対象ブロックの高さまたは幅と同じであるか否かを判定することにより、隣接する辺の長さが前記符号化対象ブロックの高さまたは幅と同じである隣接ブロックを選択し、選択された隣接ブロックを参照先ブロックとして指定することを特徴とする動画像符号化方法。
動画像の各ピクチャを分割したブロック単位で動きベクトルを用いて前記動画像を符号化する動画像符号化方法であって、
符号化対象ブロックに隣接する複数の符号化済みの隣接ブロックの中から、前記符号化対象ブロックと前記隣接ブロックとの隣接条件に基づいて判定されるいずれか一つの隣接ブロックを、動き情報を参照するための参照先ブロックとして指定する参照先指定ステップと、
画像内予測、符号化対象ブロックの動きベクトルを利用した画像間予測、および隣接ブロックの動きベクトルを利用した画像間予測の中から、予測方法として、隣接ブロックの動きベクトルを利用した画像間予測が選択された場合、選択された予測方法により参照される隣接ブロックと前記参照先指定ステップにより指定された前記参照先ブロックとが一致するか否かを表す参照先有効情報と選択された予測方法を示す情報とを動き情報に代わって生成する予測選択ステップとを含み、
前記参照先指定ステップは、前記隣接条件として、前記符号化対象ブロックと前記隣接ブロックの互いに隣接する辺の共通部分の長さの大小関係を判定することにより、隣接する辺の共通部分の長さが大きい方の隣接ブロックを選択し、選択された隣接ブロックを参照先ブロックとして指定することを特徴とする動画像符号化方法。
動画像の各ピクチャを分割したブロック単位で動きベクトルを用いて前記動画像を符号化する動画像符号化プログラムであって、
符号化対象ブロックに隣接する複数の符号化済みの隣接ブロックの中から、前記符号化対象ブロックと前記隣接ブロックとの隣接条件に基づいて判定されるいずれか一つの隣接ブロックを、動き情報を参照するための参照先ブロックとして指定する参照先指定ステップと、
画像内予測、符号化対象ブロックの動きベクトルを利用した画像間予測、および隣接ブロックの動きベクトルを利用した画像間予測の中から、予測方法として、隣接ブロックの動きベクトルを利用した画像間予測が選択された場合、選択された予測方法により参照される隣接ブロックと前記参照先指定ステップにより指定された前記参照先ブロックとが一致するか否かを表す参照先有効情報と選択された予測方法を示す情報とを動き情報に代わって生成する予測選択ステップとをコンピュータに実行させ、
前記参照先指定ステップは、前記隣接条件として、前記隣接ブロックの隣接する辺の長さが前記符号化対象ブロックの高さまたは幅と同じであるか否かを判定することにより、隣接する辺の長さが前記符号化対象ブロックの高さまたは幅と同じである隣接ブロックを選択し、選択された隣接ブロックを参照先ブロックとして指定することを特徴とする動画像符号化プログラム。
動画像の各ピクチャを分割したブロック単位で動きベクトルを用いて前記動画像を符号化する動画像符号化プログラムであって、
符号化対象ブロックに隣接する複数の符号化済みの隣接ブロックの中から、前記符号化対象ブロックと前記隣接ブロックとの隣接条件に基づいて判定されるいずれか一つの隣接ブロックを、動き情報を参照するための参照先ブロックとして指定する参照先指定ステップと、
画像内予測、符号化対象ブロックの動きベクトルを利用した画像間予測、および隣接ブロックの動きベクトルを利用した画像間予測の中から、予測方法として、隣接ブロックの動きベクトルを利用した画像間予測が選択された場合、選択された予測方法により参照される隣接ブロックと前記参照先指定ステップにより指定された前記参照先ブロックとが一致するか否かを表す参照先有効情報と選択された予測方法を示す情報とを動き情報に代わって生成する予測選択ステップとをコンピュータに実行させ、
前記参照先指定ステップは、前記隣接条件として、前記符号化対象ブロックと前記隣接ブロックの互いに隣接する辺の共通部分の長さの大小関係を判定することにより、隣接する辺の共通部分の長さが大きい方の隣接ブロックを選択し、選択された隣接ブロックを参照先ブロックとして指定することを特徴とする動画像符号化プログラム。