JP2012209706A - 画像復号装置、画像復号方法及び画像復号プログラム - Google Patents

画像復号装置、画像復号方法及び画像復号プログラム Download PDF

Info

Publication number
JP2012209706A
JP2012209706A JP2011072988A JP2011072988A JP2012209706A JP 2012209706 A JP2012209706 A JP 2012209706A JP 2011072988 A JP2011072988 A JP 2011072988A JP 2011072988 A JP2011072988 A JP 2011072988A JP 2012209706 A JP2012209706 A JP 2012209706A
Authority
JP
Japan
Prior art keywords
motion vector
vector information
decoding
unit
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2011072988A
Other languages
English (en)
Inventor
Satoshi Sakazume
智 坂爪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
JVCKenwood Corp
Original Assignee
JVCKenwood Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by JVCKenwood Corp filed Critical JVCKenwood Corp
Priority to JP2011072988A priority Critical patent/JP2012209706A/ja
Publication of JP2012209706A publication Critical patent/JP2012209706A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

【課題】動き推定処理によって特定された動きベクトル情報を表現するために必要な情報量を低減する。
【解決手段】復号部1404は、取得した符号化ビット列に対して、所定の構文構造に基づいて復号する。復号側動き推定部1405は、復号対象領域に隣接する復号済みの領域と、復号済みの領域との間で、復号対象領域と参照領域との間の位置関係を示す動きベクトル情報を特定する。動き補償部1407は動き補償を行う。動きベクトル情報構成部1406は、予測動きベクトル情報と予測動きベクトル情報に基づいて特定される探索の開始位置情報とを、復号側動き推定部1405に供給し、動きベクトル情報を再探索する場合には、新たな予測動きベクトル情報と新たな探索の開始位置情報を特定し、復号側動き推定部1405に供給するとともに、復号結果から最終的に使用する動きベクトル情報を特定し、動き補償部1407に供給する。
【選択図】図14

Description

本発明は、動画像の復号技術に関し、特に動画像の画面間もしくは画面内で動きベクトル情報を検出して符号化された符号化ビット列を復号する技術に関する。
一般に、MPEG−4 AVC/H.264に代表される動画像符号化を行う際には、動画像の画面間に存在する相関性を利用するために、双予測等の動き推定処理により、動きベクトル情報を検出し、この情報に基づいて予測ピクチャを生成する。これにより、予測ピクチャと符号化対象ピクチャとの残差情報を低減した上で符号化を行っている。
一般的な動き推定処理である符号化側動き推定処理では、符号化対象ピクチャを所定の矩形領域(例えば、マクロブロック)で隙間なく分割する。そして、各矩形領域について、参照ピクチャ内の、対応する各矩形領域を平行移動させながら、ブロックマッチング法等を利用して、参照ピクチャ内で最も類似する領域を特定する。そして、それら領域間の距離を動きベクトル情報として検出する。
また、このように検出された動きベクトル情報を符号化する際に、現在符号化対象となっている領域に隣接している領域の動きベクトル情報から予測して予測動きベクトル情報(pmv: predictive motion vector)を生成し、符号化すべき特定された動きベクトル情報から予測動きベクトル情報を減算して得られる差分動きベクトル情報(mvd: motion vector difference)を符号化する(例えば、特許文献1)。
WO03/063503号公報
しかしながら、上記手法では一般に、予測動きベクトル情報は、現在符号化対象となっている矩形領域に隣接する各矩形領域で用いられた各動きベクトル情報のうち、各ベクトル成分の中央値となる成分がそれぞれ選択されることによって得られたものである。したがって、予測動きベクトル情報は、特定された動きベクトル情報との間において必ずしも十分な相関性を示していない場合には、差分動きベクトル情報を表現するために必要な情報量がかえって増大してしまう。また、予測動きベクトル情報と特定された動きベクトル情報との間に一定の相関性を示すことがあっても、より細かい位置精度において良い近似とは限らず、十分に差分動きベクトル情報の情報量が抑制されているとは言い難かった。
本発明はこうした状況に鑑みなされたものであり、その目的は、動き推定処理によって特定された動きベクトル情報を表現するために必要な情報量を低減する技術を提供することにある。
上記課題を解決するために、本発明のある態様の画像復号装置は、画像の符号化ビット列を取得し、復号処理を行って復号信号を生成する画像復号装置であって、取得した符号化ビット列に対して、所定の構文構造に基づいて復号する復号部(1404)と、復号対象となっている領域に隣接、もしくは所定の位置関係にある復号済みの領域に含まれる信号と、復号済みの領域に含まれる信号との間で、探索の開始位置情報に基づいて、所定の動き推定処理により、復号対象となっている領域と、参照される領域との間の位置関係を示す動きベクトル情報を特定する復号側動き推定部(1405)と、動き補償を行う動き補償部(1407)と、予測動きベクトル情報と予測動きベクトル情報に基づいて特定される探索の開始位置情報とを、前記復号側動き推定部に供給し、動きベクトル情報を再探索する場合には、新たな予測動きベクトル情報と新たな探索の開始位置情報を特定し、前記復号側動き推定部に供給するとともに、復号結果から最終的に使用する動きベクトル情報を特定し、前記動き補償部に供給する動きベクトル情報構成部(1406)と、前記復号側動き推定部、前記動き補償部、および前記動きベクトル情報構成部を制御する復号制御部(1412)と、前記復号部は、複合残差動きベクトル情報、および最終的に使用する動きベクトル情報を求めるための少なくとも1つの動作モードを特定するための動作モード情報を復号し、前記動きベクトル情報構成部は、予測動きベクトル情報で表現できる部分、および前記復号側動き推定部によって特定される動きベクトル情報で表現できる部分が、最終的に使用する動きベクトル情報から取り除かれた複合残差動きベクトル情報を取得し、予測動きベクトル情報および前記復号側動き推定部によって特定される動きベクトル情報に基づいてその取り除かれた部分を補うことにより最終的に使用する動きベクトル情報を特定し、前記動き補償部に供給するように、復号された動作モード情報に基づいて、前記復号制御部によって制御される。
本発明の別の態様は、画像復号方法である。この方法は、画像の符号化ビット列を取得し、復号処理を行って復号信号を生成する画像復号方法であって、取得した符号化ビット列に対して、所定の構文構造に基づいて復号する復号ステップと、復号対象となっている領域に隣接、もしくは所定の位置関係にある復号済みの領域に含まれる信号と、復号済みの領域に含まれる信号との間で、探索の開始位置情報に基づいて、所定の動き推定処理により、復号対象となっている領域と、参照される領域との間の位置関係を示す動きベクトル情報を特定する復号側動き推定ステップと、動き補償を行う動き補償ステップと、予測動きベクトル情報と予測動きベクトル情報に基づいて特定される探索の開始位置情報とを、前記復号側動き推定部に供給し、動きベクトル情報を再探索する場合には、新たな予測動きベクトル情報と新たな探索の開始位置情報を特定し、前記復号側動き推定部に供給するとともに、復号結果から最終的に使用する動きベクトル情報を特定し、前記動き補償部に供給する動きベクトル情報構成ステップと、を備える。前記復号ステップは、複合残差動きベクトル情報、および最終的に使用する動きベクトル情報を求めるための少なくとも1つの動作モードを特定するための動作モード情報を復号し、前記動きベクトル情報構成ステップは、予測動きベクトル情報で表現できる部分、および前記復号側動き推定ステップによって特定される動きベクトル情報で表現できる部分が、最終的に使用する動きベクトル情報から取り除かれた複合残差動きベクトル情報を取得し、予測動きベクトル情報および前記復号側動き推定ステップによって特定される動きベクトル情報に基づいてその取り除かれた部分を補うことにより最終的に使用する動きベクトル情報を特定し、前記動き補償ステップに供給するように、復号された動作モード情報に基づいて制御される。
なお、以上の構成要素の任意の組合せ、本発明の表現を方法、装置、システム、記録媒体、コンピュータプログラムなどの間で変換したものもまた、本発明の態様として有効である。
本発明によれば、予測動きベクトル情報の精度を向上させるとともに、必要とする動きベクトル情報を再構成するために必要な情報量を低減できる。
実施の形態1に係る画像符号化装置の各構成要素間の基本的な接続関係を示す図である。 実施の形態1に係る画像符号化装置の各構成要素と符号化制御部との接続関係を示す図である。 処理対象の処理順序の一例を示す図である。 参照ピクチャにおける動きベクトル情報の探索の様子を示す図である。 PMVを利用した符号化側動き推定処理の一例を示す図である。 テンプレートを利用した復号側動き推定処理の一例を示す図である。 動き補償処理の一例を示す図である。 動き補償処理における別の一例を示す図である。 実施の形態1に係る画像符号化装置の基本動作を示すフローチャートである。 実施の形態1に係る画像符号化装置における、動き推定処理の詳細を示すフローチャートである。 符号化側動き推定処理の基本動作の一例を示すフローチャートである。 復号側動き推定処理の基本動作の一例を示すフローチャートである。 符号化ビット列の構成を示す概念図である。 実施の形態2に係る画像復号装置の各構成要素間の基本的な接続関係を示す図である。 実施の形態2に係る画像復号装置の各構成要素と復号制御部との接続関係を示す図である。 実施の形態2に係る画像復号装置の基本動作を示すフローチャートである。 実施の形態2に係る画像復号装置における、動き推定処理の詳細を示すフローチャートである。 実施の形態1の画像符号化装置および実施の形態2の画像復号装置の動作を、プログラムに基づいて実行する情報処理装置の基本的な接続関係を示す図である。
本発明の実施の形態に係る画像符号化装置及び画像復号装置について図面を参照して説明する。
実施の形態では、符号化対象となっている矩形領域(以下「対象領域」という)の画像信号を利用して、参照ピクチャ内を探索し、動きベクトル情報を生成する動き推定(以下「符号化側動き推定」または「符号化側ME」という)処理と、対象領域の周辺で局部復号済みの領域(以下「局部復号領域」という)から探索のためのテンプレート領域を設定し、このテンプレート領域の画像信号を利用して、参照ピクチャ内を探索し、動きベクトル情報を生成する動き推定(以下「復号側動き推定」または「復号側ME」という)処理とを組み合わせた動き推定処理(以下「複合動き推定処理」または「ハイブリッド動き推定処理」という)を行い、その後、復号動き推定処理により特定された動きベクトル情報に基づいて所定の動き補償処理を行うことで、予測ピクチャを生成する。
また、動きベクトル情報をより少ない情報量で表現するために、予測動きベクトル情報および復号側動き推定処理で特定された動きベクトル情報を利用して、本実施の形態の複合動きベクトル推定処理を行い、複合残差動きベクトル情報(h−mvd:hybrid motion vector difference)を生成する。本実施の形態は、符号化側MEにより最適な参照領域を特定し、この参照領域に最も近く、対象領域と参照領域との間の残差情報の情報量および動きベクトルMVの情報量が最も抑制されるように復号側MEを利用し、最終的な複合残差動きベクトル情報h−mvdが生成されるように構成したものである。
(実施の形態1)
まず、実施の形態1に係る画像符号化装置について説明する。当該画像符号化装置は、本実施の形態の動き推定処理を伴うことにより、より少ない情報量の残差動きベクトル情報により、動き補償処理において予測ピクチャを生成する際に利用する動きベクトル情報を表現することができる。
図1は、実施の形態1に係る画像符号化装置100の各構成要素101〜115間の基本的な接続関係を示す図である。図2は、実施の形態1に係る画像符号化装置100の各構成要素101〜115と符号化制御部116との接続関係を示す図である。なお、図1では図面の簡略化のため符号化制御部116を省略して描いている。
実施の形態1に係る画像符号化装置100は、入力部101、蓄積部102、符号化側動き推定部103、復号側動き推定部104、動きベクトル情報構成部105、動き補償部106、減算部107、直交変換部108、量子化部109、エントロピー符号化部110、逆量子化部111、逆直交変換部112、加算部113、多重化部114、出力部115および符号化制御部116を有する。以下、各部の詳細を説明する。
入力部101は、例えば、図1に示す撮像装置131、伝送装置132、記録装置133、記録媒体134、蓄積装置135等から、所定の空間解像度を持つ入力画像列を取得し、符号化対象ピクチャとして符号化側動き推定部103、復号側動き推定部104、および減算部107に供給する。
蓄積部102は、参照ピクチャを蓄積し、必要に応じて各構成要素に参照ピクチャを供給する。蓄積部102は、加算部113で生成される復号信号を取得し、参照ピクチャとして蓄積する。また、蓄積部102は、符号化側動き推定部103、復号側動き推定部104および動き補償部106に対して、要求された参照ピクチャを供給する。蓄積部102は、加算部113から復号信号を取得する際に、順次、符号化後に局部復号として得られる復号済みの領域の画像信号を取得し、局部復号領域の画像信号(以下「局部復号ピクチャ」という)として蓄積する。また、蓄積部102は、符号化対象ピクチャ全域の局部復号結果が得られると、局部復号ピクチャの画像信号を参照ピクチャとして保持するようにするのが好ましい。また、蓄積部102は、復号側動き推定部104に対して、要求された局部復号ピクチャを供給する。
さらに、蓄積部102は、動きベクトル情報構成部105から、最終的に特定された動きベクトル情報(以下「最終MV」という)を取得し、現在処理対象となっている領域の最終MVとして管理し、蓄積する。また、蓄積部102は、蓄積されている各領域の最終MVの中から、必要に応じて要求された領域の最終MVを、符号化制御部116に供給する。
符号化側動き推定部103は、入力部101から符号化対象ピクチャを取得し、蓄積部102から取得可能であれば、参照ピクチャ、および必要に応じて局部復号ピクチャを取得する。また、符号化側動き推定部103は、符号化制御部116もしくは動きベクトル情報構成部105から、取得可能であれば、面内のどの位置から探索を開始するかを特定するための開始位置情報(または初期MV)、探索幅情報、および探索精度情報を取得する。符号化側動き推定部103は、取得した符号化対象ピクチャおよび探索対象となっているピクチャ(以下「探索対象ピクチャ」という)を利用して、所定の動き推定処理を行うことにより、動きベクトル情報(以下「符号化側MV」という)を生成する。
ここで、探索対象ピクチャは、取得した参照ピクチャであるものとしているが、必要に応じて、局部復号ピクチャであってもよい。符号化側動き推定部103は、探索幅情報に基づいて探索範囲を特定し、取得した探索精度情報から特定される探索精度に基づいて所定の動き推定処理を行う。また、符号化側動き推定部103は、必要に応じて初期MVを利用して、所定の動き推定処理を行い、符号化側MVを生成する。
符号化側動き推定部103は、生成した符号化側MVと、利用した予測動きベクトル情報(pmv)から、残差動きベクトル情報(以下「符号化側残差MV」または「符号化側mvd」)を生成する。ここで、予測動きベクトル情報は、符号化制御部116もしくは動きベクトル情報構成部105から取得した初期MVであってもよい。
また、符号化側動き推定部103は、符号化側MVを表現するためにかかるコスト情報(以下「符号化側MVコスト」という)、および、符号化対象領域の信号と符号化側MVで特定された参照領域の信号との残差信号を表現するためにかかるコスト情報(以下「符号化側残差コスト」という)を生成する。符号化側動き推定部103は、生成された符号化側MV、符号化側残差MV、符号化側MVコスト、符号化側残差コスト、およびこれらを生成した際に用いた初期MV、探索幅情報、探索精度情報を、動きベクトル情報構成部105に供給する。
ここで、符号化側動き推定部103における所定の動き推定処理では、対象領域の画像信号と、探索時の誤差測定対象となっている領域(以下「測定対象領域」という)の画像信号との間の誤差値を測定しながら探索を行い、所定の条件に基づいて参照領域を特定するとともに、その空間位置を特定する。ここで、探索時に算出する誤差値は、一般的なSAD(Sum of Absolute Diference)やSATD(Sum of Absolute Transformed Difference)、画素単位での誤差の2乗和、誤差の2乗の平方根の和、誤差の2乗の和の平方根等により算出された値を用いて測定されてもよい。
符号化側動き推定部103は、開始位置から特定された空間位置までの符号化側MVを求める。また、符号化側動き推定部103は、対象領域の画像信号と、特定された参照ピクチャ内の空間位置の領域である、参照領域の画像信号との間の誤差値(以下「符号化側最終誤差値」という)を、コスト情報である符号化側残差コストとして、符号化側MVとともに、動きベクトル情報構成部105に供給してもよい。
図3は、符号化対象ピクチャ内における対象領域を特定する処理を説明するための図である。図3に示す例では、符号化対象ピクチャ301を所定の矩形形状で隙間なく分割し、矢印303のように、左上の矩形領域から右方向へ、その列が終了するとその下の列へとラスタスキャンの順序で、処理対象となる対象領域302を、符号化処理が進むにつれて、ずらしながら変更していく。符号化側動き推定部103では、例えば、図3の302のような対象領域の画像信号を、所定の動き推定処理に利用する。ここでは、このようなラスタスキャン順序に従って処理を進めるが、他の順序に従って処理を進めるようにしてもよい。
図4(a)〜(d)は、参照ピクチャ内における参照領域を特定する処理を説明するための図である。図4(a)、図4(b)に示されるように、参照ピクチャ内における探索開始位置の領域(以下「探索開始領域」という)を特定する際に、開始位置情報から得られる空間位置情報を基点として利用することができる。例えば、開始位置情報として、図3の対象領域302の面内位置に関する情報が供給されている場合には、図4(a)の符号402のように探索開始領域を設定し、この領域を基点として探索を開始することができる。また、例えば、開始位置情報として、対象領域の面内位置とは異なる位置を指定する情報が供給されている場合には、図4(b)の符号402のように指定された位置を基点として探索開始領域を設定することができる。
また、所定の動き推定処理による探索を行う際に、例えば、図4(c)、図4(d)のように、探索開始領域の位置を基準にして、測定対象領域を動かしながら探索を行うことができる。また、例えば、図4(a)の符号403のように探索領域(または探索範囲)を指定し、その範囲内で探索を行うことで、探索時の処理量を軽減するようにしてもよい。図4(c)は、渦巻き型の探索を用いる例を示している。参照ピクチャ401の探索領域403内で、渦巻き状に、探索開始領域402の空間位置を基点として、測定対象領域を変更していく。図4(d)は、ラスタスキャン型の探索を用いる例を示している。この例では、図3に示した処理と同様に、参照ピクチャ401の探索領域403内で探索する。
また、図5(a)、図5(b)に示されるように、符号化側動き推定処理における探索開始領域は、符号化制御部116によって、対象領域に隣接する符号化済みの領域に属する動きベクトル情報を利用して特定された予測動きベクトル情報515を利用してもよい。図5(b)の予測動きベクトル情報515は、図5(a)の領域A504の最終MV511、領域B505の最終MV512、および領域C506の最終MV513を利用して、各最終MVの各要素の中央値を採用することで、予測動きベクトル情報515を求めた例である。
具体的には、最終MV511=(3.75,−8.00)、最終MV512=(12.00,−7.50)、最終MV513=(2.25,12.75)であるとすると、予測動きベクトル情報515=mid(最終MV511,最終MV512,最終MV513)=(3.75,−7.50)となる。ここで、mid()は各成分について中間値を取る関数である。ここでは、符号化制御部116において、このような処理によって予測動きベクトル情報を生成し、供給しているが、他の予測方法に基づいて予測動きベクトル情報を求めるような構成であっても構わない。
ここで、符号化側動き推定処理によって特定された符号化側MVが図5(b)のMV514であったとすると、ここでの残差動きベクトル情報は、MV516=MV514−MV515となる。具体的には、MV514=(15.25,4.75)であるとすると、MV516=MV514−MV515=(15.25−3.75,4.75−(−7.50))=(11.50,12.25)となる。このような残差動きベクトル情報を求め、この残差動きベクトル情報を表現するためにかかるコスト情報を、符号化側MVコストとすることが望ましい。
復号側動き推定部104は、蓄積部102から局部復号ピクチャおよび参照ピクチャを取得する。また、入力部101等から、符号化対象ピクチャが取得可能であれば、取得するようにしてもよい。また、復号側動き推定部104は、符号化制御部116もしくは動きベクトル情報構成部105から、取得可能であれば、面内のどの位置から探索を開始するかを特定するための開始位置情報(または初期MV)、探索幅情報、および探索精度情報を取得する。
復号側動き推定部104は、取得した局部復号ピクチャおよび参照ピクチャを利用して、所定の動き推定処理を行うことにより、動きベクトル情報(以下「復号側MV」という)を生成する。ここで、復号側動き推定部104は、探索幅情報に基づいて探索範囲を特定し、取得した探索精度情報から特定される探索精度に基づいて所定の動き推定処理を行う。また、復号側動き推定部104は、必要に応じて初期MVを利用して、所定の動き推定処理を行い、復号側MVを生成する。
また、復号側動き推定部104は、復号側MVを表現するためにかかるコスト情報(以後、復号側MVコスト)、および符号化対象領域の信号と、復号側MVで特定された参照領域の信号との残差信号を表現するためにかかるコスト情報(以下「復号側残差コスト」という)を生成する。復号側動き推定部104は、生成された復号側MV、復号側MVコスト、復号側残差コスト、およびこれらを生成した際に用いた初期MV、探索幅情報、探索精度情報を、動きベクトル情報構成部105に供給する。
ここで、符号化対象ピクチャが取得できない場合には、処理対象となる局部復号ピクチャにおけるテンプレート領域の信号と、復号側MVから特定される参照領域に隣接するテンプレート領域の信号との残差信号を表現するためにかかるコスト情報(以下「復号側テンプレート残差コスト」という)を符号化側残差コストとして生成するようにしてもよい。また、必要であれば、復号側テンプレート残差コストを生成する際に、同等のコスト比較を行うために、所定の変換係数(以下「コスト変換係数」という)を乗じて符号化側残差コストとして生成してもよい。
ここで、復号側動き推定部104における所定の動き推定処理では、局部復号済みの領域であって、対象領域に隣接もしくは所定の離れた距離に、所定の形状をもつ対象テンプレート領域を定め、局部復号ピクチャから同一空間位置に対応する対象テンプレート領域に属する復号信号を特定することで、探索対象とする。この対象テンプレート領域に属する画像信号と、測定対象領域の画像信号との間の誤差値を測定しながら探索を行い、所定の条件に基づいて参照領域を特定するとともに、その空間位置を特定する。
ここで、測定対象領域は、参照ピクチャ内であるものとして話を進めるが、局部復号ピクチャ内に領域を定め、所定の動き推定処理を行うようにすることもできる。また、測定対象領域の形状は、対象テンプレート領域の形状と同一であるものとする。また、探索時に算出する誤差値は、一般的なSADやSATD、画素単位での誤差の2乗和、誤差の2乗の平方根の和、誤差の2乗の和の平方根等により算出された値を用いて測定されてもよい。
復号側動き推定部104は、開始位置から特定された空間位置までの復号側MVを求める。また、復号側動き推定部104は、符号化対象ピクチャが取得可能な場合は、対象領域の画像信号と、特定された参照領域の画像信号との間の誤差値を、コスト情報である復号側残差コストとして、復号側MVとともに、動きベクトル情報構成部105に供給してもよい。また、符号化対象ピクチャが取得できない場合には、対象テンプレート領域に属する画像信号と、特定された測定対象領域(ここでは、復号側MVによって特定される参照ピクチャ内のテンプレート領域)の画像信号との間の誤差値を、コスト情報である復号側テンプレート残差コストとし、これを符号化側残差コストとして生成するようにしてもよい。また、必要であれば、復号側テンプレート残差コストを生成する際に、同等のコスト比較を行うために、コスト変換係数を乗じて符号化側残差コストとして生成してもよい。
図6(a)〜(d)は、テンプレート領域を伴った復号側MEの様子を示した図である。図6(a)は、比較のため、予測動きベクトルpmv515、探索範囲502を用いて符号化側MEを行って得られる、符号化側MV514および残差動きベクトルmvd516、探索範囲601を用いて復号側MEを行って得られる、復号側MV517および復号側MEで特定された参照領域604の空間位置から符号化側MEで特定された空間位置までのMVである復号側残差MV518を示している。
図6(b)は、各領域とMVの位置関係をより分かりやすく示した拡大図である。仮に、参照領域507の信号が最も対象領域の信号に近く、この領域までの距離を表現しようとした場合を考える。予測動きベクトルpmv515を利用した符号化側MEを行う場合では、残差動きベクトルmvd516を表現するための情報量を必要とし、初期MVを利用せずに復号側MEを行う場合には、復号残差MV518を表現するための情報量を必要とする。
図6(a)、図6(b)における例では、予測動きベクトルpmv515の精度があまりよいとは言えず、残差動きベクトルmvd516の情報量が増大しているため、予測動きベクトルpmv515を利用せず、符号化側MV514をそのまま残差動きベクトルmvdとして利用することで情報量が抑えられると考えられる。また、対象領域の信号とテンプレート領域の信号との相関が高い場合には、復号側MEによって特定される参照領域は、より良い近似となり、信号間の誤差の程度によっては、復号側残差MV518を符号化しないようにすることも考えられる。つまり、ここでは、復号側MEによる伝送すべきMVの情報量の削減分が、信号間の誤差の増大による情報量の増大分よりも大きい場合には、復号側MEを採用した方が良い場合であると考えられる。
図6(c)、図6(d)では、初期MVを利用して復号側MEを行った場合の例を示している。このように適切な初期MVを少ない情報量で与えることができると、図6(c)の探索範囲605のように範囲を狭めても所望とする領域を検出することが可能となるため、探索時の演算量を抑制することが可能となる。また、探索範囲が限定されることにより、領域の誤検出を軽減することにもつながると考えられる。ただし、初期MVによって、所望の参照領域を含む探索範囲の内部に探索の初期位置を設定できない場合には、探索範囲内での準最適な参照領域が探索によって特定されることから、初期MVの情報量と、信号間の誤差の増大による情報量の総コストが、他のMEによる総コストよりも大きくなる場合には、他のMEを採用した方が良い場合であると考えられる。つまり、初期MVの精度と、探索範囲の大きさを適切に管理し、必要であれば復号側に伝送することで、復号側MEを利用して情報量を抑制することが可能となる。本実施の形態では、符号化側MEで得られた符号化側MVを利用して、最適な初期MVと探索範囲を特定し、情報量を抑制することを特徴とする。
動きベクトル情報構成部105は、符号化側動き推定部103から、符号化側MV、符号化側残差MV、符号化側MVコスト、符号化側残差コスト、およびこれらを生成した際に用いた初期MV、探索幅情報、探索精度情報を取得する。また、動きベクトル情報構成部105は、復号側動き推定部104から、復号側MV、復号側MVコスト、復号側残差コスト、およびこれらを生成した際に用いた初期MV、探索幅情報、探索精度情報を取得する。
動きベクトル情報構成部105は、取得した各種の動き情報および各種のコスト情報に基づいて、符号化側MVを採用した場合の総コストおよび情報量よりも小さくなるようなMVを、最終MVとして特定するとともに、特定された最終MVを、蓄積部102および動き補償部106に供給する。
また、動きベクトル情報構成部105は、特定された最終MV、復号側MV、復号側MVを生成する際に用いた初期MV(以下「復号側初期MV」という)、および復号側拡張MVに基づいて、所定の動きベクトル情報構成処理を行うことにより、複合残差動きベクトル情報(h−mvd)を生成し、エントロピー符号化部110に供給する。
ここで、復号側拡張MVは、復号側拡張MV=最終MV−(復号側初期MV+復号側MV)+α、かつ、最終MVに基づく総コスト>=復号側初期MVおよび復号側拡張MVに基づく総コストという条件を満たすようなものであればよい。ここで、αは復号側拡張MVの変動ベクトル値であり、最終MVに基づく総コスト以下の総コストとなるようなαであればよい。ここでは一般にα=(0,0)として話を進めるが、この変動ベクトル値αを考慮する場合には、復号側初期MV+復号側MVを新たな符号化側初期MV、復号側初期MVとし、再度、符号化側MEおよび復号側MEを行った後に、総コストの評価を行うことを、必要に応じて複数回行い、より最適な復号側拡張MVを求めるようにしても構わない。
また、複合残差動きベクトルh−mvdは、復号側初期MVおよび復号側拡張MVに基づいて、所定の動きベクトル情報構成処理を行うことで、生成される。ここでは、1つの動きベクトル情報が表現できるビット列に収まるような構成処理を行うことで、動きベクトル情報をまとめて表現することができるとともに、従来方式で動きベクトル情報を伝送するためのシンタックス構造(表現形式)に合わせることができるようになる。
動きベクトル情報構成部105は、最探索処理に必要となる新たな、初期MV、探索幅情報、および探索精度情報を、必要に応じて、符号化側動き推定部103、および復号側動き推定部104に供給する。また、動きベクトル情報構成部105は、最終MVが、符号化側MEおよび復号側MEの処理をどのような組み合わせで実行されて得られた結果かを示すためのMEモード情報を、エントロピー符号化部110に供給する。また、動きベクトル情報構成部105は、これらのME処理の組み合わせで用いた探索幅情報、および探索精度情報を、エントロピー符号化部110に供給する。
動き補償部106は動きベクトル情報構成部105から、生成された最終MVを取得する。また、動き補償部106は、蓄積部102から参照ピクチャを取得する。また、動き補償部106は、取得した最終MV、および参照ピクチャを利用して、所定の動き補償処理を行うことにより、予測ピクチャを生成し、減算部107および加算部113に供給する。
ここで、本実施の形態に係る動き補償部106における所定の動き補償処理では、例えば図7および図8のような処理を行うことで、予測ピクチャを生成していく。図7は、最終MVが、復号側初期MV=(0,0)、復号側MV611、復号側拡張MV518のベクトル和である場合の様子を示している。したがって、最終MVを取得することで、参照領域507を特定することができ、この領域に含まれる信号を予測ピクチャにおける対象領域と同一の空間位置の領域702に格納する。このような処理を予測ピクチャ全体に対して処理対象ごとに行うことで、予測ピクチャを生成することができる。
図8においても同様であるが、図8は更に、復号側拡張MV=(0,0)の場合の様子を示している。これは、図7とは違い、復号側拡張MV518を画像復号装置には送らない符号化パターンである。ハイブリッド動き推定処理では、このような符号化パターンもありうる。
減算部107は、入力部101から符号化対象ピクチャを取得し、動き補償部106から予測ピクチャを取得する。減算部107は、取得した符号化対象ピクチャから予測ピクチャを減算して残差情報を生成し、直交変換部108に供給する。
直交変換部108は、減算部107から残差情報を取得し、取得した残差情報に対して所定の直交変換処理を行うことにより、直交変換係数情報を生成し、量子化部109に供給する。ここで、所定の直交変換処理で用いる直交変換基底は、DCT、DST、KLT、ウェーヴレット変換、アダマール変換等、一般に画像符号化や動画像符号化で利用することができるものであればよく、特に限定されない。
量子化部109は、直交変換部108から直交変換係数情報を取得し、取得した直交変換係数情報に対して所定の量子化処理を行うことにより、量子化後情報を生成し、エントロピー符号化部110および逆量子化部111に供給する。ここで、所定の量子化処理は、一般に画像符号化や動画像符号化で利用することができるものであればよく、特に限定されない。
エントロピー符号化部110は、少なくとも、動きベクトル情報構成部105から複合残差動きベクトル情報(h−mvd)を取得し、量子化部109から量子化後情報を取得する。エントロピー符号化部110は、少なくとも、取得したh−mvdおよび量子化後情報に対して、所定のエントロピー符号化処理を行い、h−mvdおよび量子化後情報の符号化ビット列を生成し、多重化部114に供給する。また、エントロピー符号化部110は、動きベクトル情報構成部105から、MEモード情報、およびこのMEモードのME処理の組み合わせで用いた探索幅情報、および探索精度情報を取得し、所定のエントロピー符号化処理を行い、MEモード情報の符号化ビット列、探索幅情報の符号化ビット列、探索精度情報の符号化ビット列を生成し、多重化部114に供給する。ここで、所定のエントロピー符号化処理は、ハフマン符号化、算術符号化等の、一般に画像符号化や動画像符号化で利用することができるものであればよく、特に限定されない。
逆量子化部111は、量子化部109から量子化後情報を取得し、取得した量子化後情報に対して、量子化部109による所定の量子化処理と対をなす、所定の逆量子化処理を行うことにより、逆量子化後の直交変換係数情報を生成し、逆直交変換部112に供給する。
逆直交変換部112は、逆量子化部111から逆量子化後の直交変換係数情報を取得し、取得した逆量子化後の直交変換係数情報に対して、直交変換部108による所定の直交変換処理と対をなす、所定の逆直交変換処理を行うことにより、復号残差情報を生成し、加算部113に供給する。
加算部113は、動き補償部106から予測ピクチャを取得し、逆直交変換部112から復号残差情報を取得する。加算部113は、取得した予測ピクチャに復号残差情報を加算することにより、局部復号ピクチャを生成し、蓄積部102に供給する。
多重化部114は、エントロピー符号化部110から各種符号化ビット列を取得し、所定の構文構造に基づいて多重化して、多重化後の符号化ビット列を生成し、出力部115に供給する。
出力部115は、多重化部114から多重化後の符号化ビット列を取得し、出力部115に接続されている外部の機器に対して、多重化後の符号化ビット列を供給する。例えば、図1に示す伝送装置141が画像符号化装置100に接続されていれば、当該多重化後の符号化ビット列を、ネットワークを介して、外部の受信装置に伝送するように構成することができる。また、図1に示す記録装置142、記録媒体143、蓄積装置144等が画像符号化装置100に接続されていれば、当該多重化後の符号化ビット列を、記録、保存、持ち出しができるように構成することができる。
図2において、符号化制御部116は、各部の動作状態を監視し、各部の符号化動作や入出力を制御する。
図9は、実施の形態1に係る画像符号化装置100の基本動作を示すフローチャートである。まず、符号化制御部116は、ユーザ等から符号化開始要求を受けると、各部に対して符号化開始指令を送る。それに応じて、入力部101は、所定の空間解像度をもつ入力画像列を取得し、符号化対象ピクチャとして符号化側動き推定部103および減算部107に供給する。また、入力部101は、同様の符号化対象ピクチャを、復号側動き推定部104に供給する。
その後、符号化制御部116は、符号化側動き推定部103および復号側動き推定部104に対して符号化開始指令を送り、符号化側動き推定部103および復号側動き推定部104は、入力部101から符号化対象ピクチャを取得する(ステップS101)。また、符号化側動き推定部103および復号側動き推定部104は、蓄積部102から参照ピクチャを取得する(ステップS102)。さらに、復号側動き推定部104は、蓄積部102から、局部復号ピクチャを取得する。
その後、符号化制御部116は、対象領域を特定するための情報を符号化側動き推定部103および復号側動き推定部104に供給し、符号化側動き推定部103および復号側動き推定部104は、この対象領域を特定するための情報に基づいて、取得した符号化対象ピクチャ、参照ピクチャ、および復号側動き推定部104では、さらに局部復号ピクチャから、符号化対象領域、復号済み領域、参照領域を特定する(ステップS103)。
次に、符号化制御部116は、符号化側動き推定部103、復号側動き推定部104、および動きベクトル情報構成部105に対して、符号化側MEと復号側MEを組み合わせて動作させるよう、各部を制御し、本実施の形態の符号化におけるハイブリッドME処理を行う(ステップS104)ことで、一般的な符号化側MEで得られるMVおよびmvdを適用した場合の総コストよりも小さいか、もしくは等しくなるような最終MVおよび複合残差動きベクトルh−mvdが生成される。生成された最終MVは、動き補償部106および蓄積部102に供給され、複合残差動きベクトルh−mvdは、エントロピー符号化部110に供給される。
その後、符号化制御部116は、動き補償部106に動き補償処理開始指令を送り、動き補償部106は、蓄積部102から参照ピクチャを取得し、動きベクトル情報構成部105から、最終MVを取得して、所定のMC処理を行う(ステップS105)ことで、予測ピクチャを生成し、減算部107および加算部113に予測ピクチャを供給する。
次に、減算部107は、入力部101から符号化対象ピクチャを取得し、動き補償部106から予測ピクチャを取得し、符号化対象ピクチャから予測ピクチャを減算して、残差情報を生成し、直交変換部108に供給する。
次に、符号化制御部116は、直交変換部108に対して直交変換処理開始指令を送り、直交変換部108は、減算部107から残差情報を取得し、所定の直交変換処理を行う(ステップS106)ことで、直交変換係数情報を生成し、量子化部109に供給する。その後、符号化制御部116は、量子化部109に対して量子化処理開始指令を送り、量子化部109は、直交変換部108から直交変換係数情報を取得し、所定の量子化処理を行う(ステップS107)ことで、量子化後情報を生成し、エントロピー符号化部110および逆量子化部111に供給する。
その後、符号化制御部116は、逆量子化部111に対して逆量子化処理開始指令を送り、逆量子化部111は、量子化部109から量子化後情報を取得し、所定の逆量子化処理を行う(ステップS108)ことで、逆量子化後の直交変換係数情報を生成し、逆直交変換部112に供給する。その後、符号化制御部116は、逆直交変換部112に対して逆直交変換処理開始指令を送り、逆直交変換部112は、逆量子化部111から逆量子化後の直交変換係数情報を取得し、所定の逆直交変換処理を行う(ステップS109)ことにより、復号残差情報を生成し、加算部113に供給する。その後、加算部113は、動き補償部106から予測ピクチャを取得し、逆直交変換部112から復号残差情報を取得する。そして、加算部113は、取得した予測ピクチャに復号残差情報を加算することにより、復号領域の信号を格納する(ステップS110)ことで局部復号ピクチャを生成し、蓄積部102に供給する。
次に、符号化制御部116は、エントロピー符号化部110に対し、エントロピー符号化処理開始指令を送り、エントロピー符号化部110は、動きベクトル情報構成部105から、複合残差動きベクトル情報(h−mvd)、MEモード情報、ME処理の組み合わせで用いた探索幅情報、および探索精度情報を取得し、量子化部109から、量子化後情報を取得し、所定のエントロピー符号化処理を行う(ステップS111)ことで、少なくとも、複合残差動きベクトルh−mvdの符号化ビット列、量子化後情報の符号化ビット列、MEモード情報の符号化ビット列、探索幅情報の符号化ビット列、探索精度情報の符号化ビット列を生成し、多重化部114に供給する。
ここで、符号化制御部116は、処理の内部状態から、符号化対象ピクチャ全体の符号化が完了したか、していないかを判定し(ステップS112)、符号化が完了していない場合には、ステップS103に戻り、本実施の形態の符号化処理を継続する。また、符号化が完了した場合、多重化部114に対して多重化処理開始指令を送り、多重化部114は、エントロピー符号化部110から、各符号化ビット列を取得し、所定の構文構造に基づいて多重化して(ステップS113)、多重化後の符号化ビット列を生成し、出力部115に供給する。そして、出力部115は、取得した多重化後の符号化ビット列を出力する(ステップS114)ことで、符号化対象ピクチャに対する一連の符号化処理を完了する。
ここで、多重化後の符号化ビット列は、次のような構成であると良い。図13は、本実施の形態によって生成される符号化ビット列の構成を説明するための概念図である。生成される符号化ビット列は、例えば、大別すると、ヘッダ情報1301、データ情報1302で構成される。
このヘッダ情報1301内に、本実施の形態によって符号化されたビット列であることを示すためのフラグとしてのビット列1303が含まれるように構成することができる。また、ある所定の単位で本実施の形態の符号化を使用したか否かを判別できるように、より細かい処理単位におけるヘッダ情報内に、使用識別フラグとしてのビット列を含むようにすることができる。
例えば、ピクチャもしくはスライス単位で本実施の形態の符号化の使用を制御するために、ヘッダ情報1304およびデータ情報1305を含むピクチャもしくはスライスのヘッダ情報1304内に、本実施の形態の符号化の使用を制御するためのフラグとしてのビット列1306を含むようにしてもよい。また、更に細かい処理単位、例えばマクロブロック単位で本実施の形態の符号化の使用を制御するために、ヘッダ情報1307およびデータ情報1308を含むマクロブロックのヘッダ情報1307内に、本実施の形態の符号化の使用を制御するためのフラグとしてのビット列1309を含むようにしてもよい。また、このようなヘッダ情報に対して、本実施の形態の動作モードを特定するためのモード情報をビット列として格納するように符号化ビット列を構成してもよい。更に、このようなヘッダ情報に対して、本実施の形態の各部の動作や初期状態を制御するためのパラメータ情報を、ビット列として格納するように符号化ビット列を構成してもよい。
符号化制御部116は、最終的に使用する動きベクトル情報を求めるための少なくとも1つの動作モードを特定するための動作モード情報に基づいて、符号化側動き推定部103、復号側動き推定部104および動きベクトル情報構成部105を制御し、動きベクトル情報の再探索の要否を判断し、再探索が必要である場合は、新たな予測動きベクトル情報と新たな探索の開始位置情報を特定し、符号化側動き推定部103および復号側動き推定部104の少なくとも一方に供給するように動きベクトル情報構成部105に指示する。この動作モード情報により、最終的に複合残差ベクトル情報が生成されるまでの前記符号化側動き推定部および前記復号側動き推定部の動作と動きベクトル情報の再探索の有無を識別することができる。
動作モード情報は、所定の検出精度で制限された符号化側動き推定により検出された動きベクトル情報によって大まかな開始位置を特定し、復号側動き推定を行う、動作モードを特定するものであってもよい。
動作モード情報は、復号側動き推定において、符号化対象となっている領域に隣接、もしくは所定の位置関係にある復号済みの領域に含まれる信号と、復号済みの領域に含まれる信号との間で、複合側動き推定処理により、符号化対象となっている領域と、参照される領域との間の最適な位置を特定し、その後、特定された位置を新たな開始位置情報とし、新たな開始位置情報から特定される開始位置の周辺に対して符号化側動き推定を行い、位置を確定させる動作モードを特定するものであってもよい。
動作モード情報は、所定の回数および所定の組み合わせおよび順序に基づいて、復号側動き推定と符号化側動き推定を繰り返し行う動作モードを特定するものであってもよい。
各動作モードに基づいて動作し、生成された少なくとも1つの動きベクトル情報に基づいて、複合残差動きベクトル情報を生成する際、動きベクトル情報構成部105は、符号化側動き推定のみ行って得られる1つの動きベクトル情報が表現できるビット列の長さ以下のビット列に収まるような、所定の再結合処理を行うことによって複合残差動きベクトル情報を生成してもよい。
以上、実施の形態1によれば、動画像符号化の動き推定処理において、符号化側MEと復号側MEとのハイブリッド構成とし、符号化側MEで利用する動きベクトル情報を表現するための値の範囲よりも更に制限された範囲の値で表現された動きベクトル情報を生成するように構成している。これにより、必要とする動きベクトル情報の取りうる値の範囲をより限定することができ、符号量を抑制できるようになる。
更に、符号化側MEと復号側MEとのハイブリッド動作を制御するための手段を備え、復号側において動作モードを所定の処理単位で識別するためのモード情報を符号化出力するように構成している。これにより、所定の単位で動作モードを切り替えて、選択できる動作モードの中で最も情報量が少ない動きベクトル情報を生成できるようになり、符号量を抑制できるようになる。
また、ハイブリッド構成の動作モードとして、所定の検出精度で制限された符号化側MEで検出された動きベクトル情報によって大まかな位置を特定し、その後、復号側MEを行う動作モードを持ち、この動作モードを所定の処理単位で識別するためのモード情報を符号化出力するように構成することができる。これにより、動きベクトル情報の情報量が少なくなるように制限した状態でも、復号側MEで不足分を追加の情報量なしに補い、従来と同等の予測ピクチャを生成することで、符号量を抑制できるようになる。
また、ハイブリッド構成の動作モードとして、復号側MEでテンプレートによる最適な位置を特定し、その後、特定された位置の周辺で符号化側MEを行い、少ない情報量の動きベクトル情報を利用して、位置を確定させる動作モードを持ち、この動作モードを所定の処理単位で識別するためのモード情報を符号化出力するように構成することができる。これにより、復号側MEで情報量なしに得られる動きベクトル情報が、必ずしも十分な精度を満たしていない場合であっても、その後の通常の符号化側MEで正しい位置を確定させることができるため、従来と同等の予測ピクチャを生成することで、符号量を抑制する効果がある。
また、ハイブリッド構成の動作モードとして、所定の回数および所定の組み合わせに基づいて、復号側MEと符号化側MEを繰り返し行う動作モードを持ち、この動作モードを所定の処理単位で識別するためのモード情報を符号化出力するように構成することができる。これにより、微調整を行いながら、復号側MEを行うことを繰り返し行うことが可能となり、少ない動きベクトル情報で、より確からしい予測ピクチャを生成するための検出位置を特定できるようになる。
さらに、このような複数回の繰り返しによって生成された少なくとも1つの動きベクトル情報を、1つの動きベクトル情報が表現できるビット列に収まるような所定の動きベクトル情報構成処理を行うように構成することができる。これにより、動きベクトル情報をまとめて表現することができるとともに、従来方式で動きベクトル情報を伝送するためのシンタックス構造(表現形式)に合わせることができるようになる。
次に、本実施の形態の符号化におけるハイブリッドME処理(ステップS104)における詳細な動作の一例を、図10のフローチャートを用いて説明する。
まず、符号化制御部116は、蓄積部102から、現在の対象領域に隣接し、符号化済みの領域に属する最終MVを取得し、これらの最終MVの各要素の中央値から、予測動きベクトルpmvを求める(ステップS201)。この予測動きベクトルpmvを符号化側初期MVとして、符号化側動き推定部103に供給する。また、探索精度情報を符号化側動き推定部103に供給する。その後、符号化制御部116は、符号化側動き推定部103に符号化側動き推定処理開始指令を送る。この開始要求を受けて、符号化側動き推定部103は、予測動きベクトルpmvを取得するとともに、探索精度情報を取得し、符号化側MEの探索精度を設定する(ステップS202)。その後、符号化側動き推定部103は、対象領域の信号を探索対象として参照領域を探索する、所定の符号化側ME処理を行う(ステップS203)。そして、符号化側MEにおける最良の動きベクトルmvおよび残差動きベクトルmvdを決定する(ステップS204)。決定した残差動きベクトルmvdと、対象領域の信号と、参照領域の信号との間の誤差情報に基づいて、所定の方法により各コストおよび総コスト値を求める(ステップS205)。そして、決定された符号化側MV、符号化側残差MV(mvd)、符号化側MVコスト、符号化側残差コスト、およびこれらを生成した際に用いた初期MV、探索幅情報、探索精度情報を、動きベクトル情報構成部105に供給する。ここまでの処理が、符号化側MEの処理である。
次に、動きベクトル情報構成部105は、復号側MEにおける、初期MVのコスト値と総コスト値の基準値、および変動閾値を設定する(ステップS206)。ここで、初期MVのコスト値の基準値は、符号化側動き推定部103で特定された残差動きベクトルmvdのコスト値を利用するように構成することが望ましい。また、変動閾値は、あらかじめ所定のものを設定するか、符号化制御部116によって供給されるものを設定するように構成することが望ましい。また、総コスト値の基準値は、符号化側動き推定部103で特定された残差動きベクトルmvdに基づく総コスト値を利用するように構成することが望ましい。また、変動閾値は、あらかじめ所定のものを設定するか、符号化制御部116によって供給されるものを設定するように構成することが望ましい。その後、設定された各コスト値の基準値、および変動閾値から、変動範囲を設定する。
その後、符号化制御部116は、復号側動き推定部104に、初期MVを供給する。ここでは、初期MVとして(0,0)を供給したとして話を進める。符号化制御部116は、復号側動き推定部104に対して復号側動き推定処理開始指令を送る。この開始要求を受けて、復号側動き推定部104は、初期MVを取得し、初期MVを設定する(ステップS207)。また、復号側動き推定部104は、符号化制御部116から、探索精度情報を取得し、設定する(ステップS208)。その後、復号側動き推定部104は、局部復号領域内に設定されたテンプレート領域の信号を探索対象として参照領域を探索する、所定の復号側ME処理を行う(ステップS209)。そして、復号側MEにおける最良の復号側MVを決定する(ステップS210)。決定した復号側MVに基づく、対象領域の信号と、参照領域の信号との間の誤差情報に基づいて、所定の方法により各コストおよび総コスト値を求める(ステップS211)。そして、復号側動き推定部104は、動きベクトル情報構成部105に、復号側初期MV、決定した復号側MV、各コスト値、探索条件等を供給する。
その後、動きベクトル情報構成部105は、復号側動き推定部104から供給された情報を取得し、復号側動き推定部104で求められた総コスト値は、総コスト値の変動範囲内であるかを判定し(ステップS212)、範囲内である場合(ステップS212 YES)は、変動範囲内の復号側MV、コスト値および探索条件を蓄積し(ステップS213)、ステップS214に進む。また、範囲内でない場合(ステップS212 NO)は、そのままステップS214に進む。
その後、復号側初期MVのコスト値は、変動範囲内であるかを判定し(ステップS214)、範囲内である場合(ステップS214 YES)は、復号側初期MVに使用する割り当て符号量を増加させる(ステップS215)ことで、初期MVの精度を向上させ、新たに表現できるようになった復号側初期MVにおいて、次の探索開始位置である復号側初期MVの値を復号側動き推定部104に供給し、設定する(ステップS207)ことで、処理を繰り返す。また、範囲でない場合(ステップS214 NO)は、そのままステップS216に進む。
その後、動きベクトル情報構成部105は、蓄積された変動範囲内の復号側MVに基づく総コスト値のうち、符号化側MEで求めた総コスト値を下回るものがあるかを判定する(ステップS216)。下回るものがある場合(ステップS216 YES)は、復号側ME得られた、最良の総コスト値となる、初期MV、復号側MV、および探索条件等を採用し、処理を終了する。また、下回るものがない場合(ステップS216 NO)は、符号化側MEで得られた、符号化側MV、残差動きベクトルmvd、および探索条件等を採用し、処理を終了する。
以上のような処理を行うことで、符号化側MEと復号側MEのハイブリッド構成による、本実施の形態のME処理を実現することができる。これにより、符号化側MEで得られる符号化側MVに基づく総コスト値より小さい、もしくは同等の総コスト値となるような、復号側初期MV、復号側MVを求めることが可能となる。
次に、本実施の形態の符号化における符号化側ME処理(ステップS203)における詳細な動作の一例を、図11のフローチャートを用いて説明する。図11の例では、符号化側MEによって、総コスト値は同等であるが、異なる符号化側MVであるものを抽出できるような処理となっている。
まず、符号化側動き推定部103は、所定の候補数に基づいて、第1のmv候補数を設定する(ステップS501)。その後、第1のSADまたはSATD(以下、SA(T)Dと略記する)の変動閾値を設定する(ステップS502)。その後、予測動きベクトルpmvを利用する処理(ステップS503〜ステップS506)と、予測動きベクトルpmvを利用しない処理(ステップS507〜ステップS510)に分岐する。
予測動きベクトルpmvを利用する処理では、まず、第1の探索幅を設定し、探索範囲を求める(ステップS503)。次に、予測動きベクトルpmvを利用する第1のMEを行い、第1の動きベクトルmv候補を取得する(ステップS504)。ここで、取得する動きベクトルmv候補は、SA(T)Dの変動閾値の範囲内で、もっとも値の小さいものから順番に、第1の動きベクトルmv候補数だけ取得するようにすればよい。その後、取得した第1のmv候補と、予測動きベクトルpmvから、第1の残差動きベクトルmvd候補を求める(ステップS505)。そして、求められた第1の残差動きベクトルmvd候補のコストをそれぞれ計算する(ステップS506)ことで、予測動きベクトルpmvを利用する処理は終了する。
予測動きベクトルpmvを利用しない処理では、まず、第1の探索幅を設定し、探索範囲を求める(ステップS507)。次に、予測動きベクトルpmvを利用しない第2のMEを行い、第2の動きベクトルmv候補を取得する(ステップS508)。ここで、取得する動きベクトルmv候補は、SA(T)Dの変動閾値の範囲内で、もっとも値の小さいものから順番に、第2のmv候補数だけ取得するようにすればよい。その後、予測動きベクトルpmvを利用しないため、取得した第2の動きベクトルmv候補をそのまま第2の残差動きベクトルmvd候補とする(ステップS509)。そして、求められた第2の残差動きベクトルmvd候補のコストをそれぞれ計算する(ステップS510)ことで、予測動きベクトルpmvを利用しない処理が終了する。
以上のような処理を行うことで、より柔軟な符号化側MVを取得することが可能となり、符号化側残差動きベクトルmvdのコスト値が小さいものを重要視してその後の処理を行いたい場合や、多少の情報量を残差動きベクトルmvdに割いたとしても、より品質の良い参照領域を特定してその後の処理を行いたい場合など、柔軟に対応することが可能となる。
次に、本実施の形態の符号化における復号側ME処理(ステップS209)における詳細な動作の一例を、図12のフローチャートを用いて説明する。図12の例では、復号側MEによって、総コスト値は同等であるが、異なる復号側MVであるものを抽出できるような処理となっている。
まず、復号側動き推定部104は、所定の候補数に基づいて、第2の動きベクトルmv候補数を設定する(ステップS601)。その後、第2のSA(T)Dの変動閾値を設定する(ステップS602)。次に、第2の探索幅を設定し、探索範囲を求める(ステップS603)。次に、テンプレートを利用する復号側MEを行い(ステップS604)、第3の動きベクトルmv候補を取得する(ステップS605)ことで、処理が終了する。
(実施の形態2)
次に、実施の形態2に係る画像復号装置について説明する。実施の形態2に係る画像復号装置は、実施の形態1によって生成された、多重化後の符号化ビット列を取得し、復号する。
図14は、実施の形態2に係る画像復号装置1400の各構成要素1401〜1411間の基本的な接続関係を示す図である。
実施の形態2に係る画像復号装置1400は、入力部1401、蓄積部1402、多重化分離部1403、エントロピー復号部1404、復号側動き推定部1405、動きベクトル情報構成部1406、動き補償部1407、加算部1408、逆量子化部1409、逆直交変換部1410、および出力部1411を有する。また、図14に図示していないが、図15のような復号制御部1512を更に有してもよい。以下に、各部の詳細を説明する。
入力部1401は、例えば、図14に示されている伝送装置1431、記録装置1432、記録媒体1433、蓄積装置1434等から、実施の形態2に係る復号により復号可能な符号化ビット列を取得し、多重化分離部1403に供給する。
蓄積部1402は、図1の蓄積部102と同等の機能を有していれば良いため、説明を省略する。
多重化分離部1403は、入力部1401から符号化ビット列を取得し、所定の多重化分離処理を行うことにより、多重化後の符号化ビット列を取得する。そして、所定の構文構造に基づいて符号化で利用した各種パラメータ情報や、符号化モード情報を特定するための識別情報を特定しながら多重化分離を行う。そして、多重化後の符号化ビット列から、各種の符号化パラメータ情報、複合残差動きベクトル情報h−mvd、量子化後情報、MEモード情報の符号化ビット列、探索幅情報の符号化ビット列、探索精度情報の符号化ビット列等の多重化分離後の符号化ビット列を取得する。
ここで、多重化分離部1403は、上述の多重化分離を行う際に、取得した符号化ビット列内に、図13に示した上述のビット列1303を含むか否か検出し、実施の形態2に係る復号により復号可能であるかを判別してもよい。同様に、図13に示した上述のビット列1306およびビット列1309のように、より細かい処理単位で制御するために含まれたビット列を含むか否か検出し、実施の形態2に係る復号によって復号可能であるか否かを判別してもよい。また、多重化分離部1403は、多重化分離後の符号化ビット列をエントロピー復号部1404に供給する。
エントロピー復号部1404は、多重化分離部1403から、多重化分離後の符号化ビット列を取得し、所定のエントロピー復号を行う。エントロピー復号部1404は、所定のエントロピー復号によって、少なくとも複合残差動きベクトル情報h−mvd、量子化後情報、MEモード情報、探索幅情報、探索精度情報を生成し、複合残差動きベクトル情報h−mvd、探索幅情報、探索精度情報を動きベクトル情報構成部1406に供給し、量子化後情報を逆量子化部1409に供給する。
動きベクトル情報構成部1406は、エントロピー復号部1404から、複合残差動きベクトル情報h−mvd、探索幅情報、探索精度情報を取得する。また、動きベクトル情報構成部1406は、複合残差動きベクトル情報h−mvdから、復号側初期MVおよび復号側拡張MVを生成し、復号側動き推定部1405に供給する。また、動きベクトル情報構成部1406は、取得した探索幅情報、探索精度情報を、必要に応じて、復号側動き推定部1405に供給する。また、動きベクトル情報構成部1406は、復号側動き推定部1405から、最終MVを取得し、動き補償部1407に供給する。
復号側動き推定部1405は、図1の復号側動き推定部104と同等の機能を有していれば良いため、説明を省略する。
動き補償部1407は、図1の動き補償部106と同等の機能を有していればよいため、説明を省略する。
加算部1408は、図1の加算部113と同等の機能を有していればよいため、説明を省略する。
逆量子化部1409は、エントロピー復号部1404から、量子化後情報を取得する。その他の機能は、図1の逆量子化部111と同等の機能を有していればよいため、説明を省略する。
逆直交変換部1410は、図1の逆直交変換部112と同等の機能を有していればよいため、説明を省略する。
出力部1411は、蓄積部1402から復号ピクチャを取得し、出力部1411に接続されている外部の機器に対して、復号ピクチャを供給する。例えば、図14に示す表示装置1441が画像復号装置1400に接続されていれば、復号結果である復号ピクチャを表示するように構成することができる。また、図14に示す伝送装置1442が画像復号装置1400に接続されていれば、実施の形態2に係る復号により生成された復号後の復号ピクチャを、ネットワークを介して、外部の受信装置に伝送するように構成することができる。また、図14に示す記録装置1443、記録媒体1444、蓄積装置1445等が画像復号装置1400に接続されていれば、実施の形態2に係る復号により生成された復号結果である復号ピクチャを、記録、保存、持ち出しができるように構成することができる。
復号制御部1412は、図14に示すような実施の形態2に係る画像復号装置1400を構成する各部の動作状態を監視し、各部の復号動作や入出力を制御する。
図16は、実施の形態2に係る画像復号装置1400の基本動作を示すフローチャートである。まず、復号制御部1412は、ユーザ等から復号開始要求を受けると、各部に対して復号開始指令を送る。それに応じて、入力部1401は、例えば、図14に示した伝送装置1431、記録装置1432、記録媒体1433、蓄積装置1434等から、実施の形態2に係る復号により復号可能な符号化ビット列を取得し(ステップS301)、多重化分離部1403に供給する。
その後、多重化分離部1403は、入力部1401から符号化ビット列を取得し、所定の構文構造に基づいて、多重化分離を行い(ステップS302)、多重化分離後の符号化ビット列をエントロピー復号部1404に供給する。
次に、エントロピー復号部1404は、多重化分離部1403から、多重化分離後の符号化ビット列を取得し、所定のエントロピー復号を行う(ステップS303)。これにより、少なくとも複合残差動きベクトル情報h−mvd、量子化後情報、MEモード情報、探索幅情報、探索精度情報を生成し、複合残差動きベクトル情報h−mvd、探索幅情報、探索精度情報を動きベクトル情報構成部1406に供給し、量子化後情報を逆量子化部1409に供給する。
その後、逆量子化部1409は、エントロピー復号部1404から、量子化後情報を取得し、所定の逆量子化を行う(ステップS304)。この処理により、量子化後の直交変換係数情報を生成し、逆直交変換部1410に供給する。
その後、逆直交変換部1410は、逆量子化部1409から、量子化後の直交変換係数情報を取得し、所定の逆直交変換を行う(ステップS305)。この処理により、復号残差情報を生成し、加算部1408に供給する。
また、動きベクトル情報構成部1406は、エントロピー復号部1404から、複合残差動きベクトル情報h−mvd、探索幅情報、探索精度情報を取得する。その後、動きベクトル情報構成部1406は、複合残差動きベクトル情報h−mvdから、復号側初期MVおよび復号側拡張MVを生成し、復号側動き推定部1405に供給する。また、動きベクトル情報構成部1406は、取得した探索幅情報、探索精度情報を、復号側動き推定部1405に供給する。
次に、復号制御部1412は、復号側動き推定部1405に対して復号側動き推定処理開始指令を送り、これを受けて、復号側動き推定部1405は、蓄積部1402から、局部復号ピクチャおよび参照ピクチャを取得する。その後、復号制御部1412は、現在の対象領域を特定するための情報を、復号側動き推定部1405に供給し、復号側動き推定部1405は、この情報から、復号側対象領域、復号済み領域、参照領域を特定する(ステップS306)。
その後、復号側動き推定部1405は、動きベクトル情報構成部1406から、復号側初期MV、復号側拡張MV、探索幅情報、探索精度情報を取得し、本実施の形態の復号におけるME処理を行う(ステップS307)ことで、最終MVを生成し、動きベクトル情報構成部1406に供給する。
そして、動きベクトル情報構成部1406は、復号側動き推定部1405から、最終MVを取得し、動き補償部1407に供給する。
次に、動き補償部1407は、動きベクトル情報構成部1406から最終MVを取得する。また、動き補償部1407は、蓄積部1402から参照ピクチャを取得する。動き補償部1407は、取得した参照ピクチャ、最終MVに基づいて、所定の動き補償(MC)処理を行う(ステップS308)ことにより、予測ピクチャを生成する。その後、動き補償部1407は、生成した予測ピクチャを加算部1408に供給する。
次に、加算部1408は、動き補償部1407から予測ピクチャを取得し、逆直交変換部1410から復号残差情報を取得し、取得した予測ピクチャに復号残差情報を加算することにより、復号領域の信号として復号信号を生成し、格納する(ステップS309)ことで、復号ピクチャを生成する。これを参照ピクチャとして蓄積部1402に供給する。
その後、復号対象ピクチャ全体の復号が完了したかを判定し(ステップS310)、完了していない場合(ステップS310 NO)は、ステップS303に進み、処理を継続する。また、完了した場合(ステップS310 YES)、出力部1411は、蓄積部1402から復号ピクチャを取得し、出力部1411に接続されている外部の機器に対して、復号ピクチャを供給することにより、復号ピクチャを出力し、処理を完了する。
以上のようなステップを経ることで、実施の形態2に係る復号動作が終了する。
以上、実施の形態2によれば、本発明の符号化により、効率よく符号化して得られた符号化ビット列を取得し、それを正確に効率的に復号することができる。
次に、本発明の復号におけるME処理(ステップS307)における詳細な動作の一例を、図17のフローチャートを用いて説明する。
まず、復号側動き推定部1405は、動きベクトル情報構成部1406から、初期MVを取得し、設定する(ステップS401)。また、探索精度情報、探索幅情報を取得し、復号側MEの探索精度を設定するとともに、探索幅情報から、探索範囲を特定し、設定する(ステップS402)。その後、所定の復号側MEを行う(ステップS403)ことにより、復号側MVを生成し、これを最終MVとして出力する(ステップS404)ことで、処理が完了する。
以上述べたように、実施の形態1の画像符号化装置100は、動画像符号化の動き推定処理において、通常のMEと、デコーダ側MEとのハイブリッド構成とし、通常のMEで利用する動きベクトル情報を表現するための値の範囲よりも更に制限された範囲の値で表現された動きベクトル情報を生成するように構成したものである。これにより、必要とする動きベクトル情報の取りうる値の範囲をより限定することができ、符号量を抑制する効果がある。また、実施の形態2の画像復号装置1400は、このような特徴をもつ符号化によって得られた符号化ビット列を取得し、それを正確に効率的に復号することができる。
更に、通常のMEとデコーダ側MEとのハイブリッド動作を制御するための手段を備え、復号側において動作モードを所定の処理単位で識別するためのモード情報を符号化して出力するように構成した。これにより、所定の単位で動作モードを切り替えて、選択できる動作モードの中で最も情報量が少ない動きベクトル情報を生成できる。また、実施の形態2の画像復号装置1400は、このような特徴をもつ符号化によって得られた符号化ビット列を取得し、それを正確に効率的に復号することができる。
また、ハイブリッド構成の動作モードの一つとして、所定の検出精度で制限された通常のMEで検出された動きベクトル情報によって大まかな位置を特定し、その後、デコーダ側MEを行う動作モードを持ち、この動作モードを所定の処理単位で識別するためのモード情報を符号化出力するように構成した。これにより、動きベクトル情報の情報量が少なくなるように制限した状態でも、デコーダ側MEで不足分を追加の情報量なしに補い、従来と同等の予測ピクチャを生成することで、符号量を抑制する効果がある。また、実施の形態2の画像復号装置1400は、このような特徴をもつ符号化によって得られた符号化ビット列を取得し、それを正確に効率的に復号することができる。
また、ハイブリッド構成の動作モードの一つとして、デコーダ側MEでテンプレートによる最適な位置を特定し、その後、特定された位置の周辺で通常のMEを行い、少ない情報量の動きベクトル情報を利用して、位置を確定させる動作モードを持ち、この動作モードを所定の処理単位で識別するためのモード情報を符号化出力するように構成した。これにより、デコーダ側MEで情報量なしに得られる動きベクトル情報が、必ずしも十分な精度を満たしていない場合であっても、その後の通常のMEで正しい位置を確定させることができるため、従来と同等の予測ピクチャを生成することで、符号量を抑制する効果がある。また、実施の形態2の画像復号装置1400は、このような特徴をもつ符号化によって得られた符号化ビット列を取得し、それを正確に効率的に復号することができる。
また、ハイブリッド構成の動作モードとして、所定の回数および所定の組み合わせに基づいて、デコーダ側MEと通常のMEを繰り返し行う動作モードを持ち、この動作モードを所定の処理単位で識別するためのモード情報を符号化出力するように構成した。これにより、微調整を行いながら、デコーダ側MEを行うことを繰り返し行うことが可能となり、少ない動きベクトル情報で、より確からしい予測ピクチャを生成するための検出位置を特定できる。また、実施の形態2の画像復号装置1400は、このような特徴をもつ符号化によって得られた符号化ビット列を取得し、それを正確に効率的に復号することができる。
さらに、このような複数回の繰り返しによって生成された少なくとも1つの動きベクトル情報を、1つの動きベクトル情報が表現できるビット列に収まるような所定の再結合処理を行うように構成した。これにより、動きベクトル情報をまとめて表現することができるとともに、従来方式で動きベクトル情報を伝送するためのシンタックス構造(表現形式)に合わせることができる。また、実施の形態2の画像復号装置1400は、このような特徴をもつ符号化によって得られた符号化ビット列を取得し、それを正確に効率的に復号することができる。
(実施の形態3)
上記実施の形態1および2では、画像符号化装置100および画像復号装置1400を、主に、ハードウエアにより構成する例を説明したが、これに限らない。
図18は、実施の形態1および2に係る画像符号化装置100および画像復号装置1400を、コンピュータを含む情報処理装置1800によって構成する例を示すブロック図である。実施の形態3に係る情報処理装置1800は、CPUに代表される中央処理制御装置1803、記録媒体や通信装置1806を介して、メモリに代表される一時記憶装置1805やHDDに代表される外部記憶装置1804に格納された符号化プログラム、復号プログラムにより、上記実施形態1および2の処理をソフトウェア処理により実行してもよい。
また、本発明の実施の形態1〜3に係る画像符号化装置、画像符号化方法、画像復号装置、画像復号方法、および画像復号プログラムの適用される範囲は、動画像を符号化および復号する装置、方法、プログラム、システム等であればよく、特に限定されるものではない。例えば、TVに代表される放送装置、携帯電話、スマートフォン、携帯型音楽プレーヤ、ゲーム装置、テレビ会議装置、監視装置、DVD−R/RW、BD−R/RW、HDD、SD、ホログラフィックメモリ等の追記および書き換え可能な記録媒体を利用した画像記録再生装置、デジタルカメラやカムコーダといった撮像記録再生装置、オーサリング等の画像記録編集装置、動画像の配信装置等に適用しても構わない。
以上の符号化及び復号に関する処理は、ハードウェアを用いた伝送、蓄積、受信装置として実現することができるのは勿論のこと、ROM(リード・オンリ・メモリ)やフラッシュメモリ等に記憶されているファームウェアや、コンピュータ等のソフトウェアによっても実現することができる。そのファームウェアプログラム、ソフトウェアプログラムをコンピュータ等で読み取り可能な記録媒体に記録して提供することも、有線あるいは無線のネットワークを通してサーバから提供することも、地上波あるいは衛星ディジタル放送のデータ放送として提供することも可能である。
以上、本発明を実施の形態をもとに説明した。実施の形態は例示であり、それらの各構成要素や各処理プロセスの組合せにいろいろな変形例が可能なこと、またそうした変形例も本発明の範囲にあることは当業者に理解されるところである。
100 画像符号化装置、 101 入力部、 102 蓄積部、 103 符号化側動き推定部、 104 復号側動き推定部、 105 動きベクトル情報構成部、 106 動き補償部、 107 減算部、 108 直交変換部、 109 量子化部、 110 エントロピー符号化部、 111 逆量子化部、 112 逆直交変換部、 113 加算部、 114 多重化部、 115 出力部、 131 撮像装置、 132 伝送装置、 133 記録装置、 134 記録媒体、 135 蓄積装置、 141 伝送装置、 142 記録装置、 143 記録媒体、 144 蓄積装置、 116 符号化制御部、 1400 画像復号装置、 1401 入力部、 1402 蓄積部、 1403 多重化分離部、 1404 エントロピー復号部、 1405 復号側動き推定部、 1406 動きベクトル情報構成部、 1407 動き補償部、 1408 加算部、 1409 逆量子化部、 1410 逆直交変換部、 1411 出力部、 1431 伝送装置、 1432 記録装置、 1433 記録媒体、 1434 蓄積装置、 1441 表示装置、 1442 伝送装置、 1443 記録装置、 1444 記録媒体、 1445 蓄積装置、 1412 復号制御部、 1800 情報処理装置、 1801 入力装置、 1802 出力装置、 1803 中央処理制御装置、 1804 外部記憶装置、1805 一時記憶装置、 1806 通信装置、 1807 通信バス。

Claims (3)

  1. 画像の符号化ビット列を取得し、復号処理を行って復号信号を生成する画像復号装置であって、
    取得した符号化ビット列に対して、所定の構文構造に基づいて復号する復号部と、
    復号対象となっている領域に隣接、もしくは所定の位置関係にある復号済みの領域に含まれる信号と、復号済みの領域に含まれる信号との間で、探索の開始位置情報に基づいて、所定の動き推定処理により、復号対象となっている領域と、参照される領域との間の位置関係を示す動きベクトル情報を特定する復号側動き推定部と、
    動き補償を行う動き補償部と、
    予測動きベクトル情報と予測動きベクトル情報に基づいて特定される探索の開始位置情報とを、前記復号側動き推定部に供給し、動きベクトル情報を再探索する場合には、新たな予測動きベクトル情報と新たな探索の開始位置情報を特定し、前記復号側動き推定部に供給するとともに、復号結果から最終的に使用する動きベクトル情報を特定し、前記動き補償部に供給する動きベクトル情報構成部と、
    前記復号側動き推定部、前記動き補償部、および前記動きベクトル情報構成部を制御する復号制御部と、
    前記復号部は、複合残差動きベクトル情報、および最終的に使用する動きベクトル情報を求めるための少なくとも1つの動作モードを特定するための動作モード情報を復号し、
    前記動きベクトル情報構成部は、予測動きベクトル情報で表現できる部分、および前記復号側動き推定部によって特定される動きベクトル情報で表現できる部分が、最終的に使用する動きベクトル情報から取り除かれた複合残差動きベクトル情報を取得し、予測動きベクトル情報および前記復号側動き推定部によって特定される動きベクトル情報に基づいてその取り除かれた部分を補うことにより最終的に使用する動きベクトル情報を特定し、前記動き補償部に供給するように、復号された動作モード情報に基づいて、前記復号制御部によって制御されることを特徴とする画像復号装置。
  2. 画像の符号化ビット列を取得し、復号処理を行って復号信号を生成する画像復号方法であって、
    取得した符号化ビット列に対して、所定の構文構造に基づいて復号する復号ステップと、
    復号対象となっている領域に隣接、もしくは所定の位置関係にある復号済みの領域に含まれる信号と、復号済みの領域に含まれる信号との間で、探索の開始位置情報に基づいて、所定の動き推定処理により、復号対象となっている領域と、参照される領域との間の位置関係を示す動きベクトル情報を特定する復号側動き推定ステップと、
    動き補償を行う動き補償ステップと、
    予測動きベクトル情報と予測動きベクトル情報に基づいて特定される探索の開始位置情報とを、前記復号側動き推定部に供給し、動きベクトル情報を再探索する場合には、新たな予測動きベクトル情報と新たな探索の開始位置情報を特定し、前記復号側動き推定部に供給するとともに、復号結果から最終的に使用する動きベクトル情報を特定し、前記動き補償部に供給する動きベクトル情報構成ステップと、を備え、
    前記復号ステップは、複合残差動きベクトル情報、および最終的に使用する動きベクトル情報を求めるための少なくとも1つの動作モードを特定するための動作モード情報を復号し、
    前記動きベクトル情報構成ステップは、予測動きベクトル情報で表現できる部分、および前記復号側動き推定ステップによって特定される動きベクトル情報で表現できる部分が、最終的に使用する動きベクトル情報から取り除かれた複合残差動きベクトル情報を取得し、予測動きベクトル情報および前記復号側動き推定ステップによって特定される動きベクトル情報に基づいてその取り除かれた部分を補うことにより最終的に使用する動きベクトル情報を特定し、前記動き補償ステップに供給するように、復号された動作モード情報に基づいて制御されることを特徴とする画像復号方法。
  3. コンピュータに、画像の符号化ビット列を取得し、復号処理を行って復号信号を生成させる画像復号プログラムであって、
    取得した符号化ビット列に対して、所定の構文構造に基づいて復号する復号ステップと、
    復号対象となっている領域に隣接、もしくは所定の位置関係にある復号済みの領域に含まれる信号と、復号済みの領域に含まれる信号との間で、探索の開始位置情報に基づいて、所定の動き推定処理により、復号対象となっている領域と、参照される領域との間の位置関係を示す動きベクトル情報を特定する復号側動き推定ステップと、
    動き補償を行う動き補償ステップと、
    予測動きベクトル情報と予測動きベクトル情報に基づいて特定される探索の開始位置情報とを、前記復号側動き推定部に供給し、動きベクトル情報を再探索する場合には、新たな予測動きベクトル情報と新たな探索の開始位置情報を特定し、前記復号側動き推定部に供給するとともに、復号結果から最終的に使用する動きベクトル情報を特定し、前記動き補償部に供給する動きベクトル情報構成ステップと、をコンピュータに実行させ、
    前記復号ステップは、複合残差動きベクトル情報、および最終的に使用する動きベクトル情報を求めるための少なくとも1つの動作モードを特定するための動作モード情報を復号し、
    前記動きベクトル情報構成ステップは、予測動きベクトル情報で表現できる部分、および前記復号側動き推定ステップによって特定される動きベクトル情報で表現できる部分が、最終的に使用する動きベクトル情報から取り除かれた複合残差動きベクトル情報を取得し、予測動きベクトル情報および前記復号側動き推定ステップによって特定される動きベクトル情報に基づいてその取り除かれた部分を補うことにより最終的に使用する動きベクトル情報を特定し、前記動き補償ステップに供給するように、復号された動作モード情報に基づいて制御されることを特徴とする画像復号プログラム。
JP2011072988A 2011-03-29 2011-03-29 画像復号装置、画像復号方法及び画像復号プログラム Pending JP2012209706A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2011072988A JP2012209706A (ja) 2011-03-29 2011-03-29 画像復号装置、画像復号方法及び画像復号プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011072988A JP2012209706A (ja) 2011-03-29 2011-03-29 画像復号装置、画像復号方法及び画像復号プログラム

Publications (1)

Publication Number Publication Date
JP2012209706A true JP2012209706A (ja) 2012-10-25

Family

ID=47189121

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011072988A Pending JP2012209706A (ja) 2011-03-29 2011-03-29 画像復号装置、画像復号方法及び画像復号プログラム

Country Status (1)

Country Link
JP (1) JP2012209706A (ja)

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007228371A (ja) * 2006-02-24 2007-09-06 Kddi Corp 画像符号化装置
WO2008111451A1 (ja) * 2007-03-14 2008-09-18 Nippon Telegraph And Telephone Corporation 動きベクトル探索方法及び装置、そのプログラム並びにプログラムを記録した記録媒体
WO2009126260A1 (en) * 2008-04-11 2009-10-15 Thomson Licensing Methods and apparatus for template matching prediction (tmp) in video encoding and decoding
JP2009267710A (ja) * 2008-04-24 2009-11-12 Ntt Docomo Inc 画像予測符号化装置、画像予測符号化方法、画像予測符号化プログラム、画像予測復号装置、画像予測復号方法及び画像予測復号プログラム
JP2010016454A (ja) * 2008-07-01 2010-01-21 Sony Corp 画像符号化装置および方法、画像復号装置および方法、並びにプログラム
WO2010008654A1 (en) * 2008-07-16 2010-01-21 Sony Corporation Speculative start point selection for motion estimation iterative search
JP2010093646A (ja) * 2008-10-09 2010-04-22 Ntt Docomo Inc 動画像符号化装置、動画像復号装置、動画像符号化方法、動画像復号方法、動画像符号化プログラム、動画像復号プログラム、動画像処理システムおよび動画像処理方法
JP2011061302A (ja) * 2009-09-07 2011-03-24 Hitachi Kokusai Electric Inc 動画像符号化装置

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007228371A (ja) * 2006-02-24 2007-09-06 Kddi Corp 画像符号化装置
WO2008111451A1 (ja) * 2007-03-14 2008-09-18 Nippon Telegraph And Telephone Corporation 動きベクトル探索方法及び装置、そのプログラム並びにプログラムを記録した記録媒体
WO2009126260A1 (en) * 2008-04-11 2009-10-15 Thomson Licensing Methods and apparatus for template matching prediction (tmp) in video encoding and decoding
JP2009267710A (ja) * 2008-04-24 2009-11-12 Ntt Docomo Inc 画像予測符号化装置、画像予測符号化方法、画像予測符号化プログラム、画像予測復号装置、画像予測復号方法及び画像予測復号プログラム
JP2010016454A (ja) * 2008-07-01 2010-01-21 Sony Corp 画像符号化装置および方法、画像復号装置および方法、並びにプログラム
WO2010008654A1 (en) * 2008-07-16 2010-01-21 Sony Corporation Speculative start point selection for motion estimation iterative search
JP2010093646A (ja) * 2008-10-09 2010-04-22 Ntt Docomo Inc 動画像符号化装置、動画像復号装置、動画像符号化方法、動画像復号方法、動画像符号化プログラム、動画像復号プログラム、動画像処理システムおよび動画像処理方法
JP2011061302A (ja) * 2009-09-07 2011-03-24 Hitachi Kokusai Electric Inc 動画像符号化装置

Similar Documents

Publication Publication Date Title
KR102334293B1 (ko) 비디오 신호 처리 방법 및 장치
US11917191B2 (en) Method and apparatus for encoding motion information and method and apparatus for decoding same
JP6336170B2 (ja) エラー耐性が改善されたビデオ符号化及びビデオ復号化
KR101598306B1 (ko) 화상 인코딩 장치, 화상 인코딩 방법, 화상 인코딩 프로그램, 화상 디코딩 장치, 화상 디코딩 방법 및 화상 디코딩 프로그램
RU2589402C2 (ru) Способ и устройство для кодирования последовательности изображений, а также способ и устройство для декодирования последовательности изображений
JP2019146251A (ja) 動き情報の復号化方法及び符号化方法
KR20110094765A (ko) 움직임 예측 장치 및 방법과 영상 처리 장치
KR20140029369A (ko) 화상 예측 부호화 장치, 화상 예측 부호화 방법, 화상 예측 부호화 프로그램, 화상 예측 복호 장치, 화상 예측 복호 방법, 및 화상 예측 복호 프로그램
US20150023418A1 (en) Image processing apparatus and image processing method
JP2012209706A (ja) 画像復号装置、画像復号方法及び画像復号プログラム
JP2012209705A (ja) 画像符号化装置、画像符号化方法及び画像符号化プログラム
JP2014039308A (ja) 動画像復号装置、動画像復号方法、及び動画像復号プログラム、並びに、受信装置、受信方法、及び受信プログラム
JP6514307B2 (ja) 動画像符号化装置及び方法
JP5682478B2 (ja) 画像復号装置、画像復号方法、および画像復号プログラム
JP5642305B2 (ja) 動画像予測符号化装置、動画像予測符号化方法、動画像予測符号化プログラム、動画像予測復号装置、動画像予測復号方法及び動画像予測復号プログラム
JP2023025237A (ja) 動画像符号化装置及び動画像復号化装置
KR20120035769A (ko) 움직임 정보 부호화 및 복호화 방법과 이를 이용한 장치
JP2013012960A (ja) 画像符号化装置、画像符号化方法、および画像符号化プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20131001

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20140811

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140902

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20150113