JP4563981B2 - 映像符号化方法、映像符号化装置、映像符号化プログラムおよびそのプログラムを記録したコンピュータ読み取り可能な記録媒体 - Google Patents

映像符号化方法、映像符号化装置、映像符号化プログラムおよびそのプログラムを記録したコンピュータ読み取り可能な記録媒体 Download PDF

Info

Publication number
JP4563981B2
JP4563981B2 JP2006287060A JP2006287060A JP4563981B2 JP 4563981 B2 JP4563981 B2 JP 4563981B2 JP 2006287060 A JP2006287060 A JP 2006287060A JP 2006287060 A JP2006287060 A JP 2006287060A JP 4563981 B2 JP4563981 B2 JP 4563981B2
Authority
JP
Japan
Prior art keywords
encoding
prediction residual
vector
cost
divided region
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2006287060A
Other languages
English (en)
Other versions
JP2008104124A (ja
Inventor
隆一 谷田
淳 清水
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2006287060A priority Critical patent/JP4563981B2/ja
Publication of JP2008104124A publication Critical patent/JP2008104124A/ja
Application granted granted Critical
Publication of JP4563981B2 publication Critical patent/JP4563981B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

本発明は、映像を領域分割し、フレーム間予測符号化に従って分割領域の動きベクトルを探索して符号化を行う映像符号化方法およびその装置と、その映像符号化装置の実現に用いられる映像符号化プログラムおよびそのプログラムを記録したコンピュータ読み取り可能な記録媒体とに関し、特に、少ない演算量でもって、符号化効率がより高い動きベクトルを探索することを実現する映像符号化方法およびその装置と、その映像符号化装置の実現に用いられる映像符号化プログラムおよびそのプログラムを記録したコンピュータ読み取り可能な記録媒体とに関する。
近年の映像符号化方式の多くは、フレームを小さいブロックの単位に分け、符号化済みフレームの予測残差の小さい領域との差分を符号化する「動き補償」という技術を使用して符号量を削減する。
その際、予測残差の小さい領域の位置を示す動きベクトルも符号化する必要があるが、隣接するブロック間でこの動きベクトルの相関が高いため、周囲のベクトル情報を元に予測ベクトルを生成し、それとの差分を取った予測残差ベクトルを符号化するのが一般的となっている。
映像符号化規格H.264/MPG-4 AVC(以下、H.264と称する)では、あるマクロブロック(以下、MBと略記することがある)の動きベクトルを符号化する際に、図8に示すように、上・右上・左に隣接するMB(図8のA,B,Cに示すMB)の動きベクトルのメディアンを予測ベクトルとし、それとの差分のみを予測残差ベクトルとして符号化する(例えば、非特許文献1参照)。
動き補償を用いる場合、予測残差の小さい領域を探す動き探索を行わなければならない。その際には、予測残差情報の他に、この予測残差ベクトルの符号量も加味する必要がある。そのため、H.264で動きベクトルを求める場合、各探索点で予測残差情報と予測残差ベクトルとからコスト関数を計算し、それが最も小さくなる点を求める方法が一般的となっている。
このコスト関数としては、予測残差信号の電力D、予測残差ベクトルの符号量R、係数λを用いた
cost=D+λ・R
という式が広く使われている。
実際の符号化では、左上のMBから順に、このcostが最小となる点を求めていく(例えば、非特許文献2参照)。
図9に、動き補償を用いてMBを逐次的に符号化処理する場合のフローチャートの概略を示す。
動き補償を用いてMBを逐次的に符号化処理する場合には、このフローチャートに示すように、まず、左上のMBを処理対象のMBとし(S301)、そのMBについて動きベクトル導出処理を行う(S302)。続いて、予測残差にDCTと量子化を施し(S303)、動きベクトル情報とともにエントロピー符号化処理を行う(S304)。
一方、予測残差信号の量子化値に逆量子化とIDCTを施し、予測画像との和を取って復号画像を生成する(S305)。この処理が終わったら全MBの処理が終了したかを判定し(S306)、まだ終わっていなければ次のMBに進み(S307)、上記の処理を繰り返す(S302〜S307)。そして、全MBの処理が終了したところで1フレーム分の符号化処理が終了となる。
図10に、各MBの動きベクトル導出処理(図9のS302の処理)の具体的なフローチャートを示す。
各MBの動きベクトル導出処理では、このフローチャートに示すように、まず、予測ベクトルV_pを求める(S401)。また、cost_min に十分大きな値を代入し(S402)、最初の探索ベクトルV(x,y)を設定する(S403)。そして、探索ベクトルVに対応する予測画像と符号化対象MBとの予測残差Dif[j][i]を求め(S404)、その予測残差電力Pを算出する(S405)。
一方、予測ベクトルV_pと探索ベクトルVとの差分である予測残差ベクトルΔVのコストR(ΔV)をテーブル参照により算出する(S406)。その後、予測残差電力PとコストR(ΔV)とから探索ベクトルVに関するcostを“cost=P+λ・R(ΔV)”として求め(S407)、cost_min と比較する(S408)。求めたcostがcost_min より小さければcost_min の値をcostで更新し、予測残差Dif[j][i]をDif_min[j][i] に保存し、予測残差ベクトルΔVをΔV_min に保存する(S409)。
以上の処理が終わったら、全探索点の処理が終了したかを判定し(S410)、終わっていなければ次の探索ベクトルへと探索点を移し(S411)、上記の処理を繰り返す。全探索点が終わった時点で、ΔV_min に格納されたベクトルが求める予測残差ベクトル、Dif_min[j][i] に格納された値が予測残差、cost_min に格納された値がコストとなる。
図11に、図9および図10の処理を実現するための装置構成を示す。
図9および図10の処理を実現するための装置では、この図に示すように、入力画像保存バッファ301、制御部302、動き補償予測部303、コスト計算部304、ベクトル情報保存バッファ305、予測ベクトル算出部306、スイッチA307、スイッチB308、参照画像バッファ309、DCT/量子化部310、逆量子化/IDCT部311、加算器312、復号画像保存バッファ313、エントロピー符号化器314、出力バッファ315、2つの減算器316,317から構成される。
入力画像保存バッファ301は、入力された映像情報を保持し、制御部302からMB番号を受け取ると、そのMB番号のMB画像を出力する。出力された画像の一方は、参照画像バッファ309から送られる予測画像との差分を取った予測残差画像となり、スイッチA307とコスト計算部304に送られる。そして、出力された画像のもう一方は、逆量子化/IDCT部311から送られた残差の復号画像と加算され、復号画像となって復号画像保存バッファ313に格納される。
制御部302は、処理開始信号を受け取ると、最初の符号化MB番号を入力画像保存バッファ301と動き補償予測部303と参照画像バッファ309とに送る。以降は動き補償予測部303から制御信号が送られる度に、次の符号化対象MB番号を入力画像保存バッファ301と動き補償予測部303と参照画像バッファ309とに送る。
動き補償予測部303は、制御部302から最初のMB番号を受け取ると、保持している最小コストcost_min を十分大きな値で初期化する。また、スイッチA307とスイッチB308とに制御信号を送り、この2つのスイッチをOFFにする。MB番号を受信すると、そのMB番号のMBの探索ベクトルを順番に生成し、コスト計算部304からのコストを受信するたびに、その順番に従って探索ベクトルを減算器317と参照画像バッファ309とベクトル情報保存バッファ305とに出力する。その一方で、受信したコストが保持しているcost_min よりも小さい場合には、cost_min を受信したコストの値で更新し、その時点での動きベクトルをV_min に代入して保持する。全ての探索ベクトルの生成が終了すると、その時点で保持していたV_min を動きベクトルとして、減算器317と参照画像バッファ309とベクトル情報保存バッファ305とに送信する。その後、制御信号をスイッチA307とスイッチB308とに送り、この2つのスイッチをONに切り換える。これらの処理が終了すると、終了信号を制御部302に送る。
コスト計算部304は、減算器316から送られる予測残差画像の電力Pを計算すると同時に、減算器317から送られる予測残差ベクトルΔVの符号量R(ΔV)をテーブル参照により求め、
cost=P+λ・R
によってコストを算出し、動き補償予測部303に送る。
ベクトル情報保存バッファ305は、動きベクトルが送られる度にバッファに保存するとともに、符号化対象MBの予測ベクトル算出に必要な隣接MBの動きベクトルを予測ベクトル算出部306に送る。
予測ベクトル算出部306は、ベクトル情報保存バッファ305から送られる隣接ブロックのベクトル情報を元に予測ベクトルを算出し、減算器317に送る。
スイッチA307とスイッチB308は、動き補償予測部303から送られる制御信号に従ってスイッチのON/OFFを行う。
参照画像バッファ309は、参照画像を保持するとともに、動き補償予測部303から送られる動きベクトルと制御部302から送られる制御信号とを元に、対応する位置の画像を予測画像として減算器316に送信する。また、1フレーム分の符号化が終わると復号画像保存バッファ313から送られる復号画像を受信し、参照画像を更新する。
DCT/量子化部310は、スイッチA307から送られる予測残差画像にDCTと量子化を施し、エントロピー符号化器314と逆量子化/IDCT部311とに送る。
逆量子化/IDCT部311は、受け取った量子化係数に逆量子化とIDCTを施して残差の復号画像を求め、加算器312に送る。
復号画像保存バッファ313は、加算器312から送られる復号画像を保持し、1フレーム分の復号が終了したら参照画像バッファ309へ送信する。
エントロピー符号化器314は、DCT/量子化部310から送られる量子化係数とスイッチB308から送られるコスト最小となる予測残差ベクトルとを受け取ってエントロピー符号化を施し、出力バッファ315に送る。
出力バッファ315は、符号化情報を保持し、適時ストリームとして送出する。
このような図11に示す装置構成を用いることで、図9および図10に示す処理を実現することができる。
H.264の予測ベクトル:大久保榮,角野眞也,菊池義浩,鈴木輝彦,「H.264/AVC教科書」,インプレス,pp.120(2004) H.264参照ソフトウェア:http://iphome.hhi.de/suehring/tml/download/
前述した従来技術の方法によれば、各MBでは隣接ブロックから求められる予測ベクトルをもとに、コスト関数が最も小さくなる動きベクトルを順次求めることになる。
しかしながら、このようにして求めた動きベクトルは、右、下、左下のMBの動きベクトルに予測ベクトルとして影響を与えるため、1フレーム全体のコスト関数の総和を考えた場合、必ずしも最適な動きベクトルにはならないという問題がある。
一方、最適なベクトルの組み合わせを求めるため、1フレーム全てのMBの全ての探索点の組み合わせを試そうとするとKL 通り(K:探索点数 L:フレーム内の全MB数)もあるため、総当たりで求めるのは演算量の観点から現実的ではない。
本発明はかかる事情に鑑みてなされたものであって、映像を領域分割し、フレーム間予測符号化に従って分割領域の動きベクトルを探索して符号化を行うときに、少ない演算量でもって、符号化効率がより高い動きベクトルを探索することを実現する新たな映像符号化技術の提供を目的とする。
この目的を達成するために、本発明の映像符号化装置は、映像を領域分割し、フレーム間予測符号化に従って分割領域の動きベクトルを探索して符号化を行うときに、(1)1フレームの全分割領域を符号化する符号化処理を予め定めた回数だけ反復させる制御を行う制御手段と、(2)前回の符号化処理で求めた動きベクトル情報を保持する保持手段と、(3)保持手段の保持する動きベクトル情報を用いて、符号化対象分割領域と依存関係がある分割領域の予測残差ベクトルを算出する予測残差ベクトル算出手段と、(4)初回の符号化処理では、予測残差ベクトル算出手段の算出する予測残差ベクトルの符号量を加味しないコスト関数を用いて、動きベクトルの探索に用いるコストを算出し、二回目以降の符号化処理では、その予測残差ベクトルの符号量を加味するコスト関数を用いて、動きベクトルの探索に用いるコストを算出するコスト算出手段と、(5)コスト算出手段の算出したコストを用いて、符号化対象分割領域の動きベクトルを探索する探索手段とを備えるように構成する。
この構成を採るときにあって、コスト算出手段は、初回の符号化処理で用いるコスト関数として、符号化対象分割領域の予測残差電力を用いるか、あるいは、符号化対象分割領域の予測残差電力と符号化対象分割領域の予測残差ベクトルの符号量との線形結合で表されるものを用いることがある。
また、コスト算出手段は、二回目以降の符号化処理で用いるコスト関数として、符号化対象分割領域の予測残差電力と、符号化対象分割領域の予測残差ベクトルの符号量と、符号化対象分割領域と依存関係がある全分割領域の予測残差ベクトルの符号量との線形結合で表されるものを用いることがある。
また、コスト算出手段は、二回目以降の符号化処理で用いるコスト関数として、符号化対象分割領域の予測残差電力と、符号化対象分割領域のオーバーヘッド符号量と、符号化対象分割領域と依存関係がある全分割領域のオーバーヘッド符号化量との線形結合で表されるものを用いることがある。
ここで、以上の各処理手段はコンピュータプログラムでも実現できるものであり、このコンピュータプログラムは、適当なコンピュータ読み取り可能な記録媒体に記録して提供されたり、ネットワークを介して提供され、本発明を実施する際にインストールされてCPUなどの制御手段上で動作することにより本発明を実現することになる。
このように構成される本発明の映像符号化装置では、1フレームの全分割領域を符号化する符号化処理を予め定めた回数だけ反復させるようにして、初回の符号化処理では、符号化対象分割領域と依存関係がある分割領域の予測残差ベクトルの符号量を加味しないコスト関数を用いて、符号化対象分割領域の動きベクトルを探索し、二回目以降の符号化処理では、前回の符号化処理で求めた動きベクトル情報を用いて、符号化対象分割領域と依存関係がある分割領域の予測残差ベクトルを算出して、その予測残差ベクトルの符号量を加味するコスト関数を用いて、符号化対象分割領域の動きベクトルを探索するように処理する。
このように、本発明では、1フレームの全分割領域を符号化する符号化処理を予め定めた回数だけ反復させるようにして、符号化対象分割領域と依存関係がある分割領域の予測残差ベクトルの符号量を加味するコスト関数を用いて、符号化対象分割領域の動きベクトルを探索するという構成を採る。この理由は、以下の通りである。
すなわち、符号化対象分割領域と依存関係がある分割領域で予測ベクトルを生成する場合、符号化対象分割領域の動きベクトルが利用される。しかしながら、従来のコスト関数は、符号化対象分割領域と依存関係がある分割領域の影響を加味していない。
これから、符号化対象分割領域にとってコスト関数が最小となる動きベクトルであっても、次の分割領域の予測ベクトルまで考慮に入れると、必ずしも最適な動きベクトルとは限らない。
そこで、本発明では、符号化対象分割領域と依存関係がある分割領域の予測残差ベクトルの符号量を加味するコスト関数を用いて、符号化対象分割領域の動きベクトルを探索することで、フレーム全体のコストの総和がより小さくなる方向に動きベクトルを修正することで、符号化効率がより高い動きベクトルを求めることを実現するのである。
このことを実現する一つの方法として、全ての分割領域の全ての動きベクトルの組み合わせを試すという方法を用いることが考えられる。
しかしながら、そのような方法を用いると、天文学的な演算量が必要となり、現実的でない。
例えば、3つの分割領域の演算コストで比較するならば、1つの分割領域について、16×16=256点を探索すると仮定する場合、そのような方法を用いると、“256点×256点×256点=16777216点”を探索することになるというように、天文学的な演算量が必要となり、現実的でない。
これに対して、本発明では、符号化処理を例えば5回繰り返すという構成を用いることから、“(256点+256点+256点)×5回=3840点”を探索することになるというように、大幅に少ない演算量でもって、周囲の分割領域の影響を考慮した最適な動きベクトルを求めることができるようになる。
ちなみに、従来手法では、この場合、“256点×3=768点”を探索することになる。
本発明によれば、映像を領域分割し、フレーム間予測符号化に従って分割領域の動きベクトルを探索して符号化を行うときに、符号化順で後方にあたる分割領域のコストも加味したコストで動きベクトルの探索を行うため、フレーム全体のコストの総和がより小さくなる方向に動きベクトルを修正することを実現できる。
更に、符号化処理を反復することによって全画面の分割領域が逐次修正され、符号化効率がより高い動きベクトルを求めることが可能となる。
以下、実施の形態に従って本発明を詳細に説明する。
本発明では、1フレームの全MBの符号化処理を予め定めた回数だけ反復させるようにして、初回の符号化処理では、符号化対象MBと依存関係がある後段のMB(以下、後段MBと称する)の予測残差ベクトル符号量を加味しないコスト関数を用いて動きベクトルを探索し、二回目以降の反復処理では、後段MBの予測残差ベクトル符号量を加味したコスト関数を用いて動きベクトルを探索するようにすることで、1フレーム全体のコスト関数の総和を考慮した最適な動きベクトルを求めるようにする構成を採っている。
H.264では、図1に示す3つのMB(D,E,F)が符号化対象MBと依存関係がある後段MBである。
従来のコスト関数をmode0、後段MBの予測残差ベクトルを加味したコスト関数をmode1とすると、mode1のコストcost_mode1は、図1に示す3つの後段MB(D,E,F)の予測残差ベクトル(ΔVD ,ΔVE ,ΔVF )のコストをmode0のコストcost_mode0に加えた
cost_mode1=cost_mode0+λ・{R(ΔVD ) +R(ΔVE )+R(ΔVF )}
という式で表せる。
ここで、後段MBの動きベクトルには、1フレームの全MBの符号化処理を任意の回数だけ反復処理する際に、1つ前の反復処理で求めた結果を用いることとする。
また、cost_mode0が符号化対象MBの予測ベクトルコストR(ΔV)を使用していない場合には、上式に更にR(ΔV)を加えた
cost_mode1=cost_mode0
+λ・{R(ΔV)+R(ΔVD )+R(ΔVE )+R(ΔVF )}
という式を用いることもできる。
図2に、本発明の実行するフローチャートの一例を示す。
本発明では、1フレーム分の符号化処理に入ると、まず、使用するコスト関数をmode0に設定し、変数nを0で初期化する(S101)。そして、以下に示す処理をN_max 回繰り返す。この回数は2回以上の任意のものでよい。
最初の処理対象MBから順に(S102)、全MBについて以下の処理を行う。まず、符号化対象MBの動きベクトルを求める(S103)。この処理は図10と同じものを用い、その際のコスト関数も従来と同様のものでよい。そして、反復の最後の回でないならば(S104)、この動きベクトルの導出処理をフレーム内の全MBについて行う(S103,S108〜S109)。終わったら、nの値に1加算する(S110)。nがN_max を超えたら終了し、N_max 以下の場合には処理を続ける(S111)。nが1のときは(S112)、コスト関数を後段MBのベクトルコストを加算したmode1に切り換える(S113)。そして、再び最初のMBから(S102)、動きベクトルを求める処理(S103)を繰り返し、その都度nの値を1増やす。
上記の処理(S102〜S113)をN_max 回繰り返した後、再度最初のMBから処理を行う(S102)。その際には、コスト関数がmode1である点を除き、図9に示した従来手法と同様の処理を行う。まず、動きベクトルを導出した後(S103)、反復の最後の回であることを判断することで(S104)、DCT/量子化(S105)、エントロピー符号化処理(S106)、復号画像生成処理(S107)の処理を全MBについて行い(S103〜S109)、処理を終了する。
図3に、本発明の実行するフローチャートの他の一例を示す。
このフローチャートでは、図2のフローチャートのS108の処理に相当するS208の処理で、全MBについて動きベクトルを求めたことを判断すると、nが0であるのか否かを判断して(S210)、nが0であるときには、コスト関数を後段MBのベクトルコストを加算したmode1に切り換え(S211)、nが0でないときには、この切り換えを行わないようにする。そして、nの値に1加算し(S212)、N_max 以下の場合には処理を続ける(S213)、という処理を行うようにしているが、基本的な処理内容は図2のフローチャートと変わることはない。
図4に、図2の処理を実現する本発明を具備する映像符号化装置の一実施形態例を示す。ここで、図中の太い黒枠で示した部分が本発明の適用部分である。
本発明を具備する映像符号化装置は、この図に示すように、入力画像保存バッファ101、反復処理制御部102、動き補償制御部103、動き補償予測部104、広域コスト計算部105、符号化情報保存バッファ106、予測ベクトル算出部107、スイッチA108、スイッチB109、参照画像バッファ110、DCT/量子化部111、逆量子化/IDCT部112、加算器113、復号画像保存バッファ114、スイッチ付きエントロピー符号化器115、出力バッファ116、2つの減算器117,118、後段MB予測残差ベクトル算出部119から構成される。
ここで、図4の動き補償予測部104と図11の動き補償予測部303のように、図4中に示す図11と同名のものは同等の機能を有するものである。
反復処理制御部102は、処理開始信号を受けると、スイッチ付きエントロピー符号化器115に処理停止信号を送るとともに、広域コスト計算部105に制御信号を送り、コスト関数をmode0に切り替える。その後、動き補償制御部103に処理開始信号を送り、符号化を開始する。また、動き補償制御部103から終了信号を受け取ると、まず広域コスト計算部105に制御信号を送り、今度はコスト関数をmode1に切り替える。その後、再度、動き補償制御部103に処理開始信号を送ることで1フレームにつきN_max 回符号化処理を反復させる。N_max 回の処理終了後にスイッチ付きエントロピー符号化器115に符号化開始を合図する制御信号を送り、処理を停止する。
動き補償制御部103は、反復処理制御部102から処理開始信号を受け取ると、最初の符号化MB番号を入力画像保存バッファ101と動き補償予測部104と参照画像バッファ110とに送る。以降は動き補償予測部104から制御信号が送られる度に、次の符号化対象MB番号を入力画像保存バッファ101と動き補償予測部104と参照画像バッファ110に送る。1フレーム分の処理が終わると、反復処理制御部102に終了を合図する制御信号を送る。
符号化情報保存バッファ106は、動きベクトルが送られる度に、その情報を配列に格納する。また、符号化対象MBの予測ベクトル算出に必要な隣接MBの動きベクトルの情報を隣接ベクトル情報として予測ベクトル算出部107に送る。また、符号化対象MBを予測ベクトル生成に用いる後段MBについて、その予測ベクトルの算出に必要な近隣MBの動きベクトルの情報を周囲のベクトル情報として後段MB予測残差ベクトル算出部119に送信する。
後段MB予測残差ベクトル算出部119は、符号化情報保存バッファ106から送信される周囲のベクトル情報を元に、後段MB(図1に示すD〜FのMB)の予測残差ベクトルを求め、広域コスト計算部105に送る。
広域コスト計算部105は、入力された予測残差画像と予測残差ベクトルを元に、コストを計算して動き補償予測部104に送る。コストについては、反復処理制御部102から送られる制御信号によってmode0とmode1の2つの関数を切り替える。
スイッチ付きエントロピー符号化器115は、反復処理制御部102から符号化開始信号を受信すると、DCT/量子化部111から送られる量子化係数と、スイッチB109から送られるコスト最小となる予測残差ベクトルとを受け取ってエントロピー符号化を施し、出力バッファ116に送る。
このような装置構成に従って、本発明を具備する映像符号化装置は、図2に示す処理を実現することになる。
次に、本発明の実施例について説明する。
本実施例では、コスト関数のmode0については、予測残差画像のSAD(絶対値誤差和)で計算し、コスト関数のmode1については、予測残差画像のSADに符号化対象MBおよび後段MBのベクトルコストを加味した
cost_mode1=SAD
+λ・{R(ΔV)+R(ΔVD )+R(ΔVE )+R(ΔVF )}
で計算する例を示す。
本実施例のフローチャートは図2に示す通りであり、この図2のフローチャートのS103で実行する動きベクトル導出処理については、図10のフローチャートに示す通りである。
但し、図10のフローチャートのS407で実行するコスト算出の処理において、初回の符号化処理では、
cost_mode0=SAD
でコストを算出して動き探索を行い、二回目以降の符号化処理では、
cost_mode1=SAD
+λ・{R(ΔV)+R(ΔVD )+R(ΔVE )+R(ΔVF )}
でコストを算出して動き探索を行うことになる。
図5に、この処理を実現する本発明を具備する映像符号化装置の一実施例を示す。
この処理を実現するための装置では、この図に示すように、入力画像保存バッファ201、復号画像保存バッファ202、DCT/量子化部203、逆量子化/IDCT部204、スイッチ付きエントロピー符号化器205、出力バッファ206、参照画像バッファ207、動き補償予測部208、動き補償制御部209、反復処理制御部210、SAD計算部211、ベクトルコスト計算部212、予測ベクトル算出部213、符号化情報保存バッファ214、後段MB予測残差ベクトル算出部215、スイッチA216、スイッチB217、スイッチC218、2つの加算器219,220、2つの減算器221、222から構成される。
ここで、図4の動き補償予測部104と図5の動き補償予測部208のように、図5中に示す図4と同名のものは同等の機能を有するものである。
SAD計算部211は、予測残差のSADを計算して加算器220に出力する。
ベクトルコスト計算部212は、符号化対象MBの予測残差ベクトルのコストと、符号化対象MBの動きベクトルを予測ベクトルに利用する後段MBの予測残差ベクトルのコストとの総和
λ・{R(ΔV)+R(ΔVD )+R(ΔVE )+R(ΔVF )}
を計算し、スイッチC218に出力する。
スイッチC218は、反復処理制御部210から送られる制御信号に従ってON/OFFする。制御信号がmode0を示す場合はOFFに、mode1を示す場合はONとする。
加算器220は、SAD計算部211から送られるSADとスイッチC218から送られるベクトルコストの総和とを加算し、コストとして動き補償予測部208へと送る。
この装置構成に従い、動き補償予測部208は、初回の符号化処理では、スイッチC218がOFFすることで、
cost_mode0=SAD
で算出されるコストを用いて動き探索を行い、二回目以降の符号化処理では、スイッチC218がONすることで、
cost_mode1=SAD
+λ・{R(ΔV)+R(ΔVD )+R(ΔVE )+R(ΔVF )}
で算出されるコストを用いて動き探索を行うように動作する。
このようにして、このような装置構成を用いることで、図2および図10に示す処理を実現することができる。
最後に、本発明の有効性を検証するために行った実験結果について説明する。
この実験は、ITUの標準動画像(“Calligraphy Practice ”)を用いて行った。画像サイズは720×480で、フレーム数は450で、探索はフルサーチ(探索範囲は±16×16)で行い、動き補償ブロックサイズは16×16のみとし、量子化パラメータは24,30,36で固定とし、最初のフレームのみイントラ符号化し、反復回数は初回を含めて合計3回で行った。
図6に、従来手法と対比させた形で1フレーム当たりのコスト関数の合計値の実験結果を示し、図7に、従来手法と対比させた形でPSNRの実験結果を示す。
ここで、図6に示す1回目、2回目、3回目は反復回数を示すものであり、1回目は、符号化対象ブロックと依存関係があるブロックの予測残差ベクトルの符号量を加味しないコスト関数
cost_mode0=SAD
を用いて動きベクトルを探索したときの実験データを示し、2回目、3回目は、その予測残差ベクトルの符号量を加味したコスト関数
cost_mode1=SAD
+λ・{R(ΔV)+R(ΔVD )+R(ΔVE )+R(ΔVF )}
を用いて動きベクトルを探索したときの実験データを示す。
なお、本発明では、
cost_mode0=SAD
や、
cost_mode1=SAD
+λ・{R(ΔV)+R(ΔVD )+R(ΔVE )+R(ΔVF )}
という符号化効率を示す指標とは関係のない指標を用いて動きベクトルを探索しているが、その探索結果に基づいて求められた動きベクトルを用いる場合の符号化効率は、
SAD+λ・R(ΔV)
という計算式で求められるので、図6に示す実験データでは、この計算式に従って符号化効率を求めて従来手法と比較している。
また、図7中に示す本発明の実験データは、合計3回反復させたときに得られた実験データである。
これらの実験結果から、本発明の有効性を確認することができた。
なお、この実験データでは示していないが、初回の符号化処理で、符号化対象ブロックの予測残差ベクトルを考慮しないコスト関数を用いて動きベクトルを探索した方がより符号量を削減できることを確認できた。
すなわち、初回の符号化処理で、
cost_mode0=SAD+λ・R(ΔV)
というコスト関数を用いるよりも、
cost_mode0=SAD
というコスト関数を用いて動きベクトルを探索した方がより符号量を削減できることを確認できた。
符号化対象マクロブロックと依存関係がある後段マクロブロックの説明図である。 本発明の実行するフローチャートの一例である。 本発明の実行するフローチャートの他の一例である。 本発明の映像符号化装置の一実施形態例である。 本発明の映像符号化装置の一実施例である。 本発明の有効性を検証するために行った実験結果の説明図である。 本発明の有効性を検証するために行った実験結果の説明図である。 予測ベクトルの生成に用いられるマクロブロックの説明図である。 従来の符号化処理の実行するフローチャートである。 従来の動きベクトル導出処理のフローチャートである。 従来の映像符号化装置の装置構成図である。
符号の説明
101 入力画像保存バッファ
102 反復処理制御部
103 動き補償制御部
104 動き補償予測部
105 広域コスト計算部
106 符号化情報保存バッファ
107 予測ベクトル算出部
108 スイッチA
109 スイッチB
110 参照画像バッファ
111 DCT/量子化部
112 逆量子化/IDCT部
113 加算器
114 復号画像保存バッファ
115 スイッチ付きエントロピー符号化器
116 出力バッファ
117 減算器
118 減算器
119 後段MB予測残差ベクトル算出部

Claims (10)

  1. 映像を領域分割し、フレーム間予測符号化に従って分割領域の動きベクトルを探索して符号化を行う映像符号化方法であって、
    1フレームの全分割領域を符号化する符号化処理を予め定めた回数だけ反復させる過程と、
    初回の符号化処理において、符号化対象分割領域と依存関係がある分割領域の予測残差ベクトルの符号量を加味しないコスト関数を用いて、符号化対象分割領域の動きベクトルを探索する過程と、
    二回目以降の符号化処理において、前回の符号化処理で求めた動きベクトル情報を用いて、符号化対象分割領域と依存関係がある分割領域の予測残差ベクトルを算出して、その予測残差ベクトルの符号量を加味するコスト関数を用いて、符号化対象分割領域の動きベクトルを探索する過程とを備えることを、
    特徴とする映像符号化方法。
  2. 請求項1に記載の映像符号化方法において、
    前記初回の符号化処理を行う過程では、コスト関数として、符号化対象分割領域の予測残差電力を用いるか、あるいは、符号化対象分割領域の予測残差電力と符号化対象分割領域の予測残差ベクトルの符号量との線形結合で表されるものを用いることを、
    特徴とする映像符号化方法。
  3. 請求項1に記載の映像符号化方法において、
    前記二回目以降の符号化処理を行う過程では、コスト関数として、符号化対象分割領域の予測残差電力と、符号化対象分割領域の予測残差ベクトルの符号量と、符号化対象分割領域と依存関係がある全分割領域の予測残差ベクトルの符号量との線形結合で表されるものを用いることを、
    特徴とする映像符号化方法。
  4. 請求項1に記載の映像符号化方法において、
    前記二回目以降の符号化処理を行う過程では、コスト関数として、符号化対象分割領域の予測残差電力と、符号化対象分割領域のオーバーヘッド符号量と、符号化対象分割領域と依存関係がある全分割領域のオーバーヘッド符号化量との線形結合で表されるものを用いることを、
    特徴とする映像符号化方法。
  5. 映像を領域分割し、フレーム間予測符号化に従って分割領域の動きベクトルを探索して符号化を行う映像符号化装置であって、
    1フレームの全分割領域を符号化する符号化処理を予め定めた回数だけ反復させる制御を行う制御手段と、
    前回の符号化処理で求めた動きベクトル情報を保持する保持手段と、
    前記保持手段の保持する動きベクトル情報を用いて、符号化対象分割領域と依存関係がある分割領域の予測残差ベクトルを算出する予測残差ベクトル算出手段と、
    初回の符号化処理では、前記予測残差ベクトル算出手段の算出する予測残差ベクトルの符号量を加味しないコスト関数を用いて、動きベクトルの探索に用いるコストを算出し、二回目以降の符号化処理では、その予測残差ベクトルの符号量を加味するコスト関数を用いて、動きベクトルの探索に用いるコストを算出するコスト算出手段と、
    前記コスト算出手段の算出したコストを用いて、符号化対象分割領域の動きベクトルを探索する探索手段とを備えることを、
    特徴とする映像符号化装置。
  6. 請求項5に記載の映像符号化装置において、
    前記コスト算出手段は、初回の符号化処理で用いるコスト関数として、符号化対象分割領域の予測残差電力を用いるか、あるいは、符号化対象分割領域の予測残差電力と符号化対象分割領域の予測残差ベクトルの符号量との線形結合で表されるものを用いることを、
    特徴とする映像符号化装置。
  7. 請求項5に記載の映像符号化装置において、
    前記コスト算出手段は、二回目以降の符号化処理で用いるコスト関数として、符号化対象分割領域の予測残差電力と、符号化対象分割領域の予測残差ベクトルの符号量と、符号化対象分割領域と依存関係がある全分割領域の予測残差ベクトルの符号量との線形結合で表されるものを用いることを、
    特徴とする映像符号化装置。
  8. 請求項5に記載の映像符号化装置において、
    前記コスト算出手段は、二回目以降の符号化処理で用いるコスト関数として、符号化対象分割領域の予測残差電力と、符号化対象分割領域のオーバーヘッド符号量と、符号化対象分割領域と依存関係がある全分割領域のオーバーヘッド符号化量との線形結合で表されるものを用いることを、
    特徴とする映像符号化装置。
  9. 請求項5ないし8のいずれか1項に記載の映像符号化装置の実現に用いられる処理をコンピュータに実行させるための映像符号化プログラム。
  10. 請求項5ないし8のいずれか1項に記載の映像符号化装置の実現に用いられる処理をコンピュータに実行させるための映像符号化プログラムを記録したコンピュータ読み取り可能な記録媒体。
JP2006287060A 2006-10-23 2006-10-23 映像符号化方法、映像符号化装置、映像符号化プログラムおよびそのプログラムを記録したコンピュータ読み取り可能な記録媒体 Expired - Fee Related JP4563981B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006287060A JP4563981B2 (ja) 2006-10-23 2006-10-23 映像符号化方法、映像符号化装置、映像符号化プログラムおよびそのプログラムを記録したコンピュータ読み取り可能な記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006287060A JP4563981B2 (ja) 2006-10-23 2006-10-23 映像符号化方法、映像符号化装置、映像符号化プログラムおよびそのプログラムを記録したコンピュータ読み取り可能な記録媒体

Publications (2)

Publication Number Publication Date
JP2008104124A JP2008104124A (ja) 2008-05-01
JP4563981B2 true JP4563981B2 (ja) 2010-10-20

Family

ID=39438081

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006287060A Expired - Fee Related JP4563981B2 (ja) 2006-10-23 2006-10-23 映像符号化方法、映像符号化装置、映像符号化プログラムおよびそのプログラムを記録したコンピュータ読み取り可能な記録媒体

Country Status (1)

Country Link
JP (1) JP4563981B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112738521B (zh) * 2020-12-03 2022-07-01 深圳万兴软件有限公司 视频编码方法和装置、电子设备、存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005073291A (ja) * 1997-12-25 2005-03-17 Mitsubishi Electric Corp 動き補償装置
JP2006025430A (ja) * 2004-07-06 2006-01-26 Thomson Licensing 符号化モードを選択する方法及び装置
JP2006074474A (ja) * 2004-09-02 2006-03-16 Toshiba Corp 動画像符号化装置、動画像符号化方法および動画像符号化プログラム
JP2007036725A (ja) * 2005-07-27 2007-02-08 Toshiba Corp 符号化装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005073291A (ja) * 1997-12-25 2005-03-17 Mitsubishi Electric Corp 動き補償装置
JP2006025430A (ja) * 2004-07-06 2006-01-26 Thomson Licensing 符号化モードを選択する方法及び装置
JP2006074474A (ja) * 2004-09-02 2006-03-16 Toshiba Corp 動画像符号化装置、動画像符号化方法および動画像符号化プログラム
JP2007036725A (ja) * 2005-07-27 2007-02-08 Toshiba Corp 符号化装置

Also Published As

Publication number Publication date
JP2008104124A (ja) 2008-05-01

Similar Documents

Publication Publication Date Title
JP5234587B2 (ja) 映像符号化方法及び復号方法、それらの装置、及びそれらのプログラム並びにプログラムを記録した記憶媒体
JP4937741B2 (ja) 映像符号化方法及び装置、映像復号方法及び装置、それらのプログラムおよびそれらプログラムを記録した記録媒体
JP4898467B2 (ja) 可変ブロックサイズ動き予測のための符号化モードの決定方法及び装置
JP2009094828A (ja) 画像符号化装置及び画像符号化方法、画像復号化装置及び画像復号化方法
KR20090095012A (ko) 연속적인 움직임 추정을 이용한 영상 부호화, 복호화 방법및 장치
KR20060127155A (ko) 화상 정보 부호화 장치 및 화상 정보 부호화 방법
JP5400798B2 (ja) 動画像復号化方法及び装置、動画像符号化方法及び装置
KR20100027384A (ko) 예측 모드 결정 방법 및 장치
US20090016443A1 (en) Inter mode determination method for video encoding
US20090028241A1 (en) Device and method of coding moving image and device and method of decoding moving image
WO2012121234A1 (ja) 映像符号化装置、映像符号化方法および映像符号化プログラム
WO2019189904A1 (ja) イントラ予測装置、画像符号化装置、画像復号装置、及びプログラム
US8792549B2 (en) Decoder-derived geometric transformations for motion compensated inter prediction
JP2006295408A (ja) 画像符号化装置及び画像符号化プログラム
JP2015211386A (ja) 動画像符号化装置、動画像符号化方法及び動画像符号化用コンピュータプログラム
JP4563981B2 (ja) 映像符号化方法、映像符号化装置、映像符号化プログラムおよびそのプログラムを記録したコンピュータ読み取り可能な記録媒体
JP2009049969A (ja) 動画像符号化装置及び方法並びに動画像復号化装置及び方法
JP2013121044A (ja) 画像符号化装置及び画像符号化方法
CN105338365A (zh) 视频编码方法和视频编码装置
WO2019150435A1 (ja) 映像符号化装置、映像符号化方法、映像復号装置、映像復号方法、及び映像符号化システム
KR100801974B1 (ko) 저비용 움직임 추정 장치 및 움직임 추정 방법
KR100790757B1 (ko) H.264 동영상 부호화기의 적응적 고속 움직임 추정 방법
KR101841352B1 (ko) 참조 프레임 선택 방법 및 그 장치
JP2006237765A (ja) 画像符号化装置
JP5592295B2 (ja) 画像符号化方法,画像符号化装置,画像復号方法,画像復号装置およびそれらのプログラム

Legal Events

Date Code Title Description
RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20080529

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090115

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20100331

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20100721

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100727

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100729

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130806

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130806

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130806

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130806

Year of fee payment: 3

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees