JP5832263B2 - 画像符号化装置及び画像符号化方法 - Google Patents

画像符号化装置及び画像符号化方法 Download PDF

Info

Publication number
JP5832263B2
JP5832263B2 JP2011267674A JP2011267674A JP5832263B2 JP 5832263 B2 JP5832263 B2 JP 5832263B2 JP 2011267674 A JP2011267674 A JP 2011267674A JP 2011267674 A JP2011267674 A JP 2011267674A JP 5832263 B2 JP5832263 B2 JP 5832263B2
Authority
JP
Japan
Prior art keywords
size
block
image
prediction
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2011267674A
Other languages
English (en)
Other versions
JP2013121044A (ja
Inventor
昌史 高橋
昌史 高橋
信博 知原
信博 知原
山口 宗明
宗明 山口
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Kokusai Electric Inc
Original Assignee
Hitachi Kokusai Electric Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Kokusai Electric Inc filed Critical Hitachi Kokusai Electric Inc
Priority to JP2011267674A priority Critical patent/JP5832263B2/ja
Publication of JP2013121044A publication Critical patent/JP2013121044A/ja
Application granted granted Critical
Publication of JP5832263B2 publication Critical patent/JP5832263B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

本発明は、動画像を符号化する画像符号化技術に関する。
大容量の動画像情報をデジタルデータ化して記録及び伝達する手法として、MPEG(Moving Picture Experts Group)方式等の符号化方式が策定され、MPEG−1規格、MPEG−2規格、MPEG−4規格、H.264/AVC(Advanced Video Coding)規格等として国際標準の符号化方式となっている。これらの方式は、デジタル衛星放送やDVD、Blu−ray、携帯電話、デジタルカメラ、地上デジタル放送などにおける映像コンテンツの符号化方式として採用され、現在ますます利用の範囲が広がり、身近なものとなってきている。
これらの規格では、符号化処理が完了した画像情報(復号画像)を利用して符号化対象画像をブロック単位で予測し、原画像との差分(予測差分)を符号化することによって、動画像の持つ冗長性を排除して符号量を減らしている。具体的には、上記予測差分に対して周波数変換方式の一種であるDCT(Discrete Cosine Transform)を施し、その係数を量子化する。
特開2010−283495号公報 特開2009−055236号公報 特開2008−283402号公報
ハイブリッドビデオ符号化において、予測差分に対して施すDCTのサイズを画像の性質に合わせて切り替えることにより符号化効率を大幅に改善することができるが、その評価のために一度すべてのサイズで仮符号化を行うと処理量が大きくなるといった問題があった。
特許文献1では、ブロックサイズの選択のために、各ブロックの分散値の累積(和)を評価値とすることが記載されている。また、特許文献2には、各ブロックサイズにおけるブロックの分散値の総和を発生量とし、発生符号量に応じてブロックを選択することが記載されている。さらに、特許文献3には、サブブロックの総和の分散値を計算してブロックサイズを決定することが記載されている。
これら特許文献1〜特許文献3は、各ブロックに含まれる画素の分散を計算して評価値としている。しかし、特に、低〜中程度のビットレートにおけるビデオ符号化では、低周波成分の扱いが重要となるものの、画素の分散による評価では、低周波成分についての評価とならない問題があった。
本発明の目的は、周波数変換を施す際のブロックサイズを決定する際に、画素の平均値の変動を評価することによって、情報が集中する低周波領域に注目し、画像を構成する主要成分となる低周波成分を多く残し、高周波成分を大幅に削除することにより、画質劣化を抑えて符号量を大きく削減するようにしたものである。
特に、最新の規格であるH.264では、画面間予測を行った後の予測差分に対して施すDCTのサイズを画像の性質に合わせて2種類の中から選択することにより、符号化効率を大きく改善した。その切り替えは符号化処理の最小単位となるマクロブロック単位で行われるが、その判定のために一度両方のサイズで符号化すると処理量が大きくなるといった問題があった。本発明は、少ない処理量で適切なブロックサイズを決定する手段を提供する。
上記の目的を達成するため、本発明の画像符号化装置は、入力される原画像をマクロブロックに分割するブロック分割部、前記マクロブロック毎に画面内予測を行う画面内予測部、前記マクロブロック毎に画面間予測を行う画面間予測部、前記マクロブロック毎に画面内予測または画面間予測を切り替えて予測差分を行う予測差分部、前記予測差分に対して周波数変換を行う周波数変換部、及び、周波数変換するブロックサイズを決定する周波数変換サイズ決定部を有し、前記原画像を符号化する画像符号化装置であって、前記周波数変換サイズ決定部は、前記周波数変換するブロックサイズを前記マクロブロックのブロックサイズとするか若しくは前記マクロブロックサイズについてさらに分割した小ブロックサイズとするかを小ブロックの画素平均(原画像若しくは予測画像)の変動に基づいて決定することを第1の特徴とする。
上記本発明の第1の特徴の画像符号化装置において、前記周波数変換サイズ決定部は、前記マクロブロックと前記小ブロックサイズのどちらを用いるかを決定するときに、前記マクロブロック内での前記小ブロックサイズの画素平均の変動が小さい場合には前記マクロブロックのブロックサイズを選択し、前記画素平均の変動が大きい場合には前記小ブロックサイズを選択することを第2の特徴とする。
また、本発明の画像符号化方法は、入力される原画像をマクロブロックに分割し、前記マクロブロック毎に画面内予測または画面間予測を行い、前記マクロブロック毎に画面内予測または画面間予測を切り替えて予測差分を行い、前記周波数変換するブロックサイズを前記マクロブロックのブロックサイズとするか若しくは前記マクロブロックサイズについてさらに分割した小ブロックサイズとするかを小ブロックの画素平均(原画像若しくは予測画像)の変動に基づいて決定し、前記予測差分に対して周波数変換を行い、前記原画像を符号化することを第3の特徴とする。
本発明によれば、少ない符号量で高画質の画像を提供するための画像符号化技術を提供することができる。
本発明の動画像符号化装置の一実施例の構成を示すブロック図である。 本発明の動画像符号化装置の一実施例の構成を示すブロック図である。 本発明に用いる動画像符号化処理に関する概念的な説明図である。 本発明に用いる画面間予測処理に関する概念的な説明図である。 図4の部分図である。 本発明の動画像符号化処理において、周波数変換を行うまでの処理に関する概念的な説明図である。 本発明の動画像符号化処理の一実施例におけるブロックサイズの決定方法の一例を説明するための図である。 本発明の動画像符号化処理の一実施例におけるブロックサイズ決定処理の一例のフローチャートである。
本発明の画像符号化装置及び画像符号化方法は、ブロック内の画素変動に基づいてDCT処理を施すブロックサイズを決定する。
大きなブロックサイズでDCTを施した場合には、画像の空間方向の相関性が低下して画質が低下する傾向があるため、一般的に、空間方向の相関が高く画素値変動の小さい領域に対して有利に働く。
一方、小さなブロックサイズでDCTを施した場合には、一般的に、発生符号量が大きい代わりに画像を忠実に再現できるが、空間方向の相関が高い領域では冗長である。そのため、空間方向の相関が低く画素値変動の大きい領域に対して有利に働く。
本発明の画像符号化装置及び画像符号化方法では、この性質を利用し、ブロック内画素の変動が大きいほど小さなブロックサイズを選択する。例えばH.264/AVCでは、符号化処理が完了した画像情報を利用して符号化対象画像を予測し、原画像との予測差分を符号化することによって、動画像の持つ冗長性を減らして符号量を削減している。予測差分を符号化する際には、まず周波数変換の1種であるDCT(Discrete Cosine Transform)を施し、各係数値を量子化して可変長符号化を行う。ここでは、動画像の局所的性質を利用するために、画像を細かく分割したブロック単位で予測が行われる。このとき、好ましくは、大ブロックを複数の小ブロックに分割した場合に、小ブロック間の変動が大きければ小ブロックサイズを選択し、小ブロック間の変動が小さければ大ブロックサイズを選択するという処理を階層的に行うことにより、効果的である。
以下、本発明の実施例を、図面を参照して説明する。
例えば、図3は画面間予測時のブロック形状について、その表現方法を示している。図3は、本発明に用いる動画像符号化処理に関する概念的な説明図であり、H.264/AVCにおけるブロックの形状情報の符号化方法の一例を説明する図である。また、図4は、本発明に用いる画面間予測処理に関する概念的な説明図であり、画面間予測処理の動作について概念的に示している。図5は、図4の部分図で、対象ブロック404、予測画像405及び予測差分画像407の部分を抽出した図である。
図3に示すように、符号化処理は、対象画像に対してラスタースキャンの順序(矢印301参照)に従い、16×16画素で構成される符号化対象マクロブロック302を1単位として実行される。符号化対象画像の予測には、大別して、画面間予測と画面内予測があり、マクロブロック毎に両者を切り替えて利用することができる。
図4及び図5に示すように、画面間予測を行う際には、符号化対象画像403と同じ映像401に含まれる符号化済みの(既符号化)画像の復号画像を参照画像402とし、対象画像403中の対象ブロック404と相関の高いブロック(予測画像)405を参照画像402中から探索(動き探索)する。このとき、符号化対象画像403と予測画像405に対して画素ごとに差分値を差分器408で計算し、該計算によって取得される予測差分画像407加えて、予測に必要なヘッダ情報として、両ブロックの座標値の差分として表される動きベクトル406を符号化する。
一方、復号化の際には上記の逆の手順を行えばよく、復号化された予測差分を参照画像中のブロック(予測画像)405に加算することにより、復号化画像を取得することができる。
図6は、画面内(インター)予測を行った後の予測差分に対して、DCTを施すブロックサイズを決定する処理の流れについて、概念的に示している。H.264/AVCでは、インター予測を行った場合に限り、予測差分に対して施すDCTのブロックサイズを、4×4と8×8の2種類から選択することができる。
図6は、対象マクロブロック501と予測画像502を減算器503で減算した結果として取得される予測差分画像に対して、DCTを施し、8×8のブロックサイズの画像504か、4×4のブロックサイズの画像505のどちらかを選択することができることを示している。
従って、ここでは、対象マクロブロック501と予測画像502を減算器503で減算した結果として取得される予測差分画像に、8×8のブロックサイズでDCTを施すのか、それとも4×4のブロックサイズでDCTを施すのかを決定する。
どちらを選択するかを決定するためには、一度両方のブロックサイズでDCTを施して符号化を行い、発生符号量と画質の劣化度合いを計測して、良い方を選択するのが一般的であった。しかしこの場合、ブロックサイズの候補数(H.264/AVCの場合は、8×8のブロックサイズか4×4のブロックサイズの2種類)について符号化処理を行うことが必要となり、処理量が膨大になるといった問題があった。特に、今後新しい規格などでブロックサイズの種類が増えた場合には、この問題がさらに深刻化する。このため、上記のような仮符号化処理を行わなくてもブロックサイズを決定できるような、処理量の低い方式を開発することが求められていた。
図6の画像504と505によって、DCTを施すブロックサイズと、それぞれの特徴について簡単に説明する。ビデオ符号化において、DCTは、画像(ここでは、予測差分画像)を周波数成分に分解するために利用される。例えば、周波数成分に分解した場合には、画像の情報は、画像を構成する主要成分となる低周波領域に集中する。このため、低周波成分を多く残し高周波成分を大幅に削除することにより、画質劣化を抑えて符号量を大きく削減することができる。この際、最も周波数の低い成分(DC成分)に大半の情報が集まる傾向があり、この成分の扱い方が画質と符号量のトレードオフを決定する大きな要因となる。
即ち、8×8画素のような大きなブロックサイズでDCTを施した場合(画像504参照)には、情報量の大きいDC成分の絶対数が小さくなる。このため、符号量が小さくなる傾向がある。しかし、空間方向の相関性の低下に起因して発生する高周波成分の喪失により、画像がぼやけやすい。
一方、4×4画素のような小さなブロックサイズでDCTを施した場合(画像505参照)には、きめ細かな変換により画像の忠実度を高く保つことができる反面、DC成分の絶対数が大きくなる。このため、符号量が大きくなる傾向にある。
以上の性質を考慮して、画像の特徴からDCTを施すブロックサイズを一意に決定することができれば、候補となるすべてのブロックサイズで仮符号化を行う場合に比べて、大幅に処理量が低減できる。
上述のように、大きなブロックサイズでDCTを施した場合に画質が劣化する原因は、画像の空間方向の相関性が低下するためである。そのため、空間方向の相関が高い領域、すなわち画素変動が小さい場合には、概して大きなブロックサイズが有利に働く。一方、小さなブロックサイズでDCTを施した場合に符号量が増える理由は、主に、DC成分のような低周波成分の増加である。
これにより、画像の主要成分となるDC成分を忠実に再現することが可能になるという利点が生じる。しかし、空間方向の相関が高い領域では、その周波数分布が隣接するブロックのものと類似しているため上記のような処理は冗長であり、利点の効果が小さくなりうまく働かない。そのため、空間方向の相関性が低い領域、即ち画素値変動が大きい場合には、概して小さなブロックサイズが有利に働く。
従って、本発明では、符号化対象領域における画素変動に基づいて評価値を計算し、ブロックのサイズの決定に利用する。例えば、大ブロックに含まれるすべての小ブロックに対して計算した画素平均(小ブロックにおけるDC成分に相当)の分散値を評価値とすることにより、DC成分の変動に応じた評価を可能とする。
本実施例では、DCTの対象となる予測差分画像を用いて評価値を計算する方法の一例を説明する。この結果、DCTの対象となる画像に対して評価を行うため、精度の高い選択が可能となる。
図7によって、本実施例におけるブロックサイズの決定方法の一実施例について説明する。図7は、周波数変換を施すブロックサイズの決定方法に関して説明するための図である。
(1)まず初めに、対象マクロブロックの予測差分画像700に対して、4×4画素のブロックサイズによる16分割(ブロック番号n=1,2,・・・,16)を行い、各ブロック内画素の平均値AVEnを計算する。
(2)続いて、同じ予測差分画像に対して8×8画素のブロックサイズによる4分割(ブロック記号m=A,B,C,D)を行い、各ブロック(m=A(A∋n=1,2,3,4)、m=B(B∋n=5,6,7,8)、m=C(C∋n=9,10,11,12)、m=D(D∋n=13,14,15,16))に含まれる4×4ブロックの平均値AVEnに対して分散ACTAVE_mを式(1)によって計算する。
(3)最後に、これら4個の分散を足し合わせて、評価値Evalとし、この評価値Evalが、閾値T以上なら4×4画素のブロックサイズを選択し、それ以外なら8×8画素のブロックサイズを選択し、DCTを施す。
Figure 0005832263
上述の実施例では、候補となるブロックサイズを4×4画素と8×8画素の2種類としている。しかし、今後規格の改定などにより候補の数が増加した場合には、上記処理を階層的に行えば良い。
図8は、候補となるマクロブロックのブロックサイズの種類がk種類である場合に最適なサイズを決定する処理手順である。ここで、kは、2以上の整数である。
即ち、ステップS801では、候補となるブロックサイズをSIZE(n=1,2,・・・,k)に分割する(ただし、SIZEn−1<SIZE)。
ステップS802では、まず評価のためのパラメータT(n=2,・・・,k)を設定する。
次に、ステップS803では、nに2を代入する(n=2)。
続いて、ステップS804〜ステップS808では、nがk+1に等しくなるまで、以下の処理を行う。
即ち、ステップS804では、nがk+1に等しいか否かを判定する。nがk+1に等しくなければ(n≠k+1ならば)ステップS805の処理に進み、nがk+1に等しければ(n=k+1ならば)ステップS809の処理に進む。
ステップS805では、SIZEn−1で分割したブロック単位でブロック内に存在する画素の平均値を計算する。
続いて、ステップS806では、SIZEブロック単位で上記平均値の分散値を計算する。
さらに、ステップS807では、その分散値をすべてのSIZEブロックに対して足し合わせて評価値Evalを算出する。
そして、ステップS808では、kに1を足し合わせ(k=k+1)、ステップS804の処理に戻る。
nがkと等しくなると、ステップS809に進み、ステップS809では、tn−Eval(n=2,・・・,k)がすべて負の値になるかどうかを判定し、負であればステップS810の処理に進み、負でなければステップS811の処理に進む。
ステップS810では、nを1とする(n=1を選択する)。即ち、SIZEブロック単位でDCTを施すと決定する。
一方、正となるものが含まれていれば、ステップS810に進み、ステップS810では、この値を最大とするnを選択する。即ち、SIZEブロック単位でDCTを施すと決定する。
以上の処理を全て終了すれば、ステップS812において、ブロックサイズ決定処理を終了する。
パラメータTの値は定数でも良いが、予測差分の出現パターンは量子化パラメータ(QP)の値に大きく依存する。このため、パラメータTの値を、QPに依存した値に設定するとさらに効果的である。また、パラメータTの値を、解像度や符号化モード(単方向予測、双方向予測などの予測方法や、予測を行う際のブロックサイズ)などに応じて決定しても良い。また、本実施例では図7で説明した評価方法を用いているが、ブロック内画素の平均値や重み付き平均などの変動に基づくものならどのような評価式を用いても良い。
図1は、本発明の動画像符号化装置の一実施例の構成を示すブロック図である。
図1の動画像符号化装置100は、入力された原画像101の符号化画像を符号化ストリームとして出力する。
動画像符号化装置100は、入力された原画像101を保持する入力画像メモリ102と、入力画像を小領域(マクロブロック)に分割するブロック分割部103と、マクロブロック単位で画像間の動きを計算する動き探索部104と、マクロブロック単位で画面内予測を行う画面内予測部105と、動き探索部104にて検出された動き量をもとにマクロブロック単位で画面間予測を行う画面間予測部106と、画像の性質に合った予測モード(予測手段およびブロックサイズ)を決定するモード選択部107と、予測差分を生成するための減算部108と、予測差分画像を用いて周波数変換を施すブロックサイズを決定する周波数変換サイズ決定部109と、予測差分に対して符号化を行う周波数変換部110及び量子化処理部111と、符号の発生確率に応じた適応的符号化を行うための可変長符号化部112と、一度符号化した予測差分を復号化するための逆量子化処理部113及び逆周波数変換部114と、復号化された予測差分を用いて復号化画像を生成するための加算部115と、復号化画像を保持して後の予測に活用するための参照画像メモリ116を有する。
図1において、動画像符号化装置100は、原画像101を入力する。
入力画像メモリ102は、入力された原画像101の中の一枚の画像を符号化対象画像として保持し、ブロック分割部103に出力する。ブロック分割部103は、入力された画像を細かなブロックに分割し、動き探索部104、画面内予測部105、画面間予測部106、及び減算部108に出力する。
動き探索部104は、参照画像メモリ116に格納されている復号化済み画像を用いて該当ブロックの動き量を計算し、その動きベクトルを画面間予測部106に出力する。
画面内予測部105は、周辺ブロックの復号化済み画像を用いた画面内予測処理を複数のブロックサイズで実行し、モード選択部107に出力する。また、画面間予測部106は、符号化済みの別画像を参照した画面間予測処理を複数のブロックサイズで実行し、モード選択部107に出力する。
モード選択部107は、画面内予測部105及び画面間予測部106から入力された複数のブロックサイズで実行された画面内予測処理及び画面間予測処理の結果から最適な予測モードを選択し、予測画像を減算部108、加算部115、及び可変長符号化部112に出力する。また、モード選択部107は、予測情報(どの予測モードを用いたかや、動きベクトルなど)を可変長符号化部112に出力する。
続いて、減算部108は、ブロック分割部103から出力された対象ブロックの原画像と、モード選択部107で選択されたモードにて作成された予測画像との差分(予測差分)を生成し、周波数変換サイズ決定部109及び周波数変換部110に出力する。
周波数変換サイズ決定部109は、図8のフローチャートによって説明した方法で周波数変換を施すブロックサイズを決定し、決定したブロックサイズを周波数変換部110に出力する。
周波数変換部110及び量子化処理部111は、それぞれ、減算部108から入力された予測差分に対して、指定された大きさのブロックサイズを1単位としてDCTなどの周波数変換及び量子化処理を行い、可変長符号化部112及び逆量子化部113に出力する。
可変長符号化処理部112は、量子化済み周波数変換係数とヘッダ情報を、符号の発生確率に基づいて符号化し、符号化ストリームを生成して出力する。モード選択部107から入力された予測情報は、符号化されてヘッダ情報に含まれる。
逆量子化処理部113及び逆周波数変換部114は、量子化後の周波数変換係数に対して、それぞれ逆量子化及び逆DCTなどの逆周波数変換を施して、予測差分を取得して加算部115に出力する。続いて、加算部115は、モード選択部107からの予測画像と、復号化済み予測差分を加算して復号化画像を生成し、参照画像メモリ116に出力する。
参照画像メモリ116は、入力された復号化画像を格納し、格納された復号化画像を要求に応じて、動き検索部104、画面内予測部105、または画面間予測部106に出力する。
上述の実施例1は、1つの大ブロック(マクロブロック:符号化対象領域)を複数の小ブロックに分割し、当該小ブロックに対して計算した画素平均(小ブロックにおけるDC成分に相当)の分散値を評価値とすることにより、DC成分の変動に応じた評価を可能とする。この結果、小ブロック間の変動が所定の値より大きければ、小ブロックサイズでDCTを施し、小ブロック間の変動が所定の値未満であれば、大ブロックサイズでDCTを施す。この結果、少ない処理量で適切なブロックサイズを決定する手段を提供し、画質劣化を抑えて符号量を大きく削減することができる。
本実施例では、原画像を用いて評価値を計算する方法の一例を示す。すでに説明した通り、予測差分の出現パターンは、QPに大きく依存する。このため、実施例1で説明したパラメータTnもまたQPに大きく依存したものになる傾向がある。
この場合、符号化ストリームの符号量を所望のビットレートに合わせるようにQPを制御する符号化レート制御を行うなど、画面内でQPが大きく変化する場合には、パラメータの値の選定が困難化し易い。そのため、原画像を用いて評価を行うことにより、どのようなQPでも安定した結果が得られる。
なおこの場合、予測差分画像の代わりに原画像を用いる以外は実施例1と同様の方法で評価を行うため、図7の本実施例におけるブロックサイズの決定方法の一実施例についての説明、及び図8の候補となるブロックサイズの種類がk種類である場合に最適なサイズを決定する処理手順の説明を省略する。
図2は、本発明の動画像符号化装置の一実施例の構成を示すブロック図である。図1と同一の符号番号を付した構成機器は、図1と同一の機能を有する構成機器を用いているので、説明を省略した箇所がある。即ち、図2の動画像符号化装置200は、ブロック分割部103の出力を図1における構成に対して、ブロック分割部203が、入力された画像を細かなブロックに分割した結果を、分割した動き探索部104、画面内予測部105、画面間予測部106、及び減算部108に出力するのに加えて、周波数変換サイズ決定部109にも出力したものである。即ち、図2の動画像符号化装置200は、減算器108の出力データを周波数変換サイズ決定部109に入力せず、ブロック分割部103の出力データを周波数変換サイズ決定部109に入力するようにしたものである。
図2の動画像符号化装置200は、入力された原画像101の符号化画像を符号化ストリームとして出力する。
図2において、入力画像メモリ102、動き探索部105、画面内予測部105、画面間予測部106、モード選択部107、及び参照画像メモリ116の動作は図2と同一である。また、ブロック分割部103は、図1と同一の処理(入力された画像を細かなブロックに分割)を実行し、動き探索部104、画面内予測部105、画面間予測部106、減算部108、及び周波数変換サイズ決定部109に出力する。
周波数変換部110、量子化処理部111、逆量子化処理部113、逆周波数変換部114、加算部115、及び、可変長符号化部112は、図1と同一の処理を実行する。
実施例1と実施例2では、予測および周波数変換をブロック単位で行っている。しかし、それ以外にも、例えば、画像の背景から分離したオブジェクト単位で算出しても良い。
また、周波数変換の一例としてDCTを挙げているが、DST(Discrete Sine Transformation:離散サイン変換)、WT(Wavelet Transformation:ウェーブレット変換)、DFT(Discrete Fourier Transformation:離散フーリエ変換)、KLT(Karhunen-Loeve Transformation:カルーネン−レーブ変換)など、画素間相関除去に利用する直交変換ならどのようなものでも構わない。
また、本実施例では、画面間予測を行った後の周波数変換について述べているが、画面内予測を行った後の周波数変換において本発明利用しても良い。さらに、原画像に対して直接周波数変換を施しても構わない。
また、本発明は、動画像符号化方式H.264/AVCだけでなく、静止画像符号化方式(例えば、JPEG2000、及び、今後策定されるであろう次世代標準など、どのような画像符号化方式にも適用可能である。
実施例2によれば、QPに依存せず、安定した画像符号処理が可能で、少ない処理量で適切なブロックサイズを決定する手段を提供し、画質劣化を抑えて符号量を大きく削減することができる。
100、200:動画像符号化装置、 101:原画像、 102:入力画像メモリ、 103:ブロック分割部、 104:動き探索部、 105:画面内予測部、 106:画面間予測部、 107:モード選択部、 108:減算部、 109:周波数変換サイズ決定部、 110:周波数変換部、 111:量子化処理部、 112:可変長符号化部、 113:逆量子化部、 114:逆周波数変換部、 115:加算部、 116:参照画像メモリ、 301:ラスタースキャンの順序、 302:符号化対象マクロブロック、 401:符号化対象画像403と同じ映像、 402:参照画像、 403:符号化対象画像、 404:対象ブロック、 405:予測画像、 406:動きベクトル、 407:予測差分画像、 501:対象マクロブロック、 502:予測画像、 503:減算器、 504:8×8のブロックサイズの画像、 505;4×4のブロックサイズの画像、 700:予測差分画像。

Claims (3)

  1. 入力される原画像をマクロブロックに分割するブロック分割部、前記マクロブロック毎に画面内予測を行う画面内予測部、前記マクロブロック毎に画面間予測を行う画面間予測部、前記マクロブロック毎に画面内予測または画面間予測を切り替えて予測差分を行う予測差分部、前記予測差分に対して周波数変換を行う周波数変換部、及び、周波数変換するブロックサイズを決定する周波数変換サイズ決定部を有し、前記原画像を符号化する画像符号化装置であって、
    前記周波数変換サイズ決定部は、前記周波数変換するブロックサイズを、前記マクロブロックを分割した複数の小ブロックから構成される中ブロックのサイズである第1のサイズとするか、若しくは前記小ブロックのサイズである第2のサイズとするかを決定するものであって、前記原画像若しくは前記予測差分の画像を構成する前記小ブロックの画素平均の前記マクロブロック内における変動が小さい場合には前記第1のサイズを選択し、前記変動が大きい場合には前記第2のサイズを選択するものであり、前記変動の大きさは、前記第1のサイズを有する複数の中ブロックのそれぞれにおいて、前記小ブロックの画素平均の分散を計算し、前記複数の中ブロックの分散を足し合わせたもので表されることを特徴とする画像符号化装置。
  2. 前記小ブロックは前記マクロブロックを16個に分割したものであり、前記第のサイズは前記小ブロック4個分であり、前記変動が小さい場合と前記変動が大きい場合を分ける閾値は、量子化パラメータに依存した値に設定することを特徴とする請求項1記載の画像符号化装置。
  3. 入力される原画像をマクロブロックに分割し、前記マクロブロック毎に画面内予測または画面間予測を行い、前記マクロブロック毎に画面内予測または画面間予測を切り替えて予測差分を行い、前記予測差分に対して周波数変換を行い、前記原画像を符号化する画像符号化方法であって、
    前記周波数変換するブロックサイズを、前記マクロブロックを分割した複数の小ブロックから構成される中ブロックのサイズである第1のサイズとするか、若しくは前記小ブロックのサイズである第2のサイズとするか決定するときに、前記小ブロックの画素平均の前記マクロブロック内における変動が小さい場合には前記第1のサイズを選択し、前記変動が大きい場合には前記第2のサイズを選択するものであり、前記変動の大きさは、前記第1のサイズを有する複数の中ブロックのそれぞれにおいて、前記小ブロックの画素平均の分散を計算し、前記複数の中ブロックの分散を足し合わせたもので表されることを特徴とする画像符号化方法。
JP2011267674A 2011-12-07 2011-12-07 画像符号化装置及び画像符号化方法 Active JP5832263B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2011267674A JP5832263B2 (ja) 2011-12-07 2011-12-07 画像符号化装置及び画像符号化方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011267674A JP5832263B2 (ja) 2011-12-07 2011-12-07 画像符号化装置及び画像符号化方法

Publications (2)

Publication Number Publication Date
JP2013121044A JP2013121044A (ja) 2013-06-17
JP5832263B2 true JP5832263B2 (ja) 2015-12-16

Family

ID=48773500

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011267674A Active JP5832263B2 (ja) 2011-12-07 2011-12-07 画像符号化装置及び画像符号化方法

Country Status (1)

Country Link
JP (1) JP5832263B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101737861B1 (ko) * 2014-01-20 2017-05-19 한국전자통신연구원 변환 깊이 기반 dct 사이즈 결정 장치 및 방법
JP6459761B2 (ja) * 2015-05-01 2019-01-30 富士通株式会社 動画像符号化装置、動画像符号化方法及び動画像符号化用コンピュータプログラム
WO2018185881A1 (ja) * 2017-04-05 2018-10-11 オリンパス株式会社 相関値演算装置

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08223578A (ja) * 1995-02-13 1996-08-30 Nippon Telegr & Teleph Corp <Ntt> 動きベクトル探索方法および装置
US6633611B2 (en) * 1997-04-24 2003-10-14 Mitsubishi Denki Kabushiki Kaisha Method and apparatus for region-based moving image encoding and decoding
US7630563B2 (en) * 2001-07-19 2009-12-08 Qualcomm Incorporated System and method for decoding digital image and audio data in a lossless manner
JP2007110568A (ja) * 2005-10-14 2007-04-26 Matsushita Electric Ind Co Ltd 画像符号化装置
JP2007243427A (ja) * 2006-03-07 2007-09-20 Nippon Hoso Kyokai <Nhk> 符号化装置及び復号化装置
JP5236332B2 (ja) * 2008-03-28 2013-07-17 アイベックステクノロジー株式会社 符号化装置、符号化方法および符号化プログラム
JP4937224B2 (ja) * 2008-09-30 2012-05-23 株式会社東芝 画像符号化装置

Also Published As

Publication number Publication date
JP2013121044A (ja) 2013-06-17

Similar Documents

Publication Publication Date Title
JP5277257B2 (ja) 動画像復号化方法および動画像符号化方法
CN107396117B (zh) 视频编码和解码方法及非暂时性计算机可读存储介质
JP5061179B2 (ja) 照明変化補償動き予測符号化および復号化方法とその装置
JP2009111691A (ja) 画像符号化装置及び符号化方法、画像復号化装置及び復号化方法
US9210435B2 (en) Video encoding method and apparatus for estimating a code amount based on bit string length and symbol occurrence frequency
EP2522142A2 (en) Data compression for video
JP2006140758A (ja) 動画像符号化方法、動画像符号化装置および動画像符号化プログラム
JP2009094828A (ja) 画像符号化装置及び画像符号化方法、画像復号化装置及び画像復号化方法
WO2010067529A1 (ja) 動画像復号化方法及び装置、動画像符号化方法及び装置
JP5613319B2 (ja) 映像符号化装置、映像符号化方法および映像符号化プログラム
US20090028241A1 (en) Device and method of coding moving image and device and method of decoding moving image
JP2007013298A (ja) 画像符号化装置
JP2013115583A (ja) 動画像符号化装置及びその制御方法並びにプログラム
JP2020005294A (ja) 処理方法
JP5832263B2 (ja) 画像符号化装置及び画像符号化方法
WO2016116984A1 (ja) 動画像符号化装置、動画像符号化方法および動画像符号化プログラム
JP2009049969A (ja) 動画像符号化装置及び方法並びに動画像復号化装置及び方法
JP5887012B2 (ja) 画像復号化方法
JP5358485B2 (ja) 画像符号化装置
KR101610029B1 (ko) 가변 크기 블록 매칭 기반의 모션 추정 방법 및 이를 이용한 비디오 인코딩 장치
JP5887013B2 (ja) 画像復号化方法
JP5891333B2 (ja) 画像復号化方法
JP4561701B2 (ja) 動画像符号化装置
JP5422681B2 (ja) 画像復号化方法
JP2010166275A (ja) 画像符号化装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20140930

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20150413

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150421

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150618

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150707

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150902

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20150929

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20151027

R150 Certificate of patent or registration of utility model

Ref document number: 5832263

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250