JP2007513566A - 動画符号化方法及び装置 - Google Patents

動画符号化方法及び装置 Download PDF

Info

Publication number
JP2007513566A
JP2007513566A JP2006542495A JP2006542495A JP2007513566A JP 2007513566 A JP2007513566 A JP 2007513566A JP 2006542495 A JP2006542495 A JP 2006542495A JP 2006542495 A JP2006542495 A JP 2006542495A JP 2007513566 A JP2007513566 A JP 2007513566A
Authority
JP
Japan
Prior art keywords
block
encoding
mode
predetermined
determined
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2006542495A
Other languages
English (en)
Inventor
ジョン,ビョン−ウー
リー,ジェ−ユン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Samsung Electronics Co Ltd
Original Assignee
Samsung Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from KR1020040006651A external-priority patent/KR20050053297A/ko
Application filed by Samsung Electronics Co Ltd filed Critical Samsung Electronics Co Ltd
Publication of JP2007513566A publication Critical patent/JP2007513566A/ja
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/132Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/107Selection of coding mode or of prediction mode between spatial and temporal predictive coding, e.g. picture refresh
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/147Data rate or code amount at the encoder output according to rate distortion criteria
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本発明は、動画符号化時に符号化モードを速く決定し、その符号化モード下で動画を符号化する方法及び装置を提供する。
本発明に係る映像符号化方法は、(a)映像の符号化に使用される複数の符号化モードのうち、映像を構成する所定大きさのブロックが、所定の第1モードに対応する条件を満足するか否かを判断するステップと、(b)所定の条件を満足する場合には、第1モードをブロックの符号化モードと決定するステップとを含むことを特徴とする。これにより、画質の大きな低下なしに映像の符号化を迅速に行える。

Description

本発明は、動画符号化に係り、さらに詳細には、動画符号化時に符号化モードを速く決定し、その符号化モード下で動画を符号化する方法及び装置に関する。
動画の圧縮に関するH.264標準によって動画を符号化するためには、一つのピクチャをマクロブロックに分ける。そして、それぞれのマクロブロックをインタープリディクションでの全ての符号化モード及びイントラプリディクションでの全ての符号化モードで符号化した後に、マクロブロックの符号化に所要されるビット率及び元のマクロブロックと復号化されたマクロブロックとの歪曲程度によって符号化モードを一つ決めて符号化する。
インターモードは、現在ピクチャのマクロブロックを符号化するために、参照ピクチャから選択された一つまたは複数のブロックの位置を表す動きベクトルの情報と画素値との差を符号化するインタープリディクションで使用されるモードである。H.264標準では、参照ピクチャを最大5個まで有しうるので、参照ピクチャを保存したフレームメモリ内で参照ピクチャを検索して、現在マクロブロックが参照するブロックを探す。フレームメモリに保存される参照ピクチャは、現在ピクチャを基準に過去ピクチャまたは未来ピクチャとなりうる。
イントラモードは、現在ピクチャのマクロブロックを符号化するために参照ピクチャを参照するのではなく、符号化しようとするマクロブロックと空間的に隣接した画素値を利用して、符号化しようとするマクロブロックについての予測値を計算した後、この予測値と画素値との差を符号化するイントラプリディクションで使用されるモードである。
ところが、インターモードでは、マクロブロックをどのように分けるかによって非常に多くのモードが存在し、イントラモードでは、予測方向によって多様なモードが存在する。したがって、このような全てのモードのうち最適のモードを決定することは、映像符号化性能の決定に重要なものである。このために、通常的には可能な全てのモードに対して、それぞれ率−歪曲コスト(Rate−Distortion Cost:RDcost)を計算して、その値の最小であるモードを符号化モードとして選択する。しかし、この過程は、映像の符号化に時間及びコストが非常に多くかかるという問題点がある。
したがって、本発明が解決しようとする技術的課題は、符号化モードの決定に当たって、所定の順序に応じて符号化モードの決定過程を行うことによって、符号化モードを速く決定して動画を符号化する方法及び装置を提供することである。
前記技術的課題は、本発明によって、映像の符号化方法において、(a)前記映像の符号化に使用される複数の符号化モードのうち、前記映像を構成する所定大きさのブロックが、所定の第1モードに対応する条件を満足するか否かを判断するステップと、(b)前記所定の条件を満足する場合には、前記第1モードを前記ブロックの符号化モードと決定するステップとを含むことを特徴とする符号化方法により達成される。
また、前記技術的課題は、映像の符号化方法において、(a)前記映像を構成する現在ピクチャでの所定大きさのブロックに対して、インターモード下で参照ピクチャの参照ブロックとの時間的類似度を計算するステップと、(b)前記計算された時間的類似度及び、前記ブロックと前記現在ピクチャから隣接したブロックとの空間的類似度の差によって、イントラモード下での符号化過程を省略するか否かを決定するステップと、を含むことを特徴とする符号化方法によっても達成される。
また、前記技術的課題は、前述した映像符号化のための装置によっても達成される。
また、前記技術的課題は、前述した映像符号化のための方法を行うプログラムが具現されたコンピュータで読み取り可能な媒体によっても達成される。
以下、添付された図面を参照して本発明の望ましい実施例について詳細に説明する。
本発明に係る符号化装置は、動画データを符号化する。動画データは、時間軸上に配列される複数のピクチャから構成され、ピクチャは、複数のブロックから構成される。ブロックは、マクロブロック、マクロブロックを垂直または水平方向に二分割または四分割して得られたサブブロックを含む。マクロブロックの分割については、図2を参照して後述する。
図1は、本発明の望ましい実施例に係る符号化装置のブロック図である。
符号化装置は、動き推定部102、動き補償部104、イントラプリディクション実行部106、変換部108、量子化部110、再配列部112、エントロピーコーディング部114、逆量子化部116、逆変還部118、フィルタ120及びフレームメモリ122を備える。
符号化装置は、多様な符号化モードから選択された一つの符号化モード下で、現在ピクチャのマクロブロックに対して符号化を行う。このために、前述したインタープリディクション及びイントラプリディクションが有しうる全てのモード下で符号化を行って、RDcostを計算して、その値が最小であるモードを最適モードとして決めて、そのモード下で符号化を行う。RDcostについては後述する。しかし、本発明の符号化モードの決定方法で最適のモードを決定することは、RDcostの計算だけでなく、多様な方法によって行える。
インタープリディクションのために、現在ピクチャのマクロブロックの予測値を参照ピクチャで探すことは、動き推定部102で行われる。そして、動き補償部104は、1/2画素または1/4画素単位で参照ブロックが探された場合には、これら中間画素値を計算して参照ブロックデータ値を決定する。このようにインタープリディクションは、動き推定部102及び動き補償部104で行われる。
また、現在ピクチャのマクロブロックの予測値を現在ピクチャ内で探すイントラプリディクションが、イントラプリディクション実行部106で行われる。現在マクロブロックに対してインタープリディクションを行うか、またはイントラプリディクションを行うかは、全ての符号化モード下でのRDcostを計算して、その値が最小であるモードを前記ブロックの符号化モードとして決定して、マクロブロックに対する符号化を行う。
前述したように、インタープリディクションまたはイントラプリディクションが実行されて、現在フレームのマクロブロックが参照する予測データが探されたならば、これを現在ピクチャのマクロブロックから引いて、変換部108で変換を行った後に、量子化部110で量子化を行う。現在フレームのマクロブロックから動き推定された参照ブロックを引いたものを残差というが、符号化時のデータ量を減らすために、残差値を符号化することである。量子化された残差値は、エントロピーコーディング部114でエンコーディングするために再配列部112を経る。
一方、インタープリディクションに使用される参照ピクチャを得るために、量子化されたピクチャを逆量子化部116及び逆変還部118を経て、現在ピクチャを復元する。このように復元された現在ピクチャは、フレームメモリに保存されて、次のピクチャに対するインタープリディクションの実行に使用される。復元されたピクチャがフィルタ120を通過すれば、本来のピクチャで若干の符号化エラーを含むピクチャとなる。
図2は、インタープリディクション時にマクロブロックが有しうる可変ブロックを示す図である。
H.264でのインタープリディクションで、一つの16×16マクロブロックは、16×16、16×8、8×16、または8×8ブロックに分けられ、それぞれの8×8ブロックは、さらに小さな単位の8×4、4×8、4×4ブロックに分けられうる。このように分けられたそれぞれのサブブロックに対して動き推定及び補償が実行されて、動きベクトルが決まる。このような多様な種類の可変ブロックを使用してインタープリディクションを行えば、映像の特性及び動きによって効果的に符号化を行える。
図3は、符号化を行う現在ピクチャのそれぞれのマクロブロックに割当てられたブロック状の一例を示す図である。図3に示すように、映像の動きが少なく、物体が大きい場合には、大きいブロックを使用し、映像の動きが複雑であり、物体が小さい場合には、小さいブロックを使用してインタープリディクションを行うように、可変ブロックの大きさが割当てられるということが分かる。
したがって、一つのマクロブロックが有しうるサブブロックの種類は非常に多い。前述したように、一つのマクロブロックが16×8、8×16、8×8に分けられ、それぞれの8×8ブロックは、8×4、4×8、4×4ブロックにさらに小さく分けられ得るので、一つのマクロブロックが有しうるモードの種類は、16×16、16×8、8×16、8×8の4種類と、それぞれの8×8ブロックが4種類の場合が存在するので、(4×4×4×4−1)=255種類で、全て4+255=259種類のモードが存在する。したがって、インタープリディクションでは、全て259種類のブロック状に対してRDcostを計算して一つのモードを決定せねばならないので、計算量が非常に多い。
図4は、予測しようとする輝度(luminance:luma)ブロックP及び予測に使用される隣接ブロックを示す図である。
イントラプリディクションは、輝度及び色度に対してそれぞれ実行される。あるブロックがイントラモードでエンコーディングされていれば、予測しようとするブロックP410は、そのブロックに隣接したデコーディングされたブロックAな〜Lを利用して予測される。予測は、輝度ブロックだけでなく、色度(U信号、V信号)ブロックに対しても実行される。輝度予測ブロックP410は、複数の4x4ブロックから構成された16x16ブロックである。ここで、aないしpは、予測しようとする4x4ブロックであり、A、B、C、D及びI、J、K、Lは、予測に使用されるブロックである。
イントラプリディクションは、予測しようとするブロックの大きさによって、4x4予測及び16x16予測の2種類がある。そして、予測する方向によって、4x4予測には9種類のモードがあり、16x16予測には4種類のモードがある。4x4予測モードは、予測しようとする4x4ブロックに隣接したブロックA、B、C、D及びI、J、K、Lの画素値を利用して予測サンプルを求めるときの予測方向によって分けられる。
さらに具体的には、4x4イントラ輝度予測モードは、verticalモード、horizontalモード、DCモード、diagonal_down_leftモード、diagonal_down_rightモード、vertical_rightモード、horizontal_downモード、vertical_upモード、horizontal_upモードがある。そして、16x16イントラ輝度予測モードは、verticalモード、horizontalモード、DCモード、planeモードの全部4種類がある。したがって、これらの多様なモードでのRDcostを計算せねばならないので、インタープリディクションと同様に、計算量が非常に多い。
図5Aないし図5Bは、予測動きベクトル(Predicted Motion Vector;PMV)の計算を説明するための図である。
図5Aを参照して説明するに、現在マクロブロックCは、隣接マクロブロックの動きベクトルと相互類似している確率が高い。したがって、現在マクロブロックCの動きベクトルを、Cと隣接したマクロブロックであるA、B、Dの動きベクトルを利用して推測する。推測する一例としては、A、B、Dマクロブロックの動きベクトルの中間値が取れる。このように推測された動きベクトルをPMVとし、符号化時には実際動きベクトルでPMVを引いて符号化する。
図5Bに示すように、もし、現在ブロックC’のブロックの大きさと、隣接マクロブロックの分割されたブロックの大きさとが相異なる場合には、隣接マクロブロックの分割されたいずれのブロックを隣接ブロックとして決定するかが問題となる。このときには、現在ブロックの上側と隣接したブロックでは、最左側に位置するブロックであるA’ブロックを、そして、現在ブロックの上側の最右側の画素と右上側に対角線に隣接したブロックであるB’ブロックを、また、現在ブロックの左側と隣接したブロックでは、最上側に存在するブロックであるD’ブロックを選択する。このように選択されたブロックA’、B’、D’の動きベクトルを利用して、PMVを計算する。
H.264符号化時には、前述したインタープリディクションから選択された一つのモード及びイントラプリディクションから選択された一つのモードのうち、何れか一つのモードを選択して予測を行う。何なるモードを選択して予測を行うかによって、H.264の圧縮効率が変わるが、最も良好なモードを選択するために、全てのモードを適用してブロックの予測を行い、RDcostを計算する。
図6は、RDcostの計算を説明するための図である。
率(Rate;R)は、ビット率を意味するものであって、一つのマクロブロックの符号化に使用されるビット数を表す。したがって、率は、インタープリディクションまたはイントラプリディクションが実行された後の残差信号が変換及び量子化部610を経て、可変長コーディング部620を通過して得られたビット数と、動きベクトル情報が可変長コーディング部620を経たときのビット数、及び参照ピクチャ情報が可変長コーディング部620を経たときのビット数を全て合算した値である。一方、歪曲(Distortion;D)は、符号化が実行された映像を復号化したときの本来のマクロブロックと、デコーディングされたマクロブロックとの差である。したがって、歪曲Dは、逆量子化及び逆変還部630を経て本来のマクロブロックが復元されれば分かる値である。このように得られた率及び歪曲を有し、RDcost計算部640でRDcostが次の式(1)によって計算される。
Figure 2007513566
式(1)でDistortionは、現在マクロブロックとエンコーディングされて、デコーディングされて復元された該マクロブロックとの画素値の差を意味し、次の式(2)によって計算される。そして、Rateは、前述した方法により計算されたビット率を意味する。
Figure 2007513566
式(2)で、B(k,l)及びB’(k,l)は、それぞれ現在マクロブロック及び復元されたマクロブロックの(k,l)番目の画素値を表す。λの一例は、次の式(3)のような式によって決定され得る。
Figure 2007513566
式(3)で、QPは、0ないし51の整数であって、H.264量子化値である。Rateは、現在マクロブロックの符号化に所要されたビット数である。
図7は、符号化モードを決定する方法のフローチャートである。
現在ブロックを入力されれば、そのブロックをスキップモードとして決定できるかを優先的にチェックする。スキップモードは、符号化しようとするブロックの符号化モード情報のみを伝送または保存するモードである。映像の背景部分などでは、現在ピクチャの与えられたブロックが、参照ピクチャの該当ブロックと画素値が同じである確率が高く、この場合には、残差信号や動きベクトル情報のように、別途の符号化されたデータの伝送または保存の必要なしに、符号化モード情報のみを伝送するか、または保存すればよいためである。スキップモードとして決定できるかを検査するために、現在ブロックに対して動き推定を行い、参照ピクチャを決定する(S705)。そして、現在ブロックがスキップモード条件を満足するか否かを判断する(S710)。スキップモードとして決定されるためには、次の四つの場合を全て満足せねばならない。
(1)インタープリディクションに使用されるブロックの大きさが16x16であり、(2)現在ブロックの符号化に使用される参照ピクチャが、フレームメモリに保存された参照ピクチャのうち現在ピクチャと時間的に最も近いピクチャであり、(3)動きベクトルが(0,0)であるか、またはPMVと同じであり、(4)現在ブロックと参照ピクチャのブロックとの画素値の差である残差値を変換及び量子化した後の値が0である場合である。
または、次の3つの場合を全て満足せねばならない。(1)インタープリディクションに使用されるブロックの大きさが8x8であり、(2)現在ブロックの符号化に使用される参照ピクチャ及び動きベクトルが、現在ブロックの空間的または時間的な隣接ブロックの参照ピクチャ及び動きベクトル情報から推定したものと同じであり、(3)現在ブロックと参照ピクチャのブロックとの画素値の差である残差値を変換及び量子化した後の値が0である場合である。
前述したスキップ条件を全て満足すれば、そのブロックは、スキップモードとして決定され、他のモードとなる可能性についてチェックせずに終了する(S720)。
前述したスキップ条件を満足せねば、インタープリディクションで有しうる他のモード下でインタープリディクションを行って、そのうち一つのインターモードを決定した後、その決定されたインターモード下で符号化を行うときのビット数を計算する(S725)。このとき、可能な全てのモードを対象とせずに、必要に応じて一部のモードを含むグループのうち何れか一つのインターモードを決定してもよい。このようにして、平均レート(Average Rate;AR)を計算する。平均レートARは、次の式(4)によって計算され、1画素当りのレートを表す。既にインタープリディクションが実行されたので、Rateは、既に知っている値である。
Figure 2007513566
そして、平均境界エラー(Average Boundary Error;ABE)を計算する(S730)。
図8Aないし図8Bは、平均境界エラーABEの計算を説明するための図である。
平均境界エラーABEを計算するために、次の式(5)によって、境界エラーの総和(Sum of Boundary Error;SBE)を計算する。その後、1画素当りの平均境界エラーABEを計算する。
Figure 2007513566
ここで、Yorg、Uorg、Vorgは、符号化される現在マクロブロックの画素値を意味し、YRec、URec、VRecは、復号化された隣接マクロブロックの画素値を意味する。図8Aに示すように、また(x,y)は、輝度ブロックの画素座標値を、(cx,cy)は、色度ブロックの画素座標値を表す。
図8Bに示す第1場合では、復号化された隣接したマクロブロックが存在しないので、前述した式(5)によって平均境界エラーABEを計算できない。したがって、この場合には、ABE=0と決定する。第2の場合のように、左側の隣接ブロックが存在しない場合には、前述した式(5)は、次の式(6)の通りである。
Figure 2007513566

第3の場合のように、上側の隣接ブロックが存在しない場合には、前述した式(5)は、次の式(7)の通りである。
Figure 2007513566
第4の場合は、既に説明した式(5)によって平均境界エラーを求めうる。
このように計算された平均レートARと平均境界エラーABEとを比較する(S735)。平均レートと平均境界エラーABEとは、それぞれ時間的類似度及び空間的類似度を計算する一実施例である。もし、平均境界エラーABEが平均レートARより大きければ、イントラモードよりはインターモードと決定される確率が高いということを意味する。したがって、マクロブロックをS725で決定されたインターモードと決定して終了する(S750)。もし、平均境界エラーABEが平均レートARより大きくなければ、イントラモードのうち一つのモードを選択する(S740)。最後に、このように決まったイントラモード及び既に決まったインターモードのうち何れか一つのモードを選択して、マクロブロックの符号化モードを決定する(S745)。
時間的類似度を決定するさらに他の実施例は、現在ピクチャでのマクロブロックと、インターモード下で参照ピクチャの参照ブロックとの画素値の差を利用することである。この差は、現在マクロブロックを構成する各画素値と、各画素位置に該当する参照ピクチャの参照ブロック内の画素値との差を計算した後、それらの絶対値の和または二乗和を求めた後、所定の比λを乗算することで得られうる。
図9は、本発明の符号化装置を簡略化したブロック図である。
符号化装置は、判断部910、符号化モード決定部920及び符号化実行部930を備える。
判断部910は、映像の符号化に使用される複数の符号化モードのうち、映像を構成する所定大きさのブロックがスキップモードに対応する条件を満足するか否かを判断する。スキップモード条件は、前述した通りである。符号化モード決定部920は、スキップモード条件を満足する場合には、スキップモードを前記ブロックの符号化モードと決定し、満足しない場合には、インタープリディクションまたはイントラプリディクションをさらに行って、その多様な符号化モードのうち何れか一つの符号化モードを前記ブロックの符号化モードと決定する。
符号化実行部930は、符号化モード決定部920で決定された符号化モードによって、圧縮された動画データを生成する。
図10は、本発明の符号化装置の他の一実施例である。
時間的類似度計算部1010は、現在ピクチャでのマクロブロックに対して、インターモード下で参照ピクチャの参照ブロックとの時間的類似度を計算する。
比較部1020は、測定された時間的類似度と、現在ピクチャでのマクロブロックと隣接したブロックとの空間的類似度との差によって、イントラモード下で符号化過程を省略するかを判断する。このようにして、一つの符号化モードを決定する。時間的類似度及び空間的類似度は、前述した平均レート及び平均境界エラーABEに基づいて計算することが望ましい。
時間的類似度を決定するさらに他の実施例は、現在ピクチャでのマクロブロックと、インターモード下で参照ピクチャの参照ブロックとの画素値の差を使用することである。この差は、現在マクロブロックを構成する各画素値と、各画素の位置に該当する参照ピクチャの参照ブロック内の画素値との差を計算した後、それらの絶対値の和または二乗和を求めた後、所定の比λを乗算することで得られる。
符号化実行部1030は、比較部1020で決定された符号化モードによって、圧縮された動画データを生成する。
一方、前述した符号化方法は、コンピュータプログラムで作成可能である。前記プログラムを構成するコード及びコードセグメントは、当業界のコンピュータプログラマーによって容易に推論され得る。また、前記プログラムは、コンピュータで読み取り可能な情報記録媒体に保存され、コンピュータによって読み取られ、かつ実行されることによって符号化方法を具現する。前記情報記録媒体は、磁気記録媒体、光記録媒体、及びキャリアウェーブ媒体を含む。
以上、本発明についてその望ましい実施例を中心に説明した。当業者は、本発明が本発明の本質的な特性から逸脱しない範囲で変形された形態で具現され得るということを理解できる。したがって、開示された実施例は、限定的な観点ではなく、説明的な観点で考慮されねばならない。本発明の範囲は、前述した説明ではなく、特許請求の範囲に示されており、それと同等な範囲内にある全ての差異点は、本発明に含まれたものと解釈されねばならない。
本発明によれば、画質の大きな低下なしに映像の符号化を速く行える。すなわち、SNRの損失は、大きくなく、かつRDcostの計算回数を70%以上減らして、映像の符号化にかかる時間を約30%短縮させ得る。
本発明の望ましい実施例に係る符号化装置のブロック図である。 インタープリディクション時にマクロブロックが有しうる可変ブロックを示す図である。 符号化を行う現在ピクチャのそれぞれのマクロブロックに割当てられたブロック状の一例を示す図である。 予測しようとする輝度ブロックP及び予測に使用される隣接ブロックを示す図である。 PMVの計算を説明するための図である。 PMVの計算を説明するための図である。 RDcostの計算を説明するための図である。 符号化モードを決定する方法を表すフローチャートである。 平均境界エラーABEの計算を説明するための図である。 平均境界エラーABEの計算を説明するための図である。 本発明の符号化装置を簡略化したブロック図である。 本発明の符号化装置の他の一実施例である。

Claims (23)

  1. 映像の符号化方法において、
    (a)前記映像の符号化に使用される複数の符号化モードのうち、前記映像を構成する所定大きさのブロックが、所定の第1モードに対応する条件を満足するか否かを判断するステップと、
    (b)前記所定の条件を満足する場合には、前記第1モードを前記ブロックの符号化モードと決定するステップとを含むことを特徴とする符号化方法。
  2. (c)前記第1モード下で、前記ブロックに対する符号化された動画データを生成するステップをさらに含むことを特徴とする請求項1に記載の符号化方法。
  3. 前記第1モードは
    前記ブロックの符号化モード情報のみを伝送または保存するスキップモードであることを特徴とする請求項1に記載の符号化方法。
  4. 前記第1モードは、H.264でのスキップモードであることを特徴とする請求項3に記載の符号化方法。
  5. 前記所定の条件は、前記所定のブロックの動きの推定に使用されるブロックの大きさが16x16であり、参照ピクチャが、フレームメモリに保存された参照ピクチャのうち、前記所定のブロックが属したピクチャと時間的に最も近いピクチャであり、動きベクトルが(0,0)であるか、または予測動きベクトルと同じであり、前記所定のブロックと参照ピクチャのブロックとの画素値の差を変換して量子化した結果が何れも0であることを特徴とする請求項1に記載の符号化方法。
  6. 前記所定の条件は、前記所定のブロックの動きの推定に使用されるブロックの大きさが8x8であり、第1参照ピクチャ及び第1動きベクトルは、前記ブロックの空間的または時間的隣接ブロックの第2参照ピクチャ及び第2動きベクトル情報から推定したものと同じであり、前記所定のブロックと参照ピクチャの隣接ブロックとの画素値の差を変換して量子化した結果が何れも0であることを特徴とする請求項1に記載の符号化方法。
  7. 映像の符号化方法において、
    (a)前記映像を構成する現在ピクチャでの所定大きさのブロックに対して、インターモード下で参照ピクチャの参照ブロックとの時間的類似度を計算するステップと、
    (b)前記計算された時間的類似度及び、前記ブロックと、前記現在ピクチャから隣接したブロックとの空間的類似度の差によって、イントラモード下での符号化過程を省略するステップとを含むことを特徴とする符号化方法。
  8. 前記時間的類似度は、前記ブロックの符号化に所要されたビット数により決定され、前記空間的類似度は、符号化しようとする現在ピクチャのブロックと隣接したブロックとの画素値の差によって決定されることを特徴とする請求項7に記載の符号化方法。
  9. 前記時間的類似度は、前記ブロックと参照ピクチャの参照ブロックとの画素値の差によって決定され、前記空間的類似度は、符号化しようとする現在ピクチャのブロックと隣接したブロックとの画素値の差によって決定されることを特徴とする請求項7に記載の符号化方法。
  10. 前記空間的類似度は、
    現在符号化しようとするブロック内で、他のブロックとの境界部分に存在する画素と、前記画素と隣接したデコーディングされたブロックの画素との画素値の差を、輝度及び色度別にそれぞれ計算して決定されることを特徴とする請求項8に記載の符号化方法。
  11. 前記時間的類似度は、
    現在ピクチャのブロックと、これに対する参照ブロックとの差値の符号化に所要されたビット数、動きベクトルの符号化に所要されたビット数、及び参照ピクチャ情報の符号化に所要されたビット数を含む情報によって決定されることを特徴とする請求項8に記載の符号化方法。
  12. 映像の符号化に使用される複数の符号化モードのうち、前記映像を構成する所定大きさのブロックが、所定の第1モードに対応する条件を満足するか否かを判断する判断部と、
    前記所定の条件を満足する場合には、前記第1モードを前記ブロックの符号化モードと決定する符号化モード決定部とを備えることを特徴とする符号化装置。
  13. 前記第1モード下で圧縮された動画データを生成する符号化実行部をさらに備えることを特徴とする請求項12に記載の符号化装置。
  14. 前記第1モードは、
    前記ブロックの符号化モード情報のみを伝送または保存するスキップモードであることを特徴とする請求項12に記載の符号化装置。
  15. 前記所定の条件は、前記所定のブロックの動きの推定に使用されるブロックの大きさが16x16であり、参照ピクチャが、フレームメモリに保存された参照ピクチャのうち、前記所定のブロックが属したピクチャと時間的に最も近いピクチャであり、動きベクトルが(0,0)であるか、または予測動きベクトルと同じであり、前記所定のブロックと参照ピクチャのブロックとの画素値の差を変換して量子化した結果が何れも0であることを特徴とする請求項12に記載の符号化装置。
  16. 前記所定の条件は、前記所定のブロックの動きの推定に使用されるブロックの大きさが8x8であり、第1参照ピクチャ及び第1動きベクトルは、前記ブロックの空間的または時間的隣接ブロックの第2参照ピクチャ及び第2動きベクトル情報から推定したものと同じであり、前記所定のブロックと参照ピクチャの隣接ブロックとの画素値の差を変換して量子化した結果が何れも0であることを特徴とする請求項12に記載の符号化装置。
  17. 現在ピクチャでの所定大きさのブロックに対して、インターモード下で参照ピクチャの参照ブロックとの時間的類似度を計算する時間的類似度計算部と、
    前記測定された時間的類似度及び、前記ブロックと前記現在ピクチャから隣接したブロックとの空間的類似度の差によって、イントラモード下での符号化過程を省略して一つの符号化モードを定める比較部とを備えることを特徴とする符号化装置。
  18. 前記決まった符号化モード下で圧縮された動画データを生成する符号化実行部をさらに備えることを特徴とする請求項17に記載の符号化装置。
  19. 前記時間的類似度は、前記ブロックの符号化に所要されたビット数により決定され、前記空間的類似度は、符号化しようとする前記所定ブロックと、それに隣接したブロックとの画素値の差によって決定されることを特徴とする請求項17に記載の符号化装置。
  20. 前記時間的類似度は、前記ブロックと参照ピクチャの参照ブロックとの画素値の差によって決定され、前記空間的類似度は、符号化しようとする前記所定ブロックと、それに隣接したブロックとの画素値の差によって決定されることを特徴とする請求項17に記載の符号化装置。
  21. 前記空間的類似度は、
    現在符号化しようとする所定ブロック内で、他のブロックとの境界部分に存在する画素と、前記画素と隣接したデコーディングされたブロックの画素との画素値の差を、輝度及び色度別にそれぞれ計算して決定されることを特徴とする請求項19に記載の符号化装置。
  22. 前記時間的類似度は、
    現在ピクチャのブロックと、これに対する参照ブロックとの差値の符号化に所要されたビット数、動きベクトルの符号化に所要されたビット数、及び参照ピクチャ情報の符号化に所要されたビット数を含む情報によって決定されることを特徴とする請求項19に記載の符号化装置。
  23. 映像の符号化方法を行うプログラムが具現されたコンピュータで読み取り可能な媒体において、前記映像符号化方法は、
    (a)前記映像の符号化に使用される複数の符号化モードのうち、前記映像を構成する所定大きさのブロックが、所定の第1モードに対応する条件を満足するか否かを判断するステップと、
    (b)前記所定の条件を満足する場合には、前記第1モードを前記ブロックの符号化モードと決定するステップとを含むことを特徴とするコンピュータで読み取り可能な媒体。
JP2006542495A 2003-12-02 2004-11-30 動画符号化方法及び装置 Withdrawn JP2007513566A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US52613003P 2003-12-02 2003-12-02
KR1020040006651A KR20050053297A (ko) 2003-12-02 2004-02-02 동영상 부호화 방법 및 장치
PCT/KR2004/003120 WO2005055612A1 (en) 2003-12-02 2004-11-30 Method and apparatus for video encoding

Publications (1)

Publication Number Publication Date
JP2007513566A true JP2007513566A (ja) 2007-05-24

Family

ID=36847711

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006542495A Withdrawn JP2007513566A (ja) 2003-12-02 2004-11-30 動画符号化方法及び装置

Country Status (3)

Country Link
EP (1) EP1704723A1 (ja)
JP (1) JP2007513566A (ja)
WO (1) WO2005055612A1 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010226528A (ja) * 2009-03-24 2010-10-07 Canon Inc 符号化装置およびその方法
WO2011121894A1 (ja) * 2010-03-31 2011-10-06 三菱電機株式会社 画像符号化装置、画像復号装置、画像符号化方法及び画像復号方法
JP5215462B2 (ja) * 2009-05-29 2013-06-19 三菱電機株式会社 画像復号装置、および画像復号方法
JP2013207402A (ja) * 2012-03-27 2013-10-07 Nippon Hoso Kyokai <Nhk> 画像符号化装置及びプログラム

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2907989B1 (fr) 2006-10-27 2009-01-16 Actimagine Sarl Procede et dispositif d'optimisation de la compression d'un flux video
KR101624649B1 (ko) 2009-08-14 2016-05-26 삼성전자주식회사 계층적인 부호화 블록 패턴 정보를 이용한 비디오 부호화 방법 및 장치, 비디오 복호화 방법 및 장치
KR20110017719A (ko) 2009-08-14 2011-02-22 삼성전자주식회사 비디오 부호화 방법 및 장치, 비디오 복호화 방법 및 장치
US9332276B1 (en) 2012-08-09 2016-05-03 Google Inc. Variable-sized super block based direct prediction mode
US10142647B2 (en) 2014-11-13 2018-11-27 Google Llc Alternating block constrained decision mode coding

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010226528A (ja) * 2009-03-24 2010-10-07 Canon Inc 符号化装置およびその方法
JP5215462B2 (ja) * 2009-05-29 2013-06-19 三菱電機株式会社 画像復号装置、および画像復号方法
JP2014132765A (ja) * 2009-05-29 2014-07-17 Mitsubishi Electric Corp 画像復号装置および画像復号方法
JP2015084574A (ja) * 2009-05-29 2015-04-30 三菱電機株式会社 画像復号装置および画像復号方法
JP2016036176A (ja) * 2009-05-29 2016-03-17 三菱電機株式会社 画像復号装置、画像符号化装置およびビットストリーム
JP2017118573A (ja) * 2009-05-29 2017-06-29 三菱電機株式会社 画像復号装置、画像復号方法、画像符号化装置、画像符号化方法および符号化データ
WO2011121894A1 (ja) * 2010-03-31 2011-10-06 三菱電機株式会社 画像符号化装置、画像復号装置、画像符号化方法及び画像復号方法
JPWO2011121894A1 (ja) * 2010-03-31 2013-07-04 三菱電機株式会社 画像符号化装置、画像復号装置、画像符号化方法及び画像復号方法
US8948243B2 (en) 2010-03-31 2015-02-03 Mitsubishi Electric Corporation Image encoding device, image decoding device, image encoding method, and image decoding method
JP2013207402A (ja) * 2012-03-27 2013-10-07 Nippon Hoso Kyokai <Nhk> 画像符号化装置及びプログラム

Also Published As

Publication number Publication date
WO2005055612A1 (en) 2005-06-16
EP1704723A1 (en) 2006-09-27

Similar Documents

Publication Publication Date Title
KR20050053297A (ko) 동영상 부호화 방법 및 장치
KR100739714B1 (ko) 인트라 예측 모드 결정 방법 및 장치
KR100728031B1 (ko) 가변 블록 크기 움직임 예측을 위한 부호화 모드 결정 방법및 장치
JP4509104B2 (ja) 高度動画像符号化におけるイントラ予測のための高速モード決定アルゴリズム
KR101103699B1 (ko) 영상 부호화 방법 및 복호 방법, 그들의 장치, 그들의 프로그램 및 프로그램을 기록한 기록매체
RU2408161C1 (ru) Способ кодирования изображения/декодирования изображения, устройство кодирования изображения/декодирования изображения
JP5650294B2 (ja) 動画像符号化装置、動画像符号化方法、動画像符号化プログラム、動画像復号装置、動画像復号方法及び動画像復号プログラム
KR100739790B1 (ko) 인트라 예측 모드 결정 방법 및 장치
KR100727990B1 (ko) 영상의 인트라 예측 부호화 방법 및 그 방법을 사용하는부호화 장치
KR20200002697A (ko) 처리율 향상을 위한 영상 부호화/복호화 방법, 장치 및 비트스트림을 저장한 기록 매체
US20060159354A1 (en) Method and apparatus for predicting frequency transform coefficients in video codec, video encoder and decoder having the apparatus, and encoding and decoding method using the method
KR20120138248A (ko) 동화상 부호화 장치, 동화상 부호화 방법, 동화상 부호화 프로그램, 동화상 복호 장치, 동화상 복호 방법 및 동화상 복호 프로그램
TWI401967B (zh) 可調式動態影像編碼方法、可調式動態影像編碼裝置、可調式動態影像編碼程式及記錄有該程式之電腦可讀取記錄媒體
KR20080069069A (ko) 인트라/인터 예측 방법 및 장치
WO2017122604A1 (ja) 動画像符号化装置、動画像符号化方法、及び、動画像符号化プログラムが記憶された記憶媒体
KR20090087767A (ko) 영상의 인트라 예측 부호화 방법
JP4074868B2 (ja) 画像符号化制御方法及びその装置
JP5326828B2 (ja) 動画像符号化装置及び動画像符号化方法
KR20060008523A (ko) 영상의 인트라 예측 방법 및 그 장치
JP2007513566A (ja) 動画符号化方法及び装置
JP2005348411A (ja) 画像の空間予測符号化方法、符号化装置、復号化方法及び復号化装置
KR20210000689A (ko) 영상 부호화/복호화 방법 및 장치
JP4130617B2 (ja) 動画像符号化方法および動画像符号化装置
KR100771640B1 (ko) 고속 모드 결정 기능을 구비한 h.264 인코더
CN111263158B (zh) 一种基于空间相关度的多变换核快速处理方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20071022

A761 Written withdrawal of application

Free format text: JAPANESE INTERMEDIATE CODE: A761

Effective date: 20090126

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20090127