JP5416277B2 - 階層的映像符号化における空間予測方法及び装置 - Google Patents

階層的映像符号化における空間予測方法及び装置 Download PDF

Info

Publication number
JP5416277B2
JP5416277B2 JP2012519482A JP2012519482A JP5416277B2 JP 5416277 B2 JP5416277 B2 JP 5416277B2 JP 2012519482 A JP2012519482 A JP 2012519482A JP 2012519482 A JP2012519482 A JP 2012519482A JP 5416277 B2 JP5416277 B2 JP 5416277B2
Authority
JP
Japan
Prior art keywords
block
mode
spatial prediction
adjacent
activity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2012519482A
Other languages
English (en)
Other versions
JP2012533209A (ja
Inventor
チェー,ウン−イル
チョウ,デ−ソン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Samsung Electronics Co Ltd
Original Assignee
Samsung Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Samsung Electronics Co Ltd filed Critical Samsung Electronics Co Ltd
Publication of JP2012533209A publication Critical patent/JP2012533209A/ja
Application granted granted Critical
Publication of JP5416277B2 publication Critical patent/JP5416277B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/593Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/11Selection of coding mode or of prediction mode among a plurality of spatial predictive coding modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/147Data rate or code amount at the encoder output according to rate distortion criteria
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/196Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding being specially adapted for the computation of encoding parameters, e.g. by averaging previously computed encoding parameters
    • H04N19/197Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding being specially adapted for the computation of encoding parameters, e.g. by averaging previously computed encoding parameters including determination of the initial value of an encoding parameter
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • H04N19/33Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability in the spatial domain
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computing Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

本発明は階層的映像(video)符号化方法及び装置に関するもので、特に階層的映像符号化における空間予測方法及び装置に関する。
一般的に、コーデック(codec)技術は、オーディオ及びビデオデータを圧縮するための技術に使われている。コーデック技術の依存度は、特にデータ量が多くの映像処理技術で一層高い。
一方、コーデック技術における性能を評価する重要な要素のうちの一つは圧縮効率であるので、コーデックによるデータ圧縮率を高めるために、多くの努力がなされている。
現在映像処理に広く使用されているコーデックは、4:2:0映像又は8ビットのビット深さ(bit depth)を有する映像を処理できる。一方、映像フォーマットが4:2:2映像又は4:4:4映像、あるいは16ビットのビット深さに拡張された高画質の映像を処理できる新たなコーデックに関する研究が活発に進んでいる。加えて、新たなコーデックですべての映像フォーマット又はビット深さを有する入力映像を効率的に符号化及び復号化できる多くの研究が進行している。
したがって、本発明は上記した従来技術の問題点に鑑みてなされたものであって、その目的は、階層的映像符号化で生成された剰余(residual)映像を効率的に符号化するための空間予測方法及び装置を提供することにある。
また、本発明の目的は、階層的映像符号化で圧縮効率を高めるように入力映像を符号化するための空間予測方法及び装置を提供することにある。
上記のような目的を達成するために、本発明の一態様によれば、階層的映像符号化における剰余映像を符号化するための空間予測方法であって、剰余映像に含まれたブロックのうち、第1のブロックに隣接して位置した少なくとも一つの隣接ブロックの活動度に基づいてデフォルトモード、水平モード、及び垂直モードのうち少なくとも一つを空間予測モードとして選択するステップと、空間予測モードに基づいて構成された予測ブロックの画素と第1のブロックの画素との間の差を符号化するステップとを有する。上記少なくとも一つの隣接ブロックは、第1のブロックの左側に位置する第1の隣接ブロックと第1のブロックの上側に位置する第2の隣接ブロックとを含む。
本発明の他の態様によれば、階層的映像符号化における剰余映像を符号化するための空間予測装置であって、剰余映像に含まれたブロックのうちの第1のブロックに隣接して位置した少なくとも一つの隣接ブロックの活動度に基づいてデフォルトモード、水平モード、及び垂直モードのうち少なくとも一つを空間予測モードとして選択するブロック活動度判断部と、空間予測モードによって構成された予測ブロックの画素と第1のブロックの画素との間の差を符号化する空間予測部とを含む。上記少なくとも一つの隣接ブロックは、第1のブロックの左側に位置する第1の隣接ブロックと第1のブロックの上側に位置する第2の隣接ブロックとを含む。
本発明は、階層的映像符号化の際に、基本階層から復元された復元映像と入力映像との差から生成された剰余映像内に存在する画素又はブロック間の空間相関度を用いて空間予測を遂行することで、入力映像の圧縮率を向上させることができる。
本発明による実施形態の上記及び他の態様、特徴、及び利点は、添付の図面と共に述べる以下の詳細な説明から、一層明らかになるであろう。
本発明が適用される階層的映像コーダを示す図である。 本発明が適用される階層的映像デコーダを示す図である。 本発明の実施形態による空間予測を遂行する第2の符号化部109の構成を示す図である。 本発明の実施形態による空間予測を遂行するために必要な隣接ブロックの位置及び画素に基づいて空間予測の実施形態を示す図である。 本発明の実施形態による空間予測を遂行するために必要な隣接ブロックの位置及び画素に基づいて空間予測の実施形態を示す図である。 本発明の実施形態による空間予測を遂行するために必要な隣接ブロックの位置及び画素に基づいた空間予測の実施形態を示す図である。 本発明の実施形態による空間予測方法を示す図である。
以下、本発明の望ましい実施形態を添付の図面を参照して詳細に説明する。
図面において、同一の構成要素に対してはできるだけ同一の参照符号及び参照番号を付して説明する。次の説明において、具体的な構成及び要素のような特定詳細は、単に実施形態の全般的な理解を助けるために提供される。なお、公知の機能または構成に関する具体的な説明は、明瞭性と簡潔性のために省略する。“少なくとも一つの”との表現は、要素のリストを先行する場合に、要素のリスト全体を変更し、上記リストの各々の要素を変更しないことである。
後述する本発明の実施形態では、階層映像処理システムは、低解像度映像と高解像度映像を同時に処理する映像処理システムとして考えられる。しかしながら、本実施形態は、低解像度映像と高解像度映像を共に処理するすべての映像処理システムに適用が可能であることはもちろんである。
階層映像処理システムは、オリジナル映像を用いて低解像度映像と高解像度映像をサポートする。例えば、低解像度映像は順次走査(progressive)方式による映像であり、高解像度映像は飛び越し走査(interlace)方式による映像であることが一つの例である。
本発明の実施形態は、階層的映像の符号化中に、基本階層の映像から復元された映像(以下、“復元映像”と称する)と入力映像との差から生成された剰余映像(residual image)内に存在するブロック間の空間相関度を用いて空間予測を遂行し、それによって入力映像の圧縮率を向上させるためのものである。ここで、基本階層の映像は、低解像度の映像であり、入力映像は高解像度の映像であり得る。
以下、添付の図面を参照して本発明の実施形態による階層的映像の符号化方法及び装置について詳細に説明する。
図1は階層的映像コーダを示し、図2は階層的映像デコータを示す。2個の階層的構成は、説明の便宜のために図1及び図2に示すが、本実施形態は、一般的なM個の階層的構成(ここで、M>2)に適用可能である。図1の階層的映像コーダ及び図2の階層的映像デコーダは、データ圧縮率を向上させてデータ送受信時に伝送効率を増加させる動作を遂行する。
階層的映像コーダは、高解像度映像を受信し、符号化された低解像度映像と剰余映像を出力する。符号化段階以前の剰余映像は、入力される高解像度映像と階層的映像コーダで復元された高解像度映像の差によって獲得された画素値として定義される。
階層的映像デコーダは、階層的映像コーダから提供される基本階層の符号化された低解像度映像と拡張階層の符号化された剰余映像を受信し、復元された低解像度映像と復元された高解像度映像を出力する。
まず、図1を参照すると、階層的ビデオコーダは、ダウンサンプリング部101、第1の符号化部103、アップサンプリング部105、加減部107、及び第2の符号化部109を含む。
ダウンサンプリング部101は、高解像度映像である入力映像100をダウンサンプリングして基本階層の映像、すなわち低解像度映像を生成し、この生成された低解像度映像を第1の符号化部103に提供する。
第1の符号化部103は、提供された低解像度映像を符号化して第1のビットストリーム130を生成し、この生成された第1のビットストリーム130を図2の階層的映像デコーダに提供する。第1の符号化部103は、符号化された低解像度映像に対するビットストリームを復元し、この復元された第1の復元映像をアップサンプリング部105に提供する。
アップサンプリング部105は、提供された第1の復元映像に対してダウンサンプリングの逆プロセスに該当するアップサンプリングを遂行して第2の復元映像を生成し、生成された第2の復元映像を加減部107に提供する。加減部107は、入力映像100から提供された第2の復元映像を差し引き、入力映像100と第2の復元映像の差に対応する剰余映像を第2の符号化部109に提供する。
第2の符号化部109は、提供された剰余映像を符号化して第2のビットストリーム150を生成し、この生成された第2のビットストリーム150を図2の階層的ビデオデコーダに提供する。
階層的映像コーダの構成において、第1の符号化部103は、低解像度映像を符号化するための基本階層に該当し、第2の符号化部109は、高解像度映像を処理する拡張階層に該当することが、必要不可欠ではないが、好ましい。
図2を参照すると、階層的映像デコーダは、第1のデコーダ201、アップサンプリング部203、第2のデコーダ205、及び加減部207を含む。
第1のデコーダ201は、図1の階層的映像コーダから低解像度又は低画質映像に該当する第1のビットストリーム130を受信し、入力された第1のビットストリーム130を復元し、第1の復元映像をアップサンプリング部203に提供する。アップサンプリング部203は、提供された第1の復元映像をアップサンプリングして第2の復元映像を生成し、この生成された第2の復元映像を加減部207に提供する。
第2のデコーダ205は、図1の階層的映像コーダから剰余映像に該当する第2のビットストリーム150を受信し、入力された第2のビットストリーム150に対して、図1の第2の符号化部109での符号化に対応するように復号化し、復元された剰余映像を加減部207に提供する。
加減部207は、提供された第2の復元映像に復元された剰余映像を加算し、第2の復元映像と復元された剰余映像の加算に対応する第3の復元映像200をユーザーに提供する。第3の復元映像200は、高解像度又は高画質映像に該当する。
図1の階層的映像符号化の場合に、剰余映像は、基本階層から復元された第2の復元映像を入力映像100から差し引いて獲得されても、画像(picture)間の時間相関度だけでなく画素内の空間相関度も有する。その理由は、剰余映像が一般的に図1のダウンサンプリング部101で低域フィルタリングによって除去される高周波成分で構成され、このような剰余映像の高周波成分はまだ空間相関度を有しているためである。
これに基づき、本実施形態は、剰余映像の高周波成分に存在する空間相関度を効果的に利用することによって、入力映像100の圧縮率を高める新たな方法を提供する。このために、本発明の実施形態では、第2の符号化部109は、図3乃至図7に従って剰余映像の高周波成分に存在している空間相関度を用いて空間予測を遂行する。
図3は、本発明の実施形態による空間予測を遂行する第2の符号化部109の構成を示す。図3を参照すると、本発明の実施形態による第2の符号化部109は、ブロック活動度判断部301、空間予測モード決定部303、及び空間予測部305を含む。
ブロック活動度判断部301は、剰余映像の空間予測のために、剰余映像をブロック単位に分割し、分割された各ブロックに対して、隣接ブロックに関する情報(例えば、隣接ブロックの画素の活動度(activity))を用いて現在ブロックに適用する少なくとも一つの空間予測モードを選択する。この空間予測モードは、水平方向に空間予測を遂行するための水平(HORIZONTAL)モード、垂直方向に空間予測を遂行する垂直(VERTICAL)モード、及び隣接ブロックの画素の代わりに予め設定された特定値を用いて空間予測を遂行するデフォルト(DEFAULT)モードを含む。
空間予測モード決定部303は、ブロック活動度判断部301で選択された少なくとも一つの空間予測モードの中で最適モードを決定する。空間予測部305は、決定された最適モードによって剰余映像内の現在ブロックに対して空間予測を遂行する。空間予測モード決定部303は、階層的映像デコーダに含まれていない。その代わりに、階層的映像デコーダは、階層的映像コーダにより決定された最適モードによるビットストリームを復号化するための最小化動作を遂行する。
空間予測を遂行するための各装置301〜305の詳細動作を説明すると、次のようである。
ブロック活動度判断部301は、入力される剰余映像で図4に示すように、現在ブロックXの周辺に形成されたブロックA及びBに関する情報(下記の条件1〜5のうちいずれか一つ)を用いてブロックA及びブロックBの活動度を判断し、その判断結果によって、現在ブロックXに適用される少なくとも一つの空間予測モードを選択する。
図4乃至図6は、本発明の実施形態による空間予測を遂行するために必要な隣接ブロックの位置及び画素に基づいて空間予測の実施形態を示す。8×8ブロックが一例として図4乃至図6に使用されるが、このブロックは、サイズに制限をおかない。一般的に、本発明の実施形態は、N×Nブロックに適用されることができる。
図4に示すように、現在ブロックXの左側に位置した隣接ブロックAと現在ブロックXの上側に位置したブロックBが、空間予測に使用される。具体的に説明すると、現在ブロックXの隣接ブロックA及びBの画素のうち、ブロックA内の現在ブロックXに隣接した画素A1〜A8及びブロックB内の現在ブロックXに隣接した画素B1〜B8が、空間予測に使用される。
8×8予測ブロックは、水平方向に空間予測モードを遂行するための水平モードでは、図5に示すようにブロックAの画素A1〜A8を用いて構成され、垂直方向に空間予測を遂行するための垂直モードでは、図6に示すようでブロックBの画素B1〜B8を用いて構成される。これら予測ブロックは、空間予測部305でブロックXの空間予測値として使用される。
図3のブロック活動度判断部301を更に説明すると、ブロック活動度判断部301は、図4に示すように、ブロックA及びBの画素A1〜A8及び画素B1〜B8、及びブロックA及びBの符号化モード情報を用いてブロックA及びBの活動度を、次のように判断する。
これらブロックは、その活動度によって高活動度ブロックと低活動度(low-activity)ブロックに分類される。次の条件(Condition)1〜5のうちいずれか一つは、ブロック活動度を判断する基準として使用される。任意の一つの条件が使用される場合、ブロックA及びBに与えられたブロックK(画素A1〜A8を含むブロック及び画素B1〜B8を含むブロック)が該当条件を満たすと、ブロックKは、低活動度と判断され、そうでない場合には高活動度(high-activity)と判断される。
条件1:ブロックKのすべての画素の値が0である。
条件2:ブロックKのCBP(Coded Block Pattern)値が0である。
条件3:ブロックKがSKIPモードにある。
条件4:ブロックKの空間予測に使用される画素の値がすべて同一である。(例えば、K1=K2=K3=K4=K5=K6=K7=K8)
条件5:ブロックKの空間予測に使用される画素の値間の差がしきい値THより小さい場合、その関係は、式(1)のように示される。
Figure 0005416277
ブロック活動度判断部301は、条件1〜5のうちいずれか一つを用いて、ブロックKを含むブロックA及びBのブロック活動度を判断し、一例として、表1のように判断されるブロックA及びBのブロック活動度によって剰余映像の現在ブロックXの空間予測に適用されるように少なくとも一つの空間予測モードを選択する。
Figure 0005416277
表1に示すように、ブロックA及びB両方が低活動度ブロックとして判断される場合に、ブロック活動度判断部301は、現在ブロックXに対する空間予測モードとしてデフォルトモードを選択する。ブロックAが高活動度ブロックとして判断され、かつブロックBが低活動度ブロックとして判断される場合、ブロック活動度判断部301は、現在ブロックXに対する空間予測モードとしてデフォルトと水平モードを選択する。ブロックAが低活動度ブロックとして判断され、かつブロックBが高活動度ブロックとして判断された場合、ブロック活動度判断部301は、現在ブロックXに対する空間予測モードとしてデフォルト
、垂直モードを選択する。ブロックA及びB両方が高活動度ブロックとして判断される場合に、ブロック活動度判断部301は、現在ブロックXに対する空間予測モードとしてデフォルト
、水平、及び垂直モードを選択する。
ブロック活動度判断部301は、選択された空間予測モードに関する情報を空間予測モード決定部303にブロック単位で提供する。ブロック活動度判断部301は、空間予測モードのタイプが上記表1に示したように隣接ブロックのブロック活動度によって変更されるため、空間予測モードに対するエントロピー符号化も隣接ブロックの活動度条件に基づいて選択的に遂行する。例えば、ブロック活動度判断部301は、ブロックA及びBが共に低活動度ブロックとして判断された場合、空間予測モードとしてデフォルトモードのみが選択されるので、空間予測モードに関する情報を伝送しない。ブロックAが高活動度ブロックとして判断され、かつブロックBが低活動度ブロックとして判断された場合、ブロック活動度判断部301は、デフォルトモード及び水平モードの両モードが選択されるので、モード情報を1ビットで表す。同様に、ブロックAが低活動度ブロックとして判断され、かつブロックBが高活動度ブロックとして判断された場合、ブロック活動度判断部301は、デフォルト及び垂直モード両方が選択されるので、モード情報を1ビットで表す。加えて、ブロックA及びBがすべて高活動度ブロックとして判断された場合には、ブロック活動度判断部301は、デフォルト
、水平、及び垂直モードが選択されるので、モード情報を2ビット(デフォルト=00、水平=10、垂直=01)で表す。
空間予測モード決定部303は、剰余映像の圧縮率及び歪み(distortion)を考慮して選択された少なくとも一つの空間予測モードの中で最適モードを決定する。最適モードの選択方法は、映像コーダで一般的に使用される最適モードの決定方法に従う。例えば、MPEG-4又はH.264映像圧縮コーデックで使用される、圧縮率-歪みに基づいた最適モード決定方法を使うことができる。空間予測モード決定部303は、ビット率R及び歪み率Dを用いて式(1)によって定義されたRDコストを計算できる。符号化時に発生するビット率に対応するビット率Rは、選択された少なくとも一つの空間予測モードで遂行される。オリジナル映像と符号化及び復号化を遂行する場合に復元された映像との間の歪みに対応する歪み率Dは、選択された少なくとも一つの空間予測モードで遂行される。
RDcost=R×λ+D (2)
ここで、Dは、オリジナル映像と復元映像との間のSSE(Sum of Squared Error)を意味し、λは所定の定数を意味する。
空間予測モード決定部303は、選択された少なくとも一つの空間予測モードに対してRDコストを計算し、最小値である計算されたRDコストに対応する空間予測モードを最適モードとして決定する。
空間予測部305は、決定された最適モードによって剰余映像の現在ブロックに対する空間予測を遂行する。例えば、決定された最適モードがデフォルトモードである場合、空間予測部305は、ブロックA又はBを利用せずに、一例として128のように予め設定された値と現在ブロックの各画素との間の差を計算し、この計算された差を符号化して空間予測を遂行する。剰余映像の現在ブロックに対して決定された最適モードが水平モードである場合、空間予測部305は、図5に示すように空間予測のための予測ブロックを構成し、現在ブロックと構成された予測ブロックの画素との間の差を計算し、計算された差を符号化して空間予測を遂行する。剰余映像の現在ブロックに対して決定された最適モードが垂直モードである場合、空間予測部305は、図6に示すように空間予測のための予測ブロックを構成し、現在ブロックの各画素と構成された予測ブロックの画素との間の差を計算し、この計算された差を符号化して空間予測を遂行する。
図7は、本発明の実施形態による空間予測方法を示す。図7を参照すると、ステップ501で剰余映像が入力される場合、ブロック活動度判断部301は、ステップ503で剰余映像をブロックに分割する。
ステップ505で、ブロック活動度判断部301は、剰余映像に含まれたすべてのブロックに対して、条件1〜5のうちいずれか一つを用いて現在ブロックXの隣接ブロックA及びBのブロック活動度を判断した後、表1に定義されたように空間予測モードにマッピングされている、判断されたブロックA及びBの活動度によって少なくとも一つの空間予測モードを選択する。
さらに、剰余映像に含まれた各ブロックに対して、階層的映像符号化部に含まれた空間予測モード決定部303は、式(2)を用いて選択された少なくとも一つの空間予測モードの中で最適モードを決定する。
ステップ507で、空間予測部505は、入力された剰余映像に含まれた各ブロックに対して、決定された最適モードによって空間予測のための予測ブロックを構成し、現在ブロックXの画素と予測ブロックの画素との差を計算し、計算された差を符号化して空間予測を遂行する。
その結果、本発明の実施形態では、階層的映像符号化の際に、基本階層から復元された復元映像と入力映像との差から生成された剰余映像内に存在する画素又はブロック間の空間相関度を用いて空間予測を遂行することで、入力映像の圧縮率を向上させることができる。
以上、本発明の詳細な説明においては具体的な実施形態に関して説明したが、特許請求の範囲の記載及びこれと均等なものに基づいて定められる本発明の範囲及び精神を逸脱することなく、形式や細部の様々な変更が可能であることは、当該技術分野における通常の知識を持つ者には明らかである。

Claims (14)

  1. 階層的映像符号化における剰余映像を符号化するための空間予測方法であって、
    前記剰余映像に含まれたブロックのうち、第1のブロックに隣接して位置した第1の隣接ブロックの活動度と所定のしきい値との比較結果と、第2の隣接ブロックの活動度と前記しきい値との比較結果とを組み合わせてデフォルトモード、水平モード、及び垂直モードのうち少なくとも一つを空間予測モードとして選択するステップと、
    前記空間予測モードに基づいて構成された予測ブロックの画素と前記第1のブロックの画素との間の差を符号化するステップと、を有することを特徴とする空間予測方法。
  2. 前記空間予測モードを最適モードとして決定するステップをさらに有することを特徴とする請求項1に記載の空間予測方法。
  3. 前記第1及び第2の隣接ブロックの活動度は、前記第1及び第2の隣接ブロックで所定のブロックの画素活動度、符号化ブロックパターン(CBP)、スキップモード情報のうち少なくとも一つによって判断されることを特徴とする請求項1に記載の空間予測方法。
  4. 前記第1の隣接ブロックの所定ブロックは前記第1のブロックの左側に隣接した画素を含み、前記第2の隣接ブロックの所定ブロックは前記第1のブロックの上側に隣接した画素を含むことを特徴とする請求項3に記載の空間予測方法。
  5. 前記選択するステップは、
    前記決定された第1及び第2の隣接ブロックの活動度が所定のしきい値より低い場合、前記デフォルトモードを選択するステップと、
    前記決定された第1の隣接ブロックの活動度が前記所定のしきい値より高く、第2の隣接ブロックの活動度が前記所定のしきい値より低い場合、前記デフォルトモード及び前記水平モードを選択するステップと、
    前記決定された第1の隣接ブロックの活動度が前記所定のしきい値より低く、第2の隣接ブロックの活動度が前記所定のしきい値より高い場合、前記デフォルトモード及び前記垂直モードを選択するステップと、
    前記決定された前記第1及び第2の隣接ブロックの活動度が前記所定のしきい値より高い場合、前記デフォルトモード、前記水平モード、及び前記垂直モードを選択するステップと、
    を有することを特徴とする請求項1に記載の空間予測方法。
  6. 前記符号化するステップは、
    前記決定された最適モードに基づいて予測ブロックを構成するステップと、
    前記第1のブロックの画素と前記予測ブロックの画素との間の差を計算するステップと、
    前記計算された差を符号化するステップと、
    を有する請求項2に記載の空間予測方法。
  7. 前記予測ブロックを構成するステップは、
    前記決定された最適モードが前記デフォルトモードである場合、所定のデフォルト値を含む予測ブロックを構成するステップと、
    前記決定された最適モードが前記水平モードである場合、前記第1のブロックに隣接した前記第1の隣接ブロックの画素を含む予測ブロックを構成するステップと、
    前記決定された最適モードが前記垂直モードである場合、前記第1のブロックに隣接した第2の隣接ブロックの画素を含む予測ブロックを構成するステップと、
    を有することを特徴とする請求項6に記載の空間予測方法。
  8. 階層的映像符号化における剰余映像を符号化するための空間予測装置であって、
    前記剰余映像に含まれたブロックのうちの第1のブロックに隣接して位置した第1の隣接ブロックの活動度と所定のしきい値との比較結果と、第2の隣接ブロックの活動度と前記しきい値との比較結果とを組み合わせてデフォルトモード、水平モード、及び垂直モードのうち少なくとも一つを空間予測モードとして選択するブロック活動度判断部と、
    前記空間予測モードによって構成された予測ブロックの画素と前記第1のブロックの画素との間の差を符号化する空間予測部と、を含ことを特徴とする空間予測装置。
  9. 前記空間予測モードを最適のモードとして決定する空間予測モード決定部をさらに含むことを特徴とする請求項8に記載の空間予測装置。
  10. 前記第1及び第2の隣接ブロックの活動度は、前記第1及び第2の隣接ブロックで所定ブロックの画素活動度、符号化ブロックパターン(CBP)、スキップモード情報のうち少なくとも一つによって判断されることを特徴とする請求項8に記載の空間予測装置。
  11. 前記第1の隣接ブロックの所定ブロックは前記第1のブロックの左側に隣接した画素を含み、前記第2の隣接ブロックの所定ブロックは前記第1のブロックの上側に隣接した画素を含むことを特徴とする請求項10に記載の空間予測装置。
  12. 前記ブロック活動度判断部は、
    前記判断された前記第1及び第2の隣接ブロックの活動度がしきい値より低い場合、前記デフォルトモードを選択し、
    前記判断された第1の隣接ブロックの活動度が前記しきい値より高く、第2の隣接ブロックの活動度が前記しきい値より低い場合、前記デフォルトモード及び前記水平モードを選択し、
    前記判断された第1の隣接ブロックの活動度が前記しきい値より低く、第2の隣接ブロックの活動度が前記しきい値より高い場合、前記デフォルトモード及び前記垂直モードを選択し、
    前記判断された第1及び第2の隣接ブロックの活動度が前記しきい値より高い場合、前記デフォルトモード、前記水平モード、及び前記垂直モードを選択することを特徴とする請求項8に記載の空間予測装置。
  13. 前記空間予測部は、
    前記決定された最適モードに基づいて予測ブロックを構成し、
    前記第1のブロックの画素と前記予測ブロックの画素との間の差を計算し、
    前記計算された差を符号化することを特徴とする請求項9に記載の空間予測装置。
  14. 前記空間予測部は、前記予測ブロックの構成時に、
    前記決定された最適モードが前記デフォルトモードである場合、所定のデフォルト値を含む予測ブロックを構成し、
    前記決定された最適モードが前記水平モードである場合、前記第1のブロックに隣接した第1の隣接ブロックの画素を含む予測ブロックを構成し、
    前記決定された最適モードが前記垂直モードである場合、前記第1のブロックに隣接した第2の隣接ブロックの画素を含む予測ブロックを構成することを特徴とする請求項13に記載の空間予測装置。
JP2012519482A 2009-07-10 2010-07-12 階層的映像符号化における空間予測方法及び装置 Expired - Fee Related JP5416277B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US22460309P 2009-07-10 2009-07-10
US61/224,603 2009-07-10
PCT/KR2010/004503 WO2011005063A2 (en) 2009-07-10 2010-07-12 Spatial prediction method and apparatus in layered video coding

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2013236137A Division JP5710733B2 (ja) 2009-07-10 2013-11-14 階層的映像符号化における空間予測方法及び装置

Publications (2)

Publication Number Publication Date
JP2012533209A JP2012533209A (ja) 2012-12-20
JP5416277B2 true JP5416277B2 (ja) 2014-02-12

Family

ID=43427457

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2012519482A Expired - Fee Related JP5416277B2 (ja) 2009-07-10 2010-07-12 階層的映像符号化における空間予測方法及び装置
JP2013236137A Expired - Fee Related JP5710733B2 (ja) 2009-07-10 2013-11-14 階層的映像符号化における空間予測方法及び装置

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2013236137A Expired - Fee Related JP5710733B2 (ja) 2009-07-10 2013-11-14 階層的映像符号化における空間予測方法及び装置

Country Status (7)

Country Link
US (1) US8767816B2 (ja)
EP (1) EP2452501B1 (ja)
JP (2) JP5416277B2 (ja)
KR (1) KR101686958B1 (ja)
CN (1) CN102474620A (ja)
MX (1) MX2012000533A (ja)
WO (1) WO2011005063A2 (ja)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140029672A1 (en) * 2011-01-21 2014-01-30 Thomson Licensing Method of coding a sequence of images and corresponding reconstruction method
US9426494B2 (en) * 2011-07-18 2016-08-23 Ziilabs Inc., Ltd. Systems and methods with early variance measure used to optimize video encoding
US8977065B2 (en) * 2011-07-21 2015-03-10 Luca Rossato Inheritance in a tiered signal quality hierarchy
US9332276B1 (en) 2012-08-09 2016-05-03 Google Inc. Variable-sized super block based direct prediction mode
WO2015133320A1 (ja) * 2014-03-05 2015-09-11 ソニー株式会社 画像符号化装置および方法
US10142647B2 (en) 2014-11-13 2018-11-27 Google Llc Alternating block constrained decision mode coding
KR102517570B1 (ko) * 2015-02-11 2023-04-05 한국전자통신연구원 3dtv 방송 송수신 장치
US11190774B1 (en) * 2020-05-29 2021-11-30 Microsoft Technology Licensing, Llc Screen content encoding mode evaluation including intra-block evaluation of multiple potential encoding modes
CN113271467B (zh) * 2021-07-19 2021-10-22 成都索贝数码科技股份有限公司 一种支持高效编辑的超高清视频分层编解码方法

Family Cites Families (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3545000B2 (ja) * 1992-11-02 2004-07-21 ソニー株式会社 画像信号符号化装置、画像信号復号化装置
US5515377A (en) * 1993-09-02 1996-05-07 At&T Corp. Adaptive video encoder for two-layer encoding of video signals on ATM (asynchronous transfer mode) networks
US6842483B1 (en) * 2000-09-11 2005-01-11 The Hong Kong University Of Science And Technology Device, method and digital video encoder for block-matching motion estimation
US7450641B2 (en) 2001-09-14 2008-11-11 Sharp Laboratories Of America, Inc. Adaptive filtering based upon boundary strength
EP1351510A4 (en) * 2001-09-14 2008-12-10 Ntt Docomo Inc ENCODING METHOD, DECODING METHOD, ENCODING APPARATUS, DECODING APPARATUS, IMAGE PROCESSING SYSTEM, ENCODING PROGRAM, AND DECODING PROGRAM
US7386048B2 (en) * 2002-05-28 2008-06-10 Sharp Laboratories Of America, Inc. Methods and systems for image intra-prediction mode organization
EP2290989B1 (en) * 2002-05-28 2015-01-28 Sharp Kabushiki Kaisha Method and systems for image intra-prediction mode estimation, communication, and organization
JP2004140473A (ja) 2002-10-15 2004-05-13 Sony Corp 画像情報符号化装置、復号化装置並びに画像情報符号化方法、復号化方法
JP2004304724A (ja) * 2003-04-01 2004-10-28 Sony Corp 画像処理装置とその方法、並びに符号化装置
KR100995398B1 (ko) * 2004-01-20 2010-11-19 삼성전자주식회사 수직 및 수평 방향의 패턴을 고려한 전역 움직임 보상순차주사화 방법
WO2005099273A1 (en) * 2004-04-08 2005-10-20 Koninklijke Philips Electronics N.V. Monochrome frame detection method and corresponding device
US8467459B2 (en) * 2004-10-13 2013-06-18 Thomson Licensing Method and apparatus for complexity scalable video encoding and decoding
KR101108681B1 (ko) * 2005-01-19 2012-01-25 삼성전자주식회사 동영상 코덱에서의 주파수 변환 계수 예측 방법 및 장치,이를 구비한 부호화 및 복호화 장치와 방법
US8265141B2 (en) * 2005-05-17 2012-09-11 Broadcom Corporation System and method for open loop spatial prediction in a video encoder
RU2411689C2 (ru) * 2005-07-11 2011-02-10 Томсон Лайсенсинг Способ и устройство для адаптивного к макроблоку межслойного предсказания внутренней текстуры
KR100977101B1 (ko) * 2005-11-30 2010-08-23 가부시끼가이샤 도시바 화상 부호화/화상 복호화 방법 및 화상 부호화/화상 복호화장치
JP4565392B2 (ja) * 2005-12-22 2010-10-20 日本ビクター株式会社 映像信号階層復号化装置、映像信号階層復号化方法、及び映像信号階層復号化プログラム
KR100791299B1 (ko) * 2006-04-11 2008-01-04 삼성전자주식회사 다 계층 기반의 비디오 인코딩 방법 및 장치
US7864219B2 (en) * 2006-06-15 2011-01-04 Victor Company Of Japan, Ltd. Video-signal layered coding and decoding methods, apparatuses, and programs with spatial-resolution enhancement
FR2907630A1 (fr) * 2006-10-19 2008-04-25 Thomson Licensing Sas Dispositif et procede de codage sous forme scalable d'une sequence d'images et dispositif et procede de decodage correspondants
EP2119236A1 (en) * 2007-03-15 2009-11-18 Nokia Corporation System and method for providing improved residual prediction for spatial scalability in video coding
US8208558B2 (en) * 2007-06-11 2012-06-26 Texas Instruments Incorporated Transform domain fast mode search for spatial prediction in advanced video coding
JP2009111520A (ja) * 2007-10-26 2009-05-21 Canon Inc 画像符号化装置、画像符号化方法及びプログラム
JP2009111691A (ja) 2007-10-30 2009-05-21 Hitachi Ltd 画像符号化装置及び符号化方法、画像復号化装置及び復号化方法
EP2924994B1 (en) * 2008-05-07 2016-09-21 LG Electronics, Inc. Method and apparatus for decoding video signal
US8660176B2 (en) * 2008-09-26 2014-02-25 Qualcomm Incorporated Resolving geometric relationships among video data units

Also Published As

Publication number Publication date
JP5710733B2 (ja) 2015-04-30
US8767816B2 (en) 2014-07-01
WO2011005063A3 (en) 2011-03-31
CN102474620A (zh) 2012-05-23
JP2014045515A (ja) 2014-03-13
EP2452501A2 (en) 2012-05-16
EP2452501B1 (en) 2020-09-02
MX2012000533A (es) 2012-03-14
KR20110005665A (ko) 2011-01-18
EP2452501A4 (en) 2013-05-01
KR101686958B1 (ko) 2016-12-16
JP2012533209A (ja) 2012-12-20
US20110007806A1 (en) 2011-01-13
WO2011005063A2 (en) 2011-01-13

Similar Documents

Publication Publication Date Title
JP5416277B2 (ja) 階層的映像符号化における空間予測方法及び装置
JP4991699B2 (ja) ビデオ信号のスケーラブルなエンコーディング方法およびデコーディング方法
EP2319241B1 (en) Skip modes for inter-layer residual video coding and decoding
JP5335833B2 (ja) 複数層を使用するマルチメディア・データのスケーリング可能なエンコーディング及びデコーディングのためのシステム及び方法
JP4908180B2 (ja) 動画像符号化装置
KR101608426B1 (ko) 영상의 인트라 예측 부호화/복호화 방법 및 그 장치
JP5180298B2 (ja) 映像符号化装置及び方法と、映像復号化装置及び方法
JP2005507587A (ja) 空間的にスケーラブルな圧縮
JP2015065688A (ja) スケーラブルビデオコーディングのためのテクスチャ予想及びリサンプリングの方法及び装置
KR20070032111A (ko) 동영상의 무손실 부호화, 복호화 방법 및 장치
KR20110015002A (ko) 향상 계층 비디오 코딩을 위한 적응 양자화
JP2009533938A (ja) 多階層基盤のビデオエンコーディング方法および装置
KR101621854B1 (ko) Tsm 율-왜곡 최적화 방법, 그를 이용한 인코딩 방법 및 장치, 그리고 영상 처리 장치
US20140247890A1 (en) Encoding device, encoding method, decoding device, and decoding method
KR20130107861A (ko) 인터 레이어 인트라 예측 방법 및 장치
KR100856392B1 (ko) 현재 영상의 복원영역을 참조하는 동영상 부호화/복호화장치 및 그 방법
US20160127738A1 (en) Techniques in backwards compatible multi-layer compression of hdr video
KR20090103675A (ko) 영상의 인트라 예측 모드 부호화/복호화 방법 및 장치
KR20100009718A (ko) 예측 방향을 이용한 영상 부호화/복호화 장치 및 방법
JP2010010917A (ja) 動画像符号化装置、動画像復号装置、動画像符号化方法、及び動画像復号方法
WO2015055495A1 (en) Methods and devices for coding video data in a scalable bitstream
KR20080013843A (ko) 동영상의 무손실 부호화, 복호화 방법 및 장치
KR20160053848A (ko) 영상의 인트라 예측 부호화/복호화 방법 및 그 장치
Micallef et al. Reducing correlation noise in Wyner-Ziv video coding
KR101802304B1 (ko) 하다마드 변환을 이용한 부호화 방법 및 이러한 방법을 사용하는 장치

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130520

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130528

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130828

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20131015

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20131114

R150 Certificate of patent or registration of utility model

Ref document number: 5416277

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees