JP2014523186A - エントロピー符号化/復号化方法及びその装置 - Google Patents

エントロピー符号化/復号化方法及びその装置 Download PDF

Info

Publication number
JP2014523186A
JP2014523186A JP2014518805A JP2014518805A JP2014523186A JP 2014523186 A JP2014523186 A JP 2014523186A JP 2014518805 A JP2014518805 A JP 2014518805A JP 2014518805 A JP2014518805 A JP 2014518805A JP 2014523186 A JP2014523186 A JP 2014523186A
Authority
JP
Japan
Prior art keywords
unit
coding
probability
depth
binary value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2014518805A
Other languages
English (en)
Inventor
アルシン,アレクサンダー
アルシナ,エレナ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Samsung Electronics Co Ltd
Original Assignee
Samsung Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Samsung Electronics Co Ltd filed Critical Samsung Electronics Co Ltd
Publication of JP2014523186A publication Critical patent/JP2014523186A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • H03M7/40Conversion to or from variable length codes, e.g. Shannon-Fano code, Huffman code, Morse code
    • H03M7/4006Conversion to or from arithmetic code
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/13Adaptive entropy coding, e.g. adaptive variable length coding [AVLC] or context adaptive binary arithmetic coding [CABAC]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/91Entropy coding, e.g. variable length coding [VLC] or arithmetic coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/96Tree coding, e.g. quad-tree coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Theoretical Computer Science (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Compression Of Band Width Or Redundancy In Fax (AREA)

Abstract

映像のエントロピー符号化方法及び装置、並びにエントロピー復号化方法及び装置を提供する。現在の符号化シンボルよりも先に符号化された以前の符号化シンボルに基づいて決定された所定の二進値の確率を利用して、現在の符号化シンボルの二進値を算術符号化するステップと、現在の符号化シンボルの二進値によって、所定の二進値の確率を、複数個のスケーリングファクタを利用してアップデートするステップと、を含むエントロピー符号化方法である。

Description

本発明は、エントロピー符号化及び復号化に係り、より詳しくは、コンテキストに基づいた二進算術符号化/復号化において確率モデルをアップデートする方法及び装置に関する。
H.264及びMPEG−4のような現在の国際ビデオコーディング標準において、ビデオ信号は、シーケンス、フレーム、スライス、マクロブロック及びブロックに階層的に分割され、ブロックは、最小処理ユニットとなる。エンコーディング側面で、イントラ・フレーム予測またはインター・フレーム予測を通じて、ブロックのレジデュアルデータが獲得される。また、レジデュアルデータは、変換、量子化、スキャニング、ランレングスコーディング及びエントロピーコーディングを通じて圧縮される。デコーディング側面で、処理手順は逆になる。まず、エントロピーコーディング時に生成された変換ブロックの係数が、ビットストリームから抽出される。次いで、逆量子化及び逆変換を通じて、ブロックのレジデュアルデータは再構成され、予測情報は、ブロックのビデオデータを再構成するために使われる。
本発明が解決しようとする課題は、コンテキストに基づいた二進算術符号化過程で行われる確率のアップデート過程を改善することによって、映像の圧縮効率を向上させることにある。
本発明の一実施形態は、複数個のスケーリングファクタを利用して、確率モデルをアップデートする。
本発明によれば、コンテキストに基づいた二進算術符号化性能が向上する。
本発明の一実施形態によるビデオ符号化装置を示すブロック図である。 本発明の一実施形態によるビデオ復号化装置を示すブロック図である。 本発明の一実施形態による符号化単位の概念を示す図面である。 本発明の一実施形態による符号化単位に基づいた映像符号化部を示すブロック図である。 本発明の一実施形態による符号化単位に基づいた映像復号化部を示すブロック図である。 本発明の一実施形態による深度別の符号化単位及びパーティションを示す図面である。 本発明の一実施形態による符号化単位と変換単位の関係を示す図面である。 本発明の一実施形態による深度別の符号化情報を示す図面である。 本発明の一実施形態による深度別の符号化単位を示す図面である。 本発明の一実施形態による符号化単位、予測単位及び周波数変換単位の関係を示す図面である。 本発明の一実施形態による符号化単位、予測単位及び周波数変換単位の関係を示す図面である。 本発明の一実施形態による符号化単位、予測単位及び周波数変換単位の関係を示す図面である。 表1の符号化モード情報による符号化単位、予測単位及び変換単位の関係を示す図面である。 本発明の一実施形態によるエントロピー符号化装置の構成を示すブロック図である。 本発明に係る技術分野で行われる確率モデルのアップデート過程を簡略に示す図面である。 本発明の一実施形態によって、複数個のスケーリングファクタを利用した確率アップデート過程と、一つのスケーリングファクタを利用した確率アップデート過程とを比較するための図面である。 本発明の一実施形態による所定の二進値の確率アップデート過程を示すフローチャートである。 本発明の一実施形態による二進算術符号化を行う過程を示す図面である。 本発明の一実施形態によるエントロピー符号化方法を示すフローチャートである。 本発明の一実施形態によるエントロピー復号化装置の構成を示すブロック図である。 本発明の一実施形態によるエントロピー復号化方法を示すフローチャートである。
本発明の一実施形態による映像のエントロピー符号化方法は、現在の符号化シンボルよりも先に符号化された以前の符号化シンボルに基づいて決定された所定の二進値の確率を利用して、前記現在の符号化シンボルの二進値を算術符号化するステップと、前記現在の符号化シンボルの二進値によって、前記所定の二進値の確率を、複数個のスケーリングファクタを利用してアップデートするステップと、を含むことを特徴とする。
本発明の一実施形態による映像のエントロピー符号化装置は、現在の符号化シンボルよりも先に符号化された以前の符号化シンボルに基づいて決定された所定の二進値の確率を利用して、前記現在の符号化シンボルの二進値を算術符号化する二進算術符号化部と、前記現在の符号化シンボルの二進値によって、前記所定の二進値の確率を、複数個のスケーリングファクタを利用してアップデートするコンテキストモデラーと、を備えることを特徴とする。
本発明の一実施形態による映像のエントロピー復号化方法は、現在の符号化シンボルよりも先に復号化された以前の符号化シンボルに基づいて決定された所定の二進値の確率を利用して、前記現在の符号化シンボルの二進値を算術復号化するステップと、前記現在の符号化シンボルの二進値によって、前記所定の二進値の確率を、複数個のスケーリングファクタを利用してアップデートするステップと、を含むことを特徴とする。
本発明の一実施形態による映像のエントロピー復号化装置は、現在の符号化シンボルよりも先に復号化された以前の符号化シンボルに基づいて決定された所定の二進値の確率を利用して、前記現在の符号化シンボルの二進値を算術復号化する二進算術復号化部と、前記現在の符号化シンボルの二進値によって、前記所定の二進値の確率を、複数個のスケーリングファクタを利用してアップデートするコンテキストモデラーと、を備えることを特徴とする。
以下、添付された図面を参照して、本発明の望ましい実施形態について具体的に説明する。
図1は、本発明の一実施形態によるビデオ符号化装置を示すブロック図である。一実施形態によるビデオ符号化装置100は、最大符号化単位分割部110、符号化単位決定部120及び出力部130を備える。
最大符号化単位分割部110は、映像の現在のピクチャのための最大サイズの符号化単位である最大符号化単位に基づいて、現在のピクチャを区画する。現在のピクチャが最大符号化単位よりも大きければ、現在のピクチャの映像データは、少なくとも一つの最大符号化単位に分割される。一実施形態による最大符号化単位は、サイズ32×32、64×64、128×128、256×256などのデータ単位であって、横及び縦のサイズが8よりも大きい2の自乗である正方形のデータ単位である。映像データは、少なくとも一つの最大符号化単位別に、符号化単位決定部120に出力される。
一実施形態による符号化単位は、最大サイズ及び深度によって特徴づけられる。深度とは、最大符号化単位から、符号化単位が空間的に分割された回数を表し、深度が深くなるほど、深度別の符号化単位は、最大符号化単位から最小符号化単位まで分割される。最大符号化単位の深度が最上位深度であり、最小符号化単位が最下位符号化単位であると定義される。最大符号化単位は、深度が深くなるにつれて、深度別の符号化単位のサイズは減少するので、上位深度の符号化単位は、複数個の下位深度の符号化単位を含む。
前述したように、符号化単位の最大サイズによって、現在のピクチャの映像データを、最大符号化単位に分割し、それぞれの最大符号化単位は、深度別に分割される符号化単位を含む。一実施形態による最大符号化単位は、深度別に分割されるので、最大符号化単位に含まれた空間領域の映像データが、深度によって階層的に分類される。
最大符号化単位の高さ及び幅を階層的に分割可能な総回数を制限する最大深度及び符号化単位の最大サイズは、予め設定されていてもよい。
符号化単位決定部120は、深度ごとに最大符号化単位の領域が分割された少なくとも一つの分割領域を符号化して、少なくとも一つの分割領域別に、最終の符号化結果が出力される深度を決定する。すなわち、符号化単位決定部120は、現在のピクチャの最大符号化単位ごとに、深度別の符号化単位に映像データを符号化して、最小の符号化誤差が発生する深度を選択して、符号化深度として決定する。決定された符号化深度及び最大符号化単位別の映像データは、出力部130に出力される。
最大符号化単位内の映像データは、最大深度以下の少なくとも一つの深度によって、深度別の符号化単位に基づいて符号化され、それぞれの深度別の符号化単位に基づいた符号化結果が比較される。深度別の符号化単位の符号化誤差の比較結果、符号化誤差の最も小さい深度が選択される。それぞれの最大符号化単位ごとに、少なくとも一つの符号化深度が決定される。
最大符号化単位のサイズは、深度が深くなるにつれて、符号化単位が階層的に分割され、符号化単位の個数は増加する。また、一つの最大符号化単位に含まれる同一な深度の符号化単位であるとしても、それぞれのデータについての符号化誤差を測定し、下位深度への分割如何が決定される。したがって、一つの最大符号化単位に含まれるデータであるとしても、位置によって、深度別の符号化誤差が異なるので、位置によって、符号化深度が異なって決定される。したがって、一つの最大符号化単位に対して、符号化深度が一つ以上設定され、最大符号化単位のデータは、一つ以上の符号化深度の符号化単位によって区画される。
したがって、一実施形態による符号化単位決定部120は、現在の最大符号化単位に含まれるツリー構造による符号化単位が決定される。一実施形態による‘ツリー構造による符号化単位’は、現在の最大符号化単位に含まれる全ての深度別の符号化単位のうち、符号化深度として決定された深度の符号化単位を含む。符号化深度の符号化単位は、最大符号化単位内で、同一領域では深度によって階層的に決定され、他の領域では独立して決定される。同様に、現在の領域についての符号化深度は、他の領域についての符号化深度と独立して決定される。
一実施形態による最大深度は、最大符号化単位から最小符号化単位までの分割回数に係る指標である。一実施形態による第1最大深度は、最大符号化単位から最小符号化単位までの総分割回数を表す。一実施形態による第2最大深度は、最大符号化単位から最小符号化単位までの深度レベルの総個数を表す。例えば、最大符号化単位の深度が0であるとする時、最大符号化単位が1回分割された符号化単位の深度は、1に設定され、2回分割された符号化単位の深度は、2に設定される。その場合、最大符号化単位から4回分割された符号化単位が最小符号化単位であれば、深度0、1、2、3及び4の深度レベルが存在するので、第1最大深度は4、第2最大深度は5に設定される。
最大符号化単位の予測符号化及び周波数変換が行われる。予測符号化及び周波数変換も同様に、最大符号化単位ごとに、最大深度以下の深度ごとに、深度別の符号化単位に基づいて行われる。
最大符号化単位が深度別に分割される度に、深度別の符号化単位の個数が増加するので、深度が深くなるにつれて生成される全ての深度別の符号化単位に対して、予測符号化及び周波数変換を含む符号化が行われなければならない。以下、説明の便宜上、少なくとも一つの最大符号化単位のうち、現在の深度の符号化単位に基づいて、予測符号化及び周波数変換を説明する。
一実施形態によるビデオ符号化装置100は、映像データの符号化のためのデータ単位のサイズまたは形態を多様に選択可能である。映像データの符号化のためには、予測符号化、周波数変換、エントロピー符号化などのステップを経るが、全てのステップにわたって、同一なデータ単位が使われてもよく、ステップ別にデータ単位が変更されてもよい。
例えば、ビデオ符号化装置100は、映像データの符号化のための符号化単位だけでなく、符号化単位の映像データの予測符号化を行うために、符号化単位と異なるデータ単位を選択する。
最大符号化単位の予測符号化のためには、一実施形態による符号化深度の符号化単位、すなわち、それ以上分割されない符号化単位に基づいて、予測符号化が行われる。以下、予測符号化の基本となるそれ以上分割されない符号化単位を、‘予測単位’とする。予測単位が分割されたパーティションは、予測単位と、予測単位の高さ及び幅のうち少なくとも一つが分割されたデータ単位とを含む。
例えば、サイズ2N×2N(ただし、Nは、正の整数)の符号化単位がそれ以上分割されない場合、サイズ2N×2Nの予測単位となり、パーティションのサイズは、2N×2N、2N×N、N×2N、N×Nなどである。一実施形態によるパーティションタイプは、予測単位の高さまたは幅が対称的な割合で分割された対称的なパーティションだけでなく、1:nまたはn:1のように非対称的な割合で分割されたパーティション、幾何学的な形態に分割されたパーティション、任意の形態のパーティションなどを選択的に含んでもよい。
予測単位の予測モードは、イントラモード、インターモード及びスキップモードのうち少なくとも一つである。例えば、イントラモード及びインターモードは、2N×2N、2N×N、N×2N、N×Nサイズのパーティションに対して行われる。また、スキップモードは、2N×2Nサイズのパーティションに対してのみ行われる。符号化単位以内の一つの予測単位ごとに、独立して符号化が行われて、符号化誤差の最も小さい予測モードが選択される。
また、一実施形態によるビデオ符号化装置100は、映像データの符号化のための符号化単位だけでなく、符号化単位と異なるデータ単位に基づいて、符号化単位の映像データの周波数変換を行う。
符号化単位の周波数変換のためには、符号化単位よりも小さいか、またはそれと同じサイズのデータ単位に基づいて、周波数変換が行われる。例えば、周波数変換のためのデータ単位は、イントラモードのためのデータ単位と、インターモードのためのデータ単位とを含む。
以下、周波数変換の基本となるデータ単位を、‘変換単位’とする。符号化単位と類似した方式によって、符号化単位内の変換単位も、再帰的にさらに小さいサイズの変換単位に分割されつつ、符号化単位のレジデュアルデータが、変換深度によって、ツリー構造による変換単位によって区画される。
一実施形態による変換単位に対しても、符号化単位の高さ及び幅が分割され、変換単位に達するまでの分割回数を表す変換深度が設定される。例えば、サイズ2N×2Nの現在の符号化単位の変換単位のサイズが2N×2Nであれば、変換深度は0、変換単位のサイズがN×Nであれば、変換深度は1、変換単位のサイズがN/2×N/2であれば、変換深度は2に設定される。すなわち、変換単位に対しても、変換深度によって、ツリー構造による変換単位が設定される。
符号化深度別の符号化情報は、符号化深度だけでなく、予測関連情報及び周波数変換関連情報が必要である。したがって、符号化単位決定部120は、最小符号化誤差を発生させた符号化深度だけでなく、予測単位をパーティションに分割したパーティションタイプ、予測単位別の予測モード、周波数変換のための変換単位のサイズなどを決定する。
一実施形態による最大符号化単位のツリー構造による符号化単位及びパーティションの決定方式については、図3ないし図12を参照して詳細に後述する。
符号化単位決定部120は、深度別の符号化単位の符号化誤差を、ラグランジュ乗数に基づいた率−歪曲最適化技法を利用して測定する。
出力部130は、符号化単位決定部120で決定された少なくとも一つの符号化深度に基づいて符号化された最大符号化単位の映像データ、及び深度別の符号化モードに係る情報を、ビットストリームの形態で出力する。
符号化された映像データは、映像のレジデュアルデータの符号化結果である。
深度別の符号化モードに係る情報は、符号化深度情報、予測単位のパーティションタイプ情報、予測モード情報、変換単位のサイズ情報などを含む。
符号化深度情報は、現在の深度で符号化せず、下位深度の符号化単位で符号化するか否かを表す深度別の分割情報を利用して定義される。現在の符号化単位の現在の深度が符号化深度であれば、現在の符号化単位は、現在の深度の符号化単位で符号化されるので、現在の深度の分割情報は、それ以上下位深度に分割されないように定義される。逆に、現在の符号化単位の現在の深度が符号化深度でなければ、下位深度の符号化単位を利用した符号化を試みなければならないので、現在の深度の分割情報は、下位深度の符号化単位に分割されるように定義される。
現在の深度が符号化深度でなければ、下位深度の符号化単位に分割された符号化単位に対して、符号化が行われる。現在の深度の符号化単位内に、下位深度の符号化単位が一つ以上存在するので、それぞれの下位深度の符号化単位ごとに、反復的に符号化が行われて、同一な深度の符号化単位ごとに、再帰的に符号化が行われる。
一つの最大符号化単位内に、ツリー構造の符号化単位が決定され、符号化深度の符号化単位ごとに、少なくとも一つの符号化モードに係る情報が決定されなければならないので、一つの最大符号化単位に対しては、少なくとも一つの符号化モードに係る情報が決定される。また、最大符号化単位のデータは、深度によって階層的に区画されて、位置別に符号化深度が異なるので、データに対して、符号化深度及び符号化モードに係る情報が設定される。
したがって、一実施形態による出力部130は、最大符号化単位に含まれている符号化単位、予測単位及び最小単位のうち少なくとも一つに対して、当該符号化深度及び符号化モードに係る符号化情報を割り当てる。
一実施形態による最小単位は、最下位符号化深度である最小符号化単位が4分割されたサイズの正方形のデータ単位であり、最大符号化単位に含まれる全ての符号化単位、予測単位及び変換単位内に含まれる最大サイズの正方形のデータ単位である。
例えば、出力部130を通じて出力される符号化情報は、深度別の符号化単位別の符号化情報と、予測単位別の符号化情報とに分けられる。深度別の符号化単位別の符号化情報は、予測モード情報及びパーティションサイズ情報を含む。予測単位別に伝送される符号化情報は、インターモードの推定方向に係る情報、インターモードの参照映像インデックスに係る情報、動きベクトルに係る情報、イントラモードのクロマ成分に係る情報、イントラモードの補間方式に係る情報などを含む。また、ピクチャ、スライスまたはGOP別に定義される符号化単位の最大サイズに係る情報、及び最大深度に係る情報は、ビットストリームのヘッダに挿入される。
ビデオ符号化装置100の最も簡単な実施形態によれば、深度別の符号化単位は、一階層上位深度の符号化単位の高さ及び幅を半分にしたサイズの符号化単位である。すなわち、現在の深度の符号化単位のサイズが2N×2Nであれば、下位深度の符号化単位のサイズは、N×Nである。また、2N×2Nサイズの現在の符号化単位は、N×Nサイズの下位深度の符号化単位を最大四つ含む。
したがって、一実施形態によるビデオ符号化装置100は、現在のピクチャの特性を考慮して決定された最大符号化単位のサイズ及び最大深度に基づいて、それぞれの最大符号化単位ごとに最適の形態及びサイズの符号化単位を決定して、ツリー構造による符号化単位を構成する。また、それぞれの最大符号化単位ごとに、多様な予測モード、周波数変換方式などにより符号化するので、多様な映像サイズの符号化単位の映像特性を考慮して、最適の符号化モードが決定される。
したがって、映像の解像度が高すぎるか、またはデータ量が多すぎる映像を既存のマクロブロック単位で符号化すれば、ピクチャ当たりマクロブロックの数が過度に多くなる。それによって、マクロブロックごとに生成される圧縮情報も多くなるので、圧縮情報の伝送負担が大きくなり、データ圧縮効率が低下する傾向がある。したがって、一実施形態によるビデオ符号化装置は、映像のサイズを考慮して、符号化単位の最大サイズを増大させつつ、映像特性を考慮して、符号化単位を調節できるので、映像圧縮効率が向上する。
図2は、本発明の一実施形態によるビデオ復号化装置を示すブロック図である。一実施形態によるビデオ復号化装置200は、受信部210、映像データ及び符号化情報抽出部220、及び映像データ復号化部230を備える。一実施形態によるビデオ復号化装置200の各種のプロセッシングのための符号化単位、深度、予測単位、変換単位、各種の符号化モードに係る情報などの各種の用語の定義は、図1及びビデオ符号化装置100を参照して説明した通りである。
受信部210は、符号化されたビデオについてのビットストリームを受信して、パージングする。映像データ及び符号化情報抽出部220は、パージングされたビットストリームから、最大符号化単位別にツリー構造による符号化単位によって、符号化単位ごとに符号化された映像データを抽出して、映像データ復号化部230に出力する。映像データ及び符号化情報抽出部220は、現在のピクチャについてのヘッダから、現在のピクチャの符号化単位の最大サイズに係る情報を抽出する。
また、映像データ及び符号化情報抽出部220は、パージングされたビットストリームから、最大符号化単位別に、ツリー構造による符号化単位についての符号化深度及び符号化モードに係る情報を抽出する。抽出された符号化深度及び符号化モードに係る情報は、映像データ復号化部230に出力される。すなわち、ビット列の映像データを最大符号化単位に分割して、映像データ復号化部230が最大符号化単位ごとに映像データを復号化する。
最大符号化単位別の符号化深度及び符号化モードに係る情報は、一つ以上の符号化深度情報について設定され、符号化深度別の符号化モードに係る情報は、当該符号化単位のパーティションタイプ情報、予測モード情報、及び変換単位のサイズ情報などを含む。また、符号化深度情報として、深度別の分割情報が抽出されることも可能である。
映像データ及び符号化情報抽出部220が抽出した最大符号化単位別の符号化深度及び符号化モードに係る情報は、一実施形態によるビデオ符号化装置100のように符号化端で、最大符号化単位別の深度別の符号化単位ごとに、反復的に符号化を行って、最小符号化誤差を発生させることによって決定された符号化深度及び符号化モードに係る情報である。したがって、ビデオ復号化装置200は、最小符号化誤差を発生させる符号化方式によって、データを復号化して、映像を復元する。
一実施形態による符号化深度及び符号化モードに係る符号化情報は、当該符号化単位、予測単位及び最小単位のうち、所定のデータ単位に対して割り当てられているので、映像データ及び符号化情報抽出部220は、所定のデータ単位別に、符号化深度及び符号化モードに係る情報を抽出する。所定のデータ単位別に、当該最大符号化単位の符号化深度及び符号化モードに係る情報が記録されていれば、同一な符号化深度及び符号化モードに係る情報を有している所定のデータ単位は、同一な最大符号化単位に含まれるデータ単位と類推される。
映像データ復号化部230は、最大符号化単位別の符号化深度及び符号化モードに係る情報に基づいて、それぞれの最大符号化単位の映像データを復号化して、現在のピクチャを復元する。すなわち、映像データ復号化部230は、最大符号化単位に含まれるツリー構造による符号化単位のうち、それぞれの符号化単位ごとに、読み取られたパーティションタイプ、予測モード及び変換単位に基づいて、符号化された映像データを復号化する。復号化過程は、イントラ予測及び動き補償を含む予測過程と、周波数逆変換過程とを含む。
映像データ復号化部230は、符号化深度別の符号化単位の予測単位のパーティションタイプ情報及び予測モード情報に基づいて、符号化単位ごとに、それぞれのパーティション及び予測モードによって、イントラ予測または動き補償を行う。
また、映像データ復号化部230は、最大符号化単位別の周波数逆変換のために、符号化深度別の符号化単位の変換単位のサイズ情報に基づいて、符号化単位ごとに、それぞれの変換単位によって、周波数逆変換を行う。
映像データ復号化部230は、深度別の分割情報を利用して、現在の最大符号化単位の符号化深度を決定する。若し、分割情報が現在の深度からそれ以上分割されないことを表していれば、現在の深度が符号化深度である。したがって、映像データ復号化部230は、現在の最大符号化単位の映像データに対して、現在の深度の符号化単位を、予測単位のパーティションタイプ、予測モード及び変換単位サイズ情報を利用して復号化する。
すなわち、符号化単位、予測単位及び最小単位のうち、所定のデータ単位に対して設定されている符号化情報を観察して、同一な分割情報を含む符号化情報を保有しているデータ単位が集まって、映像データ復号化部230によって、同一な符号化モードで復号化する一つのデータ単位であると見なされる。
一実施形態によるビデオ復号化装置200は、符号化過程で最大符号化単位ごとに再帰的に符号化を行って、最小符号化誤差を発生させた符号化単位に係る情報を獲得して、現在のピクチャについての復号化に利用する。すなわち、最大符号化単位ごとに、最適符号化単位に決定されたツリー構造による符号化単位の符号化された映像データの復号化が可能になる。
したがって、高い解像度の映像、またはデータ量が多すぎる映像であるとしても、符号化端から伝送された最適符号化モードに係る情報を利用して、映像の特性に適応的に決定された符号化単位のサイズ及び符号化モードによって、効率的に映像データを復号化して復元する。
以下、図3ないし図13を参照して、本発明の一実施形態によるツリー構造による符号化単位、予測単位及び変換単位の決定方式を詳細に説明する。
図3は、階層的な符号化単位の概念を示す。
符号化単位の例は、符号化単位のサイズが幅×高さで表現され、サイズ64×64の符号化単位から32×32,16×16,8×8を含む。サイズ64×64の符号化単位は、サイズ64×64,64×32,32×64,32×32のパーティションに分割され、サイズ32×32の符号化単位は、サイズ32×32,32×16,16×32,16×16のパーティションに分割され、サイズ16×16の符号化単位は、サイズ16×16,16×8,8×16,8×8のパーティションに分割され、サイズ8×8の符号化単位は、サイズ8×8,8×4,4×8,4×4のパーティションに分割される。
ビデオデータ310については、解像度が1920×1080、符号化単位の最大サイズが64、最大深度が2に設定されている。ビデオデータ320については、解像度が1920×1080、符号化単位の最大サイズが64、最大深度が3に設定されている。ビデオデータ330については、解像度が352×288、符号化単位の最大サイズが16、最大深度が1に設定されている。図3に示した最大深度は、最大符号化単位から最小符号化単位までの総分割回数を表す。
解像度が高いか、またはデータ量が多い場合、符号化効率の向上だけでなく、映像特性を正確に反映するために、符号化サイズの最大サイズが相対的に大きいことが望ましい。したがって、ビデオデータ330よりも解像度が高いビデオデータ310,320は、符号化サイズの最大サイズが64に選択される。
ビデオデータ310の最大深度は2であるので、ビデオデータ310の符号化単位315は、長軸サイズが64である最大符号化単位から、2回分割されて深度が二階層深くなって、長軸サイズが32、16である符号化単位まで含む。一方、ビデオデータ330の最大深度は1であるので、ビデオデータ330の符号化単位335は、長軸サイズが16である符号化単位から、1回分割されて深度が一階層深くなって、長軸サイズが8である符号化単位まで含む。
ビデオデータ320の最大深度は3であるので、ビデオデータ320の符号化単位325は、長軸サイズが64である最大符号化単位から、3回分割されて深度が三階層深くなって、長軸サイズが32、16、8である符号化単位まで含む。深度が深くなるほど、詳細情報の表現能が向上する。
図4は、本発明の一実施形態による符号化単位に基づいた映像符号化部を示すブロック図である。
一実施形態による映像符号化部400は、ビデオ符号化装置100の符号化単位決定部120で、映像データを符号化するのに経る作業を含む。すなわち、イントラ予測部410は、現在のフレーム405のうち、イントラモードの符号化単位に対して、イントラ予測を行い、動き推定部420及び動き補償部425は、インターモードの現在のフレーム405及び参照フレーム495を利用して、インター推定及び動き補償を行う。
イントラ予測部410、動き推定部420及び動き補償部425から出力されたデータは、周波数変換部430及び量子化部440を経て、量子化された変換係数として出力される。量子化された変換係数は、逆量子化部460及び周波数逆変換部470を通じて、空間領域のデータに復元され、復元された空間領域のデータは、デブロッキング部480及びループフィルタリング部490を経て後処理されて、参照フレーム495として出力される。量子化された変換係数は、エントロピー符号化部450を経て、ビットストリーム455として出力される。
一実施形態によるビデオ符号化装置100に適用されるためには、映像符号化部400の構成要素であるイントラ予測部410、動き推定部420、動き補償部425、周波数変換部430、量子化部440、エントロピー符号化部450、逆量子化部460、周波数逆変換部470、デブロッキング部480及びループフィルタリング部490がいずれも、最大符号化単位ごとに、最大深度を考慮して、ツリー構造による符号化単位のうち、それぞれの符号化単位に基づいた作業を行わなければならない。
特に、イントラ予測部410、動き推定部420及び動き補償部425は、現在の最大符号化単位の最大サイズ及び最大深度を考慮して、ツリー構造による符号化単位のうち、それぞれの符号化単位のパーティション及び予測モードを決定し、周波数変換部430は、ツリー構造による符号化単位のうち、それぞれの符号化単位内の変換単位のサイズを決定しなければならない。
図5は、本発明の一実施形態による符号化単位に基づいた映像復号化部を示すブロック図である。
ビットストリーム505が、パージング部510を経て、復号化対象である符号化された映像データ、及び復号化のために必要な符号化に係る情報がパージングされる。符号化された映像データは、エントロピー復号化部520及び逆量子化部530を経て、逆量子化されたデータとして出力され、周波数逆変換部540を経て、空間領域の映像データが復元される。
空間領域の映像データに対して、イントラ予測部550は、イントラモードの符号化単位に対してイントラ予測を行い、動き補償部560は、参照フレーム585を共に利用して、インターモードの符号化単位に対して動き補償を行う。
イントラ予測部550及び動き補償部560を経た空間領域のデータは、デブロッキング部570及びループフィルタリング部580を経て後処理されて、復元フレーム595として出力される。また、デブロッキング部570及びループフィルタリング部580を経て後処理されたデータは、参照フレーム585として出力される。
ビデオ復号化装置200の映像データ復号化部230で、映像データを復号化するために、一実施形態による映像復号化部500のパージング部510以後のステップ別の作業が行われる。
一実施形態によるビデオ復号化装置200に適用されるためには、映像復号化部500の構成要素であるパージング部510、エントロピー復号化部520、逆量子化部530、周波数逆変換部540、イントラ予測部550、動き補償部560、デブロッキング部570及びループフィルタリング部580がいずれも、最大符号化単位ごとに、ツリー構造による符号化単位に基づいて、作業を行わなければならない。
特に、イントラ予測部550及び動き補償部560は、ツリー構造による符号化単位ごとに、パーティション及び予測モードを決定し、周波数逆変換部540は、符号化単位ごとに、変換単位のサイズを決定しなければならない。
図6は、本発明の一実施形態による深度別の符号化単位及びパーティションを示す。
一実施形態によるビデオ符号化装置100、及び一実施形態によるビデオ復号化装置200は、映像の特性を考慮するために、階層的な符号化単位を使用する。符号化単位の最大高さ及び幅、最大深度は、映像の特性によって適応的に決定されてもよく、ユーザの要求に応じて多様に設定されてもよい。既定の符号化単位の最大サイズによって、深度別の符号化単位のサイズが決定される。
一実施形態による符号化単位の階層構造600は、符号化単位の最大高さ及び幅が64であり、最大深度が4である場合を示している。一実施形態による符号化単位の階層構造600の縦軸に沿って、深度が深くなるので、深度別の符号化単位の高さ及び幅がそれぞれ分割される。また、符号化単位の階層構造600の横軸に沿って、それぞれの深度別の符号化単位の予測符号化の基本となる予測単位及びパーティションが示されている。
すなわち、符号化単位610は、符号化単位の階層構造600で最大符号化単位であって、深度が0であり、符号化単位のサイズ、すなわち、高さ及び幅が64×64である。縦軸に沿って深度が深くなり、サイズ32×32である深度1の符号化単位620、サイズ16×16である深度2の符号化単位630、サイズ8×8である深度3の符号化単位640、及びサイズ4×4である深度4の符号化単位650が存在する。サイズ4×4である深度4の符号化単位650は、最小符号化単位である。
それぞれの深度別に横軸に沿って、符号化単位の予測単位及びパーティションが配列される。すなわち、深度0のサイズ64×64の符号化単位610が予測単位であれば、予測単位は、サイズ64×64の符号化単位610に含まれるサイズ64×64のパーティション610、サイズ64×32のパーティション612、サイズ32×64のパーティション614、及びサイズ32×32のパーティション616に分割される。
同様に、深度1のサイズ32×32の符号化単位620の予測単位は、サイズ32×32の符号化単位620に含まれるサイズ32×32のパーティション620、サイズ32×16のパーティション622、サイズ16×32のパーティション624、及びサイズ16×16のパーティション626に分割される。
同様に、深度2のサイズ16×16の符号化単位630の予測単位は、サイズ16×16の符号化単位630に含まれるサイズ16×16のパーティション630、サイズ16×8のパーティション632、サイズ8×16のパーティション634、及びサイズ8×8のパーティション636に分割される。
同様に、深度3のサイズ8×8の符号化単位640の予測単位は、サイズ8×8の符号化単位640に含まれるサイズ8×8のパーティション640、サイズ8×4のパーティション642、サイズ4×8のパーティション644、及びサイズ4×4のパーティション646に分割される。
最後に、深度4のサイズ4×4の符号化単位650は、最小符号化単位であり、かつ最下位深度の符号化単位であり、当該予測単位も、サイズ4×4のパーティション650のみに設定される。
一実施形態によるビデオ符号化装置100の符号化単位決定部120は、最大符号化単位610の符号化深度を決定するために、最大符号化単位610に含まれるそれぞれの深度の符号化単位ごとに、符号化を行わなければならない。
同一な範囲及びサイズのデータを含むための深度別の符号化単位の個数は、深度が深くなるほど増加する。例えば、深度1の符号化単位が一つ含まれるデータに対して、深度2の符号化単位は四つ必要である。したがって、同一なデータの符号化結果を深度別に比較するために、一つの深度1の符号化単位、及び四つの深度2の符号化単位を利用して、それぞれ符号化されなければならない。
それぞれの深度別の符号化のためには、符号化単位の階層構造600の横軸に沿って、深度別の符号化単位の予測単位ごとに符号化を行って、当該深度で最小符号化誤差である代表符号化誤差が選択される。また、符号化単位の階層構造600の縦軸に沿って、深度が深くなり、それぞれの深度ごとに符号化を行って、深度別の代表符号化誤差を比較して、最小符号化誤差が検索される。最大符号化単位610のうち、最小符号化誤差が発生する深度及びパーティションが、最大符号化単位610の符号化深度及びパーティションタイプとして選択される。
図7は、本発明の一実施形態による符号化単位と変換単位の関係を示す。
一実施形態によるビデオ符号化装置100、または一実施形態によるビデオ復号化装置200は、最大符号化単位ごとに、最大符号化単位よりも小さいか、またはそれと同じサイズの符号化単位の映像を符号化または復号化する。符号化過程で周波数変換のための変換単位のサイズは、それぞれの符号化単位よりも大きくないデータ単位に基づいて選択される。
例えば、一実施形態によるビデオ符号化装置100、または一実施形態によるビデオ復号化装置200において、現在の符号化単位710が64×64サイズである時、32×32サイズの変換単位720を利用して、周波数変換が行われる。
また、64×64サイズの符号化単位710のデータを、64×64サイズ以下の32×32,16×16,8×8,4×4サイズの変換単位にそれぞれ周波数変換を行って符号化した後、原本との誤差が最も小さい変換単位が選択される。
図8は、本発明の一実施形態による深度別の符号化情報を示す。一実施形態によるビデオ符号化装置100の出力部130は、符号化モードに係る情報として、それぞれの符号化深度の符号化単位ごとに、パーティションタイプに係る情報800、予測モードに係る情報810、及び変換単位サイズに係る情報820を符号化して伝送する。
パーティションタイプに係る情報800は、現在の符号化単位の予測符号化のためのデータ単位として、現在の符号化単位の予測単位が分割されたパーティションの形態に係る情報を表す。例えば、サイズ2N×2Nの現在の符号化単位CU_0は、サイズ2N×2Nのパーティション802、サイズ2N×Nのパーティション804、サイズN×2Nのパーティション806、及びサイズN×Nのパーティション808のうちいずれか一つのタイプに分割されて利用される。この場合、現在の符号化単位のパーティションタイプに係る情報800は、サイズ2N×2Nのパーティション802、サイズ2N×Nのパーティション804、サイズN×2Nのパーティション806、及びサイズN×Nのパーティション808のうち一つを表すように設定される。
予測モードに係る情報810は、それぞれのパーティションの予測モードを表す。例えば、予測モードに係る情報810を通じて、パーティションタイプに係る情報800が表すパーティションが、イントラモード812、インターモード814及びスキップモード816のうち一つで予測符号化が行われるかが設定される。
また、変換単位サイズに係る情報820は、現在の符号化単位を、どの変換単位に基づいて、周波数変換を行うかを表す。例えば、変換単位は、第1イントラ変換単位サイズ822、第2イントラ変換単位サイズ824、第1インター変換単位サイズ826、及び第2イントラ変換単位サイズ828のうち一つである。
一実施形態によるビデオ復号化装置200の映像データ及び符号化情報抽出部220は、それぞれの深度別の符号化単位ごとに、パーティションタイプに係る情報800、予測モードに係る情報810、及び変換単位サイズに係る情報820を抽出して、復号化に利用可能である。
図9は、本発明の一実施形態による深度別の符号化単位を示す。
深度の変化を表すために、分割情報が利用される。分割情報は、現在の深度の符号化単位が、下位深度の符号化単位に分割されるか否かを表す。
深度0及びサイズ2N_0×2N_0の符号化単位900の予測符号化のための予測単位910は、サイズ2N_0×2N_0のパーティションタイプ912、サイズ2N_0×N_0のパーティションタイプ914、サイズN_0×2N_0のパーティションタイプ916、及びサイズN_0×N_0のパーティションタイプ918を含む。予測単位が対称的な割合で分割されたパーティション912,914,916,918のみが例示されているが、前述したように、パーティションタイプは、それらに限定されず、非対称的なパーティション、任意の形態のパーティション、幾何学的な形態のパーティションなどを含む。
パーティションタイプごとに、一つのサイズ2N_0×2N_0のパーティション、二つのサイズ2N_0×N_0のパーティション、二つのサイズN_0×2N_0のパーティション、及び四つのサイズN_0×N_0のパーティションごとに、反復的に予測符号化が行わなければならない。サイズ2N_0×2N_0、サイズN_0×2N_0、サイズ2N_0×N_0、及びサイズN_0×N_0のパーティションについては、イントラモード及びインターモードで予測符号化が行われる。スキップモードは、サイズ2N_0×2N_0のパーティションに対してのみ、予測符号化が行われる。
サイズ2N_0×2N_0、2N_0×N_0及びN_0×2N_0のパーティションタイプ912,914,916のうち一つによる符号化誤差が最も小さければ、それ以上下位深度に分割する必要がない。
サイズN_0×N_0のパーティションタイプ918による符号化誤差が最も小さければ、深度0を1に変更して分割し(920)、深度2及びサイズN_0×N_0のパーティションタイプの符号化単位930に対して、反復的に符号化を行って、最小符号化誤差を検索する。
深度1及びサイズ2N_1×2N_1(=N_0×N_0)の符号化単位930の予測符号化のための予測単位940は、サイズ2N_1×2N_1のパーティションタイプ942、サイズ2N_1×N_1のパーティションタイプ944、サイズN_1×2N_1のパーティションタイプ946、及びサイズN_1×N_1のパーティションタイプ948を含む。
また、サイズN_1×N_1のパーティションタイプ948による符号化誤差が最も小さければ、深度1を2に変更して分割し(950)、深度2及びサイズN_2×N_2の符号化単位960に対して、反復的に符号化を行って、最小符号化誤差を検索する。
最大深度がdである場合、深度別の分割情報は、深度がd−1になるまで設定され、分割情報は、深度d−2まで設定される。すなわち、深度d−2から分割されて(970)、深度d−1まで符号化が行われる場合、深度d−1及びサイズ2N_(d−1)×2N_(d−1)の符号化単位980の予測符号化のための予測単位990は、サイズ2N_(d−1)×2N_(d−1)のパーティションタイプ992、サイズ2N_(d−1)×N_(d−1)のパーティションタイプ994、サイズN_(d−1)×2N_(d−1)のパーティションタイプ996、及びサイズN_(d−1)×N_(d−1)のパーティションタイプ998を含む。
パーティションタイプのうち、一つのサイズ2N_(d−1)×2N_(d−1)のパーティション、二つのサイズ2N_(d−1)×N_(d−1)のパーティション、二つのサイズN_(d−1)×2N_(d−1)のパーティション、及び四つのサイズN_(d−1)×N_(d−1)のパーティションごとに、反復的に予測符号化を通じた符号化が行われて、最小符号化誤差が発生するパーティションタイプが検索される。
サイズN_(d−1)×N_(d−1)のパーティションタイプ998による符号化誤差が最も小さいとしても、最大深度がdであるので、深度d−1の符号化単位CU_(d−1)は、それ以上下位深度への分割過程を経ず、現在の最大符号化単位900についての符号化深度が、深度d−1として決定され、パーティションタイプは、N_(d−1)×N_(d−1)として決定される。また、最大深度がdであるので、深度d−1の符号化単位952に対して、分割情報は設定されていない。
データ単位999は、現在の最大符号化単位についての‘最小単位’であると呼ばれる。一実施形態による最小単位は、最下位符号化深度である最小符号化単位が4分割されたサイズの正方形のデータ単位である。かかる反復的な符号化過程を通じて、一実施形態によるビデオ符号化装置100は、符号化単位900の深度別の符号化誤差を比較して、最小符号化誤差が発生する深度を選択して、符号化深度を決定し、当該パーティションタイプ及び予測モードが、符号化深度の符号化モードとして設定される。
このように、深度0,1,…,d−1,dの全ての深度別の最小符号化誤差を比較して、誤差が最も小さい深度が選択されて、符号化深度として決定される。符号化深度、予測単位のパーティションタイプ及び予測モードは、符号化モードに係る情報として符号化されて伝送される。また、深度0から符号化深度に達するまで、符号化単位が分割されなければならないので、符号化深度の分割情報のみが‘0’に設定され、符号化深度を除いた深度別の分割情報は、‘1’に設定されなければならない。
一実施形態によるビデオ復号化装置200の映像データ及び符号化情報抽出部220は、符号化単位900についての符号化深度及び予測単位に係る情報を抽出して、符号化単位912を復号化するのに利用する。一実施形態によるビデオ復号化装置200は、深度別の分割情報を利用して、分割情報が‘0’である深度を符号化深度として把握し、当該深度についての符号化モードに係る情報を利用して復号化する。
図10、図11及び図12は、本発明の一実施形態による符号化単位、予測単位及び周波数変換単位の関係を示す。
符号化単位1010は、最大符号化単位に対して、一実施形態によるビデオ符号化装置100が決定した符号化深度別の符号化単位である。予測単位1060は、符号化単位1010のうち、それぞれの符号化深度別の符号化単位の予測単位のパーティションであり、変換単位1070は、それぞれの符号化深度別の符号化単位の変換単位である。
深度別の符号化単位1010は、最大符号化単位の深度が0であるとすれば、符号化単位1012,1054の深度が1、符号化単位1014,1016,1018,1028,1050,1052の深度が2、符号化単位1020,1022,1024,1026,1030,1032,1048の深度が3、符号化単位1040,1042,1044,1046の深度が4である。
予測単位1060のうち、一部のパーティション1014,1016,1022,1032,1048,1050,1052,1054は、符号化単位が分割された形態である。すなわち、パーティション1014,1022,1050,1054は、2N×Nのパーティションタイプであり、パーティション1016,1048,1052は、N×2Nのパーティションタイプであり、パーティション1032は、N×Nのパーティションタイプである。深度別の符号化単位1010の予測単位及びパーティションは、それぞれの符号化単位よりも小さいか、またはそれと同じである。
変換単位1070のうち、一部の符号化単位1052の映像データについては、符号化単位に比べて小さいサイズのデータ単位で、周波数変換または周波数逆変換が行われる。また、変換単位1014,1016,1022,1032,1048,1050,1052,1054は、予測単位1060のうち、当該予測単位及びパーティションと比較すれば、異なるサイズまたは形態のデータ単位である。すなわち、一実施形態によるビデオ符号化装置100、及び一実施形態によるビデオ復号化装置200は、同一な符号化単位についてのイントラ予測/動き推定/動き補償作業、及び周波数変換/逆変換作業であるとしても、それぞれ別途のデータ単位に基づいて行う。
これによって、最大符号化単位ごとに、領域別に階層的な構造の符号化単位ごとに、再帰的に符号化が行われて、最適符号化単位が決定されることによって、再帰的なツリー構造による符号化単位が構成される。符号化情報は、符号化単位に係る分割情報、パーティションタイプ情報、予測モード情報、及び変換単位サイズ情報を含む。以下、表1は、一実施形態によるビデオ符号化装置100、及び一実施形態によるビデオ復号化装置200で設定可能な一例を表す。
Figure 2014523186
一実施形態によるビデオ符号化装置100の出力部130は、ツリー構造による符号化単位についての符号化情報を出力し、一実施形態によるビデオ復号化装置200の符号化情報抽出部220は、受信されたビットストリームから、ツリー構造による符号化単位についての符号化情報を抽出する。
分割情報は、現在の符号化単位が下位深度の符号化単位に分割されるか否かを表す。現在の深度dの分割情報が0であれば、現在の符号化単位が下位符号化単位にそれ以上分割されない深度が符号化深度であるので、符号化深度に対して、パーティションタイプ情報、予測モード及び変換単位サイズ情報が定義される。分割情報によってさらに分割されなければならない場合には、分割された四つの下位深度の符号化単位ごとに独立して符号化が行わなければならない。
予測モードは、イントラモード、インターモード及びスキップモードのうち一つで表す。イントラモード及びインターモードは、全てのパーティションタイプで定義され、スキップモードは、パーティションタイプ2N×2Nのみで定義される。
パーティションタイプ情報は、予測単位の高さまたは幅が対称的な割合で分割された対称的なパーティションタイプ2N×2N、2N×N、N×2N、N×N、及び非対称的な割合で分割された非対称的なパーティションタイプ2N×nU、2N×nD、nL×2N、nR×2Nを表す。非対称的なパーティションタイプ2N×nU及び2N×nDは、それぞれ高さが1:3及び3:1に分割された形態であり、非対称的なパーティションタイプnL×2N及びnR×2Nは、それぞれ幅が1:3及び3:1に分割された形態である。
変換単位サイズは、イントラモードで二種類のサイズに、インターモードで二種類のサイズに設定される。すなわち、変換単位分割情報が0であれば、変換単位サイズが、現在の符号化単位のサイズ2N×2Nに設定される。変換単位分割情報が1であれば、現在の符号化単位が分割されたサイズの変換単位が設定される。また、サイズ2N×2Nである現在の符号化単位についてのパーティションタイプが、対称的なパーティションタイプであれば、変換単位サイズは、N×N、非対称的なパーティションタイプであれば、変換単位サイズは、N/2×N/2に設定される。
一実施形態によるツリー構造による符号化単位の符号化情報は、符号化深度の符号化単位、予測単位及び最小単位のうち少なくとも一つに対して割り当てられる。符号化深度の符号化単位は、同一な符号化情報を保有している予測単位及び最小単位を一つ以上含む。
したがって、隣接したデータ単位同士それぞれ保有している符号化情報を確認すれば、同一な符号化深度の符号化単位に含まれるか否かが確認される。また、データ単位が保有している符号化情報を利用すれば、当該符号化深度の符号化単位を確認できるので、最大符号化単位内の符号化深度の分布が類推される。
したがって、その場合、現在の符号化単位が、周辺データ単位を参照して予測する場合、現在の符号化単位に隣接する深度別の符号化単位内のデータ単位の符号化情報が直接参照されて利用される。
他の実施形態として、現在の符号化単位が、周辺符号化単位を参照して予測符号化が行われる場合、隣接する深度別の符号化単位の符号化情報を利用して、深度別の符号化単位内で、現在の符号化単位に隣接するデータが検索されることによって、周辺符号化単位が参照されることも可能である。
図13は、表1の符号化モード情報による符号化単位、予測単位及び変換単位の関係を示す。
最大符号化単位1300は、符号化深度の符号化単位1302,1304,1306,1312,1314,1316,1318を含む。そのうち一つの符号化単位1318は、符号化深度の符号化単位であるので、分割情報が0に設定される。サイズ2N×2Nの符号化単位1318のパーティションタイプ情報は、パーティションタイプ2N×2N 1322、2N×N 1324、N×2N 1326、N×N 1328、2N×nU 1332、2N×nD 1334、nL×2N 1336及びnR×2N 1338のうち一つに設定される。
パーティションタイプ情報が、対称的なパーティションタイプ2N×2N 1322、2N×N 1324、N×2N 1326及びN×N 1328のうち一つに設定されている場合、変換単位分割情報(TU size flag)が0であれば、サイズ2N×2Nの変換単位1342が設定され、変換単位分割情報が1であれば、サイズN×Nの変換単位1344が設定される。
パーティションタイプ情報が、非対称的なパーティションタイプ2N×nU 1332、2N×nD 1334、nL×2N 1336及びnR×2N 1338のうち一つに設定されている場合、変換単位分割情報(TU size flag)が0であれば、サイズ2N×2Nの変換単位1352が設定され、変換単位分割情報が1であれば、サイズN/2×N/2の変換単位1354が設定される。
以下、図4の本発明の一実施形態による映像符号化装置400のエントロピー符号化部450、及び図5の映像復号化装置500のエントロピー復号化部520で行われるエントロピー符号化及び復号化の過程について具体的に説明する。
前述したように、本発明の一実施形態による映像符号化装置400は、最大符号化単位を階層的に分割した符号化単位を利用して符号化を行う。エントロピー符号化部450は、各符号化単位に対して生成された符号化情報、例えば、量子化された変換係数、予測単位の予測モード、量子化パラメータ、動きベクトルなどの構文要素(Syntax Element:SE)をエントロピー符号化する。具体的には、エントロピー符号化部450は、構文要素に対して、コンテキストに基づいた二進算術符号化(Context-Based Binary Arithmetic Coding:CABAC)を行う。
図14は、本発明の一実施形態によるエントロピー符号化装置の構成を示すブロック図である。図14を参照すれば、一実施形態によるエントロピー符号化装置1400は、二進化部1410、コンテキストモデラー1420、及び二進算術符号化部1430を備える。また、二進算術符号化部1430は、レギュラーコーディング部1432と、バイパスコーディング部1434とを備える。
エントロピー符号化装置1400に入力される構文要素は、二進値ではないことがあるので、構文要素が二進値ではない場合、二進化部1410は、構文要素を二進化して、0または1の二進値で構成されたビン(Bin)ストリングを出力する。ビンは、0または1で構成されたストリームの各ビットを表すものであって、各ビンは、CABACを通じて符号化される。構文要素が0と1の頻度の同一なデータであれば、確率値を利用しないバイパスコーディング部1434に出力されて符号化される。
コンテキストモデラー1420は、レギュラーコーディング部1432に、現在の符号化シンボルについての確率モデルを提供する。具体的には、コンテキストモデラー1420は、以前に符号化されたシンボルに基づいて、所定の二進値の確率を決定し、現在の符号化シンボルの二進値を符号化するための二進値の発生確率を、二進算術符号化部1430に出力する。従来のH.264/AVCなどのコンテキストモデラーは、MPS(Most Probable Symbol)の発生確率と、0及び1のうちどの二進値がMPSに該当するかについての情報を表すコンテキストインデックスctxIdxとを通じて、符号化シンボルについての確率モデルを提供した。これに対し、本発明の一実施形態によるコンテキストモデラー1420は、MPSとLPS(Least Probable Symbol)とを区別せずに、予め決定された所定の二進値、例えば、“1”の発生確率を表すP(1)を、以前に符号化されたシンボルに基づいて決定し、決定された所定の二進値の確率を二進算術符号化部1430に提供する。
また、コンテキストモデラー1420は、現在の符号化シンボルの二進値によって、所定の二進値の確率を、複数個のスケーリングファクタを利用してアップデートする。具体的な所定の二進値の確率をアップデートする過程については後述する。
レギュラーコーディング部1432は、コンテキストモデラー1420から提供された所定の二進値の確率、及び現在の符号化シンボルが有する二進値に基づいて、二進算術符号化を行う。すなわち、レギュラーコーディング部1432は、コンテキストモデラー1420から提供された所定の二進値の確率に基づいて、“1”の発生確率P(1)と、“0”の発生確率P(0)とを決定し、決定された0及び1の発生確率P(0)及びP(1)に基づいて、現在の符号化シンボルの二進値によって、確率区間を表すRangeの区間を変更することによって、二進算術符号化を行う。
図15は、本発明に係る技術分野で行われる確率モデルのアップデート過程を簡略に示す図面である。図15を参照すれば、従来のH.264/AVCなどでは、確率関数での確率状態インデックスpStateIdxが決定されれば、符号化シンボルの値がMPSとして指定された値であれば、現在の確率状態state σから、LPS確率が低くなる前方向状態state σ+1に、確率状態が転移されるように、確率状態インデックスpStateIdxをアップデートし、符号化シンボルの値がMPSではない場合、すなわち、LPSとして指定された値であれば、現在の確率状態state σから、LPS確率が高くなる後方向状態state σ−k(k>0)に、確率状態が転移されるように、確率状態インデックスpStateIdxをアップデートする。例えば、現在の確率状態インデックスpStateIdxがCであるとする時、現在の符号化シンボルの値がLPSとして指定された値であれば、現在の符号化シンボルを符号化した後、確率状態インデックスpStateIdxは、Aにアップデートされる。次の符号化シンボルの値がMPSとして指定された値であれば、確率状態インデックスpStateIdxは、AからBに再びアップデートされる。
従来の確率関数は、図示したように、指数乗の形態を有する。かかる指数乗の形態の確率関数において、0に近いLPSの確率分布は非常に稠密であり、1/2に近いLPSの確率分布は非常に希薄である。したがって、かかる指数乗の形態の確率関数に基づいた場合、0と1の二進値の発生確率が類似した場合、すなわち、0と1の二進値の発生確率が1/2に近い場合には、確率が希薄に分布されるので、確率の予測エラーが増加する。また、指数乗の形態の確率関数を利用する場合、0に近い確率値を細密に表現しなければならないので、かかる確率値を表すためのビット深さが増加する。したがって、指数乗の形態の確率関数を有する確率モデルを保存するためのルックアップテーブルのサイズが増大する。また、従来の技術によれば、確率のアップデート時や確率区間の分割時、稠密な確率値を利用する場合、乗算演算量が増加して、ハードウェア的に負担となる。
したがって、本発明の一実施形態によるコンテキストモデラー1420は、均一な分布を有する確率関数に基づいて、0と1の二進値の発生確率を決定する。また、本発明の一実施形態によるコンテキストモデラー1420は、複数個のスケーリングパラメータを利用して、所定の二進値の確率をアップデートする。
以下、コンテキストモデラー1420で行われる確率モデルのアップデート過程について具体的に説明する。
CABACにおいて、確率アップデートは、下記の数式(1)によって行われる。
Figure 2014523186
数式(1)において、P_newは、アップデートされたLPSの確率であり、P_oldは、現在の符号化シンボルの算術符号化に利用されたLPSの確率であり、a(a<1である実数)は、スケーリングファクタである。以前に符号化されたシンボルの個数がN(Nは、整数)であるとする時、a=1/Nである。yは、現在の符号化シンボルがMPSの値に該当する二進値を有する場合、0の値を有し、現在の符号化シンボルがLPSの値に該当する二進値を有する場合、1の値を有する。
前記数式(1)に基づいた確率のアップデート過程において、重要なパラメータは、スケーリングファクタaである。スケーリングファクタaの値によって、全体のCABAC符号化過程がどれほど敏感に反応し、ノイズやエラーに反応しない安定性如何が決定される。適切なスケーリングファクタaの値を決定する過程は、困難かつ消耗的な過程である。
したがって、本発明の一実施形態によるコンテキストモデラー1420は、確率のアップデート時に複数個のスケーリングファクタaを利用して、複数個のアップデートされた確率を生成し、複数個のアップデートされた確率の加重平均を利用して、最終的にアップデートされた確率を決定する。
具体的には、本発明の一実施形態によるコンテキストモデラー1420は、複数個のスケーリングファクタaを利用した下記の数式(2)によって、アップデートされた複数個の確率を生成する。
Figure 2014523186
数式(2)において、P_newは、スケーリングファクタaを利用してアップデートされた所定の二進値の確率であり、P_oldは、現在の符号化シンボルの算術符号化に利用された所定の二進値の確率である。数式(2)において、P_newやP_oldは、予め設定された所定の二進値、すなわち、0または1の発生確率を表す。すなわち、本発明で利用される確率は、MPSとLPSではない特定の二進値、例えば、“1”の発生確率を表す。以下の説明では、所定の二進値が1である場合、すなわち、P_newやP_oldが“1”の発生確率を表す場合を仮定する。ただし、それに限定されず、P_newやP_oldが“0”の発生確率を表すものと設定された場合にも、本発明の実施形態による確率アップデート過程が同様に適用される。
コンテキストモデラー1420は、数式(2)に基づいて、複数個の確率P_newが獲得されれば、複数個の確率P_newの加重平均値を、下記の数式(3)のように計算する。
Figure 2014523186
βは、複数個の確率P_newに乗じられる加重値であって、全体の確率P_newの個数を考慮して、加重平均値が計算されるように設定される。
本発明の一実施形態によれば、確率のアップデート時に乗算過程を省略するために、確率として2の指数乗を利用した値を利用する。
確率pが0から2^k(kは、整数)までの整数Aを利用して、次の数式;p=A/(2^k)の形態の値を有すると仮定する。また、複数個のスケーリングファクタaも、2の指数乗を利用して、次の数式;a=1/(2^M)(Mは、整数)の形態の値を有すると仮定する。その場合、前記数式(2)は、下記の数式(4)のように、シフト演算を利用した形態に変更される。
Figure 2014523186
前述したように、本発明で利用される確率は、所定の二進値の確率であって、例えば、P_oldは、最後に符号化されたシンボルが1の値を有する確率を意味し、P_newは、次の符号化シンボルが1の値を有する確率であって、P_oldをアップデートした確率を意味する。このように、所定の二進値が“1”である場合、数式(4)において、最後に符号化されたシンボルが“1”であれば、Yは、2^k(kは、整数)の値を有し、最後に符号化されたシンボルが“0”であれば、Yは、0の値を有する。演算“>>M”は、Mビットほど右側シフトを行う演算であって、Mの値は、{3,4,5,6,7,8}のうち一つの値を有することが望ましい。前述したように、スケーリングファクタaは、a=1/(2^M)であるので、Mの値として{3,4,5,6,7,8}のうち一つを利用する場合、aは、{8,16,32,64,128,256}である。また、以前に符号化されたシンボルの個数がN(Nは、整数)であるとする時、a=1/Nに設定される。したがって、N=1/a∈{8,16,32,64,128,256}である。Nは、ウィンドウサイズとも呼ばれる。
一例として、コンテキストモデラー1420は、N0=16(すなわち、a0=1/16)、N1=128(すなわち、a1=1/128)である場合、次の数式;P0′=(Y>>4)+P0−(P0>>4);P1′=(Y>>7)+P1−(P1>>7)によって、アップデートされたP0′及びP1′を獲得し、次の数式;P=(P0′+P1′)>>1によって、最終的にアップデートされた確率Pを獲得する。
本発明の一実施形態によるCABACで利用される確率は、前述したように、MPSとLPSとを区別せずに、所定の二進値、すなわち、“1”の確率を表す。従来のLPSの確率が1/2を超えることができないのに対し、本発明の実施形態で利用される確率は、所定の二進値“1”の確率を表すので、確率が1/2を超える。
一方、CABAC符号化過程では、各スライス単位でエントロピーリセットが行われる。エントロピーリセットは、二進算術符号化が現在の確率値を廃棄し、予め設定された確率値に基づいて、新たにCABAC符号化を行うことを意味する。かかるリセット過程後に行われる確率アップデート過程において、初期値として設定される確率値は、最適の値ではなく、数回のアップデート過程を経るほど、一定の確率値に収斂する。
エントロピーリセット後に初期化される確率Pinitは、現在の量子化パラメータQP、及び現在の量子化パラメータと、参照量子化パラメータとの差値ΔQPを利用して、次の数式;Pinit=α+β*QP+γ*ΔQPによって設定される。α,β,γは、コンテキストモデルと、現在のスライス類型とによって予め設定された加重値である。また、前述したMも、スライス類型と、コンテキストモデルとに基づいて、エントロピーリセットの初期化過程ごとに変更される。
図16は、本発明の一実施形態によって、複数個のスケーリングファクタを利用した確率アップデート過程と、一つのスケーリングファクタを利用した確率アップデート過程とを比較するための図面である。
図16を参照すれば、一つのスケーリングファクタを利用して、確率をアップデートする場合1610は、確率アップデートが行われるほど、確率が速く変化して、適正値Poptimalに速く収斂するが、アップデートが反復されるほど、変動(fluctuation)が発生しやすい。数式(3)、(4)などに基づいた本発明の実施形態によって、複数個のスケーリングファクタを利用して、確率をアップデートする場合1620は、確率が速く変化しないが、アップデートされた確率が適正値Poptimal近辺に収斂した場合、変動が少なく発生して、エラーやノイズなどに敏感に反応せずに安定して動作する。
したがって、コンテキストモデラー1420は、かかる一つのスケーリングファクタを利用した場合と、複数個のスケーリングファクタを利用した確率アップデート過程とを考慮して、エントロピーリセット後に所定の回数(threshold)の間には、一つのスケーリングファクタを利用して、確率アップデートを行い、所定の回数以後には、システム安定のために、複数個のスケーリングファクタを利用した確率アップデート過程を行う。
図17は、本発明の一実施形態による所定の二進値の確率アップデート過程を示すフローチャートである。図17を参照すれば、ステップ1710において、コンテキストモデラー1420は、エントロピーリセット後にカウンター及び確率を初期化する。ステップ1720において、コンテキストモデラー1420は、初期に設定された確率を利用して、入力された符号化シンボルを二進算術符号化する。
ステップ1730において、コンテキストモデラー1420は、一つのスケーリングファクタを利用して、確率をアップデートする。ステップ1740において、コンテキストモデラー1420は、確率がアップデートされる度に、カウンターを一つずつ増加させる。ステップ1750において、コンテキストモデラー1420は、カウンターが所定の閾値に達したか否かを判断する。かかる所定の閾値は、ウィンドウサイズとして定義されもする。ステップ1760において、コンテキストモデラー1420は、最後にアップデートされた確率を利用して、入力された符号化シンボルを二進算術符号化する。ステップ1770において、コンテキストモデラー1420は、複数個のスケーリングファクタを利用して、所定の二進値の確率をアップデートする。以後のCABAC過程において、コンテキストモデラー1420は、複数個のスケーリングファクタを利用して、確率をアップデートする。
一方、二進算術符号化過程での確率区間の分割は、直接的な計算またはルックアップテーブルを利用して行われる。確率がKビットとして表現される場合、確率区間は、次の数式;L=(range*P+2^(k−1))>>kによって、確率区間のうち、現在の符号化シンボルによる確率区間Lが獲得される。
図18は、本発明の一実施形態による二進算術符号化を行う過程を示す図面である。
コンテキストモデラー1420は、所定の二進値、例えば、“1”の発生確率P(1)を二進算術符号化部1430に提供し、二進算術符号化部1430は、入力符号化シンボルの確率を考慮して、確率区間を分割して、二進算術符号化を行う。図18において、“1”の発生確率P(1)=0.8及びP(0)=0.2であると仮定する。説明のために、P(1)及びP(0)が固定された場合を説明するが、前述したように、P(1)及びP(0)の値は、符号化シンボルを符号化する度にアップデートされてもよい。二進算術符号化部1430は、先に入力されたシンボルS1が1の値を有するので、(0,1)の区間中で“1”の値の確率区間である(0,0.8)を選択し、次に入力されたシンボルS2が0の値を有するので、(0,0.8)の区間中で上側の0.2ほど該当する確率区間である(0.64,0.8)を選択し、最後に入力されたシンボルS3が1の値を有するので、(0.64,0.8)の0.8ほど該当する区間である(0.64,0.768)を最終的に決定した後、かかる区間(0.64,0.768)を表す代表値として0.75を選択し、0.75に該当する二進値0.11の小数点以下の“11”を、最終的なビットストリームとして出力する。すなわち、入力された符号化シンボル“101”は、“11”に符号化される。
図19は、本発明の一実施形態によるエントロピー符号化方法を示すフローチャートである。図19を参照すれば、ステップ1910において、二進算術符号化部1430は、現在の符号化シンボルよりも先に符号化された以前の符号化シンボルに基づいて決定された所定の二進値の確率を利用して、前記現在の符号化シンボルの二進値を算術符号化する。
ステップ1920において、コンテキストモデラー1420は、現在の符号化シンボルの二進値によって、所定の二進値の確率を、複数個のスケーリングファクタを利用してアップデートする。前述したように、コンテキストモデラー1420は、複数個のスケーリングファクタを利用して生成された複数個の確率の加重平均値を計算することによって、次の符号化シンボルに適用される確率を獲得する。また、コンテキストモデラー1420は、エントロピーリセット過程後に確率が初期化された状態で、所定の閾値までのアップデート過程では、一つのスケーリングファクタを利用して、確率が速く適正な値に収斂し、確率のアップデート回数が所定の閾値を超える後には、複数個のスケーリングファクタを利用して、確率をアップデートすることによって、全体の確率アップデート過程が適正な値に迅速かつ安定して収斂する。
図20は、本発明の一実施形態によるエントロピー復号化装置の構成を示すブロック図である。図20を参照すれば、エントロピー復号化装置2000は、コンテキストモデラー2010、レギュラーデコーディング部2020、バイパスデコーディング部2030、及び逆二進化部2040を備える。エントロピー復号化装置2000は、前述したエントロピー符号化装置1400で行われるエントロピー符号化過程の逆過程を行う。
バイパスコーディングにより符号化されたシンボルは、バイパスデコーディング部2030に出力されて復号化され、レギュラーコーディングにより符号化されたシンボルは、レギュラーデコーディング部2020によりデコーディングされる。レギュラーデコーディング部2020は、コンテキストモデラー2010から提供される現在の符号化シンボルよりも先に復号化された以前の符号化シンボルに基づいて決定された所定の二進値の確率を利用して、前記現在の符号化シンボルの二進値を算術復号化する。前述したように、二進算術符号化結果によって符号化されたシンボルとして、所定の確率区間の代表値を表す二進値が伝送されるので、レギュラーデコーディング部2020は、0及び1の発生確率を利用して、符号化されたシンボルを復号化する。
コンテキストモデラー2010は、復号化される符号化シンボルの二進値によって、所定の二進値の確率を、複数個のスケーリングファクタを利用してアップデートする。前述したように、コンテキストモデラー1420は、MPSとLPSとを区別せずに、予め決定された所定の二進値、例えば、“1”の発生確率を表すP(1)を、以前に符号化されたシンボルに基づいて決定し、決定された所定の二進値の確率を、レギュラーデコーディング部2020に提供する。逆二進化部2040は、レギュラーデコーディング部2020またはバイパスデコーディング部2030で復元されたビンストリングを、再び構文要素に復元する。
図21は、本発明の一実施形態によるエントロピー復号化方法を示すフローチャートである。図21を参照すれば、ステップ2110において、レギュラーデコーディング部2020は、現在の符号化シンボルよりも先に復号化された以前の符号化シンボルに基づいて決定された所定の二進値の確率を利用して、現在の符号化シンボルの二進値を算術復号化する。
ステップ2120において、コンテキストモデラー2010は、現在の符号化シンボルの二進値によって、所定の二進値の確率を、複数個のスケーリングファクタを利用してアップデートする。コンテキストモデラー2010は、複数個のスケーリングファクタを利用して生成された複数個の確率の加重平均値を計算することによって、次の符号化シンボルに適用される確率を獲得する。また、コンテキストモデラー2010は、エントロピーリセット過程後に確率が初期化された状態で、所定の閾値までのアップデート過程では、一つのスケーリングファクタを利用して、確率が速く適正な値に収斂し、確率のアップデート回数が所定の閾値を超えた後には、複数個のスケーリングファクタを利用して、確率をアップデートする。
本発明は、また、コンピュータで読み取り可能な記録媒体に、コンピュータで読み取り可能なコードとして具現することが可能である。コンピュータで読み取り可能な記録媒体は、コンピュータシステムにより読み取られるデータが保存される全ての種類の記録装置を含む。コンピュータで読み取り可能な記録媒体の例としては、ROM、RAM、CD−ROM、磁気テープ、フロッピー(登録商標)ディスク、光データ保存装置などが含まれる。また、コンピュータで読み取り可能な記録媒体は、ネットワークに連結されたコンピュータシステムに分散され、分散方式によって、コンピュータで読み取り可能なコードに保存されて実行される。
以上、本発明について、その望ましい実施形態を中心に述べた。当業者は、本発明が、本発明の本質的な特性から逸脱しない範囲で、変形された形態で具現可能であるということを理解できるであろう。本発明の範囲は、前述した説明ではなく、特許請求の範囲に表れており、それと同等な範囲内にある全ての相違点は、本発明に含まれたものと解釈されなければならない。

Claims (15)

  1. 映像のエントロピー符号化方法において、
    現在の符号化シンボルよりも先に符号化された以前の符号化シンボルに基づいて決定された所定の二進値の確率を利用して、前記現在の符号化シンボルの二進値を算術符号化するステップと、
    前記現在の符号化シンボルの二進値によって、前記所定の二進値の確率を、複数個のスケーリングファクタを利用してアップデートするステップと、を含むことを特徴とする映像のエントロピー符号化方法。
  2. 前記アップデートするステップは、
    前記複数個のスケーリングファクタをa(aは、1よりも小さい正の実数、iは、1以上の整数)、前記以前の符号化シンボルの情報に基づいて決定された二進値の確率をP_old、前記スケーリングファクタaを利用してアップデートされた二進値の確率をP_newとし、yは、前記現在の符号化シンボルが、前記所定の二進値を有する場合、0の値を有し、前記現在の符号化シンボルが、前記所定の二進値を有する場合、1の値を有すると仮定する時、次の数式;P_new=a*y+(1−a)*P_oldによって獲得された複数個のアップデートされた二進値の確率P_newの加重平均値を利用して、前記所定の二進値の確率をアップデートすることを特徴とする請求項1に記載の映像のエントロピー符号化方法。
  3. 前記スケーリングファクタaは、2の指数乗の値を利用して決定されることを特徴とする請求項2に記載の映像のエントロピー符号化方法。
  4. =1/(2^M)(Mは、整数)であり、前記アップデートされた二進値の確率P_newは、次の数式;P_new=(y>>M)+P_old−(P_old>>M)を利用して獲得されることを特徴とする請求項3に記載の映像のエントロピー符号化方法。
  5. 前記複数個のスケーリングファクタを利用してアップデートするステップは、
    確率値が初期化された場合、前記確率のアップデート過程の回数が所定の回数を超えた後から行われることを特徴とする請求項1に記載の映像のエントロピー符号化方法。
  6. 前記確率値が初期化された場合、前記確率のアップデート過程の回数が所定の回数以下である場合には、前記確率を、一つのスケーリングファクタを利用してアップデートすることを特徴とする請求項5に記載の映像のエントロピー符号化方法。
  7. 映像のエントロピー符号化装置において、
    現在の符号化シンボルよりも先に符号化された以前の符号化シンボルに基づいて決定された所定の二進値の確率を利用して、前記現在の符号化シンボルの二進値を算術符号化する二進算術符号化部と、
    前記現在の符号化シンボルの二進値によって、前記所定の二進値の確率を、複数個のスケーリングファクタを利用してアップデートするコンテキストモデラーと、を備えることを特徴とする映像のエントロピー符号化装置。
  8. 映像のエントロピー復号化方法において、
    現在の符号化シンボルよりも先に復号化された以前の符号化シンボルに基づいて決定された所定の二進値の確率を利用して、現在の符号化シンボルの二進値を算術復号化するステップと、
    前記現在の符号化シンボルの二進値によって、前記所定の二進値の確率を、複数個のスケーリングファクタを利用してアップデートするステップと、を含むことを特徴とする映像のエントロピー復号化方法。
  9. 前記アップデートするステップは、
    前記複数個のスケーリングファクタをa(aは、1よりも小さい正の実数、iは、1以上の整数)、前記以前の符号化シンボルの情報に基づいて決定された二進値の確率をP_old、前記スケーリングファクタaを利用してアップデートされた二進値の確率をP_newとし、yは、前記現在の符号化シンボルが、前記所定の二進値を有する場合、0の値を有し、前記現在の符号化シンボルが、前記所定の二進値を有する場合、1の値を有すると仮定する時、次の数式;P_new=a*y+(1−a)*P_oldによって獲得された複数個のアップデートされた二進値の確率P_newの加重平均値を利用して、前記所定の二進値の確率をアップデートすることを特徴とする請求項8に記載の映像のエントロピー復号化方法。
  10. 前記スケーリングファクタaは、2の指数乗の値を利用して決定されることを特徴とする請求項9に記載の映像のエントロピー復号化方法。
  11. =1/(2^M)(Mは、整数)であり、前記アップデートされた二進値の確率P_newは、次の数式;P_new=(y>>M)+P_old−(P_old>>M)を利用して獲得されることを特徴とする請求項10に記載の映像のエントロピー復号化方法。
  12. 前記複数個のスケーリングファクタを利用してアップデートするステップは、
    確率値が初期化された場合、前記確率のアップデート過程の回数が所定の回数を超えた後から行われることを特徴とする請求項8に記載の映像のエントロピー復号化方法。
  13. 前記確率値が初期化された場合、前記確率のアップデート過程の回数が所定の回数以下である場合には、前記確率を、一つのスケーリングファクタを利用してアップデートすることを特徴とする請求項12に記載の映像のエントロピー復号化方法。
  14. 映像のエントロピー復号化装置において、
    現在の符号化シンボルよりも先に復号化された以前の符号化シンボルに基づいて決定された所定の二進値の確率を利用して、前記現在の符号化シンボルの二進値を算術復号化する二進算術復号化部と、
    前記現在の符号化シンボルの二進値によって、前記所定の二進値の確率を、複数個のスケーリングファクタを利用してアップデートするコンテキストモデラーと、を備えることを特徴とする映像のエントロピー復号化装置。
  15. 請求項1に記載の方法を実行するためのコンピュータで実行可能なプログラムが記録された記録媒体。
JP2014518805A 2011-06-28 2012-06-28 エントロピー符号化/復号化方法及びその装置 Pending JP2014523186A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201161502021P 2011-06-28 2011-06-28
US61/502,021 2011-06-28
PCT/KR2012/005147 WO2013002585A2 (ko) 2011-06-28 2012-06-28 엔트로피 부호화/복호화 방법 및 장치

Publications (1)

Publication Number Publication Date
JP2014523186A true JP2014523186A (ja) 2014-09-08

Family

ID=47424689

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014518805A Pending JP2014523186A (ja) 2011-06-28 2012-06-28 エントロピー符号化/復号化方法及びその装置

Country Status (6)

Country Link
US (1) US9661326B2 (ja)
EP (1) EP2760201A4 (ja)
JP (1) JP2014523186A (ja)
KR (1) KR102106534B1 (ja)
CN (1) CN103797803A (ja)
WO (1) WO2013002585A2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018521556A (ja) * 2015-05-29 2018-08-02 クゥアルコム・インコーポレイテッドQualcomm Incorporated 高度算術コーダ
WO2019009450A1 (ko) * 2017-07-06 2019-01-10 엘지전자(주) 비디오 신호를 엔트로피 인코딩, 디코딩하는 방법 및 장치
JP2019521550A (ja) * 2016-05-12 2019-07-25 インターデジタル ヴイシー ホールディングス, インコーポレイテッド ビデオデータに関係する構文要素を表す一連の2値シンボルをコンテキスト適応型2値算術符号化するための方法及び装置

Families Citing this family (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9247257B1 (en) 2011-11-30 2016-01-26 Google Inc. Segmentation based entropy encoding and decoding
US9774856B1 (en) * 2012-07-02 2017-09-26 Google Inc. Adaptive stochastic entropy coding
US9509998B1 (en) 2013-04-04 2016-11-29 Google Inc. Conditional predictive multi-symbol run-length coding
US9392288B2 (en) 2013-10-17 2016-07-12 Google Inc. Video coding using scatter-based scan tables
US9179151B2 (en) 2013-10-18 2015-11-03 Google Inc. Spatial proximity context entropy coding
US9425822B2 (en) * 2014-08-05 2016-08-23 Broadcom Corporation Simplified range and context update for multimedia context-adaptive binary arithmetic coding design
CN105578180B (zh) * 2014-10-16 2019-01-15 联想(北京)有限公司 一种编码方法及装置
CN107113445A (zh) * 2014-11-04 2017-08-29 三星电子株式会社 用于二进制算术编/解码的概率更新方法及使用该方法的熵编/解码器
MX2017014838A (es) * 2015-05-19 2018-02-19 Mediatek Inc Metodo y aparato para codificacion aritmetica binaria adaptiva de contexto con base en multiples tablas.
WO2017065525A2 (ko) * 2015-10-13 2017-04-20 삼성전자 주식회사 영상을 부호화 또는 복호화하는 방법 및 장치
US10708164B2 (en) 2016-05-03 2020-07-07 Qualcomm Incorporated Binarizing secondary transform index
US10554988B2 (en) 2017-03-22 2020-02-04 Qualcomm Incorporated Binary arithmetic coding with parameterized probability estimation finite state machines
WO2019027074A1 (ko) * 2017-08-04 2019-02-07 엘지전자(주) 멀티 심볼 엔트로피 코딩을 위한 멀티 심볼 매핑을 수행하는 방법 및 장치
US10791341B2 (en) 2017-10-10 2020-09-29 Qualcomm Incorporated Binary arithmetic coding with progressive modification of adaptation parameters
WO2019140083A1 (en) * 2018-01-12 2019-07-18 Futurewei Technologies, Inc. Adaptive multi-hypothesis context-adaptive binary arithmetic coding (mcabac)
US11528490B2 (en) * 2018-04-13 2022-12-13 Zhejiang University Information preserving coding and decoding method and device
US10986354B2 (en) * 2018-04-16 2021-04-20 Panasonic Intellectual Property Corporation Of America Encoder, decoder, encoding method, and decoding method
US10939115B2 (en) * 2018-06-19 2021-03-02 Qualcomm Incorporated Efficient weighted probability estimation for binary arithmetic coding
US20210392330A1 (en) * 2018-10-18 2021-12-16 Samsung Electronics Co., Ltd. Entropy encoding/decoding method and apparatus
CN110474876B (zh) * 2019-07-15 2020-10-16 湖南遥昇通信技术有限公司 一种数据编码解码方法、装置、设备以及存储介质

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100454339C (zh) * 2001-09-14 2009-01-21 诺基亚有限公司 基于上下文的自适应二进制算术编码的方法和***
JP5001853B2 (ja) * 2004-12-14 2012-08-15 サムスン エレクトロニクス カンパニー リミテッド 映像符号化及び復号化装置とその方法
KR100703776B1 (ko) 2005-04-19 2007-04-06 삼성전자주식회사 향상된 코딩 효율을 갖는 컨텍스트 기반 적응적 산술 코딩및 디코딩 방법과 이를 위한 장치, 이를 포함하는 비디오코딩 및 디코딩 방법과 이를 위한 장치
KR101237413B1 (ko) * 2005-12-07 2013-02-26 삼성전자주식회사 오디오 신호의 부호화 및 복호화 방법, 오디오 신호의부호화 및 복호화 장치
US8891615B2 (en) * 2008-01-08 2014-11-18 Qualcomm Incorporated Quantization based on rate-distortion modeling for CABAC coders
JP5133950B2 (ja) 2009-07-16 2013-01-30 日本電信電話株式会社 コンテクスト適応エントロピ符号化方法および装置,コンテクスト適応エントロピ復号方法および装置,並びにそれらのプログラム
WO2011022047A1 (en) * 2009-08-21 2011-02-24 Thomson Licensing Methods and apparatus for explicit updates for symbol probabilities of an entropy encoder or decoder
HUE028417T2 (en) * 2011-01-14 2016-12-28 Ge Video Compression Llc Entropy coding and decoding scheme

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018521556A (ja) * 2015-05-29 2018-08-02 クゥアルコム・インコーポレイテッドQualcomm Incorporated 高度算術コーダ
JP2019521550A (ja) * 2016-05-12 2019-07-25 インターデジタル ヴイシー ホールディングス, インコーポレイテッド ビデオデータに関係する構文要素を表す一連の2値シンボルをコンテキスト適応型2値算術符号化するための方法及び装置
US11323714B2 (en) 2016-05-12 2022-05-03 Interdigital Vc Holdings, Inc. Method and device for context-adaptive binary arithmetic coding a sequence of binary symbols representing a syntax element related to video data
JP7162532B2 (ja) 2016-05-12 2022-10-28 インターデジタル ヴイシー ホールディングス, インコーポレイテッド ビデオデータに関係する構文要素を表す一連の2値シンボルをコンテキスト適応型2値算術符号化するための方法及び装置
WO2019009450A1 (ko) * 2017-07-06 2019-01-10 엘지전자(주) 비디오 신호를 엔트로피 인코딩, 디코딩하는 방법 및 장치

Also Published As

Publication number Publication date
WO2013002585A3 (ko) 2013-04-11
US20140177708A1 (en) 2014-06-26
EP2760201A4 (en) 2015-06-17
WO2013002585A2 (ko) 2013-01-03
EP2760201A2 (en) 2014-07-30
CN103797803A (zh) 2014-05-14
KR102106534B1 (ko) 2020-05-04
US9661326B2 (en) 2017-05-23
KR20130002298A (ko) 2013-01-07

Similar Documents

Publication Publication Date Title
JP2014523186A (ja) エントロピー符号化/復号化方法及びその装置
JP5917745B2 (ja) 階層的構造のデータ単位を利用したエントロピー符号化方法及び該装置、並びに復号化方法及び該装置
US9942567B2 (en) Parameter update method for entropy coding and decoding of conversion coefficient level, and entropy coding device and entropy decoding device of conversion coefficient level using same
US10432945B2 (en) Probability update method for binary arithmetic coding/decoding, and entropy coder/decoder using the same
JP6284954B2 (ja) イントラ予測のためのモード決定の簡略化
RU2612624C2 (ru) Способ и устройство для энтропийного кодирования видео и способ и устройство для энтропийного декодирования видео
JP5566529B2 (ja) 辞書を用いてビデオをコード化する方法
TWI590649B (zh) 視訊之算術解碼裝置
JP2013501451A (ja) 映像の符号化方法及び装置、その復号化方法及び装置
KR102600727B1 (ko) 파라미터화된 확률 추정 유한 상태 머신들을 이용한 이진 산술 코딩

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20141209

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20150526