JP2017538338A - 二進算術符号化/復号のための確率更新方法、及びそれを利用したエントロピー符号化/復号装置 - Google Patents

二進算術符号化/復号のための確率更新方法、及びそれを利用したエントロピー符号化/復号装置 Download PDF

Info

Publication number
JP2017538338A
JP2017538338A JP2017524039A JP2017524039A JP2017538338A JP 2017538338 A JP2017538338 A JP 2017538338A JP 2017524039 A JP2017524039 A JP 2017524039A JP 2017524039 A JP2017524039 A JP 2017524039A JP 2017538338 A JP2017538338 A JP 2017538338A
Authority
JP
Japan
Prior art keywords
probability
unit
value
coding
bin
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2017524039A
Other languages
English (en)
Inventor
アルシン,アレクサンダー
アルシナ,エレナ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Samsung Electronics Co Ltd
Original Assignee
Samsung Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Samsung Electronics Co Ltd filed Critical Samsung Electronics Co Ltd
Publication of JP2017538338A publication Critical patent/JP2017538338A/ja
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/149Data rate or code amount at the encoder output by estimating the code amount by means of a model, e.g. mathematical model or statistical model
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/91Entropy coding, e.g. variable length coding [VLC] or arithmetic coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/13Adaptive entropy coding, e.g. adaptive variable length coding [AVLC] or context adaptive binary arithmetic coding [CABAC]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/196Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding being specially adapted for the computation of encoding parameters, e.g. by averaging previously computed encoding parameters
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/20Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video object coding
    • H04N19/21Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video object coding with binary alpha-plane coding for video objects, e.g. context-based arithmetic encoding [CAE]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • H04N19/34Scalability techniques involving progressive bit-plane based encoding of the enhancement layer, e.g. fine granular scalability [FGS]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • H04N19/33Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability in the spatial domain

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Algebra (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Computing Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

CABAC(context-based adaptive binary arithmetic coding)に利用される確率更新方法に係り、該二進算術復号のための確率更新方法は、受信されたビンの値を利用して、各ビンの自己相関値を獲得し、自己相関値に基づいて、二進値の確率更新に利用される少なくとも1つのスケーリングファクタを決定し、決定された少なくとも1つのスケーリングファクタを利用して、CABAD(context−based adaptive binary arithmetic decoding)に利用される確率を更新する。

Description

本発明は、エントロピー符号化及びエントロピー復号に係り、さらに詳細には、コンテクスト基盤二進算術符号化/復号において、確率モデルをアップデートする方法及びその装置に関する。
H.264及びMPEG−4などにおいて、ビデオ信号は、シーケンス、フレーム、スライス、マクロブロック及びブロックに階層的に分割され、該ブロックは、最小処理ユニットになる。エンコーディングの側面で、イントラフレーム予測またはインターフレーム予測を介して、ブロックのレジデュアルデータが獲得される。また、レジデュアルデータは、変換、量子化、スキャニング、ランレングスコーディング(run length coding)及びエントロピーコーディングを介して圧縮される。エントロピーコーディング方式として、コンテクスト基盤適応的二進算術符号化(CABAC:context-based adaptive binary arithmetic coding)がある。CABACによれば、コンテクストインデックス(ctxIdx)を利用して、1つのコンテクストモデルを決定し、決定されたコンテクストモデルが有するLPS(least probable symbol)またはMPS(most probable symbol)の発生確率と、0と1とのうちいずれの二進値がMPSに該当するかということに係わる情報(valMPS)とを決定し、valMPSとLPSの確率とに基づいて二進算術符号化が行われる。
本発明が解決しようとする技術的課題は、コンテクスト基盤二進算術符号化/復号過程に遂行される確率のアップデート過程を改善することにより、映像の圧縮効率を向上させるためのものである。
本開示の実施形態において、ビン(bins)の自己相関値(autocorrelation value)またはビンのエントロピー値に基づいてスケーリングファクタを決定し、決定されたスケーリングファクタを利用して、二進算術符号化/復号に利用される確率を更新する。
本開示の実施形態によれば、ビン(bin)値とビンの予測確率との誤差値を最小化することにより、算術符号化を介して生じるビット発生量を減らすことができる。
本発明の一実施形態によるビデオ符号化装置のブロック図である。 本発明の一実施形態によるビデオ復号装置のブロック図である。 本発明の一実施形態による符号化単位の概念を図示する図面である。 本発明の一実施形態による符号化単位に基づいた映像符号化部のブロック図である。 本発明の一実施形態による符号化単位に基づいた映像復号部のブロック図である。 本発明の一実施形態による、深度別符号化単位及びパーティションを図示する図面である。 本発明の一実施形態による、符号化単位及び変換単位の関係を図示する図面である。 本発明の一実施形態による深度別符号化情報を図示する図面である。 本発明の一実施形態による深度別符号化単位を図示する図面である。 本発明の一実施形態による、符号化単位、予測単位及び周波数変換単位の関係を図示する図面である。 本発明の一実施形態による、符号化単位、予測単位及び周波数変換単位の関係を図示する図面である。 本発明の一実施形態による、符号化単位、予測単位及び周波数変換単位の関係を図示する図面である。 表1の符号化モード情報による、符号化単位、予測単位及び変換単位の関係を図示する図面である。 本発明の一実施形態によるエントロピー符号化装置の構成を示したブロック図である。 CABACに利用される確率更新過程を示した図面である。 CABACに利用される確率更新過程を示した図面である。 本開示の一実施形態による確率更新過程を示したフローチャートである。 自己相関値について説明するための参照図である。 自己相関値について説明するための参照図である。 本開示の一実施形態による、二進算術符号化のための確率更新方法を示したフローチャートである。 本開示の他の実施形態による、CABACに利用される確率更新方法を示したフローチャートである。 CABACに基づいた二進算術符号化を行う過程を示した図面である。 CABACに基づいた二進算術符号化を行う過程を示した図面である。 スケーリングファクタの個数によって、自己相関値Rに基づいて決定されたスケーリングファクタαの変化過程を示したグラフである。 スケーリングファクタの個数によるMSEの変化量を示したグラフである。 本開示の一実施形態によるエントロピー復号装置の構成を示したブロック図である。 本開示の一実施形態による二進算術復号のための確率更新方法を示したフローチャートである。 本開示の他の実施形態による二進算術復号のための確率更新方法を示したフローチャートである。
本開示の一実施形態による、二進算術復号のための確率更新方法は、二進算術復号される所定個数のビン(bins)を受信する段階と、前記受信された所定個数のビンの値を利用して、各ビンの自己相関(autocorrelation)値を獲得する段階と、前記自己相関値に基づいて、二進値の確率更新に利用される少なくとも1つのスケーリングファクタを決定する段階と、前記決定された少なくとも1つのスケーリングファクタを利用して、コンテクスト基盤適応的二進算術復号(CABAD:context−based adaptive binary arithmetic decoding)に利用される確率を更新する段階と、前記更新された確率を利用して、現在ビンを算術復号する段階と、を含むことを特徴とする。
本開示の一実施形態による二進算術符号化のための確率更新方法は、二進算術符号化される所定個数のビンを受信する段階と、前記受信された所定個数のビンの値を利用して、各ビンの自己相関値を獲得する段階と、前記自己相関値に基づいて、二進値の確率更新に利用される少なくとも1つのスケーリングファクタを決定する段階と、前記決定された少なくとも1つのスケーリングファクタを利用して、コンテクスト基盤適応的二進算術符号化(CABAC:context−based adaptive binary arithmetic coding)に利用される確率を更新する段階と、前記更新された確率を利用して、現在ビンを算術符号化する段階をと、含むことを特徴とする。
本開示の他の実施形態による二進算術復号のための確率更新方法は、二進算術復号される所定個数のビンを受信する段階と、互いに異なるスケーリングファクタを有する複数個の確率モデルを適用して、前記ビンの平均ビット値を示すエントロピー値を獲得する段階と、前記複数個の確率モデルのうち最小エントロピー値を獲得するのに利用された確率モデルが有するスケーリングファクタを決定する段階と、前記ビンに対して前記決定されたスケーリングファクタを利用した確率更新過程を含むコンテクスト基盤適応的二進算術復号(CABAD)を行う段階と、を含むことを特徴とする。
本開示の他の実施形態による二進算術符号化のための確率更新方法は、二進算術復号される所定個数のビンを受信する段階と、互いに異なるスケーリングファクタを有する複数個の確率モデルを適用して、前記ビンの平均ビット値を示すエントロピー値を獲得する段階と、前記複数個の確率モデルのうち最小エントロピー値を獲得するのに利用された確率モデルが有するスケーリングファクタを決定する段階と、前記ビンに対して、前記決定されたスケーリングファクタを利用した確率更新過程を含むコンテクスト基盤適応的二進算術符号化(CABAC)を行う段階と、を含むことを特徴とする。
本開示の一実施形態によるエントロピー復号装置は、二進値のビンを所定シンタックスエレメントの値にマッピングする逆二進化部と、二進算術復号される所定個数のビンを受信し、前記受信された所定個数のビンの値を利用して、各ビンの自己相関値を獲得し、前記自己相関値に基づいて、二進値の確率更新に利用される少なくとも1つのスケーリングファクタを決定し、前記決定された少なくとも1つのスケーリングファクタを利用して、コンテクスト基盤適応的二進算術復号(CABAD)に利用される確率を更新するコンテクストモデラと、前記更新された確率を利用して、現在ビンを算術復号するレギュラーデコーディング部と、を含むことを特徴とする。
本開示の一実施形態によるエントロピー符号化装置は、所定シンタックスエレメントの値を二進値のビンにマッピングする二進化部と、二進算術復号される所定個数のビンを受信し、前記受信された所定個数のビンの値を利用して、各ビンの自己相関値を獲得し、前記自己相関値に基づいて、二進値の確率更新に利用される少なくとも1つのスケーリングファクタを決定し、前記決定された少なくとも1つのスケーリングファクタを利用して、コンテクスト基盤適応的二進算術復号(CABAD)に利用される確率を更新するコンテクストモデラと、前記更新された確率を利用して、現在ビンを算術符号化するレギュラーコーディング部と、を含むことを特徴とする。
本開示の他の実施形態によるエントロピー復号装置は、二進値のビンを所定シンタックスエレメントの値にマッピングする逆二進化部と、二進算術復号される所定個数のビンを受信し、互いに異なるスケーリングファクタを有する複数個の確率モデルを適用し、前記ビンの平均ビット値を示すエントロピー値を獲得し、前記複数個の確率モデルのうち最小エントロピー値を獲得するのに利用された確率モデルが有するスケーリングファクタを決定し、決定されたスケーリングファクタを利用した確率更新を行うコンテクストモデラと、前記更新された確率を利用して、現在ビンを算術復号するレギュラーデコーディング部と、を含むことを特徴とする。
以下、添付された図面を参照し、本発明の望ましい実施形態について具体的に説明する。
図1は、本発明の一実施形態によるビデオ符号化装置のブロック図を図示する。
一実施形態によるビデオ符号化装置100は、最大符号化単位分割部110、符号化単位決定部120及び出力部130を含む。
最大符号化単位分割部110は、映像の現在ピクチャのための最大サイズの符号化単位である最大符号化単位に基づいて、現在ピクチャを区画することができる。現在ピクチャが最大符号化単位より大きければ、現在ピクチャの映像データは、少なくとも1つの最大符号化単位に分割される。一実施形態による最大符号化単位は、サイズ32x32,64x64,128x128,256x256などのデータ単位であり、縦横サイズが8より大きい2の累乗である正方形のデータ単位でもある。映像データは、少なくとも1つの最大符号化単位別に、符号化単位決定部120に出力される。
一実施形態による符号化単位は、最大サイズ及び深度で特徴づけられる。深度とは、最大符号化単位から、符号化単位が空間的に分割された回数を示し、深度が深くなるほど、深度別符号化単位は、最大符号化単位から最小符号化単位まで分割される。最大符号化単位の深度が最上位深度であり、最小符号化単位が最下位符号化単位と定義される。最大符号化単位は、深度が深くなるにつれ、深度別符号化単位の大きさは小さくなるので、上位深度の符号化単位は、複数個の下位深度の符号化単位を含む。
前述のように、符号化単位の最大サイズによって、現在ピクチャの映像データを最大符号化単位に分割し、それぞれの最大符号化単位は、深度別に分割される符号化単位を含む。一実施形態による最大符号化単位は、深度別に分割されるので、最大符号化単位に含まれた空間領域(spatial domain)の映像データが、深度によって階層的に分類される。
最大符号化単位の高さ及び幅を階層的に分割することができる総回数を制限する最大深度、及び符号化単位の最大サイズがあらかじめ設定されている。
符号化単位決定部120は、深度ごとに、最大符号化単位の領域が分割された少なくとも1つの分割領域を符号化し、少なくとも1つの分割領域別に最終符号化結果が出力される深度を決定する。すなわち、符号化単位決定部120は、現在ピクチャの最大符号化単位ごとに、深度別符号化単位で映像データを符号化し、最小の符号化誤差が発生する深度を選択して符号化深度と決定する。決定された符号化別深度及び最大符号化単位別の映像データは、出力部130に出力される。
最大符号化単位内の映像データは、最大深度以下の少なくとも1つの深度によって、深度別符号化単位に基づいて符号化され、それぞれの深度別符号化単位に基づいた符号化結果が比較される。深度別符号化単位の符号化誤差の比較結果、符号化誤差が最小である深度が選択される。それぞれの最大化符号化単位ごとに、少なくとも1つの符号化深度が決定される。
最大符号化単位の大きさは、深度が深くなるにつれ、符号化単位が階層的に分割されて分割され、符号化単位の個数は増加する。また、1つの最大符号化単位に含まれる同一深度の符号化単位であるとしても、それぞれのデータに対する符号化誤差を測定し、下位深度への分割いかんが決定される。従って、1つの最大符号化単位に含まれるデータであるとしても、位置によって深度別符号化誤差が異なるので、位置によって符号化深度が異なっても決定される。従って、1つの最大符号化単位に対して、符号化深度が1以上設定されもし、最大符号化単位のデータは、1以上の符号化深度の符号化単位によって区画される。
従って、一実施形態による符号化単位決定部120は、現在最大符号化単位に含まれるツリー構造による符号化単位が決定される。一実施形態による「ツリー構造による符号化単位」は、現在最大符号化単位に含まれるすべての深度別符号化単位中、符号化深度で決定された深度の符号化単位を含む。符号化深度の符号化単位は、最大符号化単位内で、同一領域では、深度によって階層的に決定され、他の領域については、独立して決定される。同様に、現在領域に対する符号化深度は、他の領域に対する符号化深度と独立して決定される。
一実施形態による最大深度は、最大符号化単位から最小符号化単位までの分割回数に係わる指標である。一実施形態による第1最大深度は、最大符号化単位から最小符号化単位までの総分割回数を示すことができる。一実施形態による第2最大深度は、最大符号化単位から最小符号化単位までの深度レベルの総個数を示すことができる。例えば、最大符号化単位の深度が0であるとするとき、最大符号化単位が1回分割された符号化単位の深度は、1に設定され、2回分割された符号化単位の深度は、2に設定される。その場合、最大符号化単位から4回分割された符号化単位が最小符号化単位であるならば、深度0、1、2、3及び4の深度レベルが存在するので、第1最大深度は、4に設定され、第2最大深度は、5に設定される。
最大符号化単位の予測符号化及び周波数変換が行われる。予測符号化及び周波数変換も、同様に、最大符号化単位ごとに、最大深度以下の深度ごとに、深度別符号化単位を基盤に行われる。
最大符号化単位が深度別に分割されるたびに、深度別符号化単位の個数が増加するので、深度が深くなるにつてて生成される全ての深度別符号化単位に対して、予測符号化及び周波数変換を含んだ符号化が行われなければならない。以下、説明の便宜のために、少なくとも1つの最大符号化単位のうち現在深度の符号化単位を基に、予測符号化及び周波数変換について説明する。
一実施形態によるビデオ符号化装置100は、映像データの符号化のためのデータ単位の大きさまたは形態を多様に選択することができる。映像データの符号化のためには、予測符号化、周波数変換、エントロピー符号化などの段階を経るが、全ての段階にわたって、同一データ単位が使用され、段階別にデータ単位が変更されてもよい。
例えば、ビデオ符号化装置100は、映像データの符号化のための符号化単位だけではなく、符号化単位の映像データの予測符号化を行うために、符号化単位と異なるデータ単位を選択することができる。
最大符号化単位の予測符号化のためには、一実施形態による符号化深度の符号化単位、すなわち、それ以上さらに分割されない符号化単位を基に予測符号化が行われる。以下、予測符号化の基になる、それ以上さらに分割されない符号化単位を「予測単位」とする。予測単位が分割されたパーティションは、予測単位及び予測単位の高さ及び幅のうち少なくとも一つが分割されたデータ単位を含んでもよい。
例えば、サイズ2Nx2N(ただし、Nは正の整数)の符号化単位がそれ以上分割されない場合、サイズ2Nx2Nの予測単位になり、パーティションの大きさは、2Nx2N、2NxN、Nx2N、NxNなどでもある。一実施形態によるパーティションタイプは、予測単位の高さまたは幅が対称的な比率に分割された対称的パーティションだけではなく、1:nまたはn:1のように、非対称的な比率に分割されたパーティション、幾何学的な形態に分割されたパーティション、任意的形態のパーティションなどを選択的に含んでもよい。
予測単位の予測モードは、イントラモード、インターモード及びスキップモードのうち少なくとも一つでもある。例えば、イントラモード及びインターモードは、2Nx2N,2NxN,Nx2N,NxNサイズのパーティションに対して遂行される。また、スキップモードは、2Nx2Nサイズのパーティションに対してのみ遂行される。符号化単位以内の1つの予測単位ごとに、独立して符号化が行われ、符号化誤差が最小である予測モードが選択される。
また、一実施形態によるビデオ符号化装置100は、映像データの符号化のための符号化単位だけではなく、符号化単位と異なるデータ単位を基に、符号化単位の映像データの周波数変換を行うことができる。
符号化単位の周波数変換のためには、符号化単位より小さいか、あるいはそれと同じ大きさのデータ単位を基に周波数変換が行われる。例えば、周波数変換のためのデータ単位は、イントラモードのためのデータ単位、及びインターモードのためのデータ単位を含んでもよい。
以下、周波数変換の基になるデータ単位を、「変換単位」とする。符号化単位と類似した方式で、符号化単位内の変換単位も、再帰的にさらに小サイズの変換単位に分割されながら、符号化単位のレジデュアルデータが、変換深度によって、ツリー構造による変換単位によって区画される。
一実施形態による変換単位についても、符号化単位の高さ及び幅が分割され、変換単位に至るまでの分割回数を示す変換深度が設定される。例えば、サイズ2Nx2Nの現在符号化単位の変換単位の大きさが2Nx2Nであるならば、変換深度0に設定され、変換単位の大きさがNxNであるならば、変換深度1に設定され、変換単位の大きさがN/2xN/2であるならば、変換深度2に設定される。すなわち、変換単位についても、変換深度によって、ツリー構造による変換単位が設定される。
符号化深度別符号化情報は、符号化深度だけではなく、予測関連情報及び周波数変換関連情報が必要である。従って、符号化単位決定部120は、最小符号化誤差を発生させた符号化深度だけではなく、予測単位をパーティションに分割したパーティションタイプ、予測単位別予測モード、周波数変換のための変換単位の大きさなどを決定することができる。
一実施形態による最大符号化単位のツリー構造による符号化単位及びパーティションの決定方式については、図3ないし図12を参照して詳細に説明する。
符号化単位決定部120は、深度別符号化単位の符号化誤差を、ラグランジュ乗数(Lagrangian multiplier)基盤の率・歪曲最適化技法(rate-distortion optimization)を利用して測定することができる。
出力部130は、符号化単位決定部120で決定された少なくとも1つの符号化深度に基づいて符号化された最大符号化単位の映像データ及び深度別符号化モードに係わる情報をビットストリーム形態で出力する。
符号化された映像データは、映像のレジデュアルデータの符号化結果でもある。
深度別符号化モードに係わる情報は、符号化深度情報、予測単位のパーティションタイプ情報、予測モード情報、変換単位のサイズ情報などを含んでもよい。
符号化深度情報は、現在深度で符号化せず、下位深度の符号化単位で符号化するか否かということを示す深度別分割情報を利用して定義される。現在符号化単位の現在深度が符号化深度であるならば、現在符号化単位は、現在深度の符号化単位で符号化されるので、現在深度の分割情報は、それ以上下位深度に分割されないように定義される。反対に、現在符号化単位の現在深度が符号化深度ではないならば、下位深度の符号化単位を利用した符号化を試みなければならないので、現在深度の分割情報は、下位深度の符号化単位に分割されるように定義される。
現在深度が符号化深度ではないならば、下位深度の符号化単位に分割された符号化単位に対して符号化が行われる。現在深度の符号化単位内に、下位深度の符号化単位が1以上存在するので、それぞれの下位深度の符号化単位ごとに、反復的に符号化が行われ、同一深度の符号化単位ごとに、再帰的(recursive)符号化が行われる。
1つの最大符号化単位内でツリー構造の符号化単位が決定され、符号化深度の符号化単位ごとに、少なくとも1つの符号化モードに係わる情報が決定されなければならないので、1つの最大符号化単位については、少なくとも1つの符号化モードに係わる情報が決定される。また、最大符号化単位のデータは、深度によって階層的に区画され、位置別に符号化深度が異なるので、データに対して、符号化深度及び符号化モードに係わる情報が設定される。
従って、一実施形態による出力部130は、最大符号化単位に含まれている符号化単位、予測単位及び最小単位のうち少なくとも一つに対して、当該符号化深度及び符号化モードに係わる符号化情報を割り当てられる。
一実施形態による最小単位は、最下位符号化深度である最小符号化単位が4分割された大きさの正方形のデータ単位であり、最大符号化単位に含まれる全ての符号化単位、予測単位及び変換単位内に含まれる最大サイズの正方形データ単位でもある。
例えば、出力部130を介して出力される符号化情報は、深度別符号化単位別符号化情報と、予測単位別符号化情報とに分類される。深度別符号化単位別符号化情報は、予測モード情報、パーティションサイズ情報を含んでもよい。予測単位別に伝送される符号化情報は、インターモードの推定方向に係わる情報、インターモードの参照映像インデックスに係わる情報、動きベクトルに係わる情報、イントラモードのクロマ成分に係わる情報、イントラモードの補間方式に係わる情報などを含んでもよい。また、ピクチャ別、スライス別またはGOP別に定義される符号化単位の最大サイズに係わる情報、及び最大深度に係わる情報は、ビットストリームのヘッダに挿入される。
ビデオ符号化装置100の最も簡単な形態の実施形態によれば、深度別符号化単位は、1階層上位深度の符号化単位の高さ及び幅を半分にした大きさの符号化単位である。すなわち、現在深度の符号化単位の大きさが2Nx2Nであるならば、下位深度の符号化単位の大きさは、NxNである。また、2Nx2Nサイズの現在符号化単位は、NxNサイズの下位深度符号化単位を最大4個含んでもよい。
従って、一実施形態によるビデオ符号化装置100は、現在ピクチャの特性を考慮して決定された最大符号化単位の大きさ及び最大深度を基に、それぞれの最大符号化単位ごとに、最適の形態及び大きさの符号化単位を決定し、ツリー構造による符号化単位を構成することができる。また、それぞれの最大符号化単位ごとに、多様な予測モード、周波数変換方式などで符号化することができるので、多様な映像サイズの符号化単位の映像特性を考慮し、最適の符号化モードが決定される。
従って、映像の解像度が非常に高いか、あるいはデータ量が非常に多い映像を、既存マクロブロック単位で符号化するならば、ピクチャ当たりマクロブロックの数が過度に多くなる。それによって、マクロブロックごとに生成される圧縮情報も多くなるの、で圧縮情報の伝送負担が大きくなり、データ圧縮効率が低下する傾向がある。従って、一実施形態によるビデオ符号化装置は、映像の大きさを考慮し、符号化単位の最大サイズを増大させながら、映像特性を考慮し、符号化単位を調節することができるので、映像圧縮効率が上昇する。
図2は、本発明の一実施形態によるビデオ復号装置のブロック図を図示する。
一実施形態によるビデオ復号装置200は、受信部210、映像データ及び符号化情報抽出部220及び映像データ復号部230を含む。一実施形態によるビデオ復号装置200の各種プロセッシングのための符号化単位、深度、予測単位、変換単位、各種符号化モードに係わる情報など各種用語の定義は、図1及びビデオ符号化装置100を参照して説明したところと同一である。
受信部210は、符号化されたビデオに対するビットストリームを受信してパージング(parsing)する。映像データ及び符号化情報抽出部220は、パージングされたビットストリームから、最大符号化単位別に、ツリー構造による符号化単位によって、符号化単位ごとに符号化された映像データを抽出し、映像データ復号部230に出力する。映像データ及び符号化情報抽出部220は、現在ピクチャに係わるヘッダから、現在ピクチャの符号化単位の最大サイズに係わる情報を抽出することができる。
また、映像データ及び符号化情報抽出部220は、パージングされたビットストリームから、最大符号化単位別に、ツリー構造による符号化単位に係わる符号化深度及び符号化モードに係わる情報を抽出する。抽出された符号化深度及び符号化モードに係わる情報は、映像データ復号部230に出力される。すなわち、ビット列の映像データを最大符号化単位に分割し、映像データ復号部230をして、最大符号化単位ごとに映像データを復号させる。
最大符号化単位別符号化深度及び符号化モードに係わる情報は、1以上の符号化深度情報について設定され、符号化深度別符号化モードに係わる情報は、当該符号化単位のパーティションタイプ情報、予測モード情報及び変換単位のサイズ情報などを含んでもよい。また、符号化深度情報として、深度別分割情報が抽出される。
映像データ及び符号化情報抽出部220が抽出した最大符号化単位別符号化深度及び符号化モードに係わる情報は、一実施形態によるビデオ符号化装置100のように、符号化端で、最大符号化単位別深度別符号化単位ごとに、反復的に符号化を行い、最小符号化誤差を発生させると決定された符号化深度及び符号化モードに係わる情報である。従って、ビデオ復号装置200は、最小符号化誤差を発生させる符号化方式により、データを復号して映像を復元することができる。
一実施形態による符号化深度及び符号化モードに係わる符号化情報は、当該符号化単位、予測単位及び最小単位のうち所定データ単位に対して割り当てられるので、映像データ及び符号化情報抽出部220は、所定データ単位別に、符号化深度及び符号化モードに係わる情報を抽出することができる。所定データ単位別に、当該最大符号化単位の符号化深度及び符号化モードに係わる情報が記録されているならば、同一符号化深度及び符号化モードに係わる情報を有している所定データ単位は、同一最大符号化単位に含まれるデータ単位と類推される。
映像データ復号部230は、最大符号化単位別符号化深度及び符号化モードに係わる情報に基づいて、それぞれの最大符号化単位の映像データを復号し、現在ピクチャを復元する。すなわち、映像データ復号部230は、最大符号化単位に含まれるツリー構造による符号化単位のうちそれぞれの符号化単位ごとに、判読されたパーティションタイプ、予測モード、変換単位に基づいて符号化された映像データを復号することができる。該復号過程は、イントラ予測及び動き補償を含む予測過程、及び周波数逆変換過程を含んでもよい。
映像データ復号部230は、符号化深度別符号化単位の予測単位のパーティションタイプ情報及び予測モード情報に基づいて、符号化単位ごとに、それぞれのパーティション及び予測モードによって、イントラ予測または動き補償を行うことができる。
また、映像データ復号部230は、最大符号化単位別周波数逆変換のために、符号化深度別符号化単位の変換単位のサイズ情報に基づいて、符号化単位ごとに、それぞれの変換単位によって、周波数逆変換を行うことができる。
映像データ復号部230は、深度別分割情報を利用して、現在最大符号化単位の符号化深度を決定することができる。もし分割情報が、現在深度でそれ以上分割されないということを示しているならば、現在深度が符号化深度である。従って、映像データ復号部230は、現在最大符号化単位の映像データに対して、現在深度の符号化単位を、予測単位のパーティションタイプ、予測モード及び変換単位サイズ情報を利用して復号することができる。
すなわち、符号化単位、予測単位及び最小単位のうち所定データ単位に対して設定されている符号化情報を観察し、同一分割情報を含んだ符号化情報を保有しているデータ単位が集まり、映像データ復号部230によって同一符号化モードで復号する1つのデータ単位と見なされる。
一実施形態によるビデオ復号装置200は、符号化過程において、最大符号化単位ごとに再帰的に符号化を行い、最小符号化誤差を発生させた符号化単位に係わる情報を獲得し、現在ピクチャに係わる復号に利用することができる。すなわち、最大符号化単位ごとに、最適符号化単位と決定されたツリー構造による符号化単位の符号化された映像データの復号が可能になる。
従って、高い解像度の映像、またはデータ量が過度に多い映像でも、符号化端から伝送された最適符号化モードに係わる情報を利用して、映像の特性に適応的に決定された符号化単位の大きさ及び符号化モードによって、効率的に映像データを復号して復元することができる。
以下、図3ないし図13を参照し、本発明の一実施形態による、ツリー構造による符号化単位、予測単位及び変換単位の決定方式について詳細に説明する。
図3は、階層的符号化単位の概念を図示する。
符号化単位の例は、符号化単位の大きさは、幅x高さで表現され、サイズ64x64である符号化単位から、サイズ32x32,16x16,8x8を含んでもよい。サイズ64x64の符号化単位は、サイズ64x64,64x32,32x64,32x32のパーティションに分割され、サイズ32x32の符号化単位は、サイズ32x32,32x16,16x32,16x16のパーティションに分割され、サイズ16x16の符号化単位は、サイズ16x16,16x8,8x16,8x8のパーティションに分割され、サイズ8x8の符号化単位は、サイズ8x8,8x4,4x8,4x4のパーティションに分割される。
ビデオデータ310については、解像度は、1920x1080に設定され、符号化単位の最大サイズは、64に設定され、最大深度は、2に設定されている。ビデオデータ320については、解像度は、1920x1080に設定され、符号化単位の最大サイズは、64に設定され、最大深度は、3に設定されている。ビデオデータ330については、解像度は、352x288に設定され、符号化単位の最大サイズは、16に設定され、最大深度は、1に設定されている。図3に図示された最大深度は、最大符号化単位から最小符号化単位までの総分割回数を示す。
解像度が高いか、あるいはデータ量が多い場合、符号化効率の向上だけではなく、映像特性を正確に反映させるために、符号化サイズの最大サイズが相対的に大きいことが望ましい。従って、ビデオデータ330に比べ、解像度が高いビデオデータ310,320は、符号化サイズの最大サイズが64に選択される。
ビデオデータ310の最大深度が2であるので、ビデオデータ310の符号化単位315は、長軸サイズが64である最大符号化単位から、2回分割されて深度が2階層深くなり、長軸サイズが32,16である符号化単位まで含んでもよい。一方、ビデオデータ330の最大深度が1であるので、ビデオデータ330の符号化単位335は、長軸サイズが16である符号化単位から、1回分割されて深度が1階層深くなり、長軸サイズが8である符号化単位まで含んでもよい。
ビデオデータ320の最大深度が3であるので、ビデオデータ320の符号化単位325は、長軸サイズが64である最大符号化単位から、3回分割されて深度が3階層深くなり、長軸サイズが32,16,8である符号化単位まで含んでもよい。深度が深くなるほど、細部情報の表現能が向上する。
図4は、本発明の一実施形態による、符号化単位に基づいた映像符号化部のブロック図を図示する。
一実施形態による映像符号化部400は、ビデオ符号化装置100の符号化単位決定部120において、映像データを符号化するのに経る作業を含む。すなわち、イントラ予測部410は、現在フレーム405において、イントラモードの符号化単位に対してイントラ予測を行い、動き推定部420及び動き補償部425は、インターモードの現在フレーム405及び参照フレーム495を利用して、インター推定及び動き補償を行う。
イントラ予測部410、動き推定部420及び動き補償部425から出力されたデータは、周波数変換部430及び量子化部440を経て、量子化された変換係数として出力される。量子化された変換係数は、逆量子化部460、周波数逆変換部470を介して空間領域のデータに復元され、復元された空間領域のデータは、デブロッキング部480及びループフィルタリング部490を経て後処理され、参照フレーム495として出力される。量子化された変換係数は、エントロピー符号化部450を経て、ビットストリーム455として出力される。
一実施形態によるビデオ符号化装置100に適用されるためには、映像符号化部400の構成要素であるイントラ予測部410、動き推定部420、動き補償部425、周波数変換部430、量子化部440、エントロピー符号化部450、逆量子化部460、周波数逆変換部470、デブロッキング部480及びループフィルタリング部490が、いずれも最大符号化単位ごとに、最大深度を考慮し、ツリー構造による符号化単位のうちそれぞれの符号化単位に基づいた作業を遂行しなければならない。
特に、イントラ予測部410、動き推定部420及び動き補償部425は、現在最大符号化単位の最大サイズ及び最大深度を考慮し、ツリー構造による符号化単位のうちそれぞれの符号化単位のパーティション及び予測モードを決定し、周波数変換部430は、ツリー構造による符号化単位のうちそれぞれの符号化単位内の変換単位の大きさを決定しなければならない。
図5は、本発明の一実施形態による、符号化単位に基づいた映像復号部のブロック図を図示する。
ビットストリーム505が、パージング部510)を経て、復号対象である符号化された映像データ、及び復号のために必要な符号化に係わる情報がパージングされる。符号化された映像データは、エントロピー復号部520及び逆量子化部530を経て、逆量子化されたデータとして出力され、周波数逆変換部540を経て、空間領域の映像データが復元される。
空間領域の映像データに対して、イントラ予測部550は、イントラモードの符号化単位に対してイントラ予測を行い、動き補償部560は、参照フレーム585を共に利用して、インターモードの符号化単位に対して動き補償を行う。
イントラ予測部550及び動き補償部560を経た空間領域のデータは、デブロッキング部570及びループフィルタリング部580を経て後処理され、復元フレーム595として出力される。また、デブロッキング部570及びループフィルタリング部580を経て後処理されたデータは、参照フレーム585として出力される。
ビデオ復号装置200の映像データ復号部230において映像データを復号するために、一実施形態による映像復号部500のパージング部510以後の段階別作業が遂行される。
一実施形態によるビデオ復号装置200に適用されるためには、映像復号部500の構成要素であるパージング部510、エントロピー復号部520、逆量子化部530、周波数逆変換部540、イントラ予測部550、動き補償部560、デブロッキング部570及びループフィルタリング部580が、いずれも最大符号化単位ごとに、ツリー構造による符号化単位に基づいて作業を遂行しなければならない。
特に、イントラ予測部550、動き補償部560は、ツリー構造による符号化単位ごとにそれぞれパーティション及び予測モードを決定し、周波数逆変換部540は、符号化単位ごとに、変換単位の大きさを決定しなければならない。
図6は、本発明の一実施形態による、深度別符号化単位及びパーティションを図示する。
一実施形態によるビデオ符号化装置100、及び一実施形態によるビデオ復号装置200は、映像特性を考慮するために、階層的な符号化単位を使用する。符号化単位の最大高及び最大幅、最大深度は、映像の特性によっても適応的に決定され、ユーザの要求によっても多様に設定される。あらかじめ設定された符号化単位の最大サイズによって、深度別符号化単位の大きさが決定される。
一実施形態による符号化単位の階層構造600は、符号化単位の最大高及び幅が64であり、最大深度が4である場合を図示している。一実施形態による符号化単位の階層構造600の縦軸に沿って深度が深くなるので、深度別符号化単位の高さ及び幅がそれぞれ分割される。また、符号化単位の階層構造600の横軸に沿って、それぞれの深度別符号化単位の予測符号化の基盤になる予測単位及びパーティションが図示されている。
すなわち、符号化単位610は、符号化単位の階層構造600において、最大符号化単位であって深度が0であり、符号化単位の大きさ、すなわち、高さ及び幅が64x64である。縦軸に沿って深度が深くなり、サイズ32x32である深度1の符号化単位620、サイズ16x16である深度2の符号化単位630、サイズ8x8である深度3の符号化単位640、サイズ4x4である深度4の符号化単位650が存在する。サイズ4x4である深度4の符号化単位650は、最小符号化単位である。
それぞれの深度別に横軸に沿って、符号化単位の予測単位及びパーティションが配列される。すなわち、深度0のサイズ64x64の符号化単位610が予測単位であるならば、予測単位は、サイズ64x64の符号化単位610に含まれるサイズ64x64のパーティション610、サイズ64x32のパーティション612、サイズ32x64のパーティション614、サイズ32x32のパーティション616に分割される。
同様に、深度1のサイズ32x32の符号化単位620の予測単位は、サイズ32x32の符号化単位620に含まれるサイズ32x32のパーティション620、サイズ32x16のパーティション622、サイズ16x32のパーティション624、サイズ16x16のパーティション626に分割される。
同様に、深度2のサイズ16x16の符号化単位630の予測単位は、サイズ16x16の符号化単位630に含まれるサイズ16x16のパーティション630、サイズ16x8のパーティション632、サイズ8x16のパーティション634、サイズ8x8のパーティション636に分割される。
同様に、深度3のサイズ8x8の符号化単位640の予測単位は、サイズ8x8の符号化単位640に含まれるサイズ8x8のパーティション640、サイズ8x4のパーティション642、サイズ4x8のパーティション644、サイズ4x4のパーティション646に分割される。
最後に、深度4のサイズ4x4の符号化単位650は、最小符号化単位であり、最下位深度の符号化単位であり、当該予測単位も、サイズ4x4のパーティション650だけで設定される。
一実施形態によるビデオ符号化装置100の符号化単位決定部120は、最大符号化単位610の符号化深度を決定するために、最大符号化単位610に含まれるそれぞれの深度の符号化単位ごとに、符号化を行わなければならない。
同一範囲及び同一サイズのデータを含むための深度別符号化単位の個数は、深度が深くなるほど、深度別符号化単位の個数も増加する。例えば、深度1の符号化単位一つを含むデータに対して、深度2の符号化単位は、四つが必要である。従って、同一データの符号化結果を深度別に比較するために、1つの深度1の符号化単位、及び4つの深度2の符号化単位を利用して、それぞれ符号化されなければならない。
それぞれの深度別符号化のためには、符号化単位の階層構造600の横軸に沿って、深度別符号化単位の予測単位ごとに符号化を行い、当該深度で最小の符号化誤差である代表符号化誤差が選択される。また、符号化単位の階層構造600の縦軸に沿って深度が深くなり、それぞれの深度ごとに符号化を行い、深度別代表符号化誤差を比較し、最小符号化誤差が検索される。最大符号化単位610において、最小符号化誤差が発生する深度及びパーティションが、最大符号化単位610の符号化深度及びパーティションタイプに選択される。
図7は、本発明の一実施形態による、符号化単位及び変換単位の関係を図示する。
一実施形態によるビデオ符号化装置100、または一実施形態によるビデオ復号装置200は、最大符号化単位ごとに、最大符号化単位より小さいか、あるいはそれと同じ大きさの符号化単位で映像を符号化したり復号したりする。符号化過程において、周波数変換のための変換単位の大きさは、それぞれの符号化単位ほど大きくないデータ単位を基に選択される。
例えば、一実施形態によるビデオ符号化装置100、または一実施形態によるビデオ復号装置200において、現在符号化単位710が64x64サイズであるとき、32x32サイズの変換単位720を利用して、周波数変換が行われる。
また、64x64サイズの符号化単位710のデータを、64x64サイズ以下の32x32,16x16,8x8,4x4サイズの変換単位でそれぞれ周波数変換を行って符号化した後、原本との誤差が最小である変換単位が選択される。
図8は、本発明の一実施形態による深度別符号化情報を図示する。
一実施形態によるビデオ符号化装置100の出力部130は、符号化モードに係わる情報として、それぞれの符号化深度の符号化単位ごとに、パーティションタイプに係わる情報800、予測モードに係わる情報810、変換単位サイズに係わる情報820を符号化して伝送することができる。
パーティションタイプに係わる情報800は、現在符号化単位の予測符号化のためのデータ単位であり、現在符号化単位の予測単位が分割されたパーティションの形態に係わる情報を示す。例えば、サイズ2Nx2Nの現在符号化単位CU_0は、サイズ2Nx2Nのパーティション802、サイズ2NxNのパーティション804、サイズNx2Nのパーティション806、サイズNxNのパーティション808のうちいずれか1つのタイプに分割されて利用される。その場合、現在符号化単位のパーティションタイプに係わる情報800は、サイズ2Nx2Nのパーティション802、サイズ2NxNのパーティション804、サイズNx2Nのパーティション806及びサイズNxNのパーティション808のうち一つを示すように設定される。
予測モードに係わる情報810は、それぞれのパーティションの予測モードを示す。例えば、予測モードに係わる情報810を介して、パーティションタイプに係わる情報800が示すパーティションが、イントラモード812、インターモード814及びスキップモード816のうち一つで予測符号化が行われるかということが設定される。
また、変換単位サイズに係わる情報820は、現在符号化単位をいかなる変換単位を基に周波数変換を行うかということを示す。例えば、変換単位は、第1イントラ変換単位サイズ822、第2イントラ変換単位サイズ824、第1インター変換単位サイズ826、第2インター変換単位サイズ828のうち一つでもある。
一実施形態によるビデオ復号装置200の映像データ及び符号化情報抽出部210は、それぞれの深度別符号化単位ごとに、パーティションタイプに係わる情報800、予測モードに係わる情報810、変換単位サイズに係わる情報820を抽出し、復号に利用することができる。
図9は、本発明の一実施形態による深度別符号化単位を図示する。
深度の変化を示すために、分割情報が利用される。該分割情報は、現在深度の符号化単位が、下位深度の符号化単位に分割されるか否かということを示す。
深度0及び2N_0x2N_0サイズの符号化単位900の予測符号化のための予測単位910は、2N_0x2N_0サイズのパーティションタイプ912、2N_0xN_0サイズのパーティションタイプ914、N_0x2N_0サイズのパーティションタイプ916、N_0xN_0サイズのパーティションタイプ918を含んでもよい。該予測単位が対称的な比率に分割されたパーティション912,914,916,918だけが例示されているが、前述のように、パーティションタイプは、それらに限定されるものではなく、非対称的パーティション、任意的形態のパーティション、幾何学的形態のパーティションなどを含んでもよい。
パーティションタイプごとに、1つの2N_0x2N_0サイズのパーティション、2つの2N_0xN_0サイズのパーティション、2つのN_0x2N_0サイズのパーティション、4つのN_0xN_0サイズのパーティションごとに反復的に予測符号化が行われなければならない。サイズ2N_0x2N_0、サイズN_0x2N_0、サイズ2N_0xN_0及びサイズN_0xN_0のパーティションについては、イントラモード及びインターモードで予測符号化が行われる。スキップモードは、サイズ2N_0x2N_0のパーティションについてのみ予測符号化が行われる。
サイズ2N_0x2N_0,2N_0xN_0及びN_0x2N_0のパーティションタイプ912,914,916のうち一つによる符号化誤差が最小であるならば、それ以上下位深度に分割する必要がない。
サイズN_0xN_0のパーティションタイプ918による符号化誤差が最小であるならば、深度0を1に変更しながら分割し(920)、深度2及びサイズN_0xN_0のパーティションタイプの符号化単位930に対して反復的に符号化を行い、最小符号化誤差を検索する。
深度1及びサイズ2N_1x2N_1(=N_0xN_0)の符号化単位930の予測符号化のための予測単位940は、サイズ2N_1x2N_1のパーティションタイプ942、サイズ2N_1xN_1のパーティションタイプ944、サイズN_1x2N_1のパーティションタイプ946、サイズN_1xN_1のパーティションタイプ948を含んでもよい。
また、サイズN_1xN_1のパーティションタイプ948による符号化誤差が最小であるならば、深度1を深度2に変更しながら分割し(950)、深度2及びサイズN_2xN_2の符号化単位960に対して反復的に符号化を行い、最小符号化誤差を検索する。
最大深度がdである場合、深度別分割情報は深度d−1になるまで設定され、分割情報は、深度d−2まで設定される。すなわち、深度d−2まで分割され(970)、深度d−1まで符号化が行われる場合、深度d−1及びサイズ2N_(d−1)x2N_(d−1)の符号化単位980の予測符号化のための予測単位990は、サイズ2N_(d−1)x2N_(d−1)のパーティションタイプ992、サイズ2N_(d−1)xN_(d−1)のパーティションタイプ994、サイズN_(d−1)x2N_(d−1)のパーティションタイプ996、サイズN_(d−1)xN_(d−1)のパーティションタイプ998を含んでもよい。
パーティションタイプにおいて、1つのサイズ2N_(d−1)x2N_(d−1)のパーティション、2つのサイズ2N_(d−1)xN_(d−1)のパーティション、2つのサイズN_(d−1)x2N_(d−1)のパーティション、4つのサイズN_(d−1)xN_(d−1)のパーティションごとに反復的に予測符号化を介した符号化が行われ、最小符号化誤差が発生するパーティションタイプが検索される。
サイズN_(d−1)xN_(d−1)のパーティションタイプ998による符号化誤差が最小であるとしても、最大深度がdであるので、深度d−1の符号化単位CU_(d−1)は、それ以上下位深度への分割過程を経ず、現在最大符号化単位900に対する符号化深度が深度d−1と決定され、パーティションタイプは、N_(d−1)xN_(d−1)と決定される。また、最大深度がdであるので、深度d−1の符号化単位952に対して分割情報は設定されない。
データ単位999は、現在最大符号化単位に係わる「最小単位」とされる。一実施形態による最小単位は、最下位符号化深度である最小符号化単位が4分割された大きさの正方形のデータ単位でもある。そのような反復的符号化過程を介して、一実施形態によるビデオ符号化装置100は、符号化単位900の深度別符号化誤差を比較し、最小符号化誤差が発生する深度を選択し、符号化深度を決定し、当該パーティションタイプ及び予測モードが符号化深度の符号化モードに設定される。
かように、深度0,1,…,d−1,dの全ての深度別最小符号化誤差を比較し、誤差が最小である深度が選択され、符号化深度と決定される。符号化深度、並びに予測単位のパーティションタイプ及び予測モードは、符号化モードに係わる情報として符号化されて伝送される。また、深度0から符号化深度に至るまで符号化単位が分割されなければならないので、符号化深度の分割情報だけが「0」に設定され、符号化深度を除いた深度別分割情報は、「1」に設定されなければならない。
一実施形態によるビデオ復号装置200の映像データ及び符号化情報抽出部220は、符号化単位900に対する符号化深度及び予測単位に係わる情報を抽出し、符号化単位912の復号に利用することができる。一実施形態によるビデオ復号装置200は、深度別分割情報を利用して、分割情報が「0」である深度を符号化深度と把握し、当該深度に係わる符号化モードに係わる情報を利用して、復号に利用することができる。
図10、図11及び図12は、本発明の一実施形態による、符号化単位、予測単位及び周波数変換単位の関係を図示する。
符号化単位1010は、最大符号化単位に対して、一実施形態によるビデオ符号化装置100が決定した符号化深度別符号化単位である。予測単位1060は、符号化単位1010のうち、それぞれの符号化深度別符号化単位の予測単位のパーティションであり、変換単位1070は、それぞれの符号化深度別符号化単位の変換単位である。
深度別符号化単位1010は、最大符号化単位の深度が0であるとすれば、符号化単位1012,1054は、深度が1であり、符号化単位1014,1016,1018,1028,1050,1052は、深度が2であり、符号化単位1020,1022,1024,1026,1030,1032,1048は、深度が3であり、符号化単位1040,1042,1044,1046は、深度が4である。
予測単位1060のうち一部パーティション1014,1016,1022,1032,1048,1050,1052,1054は、符号化単位が分割された形態である。すなわち、パーティション1014,1022,1050,1054は、2NxNのパーティションタイプであり、パーティション1016,1048,1052は、Nx2Nのパーティションタイプであり、パーティション1032は、NxNのパーティションタイプである。深度別符号化単位1010の予測単位及びパーティションは、それぞれの符号化単位より小さいか、あるいはそれと同じである。
変換単位1070のうち一部変換単位1052の映像データについては、符号化単位に比べ、小サイズのデータ単位で、周波数変換または周波数逆変換が行われる。また、変換単位1014,1016,1022,1032,1048,1050,1052,1054は、予測単位1060のうち当該予測単位及びパーティションと比較すれば、互いに異なる大きさまたは形態のデータ単位である。すなわち、一実施形態によるビデオ符号化装置100、及び一実施形態に他のビデオ復号装置200は、同一符号化単位に係わるイントラ予測/動き推定/動き補償作業、及び周波数変換/逆変換作業であるとしても、それぞれ別個のデータ単位を基に遂行する。
それにより、最大符号化単位ごとに、領域別に階層的な構造の符号化単位ごとに、再帰的に符号化が行われ、最適符号化単位が決定されることにより、再帰的ツリー構造による符号化単位が構成される。符号化情報は、符号化単位に係わる分割情報、パーティションタイプ情報、予測モード情報、変換単位サイズ情報を含んでもよい。下記表1は、一実施形態によるビデオ符号化装置100、及び一実施形態によるビデオ復号装置200で設定することができる一例を示す。
一実施形態によるビデオ符号化装置100の出力部130は、ツリー構造による符号化単位に係わる符号化情報を出力し、一実施形態によるビデオ復号装置200の符号化情報抽出部220は、受信されたビットストリームから、ツリー構造による符号化単位に係わる符号化情報を抽出することができる。
分割情報は、現在符号化単位が、下位深度の符号化単位に分割されるか否かということを示す。現在深度dの分割情報が0であるならば、現在符号化単位が下位符号化単位にそれ以上分割されない深度が符号化深度であるので、符号化深度に対して、パーティションタイプ情報、予測モード、変換単位サイズ情報が定義される。該分割情報によって、1段階さらに分割されなければならない場合には、分割された4個の下位深度の符号化単位ごとに、独立して符号化が行われなければならない。
予測モードは、イントラモード、インターモード及びスキップモードのうち一つで示すことができる。イントラモード及びインターモードは、全てのパーティションタイプで定義され、スキップモードは、パーティションタイプ2Nx2Nでのみ定義される。
パーティションタイプ情報は、予測単位の高さまたは幅が対称的な比率に分割された対称的パーティションタイプ2Nx2N,2NxN,Nx2N及びNxNと、非対称的な比率に分割された非対称的パーティションタイプ2NxnU,2NxnD,nLx2N,nRx2Nを示すことができる。非対称的パーティションタイプ2NxnU及び2NxnDは、それぞれ高さが1:3及び3:1に分割された形態であり、非対称的パーティションタイプnLx2N及びnRx2Nは、それぞれ幅が1:3及び3:1に分割された形態を示す。
変換単位サイズは、イントラモードで二種の大きさ、インターモードで二種の大きさに設定される。すなわち、変換単位分割情報が0であるならば、変換単位の大きさが、現在符号化単位のサイズ2Nx2Nに設定される。変換単位分割情報が1であるならば、現在符号化単位が分割された大きさの変換単位が設定される。また、サイズ2Nx2Nである現在符号化単位に係わるパーティションタイプが、対称形パーティションタイプであるならば、変換単位の大きさは、NxNに設定され、非対称形パーティションタイプであるならば、N/2xN/2に設定される。
一実施形態によるツリー構造による符号化単位の符号化情報は、符号化深度の符号化単位、予測単位及び最小単位単位のうち少なくとも一つに対して割り当てられる。符号化深度の符号化単位は、同一符号化情報を保有している予測単位及び最小単位を1以上含んでもよい。
従って、隣接したデータ単位同士それぞれ保有している符号化情報を確認すれば、同一符号化深度の符号化単位に含まれるか否かということが確認される。また、データ単位が保有している符号化情報を利用すれば、当該符号化深度の符号化単位を確認することができるので、最大符号化単位内の符号化深度の分布が類推される。
従って、その場合、現在符号化単位が周辺データ単位を参照して予測する場合、現在符号化単位に隣接する深度別符号化単位内のデータ単位の符号化情報が直接参照されて利用される。
他の実施形態として、現在符号化単位が、周辺符号化単位を参照して予測符号化が行われる場合、隣接する深度別符号化単位の符号化情報を利用して、深度別符号化単位内において、現在符号化単位に隣接するデータが検索されることにより、周辺符号化単位が参照される。
図13は、表1の符号化モード情報による、符号化単位、予測単位及び変換単位の関係を図示する。
最大符号化単位1300は、符号化深度の符号化単位1302,1304,1306,1312,1314,1316,1318を含む。そのうち1つの符号化単位1318は、符号化深度の符号化単位であるので、分割情報が0に設定される。サイズ2Nx2Nの符号化単位1318のパーティションタイプ情報は、パーティションタイプ2Nx2N 1322,2NxN 1324,Nx2N 1326,NxN 1328,2NxnU 1332,2NxnD 1334,nLx2N 1336及びnRx2N 1338のうち一つに設定される。
パーティションタイプ情報が、対称形パーティションタイプ2Nx2N 1322,2NxN 1324,Nx2N 1326及びNxN 1328のうち一つに設定されている場合、変換単位分割情報(TU size flag)が0であるならば、サイズ2Nx2Nの変換単位1342が設定され、変換単位分割情報が1であるならば、サイズNxNの変換単位1344が設定される。
パーティションタイプ情報が、非対称形パーティションタイプ2NxnU 1332,2NxnD 1334,nLx2N 1336及びnRx2N 1338のうち一つに設定されている場合、変換単位分割情報(TU size flag)が0であるならば、サイズ2Nx2Nの変換単位1352が設定され、変換単位分割情報が1であるならば、サイズN/2xN/2の変換単位1354が設定される。
以下、図4の本発明の一実施形態による映像符号化装置400のエントロピー符号化部450、及び図5の映像復号装置500のエントロピー復号部520で行われるエントロピー符号化過程及びエントロピー復号過程について具体的に説明する。
前述のように、本発明の一実施形態による映像符号化装置400は、最大符号化単位を階層的に分割した符号化単位を利用して符号化を行う。エントロピー符号化部450は、符号化過程で生成された符号化情報、例えば、量子化された変換係数、予測単位の予測モード、量子化パラメーター、動きベクトルなどのシンタックスエレメント(syntax elements)をエントロピー符号化する。エントロピー符号化方式として、コンテクスト基盤二進算術符号化(CABAC)が利用される。
表2は、HEVC(high efficiency video coding)及びH.264/AVCにおいて、CABACを介してエントロピー符号化されるシンタックスエレメントの一例である。各シンタックスエレメントの意味(semantics)については、HEVC及びH.264/AVCで記述しており、具体的な説明は省略する。
図14は、本発明の一実施形態によるエントロピー符号化装置の構成を示したブロック図である。図14を参照すれば、一実施形態によるエントロピー符号化装置1400は、二進化部(binarizer)1410、コンテクストモデラ(context modeler)1420、二進算術符号化部(binary arithmetic coder)1430を含む。また、二進算術符号化部1430は、レギュラーコーディング部(regular coding engine)1432と、バイパスコーディング部(bypass coding engine)1434とを含む。
二進化部1410は、入力されたシンタックスエレメント(syntax element)を二進シンボルであるビン(bins)でマッピングさせる。ビンは、0または1の値を有する1ビットを示すものであり、各ビンは、CABACを介して符号化される。該ビンの集合は、ビンストリング(bin string)とされる。二進化部1410は、シンタックスエレメントの類型によって、固定長二進化(fixed length binarization)、切断型Rice二進化(truncated Rice binarization)、k次exp−Golomb二進化、Golomb−rice二進化のうち一つを適用し、シンタックスエレメントの値を、0と1とのビンにマッピングして出力する。
二進化部1410で出力されるビンは、レギュラーコーディング部1432またはバイパスコーディング部1434によって算術符号化される。シンタックスエレメントを二進化したビンが均一に分布された場合、すなわち、0と1との頻度が同一であるデータである場合には、二進化されたビンは、確率値を利用しないバイパスコーディング部1434に出力されて符号化される。現在ビンをレギュラーコーディング部1432またはバイパスコーディング部1434のうちいずれのコーディング部によって算術符号化するかということは、シンタックスエレメントの類型によってあらかじめ決定される。
レギュラーコーディング部1432は、コンテクストモデラ1420によって決定された確率モデルに基づいて、ビンに対する算術符号化を行う。コンテクストモデラ1420は、レギュラーコーディング部1432に、ビンに係わる確率モデルを提供する。具体的には、コンテクストモデラ1420は、以前に符号化されたビンに基づいて、所定二進値の確率を決定し、以前ビンを符号化するのに利用された二進値の確率を更新し、更新された確率をレギュラーコーディング部1432に出力する。従来には、コンテクストインデックス(ctxIdx)を利用して、1つのコンテクストモデルを決定し、決定されたコンテクストモデルが有するLPS(least probable symbol)またはMPS(most probable symbol)の発生確率と、0と1とのうちいずれの二進値がMPSに該当するかということにに係わる情報(valMPS)とを決定した。それに反して、本開示の一実施形態によるコンテクストモデラ1420は、MPSとLPSとを区別せず、あらかじめ決定された所定二進値、例えば、「1」の発生確率を示すP(1)を、以前に符号化されたビンに基づいて決定し、決定された所定二進値の確率をレギュラーコーディング部1432に提供する。
本開示の一実施形態によるコンテクストモデラ1420は、受信されたビンの値を利用して、各ビンの自己相関値を獲得し、該自己相関値に基づいて、二進値の確率更新に利用される少なくとも1つのスケーリングファクタを決定した後、決定された少なくとも1つのスケーリングファクタを利用して、二進値の確率を更新することができる。
また、本開示の他の実施形態によるコンテクストモデラ1420は、互いに異なるスケーリングファクタを有する複数個の確率モデルを適用し、ビンの平均ビット値を示すエントロピー値を獲得し、複数個の確率モデルのうち最小エントロピー値を獲得するのに利用された確率モデルが有するスケーリングファクタを決定し、決定されたスケーリングファクタを利用して、二進値の確率を更新することができる。
レギュラーコーディング部1432は、コンテクストモデラ1420から提供された所定二進値の確率、及び現在ビンが有する二進値に基づいて、二進算術符号化を行う。すなわち、レギュラーコーディング部1432は、コンテクストモデラ1420から提供された所定二進値の確率に基づいて、「1」の発生確率P(1)、及び「0」の発生確率P(0)を決定することができ、決定された0と1との発生確率P(0)及びP(1)と、現在ビン値によって確率区間を示すrangeを分割し、分割された区間に属する代表値の二進値を出力することにより、二進算術符号化を行う。
図15A及び図15Bは、CABACに利用される確率更新過程を示した図面である。
図15Aを参照すれば、HEVCなどで利用されるコンテクストモデルは、64個のあらかじめ決定された確率状態に定義されている。各確率状態は、状態インデックスiPLPS、及びMPSの値であるVMPSによって特徴づけられる。あらかじめ決定された状態遷移テーブル(state transition table)を利用して、確率更新時、現在確率状態からどんな確率状態に遷移されるかということを示すことができる。現在算術符号化されるビンの値がMPSであるか、それともLPSであるかということにより、確率状態が変更される。例えば、現在ビンの値がMPSであるならば、現在の確率状態(state iPLPS)から、LPS確率が低くなる前方向状態(state iPLPS+1)に確率状態が変更され、現在ビンの値がLPSであるならば、現在の確率状態(state iPLPS)からLPS確率が高くなる後方向状態(state iPLPS−1)に確率状態が変更される。図15Aにおいて、TrMPS{}は、MPS処理後の確率状態遷移方向を示し、TrLPS{}は、LPS処理以後の確率状態遷移方向を示す。
MPSまたはLPSの処理時に変更される確率は、図15Aに図示されているように、指数的(exponential)に低下する形態を有する。n個のコンテクストモデルの確率Pnは、次の数学式Pn=0.5(1−α)nで表現される。ここで、(1−α)=(0.01875/0.5)1/63である。
図15Bを参照すれば、0に近いLPSの確率(probability)分布は、稠密であり、1/2に近いLPSの確率分布は、希薄である。従って、0及び1の二進値の発生確率が類似している場合、すなわち、0及び1の二進値の発生確率が1/2に近い場合には、確率が希薄に分布するので、確率の予測エラーが上昇する。また、指数乗形態の確率関数を利用する場合、0に近い確率値を細密に表現しなければならないので、かような確率値を示すためのビットデプスが増加される。従って、指数乗形態の確率関数を有する確率モデルを保存するためのルックアップ(look-up)テーブルの大きさが増大する。また、確率更新時や、確率区間を分割するとき時、稠密な確率値を利用する場合、乗算演算量が増加してハードウェア的に負担になる。従って、図15Aに図示された確率(PLPS)を、四捨五入演算などを介して所定値にマッピングさせ、確率値が指数的ではなく、階段式に減少する確率を利用することができる。
以下、コンテクストモデラ1420で遂行される確率モデルの更新過程について具体的に説明する。
CABACに利用される確率更新過程は、次の数式(1)によって遂行される。
数式(1)で、p(t)は、更新された確率を示し、p(t−1)は、以前ビンの確率を示し、α(0≦αi≦1、αは実数)は、スケーリングファクタを示し、yは、入力された現在ビンの値を示す。iは、スケーリングファクタの個数を示す整数値である。利用されるスケーリングファクタが増加するほど、予測された確率の正確度は上昇するが、演算複雑度が増大する。従って、以下の説明においては、iが1または2である場合、すなわち、1個のスケーリングファクタを利用するか、あるいは2個のスケーリングファクタを利用して確率を更新する場合を中心に説明する。しかし、本開示による確率更新方法は、2個を超えるスケーリングファクタを利用して確率を更新する場合にも、適用されるのである。
二進算術コーダでは、任意の0及び1の値を有するビンのシーケンスを扱う。0及び1のうちいずれか1つのビンの確率がA(0≦A≦1、Aは実数)と決定されれば、残りビンの確率は、1−Aと決定される。数式(1)で、入力されたビンの値が1である場合、すなわち、y=1である場合、p(t)の値が増大するので、数式(1)のp(t)は、「1」の確率、すなわち、次のビンが「1」である確率を示す。0及び1のうちいずれかがMPS、LPSであるかということを判断するためには、確率値の範囲を考慮することができる。例えば、1の確率を示すp(t)が[1/2;1]、すなわち、1/2と1との間の値を有するならば、MPSは、1であり、p(t)が[0;1/2]、すなわち、0と1/2との間の値であるならば、0がMPSに該当する。CABACに利用されるLPSの確率値は、p(t)及び1−p(t)のうち小さい値に決定される。
数式(1)に基づいた確率更新に重要な重要なパラメーターは、まさにスケーリングファクタαである。スケーリングファクタαの値によって、CABACに利用される確率がいかほど敏感に更新されるかということを示す敏感度(sensitiveness)、エラーに反応しないか否かという安定性(robustness)が決定される。
本開示の一実施形態によるコンテクストモデラ1420は、確率更新時、1以上のスケーリングファクタαを利用して、1以上の更新された確率を生成し、1以上の更新された確率の加重平均を、最終的に更新された確率と決定することができる。
具体的には、コンテクストモデラ1420は、複数個のスケーリングファクタαを数式(1)に適用し、複数個の確率P(t)が獲得されれば、複数個の確率P(t)の加重平均値を次の数式(2)のように計算し、最終的な更新確率p(t)を獲得する。
ωは、複数個の確率P(t)に乗じられる加重値である。ωは、スケーリングファクタの個数を考慮して決定される。利用されるスケーリングファクタの個数がN(Nは整数)であるならば、ω=(1/N)でもある。一例として、2個のスケーリングファクタα及びαを利用する場合、数式(1)に基づいて、p(t)=αy+(1−α)p(t−1)及びp(t)=αy+(1−α)p(t−1)が獲得される。かような場合、2個の確率p(t)及びp(t)の平均値である(p(t)+p(t))/2が更新された確率p(t)と決定される。
一方、確率更新時、乗算過程を省略するために、スケーリングファクタは、1/2のように、分母が2の指数乗(power of 2)の値を有することが望ましい。すなわち、複数個のスケーリングファクタaは、次の数式a=1/(2^M)(Miは整数)のような値を有することが望ましい。かような場合、前述の数式(1)に含まれた乗算演算は、次の数式(3)のように、シフト演算で代替される。数式(3)で、「>>」は、ライトシフト演算子である。
前述の例において、α=1/16=1/2、α=1/128=1/2に設定された場合、p(t)=αy+(1−α)p(t−1)は、p(t)=(y>>4)+p(t−1)−(p(t−1)>>4)のようにシフト演算、加算演算及び減算演算のみを含む数式を介して獲得される。同様に、p(t)=αy+(1−α)p(t−1)は、p(t)=(y>>7)+p(t−1)−(p(t−1)>>7)で代替される。乗算演算や除算演算より、シフト演算は、ハードウェア的、ソフトウェア的に容易に具現されるので、スケーリングファクタは、分母が2の指数乗である所定値に決定されることが望ましい。
図16は、本開示の一実施形態による確率更新過程を示したフローチャートである。図16を参照すれば、段階1610において、コンテクストモデラ1420は、複数個のスケーリングファクタを適用し、複数個の更新された確率を獲得する。前述の例のように、2個のスケーリングファクタα=1/16=1/2、α=1/128=1/2を利用する場合、コンテクストモデラ1420は、p(t)=(y>>4)+p(t−1)−(p(t−1)>>4)及びp(t)=(y>>7)+p(t−1)−(p2(t−1)>>7)を介して、2つの更新された確率p(t)及びp(t)を獲得し、p(t)及びp(t)の平均値である(p(t)+p(t))/2を最終的な更新確率p(t)に決定する。(p(t)+p(t))/2は、(p(t)+p(t))>>1のように、シフト演算を介して具現される。
CABAC符号化/復号過程においては、所定データ単位でエントロピーリセット(entropy reset)が行われる。例えば、スライス単位、符号化単位でエントロピーリセットが行われる。該エントロピーリセットは、現在確率値を廃棄し、あらかじめ決定された確率値に基づいて、新たにCABACを行うことを意味する。かようなリセット過程後に遂行される確率アップデート過程において、初期値に設定される確率値は、最適の値ではなく、何回かのアップデート過程を経るほど、一定確率値に収斂される。1つのスケーリングファクタを利用して、確率をアップデートする場合、確率アップデートが行われるほど、確率が早く変化し、適正値に早く収斂されるが、アップデートが反復されるほど、変動(fluctuation)が発生しやすい。複数個のスケーリングファクタを利用して、確率をアップデートする場合、確率が早く変化しないが、アップデートされた確率が適正値近くに収斂された場合、変動が少なく発生し、エラーやノイズなどに敏感に反応せず、安定して動作する。従って、段階1620において、コンテクストモデラ1420は、確率更新時ごとにカウンタ(counter)を増加させ、段階1630において、カウンタ値に基づいて、現在更新される確率が、初期ビンに係わるものであるか否かということを判断する。所定個数未満の初期ビン、例えば、50個未満の初期ビンについては、段階1640において、単一スケーリングファクタを利用して、確率更新が行われる。初期ビン後に入力されるビン、例えば、50番目ビンからは、段階1650において、2つのスケーリングファクタを利用して、決定される確率更新過程が遂行される。
前述の確率更新過程において、スケーリングファクタとして、所定値、例えば、分母が2の指数乗形態の値を有するスケーリングファクタを利用して、確率更新を行った。
本開示の一実施形態によるコンテクストモデラ1420は、受信されたビンの値を利用して、各ビンの自己相関値を獲得し、自己相関値に基づいて、二進値の確率更新に利用される少なくとも1つのスケーリングファクタを決定した後、決定された少なくとも1つのスケーリングファクタを利用して、二進値の確率を更新することができる。
図17A及び図17Bは、自己相関値について説明するための参照図である。
所定距離k(kは整数)ほど離隔されたビンの値、ビンの平均値M、ビンの分散σを利用して、所定距離kによる自己相関値Rは、次の数式(4)のように獲得される。
数式(4)で、ビンの個数は、N+1(Nは整数)であり、(N+1)個のビンの値は、y(jは0からNまでの整数)である。
図17A及び図17Bで、{y,y,y,…,y}は、8個のビンを示し、yは、0または1の値を有する。図17A及び図17Bに図示されているように、ビン値(bin value)が分布すると仮定すれば、ビンの平均値Mは、図17A及び図17Bにおいて、いずれも1/2の値を有する。
分散σは、各ビンの値yと平均値Mとの二乗誤差値(MSE:mean square error)の平均値であり、図17A及び図17Bにおいて、いずれも分散値は、(1/2)^2*8*(1/8)=1/4の値を有する。
所定距離kが1である場合、すなわち、互いに隣接したビンの値を利用して、自己相関値を計算すれば、まず、図17Aの場合のように、隣接したビンの値が類似して分布された場合の自己相関値が、図17Bのように、隣接したビンが不均一に分布された場合に比べてさらに大きい。
図18は、本開示の一実施形態による、二進算術符号化のための確率更新方法を示したフローチャートである。
前述のように、本開示の一実施形態による確率更新方法においては、入力ビンを利用して自己相関値を計算し、自己相関値に基づいて決定された各ビンの確率と、各ビン値との二乗誤差値(MSE)が最小になる値をスケーリングファクタとして利用する。
段階1810において、コンテクストモデラ1420は、CABACを介して、二進算術符号化される所定個数のビンを受信する。段階1820において、コンテクストモデラ1420は、前述の数式(3)に基づいて、各ビンの自己相関値を獲得する。
段階1830において、コンテクストモデラ1420は、自己相関値Rに基づいて、二進値の確率更新に利用される少なくとも1つのスケーリングファクタを決定する。
具体的には、{y}は、0及び1の値のうち一つを有するN個のビンであると仮定する。すなわち、jは、0から(N−1)までの値を有する。
前述の数式(1)に基づいて、以前ビンの確率、以前ビンの値及びスケーリングファクタαを利用して、j番目ビンの算術符号化後に更新された確率Pは、次の数式(5)のように表現される。
数式(5)を整理すれば、次の数式(6)のようである。
各ビンの確率と各ビン値との二乗誤差値(MSE)は、次の数式(7)の通りである。
数式(7)のように、MSEは、スケーリングファクタαによって変化する値を有する。スケーリングファクタαを決定するために、MSEが最小になるα値を決定する。そのために、数式(7)のMSEを、αに対して偏微分し、0になる値を決定する。
すなわち、
が0になるスケーリングファクタαを決定する。前記偏微分方程式の解を計算すれば、スケーリングファクタαは、以下の数式(8)のように自己相関値Rを利用して決定される。
前述のように、2個のスケーリングファクタα及びαを利用して、p1,j=αy+(1−α)p1,j−1及びp2,j=αy+(1−α)p2,(j−1)が獲得され、2個の確率p1,j及びp2,jの平均値である(p1,j+p2,j)/2が更新された確率pと決定される場合、前記数式(7)のpの代わりに、(p1,j+p2,j)/2を代入し、各ビンの確率と各ビン値とのMSEを計算すれば、次の数式(9)の通りである。
数式(9)で、β=1−αである。すなわち、β=1−αであり、β=1−αである。数式(9)を、α及びαについて偏微分して最小値を求めれば、α及びαは、自己相関値の範囲によって、次のように獲得される。
Rk∈[−1,1/7]である場合、α=0、α=0;
Rk∈[1/7,1/2]である場合、
Rk∈[1/2,5/7]である場合、α=1、α=0;
Rk∈[5/7,1]である場合、
そのように、コンテクストモデラ1420は、ビンの自己相関値を利用して、1以上のスケーリングファクタが決定されれば、段階1840において、コンテクストモデラ1420は、決定されたスケーリングファクタを利用して、以前確率値を更新し、更新された確率をレギュラーコーディング部1432に提供する。段階1850において、レギュラーコーディング部1432は、更新された確率を利用して、次のビンを二進算術符号化する。
図19は、本開示の他の実施形態による、CABACに利用される確率更新方法を示したフローチャートである。
本開示の他の実施形態によるコンテクストモデラ1420は、互いに異なるスケーリングファクタを有する複数個の確率モデルを適用し、1つのビンをコーディングするとき、必要な平均ビット値を示すエントロピー値を獲得し、最小エントロピー値を獲得するのに利用された確率モデルが有するスケーリングファクタを決定し、決定されたスケーリングファクタを利用して、確率更新を行うことができる。
図19を参照すれば、段階1910において、コンテクストモデラ1420は、二進算術符号化される所定個数のビンを受信する。
段階1920において、コンテクストモデラ1420は、互いに異なるスケーリングファクタを有する複数個の確率モデルを、受信されたビンのうち1つのビンに適用し、エントロピー値を獲得する。
M個の確率モデルをPM(iは、0からM−1までの整数)と定義し、PM確率モデルが有するスケーリングファクタをαと定義する。コンテクストモデラ1420は、現在ビンに、確率モデルPMが有するスケーリングファクタαを利用して確率更新を行う。前述の数式(1)のように、コンテクストモデラ1420は、p(t)=α+(1−α)p(t−1)によって確率更新を行う。
コンテクストモデラ1420は、ビン単位で、複数個の確率モデルを適用し、エントロピーを計算する。具体的には、コンテクストモデラ1420は、現在ビンyの値によって、次の数式(10)のように、パラメーターbitを獲得する。
数式(10)を参照すれば、パラメーターbitは、現在ビンyの値が1である場合、−log(t)の値を有し、現在ビンyの値が0である場合、−log(1−P(t))の値を有する。
パラメーターbitを利用して、現在ビンのエントロピーs(t)は、次の数式(11)のように獲得される。
数式(11)において、s(t−1)は、現在ビン以前の以前ビンについて獲得されたエントロピー値である。数式(11)に基づいて、現在ビンに係わる複数個のエントロピー値が獲得されれば、コンテクストモデラ1420は、S(t)のうち最小エントロピー値を有する場合、利用されたスケーリングファクタαを最終スケーリングファクタと決定する。
例えば、現在ビンyに対して、スケーリングファクタαを適用して獲得されたエントロピー値をS(t)と仮定し、スケーリングファクタαを適用して獲得されたエントロピー値をS(t)と仮定する。S(t)<S(t)である場合、さらに小さいエントロピー値を有するS(t)を獲得するのに利用されたスケーリングファクタαが、確率更新のためのスケーリングファクタと決定され、p(t)=αy+(1−α)p(t−1)によって確率が更新される。もしS(t)>S(t)である場合、さらに小さいエントロピー値を有するS(t)を獲得するのに利用されたスケーリングファクタαが、確率更新のためのスケーリングファクタと決定され、p(t)=αy+(1−α)p(t−1)によって確率が更新される。
図20A及び図20Bは、CABACに基づいた二進算術符号化を行う過程を示した図面である。
図20Aを参照すれば、コンテクストモデラ1420は、所定二進値、例えば、「1」の発生確率P(1)をレギュラーコーディング部1432に提供する。レギュラーコーディング部1432は、入力ビンが1であるか否かということに係わる確率を考慮し、確率区間を分割して二進算術符号化を行う。図20Aにおいて、「1」の発生確率P(1)=0.8と仮定し、「0」の発生確率をP(0)=0.2と仮定する。説明のために、P(1)及びP(0)が固定された場合について説明するが、前述のように、P(1)及びP(0)の値は、1つのビンを符号化するたびにアップデートされる。レギュラーコーディング部1432は、まず入力されたビンであるSが1の値を有するので、(0,1)の区間のうち「1」の値の確率区間である(0,0.8)を選択し、次に入力されたビンSが0の値を有するので(0,0.8)区間のうち上側の0.2ほど該当する確率区間である(0.64,0.8)を選択し、最後に入力されたビンSが1の値を有するので、(0.64,0.8)の0.8ほどの区間である(0.64,0.768)を最終的に決定する。そして、レギュラーコーディング部1432は、区間(0.64,0.768)を示す代表値として0.75を選択し、0.75に該当する二進値0.11において、小数点以下の「11」をビットストリームとして出力する。すなわち、入力ビン「101」は、「11」にマッピングされて出力される。
図20Bを参照すれば、CABACによる二進算術符号化過程は、現在利用可能な範囲R、及びかような範囲Rの下位境界値rlbを更新することによって遂行される。二進算術符号化が始まるとき、R=510、rlb=0と設定される。現在ビンの値vbinがMPSである場合、範囲Rは、RMPSに変更され、現在ビンの値vbinがLPSである場合、範囲Rは、RLPSに変更され、下位境界値rlbは、RLPSを示すように更新される。前述の図20Aの例示のように、二進算術符号化過程において、現在ビンの値がMPSであるか、それともLPSであるかということにより、所定区間Rを更新し、更新された区間を示す二進値を出力する。
図21は、スケーリングファクタの個数によって、自己相関値Rに基づいて決定されたスケーリングファクタαの変化過程を示したグラフである。
図21において、x軸は、自己相関値(R=ρ)を示し、y軸は、スケーリングファクタ値を示す。入力されたビンについて、最適のスケーリングファクタを決定するとき、1個のスケーリングファクタαやαを利用する場合(2120)、スケーリングファクタ値は、過度に遅く所定値に収斂されるか、あるいは過度に早く所定値に収斂される。従って、1個のスケーリングファクタを利用するより、2個のスケーリングファクタを利用する場合(2110)が望ましい。
図22は、スケーリングファクタの個数によるMSEの変化量を示したグラフである。図22において、図面符号2210は、1つのスケーリングファクタを利用した場合のMSEを示し、図面符号2220は、2個のスケーリングファクタを利用した場合のMSEを示す。図22においてx軸は、自己相関値(R=ρ)を示し、y軸は、MSEを示す。図22を参照すれば、2個のスケーリングファクタを利用する場合(2220)のMSEが、1個のスケーリングファクタを利用する場合(2210)のMSEより小さい。すなわち、2個のスケーリングファクタを利用する場合、1個のスケーリングファクタを利用する場合より、自己相関値Rを利用して、さらに正確に確率を更新することができる。
図23は、本開示の一実施形態によるエントロピー復号装置の構成を示したブロック図である。図23を参照すれば、エントロピー復号装置2310は、コンテクストモデラ2310、レギュラーデコーディング部2320、バイパスデコーディング部2330、逆二進化部2340を含む。エントロピー復号装置2300は、前述のエントロピー符号化装置1400で遂行されるエントロピー符号化過程の逆過程を遂行する。
バイパスコーディングによって符号化されたビンは、バイパスデコーディング部2330に出力されて復号され、レギュラーコーディングによって符号化されたビンは、レギュラーデコーディング部2320によってデコーディングされる。レギュラーデコーディング部2320は、コンテクストモデラ2310に提供される現在ビンより先立って復号された以前ビンに基づいて決定された二進値の確率を利用して、現在ビンを算術復号する。
コンテクストモデラ2310は、レギュラーデコーディング部2320に、ビンに係わる確率モデルを提供する。具体的には、コンテクストモデラ2310は、以前に復号されたビンに基づいて、所定二進値の確率を決定し、以前ビンを復号するのに利用された二進値の確率を更新し、更新された確率をレギュラーデコーディング部2320に出力する。本開示の一実施形態によるコンテクストモデラ2310は、ビンの値を利用して、各ビンの自己相関値を獲得し、自己相関値に基づいて、二進値の確率更新に利用される少なくとも1つのスケーリングファクタを決定した後、決定された少なくとも1つのスケーリングファクタを利用して、二進値の確率を更新することができる。
また、本開示の他の実施形態によるコンテクストモデラ2310は、互いに異なるスケーリングファクタを有する複数個の確率モデルを適用し、ビンの平均ビット値を示すエントロピー値を獲得し、複数個の確率モデルのうち最小エントロピー値を獲得するのに利用された確率モデルが有するスケーリングファクタを決定し、決定されたスケーリングファクタを利用して、二進値の確率を更新することができる。コンテクストモデラ2310によって遂行される確率更新過程は、前述の符号化過程での確率更新過程と同一であり、具体的な説明は省略する。
逆二進化部2340は、レギュラーデコーディング部2320またはバイパスデコーディング部2330で復元されたビンストリングを、さらにシンタックスエレメントにマッピングさせて復元する。
図24は、本開示の一実施形態による、二進算術復号のための確率更新方法を示したフローチャートである。
段階2410において、コンテクストモデラ2310は、二進算術復号される所定個数のビンを受信する。
段階2420において、コンテクストモデラ2310は、受信された所定個数のビンの値を利用して、各ビンの自己相関値を獲得する。前述の数式(3)のように、所定距離k(kは整数)ほど離隔されたビンの値、ビンの平均値M、ビンの分散σを利用して、自己相関値Rが獲得される。
段階2430において、コンテクストモデラ2310は、自己相関値に基づいて、二進値の確率更新に利用される少なくとも1つのスケーリングファクタを決定する。前述のように、本開示の一実施形態による確率更新方法では、自己相関値に基づいて決定された各ビンの確率と、各ビン値との二乗誤差値(MSE)が最小になる値をスケーリングファクタとして利用する。1個のスケーリングファクタを利用する場合、1個の最適のスケーリングファクタは、前述の数式(8)
のように獲得される。2個のスケーリングファクタα及びαを利用する場合、前記数式(7)のpの代わりに、(p1,j+p2,j)/2を代入し、各ビンの確率と各ビン値とのMSEを計算し、MSEを最小にするスケーリングファクタα及びαを決定することができる。
ビンの自己相関値を利用して、1以上のスケーリングファクタが決定されれば、段階2440において、コンテクストモデラ2310は、決定された少なくとも1つのスケーリングファクタを利用して、コンテクスト基盤適応的二進算術復号(CABAD)に利用される確率を更新し、更新された確率をレギュラーデコーディング部2320に提供する。段階2450において、レギュラーデコーディング部2320は、更新された確率を利用して、次のビンを二進算術復号する。
図25は、本開示の他の実施形態による、二進算術復号のための確率更新方法を示したフローチャートである。
段階2510において、コンテクストモデラ2310は、二進算術復号される所定個数のビンを受信する。
段階2520において、コンテクストモデラ2310は、互いに異なるスケーリングファクタを有する複数個の確率モデルを適用し、前記ビンの平均ビット値を示すエントロピー値を獲得する。
前述の二進算術符号化過程のように、コンテクストモデラ2310は、ビン単位で、複数個の確率モデルを適用してエントロピーを計算する。すなわち、コンテクストモデラ2310は、現在ビンyの値によって、数式(10)のように、パラメーターbitを獲得し、数式(11)によって、パラメーターbitを利用して、現在ビンのエントロピーs(t)を獲得する。
段階2530において、コンテクストモデラ2310は、複数個のスケーリングファクタを適用して獲得された複数個のエントロピー値のうち最小のエントロピー値を有する場合、利用されたスケーリングファクタαを最終スケーリングファクタと決定する。
段階2540において、コンテクストモデラ2310は、決定されたスケーリングファクタを利用して、以前二進値の確率を更新し、レギュラーデコーディング部2320に出力し、レギュラーデコーディング部2320は、更新された確率を利用して、次のビンに係わるコンテクスト基盤適応的二進算術復号(CABAD)を行う。
本発明は、またコンピューターで読取り可能な記録媒体に、コンピューターで読取り可能なコードとして具現することが可能である。コンピューターで読取り可能な記録媒体は、コンピュータシステムによって読取り可能なデータが保存される全種の記録装置を含む。コンピュータで読取り可能な記録媒体の例としては、ROM(read-only memory)、RAM(random access memory)、CD−ROM(compact disc read only memory)、磁気テープ、フロッピー(登録商標)ディスク、光データ保存装置などが含まれる。また、コンピュータで読取り可能な記録媒体は、ネットワークに連結されたコンピュータシステムに分散され、分散方式でコンピュータで読取り可能なコードとして保存されて実行される。
以上、本発明についてその望ましい実施形態を中心に説明した。本発明が属する技術分野で当業者であるならば、本発明が、本発明の本質的な特性から外れない範囲で変形された形態に具現されるということを理解することができるであろう。本発明の範囲は、前述の説明ではなく、特許請求の範囲に示されており、それと同等な範囲内にある全ての差異は、本発明に含まれたものであると解釈されなければならないのである。

Claims (15)

  1. 二進算術復号される所定個数のビンを受信する段階と、
    前記受信された所定個数のビンの値を利用して、各ビンの自己相関値を獲得する段階と、
    前記自己相関値に基づいて、二進値の確率更新に利用される少なくとも1つのスケーリングファクタを決定する段階と、
    前記決定された少なくとも1つのスケーリングファクタを利用して、コンテクスト基盤適応的二進算術復号(CABAD)に利用される確率を更新する段階と、
    前記更新された確率を利用して、現在ビンを算術復号する段階と、を含むことを特徴とする二進算術復号のための確率更新方法。
  2. 前記少なくとも1つのスケーリングファクタは、
    前記自己相関値に基づいて決定された各ビンの確率と各ビン値との二乗誤差値(MSE)が最小になる値に決定されることを特徴とする請求項1に記載の二進算術復号のための確率更新方法。
  3. 前記自己相関値は、
    所定距離k(kは整数)ほど離隔されたビン間の自己相関値をRとし、前記ビンの平均値をM(Mは実数)とし、前記ビンの分散をσとし、前記ビンの個数をN+1(Nは整数)とし、前記(N+1)個のビンの値をy(jは0からNまでの整数)とするとき、前記Rは、次の数式
    によって獲得されることを特徴とする請求項1に記載の二進算術復号のための確率更新方法。
  4. 前記スケーリングファクタは1個であり、前記1個のスケーリングファクタαは、前記獲得された自己相関値Rを利用して、次の数式
    によって獲得されることを特徴とする請求項3に記載の二進算術復号のための確率更新方法。
  5. 前記スケーリングファクタは、2個(bは整数)であり、前記自己相関値Rの値に基づいて、
    Rk∈[−1,1/7]である場合、前記2個のスケーリングファクタα及びαは、0の値を有し、
    Rk∈[1/7,1/2]である場合、
    及びα=0であり、
    Rk∈[1/2,5/7]である場合、α=1及びα=0であり、
    Rk∈[5/7,1]である場合、α=1及び
    であることを特徴とする請求項3に記載の二進算術復号のための確率更新方法。
  6. 前記現在ビンの値をy(yは、0または1)とし、前記現在ビン以前の確率をp(t−1)(tは整数)とし、前記更新された確率をp(t)とし、前記スケーリングファクタをαとするとき、前記更新された確率p(t)は、次の数式P(t)=αy+(1−α)*P(t−1)によって獲得されることを特徴とする請求項1に記載の二進算術復号のための確率更新方法。
  7. 前記スケーリングファクタは、複数個であり、複数個のスケーリングファクタをαとし、前記現在ビンの値をy(yは、0または1)とし、以前ビンの確率をp(t−1)(tは整数)とし、前記スケーリングファクタαによって更新された確率p(t)は、次の数式P(t)=αy+(1−α)*P(t−1)とするとき、複数個の更新された確率P(t)の加重平均値を最終的な更新確率P(t)として利用することを特徴とする請求項1に記載の二進算術復号のための確率更新方法。
  8. 二進算術符号化される所定個数のビンを受信する段階と、
    前 記受信された所定個数のビンの値を利用して、各ビンの自己相関値を獲得する段階と、
    前記自己相関値に基づいて、二進値の確率更新に利用される少なくとも1つのスケーリングファクタを決定する段階と、
    前記決定された少なくとも1つのスケーリングファクタを利用して、コンテクスト基盤適応的二進算術符号化(CABAC)に利用される確率を更新する段階と、
    前記更新された確率を利用して、現在ビンを算術符号化する段階と、を含むことを特徴とする二進算術符号化のための確率更新方法。
  9. 二進算術復号される所定個数のビンを受信する段階と、
    互いに異なるスケーリングファクタを有する複数個の確率モデルを適用し、前記ビンの平均ビット値を示すエントロピー値を獲得する段階と、
    前記複数個の確率モデルのうち最小エントロピー値を獲得するのに利用された確率モデルが有するスケーリングファクタを決定する段階と、
    前記ビンに対して、前記決定されたスケーリングファクタを利用した確率更新過程を含むコンテクスト基盤適応的二進算術復号(CABAD)を行う段階と、を含むことを特徴とする二進算術復号のための確率更新方法。
  10. 現在ビンの値をyとし、複数個の確率モデルが有するスケーリングファクタをαとし、現在ビンの確率をp(t)とし、以前ビンについて獲得されたエントロピーを、現在ビンのエントロピーs(t−1)であるとするとき、現在ビンのエントロピーs(t)は、次の数式
    によって獲得されたパラメーターbitを利用して、次の数式
    によって獲得されることを特徴とする請求項9に記載の二進算術復号のための確率更新方法。
  11. 二進算術復号される所定個数のビンを受信する段階と、
    互いに異なるスケーリングファクタを有する複数個の確率モデルを適用し、前記ビンの平均ビット値を示すエントロピー値を獲得する段階と、
    前記複数個の確率モデルのうち最小エントロピー値を獲得するのに利用された確率モデルが有するスケーリングファクタを決定する段階と、
    前記ビンに対して、前記決定されたスケーリングファクタを利用した確率更新過程を含むコンテクスト基盤適応的二進算術符号化(CABAC)を行う段階と、を含むことを特徴とする二進算術符号化のための確率更新方法。
  12. 現在ビンの値をyとし、複数個の確率モデルが有するスケーリングファクタをαとし、現在ビンの確率をp(t)とし、以前ビンについて獲得されたエントロピーを、現在ビンのエントロピーs(t−1)であるとするとき、現在ビンのエントロピーs(t)は、次の数式
    によって獲得されたパラメーターbitを利用して、次の数式
    によって獲得されることを特徴とする請求項11に記載の二進算術符号化のための確率更新方法。
  13. 二進値のビンを所定シンタックスエレメントの値にマッピングする逆二進化部と、
    二進算術復号される所定個数のビンを受信し、前記受信された所定個数のビンの値を利用して、各ビンの自己相関値を獲得し、前記自己相関値に基づいて、二進値の確率更新に利用される少なくとも1つのスケーリングファクタを決定し、前記決定された少なくとも1つのスケーリングファクタを利用して、コンテクスト基盤適応的二進算術復号(CABAD)に利用される確率を更新するコンテクストモデラと、
    前記更新された確率を利用して、現在ビンを算術復号するレギュラーデコーディング部と、を含むことを特徴とするエントロピー復号装置。
  14. 所定シンタックスエレメントの値を二進値のビンにマッピングする二進化部と、
    二進算術復号される所定個数のビンを受信し、前記受信された所定個数のビンの値を利用して、各ビンの自己相関値を獲得し、前記自己相関値に基づいて、二進値の確率更新に利用される少なくとも1つのスケーリングファクタを決定し、前記決定された少なくとも1つのスケーリングファクタを利用して、コンテクスト基盤適応的二進算術復号(CABAD)に利用される確率を更新するコンテクストモデラと、
    前記更新された確率を利用して、現在ビンを算術符号化するレギュラーコーディング部と、を含むことを特徴とするエントロピー符号化装置。
  15. 二進値のビンを所定シンタックスエレメントの値にマッピングする逆二進化部と、
    二進算術復号される所定個数のビンを受信し、互いに異なるスケーリングファクタを有する複数個の確率モデルを適用し、前記ビンの平均ビット値を示すエントロピー値を獲得し、前記複数個の確率モデルのうち最小エントロピー値を獲得するのに利用された確率モデルが有するスケーリングファクタを決定し、決定されたスケーリングファクタを利用した確率更新を行うコンテクストモデラと、
    前記更新された確率を利用して、現在ビンを算術復号するレギュラーデコーディング部と、を含むことを特徴とするエントロピー復号装置。
JP2017524039A 2014-11-04 2015-11-04 二進算術符号化/復号のための確率更新方法、及びそれを利用したエントロピー符号化/復号装置 Pending JP2017538338A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201462074943P 2014-11-04 2014-11-04
US62/074,943 2014-11-04
PCT/KR2015/011794 WO2016072744A1 (ko) 2014-11-04 2015-11-04 이진 산술 부호화/복호화를 위한 확률 갱신 방법 및 이를 이용한 엔트로피 부호화/복호화 장치

Publications (1)

Publication Number Publication Date
JP2017538338A true JP2017538338A (ja) 2017-12-21

Family

ID=55909395

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017524039A Pending JP2017538338A (ja) 2014-11-04 2015-11-04 二進算術符号化/復号のための確率更新方法、及びそれを利用したエントロピー符号化/復号装置

Country Status (8)

Country Link
US (1) US10432945B2 (ja)
EP (1) EP3206399A4 (ja)
JP (1) JP2017538338A (ja)
KR (1) KR20170078670A (ja)
CN (1) CN107113445A (ja)
AU (1) AU2015343932A1 (ja)
CA (1) CA2966720A1 (ja)
WO (1) WO2016072744A1 (ja)

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017538338A (ja) 2014-11-04 2017-12-21 サムスン エレクトロニクス カンパニー リミテッド 二進算術符号化/復号のための確率更新方法、及びそれを利用したエントロピー符号化/復号装置
US10148961B2 (en) * 2015-05-29 2018-12-04 Qualcomm Incorporated Arithmetic coder with multiple window sizes
EP3629581A1 (en) * 2015-10-13 2020-04-01 Samsung Electronics Co., Ltd. Method and device for encoding or decoding image
EP3244610A1 (en) * 2016-05-12 2017-11-15 Thomson Licensing Method and device for context-adaptive binary arithmetic coding a sequence of binary symbols representing a syntax element related to video data
CN108259896B (zh) * 2016-12-29 2021-10-08 四川大学 一种利用系数分布特性的哥伦布-莱斯初始参数自适应决策方法
US10757412B2 (en) * 2017-01-03 2020-08-25 Avago Technologies International Sales Pte. Limited Architecture flexible binary arithmetic coding system
US10531085B2 (en) * 2017-05-09 2020-01-07 Futurewei Technologies, Inc. Coding chroma samples in video compression
US10791341B2 (en) * 2017-10-10 2020-09-29 Qualcomm Incorporated Binary arithmetic coding with progressive modification of adaptation parameters
US11366738B2 (en) * 2018-03-12 2022-06-21 Headspin, Inc. System to determine performance based on entropy values
US10939115B2 (en) * 2018-06-19 2021-03-02 Qualcomm Incorporated Efficient weighted probability estimation for binary arithmetic coding
US11218737B2 (en) 2018-07-23 2022-01-04 Google Llc Asymmetric probability model update and entropy coding precision
WO2020080901A1 (ko) * 2018-10-18 2020-04-23 삼성전자 주식회사 엔트로피 부호화/복호화 방법 및 장치
CN109450596B (zh) * 2018-11-12 2022-02-01 湖南瑞利德信息科技有限公司 编码方法、解码方法、编码设备、解码设备、存储介质及终端
CN110474876B (zh) * 2019-07-15 2020-10-16 湖南遥昇通信技术有限公司 一种数据编码解码方法、装置、设备以及存储介质
US11386663B1 (en) 2020-08-28 2022-07-12 Headspin, Inc. Reference-free system for determining quality of video data
WO2023163807A1 (en) * 2022-02-22 2023-08-31 Google Llc Time-variant multi-hypothesis probability model update for entropy coding

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100648258B1 (ko) 2004-08-02 2006-11-23 삼성전자주식회사 고속의 디코딩을 수행하는 파이프라인 구조의 내용 기반적응적 이진 산술 디코더
US20090123066A1 (en) * 2005-07-22 2009-05-14 Mitsubishi Electric Corporation Image encoding device, image decoding device, image encoding method, image decoding method, image encoding program, image decoding program, computer readable recording medium having image encoding program recorded therein,
CA2610276C (en) * 2005-07-22 2013-01-29 Mitsubishi Electric Corporation Image encoder and image decoder, image encoding method and image decoding method, image encoding program and image decoding program, and computer readable recording medium recorded with image encoding program and computer readable recording medium recorded with image decoding program
CN100561877C (zh) * 2007-01-26 2009-11-18 北京中星微电子有限公司 提高算术编码速度的方法、***及编码装置
US7535387B1 (en) * 2007-09-10 2009-05-19 Xilinx, Inc. Methods and systems for implementing context adaptive binary arithmetic coding
US9008171B2 (en) * 2008-01-08 2015-04-14 Qualcomm Incorporated Two pass quantization for CABAC coders
KR101675116B1 (ko) 2009-08-06 2016-11-10 삼성전자 주식회사 영상의 부호화 방법 및 장치, 그 복호화 방법 및 장치
CN102939719B (zh) * 2010-05-21 2016-08-03 黑莓有限公司 用于在二进制熵编码和解码中减少源的方法和设备
KR101638300B1 (ko) 2010-07-28 2016-07-08 노키아 코포레이션 복잡도 균형 엔트로피 코딩을 제공하는 방법 및 장치
CN103404035B (zh) 2011-01-14 2017-05-10 Ge视频压缩有限责任公司 熵编码及解码方案
US9379736B2 (en) * 2011-06-03 2016-06-28 Qualcomm Incorporated Context-adaptive coding video data
KR102106534B1 (ko) * 2011-06-28 2020-05-04 삼성전자주식회사 엔트로피 부호화/복호화 방법 및 장치
KR20130122353A (ko) * 2012-04-30 2013-11-07 삼성전자주식회사 비트율 추정 장치 및 그것의 비트율 추정 방법
US9425822B2 (en) * 2014-08-05 2016-08-23 Broadcom Corporation Simplified range and context update for multimedia context-adaptive binary arithmetic coding design
JP2017538338A (ja) 2014-11-04 2017-12-21 サムスン エレクトロニクス カンパニー リミテッド 二進算術符号化/復号のための確率更新方法、及びそれを利用したエントロピー符号化/復号装置

Also Published As

Publication number Publication date
EP3206399A1 (en) 2017-08-16
WO2016072744A1 (ko) 2016-05-12
EP3206399A4 (en) 2017-10-25
US20170339413A1 (en) 2017-11-23
KR20170078670A (ko) 2017-07-07
CA2966720A1 (en) 2016-05-12
CN107113445A (zh) 2017-08-29
AU2015343932A1 (en) 2017-06-01
US10432945B2 (en) 2019-10-01

Similar Documents

Publication Publication Date Title
JP2017538338A (ja) 二進算術符号化/復号のための確率更新方法、及びそれを利用したエントロピー符号化/復号装置
JP6595679B2 (ja) ビデオ復号化装置
JP6510618B2 (ja) ビデオ復号化方法及びその装置
JP6402234B2 (ja) ビデオ復号化方法及び装置とビデオ符号化方法及び装置
JP5873203B2 (ja) 算術符号化を伴ったビデオ符号化方法及びその装置、ビデオ復号化方法及びその装置
KR102106534B1 (ko) 엔트로피 부호화/복호화 방법 및 장치
JP2014533058A (ja) ビデオの算術符号化方法及びその装置、並びにビデオの算術復号化方法及びその装置
CN111183647B (zh) 用于解码视频数据的方法、装置和计算机可读媒体
MX2014000162A (es) Metodo y aparato para codificacion de entropia usando unidad de datos jerargicos, y metodo y aparato para decodificacion.
KR102600727B1 (ko) 파라미터화된 확률 추정 유한 상태 머신들을 이용한 이진 산술 코딩