JP2014523186A

JP2014523186A - エントロピー符号化／復号化方法及びその装置

Info

Publication number: JP2014523186A
Application number: JP2014518805A
Authority: JP
Inventors: アルシン，アレクサンダー; アルシナ，エレナ
Original assignee: Samsung Electronics Co Ltd
Current assignee: Samsung Electronics Co Ltd
Priority date: 2011-06-28
Filing date: 2012-06-28
Publication date: 2014-09-08
Also published as: WO2013002585A3; US20140177708A1; EP2760201A4; WO2013002585A2; EP2760201A2; CN103797803A; KR102106534B1; US9661326B2; KR20130002298A

Abstract

映像のエントロピー符号化方法及び装置、並びにエントロピー復号化方法及び装置を提供する。現在の符号化シンボルよりも先に符号化された以前の符号化シンボルに基づいて決定された所定の二進値の確率を利用して、現在の符号化シンボルの二進値を算術符号化するステップと、現在の符号化シンボルの二進値によって、所定の二進値の確率を、複数個のスケーリングファクタを利用してアップデートするステップと、を含むエントロピー符号化方法である。

Description

本発明は、エントロピー符号化及び復号化に係り、より詳しくは、コンテキストに基づいた二進算術符号化／復号化において確率モデルをアップデートする方法及び装置に関する。

Ｈ．２６４及びＭＰＥＧ−４のような現在の国際ビデオコーディング標準において、ビデオ信号は、シーケンス、フレーム、スライス、マクロブロック及びブロックに階層的に分割され、ブロックは、最小処理ユニットとなる。エンコーディング側面で、イントラ・フレーム予測またはインター・フレーム予測を通じて、ブロックのレジデュアルデータが獲得される。また、レジデュアルデータは、変換、量子化、スキャニング、ランレングスコーディング及びエントロピーコーディングを通じて圧縮される。デコーディング側面で、処理手順は逆になる。まず、エントロピーコーディング時に生成された変換ブロックの係数が、ビットストリームから抽出される。次いで、逆量子化及び逆変換を通じて、ブロックのレジデュアルデータは再構成され、予測情報は、ブロックのビデオデータを再構成するために使われる。

本発明が解決しようとする課題は、コンテキストに基づいた二進算術符号化過程で行われる確率のアップデート過程を改善することによって、映像の圧縮効率を向上させることにある。

本発明の一実施形態は、複数個のスケーリングファクタを利用して、確率モデルをアップデートする。

本発明によれば、コンテキストに基づいた二進算術符号化性能が向上する。

本発明の一実施形態によるビデオ符号化装置を示すブロック図である。本発明の一実施形態によるビデオ復号化装置を示すブロック図である。本発明の一実施形態による符号化単位の概念を示す図面である。本発明の一実施形態による符号化単位に基づいた映像符号化部を示すブロック図である。本発明の一実施形態による符号化単位に基づいた映像復号化部を示すブロック図である。本発明の一実施形態による深度別の符号化単位及びパーティションを示す図面である。本発明の一実施形態による符号化単位と変換単位の関係を示す図面である。本発明の一実施形態による深度別の符号化情報を示す図面である。本発明の一実施形態による深度別の符号化単位を示す図面である。本発明の一実施形態による符号化単位、予測単位及び周波数変換単位の関係を示す図面である。本発明の一実施形態による符号化単位、予測単位及び周波数変換単位の関係を示す図面である。本発明の一実施形態による符号化単位、予測単位及び周波数変換単位の関係を示す図面である。表１の符号化モード情報による符号化単位、予測単位及び変換単位の関係を示す図面である。本発明の一実施形態によるエントロピー符号化装置の構成を示すブロック図である。本発明に係る技術分野で行われる確率モデルのアップデート過程を簡略に示す図面である。本発明の一実施形態によって、複数個のスケーリングファクタを利用した確率アップデート過程と、一つのスケーリングファクタを利用した確率アップデート過程とを比較するための図面である。本発明の一実施形態による所定の二進値の確率アップデート過程を示すフローチャートである。本発明の一実施形態による二進算術符号化を行う過程を示す図面である。本発明の一実施形態によるエントロピー符号化方法を示すフローチャートである。本発明の一実施形態によるエントロピー復号化装置の構成を示すブロック図である。本発明の一実施形態によるエントロピー復号化方法を示すフローチャートである。

本発明の一実施形態による映像のエントロピー符号化方法は、現在の符号化シンボルよりも先に符号化された以前の符号化シンボルに基づいて決定された所定の二進値の確率を利用して、前記現在の符号化シンボルの二進値を算術符号化するステップと、前記現在の符号化シンボルの二進値によって、前記所定の二進値の確率を、複数個のスケーリングファクタを利用してアップデートするステップと、を含むことを特徴とする。

本発明の一実施形態による映像のエントロピー符号化装置は、現在の符号化シンボルよりも先に符号化された以前の符号化シンボルに基づいて決定された所定の二進値の確率を利用して、前記現在の符号化シンボルの二進値を算術符号化する二進算術符号化部と、前記現在の符号化シンボルの二進値によって、前記所定の二進値の確率を、複数個のスケーリングファクタを利用してアップデートするコンテキストモデラーと、を備えることを特徴とする。

本発明の一実施形態による映像のエントロピー復号化方法は、現在の符号化シンボルよりも先に復号化された以前の符号化シンボルに基づいて決定された所定の二進値の確率を利用して、前記現在の符号化シンボルの二進値を算術復号化するステップと、前記現在の符号化シンボルの二進値によって、前記所定の二進値の確率を、複数個のスケーリングファクタを利用してアップデートするステップと、を含むことを特徴とする。

本発明の一実施形態による映像のエントロピー復号化装置は、現在の符号化シンボルよりも先に復号化された以前の符号化シンボルに基づいて決定された所定の二進値の確率を利用して、前記現在の符号化シンボルの二進値を算術復号化する二進算術復号化部と、前記現在の符号化シンボルの二進値によって、前記所定の二進値の確率を、複数個のスケーリングファクタを利用してアップデートするコンテキストモデラーと、を備えることを特徴とする。

以下、添付された図面を参照して、本発明の望ましい実施形態について具体的に説明する。

図１は、本発明の一実施形態によるビデオ符号化装置を示すブロック図である。一実施形態によるビデオ符号化装置１００は、最大符号化単位分割部１１０、符号化単位決定部１２０及び出力部１３０を備える。

最大符号化単位分割部１１０は、映像の現在のピクチャのための最大サイズの符号化単位である最大符号化単位に基づいて、現在のピクチャを区画する。現在のピクチャが最大符号化単位よりも大きければ、現在のピクチャの映像データは、少なくとも一つの最大符号化単位に分割される。一実施形態による最大符号化単位は、サイズ３２×３２、６４×６４、１２８×１２８、２５６×２５６などのデータ単位であって、横及び縦のサイズが８よりも大きい２の自乗である正方形のデータ単位である。映像データは、少なくとも一つの最大符号化単位別に、符号化単位決定部１２０に出力される。

一実施形態による符号化単位は、最大サイズ及び深度によって特徴づけられる。深度とは、最大符号化単位から、符号化単位が空間的に分割された回数を表し、深度が深くなるほど、深度別の符号化単位は、最大符号化単位から最小符号化単位まで分割される。最大符号化単位の深度が最上位深度であり、最小符号化単位が最下位符号化単位であると定義される。最大符号化単位は、深度が深くなるにつれて、深度別の符号化単位のサイズは減少するので、上位深度の符号化単位は、複数個の下位深度の符号化単位を含む。

前述したように、符号化単位の最大サイズによって、現在のピクチャの映像データを、最大符号化単位に分割し、それぞれの最大符号化単位は、深度別に分割される符号化単位を含む。一実施形態による最大符号化単位は、深度別に分割されるので、最大符号化単位に含まれた空間領域の映像データが、深度によって階層的に分類される。

最大符号化単位の高さ及び幅を階層的に分割可能な総回数を制限する最大深度及び符号化単位の最大サイズは、予め設定されていてもよい。

符号化単位決定部１２０は、深度ごとに最大符号化単位の領域が分割された少なくとも一つの分割領域を符号化して、少なくとも一つの分割領域別に、最終の符号化結果が出力される深度を決定する。すなわち、符号化単位決定部１２０は、現在のピクチャの最大符号化単位ごとに、深度別の符号化単位に映像データを符号化して、最小の符号化誤差が発生する深度を選択して、符号化深度として決定する。決定された符号化深度及び最大符号化単位別の映像データは、出力部１３０に出力される。

最大符号化単位内の映像データは、最大深度以下の少なくとも一つの深度によって、深度別の符号化単位に基づいて符号化され、それぞれの深度別の符号化単位に基づいた符号化結果が比較される。深度別の符号化単位の符号化誤差の比較結果、符号化誤差の最も小さい深度が選択される。それぞれの最大符号化単位ごとに、少なくとも一つの符号化深度が決定される。

最大符号化単位のサイズは、深度が深くなるにつれて、符号化単位が階層的に分割され、符号化単位の個数は増加する。また、一つの最大符号化単位に含まれる同一な深度の符号化単位であるとしても、それぞれのデータについての符号化誤差を測定し、下位深度への分割如何が決定される。したがって、一つの最大符号化単位に含まれるデータであるとしても、位置によって、深度別の符号化誤差が異なるので、位置によって、符号化深度が異なって決定される。したがって、一つの最大符号化単位に対して、符号化深度が一つ以上設定され、最大符号化単位のデータは、一つ以上の符号化深度の符号化単位によって区画される。

したがって、一実施形態による符号化単位決定部１２０は、現在の最大符号化単位に含まれるツリー構造による符号化単位が決定される。一実施形態による‘ツリー構造による符号化単位’は、現在の最大符号化単位に含まれる全ての深度別の符号化単位のうち、符号化深度として決定された深度の符号化単位を含む。符号化深度の符号化単位は、最大符号化単位内で、同一領域では深度によって階層的に決定され、他の領域では独立して決定される。同様に、現在の領域についての符号化深度は、他の領域についての符号化深度と独立して決定される。

一実施形態による最大深度は、最大符号化単位から最小符号化単位までの分割回数に係る指標である。一実施形態による第１最大深度は、最大符号化単位から最小符号化単位までの総分割回数を表す。一実施形態による第２最大深度は、最大符号化単位から最小符号化単位までの深度レベルの総個数を表す。例えば、最大符号化単位の深度が０であるとする時、最大符号化単位が１回分割された符号化単位の深度は、１に設定され、２回分割された符号化単位の深度は、２に設定される。その場合、最大符号化単位から４回分割された符号化単位が最小符号化単位であれば、深度０、１、２、３及び４の深度レベルが存在するので、第１最大深度は４、第２最大深度は５に設定される。

最大符号化単位の予測符号化及び周波数変換が行われる。予測符号化及び周波数変換も同様に、最大符号化単位ごとに、最大深度以下の深度ごとに、深度別の符号化単位に基づいて行われる。

最大符号化単位が深度別に分割される度に、深度別の符号化単位の個数が増加するので、深度が深くなるにつれて生成される全ての深度別の符号化単位に対して、予測符号化及び周波数変換を含む符号化が行われなければならない。以下、説明の便宜上、少なくとも一つの最大符号化単位のうち、現在の深度の符号化単位に基づいて、予測符号化及び周波数変換を説明する。

一実施形態によるビデオ符号化装置１００は、映像データの符号化のためのデータ単位のサイズまたは形態を多様に選択可能である。映像データの符号化のためには、予測符号化、周波数変換、エントロピー符号化などのステップを経るが、全てのステップにわたって、同一なデータ単位が使われてもよく、ステップ別にデータ単位が変更されてもよい。

例えば、ビデオ符号化装置１００は、映像データの符号化のための符号化単位だけでなく、符号化単位の映像データの予測符号化を行うために、符号化単位と異なるデータ単位を選択する。

最大符号化単位の予測符号化のためには、一実施形態による符号化深度の符号化単位、すなわち、それ以上分割されない符号化単位に基づいて、予測符号化が行われる。以下、予測符号化の基本となるそれ以上分割されない符号化単位を、‘予測単位’とする。予測単位が分割されたパーティションは、予測単位と、予測単位の高さ及び幅のうち少なくとも一つが分割されたデータ単位とを含む。

例えば、サイズ２Ｎ×２Ｎ（ただし、Ｎは、正の整数）の符号化単位がそれ以上分割されない場合、サイズ２Ｎ×２Ｎの予測単位となり、パーティションのサイズは、２Ｎ×２Ｎ、２Ｎ×Ｎ、Ｎ×２Ｎ、Ｎ×Ｎなどである。一実施形態によるパーティションタイプは、予測単位の高さまたは幅が対称的な割合で分割された対称的なパーティションだけでなく、１：ｎまたはｎ：１のように非対称的な割合で分割されたパーティション、幾何学的な形態に分割されたパーティション、任意の形態のパーティションなどを選択的に含んでもよい。

予測単位の予測モードは、イントラモード、インターモード及びスキップモードのうち少なくとも一つである。例えば、イントラモード及びインターモードは、２Ｎ×２Ｎ、２Ｎ×Ｎ、Ｎ×２Ｎ、Ｎ×Ｎサイズのパーティションに対して行われる。また、スキップモードは、２Ｎ×２Ｎサイズのパーティションに対してのみ行われる。符号化単位以内の一つの予測単位ごとに、独立して符号化が行われて、符号化誤差の最も小さい予測モードが選択される。

また、一実施形態によるビデオ符号化装置１００は、映像データの符号化のための符号化単位だけでなく、符号化単位と異なるデータ単位に基づいて、符号化単位の映像データの周波数変換を行う。

符号化単位の周波数変換のためには、符号化単位よりも小さいか、またはそれと同じサイズのデータ単位に基づいて、周波数変換が行われる。例えば、周波数変換のためのデータ単位は、イントラモードのためのデータ単位と、インターモードのためのデータ単位とを含む。

以下、周波数変換の基本となるデータ単位を、‘変換単位’とする。符号化単位と類似した方式によって、符号化単位内の変換単位も、再帰的にさらに小さいサイズの変換単位に分割されつつ、符号化単位のレジデュアルデータが、変換深度によって、ツリー構造による変換単位によって区画される。

一実施形態による変換単位に対しても、符号化単位の高さ及び幅が分割され、変換単位に達するまでの分割回数を表す変換深度が設定される。例えば、サイズ２Ｎ×２Ｎの現在の符号化単位の変換単位のサイズが２Ｎ×２Ｎであれば、変換深度は０、変換単位のサイズがＮ×Ｎであれば、変換深度は１、変換単位のサイズがＮ／２×Ｎ／２であれば、変換深度は２に設定される。すなわち、変換単位に対しても、変換深度によって、ツリー構造による変換単位が設定される。

符号化深度別の符号化情報は、符号化深度だけでなく、予測関連情報及び周波数変換関連情報が必要である。したがって、符号化単位決定部１２０は、最小符号化誤差を発生させた符号化深度だけでなく、予測単位をパーティションに分割したパーティションタイプ、予測単位別の予測モード、周波数変換のための変換単位のサイズなどを決定する。

一実施形態による最大符号化単位のツリー構造による符号化単位及びパーティションの決定方式については、図３ないし図１２を参照して詳細に後述する。

符号化単位決定部１２０は、深度別の符号化単位の符号化誤差を、ラグランジュ乗数に基づいた率−歪曲最適化技法を利用して測定する。

出力部１３０は、符号化単位決定部１２０で決定された少なくとも一つの符号化深度に基づいて符号化された最大符号化単位の映像データ、及び深度別の符号化モードに係る情報を、ビットストリームの形態で出力する。

符号化された映像データは、映像のレジデュアルデータの符号化結果である。

深度別の符号化モードに係る情報は、符号化深度情報、予測単位のパーティションタイプ情報、予測モード情報、変換単位のサイズ情報などを含む。

符号化深度情報は、現在の深度で符号化せず、下位深度の符号化単位で符号化するか否かを表す深度別の分割情報を利用して定義される。現在の符号化単位の現在の深度が符号化深度であれば、現在の符号化単位は、現在の深度の符号化単位で符号化されるので、現在の深度の分割情報は、それ以上下位深度に分割されないように定義される。逆に、現在の符号化単位の現在の深度が符号化深度でなければ、下位深度の符号化単位を利用した符号化を試みなければならないので、現在の深度の分割情報は、下位深度の符号化単位に分割されるように定義される。

現在の深度が符号化深度でなければ、下位深度の符号化単位に分割された符号化単位に対して、符号化が行われる。現在の深度の符号化単位内に、下位深度の符号化単位が一つ以上存在するので、それぞれの下位深度の符号化単位ごとに、反復的に符号化が行われて、同一な深度の符号化単位ごとに、再帰的に符号化が行われる。

一つの最大符号化単位内に、ツリー構造の符号化単位が決定され、符号化深度の符号化単位ごとに、少なくとも一つの符号化モードに係る情報が決定されなければならないので、一つの最大符号化単位に対しては、少なくとも一つの符号化モードに係る情報が決定される。また、最大符号化単位のデータは、深度によって階層的に区画されて、位置別に符号化深度が異なるので、データに対して、符号化深度及び符号化モードに係る情報が設定される。

したがって、一実施形態による出力部１３０は、最大符号化単位に含まれている符号化単位、予測単位及び最小単位のうち少なくとも一つに対して、当該符号化深度及び符号化モードに係る符号化情報を割り当てる。

一実施形態による最小単位は、最下位符号化深度である最小符号化単位が４分割されたサイズの正方形のデータ単位であり、最大符号化単位に含まれる全ての符号化単位、予測単位及び変換単位内に含まれる最大サイズの正方形のデータ単位である。

例えば、出力部１３０を通じて出力される符号化情報は、深度別の符号化単位別の符号化情報と、予測単位別の符号化情報とに分けられる。深度別の符号化単位別の符号化情報は、予測モード情報及びパーティションサイズ情報を含む。予測単位別に伝送される符号化情報は、インターモードの推定方向に係る情報、インターモードの参照映像インデックスに係る情報、動きベクトルに係る情報、イントラモードのクロマ成分に係る情報、イントラモードの補間方式に係る情報などを含む。また、ピクチャ、スライスまたはＧＯＰ別に定義される符号化単位の最大サイズに係る情報、及び最大深度に係る情報は、ビットストリームのヘッダに挿入される。

ビデオ符号化装置１００の最も簡単な実施形態によれば、深度別の符号化単位は、一階層上位深度の符号化単位の高さ及び幅を半分にしたサイズの符号化単位である。すなわち、現在の深度の符号化単位のサイズが２Ｎ×２Ｎであれば、下位深度の符号化単位のサイズは、Ｎ×Ｎである。また、２Ｎ×２Ｎサイズの現在の符号化単位は、Ｎ×Ｎサイズの下位深度の符号化単位を最大四つ含む。

したがって、一実施形態によるビデオ符号化装置１００は、現在のピクチャの特性を考慮して決定された最大符号化単位のサイズ及び最大深度に基づいて、それぞれの最大符号化単位ごとに最適の形態及びサイズの符号化単位を決定して、ツリー構造による符号化単位を構成する。また、それぞれの最大符号化単位ごとに、多様な予測モード、周波数変換方式などにより符号化するので、多様な映像サイズの符号化単位の映像特性を考慮して、最適の符号化モードが決定される。

したがって、映像の解像度が高すぎるか、またはデータ量が多すぎる映像を既存のマクロブロック単位で符号化すれば、ピクチャ当たりマクロブロックの数が過度に多くなる。それによって、マクロブロックごとに生成される圧縮情報も多くなるので、圧縮情報の伝送負担が大きくなり、データ圧縮効率が低下する傾向がある。したがって、一実施形態によるビデオ符号化装置は、映像のサイズを考慮して、符号化単位の最大サイズを増大させつつ、映像特性を考慮して、符号化単位を調節できるので、映像圧縮効率が向上する。

図２は、本発明の一実施形態によるビデオ復号化装置を示すブロック図である。一実施形態によるビデオ復号化装置２００は、受信部２１０、映像データ及び符号化情報抽出部２２０、及び映像データ復号化部２３０を備える。一実施形態によるビデオ復号化装置２００の各種のプロセッシングのための符号化単位、深度、予測単位、変換単位、各種の符号化モードに係る情報などの各種の用語の定義は、図１及びビデオ符号化装置１００を参照して説明した通りである。

受信部２１０は、符号化されたビデオについてのビットストリームを受信して、パージングする。映像データ及び符号化情報抽出部２２０は、パージングされたビットストリームから、最大符号化単位別にツリー構造による符号化単位によって、符号化単位ごとに符号化された映像データを抽出して、映像データ復号化部２３０に出力する。映像データ及び符号化情報抽出部２２０は、現在のピクチャについてのヘッダから、現在のピクチャの符号化単位の最大サイズに係る情報を抽出する。

また、映像データ及び符号化情報抽出部２２０は、パージングされたビットストリームから、最大符号化単位別に、ツリー構造による符号化単位についての符号化深度及び符号化モードに係る情報を抽出する。抽出された符号化深度及び符号化モードに係る情報は、映像データ復号化部２３０に出力される。すなわち、ビット列の映像データを最大符号化単位に分割して、映像データ復号化部２３０が最大符号化単位ごとに映像データを復号化する。

最大符号化単位別の符号化深度及び符号化モードに係る情報は、一つ以上の符号化深度情報について設定され、符号化深度別の符号化モードに係る情報は、当該符号化単位のパーティションタイプ情報、予測モード情報、及び変換単位のサイズ情報などを含む。また、符号化深度情報として、深度別の分割情報が抽出されることも可能である。

映像データ及び符号化情報抽出部２２０が抽出した最大符号化単位別の符号化深度及び符号化モードに係る情報は、一実施形態によるビデオ符号化装置１００のように符号化端で、最大符号化単位別の深度別の符号化単位ごとに、反復的に符号化を行って、最小符号化誤差を発生させることによって決定された符号化深度及び符号化モードに係る情報である。したがって、ビデオ復号化装置２００は、最小符号化誤差を発生させる符号化方式によって、データを復号化して、映像を復元する。

一実施形態による符号化深度及び符号化モードに係る符号化情報は、当該符号化単位、予測単位及び最小単位のうち、所定のデータ単位に対して割り当てられているので、映像データ及び符号化情報抽出部２２０は、所定のデータ単位別に、符号化深度及び符号化モードに係る情報を抽出する。所定のデータ単位別に、当該最大符号化単位の符号化深度及び符号化モードに係る情報が記録されていれば、同一な符号化深度及び符号化モードに係る情報を有している所定のデータ単位は、同一な最大符号化単位に含まれるデータ単位と類推される。

映像データ復号化部２３０は、最大符号化単位別の符号化深度及び符号化モードに係る情報に基づいて、それぞれの最大符号化単位の映像データを復号化して、現在のピクチャを復元する。すなわち、映像データ復号化部２３０は、最大符号化単位に含まれるツリー構造による符号化単位のうち、それぞれの符号化単位ごとに、読み取られたパーティションタイプ、予測モード及び変換単位に基づいて、符号化された映像データを復号化する。復号化過程は、イントラ予測及び動き補償を含む予測過程と、周波数逆変換過程とを含む。

映像データ復号化部２３０は、符号化深度別の符号化単位の予測単位のパーティションタイプ情報及び予測モード情報に基づいて、符号化単位ごとに、それぞれのパーティション及び予測モードによって、イントラ予測または動き補償を行う。

また、映像データ復号化部２３０は、最大符号化単位別の周波数逆変換のために、符号化深度別の符号化単位の変換単位のサイズ情報に基づいて、符号化単位ごとに、それぞれの変換単位によって、周波数逆変換を行う。

映像データ復号化部２３０は、深度別の分割情報を利用して、現在の最大符号化単位の符号化深度を決定する。若し、分割情報が現在の深度からそれ以上分割されないことを表していれば、現在の深度が符号化深度である。したがって、映像データ復号化部２３０は、現在の最大符号化単位の映像データに対して、現在の深度の符号化単位を、予測単位のパーティションタイプ、予測モード及び変換単位サイズ情報を利用して復号化する。

すなわち、符号化単位、予測単位及び最小単位のうち、所定のデータ単位に対して設定されている符号化情報を観察して、同一な分割情報を含む符号化情報を保有しているデータ単位が集まって、映像データ復号化部２３０によって、同一な符号化モードで復号化する一つのデータ単位であると見なされる。

一実施形態によるビデオ復号化装置２００は、符号化過程で最大符号化単位ごとに再帰的に符号化を行って、最小符号化誤差を発生させた符号化単位に係る情報を獲得して、現在のピクチャについての復号化に利用する。すなわち、最大符号化単位ごとに、最適符号化単位に決定されたツリー構造による符号化単位の符号化された映像データの復号化が可能になる。

したがって、高い解像度の映像、またはデータ量が多すぎる映像であるとしても、符号化端から伝送された最適符号化モードに係る情報を利用して、映像の特性に適応的に決定された符号化単位のサイズ及び符号化モードによって、効率的に映像データを復号化して復元する。

以下、図３ないし図１３を参照して、本発明の一実施形態によるツリー構造による符号化単位、予測単位及び変換単位の決定方式を詳細に説明する。

図３は、階層的な符号化単位の概念を示す。

符号化単位の例は、符号化単位のサイズが幅×高さで表現され、サイズ６４×６４の符号化単位から３２×３２，１６×１６，８×８を含む。サイズ６４×６４の符号化単位は、サイズ６４×６４，６４×３２，３２×６４，３２×３２のパーティションに分割され、サイズ３２×３２の符号化単位は、サイズ３２×３２，３２×１６，１６×３２，１６×１６のパーティションに分割され、サイズ１６×１６の符号化単位は、サイズ１６×１６，１６×８，８×１６，８×８のパーティションに分割され、サイズ８×８の符号化単位は、サイズ８×８，８×４，４×８，４×４のパーティションに分割される。

ビデオデータ３１０については、解像度が１９２０×１０８０、符号化単位の最大サイズが６４、最大深度が２に設定されている。ビデオデータ３２０については、解像度が１９２０×１０８０、符号化単位の最大サイズが６４、最大深度が３に設定されている。ビデオデータ３３０については、解像度が３５２×２８８、符号化単位の最大サイズが１６、最大深度が１に設定されている。図３に示した最大深度は、最大符号化単位から最小符号化単位までの総分割回数を表す。

解像度が高いか、またはデータ量が多い場合、符号化効率の向上だけでなく、映像特性を正確に反映するために、符号化サイズの最大サイズが相対的に大きいことが望ましい。したがって、ビデオデータ３３０よりも解像度が高いビデオデータ３１０，３２０は、符号化サイズの最大サイズが６４に選択される。

ビデオデータ３１０の最大深度は２であるので、ビデオデータ３１０の符号化単位３１５は、長軸サイズが６４である最大符号化単位から、２回分割されて深度が二階層深くなって、長軸サイズが３２、１６である符号化単位まで含む。一方、ビデオデータ３３０の最大深度は１であるので、ビデオデータ３３０の符号化単位３３５は、長軸サイズが１６である符号化単位から、１回分割されて深度が一階層深くなって、長軸サイズが８である符号化単位まで含む。

ビデオデータ３２０の最大深度は３であるので、ビデオデータ３２０の符号化単位３２５は、長軸サイズが６４である最大符号化単位から、３回分割されて深度が三階層深くなって、長軸サイズが３２、１６、８である符号化単位まで含む。深度が深くなるほど、詳細情報の表現能が向上する。

図４は、本発明の一実施形態による符号化単位に基づいた映像符号化部を示すブロック図である。

一実施形態による映像符号化部４００は、ビデオ符号化装置１００の符号化単位決定部１２０で、映像データを符号化するのに経る作業を含む。すなわち、イントラ予測部４１０は、現在のフレーム４０５のうち、イントラモードの符号化単位に対して、イントラ予測を行い、動き推定部４２０及び動き補償部４２５は、インターモードの現在のフレーム４０５及び参照フレーム４９５を利用して、インター推定及び動き補償を行う。

イントラ予測部４１０、動き推定部４２０及び動き補償部４２５から出力されたデータは、周波数変換部４３０及び量子化部４４０を経て、量子化された変換係数として出力される。量子化された変換係数は、逆量子化部４６０及び周波数逆変換部４７０を通じて、空間領域のデータに復元され、復元された空間領域のデータは、デブロッキング部４８０及びループフィルタリング部４９０を経て後処理されて、参照フレーム４９５として出力される。量子化された変換係数は、エントロピー符号化部４５０を経て、ビットストリーム４５５として出力される。

一実施形態によるビデオ符号化装置１００に適用されるためには、映像符号化部４００の構成要素であるイントラ予測部４１０、動き推定部４２０、動き補償部４２５、周波数変換部４３０、量子化部４４０、エントロピー符号化部４５０、逆量子化部４６０、周波数逆変換部４７０、デブロッキング部４８０及びループフィルタリング部４９０がいずれも、最大符号化単位ごとに、最大深度を考慮して、ツリー構造による符号化単位のうち、それぞれの符号化単位に基づいた作業を行わなければならない。

特に、イントラ予測部４１０、動き推定部４２０及び動き補償部４２５は、現在の最大符号化単位の最大サイズ及び最大深度を考慮して、ツリー構造による符号化単位のうち、それぞれの符号化単位のパーティション及び予測モードを決定し、周波数変換部４３０は、ツリー構造による符号化単位のうち、それぞれの符号化単位内の変換単位のサイズを決定しなければならない。

図５は、本発明の一実施形態による符号化単位に基づいた映像復号化部を示すブロック図である。

ビットストリーム５０５が、パージング部５１０を経て、復号化対象である符号化された映像データ、及び復号化のために必要な符号化に係る情報がパージングされる。符号化された映像データは、エントロピー復号化部５２０及び逆量子化部５３０を経て、逆量子化されたデータとして出力され、周波数逆変換部５４０を経て、空間領域の映像データが復元される。

空間領域の映像データに対して、イントラ予測部５５０は、イントラモードの符号化単位に対してイントラ予測を行い、動き補償部５６０は、参照フレーム５８５を共に利用して、インターモードの符号化単位に対して動き補償を行う。

イントラ予測部５５０及び動き補償部５６０を経た空間領域のデータは、デブロッキング部５７０及びループフィルタリング部５８０を経て後処理されて、復元フレーム５９５として出力される。また、デブロッキング部５７０及びループフィルタリング部５８０を経て後処理されたデータは、参照フレーム５８５として出力される。

ビデオ復号化装置２００の映像データ復号化部２３０で、映像データを復号化するために、一実施形態による映像復号化部５００のパージング部５１０以後のステップ別の作業が行われる。

一実施形態によるビデオ復号化装置２００に適用されるためには、映像復号化部５００の構成要素であるパージング部５１０、エントロピー復号化部５２０、逆量子化部５３０、周波数逆変換部５４０、イントラ予測部５５０、動き補償部５６０、デブロッキング部５７０及びループフィルタリング部５８０がいずれも、最大符号化単位ごとに、ツリー構造による符号化単位に基づいて、作業を行わなければならない。

特に、イントラ予測部５５０及び動き補償部５６０は、ツリー構造による符号化単位ごとに、パーティション及び予測モードを決定し、周波数逆変換部５４０は、符号化単位ごとに、変換単位のサイズを決定しなければならない。

図６は、本発明の一実施形態による深度別の符号化単位及びパーティションを示す。

一実施形態によるビデオ符号化装置１００、及び一実施形態によるビデオ復号化装置２００は、映像の特性を考慮するために、階層的な符号化単位を使用する。符号化単位の最大高さ及び幅、最大深度は、映像の特性によって適応的に決定されてもよく、ユーザの要求に応じて多様に設定されてもよい。既定の符号化単位の最大サイズによって、深度別の符号化単位のサイズが決定される。

一実施形態による符号化単位の階層構造６００は、符号化単位の最大高さ及び幅が６４であり、最大深度が４である場合を示している。一実施形態による符号化単位の階層構造６００の縦軸に沿って、深度が深くなるので、深度別の符号化単位の高さ及び幅がそれぞれ分割される。また、符号化単位の階層構造６００の横軸に沿って、それぞれの深度別の符号化単位の予測符号化の基本となる予測単位及びパーティションが示されている。

すなわち、符号化単位６１０は、符号化単位の階層構造６００で最大符号化単位であって、深度が０であり、符号化単位のサイズ、すなわち、高さ及び幅が６４×６４である。縦軸に沿って深度が深くなり、サイズ３２×３２である深度１の符号化単位６２０、サイズ１６×１６である深度２の符号化単位６３０、サイズ８×８である深度３の符号化単位６４０、及びサイズ４×４である深度４の符号化単位６５０が存在する。サイズ４×４である深度４の符号化単位６５０は、最小符号化単位である。

それぞれの深度別に横軸に沿って、符号化単位の予測単位及びパーティションが配列される。すなわち、深度０のサイズ６４×６４の符号化単位６１０が予測単位であれば、予測単位は、サイズ６４×６４の符号化単位６１０に含まれるサイズ６４×６４のパーティション６１０、サイズ６４×３２のパーティション６１２、サイズ３２×６４のパーティション６１４、及びサイズ３２×３２のパーティション６１６に分割される。

同様に、深度１のサイズ３２×３２の符号化単位６２０の予測単位は、サイズ３２×３２の符号化単位６２０に含まれるサイズ３２×３２のパーティション６２０、サイズ３２×１６のパーティション６２２、サイズ１６×３２のパーティション６２４、及びサイズ１６×１６のパーティション６２６に分割される。

同様に、深度２のサイズ１６×１６の符号化単位６３０の予測単位は、サイズ１６×１６の符号化単位６３０に含まれるサイズ１６×１６のパーティション６３０、サイズ１６×８のパーティション６３２、サイズ８×１６のパーティション６３４、及びサイズ８×８のパーティション６３６に分割される。

同様に、深度３のサイズ８×８の符号化単位６４０の予測単位は、サイズ８×８の符号化単位６４０に含まれるサイズ８×８のパーティション６４０、サイズ８×４のパーティション６４２、サイズ４×８のパーティション６４４、及びサイズ４×４のパーティション６４６に分割される。

最後に、深度４のサイズ４×４の符号化単位６５０は、最小符号化単位であり、かつ最下位深度の符号化単位であり、当該予測単位も、サイズ４×４のパーティション６５０のみに設定される。

一実施形態によるビデオ符号化装置１００の符号化単位決定部１２０は、最大符号化単位６１０の符号化深度を決定するために、最大符号化単位６１０に含まれるそれぞれの深度の符号化単位ごとに、符号化を行わなければならない。

同一な範囲及びサイズのデータを含むための深度別の符号化単位の個数は、深度が深くなるほど増加する。例えば、深度１の符号化単位が一つ含まれるデータに対して、深度２の符号化単位は四つ必要である。したがって、同一なデータの符号化結果を深度別に比較するために、一つの深度１の符号化単位、及び四つの深度２の符号化単位を利用して、それぞれ符号化されなければならない。

それぞれの深度別の符号化のためには、符号化単位の階層構造６００の横軸に沿って、深度別の符号化単位の予測単位ごとに符号化を行って、当該深度で最小符号化誤差である代表符号化誤差が選択される。また、符号化単位の階層構造６００の縦軸に沿って、深度が深くなり、それぞれの深度ごとに符号化を行って、深度別の代表符号化誤差を比較して、最小符号化誤差が検索される。最大符号化単位６１０のうち、最小符号化誤差が発生する深度及びパーティションが、最大符号化単位６１０の符号化深度及びパーティションタイプとして選択される。

図７は、本発明の一実施形態による符号化単位と変換単位の関係を示す。

一実施形態によるビデオ符号化装置１００、または一実施形態によるビデオ復号化装置２００は、最大符号化単位ごとに、最大符号化単位よりも小さいか、またはそれと同じサイズの符号化単位の映像を符号化または復号化する。符号化過程で周波数変換のための変換単位のサイズは、それぞれの符号化単位よりも大きくないデータ単位に基づいて選択される。

例えば、一実施形態によるビデオ符号化装置１００、または一実施形態によるビデオ復号化装置２００において、現在の符号化単位７１０が６４×６４サイズである時、３２×３２サイズの変換単位７２０を利用して、周波数変換が行われる。

また、６４×６４サイズの符号化単位７１０のデータを、６４×６４サイズ以下の３２×３２，１６×１６，８×８，４×４サイズの変換単位にそれぞれ周波数変換を行って符号化した後、原本との誤差が最も小さい変換単位が選択される。

図８は、本発明の一実施形態による深度別の符号化情報を示す。一実施形態によるビデオ符号化装置１００の出力部１３０は、符号化モードに係る情報として、それぞれの符号化深度の符号化単位ごとに、パーティションタイプに係る情報８００、予測モードに係る情報８１０、及び変換単位サイズに係る情報８２０を符号化して伝送する。

パーティションタイプに係る情報８００は、現在の符号化単位の予測符号化のためのデータ単位として、現在の符号化単位の予測単位が分割されたパーティションの形態に係る情報を表す。例えば、サイズ２Ｎ×２Ｎの現在の符号化単位ＣＵ＿０は、サイズ２Ｎ×２Ｎのパーティション８０２、サイズ２Ｎ×Ｎのパーティション８０４、サイズＮ×２Ｎのパーティション８０６、及びサイズＮ×Ｎのパーティション８０８のうちいずれか一つのタイプに分割されて利用される。この場合、現在の符号化単位のパーティションタイプに係る情報８００は、サイズ２Ｎ×２Ｎのパーティション８０２、サイズ２Ｎ×Ｎのパーティション８０４、サイズＮ×２Ｎのパーティション８０６、及びサイズＮ×Ｎのパーティション８０８のうち一つを表すように設定される。

予測モードに係る情報８１０は、それぞれのパーティションの予測モードを表す。例えば、予測モードに係る情報８１０を通じて、パーティションタイプに係る情報８００が表すパーティションが、イントラモード８１２、インターモード８１４及びスキップモード８１６のうち一つで予測符号化が行われるかが設定される。

また、変換単位サイズに係る情報８２０は、現在の符号化単位を、どの変換単位に基づいて、周波数変換を行うかを表す。例えば、変換単位は、第１イントラ変換単位サイズ８２２、第２イントラ変換単位サイズ８２４、第１インター変換単位サイズ８２６、及び第２イントラ変換単位サイズ８２８のうち一つである。

一実施形態によるビデオ復号化装置２００の映像データ及び符号化情報抽出部２２０は、それぞれの深度別の符号化単位ごとに、パーティションタイプに係る情報８００、予測モードに係る情報８１０、及び変換単位サイズに係る情報８２０を抽出して、復号化に利用可能である。

図９は、本発明の一実施形態による深度別の符号化単位を示す。

深度の変化を表すために、分割情報が利用される。分割情報は、現在の深度の符号化単位が、下位深度の符号化単位に分割されるか否かを表す。

深度０及びサイズ２Ｎ＿０×２Ｎ＿０の符号化単位９００の予測符号化のための予測単位９１０は、サイズ２Ｎ＿０×２Ｎ＿０のパーティションタイプ９１２、サイズ２Ｎ＿０×Ｎ＿０のパーティションタイプ９１４、サイズＮ＿０×２Ｎ＿０のパーティションタイプ９１６、及びサイズＮ＿０×Ｎ＿０のパーティションタイプ９１８を含む。予測単位が対称的な割合で分割されたパーティション９１２，９１４，９１６，９１８のみが例示されているが、前述したように、パーティションタイプは、それらに限定されず、非対称的なパーティション、任意の形態のパーティション、幾何学的な形態のパーティションなどを含む。

パーティションタイプごとに、一つのサイズ２Ｎ＿０×２Ｎ＿０のパーティション、二つのサイズ２Ｎ＿０×Ｎ＿０のパーティション、二つのサイズＮ＿０×２Ｎ＿０のパーティション、及び四つのサイズＮ＿０×Ｎ＿０のパーティションごとに、反復的に予測符号化が行わなければならない。サイズ２Ｎ＿０×２Ｎ＿０、サイズＮ＿０×２Ｎ＿０、サイズ２Ｎ＿０×Ｎ＿０、及びサイズＮ＿０×Ｎ＿０のパーティションについては、イントラモード及びインターモードで予測符号化が行われる。スキップモードは、サイズ２Ｎ＿０×２Ｎ＿０のパーティションに対してのみ、予測符号化が行われる。

サイズ２Ｎ＿０×２Ｎ＿０、２Ｎ＿０×Ｎ＿０及びＮ＿０×２Ｎ＿０のパーティションタイプ９１２，９１４，９１６のうち一つによる符号化誤差が最も小さければ、それ以上下位深度に分割する必要がない。

サイズＮ＿０×Ｎ＿０のパーティションタイプ９１８による符号化誤差が最も小さければ、深度０を１に変更して分割し（９２０）、深度２及びサイズＮ＿０×Ｎ＿０のパーティションタイプの符号化単位９３０に対して、反復的に符号化を行って、最小符号化誤差を検索する。

深度１及びサイズ２Ｎ＿１×２Ｎ＿１（＝Ｎ＿０×Ｎ＿０）の符号化単位９３０の予測符号化のための予測単位９４０は、サイズ２Ｎ＿１×２Ｎ＿１のパーティションタイプ９４２、サイズ２Ｎ＿１×Ｎ＿１のパーティションタイプ９４４、サイズＮ＿１×２Ｎ＿１のパーティションタイプ９４６、及びサイズＮ＿１×Ｎ＿１のパーティションタイプ９４８を含む。

また、サイズＮ＿１×Ｎ＿１のパーティションタイプ９４８による符号化誤差が最も小さければ、深度１を２に変更して分割し（９５０）、深度２及びサイズＮ＿２×Ｎ＿２の符号化単位９６０に対して、反復的に符号化を行って、最小符号化誤差を検索する。

最大深度がｄである場合、深度別の分割情報は、深度がｄ−１になるまで設定され、分割情報は、深度ｄ−２まで設定される。すなわち、深度ｄ−２から分割されて（９７０）、深度ｄ−１まで符号化が行われる場合、深度ｄ−１及びサイズ２Ｎ＿（ｄ−１）×２Ｎ＿（ｄ−１）の符号化単位９８０の予測符号化のための予測単位９９０は、サイズ２Ｎ＿（ｄ−１）×２Ｎ＿（ｄ−１）のパーティションタイプ９９２、サイズ２Ｎ＿（ｄ−１）×Ｎ＿（ｄ−１）のパーティションタイプ９９４、サイズＮ＿（ｄ−１）×２Ｎ＿（ｄ−１）のパーティションタイプ９９６、及びサイズＮ＿（ｄ−１）×Ｎ＿（ｄ−１）のパーティションタイプ９９８を含む。

パーティションタイプのうち、一つのサイズ２Ｎ＿（ｄ−１）×２Ｎ＿（ｄ−１）のパーティション、二つのサイズ２Ｎ＿（ｄ−１）×Ｎ＿（ｄ−１）のパーティション、二つのサイズＮ＿（ｄ−１）×２Ｎ＿（ｄ−１）のパーティション、及び四つのサイズＮ＿（ｄ−１）×Ｎ＿（ｄ−１）のパーティションごとに、反復的に予測符号化を通じた符号化が行われて、最小符号化誤差が発生するパーティションタイプが検索される。

サイズＮ＿（ｄ−１）×Ｎ＿（ｄ−１）のパーティションタイプ９９８による符号化誤差が最も小さいとしても、最大深度がｄであるので、深度ｄ−１の符号化単位ＣＵ＿（ｄ−１）は、それ以上下位深度への分割過程を経ず、現在の最大符号化単位９００についての符号化深度が、深度ｄ−１として決定され、パーティションタイプは、Ｎ＿（ｄ−１）×Ｎ＿（ｄ−１）として決定される。また、最大深度がｄであるので、深度ｄ−１の符号化単位９５２に対して、分割情報は設定されていない。

データ単位９９９は、現在の最大符号化単位についての‘最小単位’であると呼ばれる。一実施形態による最小単位は、最下位符号化深度である最小符号化単位が４分割されたサイズの正方形のデータ単位である。かかる反復的な符号化過程を通じて、一実施形態によるビデオ符号化装置１００は、符号化単位９００の深度別の符号化誤差を比較して、最小符号化誤差が発生する深度を選択して、符号化深度を決定し、当該パーティションタイプ及び予測モードが、符号化深度の符号化モードとして設定される。

このように、深度０，１，…，ｄ−１，ｄの全ての深度別の最小符号化誤差を比較して、誤差が最も小さい深度が選択されて、符号化深度として決定される。符号化深度、予測単位のパーティションタイプ及び予測モードは、符号化モードに係る情報として符号化されて伝送される。また、深度０から符号化深度に達するまで、符号化単位が分割されなければならないので、符号化深度の分割情報のみが‘０’に設定され、符号化深度を除いた深度別の分割情報は、‘１’に設定されなければならない。

一実施形態によるビデオ復号化装置２００の映像データ及び符号化情報抽出部２２０は、符号化単位９００についての符号化深度及び予測単位に係る情報を抽出して、符号化単位９１２を復号化するのに利用する。一実施形態によるビデオ復号化装置２００は、深度別の分割情報を利用して、分割情報が‘０’である深度を符号化深度として把握し、当該深度についての符号化モードに係る情報を利用して復号化する。

図１０、図１１及び図１２は、本発明の一実施形態による符号化単位、予測単位及び周波数変換単位の関係を示す。

符号化単位１０１０は、最大符号化単位に対して、一実施形態によるビデオ符号化装置１００が決定した符号化深度別の符号化単位である。予測単位１０６０は、符号化単位１０１０のうち、それぞれの符号化深度別の符号化単位の予測単位のパーティションであり、変換単位１０７０は、それぞれの符号化深度別の符号化単位の変換単位である。

深度別の符号化単位１０１０は、最大符号化単位の深度が０であるとすれば、符号化単位１０１２，１０５４の深度が１、符号化単位１０１４，１０１６，１０１８，１０２８，１０５０，１０５２の深度が２、符号化単位１０２０，１０２２，１０２４，１０２６，１０３０，１０３２，１０４８の深度が３、符号化単位１０４０，１０４２，１０４４，１０４６の深度が４である。

予測単位１０６０のうち、一部のパーティション１０１４，１０１６，１０２２，１０３２，１０４８，１０５０，１０５２，１０５４は、符号化単位が分割された形態である。すなわち、パーティション１０１４，１０２２，１０５０，１０５４は、２Ｎ×Ｎのパーティションタイプであり、パーティション１０１６，１０４８，１０５２は、Ｎ×２Ｎのパーティションタイプであり、パーティション１０３２は、Ｎ×Ｎのパーティションタイプである。深度別の符号化単位１０１０の予測単位及びパーティションは、それぞれの符号化単位よりも小さいか、またはそれと同じである。

変換単位１０７０のうち、一部の符号化単位１０５２の映像データについては、符号化単位に比べて小さいサイズのデータ単位で、周波数変換または周波数逆変換が行われる。また、変換単位１０１４，１０１６，１０２２，１０３２，１０４８，１０５０，１０５２，１０５４は、予測単位１０６０のうち、当該予測単位及びパーティションと比較すれば、異なるサイズまたは形態のデータ単位である。すなわち、一実施形態によるビデオ符号化装置１００、及び一実施形態によるビデオ復号化装置２００は、同一な符号化単位についてのイントラ予測／動き推定／動き補償作業、及び周波数変換／逆変換作業であるとしても、それぞれ別途のデータ単位に基づいて行う。

これによって、最大符号化単位ごとに、領域別に階層的な構造の符号化単位ごとに、再帰的に符号化が行われて、最適符号化単位が決定されることによって、再帰的なツリー構造による符号化単位が構成される。符号化情報は、符号化単位に係る分割情報、パーティションタイプ情報、予測モード情報、及び変換単位サイズ情報を含む。以下、表１は、一実施形態によるビデオ符号化装置１００、及び一実施形態によるビデオ復号化装置２００で設定可能な一例を表す。

一実施形態によるビデオ符号化装置１００の出力部１３０は、ツリー構造による符号化単位についての符号化情報を出力し、一実施形態によるビデオ復号化装置２００の符号化情報抽出部２２０は、受信されたビットストリームから、ツリー構造による符号化単位についての符号化情報を抽出する。

分割情報は、現在の符号化単位が下位深度の符号化単位に分割されるか否かを表す。現在の深度ｄの分割情報が０であれば、現在の符号化単位が下位符号化単位にそれ以上分割されない深度が符号化深度であるので、符号化深度に対して、パーティションタイプ情報、予測モード及び変換単位サイズ情報が定義される。分割情報によってさらに分割されなければならない場合には、分割された四つの下位深度の符号化単位ごとに独立して符号化が行わなければならない。

予測モードは、イントラモード、インターモード及びスキップモードのうち一つで表す。イントラモード及びインターモードは、全てのパーティションタイプで定義され、スキップモードは、パーティションタイプ２Ｎ×２Ｎのみで定義される。

パーティションタイプ情報は、予測単位の高さまたは幅が対称的な割合で分割された対称的なパーティションタイプ２Ｎ×２Ｎ、２Ｎ×Ｎ、Ｎ×２Ｎ、Ｎ×Ｎ、及び非対称的な割合で分割された非対称的なパーティションタイプ２Ｎ×ｎＵ、２Ｎ×ｎＤ、ｎＬ×２Ｎ、ｎＲ×２Ｎを表す。非対称的なパーティションタイプ２Ｎ×ｎＵ及び２Ｎ×ｎＤは、それぞれ高さが１：３及び３：１に分割された形態であり、非対称的なパーティションタイプｎＬ×２Ｎ及びｎＲ×２Ｎは、それぞれ幅が１：３及び３：１に分割された形態である。

変換単位サイズは、イントラモードで二種類のサイズに、インターモードで二種類のサイズに設定される。すなわち、変換単位分割情報が０であれば、変換単位サイズが、現在の符号化単位のサイズ２Ｎ×２Ｎに設定される。変換単位分割情報が１であれば、現在の符号化単位が分割されたサイズの変換単位が設定される。また、サイズ２Ｎ×２Ｎである現在の符号化単位についてのパーティションタイプが、対称的なパーティションタイプであれば、変換単位サイズは、Ｎ×Ｎ、非対称的なパーティションタイプであれば、変換単位サイズは、Ｎ／２×Ｎ／２に設定される。

一実施形態によるツリー構造による符号化単位の符号化情報は、符号化深度の符号化単位、予測単位及び最小単位のうち少なくとも一つに対して割り当てられる。符号化深度の符号化単位は、同一な符号化情報を保有している予測単位及び最小単位を一つ以上含む。

したがって、隣接したデータ単位同士それぞれ保有している符号化情報を確認すれば、同一な符号化深度の符号化単位に含まれるか否かが確認される。また、データ単位が保有している符号化情報を利用すれば、当該符号化深度の符号化単位を確認できるので、最大符号化単位内の符号化深度の分布が類推される。

したがって、その場合、現在の符号化単位が、周辺データ単位を参照して予測する場合、現在の符号化単位に隣接する深度別の符号化単位内のデータ単位の符号化情報が直接参照されて利用される。

他の実施形態として、現在の符号化単位が、周辺符号化単位を参照して予測符号化が行われる場合、隣接する深度別の符号化単位の符号化情報を利用して、深度別の符号化単位内で、現在の符号化単位に隣接するデータが検索されることによって、周辺符号化単位が参照されることも可能である。

図１３は、表１の符号化モード情報による符号化単位、予測単位及び変換単位の関係を示す。

最大符号化単位１３００は、符号化深度の符号化単位１３０２，１３０４，１３０６，１３１２，１３１４，１３１６，１３１８を含む。そのうち一つの符号化単位１３１８は、符号化深度の符号化単位であるので、分割情報が０に設定される。サイズ２Ｎ×２Ｎの符号化単位１３１８のパーティションタイプ情報は、パーティションタイプ２Ｎ×２Ｎ１３２２、２Ｎ×Ｎ１３２４、Ｎ×２Ｎ１３２６、Ｎ×Ｎ１３２８、２Ｎ×ｎＵ１３３２、２Ｎ×ｎＤ１３３４、ｎＬ×２Ｎ１３３６及びｎＲ×２Ｎ１３３８のうち一つに設定される。

パーティションタイプ情報が、対称的なパーティションタイプ２Ｎ×２Ｎ１３２２、２Ｎ×Ｎ１３２４、Ｎ×２Ｎ１３２６及びＮ×Ｎ１３２８のうち一つに設定されている場合、変換単位分割情報(TU size flag)が０であれば、サイズ２Ｎ×２Ｎの変換単位１３４２が設定され、変換単位分割情報が１であれば、サイズＮ×Ｎの変換単位１３４４が設定される。

パーティションタイプ情報が、非対称的なパーティションタイプ２Ｎ×ｎＵ１３３２、２Ｎ×ｎＤ１３３４、ｎＬ×２Ｎ１３３６及びｎＲ×２Ｎ１３３８のうち一つに設定されている場合、変換単位分割情報(TU size flag)が０であれば、サイズ２Ｎ×２Ｎの変換単位１３５２が設定され、変換単位分割情報が１であれば、サイズＮ／２×Ｎ／２の変換単位１３５４が設定される。

以下、図４の本発明の一実施形態による映像符号化装置４００のエントロピー符号化部４５０、及び図５の映像復号化装置５００のエントロピー復号化部５２０で行われるエントロピー符号化及び復号化の過程について具体的に説明する。

前述したように、本発明の一実施形態による映像符号化装置４００は、最大符号化単位を階層的に分割した符号化単位を利用して符号化を行う。エントロピー符号化部４５０は、各符号化単位に対して生成された符号化情報、例えば、量子化された変換係数、予測単位の予測モード、量子化パラメータ、動きベクトルなどの構文要素(Syntax Element:SE)をエントロピー符号化する。具体的には、エントロピー符号化部４５０は、構文要素に対して、コンテキストに基づいた二進算術符号化(Context-Based Binary Arithmetic Coding:CABAC)を行う。

図１４は、本発明の一実施形態によるエントロピー符号化装置の構成を示すブロック図である。図１４を参照すれば、一実施形態によるエントロピー符号化装置１４００は、二進化部１４１０、コンテキストモデラー１４２０、及び二進算術符号化部１４３０を備える。また、二進算術符号化部１４３０は、レギュラーコーディング部１４３２と、バイパスコーディング部１４３４とを備える。

エントロピー符号化装置１４００に入力される構文要素は、二進値ではないことがあるので、構文要素が二進値ではない場合、二進化部１４１０は、構文要素を二進化して、０または１の二進値で構成されたビン（Ｂｉｎ）ストリングを出力する。ビンは、０または１で構成されたストリームの各ビットを表すものであって、各ビンは、ＣＡＢＡＣを通じて符号化される。構文要素が０と１の頻度の同一なデータであれば、確率値を利用しないバイパスコーディング部１４３４に出力されて符号化される。

コンテキストモデラー１４２０は、レギュラーコーディング部１４３２に、現在の符号化シンボルについての確率モデルを提供する。具体的には、コンテキストモデラー１４２０は、以前に符号化されたシンボルに基づいて、所定の二進値の確率を決定し、現在の符号化シンボルの二進値を符号化するための二進値の発生確率を、二進算術符号化部１４３０に出力する。従来のＨ．２６４／ＡＶＣなどのコンテキストモデラーは、ＭＰＳ(Most Probable Symbol)の発生確率と、０及び１のうちどの二進値がＭＰＳに該当するかについての情報を表すコンテキストインデックスｃｔｘＩｄｘとを通じて、符号化シンボルについての確率モデルを提供した。これに対し、本発明の一実施形態によるコンテキストモデラー１４２０は、ＭＰＳとＬＰＳ(Least Probable Symbol)とを区別せずに、予め決定された所定の二進値、例えば、“１”の発生確率を表すＰ（１）を、以前に符号化されたシンボルに基づいて決定し、決定された所定の二進値の確率を二進算術符号化部１４３０に提供する。

また、コンテキストモデラー１４２０は、現在の符号化シンボルの二進値によって、所定の二進値の確率を、複数個のスケーリングファクタを利用してアップデートする。具体的な所定の二進値の確率をアップデートする過程については後述する。

レギュラーコーディング部１４３２は、コンテキストモデラー１４２０から提供された所定の二進値の確率、及び現在の符号化シンボルが有する二進値に基づいて、二進算術符号化を行う。すなわち、レギュラーコーディング部１４３２は、コンテキストモデラー１４２０から提供された所定の二進値の確率に基づいて、“１”の発生確率Ｐ（１）と、“０”の発生確率Ｐ（０）とを決定し、決定された０及び１の発生確率Ｐ（０）及びＰ（１）に基づいて、現在の符号化シンボルの二進値によって、確率区間を表すＲａｎｇｅの区間を変更することによって、二進算術符号化を行う。

図１５は、本発明に係る技術分野で行われる確率モデルのアップデート過程を簡略に示す図面である。図１５を参照すれば、従来のＨ．２６４／ＡＶＣなどでは、確率関数での確率状態インデックスｐＳｔａｔｅＩｄｘが決定されれば、符号化シンボルの値がＭＰＳとして指定された値であれば、現在の確率状態ｓｔａｔｅ σから、ＬＰＳ確率が低くなる前方向状態ｓｔａｔｅ σ＋１に、確率状態が転移されるように、確率状態インデックスｐＳｔａｔｅＩｄｘをアップデートし、符号化シンボルの値がＭＰＳではない場合、すなわち、ＬＰＳとして指定された値であれば、現在の確率状態ｓｔａｔｅ σから、ＬＰＳ確率が高くなる後方向状態ｓｔａｔｅ σ−ｋ（ｋ＞０）に、確率状態が転移されるように、確率状態インデックスｐＳｔａｔｅＩｄｘをアップデートする。例えば、現在の確率状態インデックスｐＳｔａｔｅＩｄｘがＣであるとする時、現在の符号化シンボルの値がＬＰＳとして指定された値であれば、現在の符号化シンボルを符号化した後、確率状態インデックスｐＳｔａｔｅＩｄｘは、Ａにアップデートされる。次の符号化シンボルの値がＭＰＳとして指定された値であれば、確率状態インデックスｐＳｔａｔｅＩｄｘは、ＡからＢに再びアップデートされる。

従来の確率関数は、図示したように、指数乗の形態を有する。かかる指数乗の形態の確率関数において、０に近いＬＰＳの確率分布は非常に稠密であり、１／２に近いＬＰＳの確率分布は非常に希薄である。したがって、かかる指数乗の形態の確率関数に基づいた場合、０と１の二進値の発生確率が類似した場合、すなわち、０と１の二進値の発生確率が１／２に近い場合には、確率が希薄に分布されるので、確率の予測エラーが増加する。また、指数乗の形態の確率関数を利用する場合、０に近い確率値を細密に表現しなければならないので、かかる確率値を表すためのビット深さが増加する。したがって、指数乗の形態の確率関数を有する確率モデルを保存するためのルックアップテーブルのサイズが増大する。また、従来の技術によれば、確率のアップデート時や確率区間の分割時、稠密な確率値を利用する場合、乗算演算量が増加して、ハードウェア的に負担となる。

したがって、本発明の一実施形態によるコンテキストモデラー１４２０は、均一な分布を有する確率関数に基づいて、０と１の二進値の発生確率を決定する。また、本発明の一実施形態によるコンテキストモデラー１４２０は、複数個のスケーリングパラメータを利用して、所定の二進値の確率をアップデートする。

以下、コンテキストモデラー１４２０で行われる確率モデルのアップデート過程について具体的に説明する。

ＣＡＢＡＣにおいて、確率アップデートは、下記の数式（１）によって行われる。

数式（１）において、Ｐ＿ｎｅｗは、アップデートされたＬＰＳの確率であり、Ｐ＿ｏｌｄは、現在の符号化シンボルの算術符号化に利用されたＬＰＳの確率であり、ａ（ａ＜１である実数）は、スケーリングファクタである。以前に符号化されたシンボルの個数がＮ（Ｎは、整数）であるとする時、ａ＝１／Ｎである。ｙは、現在の符号化シンボルがＭＰＳの値に該当する二進値を有する場合、０の値を有し、現在の符号化シンボルがＬＰＳの値に該当する二進値を有する場合、１の値を有する。

前記数式（１）に基づいた確率のアップデート過程において、重要なパラメータは、スケーリングファクタａである。スケーリングファクタａの値によって、全体のＣＡＢＡＣ符号化過程がどれほど敏感に反応し、ノイズやエラーに反応しない安定性如何が決定される。適切なスケーリングファクタａの値を決定する過程は、困難かつ消耗的な過程である。

したがって、本発明の一実施形態によるコンテキストモデラー１４２０は、確率のアップデート時に複数個のスケーリングファクタａ_ｉを利用して、複数個のアップデートされた確率を生成し、複数個のアップデートされた確率の加重平均を利用して、最終的にアップデートされた確率を決定する。

具体的には、本発明の一実施形態によるコンテキストモデラー１４２０は、複数個のスケーリングファクタａ_ｉを利用した下記の数式（２）によって、アップデートされた複数個の確率を生成する。

数式（２）において、Ｐ_ｉ＿ｎｅｗは、スケーリングファクタａ_ｉを利用してアップデートされた所定の二進値の確率であり、Ｐ＿ｏｌｄは、現在の符号化シンボルの算術符号化に利用された所定の二進値の確率である。数式（２）において、Ｐ_ｉ＿ｎｅｗやＰ＿ｏｌｄは、予め設定された所定の二進値、すなわち、０または１の発生確率を表す。すなわち、本発明で利用される確率は、ＭＰＳとＬＰＳではない特定の二進値、例えば、“１”の発生確率を表す。以下の説明では、所定の二進値が１である場合、すなわち、Ｐ_ｉ＿ｎｅｗやＰ＿ｏｌｄが“１”の発生確率を表す場合を仮定する。ただし、それに限定されず、Ｐ_ｉ＿ｎｅｗやＰ＿ｏｌｄが“０”の発生確率を表すものと設定された場合にも、本発明の実施形態による確率アップデート過程が同様に適用される。

コンテキストモデラー１４２０は、数式（２）に基づいて、複数個の確率Ｐ_ｉ＿ｎｅｗが獲得されれば、複数個の確率Ｐ_ｉ＿ｎｅｗの加重平均値を、下記の数式（３）のように計算する。

β_ｉは、複数個の確率Ｐ_ｉ＿ｎｅｗに乗じられる加重値であって、全体の確率Ｐ_ｉ＿ｎｅｗの個数を考慮して、加重平均値が計算されるように設定される。

本発明の一実施形態によれば、確率のアップデート時に乗算過程を省略するために、確率として２の指数乗を利用した値を利用する。

確率ｐ_ｉが０から２＾ｋ（ｋは、整数）までの整数Ａ_ｉを利用して、次の数式；ｐ_ｉ＝Ａ_ｉ／（２＾ｋ）の形態の値を有すると仮定する。また、複数個のスケーリングファクタａ_ｉも、２の指数乗を利用して、次の数式；ａ_ｉ＝１／（２＾Ｍ_ｉ）（Ｍ_ｉは、整数）の形態の値を有すると仮定する。その場合、前記数式（２）は、下記の数式（４）のように、シフト演算を利用した形態に変更される。

前述したように、本発明で利用される確率は、所定の二進値の確率であって、例えば、Ｐ＿ｏｌｄは、最後に符号化されたシンボルが１の値を有する確率を意味し、Ｐ_ｉ＿ｎｅｗは、次の符号化シンボルが１の値を有する確率であって、Ｐ＿ｏｌｄをアップデートした確率を意味する。このように、所定の二進値が“１”である場合、数式（４）において、最後に符号化されたシンボルが“１”であれば、Ｙは、２＾ｋ（ｋは、整数）の値を有し、最後に符号化されたシンボルが“０”であれば、Ｙは、０の値を有する。演算“＞＞Ｍ_ｉ”は、Ｍ_ｉビットほど右側シフトを行う演算であって、Ｍ_ｉの値は、｛３，４，５，６，７，８｝のうち一つの値を有することが望ましい。前述したように、スケーリングファクタａ_ｉは、ａ_ｉ＝１／（２＾Ｍ_ｉ）であるので、Ｍ_ｉの値として｛３，４，５，６，７，８｝のうち一つを利用する場合、ａ_ｉは、｛８，１６，３２，６４，１２８，２５６｝である。また、以前に符号化されたシンボルの個数がＮ_ｉ（Ｎ_ｉは、整数）であるとする時、ａ_ｉ＝１／Ｎ_ｉに設定される。したがって、Ｎ_ｉ＝１／ａ_ｉ∈｛８，１６，３２，６４，１２８，２５６｝である。Ｎ_ｉは、ウィンドウサイズとも呼ばれる。

一例として、コンテキストモデラー１４２０は、Ｎ０＝１６（すなわち、ａ０＝１／１６）、Ｎ１＝１２８（すなわち、ａ１＝１／１２８）である場合、次の数式；Ｐ０′＝（Ｙ＞＞４）＋Ｐ０−（Ｐ０＞＞４）；Ｐ１′＝（Ｙ＞＞７）＋Ｐ１−（Ｐ１＞＞７）によって、アップデートされたＰ０′及びＰ１′を獲得し、次の数式；Ｐ＝（Ｐ０′＋Ｐ１′）＞＞１によって、最終的にアップデートされた確率Ｐを獲得する。

本発明の一実施形態によるＣＡＢＡＣで利用される確率は、前述したように、ＭＰＳとＬＰＳとを区別せずに、所定の二進値、すなわち、“１”の確率を表す。従来のＬＰＳの確率が１／２を超えることができないのに対し、本発明の実施形態で利用される確率は、所定の二進値“１”の確率を表すので、確率が１／２を超える。

一方、ＣＡＢＡＣ符号化過程では、各スライス単位でエントロピーリセットが行われる。エントロピーリセットは、二進算術符号化が現在の確率値を廃棄し、予め設定された確率値に基づいて、新たにＣＡＢＡＣ符号化を行うことを意味する。かかるリセット過程後に行われる確率アップデート過程において、初期値として設定される確率値は、最適の値ではなく、数回のアップデート過程を経るほど、一定の確率値に収斂する。

エントロピーリセット後に初期化される確率Ｐ_ｉｎｉｔは、現在の量子化パラメータＱＰ、及び現在の量子化パラメータと、参照量子化パラメータとの差値ΔＱＰを利用して、次の数式；Ｐ_ｉｎｉｔ＝α＋β＊ＱＰ＋γ＊ΔＱＰによって設定される。α，β，γは、コンテキストモデルと、現在のスライス類型とによって予め設定された加重値である。また、前述したＭ_ｉも、スライス類型と、コンテキストモデルとに基づいて、エントロピーリセットの初期化過程ごとに変更される。

図１６は、本発明の一実施形態によって、複数個のスケーリングファクタを利用した確率アップデート過程と、一つのスケーリングファクタを利用した確率アップデート過程とを比較するための図面である。

図１６を参照すれば、一つのスケーリングファクタを利用して、確率をアップデートする場合１６１０は、確率アップデートが行われるほど、確率が速く変化して、適正値Ｐ_{ｏｐｔｉｍａｌ}に速く収斂するが、アップデートが反復されるほど、変動(fluctuation)が発生しやすい。数式（３）、（４）などに基づいた本発明の実施形態によって、複数個のスケーリングファクタを利用して、確率をアップデートする場合１６２０は、確率が速く変化しないが、アップデートされた確率が適正値Ｐ_{ｏｐｔｉｍａｌ}近辺に収斂した場合、変動が少なく発生して、エラーやノイズなどに敏感に反応せずに安定して動作する。

したがって、コンテキストモデラー１４２０は、かかる一つのスケーリングファクタを利用した場合と、複数個のスケーリングファクタを利用した確率アップデート過程とを考慮して、エントロピーリセット後に所定の回数(threshold)の間には、一つのスケーリングファクタを利用して、確率アップデートを行い、所定の回数以後には、システム安定のために、複数個のスケーリングファクタを利用した確率アップデート過程を行う。

図１７は、本発明の一実施形態による所定の二進値の確率アップデート過程を示すフローチャートである。図１７を参照すれば、ステップ１７１０において、コンテキストモデラー１４２０は、エントロピーリセット後にカウンター及び確率を初期化する。ステップ１７２０において、コンテキストモデラー１４２０は、初期に設定された確率を利用して、入力された符号化シンボルを二進算術符号化する。

ステップ１７３０において、コンテキストモデラー１４２０は、一つのスケーリングファクタを利用して、確率をアップデートする。ステップ１７４０において、コンテキストモデラー１４２０は、確率がアップデートされる度に、カウンターを一つずつ増加させる。ステップ１７５０において、コンテキストモデラー１４２０は、カウンターが所定の閾値に達したか否かを判断する。かかる所定の閾値は、ウィンドウサイズとして定義されもする。ステップ１７６０において、コンテキストモデラー１４２０は、最後にアップデートされた確率を利用して、入力された符号化シンボルを二進算術符号化する。ステップ１７７０において、コンテキストモデラー１４２０は、複数個のスケーリングファクタを利用して、所定の二進値の確率をアップデートする。以後のＣＡＢＡＣ過程において、コンテキストモデラー１４２０は、複数個のスケーリングファクタを利用して、確率をアップデートする。

一方、二進算術符号化過程での確率区間の分割は、直接的な計算またはルックアップテーブルを利用して行われる。確率がＫビットとして表現される場合、確率区間は、次の数式；Ｌ＝（ｒａｎｇｅ＊Ｐ＋２＾（ｋ−１））＞＞ｋによって、確率区間のうち、現在の符号化シンボルによる確率区間Ｌが獲得される。

図１８は、本発明の一実施形態による二進算術符号化を行う過程を示す図面である。

コンテキストモデラー１４２０は、所定の二進値、例えば、“１”の発生確率Ｐ（１）を二進算術符号化部１４３０に提供し、二進算術符号化部１４３０は、入力符号化シンボルの確率を考慮して、確率区間を分割して、二進算術符号化を行う。図１８において、“１”の発生確率Ｐ（１）＝０．８及びＰ（０）＝０．２であると仮定する。説明のために、Ｐ（１）及びＰ（０）が固定された場合を説明するが、前述したように、Ｐ（１）及びＰ（０）の値は、符号化シンボルを符号化する度にアップデートされてもよい。二進算術符号化部１４３０は、先に入力されたシンボルＳ１が１の値を有するので、（０，１）の区間中で“１”の値の確率区間である（０，０．８）を選択し、次に入力されたシンボルＳ２が０の値を有するので、（０，０．８）の区間中で上側の０．２ほど該当する確率区間である（０．６４，０．８）を選択し、最後に入力されたシンボルＳ３が１の値を有するので、（０．６４，０．８）の０．８ほど該当する区間である（０．６４，０．７６８）を最終的に決定した後、かかる区間（０．６４，０．７６８）を表す代表値として０．７５を選択し、０．７５に該当する二進値０．１１の小数点以下の“１１”を、最終的なビットストリームとして出力する。すなわち、入力された符号化シンボル“１０１”は、“１１”に符号化される。

図１９は、本発明の一実施形態によるエントロピー符号化方法を示すフローチャートである。図１９を参照すれば、ステップ１９１０において、二進算術符号化部１４３０は、現在の符号化シンボルよりも先に符号化された以前の符号化シンボルに基づいて決定された所定の二進値の確率を利用して、前記現在の符号化シンボルの二進値を算術符号化する。

ステップ１９２０において、コンテキストモデラー１４２０は、現在の符号化シンボルの二進値によって、所定の二進値の確率を、複数個のスケーリングファクタを利用してアップデートする。前述したように、コンテキストモデラー１４２０は、複数個のスケーリングファクタを利用して生成された複数個の確率の加重平均値を計算することによって、次の符号化シンボルに適用される確率を獲得する。また、コンテキストモデラー１４２０は、エントロピーリセット過程後に確率が初期化された状態で、所定の閾値までのアップデート過程では、一つのスケーリングファクタを利用して、確率が速く適正な値に収斂し、確率のアップデート回数が所定の閾値を超える後には、複数個のスケーリングファクタを利用して、確率をアップデートすることによって、全体の確率アップデート過程が適正な値に迅速かつ安定して収斂する。

図２０は、本発明の一実施形態によるエントロピー復号化装置の構成を示すブロック図である。図２０を参照すれば、エントロピー復号化装置２０００は、コンテキストモデラー２０１０、レギュラーデコーディング部２０２０、バイパスデコーディング部２０３０、及び逆二進化部２０４０を備える。エントロピー復号化装置２０００は、前述したエントロピー符号化装置１４００で行われるエントロピー符号化過程の逆過程を行う。

バイパスコーディングにより符号化されたシンボルは、バイパスデコーディング部２０３０に出力されて復号化され、レギュラーコーディングにより符号化されたシンボルは、レギュラーデコーディング部２０２０によりデコーディングされる。レギュラーデコーディング部２０２０は、コンテキストモデラー２０１０から提供される現在の符号化シンボルよりも先に復号化された以前の符号化シンボルに基づいて決定された所定の二進値の確率を利用して、前記現在の符号化シンボルの二進値を算術復号化する。前述したように、二進算術符号化結果によって符号化されたシンボルとして、所定の確率区間の代表値を表す二進値が伝送されるので、レギュラーデコーディング部２０２０は、０及び１の発生確率を利用して、符号化されたシンボルを復号化する。

コンテキストモデラー２０１０は、復号化される符号化シンボルの二進値によって、所定の二進値の確率を、複数個のスケーリングファクタを利用してアップデートする。前述したように、コンテキストモデラー１４２０は、ＭＰＳとＬＰＳとを区別せずに、予め決定された所定の二進値、例えば、“１”の発生確率を表すＰ（１）を、以前に符号化されたシンボルに基づいて決定し、決定された所定の二進値の確率を、レギュラーデコーディング部２０２０に提供する。逆二進化部２０４０は、レギュラーデコーディング部２０２０またはバイパスデコーディング部２０３０で復元されたビンストリングを、再び構文要素に復元する。

図２１は、本発明の一実施形態によるエントロピー復号化方法を示すフローチャートである。図２１を参照すれば、ステップ２１１０において、レギュラーデコーディング部２０２０は、現在の符号化シンボルよりも先に復号化された以前の符号化シンボルに基づいて決定された所定の二進値の確率を利用して、現在の符号化シンボルの二進値を算術復号化する。

ステップ２１２０において、コンテキストモデラー２０１０は、現在の符号化シンボルの二進値によって、所定の二進値の確率を、複数個のスケーリングファクタを利用してアップデートする。コンテキストモデラー２０１０は、複数個のスケーリングファクタを利用して生成された複数個の確率の加重平均値を計算することによって、次の符号化シンボルに適用される確率を獲得する。また、コンテキストモデラー２０１０は、エントロピーリセット過程後に確率が初期化された状態で、所定の閾値までのアップデート過程では、一つのスケーリングファクタを利用して、確率が速く適正な値に収斂し、確率のアップデート回数が所定の閾値を超えた後には、複数個のスケーリングファクタを利用して、確率をアップデートする。

本発明は、また、コンピュータで読み取り可能な記録媒体に、コンピュータで読み取り可能なコードとして具現することが可能である。コンピュータで読み取り可能な記録媒体は、コンピュータシステムにより読み取られるデータが保存される全ての種類の記録装置を含む。コンピュータで読み取り可能な記録媒体の例としては、ＲＯＭ、ＲＡＭ、ＣＤ−ＲＯＭ、磁気テープ、フロッピー（登録商標）ディスク、光データ保存装置などが含まれる。また、コンピュータで読み取り可能な記録媒体は、ネットワークに連結されたコンピュータシステムに分散され、分散方式によって、コンピュータで読み取り可能なコードに保存されて実行される。

以上、本発明について、その望ましい実施形態を中心に述べた。当業者は、本発明が、本発明の本質的な特性から逸脱しない範囲で、変形された形態で具現可能であるということを理解できるであろう。本発明の範囲は、前述した説明ではなく、特許請求の範囲に表れており、それと同等な範囲内にある全ての相違点は、本発明に含まれたものと解釈されなければならない。

Claims

映像のエントロピー符号化方法において、
現在の符号化シンボルよりも先に符号化された以前の符号化シンボルに基づいて決定された所定の二進値の確率を利用して、前記現在の符号化シンボルの二進値を算術符号化するステップと、
前記現在の符号化シンボルの二進値によって、前記所定の二進値の確率を、複数個のスケーリングファクタを利用してアップデートするステップと、を含むことを特徴とする映像のエントロピー符号化方法。
前記アップデートするステップは、
前記複数個のスケーリングファクタをａ_ｉ（ａ_ｉは、１よりも小さい正の実数、ｉは、１以上の整数）、前記以前の符号化シンボルの情報に基づいて決定された二進値の確率をＰ＿ｏｌｄ、前記スケーリングファクタａ_ｉを利用してアップデートされた二進値の確率をＰ_ｉ＿ｎｅｗとし、ｙは、前記現在の符号化シンボルが、前記所定の二進値を有する場合、０の値を有し、前記現在の符号化シンボルが、前記所定の二進値を有する場合、１の値を有すると仮定する時、次の数式；Ｐ_ｉ＿ｎｅｗ＝ａ_ｉ＊ｙ＋（１−ａ_ｉ）＊Ｐ＿ｏｌｄによって獲得された複数個のアップデートされた二進値の確率Ｐ_ｉ＿ｎｅｗの加重平均値を利用して、前記所定の二進値の確率をアップデートすることを特徴とする請求項１に記載の映像のエントロピー符号化方法。
前記スケーリングファクタａ_ｉは、２の指数乗の値を利用して決定されることを特徴とする請求項２に記載の映像のエントロピー符号化方法。
ａ_ｉ＝１／（２＾Ｍ_ｉ）（Ｍ_ｉは、整数）であり、前記アップデートされた二進値の確率Ｐ_ｉ＿ｎｅｗは、次の数式；Ｐ_ｉ＿ｎｅｗ＝（ｙ＞＞Ｍ_ｉ）＋Ｐ＿ｏｌｄ−（Ｐ＿ｏｌｄ＞＞Ｍ_ｉ）を利用して獲得されることを特徴とする請求項３に記載の映像のエントロピー符号化方法。
前記複数個のスケーリングファクタを利用してアップデートするステップは、
確率値が初期化された場合、前記確率のアップデート過程の回数が所定の回数を超えた後から行われることを特徴とする請求項１に記載の映像のエントロピー符号化方法。
前記確率値が初期化された場合、前記確率のアップデート過程の回数が所定の回数以下である場合には、前記確率を、一つのスケーリングファクタを利用してアップデートすることを特徴とする請求項５に記載の映像のエントロピー符号化方法。
映像のエントロピー符号化装置において、
現在の符号化シンボルよりも先に符号化された以前の符号化シンボルに基づいて決定された所定の二進値の確率を利用して、前記現在の符号化シンボルの二進値を算術符号化する二進算術符号化部と、
前記現在の符号化シンボルの二進値によって、前記所定の二進値の確率を、複数個のスケーリングファクタを利用してアップデートするコンテキストモデラーと、を備えることを特徴とする映像のエントロピー符号化装置。
映像のエントロピー復号化方法において、
現在の符号化シンボルよりも先に復号化された以前の符号化シンボルに基づいて決定された所定の二進値の確率を利用して、現在の符号化シンボルの二進値を算術復号化するステップと、
前記現在の符号化シンボルの二進値によって、前記所定の二進値の確率を、複数個のスケーリングファクタを利用してアップデートするステップと、を含むことを特徴とする映像のエントロピー復号化方法。
前記アップデートするステップは、
前記複数個のスケーリングファクタをａ_ｉ（ａ_ｉは、１よりも小さい正の実数、ｉは、１以上の整数）、前記以前の符号化シンボルの情報に基づいて決定された二進値の確率をＰ＿ｏｌｄ、前記スケーリングファクタａ_ｉを利用してアップデートされた二進値の確率をＰ_ｉ＿ｎｅｗとし、ｙは、前記現在の符号化シンボルが、前記所定の二進値を有する場合、０の値を有し、前記現在の符号化シンボルが、前記所定の二進値を有する場合、１の値を有すると仮定する時、次の数式；Ｐ_ｉ＿ｎｅｗ＝ａ_ｉ＊ｙ＋（１−ａ_ｉ）＊Ｐ＿ｏｌｄによって獲得された複数個のアップデートされた二進値の確率Ｐ_ｉ＿ｎｅｗの加重平均値を利用して、前記所定の二進値の確率をアップデートすることを特徴とする請求項８に記載の映像のエントロピー復号化方法。
前記スケーリングファクタａ_ｉは、２の指数乗の値を利用して決定されることを特徴とする請求項９に記載の映像のエントロピー復号化方法。
ａ_ｉ＝１／（２＾Ｍ_ｉ）（Ｍ_ｉは、整数）であり、前記アップデートされた二進値の確率Ｐ_ｉ＿ｎｅｗは、次の数式；Ｐ_ｉ＿ｎｅｗ＝（ｙ＞＞Ｍ_ｉ）＋Ｐ＿ｏｌｄ−（Ｐ＿ｏｌｄ＞＞Ｍ_ｉ）を利用して獲得されることを特徴とする請求項１０に記載の映像のエントロピー復号化方法。
前記複数個のスケーリングファクタを利用してアップデートするステップは、
確率値が初期化された場合、前記確率のアップデート過程の回数が所定の回数を超えた後から行われることを特徴とする請求項８に記載の映像のエントロピー復号化方法。
前記確率値が初期化された場合、前記確率のアップデート過程の回数が所定の回数以下である場合には、前記確率を、一つのスケーリングファクタを利用してアップデートすることを特徴とする請求項１２に記載の映像のエントロピー復号化方法。
映像のエントロピー復号化装置において、
現在の符号化シンボルよりも先に復号化された以前の符号化シンボルに基づいて決定された所定の二進値の確率を利用して、前記現在の符号化シンボルの二進値を算術復号化する二進算術復号化部と、
前記現在の符号化シンボルの二進値によって、前記所定の二進値の確率を、複数個のスケーリングファクタを利用してアップデートするコンテキストモデラーと、を備えることを特徴とする映像のエントロピー復号化装置。
請求項１に記載の方法を実行するためのコンピュータで実行可能なプログラムが記録された記録媒体。