JP2014068247A

JP2014068247A - 符号量計算装置及びプログラム、並びに、動画像符号化装置及びプログラム

Info

Publication number: JP2014068247A
Application number: JP2012212926A
Authority: JP
Inventors: Satoshi Nakagawa; 聰中川
Original assignee: Oki Electric Industry Co Ltd
Current assignee: Oki Electric Industry Co Ltd
Priority date: 2012-09-26
Filing date: 2012-09-26
Publication date: 2014-04-17

Abstract

【課題】動画像を符号化する際の符号量を効率的に求める。
【解決手段】本発明は、対象画像と予測画像との残差信号や予測情報等の符号化情報に係る２値符号列の系列と、符号化情報に係るコンテキスト変数の系列とに基づいてエントロピー符号化手段から出力する符号の符号量を計算する符号量計算装置を備える動画像符号化装置に関する。そして、符号量計算装置は、処理開始時での初期区間幅を記憶する手段と、初期区間幅を初期値として更新される区間幅を保持する手段と、２値符号列の系列及びコンテキスト変数の系列に応じて保持する区間幅の状態遷移を制御する手段と、２値符号列ごとに正規化によって区間幅をビットシフトした回数をカウントする手段と、カウント値と初期区間幅に対応する符号量と処理終了時に保持する区間幅に対応する符号量とに基づいて、エントロピー符号化手段から出力する符号量を計算する手段とを有することを特徴とする。
【選択図】図１

Description

本発明は、符号量計算装置及びプログラム、並びに、動画像符号化装置及びプログラムに関し、例えば、Ｈ．２６４／ＭＰＥＧ−４ＡＶＣ等の動画像符号化技術による動画像圧縮符号の処理に適用できる。

従来、Ｈ．２６４／ＭＰＥＧ−４ＡＶＣ（以下、単に「Ｈ．２６４」と呼ぶ）等に代表される映像符号化技術による映像情報の圧縮符号化処理では、入力された画像を分割した処理単位毎に、動き補償予測等を行った予測画像と、入力された画像との差分である予測残差信号に、離散コサイン変換等の空間変換を施した変換係数を量子化し、さらに、これを算術符号等のエントロピー符号化することによって高効率の映像圧縮を実現している。

そして、従来の量子化処理により量子化雑音が発生した場合、復号側で再生される復号画像に歪が生じるが、量子化することによって、符号化すべき情報量が削減される。そして、従来の量子化処理では、量子化された係数情報等は算術符号等のエントロピー符号化により、情報の発生確率に応じた符号量となるように符号化される。例えば、Ｈ．２６４ではＣＡＢＡＣ（Ｃｏｎｔｅｘｔ−ｂａｓｅｄＡｄａｐｔｉｖｅＢｉｎａｒｙＡｒｉｔｈｍｅｔｉｃＣｏｄｉｎｇ）と呼ばれるコンテキスト適応２値算術符号等が使用されている。

従来の映像符号化技術では、このような歪と符号量（レート）のトレードオフを評価し、符号化モード選択等に利用する技術としてレート歪最適化技術がある。レート歪最適化技術とは、複数の符号化モード等の選択肢について、その選択肢を選択した場合に得られる復号画像の対象画像に対する歪Ｄと、その選択肢で符号化したときに発生する符号量Ｒと、ラグランジュ乗数λで表されるＲＤコストＪ（Ｊ＝Ｄ＋λＲ）を最小化するような選択をすることによって、レートと歪のトレードオフが最適な符号化をする方法である。

例えば、ある符号化単位（Ｈ．２６４ではマクロブロック等）で複数ある符号化モード候補（イントラモード、インターモード、スキップモード等〉からの選択を行う場合に、その選択肢で符号化したときに発生する符号量Ｒを計算する。この場合、従来技術では、実際に符号化してみることによって符号量を求める必要がある。また、その他にも、特許文献１の記載技術のように、コンテキスト変数が表す確率状態ごとに対応する符号量をテーブル引きにより求め、テーブル引きの結果を累積加算することで符号量を推定する方法がある。

特開２００８−１１４３１号公報

しかしながら、従来の符号化技術のように実際に符号化を行ってみる方法では、出力されるビットパターンを求める処理等の演算量が多く処理の無駄が多い。さらに、従来技術では、符号量として整数精度のビット数しか得られず、算術符号がもつ整数符号長でない符号化が可能である特徴をモード選択等に有効に反映できない。

また、特許文献１の記載技術のように、符号量テーブルを用いて加算していく方法では、算術符号の区間幅の分布に関する近似が用いられているために精度の高い符号量の推定ができず、より符号化効率の高い最適な選択がなされない場合があるという課題があった。

上述のような課題に鑑みて、動画像を符号化する際の符号量を効率的に求めることができる符号量計算装置及びプログラム、並びに、動画像符号化装置及びプログラムが望まれている。

第１の本発明は、動画像を構成する対象画像と上記対象画像の予測画像との残差信号や予測情報等の符号化情報に係る２値符号列の系列と、上記符号化情報に係る２値符号列のそれぞれの確率状態を表すコンテキスト変数の系列とに基づいて、上記符号化情報のエントロピー符号化を行うエントロピー符号化手段を用いて、上記動画像の符号化を行う場合に、上記エントロピー符号化手段で出力する符号の符号量を計算する符号量計算装置において、（１）上記２値符号列の系列に係る処理開始時での初期区間幅を記憶する初期区間幅記憶手段と、（２）上記初期区間幅を初期値とし、上記２値符号列の系列に応じて更新される区間幅を保持する区間幅保持手段と、（３）上記２値符号列の系列及び上記コンテキスト変数の系列に応じて、上記区間幅保持手段の区間幅の状態遷移を制御する２値符号列処理手段と、（４）上記２値符号列処理手段が、正規化処理によって区間幅をビットシフトした回数をカウントするビットシフト回数カウント手段と、（５）上記ビットシフト回数カウント手段のカウント値と、上記初期区間幅に対応する符号量と、上記２値符号列の系列に係るすべての２値符号列の処理終了時に上記区間幅保持手段が保持する区間幅に対応する符号量とに基づいて、上記エントロピー符号化手段から出力する符号量を計算する計算手段とを有することを特徴とする。

なお、上述の第１の本発明の符号量計算装置には、「動画像を構成する対象画像と上記対象画像の予測画像との誤差信号に係る２値符号列の系列と、上記誤差信号に係る２値符号列のそれぞれの確率状態を表すコンテキスト変数の系列とに基づいて、上記誤差信号のエントロピー符号化を行うエントロピー符号化手段を用いて、上記動画像の符号化を行う場合に、上記エントロピー符号化手段で出力する符号の符号量を計算する符号量計算装置において、（１）上記２値符号列の系列に係る処理開始時での初期区間幅を初期値とし、上記２値符号列の系列に応じて更新される区間幅を保持する区間幅保持手段と、（２）上記２値符号列の系列及び上記コンテキスト変数の系列に応じて、上記区間幅保持手段の区間幅の状態遷移を制御する２値符号列処理手段と、（３）上記２値符号列ごとに、上記区間幅保持手段で更新される区間幅をビットシフトにより正規化する処理を行う正規化処理手段と、（４）上記正規化処理手段が、ビットシフトした回数をカウントするビットシフト回数カウント手段と、（５）上記ビットシフト回数カウント手段のカウント値と、上記初期区間幅に対応する符号量と、上記２値符号列の系列に係るすべての２値符号列の処理終了時に上記区間幅保持手段が保持する区間幅に対応する符号量とに基づいて、上記エントロピー符号化手段から出力する符号量を計算する計算手段とを有することを特徴とする符号量計算装置。」が含まれる。

第２の本発明は、動画像を構成する対象画像と上記対象画像の予測画像との残差信号や予測情報等の符号化情報に係る２値符号列と、上記符号化情報に係る２値符号列のそれぞれの確率状態を表すコンテキスト変数の系列とに基づいて、上記符号化情報のエントロピー符号化を行うエントロピー符号化手段と、上記エントロピー符号化手段で、動画像の符号化を行う場合に、必要となる符号量を推定する符号量計算手段とを備え、上記エントロピー符号化手段は、上記符号量計算装置の推定結果に基づいて選択された符号化情報に係る符号を出力する動画像符号化装置において、上記符号量計算手段として第１の本発明の符号量計算装置を適用したことを特徴とする。

第３の本発明は、動画像を構成する対象画像と上記対象画像の予測画像との残差信号や予測情報等の符号化情報に係る２値符号列と、上記符号化情報に係る２値符号列のそれぞれの確率状態を表すコンテキスト変数の系列とに基づいて、上記符号化情報のエントロピー符号化を行うエントロピー符号化手段を用いて、上記動画像の符号化を行う場合に、上記エントロピー符号化手段で出力する符号の符号量を計算する符号量計算プログラムにおいて、コンピュータを、（１）上記２値符号列の系列に係る処理開始時での初期区間幅を記憶する初期区間幅記憶手段と、（２）上記初期区間幅を初期値とし、上記２値符号列の系列に応じて更新される区間幅を保持する区間幅保持手段と、（３）上記２値符号列の系列及び上記コンテキスト変数の系列に応じて、上記区間幅保持手段の区間幅の状態遷移を制御する２値符号列処理手段と、（４）上記２値符号列処理手段が、正規化処理によって区間幅をビットシフトした回数をカウントするビットシフト回数カウント手段と、（５）上記ビットシフト回数カウント手段のカウント値と、上記初期区間幅に対応する符号量と、上記２値符号列の系列に係るすべての２値符号列の処理終了時に上記区間幅保持手段が保持する区間幅に対応する符号量とに基づいて、上記エントロピー符号化手段から出力する符号量を計算する計算手段として機能させることを特徴とする。

第４の本発明の動画像符号化プログラムは、コンピュータを、（１）動画像を構成する対象画像と上記対象画像の予測画像との残差信号や予測情報等の符号化情報に係る２値符号列と、上記符号化情報に係る２値符号列のそれぞれの確率状態を表すコンテキスト変数の系列とに基づいて、上記符号化情報のエントロピー符号化を行うエントロピー符号化手段と、（２）上記エントロピー符号化手段で、動画像の符号化を行う場合に、必要となる符号量を推定する符号量計算手段として機能させ、（３）上記エントロピー符号化手段は、上記符号量計算装置の推定結果に基づいて選択された符号化情報に係る符号を出力し、（４）上記符号量計算手段は、（４−１）上記２値符号列の系列に係る処理開始時での初期区間幅を記憶する初期区間幅記憶手段と、（４−２）上記初期区間幅を初期値とし、上記２値符号列の系列に応じて更新される区間幅を保持する区間幅保持手段と、（４−３）上記２値符号列の系列及び上記コンテキスト変数の系列に応じて状態遷移を制御する２値符号列処理手段と、（４−４）上記２値符号列処理手段が、正規化処理によって区間幅をビットシフトした回数をカウントするビットシフト回数カウント手段と、（４−５）上記ビットシフト回数カウント手段のカウント値と、上記初期区間幅に対応する符号量と、上記２値符号列の系列に係るすべての２値符号列の処理終了時に上記区間幅保持手段が保持する区間幅に対応する符号量とに基づいて、上記エントロピー符号化手段から出力する符号量を計算する計算手段とを有することを特徴とする。

本発明によれば、動画像を符号化する際の符号量を効率的に求めることができる。

第１の実施形態に係る符号量計算部の機能的構成について示したブロック図である。第１の実施形態に係る動画像符号化装置の機能的構成について示したブロック図である。第１の実施形態に係るエントロピー符号化部の機能的構成について示したブロック図である。第１の実施形態に係る符号量計算部の動作について示したフローチャートである。第１の実施形態に係る符号量計算部で用いられる符号量テーブルＴの構成例について示した説明図である。第２の実施形態に係る符号量計算部の機能的構成について示したブロック図である。第２の実施形態に係る符号量計算部の動作について示したフローチャートである。

（Ａ）第１の実施形態
以下、本発明による符号量計算装置及びプログラム、並びに、動画像符号化装置及びプログラムの第１の実施形態を、図面を参照しながら詳述する。なお、第１の実施形態では、本発明の符号量計算装置を、動画像符号化装置を構成する符号量計算部として構成した例について示している。

（Ａ−１）第１の実施形態の構成
図２は、この実施形態の動画像符号化装置１の全体構成を示すブロック図である。なお、図２において、括弧内の符号は、後述する第２の実施形態でのみ用いられる符号である。

動画像符号化装置１は、画面分割部１０１、空間変換部１０２、量子化部１０３、エントロピー符号化部１０４、逆量子化部１０５、逆空間変換部１０６、ループ内フィルタ部１０７、参照画像バッファ１０８、インター予測部１０９、イントラ予測部１１０、符号化モード選択部１１１、符号量計算部１１２、予測残差信号生成部１１３、及び復号画像生成部１１４を有している。

動画像符号化装置１は、プロセッサ及びメモリ等を有するコンピュータ（１台に限定されず、複数台を分散処理し得るようにしたものであっても良い。）に、実施形態の動画像符号化プログラム（実施形態の符号量計算プログラムを含む）等をインストールすることにより構築しても良く、その場合でも、機能的には上述の図２のように示すことができる。なお、図２において、符号量計算部１１２以外の構成について限定されないものであり、例えば、Ｈ．２６４等に準拠した種々の動画像符号化装置と同様のものを適用することができるため、詳細については説明省略する。

画面分割部１０１は、対象画像（入力画像）を、マクロブロック等の処理単位領域ごとに画面分割して、予測残差信号生成部１１３に供給する。

予測残差信号生成部１１３は、画面分割部１０１から供給される分割済の画像データとインター予測部１０９又はイントラ予測部１１０から供給される予測画像とから、予測残差信号を得て、空間変換部１０２に供給するものである。

空間変換部１０２は、予測残差信号を、ＤＣＴ（離散コサイン変換）やその整数近似変換等によって空間変換して変換係数を得る。そして、量子化部１０３は、その変換係数を、所定の量子化幅で量子化した結果として、量子化された予測残差信号を得て、エントロピー符号化部１０４に供給する。

そして、エントロピー符号化手段としてのエントロピー符号化部１０４は、量子化された予測残差信号とモード情報等の符号化情報についてエントロピー符号化（例えば、算術符号化等）を行って、その他の符号化情報とともに符号化ストリームのデータを生成する。この符号化ストリームのデータが、動画像符号化装置１の出力となる。

逆量子化部１０５は、量子化された予測残差信号を逆量子化する。そして、逆空間変換部１０６は、予測残差信号が逆量子化された結果に対して、逆空間変換（逆直交変換等）を行い、量子化誤差を伴う予測残差信号を得て、復号画像生成部１１４に供給する。

復号画像生成部１１４は、量子化誤差を伴う予測残差信号（逆空間変換部１０６からの入力信号）と予測画像（インター予測部１０９又はイントラ予測部１１０からの予測画像）より復号画像を得る。復号画像生成部１１４は、復号画像をループ内フィルタ部１０７及びイントラ予測部１１０に供給する。

ループ内フィルタ部１０７は、復号画像に対して、量子化によるブロック歪を軽減するデブロッキングフィルタ等として機能するものである。そして、ループ内フィルタ部１０７は、フィルタ処理した復号画像を参照画像バッファ１０８に供給する。

参照画像バッファ１０８は、ループ内フィルタ部１０７からのフィルタ処理した復号画像を、後続の画像の符号化時のインター予測の動き補償のための参照画像として保持する。なお、Ｈ．２６４／ＡＶＣ標準の場合、動き補償で参照する画像は、現在符号化を行おうとしている画像の直前画像に限定されず、複数の時刻の画像が参照画像となり得る。

インター予測部１０９は、現在符号化を行おうとしている対象画像データと、参照画像バッファ１０８の参照画像から動き補償等の予測情報を得て予測画像データを生成するものである。イントラ予測部１１０は、対象画像の既に符号化され、局所復号された復号画像を用いて予測画像データを生成するものである。動画像符号化装置１では、符号化モード選択部１１１の制御に応じて、インター予測部１０９又はイントラ予測部１１０のいずれかを用いた予測画像データが、予測残差信号生成部１１３及び復号画像生成部１１４に供給される。

符号化モード選択部１１１は、対象画像ごとにイントラ予測に基づく符号化モード（イントラ予測部１１０が出力する予測画像に基づく符号化）と、インター予測に基づく符号化モード（インター予測部１０９が出力する予測画像に基づく符号化）のいずれかを決定する。この実施形態の動画像符号化装置１では、上述の２つの符号化モードに対応しているものとして説明するが、動画像符号化装置１が対応する符号化モードの数や種類については限定されないものである。そして、符号化モード選択部１１１は、複数の符号化モードから、レート歪最適化によって、ＲＤコストが最小となるような符号化モードを選択する。このとき、符号化モード選択部１１１は、それぞれの符号化モードで符号化を行った場合の発生符号量Ｒを符号量計算部１１２によって求め、ＲＤコストの算出に用いるものとする。

次に、エントロピー符号化部１０４の内部構成について、図３を用いて説明する。

この実施形態のエントロピー符号化部１０４では、エントロピー符号化としてＣＡＢＡＣのような算術符号によるエントロピー符号化を行うものとする。

図３に示すように、この実施形態のエントロピー符号化部１０４は、２値化部２０１、コンテキスト計算部２０２、コンテキスト変数テーブル２０４、及び算術符号化部２０３を有している。

エントロピー符号化部１０４では、量子化部１０３からの、量子化された予測残差信号である係数情報やモード情報等が、シンタックス要素として入力される。

そして、そのシンタックス要素は、２値化部２０１により、ビンと呼ばれる２値符号列の系列に変換される。そして、コンテキスト計算部２０２は、シンタックス要素や周囲の符号化済み情報等に応じたコンテキストごとにビンの生起確率に関する状態を保持するコンテキスト変数テーブル２０４へのインデックスを求める。

そして、算術符号化部２０３は、２値化部２０１で生成されたビンごとに、対応するコンテキスト変数に応じた算術符号化を行い、符号化ビットストリームとして出力する。

次に、符号量計算部１１２の内部構成について図１を用いて説明する。

図１に示すように、符号量計算部１１２は、初期区間幅記憶部３０１、区間幅保持部３０２、ビット数カウンタ３０３、２値符号列処理部３０４、及び符号量算出部３０５を有している。

図１に示すように、符号量計算部１１２には、符号量を推定する符号化単位のシンタックス要素に対して、エントロピー符号化部１０４で生成されるのと同様のビン（２値符号列）の系列と、各ビンに対応するコンテキスト変数の系列が入力されるものとして説明する。

初期区間幅記憶部３０１は、符号量推定開始時の算術符号化部２０３の内部状態である区間幅情報を読み出して記憶するものである。

区間幅保持部３０２は、初期区間幅で初期化され、２値符号列処理部３０４により更新される区間幅を保持するものである。

２値符号列処理部３０４は、入力されるビンと、コンテキスト変数に応じて、算術符号化を実際に行う場合と同様に、区間幅保持部３０２の区間幅の状態遷移を制御するものである。

ビット数カウンタ３０３は、区間幅を正規化によってビットシフトした回数を保持するものである。

符号量算出部３０５は、計算対象となる符号化単位の２値符号列が処理されると、ビット数カウンタ３０３で保持される値と、２値符号列処理部３０４の処理終了時の区間幅に対応する符号量の和から、初期区間幅に対応する符号量を減算して、符号化対象の符号量として出力する。
（Ａ−２）第１の実施形態の動作
次に、以上のような構成を有する第１の実施形態の動画像符号化装置１の動作について、を説明する。

上述の通り、動画像符号化装置１では、符号量計算部１１２以外の処理については、種々の動画像符号化装置と同様のものを適用することができるため、符号量計算部１１２以外の動作説明については省略する。

以下では、符号量計算部１１２が、計算対象となる対象画像の符号化単位について符号量を計算するする動作の具体例について説明する。

符号量計算部１１２では、符号量計算対象の符号化単位の２値符号列と、各ビンに対応するコンテキスト変数の系列が入力されると、まず、初期区間幅記憶部３０１に初期区間幅を記憶する。初期区間幅は、実際の算術符号化を行う算術符号化部２０３の内部状態を読み出したものであり、対象符号化単位までに符号化を行ったことによる算術符号化器（エントロピー符号化部１０４）の区間幅である。

また、このとき、区間幅保持部３０２は、この初期区間幅で初期化される。さらに、ビット数カウンタ３０３も０に初期化される。

そして、２値符号列処理部３０４は、入力される２値符号列の各ビンと対応するコンテキスト変数を用いて、実際に算術符号化を行う場合と同様に区間幅の状態遷移を処理する。

図４は、符号量計算部１１２（２値符号列処理部３０４）による各ビンの処理について示したフローチャートである。２値符号列処理部３０４は、各ビン（ｂｉｎＶａｌ）に対して、図４のフローチャートの処理を実行する。

まず、ビン（ｂｉｎＶａｌ）とコンテキスト変数（ｐＳｔａｔｅＩｄｘ，ｖａｌＭＰＳ）が入力されると、２値符号列処理部３０４は、区間幅保持部３０２に保持されている区間幅（ｃｏｄＩＲａｎｇｅ）の分割幅を求める（Ｓ１０１）。

なお、区間幅はＬＰＳ（ｌｅａｓｔｐｒｏｂａｂｌｅｓｙｍｂｏｌ）とＭＰＳ（ｍｏｓｔｐｒｏｂａｂｌｅｓｙｍｂｏｌ）のための区間に分割されているため、２値符号列処理部３０４は、その分割された区間幅を求めることになる（ｃｏｄＩＲａｎｇｅＬＰＳ，ｃｏｄＩＲａｎｇｅＭＰＳ）。すなわち、ステップＳ１０１では、区間幅保持部３０２に保持されている区間幅（ｃｏｄｌＲａｎｇｅ）を分割したＬＰＳとＭＰＳのための区間幅（ｃｏｄＩＲａｎｇｅＬＰＳ，ＣｃｏｄＩＲａｎｇｅＭＰＳ）を求める。また、ＣＡＢＡＣではｐＳｔａｔｅＩｄｘとｃｏｄＩＲａｎｇｅの上位ビットによるテーブル引きでｃｏｄＩＲａｎｇｅＬＰＳを求めている。

そして、２値符号列処理部３０４は、今回入力されたビン（ｂｉｎＶａｌ）がＭＰＳである（ｖａｌＭＰＳと等しい）か否かを判定する（Ｓ１０２）。２値符号列処理部３０４は、ステップＳ１０２で、今回入力されたビンがＭＰＳと判定された場合後述するステップＳ１０３から動作し、ＭＰＳと判定されなかった場合（ＬＰＳだった場合）には後述するステップＳ１０７から動作する。

上述のステップＳ１０２で、今回入力されたビンがＭＰＳと判定された場合、２値符号列処理部３０４は、区間幅保持部３０２の区間幅をＭＰＳの区間幅に更新（ｃｏｄＩＲａｎｇｅ＝ｃｏｄＩＲａｎｇｅＭＰＳ）し（Ｓ１０３）、さらに、コンテキスト変数の更新を行う（Ｓ１０４）。

そして、２値符号列処理部３０４は、更新された区間幅が２５６（１６進数で「０ｘ１００」）より小さくなっているか否かを確認する（Ｓ１０５）。

そして、２値符号列処理部３０４は、更新された区間幅が２５６より小さくなっている場合には、正規化（ビットシフト）が１回必要であるので（ＭＰＳの場合は最大１回である）、ビット数カウンタ３０３の値（ｂｉｔＣｏｕｎｔ）を１増やし（ｂｉｔＣｏｕｎｔ＝ｂｉｔＣｏｕｎｔ＋１）、区間幅も１ビットシフトして正規化して（ｃｏｄＩＲａｎｇｅ＝ｃｏｄＩＲａｎｇｅ＜＜１）（Ｓ１０６）、当該ビンの処理を終了する。なお、上述のステップＳ１０５で更新された区間幅が２５６以上と確認された場合には、２値符号列処理部３０４は、当該ビンの処理を終了する。

一方、上述のステップＳ１０２で、今回入力されたビン（ｂｉｎＶａｌ）がＬＰＳと判断された場合、２値符号列処理部３０４は、区間幅保持部３０２の区間幅をＬＰＳの区間幅に更新（ｃｏｄＩＲａｎｇｅ＝ｃｏｄｌＲａｎｇｅＬＰＳ）し（Ｓ１０７）、さらに、コンテキスト変数の更新を行う（Ｓ１０８）。

そして、２値符号列処理部３０４は、区間幅が２５６（１６進数で「０ｘ１００」）以上となるまで（正規化処理が完了するまで）、ビット数カウンタと区間幅の更新による正規化処理（上述のステップＳ１０６と同様のビットシフトの処理）を繰り返して、当該ビンに係る処理を終了する（Ｓ１０９、Ｓ１１０）。

なお、バイパス符号化（コンテキスト変数を伴わない確率１／２想定のビン）の場合は、２値符号列処理部３０４は、単純にビット数カウンタを１増やす（ｂｉｔＣｏｕｎｔ＝ｂｉｔＣｏｕｎｔ＋１）ように構成してもよい。また、バイパス符号化のビンが連続する場合は、２値符号列処理部３０４は、バイパス符号化ビン数ｍをビット数カウンタに加算（ｂｉｔＣｏｕｎｔ＝ｂｉｔＣｏｕｎｔ＋ｍ）するよう構成しても良い。

以上の、図４のフローチャートの処理を入力されるビンの系列と、各ビンに対応するコンテキスト変数の系列に関して繰り返すことにより、区間幅保持部３０２の区間幅が、実際に算術符号化を行った場合と同様に状態遷移する。その結果、出力されるであろうビット数が、ビット数カウンタ３０３に保持されることになる。

符号量算出部３０５は、以上の処理によって求められたビット数カウンタ３０３の値（ｂｉｔＣｏｕｎｔ）と、初期区間幅記憶部３０１に記憶された初期区間幅（ｃｏｄＩＲａｎｇｅＳ）と、対象系列処理後の区間幅保持部３０２の区間幅（ｃｏｄＩＲａｎｇｅ）を用いて符号化対象に対する符号量を算出する。

ＣＡＢＡＣでは、算術符号の区間幅は９ビット精度で表現されており以下の（１）式を満たすように正規化されている。すなわち、ＣＡＢＡＣでは算術符号の区間幅が小さいほど１ビット以下の情報がすでに符号量として発生していることに相当し、その符号量は以下の（２）式のように示すことができる。なお、（１）、（２）式で、「０ｘ１００」及び「０ｘ２００」は１６進数の表現となっている。

０×１００≦ｃｏＩＲａｎｇｅ＜０ｘ２００ …（１）
−ｌｏｇ_２（ｃｏｄＩＲａｎｇｅ／０ｘ２００） …（２）
そして、区間幅に対応する符号量を図５に示すように、例えば小数点以下１６ビットの固定少数で表したテーブル（以下、「符号量テーブルＴ」と呼ぶ）として実現できる。

符号量算出部３０５は、例えば小数点以下１６ビットの固定少数として符号量Ｒを算出する場合、「ｂｉｔＣｏｕｎｔ」と、「ｃｏｄＩＲａｎｇｅＳとｃｏｄＩＲａｎｇｅ」と、上述の符号量テーブルＴとを用いて、以下の（３）式により求めることができる。そして、符号量算出部３０５は、求めた符号量Ｒを出力する。

Ｒ＝（ｂｉｔＣｏｕｎｔ＜＜１６）＋Ｔ［ｃｏｄＩＲａｎｇｅ−０×１００］
−Ｔ［ｃｏｄＩＲａｎｇｅＳ−０×１００］ …（３）
（Ａ−３）第１の実施形態の効果
第１の実施形態によれば、以下のような効果を奏することができる。

動画像符号化装置１の符号量計算部１１２では、エントロピー符号化部１０４の算術符号化によって必要となる符号量を、実際に符号化することなく（出力ビットパターンを求める処理はせず）、整数精度より高精度に求めることができる。

具体的には、符号化モード選択部１１１では、実際に符号化を行った場合と同様の算術符号の区間幅の遷移処理を行うので、特許文献１のテーブル引きによる処理のような近似ではない符号量が計算できる。さらに、符号化モード選択部１１１では、符号化開始時の初期状態、及び終了時の状態の区間幅から、整数精度より高精度な符号量を求めることができる。これにより、動画像符号化装置１では、符号化モード選択部１１１において、より最適な符号化モード選択が可能となり、符号化効率が向上する。

（Ｂ）第２の実施形態
以下、本発明による符号量計算装置及びプログラム、並びに、動画像符号化装置及びプログラムの第２の実施形態を、図面を参照しながら詳述する。なお、第２の実施形態では、本発明の符号量計算装置を、動画像符号化装置を構成する符号量計算部として構成した例について示している。

（Ｂ−１）第２の実施形態の構成
第２の実施形態の動画像符号化装置１Ａの全体構成も、上述の図２を用いて示すことができる。

そして、図６は、第２の実施形態の動画像符号化装置１Ａに搭載される符号量計算部１１２Ａの機能的構成について示したブロック図であり、上述の図１と同一又は対応する部分には同一又は対応する符号を付している。

符号量計算部１１２Ａでは、正規化回数テーブル３０６が追加されている点で第１の実施形態と異なっている。正規化回数テーブル３０６は、各ビンの区間幅に対応する正規化回数ｋを得ることを可能とするテーブルである。

上述の通り、２値符号列処理部３０４が各ビンに対して処理を行う際、当該ビンがＬＰＳの場合は正規化処理を複数回行う必要がある。第１の実施形態の２値符号列処理部３０４は、ＬＰＳのビンに対する正規化回数をループ処理（上述のステップＳ１０９、Ｓ１１０の処理）で管理していたが、第２の実施形態では、ビンごとに対応する正規化回数ｋを取得可能な正規化回数テーブル３０６を用いて管理する。

すなわち、２値符号列処理部３０４は、各ビンについて処理する際に、当該ビンがＬＰＳの場合は、正規化回数テーブル３０６から当該ビンに対応する正規化回数ｋを取得する。そして、２値符号列処理部３０４は、取得した正規化回数ｋの回数分の正規化処理（上述のステップＳ１１０と同様の処理）を実行する。

ＬＰＳのビンについては、更新された区間幅はｃｏｄＩＲａｎｇｅＬＰＳのみに依存している。したがって、符号量計算部１１２Ａにおいて、ｃｏｄＩＲａｎｇｅＬＰＳに基づいて、ビンごとに必要な正規化回数ｋをあらかじめ正規化回数テーブル３０６として用意しておくことが可能である。

例えば、ＣＡＢＡＣではｃｏｄＩＲａｎｇｅＬＰＳが取りうる範囲に応じて限定したテーブルを用意しておくことが可能である。あるいは、ｃｏｄＩＲａｎｇｅＬＰＳを求めるテーブルに、対応する正規化回数も含めたテーブルとしておくことも可能である。

（Ｂ−２）第２の実施形態の動作
次に、以上のような構成を有する第２の実施形態の動画像符号化装置１Ａ（符号量計算部１１２Ａ）の動作について、第１の実施形態との差異を中心に説明する。

図７は、符号量計算部１１２Ａを構成する符号量計算部１１２Ａ（２値符号列処理部３０４）による各ビンの処理について示したフローチャートである。第２の実施形態の２値符号列処理部３０４は、各ビン（ｂｉｎＶａｌ）に対して、図７のフローチャートの処理を実行する。

図７に示すステップＳ２０１〜Ｓ２０８については、第１の実施形態のステップＳ１０１〜Ｓ１０８と同様であるので詳しい説明は省略する。

そして、第２の実施形態の符号量計算部１１２Ａ（２値符号列処理部３０４）では、ＬＰＳのビンについて正規化する際に、第１の実施形態のようなループ処理（ステップＳ１０９、Ｓ１１０）ではなく、正規化回数テーブル３０６を用いた処理により複数回の正規化処理を実現している。

具体的には、２値符号列処理部３０４は、上述のステップＳ２０２で、処理対象となるビンがＬＰＳと判定された場合、正規化回数テーブル３０６から当該ビンに対応する正規化回数ｋ（ｃｏｄＩＲａｎｇｅＬＰＳに対応する正規化回数ｋ）を正規化回数テーブル３０６から求める（Ｓ２０９）。そして、２値符号列処理部３０４は、区間幅保持部３０２が保持する区間幅に対して正規化回数ｋの回数分の正規化処理（ビットシフトの処理）を行う（Ｓ２１０）。

具体的にはステップＳ２１０において、２値符号列処理部３０４は、正規化回数ｋにしたがって、ビット数カウンタ３０３の値をｋビット分増やし（ｂｉｔＣｏｕｎｔ＝ｂｉｔＣｏｕｎｔ＋ｋ）、区間幅保持部３０２の区間幅もｋビットシフトして正規化する（ｃｏｄＩＲａｎｇｅ＝ｃｏｄＩＲａｎｇｅ＜＜ｋ）。

以上の処理を入力されるビンの系列と、各ビンに対応するコンテキスト変数の系列に関して繰り返すことにより、符号量計算部１１２Ａでは、区間幅保持部３０２の区間幅が、実際に算術符号化を行った場合と同様に状態遷移し、出力されるであろうビット数がビット数カウンタ３０３に求まる。

そして、符号量算出部３０５は、以上の処理によって求められたビット数カウンタ３０３の値（ｂｉｔＣｏｕｎｔ）と、初期区間幅記憶部３０１に記憶された初期区間幅（ｃｏｄＩＲａｎｇｅＳ）と、対象系列処理後の区間幅保持部３０２の区間幅（ｃｏｄｌＲａｎｇｅ）を用いて計算対象系列に対する符号量Ｒを算出し出力する。

（Ｂ−３）第２の実施形態の効果
第２の実施形態によれば、第１の実施形態の効果に加えて以下のような効果を奏することができる。

第２の実施形態の符号量計算部１１２では、区間幅のビットシフトによる正規化処理を、第１の実施形態のようなループ処理ではなく、テーブル引き処理とすることで、第１の実施形態よりも符号量算出に必要な処理量を低減することができる。

（Ｃ）他の実施形態
本発明は、上記の各実施形態に限定されるものではなく、以下に例示するような変形実施形態も挙げることができる。

（Ｃ−１）上記の各実施形態では、符号量計算部は動画像符号化装置の一部を構成するものとして説明したが、符号量計算部を独立した装置（符号量計算装置）として構築するようにしてもよい。その場合、本発明の符号量計算装置の機能的構成は、図１のように示すことができる。なお、本発明の符号量計算装置は、プロセッサ及びメモリ等を有するコンピュータ（１台に限定されず、複数台を分散処理し得るようにしたものであっても良い。）に、本発明の符号量計算プログラム等をインストールすることにより構築しても良く、その場合でも、機能的には上述の図１のように示すことができる。

（Ｃ−２）上記の実施形態では、本発明の動画像符号化装置は、Ｈ．２６４に基づくエントロピー符号化（ＣＡＢＡＣ）を用いる例について説明したが、算術符号化を用いるその他の種々の符号化に対応する映像符号化処理を適用するようにしてもよい。

１…動画像符号化装置１１…画面分割部、１０２…空間変換部、１０３…量子化部、１０４…エントロピー符号化部、１０５…逆量子化部、１０６…逆空間変換部、１０７…ループ内フィルタ部、１０８…参照画像バッファ、１０９…インター予測部、１１０…イントラ予測部、１１１…符号化モード選択部、１１２…符号量計算部、１１３…予測残差信号生成部、１１４…復号画像生成部、２０１…２値化部、２０２…コンテキスト計算部、２０３…算術符号化部、２０４…コンテキスト変数テーブル、３０１…初期区間幅記憶部、３０２…区間幅保持部、３０３…ビット数カウンタ、３０４…２値符号列処理部、３０５…符号量算出部。

Claims

動画像を構成する対象画像と上記対象画像の予測画像との残差信号や予測情報等の符号化情報に係る２値符号列の系列と、上記符号化情報に係る２値符号列のそれぞれの確率状態を表すコンテキスト変数の系列とに基づいて、上記符号化情報のエントロピー符号化を行うエントロピー符号化手段を用いて、上記動画像の符号化を行う場合に、上記エントロピー符号化手段で出力する符号の符号量を計算する符号量計算装置において、
上記２値符号列の系列に係る処理開始時での初期区間幅を記憶する初期区間幅記憶手段と、
上記初期区間幅を初期値とし、上記２値符号列の系列に応じて更新される区間幅を保持する区間幅保持手段と、
上記２値符号列の系列及び上記コンテキスト変数の系列に応じて、上記区間幅保持手段の区間幅の状態遷移を制御する２値符号列処理手段と、
上記２値符号列処理手段が、正規化処理によって区間幅をビットシフトした回数をカウントするビットシフト回数カウント手段と、
上記ビットシフト回数カウント手段のカウント値と、上記初期区間幅に対応する符号量と、上記２値符号列の系列に係るすべての２値符号列の処理終了時に上記区間幅保持手段が保持する区間幅に対応する符号量とに基づいて、上記エントロピー符号化手段から出力する符号量を計算する計算手段と
を有することを特徴とする符号量計算装置。
上記２値符号列に係る区間幅ごとに対応する正規化回数を取得することが可能な情報を保持する正規化回数情報保持手段をさらに有し、
上記２値符号列処理手段は、上記２値符号列に係る区間幅ごとに、上記正規化回数情報保持手段で保持されている情報に基づいた回数分のビットシフトにより正規化処理を行い、
上記ビットシフト回数カウント手段は、上記２値符号列に係る区間幅ごとに、上記正規化回数保持手段で保持されている情報に基づいた回数をカウンタ値に加算する
ことを特徴とする請求項１に記載の符号量計算装置。
上記２値符号列処理手段は、上記２値符号列の系列うち、バイパス符号化される２値符号列については、上記ビットシフト回数カウント手段のカウンタ値を加算する処理のみを行うことを特徴とする請求項２に記載の符号量計算装置。
動画像を構成する対象画像と上記対象画像の予測画像との残差信号や予測情報等の符号化情報に係る２値符号列と、上記符号化情報に係る２値符号列のそれぞれの確率状態を表すコンテキスト変数の系列とに基づいて、上記符号化情報のエントロピー符号化を行うエントロピー符号化手段と、上記エントロピー符号化手段で、動画像の符号化を行う場合に、必要となる符号量を推定する符号量計算手段とを備え、上記エントロピー符号化手段は、上記符号量計算装置の推定結果に基づいて選択された符号化情報に係る符号を出力する動画像符号化装置において、
上記符号量計算手段として請求項１〜３のいずれかの符号量計算装置を適用したことを特徴とする動画像符号化装置。
動画像を構成する対象画像と上記対象画像の予測画像との残差信号や予測情報等の符号化情報に係る２値符号列と、上記符号化情報に係る２値符号列のそれぞれの確率状態を表すコンテキスト変数の系列とに基づいて、上記符号化情報のエントロピー符号化を行うエントロピー符号化手段を用いて、上記動画像の符号化を行う場合に、上記エントロピー符号化手段で出力する符号の符号量を計算する符号量計算プログラムにおいて、
コンピュータを、
上記２値符号列の系列に係る処理開始時での初期区間幅を記憶する初期区間幅記憶手段と、
上記初期区間幅を初期値とし、上記２値符号列の系列に応じて更新される区間幅を保持する区間幅保持手段と、
上記２値符号列の系列及び上記コンテキスト変数の系列に応じて、上記区間幅保持手段の区間幅の状態遷移を制御する２値符号列処理手段と、
上記２値符号列処理手段が、正規化処理によって区間幅をビットシフトした回数をカウントするビットシフト回数カウント手段と、
上記ビットシフト回数カウント手段のカウント値と、上記初期区間幅に対応する符号量と、上記２値符号列の系列に係るすべての２値符号列の処理終了時に上記区間幅保持手段が保持する区間幅に対応する符号量とに基づいて、上記エントロピー符号化手段から出力する符号量を計算する計算手段と
して機能させることを特徴とする符号量計算プログラム。
コンピュータを、
動画像を構成する対象画像と上記対象画像の予測画像との残差信号や予測情報等の符号化情報に係る２値符号列と、上記符号化情報に係る２値符号列のそれぞれの確率状態を表すコンテキスト変数の系列とに基づいて、上記符号化情報のエントロピー符号化を行うエントロピー符号化手段と、
上記エントロピー符号化手段で、動画像の符号化を行う場合に、必要となる符号量を推定する符号量計算手段として機能させ、
上記エントロピー符号化手段は、上記符号量計算装置の推定結果に基づいて選択された符号化情報に係る符号を出力し、
上記符号量計算手段は、
上記２値符号列の系列に係る処理開始時での初期区間幅を記憶する初期区間幅記憶手段と、
上記初期区間幅を初期値とし、上記２値符号列の系列に応じて更新される区間幅を保持する区間幅保持手段と、
上記２値符号列の系列及び上記コンテキスト変数の系列に応じて上記区間幅保持手段の区間幅の状態遷移を制御する２値符号列処理手段と、
上記２値符号列処理手段が、正規化処理によって区間幅をビットシフトした回数をカウントするビットシフト回数カウント手段と、
上記ビットシフト回数カウント手段のカウント値と、上記初期区間幅に対応する符号量と、上記２値符号列の系列に係るすべての２値符号列の処理終了時に上記区間幅保持手段が保持する区間幅に対応する符号量とに基づいて、上記エントロピー符号化手段から出力する符号量を計算する計算手段とを有する
ことを特徴とする動画像符号化プログラム。