JP4211780B2

JP4211780B2 - デジタル信号符号化装置、デジタル信号復号装置、デジタル信号算術符号化方法、およびデジタル信号算術復号方法

Info

Publication number: JP4211780B2
Application number: JP2005374008A
Authority: JP
Inventors: 俊一関口; 悦久山田; 光太郎浅井
Original assignee: Mitsubishi Electric Corp
Current assignee: Mitsubishi Electric Corp
Priority date: 2005-12-27
Filing date: 2005-12-27
Publication date: 2009-01-21
Anticipated expiration: 2022-04-25
Also published as: JP2006180521A

Description

本発明は、映像圧縮符号化技術や圧縮映像データ伝送技術等に用いられるデジタル信号符号化装置、デジタル信号復号装置、デジタル信号算術符号化方法、およびデジタル信号算術復号方法に関する。

従来、MPEGやITU-T H.26xなどの国際標準映像符号化方式では、エントロピー符号化としてハフマン符号化が採用されている。ハフマン符号化は、個々の情報源シンボルが個別の符号語として表現される必要がある場合、最適な符号化性能を与えるが、一方で映像信号のように局所的に信号の振る舞いが変動し情報源シンボルの生起確率が変動する場合に対しては最適性が保証されないという問題がある。このような場合に、個々の情報源シンボルの生起確率に動的に適応し、複数のシンボルをまとめて１つの符号語で表現する方法として算術符号化が提案されている。Mark Nelson, "Arithmetic Coding + Statistical Modeling = Data Compression Part 1 - Arithmetic Coding", Dr. Dobb's Journal, February 1991.を引用して算術符号化の考え方について簡単に説明する。ここでは、アルファベット文字を情報源シンボルとする情報源を考え、"BILL GATES"というメッセージを算術符号化することを考える。このとき、個々の文字の生起確率は図２０のように定義される。また、同図の値域に示すように、[0,1]の区間で定義される確率数直線上の区域を一意に定める。次いで、符号化処理に入る。はじめに文字"B"の符号化を行うが、これは、確率数直線上の範囲[0.2,0.3]を特定することに該当する。したがって、文字"B"には値域[0.2,0.3]の上限(High)と下限(Low)の値の組が対応することになる。次いで、"I"の符号化に際しては、"B"の符号化で特定された値域[0.2,0.3]を改めて[0,1]区間とみなし、その中の[0.5,0.6]の区間を特定する。つまり、算術符号化の処理過程は、確率数直線の値域の絞込みを行うことに相当する。各文字に対してこの処理を繰り返すと、図２１に示すように、"BILL GATES"の算術符号化結果は、文字"S"の符号化を終了した時点でのLow値「0.2572167752」として表現される。

復号処理もこの逆を考えればよく、はじめに符号化結果「0.2572167752」が確率数直線上のどの文字が割り当てられている値域に該当するかを調べ、"B"を得る。その後、"B"のLow値を差し引いた後に値域で除算を行い、「0.572167752」を得る。この結果、[0.5,0.6]の区間に対応する文字"I"を復号することが可能となる。以降、この処理を繰り返して"BILL GATES"と復号することができる。以上の処理より、算術符号化によれば、果てしなく長いメッセージの符号化であっても最終的に１つの符号語へマッピングされることになる。実際の実装上は、無限の小数点精度を扱うことができないこと、符号化・復号プロセスに乗除算が必要で演算負荷が高いなどの問題から、例えば、符号語表現として整数型レジスタを利用した浮動小数点演算を行うこととし、上記Low値の生起確率を２のべき乗で近似して乗除算をシフト演算に置き換えるなどの工夫がなされている。算術符号化によれば、理想的には上記のプロセスによって情報源シンボルの生起確率によく適合したエントロピー符号化が可能である。特に、生起確率が動的に変動する場合には、生起確率の変動の様子をトレースして図２０のテーブルを適宜更新することで、ハフマン符号化に比べて高い符号化効率を得ることができる。

Mark Nelson, "Arithmetic Coding + Statistical Modeling = Data Compression Part 1 - Arithmetic Coding", Dr. Dobb's Journal, February 1991.

ところで、エントロピー符号化される映像信号を伝送する際には、通常、伝送誤りに伴う映像の乱れを最小限に抑えるため、映像の各フレームを部分領域に分割し、再同期可能な単位、例えばMPEG-2スライス構造等で伝送することが多い。

しかし、ハフマン符号化では、個々の符号化対象シンボルは整数ビット長の符号語にマップされるため、該当する符号語をまとめて伝送単位として定義するだけでよいが、算術符号化では、明示的に符号化プロセスを中断するための特殊符号が必要となるばかりでなく、符号化を再開する際にそれ以前までのシンボルの生起確率の学習過程を一度リセットして符号を確定するためのビットを排出する必要が生じるため、中断の前後での符号化効率の低下を招く可能性がある。さらに、もし算術符号化処理が１映像フレーム中リセットされずに符号化され、伝送時にパケットデータなどの小単位に分割せざるを得ないような場合には、あるパケットの復号処理は直前パケットのデータなしに実施することができず、伝送誤りや遅延などに起因するパケットロスが発生した場合に著しく映像品質が劣化するという問題がある。

そこで、本発明は、上記従来技術に述べたように、映像符号化のエントロピー符号化として算術符号化を用いる際に問題となる符号化効率と誤り耐性の最適トレードオフを決定する仕組みを備えるデジタル信号符号化装置、デジタル信号復号装置、デジタル信号算術符号化方法、およびデジタル信号算術復号方法を提供することを目的とする。なお、本発明は、算術符号化を用いる装置や方法等全般に対して適用可能である。

上記課題を解決するため、本発明では、デジタル信号を所定単位に分割して圧縮符号化を行うデジタル信号符号化装置において、所定単位のデジタル信号を算術符号化によって圧縮する算術符号化部を備え、当該算術符号化部は、ある伝送単位の符号化が終了した時点における算術符号化状態を表現する情報を、次の伝送単位のデータの一部として多重化するデジタル信号符号化装置であることを特徴とする。

特に、上記算術符号化部は、所定単位のデジタル信号を、１つまたは複数の隣接する伝送単位に含まれる信号との間の依存関係に基づいて、符号化シンボルの生起確率を定めて算術符号化するデジタル信号符号化装置であることを特徴とする。

また、上記算術符号化部は、符号化されるシンボルの出現頻度をカウントすることで上記生起確率を学習するデジタル信号符号化装置であることを特徴とする。

また、上記算術符号化状態を表現する情報とは、算術符号化過程を示すレジスタ値のリセットの有無を示すレジスタリセットフラグと、レジスタ値をリセットしない場合のみ付加する初期レジスタ値とであるデジタル信号符号化装置であることを特徴とする。

また、デジタル信号を所定単位に分割して圧縮符号化を行うデジタル信号符号化装置において、所定単位のデジタル信号を算術符号化によって圧縮する算術符号化部を備え、当該算術符号化部は、所定単位のデジタル信号を、１つまたは複数の隣接する伝送単位に含まれる信号との間の依存関係に基づいて、符号化シンボルの生起確率を定めるとともに、符号化されるシンボルの出現頻度をカウントすることで上記生起確率を学習し、ある伝送単位の符号化が終了した時点における生起確率学習状態を表現する情報を、次の伝送単位データの一部として多重化するデジタル信号符号化装置であることを特徴とする。

特に、生起確率学習状態を表現する情報とは、符号化シンボルの生起確率の変動要因となる他の情報との依存関係をモデル化したコンテクストモデル状態を示す情報であるデジタル信号符号化装置であることを特徴とする。

また、上記デジタル信号は映像信号であって、上記伝送単位は映像フレーム内の１ないし複数個のマクロブロックから構成されるスライスであるデジタル信号符号化装置であることを特徴とする。

また、上記デジタル信号は映像信号であって、上記伝送単位は上記スライス内に含まれる符号化データの種別に応じて再構成される符号化データ単位であるデジタル信号符号化装置であることを特徴とする。

また、上記デジタル信号は映像信号であって、上記伝送単位は映像フレームであるデジタル信号符号化装置であることを特徴とする。

また、圧縮符号化されたデジタル信号を所定単位で受信して復号を行うデジタル信号復号装置において、所定単位の圧縮デジタル信号を算術符号化のプロセスに基づいて復号する算術復号部を備え、当該算術復号部は、ある伝送単位の復号開始時に、該伝送単位データの一部として多重化される算術符号化状態を表現する情報に基づいて、復号動作の初期化を行うデジタル信号復号装置であることを特徴とする。

特に、上記算術復号部は、所定単位の圧縮デジタル信号の復号に際して、１つまたは複数の隣接する伝送単位に含まれる信号との間の依存関係に基づいて、復号シンボルの生起確率を定めて復号を行うデジタル信号復号装置であることを特徴とする。

特に、上記算術復号部は、復号されたシンボルの出現頻度をカウントすることで上記生起確率を学習するデジタル信号復号装置であることを特徴とする。

また、圧縮符号化されたデジタル信号を所定単位で受信して復号を行うデジタル信号復号装置において、所定単位の圧縮デジタル信号を算術符号化のプロセスに基づいて復号する算術復号部を備え、当該算術復号部は、ある伝送単位の復号開始時に、該伝送単位データの一部として多重化されるシンボル生起確率学習状態を表現する情報に基づいて、該伝送単位の復号に用いる生起確率の初期化を行うとともに、所定単位の圧縮デジタル信号の復号に際して、１つまたは複数の隣接する伝送単位に含まれる信号との間の依存関係に基づいて復号シンボルの生起確率を定めるとともに、復号されるシンボルの出現頻度をカウントすることで上記生起確率を学習し復号を行うデジタル信号復号装置であることを特徴とする。

特に、上記デジタル信号は映像信号であって、上記伝送単位は映像フレーム内の１ないし複数個のマクロブロックから構成されるスライスであるデジタル信号復号装置であることを特徴とする。

また、上記デジタル信号は映像信号であって、上記伝送単位は上記スライス内に含まれる符号化データの種別に応じて再構成される符号化データ単位であるデジタル信号復号装置であることを特徴とする。

また、上記デジタル信号は映像信号であって、上記伝送単位は映像フレームであるデジタル信号復号装置であることを特徴とする。

また、デジタル信号を所定単位に分割して圧縮符号化を行う際のデジタル信号算術符号化方法であって、
所定単位のデジタル信号を算術符号化によって圧縮した際、ある伝送単位の符号化が終了した時点における算術符号化状態を表現する情報を、次の伝送単位のデータの一部として多重化するデジタル信号復号装置であることを特徴とする。

また、デジタル信号を所定単位に分割して圧縮符号化を行う際のデジタル信号算術符号化方法であって、所定単位のデジタル信号を算術符号化によって圧縮した際、所定単位のデジタル信号を、１つまたは複数の隣接する伝送単位に含まれる信号との間の依存関係に基づいて、符号化シンボルの生起確率を定めるとともに、符号化されるシンボルの出現頻度をカウントすることで上記生起確率を学習し、ある伝送単位の符号化が終了した時点における生起確率学習状態を表現する情報を、次の伝送単位データの一部として多重化するデジタル信号算術符号化方法ことを特徴とする。

また、圧縮符号化されたデジタル信号を所定単位で受信して復号を行う際のデジタル信号算術復号方法であって、所定単位の圧縮デジタル信号を算術符号化のプロセスに基づいて復号する際、ある伝送単位の復号開始時に、該伝送単位データの一部として多重化される算術符号化状態を表現する情報に基づいて、復号動作の初期化を行うデジタル信号算術復号方法であることを特徴とする。

また、圧縮符号化されたデジタル信号を所定単位で受信して復号を行う際のデジタル信号算術復号方法であって、所定単位の圧縮デジタル信号を算術符号化のプロセスに基づいて復号する際、ある伝送単位の復号開始時に、該伝送単位データの一部として多重化されるシンボル生起確率学習状態を表現する情報に基づいて、該伝送単位の復号に用いる生起確率の初期化を行うとともに、所定単位の圧縮デジタル信号の復号に際して、１つまたは複数の隣接する伝送単位に含まれる信号との間の依存関係に基づいて復号シンボルの生起確率を定めるとともに、復号されるシンボルの出現頻度をカウントすることで上記生起確率を学習し復号を行うデジタル信号算術復号方法であることを特徴とする。

本発明のディジタル信号符号化装置およびディジタル信号算術符号化方法によれば、所定伝送単位のデジタル信号を算術符号化によって圧縮する際、ある伝送単位の符号化が終了した時点における算術符号化状態を表現する情報を、次の伝送単位のデータの一部として多重化するようにしたり、あるいは１つまたは複数の隣接する伝送単位に含まれる信号との間の依存関係に基づいて、符号化シンボルの生起確率を定めるとともに、符号化されるシンボルの出現頻度をカウントすることで上記生起確率を学習し、ある伝送単位の符号化が終了した時点における生起確率学習状態を表現する情報を、次の伝送単位データの一部として多重化するようにしたので、それ以前の算術符号化状態またはシンボル生起確率学習状態をリセットすることなく引き継いで符号化を継続することができ、誤り耐性を確保しつつ、算術符号化の符号化効率を高めた符号化を実施することが可能となる。

また、本発明のディジタル信号復号装置およびディジタル信号算術復号方法によれば、ある伝送単位の復号開始時に、該伝送単位データの一部として多重化される算術符号化状態を表現する情報に基づいて、復号動作の初期化を行ったり、あるいはある伝送単位の復号開始時に、該伝送単位データの一部として多重化されるシンボル生起確率学習状態を表現する情報に基づいて、該伝送単位の復号に用いる生起確率の初期化を行うとともに、所定伝送単位の圧縮デジタル信号の復号に際して、１つまたは複数の隣接する伝送単位に含まれる信号との間の依存関係に基づいて復号シンボルの生起確率を定めるとともに、復号されるシンボルの出現頻度をカウントすることで上記生起確率を学習し復号を行うので、符号化装置側で前の伝送単位の算術符号化状態またはシンボル生起確率学習状態をリセットすることなく引き継いで符号化をした場合でも、正しく復号することが可能となる。

実施の形態．１
本実施の形態１では、映像フレームを１６×１６画素の矩形領域(以下、マクロブロック)に均等分割した単位で符号化を行う映像符号化方式に算術符号化を適用する例として、D. Marpe他, "Video Compression Using Context-Based Adaptive Arithmetic Coding", International Conference on Image Processing 2001に開示される事例を用いて本発明の説明を行う。

図１に、本実施の形態１における映像符号化装置の構成を示す。
図１において、本実施の形態１の映像符号化装置は、動き検出部２、フレームメモリ３ａ、算術符号化部６、動き補償部７、空間予測部１０ａ、符号化モード判定部１２、直交変換部１５、量子化部１６、逆量子化部１８、逆直交変換部１９、符号化制御部２２、送信バッファ２４、減算器５１、切替部５２、加算器５３を有している。

図２に、本実施の形態１における映像復号装置の構成を示す。
図２において、本実施の形態１の映像復号装置は、フレームメモリ３ｂ、動き補償部７、空間予測部１０ｂ、逆量子化部１８、逆直交変換部１９、算術復号部２７、切替部５４、加算器５５を有している。

これらの図において、算術符号化部６および算術復号部２７の動作が本発明のポイントとなるが、まずこれらの図に基づいて符号化装置ならびに復号装置全体の動作について説明する。

１．符号化装置の動作概要
図１の符号化装置において、入力映像信号１は、個々の映像フレームがマクロブロックに分割された単位で入力されるものとし、まず、動き検出部２において、フレームメモリ３ａに格納される参照画像４を用いてマクロブロック単位に動きベクトル５が検出される。動きベクトル５に基づいて動き補償部７において時間予測画像８が得られ、入力信号１との差分をとることによって時間予測残差信号９が得られる。一方、入力信号１は空間予測部１０aにおいて、同一映像フレーム内の空間的な近傍領域からの予測が行われ、空間予測残差信号１１が生成される。

符号化モード判定部１２では、時間予測残差信号９を符号化する動き予測モード、あるいは、その特殊例として、動きベクトルゼロ、時間予測残差信号成分なしのケースであるスキップモード、空間予測残差信号１１を符号化するイントラモードの中から、当該マクロブロックをもっとも効率よく符号化することができるモードを選択する。

この符号化モード情報１３は符号化対象情報として算術符号化部６に受け渡される。符号化モード情報１３としてイントラモードが選択される場合は、上記空間予測部１０aにおいて用いられたイントラ予測モード１４が符号化対象情報として算術符号化部６に受け渡される。動き予測モードが選択される場合は、動きベクトル５が符号化対象情報として算術符号化部６に受け渡される。

符号化モード判定部１２において選択された符号化対象信号は、直交変換部１５、量子化部１６を経て、直交変換係数データ１７として算術符号化部６へ受け渡される。直交変換係数データ１７は、逆量子化部１８、逆直交変換部１９を経たのち、切替部５２にて符号化モード情報１３に従って空間予測画像２０、すなわち空間予測部１０aの内部で空間予測残差信号１１を生成するために用いられた空間予測画像の候補のうち、空間予測モード１４を用いて生成された予測画像か、時間予測画像８かのいずれかを選択した信号と加算されて局所復号画像２１へ戻される。局所復号画像２１は以降のフレームの動き予測に用いられるため、参照画像データとしてフレームメモリ３ａへ格納される。

量子化部１６では、符号化制御部２２において決定される量子化ステップパラメータ２３によって与えられる粒度で直交変換係数データの量子化を行う。この量子化ステップパラメータ２３を調整することで出力の符号化レートと、品質のバランスとをとることになる。一般には、算術符号化の後、伝送直前の送信バッファ２４に蓄積される符号化データの占有量を一定時間ごとに確認し、その残量２５に応じて量子化ステップパラメータ２３のパラメータ調整が行われる。例えば、バッファ残量が多い場合は、レートを抑え気味に、バッファ残量に余裕がある場合はレートを高めにして品質を向上させるようにする。

算術符号化部６は、後述する手順に従って動きベクトル５、符号化モード情報１３、空間予測モード１４、直交変換係数データ１７などの符号化対象データのエントロピー符号化を行い、送信バッファ２４経由で、映像圧縮データ２６として伝送・記録される。

２．復号装置の動作概要
図２に示した復号装置では、映像圧縮データ２６を受け取ると、算術復号部２７にて後述するエントロピー復号処理が行われて、動きベクトル５、符号化モード情報１３、空間予測モード１４、直交変換係数データ１７、量子化ステップパラメータ２３などが復元される。直交変換係数データ１７、量子化ステップパラメータ２３は、符号化側と同じ逆量子化部１８と逆直交変換部１９によって局所復号される。符号化モード情報１３によって、時間方向の予測か、空間方向の予測かが選択され、時間方向の予測の場合は動き補償部７において復号された動きベクトル５を用いて時間予測画像８を復元する。空間方向の予測が選択される場合は、空間予測部１０bを用いて空間予測画像１１が復元される。ここで、符号化装置側の空間予測部１０aと、復号装置側の空間予測部１０bとの違いは、前者が、とりうるすべての空間予測モードの種別に対して最も効率のよく空間予測モード１４を特定する処理を含むのに対し、後者は与えられた空間予測モード１４から空間予測画像２０を生成する処理のみに限定されることである。

切替部５４では、時間予測画像８か、空間予測画像１１のいずれかが符号化モード情報１３に基づいて予測画像として決定され、これを加算器５５にて逆直交変換部１９の出力である局所復号信号と加算することによって復号画像２１を得る。復号画像２１は以降のフレームの予測画像生成に用いられるため、フレームメモリ３bに格納される。フレームメモリ３ａと３bの違いは符号化装置、復号装置のそれぞれに搭載されるものという区別を単に意味するだけである。

３．算術符号化・復号処理
以下、本発明のポイントである算術符号化および復号処理について詳細に説明する。符号化処理は、図１の算術符号化部６において行われ、復号処理は図２の算術復号部２７において行われる。

図３に、算術符号化部６の内部構成を示す。
図３において、本実施の形態１における算術符号化部６は、符号化対象データである動きベクトル５、符号化モード情報１３、空間予測モード１４、直交変換係数データ１７などの個々のデータタイプに対して定義されるコンテクストモデル(後述)を定めるコンテクストモデル決定部２８、各符号化対象データタイプについて定められる二値化規則に従って多値データを二値データに変換する二値化部２９、二値化後の個々の二値化系列binの値(0 or 1)の生起確率を与える生起確率生成部３０、生成された生起確率に基づいて算術符号化を実行する符号化部３１、算術符号化を中断するタイミングを通知するとともにそのタイミングで伝送単位となるデータを構成する伝送単位生成部３５、とを有している。

図４に、図３に示す算術符号化部６の動作フローを示す。
図４を参照して、図３に示す算術符号化部６の動作を詳細に説明する。

1) コンテクストモデル決定処理(ステップS1)
コンテクストモデルとは、情報源（符号化）シンボルの生起確率の変動要因となる他の情報との依存関係をモデル化したものであり、この依存関係に対応して生起確率の状態を切り替えることで、よりシンボルの実際の生起確率に適応した符号化を行うことが可能となる。

図５にコンテクストモデル(ctx)の概念を示す。なお、同図では情報源シンボルは二値とした。同図の0〜2というctxの選択肢は、このctxを用いる情報源シンボルの生起確率の状態が、状況に応じて変化するであろうことを想定して定義されている。本実施の形態１における映像符号化で言えば、あるマクロブロックにおける符号化データと、その周辺のマクロブロックの符号化データとの間の依存関係に応じてctxの値が切り替えられる。

図６に、例えば、D. Marpe他, "Video Compression Using Context-Based Adaptive Arithmetic Coding", International Conference on Image Processing 2001に開示されるマクロブロックの動きベクトルに関するコンテクストモデルの例を示す。同図において、ブロックCの動きベクトルが符号化対象で、正確には、ブロックCの動きベクトルを近傍から予測した予測差分値mvd_k(C)が符号化される。ctx_mvd(C,k)がコンテクストモデルを示す。mvd_k(A)はブロックAにおける動きベクトル予測差分値、mvd_k(B)はブロックBにおける動きベクトル予測差分値をそれぞれ示し、コンテクストモデルの切り替え評価値e_k(C)の定義に用いられる。評価値e_k(C)は、近傍の動きベクトルのばらつき具合を示すことになり、一般的にはこのばらつきが小さい場合にはmvd_k(C)は小さく、逆にe_k(C)が大きい場合はmvd_k(C)も大きくなる傾向がある。したがって、mvd_k(C)のシンボル生起確率は、e_k(C)に基づいて適応化されることが望ましい。この生起確率のバリエーションセットがコンテクストモデルであり、このケースでは３種類の生起確率バリエーションがある、といえる。

この他、符号化モード情報１３、空間予測モード１４、直交変換係数データ１７などの符号化対象データそれぞれについてあらかじめコンテクストモデルが定義され、符号化装置の算術符号化部６と、復号装置の算術復号部２７とで共有される。図３に示す算術符号化部６のコンテクストモデル決定部２８では、このような符号化対象データの種別に基づいてあらかじめ定められたモデルを選択する処理を行う。なお、コンテクストモデルの中のどの生起確率バリエーションを選択するかは下記3)の生起確率生成処理に該当するので、そこで説明する。

2) 二値化処理(ステップS2)
コンテクストモデルは、符号化対象データを二値化部２９にて二値系列化し、二値系列の各bin(バイナリ位置)に応じて定められる。二値化の規則は、各符号化データの取りうる値のおおまかな分布に従い、可変長の二値系列への変換を行う。二値化は、本来多値を取りうる符号化対象データをそのまま算術符号化するよりもbin単位で符号化することにより確率数直線分割数を削減でき演算を簡略化できる、コンテクストモデルのスリム化が可能になるなどのメリットがある。

3) 生起確率生成処理(ステップS3)
上記1), 2)のプロセスで、多値の符号化対象データの二値化と、各binに適用するコンテクストモデルの設定が完了し、符号化準備が整う。各コンテクストモデルには、0/1の各値に対する生起確率のバリエーションが含まれているので、図４に示すように、生起確率生成部３０は、ステップS1で決定されたコンテクストモデルを参照して各binにおける0/1生起確率の生成処理を行う。

図６に、生起確率選択のための評価値e_k(C)の一例を示す。生起確率生成部３０は、図６のe_k(C)に示したような生起確率選択のための評価値を定め、これに従って、参照するコンテクストモデルの選択肢の中からどの生起確率バリエーションを現在の符号化に用いるかを決定する。

4) 符号化処理(ステップS3〜S7)
3)によって、算術符号化プロセスに必要な確率数直線上の0/1各値の生起確率が得られるため、従来例にあげたプロセスにしたがって符号化部３１において算術符号化を行う(ステップS4)。また、実際の符号化値(0 or 1)３２は、生起確率生成部３０へフィードバックされ、使用したコンテクストモデルの生起確率バリエーション部分の更新のため、0/1発生頻度のカウントが行われる(ステップS5)。例えば、ある特定のコンテクストモデル内の生起確率バリエーションを用いて100個のbinの符号化処理が行われた時点で、当該生起確率バリエーションにおける0/1の生起確率がそれぞれ0.25, 0.75であったとする。ここで、同じ生起確率バリエーションを用いて1が符号化されると、1の出現頻度が更新され、0/1の生起確率は0.247、0.752に変化する。このメカニズムにより、実際の生起確率に適応した効率的な符号化を行うことが可能となる。

また、符号化部３１にて新たに生成される符号化値(0 or 1)３２の算術符号３３は、伝送単位生成部３５へ送られ、下記6)に述べるように、伝送単位を構成するデータとして多重される(ステップS6)。また、１つの符号化対象データの二値系列bin全体に対して符号化処理を終了したか否かを判断し(ステップS7)、終了していなければ(ステップS7“Ｎ”)、ステップS3に戻り各binにおける生起確率の生成処理以降の処理を行う一方、終了していれば(ステップS7“Ｙ”)、さらに次に説明する伝送単位生成処理へ移行する。

5) 伝送単位生成処理(ステップS8〜S9)
算術符号化は、複数の符号化対象データの系列を１つの符号語へ変換するが、映像信号はフレーム間での動き予測を行ったり、フレーム単位での表示を行ったりするため、フレームを単位として復号画像を生成してフレームメモリ内部の更新を行う必要がある。したがって、算術符号化された圧縮データ上でフレームという単位の切れ目を明確に判断できる必要がある。さらに、音声・オーディオなどの他のメディアとの多重や、パケット伝送などの目的から、フレーム内のさらに細かい単位で圧縮データを区切って伝送する必要もある。この例としては、一般にスライス構造、すなわち複数のマクロブロックをラスタスキャン順にグルーピングした単位が挙げられる。

図７にスライス構造の例を示す。点線で囲まれる矩形がマクロブロックに該当する。一般にスライス構造は、復号時の再同期の単位として扱われる。端的な例として、スライスデータをそのままIP伝送用のパケットペイロードにマップすることがある。映像など伝送遅延があまり許容されないリアルタイムメディアのIP伝送には、RTP(Realtime Transport Protocol)が用いられることが多い。RTPパケットはヘッダ部分にタイムスタンプが付与され、ペイロード部分に映像のスライスデータがマッピングされて伝送されることが多い。例えば、Kikuchi他、"RTP Payload Format for MPEG-4 Audio/Visual Streams", RFC 3016では、MPEG-4映像圧縮データをMPEG-4のスライス(ビデオパケット)の単位でRTPペイロードにマップする方法が規定されている。RTPはUDPパケットとして伝送されるため、一般に再送制御がなく、パケットロスが発生した場合にはスライスデータがまるまる復号装置へ届かないことがある。もしも、そのあとのスライスデータがこの廃棄されたスライスの情報に依存した符号化を行っているならば、それが仮に正常に復号装置に届いたとしても正常復号することができなくなる。このため、任意のスライスはその先頭から何の依存関係にもとらわれずに正常に復号を行えるようにする必要がある。例えば、一般に、Slice5の符号化を行うにあたって、その上部に位置するSlice3や左に位置するSlice4のマクロブロック群の情報を利用した符号化を行うようにはしない。

一方で、算術符号化の効率を向上させるには、周辺の状況に基づいてシンボルの生起確率を適応させたり、確率数直線の分割過程を保持しつづけることが望ましい。例えば、Slice5をSlice4とまったく独立に符号化するには、Slice4の最終マクロブロックの算術符号化が終了した時点での確率数直線分割状況、すなわち、算術符号化における符号語を表現するレジスタ値を保持することができず、Slice5ではレジスタを初期状態にリセットしたのち符号化を再開することになる。これにより、Slice4の末尾とSlice5の先頭との間に存在する相関が利用できず、符号化効率の低下を招くことがある。つまり、符号化効率の低下を犠牲にして、伝送誤りなどに起因するスライスデータの予期せぬロスに対する耐性を向上させるように設計するのが一般的である。

本発明に係る実施の形態１の伝送単位生成部３５では、この設計の適応性を向上させる方法ならびに装置を提供する。すなわち、伝送誤りなどによるスライスデータのロスの確率が極めて低いケースでは、算術符号化に関わるスライス間の依存関係を常時断ち切ることをせず、積極的に利用できるようにする。一方、スライスデータのロスの可能性が高い場合には、スライス間の依存関係を断ち切ることができるようにして、伝送単位での符号化効率を適応的に制御できるようにする。

つまり、本実施の形態１における伝送単位生成部３５では、符号化装置内部の制御信号として、伝送単位を区切るタイミングを伝送単位指示信号３６を受け取り、この伝送単位指示信号３６が入力するタイミングに基づいて、符号化部３１から入力される算術符号３３の符号語を区切って伝送単位のデータを生成する。

具体的には、本実施の形態１における伝送単位生成部３５は、符号化値３２の算術符号３３を逐次、伝送単位構成ビットとして多重していく(ステップS6)とともに、伝送単位内に含まれうるマクロブロックの分だけデータの符号化が終了したか否かを、上記伝送単位指示信号３６によって判断し(ステップS8)、伝送単位内のすべての符号化が終了していないと判断した場合には(ステップS8"Ｎ")、ステップS1へ戻りコンテクストモデル決定以降の処理を行う。

これに対し、伝送単位内のすべての符号化が終了したと判断した場合(ステップS8"Ｙ")、伝送単位生成部３５は、次の伝送単位データのヘッダ情報として以下の２つの情報を付加する(ステップS9)。

１．次の伝送単位において、確率数直線分割状況、すなわち符号語表現のため算術符号化過程を示すレジスタ値をリセットするか否かを示す“レジスタリセットフラグ”。尚、最初に生成される伝送単位では、このレジスタリセットフラグは、常に「リセットを行う」ことを指示するように設定される。

２．上記１．のレジスタリセットフラグが「リセットを行わない」ことを示す場合にのみ、次の伝送単位の算術符号化および復号の開始時に用いるレジスタ値として用いるべき、その時点でのレジスタ値である“初期レジスタ値”。なお、この初期レジスタ値は、図３に示すように、符号化部３１から伝送単位生成部３５へ入力される初期レジスタ値３４である。

図８に、スライス構造の映像圧縮データであるスライス映像圧縮データのビットストリームシンタックスを示す。
図８に示すように、スライス映像圧縮データ毎に、各スライス映像圧縮データのヘッダであるスライスヘッダデータには、スライス開始コードの他、上記１．のレジスタリセットフラグと、上記１．のレジスタリセットフラグが「リセットを行わない」ことを示す場合にのみ多重する初期レジスタ値とが設けられている。

以上２つの付加情報によれば、直前のスライスがロスした場合であっても、自身のスライスヘッダデータに含まれるレジスタリセットフラグと、初期レジスタ値とのレジスタ初期化のための値を用いることによって、スライス間であっても算術符号語の連続性を保った符号化を行うことができ、符号化効率を保つことが可能となる。

なお、図８ではスライスヘッダデータと、スライス映像圧縮データとが同一ストリーム上に多重されているが、図９に示すように、スライスヘッダデータは別のストリームの形でオフラインで伝送され、スライス映像圧縮データには、対応するスライスヘッダデータのID情報をつけるように構成してもよい。同図では、ストリームをIPプロトコルにしたがって伝送する例を示しており、ヘッダデータ部分を信頼性の高いTCP/IPで伝送し、映像圧縮データ部分を低遅延のRTP/UDP/IPで伝送する例を示している。図９の構成に従うヘッダ、伝送単位の分離伝送形式によれば、RTP/UDP/IPで伝送するデータは必ずしもスライスというデータ単位に分割されていなくてもよい。スライスでは、基本的にはそのスライスで単独に復号を再開できるように、近傍領域の映像信号との依存関係(コンテクストモデル)をすべてリセットする必要があるが、これは映像符号化効率の低下を招く。この図１１に示すように、初期レジスタ状態をTCP/IPで伝送することができれば、映像信号自体はフレーム内のあらゆるコンテクストモデルを利用しながら符号化を行い、RTPパケット化を行う段階で算術符号化されたデータを分割して伝送すればよい。従って、この仕組みによれば、算術符号化処理過程は回線の状況によらず安定的に獲得することができるので、スライス構造に制約されない符号化を行ったビットストリームを、高い誤り耐性を保って伝送することが可能である。

この他、図１０に示すように、レジスタリセットフラグならびに初期レジスタ値のシンタックスを使用するかどうかを、より上位のレイヤで示すように構成してもよい。図１０では、複数の映像フレームから構成される映像シーケンスの単位で付与されるヘッダ情報に、レジスタリセットフラグならびに初期レジスタ値のシンタックスを使用するかどうかを示すレジスタリセット制御フラグを多重した例を示している。例えば、回線の品質が悪く、映像シーケンスを通じてレジスタリセットを行うほうが安定した映像伝送が可能であると判断する場合、レジスタリセット制御フラグを「映像シーケンスを通じて、常にスライスの先頭ではレジスタはリセットする」ことを示す値にセットする。このとき、スライスの単位での多重化対象となるレジスタリセットフラグや初期レジスタ値についてはスライスレベルでの多重は必要なくなる。これによって、ある特定の伝送条件(回線の誤り率など)が継続するような場合は、映像シーケンスの単位でレジスタリセットの制御を行うようにすれば、スライスの単位で伝送するオーバヘッド情報を低減することができる。もちろん、レジスタリセット制御フラグは第Nフレーム、第N+1フレームなどで示される、映像シーケンス中の任意の映像フレームのヘッダ情報に付与してもよい。

図１１に、算術復号部２７の内部構成を示す。この実施の形態１の復号装置の算術復号部２７は、受信した伝送単位ごとに、そのヘッダに含まれる算術符号化過程に関する付加情報に基づいて、算術復号処理の初期化を行う伝送単位復号初期化部３７、算術復号の過程に基づいて、動きベクトル５、符号化モード情報１３、空間予測モード１４、直交変換係数データ１７などの復号対象データのタイプを特定して、それぞれに符号化装置と共通定義されるコンテクストモデルを定めるコンテクストモデル決定部２８、復号対象データのタイプに基づいて定まる二値化規則を生成する二値化部２９、二値化規則とコンテクストモデルに従って、個々のbin(0 or 1)の生起確率を与える生起確率生成部３０、生成された生起確率に基づいて算術復号を実行し、その結果得られる二値系列と、上記二値化規則とから、動きベクトル５、符号化モード情報１３、空間予測モード１４、直交変換係数データ１７などのデータを復号する復号部３８、とを有している。

図１２に、図１１に示す算術復号部２７の動作フローを示す。
図１２を参照して、図１１に示す算術復号部２７の動作を詳細に説明する。

6) 伝送単位復号初期化処理（S10）
図８に示したように、スライスなどの伝送単位ごとに多重される、算術符号化過程を示すレジスタ値のリセットの有無を示すレジスタリセットフラグと、ならびに初期レジスタ値３４とに基づいて、復号部３８における算術復号開始状態の初期化を行う(ステップS10)。レジスタ値をリセットする場合は、初期レジスタ値３４は使用されない。

7) コンテクストモデル決定処理、二値化処理、生起確率生成処理
これらのプロセスは、それぞれ、図１１に示すコンテクストモデル決定部２８、二値化部２９、生起確率生成部３０によって行われるが、符号化装置側のプロセス1)〜3)にて示すコンテクストモデル決定処理S1、二値化処理S2、生起確率生成処理S3と同様なので、それぞれ同じステップ番号を付して、これらの説明は省略するものとする。

8) 算術復号処理（S11）
これから復号しようとするbinの生起確率が7)までのプロセスで確定するため、復号部３８において、従来例に示した算術復号処理のプロセスにしたがって、binの値を復元すると共に(ステップS11)、符号化装置側の処理と同様に0/1発生頻度をカウントしてbinの生起確率を更新し(ステップS5)、二値化規則で定められる二値系列パターンと比較することにより復号したbinの値が確定したか否かを判断する(ステップS12)。二値化規則で定められる二値系列パターンと比較して復号したbinの値が確定しなければ(ステップS12"N")、再度、ステップS3の各binにおける0/1生起確率生成処理以降の処理を行う(ステップS3,S11,S5,S12)。その一方、二値化規則で定められる二値系列パターンとの合致の確認により復号した各binの値が確定した場合には(ステップS12"Y")、合致したパターンが指し示すデータ値を復号データ値として出力し、スライスなどの伝送単位全てについて復号完了していなければ(ステップS13"N")、伝送単位すべてについて復号するため、ステップS1のコンテクストモデル決定処理以降の処理を繰り返し行うようにする。

以上の本実施の形態１による算術符号化ならびに算術復号処理を備えた映像符号化・復号装置によれば、スライスなどの細かい伝送単位に区切って映像圧縮データを伝送する際も、スライスヘッダデータとして算術符号化過程を示すレジスタ値のリセットの有無を示すレジスタリセットフラグと、ならびに初期レジスタ値３４とを付加するようにしたので、算術符号化の符号化プロセスの連続性を断ち切ることなく符号化を行うことが可能となり、伝送誤りへの耐性を高めながら符号化効率を保つことが可能となると共に、その復号が可能となる。

なお、本実施の形態１では、伝送単位としてスライス構造を想定しているが、映像フレームを伝送単位としても本発明を適用可能である。

実施の形態２．
本実施の形態２では、算術符号化部６および算術復号部２７の別の形態について述べる。本実施の形態２では、算術符号化過程の符号語の状態を表すレジスタ値だけでなく、コンテクストモデル内の生起確率バリエーションに対する学習状態、すなわち生起確率生成部３０におけるbinの生起確率更新処理によるコンテクストモデル内の生起確率バリエーションに対する学習状態も、スライスヘッダに多重することを特徴とする。

つまり、例えば実施の形態１で説明した図６において、例えばブロックCの算術符号化の効率を向上させるためには、このブロックCの例えば上部に位置するブロックBの動きベクトルの情報を生起確率バリエーション決定のために使用する。したがって、もし、ブロックCとブロックBが異なるスライスに位置付けられるとすれば、ブロックBの情報を生起確率決定プロセスで使用することを禁ずる必要がある。このことは、コンテクストモデルによる生起確率適応化による符号化効率が低下することを意味する。そこで、本実施の形態２では、この設計の適応性を向上させる方法ならびに装置を提供するもので、伝送誤りなどによるスライスデータのロスの確率が極めて低いケースでは、算術符号化に関わるスライス間の依存関係を常時断ち切ることをせず、積極的に利用できるようにする一方、スライスデータのロスの可能性が高い場合には、スライス間の依存関係を断ち切ることができるようにして、伝送単位での符号化効率を適応的に制御できるようにするものである。

図１３に、本実施の形態２における算術符号化部６の内部構成を示す。本実施の形態２における算術符号化部６が、図３に示す実施の形態１の算術符号化部６と異なるのは、生起確率生成部３０が、スライスヘッダへの多重化の対象とされるコンテクストモデルの状態３９を伝送単位生成部３５へ受け渡す点だけである。

図１４に、本実施の形態２における算術符号化部６の動作フローを示す。図４に示す実施の形態１の算術符号化部６の動作フローと比較すると明らかだが、それと異なる点は、ステップS3の各binにおける0/1生起確率生成処理におけるコンテクストモデル状態３９、すなわち生起確率生成部３０におけるbinの生起確率更新処理によるコンテクストモデル内の生起確率バリエーションに対する学習状態３９も、ステップS4のバイナリ算術符号化処理におけるレジスタ値と同様に、ステップS9の伝送単位生成部３５における次伝送単位のヘッダ構成処理においてスライスヘッダに多重する点だけである。

図１５により、コンテクストモデルの状態３９の意味について説明する。
図１５は、k番目の伝送単位内にn個のマクロブロックがある場合で、各マクロブロックに対して1度だけ使用されるコンテクストモデルctxが定義されており、各マクロブロック対してctxの生起確率が変動する様子を示している。コンテクストモデルの状態３９が次の伝送単位へ引き継がれるという意味は、この図１５に示すように、k番目の伝送単位の最終状態ctx^k(n-1)がk+1番目の伝送単位におけるctxの初期状態、すなわちctx^k+1(n-1)=0,1,2における値0,1の生起確率po,p1をctx^k(n-1)=0,1,2における値0,1の生起確率po,pと等しくすることを意味する。このために、伝送単位生成部３５において、ctx^k(n-1)の状態を示すデータが、k+1番目の伝送単位におけるヘッダ情報の一部として伝送されるように構成する。

図１６に、本実施の形態２のビットストリームシンタックスの一例を示す。同図に示すように、本実施の形態２では、スライス映像圧縮データ毎のスライスヘッダデータに、図８に示す実施の形態１と同様のスライス開始コード、レジスタリセットフラグ、初期レジスタ値に加えて、直前のスライスのコンテクストモデル状態を示す情報を付加するようにしている。ただし、本実施の形態２では、レジスタリセットフラグを、初期レジスタ値の多重化有無だけでなく、コンテクストモデル状態データの多重化有無の意味も含ませるようにしてい。尚、コンテクストモデル状態データの多重化有無を示す情報としては、ジスタリセットフラグではなく、別のフラグをもうけるように構成しても勿論よい。また、実施の形態１でも説明したが、同図では、スライスヘッダデータと、スライス映像圧縮データとが同一ストリーム上に多重されているが、スライスヘッダは別のストリームの形でオフラインで伝送され、圧縮データには、対応するスライスヘッダデータのID情報をつけるように構成してもよい。

図１７に、本実施の形態２における算術復号部２７の内部構成を示す。この図１７に示す本実施の形態２における算術復号部７が、図１１に示す実施の形態１の算術復号部２７と異なるのは、伝送単位復号初期化部３７が、スライスヘッダに多重化される、直前スライスのコンテクストモデルの状態３９を生起確率生成部３０へ受け渡し、コンテクストモデルの状態を直前のスライスから引き継ぐ構成となっている点だけである。

図１８に、本実施の形態２における算術復号部２７の動作フローを示す。図１２に示す実施の形態１の算術復号部２７の動作フローと比較すると明らかだが、それと異なる点は、ステップS10の各伝送単位復号初期化処理においてスライスヘッダから復号したコンテクストモデル状態３９が、ステップS3の処理、すなわちステップS1で決定されたコンテクストモデルを参照して各binにおける0/1生起確率の生成処理を行う処理へ出力されて、生起確率生成部３０における0/1生起確率の生成処理に用いられる点である。

なお、スライスヘッダで受け渡すコンテクストモデルの状態については、コンテクストモデルの数が極めて多い場合にはスライスヘッダのオーバヘッドになるため、符号化効率への寄与が著しいコンテクストモデルを選択して、その状態を多重化するように構成してもよい。例えば、動きベクトルや直交変換係数データは、全符号量中に占める割合が多いので、これらのコンテクストモデルについてだけ状態を引き継ぐように構成する、などが考えられる。また、状態を引き継ぐコンテクストモデルの種別を明示的にビットストリームに多重するように構成し、映像の局所的な状況に応じて重要なコンテクストモデルについてのみ選択的に状態引継ぎを行うようにしてもよい。

以上の構成による本実施の形態2による映像符号化装置・復号装置によれば、細かい伝送単位に区切って映像圧縮データを伝送する際、スライスヘッダデータとして算術符号化過程を示すレジスタ値のリセットの有無を示すレジスタリセットフラグと、初期レジスタ値３４と、直前スライスのコンテクストモデル状態を示す情報を付加するようにしたので、算術符号化の符号化プロセスの連続性を断ち切ることなく符号化を行うことが可能となり、伝送誤りへの耐性を高めながら符号化効率を保つことが可能となる。なお、本実施の形態では、伝送単位としてスライス構造を想定しているが、映像フレームを伝送単位としても本発明を適用可能である。

特に、本実施の形態２では、直前スライスのコンテクストモデル状態を示す情報を付加しているので、例えば図６においてブロックCと、このブロックC直前のブロックBとが異なるスライスに位置付けられたとしても、ブロックCの生起確率決定プロセスにてブロックBのコンテクストモデル状態を利用して、コンテクストモデルによる生起確率適応化による符号化効率を向上させることができる。つまり、伝送誤りなどにより、スライスデータのロスの確率が極めて低いケースでは、算術符号化に関わるスライス間の依存関係を常時断ち切ることをせず、直前スライスのコンテクストモデル状態までも積極的に利用できるようにする一方、スライスデータのロスの可能性が高い場合には、直前スライスのコンテクストモデル状態は利用せずに、スライス間の依存関係を断ち切ることができるようにして、伝送単位での符号化効率を適応的に制御できることになる。

なお、本実施の形態２の場合、図１６に示すビットストリームシンタックスのように、スライスデータ毎に、実施の形態１のレジスタリセットフラグおよび初期レジスタ値の付加と並列に、直前スライスの各データのコンテクストモデル状態を示す情報をスライスヘッダデータとして付加するように説明したが、実施の形態１のレジスタリセットフラグおよび初期レジスタ値は付加せずに省略して、直前スライスの各データのコンテクストモデル状態を示す情報のみをスライスヘッダデータとして付加するようにしても良いし、また、実施の形態１のレジスタリセットフラグおよび初期レジスタ値の付加と並列に設けるか否かに関わらず、コンテクストモデル状態リセットフラグ（図１９参照）を設けるようにして、このコンテクストモデル状態リセットフラグがオフ、すなわちリセットを行わない場合のみ直前スライスの各データのコンテクストモデル状態を示す情報を付加して復号時に利用させるようにしても勿論良い。

実施の形態３．
本実施の形態３では、伝送単位を、符号化されるデータのタイプ別にグルーピングするデータパーティショニング形式で構成する例について述べる。例えば、Joint Video Team (JVT) of ISO/IEC MPEG and ITU-T VCEG において検討される映像符号化方式仕様ドラフトWorking Draft Number 2, Revision 3, JVT-B118r3に開示されるデータパーティショニングを例にとると、図７に示すようなスライス構造を単位として、その内部に存在するマクロブロック数分だけ、特定のタイプのデータをグルーピングして構成されるデータ単位をスライスデータの形で伝送する方式が示されている。グルーピングして構成されるデータ単位であるスライスデータのデータタイプとして、例えば、以下に示す0〜7のデータタイプがある。

0 TYPE_HEADER ピクチャ(フレーム)またはスライスヘッダ
1 TYPE_MBHEADER マクロブロックヘッダ情報(符号化モード情報など)
2 TYPE_MVD 動きベクトル
3 TYPE_CBP CBP(マクロブロック内の有効直交変換係数分布)
4 TYPE_2x2DC 直交変換係数データ(1)
5 TYPE_COEFF_Y 直交変換係数データ(2)
6 TYPE_COEFF_C 直交変換係数データ(3)
7 TYPE_EOS ストリーム終了識別情報

例えば、データタイプ2のTYPE_MVDのスライスでは、その内部のマクロブロック数分、動きベクトル情報だけを集めたデータをスライスデータとして伝送する。したがって、第k番目のスライスのTYPE_MVDのデータに続いて、第k+1番目のスライスのTYPE_MVDデータを復号する場合には、第k番目のスライス末尾における動きベクトルに関するコンテクストモデルの状態だけを、第k+1番目のスライスのTYPE_MVDデータを送るためのスライスのヘッダに多重しておけば、動きベクトルの算術符号化のためのコンテクストモデル学習状態を引き継ぐことが可能である。

図１９に、本実施の形態３におけるデータタイプ別にグルーピングした場合のビットストリームシンタックスの一例を示す。図１９では、例えば、データタイプ2のTYPE_MVDのスライスの場合である動きベクトルをスライスデータとして多重する場合には、そのスライスヘッダ中に、スライス開始コードや、TYPE_MVDを示すデータタイプID、コンテクストモデル状態リセットフラグおよび直前スライスの動きベクトル用コンテクストモデル状態を示す情報を付加する。

また、例えば、データタイプ5のTYPE_COEFF_Yの直交変換係数データ(2)の直交変換係数データ(2)のみをスライスデータとして多重する場合には、そのスライスヘッダ中に、スライス開始コードや、TYPE_COEFF_Yを示すデータタイプID、コンテクストモデル状態リセットフラグおよび直前スライスの直交変換係数データ用コンテクストモデル状態を示す情報を付加するようにする。なお、同図ではスライスヘッダデータと圧縮データとが同一ストリーム上に多重されているが、スライスヘッダは別のストリームの形でオフラインで伝送され、圧縮データには、対応するスライスヘッダデータのID情報をつけるように構成してもよい。

また、本実施の形態３における算術符号化部６は、図１３の構成において、伝送単位生成部３５が上記データパーティショニングの規則にしたがってスライス内のマクロブロックデータの再構成を行い、各データタイプの種別を表すID情報と、各データタイプに対応するコンテクストモデルの学習状態を多重するように構成すればよい。また、本実施の形態における算術復号部２７は、図１７の構成において、伝送単位復号初期化部３７が、スライスヘッダに多重されるデータタイプ種別IDをコンテクストモデル決定部２８へ通知することで使用するコンテクストモデルを決定し、かつコンテクストモデル学習状態を生起確率生成部３０へ通知することでコンテクストモデルの学習状態３９をスライス間で引き継いで算術復号を行うように構成すればよい。

以上の実施の形態３に述べた映像符号化装置および映像復号装置によれば、映像信号を所定のデータタイプでグループ化した伝送単位に分割して圧縮符号化を行う場合でも、当該伝送単位に属する映像信号を算術符号化する際に、それ以前の所定のデータタイプでグループ化した伝送単位におけるシンボル生起確率学習状態をリセットすることなく引き継いで符号化を継続するようにしたので、所定のデータタイプでグループ化した場合でも、誤り耐性を確保しつつ、算術符号化の符号化効率を高めた符号化を実施することが可能となる。

なお、本実施の形態３では、伝送単位としてスライス構造ごとのデータタイプ種別を想定しているが、映像フレーム単位でのデータタイプ種別ごとの伝送を想定しても本発明を適用可能である。

また、図１９に示す本実施の形態３のビットストリームシンタックスの一例の場合、データタイプ毎のスライスデータ毎に、コンテクストモデル状態リセットフラグ、およびそのフラグがオフの場合の直前スライスの各データのコンテクストモデル状態を示す情報をスライスヘッダデータとして付加するように説明したが、図１６に示す実施の形態２のビットストリームシンタックスの一例の場合と同様に、各データタイプのスライスデータ毎に、レジスタリセットフラグおよび初期レジスタ値の付加と並列に、コンテクストモデル状態リセットフラグ、およびそのフラグがオフの場合の直前スライスの各データのコンテクストモデル状態を示す情報をスライスヘッダデータとして付加しても良いしまた、レジスタリセットフラグおよび初期レジスタ値の付加と並列に設けるか否かに関わらず、コンテクストモデル状態リセットフラグを省略して、常に直前スライスの各データのコンテクストモデル状態を示す情報を付加して復号時に利用させるようにしても勿論良い。

また、以上の実施の形態１〜３では、ディジタル信号として、映像データを一例に説明したが、本発明では、これに限らず、映像データのディジタル信号だけでなく、音声のディジタル信号や、静止画のディジタル信号、さらにはテキストのディジタル信号や、これらを任意に組み合わせたマルチメディアデータのディジタル信号にも適用可能である。

また、以上の実施の形態１，２では、ディジタル信号の伝送単位としてスライス、実施の形態３では、スライス内でデータのタイプ別にパーティショニングしたデータタイプ等の所定伝送単位を一例に説明したが、本発明では、これに限らず複数のスライスが集まって構成される１画像（ピクチャ）、すなわち１映像フレームを単位を所定伝送単位とするようにしても良いし、また通信以外の蓄積系などへの使用を想定して、所定の伝送単位ではなく、所定の蓄積単位でも勿論よい。

実施の形態１における映像符号化装置の構成を示した図面である。実施の形態１における映像復号装置の構成を示した図面である。図１における算術符号化部６の内部構成を示した図面である。図３の算術符号化部６の動作フローを説明する図面である。コンテクストモデルの概念を説明する図面である。実施の形態１における動きベクトル用コンテクストモデルの例を示す図面である。スライス構造を説明する図面である。実施の形態１の算術符号化部６によって生成されるビットストリームの例を示す図面である。実施の形態１の算術符号化部６によって生成される他のビットストリームの例を示す図面である。実施の形態１の算術符号化部６によって生成されるさらに他のビットストリームの例を示す図面である。実施の形態１における算術復号部２７の内部構成を示した図面である。図１１の算術復号部２７の動作フローを説明する図面である。実施の形態２における算術符号化部６の内部構成を示した図面である。図１３の算術符号化部６の動作フローを説明する図面である。コンテクストモデルの学習状態を説明する図面である。実施の形態２の算術符号化部６によって生成されるビットストリームの例を示す図面である。実施の形態２における算術復号部２７の内部構成を示した図面である。図１７の算術復号部２７の動作フローを説明する図面である。実施の形態３の算術符号化部６によって生成されるビットストリームの例を示す図面である。 "BILL GATES"という文字を算術符号化した場合の個々の文字の生起確率を示す図面である。 "BILL GATES"という文字を算術符号化した場合の算術符号化結果を示す図面である。

符号の説明

２動き検出部、３ａ，３ｂフレームメモリ、６算術符号化部、７動き補償部、１０ａ，１０ｂ空間予測部、１２符号化モード判定部、１５直交変換部、１６量子化部、１８逆量子化部、１９逆直交変換部、２２符号化制御部、２４送信バッファ、５１減算器、５２切替部、５３加算器、切替部５４、加算器５５。

Claims

圧縮符号化されたデジタル信号を所定単位で受信して復号を行うデジタル信号復号装置において、
前記所定単位の圧縮デジタル信号を、複数のコンテクストモデルの中から復号対象データのタイプごとに使用するコンテクストモデルを定めて算術符号化のプロセスに基づいて復号する算術復号部を備え、
当該算術復号部は、ある所定単位のデータの一部として多重化され、上記復号対象データのタイプに対応づけられたコンテクストモデルの生起確率の初期状態を表す情報に基づいて、コンテクストモデルの生起確率状態の初期化を行い、算術復号過程を示すレジスタ値の初期化情報を復号し、該レジスタ値の初期化情報に基づいてレジスタ値の初期化を行い、前記初期化された生起確率状態と前記初期化されたレジスタ値から前記所定単位データの復号を行うことを特徴とするデジタル信号復号装置。
圧縮符号化されたデジタル信号を所定単位で受信して復号を行うデジタル信号算術復号方法であって、
前記所定単位の圧縮デジタル信号を、複数のコンテクストモデルの中から復号対象データのタイプごとに使用するコンテクストモデルを定めて算術符号化のプロセスに基づいて復号するとともに、
ある所定単位のデータの一部として多重化され、上記復号対象データのタイプに対応づけられたコンテクストモデルの生起確率の初期状態を表す情報に基づいて、コンテクストモデルの生起確率状態の初期化を行い、算術復号過程を示すレジスタ値の初期化情報を復号し、該レジスタ値の初期化情報に基づいてレジスタ値の初期化を行い、前記初期化された生起確率状態と前記初期化されたレジスタ値から前記所定単位データの復号を行うことを特徴とするデジタル信号算術復号方法。