JP4211780B2 - デジタル信号符号化装置、デジタル信号復号装置、デジタル信号算術符号化方法、およびデジタル信号算術復号方法 - Google Patents

デジタル信号符号化装置、デジタル信号復号装置、デジタル信号算術符号化方法、およびデジタル信号算術復号方法 Download PDF

Info

Publication number
JP4211780B2
JP4211780B2 JP2005374008A JP2005374008A JP4211780B2 JP 4211780 B2 JP4211780 B2 JP 4211780B2 JP 2005374008 A JP2005374008 A JP 2005374008A JP 2005374008 A JP2005374008 A JP 2005374008A JP 4211780 B2 JP4211780 B2 JP 4211780B2
Authority
JP
Japan
Prior art keywords
data
unit
digital signal
encoding
arithmetic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP2005374008A
Other languages
English (en)
Other versions
JP2006180521A (ja
Inventor
俊一 関口
悦久 山田
光太郎 浅井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP2005374008A priority Critical patent/JP4211780B2/ja
Publication of JP2006180521A publication Critical patent/JP2006180521A/ja
Application granted granted Critical
Publication of JP4211780B2 publication Critical patent/JP4211780B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

本発明は、映像圧縮符号化技術や圧縮映像データ伝送技術等に用いられるデジタル信号符号化装置、デジタル信号復号装置、デジタル信号算術符号化方法、およびデジタル信号算術復号方法に関する。
従来、MPEGやITU-T H.26xなどの国際標準映像符号化方式では、エントロピー符号化としてハフマン符号化が採用されている。ハフマン符号化は、個々の情報源シンボルが個別の符号語として表現される必要がある場合、最適な符号化性能を与えるが、一方で映像信号のように局所的に信号の振る舞いが変動し情報源シンボルの生起確率が変動する場合に対しては最適性が保証されないという問題がある。このような場合に、個々の情報源シンボルの生起確率に動的に適応し、複数のシンボルをまとめて1つの符号語で表現する方法として算術符号化が提案されている。Mark Nelson, "Arithmetic Coding + Statistical Modeling = Data Compression Part 1 - Arithmetic Coding", Dr. Dobb's Journal, February 1991.を引用して算術符号化の考え方について簡単に説明する。ここでは、アルファベット文字を情報源シンボルとする情報源を考え、"BILL GATES"というメッセージを算術符号化することを考える。このとき、個々の文字の生起確率は図20のように定義される。また、同図の値域に示すように、[0,1]の区間で定義される確率数直線上の区域を一意に定める。次いで、符号化処理に入る。はじめに文字"B"の符号化を行うが、これは、確率数直線上の範囲[0.2,0.3]を特定することに該当する。したがって、文字"B"には値域[0.2,0.3]の上限(High)と下限(Low)の値の組が対応することになる。次いで、"I"の符号化に際しては、"B"の符号化で特定された値域[0.2,0.3]を改めて[0,1]区間とみなし、その中の[0.5,0.6]の区間を特定する。つまり、算術符号化の処理過程は、確率数直線の値域の絞込みを行うことに相当する。各文字に対してこの処理を繰り返すと、図21に示すように、"BILL GATES"の算術符号化結果は、文字"S"の符号化を終了した時点でのLow値「0.2572167752」として表現される。
復号処理もこの逆を考えればよく、はじめに符号化結果「0.2572167752」が確率数直線上のどの文字が割り当てられている値域に該当するかを調べ、"B"を得る。その後、"B"のLow値を差し引いた後に値域で除算を行い、「0.572167752」を得る。この結果、[0.5,0.6]の区間に対応する文字"I"を復号することが可能となる。以降、この処理を繰り返して"BILL GATES"と復号することができる。以上の処理より、算術符号化によれば、果てしなく長いメッセージの符号化であっても最終的に1つの符号語へマッピングされることになる。実際の実装上は、無限の小数点精度を扱うことができないこと、符号化・復号プロセスに乗除算が必要で演算負荷が高いなどの問題から、例えば、符号語表現として整数型レジスタを利用した浮動小数点演算を行うこととし、上記Low値の生起確率を2のべき乗で近似して乗除算をシフト演算に置き換えるなどの工夫がなされている。算術符号化によれば、理想的には上記のプロセスによって情報源シンボルの生起確率によく適合したエントロピー符号化が可能である。特に、生起確率が動的に変動する場合には、生起確率の変動の様子をトレースして図20のテーブルを適宜更新することで、ハフマン符号化に比べて高い符号化効率を得ることができる。
ところで、エントロピー符号化される映像信号を伝送する際には、通常、伝送誤りに伴う映像の乱れを最小限に抑えるため、映像の各フレームを部分領域に分割し、再同期可能な単位、例えばMPEG-2スライス構造等で伝送することが多い。
しかし、ハフマン符号化では、個々の符号化対象シンボルは整数ビット長の符号語にマップされるため、該当する符号語をまとめて伝送単位として定義するだけでよいが、算術符号化では、明示的に符号化プロセスを中断するための特殊符号が必要となるばかりでなく、符号化を再開する際にそれ以前までのシンボルの生起確率の学習過程を一度リセットして符号を確定するためのビットを排出する必要が生じるため、中断の前後での符号化効率の低下を招く可能性がある。さらに、もし算術符号化処理が1映像フレーム中リセットされずに符号化され、伝送時にパケットデータなどの小単位に分割せざるを得ないような場合には、あるパケットの復号処理は直前パケットのデータなしに実施することができず、伝送誤りや遅延などに起因するパケットロスが発生した場合に著しく映像品質が劣化するという問題がある。
そこで、本発明は、上記従来技術に述べたように、映像符号化のエントロピー符号化として算術符号化を用いる際に問題となる符号化効率と誤り耐性の最適トレードオフを決定する仕組みを備えるデジタル信号符号化装置、デジタル信号復号装置、デジタル信号算術符号化方法、およびデジタル信号算術復号方法を提供することを目的とする。なお、本発明は、算術符号化を用いる装置や方法等全般に対して適用可能である。
上記課題を解決するため、本発明では、デジタル信号を所定単位に分割して圧縮符号化を行うデジタル信号符号化装置において、所定単位のデジタル信号を算術符号化によって圧縮する算術符号化部を備え、当該算術符号化部は、ある伝送単位の符号化が終了した時点における算術符号化状態を表現する情報を、次の伝送単位のデータの一部として多重化するデジタル信号符号化装置であることを特徴とする。
特に、上記算術符号化部は、所定単位のデジタル信号を、1つまたは複数の隣接する伝送単位に含まれる信号との間の依存関係に基づいて、符号化シンボルの生起確率を定めて算術符号化するデジタル信号符号化装置であることを特徴とする。
また、上記算術符号化部は、符号化されるシンボルの出現頻度をカウントすることで上記生起確率を学習するデジタル信号符号化装置であることを特徴とする。
また、上記算術符号化状態を表現する情報とは、算術符号化過程を示すレジスタ値のリセットの有無を示すレジスタリセットフラグと、レジスタ値をリセットしない場合のみ付加する初期レジスタ値とであるデジタル信号符号化装置であることを特徴とする。
また、デジタル信号を所定単位に分割して圧縮符号化を行うデジタル信号符号化装置において、所定単位のデジタル信号を算術符号化によって圧縮する算術符号化部を備え、当該算術符号化部は、所定単位のデジタル信号を、1つまたは複数の隣接する伝送単位に含まれる信号との間の依存関係に基づいて、符号化シンボルの生起確率を定めるとともに、符号化されるシンボルの出現頻度をカウントすることで上記生起確率を学習し、ある伝送単位の符号化が終了した時点における生起確率学習状態を表現する情報を、次の伝送単位データの一部として多重化するデジタル信号符号化装置であることを特徴とする。
特に、生起確率学習状態を表現する情報とは、符号化シンボルの生起確率の変動要因となる他の情報との依存関係をモデル化したコンテクストモデル状態を示す情報であるデジタル信号符号化装置であることを特徴とする。
また、上記デジタル信号は映像信号であって、上記伝送単位は映像フレーム内の1ないし複数個のマクロブロックから構成されるスライスであるデジタル信号符号化装置であることを特徴とする。
また、上記デジタル信号は映像信号であって、上記伝送単位は上記スライス内に含まれる符号化データの種別に応じて再構成される符号化データ単位であるデジタル信号符号化装置であることを特徴とする。
また、上記デジタル信号は映像信号であって、上記伝送単位は映像フレームであるデジタル信号符号化装置であることを特徴とする。
また、圧縮符号化されたデジタル信号を所定単位で受信して復号を行うデジタル信号復号装置において、所定単位の圧縮デジタル信号を算術符号化のプロセスに基づいて復号する算術復号部を備え、当該算術復号部は、ある伝送単位の復号開始時に、該伝送単位データの一部として多重化される算術符号化状態を表現する情報に基づいて、復号動作の初期化を行うデジタル信号復号装置であることを特徴とする。
特に、上記算術復号部は、所定単位の圧縮デジタル信号の復号に際して、1つまたは複数の隣接する伝送単位に含まれる信号との間の依存関係に基づいて、復号シンボルの生起確率を定めて復号を行うデジタル信号復号装置であることを特徴とする。
特に、上記算術復号部は、復号されたシンボルの出現頻度をカウントすることで上記生起確率を学習するデジタル信号復号装置であることを特徴とする。
また、圧縮符号化されたデジタル信号を所定単位で受信して復号を行うデジタル信号復号装置において、所定単位の圧縮デジタル信号を算術符号化のプロセスに基づいて復号する算術復号部を備え、当該算術復号部は、ある伝送単位の復号開始時に、該伝送単位データの一部として多重化されるシンボル生起確率学習状態を表現する情報に基づいて、該伝送単位の復号に用いる生起確率の初期化を行うとともに、所定単位の圧縮デジタル信号の復号に際して、1つまたは複数の隣接する伝送単位に含まれる信号との間の依存関係に基づいて復号シンボルの生起確率を定めるとともに、復号されるシンボルの出現頻度をカウントすることで上記生起確率を学習し復号を行うデジタル信号復号装置であることを特徴とする。
特に、上記デジタル信号は映像信号であって、上記伝送単位は映像フレーム内の1ないし複数個のマクロブロックから構成されるスライスであるデジタル信号復号装置であることを特徴とする。
また、上記デジタル信号は映像信号であって、上記伝送単位は上記スライス内に含まれる符号化データの種別に応じて再構成される符号化データ単位であるデジタル信号復号装置であることを特徴とする。
また、上記デジタル信号は映像信号であって、上記伝送単位は映像フレームであるデジタル信号復号装置であることを特徴とする。
また、デジタル信号を所定単位に分割して圧縮符号化を行う際のデジタル信号算術符号化方法であって、
所定単位のデジタル信号を算術符号化によって圧縮した際、ある伝送単位の符号化が終了した時点における算術符号化状態を表現する情報を、次の伝送単位のデータの一部として多重化するデジタル信号復号装置であることを特徴とする。
また、デジタル信号を所定単位に分割して圧縮符号化を行う際のデジタル信号算術符号化方法であって、所定単位のデジタル信号を算術符号化によって圧縮した際、所定単位のデジタル信号を、1つまたは複数の隣接する伝送単位に含まれる信号との間の依存関係に基づいて、符号化シンボルの生起確率を定めるとともに、符号化されるシンボルの出現頻度をカウントすることで上記生起確率を学習し、ある伝送単位の符号化が終了した時点における生起確率学習状態を表現する情報を、次の伝送単位データの一部として多重化するデジタル信号算術符号化方法ことを特徴とする。
また、圧縮符号化されたデジタル信号を所定単位で受信して復号を行う際のデジタル信号算術復号方法であって、所定単位の圧縮デジタル信号を算術符号化のプロセスに基づいて復号する際、ある伝送単位の復号開始時に、該伝送単位データの一部として多重化される算術符号化状態を表現する情報に基づいて、復号動作の初期化を行うデジタル信号算術復号方法であることを特徴とする。
また、圧縮符号化されたデジタル信号を所定単位で受信して復号を行う際のデジタル信号算術復号方法であって、所定単位の圧縮デジタル信号を算術符号化のプロセスに基づいて復号する際、ある伝送単位の復号開始時に、該伝送単位データの一部として多重化されるシンボル生起確率学習状態を表現する情報に基づいて、該伝送単位の復号に用いる生起確率の初期化を行うとともに、所定単位の圧縮デジタル信号の復号に際して、1つまたは複数の隣接する伝送単位に含まれる信号との間の依存関係に基づいて復号シンボルの生起確率を定めるとともに、復号されるシンボルの出現頻度をカウントすることで上記生起確率を学習し復号を行うデジタル信号算術復号方法であることを特徴とする。
本発明のディジタル信号符号化装置およびディジタル信号算術符号化方法によれば、所定伝送単位のデジタル信号を算術符号化によって圧縮する際、ある伝送単位の符号化が終了した時点における算術符号化状態を表現する情報を、次の伝送単位のデータの一部として多重化するようにしたり、あるいは1つまたは複数の隣接する伝送単位に含まれる信号との間の依存関係に基づいて、符号化シンボルの生起確率を定めるとともに、符号化されるシンボルの出現頻度をカウントすることで上記生起確率を学習し、ある伝送単位の符号化が終了した時点における生起確率学習状態を表現する情報を、次の伝送単位データの一部として多重化するようにしたので、それ以前の算術符号化状態またはシンボル生起確率学習状態をリセットすることなく引き継いで符号化を継続することができ、誤り耐性を確保しつつ、算術符号化の符号化効率を高めた符号化を実施することが可能となる。
また、本発明のディジタル信号復号装置およびディジタル信号算術復号方法によれば、ある伝送単位の復号開始時に、該伝送単位データの一部として多重化される算術符号化状態を表現する情報に基づいて、復号動作の初期化を行ったり、あるいはある伝送単位の復号開始時に、該伝送単位データの一部として多重化されるシンボル生起確率学習状態を表現する情報に基づいて、該伝送単位の復号に用いる生起確率の初期化を行うとともに、所定伝送単位の圧縮デジタル信号の復号に際して、1つまたは複数の隣接する伝送単位に含まれる信号との間の依存関係に基づいて復号シンボルの生起確率を定めるとともに、復号されるシンボルの出現頻度をカウントすることで上記生起確率を学習し復号を行うので、符号化装置側で前の伝送単位の算術符号化状態またはシンボル生起確率学習状態をリセットすることなく引き継いで符号化をした場合でも、正しく復号することが可能となる。
実施の形態.1
本実施の形態1では、映像フレームを16×16画素の矩形領域(以下、マクロブロック)に均等分割した単位で符号化を行う映像符号化方式に算術符号化を適用する例として、D. Marpe他, "Video Compression Using Context-Based Adaptive Arithmetic Coding", International Conference on Image Processing 2001に開示される事例を用いて本発明の説明を行う。
図1に、本実施の形態1における映像符号化装置の構成を示す。
図1において、本実施の形態1の映像符号化装置は、動き検出部2、フレームメモリ3a、算術符号化部6、動き補償部7、空間予測部10a、符号化モード判定部12、直交変換部15、量子化部16、逆量子化部18、逆直交変換部19、符号化制御部22、送信バッファ24、減算器51、切替部52、加算器53を有している。
図2に、本実施の形態1における映像復号装置の構成を示す。
図2において、本実施の形態1の映像復号装置は、フレームメモリ3b、動き補償部7、空間予測部10b、逆量子化部18、逆直交変換部19、算術復号部27、切替部54、加算器55を有している。
これらの図において、算術符号化部6および算術復号部27の動作が本発明のポイントとなるが、まずこれらの図に基づいて符号化装置ならびに復号装置全体の動作について説明する。
1.符号化装置の動作概要
図1の符号化装置において、入力映像信号1は、個々の映像フレームがマクロブロックに分割された単位で入力されるものとし、まず、動き検出部2において、フレームメモリ3aに格納される参照画像4を用いてマクロブロック単位に動きベクトル5が検出される。動きベクトル5に基づいて動き補償部7において時間予測画像8が得られ、入力信号1との差分をとることによって時間予測残差信号9が得られる。一方、入力信号1は空間予測部10aにおいて、同一映像フレーム内の空間的な近傍領域からの予測が行われ、空間予測残差信号11が生成される。
符号化モード判定部12では、時間予測残差信号9を符号化する動き予測モード、あるいは、その特殊例として、動きベクトルゼロ、時間予測残差信号成分なしのケースであるスキップモード、空間予測残差信号11を符号化するイントラモードの中から、当該マクロブロックをもっとも効率よく符号化することができるモードを選択する。
この符号化モード情報13は符号化対象情報として算術符号化部6に受け渡される。符号化モード情報13としてイントラモードが選択される場合は、上記空間予測部10aにおいて用いられたイントラ予測モード14が符号化対象情報として算術符号化部6に受け渡される。動き予測モードが選択される場合は、動きベクトル5が符号化対象情報として算術符号化部6に受け渡される。
符号化モード判定部12において選択された符号化対象信号は、直交変換部15、量子化部16を経て、直交変換係数データ17として算術符号化部6へ受け渡される。直交変換係数データ17は、逆量子化部18、逆直交変換部19を経たのち、切替部52にて符号化モード情報13に従って空間予測画像20、すなわち空間予測部10aの内部で空間予測残差信号11を生成するために用いられた空間予測画像の候補のうち、空間予測モード14を用いて生成された予測画像か、時間予測画像8かのいずれかを選択した信号と加算されて局所復号画像21へ戻される。局所復号画像21は以降のフレームの動き予測に用いられるため、参照画像データとしてフレームメモリ3aへ格納される。
量子化部16では、符号化制御部22において決定される量子化ステップパラメータ23によって与えられる粒度で直交変換係数データの量子化を行う。この量子化ステップパラメータ23を調整することで出力の符号化レートと、品質のバランスとをとることになる。一般には、算術符号化の後、伝送直前の送信バッファ24に蓄積される符号化データの占有量を一定時間ごとに確認し、その残量25に応じて量子化ステップパラメータ23のパラメータ調整が行われる。例えば、バッファ残量が多い場合は、レートを抑え気味に、バッファ残量に余裕がある場合はレートを高めにして品質を向上させるようにする。
算術符号化部6は、後述する手順に従って動きベクトル5、符号化モード情報13、空間予測モード14、直交変換係数データ17などの符号化対象データのエントロピー符号化を行い、送信バッファ24経由で、映像圧縮データ26として伝送・記録される。
2.復号装置の動作概要
図2に示した復号装置では、映像圧縮データ26を受け取ると、算術復号部27にて後述するエントロピー復号処理が行われて、動きベクトル5、符号化モード情報13、空間予測モード14、直交変換係数データ17、量子化ステップパラメータ23などが復元される。直交変換係数データ17、量子化ステップパラメータ23は、符号化側と同じ逆量子化部18と逆直交変換部19によって局所復号される。符号化モード情報13によって、時間方向の予測か、空間方向の予測かが選択され、時間方向の予測の場合は動き補償部7において復号された動きベクトル5を用いて時間予測画像8を復元する。空間方向の予測が選択される場合は、空間予測部10bを用いて空間予測画像11が復元される。ここで、符号化装置側の空間予測部10aと、復号装置側の空間予測部10bとの違いは、前者が、とりうるすべての空間予測モードの種別に対して最も効率のよく空間予測モード14を特定する処理を含むのに対し、後者は与えられた空間予測モード14から空間予測画像20を生成する処理のみに限定されることである。
切替部54では、時間予測画像8か、空間予測画像11のいずれかが符号化モード情報13に基づいて予測画像として決定され、これを加算器55にて逆直交変換部19の出力である局所復号信号と加算することによって復号画像21を得る。復号画像21は以降のフレームの予測画像生成に用いられるため、フレームメモリ3bに格納される。フレームメモリ3aと3bの違いは符号化装置、復号装置のそれぞれに搭載されるものという区別を単に意味するだけである。
3.算術符号化・復号処理
以下、本発明のポイントである算術符号化および復号処理について詳細に説明する。符号化処理は、図1の算術符号化部6において行われ、復号処理は図2の算術復号部27において行われる。
図3に、算術符号化部6の内部構成を示す。
図3において、本実施の形態1における算術符号化部6は、符号化対象データである動きベクトル5、符号化モード情報13、空間予測モード14、直交変換係数データ17などの個々のデータタイプに対して定義されるコンテクストモデル(後述)を定めるコンテクストモデル決定部28、各符号化対象データタイプについて定められる二値化規則に従って多値データを二値データに変換する二値化部29、二値化後の個々の二値化系列binの値(0 or 1)の生起確率を与える生起確率生成部30、生成された生起確率に基づいて算術符号化を実行する符号化部31、算術符号化を中断するタイミングを通知するとともにそのタイミングで伝送単位となるデータを構成する伝送単位生成部35、とを有している。
図4に、図3に示す算術符号化部6の動作フローを示す。
図4を参照して、図3に示す算術符号化部6の動作を詳細に説明する。
1) コンテクストモデル決定処理(ステップS1)
コンテクストモデルとは、情報源(符号化)シンボルの生起確率の変動要因となる他の情報との依存関係をモデル化したものであり、この依存関係に対応して生起確率の状態を切り替えることで、よりシンボルの実際の生起確率に適応した符号化を行うことが可能となる。
図5にコンテクストモデル(ctx)の概念を示す。なお、同図では情報源シンボルは二値とした。同図の0〜2というctxの選択肢は、このctxを用いる情報源シンボルの生起確率の状態が、状況に応じて変化するであろうことを想定して定義されている。本実施の形態1における映像符号化で言えば、あるマクロブロックにおける符号化データと、その周辺のマクロブロックの符号化データとの間の依存関係に応じてctxの値が切り替えられる。
図6に、例えば、D. Marpe他, "Video Compression Using Context-Based Adaptive Arithmetic Coding", International Conference on Image Processing 2001に開示されるマクロブロックの動きベクトルに関するコンテクストモデルの例を示す。同図において、ブロックCの動きベクトルが符号化対象で、正確には、ブロックCの動きベクトルを近傍から予測した予測差分値mvdk(C)が符号化される。ctx_mvd(C,k)がコンテクストモデルを示す。mvdk(A)はブロックAにおける動きベクトル予測差分値、mvdk(B)はブロックBにおける動きベクトル予測差分値をそれぞれ示し、コンテクストモデルの切り替え評価値ek(C)の定義に用いられる。評価値ek(C)は、近傍の動きベクトルのばらつき具合を示すことになり、一般的にはこのばらつきが小さい場合にはmvdk(C)は小さく、逆にek(C)が大きい場合はmvdk(C)も大きくなる傾向がある。したがって、mvdk(C)のシンボル生起確率は、ek(C)に基づいて適応化されることが望ましい。この生起確率のバリエーションセットがコンテクストモデルであり、このケースでは3種類の生起確率バリエーションがある、といえる。
この他、符号化モード情報13、空間予測モード14、直交変換係数データ17などの符号化対象データそれぞれについてあらかじめコンテクストモデルが定義され、符号化装置の算術符号化部6と、復号装置の算術復号部27とで共有される。図3に示す算術符号化部6のコンテクストモデル決定部28では、このような符号化対象データの種別に基づいてあらかじめ定められたモデルを選択する処理を行う。なお、コンテクストモデルの中のどの生起確率バリエーションを選択するかは下記3)の生起確率生成処理に該当するので、そこで説明する。
2) 二値化処理(ステップS2)
コンテクストモデルは、符号化対象データを二値化部29にて二値系列化し、二値系列の各bin(バイナリ位置)に応じて定められる。二値化の規則は、各符号化データの取りうる値のおおまかな分布に従い、可変長の二値系列への変換を行う。二値化は、本来多値を取りうる符号化対象データをそのまま算術符号化するよりもbin単位で符号化することにより確率数直線分割数を削減でき演算を簡略化できる、コンテクストモデルのスリム化が可能になるなどのメリットがある。
3) 生起確率生成処理(ステップS3)
上記1), 2)のプロセスで、多値の符号化対象データの二値化と、各binに適用するコンテクストモデルの設定が完了し、符号化準備が整う。各コンテクストモデルには、0/1の各値に対する生起確率のバリエーションが含まれているので、図4に示すように、生起確率生成部30は、ステップS1で決定されたコンテクストモデルを参照して各binにおける0/1生起確率の生成処理を行う。
図6に、生起確率選択のための評価値ek(C)の一例を示す。生起確率生成部30は、図6のek(C)に示したような生起確率選択のための評価値を定め、これに従って、参照するコンテクストモデルの選択肢の中からどの生起確率バリエーションを現在の符号化に用いるかを決定する。
4) 符号化処理(ステップS3〜S7)
3)によって、算術符号化プロセスに必要な確率数直線上の0/1各値の生起確率が得られるため、従来例にあげたプロセスにしたがって符号化部31において算術符号化を行う(ステップS4)。また、実際の符号化値(0 or 1)32は、生起確率生成部30へフィードバックされ、使用したコンテクストモデルの生起確率バリエーション部分の更新のため、0/1発生頻度のカウントが行われる(ステップS5)。例えば、ある特定のコンテクストモデル内の生起確率バリエーションを用いて100個のbinの符号化処理が行われた時点で、当該生起確率バリエーションにおける0/1の生起確率がそれぞれ0.25, 0.75であったとする。ここで、同じ生起確率バリエーションを用いて1が符号化されると、1の出現頻度が更新され、0/1の生起確率は0.247、0.752に変化する。このメカニズムにより、実際の生起確率に適応した効率的な符号化を行うことが可能となる。
また、符号化部31にて新たに生成される符号化値(0 or 1)32の算術符号33は、伝送単位生成部35へ送られ、下記6)に述べるように、伝送単位を構成するデータとして多重される(ステップS6)。また、1つの符号化対象データの二値系列bin全体に対して符号化処理を終了したか否かを判断し(ステップS7)、終了していなければ(ステップS7“N”)、ステップS3に戻り各binにおける生起確率の生成処理以降の処理を行う一方、終了していれば(ステップS7“Y”)、さらに次に説明する伝送単位生成処理へ移行する。
5) 伝送単位生成処理(ステップS8〜S9)
算術符号化は、複数の符号化対象データの系列を1つの符号語へ変換するが、映像信号はフレーム間での動き予測を行ったり、フレーム単位での表示を行ったりするため、フレームを単位として復号画像を生成してフレームメモリ内部の更新を行う必要がある。したがって、算術符号化された圧縮データ上でフレームという単位の切れ目を明確に判断できる必要がある。さらに、音声・オーディオなどの他のメディアとの多重や、パケット伝送などの目的から、フレーム内のさらに細かい単位で圧縮データを区切って伝送する必要もある。この例としては、一般にスライス構造、すなわち複数のマクロブロックをラスタスキャン順にグルーピングした単位が挙げられる。
図7にスライス構造の例を示す。点線で囲まれる矩形がマクロブロックに該当する。一般にスライス構造は、復号時の再同期の単位として扱われる。端的な例として、スライスデータをそのままIP伝送用のパケットペイロードにマップすることがある。映像など伝送遅延があまり許容されないリアルタイムメディアのIP伝送には、RTP(Realtime Transport Protocol)が用いられることが多い。RTPパケットはヘッダ部分にタイムスタンプが付与され、ペイロード部分に映像のスライスデータがマッピングされて伝送されることが多い。例えば、Kikuchi他、"RTP Payload Format for MPEG-4 Audio/Visual Streams", RFC 3016では、MPEG-4映像圧縮データをMPEG-4のスライス(ビデオパケット)の単位でRTPペイロードにマップする方法が規定されている。RTPはUDPパケットとして伝送されるため、一般に再送制御がなく、パケットロスが発生した場合にはスライスデータがまるまる復号装置へ届かないことがある。もしも、そのあとのスライスデータがこの廃棄されたスライスの情報に依存した符号化を行っているならば、それが仮に正常に復号装置に届いたとしても正常復号することができなくなる。このため、任意のスライスはその先頭から何の依存関係にもとらわれずに正常に復号を行えるようにする必要がある。例えば、一般に、Slice5の符号化を行うにあたって、その上部に位置するSlice3や左に位置するSlice4のマクロブロック群の情報を利用した符号化を行うようにはしない。
一方で、算術符号化の効率を向上させるには、周辺の状況に基づいてシンボルの生起確率を適応させたり、確率数直線の分割過程を保持しつづけることが望ましい。例えば、Slice5をSlice4とまったく独立に符号化するには、Slice4の最終マクロブロックの算術符号化が終了した時点での確率数直線分割状況、すなわち、算術符号化における符号語を表現するレジスタ値を保持することができず、Slice5ではレジスタを初期状態にリセットしたのち符号化を再開することになる。これにより、Slice4の末尾とSlice5の先頭との間に存在する相関が利用できず、符号化効率の低下を招くことがある。つまり、符号化効率の低下を犠牲にして、伝送誤りなどに起因するスライスデータの予期せぬロスに対する耐性を向上させるように設計するのが一般的である。
本発明に係る実施の形態1の伝送単位生成部35では、この設計の適応性を向上させる方法ならびに装置を提供する。すなわち、伝送誤りなどによるスライスデータのロスの確率が極めて低いケースでは、算術符号化に関わるスライス間の依存関係を常時断ち切ることをせず、積極的に利用できるようにする。一方、スライスデータのロスの可能性が高い場合には、スライス間の依存関係を断ち切ることができるようにして、伝送単位での符号化効率を適応的に制御できるようにする。
つまり、本実施の形態1における伝送単位生成部35では、符号化装置内部の制御信号として、伝送単位を区切るタイミングを伝送単位指示信号36を受け取り、この伝送単位指示信号36が入力するタイミングに基づいて、符号化部31から入力される算術符号33の符号語を区切って伝送単位のデータを生成する。
具体的には、本実施の形態1における伝送単位生成部35は、符号化値32の算術符号33を逐次、伝送単位構成ビットとして多重していく(ステップS6)とともに、伝送単位内に含まれうるマクロブロックの分だけデータの符号化が終了したか否かを、上記伝送単位指示信号36によって判断し(ステップS8)、伝送単位内のすべての符号化が終了していないと判断した場合には(ステップS8"N")、ステップS1へ戻りコンテクストモデル決定以降の処理を行う。
これに対し、伝送単位内のすべての符号化が終了したと判断した場合(ステップS8"Y")、伝送単位生成部35は、次の伝送単位データのヘッダ情報として以下の2つの情報を付加する(ステップS9)。
1.次の伝送単位において、確率数直線分割状況、すなわち符号語表現のため算術符号化過程を示すレジスタ値をリセットするか否かを示す“レジスタリセットフラグ”。尚、最初に生成される伝送単位では、このレジスタリセットフラグは、常に「リセットを行う」ことを指示するように設定される。
2.上記1.のレジスタリセットフラグが「リセットを行わない」ことを示す場合にのみ、次の伝送単位の算術符号化および復号の開始時に用いるレジスタ値として用いるべき、その時点でのレジスタ値である“初期レジスタ値”。なお、この初期レジスタ値は、図3に示すように、符号化部31から伝送単位生成部35へ入力される初期レジスタ値34である。
図8に、スライス構造の映像圧縮データであるスライス映像圧縮データのビットストリームシンタックスを示す。
図8に示すように、スライス映像圧縮データ毎に、各スライス映像圧縮データのヘッダであるスライスヘッダデータには、スライス開始コードの他、上記1.のレジスタリセットフラグと、上記1.のレジスタリセットフラグが「リセットを行わない」ことを示す場合にのみ多重する初期レジスタ値とが設けられている。
以上2つの付加情報によれば、直前のスライスがロスした場合であっても、自身のスライスヘッダデータに含まれるレジスタリセットフラグと、初期レジスタ値とのレジスタ初期化のための値を用いることによって、スライス間であっても算術符号語の連続性を保った符号化を行うことができ、符号化効率を保つことが可能となる。
なお、図8ではスライスヘッダデータと、スライス映像圧縮データとが同一ストリーム上に多重されているが、図9に示すように、スライスヘッダデータは別のストリームの形でオフラインで伝送され、スライス映像圧縮データには、対応するスライスヘッダデータのID情報をつけるように構成してもよい。同図では、ストリームをIPプロトコルにしたがって伝送する例を示しており、ヘッダデータ部分を信頼性の高いTCP/IPで伝送し、映像圧縮データ部分を低遅延のRTP/UDP/IPで伝送する例を示している。図9の構成に従うヘッダ、伝送単位の分離伝送形式によれば、RTP/UDP/IPで伝送するデータは必ずしもスライスというデータ単位に分割されていなくてもよい。スライスでは、基本的にはそのスライスで単独に復号を再開できるように、近傍領域の映像信号との依存関係(コンテクストモデル)をすべてリセットする必要があるが、これは映像符号化効率の低下を招く。この図11に示すように、初期レジスタ状態をTCP/IPで伝送することができれば、映像信号自体はフレーム内のあらゆるコンテクストモデルを利用しながら符号化を行い、RTPパケット化を行う段階で算術符号化されたデータを分割して伝送すればよい。従って、この仕組みによれば、算術符号化処理過程は回線の状況によらず安定的に獲得することができるので、スライス構造に制約されない符号化を行ったビットストリームを、高い誤り耐性を保って伝送することが可能である。
この他、図10に示すように、レジスタリセットフラグならびに初期レジスタ値のシンタックスを使用するかどうかを、より上位のレイヤで示すように構成してもよい。図10では、複数の映像フレームから構成される映像シーケンスの単位で付与されるヘッダ情報に、レジスタリセットフラグならびに初期レジスタ値のシンタックスを使用するかどうかを示すレジスタリセット制御フラグを多重した例を示している。例えば、回線の品質が悪く、映像シーケンスを通じてレジスタリセットを行うほうが安定した映像伝送が可能であると判断する場合、レジスタリセット制御フラグを「映像シーケンスを通じて、常にスライスの先頭ではレジスタはリセットする」ことを示す値にセットする。このとき、スライスの単位での多重化対象となるレジスタリセットフラグや初期レジスタ値についてはスライスレベルでの多重は必要なくなる。これによって、ある特定の伝送条件(回線の誤り率など)が継続するような場合は、映像シーケンスの単位でレジスタリセットの制御を行うようにすれば、スライスの単位で伝送するオーバヘッド情報を低減することができる。もちろん、レジスタリセット制御フラグは第Nフレーム、第N+1フレームなどで示される、映像シーケンス中の任意の映像フレームのヘッダ情報に付与してもよい。
図11に、算術復号部27の内部構成を示す。この実施の形態1の復号装置の算術復号部27は、受信した伝送単位ごとに、そのヘッダに含まれる算術符号化過程に関する付加情報に基づいて、算術復号処理の初期化を行う伝送単位復号初期化部37、算術復号の過程に基づいて、動きベクトル5、符号化モード情報13、空間予測モード14、直交変換係数データ17などの復号対象データのタイプを特定して、それぞれに符号化装置と共通定義されるコンテクストモデルを定めるコンテクストモデル決定部28、復号対象データのタイプに基づいて定まる二値化規則を生成する二値化部29、二値化規則とコンテクストモデルに従って、個々のbin(0 or 1)の生起確率を与える生起確率生成部30、生成された生起確率に基づいて算術復号を実行し、その結果得られる二値系列と、上記二値化規則とから、動きベクトル5、符号化モード情報13、空間予測モード14、直交変換係数データ17などのデータを復号する復号部38、とを有している。
図12に、図11に示す算術復号部27の動作フローを示す。
図12を参照して、図11に示す算術復号部27の動作を詳細に説明する。
6) 伝送単位復号初期化処理(S10)
図8に示したように、スライスなどの伝送単位ごとに多重される、算術符号化過程を示すレジスタ値のリセットの有無を示すレジスタリセットフラグと、ならびに初期レジスタ値34とに基づいて、復号部38における算術復号開始状態の初期化を行う(ステップS10)。レジスタ値をリセットする場合は、初期レジスタ値34は使用されない。
7) コンテクストモデル決定処理、二値化処理、生起確率生成処理
これらのプロセスは、それぞれ、図11に示すコンテクストモデル決定部28、二値化部29、生起確率生成部30によって行われるが、符号化装置側のプロセス1)〜3)にて示すコンテクストモデル決定処理S1、二値化処理S2、生起確率生成処理S3と同様なので、それぞれ同じステップ番号を付して、これらの説明は省略するものとする。
8) 算術復号処理(S11)
これから復号しようとするbinの生起確率が7)までのプロセスで確定するため、復号部38において、従来例に示した算術復号処理のプロセスにしたがって、binの値を復元すると共に(ステップS11)、符号化装置側の処理と同様に0/1発生頻度をカウントしてbinの生起確率を更新し(ステップS5)、二値化規則で定められる二値系列パターンと比較することにより復号したbinの値が確定したか否かを判断する(ステップS12)。二値化規則で定められる二値系列パターンと比較して復号したbinの値が確定しなければ(ステップS12"N")、再度、ステップS3の各binにおける0/1生起確率生成処理以降の処理を行う(ステップS3,S11,S5,S12)。その一方、二値化規則で定められる二値系列パターンとの合致の確認により復号した各binの値が確定した場合には(ステップS12"Y")、合致したパターンが指し示すデータ値を復号データ値として出力し、スライスなどの伝送単位全てについて復号完了していなければ(ステップS13"N")、伝送単位すべてについて復号するため、ステップS1のコンテクストモデル決定処理以降の処理を繰り返し行うようにする。
以上の本実施の形態1による算術符号化ならびに算術復号処理を備えた映像符号化・復号装置によれば、スライスなどの細かい伝送単位に区切って映像圧縮データを伝送する際も、スライスヘッダデータとして算術符号化過程を示すレジスタ値のリセットの有無を示すレジスタリセットフラグと、ならびに初期レジスタ値34とを付加するようにしたので、算術符号化の符号化プロセスの連続性を断ち切ることなく符号化を行うことが可能となり、伝送誤りへの耐性を高めながら符号化効率を保つことが可能となると共に、その復号が可能となる。
なお、本実施の形態1では、伝送単位としてスライス構造を想定しているが、映像フレームを伝送単位としても本発明を適用可能である。
実施の形態2.
本実施の形態2では、算術符号化部6および算術復号部27の別の形態について述べる。本実施の形態2では、算術符号化過程の符号語の状態を表すレジスタ値だけでなく、コンテクストモデル内の生起確率バリエーションに対する学習状態、すなわち生起確率生成部30におけるbinの生起確率更新処理によるコンテクストモデル内の生起確率バリエーションに対する学習状態も、スライスヘッダに多重することを特徴とする。
つまり、例えば実施の形態1で説明した図6において、例えばブロックCの算術符号化の効率を向上させるためには、このブロックCの例えば上部に位置するブロックBの動きベクトルの情報を生起確率バリエーション決定のために使用する。したがって、もし、ブロックCとブロックBが異なるスライスに位置付けられるとすれば、ブロックBの情報を生起確率決定プロセスで使用することを禁ずる必要がある。このことは、コンテクストモデルによる生起確率適応化による符号化効率が低下することを意味する。そこで、本実施の形態2では、この設計の適応性を向上させる方法ならびに装置を提供するもので、伝送誤りなどによるスライスデータのロスの確率が極めて低いケースでは、算術符号化に関わるスライス間の依存関係を常時断ち切ることをせず、積極的に利用できるようにする一方、スライスデータのロスの可能性が高い場合には、スライス間の依存関係を断ち切ることができるようにして、伝送単位での符号化効率を適応的に制御できるようにするものである。
図13に、本実施の形態2における算術符号化部6の内部構成を示す。本実施の形態2における算術符号化部6が、図3に示す実施の形態1の算術符号化部6と異なるのは、生起確率生成部30が、スライスヘッダへの多重化の対象とされるコンテクストモデルの状態39を伝送単位生成部35へ受け渡す点だけである。
図14に、本実施の形態2における算術符号化部6の動作フローを示す。図4に示す実施の形態1の算術符号化部6の動作フローと比較すると明らかだが、それと異なる点は、ステップS3の各binにおける0/1生起確率生成処理におけるコンテクストモデル状態39、すなわち生起確率生成部30におけるbinの生起確率更新処理によるコンテクストモデル内の生起確率バリエーションに対する学習状態39も、ステップS4のバイナリ算術符号化処理におけるレジスタ値と同様に、ステップS9の伝送単位生成部35における次伝送単位のヘッダ構成処理においてスライスヘッダに多重する点だけである。
図15により、コンテクストモデルの状態39の意味について説明する。
図15は、k番目の伝送単位内にn個のマクロブロックがある場合で、各マクロブロックに対して1度だけ使用されるコンテクストモデルctxが定義されており、各マクロブロック対してctxの生起確率が変動する様子を示している。コンテクストモデルの状態39が次の伝送単位へ引き継がれるという意味は、この図15に示すように、k番目の伝送単位の最終状態ctxk(n-1)がk+1番目の伝送単位におけるctxの初期状態、すなわちctxk+1(n-1)=0,1,2における値0,1の生起確率po,p1をctxk(n-1)=0,1,2における値0,1の生起確率po,pと等しくすることを意味する。このために、伝送単位生成部35において、ctxk(n-1)の状態を示すデータが、k+1番目の伝送単位におけるヘッダ情報の一部として伝送されるように構成する。
図16に、本実施の形態2のビットストリームシンタックスの一例を示す。同図に示すように、本実施の形態2では、スライス映像圧縮データ毎のスライスヘッダデータに、図8に示す実施の形態1と同様のスライス開始コード、レジスタリセットフラグ、初期レジスタ値に加えて、直前のスライスのコンテクストモデル状態を示す情報を付加するようにしている。ただし、本実施の形態2では、レジスタリセットフラグを、初期レジスタ値の多重化有無だけでなく、コンテクストモデル状態データの多重化有無の意味も含ませるようにしてい。尚、コンテクストモデル状態データの多重化有無を示す情報としては、ジスタリセットフラグではなく、別のフラグをもうけるように構成しても勿論よい。また、実施の形態1でも説明したが、同図では、スライスヘッダデータと、スライス映像圧縮データとが同一ストリーム上に多重されているが、スライスヘッダは別のストリームの形でオフラインで伝送され、圧縮データには、対応するスライスヘッダデータのID情報をつけるように構成してもよい。
図17に、本実施の形態2における算術復号部27の内部構成を示す。この図17に示す本実施の形態2における算術復号部7が、図11に示す実施の形態1の算術復号部27と異なるのは、伝送単位復号初期化部37が、スライスヘッダに多重化される、直前スライスのコンテクストモデルの状態39を生起確率生成部30へ受け渡し、コンテクストモデルの状態を直前のスライスから引き継ぐ構成となっている点だけである。
図18に、本実施の形態2における算術復号部27の動作フローを示す。図12に示す実施の形態1の算術復号部27の動作フローと比較すると明らかだが、それと異なる点は、ステップS10の各伝送単位復号初期化処理においてスライスヘッダから復号したコンテクストモデル状態39が、ステップS3の処理、すなわちステップS1で決定されたコンテクストモデルを参照して各binにおける0/1生起確率の生成処理を行う処理へ出力されて、生起確率生成部30における0/1生起確率の生成処理に用いられる点である。
なお、スライスヘッダで受け渡すコンテクストモデルの状態については、コンテクストモデルの数が極めて多い場合にはスライスヘッダのオーバヘッドになるため、符号化効率への寄与が著しいコンテクストモデルを選択して、その状態を多重化するように構成してもよい。例えば、動きベクトルや直交変換係数データは、全符号量中に占める割合が多いので、これらのコンテクストモデルについてだけ状態を引き継ぐように構成する、などが考えられる。また、状態を引き継ぐコンテクストモデルの種別を明示的にビットストリームに多重するように構成し、映像の局所的な状況に応じて重要なコンテクストモデルについてのみ選択的に状態引継ぎを行うようにしてもよい。
以上の構成による本実施の形態2による映像符号化装置・復号装置によれば、細かい伝送単位に区切って映像圧縮データを伝送する際、スライスヘッダデータとして算術符号化過程を示すレジスタ値のリセットの有無を示すレジスタリセットフラグと、初期レジスタ値34と、直前スライスのコンテクストモデル状態を示す情報を付加するようにしたので、算術符号化の符号化プロセスの連続性を断ち切ることなく符号化を行うことが可能となり、伝送誤りへの耐性を高めながら符号化効率を保つことが可能となる。なお、本実施の形態では、伝送単位としてスライス構造を想定しているが、映像フレームを伝送単位としても本発明を適用可能である。
特に、本実施の形態2では、直前スライスのコンテクストモデル状態を示す情報を付加しているので、例えば図6においてブロックCと、このブロックC直前のブロックBとが異なるスライスに位置付けられたとしても、ブロックCの生起確率決定プロセスにてブロックBのコンテクストモデル状態を利用して、コンテクストモデルによる生起確率適応化による符号化効率を向上させることができる。つまり、伝送誤りなどにより、スライスデータのロスの確率が極めて低いケースでは、算術符号化に関わるスライス間の依存関係を常時断ち切ることをせず、直前スライスのコンテクストモデル状態までも積極的に利用できるようにする一方、スライスデータのロスの可能性が高い場合には、直前スライスのコンテクストモデル状態は利用せずに、スライス間の依存関係を断ち切ることができるようにして、伝送単位での符号化効率を適応的に制御できることになる。
なお、本実施の形態2の場合、図16に示すビットストリームシンタックスのように、スライスデータ毎に、実施の形態1のレジスタリセットフラグおよび初期レジスタ値の付加と並列に、直前スライスの各データのコンテクストモデル状態を示す情報をスライスヘッダデータとして付加するように説明したが、実施の形態1のレジスタリセットフラグおよび初期レジスタ値は付加せずに省略して、直前スライスの各データのコンテクストモデル状態を示す情報のみをスライスヘッダデータとして付加するようにしても良いし、また、実施の形態1のレジスタリセットフラグおよび初期レジスタ値の付加と並列に設けるか否かに関わらず、コンテクストモデル状態リセットフラグ(図19参照)を設けるようにして、このコンテクストモデル状態リセットフラグがオフ、すなわちリセットを行わない場合のみ直前スライスの各データのコンテクストモデル状態を示す情報を付加して復号時に利用させるようにしても勿論良い。
実施の形態3.
本実施の形態3では、伝送単位を、符号化されるデータのタイプ別にグルーピングするデータパーティショニング形式で構成する例について述べる。例えば、Joint Video Team (JVT) of ISO/IEC MPEG and ITU-T VCEG において検討される映像符号化方式仕様ドラフトWorking Draft Number 2, Revision 3, JVT-B118r3に開示されるデータパーティショニングを例にとると、図7に示すようなスライス構造を単位として、その内部に存在するマクロブロック数分だけ、特定のタイプのデータをグルーピングして構成されるデータ単位をスライスデータの形で伝送する方式が示されている。グルーピングして構成されるデータ単位であるスライスデータのデータタイプとして、例えば、以下に示す0〜7のデータタイプがある。
0 TYPE_HEADER ピクチャ(フレーム)またはスライスヘッダ
1 TYPE_MBHEADER マクロブロックヘッダ情報(符号化モード情報など)
2 TYPE_MVD 動きベクトル
3 TYPE_CBP CBP(マクロブロック内の有効直交変換係数分布)
4 TYPE_2x2DC 直交変換係数データ(1)
5 TYPE_COEFF_Y 直交変換係数データ(2)
6 TYPE_COEFF_C 直交変換係数データ(3)
7 TYPE_EOS ストリーム終了識別情報
例えば、データタイプ2のTYPE_MVDのスライスでは、その内部のマクロブロック数分、動きベクトル情報だけを集めたデータをスライスデータとして伝送する。したがって、第k番目のスライスのTYPE_MVDのデータに続いて、第k+1番目のスライスのTYPE_MVDデータを復号する場合には、第k番目のスライス末尾における動きベクトルに関するコンテクストモデルの状態だけを、第k+1番目のスライスのTYPE_MVDデータを送るためのスライスのヘッダに多重しておけば、動きベクトルの算術符号化のためのコンテクストモデル学習状態を引き継ぐことが可能である。
図19に、本実施の形態3におけるデータタイプ別にグルーピングした場合のビットストリームシンタックスの一例を示す。図19では、例えば、データタイプ2のTYPE_MVDのスライスの場合である動きベクトルをスライスデータとして多重する場合には、そのスライスヘッダ中に、スライス開始コードや、TYPE_MVDを示すデータタイプID、コンテクストモデル状態リセットフラグおよび直前スライスの動きベクトル用コンテクストモデル状態を示す情報を付加する。
また、例えば、データタイプ5のTYPE_COEFF_Yの直交変換係数データ(2)の直交変換係数データ(2)のみをスライスデータとして多重する場合には、そのスライスヘッダ中に、スライス開始コードや、TYPE_COEFF_Yを示すデータタイプID、コンテクストモデル状態リセットフラグおよび直前スライスの直交変換係数データ用コンテクストモデル状態を示す情報を付加するようにする。なお、同図ではスライスヘッダデータと圧縮データとが同一ストリーム上に多重されているが、スライスヘッダは別のストリームの形でオフラインで伝送され、圧縮データには、対応するスライスヘッダデータのID情報をつけるように構成してもよい。
また、本実施の形態3における算術符号化部6は、図13の構成において、伝送単位生成部35が上記データパーティショニングの規則にしたがってスライス内のマクロブロックデータの再構成を行い、各データタイプの種別を表すID情報と、各データタイプに対応するコンテクストモデルの学習状態を多重するように構成すればよい。また、本実施の形態における算術復号部27は、図17の構成において、伝送単位復号初期化部37が、スライスヘッダに多重されるデータタイプ種別IDをコンテクストモデル決定部28へ通知することで使用するコンテクストモデルを決定し、かつコンテクストモデル学習状態を生起確率生成部30へ通知することでコンテクストモデルの学習状態39をスライス間で引き継いで算術復号を行うように構成すればよい。
以上の実施の形態3に述べた映像符号化装置および映像復号装置によれば、映像信号を所定のデータタイプでグループ化した伝送単位に分割して圧縮符号化を行う場合でも、当該伝送単位に属する映像信号を算術符号化する際に、それ以前の所定のデータタイプでグループ化した伝送単位におけるシンボル生起確率学習状態をリセットすることなく引き継いで符号化を継続するようにしたので、所定のデータタイプでグループ化した場合でも、誤り耐性を確保しつつ、算術符号化の符号化効率を高めた符号化を実施することが可能となる。
なお、本実施の形態3では、伝送単位としてスライス構造ごとのデータタイプ種別を想定しているが、映像フレーム単位でのデータタイプ種別ごとの伝送を想定しても本発明を適用可能である。
また、図19に示す本実施の形態3のビットストリームシンタックスの一例の場合、データタイプ毎のスライスデータ毎に、コンテクストモデル状態リセットフラグ、およびそのフラグがオフの場合の直前スライスの各データのコンテクストモデル状態を示す情報をスライスヘッダデータとして付加するように説明したが、図16に示す実施の形態2のビットストリームシンタックスの一例の場合と同様に、各データタイプのスライスデータ毎に、レジスタリセットフラグおよび初期レジスタ値の付加と並列に、コンテクストモデル状態リセットフラグ、およびそのフラグがオフの場合の直前スライスの各データのコンテクストモデル状態を示す情報をスライスヘッダデータとして付加しても良いしまた、レジスタリセットフラグおよび初期レジスタ値の付加と並列に設けるか否かに関わらず、コンテクストモデル状態リセットフラグを省略して、常に直前スライスの各データのコンテクストモデル状態を示す情報を付加して復号時に利用させるようにしても勿論良い。
また、以上の実施の形態1〜3では、ディジタル信号として、映像データを一例に説明したが、本発明では、これに限らず、映像データのディジタル信号だけでなく、音声のディジタル信号や、静止画のディジタル信号、さらにはテキストのディジタル信号や、これらを任意に組み合わせたマルチメディアデータのディジタル信号にも適用可能である。
また、以上の実施の形態1,2では、ディジタル信号の伝送単位としてスライス、実施の形態3では、スライス内でデータのタイプ別にパーティショニングしたデータタイプ等の所定伝送単位を一例に説明したが、本発明では、これに限らず複数のスライスが集まって構成される1画像(ピクチャ)、すなわち1映像フレームを単位を所定伝送単位とするようにしても良いし、また通信以外の蓄積系などへの使用を想定して、所定の伝送単位ではなく、所定の蓄積単位でも勿論よい。
実施の形態1における映像符号化装置の構成を示した図面である。 実施の形態1における映像復号装置の構成を示した図面である。 図1における算術符号化部6の内部構成を示した図面である。 図3の算術符号化部6の動作フローを説明する図面である。 コンテクストモデルの概念を説明する図面である。 実施の形態1における動きベクトル用コンテクストモデルの例を示す図面である。 スライス構造を説明する図面である。 実施の形態1の算術符号化部6によって生成されるビットストリームの例を示す図面である。 実施の形態1の算術符号化部6によって生成される他のビットストリームの例を示す図面である。 実施の形態1の算術符号化部6によって生成されるさらに他のビットストリームの例を示す図面である。 実施の形態1における算術復号部27の内部構成を示した図面である。 図11の算術復号部27の動作フローを説明する図面である。 実施の形態2における算術符号化部6の内部構成を示した図面である。 図13の算術符号化部6の動作フローを説明する図面である。 コンテクストモデルの学習状態を説明する図面である。 実施の形態2の算術符号化部6によって生成されるビットストリームの例を示す図面である。 実施の形態2における算術復号部27の内部構成を示した図面である。 図17の算術復号部27の動作フローを説明する図面である。 実施の形態3の算術符号化部6によって生成されるビットストリームの例を示す図面である。 "BILL GATES"という文字を算術符号化した場合の個々の文字の生起確率を示す図面である。 "BILL GATES"という文字を算術符号化した場合の算術符号化結果を示す図面である。
符号の説明
2 動き検出部、3a,3b フレームメモリ、6 算術符号化部、7 動き補償部、10a,10b 空間予測部、12 符号化モード判定部、15 直交変換部、16 量子化部、18 逆量子化部、19 逆直交変換部、22 符号化制御部、24 送信バッファ、51 減算器、52 切替部、53 加算器、切替部54、加算器55。

Claims (2)

  1. 圧縮符号化されたデジタル信号を所定単位で受信して復号を行うデジタル信号復号装置において、
    前記所定単位の圧縮デジタル信号を、複数のコンテクストモデルの中から復号対象データのタイプごとに使用するコンテクストモデルを定めて算術符号化のプロセスに基づいて復号する算術復号部を備え、
    当該算術復号部は、ある所定単位のデータの一部として多重化され、上記復号対象データのタイプに対応づけられたコンテクストモデルの生起確率の初期状態を表す情報に基づいて、コンテクストモデルの生起確率状態の初期化を行い、算術復号過程を示すレジスタ値の初期化情報を復号し、該レジスタ値の初期化情報に基づいてレジスタ値の初期化を行い、前記初期化された生起確率状態と前記初期化されたレジスタ値から前記所定単位データの復号を行うことを特徴とするデジタル信号復号装置。
  2. 圧縮符号化されたデジタル信号を所定単位で受信して復号を行うデジタル信号算術復号方法であって、
    前記所定単位の圧縮デジタル信号を、複数のコンテクストモデルの中から復号対象データのタイプごとに使用するコンテクストモデルを定めて算術符号化のプロセスに基づいて復号するとともに、
    ある所定単位のデータの一部として多重化され、上記復号対象データのタイプに対応づけられたコンテクストモデルの生起確率の初期状態を表す情報に基づいて、コンテクストモデルの生起確率状態の初期化を行い、算術復号過程を示すレジスタ値の初期化情報を復号し、該レジスタ値の初期化情報に基づいてレジスタ値の初期化を行い、前記初期化された生起確率状態と前記初期化されたレジスタ値から前記所定単位データの復号を行うことを特徴とするデジタル信号算術復号方法。
JP2005374008A 2005-12-27 2005-12-27 デジタル信号符号化装置、デジタル信号復号装置、デジタル信号算術符号化方法、およびデジタル信号算術復号方法 Expired - Lifetime JP4211780B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005374008A JP4211780B2 (ja) 2005-12-27 2005-12-27 デジタル信号符号化装置、デジタル信号復号装置、デジタル信号算術符号化方法、およびデジタル信号算術復号方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005374008A JP4211780B2 (ja) 2005-12-27 2005-12-27 デジタル信号符号化装置、デジタル信号復号装置、デジタル信号算術符号化方法、およびデジタル信号算術復号方法

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2002124114A Division JP3807342B2 (ja) 2002-04-25 2002-04-25 デジタル信号符号化装置、デジタル信号復号装置、デジタル信号算術符号化方法、およびデジタル信号算術復号方法

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2008182582A Division JP4211873B2 (ja) 2008-07-14 2008-07-14 デジタル信号符号化装置、デジタル信号復号装置、デジタル信号算術符号化方法、およびデジタル信号算術復号方法

Publications (2)

Publication Number Publication Date
JP2006180521A JP2006180521A (ja) 2006-07-06
JP4211780B2 true JP4211780B2 (ja) 2009-01-21

Family

ID=36734108

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005374008A Expired - Lifetime JP4211780B2 (ja) 2005-12-27 2005-12-27 デジタル信号符号化装置、デジタル信号復号装置、デジタル信号算術符号化方法、およびデジタル信号算術復号方法

Country Status (1)

Country Link
JP (1) JP4211780B2 (ja)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4865662B2 (ja) * 2007-09-26 2012-02-01 キヤノン株式会社 エントロピー符号化装置、エントロピー符号化方法およびコンピュータプログラム
JP4875024B2 (ja) * 2008-05-09 2012-02-15 株式会社東芝 画像情報伝送装置
PL2346029T3 (pl) * 2008-07-11 2013-11-29 Fraunhofer Ges Forschung Koder sygnału audio, sposób kodowania sygnału audio i odpowiadający mu program komputerowy
AU2009267525B2 (en) 2008-07-11 2012-12-20 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio signal synthesizer and audio signal encoder
KR101981267B1 (ko) * 2012-04-13 2019-05-23 지이 비디오 컴프레션, 엘엘씨 저지연 화상 코딩
KR102415989B1 (ko) 2012-06-29 2022-07-01 지이 비디오 컴프레션, 엘엘씨 비디오 데이터 스트림 개념
JP5638581B2 (ja) * 2012-09-19 2014-12-10 株式会社Nttドコモ 動画像符号化装置、方法及びプログラム、並びに動画像復号装置、方法及びプログラム

Also Published As

Publication number Publication date
JP2006180521A (ja) 2006-07-06

Similar Documents

Publication Publication Date Title
JP3807342B2 (ja) デジタル信号符号化装置、デジタル信号復号装置、デジタル信号算術符号化方法、およびデジタル信号算術復号方法
US9350996B2 (en) Method and apparatus for last coefficient indexing for high efficiency video coding
CN1801944B (zh) 用于视频编码和解码的方法和设备
JP4211780B2 (ja) デジタル信号符号化装置、デジタル信号復号装置、デジタル信号算術符号化方法、およびデジタル信号算術復号方法
JP4133346B2 (ja) 予測タイプの選択によるビデオデータブロックのイントラ符号化
JP4211873B2 (ja) デジタル信号符号化装置、デジタル信号復号装置、デジタル信号算術符号化方法、およびデジタル信号算術復号方法

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20080331

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080513

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080714

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080729

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080917

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20081007

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20081020

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111107

Year of fee payment: 3

R151 Written notification of patent or utility model registration

Ref document number: 4211780

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111107

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121107

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121107

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131107

Year of fee payment: 5

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

EXPY Cancellation because of completion of term