JP2010509893A

JP2010509893A - 可変長符号のメモリ効率の良い符号化

Info

Publication number: JP2010509893A
Application number: JP2009537283A
Authority: JP
Inventors: レズニク、ユリー
Original assignee: Qualcomm Inc
Current assignee: Qualcomm Inc
Priority date: 2006-11-14
Filing date: 2007-11-09
Publication date: 2010-03-25
Anticipated expiration: 2027-11-09
Also published as: DE602007011811D1; EP2092649A2; EP2092649B1; TWI369136B; WO2008061008A3; KR101108465B1; JP4897887B2; CA2668222A1; US7545293B2; KR20090091167A; WO2008061008A2; CA2668222C; BRPI0718618A2; ATE494663T1; US20080111721A1; CN101578769B; CN101578769A; ES2358551T3; TW200838323A

Abstract

一般に、本開示は、ディジタル映像、画像、音声、または言語データの符号化など、様々な用途向けの、メモリ効率の良い低複雑性のデータの適応形可変長符号化（ＶＬＣ）の技術を対象とする。一部の態様では、技術は、非常にコンパクトなデータ構造をサポートするために、特定の組の符号語の特性を利用することができる。他の態様では、技術は、無記憶情報源によって生成される２値系列の低複雑性の適応形符号化および復号をサポートすることができる。

Description

本出願は、それぞれの全内容が参照により本明細書に組み込まれる、２００６年１１月１４日出願の米国仮出願第６０／８６５，８２７号明細書、および２００６年１１月２２日出願の米国仮出願第６０／８６７，０８１号明細書の利益を主張する。

本開示は、データ圧縮に関し、より詳細には、可変長符号（ＶＬＣ）を使用したデータ圧縮に関する。

データ圧縮は、データ記憶空間、伝送帯域幅、またはその両方の消費を低減するために、様々な用途において広範に使用されている。データ圧縮の適用例には、ディジタル映像（video）、画像、言語（speech）および音声の符号化などがある。例えば、ディジタル映像符号化は、ディジタルテレビ、ディジタル直接放送システム（digital direct broadcast system）、無線通信装置、ＰＤＡ（携帯情報端末）、ラップトップまたはデスクトップコンピュータ、ディジタルカメラ、ディジタル記録装置、ビデオゲーム装置、セルラー式または衛星無線電話などを含む、幅広い装置に使用されている。ディジタル映像装置は、より効率的にディジタル映像を送受信するために、ＭＰＥＧ−２、ＭＰＥＧ−４、またはＨ．２６４／ＭＰＥＧ−４ＡｄｖａｎｃｅｄＶｉｄｅｏＣｏｄｉｎｇ（ＡＶＣ）などの映像圧縮技術を実装する。

一般に、映像圧縮技術は、映像データに固有の冗長度を低減し、または削除するために、空間的予測、動き推定、および動き補償を実行する。特に、イントラ符号化は、空間的予測に依存して、所与の映像フレーム内の映像における空間的冗長度を低減し、または削除する。インター符号化は、時間的予測に依存して、隣接するフレーム内の映像の時間的冗長度を低減し、または削除する。インター符号化では、映像符号器は、２つ以上の隣接するフレーム間の整合する映像ブロックの動きを追跡するために、動き推定を行う。動き推定は、１つまたは複数の基準フレームにおける対応する映像ブロックに対する映像ブロックの変位を示す動きベクトルを生成する。動き補償は、動きベクトルを使用して、基準フレームから予測映像ブロックを生成する。動き補償後、元の映像ブロックから予測映像ブロックを取り去ることによって、残余映像ブロック（residual video block）が形成される。

映像符号器は、映像符号化処理によって生成される残余ブロックのビットレートをさらに低減するために、変換、量子化、エントロピ符号化の処理を適用する。エントロピ符号化技術は、符号化されたデータの格納または伝送の前に、映像符号器／復号器（ＣＯＤＥＣ）の最終段階、および他の様々な符号化の適用において使用される。エントロピ符号化は、変換および量子化の操作によって生成される残余係数をさらに圧縮するために、一般に、算術演算符号または可変長符号（ＶＬＣ）の適用を伴う。エントロピ符号化技術の例には、コンテキスト適応形２値算術演算符号化（context-adaptive binary arithmetic coding：ＣＡＢＡＣ）、およびコンテキスト適応形可変長符号化（context-adaptive variable length coding：ＣＡＶＬＣ）などがあり、これらは、いくつかの符号器で、代替のエントロピ符号化モードとして使用され得る。映像復号器は、エントロピ復号を行って、各ブロックの残余情報を復元し、動き情報および残余情報を使用して、符号化された映像を再構成する。

一般に、本開示は、ディジタル映像、画像、音声、または言語データの符号化など、様々な用途向けの、メモリ効率の良い低複雑性のデータの適応形可変長符号化（ＶＬＣ）の技術を対象とする。第１の一般的な態様では、技術は、非常にコンパクトなデータ構造をサポートするために、特定の組の符号語（codeword）の特性を利用することができる。第２の一般的な態様では、技術は、無記憶情報源（memoryless source）によって生成される２値系列の低複雑性の適応形符号化および復号をサポートすることができる。

本開示は、第１の態様において、可変長の符号語を指定する符号化ツリーのレベルについての基本符号語（base codeword）の部分値を生成することと、符号化ツリーの選択されたレベルに進む前に、復号すべきビットストリームにおいて、いくつかのビットをスキップするよう復号器に指示するスキップインジケータを生成することと、メモリ内のデータ構造に、部分値およびスキップインジケータを格納することとを備える方法を提供する。

別の態様において、本開示は、可変長の符号語を指定する符号化ツリーのレベルについての基本符号語の部分値と、符号化ツリーの選択されたレベルに進む前に、復号すべきビットストリームにおいて、いくつかのビットをスキップするよう復号器に指示するスキップインジケータとを格納するデータ構造を備える有形のコンピュータ可読媒体を提供する。

別の態様において、本開示は、可変長の符号語を指定する符号化ツリーのレベルについての基本符号語の部分値を生成し、符号化ツリーの選択されたレベルに進む前に、復号すべきビットストリームにおいて、いくつかのビットをスキップするよう復号器に指示するスキップインジケータを生成するよう構成されているプロセッサと、データ構造に部分値およびスキップインジケータを格納するメモリとを備える装置を提供する。

別の態様において、本開示は、可変長の符号語を指定する符号化ツリーのレベルについての基本符号語の部分値と、符号化ツリーの選択されたレベルに進む前に、復号すべきビットストリームにおいて、いくつかのビットをスキップするよう復号器に指示するスキップインジケータとを備えるデータ構造を格納するメモリと、格納されたデータ構造における部分値およびスキップインジケータに基づいて、ビットストリームからの符号語のうちの１つを復号するためにメモリにアクセスする復号器とを備える復号装置を提供する。

別の態様において、本開示は、可変長の符号語を指定する符号化ツリーのレベルについての基本符号語の部分値と、符号化ツリーの選択されたレベルに進む前に、復号すべきビットストリームにおいて、いくつかのビットをスキップするよう復号器に指示するスキップインジケータとを備える、メモリに格納されたデータ構造にアクセスすることと、格納されたデータ構造における部分値およびスキップインジケータに基づいて、ビットストリームからの符号語のうちの１つを復号することとを備える復号方法を提供する。

別の態様において、本開示は、プロセッサに、可変長の符号語を指定する符号化ツリーのレベルについての基本符号語の部分値と、符号化ツリーの選択されたレベルに進む前に、復号すべきビットストリームにおいて、いくつかのビットをスキップするよう復号器に指示するスキップインジケータとを備える、メモリに格納されたデータ構造にアクセスさせ、格納されたデータ構造における部分値およびスキップインジケータに基づいて、ビットストリームからの符号語のうちの１つを復号させるための命令を備える有形のコンピュータ可読媒体を提供する。

追加の態様において、本開示は、符号化ツリーにおける符号語のグループであって、グループのそれぞれが、同じ重さを有する値を表す符号語を含み、グループのそれぞれにおける符号語が、符号語によって表される値に対して辞書式に順序付けられる符号語のグループと、グループのそれぞれの中の符号語の第１および第２のサブグループであって、第１のサブグループが第１の長さを有する符号語を含み、第２のサブグループが第１の長さとは異なる第２の長さを有する符号語を含む符号語の第１および第２のサブグループとを定義する符号構造に従って可変長の符号化を実行することと、メモリへの格納、装置への送信、またはユーザへの提示のうちの少なくとも１つのために、可変長の符号化の結果を生成することとを備える方法を提供する。

追加の態様において、本開示は、プロセッサに、符号化ツリーにおける符号語のグループであって、グループのそれぞれが、同じ重さを有する値を表す符号語を含み、グループのそれぞれにおける符号語が、符号語によって表される値に対して辞書式に順序付けられる符号語のグループと、グループのそれぞれの中の符号語の第１および第２のサブグループであって、第１のサブグループが第１の長さを有する符号語を含み、第２のサブグループが第１の長さとは異なる第２の長さを有する符号語を含む符号語の第１および第２のサブグループとを定義する符号構造に従って可変長の符号化を実行させ、メモリへの格納、装置への送信、またはユーザへの提示のうちの少なくとも１つのために、可変長の符号化の結果を生成させるための命令を備える有形のコンピュータ可読媒体を提供する。

追加の態様において、本開示は、符号化ツリーにおける符号語のグループであって、グループのそれぞれが、同じ重さを有する値を表す符号語を含み、グループのそれぞれにおける符号語が、符号語によって表される値に対して辞書式に順序付けられる符号語のグループと、グループのそれぞれの中の符号語の第１および第２のサブグループであって、第１のサブグループが第１の長さを有する符号語を含み、第２のサブグループが第１の長さとは異なる第２の長さを有する符号語を含む符号語の第１および第２のサブグループとを定義する符号構造に従って可変長の符号化を実行し、メモリへの格納、装置への送信、またはユーザへの提示のうちの少なくとも１つのために、可変長の符号化の結果を生成するよう構成されているプロセッサを備える装置を提供する。

追加の態様において、本開示は、可変長の符号語を指定する符号化ツリーにおける符号語のグループであって、グループのそれぞれが、同じ重さを有する値を表す符号語を含み、グループのそれぞれにおける符号語が、符号語によって表される値に対して辞書式に順序付けられる符号語のグループと、グループのそれぞれの中の符号語の第１および第２のサブグループであって、第１のサブグループが第１の長さを有する符号語を含み、第２のサブグループが第１の長さとは異なる第２の長さを有する符号語を含む符号語の第１および第２のサブグループとを定義する符号構造について、サブグループのそれぞれの基本符号語、グループのそれぞれの中の符号語の位置、第１のサブグループのそれぞれの中の符号語の数、およびサブグループのそれぞれの中の符号語の長さを使用して可変長の符号化を実行することと、メモリへの格納、装置への送信、またはユーザへの提示のうちの少なくとも１つのために、可変長の符号化の結果を生成することとを備える方法を提供する。

追加の態様において、本開示は、符号構造について、可変長の符号語を指定する符号化ツリーにおける符号語のグループであって、グループのそれぞれが、同じ重さを有する値を表す符号語を含み、グループのそれぞれにおける符号語が、符号語によって表される値に対して辞書式に順序付けられる符号語のグループと、グループのそれぞれの中の符号語の第１および第２のサブグループであって、第１のサブグループが第１の長さを有する符号語を含み、第２のサブグループが第１の長さとは異なる第２の長さを有する符号語を含む符号語の第１および第２のサブグループとを定義するための手段と、サブグループのそれぞれの基本符号語、グループのそれぞれの中の符号語の位置、第１のサブグループのそれぞれの中の符号語の数、およびサブグループのそれぞれの中の符号語の長さを使用して可変長の符号化を実行するための手段と、メモリへの格納、装置への送信、またはユーザへの提示のうちの少なくとも１つのために、可変長の符号化の結果を生成するための手段とを備える装置を提供する。

追加の態様において、本開示は、可変長の符号語を指定する符号化ツリーにおける符号語のグループであって、グループのそれぞれが、同じ重さを有する値を表す符号語を含み、グループのそれぞれにおける符号語が、符号語によって表される値に対して辞書式に順序付けられる符号語のグループと、グループのそれぞれの中の符号語の第１および第２のサブグループであって、第１のサブグループが第１の長さを有する符号語を含み、第２のサブグループが第１の長さとは異なる第２の長さを有する符号語を含む符号語の第１および第２のサブグループとを定義する符号構造について、プロセッサに、サブグループのそれぞれの基本符号語、グループのそれぞれの中の符号語の位置、第１のサブグループのそれぞれの中の符号語の数、およびサブグループのそれぞれの中の符号語の長さを使用して可変長の符号化を実行させ、メモリへの格納、装置への送信、またはユーザへの提示のうちの少なくとも１つのために、可変長の符号化の結果を生成させるための命令を備える有形のコンピュータ可読媒体を提供する。

追加の態様において、本開示は、可変長の符号語を指定する符号化ツリーにおける符号語のグループであって、グループのそれぞれが、同じ重さを有する値を表す符号語を含み、グループのそれぞれにおける符号語が、符号語によって表される値に対して辞書式に順序付けられる符号語のグループと、グループのそれぞれの中の符号語の第１および第２のサブグループであって、第１のサブグループが第１の長さを有する符号語を含み、第２のサブグループが第１の長さとは異なる第２の長さを有する符号語を含む符号語の第１および第２のサブグループとを定義する符号構造について、サブグループのそれぞれの基本符号語、グループのそれぞれの中の符号語の位置、第１のサブグループのそれぞれの中の符号語の数、およびサブグループのそれぞれの中の符号語の長さを使用して可変長の符号化を実行し、メモリへの格納、装置への送信、またはユーザへの提示のうちの少なくとも１つのために、可変長の符号化の結果を生成するよう構成されているプロセッサを備える装置を提供する。

別の態様において、本開示は、符号化ツリーにおける符号語のグループであって、グループのそれぞれが、同じ重さを有する値を表す符号語を含み、グループのそれぞれにおける符号語が、符号語によって表される値に対して辞書式に順序付けられる符号語のグループと、グループのそれぞれの中の符号語の第１および第２のサブグループであって、第１のサブグループが第１の長さを有する符号語を含み、第２のサブグループが第１の長さとは異なる第２の長さを有する符号語を含む符号語の第１および第２のサブグループとを定義する可変長の符号構造を使用した可変長の符号化のためのデータ構造を備える有形のコンピュータ可読媒体を提供する。

別の態様において、本開示は、可変長の符号語を指定する符号化ツリーのレベルについての基本符号語の部分値と、符号化ツリーの選択されたレベルに進む前に、復号すべきビットストリームにおけるいくつかのビットをスキップするよう復号器に指示するスキップインジケータとを備えるデータ構造を格納するメモリと、格納されたデータ構造における部分値およびスキップインジケータに基づいて、ビットストリームからの符号語のうちの１つを復号するためにメモリにアクセスする復号器とを備える集積回路装置を提供する。

別の態様において、本開示は、可変長の符号語を指定する符号化ツリーのレベルについての基本符号語の部分値と、符号化ツリーの選択されたレベルに進む前に、復号すべきビットストリームにおけるいくつかのビットをスキップするよう復号器に指示するスキップインジケータとを備えるデータ構造を格納するメモリと、格納されたデータ構造における部分値およびスキップインジケータに基づいて、ビットストリームからの符号語のうちの１つを復号するためにメモリにアクセスする復号器と、無線通信によって符号器から符号語を受信するための受信機と、復号された符号語に少なくとも一部分基づいてユーザに出力を提示する出力装置とを備える無線通信装置ハンドセットを提供する。

別の態様において、本開示は、符号化ツリーにおける符号語のグループであって、グループのそれぞれが、同じ重さを有する値を表す符号語を含み、グループのそれぞれにおける符号語が、符号語によって表される値に対して辞書式に順序付けられる符号語のグループと、グループのそれぞれの中の符号語の第１および第２のサブグループであって、第１のサブグループが第１の長さを有する符号語を含み、第２のサブグループが第１の長さとは異なる第２の長さを有する符号語を含む符号語の第１および第２のサブグループとを定義する符号構造に従って可変長の符号化を実行するよう構成されているプロセッサであって、メモリへの格納、装置への送信、またはユーザへの提示のうちの少なくとも１つのために、可変長の符号化の結果を生成するよう構成されているプロセッサを備える集積回路装置を提供する。

別の態様において、本開示は、符号化ツリーにおける符号語のグループであって、グループのそれぞれが、同じ重さを有する値を表す符号語を含み、グループのそれぞれにおける符号語が、符号語によって表される値に対して辞書式に順序付けられる符号語のグループと、グループのそれぞれの中の符号語の第１および第２のサブグループであって、第１のサブグループが第１の長さを有する符号語を含み、第２のサブグループが第１の長さとは異なる第２の長さを有する符号語を含む符号語の第１および第２のサブグループとを定義する符号構造に従って可変長の符号化を実行するよう構成されているプロセッサであって、メモリへの格納、装置への送信、またはユーザへの提示のうちの少なくとも１つのために、可変長の符号化の結果を生成するよう構成されているプロセッサを備える無線通信装置ハンドセットを提供する。

本開示に記載した技術は、ハードウェア、ソフトウェア、ファームウェア、またはその任意の組み合わせにおいて実装され得る。ソフトウェアに実装された場合、ソフトウェアは、マイクロプロセッサ、特定用途向け集積回路（ＡＳＩＣ）、フィールドプログラマブルゲートアレイ（ＦＰＧＡ）、またはディジタル信号プロセッサ（ＤＳＰ）、または他の等価の一体型または別個の論理回路など、１つまたは複数のプロセッサにおいて実行され得る。これらの技術を実行するソフトウェアは、最初にコンピュータ可読媒体に格納され、プロセッサによってロードされ、実行され得る。したがって、本開示は、本開示に記載した様々な技術のうちの任意のものをプロセッサに実行させるための命令を備えるコンピュータ可読媒体を備えるコンピュータプログラム製品も企図する。

本開示の１つまたは複数の態様の詳細は、添付の図面および以下の説明に記載されている。本開示に記載されている技術の他の特徴、目的、および利点は、説明、図面、および特許請求の範囲から明らかになる。

映像符号化および復号システムを示すブロック図。映像符号器の一例を示すブロック図。映像復号器の一例を示すブロック図。２値符号化ツリーの一例を示す図。漸近的挙動（asymptotic behavior）を有する適応形ブロック符号の冗長レートを示すグラフ。ブロックグループ、サブグループ、基本符号語を示す２値ツリーの図。異なる値ｐでの適応形ブロック符号の冗長レートの比較を示すグラフ。異なる値ｐでの適応形ブロック符号の冗長レートの比較を示すグラフ。源データの非対称に対する冗長の感度を示すグラフ。本開示の一態様による、単調分布についてのメモリ効率の良い可変長の符号化を構成するための方法を示すフロー図。図９の方法に従って構成された可変長の符号を使用して記号を符号化するための方法を示すフロー図。図９の方法に従って構成された可変長の符号を復号するための方法を示すフロー図。本開示の別の態様による適応形ブロック符号を構成するための方法を示すフロー図。図１２の方法に従って構成された可変長の符号を使用してブロックを符号化するための方法を示すフロー図。図１２の方法に従って構成された可変長の符号を復号するための方法を示すブロック図。

一般に、本開示は、ディジタル映像、画像、音声、または言語データの符号化など、様々な用途向けの、メモリ効率の良い低複雑性のデータの適応形可変長符号化（ＶＬＣ）の技術を対象とする。一部の態様では、技術は、非常にコンパクトなデータ構造をサポートするために、特定の組の符号語の特性を利用することができる。他の態様では、技術は、無記憶情報源によって生成される２値系列の低複雑性の適応形符号化および復号をサポートすることができる。本開示に記載されている技術は、一般のデータ圧縮および符号化を含めて、広範囲の実用的な応用に適用可能であるが、本開示は、例および例証の目的で、ディジタル映像符号化および復号について言及する。

本開示の第１の一般的な態様によれば、コンパクトなデータ構造をサポートするために、開示された技術は、任意の特定の符号構成方式（code construction scheme）に依存する必要はない。例えば、ハフマン、シャノン、シャノン−ファノ、ギルバート−ムーア、または他の符号構成方式を使用することができる。しかし、この第１の一般的な態様については、こうした符号は、記号の確率が単調に増加する源について、記号の入力アルファベットから構成されることを前提とする。より詳細には、符号語は、単調に減少する長さ、または少なくとも非増加の長さを有すること、および同じ長さの符号語は、それらが表す入力アルファベットにおける記号と同じ辞書式順序を有することを前提とする。

所望の辞書式順序は、入力アルファベットの並べ替えによって達成することができる。こうした符号語の場合、基本符号語値は、符号化ツリーのレベルごとに計算することができる。基本符号語値は、符号化ツリーの各レベルにおける、辞書式に最小の正準符号語（canonical codeword）を表す。そのそれぞれの記号の基本符号語値およびインデックスは、並べ替えられた配列に格納され得る。インデックスは、ツリーにおける埋められたレベルごとに、オフセット値として格納され得る。復号プロセスは、ビットストリームバッファと、左寄せの基本符号語値との比較、次いで復号された記号のインデックスの簡単な直接計算を伴う。

可変長の符号の漸進的復号を容易にする非常にコンパクトなデータ構造を生成するためにさらに圧縮することができるデータ構造により、こうした符号を一意に記述するために、上記の特性を使用することができる。例えば、左寄せの基本符号語値は、通常、右から左への大量の先行ゼロ（leading zero）を有する。先行ゼロの数は、プロセスが、該当する符号化ツリーにおけるより深い層に移動するにつれて、単調に低下する。したがって、一番最初の層で開始し、下方に移動しながら、ビットが順次復号されるとき、復号プロセスの精度に影響を与えることなく、先行ゼロビットの一部をスキップすることができる。

先行ゼロは、一定単位、例えば８ビット単位で削除することができ、これは、従来の８ビット／バイトコンピュータにおけるビットストリームバッファ管理に便利である。このプロセスを管理するために、１つまたは複数のスキップインジケータの追加の表を提供することができる。一例として、スキップインジケータは、先行ゼロがドロップされると、異なる基本符号語値を区別することができるように、復号器に、ビットストリームバッファにおいて一定単位だけ前方にスクロールするよう指示する。先行ゼロの削除によって、変更された基本符号語値の結果として得られた配列の幅を実質的に低減することができ、したがって、メモリ使用率を節約することができる。

したがって、第１の一般的な態様において、本開示は、可変長の符号語を指定する符号化ツリーのレベルについての基本符号語の部分値を生成することと、符号化ツリーの選択されたレベルに進む前に、復号すべきビットストリームにおいて、いくつかのビットをスキップするよう復号器に指示するスキップインジケータを生成することと、メモリ内のデータ構造に、部分値およびスキップインジケータを格納することとを備える方法を企図する。データ構造は、テーブル、リンクリスト、２値ツリー、ラディックスツリー、フラットファイルなど、広範なデータ構造のうちの任意のものでよく、多くの形式のランダムアクセスメモリ（ＲＡＭ）、読み取り専用メモリ（ＲＯＭ）、またはその両方など、様々な異なるメモリ装置のうちの任意のものに格納することができる。データ構造は、符号器または復号器内のこうしたメモリに格納することができる。例えば、復号器は、メモリ効率の良い方法で符号語の可変長の復号を行うために、復号器に関連付けられているメモリから、データ構造、またはデータ構造のコンテンツの部分にアクセスすることができる。

この第１の一般的な態様によれば、本開示は、可変長の符号語を指定する符号化ツリーのレベルについての基本符号語の部分値を生成し、符号化ツリーの選択されたレベルに進む前に、復号すべきビットストリームにおいて、いくつかのビットをスキップするよう復号器に指示するスキップインジケータを生成するよう構成されているプロセッサと、データ構造に部分値およびスキップインジケータを格納するメモリとをさらに企図する。こうした情報は、単一のデータ構造または複数のデータ構造に格納することができる。したがって、データ構造への言及は、本開示において企図された情報を格納する１つまたは複数のデータ構造を含み得る。可変長の符号化を実行するために、データ構造にアクセスするよう構成されているプロセッサは、源装置または受信装置内、または可変長の符号化を実行する際に、符号器および／または復号器によって使用する符号構造を定義するデータ構造を生成する別個の装置内に実装することができる。

本開示の第１の一般的な態様に従う、コンパクトなデータ構造を達成するためのこの技術によれば、それぞれの有効な符号語の長さは、符号ツリーにおける外部ノードを含むレベルに対応し得る。上述したように、データ構造は、基本符号語の部分値、および１つまたは複数のスキップインジケータを含み得る。より詳細には、一部の実施形態では、データ構造は、有効な符号語長ごとに、以下の情報、（ａ）符号ツリーの現在のレベルにおける辞書式に最小（または最大）の符号語の部分値、（ｂ）部分値におけるビット数、（ｃ）辞書式に最小（または最大）の符号語に対応する記号の値、および（ｄ）符号ツリーの次のレベルに進む前に、いくつかの数のビットをスキップするよう復号器に指示するインジケータを含み得る。したがって、データ構造は、基本符号語によって表される記号の値、および基本符号語の部分値の長さ、すなわち、基本符号語の各部分値におけるビット数をさらに含み得る。符号化および復号の技術は、このデータ構造を使用して、生成または復号すべき符号語に対応するレベルを識別し、次いで、符号語または復号された記号の値を直接計算することができる。したがって、データ構造は、そのうちの一部が結合されたＣＯＤＥＣとして構成され得る映像符号器または復号器、画像符号器または復号器、音声符号器または復号器、または言語符号器または復号器のメモリに格納することができる。

可変長の符号の符号化または復号のための既存の技術の例は、A. Moffat and A. Turpin, On the Implementation of Minimum-Redundancy Prefix Codes, IEEE Trans. Communications, 45 (10) (1997) 1200-1207, J. B. Connell, A Huffman-Shannon-Fano Code, Proc. IEEE, July 1973, 1046-1047、およびA. Brodnik and S. Carlsson, Sublinear Decoding of Huffman Codes Almost in Place, DIMACS Workshop on Codes and Trees: Algorithmic and information Theoretic Approaches, October 1998, Rutgers University, DIMACS Center, NJに記載されている。これらの既存の技術に比べて、コンパクトなデータ構造を達成するための開示された技術は、いくつかの利点を提供し得る。

第１の例として、開示された技術によって生成されるデータ構造は、辞書式に最小の符号語の部分値が、例えば映像復号器によって格納され、使用されるという事実により、かなり少量のメモリを使用し得る。別の例として、開示された技術は、ビットストリームデータへの増分的アクセスを使用することができ、これによって、ビットストリームバッファを、適度に短いレジスタによって提示し、例えばスキップ指示を介して、任意の便利な間隔で更新することができ、実装の複雑性をさらに低減することができる。

例えば、一部の実装では、非常に長い符号の場合でさえ、３２ビットレジスタで十分であり得る。さらに、更新を８ビット間隔で行うことができる。全体的に、開示された技術は、可変長符号の表現および符号化／復号の複雑性をかなり低減することができ、これによって、圧縮アルゴリズムの設計者は、かなり大きい、したがって、より効率の良いコードブックを使用することができるようになる。

本開示の第２の一般的な態様によれば、無記憶情報源によって生成された２値系列の低複雑性の適応形符号化および復号をサポートするために、開示された技術は、ある系列における前のビットの非ゼロビットの数によって識別される１組のコンテキストのために構成されたユニバーサルブロック符号（universal block code）を実装し得る。この第２の一般的な態様は、非常にコンパクトなデータ構造の生成に関して上述した第１の一般的な態様とは別に、またはそれと共に提供され、または実施され得る。低複雑性の適応形符号化および復号のための技術は、この第２の一般的な態様によれば、R. E. Krichevsky and V. K. Trofimov, The Performance of Universal Encoding, IEEE Trans Information Theory, 27 (1981) 199-207に記載されている推定を改良する、こうした符号の漸近的冗長について開示された決まったやり方に依存し得る。

この第２の一般的な態様による技術は、いくつかの推定された密度のために設計され、ある系列における前のブロック（コンテキスト）内の非ゼロのビットの数によってインデックスが付けられたハフマン符号の配列を使用することができる。ｎ＝８・・・１６の小さめなサイズのビットのブロックを使用する（および対応する１．５・・・５ｋバイトのメモリを使用する）ことによって、こうした技術は、W. B. Pennebaker, J. L. Mitchell, G. G. Langdon, Jr., R. B. Arps, An overview of the basic principles of the Q-Coder adaptive binary arithmetic coder, IBM J. Res. Dev., 32 (6) (1988) 717に記載されており、ＪＢＩＧ画像符号化標準に使用されるＱコーダアルゴリズム、およびD. Marpe, H. Schwartz, and T. Wiegand, Context-Based Adaptive Binary Arithmetic Coding in the H.264/AVC video compression standard, IEEE Trans. on CSVT, 13(7):620 636, July 2003に記載されており、映像圧縮のためのＩＴＵ−ＴＨ．２６４／ＭＰＥＧＡＶＣ標準で使用されるＣＡＢＡＣアルゴリズムなど、他の既存のアルゴリズムに匹敵する、またはそれより優れた圧縮性能を達成し得る。

低複雑性の適応形符号化および復号は、本開示のこの第２の一般的な態様によれば、無記憶情報のモデルにおいて、ビットのブロックの確率、またはその推定が、そのビットの実際のパターンではなく、その重さ（非ゼロのビットの数）のみに依存するという認識に基づき得る。したがって、ある固定長のすべての可能なブロックの組を、同じ重さ（およびしたがって、同じ確率）のブロックを含む異なるグループに分けることができる。各グループが、ブロックを、自然にまたは並べ替えによって、辞書式順序で格納することが想定され得る。

蓋然性が等しいブロックの各グループは、多くとも２つのサブグループを含むことができ、こうした各サブグループ内のブロックが同じ長さの符号語によって符号化されることは、最小冗長符号（ハフマン符号やシャノン符号など）の既知の特性である。一般性を損ねることなく、第１のサブグループにおける符号語の長さは、第２のサブグループにおける符号語の長さより短いことがさらに想定され得る。グループ内のブロック（または単語）は、辞書式順序に従うため、これは、より大きい符号語長を有するサブグループと、より短い符号語長を有するサブグループとで簡単に分けることができる。インデックス値は、グループ内のブロックの位置を示す。各サブグループ内の辞書式に最小のブロック（または単語）に、基本符号語が割り当てられる。基本符号語が与えられると、各サブグループ内の残りの符号語は、容易に計算することができる。

したがって、本開示のこの第２の一般的な態様によれば、例えば、符号化ツリーにおける入力ブロックまたは単語およびそれぞれの出力符号語のグループであって、同じ重さを有するブロック（または単語）を表す符号語をぞれぞれ含むグループと、グループのそれぞれの中の符号語の第１および第２のサブグループであって、第１のサブグループが第１の長さを有する符号語を含み、第２のサブグループが第１の長さとは異なる第２の長さを有する符号語を含む符号語の第１および第２のサブグループとを定義する符号構造を使用する符号器または復号器によって可変長符号化を実行することができる。グループのそれぞれの中のブロックは、辞書式に順序付けられ、次いで、辞書式の順序が各サブグループにおいて維持されるように、サブグループに分けられる。さらに、サブグループ内の各ブロックに対応する符号語が割り当てられるので、それらも同じ辞書式順序に従い、直接計算による符号化および復号を容易にする。

ブロック、そのグループおよびサブグループのこの配列に基づいて、簡略化されたプロセスを使用して、符号語を直接計算することができる。例えば、ブロックの重さおよびインデックス値を取得すると、インデックス値が第１のサブグループにおける最大数のブロック未満である場合、符号語を見つけ出すために、第１のサブグループが選択される。そうでない場合、符号語を見つけ出すために、第２のサブグループが選択される。次いで、選択されたサブグループについての基本符号語を取り出すと、基本符号語値を、選択されたサブグループ内のブロックのインデックス値に基づいて決定された値と合計することによって、符号語は、容易に計算される。本開示のこの第２の一般的な態様のために、ブロックまたは単語という用語は、符号化方式に従って符号化され得る入力量を一般的に指すのに区別なく使用され得る。ブロックまたは単語は、２値アルファベット｛０，１｝など、入力アルファベットから形成され得る一連の記号を含み得る。符号語は、一般に、符号化方式の結果としてブロック（または単語）に割り当てられた出力量を指す。

本開示に記載されている技術のこれらおよび他の態様について、以下でより詳しく説明する。技術は、一緒にまたは別々に使用することができ、ディジタル映像、画像、音声、または言語データの符号化または復号のために構成されるシステムおよび装置を含めて、様々な符号化および復号システムおよび装置のうちの任意のものにおいて実装することができる。例および例証の目的で、本開示は、データ圧縮および符号化の一般の実用的な応用、または異なるタイプのデータへの他の特定の適用に関する制限なく、こうした技術をディジタル映像符号化および復号に適用することを説明する。

図１は、映像符号化および復号システム１０を示すブロック図である。図１に示されているように、システム１０は、通信チャネル１６を介して受信装置１４に符号化された映像を送信する源装置１２を含む。源装置１２は、映像源１８、映像符号器２０、および送信機２２を含み得る。受信装置１４は、受信機２４、映像復号器２６、および映像表示装置２８を含み得る。システム１０は、ディジタル映像データの、メモリ効率の良い低複雑性の適応形可変長符号化（ＶＬＣ）の技術を適用するよう構成され得る。特に、メモリ効率の良い低複雑性の適応形ＶＬＣ技術は、予測映像符号化（predictive video coding）プロセスによって生成される残余ブロック係数（residual block coefficient）のエントロピ符号化に使用することができる。これらの技術は、一連のゼロを使用して、非ゼロ変換係数の位置を符号化する映像符号化方式、または他の映像符号化方式に適用することができる。

図１の例において、通信チャネル１６は、無線周波数（ＲＦ）スペクトルまたは１つまたは複数の物理的な伝送路など、任意の無線または有線の通信媒体、または無線および有線の媒体の任意の組み合わせを備え得る。チャネル１６は、例えばローカルエリアネットワーク、広域ネットワーク、またはグローバルネットワーク（global network）、例えばインターネットなど、パケットベースのネットワークの一部を形成し得る。通信チャネル１６は、一般に、映像データを源装置１２から受信装置１４に送信するための任意の適した通信媒体、または異なる通信媒体の集まりを表す。

源装置１２は、宛先装置１４に送信するための映像を生成する。しかし、一部の場合、装置１２、１４は、実質的に対称の方法で動作し得る。例えば、装置１２、１４のそれぞれは、映像符号化および復号の成分を含み得る。したがって、システム１０は、例えば、映像ストリーミング、映像ブロードキャスティング（video broadcasting）、またはテレビ電話のためなど、映像装置１２、１４の間の一方向または双方向の映像伝送をサポートし得る。他のデータ圧縮および符号化の用途では、装置１２、１４は、画像、言語、または音声データなど、または映像、画像、言語、および音声データのうちの２つ以上の組み合わせなど、他のタイプのデータを送信し、受信し、または交換するよう構成することができる。したがって、映像の用途の説明は、例証の目的で提供され、本明細書で広範に記載されるように、本開示の様々な態様の制限と見なされないものとする。

映像源１８は、１つまたは複数のビデオカメラ、前に捕捉した映像を含む映像アーカイブ、または映像コンテンツプロバイダから提供されたライブ映像など、映像捕捉装置を含み得る。別の代替として、映像源１８は、源映像としてのコンピュータグラフィックスベースのデータ、またはライブ映像とコンピュータが生成した映像との組み合わせを生成し得る。一部の場合、映像源１８がカメラであれば、源装置１２および受信装置１４は、いわゆるカメラ付き電話、またはテレビ電話を形成し得る。したがって、一部の態様において、源装置１２、受信装置１４、またはその両方は、移動電話など、無線通信装置ハンドセットを形成し得る。いずれの場合でも、捕捉された、前に捕捉された、またはコンピュータで生成された映像は、送信機２２、チャネル１６、および受信機２４を介して映像源装置１２から映像受信装置１４の映像復号器２６に送信するために、映像符号器２０によって符号化され得る。表示装置２８は、液晶ディスプレイ（ＬＣＤ）、プラズマディスプレイ、有機発光ダイオード（ＯＬＥＤ）ディスプレイなど、様々なディスプレイ装置のうちの任意のものを含み得る。

映像符号器２０および映像復号器２６は、空間的、時間的、および／またはＳＮ比（ＳＮＲ）スケーラビリティのために、拡張可能な映像符号化をサポートするよう構成され得る。一部の態様において、映像符号器２０および映像復号器２２は、ＳＶＣのための細粒度ＳＮＲスケーラビリティ（ＦＧＳ）符号化（fine granularity SNR scalability (FGS) coding）をサポートするよう構成され得る。符号器２０および復号器２６は、基本層（base layer）および１つまたは複数の拡張可能な高機能層（enhancement layer）の符号化、伝送、および復号をサポートすることによって、様々な度合いのスケーラビリティをサポートし得る。拡張可能な映像符号化では、基本層は、最低レベルの品質で映像データを運ぶ。１つまたは複数の高機能層は、より高い空間的、時間的、および／またはＳＮＲレベルをサポートするために、追加のビットストリームを運ぶ。

映像符号器２０および映像復号器２６は、ＭＰＥＧ−２、ＭＰＥＧ−４、ＩＴＵ−ＴＨ．２６３、またはＩＴＵ−ＴＨ．２６４／ＭＰＥＧ−４ＡｄｖａｎｃｅｄＶｉｄｅｏＣｏｄｉｎｇ（ＡＶＣ）などの映像圧縮標準に従って動作し得る。図１には示されてないが、一部の態様において、映像符号器２０および映像復号器２６は、それぞれ音声符号器および復号器と統合され、共通のデータストリームまたは別々のデータストリームにおける音声および映像の両方の符号化を処理するために、適切なＭＵＸ−ＤＥＭＵＸユニット、または他のハードウェアおよびソフトウェアを含むことができる。該当する場合、ＭＵＸ−ＤＥＭＵＸユニットは、ＩＴＵＨ．２２３多重化装置プロトコル、またはユーザデータグラムプロトコル（ＵＤＰ）など他のプロトコルに準拠し得る。

Ｈ．２６４／ＭＰＥＧ−４（ＡＶＣ）標準は、ＪｏｉｎｔＶｉｄｅｏＴｅａｍ（ＪＶＴ）として知られる共同パートナーシップの成果として、ＩＴＵ−ＴＶｉｄｅｏＣｏｄｉｎｇＥｘｐｅｒｔｓＧｒｏｕｐ（ＶＣＥＧ）、およびＩＳＯ／ＩＥＣＭｏｖｉｎｇＰｉｃｔｕｒｅＥｘｐｅｒｔｓＧｒｏｕｐ（ＭＰＥＧ）によって策定された。Ｈ．２６４標準は、本明細書では、Ｈ．２６４標準またはＨ．２６４仕様、またはＨ．２６４／ＡＶＣ標準または仕様と呼ばれ得るＩＴＵ−ＴＳｔｕｄｙＧｒｏｕｐによる２００５年３月付けのITU-T Recommendation H.264, Advanced video coding for generic audiovisual servicesに記載されている。

ＪｏｉｎｔＶｉｄｅｏＴｅａｍ（ＪＶＴ）は、引き続き、Ｈ．２６４／ＭＰＥＧ−４ＡＶＣへの拡張可能な映像符号化（ＳＶＣ）の拡張に取り組んでいる。発展するＳＶＣの拡張の仕様は、ＪｏｉｎｔＤｒａｆｔ（ＪＤ）の形をしている。ＪＶＴによって作成されたＪｏｉｎｔＳｃａｌａｂｌｅＶｉｄｅｏＭｏｄｅｌ（ＪＳＶＭ）は、本開示に記載されている様々な符号化タスクのために、システム１０内で使用され得る、拡張可能な映像で使用するためのツールを実装する。細粒度ＳＮＲスケーラビリティ（ＦＧＳ）符号化に関する詳細な情報は、例えばＪｏｉｎｔＤｒａｆｔ６（ＳＶＣＪＤ６）におけるThomas Wiegand, Gary Sullivan, Julien Reichel, Heiko Schwarz, and Mathias Wien, "Joint Draft 6: Scalable Video Coding," JVT-S 201, April 2006, Geneva、およびＪｏｉｎｔＤｒａｆｔ９（ＳＶＣＪＤ９）におけるThomas Wiegand, Gary Sullivan, Julien Reichel, Heiko Schwarz, and Mathias Wien, "Joint Draft 9 of SVC Amendment," JVT-V 201, January 2007, Marrakech, MoroccoなどのＪｏｉｎｔＤｒａｆｔ文書で見つけることができる。

一部の態様において、映像ブロードキャスティングの場合、本開示に記載されている技術は、例えば、無線映像ブロードキャストサーバまたは無線通信装置ハンドセットを介して、技術標準ＴＩＡ−１０９９（「ＦＬＯ仕様」）として発行されるForward Link Only (FLO) Air Interface Specification, "Forward Link Only Air Interface Specification for Terrestrial Mobile Multimedia Multicast"を使用して、ｔｅｒｒｅｓｔｒｉａｌｍｏｂｉｌｅｍｕｌｔｉｍｅｄｉａｍｕｌｔｉｃａｓｔ（ＴＭ３）システムにおいて、リアルタイム映像サービスを配信するためのＥｎｈａｎｃｅｄＨ．２６４映像符号化に適用され得る。ＦＬＯ仕様は、ビットストリーム構文記述およびセマンティクス、およびＦＬＯＡｉｒＩｎｔｅｒｆａｃｅに適した復号プロセスを定義する例を含む。あるいは、映像は、ＤＶＢ−Ｈ（ｄｉｇｉｔａｌｖｉｄｅｏｂｒｏａｄｃａｓｔ−ｈａｎｄｈｅｌｄ）、ＩＳＤＢ−Ｔ（ｉｎｔｅｇｒａｔｅｄｓｅｒｖｉｃｅｓｄｉｇｉｔａｌｂｒｏａｄｃａｓｔ−ｔｅｒｒｅｓｔｒｉａｌ）、またはＤＭＢ（ｄｉｇｉｔａｌｍｅｄｉａｂｒｏａｄｃａｓｔ）など、他の標準に従ってブロードキャストされ得る。したがって、源装置１２は、移動無線端末、映像ストリーミングサーバ、または映像ブロードキャストサーバとすることができる。しかし、本開示に記載されている技術は、ブロードキャスト、マルチキャスト、またはポイントツーポイントシステムの任意の特定のタイプに限定されない。ブロードキャストの場合、源装置１２は、映像データのいくつかのチャネルを、図１の受信装置１４にそれぞれ類似し得る複数の受信装置にブロードキャストすることができる。

映像符号器２０および映像復号器２６はそれぞれ、１つまたは複数のマイクロプロセッサ、ディジタル信号プロセッサ（ＤＳＰ）、特定用途向け集積回路（ＡＳＩＣ）、フィールドプログラマブルゲートアレイ（ＦＰＧＡ）、別個のロジック、ソフトウェア、ハードウェア、ファームウェア、またはその任意の組み合わせとして実装され得る。したがって、映像符号器２０および映像復号器２６のそれぞれは、少なくとも部分的に集積回路（ＩＣ）チップまたは装置として実装することができ、いずれもそれぞれの移動装置、加入者装置、ブロードキャスト装置、サーバなどに、結合された符号器／復号器（ＣＯＤＥＣ）の一部として統合され得る１つまたは複数の符号器または復号器に含まれ得る。さらに、源装置１２および受信装置１４はそれぞれ、該当する場合、無線通信をサポートするのに十分な無線周波数（ＲＦ）無線構成要素およびアンテナを含めて、符号化された映像の送受信に適した変調、復調、周波数変換、フィルタリング、および増幅器の構成要素を含み得る。しかし、説明を簡単にするために、こうした構成要素は、図１に示していない。

映像系列は、一連の映像フレームを含む。映像符号器２０は、映像データを符号化するために、個々の映像フレーム内の画素のブロックに対して働く。映像ブロックは、固定または可変のサイズを有していてよく、指定された符号化標準に従ってサイズが異なり得る。各映像フレームは、一連のスライスを含む。各スライスは、サブブロックに配列され得る一連のマクロブロックを含み得る。一例として、ＩＴＵ−ＴＨ．２６４標準は、輝度成分（luma component）については１６×１６、８×８、４×４、色度成分（chroma component）については８×８など、様々なブロックサイズのイントラ予測、および輝度成分については１６×１６、１６×８、８×１６、８×８、８×４、４×８、４×４、色度成分については対応する変倍サイズなど、様々なブロックサイズのインター予測をサポートする。

より小さい映像ブロックは、より良い解像度を提供することができ、より高いレベルの詳細を含む映像フレームの位置の特定に使用され得る。一般に、マクロブロック（ＭＢ）および様々なサブブロックは、映像ブロックであると考えることができる。さらに、スライスは、ＭＢおよび／またはサブブロックなど、一連の映像ブロックであると考えることができる。各スライスは、別々に復号可能な単位とすることができる。予測後、８×８の残余ブロック、または４×４の残余ブロックに変換が行われ、イントラ１６×１６予測モードが使用される場合、色度成分または輝度成分についての４×４ブロックのＤＣ係数に、追加の変換が適用され得る。

図１のシステム１０の映像符号器２０および／または映像復号器２６は、本開示に記載したように、メモリ効率の良い低複雑性の適応形可変長符号化（ＶＬＣ）のための技術を使用するよう構成され得る。特に、映像符号器２０および／または映像復号器２６は、メモリ使用率、処理オーバーヘッド、処理複雑性、帯域幅消費、データ格納スペース、および／または消費電力を低減するために、こうした技術の少なくとも一部を適用する、エントロピ符号器およびエントロピ復号器をそれぞれ含み得る。

図２は、図１に示すような映像符号器２０の一例を示すブロック図である。映像符号器２０は、少なくとも一部分、まとめて集積回路装置と呼ばれ得る１つまたは複数の集積回路装置として形成され得る。一部の態様では、映像符号器２０は、無線通信装置ハンドセットまたはブロードキャストサーバの一部を形成し得る。映像符号器２０は、映像フレーム内のブロックのイントラおよびインター符号化を実行し得る。イントラ符号化は、空間的予測に依存して、所与の映像フレーム内の映像における空間的冗長度を低減し、または削除する。インター符号化は、時間的予測に依存して、映像系列の隣接するフレーム内の映像の時間的冗長度を低減し、または削除する。インター符号化では、映像符号器２０は、隣接するフレーム間の整合する映像ブロックの動きを追跡するために、動き推定を行う。

図２に示すように、映像符号器２０は、符号化すべき映像フレーム内の現在の映像ブロック３０を受信する。図２の例において、映像符号器２０は、動き推定ユニット３２、基準フレームストア３４、動き補償ユニット３６、ブロック変換ユニット３８、量子化ユニット４０、逆量子化ユニット４２、逆変換ユニット４４およびエントロピ符号化ユニット４６を含む。エントロピ符号化ユニット４６は、符号化に有用なデータを取得するために、メモリ４５に格納されている１つまたは複数のデータ構造にアクセスし得る。ループ内デブロッキングフィルタ（in-loop deblocking filter）（図示せず）は、ブロッキングアーティファクト（blocking artifact）を削除するために、ブロックをフィルタ処理するために適用され得る。映像符号器２０は、加算器４８および加算器５０も含む。図２は、映像ブロックのインター符号化のための映像符号器２０の時間的予測構成要素を示す。説明を簡単にするために、図２には示されていないが、映像符号器２０は、いくつかの映像ブロックのイントラ符号化のための、空間的予測構成要素も含み得る。

動き推定ユニット３２は、１つまたは複数の動きベクトルを生成するために、映像ブロック３０を、１つまたは複数の隣接する映像フレーム内のブロックと比較する。１つまたは複数の隣接するフレームは、前に符号化されたブロックから再構成された映像ブロックを格納するための任意のタイプのメモリまたはデータ格納装置を備え得る基準フレームストア３４から取り出すことができる。動き推定は、例えば、１６×１６、１６×８、８×１６、８×８、またはより小さいブロックサイズなど、可変サイズのブロックについて実行され得る。動き推定ユニット３２は、例えば、レート歪みモデル（rate distortion model）に基づいて、現在の映像ブロック３０に最も近い、隣接するフレーム内の１つまたは複数のブロックを識別し、隣接するフレーム内のブロックと現在の映像ブロックとの間の変位を決定する。これに基づいて、動き推定ユニット３２は、現在の映像ブロック３０と現在の映像ブロック３０を符号化するために使用される基準フレームからの１つまたは複数の一致するブロックとの間の変位の大きさおよび軌道を示す１つまたは複数の動きベクトル（ＭＶ）を生成する。

動きベクトルは、半分または１／４の画素精度、またはさらに細かい精度を有している場合があり、これによって映像符号器２０は、整数画素位置より高い精度で動きを追跡し、より良い予測ブロックを取得することができる。小数画素値を含む動きベクトルが使用されると、動き補償ユニット３６において、補間演算が行われる。動き推定ユニット３２は、レート歪みモデルなど、何らかの基準を使用して、映像ブロックについての最高のブロック分割、および１つまたは複数の動きベクトルを識別する。例えば、双方向予測の場合、１つより多くの動きベクトルが存在する場合がある。結果として得られたブロック分割および動きベクトルを使用して、動き補償ユニット３６は、予測映像ブロックを形成する。

映像符号器２０は、加算器４８において、元の、現在の映像ブロック３０から、動き補償ユニット３６によって生成された予測映像ブロックを取り去ることによって、残余映像ブロックを形成する。ブロック変換ユニット３８は、Ｈ．２６４／ＡＶＣで使用される４×４または８×８の整数変換などの変換を残余ブロックに適用して、残余変換ブロック係数を生成する。量子化ユニット４０は、ビットレートをさらに減らすために、残余変換ブロック係数を量子化する。エントロピ符号化ユニット４６は、ビットレートをまたさらに減らすために、量子化された係数をエントロピ符号化する。

エントロピ符号化ユニット４６は、ＶＬＣ符号化を量子化されたブロック係数に適用するために、可変長符号化（ＶＬＣ）ユニットとして動作する。特に、エントロピ符号化ユニット４６は、本開示に記載したようなメモリ効率の良い低複雑性の適応形ＶＬＣ技術を使用して、ディジタル映像ブロック係数のＶＬＣ符号化を実行するよう構成することができる。したがって、本開示に記載されている様々な符号化プロセスは、映像データの符号化を実行するために、エントロピ符号化ユニット４６内に実装され得る。あるいは、こうしたエントロピ符号化ユニット４６は、それだけには限定されないが、映像、画像、言語、および音声データを含めて、様々なデータのうちの任意のものを符号化するために、本開示に記載されているプロセスを実行し得る。一般に、映像復号器２６は、例えば図３を参照して説明するように、符号化された映像を復号し、再構成するために、ＶＬＣ復号を含めて、逆の操作を実行する。

逆量子化ユニット４２および逆変換ユニット４４は、残余ブロックを再構成するために、逆量子化および逆変換をそれぞれ適用する。加算器５０は、再構成された残余ブロックを、動き補償ユニット３６によって生成された動き補償済みの予測ブロックに追加して、再構成された映像ブロックを生成して基準フレームストア３４に格納する。再構成された映像ブロックは、次の映像フレームにおけるブロックを符号化するために、動き推定ユニット３２、および動き補償ユニット３６によって使用される。

図３は、映像復号器２６の一例を示すブロック図である。映像復号器２６は、少なくとも一部分、まとめて集積回路装置と呼ばれ得る１つまたは複数の集積回路装置として形成され得る。一部の態様では、映像復号器２６は、無線通信装置ハンドセットの一部を形成し得る。映像復号器２６は、映像フレーム内のブロックのイントラおよびインター復号を実行し得る。図３に示されるように、映像復号器２６は、映像符号器２０によって符号化された符号化済みの映像ビットストリームを受信する。図３の例において、映像復号器２６は、エントロピ復号ユニット５２、動き補償ユニット５４、逆量子化ユニット５６、逆変換ユニット５８、および基準フレームストア６２を含む。エントロピ復号ユニット５２は、符号化に有用なデータを取得するために、メモリ５１に格納されている１つまたは複数のデータ構造にアクセスし得る。映像復号器２６は、加算器６４の出力をフィルタ処理するループ内デブロッキングフィルタ（図示せず）も含み得る。映像復号器２６は、加算器６４も含む。図３は、映像ブロックのインター復号のための映像復号器２６の時間的予測構成要素を示す。図３には示されていないが、映像復号器２６は、いくつかの映像ブロックのイントラ復号のための、空間的予測構成要素も含み得る。

エントロピ復号ユニット５２は、符号化された映像ビットストリームを受信し、ビットストリームからの、量子化された残余係数、マイクロブロック符号化モード、および動きベクトルおよびブロック分割を含み得る動き情報を復号する。したがって、エントロピ復号ユニット５２は、ＶＬＣ復号ユニットとしての役目を果たす。例えば、符号化されたビットストリームからの量子化された残余係数を復号するために、図２のエントロピ符号化ユニット４６のように、図３のエントロピ復号ユニット５２は、本開示に記載されているような、ディジタル映像ブロック係数のメモリ効率の高い低複雑性の適応形ＶＬＣ復号を実行することができる。しかし、エントロピ復号ユニット５２は、符号化されたビットストリームから量子化されたブロック係数を取り出すために、図２のエントロピ符号化ユニット４６に対して逆の方法でＶＬＣ復号を実行することができる。したがって、本開示に記載されている様々な復号プロセスは、映像データの復号を実行するために、エントロピ復号ユニット５２内に実装される。あるいは、こうしたエントロピ復号ユニット５２は、それだけには限定されないが、映像、画像、言語、および音声データを含めて、様々なデータのうちの任意のものを復号するために、本開示に記載されているプロセスを実行し得る。いずれの場合でも、エントロピ復号ユニット５２によって実行された可変長の符号化の結果は、ユーザに出力され、メモリに格納され、かつ／または別の装置または処理ユニットに送信され得る。

動き補償ユニット５４は、予測映像ブロックを生成するために、動きベクトルおよびブロック分割、および１つまたは複数の再構成された基準フレームを基準フレームストア６２から受信する。逆量子化ユニット５６は、量子化されたブロック係数を逆量子化、すなわち逆量子化する。逆変換ユニット５８は、残余ブロックを生成するために、逆ＤＣＴ、逆４×４または８×８整数変換など、逆変換を係数に適用する。予測映像ブロックは、次いで、復号されたブロックを形成するために、加算器６４によって、残余ブロックと合計される。デブロッキングフィルタ（図示せず）は、ブロッキングアーティファクトを削除するために、復号されたブロックをフィルタ処理するために適用され得る。フィルタ処理されたブロックは、次いで、その後の映像フレームの復号のために基準フレームを提供し、表示装置２８（図１）を駆動するために、復号された映像を生成する基準フレームストア６２に入れられる。

可変長符号のメモリ効率の良い符号化
次に、本開示の第１の一般的な態様による、コンパクトなデータ構造をサポートするための可変長符号化のためのメモリ効率の良い技術の一例について、より詳細に説明する。この技術は、ハフマン、シャノン、シャノン−ファノ、ギルバートムーア、または他の符号など、任意の特定の符号構成方式に依存する必要はない。しかし、この技術は、記号の確率が単調に増加する源について、符号が構成されることを前提とする。より詳細には、符号語は、単調に減少する（または少なくとも非増加の）長さを有すること、および同じ長さの符号語は、それらが表す入力アルファベットにおける記号と同じ辞書式順序を有することを前提とする。

この技術は、映像符号化または他の用途に適用されるとき、非常にコンパクトなデータ構造により、こうした符号を一意に記述するために、上記の特性を使用する。上述したように、データ構造は、有効な符号語の長さ、すなわち符号ツリーにおける外部ノードを含むレベルごとに、以下の情報、
ａ．符号ツリー中の現在のレベルにおける辞書式に最小（または最大）の符号語の部分値
ｂ．部分値におけるビット数
ｃ．辞書式に最小（または最大）の符号語に対応する記号の値
ｄ．符号ツリーの次のレベルに進む前に、いくつかの数のビットをスキップするよう復号器に指示するインジケータ
を含み得る。

符号化および復号のプロセスは、この構造を使用して、生成（または復号）すべき符号語に対応する符号ツリーのレベルを識別し、次いで、符号語（または復号された記号）の値を直接計算することができる。

この技術によって、辞書式に最小の符号語の部分値のみが格納されるという事実により、符号化および復号に、かなり少量のメモリを使用できるようになる。データ構造は、テーブル、リンクリスト、２値ツリー、ラディックスツリー、フラットファイルなど、広範なデータ構造のうちの任意のものでよく、多くの形式のランダムアクセスメモリ（ＲＡＭ）、読み取り専用メモリ（ＲＯＭ）、またはその両方など、様々な異なるメモリ装置のうちの任意のものに格納することができる。データ構造は、図２および図３にそれぞれ示されているメモリ４５またはメモリ５１内など、符号器または復号器内のこうしたメモリに格納することができる。この場合も、符号化ツリーのレベルの少なくともいくつかは、符号語によって表される記号値の順序に対して辞書式順序で配列される符号語を含む。したがって、基本符号語のそれぞれは、符号化ツリー中の対応するレベルにおける、辞書式に最小の符号語である。さらに、この技術は、ビットストリームデータへの増分的アクセスを使用することができ、これによって、ビットストリームバッファを、適度に短いレジスタによって提示することができる。例えば、３２ビットレジスタは、非常に長い符号でさえ、十分であり得る。レジスタは、便利な間隔（例えば８ビットなど）で更新することができ、実装の複雑性をさらに低減することができる。全体的に、様々な態様において、この技術は、可変長符号の表現および符号化／復号の複雑性をかなり低減することができ、これによって、圧縮アルゴリズムの設計者は、より大きく、より効率の良いコードブックを使用することができるようになる。

次に、本開示に記載されている技術の例証を助けるために、可変長符号の一般論について説明する。可変長符号は、データ圧縮における基本的なツールを表す。一般に、可変長符号は、何らかの既知の、一般にかなり不均衡な分布の記号の系列を表すために使用される。こうした系列は、全長がかなり短い２値系列または符号によって表すことができる。長さの短縮は、より頻繁に出現する記号をより短い符号に置き換え、あまり頻繁に出現しない記号をより長い符号に置き換えることによって達成される。

データ圧縮で使用される可変長符号の例には、例えばD. A. Huffman. A method for the construction of minimum-redundancy codes. Proc. IRE, vol. 40, pp. 1098-1101. Sept. 1952に記載されているハフマン符号、例えばC. E. Shannon, A mathematical theory of communication, Bell Syst. Tech J. Vol. 27. pp. 379-423, July 1948に記載されているシャノン符号、例えばR M. Fano, The transmission of information, Res. Lab. Electronics, Massachusetts Inst. of Technology, Cambridge, Mass. Tech. Rep. No. 65, 1949に記載されているシャノン−ファノ符号、および例えばE. N. Gilbert and E. F. Moore, Variable-Length Binary Encodings, Bell Syst. Tech. J., Vol.7, pp. 932-967, 1959に記載されているギルバートムーア符号（シャノン−ファノ−エリアス符号と呼ばれることもある）がある。

上述した符号は、例えば、T. Cover and J. Thomas, Elements of Information Theory, Wiley, 1991に記載されているような、あるクラスの接頭符号（prefix free code）に属する。図４は、２値符号化ツリーの一例を示す図である。上述した符号は、図４に示されているものなど、２値ツリーによって便利に表すことができる。したがって、符号器は、符号化ツリーに一致する記号値を符号化し得る。ツリーによる値は、映像データ、画像データ、言語データ、または音声データなど、様々なデータのうちの任意のものを表すことができる。こうしたツリーにおける各内部ノードは、その０値が右への移動を強制し、１値がツリーにおける左の子ノードへの移動を強制する２進数に対応する。一番上のノードは、符号化／復号がそこから開始するノードであるルートノードと呼ばれる。

ツリーにおける各外部ノードでは、符号化／復号プロセスが再開され、すなわちルートから現在のノードまでのビットの系列としての符号語、または現在の符号語に関連付けられている記号の復号された値のいずれかが生成される。図４の符号ツリー例では、０から１５までインデックスが付けられた記号に対応する１６の符号語がある。この例では、最短の符号語は、１ビットの長さを有し、最長の符号語は、それぞれ１０ビットの長さを有する。このツリーにおいて外部ノード（符号語）を含むレベルの数は、７、すなわち、第１、第３、第４、第６、第７、第９、および第１０のレベルである。

さらに図４を参照して、ｎは、符号ツリーにおける外部ノードの数（およびしたがって符号における符号語の数）を示し、Ｌは、最長の符号語の長さ、Ｋは、符号ツリーにおける外部ノードで埋められるレベルの数を示すとする。以下の説明では、ポールバッハマンのО記法を使用する。例えば、式ｙ（ｎ）＝О（ｘ（ｎ））は、十分に大きいすべてのｎについて、｜ｙ（）｜≦Ｍ｜ｘ（ｎ）｜となるようなある定数Ｍ＞０の存在を示す。

符号化プロセスをサポートするために、エントロピ符号化ユニット４６またはエントロピ復号ユニット５２などの符号器または復号器は、一般に、メモリ４５またはメモリ５１など、コンピュータメモリに２値ツリーを格納する必要がある。さらに、符号化および復号プロセスは、メモリに格納されている符号化ツリーのビットごと（すなわちノードごと）のトラバースを伴うはずである。したがって、こうした実装は、О（ｎ）ストレージコストを要し、最高О（Ｌ）ステップまでかかるはずである。それにもかかわらず、一部の特別な場合では、符号化ツリーが何らかの特定の構造を有するとき、こうした符号構造を格納し、符号化または復号の操作を実行する、より効果的な方法があり得る。

例えば、図４の符号化ツリーの例に提示されている符号を考えると、符号語は、非低減の長さであること、および符号化ツリーの同じレベルにおけるすべての符号語は、隣接する値を有することを観察することができる。例えば、図４のツリーの第４レベルの符号語は、ツリーの第３レベルの符号語より長く、すなわち、０００１対０１１、０１０、００１、および０００である。さらに、第３レベルの符号語は、０１１、０１０、０１１、０００の隣接する値を有する。したがって、すべての符号を格納する代わりに、符号化ツリーのレベルごとに、最小または最大の符号語のみを、すなわち隣接する符号語をそこから計算することができる基本符号語として格納することで十分であり得る。

上記の観察は、例えばA. Moffat and A. Turpin, On the Implementation of Minimum-Redundancy Prefix Codes, IEEE Trans. Communications, 45 (10) (1997) 1200-1207に記載されているように、いわゆる正準形への符号の変換に基づいて可変長の符号を復号する技術を理解する鍵である。簡単に言えば、正準の符号は、長さの非低減分布を有し、そのノードに割り当てられているインデックスに対して辞書式順序を維持する。結果として得られた符号が上記の特性を有するように、任意の所与の源を並べ替えることができることを示すのは、かなり簡単である。

例えば、図４の符号化ツリーに示されている符号は、以下の表１に示すように、非単調分布の源についての並べ替えられた符号を表す。具体的には、表１は、並べ替えられた正準の可変長符号の一例である。

上記の表１において、記号０は、最も高い確率を有し、１、２が続く。しかし、記号３は、４より低い確率を有し、４および８は、１および２と同じ確率を有する。並べ替え後、すべての記号の確率は、単調に増加（非低減）しており、その結果、図４の符号化ツリーにおいて表現して示される正準の符号が得られる。A. Moffat and A. Turpin, On the Implementation of Minimum-Redundancy Prefix Codes, IEEE Trans. Communications, 45 (10) (1997) 1200-1207に記載されている、いわゆるＭｏｆｆａｔ−Ｔｕｒｐｉｎアルゴリズムは、正準の符号を復号するための技術を提供する。本開示に記載されている技術は、Ｍｏｆｆａｔ−Ｔｕｒｐｉｎアルゴリズムと比べて、改善をもたらし得る。J. B. Connell, A Huffman-Shannon-Fano Code, Proc. IEEE, July 1973, 1046-1047、およびA. Brodnik and S. Carlsson, Sublinear Decoding of Huffman Codes Almost in Place, DIMACS Workshop on Codes and Trees: Algorithmic and information Theoretic Approaches, October 1998, Rutgers University, DIMACS Center, NJに記載されているものなど、他のアルゴリズムは、Ｍｏｆｆａｔ−Ｔｕｒｐｉｎアルゴリズムに似ており、開示された技術を似たように使用することによって、改良することもできる。

可変長符号の復号のためのＭｏｆｆａｔ−Ｔｕｒｐｉｎアルゴリズムについて、以下で説明する。入力アルファベットＡは、ｎ個の文字を含む：Ａ＝｛α_０，・・・α_ｎ−１｝と仮定すると、並べ替えｉ：Ａ→｛０，・・・，ｎ−１｝は、結果として得られた確率がｐ_０≦ｐ_１≦・・・≦ｐ_ｎ−１を満たすように適用される。次いで、Ｌが最長の符号語の長さである場合、インデックス１≦ｉＬごとに、符号語ｌ_ｉの長さを割り当てる、ハフマンまたは他の最小冗長構成アルゴリズムを適用することができる。その結果、「集団数（population number）」は、ｍ_ｌ、すなわち、長さｌの符号語の数として生成される。

これらのパラメータを使用して、以下のように、ツリーにおけるレベルごとにいわゆる「基本」値が計算される。

これらの基本符号語値は、符号化ツリーの各レベルにおける、辞書式に最小の正準符号語を表す。ｂａｓｅ［ｌ］の基本符号語値が与えられると、次に、長さｌのｍ_ｌ個の符号語の中のｊ＋１番目の符号語の値を計算することができる。

復号器の動作では、次のように左寄せバージョンの基本符号語値を格納することがより便利である。

この場合、Ｗは、ビットストリームから最後にロードされたビットを保持するために使用されるビットバッファまたはレジスタの長さである。Ｗ≧Ｌであると仮定する。

最後に、基本符号語値に加えて、Ｍｏｆｆａｔ−Ｔｕｒｐｉｎ復号器は、並べ替えられた配列に、それぞれの記号のインデックスも格納する。これらのインデックスは、ツリーにおける埋められたレベルごとに、ｏｆｆｓｅｔ［ｌ］値として格納される。図４のツリーによって表される符号についてのＭｏｆｆａｔ−Ｔｕｒｐｉｎアルゴリズムによって維持される完全な構造例が、以下の表２に示される。

表２の構造を使用したＭｏｆｆａｔ−Ｔｕｒｐｉｎ復号アルゴリズムの実装のための擬似符号例が、以下の表３に示される。

上記の表３から、復号プロセス全体は、現在のビットストリームバッファと左寄せの基本符号語値とのＫ回までの（Ｗビット）比較を伴い、次いで、復号された記号のインデックスの簡単な直接計算を伴うことがわかる。また、こうした構造によって使用されるｌｊ＿ｂａｓｅ［］配列は、メモリのО（Ｋ＊Ｗ）ビットを必要とすることもわかり、このことは、ＷがＷ≧ｌとなるように使用されなければならないため、符号語が長い場合、問題となり得る。

表３の例において、復号器は、ビットストリームからＶとしてＷビットを受信し、符号化ツリーの連続するレベルｉについて、Ｖと基本符号語（ｌｊ＿ｂａｓｅ［ｉ］）と比較する。Ｖ以下である基本符号語が見つかると、符号語のレベルの検索を終了する。次いで、復号器は、レベルｉに関連付けられている長さを決定し、ｌビットずつビットストリームをスクロールし、記号を復号する。特に、復号された記号は、レベルｉについてのオフセット値、およびビットストリームからの符号語ＶとＷ−Ｉビットだけ右にシフトされた、レベルｉの基本符号語との間の差との合計によって決定される。

一般の設定では、Ｍｏｆｆａｔ−Ｔｕｒｐｉｎ復号に準ずるとき、逆マッピングルックアップ（inverse mapping lookup）ｉ^−１：｛０，・・・，ｎ−１｝→Ａである。この場合、最後の演算は、О（ｎ）スペースを必要とするため、最もメモリを使うものとなる。しかし、多くの実際的な場合では、変換または予測子のランレングスまたは出力を伴う状況など、符号化する必要のある源は、すでに順序付けられている。したがって、Ｍｏｆｆａｔ−Ｔｕｒｐｉｎ構造におけるｌｊ＿ｂａｓｅ［］配列によって使用されるメモリは、ストレージコスト全体における主要因となる。

第１の一般的な態様によれば、本開示に記載されている技術は、Ｍｏｆｆａｔ−Ｔｕｒｐｉｎアルゴリズムまたは他のアルゴリズムで使用されるデータ構造のこれ以上の圧縮を可能にする改良点を提供し、可変長符号の増分的復号をサポートする。次に、改良点について、より詳しく説明する。表２を参照すると、ｌｊ＿ｂａｓｅ［ｌ］値が右から左への先行ビットを大量に有することは明らかである。したがって、基本符号語の部分値は、基本符号語からの固定数の先行ビットの削除を表す。ほとんどの場合、削除される先行ビットは、ゼロである。符号化ツリーがより深い層に達するにつれて、こうしたゼロの数は、単調に増加している。したがって、符号化ツリーの一番最初の層で開始し、下方に移動しながら、ビットが順序復号される場合、復号の正確さに影響を与えることなく、先行ゼロビットの一部をスキップすることができる。先行ゼロの少なくとも一部をスキップすることによって、本開示に記載されている技術は、非常に圧縮されたデータ構造、および可変長の符号の増分的復号を可能にする。

しかし、先行ビットが削除されると、符号化ツリーのより低いレベルにおけるいくつかの正当な符号が、削除される先行ビットの範囲まで及ぶ可能性がある。したがって、こうした符号を失うのを避けるために、スキップインジケータの表が提供される。スキップインジケータは、符号化ツリーの選択されたレベルに進む前に、復号すべきビットストリームにおいて、いくつかのビットをスキップするよう復号器に指示する。特に、スキップインジケータは、符号化ツリーの選択されたレベルに進む前に、符号語ビットストリームにおいて、固定数のビット、例えば８ビットなどをスキップするよう復号器に指示することができる。このようにして、ツリーの選択されたレベルにおける基本符号語の部分値は、固定数のビットだけ、基本符号語をシフトすることに基づく。シフトなしでは、ツリーの選択されたレベルにおける基本符号語は、少なくとも部分的に削除された数の先行ビットまで及ぶことになる。

以下の表４は、符号語を表し、処理するために使用されるデータ構造をさらに圧縮するために、本開示の一態様に従って先行ゼロが削除される符号化プロセスの実装例を示す。表４の例において、先行ゼロは、８単位で削除され、これは、従来の８ビット／バイトコンピュータにおけるビットストリームバッファ管理に便利である。先行ゼロの削除を管理するために、上述したように、インジケータ（ｓｋｉｐ＿８［ｉ］）の追加の表が提供される。したがって、表４は、一般に、表２に合致するが、先行ゼロを各符号語から削除し、スキップインジケータ列を追加する。

表４の例において、値ｒ＿ｌｊ＿ｂａｓｅ（ｉ）は、各インデックス位置における基本符号語値を表し、値ｒ＿ｌｅｖｅｌ［ｉ］は、そのインデックス位置についての符号化ツリー内のレベル、およびそのレベルにおける符号語の長さを示し、値ｏｆｆｓｅｔ［ｉ］は、基本符号語値についての、右から左への先行ゼロの数を示し、値ｓｋｉｐ＿８［ｉ］は、次の基本符号語値について、復号器が８ビットをスキップすべきかどうかを示し、１はスキップを指定し、０はスキップなしを指定する。このスキップ操作は、そうでなければ、先行ゼロが削除されると失われることになる符号語を復号器が識別できるようにするために、選択された間隔で、ビットバッファを定期的にリフレッシュする。例えば、左寄せの符号語の一番右の８つの先行ゼロが削除される場合、一番右の８ビットに及ぶ符号語は、部分的に、または完全に失われることになる。したがって、スキップ指示に応答して一番左の８ビットをスキップすることは、符号語を削除されないビットの範囲に移動させることになり、それによって、復号に使用する符号語を保持する。

したがって、スキップインジケータは、表４の例において、例えば８など、符号の次のレベルについて、指定されたスキップ増分だけ復号器が前方にスキップすべきとき、信号で伝える。一例として、表２において、インデックス位置５および６（ツリーレベル９および１０）にある基本符号語値は、それぞれ００００００００１０００００００および００００００００００００００００である。一番右の８つの先行ゼロ（左寄せ）がこれらの基本符号語値から削除されるとき、８つの先行ゼロを削除するときに実際の基本符号語値（００００００００１０００００００）が失われないように、復号器が前方に８ビットスキップすることが必要である。代わりに、実際の基本符号語値（００００００００１０００００００）は、最初の８ビット（００００００００）をスキップし、次いで、一番右の８つの先行ゼロを削除することによって、異なる基本符号語値（１０００００００）に変換される。

先行ゼロの削除により、変更されたｌｊ＿ｂａｓｅ［ｉ］配列の幅は、かなり小さくなる。表４の符号において、一例として、変更されたｌｊ＿ｂａｓｅ［ｉ］配列の幅Ｗは、表２の場合のＷ＝１６の代わりに、Ｗ＝８である。こうした余分のスキップ表を使用して、定期的にビットバッファをリフレッシュするアルゴリズムの実装の一例が、以下の表５に示されている。表５に示されるように構成されたアルゴリズムは、非常に長い符号語または非常にコンパクトな基本符号語値（ｌｊ＿ｂａｓｅ）表をサポートするよう構成され得る。

表５に示されるように、復号器は、ビットストリームから最後のＷビットを取得し、これは、値Ｖ＝ｂｉｔｓｔｒｅａｍ＿ｂｕｆｆｅｒによって表されている。次いで、復号器は、ビットストリームバッファからの符号語Ｖ以下である基本符号語値ｌｊ＿ｂａｓｅ［ｉ］について、符号化ツリーのレベルｉを検索する。ツリーの現在のレベルｉが、例えば表５に示されるように、スキップレベル（ｓｋｉｐ＿Ｂ［ｉ］）に対応する場合、復号器は、復号器によって検索される次のレベルの符号語を、Ｂ個の一番右の先行ゼロの削除によって失うのではなく、保持することができるように、例えば、いくつかの実装における８ビットなど、Ｂビットだけ右にビットストリームをスクロールする。

例えば、表５に示されるように、ツリーの現在のレベルにおける符号語についての残余長さｌ＝ｌｅｖｅｌ［ｉ］を決定すると、復号器は、長さｌだけビットストリームをスクロールする。次いで、復号器は、現在のレベルｉについてのオフセット、およびビットストリームバッファコンテンツＶと、Ｗ−ｌビットだけ右にシフトされた、現在のレベルｉの基本符号語との間の差の合計に基づいて、記号インデックスを直接計算する。

復号器は、基本符号語の部分値、スキップインジケータ、基本符号語によって表される値、および基本符号語の部分値の長さ（すなわち、ビット数）を指定する格納されているデータ構造を使用して、符号語ビットストリームからの符号語を復号する。一般に、エントロピ復号ユニット５２などの復号器に関連付けられているプロセッサは、符号語のビットストリームからの符号語以下である基本符号語の部分値のうちの選択された１つについて、符号化ツリーのレベルを検索する。プロセッサは、スキップインジケータに応答して、選択されたレベルの符号化ツリーに進む前に、符号語ビットストリームにおいて、いくつかのビットをスキップし、符号語以下の基本符号語の部分値のうちの選択された１つと符号語との間の差、および符号語以下の基本符号語の部分値のうちの選択された１つのインデックスに基づいて、符号語に対応する複数の値のうちの１つを計算する。プロセッサは、メモリ内に格納する、異なる装置または処理ユニットに送信する、またはユーザに提示するために、復号の結果を生成する。例えば、復号された結果を、表示装置２８を駆動して、映像または画像を提示し、かつ／または音声出力装置を駆動して、音声または言語出力を提示するために使用することができる。

表５の例において、復号器は、そうでなければ、先行ゼロが削除されると失われる符号語を保持するために、スキップ操作を介してビットストリームバッファの増分的更新を実行する。さらに、復号器が符号の各レベルで比較する基本符号語値を、かなり短くすることができる。次に、基本符号語値の長さの短縮の可能な量について説明する。本開示に記載されている変更されたアルゴリズムにおけるこうした量のダイナミックレンジを分析するために、２つの隣接するレベルの間の差は、以下のように考えられる。

ｉが次の非空のレベルのインデックスである場合、次のようになる。

ここで、注目すべき主な量は、ｍ_ｌ＋ｉ２^−ｉであり、これは、この差に影響を与える。最も簡単な場合、ｉ＝１であるとき、この差は、単に、外部ノード数に依存することが明らかであり、したがって、Ｗは、以下になるように選択することができる。

これは、最も実際的な場合では、Ｌよりかなり小さい量である。この差は、かなり不均衡な分布の場合、特に大きいはずである。

例えば、入力記号がベルヌーイ確率ｐ^ｍ（１−ｐ）^ｍ−ｋでｍビットのブロックである場合、最も埋められたレベルは、おおよそ

の符号語を含むはずであり、これは、符号語間を区別するために、おおよそＨ（ｐ）ｍビットを使用すべきであることを意味し、ここでは、Ｈ（ｐ）は、例えばT. Cover and J. Thomas, Elements of Information Theory, Wiley, 1991に記載されているエントロピ関数である。

一方、この場合の最長の符号語は、おおよそ

ビットを有し、この場合、非対称分布では、

であることがよく知られており、式中、Ｈ_−∞（ｐ）は、例えばW.Szpankowski, Average Case Analysis of Algorithms on Sequences (New York, John Wiley & Sons, 2001)に記載されているような、レニーエントロピの特別な場合である。ｐ≧０またはｐ≧１で、この差を任意に大きくすることができる。

上記の説明に基づいて、提案された技術は、大きい、非対称の符号構造の処理に効果的であるはずであるということになる。こうした構造は、従来の／既存の技術を使用して処理することが従来難しく、多くの場合、技術者は、それらをより実用的にするために、符号の圧縮性能に影響を与える様々な簡略化を使用するという方法を採る。

例えば、S. Golomb, "Run-length coding," IEEE Trans. Inform. Theory, vol. IT-12, pp. 399-401, July 1966およびR. Gallager and D. van Voorhis, "Optimal source codes for geometrically distributed integer alphabets," IEEE Trans. Inform. Theory, vol. IT-21, pp. 228-230, Mar. 1975に記載されているものなど、非常に人気のあるゴロム符号は、特に簡単な構造で可変長符号を表すが、これらは、幾何分布のクラス、およびこうした分布の加算無限のパラメータの値にのみ最適である。技術者は、主に複雑性の問題が動機となる、著しく分散する分布にさえ、それらを使用する傾向にある。こうした解決策は、こうした符号の暗黙の性能の制約のために、準最適であり、また拡張または変更が非常に難しくなり得る。

T. J. Lynch, Sequence time coding for data compression, Proc. IEEE (Lett.), 54 (1966) 1490-1491およびL. D. Davisson, Comments on Sequence time coding for data compression, Proc. IEEE (Lett.), 54 (1966) 2010-2011に記載されているようなＬｙｎｃｈ−Ｄａｖｉｓｓｏｎ符号の設計に関連付けられている別の解決策は、符号を、最初の１つのみが可変長符号化を受け、残りの１つが固定数のビットを使用して拡張として送信される、２つの部分に分割することである。残念ながら、こうした分割における効率の損失があり、それは、時として、記号ごとに１．５〜２ビットの大きさとなる。

より手の込んだバージョンのコードブック分割技術が、例えばBoris Ryabko, Jaakko Astola, Karen Egiazarian, Fast Codes for Large Alphabets, Communications in Information and Systems, v.3, n. 2, pp.139-152、およびBoris Ryabko, Jorma Rissanen, Fast Adaptive Arithmetic Code for Large Alphabet Sources with Asymmetrical Distributions, IEEE Communications Letters, v. 7, no. 1, 2003,pp.33-35に記載されているように、アルファベットグループ分け（alphabet grouping）の名で開発されている。しかし、この手法も、圧縮効率において、いくらかの損失を犠牲にする。

上述した技術とは異なり、本開示に記載されている技術は、符号の構造および最適性を十分保持するよう構成することができ、したがって、ディジタル映像、画像、音声、または言語データの符号化および復号においてなど、データ圧縮および符号化における広範な実用的な応用に役立つツールとなり得る。

２値適応形ブロック符号化
次に、本開示の第２の一般的な態様による、無記憶情報源によって生成される２値系列の適応形可変長符号化の低複雑性技術の一例について、より詳しく説明する。この開示された技術は、ある系列における前のビットの非ゼロビットの数によって識別される１組のコンテキストのために構築されたユニバーサルブロック符号を実装し得る。本開示のこの第２の一般的な態様は、非常にコンパクトなデータ構造の生成に関して上述した第１の一般的な態様とは別に、またはそれと共に実施され、または提供され得る。データ構造は、テーブル、リンクリスト、２値ツリー、ラディックスツリー、フラットファイルなど、広範なデータ構造のうちの任意のものでよく、多くの形式のランダムアクセスメモリ（ＲＡＭ）、読み取り専用メモリ（ＲＯＭ）、またはその両方など、様々な異なるメモリ装置のうちの任意のものに格納することができる。データ構造は、符号器または復号器内のこうしたメモリに格納することができる。この第２の一般的な態様によれば、低複雑性の適応形符号化および復号のための技術は、R. E. Krichevsky and V. K. Trofimov, The Performance of Universal Encoding, IEEE Trans. Information Theory, 27 (1981) 199-207に記載されている推定を改良する、こうした符号の漸近的冗長の決まったやり方に少なくとも一部分依存し得る。

データ圧縮アルゴリズムは、何らかの未知の分布のビットの入力系列を復号可能なビットストリームに変換する。例えば、画像または映像コーデック、音声コーデックにおけるスペクトルの拡張可能（ビットスライスベースの）符号化、および他の用途の設計において、データ圧縮が使用される。こうした場合のほとんどは、符号化されるビットは、変換フィルタ、予測フィルタなど、様々な信号処理ツールによって生成される値から取得され、このことは、それらはすでに十分相関が取り除かれており、こうした源の無記憶情報性の前提が正当とされることを意味する。

こうした２値適応形アルゴリズムのほとんどの一般的に使用されている実装は、一般的に、その複雑性を低減するために何らかの近似および簡単な方法が適用された状態の算術演算符号に基づく。こうしたアルゴリズムの２つのよく知られている例には、W. B. Pennebaker, J. L. Mitchell, G. G. Langdon, Jr., R. B. Arps, An overview of the basic principles of the Q-Coder adaptive binary arithmetic coder, IBM J. Res. Dev., 32 (6) (1988) 717に記載されており、ＪＢＩＧ画像符号化標準に使用されるＱコーダアルゴリズム、またはD. Marpe, H. Schwartz, and T. Wiegand, Context-Based Adaptive Binary Arithmetic Coding in the H.264/AVC video compression standard, IEEE Trans. on CSVT, 13(7):620 636, July 2003に記載されており、映像圧縮のためのＩＴＵ−ＴＨ．２６４／ＭＰＥＧＡＶＣ標準で使用されるＣＡＢＡＣアルゴリズムがある。

本開示のこの第２の一般的な態様によれば、代替の実装は、いくつかの推定された密度のために設計され、ある系列における前のブロック（コンテキスト）内の非ゼロのビットの数によってインデックスが付けられたハフマン符号の配列を使用する。効率および実装の両方の観点から、こうした技術は、例えばｎ＝８・・・１６の小さめなサイズのビットのブロックを使用し、および例えば１．５ｋバイト・・・５ｋバイトの対応するメモリ量を使用することによって、所望の圧縮性能を達成することができる。

この技術は、確率ｐおよびｑ＝１−ｐが対応する２値アルファベット｛０，１｝から記号を生成する無記憶情報源の文脈で考えることができる。ｗがこの源によって生成された長さｎの単語である場合、その確率は、

であり、式中、ｋは、この単語における１の数を示す。値ｋは、ｗの重さと呼ぶこともできる。

ブロック符号Φは、長さ｜ｗ｜＝ｎの単語ｗと、２値系列（または符号語）Φ（ｗ）との間の単射であり、

式中、符号語Φ（ｗ）は、例えばT. M. Cover and J. M. Thomas, Elements of Information Theory, (John Wiley & Sons, New York, 1991)に記載されているような、一意に復号可能な組を表す。

一般に、源（すなわち、その確率ｐ）が既知であるとき、こうした符号は、その平均長さ、または相対語では、その平均冗長度を最低限に抑えるようになっている。

上記の式では、Ｈ（ｐ）＝−ｐｌｏｇｐ−ｑｌｏｇｑは、源のエントロピを示す。

この問題を解決するために提案された符号およびアルゴリズムの従来の例には、ハフマン、シャノン、シャノン−ファノ、およびギルバートムーア符号、およびその変形などがある。こうした符号の性能は、よく研究されており、こうした符号についての多くの有用な実用的実装技術も報告されている。

源が未知であるとき、使用可能な最適なオプションは、源のクラスについて、最悪の場合の冗長を最低限に抑えるユニバーサル符号Φ＊を設計することであり、例えばB. M. Fitingof, Optimal Coding in the Case of Unknown and Changing Message Statistics, Probl. Inform. Transm., 2, (2) (1965) 3 {11 (in Russian) 1-7 (English Transl.), L. D. Davisson, Universal Noiseless Coding, IEEE Trans. Inform. Theory, 19 (6) (1973), 783-795およびR. E. Krichevsky and V. K. Trofimov, The Performance of Universal Encoding, IEEE Trans. Information Theory, 27 (1981) 199-207に記載されており、以下に示される通りである。

こうした符号の一例は、単語の確率の以下の推定を使用して、構成することができる。

式中、Γ（ｘ）は、Γ関数、ｋは、単語ｗの重さ、およびｎは、その長さである。上記の公式は、R. E. Krichevsky and V. K. Trofimov, The Performance of Universal Encoding, IEEE Trans. Information Theory, 27 (1981) 199-207に記載されており、ｎが無限大（ｎ≧∞）に近づくにつれて、真の確率への一様（ｐ）収束を確実にする。

源のパラメータの正確な値がわからない状況で、過去にこの源によって生成された記号の系列ｕにアクセスすることができる。こうした系列は、サンプルと呼ぶことができ、｜ｕ｜＝ｔビット長と見なすことができる。ここでのタスクは、このサンプルの異なる値によってインデックスが付けられた１組の符号

を設計することであり、以下に示されるように、その結果として得られる最悪の場合の平均冗長度を最小に抑えるようにする。

こうした符号は、サンプルベースまたは適応形ユニバーサルブロック符号と呼ばれる。この開示では、サンプルｕが与えられると、以下の単語ｗの確率の推定を使用して、適応形ブロック符号の特定の実装を記載する。

式中、ｓは、サンプルの重さ、ｔは、その長さである。

すぐ上の推定量関数（estimator function）（１）を使用したサンプルベースの符号の概念および分析は、R. E. Krichevsky in R. E. Krichevsky, Universal Data Compression and Retrieval (Kluwer, Norwell, MA, 1993)によって記載されている。適応形ブロック符号の平均冗長レートは、漸近的に

であり、式中、ｎはブロックサイズ、ｔは、サンプルのサイズである。

上記の式（２）から、長さｔ＝О（ｎ）のサンプルを使用することによって、既知の源について、ブロック符号の冗長レートの順序に一致する、こうした符号の冗長レートをО（１／ｎ）に低下させることが可能であることが明らかである。しかし、こうした符号の十分な可能性を理解することができるように、ハフマン、シャノンなど、実際の符号構成アルゴリズムの選択によって影響を受ける項を含めて、その冗長についてのより正確な式を知る必要がある。

この第２の一般的な態様によれば、本開示は、Ｋｒｉｃｈｅｖｓｋｙの定理２の以下の改良を提供する。特に、以下の定理１は、以下のように、適応形ブロック符号

についての平均冗長レートの定理を改良する。

定理１：適応形ブロック符号

の平均冗長レートは、以下の漸近的挙動（ｎ，ｔ≧∞）を有する。

式中、ｎはブロックサイズ、ｔはサンプルサイズ、ｐ、ｑ＝１−ｐは、入力源の記号の確率であり、

は、上記の式（１）で推定された分布に対する符号

の平均冗長度である。

の正確な挙動は、アルゴリズム固有である。しかし、従来のハフマンおよびシャノンの符号を含む大きいクラスの最小冗長技術では、この項は、大きさにおいて以下のような制限があり、

振動挙動を示し、これは、パラメータｐの値によって、何らかの定数に収束してもしなくてもよい。また、ｔおよびｎの短い値の場合、こうした符号の冗長は、次の以下の項によって影響を受ける可能性がある。

これは、源ｐのパラメータの関数である。図５は、漸近的挙動を有する適応形ブロック符号の冗長レートを示すグラフであり、この量を描く。短いブロック／サンプルの場合、こうした符号の性能は、源の非対称性に影響を受けやすい。この定理の証明は、例えば、Asymptotic average redundancy of adaptive block codes, Y.A. Reznik, W. Szpankowski, Proceedings of IEEE International Symposium on Information Theory (ISIT), 2003で見つけることができる。

次に、上述した符号を実装するための効率的なアルゴリズムの例について説明する。無記憶情報モデルにおいて、単語ｗの確率（またはその推定）は、そのビットの実際のパターンではなく、その重さｋのみに依存する。したがって、すべての可能なｎビットの単語の組を考えると、その組を同じ重さ（ｋ＝０，・・・ｎ）および同じ確率の単語を含むｎ＋１のグループに分けることができる。

こうしたグループのサイズは、以下の通りである。

さらに便宜上、各グループＷ_ｎ，ｋは、辞書式順序に単語を格納すると仮定する。値Ｉ_ｎ，ｋ（ｗ）は、グループＷ_ｎ，ｋにおける単語ｗのインデックス（位置）を示す。以下の表６は、ベルヌーイ確率ｐ^ｋｑ^ｎ−ｋ，ｐ＝０．９で４ビットのブロックのために構成された符号の一例である。

表６における符号例は、本開示のいくつかの態様による、グループＷ_ｎ，ｋにおける単語とその符号語との間の提案されたマッピングの構造を記述するために使用される。この符号は、同じレベルにある符号語が、それらが表す入力ブロックと同じ辞書式順序を有することを確実にするために、追加のステップがとられた、ハフマンのアルゴリズムの変更を使用して構成されている。圧縮効率のどんなロスもなく、こうした並べ替えが可能であることは、よく知られている。この並べ替えの概念を使用した以前のアルゴリズムの例には、ハフマン−シャノン−ファノ符号、およびＭｏｆｆａｔおよびＴｕｒｐｉｎによって述べられた正準の符号などがある。

図６は、表６のブロック符号例の構造を示す符号化ツリーを示す図である。予想されるように、各グループＷ_ｎ，ｋは、同じ長さの符号語を含む多くとも２つのサブグループから成る。一般に、図６の符号化ツリー、および表６のブロック符号によって表される符号構造は、符号語のグループ、およびそのグループのそれぞれの中の符号語の第１および第２のサブグループを定義する。各グループは、同じ重さを有する値を表す符号語を含む。第１のサブグループは、第１の長さを有する符号語を含み、第２のサブグループは、第１の長さとは異なる第２の長さを有する符号語を含む。各グループにおける符号語は、直接計算による符号化および復号を容易にするために、符号語によって表される値に対して、辞書式に順序付けられる。

グループの一例は、図６の参照番号６６によって示される。第１および第２のサブグループの例は、それぞれ図６の参照番号６８Ａ、６８Ｂによって示される。類似のグループおよびサブグループは、符号化ツリー内に重さごとに提供される。グループは、同じ重さｋを有するブロックを含む。サブグループは、符号化ツリーにおける同じ重さおよび同じレベルを有するブロックを含む。これは、グループＷ_ｎ，ｋにおけるすべての単語が、同じ確率、およびいわゆるハフマン符号の兄弟の性質を有するという事実から得られる。また、この観察は、シャノン符号、汎用型シャノン符号、および場合によっては他のアルゴリズムにも当てはまる。上述したように、グループＷ_ｎ，ｋは、同じ長さの符号語を含む多くとも２つのサブグループを含み、次のように表すことができる。

式中、ｌは、グループＷ_ｎ，ｋからのブロックに割り当てることができる最も短い符号長である。さらに、グループＷ_ｎ，ｋ内の単語は、辞書式順序に従うため、Ｗ_{ｎ，ｋ，ｌ}とＷ_{ｎ，ｋ，ｌ＋１}との間の分割は、単に次のようになる。

式中、ｎ_ｋは、より短い符号語を含むサブグループのサイズを示す。したがって、第１のサブグループが、長さ３の３つの符号語を有し、同じグループ内の第２のサブグループが、長さ４の１つの符号語を有する場合、ｎ_ｋ（より短い符号語を含むサブグループ、すなわち第１のサブグループのサイズ）は、３に等しい。この例は、図６の符号化ツリーのレベル３および４に関連付けられているグループ内のサブグループに対応し、サブグループ６８Ａは、それぞれ長さ３の符号語００１、０１０、および０１１を有し、サブグループ６８Ｂは、長さ４の符号語０００１を有する。

各サブグループ内の辞書式に最小の符号語は、例えば、本開示の第１の態様に関して上述したように、基本符号語と呼ぶことができ、以下のように表すことができる。

式中、ｗ_ｉは、グループＷ_ｎ，ｋにおけるｉ番目のブロックである。上述したように、両方のサブグループ内の残りの符号語を、以下のように計算することができることに留意されたい。

一例として、例えば図６の符号化ツリーのレベル３および４の例と同様に、長さ３の３つの符号語を含む第１のサブグループ６８Ａ、および長さ４の１つの符号語を含む第２のサブグループ６８Ｂがあると仮定する。この場合、所与のブロックの位置がｉ＝２である場合、ｉ＜ｎ_ｋ（ｎ_ｋは３に等しい）であり、結果として得られた符号語は、該当する基本符号語＋ｉである。この例では、サブグループの基本符号語は、００１であり、結果として得られた符号語は、００１＋２＝０１１である。図６の符号化ツリーのレベル３および４について、該当する符号語の位置がｉ≧ｎ_ｋであった場合、符号語は、第２のグループ内にあることになり、００００＋４−３＝０００１に等しい、００００＋ｉ−ｎ_ｋの基本符号語に等しいことになる。

基本符号語は、非空のサブグループによって定義されるだけであり、ｎビットブロックのために構成されたツリーにおけるこうしたサブグループＳの数は、

以内である。さらに、複数のサブグループは、同じレベルに存在する可能性があり、こうした一緒に配列されているサブグループの数は、ｎ＋１を超えることはできない。例えば、図６におけるツリーの第１０レベルにおいて、符号語１１１０および１１１１に対応する２つのサブグループがある。しかし、これらのサブグループは、同じグループに属さない。これは、レベルごとに一意の基本符号語を割り当てるが、次いでこうした符号を処理するためにО（ｎ２^ｎ）の大きい並べ替え表を必要とする他のアルゴリズムとのかなりの差である。この場合、構造全体は、О（ｎ^２）ビットの大きさである。

一般に、この符号構造は、グループＷおよびサブグループＳを定義する。各グループは、同じ重さを有する値を表す符号語を含む。各グループにおける符号語は、符号語によって表される値に対して辞書式に順序付けられる。さらに、各グループにおける第１のサブグループは、第１の長さを有する符号語を含み、第２のサブグループは、第１の長さとは異なる第２の長さを有する符号語を含む。符号構造は、可変長の符号化を実行するために、符号器によってアクセスすることができるデータ構造によって表すことができる。本開示は、可変長の符号化または復号におけるこうした符号構造の使用、およびこうした符号構造を定義するデータ構造を備えるコンピュータ可読媒体を企図する。

上記の説明を受けて、次に、ブロック符号の直接計算のための簡単なアルゴリズムについて説明する。パラメータ

が使用可能であり、レベルｌおよび基本符号語Ｂ_{ｎ，ｋ，ｌ}を非空のサブグループごとに取得することができると仮定する。次いで、ブロックｗを符号化するプロセスは、実質的に以下のステップの組によって達成することができる。

１．ブロックｗが与えられると、その重さｋおよびインデックスＩ_ｎ，ｋ（ｗ）を取得する。

２．Ｉ_ｎ，ｋ（ｗ）＜ｎ_ｋである場合、第１のサブグループＷ_{ｎ，ｋ，ｌ}を選択し、そうでない場合、第２のサブグループＷ_{ｎ，ｋ，ｌ＋１}を選択する。

３．次いで、選択されたサブグループ（Ｗ_{ｎ，ｋ，ｌ}またはＷ_{ｎ，ｋ，ｌ＋１}）についての基本符号語（Ｂ_{ｎ，ｋ，ｌ}またはＢ_{ｎ，ｋ，ｌ＋１}）を取り出し、以下の式に従って、該当する符号を計算する。

上記の式によれば、選択されたサブグループ（Ｗ_{ｎ，ｋ，ｌ}またはＷ_{ｎ，ｋ，ｌ＋１}）内のブロックｗの位置ｉ＝Ｉ_ｎ，ｋ（ｗ）が、サブグループ内のブロックの数ｎ_ｋ未満である場合、符号語は、Ｂ_{ｎ，ｋ，ｌ}＋ｉである。あるいは、選択されたサブグループ（Ｗ_{ｎ，ｋ，ｌ}またはＷ_{ｎ，ｋ，ｌ＋１}）内のブロックｗの位置ｉがサブグループ内のブロックの数ｎ_ｋ以上である場合、符号語は、Ｂ_{ｎ，ｋ，ｌ＋１}＋ｉ−ｎ_ｋである。

上述したように、一例として、図６の符号化ツリーのレベル３および４の場合、所与のブロック符号の位置がｉ＝２＜ｎ_ｋであるとき、上記のプロセスは、０１１の符号語をもたらし、所与のブロック符号の位置がｉ＝３≧ｎ_ｋであるとき、０００１の符号語をもたらす。この例では、ｎ_ｋは３、すなわち、重さｋ＝１の第１のサブグループ６８Ａにおける符号語の数である。位置ｉの順序は、基本符号語で開始して、例えば、図６の例における重さｋ＝１の場合、０から３など、辞書式に進む。特に、すべて第１のサブグループ６８Ａ（ｉ＜ｎ_ｋ）内にある位置０は基本符号語００１に対応し、位置１は符号語０１０に対応し、位置２は符号語０１１に対応し、位置３は、サブグループ６８Ｂ（ｉ≧ｎ_ｋ）内の符号語０００１に対応する。

このプロセスは、同じレベルにある符号語が、それらが表す入力ブロックと同じ辞書式順序を有するように、並べ替えられることを確実にすることによって、容易に達成することができる。例えば、上述した符号語は、入力ブロック０００１、００１０、０１００、および１０００の辞書式順序に従う。次いで、各サブグループにおける辞書式に最小の符号語、例えば、サブグループ６８Ａにおける００１、またはサブグループ６８Ｂにおける０００１は、上述した符号語の計算の目的で、基本符号語として使用することができる。上述したようなブロック符号の直接構成のプロセスの実装例を表すＣ言語プログラム符号を、以下の表７に示す。

上記のＣ言語符号において、値ｋは、ブロックｗの重さを示し、値ｉは、重さｋのグループ内のブロックの位置（Ｉ_ｎ，ｋ（ｗ）を示し、ｎｋ［ｋ］は、重さｋのグループの第１のサブグループ内の符号語の数を示す。ｉがｎｋ［ｋ］以上である場合、ｉは、インデックスを調整するために減分され、サブグループは、該当する重さｋの第２のサブグループ（１）に設定される。この第２のサブグループは、ｊ＝ｓｇ［ｋ］［ｌ］によって識別される。ｉがｎｋ［ｋ］）未満である場合、ｉは、減分されず、サブグループは、該当する重さｋの第１のサブグループ（０）に設定される。この第１のサブグループは、ｊ＝ｓｇ［ｋ］［０］によって識別される。

次いで、符号語は、該当するサブグループｊ（ｂａｓｅ［ｊ］）の基本符号語と、ｉの値の合計として生成される。図６の例について、ｉの値が２である場合、符号は、サブグループ６８Ａの基本符号語００１と、ｉの値（２）との合計となり、これは、００１＋０１０＝０１１に等しい。上記の式（１３）を参照すると、サブグループに応じて、基本符号語は、Ｂ_{ｎ，ｋ，ｌ}またはＢ_{ｎ，ｋ，ｌ＋１}のいずれかであり、ｉの値は、ｉまたはｉ−ｎｋ［ｋ］のいずれかである。したがって、上記の符号は、一般に、式（１３）によって提供される結果に対応する。符号語（ｃｏｄｅ）を計算すると、符号語の長さ（ｌｅｎ）は、ｌｅｎ［ｊ］と指定され、これは、適当なサブグループの符号長であり、この場合、第２のサブグループは、第１のサブグループより１大きい符号長を有する。次いで、符号化プロセスは、ｃｏｄｅおよびｌｅｎの値をビットストリームｂｓに書き込む、演算ｐｕｔ＿ｂｉｔｓ（ｃｏｄｅ，ｌｅｎ，ｂｓ）を介して符号をビットストリームに書き込む。ビットストリームは、別の装置による復号のために送信される。このプロセスは、次の符号語の計算のために、重さｋを戻す。

上記で概説した符号化プロセスは、符号化すべき値の重さに基づいて、グループのうちの１つを選択することと、選択されたグループの第１のサブグループ内の符号語の数に対する符号化すべき値の辞書式位置に基づいて、サブグループのうちの１つを選択することと、選択されたサブグループの基本符号語、および符号化すべき値の辞書式位置に基づいて、選択されたサブグループ内の符号語のうちの１つを選択することと、選択された符号語により、符号化すべき値を符号化することとを伴い得る。サブグループのそれぞれの基本符号語、グループのそれぞれの中の符号語の位置、第１のサブグループのそれぞれの中の符号語の数、およびサブグループのそれぞれの中の符号語の長さは、可変長の符号化をサポートするために、符号器によってアクセスすることができるデータ構造に格納され得る。

メモリの見地から、表７に示されるプロセスは、Ｓ個の基本符号語（長さО（ｎ）ビット）、ｎ＋１値のｎｋ（長さО（ｎ）ビット）、Ｓ個の符号長（長さО（ｌｏｇｎ）ビット）、および２（ｎ＋１）サブグループインデックス（長さО（ｌｏｇｎ）ビット）のみを必要とする。追加のメモリ低減は、本開示の他の場所に記載されているように、基本符号語の増分的値を格納することによって可能である。Ｓ＝О（ｎ）と仮定すると、データ構造全体は、О（ｎ^２）ビットのみを必要とする。表７に示されている特定の実装において、例えば、ｎ−２０およびＳ＝３２であると仮定すると、このデータ構造のサイズは、２４４バイトになる。これは、この符号をダイレクトテーブル（direct table）の形で提示するために必要となる２２０の単語よりはるかに少ない。例えば、ｎ≦１２・・・１６など、適度に短いブロックの場合、重さおよびインデックス（表７のプロセスにおける関数ｗｅｉｇｈｔ（．）およびｉｎｄｅｘ（．，．））の計算は、せいぜい単一回のルックアップとすることができる。この場合、符号化プロセス全体は、多くとも１回の比較、２回の加算、および４回のルックアップを必要とし得る。

より大きいブロックの場合、以下のよく知られている組み合わせ公式を使用することができる。

式中、ｗ_ｊは、単語ｗの個々のビットを表し、すべてのｋ＞ｎの場合、

であると仮定する。この公式を実装するために、すべての２項係数を、パスカルの三角形においてレベルｎまで事前計算するか、以下の簡単な恒等式を使用して、それらを動的に計算することができる。

事前に計算された係数に基づく実装は、

個の単語（О（ｎ３）ビット）のメモリおよびО（ｎ）回の加算を必要とする。係数の動的計算は、О（ｎ）回の加算、乗算、除算を必要とする。しかし、プロセス全体は、ほんの少しのレジスタしか必要なく、スタティックメモリは必要としない場合がある。インデックス計算の複雑性の追加の説明は、T. Tjalkens, Implementation cost of the Huffman-Shannon-Fano code, in Proc. Data Compression Conference (DCC'05) (Snowbird, Utah, March 29-31, 2005) 123-132で見つけることができる。

次に、上記の技術を実装する復号器の設計の一例について説明する。上述した符号化プロセスのように、復号プロセスは、パラメータｎ_ｋ、基本符号語、および関連の長さを使用し得る。便宜上、以下の説明は、左寄せのバージョンの基本符号語値に依存する。

式中、Ｔは、機械語の長さ（Ｔ＞ｍａｘｌ）である。次いで、復号プロセス例は、以下のように説明することができる。

１．ビットストリーム内で、

がＴビット未満である一番上のサブグループを見つける。

２．ブロックのインデックスＩ_ｎ，_ｋ（ｗ）を、上記の式（１３）に基づいて復号する。

３．その重さｋおよびインデックスを使用して再構成されたブロックを生成する。上述した復号プロセスの実装例を表すＣ言語符号を、以下の表８に示す。

表８に示されている復号プロセス例は、左寄せの基本符号語ｌｊ＿ｂａｓｅ［Ｓ］を使用する。動作中、復号プロセスは、ビットストリームバッファのコンテンツｖａｌを受信し、ビットストリームバッファのコンテンツｖａｌに対応する基本符号語を有する符号化ツリー内のサブグループを識別する。例えば、プロセスは、基本符号語が受信した符号語ｖａｌより大きい限り、引き続き、符号化ツリーにおける異なるレベルのサブグループを通過して下方に移動する。しかし、ｖａｌ以下の基本符号語を含むサブグループに到達すると、そのサブグループが選択される。適切なサブグループを見つけると、プロセスは、サブグループの符号長を決定し、ビットストリームをその長さだけスクロールして、復号されたビットをスキップし、符号語を隔離する。復号プロセスは、基本符号語値をビットストリームバッファコンテンツから取り去ることによって、サブグループ内の符号語のインデックス位置ｉを決定する。

例えば、符号語が０１１であり、基本符号語が０１０である場合、この差の結果は２であり、これは、符号語が、サブグループ内の可能な位置０、１、および２の中の位置２にあることを示す。３２ビット幅のレジスタの例では、この差は、３２マイナス符号長ｌｅｎだけ、右にシフトされ得る。次いで、復号プロセスは、該当する重さｋ、およびサブグループインデックスｊを取り出し、インデックスｉを再構成する。次いで、プロセスは、選択されたグループ内のｉ番目の単語を、符号語として生成し、重さｋを戻す。式ｋｊ［ｊ］．ｋは、サブグループの重さを戻し、式ｋｊ［ｊ］．ｊは、サブグループのインデックスを、所与の重さについての第１のサブグループ（０）または第２のサブグループ（１）を示す０または１のいずれかとして戻す。ｊ＝１となるように第２のサブグループが選択されると、インデックスｉは、ｎｋ［ｋ］の値を追加することによって調整される。そうでなく、第１のサブグループが選択された場合、インデックスｉは、調整されない。関数ｗｏｒｄ（）は、例えば上記の式（１３）を使用して、復号された単語値として、ｎ，ｋグループにおけるｉ番目の単語を戻す。

一般に、符号器は、符号構造がグループおよびサブグループを定義する、上述した符号構造に従って可変長符号化を実行することができる。この場合もまた、各グループは、同じ重さを有する値を表す符号語を含む。各グループにおける符号語は、符号語によって表される値に対して辞書式に順序付けられる。さらに、各グループにおける第１のサブグループは、第１の長さを有する符号語を含み、第２のサブグループは、第１の長さとは異なる第２の長さを有する符号語を含む。

符号構造は、可変長の符号化を実行するために、符号器または復号器によってアクセスすることができるデータ構造によって表すことができる。上述したように、データ構造は、サブグループのそれぞれの基本符号語、グループのそれぞれの中の符号語の位置、第１のサブグループのそれぞれの中の符号語の数、およびサブグループのそれぞれの中の符号語の長さを指定することができる。このデータ構造は、映像符号器、画像符号器、音声符号器、言語符号器、映像復号器、画像復号器、および音声復号器、または言語復号器のうちの１つに関連付けられているメモリに格納することができ、符号化操作をサポートするために必要に応じてアクセスされる。

上述したように、エントロピ復号ユニット５２などの復号器は、符号化ツリーのトップダウン（上から下への）検索で、復号すべき符号語以下の基本符号語を含むサブグループのうちの第１のものを選択することを選択することができる。次いで、復号器は、復号すべき符号語と、選択されたサブグループの基本符号語との間の差に基づいて、選択されたサブグループ内の復号すべき符号語の位置、すなわちサブグループインデックスを決定することができる。復号器は、選択されたサブグループが存在するグループに基づいて、復号すべき符号語によって表される値の重さを決定し、選択されたサブグループがそのグループの第１のサブグループであるか、第２のサブグループであるかに基づいて、選択されたサブグループが存在するグループ内の符号語の位置、すなわちグループインデックスを決定する。次いで、復号器は、復号すべき符号器によって表される値の重さ、および選択されたサブグループが存在するグループ内の符号語の位置に基づいて、値のうちの１つを選択し、選択された値により復号すべき符号語を復号する。値は、例えば、表６のブロック符号のうちの１つに対応し得る。

本開示のこの態様に従って企図される符号構造およびデータ構造は、計算オーバーヘッド、メモリ使用率、および処理時間に関して、効率をサポートすることができる。表８の復号プロセス例は、例えば、サブグループを見つけるための比較およびルックアップを１回からＳ回、加算を１回または２回、シフト操作を１回、追加の比較を１回、および追加のルックアップを３回必要とする。サブグループを見つけるのに必要なステップの数は、基本符号語を２値検索ツリーに入れることによって、または余分のルックアップテーブルを使用することによって、さらに低減することができるが、いずれの場合も、余分のメモリを犠牲にする。

復号プロセスの最後に、上述したように、符号語の重さｋとインデックスＩ_ｎ，ｋ（ｗ）が、（例えば、表８の関数ｗｏｒｄ（）によって）実際の値に変換される。ブロックが適度に短い場合、これは、簡単なルックアップによって達成することができる。そうでない場合、単語は、例えば、D. A. Huffman, A method for the construction of minimum-redundancy codes. Proc. IRE, 40 (Sept. 1952) 1098-1101に記載されている計数公式（enumeration formula）を使用することによって合成することができる。複雑性の観点から、このプロセスは、符号器におけるインデックス計算に似ている。

上述した符号化および復号プロセスを使用して、データのブロックの適応形符号化および復号のシステムを定義することができる。この例について、以下の条件で、入力ブロックを符号化することができると仮定する。

１．コンテキストがない、すなわち、ユニバーサル符号が実装される
２．コンテキストは、以前観察された１つのブロックによって与えられる。すなわちｔ＝ｎ
３．コンテキストは、以前観察された２つのブロックによって与えられる。すなわちｔ＝２ｎ。

実際のブロックをコンテキストとして使用する代わりに、その重さを使用することで十分である（源の無記憶情報の性質のため）。これは、ｔビットサンプルの場合、その重さｓによってインデックスを付けられたｔ＋１の符号構造の配列が提供されることを意味する。スペースをさらに節約するために、ｓおよびｋに対するＫＴ分布の対称性を使用することができる。特にプロセスは、ｓ＞ｔ／２であるときは毎回、ｓ＝ｔ−ｓを交換し、ビットを反転する（すなわち、強制的にｋ＝ｎ−ｋにする）ことができる。このように、ｔ／２＋１のテーブルを定義するだけでよい。この例では、適応形符号によって必要なメモリの全体量は、１＋ｎ／２＋１＋ｎ＋１＝１．５ｎ＋３のテーブルになる。ブロックサイズｎ＝８・・・２０の場合の特定のメモリ推定量を、以下の表９に示す。

上記の表では、ＫＴ推定された密度を使用し、また本開示に従って変更されたハフマン符号構成アルゴリズムを使用して生成された。以下に示されるのは、本開示に記載されているような、適応形ブロック符号器を実装するプログラムのためのコンピュータ符号の一例である。

次に、ブロックサイズｎ＝１６での本明細書に記載された適応形符号化プロセスの性能の評価の実験結果を説明すると共に、よく知られている他のアルゴリズムと比較する。特に、適用形符号化プロセスは、W. B. Pennebaker, J. L. Mitchell, G. G. Langdon, Jr., R. B. Arps, An overview of the basic principles of the Q-Coder adaptive binary arithmetic coder, IBM J. Res. Dev., 32 (6) (1988) 717に記載されており、ＪＢＩＧ画像符号化標準に使用されるＱコーダアルゴリズム、およびD. Marpe, H. Schwartz, and T. Wiegand, Context-Based Adaptive Binary Arithmetic Coding in the H.264/AVC video compression standard, IEEE Trans. on CSVT, 13(7):620-636, July 2003に記載されており、映像圧縮のＩＴＵ−ＴＨ．２６４／ＭＰＥＧＡＶＣ標準で使用されるＣＡＢＡＣアルゴリズムと比較される。

テストを行うために、コンピュータで生成されたビットの系列は、確率ｐで２値ベルヌーイ源からの出力をシミュレートするために使用された。１６から１０２４に及ぶこうした系列の長さ、および特定の長さごとに、こうした系列のＱ＝１００００００のサンプルが生成された。相対冗長レートが次のように計算された。

本開示に記載されている適応形符号化プロセスでは、コンテキストの以下の構造が使用された。

１．最初の１６ビットブロックは、コンテキストなしに符号化される（ユニバーサル符号）
２．第２のブロックは、そのコンテキストとして第１のものを使用して符号化される（ｔ＝１６の符号）
３．３番目およびそれ以降のすべてのブロックは、コンテキストとして系列内の前のブロック２つを使用して符号化される（ｔ＝３２のサンプルベースの符号）。

図７Ａおよび７Ｂは、異なる値ｐでの適応形ブロック符号の冗長レートとＱコーダおよびＣＡＢＡＣ技術との比較を示すグラフである。図７Ａは、ｐ＝０．１の場合の結果を示し、図７Ｂは、ｐ＝０．５の場合の結果を示す。図８は、適応形ブロック符号、Ｑコーダ、およびＣＡＢＡＣ技術の場合の源データの非対称性に対する冗長の感度を示すグラフである。実験的研究の結果が、図７Ａ、図７Ｂ、および図８に示されている。図７Ａおよび図７Ｂは、ｘ軸上の符号化されたビットの数対ｙ軸上の（平均符号長−エントロピ）／エントロピを描く。

図８は、ｘ軸上の確率対ｙ軸上の（平均符号長−エントロピ）／エントロピを描く。図７Ａ、図７Ｂ、および図８の各グラフは、Ｑコーダ、ＣＡＢＡＣ、および適応形符号化のグラフを対応するラベルによって示す。実験結果から、本開示に記載されている適応形符号は、ＱコーダおよびＣＡＢＡＣアルゴリズムの両方よりはるかに速い収束率を有し得ることがわかる。適応形符号化プロセスは、より短い系列については、ＱコーダおよびＣＡＢＡＣアルゴリズムより優れており、符号化されたビットの合計長さが１０２４に近づくと、ＱコーダおよびＣＡＢＡＣアルゴリズムに匹敵するようになる。さらに図８に示されているように、１６０の符号化されたビット（または次いで１６ビットブロック）の後、適応形符号化プロセスは、ＱコーダおよびＣＡＢＡＣアルゴリズムに比べて、より低い冗長を提供することができる。この挙動は、上述した定理１に一致する。

図９は、本開示の第１の一般の一態様による、単調分布についてのメモリ効率の良い可変長の符号化を構成するための方法を示すフロー図である。この方法は、図２および図３に示されるように、エントロピ符号化ユニット４６およびエントロピ復号ユニット５２によって使用する符号を構成するために、符号器、復号器、または他の装置に関連付けられているプロセッサによって実装することができ、それだけには限定されないが、映像、画像、言語、および音声データを含む、様々なデータのうちの任意のものの圧縮および符号化をサポートし得る。こうしたプロセッサは、例えば、可変長の符号化に有用な符号構造属性を定義するデータ構造を準備するために、符号器または復号器内、または汎用コンピューティングシステム内に設けることができる。

図９に示されるように、プロセッサは、符号化された入力記号のアルファベットを取得する（７０）。記号は、所与のデータセットまたは系列内の記号の存在または使用の確率または頻度を示すそれぞれの重さを有する。該当する記号の重さを決定すると（７２）、プロセスは、その重さに基づいて、インデックスを記号に割り当て（７４）、インデックスおよび記号の辞書式順序に基づいて、記号に符号を割り当てる（７６）。したがって、同じ重さを有する記号は、本開示に記載されている符号化技術を容易にするために、辞書式に順序付けられ得る。

符号は、２値符号化ツリーによって表される符号構造に従ってまとめることができる。プロセッサは、符号化ツリー内のレベルごとに、基本符号語を識別する（７８）。基本符号語は、そのツリーの所与のレベルにおける最小の符号語であり、そのツリーのそのレベルにおける記号の中の辞書式に最も早い記号に対応する。コンパクトなデータ構造を提供するために、プロセッサは、部分的な基本符号語を生成するために、基本符号語から固定数Ｂの先行ビットを削除する（８０）。基本符号語は、左寄せの符号語として構築することができ、先行ビットは、左寄せの符号語における右から左に進むＭ個の先行ビットであり得る。一部の実装では、削除される先行ビットの数は、８とすることができる。他の実装では、削除される先行ビットの数は、８未満、または８を上回ってもよい。

符号化ツリーの多くのレベルについて、Ｍ個の先行ビットは、ゼロである。しかし、いくつかのレベルでは、先行ビットは、そのツリーにおけるそれぞれのレベルについてのすべてまたは一部の基本符号を形成し得る。これらの選択されたレベルで、プロセッサは、スキップインジケータを生成する（８２）。スキップインジケータは、先行するＢビットの削除時に、基本符号が失われないように、復号器がビットストリームをＢビットだけスクロールする旨の命令を提供する。このプロセスは、データ構造において、結果として得られた部分的な基本符号語、符号化ツリーのそれぞれのレベルにおける符号語に関連付けられている長さ、符号化ツリーにおける符号語に関連付けられているそれぞれの記号のインデックスを示すオフセット、および先行するＢビット内に少なくとも部分的に含まれる基本符号語の損失を防ぐために、ビットストリームがＢビットだけスクロールされなければならないときを示す１つまたは複数のスキップインジケータを格納することができる（８４）。データ構造は、構成された可変符号でエントロピ符号化および復号を行うのを助けるために、エントロピ符号化ユニット４６およびエントロピ復号ユニット５２に提供され得る。データ構造は、１つまたは複数の１次元または多次元のルックアップテーブル、リンクリスト、２値ツリー、ラディックスツリー、フラットファイルなどを含めて、様々な形をとり得る。

図１０は、本開示の第１の一般的な態様による、図９の方法に従って構成された可変長の符号を使用して記号を符号化するための方法を示すフロー図である。図１０に示すように、エントロピ符号化ユニット４６は、記号を受信し（８６）、記号インデックスを決定し（８７）、符号化ツリーにおける対応するレベルを識別するために、記号のインデックスとオフセットテーブルとを比較する。特に、エントロピ符号化ユニット４６は、記号のインデックスがツリーの所与のレベルのオフセット以上であるかどうかを決定する（８８）。記号インデックスは、重さの順序にランク付けされた、他の記号の中の記号の順序を表し、同じ重さの記号は、記号のアルファベットに従って辞書式に順序付けられている。オフセットは、ツリーの該当するレベルの１つまたは複数の符号の長さと、最大符号長との間の差である。図４のツリーでは、例えば最大符号長が１６であり、ツリーのレベル３の符号長が３である場合、基本符号語の該当するオフセットは、１２である。

記号インデックスがツリーの現在のレベルのオフセットを超えない場合、エントロピ符号化ユニット４６は、トップダウン検索で、符号化ツリーの次のレベルへと下方に進み（９０）、記号インデックスとその次のレベルのオフセットとの比較を繰り返す（８８）。記号インデックスが符号化ツリーの特定のレベルのオフセット以上であることをエントロピ符号化ユニット４６が決定すると（８８）、エントロピ符号化ユニットは、記号の適切な符号語を計算する。特に、エントロピ符号化ユニット４６は、記号の符号語を、ツリーの現在のレベルの基本符号語と、記号インデックスとそのレベルのオフセットとの差との合計に設定する（９２）。

図４のツリーの例を使用して、記号インデックスが１４である場合、１４はそのレベルの基本符号語に割り当てられた１２のオフセットより大きいため、エントロピ符号化ユニット４６は、記号の符号がツリーのレベル３に存在することを決定する。次いで、エントロピ符号化ユニット４６は、基本符号語（００１）＋（記号インデックス（１４）−オフセット（１２））として符号語を計算し、すなわち００１＋２＝００１＋０１０＝０１１となる。受信された記号の符号を設定する（９２）と、エントロピ符号化ユニット４６は、例えば、エントロピ復号ユニット５２を備える受信装置に送信するために、符号語をビットストリームに出力する（９４）。エントロピ符号化ユニット４６は、次いで、該当するデータ系列における次の記号について、プロセスを繰り返す。

図１１は、本開示の第１の一般的な態様による、図９の方法に従って構成された可変長の符号を復号するための方法を示すブロック図である。図１１に示される方法は、表５に示されるものと同じ、または似たアルゴリズムを使用して実行され得る。実装例では、図１０を参照して説明したように、符号は、エントロピ復号ユニット５２によって受信され、エントロピ符号化ユニット４６によって符号化される。図１１に示した方法は、本開示に記載されるような、メモリ効率のより復号技術を使用することができ、こうした符号を構成することができるコンパクトなデータ構造を利用することができる。図１１に示されるように、エントロピ復号ユニット５２は、入ってくるビットストリームから符号語を受信する（９６）。符号語は、ビットストリームバッファから取り出された固定幅Ｗのビットから取得され得る。符号語は、左寄せでよく、または左寄せフォーマットに変換することができ、幅Ｗは、右から左に、符号語からＢ個の先行ビットを削除することによって低減され得る。

エントロピ復号ユニット５２は、一番上のレベルから開始し、適切な基本符号語が見つかるまで、トップダウン検索で、ツリーの中へより深く進みながら、符号語を、符号化ツリーの異なるレベルの基本符号語と比較する。特に、エントロピ復号ユニット５２は、ツリーの現在のレベルの基本符号語が符号語以下であるかどうかを決定することができる（９８）。そうでない場合、エントロピ復号ユニットは、引き続きツリーの次のレベルへと下方に進み（１００）、次のレベルに関連付けられている基本符号語についての比較を繰り返す（９８）。しかし、次のレベルに進むと（１００）、エントロピ復号ユニット５２は、スキップインジケータが現在のレベルに関連付けられているかどうかを決定する（１０２）。そうである場合、エントロピ復号ユニット５２は、次のレベルに進む（１００）前に、ビットストリームバッファを一定単位だけスクロールする（１０４）。特に、エントロピ復号ユニット５２は、先行するＭビットをドロップすることによって符号語が失われないように、Ｍビットだけビットストリームバッファをスクロールすることができる。スキップ指示（１０２）がない場合、エントロピ復号ユニット５２は、単に、次のレベルに進む（１００）。

いずれの場合でも、エントロピ復号ユニット５２は、再度、符号語を、現在のレベルの基本符号語と比較する（９８）。エントロピ復号ユニット５２は、基本符号語がその符号語以下であるレベルを見つけ（９８）、エントロピ復号ユニット５２は、それぞれのレベルで基本符号語の残余長さを決定し（１０６）、ビットストリームを残余長さだけスクロールする（１０８）。次いで、エントロピ復号ユニット５２は、そのレベルのオフセット、および基本符号語と復号される符号語との間の差に基づいて、符号語に関連付けられている記号を計算する（１１０）。

例えば、図４のツリーを参照すると、符号語が０１１０００００００００００００である場合、８個の先行ビットがドロップされた、部分的な、切り捨てられた符号語は、０１１０００００である。この場合、エントロピ復号ユニット５２は、レベル３の部分的な基本符号語（００１０００００）を、符号語以下であると識別し、３の残余長さを識別する。エントロピ復号ユニット５２は、次の符号語を受信するために、ビットストリームを３ビット前方にスクロールする。さらに、エントロピ復号ユニット５２は、レベル３のオフセットを、ビットストリームバッファ内の符号語とそのレベルの基本符号語との差に追加することによって、符号語の記号を計算する。例えば、エントロピ復号ユニット５２は、符号を、オフセット［３］＝１２＋符号語０１１０００００−００１０００００として計算し、これは、１２＋２＝１４に等しい。この場合、１４が符号０１１によって表される記号のインデックスである。

図１１に示される方法は、本開示の他の場所に記載されているように、非常にコンパクトなデータ構造、およびかなりのメモリ効率を利用することができる。その結果、こうした方法を実装することによって、エントロピ復号ユニット５２は、そのすべてが映像復号装置、またはデータの復元および復号のために構成されている他の装置には望ましい可能性のある、処理オーバーヘッドの低減、メモリ使用率の低減、および処理速度の増加を含めて、効率の増加を提供することができる。

図１２は、本開示の第２の一般的な態様による適応形ブロック符号を構成するための方法を示すフロー図である。図１２の方法は、符号化装置内のプロセッサまたは適応形ブロック符号の効率の良い直接構成をサポートする汎用プロセッサ内に実装することができる。図１２に示されるように、プロセッサは、符号化すべき１組の単語（１１２）を取得する。結果として得られた符号構造を表すデータ構造は、符号化装置、復号装置、またはその両方の中のメモリに格納され得る。単語は、２値符号のブロックとすることができる。単語の重さを決定する（１１４）と、プロセッサは、重さに基づいて、符号語グループを単語に割り当てる（１１６）。符号語グループは、同じ重さｋの単語の符号語を含み、例えば、図６に示されるように、符号化ツリーの隣接する２つのレベルにまたがり得る。

図１２にさらに示されるように、プロセッサは、単語の長さに基づいて、サブグループを同じグループ内の単語に割り当てる（１１８）。特に、グループは、第１のサブグループおよび第２のサブグループを含み得る。第１のサブグループは、同じ長さおよび同じ重さを有する１つまたは複数の符号語を含む。同様に、第２のサブグループは、同じ長さおよび同じ重さを有する１つまたは複数の符号語を含む。しかし、第１のサブグループ内の符号語の長さは、第２のサブグループ内の符号語の長さ未満である。したがって、各サブグループは、同じ重さの、符号化ツリーにおける同じレベルにおける符号語を含む。

プロセッサは、サブグループごとに基本符号語を識別する（１２０）。基本符号語は、サブグループ内の最小の符号語である。図６の例では、サブグループ６８Ａの基本符号語は、００１である。しかし、サブグループ６８Ａは、基本符号語００１に加えて、符号語０１０および０１１をさらに含む。この例では、相対的に少量の計算が与えられると、符号を、容易に、直接計算することができるように、サブグループ内の符号語は、それらが表す単語の辞書式順序で順序付けられる。

各グループの第１のサブグループ内の要素の数は、符号語を計算するために使用することができる。そのために、プロセッサは、各グループの第１のサブグループ内の要素の数を格納し（１２２）、また、グループインデックスマッピング（１２４）、サブグループ符号長マッピング（１２６）、およびサブグループ基本符号語マッピング（１２８）も格納する。グループインデックスマッピングは、符号語が存在するグループ内の単語の符号語の位置を識別することができる。サブグループ符号長マッピングは、特定のサブグループ内の符号の長さを識別することができる。サブグループ基本符号語マッピングは、各サブグループに関連付けられている基本符号語を識別することができる。一般に、グループ内の単語のインデックスが与えられると、符号は、特定のサブグループの基本符号語から構成することができる。格納されている情報は、符号器、復号器、またはその両方によってアクセスすることができるデータ構造に格納することができる。

図１３は、本開示の第２の一般的な態様による、図１２の方法に従って構成された可変長の符号を使用してブロックを符号化するための方法を示すフロー図である。図１３の方法は、例えば、図２のエントロピ符号化ユニット４６など、エントロピ符号化ユニット内に実装することができる。図１３に示される方法は、表７に示されるものと同じ、または似たアルゴリズムを使用して実行され得る。図１３に示されるように、所与の単語を符号化するために、エントロピ符号化４６は、その重さ（１３０）およびグループインデックス（１３２）を取得する。単語の重さを使用して、エントロピ符号化４６は、該当する符号化ツリー内の単語のグループインデックスを決定する（１３２）。グループインデックスＩ_ｎ，ｋ（ｗ）は、辞書式順序で単語を格納するグループＷ_ｎ，ｋ内の単語ｗのインデックス（位置）を指定する。

エントロピ符号化ユニット４６は、グループインデックスを、入力単語の符号語が存在するグループの第１のサブグループ内の要素の数ｎ_ｋと比較する。特に、エントロピ符号化ユニット４６は、グループのインデックスが第１のサブグループ内の要素の数以上であるかどうかを決定する（１３４）。そうである場合、エントロピ符号化ユニット４６は、第２のサブグループ、すなわちグループ内のサブグループ１を選択し（１３８）、グループインデックス値を減分する（１４０）。特に、グループインデックス値は、第１のサブグループにおける要素の数ｎ_ｋだけ減分される。グループインデックスが第１のサブグループ内の要素の数以上でない場合（１３４）、エントロピ符号化ユニット４６は、第１のサブグループ、すなわちサブグループ０を選択する（１３６）。各サブグループは、それ自体の基本符号語を有する。エントロピ符号化ユニット４６は、選択されたサブグループの基本符号語を取得し（１４２）、基本符号語とグループインデックス値との合計に基づいて、符号語を計算する（１４４）。

図６の符号化ツリー例を参照すると、一例として、符号化すべき単語の重さが２であると仮定した場合、グループインデックス値は２、例えば符号化ツリーのレベル３および４のグループに対応する第１のサブグループ内の要素の数は３である。この場合、グループインデックス値（２）は、第１のサブグループ内の要素の数（３）未満であるから、エントロピ符号化ユニット４６は、第１のサブグループ（サブグループ０）を選択する。その結果、基本符号語は００１である。単語を符号化するために、エントロピ符号化ユニット４６は、２のグループインデックス値を００１の基本符号語に追加し、結果として０１１の符号語が得られる。

同じグループについて、グループインデックス値が３であった場合、エントロピ符号化ユニット４６は、第２のサブグループ（サブグループ１）を選択することになる。しかし、エントロピ符号化ユニット４６は、第１のサブグループ（サブグループ０）内の要素の数ｎ_ｋだけグループインデックス値だけ減分することになる。この場合、３のグループインデックス値は、３だけ低減されゼロになり、符号語は、第２のサブグループの基本符号語である０００１＋グループインデックス値である０として計算されることになり、その結果、０００１の符号語が得られる。

入力単語の符号語を計算することに加えて、エントロピ符号化ユニット４６は、選択されたサブグループ内の符号の長さを取得することができる（１４６）。上記の例で、サブグループ０のレベル３について、符号の長さは、３となる。エントロピ符号化ユニットは、エントロピ復号ユニット５２などエントロピ復号ユニットを含む復号装置など別の装置に格納および／または送信するために、計算された符号語とサブグループの符号長を、ビットストリームに出力する。

図１４は、本開示の第２の一般的な態様による、図１２および図１３の方法に従って構成された可変長の符号を復号するための方法を示すブロック図である。図１４に示される方法は、表８に示されるものと同じ、または似たアルゴリズムを使用して実行され得る。可変長の符号は、エントロピ符号化ユニット４６を含む符号化装置などの符号化装置から受信することができる。可変長符号は、エントロピ復号ユニット５２によって受信され、復号され得る。図１４に示されるように、エントロピ復号ユニット５２は、入ってくるビットストリームから符号語を受信し（１５０）、符号語をサブグループの基本符号語と比較する。特にエントロピ復号ユニット５２は、該当する符号化ツリーを検索して、ビットストリームバッファから取得された符号語のコンテンツ以下の左寄せのサブグループの基本符号語を識別することができる（１５２）。

ツリーにおける所与のレベルのサブグループ内のサブグループの基本符号語が、符号語以下でない（１５２）場合、エントロピ復号ユニット５２は、ツリーの次のレベルの次のサブグループに進み（１５４）、比較を繰り返す。このプロセスは、基本符号語がビットストリームから受信された符号語より大きいままである限り、すなわち、エントロピ復号ユニット５２が、サブグループの基本符号語が符号語以下であるレベルに到達するまで、反復ベースで続行する。符号語と基本符号語を比較する際、エントロピ復号ユニット５２は、本開示の第１の態様に従って、追加のメモリ低減のために、基本符号語の部分的な増分値を使用することができる。特に、いくつかの先行ビットは、上述したように、メモリ効率を向上させるために、ドロップされ得る。

サブグループの基本符号語が符号語以下である符号化ツリーのレベルに到達すると、エントロピ復号ユニット５２は、サブグループの符号長を決定し（１５６）、その長さだけビットストリームをスクロールして、復号されたビットをスキップし、符号語を隔離する。エントロピ復号ユニット５２は、基本符号語を使用して、そのサブグループ内の符号語の位置を決定することができる（１５８）。例えば、エントロピ復号ユニット５２は、符号語と基本符号語との間の位置の差を生成するために、ビットストリーム符号語を基本符号語から取り去ることができる。

一例として、図６の符号化ツリーを参照して、入ってくる符号語が０１１０００００００００００００である場合、エントロピ復号ユニット５２は、基本符号語００１０００００００００００００を、符号語以下の一番上のサブグループの基本符号語と識別する。この基本符号語は、レベル３および４のグループ内の第１のサブグループに関連付けられている。基本符号語に関連付けられているサブグループの符号長（３）を決定すると、エントロピ復号ユニット５２は、ビットストリームをスクロールして、復号されたビットをスキップすることができる。エントロピ復号ユニット５２は、ビットストリームからの符号語から基本符号語を取り去ることによって、符号語のグループインデックスを決定することができる。この例では、０１１−００１は、０１０をもたらし、これは、２のグループインデックス値を生成する。

エントロピ復号ユニット５２は、例えば符号化ツリー内のサブグループのレベルに基づいて、符号語の重さを決定することもできる（１６０）。さらに、エントロピ復号ユニット５２は、サブグループインデックス、すなわち、符号化ツリー内の選択されたサブグループのインデックスを決定することができる（１６２）。重さ、位置およびサブグループのインデックスを使用して、エントロピ復号ユニット５２は、単語インデックスを決定し（１６４）、それによって、符号語によって表される単語を生成するために、ビットストリームからの符号語を復号する。この場合も、一部の実装では、エントロピ復号ユニット５２によって実行される復号方法は、表８に示されるプロセスに対応し得る。

情報および信号を、様々な異なる技術および技法のうちの任意のものを使用して表すことができることを、当業者であれば理解されよう。例えば、上記の説明にわたって言及され得るデータ、命令、コマンド、情報、信号、ビット、記号、およびチップは、電圧、電流、電磁波、磁場または磁性粒子、光電場または光学粒子、またはその任意の組み合わせによって表すことができる。

本明細書に開示された実施形態との関連で記載されている様々な例示の論理ブロック、モジュール、回路、およびアルゴリズムステップが、電子ハードウェア、コンピュータソフトウェア、またはその両方の組み合わせとして実装され得ることを、当業者であれば、さらに理解されよう。ハードウェアおよびソフトウェアのこの互換性を明らかに示すために、様々な例示の構成要素、ブロック、モジュール、回路、およびステップについて、その機能に関して、上記で全般的に説明してきた。こうした機能は、ハードウェアとして実装されるか、ソフトウェアとして実装されるかは、システム全体に課せられる特定の用途および設計の制約によって決まる。当業者であれば、記載した機能を、特定の用途ごとに様々な方法で実装することができるが、こうした実装は、本開示の範囲からの逸脱をもたらすものと解釈されないものとする。

本明細書に記載された技術は、ハードウェア、ソフトウェア、ファームウェア、またはその任意の組み合わせにおいて実装され得る。こうした技術は、汎用コンピュータ、無線通信装置ハンドセット、または無線通信装置ハンドセットおよび他の装置における適用を含めて、複数の使用を有する集積回路装置など、様々な装置の任意のものに実装することができる。モジュールまたは構成要素として記載されている任意の特徴は、一体型の論理装置に一緒に、または別個ではあるが、相互運用可能な論理装置として別々に実装されてもよい。ソフトウェアに実装される場合、技術は、実行されると、上述した方法のうちの１つまたは複数を実行する命令を含むプログラムコードを備えるコンピュータ可読データ記憶媒体によって少なくとも一部分実現することができる。コンピュータ可読データ記憶媒体は、コンピュータプログラム製品の一部分を形成し得る。コンピュータ可読媒体は、ランダムアクセスメモリ（ＲＡＭ）、例えばシンクロナスダイナミックランダムアクセスメモリ（ＳＤＲＡＭ）、読み取り専用メモリ（ＲＯＭ）、不揮発性ランダムアクセスメモリ（ＮＶＲＡＭ）、電気的に消去書き込み可能ＲＯＭ（ＥＥＰＲＯＭ）、フラッシュメモリ、磁気または光データ記憶媒体などを備え得る。さらに、または代わりに、技術は、命令またはデータ構造の形でプログラムコードを運び、または通信し、伝播信号または波など、コンピュータによるアクセス、読み取り、かつ／または実行が可能なコンピュータ可読通信媒体によって少なくとも一部分実現することができる。

プログラムコードは、１つまたは複数のディジタル信号プロセッサ（ＤＳＰ）、汎用マイクロプロセッサ、特定用途向け集積回路（ＡＳＩＣ）、フィールドプログラマブル論理アレイ（ＦＰＧＡ）、または他の等価の一体型または別個の論理回路など、１つまたは複数のプロセッサによって実行することができる。汎用プロセッサは、マイクロプロセッサとすることができるが、代替では、プロセッサは、任意の従来のプロセッサ、コントローラ、マイクロコントローラ、または状態機械とすることができる。また、プロセッサは、例えば、ＤＳＰとマイクロプロセッサとの組み合わせ、複数のマイクロプロセッサ、１つまたは複数のマイクロプロセッサおよびＤＳＰコア、または他の任意のこうした構成など、コンピューティング装置の組み合わせとして実装することもできる。したがって、「プロセッサ」という用語は、本明細書で使用される場合、上記の構成のうちの任意のもの、または本明細書に記載された技術の実装に適した他の任意の構成を指し得る。さらに、一部の態様において、本明細書に記載されている機能は、符号化および復号のために構成された専用のソフトウェアモジュールまたはハードウェアモジュール内に設けられ、または結合された映像符号器／復号器（ＣＯＤＥＣ）に組み込まれてもよい。

本開示の様々な実施形態について説明してきた。これらおよび他の実施形態は、以下の特許請求の範囲内に含まれる。

Claims

可変長の符号語を指定する符号化ツリーのレベルについての基本符号語の部分値を生成することと、
前記符号化ツリーの選択されたレベルに進む前に、復号すべきビットストリームにおいて、いくつかのビットをスキップするよう復号器に指示するスキップインジケータを生成することと、
メモリ内のデータ構造に、前記部分値および前記スキップインジケータを格納することと
を備える方法。
前記基本符号語によって表される値を生成することと、
前記基本符号語の前記部分値の長さを生成することと、
前記メモリ内の前記データ構造に、前記値および前記長さを格納することと
をさらに備える請求項１に記載の方法。
前記データ構造を、映像復号器、画像復号器、および音声復号器、または言語復号器のうちの１つのメモリに格納することをさらに備える請求項１に記載の方法。
前記符号化ツリーの前記レベルのうちの一部が、前記符号語によって表される値に対して辞書式順序で配列される符号語を含み、前記基本符号語のそれぞれが、前記符号化ツリーの対応するレベルにおける、辞書式に最小の符号語である請求項１に記載の方法。
前記基本符号語の前記部分値が、前記基本符号語からの固定数の先行ビットの削除を表す請求項１に記載の方法。
前記スキップインジケータが、前記符号化ツリーの前記選択されたレベルに進む前に、前記符号語ビットストリームにおいて、前記固定数のビットをスキップするよう前記復号器に指示する請求項５に記載の方法。
前記ツリーの前記選択されたレベルにおける前記基本符号語の前記部分値が、前記固定数のビットだけ、前記基本符号語をシフトすることに基づいており、前記シフトなしでは、前記ツリーの前記選択されたレベルにおける前記基本符号語が、少なくとも部分的に前記削除された数の先行ビットまで及ぶことになる請求項５に記載の方法。
前記格納されているデータ構造を使用して、前記符号語ビットストリームからの前記符号語のうちの１つを復号することをさらに備え、復号することが、
前記符号語ビットストリームからの前記符号語以下である前記基本符号語の前記部分値のうちの選択された１つについて、前記符号化ツリーの前記レベルを検索することと、
前記スキップインジケータに応答して、前記符号化ツリーの前記選択されたレベルに進む前に、前記符号語ビットストリームにおいて、いくつかのビットをスキップすることと、
前記符号語以下の前記基本符号語の前記部分値のうちの前記選択された１つと前記符号語との間の差、および前記符号語以下の前記基本符号語の前記部分値のうちの前記選択された１つのインデックスに基づいて、前記符号語に対応する複数の値のうちの１つを計算することと
を備える請求項１に記載の方法。
前記計算された値に少なくとも一部分基づいて、ユーザに出力を提示することをさらに備える請求項８に記載の方法。
前記符号化ツリーに一致する前記符号語で値を符号化することをさらに含み、前記符号語によって表される前記値が、映像データ、画像データ、言語データ、または音声データのうちの少なくとも１つを表す請求項１に記載の方法。
可変長の符号語を指定する符号化ツリーのレベルについての基本符号語の部分値を生成するための手段と、
前記符号化ツリーの選択されたレベルに進む前に、復号すべきビットストリームにおいて、いくつかのビットをスキップするよう復号器に指示するスキップインジケータを生成するための手段と、
メモリ内のデータ構造に、前記部分値および前記スキップインジケータを格納するための手段と
を備える装置。
前記基本符号語によって表される値を生成するための手段と、
前記基本符号語の前記部分値の長さを生成するための手段と、
前記メモリ内の前記データ構造に、前記値および前記長さを格納するための手段と
をさらに備える請求項１１に記載の装置。
前記データ構造を、映像復号器、画像復号器、および音声復号器、または言語復号器のうちの１つのメモリに格納するための手段をさらに備える請求項１１に記載の装置。
前記符号化ツリーの前記レベルのうちの一部が、前記符号語によって表される値に対して辞書式順序で配列される符号語を含み、前記基本符号語のそれぞれが、前記符号化ツリーの対応するレベルにおける、辞書式に最小の符号語である請求項１１に記載の装置。
前記基本符号語の前記部分値が、前記基本符号語からの固定数の先行ビットの削除を表す請求項１１に記載の装置。
前記スキップインジケータが、前記符号化ツリーの前記選択されたレベルに進む前に、前記符号語ビットストリームにおいて、前記固定数のビットをスキップするよう前記復号器に指示する請求項１５に記載の装置。
前記ツリーの前記選択されたレベルにおける前記基本符号語の前記部分値が、前記固定数のビットだけ、前記基本符号語をシフトすることに基づいており、前記シフトなしでは、前記ツリーの前記選択されたレベルにおける前記基本符号語が、少なくとも部分的に前記削除された数の先行ビットまで及ぶことになる請求項１５に記載の装置。
前記格納されているデータ構造を使用して、前記符号語ビットストリームからの前記符号語のうちの１つを復号するための手段をさらに含み、前記復号するための手段が、
前記符号語ビットストリームからの前記符号語以下である前記基本符号語の前記部分値のうちの選択された１つについて、前記符号化ツリーの前記レベルを検索するための手段と、
前記スキップインジケータに応答して、前記符号化ツリーの前記選択されたレベルに進む前に、前記符号語ビットストリームにおいて、いくつかのビットをスキップするための手段と、
前記符号語以下の前記基本符号語の前記部分値のうちの前記選択された１つと前記符号語との間の差、および前記符号語以下の前記基本符号語の前記部分値のうちの前記選択された１つのインデックスに基づいて、前記符号語に対応する複数の値のうちの１つを計算するための手段と
を備える請求項１１に記載の装置。
前記計算された値に少なくとも一部分基づいて、ユーザに出力を提示するための手段をさらに備える請求項１８に記載の装置。
前記符号化ツリーに一致する前記符号語で値を符号化するための手段をさらに含み、前記符号語によって表される前記値が、映像データ、画像データ、言語データ、または音声データのうちの少なくとも１つを表す請求項１１に記載の方法。
可変長の符号語を指定する符号化ツリーのレベルについての基本符号語の部分値と、前記符号化ツリーの選択されたレベルに進む前に、復号すべきビットストリームにおいて、いくつかのビットをスキップするよう復号器に指示するスキップインジケータとを格納するデータ構造を備える有形のコンピュータ可読媒体。
前記データ構造が、前記基本符号語によって表される値、および前記基本符号語の前記部分値の長さをさらに格納する請求項２１に記載のコンピュータ可読媒体。
前記符号化ツリーの前記レベルのうちの一部が、前記符号語によって表される値に対して辞書式順序で配列される符号語を含み、前記基本符号語のそれぞれが、前記符号化ツリーの対応するレベルにおける、辞書式に最小の符号語である請求項２１に記載のコンピュータ可読媒体。
前記基本符号語の前記部分値が、前記基本符号語からの固定数の先行ビットの削除を表す請求項２１に記載のコンピュータ可読媒体。
前記スキップインジケータが、前記符号化ツリーの前記選択されたレベルに進む前に、前記符号語ビットストリームにおいて、前記固定数のビットをスキップするよう前記復号器に指示する請求項２４に記載のコンピュータ可読媒体。
前記ツリーの前記選択されたレベルにおける前記基本符号語の前記部分値が、前記固定数のビットだけ、前記基本符号語をシフトすることに基づいており、前記シフトなしでは、前記ツリーの前記選択されたレベルにおける前記基本符号語が、少なくとも部分的に前記削除された数の先行ビットまで及ぶことになる請求項２４に記載のコンピュータ可読媒体。
前記符号語によって表される前記値が、映像データ、画像データ、言語データ、または音声データのうちの少なくとも１つを表す請求項２４に記載のコンピュータ可読媒体。
可変長の符号語を指定する符号化ツリーのレベルについての基本符号語の部分値を生成し、前記符号化ツリーの選択されたレベルに進む前に、復号すべきビットストリームにおいて、いくつかのビットをスキップするよう復号器に指示するスキップインジケータを生成するよう構成されているプロセッサと、
データ構造に、前記部分値および前記スキップインジケータを格納するメモリと
を備える装置。
前記プロセッサが、前記基本符号語によって表される値を生成し、前記基本符号語の前記部分値の長さを生成し、前記メモリが、前記データ構造に、前記値および前記長さを格納する請求項２８に記載の装置。
前記装置が、映像復号器、画像復号器、および音声復号器、または言語復号器のうちの１つを備える請求項２８に記載の装置。
前記符号化ツリーの前記レベルのうちの一部が、前記符号語によって表される値に対して辞書式順序で配列される符号語を含み、前記基本符号語のそれぞれが、前記符号化ツリーの対応するレベルにおける、辞書式に最小の符号語である請求項２８に記載の装置。
前記基本符号語の前記部分値が、前記基本符号語からの固定数の先行ビットの削除を表す請求項２８に記載の装置。
前記スキップインジケータが、前記符号化ツリーの前記選択されたレベルに進む前に、前記符号語ビットストリームにおいて、前記固定数のビットをスキップするよう前記復号器に指示する請求項３２に記載の装置。
前記ツリーの前記選択されたレベルにおける前記基本符号語の前記部分値が、前記固定数のビットだけ、前記基本符号語をシフトすることに基づいており、前記シフトなしでは、前記ツリーの前記選択されたレベルにおける前記基本符号語が、少なくとも部分的に前記削除された数の先行ビットまで及ぶことになる請求項３２に記載の装置。
前記格納されているデータ構造を使用して、前記符号語ビットストリームからの前記符号語のうちの１つを復号する復号器をさらに備え、前記復号器が、
前記符号語ビットストリームからの前記符号語以下である前記基本符号語の前記部分値のうちの選択された１つについて、前記符号化ツリーの前記レベルを検索し、
前記スキップインジケータに応答して、前記符号化ツリーの前記選択されたレベルに進む前に、前記符号語ビットストリームにおいて、いくつかのビットをスキップし、
前記符号語以下の前記基本符号語の前記部分値のうちの前記選択された１つと前記符号語との間の差、および前記符号語以下の前記基本符号語の前記部分値のうちの前記選択された１つのインデックスに基づいて、前記符号語に対応する複数の値のうちの１つを計算する
請求項２８に記載の装置。
前記計算された値に少なくとも一部分基づいて、ユーザに出力を提示する出力装置をさらに備える請求項３５に記載の装置。
前記符号語によって表される値が、映像データ、画像データ、言語データ、または音声データのうちの少なくとも１つを表す請求項２８に記載の装置。
無線通信によって符号器から前記符号語を受信する無線受信機をさらに備える請求項２８に記載の装置。
可変長の符号語を指定する符号化ツリーのレベルについての基本符号語の部分値と、前記符号化ツリーの選択されたレベルに進む前に、復号すべきビットストリームにおいて、いくつかのビットをスキップするよう復号器に指示するスキップインジケータとを備えるデータ構造を格納するメモリと、
前記格納されたデータ構造における前記部分値および前記スキップインジケータに基づいて、前記ビットストリームからの前記符号語のうちの１つを復号するために前記メモリにアクセスする復号器と
を備える復号装置。
前記復号器が、
前記符号語ビットストリームからの前記符号語以下である前記基本符号語の前記部分値のうちの選択された１つについて、前記符号化ツリーの前記レベルを検索し、
前記スキップインジケータに応答して、前記符号化ツリーの前記選択されたレベルに進む前に、前記符号語ビットストリームにおいて、いくつかのビットをスキップし、
前記符号語以下の前記基本符号語の前記部分値のうちの前記選択された１つと前記符号語との間の差、および前記符号語以下の前記基本符号語の前記部分値のうちの前記選択された１つのインデックスに基づいて、前記符号語に対応する複数の値のうちの１つを計算する
請求項３９に記載の装置。
前記計算された値に少なくとも一部分基づいて、ユーザに出力を提示する出力装置をさらに備える請求項４０に記載の装置。
前記データ構造が、前記基本符号語によって表される値、および前記基本符号語の前記部分値の長さを備える請求項４１に記載の装置。
前記復号装置が、マルチメディア復号装置を備え、前記復号器が、映像復号器、画像復号器、および音声復号器、または言語復号器のうちの１つを含む請求項３９に記載の装置。
前記符号化ツリーの前記レベルのうちの一部が、前記符号語によって表される値に対して辞書式順序で配列される符号語を含み、前記基本符号語のそれぞれが、前記符号化ツリーの対応するレベルにおける、辞書式に最小の符号語である請求項３９に記載の装置。
前記基本符号語の前記部分値が、前記基本符号語からの固定数の先行ビットの削除を表す請求項３９に記載の装置。
前記復号器が、前記符号化ツリーの前記選択されたレベルに進む前に、前記スキップインジケータに応答して、前記符号語ビットストリームにおいて、前記固定数のビットをスキップする請求項４５に記載の装置。
前記ツリーの前記選択されたレベルにおける前記基本符号語の前記部分値が、前記固定数のビットだけ、前記基本符号語をシフトすることに基づいており、前記シフトなしでは、前記ツリーの前記選択されたレベルにおける前記基本符号語が、少なくとも部分的に前記削除された数の先行ビットまで及ぶことになる請求項４５に記載の装置。
無線通信によって符号器から前記符号語を受信するための受信機をさらに備える請求項３９に記載の装置。
メモリ内に格納されているデータ構造にアクセスすることであって、可変長の符号語を指定する符号化ツリーのレベルについての基本符号語の部分値と、前記符号化ツリーの選択されたレベルに進む前に、復号すべきビットストリームにおいて、いくつかのビットをスキップするよう復号器に指示するスキップインジケータとを備える前記データ構造にアクセスすることと、
前記格納されたデータ構造における前記部分値および前記スキップインジケータに基づいて、前記ビットストリームからの前記符号語のうちの１つを復号することと
を備える復号方法。
復号することが、
前記符号語ビットストリームからの前記符号語以下である前記基本符号語の前記部分値のうちの選択された１つについて、前記符号化ツリーの前記レベルを検索することと、
前記スキップインジケータに応答して、前記符号化ツリーの前記選択されたレベルに進む前に、前記符号語ビットストリームにおいて、いくつかのビットをスキップすることと、
前記符号語以下の前記基本符号語の前記部分値のうちの前記選択された１つと前記符号語との間の差、および前記符号語以下の前記基本符号語の前記部分値のうちの前記選択された１つのインデックスに基づいて、前記符号語に対応する複数の値のうちの１つを計算することと
を備える請求項４９に記載の方法。
前記計算された値に少なくとも一部分基づいて、ユーザに出力を提示することをさらに備える請求項４９に記載の方法。
前記データ構造が、前記基本符号語によって表される値、および前記基本符号語の前記部分値の長さを備える請求項４９に記載の方法。
復号することが、映像データ、画像データ、音声データ、および言語データのうちの少なくとも１つを表す値を取得するために、前記符号語を復号することを備える請求項４９に記載の方法。
前記符号化ツリーの前記レベルのうちの一部が、前記符号語によって表される値に対して辞書式順序で配列される符号語を含み、前記基本符号語のそれぞれが、前記符号化ツリーの対応するレベルにおける、辞書式に最小の符号語である請求項４９に記載の方法。
前記基本符号語の前記部分値が、前記基本符号語からの固定数の先行ビットの削除を表す請求項４９に記載の方法。
前記復号器が、前記符号化ツリーの前記選択されたレベルに進む前に、前記スキップインジケータに応答して、前記符号語ビットストリームにおいて、前記固定数のビットをスキップする請求項５５に記載の装置。
前記ツリーの前記選択されたレベルにおける前記基本符号語の前記部分値が、前記固定数のビットだけ、前記基本符号語をシフトすることに基づいており、前記シフトなしでは、前記ツリーの前記選択されたレベルにおける前記基本符号語が、少なくとも部分的に前記削除された数の先行ビットまで及ぶことになる請求項５５に記載の方法。
無線通信によって符号器から前記符号語を受信することをさらに備える請求項４９に記載の方法。
可変長の符号語を指定する符号化ツリーのレベルについての基本符号語の部分値と、前記符号化ツリーの選択されたレベルに進む前に、復号すべきビットストリームにおいて、いくつかのビットをスキップするよう復号器に指示するスキップインジケータとを備えるデータ構造を格納するための手段と、
前記格納されたデータ構造における前記部分値および前記スキップインジケータに基づいて、前記ビットストリームからの前記符号語のうちの１つを復号するための手段と
を備える復号装置。
復号するための前記手段が、
前記符号語ビットストリームからの前記符号語以下である前記基本符号語の前記部分値のうちの選択された１つについて、前記符号化ツリーの前記レベルを検索するための手段と、
前記スキップインジケータに応答して、前記符号化ツリーの前記選択されたレベルに進む前に、前記符号語ビットストリームにおいて、いくつかのビットをスキップするための手段と、
前記符号語以下の前記基本符号語の前記部分値のうちの前記選択された１つと前記符号語との間の差、および前記符号語以下の前記基本符号語の前記部分値のうちの前記選択された１つのインデックスに基づいて、前記符号語に対応する複数の値のうちの１つを計算するための手段と
を備える請求項５９に記載の装置。
前記計算された値に少なくとも一部分基づいて、ユーザに出力を提示するための手段をさらに備える請求項５９に記載の装置。
前記データ構造が、前記基本符号語によって表される値、および前記基本符号語の前記部分値の長さを備える請求項５９に記載の装置。
復号するための前記手段が、映像データ、画像データ、音声データ、および言語データのうちの少なくとも１つを表す値を取得するために、前記符号語を復号するための手段を備える請求項５９に記載の装置。
前記符号化ツリーの前記レベルのうちの一部が、前記符号語によって表される値に対して辞書式順序で配列される符号語を含み、前記基本符号語のそれぞれが、前記符号化ツリーの対応するレベルにおける、辞書式に最小の符号語である請求項５９に記載の装置。
前記基本符号語の前記部分値が、前記基本符号語からの固定数の先行ビットの削除を表す請求項５９に記載の装置。
復号するための前記手段が、前記符号化ツリーの前記選択されたレベルに進む前に、前記スキップインジケータに応答して、前記符号語ビットストリームにおいて、前記固定数のビットをスキップする請求項６５に記載の装置。
前記ツリーの前記選択されたレベルにおける前記基本符号語の前記部分値が、前記固定数のビットだけ、前記基本符号語をシフトすることに基づいており、前記シフトなしでは、前記ツリーの前記選択されたレベルにおける前記基本符号語が、少なくとも部分的に前記削除された数の先行ビットまで及ぶことになる請求項６５に記載の装置。
無線通信によって符号器から前記符号語を受信するための手段をさらに備える請求項５９に記載の装置。
プロセッサに、
メモリ内に格納されているデータ構造にアクセスさせることであって、可変長の符号語を指定する符号化ツリーのレベルについての基本符号語の部分値と、前記符号化ツリーの選択されたレベルに進む前に、復号すべきビットストリームにおいて、いくつかのビットをスキップするよう復号器に指示するスキップインジケータとを備える前記データ構造にアクセスさせること、および
前記格納されたデータ構造における前記部分値および前記スキップインジケータに基づいて、前記ビットストリームからの前記符号語のうちの１つを復号させること
のための命令を備える有形のコンピュータ可読媒体。
命令が、前記プロセッサに、
前記符号語ビットストリームからの前記符号語以下である前記基本符号語の前記部分値のうちの選択された１つについて、前記符号化ツリーの前記レベルを検索させ、
前記スキップインジケータに応答して、前記符号化ツリーの前記選択されたレベルに進む前に、前記符号語ビットストリームにおいて、いくつかのビットをスキップさせ、
前記符号語以下の前記基本符号語の前記部分値のうちの前記選択された１つと前記符号語との間の差、および前記符号語以下の前記基本符号語の前記部分値のうちの前記選択された１つのインデックスに基づいて、前記符号語に対応する複数の値のうちの１つを計算させる
請求項６９に記載のコンピュータ可読媒体。
前記プロセッサに、前記計算された値に少なくとも一部分基づいて、ユーザに出力を提示するよう出力装置を制御させるための命令をさらに備える請求項６９に記載のコンピュータ可読媒体。
前記データ構造が、前記基本符号語によって表される値、および前記基本符号語の前記部分値の長さを備える請求項６９に記載のコンピュータ可読媒体。
前記命令が、前記プロセッサに、映像データ、画像データ、音声データ、および言語データのうちの少なくとも１つを表す値を取得するために、前記符号語を復号させる請求項６９に記載のコンピュータ可読媒体。
前記符号化ツリーの前記レベルのうちの一部が、前記符号語によって表される値に対して辞書式順序で配列される符号語を含み、前記基本符号語のそれぞれが、前記符号化ツリーの対応するレベルにおける、辞書式に最小の符号語である請求項６９に記載のコンピュータ可読媒体。
前記基本符号語の前記部分値が、前記基本符号語からの固定数の先行ビットの削除を表す請求項６９に記載のコンピュータ可読媒体。
前記命令が、前記プロセッサに、前記符号化ツリーの前記選択されたレベルに進む前に、前記スキップインジケータに応答して、前記符号語ビットストリームにおいて、前記固定数のビットをスキップさせる請求項７５に記載のコンピュータ可読媒体。
前記ツリーの前記選択されたレベルにおける前記基本符号語の前記部分値が、前記固定数のビットだけ、前記基本符号語をシフトすることに基づいており、前記シフトなしでは、前記ツリーの前記選択されたレベルにおける前記基本符号語が、少なくとも部分的に前記削除された数の先行ビットまで及ぶことになる請求項７５に記載のコンピュータ可読媒体。
可変長の符号語を指定する符号化ツリーのレベルについての基本符号語の部分値と、前記符号化ツリーの選択されたレベルに進む前に、復号すべきビットストリームにおいて、いくつかのビットをスキップするよう復号器に指示するスキップインジケータとを備えるデータ構造を格納するメモリと、
前記格納されたデータ構造における前記部分値および前記スキップインジケータに基づいて、前記ビットストリームからの前記符号語のうちの１つを復号するために前記メモリにアクセスする復号器と、
無線通信によって符号器から前記符号語を受信するための受信機と、
前記復号された符号語に少なくとも一部分基づいてユーザに出力を提示する出力装置と
を備える無線通信装置ハンドセット。
前記復号器が、
前記符号語ビットストリームからの前記符号語以下である前記基本符号語の前記部分値のうちの選択された１つについて、前記符号化ツリーの前記レベルを検索し、
前記スキップインジケータに応答して、前記符号化ツリーの前記選択されたレベルに進む前に、前記符号語ビットストリームにおいて、いくつかのビットをスキップし、
前記符号語以下の前記基本符号語の前記部分値のうちの前記選択された１つと前記符号語との間の差、および前記符号語以下の前記基本符号語の前記部分値のうちの前記選択された１つのインデックスに基づいて、前記符号語に対応する複数の値のうちの１つを計算する
請求項７８に記載のハンドセット。
前記データ構造が、前記基本符号語によって表される値、および前記基本符号語の前記部分値の長さを備える請求項７８に記載のハンドセット。
前記復号器が、映像復号器、画像復号器、および音声復号器、または言語復号器のうちの１つを含む請求項７８に記載のハンドセット。
前記符号化ツリーの前記レベルのうちの一部が、前記符号語によって表される値に対して辞書式順序で配列される符号語を含み、前記基本符号語のそれぞれが、前記符号化ツリーの対応するレベルにおける、辞書式に最小の符号語である請求項７８に記載のハンドセット。
前記基本符号語の前記部分値が、前記基本符号語からの固定数の先行ビットの削除を表し、前記復号器が、前記符号化ツリーの前記選択されたレベルに進む前に、前記スキップインジケータに応答して、前記符号語ビットストリームにおいて、前記固定数のビットをスキップする請求項７８に記載のハンドセット。
前記ツリーの前記選択されたレベルにおける前記基本符号語の前記部分値が、前記固定数のビットだけ、前記基本符号語をシフトすることに基づいており、前記シフトなしでは、前記ツリーの前記選択されたレベルにおける前記基本符号語が、少なくとも部分的に前記削除された数の先行ビットまで及ぶことになる請求項８３に記載のハンドセット。
可変長の符号語を指定する符号化ツリーのレベルについての基本符号語の部分値と、前記符号化ツリーの選択されたレベルに進む前に、復号すべきビットストリームにおいて、いくつかのビットをスキップするよう復号器に指示するスキップインジケータとを備えるデータ構造を格納するメモリと、
前記格納されたデータ構造における前記部分値および前記スキップインジケータに基づいて、前記ビットストリームからの前記符号語のうちの１つを復号するために前記メモリにアクセスする復号器と
を備える集積回路装置。
前記復号器が、
前記符号語ビットストリームからの前記符号語以下である前記基本符号語の前記部分値のうちの選択された１つについて、前記符号化ツリーの前記レベルを検索し、
前記スキップインジケータに応答して、前記符号化ツリーの前記選択されたレベルに進む前に、前記符号語ビットストリームにおいて、いくつかのビットをスキップし、
前記符号語以下の前記基本符号語の前記部分値のうちの前記選択された１つと前記符号語との間の差、および前記符号語以下の前記基本符号語の前記部分値のうちの前記選択された１つのインデックスに基づいて、前記符号語に対応する複数の値のうちの１つを計算する
請求項８５に記載の集積回路装置。
前記データ構造が、前記基本符号語によって表される値、および前記基本符号語の前記部分値の長さを備える請求項８５に記載の集積回路装置。
前記復号器が、映像復号器、画像復号器、および音声復号器、または言語復号器のうちの１つを含む請求項８５に記載の集積回路装置。
前記符号化ツリーの前記レベルのうちの一部が、前記符号語によって表される値に対して辞書式順序で配列される符号語を含み、前記基本符号語のそれぞれが、前記符号化ツリーの対応するレベルにおける、辞書式に最小の符号語である請求項８５に記載の集積回路装置。
前記基本符号語の前記部分値が、前記基本符号語からの固定数の先行ビットの削除を表し、前記復号器が、前記符号化ツリーの前記選択されたレベルに進む前に、前記スキップインジケータに応答して、前記符号語ビットストリームにおいて、前記固定数のビットをスキップする請求項８５に記載の集積回路装置。
前記ツリーの前記選択されたレベルにおける前記基本符号語の前記部分値が、前記固定数のビットだけ、前記基本符号語をシフトすることに基づいており、前記シフトなしでは、前記ツリーの前記選択されたレベルにおける前記基本符号語が、少なくとも部分的に前記削除された数の先行ビットまで及ぶことになる請求項９０に記載の集積回路装置。