JP4966669B2 - マッチング追跡を用いたデータ圧縮 - Google Patents

マッチング追跡を用いたデータ圧縮 Download PDF

Info

Publication number
JP4966669B2
JP4966669B2 JP2006549457A JP2006549457A JP4966669B2 JP 4966669 B2 JP4966669 B2 JP 4966669B2 JP 2006549457 A JP2006549457 A JP 2006549457A JP 2006549457 A JP2006549457 A JP 2006549457A JP 4966669 B2 JP4966669 B2 JP 4966669B2
Authority
JP
Japan
Prior art keywords
data
data set
dimensional
maximum magnitude
dimensional basis
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2006549457A
Other languages
English (en)
Other versions
JP2007518367A5 (ja
JP2007518367A (ja
Inventor
モンロ、ドナルド、エム.
Original Assignee
アイスコフ・ビジュアルズ・エルエルシー
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by アイスコフ・ビジュアルズ・エルエルシー filed Critical アイスコフ・ビジュアルズ・エルエルシー
Publication of JP2007518367A publication Critical patent/JP2007518367A/ja
Publication of JP2007518367A5 publication Critical patent/JP2007518367A5/ja
Application granted granted Critical
Publication of JP4966669B2 publication Critical patent/JP4966669B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • H04N19/31Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability in the temporal domain
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/63Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/97Matching pursuit coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Theoretical Computer Science (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

本発明は、データ圧縮技術に関するものであって、具体的には、マッチング追跡アルゴリズムを用いる技術に関する。本発明は、特にビデオおよび静止画像の圧縮に適用可能であるが、これらに限定されるものではない。
マッチング追跡として知られる変換は、「時間周波数ディクショナリを用いるマッチング追跡」(IEEE Transactionson Signal Processing,volume 41、1993年12月12日)と題するMallatおよびZangの論文の中で最初に紹介された。この論文の出版後、ビデオ画像およびオーディオデータ圧縮への前記マッチング追跡アルゴリズムの応用を目的とした数多くの研究が行われた。その一例は、「マッチング追跡に基づく非常に低いビットレートのビデオ符号化」(IEEE Transactions on Circuit and Systems for Video Technology、volume 7、number 5、1997年10月、158−171ページ)と題するNeffおよびZakhorの論文である(米国特許第US−A−5699121号公報も参照のこと)。前記変換が極めて効果的であることは証明されたものの、大量の計算を要するため比較的遅いことを主な理由として、その実用化には限りがあった。一般に、前記変換が十分に最適化されるか、若しくはハードウェアのスピードが十分に速くなるまで、今後数年間は実際的なリアルタイムのビデオ符号化システムに前記変換を使用できるようになることはないと考えられてきた。しかし、スピーチエンコードにマッチング追跡を利用する方法は、「直交マッチング追跡を用いたウェーブレットベースのスピーチ符号化」と題するRezaiifarおよびJafarkhaniの論文(Proc.29th Int.Conf.onInformation Systems(CISS−95),pp88−92、1995年3月)の中で説明されている。
本発明は、また、常に大量の計算を必要とするという、マッチング追跡に対する問題のある考え方を払拭するものでもある。
この出願の発明に関連する先行技術文献情報としては、以下のものがある(国際出願日以降国際段階で引用された文献及び他国に国内移行した際に引用された文献を含む)。
米国特許第号5,699,121明細書 米国特許出願公開第2003/031369号明細書 Banham, M.R., "A Selective Update Approach to Matching Pursuits Video Coding," IEEE Transaction on Circuits and Systems for Video Technology, 1997,7(1),119−129 Mallat, S.G., "Matching Pursuits with Time−Frequency Dictionaries," IEEE Transactions on Signal Processing, December 1993, 41, 3397−3408 Neff et al., "Very low bit rate video coding based on Matching Pursuits," IEEE Transactions on Circuits and Systems for Video Techonology, Octorber 1997, 7(5), 158−171 Rezaiifar et al., "Wavelet Based Speech Coding Using Orthogonal Matching Pursuit," Proc. 29th Int. Conf. on Information Systems (CISS−95), March 1995,88−92, Vetterli, M.., "Matching Pursuit for Compression and Application to Motion Compensated Video Coding," IEEE International Conference Proceedings ICIP−94, November 1994, 1(13−16), 725−729
本発明の1つの観点に従い、多次元データに変換を適用し、多次元変換データセットを生成する工程と、1若しくはそれ以上の1次元マッチング追跡アルゴリズムを適用することにより前記変換データセットを符号化する工程とを有するデータ圧縮方法が提供される。
好ましくは、前記データを通る異なるスキャン方向のそれぞれで、複数の1次元マッチング追跡アルゴリズムが用いられる。前記スキャン方向は直交でよいが、必ずしもそれに限定されない。前記データの1つの次元に1つの1次元マッチング追跡アルゴリズムを適用することも、それより少なくすることも可能である。言い換えれば、前記データの次元の数を上限として、1若しくはそれ以上のマッチング追跡アルゴリズムを使用することができる。
本発明の別の観点に従って提供されるデータ圧縮方法は、
(a)多次元データに変換を適用し、多次元変換データセットを生成する工程と、
(b)前記変換データセットを複数の第1の1次元基底関数のそれぞれで畳み込み、対応する複数の畳み込みデータセットを生成する工程と、
(c)全ての畳み込みデータセットにわたる第1の方向における場所と、最大マグニチュードとを表す第1の基底関数を決定する工程と、
(d)前記変換データを前記場所にて、複数の第2の1次元基底関数のそれぞれで畳み込む工程と、
(e)最大マグニチュードを表す第2の基底関数を決定する工程と、
(f)前記場所を囲む前記変換データの部分を、前記決定された最大マグニチュードに対応する前記第1および第2の基底関数から派生する原子で表す工程と、
(g)前記変換データセットから前記原子を減算して新しいデータセットを作成する工程と、
(h)前記変換データセットの任意の変更部分を前記複数の第1の1次元基底関数のそれぞれで畳み込むことによって前記畳み込みデータを繰り返し更新し、工程(c)〜(f)を再度適用する工程と、
(i)工程(f)で派生した原子を量子化変換データ符号化バージョンとして出力する工程とを有するものである。
別の観点に従って提供されるデータ圧縮方法は、
(a)多次元データに変換を適用し、多次元変換データセットを生成する工程と、
(b)前記変換データセットを複数の第1の1次元基底関数のそれぞれで畳み込み、対応する複数の畳み込みデータセットを生成する工程と、
(c)全ての畳み込みデータセットにわたる第1の方向における第1の場所と、最大マグニチュードを表す第1の基底関数とを決定し、前記第1の場所を囲む前記変換データの部分を、前記決定された最大マグニチュードに対応する前記第1の関数から派生した第1の原子で表す工程と、
(d)前記変換データセットから前記第1の原子を減算して新しいデータセットを作成する工程と、
(e)前記新しいデータセットを複数の第2の1次元基底関数のそれぞれで畳み込む工程と、
(f)全ての畳み込みデータセットにわたる第2の方向における第2の場所と、最大マグニチュードを表す第2の基底関数とを決定し、第2の場所を囲む前記新しいデータセットの部分を、前記決定された最大マグニチュードに対応する前記第2の関数から派生した第2の原子で表す工程と、
(g)前記新しいデータセットから前記第2の原子を減算し、さらに新しいデータセットを作成する工程と、
(h)前記さらに新しいデータセットを用いて工程(b)を繰り返した後に工程(c)〜(f)を再度適用する工程と、
(i)工程(c)および(f)で派生した原子を量子化変換データ符号化バージョンとして出力する工程とを有するものである。
別の観点に従い、時間変動データに変換を適用し、多次元変換データセットを生成する手段を有するデータ圧縮のための符号器と、1若しくはそれ以上の1次元マッチング追跡アルゴリズムを各次元に1つ適用することにより前記変換データセットを符号化するための符号器とが提供される。
別の観点に従って提供されるデータ圧縮のための符号器は、
(a)多次元変換データセットを生成するために多次元データに変換を適用する手段と、
(b)対応する複数の畳み込みデータセットを生成するために前記変換データセットを複数の第1の1次元基底関数のそれぞれで畳み込む手段と、
(c)全ての畳み込みデータセットにわたる第1の方向における場所と、最大マグニチュードを表す第1の基底関数とを決定する手段と、
(d)前記変換データを前記場所にて、複数の第2の1次元基底関数のそれぞれで畳み込む手段と、
(e)最大マグニチュードを表す第2の基底関数を決定する手段と、
(f)前記場所を囲む前記変換データの部分を、前記決定された最大マグニチュードに対応する前記第1および第2の基底関数から派生する原子で表すた手段と、
(g)新しいデータセットを作成するため、前記変換データセットから前記原子を減算する手段と、
(h)前記変換データセットの任意の変更部分を前記複数の第1の1次元基底関数のそれぞれで畳み込むことによって前記畳み込みデータを繰り返し更新する手段と、
(i)その派生原子の量子化変換データ符号化バージョンを出力する手段とを有するものである。
別の観点に従って提供されるデータ圧縮のための符号器は、
(a)多次元変換データセットを生成するために多次元データに変換を適用する手段と、
(b)対応する複数の畳み込みデータセットを生成するために前記変換データセットを複数の第1の1次元基底関数のそれぞれで畳み込む手段と、
(c)全ての畳み込みデータセットにわたる第1の方向における第1の場所と、最大マグニチュードを表す第1の基底関数とを決定する手段、および前記第1の場所を囲む前記変換データの部分を、前記決定された最大マグニチュードに対応する前記第1の関数から派生した第1の原子で表す手段と、
(d)前記変換データセットから前記第1の原子を減算して新しいデータセットを作成する手段と、
(e)前記新しいデータセットを複数の第2の1次元基底関数のそれぞれで畳み込む手段と、
(f)全ての畳み込みデータセットにわたる第2の方向における第2の場所と、最大マグニチュードを表す第2の基底関数とを決定する手段、および第2の場所を囲む前記新しいデータセットの部分を、前記決定された最大マグニチュードに対応する前記第2の関数から派生した第2の原子で表す手段と、
(g)さらに新しいデータセットを作成するため、前記新しいデータセットから前記第2の原子を減算する手段と、
(h)前記さらに新しいデータセットを用いて工程(b)を繰り返す手段、およびそのた後に工程(c)〜(f)を再度適用する手段と、
(i)工程(c)および(f)で派生した原子を量子化変換データ符号化バージョンとして出力するための手段とを有するものである。
本発明は、さらに、前述のような符号器を含むコーデックを含むものである。本発明は、さらに、上述の方法を実行するためのコンピュータプログラムと、そのようなコンピュータプログラムを運ぶ機械読み取り可能なデータキャリアとを含むものである。
好ましい方法において、前記変換は、非相関変換および/または周波数に基づく変換から成るか、若しくはそれ若しくはそれらを含む。
前記マッチング追跡アルゴリズムを適用する場合、前記変換データセットを前記複数の基底のそれぞれで畳み込むためのメカニズムは重要ではない。典型的に、これは、前記基底のそれぞれの内積を、前記変換データセットのあらゆる可能なポジション(データポイント)で計算することによって行うことが可能である。しかし、前記ポジションを決めるための、より精度の低い方法を使うこともできる。同様に、例えば検索などあらゆる便利な方法で、前記内積が最大であるポジションを決定することができる。好ましくは、次に、そのポジションの基底関数に、その選択された内積と同じサインを有する係数を掛けることによって、その相関点周囲のデータのわずかな部分が表される。
最大マグニチュードを有するポジションは、絶対マグニチュード(ゼロに対して)を取ることによって決定することができる。あるいは、最大マグニチュードのポジションは、感覚的若しくは精神物理的モデルを表すことが可能なデータ全体に1つの関数を適用した後に決定することができ、そのようなモデルとしては、前記データの知覚的重要性を表す心理音響的若しくは心理視覚的モデルなどがある。その機能マップは、最大マグニチュードのポジションを決定する前に、前記データから減算されるしきい値を定義する場合がある。あるいは、前記機能マップを前記データの乗数として用いること、若しくはその他の何らかの方法で前記データと組み合わせることができる。
本発明の方法は、2次元データ(例えば静止画像)および3次元データ(例えば時間次元に何らかの圧縮のある動画)の両方の圧縮に用いることができる。3次元データを圧縮する場合は、2次元変換を用いた後に1次元マッチング追跡アルゴリズムを3回適用することができる。
本発明の1つの実施形態において、前記変換データセットの全体または部分(例えば前記データセットのサブバンド)を、前記データが最も相関される方向にスキャンし、そのスキャンデータに1次元マッチング追跡を適用することができる。
本発明は、様々な方法で実用化が可能なものである。次に、添付の図を参照し、例を挙げて具体的な実施形態をいくつか説明する。
具体的な実施形態を詳細に説明する前に、前記マッチング追跡変換の動作の概要を説明する。具体的には、2D変換を用いて、静止画像のような2Dブロックのデータを圧縮する方法の概要を述べる。
前記2Dのケースにおけるマッチング追跡は、2D基底関数のライブラリを用いるものであって、典型的には、正規化ガボール関数であるが、他の関数も等しく用いることが可能である。前記画像をエンコードするために、前記変換は、あらゆる可能なデータポイントでの全ての基底の内積を形成する。これは、前記データをあらゆる全ての基底関数で畳み込むことと同等である。局所的には、前記基底関数が前記データを象徴するところでは、その内積の中にピークが生じる。その結果から、最大マグニチュードの内積を与える基底関数を検索する。次に、そのポジションの基底関数に、選択された内積と同じサインを有する係数を掛けることによって、前記データのわずかな部分を表すことができる。
これにより、「原子」と呼ばれるものが与えられる。前記原子のコードは、対応する基底関数の数に沿った前記データセット(例えば画像)内の振幅とポジションである。
次に、検出された原子を前記画像から減算することにより、前記データのその時点での非符号化部分を表す修正画像を得る。次に、このプロセスを繰り返し行い、追加的な原子を検出する。各繰り返しの都度、最大マグニチュードの内積を与える基底関数の検索が実行される。当然、前記畳み込みの更新が必要なのは、前記基底関数の減算によって変更されたところだけである。
各繰り返しにて検出された原子を単純に合計し、前記データのエンコード化されたバージョンを作成する。ある程度望ましいレベルの忠実さで元画像を表すために十分な原子が検出されたら、それら原子の一覧によって、圧縮コードが構成される。必要であれば、サイズを縮小するためにこのコードを配列してエントロピー符号化することが可能である。
前記1次元マッチング追跡変換はこれに類似しているが、当然、そのコードブックは2D関数ではなく1D関数を含むものである。生オーディオデータへの変換として適用された1次元マッチング追跡は有望な結果を与えてきたが、上述のように、前記変換が非常に大量の計算を伴う点が、これまで、実際的なリアルタイムのアプリケーションでの有用性を厳しく制約してきた。
図1は、第1の実施形態に従った本発明の動作の概略を示す。ここでは、何らかの変換(好ましくは周波数変換)を多次元データセット(図示せず)に適用し、多次元変換データセット10が作成されている。例示のみを目的とし、前記データセット10は、軸x、yを有する2次元データセットである。
このデータセットにマッチング追跡を適用するために、前記データをx方向でラスタースキャンし、最大マグニチュードの原子が検出される場所12を決定する。ポジション、振幅、コードブック・エントリを記録する。次に、検出された前記原子を前記変換データセット10から減算し(典型的には前記振幅の量子化の後)、修正データセット10aを作成する。次に、前記データセット10aをy方向でラスタースキャンし、前記プロセスを繰り返すことによって、追加的場所14(この場所は前記場所12と同一ではない場合がある)での最良のy原子を検出する。
2次元画像をエンコードするには、スキャンをx方向とy方向で交互に行い、このプロセスを単純に繰り返す。前記スキャンとしては直交スキャンが好ましいが、横および縦である必要はなく、一部のアプリケーションにおいては、対角方向の交互ラスタースキャンを行うことが好ましい場合もある。
この実施形態は、より高次元のデータセットに容易に応用することができる。例えば、3次元データセットのx、y、zの交互スキャンを行い、各スキャンで選択される適切な1次元原子でエンコードすることができる。前記データセットがx、y、tでのビデオストリームを表すものである場合、前記t軸を上記z軸と全く同じ方法で扱い、同じ方法を採用することが可能である。すなわち、前記t軸があたかも独立の空間軸であるかのように、前記t軸を扱うことができる。x、y、z、tでの時間変動3次元データも同様の方法で扱うことができ、この場合、x、y、z、tでスキャンを繰り返す。2次元の場合と同じく、互いに直交方向のスキャンが好ましいが、前記軸が前述のようである必要はない。一部の実施形態においては、対角面を走査するラスタースキャンが好ましい場合がある。
各1次元スキャンに使用されるコードブックは一意のものとすることができるが、同一のコードブックを複数方向のスキャンに使用することもできる。場合によっては、第1のコードブックを空間次元でのスキャンに使用するのが望ましく、第2のコードブックを時間次元のスキャンに使用するのが望ましい。
各ラスタースキャンを、エンコード化するデータセット全体に行う必要はない。希望に応じて、スキャン前に前記データセットを分割し、分割されたそれぞれの部分について別個にスキャンを行うことができる。その分割は、空間分割、時間分割、周波数分割、若しくはその他のタイプの分割のいずれでもよく、処理されるデータのタイプおよび使用中の特定の変換に応じて便利であろう分割を行うことができる。1次元スキャンは、各領域にて異なる方向で行うことができる。
別の、より洗練された方法を、図2に示す。ここでは、最初にスキャンをx方向20で行い、最適なx原子22の場所22を前述のように決定する。次に、y方向で直交スキャン24を、データセット全体にではなく、前記原子22の領域にて局所的にのみ行う。次に、この場所にて、最良のy原子が選択される。前記x原子とy原子とによって、単一の(分離可能な)2次元変換が定められる。その振幅を量子化し、前記原子を前記データセットから減算し、修正データセットを作り出し、それに対して前記手順を繰り返すことができる。第2のスキャンは第1のスキャンに対して直交方向に行われるので、図の下方で22a、22b、22cが示すように、前記x原子22の場所は前記y軸の出力ストリームで分割される。したがって、前記y軸ストリームにある複数の場所で、前記減算の後に前記データセットの「修復」が必要となる。
3次元以上においても同一の方法を用いることができる。したがって、元データセットがx、y、zでの3次元モデルを表すものであっても、3回の別個の1次元スキャンを用いて単一の3D原子を生成することができる。
同様に、x、y、tでビデオストリームをエンコードする場合、前記t軸を単純に第3の空間次元として取り扱い、x、y、tで単一の3D原子を作成することができる。ビデオ画像のシーケンスをエンコードする場合は、上述のように、適切な変換を最初に適用し、3次元変換データセットを作成する(空間および時間)。次に、前記3次元データセットに対し、3回のマッチング追跡の可分割検索を異なる直交方向で行う。したがって、例えば最初に、第1の1次元コードブックを用いて前記データをx方向でラスタースキャンし、前記コードブック内で各原子に最適にマッチする場所を求める。最良のx原子と場所が検出されたら、次に、再びマッチング追跡を行うが、今回は別個のコードブックを用いてy方向のみを走査する。発明者らは、実際には、予め特定された最良の場所若しくはその近くの小さいエリアに前記y検索を制限しても、なおよい結果が得られ、しかも大幅に計算負荷が低減されることを発見した。したがって、前記y方向でデータセット全体を再びスキャンする必要はない。
最良の原子の場所が確認されたら、今度は時間次元に基づく1次元コードブックを用いて前記プロセスを繰り返す。前と同じように、xおよび/またはy検索で検出された最良の場所若しくはそれに近い場所にあるエリアに限定してtの検索を行うことができる。実際には、x、y、tの検索に別個のマッチング追跡コードブックを用いて最良の結果を得ることが可能であることが発見済みである。しかし、xおよびy方向のみ若しくは3つの全ての方向で、共通コードブックを適宜使用することも可能である。
3つの全ての1次元原子が特定されたら、好ましい場所周辺で3次元ブロック全体を再構成することができる。(その内積を用いて)再計算し、調整後の前記データ(それぞれ個別の方向の「振幅」はそれ自体では、実際のモデル振幅を計算するのに不十分であるので、振幅を含める)を再構成する。
次に、前記モデル化データを量子化し、前記元データから減算する。将来参考にするために前記3つの1次元原子についてのメモを作成し、この縮小データセットに対して全てのプロセスを繰り返す。特定のアプリケーションの要求に応じ、前記データセットが十分に縮小されるまで、これを繰り返す。
分離可能なx、y、z、t原子から構成された単一の4D原子を用いることによって、同じ方法を時間変動3次元データに適用することも可能である。
上記は可能な様々な選択肢を提供するものであるが、最も好ましい実施形態について以下に述べる。前記多次元変換の後、望ましい任意の1次元読み出し順序で前記データを単純にスキャンする。次に、前記1次元スキャンを1次元マッチング追跡で符号化する。
その他の読み出し順序で再スキャンすることによって、これを繰り返すことができる(ただし、これは第1のものに対して直交である必要はない)。したがって、典型的には、前記データの次元当たり1を最高として、1若しくはそれ以上のマッチング追跡アルゴリズムを用いる。
ウェーブレット変換が用いられた場合は、そのxコードブックは、周波数、位相、減衰、振幅の定数の大きさを定める原子を含むことができ、そのyコードブックはスリュー、減衰、サイズ、振幅を定めることができ(周波数はすでに決定済みであるので考慮する必要はない)、そのtコードブックは時間スリュー、減衰、サイズを定めることができる。
個々の1次元原子を定めるために使用できる便利な関数は、ガボール関数である。x方向においては、下記等式のf(x)によってそれが得られる。
Figure 0004966669
同様のガボール関数G(y)およびH(t)を、yおよびt方向に使用することができる。当然、その振幅、位相シフト、減衰の定数は、前記3方向のそれぞれにおいて異なる場合があるものと理解される。
それら3つのマッチは、必ずしも上述の順序で実行する必要はなく、例えばt、x、yまたはx、t、yなど、その他の順序でのマッチで十分若しくは便利である場合もある。
前記好ましい実施形態において、各1次元マッチング追跡アルゴリズムは、使用可能な前記基底のそれぞれの内積を、前記変換データセットのあらゆる可能なポジション(データポイント)で計算することによって実行することが可能である。次に、例えば検索などあらゆる便利な方法で、前記内積が最大マグニチュードであるポジションが決定される。上述のように、前記第2、第3の1Dマッチは、空間での検索を一切必要としないが、場合によっては、先行マッチで検出された「最良」の場所の近くで小規模の1D(または2Dまたは3D)を実行することが便利である。あるいは、最大絶対マグニチュード(ゼロに対して)を有する場所を探すのではなく、その他の何らかのマグニチュードの尺度を用いることができる。心理音響的若しくは心理視覚的モデルのようなモデルが使用される場合は、最大マグニチュードのポジションは、基礎となるモデルを参照して選択される。それを行う1つの方法は、最大マグニチュードのポジションを決定する前に前記モデルを重みとしてデータセット全体に適用することであるが、別の方法は、前記モデルを定義づけ、しきい値として捉えることであって、この場合、前記しきい値を内積から減算した後に、最大マグニチュードの差を求めることができる。当然、その他の方法も可能なものと理解される。一般に、心理音響的モデル、心理視覚的モデル、またはその他のモデルを、前記変換データセット全体に機能マップとして適用し、最大マグニチュードのポジションを、前記マップ機能によって修正された前記変換データ全体で決定することができる。
上述の実施形態のいずれにおいても、スキャン方向を交互にする代わりに、「機動的スキャン」と名づけた方法を使用することができる。まず、それぞれの可能な方向で別個にスキャンを行い、それらの方向のそれぞれにおいて、可能な最良の原子を決定する。前記原子のそれぞれの振幅(マグニチュード)を保管する。次に、その他のチャネルのうちの1つの保管されたマグニチュードよりも低いマグニチュードを有する原子を前記チャネルが生成するまで、最高のマグニチュードのチャネル(方向)を繰り返しスキャンする。次に、その時点で最大マグニチュードの原子を含むチャネルに切り替え、前記と同一の方法でそれを繰り返しスキャンする。前記チャネルが最高のマグニチュードの原子を生成しなくなったら、再び切り替える。
最後にスキャンされたチャネルが、別のチャネルですでに検出済みの原子と同一のマグニチュードの原子を生成する場合、それらのチャネルを交代させて切り替えるのが好ましい。しかし、あるいは、そのような状況でチャネルを全く切り替えないことも等しく可能である。
この方法は、前記符号器が1つのチャネルにおける「迅速なゲイン」の獲得に集中するのを可能にし、切り替えを行うことが最適になると同時に別のチャネルへ自動的に切り替えるので、特に効率的である。因果関係に基づく規則が使用されるので、前記復号器内に設定された対応規則によって前記符号器の状態を継続的に追跡することができ、状態ビットを転送する必要はない。
上述の好ましい実施形態は、従来の動き補正ビデオ符号化で必要であったようなモーションベクトルを必要としない完全な3Dマッチング追跡ビデオコーダの将来性を初めて提供するものである。モーションベクトルの必要性は、前記原子の時間的特徴によって効果的に除去される。これは、完全にスケーラブルなビデオ符号化の初の実用化につながる影響力を有するものである。
当然、これは、希望に応じて引き続き動き補正を使用する可能性を除外するものではない。時間変動2Dおよび3Dデータの双方に適用可能なそのような実施形態においては、いったん1若しくはそれ以上の空間原子が決定されたら、例えばモーションベクトルを用いるなど何らかの予測メカニズムによって、前記原子を時間次元にコピー(若しくはそれに沿って移動)することが可能である。この方法について、本発明の実施形態を動き補正コーデック内にどのように組み込むことができるかについて、図を参照し以下に詳細に説明する。
これら特定の実施形態の場面を設定するために、次に、一部の標準的な動き補正ビデオ圧縮技術について簡単に説明する。
ビデオ圧縮は、動き補正と非動き補正という2つの基本的なカテゴリーに分類される。その他のフレームを一切参照せずに個々のフレームが圧縮される場合、前記圧縮は「イントラコード式」である。イントラコード式ビデオの利点の1つは、その画像シーケンスに対して実行可能な編集に関する制限がないことである。結果として、放送業界で使用されているほとんどのデジタルビデオは、ソースにてこの方法で保管される。前記イントラコードによる方法は、例えば業界標準JPEG圧縮スキームを含め、多数の静止画像圧縮技術のいずれとも併用することができる。この方法は、ビデオ圧縮用移動JPEG標準が採用している。JPEG圧縮は、個々のフレームそれぞれに対して使用され、前記フレームそれぞれは個別に扱われ、他のフレームを参照することはない。
しかし、ビデオシーケンスは、通常、全く無関係な画像の集合によって構成されているものではなく、通常、前記ビデオシーケンスにおける時間的冗長を考慮することによって、より高い圧縮が得られる。これには、インターコード式圧縮として知られるプロセスが伴う。この方法では、出力シーケンスにある個々の画像は、その画像と前の画像との間に生じた変化を参照して定義される。圧縮データストリーム(再構成のためにデコーダによってビデオチャネルを通して送信されたもの)は、通常、いくつかのフレームから一度に取られた情報を表すものであって、前記圧縮データストリームの編集によって質が大きく損なわれるため、編集は通常行われない。
インターコード式圧縮は、MPEGビデオ圧縮標準に取り入れられた圧縮技術の1つである。
図3は、典型的なインターコード式圧縮スキームの概略を示す。前記図において、最上行Oは圧縮元とするデジタル化ビデオフレームを表し、2行目Cは圧縮後の画像を表し、最下行Rはその残フレームを表す。
前記スキームにおいて、選択された元フレームSは静止画像として扱われるものであって、前記元フレームを任意の便利な方法によって圧縮してイントラフレーム1が生成される。次に、これらのフレームを参照フレームとして用いて予測フレームPを作成する。これらのフレームのコンテンツは、そのシーケンスの前向きか後ろ向きのどちらかで、1若しくはそれ以上のIフレームから予測される。通常、これは、モーションベクトルを使用し、前記画像内の移動ブロックと関連付けることによって行われる。あるいは、前記画像内の特定の物理的オブジェクトの動きを決定して予測することができる。最後に、前記Cシーケンスは、前記フレームPとIとの間の補間フレームBの生成によって完成される。次に、前記Cシーケンスのシーケンシャルフレームによって、前記元ビデオシーケンスを近似させることができる。実際には、最終的に妥当な外観を求める場合、追加的な補正が通常は必要である。これら追加的な補正は、前記元フレームとそれに対応する圧縮フレームの間の差異に対応する残フレームRをそれぞれのケースについて決定することによって行われる。残フレームは、そのイントラフレームについて計算することが可能であるが、これは必ずしも必要ではない。したがって、前記残フレームのうちXが付けられたものは取り除かれる場合がある。
実際的な実施形態においては、符号器が、図中Sが付けられた元フレームから前記Iフレームを計算し、それを元に、前記Pフレームを定義するために必要なモーションパラメータ(ベクトル)を計算する。したがって、前記符号器からそのデコーダに送信されるデータストリームは、エンコードされたIフレームと、前記デコーダによる前記Pフレームの構成を可能にする適切なモーションベクトルとを含む。前記Bフレームは前記デコーダのみによって前記IおよびPフレーム内の情報に基づいて再構成されるので、前記Bフレーム上の情報は送信されない。最終的な結果を改善するために、前記データストリームには、1フレームずつ送信された残画像も含まれる。前記残画像は前記元画像と前記圧縮画像との差分を表すため、前記符号器は圧縮画像のシーケンスへのアクセスを必要とする。これは、前記符号器内に追加的デコーダを組み込むことによって達成される。
したがって、送信される最終データストリームは、完全なIフレームと、前記Pフレームのモーションベクトルと、全ての前記残フレームとを含むが、図1にてXが付けられたフレームは前記残フレームから取り除かれる場合がある。各残画像は、通常、送信前に圧縮される。
マッチング追跡を含め、前記元フレームSを圧縮してそのイントラフレームを作成するための様々な変換は、当業者には周知のものである。また、前述のNeffとZachorの論文は、前記残画像をエンコードするためにマッチング追跡を使用する可能性についても述べている。
これに対し、前記好ましい実施形態においては、生画像を任意の標準的な変換によって変換し、次に、前記マッチング追跡アルゴリズムを用いて前記変換の結果を量子化する。また、残画像にも同一の方法が適用される。つまり、マッチング追跡を変換として前記残画像に適用するのではなく、標準的な変換を用いて前記残画像をまず変換し、次にマッチング追跡を用いてその変換の結果を量子化する。 どちらのケースにおいても、前記データ自体に行われる最初の変換としては、例えば、FFT、ウェーブレット変換、DCT、または重複直交変換が可能である。また、その他の変換を使用することもできる。
モーションベクトルを使用する場合は、図4が示すように、動き補正されたハードウェア若しくはソフトウェア符号器内に上述の方法を組み入れるが、すでに説明したように、本発明においてはモーションベクトル補正は必ずしも必要ない。

図4が示すように、入力302にてフレームが1つずつ入力され、前記イントラフレームデータはイントラフレーム変換304へ伝達され、続いてマッチング追跡コーダまたは原子検索器303へ伝達される。次に、その振幅である原子が305にて量子化される。そのインターフレームデータは、モーション予測器306へ伝達され、前記モーション予測器はパラメータ化されたモーション記述をライン308にて提供し、次にそれが動き補正器310へ伝達される。前記動き補正器は予測されたフレームをライン312に沿って出力し、前記出力を前記入力フレームから減算することによって得られた残フレーム314は残分変換316へ伝達される。前記変換の出力をマッチング追跡コーダ309に適用し、次に量子化器307に適用すると、前記量子化器は量子化されたコードを出力し、その出力ストリームへ送信する。
また、ライン308のモーション記述もモーション記述コーダ320へ伝達され、前記記述コーダは前記記述を符号化してモーションデータをライン322へ出力する。
したがって、前記出力ストリームは、符号化されたイントラフレームデータと、残データと、モーションデータとによって構成される。
前記出力ストリームは参照復号器324へ再び入力され、前記復号器は参照フレーム(イントラまたはインター)をライン326に沿って前記動き補正器へ送り返し、328に沿って前記モーション予測器へ送り返す。この方法において、前記動き補正器および前記モーション予測器は、前記出力ストリームが何を送信しているかを常に把握している。前記参照復号器324は、例えば図5が示すように、それ自体でフル復号器である。
一般に、前記モーションベクトルは、解凍された前フレームを後続フレームと比較することによって得られるが、その元の前フレームを使用することもできる。いずれの場合も、残フレームは、予測フレームと元の後続フレームとの差分として計算される。前記実施形態の1つのバリエーションにおいて(図示せず)、比較対象のフレームとして前フレームを使うことによって、そのモーションベクトルを改善する。
前記出力ストリームは通信ネットワーク全体を通り、反対側の端にて、図5の略図が示すように復号器によって解読される。前記データストリームのイントラ情報はイントラフレーム復号器410へ入力され、前記復号器は解読されたイントラフレーム情報をライン412に提供する。前記インター情報はバス414に入力される。前記残データは前記バスからライン416に沿って残分復号器418へ送信される。同時に、前記モーションデータはライン420に沿って動き補正器422へ入力される。前記残分復号器および前記動き補正器からの出力は合算され、解読されたインターフレームはライン423に提供される。
参照フレーム情報はライン424に沿って前記動き補正器に戻されるので、前記動き補正器は、前記復号器に対する出力と入力の両方の、その時点での詳細を常に有する。
当然、本発明は、図4が示す動き補正ビデオコーダのタイプとの使用に限定されず、主変換からの出力を量子化する必要がある場合、本発明をあらゆるタイプのビデオコーダと使用することが可能であると理解されるべきである。
この方法は、ビデオ圧縮だけでなく、前述したように、静止画像圧縮にも使用することができる。
例えば静止画像を表す生入力データを用いる、さらに別の実施形態を図6に示す。ここでは、入力データ/画像40はまず何らかの方法(例えばウェーブレット変換41)で変換/圧縮され、変換画像42が作り出される。前記画像を、次に、マッチング追跡コーダおよび量子化器43によって量子化し、最終的な符号化された出力44を作成する。前記ウェーブレット変換41の代わりに、FFT、DCT、または重複直交変換のような他の便利な圧縮変換を使うことができる。
図6が示す例において、前記画像40は、ウェーブレット変換によって、空間フィルタされたいくつかのセクション若しくはサブバンド45、46、47、48に分割される。セクション46および47は、1方向でハイパス・フィルタされ、別の方向でローパス・フィルタされてあり、これはすなわち、それら2つのサブバンドは、ある方向において、もう一方の方向よりも非相関しやすいことを意味する。当然、横変換の後に縦変換を行ったり、その逆を行うことが可能なものと理解されるべきである。参照番号400、401が示す前記サブバンドのラスタースキャンを行った後、1次元マッチング追跡による量子化を用いる。異なるスケールでの前記画像内の構造の検出はすでに前記ウェーブレット変換によって自動的に実行済みであるので、各方向に対してかなり小さいマッチング追跡コードブックを用いることができる。したがって、前記マッチング追跡アルゴリズムによってそれを実行する必要はない。
1Dマッチング追跡アルゴリズムの使用による2D変換の出力の量子化は、ウェーブレット変換だけでなく、(少なくとも前記出力の一部エリアにおいて)ある方向において別の方向におけるよりも優れた非相関をする、他の任意の2D変換にも適用することができる。一般に、前記変換の出力は前記データを自動的に多数の異なる分割に分けるものであって、そうすることで、前記分割を個別に、それぞれ別個の好ましい方向でスキャンすることができる。
前記マッチング追跡アルゴリズムは、任意の多次元非相関変換の出力、好ましくは周波数変換の出力に適用できるものと予想される。
図1は、独立の1次元原子が使用された、本発明の第1の実施形態の図である。 図2は、2次元原子を生成するために2つの1次元原子が使用された、第2の実施形態である。 図3は、ビデオ符号化の一般的な方法を示す。 図4は、本発明の1つの実施形態に従ったビデオコーダの概略図である。 図5は、図2の符号器に対応する復号器を示す。 図6は、ウェーブレット変換の2次元出力へのマッチング追跡の適用を図示する。

Claims (27)

  1. データ圧縮方法であって、
    1又は複数の符号器によって、多次元データに変換を適用し、変換された多次元データセットを生成する工程と、
    1又は複数の符号器によって、1次元マッチング追跡アルゴリズムを適用することにより前記変換された多次元データセットを符号化する工程と
    を有し、
    前記1次元マッチング追跡アルゴリズムは、前記データの連続的な1次元スキャンによって適用されるものであり、
    前記連続的な1次元スキャンは、ある方向のスキャンが、他の方向でのスキャンで予め見つかった原子のうち最大マグニチュードの原子より低いマグニチュードの原子が見つかるまで、同一方向に続き、その後、スキャン方向が変更されるものである、データ圧縮方法。
  2. データ圧縮方法であって、
    (a)1又は複数の符号器によって、多次元データに変換を適用し、変換された多次元データセットを生成する工程と、
    (b)1又は複数の符号器によって、前記変換された多次元データセットに対し複数の第1の1次元基底関数のそれぞれを用いて畳み込み演算を行い、対応する複数の畳み込みデータセットを生成する工程と、
    (c)1又は複数の符号器によって、前記畳み込みデータセットに基づいて、最大マグニチュードを表す1つの第1の1次元基底関数と、前記最大マグニチュードに対応する第1の方向における場所とを決定する工程と、
    (d)1又は複数の符号器によって、前記変換された多次元データセットの前記場所を含む領域に対応する部分データを、前記決定された最大マグニチュードに対応する前記1つの第1の1次元基底関数で表す工程と、
    (e)1又は複数の符号器によって、前記変換された多次元データセットから、前記1つの第1の1次元基底関数で表わされる前記部分データを減算して新しいデータセットを作成する工程と、
    (f)1又は複数の符号器によって、前記変換された多次元データセットにおいて前記減算により変更された部分全てを前記複数の第1の1次元基底関数のそれぞれを用いて畳み込み演算を行うことによって、前記畳み込みデータセットを繰り返し更新する工程、およびその次に工程(c)および(d)を再度適用する工程と、
    (g)1又は複数の符号器によって、前記決定された最大マグニチュードに対応する前記1つの第1の1次元基底関数に関する原子を前記変換された多次元データセットの符号化バージョンとして出力する工程と
    を有し、
    圧縮されるデータはビデオ画像データを表わすものであり、
    前記変換された多次元データセットの少なくとも一部は、ある1方向で、当該1方向に垂直な方向よりも優れた非相関があり、工程(c)、(d)、(e)及び(f)を含むアルゴリズムの最初の適用は、最大相関の方向の1次元スキャンによって行われるものである、データ圧縮方法。
  3. 請求項2のデータ圧縮方法において、前記符号化バージョンである各原子は、マグニチュードと、変換された多次元データセットにおける場所と、基底関数のコードブック・エントリとを含むものである、データ圧縮方法。
  4. 請求項1のデータ圧縮方法において、圧縮されるデータはビデオ画像データを表すものである、データ圧縮方法。
  5. 請求項1のデータ圧縮方法において、圧縮されるデータは静止画像を表すものである、データ圧縮方法。
  6. 請求項1のデータ圧縮方法において、圧縮されるデータは、動き補正ビデオコーダ内の残画像を有するものである、データ圧縮方法。
  7. 請求項1のデータ圧縮方法において、前記変換された多次元データセットの1次元は時間を表すものである、データ圧縮方法。
  8. 請求項1のデータ圧縮方法において、前記変換は周波数領域への変換である、データ圧縮方法
  9. 請求項1のデータ圧縮方法において、
    前記変換された多次元データセットの少なくとも一部は、ある1方向で、当該1方向に垂直な方向よりも優れた非相関があり、1次元マッチング追跡アルゴリズムを複数回適用するうちの最初の適用は、最大相関の方向の1次元スキャンによって行われるものである、データ圧縮方法。
  10. 請求項1のデータ圧縮方法において、前記変換された多次元データセットは2次元データセットである、データ圧縮方法。
  11. 請求項1のデータ圧縮方法において、前記スキャン方向は、前記ある方向から前記最大マグニチュードの原子が見つかった方向へ変更されるものである、データ圧縮方法。
  12. 請求項2のデータ圧縮方法であって、1又は複数の符号器によって、最大マグニチュードの場所を決定する前に、前記畳み込みデータセットに機能マップを適用する工程を含むものである、データ圧縮方法。
  13. 請求項12のデータ圧縮方法において、前記機能マップは感覚的モデルを表すものである、データ圧縮方法。
  14. 請求項12のデータ圧縮方法において、前記機能マップは心理音響的モデルを表すものである、データ圧縮方法。
  15. 請求項12のデータ圧縮方法において、前記機能マップは心理視覚的モデルを表すものである、データ圧縮方法。
  16. 請求項12のデータ圧縮方法において、前記機能マップは倍数的に適用されるものである、データ圧縮方法。
  17. 請求項12のデータ圧縮方法において、前記機能マップは加算的または減算的に適用されるものである、データ圧縮方法。
  18. 請求項2のデータ圧縮方法であって、追加的工程として、
    (c1)1又は複数の符号器によって、前記変換された多次元データセットに対し前記場所で複数の第2の1次元基底関数のそれぞれを用いて畳み込み演算を行う工程と、
    (c2)1又は複数の符号器によって、最大マグニチュードを表す1つの第2の1次元基底関数を決定する工程と
    を含み、
    工程(d)において、前記変換された多次元データセットの前記場所を含む領域に対応する部分データを、前記決定された最大マグニチュードに対応する前記第1および前記第2の1次元基底関数で表す工程と、を含む、データ圧縮方法。
  19. 請求項2のデータ圧縮方法であって、追加的工程として、
    (a)1又は複数の符号器によって、前記変換された多次元データセットに対し前記場所で複数の第3の1次元基底関数のそれぞれを用いて畳み込み演算を行う工程と、
    (b)1又は複数の符号器によって、最大マグニチュードを表す1つの第3の基底関数を決定する工程と
    を有し、
    前記原子は、前記決定された最大マグニチュードに対応する前記1つの第3の1次元基底関数からさらに得られるものである、データ圧縮方法。
  20. 請求項18の方法において、前記最大マグニチュードを表す前記1つの第2の1次元基底関数は、前記場所含む前記領域の外における追加的な検索を行わずに決定されるものである、データ圧縮方法。
  21. 請求項18の方法において、前記最大マグニチュードを表す前記1つの第2の1次元基底関数は、前記場所を含む局所的なエリアの検索によって少なくとも部分的に決定されるものである、データ圧縮方法。
  22. データ圧縮方法であって、
    (a)1又は複数の符号器によって、多次元データに変換を適用し、変換された多次元データセットを生成する工程と、
    (b)1又は複数の符号器によって、前記変換された多次元データセットに対し複数の第1の1次元基底関数のそれぞれを用いて畳み込み演算を行い、対応する複数の畳み込みデータセットを生成する工程と、
    (c)1又は複数の符号器によって、畳み込みデータセットに基づいて、最大マグニチュードを表す1つの第1の1次元基底関数と、前記最大マグニチュードに対応する第1の方向における第1の場所とを決定し、前記変換された多次元データセットの前記第1の場所を含む領域に対応する部分データを、前記決定された最大マグニチュードに対応する前記1つの第1の1次元基底関数で表す工程と、
    (d)1又は複数の符号器によって、前記変換された多次元データセットから、前記1つの第1の1次元基底関数で表わされる前記部分データを減算して新しいデータセットを作成する工程と、
    (e)1又は複数の符号器によって、前記新しいデータセットに対し複数の第2の1次元基底関数のそれぞれを用いて畳み込む演算を行う工程と、
    (f)1又は複数の符号器によって、畳み込みデータセットに基づいて、最大マグニチュードを表す1つの第2の1次元基底関数と、前記最大マグニチュードに対応する第2の方向における第2の場所とを決定する工程、および前記新しいデータセットの第2の場所を含む領域に対応する部分データを、前記決定された最大マグニチュードに対応する前記第2の1次元基底関数で表す工程と、
    (g)1又は複数の符号器によって、前記新しいデータセットから、前記第2の1次元基底関数で表わされる前記部分データを減算し、さらに新しいデータセットを作成する工程と、
    (h)1又は複数の符号器によって、前記さらに新しいデータセットを用いて工程(b)を繰り返す工程、およびその後に工程(c)〜(f)を再度適用する工程と、
    (i)1又は複数の符号器によって、前記決定された最大マグニチュードそれぞれに対応する前記1つの第1の1次元基底関数および前記第2の1次元基底関数に関する原子を量子化変換データの符号化バージョンとして出力する工程と
    を有し、
    前記最大マグニチュードを表す前記第2の1次元基底関数は、前記第1の場所を含む前記領域の外における追加的な検索を行わずに決定される、データ圧縮方法。
  23. 請求項22のデータ圧縮方法において、前記第1の場所と前記第2の場所は一致するものである。
  24. データ圧縮のための符号器であって、
    (a)変換された多次元データセットを生成するために多次元データに変換を適用する手段と、
    (b)対応する複数の畳み込みデータセットを生成するために前記変換された多次元データセットに対し複数の第1の1次元基底関数のそれぞれを用いて畳み込み演算を行う手段と、
    (c)畳み込みデータセットに基づいて、最大マグニチュードを表す1つの第1の1次元基底関数と、前記最大マグニチュードに対応する第1の方向における場所とを決定する手段と、
    (d)前記変換された多次元データセットの前記場所を含む領域に対応する部分データを、前記決定された最大マグニチュードに対応する前記1つの第1の1次元基底関数で表す手段と、
    (e)前記変換された多次元データセットから、前記1つの第1の1次元基底関数で表わされる前記部分データを減算して新しいデータセットを作成する手段と、
    (f)前記変換された多次元データセットにおいて前記減算により変更された部分全てを前記複数の第1の1次元基底関数のそれぞれを用いて畳み込み演算を行うことによって、前記畳み込みデータセットを繰り返し更新する手段と、
    (g)前記決定された最大マグニチュードに対応する前記1つの第1の1次元基底関数に関する原子を前記変換された多次元データセットの符号化バージョンとして出力する手段と、
    (h)プロセッサと
    を有し、
    圧縮されるデータはビデオ画像データを表わすものであり、
    前記変換された多次元データセットの少なくとも一部は、ある1方向で、当該1方向に垂直な方向よりも優れた非相関があり、手段(c)、(d)、(e)及び(f)によって実行されるアルゴリズムの最初の適用は、最大相関の方向の1次元スキャンによって行われるものである、データ圧縮のための符号器。
  25. 請求項24のデータ圧縮のための符号器であって、
    (c1)前記変換された多次元データセットに対し複数の第2の1次元基底関数のそれぞれを用いて畳み込み演算を行う手段と、
    (c2)最大マグニチュードを表す1つの第2の1次元基底関数を決定する手段と
    を含み、
    前記変換された多次元データセットの部分を表すための手段は、前記1つの第2の1次元基底関数について更に機能するものである、データ圧縮のための符号器。
  26. データ圧縮のための符号器であって、
    (a)変換された多次元データセットを生成するために、多次元データに変換を適用する手段と、
    (b)対応する複数の畳み込みデータセットを生成するために、前記変換された多次元データセットに対し複数の第1の1次元基底関数のそれぞれを用いて畳み込み演算を行う手段と、
    (c)畳み込みデータセットに基づいて、最大マグニチュードを表す1つの第1の1次元基底関数と、前記最大マグニチュードに対応する第1の方向における第1の場所とを決定し、前記変換された多次元データセットの前記第1の場所を含む領域に対応する部分データを、前記決定された最大マグニチュードに対応する前記1つの第1の1次元基底関数で表す手段と、
    (d)前記変換された多次元データセットから、前記1つの第1の1次元基底関数で表わされる前記部分データを減算して新しいデータセットを作成する手段と、
    (e)前記新しいデータセットに対し複数の第2の1次元基底関数のそれぞれを用いて畳み込む演算を行う手段と、
    (f)畳み込みデータセットに基づいて、最大マグニチュードを表す1つの第2の1次元基底関数と、前記最大マグニチュードに対応する第2の方向における第2の場所とを決定し、前記新しいデータセットの第2の場所を含む領域に対応する部分データを、前記決定された最大マグニチュードに対応する前記第2の1次元基底関数で表す手段と、
    (g)さらに新しいデータセットを作成するため、前記新しいデータセットから、前記第2の1次元基底関数で表わされる前記部分データを減算する手段と、
    (h)前記さらに新しいデータセットを用いて手段(b)による処理を繰り返し、その後に手段(c)〜(f)による処理を再度適用する手段と、
    (i)前記決定された最大マグニチュードにそれぞれ対応する前記1つの第1の1次元基底関数および前記第2の1次元基底関数に関する原子を、変換された多次元データセットの符号化バージョンとして出力する手段と、
    (j)プロセッサと、
    を有し、
    前記最大マグニチュードを表す前記第2の1次元基底関数は、前記第1の場所を含む前記領域の外における追加的な検索を行わずに決定される、データ圧縮のための符号器。
  27. 請求項1記載の方法の各工程をコンピュータで実行させるためのコンピュータプログラム。
JP2006549457A 2004-01-08 2005-01-07 マッチング追跡を用いたデータ圧縮 Active JP4966669B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
GB0400334.9 2004-01-08
GB0400334A GB2409943A (en) 2004-01-08 2004-01-08 Data compression using matching pursuits algorithms
PCT/US2005/000612 WO2005067661A2 (en) 2004-01-08 2005-01-07 Data compression using matching pursuits

Publications (3)

Publication Number Publication Date
JP2007518367A JP2007518367A (ja) 2007-07-05
JP2007518367A5 JP2007518367A5 (ja) 2008-07-31
JP4966669B2 true JP4966669B2 (ja) 2012-07-04

Family

ID=31503580

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006549457A Active JP4966669B2 (ja) 2004-01-08 2005-01-07 マッチング追跡を用いたデータ圧縮

Country Status (7)

Country Link
US (1) US7889933B2 (ja)
EP (1) EP1702294B1 (ja)
JP (1) JP4966669B2 (ja)
KR (1) KR20070024470A (ja)
CN (1) CN1906624A (ja)
GB (1) GB2409943A (ja)
WO (1) WO2005067661A2 (ja)

Families Citing this family (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8121848B2 (en) 2005-09-08 2012-02-21 Pan Pacific Plasma Llc Bases dictionary for low complexity matching pursuits data coding and decoding
US7848584B2 (en) * 2005-09-08 2010-12-07 Monro Donald M Reduced dimension wavelet matching pursuits coding and decoding
US7813573B2 (en) * 2005-09-08 2010-10-12 Monro Donald M Data coding and decoding with replicated matching pursuits
US8674855B2 (en) 2006-01-13 2014-03-18 Essex Pa, L.L.C. Identification of text
US7783079B2 (en) 2006-04-07 2010-08-24 Monro Donald M Motion assisted data enhancement
US7586424B2 (en) 2006-06-05 2009-09-08 Donald Martin Monro Data coding using an exponent and a residual
US7845571B2 (en) 2006-06-19 2010-12-07 Monro Donald M Data compression
US7770091B2 (en) 2006-06-19 2010-08-03 Monro Donald M Data compression for use in communication systems
US7689049B2 (en) 2006-08-31 2010-03-30 Donald Martin Monro Matching pursuits coding of data
US7508325B2 (en) 2006-09-06 2009-03-24 Intellectual Ventures Holding 35 Llc Matching pursuits subband coding of data
US20080084924A1 (en) * 2006-10-05 2008-04-10 Donald Martin Monro Matching pursuits basis selection design
US7974488B2 (en) 2006-10-05 2011-07-05 Intellectual Ventures Holding 35 Llc Matching pursuits basis selection
US7707213B2 (en) 2007-02-21 2010-04-27 Donald Martin Monro Hierarchical update scheme for extremum location
US7707214B2 (en) 2007-02-21 2010-04-27 Donald Martin Monro Hierarchical update scheme for extremum location with indirect addressing
US10194175B2 (en) 2007-02-23 2019-01-29 Xylon Llc Video coding with embedded motion
US8693442B2 (en) 2008-09-22 2014-04-08 Blackberry Limited Multi-site MIMO cooperation in cellular network
US7791513B2 (en) 2008-10-06 2010-09-07 Donald Martin Monro Adaptive combinatorial coding/decoding with specified occurrences for electrical computers and digital data processing systems
US7786907B2 (en) 2008-10-06 2010-08-31 Donald Martin Monro Combinatorial coding/decoding with specified occurrences for electrical computers and digital data processing systems
US7786903B2 (en) 2008-10-06 2010-08-31 Donald Martin Monro Combinatorial coding/decoding with specified occurrences for electrical computers and digital data processing systems
US7864086B2 (en) 2008-10-06 2011-01-04 Donald Martin Monro Mode switched adaptive combinatorial coding/decoding for electrical computers and digital data processing systems
CN103675444B (zh) * 2012-08-30 2016-09-14 中国石油化工股份有限公司 一种高精度的时频分析方法
EP3414842A1 (en) * 2016-02-08 2018-12-19 Koninklijke Philips N.V. Device for and method of determining clusters

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5648987A (en) * 1994-03-24 1997-07-15 Samsung Electronics Co., Ltd. Rapid-update adaptive channel-equalization filtering for digital radio receivers, such as HDTV receivers
GB9508692D0 (en) 1995-04-28 1995-06-14 Zeneca Ltd Binder resin, process for its manufacture and composition containing it
US5699121A (en) * 1995-09-21 1997-12-16 Regents Of The University Of California Method and apparatus for compression of low bit rate video signals
GB9802235D0 (en) * 1998-02-03 1998-04-01 Nds Ltd Digital signal processing
GB9802233D0 (en) * 1998-02-03 1998-04-01 Nds Ltd Digital signal processing
DE69924922T2 (de) * 1998-06-15 2006-12-21 Matsushita Electric Industrial Co., Ltd., Kadoma Audiokodierungsmethode und Audiokodierungsvorrichtung
GB2348065A (en) * 1999-03-19 2000-09-20 Nds Ltd Signal compression
FR2792798B1 (fr) * 1999-04-26 2001-05-25 Thomson Multimedia Sa Procede et dispositif de quantification pour compression video
US6836569B2 (en) * 2001-04-13 2004-12-28 Erwan Le Pennec Method and apparatus for processing or compressing n-dimensional signals by foveal filtering along trajectories
US7006567B2 (en) * 2001-11-30 2006-02-28 International Business Machines Corporation System and method for encoding three-dimensional signals using a matching pursuit algorithm
US7515730B2 (en) * 2001-12-13 2009-04-07 Digimarc Corporation Progressive image quality control using watermarking
US20030228068A1 (en) * 2002-06-11 2003-12-11 General Electric Company Progressive transmission and reception of image data using modified hadamard transform
JP4213646B2 (ja) * 2003-12-26 2009-01-21 株式会社エヌ・ティ・ティ・ドコモ 画像符号化装置、画像符号化方法、画像符号化プログラム、画像復号装置、画像復号方法、及び画像復号プログラム。

Also Published As

Publication number Publication date
KR20070024470A (ko) 2007-03-02
US20090190842A1 (en) 2009-07-30
WO2005067661A3 (en) 2005-10-06
WO2005067661A2 (en) 2005-07-28
GB0400334D0 (en) 2004-02-11
JP2007518367A (ja) 2007-07-05
GB2409943A (en) 2005-07-13
US7889933B2 (en) 2011-02-15
EP1702294B1 (en) 2014-11-05
EP1702294A4 (en) 2010-11-17
CN1906624A (zh) 2007-01-31
EP1702294A2 (en) 2006-09-20

Similar Documents

Publication Publication Date Title
JP4966669B2 (ja) マッチング追跡を用いたデータ圧縮
JP5623565B2 (ja) バタフライプロセッサを使用して離散コサイン変換をエンコードしそして計算するための装置及び方法
JP5259396B2 (ja) ハイブリッド映像圧縮のための非線形予測フィルタ
JP2000508127A (ja) 動きに基づく分割及び合併を用いたビデオ・エンコーダ及びデコーダ
Chen et al. Compressive sensing multi-layer residual coefficients for image coding
JPH08256266A (ja) 画像符号化方式
JP2022541215A (ja) ウェーブレット変換に基づく画像符号化/復号方法および装置
KR20120098499A (ko) 영상의 변환 방법 및 장치, 및 영상의 역변환 방법 및 장치
Dardouri et al. Dynamic neural network for lossy-to-lossless image coding
CN117980914A (zh) 用于以有损方式对图像或视频进行编码、传输和解码的方法及数据处理***
Kountchev et al. Inverse pyramidal decomposition with multiple DCT
Siddeq et al. A novel 2D image compression algorithm based on two levels DWT and DCT transforms with enhanced minimize-matrix-size algorithm for high resolution structured light 3D surface reconstruction
Ukrit et al. Effective lossless compression for medical image sequences using composite algorithm
JP3932244B2 (ja) 画像符号/復号方法及びその装置並びにそのプログラムを記録した記録媒体
JPH08116542A (ja) 画像符号化装置、画像復号化装置および動きベクトル検出装置
JP2016536859A (ja) メディア信号のエンコード及びデコード方法並びにそれを用いる装置
Siddeq et al. DCT and DST based Image Compression for 3D Reconstruction
JP5931747B2 (ja) 画像シーケンスのブロックの符号化および復元の方法
JP4344184B2 (ja) 動画像符号化装置、動画像符号化方法、動画像符号化プログラム、動画像復号装置、動画像復号方法、及び動画像復号プログラム
JP2022171424A (ja) 符号化装置、プログラム、及びモデル生成方法
Kalker et al. Projection methods in motion estimation and compensation
KR20240025629A (ko) 광학 흐름를 이용한 비디오 압축
KR100946925B1 (ko) 다수의 기본 블록들을 이용한 다차원 변환 및 양자화 방법,그리고 그 장치
Deng An interpolative subband coding algorithm for lossless image compression
KR20220160109A (ko) 적응적 반복 인트라 예측을 이용한 비디오 압축

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070901

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080613

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20100507

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20101111

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110210

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110620

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110915

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20111018

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120206

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20120217

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120306

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120402

R150 Certificate of patent or registration of utility model

Ref document number: 4966669

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150406

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250