JP2005515731A - ウェーブレット定義域ハーフピクセル動き補償 - Google Patents

ウェーブレット定義域ハーフピクセル動き補償 Download PDF

Info

Publication number
JP2005515731A
JP2005515731A JP2003561253A JP2003561253A JP2005515731A JP 2005515731 A JP2005515731 A JP 2005515731A JP 2003561253 A JP2003561253 A JP 2003561253A JP 2003561253 A JP2003561253 A JP 2003561253A JP 2005515731 A JP2005515731 A JP 2005515731A
Authority
JP
Japan
Prior art keywords
data
wavelet domain
wavelet
frame
block
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Ceased
Application number
JP2003561253A
Other languages
English (en)
Inventor
リー、フレデリック
チャング、ジョナサン
Original Assignee
オクタ・テクノロジー・インコーポレイテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by オクタ・テクノロジー・インコーポレイテッド filed Critical オクタ・テクノロジー・インコーポレイテッド
Publication of JP2005515731A publication Critical patent/JP2005515731A/ja
Ceased legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/547Motion estimation performed in a transform domain
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/523Motion estimation or motion compensation with sub-pixel accuracy
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • H04N19/619Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding the transform being operated outside the prediction loop
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/63Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/63Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets
    • H04N19/64Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets characterised by ordering of coefficients or of bits for transmission
    • H04N19/645Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets characterised by ordering of coefficients or of bits for transmission by grouping of coefficients into blocks after the transform

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression Of Band Width Or Redundancy In Fax (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

本発明は、エイリアシング効果を減少させ、逆ウェーブレット変換を必要としないでウェーブレット定義域における動き予測及び補償(490)を提供するウェーブレット定義域ハーフピクセル動き補償プロセス(図4)に関する。エンコーディングには、従来の方式で、q−次元H変換(490)が第1フレームに於ける非オーバーラッピングq×qマトリクスに対して提供される。第2フレームのための動きベクトルが決定されるとき、第1フレームのウェーブレットデータのハーフピクセル補間(480)が、変換されたq×qマトリクスより水平及び/又は垂直にずれたq×q空間定義域マトリクスに対応するハーフピクセルデータ(480)を生成する。動き予測技術(490)は、次に、1フレームのウェーブレット定義域オブジェクトデータと、別フレームの為の実際及び補間されたウェーブレット定義域データとを比較することによってオブジェクトの動きを識別しうる。ハーフピクセル補間若しくはデータの生成(480)が、高性能なウェーブレットビデオエンコーダにおいてマルチ解像度の動き予測と共に併用されて良い。

Description

ウェーブレット変換は、イメージ内の変化を近似して、イメージを捕捉する人間の視覚系に巧みに適応させる空間周波数定義域構造として静止画を分解する。結果として、ウェーブレット圧縮技術は、静止画圧縮の定義域において多大な成功を収めてきた。例えば、米国のFBIの指紋圧縮標準JPEG2000、及びISO静止画圧縮標準JPEG2000では、ウェーブレット圧縮技術が用いられている。
ウェーブレット変換の一つの型として、H変換すなわちHaar変換の拡張がある。数式1は、二次元のH変換マトリクスHを示すものである。ここで数式2では、係数a00、a01、a10、及びa11を有する2×2マトリクスAである空間定義域を、係数h0、hx、hy、及びhdを有するウェーブレット定義域マトリクスへと変換する。イメージエンコーディングのためには、係数a00、a01、a10、及びa11はピクセル値(例えばカラー値、グレイスケール値、若しくはRGB又はYUVのカラーコンポーネント値)であり、イメージ内の対応ピクセル位置に従ったマトリクスA内の位置を有する。変換後のマトリクスでは、ウェーブレット定義域値h0がマトリクスAの(低周波数の)平均空間エネルギーを示しており、ウェーブレット定義域値hx、hy、hdは、各々、マトリクスA内の(高周波数)垂直、水平、及び対角方向の変化を示す。
ここで、
Figure 2005515731
Figure 2005515731
となる。
しかしながら、H変換は基本的に二次元のマトリクス変換であり、ピクセル値a00、a01、a10、及びa11、及び、ウェーブレット定義域値h0、hx、hy、及びhdを、4つのコンポーネントベクトルへと再整列させることによって、数式3が、シングルマトリクス乗法を用いたウェーブレット定義域に対するピクセル値のH変換を示し、ここでは、
Figure 2005515731
となる。
H変換を用いる一つの静止画エンコーディング方法は、イメージを示すピクセル値のN×Nマトリクスを分解し、N/2×N/2非オーバーラップ2×2マトリクスとし、ピクセル値の各々の2×2マトリクスに対して二次元H変換を適用するものである。完全なN×Nマトリクスのためのウェーブレット変換コンポーネントは、次に再整列され、図1に示されているようなアレイ100を構成する。示されているとおり、アレイ100は、オリジナルのN×Nアレイ内の2×2空間定義域マトリクスに対応する空間位置に応じたN/2×N/2サブアレイH0内に配置された低周波数コンポーネントh0を有する。N/2×N/2サブアレイであるHx、Hy、及びHdは、オリジナルのN×Nアレイ内の対応する2×2マトリクスの空間位置によって、N/2×N/2サブアレイであるHx、Hy、及びHd内部に各々配置された高周波数コンポーネントhx、hy、及びhdを有する。
オリジナルイメージのH変換と同様の規則で、H変換が低周波数サブアレイH0に適用されても良く、結果として獲得されたレベル2の変換構成要素h0’、hx’、hy’、及びhd’が、N/4×N/4サブアレイであるH0’、Hx’、Hy’、及びHd’内に配置されても良い。プロセスが複数回繰り返され、図2で示されているようなマルチ解像度ピラミッドデータ構造を構築する。静止画をエンコードし、変換し、ストアするとき、不可逆圧縮が、ピラミッド構造の一つ若しくは複数のより低いレベルに落ちて(drop)も良く、データ/圧縮の量が、イメージの利用可能帯域幅、すなわち所望とする解像度に適応して容易に変化若しくは適合してよい。
ビデオ(動画)のエンコーディングは、一般的には、異なった時間インデックスを有するフレーム内の冗長な情報を除去する、動き予測/補償手順を用いるものである。ビデオイメージのフレームのウェーブレット変換を用いるようなシステムでは、ウェーブレット定義域におけるイメージデータ上で直接的に動き予測を実行することが望ましい。しかしながら、ビデオに於けるオブジェクトの比較的小さな動きが、ウェーブレット定義域データ、とりわけ高周波数コンポーネントにおいて著しい変化を引き起こし得る。
図3は、背景色“e”上に色“d”を有するオブジェクトを含むイメージの実施例である。オブジェクトの一部に対応する2×2マトリクス310のH変換が、値2dを有する低周波数コンポーネントh0を提供し、0である高周波数コンポーネントhxを提供する。次のフレームで、オブジェクトが左に1ピクセル移動するとすると、オブジェクトのエッジが2×2マトリクス320内となり、マトリクス320はマトリクス310が第1フレーム内で有していたの同様に、第2のフレーム内で同一の相対位置を有する。マトリクス320のH変換によって、値d+eを有する低周波数コンポーネントh0が提供され、e−dである高周波数コンポーネントhxが提供される。従って、色eが色dと著しく異なるとき、オブジェクトの小さな動きがウェーブレット定義域データに於ける大きな変化を招く。
ウェーブレット定義域における迅速な変化によって、ウェーブレット定義域における動き予測技術が複雑になってしまう。動き予測は空間定義域で実行されうるが、圧縮のための空間定義域からウェーブレット定義域への変換、及び動き予測のための空間定義域への戻り(back)は、ウェーブレット定義域ピラミッド構造のレベルに対応した一連の逆ウェーブレット変換を要求する。逆ウェーブレット変換は、エンコーディングを複雑にしてしまい、処理能力の低いシステムにとってはリアルタイムエンコーディングが困難となる。そのようなわけで、ビデオエンコーディングシステムは、低処理能力でよく、充分なウェーブレット定義域圧縮を用いることが要求される。
(発明の効果)
本発明の一側面に依れば、H変換を用いた複雑性の低いハーフピクセル補間プロセスが、動き予測、及び逆ウェーブレット変換を要しないウェーブレット定義域内補償を提供する。エンコーディングのためには、q次元(例えばq=2)H変換が、第1フレームアレイに於けるオーバーラップしないq×qマトリクスに対し従来方式で適用され、第1フレームを示すウェーブレット定義域データ構造を構築する。第2フレームのための動きベクトルを決定するとき、第1フレームのウェーブレットデータの“ハーフピクセル補間”が、q×qマトリクスの標準セットより水平及び/又は垂直に(例えば1ピクセル分)ずれた、q×qマトリクスのウェーブレット変換に対応するハーフピクセルデータを生成する。動き予測技術は、次に、第2フレームアレイのためのウェーブレット定義域データと、第1フレームのための現実のウェーブレット定義域データ及び補間“ハーフピクセル”のウェーブレット定義域データとを比較することで、第2フレームのオブジェクトを識別しうる。
本発明の一実施例は、ウェーブレット変換ユニット、ハーフピクセルデータジェネレータ、及び動き予測ユニットを有するエンコーダである。ウェーブレット変換ユニットは、空間定義域よりウェーブレット定義域へと従来の方式を用いてビデオデータ変換を行い、ビデオフレームを表現するものである。ハーフピクセルデータジェネレータは、ウェーブレット変換ユニットよりウェーブレット定義域データを受信し、ハーフピクセルデータを生成する。ハーフピクセルデータは、ウェーブレット変換ユニットが変換するマトリクスに対しずれているマトリクスのウェーブレット変換の結果得られるウェーブレット定義域データを近似する。ハーフピクセルデータジェネレータは、以下に述べるような公式及び方法を用いて良く、逆ウェーブレット変換を採用することなく、ウェーブレット定義域データよりハーフピクセルデータを生成する。
動き予測ユニットは、コードされたフレームに於けるオブジェクトブロックにベストマッチングするブロックのため、ウェーブレット定義域データ及びハーフピクセルデータの双方をサーチする。従って、インターコードされたフレーム内のオブジェクトブロックのための動き予測は、ウェーブレット定義域データのブロック若しくはハーフピクセルデータのブロックであるベストマッチを識別しうる。
一般的に、エンコーダはさらに量子化ユニット及び逆量子化ユニットを含む。量子化ユニットは、デコーダに送信するためのフレームエンコーディングを行うべくデータを量子化する。逆量子化ユニットは、量子化ユニットよりのアウトプットデータを逆量子化し、次のフレームの動き予測で用いられるためのメモリ、すなわちバッファ内に結果をストアする。とりわけ、ハーフピクセルジェネレータは、典型的にはウェーブレット定義域データを量子化及び逆量子化した後に用いるので、生成されたハーフピクセルデータが、デコーダが生成しうるハーフピクセルデータと同一であって良い。
本発明の別の実施例は、ビデオエンコーディングのプロセスである。エンコーディングプロセスには、ビデオデータの第1フレーム上でウェーブレット変換を実行し第1ウェーブレット定義域データを生成する過程、及び第1ウェーブレット定義域データよりハーフピクセルデータを生成する過程が含まれる。ハーフピクセルデータは、ウェーブレット変換の間に用いられるマトリクスと比較してずれたマトリクスのウェーブレット変換の結果として生じうるウェーブレット定義域データを近似する。エンコーディングプロセスは、次に、第2フレームのウェーブレット定義域データよりのオブジェクトブロックにベストマッチングするブロックのために、ウェーブレット定義域データ及びハーフピクセルデータをサーチして良い。従って、第2フレームを表すデータ構造すなわちストリームが、オブジェクトブロックにベストマッチするウェーブレット定義域データ若しくはハーフピクセルデータのブロックを識別する動きベクトルを含んでいても良い。
本発明の更に別の実施例は、ビデオデコードプロセスを含む。デコーディングプロセスは、データ構造すなわちデータストリームをデコードし、ビデオの第1フレームに関連するウェーブレット定義域差分アレイ及び動きベクトルを復元する。各々の動きベクトルのため、デコーディングプロセスが、動きベクトルが第1タイプであるか第2タイプであるかを決定する。第1タイプの動きベクトルは、第2フレームを示すウェーブレット定義域データ各ブロックを識別する。第2タイプの動きベクトルは、第2フレームの一部分を示す、ずれたマトリクスのウェーブレット変換近似に対応するハーフピクセルデータの各ブロックを識別し、ここで、ずれたマトリクスは、第2フレームを示すウェーブレット定義域データを生成する際に用いられるマトリクスに対しずれている。
第1フレームのためにウェーブレット定義域データを生成すべく、デコーディングプロセスが第1タイプの動きベクトルによって識別されたウェーブレット定義域データの各ブロックを、差分アレイの各部分に加算する。加えて、第2タイプの各動きベクトルのために、デコーディングプロセスが、第2タイプの動きベクトルによって識別されたハーフピクセルウェーブレット定義域データのブロックを生成する際に第2フレームを示すウェーブレット定義域データを使用し、また生成されたブロックを動きベクトルに対応する差分アレイの一部に加算する。第1フレームのための構成されたウェーブレット定義域データの逆ウェーブレット変換によって、第1フレームの表示が可能となる。
本発明の更に別の実施例には、ビデオを示すデータ構造が含まれる。ある実施例では、データ構造が、ビデオの第1フレームの為のウェーブレット定義域データを有する第1のデータ、ビデオの第2フレームの為のウェーブレット定義域差分アレイを有する第2のデータ、及び第1及び第2タイプの動きベクトルを含む。第1タイプの動きベクトルは、差分アレイに於ける各ブロックに対応し、差分アレイ中の各ブロックに対する加算の為の第1フレームのウェーブレット定義域データブロックを識別する。第2タイプの動きベクトルは、差分アレイ中の各ブロックに対応し、差分アレイ中の各ブロックに加算するためのハーフピクセルデータブロックを識別する。ここで、ハーフピクセルデータは、第1のフレームの為のウェーブレット定義域データ生成するのに用いたれた第1フレームよりのアレイに対してずれている第1フレーム中のアレイのウェーブレット変換を近似する。
本発明の一側面によれば、ビデオエンコードための動き予測プロセスは、ウェーブレット変換が決定したウェーブレット定義域イメージデータより“ハーフピクセル”のウェーブレット定義域データを生成する。ハーフピクセルデータは、ウェーブレット変換で用いられるマトリクスより、水平、垂直、若しくは対角線上にずれた、空間定義域若しくは低周波数マトリクスのウェーブレット変換結果を近似する。近似されたハーフピクセルデータは、動き予測の間に逆ウェーブレット変換及びウェーブレットデータ再変換を必要とすることなく決定され、低い有効処理能力の装置及びアプリケーションに適している。ビデオに於けるオブジェクトの動きを示す動きベクトル決定の動き予測手順は、あるフレームからのウェーブレット定義域データへのウェーブレット定義域オブジェクトブロックと、別フレームのハーフピクセルデータとを比較しうる。
図4は、本発明の実施例によるビデオエンコーダ400のブロック図である。ビデオエンコーダ400は、ウェーブレット変換ユニット410、量子化ユニット430、エントロピーエンコードユニット440、逆量子化ユニット450、ハーフピクセルデータジェネレータ480、及び動き予測ユニット490を有する。ビデオエンコーダ400の機能ブロックは、専用のハードウェア、ソフトウェア、若しくはそれらの組み合わせを実行することで実現されてよく、ここに記載されているエンコード機能を実行する。
動作中、ウェーブレット変換ユニット410は、ビデオイメージよりの一連のフレームを示す一連の空間定義域アレイとして、ビデオイメージデータをレシーブする。ウェーブレット変換ユニット410は、各々の空間定義域アレイをウェーブレット定義域データ構造へと変換させる。特に、ウェーブレット変換ユニット410は、各々の空間定義域アレイを非オーバーラッピングq×qマトリクスのセットへと分離させ、各々q×qのウェーブレット定義域変換を実行する。本発明の実施例では、qは2であり、空間定義域、若しくは低周波数アレイのウェーブレット変換は、式1、2、及び3の二次元H変換である。低周波数ウェーブレット定義域データは、次に、空間定義域アレイと同一の規則で変換された低周波数コンポーネントアレイへと集約(collect)されて良い。低周波数アレイを繰り返し構築し、構築されたアレイへとウェーブレット変換を適用することで、ウェーブレット変換ユニット410は、図2で示されているようなピラミッドデータ構造を構築する。一般的には、ピラミッドデータ構造におけるレベルの数は、単一レベルにのみ限定されることを含め所望に限定される。
上述したような2次元H変換は、高速での低複雑性エンコーダの使用で複数のメリットを有している。とりわけ、オーバーラップしないq×qピクセルブロック変換は、エンコーダ400内でのパラレル処理アーキテクチャのインプリメンテーションを単純化する。また、H変換は小カーネルを含んでおり、8回の整数の加法/減法によって、空間的若しくは低周波数コンポーネントであるa00、a01、a10、及びa11の、ウェーブレット定義域値h0、hx、hy、及びhdへの変換を完了させることが可能となる。加えて、第1にロウを変換し、次にカラムを変換することによる、二次元拡張された一次元変換とは異なった二次元ウェーブレット変換が、水平方向のより高周波数の貢献(contribution)、及び垂直方向の低周波数のコンポーネントに隠れた問題を回避する。
エンコードされたフレームがウェーブレット変換ユニット410を通過した後、エンコーダ400内のすべてのエンコードプロセスがウェーブレット定義域内で実行される。動き予測を用いずにコードされた、intraフレームのためには、量子化ユニット430が、ウェーブレット変換ユニット420よりのウェーブレット定義域データを量子化し、エントロピーコーディングユニット440がintraフレームを示す量子化されたウェーブレットデータに対してハフマンエンコーディングのようなエンコーディング法を適用する。ビデオエンコーダ400のアプリケーションに依って、エンコードされたイメージデータが転送されても良く、またストアされても良い。
逆量子化ユニット450は、エンコーダ400よりのデコーダレシーブデータとして、量子化ユニット430よりのデータの量子化を取り消す。interフレームを連続してエンコーディングするために、逆量子化ユニット450は、最終的なウェーブレット定義域データをフレームメモリ470内にストアする。
interフレームは、ウェーブレット変換410よりのウェーブレット定義域データ及び動きベクトルを用いて構成された類似するウェーブレット定義域データと、ストアされたウェーブレット定義域データ及び別フレームのためのハーフピクセルデータとの間の差分としてエンコードされる。特に、加算器420は、ウェーブレット変換ユニット410が量子化ユニット430へとアウトプットするウェーブレット定義域データより構成フレームデータを減じる。一般的には、差分データは、図2に示されているピラミッド構造に於けるウェーブレット定義域データの各々のアレイ若しくはサブアレイのための差分アレイを含んでいて良い。
interフレームのためには、逆量子化ユニット450が差分データを逆量子化し、加算器460が、動きベクトルより構成された同一のフレームデータ及びウェーブレット定義域データ若しくはフレームメモリ470内に先にストアされているハーフピクセルデータを加算しなおす。結果として得られるウェーブレット定義域フレームデータが、別のinterフレームに要求されてよい動き予測プロセスのため、フレームメモリ470内にストアされる。
結果として得られた差分フレームデータは、量子化ユニット430によって量子化され、またエントロピーコーディングユニット440によってエンコードされる。エントロピーコーディングユニット440はまた、アウトプットデータCODEの一部としてinterフレームのために動きベクトルをエンコードする。
図5はアウトプットデータCODEをデコーディングすることが可能なデコーダ500のブロック図である。デコーダ500は、エントロピーデコーディングユニット510及び逆量子化ユニット520を有しており、逆量子化ユニットが量子化及びエントロピーコーディングを取り消し、intraフレームのためのウェーブレット定義域データ、若しくは差分データ及びinterフレームのための動きベクトルを生成する。intraフレームのためのウェーブレット的定義域データが、フレームメモリ540内部に直接的にストアされてもよい。逆ウェーブレット変換ユニット550は、ディスプレー又はその他使用のためにビデオフレームを示す空間定義域データVIDEOへと、ウェーブレット定義域データを変換する。
interフレームのために、加算機530が、現在フレームのために動きベクトルが識別するフレームメモリ540よりのウェーブレット的定義域データ若しくはハーフピクセルデータの差分アレイブロックへと加算する。従って、動きベクトルがハーフピクセルデータのブロックを識別する時、ハーフピクセルデータジェネレータ550は、エンコーダ400においてハーフピクセルデータジェネレータ480と同一技術を用いることで、フレームメモリ540内部のウェーブレット定義域データより所望とされるハーフピクセルデータブロックを生成する。
本発明の一側面によれば、ウェーブレット定義域ハーフピクセルデータジェネレータ480及び550が、ウェーブレット変換ユニット410が使用しない空間定義域ピクセル値のq×qマトリクス若しくは低周波数ウェーブレット定義域係数のウェーブレット変換に対応し、また近似するハーフピクセルデータを生成する。とりわけ、図6A、6B、および6Cは、16個のピクセル値のアレイ、若しくは周波数コンポーネントa乃至pを示しており、それらは4つの2×2アレイ610、620、630、及び640へと区分けされている。実施例では、ウェーブレット変換ユニット410が、アレイ610、620、630、及び640の二次元H変換を実行し、4セットのウェーブレット定義域係数、{h01,hx1,hy1,hd1}、{h02,hx2,hy2,hd2}、{h03,hx3,hy3,hd3}、{h04,hx4,hy4,hd4}を生成する。
図6A、6B、および6Cはまた、ウェーブレット変換ユニット410が変換したアレイ610、620、630、及び640に対してずれているアレイ612、634、613、624、及び614も示している。とりわけ、アレイ612(若しくは634)はアレイ610及び620(または630及び640)より1ピクセル水平方向にずれている。アレイ613(若しくは624)は、アレイ610及び630(または620及び640)より1ピクセル垂直方向にずれており、アレイ614は、アレイ610、620、630、及び640の各々より対角方向に1ピクセルずれている。
ウェーブレット変換ユニット410は、それら変換がフレームの表示のために要求されていない、すなわちダウンサンプリングのために変換がスキップされているので、オフセットアレイ612、634、613、624、及び614のウェーブレット変換を決定しない。アレイ612、634、613、624、及び614のウェーブレット定義域変換は、ピクセル値a乃至p若しくはウェーブレット定義域係数{h01,hx1,hy1,hd1}、{h02,hx2,hy2,hd2}、{h03,hx3,hy3,hd3}、{h04,hx4,hy4,hd4}より厳密に決定され得るが、ピクセル値a乃至p、又はウェーブレット定義域ピラミッド構造よりの低周波数ウェーブレット定義域コンポーネントh01、h02、h03、及びh04の決定は、一般的に一連のウェーブレット変換を要する。各レベルのマルチ分解構造において、高周波数コンポーネントは利用可能であるが、低周波数コンポーネントはマルチ分解構造のトップレベルのためだけに利用可能である。
上述したように、低処理能力のエンコーディングまたはデコーディングプロセスが、オフセットアレイ612、634、616、624、若しくは614のためのウェーブレット定義域係数が、アレイ610、620、630、及び640のウェーブレット定義域係数と大きく異なり得るにも関わらず、逆ウェーブレット変換を回避することを求める(seek)。逆ウェーブレット変換を回避するためには、ハーフピクセルデータジェネレータ480が、アレイ612、634、613、624、及び614と、サブバンド内のその他のオフセットアレイのウェーブレット変換を近似するハーフピクセルデータを生成する時に、利用不可能な低周波数コンポーネントh01、h02、h03、及びh04の近似を用いる。従って、ウェーブレット定義域ハーフピクセルデータジェネレータ480が、ピラミッドウェーブレット定義域データ構造のその他レベル内の類似するオフセットアレイのウェーブレット変換近似を構築し、ピラミッド構造の全てのレベルにおける全てのサブバンドのハーフピクセル動き予測を可能とする。
数式4は、オフセットアレイに関連するハーフピクセルデータ獲得のための式を得るための技術に関する概要(アウトライン)であり、
Figure 2005515731
である。
式4では、hx、hy、hdは、実際の高周波数のウェーブレット定義域コンポーネントであり、h0’は、2×2アレイのための実際の低周波数のコンポーネントh0の近似である。ピラミッドデータ構造の上部レベルの対応する低周波数コンポーネントによって提供されているように、ローカルの低周波数ウェーブレット係数の平均値は、典型的には実際の低周波数係数h0の適切な近似を示すが、h0の別の近似が用いられてもよい。アレイh’は、低周波数コンポーネントの上述した近似を有するウェーブレット定義域係数を示しており、h’に対し逆H変換を適用すると、空間定義域ピクセル値または低周波数係数の近似マトリクスA’が得られる。シフトされた、即ちオフセットアレイA’を置換し、またシフトされたアレイA’へとH変換を適用することで、実際のウェーブレット定義域係数h0、hx、hy、hdを近似するウェーブレット定義域アレイh’を提供する。式4において示されているような数学的な操作を実行することによって、オーバーラップしたアレイ(例えばアレイ610、620,630、及び640)のウェーブレット定義域係数、及びウェーブレット定義域ピラミッドデータ構造のトップレベルの低周波数コンポーネントに関するハーフピクセルウェーブレット定義域データ(例えばアレイ612、634、613、624、及び614)のための公式が提供される。
図6Aにおいて示されている、例えばアレイ612及び634のような水平方向にずれているアレイのためにはハーフピクセルデータジェネレータ480が数式5を用いてハーフピクセル係数h0’(r,s)、hxx(r,s)、hyx(r,s)、hdx(r,s)を生成し、ここで、
Figure 2005515731
である。
数式5では、iは、対象となる水平方向にずれたアレイを含むマルチ解像度のウェーブレット定義域データ構造レベルを示しており、r及びsは所望のオフセットアレイより1ピクセル分水平方向にずれているアレイを識別するインデックスであり、hxr、hyr、hdrはウェーブレット定義域係数である。また、h0’rは左のアレイrに対応する近似低周波数ウェーブレット定義域係数であり、hxs、hys、hdsはウェーブレット定義域係数であり、h0sは右のアレイsに対応する近似低周波数ウェーブレット定義域係数であり、またh0(r,s)TOPは、マルチ解像度構造のトップレベル(MAXLEVEL)での、低周波数ウェーブレット定義域係数であり、または低周波数ウェーブレット定義域係数の平均であり、アレイr及びsを含むアレイに対応している。hyx(r,s)及びhdx(r,s)に関して、式5では、近似h0’s若しくはh0’rが用いられることはなく、また正確である。
図6Bにおいて示されている、例えばアレイ613及び624のような垂直方向にずれているアレイのためには、ハーフピクセルデータジェネレータ480が数式6を用いてハーフピクセル係数h0’(r,s)、hxy(r,s)、hyy(r,s)、hdy(r,s)を生成し、ここで、
Figure 2005515731
である。
数式6では、iは、対象となる垂直方向にずれたアレイを含むマルチ解像度のウェーブレット定義域データ構造レベルを示しており、r及びsは所望のオフセットアレイより1ピクセル分垂直方向にずれているアレイを識別するインデックスであり、hxr、hyr、hdrはウェーブレット定義域係数である。また、h0’rは上のアレイrに対応する近似低周波数ウェーブレット定義域係数であり、hxs、hys、hdsはウェーブレット定義域係数であり、h0sは下のアレイsに対応する近似低周波数ウェーブレット定義域係数であり、またh0(r,s)TOPは、マルチ解像度構造のトップレベル(MAXLEVEL)での、低周波数ウェーブレット定義域係数であり、または低周波数ウェーブレット定義域係数の平均であり、アレイr及びsを含むアレイに対応している。hxy(r,s)及びhdy(r,s)に関して、式6では、近似h0’s若しくはh0’rが用いられることはなく、また正確である。
図6Cにおいて示されている、例えばアレイ614のような対角線方向にずれているアレイのためには、ハーフピクセルデータジェネレータ480が数式7を用いてハーフピクセル係数h0’(r,s)、hxd(r,s)、hyd(r,s)、hdd(r,s)を生成し、ここで、
Figure 2005515731
となる。
式7では、iは、対象となる対角線方向にずれたアレイを含むマルチ解像度のウェーブレット定義域データ構造レベルを示しており、r、s、t、及びuは所望のオフセットアレイより1ピクセル分対角線方向にずれているアレイを識別するインデックスであり、hxr、hyr、hdrはウェーブレット定義域係数である。また、h0’rは左上のアレイrに対応する近似低周波数ウェーブレット定義域係数であり、hxs、hys、hdsはウェーブレット定義域係数であり、h0’sは右上のアレイsに対応する近似低周波数ウェーブレット定義域係数であり、hxt、hyt、hdtはウェーブレット定義域係数であり、h0’tは左下のアレイtに対応する近似低周波数ウェーブレット定義域係数であり、hxu、hyu、hduはウェーブレット定義域係数であり、h0’uは右下のアレイuに対応する近似低周波数ウェーブレット定義域係数であり、またh0(r,u)TOPは、マルチ解像度構造のトップレベル(MAXLEVEL)での、低周波数ウェーブレット定義域係数であり、または低周波数ウェーブレット定義域係数の平均であり、アレイr乃至uを含むアレイに対応している。
図4のエンコーダ400では、フレームメモリ470が、エンコードされ、量子化され、逆量子化され、またデコードされた、前フレームのウェーブレット定義域データ(例えばピラミッド構造)を有する。次フレームのinterコーディングのためには、ハーフピクセルデータジェネレータ480が、メモリ470内の前フレームのウェーブレット定義域データを使用して、ハーフピクセルデータを生成する。とりわけ、ハーフピクセルデータジェネレータ480は、数式5、6、及び7を用いて、ピラミッドデータ構造の各々のレベルiのためのハーフピクセルウェーブレット定義域データを生成しうる。
ジェネレータ480より結果として得られるウェーブレット定義域データ及びハーフピクセルウェーブレット定義域データは、図7Aにおいて示されているマルチタイプの解像度データ構造700へと混合されてよい。マルチ解像度データ構造700の各々のレベルである、サブバンドアレイHx、Hy、及びHdが、各々ウェーブレット定義域係数hx、hy、及びhdのコレクション(collection)だけでなく、それらに適応する近似されたハーフピクセルウェーブレット定義域係数(hxx、hxy、hxd)、(hyx、hyy、hyd)、及び(hdx、hdy、hdd)を包含するべく増加される。ピラミッド構造のトップレベルは、低周波数係数h0TOP及びハーフピクセルの低周波数係数hxTOP、hyTOP、及びhdTOPを含んでおり、それらはトップレベルのために厳密に計算され得る。
図7Bは、マルチ解像度データ構造750におけるウェーブレット定義域データ及びハーフピクセルウェーブレット定義域データの代替構成を示している。データ構造750は、トップレベルの下のレベル毎に、12のサブアレイであるHx、Hy、Hd、Hxx、Hyx、Hdx、Hxy、Hyy、Hdy、Hxd、Hyd、及びHddを有する。サブアレイHx、Hy、及びHdは、内在するピクセル値の対応位置に従って整列されているウェーブレット定義域係数(hx、hy、及びhd)を含む。サブアレイHxx、Hyx、Hdx、Hxy、Hyy、Hdy、Hxd、Hyd、及びHddの各々が、内在するピクセル値の位置に適合するハーフピクセルのウェーブレット定義域係数hxx、hyx、hdx、hxy、hyy、hdy、hxd、hyd、及びhddを含む。オブジェクトブロックは、サブアレイHx、Hy、Hd、Hxx、Hyx、Hdx、Hxy、Hyy、Hdy、Hxd、Hyd、及びHddにおけるブロックと直接的に比較されてもよいので、マルチ解像度のデータ構造750は、ウェーブレット定義域データのブロックと別フレームの同一レベル内におけるオブジェクトブロックとの比較を単純化し得る。
エンコードされるべきinterフレームの一部のためのベストマッチの検索が実行される時に、図4の動き予測ユニット490が、前フレームのためのハーフピクセルデータ及びウェーブレット定義域データをサーチする。ハーフピクセルウェーブレットデータを効果的に用いることが、interフレームのウェーブレット定義域データのブロックとマッチングするためのコードブックにおけるベクトル数を拡張し、従って、エンコーディングの際に、達成される圧縮レート及びイメージイクオリティが改善され得る。
図8はエンコーダ400(図4)において実現された本発明の実施例によるビデオエンコーディングプロセス800のフローチャートである。エンコーディングプロセス800はステップ810で開始されており、ここでウェーブレット変換ユニット410がビデオイメージのフレームのためのウェーブレット定義域データを生成する。ステップ815は、次にフレームが動き予測を用いることなくエンコードされるintraフレームであるか、動き予測を要するinterフレームであるか否かを決定する。代替例として、フレームがintraによるエンコードを実行されるかinterによるエンコードを実行されるかの選択が、動き予測が到達した圧縮量の決定後に実行されてもよい。とりわけ、動き予測が当該フレームが前フレームと著しく異なると示す場合、フレームがintraエンコーディングのために選択されてもよい。
intraフレームのためには、量子化ユニット430及びエントロピーコーディングユニット440が、フレームのためウェーブレット定義域データを量子化し、エンコードして送信する。ステップ825では、逆量子化ユニット450が、別フレームの動き予測に実行可能な量子化されたウェーブレットデータを逆量子化する。フレームバッファ470は、逆量子化ユニット750よりの逆量子化されたウェーブレットデータアウトプットをストアする。
プロセス800のステップ830では、ハーフピクセルデータジェネレータ480がフレームメモリ470内部にバッファされたウェーブレット定義域データよりハーフピクセルデータを生成する。ステップ830は、インターコードされた後フレームの予測においてハーフピクセルデータを生成するが、複数のケースでハーフピクセルデータが要求されなくてもよい。要求される処理能力を低くするためには、代替のエンコーディングプロセスが、動き予測が要求されるフレームのインターコーディングの間のみ、ハーフピクセルデータを生成する。
プロセス800は、ステップ830におけるハーフピクセルウェーブレット定義域情報の生成の後、エンコーディングを要する別フレームを識別した場合に、ステップ835で分岐してステップ810へと戻る。
エンコードされるフレームがinterフレームである場合、プロセス800がステップ815から分岐してステップ840へと進行し、そこで動き予測ユニット490がフレーム内でオブジェクトブロックを選択する。オブジェクトブロックはウェーブレット定義域ピラミッドデータ構造の特定レベルにおけるウェーブレット定義域係数ブロックであってよい。多様なオブジェクトブロック選択過程が採用されてよい。例えば、各オブジェクトブロックがブロックのコンテンツに従って選択されたイレギュラーなサイズを有していてもよい。代替例としては、ブロックが、固定されたサイズ(例えば16×16のアレイ)や、オブジェクトブロックのピラミッド構造におけるレベルによって選択されたサイズを有していてもよい。
一度オブジェクトブロックが選択されると、動き予測ユニット490が、前のフレームの同一レベルにあるウェーブレット定義域データ及びハーフピクセルデータを検索し、ベストマッチングするブロックを識別する。動き予測ユニット490は、次にベストマッチングブロックに対応する動きベクトルを生成する。各々の動きベクトルが、セットされる加算ビットを含んでいてよく、また、動きベクトルがウェーブレット定義域データおよびハーフピクセルデータの何れを識別するかを示さない。そのような訳で、動きベクトルが、ウェーブレット定義域データ若しくはハーフピクセルデータのブロックの何れかを識別し得る。ステップ855では、ベストマッチングブロックがオブジェクトブロックより減じられ、差分ブロックを生成する。前記差分ブロックはエンコードされたフレームを示す差分データの一部となる。ステップ860は、次に別オブジェクトブロックが選択され得るか否か決定する。
動き予測ユニット490は、オブジェクトブロックが選択されないで、また差分ブロックの集まり(collection)がフレームのウェーブレット定義域差分データを形成するまで、マルチ解像度構造の各レベルのために、ステップ840乃至860を繰り返す。ステップ865では、量子化ユニット430及びエントロピーコーディングユニット440がウェーブレット定義域差分データ及び関連する動きベクトルを量子化、エンコード、及び送信する。
ステップ870及び875では、逆量子化ユニット450が差分データを逆量子化し、また加算器460が動きベクトルが識別するベストマッチングブロックを加算し直す。結果として、エンコーディングプロセス800は、ウェーブレット定義域データ(量子化、エンコーディング、デコーディング、若しくは逆量子化へと可能な限り導入された変化をを含む)を再構築し、次にステップ830へと戻り、次のフレームのための動き予測において利用可能なハーフピクセルデータを生成する。
動き予測プロセスがハーフピクセルデータを識別し得る動きベクトルを使用するので、デコーディングプロセスが複数のハーフピクセルウェーブレット定義域イメージデータを要求してもよい。図9は本発明の実施例によるデコーディングプロセス900のフローチャートである。
デコーディングプロセス900はステップ910で開始されており、ここで、デコーダ500がエンコードされたフレームデータをレシーブする。ステップ915では、デコーダ500がinterフレーム若しくはintraフレームのどちらにフレームデータが対応するか決定する。intraフレームのためのデータは動きベクトルを含んでおらず、デコーディングのためにハーフピクセルデータを要求しない。従って、intraフレームは従来の方法でデコードされ得る。とりわけ、ステップ920はintraフレームを示すウェーブレット定義域データをデコード及び逆量子化する。ここでステップ965は、逆ウェーブレット変換を実行し得り、ピクセル情報を再構築する。逆変換の前に、ステップ920が、interフレームをデコーディングする際の実行可能な後の使用のために、ウェーブレット定義域データをバッファする。
レシーブされたフレームデータがinterフレームに対応すると、ステップ915が決定する場合、プロセス900はステップ915よりステップ925へと分岐し、ステップ925では、interフレームに関連する差分データ及び動きベクトルがデコード及び逆量子化される。ステップ930は、次に、差分データよりのinterフレームのためのウェーブレット定義域データ、及び先のフレームのためのバッファされたウェーブレット定義域データを再構築するプロセスのために、動きベクトルの1つを選択する。
ステップ930に続いて、ステップ935は選択された動きベクトルがウェーブレット定義域データ若しくはハーフピクセルデータの何れのマッチングブロックに対応するか決定する。動きベクトルがウェーブレット定義域データのブロックに対応する場合、ステップ945が、前フレームのためにバッファされたウェーブレット定義域データよりウェーブレット定義域データのブロックを識別し、また使用する。
動きベクトルがハーフピクセルデータのブロックに対応する場合は、ステップ940が前のフレームのためにバッファされたウェーブレット定義域データよりハーフピクセルデータのブロックを生成する。とりわけ、ステップ940は上述したように数式5、6、及び7を使用してもよく、要求されたブロックハーフピクセルデータを生成する。デコーディングのために全てのハーフピクセルデータ生成が要求されることはなく、また要求される処理能力を低くするために、動きベクトルによって識別されたハーフピクセルデータのブロックのみが生成される。代替例としては、動きベクトルが特定のブロックを識別する前に、デコーダが全てのハーフピクセルのウェーブレット定義域データを決定してもよい。
ステップ950は、識別され生成されたウェーブレット定義域データのブロック若しくはハーフピクセルデータのブロックを、動きベクトルに対応し差分アレイ内にあるブロックへと加算する。ステップ930乃至955が各動きベクトルのために一回ずつ反復され、ステップ950における加算がデコードされたinterフレームのためのウェーブレット定義域データを再構築する。ステップ965が逆ウェーブレット変換を実行する前に、最新のデコードされたウェーブレット定義域データが、後のinterフレームをデコーディングする際に実行可能となるべくバッファされ、フレームの表示のために要求されるピクセルデータを再構築する。
上述したように、比較的少ない処理能力を有するエンコーダがウェーブレット定義域データよりのハーフピクセルデータを生成し得る。ハーフピクセルデータは動き予測の検索内に含まれていてもよく、実行可能なマッチングブロックのコードブックを効果的に拡張する。この拡張によって、ビデオ信号における冗長な情報のより効果的な除去を提供することで、圧縮が改善される。
本発明は特定の実施例に関して記載されたが、記載は単なる例示に過ぎず本発明をこれに限定するものではない。例えば、本発明の記載は、後のターゲットフレームに対する前のソースフレームを基にした動き予測に関して特化されているが、ターゲットフレームに続くソースフレーム若しくは複数のソースフレームを用いたその他の動き予測手順も本発明の実施例に適している。加えて上述したような本発明の原理は、別形式及び別次元のウェーブレット変換に対しても、より一般的に適用され得る。特許請求の範囲に含まれる変形及び変更は全て本発明の範囲内のものである。
図は、静止画のウェーブレット変換の結果として得られるデータ構造を示すものである。 図は、静止画データへの一連のウェーブレット変換の適用によって得られたマルチ解像度データ構造を示すものである。 図は、オブジェクトの小さな動きが、ウェーブレットドメインデータ上で有し得る効果を示すものである。 図は、本発明の実施例によるウェーブレットドメインハーフピクセル補間を用いたエンコーディングシステムを示すブロック図である。 図は、本発明の実施例によるウェーブレットドメインハーフピクセル補間を用いたデコーディングシステムを示すブロック図である。 図は、本発明の実施例によるハーフピクセルデータに関連し、空間ドメインまたは低周波数イメージデータの標準部分より水平方向にずれているマトリクスを示すものである。 図は、本発明の実施例によるハーフピクセルデータに関連し、空間ドメインまたは低周波数イメージデータの標準部分より垂直方向にずれているマトリクスを示すものである。 図は、本発明の実施例によるハーフピクセルデータに関連し、空間ドメインまたは低周波数イメージデータの標準部分より対角線方向にずれているマトリクスを示すものである。 図は、本発明の実施例によるウェーブレットドメインハーフピクセルデータを含むマルチ解像度データ構造を示すものである。 図は、本発明の実施例によるウェーブレットドメインハーフピクセルデータを含むマルチ解像度データ構造を示すものである。 図は、本発明の実施例によるエンコーディングプロセスのフローチャートである。 図は、本発明の実施例によるデコーディングプロセスのフローチャートである。

Claims (24)

  1. 空間定義域よりウェーブレット定義域へと、ビデオデータを変換するために操作可能なウェーブレット変換ユニットと、
    ウェーブレット変換ユニットよりウェーブレット定義域データをレシーブするために接続されたハーフピクセルデータジェネレータであって、
    前記ハーフピクセルデータジェネレータは前記ウェーブレット定義域データよりハーフピクセルデータを生成し、前記ハーフピクセルデータが、前記ウェーブレット変換ユニットが変換するマトリクスに対しずれている、マトリクスのウェーブレット変換よりの結果として得られるウェーブレット定義域データを近似することを特徴とするハーフピクセルデータジェネレータと、
    コードされるフレームにおけるオブジェクトブロックにベストマッチングするブロックのために、前記ウェーブレット定義域データ及び前記ハーフピクセルデータを検索するべく操作可能な動き予測ユニットとを有するエンコーダ。
  2. 前記ハーフピクセルデータジェネレータが、逆ウェーブレット変換を実行することなく、前記ウェーブレット定義域データより前記ハーフピクセルデータを生成することを特徴とする請求項1に記載のエンコーダ。
  3. 更に、intraフレームのエンコーディングのために前記ウェーブレット定義域データを量子化するべく接続された量子化ユニットと、
    メモリと、
    前記量子化ユニットよりのデータアウトプットを逆量子化し、後のフレームのための動き予測に用いられるべく前記メモリ内に結果をストアするべく接続された逆量子化ユニットとを含む請求項1に記載のエンコーダ。
  4. 前記ウェーブレット変換は、二次元H変換であることを特徴とする請求項1に記載のエンコーダ。
  5. 前記ハーフピクセルジェネレータが、マルチ解像度データ構造のレベルのために、該レベルのための高周波数ウェーブレット定義域データ及び低周波数ウェーブレット定義域データの近似を用い、前記ハーフピクセルデータを生成することを特徴とする請求項1に記載のエンコーダ。
  6. 該レベルのための前記低周波数ウェーブレット定義域データの前記近似が、前記マルチ解像度データ構造のより高いレベルよりの低周波数ウェーブレット定義域データによって決定されることを特徴とする請求項5に記載のエンコーダ。
  7. 前記マルチ解像度データ構造のより高いレベルが前記マルチ解像度データ構造のトップレベルであることを特徴とする請求項5に記載のエンコーダ。
  8. 前記ウェーブレット定義域データに対応するマトリクスより水平方向にずれているオフセットマトリクスのために、前記エンコーダが、次式、
    Figure 2005515731
    を用い、ハーフピクセル係数hxx(r,s)、hyx(r,s)、hdx(r,s)を含むハーフピクセルデータを決定し、
    ここで、r及びsは、前記オフセットマトリクスより1係数だけ水平方向にずれているアレイを識別するインデックスであり、
    hxr、hyr、及びhdrがウェーブレット定義域係数であり、h0’rはrに対応する近似低周波数ウェーブレット定義域係数であり、
    hxs、hys、及びhdsはウェーブレット定義域係数であり、h0sはsに対応する近似低周波数ウェーブレット定義域係数であることを特徴とする請求項1に記載のエンコーダ。
  9. 前記ウェーブレット定義域データに対応するマトリクスより垂直方向にずれているオフセットマトリクスのために、前記エンコーダが、次式、
    Figure 2005515731
    を用い、ハーフピクセル係数hxy(r,s)、hyy(r,s)、hdy(r,s)を含むハーフピクセルデータを決定し、
    ここで、r及びsは、前記オフセットマトリクスより1係数だけ垂直方向にずれているアレイを識別するインデックスであり、
    hxr、hyr、及びhdrがウェーブレット定義域係数であり、h0’rはrに対応する近似低周波数ウェーブレット定義域係数であり、
    hxs、hys、及びhdsはウェーブレット定義域係数であり、h0sはsに対応する近似低周波数ウェーブレット定義域係数であることを特徴とする請求項1に記載のエンコーダ。
  10. 前記ウェーブレット定義域データに対応するマトリクスより対角線方向にずれているオフセットマトリクスのために、前記エンコーダが、次式、
    Figure 2005515731
    を用い、ハーフピクセル係数hxy(r,s)、hyy(r,s)、hdy(r,s)を含むハーフピクセルデータを決定し、
    ここで、r、s、t、及びuは、前記オフセットマトリクスより1係数だけ対角線方向にずれているアレイを識別するインデックスであり、
    hxr、hyr、及びhdrがウェーブレット定義域係数であり、h0’rはrに対応する近似低周波数ウェーブレット定義域係数であり、
    hxs、hys、及びhdsはウェーブレット定義域係数であり、h0sはsに対応する近似低周波数ウェーブレット定義域係数であり、
    hxt、hyt、及びhdtがウェーブレット定義域係数であり、h0’rはtに対応する近似低周波数ウェーブレット定義域係数であり、
    hxu、hyu、及びhduはウェーブレット定義域係数であり、h0sはuに対応する近似低周波数ウェーブレット定義域係数であることを特徴とする請求項1に記載のエンコーダ。
  11. 第1のウェーブレット定義域データを生成するために、ビデオデータの第1フレーム上でウェーブレット変換を実行する過程と、
    前記第1のウェーブレット定義域データよりハーフピクセルデータを生成する過程であって、ここで前記ハーフピクセルデータが、前記ウェーブレット変換の間に用いられるマトリクスに対しずれているマトリクスのウェーブレット変換の結果として得られるウェーブレット定義域データを近似することを特徴とする過程と、
    第2フレームを示す第2のウェーブレット定義域データよりのオブジェクトブロックにベストマッチするブロックのために、ウェーブレット定義域データ及び前記ハーフピクセルデータを検索する過程と、
    前記第2フレームを示すデータストリーム内に、前記オブジェクトブロックにベストマッチする前記ブロックを識別する動きベクトルを有する過程とを有するエンコーディングプロセス。
  12. 前記第1のウェーブレット定義域データよりハーフピクセルデータを生成する過程が、逆ウェーブレット変換を実行することなく実行されることを特徴とする請求項11に記載のエンコーディングプロセス。
  13. 前記第1のウェーブレット定義域データが、トップレベル、及びより低いレベルを含む複数のレベルを有し、各々のより低いレベルが高周波数ウェーブレット定義域データを含み、前記トップレベルは高周波数ウェーブレット定義域データ及び低周波数ウェーブレット定義域データを含んでおり、
    前記第1のウェーブレット定義域データよりハーフピクセルデータを生成する過程が、前記より低いレベルの1つよりの高周波数ウェーブレット定義域データと、前記より低いレベルのための低周波数の近似とを組み合わせる過程を含むことを特徴とする請求項11に記載のエンコーディングプロセス。
  14. 前記より低いレベルのための前記低周波数の近似が、前記トップレベルの前記低周波数ウェーブレット定義域データより獲得されることを特徴とする請求項13に記載のエンコーディングプロセス。
  15. 前記ハーフピクセルデータを生成する過程が、前記ウェーブレット定義域データに対応するマトリクスより水平方向にずれているオフセットマトリクスのために、次式、
    Figure 2005515731
    を用い、ハーフピクセル係数hxx(r,s)、hyx(r,s)、hdx(r,s)を決定する過程を含み、
    ここで、r及びsは、前記オフセットマトリクスより1係数だけ水平方向にずれているアレイを識別するインデックスであり、
    hxr、hyr、及びhdrがウェーブレット定義域係数であり、h0’rはrに対応する近似低周波数ウェーブレット定義域係数であり、
    hxs、hys、及びhdsはウェーブレット定義域係数であり、h0sはsに対応する近似低周波数ウェーブレット定義域係数であることを特徴とする請求項11に記載のエンコーディングプロセス。
  16. 前記ハーフピクセルデータを生成する過程が、前記ウェーブレット定義域データに対応するマトリクスより垂直方向にずれているオフセットマトリクスのために、次式、
    Figure 2005515731
    を用い、ハーフピクセル係数hxy(r,s)、hyy(r,s)、hdy(r,s)を決定する過程を含み、
    ここで、r及びsは、前記オフセットマトリクスより1係数だけ垂直方向にずれているアレイを識別するインデックスであり、
    hxr、hyr、及びhdrがウェーブレット定義域係数であり、h0’rはrに対応する近似低周波数ウェーブレット定義域係数であり、
    hxs、hys、及びhdsはウェーブレット定義域係数であり、h0sはsに対応する近似低周波数ウェーブレット定義域係数であることを特徴とする請求項11に記載のエンコーダ。
  17. 前記ハーフピクセルデータを生成する過程が、前記ウェーブレット定義域データに対応するマトリクスより対角線方向にずれているオフセットマトリクスのために、次式、
    Figure 2005515731
    を用い、ハーフピクセル係数hxy(r,s)、hyy(r,s)、hdy(r,s)を決定する過程を含み、
    ここで、r、s、t、及びuは、前記オフセットマトリクスより1係数だけ対角線方向にずれているアレイを識別するインデックスであり、
    hxr、hyr、及びhdrがウェーブレット定義域係数であり、h0’rはrに対応する近似低周波数ウェーブレット定義域係数であり、
    hxs、hys、及びhdsはウェーブレット定義域係数であり、h0sはsに対応する近似低周波数ウェーブレット定義域係数であり、
    hxt、hyt、及びhdtがウェーブレット定義域係数であり、h0’rはtに対応する近似低周波数ウェーブレット定義域係数であり、
    hxu、hyu、及びhduはウェーブレット定義域係数であり、h0sはuに対応する近似低周波数ウェーブレット定義域係数であることを特徴とする請求項1に記載のエンコーダ。
  18. ビデオデコーディングプロセスであって、
    ビデオの第1フレームに関連する動きベクトル及びウェーブレット定義域データの差分を含む差分アレイを抽出するべくデータ構造をデコーディングする過程と、
    各動きベクトルのために、前記動きベクトルが第1のタイプ、第2のタイプでいずれであるかを識別する過程と、
    前記第1のタイプの動きベクトルによって識別されたウェーブレット定義域データの前記各々のブロックを、前記差分アレイの各部分に加算する過程と、
    第2のタイプの各動きベクトルのために、前記第2フレームを示す前記ウェーブレット定義域データより、前記第2のタイプの前記動きベクトルによって識別されたデータの前記ブロックを生成し、生成された前記ブロックを前記第2のタイプの前記動きブロックに対応する前記差分アレイの一部に加算する過程とを含み、
    ここで、前記第1のタイプの動きベクトルは、第2のフレームを示すウェーブレット定義域データの各ブロックを識別し、
    前記第2のタイプの動きベクトルが、前記第2のフレームの一部を示すピクセル値のマトリクスのウェーブレット変換の近似に対応するデータの各ブロックを識別し、前記マトリクスが前記第2フレームを示す前記ウェーブレット定義域データを生成する際に用いられるマトリクスに対しずれていることを特徴とするビデオデコーディングプロセス。
  19. 更に、ウェーブレット定義域データ及び生成されたデータの前記ブロックを、前記差分アレイに対して加算し、結果として生ずるアレイ上で逆ウェーブレット変換を実行する過程を含む請求項18に記載の方法。
  20. 前記第2のタイプの前記動きベクトルによって識別されたデータの前記ブロックが、前記第2フレームのための前記ウェーブレット定義域データ上で逆ウェーブレット変換を実行することなく、前記第2フレームのための前記ウェーブレット定義域データより生成されることを特徴とする請求項18に記載の方法。
  21. 前記第2フレームを示す前記ウェーブレット定義域データが、トップレベル及びより低いレベルを含む複数のレベルを有し、各々のより低いレベルが高周波数ウェーブレット定義域データを含み、トップレベルが低周波数ウェーブレット定義域データを有し、
    前記第2のタイプの前記動きベクトルによって識別されたデータの前記ブロックを生成する過程が、前記より低いレベルの1つよりの高周波数ウェーブレット定義域データと、前記より低いレベルのための低周波数近似とを組み合わせる過程を含むことを特徴とする請求項18に記載の方法。
  22. 前記より低いレベルのための低周波数の前記近似が前記トップレベルにおける前記低周波数ウェーブレット定義域データより獲得されることを特徴とする請求項21に記載の方法。
  23. ビデオを示すデータ構造であって、
    前記ビデオの第1フレームのためのウェーブレット定義域データを示す第1のデータと、
    前記ビデオの第2フレームのための差分アレイを示す第2のデータと、
    第1のタイプの動きベクトルと、
    第2のタイプの動きベクトルとを有し、
    ここで、前記第1のタイプの動きベクトルが前記差分アレイにおける各ブロックに対応しており、また、第2フレームのためのウェーブレット定義域データの生成時、前記差分アレイに於いて前記各ブロックに対する加算を目的として、前記ウェーブレット定義域データのブロックを識別し、
    前記第2のタイプの前記動きベクトルが前記差分アレイにおける各ブロックに対応しており、また、前記第2フレームのための前記ウェーブレット定義域データの生成時、前記差分アレイにおける前記各ブロックに対する加算を目的として、ハーフピクセルデータのブロックを識別し、前記ハーフピクセルデータが、前記第1のフレームのために前記ウェーブレット定義域データを生成する際に用いられた前記第1フレームよりのアレイに対しずれている前記第1フレームよりのアレイのウェーブレット変換を近似することを特徴とするデータ構造。
  24. 前記第1のデータが、
    前記ビデオの前記第1フレームのための第2の差分アレイを示すデータと、
    前記第1フレームに関連する前記第1のタイプの動きベクトルと、
    前記第1フレームに関連する前記第2のタイプの動きベクトルとを有し、
    ここで、前記第1のフレームに関連する前記第1のタイプの前記動きベクトルが、前記第2の差分アレイにおける各ブロックに対応し、また、前記第1フレームのための前記ウェーブレット定義域データの生成時、前記第2の差分アレイにおける前記各ブロックに対する加算を目的として、第3フレームのためのウェーブレット定義域データブロックを識別し、
    前記第1フレームに関連する前記第2のタイプの前記動きベクトルが、前記第2の差分アレイにおける各ブロックに対応し、前記第1フレームのための前記ウェーブレット定義域データの生成時、前記第2の差分アレイにおける前記各ブロックに対する加算を目的として、ハーフピクセルデータのブロックを識別し、前記ハーフピクセルデータが、前記第3フレームのための前記ウェーブレット定義域データを生成する際に用いられた前記第3フレームよりのアレイに対しずれている、前記第3フレームよりのアレイのウェーブレット変換を近似することを特徴とする請求項23に記載のデータ構造。
JP2003561253A 2002-01-09 2003-01-09 ウェーブレット定義域ハーフピクセル動き補償 Ceased JP2005515731A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US10/043,363 US6888891B2 (en) 2002-01-09 2002-01-09 Wavelet domain half-pixel motion compensation
PCT/US2003/000675 WO2003061296A1 (en) 2002-01-09 2003-01-09 Wavelet domain half-pixel motion compensation

Publications (1)

Publication Number Publication Date
JP2005515731A true JP2005515731A (ja) 2005-05-26

Family

ID=21926784

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003561253A Ceased JP2005515731A (ja) 2002-01-09 2003-01-09 ウェーブレット定義域ハーフピクセル動き補償

Country Status (7)

Country Link
US (1) US6888891B2 (ja)
EP (1) EP1470725A4 (ja)
JP (1) JP2005515731A (ja)
KR (1) KR20040083422A (ja)
CN (1) CN100366093C (ja)
AU (1) AU2003207502A1 (ja)
WO (1) WO2003061296A1 (ja)

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100366382B1 (ko) * 2001-02-12 2002-12-31 (주) 멀티비아 동영상 부호화 장치 및 방법
US20040005005A1 (en) * 2002-04-22 2004-01-08 Mcintyre Kristen A. Method and apparatus to facilitate image difference transmission while maintaining image salience
SE527621C2 (sv) * 2003-06-10 2006-04-25 Jan-Olov Stroemberg Metod och system för komprimering av bilddata
US7627037B2 (en) * 2004-02-27 2009-12-01 Microsoft Corporation Barbell lifting for multi-layer wavelet coding
US7580461B2 (en) 2004-02-27 2009-08-25 Microsoft Corporation Barbell lifting for wavelet coding
KR100815977B1 (ko) * 2005-04-20 2008-03-24 주식회사 메디슨 연속되는 영상으로부터 움직임을 추정하는 방법 및 시스템
US9332274B2 (en) * 2006-07-07 2016-05-03 Microsoft Technology Licensing, Llc Spatially scalable video coding
US8000388B2 (en) * 2006-07-17 2011-08-16 Sony Corporation Parallel processing apparatus for video compression
GB0716158D0 (en) * 2007-08-17 2007-09-26 Imagination Tech Ltd Data compression
KR100950417B1 (ko) * 2008-01-16 2010-03-29 에스케이 텔레콤주식회사 방향성 필터링 기반 웨이블렛 변환에서 문맥 모델링 방법및 웨이블렛 코딩 장치와 이를 위한 기록 매체
KR100941582B1 (ko) * 2008-03-07 2010-02-10 에스케이 텔레콤주식회사 리프팅 기반 방향성 웨이블렛 변환의 적응적 갱신 방법 및갱신 장치와 이를 위한 기록 매체
JP5230483B2 (ja) * 2008-03-18 2013-07-10 キヤノン株式会社 撮像装置及びその制御方法
US8660177B2 (en) * 2010-03-24 2014-02-25 Sony Computer Entertainment Inc. Parallel entropy coding
CN102096931B (zh) * 2011-03-04 2013-01-09 中南大学 基于分层背景建模的运动目标实时检测方法
JP4855556B1 (ja) * 2011-03-22 2012-01-18 株式会社モルフォ 動体検出装置、動体検出方法、動体検出プログラム、動体追跡装置、動体追跡方法及び動体追跡プログラム
BR112018068603A2 (pt) * 2016-03-18 2019-02-05 Koninklijke Philips Nv decodificador e codificador de vídeo e método de decodificação e de codificação vídeo
FR3098367B1 (fr) * 2019-07-05 2023-01-27 Fond B Com Procédé et dispositif de codage d’une séquence d’hologrammes numériques

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2270811B (en) 1992-09-17 1996-02-07 Sony Broadcast & Communication Video data compression
JP2933457B2 (ja) 1993-02-18 1999-08-16 日本電気株式会社 ウェーブレット変換符号化方法
JP2956464B2 (ja) 1993-12-29 1999-10-04 日本ビクター株式会社 画像情報圧縮伸長装置
JP3655651B2 (ja) * 1994-09-02 2005-06-02 テキサス インスツルメンツ インコーポレイテツド データ処理装置
JPH09107548A (ja) * 1995-10-11 1997-04-22 Matsushita Electric Ind Co Ltd 画像圧縮装置および画像圧縮方法
US6272253B1 (en) 1995-10-27 2001-08-07 Texas Instruments Incorporated Content-based video compression
EP0817494A3 (en) * 1996-06-28 1998-07-22 Oki Electric Industry Co., Ltd. Image coding method and apparatus
US6125210A (en) * 1997-10-24 2000-09-26 Intel Corporation Method and apparatus for two-dimensional wavelet recomposition

Also Published As

Publication number Publication date
US20030128760A1 (en) 2003-07-10
CN100366093C (zh) 2008-01-30
EP1470725A1 (en) 2004-10-27
KR20040083422A (ko) 2004-10-01
CN1640147A (zh) 2005-07-13
US6888891B2 (en) 2005-05-03
WO2003061296A1 (en) 2003-07-24
EP1470725A4 (en) 2006-05-24
AU2003207502A1 (en) 2003-07-30

Similar Documents

Publication Publication Date Title
JP2005515731A (ja) ウェーブレット定義域ハーフピクセル動き補償
KR100971833B1 (ko) 화상 부호화 방법 및 장치
JP5700970B2 (ja) 画像シーケンスを表す符号化データストリームの復号方法と画像シーケンスの符号化方法
JP4429968B2 (ja) Svcの圧縮率を高めるシステムおよび方法
JPS62203496A (ja) 動画像信号の高能率符号化方式
JP2010528555A (ja) ビデオ信号の処理方法および装置
KR101225160B1 (ko) 비디오 이미지 시퀀스를 상이한 공간 해상도의 주파수부대역 계수들로 인코딩하는 방법 및 장치
JP2002507339A (ja) 非線形ピラミッドを用いた階層的な運動推定実行方法及び装置
JP2002314428A (ja) 信号符号化方法及び装置並びに復号方法及び装置
JP2004229315A (ja) 直交変換−ドメインブロックマッチングを用いる動き推定
JP3502392B2 (ja) デジタル画像画素補填方法、及びそれを用いたデジタル画像符号化装置、画像復号化装置
JP6042899B2 (ja) 映像符号化方法および装置、映像復号方法および装置、それらのプログラム及び記録媒体
KR20030014705A (ko) 프레임들의 시퀀스를 인코딩하는 방법
JPH08294119A (ja) 画像符号化/復号化装置
US5907360A (en) Coder/decoder for television image sub-band compatible coding, and its application to hierarchical motion coding by tree structures
KR20060113666A (ko) 양자화 잡음 전파 효과의 감소를 위한 최적의 시공간 변환
US20100002767A1 (en) Dynamic image encoding device, dynamic image decoding device, dynamic image encoding method, dynamic image decoding method, dynamic image encoding program, and dynamic image decoding program
JP3305480B2 (ja) 画像符号化・復号化装置
JP5931747B2 (ja) 画像シーケンスのブロックの符号化および復元の方法
JP3282138B2 (ja) 画像データ圧縮処理方法および画像データ再構成方法
JP2018198402A (ja) 符号化装置、復号装置、及びプログラム
JP4153774B2 (ja) 動画像符号化方法とその復号化方法、およびそれらの装置
KR100254160B1 (ko) 웨이브렛 기반 프랙탈 근사화를 이용한 정지영상 및 동영상부호화 방법
JP6846134B2 (ja) 映像符号化装置及び映像復号装置
JPH06350990A (ja) 画像データ圧縮処理方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050914

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080708

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20081007

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20081015

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20081107

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20081114

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20081114

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20090728

A045 Written measure of dismissal of application [lapsed due to lack of payment]

Free format text: JAPANESE INTERMEDIATE CODE: A045

Effective date: 20091124