JP4762486B2 - マルチ・リゾルーション・ビデオ符号化および復号化 - Google Patents

マルチ・リゾルーション・ビデオ符号化および復号化 Download PDF

Info

Publication number
JP4762486B2
JP4762486B2 JP2003309278A JP2003309278A JP4762486B2 JP 4762486 B2 JP4762486 B2 JP 4762486B2 JP 2003309278 A JP2003309278 A JP 2003309278A JP 2003309278 A JP2003309278 A JP 2003309278A JP 4762486 B2 JP4762486 B2 JP 4762486B2
Authority
JP
Japan
Prior art keywords
frame
resolution
information
scaling factor
frames
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP2003309278A
Other languages
English (en)
Other versions
JP2004266794A (ja
JP2004266794A5 (ja
Inventor
ダブリュ.ホルコム トーマス
レグナザン シャンカー
ブルース リン チ−ルン
スリニバサン スリドハー
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Microsoft Corp
Original Assignee
Microsoft Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Microsoft Corp filed Critical Microsoft Corp
Publication of JP2004266794A publication Critical patent/JP2004266794A/ja
Publication of JP2004266794A5 publication Critical patent/JP2004266794A5/ja
Application granted granted Critical
Publication of JP4762486B2 publication Critical patent/JP4762486B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

本発明はマルチ・リゾルーション(multi-resolution:複数解像度)・ビデオ符号化および復号化(multi-resolution video coding and decoding)に関する。例えば、ビデオ符号器はビデオ・フレーム・サイズを適応して変更して、低ビットレートでのブロッキング・アーティファクト(blocking artifacts)を低減する。
デジタル・ビデオは大量の記憶および伝送容量を消費する(使い尽くす)。通常の生のデジタル・ビデオ・シーケンスは毎秒15または30フレームを含む。各フレームは数万または数十万のピクセル(ペルとも呼ばれる)を含むことがある。各ピクセルは画像の極めて小さい要素を表現する。生の形式では、コンピュータは一般にピクセルを24ビットで表現する。したがって、通常の生のデジタル・ビデオ・シーケンスの1秒あたりのビット数またはビットレートは、5百万ビット/秒以上になる可能性がある。
大抵のコンピュータおよびコンピュータ・ネットワークは、生のデジタル・ビデオを処理するためのリソース(資源)が不足している。このため、エンジニアは圧縮(コード化または符号化とも呼ばれる)を使用して、デジタル・ビデオのビットレートを低減する。圧縮を可逆的(lossless)にすることができ、これにおいてはビデオの品質は悪くならないが、ビットレートの低減がビデオの複雑性によって制限される。または、圧縮を不可逆的(lossy)にすることができ、これにおいてはビデオの品質が悪くなるが、ビットレートの低減は、可逆的圧縮における結果に対して、より劇的である。圧縮解除は圧縮を逆にする。
一般に、ビデオ圧縮テクニック(techniques;技術、方法)は、イントラ・フレーム(フレーム内)圧縮およびインター・フレーム(フレーム間)圧縮を含む。イントラ・フレーム圧縮テクニックは個々のフレームを圧縮し、これらは通常、Iフレーム、キー・フレームまたは参照フレームと呼ばれる。インター・フレーム圧縮テクニックは、先行および/または後に続くフレームを参照してフレームを圧縮し、通常は予測フレーム、PフレームまたはBフレームと呼ばれる。
多くのイントラ・フレームおよびインター・フレーム圧縮テクニックは、ブロック・ベースである。ビデオ・フレームは符号化のために複数のブロックに分割される。例えば、Iフレームが8×8ブロックに分割され、これらのブロックが圧縮される。または、Pフレームが16×16マクロブロック(例えば、4つの8×8ルミナンス・ブロックおよび2つの8×8クロミナンス・ブロック)に分割され、これらのマクロブロックが圧縮される。異なる実装は異なるブロック構成を使用することができる。
米国特許第6,499,060号明細書 米国特許第6,418,166号明細書
標準ビデオ符号器は、目標レートがあるしきい値より下に落ちたとき、性能が劇的な劣化を受ける。ブロック・ベースのビデオ圧縮および圧縮解除では、量子化および他の不可逆的処理ステージが、一般にブロッキング・アーティファクト、すなわち複数のブロックの間の知覚可能な不連続性として現れる歪み、をもたらす。低いビットレートでは、Iフレームのブロックについての高い周波数情報がひどく歪まされるか、あるいは完全に失われる可能性がある。同様に、Pフレーム(動き推定または他の予測によって予測されなかったPフレームの一部分)のブロックの残差についての高い周波数情報がひどく歪まされるか、あるいは完全に失われる可能性がある。結果として、著しいブロッキング・アーティファクトが「低域通過」領域において生じる可能性があり、再構築されたビデオの品質において相当な低下を引き起こす可能性がある。
いくつかの以前の符号器は、再構築されたフレームをデブロッキング・フィルタ(deblocking filter;ブロック化除去フィルタ)により処理することによって、ブロッキング・アーティファクトの知覚可能性を低減しようと試みている。デブロッキング・フィルタは、複数のブロックの間の境界を平滑化する。デブロッキング・フィルタは、知覚されるビデオ品質を改善することができるが、これはいくつかの欠点を有する。例えば、そのフィルタは、復号器において再構築された出力においてのみ、機能する。したがって、ループ内デブロッキングを使用中であるときでさえ、デブロッキングの効果を、カレント・フレームについての動き推定、動き補償または変換符号化のプロセスに要素として組み込むことができない。他方では、後処理フィルタによるカレント・フレームの平滑化(すなわち、ループ外デブロッキング)は極端になり過ぎる可能性があり、平滑化プロセスは不要な計算の複雑性を導入する。
ビデオ圧縮およびデジタル・ビデオへの圧縮解除についての決定的な重要性を考えると、ビデオ圧縮および圧縮解除は十分に開発された分野であることは驚くべきことではない。しかし、以前のビデオ圧縮および圧縮解除張テクニックの利点が何であれ、これらは以下のテクニックおよびツールの利点を有していない。
要約すると、詳細な説明は、マルチ・リゾルーション・ビデオ符号化のための様々なテクニックおよびツールを対象とする。例えば、ビデオ符号器はビデオ・フレーム・サイズを適応して変更して、低いビットレードでのブロッキング・アーティファクトを低減する。それを行うと、符号器はブロッキング・アーティファクトを低減するが、ブロッキング・アーティファクトより知覚可能性が低く、不愉快さが少ないブラーリング(blurring;不鮮明化)を増す可能性がある。様々なテクニックおよびツールを組み合わせて、あるいは独立して使用することができる。
一態様では、ビデオ符号器はビデオを、多数の空間リゾルーションのうちのいずれかで符号化する。符号器は、多数のビデオ・フレームのシーケンスにおける少なくとも1つのフレームを第1の空間リゾルーションで符号化し、少なくとも1つの他のフレームを第2の空間リゾルーションで符号化する。第2の空間リゾルーションは第1の空間リゾルーションとは異なり、符号器は第2の空間リゾルーションを多数の空間リゾルーションのセットから選択して、ビデオ・フレームのシーケンスにおけるブロッキング・アーティファクトを低減する。
その他の態様では、符号器はフレームの第1の部分を第1の空間リゾルーションで符号化し、フレームの第2の部分を第2の空間リゾルーションで符号化する。第2の空間リゾルーションは第1の空間リゾルーションとは異なる。
その他の態様では、ビデオ符号器は、第1の空間リゾルーションで符号化された第1のフレームについて第1の空間リゾルーションを示す第1のコードをビットストリームに含み、第2の空間リゾルーションで符号化された第2のフレームについて第2の空間リゾルーションを示す第2のコードをビットストリームに含む。第2の空間リゾルーションは第1の空間リゾルーションとは異なり、符号器は第2の空間リゾルーションを多数の空間リゾルーションのセットから選択して、ビデオ・フレームのシーケンスにおけるブロッキング・アーティファクトを低減する。
その他の態様では、符号器は、フレームの第1の部分について第1の空間リゾルーションを示す第1のシグナルをビットストリームに含み、フレームの第2の部分について第2の空間リゾルーションを示す第2のシグナルをビットストリームに含む。第2の空間リゾルーションは第1の空間リゾルーションとは異なる。
その他の態様では、復号器はマルチ・リゾルーションのシグナルを、多数の符号化されたフレームのビデオ・シーケンスのためのシーケンス・ヘッダにおいて受信する。マルチ・リゾルーションのシグナルは、複数のフレームが複数の空間リゾルーションで符号化されるかどうかを示す。複数のフレームが複数の空間リゾルーションで符号化される場合、復号器は第1の符号化されたフレームを第1の空間リゾルーションで復号化し、第2の符号化されたフレームを第2の空間リゾルーションで復号化する。
その他の態様では、復号器は、符号化されたフレームの第1の部分を第1の空間リゾルーションで復号化し、符号化されたフレームの第2の部分を第2の空間リゾルーションで復号化する。第2の空間リゾルーションは第1の空間リゾルーションとは異なる。
その他の態様では、符号器または復号器はビデオ・イメージのためのピクセル・データを受信し、ビデオ・イメージの空間リゾルーションを適応して変更するが、これは、再サンプリングされたピクセル・データを、6タップ・ダウン・サンプリング・フィルタまたは10タップアップサンプリングフィルタを使用して計算することを含む。
追加の特徴および利点は、添付の図面を参照して進行する、以下の様々な実施形態の詳細な説明から明らかになるであろう。
本発明の詳細な実施形態は、マルチ・リゾルーション・ビデオ符号化および復号化を対象とする。例えば、ビデオ符号器はビデオ・フレーム・サイズを適応して変更して、低いビットレードでのブロッキング・アーティファクトを低減する。それを行う際に、符号器はブロッキング・アーティファクトを低減するが、ブラーリングを増す可能性があり、これはブロッキング・アーティファクトより知覚可能性が低く、より好ましくないものではない。
いくつかの実施形態では、符号器はマルチ・リゾルーション符号化テクニックおよびツールを使用して、入力フレームを異なる空間リゾルーションで符号化する。例えば、一実装態様では、符号器はフレームを最大の元のリゾルーションで符号化したり、水平方向において2分の1にダウン・サンプリングされたリゾルーションで符号化したり、垂直方向において2分の1にダウン・サンプリングされたリゾルーションで符号化したり、あるいは水平方向および垂直方向において2分の1にダウン・サンプリングされたリゾルーションで符号化したり、する。別法として、符号器は、元のリゾルーションに対してある他のファクタ(factor)によって符号化されたフレームのリゾルーションを減らすかあるいは増したり、現在のリゾルーションに対してあるファクタにより符号化されたフレームのリゾルーションを減らすかあるいは増したり、あるいはある他のテクニックを使用してリゾルーションを設定したり、する。復号器は、符号化されたフレームを、対応するテクニックを使用して復号化する。
いくつかの実施形態では、符号器はフレームのための空間リゾルーションを、フレーム毎のベースで、あるいはある他のベースで選択する。復号器は対応する調整を実行する。
いくつかの実施形態では、符号器は空間リゾルーションを、ある基準(例えば、ビットレート、フレーム・コンテンツなど)を評価することによって選択する。
様々なテクニックおよびツールを組み合わせて、あるいは独立して使用することができる。個々の実施形態は、説明するテクニックおよびツールのうち1つまたは複数を実装する。異なるテクニックおよびツールを組み合わせて、独立して、あるいは他のテクニックおよびツールと共に使用することができる。
I.コンピューティング環境
図1は、説明する実施形態を実装することができる、適切なコンピューティング環境(100)の汎用的な実施例を例示する。コンピューティング環境(100)は、本発明の用途または機能性の範囲についていかなる限定をも示唆するように意図されない、これは、本発明を多様な汎用または専用コンピューティング環境において実装することができるからである。
図1を参照すると、コンピューティング環境(100)は少なくとも1つの処理装置(110)およびメモリ(120)を含む。図1では、この最も基本的な構成(130)が破線内に含まれる。処理装置(110)はコンピュータ実行可能命令を実行し、実際または仮想のプロセッサにすることができる。マルチ処理システムでは、マルチ処理装置は、処理能力を増すためのコンピュータ実行可能命令を実行する。メモリ(120)を揮発性メモリ(例えば、レジスタ、キャッシュ、RAM)、不揮発性メモリ(例えば、ROM、EEPROM、フラッシュメモリなど)、またはこれら2つのある組合せにすることができる。メモリ(120)は、マルチ・リゾルーション符号化および/または復号化テクニックを実装するソフトウェア(180)を格納する。
コンピューティング環境は追加の機能を有することができる。例えば、コンピューティング環境(100)はストレージ(140)、1つまたは複数の入力デバイス(150)、1つまたは複数の出力デバイス(160)、および1つまたは複数の通信接続(170)を含む。バス、コントローラ、またはネットワークなど、相互接続メカニズム(図示せず)がコンピューティング環境(100)の複数のコンポーネントを相互接続する。通常、オペレーティング・システム・ソフトウェア(図示せず)は、コンピューティング環境(100)において実行する他のソフトウェアのためのオペレーティング環境を提供し、コンピューティング環境(100)のコンポーネントの活動を調整する。
ストレージ(140)をリムーバルまたは非リムーバルにすることができ、これには磁気ディスク、磁気テープまたはカセット、CD−ROM、CD−RW、DVD、または情報を格納するために使用することができ、コンピューティング環境(100)内でアクセスすることができるいずれかの他の媒体が含まれる。ストレージ(140)は、マルチ・リゾルーション符号化および/または復号化テクニックを実装するソフトウェア(180)のための命令を格納する。
入力デバイス(150)を、キーボード、マウス、ペンまたはトラック・ボールなどのタッチ入力デバイス、音声入力デバイス、スキャニング・デバイス、ネットワーク・アダプタ、または、入力をコンピューティング環境(100)に提供する別のデバイスにすることができる。ビデオでは、入力デバイス(150)をTVチューナー・カード、カメラ・ビデオ・インターフェース、または、ビデオ入力をアナログまたはデジタル形式で受け入れる類似のデバイス、または、ビデオ入力をコンピューティング環境に提供するCD−ROM/DVDリーダにすることができる。出力デバイス(160)を、ディスプレイ、プリンタ、スピーカ、CD/DVDライタ、ネットワーク・アダプタ、または、コンピューティング環境(100)からの出力を提供する別のデバイスにすることができる。
通信接続(170)は、ある通信媒体を介した別のコンピューティング・エンティティへの通信を可能にする。通信媒体は、コンピュータ実行可能命令、圧縮されたビデオ情報、または変調データ信号における他のデータなどの情報を搬送する。変調データ信号は、その特性の1つまたは複数が、情報を信号において符号化するように設定または変更されている信号である。例として、限定ではなく、通信媒体には、電気的、光学、RF、赤外線、音響または他の搬送波内に実装されたワイヤードまたはワイヤレス・テクニックが含まれる。
本発明をコンピュータ可読媒体の一般的なコンテクストで説明することができる。コンピュータ可読媒体は、コンピューティング環境内でアクセスすることができる任意の使用可能な媒体である。例として、限定ではなく、コンピューティング環境(100)内でコンピュータ可読媒体は、メモリ(120)、ストレージ(140)、通信媒体、および上記のいずれかの組合せを含む。
本発明を、対象とする実際または仮想のプロセッサ上のコンピューティング環境内で実行されるプログラム・モジュールに含まれたコンピュータ実行可能命令の一般的なコンテクストで説明することができる。一般に、プログラム・モジュールには、ルーチン、プログラム、ライブラリ、オブジェクト、クラス、コンポーネント、データ構造など、特定のタスクを実行するか、あるいは特定の抽象データ型を実施するものが含まれる。プログラム・モジュールの機能性を複数のプログラム・モジュールの間で、様々な実施形態において望ましいように結合または分割することができる。プログラム・モジュールのためのコンピュータ実行可能命令を、ローカルまたは分散コンピューティング環境内で実行することができる。
提示のために、詳細な説明は「設定する(set)」、「選択する(choose)」、「符号化する(encode)」および「復号化する(decode)」という用語を使用して、コンピューティング環境におけるコンピュータ・オペレーションを説明する。これらの用語は、コンピュータによって実行されたオペレーションについての高レベルの抽象であり、人間によって実行される行為(acts)と混同されるべきではない。これらの用語に対応する実際のコンピュータ・オペレーションは、実装に応じて変わる。
II.ビデオ符号器および復号器の実施例
様々な実施形態におけるテクニックおよびツールを、ビデオ符号器(encode)および/または復号器(decoder)に実装することができる。ビデオ符号器および復号器は、それらの内に異なるモジュールを含むことができ、複数の異なるモジュールが互いに多数の異なる方法で関係し、通信することができる。以下で説明するモジュールおよび関係は例示的である。
実装および所望の圧縮のタイプに応じて、符号器または復号器のモジュールを追加し、省略し、多数のモジュールに分割し、他のモジュールと結合し、かつ/または同様のモジュールと置き換えることができる。代替実施形態では、異なるモジュールおよび/または他のモジュールの構成を有する符号器または復号器は、説明するテクニックの1つまたは複数を実行する。
例示する符号器および復号器はブロック・ベースであり、4:2:0マクロブロック・フォーマットを使用し、各マクロブロックは4つの8×8ルミナンス・ブロック(時として、1つの16×16マクロブロックとして扱われる)、および、2つの8×8クロミナンス・ブロックを含む。別法として、符号器および復号器はオブジェクト・ベースであり、異なるマクロブロックまたはブロック・フォーマットを使用し、あるいは、8×8ブロックおよび16×16マクロブロックとは異なるサイズまたは構成のピクセルのセットにおいてオペレーションを実行する。
A.ビデオ符号器の実施例
符号器は、カレント・フレームを含むビデオ・フレームのシーケンスを受信し、圧縮されたビデオ情報を出力として生成する。符号器は、予測フレームおよびキー・フレームを圧縮する。符号器のコンポーネントの多数が、キー・フレームおよび予測フレームの両方を圧縮するために使用される。これらのコンポーネントによって実行される厳密なオペレーションは、圧縮中されている情報のタイプに応じて異なる可能性がある。
予測フレーム(Pフレーム、双方向予測ではBフレーム、またはインター(フレーム間)符号化フレーム(inter-coded frame)とも呼ばれる)が、1つまたは複数の他のフレームからの予測(または差)に関して表現される。予測残差は、予測されたものと元のフレームの間の差である。対照的にキー・フレーム(Iフレーム、イントラ(フレーム内)符号化フレーム(intra-coded frame)とも呼ばれる)は、他のフレームに関係なく圧縮される。
いくつかの実施形態の中の図2を参照すると、カレント・フレーム(205)を符号化する符号器(200)は、マルチ・リゾルーション符号化のためのリゾルーション変換器(210)を含む。リゾルーション変換器(210)はカレント・フレーム(205)を入力として受信し、変換されたフレームはもちろん、マルチ・リゾルーション・パラメータ(215)を出力する。カレント・フレーム(205)が予測フレームである場合、リゾルーション変換器(230)は、入力としてカレント・フレーム(205)のための参照フレーム(225)を受信し、変換された参照フレームを出力する。
リゾルーション変換器(210)および(230)は、他の符号化モジュール(240)と通信し、他の符号化モジュール(240)は、リゾルーション変換器(210)および(230)によって提供されたマルチ・リゾルーション符号化情報(例えば、マルチ・リゾルーション・パラメータ(215))に部分的に基づく出力(245)(例えば、ピクセル・ブロック・データ、モーション・ベクトル、残差など)を生成する。
他の符号器モジュール(240)には例えば、動き推定器、動き補償器、周波数変換器、量子化器、フレーム・ストアおよびエントロピー符号器を含むことができる。
カレント・フレーム(205)が前方予測フレームである場合、動き推定器は、参照フレーム(225)に対するカレント・フレーム(205)のマクロブロックまたは他のピクセルのセットの動きを、推定する。この場合の参照フレームは、フレーム・ストアにバッファリングされた、再構築された以前のフレームである。代替実施形態では、参照フレーム(225)は後のフレームであり、あるいはカレント・フレーム(205)は双方向に予測される。動き補償器は、動き情報を再構築された以前のフレームに適用して、動き補償されたカレント・フレームを形成する。しかし、予測はめったに完全ではなく、動き補償されたカレント・フレームと元のカレント・フレーム(205)の間の差異は、予測残差である。別法として、動き推定器および動き補償器は別のタイプの動き推定/補償を適用する。
周波数変換器は、空間領域ビデオ情報(spatial domain video information)を周波数領域(frequency domain)(すなわち、スペクトル)データに変換する。ブロック・ベースのビデオ・フレームでは、周波数変換器は離散コサイン変換(DCT)をピクセル・データのブロックまたは予測残差データに適用し、DCT係数のブロックを生成する。別法として、周波数変換器は、フーリエ変換などの別の従来の周波数変換を適用し、あるいはウェーブレットまたはサブ・バンド解析(analysis)を使用する。
次いで、量子化器はスペクトル・データ係数のブロックを量子化する。量子化器はフレーム毎のベースで、あるいは他のベースで変わるステップ・サイズを使用して、スペクトル・データに対して一様のスカラ量子化を適用する。別法として、量子化器は、非一様、ベクトル、または非適応量子化などの別のタイプの量子化をスペクトル・データ係数に適用したり、あるいは、周波数変換を使用しない符号器システムにおいて空間領域データを直接量子化したり、する。適応量子化に加えて、符号器(200)はフレーム・ドロップ、適応フィルタリング、またはレート・コントロールのための他のテクニックを使用することができる。
再構築されたカレント・フレームが、後続の動き推定/補償のために必要とされるとき、符号器(200)のモジュールはカレント・フレーム(205)を再構築し、これは通常、フレームを符号化するために使用されたテクニックの逆を実行する。フレーム・ストアは、再構築されたカレント・フレームを、次のフレームの予測において使用するためにバッファリングする。
エントロピー符号器は、量子化器の出力ならびにある副情報(例えば、動き情報、量子化ステップ・サイズなど)を圧縮する。通常のエントロピー符号化テクニックには、算術符号化、差分符号化、ハフマン符号化、ラン・レングス符号化、LZ符号化、辞書型符号化、および上記の組合せまたは変形物が含まれる。エントロピー符号器は通常、異なる種類の情報について異なる符号化テクニックを使用し、特定の符号化テクニック内の多数のコード・テーブルの中から選択することができる。
いくつかの実施形態における他の符号器モジュール(240)についての追加の詳細については、2001年5月3日出願の「DYNAMIC FILTERING FOR LOSSY COMPRESSION」という名称の米国特許出願第09/849,502号、1998年11月30日出願の「EFFICIENT MOTION VECTOR CODING FOR VIDEO COMPRESSION」という名称の米国特許出願第09/201,278号、特許文献1および特許文献2を参照されたい。これらの各開示は参照により本明細書に組み込まれる。
B.ビデオ復号器の実施例
図3を参照すると、復号器(300)は、圧縮されたビデオ・フレームのシーケンスについての情報を受信し、再構築されたフレームを含む出力を生成する。復号器(300)は、予測フレームおよびキー・フレームを圧縮解除する。復号器(300)のコンポーネントの多数が、キー・フレームおよび予測フレームの両方を圧縮解除するために使用される。これらのコンポーネントによって実行される厳密なオペレーションは、圧縮されている情報のタイプに応じて変わる可能性がある。
いくつかの実施形態では、カレント・フレーム(305)を再構築する復号器(300)は、マルチ・リゾルーション復号化のためのリゾルーション変換器(310)を含む。リゾルーション変換器(310)は、復号化されたフレーム(315)を入力として取り、再構築されたカレント・フレーム(305)を出力する。
カレント・フレーム(305)が予測フレームである場合、リゾルーション変換器(330)は入力として、マルチ・リゾルーション・パラメータ(315)およびカレント・フレーム(305)のための参照フレーム(325)を受信する。リゾルーション変換器(330)は、参照フレーム情報を他の復号器モジュール(340)に出力する。他の復号器モジュール(340)は参照フレーム情報を、符号器から受信された動きベクトル、残差など(345)と共に使用して、カレント・フレーム(305)を復号化する。
他の復号器モジュール340には、例えば、バッファ、エントロピー復号器、動き補償器、フレーム・ストア、逆量子化器および逆周波数変換器を含むことができる。
バッファは、圧縮されたビデオ・シーケンスについての情報(345)を受信し、受信された情報をエントロピー復号器で使用可能にする。バッファは通常、情報を、経時的にかなり一定であるレートで受信し、帯域幅または伝送における短期変動を平滑化するためのジッタ・バッファを含む。バッファは、再生バッファおよび他のバッファも含むことができる。別法として、バッファは情報を、変化するレートで受信する。
エントロピー復号器は、エントロピー符号化された量子化データ、ならびに、エントロピー符号化された副情報(例えば、動き情報、量子化ステップ・サイズなど)を復号化し、通常は、符号器において実行されたエントロピー符号化の逆を適用する。エントロピー復号器はしばしば、異なる種類の情報について異なる復号化テクニックを使用し、特定の復号化テクニック内の多数のコード・テーブルの中から選択することができる。
再構築されるフレームが前方予測フレームである場合、動き補償器は動き情報を参照フレームに適用して、再構築中であるフレームの予測を形成する。例えば、動き補償器はマクロブロック動きベクトルを使用して、参照フレームにおけるマクロブロックを見つけ出す。フレーム・バッファは、以前の再構築されたフレームを、参照フレームとして使用するために格納する。別法として、動き補償器は別のタイプの動き補償を適用する。動き補償器による予測はめったに完全ではなく、そのため復号器はまた予測残差をも再構築する。
復号器が、再構築されたフレームを後続の動き補償のために必要とするとき、フレーム・ストアは、再構築されたフレームを、次のフレームの予測において使用するためにバッファリングする。
逆量子化器は、エントロピー復号化されたデータを逆量子化する。一般には、逆量子化器は、フレーム毎のベースで、あるいは他のベースで変わるステップ・サイズを使用して、エントロピー復号化されたデータに対して一様のスカラ逆量子化を適用する。別法として、逆量子化器は、非一様、ベクトル、または非適応逆量子化などの別のタイプの逆量子化をデータに適用したり、あるいは空間領域データを、逆周波数変換を使用しない復号器システムにおいて直接逆量子化したり、する。
逆周波数変換器は、量子化された周波数領域データを空間領域ビデオ情報に変換する。ブロック・ベースのビデオ・フレームでは、逆周波数変換器は、逆DCT(IDCT)をDCT係数のブロックに適用し、それぞれキー・フレームまたは予測フレームのためのピクセル・データまたは予測残差データを生成する。別法として、周波数変換器は、フーリエ変換などの別の従来の逆周波数変換を適用し、あるいはウェーブレットまたはサブ・バンド統合(synthesis)を使用する。
いくつかの実施形態における他の復号器モジュール(340)についての追加の詳細については、2001年5月3日出願の「DYNAMIC FILTERING FOR LOSSY COMPRESSION」という名称の米国特許出願第09/849,502号、1998年11月30日出願の「EFFICIENT MOTION VECTOR CODING FOR VIDEO COMPRESSION」という名称の米国特許出願第09/201,278号、特許文献1および特許文献2を参照されたい。
III.マルチ・リゾルーション・ビデオ符号化および復号化
マルチ・リゾルーション符号化では、符号器が入力フレームを異なる空間リゾルーションで符号化する。符号器はフレームのための空間リゾルーションを、フレーム毎のベースで、あるいは他のベースで選択する。いくつかの実施形態では、符号器は空間リゾルーションを、以下の観測に基づいて選択する。
1.ビットレートが減るにつれて、より低い空間リゾルーションでの符号化での利点が増す。
2.量子化ステップ・サイズが増すにつれて、より低い空間リゾルーションでの符号化での利点が増す。
3.ダウン・サンプリングが高い周波数情報を廃棄するので、ダウン・サンプリングは時として、知覚的に重要な高い周波数コンテンツ(例えば、「強いエッジ」、テキストなど)を有するフレームには、あまり適していない。
4.フレームが低域特性を有する場合、あるいはフレームがノイズのような高い周波数コンテンツを有する場合、ダウン・サンプリングが適切である可能性がある。
いくつかの実施形態では、符号器はカレント・フレームのビットレート、量子化器ステップ・サイズおよび高い周波数エネルギーについての方向づけ(orientation)/大きさを使用して、空間リゾルーションを選択する。例えば、カレント・フレームの水平の高い周波数成分の大きさが大きいが垂直の高い周波数成分の大きさが小さい場合、符号器は垂直ダウン・サンプリングを選択する。他の実施形態では、符号器は参照フレームからの情報を(カレント・フレームからの情報の代わりに、あるいはこれと組み合わせて)使用して、空間リゾルーションを選択する。別法として、符号器は上の基準のいくつかまたはすべてを省略するか、上の基準のいくつかの代わりに他の基準を使用するか、あるいは追加の基準を使用して空間リゾルーションを選択することができる。
符号器がカレント・フレームのための空間リゾルーションを選択した後、符号器は、これを符号化する前に、元のフレームを所望のリゾルーションへ再サンプリングする。カレント・フレームが予測フレームである場合、符号器はまた予測フレームのための参照フレームも、カレント・フレームの新しいリゾルーションに合致するように再サンプリングする。次いで、符号器はリゾルーションの選択を復号器に送信する。一実装では、6タップ・フィルタがダウン・サンプリングのために使用され、10タップ・フィルタがアップ・サンプリングのために使用され、これらのフィルタは、組み合わせることによって、再構築されたビデオの品質を高めるように設計される。別法として、他のフィルタが使用される。
図4は、フレームのマルチ・リゾルーション符号化のためのテクニック(400)を示す。図2の符号器(200)などの符号器は、フレームのためのリゾルーションを設定する(410)。例えば、符号器は、上に挙げた基準または他の基準を考慮する。
次いで、符号器は、フレーム(420)をそのリゾルーションで符号化する。符号化が完了した場合(430)、符号器は終了する。そうでない場合、符号器が次のフレームのためのリゾルーションを設定し(410)、符号化を継続する。別法として、符号器はリゾルーションをフレーム・レベル以外のあるレベルに設定する。
いくつかの実施形態では、符号器は予測フレームならびにイントラ・フレームを符号化する。図6は、イントラ・フレームおよび予測フレームのマルチ・リゾルーション符号化のためのテクニック(600)を示す。
最初に、符号器は、符号化されるカレント・フレームがIフレームであるかPフレームであるかをチェックする(610)。カレント・フレームがIフレームである場合、符号器はカレント・フレームのためのリゾルーションを設定する(620)。フレームがPフレームである場合、符号器は、カレント・フレームのためのリゾルーションを設定する(620)前に、参照フレームのためのリゾルーションを設定する(630)。
カレント・フレームのためのリゾルーションを設定した後(620)、符号器はカレント・フレームをそのリゾルーションで符号化する(640)。符号化が完了した場合(650)、符号器は終了する。そうでない場合、符号器は符号化を継続する。
いくつかの実装では、符号器は、以下のリゾルーションのうち1つで選択的にフレームを符号化する。すなわち、1)最大リゾルーション、2)水平方向において2のファクタでダウン・サンプリングされたリゾルーション、3)垂直方向において2のファクタでダウン・サンプリングされたリゾルーション、または4)水平方向および垂直方向において2のファクタでダウン・サンプリングされたリゾルーション、である。別法として、符号器は、リゾルーションをある他のファクタ(例えば、2のべき乗ではないもの)により減らすかあるいは増したり、追加の使用可能なリゾルーションを有したり、あるいはある他のテクニックを使用してリゾルーションを設定したり、する。符号器は各フレームのためのリゾルーションを、元のイメージ・サイズに対して設定する。別法として、符号器はフレームのためのリゾルーションを、以前のフレームのリゾルーションまたは以前のリゾルーション設定に対して設定し、すなわち、符号器は、以前のリゾルーションに対してリゾルーションを漸進的に(progressively)変更する。
復号器は、符号化されたフレームを復号化し、必要な場合、フレームを表示前にアップ・サンプリングする。符号化されたフレームのリゾルーションのように、復号化されたフレームのリゾルーションを多数の異なる方法において調整することができる。
図5は、フレームのマルチ・リゾルーション復号化のためのテクニック(500)を示す。図3の復号器(300)などの復号器は、フレームのためのリゾルーションを設定する(510)。例えば、復号器はリゾルーション情報を符号器から得る。
次いで、復号器は、フレームをそのリゾルーションで復号化する(520)。復号化が完了した場合(530)、復号器は終了する。そうでない場合、復号器は次のフレームのためのリゾルーションを設定し(510)、復号化を継続する。別法として、復号器はリゾルーションをフレーム・レベル以外のあるレベルに設定する。
いくつかの実施形態では、復号器は予測フレームならびにイントラ・フレームを復号化する。図7は、イントラ・フレームおよび予測フレームのマルチ・リゾルーション復号化のためのテクニック(700)を示す。
最初に、復号器は、復号化されるカレント・フレームがIフレームであるかPフレームであるかをチェックする(710)。カレント・フレームがIフレームである場合、復号器はカレント・フレームのためのリゾルーションを設定する(720)。フレームがPフレームである場合、復号器は、カレント・フレームのためのリゾルーションを設定する(720)前に、参照フレームのためのリゾルーションを設定する(730)。
参照フレームのためのリゾルーションを設定した後(720)、復号器はカレント・フレームをそのリゾルーションで復号化する(740)。復号化が完了した場合(750)、復号器は終了する。そうでない場合、復号器は復号化を継続する。
復号器は通常、符号器で使用されたリゾルーション、例えば、上述のリゾルーションのうち1つでフレームを復号化する。別法として、復号器で使用可能なリゾルーションは、符号器で使用されたものと厳密に同じではない。
A.シグナリング
マルチ・リゾルーション符号化されたフレームを復号化するための十分な情報を復号器に提供するために、符号器はビット・ストリーム・シグナリングを使用する。例えば、符号器は、フレームのシーケンスがマルチ・リゾルーション符号化を使用して符号化されるかどうかを示し、かつ/または、シーケンス内で符号化されたフレームのリゾルーションを示すシグナルを、1つまたは複数のフラグまたはコードの形式で送信することができる。別法として、符号器はマルチ・リゾルーション符号化を、シーケンス・レベル以外のあるレベルで可能/不可能にし、かつ/またはリゾルーションをフレーム・レベル以外のあるレベルで設定する。
図8は、フレームのシーケンスをマルチ・リゾルーション符号化により符号化する際に、シグナルを送信するためのテクニック(800)を示す。符号器は次のシーケンス・ヘッダを入力として取り(810)、マルチ・リゾルーション符号化がこのシーケンスに対して可能にするべきであるかどうかを決定する(820)。
符号器が、マルチ・リゾルーション符号化をこのシーケンスに対して使用中でない場合、符号器は、そのシーケンスのシグナルをそれに応じて設定し(830)、そのシーケンス内のフレームを符号化する(840)。
符号器がマルチ・リゾルーション符号化を使用中である場合、符号器はシーケンスのシグナルをそれに応じて設定する(850)。次いで、符号器はそのシーケンス内のフレームを、そのフレームの水平および/または垂直リゾルーション用のスケーリング・ファクタを示すシグナルに従って、(例えば、図4または図6を参照して上述したように)符号化する。
符号化が完了した場合(870)、符号器は終了する。そうでない場合、符号器は次のシーケンスを符号化する。
いくつかの実施形態では、符号器は、マルチ・リゾルーション符号化がフレームのシーケンスのために可能にされるかどうかを示す1ビットを送信する。次いで、そのシーケンス内のフレームについて、IフレームおよびPフレームの各々について指定されたフィールドにおけるコードが、最大リゾルーション・フレームに対するそのフレームのリゾルーション用のスケーリング・ファクタを指定する。一実装では、そのコードは固定長コードである。表1は、スケーリング・ファクタが、RESPIC FLCというラベルが付けられたフィールドにおいてどのように符号化されるかを示している。
Figure 0004762486
別法として、符号器は、フレーム・リゾルーションへの調整をシグナルで送るもう1つの方法(例えば、可変長コード)を使用する。実装および可能なリゾルーションの数に応じて、符号器は追加のシグナル・コードまたはより少ない数のシグナル・コードを使用することができ、あるいは水平および垂直リゾルーションについて異なるコードを使用することができる。さらに、可能なリゾルーションの相対的確率に応じて、符号器はコードの長さを調整することができる(例えば、より短いコードを、最も可能性の高いリゾルーションに割り当てる)。さらに、符号器はシグナルを他の目的のために使用することができる。例えば、符号器はシグナル(例えば、固定または可変長コード)を使用して、複数のフィルタが使用可能である状況においてどのフィルタが再サンプリングのために使用されるべきであるかを示すことができる。符号器はこのようなシグナルを使用して、使用可能な、あらかじめ定義されたフィルタまたはカスタム・フィルタのうちどちらを再サンプリングにおいて使用するべきであるかを示すことができる。
シグナルを送信することによって、符号器は復号器に、マルチ・リゾルーション符号化されたフレームを復号化するために有用な情報を提供する。復号器はシグナルを構文解析して、符号化されたフレームがどのように復号化されるべきであるかを決定する。例えば、復号器は、符号器によって送信されたコードを解釈して、フレームのシーケンスがマルチ・リゾルーション符号化を使用して符号化されているかどうかを決定し、かつ/または、シーケンス内の符号化されたフレームのリゾルーションを決定することができる。
図9は、符号化されたフレームのシーケンスをマルチ・リゾルーション復号化により復号化するとき、シグナルを受信および解釈するためのテクニック(900)を示す。復号器は次の符号化されたシーケンス・ヘッダを入力として取り(910)、このシーケンスに関連付けられたシグナルをチェックして、符号器がマルチ・リゾルーション符号化をこのシーケンスのために使用したかどうかを決定する(920)。
符号器がマルチ・リゾルーション符号化を使用しなかった場合、復号器は、そのシーケンス内のフレームを復号化する(930)。他方では、符号器がマルチ・リゾルーション符号化を使用した場合、復号器は、そのフレーム用の水平および/または垂直リゾルーションのスケーリング・ファクタを示すシグナルを構文解析する(940)。次いで、復号器は、そのフレームをそれに応じて(例えば、図5または図7を参照して上述したように)復号化する(950)。
復号化が完了した場合(960)、復号器は終了する。そうでない場合、復号器は次のシーケンスを復号化する。
B.ダウン・サンプリングおよびアップ・サンプリング
以下のセクションでは、いくつかの実装におけるアップ・サンプリングおよびダウン・サンプリングのプロセスを説明する。他の実装は、異なるアップ・サンプリング、ダウン・サンプリングまたはフィルタリング・テクニックを使用する。例えば、代替実施形態では、符号器は、非線形フィルタまたは空間的に変化するフィルタ・バンクを使用して、フレームを符号化することができる。
表2は、符号器および/または復号器によって、フレームのダウン・サンプリング/アップ・サンプリングのために使用される変数定義を示している。これらの定義は、ダウン・サンプリングおよびアップ・サンプリングの実施例のための擬似コードについての以下の説明で使用される。
表2:いくつかの実装におけるダウン・サンプリング/アップ・サンプリングのための変数定義
=アップ・サンプリングされた(最大リゾルーション)ライン内のサンプルの数
=ダウン・サンプリングされた(半リゾルーション)ライン内のサンプルの数
[n]=位置nでアップ・サンプリングされたサンプル値、ただしn=0,1,2…N−1
[n]=位置nでダウン・サンプリングされたサンプル値、ただしn=0,1,2…N−1
「ライン」という用語は、Y、CrまたはCbのコンポーネント平面における水平−行または垂直−列におけるサンプル群を指す。以下の実施例では、アップ・サンプリングおよびダウン・サンプリング・オペレーションが行および列の両方について等しく、したがって、1次元のラインのサンプルを使用して例示される。垂直および水平のアップ・サンプリングまたはダウン・サンプリングが実行される場合、水平ラインが最初に再サンプリングされ、後に垂直ラインが続く。別法として、水平および垂直フィルタリングが同時にピクセルのブロック上で、異なるフィルタを使用して実施される。
表3は、ルミナンス線の再サンプリングのための擬似コードを示し、表4は、クロミナンス・ラインの再サンプリングのための擬似コードを示している。
表3:いくつかの実装におけるルミナンス線の再サンプリングのための擬似コード
Nd=Nu/2(ただし、Nは最大リゾルーションのルミナンス・ラインにおけるサンプルの数)
if((Nd & 15)!=0)
Nd=Nd+16-(Nd & 15)
表4:いくつかの実施態様におけるクロミナンス線の再サンプリングのための擬似コード
Nd=Nu/2(ただし、Nは最大リゾルーションのクロミナンス・ラインにおけるサンプルの数)
if((Nd & 7)!=0)
Nd=Nd+8-(Nd & 7)
再サンプリングは、ダウン・サンプリングされたラインについてのサンプルの数を設定する。次いで、(4:2:0または類似のマクロブロックにより動作する符号器では)再サンプリングがラインにおけるサンプルの数を調整し、このラインがルミナンス・ライン用のマクロブロックの倍数(すなわち、16の倍数)、またはクロミナンス・ライン用のブロックの倍数(すなわち、8の倍数)であるように、する。
1.ダウン・サンプリング・フィルタ
ラインのダウン・サンプリングは、表5の擬似コードに従って出力を生成する。
表5:いくつかの実装におけるラインのダウン・サンプリングのための擬似コード
if (Nd!=(Nu/2))
{
for (i=Nu;i<Nd*2;i++)
xu[i]=xu[Nu-1]
}
downsamplefilter_line(xu[])
for (i=0;i<Nd;i++)
xd[i]=xu[i*2]
downsamplefilter_line()において使用される6タップ・フィルタのためのコードを、図10に示す。
図10では、イメージが水平方向においてフィルタリングされるとき、RND_DOWNが値64に設定され、イメージが垂直方向においてフィルタリングされるとき、値63に設定される。
2.アップ・サンプリング・フィルタ
ラインのアップ・サンプリングは、表6の擬似コードに従って出力を生成する。
表6:いくつかの実装におけるラインのアップ・サンプリングのための擬似コード
for (i=0;i<Nu;i++)
{
xu[i]=xd[i*2]
xu[i+1]=0
}
upsamplefilter_line(xu[])
upsamplefilter_line()において使用される10タップ・フィルタのためのコード例を、図11に示す。図11では、イメージが水平方向においてフィルタリングされるとき、RND_UPが15に設定され、イメージが垂直方向においてフィルタリングされるとき、16に設定される。
他のフィルタのペアも再サンプリングのために使用することができる。フィルタのペアを、ビデオのコンテンツおよび/または目標ビットレートに調整することができる。符号器は、フィルタの選択を副情報として復号器に送信することができる。
C.新しいフレーム・ディメンションの計算
表7の擬似コードは、符号器が、ダウン・サンプリングされたフレームのための新しいフレーム・ディメンション(dimensions:大きさ、寸法)を計算する方法を例示している。
表7:ダウン・サンプリング後に新しいフレーム・ディメンションを計算するための擬似コード
X=水平ディメンション、元のリゾルーションにおけるサンプルの数
Y=垂直ディメンション、元のリゾルーションにおけるサンプルの数
x=新しい水平リゾルーション
y=新しい垂直リゾルーション
hscale=水平スケーリング・ファクタ(0=最大リゾルーション、1=半リゾルーション)
vscale=垂直スケーリング・ファクタ(0=最大リゾルーション、1=半リゾルーション)
x=X
y=Y
if (hscale==1)
{
x=X/2
if ((x & 15)!=0)
x=x+16-(x & 15)
}
if (vscale==1)
{
y=Y/2
if ((y & 15)!=0)
y=y+16-(y & 15)
}
表7に示すテクニックを使用した実装では、符号器が新しいフレーム・ディメンションを計算し、これは、元の・ディメンションを2のファクタでダウン・サンプリングすること、および次いで、新しい・ディメンションがマクロブロック・サイズの整数の倍数(16の倍数)であるように、端数を切り上げる。クロミナンス・ラインについて、符号器は、ディメンションを、ブロック・サイズの整数の倍数(8の倍数)となるように切り上げる。新しいディメンションの切り上げにより、ダウン・サンプリングされたフレームを、4:2:0または類似のマクロブロック・フォーマットを使用するビデオ符号器/復号器によって、符号化することができる。
D.他に取りうる方法(alternatives)
上述の様々な選択肢(alternatives)と共に、あるいはこれらに加えて、符号器および復号器は以下のように動作することができる。
マルチ・リゾルーション・フレームワークを、個々のフレームまたは一連のフレームについてのいくつかのレベルのダウン・サンプリングに拡張することができる。いくつかのレベルのダウン・サンプリングを使用することにより、符号器が高リゾルーション・フレームを比較的低いビットレートで符号化するとき、再構築されたフレームの品質を改善することができる。
符号器は、元のリゾルーションに関係したリゾルーションを2のファクタで調整することによって達成されるリゾルーション以外のリゾルーションにフレームを再サンプリングするマルチレート・フィルタリング・テクニックを使用することができる。例えば、分数比サンプリング(fractional-rate sampling)は、複雑さが増すという代償を払って、より順調なトレードオフを、高い周波数の細部の保持とブロッキング・アーティファクトの低減との間で提供することができる。
符号器は、異なるレベルの再サンプリングをフレームの異なる部分に適用することができる。例えば、符号器は、フレームのうち高い周波数コンテンツがほとんどない領域を、ダウン・サンプリングされたリゾルーションで符号化することができると同時に、符号器は、フレームのうち強い高い周波数コンテンツを有するエリアを元のリゾルーションで符号化することができる。さらに、符号器は異なるフィルタを、フレームの異なる部分を再サンプリングするために、あるいは垂直および水平再サンプリングのために適用することができる。符号器はシグナリングを使用して、異なる再サンプリングレベル、および/または、フレームの異なる部分を再サンプリングするために使用された異なるフィルタを示すことができる。
本発明の原理を、様々な上述の実施形態を参照して説明し、例示したが、上述の実施形態を構成および詳細において、このような原理から逸脱することなく修正できることは理解されよう。本明細書で説明したプログラム、プロセスまたは方法は、特に断らない限り、いかなる特定のタイプのコンピューティング環境にも関係せず、あるいは限定されないことを理解されたい。様々なタイプの汎用または専用コンピューティング環境は、本明細書で説明した教示によるオペレーションと共に使用することができ、あるいはこれを実行することができる。ソフトウェアにおいて示した上述の実施形態の要素をハードウェアに実装することができ、その逆も可能である。
本発明の原理を適用することができる多数の可能な実施形態に鑑みて、本発明として、付属の特許請求の範囲およびその同等物の範囲および趣旨内に入る可能性のあるこのようなすべての実施形態を主張する。
説明する実施形態を実装することができる、適切なコンピューティング環境のブロック図である。 説明する実施形態を実装することができる、ビデオ符号器のブロック図である。 説明する実施形態を実装することができる、ビデオ復号器のブロック図である。 フレームのマルチ・リゾルーション符号化のための汎用化されたテクニックを示す流れ図である。 フレームのマルチ・リゾルーション復号化のための汎用化されたテクニックを示す流れ図である。 イントラ・フレームおよび予測フレームのマルチ・リゾルーション符号化のためのテクニックを示す流れ図である。 イントラ・フレームおよび予測フレームのマルチ・リゾルーション復号化のためのテクニックを示す流れ図である。 フレームのシーケンスをマルチ・リゾルーション符号化により符号化するとき、シグナルを送信するためのテクニックを示す流れ図である。 符号化されたフレームのシーケンスをマルチ・リゾルーション復号化により復号化するとき、シグナルを受信および解釈するためのテクニックを示す流れ図である。 一実装例におけるダウン・サンプリング・フィルタのための擬似コードリストの図である。 一実装例におけるアップ・サンプリング・フィルタのための擬似コードリストの図である。
符号の説明
200 符号器
205 カレント・フレーム
210 リゾルーション変換器
215 マルチ・リゾルーション・パラメータ
225 参照フレーム
230 リゾルーション変換器
240 他の符号器モジュール
245 動きベクトル、残差など
300 復号器
305 カレント・フレーム
310 リゾルーション変換器
315 マルチ・リゾルーション・パラメータ、復号化されたフレーム
325 参照フレーム
330 リゾルーション変換器
340 他の復号器モジュール
345 動きベクトル、残差など

Claims (39)

  1. ビデオ・フレームのシーケンスのビットストリームを復号化するための方法であって、
    前記シーケンスについての第1の情報であって、前記ビットストリーム中に第2の情報が存在するかどうかを示す第1の情報を受信することと、
    前記第1の情報に基づいて前記ビットストリーム中に前記第2の情報が存在することを判定することと、その後、前記判定することに応じて、空間リゾルーションのスケーリング・ファクタに基づいて前記シーケンスの複数フレームを復号化するために、前記シーケンスの複数フレームの各々について、前記ビットストリーム中のフレーム・レベルでの第2の情報であって、前記フレームについて1または複数の空間リゾルーションのスケーリング・ファクタを示す第2の情報を受信することと、
    前記スケーリング・ファクタを使用して前記複数フレームをマルチ空間リゾルーション復号化することとを備え、
    前記複数フレームは、少なくとも1つのIフレームおよび少なくとも1つのPフレームを備え、前記少なくとも1つのPフレームの各々は、前記少なくとも1つのIフレームのうち参照Iフレームを有し、前記少なくとも1つのPフレームを復号化する目的のために、前記少なくとも1つのPフレームの各々について、当該Pフレームについての前記1または複数の空間リゾルーションのスケーリング・ファクタは、当該Pフレームの参照Iフレームについての前記1または複数の空間リゾルーションのスケーリング・ファクタと同一であるように制約されることを特徴とする方法。
  2. 前記1または複数の空間リゾルーションのスケーリング・ファクタは、少なくとも部分的に、ビットレート基準に基づいて適応して決定されることを特徴とする請求項1に記載の方法。
  3. 前記1または複数の空間リゾルーションのスケーリング・ファクタは、少なくとも部分的に、高い周波数コンテンツの基準に基づいて適応して決定されることを特徴とする請求項1に記載の方法。
  4. 前記1または複数の空間リゾルーションのスケーリング・ファクタは、少なくとも部分的に、量子化ステップ・サイズ基準に基づいて適応して決定されることを特徴とする請求項1に記載の方法。
  5. 前記第2の情報は、固定長コードであることを特徴とする請求項1に記載の方法。
  6. 前記固定長コードは、前記1または複数の空間リゾルーションのスケーリング・ファクタの4つの可能な状態を表す2ビット・コードであることを特徴とする請求項5に記載の方法。
  7. 前記第2の情報は、可変長コードであることを特徴とする請求項1に記載の方法。
  8. 前記第1の情報は、シーケンス・ヘッダにおいてシグナルされることを特徴とする請求項1に記載の方法。
  9. 前記第1の情報は、前記シーケンス・ヘッダにおける1ビット・コードであることを特徴とする請求項8に記載の方法。
  10. 前記ビットストリーム中の第3の情報であって、選択された再サンプリング・フィルタを示す第3の情報を受信することをさらに備えることを特徴とする請求項1に記載の方法。
  11. 前記1または複数の空間リゾルーションのスケーリング・ファクタは、垂直空間リゾルーションのスケーリング・ファクタおよび水平空間リゾルーションのスケーリング・ファクタを備えることを特徴とする請求項1に記載の方法。
  12. 前記垂直空間リゾルーションのスケーリング・ファクタは、前記水平空間リゾルーションのスケーリング・ファクタと異なることを特徴とする請求項11に記載の方法。
  13. 前記垂直空間リゾルーションのスケーリング・ファクタは、フルのリゾルーションおよび半分のリゾルーションを含む垂直空間リゾルーションのセットから選択されることを特徴とする請求項11に記載の方法。
  14. 前記水平空間リゾルーションのスケーリング・ファクタは、フルのリゾルーションおよび半分のリゾルーションを含む水平空間リゾルーションのセットから選択されることを特徴とする請求項11に記載の方法。
  15. 前記第2の情報によって示される前記空間リゾルーションのスケーリング・ファクタに従ってマルチ空間リゾルーション復号化で前記複数フレームを復号化することと、
    前記複数フレームを表示することと
    をさらに備えることを特徴とする請求項1に記載の方法。
  16. 前記マルチ空間リゾルーション復号化で復号化することは、
    低減した空間リゾルーションで符号化された前記複数フレームのカレント・フレームを復号化することと、
    前記カレント・フレームを復号化した後、前記カレント・フレームをアップ・サンプリングすることであって、前記アップ・サンプリングはフルのリゾルーションの復号化されたフレームを生じることと
    を備えることを特徴とする請求項15に記載の方法。
  17. 前記アップ・サンプリングすることは、前記復号化されたカレント・フレームに10タップ・フィルタを適用することを備えることを特徴とする請求項16に記載の方法。
  18. 前記低減した空間リゾルーションでの表示されたカレント・フレームは、低減したブロッキング・アーティファクトを備えることを特徴とする請求項16に記載の方法。
  19. ビデオ・フレームのシーケンスのビットストリームであって、複数レベルを有するビットストリームを符号化する方法であって、
    前記シーケンスについての第1の情報であって、前記ビットストリーム中に第2の情報が存在するかどうかを示す第1の情報を出力することと、
    前記第1の情報によって示されるように、前記ビットストリーム中に前記第2の情報が存在することを判定することと、その後、前記判定することに応じて、空間リゾルーションのスケーリング・ファクタに基づいて前記シーケンスの複数フレームを符号化するために、前記シーケンスの複数フレームの各々について、前記ビットストリーム中のフレーム・レベルでの第2の情報であって、前記フレームについて1または複数の空間リゾルーションのスケーリング・ファクタを示す第2の情報を出力すること、
    前記スケーリング・ファクタを使用して前記複数フレームについてのマルチ空間リゾルーション符号化されたデータを出力することとを備え、
    前記複数フレームは、少なくとも1つのIフレームおよび少なくとも1つのPフレームを備え、前記少なくとも1つのPフレームの各々は、前記少なくとも1つのIフレームのうち参照Iフレームを有し、前記少なくとも1つのPフレームを符号化する目的のために、前記少なくとも1つのPフレームの各々について、当該Pフレームについての前記1または複数の空間リゾルーションのスケーリング・ファクタは、当該Pフレームの参照Iフレームについての前記1または複数の空間リゾルーションのスケーリング・ファクタと同一であるように制約されることを特徴とする方法。
  20. 前記第2の情報は、固定長コードであることを特徴とする請求項19に記載の方法。
  21. 前記固定長コードは、前記1または複数の空間リゾルーションのスケーリング・ファクタの4つの可能な状態を表す2ビット・コードであることを特徴とする請求項20に記載の方法。
  22. 前記第2の情報は、可変長コードであることを特徴とする請求項19に記載の方法。
  23. 前記第1の情報は、シーケンス・ヘッダにおいてシグナルされることを特徴とする請求項19に記載の方法。
  24. 前記第1の情報は、前記シーケンス・ヘッダにおける1ビット・コードであることを特徴とする請求項23に記載の方法。
  25. 前記ビットストリーム中の第3の情報であって、選択された再サンプリング・フィルタを示す第3の情報を出力することをさらに備えることを特徴とする請求項19に記載の方法。
  26. 前記1または複数の空間リゾルーションのスケーリング・ファクタは、垂直空間リゾルーションのスケーリング・ファクタおよび水平空間リゾルーションのスケーリング・ファクタを備えることを特徴とする請求項19に記載の方法。
  27. 前記垂直空間リゾルーションのスケーリング・ファクタは、前記水平空間リゾルーションのスケーリング・ファクタと異なることを特徴とする請求項26に記載の方法。
  28. 前記垂直空間リゾルーションのスケーリング・ファクタは、フルのリゾルーションおよび半分のリゾルーションを含む垂直空間リゾルーションのセットから選択されることを特徴とする請求項26に記載の方法。
  29. 前記水平空間リゾルーションのスケーリング・ファクタは、フルのリゾルーションおよび半分のリゾルーションを含む水平空間リゾルーションのセットから選択されることを特徴とする請求項26に記載の方法。
  30. 前記1または複数の空間リゾルーションのスケーリング・ファクタは、少なくとも部分的に、ビットレート基準に基づいて適応して決定されることを特徴とする請求項19に記載の方法。
  31. 前記1または複数の空間リゾルーションのスケーリング・ファクタは、少なくとも部分的に、高い周波数コンテンツの基準に基づいて適応して決定されることを特徴とする請求項19に記載の方法。
  32. 前記1または複数の空間リゾルーションのスケーリング・ファクタは、少なくとも部分的に、量子化ステップ・サイズ基準に基づいて適応して決定されることを特徴とする請求項19に記載の方法。
  33. 前記第2の情報によって示される前記空間リゾルーションのスケーリング・ファクタに従ってマルチ空間リゾルーション符号化で前記複数フレームを符号化することをさらに備えることを特徴とする請求項19に記載の方法。
  34. 前記複数フレームのカレント・フレームをダウン・サンプリングすることであって、前記ダウン・サンプリングは低減したリゾルーションのフレームを生じることをさらに備えることを特徴とする請求項33に記載の方法。
  35. 前記ダウン・サンプリングすることは、前記カレント・フレームに6タップ・フィルタを適用することを備えることを特徴とする請求項34に記載の方法。
  36. 前記ダウン・サンプリングすることは、垂直方向でダウン・サンプリングするのに先立って水平方向でダウン・サンプリングすることを備えることを特徴する請求項34に記載の方法。
  37. 前記複数フレームのカレント・フレームは、複数ラインを含み、前記カレント・フレームについての前記マルチ空間リゾルーション符号化は、前記複数ラインの各々におけるサンプルの数を、前記数がマクロブロックの倍数となるように調節することを含むことを特徴する請求項19に記載の方法。
  38. ビデオ・フレームのシーケンスのビットストリーム中の第1の情報であって、前記ビットストリーム中に第2の情報が存在するかどうかを示す第1の情報を受信する手段と、
    前記ビットストリーム中に前記第2の情報が存在することを前記第1の情報が示す場合、前記シーケンスの複数フレームの各々について前記ビットストリーム中のフレーム・レベルでの第2の情報であって、1または複数の空間リゾルーションのスケーリング・ファクタを示す第2の情報を受信し、前記スケーリング・ファクタを使用して前記複数フレームをマルチ空間リゾルーション復号化する手段であって、前記複数フレームは、少なくとも1つのIフレームおよび少なくとも1つのPフレームを備え、前記少なくとも1つのPフレームの各々は、前記少なくとも1つのIフレームのうち参照Iフレームを有し、前記少なくとも1つのPフレームの各々について、前記1または複数の空間リゾルーションのスケーリング・ファクタは、当該Pフレームの参照Iフレームについての前記1または複数の空間リゾルーションのスケーリング・ファクタと同一であるように制約される手段と
    を備えることを特徴とするシステム。
  39. ビデオ・フレームのシーケンスのビットストリーム中の第1の情報であって、前記ビットストリーム中に第2の情報が存在するかどうかを示す第1の情報を出力する手段と、
    前記ビットストリーム中に前記第2の情報が存在することを前記第1の情報が示す場合、前記シーケンスの複数フレームの各々について、前記ビットストリーム中のフレーム・レベルでの第2の情報であって、前記フレームについて1または複数の空間リゾルーションのスケーリング・ファクタを示す第2の情報を出力し、前記スケーリング・ファクタを使用して前記複数フレームについてマルチ空間リゾルーション符号化されたデータを出力する手段であって、前記複数フレームは、少なくとも1つのIフレームおよび少なくとも1つのPフレームを備え、前記少なくとも1つのPフレームの各々は、前記少なくとも1つのIフレームのうち参照Iフレームを有し、前記少なくとも1つのPフレームの各々について、前記1または複数の空間リゾルーションのスケーリング・ファクタは、当該Pフレームの参照Iフレームについての前記1または複数の空間リゾルーションのスケーリング・ファクタと同一であるように制約される手段と
    を備えることを特徴とするシステム。
JP2003309278A 2002-09-04 2003-09-01 マルチ・リゾルーション・ビデオ符号化および復号化 Expired - Lifetime JP4762486B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US40847702P 2002-09-04 2002-09-04
US60/408,477 2002-09-04

Publications (3)

Publication Number Publication Date
JP2004266794A JP2004266794A (ja) 2004-09-24
JP2004266794A5 JP2004266794A5 (ja) 2005-05-26
JP4762486B2 true JP4762486B2 (ja) 2011-08-31

Family

ID=33130514

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003309278A Expired - Lifetime JP4762486B2 (ja) 2002-09-04 2003-09-01 マルチ・リゾルーション・ビデオ符号化および復号化

Country Status (1)

Country Link
JP (1) JP4762486B2 (ja)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8964830B2 (en) * 2002-12-10 2015-02-24 Ol2, Inc. System and method for multi-stream video compression using multiple encoding formats
US9571857B2 (en) 2008-09-18 2017-02-14 Thomson Licensing Methods and apparatus for video imaging pruning
WO2011090798A1 (en) 2010-01-22 2011-07-28 Thomson Licensing Data pruning for video compression using example-based super-resolution
EP2526698A1 (en) 2010-01-22 2012-11-28 Thomson Licensing Methods and apparatus for sampling -based super resolution video encoding and decoding
EP2614643A1 (en) 2010-09-10 2013-07-17 Thomson Licensing Video encoding using example - based data pruning
WO2012033971A1 (en) 2010-09-10 2012-03-15 Thomson Licensing Recovering a pruned version of a picture in a video sequence for example - based data pruning using intra- frame patch similarity
US9544598B2 (en) 2010-09-10 2017-01-10 Thomson Licensing Methods and apparatus for pruning decision optimization in example-based data pruning compression

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000134618A (ja) * 1998-10-23 2000-05-12 Nippon Telegr & Teleph Corp <Ntt> 画像信号符号化方法と装置、及び画像信号復号方法と装置、及びこれらの方法を記録した記録媒体
US20020064226A1 (en) * 2000-09-29 2002-05-30 Sven Bauer Method and device for coding and decoding image sequences

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000134618A (ja) * 1998-10-23 2000-05-12 Nippon Telegr & Teleph Corp <Ntt> 画像信号符号化方法と装置、及び画像信号復号方法と装置、及びこれらの方法を記録した記録媒体
US20020064226A1 (en) * 2000-09-29 2002-05-30 Sven Bauer Method and device for coding and decoding image sequences

Also Published As

Publication number Publication date
JP2004266794A (ja) 2004-09-24

Similar Documents

Publication Publication Date Title
US7379496B2 (en) Multi-resolution video coding and decoding
US7602851B2 (en) Intelligent differential quantization of video coding
KR101213704B1 (ko) 가변 컬러 포맷 기반 동영상 부호화 방법 및 장치, 그복호화 방법 및 장치
JP4610195B2 (ja) スキップマクロブロックコード化
US8897360B2 (en) Method and apparatus for encoding and decoding images by adaptively using an interpolation filter
JP4704374B2 (ja) ビデオトランスコーディング方法及び装置
US7848426B2 (en) Motion vector estimation method and encoding mode determining method
US20050200757A1 (en) Method and apparatus for digital video reconstruction
US20100254450A1 (en) Video coding method, video decoding method, video coding apparatus, video decoding apparatus, and corresponding program and integrated circuit
US20060280372A1 (en) Multilayer-based video encoding method, decoding method, video encoder, and video decoder using smoothing prediction
JP2006333519A (ja) スケーラブルビデオコーディング及びデコーディング方法と装置
KR20100017453A (ko) 비디오 신호 처리 방법 및 장치
US20100086048A1 (en) System and Method for Video Image Processing
WO2013003726A1 (en) Block based adaptive loop filter
JP2001145113A (ja) 画像情報変換装置及び方法
JP2004032718A (ja) フェーディング推定/補償によりビデオフレームを処理するシステムおよび方法
US7502415B2 (en) Range reduction
KR20110065089A (ko) 영상의 부호화 방법 및 장치, 그 복호화 방법 및 장치
KR20060119736A (ko) 영상 신호의 인코딩 방법
KR101652183B1 (ko) Vlc 코드워드들을 이용한 코딩 구문 요소들
JP4762486B2 (ja) マルチ・リゾルーション・ビデオ符号化および復号化
KR20080067922A (ko) 영상 축소 기능을 갖는 영상 복호화 방법 및 장치
WO2006132509A1 (en) Multilayer-based video encoding method, decoding method, video encoder, and video decoder using smoothing prediction
KR100923029B1 (ko) 비디오 프레임의 재압축 방법
JP4153774B2 (ja) 動画像符号化方法とその復号化方法、およびそれらの装置

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040730

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060818

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20091208

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20100305

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20100310

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100407

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100924

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20101222

RD13 Notification of appointment of power of sub attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7433

Effective date: 20110113

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20110113

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110218

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110516

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110603

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110608

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140617

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

Ref document number: 4762486

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

EXPY Cancellation because of completion of term