JP2008512035A - 多階層ビデオコーディングおよびデコーディング方法、ビデオエンコーダおよびデコーダ - Google Patents

多階層ビデオコーディングおよびデコーディング方法、ビデオエンコーダおよびデコーダ Download PDF

Info

Publication number
JP2008512035A
JP2008512035A JP2007529675A JP2007529675A JP2008512035A JP 2008512035 A JP2008512035 A JP 2008512035A JP 2007529675 A JP2007529675 A JP 2007529675A JP 2007529675 A JP2007529675 A JP 2007529675A JP 2008512035 A JP2008512035 A JP 2008512035A
Authority
JP
Japan
Prior art keywords
frame
video
resolution
layer
coded
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2007529675A
Other languages
English (en)
Other versions
JP4660550B2 (ja
Inventor
ハン,ウ−ジン
リー,ベ−グン
チャ,サン−チャン
ハ,ホ−ジン
リー,ギョ−ヒョク
リー,ジェ−ヨン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Samsung Electronics Co Ltd
Original Assignee
Samsung Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from KR1020040090991A external-priority patent/KR100679018B1/ko
Application filed by Samsung Electronics Co Ltd filed Critical Samsung Electronics Co Ltd
Publication of JP2008512035A publication Critical patent/JP2008512035A/ja
Application granted granted Critical
Publication of JP4660550B2 publication Critical patent/JP4660550B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • H04N19/615Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding using motion compensated temporal filtering [MCTF]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/12Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/187Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a scalable video layer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/63Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/63Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets
    • H04N19/64Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets characterised by ordering of coefficients or of bits for transmission
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/13Adaptive entropy coding, e.g. adaptive variable length coding [AVLC] or context adaptive binary arithmetic coding [CABAC]

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Discrete Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

多階層ビデオコーディングおよびデコーディング方法と多階層ビデオエンコーダおよびデコーダを提供する。
本発明の一実施形態による多階層ビデオコーディング方法は、所定の解像度ビデオフレームを第1ビデオコーディング方式によってコーディングするステップと、前記第1ビデオコーディング方式によってコーディングされたフレームを参照して前記ビデオフレームを前記解像度と同じ解像度で第2ビデオコーディング方式によってコーディングするステップ、および前記第1および第2ビデオコーディング方式によってコーディングされたフレームを含むビットストリームを生成するステップを含む。

Description

本発明は、多階層ビデオコーディングアルゴリズムに関し、より詳しくは所定の解像度階層を複数のコーディングアルゴリズムによってコーディングする多階層ビデオコーディングアルゴリズムに関するものである。
インターネットを含む情報通信技術の発達につれて文字、音声だけでなく画像通信が増加している。既存の文字中心の通信方式では消費者の多様な欲求を充足させることができないため、文字、映像、音楽など多様な形態の情報を収容することができるマルチメディアサービスが増加している。マルチメディアデータはその量が膨大であるため、大容量の保存媒体を必要とし、伝送時に広い帯域幅を必要とする。例えば640*480の解像度を有する24bitトゥルーカラーのイメージは1フレーム当たり640*480*24bitの容量、すなわち約7.37Mbitのデータが必要である。これを1秒当たり30フレームで伝送する場合には221Mbit/secの帯域幅を必要とし、90分間上映される映画を保存するには約1200Gbitの保存空間を必要とする。従って文字、映像、オーディオを含むマルチメディアデータを伝送するためには圧縮コーディング技法を使用するのが必須である。
ビデオデータを圧縮する基本的な原理はデータの重複(冗長)をなくす過程である。イメージで同じ色やオブジェクトが繰り返されるような空間的重複、および動画フレームで隣接するフレーム間の変化がほとんどないような時間的重複、または人間の視覚および知覚能力が高い周波数に鈍感なことを考慮した心理視覚の重複をなくすことによってビデオデータを圧縮することができる。
図1はビデオ圧縮が適用される環境を示している。
ビデオデータはビデオエンコーダ110で圧縮される。現在知られているビデオ圧縮方式はMPEG−2、MPEG−4、H.263、H.264などがあり、このような圧縮方式はDCT(Discrete Cosine Transform)に基づく。一方、最近にはウェーブレット変換に基づくスケーラブルビデオコーディングに関する研究が活発になっている。圧縮されたビデオデータはネットワーク120を介してビデオデコーダ130に伝送される。ビデオデコーダ130は圧縮されたビデオデータをデコーディングしてビデオデータを復元する。
ビデオエンコーダ110はネットワーク120の帯域幅を超えないようにビデオデータを圧縮しなければ、圧縮されたビデオデータをビデオデコーダ130がデコーディングすることはできない。しかし、ネットワーク120の通信帯域幅はネットワークの種類によって異なる。例えばイーサネット(登録商標)を利用するときの通信帯域幅と、無線ランを利用するときの通信帯域幅とが異なる。また、セルラー通信網を利用する場合に通信帯域幅は非常に狭い。このため、1つの圧縮されたビデオデータから多様なビットレートの圧縮されたビデオデータを得ることができる方法、特にスケーラブルビデオコーディングに関する研究が活発である。
スケーラブルビデオコーディングはスケーラビリティを有するようにビデオデータをコーディングするビデオ圧縮方式を意味する。スケーラビリティとは、1つのビデオシーケンスを圧縮して得たビットストリームから解像度とフレームレートおよび画質を異にする多様なビデオシーケンスを復元することができる特性を意味する。時間的スケーラビリティはMCTF(Motion Compensation Temporal Filtering)、UMCTF(Unconstrained MCTF)、STAR(Successive Temporal Approximation and Referencing)などのアルゴリズムによって得ることができる。空間的スケーラビリティはウェーブレット変換アルゴリズムによって得ることができるが、最近には多階層技法に関する研究が活発である。SNR(信号対雑音比)スケーラビリティはEZW、SPIHT、EZBC、EBCOTのような量子化アルゴリズムによって得ることができる。
図2および図3は多階層ビデオストリーム構造の例を示している。
図2を参照すれば、多階層ビデオエンコーダは現在まで知られているコーディング効率が最高MPEG−4 AVC(Advanced Video Coding)アルゴリズムによって各階層をコーディングする。MPEG−4 AVCアルゴリズムはフレーム間の時間的重複を除去した後、DCT(Discrete Cosine Transform)方式によって時間的重複が除去されたフレームを変換させた後に量子化させる。
図2を参照すれば、階層は互いに解像度と、フレームレート、および伝送率のうち少なくともいずれか1つを異にする。ビデオコーディング過程は最低解像度とフレームレートおよび伝送率を有する基礎階層フレームをコーディングした後にコーディングされた基礎階層フレームを参照して向上階層をコーディングする。このようにAVCに基づく多階層ビデオコーディング方式は各階層でAVCに基づく技術が使用されるので優れたコーディング効率を有する。特に、AVCアルゴリズムによって使用されるイントラ予測とデブロッキング技術を利用すれば、ビデオコーディング過程で生じる大体のアーチファクトを除去することができる。また各階層はレート歪み(Rate−Distortion)の観点で最適化されている。しかし生成されたビットストリームはスケーラビリティ特性が柔軟でない。多階層のAVCビデオコーディング方式によって生成されたビットストリームでは微細単位スケーラビリティ(Fine Grain Scalability;以下、FGSという)を容易に具現できず、結合されたスケーラビリティ(combined scalability)特性を容易に得ることができない。それは各スケーラビリティが互いに従属しているためである。実際使用される階層が多い場合に図2の多階層コーディング方式はすべての階層に対するAVCコーディングを行わなければならない。
図3を参照すれば、最低解像度とフレームレートおよび伝送率を有する基礎階層をAVC方式によってコーディングした後に、コーディングされた基礎階層を参照して最高解像度とフレームレートおよび画質の階層をウェーブレットコーディング方式を利用してコーディングする。
図3を参照すれば、最高解像度とフレームレートおよび伝送率を有する階層をウェーブレットコーディング方式によってコーディングするため、十分なスケーラビリティ(full scalability)を有するビットストリームを得ることができる。また、最低解像度階層をAVC方式によってコーディングするため、ビットストリームによってビデオデコーダは最低解像度で満足できる画質のビデオフレームを再構成することができる。
図2と図3を比較すれば、図2のビットストリームはすべての階層に最適化されているものの、スケーラビリティの特性が弱く、図3はスケーラビリティの特性は良いものの、1つのウェーブレットコーディングされた階層から最低解像度のAVC階層を除外したすべての階層を再構成しなければならないため画質が劣る。
本発明は、詳述した問題点を解決するために案出されたものであって、本発明の目的はコーディング効率とスケーラビリティに優れた多階層ビデオコーディング方法およびデコーディング方法と多階層ビデオエンコーダおよびデコーダを提供することにその目的がある。
本発明の目的は、以上で言及した目的に制限されず、言及していないさらなる目的は下記によって当業者に明確に理解できるものである。
前記目的を達成するために、本発明の一実施形態による多階層ビデオコーディング方法は、(a)所定の解像度ビデオフレームを第1ビデオコーディング方式によってコーディングするステップと、(b)前記第1ビデオコーディング方式によってコーディングされたフレームを参照して、前記ビデオフレームを前記解像度と同じ解像度で第2ビデオコーディング方式によってコーディングするステップ、および(c)前記第1および第2ビデオコーディング方式によってコーディングされたフレームを含むビットストリームを生成するステップを含む。
前記目的を達成するために、本発明の他の実施形態による多階層ビデオコーディング方法は、(a)ビデオフレームをダウンサンプリングして低解像度ビデオフレームを生成するステップと、(b)前記低解像度ビデオフレームをビデオコーディングするステップと、(c)前記低解像度階層のコーディングされたフレームを参照して前記ビデオフレームをビデオコーディングするステップ、および(d)前記低解像度および高解像度階層のコーディングされたフレームを含むビットストリームを生成するステップを含み、前記(b)ステップは、(b1)前記低解像度ビデオフレームを第1ビデオコーディング方式によってコーディングするステップと、(b2)前記第1ビデオコーディング方式によってコーディングされたフレームを参照して前記低解像度ビデオフレームを第2ビデオコーディング方式によってコーディングするステップとを含む。
前記目的を達成するために、本発明のもう1つの実施形態による多階層ビデオコーディング方法は、(a)所定の解像度階層のビデオフレームを第1ビデオコーディング方式によってコーディングするステップと、(b)前記第1ビデオコーディング方式によってコーディングされたフレームを参照して前記ビデオフレームを前記コーディングされたフレームの解像度と同じ解像度で第2ビデオコーディング方式によってコーディングするステップ、および(c)すべての解像度階層のコーディングされたフレームを含むビットストリームを生成するステップを含み、前記(a)および(b)ステップはすべての解像度階層において低解像度階層から高解像度階層に循環的に行われる。
前記目的を達成するために、本発明の一実施形態による多階層ビデオエンコーダは高解像度ビデオフレームをダウンサンプリングして低解像度ビデオフレームを生成するダウンサンプラと、前記低解像度ビデオフレームをビデオコーディングする低解像度ビデオエンコーディング部と、前記低解像度ビデオエンコーディング部によって低解像度にコーディングされたフレームを参照して前記高解像度ビデオフレームをビデオコーディングする高解像度ビデオエンコーディング部、および前記低解像度にコーディングされたフレームおよび高解像度にコーディングされたフレームを含むビットストリームを生成するビットストリーム生成部を含み、前記低解像度ビデオエンコーディング部は低解像度ビデオフレームを第1ビデオコーディング方式によってコーディングし、前記第1ビデオコーディング方式によってコーディングされたフレームを参照して前記ビデオフレームを前記解像度と同じ解像度で第2ビデオコーディング方式によってコーディングして前記低解像度コーディングされたフレームを生成する。
前記目的を達成するために、本発明の一実施形態による多階層ビデオデコーディング方法は、(a)ビットストリームから第1および第2コーディングされたフレームを抽出するステップと、(b)前記第1コーディングされたフレームを第1ビデオデコーディング方式によってデコーディングして第1フレームを再構成するステップ、および(c)前記再構成された第1フレームを参照して前記情報から得た第2コーディングされたフレームを前記再構成された第1フレームと同じ解像度で第2ビデオデコーディング方式によってデコーディングして第2フレームを再構成するステップを含む。
前記目的を達成するために、本発明の他の実施形態による多階層ビデオデコーディング方法は、(a)ビットストリームから第1および第2コーディングされたフレームを抽出するステップと、(b)前記第1コーディングされたフレームを第1ビデオデコーディング方式によってデコーディングして第1フレームを再構成するステップと、(c)前記再構成された第1フレームと同じ解像度で前記第2コーディングされたフレームを第2ビデオデコーディング方式によってデコーディングして第2フレームを再構成するステップ、および(d)前記再構成された第1および第2フレームを加えてビデオフレームを再構成するステップを含む。
前記目的を達成するために、本発明のもう1つの実施形態による多階層ビデオデコーディング方法は、(a)ビットストリームから低解像度および高解像度階層のコーディングされたフレームを抽出するステップと、(b)前記低解像度階層のコーディングされたフレームをデコーディングして低解像度階層フレームを再構成するステップ、および(c)前記再構成された低解像度階層フレームを参照して前記情報から得た高解像度階層のコーディングされたフレームをデコーディングして高解像度階層フレームを再構成するステップを含み、前記低解像度階層のコーディングされたフレームは第1ビデオコーディング方式によってコーディングされたフレームと第2ビデオコーディング方式によってコーディングされたフレームで構成され、前記(b)ステップは、(b1)前記第1ビデオコーディング方式によってコーディングされたフレームを第1ビデオデコーディング方式によってデコーディングして第1フレームを再構成するステップと、(b2)前記再構成された第1フレームを参照して前記第2ビデオコーディング方式によってコーディングされたフレームを第2ビデオデコーディング方式によってデコーディングして第2フレーム(低解像度フレーム)を再構成するステップを含む。
前記目的を達成するために、本発明のもう1つの実施形態による多階層ビデオデコーディング方法は、(a)ビットストリームから低解像度および高解像度階層のコーディングされたフレームに関する情報を抽出するステップと、(b)前記情報から得た低解像度階層のコーディングされたフレームをデコーディングして低解像度階層フレームを再構成するステップ、および(c)前記再構成された低解像度階層フレームを参照して前記情報から得た高解像度階層のコーディングされたフレームをデコーディングして高解像度フレームを再構成するステップを含み、前記低解像度階層のコーディングされたフレームは第1ビデオコーディング方式によってコーディングされたフレームと第2ビデオコーディング方式によってコーディングされたフレームで構成され、前記(b)ステップは、(b1)前記第1ビデオコーディング方式によってコーディングされたフレームを第1ビデオデコーディング方式によってデコーディングして第1フレームを再構成するステップと、(b2)前記第2ビデオコーディング方式によってコーディングされたフレームを第2ビデオデコーディング方式によってデコーディングして第2フレームを再構成するステップ、および(b3)前記再構成された第1フレームおよび第2フレームを加えて低解像度ビデオフレームを再構成するステップを含む。
前記目的を達成するために、本発明のもう1つの実施形態による多階層ビデオデコーディング方法は、ビットストリームから低解像度および高解像度階層のコーディングされたフレームに関する情報を抽出し、前記情報から低解像度および高解像度階層のコーディングされたフレームをデコーディングしてビデオフレームを再構成する多階層ビデオデコーディング方法であって、各解像度階層のコーディングされたビデオフレームは第1ビデオコーディング方式によってコーディングされた第1フレームと第2ビデオコーディング方式によってコーディングされた第2フレームで構成され、(a)所定の解像度階層でコーディングされた第1フレームを第1ビデオデコーディング方式によってコーディングして第1フレームを再構成するステップ、および(b)前記再構成された第1フレームを参照して前記解像度階層でコーディングされた第2フレームを第2ビデオデコーディング方式によってデコーディングして第2フレームを再構成するステップを含み、前記(a)および(b)ステップはすべての解像度階層において低解像度階層から高解像度階層の順に循環的に行われる。
前記目的を達成するために、本発明のもう1つの実施形態による多階層ビデオデコーディング方法はビットストリームから低解像度および高解像度階層のコーディングされたフレームに関する情報を抽出し、前記情報から低解像度および高解像度階層のコーディングされたフレームをデコーディングしてビデオフレームを再構成する多階層ビデオデコーディング方法であって、各解像度階層のコーディングされたビデオフレームは第1ビデオコーディング方式によってコーディングされた第1フレームと第2ビデオコーディング方式によってコーディングされた第2フレームで構成され、(a)所定の解像度階層でコーディングされた第1フレームを第1ビデオデコーディング方式によってコーディングして第1フレームを再構成するステップと、(b)前記解像度階層でコーディングされた第2フレームを第2ビデオデコーディング方式によってデコーディングして第2フレームを再構成するステップ、および(c)前記再構成された第1および第2フレームを加えて前記解像度階層のフレームを再構成するステップを含み、前記(a)、(b)および(c)ステップはすべての解像度階層において低解像度階層から高解像度階層の順に循環的に行われる。
前記目的を達成するために、本発明の一実施形態による多階層ビデオデコーダはビットストリームを解析して高解像度および低解像度階層のコーディングされたフレームを抽出するビットストリーム解析部と、前記低解像度コーディングされたフレームをデコーディングする低解像度ビデオデコーディング部、および前記低解像度ビデオデコーディング部によって再構成された低解像度フレームを参照して前記高解像度階層のコーディングされたフレームをデコーディングする高解像度ビデオデコーディング部を含み、前記低解像度ビデオデコーディング部は前記低解像度階層のコーディングされたフレームを構成する第1コーディングされたフレームを第1ビデオデコーディング方式によってデコーディングし、前記第1ビデオデコーディング方式によってデコーディングされた第1フレームを参照して、前記低解像度階層のコーディングされたフレームを構成する第2コーディングされたフレームを第2ビデオデコーディング方式によってデコーディングして前記低解像度フレームを再構成する。
その他、実施形態の具体的な事項は詳細な説明および図面に含まれている。
本発明の実施形態によれば、所定の解像度階層を互いに異なる特性を有する複数のビデオコーディング方式によってコーディングして、スケーラビリティに優れつつビデオコーディング効率が良いビデオコーディングを行うことができる。
本発明の利点および特徴、そしてそれらを達成する方法は添付する図面とともに詳細に後述する実施形態を参照すれば明確になる。しかし、本発明は以下に開示される実施形態に限定されず、相異なる多様な形態によって具現でき、単に本実施形態は本発明の開示を完全なものにし、本発明の属する技術分野における通常の知識を有する者に発明の範疇を完全に知らせるために提供するものであって、本発明は請求項の範疇によってのみ定義される。
以下、添付する図面を参照して本発明の実施形態を説明する。
図4は本発明の一実施形態による多階層ビデオコーディングによって生成されたビットストリームの構造を示す図面である。
本実施形態でビットストリームは解像度毎に2つの階層を有する。1つはAVC方式によってコーディングされた階層であり、もう1つはウェーブレットコーディング方式によってコーディングされた階層である。本明細書でAVCコーディングまたはAVC階層はAVCアルゴリズムのDCT変換と量子化を採用したコーディングまたは階層を意味し、ウェーブレットコーディング方式またはウェーブレット階層はウェーブレット変換と埋め込み量子化を採用したコーディングまたは階層を意味する。生成されたビットストリームが時間的スケーラビリティを有するようにするために、AVCコーディングとウェーブレットコーディングはすべてMCTF、UMCTF、またはSTARのように時間的スケーラビリティを有するアルゴリズムを採用する。
各解像度でAVC階層はAVC階層の解像度−時間−画質(spatio−temporal−quality)の面でコーディング効率を保障する反面、ウェーブレット階層はFGS特徴を保障する。プレデコーダはウェーブレット階層のビットストリームの一部を単に切り取ることによってAVC階層とウェーブレット階層の間の画質を有するビットストリームを生成することができる。また多階層でも切り取り過程は同様に適用することができる。
例えば、図4のビットストリームでプレデコーダはQCIF解像度を有する32〜64kbpの画質を有するビットストリームを生成することができる。このために、プレデコーダはCIFおよびSD解像度階層をすべて切り取り、QCIF解像度のウェーブレット階層の一部または全部を切り取れば良い。
このように多階層ビットストリームを生成するためのビデオエンコーダの例は図5を参照して説明する。便宜上、2つの解像度階層を有するビデオエンコーダを説明するが、これは例示的なものである。
図5は本発明の一実施形態による多階層ビデオエンコーダの構成を示すブロック図である。多階層ビデオエンコーダはダウンサンプラ550と、低解像度階層のビデオコーディングのためのAVCコーディング部510およびウェーブレットコーディング部520と、高解像度階層のビデオコーディングのためのAVCコーディング部530およびウェーブレットコーディング部540と、ビットストリームを生成するビットストリーム生成部560を含む。
ダウンサンプラ550はビデオフレームをダウンサンプリングして低解像度ビデオフレームを生成する。
多階層ビデオエンコーダは各解像度階層毎に2つのコーディング部を有する。1つはAVCコーディング部であり、もう1つはウェーブレットコーディング部である。すなわち低解像度階層のコーディングのために、多階層ビデオエンコーダはAVCコーディング部510とウェーブレットコーディング部520とを含み、高解像度階層のコーディングのために多階層ビデオエンコーダはAVCコーディング部530とウェーブレットコーディング部540とを含む。
ビットストリーム生成部560は低解像度および高解像度階層のコーディングされたフレームを含むビットストリームを生成する。
ビットストリームを生成する過程は次の通りである。
まず、ダウンサンプラ550はビデオフレーム500をダウンサンプリングして解像度が半分である低解像度ビデオフレームを生成する。生成された低解像度ビデオフレームは低解像度階層のAVCコーディング部510とウェーブレットコーディング部520に提供され、ビデオフレーム500は高解像度階層のAVCコーディング部530とウェーブレットコーディング部540に提供される。
低解像度階層のAVCコーディング部510は低解像度フレームの時間的重複を除去し、時間的重複が除去された低解像度フレームをDCT変換して、DCT変換された低解像度フレームを量子化してコーディングする。このために、AVCコーディング部510は時間的フィルタリング部511とDCT変換部512および量子化部513を含む。低解像度階層のAVCコーディングされたデータは低解像度ウェーブレットコーディング過程に提供される。
低解像度階層のウェーブレットコーディング部520は低解像度階層のAVCコーディングされたフレームを参照して低解像度フレームの時間的重複を除去し、時間的重複が除去された低解像度フレームをウェーブレット変換して、ウェーブレット変換された低解像度フレームを量子化してコーディングする。このために、ウェーブレットコーディング部520は時間的フィルタリング部521とウェーブレット変換部522および量子化部523を含む。低解像度階層のウェーブレットコーディングされたデータは高解像度AVCコーディング過程に提供される。
高解像度階層のAVCコーディング部530は低解像度階層のウェーブレットコーディングされたフレームを参照して高解像度フレームの時間的重複を除去し、時間的重複が除去された高解像度フレームをDCT変換して、DCT変換された高解像度フレームを量子化してコーディングする。このために、AVCコーディング部530は時間的フィルタリング部531とDCT変換部532および量子化部533を含む。高解像度階層のAVCコーディングされたデータは高解像度ウェーブレットコーディング過程に提供される。
高解像度階層のウェーブレットコーディング部540は高解像度階層のAVCコーディングされたフレームを参照して高解像度フレームの時間的重複を除去し、時間的重複が除去された高解像度フレームをウェーブレット変換して、ウェーブレット変換された高解像度フレームを量子化してコーディングする。このために、ウェーブレットコーディング部520は時間的フィルタリング部521とウェーブレット変換部522および量子化部523を含む。
ビットストリーム生成部560は低解像度階層のAVCコーディングされたフレームとウェーブレットコーディングされたフレーム、および高解像度階層のAVCコーディングされたフレームとウェーブレットコーディングされたフレームを含むビットストリームを生成する。ビットストリームはコーディングされたフレームに関する情報の外にもシーケンスヘッダ、GOP(Group Of Picture)ヘッダ、フレームヘッダなどのヘッダ情報と時間的フィルタリング過程から得た動きベクトルのような他の情報をさらに含む。
生成されたビットストリームはプレデコーダ(図示せず)でプレデコーディングされて多階層ビデオデコーダに伝送される。例えば、携帯電話やPDAのように小さいディスプレイ画面を有するデバイスのためにプレデコーダはビットストリームで高解像度階層を切り取って(truncating)低解像度階層のコーディングされたフレームのみ含むビットストリームを生成することができる。またプレデコーダはネットワーク状態が良くない場合にビットストリームの一部を切り取って低いビットレートを有するビットストリームを生成することができる。一方、要求されるフレームレートが少ない場合にプレデコーダはビットストリームで一部フレームを切り取って低いフレームレートを有するビットストリームを生成することができる。
図6は多階層ビデオエンコーディング過程を示すフローチャートである。
まず、多階層ビデオエンコーダにビデオフレームが入力される(S610)。多階層ビデオエンコーダは入力されたビデオフレームをダウンサンプリングする(S620)。一実施形態において、多階層ビデオエンコーダはダウンサンプリング過程でMPEGダウンサンプラを利用する。それはMPEGダウンサンプラが現在まで知られているウェーブレットダウンサンプラに比べてダウンサンプリングされた低解像度イメージが柔らかいためである。しかし、これは例示的なものであって、ダウンサンプリングされたイメージを得ることができるフィルタであればいずれも使用可能である。解像度階層が3つのビットストリームを生成するには、多階層ビデオエンコーダは入力されたビデオフレームをダウンサンプリングして1/2、および1/4解像度にダウンサンプリングされた低解像度フレームを生成する。解像度階層が4つのビットストリームを生成するには、多階層ビデオエンコーダは入力されたビデオフレームをダウンサンプリングして1/2、1/4および1/8解像度にダウンサンプリングされた低解像度フレームを生成する。
多階層ビデオエンコーダは低解像度ビデオフレームをAVC方式によってコーディングする(S630)。それから低解像度のAVC方式によってコーディングされたビデオフレームを参照して低解像度ビデオフレームをウェーブレットコーディング方式によってコーディングする(S640)。例えば、解像度がQCIFで、フレームレートが15Hzで、ビットレートが32kbpsになるようにAVCコーディングを行った後に、AVCコーディングされたフレームを参照して同じ解像度とフレームレートを有し、ビットレートが64kbpsになるようにウェーブレットコーディングを行う。
多階層ビデオエンコーダは低解像度フレームをコーディングしてから低解像度階層のコーディングされたフレームを参照して高解像度フレームをコーディングする。
具体的に、多階層ビデオエンコーダは高解像度ビデオフレームをAVC方式によってコーディングする(S650)。それから多階層ビデオエンコーダはAVC方式によってコーディングされたビデオフレームを参照して高解像度ビデオフレームをウェーブレットコーディング方式によってコーディングする(S660)。例えば、多階層ビデオエンコーダは解像度がCIFで、フレームレートが30Hzで、ビットレートが256kbpsになるようにAVCコーディングを行った後に、QCIF解像度のAVC方式によってコーディングされたビデオフレームとウェーブレットコーディング方式によってコーディングされたビデオフレームおよびCIF解像度のAVCコーディングされたフレームを参照してCIF解像度と30Hzのフレームレートを有し、ビットレートが750kbpsになるようにウェーブレットコーディング過程を行う。
すべての解像度に対してビデオコーディングが終了すれば、多階層ビデオエンコーダはコーディングされたビデオフレームを利用してビットストリームを生成する(S670)。
具体的な多階層ビデオコーディング過程の例は図7および図8を参照して説明する。便宜上、2つの解像度階層をコーディングする場合を説明し、3つ以上の解像度階層の場合も同じ方式によってコーディングすることができる。
まず、図7の実施形態を説明する。
多階層ビデオエンコーダはビデオフレーム700をダウンサンプリングして低解像度ビデオフレーム710を生成する。
多階層ビデオエンコーダは低解像度ビデオフレーム710をAVCコーディングしてビットストリームに含まれる低解像度階層のAVCコーディングされたフレームを生成する。それから多階層ビデオエンコーダは低解像度階層のAVCコーディングされたフレームをデコーディングしてデコーディングされたフレーム720を得、低解像度ビデオフレーム710と比較して低解像度差分フレーム730を得る。
多階層ビデオエンコーダは低解像度差分フレーム730をウェーブレットコーディングして低解像度階層のウェーブレットコーディングされたフレームを生成する。それから多階層ビデオエンコーダは低解像度階層のウェーブレットコーディングされたフレームをデコーディングしてデコーディングされたフレーム740を得、デコーディングされたフレーム720と合わせて低解像度階層のデコーディングされたビデオフレーム750を得る。
多階層ビデオエンコーダは低解像度階層のデコーディングされたビデオフレーム750をアップサンプリングし、アップサンプリングされたフレーム760とビデオフレーム700を比較して高解像度階層フレーム770を得る。多階層ビデオエンコーダは高解像度階層フレーム770をAVCコーディングしてビットストリームに含まれる高解像度階層のAVCコーディングされたフレームを生成する。それから多階層ビデオエンコーダは高解像度階層のAVCコーディングされたフレームをデコーディングしてデコーディングされたフレーム780を得、高解像度階層フレーム770と比較して高解像度差分フレーム780を得る。
多階層ビデオエンコーダは高解像度差分フレーム780をウェーブレットコーディングしてビットストリームに含まれる高解像度階層のウェーブレットコーディングされたフレームを生成する。
多階層ビデオエンコーダは生成された低解像度階層のAVCコーディングされたフレームおよびウェーブレットコーディングされたフレームと、高解像度階層のAVCコーディングされたフレームおよびウェーブレットコーディングされたフレームを含むビットストリームを生成する。
次に図8の実施形態を説明する。
まず、コーディング過程を説明する。多階層ビデオエンコーダは高解像度ビデオフレームをダウンサンプリングして低解像度ビデオフレームを生成する。多階層ビデオエンコーダは低解像度ビデオフレームをAVCコーディングし、低解像度階層のAVCコーディングされたビデオフレームを参照して低解像度階層のビデオフレームをウェーブレットコーディングする。
まず、N番目の低解像度ビデオフレーム812をコーディングするとき、低解像度ビデオフレーム811とビデオフレーム813を参照する。開放ループ方式のビデオコーディングで参照されるフレームは低解像度ビデオフレーム811,813であるが、閉鎖ループ方式のビデオコーディングで参照されるフレームは低解像度ビデオフレーム811,813をAVCコーディングした後に、コーディングされたフレームをデコーディングして再構成したフレームを参照する。
低解像度のAVCコーディングが終了すれば、多階層ビデオエンコーダは低解像度のウェーブレットコーディングを行う。多階層ビデオエンコーダはフレーム822をコーディングするとき、フレーム821とフレーム823を参照することができるが、フレーム812をAVCコーディングしたフレームをデコーディングして再構成したフレームを参照することもできる。
低解像度階層のビデオコーディングが終了すれば、多階層ビデオエンコーダは高解像度階層のビデオコーディングを行う。
N番目の高解像度階層のビデオフレーム842をAVCコーディングするとき、多階層ビデオエンコーダはビデオフレーム841とビデオフレーム843を参照することができるが、ビデオフレーム822を再構成したビデオフレームを参照することもできる。このために、多階層ビデオエンコーダはビデオフレーム822を再構成したビデオフレームをアップサンプリングしてビデオフレーム832を生成し、これを参照する。
N番目の高解像度階層のビデオフレーム852をウェーブレットコーディングするとき、多階層ビデオエンコーダはフレーム851,853とフレーム842を再構成したフレームを参照することができる。
図7の実施形態と図8の実施形態を比較すれば、図7の実施形態では時間的フィルタリングが終了した後に階層間の参照が行われるが、図8の実施形態では時間的フィルタリング過程で階層間の参照が行われる。動きが多い場合にはフレーム間の時間的な連関性よりは空間的な連関性がより大きい可能性があるため、図7の実施形態が良いコーディング性能を示すが、動きが少ない場合にはフレーム間の空間的な連関性よりは時間的な連関性がより大きい可能性があるため、図8の実施形態がより良いコーディング性能を示すことができる。
次に各階層でビットレートを割り当てる過程を説明する。
図9は本発明の一実施形態による多階層ビデオコーディング過程で各層のビットレートを割り当てる過程を示す図面である。便宜上、3つの解像度階層(QCIF、CIF、SD階層)があることを基準に説明する。
ビデオコーディングに関するスケーラビリティ要求事項がQCIF階層930では15Hzのフレームレートで96〜192kbpsであり、CIF階層920では7.5Hz〜30Hzのフレームレートで192〜768kbpsであり、SD階層910では15Hz〜60Hzのフレームレートで768〜3072kbpsであると仮定して説明する。
まず、QCIF階層930のビデオコーディングを説明する。多階層ビデオエンコーダは96kbpsのビットレートと15Hzのフレームレートを有するようにQCIFフレームをAVCコーディングする。それから192kbpsのビットレートと15Hzのフレームレートを有するようにコーディングされたAVCフレームを参照してQCIFフレームをウェーブレットコーディングする。
CIF階層920のビデオコーディングを説明する。
多階層ビデオエンコーダはCIF階層920の最大フレームレートである30Hzのフレームレートを有するようにCIFフレームをAVCコーディングする。192kpbsのビットレートと7.5Hzのフレームレートを有するビデオフレームを再構成するには、QCIF階層930のAVCコーディングされたフレームおよびウェーブレットコーディングされたフレームと、CIF階層920のAVCコーディングされたフレームの一部が必要である。
多階層ビデオエンコーダはCIF階層920の最大フレームレートである30Hzのフレームレートを有するようにCIFフレームをウェーブレットコーディングする。CIF階層920の384kbpsから768kbpsのフレームを再構成するには、QCIF階層930のAVCコーディングされたフレームおよびウェーブレットコーディングされたフレームと、CIF階層920のAVCコーディングされたフレームおよびウェーブレットコーディングされたフレームの一部が必要である。
SD階層910のビデオコーディングを説明する。
多階層ビデオエンコーダはSD階層910の最大フレームレートである60Hzのフレームレートを有するようにSDフレームをAVCコーディングする。768kpbsのビットレートと15Hzのフレームレートを有するビデオフレームを再構成するには、QCIF階層930のAVCコーディングされたフレームおよびウェーブレットコーディングされたフレームと、CIF階層920のAVCコーディングされたフレームおよびウェーブレットコーディングされたフレームと、SD階層910のAVCコーディングされたフレームの一部が必要である。
多階層ビデオエンコーダはSD階層910の最大フレームレートである60Hzのフレームレートを有するようにCIFフレームをウェーブレットコーディングする。SD階層910の1536kbpsから3072kbpsのフレームを再構成するには、QCIF階層930のAVCコーディングされたフレームおよびウェーブレットコーディングされたフレームと、CIF階層920のAVCコーディングされたフレームおよびウェーブレットコーディングされたフレーム、およびSD階層910のAVCコーディングされたフレームおよびウェーブレットコーディングされたフレームの一部が必要である。
多階層ビデオコーディングについての以上の説明は例示的なものであって、多様な多階層ビデオコーディングを具現することができる。図10および図11は前記説明の実施形態と異なるビットストリーム構造の例を示している。
図4とは異なり、図10の実施形態はSD階層では1つのコーディング方式よってのみコーディングする。これは高い解像度で十分なビットレート(例えば3.0MHzのビットレート)を有する場合にはウェーブレットコーディングされたビットストリームから相対的に少ないビットレート(例えば1.5Mbps)のビデオフレームを容易に再構成することができるためである。
図12は本発明の一実施形態による多階層ビデオデコーダの構成を示すブロック図である。説明の便宜上、2つの解像度階層を有するビットストリームからビデオフレームを再構成するビデオデコーダを基準に説明する。
多階層ビデオデコーダはビットストリーム解析部1250と低解像度階層のコーディングされたビデオフレームをデコーディングするためのAVCデコーディング部1210およびウェーブレットデコーディング部1220と、高解像度階層のコーディングされたビデオフレームをデコーディングするためのAVCデコーディング部1230およびウェーブレットデコーディング部1240を含む。
ビットストリーム解析部1250は入力されたビットストリームに含まれた高解像度階層および低解像度階層のコーディングされたフレームを抽出する。低解像度階層のコーディングされたフレームはAVCコーディングされたフレームとウェーブレットコーディングされたフレームとを含み、高解像度階層のコーディングされたフレームもAVCコーディングされたフレームとウェーブレットコーディングされたフレームとを含む。
低解像度階層のAVCデコーディング部1210は低解像度階層のAVCコーディングされたフレームを逆量子化し、逆量子化されたフレームを逆DCT変換した後に、逆DCT変換されたフレームを逆時間的フィルタリングする。このために、低解像度階層のAVCデコーディング部1210は逆量子化部1211と逆DCT変換部1212および逆時間的フィルタリング部1213を含む。
低解像度階層のウェーブレットデコーディング部1220はAVCデコーディング部1210で再構成されたビデオフレームを参照して低解像度階層のウェーブレットコーディングされたフレームを逆量子化し、逆量子化されたフレームを逆ウェーブレット変換した後に、逆ウェーブレット変換されたフレームを逆時間的フィルタリングする。このために、低解像度階層のウェーブレットデコーディング部1220は逆量子化部1221と逆ウェーブレット変換部1222および逆時間的フィルタリング部1223を含む。
高解像度階層のAVCデコーディング部1230は低解像度階層のウェーブレットデコーディング部1220で再構成されたビデオフレームを参照して高解像度階層のAVCコーディングされたフレームを逆量子化し、逆量子化されたフレームを逆DCT変換した後に、逆DCT変換されたフレームを逆時間的フィルタリングする。このために、高解像度階層のAVCデコーディング部1230は逆量子化部1231と逆DCT変換部1232および逆時間的フィルタリング部1233を含む。
高解像度階層のウェーブレットデコーディング部1240はAVCデコーディング部1230で再構成されたビデオフレームを参照して高解像度階層のウェーブレットコーディングされたフレームを逆量子化し、逆量子化されたフレームを逆ウェーブレット変換した後に、逆ウェーブレット変換されたフレームを逆時間的フィルタリングする。このために、高解像度階層のウェーブレットデコーディング部1240は逆量子化部1241と逆ウェーブレット変換部1242および逆時間的フィルタリング部1243を含む。
明細書における各構成要素はソフトウェアまたはFPGAまたはASICのようなハードウェア構成要素を意味し、各構成要素はある役割を行う。しかし、構成要素はソフトウェアまたはハードウェアに限定される意味ではない。各構成要素はアドレシングできる格納媒体にあるように構成することができ、1つまたはそれ以上のプロセッサを実行させるように構成することもできる。したがって、一例として構成要素は、ソフトウェア構成要素、オブジェクト指向ソフトウェア構成要素、クラス構成要素およびタスク構成要素などのような構成要素と、プロセス、関数、属性、プロシージャ、サブルーチン、プログラムコードのセグメント、ドライバ、ファームウェア、マイクロコード、回路、データ、データベース、データ構造、テーブル、アレイ、および変数を含む。このような構成要素によって提供される機能は、さらに小さい数の構成要素およびモジュールで結合されたり、追加的な構成要素とモジュールにさらに分離できる。また、構成要素はビデオエンコーディングおよびデコーディングシステムのための1つまたはそれ以上のコンピュータを実行させるようにも具現できる。
図13は本発明の一実施形態による多階層ビデオデコーディング過程を示すフローチャートである。
まず、多階層ビデオデコーダにビットストリームが入力されれば、多階層ビデオデコーダはビットストリームを解析する(S1310)。多階層ビデオデコーダはビットストリームを解析してビットストリームから高解像度階層および低解像度階層のコーディングされたフレームを抽出する。
コーディングされたフレームを抽出した後に多階層ビデオデコーダはコーディングされたフレームのうち低解像度階層のAVCコーディングされたフレームをAVCデコーディングして低解像度AVC階層をデコーディングする(S1220)。低解像度AVC階層をデコーディングして再構成したビデオフレームは低解像度ウェーブレット階層のデコーディング過程に提供される。
多階層ビデオデコーダは低解像度AVC階層のデコーディング過程によって再構成されたビデオフレームを参照して低解像度ウェーブレット階層をデコーディングする(S1330)。低解像度ウェーブレット階層をデコーディングするために多階層ビデオデコーダは低解像度AVC階層のデコーディング過程によって再構成されたビデオフレームを参照して、コーディングされたフレームのうち低解像度階層のウェーブレットコーディングされたフレームをウェーブレットデコーディングする。低解像度ウェーブレット階層をデコーディングして再構成したビデオフレームは高解像度AVC階層のデコーディング過程に提供される。
多階層ビデオデコーダは低解像度ウェーブレット階層のデコーディング過程によって再構成されたビデオフレームを参照して高解像度AVC階層をデコーディングする(S1340)。高解像度AVC階層をデコーディングするために多階層ビデオデコーダは低解像度ウェーブレット階層のデコーディング過程によって再構成されたビデオフレームを参照して、コーディングされたフレームのうち高解像度階層のAVCコーディングされたフレームをAVCデコーディングする。高解像度AVC階層をデコーディングして再構成したビデオフレームは高解像度ウェーブレット階層のデコーディング過程に提供される。
多階層ビデオデコーダは高解像度AVC階層のデコーディング過程によって再構成されたビデオフレームを参照して高解像度ウェーブレット階層をデコーディングする(S1350)。高解像度ウェーブレット階層をデコーディングするために多階層ビデオデコーダは高解像度AVC階層のデコーディング過程によって再構成されたビデオフレームを参照して、コーディングされたフレームの中で高解像度階層のウェーブレットコーディングされたフレームをウェーブレットデコーディングする。
すべての階層に対するデコーディング過程が終了すれば、多階層ビデオデコーダはデコーディングされたビデオフレームを利用してビデオ信号を生成する(S1360)。生成されたビデオ信号はディスプレイ装置を介して表示される。
本明細書に開示された実施形態と図面は例示的なものであって、本発明の技術的思想はこれに限定されない。例えば、詳細な説明において、1つの解像度階層をAVC階層とウェーブレット階層で構成したが、これは例示的なものであって、他のコーディングアルゴリズムを使用する2つの階層で構成することもできる。また、1つの解像度階層を2つのビデオコーディング方式によってコーディングしたが、2つを超過する複数のビデオコーディング方式によってコーディングすることも可能である。したがって以上の説明は例示的なものであって、本発明の技術的思想は後述する特許請求の範囲によってより明確に限定される。
ビデオ圧縮が適用される環境を示す図である。 多階層ビデオビットストリームの構造の例を示す図である。 多階層ビデオビットストリームの構造の例を示す図である。 本発明の一実施形態による多階層ビデオビットストリームの構造を示す図である。 本発明の一実施形態による多階層ビデオエンコーダの構成を示すブロック図である。 本発明の一実施形態による多階層ビデオコーディング過程を示すフローチャートである。 本発明の実施形態による多階層ビデオコーディング過程をより詳細に示す図である。 本発明の実施形態による多階層ビデオコーディング過程をより詳細に示す図である。 本発明の一実施形態による多階層ビデオコーディング過程で各層のビットレートを割り当てる過程を示す図である。 本発明の他の実施形態による多階層ビデオビットストリームの構造を示す図である。 本発明の他の実施形態による多階層ビデオビットストリームの構造を示す図である。 本発明の一実施形態による多階層ビデオデコーダの構成を示すブロック図である。 本発明の一実施形態による多階層ビデオデコーディング過程を示すフローチャートである。

Claims (40)

  1. (a)所定の解像度ビデオフレームを第1ビデオコーディング方式によってコーディングするステップと、
    (b)前記第1ビデオコーディング方式によってコーディングされたフレームを参照して、前記ビデオフレームを前記解像度と同じ解像度で第2ビデオコーディング方式によってコーディングするステップと、
    (c)前記第1ビデオコーディング方式によってコーディングされたビデオフレームまたは前記第2ビデオコーディング方式によってコーディングされたビデオフレームのビットレートを向上させるための向上階層の情報を生成するステップと、
    (d)前記第1および第2ビデオコーディング方式によってコーディングされたフレームと前記生成された向上階層の情報を含むビットストリームを生成するステップとを含む多階層ビデオコーディング方法。
  2. 前記第1ビデオコーディング方式はAVCコーディング方式によってあり、前記第2ビデオコーディング方式はウェーブレットコーディング方式である請求項1に記載の多階層ビデオコーディング方法。
  3. 前記第1ビデオコーディング方式と前記第2ビデオコーディング方式は同じフレームレートでビデオコーディング過程を行う請求項1に記載の多階層ビデオコーディング方法。
  4. 前記(b)ステップは、(b1)前記第1ビデオコーディング方式によってコーディングされたフレームをデコーディングするステップと、(b2)前記ビデオフレームと前記(b1)ステップによってデコーディングされたフレームの差分フレームを求めるステップ、および(b3)前記差分フレームを第2ビデオコーディング方式によってコーディングするステップを含む請求項1に記載の多階層ビデオコーディング方法。
  5. 前記(b)ステップは、(b4)前記第1ビデオコーディング方式によってコーディングされたフレームをデコーディングするステップと、(b5)前記ビデオフレームを第2ビデオコーディング方式によってコーディングするステップとを含み、前記(b5)ステップの時間的フィルタリング過程で前記(b4)ステップによってデコーディングされたフレームを参照する請求項1に記載の多階層ビデオコーディング方法。
  6. (a)高解像度ビデオフレームをダウンサンプリングして低解像度ビデオフレームを生成するステップと、
    (b)前記低解像度ビデオフレームを第1ビデオコーディング方式によってコーディングするステップと、
    (c)前記コーディングされた低解像度ビデオフレームを参照して、前記高解像度ビデオフレームを第2ビデオコーディング方式によってコーディングするステップと、
    (d)前記コーディングされた低解像度ビデオフレームおよび高解像度ビデオフレームを含むビットストリームを生成するステップと、
    (e)前記低解像度ビデオフレームまたは前記高解像度ビデオフレームのビットレートを向上させるための向上階層の情報を生成するステップとを含む多階層ビデオコーディング方法。
  7. 前記第1ビデオコーディング方式はAVCコーディング方式であり、前記第2ビデオコーディング方式はウェーブレットコーディング方式である請求項6に記載の多階層ビデオコーディング方法。
  8. 前記第1ビデオコーディング方式と前記第2ビデオコーディング方式は同じフレームレートでビデオコーディング過程を行う請求項6に記載の多階層ビデオコーディング方法。
  9. 前記(b)ステップは、前記第1ビデオコーディング方式によってコーディングされたフレームをデコーディングするステップと、前記低解像度ビデオフレームと前記第1ビデオコーディング方式によってコーディングされたフレームの差分フレームを求めるステップと、前記差分フレームを前記第2ビデオコーディング方式によってコーディングするステップとを含む請求項6に記載の多階層ビデオコーディング方法。
  10. 前記(b)ステップは、前記第1ビデオコーディング方式によってコーディングされたフレームをデコーディングするステップと、前記デコーディングされたフレームを参照して前記高解像度ビデオフレームを第2ビデオコーディング方式によってコーディングするステップとを含む請求項6に記載の多階層ビデオコーディング方法。
  11. (a)所定の解像度階層のビデオフレームを第1ビデオコーディング方式によってコーディングするステップと、
    (b)前記第1ビデオコーディング方式によってコーディングされたフレームを参照して、前記ビデオフレームを前記コーディングされたフレームの解像度と同じ解像度で第2ビデオコーディング方式によってコーディングするステップと、
    (c)前記第1ビデオコーディング方式によってコーディングされたビデオフレームまたは前記第2ビデオコーディング方式によってコーディングされたビデオフレームのビットレートを向上させるための向上階層の情報を生成するステップと、
    (d)すべてのコーディングされたフレームと前記生成された向上階層の情報を含むビットストリームを生成するステップとを含み、
    前記(a)および(b)ステップはすべての解像度階層において低解像度階層から高解像度階層に循環的に行われる多階層ビデオコーディング方法。
  12. 前記第1ビデオコーディング方式はAVCコーディング方式であり、前記第2ビデオコーディング方式はウェーブレットコーディング方式である請求項11に記載の多階層ビデオコーディング方法。
  13. 前記第1ビデオコーディング方式と前記第2ビデオコーディング方式は同じフレームレートでビデオコーディング過程を行う請求項11に記載の多階層ビデオコーディング方法。
  14. 前記(b)ステップは、(b1)前記第1ビデオコーディング方式によってコーディングされたフレームをデコーディングするステップと、(b2)前記ビデオフレームと前記(b1)ステップによってデコーディングされたフレームの差分フレームを求めるステップ、および(b3)前記差分フレームを前記第2ビデオコーディング方式によってコーディングするステップを含む請求項11に記載の多階層ビデオコーディング方法。
  15. 前記(b)ステップは、(b4)前記第1ビデオコーディング方式によってコーディングされたフレームをデコーディングするステップと、(b5)前記ビデオフレームを第2ビデオコーディング方式によってコーディングするステップとを含み、前記(b5)ステップの時間的フィルタリング過程で前記(b4)ステップによってデコーディングされたフレームを参照する請求項11に記載の多階層ビデオコーディング方法。
  16. 高解像度ビデオフレームをダウンサンプリングして低解像度ビデオフレームを生成するダウンサンプラと、
    前記低解像度ビデオフレームをビデオコーディングする低解像度ビデオエンコーディング部と、
    前記低解像度ビデオエンコーディング部によって低解像度コーディングされたフレームを参照して、前記高解像度ビデオフレームをビデオコーディングする高解像度ビデオエンコーディング部と、
    前記低解像度にコーディングされたフレームまたは前記高解像度にコーディングされたフレームのビットレートを向上させるための向上階層の情報を生成する手段と、
    前記低解像度にコーディングされたフレーム、前記高解像度にコーディングされたフレームおよび前記向上階層の情報を含むビットストリームを生成するビットストリーム生成部とを含み、
    前記低解像度ビデオエンコーディング部は低解像度ビデオフレームを第1ビデオコーディング方式によってコーディングし、前記第1ビデオコーディング方式によってコーディングされたフレームを参照して、前記ビデオフレームを前記解像度と同じ解像度で第2ビデオコーディング方式によってコーディングして前記低解像度にコーディングされたフレームを生成する多階層ビデオエンコーダ。
  17. 前記第1ビデオコーディング方式はAVCコーディング方式であり、前記第2ビデオコーディング方式はウェーブレットコーディング方式である請求項16に記載の多階層ビデオエンコーダ。
  18. (a)ビットストリームから第1および第2コーディングされたフレームを抽出するステップと、
    (b)前記第1コーディングされたフレームを第1ビデオデコーディング方式によってデコーディングして第1フレームを再構成するステップと、
    (c)前記再構成された第1フレームを参照して、前記抽出するステップで得た第2コーディングされたフレームを前記再構成された第1フレームと同じ解像度で第2ビデオデコーディング方式によってデコーディングして第2フレームを再構成するステップと、
    (d)前記ビットストリームに含まれる向上階層の情報を利用して前記第1フレームまたは第2フレームのビットレートを向上させるステップとを含む多階層ビデオデコーディング方法。
  19. 前記第1ビデオデコーディング方式はAVCデコーディング方式であり、前記第2ビデオデコーディング方式はウェーブレットデコーディング方式である請求項18に記載の多階層ビデオデコーディング方法。
  20. (a)ビットストリームから第1および第2コーディングされたフレームを抽出するステップと、
    (b)前記第1コーディングされたフレームを第1ビデオデコーディング方式によってデコーディングして第1フレームを再構成するステップと、
    (c)前記再構成された第1フレームと同じ解像度で前記第2コーディングされたフレームを第2ビデオデコーディング方式によってデコーディングして第2フレームを再構成するステップと、
    (d)前記ビットストリームに含まれる向上階層の情報を利用して前記第1フレームまたは第2フレームのビットレートを向上させるステップと、
    (e)前記ビットレートが向上した第1および第2フレームを加えて最終ビデオフレームを復元するステップとを含む多階層ビデオデコーディング方法。
  21. 前記第1ビデオデコーディング方式はAVCデコーディング方式であり、前記第2ビデオデコーディング方式はウェーブレットデコーディング方式である請求項20に記載の多階層ビデオデコーディング方法。
  22. (a)ビットストリームから低解像度および高解像度階層のコーディングされたフレームを抽出するステップと、
    (b)前記低解像度階層のコーディングされたフレームをデコーディングして低解像度階層フレームを再構成するステップと、
    (c)前記再構成された低解像度階層フレームを参照して、前記情報から得た高解像度階層のコーディングされたフレームをデコーディングして高解像度階層フレームを再構成するステップとを含み、
    前記低解像度階層のコーディングされたフレームは第1ビデオコーディング方式によってコーディングされたフレームと第2ビデオコーディング方式によってコーディングされたフレームで構成され、前記(b)ステップは、(b1)前記第1ビデオコーディング方式によってコーディングされたフレームを第1ビデオデコーディング方式によってデコーディングして第1フレームを再構成するステップと、(b2)前記再構成された第1フレームを参照して前記第2ビデオコーディング方式によってコーディングされたフレームを第2ビデオデコーディング方式によってデコーディングして第2フレーム(低解像度フレーム)を再構成するステップとを含む多階層ビデオデコーディング方法。
  23. 前記第1ビデオデコーディング方式はAVCデコーディング方式であり、前記第2ビデオデコーディング方式はウェーブレットデコーディング方式である請求項22に記載の多階層ビデオデコーディング方法。
  24. (a)ビットストリームから低解像度および高解像度階層のコーディングされたフレームに関する情報を抽出するステップと、
    (b)前記情報から得た低解像度階層のコーディングされたフレームをデコーディングして低解像度階層フレームを再構成するステップと、
    (c)前記再構成された低解像度階層フレームを参照して前記情報から得た高解像度階層のコーディングされたフレームをデコーディングして高解像度フレームを再構成するステップとを含み、
    前記低解像度階層のコーディングされたフレームは第1ビデオコーディング方式によってコーディングされたフレームと第2ビデオコーディング方式によってコーディングされたフレームで構成され、前記(b)ステップは、(b1)前記第1ビデオコーディング方式によってコーディングされたフレームを第1ビデオデコーディング方式によってデコーディングして第1フレームを再構成するステップと、(b2)前記第2ビデオコーディング方式によってコーディングされたフレームを第2ビデオデコーディング方式によってデコーディングして第2フレームを再構成するステップ、および(b3)前記再構成された第1フレームおよび第2フレームを加えて低解像度ビデオフレームを再構成するステップを含む多階層ビデオデコーディング方法。
  25. 前記第1ビデオデコーディング方式はAVCデコーディング方式であり、前記第2ビデオデコーディング方式はウェーブレットデコーディング方式である請求項24に記載の多階層ビデオデコーディング方法。
  26. ビットストリームから低解像度および高解像度階層のコーディングされたフレームに関する情報を抽出し、前記情報から低解像度および高解像度階層のコーディングされたフレームをデコーディングしてビデオフレームを再構成する多階層ビデオデコーディング方法において、
    各解像度階層のコーディングされたビデオフレームは第1ビデオコーディング方式によってコーディングされた第1フレームと第2ビデオコーディング方式によってコーディングされた第2フレームで構成され、
    (a)所定の解像度階層でコーディングされた第1フレームを第1ビデオデコーディング方式によってデコーディングして第1フレームを再構成するステップと、
    (b)前記再構成された第1フレームを参照して前記解像度階層でコーディングされた第2フレームを第2ビデオデコーディング方式によってデコーディングして第2フレームを再構成するステップと、
    (c)前記ビットストリームに含まれる向上階層の情報を利用して前記再構成された第1フレームまたは前記再構成された第2フレームのビットレートを向上させるステップとを含み、前記(a)および(b)ステップはすべての解像度階層において低解像度階層から高解像度階層の順に循環的に行われる多階層ビデオデコーディング方法。
  27. 前記第1ビデオデコーディング方式はAVCデコーディング方式であり、前記第2ビデオデコーディング方式はウェーブレットデコーディング方式である請求項26に記載の多階層ビデオデコーディング方法。
  28. ビットストリームから低解像度および高解像度階層のコーディングされたフレームに関する情報を抽出し、前記情報から低解像度および高解像度階層のコーディングされたフレームをデコーディングしてビデオフレームを再構成する多階層ビデオデコーディング方法において、
    各解像度階層のコーディングされたビデオフレームは第1ビデオコーディング方式によってコーディングされた第1フレームと第2ビデオコーディング方式によってコーディングされた第2フレームで構成され、
    (a)所定の解像度階層でコーディングされた第1フレームを第1ビデオデコーディング方式によってコーディングして第1フレームを再構成するステップと、
    (b)前記解像度階層でコーディングされた第2フレームを第2ビデオデコーディング方式によってデコーディングして第2フレームを再構成するステップと、
    (c)前記ビットストリームに含まれる向上階層の情報を利用して前記再構成された第1フレームまたは前記再構成された第2フレームのビットレートを向上させるステップと、
    (d)前記ビットレートが向上した第1および第2フレームを加えて前記解像度階層の最終フレームを復元するステップとを含み、前記(a)ないし(d)ステップはすべての解像度階層において低解像度階層から高解像度階層の順に循環的に行われる多階層ビデオデコーディング方法。
  29. 前記第1ビデオデコーディング方式はAVCデコーディング方式であり、前記第2ビデオデコーディング方式はウェーブレットデコーディング方式である請求項28に記載の多階層ビデオデコーディング方法。
  30. ビットストリームを解析して高解像度および低解像度階層のコーディングされたフレームを抽出するビットストリーム解析部と、
    前記低解像度コーディングされたフレームをデコーディングする低解像度ビデオデコーディング部と、
    前記低解像度ビデオデコーディング部によって再構成された低解像度フレームを参照して、前記高解像度階層のコーディングされたフレームをデコーディングする高解像度ビデオデコーディング部とを含み、
    前記低解像度ビデオデコーディング部は前記低解像度階層のコーディングされたフレームを構成する第1コーディングされたフレームを第1ビデオデコーディング方式によってデコーディングし、前記第1ビデオデコーディング方式によってデコーディングされた第1フレームを参照し、前記低解像度階層のコーディングされたフレームを構成する第2コーディングされたフレームを第2ビデオデコーディング方式によってデコーディングして前記低解像度フレームを再構成して、前記ビットストリームに含まれる向上階層の情報を利用して前記デコーディングされた低解像度フレームのビットレートを向上させる多階層ビデオデコーダ。
  31. 前記第1ビデオデコーディング方式はAVCデコーディング方式であり、前記第2ビデオデコーディング方式はウェーブレットデコーディング方式である請求項30に記載の多階層ビデオデコーダ。
  32. 請求項1ないし請求項15および請求項18ないし請求項29のいずれか一項に記載の方法をコンピュータで実行するためのプログラムを記録した媒体。
  33. 基礎階層のエンコーディングされたビデオ信号に関する情報を含む第1領域と、
    前記基礎階層と解像度またはフレーム率が相異し、前記基礎階層の情報を利用してエンコーディングされた上位階層に関する情報を含む第2領域と、
    前記基礎階層または前記上位階層のビットレート向上のための向上階層の情報を含む第3領域とを含むことを特徴とするビットストリーム構造。
  34. 前記基礎階層および上位階層はDCT変換を使用してコーディングされることを特徴とする請求項33に記載のビットストリーム構造。
  35. 前記基礎階層のエンコーディングされたビデオ信号はH.264によってコーディングされた信号であることを特徴とする請求項33に記載のビットストリーム構造。
  36. 基礎階層のビデオ信号を復元するステップと、
    前記基礎階層の情報を利用して上位階層の情報を復元するステップと、
    前記基礎階層または前記上位階層のビットレートを向上させるための向上階層を復元するステップとを含むことを特徴とするビデオデコーディング方法。
  37. 前記基礎階層のビデオ信号はH.264によってコーディングされたビデオ信号であることを特徴とする請求項36に記載のビデオデコーディング方法。
  38. 前記上位階層は逆DCT変換を利用して復元されることを特徴とする請求項36に記載のビデオデコーディング方法。
  39. 前記向上階層は逆ウェーブレット変換を利用して復元することを特徴とする請求項36に記載のビデオデコーディング方法。
  40. 基礎階層のビデオ信号を復元するステップと、
    前記基礎階層のビットレートを向上させるための向上階層を復元するステップと、
    前記基礎階層および前記向上階層情報を利用して上位階層の情報を復元するステップとを含むことを特徴とするビデオデコーディング方法。
JP2007529675A 2004-09-07 2005-08-13 多階層ビデオコーディングおよびデコーディング方法、ビデオエンコーダおよびデコーダ Expired - Fee Related JP4660550B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US60734304P 2004-09-07 2004-09-07
KR1020040090991A KR100679018B1 (ko) 2004-09-07 2004-11-09 다계층 비디오 코딩 및 디코딩 방법, 비디오 인코더 및디코더
PCT/KR2005/002654 WO2006028330A1 (en) 2004-09-07 2005-08-13 Multi-layer video coding and decoding methods and multi-layer video encoder and decoder

Publications (2)

Publication Number Publication Date
JP2008512035A true JP2008512035A (ja) 2008-04-17
JP4660550B2 JP4660550B2 (ja) 2011-03-30

Family

ID=36036591

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007529675A Expired - Fee Related JP4660550B2 (ja) 2004-09-07 2005-08-13 多階層ビデオコーディングおよびデコーディング方法、ビデオエンコーダおよびデコーダ

Country Status (3)

Country Link
EP (1) EP1787473A4 (ja)
JP (1) JP4660550B2 (ja)
WO (1) WO2006028330A1 (ja)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002520920A (ja) * 1998-07-06 2002-07-09 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ スケーラブルビデオ符号化システム

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2126467A1 (en) * 1993-07-13 1995-01-14 Barin Geoffry Haskell Scalable encoding and decoding of high-resolution progressive video
JP3787823B2 (ja) * 1997-07-31 2006-06-21 ソニー株式会社 画像処理装置および画像処理方法
JP3384299B2 (ja) * 1997-10-15 2003-03-10 富士ゼロックス株式会社 画像処理装置および画像処理方法
KR100269206B1 (ko) * 1998-02-21 2000-10-16 윤종용 임의 해상도 다계층 이진형상 부호화기 및 그 방법
US20050111541A1 (en) * 2002-04-26 2005-05-26 Atsushi Hatabu Moving image transferring system, moving image encoding apparatus, moving image decoding apparatus, and moving image transferring program

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002520920A (ja) * 1998-07-06 2002-07-09 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ スケーラブルビデオ符号化システム

Also Published As

Publication number Publication date
EP1787473A4 (en) 2009-01-21
WO2006028330A1 (en) 2006-03-16
JP4660550B2 (ja) 2011-03-30
EP1787473A1 (en) 2007-05-23

Similar Documents

Publication Publication Date Title
US7933456B2 (en) Multi-layer video coding and decoding methods and multi-layer video encoder and decoder
JP5014989B2 (ja) 基礎階層を利用するフレーム圧縮方法、ビデオコーディング方法、フレーム復元方法、ビデオデコーディング方法、ビデオエンコーダ、ビデオデコーダ、および記録媒体
KR100621581B1 (ko) 기초 계층을 포함하는 비트스트림을 프리디코딩,디코딩하는 방법, 및 장치
KR100596705B1 (ko) 비디오 스트리밍 서비스를 위한 비디오 코딩 방법과 비디오 인코딩 시스템, 및 비디오 디코딩 방법과 비디오 디코딩 시스템
KR100679022B1 (ko) 계층간 필터링을 이용한 비디오 코딩 및 디코딩방법과,비디오 인코더 및 디코더
US8929436B2 (en) Method and apparatus for video coding, predecoding, and video decoding for video streaming service, and image filtering method
US20050226334A1 (en) Method and apparatus for implementing motion scalability
US20060159359A1 (en) Fine granularity scalable video encoding and decoding method and apparatus capable of controlling deblocking
US20060013311A1 (en) Video decoding method using smoothing filter and video decoder therefor
EP1741297A1 (en) Method and apparatus for implementing motion scalability
JP2008515328A (ja) 階層間フィルタリングを利用したビデオコーディングおよびデコーディング方法と、ビデオエンコーダおよびデコーダ
CA2557312C (en) Video encoding and decoding methods and systems for video streaming service
WO2006080655A1 (en) Apparatus and method for adjusting bitrate of coded scalable bitsteam based on multi-layer
JP4660550B2 (ja) 多階層ビデオコーディングおよびデコーディング方法、ビデオエンコーダおよびデコーダ

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100302

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100602

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100803

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20101104

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20101130

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20101228

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140107

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4660550

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees