JP2017523682A - インターレイヤビデオ符号化/復号のためのデプス映像の予測モード伝送方法及びその装置 - Google Patents

インターレイヤビデオ符号化/復号のためのデプス映像の予測モード伝送方法及びその装置 Download PDF

Info

Publication number
JP2017523682A
JP2017523682A JP2016573764A JP2016573764A JP2017523682A JP 2017523682 A JP2017523682 A JP 2017523682A JP 2016573764 A JP2016573764 A JP 2016573764A JP 2016573764 A JP2016573764 A JP 2016573764A JP 2017523682 A JP2017523682 A JP 2017523682A
Authority
JP
Japan
Prior art keywords
video
unit
depth
prediction
flag
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2016573764A
Other languages
English (en)
Inventor
リ,ジン−ヨン
パク,ミン−ウ
チョウ,ヨン−ジン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Samsung Electronics Co Ltd
Original Assignee
Samsung Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Samsung Electronics Co Ltd filed Critical Samsung Electronics Co Ltd
Publication of JP2017523682A publication Critical patent/JP2017523682A/ja
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/597Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding specially adapted for multi-view video sequence encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/187Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a scalable video layer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/107Selection of coding mode or of prediction mode between spatial and temporal predictive coding, e.g. picture refresh

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

デプス映像を構成する現在ブロックの予測モード情報をビットストリームから獲得する段階、獲得された予測モード情報に基づいて、現在ブロックの予測ブロックを生成する段階、及び予測ブロックを利用して、デプス映像を復号する段階を含み、現在ブロックの予測モード情報をビットストリームから獲得する段階は、現在ブロックを、パターンによって、2以上のパーティションに分割して予測することに対する許容いかんを示す第1フラグ、デプス映像が、デプス映像を構成するブロックを、ウェッジレットを境界に、2以上のパーティションに分割して予測することに対する許容いかんを示す第2フラグ、及びデプス映像が、デプス映像を構成するブロックを、コントゥールを境界に、2以上のパーティションに分割して予測することに対する許容いかんを示す第3フラグを受信する段階、並びに第1フラグ、第2フラグ及び第3フラグに基づいて決定される所定条件を満足する場合に限り、現在ブロックを、パターンによって、2以上のパーティションに分割する方法のタイプに係わる情報を示す第4フラグを、ビットストリームから受信する段階を含むことを特徴とするインターレイヤビデオ復号方法である。

Description

本発明は、インターレイヤビデオ符号化方法及び該復号方法に係り、さらに具体的には、デプス映像の予測モードに係わる符号化方法及び該復号方法に関する。
立体映像とは、深さ及び空間に係わる形状情報を、映像情報と同時に提供する三次元映像を意味する。ステレオ映像の場合、左右の目にそれぞれ異なる視点の映像を提供する一方、立体映像は、観察者が見る視点を異にするたびに、異なる方向から見たような映像を提供する。従って、立体映像を生成するためには、さまざまな視点で撮影した映像が必要である。
立体映像を生成するために、さまざまな視点で撮った映像は、データ量が膨大である。従って、立体映像のために、ネットワークインフラ、地上波帯域幅などを考慮すれば、MPEG−2、H.264/AVCそしてHEVCのような単一視点ビデオ圧縮(single-view video coding)に最適化された符号化装置を使用して圧縮しても、実現がほぼ不可能である。
従って、立体映像を生成するために、最適化された多視点(マルチレイヤ)映像符号化装置が要求される。特に、時間と視点との重複性を効率的に減少させるための技術開発が必要である。
例えば、多視点ビデオコーデックは、基本視点を単一視点ビデオ圧縮を使用して圧縮し、拡張視点では、基本視点を参照して符号化することにより、圧縮率を向上させることができる。また、デプス映像のような補助データを追加して符号化することにより、映像の復号端から入力された視点より多くの視点の映像を生成する。ここで、デプス映像は、ユーザに直接見られるために使用されるよりは、中間視点の映像を合成するために使用されるが、デプス映像に劣化が発生すれば、合成された映像の画質が低下する。従って、多視点ビデオコーデックは、多視点のビデオだけではなく、デプス映像も効率的に圧縮する必要がある。
一実施形態によるインターレイヤビデオ復号及び該符号化の装置及び方法は、デプス映像の予測モードを効率的に符号化または復号して装置の複雑度を低め、合成視点の映像を効果的に生成することができる。
一方、本発明の技術的課題及び効果は、以上で言及した特徴に制限されるものではなく、言及されていない他の技術的課題は、以下の記載から、当該技術分野の当業者に明確に理解されるであろう。
一実施形態によるインターレイヤビデオ符号化装置のブロック図である。 一実施形態によるビデオ符号化方法のフローチャートである。 一実施形態によるインターレイヤビデオ復号装置のブロック図である。 一実施形態によるビデオ復号方法のフローチャートである。 一実施形態によるインターレイヤ予測構造を図示する図面である。 一実施形態によるSPS 3D拡張シンタックスを示す図面である。 DMM予測モードの2つのタイプを示す図面である。 一実施形態によるcoding_unitシンタックスを示す図面である。 DMMパラメータを受信するintra_mode_extシンタックスを示す図面である。 一実施形態による、ツリー構造の符号化単位に基づいたビデオ符号化装置のブロック図である。 一実施形態による、ツリー構造の符号化単位に基づいたビデオ復号装置のブロック図である。 本発明の一実施形態による符号化単位の概念を図示する図面である。 本発明の一実施形態による、符号化単位に基づいた映像符号化部のブロック図である。 本発明の一実施形態による、符号化単位に基づいた映像復号部のブロック図である。 本発明の一実施形態による、深度別符号化単位及びパーティションを図示する図面である。 本発明の一実施形態による、符号化単位及び変換単位の関係を図示する図面である。 一実施形態による深度別符号化情報を図示する図面である。 本発明の一実施形態による深度別符号化単位を図示する図面である。 本発明の一実施形態による、符号化単位、予測単位及び変換単位の関係を図示する図面である。 本発明の一実施形態による、符号化単位、予測単位及び変換単位の関係を図示する図面である。 本発明の一実施形態による、符号化単位、予測単位及び変換単位の関係を図示する図面である。 表1の符号化モード情報による、符号化単位、予測単位及び変換単位の関係を図示する図面である。 一実施形態による、プログラムが保存されたディスクの物理的構造を例示する図面である。 ディスクを利用して、プログラムを記録して判読するためのディスクドライブを図示する図面である。 コンテンツ流通サービス(content distribution service)を提供するためのコンテンツ供給システム(content supply system)の全体的構造を図示する図面である。 一実施形態による、本発明のビデオ符号化方法及びビデオ復号方法が適用される携帯電話の外部構造を図示する図面である。 一実施形態による、本発明のビデオ符号化方法及びビデオ復号方法が適用される携帯電話の内部構造を図示する図面である。 本発明による通信システムが適用されたデジタル放送システムを図示する図面である。 本発明の一実施形態による、ビデオ符号化装置及びビデオ復号装置を利用するクラウドコンピューティングシステムのネットワーク構造を図示する図面である。
一実施形態によるインターレイヤビデオ復号方法は、デプス映像を構成する現在ブロックの予測モード情報をビットストリームから獲得する段階、前記獲得された予測モード情報に基づいて、前記現在ブロックの予測ブロックを生成する段階、及び前記予測ブロックを利用して、前記デプス映像を復号する段階を含み、前記現在ブロックの予測モード情報をビットストリームから獲得する段階は、前記現在ブロックを、パターンによって、2以上のパーティションに分割して予測することに対する許容いかんを示す第1フラグ、及び前記デプス映像が、前記デプス映像を構成するブロックを、ウェッジレット(wedgelet)を境界に、2以上のパーティションに分割して予測することに対する許容いかんを示す第2フラグ、及び前記デプス映像が、前記デプス映像を構成するブロックを、コントゥール(contour)を境界に、2以上のパーティションに分割して予測することに対する許容いかんを示す第3フラグを受信する段階、並びに前記第1フラグ、第2フラグ及び第3フラグに基づいて決定される所定条件を満足する場合に限り、前記現在ブロックを、パターンによって、2以上のパーティションに分割する方法のタイプに係わる情報を示す第4フラグを、前記ビットストリームから受信する段階を含むことを特徴とする。
前記第2フラグは、前記デプス映像が、前記デプス映像を構成する構成するブロックをイントラSDC(simplified depth coding)モードを使用して予測することに対する許容いかんをさらに含むことを特徴とする。
前記第4フラグは、前記現在ブロックをウェッジレットを使用して、2個以上のパーティションに分割して予測する方法、及び前記現在ブロックを、コントゥールを使用して、2個以上のパーティションに分割して予測する方法のうちいずれか一つを特定することを特徴とする。
前記第3フラグは、前記デプス映像が、前記デプス映像を構成する各ブロックと対応するテクスチュア映像を参照することを許容しない場合には、前記デプス映像が、前記デプス映像を構成するブロックを、コントゥールを境界に、2以上のパーティションに分割して予測する方法を許容しないことを示すことを特徴とする。
前記デプス映像の予測モード情報を獲得する段階は、前記第1フラグが、前記現在ブロックを、パターンによって、2以上のパーティションに分割して予測する方法を許容するということを示し、前記第2フラグが、前記デプス映像が、前記デプス映像を構成するブロックを、ウェッジレットを境界に、2以上のパーティションに分割して予測する方法を許容するということを示し、前記第3フラグが、前記デプス映像が、前記デプス映像を構成するブロックを、コントゥールを境界に、2以上のパーティションに分割して予測する方法を許容するということを示す場合にだけ、前記所定条件を満足すると決定する段階を含むことを特徴とする。
前記デプス映像の予測モード情報を獲得する段階は、前記所定条件を満足せず、第2フラグが、前記デプス映像が、前記デプス映像を構成するブロックを、ウェッジレットを境界に、2以上のパーティションに分割して予測する方法を許容するということを示し、第3フラグが、前記デプス映像が、前記デプス映像を構成するブロックを、コントゥールを境界に、2以上のパーティションに分割して予測する方法を許容しないことを示すとき、前記現在ブロックを、ウェッジレットを使用して、2個以上のパーティションに分割して予測すると決定し、前記所定条件を満足せず、第2フラグが、前記デプス映像が、前記デプス映像を構成するブロックを、ウェッジレットを境界に、2以上のパーティションに分割して予測する方法を許容しないことを示し、第3フラグが、前記デプス映像が、前記デプス映像を構成するブロックを、コントゥールを境界に、2以上のパーティションに分割して予測する方法を許容するということを示すとき、前記現在ブロックを、コントゥールを使用して、2個以上のパーティションに分割して予測すると決定することができる。
一実施形態によるインターレイヤビデオ符号化方法は、デプス映像を構成する現在ブロックの予測モードを決定する段階、前記決定された予測モードを利用して、前記現在ブロックの予測ブロックを生成する段階、及び前記予測ブロックを利用して、前記デプス映像を符号化してビットストリームを生成する段階を含み、前記現在ブロックの予測モードを決定する段階は、前記現在ブロックを、パターンによって、2以上のパーティションに分割して予測することに対する許容いかんを示す第1フラグ、前記デプス映像が、前記デプス映像を構成するブロックを、ウェッジレットを境界に、2以上のパーティションに分割して予測することに対する許容いかんを示す第2フラグ、及び前記デプス映像が、前記デプス映像を構成するブロックを、コントゥールを境界に、2以上のパーティションに分割して予測することに対する許容いかんを示す第3フラグを生成する段階、並びに前記第1フラグ、第2フラグ及び第3フラグに基づいて決定される所定条件を満足する場合に限り、前記現在ブロックを、パターンによって、2以上のパーティションに分割する方法のタイプに係わる情報を示す第4フラグを生成する段階を含むことを特徴とする。
一実施形態によるインターレイヤビデオ復号装置は、デプス映像を構成する現在ブロックの予測モード情報をビットストリームから獲得する予測モード決定部、前記獲得された予測モード情報に基づいて、前記現在ブロックの予測ブロックを生成する予測ブロック生成部、及び前記予測ブロックを利用して、前記デプス映像を復号する復号部を含み、前記予測モード決定部は、前記現在ブロックを、パターンによって、2以上のパーティションに分割して予測することに対する許容いかんを示す第1フラグ、前記デプス映像が、前記デプス映像を構成するブロックを、ウェッジレットを境界に、2以上のパーティションに分割して予測することに対する許容いかんを示す第2フラグ、及び前記デプス映像が、前記デプス映像を構成するブロックを、コントゥールを境界に、2以上のパーティションに分割して予測することに対する許容いかんを示す第3フラグを受信して、前記受信された第1フラグ、第2フラグ及び第3フラグに基づいて決定される所定条件を満足する場合に限り、前記現在ブロックを、パターンによって、2以上のパーティションに分割する方法のタイプに係わる情報を示す第4フラグを、前記ビットストリームから受信することを特徴とする。
一実施形態によるインターレイヤビデオ符号化装置は、デプス映像を構成する現在ブロックの予測モードを決定する予測モード決定部、前記決定された予測モードを利用して、前記現在ブロックの予測ブロックを生成する予測ブロック生成部、及び前記予測ブロックを利用して、前記デプス映像を符号化してビットストリームを生成する符号化部を含み、前記予測モード決定部は、前記現在ブロックを、パターンによって、2以上のパーティションに分割して予測することに対する許容いかんを示す第1フラグ、前記デプス映像が、前記デプス映像を構成するブロックを、ウェッジレットを境界に、2以上のパーティションに分割して予測することに対する許容いかんを示す第2フラグ、及び前記デプス映像が、前記デプス映像を構成するブロックを、コントゥールを境界に、2以上のパーティションに分割して予測することに対する許容いかんを示す第3フラグを生成し、前記第1フラグ、第2フラグ及び第3フラグに基づいて決定される所定条件を満足する場合に限り、前記現在ブロックを、パターンによって、2以上のパーティションに分割する方法のタイプに係わる情報を示す第4フラグを生成することを特徴とする。
一実施形態による前記インターレイヤ復号方法またはインターレイヤ符号化方法で遂行される方法を、コンピューターで実行させるためのプログラムを記録したコンピュータで読み取り可能な記録媒体が提供される。
以下、図1Aないし図6を参照し、一実施形態による、インターレイヤビデオ復号及び該符号化の装置及び方法のためのデプス映像の予測方法が提案される。
また、図7ないし図19を参照し、先立って提案したインターレイヤビデオ符号化技法及び該復号技法に適用可能な一実施形態による、ツリー構造の符号化単位に基づいたビデオ符号化技法及びビデオ復号技法が開示される。また、図20ないし図26を参照し、先立って提案したビデオ符号化方法、ビデオ復号方法が適用可能な一実施形態が開示される。
以下、「映像」は、ビデオの静止映像や動画、すなわち、ビデオそのものを示す。
以下「サンプル」は、映像のサンプリング位置に割り当てられたデータであり、プロセッシング対象になるデータを意味する。例えば、空間領域の映像において、ピクセルがサンプルでもある。
以下「現在ブロック(current block)」は、符号化または復号するデプス映像の単位ブロックを意味する。
まず、図1Aないし図6を参照し、一実施形態による、インターレイヤビデオ復号及び該符号化の装置及び方法のためのデプス映像の予測方法、及び予測モードに係わる伝送方法が開示される。
図1Aは、一実施形態によるインターレイヤビデオ符号化装置10のブロック図である。図1Bは、一実施形態によるビデオ符号化方法のフローチャートである。
一実施形態によるインターレイヤビデオ符号化装置10は、予測モード決定部12、予測ブロック生成部14、レジデュアルデータ生成部16及び符号化部18を含んでもよい。また、一実施形態によるインターレイヤビデオ符号化装置10は、予測モード決定部12、予測ブロック生成部14、レジデュアルデータ生成部16及び符号化部18を総括的に制御する中央プロセッサ(図示せず)を含んでもよい。または、予測モード決定部12、予測ブロック生成部14、レジデュアルデータ生成部16及び符号化部18が、それぞれの自体プロセッサ(図示せず)によって作動し、プロセッサ(図示せず)が相互有機的に作動することにより、インターレイヤビデオ符号化装置10が全体的に作動することもできる。または、インターレイヤビデオ符号化装置10の外部プロセッサ(図示せず)の制御によって、予測モード決定部12、予測ブロック生成部14、レジデュアルデータ生成部16及び符号化部18が制御されもする。
インターレイヤビデオ符号化装置10は、予測モード決定部12、予測ブロック生成部14、レジデュアルデータ生成部16及び符号化部18の入出力データが保存される1以上のデータ保存部(図示せず)を含んでもよい。インターレイヤビデオ符号化装置10は、データ保存部(図示せず)のデータ入出力を管轄するメモリ制御部(図示せず)を含んでもよい。
インターレイヤビデオ符号化装置10は、ビデオ符号化結果を出力するために、内部に搭載されたビデオエンコーディングプロセッサまたは外部ビデオエンコーディングプロセッサと連繋して作動することにより、変換を含んだビデオ符号化動作を遂行することができる。インターレイヤビデオ符号化装置10の内部ビデオエンコーディングプロセッサは、別個のプロセッサとしてビデオ符号化動作を具現することができる。また、インターレイヤビデオ符号化装置10または中央演算装置、グラフィック演算装置が、ビデオエンコーディングプロセッシングモジュールを含むことにより、基本的なビデオ符号化動作を具現する場合も可能である。
一実施形態によるインターレイヤビデオ符号化装置10は、スケーラブルビデオコーディング(scalable video coding)方式によって、多数の映像シーケンスをレイヤ別に分類してそれぞれ符号化し、レイヤ別に符号化されたデータを含む別個のストリームを出力することができる。インターレイヤビデオ符号化装置10は、第1レイヤ映像シーケンス及び第2レイヤ映像シーケンスを互いに異なるレイヤに符号化することができる。
例えば、空間的スケーラビリティ(spatial scalability)に基づいたスケーラブルビデオコーディング方式によれば、低解像度映像が第1レイヤ映像として符号化され、高解像度映像が第2レイヤ映像として符号化される。第1レイヤ映像の符号化結果が第1レイヤストリームとして出力され、第2レイヤ映像の符号化結果が第2レイヤストリームとして出力される。
他の例として、多視点ビデオが、スケーラブルビデオコーディング方式によって符号化される。その場合、中央視点映像は、第1レイヤ映像として符号化され、左視点映像及び右視点映像は、第1レイヤ映像を参照する第2レイヤ映像として符号化される。または、インターレイヤビデオ符号化装置10が、第1レイヤ、第2レイヤ、第3レイヤなど3以上のレイヤを許容する場合、中央視点映像は、第1レイヤ映像として符号化され、左視点映像は、第2レイヤ映像として符号化され、右視点映像は、第3レイヤ映像として符号化される。ここで、必ずしもかような構成に限定されるものではなく、中央視点映像、左視点映像、右視点映像が符号化されるレイヤ、及び参照されるレイヤが変更されもするということは言うまでもない。
さらに他の例として、時間的スケーラビリティに基づいた時間階層的予測(temporal hierarchical prediction)によって、スケーラブルビデオコーディング方式が遂行される。基本フレームレートの映像を符号化して生成された符号化情報を含む第1レイヤストリームが出力される。フレームレート別に、時間的階層(temporal level)が分類され、各時間的階層が各レイヤに符号化される。基本フレームレートの映像を参照し、高速フレームレートの映像をさらに符号化し、高速フレームレートの符号化情報を含む第2レイヤストリームが出力される。
また、第1レイヤと、多数の第2レイヤとの対するスケーラブルビデオコーディングが行われる。第2レイヤが3以上である場合、第1レイヤ映像と、最初の第2レイヤ映像、2番目の第2レイヤ映像、…、K番目の第2レイヤ映像とが符号化される。それにより、第1レイヤ映像の符号化結果が第1レイヤストリームとして出力され、最初、2番目、…、K番目の第2レイヤ映像の符号化結果がそれぞれ最初、2番目、…、K番目の第2レイヤストリームとして出力される。
一実施形態によるインターレイヤビデオ符号化装置10は、単一レイヤの映像を参照し、現在映像を予測するインター予測(inter prediction)を行うことができる。インター予測を介して、現在映像と参照映像との動き情報を示すモーションベクトル(motion vector)、及び現在映像と参照映像とのレジデュアル成分(residual)が生成される。
また、インターレイヤビデオ符号化装置10は、第1レイヤ映像を参照し、第2レイヤ映像を予測するインターレイヤ予測(inter-layerprediction)を行うことができる。
また、一実施形態によるインターレイヤビデオ符号化装置10が、第1レイヤ、第2レイヤ、第3レイヤなど3以上のレイヤを許容する場合には、マルチレイヤ予測構造によって、1つの第1レイヤ映像と第3レイヤ映像とのインターレイヤ予測、第2レイヤ映像と第3レイヤ映像とのインターレイヤ予測を行うこともできる。
インターレイヤ予測を介して、現在映像と異なるレイヤの参照映像間の位置差成分、及び現在映像と異なるレイヤの参照映像間のレジデュアル成分が生成される。
インターレイヤ予測構造は、図3を参照して後述する。
一実施形態によるインターレイヤビデオ符号化装置10は、各レイヤごとに、ビデオのそれぞれの映像ブロック別に符号化する。ブロックのタイプは、正方形または長方形でもあり、任意の幾何学的形態でもある。一定サイズのデータ単位に制限されるものではない。ブロックは、ツリー構造による符号化単位内では、最大符号化単位、符号化単位、予測単位、変換単位などでもある。ツリー構造の符号化単位を含む最大符号化単位は、コーディングツリーユニット(coding tree unit)、コーディングブロックツリー(coding block tree)、ブロックツリー、ルートブロックツリー(root block tree)、コーディングツリー、コーディングルートまたはツリートランク(tree trunk)などで多様に命名されたりする。ツリー構造による符号化単位に基づいたビデオ符号化/復号方式は、図7ないし図19を参照して後述する。
一方、一実施形態によるインターレイヤビデオ符号化装置10が、多視点ビデオ映像を符号化する場合には、デプス映像のような補助データを追加して符号化することにより、映像の復号端を介して入力された視点より多くの視点の映像を生成することができる。ここで、デプス映像は、ユーザに直接見せるために使用されるというよりは、中間視点の映像を合成するために使用されるので、デプス映像の劣化いかんが、合成された映像の画質に影響を及ぼす。
デプス映像のデプス値の変化量は、客体の境界近辺で大きく示され、客体内部や背景領域では、相対的に少なく示される。従って、デプス値の差が大きい客体の境界部分で発生するエラーを最小化させることが、合成映像のエラー最小化に直結する。また、デプス値が変化量が少ない客体内部や背景領域については、相対的にデータ量を減らすことが、デプス映像に係わる符号化効率を高める。
従って、インターレイヤビデオ符号化装置10は、デプス映像を所定のDC、Planar、Angularのようなイントラ予測モードを使用して、現在ブロックを符号化することができる。また、インターレイヤビデオ符号化装置10は、DMM(depth modeling mode)モード、SDCモード、CCD(chain coding mode)モードのような予測モードを使用して、デプス映像を符号化することができる。インターレイヤビデオ符号化装置10は、前述の予測モードの使用いかんに係わる情報を含むフラグを各レイヤ別に生成することができる。
インターレイヤビデオ符号化装置10は、所定の予測モードに基づいて予測ブロックを生成し、生成された予測ブロックと、符号化する現在ブロックとの差分データ、すなわち、レジデュアルデータを生成することができる。
所定の予測モードを利用して生成されたレジデュアルデータは、全部が符号化されないか、あるいは一部だけが符号化される。一実施形態によるインターレイヤビデオ符号化装置10は、レジデュアルデータの平均値を符号化する。
一方、一実施形態によるインターレイヤビデオ符号化装置10は、符号化するブロックに対してDC値(以下、平均値)を計算し、計算された平均値を、デプス情報ルックアップテーブル(depth lookup table)にマッピングしてインデックスを決定することができる。ここで、デプス情報ルックアップテーブルは、デプス映像が有することができるデプス値とインデックスとをマッチングさせておいたテーブルを示す。
また、インターレイヤビデオ符号化装置10は、原本ブロックに係わる平均値を、デプス情報ルックアップテーブルにマッピングして決定したインデックスと、予測ブロックから求めた平均値を介して計算されたインデックスとの差値のみを復号装置に伝送することができる。その場合、インデックスの差値が符号化される。
以下、図1Bを参照し、一実施形態によるインターレイヤビデオ符号化装置10の動作について詳細に説明する。
段階11において、予測モード決定部12は、デプス映像を構成する現在ブロックに係わる予測モードを決定することができる。予測モードは、DC、Planar、Angular及びDMM(depth modeling mode)モード、SDCモードを含んでもよい。
ここで、DCモードは、予測ブロックの予測サンプルを、現在ブロックの周辺参照サンプルの平均値で満たして入れる方法を利用するイントラ予測モードである。
また、Planarモードは、参照サンプルに対する予測サンプルpredSample[x],[y](x及びyは、0からnTbs−1)に対して、次の数式(1)によって計算されるイントラ予測モードである。
predSamples[x][y]=((nTbS−1−x)*p[−1][y]+(x+1)*p[nTbS][−1]+(nTbS−1−y)*p[x][−1]+(y+1)*p[−1][nTbS]+nTbS)>>(Log2(nTbS)+1) (1)
ここで、nTbSは、予測ブロックの横または縦の大きさを示す。
またAngularモードは、画面内予測モードのうち、モード2からモード34までの方向性を考慮し、参照サンプルから予測サンプルを決定するイントラ予測モードを意味する。
また、DMM予測モードは、深さモデリングモード技術であり、デプス映像の客体境界を正確であって効率的に表現するための方法である。具体的には、DMM予測モードは、現在ブロックをパターンによって、少なくとも2つの領域に分割して予測を行うモードであり、ウェッジレット及びコントゥールを利用して領域を分け、各領域別に平均値を計算することができる。
DMM予測モードは、DMM mode−1(DMM_WFULLモードまたはINTRA_DEP_WEDGEともいう)タイプ及びDMM mode−4(DMM_CPREDTEXモードまたはINTRA_DEP_CONTOURともいう)タイプを含んでもよい。DMM mode−1は、インターレイヤビデオ符号化装置10において、現在ブロックに対してさまざまな境界線を適用し、2つの領域に分割した後、最も適する境界線を基準に領域を分割するウェッジレットモードをいう。このとき、ウェッジレットは、斜線を意味し、ウェッジレットパーティションは、斜線を境界に、現在予測符号化ブロックから分割された2以上のパーティションを意味する。
DMM mode−4は、現在ブロックのテクスチャのパターンによって、予測ブロックを少なくとも2以上の領域に分割するモードであり、コントゥールパーティション(countour partition)に対応するテクスチュア映像ブロックを利用して決定することができるモードをいう。このとき、コントゥールは、任意の形態を包括する曲線を意味し、コントゥールパーティションは、等高線を境界に分割された現在予測符号化ブロックから分割された2以上のパーティションを意味する。
DMM mode−1及びDMM mode−4に係わる詳細な説明は、図4Bを参照して後述する。
SDC予測モードは、客体内部と背景領域とのデプス値の変化量少ないという点に基づいて、レジデュアルデータをDC形態で符号化するか、あるいは符号化しないときに使用されるモードである。レジデュアルデータのDC成分は、レジデュアルブロックのピクセル値であり、レジデュアルブロックの全部または一部のピクセル値の平均値と決定することができる。
SDC予測モードは、SDCイントラ予測モード及びSDCインター予測モードを含んでもよい。例えば、SDCイントラ予測モードは、DC、DMM mode−1、DMM mode−4及びPlanar予測モードを含んでもよく、インターレイヤビデオ符号化装置10は、SDCイントラ予測モードに含まれた代表モードのうち最も確率が高い代表モードで、現在ブロックを予測して符号化することができる。SDCインター予測モードは、所定の予測モードを利用して構成され、パーティションモードによって異なるように構成される。例えば、パーティションモードが、2Nx2Nである場合にだけ、SDCインター予測モードを許容し、2NxN、Nx2N、NxNなどのモードである場合には、SDCインター予測モードを許容しない。
予測モード決定部12は、現在デプス映像、及び現在デプス映像を構成する現在ブロックが使用する予測モードに係わる情報を含むフラグを生成することができる。予測モード情報を含むフラグは、図4ないし6を参照して後述する。
段階13において、予測ブロック生成部14は、決定された予測モードに基づいて、現在ブロックの予測ブロックを生成することができる。
段階15において、レジデュアルデータ生成部16は、現在ブロックと予測ブロックとの差であるレジデュアルデータを生成することができる。一実施形態によるレジデュアルデータ生成部16は、レジデュアルデータを符号化部18に伝送しないか、あるいはレジデュアルデータの全部または一部を平均して符号化部18に伝送することができる。
例えば、レジデュアルデータ生成部16は、現在ブロックと予測ブロックとの差である残差ブロック内の左側上端画素値、右側上端画素値、左側下端画素値及び右側下端画素値を利用して平均値を計算し、符号化部18に伝送することができる。具体的には、レジデュアルデータ生成部16は、残差ブロック内の全ての画素値を利用して平均値を求めるよりは、予測ブロックの左側上端画素値、右側上端画素値、左側下端画素値及び右側下端画素値に対して加重和を遂行することができる。また、必ずしもかような構成に限定されるのではなければ、各画素位置別に少なくとも1以上の画素値を利用し(例えば、左側上端4個の画素値、及び右側上端4個の画素値を利用)、残差ブロックに係わる平均値を予測することができる。
また、レジデュアルデータ生成部16は、予測モードによって、残差ブロックに係わる平均値を異なるように求めることもできる。例えば、レジデュアルデータ生成部16は、前記予測ブロックが、DCモードまたはPlanarモードで予測される場合、前記残差ブロックの左側上端画素値、右側上端画素値、左側下端画素値及び右側下端画素値の平均を利用し、前記生成された残差ブロックに係わる平均値を計算し、符号化部18に伝送することができる。
また、レジデュアルデータ生成部16は、予測ブロックがDMM予測モードで予測される場合、残差ブロックで分割された領域別に、前記予測ブロックの左側上端画素値、右側上端画素値、左側下端画素値及び右側下端画素値を利用して、領域別に平均値を予測することができる。
他の例として、平均値計算部16は、現在ブロックの予測モードによって、他位置の画素値を利用して、残差ブロックに係わる平均値を予測することができる。
さらに他の例として、レジデュアルデータ生成部16は、予測ブロックがAngularモードのうち、水平方向あるいは垂直方向の予測モードで予測される場合、レジデュアルデータを符号化部18に伝送しない。
インターレイヤビデオ符号化装置10は、デプス映像を符号化するために、予測モードに係わる情報と、レジデュアルデータとを含むビットストリームを生成することができる。
図2Aは、一実施形態によるインターレイヤビデオ復号装置20のブロック図である。
一実施形態によるインターレイヤビデオ復号装置20は、パージング部22(または、予測モード決定部 22)、予測ブロック生成部24、レジデュアルデータ生成部26及び復号部28を含んでもよい。また、一実施形態によるインターレイヤビデオ復号装置20は、パージング部22、予測ブロック生成部24、レジデュアルデータ生成部26及び復号部28を総括的に制御する中央プロセッサ(図示せず)を含んでもよい。または、パージング部22、予測ブロック生成部24、レジデュアルデータ生成部26及び復号部28が、それぞれの自体プロセッサ(図示せず)によって作動し、プロセッサ(図示せず)が相互有機的に作動することにより、インターレイヤビデオ復号装置20が全体的に作動することもできる。または、一実施形態によるインターレイヤビデオ復号装置20の外部プロセッサ(図示せず)の制御によって、パージング部22、予測ブロック生成部24、レジデュアルデータ生成部26及び復号部28が制御されもする。
また、一実施形態によるインターレイヤビデオ復号装置20は、パージング部22、予測ブロック生成部24、レジデュアルデータ生成部26及び復号部28の入出力データが保存される1以上のデータ保存部(図示せず)を含んでもよい。インターレイヤビデオ復号装置20は、データ保存部(図示せず)のデータ入出力を管轄するメモリ制御部(図示せず)を含んでもよい。
一実施形態によるインターレイヤビデオ復号装置20は、ビデオ復号を介してビデオを復元するために、内部に搭載されたビデオデコーディングプロセッサまたは外部ビデオデコーディングプロセッサと連繋して作動することにより、逆変換を含んだビデオ復号動作を遂行することができる。一実施形態によるインターレイヤビデオ復号装置20の内部ビデオデコーディングプロセッサは、別個のプロセッサだけではなく、インターレイヤビデオ復号装置20または中央演算装置、グラフィック演算装置が、ビデオデコーディングプロセッシングモジュールを含むことにより、基本的なビデオ復号動作を具現する場合も含んでもよい。
一実施形態によるインターレイヤビデオ復号装置20は、スケーラブル符号化方式によって、レイヤ別にビットストリームを受信することができる。インターレイヤビデオ復号装置20が受信するビットストリームのレイヤ個数が限定されるものではない。
例えば、空間的スケーラビリティに基づいたインターレイヤビデオ復号装置20は、互いに異なる解像度の映像シーケンスが、互いに異なるレイヤに符号化されたストリームを受信することができる。第1レイヤストリームを復号して低解像度映像シーケンスが復元され、第2レイヤストリームを復号して高解像度映像シーケンスが復元される。
他の例として、多視点ビデオが、スケーラブルビデオコーディング方式によって復号される。ステレオスコピックビデオストリームが多数レイヤに受信された場合、第1レイヤストリームを復号して左視点映像が復元される。第1レイヤストリームに第2レイヤストリームをさらに復号し、右視点映像が復元される。
または、多視点ビデオストリームが多数レイヤに受信された場合、第1レイヤストリームを復号し、中央視点映像が復元される。第1レイヤストリームに第2レイヤストリームをさらに復号し、左視点映像が復元される。第1レイヤストリームに第3レイヤストリームをさらに復号し、右視点映像が復元される。
他の例として、時間的スケーラビリティに基づいたスケーラブルビデオコーディング方式が遂行される。第1レイヤストリームを復号し、基本フレームレートの映像が復元される。第1レイヤストリームに第2レイヤストリームをさらに復号し、高速フレームレートの映像が復元される。
また、第2レイヤが3以上である場合、第1レイヤストリームから第1レイヤ映像が復元され、第1レイヤ復元映像を参照し、第2レイヤストリームをさらに復号すれば、第2レイヤ映像がさらに復元される。第2レイヤ復元映像を参照し、K番目レイヤストリームをさらに復号すれば、K番目レイヤ映像がさらに復元されもする。
インターレイヤビデオ復号装置20は、第1レイヤストリーム及び第2レイヤストリームから、第1レイヤ映像及び第2レイヤ映像の符号化されたデータを獲得し、加えてインター予測によって生成されたモーションベクトル、及びインターレイヤ予測によって生成された予測情報をさらに獲得することができる。
例えば、インターレイヤビデオ復号装置20は、各レイヤ別に、インター予測されたデータを復号し、多数レイヤ間にインターレイヤ予測されたデータを復号することができる。符号化単位または予測単位を基に、動き補償(motion compensation)、及びインターレイヤ復号を介した復元が遂行されもする。
各レイヤストリームについては、同一レイヤのインター予測を介して予測された復元映像を参照し、現在映像のための動き補償を行うことにより、映像を復元することができる。動き補償は、現在映像のモーションベクトルを利用して決定された参照映像と、現在映像のレジデュアル成分とを合成し、現在映像の復元映像を再構成する動作を意味する。
また、インターレイヤビデオ復号装置20は、インターレイヤ予測を介して予測された第2レイヤ映像を復号するために、第1レイヤ映像の予測情報を参照し、インターレイヤ復号を行うこともできる。インターレイヤ復号は、現在映像の予測情報を決定するために、他レイヤの参照ブロックの予測情報を利用して、現在映像の予測情報を再構成する動作を意味する。
一実施形態によるインターレイヤビデオ復号装置20は、第2レイヤ映像を参照して予測された第3レイヤ映像を復元するためのインターレイヤ復号を行うこともできる。インターレイヤ予測構造は、追って図3を参照して詳細に説明する。
インターレイヤビデオ復号装置20は、ビデオのそれぞれの映像ブロック別に復号する。ブロックは、ツリー構造による符号化単位のうち、最大符号化単位、符号化単位、予測単位、変換単位などでもある。ツリー構造による符号化単位に基づいたビデオ符号化/復号方式は、図7ないし図20を参照して後述する。
一方、一実施形態によるインターレイヤビデオ復号装置20が多視点ビデオ映像を復元する場合には、デプス映像のような補助データを追加して復号することにより、映像の復号端を介して入力された視点より多くの視点の映像を生成することができる。ここで、デプス映像は、ユーザに直接見せるために使用されるよりは、中間視点の映像を合成するために使用されるので、デプス映像の劣化いかんが、合成された映像の画質に影響を及ぼす。
デプス映像のデプス値の変化量は、客体の境界近辺で大きく示され、客体内部では、相対的に少なく示される。従って、デプス値の差が大きい客体の境界部分で発生するエラーを最小化させることが、合成映像のエラー最小化に直結する。また、デプス値が変化量が少ない客体内部については、相対的にデータ量を減らすことが、デプス映像に係わる復号効率を高めることができる。
インターレイヤビデオ復号装置20は、デプス映像を所定のDC、Planar、Angularのようなイントラ予測モードを使用して復号することができる。また、インターレイヤビデオ復号装置20は、DMMモード、SDCモード、CCDモードのような予測モードを使用して、デプス映像を復号することができる。DCモード、Planerモード、Angularモード、DMMモード、SDCモードは、図1を参照して説明した。
インターレイヤビデオ復号装置20は、デプス映像、及び現在ブロックを構成する現在ブロック(すなわち、符号化/復号単位)で使用される予測モードに係わる情報を含むフラグを獲得することができる。一実施形態によるインターレイヤビデオ復号装置20は、基本レイヤ及び向上レイヤの符号化データを復号するために、共通して使用されるパラメータ情報を含むVPSNAL(video parameter set network abstraction layer)ユニットから、予測モード情報を含むフラグを受信することができる。他の実施形態による、インターレイヤビデオ復号装置20は、SPS(sequence parameter set)NALユニットやPPS(picture parameterset)NALユニットから、予測モード情報を含むフラグを受信することができる。
PPSは、少なくとも1つのピクチャに対するパラメータセットである。例えば、PPSは、少なくとも1つのピクチャの映像符号化データを符号化するために、共通して使用されるパラメータ情報を含むパラメータセットである。PPS NALユニットは、PPSを含むNALユニットである。SPSは、シーケンスに係わるパラメータセットである。シーケンスは、少なくとも1つのピクチャの集合である。例えば、SPSは、少なくとも1つのPPSを参照して符号化を行うピクチャの符号化データを符号化するために、共通して使用されるパラメータ情報を含んでもよい。
インターレイヤビデオ復号装置20は、デプス映像を復号するために、DC、Planar、Angularのようなイントラ予測モードを使用して、現在ブロックに対する予測ブロックを生成することができる。また、インターレイヤビデオ復号装置20は、DMMモード、SDCモード、CCDモードを使用して、現在ブロックに対する予測ブロックを生成することができる。また、インターレイヤビデオ復号装置20は、生成された予測ブロックと、復号する現在ブロックとの差分データ、すなわち、レジデュアルデータをビットストリームから受信することができる。
または、一実施形態によるインターレイヤビデオ復号装置20は、予測ブロックに対してDC値(以下、平均値)を計算し、計算された平均値を、デプス情報ルックアップテーブル(depth lookup table)にマッピングしてインデックスを計算することができる。また、インターレイヤビデオ復号装置20は、復元ブロックに係わる平均値に対応する復元インデックスと、予測ブロックに係わる平均値に対応する予測インデックスとのインデックス差値をビットストリームを介して受信することができる。
以下、図2Bを参照し、一実施形態によるインターレイヤビデオ復号装置20の動作について詳細に説明する。
段階21において、パージング部22は、ビットストリームからデプス映像を構成する現在ブロックに係わる予測モード情報を獲得することができる。予測モード情報は、デプス映像及び現在ブロックを復元するために使用される情報であり、DCモード、Planarモード、Angularモード、DMMモード及びSDCモードに係わる使用いかんを含んでもよい。
段階21において、パージング部22は、予測モード情報を含むフラグをパージングすることができる。パージング部22は、デプス映像が、デプス映像を構成するブロックを、DMM mode−1またはDMM mode−4を使用して予測することに対する許容いかん、及び復号する現在映像に係わるDMM予測モードの許容いかんを示すフラグをビットストリームから受信することができる。インターレイヤビデオ復号装置10は、現在映像に係わるDMM予測モードの許容いかんを示すフラグ、及びデプス映像が、デプス映像を構成するブロックを、DMM mode−1またはDMM mode−4を使用して予測することに対する許容いかんを示すフラグを利用して、所定条件を満足する場合にだけ、現在映像のDMM予測モードのタイプに係わる情報を示すフラグを、ビットストリームから追加して受信し、複雑度を低くすることができる。予測モード情報を含むフラグは、図4Aないし図6を参照して詳細に後述する。
段階23において、予測ブロック生成部24は、獲得された予測モード情報に基づいて、現在ブロックの予測ブロックを生成することができる。
段階25において、レジデュアルデータ生成部26は、ビットストリームから、レジデュアルデータを獲得することができる。ただし、所定予測モードで予測モードが生成された場合、レジデュアルデータは、復号されないこともある。
段階27において、復号部28は、予測ブロックを利用して、現在ブロック及びデプス映像を復号することができる。
以下、図3を参照し、一実施形態によるインターレイヤビデオ符号化装置10で遂行されるインターレイヤ予測構造について説明する。
図3は、一実施形態によるインターレイヤ予測構造を図示している。
一実施形態によるインターレイヤビデオ符号化装置10は、図3に図示された多視点ビデオ予測構造の再生順序30によって、基本視点映像、左視点映像及び右視点映像を予測符号化することができる。
関連技術による多視点ビデオ予測構造の再生順序30によれば、横方向に、同一視点の映像が配列されている。従って、「left」と表記された左視点映像が横方向に一列に配列され、「center」と表記された基本視点映像が横方向に一列に配列され、「right」と表記された右視点映像が横方向に一列に配列されている。基本視点映像は、左視点/右視点映像に比べ、中央視点映像でもある。
また、縦方向に、POC順序の同一である映像が配列される。映像のPOC順序は、ビデオを構成する映像の再生順序を示す。多視点ビデオ予測構造30で表示されている「POCX」は、当該列に位置した映像の相対的な再生順序を示し、Xの数字が小さいほど、再生順序が先になり、大きくなるほど再生順序が後になる。
従って、関連技術による多視点ビデオ予測構造の再生順序30によれば、「left」と表記された左視点映像が、POC順序(再生順序)によって横方向に配列され、「center」と表記された基本視点映像が、POC順序(再生順序)によって横方向に配列され、「right」と表記された右視点映像が、POC順序(再生順序)によって横方向に配列されている。また、基本視点映像と同一列(column)に位置した左視点映像及び右視点映像は、いずれも視点は異なるが、POC順序(再生順序)が同一である映像である。
各視点別に、4個の連続映像が1つのGOP(group of picture)を構成している。各GOPは、連続するアンカピクチャ(key picture)間の映像と、1つのアンカピクチャとを含む。
アンカピクチャは、ランダムアクセスポイント(random access point)であり、ビデオを再生するとき、映像の再生順序、すなわち、POC順序によって配列された映像のうち、任意に再生位置が選択されれば、再生位置において、POC順序が最も隣接するアンカピクチャが再生される。基本視点映像は、基本視点アンカピクチャ31,32,33,34,35を含み、左視点映像は、左視点アンカピクチャ131,132,133,134,135を含み、右視点映像は、右視点アンカピクチャ231,232,233,234,235を含む。
多視点映像は、GOP順に再生されて予測(復元)される。まず、多視点ビデオ予測構造の再生順序30によれば、各視点別に、GOP 0に含まれた映像が再生された後、GOP 1に含まれた映像が再生される。すなわち、GOP 0、GOP 1、GOP 2、GOP 3の順序、各GOPに含まれた映像が再生される。また、多視点ビデオ予測構造のコーディング順序によれば、各視点別に、GOP 0に含まれた映像が予測(復元)された後、GOP 1に含まれた映像が予測(復元)される。すなわち、GOP 0、GOP 1、GOP 2、GOP 3の順序、各GOPに含まれた映像が予測(復元)される。
多視点ビデオ予測構造の再生順序30によれば、映像に対して、視点間予測(インターレイヤ予測)及びインター予測がいずれも行われる。多視点ビデオ予測構造において、矢印が始まる映像が参照映像であり、矢印が終わる映像が、参照映像を利用して予測される映像である。
基本視点映像の予測結果は、符号化された後、基本視点映像ストリームの形態で出力され、付加視点映像の予測結果は、符号化された後、レイヤビットストリームの形態で出力される。また、左視点映像の予測符号化結果は、第1レイヤビットストリームとして出力され、右視点映像の予測符号化結果は、第2レイヤビットストリームとして出力される。
基本視点映像については、インター予測だけが行われる。すなわち、Iピクチャタイプであるアンカピクチャ31,32,33,34,35は、他の映像を参照しないが、Bピクチャタイプ及びbピクチャタイプである残りの映像は、他の基本視点映像を参照して予測される。Bピクチャタイプ映像は、POC順序が先になるIピクチャタイプアンカピクチャと、後になるIピクチャタイプアンカピクチャとを参照して予測される。bピクチャタイプ映像は、POC順序が先になるIピクチャタイプアンカピクチャと、後になるBピクチャタイプ映像とを参照するか、あるいはPOC順序が先になるBピクチャタイプ映像と、後になるIピクチャタイプアンカピクチャとを参照して予測される。
左視点映像及び右視点映像については、それぞれ、異なる視点映像を参照する視点間予測(インターレイヤ予測)、及び同一視点映像を参照するインター予測が行われる。
左視点アンカピクチャ131,132,133,134,135に対して、それぞれPOC順序が同一である基本視点アンカピクチャ31,32,33,34,35を参照し、視点間予測(インターレイヤ予測)が行われる。右視点アンカピクチャ231,232,233,234,235については、それぞれPOC順序が同一である基本視点映像31,32,33,34,35または左視点アンカピクチャ131,132,133,134,135を参照し、視点間予測が行われる。また、左視点映像及び右視点映像のうち、アンカピクチャ131,132,133,134,135,231,232,233,234,235ではない残りの映像に対しても、POCが同一である他視点映像を参照する視点間予測(インターレイヤ予測)が行われる。
左視点映像及び右視点映像のうち、アンカピクチャ131,132,133,134,135,231,232,233,234,235ではない残りの映像は、同一視点映像を参照して予測される。
ただし、左視点映像及び右視点映像は、それぞれ、同一視点の付加視点映像のうち、再生順序が先行するアンカピクチャを参照して予測されないこともある。すなわち、現在左視点映像のインター予測のために、現在左視点映像より再生順序が先行する左視点アンカピクチャを除いた左視点映像が参照される。同様に、現在右視点映像のインター予測のために、現在右視点映像より再生順序が先行する右視点アンカピクチャを除いた右視点映像が参照される。
また、現在左視点映像のインター予測のために、現在左視点映像が属した現在GOPより先行する以前GOPに属する左視点映像は、参照せず、現在GOPに属するが、現在左視点映像より先に復元される左視点映像を参照して予測が行われることが望ましい。右視点映像の場合も、同様である。
一実施形態によるインターレイヤビデオ復号装置20は、図3に図示された多視点ビデオ予測構造の再生順序30によって、基本視点映像、左視点映像及び右視点映像を復元することができる。
左視点映像は、基本視点映像を参照する視点間ディスパリティ補償と、左視点映像を参照するインター動き補償とを介して復元される。右視点映像は、基本視点映像及び左視点映像を参照する視点間ディスパリティ補償と、右視点映像を参照するインター動き補償とを介して復元される。左視点映像及び右視点映像のディスパリティ補償及び動き補償のために、参照映像が先に復元されなければならない。
左視点映像のインター動き補償のために、復元された左視点の参照映像を参照するインター動き補償を介して、左視点映像が復元される。右視点映像のインター動き補償のために、復元された右視点の参照映像を参照するインター動き補償を介して、右視点映像が復元される。
また、現在左視点映像のインター動き補償のために、現在左視点映像が属した現在GOPより先行する以前GOPに属する左視点映像は、参照せず、現在GOPに属するが、現在左視点映像より先に復元される左視点映像だけ参照されることが望ましい。右視点映像の場合も、同様である。
以下、図4Aないし図6を参照し、一実施形態によるインターレイヤビデオ復号装置が、デプス映像の予測及び復元のために、予測モード情報を受信する方法について説明する。
図4Aは、一実施形態によるSPS(sequence parameter set)3D拡張シンタックスの一部を示している。
一実施形態によるインターレイヤビデオ復号装置20は、デプス映像が、SDCモードのうちインターSDCを許容するか否かということを示すフラグを受信することができる。また、インターレイヤビデオ復号装置20は、デプス映像がDMM予測モードのうちDMM mode−4(DMM_CPREDTEX)を許容するか否かということを示すフラグを受信することができる。また、インターレイヤビデオ復号装置20は、デプス映像がDMM予測モードのうちDMM mode−1(DMM_WFULL)モードまたはイントラSDCモードを許容するか否かということを示すフラグを受信することができる。
図4Aの410は、DMM予測モードのうちDMM mode−4使用の許容いかんを示すフラグintra_contour_enabled_flag[d]を示す。intra_contour_enabled_flag[d]410が1の値である場合、現在デプス映像は、デプス映像を構成するブロックを、DMM mode−4の予測モードを使用して予測することを許容することができる。従って、現在デプス映像は、DMM mode−4を使用して、予測ブロックを生成して復号される。反対に、intra_contour_enabled_flag[d]410が0の値を有する場合には、現在デプス映像は、DMM mode−4を使用して復号されない。intra_contour_enabled_flag[d]410が定義されていない場合、intra_contour_enabled_flag[d]410の値は、0に推定される。
図4Aの420は、DMM予測モードのうちDMM mode−1の使用の許容いかん、及びイントラSDCモード使用の許容いかんを示すフラグintra_dc_only_wedge_enabled_flag[d]を示す。intra_dc_only_wedge_enabled_flag[d]420が1の値を有する場合、現在デプス映像は、現在デプス映像を構成するブロックを、DMM mode−1及びイントラSDCモードのうち少なくとも1つのモードを使用して予測することを許容することができる。従って、現在デプス映像は、DMM mode−1及びイントラSDCモードのうち少なくとも1つのモードを使用して、予測ブロックを生成して復号される。反対に、intra_dc_only_wedge_enabled_flag[d]420が0の値を有する場合、現在デプス映像は、DMM mode−1及びイントラSDCモードを使用して復号されない。intra_dc_only_wedge_enabled_flag[d]420が定義されていない場合、intra_dc_only_wedge_enabled_flag[d]420の値は、0に推定される。
図4Aの430は、DMM予測モードのうちインターSDCモードの許容いかんを示すフラグinter_dc_only_enabled_flag[d]を示す。inter_dc_only_enabled_flag[d]430が1の値を有する場合、現在デプス映像は、現在デプス映像を構成するブロックを、インターSDCモードを使用して予測することを許容することができる。従って、現在デプス映像は、インターSDCモードを使用して、予測ブロックを生成して復号される。反対にinter_dc_only_enabled_flag[d]430が0の値を有する場合、現在デプス映像は、インターSDCモードを使用して復号されない。inter_dc_only_enabled_flag[d]430が定義されていない場合、inter_dc_only_enabled_flag[d]430の値は、0であると推定される。
図4Bは、DMM予測モードの2つのタイプを示している。
前述のように、DMM予測モードは、デプスモデリングモード技術であり、デプス映像の客体境界を正確であって効率的に表現するための方法である。具体的には、DMM予測モードは、現在ブロックを、パターンによって、少なくとも2つの領域に分割して予測を行うモードであり、ウェッジレット及びコントゥールを利用して、現在ブロックを2以上の領域に分け、各領域別に平均値を計算することができる。
DMM予測モードは、DMM mode−1(DMM_WFULLモードまたはINTRA_DEP_WEDGEともいう)タイプ及びDMM mode−4(DMM_CPREDTEXモードまたはINTRA_DEP_CONTOURともいう)タイプを含んでもよい。
インターレイヤビデオ復号装置20は、現在ブロックに対してさまざまな境界線を適用し、2つの領域に分割した後、最も適する境界線を基準に領域を分割するウェッジレットモードであるDMM mode−1またはDMM mode−4を使用して、現在ブロックに対する予測ブロックを生成し、現在ブロックを復元することができる。また、インターレイヤビデオ復号装置20は、現在ブロックに対してさまざまな境界線を適用し、2つの領域に分割し後、最も適する境界線を基準に領域を分割するウェッジレットモードであるDMM mode−1またはDMM mode−4を使用して、現在ブロックに対する予測ブロックを生成し、現在ブロックを復元することができる。このとき、ウェッジレットは、斜線を意味し、ウェッジレットパーティションは、斜線を境界に、現在ブロックから分割された2以上のパーティションを意味する。説明の便宜のために、インターレイヤビデオ復号装置20が、現在ブロックをDMM予測モードを使用して復元することを例に挙げて説明するが、当業者であるならば、インターレイヤビデオ復号装置20と対応する動作が、インターレイヤビデオ符号化装置10で遂行されるということが分かるであろう。
インターレイヤビデオ復号装置20は、現在ブロック440を、ウェッジレット443を利用して、P 442とP 444とに分割することができる。また、インターレイヤビデオ復号装置20は、現在ブロック460を、コントゥール463を利用して、P 462とP 464とに分割することができる。
DMM mode−1は、ウェッジレット443に係わる情報を、ビットストリームに直接伝送する方法で、ウェッジレット443の出発点及び終点の位置を、あらかじめ定義されたテーブルを利用して表現して伝送する予測モードである。インターレイヤビデオ復号装置20は、ビットストリームから、ウェッジレット443の出発点及び終点の位置を獲得し、現在ブロック440をP1 442とP2 444とに分割することができる。
DMM mode−4は、コントゥール463に係わる情報を獲得するために、現在ブロック460と同一位置のテクスチュア映像ブロック480であるCTLB(co-located texture luma block)を参照する予測モードである。インターレイヤビデオ復号装置20は、テクスチュア映像ブロック480の輝度平均を計算し、計算された輝度平均を臨界値として利用して、対応テクスチュア映像ブロック480を分割した後、分割情報を、現在ブロック460に同一に適用することができる。インターレイヤビデオ復号装置20は、対応テクスチュア映像ブロック480の分割情報を利用して、現在ブロック460を、P1 462とP2 464とに分割することができる。
一実施形態によるインターレイヤビデオ復号装置20は、ウェッジレットまたはコントゥールによって分割された領域別に、1つのDC値を利用して予測することができる。例えば、P1 442に属する全てのピクセル値は、P1 442のDC値で予測し、P2 444に属する全てのピクセル値は、P2 444のDC値で予測することができる。
図5は、一実施形態によるcoding_unitシンタックスの一部を示している。図5の550は、DMM予測モードのパラメータを獲得するintra_mode_extを遂行するために、現在デプス映像に係わるDMM予測モードの許容いかんを確認する条件文である。すなわち、フラグIntracontourEnabledFlagとフラブIntraDCOnlyWedgeEnabledFlagとのうちいずれか1つの値が1であるならば、現在ブロックに対して、DMM予測モードを利用して予測を行うためのパラメータを獲得するintra_mode_extを遂行することができる。IntraDCOnlyWedgeEnabledFlag及びIntracontourEnabledFlagは、数式(2)を参照して後述する。
図5の570は、現在ブロックに対するDMM予測モードの許容いかんを示すフラグであるno_dim_flag[x0+i][y0+j]を示す。no_dim_flag[x0+i][y0+j]570が1の値を有する場合、no_dim_flag[x0+i][y0+j]に対応する現在ブロックには、DMM予測モードが許容されず、反対に、no_dim_flag[x0+i][y0+j]570が0の値を有する場合、no_dim_flag[x0+i][y0+j]に対応する現在ブロックには、DMM予測モードが許容されるということを示すことができる。
図6は、DMMパラメータを受信するintra_mode_extシンタックスを示している。
インターレイヤビデオ復号装置20は、現在ブロックで使用されるDMM予測モードのタイプを示すフラグdepth_intra_mode_idx_flag[x0][y0]650を追加して受信することができる。depth_intra_mode_idx_flag[x0][y0]650の値が0であるならば、現在ブロックを、DMM mode−1を使用して予測することができるということを示し、1であるならば、現在ブロックを、DMM mode−4を使用して予測することができるということを示すことができるが、それに制限されるものではない。
条件630は、depth_intra_mode_flag[x0][y0]650を受信するための所定条件を示す。条件630において、no_dim_flag 570が0であり、IntraDCOnlyWedgeEnabledFlagが1であり、IntracontourEnabledFlagが1である場合に限り、depth_intra_mode_flag[x0][y0]650を受信することができる。
IntraDCOnlyWedgeEnabledFlag及びIntracontourEnabledFlagは、それぞれ現在ブロックに対して、DMM mode−1とDMM mode−4とを使用して現在ブロックを予測することに対する許容いかんを示すことができる。IntraDCOnlyWedgeEnabledFlag及びIntracontourEnabledFlagは、以下の数式(2)のように定義される。
IntracontourEnabledFlag=intra_contour_enabled_flag[Depthflag] && in_comp_pred_flag (2)
IntraDCOnlyWedgeEnabledFlag=intra_dc_only_wedge_enabled_flag[DepthFlag]
フラグIntracontourEnabledFlagは、前述のintra_contour_enabled_flag[d]と、フラグin_comp_pred_flagとによって決定される。in_comp_pred_flagは、デプス映像が対応するテクスチュア映像を参照することができるか否かということにに係わる情報を示す。in_comp_pred_flagが1の値を持てばデプス映像に対応するテクスチュア映像を参照することができるし、0の値を有すれば、デプス映像に対応するテクスチュア映像を参照することができないということを示すことができる。すなわち、現在デプス映像に対応するテクスチュア映像を参照することができない場合(in_comp_pred_flag=0)は、DMM mode−4を使用して、現在ブロックを予測することができないので、IntracontourEnabledFlagは、0になる。
IntraDCOnlyWedgeEnabledFlagは、前述のintra_dc_only_wedge_enabled_flag[d]と同一である。
従って、IntraDCOnlyWedgeEnabledFlagが1の値を有すれば、現在ブロックが属したデプス映像が、DMM mode−1またはイントラSDCモードを使用して予測することを許容するということを示し、0の値を有すれば、現在ブロックが属したデプス映像がDMM mode−1及びイントラSDCモードを使用して予測することを許容しないということを示すことができる。また、IntracontourEnabledFlagが1の値を有すれば、現在ブロックが属したデプス映像が、DMM mode−4を使用して予測することを許容するということを示し、0の値を有すれば、現在ブロックが属したデプス映像がDMM mode−4を使用して予測することを許容しないということを示すことができる。
言い換えれば、現在ブロックが属したデプス映像が、DMM mode−1及びDMM−mode−4の予測をいずれも許容しないのであれば、現在ブロックに対するDMM予測モードのタイプ情報を示すフラグを受信しないことにより、装置の複雑度を低くすることができる。
もしno_dim_flag 570が0であり、IntracontourEnabledFlagが1であり、IntraDCOnlyWedgeEnabledFlagが0である場合には、depth_intra_mode_flag[x0][y0]650を受信せず、現在ブロックに対するDMM予測モードのタイプをDMM mode−4に決定することができる。もしno_dim_flag 570が0であり、IntracontourEnabledFlagが0であり、IntraDCOnlyWedgeEnabledFlagが1である場合には、depth_intra_mode_flag[x0][y0]650を受信せず、現在ブロックに対するDMM予測モードのタイプをDMM mode−1に決定することができる。
インターレイヤビデオ復号装置20は、インターレイヤビデオ符号化装置10から、no_dim_flag 570が含まれたCABAC(context-based adaptive binary arithmetic coding)で符号化されたビットストリームを受信し、受信されたビットストリームをCABAC復号することができる。このとき、フラグno_dim_flag 570は、周辺ブロック情報を参照せずに、独立した1つのコンテクストモデルを使用して伝送される。
一方、説明の便宜のために、図4ないし図6では、それぞれインターレイヤビデオ復号装置20が遂行する動作のみについて詳細に説明し、インターレイヤビデオ符号化装置10での動作は省略したが、インターレイヤビデオ符号化装置10においても、それに対応する動作が遂行されるということは、本実施形態が属する技術分野の当業者であるならば、容易に理解することができるであろう。
一実施形態によるインターレイヤビデオ符号化装置10、及び一実施形態によるインターレイヤビデオ復号装置20において、ビデオデータが分割されるブロックが、ツリー構造の符号化単位に分割され、符号化単位に対するインターレイヤ予測またはインター予測のために、符号化単位、予測単位、変換単位が利用される場合があるということは、前述の通りである。以下、図7ないし図19を参照し、一実施形態による、ツリー構造の符号化単位及び変換単位に基づいたビデオ符号化方法及びその装置、ビデオ復号方法及びその装置が開示される。
図7は、一実施形態による、ツリー構造による符号化単位に基づいたビデオ符号化装置100のブロック図である。
以下、ビデオ符号化装置100は、図1Aを参照して説明したインターレイヤビデオ符号化装置10の一実施形態である。従って、以下で省略された内容であるとしても、インターレイヤビデオ符号化装置10について、以上で記述された内容は、ビデオ符号化装置100にも適用される。
一実施形態による、ツリー構造による符号化単位に基づいたビデオ予測を伴うビデオ符号化装置100は、最大符号化単位分割部110、符号化単位決定部120及び出力部130を含む。以下、説明の便宜のために、一実施形態による、ツリー構造による符号化単位に基づいたビデオ予測を伴うビデオ符号化装置100は、「ビデオ符号化装置100」と縮約して呼称する。
最大符号化単位分割部110は、映像の現在ピクチャのための最大サイズの符号化単位である最大符号化単位に基づいて、現在ピクチャを区画することができる。現在ピクチャが最大符号化単位より大きければ、現在ピクチャの映像データは、少なくとも1つの最大符号化単位に分割される。一実施形態による最大符号化単位は、サイズ32x32,64x64,128x128,256x256などのデータ単位であり、縦横サイズ2の累乗である正方形のデータ単位でもある。映像データは、少なくとも1つの最大符号化単位別に、符号化単位決定部120に出力される。
一実施形態による符号化単位は、最大サイズ及び深度で特徴づけられる。深度とは、最大符号化単位から符号化単位が空間的に分割された回数を示し、深度が深くなるほど、深度別符号化単位は、最大符号化単位から最小符号化単位まで分割される。最大符号化単位の深度が最上位深度であり、最小符号化単位が最下位符号化単位と定義される。最大符号化単位は、深度が深くなるにつれ、深度別符号化単位の大きさは小さくなるので、上位深度の符号化単位は、複数個の下位深度の符号化単位を含んでもよい。
前述のように、符号化単位の最大サイズによって、現在ピクチャの映像データを最大符号化単位に分割し、それぞれの最大符号化単位は、深度別に分割される符号化単位を含んでもよい。一実施形態による最大符号化単位は、深度別に分割されるので、最大符号化単位に含まれた空間領域(spatial domain)の映像データが、深度によって階層的に分類される。
最大符号化単位の高さ及び幅を階層的に分割することができる総回数を制限する最大深度、及び符号化単位の最大サイズがあらかじめ設定されている。
符号化単位決定部120は、深度ごとに最大符号化単位の領域が分割された少なくとも1つの分割領域を符号化し、少なくとも1つの分割領域別に、最終符号化結果が出力される深度を決定する。すなわち、符号化単位決定部120は、現在ピクチャの最大符号化単位ごとに、深度別符号化単位で映像データを符号化し、最小の符号化誤差が発生する深度を選択し、符号化深度と決定する。決定された符号化深度及び最大符号化単位別映像データは、出力部130に出力される。
最大符号化単位内の映像データは、最大深度以下の少なくとも1つの深度によって、深度別符号化単位に基づいて符号化され、それぞれの深度別符号化単位に基づいた符号化結果が比較される。深度別符号化単位の符号化誤差の比較結果、符号化誤差が最小である深度が選択される。それぞれの最大化符号化単位ごとに、少なくとも1つの符号化深度が決定される。
最大符号化単位の大きさは、深度が深くなるにつれ、符号化単位が階層的に分割されて分割され、符号化単位の個数は増加する。また、1つの最大符号化単位に含まれる同一深度の符号化単位であるとしても、それぞれのデータに係わる符号化誤差を測定し、下位深度への分割いかんが決定される。従って、1つの最大符号化単位に含まれるデータであるとしても、位置によって、深度別符号化誤差が異なるので、位置によって、符号化深度が異なっても決定される。従って、1つの最大符号化単位に対して、符号化深度が1以上設定され、最大符号化単位のデータは、1以上の符号化深度の符号化単位によって区画される。
従って、一実施形態による符号化単位決定部120では、現在最大符号化単位に含まれるツリー構造による符号化単位が決定される。一実施形態による「ツリー構造による符号化単位」は、現在最大符号化単位に含まれる全ての深度別符号化単位のうち、符号化深度と決定された深度の符号化単位を含む。符号化深度の符号化単位は、最大符号化単位内で、同一領域では、深度によって階層的に決まり、他の領域については、独立して決定される。同様に、現在領域に対する符号化深度は、他の領域に対する符号化深度と独立して決定される。
一実施形態による最大深度は、最大符号化単位から最小符号化単位までの分割回数と係わる指標である。一実施形態による第1最大深度は、最大符号化単位から最小符号化単位までの総分割回数を示すことができる。一実施形態による第2最大深度は、最大符号化単位から最小符号化単位までの深度レベルの総個数を示すことができる。例えば、最大符号化単位の深度が0であるとするとき、最大符号化単位が1回分割された符号化単位の深度は、1に設定され、2回分割された符号化単位の深度は、2に設定される。その場合、最大符号化単位から4回分割された符号化単位が最小符号化単位であるならば、深度0,1,2,3及び4の深度レベルが存在するので、第1最大深度は、4に設定され、第2最大深度は、5に設定される。
最大符号化単位の予測符号化及び変換が行われる。予測符号化及び変換も同様に、最大符号化単位ごとに、最大深度以下の深度ごとに、深度別符号化単位を基に行われる。
最大符号化単位が深度別に分割されるたびに、深度別符号化単位の個数が増加するので、深度が深くなるにつれ、生成される全ての深度別符号化単位に対して、予測符号化及び変換を含んだ符号化が行われなければならない。以下、説明の便宜のために、少なくとも1つの最大符号化単位のうち、現在深度の符号化単位を基に予測符号化及び変換について説明する。
一実施形態によるビデオ符号化装置100は、映像データの符号化のためのデータ単位の大きさまたは形態を、多様に選択することができる。映像データの符号化のためには、予測符号化、変換、エントロピー符号化などの段階を経るが、全ての段階にわたって、同一データ単位が使用され、段階別にデータ単位が変更されもする。
例えば、ビデオ符号化装置100は、映像データの符号化のための符号化単位だけでなく、符号化単位の映像データの予測符号化を行うために、符号化単位と異なるデータ単位を選択することができる。
最大符号化単位の予測符号化のためには、一実施形態による符号化深度の符号化単位、すなわち、それ以上さらに分割されない符号化単位を基に予測符号化が行われる。以下、予測符号化の基盤になる、それ以上さらに分割されない符号化単位を「予測単位」と呼ぶ。予測単位が分割されたパーティションは、予測単位、並びに予測単位の高さ及び幅のうち少なくとも一つが分割されたデータ単位を含んでもよい。パーティションは、符号化単位の予測単位が分割された形態のデータ単位であり、予測単位は、符号化単位と同一サイズのパーティションでもある。
例えば、サイズ2Nx2N(ただし、Nは、正の整数)の符号化単位がそれ以上分割されない場合、サイズ2Nx2Nの予測単位になり、パーティションの大きさは、2Nx2N、2NxN、Nx2N、NxNなどでもある。一実施形態によるパーティションタイプは、予測単位の高さまたは幅が対称的な比率に分割された対称的パーティションだけではなく、1:nまたはn:1のように、非対称的な比率に分割されたパーティション、幾何学的な形態に分割されたパーティション、任意的形態のパーティションなどを選択的に含んでもよい。
予測単位の予測モードは、イントラモード、インターモード及びスキップモードのうち少なくとも一つでもある。例えば、イントラモード及びインターモードは、2Nx2N,2NxN,Nx2N,NxNサイズのパーティションに対して遂行される。また、スキップモードは、2Nx2Nサイズのパーティションに対してのみ遂行される。符号化単位以内の1つの予測単位ごとに、独立して符号化が行われ、符号化誤差が最小である予測モードが選択される。
また、一実施形態によるビデオ符号化装置100は、映像データの符号化のための符号化単位だけではなく、符号化単位と異なるデータ単位を基に、符号化単位の映像データの変換を行うことができる。符号化単位の変換のためには、符号化単位より小さいか、あるいはそれと同じ大きさの変換単位を基に変換が行われる。例えば、変換単位は、イントラモードのためのデータ単位、及びインターモードのための変換単位を含んでもよい。
一実施形態による、ツリー構造による符号化単位と類似した方式で、符号化単位内の変換単位も、再帰的にさらに小サイズの変換単位に分割されながら、符号化単位のレジデュアルデータが、変換深度によって、ツリー構造による変換単位によって区画される。
一実施形態による変換単位についても、符号化単位の高さ及び幅が分割され、変換単位に至るまでの分割回数を示す変換深度が設定される。例えば、サイズ2Nx2Nの現在符号化単位の変換単位の大きさが2Nx2Nであるならば、変換深度0に設定され、変換単位の大きさがNxNであるならば、変換深度1に設定され、変換単位の大きさがN/2xN/2であるならば、変換深度2に設定される。すなわち、変換単位についても、変換深度によって、ツリー構造による変換単位が設定される。
符号化深度別符号化情報は、符号化深度だけではなく、予測関連情報及び変換関連情報が必要である。従って、符号化単位決定部120は、最小符号化誤差を発生させた符号化深度だけではなく、予測単位をパーティションに分割したパーティションタイプ、予測単位別予測モード、変換のための変換単位の大きさなどを決定することができる。
一実施形態による、最大符号化単位のツリー構造による符号化単位及び予測単位/パーティション、及び変換単位の決定方式については、図7ないし図19を参照して詳細に後述する。
符号化単位決定部120は、深度別符号化単位の符号化誤差をラグランジュ乗数(Lagrangian multiplier)基盤の率・歪曲最適化技法(rate-distortion optimization)を利用して測定することができる。
出力部130は、符号化単位決定部120で決定された少なくとも1つの符号化深度に基づいて符号化された最大符号化単位の映像データ、及び深度別符号化モードについての情報をビットストリーム形態で出力する。
符号化された映像データは、映像のレジデュアルデータの符号化結果でもある。
深度別符号化モードについての情報は、符号化深度情報、予測単位のパーティションタイプ情報、予測モード情報、変換単位の大きさ情報などを含んでもよい。
符号化深度情報は、現在深度で符号化せず、下位深度の符号化単位に符号化するか否かということを示す深度別分割情報を利用して定義される。現在符号化単位の現在深度が符号化深度であるならば、現在符号化単位は、現在深度の符号化単位で符号化されるので、現在深度の分割情報は、それ以上下位深度に分割されないように定義される。反対に、現在符号化単位の現在深度が符号化深度ではないならば、下位深度の符号化単位を利用した符号化を試みなければならないので、現在深度の分割情報は、下位深度の符号化単位に分割されるように定義される。
現在深度が符号化深度ではないならば、下位深度の符号化単位に分割された符号化単位に対して符号化が行われる。現在深度の符号化単位内に、下位深度の符号化単位が1以上存在するので、それぞれの下位深度の符号化単位ごとに反復的に符号化が行われ、同一深度の符号化単位ごとに再帰的(recursive)符号化が行われる。
1つの最大符号化単位内で、ツリー構造の符号化単位が決定され、符号化深度の符号化単位ごとに、少なくとも1つの符号化モードについての情報が決定されなければならないので、1つの最大符号化単位については、少なくとも1つの符号化モードについての情報が決定される。また、最大符号化単位のデータは、深度によって階層的に区画され、位置別に符号化深度が異なりもするので、データに対して、符号化深度及び符号化モードについての情報が設定される。
従って、一実施形態による出力部130は、最大符号化単位に含まれている符号化単位、予測単位及び最小単位のうち少なくとも一つに対して、当該符号化深度及び符号化モードに係わる符号化情報を割り当てられる。
一実施形態による最小単位は、最下位符号化深度である最小符号化単位が4分割された大きさの正方形のデータ単位である。一実施形態による最小単位は、最大符号化単位に含まれる全ての符号化単位、予測単位、パーティション単位、及び変換単位内に含まれる最大サイズの正方形データ単位でもある。
例えば、出力部130を介して出力される符号化情報は、深度別符号化単位別符号化情報と、予測単位別符号化情報とに分類される。深度別符号化単位別符号化情報は、予測モード情報、パーティションサイズ情報を含んでもよい。予測単位別に伝送される符号化情報は、インターモードの推定方向についての情報、インターモードの参照映像インデックスについての情報、動きベクトルについての情報、イントラモードのクロマ成分についての情報、イントラモードの補間方式についての情報などを含んでもよい。
ピクチャ別、スライス別またはGOP別に定義される符号化単位の最大サイズについての情報、及び最大深度についての情報は、ビットストリームのヘッダ、シーケンスパラメータセットまたはピクチャパラメータセットなどに挿入される。
また、現在ビデオに対して許容される変換単位の最大サイズについての情報、及び変換単位の最小サイズについての情報も、ビットストリームのヘッダ、シーケンスパラメータセットまたはピクチャパラメータセットなどを介して出力される。出力部130は、図1ないし図6を参照して説明した予測と係わる参照情報、予測情報、単一方向予測情報、第4スライスタイプを含むスライスタイプ情報などを符号化して出力することができる。
ビデオ符号化装置100の最も簡単な形態の実施形態によれば、深度別符号化単位は、1階層上位深度の符号化単位の高さ及び幅を半分にした大きさの符号化単位である。すなわち、現在深度の符号化単位の大きさが2Nx2Nであるならば、下位深度の符号化単位の大きさは、NxNである。また、2Nx2Nサイズの現在符号化単位は、NxNサイズの下位深度符号化単位を最大4個含んでもよい。
従って、ビデオ符号化装置100は、現在ピクチャの特性を考慮して決定された最大符号化単位の大きさ及び最大深度を基に、それぞれの最大符号化単位ごとに、最適の形態及び大きさの符号化単位を決定し、ツリー構造による符号化単位を構成することができる。また、それぞれの最大符号化単位ごとに、多様な予測モード、変換方式などで符号化することができるので、多様な映像サイズの符号化単位の映像特性を考慮し、最適の符号化モードが決定される。
従って、映像の解像度が非常に高いか、あるいはデータ量が非常に多い映像を、既存マクロブロック単位で符号化するならば、ピクチャ当たりマクロブロックの数が過度に多くなる。それによって、マクロブロックごとに生成される圧縮情報も多くなるので、圧縮情報の伝送負担が大きくなり、データ圧縮効率が低下する傾向がある。従って、一実施形態によるビデオ符号化装置は、映像の大きさを考慮し、符号化単位の最大サイズを増大させながら、映像特性を考慮し、符号化単位を調節することができるので、映像圧縮効率が上昇する。
図7のビデオ符号化装置100は、図1を参照して説明したビデオ符号化装置10の動作を遂行することができる。
符号化単位決定部120は、ビデオ符号化装置10のイントラ予測部12の動作を遂行することができる。最大符号化単位ごとに、ツリー構造による符号化単位別に、イントラ予測のための予測単位を決定し、予測単位ごとにイントラ予測を行うことができる。
出力部130は、ビデオ符号化装置10のシンボル符号化部14の動作を遂行することができる。予測単位ごとに、イントラ予測モードの予測のために、MPMフラグを符号化することができる。現在予測単位のイントラ予測モードが、左側/上端予測単位のイントラ予測モードのうち少なくとも一つと同一である場合には、左側イントラ予測モードと上端イントラ予測モードとが同一であるか、あるいは異なるかということに係わりなく、常に固定された個数の複数個の候補イントラ予測モードを決定し、候補イントラ予測モードに基づいて、現在予測単位のための現在イントラモード情報を決定して符号化することができる。
出力部130は、候補イントラ予測モードの個数を毎ピクチャごとに決定することができる。それと類似して、候補イントラ予測モードの個数が、スライスごとに、最大符号化単位ごとに、符号化単位ごとにまたは予測単位ごとに決定されもする。それらに制限されることなく、所定データ単位ごとに、候補イントラ予測モードの個数がさらに決定される。
出力部130は、候補イントラ予測モードの個数を更新したデータ単位のレベルによって、PPS(picture parameter set)、SPS(slice parameter set)、最大符号化単位レベル、符号化単位レベル、予測単位レベルなど多様なデータ単位レベルのパラメータであり、候補イントラ予測モードの個数を示す情報を符号化することもできる。ただし、所定データ単位ごとに、毎回候補イントラ予測モードの個数が決定されるとしても、常に候補イントラ予測モードの個数を示す情報が符号化されるものではない。
図8は、一実施形態による、ツリー構造による符号化単位に基づいたビデオ復号装置200のブロック図である。
以下、ビデオ復号装置200は、図2Aを参照して説明したインターレイヤビデオ復号装置20の一実施形態である。従って、以下で省略された内容であるとしても、インターレイヤビデオ復号装置20について、以上で記述された内容は、ビデオ復号装置200にも適用される。
一実施形態による、ツリー構造による符号化単位に基づいたビデオ予測を伴うビデオ復号装置200は、受信部210、映像データ及び符号化情報抽出部220及び映像データ復号部230を含む。以下、説明の便宜のために、一実施形態による、ツリー構造による符号化単位に基づいたビデオ予測を伴うビデオ復号装置200は、「ビデオ復号装置200」と縮約して呼称する。
一実施形態によるビデオ復号装置200の復号動作のための符号化単位、深度、予測単位、変換単位、各種符号化モードについての情報など各種用語の定義は、図7及びビデオ符号化装置100を参照して説明したところと同一である。
受信部210は、符号化されたビデオに係わるビットストリームを受信してパージングする。映像データ及び符号化情報抽出部220は、パージングされたビットストリームから、最大符号化単位別に、ツリー構造による符号化単位によって、符号化単位ごとに符号化された映像データを抽出し、映像データ復号部230に出力する。映像データ及び符号化情報抽出部220は、現在ピクチャに係わるヘッダ、シーケンスパラメータセットまたはピクチャパラメータセットから、現在ピクチャの符号化単位の最大サイズについての情報を抽出することができる。
また、映像データ及び符号化情報抽出部220は、パージングされたビットストリームから、最大符号化単位別に、ツリー構造による符号化単位に係わる、符号化深度及び符号化モードについての情報を抽出する。抽出された符号化深度及び符号化モードについての情報は、映像データ復号部230に出力される。すなわち、ビット列の映像データを、最大符号化単位に分割し、映像データ復号部230が、最大符号化単位ごとに映像データを復号する。
最大符号化単位別符号化深度及び符号化モードについての情報は、1以上の符号化深度情報に対して設定され、符号化深度別符号化モードについての情報は、当該符号化単位のパーティションタイプ情報、予測モード情報及び変換単位のサイズ情報などを含んでもよい。また、符号化深度情報として、深度別分割情報が抽出されもする。
映像データ及び符号化情報抽出部220が抽出した最大符号化単位別符号化深度及び符号化モードについての情報は、一実施形態によるビデオ符号化装置100のように、符号化端で、最大符号化単位別深度別符号化単位ごとに反復的に符号化を行い、最小符号化誤差を発生させることによって決定された符号化深度及び符号化モードについての情報である。従って、ビデオ復号装置200は、最小符号化誤差を発生させる符号化方式によって、データを復号し、映像を復元することができる。
一実施形態による符号化深度及び符号化モードに係わる符号化情報は、当該符号化単位、予測単位及び最小単位のうち所定データ単位に対して割り当てられているので、映像データ及び符号化情報抽出部220は、所定データ単位別に、符号化深度及び符号化モードについての情報を抽出することができる。所定データ単位別に、当該最大符号化単位の符号化深度及び符号化モードについての情報が記録されているならば、同一符号化深度及び符号化モードについての情報を有している所定データ単位は、同一最大符号化単位に含まれるデータ単位と類推される。
映像データ復号部230は、最大符号化単位別符号化深度及び符号化モードについての情報に基づいて、それぞれの最大符号化単位の映像データを復号し、現在ピクチャを復元する。すなわち、映像データ復号部230は、最大符号化単位に含まれるツリー構造による符号化単位のうちそれぞれの符号化単位ごとに、判読されたパーティションタイプ、予測モード、変換単位に基づいて、符号化された映像データを復号することができる。復号過程は、イントラ予測及び動き補償を含む予測過程、及び逆変換過程を含んでもよい。
映像データ復号部230は、符号化深度別符号化単位の予測単位のパーティションタイプ情報及び予測モード情報に基づいて、符号化単位ごとに、それぞれのパーティション及び予測モードによって、イントラ予測または動き補償を行うことができる。
また、映像データ復号部230は、最大符号化単位別逆変換のために、符号化単位別に、ツリー構造による変換単位情報を判読し、符号化単位ごとに、変換単位に基づいた逆変換を行うことができる。逆変換を介して、符号化単位の空間領域の画素値が復元される。
映像データ復号部230は、深度別分割情報を利用して、現在最大符号化単位の符号化深度を決定することができる。もし分割情報が現在深度において、それ以上分割されないということを示しているならば、現在深度が符号化深度である。従って、映像データ復号部230は、現在最大符号化単位の映像データに対して、現在深度の符号化単位を、予測単位のパーティションタイプ、予測モード及び変換単位大きさ情報を利用して復号することができる。
すなわち、符号化単位、予測単位及び最小単位のうち、所定データ単位に対して設定されている符号化情報を観察し、同一分割情報を含んだ符号化情報を保有しているデータ単位が集まり、映像データ復号部230によって、同一符号化モードで復号する1つのデータ単位と見なされる。かように決定された符号化単位ごとに、符号化モードに係わる情報を獲得し、現在符号化単位の復号が行われる。
さらに、図8のビデオ復号装置200は、図2を参照して説明したビデオ復号装置20の動作を遂行することができる。
受信部210は、ビデオ復号装置20のパージング部22の動作を遂行することができる。映像データ及び符号化情報抽出部220と、映像データ復号部230は、ビデオ復号装置20のイントラ予測部24の動作を遂行することができる。
パージング部22は、ツリー構造による符号化単位別に、イントラ予測のための予測単位が決定された場合、予測単位ごとに、ビットストリームからイントラ予測モードの予測のためのMPMフラグをパージングすることができる。左側イントラ予測モードと上端イントラ予測モードとが相互同一であるか、あるいは異なるかということを判断する必要なく、ビットストリームからMPMフラグに連続し、現在イントラモード情報がパージングされる。映像データ及び符号化情報抽出部220は、MPMフラグ及びイントラモード情報を含み、ブロックのシンボルのパージングを完了した後、パージングされた情報から、現在イントラ予測モードを復元することができる。固定個数の複数個の候補イントラ予測モードを利用して、現在イントラ予測モードが予測されもする。映像データ復号部230は、復元された現在イントラ予測モード及びレジデュアルデータを利用して、現在予測単位に対するイントラ予測を行うことができる。
映像データ及び符号化情報抽出部220は、候補イントラ予測モードの個数を毎ピクチャごとにさらに決定することができる。
パージング部22は、ビットストリームのPPS(picture parameter set)、SPS(slice parameter set)、最大符号化単位レベル、符号化単位レベル、予測単位レベルなど多様なデータ単位レベルのパラメータから、固定された個数の候補イントラ予測モードの個数を示す情報をパージングする場合がある。その場合、映像データ及び符号化情報抽出部220は、情報がパージングされたレベルに対応するデータ単位ごとに、パージングされた情報が示す個数ほどの候補イントラ予測モードを決定することができる。
ただし、映像データ及び符号化情報抽出部220は、候補イントラ予測モードの個数を示す情報がパージングされないとしても、スライスごとに、最大符号化単位ごとに、符号化単位ごとに、または予測単位など所定データ単位ごとに、候補イントラ予測モードの個数を更新することもできる。
結局、ビデオ復号装置200は、符号化過程において、最大符号化単位ごとに再帰的に符号化を行い、最小符号化誤差を発生させた符号化単位に係わる情報を獲得し、現在ピクチャに対する復号に利用することができる。すなわち、最大符号化単位ごとに、最適符号化単位と決定されたツリー構造による符号化単位の符号化された映像データの復号が可能になる。
従って、高い解像度の映像、またはデータ量が過度に多い映像でも、符号化端から伝送された最適符号化モードについての情報を利用して、映像の特性に適応的に決定された符号化単位の大きさ及び符号化モードによって、効率的に映像データを復号して復元することができる。
図9は、本発明の一実施形態による符号化単位の概念を図示している。
符号化単位の例は、符号化単位の大きさは、幅x高さで表現され、サイズ64x64である符号化単位から、サイズ32x32,16x16,8x8を含んでもよい。サイズ64x64の符号化単位は、サイズ64x64,64x32,32x64,32x32のパーティションに分割され、サイズ32x32の符号化単位は、サイズ32x32,32x16,16x32,16x16のパーティションに分割され、サイズ16x16の符号化単位は、サイズ16x16,16x8,8x16,8x8のパーティションに分割され、サイズ8x8の符号化単位は、サイズ8x8,8x4,4x8,4x4のパーティションに分割される。
ビデオデータ310については、解像度は、1920x1080に設定され、符号化単位の最大サイズは、64に設定され、最大深度は、2に設定されている。ビデオデータ320については、解像度は、1920x1080に設定され、符号化単位の最大サイズは、64に設定され、最大深度は、3に設定されている。ビデオデータ330については、解像度は、352x288に設定され、符号化単位の最大サイズは、16に設定され、最大深度は、1に設定されている。図9に図示された最大深度は、最大符号化単位から最小符号化単位までの総分割回数を示す。
解像度が高いか、あるいはデータ量が多い場合、符号化効率の向上だけではなく、映像特性を正確に反映させるために、符号化サイズの最大サイズが相対的に大きいことが望ましい。従って、ビデオデータ330に比べ、解像度が高いビデオデータ310,320は、符号化サイズの最大サイズが64に選択される。
ビデオデータ310の最大深度が2であるので、ビデオデータ310の符号化単位315は、長軸サイズが64である最大符号化単位から、2回分割されて深度が2階層深くなり、長軸サイズが32、16である符号化単位まで含んでもよい。一方、ビデオデータ330の最大深度が1であるので、ビデオデータ330の符号化単位335は、長軸サイズが16である符号化単位から、1回分割されて深度が1階層深くなり、長軸サイズが8である符号化単位まで含んでもよい。
ビデオデータ320の最大深度が3であるので、ビデオデータ320の符号化単位325は、長軸サイズが64である最大符号化単位から、3回分割されて深度が3階層深くなり、長軸サイズが32、16、8である符号化単位まで含んでもよい。深度が深くなるほど、細部情報の表現能が向上する。
図10は、本発明の一実施形態による、符号化単位に基づいた映像符号化部400のブロック図である。
一実施形態による映像符号化部400は、ビデオ符号化装置100の符号化単位決定部120において、映像データを符号化するのに経る作業を含む。すなわち、イントラ予測部410は、現在フレーム405において、イントラモードの符号化単位に対してイントラ予測を行い、動き推定部420及び動き補償部425は、インターモードの現在フレーム405及び参照フレーム495を利用して、インター推定及び動き補償を行う。
イントラ予測部410、動き推定部420及び動き補償部425から出力されたデータは、変換部430及び量子化部440を経て、量子化された変換係数として出力される。量子化された変換係数は、逆量子化部460、逆変換部470を介して、空間領域のデータに復元され、復元された空間領域のデータは、デブロッキング部480及びループフィルタリング部490を経て後処理され、参照フレーム495として出力される。量子化された変換係数は、エントロピー符号化部450を経て、ビットストリーム455として出力される。
一実施形態によるビデオ符号化装置100に適用されるためには、映像符号化部400の構成要素である、イントラ予測部410、動き推定部420、動き補償部425、変換部430、量子化部440、エントロピー符号化部450、逆量子化部460、逆変換部470、デブロッキング部480及びループフィルタリング部490が、いずれも最大符号化単位ごとに、最大深度を考慮し、ツリー構造による符号化単位のうち、それぞれの符号化単位に基づいた作業を遂行しなければならない。
特に、イントラ予測部410、動き推定部420及び動き補償部425は、現在最大符号化単位の最大サイズ及び最大深度を考慮し、ツリー構造による符号化単位のうちそれぞれの符号化単位のパーティション及び予測モードを決定し、変換部430は、ツリー構造による符号化単位のうち、それぞれの符号化単位内の変換単位の大きさを決定しなければならない。
特に、イントラ予測部410は、ビデオ符号化装置10のイントラ予測部12の動作を遂行することができる。最大符号化単位ごとに、ツリー構造による符号化単位別に、イントラ予測のための予測単位を決定し、予測単位ごとにイントラ予測を行うことができる。
現在予測単位と左側/上端予測単位とが同一である場合、左側イントラ予測モードと上端イントラ予測モードとが同一であるか、あるいは異なる場合、いずれも複数個の候補イントラ予測モードが決定されるので、エントロピー符号化部450は、予測単位ごとに、MPMフラグを符号化し、すぐに現在予測単位のための候補イントラ予測モードに基づいて決定された現在イントラモード情報を符号化することができる。
図11は、本発明の一実施形態による符号化単位に基づいた映像復号部500のブロック図である。
ビットストリーム505がパージング部510を経て、復号対象である符号化された映像データ、及び復号のために必要な符号化についての情報がパージングされる。符号化された映像データは、エントロピー復号部520及び逆量子化部530を経て、逆量子化されたデータとして出力され、逆変換部540を経て、空間領域の映像データが復元される。
空間領域の映像データに対して、イントラ予測部550は、イントラモードの符号化単位に対してイントラ予測を行い、動き補償部560は、参照フレーム585を共に利用して、インターモードの符号化単位に対して動き補償を行う。
イントラ予測部550及び動き補償部560を経た空間領域のデータは、デブロッキング部570及びループフィルタリング部580を経て後処理され、復元フレーム595として出力される。また、デブロッキング部570及びループフィルタリング部580を経て後処理されたデータは、参照フレーム585として出力される。
ビデオ復号装置200の映像データ復号部230において映像データを復号するために、一実施形態による映像復号部500のパージング部510以後の段階別作業が遂行される。
一実施形態によるビデオ復号装置200に適用されるためには、映像復号部500の構成要素である、パージング部510、エントロピー復号部520、逆量子化部530、逆変換部540、イントラ予測部550、動き補償部560、デブロッキング部570及びループフィルタリング部580が、いずれも最大符号化単位ごとに、ツリー構造による符号化単位に基づいて作業を遂行しなければならない。
特に、イントラ予測部550、動き補償部560は、ツリー構造による符号化単位ごとに、それぞれパーティション及び予測モードを決定し、逆変換部540は、符号化単位ごとに、変換単位の大きさを決定しなければならない。
特に、パージング部510は、ツリー構造による符号化単位別に、イントラ予測のための予測単位が決定された場合、予測単位ごとに、ビットストリームからイントラ予測モードの予測のためのMPMフラグをパージングすることができる。左側イントラ予測モードと上端イントラ予測モードとが相互同一であるか、あるいは異なるかということを判断する必要なく、ビットストリームからMPMフラグに連続し、現在イントラモード情報がパージングされる。エントロピー復号部520は、MPMフラグ及び現在イントラモード情報を含み、ブロックのシンボルのパージングを完了した後、パージングされた情報から、現在イントラ予測モードを復元することができる。イントラ予測部550は、復元された現在イントラ予測モード及びレジデュアルデータを利用して、現在予測単位に対するイントラ予測を行うことができる。
図12は、本発明の一実施形態による深度別符号化単位及びパーティションを図示している。
一実施形態によるビデオ符号化装置100、及び一実施形態によるビデオ復号装置200は、映像特性を考慮するために、階層的な符号化単位を使用する。符号化単位の最大高及び最大幅、最大深度は、映像の特性によって適応的に決定され、ユーザの要求によって、多様に設定されもする。あらかじめ設定された符号化単位の最大サイズによって、深度別符号化単位の大きさが決定される。
一実施形態による符号化単位の階層構造600は、符号化単位の最大高及び最大幅が64であり、最大深度が4である場合を図示している。このとき、最大深度は、最大符号化単位から最小符号化単位までの総分割回数を示す。一実施形態による符号化単位の階層構造600の縦軸に沿って、深度が深くなるので、深度別符号化単位の高さ及び幅がそれぞれ分割される。また、符号化単位の階層構造600の横軸に沿って、それぞれの深度別符号化単位の予測符号化の基盤になる予測単位及びパーティションが図示されている。
すなわち、符号化単位610は、符号化単位の階層構造600において最大符号化単位であって、深度が0であり、符号化単位の大きさ、すなわち、高さ及び幅が64x64である。縦軸に沿って深度が深くなり、サイズ32x32である深度1の符号化単位620、サイズ16x16である深度2の符号化単位630、サイズ8x8である深度3の符号化単位640、サイズ4x4である深度4の符号化単位650が存在する。サイズ4x4である深度4の符号化単位650は、最小符号化単位である。
それぞれの深度別に、横軸に沿って符号化単位の予測単位及びパーティションが配列される。すなわち、深度0のサイズ64x64の符号化単位610が予測単位であるならば、予測単位は、サイズ64x64の符号化単位610に含まれるサイズ64x64のパーティション610、サイズ64x32のパーティション612、サイズ32x64のパーティション614、サイズ32x32のパーティション616に分割される。
同様に、深度1のサイズ32x32の符号化単位620の予測単位は、サイズ32x32の符号化単位620に含まれるサイズ32x32のパーティション620、サイズ32x16のパーティション622、サイズ16x32のパーティション624、サイズ16x16のパーティション626に分割される。
同様に、深度2のサイズ16x16の符号化単位630の予測単位は、サイズ16x16の符号化単位630に含まれるサイズ16x16のパーティション630、サイズ16x8のパーティション632、サイズ8x16のパーティション634、サイズ8x8のパーティション636に分割される。
同様に、深度3のサイズ8x8の符号化単位640の予測単位は、サイズ8x8の符号化単位640に含まれるサイズ8x8のパーティション640、サイズ8x4のパーティション642、サイズ4x8のパーティション644、サイズ4x4のパーティション646に分割される。
最後に、深度4のサイズ4x4の符号化単位650は、最小符号化単位であり、最下位深度の符号化単位であり、当該予測単位も、サイズ4x4のパーティション650だけに設定される。
一実施形態によるビデオ符号化装置100の符号化単位決定部120は、最大符号化単位610の符号化深度を決定するために、最大符号化単位610に含まれるそれぞれの深度の符号化単位ごとに符号化を行わなければならない。
同一及び同一サイズのデータを含むための深度別符号化単位の個数は、深度が深くなるほど、深度別符号化単位の個数も増加する。例えば、深度1の符号化単位一つを含むデータに対して、深度2の符号化単位は、四つが必要である。従って、同一データの符号化結果を深度別に比較するために、1つの深度1の符号化単位、及び4つの深度2の符号化単位を利用して、それぞれ符号化されなければならない。
それぞれの深度別符号化のためには、符号化単位の階層構造600の横軸に沿って、深度別符号化単位の予測単位ごとに符号化を行い、当該深度で最小の符号化誤差である代表符号化誤差が選択される。また、符号化単位の階層構造600の縦軸に沿って深度が深くなり、それぞれの深度ごとに符号化を行い、深度別代表符号化誤差を比較し、最小符号化誤差が検索される。最大符号化単位610において、最小符号化誤差が発生する深度及びパーティションが、最大符号化単位610の符号化深度及びパーティションタイプに選択される。
図13は、本発明の一実施形態による、符号化単位及び変換単位の関係を図示している。
一実施形態によるビデオ符号化装置100、または一実施形態によるビデオ復号装置200は、最大符号化単位ごとに、最大符号化単位より小さいか、あるいはそれと同じ大きさの符号化単位で映像を符号化したり復号したりする。符号化過程において、変換のための変換単位の大きさは、それぞれの符号化単位ほど大きくないデータ単位を基に選択される。
例えば、一実施形態によるビデオ符号化装置100、または一実施形態によるビデオ復号装置200で、現在符号化単位710が64x64サイズであるとき、32x32サイズの変換単位720を利用して変換が行われる。
また、64x64サイズの符号化単位710のデータを64x64サイズ以下の32x32,16x16,8x8,4x4サイズの変換単位にそれぞれ変換を行って符号化した後、原本との誤差が最小である変換単位が選択される。
図14は、一実施形態による深度別符号化情報を図示している。
一実施形態によるビデオ符号化装置100の出力部130は、符号化モードについての情報として、それぞれの符号化深度の符号化単位ごとに、パーティションタイプについての情報800、予測モードについての情報810、変換単位サイズに係わる情報820を符号化して伝送することができる。
パーティションタイプに係わる情報800は、現在符号化単位の予測符号化のためのデータ単位として、現在符号化単位の予測単位が分割されたパーティションの形態に係わる情報を示す。例えば、サイズ2Nx2Nの現在符号化単位CU_0は、サイズ2Nx2Nのパーティション802、サイズ2NxNのパーティション804、サイズNx2Nのパーティション806、サイズNxNのパーティション808のうちいずれか1つのタイプに分割されて利用される。その場合、現在符号化単位のパーティションタイプについての情報800は、サイズ2Nx2Nのパーティション802、サイズ2NxNのパーティション804、サイズNx2Nのパーティション806及びサイズNxNのパーティション808のうち一つを示すように設定される。
予測モードについての情報810は、それぞれのパーティションの予測モードを示す。例えば、予測モードについての情報810を介して、パーティションタイプについての情報800が示すパーティションが、イントラモード812、インターモード814及びスキップモード816のうち一つで予測符号化が行われるかということが設定される。
また、変換単位サイズについての情報820は、現在符号化単位を、いかなる変換単位を基に変換を行うかということを示す。例えば、変換単位は、第1イントラ変換単位サイズ822、第2イントラ変換単位サイズ824、第1インター変換単位サイズ826、第2インター変換単位サイズ828のうち一つでもある。
一実施形態によるビデオ復号装置200の映像データ及び符号化情報抽出部210は、それぞれの深度別符号化単位ごとに、パーティションタイプについての情報800、予測モードについての情報810、変換単位サイズに係わる情報820を抽出して復号に利用することができる。
図15は、本発明の一実施形態による深度別符号化単位を図示している。
深度の変化を示すために分割情報が利用される。分割情報は、現在深度の符号化単位が、下位深度の符号化単位に分割されるか否かということを示す。
深度0及び2N_0x2N_0サイズの符号化単位900の予測符号化のための予測単位910は、2N_0x2N_0サイズのパーティションタイプ912、2N_0xN_0サイズのパーティションタイプ914、N_0x2N_0サイズのパーティションタイプ916、N_0xN_0サイズのパーティションタイプ918を含んでもよい。予測単位が対称的な比率に分割されたパーティション912,914,916,918だけが例示されているが、前述のように、パーティションタイプは、それらに限定されるものではなく、非対称的パーティション、任意的形態のパーティション、幾何学的形態のパーティションなどを含んでもよい。
パーティションタイプごとに、1つの2N_0x2N_0サイズのパーティション、2つの2N_0xN_0サイズのパーティション、2つのN_0x2N_0サイズのパーティション、4つのN_0xN_0サイズのパーティションごとに、反復的に予測符号化が行われなければならない。サイズ2N_0x2N_0、サイズN_0x2N_0、サイズ2N_0xN_0及びサイズN_0xN_0のパーティションについては、イントラモード及びインターモードで予測符号化が行われる。スキップモードは、サイズ2N_0x2N_0のパーティションについてのみ予測符号化が行われる。
サイズ2N_0x2N_0のパーティションタイプ912,2N_0xN_0のパーティションタイプ914及びN_0x2N_0のパーティションタイプ916のパーティションタイプのうち一つによる符号化誤差が最小であれば、それ以上下位深度に分割する必要はない。
サイズN_0xN_0のパーティションタイプ918による符号化誤差が最小であれば、深度0を1に変更しながら分割し(920)、深度2及びサイズN_0xN_0のパーティションタイプの符号化単位930に対して反復的に符号化を行い、最小符号化誤差を検索する。
深度1及びサイズ2N_1x2N_1(=N_0xN_0)の符号化単位930の予測符号化のための予測単位940は、サイズ2N_1x2N_1のパーティションタイプ942、サイズ2N_1xN_1のパーティションタイプ944、サイズN_1x2N_1のパーティションタイプ946、サイズN_1xN_1のパーティションタイプ948を含んでもよい。
また、サイズN_1xN_1のパーティションタイプ948による符号化誤差が最小であれば、深度1を深度2に変更しながら分割し(950)、深度2及びサイズN_2xN_2の符号化単位960に対して反復的に符号化を行い、最小符号化誤差を検索する。
最大深度がdである場合、深度別符号化単位は、深度d−1になるまで設定され、分割情報は、深度d−2まで設定される。すなわち、深度d−2から分割され(970)、深度d−1まで符号化が行われる場合、深度d−1及びサイズ2N_(d−1)x2N_(d−1)の符号化単位980の予測符号化のための予測単位990は、サイズ2N_(d−1)x2N_(d−1)のパーティションタイプ992、サイズ2N_(d−1)xN_(d−1)のパーティションタイプ994、サイズN_(d−1)x2N_(d−1)のパーティションタイプ996、サイズN_(d−1)xN_(d−1)のパーティションタイプ998を含んでもよい。
パーティションタイプにおいて、1つのサイズ2N_(d−1)x2N_(d−1)のパーティション、2つのサイズ2N_(d−1)xN_(d−1)のパーティション、2つのサイズN_(d−1)x2N_(d−1)のパーティション、4つのサイズN_(d−1)xN_(d−1)のパーティションごとに反復的に予測符号化を介した符号化が行われ、最小符号化誤差が発生するパーティションタイプが検索される。
サイズN_(d−1)xN_(d−1)のパーティションタイプ998による符号化誤差が最小であるとしても、最大深度がdであるので、深度d−1の符号化単位CU_(d−1)は、それ以上下位深度への分割過程を経ず、現在最大符号化単位900に対する符号化深度が深度d−1に決定され、パーティションタイプは、N_(d−1)xN_(d−1)に決定される。また、最大深度がdであるので、深度d−1の符号化単位952に対して、分割情報が設定されない。
データ単位999は、現在最大符号化単位に対する「最小単位」とされる。一実施形態による最小単位は、最下位符号化深度である最小符号化単位が4分割された大きさの正方形のデータ単位でもある。かような反復的符号化過程を介して、一実施形態によるビデオ符号化装置100は、符号化単位900の深度別符号化誤差を比較し、最小の符号化誤差が発生する深度を選択し、符号化深度を決定し、当該パーティションタイプ及び予測モードが符号化深度の符号化モードに設定される。
かように、深度0,1,…,d−1,dの全ての深度別最小符号化誤差を比較し、誤差が最小である深度が選択され、符号化深度と決定される。符号化深度、並びに予測単位のパーティションタイプ及び予測モードは、符号化モードについての情報として符号化されて伝送される。また、深度0から符号化深度に至るまで符号化単位が分割されなければならないので、符号化深度の分割情報だけが「0」に設定され、符号化深度を除いた深度別分割情報は、「1」に設定されなければならない。
一実施形態によるビデオ復号装置200の映像データ及び符号化情報抽出部220は、符号化単位900に対する符号化深度及び予測単位についての情報を抽出し、符号化単位912を復号するのに利用することができる。一実施形態によるビデオ復号装置200は、深度別分割情報を利用して、分割情報が「0」である深度を符号化深度と把握し、当該深度に係わる符号化モードについての情報を利用して、復号に利用することができる。
図16、図17及び図18は、本発明の一実施形態による、符号化単位、予測単位及び変換単位の関係を図示している。
符号化単位1010は、最大符号化単位に対して、一実施形態によるビデオ符号化装置100が決定した符号化深度別符号化単位である。予測単位1060は、符号化単位1010において、それぞれの符号化深度別符号化単位の予測単位のパーティションであり、変換単位1070は、それぞれの符号化深度別符号化単位の変換単位である。
深度別符号化単位1010は、最大符号化単位の深度が0であるとすれば、符号化単位1012,1054は、深度が1であり、符号化単位1014,1016,1018,1028,1050,1052は、深度が2であり、符号化単位1020,1022,1024,1026,1030,1032,1048は、深度が3であり、符号化単位1040,1042,1044,1046は、深度が4である。
予測単位1060において、一部パーティション1014,1016,1022,1032,1048,1050,1052,1054は、符号化単位が分割された形態である。すなわち、パーティション1014,1022,1050,1054は、2NxNのパーティションタイプであり、パーティション1016,1048,1052は、Nx2Nのパーティションタイプであり、パーティション1032は、NxNのパーティションタイプである。深度別符号化単位1010の予測単位及びパーティションは、それぞれの符号化単位より小さいか、あるいはそれと同じである。
変換単位1070のうち一部変換単位1052の映像データについては、符号化単位に比べ、小サイズのデータ単位で変換または逆変換が行われる。また、変換単位1014,1016,1022,1032,1048,1050,1052,1054は、予測単位1060において、当該予測単位及びパティションと比較するとき、互いに異なる大きさまたは形態のデータ単位である。すなわち、一実施形態によるビデオ符号化装置100、及び一実施形態に他のビデオ復号装置200は、同一符号化単位に対するイントラ予測/動き推定/動き補償作業、及び変換/逆変換作業であるとしても、それぞれ別個のデータ単位を基に遂行することができる。
それによって、最大符号化単位ごとに、領域別に階層的な構造の符号化単位ごとに再帰的に符号化が行われ、最適符号化単位が決定されることにより、再帰的ツリー構造による符号化単位が構成される。符号化情報は、符号化単位に係わる分割情報、パーティションタイプ情報、予測モード情報、変換単位サイズ情報を含んでもよい。以下、表1は、一実施形態によるビデオ符号化装置100、及び一実施形態によるビデオ復号装置200で設定することができる一例を示す。
一実施形態によるビデオ符号化装置100の出力部130は、ツリー構造による符号化単位に係わる符号化情報を出力し、一実施形態によるビデオ復号装置200の符号化情報抽出部220は、受信されたビットストリームから、ツリー構造による符号化単位に係わる符号化情報を抽出することができる。
分割情報は、現在符号化単位が、下位深度の符号化単位に分割されるか否かということを示す。現在深度dの分割情報が0であるならば、現在符号化単位が下位符号化単位にそれ以上分割されない深度が符号化深度であるので、符号化深度に対して、パーティションタイプ情報、予測モード、変換単位サイズ情報が定義される。分割情報によって、1段階さらに分割されなければならない場合には、分割された4個の下位深度の符号化単位ごとに、独立して符号化が行われなければならない。
予測モードは、イントラモード、インターモード及びスキップモードのうち一つで示すことができる。イントラモード及びインターモードは、全てのパーティションタイプで定義され、スキップモードは、パーティションタイプ2Nx2Nでのみ定義される。
パーティションタイプ情報は、予測単位の高さまたは幅が対称的な比率に分割された対称的パーティションタイプ2Nx2N,2NxN,Nx2N及びNxNと、非対称的な比率に分割された非対称的パーティションタイプ2NxnU,2NxnD,nLx2N,nRx2Nとを示すことができる。非対称的パーティションタイプ2NxnU及び2NxnDは、それぞれ高さが1:3及び3:1に分割された形態であり、非対称的パーティションタイプnLx2N及びnRx2Nは、それぞれ幅が1:3及び3:1に分割された形態を示す。
変換単位サイズは、イントラモードで二種の大きさ、インターモードで二種の大きさに設定される。すなわち、変換単位分割情報が0であるならば、変換単位の大きさが現在符号化単位のサイズ2Nx2Nに設定される。変換単位分割情報が1であるならば、現在符号化単位が分割された大きさの変換単位が設定される。また、サイズ2Nx2Nである現在符号化単位に対するパーティションタイプが対称形パーティションタイプであるならば、変換単位の大きさはNxNに設定され、非対称形パーティションタイプであるならば、N/2xN/2に設定される。
一実施形態による、ツリー構造による符号化単位の符号化情報は、符号化深度の符号化単位、予測単位及び最小単位単位のうち少なくとも一つに対して割り当てられる。符号化深度の符号化単位は、同一符号化情報を保有している予測単位及び最小単位を1以上含んでもよい。
従って、隣接したデータ単位同士それぞれ保有している符号化情報を確認すれば、同一符号化深度の符号化単位に含まれるか否かということが確認される。また、データ単位が保有している符号化情報を利用すれば、当該符号化深度の符号化単位を確認することができるので、最大符号化単位内の符号化深度の分布が類推される。
従って、その場合、現在符号化単位が周辺データ単位を参照して予測する場合、現在符号化単位に隣接する深度別符号化単位内のデータ単位の符号化情報が直接参照されて利用される。
他の実施形態で、現在符号化単位が周辺符号化単位を参照して予測符号化が行われる場合、隣接する深度別符号化単位の符号化情報を利用して、深度別符号化単位内において、現在符号化単位に隣接するデータが検索されることにより、周辺符号化単位が参照されもする。
図19は、表1の符号化モード情報による符号化単位、予測単位及び変換単位の関係を図示している。
最大符号化単位1300は、符号化深度の符号化単位1302,1304,1306,1312,1314,1316,1318を含む。このうち1つの符号化単位1318は、符号化深度の符号化単位であるために、分割情報が0に設定される。サイズ2Nx2Nの符号化単位1318のパーティションタイプ情報は、パーティションタイプ2Nx2N 1322,2NxN 1324,Nx2N 1326,NxN 1328,2NxnU 1332,2NxnD 1334,nLx2N 1336及びnRx2N 1338のうち一つに設定される。
変換単位分割情報(TU size flag)は、変換インデックスの一種であり、変換インデックスに対応する変換単位の大きさは、符号化単位の予測単位タイプまたはパーティションタイプによって変更される。
例えば、パーティションタイプ情報が対称形パーティションタイプ2Nx2N 1322,2NxN1324,Nx2N 1326及びNxN 1328のうち一つに設定されている場合、変換単位分割情報が0であるならば、サイズ2Nx2Nの変換単位1342が設定され、変換単位分割情報が1であるならば、サイズNxNの変換単位1344が設定される。
パーティションタイプ情報が非対称形パーティションタイプ2NxnU 1332,2NxnD 1334,nLx2N 1336及びnRx2N 1338のうち一つに設定された場合、変換単位分割情報(TU size flag)が0であるならば、サイズ2Nx2Nの変換単位1352が設定され、変換単位分割情報が1であるならば、サイズN/2xN/2の変換単位1354が設定される。
変換単位分割情報(TU size flag)は、0または1の値を有するフラグであるが、一実施形態による変換単位分割情報が1ビットのフラグに限定されるものではなく、設定によって、0、1、2、3、…などで増加して変換単位が階層的に分割されもする。変換単位分割情報は、変換インデックスの一実施形態として利用される。
その場合、一実施形態による変換単位分割情報を変換単位の最大サイズ、変換単位の最小サイズと共に利用すれば、実際に利用された変換単位の大きさが表現される。一実施形態によるビデオ符号化装置100は、最大変換単位サイズ情報、最小変換単位サイズ情報及び最大変換単位分割情報を符号化することができる。符号化された最大変換単位サイズ情報、最小変換単位サイズ情報及び最大変換単位分割情報は、SPSに挿入される。一実施形態によるビデオ復号装置200は、最大変換単位サイズ情報、最小変換単位サイズ情報及び最大変換単位分割情報を利用して、ビデオ復号に利用することができる。
例えば、(a)現在符号化単位がサイズ64x64であり、最大変換単位サイズが32x32であるならば、(a−1)変換単位分割情報が0であるとき、変換単位の大きさは、32x32に設定され、(a−2)変換単位分割情報が1であるとき、変換単位の大きさは、16x16に設定され、(a−3)変換単位分割情報が2であるとき、変換単位の大きさは、8x8に設定される。
他の例として、(b)現在符号化単位がサイズ32x32であり、最小変換単位サイズが32x32であるならば、(b−1)変換単位分割情報が0であるとき、変換単位の大きさは、32x32に設定され、変換単位の大きさは、32x32より小さいことがないので、それ以上の変換単位分割情報が設定されない。
さらに他の例として、(c)現在符号化単位がサイズ64x64であり、最大変換単位分割情報が1であるならば、変換単位分割情報は、0または1であり、他の変換単位分割情報が設定されはない。
従って、最大変換単位分割情報を「MaxTransformSizeIndex」と定義し、最小変換単位サイズを「MinTransformSize」と定義し、変換単位分割情報が0である場合の変換単位サイズを「RootTuSize」と定義するとき、現在符号化単位で可能な最小変換単位サイズ「CurrMinTuSize」は、下記数式(A)のように定義される。
CurrMinTuSize
=max(MinTransformSize,RootTuSize/(2^MaxTransformSizeIndex)) (A)
現在符号化単位で可能な最小変換単位サイズ「CurrMinTuSize」と比較し、変換単位分割情報が0である場合の変換単位サイズである「RootTuSize」は、システム上採択可能な最大変換単位サイズを示すことができる。すなわち、数式(A)によれば、「RootTuSize/(2^MaxTransformSizeIndex)」は、変換単位分割情報が0である場合の変換単位サイズである「RootTuSize」を最大変換単位分割情報に相応する回数ほど分割した変換単位サイズであり、「MinTransformSize」は、最小変換単位サイズであるので、それらのうち小さい値が現在符号化単位で可能な最小変換単位サイズ「CurrMinTuSize」でもある。
一実施形態による最大変換単位サイズ「RootTuSize」は、予測モードによっても異なる。
例えば、現在予測モードがインターモードであるならば、「RootTuSize」は、下記数式(B)によって決定される。数式(B)で、「MaxTransformSize」は、最大変換単位サイズを示し、「PUSize」は、現在予測単位サイズを示す。
RootTuSize=min(MaxTransformSize,PUSize) (B)
すなわち、現在予測モードがインターモードであるならば、変換単位分割情報が0である場合の変換単位サイズである「RootTuSize」は、最大変換単位サイズ及び現在予測単位サイズのうち小さい値に設定される。
現在パーティション単位の予測モードがイントラモードであるならば、「RootTuSize」は、下記数式(C)によって決定される。「PartitionSize」は、現在パーティション単位の大きさを示す。
RootTuSize=min(MaxTransformSize,PartitionSize) (C)
すなわち、現在予測モードがイントラモードであるならば、変換単位分割情報が0である場合の変換単位サイズである「RootTuSize」は、最大変換単位サイズ及び現在パーティション単位サイズのうち小さい値に設定される。
ただし、パーティション単位の予測モードによって変動する一実施形態による現在最大変換単位サイズ「RootTuSize」は、一実施形態であるのみ、現在最大変換単位サイズを決定する要因は、それらに限定されるものではないことに留意しなければならない。
図7ないし図19を参照して説明したツリー構造の符号化単位に基づいたビデオ符号化技法によって、ツリー構造の符号化単位ごとに、空間領域の映像データが符号化され、ツリー構造の符号化単位に基づいたビデオ復号技法によって、最大符号化単位ごとに復号が行われながら、空間領域の映像データが復元され、ピクチャ、及びピクチャシーケンスであるビデオが復元される。復元されたビデオは、再生装置によって再生されたり、記録媒体に保存されたり、ネットワークを介して伝送されたりする。
一方、前述の本発明の実施形態は、コンピュータで実行されるプログラムに作成可能であり、コンピュータで読み取り可能な記録媒体を利用して、前記プログラムを動作させる汎用デジタルコンピュータで具現される。前記コンピュータで読み取り可能な記録媒体は、マグネチック記録媒体(例えば、ROM(read only memory)、フロッピー(登録商標)ディスク、ハードディスクなど)、光学的判読媒体(例えば、CD−ROM(compact disc read only memory)、DVD(digital versatile disc)など)のような記録媒体を含む。
説明の便宜のために、先に図1Aないし図19を参照して説明したビデオ符号化方法及び/またはビデオ符号化方法は、「本発明のビデオ符号化方法」とする。また、先に図1Aないし図19を参照して説明したビデオ復号方法及び/またはビデオ復号方法は、「本発明のビデオ復号方法」とする。
また、先に図1Aないし図19を参照して説明したビデオ符号化装置、ビデオ符号化装置またはビデオ符号化部で構成されたビデオ符号化装置は、「本発明のビデオ符号化装置」とする。また、先に図1Aないし図19を参照して説明したインターレイヤビデオ復号装置、ビデオ復号装置またはビデオ復号部で構成されたビデオ復号装置は、「本発明のビデオ復号装置」とする。
一実施形態によるプログラムが保存されるコンピュータで判読可能な記録媒体がディスク26000である実施形態について以下で説明する。
図20は、一実施形態によるプログラムが保存されたディスク26000の物理的構造を例示する。記録媒体として説明したディスク26000は、ハードドライブ、CD−ROMディスク、ブルーレイ(登録商標(Blu-ray))ディスク、DVDディスクでもある。ディスク26000は、多数の同心円のトラックTrから構成され、トラックは、円周方向に沿って、所定個数のセクタSeに分割される。前述の一実施形態によるプログラムを保存するディスク26000において特定領域に、前述の量子化パラメータ決定方法、ビデオ符号化方法及びビデオ復号方法を具現するためのプログラムが割り当てられて保存される。
前述のビデオ符号化方法及びビデオ復号方法を具現するためのプログラムを保存する記録媒体を利用して達成されたコンピュータシステムについて、図21を参照して説明する。
図21は、ディスク26000を利用して、プログラムを記録して判読するためのディスクドライブ26800を図示している。コンピュータシステム26700は、ディスクドライブ26800を利用して、本発明のビデオ符号化方法及びビデオ復号方法のうち少なくとも一つを具現するためのプログラムを、ディスク26000に保存することができる。ディスク26000に保存されたプログラムを、コンピュータシステム26700上で実行するために、ディスクドライブ26800によって、ディスク26000からプログラムが判読され、プログラムがコンピュータシステム26700に伝送される。
図20及び図21で例示されたディスク26000だけではなく、メモリカード、ROMカセット、SSD(solid state drive)にも、本発明のビデオ符号化方法及びビデオ復号方法のうち少なくとも一つを具現するためのプログラムが保存される。
前述の実施形態によるビデオ符号化方法及びビデオ復号方法が適用されたシステムについて説明する。
図22は、コンテンツ流通サービス(content distribution service)を提供するためのコンテンツ供給システム(content supply system)11000の全体的構造を図示している。通信システムのサービス領域は、所定サイズのセルに分割され、各セルに、ベーステーションになる無線基地局11700,11800,11900,12000が設けられる。
コンテンツ供給システム11000は、多数の独立デバイスを含む。例えば、コンピュータ12100、PDA(personal digital assistant)12200、ビデオカメラ12300及び携帯電話12500のような独立デバイスが、インターネットサービス・プロバイダ11200、通信網11400及び無線基地局11700,11800,11900,12000を経て、インターネット11100に連結される。
しかし、コンテンツ供給システム11000は、図24に図示された構造だけに限定されるものではなく、デバイスは、選択的に連結される。独立デバイスは、無線基地局11700,11800,11900,12000を経ずに、通信網11400に直接連結されもする。
ビデオカメラ12300は、デジタルビデオカメラのように、ビデオ映像を撮影することができる撮像デバイスである。携帯電話12500は、PDC(personal digital communications)、CDMA(code division multiple access)方式、W−CDMA(wideband code division multiple access)方式、GSM(登録商標(global system for mobile communications))方式及びPHS(personal handyphone system)方式のような多様なプロトコルのうち少なくとも1つの通信方式を採択することができる。
ビデオカメラ12300は、無線基地局11900及び通信網11400を経て、ストリーミングサーバ11300に連結される。ストリーミングサーバ11300は、ユーザが、ビデオカメラ12300を使用して伝送したコンテンツをリアルタイム放送でストリーミング伝送することができる。ビデオカメラ12300から受信されたコンテンツは、ビデオカメラ12300またはストリーミングサーバ11300によって符号化される。ビデオカメラ12300によって撮影されたビデオデータは、コンピュータ12100を経て、ストリーミングサーバ11300に伝送されもする。
カメラ12600によって撮影されたビデオデータも、コンピュータ12100を経て、ストリーミングサーバ11300に伝送されもする。カメラ12600は、デジタルカメラのように、静止映像とビデオ映像とをいずれも撮影することができる撮像装置である。カメラ12600から受信されたビデオデータは、カメラ12600またはコンピュータ12100によって符号化される。ビデオ符号化及びビデオ復号のためのソフトウェアは、コンピュータ12100がアクセスすることができるCD−ROMディスク、フロッピーディスク、ハードディスクドライブ、SSD、メモリカードのようなコンピュータで判読可能な記録媒体に保存される。
また、携帯電話12500に搭載されたカメラによってビデオが撮影された場合、ビデオデータが携帯電話12500から受信される。
ビデオデータは、ビデオカメラ12300、携帯電話12500またはカメラ12600に搭載されたLSI(large scale integrated circuit)システムによって符号化される。
一実施形態によるコンテンツ供給システム11000において、例えば、コンサートの現場録画コンテンツのように、ユーザが、ビデオカメラ12300、カメラ12600、携帯電話12500または他の撮像デバイスを利用して録画されたコンテンツが符号化され、ストリーミングサーバ11300に伝送される。ストリーミングサーバ11300は、コンテンツデータを要請した他のクライアントに、コンテンツデータをストリーミング伝送することができる。
クライアントは、符号化されたコンテンツデータを復号することができるデバイスであり、例えば、コンピュータ12100、PDA 12200、ビデオカメラ12300または携帯電話12500でもある。従って、コンテンツ供給システム11000は、クライアントをして、符号化されたコンテンツデータを受信して再生させる。また、コンテンツ供給システム11000は、クライアントが、符号化されたコンテンツデータを受信し、リアルタイムで復号して再生するようにし、個人放送(personal broadcasting)を可能にする。
コンテンツ供給システム11000に含まれた独立デバイスの符号化動作及び復号動作に、本発明のビデオ符号化装置及びビデオ復号装置が適用される。
図23及び図24を参照し、コンテンツ供給システム11000において、携帯電話12500の一実施形態について詳細に説明する。図23は、一実施形態による、本発明のビデオ符号化方法及びビデオ復号方法が適用される携帯電話12500の外部構造を図示している。携帯電話12500は、機能が制限されておらず、応用プログラムを介して、相当部分の機能を変更したり拡張したりすることができるスマートフォンでもある。
携帯電話12500は、無線基地局12000とRF信号を交換するための内蔵アンテナ12510を含み、カメラ12530によって撮影された映像、またはアンテナ12510によって受信されて復号された映像をディスプレイするためのLCD(liquid crystal display)画面、OLED(organic lightemittingdiodes)画面のようなディスプレイ画面12520を含む。スマートフォン12510は、制御ボタン、タッチパネルを含む動作パネル12540を含む。ディスプレイ画面12520がタッチスクリーンである場合、動作パネル12540は、ディスプレイ画面12520のタッチ感知パネルをさらに含む。スマートフォン12510は、音声、音響を出力するためのスピーカ12580、または他の形態の音響出力部と、音声、音響が入力されるマイクロフォン12550、または他の形態の音響入力部と、を含む。スマートフォン12510は、ビデオ及び静止映像を撮影するためのCCDカメラのようなカメラ12530をさらに含む。また、スマートフォン12510は、カメラ12530によって撮影されたり、電子メール(E−mail)で受信されたり、他の形態で獲得されたりするビデオや静止映像のように、符号化されるか、あるいは復号されたデータを保存するための記録媒体12570、及び記録媒体12570を携帯電話12500に装着するためのスロット12560を含んでもよい。記録媒体12570は、SDカード、またはプラスチックケースに内蔵されたEEPROM(electrically erasable andprogrammablereadonlymemory)のような他の形態のフラッシュメモリでもある。
図24は、携帯電話12500の内部構造を図示している。ディスプレイ画面12520及び動作パネル12540で構成された携帯電話12500の各パートを組織的に制御するために、電力供給回路12700、動作入力制御部12640、映像符号化部12720、カメラ・インターフェース12630、LCD制御部12620、映像復号部12690、マルチプレクサ/デマルチプレクサ(MUX/DEMUX:multiplexer/demultiplexer)12680、記録/判読部12670、変調/復調(modulation/demodulation)部12660及び音響処理部12650が、同期化バス12730を介して、中央制御部12710に連結される。
ユーザが、電源ボタンを動作し、「電源オフ」状態から「電源オン」状態に設定すれば、電力供給回路12700は、バッテリパックから携帯電話12500の各パートに電力を供給することにより、携帯電話12500が動作モードでセッティングされる。
中央制御部12710は、CPU(central processing unit)、ROM及びRAM(random access memory)を含む。
携帯電話12500が外部に通信データを送信する過程においては、中央制御部12710の制御によって、携帯電話12500においてデジタル信号が生成される、例えば、音響処理部12650においては、デジタル音響信号が生成され、ビデオ符号化部12720においては、デジタル映像信号が生成され、動作パネル12540及び動作入力制御部12640を介して、メッセージのテキストデータが生成される。中央制御部12710の制御によって、デジタル信号が変調/復調部12660に伝達されれば、変調/復調部12660は、デジタル信号の周波数帯域を変調し、通信回路12610は、帯域変調されたデジタル音響信号に対して、D/A変換(digital-analog conversion)処理及び周波数変換(frequency conversion)処理を行う。通信回路12610から出力された送信信号は、アンテナ12510を介して、音声通信基地局または無線基地局12000に送出される。
例えば、携帯電話12500が通話モードであるとき、マイクロフォン12550によって獲得された音響信号は、中央制御部12710の制御によって、音響処理部12650でデジタル音響信号に変換される。生成されたデジタル音響信号は、変調/復調部12660及び通信回路12610を経て送信信号に変換され、アンテナ12510を介して送出される。
データ通信モードにおいて、電子メールのようなテキストメッセージが伝送される場合、動作パネル12540を利用して、メッセージのテキストデータが入力され、テキストデータが、動作入力制御部12640を介して、中央制御部12610に伝送される。中央制御部12610の制御によって、テキストデータは、変調/復調部12660及び通信回路12610を介して送信信号に変換され、アンテナ12510を介して、無線基地局12000に送出される。
データ通信モードで映像データを伝送するために、カメラ12530によって撮影された映像データが、カメラ・インターフェース12630を介して、映像符号化部12720に提供される。カメラ12530によって撮影された映像データは、カメラ・インターフェース12630及びLCD制御部12620を介して、ディスプレイ画面12520で直ちにディスプレイされる。
映像符号化部12720の構造は、前述の本発明のビデオ符号化装置の構造と相応する。映像符号化部12720は、カメラ12530から提供された映像データを、前述の本発明のビデオ符号化方式によって符号化し、圧縮符号化された映像データに変換して、符号化された映像データを、多重化/逆多重化部12680に出力することができる。カメラ12530の録画中、携帯電話12500のマイクロフォン12550によって獲得された音響信号も、音響処理部12650を経てデジタル音響データに変換され、デジタル音響データは、多重化/逆多重化部12680に伝達される。
多重化/逆多重化部12680は、音響処理部12650から提供された音響データと共に、映像符号化部12720から提供された符号化された映像データを多重化する。多重化されたデータは、変調/復調部12660及び通信回路12610を介して送信信号に変換され、アンテナ12510を介して送出される。
携帯電話12500が外部から通信データを受信する過程では、アンテナ12510を介して受信された信号を、周波数復元(frequency recovery)処理及びA/D変換(analog-digitalconversion)処理を介してデジタル信号を変換する。変調/復調部12660は、デジタル信号の周波数帯域を復調する。帯域復調されたデジタル信号は、種類によって、ビデオ復号部12690、音響処理部12650またはLCD制御部12620に伝達される。
携帯電話12500は、通話モードであるとき、アンテナ12510を介して受信された信号を増幅し、周波数変換処理及びA/D変換(analog-digital conversion)処理を介して、デジタル音響信号を生成する。受信されたデジタル音響信号は、中央制御部12710の制御によって、変調/復調部12660及び音響処理部12650を経て、アナログ音響信号に変換され、アナログ音響信号がスピーカ12580を介して出力される。
データ通信モードにおいて、インターネットのウェブサイトからアクセスされたビデオファイルのデータが受信される場合、アンテナ12510を介して、無線基地局12000から受信された信号は、変調/復調部12660の処理結果、多重化されたデータを出力し、多重化されたデータは、多重化/逆多重化部12680に伝達される。
アンテナ12510を介して受信した多重化されたデータを復号するために、多重化/逆多重化部12680は、多重化されたデータを逆多重化し、符号化されたビデオデータストリームと、符号化されたオーディオデータストリームとが分離される。同期化バス12730によって、符号化されたビデオデータストリームは、ビデオ復号部12690に提供され、符号化されたオーディオデータストリームは、音響処理部12650に提供される。
映像復号部12690の構造は、前述の本発明のビデオ復号装置の構造と相応する。映像復号部12690は、前述の本発明のビデオ復号方法を利用して、符号化されたビデオデータを復号し、復元されたビデオデータを生成し、復元されたビデオデータを、LCD制御部12620を経て、ディスプレイ画面12520に復元されたビデオデータを提供することができる。
それによって、インターネットのウェブサイトからアクセスされたビデオファイルのビデオデータが、ディスプレイ画面12520でディスプレイされる。それと同時に、音響処理部12650も、オーディオデータをアナログ音響信号に変換し、アナログ音響信号を、スピーカ12580に提供することができる。それにより、インターネットのウェブサイトからアクセスされたビデオファイルに含まれたオーディオデータも、スピーカ12580で再生される。
携帯電話12500、または他の形態の通信端末機は、本発明のビデオ符号化装置及びビデオ復号装置をいずれも含む送受信端末機であるか、前述の本発明のビデオ符号化装置のみを含む送信端末機であるか、本発明のビデオ復号装置のみを含む受信端末機でもある。
本発明の通信システムは、図24を参照して説明した構造に限定されるものではない。例えば、図25は、一実施形態による通信システムが適用されたデジタル放送システムを図示している。
図25の一実施形態によるデジタル放送システムは、本発明のビデオ符号化装置及びビデオ復号装置を利用して、衛星ネットワークまたは地上波ネットワークを介して伝送されるデジタル放送を受信することができる。
具体的に見れば、放送局12890は、電波を介して、ビデオデータストリームを通信衛星または放送衛星12900に伝送する。放送衛星12900は、放送信号を伝送し、放送信号は、家庭にあるアンテナ12860によって、衛星放送受信機に受信される。各家庭において、符号化されたビデオストリームは、TV(television)受信機12810、セットトップボックス(set-top box)12870、または他のデバイスによって復号されて再生される。
再生装置12830において、本発明のビデオ復号装置が具現されることにより、再生装置12830が、ディスク及びメモリカードのような記録媒体12820に記録された符号化されたビデオストリームを判読して復号することができる。それによって、復元されたビデオ信号は、例えば、モニタ12840で再生される。
衛星/地上波放送のためのアンテナ12860またはケーブルTV受信のためのケーブルアンテナ12850に連結されたセットトップボックス12870にも、本発明のビデオ復号装置が搭載される。セットトップボックス12870の出力データも、TVモニタ12880で再生される。
他の例として、セットトップボックス12870の代わりに、TV受信機12810自体に本発明のビデオ復号装置が搭載されもする。
適切なアンテナ12910を具備した自動車12920が、衛星12800または無線基地局11700から送出される信号を受信することもできる。自動車12920に搭載された自動車ナビゲーションシステム12930のディスプレイ画面に、復号されたビデオが再生される。
ビデオ信号は、本発明のビデオ符号化装置によって符号化され、記録媒体に記録されて保存される。具体的に見れば、DVDレコーダによって、映像信号が、DVDディスク12960に保存されるか、あるいはハードディスクレコーダ12950によって、ハードディスクに映像信号が保存される。他の例として、ビデオ信号は、SDカード12970に保存されもする。ハードディスクレコーダ12950が、一実施形態による本発明のビデオ復号装置を具備すれば、DVDディスク12960、SDカード12970、または他の形態の記録媒体に記録されたビデオ信号がモニタ12880で再生される。
自動車ナビゲーションシステム12930は、図24のカメラ12530、カメラ・インターフェース12630及びビデオ符号化部12720を含まないこともある。例えば、コンピュータ12100及びTV受信機12810も、図24のカメラ12530、カメラ・インターフェース12630及びビデオ符号化部12720を含まないこともある。
図26は、一実施形態によるビデオ符号化装置及びビデオ復号装置を利用するクラウドコンピューティングシステムのネットワーク構造を図示している。
本発明のクラウドコンピューティングシステムは、クラウドコンピューティングサーバ14100、ユーザDB(database)14100、コンピューティング資源14200及びユーザ端末機を含んでなる。
クラウドコンピューティングシステムは、ユーザ端末機の要請によって、インターネットのような情報通信網を介して、コンピューティング資源のオンデマンド・アウトソーシングサービスを提供する。クラウドコンピューティング環境において、サービスプロバイダは、互いに異なる物理的な位置に存在するデータセンターのコンピューティング資源を仮想化技術で統合し、ユーザが必要とするサービスを提供する。サービスユーザは、アプリケーション(application)、ストレージ(storage)、運用体制(OS)、保安(security)などのコンピューティング資源を、各ユーザ所有の端末にインストールして使用するのではなく、仮想化技術を介して生成された仮想空間上のサービスを、所望時点に所望程度選んで使用することができる。
特定サービスユーザのユーザ端末機は、インターネット及び移動通信網を含む情報通信網を介して、クラウドコンピューティングサーバ14100に接続する。ユーザ端末機は、クラウドコンピューティングサーバ14100からクラウドコンピューティングサービス、特に、動画再生サービスを提供される。ユーザ端末機は、デスクトップPC(personal computer)14300、スマートTV 14400、スマートフォン14500、ノート型パソコン14600、PMP(portable multimedia player)14700、タブレットPC 14800などインターネット接続が可能な全ての電子機器にもなる。
クラウドコンピューティングサーバ14100は、クラウド網に分散している多数のコンピューティング資源14200を統合し、ユーザ端末機に提供することができる。多数のコンピューティング資源14200は、さまざまなデータサービスを含み、ユーザ端末機からアップロードされたデータを含んでもよい。かようにクラウドコンピューティングサーバ14100は、多くのところに分散している動画データベースを仮想化技術で統合し、ユーザ端末機が要求するサービスを提供する。
ユーザDB 14100には、クラウドコンピューティングサービスに加入しているユーザ情報が保存される。ここで、ユーザ情報は、ログイン情報と、住所、氏名など個人信用情報を含んでもよい。また、ユーザ情報は、動画のインデックス(index)を含んでもよい。ここで、該インデックスは、再生を完了した動画リストや、再生中の動画リストや、再生中の動画の停止時点などを含んでもよい。
ユーザDB 14100に保存された動画に係わる情報は、ユーザデバイス間に共有される。従って、例えば、ノート型パソコン14600から再生要請され、ノート型パソコン14600に所定動画サービスを提供した場合、ユーザDB 14100に、所定動画サービスの再生ヒストリーが保存される。スマートフォン14500から、同一動画サービスの再生要請が受信される場合、クラウドコンピューティングサーバ14100は、ユーザDB 14100を参照し、所定動画サービスを求めて再生する。スマートフォン14500が、クラウドコンピューティングサーバ14100を介して動画データストリームを受信する場合、動画データストリームを復号してビデオを再生する動作は、先に図24を参照して説明した携帯電話12500の動作と類似している。
クラウドコンピューティングサーバ14100は、ユーザDB 14100に保存された所定動画サービスの再生ヒストリーを参照することもできる。例えば、クラウドコンピューティングサーバ14100は、ユーザ端末機から、ユーザDB 14100に保存された動画に対する再生要請を受信する。動画がそれ以前に再生中であったのであるならば、クラウドコンピューティングサーバ14100は、ユーザ端末機からの選択によって、最初から再生するか、あるいは以前停止時点から再生するかということにより、ストリーミング方法が異なる。例えば、ユーザ端末機が、最初から再生するように要請した場合には、クラウドコンピューティングサーバ14100が、ユーザ端末機に、当該動画を最初のフレームからストリーミング伝送する。一方、該端末機が、以前停止時点から続けて再生するように要請した場合には、クラウドコンピューティングサーバ14100は、ユーザ端末機に、当該動画を停止時点のフレームからストリーミング伝送する。
このとき、ユーザ端末機は、図1Aないし図19を参照して説明した本発明のビデオ復号装置を含んでもよい。他の例として、ユーザ端末機は、図1Aないし図19を参照して説明した本発明のビデオ符号化装置を含んでもよい。また、ユーザ端末機は、図1Aないし図19を参照して説明した本発明のビデオ符号化装置及びビデオ復号装置をいずれも含んでもよい。
図1Aないし図19を参照して説明したビデオ符号化方法及びビデオ復号方法、ビデオ符号化装置及びビデオ復号装置が活用される一実施形態について、図20ないし図26で説明した。しかし、図1Aないし図19を参照して説明したビデオ符号化方法及びビデオ復号方法が記録媒体に保存されるか、あるいはビデオ符号化装置及びビデオ復号装置がデバイスで具現される一実施形態は、図20ないし図26の実施形態に限定されるものではない。
本発明による方法、プロセス、装置、製品及び/またはシステムは、簡単であり、コスト面で効果的であり、複雑ではなく、非常に多様で正確である。また、本発明による、プロセス、装置、製品及びシステムに、周知の構成要素を適用することにより、直ちに利用することができ、効率的であって経済的な製造、応用及び活用を具現することができる。本発明の他の重要な側面は、コスト低減、システム単純化、性能向上を要求する現状に符合する。かような本発明の実施形態に見られる有用な様相は、結果的に、少なくとも現技術のレベルを高めるであろう。
本発明は、特定の最上の実施形態と係わって説明したが、それら以外に、本発明に、代替、変形及び修正が適用された発明は、前述の説明に照らし合わせ、当業者に明白であろう。すなわち、特許請求の範囲は、かような全ての代替、変形及び修正された発明を含むものであると解釈する。従って、本明細書及び図面で説明した全ての内容は、例示的であって非制限的な意味に解釈されるものではない。

Claims (10)

  1. デプス映像を構成する現在ブロックの予測モード情報をビットストリームから獲得する段階と、
    前記獲得された予測モード情報に基づいて、前記現在ブロックの予測ブロックを生成する段階と、
    前記予測ブロックを利用して、前記デプス映像を復号する段階と、を含み、
    前記現在ブロックの予測モード情報をビットストリームから獲得する段階は、
    前記現在ブロックを、パターンによって、2以上のパーティションに分割して予測することに対する許容いかんを示す第1フラグ、前記デプス映像が、前記デプス映像を構成するブロックを、ウェッジレットを境界に、2以上のパーティションに分割して予測することに対する許容いかんを示す第2フラグ、及び前記デプス映像が、前記デプス映像を構成するブロックを、コントゥールを境界に、2以上のパーティションに分割して予測することに対する許容いかんを示す第3フラグを受信する段階と、
    前記第1フラグ、第2フラグ及び第3フラグに基づいて決定される所定条件を満足する場合に限り、前記現在ブロックを、パターンによって、2以上のパーティションに分割する方法のタイプに係わる情報を示す第4フラグを、前記ビットストリームから受信する段階と、を含むことを特徴とするインターレイヤビデオ復号方法。
  2. 前記第2フラグは、
    前記デプス映像が、前記デプス映像を構成する構成するブロックを、イントラSDC(simplified depth coding)モードを使用して予測することに対する許容いかんをさらに含むことを特徴とする請求項1に記載のインターレイヤビデオ復号方法。
  3. 前記第4フラグは、
    前記現在ブロックを、ウェッジレットを使用して、2個以上のパーティションに分割して予測する方法、及び前記現在ブロックを、コントゥールを使用して、2個以上のパーティションに分割して予測する方法のうちいずれか一つを特定することを特徴とする請求項1に記載のインターレイヤビデオ復号方法。
  4. 前記第3フラグは、
    前記デプス映像が、前記デプス映像を構成する各ブロックと対応するテクスチュア映像を参照することを許容しない場合には、前記デプス映像が、前記デプス映像を構成するブロックを、コントゥールを境界に、2以上のパーティションに分割して予測する方法を許容しないことを示すことを特徴とする請求項1に記載のインターレイヤビデオ復号方法。
  5. 前記デプス映像の予測モード情報を獲得する段階は、
    前記第1フラグが、前記現在ブロックを、パターンによって、2以上のパーティションに分割して予測する方法を許容するということを示し、前記第2フラグが、前記デプス映像が、前記デプス映像を構成するブロックを、ウェッジレットを境界に、2以上のパーティションに分割して予測する方法を許容するということを示し、前記第3フラグが、前記デプス映像が、前記デプス映像を構成するブロックを、コントゥールを境界に、2以上のパーティションに分割して予測する方法を許容するということを示す場合にだけ、前記所定条件を満足すると決定する段階を含むことを特徴とする請求項1に記載のインターレイヤビデオ復号方法。
  6. 前記デプス映像の予測モード情報を獲得する段階は、
    前記所定条件を満足せず、第2フラグが、前記デプス映像が、前記デプス映像を構成するブロックを、ウェッジレットを境界に、2以上のパーティションに分割して予測する方法を許容するということを示し、第3フラグが、前記デプス映像が、前記デプス映像を構成するブロックを、コントゥールを境界に、2以上のパーティションに分割して予測する方法を許容しないことを示すとき、前記現在ブロックを、ウェッジレットを使用して、2個以上のパーティションに分割して予測すると決定し、
    前記所定条件を満足せず、第2フラグが、前記デプス映像が、前記デプス映像を構成するブロックを、ウェッジレットを境界に、2以上のパーティションに分割して予測する方法を許容しないことを示し、第3フラグが、前記デプス映像が、前記デプス映像を構成するブロックを、コントゥールを境界に、2以上のパーティションに分割して予測する方法を許容するということを示すとき、前記現在ブロックを、コントゥールを使用して、2個以上のパーティションに分割して予測すると決定することを特徴とする請求項1に記載のインターレイヤビデオ復号方法。
  7. デプス映像を構成する現在ブロックの予測モードを決定する段階と、
    前記決定された予測モードを利用して、前記現在ブロックの予測ブロックを生成する段階と、
    前記予測ブロックを利用して、前記デプス映像を符号化してビットストリームを生成する段階と、を含み、
    前記現在ブロックの予測モードを決定する段階は、前記現在ブロックを、パターンによって、2以上のパーティションに分割して予測することに対する許容いかんを示す第1フラグ、前記デプス映像が、前記デプス映像を構成するブロックを、ウェッジレットを境界に、2以上のパーティションに分割して予測することに対する許容いかんを示す第2フラグ、及び前記デプス映像が、前記デプス映像を構成するブロックを、コントゥールを境界に、2以上のパーティションに分割して予測することに対する許容いかんを示す第3フラグを生成する段階と、
    前記第1フラグ、第2フラグ及び第3フラグに基づいて決定される所定条件を満足する場合に限り、前記現在ブロックを、パターンによって、2以上のパーティションに分割する方法のタイプに係わる情報を示す第4フラグを生成する段階と、を含むことを特徴とするインターレイヤビデオ符号化方法。
  8. デプス映像を構成する現在ブロックの予測モード情報をビットストリームから獲得する予測モード決定部と、
    前記獲得された予測モード情報に基づいて、前記現在ブロックの予測ブロックを生成する予測ブロック生成部と、
    前記予測ブロックを利用して、前記デプス映像を復号する復号部と、を含み、
    前記予測モード決定部は、前記現在ブロックを、パターンによって、2以上のパーティションに分割して予測することに対する許容いかんを示す第1フラグ、前記デプス映像が、前記デプス映像を構成するブロックを、ウェッジレットを境界に、2以上のパーティションに分割して予測することに対する許容いかんを示す第2フラグ、及び前記デプス映像が、前記デプス映像を構成するブロックを、コントゥールを境界に、2以上のパーティションに分割して予測することに対する許容いかんを示す第3フラグを受信して、前記受信された第1フラグ、第2フラグ及び第3フラグに基づいて決定される所定条件を満足する場合に限り、前記現在ブロックを、パターンによって、2以上のパーティションに分割する方法のタイプに係わる情報を示す第4フラグを、前記ビットストリームから受信することを特徴とするインターレイヤビデオ復号装置。
  9. デプス映像を構成する現在ブロックの予測モードを決定する予測モード決定部と、
    前記決定された予測モードを利用して、前記現在ブロックの予測ブロックを生成する予測ブロック生成部と、
    前記予測ブロックを利用して、前記デプス映像を符号化してビットストリームを生成する符号化部と、を含み、
    前記予測モード決定部は、前記現在ブロックを、パターンによって、2以上のパーティションに分割して予測することに対する許容いかんを示す第1フラグ、前記デプス映像が、前記デプス映像を構成するブロックを、ウェッジレットを境界に、2以上のパーティションに分割して予測することに対する許容いかんを示す第2フラグ、及び前記デプス映像が、前記デプス映像を構成するブロックを、コントゥールを境界に、2以上のパーティションに分割して予測することに対する許容いかんを示す第3フラグを生成し、前記第1フラグ、第2フラグ及び第3フラグに基づいて決定される所定条件を満足する場合に限り、前記現在ブロックを、パターンによって、2以上のパーティションに分割する方法のタイプに係わる情報を示す第4フラグを生成することを特徴とするインターレイヤビデオ符号化装置。
  10. 請求項1ないし7のうちいずれか1項に記載の方法をコンピュータで実行させるためのプログラムを記録したコンピュータで読み取り可能な記録媒体。
JP2016573764A 2014-06-20 2015-06-22 インターレイヤビデオ符号化/復号のためのデプス映像の予測モード伝送方法及びその装置 Pending JP2017523682A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201462014811P 2014-06-20 2014-06-20
US62/014,811 2014-06-20
PCT/KR2015/006283 WO2015194915A1 (ko) 2014-06-20 2015-06-22 인터 레이어 비디오 부복호화를 위한 깊이 영상의 예측 모드 전송 방법 및 장치

Publications (1)

Publication Number Publication Date
JP2017523682A true JP2017523682A (ja) 2017-08-17

Family

ID=54935817

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016573764A Pending JP2017523682A (ja) 2014-06-20 2015-06-22 インターレイヤビデオ符号化/復号のためのデプス映像の予測モード伝送方法及びその装置

Country Status (5)

Country Link
US (1) US10368098B2 (ja)
JP (1) JP2017523682A (ja)
KR (1) KR20170023000A (ja)
CN (1) CN106464908A (ja)
WO (1) WO2015194915A1 (ja)

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU3250093A (en) 1991-12-12 1993-07-19 Gilead Sciences, Inc. Nuclease stable and binding competent oligomers and methods for their use
WO2016056550A1 (ja) * 2014-10-08 2016-04-14 シャープ株式会社 画像復号装置
US10297009B2 (en) * 2014-12-22 2019-05-21 Interdigital Ce Patent Holdings Apparatus and method for generating an extrapolated image using a recursive hierarchical process
JP2018050091A (ja) * 2015-02-02 2018-03-29 シャープ株式会社 画像復号装置、画像符号化装置および予測ベクトル導出装置
US10142627B2 (en) 2015-06-18 2018-11-27 Qualcomm Incorporated Intra prediction and intra mode coding
US10841593B2 (en) 2015-06-18 2020-11-17 Qualcomm Incorporated Intra prediction and intra mode coding
US11463689B2 (en) 2015-06-18 2022-10-04 Qualcomm Incorporated Intra prediction and intra mode coding
CN113965747B (zh) * 2016-07-05 2024-06-14 株式会社Kt 对视频进行解码或编码的方法和计算机可读介质
CN107071478B (zh) * 2017-03-30 2019-08-20 成都图必优科技有限公司 基于双抛物线分区模板的深度图编码方法
CN113709439B (zh) * 2017-04-11 2024-05-14 杜比实验室特许公司 用于渲染视觉对象的方法、装置及***
CN108234987A (zh) * 2018-01-23 2018-06-29 西南石油大学 一种用于深度图像边界拟合的双抛物线分区模板优化方法
US11277644B2 (en) 2018-07-02 2022-03-15 Qualcomm Incorporated Combining mode dependent intra smoothing (MDIS) with intra interpolation filter switching
US11303885B2 (en) 2018-10-25 2022-04-12 Qualcomm Incorporated Wide-angle intra prediction smoothing and interpolation
RU2767513C1 (ru) 2018-12-28 2022-03-17 Телефонактиеболагет Лм Эрикссон (Пабл) Способ и оборудование для проведения выбора преобразования в кодере и декодере
CN113330741B (zh) * 2019-02-15 2022-12-30 华为技术有限公司 从帧内子划分译码模式工具限制子分区的尺寸的编码器、解码器、及对应方法
EP3987799A1 (en) * 2019-06-24 2022-04-27 InterDigital VC Holdings France, SAS Intra prediction for video encoding and decoding
WO2021110045A1 (en) * 2019-12-03 2021-06-10 Huawei Technologies Co., Ltd. Coding method, device, system with merge mode

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104270639B (zh) 2006-01-09 2017-08-18 杜比国际公司 为多视点视频编码提供降低分辨率更新模式的方法和装置
ZA200805337B (en) 2006-01-09 2009-11-25 Thomson Licensing Method and apparatus for providing reduced resolution update mode for multiview video coding
TR201807638T4 (tr) 2010-08-11 2018-06-21 Ge Video Compression Llc Multi görüntü sinyali kodeği.
CN101945288B (zh) 2010-10-19 2011-12-21 浙江理工大学 一种基于h.264压缩域图像深度图生成方法
KR20120068743A (ko) 2010-12-17 2012-06-27 한국전자통신연구원 인터 예측 방법 및 그 장치
CN102857763B (zh) * 2011-06-30 2016-02-17 华为技术有限公司 一种基于帧内预测的解码方法和解码装置
US9363535B2 (en) 2011-07-22 2016-06-07 Qualcomm Incorporated Coding motion depth maps with depth range variation
WO2013042884A1 (ko) 2011-09-19 2013-03-28 엘지전자 주식회사 영상 부호화/복호화 방법 및 그 장치
MX2014005114A (es) 2011-10-28 2014-08-27 Samsung Electronics Co Ltd Metodo y aparato para intra-prediccion de video.
WO2013068564A1 (en) * 2011-11-11 2013-05-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Effective wedgelet partition coding using spatial prediction
CN109257599B (zh) 2011-11-11 2023-05-16 Ge视频压缩有限责任公司 解码器、编码器及重构、编码、解码、传送和处理方法
KR20230098693A (ko) * 2011-11-11 2023-07-04 지이 비디오 컴프레션, 엘엘씨 분할 코딩을 이용한 효과적인 예측
CN104025601A (zh) 2011-12-30 2014-09-03 数码士有限公司 编码三维图像的方法和设备以及解码方法和设备
CN103067716B (zh) 2013-01-10 2016-06-29 华为技术有限公司 深度图像的编解码方法和编解码装置
CN103237214B (zh) 2013-04-12 2016-06-08 华为技术有限公司 深度图像的编解码方法和编解码装置
US10404999B2 (en) * 2013-09-27 2019-09-03 Qualcomm Incorporated Residual coding for depth intra prediction modes
US9756359B2 (en) * 2013-12-16 2017-09-05 Qualcomm Incorporated Large blocks and depth modeling modes (DMM'S) in 3D video coding
CN104010196B (zh) 2014-03-14 2017-02-15 北方工业大学 基于hevc的3d质量可伸缩视频编码

Also Published As

Publication number Publication date
CN106464908A (zh) 2017-02-22
US10368098B2 (en) 2019-07-30
US20170251224A1 (en) 2017-08-31
KR20170023000A (ko) 2017-03-02
WO2015194915A1 (ko) 2015-12-23

Similar Documents

Publication Publication Date Title
KR102329126B1 (ko) 인터 레이어 비디오의 복호화 및 부호화를 위한 머지 후보 리스트 구성 방법 및 장치
KR102290420B1 (ko) 비디오 부호화 방법 및 그 장치, 비디오 복호화 방법 및 그 장치
US10368098B2 (en) Method and device for transmitting prediction mode of depth image for interlayer video encoding and decoding
KR102270787B1 (ko) 휘도차를 보상하기 위한 인터 레이어 비디오 부호화 방법 및 그 장치, 비디오 복호화 방법 및 그 장치
KR102216128B1 (ko) 움직임 벡터 결정 방법 및 그 장치
KR102091139B1 (ko) 다시점 비디오의 인터 레이어 예측 구조에 따른 비디오 스트림 부호화 방법 및 그 장치, 다시점 비디오의 인터 레이어 예측 구조에 따른 비디오 스트림 복호화 방법 및 그 장치
JP6742243B2 (ja) 輝度補償を利用したインターレイヤビデオ符号化方法及びその装置、該ビデオ復号化方法及びその装置
EP3024240A1 (en) Intra scene prediction method of depth image for interlayer video decoding and encoding apparatus and method
KR20130116832A (ko) 트리 구조의 부호화 단위에 기초한 다시점 비디오 부호화 방법 및 그 장치, 트리 구조의 부호화 단위에 기초한 다시점 비디오 복호화 방법 및 그 장치
KR102199461B1 (ko) 적응적 휘도 보상을 위한 인터 레이어 비디오 부호화 방법 및 그 장치, 비디오 복호화 방법 및 그 장치
JP6367965B2 (ja) デプス映像を符号化または復号する方法、及びその装置
KR102399593B1 (ko) 다 시점 영상 부호화/복호화 방법 및 장치
KR20150106380A (ko) 인터 레이어 비디오 부복호화를 위한 깊이 영상의 예측 모드 전송 방법 및 장치
KR20150043226A (ko) 깊이 인트라 부호화 방법 및 그 장치, 복호화 방법 및 그 장치
JP6374605B2 (ja) 映像を復号する方法、装置及び記録媒体
JP2017505037A (ja) デプス符号化方法及びその装置、デプス復号化方法及びその装置
KR102047501B1 (ko) 인터-레이어 예측을 이용한 멀티 레이어 영상 부호화 또는 복호화 방법 및 장치
KR101919015B1 (ko) 다 시점 영상 부호화/복호화 방법 및 장치
KR20130119380A (ko) 슬라이스 헤더를 이용하는 3차원 비디오 부호화 방법 및 그 장치, 다시점 비디오 복호화 방법 및 그 장치
JP2017518706A (ja) デプスブロックを利用する、マルチレイヤビデオ符号化方法及びマルチレイヤビデオ復号方法
JP2017513426A (ja) 類型情報を利用した、マルチレイヤビデオ符号化方法及びマルチレイヤビデオ復号方法
KR20160138129A (ko) 뎁스 블록을 이용한 멀티 레이어 비디오 부호화 방법 및 멀티 레이어 비디오 복호화 방법.
KR20170019362A (ko) 뎁스 블록을 이용한 멀티 레이어 비디오 부호화 방법 및 멀티 레이어 비디오 복호화 방법
KR20150043227A (ko) 뎁스 인터 부호화 방법 및 그 장치, 복호화 방법 및 그 장치
KR102193620B1 (ko) 인터 레이어 비디오 복호화 및 부호화 장치 및 방법을 위한 디스패리티 벡터 예측 방법

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180619

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20190426

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190514

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20191203