JP5179484B2 - マルチレイヤ・ビットストリームデータを情報伝達するための方法およびシステム - Google Patents

マルチレイヤ・ビットストリームデータを情報伝達するための方法およびシステム Download PDF

Info

Publication number
JP5179484B2
JP5179484B2 JP2009516783A JP2009516783A JP5179484B2 JP 5179484 B2 JP5179484 B2 JP 5179484B2 JP 2009516783 A JP2009516783 A JP 2009516783A JP 2009516783 A JP2009516783 A JP 2009516783A JP 5179484 B2 JP5179484 B2 JP 5179484B2
Authority
JP
Japan
Prior art keywords
layer
bit rate
representation
scalable
bitstream
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2009516783A
Other languages
English (en)
Other versions
JP2010507267A (ja
Inventor
エー.セガール クリストファー
サン シジュン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Publication of JP2010507267A publication Critical patent/JP2010507267A/ja
Application granted granted Critical
Publication of JP5179484B2 publication Critical patent/JP5179484B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • H04N19/36Scalability techniques involving formatting the layers as a function of picture distortion after decoding, e.g. signal-to-noise [SNR] scalability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/115Selection of the code volume for a coding unit prior to coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/13Adaptive entropy coding, e.g. adaptive variable length coding [AVLC] or context adaptive binary arithmetic coding [CABAC]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/187Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a scalable video layer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • H04N19/33Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability in the spatial domain
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/40Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video transcoding, i.e. partial or full decoding of a coded input stream followed by re-encoding of the decoded output stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/48Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using compressed domain processing techniques other than decoding, e.g. modification of transform coefficients, variable length coding [VLC] data or run-length data
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

本発明の実施形態は、マルチレイヤ・ビットストリームデータを情報伝達するための方法およびシステムを含んでいる。
エンコーダ出力のビットレートを下げるために、スケーラブルなビットストリームは、レイヤ間予測の一形態を含みうる。典型的なシステムは、AVC|H。264ビデオ符号化標準のためのスケーラブルなビデオ拡張におけるレイヤ間予測を含んでいる。上記拡張はSVCとして一般に知られており、SVCシステムはT.Wiegand、G.Sullivan、J.Reichel、H.Schwarz and M.Wien、"Joint Draft 9 of SVC amendment (revision 2)"、JVT-V201、Marrakech、Morocco、January 13-19、2007(本文献は、参照によって本明細書に組み込まれるものとする)に記載されている。上記SVCシステムにおいて、レイヤ間予測は、列挙された(enumerated)下位レイヤから列挙された上位レイヤへ動きおよびモードの情報を投影する(project)ことによって実現される。それに加えて、予測残差が、列挙された下位レイヤから列挙された上位レイヤへ投影される。したがって、上記の上位レイヤのビットストリームは、復号された出力の質を改善するために追加の残差を含むことができる。
本発明の第1の態様によれば、拡張されたマルチレイヤビットストリームを作成するための方法であって、a)ビデオシーケンスのスケーラブルなマルチレイヤ表現を受信するステップ;b)上記ビデオシーケンスのレイヤの非スケーラブルな単一レイヤ表現に関連する、上記ビデオシーケンスの上記レイヤの第1のビットレート特性を決定するステップ;およびc)ビットレート特性データを上記スケーラブルなマルチレイヤ表現に添付(attach)して、拡張されたスケーラブルな表現を形成するステップを含む方法が提供される。
本発明の第1の態様によれば、拡張されたマルチレイヤビットストリームを作成するためのシステムであって、ビデオシーケンスのスケーラブルなマルチレイヤ表現を受信する受信機;上記ビデオシーケンスのレイヤの非スケーラブルな単一レイヤ表現に関する、上記ビデオシーケンスの上記レイヤの第1のビットレート特性を決定する決定器;および拡張されたスケーラブルな表現を形成するために、ビットレート特性データを上記スケーラブルなマルチレイヤ表現に添付する添付器を含むシステムがさらに提供される。
上記スケーラブルなマルチレイヤ表現はSVC表現であってよく、上記非スケーラブルな単一レイヤ表現はAVC表現であってよい。
ビットレート特性データを添付する上記ステップは、SVCビットストリーム中にSEIメッセージを追加するステップを含みうる。
上記第1のビットレート特性は最大ビットレートであってもよく、上記第1のビットレート特性は平均ビットレートであってもよい。
上記第1のビットレート特性は、第1のエントロピー・エンコーダ専用であり、上記方法は、上記レイヤの上記非スケーラブルな単一レイヤ表現のための第2のエントロピー・エンコーダ専用の、第2のビットレート特性を決定するステップをさらに含み、添付される上記ビットレート特性データは、上記第1のビットレート特性および上記第2のビットレート特性に関するデータを含んでいてもよい。
上記方法は、上記スケーラブルなマルチレイヤ表現中の別のレイヤが、上記レイヤおよび上記別のレイヤ中の係数を逆変換することなく上記レイヤと統合可能であるかを判定し、上記レイヤと上記別のレイヤとがそのように統合可能である場合には、統合データを上記スケーラブルなマルチレイヤ表現に添付するステップをさらに含みうる。
本発明の第2の態様によれば、拡張されたマルチレイヤビットストリームを作成するための方法であって、a)ビデオシーケンスのSVC表現を受信するステップ;b)上記レイヤのAVC表現に関する、上記ビデオシーケンスのレイヤの第1の平均AVCビットレート特性および第1の最大AVCビットレート特性とを決定するステップ;およびc)第1のビットレート特性データを上記スケーラブルなマルチレイヤ表現に添付して、拡張されたSVC表現を形成するステップを含む方法が提供される。
ビットレート特性データを添付する上記ステップは、上記SVC表現中にSEIメッセージを追加するステップを含みうる。
上記レイヤの上記第1の特性は、第1のエントロピー・エンコーダ専用であり、上記方法は、上記レイヤの上記AVC表現のための第2のエントロピー・エンコーダ専用の、第2の平均AVCビットレート特性および第2の最大AVCビットレート特性を決定するステップ、および、第2のビットレート特性データを、上記拡張されたSVCビットストリームに添付するステップをさらに含んでいてもよい。
上記方法は、上記SVC表現中の別のレイヤが、上記レイヤおよび上記別のレイヤ中の係数を逆変換することなく上記レイヤと統合可能であるかを判定し、上記レイヤと上記別のレイヤとがそのように統合可能である場合には、統合データを上記SVC表現に添付するステップをさらに含みうる。
本発明の第3の態様によれば、拡張されたマルチレイヤビットストリームを作成するための方法であって、a)ビデオシーケンスのSVC表現を受信するステップ;b)コンテキスト適応的な可変長符号コーデックによって符号化されたレイヤのAVC表現に関する、上記ビデオシーケンスの上記レイヤの平均AVC/VLCビットレート特性および最大AVC/VLCビットレート特性を決定するステップ;c)コンテキスト適応的な算術符号コーデックによって符号化された上記レイヤのAVC表現に関する、上記ビデオシーケンスの上記レイヤの平均AVC/ACビットレート特性および最大AVC/ACビットレート特性を決定するステップ;およびd)上記AVC/VLC特性および上記AVC/AC特性を含むSEIメッセージを上記SVC表現に関連付けて、拡張されたSVC表現を形成するステップを含む方法が提供される。
上記方法は、上記SVC表現中の別のレイヤが、上記レイヤおよび上記別のレイヤ中の係数を逆変換することなく上記レイヤと統合可能であるかを判定し、上記レイヤと上記別のレイヤとがそのように統合可能である場合には、レイヤ統合SEIメッセージを上記SVC表現に関連付けるステップをさらに含みうる。
本発明の第4の態様によれば、スケーラブルなマルチレイヤビットストリーム表現を単一レイヤビットストリーム表現に変換(translate)するための方法であって、a)ビットレート特性データを含むビデオシーケンスのスケーラブルなマルチレイヤ表現を受信するステップであって、当該ビットレート特性データは、上記マルチレイヤ表現中の複数のレイヤが単一レイヤビットストリーム表現として表現されるときの、当該複数のレイヤのためのレイヤ専用且つエントロピー・エンコーダ専用のビットレート特性を含むステップ;b)目標(target)ビットレートパラメータを決定するステップ;c)上記目標ビットレートパラメータと上記レイヤ専用且つエントロピー・エンコーダ専用のビットレート特性との間の関係に基づいて、上記レイヤのうちの1つ以上のレイヤを変換のために選択するステップ;およびd)選択された上記1つ以上のレイヤを上記単一レイヤビットストリーム表現に変換するステップを含む方法が提供される。
本発明の第4の態様によれば、スケーラブルなマルチレイヤビットストリーム表現を単一レイヤビットストリーム表現に変換するためのシステムであって、ビットレート特性データを含むビデオシーケンスのスケーラブルなマルチレイヤ表現を受信する受信機であって、上記ビットレート特性データは、上記マルチレイヤ表現中の複数のレイヤが単一レイヤビットストリーム表現として表現されるときの、当該複数のレイヤのためのレイヤ専用且つエントロピー・エンコーダ専用のビットレート特性を含む、受信機;目標ビットレートパラメータを決定するための決定器;上記目標ビットレートパラメータと上記レイヤ専用且つエントロピー・エンコーダ専用のビットレート特性との間の関係に基づいて、上記レイヤのうちの1つ以上のレイヤを変換のために選択するための選択器;および選択された上記1つ以上のレイヤを上記単一レイヤビットストリーム表現に変換するための変換器を含むシステムも提供される。
上記スケーラブルなマルチレイヤ表現は、レイヤ統合データをさらに含み、上記レイヤのうちの1つ以上のレイヤを変換のために選択する上記ステップは、上記レイヤ統合データの分析も含みうる。
上記方法は、選択された上記レイヤのうちの2つ以上のレイヤを、係数を逆変換することなく統合可能であることを上記レイヤ統合データが示している場合に、当該統合を行うステップをさらに含みうる。
本発明の第5の態様によれば、SVCビットストリーム表現をAVCビットストリーム表現に変換するための方法であって、a)第1レイヤおよび第2レイヤを含むSVCビデオシーケンスを受信するステップであって、上記SVCビデオシーケンスはビットレート特性データをさらに含み、当該ビットレート特性データは、i)上記第1レイヤがAVCビットストリームとして表現されてVLCエンコーダによって符号化されるときの、上記第1レイヤのための最大ビットレート特性および平均ビットレート特性;ii)上記第1レイヤがAVCビットストリームとして表現されて算術エンコーダによって符号化されるときの、上記第1レイヤのための最大ビットレート特性および平均ビットレート特性;iii)上記第2レイヤがAVCビットストリームとして表現されてVLCエンコーダによって符号化されるときの、上記第2レイヤのための最大ビットレート特性および平均ビットレート特性;およびiv)上記第2レイヤがAVCビットストリームとして表現されて算術エンコーダによって符号化されるときの、上記第2レイヤのための最大ビットレート特性および平均ビットレート特性を含ステップ、c)目標ビットレートパラメータを決定するステップ;d)上記目標ビットレートパラメータと、上記第1レイヤおよび第2レイヤのための上記最大ビットレート特性または上記平均ビットレート特性のうちの1つとの関係に基づいて、上記第1レイヤおよび第2レイヤのうちの1つ以上のレイヤを変換のために選択するステップ;およびe)選択された上記1つ以上のレイヤを上記AVCビットストリーム表現に変換するステップを含む方法が提供される。
上記方法は、上記ビットレート特性に基づいて上記VLCエンコーダおよび上記算術エンコーダのうちの1つを選択するステップをさらに含みうる。
上記SVCビデオシーケンスは、レイヤ統合データをさらに含み、上記レイヤのうちの1つ以上のレイヤを変換のために選択する上記ステップは、上記レイヤ統合データの分析も含んでいてもよい。
上記レイヤ統合データが上記統合が可能であることを示している場合に、上記変換が係数の逆変換なしに行われてもよい。
本発明の一部の実施形態は、マルチレイヤビットストリームデータを情報伝達するための方法およびシステムを含む。一部の実施形態では、マルチレイヤビットストリームの様々なレイヤに関連するビットレートはエンコーダにおいて測定され、ビットストリーム中においてデコーダへ情報伝達される。一部の実施形態では、ビットレートは特定のエントロピー・エンコーダ専用でありうる。一部の実施形態では、画像ビットストリームおよび関連付けられたビットレートデータは、デコーダ、変換器、トランスコーダ、または他のデバイスにおいて受信される。上記ビットレートデータは、画像レイヤ、エントロピー・コーデックを選択するため、および他の決定を行うために用いることができる。
本発明の前述および他の目的、特徴、および利点は、本発明に関する以下の詳細な説明を添付図面と併せて参酌すれば、より容易に理解されるだろう。
変換領域係数のスケーリングを含む本発明の実施形態を示す図である。 量子化された変換係数の累算、および量子化された変換領域係数のスケーリングを含む本発明の実施形態を示す図である。 変換領域係数のスケーリング、および再構成なしのビットストリーム書き換え(rewriting)を含む本発明の実施形態を示す図である。 量子化された変換係数または変換インデックスの累算、および再構成なしのビットストリーム書き換えを含む本発明の実施形態を示す図である。 変換サイズの選択を含む本発明の実施形態を示す図である。 条件付きの変換サイズの指示(indication)および選択を含む本発明の実施形態を示す図である。 量子化パラメータに基づく係数スケーリングを含む本発明の実施形態を示す図である。 隣接マクロブロック・データに基づくエントロピー・エンコーダ制御値の計算を含む本発明の実施形態を示す図である。 隣接マクロブロックの条件の組み合わせに基づくエントロピー・エンコーダ制御値の決定を含む本発明の実施形態を示す図である。 隣接マクロブロック・データに基づく、推定された予測モードの決定および予測モードの情報伝達(signaling)を含む本発明の実施形態を示す図である。 統合されたレイヤの符号化ブロック・パターンの計算を含む本発明の実施形態を示す図である。 レイヤの空間解像度に基づく選択的な変換累算を含む本発明の実施形態を示す図である。 代替表現ビットレートデータを原表現(original representation)に添付する処理を示す図である。 画像を代替表現に変換してビットレート特性を測定する処理を示す図である。 複数のエントロピー・エンコーダ用のビットレート特性を決定する処理を示す図である。 複数のレイヤ用のビットレート特性を決定する処理を示す図である。 VLCエンコーダ用およびACエンコーダ用のビットレートデータを決定および添付する処理を示す図である。 目標ビットレートパラメータの決定を示す図である。 目標ビットレート制約に基づくエントロピー・エンコーダの選択を示す図である。 逆変換なしに複数のレイヤを統合できるかに関する判定を示す図である。 変換サイズの選択を含む本発明の実施形態を示すブロック図である。 量子化パラメータに基づく係数スケーリングを含む本発明の実施形態を示すブロック図である。 隣接マクロブロック・データに基づくエントロピー・エンコーダ制御値の計算を含む本発明の実施形態を示す図である。 統合されたレイヤの符号化ブロック・パターンの計算を含む本発明の実施形態を示す図である。 レイヤの空間解像度に基づく選択的な変換累算を含む本発明の実施形態を示すブロック図である。 代替表現ビットレートデータを原表現に添付する処理を示すブロック図である。 複数のエントロピー・エンコーダ用のビットレート特性を決定する処理を示すブロック図である。 VLCエンコーダ用およびACエンコーダ用のビットレートデータを決定および添付する処理を示すブロック図である。 目標ビットレートパラメータの決定を示すブロック図である。
本発明の実施形態は、図面を参照することによって最も良く理解できるであろう。全ての図面を通して、同様の部分を同様の数字で示している。上に挙げた各図は、この詳細な説明の一部として明示的に組み込まれるものとする。
本発明の構成要素は、ここで概略的に説明し図面中に概略的に示したように、多種多様な異なる構成に構成および設計できることが容易に理解できるであろう。したがって、本発明の方法およびシステムの実施形態についての以下のより詳細な説明は、本発明の範囲を制限することを意図したものではなく、本発明の現在の好ましい実施形態の代表例にすぎない。
本発明の実施形態の構成要素は、ハードウェア、ファームウェア、および/またはソフトウェアで実現できる。ここで開示した典型的な実施形態は、これら形態の1つについて記述したものにすぎず、当業者であれば、本発明の範囲内にある限りこれらの形態の何れにおいてもこれら構成要素を実施できることが理解できるであろう。
本発明の一部の実施形態は、スケーラブルなビデオ符号化のための残差の累算のための方法およびシステムを含んでいる。一部の実施形態は、スケーラブルなビットストリームを復号するための方法およびシステムを含んでいる。上記ビットストリームを、エンコーダによって生成し、続いてデコーダに格納および/または伝送することができる。上記デコーダは、上記ビットストリームを解析し、解析されたシンボルを復号された画像のシーケンスに変換することができる。
スケーラブルなビットストリームは、異なる複数の表現の原画像シーケンスを含みうる。1つの具体例では、上記ビットストリーム中の第1レイヤは、上記画像シーケンスの低品質バージョンを含んでおり、上記ビットストリーム中の第2レイヤは、上記画像シーケンスのより高品質のバージョンか、あるいはより高品質のバージョンを生成するための追加データを含んでいる。第2の具体例では、上記ビットストリーム中の第1レイヤは、上記画像シーケンスの低解像度バージョンを含んでおり、上記ビットストリーム中の第2レイヤは、上記画像シーケンスのより高い解像度バージョンを含んでいる。より複雑な例は当業者に容易に理解できるであろう。より複雑な例は、異なる複数の品質および異なる複数の解像度の組み合わせを含む、複数の表現の画像シーケンスおよび/またはストリームを含みうる。
エンコーダ出力のビットレートを下げるために、スケーラブルなビットストリームは、レイヤ間予測の一形態を含みうる。典型的な実施形態は、AVC|H.264ビデオ符号化標準のためのスケーラブルなビデオ拡張におけるレイヤ間予測を含みうる。上記拡張はSVCとして一般に知られており、SVCシステムはT. Wiegand, G. Sullivan, J. Reichel, H. Schwarz and M. Wien, "Joint Draft 9 of SVC amendment (revision 2)", JVT-V201, Marrakech, Morroco, January 13-19, 2007に記載されている。上記文献は、参照によって本明細書に組み込まれるものとする。上記SVCシステムにおいて、レイヤ間予測は、列挙された下位レイヤから列挙された上位レイヤまで動きおよびモードの情報を投影することによって実現される。それに加えて、予測残差が、列挙された下位レイヤから列挙された上位レイヤへ投影される。したがって、上記の上位レイヤのビットストリームは、復号された出力の質を改善するために追加の残差を含むことができる。
ISO/IEC JTC1/SC29/WG11 Informationn Technology - Coding of Audio-Visual Objects - Part 10: Advanced Video Coding, ISO/IEC 14496-10, 2005も、参照によって本明細書に組み込まれるものとする。
ITU-T Recommendation H.264: "Advanced video coding for generic audio visual services", March 2003も、参照によって本明細書に組み込まれるものとする。
〔SVCからAVCへのビットストリームの書き換え〕
現在のSVCシステムは、基本レイヤに加えてどんなレイヤでもAVCデバイスをサポートできるトランスコーディングを必要としている。これは、SVCの応用範囲を制限する。本発明の実施形態は、SVCビットストリームをAVC準拠のビットストリームへ高速で書き換えることを可能にするために、CGS(coarse grain scalable)レイヤのシンタックス(syntax)およびセマンティックス(semantics)への変更を含んでいる。一部の実施形態では、ネットワークデバイスは、誤差(drift)なしに、かつ、シーケンスを再構成する必要なしに、SVCデータをAVCビットストリームへ書き換えることができる。これは、一部の実施形態では、多数の粗粒度スケーラブルなレイヤをまとめる(merge)ことにより実現できる。
本発明の一部の実施形態は、SVCからAVCへのビットストリームの書き換えを含んでいる。このプロセスは、SVCビットストリームを入力として取り込むステップ、およびAVCビットストリームを出力として生成するステップを含みうる。これは概念的にトランスコーディングに類似している。しかしながら、一部の実施形態は、SVCの単一ループ構造を利用し、SVCビットストリームをAVCシンタックス要素上に直接マッピングすることを可能にする。一部の実施形態は、誤差をもたらすことなしに、かつビデオシーケンスの再構成なしに、この機能を実行することができる。
SVCからAVCへのビットストリームへの高速書き換えを可能にする実施形態は、SVCの端々(SVC end-to-end)によってもたらされる追加の費用を負担する必要をなくす。したがって、それは、スケーラブルな機能性がもはや必要でない場合には廃棄(discard)できる。これらの実施形態は、SVCの応用範囲を大きく拡張することができる。典型的な実施形態の限定されない例として、最終の伝送リンクが制約された速度の伝送リンクであるようなシナリオを考える。これは、携帯機器への無線リンクであってもよく、それに代えて高解像度ディスプレイへの無線リンクであってもよい。いずれの場合も、我々は、SVCのスケーラビリティ特徴を用いて送信機での速度を知的に適応させることができる。しかしながら、ビットストリームからSVC成分を取り除くことは、受信デバイスがSVC機能を必要としないので、有利である。これは、より少数のビットが付加ビット(overhead)に割り当てられ、より多くのビットが画像データに利用可能であるので、伝送されるビデオの視覚的な品質を改善する。
ビットストリーム書き換えの第2の限定されない例として、多数の異種のデバイスをサポートするシステムを考える。低速の伝送リンクで接続されているデバイスは、SVCビットストリームの一部であるAVC基本レイヤを受け取り、より高速の伝送リンクで接続されているデバイスはAVC基本レイヤに加えて付加的なSVC拡張を受け取る。この拡張データを見るために、これらの受信機は、SVCシーケンスを復号および再構成することができなければならない。これは、これらデバイスを多数用いる用途については、SVCを配備するための多額の出費を招く。セットトップ・ボックス(または他の復号ハードウェア)は、各受信機に配備しなければならない。より費用効率が高い解決策として、ネットワーク内でSVCからAVCへビットストリームを書き換えるプロセスを使用して、全てのデバイスにAVCデータを送出することができる。これは、SVCの配備コストを低減する。
ビットストリーム書き換えの第3の限定されない例として、クライアントデバイスへの最終的な送出のためにメディア・サーバ上にコンテンツを格納するためにSVCを利用する適用を考える。SVCフォーマットは、多数のAVCビットストリームをサーバに保存するのと比較して、必要とする格納スペースが少ないので、非常に魅力的である。しかしながら、それは、さらに、サーバ内のトランスコーディング演算がAVCクライアントをサポートするか、あるいはクライアント上のSVC能力をサポートすることを必要とする。SVCからAVCへのビットストリームの書き換えを可能にすることは、ネットワーク全体にわたってトランスコーディングおよび/またはSVCの能力を計算上要求することを必要とせずに、メディア・サーバがSVCを利用して効率を符号化することを可能にする。
ビットストリーム書き換えの第4の限定されない例として、SVCからAVCへビットストリームを書き換えるプロセスは、SVCデコーダのハードウェアの設計を簡素化する。現在、SVCデコーダは、AVCの復号および再構成のロジック全体にわたって修正を必要とする。SVCからAVCビットストリームへの書き換えを可能にすることで、AVCとSVCとの間の差は、エントロピー・デコーダおよび係数スケーリング演算に集約される。これは、最終の再構成ループがAVC再構成プロセスと同一であるので、SVC復号プロセスの設計を簡素化する。さらに、SVC再構成ステップは、1つのブロック当たりただ1つの予測演算とただ1つの逆変換演算とを含むことが保証される。これは、現在のSVC演算と異なるものであり、多数の逆変換演算とイントラ予測のための可変の参照データとを必要とする。
本発明の一部の実施形態は、SVCビットストリームからAVCビットストリームへの直接マッピングを可能にするために、SVC粗粒度スケーラビリティ・レイヤに対する変更を含んでいる。これらの変更は、修正されたIntraBLモードと、インター符号化(画面間符号化)された拡張レイヤ中のBLSkipブロックの変換についての制限とを含む。一部の実施形態では、これらの変更は、シーケンス基準で、場合によってはシーケンス基準およびスライス基準の両方で、送られたフラグによって実施できる。
〔インター符号化ブロック〕
一部の実施形態は、インター符号化ブロックのための変更を含んでいる。これらの変更は、以下のものを含んでいる。基本レイヤ・ブロックから推定(infer)されるブロックは、基本レイヤ・ブロックと同じ変換を用いなければならない。例えば、粗粒度スケーラブルなレイヤ中のブロックが1に等しいbase_mode_flagを有しており、かつ同じ場所にある基本レイヤ・ブロックが4×4変換を用いる場合、拡張レイヤ・ブロックも4×4変換を用いなければならない。
基本レイヤ・ブロックから推定され、かつ残差予測を用いるブロックの再構成は、変換領域に生じなければならない。ここで、基本レイヤ・ブロックが空間領域中で再構成され、次いで、残差が拡張レイヤ中で伝送されるであろう。これらの実施形態では、基本レイヤ・ブロックの変換係数は、デコーダでスケーリングされ、拡張レイヤ中の情報によって微調整(refine)され、次いで逆変換される。
avc_rewriteフラグが1である場合、smoothed_reference_flagは0であるものとする。
〔イントラ符号化ブロック〕
イントラ符号化(画面内符号化)ブロックは、SVCからAVCへの書き換えの問題に、追加の障害を生じさせる。上記CGSシステム内では、拡張レイヤ中のブロックをIntraBLモードで符号化してもよい。このモードは、基本レイヤ中のイントラ符号化ブロックが復号され予測に使用されるべきであることを情報伝達する。その後、追加の残差を、拡張レイヤ中で情報伝達することができる。SVCからAVCへの書き換えを行うシステム内では、これは障害を作成する。なぜなら、再構成されたイントラ符号化ブロックを、その近傍の空間的予測と情報伝達された残差との和として記述することができないからである。したがって、イントラ符号化ブロックは、SVCからAVCへトランスコードされなければならない。これは、追加の計算上の複雑さを必要とする。さらに、それは、動き補償を介して伝播(propagate)しうる符号化誤差をもたらす。
本発明の一部の実施形態について図1Aを参照して説明する。これらの実施形態に係る、デコーダまたはリライタ(システム)は、第1の逆量子化器5、スケーラ6、第2の逆量子化器11、第1の加算器(係数統合器)7、イントラ予測器8、逆変換器10、および第2の加算器(第2の統合器)9を含んでいる。これらの実施形態では、基本レイヤの残差(基本レイヤの量子化された変換係数)1、予測モードデータ2、および拡張レイヤの残差(拡張レイヤの量子化された変換係数)3を、デコーダまたはリライタで受け取る。近隣ブロック・データ4も、デコーダ/リライタで既知である。第1の逆量子化器5が、基本レイヤの残差データ1を逆量子化し、それによって基本レイヤの変換係数を作成することができ、また、スケーラ6が、変換係数を拡張レイヤの特性と整合する(match)ようにスケーリングし、それによって基本レイヤのスケーリングされた変換係数を作成することができる。一部の実施形態では、整合される特性は、量子化パラメータ特性を含みうる。さらにまた、拡張レイヤの残差3が、第2の逆量子化器11によって逆量子化され、第1の加算器7によって、基本レイヤのスケーリングされた残差の係数(基本レイヤのスケーリングされた変換係数)に加算され、それによって統合された係数を形成することができる。その後、逆変換器10が、統合された係数を逆変換して空間領域の拡張値を生成する。一部の実施形態では、拡張レイヤ情報を、必要としない場合には無視することができる。予測モードデータ2および近隣ブロック・データ4は、イントラ予測器8による予測ブロックの決定に使用される。その後、第2の加算器9が、基本レイヤおよび拡張レイヤからの空間領域の拡張値に対して予測ブロックを加算して、復号されたブロック12を生成する。
本発明の一部の実施形態について図1Bを参照して説明する。これらの実施形態では、基本レイヤの残差1、予測モードデータ2、および拡張レイヤの残差3を、デコーダまたはリライタで受け取る。近隣ブロック・データ135も、デコーダ/リライタで既知であり、予測(134)に使用できる。これらの実施形態では、基本レイヤの量子化された変換係数1を拡張レイヤの特性と整合するようにスケーリングし(130)、それによって基本レイヤのスケーリングされた変換係数を作成することができる。一部の実施形態では、整合される特性は、量子化パラメータ特性を含みうる。拡張レイヤの量子化された変換係数を基本レイヤの量子化されスケーリングされた変換係数3に加算して(131)、量子化され統合された係数を作成することができる。その後、量子化され統合された係数を逆量子化して(132)、統合され非量子化された係数を生成することができる。その後、統合され非量子化された係数を逆変換して(133)、統合された空間領域値を生成することができる。その後、これらの空間領域値を予測データと統合して(136)、再構成された画像137を形成することができる。
本発明の一部の実施形態について図2Aを参照して説明する。これらの実施形態では、ビットストリームが、画像の完全な再構成なしに再符号化される。これらの実施形態では、基本レイヤ(BL)の残差データ1を、デコーダ、トランスコーダ、エンコーダのデコーダ部分、もしくは他のデバイスまたはモジュールで受け取ることができる。拡張レイヤ(EL)の残差データ3も、上記のデバイスまたはモジュールで受け取ることができる。これらの実施形態では、第1の逆量子化器5が、BLの残差1を逆量子化してBLの変換係数を生成することができる。その後、スケーラ6が、これらのBLの変換係数を拡張レイヤの特性と整合するようにスケーリングし、それによってBLの変換係数を作成することができる。一部の実施形態では、この拡張レイヤの特性は、量子化パラメータであってもよく、解像度パラメータであってもよく、基本レイヤを拡張レイヤに関連付ける何らかの他のパラメータであってもよい。さらにまた、第2の逆量子化器11が、拡張レイヤデータ3を逆量子化して拡張レイヤの係数18を生成することができる。その後、係数統合器19が、スケーリングされたBL係数16を、拡張レイヤの係数18と統合して、統合された係数17を生成することができる。その後、ビットストリーム・エンコーダ(ビットストリーム生成器)13が、統合された係数を縮小レイヤ(reduced-layer)または単一レイヤのビットストリームに書き換えることができる。ビットストリーム・エンコーダ13は、さらに予測データ2をビットストリーム中に書き込むことができる。ビットストリーム・エンコーダ13の機能は、量子化機能、エントロピー符号化機能、および他の機能をさらに含んでいてもよい。
本発明の一部の実施形態について図2Bを参照して説明する。これらの実施形態では、ビットストリームは、画像の完全な再構成なしに、かつ逆量子化なしに、再符号化される。これらの実施形態では、基本レイヤ(BL)の残差データ36を、デコーダ、トランスコーダ、エンコーダのデコーダ部分、もしくは他のデバイスまたはモジュールで受け取ることができる。拡張レイヤ(EL)データ37も、上記デバイスまたはモジュールで受け取ることができる。これらの実施形態では、BLの信号36および拡張レイヤの信号37をエントロピー復号して、量子化された係数またはインデックス21および23を生成することができる。その後、BLの量子化インデックス21を拡張レイヤの特性と整合するようにスケーリングし(20)、それによってBLのスケーリングされたインデックスを作成することができる。一部の実施形態では、この拡張レイヤの特性は、量子化パラメータであってもよく、解像度パラメータであってもよく、基本レイヤを拡張レイヤに関連付ける何らかの他のパラメータであってもよい。その後、スケーリングされたBLインデックス26をELのインデックス23と統合して(24)、統合されたインデックス27を生成することができる。その後、ビットストリーム・エンコーダ25が、統合された係数を縮小レイヤまたは単一レイヤのビットストリーム28に書き換えることができる。ビットストリーム・エンコーダ25は、さらに予測データ35をビットストリーム中に書き込むことができる。ビットストリーム・エンコーダ25の機能は、量子化機能、エントロピー符号化機能、および他の機能も含みうる。
これらの実施形態では、基本レイヤ・ブロックを完全に再構成する必要はない。それに代えて、イントラ予測モードおよび残差データが両方とも、拡張レイヤにマッピングされる。その後、拡張レイヤから追加の残差データが加算される。最後に、上記ブロックが再構成される。このアプローチの利点は、損失なしに、かつ基本レイヤを完全に復号する必要なしに、拡張ブロックを単一レイヤのビットストリーム中に書くことができるということである。
本発明の一部の実施形態は、残差予測フラグの使用なしに、CGSシステム中の複数のレイヤ間で動きデータを伝播することを含んでいる。これらの実施形態は、基本レイヤから拡張レイヤへイントラ予測モードを伝播させる、改良されたIntraBL方法を含んでいる。その後、イントラ予測が拡張レイヤで行われる。
これらの実施形態では、IntraBLブロックの変換タイプは、同じ場所にある基本レイヤ・ブロックと同じでなければならない。例えば、基本レイヤ・ブロックが8×8変換を用いる場合、拡張レイヤ・ブロックも8×8変換を用いなければならない。
一部の実施形態では、ビットストリームの独立した処理を可能にするために、8×8変換フラグも拡張レイヤ中で伝送することができる。
一部の典型的な実施形態では、基本レイヤ中の16×16変換によって符号化されたブロックも、拡張レイヤ中の16×16変換によって符号化される。しかしながら、拡張レイヤ・ブロックは4×4走査のパターンおよび方法で伝送される。すなわち一部の実施形態では、16×16ブロックのDC係数およびAC係数が別々に送られない。
本発明の一部の実施形態について図3および図19を参照して説明する。これらの実施形態に係るシステムは、サイズ決定器301、決定器302、第1の選択器303、および第2の選択器304を含んでいる。マルチレイヤ画像を含むこれらの実施形態では、1つのレイヤから別のレイヤへイントラ予測モードおよび変換データを推定することができる。一部の実施形態では、サイズ決定器301が第1レイヤの変換サイズを決定することができる(30)。第1レイヤは、基本レイヤであってもよく、別のレイヤを予測する基となるレイヤであってもよい。これらの実施形態では、予め定められた変換サイズが確立される。その後、第1レイヤの変換サイズが、予め定められた(予め規定された)変換サイズと比較される。すなわち、決定器302は、下位レイヤの変換サイズが予め定められた変換サイズと同じである(実質的に類似している)かを判定する。第1レイヤの変換サイズが予め定められた変換サイズと同じである場合(31)、第1の選択器303が予め定められた変換サイズを逆変換演算に選択する(33)。第1レイヤの変換サイズが予め定められた変換サイズと同じでない場合(31)、第2の選択器304がデフォルト変換サイズを逆変換演算に選択する(32)。一部の実施形態では、予め定められた変換サイズを8×8とすることができ、また、デフォルト変換サイズを4×4とすることができる。
一部の実施形態では、予め定められた変換サイズも、特別の走査のパターンおよび方法に関連付けることができる。これらの実施形態では、第1レイヤの変換サイズと予め定められた変換サイズとの関係も、特別な符号化の方法およびパターンをトリガーすることができる。例えば、一部の実施形態では、予め定められた変換サイズを16×16とすることができ、予め定められた16×16のサイズと実際の下位レイヤのサイズとの一致は、「16×16が使用されることになっているが、AC係数およびDC係数が一緒に伝送される4×4の走査パターンおよび走査方法でデータが符号化されている」ことを示しうる。
本発明の一部の実施形態について図4を参照して説明する。これらの実施形態では、マルチレイヤ・ビットストリームを解析(40)および処理して、基本レイヤの変換サイズを決定すると共に、BLの係数値を生成する。ビットストリームの拡張レイヤも解析して変換サイズおよび係数値を決定し(41)、変換指標が存在するかを判定する。拡張レイヤの変換指標がビットストリーム中に存在する場合(42)、指し示された変換サイズをELの係数の逆変換に用いることができる(43)。拡張レイヤの変換指標がビットストリーム中に存在しない場合(42)、基本レイヤの変換サイズが8×8であるかを判定する(44)。基本レイヤの変換サイズが8×8である場合、8×8変換サイズを用いて拡張レイヤを逆変換する(46)。基本レイヤの変換サイズが8×8でない場合、4×4などのようなデフォルト変換サイズを用いて拡張レイヤを逆変換することができる(45)。
本発明の一部の実施形態では、イントラ予測モードは、IntraBLブロック中の基本レイヤからイントラ予測モードを推定することによって、基本レイヤから直接コピーすることができる。一部の代替の実施形態では、それは、基本レイヤのモードと異なり符号化することができる。一部の実施形態では、AVC中でイントラ予測モードを情報伝達するための現行の方法を用いることができる。しかしながら、これらの実施形態では、予測されるモード(または最も可能性の高いモード)は、基本レイヤのモードと等しくなるよう設定される。
一部の実施形態では、8×8変換フラグを拡張レイヤのビットストリームから省略してもよく、また、変換を基本レイヤモードから推定してもよい。
一部の実施形態では、16×16変換係数を、基本レイヤ中および拡張レイヤ中の両方において同じ方法で情報伝達することができる。16×16変換の存在は、拡張レイヤ中の追加のフラグで情報伝達してもよく、基本レイヤのビットストリームから推定してもよい。
本発明の一部の実施形態は、IntraBLブロックのための残差予測フラグを含んでいる。これらの実施形態は、基本レイヤの残差を適応的に使用して拡張レイヤのイントラ予測されたブロックを改良することを可能にする。
本発明の一部の実施形態では、AVCビットストリームに直接マッピングすることができない、SVCビットストリーム中のモードを全て、エンコーダが無効にすることができる。これらの実施形態のための情報伝達は、SVCビットストリーム中で行うことができる。一部の典型的な実施形態では、この情報伝達は、シーケンス・ヘッダー中、シーケンス・パラメータ・セット中、ピクチャ・パラメータ・セット中、スライス・ヘッダ中、または他の所で、起こりうる。一部の実施形態で、この情報伝達は、SEIメッセージ中で起こりうる。典型的な実施形態では、この情報伝達は、空間スケーラビリティSEIメッセージ中で起こりうる。一部の実施形態では、この情報伝達は他の帯域外方法によって起こり得るし、一部の場合には、SVC復号演算に対して標準の変更を加えることを必要としないであろう。
一部の実施形態では、エンコーダがこの動作モードを情報伝達すると、デコーダは、AVCに変換できるビットストリームをエンコーダが生成しているとみなすことができる。一部の典型的な実施形態では、エンコーダは、このモードで動作しているとき、IntraBLブロックモードまたは平滑化参照ツールを用いなくてもよい。さらに、これらの実施形態では、エンコーダは、基本レイヤの変換係数をスケーリングし、次いで伝送された残差を加算することによって、残差データを組み込む(incorporate)ことができることを保証できる。これらの実施形態は、エンコーダが基本レイヤ中および拡張レイヤ中で同じ変換方法を用いることを必要とする可能性がある。
〔CGSのためのSVCからAVCへのビットストリーム書き換え:シンタックス〕
F.7.3.2 シーケンス・パラメータ・セットSVC拡張のシンタックス
Figure 0005179484
Figure 0005179484
F.7.3.4 スケーラブルな拡張におけるスライス・ヘッダ
Figure 0005179484
Figure 0005179484
Figure 0005179484
Figure 0005179484
Figure 0005179484
F.7.3.6.3 スケーラブルな拡張における残差のシンタックス
Figure 0005179484
Figure 0005179484
Figure 0005179484
F.7.3.2 シーケンス・パラメータ・セットSVC拡張のセマンティックス
0に等しいnal_unit_extension_flagは、(dependency_id,temporal_level,quality_level)へのsimple_priority_idのマッピングを指定するパラメータがシーケンス・パラメータ・セット中で次に続くことを示す。1に等しいnal_unit_extension_flagは、(dependency_id,temporal_level,quality_level)へのsimple_priority_idのマッピングを指定するパラメータが存在しないことを示す。nal_unit_extension_flagが存在しない場合、nal_unit_extension_flagが1に等しいと推定されるものとする。現(current)シーケンス・パラメータ・セットを参照する、20および21に等しいnal_unit_typeを持つ、全てのNALユニットのNALユニットシンタックス要素extension_flagは、nal_unit_extension_flagに等しいものとする。
注:profile_idcが83に等しくない場合、現シーケンス・パラメータ・セットを参照する、20および21に等しいnal_unit_typeを持つ、全てのNALユニットのシンタックス要素extension_flagは、1に等しいものとする。
number_of_simple_priority_id_values_minus1に1を加えた値は、(dependency_id,temporal_level,quality_level)へのマッピングがシーケンス・パラメータ・セット中で次に続くパラメータによって指定される、simple_priority_idの値の個数を指定する。number_of_simple_priority_id_values_minus1の値は、0〜63の範囲内にあるものとする。
priority_id、dependency_id_list[priority_id]、temporal_level_list[priority_id]、quality_level_list[priority_id]は、従属節F.7.4.1で示すシンタックス要素dependency_id、temporal_level、およびquality_levelを推定するプロセスを指定する。priority_idの全ての値についてdependency_list[priority_id]、temporal_level_list[priority_id]、およびquality_level_list[priority_id]が存在しない場合、dependency_list[priority_id]、temporal_level_list[priority_id]、およびquality_level_list[priority_id]が0に等しいと推定されるものとする。
extended_spatial_scalabilityは、基本レイヤのアップサンプリングのための幾何学的パラメータに関連付けられたシンタックス要素の存在を示す。extended_spatial_scalabilityが0に等しい場合、幾何学的パラメータがビットストリーム中にない。extended_spatial_scalabilityが1に等しい場合、幾何学的パラメータがシーケンス・パラメータ・セット中にある。extended_spatial_scalabilityが2に等しい場合、幾何学的パラメータがslice_data_in_scalable_extension中にある。3の値は、extended_spatial_scalabilityには未使用である。extended_spatial_scalabilityが存在しない場合、extended_spatial_scalabilityが0に等しいと推定されるものとする。
scaled_base_left_offsetは、アップサンプリングされた基本レイヤのピクチャの左上の画素と現レイヤのピクチャの左上の画素との間の水平オフセットを2つの輝度サンプルの単位で指定する。scaled_base_left_offsetが存在しない場合、scaled_base_left_offsetが0に等しいと推定されるものとする。
変数ScaledBaseLeftOffsetは、次のように規定される:
ScaledBaseLeftOffset=2*scaled_base_left_offset (F−40)
変数ScaledBaseLeftOffsetCは、次のように規定される:
ScaledBaseLeftOffsetC=ScaledBaseLeftOffset/SubWidthC (F−41)
scaled_base_top_offsetは、アップサンプリングされた基本レイヤのピクチャの左上の画素と現レイヤのピクチャの左上の画素との間の垂直オフセットを2つの輝度サンプルの単位で指定する。scaled_base_top_offsetが存在しない場合、scaled_base_top_offsetが0に等しいと推定されるものとする。
変数ScaledBaseTopOffsetは、次のように規定される。
ScaledBaseTopOffset=2*scaled_base_top_offset (F−42)
変数ScaledBaseTopOffsetCは、次のように規定される。
ScaledBaseTopOffsetC=ScaledBaseTopOffset/SubHeightC (F−43)
scaled_base_right_offsetは、アップサンプリングされた基本レイヤのピクチャの右下画素と現レイヤのピクチャの右下画素との間の水平オフセットを2つの輝度サンプルの単位で指定する。scaled_base_right_offsetが存在しない場合、scaled_base_right_offsetが0に等しいと推定されるものとする。
変数ScaledBaseRightOffsetは、次のように規定される。
ScaledBaseRightOffset=2*scaled_base_right_offset (F−44)
変数ScaledBaseWidthは、次のように規定される:
ScaledBaseWidth
=PicWidthInMbs*16-ScaledBaseLeftOffset-ScaledBaseRightOffset (F-45)
変数ScaledBaseWidthCは、次のように規定される:
ScaledBaseWidthC=ScaledBaseWidth/SubWidthC (F−46)
scaled_base_bottom_offsetは、アップサンプリングされた基本レイヤのピクチャの右下画素と現レイヤのピクチャの右下画素との間の垂直オフセットを2つの輝度サンプルの単位で指定する。scaled_base_bottom_offsetが存在しない場合、scaled_base_bottom_offsetが0に等しいと推定されるものとする。
変数ScaledBaseBottomOffsetは、次のように規定される。
ScaledBaseBottomOffset=2*scaled_base_bottom_offset (F−47)
変数ScaledBaseHeightは、次のように規定される。
ScaledBaseHeight
=PicHeightInMbs*16-ScaledBaseTopOffset-ScaledBaseBottomOffset (F-48)
変数ScaledBaseHeightCは、次のように規定される。
ScaledBaseHeightC=ScaledBaseHeight/SubHeightC (F−49)
chroma_phase_x_plus1は、現レイヤのピクチャの水平方向のサンプリング・スペースの4分の1の単位で色差成分の水平方向位相シフトを指定する。chroma_phase_x_plus1が存在しない場合、chroma_phase_x_plus1が0に等しいと推定されるものとする。chroma_phase_x_plus1は、0〜1の範囲内にある、2および3の値は未使用である。
chroma_phase_y_plus1は、現レイヤのピクチャの垂直方向のサンプリング・スペースの4分の1の単位で色差成分の垂直方向位相シフトを指定する。chroma_phase_y_plus1が存在しない場合、chroma_phase_y_plus1が1に等しいと推定されるものとする。chroma_phase_y_plus1は、0〜2の範囲内にあり、3の値は未使用である。注:vui_parameters中で指定された色種類(chroma type)は、同じsequence_parameter_set中の色相(chroma phase)パラメータchroma_phase_x_plus1およびchroma_phase_y_plus1と一致していなければならない。
avc_rewrite_flagは、エントロピー符号の復号および符号化と変換係数のスケーリングとだけによって、伝送されたシーケンスを劣化なしにAVCビットストリームとして書き換えることができることを示す。IntraBLブロックには代替の方法が使用され、エンコーダによる変換サイズの選択に制限がかけられる。
avc_adaptive_rewrite_flagは、avc_rewrite_flagがスライス・ヘッダ中で送られることを示す。
本発明の一部の実施形態は、量子化された変換係数を「非量子化された」バージョンまたは代替の量子化領域のいずれかにマッピングするスケーリング・プロセスを含んでいる。一部の実施形態では、avc_rewrite_flagが上述したようにこれらのプロセスが無効にされていることを情報伝達する場合、現行のH.264/AVCビデオ符号化規格で規定されたプロセスに従って、全てのレイヤ中の復号された変換係数を「非量子化する」ことができる。しかしながら、これらの実施形態が有効にされていることをavc_rewrite_flagが情報伝達する場合、所望の拡張レイヤに先行する複数のレイヤ中において、量子化され復号された変換係数またはインデックスが「非量子化され」ない。それに代えて、量子化された係数またはインデックスが、下位レイヤ(特に、所望の拡張レイヤに依存する(depend on)レイヤ)から次に上位のレイヤ(特に、前述した下位レイヤに明示的に依存するレイヤであって、依存の順序において、所望の拡張レイヤにより近いレイヤ)へマッピングされる。
本発明の一部の実施形態について図5および図20を参照して説明する。これらの実施形態に係るシステムは、第1のパラメータ決定器311、第2のパラメータ決定器312、およびスケーラ313を含む。これらの実施形態では、マッピング・プロセスは以下のように動作しうる。初めに、第1のパラメータ決定器311が、下位レイヤのビットストリーム中における量子化パラメータ、すなわちQp値を決定する(50)。次いで、第2のパラメータ決定器312が、上位レイヤ中における量子化パラメータ、すなわちQp値を決定する(51)。次に、スケーラ313で、下位レイヤの係数(第1レイヤの変換係数)を、量子化パラメータに基づいた率だけスケーリングすることができる(52)。
一部の実施形態では、下位レイヤのQp値と上位レイヤのQp値との差を計算することができる。一部の実施形態では、変換係数を次のプロセスでスケーリングすることができる。
Figure 0005179484
(ここで、THigherLayerおよびTLowerLayerはそれぞれ上位レイヤおよび下位レイヤにおける変換係数を示し、nは整数であり、Qp_LowerLayerおよびQp_HigherLayerはそれぞれ下位レイヤおよび上位レイヤのための量子化パラメータである)
マッピング・プロセスの計算は、多くの計算を単純化する方法で実施することができる。例えば、次のシステムが同等である。
Figure 0005179484
(ここで、//が整数除算を示し、%はモジュロ演算を示し、MおよびScaleMatrixは予め定められた定数である)
これらの予め定められた値の一具体例は、次の通りである。
ScaleMatrix=[512 573 642 719 806 902]
M=512
しかしながら、MおよびScaleMatrixについて他の値を用いてもよいことが容易に理解できるはずである。
単純化された上記の例は、Qp_Diffの値が常に0より大きいとみなす。従って、一部の実施形態では、アプリケーションが、スケーリング演算を行う前にQp_Diffの値をチェックすることができる。Qp_Diffの値が0より小さい場合、さらなる処理に先立って0の値をそれに再割り当てすることができる。一部の実施形態では、Qp_LowerLayerがQp_HigherLayer以上であるとみなすことができる。
一部の代替の実施形態では、次のシステムを実施することができる。
Figure 0005179484
典型的な実施形態では、予め定められた値を次のように選択することができる。
ScaleMatrix=[291 325 364 408 457 512 573 642 719 806 902]
M=512
一部の実施形態では、変換係数を下位レイヤから上位レイヤにマッピングした後、上述のプロセスを利用する一部の場合において、係数を微調整していてもよい。微調整の後、第2のスケーリング演算を使用することができる。このスケーリング演算は、変換係数を「非量子化する(de-quantize)」ものとすることができる。
上述した一部の実施形態は1つの下位レイヤおよび1つの上位レイヤについてしか記述していなかったが、一部の実施形態は2つより多くのレイヤを含んでいてもよい。例えば、典型的な3つのレイヤの場合は、次のように機能することができる。最初に、最下位レイヤを復号することができる。その後、上述の方法によって変換係数を第2レイヤにマッピングすることができる。その後、マッピングされた変換係数を微調整することができる。次に、上述の方法を用いてこれらの変換係数を第3レイヤにマッピングすることができる。その後、これらの変換係数を微調整することができ、その結果として得られる係数を、AVC/H.264ビデオ符号化標準によって規定されたスケーリング演算などのようなスケーリング演算によって「非量子化する」ことができる。
本発明の一部の実施形態について図6および図21を参照して説明する。これらの実施形態に係るシステムは、第1の識別器321、第2の識別器322、第1の指標決定器323、第2の指標決定器324、および値決定器325を含んでいる。これらの実施形態では、隣接するマクロブロックに関連付けられた情報を用いて、対象ブロックまたはマクロブロックのための符号化演算または復号演算を通知することができる。一部の実施形態では、第1の隣接マクロブロックが第1の識別器321によって識別され(60)、第2の隣接マクロブロックが第2の識別器322によって識別される(61)。その後、第1の指標決定器323が第1の隣接マクロブロック指標を決定し(62)、第2の指標決定器324が第2の隣接マクロブロック指標を決定する(63)。その後、値決定器325が、これらの隣接マクロブロック指標に基づいてエントロピー・エンコーダ制御値を決定することができる(64)。
本発明の一部の実施形態について図7を参照して説明する。これらの実施形態では、第1の隣接マクロブロックを識別し(71)、第2の隣接マクロブロックを識別する(72)。その後、第1の隣接マクロブロックの属性を調べて、第1のマクロブロックが予め規定された条件を満たすかを判定することができる(73)。さらにまた、第2の隣接マクロブロックを条件も調べて、予め規定された条件が満たされているかを判定することができる(74)。一部の実施形態では、これらの条件は、「マクロブロックが利用可能であるか」、「マクロブロックがレイヤ間予測モードで符号化されているか」、「マクロブロックが空間領域において符号化されているか」、「マクロブロックがDC予測でイントラ予測されているか」、および「マクロブロックが別の時間的に一致するレイヤを参照して符号化されているか」という条件を含みうる。第1のマクロブロック75について上記条件の何れかが満たされている場合、第1のマクロブロック・フラグが、準拠を示すようにセットされる(80)。何れの条件も満たされていない場合、上記フラグは、不準拠を示すようにセットされる(76)。一部の実施形態では、何れかの条件が満たされた場合(80)、フラグを「0」にセットし、何れの条件も満たされていない場合(76)、フラグを「1」にセットすることができる。第2の隣接マクロブロックについて同じプロセス74、79を続けることができる。そのプロセスでは、条件が満たされていない場合(78)、フラグを1つの値にセットし、条件が満たされている(81)場合、フラグを別の値にセットすることができる。両方の隣接マクロブロックが調べられ、かつ関連付けられた2つのフラグがセットされている場合、これらのフラグを加算することができる(82)。その後、加算結果の値をエントロピー・エンコーダ制御値として使用することができる。
本発明の一部の実施形態について図8を参照して説明する。これらの実施形態では、第1の隣接マクロブロックは識別され(90)、第2の隣接マクロブロックが識別される(91)。その後、第1の隣接マクロブロックおよび第2の隣接マクロブロックの属性を調べて、マクロブロックが予め規定された条件を満たしているかを判定する(92)。一部の実施形態では、これらの条件は、「マクロブロックは利用可能であるか」、「マクロブロックがレイヤ間予測モードで符号化されているか」、および「マクロブロックが別のレイヤを参照して符号化されているか」という条件を含みうる。何れかのマクロブロックについて上記条件の何れかが満たされている場合(94)、推定された予測モードを、予め定められたモードにセットする。一部の実施形態では、予め定められたモードをDC予測モードとすることができる。
これらの実施形態では、さらに、実際の予測モードを特定することもできる。実際の予測モードは、画像の内容に基づくものとすることができる。最小のエラーまたは低減されたエラーを生じる方法を用いて、予測モードを決定することができる。実際の予測モードが推定された予測モードと同じである場合(94)、推定された予測モードの使用を示すようにビットストリームを符号化することができる。デコーダ側で、同じプロセスを続けて、ビットストリームを復号する時に、推定されたモードを選択することができる。実際の予測モードが推定された予測モードと同じでない場合(94)、実際のモードおよびその選択を示すようにメッセージを送ることができる(95)。推定された予測モードおよび実際の予測モードの情報伝達に関する詳細は、JVT AVC規格書で知ることができる。JVT AVC規格書は参照によって本明細書に組み込まれるものとする。
本発明の一部の実施形態は、イントラ符号化されたブロック中の輝度情報および色情報のための、イントラ予測モードの符号化を含んでいてもよい。伝統的に、これらのモードを、コンテキスト適応的な方法で情報伝達し、空間的隣接部の予測モードに依存する方法で符号化する。本発明の一部の実施形態では、条件付きのプロセスを用いてもよい。これらの実施形態では、隣接部がレイヤ間予測を利用しない場合、隣接部から予測モードを予測することができる。レイヤ間予測を利用するブロックは、次の方法の1つで処理することができる。一部の典型的な実施形態では、ブロックを、それが最も可能性の高い予測モードを有するかのように処理することができる。H.264/AVC関連の実施形態では、これは、輝度予測の場合についてDC予測モード(モード2)とすることができる。
一部の代替の実施形態では、ブロックを、それがインター符号化されたブロックであり、かつ予測領域のOUTSIDE(「外部」)であるかのように、処理してもよい。これらの実施形態では、OUTSIDEは、JVT SVCプロジェクト・グループの中でテストするのに利用されたソフトウェアを含む特定のコンテキストを有している。このソフトウェアは、JSVMとして一般に知られている。
一部の環境では、符号化されたモードを情報伝達するための、予測モードの符号化およびコンテキストの選択は、別々のプロセスとしてもよい。これら2つのプロセスに異なる予測方法を用いてもよい。例えば、レイヤ間予測を使用するブロックを含む、全てのイントラ符号化されたブロックについて、実際の予測モードを用いて予測モードを符号化してもよい。しかしながら、これらの同じブロックは、上述した規則の1つなどのような別の規則を利用して、符号化値を符号化するためのコンテキストを取得してもよい。例えば、上記コンテキストは、レイヤ間予測を利用するイントラ・ブロックが、最も可能性の高い予測モードを有しているものと仮定することができる。これらの実施形態の一部は、異なる複数のレイヤに対応する複数のビットストリームを独立して処理することを可能にする。
本発明の一部の実施形態は、JVT SVC標準(これは参照によって本明細書に含まれるものとする)の中で規定されている、「符号化ブロック・パターン」情報、すなわちCbpの保守を含んでいる。この情報は、画像(またはマクロブロック)内における、残差情報を含むサブ領域を規定する。一部の場合には、ビットストリーム・デコーダは、最初にCbpを復号し、次に情報を利用してビットストリームの残りを解析するので、その情報がビットストリームを復号するために必要となりうる。(例えば、Cbpは、存在しうる変換係数リストの数を規定することができる。)多くのデコーダでは、Cbpは、復号されたフレームを再構成するためにも利用される。例えば、Cbpが残差情報を示す場合、デコーダは、逆変換を計算することだけが必要である。一部の実施形態では、ビットストリーム中で伝送されたCbpは、解析プロセスが変換係数を抽出するために利用することができる。しかしながら、それは再構成プロセスにはもはや有用ではないかもしれない。なぜならサブ領域が前のレイヤからの残差情報を含みうるからである。
従って、本発明の実施形態のデコーダは、(1)再構成プロセス内のCbp情報を利用しないものであってもよく、(2)ビットストリームを解析した後にCbpを再計算しないものであってもよい。再計算プロセスの例は、残差情報を含むサブ領域を識別するために全ての係数リストを走査すること、あるいは、それに代えて、伝送されたCbpとCbp(これらは下位レイヤデータを再構成するために利用される)との間の2進論理和演算の計算によって新しいCbpを生成することを含んでいる。この場合、「下位レイヤデータ」は、レイヤ間予測プロセス中に利用されるレイヤを意味する。
本発明の一部の実施形態について図9および図22を参照して説明する。これらの実施形態に係るシステムは、受信機331、デコーダ332、解析器333、スケーラ334、加算器335、および計算器336を含んでいる。これらの実施形態では、受信機331が、Cbp情報および符号化画像データを含むビットストリームを受け取る(100)。デコーダ332がCbp情報を復号し(101)、Cbp情報を用いてビットストリームのどの部分が変換係数データを含むかを判定することができる。その後、解析器333が、Cbp情報を用いてビットストリームを解析して、基本レイヤおよび全ての拡張レイヤ中における、量子化されたインデックスまたは非量子化された変換係数を識別することができる(102)。その後、スケーラ334が、基本レイヤまたは下位レイヤのインデックスまたは係数を拡張レイヤと整合するようにスケーリングすることができる(103)。その後、加算器335が、スケーリングされたインデックスまたは係数を拡張レイヤに加算する(すなわち拡張レイヤと統合する)して、統合されたレイヤを形成することができる(104)。その後、計算器336が、元の基本レイヤまたは下位レイヤと新しい統合されたレイヤとの間での係数位置の変化を反映するように、Cbp情報を再計算または更新することができる(105)。その後、新しい統合したCbp情報は、その後に続く、統合したレイヤ、あるいは結果として得られた再構成された画像を処理することに使用できる。一部の実施形態では、統合されたCbp情報を、AVC規格書で規定されたループ・フィルタ演算に利用できる。
本発明の一部の実施形態は、8×8変換を有効にするフラグを処理するための方法およびシステムを含んでいる。これらの実施形態は、JVT SVC標準に関連しうる。これらの実施形態では、ブロックが、レイヤ間予測でイントラ符号化されており、かつ残差データを含んでいない場合、このフラグを伝送する必要がない。一部の実施形態では、フレーム間予測が指定サイズ(例えば8×8など)より小さなブロックを利用している場合、フラグを伝送する必要がない。これらの実施形態は、1つまたは複数の下位レイヤの中で伝送された変換フラグをコピーし、このフラグを再構成プロセス中に使用することができる。
本発明の一部の実施形態は、8×8変換を有効にするフラグを処理するための代替の方法およびシステムを含んでいる。これらの実施形態では、ブロックが残差データを含んでいない場合、このフラグを伝送する必要がない。この場合がレイヤ間予測に利用される下位レイヤに生じたのであれば、上位レイヤは、残差データを送る時に8×8変換を有効にすることを選択することができる。これは、伝送されないが8×8変換を無効にするような、フラグのデフォルト値であってもよい。一部の実施形態では、この特別な場合において、デコーダは、下位レイヤおよび上位レイヤが異なる変換を使用できるようにすることができる。
本発明の一部の実施形態は、量子化行列を処理するための方法およびシステムを含んでいる。量子化行列は、当該技術分野の専門家には、重み行列またはスケーリング行列としても知られている。これらの行列は、「非量子化」プロセスを変化させ、エンコーダおよびデコーダが周波数依存の(または変換係数依存の)量子化を適用することを可能にしうる。これらの実施形態では、スケーリング行列の存在は、上述のマッピング・プロセスで記述されたスケーリング・プロセスを変更する。一部の実施形態では、マッピング手順は、次のように記述できる。
Figure 0005179484
(ここで、THigherLayerおよびTLowerLayerはそれぞれ上位レイヤおよび下位レイヤにおける変換係数を示し、nは整数であり、Qp_LowerLayerおよびQp_HigherLayerはそれぞれ下位レイヤと上位レイヤのための量子化パラメータであり、S_LおよびS_Hはそれぞれ下位レイヤおよび上位レイヤのためのスケーリング率である)
重み行列を調整するために、一部の実施形態は、前記マッピング・プロセス中で示したアルゴリズムの修正版を利用できる。このアルゴリズムの修正版は、上記の説明を参照して以下のように規定できる。
Figure 0005179484
(ここで、S_L[n]およびS_H[n]は、明示的に存在してもよく、それに代えてビットストリームから取得されてもよい)
重み行列を調整する代替の実施形態では、追加の重み行列をビットストリーム中で送ることができる。この追加の重み行列は、下位レイヤからレイヤを予測するのに必要な周波数の重みを明示的に規定することができる。例えば、重み行列は次のように使用できる。
Figure 0005179484
(ここで、W1およびW2は、ビットストリームに含まれる重み行列である)
一部の実施形態では、W1またはW2の何れかが伝送されなくてもよい。これらの実施形態では、伝送されない行列は0に等しい要素を有するものとみなすことができる。
本発明の実施形態は、スケーラブルなビデオコーデックを、変更、作成および/または適用するための方法およびシステムを含んでいる。一部の実施形態は、より少数のレイヤを有するビットストリームへの、マルチレイヤ・ビットストリームの高速変換を可能にする。一部の実施形態は、マルチレイヤのビットストリームから単一レイヤのビットストリームへの変換を含んでいる。一部の典型的な実施形態は、AVCビットストリームからSVCビットストリームへの変換を含んでいる。
本発明の実施形態は、残差予測に関する。これらの実施形態は、変換領域内および空間領域内の両方で演算を行う残差予測プロセスを含むことができる。典型的な実施形態では、ビットストリーム中の上位レイヤがビットストリーム中の下位レイヤを参照し、かつ両レイヤが同じ空間解像度を含む場合、残差予測プロセスは、残差の変換係数を下位レイヤから上位レイヤへマッピングするステップを含むことができる。このマッピング・プロセスは、スケーリングされた変換係数または(スケーリングされていない)変換係数のレベルに有効である。一部の実施形態では、スケーリングされた変換係数の残差予測のプロセスは、次段落のように定めることができる。
A.8.11.4.1 スケーリングされた変換係数のための残差累算プロセス
このプロセスへの入力は、
マクロブロックがフィールドまたはフレームのマクロブロックであるかを示す変数fieldMb
輝度変換のタイプを示す変数lumaTrafo
256+2*MbWidthC*MbHeightCの要素を持つスケーリングされた変換係数値のリストsTCoeff
であり、
このプロセスの出力は、スケーリングされた変換係数値sTCoeffの修正版を含んでいる。
サブ節G.8.11.3(これは、本明細書に含まれるものとするSVC規格で規定されている)に記載されたスケーリングされた変換係数のための進歩的な微調整プロセスは、fieldMb、lumaTrafo、およびsTCoeffを入力とし、sTCoeffの修正版を出力として、起動させることができる。
反対に、一部の実施形態では、拡張レイヤが、異なる空間解像度を含む下位レイヤをレイヤ間予測に利用する場合に、空間領域内で残差予測プロセスを行ってもよい。これらの実施形態では、参照されたレイヤからの残差は、強度領域内で再構成され、拡張レイヤの解像度に補間される。代替シナリオにおいて、参照レイヤからの残差は、空間領域内で参照レイヤから導かれた予測に加算される。その後、この加算の結果が拡張レイヤに補間される。
本発明の一部の実施形態について図10および図23を参照して説明する。これらの実施形態に係るシステムは、解像度決定器341、比較器342、コントローラ343、係数スケーラ344、係数統合器345、逆変換器346、および空間領域統合器347を含んでいる。これらの実施形態では、現レイヤを調べて、現レイヤが残差予測を使用しているかを判定することができる(110)。残差予測が使用されていない場合、累算は必要ではない(111)。残差予測が使用されている場合(110)、解像度決定器341が現レイヤおよび参照レイヤの空間解像度を決定する(112、113)。その後、比較器342が、現レイヤの空間解像度を参照レイヤの空間解像度と比較する(114)。コントローラ343は、これら空間解像度が同じである場合に、係数スケーラ344および係数統合器345がステップ116および117を行うことを選択的に許容する。すなわち、これらの空間解像度が同じである場合(114)、参照レイヤ(これから現レイヤが予測される)の係数またはインデックスを、係数スケーラ344がスケーリングし(116)、係数統合器345が現レイヤのインデックスまたは係数と統合する(117)ことができる。コントローラ343は、これらの空間解像度が同じでない場合に、逆変換器346および空間領域統合器347がステップ115、118、および120を行うことを選択的に許容する。すなわち、空間解像度が同じでない場合(114)、現レイヤおよび参照レイヤのインデックスを非量子化し、結果として得られた係数を逆変換することができる(115,118)。その後、空間領域統合器347が、現レイヤおよび参照レイヤ中の得られた空間領域値を統合して、再構成された画像を形成することができる(120)。
上記の説明から容易に分かるように、残差予測の方法は、予測のために参照された、列挙された上位レイヤおよび列挙された下位レイヤの解像度に依存する。不運にも、空間領域内における残差情報の累算は、変換領域内における残差の累算およびそれに続く空間領域への変換とは等しくないかもしれないので、これは問題である。標準化された復号プロセスの場合、これは、エンコーダおよびデコーダとの間での誤差、および符号化効率の減少をもたらしうる。
現行のSVCシステムは、空間領域内でのみ残差予測を行うことで、この問題を解決しようとしている。しかしながら、本発明の一部の実施形態は、両方の領域内で残差予測を行う復号プロセスを含んでいる。より詳細には、残差予測が有効にされ、かつ拡張レイヤとレイヤ間予測のために参照されたレイヤとが同じ解像度である場合、変換領域内で残差が累算される。しかしながら、残差予測が有効にされ、かつ拡張レイヤとレイヤ間予測のために参照されたレイヤとが異なる解像度である場合、空間領域内で残差が累算される。
典型的な復号プロセスは、次のように記述される。
Figure 0005179484
Figure 0005179484
Figure 0005179484
上記の擬似コードには明示的に記述されていないが、他の典型的な実施形態は、規定された復号プロセスに対する他の拡張を含んでいる。一部の実施形態では、イントラ・レイヤ予測を、スケーラブルなビットストリーム中の複数のレイヤで行ってもよい。これがビデオ符号化規格の中で許容される場合、全ての処理に先立って関数GenerateIntraLayerPredictionを呼び出してもよい。この関数の出力は、アレイrYCCに加算することができる。さらに、一部の実施形態では、関数GenerateIntraLayerPredictionを上記の擬似コード中で呼び出さない。代わりに、outYCC=GeneateIntraLayerPrediction(layerID)+rYCCの行がoutYCC=rYCCに置き換えられるであろう。
本発明の一部の実施形態では、残差の累算プロセスを、スケーリングされていない変換係数について行ってもよい。この場合、スケーリングされた変換係数を構成する前にレイヤ間予測プロセスを行うことができる。一部の実施形態の態様は、「画像スケーラビリティのための方法およびシステム」("Methods and Systems for Image Scalability")というタイトルが付けられ、2006年7月10日に出願され、C.アンドリュー・セガル(C. Andrew Segall)によって発明された米国仮特許出願第60/806,930号に記載されている。一部の実施形態の態様は、「粗粒度スケーラビリティのためにビットストリームを書き換えるためのシステムおよび方法」("Systems and Methods for Bit-Stream Rewriting for Coarse Grain Scalability")というタイトルがつけられ、2006年10月6日に出願され、C.アンドリュー・セガルによって発明された米国仮特許出願第60/828,618号に記載されている。
典型的な手順のための擬似コードは、以下の通りである。
Figure 0005179484
Figure 0005179484
Figure 0005179484
本発明の一部の実施形態は、スケーラブルなビットストリームを入力として取り込み、再構成された画像シーケンスを生成するデコーダを含んでいる。上記のスケーラブルなビットストリームは、ビットストリームの列挙された下位レイヤからビットストリームの列挙された上位レイヤへ情報を投影するためにレイヤ間予測プロセスを用いる。
本発明の一部の実施形態は、変換領域内および空間領域内の両方で残差情報を累算するような復号プロセスを含んでいる。ビットストリーム中の列挙されたレイヤが同じ解像度を持つ画像シーケンスを記述している場合、ビットストリーム中の列挙されたレイヤ間で変換領域内の累算が行われる。
本発明の一部の実施形態は、レイヤ間予測に利用されるレイヤとは異なる空間解像度を持つ現レイヤを処理する場合だけ、累算された変換係数を空間領域に変換するような復号プロセスを含んでいる。変換係数は、空間領域に変換され、続いてアップサンプリング(すなわち補間)される。その後、変換係数リストは、0に等しくなるようセットされる。
本発明の一部の実施形態は、現在の復号レイヤとレイヤ間予測のために利用されるレイヤとの間で解像度が異なるようになるまで、変換領域内で残差を累算するような復号プロセスを含んでいる。その後、変換係数リストを0にセットし、続く同じ空間解像度を持つレイヤを参照するレイヤの処理では、変換領域内で累算を行う。
本発明の一部の実施形態は、イントラ・レイヤ予測を行うこと、スケーリングされた変換係数に基づいて逆変換の計算を行うこと、0でない可能性がある残差の信号に対して逆変換演算の出力を加算すること、およびこの前の加算の結果をイントラ・レイヤ予測プロセスの出力と加算することによって、出力ビットストリームを生成するような、復号プロセスを含んでいる。
本発明の一部の実施形態は、スケーリングされていない変換係数または変換係数レベルに基づいてレイヤ間予測を行うことをさらに可能にする復号プロセスを含む。
本発明の一部の実施形態は、出力のために再構成されないビットストリームのレイヤ内でイントラ・レイヤ予測を行うことをさらに可能にする復号プロセスを含む。このイントラ・レイヤ予測の結果は、累算された空間残差に加算される。
本発明の一部の実施形態は、残差予測プロセス中にクリッピングを行うような復号プロセスを含んでいる。
〔情報伝達の実施形態〕
画像表現は、多くの方法によって代替表現に変換することができる。この変換が行われるトランスコーディング演算は、原画像表現を完全に復号し、当該画像表現を別のフォーマットで再符号化することによって、代替の画像表現を生成するステップを含みうる。代替の画像表現は、原画像表現を完全に復号する代わりに原画像表現を係数の逆変換なしに改変する、前述の方法によっても生成しうる。これらの実施形態では、係数をスケーリングし、他のレイヤの係数と統合して、単一レイヤ表現を形成することができる。場合によっては、これを誤差なしに行うことができる。画像表現を代替表現に変換するために他の方法を用いることもできる。
一部の実施形態では、変換データを画像データに添付することができる。一部の実施形態では、誤差および完全な再構成なしにスケーラブルな現レイヤの表現を非スケーラブルな(例えばAVC)ビットストリームに変換しうることを示す変換データを、画像表現に付加(append)することができる。スケーラブルなレイヤがSVCレイヤであり、代替表現がAVCビットストリームである場合、この追加情報は"avc_layer_conversion flag"と称される。
本発明の一部の実施形態は、特定の複数の画像レイヤに関するビットレート特性を決定し、これらの特性を画像ファイルまたはビットストリームに追加する、コーデックを含みうる。一部の実施形態では、これらの特性はメタデータとして示されうる。一部の実施形態では、レイヤの代替表現に関してビットレート特性を決定することができる。例えば、代替表現はSVCレイヤのAVC準拠の変換を含みうる。一部の実施形態では、画像シーケンスまたはフレームのマルチレイヤSVC表現を、単一レイヤのAVC準拠の表現に変換することができる。AVC準拠の表現に関するビットレート特性は、原SVCレイヤ表現を用いて決定および符号化することができる。一部の実施形態では、ビットレート特性は、最大ビットレート、平均ビットレート、もしくは他のビットレート情報を含みうる。
一部の実施形態では、ビットレート特性は、画像表現の符号化に用いられるエントロピー・エンコーダに関して決定されうる。一部の実施形態では、ビットレート特性は、可変長符号(VLC)によって符号化された画像表現のために決定されうる。一部の実施形態では、ビットレート特性は、算術符号(AC)処理によって符号化された画像表現のために決定されうる。一部の実施形態では、ビットレート特性は、別のフォーマット(例えばAVC)に変換されて特定のエントロピー・エンコーダによって符号化されたときの画像表現のために決定され、その結果として当該画像表現に関するものとなりうる。典型的な実施形態では、SVCレイヤのためのビットレート特性は、VLCエンコーダによって符号化された当該レイヤのAVC変換のためのビットレートデータを含みうる。ACエンコーダによってAVC表現に変換された場合の上記と同一のレイヤのために、別のビットレート特性が決定されうる。そして、両ビットレート特性は、SVCレイヤに付加されるか、あるいはSVCレイヤに関連付けられる。
本発明の一部の実施形態では、スケーラブルなマルチレイヤ画像表現の複数のレイヤを、当該表現を完全に復号することなく統合できるかを、エンコーダが決定しうる。一部の実施形態では、この決定は、スケーラブルな表現の中にavc_rewrite flagが存在するか否かに基づいて行われうる。これは、(a)IntraBLマクロブロックがスケーラブルな表現中で使用されていないことを判定すること、(b)平滑化参照予測が使用されたことを判定すること、および/または、(c)下位レイヤ内の復号された変換係数が拡張レイヤ内の復号された変換係数にマッピングされていることを判定すること、にも基づきうる。原表現を完全に復号することなく複数のレイヤを統合できる場合、この情報を示すメッセージを原表現に添付することができる。一部の実施形態では、このメッセージは、スケーラビリティSEIメッセージの一部でありうる。
本発明の一部の実施形態について図11および図24を参照して説明する。これらの実施形態に係るエンコーダは、決定器(受信機)401および添付器402を含む。これらの実施形態では、決定器401および添付器402が、原表現として伝達される画像を受信する(130)。原表現は、スケーラブルな画像形式などの特定の画像形式であってもよい。原表現は、ビデオシーケンスのスケーラブルなマルチレイヤ表現であってもよい。典型的な一実施形態では、原表現は、複数のレイヤを含むSVCビデオ表現であってもよい。次いで、決定器401が、画像を代替表現に変換するときの、受信した画像のための1つ以上のビットレート特性(ビデオシーケンスの1つのレイヤの1つ以上のビットレート特性)を決定しうる(131)。一部の実施形態では、上記代替表現は、単一レイヤのみを含む非スケーラブルなビデオ表現であってもよい。すなわち、ビットレート特性は非スケーラブルな単一レイヤ表現に関するものであってもよい。一部の実施形態では、上記ビットレート特性は、最大ビットレートおよび/または平均ビットレートであってもよい。一部の実施形態では、上記代替表現はAVCビデオ表現であってもよい。ビットレート特性が決定されると、添付器402(決定されたビットレート特性のデータ)は、ビットレート特性データを原画像表現に添付、付加、あるいは関連付けして(132)、拡張された表現を形成する。一部の実施形態では、ビットレート特性データは、ビデオビットストリーム内のメタデータとして関連付けされていてもよい。一部の実施形態では、上記の拡張された表現は、SVC等のスケーラブルな表現であってもよい。一部の実施形態では、上記添付は、SVCビットストリーム中にSEIメッセージを追加するステップを含みうる。添付器402は、ビデオビットストリームおよびビットストリーム内の関連付けられたビットレート特性データを後段のデバイス(デコーダ、変換器、トランスコーダ、または他のデバイス)に情報伝達しうる。一部の実施形態では、ビデオビットストリームおよび関連付けられたビットレート特性データは、ビットレート特性データが画像レイヤおよびエントロピー・コーデックの選択並びに他の決定の実行に用いられうる、後段のデバイスによって受信されうる。
本発明の一部の実施形態について図12を参照して説明する。これらの実施形態では、画像が原画像表現として受信される(140)。次に、この原表現が、部分的に復号される(141)。一部の実施形態では、この部分的な復号は、逆変換なしのエントロピー復号を含みうる。次に、当該画像の原表現が代替表現に変換(convertまたはtranslate)されうる(142)。一部の実施形態では、上記変換は、下位レイヤの変換係数を、上位レイヤおよびこれらのレイヤからの変換係数の組み合わせと整合するようにスケーリングするステップを含みうる。上記変換は、統合された係数をエントロピー復号して、統合された単一レイヤ表現を形成するステップもさらに含みうる。一部の実施形態では、上記原表現はSVCビットストリームであり、上記代替表現はAVCビットストリームである。上記代替表現のための1つ以上のビットレート特性が測定(143)または計算されうる。次いで、これらの特性に基づくビットレートデータが、画像の原表現に添付または関連付けられうる(144)。
本発明の一部の実施形態について図13および図25を参照して説明する。これらの実施形態に係るエンコーダは、第1の決定器(受信機)411、第2の決定器(受信機)412、および添付器413を含んでいる。これらの実施形態では、第1の決定器411、第2の決定器412、および添付器413が、画像を原画像表現として受信する(150)。上記原画像表現は、ビデオシーケンスのスケーラブルなマルチレイヤ表現であってもよい。典型的な一実施形態では、上記原画像表現は、複数のレイヤを有するSVCビデオ表現であってもよい。次いで、第1の決定器411が、第1のエントロピー・エンコーダで符号化された画像の代替表現のための、1つ以上のビットレート特性の第1のセットを決定しうる(151)。上記第1のセットは、第1のエントロピー・エンコーダ専用であってもよい。上記第1のセットは、非スケーラブルな単一レイヤ表現に関するものであってもよい。一部の実施形態では、上記第1のセットは、ビデオシーケンスのレイヤの第1の平均AVCビットレート特性および第1の最大AVCビットレート特性を含みうる。一部の実施形態では、上記代替表現はAVCビデオ表現であってもよい。第2の決定器412もまた、画像の代替表現が第2のエントロピー・エンコーダによって符号化されるときの、当該画像の代替表現のための1つ以上のビットレート特性の第2のセットを決定しうる(152)。当該第2のセットは、上記レイヤの非スケーラブルな単一レイヤ表現のための第2のエントロピー・エンコーダ専用であってもよい。一部の実施形態では、上記第2のセットは、第2の平均AVCビットレート特性および第2の最大AVCビットレート特性を含みうる。次いで、添付器413が、ビットレート特性のこれらのセットを画像の原表現に添付または関連付けうる(153)。関連付けられたこれらのビットレート特性は、後の処理によって原表現を代替表現に変換することに関する決定が行われる際に用いられうる。これらの処理は、添付されたビットレート特性データを有する原表現を受信する後段のデバイス(デコーダ、変換器、トランスコーダ、または他のデバイス)内において生じうる。
本発明の一部の実施形態について図14を参照して説明する。これらの実施形態では、第1レイヤ表現および第2レイヤ表現を含む画像データが受信される(160)。次に、第1レイヤが非スケーラブルな代替表現で表現されたときの、第1レイヤのための1つ以上のビットレート特性が決定される(161)。第2レイヤが非スケーラブルな代替表現で表現されたときの、第2レイヤのための1つ以上のビットレート特性も決定されうる(162)。次に、代替表現の第1レイヤのビットレートデータが第1レイヤ表現に関連付けられうる(163)。また、代替表現の第2レイヤのビットレートデータが第2レイヤ表現に関連付けられうる(164)。次いで、第1および第2のレイヤ表現が、それに関連付けられた代替表現ビットレート特性データと共に送信され、任意の受信デバイスが、当該関連付けられたデータを用いて代替表現の変換の決定を行うことができる。
本発明の一部の実施形態について図15および図26を参照して説明する。これらの実施形態に係るエンコーダは、第1の決定器(受信機)421、第2の決定器(受信機)422、および関連付け器(associator)423を含んでいる。これらの実施形態では、エンコーダの第1の決定器421、第2の決定器422、および関連付け器423が、画像の第1レイヤに対する画像データを受信する(170)。当該画像データは、復号されていない未加工画像データであってもよい。これらの実施形態では、第1の決定器421が第1の可変長符号(VLC)ビットレート特性を決定する(171)。当該第1の可変長符号(VLC)ビットレート特性では、第1のVLC特性が、VLCエンコーダ(コンテキスト適応的な可変長符号コーデック)によって符号化された非スケーラブルなレイヤとして表現されたときの画像の第1レイヤのビットレートに関連する。第1のVLCビットレート特性は、第1レイヤの平均AVC/VLCビットレート特性および最大AVC/VLCビットレート特性を含みうる。また、第2の算術符号(AC)ビットレート特性が第2の決定器422によって決定されうる(172)。当該第2の算術符号(AC)ビットレートでは、第2のACビットレート特性が、ACエンコーダ(コンテキスト適応的な算術符号コーデック)によって符号化された非スケーラブルなレイヤとして表現されたときの画像の第1レイヤのビットレートに関連する。第2のACビットレート特性は、第1レイヤの平均AVC/ACビットレート特性および最大AVC/ACビットレート特性を含みうる。次に、関連付け器423は、第1のVLCビットレート特性データおよび第2のACビットレートデータを、画像の第1レイヤのスケーラブルな表現に関連付ける(173)か、または添付しうる。次に、関連付けられたビットレート特性データは、スケーラブルなレイヤを非スケーラブルなレイヤに変換するために変換処理において用いられうる。
本発明の一部の実施形態は、関連付けられたビットレート特性データを含む画像ファイルまたはビットストリームを受信し、当該ビットレート特性データを用いてビットストリームまたはファイル変換処理を制御するための、方法およびシステムを含んでいる。一部の実施形態では、上記ビットストリーム特性データを用いて、マルチレイヤのスケーラブルなビットストリームのうち何れのレイヤが単一レイヤビットストリームに変換されるべきであるのかを判定することができる。一部の実施形態では、上記ビットストリーム特性データを用いて、変換処理のためのエントロピー・エンコーダの選択を制御することができる。典型的な一実施形態では、上記ビットストリーム特性データを用いて、SVCビットストリームからAVCビットストリームへの変換に関する処理を制御すると共に、変換処理のためのVLCまたはACエンコーダの選択を制御することができる。
本発明の一部の実施形態について図16および図27を参照して説明する。これらの実施形態に係る後段のデバイス(デコーダ、変換器、トランスコーダ、もしくは他のデバイス)は、決定器(受信機)431、選択器432、および変換器433を含む。これらの実施形態では、決定器431、選択器432、および変換器433は、代替表現ビットレートデータを有するスケーラブルなマルチレイヤビットストリームをエンコーダから受信する(180)。決定器431は、ビットレート特性データを含むビデオシーケンスのスケーラブルなマルチレイヤ表現を受信しうる。当該ビットレート特性データは、マルチレイヤ表現中の複数のレイヤが単一レイヤビットストリーム表現として表現されるときの、マルチレイヤ表現中の上記複数のレイヤのためのレイヤ専用且つエントロピー・エンコーダ専用のビットレート特性を含んでいる。決定器431は、目標ビットレートパラメータも決定する(181)。上記目標ビットレートパラメータは、意図された受信デバイスの処理能力、伝送チャネル特性、または他の基準に基づいて決定されうる。選択器432は、代替表現ビットレートデータを用いて、上記目標ビットレートパラメータが満たされるようにマルチレイヤビットストリームから複数のレイヤを選択しうる(182)。この選択は、目標ビットレートパラメータと、レイヤ専用且つエントロピー・エンコーダ専用のビットレート特性との関係に基づいて行うことができる。一部の実施形態では、上記目標ビットレートパラメータは最大ビットレートを含みうる。その場合、最大ビットレートパラメータを超過しないビットストリームを生成するためにマルチレイヤビットストリーム中の一部のレイヤを廃棄する必要がある。変換器433は、選択された複数のレイヤを代替表現に変換し(183)、送信先に送信しうる。上記代替表現は、単一レイヤビットストリーム表現であってもよい。
本発明の一部の実施形態について図17を参照して説明する。これらの実施形態では、代替表現のビットレートデータを含むスケーラブルなマルチレイヤビットストリームが受信される(190)。また、目標ビットレートパラメータが決定される(191)。上記目標ビットレートパラメータは、意図された受信デバイスの処理能力、伝送チャネル特性、もしくは他の基準に基づいて決定されうる。一部の実施形態では、代替のエントロピー・エンコーダが利用可能である場合、エントロピー・エンコーダが選択されうる(192)。一部の実施形態では、VLCエンコーダまたはACエンコーダが選択されうる。SVCビットストリーム上で動作する一部の実施形態は、コンテキスト適応的なVLC(CAVLC)符号とコンテキスト適応的なAC符号(CABAL)との間で選択を行いうる。
代替表現のビットレートデータを用いて、上記目標ビットレートパラメータが満たされるようにマルチレイヤビットストリームから複数のレイヤが選択されうる(193)。一部の実施形態では、上記目標ビットレートパラメータは最大ビットレートを含みうる。その場合、最大ビットレートパラメータを超過しないビットストリームを生成するために、マルチレイヤビットストリーム中の一部のレイヤを破棄する必要がある。選択された複数のレイヤは、選択されたエントロピー符号を用いて代替の非スケーラブルな表現に変換されうる(193)。
本発明の一部の実施形態について図18を参照して説明する。これらの実施形態では、代替表現ビットレートデータおよびレイヤ互換性データ(layer compatibility data)を含む、スケーラブルなマルチレイヤビットストリームが受信される(200)。当該レイヤ互換性データに基づいて、ビットストリームを完全に復号することなく複数のスケーラブルなレイヤを統合することができるかが判定されうる(201)。一部の実施形態では、係数の逆変換なしに複数のレイヤを統合することができるかに関する判定が行われる。
復号および再符号化なしに複数のレイヤを統合できる場合、目標ビットレートパラメータ(202)も決定されうる。上記目標ビットレートパラメータは、意図された受信デバイスの処理能力、伝送チャネル特性、または他の基準に基づいて決定されうる。代替表現のビットレートデータを用いて、上記目標ビットレートパラメータが満たされるようにマルチレイヤビットストリームから複数のレイヤが選択されうる(203)。一部の実施形態では、上記目標ビットレートパラメータは最大ビットレートを含みうる。その場合、最大ビットレートパラメータを超過しないビットストリームを生成するために、マルチレイヤビットストリーム中の一部のレイヤを廃棄する必要がある。選択された複数のレイヤを、完全に復号することなく係数のスケーリングによって統合し、その結果として代替表現を得ることができる(204)。
復号および再符号化なしに複数のレイヤを統合することができない場合、目標ビットレートパラメータ(205)が再び決定されうる。しかしながら、完全な復号なしに複数のレイヤを統合することができないため、上記複数のレイヤは、復号されて代替表現に再符号化される。この処理では、再符号化された複数のレイヤのビットレート特性が決定されうる。これらのビットレート特性は、目標ビットレートと比較されて、何れのレイヤが復号、再符号化、および/または再送信のために選択されるべきであるのかが判定されうる。代替表現のビットレートデータを用いて、再符号化されたビットストリームから複数のレイヤが、上記目標ビットレートパラメータが満たされるように選択されうる(206)。選択された複数のレイヤは、再符号化によって(207)代替表現に統合することができる(204)。
本発明の一部の実施形態では、以下のスケーラビリティSEIメッセージのシンタックスが用いられうる。
〔シンタックス〕
F.10.1.1 スケーラビリティ情報SEIメッセージのシンタックス
Figure 0005179484
Figure 0005179484
Figure 0005179484
Figure 0005179484
一部の典型的な実施形態では、以下のSEIメッセージのセマンティックスを用いることができる。
F.10.2 SEIペイロードのセマンティックス
F.10.2.1 スケーラビリティ情報SEIメッセージのセマンティックス
このSEIメッセージは、存在する場合であれば、IDRアクセスユニット内に表れるものとする。当該メッセージのセマンティックスは、同タイプの次のSEIメッセージまで有効である。
num_layers_minus1に1を加算した値は、ビットストリームによってサポートされるスケーラブルなレイヤまたは提示ポイント(presentation point)の数を示す。num_layers_minus1の値は、0〜255の範囲内にある。
layer_id[i]は、スケーラブルなレイヤの識別子を示す。
スケーラブルなレイヤの各々は、レイヤ識別子に関連付けられている。レイヤ識別子は次のように割り当てられる。レイヤ識別子のより大きい値はより上位のレイヤを示す。値0は最下位レイヤを示す。レイヤの復号および提示は、いかなるより上位のレイヤにも依存しないが、より下位のレイヤに依存しうる。従って、最下位レイヤは独立して復号および提示することができ、レイヤ1の復号および提示はレイヤ0に依存し、レイヤ2の復号および提示はレイヤ0および1に依存し、以後同様に復号および提示しうる。スケーラブルなレイヤの表現は、スケーラブルなレイヤ自体の存在と、当該スケーラブルなレイヤが直接的または間接的に依存する全てのより下位のレイヤの存在とを必要とする。以下では、スケーラブルなレイヤおよび当該スケーラブルなレイヤが直接的または間接的に依存する全ての下位レイヤを、スケーラブルなレイヤ表現と総称する。
1に等しいfgs_layer_flag[i]は、iと等しいレイヤ識別子を有するスケーラブルなレイヤが、細粒度のスケーラブルな(FGS)レイヤであることを示す。値0は、スケーラブルなレイヤがFGSレイヤではないことを示す。FGSレイヤの符号化されたスライスNALユニットは、バイトの位置に合った(byte-aligned)任意の位置で切り捨てることができる。
1に等しいsub_pic_layer_flag[i]は、iと等しいレイヤ識別子を有するスケーラブルなレイヤが複数のサブピクチャから成っており、各サブピクチャはアクセスユニットの符号化された複数のスライスのサブセットから成っていることを示す。値0は、スケーラブルなレイヤがアクセスユニット全体から成っていることを示す。
注:符号化されたピクチャの各サブピクチャのスケーラブルなレイヤへのマッピングは、サブピクチャのスケーラブルなレイヤの情報SEIメッセージによって情報伝達される。
1に等しいsub_region_layer_flag[i]は、iと等しいレイヤ識別子を有するスケーラブルなレイヤのための部分領域情報がSEIメッセージ中に存在することを示す。値0は、スケーラブルなレイヤのための部分領域情報がSEIメッセージ中に存在しないことを示す。
1に等しいprofile_level_info_present_flag[i]は、iと等しいレイヤ識別子を有するスケーラブルなレイヤのためのプロファイルおよびレベル情報がSEIメッセージ中に存在することを示す。値0は、iと等しいレイヤ識別子を有するスケーラブルなレイヤのためのプロファイルおよびレベル情報がSEIメッセージ中に存在しないことを示す。
1に等しいdecoding_dependency_info_present_flag[i]は、iと等しいレイヤ識別子を有するスケーラブルなレイヤのための復号依存性情報がSEIメッセージ中に存在することを示す。値0は、iと等しいレイヤ識別子を有するスケーラブルなレイヤのための復号依存性情報がSEIメッセージ中に存在しないことを示す。
1に等しいbitrate_info_present_flag[i]は、iと等しいレイヤ識別子を有するスケーラブルなレイヤのためのビットレート情報がSEIメッセージ中に存在することを示す。値0は、iと等しいレイヤ識別子を有するスケーラブルなレイヤのためのビットレート情報がSEIメッセージ中に存在しないことを示す。
1に等しいfrm_rate_info_present_flag[i]は、iと等しいレイヤ識別子を有するスケーラブルなレイヤのためのフレームレート情報がSEIメッセージ中に存在することを示す。値0は、iと等しいレイヤ識別子を有するスケーラブルなレイヤのためのフレームレート情報がSEIメッセージ中に存在しないことを示す。
1に等しいfrm_size_info_present_flag[i]は、iと等しいレイヤ識別子を有するスケーラブルなレイヤのためのフレームサイズ情報がSEIメッセージ中に存在することを示す。値0は、iと等しいレイヤ識別子を有するスケーラブルなレイヤのためのフレームサイズ情報がSEIメッセージ中に存在しないことを示す。
1に等しいlayer_dependency_info_present_flag[i]は、iと等しいレイヤ識別子を有するスケーラブルなレイヤのためのレイヤ依存性情報がSEIメッセージ中に存在することを示す。値0は、iと等しいレイヤ識別子を有するスケーラブルなレイヤのためのレイヤ依存性情報がSEIメッセージ中に存在しないことを示す。
1に等しいinit_parameter_sets_info_present_flag[i]は、iと等しいレイヤ識別子を有するスケーラブルなレイヤのための初期パラメータ・セット情報がSEIメッセージ中に存在することを示す。値0は、iと等しいレイヤ識別子を有するスケーラブルなレイヤのための初期パラメータ・セット情報がSEIメッセージ中に存在しないことを示す。
注:初期パラメータ・セットとは、ビットストリームの最初に配置することのできるパラメータ・セット、あるいはセッションの最初に送信することのできるパラメータ・セットを意味する。
layer_profile_idc[i]、layer_constraint_set0_flag[i]、layer_constraint_set1_flag[i]、layer_constraint_set2_flag[i]、layer_constraint_set3_flag[i]、およびlayer_level_idc[i]は、iと等しいレイヤ識別子を有するスケーラブルなレイヤの表現のビットストリームの特性およびレベル準拠性を示す。layer_profile_idc[i]、layer_constraint_set0_flag[i]、layer_constraint_set1_flag[i]、layer_constraint_set2_flag[i]、layer_constraint_set3_flag[i]、およびlayer_level_idc[i]のセマンティックスは、ここで対象(target)ビットストリームがスケーラブルなレイヤ表現のビットストリームではない限りは、profile_idc、constraint_set0_flag、constraint_set1_flag、constraint_set2_flag、constraint_set3_flag、およびlevel_idcのセマンティックスとそれぞれ同一である。
1に等しいavc_layer_conversion_flag[i]は、iと等しいレイヤ識別子を有するスケーラブルなレイヤの表現が、誤差なしに、かつスケーラブルなレイヤの完全な再構成なしにAVCビットストリームへ変換可能であることを示す。値0は、iと等しいレイヤ識別子を有するスケーラブルなレイヤの表現が、誤差なしに、かつスケーラブルなレイヤの完全な再構成なしにAVCビットストリームへ変換できないことを示す。
temporal_level[i]、dependency_id[i]、およびquality_level[i]は、iと等しいレイヤ識別子を有するスケーラブルなレイヤ中のNALユニットのtemporal_level、dependency_id、およびquality_levelとそれぞれ等しい。
avg_bitrate[i]は、iと等しいレイヤ識別子を有するスケーラブルなレイヤの表現のビットストリームの平均ビットレートを1000ビット/秒単位で示す。avg_bitrate[i]のセマンティックスは、accurate_statistics_flagが1と等しい場合、ここで対象ビットストリームがスケーラブルなレイヤの表現のビットストリームであることを除いては、サブシーケンスレイヤ特性SEIメッセージ中のaverage_bit_rateのセマンティックスと同一である。
max_bitrate[i]は、iと等しいレイヤ識別子を有するスケーラブルなレイヤの表現のビットストリームの最大ビットレートを、1000ビット/秒単位で、AnnexCで規定されたアクセスユニット除去時間の任意の1秒時間窓で示す。
avc_avg_bitrate_cabac[i]は、CABACエントロピー・エンコーダを用いたAVCビットストリームへの変換後における、iと等しいレイヤ識別子を有するスケーラブルなレイヤの表現のビットストリームの平均ビットレートを1000ビット/秒単位で示す。avg_bitrate[i]のセマンティックスは、accurate_statistics_flagが1と等しい場合、対象ビットストリームがスケーラブルなレイヤの表現のビットストリームである場合を除いて、サブシーケンスレイヤ特性SEIメッセージ中のaverage_bit_rateのセマンティックスと同一である。
avc_max_bitrate_cabac[i]は、CABACエントロピー・エンコーダを用いたAVCビットストリームへの変換後における、iと等しいレイヤ識別子を有するスケーラブルなレイヤの表現のビットストリームの最大ビットレートを、1000ビット/秒単位で、AnnexCで規定されたアクセスユニット除去時間の任意の1秒を時間窓として示す。
avc_avg_bitrate_cavlc[i]は、CAVLCエントロピー・エンコーダを用いたAVCビットストリームへの変換後における、iと等しいレイヤ識別子を有するスケーラブルなレイヤの表現のビットストリームの平均ビットレートを1000ビット/秒単位で示す。avg_bitrate[i]のセマンティックスは、accurate_statistics_flagが1と等しい場合、対象ビットストリームがスケーラブルなレイヤ表現のビットストリームである場合を除いて、サブシーケンスレイヤ特性SEIメッセージ中のaverage_bit_rateのセマンティックスと同一である。
avc_max_bitrate_cavlc[i]は、CAVLCエントロピー・エンコーダを用いたAVCビットストリームへの変換後における、iと等しいレイヤ識別子を有するスケーラブルなレイヤの表現のビットストリームの最大ビットレートを、1000ビット/秒単位で、AnnexCで規定されたアクセスユニット除去時間の任意の1秒を時間窓として示す。
constant_frm_rate_idc[i]は、iと等しいレイヤ識別子を有するスケーラブルなレイヤの表現のフレームレートが一定であるかを示す。スケーラブルなレイヤ表現の何れの部分期間(temporal section)が計算用に用いられたとしても、以下に定義するavg_frm_rateの値が一定である場合はフレームレートは一定であり、そうでない場合はフレームレートは一定ではない。値0は一定ではないフレームレートを示し、値1は一定のフレームレートを示し、値2は、フレームレートが一定であるかが不明であることを示す。ConstantFrameRateの値は、0〜2の範囲内にある。
avg_frm_rate[i]は、iと等しいレイヤ識別子を有するスケーラブルなレイヤの表現のビットストリームの平均フレームレートをフレーム/秒単位で示す。avg_frm_rate[i]のセマンティックスは、accurate_statistics_flagが1と等しい場合、対象ビットストリームがスケーラブルなレイヤ表現のビットストリームである場合を除いては、サブシーケンスのレイヤ特性のSEIメッセージ中のaverage_frame_rateのセマンティックスと同一である。
frm_width_in_mbs_minus1[i]に1を加えた値は、iと等しいレイヤ識別子を有するスケーラブルなレイヤの表現中の符号化されたフレームの、マクロブロック内の最大幅を示す。
frm_height_in_mbs_minus1[i]に1を加えた値は、iと等しいレイヤ識別子を有するスケーラブルなレイヤの表現中の符号化されたフレームの、マクロブロック内の最大高さを示す。
base_region_layer_id[i]に1を加えた値は、iと等しいレイヤ識別子を有するスケーラブルなレイヤによって表現される領域の微分(derivation)のための基本領域として、表現される領域が用いられる、スケーラブルなレイヤのレイヤ識別子の値を示す。
1と等しいdynamic_rect_flag[i]は、iと等しいレイヤ識別子を有するスケーラブルなレイヤによって表現される領域が、基本領域の動的に変更された矩形部分であることを示す。dynamic_rect_flag[i]が1と等しくない場合、スケーラブルな現レイヤによって表現される領域は、基本領域の一定の矩形部分である。
horizontal_offset[i]およびvertical_offset[i]は、それぞれ、iと等しいレイヤ識別子を有するスケーラブルなレイヤの表現によって表現される矩形領域の左上の画素の水平オフセットおよび垂直オフセットを、それぞれ、基本領域の輝度サンプル中における基本領域の左上の画素に対する相対値として与える。
region_width[i]およびregion_height[i]は、基本領域の輝度サンプル中における、iと等しいレイヤ識別子を有するスケーラブルなレイヤの表現によって表現される矩形領域の幅および高さを、それぞれ与える。
roi_id[i]は、iと等しいレイヤ識別子を有するスケーラブルなレイヤによって表現される領域の、注目領域の識別子(region-of-interest identifier)を示す。
num_directly_dependent_layers[i]は、iと等しいレイヤ識別子を有するスケーラブルなレイヤが直接的に依存するスケーラブルなレイヤの数を示す。レイヤAがレイヤBに直接的に依存するとは、レイヤBからのレイヤ間予測を有している符号化されたピクチャが、レイヤA内に少なくとも1つあることを意味している。num_directly_dependent_layersの値は0〜255の範囲内にある。
directly_dependent_layer_id_delta[i][j]は、iと等しいレイヤ識別子を有するスケーラブルなレイヤが直接的に依存するj番目のスケーラブルなレイヤのレイヤ識別子とiとの差を示す。直接的に依存するスケーラブルなレイヤのレイヤ識別子は、(directly_dependent_layer_id_delta+i)と等しい。
num_init_seq_parameter_set_minus1[i]に1を加えた値は、iと等しいレイヤ識別子を有するスケーラブルなレイヤの表現を復号するための初期シーケンス・パラメータ・セットの数を示す。
init_seq_parameter_set_id_delta[i][j]は、jが0と等しい場合、iと等しいレイヤ識別子を有するスケーラブルなレイヤの表現を復号するためのj番目の初期シーケンス・パラメータ・セットの値を示す。init_seq_parameter_set_id_delta[i][j]は、jが0より大きい場合、j番目の初期シーケンス・パラメータ・セットのseq_parameter_set_idの値と、(j−1)番目の初期シーケンス・パラメータ・セットのseq_parameter_set_idの値との差を示す。初期シーケンス・パラメータ・セットは、seq_parameter_set_idの値の昇順で論理的に順序付けられている。
num_init_pic_parameter_set_minus1[i]に1を加えた値は、iと等しいレイヤ識別子を有するスケーラブルなレイヤの表現を復号するための初期ピクチャ・パラメータ・セットの数を示す。
init_pic_parameter_set_id_delta[i][j]は、jが0と等しい場合、iと等しいレイヤ識別子を有するスケーラブルなレイヤの表現を復号するためのj番目の初期ピクチャ・パラメータ・セットのpic_parameter_set_idの値を示す。init_pic_parameter_set_id_delta[i][j]は、jが0より大きい場合、j番目の初期ピクチャ・パラメータ・セットのpic_parameter_set_idの値と、(j−1)番目の初期ピクチャ・パラメータ・セットのpic_parameter_set_idの値との差を示す。初期ピクチャ・パラメータ・セットは、pic_parameter_set_idの値の昇順で論理的に順序付けられている。
以上の明細書中で使用した用語および表現は、ここでは制限の用語としてではなく説明の用語として使用したものであり、そのような用語および表現の使用には図示および説明した特徴およびその一部の均等物を除外しようとする意図はなく、本発明の範囲は次に記載する請求項によってのみ規定され制限されるものと認識されるべきである。
本発明の実施形態のシステムの各要素は、次のようにCPUを用いてソフトウェアによって実現してもよい。
すなわち、上記システムは、各機能を実現する制御プログラムの命令を実行するCPU(Central Processing Unit;中央処理装置)、プログラムを記録したROM(Read Only Memory;読み取り専用メモリ)、プログラムがその上で実行されるRAM(Random Access Memory;ランダムアクセスメモリ)、上記プログラムおよび各種のデータを格納するメモリ等の記憶装置(記録媒体)などの構成要素を含むことができる。本発明の目的は、上記各機能を実現するためのソフトウェアである上記システムの制御プログラムのプログラムコード(例えば、実行可能コードプログラム、中間コードプログラム、ソースプログラムなど)をコンピュータで読み取り可能な形で記録媒体上に記録し、この記録媒体を上記システムに供給し、そのコンピュータ(もしくはCPUまたはMPU)が上記記録媒体から上記プログラムコードを読み出して上記プログラムを実行する形でも、達成可能である。
そのような記録媒体の例は、磁気テープおよびカセットテープ等のテープ;フレキシブルディスクおよびハードディスク等の磁気ディスク;CD−ROM/MO/MD/DVD/CD−R等の光ディスクを含むディスク;ICカード(メモリカードを含む)等のカード;マスクROM、EPROM(Erasable Programmable Read Only Memory;および、消去可能プログラマブルROM)、EEPROM(Electrically Erasable Programmable Read Only Memory;電気的消去可能プログラマブルROM)、またはフラッシュROM等の半導体メモリを含んでいる。
それに代えて、上記システムを通信網に接続して、プログラムコードを通信ネットワーク経由で供給可能としてもよい。通信ネットワークの制限されない例は、インターネット、イントラネット、エクストラネット、LAN、ISDN、VAN、CATV網、仮想専用網(virtual private network)、電話回線網、移動体通信網、および衛星通信網を含んでいる。通信ネットワークを構成する伝送媒体の制限されない例は、IEEE1394、USB、電力線通信、ケーブルテレビ回線、電話回線、およびADSL回線等のような有線媒体;IrDAおよびリモートコントローラ等の赤外線;Bluetooth(登録商標)、IEEE802.11、HDR、携帯電話網、衛星回線および地上波デジタル放送網等の電波からなる。なお、本発明は、プログラムコードの電子的な伝送によって具現化された、搬送波によって、あるいはデータ信号列として、実現され得る。

Claims (15)

  1. 拡張されたマルチレイヤビットストリームを作成するための方法であって、
    a)ビデオシーケンスのスケーラブルなマルチレイヤ表現を受信するステップ;
    b)上記ビデオシーケンスのレイヤの非スケーラブルな単一レイヤ表現に関する、スケーラブルな表現を非スケーラブルな表現に、誤差無く、かつ完全な再構成を行わずに変換可能なことを示すフラグ、
    プロファイルおよびレベル準拠性を示すフラグ、および、
    上記ビデオシーケンスの上記レイヤが、i)VLC符号化されるときの最大ビットレート特性および平均ビットレート特性と、ii)算術符号化されるときの最大ビットレート特性および平均ビットレート特性を上記スケーラブルなマルチレイヤ表現に添付して、拡張されたスケーラブルな表現を形成するステップを含む方法。
  2. 上記スケーラブルなマルチレイヤ表現は、SVC表現であり、
    上記非スケーラブルな単一レイヤ表現は、AVC表現である、請求項1に記載の方法。
  3. 記ビットレート特性を添付する上記ステップは、SVCビットストリーム中にSEIメッセージを追加するステップを含む、請求項2に記載の方法。
  4. 上記スケーラブルなマルチレイヤ表現中のレイヤが、このレイヤと異なるレイヤに対し、係数を逆変換することなく統合可能であるかを判定し、統合可能である場合は、上記スケーラブルな表現を非スケーラブルな表現に、誤差無く、かつ完全な再構成を行わずに変換可能なことを示すフラグを上記スケーラブルなマルチレイヤ表現に添付するステップをさらに含む、請求項1ないしの何れか1項に記載の方法。
  5. SVCビットストリーム表現をAVCビットストリーム表現に変換するための方法であって、
    a)第1レイヤおよび第2レイヤを含むSVCビデオシーケンスを受信するステップであって、上記SVCビデオシーケンスはビットレート特性データをさらに含み、当該ビットレート特性データは、
    i)上記第1レイヤがAVCビットストリームとして表現されてVLCエンコーダによって符号化されるときの、上記第1レイヤのための最大ビットレート特性および平均ビットレート特性;
    ii)上記第2レイヤがAVCビットストリームとして表現されてVLCエンコーダによって符号化されるときの、上記第2レイヤのための最大ビットレート特性および平均ビットレート特性を含むステップ;
    c)目標ビットレートパラメータを決定するステップ;
    d)上記目標ビットレートパラメータと、上記第1レイヤおよび第2レイヤのための上記最大ビットレート特性または上記平均ビットレート特性のうちの1つとの関係に基づいて、上記第1レイヤおよび第2レイヤのうちの1つ以上のレイヤを変換のために選択するステップ;および
    e)選択された上記1つ以上のレイヤを上記AVCビットストリーム表現に変換するステップを含む方法。
  6. SVCビットストリーム表現をAVCビットストリーム表現に変換するための方法であって、
    a)第1レイヤおよび第2レイヤを含むSVCビデオシーケンスを受信するステップであって、上記SVCビデオシーケンスはビットレート特性データをさらに含み、当該ビットレート特性データは、
    i)上記第1レイヤがAVCビットストリームとして表現されて算術エンコーダによって符号化されるときの、上記第1レイヤのための最大ビットレート特性および平均ビットレート特性;
    ii)上記第2レイヤがAVCビットストリームとして表現されて算術エンコーダによって符号化されるときの、上記第2レイヤのための最大ビットレート特性および平均ビットレート特性を含むステップ;
    c)目標ビットレートパラメータを決定するステップ;
    d)上記目標ビットレートパラメータと、上記第1レイヤおよび第2レイヤのための上記最大ビットレート特性または上記平均ビットレート特性のうちの1つとの関係に基づいて、上記第1レイヤおよび第2レイヤのうちの1つ以上のレイヤを変換のために選択するステップ;および
    e)選択された上記1つ以上のレイヤを上記AVCビットストリーム表現に変換するステップを含む方法。
  7. SVCビットストリーム表現をAVCビットストリーム表現に変換するための方法であって、
    a)第1レイヤおよび第2レイヤを含むSVCビデオシーケンスを受信するステップであって、上記SVCビデオシーケンスはビットレート特性データをさらに含み、当該ビットレート特性データは、
    i)上記第1レイヤがAVCビットストリームとして表現されてVLCエンコーダによって符号化されるときの、上記第1レイヤのための最大ビットレート特性および平均ビットレート特性;
    ii)上記第1レイヤがAVCビットストリームとして表現されて算術エンコーダによって符号化されるときの、上記第1レイヤのための最大ビットレート特性および平均ビットレート特性;
    iii)上記第2レイヤがAVCビットストリームとして表現されてVLCエンコーダによって符号化されるときの、上記第2レイヤのための最大ビットレート特性および平均ビットレート特性;および
    iv)上記第2レイヤがAVCビットストリームとして表現されて算術エンコーダによって符号化されるときの、上記第2レイヤのための最大ビットレート特性および平均ビットレート特性を含むステップ;
    c)目標ビットレートパラメータを決定するステップ;
    d)上記目標ビットレートパラメータと、上記第1レイヤおよび第2レイヤのための上記最大ビットレート特性または上記平均ビットレート特性のうちの1つとの関係に基づいて、上記第1レイヤおよび第2レイヤのうちの1つ以上のレイヤを変換のために選択するステップ;および
    e)選択された上記1つ以上のレイヤを上記AVCビットストリーム表現に変換するステップを含む方法。
  8. 上記ビットレート特性に基づいて上記VLCエンコーダおよび上記算術エンコーダのうちの1つを選択するステップをさらに含む、請求項に記載の方法。
  9. 上記SVCビデオシーケンスは、変換データをさらに含み、
    上記レイヤのうちの1つ以上のレイヤを変換のために選択する上記ステップは、上記変換データの有無の分析も含み、
    上記変換データは、誤差および完全な再構成なしにスケーラブルな現レイヤの表現を非スケーラブルなAVCビットストリームに変換しうることを示すものである、請求項ないしの何れか1項に記載の方法。
  10. 上記変換データが上記変換が可能であることを示している場合に、上記変換が係数の逆変換なしに行われる、請求項に記載の方法。
  11. 拡張されたマルチレイヤビットストリームを作成するためのシステムであって、
    ビデオシーケンスのスケーラブルなマルチレイヤ表現を受信するための受信機;
    上記ビデオシーケンスのレイヤの非スケーラブルな単一レイヤ表現に関する、スケーラブルな表現を非スケーラブルな表現に、誤差無く、かつ完全な再構成を行わずに変換可能なことを示すフラグ、プロファイルおよびレベル準拠性を示すフラグ、および、上記ビデオシーケンスの上記レイヤのi)VLC符号化されるときの最大ビットレート特性および平均ビットレート特性と、ii)算術符号化されるときの最大ビットレート特性および平均ビットレート特性を決定するための決定器;および
    上記変換可能なことを示すフラグ、上記プロファイルおよびレベル準拠性を示すフラグおよび上記ビットレート特性を上記スケーラブルなマルチレイヤ表現に添付して、拡張されたスケーラブルな表現を形成するための添付器を含むシステム。
  12. 請求項1〜の何れか1項に記載の方法の各ステップをコンピュータに実行させるためのプログラム。
  13. 請求項10の何れか1項に記載の方法の各ステップをコンピュータに実行させるためのプログラム。
  14. 請求項12に記載のプログラムを記録した、コンピュータ読み取り可能な記録媒体。
  15. 請求項13に記載のプログラムを記録した、コンピュータ読み取り可能な記録媒体。
JP2009516783A 2006-10-16 2007-10-15 マルチレイヤ・ビットストリームデータを情報伝達するための方法およびシステム Expired - Fee Related JP5179484B2 (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US82962006P 2006-10-16 2006-10-16
US60/829,620 2006-10-16
US11/776,430 US7535383B2 (en) 2006-07-10 2007-07-11 Methods and systems for signaling multi-layer bitstream data
US11/776,430 2007-07-11
PCT/JP2007/070497 WO2008047929A1 (en) 2006-10-16 2007-10-15 Methods and systems for signaling multi-layer bitstream data

Publications (2)

Publication Number Publication Date
JP2010507267A JP2010507267A (ja) 2010-03-04
JP5179484B2 true JP5179484B2 (ja) 2013-04-10

Family

ID=39314139

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009516783A Expired - Fee Related JP5179484B2 (ja) 2006-10-16 2007-10-15 マルチレイヤ・ビットストリームデータを情報伝達するための方法およびシステム

Country Status (5)

Country Link
US (1) US7535383B2 (ja)
EP (1) EP2082581A4 (ja)
JP (1) JP5179484B2 (ja)
CN (1) CN101529911B (ja)
WO (1) WO2008047929A1 (ja)

Families Citing this family (92)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8081214B2 (en) * 2004-10-12 2011-12-20 Enforcement Video, Llc Method of and system for mobile surveillance and event recording
US8289370B2 (en) 2005-07-20 2012-10-16 Vidyo, Inc. System and method for scalable and low-delay videoconferencing using scalable video coding
US8982944B2 (en) * 2005-10-12 2015-03-17 Enforcement Video, Llc Method and system for categorized event recording of images in multiple resolution levels
FR2903556B1 (fr) * 2006-07-04 2008-10-03 Canon Kk Procedes et des dispositifs de codage et de decodage d'images, un systeme de telecommunications comportant de tels dispositifs et des programmes d'ordinateur mettant en oeuvre de tels procedes
CN101507281B (zh) * 2006-07-12 2013-06-05 诺基亚公司 媒体文件中的兴趣区域可缩放性信息的信号发送
CN102158697B (zh) * 2006-09-07 2013-10-09 Lg电子株式会社 用于解码/编码视频信号的方法及装置
US7456760B2 (en) * 2006-09-11 2008-11-25 Apple Inc. Complexity-aware encoding
WO2008049446A1 (en) 2006-10-25 2008-05-02 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Quality scalable coding
WO2008056959A1 (en) * 2006-11-09 2008-05-15 Lg Electronics Inc. Method and apparatus for decoding/encoding a video signal
KR100896290B1 (ko) * 2006-11-17 2009-05-07 엘지전자 주식회사 비디오 신호의 디코딩/인코딩 방법 및 장치
US8665942B2 (en) 2007-01-23 2014-03-04 Sharp Laboratories Of America, Inc. Methods and systems for inter-layer image prediction signaling
US8503524B2 (en) * 2007-01-23 2013-08-06 Sharp Laboratories Of America, Inc. Methods and systems for inter-layer image prediction
US7826673B2 (en) * 2007-01-23 2010-11-02 Sharp Laboratories Of America, Inc. Methods and systems for inter-layer image prediction with color-conversion
US8233536B2 (en) * 2007-01-23 2012-07-31 Sharp Laboratories Of America, Inc. Methods and systems for multiplication-free inter-layer image prediction
EP3518547B1 (en) 2007-04-12 2021-10-06 InterDigital VC Holdings, Inc. Methods and apparatus for video usability information (vui) for scalable video coding (svc)
US20090046157A1 (en) * 2007-08-13 2009-02-19 Andrew Cilia Combined wide-angle/zoom camera for license plate identification
US8599368B1 (en) 2008-01-29 2013-12-03 Enforcement Video, Llc Laser-based speed determination device for use in a moving vehicle
US8432968B2 (en) * 2007-10-15 2013-04-30 Qualcomm Incorporated Scalable video coding techniques for scalable bitdepths
WO2009097449A1 (en) * 2008-01-29 2009-08-06 Enforcement Video, Llc Omnidirectional camera for use in police car event recording
WO2009102480A2 (en) 2008-02-15 2009-08-20 Enforcement Video, Llc System and method for multi-resolution storage of images
HUE031487T2 (en) * 2008-04-16 2017-07-28 Ge Video Compression Llc Bit depth scalability
WO2010008210A2 (ko) * 2008-07-16 2010-01-21 한국전자통신연구원 Mgs 기반 svc 비트스트림을 avc 비트스트림으로 변환하는 장치
KR20100008757A (ko) * 2008-07-16 2010-01-26 한국전자통신연구원 Mgs 기반 svc 비트스트림을 avc 비트스트림으로 변환하는 장치
US8265140B2 (en) * 2008-09-30 2012-09-11 Microsoft Corporation Fine-grained client-side control of scalable media delivery
KR100970388B1 (ko) * 2008-10-31 2010-07-15 한국전자통신연구원 네트워크 흐름기반 스케일러블 비디오 코딩 적응 장치 및 그 방법
US20100141689A1 (en) * 2008-12-04 2010-06-10 Kent Displays, Inc. Electronic skin reader
US8391356B1 (en) 2009-02-18 2013-03-05 Sprint Communications Company L.P. Scalable video coding priority marking
DE102009039095A1 (de) * 2009-08-27 2011-03-10 Siemens Aktiengesellschaft Verfahren und Vorrichtung zum Erzeugen, Decodieren und Transcodieren eines codierten Videodatenstroms
KR101751559B1 (ko) * 2009-10-30 2017-06-27 선 페이턴트 트러스트 복호방법, 복호장치, 부호화 방법 및 부호화 장치
KR101066117B1 (ko) * 2009-11-12 2011-09-20 전자부품연구원 스케일러블 영상 코딩 방법 및 장치
JP2011109469A (ja) * 2009-11-18 2011-06-02 Canon Inc コンテンツ受信装置及びコンテンツ受信装置の制御方法
US20110150073A1 (en) * 2009-12-21 2011-06-23 General Instrument Corporation Scalable video transcoding device
US8736680B1 (en) 2010-05-18 2014-05-27 Enforcement Video, Llc Method and system for split-screen video display
US8976856B2 (en) 2010-09-30 2015-03-10 Apple Inc. Optimized deblocking filters
US20130251031A1 (en) * 2010-11-25 2013-09-26 Yehuda Yitschak Method for bit rate control within a scalable video coding system and system therefor
US9118939B2 (en) * 2010-12-20 2015-08-25 Arris Technology, Inc. SVC-to-AVC rewriter with open-loop statistical multiplexer
JP5592779B2 (ja) * 2010-12-22 2014-09-17 日本電信電話株式会社 画像符号化方法、画像復号方法、画像符号化装置、及び画像復号装置
JP5594841B2 (ja) * 2011-01-06 2014-09-24 Kddi株式会社 画像符号化装置及び画像復号装置
AU2012205650B2 (en) * 2011-01-14 2016-08-11 Vidyo, Inc. Improved NAL unit header
JP5592295B2 (ja) * 2011-03-09 2014-09-17 日本電信電話株式会社 画像符号化方法,画像符号化装置,画像復号方法,画像復号装置およびそれらのプログラム
CN103503444A (zh) * 2011-03-10 2014-01-08 维德约股份有限公司 在视频编码中用信号通知活动层的数量
EP2684293A4 (en) * 2011-03-10 2014-10-29 Vidyo Inc SET OF DEPENDENCY PARAMETERS FOR EVOLVING VIDEO CODING
CN103548353B (zh) * 2011-04-15 2015-08-19 Sk普兰尼特有限公司 使用多轨视频的高速可伸缩视频编码装置和方法
US20130016776A1 (en) * 2011-07-12 2013-01-17 Vidyo Inc. Scalable Video Coding Using Multiple Coding Technologies
US9591318B2 (en) 2011-09-16 2017-03-07 Microsoft Technology Licensing, Llc Multi-layer encoding and decoding
JP2013126157A (ja) * 2011-12-15 2013-06-24 Sony Corp 画像処理装置及び画像処理方法
WO2013106190A1 (en) 2012-01-09 2013-07-18 Dolby Laboratories Licensing Corporation Hybrid reference picture reconstruction method for single and multiple layered video coding systems
US11089343B2 (en) 2012-01-11 2021-08-10 Microsoft Technology Licensing, Llc Capability advertisement, configuration and control for video coding and decoding
KR102047492B1 (ko) * 2012-03-12 2019-11-22 삼성전자주식회사 스케일러블 비디오 부호화 방법 및 장치, 스케일러블 비디오 복호화 방법 및 장치
WO2013143103A1 (en) * 2012-03-29 2013-10-03 Mediatek Singapore Pte. Ltd. Methods and apparatuses of intra mode coding for scalable extension of high efficiency video coding (hevc)
CN104247423B (zh) * 2012-03-21 2018-08-07 联发科技(新加坡)私人有限公司 可伸缩视频编码***的帧内模式编码方法和装置
US20160119639A1 (en) * 2012-04-20 2016-04-28 Sony Corporation Image processing apparatus and image processing method
US10205961B2 (en) * 2012-04-23 2019-02-12 Qualcomm Incorporated View dependency in multi-view coding and 3D coding
AU2013254214C1 (en) 2012-04-23 2017-03-02 Sun Patent Trust Encoding method, decoding method, encoding apparatus, decoding apparatus, and encoding and decoding apparatus
CN103843342B (zh) * 2012-06-12 2017-04-12 Lg电子株式会社 图像解码方法
US9313486B2 (en) 2012-06-20 2016-04-12 Vidyo, Inc. Hybrid video coding techniques
US20140003504A1 (en) * 2012-07-02 2014-01-02 Nokia Corporation Apparatus, a Method and a Computer Program for Video Coding and Decoding
EP2868092A4 (en) 2012-07-02 2016-05-04 Nokia Technologies Oy METHOD AND DEVICE FOR VIDEO CODING
CN104704831B (zh) 2012-08-06 2019-01-04 Vid拓展公司 多层视频编码中用于空间层的采样栅格信息
US9398284B2 (en) * 2012-08-16 2016-07-19 Qualcomm Incorporated Constructing reference picture lists for multi-view or 3DV video coding
US9467692B2 (en) * 2012-08-31 2016-10-11 Qualcomm Incorporated Intra prediction improvements for scalable video coding
CN104604228B (zh) * 2012-09-09 2018-06-29 Lg 电子株式会社 图像解码方法和使用其的装置
US20140078249A1 (en) * 2012-09-20 2014-03-20 Qualcomm Incorporated Indication of frame-packed stereoscopic 3d video data for video coding
US9992490B2 (en) * 2012-09-26 2018-06-05 Sony Corporation Video parameter set (VPS) syntax re-ordering for easy access of extension parameters
CN103716622B (zh) * 2012-09-29 2017-02-08 华为技术有限公司 用于图像处理的方法和装置
US20150237372A1 (en) * 2012-10-08 2015-08-20 Samsung Electronics Co., Ltd. Method and apparatus for coding multi-layer video and method and apparatus for decoding multi-layer video
US10085017B2 (en) * 2012-11-29 2018-09-25 Advanced Micro Devices, Inc. Bandwidth saving architecture for scalable video coding spatial mode
US9756613B2 (en) 2012-12-06 2017-09-05 Qualcomm Incorporated Transmission and reception timing for device-to-device communication system embedded in a cellular system
KR101979634B1 (ko) 2012-12-13 2019-05-20 삼성전자주식회사 화질 개선을 위한 영상 처리 장치 및 그 방법
US9774927B2 (en) * 2012-12-21 2017-09-26 Telefonaktiebolaget L M Ericsson (Publ) Multi-layer video stream decoding
RU2610286C2 (ru) * 2012-12-21 2017-02-08 Телефонактиеболагет Л М Эрикссон (Пабл) Декодирование многослойного видеопотока
CN116320392A (zh) 2013-01-04 2023-06-23 Ge视频压缩有限责任公司 高效可伸缩编码概念
US20140269934A1 (en) * 2013-03-15 2014-09-18 Sony Corporation Video coding system with multiple scalability and method of operation thereof
CN117956144A (zh) * 2013-04-08 2024-04-30 Ge视频压缩有限责任公司 多视图解码器
US9485508B2 (en) * 2013-04-08 2016-11-01 Qualcomm Incorporated Non-entropy encoded set of profile, tier, and level syntax structures
KR20140138538A (ko) 2013-05-24 2014-12-04 주식회사 케이티 복수의 레이어를 지원하는 비디오 코딩 방법 및 장치
KR102115075B1 (ko) * 2013-06-18 2020-05-25 브이아이디 스케일, 인크. Hevc 확장을 위한 인터 레이어 파라미터 집합
AU2014288482A1 (en) * 2013-07-12 2015-02-26 Sony Corporation Image coding device and method
JP6514197B2 (ja) 2013-07-15 2019-05-15 ジーイー ビデオ コンプレッション エルエルシー ネットワーク装置およびエラー処理の方法
FR3008840A1 (fr) * 2013-07-17 2015-01-23 Thomson Licensing Procede et dispositif de decodage d'un train scalable representatif d'une sequence d'images et procede et dispositif de codage correspondants
US10284858B2 (en) * 2013-10-15 2019-05-07 Qualcomm Incorporated Support of multi-mode extraction for multi-layer video codecs
US10250895B2 (en) * 2014-03-14 2019-04-02 Sharp Kabushiki Kaisha DPB capacity limits
WO2015147426A1 (ko) 2014-03-24 2015-10-01 주식회사 케이티 멀티 레이어 비디오 신호 인코딩/디코딩 방법 및 장치
US10148969B2 (en) * 2015-02-11 2018-12-04 Qualcomm Incorporated Of sample entry and operation point signalling in a layered video file format
US9538137B2 (en) 2015-04-09 2017-01-03 Microsoft Technology Licensing, Llc Mitigating loss in inter-operability scenarios for digital video
JP2016218721A (ja) 2015-05-20 2016-12-22 ソニー株式会社 メモリ制御回路およびメモリ制御方法
US10341605B1 (en) 2016-04-07 2019-07-02 WatchGuard, Inc. Systems and methods for multiple-resolution storage of media streams
US11496747B2 (en) 2017-03-22 2022-11-08 Qualcomm Incorporated Intra-prediction mode propagation
US10630978B2 (en) * 2017-05-12 2020-04-21 Blackberry Limited Methods and devices for intra-coding in video compression
EP4022777A4 (en) * 2019-09-24 2022-11-23 Huawei Technologies Co., Ltd. DECODED PICTURE BUFFER OPERATION FOR RESOLUTION CHANGES
WO2021188453A1 (en) 2020-03-16 2021-09-23 Bytedance Inc. Gradual decoding refresh access unit in scalable video coding
CN115336277A (zh) * 2020-03-17 2022-11-11 字节跳动有限公司 在视频编解码中使用视频参数集

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6490320B1 (en) 2000-02-02 2002-12-03 Mitsubishi Electric Research Laboratories Inc. Adaptable bitstream video delivery system
US6574279B1 (en) * 2000-02-02 2003-06-03 Mitsubishi Electric Research Laboratories, Inc. Video transcoding using syntactic and semantic clues
US6493386B1 (en) 2000-02-02 2002-12-10 Mitsubishi Electric Research Laboratories, Inc. Object based bitstream transcoder
JP3561485B2 (ja) * 2000-08-18 2004-09-02 株式会社メディアグルー 符号化信号分離・合成装置、差分符号化信号生成装置、符号化信号分離・合成方法、差分符号化信号生成方法、符号化信号分離・合成プログラムを記録した媒体および差分符号化信号生成プログラムを記録した媒体
US7391807B2 (en) * 2002-04-24 2008-06-24 Mitsubishi Electric Research Laboratories, Inc. Video transcoding of scalable multi-layer videos to single layer video
JP4329358B2 (ja) * 2003-02-24 2009-09-09 富士通株式会社 ストリーム配信方法、及びストリーム配信システム
JP4068537B2 (ja) * 2003-09-03 2008-03-26 日本電信電話株式会社 階層符号化ビットストリームの再量子化方法及びその装置と、階層符号化ビットストリームの再量子化プログラム及びそのプログラムを記録した記録媒体
US20050254575A1 (en) * 2004-05-12 2005-11-17 Nokia Corporation Multiple interoperability points for scalable media coding and transmission
KR100679022B1 (ko) * 2004-10-18 2007-02-05 삼성전자주식회사 계층간 필터링을 이용한 비디오 코딩 및 디코딩방법과,비디오 인코더 및 디코더
US20060153294A1 (en) * 2005-01-12 2006-07-13 Nokia Corporation Inter-layer coefficient coding for scalable video coding
CN100358364C (zh) * 2005-05-27 2007-12-26 上海大学 基于h.264的精细颗粒可伸缩编码的码率控制方法
US8315308B2 (en) * 2006-01-11 2012-11-20 Qualcomm Incorporated Video coding with fine granularity spatial scalability

Also Published As

Publication number Publication date
CN101529911B (zh) 2012-02-29
US7535383B2 (en) 2009-05-19
JP2010507267A (ja) 2010-03-04
WO2008047929A1 (en) 2008-04-24
US20080007438A1 (en) 2008-01-10
EP2082581A1 (en) 2009-07-29
CN101529911A (zh) 2009-09-09
EP2082581A4 (en) 2015-12-16

Similar Documents

Publication Publication Date Title
JP5179484B2 (ja) マルチレイヤ・ビットストリームデータを情報伝達するための方法およびシステム
US7885471B2 (en) Methods and systems for maintenance and use of coded block pattern information
US7840078B2 (en) Methods and systems for image processing control based on adjacent block characteristics
US8532176B2 (en) Methods and systems for combining layers in a multi-layer bitstream
US8059714B2 (en) Methods and systems for residual layer scaling
AU2015230740B2 (en) Method and apparatus of scalable video coding
US8422548B2 (en) Methods and systems for transform selection and management
US8681865B2 (en) System and method for transcoding between scalable and non-scalable video codecs
JP4833296B2 (ja) 多階層を基盤としたスケーラブルビデオコーディング方法および装置
US8351502B2 (en) Method and apparatus for adaptively selecting context model for entropy coding
JP5095750B2 (ja) 画像ビットストリームの処理方法
US8130822B2 (en) Methods and systems for conditional transform-domain residual accumulation
JP2009543501A (ja) マルチレイヤ・ビットストリーム中の複数のレイヤを統合するための方法およびシステム
EP2719181A1 (en) Method and apparatus of scalable video coding
CA2543947A1 (en) Method and apparatus for adaptively selecting context model for entropy coding
CA2647723A1 (en) System and method for transcoding between scalable and non-scalable video codecs
EP2372922A1 (en) System and method for transcoding between scalable and non-scalable video codecs
AU2008201768A1 (en) Method and apparatus for adaptively selecting context model for entropy coding
AU2012201234A1 (en) System and method for transcoding between scalable and non-scalable video codecs

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120321

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120515

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120821

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20121010

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20121211

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130109

R150 Certificate of patent or registration of utility model

Ref document number: 5179484

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees