JP5989800B2 - 視覚ダイナミックレンジコード化動作及びパラメータの指定 - Google Patents

視覚ダイナミックレンジコード化動作及びパラメータの指定 Download PDF

Info

Publication number
JP5989800B2
JP5989800B2 JP2014551263A JP2014551263A JP5989800B2 JP 5989800 B2 JP5989800 B2 JP 5989800B2 JP 2014551263 A JP2014551263 A JP 2014551263A JP 2014551263 A JP2014551263 A JP 2014551263A JP 5989800 B2 JP5989800 B2 JP 5989800B2
Authority
JP
Japan
Prior art keywords
data
vdr
rpu
image
syntax
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2014551263A
Other languages
English (en)
Other versions
JP2015503873A (ja
Inventor
キュ,シェン
イン,ペング
イエ,ヤン
へ,ユーウェン
ギッシュ,ウォルター
スー,グアン−ミン
ユアン,ユーフェイ
ヒュルヤルカール,サミール
Original Assignee
ドルビー ラボラトリーズ ライセンシング コーポレイション
ドルビー ラボラトリーズ ライセンシング コーポレイション
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ドルビー ラボラトリーズ ライセンシング コーポレイション, ドルビー ラボラトリーズ ライセンシング コーポレイション filed Critical ドルビー ラボラトリーズ ライセンシング コーポレイション
Publication of JP2015503873A publication Critical patent/JP2015503873A/ja
Application granted granted Critical
Publication of JP5989800B2 publication Critical patent/JP5989800B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L69/00Network arrangements, protocols or services independent of the application payload and not provided for in the other groups of this subclass
    • H04L69/22Parsing or analysis of headers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/597Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding specially adapted for multi-view video sequence encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/98Adaptive-dynamic-range coding [ADRC]

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Computer Security & Cryptography (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

(関連出願の相互参照)
本願は、参照によりその開示全体を組み込む、2012年1月3日出願の米国仮出願第61/582614号の優先権を主張するものである。
本発明は、一般にビデオコード化システムに関し、さらに詳細には、視覚ダイナミックレンジ画像を符号化、復号及び表現するシステムに関する。
表示技術は、特定のビデオフォーマットに基づくビデオコンテンツの伝送及びレンダリングに対応するように開発されている。例えば、MPEGビデオのエンコーダ及びデコーダは、MPEGビデオフォーマットでコード化されたビデオコンテンツに対応することができる。その他のビデオのエンコーダ及びデコーダは、異なるビデオフォーマットでコード化されたビデオコンテンツに対応することができる。
手持ち型デバイスなどの消費者デバイスは、通常、限られた1組のビデオフォーマットのうちの特定のビデオフォーマットにそれぞれ対応することができる、限られた1組のビデオコード化システムをインストールされる、又は備えて構成される。したがって、あるビデオコンテンツが予想したビデオフォーマットで符号化及び送達されない場合には、デバイスは、そのビデオコンテンツを復号してレンダリングを助けるための適当なビデオデコーダを見つけることができない可能性が高い。レンダリングしたとしても、レンダリングされたビデオコンテンツが、受信したビデオコンテンツの間違った解釈又は表現を含み、目に見える色及び輝度値のアーチファクトを生じる可能性がある。WO2008/077272A1、WO2008/083521A1、WO2009/051692A2及びWO2010/105036A1には、スケーラブル又は階層的な方法によるビデオデータの符号化が記載されている。
本項で述べる手法は、追求することができる手法であるが、必ずしも既に想起又は追求されている手法であるとは限らない。したがって、特に指定しない限り、本項に記載するいずれの手法も、単に本項に含まれているという事実によって従来技術として認められるものと仮定すべきではない。同様に、1つ又は複数の手法に関して特定される問題は、特に指定しない限り、本項に基づいて任意の従来技術で認識されていると仮定すべきではない。
本発明を、限定ではなく例示を目的として、添付の各図面に示す。これらの図面において、同じ参照番号は、同様の要素を指している。
例示的な実施形態における、1つ又は複数のVDR仕様に準拠するコード化シンタックスに基づいて参照処理ユニット(RPU)データを生成する視覚ダイナミックレンジ(VDR)エンコーダを示す図である。 例示的な実施形態における、1つ又は複数のVDR仕様に準拠するコード化シンタックスに基づいて参照処理ユニット(RPU)データを生成する視覚ダイナミックレンジ(VDR)エンコーダを示す図である。 例示的な実施形態における、NALヘッダ及びローバイトシーケンスペイロードを含むNALデータユニットを示す図である。 RPUデータヘッダのレイアウトを示す図である。 例示的な実施形態におけるRPUデータヘッダの構文解析を示す図である。 RPUデータペイロードのレイアウトを示す図である。 例示的な実施形態におけるRPUデータペイロードの復号を示す図である。 例示的な実施形態におけるRPUデータペイロードの復号を示す図である。 例示的な実施形態におけるRPUデータペイロードの復号を示す図である。 例示的な実施形態におけるRPUデータからコード化シンタックスを構文解析するVDRデコーダを示す図である。 本発明の例示的な実施形態による例示的なプロセスフローを示す図である。 本発明の例示的な実施形態による例示的なプロセスフローを示す図である。 本発明の一実施形態による、本明細書に記載するコンピュータ又はコンピューティングデバイスを実装することができる例示的なハードウェアプラットフォームを示す図である。
本明細書では、階層的VDR(visual dynamic range)コーデックを用いて視覚ダイナミックレンジ画像を符号化、復号及び表現することに関する例示的な実施形態について述べる。以下の記述では、説明の目的で、本発明が完全に理解されるように多数の具体的な詳細を記載する。ただし、本発明は、これらの具体的な詳細を用いずに実施することもできることは明らかであろう。場合により、本発明が不要に分かりにくくなる、曖昧になる、又はややこしくなることを避けるために、周知の構造及びデバイスの記述で細部まで網羅しないこともある。
本明細書では、以下の概要に従って例示的な実施形態について述べる。
1.概略
2.VDRエンコーダ
3.RPUデータユニット
4.RPUデータ復号−シーケンスレベル及び/又はフレームレベル
5.RPUデータ復号−区分レベル
6.RPUデータ復号−クロママッピング
7.RPUデータ復号の追加例
8.例示的なプロセスフロー
9.実施態様の機構−ハードウェア概略
10.等価形態、拡張形態、代替形態など
1.概略
この概略では、本発明の例示的な実施形態のいくつかの態様の基本的な説明を与える。なお、この概略は、この例示的な実施形態の態様の広範又は網羅的な要約ではないことに留意されたい。さらに、この概略は、この例示的な実施形態のいかなる特定の重要な態様又は要素も特定するものではなく、またこの例示的な実施形態又は本発明一般のいかなる範囲も示すものではないと理解すべきものである。この概略は、単に、この例示的な実施形態に関係するいくつかの概念を要約し簡略化した形式で与えるものに過ぎず、後述する様々な例示的な実施形態についてのさらに詳細な記述のための単なる概念的な前置きであるものと理解されたい。
本明細書に記載する技術は、異なるビデオコード化システムが生成した参照処理データの、共通の伝達手段(vehicle)での下流側デバイスへの転送及び信号通信に対応する。本明細書で使用する「共通の伝達手段」という用語は、幅広い視覚ダイナミックレンジ(visual dynamic range:VDR)仕様のうちのいずれか1つに基づいて生成された参照処理データを搬送するように構成された、共通参照処理ユニット(reference processing unit:RPU)データフォーマットを指すことができる。本明細書で使用する「共通の伝達手段で搬送される参照処理データ」は、その参照処理データと関連するビデオデータの符号化及び復号に使用された、又は使用される複数のシンタックス要素を指定する動作及びパラメータを含むコード化シンタックスを提供する。本明細書で述べるシンタックス要素は、異なるVDR仕様の一部又は全てに共通の、或いは異なるVDR仕様の1つ又は複数(ただし全てではない)に特有の動作を記述することができる。コード化シンタックスがどのVDR仕様と関係しているかに関わらず、共通の参照処理データの復号/構文解析プロセスを、例えば下流側(例えば消費者)デバイスで実施して、コード化シンタックス又はそれに含まれるシンタックス要素を復号することができる。したがって、下流側デバイスは、その消費者デバイスが対応するように構成されている、又は構成されることになる既存の又は新たなVDR仕様ごとに、個別かつ別個の参照処理データ復号/構文解析プロセスを実施する必要がない。下流側デバイスの提供者は、既存の又は新たなVDR仕様に指定されるメディアサンプルを符号化及び復号するアルゴリズム及び動作に対応することのみに集中すればよい可能性がある。同じ参照処理データ復号/構文解析プロセスを、これから開発されるVDR仕様も含めて全てのVDR仕様について再利用する、又は実質的に再利用することができる。これは、本明細書に記載する技術が、共通の伝達手段を使用して、様々なVDR仕様で生成されるメディアサンプルに関連する参照処理データを送達又は信号通信するからである。本明細書で使用する「メディアサンプル」という用語は、参照処理データと結合されたときに本明細書で述べるVDRデータを形成するデータを指す。
複数の層(又はビットストリーム)を使用して、VDRエンコーダなどの上流側デバイスから下流側デバイスにVDRデータ(メディアサンプル及び参照処理ユニットデータ)を送達することができる。複数の層で搬送されるVDRデータは、後方互換性表示技術及び新たな高ダイナミックレンジ(HDR)表示技術を含むことができる(ただしこれらのいずれかのみに限定されるわけではない)広範囲の表示技術に対応するために使用することができる。本明細書で使用する「VDR」又は「視覚ダイナミックレンジ」という用語は、標準的なダイナミックレンジより広いダイナミックレンジを指すことができ、人間の視覚が瞬時に知覚することができる瞬時知覚可能なダイナミックレンジ及び色域までの広いダイナミックレンジを含むことができる(ただしこれらに限定されない)。本明細書で使用する「多層」又は「複数の層」という用語は、(それらのビデオ信号の)互いの間に1つ又は複数の論理依存関係を有する複数のビデオ又は画像信号を搬送する、基本レイヤ(BL)、参照処理ユニット(RPU)レイヤ、拡張レイヤ(EL)を含む、2つ以上のビットストリームを指すことができる。
基本レイヤは、上流側デバイスによって標準的ダイナミックレンジ(standard dynamic range:SDR)信号から得られる、又はVDR信号中の入力VDRデータからマッピングされる、BLデータ(基本レイヤメディアサンプル)を搬送することができる。1つ又は複数の拡張レイヤ(EL)は、上流側デバイスによって少なくとも部分的にはVDR信号から得られるELデータ(拡張レイヤメディアサンプル)を搬送することができる。いくつかの実施形態では、ともに同じ入力VDRデータとの相関があるBLデータとELデータの間の統計的冗長性を利用するために、ELデータを、BLビデオデータ及び入力VDRビデオデータに基づく予測値の間の残差値又は差分値を含むように(冗長性を)低下させることができる。いくつかの実施形態では、VDRエンコーダは、残差値がゼロまで低下するように正確な予測アルゴリズムを適用するように構成することができる。したがって、ELデータを使用して、無用なゼロ残差値を保持する代わりに、正確な予測アルゴリズムに関するより小さなレイヤ間参照ピクチャのセットを保持するようにすることができる。残差ゼロのビデオコード化システムのレイヤ間参照ピクチャを、単一のVDR画像についてではなく、相関のある一群の入力VDR画像のグループについて生成することができる。
いくつかの実施形態では、RPUレイヤは、上流側デバイスによって生成された参照処理データ(或いはRPUデータとも記す)を搬送することができる。VDRエンコーダなどの上流側デバイスは、RPUデータを使用して、VDRデコーダなどの下流側デバイスにコード化シンタックスを信号通信することができる。コード化シンタックスによって、VDRデコーダは、BLレイヤ及びELレイヤのBLデータ及びELデータに基づいてVDR画像を再構築することができる。
RPUデータに含まれて搬送されるシンタックス要素の例としては、レイヤ間予測係数、残差非線形逆量子化パラメータ、クロマリサンプリングフィルタ係数、色空間変換指標、及びその他のVDRシンタックス要素(例えばBLデータ及びELデータを生成するVDRエンコーダ並びにBLデータ及びELデータを復号するVDRデコーダによって実行される機能及び/又は動作のフラグ及び記述子など)などが挙げられるが、これらのいずれかに限定されるわけではない。RPUデータに含まれるシンタックス要素は、シーケンスレベル、フレームレベル、パーティションレベル又は機能/動作レベルの1つに分類することができる。
入力VDRメディアコンテンツ(例えばHDR動画)は、複数のシーケンス(例えば複数のシーン、又はシーンの一部分に対応する)、フレーム(又は画像若しくはピクチャ)或いはパーティション(又は画像の一部分)に細分することができる。シーケンスレベル、フレームレベル又はパーティションレベルのシンタックス要素は、現在のRPUデータにおいて明示的にコード化することができる、又は対応するシーケンスレベル、フレームレベル又はパーティションレベルで以前に送信されたRPUデータから予測することができる。これに加えて、又は必要に応じて、又は別法として、シンタックス要素は、シーケンスレベル、フレームレベル及びパーティションレベルのうちの複数のレベルで現れることもある。
階層的コーデックアーキテクチャ(BLレイヤ、ELレイヤ及びRPUレイヤ)を含む本明細書に記載する技術は、様々なVDRコード化システムによって実施することができる。例えば、これらの技術の一部を実施する第1のVDRコード化システムは、基本レイヤ及び拡張レイヤの両方がクロマフォーマット(例えば4:2:0)及び低ビット深度(例えば8ビット)を使用する、剰余ベースの階層的コーデックとすることができ、これらの技術の一部を実施する第2のVDRコード化システムは、拡張レイヤが使用するクロマフォーマット(例えば4:4:4)が基本レイヤのクロマフォーマット(例えば4:2:0)より広く、拡張レイヤが使用するビット深度(例えば12ビット以上)が基本レイヤのビット深度(8ビット)より高い、信号ベースの階層的コーデックとすることができる。特に、本明細書に記載するRPUデータ復号技術は、1つ又は複数の異なるVDR仕様からなる1組のVDR仕様に最初に対応しているVDRコード化システムで実施することができ、後に追加のVDR仕様に対応するときに、そのVDRコード化システムにほとんど、又は全く変更を加えずに再利用することができる。
RPUレイヤコード化ビットストリーム、又はそれに含まれるRPUデータは、他のレイヤに含まれるコード化ビットストリーム、又はそれに含まれるBLデータ及びELデータと同期させることができる。例えば、RPUデータとBL/ELデータの同期は、表示順序のピクチャ表示番号(例えばH.264に指定されるpicture_order_countなど)によって行うことができる。
本明細書に記載する技術は、レイヤ間予測、逆マッピング、クロマリサンプリング、パーティションの境界領域の補間などのデータ処理、空間的スケーリング、非線形量子化などに使用される複数の動作に対応する。対応している動作の一部は、様々なVDR仕様の一部又は全てに共通であることもあるが、別の一部は、1つ又は複数の特定の(ただし全てではない)VDR仕様に特有のものであることもある。例えば、非線形量子化/逆量子化は、ELデータとして残差値を使用するVDR仕様の場合に実行される可能性がある。
本明細書に記載する技術は、フレキシブルなコード化シンタックスによって駆動されるビデオ符号化及び復号に対応する。この手法では、例えば改良されたアルゴリズムを備え、実施コストや速度なども向上させたエンコーダ及びデコーダの設計を、並行に、かつ連続的に最適化することができる。階層的VDRデータを備えたコード化シンタックスは、現在のRPUデータと以前に送信されたRPUデータの間の冗長性を利用することによって、VDRエンコーダからVDRデコーダに効率的に伝送及び信号通信することができる。コード化シンタックスは、VDRデコーダが例えば逆データフローの復号動作を効率的に実行するためのロードマップ(例えばcompleteなど)を提供する。
いくつかの例示的な実施形態では、本明細書に記載する機構は、手持ち型デバイス、ゲーム機、テレビジョン、ラップトップコンピュータ、ネットブックコンピュータ、タブレットコンピュータ、携帯電話、電子書籍リーダ、POS端末、デスクトップコンピュータ、コンピュータワークステーション、コンピュータキオスク、又はその他の様々な種類の端末及びメディア処理ユニットなど(ただしこれらのいずれかに限定されない)のメディア処理システムの一部を構成する。
好ましい実施形態並びに本明細書に記載する一般的な原理及び特徴に加えられる様々な修正は、当業者には容易に明らかになるであろう。したがって、本開示は、記載した実施形態に限定されるものではなく、本明細書に記載する原理及び特徴と矛盾しない限り最大の範囲を有するものとする。
2.VDRエンコーダ
VDRエンコーダは、1つ又は複数の異なるVDR仕様のうちの1つに準拠するコード化シンタックスを使用して、BLデータ、ELデータ及びRPUデータを生成することができる。これらの異なるVDR仕様は、メジャーバージョン番号及び/又はマイナーバージョン番号の異なる組合せを含む異なるバージョンでラベル付け又は識別することができる(特定のVDR仕様を識別するその他の方法を使用することもできる。)。本明細書で用いる「VDR仕様」は、VDRエンコーダなどの上流側デバイスからVDRデコーダなどの下流側デバイスに信号通信することができるコード化シンタックスに含めることができるシンタックス要素の仕様を提供することができる。
図1は、1つ又は複数のVDR仕様に準拠するコード化シンタックスに基づいてRPUデータを生成するVDRエンコーダ102を示す図である。いくつかの実施形態では、VDRエンコーダ102は、例えば第1のバージョン(「1.0」)又は第2のバージョン(「1.x」)とラベル付けされる、少なくとも2つのVDR仕様に対応する。VDRエンコーダ102は、VDRエンコーダ102が対応している1つ又は複数のVDR仕様に準拠するコード化シンタックスに従ってBLデータ、ELデータ、RPUデータ、レイヤ間予測データ及び中間メディアデータに対する動作を実行するように構成することができる。これらの異なるVDR仕様としては、後方互換性に対応する第1のバージョン及び後方互換性に対応していない第2のバージョンなどが挙げられるが、これらに限定されるわけではない。本明細書で使用する「後方互換性」という用語は、BLデータがSDRディスプレイ上で見るように最適化されたSDR画像を含むかどうかということを指している。VDRエンコーダ102は、1つ又は複数のコンピューティングデバイスを用いて実装することができる。
一実施形態では、VDRエンコーダ102は、(入力)VDR信号104を受信し、このVDR信号104から入力VDR画像を導出するように構成される。本明細書で使用する「入力VDR画像」は、ソース画像のVDRバージョンを復号するためのダイナミックレンジの広い又は高い画像データを含むことができる。このソース画像は、ハイエンド画像取得装置が取り込んだ生画像とすることができる。入力VDR画像は、高ダイナミックレンジの色域に対応する入力色空間内の高ビット深度(例えば10+ビット)の画像とすることができる。本明細書に記載するVDRコード化システムが受信又は処理する1つ又は複数のVDR信号の例としては、12ビットP3 D65 RGB444信号、12ビット勧告(Rec.)709 RGB444信号、12ビットDCDM X’Y’Z’444信号、16ビットTIFFファイルフォーマットのビデオデータなどが挙げられるが、これらに限定されるわけではない。
1つの例では、入力VDR画像中に表される各ピクセルは、色空間(例えばRGB色空間など)で定義される全てのチャネル(例えば赤、緑及び青の色チャネル)のピクセル値を含む。各ピクセルは、必要に応じて、かつ/又は別法として、色空間内のチャネルの1つ又は複数についてのアップサンプリング又はダウンサンプリングされたピクセル値を含む。なお、いくつかの実施形態では、赤、緑及び青などの3原色に加えて、本明細書で述べる色空間内で異なる原色を同時に使用して、広い色域に対応することもでき、それらの実施形態では、本明細書で述べる画像データは、それらの異なる原色についての追加のピクセル値を含み、本明細書に記載する技術によって同時に処理することができることに留意されたい。
一実施形態では、VDRエンコーダ102は、マッピング色空間(例えばYCbCr空間、RGB空間、又は別の色空間などのうちの1つ)におけるレイヤ間予測に関する動作)を実行することができる。いくつかの実施形態では、入力色空間がマッピング色空間と異なる場合には、色空間変換ユニットによって、入力VDR画像を、入力色空間からマッピング色空間に変換することができる。
一実施形態では、VDRエンコーダ102は、図1に示すように、(入力)SDR信号108を受信して、SDR信号108からBLデータを導出するように構成される。本明細書に記載するVDRコード化システムが受信する1つ又は複数のSDR信号の例としては、8ビットYCbCr信号、8ビットYUVファイルフォーマットのビデオデータなどが挙げられるが、これらのいずれかに限定されるわけではない。
本明細書で使用する「BLデータ」は、SDRディスプレイで見るように最適化されている場合もされていない場合もある低ビット深度の(例えば8ビット)画像データを指すことができる。本明細書で使用する「低ビット深度」という用語は、低いビット深度を有するコード化空間内で量子化された画像データを指し、低ビット深度の例としては、8ビットが挙げられる。一方、「高ビット深度」という用語は、高いビット深度を有するコード化空間内で量子化された画像データを指し、高ビット深度の例としては、10ビット、12ビット、又はそれ以上のビットが挙げられる。特に、「低ビット深度」又は「高ビット深度」という用語は、ピクセル値の最下位のビット又は最上位のビットを指しているわけではない。
第1の例では、BLデータは、SDRディスプレイで見るように最適化されたSDR画像を含み、後方互換性に対応する第1のバージョンのVDR仕様と関連づけることができる。SDR画像は、カラリストによる色補正を含んで、SDR画像が比較的狭いダイナミックレンジ又は標準的なダイナミックレンジ内で可能な限り現実的に見えるようにすることができる。例えば、入力VDR画像を生じるソースHDR画像中のピクセルの一部又は全てに関する色相情報を、SDR画像中で変更又は補正して、標準的なダイナミックレンジ内で現実的に見える画像を生成することができる。
第2の例では、VDRエンコーダ102は、図1の108のような入力SDR信号からBLデータを導出するのではなく、入力VDR画像にVDR/SDR(例えばトーン)マッピングを適用してBLデータを導出するように構成される。この例におけるBLデータは、SDRディスプレイで見るように最適化されていない可能性があり、後方互換性に対応していない第2のバージョンのVDR仕様と関連づけられている可能性がある。BLデータは、入力VDR画像の低ビット表現を含むことができる。VDR/SDRマッピングは、例えば、大域量子化、線形量子化、線形伸長、曲線に基づく量子化、確率密度関数(Pdf)最適化量子化、ロイドマックス量子化、パーティションに基づく量子化、知覚量子化、クロスカラーチャネル/ベクトル量子化或いはその他のタイプの量子化のうちの1つ又は複数に基づくことができる。これに加えて、又は必要に応じて、又は別法として、VDR/SDRマッピングは、例えば雑音除去処理、フレーム整列処理、色グレーディング処理などを含まないこともあるし、或いは1つ以上含むこともある。この例におけるBLデータは、標準的なダイナミックレンジ内で現実的に見える画像を提示するように最適化されていない可能性がある。それよりも、BLデータは、下流側デバイスによってELデータと効率的に結合されて、図1の入力VDR信号から導出される入力VDR画像に対応する出力VDR画像を構築するようになされている可能性がある。
一実施形態では、VDRエンコーダ102、又はそれに含まれる基本レイヤSDRエンコーダ(116)は、SDR信号108から、又はVDR信号104から導出される入力VDR画像に対するマッピング動作から導出することができる入力SDR画像を符号化して基本レイヤビットストリーム128にするように構成される。
一実施形態では、VDRエンコーダ102は、H.264/MPEG−4 AVC(IS 14496−10)、HEVC、MPEG−4 Part2(IS 14496−2)、MPEG−2(IS 11138−2)、VP8、VC−1及び/又はその他などのハイブリッドビデオコード化モデルを採用する。基本レイヤで符号化されるようになされているメディアサンプルは、同じ画像中の近接するサンプルから(イントラ予測を用いて)、又は同じ基本レイヤに属する過去に復号した画像のサンプルから(インター予測を用いて)予測することができる。予測に使用されるこれらの復号したBLサンプルは、(基本レイヤ用の)参照ピクチャ記憶装置114に格納又はバッファすることができる。
一実施形態では、VDRエンコーダ102は、さらに、復号されたBLサンプルに基づいて拡張レイヤで符号化されるようになされたメディアサンプルのレイヤ間予測を実行するように構成される。復号されたBLサンプルは、参照ピクチャ記憶装置114(メモリバッファ又はその他の形態のメモリ空間のうちの1つ又は複数とすることができる)から取り出すことができる。
VDRエンコーダ102、又はそれに含まれるVDR RPU110は、VDRエンコーダ102によって実行される符号化関連動作のためのコード化シンタックスを生成するように構成することができる。これらの符号化関連動作としては、拡張レイヤ/ビットストリーム124に含めて伝送されるELデータを生成するために実行される動作が含まれる。本明細書に記載する技術では、符号化関連動作のためのコード化シンタックスは、VDRエンコーダからVDRデコーダに信号通信され、VDRデコーダが復号関連動作にそのコード化シンタックスを使用するようにする。いくつかの実施形態では、VDRエンコーダからVDRデコーダに信号通信されるコード化シンタックスは、VDRデコーダのみが実行し、VDRエンコーダは実行しない、1つ又は複数の追加の動作を指定することができる。これらの追加の動作には、表示管理動作が含まれるが、これらのいずれかに限定されるわけではない。
コード化シンタックスは、VDRエンコーダ102が対応している特定のVDR仕様に準拠する複数のシンタックス要素を含むことができ、レイヤ間予測係数、残差非線形逆量子化パラメータ、クロマリサンプリング/フィルタ係数、色空間変換指標、又はその他のVDRシンタックス要素(例えばBLデータ及びELデータを生成するVDRエンコーダ並びにBLデータ及びELデータを復号するVDRデコーダによって実行される機能及び/又は動作のフラグ及び記述子など)などを含むが、これらのいずれかに限定されるわけではない。
一実施形態では、RPU処理モジュール112は、コード化シンタックスに基づいて一連のシーケンスレベル、フレームレベル及びパーティションレベルの動作(予測に関連する動作を含むことができるが、それらのみに限定されるわけではない)を実行するように構成される。例えば、RPU処理モジュール112は、コード化シンタックスに指定される、SDR/VDRマッピングなどの逆マッピング、クロマアップサンプリング、1つ又は複数のビデオデータ処理動作(例えばフィルタリング、補間、リスケーリングなど)、或いは非線形量子化(NLQ)などの動作を実行することができる。その結果として、RPU処理モジュール112は、予測参照値を生成することができる。
一実施形態では、VDRエンコーダ102は、1つ又は複数の動作を実行して、入力VDR画像(VDR信号104と、必要に応じて変換された色空間とから導出される)から導出されるVDR画像データと予測参照値との間の残差値(130)を生成することができる。残差値は、線形領域又は対数領域における差分とすることができる。一実施形態では、VDRエンコーダ102、又はそれに含まれる残差ダウンサンプリング/リサンプリングユニットは、残差値(130)に対して1つ又は複数のダウンサンプリング/リサンプリング動作を実行して、さらに処理するためのダウンサンプリング(例えば8ビット)残差値を生成するように構成することができる。一実施形態では、VDRエンコーダ102、又はそれに含まれる残差非線形量子化器(NLQ、118)は、残差値(130)又はダウンサンプリング残差値に対して1つ又は複数の非線形量子化動作を実行し、その非線形量子化残差値をさらに処理するためにVDRエンコーダ102のその他のユニットに供給するように構成することができる。
一実施形態では、VDRエンコーダ102、又はそれに含まれる拡張レイヤ(単なる一例としては、8ビット/4:2:0など)エンコーダ(120)は、ELデータとして残差値(いくつかの実施形態では非線形量子化及び/又はダウンサンプリングされていることもある)を符号化して、拡張レイヤビットストリーム124にするように構成される。
VDRエンコーダ102又は拡張レイヤ(単なる一例としては、8ビット/4:2:0など)エンコーダ(120)がハイブリッドビデオコード化モデルを採用する実施形態では、残差値は、同じ画像中の近接する残差値サンプルから(イントラ予測を用いて)、又は同じ拡張レイヤに属する過去に復号された画像の残差値サンプルから(インター予測を用いて)予測することができる。一実施形態では、予測のための同じレイヤのELサンプルは、(拡張レイヤ用の)参照ピクチャ記憶装置122に格納又はバッファされる。
一実施形態では、VDRエンコーダ102、又はそれに含まれるVDR RPU110は、RPUデータの一部としてコード化シンタックスを符号化して、VDR RPUビットストリーム126にするように構成される。RPUデータとしては、SDR/VDRマッピングパラメータ、予測参照画像を生成するために適用される予測方法が使用する多項式パラメータ、NLQパラメータ、VDR RPU(110)が実行する1つ又は複数のビデオデータ処理で使用されるパラメータなどが挙げられるが、これらのいずれかに限定されるわけではない。VDR RPU110は、RPUデータユニットにフラグ又はヘッダフィールドを設定して、コード化シンタックスのいずれかのシンタックス要素を、以前のシーケンス、以前のフレーム又は以前のパーティションについて以前に送信されたRPUデータから予測することができるかどうかを示すことができる。
BLエンコーダ(116)及びELエンコーダ(120)の一方又は両方は、H.264/MPEG−4 AVC、HEVC、MPEG−2、VP8、VC−1及び/又はその他などの複数のコーデックのうちの1つ又は複数を用いて実装することができる。
図1に示すフローとは逆のデータフローを実施し、VDRエンコーダ102がコード化シンタックスを生成するのに使用したのと同じVDR仕様に対応している、対応するVDRデコーダを使用して、VDRエンコーダ102が生成したBLビットストリーム、ELビットストリーム及びRPUビットストリームを復号し、入力VDR画像の再構築バージョンを生成することができる。
図2は、1つ又は複数の異なるVDR仕様に対応するRPUデータを生成するVDRエンコーダ(202)を示す図である。VDRエンコーダ202は、VDRエンコーダ102が実施する第1のバージョン又は第2のバージョンとは異なっていてもよい第3のバージョン(例えば「2.0」と記す)のVDR仕様と関連することができるが、これに限定されるわけではない。VDRエンコーダ202は、1つ又は複数のコンピューティングデバイスで実装することができる。
1つの例示的な実施形態では、VDRエンコーダ202は、(入力)VDR信号204を受信して、VDR信号204から入力VDR画像を導出するように構成される。入力VDR画像は、高ダイナミックレンジの色域に対応する入力色空間内の高ビット深度(例えば10+ビット)の画像データを含むことができる。
いくつかの実施形態では、入力色空間がVDRエンコーダ202が予測動作を実行するマッピング色空間と異なる場合には、色空間変換ユニットによって、入力VDR画像を、入力色空間からマッピング色空間に変換することができる。
一実施形態では、VDRエンコーダ202は、図2に示すように、(入力)SDR信号208を受信して、SDR信号208からBLデータを導出するように構成される。或いは、VDRエンコーダ202は、SDR信号からBLデータを復号するのではなく、入力VDR画像にVDR/SDR(例えばトーン)マッピングを適用して、BLデータを導出するように構成される。BLデータは、SDRディスプレイで見るように最適化されている場合も最適化されていない場合もある低ビット深度(例えば8ビット)の画像データを含むことができる。VDRエンコーダ202に関連するBLデータは、上述のVDRエンコーダ102に関連するBLデータと同様である場合も同様でない場合もある。
一実施形態では、VDRエンコーダ202、又はそれに含まれる基本レイヤSDRエンコーダ(216)は、SDR信号208から、又はVDR信号204から導出される入力VDR画像に対するマッピング動作から導出することができるBLデータを符号化して基本レイヤビットストリーム228にするように構成される。
一実施形態では、BLデータによって表現されるメディアサンプルは、同じ画像中の近接するサンプルから(例えばイントラ予測を用いて)、又は同じ基本レイヤに属する過去に復号した画像のサンプルから(例えばインター予測を用いて)予測することができる。これらのサンプルは、(基本レイヤ用の)参照ピクチャ記憶装置214に格納又はバッファすることができる。
一実施形態では、VDRエンコーダ202は、BLデータサンプルに基づいて拡張レイヤに関する高ビット深度のメディアサンプルのレイヤ間予測を実行するように構成される。それらのBLデータサンプルは、メモリバッファ又はその他の形態のメモリ空間のうちの1つ又は複数の参照ピクチャ記憶装置214から取り出すことができる。いくつかの実施形態では、VDRエンコーダ202は、レイヤ間参照ピクチャ及び復号されたBLサンプルを使用して高ビット深度のメディアサンプルについて残差値を生じない(或いは生じたとしても残差値が全てゼロである)正確な予測アルゴリズムに基づく1つ又は複数の動作を実行するように設計される。したがって、高ビット深度のメディアサンプルを、少なくとも部分的にはレイヤ間参照ピクチャ及び復号されたBLサンプルに基づいて正確に予測することができる。
VDRエンコーダ202、又はそれに含まれるVDR RPU210は、拡張レイヤビットストリーム224で伝送される(レイヤ間参照ピクチャを含んでいてもよい)ELデータを生成するためのコード化シンタックスを生成するように構成することができる。コード化シンタックスは、VDRエンコーダ202が対応している特定のVDR仕様に準拠する複数のシンタックス要素を含むことができ、レイヤ間予測係数、クロマリサンプリング/フィルタ係数、色空間変換指標、その他のVDRシンタックス要素(例えばBLデータ及びELデータを生成するVDRエンコーダによって実行される機能及び/又は動作のフラグ及び記述子など)などを含むが、これらのいずれかに限定されるわけではない。
一実施形態では、RPU処理モジュール212は、コード化シンタックスに基づいて一連の動作(予測に関連する動作を含むことができるが、それらのみに限定されるわけではない)を実行するように構成される。例えば、RPU処理モジュール212は、コード化シンタックスに指定される、SDR/VDRマッピングなどの逆トーンマッピング、クロマアップサンプリング、及び1つ又は複数のビデオデータ処理動作(例えばフィルタリング、補間、リスケーリングなど)などの動作を実行することができる。一実施形態では、RPU処理モジュール212は、残差値を生じない(或いは、VDRエンコーダ202又はそれに含まれるRPU処理モジュール212が実行する予測動作が正確であるために、全ての残差値がゼロである)。この実施形態では、拡張レイヤVDRエンコーダ220がピクセルデータに作用しているので、RPU処理モジュール212は、ELデータを生成するために残差非線形量子化(NLQ)を実行しない。したがって、VDR RPU210によって生成されるコード化シンタックスは、残差非線形量子化(NLQ)に関連するパラメータを有していないこともある。
一実施形態では、RPU処理モジュール212は、コード化シンタックスに基づいてレイヤ間参照ピクチャを生成するように構成される。本明細書で述べるレイヤ間参照ピクチャは、全ての入力VDR画像について生成する必要はない。レイヤ間参照ピクチャは、VDR信号204から導出された1つ又は複数の連続したVDR画像のシーケンスについて生成することができる。レイヤ間参照ピクチャのメディアサンプルは、(拡張レイヤ用の)参照ピクチャ記憶装置222に格納又はバッファすることができる。
一実施形態では、VDRエンコーダ202、又はそれに含まれる拡張レイヤエンコーダ(220)は、少なくとも部分的にはレイヤ間参照ピクチャ及び/又はVDR信号204から導出された入力VDR画像に基づいて、出力EL信号を符号化して拡張レイヤビットストリーム224にするように構成される。
一実施形態では、VDRエンコーダ202、又はそれに含まれるVDR RPU(210)は、RPUデータの少なくとも一部としてコード化シンタックスを符号化して、VDR RPUビットストリーム226にするように構成される。
基本レイヤエンコーダ(216)及び拡張レイヤエンコーダ(220)の一方又は両方は、H.264/MPEG−4 AVC、HEVC、MPEG−2、VP8、VC−1及び/又はその他などの複数のコーデックのうちの1つ又は複数を用いて実装することができる。
図2に示すフローとは逆のデータフローを実施し、VDRエンコーダ202がコード化シンタックスを生成するのに使用したのと同じVDR仕様に対応している、対応するVDRデコーダを使用して、第3のバージョンのVDRエンコーダ202が生成したビットストリームを復号し、入力VDR画像の再構築バージョンを生成することができる。
これに加えて、又は必要に応じて、又は別法として、本明細書に記載する技術は、その他のバージョンのVDR仕様に対応するVDRコーデック(又はコード化システム)に対応することもできる。
3.RPUデータユニット
いくつかの実施形態では、VDRエンコーダ(例えば図1の102又は図2の202)などの上流側デバイスが生成したRPUデータを、複数のネットワーク抽象化レイヤ(NAL)データユニットに含めて下流側デバイスに供給することができる。一実施形態では、図3に示すように、NALデータユニットは、NALヘッダ、及びローバイトシーケンスペイロード(raw byte sequence payload)(RBSP)を含む。単なる例示であるが、NALデータユニット中のRBSPを使用してRPUデータをカプセル化するときには、NALヘッダの「NAL_unit_type」フィールドを、25、又はH.264/MPEG−4 AVC仕様(IS 14496−10)に指定されるNALタイプと異なる別の識別番号に設定することができる。
いくつかの実施形態では、NALデータユニットのRBSPのRPUデータは、RPUデータヘッダ及びRPUデータペイロードを含む。RPUデータユニットを共通の伝達手段として使用して、上流側デバイスから下流側デバイスにRPUデータを送達することができ、この場合、RPUデータは、複数のVDR仕様(例えば異なるバージョン)のうちのいずれか1つと関連することができる。RPUデータヘッダは、コーデック又はコード化システムタイプ(例えば3Dコード化システム用又はVDRコード化システム用など)と複数の異なるVDR仕様のうちの特定のVDR仕様とを特定するヘッダフィールドを含むことができる。RPUデータヘッダは、RPUデータユニットに含めて搬送されるRPUデータの1つ又は複数の高レベル(例えばシーケンスレベル及びフレームレベル)の部分も含むことができる。
RPUデータペイロードを使用して、上流側デバイスは、多層ビデオ信号の復号及び復号したビデオ信号を用いたVDR画像の再構築に使用することができるフラグ、動作及びパラメータの集合の記述子(又は構文記述子)を伝送することができる。RPUデータペイロードに記述される、VDR画像の再構築に使用される1つ又は複数のフラグ、動作及びパラメータは、レイヤ間予測に関係していることがある。本明細書に記載するレイヤ間予測用のフラグ、動作及びパラメータは、逆マッピング、クロマアップサンプリング、及びディスプレイ管理などその他の機能のうちの1つ又は複数に関係していることがある。これに加えて、又は必要に応じて、又は別法として、RPUデータペイロードに記述される、VDR画像の再構築に使用される1つ又は複数の機能、動作及びパラメータは、レイヤ間予測に付属する、又はレイヤ間予測とは別のデータ処理に関係していることがある。
図4は、例示的な実施形態におけるRPUデータヘッダのレイアウトを示す図である。一実施形態では、RPUデータヘッダは、複数のヘッダフィールドを含む。単なる例示であるが、ヘッダフィールドは、「rpu_type」、「rpu_format」、「vdr_rpu_profile」、「vdr_rpu_level」、「vdrシーケンスレベル情報」、「vdrフレームレベル情報」などを含むことができるが、これらのいずれかに限定されるわけではない。
ヘッダフィールド「rpu_type」を使用して、RPUデータが3Dコーデックであるか(例えばrpu_type=0又は1のときなど)、或いはVDRコーデックであるか(例えばrpu_type=2のときなど)を特定することができる。ヘッダフィールド「rpu_type」は、まだ開発されていない追加の新たなビデオコーデックに対応することができる。ヘッダフィールド「rpu_format」を使用して、RPUデータが関連する1つ又は複数のVDRバージョンを特定することができる。単なる例示であるが、ヘッダフィールド「rpu_format」の最上位ビットを使用して、大きな差違を有するVDRコーデックを区別することができ、同じフィールドの最下位ビットを使用して、VDRコーデックの小さな変化を区別することができる。例えば、ヘッダフィールド「rpu_format」の最上位ビット(例えば上位3ビット)が0であるときには、RPUデータは、VDRバージョン1.xのフローに関係し、一方、ヘッダフィールド「rpu_format」の最上位ビット(例えば上位3ビット)が1であるときには、RPUデータは、VDRバージョン2.0のフローに関係する。
本明細書に記載するVDRコード化システムは、1つ又は複数の異なるRPUプロファイルに対応することができる。ヘッダフィールド「vdr_rpu_profile」を使用して、RPUデータが関係するプロファイルを特定することができる。例えば、ヘッダフィールドの値0は、YCbCrのマッピング色空間、4:2:0のマッピングクロマフォーマット、多項式マッピング方法、及び大域のみのマッピングパーティションを指定するベースラインプロファイルを示し、ヘッダフィールドの値1は、全てのマッピング色空間、全てのマッピングクロマフォーマット、全てのマッピング方法、及び大域のみのマッピングパーティションを指定するメインプロファイルを示し、ヘッダフィールドの値2は、全ての色空間、全てのマッピングクロマフォーマット、全てのマッピング方法、及び局所可の(local−okay)マッピングパーティション(大域パーティション又は局所パーティション)を指定するハイプロファイルを示す。いくつかの実施形態では、ヘッダフィールド「rpu_format」のその他の可能な値を、現在開発中の、又はこれから開発される新たなプロファイルで使用するために保留しておく。さらに、これに加えて、かつ/又は必要に応じて、ヘッダフィールド「rpu_level」を使用して、RPUデータを用いて実行されるRPU処理の複雑さのレベルを区別することもできる。
本明細書に記載する技術では、VDR仕様に準拠する1つ又は複数のシンタックス要素を含むコード化シンタックスは、RPUビットストリームに含めてVDRエンコーダからVDRデコーダに伝送/信号通信することができる。シンタックス要素は、VDR符号化動作及び対応するVDR復号動作で使用されるフラグ、動作及びパラメータを指定することができる。シンタックス要素に表されるパラメータは、様々な係数タイプにすることができ、様々な制度、ビット長又はワード長などで、論理値、整数(固定小数点)値、又は浮動小数点値として指定することができる。
コード化シンタックス中のいくつかのシンタックス要素は、連続した画像のフルシーケンスの間不変のままであるシーケンスレベル情報として分類することができる。シーケンスレベル情報の例としては、シンタックス要素「chroma_sample_loc_type」、「vdr_color_primaries」、「vdr_chroma_format_idc」などが挙げられる(ただしこれらのいずれかに限定されるわけではない)が、同じシンタックス要素をシーケンスレベル、又は様々なコードシンタックスの別のレベルとして使用することができることに留意されたい。図4に示すように、シーケンスレベル情報は、ヘッダフィールド「vdrシーケンスレベル情報」に配置される。このヘッダフィールド「vdrシーケンスレベル情報」は、複雑なフィールドであってもよく、任意の特定のシーケンスレベル情報が1つ又は複数の現在のRPUデータユニットを用いて直接コード化されるかどうか、或いはシーケンスレベル情報が以前のRPUデータから予測されるかどうかを示すフラグvdr_seq_info_present_flagを含むことができる。
いくつかの実施形態では、伝送効率上の理由から、各画像(この記述の文脈では、「フレーム」と言い換えることもできる)ごとにシーケンスレベル情報をVDRエンコーダからVDRデコーダに送信しないこともある。その代わりに、連続したフレームのシーケンスごとに一度ずつ、シーケンスレベルパラメータを送信することができる。ただし、本発明の実施形態は、ランダムアクセス、誤り訂正及びロバストネスといった理由から同一シーケンス内でシーケンスレベルパラメータを一度や二度など繰り返すことを排除するわけではない。1つの例では、100個の連続した画像を含むシーケンスでは、10フレーム、25フレーム、50フレームなどのスライスの後でそのシーケンス内でシーケンスレベルパラメータを繰り返すことができる。別の例では、瞬時復号リフレッシュ(IDR)ピクチャごと、IDRピクチャ2つごとなどについてシーケンス内でシーケンスレベルパラメータを繰り返すことができる。
コード化シンタックス中のいくつかのシンタックス要素は、フルフレームの間不変のままであるフレームレベル情報として分類することができる。いくつかの実施形態では、フレームレベル情報は、図4に示すように、ヘッダフィールド「VDRフレームレベル情報」に配置される。いくつかの実施形態では、フレームレベル情報の一部又は全ては、以前のRPUデータユニットで送信されたフレームレベルシンタックス要素から予測することができる。
例えば、レイヤ間予測係数は、グループオブピクチャ(GOP)、シーン、フレームシーケンスなどの間、同じ又は同様とすることができる。したがって、フレームレベル情報は、必ずしもフレームごとに繰り返されないこともある。同じRPU識別子(id)を有する1つ又は複数の現在のRPUデータユニットについて、VDRエンコーダは、RPUデータユニットのRPUデータフィールド「vdr_rpu_id」に含めたRPU ID(又は識別子)をVDRデコーダに信号通信して、フレームレベル情報が現在のRPUデータユニット中で直接コード化されている(したがって異なるRPU IDで特定される以前のRPUデータを参照せずに直接取り出すことができる)ことを示すことができる。
いくつかの実施形態では、1つ又は複数の現在のRPUデータユニットのフラグ「use_prev_vdr_rpu_flag」は、1つ又は複数の以前に送信されたRPUデータユニット内のフレームレベル情報を1つ又は複数の現在のRPUデータユニットに関するフレームレベル情報の予測に再使用又は使用すべきであることをVDRデコーダに対して示すように設定することができる。以前に送信されたRPUデータユニットは、1つ又は複数の現在のRPUデータユニット内のRPUデータフィールド「prev_vdr_rpu_id」で特定することができる。その結果として、1つ又は複数の現在のRPUデータユニットに含めて予測可能なフレームレベルシンタックス要素を送信することを回避することができる。いくつかの実施形態では、現在のRPUデータユニットが直接コード化されたフレームレベルシンタックス要素を搬送しないので、現在のRPUデータユニットにRPU IDを割り当てることも回避することができる。ビットストリーム伝送におけるデータボリュームの削減とVDRデコーダにおけるメモリ仕様の増加との間の費用便益の兼ね合いに応じて、最大数のRPU ID及びそれらに対応するフレームレベルシンタックス要素を予測に使用することができる。
いくつかの実施形態では、本明細書に記載する技術は、画像を1つ又は複数のパーティションに分割することに対応する。コード化シンタックスを指定するために使用することができる一部のシンタックス要素は、フレームレベルシンタックス要素として分類することができ、別の一部のシンタックス要素は、パーティションレベルシンタックス要素として分類することができる。
4.RPUデータ復号−シーケンスレベル及び/又はフレームレベル
図5は、RPUデータユニットのシーケンスレベル及び/又はフレームレベルのシンタックス要素を復号(又は構文解析)するために使用することができるRPU復号(又は構文解析)プロセスを示す図である。RPU復号/構文解析プロセスは、1つ又は複数の現在のRPUデータユニットを受信して、その1つ又は複数の現在のRPUデータユニット中の1つ又は複数のRPUデータヘッダからシンタックス要素の少なくとも一部を導出するように構成することができる。最初に、RPU復号/構文解析プロセスは、フラグ「use_prev_vdr_rpu_flag」が存在するかどうかを判定し、存在する場合には、そのフラグ(シンタックス要素)がどんな値であるかを決定することができる。
フラグが1(又は「yes」)に設定されていると判定した場合には、RPU復号/構文解析プロセスは、受信したRPUデータユニットからシンタックス要素「prev_vdr_rpu_id」を復号又は構文解析するステップに進む。このシンタックス要素「prev_vdr_rpu_id」は、1つ又は複数の以前に送信されたRPUデータユニット中の以前に送信されたシンタックス要素と関連する予測子(又は以前の)RPU IDを指すものである。予測子RPU IDに基づいて、RPU復号/構文解析プロセスは、予測子RPU IDをキーとして用いて、指定されたRPUデータキャッシュから以前に送信されたシンタックス要素を取り出すことができる。「use_prev_vdr_flag」が1(又は「yes」)に設定されたこの処理経路を使用して、RPUデータキャッシュの同じレベルの以前に送信されたシンタックス要素から、コード化シンタックス中のシーケンスレベル、フレームレベル及びパーティションレベルの一部又は全てのシンタックス要素を予測することができる。
一方、フラグ「use_prev_vdr_rpu_flag」が0(又は「no」)に設定されていると判定した場合には、RPU復号/構文解析プロセスは、受信したRPUデータユニットからシンタックス要素「vdr_rpu_id」を復号又は構文解析するステップに進む。このシンタックス要素「vdr_rpu_id」は、1つ又は複数の現在のRPUデータユニット中に直接コード化されたシンタックス要素に割り当てられた現在のRPU IDに設定される。単なる例示であるが、これらのシンタックス要素としては、「mapping_color_space」、「mapping_chroma_idc」、「chroma_resampling_filter_idc」、「num_pivots_minus2」、「pred_pivot_value[][]」、「nlq_method_idx」、「nlq_num_pivots_minus2」、「nlq_pred_pivot_value[][]」、「enable_residual_spatial_upsampling_flag」、「num_x_partition_minus1」、「num_y_partition_minus1」、「residual_resampling_filter_idc」、「overlapped_prediction_method」などが挙げられるが、これらに限定されるわけではない。なお、様々な実施形態では、異なるシンタックス要素及び/又は異なるシンタックス要素名を定義又は使用して、本明細書に記載する技術を実施することもできることに留意されたい。
これらのシンタックス要素のうちの1つ又は複数は、特定の対応する動作の有無を示すフラグとすることができる。例えば、フラグ「use_prev_vdr_rpu_flag」は、以前のRPU IDについてのキャッシュされたシンタックス要素からRPUデータを予測する動作の有無を示す。同様に、フラグ「enable_residual_spatial_upsampling_flag」は、受信したBLデータ及びELデータに基づいてVDR画像を再構築する際に残差リサンプリングフィルタ動作を実行すべきかどうかを示すことができる。指標「chroma_resampling_filter_idc」は、受信したBLデータ及びELデータに基づいてVDR画像を再構築する際にどのクロマリサンプリングフィルタを使用すべきかを示すことができる。また、RPU復号/構文解析プロセス自体では、これらのフラグのそれぞれを使用して、特定の処理経路をとるべきかどうかを判定する。
図5に示すように、RPUタイプ及びバージョン情報(例えばRPUデータが対応するVDR仕様のv1.xフローと関連するかどうか、及び/又はVDR仕様が残差ゼロのELデータを実装するかどうかを示すことができる)を使用して、RPU復号/構文解析プロセスのいくつかの処理経路を決定することができる。
また、シンタックス要素「num_x_partition_minus1」及び「num_y_partition_minus1」などのパラメータを使用して、RPU復号/構文解析プロセスの処理経路の一部を決定することができる。例えば、これらのシンタックス要素が両方とも、大域のみのパーティションを示すゼロ値を有する場合には、大域のみのパーティションに対応する処理経路をとることができる。一方、これらのシンタックス要素のうちのいずれか又は両方が非ゼロ値を有する場合には、図5に示すように、異なる処理経路をとることができる。
5.RPUデータ復号−パーティションレベル
いくつかの実施形態では、パーティションレベルシンタックス要素を、1つ又は複数の現在のRPUデータユニット(の1つ又は複数のRPUペイロードなど)に含めてVDRエンコーダからVDRデコーダに伝送することができる。図6は、例示的な実施形態において、1つ又は複数の現在のRPUデータユニットからパーティションレベルシンタックス要素を復号するために使用することができる。RPUデータペイロード復号/構文解析プロセスを示す図である。パーティションレベルシンタックス要素のうちの1つ又は複数を、コード化シンタックスと関連させて、又はコード化シンタックスで使用して、レイヤ間予測関連動作及び/又はその他の処理動作を指定することができる。
いくつかの実施形態では、図6のRPUデータペイロード復号/構文解析プロセスは、例えば図5のRPU復号/構文解析プロセスによって呼び出すことができる関数「vdr_rpu_data_payload()」として実施することができる。
いくつかの実施形態では、画像フレームのx方向及びy方向に反復されるパーティションごとに図6のいくつかのステップを繰り返す。図6に示すように、関数「rpu_data_mapping(x,y)」を最初に各パーティションごとに呼び出して、複数の異なるVDR仕様に共通していることもあるパーティションレベルシンタックス要素を復号することができる。その後、特定のVDR仕様への特有性がより高いシンタックス要素を復号することができる。より特有性の高いシンタックス要素の復号は、例えば1つ又は複数の現在のRPUデータユニットから既に復号されているその他のシンタックス要素又はRPU情報に基づいて実行することができる。例えば、(1)「rpu_format」フィールド及び(2)1つ又は複数の現在のRPUデータユニットの1つ又は複数のRPUデータヘッダから復号されたシンタックス要素「mapping_chroma_idc」(バージョン番号V1.xのVDR仕様)又はシンタックス要素「vdr_chroma_format_idc」及び「sdr_chroma_format_idc」(バージョン番号v2.xのVDR仕様)に基づいて、図6のRPUデータペイロード復号/構文解析プロセスは、バージョン「v1.x」又は「v2.x」のVDR仕様に準拠する受信したBLデータ及びELデータに対してクロマリサンプリング動作を実行すべきかどうかを判定することができる。
VDR仕様がバージョンv1.xであり、かつフラグ「disable_residual_flag」が偽であると判定した場合には、RPU復号/構文解析関数「rpu_data_nlq(x,y)」を、各パーティションごとに呼び出すことができる。さらに、図6に示すように、xパーティション指標及びyパーティション指標が両方ともゼロであるときには、フレームレベルRPU復号/構文解析関数「rpu_data_residual_resampling(x,y)」など、その他の復号/構文解析関数を呼び出すこともできる。
いくつかの実施形態では、VDRコード化システムが実施するVDR仕様は、クロマリサンプリング、逆マッピング、並びに重複領域に基づく予測、剰余非線形量子化/逆量子化、残差クロマリサンプリング、空間的スケーリング、及びデータ処理(例えばパーティションの境界領域の補間など)など(ただしこれらに限定されない)の予測に基づく動作に対応している。
クロマリサンプリングでは、VDR仕様は、固定フィルタ並びに明示的な1D(2D分離型)フィルタ及び2D(非分離型)フィルタの両方、或いはその他の輝度又はクロマチャネル情報を使用するフィルタ(クロスチャネルリサンプリングフィルタ)などに対応することができる。シンタックス要素「chroma_resampling_filter_idc」を使用して、前述のフィルタのうちのどれをコード化シンタックスの一部とするかを指定することができる。本明細書に記載する技術では、異なるクロマチャネルは、異なるフィルタを使用することができる。これに加えて、又は必要に応じて、又は別法として、明示的なフィルタは、対称であっても非対称であってもよい。いくつかの実施形態では、本明細書に記載する1つ又は複数のフィルタは、ピクチャ境界(又は画像境界)をフィルタリング動作における特殊なケースとして処理するように設計される。例えば、フィルタは、反復(図6に示す)又はミラーリングによって、ピクチャ境界を単純にパッドすることができる。いくつかの実施形態では、本明細書に記載する1つ又は複数のフィルタは、異なるパーティションに跨がる動作を実行する、又はパーティション境界をピクチャ境界と同じように扱うように設計される。同一画像の異なるパーティションに対して、異なるクロマリサンプリングフィルタを使用することができる。これに加えて、又は必要に応じて、又は別法として、フル画像の全てのパーティションにフィルタを適用することもできる。これに加えて、又は必要に応じて、又は別法として、例えば明示的なフィルタなど特定のタイプのフィルタを、フル画像に対して指定することもできる。ただし、異なるパーティションに対して、コード化シンタックスでは異なる係数を指定することができる。例えば、シンタックス要素「chroma_resampling_filter_idc」をフレームレベルで信号通信して、フレーム全体で特定のタイプのフィルタが使用されることを示すことができる。しかし、そのフレーム内の異なるパーティションについての異なるフィルタ係数は、パーティションレベルで信号通信することができる。これに加えて、又は必要に応じて、又は別法として、パーティションレベルフィルタ係数は、直接コード化してもよいし、現在のRPU IDの下で以前のパーティションのうちの1つ又は複数から予測してもよいし、或いは以前のRPU IDの下で1つ又は複数の以前のRPUデータユニットの1つ又は複数のパーティションから予測してもよい。本明細書に記載する係数は、非差分コード化することもできるし、差分コード化(例えば異なるパーティション、画像又はクロマチャネルの値に対する差分値を含む)することもできる。また、クロマリサンプリングフィルタは、クロマサンプル位置を考慮しなければならない。
逆マッピングは、VDR階層的コーデックで重要な役割を果たすことがある。本明細書に記載するVDR仕様は、様々な逆マッピング方法に対応することができる。逆マッピング方法の例としては、ビットシフト、多項式、MMR、SOP、ID LUT、曲線当てはめなどのいずれかが挙げられるが、これらのみに限定されるわけではない。図8に示す復号/構文解析関数「rpu_data_mapping()」を使用して、指定された色空間の各色成分(輝度又はクロマ成分)における逆マッピングに関係するシンタックス要素を復号(又は構文解析)することができる。シンタックス要素「syntax_mapping_idc」を使用して、逆マッピング方法のうちのどれを選択するかを示すことができる。画像の異なる領域は異なる視覚コンテンツを含む可能性があるので、VDR仕様は、異なるパーティション(すなわち異なる領域)が異なるマッピング方法を使用できるようにすることができる。画像の各チャネルのダイナミックレンジは、複数のセグメント(又はピース)に分割することができ、各ダイナミックレンジセグメントが異なるマッピング方法を使用することができる。さらに、異なるパーティションのそれぞれの各ダイナミックレンジが異なるマッピング方法を使用することができる。この手法は、画像のメディアコンテンツの中央のダイナミックレンジが線形で、線形マッピングとして扱うことができるが、暗範囲及び明範囲は非線形で、比較的複雑なマッピング方法で処理しなければならない、逆マッピングで使用することができる。一実施形態では、シンタックスpivot_valueを使用して、ダイナミックレンジセグメントを示す。これに加えて、又は必要に応じて、又は別法として、マッピングされたピボット値は、差分コード化することもできる(例えばシンタックス要素「pred_pivot_value」で示す)し、或いは下流側VDRデコーダに信号通信される1つ又は複数の現在のRPUデータユニットのコード化シンタックスに直接コード化することもできる。
いくつかの実施形態では、画像中の複数のパーティションのうちの少なくとも1つは、複数の異なるダイナミックレンジセグメントを使用することができる。いくつかの実施形態では、画像中の全てのパーティションの異なるダイナミックレンジセグメントの数のうちの最大のものを、限界未満になるように決定又は設定する。いくつかの実施形態では、画像の全てのパーティションが同数の異なるダイナミックレンジセグメントを保持するが、異なるパーティションのダイナミックレンジは、必要に応じて異なっていてもよい。
線形マッピングでは、コード化シンタックスの1つ又は複数のシンタックス要素をVDRエンコーダが使用して、多項式係数を下流側VDRデコーダに信号通信することができる。或いは、コード化シンタックスの1つ又は複数のシンタックス要素を使用して、マッピングされたピボット値を信号通信して、各ダイナミックレンジセグメントのピクセルを補間することができる。マッピングされたピボット値が存在することは、シンタックス要素(又はフラグ)「linear_interp_flag」を用いて信号通信することができる。1つの例では、1D LUTのデータ点のいくつか又は全ての値を信号通信することができる。別の例では、1D LUTの少なくともいくつかの値を、下流側VDRデコーダに信号通信されたマッピングされたピボット値を使用した補間に基づいて構築することができる。
パーティションについてのダイナミックレンジマッピング(例えばトーンマッピング)に使用される係数は、直接コード化してもよいし、或いは同じRPUデータユニットから導出される近接するパーティションのマッピングされたダイナミックレンジセグメントから予測してもよい。これに加えて、又は必要に応じて、又は別法として、パーティションについての係数は、以前のRPUデータユニットから導出されるマッピングピースのパーティションのマッピングされたダイナミックレンジセグメントから予測することもできる。例えば、パーティションについての係数は、以前のRPUデータユニットから導出される同じパーティションのマッピングされたダイナミックレンジセグメントから予測することができる。
本明細書に記載する技術は、コード化色空間(例えばRPUデータヘッダのシーケンスレベル情報に含めて信号通信することができる)とは異なるマッピング色空間(例えばシンタックス要素「mapping_color_space」で示されるものなど)を使用することに対応している。例えば、コード化色空間をYCbCrとし、マッピング色空間をRGBとすることができる。その他のタイプの色空間も、コード化空間又はマッピング空間の選択肢として用いることができる。マッピング色空間は、パーティションによって異なっていてもよい。或いは、マッピング色空間は、全てのパーティションで同じであってもよい。マッピング方法及びメタデータは、マッピング色空間のチャネルによって異なっていてもよい。或いは、マッピング方法及びメタデータは、マッピング色空間の全てのチャネルで同じであってもよい。1つの画像で複数のパーティションを使用する実施形態では、パーティションの境界に沿って不連続性が存在する可能性がある。一実施形態では、コード化シンタックスを使用して、ピクセル値又は色値の加重平均によって、かつ/或いは線形又は非線型な方法でパーティションの境界を融合することによってパーティションの境界を単に平滑化することにより実行される境界マッピング方法を信号通信することができる。一実施形態では、コード化シンタックスのシンタックス要素「overlappsed_prediction_method」を少なくとも部分的に使用して、境界マッピング方法を信号通信することができる。
6.RPUデータ復号−クロママッピング
図7は、例示的な実施形態における、クロマリサンプリングに関係するシンタックス要素を復号(又は構文解析)するために使用することができるRPUデータ復号(又は構文解析)動作(例えばrpu_data_chroma_resampling()関数の形態)を示す図である。これらのシンタックス要素は、パーティションレベルとすることができるが、必ずしもパーティションレベルでなければならないというわけではない。RPUデータコード化動作は、例えば図6の復号/構文解析プロセスによって呼び出すことができる復号/構文解析関数として実施することができる。マッピング色空間がフル画像で同じである実施形態では、図7に示すシンタックス要素を、必要に応じてフレームレベルシンタックス要素としてコード化シンタックスに示すことができる。
いくつかの実施形態では、ピース単位のマッピング動作で呼び出されるセグメントの数を、全てのパーティションで同じに保つことができる。補間に関する一部のシンタックス要素は、フレームレベルシンタックス要素としてコード化シンタックスに示すことができるが、補間に関する別の一部のシンタックス要素は、パーティションレベルシンタックス要素としてコード化シンタックスに示すことができる。
図7に示すように、「rpu_data_chroma_resampling()」復号/構文解析関数は、色空間内の色成分の数を復号することができる。各色成分ごとに、いくつかのステップを繰り返すことができる。
ある色成分のフラグが、以前のパーティションフィルタ係数を使用することを示している場合には、復号/構文解析関数「rpu_data_chroma_resampling()」は、その色成分の予測子パーティション情報を導出するステップに進む。予測子パーティション情報は、以前のRPU IDについてのキャッシュされたシンタックス要素から導出される、或いは1つ又は複数の現在のRPUデータユニットの1つ又は複数のその他のパーティションの既に復号されているシンタックス要素から導出される、パーティションフィルタ係数を含むことができる。
一方、色成分のフラグが、以前のパーティションフィルタ係数を使用しないことを示している場合には、復号/構文解析関数「rpu_data_chroma_resampling()」は、1つ又は複数の現在のRPUデータユニットからパーティションフィルタ係数を導出するステップに進む。これらの係数は、2Dの明示的なフィルタ、1Dの垂直方向の明示的なフィルタ、1Dの水平方向の明示的なフィルタなどに関係することができる。
ダイナミックレンジマッピングで使用する係数と同様に、パーティションのクロマリサンプリング又はクロママッピングの係数は、別法として、同じ1つ又は複数の現在のRPUデータユニットから導出される近接するパーティションの同様の係数から予測することができる。これに加えて、又は必要に応じて、又は別法として、パーティションについての係数は、1つ又は複数の以前に送信されたRPUデータユニットから導出されるマッピングされたピースのパーティションの同じ係数から予測することができる。例えば、パーティションについての係数は、1つ又は複数の以前に送信されたRPUデータユニットから導出される同じパーティションの同じ係数から予測することができる。
7.RPUデータ復号の追加例
図9は、例示的な実施形態における、パーティションレベルの非線形量子化/逆量子化に関係するシンタックス要素を復号(又は構文解析)するRPUデータ復号(又は構文解析)動作(例えばrpu_data_nlq()関数の形態)を示す図である。特定のVDR仕様は、非線形量子化/逆量子化に対応することができる。非線形量子化/逆量子化の例としては、線形不感帯、μ−law曲線、ラプラス曲線、シグモイド曲線などに基づく非線形量子化/逆量子化のうちのいずれかなどが挙げられるが、これらのみに限定されるわけではない。特定の非線形量子化/逆量子化の方法を、シンタックス要素「nlq_method_idc」で下流側VDRデコーダに信号通信することができる。一実施形態では、画像の全てのパーティションに対して同じ方法(例えばシンタックス要素「nlq_method_idc」は、RPUデータヘッダのフレームレベル情報の一部として信号通信することができる)を使用することができるが、この方法の係数は、異なるパーティションで同じであっても同じでなくてもよい。非線形量子化/逆量子化に関わるデータレンジは、複数のセグメントに分割することができる。異なるセグメントは、同じ方法の異なる係数を有することができる。
他の動作で使用される他の係数と同様に、パーティションの非線形量子化/逆量子化の係数も、直接コード化することもできるし、或いは同じRPUデータユニットから導出される近接するパーティションの同じ係数から予測することもできる。これに加えて、又は必要に応じて、又は別法として、パーティションについての係数は、以前のRPUデータユニットから導出されるマッピングされたピースのパーティションの同じ係数から予測することができる。例えば、パーティションについての係数は、以前のRPUデータユニットから導出される同じパーティションの同じ係数から予測することができる。
いくつかの実施形態では、特定のVDR仕様に準拠するコード化シンタックスは、剰余データに実行されるクロマリサンプリング及び/又は空間的アップサンプリング(例えば1:2)を指定することができる。いくつかの実施形態では、剰余データに実行される動作は、コード化シンタックスにおいて、上述のクロマリサンプリングフィルタに関する動作と同様に扱われる。
いくつかの実施形態では、BL信号及びEL信号中に符号化される画像データに対して、異なるクロマフォーマットが使用される。例えば、BL信号は、EL信号が使用するものとは異なるクロマフォーマット(異なるクロマサンプリング及び異なるビット深度)を使用することができる。これに加えて、又は必要に応じて、又は別法として、BL信号とEL信号は、異なる色空間を使用することもできる。
本明細書に記載する技術は、クロマリサンプリング、色空間変換及び逆マッピングの間の異なる処理順序に対応することができる。いくつかの実施形態では、VDRコード化システムは、複数の可能な処理順序のうちの1つ、2つ又はそれ以上に対応することができる。VDRコード化システムが対応している1つ又は複数の処理順序は、最適とみなすことができる。例えば、VDRエンコーダ(例えば図2の202)の出力ビットストリーム(例えば図2のBLビットストリーム228及びELビットストリーム224)のBLデータ及びELデータの両方のコード化色空間をVDR仕様に指定されるYCbCrとして、マッピング色空間はRGBとすることができ、入力SDR信号(例えば図2の208)をYCbCr 4:2:0とし、入力VDR信号(例えば図2の204)をRGB 4:4:4 12ビットとする。この例では、レイヤ間参照データは、以下のように生成することができる。VDRエンコーダは、最初に、入力SDR信号から導出されるBLデータについて、4:2:0から4:4:4へのクロマリサンプリングを実行する。次に、BLデータ(この時点では4:4:4クロマフォーマット)に対して、YCbCrからRGBへの色変換を実行することができる。マッピング色空間で、このBLデータ(この時点では4:4:4クロマフォーマットであり、マッピング色空間中と同じマッピング色空間)に対して逆マッピングを実行して、マッピング色空間内のレイヤ間予測値を生成することができる。このレイヤ間予測値に対して、RGBからYCbCrへの色変換を実行して、ELデータを生成することができる。
8.例示的なプロセスフロー
図10は、例示的な実施形態における、RPUデータからコード化シンタックスを復号するVDRデコーダを示す図である。コード化シンタックスは、例えば図1のVDRエンコーダ102が対応している第1のバージョン(「1.x」)又は第2のバージョン(「1.x」)とすることができる特定のVDR仕様に準拠しているものとすることができる。VDRデコーダは、コード化シンタックスに従って、BLデータ、ELデータ、RPUデータ、レイヤ間予測データ及び中間メディアデータに対して復号動作を実行するように構成することができる。図10のVDRデコーダは、1つ又は複数のコンピューティングデバイス、カスタムかつ/又は市販品ハードウェアデバイス、プログラマブルデバイス、或いはそれらの任意の組合せなどで実装することができる。
いくつかの実施形態では、図10のVDRデコーダは、図5から図9に示す復号/構文解析プロセスのうちの1つ又は複数を実施して、コード化シンタックス及びそれに含まれるシンタックス要素を導出することができる。図10のVDRデコーダは、BLデータ、ELデータ及びRPUデータに復号動作を適用して、例えばVDRエンコーダ(例えば図1の102)によって符号化された入力VDR画像に対応する出力VDR画像を構築することができる。
図11Aは、本発明の例示的な実施形態による例示的なプロセスフローを示す図である。いくつかの例示的な実施形態では、1つ又は複数のコンピューティングデバイス又は構成要素が、このプロセスフローを実行することができる。ブロック1102で、多層VDRビデオエンコーダ(例えば図1の102又は図2の202)は、入力視覚ダイナミックレンジ(VDR)画像と、その入力VDR画像に関連する入力基本レイヤ(BL)画像を受信する。
ブロック1104で、多層VDRビデオエンコーダは、シーケンスレベル、フレームレベル又はパーティションレベルの複数のシンタックス要素を含むコード化シンタックスを生成する。
ブロック1106で、多層VDRビデオエンコーダは、コード化シンタックスに従って、入力BL画像及び入力VDR画像をBLデータ及び拡張レイヤ(EL)データに変換する。
ブロック1108で、多層VDRビデオエンコーダは、コード化シンタックスを参照処理ユニット(RPU)データに変換する。
ブロック1110で、多層VDRビデオエンコーダは、BLデータ、ELデータ及びRPUデータを、BL信号、EL信号及びRPU信号に含めて出力する。
一実施形態では、多層VDRビデオエンコーダは、さらに、少なくとも部分的にはコード化シンタックスに基づいて、1つ又は複数の現在のRPUデータユニットを生成するステップと、この1つ又は複数の現在のRPUデータユニットにおいてコード化シンタックスが準拠する特定のVDR仕様を特定するステップとを実行するように構成される。
一実施形態では、1つ又は複数の現在のRPUデータユニットのうちの少なくとも1つは、複数の異なるVDR仕様のうちのいずれか1つに対応することができるデータ構造を含む。
一実施形態では、多層VDRビデオエンコーダは、さらに、1つ又は複数の現在のRPUデータユニットにおいて、コード化シンタックスの複数のシンタックス要素の中の少なくとも1つのシンタックス要素が1つ又は複数の現在のRPUデータユニットの1つ又は複数のその他のパーティションから予測可能であることを示すステップを実行するように構成される。
一実施形態では、多層VDRビデオエンコーダは、さらに、1つ又は複数の現在のRPUデータユニットにおいて、コード化シンタックスの複数のシンタックス要素の中の少なくとも1つのシンタックス要素が、以前の入力VDR画像及びこの入力VDR画像と関連する以前の入力BL画像についての1つ又は複数の以前のRPUデータユニットから予測可能であることを示すステップを実行するように構成される。
一実施形態では、入力VDR画像及び以前の入力VDR画像は、入力VDR画像のシーケンスに属し、この入力VDR画像のシーケンスは、共通の1組のシーケンスレベルのシンタックス要素のセットを共有する。
一実施形態では、入力VDR画像及び以前の入力VDR画像は、入力VDR画像の2つの異なるシーケンスに属し、これら2つの異なる入力VDR画像のシーケンスのうちの第1のシーケンスは、第1の共通の1組のシーケンスレベルのシンタックス要素のセットを共有し、これら2つの異なる入力VDR画像のシーケンスのうちの第2のシーケンスは、第1のセットとは異なる第2の共通の1組のシーケンスレベルのシンタックス要素のセットを共有する。
一実施形態では、複数のシンタックス要素のうちの少なくとも1つのシンタックス要素は、シーケンスレベル、フレームレベル又はパーティションレベルのうちの2つ以上のシンタックス要素として使用可能である。
一実施形態では、BLデータは、標準的ダイナミックレンジ(SDR)のディスプレイで見るように最適化されたSDR画像を表す。一実施形態では、BLデータは、標準的ダイナミックレンジ(SDR)のディスプレイで見るように最適化されたSDR画像を表していない。
一実施形態では、ELデータは、入力VDR画像とBLデータに基づいて生成した予測VDR画像との間の残差値を含む。一実施形態では、ELデータは、入力VDR画像のシーケンスの2つ以上の入力VDR画像のレイヤ間参照ピクチャを含む。この2つ以上の入力VDR画像は、入力VDR画像を含む。
一実施形態では、複数のシンタックス要素は、パラメータ、係数、ピボット値、フラグに対応する動作の有無を示すフラグ、或いは表示管理メタデータを含む1つ又は複数のタイプのメタデータのうちの1つ又は複数を含む。
一実施形態では、入力VDR画像は、入力色空間で符号化された画像データを含み、ELデータは、出力色空間で符号化された画像データを含み、ELデータは、少なくとも部分的にはマッピングされたデータに基づいて生成され、マッピングされたデータは、少なくとも部分的にはBLデータに基づいて生成され、マッピングされたデータは、マッピングされた色空間で符号化されたマッピングされた画像データを含む。
一実施形態では、入力色空間、出力色空間及びマッピングされた色空間のうちの少なくとも2つは、異なる色空間である。一実施形態では、入力色空間、出力色空間及びマッピングされた色空間のうちの少なくとも2つは、同じ色空間である。
一実施形態では、ELデータは、第1のクロマフォーマットで符号化された画像データを含み、BLデータは、第1のクロマフォーマットとは異なる第2のクロマフォーマットで符号化された画像データを含む。一実施形態では、ELデータは、あるクロマフォーマットで符号化された画像データを含み、BLデータは、同じクロマフォーマットで符号化された画像データを含む。
一実施形態では、複数のシンタックス要素は、クロマリサンプリング動作、逆マッピング動作、非重複領域に基づく予測動作、重複領域に基づく予測動作、剰余非線形量子化及び逆量子化動作、残差クロマリサンプリング動作、空間的スケーリング動作、補間などのデータ処理動作、又は表示管理動作のうちの1つ又は複数を信号通信する。
一実施形態では、多層VDRビデオエンコーダは、さらに、1つ又は複数の入力ビデオ信号を用いて表現、受信、伝送又は格納される1つ又は複数の入力VDR画像を、1つ又は複数の出力ビデオ画像を用いて表現、受信、伝送又は格納される1つ又は複数の出力VDR画像に変換するステップを実行するように構成される。
一実施形態では、入力VDR画像は、高ダイナミックレンジ(HDR)画像フォーマット、映画芸術科学アカデミー(AMPAS)のアカデミー色符号化仕様(ACES)標準に関連するRGB色空間、デジタルシネマイニシアチブのP3色空間標準、参照入力媒体測色値/参照出力媒体測色値(Reference Input Medium Metric/Reference Output Medium Metric:RIMM/ROMM)標準、sRGB色空間、RGB色空間、又はYCbCr色空間のうちの1つで符号化される。
図11Bは、本発明の例示的な実施形態による例示的なプロセスフローを示す図である。いくつかの例示的な実施形態では、1つ又は複数のコンピューティングデバイス又はハードウェア構成要素が、このプロセスフローを実行することができる。ブロック1152で、多層ビデオデコーダ(例えば図10に示すデコーダなど)は、基本レイヤ(BL)信号、拡張レイヤ(EL)信号及び参照処理ユニット(RPU)信号に含まれるBLデータ、ELデータ及びRPUデータを受信する。このBLデータ、ELデータ及びRPUデータは、共通の視覚ダイナミックレンジ(VDR)ソース画像と関連づけられている。
ブロック1154で、多層ビデオデコーダは、RPUデータを復号して、シーケンスレベル、フレームレベル又はパーティションレベルの複数のシンタックス要素を含むコード化シンタックスにする。
ブロック1156で、多層ビデオデコーダは、コード化シンタックスに従って、BLデータ及びELデータを再構築したVDR画像に変換する。
ブロック1158で、多層ビデオデコーダは、再構築したVDR画像を出力する。
一実施形態では、多層ビデオデコーダは、さらに、1つ又は複数の現在のRPUデータユニットから、コード化シンタックスが準拠する特定のVDR仕様を決定するステップと、1つ又は複数の現在のRPUデータユニットからコード化シンタックスの少なくとも一部分を導出するステップとを実行するように構成される。
一実施形態では、多層ビデオデコーダは、さらに、1つ又は複数の現在のRPUデータユニットから、コード化シンタックスの複数のシンタックス要素のうちの少なくとも1つのシンタックス要素が、1つ又は複数の現在のRPUデータユニットの1つ又は複数のその他のパーティションから予測可能であると決定するステップを実行するように構成される。
一実施形態では、多層ビデオデコーダは、さらに、1つ又は複数の現在のRPUデータユニットから、コード化シンタックスの複数のシンタックス要素のうちの少なくとも1つのシンタックス要素が、以前に再構築したVDR画像に関連する1つ又は複数の以前のRPUデータユニットから予測可能であると決定するステップを実行するように構成される。
一実施形態では、再構築したVDR画像及び以前に再構築したVDR画像は、再構築したVDR画像のシーケンスに属し、この再構築したVDR画像のシーケンスは、共通の1組のシーケンスレベルのシンタックス要素のセットを共有する。
一実施形態では、再構築したVDR画像及び以前に再構築したVDR画像は、再構築したVDR画像の2つの異なるシーケンスに属し、これら2つの異なる再構築したVDR画像のシーケンスのうちの第1のシーケンスは、第1の共通の1組のシーケンスレベルのシンタックス要素のセットを共有し、これら2つの異なる再構築したVDR画像のシーケンスのうちの第2のシーケンスは、第1のセットとは異なる第2の共通の1組のシーケンスレベルのシンタックス要素のセットを共有する。
一実施形態では、ELデータは、再構築したVDR画像のシーケンス中の2つ以上の再構築したVDR画像のレイヤ間参照ピクチャを含み、この2つ以上の再構築したVDR画像は、再構築したVDR画像を含む。
一実施形態では、再構築したVDR画像は、第1の色空間で符号化した画像データを含み、ELデータは、第2の色空間で符号化した画像データを含み、再構築したVDR画像は、BLデータから導出したマッピングされたデータに少なくとも部分的には基づいて生成され、マッピングされたデータは、第3の色空間で符号化したマッピングされた画像データを含む。
一実施形態では、第1、第2及び第3の色空間のうちの少なくとも2つは、異なる色空間である。一実施形態では、第1、第2及び第3の色空間のうちの少なくとも2つは、同じ色空間である。
一実施形態では、多層ビデオデコーダは、さらに、1つ又は複数の入力ビデオ信号を用いて表現、受信、伝送又は格納される画像データを、1つ又は複数の出力ビデオ信号を用いて表現、受信、伝送又は格納される1つ又は複数の出力VDR画像に変換するステップを実行するように構成される。
一実施形態では、再構築したVDR画像は、高ダイナミックレンジ(HDR)画像フォーマット、映画芸術科学アカデミー(AMPAS)のアカデミー色符号化仕様(ACES)標準に関連するRGB色空間、デジタルシネマイニシアチブのP3色空間標準、参照入力媒体測色値/参照出力媒体測色値(RIMM/ROMM)標準、sRGB色空間、RGB色空間、又はYCbCr色空間のうちの1つで符号化された画像データを含む。
様々な例示的な実施形態において、エンコーダ、デコーダ、システム、装置、或いは1つ又は複数のその他のコンピューティングデバイスは、記載した前述の方法のいずれか又は一部を実行する。
9.実施機構−ハードウェア概略
一実施形態によれば、本明細書に記載する技術は、1つ又は複数の特殊目的コンピューティングデバイスによって実施される。特殊目的コンピューティングデバイスは、この技術を実行するようにハードワイヤードにしてもよいし、この技術を実行するように永続的にプログラムされた1つ又は複数の特定用途向け集積回路(ASIC)又はフィールドプログラマブルゲートアレイ(FPGA)などのデジタル電子デバイスを含んでいてもよく、或いはファームウェア、メモリ、その他の記憶装置又はそれらの組合せに格納したプログラム命令に従ってこの技術を実行するようにプログラムされた1つ又は複数の汎用ハードウェアプロセッサを含んでいてもよい。このような特殊目的コンピューティングデバイスは、カスタムハードワイヤード論理、ASIC又はFPGAを、カスタムプログラミングと組み合わせて、この技術を実施することもできる。特殊目的コンピューティングデバイスは、デスクトップコンピューティングデバイス、ポータブルコンピューティングデバイス、手持ち型デバイス、ネットワークデバイス、或いはこの技術を実施するハードワイヤード論理及び/又はプログラム論理を組み込むその他の任意のデバイスとすることができる。
例えば、図12は、本発明の例示的な実施形態を実施することができるコンピュータシステム1200を示すブロック図である。コンピュータシステム1200は、情報を通信するためのバス1202又はその他の通信機構と、情報を処理するためのバス1202と結合されたハードウェアプロセッサ1204とを含む。ハードウェアプロセッサ1204は、例えば汎用マイクロプロセッサとすることができる。
また、コンピュータシステム1200は、情報及びプロセッサ1204によって実行される命令を格納するための、バス1202に結合されたランダムアクセスメモリ(RAM)又はその他の動的記憶デバイスなどのメインメモリ1206も含む。メインメモリ1206は、プロセッサ1204によって実行される命令の実行中に一時的な変数又はその他の中間情報を格納するために使用することもできる。このような命令は、プロセッサ1204がアクセス可能な非一時的な記憶媒体に格納すると、コンピュータシステム1200を、それらの命令に指定された動作を実行するようにカスタマイズされた特殊目的マシンにする。
コンピュータシステム1200は、プロセッサ1204用の静的情報及び命令を格納するための、バス1202に結合された読取り専用メモリ(ROM)1208又はその他の静的記憶デバイスをさらに含む。磁気ディスク又は光ディスクなどの記憶デバイス1210が設けられ、バス1202に結合されて、情報及び命令を格納する。
コンピュータシステム1200は、バス1202を介して、コンピュータのユーザに対して情報を表示するための液晶ディスプレイなどのディスプレイ1212に結合することができる。英数字又はその他のキーを含む入力デバイス1214が、バス1202に結合されて、情報及びコマンド選択をプロセッサ1204に通信する。別のタイプのユーザ入力デバイスは、方向情報及びコマンド選択をプロセッサ1204に通信し、ディスプレイ1212上のカーソル移動を制御するための、マウス、トラックボール又はカーソル方向キーなどのカーソル制御装置1216である。この入力デバイスは、通常は、デバイスが平面内で位置を指定することを可能にする、2つの軸、すなわち第1の軸(例えばx)及び第2の軸(例えばy)の方向の2つの自由度を有する。
コンピュータシステム1200は、そのコンピュータシステムと組み合わせたときにそのコンピュータシステム1200を特殊目的マシンにする、又は特殊目的マシンとなるようにプログラムする、カスタマイズハードワイヤード論理、1つ又は複数のASIC又はFPGA、ファームウェア及び/或いはプログラム論理を用いて、本明細書に記載する技術を実施することができる。一実施形態によれば、本明細書の技術は、プロセッサ1204がメインメモリ1206に収容された1つ又は複数の命令の1つ又は複数のシーケンスを実行したのに応答して、コンピュータシステム1200によって実行される。このような命令は、記憶デバイス1210などの別の記憶媒体からメインメモリ1206に読み込むことができる。メインメモリ1206に収容された命令のシーケンスを実行すると、プロセッサ1204が、本明細書に記載するプロセスステップを実行する。代替の実施形態では、ソフトウェア命令の代わりに、又はソフトウェア命令と組み合わせて、ハードワイヤード回路を使用することができる。
本明細書で使用する「記憶媒体」という用語は、マシンを特定の様式で動作させるデータ及び/又は命令を格納する任意の非一時的媒体を指す。このような記憶媒体は、不揮発性媒体及び/又は揮発性媒体を含むことができる。不揮発性媒体としては、例えば、記憶デバイス1210などの光ディスク又は磁気ディスクが挙げられる。揮発性媒体としては、メインメモリ1206などの動的メモリが挙げられる。一般的な形態の記憶媒体としては、例えば、フロッピーディスク、フレキシブルディスク、ハードディスク、固体状態ドライブ、磁気テープ又はその他の任意の磁気データ記憶媒体、CD−ROM又はその他の任意の光学データ記憶媒体、穴のパターンを有する任意の物理媒体、RAM、PROM及びEPROM、フラッシュEPROM、NVRAM、或いはその他の任意のメモリチップ又はカートリッジなどが挙げられる。
記憶媒体は、伝送媒体とは異なるが、これと協働して使用することができる。伝送媒体は、記憶媒体間での情報の転送に関わる。例えば、伝送媒体としては、バス1202を構成するワイヤなどの、同軸ケーブル、銅線及び光ファイバなどが挙げられる。伝送媒体は、無線波データ通信及び赤外線データ通信中に生成されるような音波又は光波の形態をとることもできる。
様々な形態の媒体が、1つ又は複数の命令の1つ又は複数のシーケンスを実行するためにプロセッサ1204に搬送するのに関わる可能性がある。例えば、これらの命令は、最初に磁気ディスク又は遠隔のコンピュータの固体状態ドライブで搬送することができる。遠隔のコンピュータは、命令をその動的メモリにロードし、モデムを用いて電話回線を介して送信することができる。コンピュータシステム1200のローカルなモデムは、電話回線を介してデータを受信し、赤外線送信機を使用してこのデータを赤外線信号に変換することができる。赤外線検出器は、赤外線信号に含めて搬送されるデータを受信することができ、適当な回路が、このデータをバス1202上に配置することができる。バス1202は、このデータをメインメモリ1206に搬送し、このメインメモリ1206からプロセッサ1204が命令を取り出して実行する。メインメモリ1206が受信した命令は、必要に応じて、プロセッサ1204が実行する前又は後に、記憶デバイス1210に格納することができる。
また、コンピュータシステム1200は、バス1202に結合された通信インタフェース1218も含む。通信インタフェース1218は、ローカルネットワーク1222に結合されたネットワークリンク1220に結合する2方向データ通信を提供する。例えば、通信インタフェース1218は、統合サービスデジタルネットワーク(ISDN)カード、ケーブルモデム、衛星モデム、又は対応するタイプの電話回線へのデータ通信接続を提供するモデムとすることができる。別の例示的な通信インタフェース1218は、互換性のあるLANへのデータ通信接続を提供するローカルエリアネットワーク(LAN)カードとすることができる。ワイヤレスリンクを実行することもできる。このようないずれの実施態様においても、通信インタフェース1218は、様々なタイプの情報を表すデジタルデータストリームを搬送する電気信号、電磁気信号又は光信号を送信及び受信する。
ネットワークリンク1220は、通常は、1つ又は複数のネットワークを介してその他のデータデバイスへのデータ通信を提供する。例えば、ネットワークリンク1220は、ローカルネットワーク1222を介してホストコンピュータ1224又はインターネットサービスプロバイダ(ISP)1226によって運用されるデータ機器への接続を提供することができる。ISP1226は、現在一般に「インターネット」1228と呼ばれるワールドワイドパケットデータ通信ネットワークを介して、データ通信サービスを提供する。ローカルネットワーク1222及びインターネット1228は両方とも、デジタルデータストリームを搬送する電気信号、電磁気信号又は光信号を使用する。コンピュータシステム1200との間でデジタルデータを搬送する、様々なネットワークを通る信号及び通信インタフェース1218を通るネットワークリンク1220上の信号は、伝送媒体の例示的な形態である。
コンピュータシステム1200は、1つ又は複数のネットワーク、ネットワークリンク1220及び通信インタフェース1218を介してメッセージを送信し、プログラムコードなどのデータを受信することができる。インターネットの例では、サーバ1230は、インターネット1228、ISP1226、ローカルネットワーク1222及び通信インタフェース1218を介してアプリケーションプログラムの要求されたコードを伝送することもある。
受信したコードは、受信時にプロセッサ1204が実行することができ、かつ/或いは記憶デバイス1210又はその他の不揮発性記憶装置に格納して後に実行することもできる。
10.等価形態、拡張形態、代替形態など
以上の明細書では、実施態様によって変わる可能性がある多数の具体的な詳細を参照して、本発明の例示的な実施形態について説明した。したがって、何が本発明であるか、また出願人が何を以て本発明としようと意図しているかを示す唯一かつ排他的な指標は、後のいかなる訂正も含めてこれらの特許請求の範囲がとる特定の形態における、本願から生じる特許請求の範囲である。これらの特許請求の範囲に含まれる用語について本明細書に明記した任意の定義は、特許請求の範囲で用いるそれらの用語の意味を支配するものとする。したがって、請求項に明記されていない制限、要素、性質、特徴、利点又は属性は、いかなる形でもその請求項の範囲を制限しないものとする。本明細書及び図面は、したがって、制限的なものではなく例示的なものとみなすべきものである。

Claims (15)

  1. 入力視覚ダイナミックレンジ(VDR)画像及び前記入力VDR画像と関連する入力基本レイヤ(BL)画像を受信するステップであって、前記BL画像は標準的ダイナミックレンジ(SDR)画像を表す、ステップと、
    少なくともフレームレベルの複数のシンタックス要素を含む、符号化関連動作のためのコード化シンタックスを生成するステップであって、前記コード化シンタックスは、複数の異なるVDRバージョンのうちの1つに従い、前記複数の異なるVDRバージョンは、異なるシンタックス要素を有する、ステップと、
    前記コード化シンタックスに従って、前記入力BL画像及び前記入力VDR画像をBLデータ及び拡張レイヤ(EL)データに変換するステップであり、前記ELデータが、前記入力VDR画像と前記BLデータに基づいて生成される予測VDR画像との間の残差値を含み、前記複数のシンタックス要素が、前記BLデータ及び前記ELデータを生成するために実行される、クロマ・リサンプリング動作、SDRからVDRへの逆マッピング動作、非重複領域に基づくレイヤ間予測動作、重複領域に基づくレイヤ間予測動作、剰余非線形量子化及び逆量子化動作、残差クロマ・リサンプリング動作、残差空間的アップサンプリング動作、補間のうちの1つ又は複数を指定する、ステップと、
    対応するデコーダが復号関連動作に前記コード化シンタックスを使用できるように前記コード化シンタックスのシンタックス要素を参照処理ユニット(RPU)データに符号化するステップであり、現在のRPUデータ・ユニットは、前記複数の異なるVDRバージョンのうちの1つをサポートできるデータ構造を有し、前記現在のRPUデータ・ユニットは、前記コード化シンタックスが従う個々のVDRバージョンを示し、前記RPUデータが、現在のRPUデータ・ユニットを含み、前記現在のRPUデータ・ユニットが、RPUデータ・ヘッダ及びRPUデータ・ペイロードを含み、前記シンタックス要素は、1又は複数のパラメータ、係数、ピボット値、フラグに対応する動作の有無を示すフラグを含む、ステップと、
    前記BLデータ、前記ELデータ及び前記RPUデータをBL信号、EL信号及びRPU信号に含めて出力するステップと、
    を含み、
    前記現在のRPUデータ・ユニットが、以前に送信されたRPUデータのフレーム・レベルのシンタックス要素を再利用すべきかどうかを示すフラグを含み、前記RPUデータ内に含まれる前記コード化シンタックスによって、前記BLデータ及び前記ELデータに基づく前記入力VDR画像の再構築が可能になる、方法。
  2. 前記現在のRPUデータ・ユニットにおいて、前記コード化シンタックスの前記複数のシンタックス要素のうちの少なくとも1つのシンタックス要素が前記現在のRPUデータ・ユニットのうちの1つ又は複数のその他のパーティションから予測可能であることを示すステップをさらに含む、請求項1に記載の方法。
  3. 前記現在のRPUデータ・ユニットにおいて、前記コード化シンタックスの前記複数のシンタックス要素のうちの少なくとも1つのシンタックス要素が、以前の入力VDR画像及び前記以前のVDR画像と関連する以前の入力BL画像についての1つ又は複数の以前のRPUデータ・ユニットから予測可能であることを示すステップをさらに含む、請求項1に記載の方法。
  4. 前記入力VDR画像及び前記以前の入力VDR画像が、入力VDR画像のシーケンスに属し、前記入力VDR画像のシーケンスが、共通の1組のシーケンスレベルのシンタックス要素のセットを共有する、請求項3に記載の方法。
  5. 前記入力VDR画像及び前記以前の入力VDR画像が、入力VDR画像の2つの異なるシーケンスに属し、前記2つの異なる入力VDR画像のシーケンスのうちの第1のシーケンスが、シーケンスレベルのシンタックス要素の第1の共通のセットを共有し、前記2つの異なる入力VDR画像のシーケンスのうちの第2のシーケンスが、前記第1の共通のセットとは異なるシーケンスレベルのシンタックス要素の第2の共通のセットを共有する、請求項3に記載の方法。
  6. 前記複数のシンタックス要素のうちの少なくとも1つのシンタックス要素が、1つ又は複数のシーケンスレベル、1つ又は複数のフレームレベル或いは1つ又は複数のパーティションレベルのうちの2つ以上のシンタックス要素として使用可能である、請求項1に記載の方法。
  7. 前記ELデータが、入力VDR画像のシーケンスの2つ以上の入力VDR画像のレイヤ間参照ピクチャを含み、前記2つ以上の入力VDR画像が、前記入力VDR画像を含む、請求項1に記載の方法。
  8. 前記入力VDR画像が、入力色空間で符号化された画像データを含み、前記ELデータが、出力色空間で符号化された画像データを含み、前記ELデータが、少なくとも部分的にはマッピングされたデータに基づいて生成され、前記マッピングされたデータが、少なくとも部分的には前記BLデータに基づいて生成され、前記マッピングされたデータが、マッピングされた色空間で符号化されたマッピングされた画像データを含む、請求項1に記載の方法。
  9. 前記入力色空間、前記出力色空間、前記マッピングされた色空間、又はコード化色空間のうちの少なくとも2つが異なる色空間である、請求項8に記載の方法。
  10. 前記入力色空間、前記出力色空間、前記マッピングされた色空間、又はコード化色空間のうちの少なくとも2つが同じ色空間である、請求項8に記載の方法。
  11. 前記ELデータが、第1のクロマフォーマットで符号化された画像データを含み、前記BLデータが、前記第1のクロマフォーマットとは異なる第2のクロマフォーマットで符号化された画像データを含む、請求項1に記載の方法。
  12. 前記ELデータが、あるクロマフォーマットで符号化された画像データを含み、前記BLデータが、同じクロマフォーマットで符号化された画像データを含む、請求項1に記載の方法。
  13. 基本レイヤ(BL)信号、拡張レイヤ(EL)信号及び参照処理ユニット(RPU)信号に含まれるBLデータ、ELデータ及びRPUデータを受信するステップであり、前記BLデータ、前記ELデータ及び前記RPUデータが共通の視覚ダイナミックレンジ(VDR)ソース画像と関連づけられ、前記ELデータが、前記VDRソース画像と前記BLデータに基づいて生成される予測VDR画像との間の残差値を含み、前記BLデータは標準的ダイナミックレンジ(SDR)画像を表す、ステップと、
    前記RPUデータを復号して、少なくともフレームレベルの複数のシンタックス要素を含むコード化シンタックスにするステップであって、前記コード化シンタックスは、複数の異なるVDRバージョンのうちの1つに従い、前記複数の異なるVDRバージョンは、異なるシンタックス要素を有し、前記RPUデータが、現在のRPUデータ・ユニットを含み、前記現在のRPUデータ・ユニットから、前記コード化シンタックスが従う個々のVDRバージョンを決定し、前記複数のシンタックス要素が、前記BLデータ及び前記ELデータを生成するために実行される、クロマ・リサンプリング動作、SDRからVDRへの逆マッピング動作、非重複領域に基づくレイヤ間予測動作、重複領域に基づくレイヤ間予測動作、剰余非線形量子化及び逆量子化動作、残差クロマ・リサンプリング動作、残差空間的アップサンプリング動作、補間のうちの1つ又は複数を指定する、ステップと、
    前記コード化シンタックスに従って前記BLデータ及び前記ELデータを再構築したVDR画像に変換するステップであり、現在のRPUデータ・ユニットは、前記複数の異なるVDRバージョンのうちの1つをサポートできるデータ構造を有し、前記シンタックス要素は、1又は複数のパラメータ、係数、ピボット値、フラグに対応する動作の有無を示すフラグを含み、前記現在のRPUデータ・ユニットが、RPUデータ・ヘッダ及びRPUデータ・ペイロードを含み、前記現在のRPUデータ・ユニットが、以前に送信されたRPUデータのフレーム・レベルのシンタックス要素を再利用すべきかどうかを示すフラグを含み、前記RPUデータ内に含まれる前記コード化シンタックスによって、前記BLデータ及び前記ELデータに基づく前記再構築したVDR画像の決定が可能になるステップと、
    前記再構築したVDR画像を出力するステップとを含む、方法。
  14. 請求項1から12に記載の方法のいずれかを実行するエンコーダ。
  15. 請求項13に記載の方法を実行するデコーダ。
JP2014551263A 2012-01-03 2012-12-18 視覚ダイナミックレンジコード化動作及びパラメータの指定 Active JP5989800B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201261582614P 2012-01-03 2012-01-03
US61/582,614 2012-01-03
PCT/US2012/070397 WO2013103522A1 (en) 2012-01-03 2012-12-18 Specifying visual dynamic range coding operations and parameters

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2016157088A Division JP6219464B2 (ja) 2012-01-03 2016-08-10 高ダイナミックレンジ画像を生成するデコーダ及びその方法

Publications (2)

Publication Number Publication Date
JP2015503873A JP2015503873A (ja) 2015-02-02
JP5989800B2 true JP5989800B2 (ja) 2016-09-07

Family

ID=47436287

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2014551263A Active JP5989800B2 (ja) 2012-01-03 2012-12-18 視覚ダイナミックレンジコード化動作及びパラメータの指定
JP2016157088A Active JP6219464B2 (ja) 2012-01-03 2016-08-10 高ダイナミックレンジ画像を生成するデコーダ及びその方法

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2016157088A Active JP6219464B2 (ja) 2012-01-03 2016-08-10 高ダイナミックレンジ画像を生成するデコーダ及びその方法

Country Status (8)

Country Link
US (2) US10136162B2 (ja)
EP (1) EP2801192B1 (ja)
JP (2) JP5989800B2 (ja)
KR (2) KR101697149B1 (ja)
CN (2) CN107896332B (ja)
HK (2) HK1203013A1 (ja)
TW (2) TWI556629B (ja)
WO (1) WO2013103522A1 (ja)

Families Citing this family (57)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9979960B2 (en) 2012-10-01 2018-05-22 Microsoft Technology Licensing, Llc Frame packing and unpacking between frames of chroma sampling formats with different chroma resolutions
US9485508B2 (en) 2013-04-08 2016-11-01 Qualcomm Incorporated Non-entropy encoded set of profile, tier, and level syntax structures
TWI676389B (zh) * 2013-07-15 2019-11-01 美商內數位Vc專利控股股份有限公司 至少一種色彩轉換之編碼方法和編碼器、解碼器、顯示裝置、編碼視訊訊號、電腦程式製品及處理器可讀式媒體
CN105409203B (zh) 2013-07-30 2018-07-31 杜比实验室特许公司 用于产生场景稳定元数据的***和方法
US9264683B2 (en) 2013-09-03 2016-02-16 Sony Corporation Decoding device and decoding method, encoding device, and encoding method
TWI713355B (zh) * 2013-09-03 2020-12-11 日商新力股份有限公司 解碼裝置、解碼方法、顯示裝置、及顯示方法
US9036908B2 (en) * 2013-09-30 2015-05-19 Apple Inc. Backwards compatible extended image format
US9648351B2 (en) 2013-10-24 2017-05-09 Dolby Laboratories Licensing Corporation Error control in multi-stream EDR video codec
BR112016015256B1 (pt) * 2014-01-07 2023-12-19 Dolby Laboratories Licensing Corporation Método, aparelho e mídia legível por computador para decodificar uma imagem de alta faixa dinâmica - hdr - no formato jpeg, e método, aparelho e mídia legível por computador para codificar uma imagem de alta faixa dinâmica - hdr - no formato jpeg
EP3105926B1 (en) 2014-02-13 2018-04-11 Dolby International AB Piecewise inter-layer prediction for signals with enhanced dynamic range
EP4087247A1 (en) 2014-02-26 2022-11-09 Dolby Laboratories Licensing Corp. Luminance based coding tools for video compression
US10271052B2 (en) 2014-03-14 2019-04-23 Qualcomm Incorporated Universal color-space inverse transform coding
US10136147B2 (en) 2014-06-11 2018-11-20 Dolby Laboratories Licensing Corporation Efficient transcoding for backward-compatible wide dynamic range codec
US10021411B2 (en) * 2014-11-05 2018-07-10 Apple Inc. Techniques in backwards compatible multi-layer compression of HDR video
JP6601729B2 (ja) * 2014-12-03 2019-11-06 パナソニックIpマネジメント株式会社 データ生成方法、データ再生方法、データ生成装置及びデータ再生装置
US9854201B2 (en) 2015-01-16 2017-12-26 Microsoft Technology Licensing, Llc Dynamically updating quality to higher chroma sampling rate
US9749646B2 (en) * 2015-01-16 2017-08-29 Microsoft Technology Licensing, Llc Encoding/decoding of high chroma resolution details
KR102117522B1 (ko) 2015-01-19 2020-06-01 돌비 레버러토리즈 라이쎈싱 코오포레이션 높은 동적 범위 비디오에 대한 디스플레이 관리
US10666990B2 (en) 2015-01-30 2020-05-26 Interdigital Vc Holdings, Inc. Method and device for matching colors between color pictures of different dynamic range
EP4089627A3 (en) 2015-01-30 2022-12-28 InterDigital VC Holdings, Inc. A method and apparatus of encoding and decoding a color picture
EP3051821A1 (en) * 2015-01-30 2016-08-03 Thomson Licensing Method and apparatus for encoding and decoding high dynamic range (HDR) videos
EP3051818A1 (en) * 2015-01-30 2016-08-03 Thomson Licensing Method and device for decoding a color picture
US10148969B2 (en) * 2015-02-11 2018-12-04 Qualcomm Incorporated Of sample entry and operation point signalling in a layered video file format
KR101954851B1 (ko) * 2015-02-16 2019-03-06 삼성전자주식회사 메타데이터 기반 영상 처리 방법 및 장치
RU2661309C1 (ru) * 2015-02-17 2018-07-13 Долби Лэборетериз Лайсенсинг Корпорейшн Межслойное предсказание для сигналов с улучшенным динамическим диапазоном
US20160286224A1 (en) * 2015-03-26 2016-09-29 Thomson Licensing Method and apparatus for generating color mapping parameters for video encoding
EP3076669A1 (en) * 2015-04-03 2016-10-05 Thomson Licensing Method and apparatus for generating color mapping parameters for video encoding
WO2016164235A1 (en) 2015-04-06 2016-10-13 Dolby Laboratories Licensing Corporation In-loop block-based image reshaping in high dynamic range video coding
WO2016171510A1 (ko) * 2015-04-24 2016-10-27 엘지전자 주식회사 방송 신호 송수신 방법 및 장치
EP3104609A1 (en) * 2015-06-08 2016-12-14 Thomson Licensing Method and apparatus for color gamut scalability (cgs) video encoding with artifact detection
WO2016198325A1 (en) * 2015-06-08 2016-12-15 Thomson Licensing Method and apparatus for color gamut scalability (cgs) video encoding with artifact detection
EP3113496A1 (en) 2015-06-30 2017-01-04 Thomson Licensing Method and device for encoding both a hdr picture and a sdr picture obtained from said hdr picture using color mapping functions
EP3323243B1 (en) 2015-07-16 2022-01-19 Dolby Laboratories Licensing Corporation Signal reshaping and decoding for hdr signals
JP6626573B2 (ja) * 2015-11-02 2019-12-25 ドルビー ラボラトリーズ ライセンシング コーポレイション ハイダイナミックレンジ映像の、crcコードを含むレイヤ表現および配信
GB2547934B (en) * 2016-03-03 2021-07-07 V Nova Int Ltd Adaptive video quality
KR102385726B1 (ko) * 2016-05-04 2022-04-12 인터디지털 브이씨 홀딩스 인코포레이티드 하이 다이내믹 레인지 화상을 코딩된 비트스트림으로 인코딩/디코딩하기 위한 방법 및 장치
US20190132600A1 (en) * 2016-05-04 2019-05-02 Thomson Licensing Method and apparatus for encoding/decoding a scalar integer into a parameter representative of a pivot points of a piece-wise linear function
PL3745390T3 (pl) * 2016-05-27 2024-03-04 Dolby Laboratories Licensing Corporation Przechodzenie pomiędzy priorytetem wideo a priorytetem grafiki
JP6769231B2 (ja) * 2016-10-17 2020-10-14 富士通株式会社 動画像符号化装置、動画像符号化方法、動画像復号装置、動画像復号方法、及び動画像符号化用コンピュータプログラムならびに動画像復号用コンピュータプログラム
US10368080B2 (en) 2016-10-21 2019-07-30 Microsoft Technology Licensing, Llc Selective upsampling or refresh of chroma sample values
US10666937B2 (en) 2016-12-21 2020-05-26 Qualcomm Incorporated Low-complexity sign prediction for video coding
TWI723123B (zh) * 2017-01-23 2021-04-01 香港商斑馬智行網絡(香港)有限公司 圖像融合的方法、裝置和設備
EP3609182A4 (en) 2017-04-06 2020-04-08 Panasonic Intellectual Property Corporation of America ENCODING DEVICE AND METHOD, DECODING DEVICE AND METHOD
WO2020044253A1 (en) 2018-08-28 2020-03-05 Beijing Bytedance Network Technology Co., Ltd. Redundancy removal of partitioning methods
WO2020089583A1 (en) * 2018-10-09 2020-05-07 V-Nova International Limited Signal element coding format compatability within a hierarchical coding scheme using multiple resolutions
GB201817781D0 (en) * 2018-10-31 2018-12-19 V Nova Int Ltd Mehods, apparatuses, computer programs and computer-readable media
CN111491168A (zh) * 2019-01-29 2020-08-04 华为软件技术有限公司 视频编解码方法、解码器、编码器和相关设备
US11425378B2 (en) 2019-01-31 2022-08-23 Hfi Innovation Inc. Method and apparatus of transform type assignment for intra sub-partition in video coding
EP3931803A1 (en) 2019-02-27 2022-01-05 3Shape A/S Method for generating objects using an hourglass predictor
CN113632481B (zh) * 2019-03-15 2023-12-26 寰发股份有限公司 色度残差缩放的延迟降低方法和装置
WO2020223496A1 (en) * 2019-04-30 2020-11-05 Beijing Dajia Internet Informationtechnology Co., Ltd. Methods and apparatus of joint coding of chroma residuals
TWI812874B (zh) * 2019-10-01 2023-08-21 美商杜拜研究特許公司 張量乘積之b平滑曲線預測子
CN111337133B (zh) * 2020-03-02 2021-08-03 浙江大华技术股份有限公司 红外数据的生成方法及装置、解析方法及装置
EP4341903A1 (en) 2021-05-21 2024-03-27 Dolby Laboratories Licensing Corporation Patch-based reshaping and metadata for volumetric video
WO2023033991A1 (en) 2021-08-30 2023-03-09 Dolby Laboratories Licensing Corporation Reshaper for learning-based image/video coding
AU2022344154A1 (en) * 2021-09-09 2024-03-28 Dolby Laboratories Licensing Corporation Tensor-product b-spline prediction for hdr video in mobile applications
CN118202645A (zh) * 2022-06-30 2024-06-14 北京小米移动软件有限公司 一种ai模型的传输方法及其装置

Family Cites Families (38)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8218625B2 (en) 2004-04-23 2012-07-10 Dolby Laboratories Licensing Corporation Encoding, decoding and representing high dynamic range images
US20050259729A1 (en) * 2004-05-21 2005-11-24 Shijun Sun Video coding with quality scalability
JP2006135521A (ja) 2004-11-04 2006-05-25 Ricoh Co Ltd 画像処理装置、画像処理方法、プログラム及び情報記録媒体
WO2007018688A1 (en) * 2005-07-22 2007-02-15 Thomson Licensing Method and apparatus for weighted prediction for scalable video coding
US8014445B2 (en) * 2006-02-24 2011-09-06 Sharp Laboratories Of America, Inc. Methods and systems for high dynamic range video coding
US8194997B2 (en) * 2006-03-24 2012-06-05 Sharp Laboratories Of America, Inc. Methods and systems for tone mapping messaging
JP4384130B2 (ja) * 2006-03-28 2009-12-16 株式会社東芝 動画像復号方法及び装置
JP4991851B2 (ja) 2006-07-17 2012-08-01 トムソン ライセンシング ビデオ色向上データをエンコードする方法および装置ならびにビデオ色向上データをデコードする方法および装置
WO2008027192A2 (en) * 2006-08-25 2008-03-06 Thomson Licensing Methods and apparatus for reduced resolution partitioning
WO2008049446A1 (en) * 2006-10-25 2008-05-02 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Quality scalable coding
US8237865B2 (en) 2006-12-18 2012-08-07 Emanuele Salvucci Multi-compatible low and high dynamic range and high bit-depth texture and video encoding system
WO2008088497A2 (en) * 2006-12-21 2008-07-24 Thomson Licensing Methods and apparatus for improved signaling using high level syntax for multi-view video coding and decoding
US20110228855A1 (en) * 2006-12-25 2011-09-22 Yongying Gao Device for Encoding Video Data, Device for Decoding Video Data, Stream of Digital Data
WO2008083521A1 (en) 2007-01-10 2008-07-17 Thomson Licensing Video encoding method and video decoding method for enabling bit depth scalability
US7826673B2 (en) 2007-01-23 2010-11-02 Sharp Laboratories Of America, Inc. Methods and systems for inter-layer image prediction with color-conversion
JP2010525658A (ja) * 2007-04-19 2010-07-22 トムソン ライセンシング イントラ予測のための適応参照画像データ生成
TW200845723A (en) * 2007-04-23 2008-11-16 Thomson Licensing Method and apparatus for encoding video data, method and apparatus for decoding encoded video data and encoded video signal
KR101366249B1 (ko) * 2007-06-28 2014-02-21 삼성전자주식회사 스케일러블 영상 부호화장치 및 방법과 그 영상 복호화장치및 방법
JP4687918B2 (ja) 2007-07-24 2011-05-25 富士ゼロックス株式会社 画像処理装置及びプログラム
WO2009023091A2 (en) * 2007-08-15 2009-02-19 Thomson Licensing Methods and apparatus for motion skip mode in multi-view coded video using regional disparity vectors
KR101365596B1 (ko) 2007-09-14 2014-03-12 삼성전자주식회사 영상 부호화장치 및 방법과 그 영상 복호화장치 및 방법
BRPI0818648A2 (pt) * 2007-10-15 2015-04-07 Thomson Licensing Métodos e aparelho para predição de resíduo interchamadas para vídeo escalável
KR101365597B1 (ko) 2007-10-24 2014-02-20 삼성전자주식회사 영상 부호화장치 및 방법과 그 영상 복호화장치 및 방법
US8175158B2 (en) * 2008-01-04 2012-05-08 Sharp Laboratories Of America, Inc. Methods and systems for inter-layer image prediction parameter determination
US8542748B2 (en) * 2008-03-28 2013-09-24 Sharp Laboratories Of America, Inc. Methods and systems for parallel video encoding and decoding
HUE031487T2 (en) * 2008-04-16 2017-07-28 Ge Video Compression Llc Bit depth scalability
US8897359B2 (en) * 2008-06-03 2014-11-25 Microsoft Corporation Adaptive quantization for enhancement layer video coding
JP5462259B2 (ja) * 2008-07-16 2014-04-02 シズベル インターナショナル エス.アー. トラックおよびトラックサブセットグループ化の方法および装置
US9571856B2 (en) 2008-08-25 2017-02-14 Microsoft Technology Licensing, Llc Conversion operations in scalable video encoding and decoding
TW201032597A (en) * 2009-01-28 2010-09-01 Nokia Corp Method and apparatus for video coding and decoding
BRPI1008372A2 (pt) 2009-02-11 2018-03-06 Thomson Licensing métodos e aparelho para codificação e decodificação de vídeo escalável com profundidade de bit utilizando mapeamento de tons e mapeamento inverso de tons
US20100226437A1 (en) * 2009-03-06 2010-09-09 Sony Corporation, A Japanese Corporation Reduced-resolution decoding of avc bit streams for transcoding or display at lower resolution
JP5589006B2 (ja) * 2009-03-13 2014-09-10 ドルビー ラボラトリーズ ライセンシング コーポレイション 高ダイナミックレンジ、視覚ダイナミックレンジ及び広色域のビデオの階層化圧縮
WO2011126759A1 (en) * 2010-04-09 2011-10-13 Sony Corporation Optimal separable adaptive loop filter
US9154807B2 (en) 2010-06-25 2015-10-06 Qualcomm Incorporated Inclusion of switched interpolation filter coefficients in a compressed bit-stream
TWI559779B (zh) 2010-08-25 2016-11-21 杜比實驗室特許公司 擴展影像動態範圍
US9282314B2 (en) * 2011-02-24 2016-03-08 Vixs Systems, Inc. Stereoscopic video processing with separable 2D filter
US8767824B2 (en) * 2011-07-11 2014-07-01 Sharp Kabushiki Kaisha Video decoder parallelization for tiles

Also Published As

Publication number Publication date
TW201642656A (zh) 2016-12-01
EP2801192A1 (en) 2014-11-12
CN107896332A (zh) 2018-04-10
KR20160029134A (ko) 2016-03-14
CN104041036B (zh) 2018-02-02
HK1251970A1 (zh) 2019-05-10
TW201347542A (zh) 2013-11-16
CN104041036A (zh) 2014-09-10
JP2015503873A (ja) 2015-02-02
EP2801192B1 (en) 2018-09-26
JP6219464B2 (ja) 2017-10-25
WO2013103522A1 (en) 2013-07-11
TWI606718B (zh) 2017-11-21
CN107896332B (zh) 2019-11-15
KR101697149B1 (ko) 2017-01-17
KR20140120320A (ko) 2014-10-13
US10587897B2 (en) 2020-03-10
JP2016208542A (ja) 2016-12-08
US20140341305A1 (en) 2014-11-20
TWI556629B (zh) 2016-11-01
HK1203013A1 (en) 2015-10-09
US20170164008A1 (en) 2017-06-08
US10136162B2 (en) 2018-11-20

Similar Documents

Publication Publication Date Title
JP6219464B2 (ja) 高ダイナミックレンジ画像を生成するデコーダ及びその方法
CN113168718B (zh) 视频解码方法、装置和存储介质
JP5143829B2 (ja) スケーラブルビデオコーディングされたビットストリームのデコーディング方法及び装置
KR101641523B1 (ko) 다층 vdr 코딩에서의 지각적으로-양자화된 비디오 콘텐트의 인코딩
KR102607887B1 (ko) 인트라 예측 방법 및 그 장치
JP2022125049A (ja) 符号化方法及び機器
CN112868184A (zh) 网络抽象层单元头中的网络抽象单元层类型类
CN112889279A (zh) 视频编解码方法及装置
JP2023508060A (ja) ビデオコーディングのためのクロスコンポーネント適応ループフィルタリング
CN114205601A (zh) 编解码视频中的解码器配置记录
JP2022521992A (ja) ビデオコーディングのための方法、装置及びコンピュータプログラム
CN113678457A (zh) 视频流中的具有子区域划分的填充处理方法
US20170214924A1 (en) Self-adaptive prediction method for multi-layer codec
JP2022521199A (ja) ビデオビットストリームにおけるレイヤ間予測の信号伝達
JP2023515626A (ja) エンコーダ、デコーダ、および対応するシグナリングの方法、ならびにパラメータセット内のセマンティクス
KR20220127351A (ko) 하이 레벨 신택스를 시그널링하는 것에 관한 인코더, 디코더 및 대응하는 방법
JP2022531338A (ja) 参照ピクチャ・リサンプリングをリサンプリング・ピクチャ・サイズ指示とともにビデオ・ビットストリームでシグナリングすること
KR20220156069A (ko) 인코더, 디코더 및 대응하는 방법
CN115836521A (zh) 信令通知不可缩放嵌套的视频语法元素中的约束
JP2023542227A (ja) 補助情報のシグナリング
CN114514742A (zh) 采用已编码视频流中的子图片进行信号发送的用信号发送虚拟边界的方法
RU2773642C1 (ru) Сигнализация для передискретизации опорного изображения
KR20220154792A (ko) 인코더, 디코더 및 대응하는 방법

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150929

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20151224

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160315

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160613

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20160712

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160810

R150 Certificate of patent or registration of utility model

Ref document number: 5989800

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250