JP6449329B2 - ディスプレイストリーム圧縮(dsc)において量子化パラメータ(qp)を選択するためのシステムおよび方法 - Google Patents

ディスプレイストリーム圧縮(dsc)において量子化パラメータ(qp)を選択するためのシステムおよび方法 Download PDF

Info

Publication number
JP6449329B2
JP6449329B2 JP2016562506A JP2016562506A JP6449329B2 JP 6449329 B2 JP6449329 B2 JP 6449329B2 JP 2016562506 A JP2016562506 A JP 2016562506A JP 2016562506 A JP2016562506 A JP 2016562506A JP 6449329 B2 JP6449329 B2 JP 6449329B2
Authority
JP
Japan
Prior art keywords
current block
determining
video data
bits
video
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2016562506A
Other languages
English (en)
Other versions
JP2017515378A5 (ja
JP2017515378A (ja
Inventor
ティルマライ、ビジャヤラグハバン
ジェイコブソン、ナタン・ハイム
ジョシ、ラジャン・ラクスマン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qualcomm Inc
Original Assignee
Qualcomm Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qualcomm Inc filed Critical Qualcomm Inc
Publication of JP2017515378A publication Critical patent/JP2017515378A/ja
Publication of JP2017515378A5 publication Critical patent/JP2017515378A5/ja
Application granted granted Critical
Publication of JP6449329B2 publication Critical patent/JP6449329B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/15Data rate or code amount at the encoder output by monitoring actual compressed data size at the memory before deciding storage at the transmission buffer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/152Data rate or code amount at the encoder output by measuring the fullness of the transmission buffer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/174Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a slice, e.g. a line of blocks or a group of blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/42Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
    • H04N19/423Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation characterised by memory arrangements

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Storage Device Security (AREA)

Description

[0001]本開示は、ビデオコーディングおよび圧縮の分野に関し、詳細には、ディスプレイストリーム圧縮(DSC:display stream compression)など、ディスプレイリンクを介した送信のためのビデオ圧縮に関する。
[0002]デジタルビデオ機能は、デジタルテレビジョン、携帯情報端末(PDA)、ラップトップコンピュータ、デスクトップモニタ、デジタルカメラ、デジタル記録デバイス、デジタルメディアプレーヤ、ビデオゲームデバイス、ビデオゲームコンソール、セルラー電話または衛星無線電話、ビデオ遠隔会議デバイスなどを含む、広範囲にわたるディスプレイに組み込まれ得る。適切なソースデバイスにディスプレイを接続するために、ディスプレイリンクが使用される。ディスプレイリンクの帯域幅要件はディスプレイの解像度に比例し、したがって、高解像度ディスプレイは、大きい帯域幅のディスプレイリンクを必要とする。いくつかのディスプレイリンクは、高解像度ディスプレイをサポートするための帯域幅を有しない。高解像度ディスプレイにデジタルビデオを与えるためにより低い帯域幅のディスプレイリンクが使用され得るように帯域幅要件を低減するために、ビデオ圧縮が使用され得る。
[0003]他のものが、ピクセルデータに対して画像圧縮を利用することを試みた。しかしながら、そのような方式は、時々視覚的ロスレスでないか、または従来のディスプレイデバイスにおいて実装することが困難で費用がかかることがある。
[0004]ビデオエレクトロニクス規格協会(VESA:Video Electronics Standards Association)は、ディスプレイリンクビデオ圧縮のための規格として、ディスプレイストリーム圧縮(DSC)を開発した。DSCなど、ディスプレイリンクビデオ圧縮技法は、特に、視覚的ロスレスである(すなわち、圧縮がアクティブであることをユーザがわからないほど十分に良好である)ピクチャ品質を与えるべきである。ディスプレイリンクビデオ圧縮技法はまた、従来のハードウェアを用いてリアルタイムに実装することが容易で費用がかからない方式を与えるべきである。
[0005]本開示のシステム、方法およびデバイスは、それぞれいくつかの発明的態様を有し、それらのうちの単一の態様が、本明細書で開示する望ましい属性を単独で担当するとは限らない。
[0006]一態様では、ビデオデータをコーディングするための装置が、ビデオデータを記憶するためのメモリと、プロセッサとを含む。メモリはバッファを含む。プロセッサは、コーディングされるべきビデオデータを受信するように構成される。プロセッサは、ビデオデータのコンテンツのタイプと、コンテンツのタイプに関連付けられたレートひずみモデルとを考慮することなしに、ビデオデータの現在ブロックの量子化パラメータ(QP)を決定するようにさらに構成される。プロセッサはまた、決定されたQPを使用して、ビットストリーム中で現在ブロックをコーディングするように構成される。
[0007]本開示で説明する態様による技法を利用し得る例示的なビデオ符号化および復号システムを示すブロック図。 [0008]本開示で説明する態様による技法を実行し得る別の例示的なビデオ符号化および復号システムを示すブロック図。 [0009]本開示で説明する態様による技法を実装し得るビデオエンコーダの一例を示すブロック図。 [0010]本開示で説明する態様による技法を実装し得るビデオデコーダの一例を示すブロック図。 [0011]本開示で説明する態様による中のQP選択のための方法を示すフローチャート。
[0012]一般に、本開示は、ディスプレイストリーム圧縮(DSC)など、ビデオ圧縮技法のコンテキストにおいて量子化パラメータ(QP)を選択するための技法に関する。より詳細には、本開示は、レートひずみモデルを考慮することなしに、QPを計算するための(たとえば、計算(または決定)を実行するためのレートひずみモデルの利用なしに、QPを計算(または決定)するための)システムおよび方法に関する。
[0013]いくつかの実施形態について、DSC規格のコンテキストにおいて本明細書で説明するが、本明細書で開示するシステムおよび方法が任意の好適なビデオコーディング規格に適用可能であり得ることを、当業者は諒解されよう。たとえば、本明細書で開示する実施形態は、以下の規格、すなわち、国際電気通信連合(ITU)電気通信標準化部門(ITU−T)H.261、国際標準化機構/国際電気標準会議(ISO/IEC)ムービングピクチャエキスパートグループ1(MPEG−1)Visual、ITU−T H.262またはISO/IEC MPEG−2 Visual、ITU−T H.263、ISO/IEC MPEG−4 Visual、(ISO/IEC MPEG−4 AVCとしても知られる)ITU−T H.264、および高効率ビデオコーディング(HEVC)のうちの1つまたは複数、ならびにそのような規格の拡張に適用可能であり得る。また、本開示で説明する技法は、将来開発される規格の一部になり得る。言い換えれば、本開示で説明する技法は、前に開発されたビデオコーディング規格、現在開発中のビデオコーディング規格、および次のビデオコーディング規格に適用可能であり得る。
[0014]QPを計算することは、レート制御プロセスにおいて望ましいステップであり得、コーディング方式のレートひずみ(RD:rate-distortion)性能に大きい影響を及ぼし得る。一実施形態では、QPは、経験的レートひずみモデルを必要とするレートひずみ関係を最適化するように選択される。たとえば、QPは、所与のレートひずみ経験的モデルに最も良く適合するように計算され得る。この手法は、特定のコンテンツ、たとえば、自然コンテンツで動作するとき、うまく動作し得る。しかしながら、自然グラフィックス、合成グラフィックス、コンピュータグラフィックス、フラクタルなどを含むいくつかのタイプのコンテンツで動作するとき、異なるタイプのコンテンツについて効率的に動作するレートひずみモデルを確立することは困難であり得る。たとえば、レートひずみモデルのための単一の閉形式表現を確立することは困難であり得る。この困難を克服するために、レートひずみモデルの知識を必要としないかまたはレートひずみモデルに依存しないQPを計算するための方法を実装することが望ましいことがある。
[0015]これらおよび他の困難に対処するために、いくつかの態様による技法は、レートひずみモデルを考慮することなしに最適QPを決定することができる。レートひずみモデルは、DSCにおける1つまたは複数のコーディングモード、あるいは1つまたは複数の異なるタイプのコンテンツに関連付けられ得る。レートひずみモデルは、経験的データに基づき得る。一実施形態では、本技法は、(1)現在ブロックのためのビットバジェット(たとえば、コーディングのための割り振られたビットの数)と、前のブロックを符号化するためのビットの数との間の差と、(2)現在ブロックのためのビットバジェットと、前のブロックを符号化するためのビットの数との間の差の関数であるQP調整値とに基づいて、QPを決定することができる。現在ブロックのための決定されたQPは、バッファフルネス(buffer fullness)、現在ブロックの平坦度などに基づいてさらに調整され得る。
[0016]このようにして、本技法は、コーディングモードまたは特定のタイプのコンテンツに関連付けられた特定のレートひずみモデルに依拠することなしに、QP値を選択することができる。このことは、レートひずみを確立することが、時間がかかり、かなりの量の労力を伴うことがあるので、コストおよび/またはリソースを節約することができる。さらに、本技法は、異なるタイプのコンテンツでうまく動作するQPを決定することができる。
ビデオコーディング規格
[0017]ビデオ画像、TV画像、静止画像、あるいはビデオレコーダまたはコンピュータによって生成された画像など、デジタル画像は、水平ラインおよび垂直ラインで配列されたピクセルまたはサンプルを含み得る。単一の画像中のピクセルの数は一般に数万個である。各ピクセルは、一般に、ルミナンス情報とクロミナンス情報とを含んでいる。圧縮がなければ、画像エンコーダから画像デコーダに搬送されるべき情報の甚だしい量は、リアルタイム画像送信を実行不可能にするであろう。送信されるべき情報の量を低減するために、JPEG、MPEGおよびH.263規格など、いくつかの異なる圧縮方法が開発された。
[0018]ビデオコーディング規格は、ITU−T H.261と、ISO/IEC MPEG−1 Visualと、ITU−T H.262またはISO/IEC MPEG−2 Visualと、ITU−T H.263と、ISO/IEC MPEG−4 Visualと、(ISO/IEC MPEG−4 AVCとしても知られる)ITU−T H.264と、そのような規格の拡張を含むHEVCとを含む。
[0019]さらに、VESAによって、あるビデオコーディング規格、すなわち、DSCが開発された。DSC規格は、ディスプレイリンクを介した送信のためにビデオを圧縮することができるビデオ圧縮規格である。ディスプレイの解像度が増加するにつれて、ディスプレイを駆動するために必要とされるビデオデータの帯域幅は、対応して増加する。いくつかのディスプレイリンクは、そのような解像度についてディスプレイにビデオデータのすべてを送信するための帯域幅を有しないことがある。したがって、DSC規格は、ディスプレイリンクを介した相互運用可能な、視覚的ロスレス圧縮のための圧縮規格を規定する。
[0020]DSC規格は、H.264およびHEVCなど、他のビデオコーディング規格とは異なる。DSCは、フレーム内圧縮を含むが、フレーム間圧縮を含まず、これは、ビデオデータをコーディングする際にDSC規格によって時間的情報が使用されないことがあることを意味する。対照的に、他のビデオコーディング規格は、それらのビデオコーディング技法においてフレーム間圧縮を採用し得る。
ビデオコーディングシステム
[0021]添付の図面を参照しながら新規のシステム、装置、および方法の様々な態様について以下でより十分に説明する。ただし、本開示は、多くの異なる形態で実施され得、本開示全体にわたって提示する任意の特定の構造または機能に限定されるものと解釈されるべきではない。むしろ、これらの態様は、本開示が周到で完全になり、本開示の範囲を当業者に十分に伝えるために与えるものである。本明細書の教示に基づいて、本開示の範囲は、本開示の他の態様とは無関係に実装されるにせよ、本開示の他の態様と組み合わせて実装されるにせよ、本明細書で開示する新規のシステム、装置、および方法のいかなる態様をもカバーするものであることを、当業者なら諒解されたい。たとえば、本明細書に記載する態様をいくつ使用しても、装置は実装され得、または方法は実施され得る。さらに、本開示の範囲は、本明細書に記載する本開示の様々な態様に加えてまたはそれらの態様以外に、他の構造、機能、または構造および機能を使用して実施されるそのような装置または方法をカバーするものとする。本明細書で開示するどの態様も請求項の1つまたは複数の要素によって実施され得ることを理解されたい。
[0022]本明細書では特定の態様について説明するが、これらの態様の多くの変形および置換は本開示の範囲内に入る。好適な態様のいくつかの利益および利点について説明するが、本開示の範囲は特定の利益、使用、または目的に限定されるものではない。むしろ、本開示の態様は、様々なワイヤレス技術、システム構成、ネットワーク、および伝送プロトコルに広く適用可能であるものとし、そのうちのいくつかを例として図および好適な態様についての以下の説明で示す。発明を実施するための形態および図面は、本開示を限定するものではなく説明するものにすぎず、本開示の範囲は添付の特許請求の範囲およびそれの均等物によって定義される。
[0023]添付の図面は例を示している。添付の図面中の参照番号によって示される要素は、以下の説明における同様の参照番号によって示される要素に対応する。本開示では、序数語(たとえば、「第1の」、「第2の」、「第3の」など)で始まる名前を有する要素は、必ずしもそれらの要素が特定の順序を有することを暗示するとは限らない。むしろ、そのような序数語は、同じまたは同様のタイプの異なる要素を指すために使用されるにすぎない。
[0024]図1Aは、本開示で説明する態様による技法を利用し得る例示的なビデオコーディングシステム10を示すブロック図である。本明細書で使用し説明する「ビデオコーダ」または「コーダ」という用語は、ビデオエンコーダとビデオデコーダの両方を総称的に指す。本開示では、「ビデオコーディング」または「コーディング」という用語は、ビデオ符号化とビデオ復号とを総称的に指すことがある。ビデオエンコーダおよびビデオデコーダに加えて、本出願で説明する態様は、トランスコーダ(たとえば、ビットストリームを復号し、別のビットストリームを再符号化することができるデバイス)およびミドルボックス(たとえば、ビットストリームを変更、変換、および/または場合によっては操作することができるデバイス)など、他の関係するデバイスに拡張され得る。
[0025]図1Aに示されているように、ビデオコーディングシステム10は、宛先デバイス14によって後で復号されるべき符号化ビデオデータを生成するソースデバイス12を含む。図1Aの例では、ソースデバイス12および宛先デバイス14は、別個のデバイスを構成する。ただし、ソースデバイス12および宛先デバイス14は、図1Bの例に示されているように、同じデバイス上にあるかまたはそれの一部であり得ることに留意されたい。
[0026]もう一度図1Aを参照すると、ソースデバイス12および宛先デバイス14は、それぞれ、デスクトップコンピュータ、ノートブック(たとえば、ラップトップ)コンピュータ、タブレットコンピュータ、セットトップボックス、いわゆる「スマート」フォンなどの電話ハンドセット、いわゆる「スマート」パッド、テレビジョン、カメラ、ディスプレイデバイス、デジタルメディアプレーヤ、ビデオゲームコンソール、ビデオストリーミングデバイスなどを含む、広範囲にわたるデバイスのいずれかを備え得る。様々な実施形態では、ソースデバイス12および宛先デバイス14は、ワイヤレス通信のために装備され得る。
[0027]宛先デバイス14は、復号されるべき符号化ビデオデータをリンク16を介して受信し得る。リンク16は、ソースデバイス12から宛先デバイス14に符号化ビデオデータを移動することが可能な任意のタイプの媒体またはデバイスを備え得る。図1Aの例では、リンク16は、ソースデバイス12が符号化ビデオデータをリアルタイムで宛先デバイス14に送信することを可能にするための通信媒体を備え得る。符号化ビデオデータは、ワイヤレス通信プロトコルなどの通信規格に従って変調され、宛先デバイス14に送信され得る。通信媒体は、無線周波数(RF)スペクトルあるいは1つまたは複数の物理伝送線路など、任意のワイヤレスまたはワイヤード通信媒体を備え得る。通信媒体は、ローカルエリアネットワーク、ワイドエリアネットワーク、またはインターネットなどのグローバルネットワークなど、パケットベースネットワークの一部を形成し得る。通信媒体は、ルータ、スイッチ、基地局、またはソースデバイス12から宛先デバイス14への通信を可能にするために有用であり得る任意の他の機器を含み得る。
[0028]図1Aの例では、ソースデバイス12は、ビデオソース18と、ビデオエンコーダ20と、出力インターフェース22とを含む。場合によっては、出力インターフェース22は、変調器/復調器(モデム)および/または送信機を含み得る。ソースデバイス12において、ビデオソース18は、ビデオキャプチャデバイス、たとえばビデオカメラ、以前にキャプチャされたビデオを含んでいるビデオアーカイブ、ビデオコンテンツプロバイダからビデオを受信するためのビデオフィードインターフェース、および/またはソースビデオとしてコンピュータグラフィックスデータを生成するためのコンピュータグラフィックスシステムなどのソース、あるいはそのようなソースの組合せを含み得る。一例として、ビデオソース18がビデオカメラである場合、ソースデバイス12および宛先デバイス14は、図1Bの例に示されているように、いわゆる「カメラフォン」または「ビデオフォン」を形成し得る。ただし、本開示で説明する技法は、概してビデオコーディングに適用可能であり得、ワイヤレスおよび/またはワイヤード適用例に適用され得る。
[0029]キャプチャされたビデオ、以前にキャプチャされたビデオ、またはコンピュータ生成されたビデオは、ビデオエンコーダ20によって符号化され得る。符号化ビデオデータは、ソースデバイス12の出力インターフェース22を介して宛先デバイス14に送信され得る。符号化ビデオデータは、さらに(または代替として)、復号および/または再生のための宛先デバイス14または他のデバイスによる後のアクセスのためにストレージデバイス31上に記憶され得る。図1Aおよび図1Bに示されているビデオエンコーダ20は、図2A示されているビデオエンコーダ20、または本明細書で説明する他のビデオエンコーダを備え得る。
[0030]図1Aの例では、宛先デバイス14は、入力インターフェース28と、ビデオデコーダ30と、ディスプレイデバイス32とを含む。場合によっては、入力インターフェース28は、受信機および/またはモデムを含み得る。宛先デバイス14の入力インターフェース28は、リンク16を介しておよび/またはストレージデバイス31から符号化ビデオデータを受信し得る。リンク16を介して通信され、またはストレージデバイス31上に与えられた符号化ビデオデータは、ビデオデータを復号する際に、ビデオデコーダ30などのビデオデコーダが使用するためのビデオエンコーダ20によって生成される様々なシンタックス要素を含み得る。そのようなシンタックス要素は、通信媒体上で送信された、記憶媒体上に記憶された、またはファイルサーバ記憶された符号化ビデオデータに含まれ得る。
[0031]ディスプレイデバイス32は、宛先デバイス14と一体化されるかまたはその外部にあり得る。いくつかの例では、宛先デバイス14は、一体型ディスプレイデバイスを含み、また、外部ディスプレイデバイスとインターフェースするように構成され得る。他の例では、宛先デバイス14はディスプレイデバイスであり得る。概して、ディスプレイデバイス32は、復号ビデオデータをユーザに対して表示し、液晶ディスプレイ(LCD)、プラズマディスプレイ、有機発光ダイオード(OLED)ディスプレイ、または別のタイプのディスプレイデバイスなど、様々なディスプレイデバイスのいずれかを備え得る。
[0032]関係する態様では、図1Bは例示的なビデオコーディングシステム10’を示し、ここにおいて、ソースデバイス12および宛先デバイス14はデバイス11上にあるかまたはそれの一部である。デバイス11は、「スマート」フォンなどの電話ハンドセットであり得る。デバイス11は、ソースデバイス12および宛先デバイス14と動作可能に通信している(随意に存在する)コントローラ/プロセッサデバイス13を含み得る。図1Bのビデオコーディングシステム10’およびそれの構成要素(components)は、場合によっては図1Aのビデオコーディングシステム10およびそれの構成要素と同様である。
[0033]ビデオエンコーダ20およびビデオデコーダ30は、DSCなどのビデオ圧縮規格に従って動作し得る。代替的に、ビデオエンコーダ20およびビデオデコーダ30は、代替的にMPEG−4,Part10,AVCと呼ばれるITU−T H.264規格、HEVCなど、他のプロプライエタリ規格または業界規格、またはそのような規格の拡張に従って動作し得る。ただし、本開示の技法は、いかなる特定のコーディング規格にも限定されない。ビデオ圧縮規格の他の例としてはMPEG−2およびITU−T H.263がある。
[0034]図1Aおよび図1Bの例には示されていないが、ビデオエンコーダ20およびビデオデコーダ30は、それぞれオーディオエンコーダおよびデコーダと統合され得、共通のデータストリームまたは別個のデータストリーム中のオーディオとビデオの両方の符号化を処理するために、適切なMUX−DEMUXユニット、または他のハードウェアおよびソフトウェアを含み得る。適用可能な場合、いくつかの例では、MUX−DEMUXユニットは、ITU H.223マルチプレクサプロトコル、またはユーザデータグラムプロトコル(UDP)などの他のプロトコルに準拠し得る。
[0035]ビデオエンコーダ20およびビデオデコーダ30はそれぞれ、1つまたは複数のマイクロプロセッサ、デジタル信号プロセッサ(DSP)、特定用途向け集積回路(ASIC)、フィールドプログラマブルゲートアレイ(FPGA)、ディスクリート論理、ソフトウェア、ハードウェア、ファームウェアなど、様々な好適なエンコーダ回路のいずれか、またはそれらの任意の組合せとして実装され得る。本技法が部分的にソフトウェアで実装されるとき、デバイスは、好適な非一時的コンピュータ可読媒体にソフトウェアの命令を記憶し、1つまたは複数のプロセッサを使用してその命令をハードウェアで実行して、本開示の技法を実行し得る。ビデオエンコーダ20およびビデオデコーダ30の各々は1つまたは複数のエンコーダまたはデコーダ中に含まれ得、そのいずれも、それぞれのデバイスにおいて複合エンコーダ/デコーダの一部として統合され得る。
ビデオコーディングプロセス
[0036]上記で手短に述べたように、ビデオエンコーダ20はビデオデータを符号化する。ビデオデータは、1つまたは複数のピクチャを備え得る。ピクチャの各々は、ビデオの一部を形成する静止画像である。いくつかの事例では、ピクチャはビデオ「フレーム」と呼ばれることがある。ビデオエンコーダ20がビデオデータを符号化するとき、ビデオエンコーダ20はビットストリームを生成し得る。ビットストリームは、ビデオデータのコード化表現を形成するビットのシーケンスを含み得る。ビットストリームはコード化ピクチャと関連データとを含み得る。コード化ピクチャは、ピクチャのコード化表現である。
[0037]ビットストリームを生成するために、ビデオエンコーダ20は、ビデオデータ中の各ピクチャに対して符号化演算を実行し得る。ビデオエンコーダ20がピクチャに対して符号化演算を実行するとき、ビデオエンコーダ20は、一連のコード化ピクチャと関連データとを生成し得る。関連データは、QPなど、コーディングパラメータのセットを含み得る。コード化ピクチャを生成するために、ビデオエンコーダ20は、ピクチャを等しいサイズのビデオブロックに区分し得る。ビデオブロックはサンプルの2次元アレイであり得る。コーディングパラメータは、ビデオデータのあらゆるブロックについてコーディングオプション(たとえば、コーディングモード)を定義し得る。コーディングオプションは、所望のレートひずみ性能を達成するために選択され得る。
[0038]いくつかの例では、ビデオエンコーダ20はピクチャを複数のスライスに区分し得る。スライスの各々は、画像またはフレーム中の領域の残りからの情報なしに独立して復号され得る、画像(たとえば、フレーム)中の空間的に別個の領域を含み得る。各画像またはビデオフレームは単一のスライス中で符号化され得るか、またはそれはいくつかのスライス中で符号化され得る。DSCでは、各スライスを符号化するために割り振られるターゲットビットは、実質的に一定であり得る。ピクチャに対して符号化演算を実行することの一部として、ビデオエンコーダ20は、ピクチャの各スライスに対して符号化演算を実行し得る。ビデオエンコーダ20がスライスに対して符号化演算を実行するとき、ビデオエンコーダ20は、スライスに関連付けられた符号化データを生成し得る。スライスに関連付けられた符号化データは「コード化スライス」と呼ばれることがある。
DSCビデオエンコーダ
[0039]図2Aは、本開示で説明する態様による技法を実装し得るビデオエンコーダ20の一例を示すブロック図である。ビデオエンコーダ20は、本開示の技法の一部または全部を実行するように構成され得る。いくつかの例では、本開示で説明する技法は、ビデオエンコーダ20の様々な構成要素間で共有され得る。いくつかの例では、追加または代替として、プロセッサ(図示せず)が、本開示で説明する技法の一部または全部を実行するように構成され得る。
[0040]説明の目的で、本開示では、DSCコーディングのコンテキストにおいてビデオエンコーダ20について説明する。ただし、本開示の技法は、他のコーディング規格または方法に適用可能であり得る。
[0041]図2Aの例では、ビデオエンコーダ20は複数の機能構成要素を含む。ビデオエンコーダ20の機能構成要素は、色空間変換器105と、バッファ110と、平坦度検出器115と、レートコントローラ120と、予測器、量子化器、および再構成器構成要素125と、ラインバッファ130と、インデックスカラー履歴135と、エントロピーエンコーダ140と、サブストリームマルチプレクサ145と、レートバッファ150とを含む。他の例では、ビデオエンコーダ20は、より多数の、より少数の、または異なる機能構成要素を含み得る。
[0042]色空間105変換器は、入力色空間をコーディング実装形態において使用される色空間に変換し得る。たとえば、例示的な一実施形態では、入力ビデオデータの色空間は、赤、緑、および青(RGB)色空間中にあり、コーディングは、ルミナンスY、クロミナンスグリーンCg、およびクロミナンスオレンジCo(YCgCo)色空間において実装される。色空間変換は、ビデオデータへのシフトおよび追加を含む(1つまたは複数の)方法によって実行され得る。他の色空間中の入力ビデオデータが処理され得、他の色空間への変換も実行され得ることに留意されたい。
[0043]関係する態様では、ビデオエンコーダ20は、バッファ110、ラインバッファ130、および/またはレートバッファ150を含み得る。たとえば、バッファ110は、色空間変換されたビデオデータを、ビデオエンコーダ20の他の部分によるそれの使用に先立って保持し得る。別の例では、色空間変換されたデータはより多くのビットを必要とし得るので、ビデオデータはRGB色空間中で記憶され得、色空間変換が必要に応じて実行され得る。
[0044]レートバッファ150はビデオエンコーダ20においてレート制御機構の一部として機能し得、このことについて、レートコントローラ120に関して以下でより詳細に説明する。各ブロックを符号化することに費やされるビットは、大いに、実質的に、ブロックの性質に基づいて変動することがある。レートバッファ150は、圧縮されたビデオにおけるレート変動を平滑化することができる。いくつかの実施形態では、ビットが固定ビットレート(CBR)でバッファから取り出されるCBRバッファモデルが採用される。CBRバッファモデルでは、ビデオエンコーダ20がビットストリームにあまりに多くのビットを加えた場合、レートバッファ150はオーバーフローし得る。一方、ビデオエンコーダ20は、レートバッファ150のアンダーフローを防ぐために、十分なビットを加えなければならない。
[0045]ビデオデコーダ側では、ビットは、固定ビットレートでビデオデコーダ30のレートバッファ155(以下でさらに詳細に説明する図2Bを参照)に加えられ得、ビデオデコーダ30は、各ブロックについて可変数のビットを削除し得る。適切な復号を保証するために、ビデオデコーダ30のレートバッファ155は、圧縮されたビットストリームの復号中に「アンダーフロー」または「オーバーフロー」すべきでない。
[0046]いくつかの実施形態では、バッファフルネス(BF)は、バッファに現在あるビットの数を表す値BufferCurrentSizeと、レートバッファ150のサイズ、すなわち、任意の時点においてレートバッファ150に記憶され得るビットの最大数を表すBufferMaxSizeとに基づいて定義され得る。BFは次のように計算され得る。
Figure 0006449329
[0047]平坦度検出器115は、ビデオデータ中の複雑な(complex)(すなわち、平坦でない)エリアからビデオデータ中の平坦な(flat)(すなわち、単純なまたは均一な)エリアへの変化を検出することができる。「複雑な」および「平坦な」という用語は、本明細書では、概して、ビデオエンコーダ20がビデオデータのそれぞれの領域を符号化することの困難さを指すために使用する。したがって、本明細書で使用する「複雑な」という用語は、概して、ビデオデータの領域が、ビデオエンコーダ20が符号化することが複雑または困難であることを表し、たとえば、テクスチャードビデオデータ、高い空間周波数、および/または符号化することが複雑である他の特徴を含み得る。たとえば、ビデオデータの領域は、領域を符号化するために必要とされるビットの数がしきい値よりも大きいとき、複雑な領域であると決定され得る。本明細書で使用する「平坦な」という用語は、概して、ビデオデータの領域が、ビデオエンコーダ20がエンコーダすることが単純であることを表し、たとえば、ビデオデータ中の滑らかな勾配、低い空間周波数、および/または符号化することが単純である他の特徴を含み得る。たとえば、ビデオデータの領域は、領域を符号化するために必要とされるビットの数がしきい値よりも小さいとき、平坦な領域であると決定され得る。
[0048]しかしながら、実装形態に応じて、所与の領域が複雑であるのか平坦であるのかの決定は、使用される符号化規格、ビデオエンコーダ20に含まれる具体的なハードウェア、符号化されるべきビデオデータのタイプなどにも基づいて決定され得る。さらに、ビデオデータ領域のいくつかのプロパティが、領域を符号化するためにいくつのビットが必要とされるかに影響を及ぼし得、たとえば、高いテクスチャおよび/または高い空間周波数領域は、より低いテクスチャおよび/またはより低い空間周波数領域よりも多くのビットが符号化されることを必要とし得る。同様に、ランダムノイズを備える領域は、ビデオデータのより構造化された領域と比較して、多数のビットが符号化されることを必要とし得る。したがって、いくつかの実装形態では、ビデオデータの領域は、テクスチャおよび/または空間周波数の測度(たとえば、複雑度値)を複雑度しきい値と比較することによって、複雑な領域および/または平坦な領域として識別され得る。複雑な領域と平坦な領域との間の遷移が、符号化ビデオデータ中の量子化アーティファクトを低減するために、ビデオエンコーダ20によって使用され得る。詳細には、レートコントローラ120、ならびに予測器、量子化器、および再構成器構成要素125は、複雑な領域から平坦な領域への遷移が識別されたとき、そのような量子化アーティファクトを低減することができる。
[0049]レートコントローラ120は、コーディングパラメータのセット、たとえば、QPを決定する。QPは、レートバッファ150がオーバーフローまたはアンダーフローしないことを保証するターゲットビットレートについてピクチャ品質を最大にするために、レートバッファ150のバッファフルネスとビデオデータの画像アクティビティとに基づいて、レートコントローラ120によって調整され得る。レートコントローラ120はまた、最適レートひずみ性能を達成するために、ビデオデータの各ブロックについて特定のコーディングオプション(たとえば、特定のモード)を選択する。レートコントローラ120は、再構成された画像のひずみを、それがビットレート制約を満たすように、すなわち、全体的実コーディングレートがターゲットビットレート内に収まるように最小化する。
[0050]予測器、量子化器、および再構成器構成要素125は、ビデオエンコーダ20の少なくとも3つの符号化演算を実行し得る。予測器、量子化器、および再構成器構成要素125は、いくつかの異なるモードで予測を実行し得る。1つの例示的なプレディケーションモードは、メディアン適応予測の変更バージョンである。メディアン適応予測はロスレスJPEG規格(JPEG−LS)によって実装され得る。予測器、量子化器、および再構成器構成要素125によって実行され得るメディアン適応予測の変更バージョンは、3つの連続するサンプル値の並列予測を可能にし得る。別の例示的な予測モードはブロック予測である。ブロック予測では、サンプルは、前に再構成されたピクセルから左側に予測される。ビデオエンコーダ20およびビデオデコーダ30は、両方とも、ブロック予測使用を決定するために、再構成されたピクセルに対して同じ探索を実行することができ、したがって、ビットはブロック予測モードで送られる必要がない。成分範囲の中点を使用してサンプルが予測される中点予測モードも実装され得る。中点予測モードは、ワーストケースサンプルにおいてさえも、圧縮されたビデオに必要なビットの数の制限(bounding)を可能にし得る。
[0051]予測器、量子化器、および再構成器構成要素125はまた、量子化を実行する。たとえば、量子化は、シフタを使用して実装され得る2のべき乗量子化器(power-of-2 quantizer)を介して実行され得る。2のべき乗量子化器の代わりに他の量子化技法が実装され得ることに留意されたい。予測器、量子化器、および再構成器構成要素125によって実行される量子化は、レートコントローラ120によって決定されたQPに基づき得る。最終的に、予測器、量子化器、および再構成器構成要素125はまた、予測値に逆量子化残差を加算することと、結果がサンプル値の有効範囲の外側にないことを保証することとを含む再構成を実行する。
[0052]予測器、量子化器、および再構成器構成要素125によって実行される予測、量子化、および再構成に対する上記で説明した例示的な手法は、例示的なものにすぎず、他の手法が実装され得ることに留意されたい。また、予測器、量子化器、および再構成器構成要素125は、予測、量子化、および/または再構成を実行するための(1つまたは複数の)副構成要素(subcomponent(s))を含み得ることに留意されたい。さらに、予測、量子化、および/または再構成は、予測器、量子化器、および再構成器構成要素125の代わりにいくつかの別個のエンコーダ構成要素によって実行され得ることに留意されたい。
[0053]ラインバッファ130は、予測器、量子化器、および再構成器構成要素125ならびにインデックスカラー履歴135が、バッファされたビデオデータを使用することができるように、予測器、量子化器、および再構成器構成要素125からの出力を保持する。インデックスカラー履歴135は、最近使用されたピクセル値を記憶する。これらの最近使用されたピクセル値は、専用シンタックスを介してビデオエンコーダ20によって直接参照され得る。
[0054]エントロピーエンコーダ140は、インデックスカラー履歴135と、平坦度検出器115によって識別された平坦度遷移とに基づいて、予測器、量子化器、および再構成器構成要素125から受信された予測残差を符号化する。いくつかの例では、エントロピーエンコーダ140は、サブストリームエンコーダごとにクロックごとに3つのサンプルを符号化し得る。サブストリームマルチプレクサ145は、ヘッダレスパケット多重化方式に基づいてビットストリームを多重化し得る。これは、ビデオデコーダ30が並列に3つのエントロピーデコーダを動作させることを可能にし、クロックごとの3つのピクセルの復号を可能にする。サブストリームマルチプレクサ145は、パケットがビデオデコーダ30によって効率的に復号され得るようにパケット順序を最適化し得る。クロックごとの2のべき乗個のピクセル(たとえば、2つのピクセル/クロックまたは4つのピクセル/クロック)の復号を容易にし得る、エントロピーコーディングに対する異なる手法が実装され得ることに留意されたい。
DSCビデオデコーダ
[0055]図2Bは、本開示で説明する態様による技法を実装し得るビデオデコーダ30の一例を示すブロック図である。ビデオデコーダ30は、本開示の技法の一部または全部を実行するように構成され得る。いくつかの例では、本開示で説明する技法は、ビデオエンコーダ30の様々な構成要素間で共有され得る。いくつかの例では、追加または代替として、プロセッサ(図示せず)が、本開示で説明する技法の一部または全部を実行するように構成され得る。
[0056]説明の目的で、本開示では、DSCコーディングのコンテキストにおいてビデオデコーダ30について説明する。ただし、本開示の技法は、他のコーディング規格または方法に適用可能であり得る。
[0057]図2Bの例では、ビデオデコーダ30は複数の機能構成要素を含む。ビデオデコーダ30の機能構成要素は、レートバッファ155と、サブストリームデマルチプレクサ160と、エントロピーデコーダ165と、レートコントローラ170と、予測器、量子化器、および再構成器構成要素175と、インデックスカラー履歴180と、ラインバッファ185と、色空間変換器190とを含む。ビデオデコーダ30の図示された構成要素は、図2A中のビデオエンコーダ20に関して上記で説明した対応する構成要素に類似する。したがって、ビデオデコーダ30の構成要素の各々は、上記で説明したビデオエンコーダ20の対応する構成要素と同様の様式で動作し得る。
DSCにおけるスライス
[0058]上述のように、スライスは、概して、画像またはフレーム中の領域の残りからの情報を使用することなしに独立して復号され得る、画像またはフレーム中の空間的に別個の領域を指す。各画像またはビデオフレームは単一のスライス中で符号化され得るか、またはそれはいくつかのスライス中で符号化され得る。DSCでは、各スライスを符号化するために割り振られるターゲットビットは、実質的に一定であり得る。
DSCのためにQPを選択すること
[0059]QPを計算することは、レート制御プロセスにおいて望ましいステップであり得、コーディング方式のレートひずみ(RD)性能に大きい影響を及ぼし得る。一実施形態では、QPは、経験的レートひずみモデルを必要とするレートひずみ関係を最適化するように選択される。たとえば、QPは、所与のレートひずみ経験的モデルに最も良く適合するように計算され得る。この手法は、特定のコンテンツ、たとえば、自然コンテンツで動作するとき、うまく動作し得る。しかしながら、自然グラフィックス、合成グラフィックス、コンピュータグラフィックス、フラクタルなどを含むいくつかのタイプのコンテンツで動作するとき、異なるタイプのコンテンツについて効率的に動作するレートひずみモデルを確立することは困難であり得る。たとえば、レートひずみモデルのための単一の閉形式表現を確立することは困難であり得る。この困難を克服するために、レートひずみモデルの知識を必要としないかまたはレートひずみモデルに依存しないQPを計算するための方法を実装することが望ましいことがある。
[0060]これらおよび他の困難に対処するために、いくつかの態様による技法は、レートひずみモデルを考慮することなしに最適QPを決定することができる。レートひずみモデルは、DSCにおける1つまたは複数のコーディングモード、あるいは1つまたは複数の異なるタイプのコンテンツに関連付けられ得る。レートひずみモデルは、経験的データに基づき得る。一実施形態では、本技法は、(1)現在ブロックのためのビットバジェットと、前のブロックを符号化するためのビットの数との間の差と、(2)現在ブロックのためのビットバジェットと、前のブロックを符号化するためのビットの数との間の差の関数であるQP調整値とに基づいて、QPを決定することができる。現在ブロックのための決定されたQPは、バッファフルネス、現在ブロックの平坦度などに基づいてさらに調整され得る。
[0061]このようにして、本技法は、コーディングモードまたは特定のタイプのコンテンツに関連付けられた特定のレートひずみモデルに依拠することなしに、QP値を選択することができる。このことは、レートひずみを確立することが、時間がかかり、かなりの量の労力を伴うことがあるので、コストおよび/またはリソースを節約することができる。さらに、本技法は、異なるタイプのコンテンツでうまく動作するQPを決定することができる。
[0062]DSCにおいてQPを選択することに関係するいくつかの詳細について、たとえば、例示的な実施形態に関して以下で説明する。本開示全体にわたって使用される様々な用語は、それらの通常の意味を有する広義の用語である。いくつかの実施形態では、QPは、量子化の程度を制御するために量子化プロセスにおいて使用されるパラメータを指すことがある。たとえば、量子化プロセスは、ビットレートをさらに低減するために、残差を量子化する。量子化プロセスは、残差の一部または全部に関連するビット深度を低減し得る。量子化の程度は、量子化パラメータを調整することによって変更され得る。たとえば、量子化パラメータは、残差の量子化を決定するために使用される。QP値が低いとき、詳細な視覚情報の大部分は保持され得る。低いQP値は、概して、より低いひずみを与えるが、より高いビットレートという代償を払う。QP値が増加するにつれて、より多くのビットプレーンが廃棄され得、このことは、ビットレートを低減するが、ひずみを増加させるという代償を払う。いくつかの実施形態では、本技法は、レートひずみモデルとは無関係にQPを決定する、レートひずみモデルに応じずにQPを決定する、などを行うことができる。いくつかの態様によれば、レートひずみモデルを考慮することなしにQPを決定することは、レートひずみモデルとは無関係にQPを決定すること、レートひずみモデルに応じずにQPを決定することなどと呼ばれることもある。レートひずみモデルは、コーディングされるべきビデオデータのコンテンツのタイプに関連付けられ得るか、特定のモードに関連付けられ得るか、またはその両方である。コンテンツのタイプはコンテンツの実体とは異なることがある。コンテンツのタイプは、自然コンテンツ、合成コンテンツ、コンピュータグラフィックス、フラクタルなどを含み得る。レートひずみモデルは、コンテンツの特定のタイプに関連付けられ、実際のコンテンツ自体に関連付けられないことがある。
例示的な実施形態
[0063]一実施形態では、経験的レートひずみモデルを知ることなしに異なるタイプのコンテンツについてうまく動作するQPを計算するための装置および方法が提供される。特定のコーディングモード(またはオプション)について、現在ブロックのための対応するQP値は、以下で説明するステップから計算され得る。この技法は、各コーディングモード(またはオプション)について、そのコーディングモード(またはオプション)に関連付けられたQPを計算するために独立して使用され得る。たとえば、現在ブロックについて、QP値は、以下で説明するステップを使用して、各コーディングモードについて計算され、たとえばブロックごとに追跡され得る。いくつかの実施形態では、各コーディングモードに対応するQPを計算する代わりに、本技法は、すべてのコーディングモードをコーディングするために使用され得る単一のQP値を計算し得る。たとえば、現在ブロックのための単一のQP値は、以下で説明するステップから計算され得る。
1. ビットバジェットを計算する
[0064](ここではbitBudgetとして示される)現在ブロックのためのビットバジェットは、スライス中に残っているビットの数(numSliceBitsRemaining)と、スライス中で符号化されるべきピクセルの数(numSlicePixelsRemaining)と、現在ブロック中のピクセルの数(numPixelsInBlock)とを考慮することによって計算される。さらに、バッファ中のビットの数(たとえば、BF)は、bitBudgetを計算する間に考慮され得る。
一例では、現在ブロックのためのビットレートは、スライス中に残っているビットの数を、符号化される必要があるスライス中のピクセルの数で除算することによって計算される。したがって、bitBudgetは、次のように計算される。
Figure 0006449329
別の例では、bitBudgetは、スライス内の現在ブロックの位置に応じて計算され得る。たとえば、bitBudgetは、レートdecBitBudgetによって線形的に減少させられ得、ここで、decBitBudgetは、現在スライス中で符号化されるブロックの数と、現在スライス中のブロックの総数とに応じて計算され得る。
2. ビットバジェットと、前のブロックを符号化するためのビットの数との間の差を計算する
[0065]特定のモードについての、bitBudgetと(prevBlockBitsとして示される)前のブロックを符号化するために必要とされたビットの数との間の差が計算される。この差は、diffBitsとして表され得、diffBits=prevBlockBits−bitBudgetとして計算され得る。さらに、diffBitsは、たとえば、diffBits=diffBits/(numPixelsinBlock*targetBitRate)として正規化され得る。
[0066]いくつかの実施形態では、前のブロックをコーディングするために使用されたコーディングモードにかかわらず、単一のQPが、導出され、すべてのコーディングモードのために使用されるべきであるとき、(prevBlockBitsとして示される)前のブロックをコーディングすることに費やされたビットの数は、diffBitsを計算するために使用される。
3. 差の関数としてQP調整値を決定する
[0067]QpAdjは、ステップ2において計算されたdiffBitsの絶対値の関数として計算される調整値を表すものとする。関数は、diffBitsの絶対値が増加するにつれて、QpAdjの値を線形的にまたは非線形的に増加させ得る。
一例では、diffBitsの絶対値は、K個のしきい値を使用してK+1個の範囲に分類され得る。たとえば、K個のしきい値(たとえば、1〜K)があり得、連続する2つのしきい値は範囲の開始および終了を定義することができる。たとえば、範囲1は0としきい値1との間にあり得、範囲2はしきい値1としきい値2との間にあり得、以下同様である。K個のしきい値の場合、K+1個の範囲があり得る。各範囲について、特定のQpAdj値があり、ここで、QpAdj値は、範囲が増加するにつれて増加する。
いくつかの実施形態では、QpAdjは、絶対値を取ることなしに、diffBitsの関数として計算され得る。K+1個の範囲およびそれぞれのQpAdj値を分類するために使用されるK個のしきい値[しきい値1,しきい値2,...しきい値k]は、diffBitsの符号値に応じて異なり得る。
− 一例では、diffBits>0であるとき、diffBitsは、K個のしきい値を使用してK+1個の範囲に分類され得る。各範囲について、特定のQpAdj値があり、ここで、QpAdj値は、範囲が増加するにつれて増加する。そうではなく、diffBits≦0である場合、diffBitsの絶対値は、J個のしきい値を使用してJ+1個の範囲に分類され得る。また、各範囲について、範囲が増加するにつれて増加する特定のQpAdj値がある。
− 一例では、diffBits≧0であるとき、diffBitsは、K個のしきい値を使用してK+1個の範囲に分類され得る。各範囲について、特定のQpAdj値があり、ここで、QpAdj値は、範囲が増加するにつれて増加する。そうではなく、diffBits<0である場合、diffBitsの絶対値は、J個のしきい値を使用してJ+1個の範囲に分類され得る。また、各範囲について、範囲が増加するにつれて増加する特定のQpAdj値があり得る。
− 一例では、diffBits≦0またはdiffBits<0であるとき、diffBitsは、J個のしきい値を使用してJ+1個の範囲に分類され得る。また、各範囲について、範囲が減少するにつれて減少する特定のQpAdj値がある。この場合、QpAdjは負の値を取り得ることに留意されたい。
− 一例では、diffBits>0であるときとdiffBits≦0であるときのしきい値の数は同じであるが(K=J)、個々の値は同じであることも同じでないこともある。
− 一例では、diffBits≧0であるときとdiffBits<0であるときのしきい値の数は同じであるが(K=J)、個々の値は同じであることも同じでないこともある。
− 一例では、diffBits>0の場合とdiffBits≦0の場合の両方についてK個のしきい値が同じであるときでも、各範囲のための関連付けられたQpAdj値は、diffBits>0とdiffBits≧0とについて同じであることも同じでないこともある。
− 一例では、diffBits≧0の場合とdiffBits<0の場合の両方についてK個のしきい値が同じであるときでも、各範囲のための関連付けられたQpAdj値は、diffBits≧0とdiffBits>0とについて同じであることも同じでないこともある。
4. 現在ブロックのためのQP値を決定する
[0068]現在ブロックのためのQP値(currQP)は、ステップ2におけるdiffBitsと、ステップ3において計算されたQpAdjと、前のブロックをコーディングするために使用された同じモードに対応する前のブロックを符号化するために使用されたQP値(prevQP)とに基づいて決定され得る。より正確には、currQPを計算するために以下の式が使用される。
Figure 0006449329
一例では、currQP=prevQP+QPAdjである。
一実施形態では、前のブロックのコーディングモードにかかわらず、単一のQPが、導出され、すべてのコーディングモードのために使用されるべきであるとき、前のブロックを符号化するために使用されたQP値(prevQP)は、currQPの計算のために使用される。
5. バッファフルネスに基づいて現在ブロックのためのQP値を調整する
[0069]BFに応じて、currQPは、バッファエラーを回避するためにさらに調整され得る。より詳細には、currQPは、BFがあるしきい値を超えるとき、さらに増分され得、これはバッファオーバーフローを防ぎ得る。同様に、currQPは、BFがあるしきい値を下回るとき、さらに減分され得、これは、アンダーフローを防ぎ得る。
一実装形態では、単一のしきい値を使用するよりもむしろ、複数のしきい値が使用され得る。各しきい値について、currQPを調整する関連付けられた値がある。たとえば、[P1,P2,...Pn]がn個のしきい値であり、[p1,p2,...pn]がそれぞれの調整値であるものとし、両方が単調減少する順序で表されると仮定する。currQPは、以下のように調整され得る。
Figure 0006449329
− 一実施形態では、2つのしきい値P1およびP2、ならびにそれぞれの調整値p1およびp2が使用され得る。
− 一実装形態では、よりも大きいかまたはそれに等しい(≧)は、上記の条件では、よりも大きい(>)と置き換えられ得る。
同様に、[Q1,Q2,...Qm]はm個のしきい値であり、[q1,q2,...qm]はそれぞれの調整値である。両方が単調増加する順序にあると仮定する。currQPは、以下のように調整され得る。
Figure 0006449329
− 一実施形態では、2つのしきい値Q1およびQ2、ならびにそれぞれの調整値q1およびq2が使用され得る。
− 一実装形態では、よりも小さいかまたはそれに等しい(≦)は、上記の条件では、よりも小さい(<)と置き換えられ得る。
○ 一例では、mはnに等しい。
○ 一例では、m=nであるとき、[Q1,Q2,...Qm]=[100−P1,100−P2,...100−Pn]である。
○ 一例では、m=nであるとき、1からnまでの値を取るすべてのiについて、qiはpiに等しいことも等しくないこともある。
[0070]BF計算に対する選択された手法は、コンテキストおよび適用例に応じて変動し得ることに留意されたい。
平坦度検出およびQPを決定すること
[0071]一実施形態では、平坦度検出アルゴリズムがビデオデータの「複雑な」領域からビデオデータの「平坦な」領域への遷移を検出した場合、上記のステップ1〜4は省略され得る。そのような場合、currQPは低い値に設定され得る。
[0072]BFに応じて、currQPは、たとえば、ステップ5に関して上記で説明したように調整され得る。より正確には、バッファフルネスがあるしきい値を超えたとき、currQPは増加させられ得る。
6. 平坦な現在ブロックのQP値を調整する
[0073]現在ブロック中の視覚情報が「極めて平坦」である(たとえば、高いレベルまたは程度の平坦度を有する)場合、currQPはさらに調整され得る。現在ブロックの複雑度値Ccurを計算することに対する選択された手法は、コンテキストおよび適用例に応じて変動し得る。Ccurがしきい値よりも小さいかまたはそれ以下である場合、currQPは、平坦なブロックのための所定のQP値、たとえば、flatQpに等しく設定され得る。
一例では、単一のしきい値の代わりに、複数(たとえば、L個)のしきい値、たとえば、単調増加する順序で配列された[T1,T2,...TL]が使用され得る。さらに、各しきい値について、単調増加する順序で配列され得る関連付けられたQP値[flatQp1,flatQp2,...,flatQpL]があり得る。たとえば、Ccurに基づいてflatQpの値を決定するために、以下のステップが使用され得る。
Figure 0006449329
− 一実施形態では、2つのしきい値T1およびT2、ならびにそれぞれの関連付けられたQP値flatQP1およびflatQP2が使用され得る。
一例では、よりも小さいかまたはそれに等しい(≦)の代わりに、よりも小さい(<)が上記の条件付き検査において使用され得る。
currQPは、flatQpに等しく設定され得ることに留意されたい。一代替形態では、currQPは、currQP=(currQP>flatQp)?flatQp:currQPに従って決定され得る。
一例では、スライス中の第1のラインに関してflatQpおよび/または[flatQp1,flatQp2,...,flatQpL]は、スライス中のラインの残りと比較して異なり得る。これは、主に、スライス中の第1のラインの品質を改善するためである。さらに、所与のしきい値について、スライス中の第1のラインのためのflatQpおよび/または[flatQp1,flatQp2,...,flatQpL]は、スライス中のラインの残りよりも小さいことがある。
一例では、スライス中の第1のラインのための[T1,T2,...TL]は、スライス中のラインの残りと比較して異なり得る。
利用可能なビットバジェットが低いとき、QPを決定すること
[0074]ごく少数のビットが残されているとき、QPは高い値、たとえば、所定の高い値に設定され得る。一実装形態では、条件(numSliceBitsRemaining<thresholdBits&&bppRemaining<targetBpp)が真であるとき、上記のステップ1〜4は省略され、QPは極めて高い値に設定され得る。ここで、thresholdBitsは、構成可能パラメータであり得る変数であり、targetBppは、ピクセル当たりのターゲットビットであり、bppRemainingは、bppRemaining=numSliceBitsRemaining/numSlicePixelsRemainingとして計算される。
一例では、QPは、最大許容値に等しく設定され得る。
DSCにおいてQPを決定する方法
[0001]図3は、本開示の一実施形態による、ビデオデータをコーディングするためのプロセス300を示すフローチャートである。本方法は、QPを選択することに関する。プロセス300のブロックは、ビデオエンコーダ(たとえば、図2A中のビデオエンコーダ20)、ビデオデコーダ(たとえば、図2B中のビデオデコーダ30)、またはそれらの(1つまたは複数の)構成要素によって実行され得る。説明の目的で、プロセス300について、ビデオエンコーダ20、ビデオデコーダ30、または別の構成要素であり得る、(単にコーダとも呼ばれる)ビデオコーダによって実行されるものとして説明する。図3に関して説明するすべての実施形態は、別々に、または互いと組み合わせて実装され得る。プロセス300に関係するいくつかの詳細が上記で説明されている。
[0075]プロセスはブロック301において開始する。コーダは、ビデオデータを記憶するためのメモリを含むことができる。メモリはバッファを含むことができる。ブロック302において、コーダは、たとえば、DSCを介して、コーディングされるべきビデオデータを受信する。
[0076]ブロック303において、コーダは、ビデオデータのコンテンツのタイプと、コンテンツのタイプに関連付けられたレートひずみモデルとを考慮することなしに、ビデオデータの現在ブロックのQPを決定する。ビデオデータのコンテンツのタイプは、自然コンテンツ、合成コンテンツ、コンピュータグラフィックス、フラクタルなどのうちの1つまたは複数を含み得る。
[0077]一実施形態では、コーダは、(1)現在ブロックのためのビットバジェットと、前のブロックを符号化するために使用されたビットの数との間の差と、(2)現在ブロックのためのビットバジェットと、前のブロックを符号化するためのビットの数との間の差の関数である、QPを調整するための第1の値とに少なくとも部分的に基づいて、QPを決定する。たとえば、現在ブロックのためのビットバジェットと、前のブロックを符号化するためのビットの数との間の差は、diffBitsを指すことがあり、(2)現在ブロックのためのビットバジェットと、前のブロックを符号化するためのビットの数との間の差の関数である、QPを調整するための第1の値は、QPAdjを指すことがある。一実施形態では、現在ブロックはスライス中に含まれ、現在ブロックのためのビットバジェットは、式、すなわち、(スライスのために残っているビットの数/スライス中でコーディングされるべきピクセルの数)*現在ブロック中のピクセルの数、に従って決定される。コーダは、式、すなわち、前のブロックのQP+第1の値*(現在ブロックのためのビットバジェットと、前のブロックを符号化するために使用されたビットの数との間の差>0?1:−1)、に従ってQPを決定し得る。
[0078]いくつかの実施形態では、コーダは、2つまたはそれ以上のしきい値によって定義された複数の範囲を定義する。所定の値に関連付けられた複数の範囲の各々。コーダは、複数の範囲のうちのいずれが、現在ブロックのためのビットバジェットと、前のブロックを符号化するためのビットの数との間の差を含むかを決定する。コーダは、第1の値を、決定された範囲に関連付けられた所定の値に設定する。たとえば、2つまたはそれ以上のしきい値および複数の範囲は、上記のK個のしきい値またはK+1個の範囲を指すことがあり、各範囲は、QPAdjのための特定の値に関連付けられ得る。
[0079]いくつかの実施形態では、コーダはバッファのフルネスまたはバッファフルネスを決定する。バッファフルネスはBFを指すことがある。一実施形態では、バッファのフルネスが、1つまたは複数のしきい値よりも大きいかまたはそれに等しいと決定したことに応答して、コーダは、決定されたQPを、1つまたは複数のしきい値に関連付けられた第2の値だけ調整する。別の実施形態では、バッファのフルネスが、1つまたは複数のしきい値よりも小さいかまたはそれに等しいと決定したことに応答して、コーダは、決定されたQPを、1つまたは複数のしきい値に関連付けられた第2の値だけ調整する。
[0080]いくつかの実施形態では、コーダは、現在ブロックの平坦度を決定する。現在ブロックの平坦度が、1つまたは複数のしきい値よりも大きいかまたはそれに等しいと決定したことに応答して、コーダは、QPを、1つまたは複数のしきい値に関連付けられたQP値に等しく設定する。1つまたは複数のしきい値に関連付けられたQP値は、flatQPを指すことがある。
[0081]ブロック304において、コーダは、決定されたQPを使用して、ビットストリーム中で現在ブロックをコーディングする。コーダは、固定ビットレートを使用してビデオデータをコーディングし得る。
[0082]プロセス300はブロック305において終了する。ブロックは、実施形態によっては、プロセス300において追加および/または省略され得、プロセス300のブロックは、実施形態によっては、異なる順序で実行され得る。
[0083]本開示で説明するいかなる特徴および/または実施形態も、別々に、またはそれらの任意の組合せで実装され得る。たとえば、図1〜図2に関して説明したいかなる特徴および/または実施形態、ならびに本開示の他の部分も、図3に関して説明した任意の特徴および/または実施形態との任意の組合せで実装され得、その逆も同様である。本開示の実施形態は、図3に示されている例にまたはそれによって限定されず、他の変形形態が、本開示の趣旨から逸脱することなく実装され得る。
他の考慮事項
[0096]本明細書で開示する情報および信号は、多種多様な技術および技法のいずれかを使用して表され得る。たとえば、上記の説明全体にわたって言及され得るデータ、命令、コマンド、情報、信号、ビット、シンボル、およびチップは、電圧、電流、電磁波、磁界または磁性粒子、光場または光学粒子、あるいはそれらの任意の組合せによって表され得る。
[0097]本明細書で開示した実施形態に関して説明した様々な例示的な論理ブロック、およびアルゴリズムステップは、電子ハードウェア、コンピュータソフトウェア、またはその両方の組合せとして実装され得る。ハードウェアとソフトウェアのこの互換性を明確に示すために、様々な例示的な構成要素、ブロック、およびステップについて、概してそれらの機能に関して上記で説明した。そのような機能をハードウェアとして実装するか、ソフトウェアとして実装するかは、特定の適用例および全体的なシステムに課せられた設計制約に依存する。当業者は、説明した機能を特定の適用例ごとに様々な方法で実装し得るが、そのような実装の決定は、本開示の範囲からの逸脱を生じるものと解釈されるべきではない。
[0098]本明細書で説明した技法は、ハードウェア、ソフトウェア、ファームウェア、またはそれらの任意の組合せで実装され得る。そのような技法は、汎用コンピュータ、ワイヤレス通信デバイスハンドセット、またはワイヤレス通信デバイスハンドセットおよび他のデバイスにおける適用例を含む複数の用途を有する集積回路デバイスなど、様々なデバイスのいずれかに実装され得る。デバイスまたは構成要素として説明した特徴は、集積論理デバイスに一緒に、またはディスクリートであるが相互運用可能な論理デバイスとして別々に実装され得る。ソフトウェアで実装された場合、本技法は、実行されたとき、上記で説明した方法のうちの1つまたは複数を実行する命令を含むプログラムコードを備えるコンピュータ可読データ記憶媒体によって、少なくとも部分的に実現され得る。コンピュータ可読データ記憶媒体は、パッケージング材料を含むことがあるコンピュータプログラム製品の一部を形成し得る。コンピュータ可読媒体は、同期ダイナミックランダムアクセスメモリ(SDRAM)などのランダムアクセスメモリ(RAM)、読取り専用メモリ(ROM)、不揮発性ランダムアクセスメモリ(NVRAM)、電気消去可能プログラマブル読取り専用メモリ(EEPROM(登録商標))、フラッシュメモリ、磁気または光学データ記憶媒体など、メモリまたはデータ記憶媒体を備え得る。本技法は、追加または代替として、伝搬信号または電波など、命令またはデータ構造の形態でプログラムコードを搬送または伝達し、コンピュータによってアクセスされ、読み取られ、および/または実行され得るコンピュータ可読通信媒体によって、少なくとも部分的に実現され得る。
[0099]プログラムコードは、1つまたは複数のデジタル信号プロセッサ(DSP)、汎用マイクロプロセッサ、特定用途向け集積回路(ASIC)、フィールドプログラマブル論理アレイ(FPGA)、または他の等価の集積回路またはディスクリート論理回路など、1つまたは複数のプロセッサを含み得るプロセッサによって実行され得る。そのようなプロセッサは、本開示で説明する技法のいずれかを実行するように構成され得る。汎用プロセッサはマイクロプロセッサであり得るが、代替として、プロセッサは、任意の従来のプロセッサ、コントローラ、マイクロコントローラ、または状態機械であり得る。プロセッサはまた、コンピューティングデバイスの組合せ、たとえば、DSPとマイクロプロセッサとの組合せ、複数のマイクロプロセッサ、DSPコアと連携する1つまたは複数のマイクロプロセッサ、あるいは任意の他のそのような構成として実装され得る。したがって、本明細書で使用する「プロセッサ」という用語は、上記の構造、上記の構造の任意の組合せ、または本明細書で説明する技法の実装に好適な他の構造または装置のいずれかを指すことがある。さらに、いくつかの態様では、本明細書で説明した機能は、符号化および復号のために構成された専用のソフトウェアもしくはハードウェア内に提供され得、または複合ビデオエンコーダ/デコーダ(コーデック)に組み込まれ得る。また、本技法は、1つまたは複数の回路または論理要素で十分に実装され得る。
[0100]本開示の技法は、ワイヤレスハンドセット、集積回路(IC)またはICのセット(たとえば、チップセット)を含む、多種多様なデバイスまたは装置で実装され得る。本開示では、開示する技法を実行するように構成されたデバイスの機能的態様を強調するために、様々な構成要素またはユニットについて説明したが、それらの構成要素またはユニットは、必ずしも異なるハードウェアユニットによる実現を必要とするとは限らない。むしろ、上記で説明したように、様々なユニットが、好適なソフトウェアおよび/またはファームウェアとともに、上記で説明した1つまたは複数のプロセッサを含めて、コーデックハードウェアユニットにおいて組み合わせられるか、または相互動作可能なハードウェアユニットの集合によって与えられ得る。
[0101]上記で様々な異なる実施形態に関して説明したが、一実施形態からの特徴または要素は、本開示の教示から逸脱することなく他の実施形態と組み合わせられ得る。しかしながら、それぞれの実施形態間の特徴の組合せは、それに必ずしも限定されるとは限らない。本開示の様々な実施形態について説明した。これらおよび他の実施形態は以下の特許請求の範囲内に入る。
以下に、本願出願の当初の特許請求の範囲に記載された発明を付記する。
[C1]
ビデオデータをコーディングするための装置であって、
前記ビデオデータを記憶するためのメモリと、前記メモリがバッファを含む、
前記メモリに動作可能に結合され、
コーディングされるべき前記ビデオデータを受信することと、
前記ビデオデータのコンテンツのタイプと、コンテンツの前記タイプに関連付けられたレートひずみモデルとを考慮することなしに、前記ビデオデータの現在ブロックの量子化パラメータ(QP)を決定することと、
前記決定されたQPを使用して、ビットストリーム中で前記現在ブロックをコーディングすることと
を行うように構成されたハードウェアプロセッサとを備える、装置。
[C2]
前記プロセッサが、(1)前記現在ブロックのためのビットバジェットと、前のブロックを符号化するために使用されたビットの数との間の差と、(2)前記現在ブロックのための前記ビットバジェットと、前記前のブロックを符号化するために使用されたビットの前記数との間の前記差の関数である、前記QPを調整するための第1の値とに少なくとも部分的に基づいて、前記QPを決定するようにさらに構成された、C1に記載の装置。
[C3]
前記現在ブロックがスライス中に含まれ、前記現在ブロックのための前記ビットバジェットが、式、すなわち、(前記スライスのために残っているビットの数/前記スライス中でコーディングされるべきピクセルの数)*前記現在ブロック中のピクセルの数、に従って決定される、C2に記載の装置。
[C4]
前記プロセッサが、式、すなわち、前記前のブロックのQP+前記第1の値*(前記現在ブロックのための前記ビットバジェットと、前記前のブロックを符号化するためのビットの前記数との間の前記差>0?1:−1)、に従って前記QPを決定するように構成された、C2に記載の装置。
[C5]
前記プロセッサは、
2つまたはそれ以上のしきい値によって定義される複数の範囲を定義することと、前記複数の範囲の各々が所定の値に関連付けられた、
前記複数の範囲のうちのいずれが、前記現在ブロックのための前記ビットバジェットと、前記前のブロックを符号化するためのビットの前記数との間の前記差を含むかを決定することと、
前記第1の値を、前記決定された範囲に関連付けられた前記所定の値に設定することとを行うようにさらに構成された、C2に記載の装置。
[C6]
前記プロセッサは、
前記バッファのフルネスを決定することと、
前記バッファの前記フルネスが、1つまたは複数のしきい値よりも大きいかまたはそれに等しいと決定したことに応答して、前記決定されたQPを、前記1つまたは複数のしきい値に関連付けられた第2の値だけ調整することとを行うようにさらに構成された、C1に記載の装置。
[C7]
前記プロセッサは、
前記バッファのフルネスを決定することと、
前記バッファの前記フルネスが、1つまたは複数のしきい値よりも小さいかまたはそれに等しいと決定したことに応答して、前記決定されたQPを、前記1つまたは複数のしきい値に関連付けられた第2の値だけ調整することとを行うようにさらに構成された、C1に記載の装置。
[C8]
前記プロセッサは、
前記現在ブロックの平坦度を決定することと、
前記現在ブロックの前記平坦度が、1つまたは複数のしきい値よりも大きいかまたはそれに等しいと決定したことに応答して、前記QPを、前記1つまたは複数のしきい値に関連付けられたQP値に等しく設定することとを行うようにさらに構成された、C1に記載の装置。
[C9]
前記プロセッサが、固定ビットレートを使用して前記ビデオデータをコーディングするようにさらに構成された、C1に記載の装置。
[C10]
前記ビデオデータのコンテンツの前記タイプが、自然コンテンツ、合成コンテンツ、コンピュータグラフィックス、またはフラクタルのうちの1つを備える、C1に記載の装置。
[C11]
ビデオデータをコーディングする方法であって、
メモリに前記ビデオデータを記憶することと、前記メモリがバッファを含む、
コーディングされるべき前記ビデオデータを受信することと、
前記ビデオデータのコンテンツのタイプと、コンテンツの前記タイプに関連付けられたレートひずみモデルとを考慮することなしに、前記ビデオデータの現在ブロックの量子化パラメータ(QP)を決定することと、
前記決定されたQPを使用して、ビットストリーム中で前記現在ブロックをコーディングすることとを備える、方法。
[C12]
前記QPが、(1)前記現在ブロックのためのビットバジェットと、前のブロックを符号化するために使用されたビットの数との間の差と、(2)前記現在ブロックのための前記ビットバジェットと、前記前のブロックを符号化するために使用されたビットの前記数との間の前記差の関数である、前記QPを調整するための第1の値とに少なくとも部分的に基づいて決定される、C11に記載の方法。
[C13]
前記現在ブロックがスライス中に含まれ、前記現在ブロックのための前記ビットバジェットが、式、すなわち、(前記スライスのために残っているビットの数/前記スライス中でコーディングされるべきピクセルの数)*前記現在ブロック中のピクセルの数、に従って決定される、C12に記載の方法。
[C14]
前記QPが、式、すなわち、前記前のブロックのQP+前記第1の値*(前記現在ブロックのための前記ビットバジェットと、前記前のブロックを符号化するためのビットの前記数との間の前記差>0?1:−1)、に従って決定される、C12に記載の方法。
[C15]
2つまたはそれ以上のしきい値によって定義される複数の範囲を定義することと、前記複数の範囲の各々が所定の値に関連付けられた、
前記複数の範囲のうちのいずれが、前記現在ブロックのための前記ビットバジェットと、前記前のブロックを符号化するためのビットの前記数との間の前記差を含むかを決定することと、
前記第1の値を、前記決定された範囲に関連付けられた前記所定の値に設定することとをさらに備える、C12に記載の方法。
[C16]
前記バッファのフルネスを決定することと、
前記バッファの前記フルネスが、1つまたは複数のしきい値よりも大きいかまたはそれに等しいと決定したことに応答して、前記決定されたQPを、前記1つまたは複数のしきい値に関連付けられた第2の値だけ調整することとをさらに備える、C11に記載の方法。
[C17]
前記バッファのフルネスを決定することと、
前記バッファの前記フルネスが、1つまたは複数のしきい値よりも小さいかまたはそれに等しいと決定したことに応答して、前記決定されたQPを、前記1つまたは複数のしきい値に関連付けられた第2の値だけ調整することとをさらに備える、C11に記載の方法。
[C18]
前記現在ブロックの平坦度を決定することと、
前記現在ブロックの前記平坦度が、1つまたは複数のしきい値よりも大きいかまたはそれに等しいと決定したことに応答して、前記QPを、前記1つまたは複数のしきい値に関連付けられたQP値に等しく設定することとをさらに備える、C11に記載の方法。
[C19]
固定ビットレートを使用して前記ビデオデータをコーディングすることをさらに備える、C11に記載の方法。
[C20]
前記ビデオデータのコンテンツの前記タイプが、自然コンテンツ、合成コンテンツ、コンピュータグラフィックス、またはフラクタルのうちの1つを備える、C11に記載の方法。
[C21]
コンピュータハードウェアを備えるプロセッサ上で実行されたとき、
メモリにビデオデータを記憶することと、前記メモリがバッファを含む、
コーディングされるべき前記ビデオデータを受信することと、
前記ビデオデータのコンテンツのタイプと、コンテンツの前記タイプに関連付けられたレートひずみモデルとを考慮することなしに、前記ビデオデータの現在ブロックの量子化パラメータ(QP)を決定することと、
前記決定されたQPを使用して、ビットストリーム中で前記現在ブロックをコーディングすることとを前記プロセッサに行わせる命令を備える非一時的コンピュータ可読媒体。
[C22]
前記命令が、
(1)前記現在ブロックのためのビットバジェットと、前のブロックを符号化するために使用されたビットの数との間の差と、(2)前記現在ブロックのための前記ビットバジェットと、前記前のブロックを符号化するために使用されたビットの前記数との間の前記差の関数である、前記QPを調整するための第1の値とに少なくとも部分的に基づいて、前記QPを決定することを前記プロセッサにさらに行わせる、C21に記載のコンピュータ可読媒体。
[C23]
前記命令が、式、すなわち、前記前のブロックのQP+前記第1の値*(前記現在ブロックのための前記ビットバジェットと、前記前のブロックを符号化するためのビットの前記数との間の前記差>0?1:−1)、に従って前記QPを決定することを前記プロセッサにさらに行わせる、C22に記載のコンピュータ可読媒体。
[C24]
前記命令は、
2つまたはそれ以上のしきい値によって定義される複数の範囲を定義することと、前記複数の範囲の各々が所定の値に関連付けられた、
前記複数の範囲のうちのいずれが、前記現在ブロックのための前記ビットバジェットと、前記前のブロックを符号化するためのビットの前記数との間の前記差を含むかを決定することと、
前記第1の値を、前記決定された範囲に関連付けられた前記所定の値に設定することとを前記プロセッサにさらに行わせる、C22に記載のコンピュータ可読媒体。
[C25]
前記ビデオデータのコンテンツの前記タイプが、自然コンテンツ、合成コンテンツ、コンピュータグラフィックス、またはフラクタルのうちの1つを備える、C21に記載のコンピュータ可読媒体。
[C26]
ビデオ情報をコーディングするための装置であって、
メモリにビデオデータを記憶するための手段と、前記メモリがバッファを含む、
コーディングされるべき前記ビデオデータを受信するための手段と、
前記ビデオデータのコンテンツのタイプと、コンテンツの前記タイプに関連付けられたレートひずみモデルとを考慮することなしに、前記ビデオデータの現在ブロックの量子化パラメータ(QP)を決定するための手段と、
前記決定されたQPを使用して、ビットストリーム中で前記現在ブロックをコーディングするための手段とを備える、装置。
[C27]
前記QPを決定するための前記手段が、
(1)前記現在ブロックのためのビットバジェットと、前のブロックを符号化するために使用されたビットの数との間の差と、(2)前記現在ブロックのための前記ビットバジェットと、前記前のブロックを符号化するために使用されたビットの前記数との間の前記差の関数である、前記QPを調整するための第1の値とに少なくとも部分的に基づいて、前記QPを決定するようにさらに構成された、C26に記載の装置。
[C28]
前記QPを決定するための前記手段が、式、すなわち、前記前のブロックのQP+前記第1の値*(前記現在ブロックのための前記ビットバジェットと、前記前のブロックを符号化するためのビットの前記数との間の前記差>0?1:−1)、に従って前記QPを決定するようにさらに構成された、C27に記載の装置。
[C29]
前記QPを決定するための前記手段は、
2つまたはそれ以上のしきい値によって定義される複数の範囲を定義することと、前記複数の範囲の各々が所定の値に関連付けられた、
前記複数の範囲のうちのいずれが、前記現在ブロックのための前記ビットバジェットと、前記前のブロックを符号化するためのビットの前記数との間の前記差を含むかを決定することと、
前記第1の値を、前記決定された範囲に関連付けられた前記所定の値に設定することとを行うようにさらに構成された、C27に記載の装置。
[C30]
前記ビデオデータのコンテンツの前記タイプが、自然コンテンツ、合成コンテンツ、コンピュータグラフィックス、またはフラクタルのうちの1つを備える、C26に記載の装置。

Claims (24)

  1. ビデオデータをコーディングするための装置であって、
    前記ビデオデータを記憶するためのメモリと、前記メモリがバッファを含む、
    前記メモリに動作可能に結合され、
    コーディングされるべき前記ビデオデータを受信することと、
    前記ビデオデータの現在ブロックをコーディングするために割り振られたビットの数と、前記ビデオデータの前のブロックを符号化するために使用されたビットの数との間の差を決定することと、
    前記差が収まる、複数の範囲の中の1つの範囲を決定することと、
    前記決定された範囲に基づいて、量子化パラメータ(QP)を調整するための調整値を決定することと、
    前記決定された調整値に基づいて、前記現在ブロックの調整されたQPを決定することと、
    前記調整されたQPを使用して、ビットストリーム中で前記現在ブロックをコーディングすることと
    を行うように構成されたハードウェアプロセッサと
    を備え、
    ここにおいて、前記差は、前記前のブロックを符号化するために使用されたビットの前記数から前記現在ブロックをコーディングするために割り振られたビットの前記数を引くことによって決定され、前記現在ブロックをコーディングするために割り振られたビットの前記数が、(スライスのために残っているビットの数/前記スライス中でコーディングされるべきピクセルの数)*前記現在ブロック中のピクセルの数、と決定される、
    装置。
  2. 前記プロセッサが、式、すなわち、前記前のブロックのQP+前記決定された範囲に関連付けられた前記値*(前記差>0?1:−1)、に従って前記現在ブロックの前記QPを決定するように構成された、請求項1に記載の装置。
  3. 前記複数の範囲は、2つまたはそれ以上のしきい値によって定義され、前記複数の範囲の各々は、前記QPを調整するためのそれぞれの調整値に関連付けられる、請求項1に記載の装置。
  4. 前記プロセッサは、
    前記バッファのフルネスを決定することと、
    前記バッファの前記フルネスが、1つまたは複数のしきい値よりも大きいかまたはそれに等しいと決定したことに応答して、前記調整されたQPを、前記1つまたは複数のしきい値に関連付けられた第2の調整値だけ調整することと
    を行うようにさらに構成された、請求項1に記載の装置。
  5. 前記プロセッサは、
    前記バッファのフルネスを決定することと、
    前記バッファの前記フルネスが、1つまたは複数のしきい値よりも小さいかまたはそれに等しいと決定したことに応答して、前記調整されたQPを、前記1つまたは複数のしきい値に関連付けられた第2の調整値だけ調整することと
    を行うようにさらに構成された、請求項1に記載の装置。
  6. 前記プロセッサは、
    前記現在ブロックの平坦度を決定することと、
    前記現在ブロックの前記平坦度が、1つまたは複数のしきい値よりも大きいかまたはそれに等しいと決定したことに応答して、前記QPを、前記1つまたは複数のしきい値に関連付けられたQP値に等しく設定することと
    を行うようにさらに構成された、請求項1に記載の装置。
  7. 前記プロセッサが、固定ビットレートを使用して前記ビデオデータをコーディングするようにさらに構成された、請求項1に記載の装置。
  8. 前記ビデオデータのコンテンツのタイプが、自然コンテンツ、合成コンテンツ、コンピュータグラフィックス、またはフラクタルのうちの1つを備える、請求項1に記載の装置。
  9. ビデオデータをコーディングする方法であって、
    メモリに前記ビデオデータを記憶することと、前記メモリがバッファを含む、
    コーディングされるべき前記ビデオデータを受信することと、
    前記ビデオデータの現在ブロックをコーディングするために割り振られたビットの数と、前記ビデオデータの前のブロックを符号化するために使用されたビットの数との間の差を決定することと、
    前記差が収まる、複数の範囲の中の1つの範囲を決定することと、
    前記決定された範囲に基づいて、量子化パラメータ(QP)を調整するための調整値を決定することと、
    前記決定された調整値に基づいて、前記現在ブロックの調整されたQPを決定することと、
    前記調整されたQPを使用して、ビットストリーム中で前記現在ブロックをコーディングすることと
    を備え、
    ここにおいて、前記差は、前記前のブロックを符号化するために使用されたビットの前記数から前記現在ブロックをコーディングするために割り振られたビットの前記数を引くことによって決定され、前記現在ブロックをコーディングするために割り振られたビットの前記数が、(スライスのために残っているビットの数/前記スライス中でコーディングされるべきピクセルの数)*前記現在ブロック中のピクセルの数、と決定される、
    方法。
  10. 前記現在ブロックの前記QPが、式、すなわち、前記前のブロックのQP+前記決定された範囲に関連付けられた前記値*(前記差>0?1:−1)、に従って決定される、請求項に記載の方法。
  11. 複数の範囲は、2つまたはそれ以上のしきい値によって定義され、前記複数の範囲の各々は、前記QPを調整するためのそれぞれの調整値に関連付けられる、請求項に記載の方法。
  12. 前記バッファのフルネスを決定することと、
    前記バッファの前記フルネスが、1つまたは複数のしきい値よりも大きいかまたはそれに等しいと決定したことに応答して、前記調整されたQPを、前記1つまたは複数のしきい値に関連付けられた第2の調整値だけ調整することと
    をさらに備える、請求項に記載の方法。
  13. 前記バッファのフルネスを決定することと、
    前記バッファの前記フルネスが、1つまたは複数のしきい値よりも小さいかまたはそれに等しいと決定したことに応答して、前記調整されたQPを、前記1つまたは複数のしきい値に関連付けられた第2の調整値だけ調整することと
    をさらに備える、請求項に記載の方法。
  14. 前記現在ブロックの平坦度を決定することと、
    前記現在ブロックの前記平坦度が、1つまたは複数のしきい値よりも大きいかまたはそれに等しいと決定したことに応答して、前記QPを、前記1つまたは複数のしきい値に関連付けられたQP値に等しく設定することと
    をさらに備える、請求項に記載の方法。
  15. 固定ビットレートを使用して前記ビデオデータをコーディングすることをさらに備える、請求項に記載の方法。
  16. 前記ビデオデータのコンテンツのタイプが、自然コンテンツ、合成コンテンツ、コンピュータグラフィックス、またはフラクタルのうちの1つを備える、請求項に記載の方法。
  17. コンピュータハードウェアを備えるプロセッサ上で実行されたとき、
    メモリにビデオデータを記憶することと、前記メモリがバッファを含む、
    コーディングされるべき前記ビデオデータを受信することと、
    前記ビデオデータの現在ブロックをコーディングするために割り振られたビットの数と、前記ビデオデータの前のブロックを符号化するために使用されたビットの数との間の差を決定することと、
    前記差が収まる、複数の範囲の中の1つの範囲を決定することと、
    前記決定された範囲に基づいて、量子化パラメータ(QP)を調整するための調整値を決定することと、
    前記決定された調整値に基づいて、前記現在ブロックの調整されたQPを決定することと、
    前記調整されたQPを使用して、ビットストリーム中で前記現在ブロックをコーディングすることと
    を前記プロセッサに行わせる命令を備え、
    ここにおいて、前記差は、前記前のブロックを符号化するために使用されたビットの前記数から前記現在ブロックをコーディングするために割り振られたビットの前記数を引くことによって決定され、前記現在ブロックをコーディングするために割り振られたビットの前記数が、(スライスのために残っているビットの数/前記スライス中でコーディングされるべきピクセルの数)*前記現在ブロック中のピクセルの数、と決定される、
    非一時的コンピュータ可読媒体。
  18. 前記命令が、式、すなわち、前記前のブロックのQP+前記決定された範囲に関連付けられた前記値*(前記差>0?1:−1)、に従って前記現在ブロックの前記QPを決定することを前記プロセッサにさらに行わせる、請求項17に記載のコンピュータ可読媒体。
  19. 前記複数の範囲は、2つまたはそれ以上のしきい値によって定義され、前記複数の範囲の各々は、前記QPを調整するためのそれぞれの調整値に関連付けられる、請求項17に記載のコンピュータ可読媒体。
  20. 前記ビデオデータのコンテンツのタイプが、自然コンテンツ、合成コンテンツ、コンピュータグラフィックス、またはフラクタルのうちの1つを備える、請求項17に記載のコンピュータ可読媒体。
  21. ビデオ情報をコーディングするための装置であって、
    メモリにビデオデータを記憶するための手段と、前記メモリがバッファを含む、
    コーディングされるべき前記ビデオデータを受信するための手段と、
    前記ビデオデータの現在ブロックをコーディングするために割り振られたビットの数と、前記ビデオデータの前のブロックを符号化するために使用されたビットの数との間の差を決定するための手段と、
    前記差が収まる、複数の範囲の中の1つの範囲を決定するための手段と、
    前記決定された範囲に基づいて、量子化パラメータ(QP)を調整するための調整値を決定するための手段と、
    前記決定された調整値に基づいて、前記現在ブロックの調整されたQPを決定するための手段と、
    前記調整されたQPを使用して、ビットストリーム中で前記現在ブロックをコーディングするための手段と
    を備え、
    ここにおいて、前記差は、前記前のブロックを符号化するために使用されたビットの前記数から前記現在ブロックをコーディングするために割り振られたビットの前記数を引くことによって決定され、前記現在ブロックをコーディングするために割り振られたビットの前記数が、(スライスのために残っているビットの数/前記スライス中でコーディングされるべきピクセルの数)*前記現在ブロック中のピクセルの数、と決定される、
    装置。
  22. 前記QPを決定するための前記手段が、式、すなわち、前記前のブロックのQP+前記決定された範囲に関連付けられた前記値*(前記差>0?1:−1)、に従って前記現在ブロックの前記QPを決定するようにさらに構成された、請求項21に記載の装置。
  23. 前記複数の範囲は、2つまたはそれ以上のしきい値によって定義され、前記複数の範囲の各々は、前記QPを調整するためのそれぞれの調整値に関連付けられる、請求項21に記載の装置。
  24. 前記ビデオデータのコンテンツのタイプが、自然コンテンツ、合成コンテンツ、コンピュータグラフィックス、またはフラクタルのうちの1つを備える、請求項21に記載の装置。
JP2016562506A 2014-04-15 2015-04-14 ディスプレイストリーム圧縮(dsc)において量子化パラメータ(qp)を選択するためのシステムおよび方法 Active JP6449329B2 (ja)

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
US201461979868P 2014-04-15 2014-04-15
US61/979,868 2014-04-15
US201462034680P 2014-08-07 2014-08-07
US62/034,680 2014-08-07
US14/685,430 US9848193B2 (en) 2014-04-15 2015-04-13 System and method for selecting quantization parameter (QP) in display stream compression (DSC)
US14/685,430 2015-04-13
PCT/US2015/025742 WO2015160801A2 (en) 2014-04-15 2015-04-14 System and method for selecting quantization parameter (qp) in display stream compression (dsc)

Publications (3)

Publication Number Publication Date
JP2017515378A JP2017515378A (ja) 2017-06-08
JP2017515378A5 JP2017515378A5 (ja) 2018-04-26
JP6449329B2 true JP6449329B2 (ja) 2019-01-09

Family

ID=54266171

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016562506A Active JP6449329B2 (ja) 2014-04-15 2015-04-14 ディスプレイストリーム圧縮(dsc)において量子化パラメータ(qp)を選択するためのシステムおよび方法

Country Status (8)

Country Link
US (1) US9848193B2 (ja)
EP (1) EP3132602B1 (ja)
JP (1) JP6449329B2 (ja)
KR (1) KR101941760B1 (ja)
CN (1) CN106165418B (ja)
BR (1) BR112016024218A8 (ja)
MX (1) MX358538B (ja)
WO (1) WO2015160801A2 (ja)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10432952B2 (en) * 2015-11-19 2019-10-01 Qualcomm Incorporated System and methods for fixed-point approximations in display stream compression (DSC)
US10574988B2 (en) * 2015-11-19 2020-02-25 Qualcomm Incorporated System and methods for reducing slice boundary visual artifacts in display stream compression (DSC)
US10368073B2 (en) * 2015-12-07 2019-07-30 Qualcomm Incorporated Multi-region search range for block prediction mode for display stream compression (DSC)
US10555002B2 (en) * 2016-01-21 2020-02-04 Intel Corporation Long term reference picture coding
US20170280139A1 (en) 2016-03-22 2017-09-28 Qualcomm Incorporated Apparatus and methods for adaptive calculation of quantization parameters in display stream compression
US10432936B2 (en) * 2016-04-14 2019-10-01 Qualcomm Incorporated Apparatus and methods for perceptual quantization parameter (QP) weighting for display stream compression
US10855989B2 (en) * 2016-06-09 2020-12-01 Qualcomm Incorporated Substream multiplexing for display stream compression
CN109996076B (zh) * 2016-10-12 2021-08-06 深圳市大疆创新科技有限公司 码率控制的方法、计算机***和装置
CN109429069B (zh) * 2017-08-23 2021-08-24 珠海全志科技股份有限公司 一种显示流压缩编码器以及显示引擎
US11368692B2 (en) * 2018-10-31 2022-06-21 Ati Technologies Ulc Content adaptive quantization strength and bitrate modeling
US11546617B2 (en) 2020-06-30 2023-01-03 At&T Mobility Ii Llc Separation of graphics from natural video in streaming video content

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3189257B2 (ja) * 1992-05-21 2001-07-16 ソニー株式会社 画像符号器
JP2002051221A (ja) * 2000-08-01 2002-02-15 Canon Inc 画像符号化装置、画像復号化装置、システム、及びその方法並びに記憶媒体
US6831947B2 (en) * 2001-03-23 2004-12-14 Sharp Laboratories Of America, Inc. Adaptive quantization based on bit rate prediction and prediction error energy
EP2123040B1 (en) 2006-12-12 2017-12-06 Vantrix Corporation An improved video rate control for video coding standards
ES2931465T3 (es) * 2007-03-14 2022-12-29 Nippon Telegraph & Telephone Método y aparato de control de cuantificación, programa para el mismo y medio de almacenamiento que almacena el programa
US8295344B2 (en) * 2007-10-22 2012-10-23 Broadcom Corporation Adaptive rate control for encoding of variable frame rate video sources
US8897365B2 (en) * 2008-11-19 2014-11-25 Nvidia Corporation Video rate control processor for a video encoding process
JP5197329B2 (ja) * 2008-11-28 2013-05-15 キヤノン株式会社 符号化装置及び符号化方法
JP5257215B2 (ja) * 2009-04-16 2013-08-07 ソニー株式会社 画像符号化装置と画像符号化方法
JP5342391B2 (ja) * 2009-09-25 2013-11-13 株式会社メガチップス 画像処理装置
US9185424B2 (en) * 2011-07-05 2015-11-10 Qualcomm Incorporated Image data compression
US9451250B2 (en) 2012-10-03 2016-09-20 Broadcom Corporation Bounded rate compression with rate control for slices

Also Published As

Publication number Publication date
EP3132602B1 (en) 2021-04-14
US20150296206A1 (en) 2015-10-15
BR112016024218A2 (pt) 2017-08-15
EP3132602A2 (en) 2017-02-22
KR101941760B1 (ko) 2019-01-23
CN106165418B (zh) 2019-07-05
US9848193B2 (en) 2017-12-19
BR112016024218A8 (pt) 2021-07-13
CN106165418A (zh) 2016-11-23
KR20160145088A (ko) 2016-12-19
JP2017515378A (ja) 2017-06-08
WO2015160801A2 (en) 2015-10-22
MX2016013225A (es) 2017-01-18
MX358538B (es) 2018-08-24
WO2015160801A3 (en) 2016-02-25

Similar Documents

Publication Publication Date Title
JP6449329B2 (ja) ディスプレイストリーム圧縮(dsc)において量子化パラメータ(qp)を選択するためのシステムおよび方法
US10244255B2 (en) Rate-constrained fallback mode for display stream compression
US10284849B2 (en) Quantization parameter (QP) calculation for display stream compression (DSC) based on complexity measure
KR101975093B1 (ko) 디스플레이 스트림 압축 (dsc) 을 위한 라그랑지안 파라미터 계산을 위한 시스템 및 방법
US10631005B2 (en) System and method for coding in block prediction mode for display stream compression (DSC)
JP6464192B2 (ja) ディスプレイストリーム圧縮(dsc)のための平坦度検出のためのシステムおよび方法
JP2018534875A (ja) ディスプレイストリーム圧縮(dsc)におけるスライス境界視覚アーティファクトを減らすためのシステムおよび方法
US9936203B2 (en) Complex region detection for display stream compression
JP2019512970A (ja) ディスプレイストリーム圧縮における量子化パラメータの適応計算のための装置および方法
US9843816B2 (en) System and method for coding in pattern mode for display stream compression (DSC)
JP2019514290A (ja) ディスプレイストリーム圧縮用の知覚的量子化パラメータ(qp)重み付けのための装置および方法
JP2018525901A (ja) ディスプレイストリーム圧縮における変換モード用ブロックサイズの変更

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180315

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180315

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20180315

A975 Report on accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A971005

Effective date: 20180625

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20180625

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20180703

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20181003

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20181005

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20181106

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20181205

R150 Certificate of patent or registration of utility model

Ref document number: 6449329

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250