JP6449329B2

JP6449329B2 - ディスプレイストリーム圧縮（ｄｓｃ）において量子化パラメータ（ｑｐ）を選択するためのシステムおよび方法

Info

Publication number: JP6449329B2
Application number: JP2016562506A
Authority: JP
Inventors: ティルマライ、ビジャヤラグハバン; ジェイコブソン、ナタン・ハイム; ジョシ、ラジャン・ラクスマン
Original assignee: Qualcomm Inc
Current assignee: Qualcomm Inc
Priority date: 2014-04-15
Filing date: 2015-04-14
Publication date: 2019-01-09
Anticipated expiration: 2035-04-14
Also published as: EP3132602B1; US20150296206A1; BR112016024218A2; EP3132602A2; KR101941760B1; CN106165418B; US9848193B2; BR112016024218A8; CN106165418A; KR20160145088A; JP2017515378A; WO2015160801A2; MX2016013225A; MX358538B; WO2015160801A3

Description

[0001]本開示は、ビデオコーディングおよび圧縮の分野に関し、詳細には、ディスプレイストリーム圧縮（ＤＳＣ：display stream compression）など、ディスプレイリンクを介した送信のためのビデオ圧縮に関する。

[0002]デジタルビデオ機能は、デジタルテレビジョン、携帯情報端末（ＰＤＡ）、ラップトップコンピュータ、デスクトップモニタ、デジタルカメラ、デジタル記録デバイス、デジタルメディアプレーヤ、ビデオゲームデバイス、ビデオゲームコンソール、セルラー電話または衛星無線電話、ビデオ遠隔会議デバイスなどを含む、広範囲にわたるディスプレイに組み込まれ得る。適切なソースデバイスにディスプレイを接続するために、ディスプレイリンクが使用される。ディスプレイリンクの帯域幅要件はディスプレイの解像度に比例し、したがって、高解像度ディスプレイは、大きい帯域幅のディスプレイリンクを必要とする。いくつかのディスプレイリンクは、高解像度ディスプレイをサポートするための帯域幅を有しない。高解像度ディスプレイにデジタルビデオを与えるためにより低い帯域幅のディスプレイリンクが使用され得るように帯域幅要件を低減するために、ビデオ圧縮が使用され得る。

[0003]他のものが、ピクセルデータに対して画像圧縮を利用することを試みた。しかしながら、そのような方式は、時々視覚的ロスレスでないか、または従来のディスプレイデバイスにおいて実装することが困難で費用がかかることがある。

[0004]ビデオエレクトロニクス規格協会（ＶＥＳＡ：Video Electronics Standards Association）は、ディスプレイリンクビデオ圧縮のための規格として、ディスプレイストリーム圧縮（ＤＳＣ）を開発した。ＤＳＣなど、ディスプレイリンクビデオ圧縮技法は、特に、視覚的ロスレスである（すなわち、圧縮がアクティブであることをユーザがわからないほど十分に良好である）ピクチャ品質を与えるべきである。ディスプレイリンクビデオ圧縮技法はまた、従来のハードウェアを用いてリアルタイムに実装することが容易で費用がかからない方式を与えるべきである。

[0005]本開示のシステム、方法およびデバイスは、それぞれいくつかの発明的態様を有し、それらのうちの単一の態様が、本明細書で開示する望ましい属性を単独で担当するとは限らない。

[0006]一態様では、ビデオデータをコーディングするための装置が、ビデオデータを記憶するためのメモリと、プロセッサとを含む。メモリはバッファを含む。プロセッサは、コーディングされるべきビデオデータを受信するように構成される。プロセッサは、ビデオデータのコンテンツのタイプと、コンテンツのタイプに関連付けられたレートひずみモデルとを考慮することなしに、ビデオデータの現在ブロックの量子化パラメータ（ＱＰ）を決定するようにさらに構成される。プロセッサはまた、決定されたＱＰを使用して、ビットストリーム中で現在ブロックをコーディングするように構成される。

[0007]本開示で説明する態様による技法を利用し得る例示的なビデオ符号化および復号システムを示すブロック図。 [0008]本開示で説明する態様による技法を実行し得る別の例示的なビデオ符号化および復号システムを示すブロック図。 [0009]本開示で説明する態様による技法を実装し得るビデオエンコーダの一例を示すブロック図。 [0010]本開示で説明する態様による技法を実装し得るビデオデコーダの一例を示すブロック図。 [0011]本開示で説明する態様による中のＱＰ選択のための方法を示すフローチャート。

[0012]一般に、本開示は、ディスプレイストリーム圧縮（ＤＳＣ）など、ビデオ圧縮技法のコンテキストにおいて量子化パラメータ（ＱＰ）を選択するための技法に関する。より詳細には、本開示は、レートひずみモデルを考慮することなしに、ＱＰを計算するための（たとえば、計算（または決定）を実行するためのレートひずみモデルの利用なしに、ＱＰを計算（または決定）するための）システムおよび方法に関する。

[0013]いくつかの実施形態について、ＤＳＣ規格のコンテキストにおいて本明細書で説明するが、本明細書で開示するシステムおよび方法が任意の好適なビデオコーディング規格に適用可能であり得ることを、当業者は諒解されよう。たとえば、本明細書で開示する実施形態は、以下の規格、すなわち、国際電気通信連合（ＩＴＵ）電気通信標準化部門（ＩＴＵ−Ｔ）Ｈ．２６１、国際標準化機構／国際電気標準会議（ＩＳＯ／ＩＥＣ）ムービングピクチャエキスパートグループ１（ＭＰＥＧ−１）Ｖｉｓｕａｌ、ＩＴＵ−ＴＨ．２６２またはＩＳＯ／ＩＥＣＭＰＥＧ−２Ｖｉｓｕａｌ、ＩＴＵ−ＴＨ．２６３、ＩＳＯ／ＩＥＣＭＰＥＧ−４Ｖｉｓｕａｌ、（ＩＳＯ／ＩＥＣＭＰＥＧ−４ＡＶＣとしても知られる）ＩＴＵ−ＴＨ．２６４、および高効率ビデオコーディング（ＨＥＶＣ）のうちの１つまたは複数、ならびにそのような規格の拡張に適用可能であり得る。また、本開示で説明する技法は、将来開発される規格の一部になり得る。言い換えれば、本開示で説明する技法は、前に開発されたビデオコーディング規格、現在開発中のビデオコーディング規格、および次のビデオコーディング規格に適用可能であり得る。

[0014]ＱＰを計算することは、レート制御プロセスにおいて望ましいステップであり得、コーディング方式のレートひずみ（ＲＤ：rate-distortion）性能に大きい影響を及ぼし得る。一実施形態では、ＱＰは、経験的レートひずみモデルを必要とするレートひずみ関係を最適化するように選択される。たとえば、ＱＰは、所与のレートひずみ経験的モデルに最も良く適合するように計算され得る。この手法は、特定のコンテンツ、たとえば、自然コンテンツで動作するとき、うまく動作し得る。しかしながら、自然グラフィックス、合成グラフィックス、コンピュータグラフィックス、フラクタルなどを含むいくつかのタイプのコンテンツで動作するとき、異なるタイプのコンテンツについて効率的に動作するレートひずみモデルを確立することは困難であり得る。たとえば、レートひずみモデルのための単一の閉形式表現を確立することは困難であり得る。この困難を克服するために、レートひずみモデルの知識を必要としないかまたはレートひずみモデルに依存しないＱＰを計算するための方法を実装することが望ましいことがある。

[0015]これらおよび他の困難に対処するために、いくつかの態様による技法は、レートひずみモデルを考慮することなしに最適ＱＰを決定することができる。レートひずみモデルは、ＤＳＣにおける１つまたは複数のコーディングモード、あるいは１つまたは複数の異なるタイプのコンテンツに関連付けられ得る。レートひずみモデルは、経験的データに基づき得る。一実施形態では、本技法は、（１）現在ブロックのためのビットバジェット（たとえば、コーディングのための割り振られたビットの数）と、前のブロックを符号化するためのビットの数との間の差と、（２）現在ブロックのためのビットバジェットと、前のブロックを符号化するためのビットの数との間の差の関数であるＱＰ調整値とに基づいて、ＱＰを決定することができる。現在ブロックのための決定されたＱＰは、バッファフルネス（buffer fullness）、現在ブロックの平坦度などに基づいてさらに調整され得る。

[0016]このようにして、本技法は、コーディングモードまたは特定のタイプのコンテンツに関連付けられた特定のレートひずみモデルに依拠することなしに、ＱＰ値を選択することができる。このことは、レートひずみを確立することが、時間がかかり、かなりの量の労力を伴うことがあるので、コストおよび／またはリソースを節約することができる。さらに、本技法は、異なるタイプのコンテンツでうまく動作するＱＰを決定することができる。
ビデオコーディング規格
[0017]ビデオ画像、ＴＶ画像、静止画像、あるいはビデオレコーダまたはコンピュータによって生成された画像など、デジタル画像は、水平ラインおよび垂直ラインで配列されたピクセルまたはサンプルを含み得る。単一の画像中のピクセルの数は一般に数万個である。各ピクセルは、一般に、ルミナンス情報とクロミナンス情報とを含んでいる。圧縮がなければ、画像エンコーダから画像デコーダに搬送されるべき情報の甚だしい量は、リアルタイム画像送信を実行不可能にするであろう。送信されるべき情報の量を低減するために、ＪＰＥＧ、ＭＰＥＧおよびＨ．２６３規格など、いくつかの異なる圧縮方法が開発された。

[0018]ビデオコーディング規格は、ＩＴＵ−ＴＨ．２６１と、ＩＳＯ／ＩＥＣＭＰＥＧ−１Ｖｉｓｕａｌと、ＩＴＵ−ＴＨ．２６２またはＩＳＯ／ＩＥＣＭＰＥＧ−２Ｖｉｓｕａｌと、ＩＴＵ−ＴＨ．２６３と、ＩＳＯ／ＩＥＣＭＰＥＧ−４Ｖｉｓｕａｌと、（ＩＳＯ／ＩＥＣＭＰＥＧ−４ＡＶＣとしても知られる）ＩＴＵ−ＴＨ．２６４と、そのような規格の拡張を含むＨＥＶＣとを含む。

[0019]さらに、ＶＥＳＡによって、あるビデオコーディング規格、すなわち、ＤＳＣが開発された。ＤＳＣ規格は、ディスプレイリンクを介した送信のためにビデオを圧縮することができるビデオ圧縮規格である。ディスプレイの解像度が増加するにつれて、ディスプレイを駆動するために必要とされるビデオデータの帯域幅は、対応して増加する。いくつかのディスプレイリンクは、そのような解像度についてディスプレイにビデオデータのすべてを送信するための帯域幅を有しないことがある。したがって、ＤＳＣ規格は、ディスプレイリンクを介した相互運用可能な、視覚的ロスレス圧縮のための圧縮規格を規定する。

[0020]ＤＳＣ規格は、Ｈ．２６４およびＨＥＶＣなど、他のビデオコーディング規格とは異なる。ＤＳＣは、フレーム内圧縮を含むが、フレーム間圧縮を含まず、これは、ビデオデータをコーディングする際にＤＳＣ規格によって時間的情報が使用されないことがあることを意味する。対照的に、他のビデオコーディング規格は、それらのビデオコーディング技法においてフレーム間圧縮を採用し得る。
ビデオコーディングシステム
[0021]添付の図面を参照しながら新規のシステム、装置、および方法の様々な態様について以下でより十分に説明する。ただし、本開示は、多くの異なる形態で実施され得、本開示全体にわたって提示する任意の特定の構造または機能に限定されるものと解釈されるべきではない。むしろ、これらの態様は、本開示が周到で完全になり、本開示の範囲を当業者に十分に伝えるために与えるものである。本明細書の教示に基づいて、本開示の範囲は、本開示の他の態様とは無関係に実装されるにせよ、本開示の他の態様と組み合わせて実装されるにせよ、本明細書で開示する新規のシステム、装置、および方法のいかなる態様をもカバーするものであることを、当業者なら諒解されたい。たとえば、本明細書に記載する態様をいくつ使用しても、装置は実装され得、または方法は実施され得る。さらに、本開示の範囲は、本明細書に記載する本開示の様々な態様に加えてまたはそれらの態様以外に、他の構造、機能、または構造および機能を使用して実施されるそのような装置または方法をカバーするものとする。本明細書で開示するどの態様も請求項の１つまたは複数の要素によって実施され得ることを理解されたい。

[0022]本明細書では特定の態様について説明するが、これらの態様の多くの変形および置換は本開示の範囲内に入る。好適な態様のいくつかの利益および利点について説明するが、本開示の範囲は特定の利益、使用、または目的に限定されるものではない。むしろ、本開示の態様は、様々なワイヤレス技術、システム構成、ネットワーク、および伝送プロトコルに広く適用可能であるものとし、そのうちのいくつかを例として図および好適な態様についての以下の説明で示す。発明を実施するための形態および図面は、本開示を限定するものではなく説明するものにすぎず、本開示の範囲は添付の特許請求の範囲およびそれの均等物によって定義される。

[0023]添付の図面は例を示している。添付の図面中の参照番号によって示される要素は、以下の説明における同様の参照番号によって示される要素に対応する。本開示では、序数語（たとえば、「第１の」、「第２の」、「第３の」など）で始まる名前を有する要素は、必ずしもそれらの要素が特定の順序を有することを暗示するとは限らない。むしろ、そのような序数語は、同じまたは同様のタイプの異なる要素を指すために使用されるにすぎない。

[0024]図１Ａは、本開示で説明する態様による技法を利用し得る例示的なビデオコーディングシステム１０を示すブロック図である。本明細書で使用し説明する「ビデオコーダ」または「コーダ」という用語は、ビデオエンコーダとビデオデコーダの両方を総称的に指す。本開示では、「ビデオコーディング」または「コーディング」という用語は、ビデオ符号化とビデオ復号とを総称的に指すことがある。ビデオエンコーダおよびビデオデコーダに加えて、本出願で説明する態様は、トランスコーダ（たとえば、ビットストリームを復号し、別のビットストリームを再符号化することができるデバイス）およびミドルボックス（たとえば、ビットストリームを変更、変換、および／または場合によっては操作することができるデバイス）など、他の関係するデバイスに拡張され得る。

[0025]図１Ａに示されているように、ビデオコーディングシステム１０は、宛先デバイス１４によって後で復号されるべき符号化ビデオデータを生成するソースデバイス１２を含む。図１Ａの例では、ソースデバイス１２および宛先デバイス１４は、別個のデバイスを構成する。ただし、ソースデバイス１２および宛先デバイス１４は、図１Ｂの例に示されているように、同じデバイス上にあるかまたはそれの一部であり得ることに留意されたい。

[0026]もう一度図１Ａを参照すると、ソースデバイス１２および宛先デバイス１４は、それぞれ、デスクトップコンピュータ、ノートブック（たとえば、ラップトップ）コンピュータ、タブレットコンピュータ、セットトップボックス、いわゆる「スマート」フォンなどの電話ハンドセット、いわゆる「スマート」パッド、テレビジョン、カメラ、ディスプレイデバイス、デジタルメディアプレーヤ、ビデオゲームコンソール、ビデオストリーミングデバイスなどを含む、広範囲にわたるデバイスのいずれかを備え得る。様々な実施形態では、ソースデバイス１２および宛先デバイス１４は、ワイヤレス通信のために装備され得る。

[0027]宛先デバイス１４は、復号されるべき符号化ビデオデータをリンク１６を介して受信し得る。リンク１６は、ソースデバイス１２から宛先デバイス１４に符号化ビデオデータを移動することが可能な任意のタイプの媒体またはデバイスを備え得る。図１Ａの例では、リンク１６は、ソースデバイス１２が符号化ビデオデータをリアルタイムで宛先デバイス１４に送信することを可能にするための通信媒体を備え得る。符号化ビデオデータは、ワイヤレス通信プロトコルなどの通信規格に従って変調され、宛先デバイス１４に送信され得る。通信媒体は、無線周波数（ＲＦ）スペクトルあるいは１つまたは複数の物理伝送線路など、任意のワイヤレスまたはワイヤード通信媒体を備え得る。通信媒体は、ローカルエリアネットワーク、ワイドエリアネットワーク、またはインターネットなどのグローバルネットワークなど、パケットベースネットワークの一部を形成し得る。通信媒体は、ルータ、スイッチ、基地局、またはソースデバイス１２から宛先デバイス１４への通信を可能にするために有用であり得る任意の他の機器を含み得る。

[0028]図１Ａの例では、ソースデバイス１２は、ビデオソース１８と、ビデオエンコーダ２０と、出力インターフェース２２とを含む。場合によっては、出力インターフェース２２は、変調器／復調器（モデム）および／または送信機を含み得る。ソースデバイス１２において、ビデオソース１８は、ビデオキャプチャデバイス、たとえばビデオカメラ、以前にキャプチャされたビデオを含んでいるビデオアーカイブ、ビデオコンテンツプロバイダからビデオを受信するためのビデオフィードインターフェース、および／またはソースビデオとしてコンピュータグラフィックスデータを生成するためのコンピュータグラフィックスシステムなどのソース、あるいはそのようなソースの組合せを含み得る。一例として、ビデオソース１８がビデオカメラである場合、ソースデバイス１２および宛先デバイス１４は、図１Ｂの例に示されているように、いわゆる「カメラフォン」または「ビデオフォン」を形成し得る。ただし、本開示で説明する技法は、概してビデオコーディングに適用可能であり得、ワイヤレスおよび／またはワイヤード適用例に適用され得る。

[0029]キャプチャされたビデオ、以前にキャプチャされたビデオ、またはコンピュータ生成されたビデオは、ビデオエンコーダ２０によって符号化され得る。符号化ビデオデータは、ソースデバイス１２の出力インターフェース２２を介して宛先デバイス１４に送信され得る。符号化ビデオデータは、さらに（または代替として）、復号および／または再生のための宛先デバイス１４または他のデバイスによる後のアクセスのためにストレージデバイス３１上に記憶され得る。図１Ａおよび図１Ｂに示されているビデオエンコーダ２０は、図２Ａ示されているビデオエンコーダ２０、または本明細書で説明する他のビデオエンコーダを備え得る。

[0030]図１Ａの例では、宛先デバイス１４は、入力インターフェース２８と、ビデオデコーダ３０と、ディスプレイデバイス３２とを含む。場合によっては、入力インターフェース２８は、受信機および／またはモデムを含み得る。宛先デバイス１４の入力インターフェース２８は、リンク１６を介しておよび／またはストレージデバイス３１から符号化ビデオデータを受信し得る。リンク１６を介して通信され、またはストレージデバイス３１上に与えられた符号化ビデオデータは、ビデオデータを復号する際に、ビデオデコーダ３０などのビデオデコーダが使用するためのビデオエンコーダ２０によって生成される様々なシンタックス要素を含み得る。そのようなシンタックス要素は、通信媒体上で送信された、記憶媒体上に記憶された、またはファイルサーバ記憶された符号化ビデオデータに含まれ得る。

[0031]ディスプレイデバイス３２は、宛先デバイス１４と一体化されるかまたはその外部にあり得る。いくつかの例では、宛先デバイス１４は、一体型ディスプレイデバイスを含み、また、外部ディスプレイデバイスとインターフェースするように構成され得る。他の例では、宛先デバイス１４はディスプレイデバイスであり得る。概して、ディスプレイデバイス３２は、復号ビデオデータをユーザに対して表示し、液晶ディスプレイ（ＬＣＤ）、プラズマディスプレイ、有機発光ダイオード（ＯＬＥＤ）ディスプレイ、または別のタイプのディスプレイデバイスなど、様々なディスプレイデバイスのいずれかを備え得る。

[0032]関係する態様では、図１Ｂは例示的なビデオコーディングシステム１０’を示し、ここにおいて、ソースデバイス１２および宛先デバイス１４はデバイス１１上にあるかまたはそれの一部である。デバイス１１は、「スマート」フォンなどの電話ハンドセットであり得る。デバイス１１は、ソースデバイス１２および宛先デバイス１４と動作可能に通信している（随意に存在する）コントローラ／プロセッサデバイス１３を含み得る。図１Ｂのビデオコーディングシステム１０’およびそれの構成要素（components）は、場合によっては図１Ａのビデオコーディングシステム１０およびそれの構成要素と同様である。

[0033]ビデオエンコーダ２０およびビデオデコーダ３０は、ＤＳＣなどのビデオ圧縮規格に従って動作し得る。代替的に、ビデオエンコーダ２０およびビデオデコーダ３０は、代替的にＭＰＥＧ−４，Ｐａｒｔ１０，ＡＶＣと呼ばれるＩＴＵ−ＴＨ．２６４規格、ＨＥＶＣなど、他のプロプライエタリ規格または業界規格、またはそのような規格の拡張に従って動作し得る。ただし、本開示の技法は、いかなる特定のコーディング規格にも限定されない。ビデオ圧縮規格の他の例としてはＭＰＥＧ−２およびＩＴＵ−ＴＨ．２６３がある。

[0034]図１Ａおよび図１Ｂの例には示されていないが、ビデオエンコーダ２０およびビデオデコーダ３０は、それぞれオーディオエンコーダおよびデコーダと統合され得、共通のデータストリームまたは別個のデータストリーム中のオーディオとビデオの両方の符号化を処理するために、適切なＭＵＸ−ＤＥＭＵＸユニット、または他のハードウェアおよびソフトウェアを含み得る。適用可能な場合、いくつかの例では、ＭＵＸ−ＤＥＭＵＸユニットは、ＩＴＵＨ．２２３マルチプレクサプロトコル、またはユーザデータグラムプロトコル（ＵＤＰ）などの他のプロトコルに準拠し得る。

[0035]ビデオエンコーダ２０およびビデオデコーダ３０はそれぞれ、１つまたは複数のマイクロプロセッサ、デジタル信号プロセッサ（ＤＳＰ）、特定用途向け集積回路（ＡＳＩＣ）、フィールドプログラマブルゲートアレイ（ＦＰＧＡ）、ディスクリート論理、ソフトウェア、ハードウェア、ファームウェアなど、様々な好適なエンコーダ回路のいずれか、またはそれらの任意の組合せとして実装され得る。本技法が部分的にソフトウェアで実装されるとき、デバイスは、好適な非一時的コンピュータ可読媒体にソフトウェアの命令を記憶し、１つまたは複数のプロセッサを使用してその命令をハードウェアで実行して、本開示の技法を実行し得る。ビデオエンコーダ２０およびビデオデコーダ３０の各々は１つまたは複数のエンコーダまたはデコーダ中に含まれ得、そのいずれも、それぞれのデバイスにおいて複合エンコーダ／デコーダの一部として統合され得る。
ビデオコーディングプロセス
[0036]上記で手短に述べたように、ビデオエンコーダ２０はビデオデータを符号化する。ビデオデータは、１つまたは複数のピクチャを備え得る。ピクチャの各々は、ビデオの一部を形成する静止画像である。いくつかの事例では、ピクチャはビデオ「フレーム」と呼ばれることがある。ビデオエンコーダ２０がビデオデータを符号化するとき、ビデオエンコーダ２０はビットストリームを生成し得る。ビットストリームは、ビデオデータのコード化表現を形成するビットのシーケンスを含み得る。ビットストリームはコード化ピクチャと関連データとを含み得る。コード化ピクチャは、ピクチャのコード化表現である。

[0037]ビットストリームを生成するために、ビデオエンコーダ２０は、ビデオデータ中の各ピクチャに対して符号化演算を実行し得る。ビデオエンコーダ２０がピクチャに対して符号化演算を実行するとき、ビデオエンコーダ２０は、一連のコード化ピクチャと関連データとを生成し得る。関連データは、ＱＰなど、コーディングパラメータのセットを含み得る。コード化ピクチャを生成するために、ビデオエンコーダ２０は、ピクチャを等しいサイズのビデオブロックに区分し得る。ビデオブロックはサンプルの２次元アレイであり得る。コーディングパラメータは、ビデオデータのあらゆるブロックについてコーディングオプション（たとえば、コーディングモード）を定義し得る。コーディングオプションは、所望のレートひずみ性能を達成するために選択され得る。

[0038]いくつかの例では、ビデオエンコーダ２０はピクチャを複数のスライスに区分し得る。スライスの各々は、画像またはフレーム中の領域の残りからの情報なしに独立して復号され得る、画像（たとえば、フレーム）中の空間的に別個の領域を含み得る。各画像またはビデオフレームは単一のスライス中で符号化され得るか、またはそれはいくつかのスライス中で符号化され得る。ＤＳＣでは、各スライスを符号化するために割り振られるターゲットビットは、実質的に一定であり得る。ピクチャに対して符号化演算を実行することの一部として、ビデオエンコーダ２０は、ピクチャの各スライスに対して符号化演算を実行し得る。ビデオエンコーダ２０がスライスに対して符号化演算を実行するとき、ビデオエンコーダ２０は、スライスに関連付けられた符号化データを生成し得る。スライスに関連付けられた符号化データは「コード化スライス」と呼ばれることがある。
ＤＳＣビデオエンコーダ
[0039]図２Ａは、本開示で説明する態様による技法を実装し得るビデオエンコーダ２０の一例を示すブロック図である。ビデオエンコーダ２０は、本開示の技法の一部または全部を実行するように構成され得る。いくつかの例では、本開示で説明する技法は、ビデオエンコーダ２０の様々な構成要素間で共有され得る。いくつかの例では、追加または代替として、プロセッサ（図示せず）が、本開示で説明する技法の一部または全部を実行するように構成され得る。

[0040]説明の目的で、本開示では、ＤＳＣコーディングのコンテキストにおいてビデオエンコーダ２０について説明する。ただし、本開示の技法は、他のコーディング規格または方法に適用可能であり得る。

[0041]図２Ａの例では、ビデオエンコーダ２０は複数の機能構成要素を含む。ビデオエンコーダ２０の機能構成要素は、色空間変換器１０５と、バッファ１１０と、平坦度検出器１１５と、レートコントローラ１２０と、予測器、量子化器、および再構成器構成要素１２５と、ラインバッファ１３０と、インデックスカラー履歴１３５と、エントロピーエンコーダ１４０と、サブストリームマルチプレクサ１４５と、レートバッファ１５０とを含む。他の例では、ビデオエンコーダ２０は、より多数の、より少数の、または異なる機能構成要素を含み得る。

[0042]色空間１０５変換器は、入力色空間をコーディング実装形態において使用される色空間に変換し得る。たとえば、例示的な一実施形態では、入力ビデオデータの色空間は、赤、緑、および青（ＲＧＢ）色空間中にあり、コーディングは、ルミナンスＹ、クロミナンスグリーンＣｇ、およびクロミナンスオレンジＣｏ（ＹＣｇＣｏ）色空間において実装される。色空間変換は、ビデオデータへのシフトおよび追加を含む（１つまたは複数の）方法によって実行され得る。他の色空間中の入力ビデオデータが処理され得、他の色空間への変換も実行され得ることに留意されたい。

[0043]関係する態様では、ビデオエンコーダ２０は、バッファ１１０、ラインバッファ１３０、および／またはレートバッファ１５０を含み得る。たとえば、バッファ１１０は、色空間変換されたビデオデータを、ビデオエンコーダ２０の他の部分によるそれの使用に先立って保持し得る。別の例では、色空間変換されたデータはより多くのビットを必要とし得るので、ビデオデータはＲＧＢ色空間中で記憶され得、色空間変換が必要に応じて実行され得る。

[0044]レートバッファ１５０はビデオエンコーダ２０においてレート制御機構の一部として機能し得、このことについて、レートコントローラ１２０に関して以下でより詳細に説明する。各ブロックを符号化することに費やされるビットは、大いに、実質的に、ブロックの性質に基づいて変動することがある。レートバッファ１５０は、圧縮されたビデオにおけるレート変動を平滑化することができる。いくつかの実施形態では、ビットが固定ビットレート（ＣＢＲ）でバッファから取り出されるＣＢＲバッファモデルが採用される。ＣＢＲバッファモデルでは、ビデオエンコーダ２０がビットストリームにあまりに多くのビットを加えた場合、レートバッファ１５０はオーバーフローし得る。一方、ビデオエンコーダ２０は、レートバッファ１５０のアンダーフローを防ぐために、十分なビットを加えなければならない。

[0045]ビデオデコーダ側では、ビットは、固定ビットレートでビデオデコーダ３０のレートバッファ１５５（以下でさらに詳細に説明する図２Ｂを参照）に加えられ得、ビデオデコーダ３０は、各ブロックについて可変数のビットを削除し得る。適切な復号を保証するために、ビデオデコーダ３０のレートバッファ１５５は、圧縮されたビットストリームの復号中に「アンダーフロー」または「オーバーフロー」すべきでない。

[0046]いくつかの実施形態では、バッファフルネス（ＢＦ）は、バッファに現在あるビットの数を表す値ＢｕｆｆｅｒＣｕｒｒｅｎｔＳｉｚｅと、レートバッファ１５０のサイズ、すなわち、任意の時点においてレートバッファ１５０に記憶され得るビットの最大数を表すＢｕｆｆｅｒＭａｘＳｉｚｅとに基づいて定義され得る。ＢＦは次のように計算され得る。

[0047]平坦度検出器１１５は、ビデオデータ中の複雑な（complex）（すなわち、平坦でない）エリアからビデオデータ中の平坦な（flat）（すなわち、単純なまたは均一な）エリアへの変化を検出することができる。「複雑な」および「平坦な」という用語は、本明細書では、概して、ビデオエンコーダ２０がビデオデータのそれぞれの領域を符号化することの困難さを指すために使用する。したがって、本明細書で使用する「複雑な」という用語は、概して、ビデオデータの領域が、ビデオエンコーダ２０が符号化することが複雑または困難であることを表し、たとえば、テクスチャードビデオデータ、高い空間周波数、および／または符号化することが複雑である他の特徴を含み得る。たとえば、ビデオデータの領域は、領域を符号化するために必要とされるビットの数がしきい値よりも大きいとき、複雑な領域であると決定され得る。本明細書で使用する「平坦な」という用語は、概して、ビデオデータの領域が、ビデオエンコーダ２０がエンコーダすることが単純であることを表し、たとえば、ビデオデータ中の滑らかな勾配、低い空間周波数、および／または符号化することが単純である他の特徴を含み得る。たとえば、ビデオデータの領域は、領域を符号化するために必要とされるビットの数がしきい値よりも小さいとき、平坦な領域であると決定され得る。

[0048]しかしながら、実装形態に応じて、所与の領域が複雑であるのか平坦であるのかの決定は、使用される符号化規格、ビデオエンコーダ２０に含まれる具体的なハードウェア、符号化されるべきビデオデータのタイプなどにも基づいて決定され得る。さらに、ビデオデータ領域のいくつかのプロパティが、領域を符号化するためにいくつのビットが必要とされるかに影響を及ぼし得、たとえば、高いテクスチャおよび／または高い空間周波数領域は、より低いテクスチャおよび／またはより低い空間周波数領域よりも多くのビットが符号化されることを必要とし得る。同様に、ランダムノイズを備える領域は、ビデオデータのより構造化された領域と比較して、多数のビットが符号化されることを必要とし得る。したがって、いくつかの実装形態では、ビデオデータの領域は、テクスチャおよび／または空間周波数の測度（たとえば、複雑度値）を複雑度しきい値と比較することによって、複雑な領域および／または平坦な領域として識別され得る。複雑な領域と平坦な領域との間の遷移が、符号化ビデオデータ中の量子化アーティファクトを低減するために、ビデオエンコーダ２０によって使用され得る。詳細には、レートコントローラ１２０、ならびに予測器、量子化器、および再構成器構成要素１２５は、複雑な領域から平坦な領域への遷移が識別されたとき、そのような量子化アーティファクトを低減することができる。

[0049]レートコントローラ１２０は、コーディングパラメータのセット、たとえば、ＱＰを決定する。ＱＰは、レートバッファ１５０がオーバーフローまたはアンダーフローしないことを保証するターゲットビットレートについてピクチャ品質を最大にするために、レートバッファ１５０のバッファフルネスとビデオデータの画像アクティビティとに基づいて、レートコントローラ１２０によって調整され得る。レートコントローラ１２０はまた、最適レートひずみ性能を達成するために、ビデオデータの各ブロックについて特定のコーディングオプション（たとえば、特定のモード）を選択する。レートコントローラ１２０は、再構成された画像のひずみを、それがビットレート制約を満たすように、すなわち、全体的実コーディングレートがターゲットビットレート内に収まるように最小化する。

[0050]予測器、量子化器、および再構成器構成要素１２５は、ビデオエンコーダ２０の少なくとも３つの符号化演算を実行し得る。予測器、量子化器、および再構成器構成要素１２５は、いくつかの異なるモードで予測を実行し得る。１つの例示的なプレディケーションモードは、メディアン適応予測の変更バージョンである。メディアン適応予測はロスレスＪＰＥＧ規格（ＪＰＥＧ−ＬＳ）によって実装され得る。予測器、量子化器、および再構成器構成要素１２５によって実行され得るメディアン適応予測の変更バージョンは、３つの連続するサンプル値の並列予測を可能にし得る。別の例示的な予測モードはブロック予測である。ブロック予測では、サンプルは、前に再構成されたピクセルから左側に予測される。ビデオエンコーダ２０およびビデオデコーダ３０は、両方とも、ブロック予測使用を決定するために、再構成されたピクセルに対して同じ探索を実行することができ、したがって、ビットはブロック予測モードで送られる必要がない。成分範囲の中点を使用してサンプルが予測される中点予測モードも実装され得る。中点予測モードは、ワーストケースサンプルにおいてさえも、圧縮されたビデオに必要なビットの数の制限（bounding）を可能にし得る。

[0051]予測器、量子化器、および再構成器構成要素１２５はまた、量子化を実行する。たとえば、量子化は、シフタを使用して実装され得る２のべき乗量子化器（power-of-2 quantizer）を介して実行され得る。２のべき乗量子化器の代わりに他の量子化技法が実装され得ることに留意されたい。予測器、量子化器、および再構成器構成要素１２５によって実行される量子化は、レートコントローラ１２０によって決定されたＱＰに基づき得る。最終的に、予測器、量子化器、および再構成器構成要素１２５はまた、予測値に逆量子化残差を加算することと、結果がサンプル値の有効範囲の外側にないことを保証することとを含む再構成を実行する。

[0052]予測器、量子化器、および再構成器構成要素１２５によって実行される予測、量子化、および再構成に対する上記で説明した例示的な手法は、例示的なものにすぎず、他の手法が実装され得ることに留意されたい。また、予測器、量子化器、および再構成器構成要素１２５は、予測、量子化、および／または再構成を実行するための（１つまたは複数の）副構成要素（subcomponent(s)）を含み得ることに留意されたい。さらに、予測、量子化、および／または再構成は、予測器、量子化器、および再構成器構成要素１２５の代わりにいくつかの別個のエンコーダ構成要素によって実行され得ることに留意されたい。

[0053]ラインバッファ１３０は、予測器、量子化器、および再構成器構成要素１２５ならびにインデックスカラー履歴１３５が、バッファされたビデオデータを使用することができるように、予測器、量子化器、および再構成器構成要素１２５からの出力を保持する。インデックスカラー履歴１３５は、最近使用されたピクセル値を記憶する。これらの最近使用されたピクセル値は、専用シンタックスを介してビデオエンコーダ２０によって直接参照され得る。

[0054]エントロピーエンコーダ１４０は、インデックスカラー履歴１３５と、平坦度検出器１１５によって識別された平坦度遷移とに基づいて、予測器、量子化器、および再構成器構成要素１２５から受信された予測残差を符号化する。いくつかの例では、エントロピーエンコーダ１４０は、サブストリームエンコーダごとにクロックごとに３つのサンプルを符号化し得る。サブストリームマルチプレクサ１４５は、ヘッダレスパケット多重化方式に基づいてビットストリームを多重化し得る。これは、ビデオデコーダ３０が並列に３つのエントロピーデコーダを動作させることを可能にし、クロックごとの３つのピクセルの復号を可能にする。サブストリームマルチプレクサ１４５は、パケットがビデオデコーダ３０によって効率的に復号され得るようにパケット順序を最適化し得る。クロックごとの２のべき乗個のピクセル（たとえば、２つのピクセル／クロックまたは４つのピクセル／クロック）の復号を容易にし得る、エントロピーコーディングに対する異なる手法が実装され得ることに留意されたい。
ＤＳＣビデオデコーダ
[0055]図２Ｂは、本開示で説明する態様による技法を実装し得るビデオデコーダ３０の一例を示すブロック図である。ビデオデコーダ３０は、本開示の技法の一部または全部を実行するように構成され得る。いくつかの例では、本開示で説明する技法は、ビデオエンコーダ３０の様々な構成要素間で共有され得る。いくつかの例では、追加または代替として、プロセッサ（図示せず）が、本開示で説明する技法の一部または全部を実行するように構成され得る。

[0056]説明の目的で、本開示では、ＤＳＣコーディングのコンテキストにおいてビデオデコーダ３０について説明する。ただし、本開示の技法は、他のコーディング規格または方法に適用可能であり得る。

[0057]図２Ｂの例では、ビデオデコーダ３０は複数の機能構成要素を含む。ビデオデコーダ３０の機能構成要素は、レートバッファ１５５と、サブストリームデマルチプレクサ１６０と、エントロピーデコーダ１６５と、レートコントローラ１７０と、予測器、量子化器、および再構成器構成要素１７５と、インデックスカラー履歴１８０と、ラインバッファ１８５と、色空間変換器１９０とを含む。ビデオデコーダ３０の図示された構成要素は、図２Ａ中のビデオエンコーダ２０に関して上記で説明した対応する構成要素に類似する。したがって、ビデオデコーダ３０の構成要素の各々は、上記で説明したビデオエンコーダ２０の対応する構成要素と同様の様式で動作し得る。
ＤＳＣにおけるスライス
[0058]上述のように、スライスは、概して、画像またはフレーム中の領域の残りからの情報を使用することなしに独立して復号され得る、画像またはフレーム中の空間的に別個の領域を指す。各画像またはビデオフレームは単一のスライス中で符号化され得るか、またはそれはいくつかのスライス中で符号化され得る。ＤＳＣでは、各スライスを符号化するために割り振られるターゲットビットは、実質的に一定であり得る。
ＤＳＣのためにＱＰを選択すること
[0059]ＱＰを計算することは、レート制御プロセスにおいて望ましいステップであり得、コーディング方式のレートひずみ（ＲＤ）性能に大きい影響を及ぼし得る。一実施形態では、ＱＰは、経験的レートひずみモデルを必要とするレートひずみ関係を最適化するように選択される。たとえば、ＱＰは、所与のレートひずみ経験的モデルに最も良く適合するように計算され得る。この手法は、特定のコンテンツ、たとえば、自然コンテンツで動作するとき、うまく動作し得る。しかしながら、自然グラフィックス、合成グラフィックス、コンピュータグラフィックス、フラクタルなどを含むいくつかのタイプのコンテンツで動作するとき、異なるタイプのコンテンツについて効率的に動作するレートひずみモデルを確立することは困難であり得る。たとえば、レートひずみモデルのための単一の閉形式表現を確立することは困難であり得る。この困難を克服するために、レートひずみモデルの知識を必要としないかまたはレートひずみモデルに依存しないＱＰを計算するための方法を実装することが望ましいことがある。

[0060]これらおよび他の困難に対処するために、いくつかの態様による技法は、レートひずみモデルを考慮することなしに最適ＱＰを決定することができる。レートひずみモデルは、ＤＳＣにおける１つまたは複数のコーディングモード、あるいは１つまたは複数の異なるタイプのコンテンツに関連付けられ得る。レートひずみモデルは、経験的データに基づき得る。一実施形態では、本技法は、（１）現在ブロックのためのビットバジェットと、前のブロックを符号化するためのビットの数との間の差と、（２）現在ブロックのためのビットバジェットと、前のブロックを符号化するためのビットの数との間の差の関数であるＱＰ調整値とに基づいて、ＱＰを決定することができる。現在ブロックのための決定されたＱＰは、バッファフルネス、現在ブロックの平坦度などに基づいてさらに調整され得る。

[0061]このようにして、本技法は、コーディングモードまたは特定のタイプのコンテンツに関連付けられた特定のレートひずみモデルに依拠することなしに、ＱＰ値を選択することができる。このことは、レートひずみを確立することが、時間がかかり、かなりの量の労力を伴うことがあるので、コストおよび／またはリソースを節約することができる。さらに、本技法は、異なるタイプのコンテンツでうまく動作するＱＰを決定することができる。

[0062]ＤＳＣにおいてＱＰを選択することに関係するいくつかの詳細について、たとえば、例示的な実施形態に関して以下で説明する。本開示全体にわたって使用される様々な用語は、それらの通常の意味を有する広義の用語である。いくつかの実施形態では、ＱＰは、量子化の程度を制御するために量子化プロセスにおいて使用されるパラメータを指すことがある。たとえば、量子化プロセスは、ビットレートをさらに低減するために、残差を量子化する。量子化プロセスは、残差の一部または全部に関連するビット深度を低減し得る。量子化の程度は、量子化パラメータを調整することによって変更され得る。たとえば、量子化パラメータは、残差の量子化を決定するために使用される。ＱＰ値が低いとき、詳細な視覚情報の大部分は保持され得る。低いＱＰ値は、概して、より低いひずみを与えるが、より高いビットレートという代償を払う。ＱＰ値が増加するにつれて、より多くのビットプレーンが廃棄され得、このことは、ビットレートを低減するが、ひずみを増加させるという代償を払う。いくつかの実施形態では、本技法は、レートひずみモデルとは無関係にＱＰを決定する、レートひずみモデルに応じずにＱＰを決定する、などを行うことができる。いくつかの態様によれば、レートひずみモデルを考慮することなしにＱＰを決定することは、レートひずみモデルとは無関係にＱＰを決定すること、レートひずみモデルに応じずにＱＰを決定することなどと呼ばれることもある。レートひずみモデルは、コーディングされるべきビデオデータのコンテンツのタイプに関連付けられ得るか、特定のモードに関連付けられ得るか、またはその両方である。コンテンツのタイプはコンテンツの実体とは異なることがある。コンテンツのタイプは、自然コンテンツ、合成コンテンツ、コンピュータグラフィックス、フラクタルなどを含み得る。レートひずみモデルは、コンテンツの特定のタイプに関連付けられ、実際のコンテンツ自体に関連付けられないことがある。
例示的な実施形態
[0063]一実施形態では、経験的レートひずみモデルを知ることなしに異なるタイプのコンテンツについてうまく動作するＱＰを計算するための装置および方法が提供される。特定のコーディングモード（またはオプション）について、現在ブロックのための対応するＱＰ値は、以下で説明するステップから計算され得る。この技法は、各コーディングモード（またはオプション）について、そのコーディングモード（またはオプション）に関連付けられたＱＰを計算するために独立して使用され得る。たとえば、現在ブロックについて、ＱＰ値は、以下で説明するステップを使用して、各コーディングモードについて計算され、たとえばブロックごとに追跡され得る。いくつかの実施形態では、各コーディングモードに対応するＱＰを計算する代わりに、本技法は、すべてのコーディングモードをコーディングするために使用され得る単一のＱＰ値を計算し得る。たとえば、現在ブロックのための単一のＱＰ値は、以下で説明するステップから計算され得る。
１．ビットバジェットを計算する
[0064]（ここではｂｉｔＢｕｄｇｅｔとして示される）現在ブロックのためのビットバジェットは、スライス中に残っているビットの数（ｎｕｍＳｌｉｃｅＢｉｔｓＲｅｍａｉｎｉｎｇ）と、スライス中で符号化されるべきピクセルの数（ｎｕｍＳｌｉｃｅＰｉｘｅｌｓＲｅｍａｉｎｉｎｇ）と、現在ブロック中のピクセルの数（ｎｕｍＰｉｘｅｌｓＩｎＢｌｏｃｋ）とを考慮することによって計算される。さらに、バッファ中のビットの数（たとえば、ＢＦ）は、ｂｉｔＢｕｄｇｅｔを計算する間に考慮され得る。

一例では、現在ブロックのためのビットレートは、スライス中に残っているビットの数を、符号化される必要があるスライス中のピクセルの数で除算することによって計算される。したがって、ｂｉｔＢｕｄｇｅｔは、次のように計算される。

別の例では、ｂｉｔＢｕｄｇｅｔは、スライス内の現在ブロックの位置に応じて計算され得る。たとえば、ｂｉｔＢｕｄｇｅｔは、レートｄｅｃＢｉｔＢｕｄｇｅｔによって線形的に減少させられ得、ここで、ｄｅｃＢｉｔＢｕｄｇｅｔは、現在スライス中で符号化されるブロックの数と、現在スライス中のブロックの総数とに応じて計算され得る。
２．ビットバジェットと、前のブロックを符号化するためのビットの数との間の差を計算する
[0065]特定のモードについての、ｂｉｔＢｕｄｇｅｔと（ｐｒｅｖＢｌｏｃｋＢｉｔｓとして示される）前のブロックを符号化するために必要とされたビットの数との間の差が計算される。この差は、ｄｉｆｆＢｉｔｓとして表され得、ｄｉｆｆＢｉｔｓ＝ｐｒｅｖＢｌｏｃｋＢｉｔｓ−ｂｉｔＢｕｄｇｅｔとして計算され得る。さらに、ｄｉｆｆＢｉｔｓは、たとえば、ｄｉｆｆＢｉｔｓ＝ｄｉｆｆＢｉｔｓ／（ｎｕｍＰｉｘｅｌｓｉｎＢｌｏｃｋ＊ｔａｒｇｅｔＢｉｔＲａｔｅ）として正規化され得る。

[0066]いくつかの実施形態では、前のブロックをコーディングするために使用されたコーディングモードにかかわらず、単一のＱＰが、導出され、すべてのコーディングモードのために使用されるべきであるとき、（ｐｒｅｖＢｌｏｃｋＢｉｔｓとして示される）前のブロックをコーディングすることに費やされたビットの数は、ｄｉｆｆＢｉｔｓを計算するために使用される。
３．差の関数としてＱＰ調整値を決定する
[0067]ＱｐＡｄｊは、ステップ２において計算されたｄｉｆｆＢｉｔｓの絶対値の関数として計算される調整値を表すものとする。関数は、ｄｉｆｆＢｉｔｓの絶対値が増加するにつれて、ＱｐＡｄｊの値を線形的にまたは非線形的に増加させ得る。

一例では、ｄｉｆｆＢｉｔｓの絶対値は、Ｋ個のしきい値を使用してＫ＋１個の範囲に分類され得る。たとえば、Ｋ個のしきい値（たとえば、１〜Ｋ）があり得、連続する２つのしきい値は範囲の開始および終了を定義することができる。たとえば、範囲１は０としきい値１との間にあり得、範囲２はしきい値１としきい値２との間にあり得、以下同様である。Ｋ個のしきい値の場合、Ｋ＋１個の範囲があり得る。各範囲について、特定のＱｐＡｄｊ値があり、ここで、ＱｐＡｄｊ値は、範囲が増加するにつれて増加する。

いくつかの実施形態では、ＱｐＡｄｊは、絶対値を取ることなしに、ｄｉｆｆＢｉｔｓの関数として計算され得る。Ｋ＋１個の範囲およびそれぞれのＱｐＡｄｊ値を分類するために使用されるＫ個のしきい値［しきい値１，しきい値２，．．．しきい値ｋ］は、ｄｉｆｆＢｉｔｓの符号値に応じて異なり得る。

− 一例では、ｄｉｆｆＢｉｔｓ＞０であるとき、ｄｉｆｆＢｉｔｓは、Ｋ個のしきい値を使用してＫ＋１個の範囲に分類され得る。各範囲について、特定のＱｐＡｄｊ値があり、ここで、ＱｐＡｄｊ値は、範囲が増加するにつれて増加する。そうではなく、ｄｉｆｆＢｉｔｓ≦０である場合、ｄｉｆｆＢｉｔｓの絶対値は、Ｊ個のしきい値を使用してＪ＋１個の範囲に分類され得る。また、各範囲について、範囲が増加するにつれて増加する特定のＱｐＡｄｊ値がある。

− 一例では、ｄｉｆｆＢｉｔｓ≧０であるとき、ｄｉｆｆＢｉｔｓは、Ｋ個のしきい値を使用してＫ＋１個の範囲に分類され得る。各範囲について、特定のＱｐＡｄｊ値があり、ここで、ＱｐＡｄｊ値は、範囲が増加するにつれて増加する。そうではなく、ｄｉｆｆＢｉｔｓ＜０である場合、ｄｉｆｆＢｉｔｓの絶対値は、Ｊ個のしきい値を使用してＪ＋１個の範囲に分類され得る。また、各範囲について、範囲が増加するにつれて増加する特定のＱｐＡｄｊ値があり得る。

− 一例では、ｄｉｆｆＢｉｔｓ≦０またはｄｉｆｆＢｉｔｓ＜０であるとき、ｄｉｆｆＢｉｔｓは、Ｊ個のしきい値を使用してＪ＋１個の範囲に分類され得る。また、各範囲について、範囲が減少するにつれて減少する特定のＱｐＡｄｊ値がある。この場合、ＱｐＡｄｊは負の値を取り得ることに留意されたい。

− 一例では、ｄｉｆｆＢｉｔｓ＞０であるときとｄｉｆｆＢｉｔｓ≦０であるときのしきい値の数は同じであるが（Ｋ＝Ｊ）、個々の値は同じであることも同じでないこともある。

− 一例では、ｄｉｆｆＢｉｔｓ≧０であるときとｄｉｆｆＢｉｔｓ＜０であるときのしきい値の数は同じであるが（Ｋ＝Ｊ）、個々の値は同じであることも同じでないこともある。

− 一例では、ｄｉｆｆＢｉｔｓ＞０の場合とｄｉｆｆＢｉｔｓ≦０の場合の両方についてＫ個のしきい値が同じであるときでも、各範囲のための関連付けられたＱｐＡｄｊ値は、ｄｉｆｆＢｉｔｓ＞０とｄｉｆｆＢｉｔｓ≧０とについて同じであることも同じでないこともある。

− 一例では、ｄｉｆｆＢｉｔｓ≧０の場合とｄｉｆｆＢｉｔｓ＜０の場合の両方についてＫ個のしきい値が同じであるときでも、各範囲のための関連付けられたＱｐＡｄｊ値は、ｄｉｆｆＢｉｔｓ≧０とｄｉｆｆＢｉｔｓ＞０とについて同じであることも同じでないこともある。
４．現在ブロックのためのＱＰ値を決定する
[0068]現在ブロックのためのＱＰ値（ｃｕｒｒＱＰ）は、ステップ２におけるｄｉｆｆＢｉｔｓと、ステップ３において計算されたＱｐＡｄｊと、前のブロックをコーディングするために使用された同じモードに対応する前のブロックを符号化するために使用されたＱＰ値（ｐｒｅｖＱＰ）とに基づいて決定され得る。より正確には、ｃｕｒｒＱＰを計算するために以下の式が使用される。

一例では、ｃｕｒｒＱＰ＝ｐｒｅｖＱＰ＋ＱＰＡｄｊである。

一実施形態では、前のブロックのコーディングモードにかかわらず、単一のＱＰが、導出され、すべてのコーディングモードのために使用されるべきであるとき、前のブロックを符号化するために使用されたＱＰ値（ｐｒｅｖＱＰ）は、ｃｕｒｒＱＰの計算のために使用される。
５．バッファフルネスに基づいて現在ブロックのためのＱＰ値を調整する
[0069]ＢＦに応じて、ｃｕｒｒＱＰは、バッファエラーを回避するためにさらに調整され得る。より詳細には、ｃｕｒｒＱＰは、ＢＦがあるしきい値を超えるとき、さらに増分され得、これはバッファオーバーフローを防ぎ得る。同様に、ｃｕｒｒＱＰは、ＢＦがあるしきい値を下回るとき、さらに減分され得、これは、アンダーフローを防ぎ得る。

一実装形態では、単一のしきい値を使用するよりもむしろ、複数のしきい値が使用され得る。各しきい値について、ｃｕｒｒＱＰを調整する関連付けられた値がある。たとえば、［Ｐ₁，Ｐ₂，．．．Ｐ_n］がｎ個のしきい値であり、［ｐ₁，ｐ₂，．．．ｐ_n］がそれぞれの調整値であるものとし、両方が単調減少する順序で表されると仮定する。ｃｕｒｒＱＰは、以下のように調整され得る。

− 一実施形態では、２つのしきい値Ｐ₁およびＰ₂、ならびにそれぞれの調整値ｐ₁およびｐ₂が使用され得る。

− 一実装形態では、よりも大きいかまたはそれに等しい（≧）は、上記の条件では、よりも大きい（＞）と置き換えられ得る。

同様に、［Ｑ₁，Ｑ₂，．．．Ｑ_m］はｍ個のしきい値であり、［ｑ₁，ｑ₂，．．．ｑ_m］はそれぞれの調整値である。両方が単調増加する順序にあると仮定する。ｃｕｒｒＱＰは、以下のように調整され得る。

− 一実施形態では、２つのしきい値Ｑ₁およびＱ₂、ならびにそれぞれの調整値ｑ₁およびｑ₂が使用され得る。

− 一実装形態では、よりも小さいかまたはそれに等しい（≦）は、上記の条件では、よりも小さい（＜）と置き換えられ得る。

○ 一例では、ｍはｎに等しい。

○ 一例では、ｍ＝ｎであるとき、［Ｑ₁，Ｑ₂，．．．Ｑ_m］＝［１００−Ｐ₁，１００−Ｐ₂，．．．１００−Ｐ_n］である。

○ 一例では、ｍ＝ｎであるとき、１からｎまでの値を取るすべてのｉについて、ｑ_iはｐ_iに等しいことも等しくないこともある。

[0070]ＢＦ計算に対する選択された手法は、コンテキストおよび適用例に応じて変動し得ることに留意されたい。
平坦度検出およびＱＰを決定すること
[0071]一実施形態では、平坦度検出アルゴリズムがビデオデータの「複雑な」領域からビデオデータの「平坦な」領域への遷移を検出した場合、上記のステップ１〜４は省略され得る。そのような場合、ｃｕｒｒＱＰは低い値に設定され得る。

[0072]ＢＦに応じて、ｃｕｒｒＱＰは、たとえば、ステップ５に関して上記で説明したように調整され得る。より正確には、バッファフルネスがあるしきい値を超えたとき、ｃｕｒｒＱＰは増加させられ得る。
６．平坦な現在ブロックのＱＰ値を調整する
[0073]現在ブロック中の視覚情報が「極めて平坦」である（たとえば、高いレベルまたは程度の平坦度を有する）場合、ｃｕｒｒＱＰはさらに調整され得る。現在ブロックの複雑度値Ｃ_curを計算することに対する選択された手法は、コンテキストおよび適用例に応じて変動し得る。Ｃ_curがしきい値よりも小さいかまたはそれ以下である場合、ｃｕｒｒＱＰは、平坦なブロックのための所定のＱＰ値、たとえば、ｆｌａｔＱｐに等しく設定され得る。

一例では、単一のしきい値の代わりに、複数（たとえば、Ｌ個）のしきい値、たとえば、単調増加する順序で配列された［Ｔ₁，Ｔ₂，．．．Ｔ_L］が使用され得る。さらに、各しきい値について、単調増加する順序で配列され得る関連付けられたＱＰ値［ｆｌａｔＱｐ₁，ｆｌａｔＱｐ₂，．．．，ｆｌａｔＱｐ_L］があり得る。たとえば、Ｃ_curに基づいてｆｌａｔＱｐの値を決定するために、以下のステップが使用され得る。

− 一実施形態では、２つのしきい値Ｔ₁およびＴ₂、ならびにそれぞれの関連付けられたＱＰ値ｆｌａｔＱＰ₁およびｆｌａｔＱＰ₂が使用され得る。

一例では、よりも小さいかまたはそれに等しい（≦）の代わりに、よりも小さい（＜）が上記の条件付き検査において使用され得る。

ｃｕｒｒＱＰは、ｆｌａｔＱｐに等しく設定され得ることに留意されたい。一代替形態では、ｃｕｒｒＱＰは、ｃｕｒｒＱＰ＝（ｃｕｒｒＱＰ＞ｆｌａｔＱｐ）？ｆｌａｔＱｐ：ｃｕｒｒＱＰに従って決定され得る。

一例では、スライス中の第１のラインに関してｆｌａｔＱｐおよび／または［ｆｌａｔＱｐ₁，ｆｌａｔＱｐ₂，．．．，ｆｌａｔＱｐ_L］は、スライス中のラインの残りと比較して異なり得る。これは、主に、スライス中の第１のラインの品質を改善するためである。さらに、所与のしきい値について、スライス中の第１のラインのためのｆｌａｔＱｐおよび／または［ｆｌａｔＱｐ₁，ｆｌａｔＱｐ₂，．．．，ｆｌａｔＱｐ_L］は、スライス中のラインの残りよりも小さいことがある。

一例では、スライス中の第１のラインのための［Ｔ₁，Ｔ₂，．．．Ｔ_L］は、スライス中のラインの残りと比較して異なり得る。
利用可能なビットバジェットが低いとき、ＱＰを決定すること
[0074]ごく少数のビットが残されているとき、ＱＰは高い値、たとえば、所定の高い値に設定され得る。一実装形態では、条件（ｎｕｍＳｌｉｃｅＢｉｔｓＲｅｍａｉｎｉｎｇ＜ｔｈｒｅｓｈｏｌｄＢｉｔｓ＆＆ｂｐｐＲｅｍａｉｎｉｎｇ＜ｔａｒｇｅｔＢｐｐ）が真であるとき、上記のステップ１〜４は省略され、ＱＰは極めて高い値に設定され得る。ここで、ｔｈｒｅｓｈｏｌｄＢｉｔｓは、構成可能パラメータであり得る変数であり、ｔａｒｇｅｔＢｐｐは、ピクセル当たりのターゲットビットであり、ｂｐｐＲｅｍａｉｎｉｎｇは、ｂｐｐＲｅｍａｉｎｉｎｇ＝ｎｕｍＳｌｉｃｅＢｉｔｓＲｅｍａｉｎｉｎｇ／ｎｕｍＳｌｉｃｅＰｉｘｅｌｓＲｅｍａｉｎｉｎｇとして計算される。

一例では、ＱＰは、最大許容値に等しく設定され得る。
ＤＳＣにおいてＱＰを決定する方法
[0001]図３は、本開示の一実施形態による、ビデオデータをコーディングするためのプロセス３００を示すフローチャートである。本方法は、ＱＰを選択することに関する。プロセス３００のブロックは、ビデオエンコーダ（たとえば、図２Ａ中のビデオエンコーダ２０）、ビデオデコーダ（たとえば、図２Ｂ中のビデオデコーダ３０）、またはそれらの（１つまたは複数の）構成要素によって実行され得る。説明の目的で、プロセス３００について、ビデオエンコーダ２０、ビデオデコーダ３０、または別の構成要素であり得る、（単にコーダとも呼ばれる）ビデオコーダによって実行されるものとして説明する。図３に関して説明するすべての実施形態は、別々に、または互いと組み合わせて実装され得る。プロセス３００に関係するいくつかの詳細が上記で説明されている。

[0075]プロセスはブロック３０１において開始する。コーダは、ビデオデータを記憶するためのメモリを含むことができる。メモリはバッファを含むことができる。ブロック３０２において、コーダは、たとえば、ＤＳＣを介して、コーディングされるべきビデオデータを受信する。

[0076]ブロック３０３において、コーダは、ビデオデータのコンテンツのタイプと、コンテンツのタイプに関連付けられたレートひずみモデルとを考慮することなしに、ビデオデータの現在ブロックのＱＰを決定する。ビデオデータのコンテンツのタイプは、自然コンテンツ、合成コンテンツ、コンピュータグラフィックス、フラクタルなどのうちの１つまたは複数を含み得る。

[0077]一実施形態では、コーダは、（１）現在ブロックのためのビットバジェットと、前のブロックを符号化するために使用されたビットの数との間の差と、（２）現在ブロックのためのビットバジェットと、前のブロックを符号化するためのビットの数との間の差の関数である、ＱＰを調整するための第１の値とに少なくとも部分的に基づいて、ＱＰを決定する。たとえば、現在ブロックのためのビットバジェットと、前のブロックを符号化するためのビットの数との間の差は、ｄｉｆｆＢｉｔｓを指すことがあり、（２）現在ブロックのためのビットバジェットと、前のブロックを符号化するためのビットの数との間の差の関数である、ＱＰを調整するための第１の値は、ＱＰＡｄｊを指すことがある。一実施形態では、現在ブロックはスライス中に含まれ、現在ブロックのためのビットバジェットは、式、すなわち、（スライスのために残っているビットの数／スライス中でコーディングされるべきピクセルの数）＊現在ブロック中のピクセルの数、に従って決定される。コーダは、式、すなわち、前のブロックのＱＰ＋第１の値＊（現在ブロックのためのビットバジェットと、前のブロックを符号化するために使用されたビットの数との間の差＞０？１：−１）、に従ってＱＰを決定し得る。

[0078]いくつかの実施形態では、コーダは、２つまたはそれ以上のしきい値によって定義された複数の範囲を定義する。所定の値に関連付けられた複数の範囲の各々。コーダは、複数の範囲のうちのいずれが、現在ブロックのためのビットバジェットと、前のブロックを符号化するためのビットの数との間の差を含むかを決定する。コーダは、第１の値を、決定された範囲に関連付けられた所定の値に設定する。たとえば、２つまたはそれ以上のしきい値および複数の範囲は、上記のＫ個のしきい値またはＫ＋１個の範囲を指すことがあり、各範囲は、ＱＰＡｄｊのための特定の値に関連付けられ得る。

[0079]いくつかの実施形態では、コーダはバッファのフルネスまたはバッファフルネスを決定する。バッファフルネスはＢＦを指すことがある。一実施形態では、バッファのフルネスが、１つまたは複数のしきい値よりも大きいかまたはそれに等しいと決定したことに応答して、コーダは、決定されたＱＰを、１つまたは複数のしきい値に関連付けられた第２の値だけ調整する。別の実施形態では、バッファのフルネスが、１つまたは複数のしきい値よりも小さいかまたはそれに等しいと決定したことに応答して、コーダは、決定されたＱＰを、１つまたは複数のしきい値に関連付けられた第２の値だけ調整する。

[0080]いくつかの実施形態では、コーダは、現在ブロックの平坦度を決定する。現在ブロックの平坦度が、１つまたは複数のしきい値よりも大きいかまたはそれに等しいと決定したことに応答して、コーダは、ＱＰを、１つまたは複数のしきい値に関連付けられたＱＰ値に等しく設定する。１つまたは複数のしきい値に関連付けられたＱＰ値は、ｆｌａｔＱＰを指すことがある。

[0081]ブロック３０４において、コーダは、決定されたＱＰを使用して、ビットストリーム中で現在ブロックをコーディングする。コーダは、固定ビットレートを使用してビデオデータをコーディングし得る。

[0082]プロセス３００はブロック３０５において終了する。ブロックは、実施形態によっては、プロセス３００において追加および／または省略され得、プロセス３００のブロックは、実施形態によっては、異なる順序で実行され得る。

[0083]本開示で説明するいかなる特徴および／または実施形態も、別々に、またはそれらの任意の組合せで実装され得る。たとえば、図１〜図２に関して説明したいかなる特徴および／または実施形態、ならびに本開示の他の部分も、図３に関して説明した任意の特徴および／または実施形態との任意の組合せで実装され得、その逆も同様である。本開示の実施形態は、図３に示されている例にまたはそれによって限定されず、他の変形形態が、本開示の趣旨から逸脱することなく実装され得る。
他の考慮事項
[0096]本明細書で開示する情報および信号は、多種多様な技術および技法のいずれかを使用して表され得る。たとえば、上記の説明全体にわたって言及され得るデータ、命令、コマンド、情報、信号、ビット、シンボル、およびチップは、電圧、電流、電磁波、磁界または磁性粒子、光場または光学粒子、あるいはそれらの任意の組合せによって表され得る。

[0097]本明細書で開示した実施形態に関して説明した様々な例示的な論理ブロック、およびアルゴリズムステップは、電子ハードウェア、コンピュータソフトウェア、またはその両方の組合せとして実装され得る。ハードウェアとソフトウェアのこの互換性を明確に示すために、様々な例示的な構成要素、ブロック、およびステップについて、概してそれらの機能に関して上記で説明した。そのような機能をハードウェアとして実装するか、ソフトウェアとして実装するかは、特定の適用例および全体的なシステムに課せられた設計制約に依存する。当業者は、説明した機能を特定の適用例ごとに様々な方法で実装し得るが、そのような実装の決定は、本開示の範囲からの逸脱を生じるものと解釈されるべきではない。

[0098]本明細書で説明した技法は、ハードウェア、ソフトウェア、ファームウェア、またはそれらの任意の組合せで実装され得る。そのような技法は、汎用コンピュータ、ワイヤレス通信デバイスハンドセット、またはワイヤレス通信デバイスハンドセットおよび他のデバイスにおける適用例を含む複数の用途を有する集積回路デバイスなど、様々なデバイスのいずれかに実装され得る。デバイスまたは構成要素として説明した特徴は、集積論理デバイスに一緒に、またはディスクリートであるが相互運用可能な論理デバイスとして別々に実装され得る。ソフトウェアで実装された場合、本技法は、実行されたとき、上記で説明した方法のうちの１つまたは複数を実行する命令を含むプログラムコードを備えるコンピュータ可読データ記憶媒体によって、少なくとも部分的に実現され得る。コンピュータ可読データ記憶媒体は、パッケージング材料を含むことがあるコンピュータプログラム製品の一部を形成し得る。コンピュータ可読媒体は、同期ダイナミックランダムアクセスメモリ（ＳＤＲＡＭ）などのランダムアクセスメモリ（ＲＡＭ）、読取り専用メモリ（ＲＯＭ）、不揮発性ランダムアクセスメモリ（ＮＶＲＡＭ）、電気消去可能プログラマブル読取り専用メモリ（ＥＥＰＲＯＭ（登録商標））、フラッシュメモリ、磁気または光学データ記憶媒体など、メモリまたはデータ記憶媒体を備え得る。本技法は、追加または代替として、伝搬信号または電波など、命令またはデータ構造の形態でプログラムコードを搬送または伝達し、コンピュータによってアクセスされ、読み取られ、および／または実行され得るコンピュータ可読通信媒体によって、少なくとも部分的に実現され得る。

[0099]プログラムコードは、１つまたは複数のデジタル信号プロセッサ（ＤＳＰ）、汎用マイクロプロセッサ、特定用途向け集積回路（ＡＳＩＣ）、フィールドプログラマブル論理アレイ（ＦＰＧＡ）、または他の等価の集積回路またはディスクリート論理回路など、１つまたは複数のプロセッサを含み得るプロセッサによって実行され得る。そのようなプロセッサは、本開示で説明する技法のいずれかを実行するように構成され得る。汎用プロセッサはマイクロプロセッサであり得るが、代替として、プロセッサは、任意の従来のプロセッサ、コントローラ、マイクロコントローラ、または状態機械であり得る。プロセッサはまた、コンピューティングデバイスの組合せ、たとえば、ＤＳＰとマイクロプロセッサとの組合せ、複数のマイクロプロセッサ、ＤＳＰコアと連携する１つまたは複数のマイクロプロセッサ、あるいは任意の他のそのような構成として実装され得る。したがって、本明細書で使用する「プロセッサ」という用語は、上記の構造、上記の構造の任意の組合せ、または本明細書で説明する技法の実装に好適な他の構造または装置のいずれかを指すことがある。さらに、いくつかの態様では、本明細書で説明した機能は、符号化および復号のために構成された専用のソフトウェアもしくはハードウェア内に提供され得、または複合ビデオエンコーダ／デコーダ（コーデック）に組み込まれ得る。また、本技法は、１つまたは複数の回路または論理要素で十分に実装され得る。

[0100]本開示の技法は、ワイヤレスハンドセット、集積回路（ＩＣ）またはＩＣのセット（たとえば、チップセット）を含む、多種多様なデバイスまたは装置で実装され得る。本開示では、開示する技法を実行するように構成されたデバイスの機能的態様を強調するために、様々な構成要素またはユニットについて説明したが、それらの構成要素またはユニットは、必ずしも異なるハードウェアユニットによる実現を必要とするとは限らない。むしろ、上記で説明したように、様々なユニットが、好適なソフトウェアおよび／またはファームウェアとともに、上記で説明した１つまたは複数のプロセッサを含めて、コーデックハードウェアユニットにおいて組み合わせられるか、または相互動作可能なハードウェアユニットの集合によって与えられ得る。

[0101]上記で様々な異なる実施形態に関して説明したが、一実施形態からの特徴または要素は、本開示の教示から逸脱することなく他の実施形態と組み合わせられ得る。しかしながら、それぞれの実施形態間の特徴の組合せは、それに必ずしも限定されるとは限らない。本開示の様々な実施形態について説明した。これらおよび他の実施形態は以下の特許請求の範囲内に入る。
以下に、本願出願の当初の特許請求の範囲に記載された発明を付記する。
［Ｃ１］
ビデオデータをコーディングするための装置であって、
前記ビデオデータを記憶するためのメモリと、前記メモリがバッファを含む、
前記メモリに動作可能に結合され、
コーディングされるべき前記ビデオデータを受信することと、
前記ビデオデータのコンテンツのタイプと、コンテンツの前記タイプに関連付けられたレートひずみモデルとを考慮することなしに、前記ビデオデータの現在ブロックの量子化パラメータ（ＱＰ）を決定することと、
前記決定されたＱＰを使用して、ビットストリーム中で前記現在ブロックをコーディングすることと
を行うように構成されたハードウェアプロセッサとを備える、装置。
［Ｃ２］
前記プロセッサが、（１）前記現在ブロックのためのビットバジェットと、前のブロックを符号化するために使用されたビットの数との間の差と、（２）前記現在ブロックのための前記ビットバジェットと、前記前のブロックを符号化するために使用されたビットの前記数との間の前記差の関数である、前記ＱＰを調整するための第１の値とに少なくとも部分的に基づいて、前記ＱＰを決定するようにさらに構成された、Ｃ１に記載の装置。
［Ｃ３］
前記現在ブロックがスライス中に含まれ、前記現在ブロックのための前記ビットバジェットが、式、すなわち、（前記スライスのために残っているビットの数／前記スライス中でコーディングされるべきピクセルの数）＊前記現在ブロック中のピクセルの数、に従って決定される、Ｃ２に記載の装置。
［Ｃ４］
前記プロセッサが、式、すなわち、前記前のブロックのＱＰ＋前記第１の値＊（前記現在ブロックのための前記ビットバジェットと、前記前のブロックを符号化するためのビットの前記数との間の前記差＞０？１：−１）、に従って前記ＱＰを決定するように構成された、Ｃ２に記載の装置。
［Ｃ５］
前記プロセッサは、
２つまたはそれ以上のしきい値によって定義される複数の範囲を定義することと、前記複数の範囲の各々が所定の値に関連付けられた、
前記複数の範囲のうちのいずれが、前記現在ブロックのための前記ビットバジェットと、前記前のブロックを符号化するためのビットの前記数との間の前記差を含むかを決定することと、
前記第１の値を、前記決定された範囲に関連付けられた前記所定の値に設定することとを行うようにさらに構成された、Ｃ２に記載の装置。
［Ｃ６］
前記プロセッサは、
前記バッファのフルネスを決定することと、
前記バッファの前記フルネスが、１つまたは複数のしきい値よりも大きいかまたはそれに等しいと決定したことに応答して、前記決定されたＱＰを、前記１つまたは複数のしきい値に関連付けられた第２の値だけ調整することとを行うようにさらに構成された、Ｃ１に記載の装置。
［Ｃ７］
前記プロセッサは、
前記バッファのフルネスを決定することと、
前記バッファの前記フルネスが、１つまたは複数のしきい値よりも小さいかまたはそれに等しいと決定したことに応答して、前記決定されたＱＰを、前記１つまたは複数のしきい値に関連付けられた第２の値だけ調整することとを行うようにさらに構成された、Ｃ１に記載の装置。
［Ｃ８］
前記プロセッサは、
前記現在ブロックの平坦度を決定することと、
前記現在ブロックの前記平坦度が、１つまたは複数のしきい値よりも大きいかまたはそれに等しいと決定したことに応答して、前記ＱＰを、前記１つまたは複数のしきい値に関連付けられたＱＰ値に等しく設定することとを行うようにさらに構成された、Ｃ１に記載の装置。
［Ｃ９］
前記プロセッサが、固定ビットレートを使用して前記ビデオデータをコーディングするようにさらに構成された、Ｃ１に記載の装置。
［Ｃ１０］
前記ビデオデータのコンテンツの前記タイプが、自然コンテンツ、合成コンテンツ、コンピュータグラフィックス、またはフラクタルのうちの１つを備える、Ｃ１に記載の装置。
［Ｃ１１］
ビデオデータをコーディングする方法であって、
メモリに前記ビデオデータを記憶することと、前記メモリがバッファを含む、
コーディングされるべき前記ビデオデータを受信することと、
前記ビデオデータのコンテンツのタイプと、コンテンツの前記タイプに関連付けられたレートひずみモデルとを考慮することなしに、前記ビデオデータの現在ブロックの量子化パラメータ（ＱＰ）を決定することと、
前記決定されたＱＰを使用して、ビットストリーム中で前記現在ブロックをコーディングすることとを備える、方法。
［Ｃ１２］
前記ＱＰが、（１）前記現在ブロックのためのビットバジェットと、前のブロックを符号化するために使用されたビットの数との間の差と、（２）前記現在ブロックのための前記ビットバジェットと、前記前のブロックを符号化するために使用されたビットの前記数との間の前記差の関数である、前記ＱＰを調整するための第１の値とに少なくとも部分的に基づいて決定される、Ｃ１１に記載の方法。
［Ｃ１３］
前記現在ブロックがスライス中に含まれ、前記現在ブロックのための前記ビットバジェットが、式、すなわち、（前記スライスのために残っているビットの数／前記スライス中でコーディングされるべきピクセルの数）＊前記現在ブロック中のピクセルの数、に従って決定される、Ｃ１２に記載の方法。
［Ｃ１４］
前記ＱＰが、式、すなわち、前記前のブロックのＱＰ＋前記第１の値＊（前記現在ブロックのための前記ビットバジェットと、前記前のブロックを符号化するためのビットの前記数との間の前記差＞０？１：−１）、に従って決定される、Ｃ１２に記載の方法。
［Ｃ１５］
２つまたはそれ以上のしきい値によって定義される複数の範囲を定義することと、前記複数の範囲の各々が所定の値に関連付けられた、
前記複数の範囲のうちのいずれが、前記現在ブロックのための前記ビットバジェットと、前記前のブロックを符号化するためのビットの前記数との間の前記差を含むかを決定することと、
前記第１の値を、前記決定された範囲に関連付けられた前記所定の値に設定することとをさらに備える、Ｃ１２に記載の方法。
［Ｃ１６］
前記バッファのフルネスを決定することと、
前記バッファの前記フルネスが、１つまたは複数のしきい値よりも大きいかまたはそれに等しいと決定したことに応答して、前記決定されたＱＰを、前記１つまたは複数のしきい値に関連付けられた第２の値だけ調整することとをさらに備える、Ｃ１１に記載の方法。
［Ｃ１７］
前記バッファのフルネスを決定することと、
前記バッファの前記フルネスが、１つまたは複数のしきい値よりも小さいかまたはそれに等しいと決定したことに応答して、前記決定されたＱＰを、前記１つまたは複数のしきい値に関連付けられた第２の値だけ調整することとをさらに備える、Ｃ１１に記載の方法。
［Ｃ１８］
前記現在ブロックの平坦度を決定することと、
前記現在ブロックの前記平坦度が、１つまたは複数のしきい値よりも大きいかまたはそれに等しいと決定したことに応答して、前記ＱＰを、前記１つまたは複数のしきい値に関連付けられたＱＰ値に等しく設定することとをさらに備える、Ｃ１１に記載の方法。
［Ｃ１９］
固定ビットレートを使用して前記ビデオデータをコーディングすることをさらに備える、Ｃ１１に記載の方法。
［Ｃ２０］
前記ビデオデータのコンテンツの前記タイプが、自然コンテンツ、合成コンテンツ、コンピュータグラフィックス、またはフラクタルのうちの１つを備える、Ｃ１１に記載の方法。
［Ｃ２１］
コンピュータハードウェアを備えるプロセッサ上で実行されたとき、
メモリにビデオデータを記憶することと、前記メモリがバッファを含む、
コーディングされるべき前記ビデオデータを受信することと、
前記ビデオデータのコンテンツのタイプと、コンテンツの前記タイプに関連付けられたレートひずみモデルとを考慮することなしに、前記ビデオデータの現在ブロックの量子化パラメータ（ＱＰ）を決定することと、
前記決定されたＱＰを使用して、ビットストリーム中で前記現在ブロックをコーディングすることとを前記プロセッサに行わせる命令を備える非一時的コンピュータ可読媒体。
［Ｃ２２］
前記命令が、
（１）前記現在ブロックのためのビットバジェットと、前のブロックを符号化するために使用されたビットの数との間の差と、（２）前記現在ブロックのための前記ビットバジェットと、前記前のブロックを符号化するために使用されたビットの前記数との間の前記差の関数である、前記ＱＰを調整するための第１の値とに少なくとも部分的に基づいて、前記ＱＰを決定することを前記プロセッサにさらに行わせる、Ｃ２１に記載のコンピュータ可読媒体。
［Ｃ２３］
前記命令が、式、すなわち、前記前のブロックのＱＰ＋前記第１の値＊（前記現在ブロックのための前記ビットバジェットと、前記前のブロックを符号化するためのビットの前記数との間の前記差＞０？１：−１）、に従って前記ＱＰを決定することを前記プロセッサにさらに行わせる、Ｃ２２に記載のコンピュータ可読媒体。
［Ｃ２４］
前記命令は、
２つまたはそれ以上のしきい値によって定義される複数の範囲を定義することと、前記複数の範囲の各々が所定の値に関連付けられた、
前記複数の範囲のうちのいずれが、前記現在ブロックのための前記ビットバジェットと、前記前のブロックを符号化するためのビットの前記数との間の前記差を含むかを決定することと、
前記第１の値を、前記決定された範囲に関連付けられた前記所定の値に設定することとを前記プロセッサにさらに行わせる、Ｃ２２に記載のコンピュータ可読媒体。
［Ｃ２５］
前記ビデオデータのコンテンツの前記タイプが、自然コンテンツ、合成コンテンツ、コンピュータグラフィックス、またはフラクタルのうちの１つを備える、Ｃ２１に記載のコンピュータ可読媒体。
［Ｃ２６］
ビデオ情報をコーディングするための装置であって、
メモリにビデオデータを記憶するための手段と、前記メモリがバッファを含む、
コーディングされるべき前記ビデオデータを受信するための手段と、
前記ビデオデータのコンテンツのタイプと、コンテンツの前記タイプに関連付けられたレートひずみモデルとを考慮することなしに、前記ビデオデータの現在ブロックの量子化パラメータ（ＱＰ）を決定するための手段と、
前記決定されたＱＰを使用して、ビットストリーム中で前記現在ブロックをコーディングするための手段とを備える、装置。
［Ｃ２７］
前記ＱＰを決定するための前記手段が、
（１）前記現在ブロックのためのビットバジェットと、前のブロックを符号化するために使用されたビットの数との間の差と、（２）前記現在ブロックのための前記ビットバジェットと、前記前のブロックを符号化するために使用されたビットの前記数との間の前記差の関数である、前記ＱＰを調整するための第１の値とに少なくとも部分的に基づいて、前記ＱＰを決定するようにさらに構成された、Ｃ２６に記載の装置。
［Ｃ２８］
前記ＱＰを決定するための前記手段が、式、すなわち、前記前のブロックのＱＰ＋前記第１の値＊（前記現在ブロックのための前記ビットバジェットと、前記前のブロックを符号化するためのビットの前記数との間の前記差＞０？１：−１）、に従って前記ＱＰを決定するようにさらに構成された、Ｃ２７に記載の装置。
［Ｃ２９］
前記ＱＰを決定するための前記手段は、
２つまたはそれ以上のしきい値によって定義される複数の範囲を定義することと、前記複数の範囲の各々が所定の値に関連付けられた、
前記複数の範囲のうちのいずれが、前記現在ブロックのための前記ビットバジェットと、前記前のブロックを符号化するためのビットの前記数との間の前記差を含むかを決定することと、
前記第１の値を、前記決定された範囲に関連付けられた前記所定の値に設定することとを行うようにさらに構成された、Ｃ２７に記載の装置。
［Ｃ３０］
前記ビデオデータのコンテンツの前記タイプが、自然コンテンツ、合成コンテンツ、コンピュータグラフィックス、またはフラクタルのうちの１つを備える、Ｃ２６に記載の装置。

Claims

ビデオデータをコーディングするための装置であって、
前記ビデオデータを記憶するためのメモリと、前記メモリがバッファを含む、
前記メモリに動作可能に結合され、
コーディングされるべき前記ビデオデータを受信することと、
前記ビデオデータの現在ブロックをコーディングするために割り振られたビットの数と、前記ビデオデータの前のブロックを符号化するために使用されたビットの数との間の差を決定することと、
前記差が収まる、複数の範囲の中の１つの範囲を決定することと、
前記決定された範囲に基づいて、量子化パラメータ（ＱＰ）を調整するための調整値を決定することと、
前記決定された調整値に基づいて、前記現在ブロックの調整されたＱＰを決定することと、
前記調整されたＱＰを使用して、ビットストリーム中で前記現在ブロックをコーディングすることと
を行うように構成されたハードウェアプロセッサと
を備え、
ここにおいて、前記差は、前記前のブロックを符号化するために使用されたビットの前記数から前記現在ブロックをコーディングするために割り振られたビットの前記数を引くことによって決定され、前記現在ブロックをコーディングするために割り振られたビットの前記数が、（スライスのために残っているビットの数／前記スライス中でコーディングされるべきピクセルの数）＊前記現在ブロック中のピクセルの数、と決定される、
装置。
前記プロセッサが、式、すなわち、前記前のブロックのＱＰ＋前記決定された範囲に関連付けられた前記値＊（前記差＞０？１：−１）、に従って前記現在ブロックの前記ＱＰを決定するように構成された、請求項１に記載の装置。
前記複数の範囲は、２つまたはそれ以上のしきい値によって定義され、前記複数の範囲の各々は、前記ＱＰを調整するためのそれぞれの調整値に関連付けられる、請求項１に記載の装置。
前記プロセッサは、
前記バッファのフルネスを決定することと、
前記バッファの前記フルネスが、１つまたは複数のしきい値よりも大きいかまたはそれに等しいと決定したことに応答して、前記調整されたＱＰを、前記１つまたは複数のしきい値に関連付けられた第２の調整値だけ調整することと
を行うようにさらに構成された、請求項１に記載の装置。
前記プロセッサは、
前記バッファのフルネスを決定することと、
前記バッファの前記フルネスが、１つまたは複数のしきい値よりも小さいかまたはそれに等しいと決定したことに応答して、前記調整されたＱＰを、前記１つまたは複数のしきい値に関連付けられた第２の調整値だけ調整することと
を行うようにさらに構成された、請求項１に記載の装置。
前記プロセッサは、
前記現在ブロックの平坦度を決定することと、
前記現在ブロックの前記平坦度が、１つまたは複数のしきい値よりも大きいかまたはそれに等しいと決定したことに応答して、前記ＱＰを、前記１つまたは複数のしきい値に関連付けられたＱＰ値に等しく設定することと
を行うようにさらに構成された、請求項１に記載の装置。
前記プロセッサが、固定ビットレートを使用して前記ビデオデータをコーディングするようにさらに構成された、請求項１に記載の装置。
前記ビデオデータのコンテンツのタイプが、自然コンテンツ、合成コンテンツ、コンピュータグラフィックス、またはフラクタルのうちの１つを備える、請求項１に記載の装置。
ビデオデータをコーディングする方法であって、
メモリに前記ビデオデータを記憶することと、前記メモリがバッファを含む、
コーディングされるべき前記ビデオデータを受信することと、
前記ビデオデータの現在ブロックをコーディングするために割り振られたビットの数と、前記ビデオデータの前のブロックを符号化するために使用されたビットの数との間の差を決定することと、
前記差が収まる、複数の範囲の中の１つの範囲を決定することと、
前記決定された範囲に基づいて、量子化パラメータ（ＱＰ）を調整するための調整値を決定することと、
前記決定された調整値に基づいて、前記現在ブロックの調整されたＱＰを決定することと、
前記調整されたＱＰを使用して、ビットストリーム中で前記現在ブロックをコーディングすることと
を備え、
ここにおいて、前記差は、前記前のブロックを符号化するために使用されたビットの前記数から前記現在ブロックをコーディングするために割り振られたビットの前記数を引くことによって決定され、前記現在ブロックをコーディングするために割り振られたビットの前記数が、（スライスのために残っているビットの数／前記スライス中でコーディングされるべきピクセルの数）＊前記現在ブロック中のピクセルの数、と決定される、
方法。
前記現在ブロックの前記ＱＰが、式、すなわち、前記前のブロックのＱＰ＋前記決定された範囲に関連付けられた前記値＊（前記差＞０？１：−１）、に従って決定される、請求項９に記載の方法。
複数の範囲は、２つまたはそれ以上のしきい値によって定義され、前記複数の範囲の各々は、前記ＱＰを調整するためのそれぞれの調整値に関連付けられる、請求項９に記載の方法。
前記バッファのフルネスを決定することと、
前記バッファの前記フルネスが、１つまたは複数のしきい値よりも大きいかまたはそれに等しいと決定したことに応答して、前記調整されたＱＰを、前記１つまたは複数のしきい値に関連付けられた第２の調整値だけ調整することと
をさらに備える、請求項９に記載の方法。
前記バッファのフルネスを決定することと、
前記バッファの前記フルネスが、１つまたは複数のしきい値よりも小さいかまたはそれに等しいと決定したことに応答して、前記調整されたＱＰを、前記１つまたは複数のしきい値に関連付けられた第２の調整値だけ調整することと
をさらに備える、請求項９に記載の方法。
前記現在ブロックの平坦度を決定することと、
前記現在ブロックの前記平坦度が、１つまたは複数のしきい値よりも大きいかまたはそれに等しいと決定したことに応答して、前記ＱＰを、前記１つまたは複数のしきい値に関連付けられたＱＰ値に等しく設定することと
をさらに備える、請求項９に記載の方法。
固定ビットレートを使用して前記ビデオデータをコーディングすることをさらに備える、請求項９に記載の方法。
前記ビデオデータのコンテンツのタイプが、自然コンテンツ、合成コンテンツ、コンピュータグラフィックス、またはフラクタルのうちの１つを備える、請求項９に記載の方法。
コンピュータハードウェアを備えるプロセッサ上で実行されたとき、
メモリにビデオデータを記憶することと、前記メモリがバッファを含む、
コーディングされるべき前記ビデオデータを受信することと、
前記ビデオデータの現在ブロックをコーディングするために割り振られたビットの数と、前記ビデオデータの前のブロックを符号化するために使用されたビットの数との間の差を決定することと、
前記差が収まる、複数の範囲の中の１つの範囲を決定することと、
前記決定された範囲に基づいて、量子化パラメータ（ＱＰ）を調整するための調整値を決定することと、
前記決定された調整値に基づいて、前記現在ブロックの調整されたＱＰを決定することと、
前記調整されたＱＰを使用して、ビットストリーム中で前記現在ブロックをコーディングすることと
を前記プロセッサに行わせる命令を備え、
ここにおいて、前記差は、前記前のブロックを符号化するために使用されたビットの前記数から前記現在ブロックをコーディングするために割り振られたビットの前記数を引くことによって決定され、前記現在ブロックをコーディングするために割り振られたビットの前記数が、（スライスのために残っているビットの数／前記スライス中でコーディングされるべきピクセルの数）＊前記現在ブロック中のピクセルの数、と決定される、
非一時的コンピュータ可読媒体。
前記命令が、式、すなわち、前記前のブロックのＱＰ＋前記決定された範囲に関連付けられた前記値＊（前記差＞０？１：−１）、に従って前記現在ブロックの前記ＱＰを決定することを前記プロセッサにさらに行わせる、請求項１７に記載のコンピュータ可読媒体。
前記複数の範囲は、２つまたはそれ以上のしきい値によって定義され、前記複数の範囲の各々は、前記ＱＰを調整するためのそれぞれの調整値に関連付けられる、請求項１７に記載のコンピュータ可読媒体。
前記ビデオデータのコンテンツのタイプが、自然コンテンツ、合成コンテンツ、コンピュータグラフィックス、またはフラクタルのうちの１つを備える、請求項１７に記載のコンピュータ可読媒体。
ビデオ情報をコーディングするための装置であって、
メモリにビデオデータを記憶するための手段と、前記メモリがバッファを含む、
コーディングされるべき前記ビデオデータを受信するための手段と、
前記ビデオデータの現在ブロックをコーディングするために割り振られたビットの数と、前記ビデオデータの前のブロックを符号化するために使用されたビットの数との間の差を決定するための手段と、
前記差が収まる、複数の範囲の中の１つの範囲を決定するための手段と、
前記決定された範囲に基づいて、量子化パラメータ（ＱＰ）を調整するための調整値を決定するための手段と、
前記決定された調整値に基づいて、前記現在ブロックの調整されたＱＰを決定するための手段と、
前記調整されたＱＰを使用して、ビットストリーム中で前記現在ブロックをコーディングするための手段と
を備え、
ここにおいて、前記差は、前記前のブロックを符号化するために使用されたビットの前記数から前記現在ブロックをコーディングするために割り振られたビットの前記数を引くことによって決定され、前記現在ブロックをコーディングするために割り振られたビットの前記数が、（スライスのために残っているビットの数／前記スライス中でコーディングされるべきピクセルの数）＊前記現在ブロック中のピクセルの数、と決定される、
装置。
前記ＱＰを決定するための前記手段が、式、すなわち、前記前のブロックのＱＰ＋前記決定された範囲に関連付けられた前記値＊（前記差＞０？１：−１）、に従って前記現在ブロックの前記ＱＰを決定するようにさらに構成された、請求項２１に記載の装置。
前記複数の範囲は、２つまたはそれ以上のしきい値によって定義され、前記複数の範囲の各々は、前記ＱＰを調整するためのそれぞれの調整値に関連付けられる、請求項２１に記載の装置。
前記ビデオデータのコンテンツのタイプが、自然コンテンツ、合成コンテンツ、コンピュータグラフィックス、またはフラクタルのうちの１つを備える、請求項２１に記載の装置。