JP6978633B2

JP6978633B2 - 空間層レート割り当て

Info

Publication number: JP6978633B2
Application number: JP2021502480A
Authority: JP
Inventors: ホロウィッツ、マイケル; ブラント、ラスマス
Original assignee: Google LLC
Current assignee: Google LLC
Priority date: 2018-07-26
Filing date: 2019-06-23
Publication date: 2021-12-08
Anticipated expiration: 2039-06-23
Also published as: US20230239480A1; US11632555B2; US12022090B2; WO2020023167A1; KR20210022117A; KR102525584B1; EP3827588A1; CN112514387B; JP2021524213A; CN112514387A; US11032549B2; CN116016935A; KR20230058541A; US20200036981A1; US20210281850A1

Description

本開示は、スケーラブルな映像符号化（ｖｉｄｅｏｃｏｄｉｎｇ）のコンテキストにおける空間層レート割り当てに関する。

映像（ｖｉｄｅｏ）が広範囲のアプリケーションにおいてますます一般的になるにつれて、映像ストリームは、アプリケーションに応じて複数回、符号化（ｅｎｃｏｄｅｄ）および／または復号化（ｄｅｃｏｄｅｄ）される必要がある場合がある。例えば異なるアプリケーションおよび／または装置は、帯域幅またはリソース制約に準拠する必要がある場合がある。非常に高価であることなく、設定のいくつかの組み合わせを必要とするこれらの要求を満たすために、映像をいくつかの解像度（ｒｅｓｏｌｕｔｉｏｎｓ）に圧縮する高効率のコーデック（ｃｏｄｅｃｓ）が開発されてきた。スケーラブルＶＰ９およびＨ．２６４のようなコーデックでは、映像ビットストリームは、ユーザが異なる解像度（すなわち各空間層の解像度）で元の映像を再構成することを可能にする複数の空間層を含むことができる。スケーラブルな機能を有することによって、映像コンテンツは装置から、限定されたさらなる処理を有する装置に送達され得る。

ヴィヴェクケーゴヤール（ＶＩＶＥＫＫＧＯＹＡＬ），『変換符号化の理論的基礎』（ＴｈｅｏｒｅｔｉｃａｌＦｏｕｎｄａｔｉｏｎｓｏｆＴｒａｎｓｆｏｒｍＣｏｄｉｎｇ），ＩＥＥＥ信号処理マガジン（ＩＥＥＥＳＩＧＮＡＬＰＲＯＣＥＳＳＩＮＧＭＡＧＡＺＩＮＥ），ＩＥＥＥサービスセンター（ＩＥＥＥＳＥＲＶＩＣＥＣＥＮＴＥＲ），ＰＩＳＣＡＴＡＷＡＹ，ＮＪ，ＵＳ，ｖｏｌ．１８，ｎｏ．５，２００１年９月１日，９頁〜２１頁，ＸＰ０１１０９２３５６，ＩＳＳＮ：１０５３−５８８８「ビット割り当て」（ＢｉｔＡｌｌｏｃａｔｉｏｎ）の部，１４頁〜１５頁

ビットレートを割り当てる方法を改善する余地がある。

本開示の一態様は、ビットレートを割り当てる方法を提供する。この方法は、データ処理ハードウェアにおいて、スケーリングされた映像入力信号に対応する変換係数（Ｔｒａｎｓｆｏｒｍｃｏｅｆｆｉｃｉｅｎｔ）を受信する工程を含み、スケーリングされた映像入力信号は複数の空間層を含み、複数の空間層はベース層を含む。この方法はまた、データ処理ハードウェアによって、スケーリングされた映像入力信号からのフレームのサンプル（ｓａｍｐｌｅｏｆｆｒａｍｅｓ）に基づき、空間レート係数（Ｓｐａｔｉａｌｒａｔｅｆａｃｔｏｒ）を決定する工程を含む。空間レート係数は、スケーリングされた映像入力信号から形成された符号化ビットストリーム（ｅｎｃｏｄｅｄｂｉｔｓｔｒｅａｍ）の各空間層における、ビットレート割り当てのための係数を定義する。空間レート係数は、ベース層の変換係数当たりのビットレートと、複数の空間層の変換係数当たりのビットの平均レートとの差によって表される。本方法はまた、空間レート係数とフレームのサンプルとに基づき、各空間層にビットレートを割り当てることによって、符号化ビットストリームの複数の空間層の歪みを低減する工程を含む。

本開示の実装は、以下の任意の特徴のうちの１つまたは複数を含むことができる。いくつかの実装形態では、この方法はまた、データ処理ハードウェアにおいて、スケーリングされた映像入力信号からフレームの第２サンプルを受信する工程と、スケーリングされた映像入力信号からのフレームの第２サンプルに基づき、空間レート係数をデータ処理ハードウェアによって修正（ｍｏｄｉｆｙ）する工程と、データ処理ハードウェアによって、修正された空間レート係数とフレームの第２サンプルとに基づき、各空間層に修正されたビットレートを割り当てる工程とを含む。追加の実装形態では、本方法はまた、データ処理ハードウェアにおいて、スケーリングされた映像入力信号からフレームの第２サンプルを受信する工程と、データ処理ハードウェアによって、フレーム毎ベースで（ｆｒａｍｅ−ｂｙ−ｆｒａｍｅｂａｓｉｓ）、指数移動平均に基づき空間レート係数を修正する工程とであって、指数移動平均は少なくともフレームのサンプルとフレームの第２サンプルとに対応する、前記空間レート係数を修正する工程と、修正された空間レート係数に基づき各空間層に、修正されたビットレートをデータ処理ハードウェアによって割り当てる工程とを含む。

一部の例では、スケーリングされた映像入力信号を受信する工程は、映像入力信号を受信する工程と、映像入力信号を複数の空間層にスケーリングする工程と、各空間層をサブブロックに分割する工程と、各サブブロックを変換係数に変換する工程と、各サブブロックに対応する変換係数をスカラー量子化する工程とを含む。スケーリングされた映像入力信号からのフレームのサンプルに基づき空間レート係数を決定する工程は、映像入力信号の全てのフレームにわたる変換ブロックの平均に基づき、各スカラー量子化された変換係数の分散推定（ｖａｒｉａｎｃｅｅｓｔｉｍａｔｉｏｎｓ）を決定する工程を含むことができる。ここで、各サブブロックの変換係数は、全てのサブブロックにわたって同一に分布（ｉｄｅｎｔｉｃａｌｌｙｄｉｓｔｒｉｂｕｔｅｄ）されてもよい。

いくつかの実装形態では、この方法は、データ処理ハードウェアによって、空間レート係数が空間レート係数閾値を満足することを決定する工程も含む。これらの実施形態では、空間レート係数閾値に対応する値が約１．０未満で約０．５よりも大きい場合に、空間レート係数閾値に対応する値は空間レート係数閾値を満たすことができる。空間レート係数は、符号化ビットストリームの各層にビットレートを割り当てるように構成された、単一のパラメータを含むことができる。いくつかの例では、空間レート係数は、分散の積の比率に対応する加重和（ｗｅｉｇｈｔｅｄｓｕｍ）を含み、比は、第１空間層からのスカラー量子化された変換係数の推定分散（ｅｓｔｉｍａｔｅｄｖａｒｉａｎｃｅｓ）に基づく分子と、第２空間層からのスカラー量子化された変換係数の推定分散に基づく分母とを含む。

本開示の別の態様は、ビットレートを割り当てるシステムを提供する。システムは、データ処理ハードウェアと、データ処理ハードウェアに通信するメモリハードウェアとを含む。メモリハードウェアは命令を記憶し、命令はデータ処理ハードウェアによって実行されると、データ処理ハードウェアに動作を実行させる。動作は、スケーリングされた映像入力信号に対応する変換係数を受信する工程を含み、スケーリングされた映像入力信号は複数の空間層を含み、複数の空間層はベース層を含む。動作はまた、スケーリングされた映像入力信号からのフレームのサンプルに基づき、空間レート係数を決定する工程を含む。空間レート係数は、スケーリングされた映像入力信号から形成された符号化ビットストリームの各空間層における、ビットレート割り当てのための係数を定義する。空間レート係数は、ベース層の変換係数当たりのビットレートと、複数の空間層の変換係数当たりのビットの平均レートとの差によって表される。動作はまた、空間レート係数とフレームのサンプルとに基づき、各空間層にビットレートを割り当てることによって、符号化ビットストリームの複数の空間層の歪みを低減する工程を含む。

この態様は、以下の任意の特徴のうちの１つ以上を含むことができる。いくつかの実装形態では、動作は、スケーリングされた映像入力信号からフレームの第２サンプルを受信する工程と、スケーリングされた映像入力信号からのフレームの第２サンプルに基づき空間レート係数を修正する工程と、修正された空間レート係数とフレームの第２サンプルとに基づき、各空間層に修正されたビットレートを割り当てる工程とを含む。追加の実装では、動作はさらに、スケーリングされた映像入力信号からフレームの第２サンプルを受信する工程と、フレーム毎のベースで指数移動平均に基づき空間レート係数を修正する工程であって、指数移動平均は少なくともフレームのサンプルとフレームの第２サンプルとに対応する、前記フレームの第２サンプルを修正する工程と、修正されたビットレートを、修正された空間レート係数に基づき各空間層に割り当てる工程とを含む。

一部の例では、スケーリングされた映像入力信号を受信する工程は、映像入力信号を受信する工程と、映像入力信号を複数の空間層にスケーリングする工程と、各空間層をサブブロックに分割する工程と、各サブブロックを変換係数に変換する工程と、各サブブロックに対応する変換係数をスカラー量子化する工程とを含む。スケーリングされた映像入力信号からのフレームのサンプルに基づき空間レート係数を決定する工程は、映像入力信号のフレームの全ての変換ブロックにわたる平均に基づき、各スカラー量子化された変換係数の分散推定を決定する工程を含むことができる。ここで、各サブブロックの変換係数は、全てのサブブロックにわたって同一に分布されてもよい。

いくつかの実装形態では、動作は、空間レート係数が空間レート係数閾値を満足することを決定する工程も含む。これらの実装形態では、空間レート係数閾値に対応する値は、値が約１．０未満で約０．５よりも大きい場合に、空間レート係数閾値を満たしてもよい。空間レート係数は、符号化ビットストリームの各層にビットレートを割り当てるように構成された、単一のパラメータを含むことができる。いくつかの例では、空間レート係数は、分散の積の比に対応する加重和を含み、比は、第１空間層からのスカラー量子化された変換係数の推定分散に基づく分子と、第２空間層からのスカラー量子化された変換係数の推定分散に基づく分母とを含む。

本開示の１つ以上の実装の詳細は、添付の図面および以下の明細書に記載されている。他の態様、特徴、および利点は、明細書および図面および特許請求の範囲から明らかになるであろう。

例示的なレート割り当てシステムの概略図。図１のレート割り当てシステム内の例示的なエンコーダの概略図。図１のレート割り当てシステム内の例示的なアロケータの概略図。レート割り当てシステムを実装するための例示的な方法の流れ図。本明細書に記載されたシステムおよび方法を実装するために使用され得る例示的な計算装置の概略図。

様々な図面における同様の参照符号は同様の要素を示す。
図１は、レート割り当てシステム１００の例である。レート割り当てシステム１００は、一般に、映像入力信号１２０としてキャプチャされた映像を、ネットワーク１３０を介してリモートシステム１４０に通信する映像ソース装置１１０を含む。リモートシステム１４０において、エンコーダ２００およびアロケータ３００は、映像入力信号１２０を、符号化ビットストリーム２０４に変換する。符号化ビットストリーム２０４は、複数の空間層Ｌ_０〜Ｌ_ｉを含み、ｉは空間層Ｌ_０〜Ｌ_ｉの数を指定する。各空間層Ｌは、符号化ビットストリーム２０４のスケーラブルな形態である。スケーラブル映像ビットストリームとは、映像ビットストリームをいい、ビットストリームの一部は、いくつかのターゲットデコーダに対して有効なビットストリームを形成するサブストリーム（例えば空間層Ｌ）が生じるように、除去されることができる。より詳細には、サブストリームは、元のキャプチャされた映像の品質よりも低い再構成品質を有する、元の映像入力信号１２０のソースコンテンツ（例えばキャプチャされた映像）を生成する。例えば第１空間層Ｌ_１は１２８０×７２０の７２０ｐ高精細度（ＨＤ）解像度を有し、一方でベース層Ｌ_０は、映像グラフィックスアダプタ解像度（ＶＧＡ）の拡張形態として６４０×３６０の解像度にスケーリングする。スケーラビリティの点で、一般に、映像は、一時的にスケーラブル（例えばフレームレートによって）であったり、空間的（例えば空間解像度によって）であったり、および／または品質（例えば信号対雑音比ＳＮＲと呼ばれる忠実度（ｆｉｄｅｌｉｔｙ））によったりする。

レート割り当てシステム１００は、ユーザ１０、１０ａが映像ソース装置１１０で映像をキャプチャし、キャプチャされた映像を他のユーザ１０、１０ｂ〜１０ｃに通信する例示的な環境である。ここで、キャプチャされた映像をユーザ１０ｂ、１０ｃが映像受信装置１５０、１５０ｂ〜１５０ｃを介して受信する前に、エンコーダ２００およびアロケータ３００は、キャプチャされた映像を、割り当てられたビットストリームレートで、符号化ビットストリーム２０４に変換する。各映像受信装置１５０は、異なる映像解像度を受信および／または処理するように構成することができる。ここで、より大きい層番号ｉを有する空間層Ｌは、より大きい解像度を有する層Ｌを指し、ｉ=０は、複数の空間層Ｌ_０〜Ｌ_ｉのビットストリームのうちの最も低いスケーラブルな解像度を有するベース層Ｌ_０を指す。図１を参照すると、符号化された映像ビットストリーム２０４は、２つの空間層Ｌ_０、Ｌ_１を含む。したがって、１つの映像受信装置１５０は、低解像度空間層Ｌ_０として映像コンテンツを受信することができ、一方で、別の映像受信装置１５０は、高解像度空間層Ｌ_１として映像コンテンツを受信することができる。例えば図１は、ユーザ１０ｂの第１映像受信装置１５０ａを、低解像度空間層Ｌ_０を受信する携帯電話機として示し、ラップトップとしての第２受信装置１５０ｂを有するユーザ１０ｃは、高解像度空間層Ｌ_１を受信する。

異なる映像受信装置１５０ａ〜１５０ｂが異なる空間層Ｌ_０〜Ｌ_ｉを受信するとき、各空間層Ｌの映像品質は、受信された空間層ＬのビットレートＢ_Ｒおよび／または割り当て係数Ａ_Ｆに依存しうる。ここで、ビットレートＢ_Ｒは１秒当たりのビット（ｂｉｔｓｐｅｒｓｅｃｏｎｄ）に対応し、割り当て係数Ａ_Ｆは、サンプル当たりのビット（すなわち、変換係数）に対応する。スケーラブルビットストリーム（例えば符号化ビットストリーム２０４）の場合、スケーラブルビットストリームの総ビットレートＢ_Ｒｔｏｔは、スケーラブルビットストリームの各空間層Ｌが同様のビットレート制約を受けるように、しばしば制約される。これらの制約のために、１つの空間層Ｌに関連するビットレートＢ_Ｒは、別の空間層Ｌの品質を損なうか、またはトレードオフする可能性がある。より詳細には、映像受信装置１５０を介してユーザ１０によって受信された空間層Ｌ上で品質が損なわれた場合、品質はユーザ経験に否定的な効果を生成する可能性がある。例えばリアルタイム通信（ＲＴＣ）アプリケーションを介した通信の形態として映像コンテンツを転送することは、より一般的になりつつある。ＲＴＣアプリケーションのユーザ１０は、アプリケーションの主観的な品質（ｓｕｂｊｅｃｔｉｖｅｑｕａｌｉｔｙ）に基づき通信のためのアプリケーションを選択することが多い。したがって、アプリケーションユーザとして、ユーザ１０は、一般に、アプリケーションユーザ１０が受け取る空間層Ｌへの不十分なビットレート割り当てに起因する可能性がある品質問題なしに、前向きな通信体験（ｐｏｓｉｔｉｖｅｃｏｍｍｕｎｉｃａｔｉｏｎｅｘｐｅｒｉｅｎｃｅ）を有することを望んでいる。前向きなユーザ経験（ｐｏｓｉｔｉｖｅｕｓｅｒｅｘｐｅｒｉｅｎｃｅ）を確実にすることを支援するために、アロケータ３００は、割り当て係数Ａ_Ｆを適応的に通信して、複数の空間層Ｌ_０〜Ｌ_ｉのうちの各空間層Ｌに対するビットレートＢ_Ｒを決定するように構成される。複数の空間層Ｌ_０〜Ｌ_ｉの中で割り当て係数Ａ_Ｆを解析的に割り当てることによって、アロケータ３００は、所与の総ビットレートＢ_Ｒｔｏｔに対して全ての空間層Ｌ_０〜Ｌ_ｉにわたって最高の映像品質を達成しようとする。

映像ソース装置１１０は、キャプチャされた映像および／または映像入力信号１２０をネットワーク１３０および／またはリモートシステム１４０に通信することができる任意の計算装置またはデータ処理ハードウェアであってもよい。いくつかの例では、映像ソース装置１１０は、データ処理ハードウェア１１２、メモリハードウェア１１４、および映像キャプチャ装置１１６を含む。いくつかの実装形態では、映像キャプチャ装置１１６は、実際には、キャプチャされた画像のシーケンスを映像コンテンツとして通信することができる画像キャプチャ装置である。例えばいくつかのデジタルカメラおよび／またはウェブカムは、特定の周波数で画像をキャプチャして、知覚される映像コンテンツを形成するように構成される。他の例では、映像ソース装置１１０は、続いてデジタルフォーマットに変換され得る連続的なアナログフォーマットで映像をキャプチャする。いくつかの構成では、映像ソース装置１１０は、キャプチャされたデータ（例えば、アナログまたはデジタル）を、エンコーダ２００によってさらに処理されるフォーマットに最初にエンコードまたは圧縮するためのエンコーダを含む。他の例では、映像ソース装置１１０は、映像ソース装置１１０においてエンコーダ２００にアクセスするように構成される。例えばエンコーダ２００は、リモートシステム１４０上にホストされたウェブアプリケーションであり、映像ソース装置１１０によってネットワーク接続を介してアクセス可能である。例えば他の例では、エンコーダ２００および／またはアロケータ３００の部分または全部は、映像ソース装置１１０上でホストされる。例えば、エンコーダ２００およびアロケータ３００は、映像ソース装置１１０上でホストされるが、リモートシステム１４０は、映像受信装置１５０の復号機能に応じて、および映像受信装置１５０とリモートシステム１４０との間のネットワーク１３０の接続の容量に応じて、空間層Ｌ_０〜Ｌ_ｉを含むビットストリームを映像受信装置１５０に中継するバックエンドシステムとして機能する。追加的にまたは代替的に、映像ソース装置１１０は、映像キャプチャ装置１１６を利用して、ユーザ１０ａがネットワーク１３０を介して他のユーザ１０ｂ〜１０ｃに通信するように係わるように、構成されている。

映像入力信号１２０は、キャプチャされた映像コンテンツに対応する映像信号である。ここで、映像ソース装置１１０は、映像コンテンツをキャプチャする。例えば図１は、ウェブカメラ１１６を介して映像コンテンツをキャプチャする映像ソース装置１１０を示している。いくつかの例では、映像入力信号１２０は、エンコーダ２００によってデジタルフォーマットに処理されるアナログ信号である。他の例では、映像入力信号１２０は、エンコーダ２００が再量子化プロセスを実行するように、エンコーダ２００の前に何らかのレベルの符号化またはデジタルフォーマット化を受けている。

映像ソース装置１１０と同様に、映像受信装置１５０は、ネットワーク１３０および／またはリモートシステム１４０を介して通信されたキャプチャ映像を受信することができる任意の計算装置またはデータ処理ハードウェアであってもよい。いくつかの例では、映像ソース装置１１０および映像受信装置１５０は、映像受信装置１５０が映像ソース装置１１０となり、映像ソース装置１１０が映像受信装置１５０となるような同一の機能で構成される。いずれの場合も、映像受信装置１５０は、少なくともデータ処理ハードウェア１５２およびメモリハードウェア１５４を含む。さらに、映像受信装置１５０は、受信した映像コンテンツ（例えば符号化ビットストリーム２０４の少なくとも１つの層Ｌ）を表示するように構成されたディスプレイ１５６を含む。図１に示すように、ユーザ１０ｂ、１０ｃは、符号化ビットストリーム２０４をビットレートＢ_Ｒで空間層Ｌとして受信し、符号化ビットストリーム２０４を映像としてディスプレイ１５６に復号して表示する。いくつかの例では、映像受信装置１５０が符号化ビットストリーム２０４の内容を表示することを可能にするために、映像受信装置１５０はデコーダを含み、またはデコーダに（例えばネットワーク１３０を介して）アクセスするように構成される。

いくつかの実施形態では、エンコーダ２００および／またはアロケータ３００は、クラウド環境の分散システムなどのリモートシステム１４０によってホストされるアプリケーションであり、映像ソース装置１１０および／または映像受信装置１５０を介してアクセスされる。いくつかの実装形態では、エンコーダ２００および／またはアロケータ３００は、映像ソース装置１１０および／または映像受信装置１５０のメモリハードウェア１１４，１５４にダウンロードされたアプリケーションである。エンコーダ２００および／またはアロケータ３００へのアクセスポイントにかかわらず、エンコーダ２００および／またはアロケータ３００は、リモートシステム１４０に通信して、リソース１４２（例えばデータ処理ハードウェア１４４、メモリハードウェア１４６、またはソフトウェアリソース１４８）にアクセスするように構成することができる。リモートシステム１４０のリソース１４２へのアクセスは、エンコーダ２００および／またはアロケータ３００が映像入力信号１２０を符号化ビットストリーム２０４に符号化すること、および／またはビットレートＢ_Ｒを符号化ビットストリーム２０４の複数の空間層Ｌ_０〜Ｌ_ｉの各空間層Ｌに割り当てることを可能にし得る。任意選択で、リアルタイム通信（ＲＴＣ）アプリケーションは、ユーザ１０，１０ａ〜１０ｃの間で通信するために使用されるリモートシステム１４０のソフトウェアリソース１４８として、組み込み機能としてのエンコーダ２００および／またはアロケータ３００を備える。

図１をさらに詳細に参照すると、３人のユーザ１０、１０ａ〜１０ｃは、リモートシステム１４０によってホストされるＲＴＣアプリケーション（例えばクラウドによってホストされるｗｅｂＲＴＣ映像アプリケーション）を介して通信する。この例では、第１ユーザ１０ａは、第２ユーザ１０ｂおよび第３ユーザ１０ｃとのグループ映像チャットをしている。話している第１ユーザ１０ａの映像を映像キャプチャ装置１１６がキャプチャすると、映像入力信号１２０を介してキャプチャされた映像は、エンコーダ２００およびアロケータ３００によって処理され、ネットワーク１３０を介して通信される。ここで、エンコーダ２００およびアロケータ３００は、ＲＴＣアプリケーションと共に動作して、複数の空間層Ｌ_０、Ｌ_１を有する符号化ビットストリーム２０４を生成する。ここで各空間層Ｌは、映像入力信号１２０に基づき割り当て係数Ａ_Ｆ０、Ａ_Ｆ１によって決定される割り当てられたビットレートＢ_Ｒ０、Ｂ_Ｒ１を有する。各映像受信装置１５０ａ、１５０ｂの性能に起因して、チャットする第１ユーザ１０ａの映像を受信する各ユーザ１０ｂ、１０ｃは、映像入力信号１２０に対応する元の映像の異なるスケーリングされたバージョンを受信する。例えば第２ユーザ１０ｂはベース空間層Ｌ_０を受信し、第３ユーザ１０ｃは第１空間層Ｌ_１を受信する。各ユーザ１０ｂ、１０ｃは、受信した映像コンテンツを、ＲＴＣアプリケーションに通信するディスプレイ１５６ａ、１５６ｂに表示する。ＲＴＣ通信アプリケーションが示されているが、エンコーダ２００および／またはアロケータ３００は、複数の空間層Ｌ_０〜Ｌ_ｉを有する符号化ビットストリーム２０４を含む他のアプリケーションで使用されてもよい。

図２は、エンコーダ２００の例である。エンコーダ２００は、入力２０２としての映像入力信号１２０を、出力２０４としての符号化ビットストリームに変換するように構成されている。個々に示されているが、エンコーダ２００およびアロケータ３００は、単一の装置（例えば図１に点線で示すように）に統合されてもよく、または複数の装置（例えば映像入力装置１１０、映像受信装置１５０、またはリモートシステム１４０）にわたって別々に発生してもよい。エンコーダ２００は、一般に、スケーラ２１０、変換器２２０、量子化器２３０、およびエントロピエンコーダ２４０を含む。図示されていないが、エンコーダ２００は、符号化ビットストリーム２０４を生成するための追加の構成要素を含むことができ、追加の構成要素は、予測成分（例えば動き推定およびイントラ予測）および／またはインループフィルタなどである。予測成分は、変換のために変換器２２０に伝達される残差を生成し、残差は、元の入力フレームからフレームの予測（例えば動き補償またはフレーム内予測）を引いた差分に基づく。

スケーラ２１０は、映像入力信号１２０を複数の空間層Ｌ_０〜Ｌ_ｉにスケーリングするように構成される。いくつかの実装形態では、スケーラ２１０は、空間分解能を低減するために除去され得る映像入力信号１２０の部分を決定することによって、映像入力信号１２０をスケーリングする。部分または複数の部分を除去することによって、スケーラ２１０は、映像入力信号１２０のバージョンを形成し、複数の空間層（例えばサブストリーム）を形成する。スケーラ２１０は、スケーラ２１０がベース空間層Ｌ_０を形成するまで、このプロセスを繰り返すことができる。いくつかの例では、スケーラ２１０は、映像入力信号１２０をスケーリングして、設定された数の空間層Ｌ_０〜Ｌ_ｉを形成する。他の例では、スケーラ２１０は、サブストリームを復号するためのデコーダが存在しないとスケーラ２１０が判定するまで、映像入力信号１２０をスケーリングするように構成される。スケーラ２１０が、映像入力信号１２０のスケーリングされたバージョンに対応するサブストリームを復号するデコーダが存在しないと判定した場合、スケーラ２１０は、前のバージョン（例えば空間層Ｌ）をベース空間層Ｌ_０とする。スケーラ２１０のいくつかの例は、Ｈ．２６４映像圧縮規格の拡張またはＶＰ９符号化フォーマットの拡張のような、スケーラブル映像符号化（ＳＶＣ）拡張に対応するコーデックを含む。

変換器２２０は、スケーラ２１０からの映像入力信号１２０に対応する各空間層Ｌを受け取るように構成される。空間層Ｌ毎に、変換器２２０は、動作２２２において、各空間層Ｌをサブブロックに分割する。各サブブロックを用いて動作２２４において、変換器２２０は、各サブブロックを変換して変換係数２２６を生成する（例えば離散コサイン変換（ＤＣＴ）によって）。変換係数２２６を生成することによって、変換器２２０は、冗長映像データと非冗長映像データとを相関させて、エンコーダ２００による冗長映像データの除去を助けることができる。いくつかの実装形態では、変換係数はまた、アロケータ３００が、空間層Ｌ内の非ゼロ分散を有する変換ブロック毎の係数の数を容易に決定することを可能にする。

量子化器２３０は、量子化または再量子化プロセス２３２（スカラー量子化）を実行するように構成される。量子化プロセスは、一般に、入力パラメータ（例えば連続するアナログデータセットから）を、出力値のより小さいデータセットに変換する。量子化プロセスは、アナログ信号をデジタル信号に変換することができるが、ここでは、量子化プロセス２３２（再量子化プロセスとも呼ばれることもある）は、通常、デジタル信号をさらに処理する。映像入力信号１２０の形態に応じて、いずれかのプロセスを交換可能に使用することができる。量子化または再量子化プロセスを使用することによって、データは圧縮されることが可能であるが、より小さいデータセットはより大きいまたは連続的なデータセットの減少であるので、データ損失のいくつかの態様のコストである。ここで、量子化プロセス２３２は、デジタル信号を変換する。いくつかの例では、量子化器２３０は、変換器２２０からの各サブブロックの変換係数２２６を量子化インデックス２３４にスカラー量子化することによって、符号化ビットストリーム２０４の形成に寄与する。ここで、変換係数２２６をスカラー量子化することによって、非可逆的な符号化を可能にして、冗長な映像データ（例えば符号化中に除去され得るデータ）を、貴重な映像データ（例えば除去すべきでないデータ）にコントラストさせるために、各変換係数２２６をスケーリングすることができる。

エントロピエンコーダ２４０は、量子化インデックス２３４（すなわち、量子化された変換係数）およびサイド情報を、ビットに変換するように構成される。この変換によって、エントロピエンコーダ２４０は、符号化ビットストリーム２０４を形成する。いくつかの実装形態では、量子化器２３０と共にエントロピエンコーダ２４０は、エンコーダ２００が符号化ビットストリームを形成することを可能にし、ここで各層Ｌ_０〜Ｌ_ｉは、アロケータ３００によって決定された割り当て係数Ａ_Ｆ０〜Ａ_Ｆｉに基づきビットレートＢ_Ｒ０〜Ｂ_Ｒｉを有する。

図３は、アロケータ３００の例である。アロケータ３００は、複数の空間層Ｌ_０〜Ｌ_ｉに関連する非量子化された変換係数２２６を受信し、各受信された空間層Ｌ_０〜Ｌ_ｉについて割り当て係数Ａ_Ｆを決定するように構成される。いくつかの実装において、アロケータ３００は、スカラー量子化のための二乗誤差ベースの高速近似に基づき、各割り当て係数Ａ_Ｆを決定する。二乗誤差の高速近似によって、システムは、Ｎ個のスカラー量子化器を割り当てるために（高速近似のコンテキストで）最適なビットレートを決定することが可能になる。典型的には、ｎ個のスカラー量子化器に割り当てられる最適ビットレートは、レート−歪み最適化量子化によって決定される。レート−歪み最適化は、ビットレート制約（例えば総ビットレートＢ_Ｒｔｏｔ）による歪みの量（すなわち、映像品質の損失）を最小化することによって、映像圧縮中の映像品質を改善することを追求する。ここで、アロケータ３００は、Ｎ個のスカラー量子化器の最適ビットレートを決定する原理を適用し、符号化ビットストリーム２０４の複数の空間層Ｌ_０〜Ｌ_ｉの各々にビットレートを割り当てるための最適な割り当て係数を決定する。

一般的に言えば、スカラー量子化のための自乗誤差の高速近似は、以下の式で表すことができる。

ここで、ｈ_ｉ ^２は、第ｉ量子化器への入力信号（例えば変換係数）のソース分布に依存し、σ_ｉ ^２は、その信号の分散であり、ｒ_ｉは、第ｉ量子化器についての入力シンボル当たりのビット単位でのビットレートである。２スカラー量子化器に対する最適なレート割り当てのための式は、２乗誤差の高速近似を使用して以下に導出される。

２量子化問題の平均歪みＤ、すなわちＤ_２は、（ｄ_０＋ｄ_１）／２に等しい。同様に、２量子化問題についての平均レートＲ_２は、（ｒ_０＋ｒ_１）／２に等しい。ここで、ｄ_ｉは第ｉ量子化器による自乗誤差歪みであり、ｒ_ｉは１サンプル当たりのビット単位で第ｉ量子化器に割り当てられたビットレートである。ただし、パラメータｄ_ｉは、ｄ_ｉ（ｒ_ｉ）のような式が適切であるようなレートｒ_ｉの関数であるが、便宜上、ｄ_ｉは単に代わりにｄ_ｉとして表される。ｄ_０およびｄ_１についての高速近似をＤ_２の式に代入すると、次のようになる。

式（２）を用いて、２Ｒ_２−ｒ_０をｒ_１に代入すると、以下になる。

ｒ_０についてのＤ_２の導関数をさらにとることによって、式（３）から以下の式が得られる。

上記の式、つまり式（４）をゼロに設定し、ｒ_０について解くことによって、以下のように表されるゼロ量子化器についての最適レートｒ^＊の式が得られる。

高速歪みの式は凸（ｃｏｎｖｅｘ）であるため、導関数をゼロに設定することによって求められる最小値はグローバルである。同様に、第１量子化器の最適レートｒ^＊は、次のように表すことができる。

最適な量子化器の歪み、ｄ_０ ^＊およびｄ_１ ^＊を見出すために、式（５）および式（６）を、以下のようにスカラー量子化器の歪みについてのそれぞれの高速式に最適なレートで代入する。

式（７）の簡略化された形態は、以下の式をもたらす。

この同じ２量子化器分析は、ゼロ量子化器と第１量子化器とを単一の量子化システム（すなわち、ネスト化されたシステム）に結合することによって、３量子化器に拡張することができ、ここで、結合された量子化器は、式（１）〜（８）に従って既に解かれる。２量子化レート割り当てと同様の方法を使用して、３量子化器システムは以下のように導出される。

２量子化器システムのための平均／量子化器の歪みは、ｄ_ａｖｇ＝（ｄ_０＋ｄ_１）／２として表され、ｄ_ａｖｇを３量子化器の歪み平均の式に代入することによって、Ｄ_３＝（ｄ_０＋ｄ_１＋ｄ_２）／３は以下の式をもたらす。

同様に、３量子化器システムの平均レートは、次のように表される。

式（８）に示すように、２量子化器解析からの最適な歪みの結果を利用して、３量子化器の歪みは、以下の式で表すことができる。

したがって、式（１１）が簡略化され、ｒ_ａｖｇ=（３／２）Ｒ_３−（１／２）ｒ_２が式（１１）に代入されると、式（１１）は、以下の式に変換される。

式（１２）を用いて、ｒ_２に対する導関数をゼロに設定し、ｒ_２について解くことによって、以下の式を得ることができる。

３量子化器について、式（１３）のより一般的な表現は、次のように表すことができる。

第１量子化器および第２量子化器に基づき、Ｎ量子化器に対する最適なレート割り当てｒ^＊の式を導出することができる。第ｉ量子化器に対する最適レートの式は、以下のとおりである。

最適レートの式を歪みのための高速式に代入し、２量子化器の式と同様に単純化することによって、Ｎ量子化器に関する最適な歪みのための結果的な式が以下に示される。

式（１）〜（１６）からの導出された表現に基づき、アロケータ３００は、最適な歪みについてのこれらの式を適用して、複数の空間層Ｌ_０〜Ｌ_ｉの各層Ｌについて最適な割り当て係数Ａ_Ｆ（すなわち、最適なビットレートＢ_Ｒに寄与する）を決定することができる。導出されたＮ個の量子化表現に類似して、複数の空間層ビットレートは、２層および３層レート割り当てシステムに関連する式から推定することができる。いくつかの例では、空間層Ｌ_０〜Ｌ_ｉは典型的には異なる空間次元を有するが、空間層Ｌ_０〜Ｌ_ｉは、同じ映像ソース（例えば映像ソース装置１１０）から発生すると仮定する。一部の実施形態では、第１空間層Ｌ_０および第２空間層Ｌ_１を符号化するスカラー量子化器は、これらのスカラー量子化器の値が異なっても、構造が同一であると仮定される。さらに、各空間層Ｌについて、サンプルＳの数は、一般に、変換係数２２６の数に等しい（すなわち、量子化器の数に等しい）。

２空間層レート割り当てシステムの場合、２空間層の平均歪みＤ_２は、第１および第２空間層Ｌ_０、Ｌ_１（すなわち空間層０および空間層１）に対応する平均歪みｄ_０およびｄ_１の加重和として、以下のように表すことができる。

ここで、ｓ_ｉは第ｉ空間層Ｌ_ｉにおけるサンプル数に等しく、Ｓ=ｓ_０+ｓ_１である。同様に、２空間層の平均ビットレートは、次のように表すことができる。

ここで、ｒ_０およびｒ_１は、それぞれ第１および第２空間層Ｌ_０、Ｌ_１の平均ビットレートである。Ｎ−量子化器の最適な歪みについての式（すなわち、式（１６））をＤ_２についての式（１７）に代入すると、上述のＤ_２は次のように表すことができる。

ここでσ_ｊ，ｉ ^２は、第ｉ空間層Ｌ_ｉにおける第ｊスカラー量子化器への入力信号の分散である。式（１８）においてｒ_１について解き、結果を式（１９）に代入すると、以下のようになる。

また、ｒ_０に対するＤ_２の導関数をゼロに設定し、ｒ_０について解くことによって、ｒ_０を次式で表すことができる。

表記の便宜上、式（２１）を簡略化するために、Ｐ_ｉ＝Π_ｊ＝０ ^Ｓｉ−１ｈ_ｊ，ｉσ_ｊ，ｉである。Ｐ_ｉについてのこの式をｒ_０ ^＊についての式（２１）に代入し、得られた項を再配置することによって、Ｎ−量子化器の割り当て式と同様に現れる次式が形成される。

あるいは、式（２２）は、以下の式に到達するためにｒ_１ ^＊の項で表現されてもよい。

式（７）〜（２３）に基づき、最適な２空間層歪みは以下のように表すことができる。

同様のアプローチは、３つの空間層Ｌ_０〜Ｌ_２に適用される最適な割り当て係数を開発することができる。２つの空間層Ｌ_０、Ｌ_１と同様に、ｓ_ｉは第ｉ空間層Ｌ_ｉにおけるサンプルの数に等しく、Ｓ＝ｓ_０＋ｓ_１＋ｓ_２である。３つの空間層Ｌ_０〜Ｌ_２についての平均レートＲ_３および歪みＤ_３は、それぞれ、空間層０，１，２（例えば３つの空間層Ｌ_０〜Ｌ_２）の平均レートｒ_０、ｒ_１、ｒ_２の加重和および歪みｄ_０、ｄ_１、ｄ_２の加重和として、次のように表すことができる。

同様の技術が２量子化器の結果から３量子化器に適用される場合、Ｒ_３は、以下の式を使用して、平均２層レートＲ_２の組合せとして表現され得る。

同様に、３量子化器について、歪みは以下のように表すことができる。

２層最適歪みＤ_２ ^＊の式（２４）と、最適なＮ−量子化器歪みｄ_ｉ ^＊のための式（８）とを用いて、式（２９）はＤ_３について解くことができ、以下の式を得ることができる。

ここで、Ｐ_ｉ=Π_ｊ＝０ ^Ｓｉ−１ｈ_ｊ，ｉσ_ｊ，ｉである。式（２７）は、Ｒ_２について解くことができ、以下の式を得ることができる。

さらに、式（３２）をＤ_３の式（３１）に代入することによって、式（３１）と式（３２）を合成することによって、以下の式が得られる。

ｒ_２についての式は、ｒ_２に対するＤ_３の導関数をとり、結果をゼロに設定することによって形成することができる。この式は、以下の式で表すことができる。

各項が再配置されると、式（３４）は、以下のような

と同様に見えることができる。

この式（３６）を第１層Ｌ_０および第２層Ｌ_１に適用すると、各層についての割り当て係数（ａｌｌｏｃａｔｉｏｎｆａｃｔｏｒ）は、以下のように表すことができる。

２つの空間層Ｌ_０〜Ｌ_１および３つの空間層Ｌ_０〜Ｌ_２の両方の導出は、アロケータ３００におけるレート割り当て（例えば各空間層Ｌに割り当てられたビットレートＢ_Ｒを決定するための割り当て係数Ａ_Ｆ）を最適化することができるように複数の空間層に拡張されるパターンを示す。ここで、上記結果をＬ個の空間層Ｌ_ｉ〜Ｌ_Ｌに拡張することによって、以下の式で表される普遍的表現が得られる。

ここで、Ｒ_Ｌは、Ｌ個の空間層Ｌ_０〜Ｌ_ｉ上のサンプル当たりのビットに対応する平均レートである。Ｌ個の空間層にわたるサンプル総数Ｓは、ここではＳ＝Σ_ｉ＝０ ^Ｌ−１ｓ_ｉであり、ｓ_ｉは第ｉ空間層におけるサンプル数である。Ｐ_ｉ＝Π_ｊ＝０ ^Ｓｉ−１ｈ_ｊ，ｉσ_ｊ，ｉであり、ここでｈ_ｊ，ｉは、第ｉ空間層における第ｊ量子化器によって量子化される信号のソース分布に依存する。σ_ｊ，ｉ ^２は、第ｉ空間層における第ｊ変換係数の分散に対応する。

いくつかの実装形態では、式（３９）は、様々な仮定に起因して異なる形態を有する。式（３９）の２つの異なる形態を以下に示す。

例えばｈ_ｊ，ｉの値は、第ｉ空間層Ｌｉにおける第ｊ量子化器によって量子化される映像入力信号１２０のソース分布に依存する。同様のソース分布を有する例では、ｈ_ｊ，ｉの値は、量子化器から量子化器へ変化しないので、式（３９）内の積の項の比率のためにキャンセルされる。換言すれば、ｈ_ｊ，０=ｈ_ｊ，１=ｈ_ｊ，２=ｈである。したがって、このキャンセルが生じる場合、Ｐ_ｉの項は、Ｐ_ｉ＝Π_ｊ＝０ ^Ｓｉ−１ｈ_ｊ，ｉσ_ｊ，ｉ＝ｈΠ_ｊ＝０ ^Ｓｉ−１σ_ｊ，ｉである。これによって、Ｐ_ｉは常に、分子にｈがあり、分母の同類項をキャンセルする比率として表示されるため、このパラメータは考慮から効果的に除外される。実際には、ｈ_ｊ，０は、ｈ_ｊ，１およびｈ_ｊ，２とは異なることがある。というのは、ベース空間層Ｌ_０は時間予測のみを使用するが、他の空間層は時間予測および空間予測の両方を使用することができるからである。いくつかの構成では、この差は、アロケータ３００によって決定された割り当て係数Ａ_Ｆに大きく影響を及ぼさない。

他の実施態様では、エンコーダ２００は、変換係数２２６をもたらす変換ブロックを導入する。これが発生すると、変数ｓ_ｉ′を導入する変換係数２２６のグループ化に変化が生じ得る。変数ｓ_ｉ′は、式（３９ａ）に示されるように、第ｉ空間層Ｌ_ｉにおける非ゼロ分散を有する変換ブロック当たりの変換係数２２６の平均数に対応する。これに対して、この変数ｓ_ｉ′は、第ｉ空間層Ｌ_ｉにおけるサンプル数Ｓに対応する式（３９ｂ）のｓ_ｉに対応する。さらに、式（３９ａ）において、項Ｐ_ｉ＝Π_ｋ＝０ ^{Ｓ′ｉ−１}σ_ｋ，ｉであり、ここでσ_ｋ，ｉ ^２は、第ｉ空間層Ｌ_ｉの変換ブロックの第ｋ係数の分散である。実際的には、式（３９ａ）は、分散の積の比の加重和の式（例えば（１／２）Σ_ｊ＝０ ^Ｌ−１（ｓ_ｊ′／ｓ′）ｌｏｇ_２（Ｐ_ｉ／Ｐ_ｊ））として、第ｉ空間層Ｌ_ｉに対する最適なビットレート割り当てを表す。

図３を参照すると、いくつかの実装形態では、アロケータ３００は、サンプラ３１０と、推定器３２０と、レート決定器３３０とを備える。サンプラ３１０は、複数の空間層Ｌ_０〜Ｌ_ｉを有する非量子化変換係数２２６を、アロケータ３００の入力３０２として受け取る。例えば図２は、点線によってアロケータ３００に通信される変換器２２０によって生成された変換係数２２６を示す。受信された非量子化変換係数２２６によって、サンプラ３１０は、映像入力信号１２０のフレームをサンプルＳ_Ｆとして識別する。サンプラ３１０によって識別されたサンプルＳ_Ｆに基づき、アロケータ３００は、各空間層Ｌについて割り当て係数Ａ_Ｆを決定する。いくつかの実施形態では、アロケータ３００は、各空間層Ｌの割り当て係数Ａ_Ｆを動的に決定するように構成される。これらの実施態様では、サンプラ３１０は、アロケータ３００が、サンプラ３１０によって識別された各セットのサンプルＳ_Ｆに割り当て係数Ａ_Ｆを適合させることができるように、フレームサンプルＳ_Ｆのセットを反復的に識別するように構成されてもよい。例えばアロケータ３００は、映像入力信号１２０のフレームの第１サンプルＳ_Ｆ１に基づき、各空間層Ｌに対する割り当て係数Ａ_Ｆを決定する。その後、アロケータ３００は、サンプラ３１０によって識別された映像入力信号１２０のフレームの第２サンプルＳ_Ｆ２に基づき、各空間層Ｌ（例えば必要であれば）に適用される割り当て係数Ａ_Ｆを調整（ａｄｊｕｓｔ）または修正（ｍｏｄｉｆｙ）する（例えば図３に示されるように、第１サンプルＳ_Ｆ１の第１割り当て係数Ａ_Ｆ１から、第２サンプルＳ_Ｆ２の第２割り当て係数Ａ_Ｆ２へと変化する）ように進む。このプロセスは、アロケータ３００が映像入力信号１２０を受信する期間にわたって繰り返し継続することができる。これらの例では、アロケータ３００は、割り当て係数Ａ_Ｆを修正し、続いて第１サンプルＳ_Ｆ１と第２サンプルＳ_Ｆ２との間の変化に基づき（例えば第１空間レート係数３３２_１から第２空間レート係数３３２_２への）空間レート係数３３２を修正する。追加的にまたは代替的に、アロケータ３００は、指数移動平均を使用して、フレーム毎に割り当て係数Ａ_Ｆを修正することができる。指数移動平均は、一般に、現在のフレームに対して決定された割り当て係数Ａ_Ｆを、以前のフレームからの割り当て係数Ａ_Ｆの加重平均で重み付けする加重移動平均である。言い換えると、ここでは、割り当て係数Ａ_Ｆに対する各修正は、現在の割り当て係数Ａ_Ｆおよび以前の割り当て係数Ａ_Ｆを有する加重平均である。

推定器３２０は、エンコーダ２００からの各変換係数の分散推定３２２を決定するように構成されている。いくつかの構成では、推定器３２０は、変換器２２０からの各ブロック内の変換係数２２６が同様に分布されていると仮定する。この仮定に基づき、変換係数２２６の分散は、映像入力信号１２０のサンプルフレームＳ_Ｆ内の全ての変換ブロックにわたって平均することで推定できる。例えば以下の式は、第ｉ空間層Ｌ_ｉにおける第ｋ変換係数２２６を、ランダム変数Ｅ_ｋ，ｉとしてモデル化する。

ここで、ε_{ｂ，ｋ，ｉ，ｔ}は、第ｔフレームにおける第ｉ空間層Ｌ_ｉにおいて第ｂ変換ブロックにおける第ｋ変換係数２２６を表す。Ｂ_ｉは、第ｉ空間層Ｌ_ｉにおけるブロック数を表す。Ｓ_Ｆは、分散を推定するために使用されるサンプルフレームの数を表す。いくつかの例では、σ_ｋ，ｉ ^２の値は、第ｉ空間層Ｌ_ｉにおける第ｋ変換係数２２６の分散の推定値であり、全てのそのようなブロックが同一の統計を有すると仮定された場合に、変換ブロックとは無関係である。しかしながら、実際には、変換ブロックの統計量は、フレームにわたって変化し得る。これは、フレームのエッジのブロックが中央のブロックよりも低いアクティビティを有しうる映像会議のコンテンツに対して特に当てはまることがある。したがって、これらの非同一の統計がレート割り当て結果の精度に悪影響を及ぼす場合、フレーム内で中央に配置されたブロックに基づく分散を推定することによって、負の影響を軽減することができる。いくつかの構成では、変換係数の分散が推定されるサブブロックは、映像画像内の全てのサブブロックのサブセットを表す（例えば映像画像の最も中央部分にあるサブブロック、または映像画像が以前の画像と比較して変更された場所にあるサブブロック）。

レート決定器３３０は、サンプラ３１０によって識別された映像入力信号１２０からのフレームのサンプルＳ_Ｆに基づき、空間レート係数３３２を決定するように構成される。いくつかの例では、空間レート係数３３２は、符号化ビットストリーム２０４の各空間層Ｌ_０〜Ｌ_ｉにおけるビットレートＢ_Ｒを決定するための係数を規定する。空間レート係数３３２は、空間層Ｌ_ｉ−１に割り当てられたビットレートと、空間層Ｌ_ｉに割り当てられたビットレートとの比である。空間層Ｌ_０および空間層Ｌ_１を有する２空間の例では、空間レート係数は０．５に等しく、空間層Ｌ_１に割り当てられたビットレートが５００ｋｂｐｓに等しく、空間層Ｌ_０に割り当てられたビットレートが２５０ｋｂｐｓ（すなわち、５００ｋｂｐｓの０．５倍）に等しい。これらの実施形態では、空間レート係数３３２の値は、ベース層Ｌ_０の割り当て係数Ａ_Ｆと平均レートＲ_Ｌとの差（例えば式（３９）の表現ｒ^＊ _０−Ｒ_Ｌ）に等しく設定される。ここで、割り当て係数Ａ_Ｆは、ベース層Ｌ_０の変換係数当たりのビットに対応し（ｒ^＊ｏとも呼ばれる）、平均レートＲ_Ｌは、複数の空間層Ｌ_０〜Ｌ_ｉの変換係数当たりのビットに対応する。いくつかの構成では、２つの空間層についての実験結果は、空間レート係数３３２が式ｓｒｆ=０．６５＋（ｒ^＊ _０−Ｒ_Ｌ）／２０に対応することを示している。空間レート係数３３２は、単一のパラメータとして、アロケータ３００が、符号化ビットストリーム２０４の各層Ｌに対するビットレートＢ_Ｒを容易にチューニングまたは修正することを可能にすることができる。

２つの空間層について説明されているが、アロケータ３００は、空間レート係数３３２および／または割り当て係数Ａ_Ｆを、任意の数の空間層Ｌ_０〜Ｌ_ｉに適用することができる。例えばアロケータ３００は、２つの空間層の各組について割り当て係数Ａ_Ｆおよび／または空間レート係数３３２を決定する。３つの層Ｌ_０〜Ｌ_２を用いて説明するために、アロケータ３００は、ベース層Ｌ_０および第１層Ｌ_１の割り当て係数Ａ_Ｆを決定し、それから第１層Ｌ_１および第２層Ｌ_２について割り当て係数Ａ_Ｆを決定する。各割り当て係数Ａ_Ｆを使用して、空間レート係数３３２と、ベース層Ｌ_０および第１層Ｌ_１に対する１つの空間レート係数３３２と、第１層Ｌ_１および第２層Ｌ_２に対する第２空間レート係数３３２とを決定することができる。２つの空間層の各セットの空間速度係数３３２を用いて、アロケータ３００は、空間レート係数３３２および／または割り当て係数ＡＦを平均（例えば加重平均、算術平均、幾何学的平均など）して、任意の数の空間層Ｌ_０〜Ｌ_ｉの平均空間レート係数および／または平均割り当て係数を生成することができる。

いくつかの例では、アロケータ３００が空間レート係数３３２に基づきビットレートＢ_Ｒを決定するのを助けるために、空間レート係数３３２は、空間レート係数閾値３３４を満たさなければならない（例えば、値の範囲内にある）。いくつかの実装形態では、値が約１．０未満および約０．５より大きい範囲内にあるとき、値は空間レート係数閾値３３４を満たす。他の実装形態では、空間レート係数閾値３３４は、値のより狭い範囲（例えば、０．５５〜０．９５、０．６５〜０．８５、０．５１〜０．９９、０．６５〜１．０、０．７５〜１．０など）に対応するか、または値のより広い範囲（例えば、０．４０〜１．２０、０．３５〜０．９５、０．４９〜１．０５、０．４２〜１．１７、０．７５〜１．３８など）に対応する。いくつかの構成では、空間レート係数３３２が空間レート係数閾値３３４に対応する値の範囲外である場合、アロケータ３００は、空間レート係数閾値３３４を満たすように空間レート係数３３２を調整する。例えば空間レート係数閾値３３４が０．４５〜０．９５の範囲である場合、この範囲外の空間レート係数３３２は、範囲の最も近い最大値に調整される（例えば０．３の空間レート係数３３２は、０．４５の空間レート係数３３２に調整され、１．８２の空間レート係数３３２は、０．９５の空間レート係数３３２に調整される）。

決定された空間レート係数３３２に基づき、アロケータ３００は、総ビットレートＢ_Ｒｔｏｔに対する制約にさらされる複数の空間層Ｌ_０〜Ｌ_ｉの歪みを低減することによって、映像品質を最適化するように構成される。歪みを低減するために、アロケータ３００は、フレームのサンプルＳ_Ｆに対して計算された空間レート係数３３２に基づいて、各空間層ＬへのビットレートＢ_Ｒに影響を与える（例えば、エンコーダ２００がビットレートＢ_Ｒを決定するのを助ける）。例えば符号化ビットストリーム２０４が２つの空間層Ｌ_０、Ｌ_ｉを含む場合、アロケータ３００は、割り当て係数Ａ_Ｆを決定し、割り当て係数Ａ_Ｆは、次に、空間レート係数３３２を決定し、式Ｂ_Ｒ１=Ｂ_Ｒｔｏｔ／（１＋ｓｒｆ）に対応する第１ビットレートＢ_Ｒ１と、式Ｂ_Ｒ０=（Ｂ_Ｒｔｏｔ＊ｓｒｆ）／（１＋ｓｒｆ）に対応する第２ビットレートＢ_Ｒ０とを生成するために使用される。ここでＢ_Ｒｔｏｔは、全体のビットストリーム（すなわち、全ての空間層Ｌ_０、Ｌ_１）を符号化するのに利用可能な総ビットレートに対応する。

図４は、レート割り当てシステム１００を実装する方法４００の一例である。動作４０２において、方法４００は、データ処理ハードウェア５１０において、映像入力信号１２０に対応する変換係数２２６（例えば非量子化された変換係数）を受信する。映像入力信号１２０は複数の空間層Ｌ_０〜Ｌ_ｉを含み、複数の空間層Ｌ_０〜Ｌ_ｉはベース層Ｌ_０を含む。動作４０４において、方法４００は、データ処理ハードウェア５１０によって、映像入力信号１２０からのフレームのサンプルＳ_Ｆに基づき、空間レート係数３３２を決定する。空間レート係数３３２は、符号化ビットストリーム２０４の各空間層Ｌにおけるレート割り当ての係数を定義し、空間レート係数３３２は、ベース層Ｌ_０の変換係数当たりのビットレートと、複数の空間層Ｌ_０〜Ｌ_ｉの変換係数当たりのビットの平均レートＲ_Ｌとの差によって表される。動作４０６において、方法４００は、データ処理ハードウェア５１０によって、空間レート係数３３２およびフレームのサンプルＳ_Ｆに基づき、各空間層ＬにビットレートＢ_Ｒを割り当てることによって、符号化ビットストリーム２０４の複数の空間層Ｌ_０〜Ｌ_ｉの歪みｄを低減する。

図５は、本文書に記載されているシステムおよび方法、例えば、エンコーダ２００および／またはアロケータ３００を実装するために使用され得る例示的な計算装置５００の概略図である。計算装置５００は、ラップトップ、デスクトップ、ワークステーション、携帯情報端末、サーバ、ブレードサーバ、メインフレーム、および他の適切なコンピュータなどの様々な形態のデジタルコンピュータを表すことが意図されている。ここに示された構成要素、それらの接続および関係、およびそれらの機能は、例示的なものに過ぎず、本明細書に記載および／または特許請求された本発明の実施を制限することを意図するものではない。

計算装置５００は、データ処理ハードウェア５１０と、メモリハードウェア５２０と、記憶装置５３０と、メモリ５２０および高速拡張ポート５５０に接続される高速インタフェース／コントローラ５４０と、低速バス５７０および記憶装置５３０に接続する低速インタフェース／コントローラ５６０とを含む。各構成要素５１０、５２０、５３０、５４０、５５０、および５６０は、様々なバスを使用して相互接続され、共通のマザーボード上に、または適宜他の方法で実装することができる。プロセッサ５１０は、メモリ５２０または記憶装置５３０に格納された命令を含む、計算装置５００内で実行するための命令を処理して、高速インタフェース５４０に結合されたディスプレイ５８０などの外部入出力装置上のグラフィカルユーザインタフェース（ＧＵＩ）のためのグラフィカル情報を表示することができる。他の実装形態では、複数のプロセッサおよび／または複数のバスを、複数のメモリおよびメモリのタイプと共に、適切に使用することができる。また、複数の計算装置５００は必要な動作の一部を提供する各装置（例えばサーババンク、ブレードサーバのグループ、またはマルチプロセッサシステム）に接続されてもよい。

メモリ５２０は、計算装置５００内に非一時的に情報を格納する。メモリ５２０は、コンピュータ可読媒体、揮発性メモリユニット（複数）、または不揮発性メモリユニット（複数）であってもよい。非一時的メモリ５２０は、計算装置によって使用されるための一時的または永続的なベースで、プログラム（例えば命令のシーケンス）またはデータ（例えばプログラム状態情報）を記憶するために使用される物理的装置であってもよい。不揮発性メモリの例には、フラッシュメモリおよび読み出し専用メモリ（ＲＯＭ）／プログラム可能読み出し専用メモリ（ＰＲＯＭ）／消去可能プログラマブル読み出し専用メモリ（ＰＲＯＭ）／電子的消去可能プログラマブル読み出し専用メモリ（ＥＥＰＲＯＭ）（例えばブートプログラムのようにファームウェアに典型的に使用される）が含まれるが、これらに限定されない。揮発性メモリの例は、ランダムアクセスメモリ（ＲＡＭ）、ダイナミックランダムアクセスメモリ（ＤＲＡＭ）、スタティックランダムアクセスメモリ（ＳＲＡＭ）、相変化メモリ（ＰＣＭ）、ならびにディスクまたはテープを含むが、これらに限定されない。

記憶装置５３０は、計算装置５００のための大容量記憶を提供することができる。一部の実施形態では、記憶装置５３０はコンピュータ可読媒体である。様々な異なる実施形態では、記憶装置５３０は、フロッピー（登録商標）ディスク装置、ハードディスク装置、光ディスク装置、またはテープ装置、フラッシュメモリまたは他の同様の固体メモリ装置であったり、または記憶領域ネットワークまたは他の構成の装置を含む装置のアレイであったりしてもよい。追加の実装形態では、コンピュータプログラム製品は、情報キャリアに実体的に具体化される。コンピュータプログラム製品は、実行されると上述のような１つ以上の方法を実行する命令を含む。情報キャリアは、メモリ５２０、記憶装置５３０、またはプロセッサ５１０上メモリなどのコンピュータ可読媒体である。

高速コントローラ５４０は、計算装置５００に対する帯域幅集中の動作を管理し、低速コントローラ５６０は、より低い帯域幅集中の動作を管理する。このような職務の割り当ては、例示的なものに過ぎない。いくつかの実施形態では、高速コントローラ５４０は、メモリ５２０に、（例えばグラフィックスプロセッサまたはアクセラレータを介して）ディスプレイ５８０に、および高速拡張ポート５５０に結合される。高速拡張ポート５５０は、様々な拡張カード（図示せず）を受け入れることができる。いくつかの実施形態では、低速コントローラ５６０は、記憶装置５３０および低速拡張ポート５９０に結合される。様々な通信ポート（例えばＵＳＢ、ブルートゥース（登録商標）、イーサネット（登録商標）、無線イーサネット（登録商標））を含むことができる低速拡張ポート５９０は、キーボード、ポインティングデバイス、スキャナなどの１つまたは複数の入出力装置に結合され得たり、スイッチまたはルータなどのネットワークデバイスに例えばネットワークアダプタを介して結合され得たりする。

計算装置５００は、図面に示すように、いくつかの異なる形態で実装することができる。例えば計算装置５００は、標準サーバ５００ａとしてまたは複数のサーバ５００ａからなるグループ内の複数回として、ラップトップコンピュータ５００ｂとして、またはラックサーバシステム５００ｃの一部として、実装されてもよい。

本明細書に記載されたシステムおよび技術の様々な実装は、デジタル電子および／または光回路、集積回路、特別に設計されたＡＳＩＣ（特定用途向け集積回路）、コンピュータハードウェア、ファームウェア、ソフトウェア、および／またはそれらの組合せで実現することができる。これらの様々な実装は、少なくとも１つのプログラマブルプロセッサを含むプログラマブルシステムで実行可能および／または解釈可能な１つまたは複数のコンピュータプログラム内の実装を含むことができる。少なくとも１つのプログラマブルプロセッサは、専用または一般の用途で、データおよび命令を受信したりデータおよび命令を送信したりするように、記憶システム、少なくとも１つの入力装置、および少なくとも１つの出力装置に結合される。

これらのコンピュータプログラム（プログラム、ソフトウェア、ソフトウェアアプリケーションまたはコードとしても知られている）は、プログラマブルプロセッサのための機械命令を含み、高レベル手続きおよび／またはオブジェクト指向のプログラミング言語でおよび／またはアセンブリ／機械言語で実施することができる。本明細書で使用されるように、用語「機械可読媒体」および「コンピュータ可読媒体」は、プログラマブルプロセッサに機械命令および／またはデータを提供するために使用される任意のコンピュータプログラム製品、非一時的なコンピュータ可読媒体、装置および／またはデバイス（例えば磁気ディスク、光ディスク、メモリ、プログラマブルロジックデバイス（ＰＬＤｓ））を指し、機械可読信号として機械命令を受信する機械可読媒体を含む。用語「機械可読信号」は、機械命令および／またはデータをプログラマブルプロセッサに提供するために使用される任意の信号を指す。

本明細書に記載されたプロセスおよび論理フローは、１つ以上のコンピュータプログラムを実行して、入力データ上で動作して出力を生成することによって機能を実行する１つまたは複数のプログラマブルプロセッサによって実行することができる。プロセスおよび論理フローはまた、専用ロジック回路、例えばＦＰＧＡ（フィールドプログラマブルゲートアレイ）またはＡＳＩＣ（特定用途向け集積回路）によって実行することもできる。コンピュータプログラムの実行に適したプロセッサは、例として、汎用マイクロプロセッサおよび専用マイクロプロセッサの両方、および任意の種類のデジタルコンピュータの任意の１つ以上のプロセッサを含む。一般に、プロセッサは、読み出し専用メモリまたはランダムアクセスメモリまたは両方から、命令およびデータを受け取る。コンピュータの本質的な要素は、命令を実行するためのプロセッサと、命令およびデータを格納するための１つまたは複数のメモリ装置とを含む。一般に、コンピュータはまた、データを記憶するための１つまたは複数の大容量記憶装置、例えば磁気、光磁気ディスク、または光ディスクからデータを受信するか、これら大容量記憶装置にデータを送信するか、または両方ができるように、これら大容量記憶装置を備えるかまたはこれら大容量記憶装置に動作可能に結合される。しかし、コンピュータはそのような装置を有する必要はない。コンピュータプログラム命令およびデータを格納するのに適したコンピュータ可読媒体は、例えばＥＰＲＯＭ、ＥＥＰＲＯＭ、およびフラッシュメモリ装置のような半導体メモリ装置、例えば内部ハードディスクまたは取り外し可能ディスクのような磁気ディスク、光磁気ディスク、ならびにＣＤ−ＲＯＭおよびＤＶＤ−ＲＯＭディスクを例として含む、全ての形態の不揮発性メモリ、媒体、およびメモリ装置を含む。プロセッサおよびメモリは、専用ロジック回路によって補うことができ、または専用ロジック回路に組み込むことができる。

ユーザとの対話を提供するために、本開示の１つ以上の態様は、ユーザに情報を表示するための例えばＣＲＴ（ブラウン管）、ＬＣＤ（液晶ディスプレイ）モニタ、またはタッチスクリーンなどのディスプレイ装置を有するコンピュータ上で実施することができ、コンピュータは付加的に、ユーザがコンピュータに入力を提供することができるキーボードおよびポインティング装置、例えばマウスまたはトラックボールを備えることができる。他の種類の装置を使用して、ユーザとの対話を提供することができ、例えばユーザに提供されるフィードバックは、視覚フィードバック、聴覚フィードバック、または触覚フィードバックのような感覚フィードバックの任意の形態とすることができ、ユーザからの入力は、音響、音声、または触覚入力を含む任意の形態で受信することができる。さらにコンピュータは、例えばユーザのクライアント装置上のウェブブラウザから受信された要求に応答して、ユーザのクライアント装置上のウェブブラウザにウェブページを送信することによって、ユーザによって使用される装置にドキュメントを送信し、該装置からドキュメントを受信することによって、ユーザと対話することができる。

いくつかの実装が記載されている。それにもかかわらず、本開示の趣旨および範囲から逸脱することなく、様々な変更がなされ得ることが理解されるであろう。したがって、他の実施形態は、以下の請求項の範囲内である。

Claims

データ処理ハードウェア（５１０）において、スケーリングされた映像入力信号（１２０）に対応する変換係数（２２６）を受信する工程であって、スケーリングされた前記映像入力信号（１２０）は複数の空間層（Ｌ）を含み、前記複数の空間層（Ｌ）はベース層（Ｌ_０）を含む、前記変換係数（２２６）を受信する工程と、
前記データ処理ハードウェア（５１０）によって、スケーリングされた前記映像入力信号（１２０）からのフレームのサンプラによって識別されたサンプル（Ｓ_Ｆ）に基づき空間レート係数（３３２）を決定する工程（３３２）であって、前記各空間層について前記サンプルの数は前記変換係数の数に等しく、前記空間レート係数（３３２）は、スケーリングされた前記映像入力信号（１２０）から形成された符号化ビットストリーム（２０４）の各空間層（Ｌ）におけるビットレートを決定するための係数を規定し、前記空間レート係数（３３２）は、前記ベース層（Ｌ_０）の前記変換係数（２２６）毎のビットレートと、前記複数の空間層（Ｌ）の前記変換係数（２２６）毎のビットの平均レート（Ｒ_Ｌ）との差によって表される、前記空間レート係数（３３２）を決定する工程と、
前記データ処理ハードウェア（５１０）によって、前記空間レート係数（３３２）とフレームの前記サンプル（Ｓ_Ｆ）とに基づき、各空間層（Ｌ）に前記ビットレートを割り当てることによって、前記符号化ビットストリーム（２０４）の前記複数の空間層（Ｌ）に対する歪みを低減する工程と
を備える、方法（４００）。
前記方法はさらに、
前記データ処理ハードウェア（５１０）において、スケーリングされた前記映像入力信号（１２０）からフレームの前記サンプラによって反復的に識別された第２サンプル（Ｓ_Ｆ）を受信する工程と、
前記データ処理ハードウェア（５１０）によって、スケーリングされた前記映像入力信号（１２０）からのフレームの前記第２サンプル（Ｓ_Ｆ）に基づき、前記空間レート係数（３３２）を修正する工程と、
前記データ処理ハードウェア（５１０）によって、修正された前記空間レート係数（３３２）とフレームの前記第２サンプル（Ｓ_Ｆ）とに基づき、各空間層（Ｌ）に修正された前記ビットレートを割り当てる工程と
を備える、請求項１に記載の方法（４００）。
前記方法はさらに、
前記データ処理ハードウェア（５１０）において、スケーリングされた前記映像入力信号（１２０）からフレームの前記サンプラによって反復的に識別された第２サンプル（Ｓ_Ｆ）を受信する工程と、
前記データ処理ハードウェア（５１０）によって、指数移動平均に基づきフレーム毎に前記空間レート係数（３３２）を修正する工程であって、前記指数移動平均は少なくともフレームの前記サンプル（Ｓ_Ｆ）とフレームの前記第２サンプル（Ｓ_Ｆ）とに対応する、前記空間レート係数（３３２）を修正する工程と、
前記データ処理ハードウェア（５１０）によって、修正された前記ビットレートを、修正された前記空間レート係数（３３２）に基づき各空間層（Ｌ）に割り当てる工程と
を備える、請求項１または２に記載の方法（４００）。
スケーリングされた前記映像入力信号（１２０）を受信する工程は、
前記映像入力信号（１２０）を受信する工程と、
前記映像入力信号（１２０）を前記複数の空間層（Ｌ）にスケーリングする工程と、
各空間層（Ｌ）をサブブロックに分割する工程と、
各サブブロックを前記変換係数（２２６）に変換する工程（２２６）と、
各サブブロックに対応する前記変換係数（２２６）をスカラー量子化する工程と
を備える、請求項１〜３のいずれか一項に記載の方法（４００）。
スケーリングされた前記映像入力信号（１２０）からフレームの前記サンプル（Ｓ_Ｆ）に基づき前記空間レート係数（３３２）を決定する工程は、
前記映像入力信号（１２０）のフレームの全ての変換ブロックにわたる平均に基づき、各スカラー量子化（２１０）された前記変換係数（２２６）の分散推定（３２２）を決定する工程を備える、
請求項４に記載の方法（４００）。
各サブブロックの前記変換係数（２２６）は、全てのサブブロックにわたって同一に分布される、
請求項４または５に記載の方法（４００）。
前記空間レート係数（３３２）は、前記符号化ビットストリーム（２０４）の各層（Ｌ）に前記ビットレートを割り当てるように構成された単一のパラメータを含む、
請求項１〜６のいずれか一項に記載の方法（４００）。
前記方法はさらに、前記データ処理ハードウェア（５１０）によって、前記空間レート係数（３３２）が空間レート係数閾値（３３４）を満たすか決定する工程を含む、
請求項１〜７のいずれか一項に記載の方法（４００）。
前記空間レート係数閾値（３３４）に対応する値が１．０未満で０．５よりも大きい場合に、前記空間レート係数閾値（３３４）に対応する値は前記空間レート係数閾値（３３４）を満たす、
請求項８に記載の方法（４００）。
前記空間レート係数（３３２）は、加重和を含み、
前記加重和は、分散の積の比に対応し、
前記比は、第１空間層（Ｌ）からのスカラー量子化（２１０）された前記変換係数（２２６）の推定分散に基づく分子と、第２空間層（Ｌ）からのスカラー量子化（２１０）された前記変換係数（２２６）の推定分散に基づく分母とを備える、
請求項１〜９のいずれか一項に記載の方法（４００）。
データ処理ハードウェア（５１０）と、
前記データ処理ハードウェア（５１０）に通信するメモリハードウェア（５２０）と
を備えるシステム（１００）であって、
前記メモリハードウェア（５２０）は命令を記憶し、前記命令は前記データ処理ハードウェア（５１０）上で実行されると前記データ処理ハードウェア（５１０）に、
スケーリングされた映像入力信号（１２０）に対応する変換係数（２２６）を受信する工程であって、スケーリングされた前記映像入力信号（１２０）は複数の空間層（Ｌ）を含み、前記複数の空間層（Ｌ）はベース層（Ｌ_０）を含む、前記変換係数（２２６）を受信する工程と、
スケーリングされた前記映像入力信号（１２０）からフレームのサンプラによって識別されたサンプル（Ｓ_Ｆ）に基づき空間レート係数（３３２）を決定する工程であって、前記各空間層について前記サンプルの数は前記変換係数の数に等しく、前記空間レート係数（３３２）は、スケーリングされた前記映像入力信号（１２０）から形成された符号化ビットストリーム（２０４）の各空間層（Ｌ）におけるビットレートを決定するための係数を規定し、前記空間レート係数（３３２）は、前記ベース層（Ｌ_０）の前記変換係数（２２６）毎のビットレートと、複数の空間層（Ｌ）の前記変換係数（２２６）毎のビットの平均レート（Ｒ_Ｌ）との差によって表される、前記空間レート係数（３３２）を決定する工程と、
前記空間レート係数（３３２）とフレームの前記サンプル（Ｓ_Ｆ）とに基づき、各空間層（Ｌ）に前記ビットレートを割り当てることによって、前記符号化ビットストリーム（２０４）の前記複数の空間層（Ｌ）の歪みを低減する工程と
を備える動作を実行させる、システム（１００）。
前記動作はさらに、
スケーリングされた前記映像入力信号（１２０）からフレームの前記サンプラによって反復的に識別された第２サンプル（Ｓ_Ｆ）を受信する工程と、
スケーリングされた前記映像入力信号（１２０）からフレームの前記第２サンプル（Ｓ_Ｆ）に基づき、前記空間レート係数（３３２）を修正する工程と、
修正された前記空間レート係数（３３２）とフレームの前記第２サンプル（Ｓ_Ｆ）とに基づき、修正された前記ビットレートを各空間層（Ｌ）に割り当てる工程と
を備える、請求項１１に記載のシステム（１００）。
前記動作はさらに、
スケーリングされた前記映像入力信号（１２０）から、フレームの前記サンプラによって反復的に識別された第２サンプル（Ｓ_Ｆ）を受信する工程と、
指数移動平均に基づき前記空間レート係数（３３２）を修正する工程であって、前記指数移動平均は少なくともフレームの前記サンプル（Ｓ_Ｆ）とフレームの前記第２サンプル（Ｓ_Ｆ）とに基づく、前記空間レート係数（３３２）を修正する工程と、
修正された前記空間レート係数（３３２）に基づき、修正された前記ビットレートを各空間層（Ｌ）に割り当てる工程と
を備える、請求項１１または１２に記載のシステム（１００）。
スケーリングされた前記映像入力信号（１２０）を受信する工程はさらに、
前記映像入力信号（１２０）を受信する工程と、
前記映像入力信号（１２０）を前記複数の空間層（Ｌ）にスケーリングする工程と、
各空間層（Ｌ）をサブブロックに分割する工程と、
各サブブロックを前記変換係数（２２６）に変換する工程と、
各サブブロックに対応する前記変換係数（２２６）をスカラー量子化する工程と
を備える、請求項１１〜１３のいずれか一項に記載のシステム（１００）。
スケーリングされた前記映像入力信号（１２０）からのフレームのサンプル（Ｓ_Ｆ）に基づき空間レート係数（３３２）を決定する工程は、
前記映像入力信号（１２０）のフレームの全ての変換ブロックにわたる平均に基づき、各スカラー量子化された前記変換係数（２２６）の分散推定（３２２）を決定する工程を含む、
請求項１４に記載のシステム（１００）。
各サブブロックの変換係数（２２６）は、全てのサブブロックにわたって同一に分布される、
請求項１４または１５のシステム（１００）。
前記空間レート係数（３３２）は、前記符号化ビットストリーム（２０４）の各層（Ｌ）に前記ビットレートを割り当てるように構成された、単一のパラメータを含む、
請求項１１〜１６のいずれか一項に記載のシステム（１００）。
前記動作はさらに、前記空間レート係数（３３２）が空間レート係数閾値（３３４）を満たすことを決定する工程を含む、
請求項１１〜１７のいずれか一項に記載のシステム（１００）。
前記空間レート係数閾値（３３４）に対応する値が１．０未満で０．５よりも大きい場合に、前記空間レート係数閾値（３３４）に対応する値は前記空間レート係数閾値（３３４）を満たす、
請求項１８に記載のシステム（１００）。
前記空間レート係数（３３２）は加重和を含み、
前記加重和は分散の積の比に対応し、
前記比は、第１空間層（Ｌ）からのスカラー量子化された前記変換係数（２２６）の推定分散に基づく分子と、第２空間層（Ｌ）からのスカラー量子化された前記変換係数（２２６）の推定分散に基づく分母とを備える、
請求項１１〜１９のいずれか一項に記載のシステム（１００）。
データ処理ハードウェア（５１０）において、スケーリングされた映像入力信号（１２０）に対応する非量子化変換係数（２２６）を受信する工程であって、スケーリングされた前記映像入力信号（１２０）は複数の空間層（Ｌ）を含む、前記非量子化変換係数（２２６）を受信する工程と、
前記データ処理ハードウェア（５１０）によって、スケーリングされた前記映像入力信号（１２０）からのフレームのサンプラによって識別されたサンプル（Ｓ_Ｆ）に基づき割り当て係数を決定する工程であって、前記各空間層について前記サンプルの数は前記非量子化変換係数の数に等しく、前記割り当て係数は受信された前記非量子化変換係数（２２６）の分散の推定に対応する、前記割り当て係数を決定する工程と、
前記データ処理ハードウェア（５１０）によって、前記割り当て係数とフレームの前記サンプル（Ｓ_Ｆ）とに基づき、各空間層（Ｌ）にビットレートを割り当てる工程と
を備える、方法（４００）。