JP2004511976A - ディジタルビデオ記録のためのビデオビットレート制御方法及び装置 - Google Patents

ディジタルビデオ記録のためのビデオビットレート制御方法及び装置 Download PDF

Info

Publication number
JP2004511976A
JP2004511976A JP2002535397A JP2002535397A JP2004511976A JP 2004511976 A JP2004511976 A JP 2004511976A JP 2002535397 A JP2002535397 A JP 2002535397A JP 2002535397 A JP2002535397 A JP 2002535397A JP 2004511976 A JP2004511976 A JP 2004511976A
Authority
JP
Japan
Prior art keywords
frame
frames
video
complexity
encoded
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2002535397A
Other languages
English (en)
Inventor
モレル,アントニー
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Original Assignee
Koninklijke Philips Electronics NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Koninklijke Philips Electronics NV filed Critical Koninklijke Philips Electronics NV
Publication of JP2004511976A publication Critical patent/JP2004511976A/ja
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/177Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a group of pictures [GOP]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/115Selection of the code volume for a coding unit prior to coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/14Coding unit complexity, e.g. amount of activity or edge presence estimation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/149Data rate or code amount at the encoder output by estimating the code amount by means of a model, e.g. mathematical model or statistical model
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/152Data rate or code amount at the encoder output by measuring the fullness of the transmission buffer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Algebra (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Television Signal Processing For Recording (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)

Abstract

本発明は、ビデオ符号化システムのビデオビットレート制御方法に関連し、前記符号化システムは、蓄積装置内に蓄積され且つ入力フレームのシーケンスから由来する符号化されたビデオフレームを発生し、前記方法は、前記入力フレームに、評価ステップから発行された、量子化ファクターを適用するための、少なくとも量子化ステップを有する。この評価ステップは、符号化される現在のフレームの複雑さ評価するために、前に符号化されたフレームに関連する統計を使用する。並列に、符号化されているフレームに対する現在のビット目標は、蓄積装置内に有効な残りの空間とシーケンス内の符号化されるフレームの残りの数に関して推定される。そして、量子化ファクタは、推定された複雑さと推定された現在のビット目標に基づいて得られる。この発明は、符号化されたフレームに対する出力ビットレートが、CBR又はVBR動作を有する結果となり、符号化されたビデオフレームの一定の品質を導き、そして、蓄積媒体の最適な充填を保証する。

Description

【0001】
本発明は、ビデオ符号化システムのビデオビットレート制御方法に関連し、前記符号化システムは、蓄積装置内に蓄積され且つ入力フレームのシーケンスから由来する符号化されたビデオフレームを発生し、前記方法は、前記入力フレームに量子化ファクターを適用するための、少なくとも量子化ステップを有する。
【0002】
本発明は、MPEG−2ビデオ符号化器又は変換符号化器のような、ビデオ符号化システム内で使用され得る。
【0003】
ISO/IEC13818−2と呼ばれる、MPPEG−2ビデオ圧縮規格(動画専門家グループ)は、放送応用に使用されるだけでなく、記録応用にも使用される。この規格は、ディジタルビデオディスク(DVD)に蓄積される圧縮されたビデオシーケンスを発生するのに使用される。このために、多くの技術が考えられている。1つは、入力フレームの符号化よりなり、MPEG−2符号化されたフレームを含む結果の出力信号は一定ビットレート(CBR)である。他の1つは、入力フレームの符号化よりなり、結果の出力信号は可変ビットレート(VBR)である。第1のアプローチは、空間の制限された蓄積装置上に符号化されたビデオフレームを蓄積することが保証されるので、非常に便利であるが、入力フレームはそれらの複雑さに依存して同じ量のビットを必要としないので、変動し得るビデオの品質には有害である。この第2のアプローチは、割当てられるビットの量が、フレームの複雑さと共に増加するので、全体的に符号化されたフレームの非常に一定の品質を保証する。しかし、この処理の制御は、固定されない、発生されたビットの量の予測を許さず、そして、この結果、空間の制限された蓄積装置上に前記符号化されたフレームを蓄積することは、保証されず、そして、大きなビットのオーバーフローとアンダーフローを導き得る。
【0004】
国際特許出願番号WO99/49664は、符号化されたビデオフレームのビットレートを一定の全体値に調整するがしかし局部的に可変の出力ビットレートとなる方法を開示する。このために、目標ビットレートが、目標符号化品質を決定することを考慮して、符号化されるべきフレームの連続する組みに対して決定される。目標ビットレートは、前と実際の目標ビットレートの間の差から得られる。実際の目標は、シーンの複雑さと、フレームの各組みの目標符号化品質に従って、可変にされる。
【0005】
本発明の目的は、一定の品質で、空間の制限された蓄積装置上に、圧縮されたフレームのシーケンスの蓄積を許す、改善されたビデオビットレート制御方法を提案することである。
【0006】
従来技術で提案された方法は、空間の制限された蓄積装置上で、ビデオフレームのシーケンスの符号化に使用されるときには、機能的な制限を有する。
【0007】
最初に、出力VBRが大きな振幅で上下する場合には、シーケンスの符号化の最後で問題が発生しうる。この場合には、符号化される残りのフレームに対するビットレート割当ては、危険になり、蓄積装置容量のオーバーフロー又はアンダーフローをおそらく導く。この結果、フレーム蓄積の最適な収束は、常には保証されず、例えば、入力シーケンス内に含まれる全てのフレームは、蓄積されることができない。
【0008】
第2に、この方法により要求される符号化されたフレームの一定の品質は、常には保証されない。確かに、目標符号化品質は、現在のビットレート目標と前のフレームの組みに関するビットレート目標の間の差に基づいて修正される。所定のビットレート目標で、フレームの複雑さが低いか又は高いかに依存して、同じ品質が得られないので、目標符号化の変化は、変動し、局部的な一時的な視覚品質の変動を導く。
【0009】
本発明に従った方法は、従来技術の方法の制限の解決を提供することを目的とする。この目的のために、本発明に従った方法は、量子化ファクターの評価が、−量子化ファクターQ(n−1)とフレームサイズS(n−1)から、前記の前に符号化されたフレームの複雑さX(n−1)を計算する、計算サブステップと、
−少なくとも複雑さX(n−1)から、現在の入力フレームの複雑さXe(n)を推定するための、第1の推定サブステップと、
−蓄積装置上のまだ有効なビットの数と入力シーケンス内の符号化するべきフレームの残りの数から、符号化後の現在の入力フレームのフレームサイズR(n)を推定するための第2の推定サブステップと、
−現在の入力フレームの複雑さXe(n)と推定されたフレーサイズR(n)から、現在の入力フレームに適用される量子化ファクターを推定する、第3の推定サブステップとを有する。
【0010】
この方法は、システムが、符号化されたフレームのシーケンスに対し、一定の品質を得ることを許す。符号化される現在のフレームの複雑さを評価するために、前の符号化されたフレームの統計を考慮する。この評価は、推定された複雑さは符号化されたフレームに沿って平滑化されるので、時定数を含む機構により実行されることを特徴とする。並行して、符号化されているフレームに対する現在のビット目標は、蓄積装置上で利用できる残りの空間と符号化されるフレームの残りの数に関連して、推定される。そして、推定された複雑さと推定された現在のビット目標に基づいて、量子化器ステップが得られ、そして、符号化されているフレームを定義する離散コサイン変換(DCT)係数を定量化するのに使用される。この結果、量子化器ステップは、フレーム間の相対的な変動を平滑化し、この結果、VBR動作を有する符号化されたフレームに関する出力ビットレートとなり、そして、符号化されたビデオフレームの一定の又はゆっくり変化する品質を導く。
【0011】
この方法は、時定数は、蓄積装置上に符号化されたビデオフレームの数と、シーケンス内で符号化されるべきビデオフレームの残りの数の関数であることを特徴とする。
【0012】
これは、主にシーケンス符号化の最初と最後で、符号化されたフレームに関する出力ビットレートの制御された変動を可能とする。このように、ビットレートは、符号化パラメータの設定を考慮してCBRからVBR動作へ、そして、蓄積装置上に入力シーケンスの全てのフレームの蓄積を保証するためにVBRからCBRへ、変化するために制御される。シーケンス内の現在のフレームのランクに関する時定数値の変化に基づいて、そのような一時的な状態は、品質と空間に関する、蓄積装置の最適な充填を保証する、制約されたVBR動作変化に対応する。もちろん、この方法は、符号化処理中に、VBR動作を得ることを許す。
【0013】
本発明の特定の特徴は、以下の説明する実施例と、添付の図面を参照して説明する。図において、同一の部分又はサブステップは同様な方法で指定されている。
【0014】
本発明は、空間の制限された蓄積装置上に、一定品質で、フレームの圧縮されたシーケンスを蓄積することを許す、改良されたビデオビットレート制御方法に関連する。
【0015】
本発明は、レート制御ストラテジーが、結果の符号化されたフレームの出力品質を調整するために必要とされ且つ使用される、ビデオ符号化システムで使用され得る。例えば、本発明は、理想的には、ビデオ符号化システム又はビデオ変換符号化システムの量子化ステップを管理するために使用されうる。MPEG−2ビデオ変換符号化システムの場合を説明するが、しかし、本発明の範囲はこの特定の場合に制限されないが、しかし、MPEG−4又は、H.263のようなブロックに基づくビデオ符号化規格をカバーしうることは、当業者には、明らかである。
【0016】
図1は、MPEG−2ビデオ圧縮信号変換符号化の状況で、本発明に従った方法を示す。変換符号化は、低ビットレートを有する出力信号を得るために、入力信号のビットレート低減を実行し、前記出力信号は、空間の制限された蓄積装置上に蓄積される。この図は、本発明に従った、変換符号化ステップ101、蓄積ステップ102、及び、ビットレート制御ステップ103を構成する3つの組の処理ステップを有する。
【0017】
変換符号化ステップ101に関する組みは、
−複数の圧縮されたデータフレームを含む入力の圧縮されたビデオ信号105を受信し且つ、復号されたデータ信号106を供給する残余復号ブランチ104。このブランチは、直列に、復号されたDCT係数を供給する可変長復号107(VLD)、逆量子化されたDCT係数を供給する逆量子化108(IQ)及び、復号された信号106を供給する逆離散コサイン変換109(IDCT)を含む。
−信号114を構成するために、信号106から減算される動き補償された信号111を発生する、動き補償ブランチ110。動き補償112は、変換符号化されている現在のフレームに関連し且つ入力信号105内に含まれている、動きベクトルV(n)を使用して達成される。この動き補償は、前に処理されたフレームの符号化誤差に対応する、メモリ113内に蓄積されたフレーム信号に適用される。この符号化誤差は、出力の量子化された信号122に与えられる、逆量子化115と逆DCT116後に得られた信号から信号114を減算した後に得られる。ブランチ110は、出力の変換符号化信号117の品質ドリフトを避ける。
−信号114から、出力の変換符号化され且つ圧縮された出力のビデオ信号117をえるための、符号化ブランチ118。これは、DCT係数により構成された周波数信号120を供給するDCT119、量子化されたDCT係数で構成された信号122を供給する量子化121(QUANT)、及び、信号117として送られ且つ蓄積装置102に蓄積される前に、バッファ124に蓄積される、可変長符号化されたDCT係数を発生するための可変長符号化123(VLC)を有する。
【0018】
ビットレート制御ステップに関する組み103は、信号117の一定の品質と、蓄積装置102の最適な充填を保証するために、信号117の出力ビットレートを制御するために、組み101と102に接続されている。このために、組み103は、現在のフレームが変換符号化されるときに、ステップ121で使用される量子化ファクターの最も適する値を決定するために、前に変換されたフレームの統計を符号化及び蓄積することを使用する。このビットレート制御は、量子化ファクター値の評価は、圧縮されたフレームの、フレームの複雑さとフレームサイズの間の比から得られる、という原理にもとづいている。
【0019】
従って、第1のステップ125では、前に変換符号化されたフレームに関連する平均量子化ファクター値Q(n−1)が、前記の前に変換符号化されたフレームのフレームサイズS(n−1)と乗算され、前に変換符号化されたフレームに関連する複雑さX(n−1)となる。このフレームサイズS(n−1)はビットで表されそして、前に変換符号化されたフレームがバッファ124内に一時的に蓄積される時に計算される。
【0020】
第2のステップ126では、変換符号化される現在のフレームの複雑さXe(n)は、計算された前に変換符号化されたフレームの複雑さX(n−1)から推定される。例えば、前に変換符号化されたフレームに関するフレームの複雑さの重み付けされた平均を使用して、以下のパラグラフで更に説明する、多くの技術が、Xe(n)を評価するのに使用され得る。現在のフレームの複雑さの推定と並行して、現在のフレームサイズR(n)が、ステップ102の統計を蓄積することから推定される。フレームサイズR(n)は、ビットで表され、以下のように計算される。
【0021】
【数2】
Figure 2004511976
ここで、変数
【0022】
【外2】
Figure 2004511976
は、蓄積装置上に充填されずに残っているビット空間の数に対応し、
変数
【0023】
【外3】
Figure 2004511976
は、シーケンス内で変換符号化されそして、蓄積装置上に記録されるのに、残っているフレームの数に対応し、
【0024】
【外4】
Figure 2004511976
は、
【0025】
【数3】
Figure 2004511976
を確認するフレームの数に対応する。
【0026】
この推定は、システムが、蓄積装置の蓄積占有率とまだ変換符号化されていない入力シーケンス内のフレームの数を考慮することにより、現在のフレームの変換符号化のための、平均フレームサイズを目標とすることを許す。これは、入力シーケンスの全てのフレームの最適な蓄積を補償するための、重要な特徴である。変数
【0027】
【外5】
Figure 2004511976
は、正のゼロでない値に設定されており、そして、蓄積容量のオーバーフローよりも小さなアンダーフローを選ぶことを許す場合には、これは、むしろ異なる複雑さを有する連続するフレームを扱うときに好ましい。
【0028】
第3のステップ127では、推定された複雑さXe(n)と推定されたフレームザイズR(n)の間の比は、推定された量子化ファクターQe(n)を得るために、計算される。このステップ121は、変換符号化されている現在の入力フレームにより、信号120内に含まれる各DCT係数を、Qe(n)により除算することよりなり、前記除算の結果は、信号122を構成する量子化されたDCT係数を定義するために、最も近い整数に丸められる。しかしながら、DCT係数を量子化するために使用される量子化ファクターは、推定された値Qe(n)から僅かに異なる可能性がある。これは、以下のシナリオの場合である。
−Qe(n)は、MPEG−2量子化スケールの粒状性により許される最も近い値に丸められ、
−局部的なフレームの複雑さに適応される量子化係数を局部的に変更することよりなる、適応量子化が実行され、
−推定されたQe(n)は、例えば、Bフレームに対してはファクター1.4によりQe(n)を乗算しそして、PフレームとIフレームに対してはファクター1.0によりQe(n)を乗算しするような、変換符号化されているフレームの形式に従って変更され、
−Qe(n)が、入力フレームが量子化された量子化ファクタの値を超える場合には、前記値に設定される。
【0029】
図2は、本発明に従ったレート制御ストラテジーセット103を示す。このレート制御は、統計Q(n−1)、S(n−1)及び、R(n)に関して変換符号化される現在のフレーム番号nに対して量子化ファクタQe(n)の推定値を送ることを目的とする。このために、前に説明した図1のように、現在のフレームに関連する複雑さXe(n)の推定126が、前に変換符号化されたフレームに関連する複雑さX(n−1)に基づいて実行される。この推定126は、推定の反応速度を調整することを許す入力として、調整可能な忘却ファクターT(n)を使用する。この推定は、以下の式に従ってなされる。
【0030】
【数4】
Figure 2004511976
Eq.2は、変換符号化された前のフレームに関する、複雑さX(n−1)と複雑さXe(n−1)を包含する、1次再帰フィルタの式に対応する。この推定は、単位ステップ信号Xの振幅の66%に等しいXeの振幅を得るために必要な、フレーム又はサンプルの数で表現される、継続時間として定義される時定数により特徴化される。eq.2の場合には、τで示された時定数は、
τ=1/(2.T)       (eq.3)
により与えられる。時定数は、直接的に、忘却ファクタTに依存しており、このファクタは一定値を有するか又は、シーケンス内で変換符号化されているフレームのランクと共に変化する。τが、τ>>1に設定されている場合には、複雑さXe(n)は、1つの推定値から次に大きく変わらない。言い替えると、複雑さXe(n)は、複雑さXe(n−1)に近い。このように、推定された量子化ファクタQe(n)は、量子化ファクタQe(n−1)に近く、これは、ランクnとn−1を有するフレームに対して、一定品質が得られることを意味する。この結果、一定の量子化ファクタで行われた量子化121からの結果の信号117のビットレートは、VBR動作を有する。τがフレームの小さな数に設定されている場合には、Xeは、大きく比例して変化し、連続する量子化ファクタは大きな差を有する結果となり、これは、信号117の出力ビットレートのCBR動作を導く。
【0031】
本発明の他の特徴は、複雑さ推定ステップ126で使用される時定数τの変化機構を定義することよりなる。この変化機構は、オーバーフロー又はアンダーフローなしに、蓄積装置上で利用できる全ての空間が使用されることを保証するために、シーケンス変換符号化の最初と最後で、信号117の制御されたCBR動作を得ることを許す。この変化機構は、変換符号化されるフレームの比較的一定な品質を得るために、時定数τを増加して、CBRからVBR動作への切り換えも許す。時定数τは、以下のように定義される変化範囲に制限される。
【0032】
最初に、蓄積容量が変換符号化の最後で満足することを保証するために、τは、
【0033】
【数5】
Figure 2004511976
に従わなければならない。
【0034】
更に、τは、グループオブピクチャー(GOP)又は、フレームのグループに含まれているフレームの数
【0035】
【外6】
Figure 2004511976
よりも大きくなければならない。
【0036】
【数6】
Figure 2004511976
これは、少なくとも
【0037】
【外7】
Figure 2004511976
フレームより上で変換符号化される入力フレームの推定された複雑さを平滑化することを許し、そして、前記入力フレームに対する個々のビット割り当て特性を考慮しないことを許す。
【0038】
推定された複雑さXe(n)は、前に変換符号化されたフレームに関連する複雑さから得られるけれども、古すぎる複雑さから得られる必要はない。このために、τは、
【0039】
【数7】
Figure 2004511976
に従わなければならない。このように、現在の複雑さXe(n)の推定は主に、
【0040】
【外8】
Figure 2004511976
前に変換符号化されたフレームに関連する複雑さに依存し、これは、移動する方法で、シーケンスの現在のシーンに対して、複雑さ推定のゆっくりした適応を許す。
【0041】
量子化ファクタQe(n)の推定は、周期的に行われる。例えば、同時にR(N),Q(n−1),S(n−1)及び、Xe(n)の更新も包含し、フレーム周期周波数で実行されても良い。代わりの構成では、入力ビデオ信号が、例えば、各GOPがINTRAフレームにより識別されるような、GOP構造を有する場合には、Qe(n)は、GOP周波数で更新され、それにより、推定された値Qe(n)は大きく平滑化されそして、処理負荷が減少される。そうでない場合には、GOP構造が入力ビデオ信号内で識別できない場合には、R(n)、Q(n−1)、S(n−1)及び、Xe(n)の更新は、放送の状況で推奨されるGOPの継続時間に対応する、毎回最大で0.5秒の任意の周期で実行される。
【0042】
図3は、複雑さXe(n)を推定するのに使用される、サブ図3aで記載された時定数変化の例を示し、そして、信号120に関するDCT係数を量子化するために使用される量子化ファクタQのサブ図3bに記載された結果の変化及び、図1に記載されたような変換符号化の状況で、信号117の結果の出力ビットレートのサブ図3cで記載される変化を示す。各図の水平軸は、合計でNフレームを含むシーケンス内のフレームのランクに対応する。5つの特徴的な範囲が、フレームランクnに依存して、考えられる。

【0043】
【外9】
Figure 2004511976
:この範囲は、変換符号化の開始に対応する。時定数τは、信号117のCBR動作を得るために、一定の小さい値に設定される。それは、
【0044】
【外10】
Figure 2004511976
を確認することが成り立つ。この範囲は、複雑さXe(n)が得られる前の複雑さの組みX(n−1)のような符号化パラメータを設定することを許す。典型的には、
【0045】
【外11】
Figure 2004511976
は、この範囲の継続時間が約1分のように設定される。量子化ファクタQ(n)は、大きく上下し、CBRが間接的に課される場合には、フレームの複雑さ変化を補償するために、強い又は小さな量子化が必要である、という事実を反映する。

【0046】
【外12】
Figure 2004511976
:この範囲は、τが、τ(n)=nを満たす、一時的な状態である。時定数は、フレームランクと共に増加され、それにより、信号117の出力ビットレートは、CBRからVBR動作にゆっくりと変化する。言い替えると、この状態は、制約されたVBR制御調整に対応する。図3bから分かるように、量子化ファクタQ(n)は、減少する振幅の変動を有し、これは、変換符号化されたフレームの更に一定の品質となる。典型的には、
【0047】
【外13】
Figure 2004511976
は、時点0からの継続時間は数分であるように設定される。

【0048】
【外14】
Figure 2004511976
:この範囲は、時定数に
【0049】
【外15】
Figure 2004511976
を課す、入力フレームの変換符号化に対応する。量子化Q(n)は、平均値Qmean付近の制限された変化を有するので、この大きな時定数は、比較的一定の品質の変換符号化されたフレームを得ることを許す。それは、出力信号117のVBR動作となる。

【0050】
【外16】
Figure 2004511976
:この範囲は、τが、τ(n)=N−nに従う一時的な状態である。時定数は、フレームのランクが増加すると減少され、それにより、出力信号117はVBRからCBRにゆっくりと変化する。量子化ファクタQ(n)は増加する振幅の変動を有し、これは、変換符号化されたフレームの更に可変の品質となる。

【0051】
【外17】
Figure 2004511976
:この範囲は、変換符号化の最後に対応する。時定数τは、信号117のCBR動作を得るために、一定の小さな値に設定される。
【0052】
【外18】
Figure 2004511976
が成り立つ。このCBR動作は、ビットレートが、シーケンス内で変換符号化される残りのフレームと、前記蓄積装置上に有効な空間を考慮して目標付けされるので、空間の制限された蓄積装置の最適な充填を得ることを許す。典型的には、
【0053】
【外19】
Figure 2004511976
は、この範囲の継続時間が約1分であるように設定される。
【0054】
もちろん、時定数τの変化機構に関する上述の例は、網羅的ではなく、そして、代わりの機構が、本発明の範囲から離れることなく適用され得る。例えば、0と
【0055】
【外20】
Figure 2004511976
の間の範囲は、大きな時定数で量子化を開始するために抑圧され、最初から出力信号117のVBR動作となる。
【0056】
本発明は、配線された電子回路により又は、代わりに、コンピュータ読出し可能な媒体に蓄積された命令の組みによるような、幾つかの方法で実行されてもよく、前記命令は少なくとも前記回路の一部を置き換え、そして、前記置き換えられた回路内で完了するように同じ機能を実行するために、コンピュータ又はディジタルプロセッサの制御の下で実行可能である。本発明は、上述の方法の、ステップ又は、幾つかのステップを実行するためのコンピュータの実行可能な命令を含む、ソフトウェアモジュールを含むコンピュータ読出し可能な媒体にも関連する。
【0057】
動詞”符号化”はディジタル領域で行われるどのようなビデオ信号データ操作にも関連する。特にこの動詞は符号化と変換符号化方法の両方に適用する。
【図面の簡単な説明】
【図1】
MPEG−2ビデオ圧縮信号変換符号化の状況での、本発明に従った方法を示す図である。
【図2】
本発明に従ったビットレート制御ステップを示す図である。
【図3a】
本発明に従って得られたビットレート制御を示す図である。
【図3b】
本発明に従って得られたビットレート制御を示す図である。
【図3c】
本発明に従って得られたビットレート制御を示す図である。

Claims (9)

  1. 入力フレームのシーケンスから、蓄積装置に蓄積される符号化されたビデオフレームを発生するビデオ符号化システムのための、ビデオビットレート制御方法であって、前記方法は、評価ステップから発行される量子化ファクターを前記入力フレームに適用する、少なくとも量子化ステップを有し、
    前記評価ステップは、
    −前に符号化されたフレームに関する量子化ファクターQ(n−1)とフレームサイズS(n−1)から、前記の前に符号化されたフレームの複雑さX(n−1)を計算する、計算サブステップと、
    −複雑さX(n−1)から、現在の入力フレームの複雑さXe(n)を推定するための、第1の推定サブステップと、
    −蓄積装置上のまだ有効なビットの数と入力シーケンス内の符号化されるべきフレームの残りの数から、符号化後の現在の入力フレームに関するフレームサイズR(n)を推定するための第2の推定サブステップと、
    −現在の入力フレームの複雑さXe(n)と推定されたフレーサイズR(n)から、現在の入力フレームに適用される量子化ファクターを推定する、第3の推定サブステップとを有することを特徴とする方法。
  2. 第1の推定サブステップは、時定数を有するフィルタにより行われることを特徴とする、請求項1に記載の方法。
  3. 時定数は、既に符号化されたビデオフレームの数とシーケンス内のまだ符号化されていないビデオフレームの残りの数の関数であることを特徴とする、請求項2に記載の方法。
  4. 時定数τ(n)の時間の漸進的変化は、以下の関係、
    Figure 2004511976
    により与えられ、
    【外1】
    Figure 2004511976
    は、増加する値のしきい値であり、nはシーケンス内で符号化されている現在のフレーム番号であり、Nはシーケンス内のフレームの合計数である、ことを特徴とする請求項3に記載の方法。
  5. 複雑さXe(n)は周期的に更新されることを特徴とする、請求項1に記載の方法。
  6. 請求項1乃至5のうち何れか一項に記載のビデオビットレート制御方法を実行することを許すビデオ符号化装置。
  7. 請求項1乃至5のうち何れか一項に記載の符号化ビデオビットレート制御方法を実行することを許すビデオ変換符号化装置。
  8. 入力の符号化されていないフレームから、出力の符号化されたフレームを発生する符号化装置のためのコンピュータプログラムプロダクトであって、そのプロダクトは、前記装置にロードされたときに、前記装置に請求項1乃至5のうち何れか一項に記載の方法を実行させる、命令の組みを含むコンピュータプログラムプロダクト。
  9. 入力の符号化されていないフレームから、出力の符号化されたフレームを発生する変換符号化装置のためのコンピュータプログラムプロダクトであって、そのプロダクトは、前記装置にロードされたときに、前記装置に請求項1乃至5のうち何れか一項に記載の方法を実行させる、命令の組みを含むコンピュータプログラムプロダクト。
JP2002535397A 2000-10-10 2001-10-01 ディジタルビデオ記録のためのビデオビットレート制御方法及び装置 Pending JP2004511976A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP00402792 2000-10-10
PCT/EP2001/011389 WO2002032141A2 (en) 2000-10-10 2001-10-01 Video bitrate control method and device for digital video recording

Publications (1)

Publication Number Publication Date
JP2004511976A true JP2004511976A (ja) 2004-04-15

Family

ID=8173897

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002535397A Pending JP2004511976A (ja) 2000-10-10 2001-10-01 ディジタルビデオ記録のためのビデオビットレート制御方法及び装置

Country Status (6)

Country Link
US (1) US6823008B2 (ja)
EP (1) EP1329109A2 (ja)
JP (1) JP2004511976A (ja)
KR (1) KR20020064925A (ja)
CN (1) CN1223197C (ja)
WO (1) WO2002032141A2 (ja)

Families Citing this family (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100468726B1 (ko) * 2002-04-18 2005-01-29 삼성전자주식회사 실시간 가변 비트율 제어를 수행하는 부호화 장치 및 방법
JP3903912B2 (ja) * 2002-12-02 2007-04-11 株式会社日立製作所 記録装置および記録方法
KR100950525B1 (ko) * 2002-12-02 2010-03-30 삼성전자주식회사 트랜스코딩 장치 및 방법, 이에 사용되는 타겟비트할당 및픽처 복잡도 예측 장치 및 방법
EP1445958A1 (en) * 2003-02-05 2004-08-11 STMicroelectronics S.r.l. Quantization method and system, for instance for video MPEG applications, and computer program product therefor
US7266147B2 (en) * 2003-03-31 2007-09-04 Sharp Laboratories Of America, Inc. Hypothetical reference decoder
US7535959B2 (en) * 2003-10-16 2009-05-19 Nvidia Corporation Apparatus, system, and method for video encoder rate control
KR101058524B1 (ko) * 2004-07-22 2011-08-23 삼성전자주식회사 비트량 제어장치 및 제어방법
FR2882614B1 (fr) * 2005-02-28 2007-10-12 Canon Kk Procede et dispositif de codage d'un signal numerique d'entite multimedia et procede et dispositif de decodage associes.
US7936938B2 (en) * 2004-09-07 2011-05-03 Canon Kabushiki Kaisha Methods and devices for encoding a digital image signal and associated decoding methods and devices
US8363717B2 (en) * 2005-05-17 2013-01-29 Canon Kabushiki Kaisha Image processing apparatus
US8077775B2 (en) * 2006-05-12 2011-12-13 Freescale Semiconductor, Inc. System and method of adaptive rate control for a video encoder
US7773672B2 (en) * 2006-05-30 2010-08-10 Freescale Semiconductor, Inc. Scalable rate control system for a video encoder
US20070280294A1 (en) * 2006-05-31 2007-12-06 Modulus Video, Inc. Constrained Fidelity Constant Bit Rate Video Encoding Systems and Methods
US8396114B2 (en) * 2009-01-29 2013-03-12 Microsoft Corporation Multiple bit rate video encoding using variable bit rate and dynamic resolution for adaptive video streaming
IT1398196B1 (it) 2009-06-25 2013-02-14 St Microelectronics Srl Controllore dinamico della velocita' di trasmissione indipendente dal gruppo di immagini
US8705616B2 (en) 2010-06-11 2014-04-22 Microsoft Corporation Parallel multiple bitrate video encoding to reduce latency and dependences between groups of pictures
US20110310961A1 (en) * 2010-06-17 2011-12-22 Microsoft Corporation Video rate control based on transform-coefficients histogram
US9591318B2 (en) 2011-09-16 2017-03-07 Microsoft Technology Licensing, Llc Multi-layer encoding and decoding
US11089343B2 (en) 2012-01-11 2021-08-10 Microsoft Technology Licensing, Llc Capability advertisement, configuration and control for video coding and decoding
US9729889B2 (en) * 2012-06-29 2017-08-08 Intel Corporation Multi-pass quantization and bit packing control for video
US11184621B2 (en) 2017-02-23 2021-11-23 Netflix, Inc. Techniques for selecting resolutions for encoding different shot sequences
US10742708B2 (en) 2017-02-23 2020-08-11 Netflix, Inc. Iterative techniques for generating multiple encoded versions of a media title
US11166034B2 (en) 2017-02-23 2021-11-02 Netflix, Inc. Comparing video encoders/decoders using shot-based encoding and a perceptual visual quality metric
US11153585B2 (en) 2017-02-23 2021-10-19 Netflix, Inc. Optimizing encoding operations when generating encoded versions of a media title
US10666992B2 (en) 2017-07-18 2020-05-26 Netflix, Inc. Encoding techniques for optimizing distortion and bitrate
US10616585B2 (en) * 2017-11-22 2020-04-07 Arm Limited Encoding data arrays
CN112204970A (zh) * 2018-07-25 2021-01-08 深圳市大疆创新科技有限公司 图像的编码控制方法、装置、存储介质及无人机
CN110753242B (zh) * 2019-11-01 2021-10-12 深圳市梦网视讯有限公司 一种转码片源帧层量化参数调整方法和***

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
BE1007807A3 (nl) * 1993-11-30 1995-10-24 Philips Electronics Nv Inrichting voor het coderen van een videosignaal.
JP3224465B2 (ja) * 1993-12-22 2001-10-29 シャープ株式会社 画像符号化装置
US5686964A (en) * 1995-12-04 1997-11-11 Tabatabai; Ali Bit rate control mechanism for digital image and video data compression
US6100940A (en) * 1998-01-21 2000-08-08 Sarnoff Corporation Apparatus and method for using side information to improve a coding system
WO1999049664A1 (en) 1998-03-20 1999-09-30 Sgs-Thomson Microelectronics Asia Pacific (Pte) Ltd. Moving pictures encoding with constant overall bit rate
US6570922B1 (en) * 1998-11-24 2003-05-27 General Instrument Corporation Rate control for an MPEG transcoder without a priori knowledge of picture type
US6539124B2 (en) * 1999-02-03 2003-03-25 Sarnoff Corporation Quantizer selection based on region complexities derived using a rate distortion model

Also Published As

Publication number Publication date
WO2002032141A2 (en) 2002-04-18
US6823008B2 (en) 2004-11-23
CN1223197C (zh) 2005-10-12
WO2002032141A3 (en) 2002-06-20
US20020085634A1 (en) 2002-07-04
EP1329109A2 (en) 2003-07-23
CN1393109A (zh) 2003-01-22
KR20020064925A (ko) 2002-08-10

Similar Documents

Publication Publication Date Title
JP2004511976A (ja) ディジタルビデオ記録のためのビデオビットレート制御方法及び装置
JP4256574B2 (ja) 画像信号符号化方法および画像信号符号化装置
EP1051853B1 (en) One-pass variable bit rate moving pictures encoding
EP1074148B1 (en) Moving pictures encoding with constant overall bit rate
KR100756596B1 (ko) 비디오 데이터 부호화 장치 및 비디오 데이터 부호화 방법
KR100238066B1 (ko) 양자화활동도를 이용한 비트 발생량 제어방법 및 그 영상 부호화장치
EP1063851B1 (en) Apparatus and method of encoding moving picture signal
WO2000018137A1 (en) Frame-level rate control for video compression
JP3259702B2 (ja) 動画像可変ビットレート符号化装置および方法
JP3907875B2 (ja) 符号化レート制御装置及び情報符号化装置
JP2004274236A (ja) 符号化装置および符号化方法、プログラム、並びに記録媒体
US6580755B1 (en) Apparatus and method for encoding
EP1157560B1 (en) Bit rate control for video data compression
JP2001028753A (ja) 動画像符号化装置及びその方法
JP4179917B2 (ja) 動画像符号化装置及び方法
KR20040007818A (ko) 동영상 부호화를 위한 dct연산량 조절 방법 및 그 장치
JPH06141298A (ja) 可変転送レート符号化装置及び記録媒体
JP3978810B2 (ja) 符号化方法およびこれを使用した符号化装置
JP3425130B2 (ja) 符号化装置及び符号化方法
JP2005045736A (ja) 画像信号符号化方法及び装置、符号化制御装置並びにプログラム
KR100285705B1 (ko) 엠펙비디오인코더의비트율제어방법
JP4079530B2 (ja) バリアブル・ビットレートによる動画像の符号化方法と装置
JP4273385B2 (ja) 符号化装置および符号化方法、プログラム、並びに記録媒体
Sun et al. Scene adaptive parameters selection for MPEG syntax based HDTV coding
JPH1042293A (ja) 符号化制御装置および符号化装置および符号化制御方法

Legal Events

Date Code Title Description
RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20040415

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20040930

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20061115

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20061205

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20070228

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20070307

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070605

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070703

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20080219