JPWO2009157577A1 - 画像処理装置及び画像処理方法 - Google Patents

画像処理装置及び画像処理方法 Download PDF

Info

Publication number
JPWO2009157577A1
JPWO2009157577A1 JP2010518087A JP2010518087A JPWO2009157577A1 JP WO2009157577 A1 JPWO2009157577 A1 JP WO2009157577A1 JP 2010518087 A JP2010518087 A JP 2010518087A JP 2010518087 A JP2010518087 A JP 2010518087A JP WO2009157577 A1 JPWO2009157577 A1 JP WO2009157577A1
Authority
JP
Japan
Prior art keywords
code amount
quantization
generated code
unit
encoding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2010518087A
Other languages
English (en)
Other versions
JP5472105B2 (ja
Inventor
孝明 渕江
孝明 渕江
恭平 小藪
恭平 小藪
正二郎 柴田
正二郎 柴田
加洲 高橋
加洲 高橋
祐哉 堀内
祐哉 堀内
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP2010518087A priority Critical patent/JP5472105B2/ja
Publication of JPWO2009157577A1 publication Critical patent/JPWO2009157577A1/ja
Application granted granted Critical
Publication of JP5472105B2 publication Critical patent/JP5472105B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/42Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
    • H04N19/436Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation using parallelised computational arrangements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • H04N19/126Details of normalisation or weighting functions, e.g. normalisation matrices or variable uniform quantisers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/13Adaptive entropy coding, e.g. adaptive variable length coding [AVLC] or context adaptive binary arithmetic coding [CABAC]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/14Coding unit complexity, e.g. amount of activity or edge presence estimation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/149Data rate or code amount at the encoder output by estimating the code amount by means of a model, e.g. mathematical model or statistical model
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/15Data rate or code amount at the encoder output by monitoring actual compressed data size at the memory before deciding storage at the transmission buffer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/18Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a set of transform coefficients
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/192Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding the adaptation method, adaptation tool or adaptation type being iterative or recursive
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/196Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding being specially adapted for the computation of encoding parameters, e.g. by averaging previously computed encoding parameters
    • H04N19/197Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding being specially adapted for the computation of encoding parameters, e.g. by averaging previously computed encoding parameters including determination of the initial value of an encoding parameter
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
    • H04N19/89Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression involving methods or arrangements for detection of transmission errors at the decoder
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/91Entropy coding, e.g. variable length coding [VLC] or arithmetic coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computing Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Algebra (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本発明は、回路規模を削減することができる。画像符号化装置(100)は、入力画像(91)が簡易な処理により符号化されてなる簡易符号化データであるDCT係数を、量子化因子である量子化パラメータ(QP)から離散的に選択された選択量子化パラメータ(QPl)に基づいて入力画像である入力画像(91)を少なくとも量子化することにより入力画像(91)を符号化し、符号化による入力画像(91)の発生符号量を算出する。画像符号化装置(100)は、符号化による入力画像の発生符号量における簡易な処理に応じて発生する誤差を補正し、低精度発生符号量を算出する。画像符号化装置(100)は、選択量子化パラメータ(QPl)に基づいて入力画像(91)が符号化されたときの低精度発生符号量に対する補間処理により、選択量子化パラメータ(QPl)以外の量子化パラメータ(QP)に基づいて入力画像(91)が符号化されたときの低精度発生符号量を算出する。

Description

本発明は、例えば画像符号化装置等に係り、特に1ピクチャに与えられた目標符号量に画面内フィードバック制御を行わずに発生符号量を合わせ込む技術分野に関する。
従来、動画のビットストリームを伝送したり記録メディアに記録したりするシステム等においては、伝送路或いは記録容量を効率良く利用するために、高能率符号化が実施されている。これを実現する画像符号化装置では、エンコーダで発生するビットストリームの符号化ビットレートは伝送メディアの転送レートに合わせて一定とされており、この制限の下でデータ発生量、つまり、エンコーダにおける量子化の量子化ステップが制御されている。すなわち、例えば絵柄が複雑な画像が連続するときは量子化ステップを大きくしてデータ発生量を抑圧し、これとは逆に単純な絵柄が連続するときは量子化ステップを小さくしてデータ発生量を増加させることで、バッファメモリのオーバーフロー又はアンダーフローを生じさせないようにして固定レートを保持している。
従って、このような従来技術に係る画像符号化装置では、複雑な画像が連続するときは量子化ステップが大きくなり画質が劣化し、単純な画像が連続するときは量子化ステップが小さくなり全体を通じて均等な画質を得ることができなかった。この問題に鑑みて、例えば特許文献1では、GOP(Group Of Pictures)毎の符号化の難易度と複数のGOPの符号化の難易度の総和の比に従って各GOP自身に割り当てられる割当符号量を、絵柄が複雑な画像を含むGOPに対しては多く割り当て、絵柄が単純な画像を含むGOPに対しては少なく割り当てるように算出する画像符号化装置が開示されている。
一方、1ピクチャに与えられた目標符号量に発生符号量を合わせ込む方法として、例えばTM5(test model 5)のstep2が良く知られている。これは、ピクチャに割り当てられた符号量をマクロブロック(MB;Macro block)に均等に配分したものをMBの目標符号量とし、ピクチャ内でフィードバック(feed back)制御をかける事で、目標符号量に合わせ込む手法である。
特許第3358620号公報。
しかしながら、前述したTM5のstep2の方法では、シーケンス先頭ピクチャやシーンチェンジ直後ピクチャのエンコードにおいて、量子化ステップの初期値が、そのピクチャの絵柄に合ったものではないため、画質が劣化する場合があった。
例えばフィードバック制御において絵柄に追従するまでの部分の量子化ステップが大きすぎる場合は、その部分の画質が他の部分に比べて劣化してしまい、量子化ステップが小さすぎる場合は、その部分で符号量を使いすぎてしまい、他の部分にその影響が及ぶおそれがある。
また、MBの目標符号量を常に一定にしているため、画面内で画の難しさに偏りがある時などは、不適切な符号量配分になっていた。そこで、画像符号化装置は、予め並列に符号化を実行して発生符号量を予測し、1ピクチャに与えられた目標符号量に画面内フィードバック制御を行わずに発生符号量を合わせ込むことが望ましい。しかしながら、画像符号化装置は、量子化パラメータの数だけ並列して量子化を実行するのでは、回路規模が大きくなってしまうという問題があった。
かかる課題を解決するため、本発明の画像処理装置においては、入力画像が簡易な処理により簡易符号化されてなる簡易符号化データを、量子化因子から離散的に選択された選択量子化因子に基づく量子化ステップを用いて少なくとも量子化することにより上記入力画像を符号化し、符号化による上記入力画像の発生符号量を算出する選択発生符号量算出部と、上記符号化による上記入力画像の発生符号量における上記簡易な処理に応じて発生する誤差を補正する誤差補正部と、上記選択量子化因子に基づいて上記入力画像が符号化されたときの発生符号量に対する補間処理により、選択量子化パラメータ以外の量子化パラメータに基づいて上記入力画像が符号化されたときの発生符号量を算出する補間発生符号量算出部とを設けるようにした。
これにより、画像処理装置は、全ての量子化パラメータに基づいて入力画像を符号化しなくても済むと共に、簡易的な符号化により入力画像を符号化するため、回路構成を簡略化しつつ、当該簡易的な符号化に基づく誤差を補正して発生符号量の精度を向上させ得る。
さらに本発明の画像処理方法においては、入力画像が簡易な処理により簡易符号化されてなる簡易符号化データを、量子化因子から離散的に選択された選択量子化因子に基づく量子化ステップを用いて少なくとも量子化することにより上記入力画像を符号化し、符号化による上記入力画像の発生符号量を算出する選択発生符号量算出ステップと、上記符号化による上記入力画像の発生符号量における上記簡易な処理に応じて発生する誤差を補正する誤差補正ステップと、上記選択量子化因子に基づいて上記入力画像が符号化されたときの発生符号量に対する補間処理により、選択量子化パラメータ以外の量子化パラメータに基づいて上記入力画像が符号化されたときの発生符号量を算出する補間発生符号量算出ステップとを設けるようにした。
これにより、画像処理方法は、全ての量子化パラメータに基づいて入力画像を符号化しなくても済むと共に、簡易的な符号化により入力画像を符号化するため、回路構成を簡略化しつつ、当該簡易的な符号化に基づく誤差を補正して発生符号量の精度を向上させ得る。
さらに本発明の画像処理装置においては、入力画像を少なくとも量子化因子に基づいて量子化することにより入力画像を簡易符号化し、簡易符号化による入力画像の発生符号量を算出する簡易発生符号量算出部と、簡易発生符号量算出部によって算出された発生符号量に基づいて、入力画像を符号化したときの発生符号量が目標符号量に最も近いと予測される量子化因子を基本量子化因子として決定する基本量子化因子決定部と、量子化因子に基づくリスケーリングファクタにより入力画像を除算したときの剰余に基づいて、入力画像が前回符号化されたときに使用された量子化因子を検出量子化因子として符号化単位ごとに検出するバックサーチ部と、バックサーチ部によって検出された検出量子化因子に基づいて入力画像を符号化し、符号化単位ごとの発生符号量を算出する検出発生符号量算出部と、バックサーチ部によって検出量子化因子が検出されなかった符号化単位についての基本量子化因子に基づく発生符号量と、バックサーチ部によって量子化因子が検出された符号化単位についての検出発生符号量算出部によって算出された発生符号量とを加算することにより、複数の符号化単位から構成される制御単位ごとの発生符号量を算出する制御単位発生符号量算出部とを設けるようにした。
これにより、画像処理装置は、非原画でなる入力画像に対して、バックサーチ部によって検出量子化因子が検出されなかった符号化単位についての基本量子化因子に基づく発生符号量を用いることにより、簡易な構成でバックサーチ部によって検出された検出量子化因子に基づいて入力画像を符号化した場合の発生符号量を算出することができる。
本発明によれば、全ての量子化パラメータに基づいて入力画像を符号化しなくても済むと共に、簡易的な符号化により入力画像を符号化するため、回路構成を簡略化しつつ、当該簡易的な符号化に基づく誤差を補正して発生符号量の精度を向上させ得る。かくして本発明は、発生符号量を算出する際に回路規模を削減し得る画像処理装置及び画像処理方法を実現し得る。
さらに本発明によれば、非原画でなる入力画像に対して、バックサーチ部によって検出量子化因子が検出されなかった符号化単位についての基本量子化因子に基づく発生符号量を用いることにより、簡易な構成でバックサーチ部によって検出された検出量子化因子に基づいて入力画像を符号化した場合の発生符号量を算出することができる。かくして本発明は、発生符号量を算出する際に回路規模を削減し得る画像処理装置及び画像処理方法を実現し得る。
図1は、本発明の第1の実施の形態に係る画像符号化装置の構成図。
図2は、離散的な値のQPの補正を行い、間のQPについて補間により符号量を計算することを説明する概念図。
図3は、本発明の第1の実施の形態に係る画像符号化装置による符号化の処理手順を詳細に説明するフローチャート。
図4は、適応的なQ Matrixの切り替え処理について更に説明するフローチャート。
図5は、本発明の低精度発生符号量の算出処理について説明するフローチャート。
図6は、本発明の第2の実施の形態に係る画像符号化装置の構成図。
図7は、本発明の第2の実施の形態に係る画像符号化装置による符号化の処理手順を詳細に説明するフローチャート。
図8は、前回のパラメータ推定処理を説明するフローチャート。
図9は、原画モードかダビングモードかの判定を説明するフローチャート。
1……第1のプレエンコード部、2……第2のプレエンコード部、3……エンコード部、4……符号量制御部、6,7……ディレイバッファ、11……画面内予測モード決定部、12……画面内予測処理部、13……DCT部、14……量子化部、15……エントロピー符号長計算部、21……画面内予測処理部、22……DCT部、23……量子化部、24……エントロピー符号長計算部、25……バッファ、26……IDCT部、27……逆量子化部、31……画面内予測処理部、32……DCT部、33……量子化部、34……エントロピー符号化部、35……バッファ、36……IDCT部、37……逆量子化部、40……前定モード推定プレエンコード部、41……画面内予測処理部、42……DCT部、43……バックサーチ部、44……バッファ、45……量子化部、46……エントロピー符号長計算部
以下、図面を参照して、本発明を実施するための最良の形態(以下、単に実施の形態と称する)について詳細に説明する。なお説明は以下の順序で行う。
1.第1の実施の形態(補間による低精度発生符号量の予測)
2.第2の実施の形態(バックサーチによる高精度発生符号量の予測)
<1.第1の実施の形態>
[1−1.本発明の特徴]
この実施の形態に係る画像符号化装置100及び画像符号化方法は、以下などを特徴とする。
画像符号化装置100は、H.264/AVC(Advanced Video Coding;高度動画像圧縮符号化標準)等に代表される算術符号化を用いた画像圧縮方式でなる。画像符号化装置100は、符号量制御を行う際に、ピクチャ内で良好な符号量分布を実現するために、並列プレエンコード(Pre Encode)と直列プレエンコードを組み合わせる。これにより、画像符号化装置100は、回路規模とLatency(遅延時間)の増加を抑えつつ、精度のよい予測を行う。
より詳細には、画像符号化装置100は、第1及び第2のプレエンコード部1及び2により、量子化と符号長計算部のみ並列に行い、他の処理要素は共用することで、回路共通化による回路規模の削減を図る。
つまり、本来であれば、並列プレエンコードを行う場合には、全ての処理要素を並列に設ける必要があるところ、この実施の形態に係る画像符号化装置100では、精度に影響なく共通化できる処理要素を的確に特定し、該処理要素につき回路を共通化する。これにより、第1及び第2のプレエンコード部1及び2自体の回路規模とlatency(遅延時間)の増加を抑える。
そして、第1のプレエンコード部1では、少し精度を落とし回路規模並びに処理負荷を抑えた並列プレエンコードを広い範囲の量子化パラメータ(QP)で行い、目標符号量を実現するQPを粗く見積もる。第2のプレエンコード部2では、精度を上げた並列プレエンコードを狭い範囲で行い、本エンコード部3で使用する基本量子化パラメータQPMBを決定する。以上により、画像符号化装置100は、画像符号化の精度を上げつつ処理負荷を軽減する。さらに、プレエンコードを簡略化したことによる誤差がビットレートや量子化パラメータQPと相関を持つことから、詳細は後述するような統計モデルを予め作成しておき、ビットレートや量子化パラメータQPから誤差の補正を行うこととしている。
図1には、本発明の一実施の形態に係る画像符号化装置100の構成を示し説明する。
この画像符号化装置100は、第1のプレエンコード部1、第2のプレエンコード部2、本エンコード部3、符号量制御部4、ディレイバッファ5,6を有している。
第1のプレエンコード部1は、第1のプレエンコードを行うモジュールであり、画面内予測モード決定部11、画面内予測処理部12、DCT(Discrete Cosine Transform;離散コサイン変換)部13、量子化部14、エントロピー符号長計算部15、アクティビティ(Activity)計算部16を備えている。
第2のプレエンコード部2は、第2のプレエンコードを行うモジュールであり、画面内予測処理部21、DCT部22、量子化部23、エントロピー符号長計算部24、バッファ25、IDCT(Inverse DCT)部26、逆量子化部27を備えている。
そして、本エンコード部3は、本エンコードを行うモジュールであり、画面内予測処理部31、DCT部32、量子化部33、エントロピー符号化部34、バッファ35、IDCT部36、逆量子化部37を備えている。
符号量制御部4は、符号量制御を行うモジュールである。
[1−2.量子化パラメータ及び量子化行列の予測]
[1−2−1.低精度発生符号量の算出]
画像符号化装置100は、符号化難易度に応じて例えば3つの量子化行列Q Matrixを適用的に選択して使用する(詳しくは後述する)。画像符号化装置100は、一の量子化行列Q Matrixを設定すると共に、当該設定された量子化行列Q Matrixの取り得る範囲の量子化パラメータQPについて、第1のプレエンコード部1による簡易な処理によって発生符号量を粗く見積もる。以下、当該プレエンコード部1の結果により見積もられた発生符号量を低精度発生符号量と呼ぶ。画像符号化装置100は、全ての量子化行列Q Matrixについて同様の処理を実行し、量子化行列Q Matrix及び量子化パラメータQPを変更したときの低精度発生符号量を算出する。そして画像符号化装置100は、低精度発生符号量が目標符号量に最も近くなる量子化パラメータQP及び量子化行列Q Matrixを次のステップ(第2のプレエンコード部2)でピクチャの平均量子化パラメータBase QPとして使用する予測量子化パラメータQPd、次のステップで使用するピクチャの量子化行列Q Matrix(以下、これを予測量子化行列Q MatrixDと呼ぶ)とする。
このとき画像符号化装置100は、離散的に選択された一部の量子化パラメータQP(以下、これを選択量子化パラメータQPlと呼ぶ)を用いて入力画像91における低精度発生符号量を算出する。画像符号化装置100は、選択量子化パラメータQPl間の低精度発生符号量を補間によって算出することにより、量子化行列Q Matrixが取り得る範囲の量子化パラメータQPの全てについて、低精度発生符号量を算出するようになされている。
実際上、入力画像91は、最初に第1のプレエンコード部1の画面内予測モード決定部11に入力される。画面内予測モード決定部11は、この入力画像91に基づいて、全ての画面内予測モードによって差分画像データを生成すると共に、当該差分画像データの発生符号量の予測に基づいて画面内予測モードを決定する。予測モード(予測方向)は、最小4×4画素単位で9通りの予測モードの中から決定されることになる。
この決定された画面内予測モードは、画面内予測処理部12に送出されると共に、第2のプレエンコード部2や本エンコード部3にも送出される。この画面内予測モードは、第2のプレエンコード部2による第2のプレエンコード、本エンコード部3による本エンコードでも使用される。
次に画面内予測処理部12は、予測画像と入力画像91との差分画像を計算し、差分画像データを生成する。ここでの予測画像は、処理を削減するため入力画像91から作られる。このように、第1のプレエンコード部1は、入力画像を用いて画面内予測処理を行うことで、逆量子化部、IDCT部、バッファを削減することができ、回路規模を削減することが可能となる。
DCT部13は、差分画像データに対して整数精度DCT処理を実行し、DCT係数を生成すると、これを量子化部14に送出する。量子化部14は、このDCT係数について量子化を行い、量子化係数を生成すると、これをエントロピー符号長計算部15に送出する。エントロピー符号長計算部15は、量子化係数に対し、コンテキスト適応型可変長符号化方式(CAVLC;Context−Adaptive Variable Length Coding)を行うことにより符号量を計算する。CAVLCによれば、周囲の状況に応じて高効率の符号化方式を適応的に選択できる。
このように第1のプレエンコードでは、本エンコードにおいてエントロピー符号化方式としてCABAC(Context−Adaptive Binary Arithmetic Coding)を用いる場合でも、符号量計算にCAVLCを用いることを特徴の一つとしている。尚、CABACとは、コンテキスト適応型2値算術符号化方式である。
ここで、量子化部14は、並列に設けられた量子化部14−1,…,14−n(n=1,2,3・・)により構成され、エントロピー符号長計算部15は、並列に設けられたエントロピー符号長計算部15−1,…,15−n(n=1,2,3・・)により構成されている。nの値は、例えば15に設定されている。量子化部14は、0〜51でなる量子化パラメータQPのうち、設定されている量子化行列Q Matrixに対応した選択量子化パラメータQPlを各量子化部14−1,…,14−nに設定する。この選択量子化パラメータQPlは、量子化行列Q Matrixが取り得る量子化パラメータQPの範囲から、任意の間隔で離散的に選択される。なお選択量子化パラメータQPlは、例えば一定間隔で選択されても良く、量子化パラメータQPの値に応じて変化する間隔で選択されても良い。このような構成の下、第1のプレエンコード部1は、量子化と符号長計算を、上記並列数と同数の複数の量子化パラメータQPに対して並列に実行し、それぞれの発生符号量を符号量制御部4に出力する。
即ち、第1のプレエンコード部1は、量子化部14、エントロピー符号長計算部15による回路規模を抑えた並列プレエンコードにより、広い範囲の量子化パラメータQPで第1のプレエンコードを行うことで、広い範囲の量子化パラメータQPに対する発生符号量を算出する。
ここで、アクティビティ計算部16は、画面内予測モード決定部11による画面内予測モードの決定と同時並行して、アクティビティ(Activity)を計算し、該アクティビティによりマクロブロック(MB;Macro Block)をグループ分けする。 つまり、NumOfActivityGroupのグループに分ける場合を想定すると、アクティビティ計算部16は、ActivityTheshold[0]〜ActivityTheshold[NumOfActivityGroup−2]とアクティビティの値とを比較することにより、アクティビティグループを決定する。
尚、量子化処理において実際に使用される量子化パラメータQPは、ピクチャの平均量子化パラメータQP(BaseQP)に対して、アクティビティグループに依存したオフセット(AdaptQPDelta)を加えることで求められる。
Figure 2009157577
例えば、NumOfActivityGroupを13とするなら、AdaptQPDeltaの各値は、
AdaptQPDelta[13]={−6,−5,−4,−3,−2,−1,0,1,2,3,4,5,6}
とすることができる。
各MBに対して決定されたアクティビティグループ(Activity Group)番号は、量子化部14に入力される。量子化部14は、選択量子化パラメータQPlに対し、アクティビティグループに応じたオフセットを付加して適応量子化パラメータQPtを算出する。量子化部14は、適応量子化パラメータQPtに基づいて、DCT係数に対する量子化処理を実行する。
第1のプレエンコード部1は、次の量子化行列Q Matrix及び当該量子化行列Q Matrixに対応する選択量子化パラメータQPlを設定することにより、同様にして発生符号量を算出する。この結果、第1のプレエンコード部1は、量子化行列Q Matrix及び当該量子化行列Q Matrixに対応する選択量子化パラメータQPlについて、発生符号量をそれぞれ算出することになる。
[1−2−2.発生符号量の誤差の補正]
符号量制御部4は、第1のプレエンコード部1において算出された発生符号量に対して補正を行う。
ここでの補正は、誤差が、ある程度の傾向を持っている事を利用して行う。
一つ目の誤差要因は、画面内予測処理にローカルデコード(Local Decode)画ではなく入力画像91を用いている事である。この場合、画面内予測に使う画にコーデック(Codec)による歪がのっていないので、実際のエンコードより符号化効率が良くなり、符号量が少なめに出る傾向がある。この誤差の大きさは、歪の大きさに依存するので、発生符号量と誤差の関係では、ビットレート(Bit rate)が小さくなると誤差が大きくなる傾向がある。また、量子化パラメータQPと誤差の関係では、量子化パラメータQPが大きくなると誤差が大きくなる傾向にある。よって、予め誤差の大きさの統計データを取り、ビットレート“r”とQP“q”の関数として定義する。
具体的に、符号量制御部4は、CAVLCによって符号化されたときの発生符号量について、ビットレートによる平均的な誤差のモデル、量子化パラメータQPによる平均的な誤差のモデルをそれぞれ作成しておく。この誤差モデルは、量子化パラメータQP及びビットレートにそれぞれ対応する例えば数式やテーブルとして予め記憶される。符号量制御部4は、量子化パラメータQP及びビットレートから補正すべき誤差を表す補正量C_rate、C_qpを、対応する誤差モデルからそれぞれ算出する。符号量制御部4は、量子化パラメータQP及びビットレートに対応する補正量C_rate、C_qpのうち、次式に従って小さい値を補正量Cvとして選択する。
補正量Cv=min(C_rate、C_qp)
これにより、誤差の補正量が大きくなり過ぎてしまい、補正された発生符号量が第2のプレエンコード部2において算出される高精度発生符号量よりも大きくなってしまうことを防止し得るようになされている。なおこの補正量C_rate、C_qpは、第1のプレエンコード部1によって算出された発生符号量(Pre−Encode符号量)に対する補正量の割合(%)を表している。
符号量制御部4は、第1のプレエンコード部1によって算出された発生符号量に対し、次式に従って補正量Cvを乗算することにより、発生符号量に対する補正量(以下、これをCAVLC補正符号量と呼ぶ)を算出する。
CAVLC補正符号量=Pre−Encode符号量×Cv
符号量制御部4は、発生符号量に対してCAVLC補正符号量を加算することにより、CAVLCについての低精度発生符号量を算出する。
二つ目の誤差要因は、エントロピー符号化方式でCABACを選択したときのみ発生するものである。第1のプレエンコード部1では、CABACによる符号化を実行せず、CAVLCの符号量からCABACによって符号化したときの低精度発生符号量を予測する。CABACはCAVLCより符号化効率が良いので、CAVLCでプレエンコードした発生符号量は、実際の符号量より多めに出る傾向がある。例えば、発生符号量と誤差の関係では、この誤差の大きさは統計的に見てビットレート(Bit rate)が小さくなるとCABACの効率が良くなることに起因して、大きくなる傾向にある。これも同様に、予め誤差の大きさの統計データを取り、平均的な誤差のモデルを作成しておくことで補正する。
CABACに起因する誤差は、CAVLCの符号量による符号化において生じる誤差と比較して、量子化パラメータQP及びビットレートに関し反対側に変化し、その変化量は小さいことが明らかになった。
そこで、CABACについての補正量(以下、これをCABAC補正量と呼ぶ)をビットレート“r”とQP“q”の関数として定義する。このとき、補正量Cbは、次式によって算出される。
補正量Cb=min(r,q)
符号量制御部4は、第1のプレエンコード部1によって算出された発生符号量(Pre−Encode符号量)に対し、次式に従って補正量Cvを乗算することにより、発生符号量に対する補正量(以下、これをCABAC補正符号量と呼ぶ)を算出する。
CABAC補正符号量=Pre−Encode符号量×Cb
符号量制御部4は、低精度発生符号量に対してCABAC補正符号量を加算することにより、CABACについての低精度発生符号量を算出する。符号量制御部4は、図2に示すように、第1のプレエンコード部1によって算出された発生符号量(四角で表す)に対して補正されたCAVLC補正量及びCABAC補正符号量(黒丸で表す)をそれぞれ算出することができる。
次に、符号量制御部4は、量子化パラメータ(QP)の推定処理を行う。上述したように、第1のプレエンコード部1は、任意の間隔で、離散的な値の選択量子化パラメータQPlでプレエンコードを行って発生符号量を取得している。符号量制御部4は、量子化行列Q Matrixの取り得る量子化パラメータQPの範囲のうち、選択量子化パラメータQPl以外の量子化パラメータQPに関して、補間により発生符号量を計算する(白丸で示す)。補間処理としては、線形補間など一般的な補間処理を用いることができる。
即ち、図2に示されるように、第1のプレエンコード部1で得た離散的な値の量子化パラメータQP(四角で示す)ついて、補正を行い補正後の量子化パラメータQP(黒丸で示す)を得て、更に、その間の量子化パラメータQP(白に丸で示す)について補間により符号量を計算することになる。
このように、符号量制御部4は、第1のプレエンコード部1によって算出された発生符号量に対し、当該第1のプレエンコード部1において簡易化した処理に応じて発生する発生符号量の誤差を補正してCAVLCについての低精度発生符号量を算出する。これにより、符号量制御部4は、簡易化された符号化処理による発生符号量の予測精度を向上させ得る。符号量制御部4は、CAVLCについての低精度発生符号量を用いてCABACによる発生符号量の予測量である低精度発生符号量を算出する。これにより、符号量制御部4は、処理の複雑なCABACを行うことなく、CABACによる低精度発生符号量を見積もることができる。符号量制御部4は、離散的に選択された選択量子化パラメータQPlによって予測された低精度発生符号量から、補間処理により、当該選択量子化パラメータQPl以外の量子化パラメータQPについての低精度発生符号量を予測する。これにより、符号量制御部4は、わざわざ全ての量子化パラメータQPを用いて入力画像91を符号化せずに済み、第1のプレエンコード部1の構成を簡易にすることができる。
[1−2−3.予測量子化行列の決定]
上述したように、量子化行列Q Matrixが取り得る全ての量子化パラメータQPについて、低精度発生符号量が算出された。符号量制御部4は、符号化難易度に応じて量子化行列Q Matrixを変更し、変更された量子化行列Q Matrixに対応する低精度発生符号量に基づいて、目標符号量に最も近い量子化パラメータQPを基本量子化パラメータQPMBとして選択するようになされている。
符号量制御部4は、量子化行列Q Matrix毎に、目標符号量に一番近い低精度発生符号量が生成されたときに使用された量子化パラメータQPを近傍量子化パラメータQPnとして選択する。符号量制御部4は、符号化難易度として、例えば各量子化行列Q Matrix毎に選択された近傍量子化パラメータQPnを使用する。もちろん、アクティビティなど別の指標を用いることも可能である。ここでは、切り替えて使う量子化行列Q Matrixの数をNumOfQMatrixIdとし、傾斜の緩やかな量子化行列Q Matrixから昇順にId(識別子)を付け、各量子化行列Q Matrixの取り得る範囲における最大の量子化パラメータQPをQMatrixTheshold[Id]とする。
符号量制御部4は、Idの値の小さい量子化行列Q Matrixから近傍量子化パラメータQPnとQMatrixThesholdとを比較する。符号量制御部4は、近傍量子化パラメータQPnがQMatrixTheshold[Id]より小さい量子化行列Q Matrixのうち、最小のIdを有する量子化行列Q Matrixを予測量子化行列Q MatrixDとして決定する。符号量制御部4は、当該予測量子化行列Q MatrixDにおける近傍量子化パラメータQPnを予測量子化パラメータQPdとして決定する。
すなわち符号量制御部4は、低精度発生符号量が目標符号量に近い量子化パラメータQPを取り得る量子化行列Q Matrixのうち、最小の傾斜を有する量子化行列Q Matrixを予測量子化行列Q MatrixDとして決定する。この予測量子化行列Q MatrixDは本エンコード部3による本エンコードにも使用されることになる。符号量制御部4は、低精度発生符号量の条件を満たす中で最小の傾斜を有する量子化行列Q Matrixを用いることができるため、画質の劣化を極力防止することができる。
なお、符号量制御部4は、第1のプレエンコード部1によってIdの小さい量子化行列Q Matrixから順に当該量子化行列Q Matrixの取り得る範囲の選択量子化パラメータQPlについて低精度発生符号量を算出する。そして符号量制御部4は、近傍量子化パラメータQPnがQMatrixTheshold[Id]より小さい量子化行列Q Matrixを検出した場合には、当該量子化行列Q Matrix及び近傍量子化パラメータQPnを予測量子化行列Q MatrixD及び予測量子化パラメータQPdとして決定する。このとき符号量制御部4は、第1のプレエンコード部1に次のピクチャに対する処理を開始させる。すなわち符号量制御部4は、第1のプレエンコード部1に処理中のピクチャに関する次のIdでなる量子化行列Q Matrixについての低精度発生符号量を算出させない。これにより、符号量制御部4は、予測量子化パラメータQPd及び予測量子化行列Q MatrixDを決定するのに要する処理時間を短縮し得る。
このように、符号量制御部4は、低精度発生符号量が目標符号量に近くなる量子化パラメータQPを取り得る量子化行列Q Matrixのうち、画質の低下を防止するために最も傾斜の小さい量子化行列Q Matrixを予測量子化行列Q MatrixDとして選択する。符号量制御部4は、予測量子化行列Q MatrixDにおいて低精度発生符号量が目標符号量に最も近くなる量子化パラメータQPを予測量子化パラメータQPdとして選択する。これにより、符号量制御部4は、画質を極力低下させないように適応的に量子化行列Q Matrixを変更しつつ、低精度発生符号量が目標符号量に最も近くなる量子化パラメータQPを予測量子化パラメータQPdとして選択することができる。
[1−3.基本量子化パラメータの決定]
第2のプレエンコード部2は、予測量子化パラメータQPd及び予測量子化行列Q MatrixDを用いて実際にエンコーダ3と同様の符号化を実行することにより、高精度発生符号量を高い精度で算出する。以下、この第2のプレエンコード部2によって算出された発生符号量を高精度発生符号量と呼ぶ。このとき第2のプレエンコード部2は、予測量子化パラメータQPdだけでなく、当該予測量子化パラメータQPdの前後の量子化パラメータQPを用いて高精度発生符号量を算出し、その変動率を用いて予測量子化パラメータQPd近傍の高精度発生符号量を予測する。
符号量制御部4は、予測量子化パラメータQPd、予測量子化行列Q MatrixD及び各MBのアクティビティグループを第2のプレエンコード部2に供給する。第2のプレエンコード部2は、これらの値に基づいて第2のプレエンコードを行う。
第2のプレエンコード部2では、入力画像91が、ディレイバッファ5を介して遅延処理された後に画面内予測処理部21に入力される。画面内予測処理部21は、予測画像と入力画像91との差分を計算し、差分画像データを生成する。そして、DCT部22は、差分画像データに対してDCT処理を実行しDCT係数を生成する。量子化部23は、DCT係数に対して量子化処理を実行し、量子化係数を生成する。エントロピー符号長計算部24は、CAVLC又はCABACを用いて量子化係数をそれぞれエントロピー符号化し、高精度発生符号量を計算する。
尚、第2のプレエンコード部2における処理の過程において、量子化部23は量子化係数を逆量子化部27に送出する。逆量子化部27は、量子化係数を逆量子化してDCT係数を再生する。そして、IDCT部26はDCT係数をIDCT変換し、ローカルデコード画像を生成し、バッファ25に保存することになる。
ここで、量子化部23は、この例では3段の量子化部23−1,23−2,23−3により構成され、エントロピー符号長計算部24は、この例では3段のエントロピー符号長計算部24−1,24−2,24−3により構成されている。3段と少なくしているのは、既に第1のプレエンコードで量子化パラメータQPが広い範囲で粗く見積もられているからである。
このような構成の下、量子化部23、エントロピー符号長計算部24は、並列に処理を実行し、予測量子化パラメータQPd及び当該予測量子化パラメータQPdの前後の量子化パラメータQPでの高精度発生符号量を得ることになる。このとき、エントロピー符号長計算部24は、本エンコード部3による本エンコードのエントロピー符号化方式と同じ方式をCABAC/CAVLCのいずれかから選択する。
続いて、符号量制御部4は、第2のプレエンコードにより得られた高精度発生符号量から、本エンコードで使用するピクチャの基本量子化パラメータQPMBを決定する。そして、符号量制御部4は、この決定されたピクチャの基本量子化パラメータQPMBや予測量子化行列Q MatrixD、各MBのアクティビティグループから、量子化の情報(Q Matrix、各MBのQP等)を本エンコード部3に送出する。
より詳細には、目標符号量が、第2のプレエンコードで得られた高精度発生符号量に挟まれている場合、つまり、
Figure 2009157577
の場合には、目標符号量に最も近い量子化パラメータQPを基本量子化パラメータQPMBとして選択する。
そうでない場合、符号量制御部4は、量子化パラメータQPの変化に対する高精度発生符号量の変動率を、第2のプレエンコードの結果から求める。予測量子化パラメータQPdは、第1のプレエンコード部1による低精度発生符号量に基づいて算出されている。このため目標符号量に最も近い量子化パラメータQPは、予測量子化パラメータQPdの近傍に存在する。量子化パラメータQPの値が近い場合、発生符号量の変動率は略一定である。そこで、符号量制御部4は、予測量子化パラメータQPd及び当該予測量子化パラメータQPdの前後の量子化パラメータQPにおける高精度発生符号量の変動率から各量子化パラメータQPでの高精度発生符号量を予測し、目標符号量に最も近い量子化パラメータQPを基本量子化パラメータQPMBとして選択する。
まず、量子化パラメータQPが「1」減算されたときに、高精度発生符号量が何%変わるかを表すDiffRatio_1を、第2のプレエンコード2の結果から以下のようにして求める。なお、Generated_bitsは第2のプレエンコード2における発生符号量を表しており、QP_precode1は、予測量子化パラメータQPdを、QP_precode1−1は予測量子化パラメータQPdより「1」小さい量子化パラメータQPを表している。
Figure 2009157577
量子化パラメータQPが「1」加算されたときに、高精度発生符号量が何%変わるかを表すDiffRatio_2を、第2のプレエンコード2の結果から以下のようにして求める。QP_precode1+1は予測量子化パラメータQPdより「1」大きい量子化パラメータQPを表している。
Figure 2009157577
予測量子化パラメータQPdの近傍における高精度発生符号量の変動率DiffRatioを、以下のようにして求める。
DiffRatio=(DiffRatio_1+DiffRatio_2)/2
すなわち、予測量子化パラメータQPdから正負の方向にそれぞれ「1」だけ変化したときの発生符号量の変動の平均値としてDiffRatioを算出する。
DeltaQPを、高精度発生符号量が目標符号量に最も近い量子化パラメータQPと予測量子化パラメータQPd(QP_precode1)との差の絶対値とすると、目標符号量に最も近い高精度発生符号量に対応する量子化パラメータQPが予測量子化パラメータQPdより1だけ小さい量子化パラメータQP(QP_precode1−1)より小さいときには、高精度発生符号量が目標符号量に最も近い量子化パラメータQPの高精度発生符号量(Generated_bits(QP))を以下のように算出する。
Figure 2009157577
目標符号量に最も近い高精度発生符号量に対応する量子化パラメータQPが予測量子化パラメータQPdより1だけ大きい量子化パラメータQP(QP_precode1+1)より大きいときには、高精度発生符号量が目標符号量に最も近い量子化パラメータQPの高精度発生符号量(Generated_bits(QP))を以下のように算出する。
Figure 2009157577
Figure 2009157577
すなわち、符号量制御部4は、予測量子化パラメータQPdの前後の量子化パラメータQPを用いたときの高精度発生符号量に対し、予測量子化パラメータQPdを中心に量子化パラメータQPの値が「1」だけ変化したときの変動率に応じた符号量だけ増減させる。符号量制御部4は、予測量子化パラメータQPdの近傍の量子化パラメータQPを用いた場合の高精度発生符号量を高い精度で算出することができる。
以上のようにして、符号量制御部4は、目標符号量に最も近い量子化パラメータQPを本エンコードにおいて平均量子化パラメータ(BaseQP)として使用する基本量子化パラメータQPMBとして選択することになる。
上述したように、第2のプレエンコード部2では、第1のプレエンコード部1により推定された予測量子化パラメータQPd(QP_precode1)と、ひとつ大きい量子化パラメータQP(QP_precode1+1),ひとつ小さい量子化パラメータQP(QP_precode1−1)でプレエンコードする。ここで、回路規模削減のため、前述したように、量子化部23とエントロピー符号長計算部24のみ並列化し、その他の処理は共用する。
このとき、画面内予測処理で使用するローカルデコード(Local Decode)画は、第1のプレエンコード部1の結果に基づいて推定された予測量子化パラメータQPd(QP_precode1)で量子化したデータとする。つまり、逆量子化とIDCTで処理されるデータは、予測量子化パラメータQPd(QP_precode1)の量子化の出力である。これは、予測量子化パラメータQPdの前後の量子化パラメータQP(QP_precode1+1、QP_precode1−1)を使うプレエンコードの画面内予測処理の入力を、自分自身のローカルデコード(Local Decode)画ではなく、予測量子化パラメータQPd(QP_precode1)のローカルデコード(Local Decode)画で代用することを意味する。
このように、符号量制御部4は、第1のプレエンコード部1の結果に基づく低精度発生符号量の予測により、低精度発生符号量が目標符号量に最も近くなる可能性が極めて高い予測量子化パラメータQPd及びその前後の量子化パラメータQPによって本エンコードと同様の符号化によって高精度発生符号量を算出する。これにより、符号量制御部4は、予測量子化パラメータQPd及びその前後の量子化パラメータQPを用いた場合の高精度発生符号量をほぼ正確に算出することができる。さらに本発明は、狭い範囲内では量子化パラメータQPの変化に伴う高精度発生符号量の変動率がほぼ一定であることに着目した。符号量制御部4は、予測量子化パラメータQPd及びその前後の量子化パラメータQPにおける高精度発生符号量の変動率に基づいて、予測量子化パラメータQPdの近傍の量子化パラメータQPを用いたときの高精度発生符号量を算出する。これにより符号量制御部4は、予測量子化パラメータQPdの近傍の量子化パラメータQPについても、ほぼ正確に高精度発生符号量を算出することができる。
[1−4.本エンコード]
本エンコード部3は、第2のプレエンコード部2の結果に基づいて得られる基本量子化パラメータQPMB、並びに第1のプレエンコード部1の結果に基づいて得られる予測量子化行列Q Matrix、アクティビティグループ、画面内予測モード等を使用して本エンコードを行う。即ち、本エンコード部3は、ディレイバッファ6を介して遅延処理された入力画像91を受けると、画面内予測処理部31では第1のプレエンコード時に決定された画面内予測モードで、予測画像と入力画像91との差分画像データが計算される。DCT部32はDCT処理を行い、量子化部33はDCT係数の量子化を行う。量子化部33の出力(量子化係数)は逆量子化部37にも送られる。逆量子化部37は、量子化係数を逆量子化してDCT係数を再生する。そして、IDCT部36はDCT係数をIDCT変換し、予測画像を生成し、バッファ35に保存する。
こうして、前述したようなDCT部32によるDCT、量子化部33によるDCT係数の量子化を経て、エントロピー符号化部34によりエントロピー符号化がなされ、目標符号量とされた出力ストリーム92が出力される。
[1−5.まとめ]
このように、この実施の形態に係る画像符号化装置100では、第1のプレエンコード部1による第1のプレエンコードにおいて、複数の選択量子化パラメータQPlでエンコードした時の低精度発生符号量を粗く計算することにより、目標符号量になる予測量子化パラメータQPdを見積もる。
このとき、第1のプレエンコード部1は、任意の間隔の選択量子化パラメータQPlでエンコードした場合の発生符号量を計算するために、並列にエンコードを行うこととしている。
一般的には、並列にエンコードを行うためには、回路規模が非常に大きくなってしまうが、この実施の形態では、回路規模削減のために並列エンコードを実現しつつ、出来るだけ共通に処理を行うようにして問題を解消している。
即ち、より具体的に、第1のプレエンコード部1は、先に説明したように、量子化部14とエントロピー符号長計算部15のみ並列に設け、他の処理は共用する。また、逆量子化部、IDCT部、バッファを削減するために、予測画像として入力画像を用いて、画面内予測処理を行うこととしている。
一方、エントロピー符号化でCABACを用いる場合、高いビットレートでは、処理できない事である。即ち、第1のプレエンコード部1は、仮にエントロピー符号化でCABACを用いる場合、符号量予測のために、ある量子化パラメータQPで符号量計算を行おうとしたとき、その量子化パラメータQPでの符号量が大きい場合(すなわち量子化係数における各値が大きい場合)、発生符号量を予測することが出来ない。
CABACは1bit毎に確率計算を行ってデータを圧縮していくエントロピー符号化方式である。1bitずつ処理するということは、符号量が多くなると処理時間が長くなることを意味し、一定の時間内(例えば1フレームの時間)に処理が終了しなくなる。よって、第1のプレエンコード部1は、仮にエントロピー符号化でCABACを用いる場合、符号量が多い場合は、エントロピー符号化後の発生符号量を計算することができなくなり、高いビットレートにおいて発生符号量を予測することができないのである。
この点、第1の実施の形態において、第1のプレエンコード部1は、符号量計算にCAVLCを用いる。このように、第1のプレエンコード部1では、回路規模を削減し、処理を削減し、簡略化したプレエンコードを行うことで、低精度発生符号量を粗く見積もる。そして符号量制御部4は、目標符号量に近い低精度発生符号量を有する量子化パラメータQPを予測量子化パラメータQPdとして選択する。
第2のプレエンコード部2では、第1のプレエンコード部1による予測量子化パラメータQPdの推定が誤差を持っていることに鑑み、再度プレエンコードすることで、量子化パラメータQP推定の精度を上げる。即ち、第1のプレエンコード部1により大まかに見積もった予測量子化パラメータQPdの周辺の量子化パラメータQPで、再度プレエンコードすることにより高精度発生符号量を取得し、目標とする高精度発生符号量に一番近い量子化パラメータQPを再度求める。エントロピー符号長計算は、本エンコードと同じ方式(CABAC又はCAVLC)を用いる。
尚、画面内予測処理の入力(ローカルデコード画像)が異なる事による誤差は存在するが、量子化パラメータQPが略同じ値であり、エンコードによる歪も略同じ量であるので、無視できるものとする。
[1−6.処理手順]
以下、図3のフローチャートを参照して、本発明の一実施の形態に係る画像符号化装置100による符号化の処理手順RT1を詳細に説明する。この処理手順の一部または全部は、一実施の形態に係る画像符号化方法にも相当する。
先ず、アクティビティ計算部16は、MB毎にアクティビティを計算し、その値に応じてMBをアクティビティグループに分ける(ステップS1)。
続いて、画面内予測モード決定部11は、入力画像91に基づいて画面内予測モードを決定する(ステップS2)。この画面内予測モードは、第2のプレエンコード部2による第2のプレエンコード、本エンコード部3による本エンコードでも使用される。
次に画面内予測処理部12は、予測画像と入力画像との差分画像データを計算する。ここでの予測画像は、処理を削減するため入力画像91が用いられる。次いで、DCT部13は、整数精度DCTを行い、DCT係数を量子化部14に送出する(ステップS3)。
量子化部14は、任意の間隔の複数の選択量子化パラメータQPlをピクチャの平均量子化パラメータ(BaseQP)としてDCT係数値を量子化する。エントロピー符号長計算部15は、量子化係数を可変長符号化し、符号長計算を行うことで、選択量子化パラメータQPlごとの発生符号量を取得する(ステップS4)。この時、MBの量子化パラメータQPは、前述したようにアクティビティを考慮した値が与えられて、エンコードされる。即ち、前述したように、MBの量子化パラメータQPは、ピクチャの平均量子化パラメータ(BaseQP)に対して、アクティビティグループに依存したオフセットを加えることで求められる。
尚、適応的な量子化行列Q Matrix切り替え処理に対応させる場合には、上記の処理を量子化行列Q Matrix毎に行う。つまり、量子化行列Q Matrix毎に、離散的な(飛び飛びの)値の選択量子化パラメータQPlでプレエンコードを行って、1ピクチャ分の発生符号量を取得する。この時、量子化行列Q Matrix毎に量子化パラメータQPの取り得る範囲をカバーするように選択量子化パラメータQPlを選択する。
次に符号量制御部4が、第1のプレエンコード部1によって算出された発生符号量の補正処理を行い、低精度発生符号量を算出する。符号量制御部4は、プレエンコードを簡略化したことによる誤差の補正を行うと共に、補間処理により、選択量子化パラメータQPl以外の量子化パラメータQPに対応する低精度発生符号量を算出する(ステップS5)。
符号量制御部4は、各量子化行列Q Matrixに対し、ステップS5の処理を実行し、量子化行列Q Matrixごとの低精度発生符号量を算出する(ステップS6)。以上の処理で、必要となる全ての量子化パラメータQPに対する低精度発生符号量が求められるので、その中で目標符号量に最も近い低精度発生符号量を生成し得る量子化パラメータQPのうち、傾斜の最も小さい量子化行列Q Matrix予測量子化行列Q MatrixDとして選択する。さらに符号量制御部4は、予測量子化行列Q MatrixDに対応する目標符号量に最も近い低精度発生符号量を生成し得る量子化パラメータQPを予測量子化パラメータQPdとして選択する。(ステップS7)。また、上記の様に量子化行列Q Matrixを選択することで、取り得る量子化パラメータQPの範囲を限定することになり、第1のプレエンコード部1で低精度発生符号量を算出する際の選択量子化パラメータQPlの範囲を減らすことが可能になる。これが、第1のプレエンコード部1にて決定された予測量子化行列Q MatrixDと予測量子化パラメータQPdとなる。
続いて、第2のプレエンコード部2による発生符号量取得処理を行う(ステップS8〜S10)。この第2のプレエンコード部2の目的は、第1のプレエンコード部1による予測量子化パラメータQPdの推定が誤差を持っていることに鑑みて、再度プレエンコードすることで、基本量子化パラメータQPMB推定の精度を上げることにある。
即ち、第1のプレエンコード部1の結果により大まかに見積もった予測量子化パラメータQPdの周辺の量子化パラメータQPで、再度プレエンコードすることにより高精度発生符号量を取得し、目標符号量に一番近い量子化パラメータQPを再度求める。エントロピー符号長計算は、本エンコードと同じ方式(CABAC又はCAVLC)が用いられる。
具体的には、第1のプレエンコード部1の結果により決定された画面内予測モードを用いて画面内予測処理部21による画面内予測処理及びDCT部22によるDCTを行う(ステップS8)。第2のプレエンコード部2は、画面内予測で使用するローカルデコード画像(予測画像)として、第1のプレエンコード部1の結果により推定された予測量子化パラメータQPd(QP_precode1)で量子化したローカルデコード画像を共用する。
量子化に際しては、第1のプレエンコード部1の結果により決定された予測量子化パラメータQPd(QP_precode1)、量子化行列Q Matrix及びアクティビティグループ(Activity Group)が用いられる。量子化部23−1には予測量子化パラメータQPd(QP_precode1)が設定され、量子化部23−2には予測量子化パラメータQPdよりも「1」だけ小さい量子化パラメータQP(QP_precode1−1)が設定され、量子化部23−3には予測量子化パラメータQPdよりも「1」だけ大きい量子化パラメータ(QP_precode1+1)が設定される。
さらに、MBの量子化パラメータ(QP)には、アクティビティを考慮した値が与えられてエンコードされる。以上の第2のプレエンコードにより、1ピクチャの高精度発生符号量を取得することができる(ステップS9)。
続いて、符号量制御部4は、第2のプレエンコード部2に基づいて得られた高精度発生符号量から基本量子化パラメータQPMBを決定する(ステップS10)。
続いて、本エンコード部3が本エンコードを行う(ステップS11)。本エンコードでは、第2のプレエンコード部2の結果により決定されたピクチャの基本量子化パラメータQPMB、第1のプレエンコード部1の結果により決定された予測量子化行列Q MatrixD、Activity Groupを使用してエンコードを行う。こうして符号化に関わる一連の処理を終了する。
以下、図4のフローチャートを参照して、画像符号化装置100による符号化の処理手順RT1のステップS7において実行されるQ Matrix決定処理手順RT2について更に説明する。
この処理を開始すると、符号量制御部4は、先ずIdをId=0にイニシャライズした後(ステップS21)、Idの値の小さい量子化行列Q−Matrixから、低精度発生符号量が目標符号量に最も近い量子化パラメータ(QP)と、量子化行列Q−Matrixにおいて取り得る最大の量子化パラメータQP(QMatrixTheshold[Id])とを比較する(ステップS22)。そして、符号量制御部4は、Id番目の量子化行列Q−Matrixでの低精度発生符号量が目標符号量に最も近い量子化パラメータ(QP)がQMatrixTheshold[Id]より小さければ、現在の量子化行列Q−Matrixを予測量子化行列Q MatrixDに決定する。さらに符号量制御部4は、予測量子化行列Q MatrixDにおける低精度発生符号量が目標符号量に最も近い量子化パラメータ(QP)を予測量子化パラメータQPdに決定すると(ステップS23)、QMatrix決定処理手順RT2を終了する。
一方、ステップS22において、符号量制御部4は、Id番目の量子化行列Q−Matrixでの低精度発生符号量が目標符号量に最も近い量子化パラメータ(QP)がQMatrixTheshold[Id]以上であれば、Idをインクリメント(ステップS24)する。符号量制御部4は、Id=量子化行列Q−Matrixの総数よりも「1」小さい(NumOfQMatrixId−1)であるか否かを判断する(ステップS25)。そして、Id=NumOfQMatrixId−1でなければステップS22に戻り、次の量子化行列Q−Matrixをチェックする。一方、Id=NumOfQMatrixId−1であれば、一番急峻な傾斜を有する量子化行列Q−Matrix(IDがNumOfQMatrixIdの量子化行列Q−Matrix)が選択され(ステップS23)、Q Matrix決定処理手順RT2を終了する。
この図4のQ Matrix決定処理手順RT2により、符号量制御部4は、量子化行列Q−Matrix毎に、取り得る最大の量子化パラメータQPを設定して、傾斜の緩やかな量子化行列Q−Matrixから順に、低精度発生符号量が目標符号量に最も近いと推定された量子化パラメータQPに対応する低精度発生符号量が目標符号量に本当に近い値を示すか否かを判断する。そして、近い値であれば対応する量子化行列Q−Matrixを本エンコードで用いる予測量子化行列Q MatrixDとして決定することになる。
以上説明したように、本発明の一実施の形態では、ピクチャ単位の2回のプレエンコードを実施する。そして、画像符号化装置100は、効率向上のためには、処理量が増大し、それに起因してエンコードの回路規模が増大するとの問題を解消するために、回路一部共有化による部分的並列構成を採用する。これにより、プレエンコーダの構成を簡略化しつつ、該簡略化に伴う誤差を統計データで補正する。
従って、画像符号化装置100は、1ピクチャに与えられた目標符号量に、画面内Feed Back制御を行わずに本エンコードにおいて発生する本エンコード発生符号量を合わせ込むことが可能になる。これにより、画像符号化装置100は、Feed Backパラメータの不適切な初期値による弊害や、不適切な目標符号量配分など、Feed Back制御の問題を取り除くことが可能になる。その結果、画像符号化装置100は、目標符号量に本エンコード発生符号量を一致させ、視覚特性を考慮した符号量配分、つまり適切な量子化パラメータの決定が可能となる。
なお、本発明は前述した実施の形態に限定されるものではなく、その趣旨を逸脱しない範囲で種々の改良や変更が可能である。
たとえば、上記画像符号化装置100及び画像符号化方法は、該装置に実装されるコンピュータプログラム或いは該プログラムを記録した記録媒体、該方法を実施するコンピュータプログラム或いは該プログラムを記録した記録媒体としての実施も可能である。
[1−7.動作及び効果]
以上の構成によれば、画像処理装置としての画像符号化装置100は、入力画像91が簡易な処理により符号化されてなる簡易符号化データであるDCT係数を、量子化因子である量子化パラメータQPから離散的に選択された選択量子化パラメータQPlに基づいて入力画像である入力画像91を少なくとも量子化することにより入力画像91を符号化し、符号化による入力画像91の発生符号量を算出する。
画像符号化装置100は、符号化による入力画像の発生符号量における簡易な処理に応じて発生する誤差を補正し、低精度発生符号量を算出する。
画像符号化装置100は、選択量子化パラメータQPlに基づいて入力画像91が符号化されたときの低精度発生符号量に対する補間処理により、選択量子化パラメータQPl以外の量子化パラメータQPに基づいて入力画像91が符号化されたときの低精度発生符号量を算出する。
これにより、画像符号化装置100は、全ての量子化パラメータQPを符号化しなくても、当該全ての量子化パラメータQPに基づく低精度発生符号量を算出することができ、低精度発生符号量の算出を簡易にすると共に、算出回路を削減することができる。
画像符号化装置100は、選択量子化パラメータQPlに基づく符号化及び補間処理により算出された低精度発生符号量に基づいて、入力画像91を符号化したときの本エンコード発生符号量が目標符号量に最も近いと予測される量子化パラメータQPを基本量子化パラメータQPMBとして決定する。画像符号化装置100は、本エンコード部3により基本量子化パラメータQPMBに基づいて入力画像91を符号化(本エンコード)する。
これにより、画像符号化装置100は、簡易な処理により生成された低精度発生符号量に基づいて基本量子化パラメータQPMBを決定することができるため、基本量子化パラメータQPMBを決定するための処理を簡易化することができる。
画像符号化装置100は、基本量子化パラメータQPMBに対してアクティビティに応じたオフセットを付加した適応量子化パラメータQPtに基づいて入力画像91を符号化する。
これにより、画像符号化装置100は、画質に応じた適切な適応量子化パラメータQPtを用いて入力画像91を符号化できるため、出力ストリーム92における画質の低下を極力抑制できる。
画像符号化装置100は、量子化の際に使用する量子化行列Q Matrixが取り得る量子化パラメータQPの範囲内から選択された選択量子化パラメータQPlを使用する。
これにより、画像符号化装置100は、量子化パラメータQPの範囲を限定することができるため、選択量子化パラメータQPlの数を低減させて回路構成を簡易化できる。また、選択量子化パラメータQPlの間隔を小さく設定することができるため、低精度発生符号量の精度を向上させ得る。
画像符号化装置100は、以下のようにして選択量子化パラメータQPlに基づく符号化及び補間処理により算出された低精度発生符号量に基づいて、入力画像91を符号化したときの発生符号量が目標符号量に最も近いと予測される量子化パラメータQPを基本量子化パラメータQPMBとして決定する。すなわち、画像符号化装置100は、低精度発生符号量において、目標符号量に最も近い発生符号量に対応する量子化パラメータQPを予測量子化パラメータQPdとして選択する。画像符号化装置100は、選択された予測量子化パラメータQPd及び当該予測量子化パラメータQPdの近傍の量子化パラメータQPに基づいて入力画像91を符号化し、符号化による入力画像91の高精度発生符号量を算出する。画像符号化装置100は、予測量子化パラメータQPd及び当該予測量子化パラメータQPdの近傍の量子化パラメータQPのいずれかに基づいて入力画像91を符号化したときの高精度発生符号量が目標符号量に最も近い場合に、予測量子化パラメータQPd及び当該予測量子化パラメータQPdの近傍の量子化パラメータQPから、目標符号量に最も近い高精度発生符号量に対応する量子化パラメータQPを基本量子化パラメータQPMBとして選択する。
これにより、画像符号化装置100は、予測量子化パラメータQPd及びその近傍の量子化パラメータQPに基づく発生符号量を算出することができる。この予測量子化パラメータQPdは、目標符号量と最も近い本エンコード発生符号量を生成し得る基本量子化パラメータQPMBの近傍であると予測されるものである。このため、画像符号化装置100は、目標符号量と最も近い発生符号量を生成し得る量子化パラメータQPである可能性の高い予測量子化パラメータQPdに基づいて入力画像91を符号化し、その発生符号量を算出することができる。
画像符号化装置100は、傾斜の小さい量子化行列Q Matrixから順に使用して符号化による入力画像91の発生符号量を算出し、予測量子化パラメータQPdが使用された量子化行列Q Matrixの取り得る範囲内であった場合に、使用された量子化行列Q Matrixを本エンコード部3によって使用する予測量子化行列Q MatrixDに決定する。画像符号化装置100は、予測量子化パラメータQPdの直前及び直後の量子化パラメータQPを予測量子化パラメータQPdの近傍の量子化パラメータQPdとする。画像符号化装置100は、予測量子化パラメータQPd及び当該予測量子化パラメータQPdの近傍の量子化パラメータQPに基づいて入力画像91を符号化したときの高精度発生符号量の範囲内に、目標符号量が入る場合には、予測量子化パラメータQPd及び当該予測量子化パラメータQPdの近傍の量子化パラメータQPから、目標符号量に最も近い高精度発生符号量に対応する量子化パラメータQPを基本量子化パラメータQPMBとして選択する。
これにより、画像符号化装置100は、入力画像91を基本量子化パラメータQPMBによって実際に符号化したときの高精度発生符号量に基づいて基本量子化パラメータQPMBを決定できるため、基本量子化パラメータQPMBの検出精度を向上させ得る。
画像符号化装置100は、予測量子化パラメータQPd及び当該予測量子化パラメータQPdの近傍の量子化パラメータQPに基づいて入力画像91を符号化したときの発生符号量の範囲内に、目標符号量が入らない場合には、予測量子化パラメータQPd及び当該予測量子化パラメータQPdの近傍の量子化パラメータQPに基づいて入力画像91を符号化したときの高精度発生符号量から、量子化パラメータQPの変動に伴う高精度発生符号量の変動率DiffRatioを算出する。画像符号化装置100は、変動率算出部によって算出された変動率DiffRatioから、予測量子化パラメータQPd及び当該予測量子化パラメータQPdの近傍の量子化パラメータQP以外の量子化パラメータQPに基づいて入力画像91を符号化したときの高精度発生符号量を算出する。画像符号化装置100は、高精度発生符号量において、目標符号量に最も近い発生符号量に対応する量子化パラメータQPを基本量子化パラメータQPMBとして選択する。
これにより、画像符号化装置100は、量子化パラメータQPが近い範囲内においては高精度発生符号量の変動率DiffRatioがほぼ一定であるという性質を利用して、予測量子化パラメータQPdの周辺の量子化パラメータQPにおける高精度発生符号量を高い精度で算出することができる。
画像符号化装置100は、簡易的な処理により、簡易符号化による入力画像91の低精度発生符号量を算出する。これにより、画像符号化装置100は、第1のプレエンコード部1の構成を簡易にすることができる。
画像符号化装置100は、本エンコード部3と同等の処理により、第2のプレエンコード部2によって実行される符号化による入力画像91の高精度発生符号量を算出する。これにより、画像符号化装置100は、本エンコード発生符号量とほぼ同一の符号量を示す高精度発生符号量に基づいて基本量子化パラメータQPMBを決定できる。このため、画像符号化装置100は、基本量子化パラメータQPMBを用いて本符号化(本エンコード)したときの本エンコード発生符号量を目標符号量に近くできる。
画像符号化装置100は、本エンコード部3により基本量子化パラメータQPMBに基づいて入力画像91を本エンコードし、第1のエンコード部1により本エンコードと比して、簡易な処理により入力画像91を符号化する。
これにより、画像符号化装置100は、簡易な処理により粗く見積もられた低精度発生符号量に基づいて、まず基本量子化パラメータQPMBの近傍であると予測される予測量子化パラメータQPdを決定する。そして画像符号化装置100は、第2のプレエンコード部2により、予測量子化パラメータQPdに基づいて基本量子化パラメータQPMBを決定する。このため、画像符号化装置100は、簡易な構成により、高い精度で基本量子化パラメータQPMBを決定することができる。
画像符号化装置100は、本エンコード部3により量子化の前にローカルデコード画像を予測画像とする画面内予測を実行する。画像符号化装置100は、第1のプレエンコード部1により量子化の前に入力画像91を予測画像とする画面内予測を実行することにより、入力画像91の簡易符号化による低精度発生符号量を算出する。画像符号化装置100は、低精度発生符号量に対し、予測画像を入力画像91としたことに応じて発生する誤差を補正する。
画像符号化装置100は、予め統計によりモデル化された誤差情報を用いて予測画像を入力画像91としたことに応じて発生する誤差を補正することにより、低精度発生符号量を算出する。
この誤差情報は、量子化パラメータQP及び入力画像91の符号化による発生符号量の関数として定義されている。
これにより、画像符号化装置100は、誤差を適切に定義することができるため、CAVLC補正量を適切に算出して低精度発生符号量の精度を向上させ得る。
画像符号化装置100は、量子化パラメータQP及び入力画像91の符号化による低精度発生符号量を指標としてそれぞれモデル化された誤差情報を有し、より小さい誤差量を示す誤差情報からCAVLC補正量を決定する。
これにより、画像符号化装置100は、CAVLC補正量を不要に大きくしてしまうことを防止し、補正後の低精度発生符号量の精度を向上させ得る。
画像符号化装置100は、本エンコード部3による入力画像91の量子化の後に、可変長符号化又は算術符号化を入力画像91に応じて切り替えて実行する。画像符号化装置100は、第2のプレエンコード部2により可変長符号化を実行することにより、可変長符号化による入力画像91の発生符号量を算出し、本エンコード部3が入力画像91に対して算術符号化を実行する場合には、可変長符号化による入力画像91の発生符号量を補正することにより、算術符号化による入力画像91の低精度発生符号量を算出する。
これにより、画像符号化装置100は、算術符号化を実行することなく算術符号化による入力画像91の低精度発生符号量を予測することができるため、算術符号化のための複雑な回路を設けずに済む。
画像符号化装置100は、予め統計によりモデル化された誤差情報を用いて可変長符号化による入力画像91の発生符号量を補正し、算術符号化による入力画像91の低精度発生符号量を予測する。
これにより、画像符号化装置100は、比較的複雑な傾向を示す算術符号化による誤差を適切に定義することができるため、CABAC補正量を適切に算出して低精度発生符号量の精度を向上させ得る。
画像符号化装置200は、本エンコード部3によって量子化の前にローカルデコード画像を予測画像とする画面内予測を実行する。画像符号化装置200は、予測量子化パラメータQPd及び当該予測量子化パラメータQPdの近傍の量子化パラメータQPに基づいて入力画像91を符号化する際、予測量子化パラメータQPdに基づくローカルデコード画像を当該予測量子化パラメータQPdの近傍の量子化パラメータQPに対する予測画像とする。
これにより、画像符号化装置100は、予測量子化パラメータQPdに基づくローカル画像を当該予測量子化パラメータQPdの近傍の量子化パラメータQPと共用することができるため、回路構成を簡易にすることができる。
以上の構成によれば、図5のフローチャートに示すように、画像符号化装置100は、離散的に選択された選択量子化パラメータQPlを用いて簡易的な符号化により入力画像91を符号化して発生符号量を算出(ステップS31)し、当該発生符号量における簡易的な符号化によって発生する誤差を補正し(ステップS32)、低精度発生符号量を算出する。画像符号化装置100は、補正された発生符号量を補間することにより、選択量子化パラメータQPl以外の量子化パラメータQPについての低精度発生符号量を算出する(ステップS33)。
これにより、画像符号化装置100は、簡易的な符号化及び選択量子化パラメータQPlによる簡易な構成により、比較的精度の高い低精度発生符号量を算出することができる。
[2.第2の実施の形態]
図6〜図9に示す第2の実施の形態では、図1〜図5に示した第1の実施の形態と対応する箇所に同一符号を附して示し、同一部分についての説明を省略する。第2の実施の形態では、バックサーチを実行する前モード推定プレエンコード部40を有している点が第1の実施の形態と異なっている。
[2−1.バックサーチ]
本発明は、例えば画像符号化装置等に係り、特にダビング時の画質の劣化を防ぎ所望とする本エンコード発生符号量に制御する技術分野に関する。
従来、テレビジョン放送局間で映像データの伝送を行う際、或いは複数のビデオテープレコーダ(VTR装置)を用いて映像データの複写を行う際には、MPEG(Moving picture experts group)2方式で圧縮符号化した映像データを伸長復号し、再度、圧縮符号化することから、エンコーダとデコーダを直列にタンデム接続する必要がある。
そして、このようなタンデム接続時の圧縮符号化と伸長復号の繰り返しによる映像の品質劣化を低減する手法として所謂「バックサーチ」という手法が採用されている。
ここで、「バックサーチ」とは、以前の圧縮符号化で使用された量子化ステップ、或いは、その倍数関係にある量子化ステップを用いると、離散余弦変換(DCT;discrete cosine transfer)係数の剰余の総和が極小となるという性質を利用して、最小値に係る量子化ステップを最適な量子化ステップとして求める手法である。
この「バックサーチ」を用いた技術については、例えば特許文献1では、前回の圧縮符号化における量子化ステップをバックサーチ方式により再生し、前回と同じ量子化ステップおよびGOP(Group of pictures)位相で再び入力映像データを圧縮符号化し、エンコーダとデコーダをタンデム接続して映像データの圧縮符号化及び伸長復号を繰り返した場合の映像の品質の劣化を防止する映像データ圧縮装置が開示されている。
このMPEG2など、直交変換を用いた符号化方式において、ダビング時の劣化を防ぐ方法として、量子化ステップや、Interの予測画像(動きベクトル)を再現あるいは再利用する方法がある(例えば特許文献2参照)。
特開平10−174098号公報。
一方、H264(AVC;Advanced Video Coding;高度動画像圧縮符号化標準)Intra画像では、フレーム内予測(Intra予測)があり、ピクチャ単位の量子化行列Q Matrix、DCTブロック単位の画面内予測モードとマクロブロック単位の量子化ステップを再現することで、ダビング時の劣化を防ぐことができる。
[2−2.画像符号化装置の構成]
図6には、本発明の一実施の形態に係る画像符号化装置200の構成を示し説明する。
即ち、H/264/AVC(Advanced Video Coding;高度動画像圧縮符号化標準)に代表される算術符号化を用いた画像圧縮方式で、符号量制御を行う際に、ピクチャ内で良好な符号量分布を実現し、同時にダビング特性を向上させるために、第1のプレエンコード部1で求めたパラメータを用いて、第2のプレエンコード部2と前モード推定プレエンコード部40によるプレエンコードを並列に行い、ダビングモードでエンコードするか、原画モードでエンコードするかを決定する。
そして、この前モード推定プレエンコード部40では、第1のプレエンコード部1で求めた予測量子化行列Q MatrixDを用い、また第1のプレエンコード部1で求めた予測量子化パラメータQPdを起点として、上下の一定の範囲の量子化パラメータQPに対して推定処理を行い、前回の符号化に使用された量子化パラメータQPを求めることで、バックサーチ処理のサーチ範囲を限定し回路規模を削減する。
さらに、画像符号化装置200は、第2のプレエンコード部2と前モード推定プレエンコード部40による処理を並列に行うことにより、バックサーチ結果での符号量が条件を満たさない場合に対処できるようにする。これにより、画像符号化装置200は、量子化パラメータQPの推定範囲を符号量が増える方向にも取れる様にする。
そして、本エンコード部3では、原画モードかダビングモードであるかにより、エンコードに使うパラメータを切り替えて本エンコードを行う。
前モード推定プレエンコード部40は、前モードを推定するためのプレエンコードを行うモジュールであり、画面内予測処理部41、DCT部42、バックサーチ部43、バッファ44、量子化部45、エントロピー符号長計算部46を備えている。
符号量制御部4は、符号量制御を行うモジュールである。
尚、AVC Intraでは、復号の際に、一度符号化、復号化を通じた画像を再度復号化する際に、前回の符号化で使われた量子化パラメータQP及び画面内予測モードを使うと、前回の符号化で量子化歪みが既に落とされているので、それ以上、量子化歪みが生じにくいという性質がある。このように前回の符号化で使われた量子化パラメータQP及び画面内予測モードを検出することを、「バックサーチ」と称するものとする。
バックサーチ部43は、量子化パラメータQP検出機能、並びに画面内予測モードの検出機能を備える。バックサーチ部43は、量子化パラメータQP検出機能により、前回のエンコードの過程で得られるDCT係数に基づいて、前回のエンコードにおいて使われた量子化パラメータQPを検出する。以下、検出された量子化パラメータQPを検出量子化パラメータQPeと呼ぶ。具体的に、バックサーチ部43は、MB毎にDCT係数を複数の量子化パラメータQPによるリスケーリングファクターRFで除算したときの剰余を用いて、検出量子化パラメータQPeを検出する。そして、バックサーチ部43は、画面内予測モード検出機能により、検出された検出量子化パラメータQPeに基づいて前回の符号化に使用された画面内予測モードを検出する。この構成の詳細については、特許文献3に記載されている。なお本実施の形態においては、処理の軽減化のため、バックサーチとして検出量子化パラメータQPeと画面内予測モードの検出のみを実行し、量子化行列Q MatrixEの検出を実行しない。
国際出願番号PCT/JP2008/066917
エントロピー符号長計算部46は、本エンコード部3による本エンコードのエントロピー符号化と同じ方式をCABAC/CAVLCから選択する。前モード推定プレエンコード部40は、検出量子化パラメータQPe及び検出された画面内予測モードに基づいて、バックサーチ発生符号量を算出する。符号量制御部4は、こうして得られたバックサーチ発生符号量から、目標符号量を満たすかを判断することになる。
符号量制御部4は、第2のプレエンコード部2と前モード推定プレエンコード部40の結果から、原画モードでエンコードするか、ダビングモードでエンコードするかを決定し、最終的なエンコードのパラメータを決定する(詳しくは後述する)。符号量制御部4は、原画モード/ダビングモードの判定結果と、基本量子化パラメータQPMB、予測量子化行列Q MatrixD、及び画面内予測モード、並びに各MBのアクティビティグループ(以下、これらをまとめて本エンコード情報と呼ぶ)を本エンコード部3に渡す。この結果、本エンコード部3は、原画モード及びダビングモードのいずれかに移行し、当該原画モード及びダビングモードに応じた本エンコード情報を用いてエンコードを行う。
本エンコード部3は、ディレイバッファ6を介して遅延処理された入力画像91を受け取ると、第1のプレエンコード部1によって決定された画面内予測モードを用い、画面内予測処理部31によって予測画像と入力画像との差分画像データを生成する。DCT部32はDCT処理を行い、量子化部33はDCT係数の量子化を行う。量子化部33の出力は逆量子化部37にも送られる。逆量子化部37は、逆量子化してDCT係数を再生する。そして、IDCT部36はDCT係数をIDCT変換し、入力画像を再生し、バッファ35に保存する。こうして、前述したようなDCT部32によるDCT、量子化部33によるDCT係数の量子化を経て、エントロピー符号化部34によりエントロピー符号化がなされ、目標符号量とされた出力ストリーム92が出力される。
[2−3.非原画に対するモードの選択]
次に、原画モード/ダビングモードの判定処理について説明する。上述したように、バックサーチ部43によって、処理対象となるMBから検出量子化パラメータQPeが検出されている。このとき、入力画像91が原画あっても、偶発的にバックサーチが成功し、検出量子化パラメータQPeが検出される場合がある。逆に、入力画像91が非原画であっても、偶発的にバックサーチが不成功となり、検出量子化パラメータQPeが検出されない場合がある。
そこで、符号量制御部4は、バックサーチの成功率が閾値以上であるか否かにより、現在処理中の入力画像91におけるピクチャが原画であるか非原画であるかを判定する。
ここで、原則としてピクチャが非原画であるときに使用されるダビングモードでは、バックサーチが成功したMBに対しては検出量子化パラメータQPeを用いるのに対し、バックサーチが不成功のMBに対して基本量子化パラメータQPMB及びアクティビティによるオフセットを用いる。このとき、これらの組み合わせによっては、ピクチャのバックサーチ発生符号量が目標符号量を超えてしまう場合がある。このため、符号量制御部4は、ピクチャが非原画であると判定した場合には、ダビングモードにおけるバックサーチ発生符号量を算出し、バックサーチ発生符号量が目標符号量内に収まる場合には、ダビングモードを選択し、バックサーチ発生符号量が目標符号量内に収まらない場合には、原画モードを選択するようになされている。
具体的に、符号量制御部4は、バックサーチが成功したMB(以下、これを成功MBと呼ぶ)の発生符号量の和(GenBits_success)を算出する。成功MBでは、アクティビティを考慮することなく、検出量子化パラメータQPeをそのまま使用する。そのため符号量制御部4は、成功MBについて、前モード推定プレエンコード部40によって算出された発生符号量を使用し、発生符号量の和(GenBits_success)を算出する。
符号量制御部4は、バックサーチが不成功のMB(以下、これを不成功MBと呼ぶ)について、第2のプレエンコード部2において算出された高精度発生符号量に基づいて、基本量子化パラメータQPMBを用いたときの発生符号量の和(GenBits_not_success)を算出する。上述したように、第2のプレエンコード部2では、量子化パラメータQPが「1」だけ変化したときの変動率(Diffratio)、及び基本量子化パラメータQPMBを算出している。符号量制御部4は、発生符号量の和(GenBits_not_success)に対し、予測量子化パラメータQPeと基本量子化パラメータQMBとの差分値(Diff_QP)の回数だけ変動率(Diffratio)を乗算することにより、不成功MBについて基本量子化パラメータQPMBを用いたときの発生符号量(GenBits_not_success_rev)を算出する。すなわち、基本量子化パラメータQPMBが予測量子化パラメータQPdより大きい時、
Figure 2009157577
と求め、基本量子化パラメータQPMBが予測量子化バラメータQPdより小さい時、
Figure 2009157577
として求める。
符号量制御部4は、成功MBの発生符号量(GenBits_success)と不成功MBの発生符号量(GenBits_not_success_rev)を加算することにより、ダビングモードを使用した場合のピクチャのバックサーチ発生符号量(GenBits_rev)を次式のように算出する。
Figure 2009157577
次に、符号量制御部4は、ピクチャのバックサーチ発生符号量(GenBits_rev)が目標符号量内に収まるか否かについて判別する。
符号量制御部4は、次式に従い、ピクチャのバックサーチ発生符号量(GenBits_rev)と目標符号量(TargetBit)とを比較する。なおαは、符号量の揺れがどの程度まで許容されるかによって決定される加算符号量である。
GenBits_rev<=(TargetBits+α)
符号量制御部4は、ピクチャのバックサーチ発生符号量(GenBits_rev)が目標符号量内に収まる場合、ダビングモードを選択する。
一方、符号量制御部4は、ピクチャのバックサーチ発生符号量(GenBits_rev)が目標符号量内に収まらない場合、不成功MBの発生符号量(GenBits_not_success_rev)が計算によって算出されたことによる誤差によって目標符号量内に収まらない可能性があるため、この可能性について検証する。符号量制御部4は、成功MBの発生符号量(GenBits_success)と不成功MBの予測量子化パラメータQPdを用いたときの発生符号量(GenBits_not_success)とを加算したピクチャの修正前発生符号量(GenBits)と目標符号量(TargetBit)とを次式に従って比較する。
GenBits<=(TargetBits+α)
符号量制御部4は、ピクチャの修正前発生符号量(GenBits)が目標符号量(TargetBit)を超えている場合、計算によって算出されたことによる誤差がない状態であっても、発生符号量が目標符号量(TargetBit)を超えているため、原画モードを選択する。
なお、前モード推定プレエンコード部40は、画面内予測処理部41で予測画像として入力画像91を使用しているが、一度エンコードされた画に対して、同じパラメータでエンコードした場合、歪は乗らない。ゆえに、入力画像91とローカルデコード(Local Decode)画像は同じになり、符号量に誤差は乗らない。よって、検出率が高い場合、予測画像として入力画像91を用いたことによる誤差は非常に小さく無視できる。
このように、符号量制御部4は、ピクチャが非原画であった場合には、ダビングモードを使用した場合におけるピクチャのバックサーチ発生符号量を予測し、ピクチャのバックサーチ発生符号量が目標符号量に収まる場合には、ダビングモードを選択する。一方、符号量制御部4は、ピクチャのバックサーチ発生符号量が目標符号量に収まらない場合には、原画モードを選択するようになされている。
[2−4.本エンコード]
この時、本エンコード部3の画面内予測処理部31は、原画モードであれば、画面内予測モード決定部11で決定された画面内予測モードを処理対象となるMBに対して使用する。画面内予測処理部31は、ダビングモードであれば、処理対象となるMBごとに使用する画面内予測モードを変更する。すなわち画面内予測処理部31は、処理対象となるMBにおいてバックサーチが成功した場合には、バンクサーチ部43によって検出された画面内予測モードを使用する。画面内予測処理部31は、処理対象となるMBにおいてバックサーチが不成功であった場合には、第1のプレエンコード部1によって検出された第1位の画面内予測モードを使用する。
このとき、量子化部33は、処理対象となるMBごとに使用する量子化パラメータQPを変更する。すなわち画面内予測処理部31は、処理対象となるMBにおいてバックサーチが成功した場合には、バックサーチ部43によって検出された検出量子化パラメータQPeをそのまま使用する。画面内予測処理部31は、処理対象となるMBにおいてバックサーチが不成功であった場合には、第2のプレエンコード部2の結果に応じて決定された基本量子化パラメータQPMBを使用する。なお、基本量子化パラメータQPMBは、平均量子化パラメータ(QPBase)として用いられ、第1のプレエンコード部1によって決定されたアクティビティグループに応じたオフセットが付加される。量子化部33は、バックサーチの成功の有無に拘らず、量子化行列Q Matrixとして第1のプレエンコード部1によって決定された予測量子化行列Q MatrixDを用いる。
このように、画像符号化装置200は、原画モード/ダビングモード判定結果に基づいて原画モードに移行し、第2のプレエンコード部2の結果に応じて決定された基本量子化パラメータQPMBをピクチャの平均量子化パラメータ(QPBase)として用いる。一方、画像符号化装置200は、ダビングモードに移行すると、前モード推定プレエンコード部40によって検出された検出量子化パラメータQPeをそのまま用いるようになされている。
[2−5.処理手順]
以下、図7のフローチャートを参照して、本発明の一実施の形態に係る画像符号化装置による符号化処理手順RT10を詳細に説明する。この処理手順の一部または全部は、一実施の形態に係る画像符号化方法にも相当する。
尚、ステップS1〜S10については、図3と同様のため、説明を省略する。
画像処理装置200は、前モード推定プレエンコード部40による前モード推定プレエンコードを行う(ステップS41乃至S43)。この前モード推定プレエンコードにおいて、前モード推定プレエンコード部40は、前回の符号化パラメータ(量子化パラメータQP及び画面内予測モード)を推定し、推定された符号化パラメータで符号化した場合のバックサーチ発生符号量を取得する。
画像符号化装置200は、画面内予測処理部41によって予測画像と入力画像91との差分画像データを生成する。この時、画面内予測処理部41は、画面内予測モード決定部11で決定された第1候補から第M候補まで各々で差分画像データを計算する。画面内予測処理では、本来ローカルデコード(Local Decode)画像を使用して処理を行うが、ここでは入力画像91を用いて行う。
次に画像符号化装置200は、DCT部42によるDCT変換を行い、その出力を、バックサーチ部43、バッファ44に供給する(ステップS41)。続いて、前モード推定プレエンコード部40は、サブルーチンSRT20へ移り、前回のパラメータ推定処理を行う(ステップS42)。
続いて、画像符号化装置200は、量子化部45によって量子化を行い、エントロピー符号長計算部46によって符号量計算処理を行う(ステップS43)。
即ち、量子化部45は、バックサーチ部43から出力された画面内予測モードに応じて、バッファ44に格納されているデータから指定された画面内予測モードに該当するデータを選択し、量子化を行う。このとき、量子化部45は、バックサーチ部43から出力された検出量子化パラメータQPeに基づいて量子化を行う。その後、画像符号化装置200は、エントロピー符号長計算部46によってMBごとの発生符号量を計算する。エントロピー符号長計算は、本エンコードのエントロピー符号化と同じ方式(CABAC/CAVLC)で行われる。そして符号量制御部4は、バックサーチの成功の有無に応じて、ダビングモードを使用したときのピクチャのバックサーチ発生符号量を推定する。
次に、画像符号化装置200は、エンコードモード(原画モード/ダビングモード)判定を行う(ステップS44)。
画像符号化装置200は、本エンコード部3による本エンコードを行う(ステップS45)。この本エンコードでは、原画モードかダビングモードであるかにより、エンコードに使うパラメータを切り替えてエンコードを行う。
こうして画像符号化装置200は、符号化処理手順RT10の一連の処理を終了する。
以下、図8のフローチャートを参照して、符号化処理手順RT10のステップS42において実行される前モードの推定処理を説明する。
まず、第1のプレエンコード結果により算出された予測量子化パラメータQPd及び各MBのアクティビティグループから、推定の起点となる初期の量子化パラメータQPを設定する。(ステップS101)。
続いて、検出量子化パラメータQPeの推定処理を行う(ステップS102)。検出量子化パラメータQPeの推定処理は、ステップS101において設定された値に対して、一定の範囲の量子化パラメータQPに対して行われる。つまり、0〜51でなる量子化パラメータQPのうち、上限値(QP LowerQPRange)から下限値(QP UpperQPRange)の範囲の量子化パラメータQPに対して推定処理を行う。なお、この範囲は例えば「10」程度に設定される。
換言すれば、前モード推定プレエンコード部40は、第1のプレエンコード部1で求めた予測量子化行列Q MatrixDを用い、第1のプレエンコード部1の結果に基づいて算出された予測量子化パラメータQPdを起点として、所定の範囲の量子化パラメータQPに対して推定処理を行うことになる。
そして、バックサーチ部43は、検出量子化パラメータQPeの推定が成功したか否かを判断し(ステップS103)、推定が不成功の場合は、予測量子化パラメータQPdと画面内予測モード決定部11で決定された第1候補の画面内予測モードを出力する(ステップS104)。一方、バックサーチ部43は、推定が成功した場合は、推定された検出量子化パラメータQPeを出力し(ステップS105)、画面内予測モードの推定処理を行う(ステップS106)。
この画面内予測モードの推定処理は、第1候補から第M候補に対して行われる。バックサーチ部43は、画面内予測モードの推定が成功したか否かを判断し(ステップS107)、成功した場合は、推定された画面内予測モードを出力し(ステップS108)、不成功の場合は、画面内予測モード決定部11で決定された第1候補の画面内予測モードを出力する(ステップS109)。
バックサーチ部43は、画面内予測を行うブロック数を処理したか否かを判断し(ステップS110)、処理が完了していなければステップS106に戻り、上記処理を繰り返す。一方、バックサーチ部43は、処理が完了していると判断した場合には、符号化処理手順RT10のステップS42(図7)に戻る。
以下、図9のフローチャートを参照して、符号化処理手順RT10のステップS44において実行される原画モード/ダビングモードの判定処理にについて説明する。
この処理に入ると、先ず、符号量制御部4は、原画/非原画(符号化された画)の判定を行う(ステップS111)。即ち、符号量制御部4は、前回の符号化に使用された量子化パラメータQPの推定処理で検出量子化パラメータQPeが検出されたMBの数と、MB総数から、検出率を求め、この検出率が一定以上であるとき非原画と判定する。
ここで、符号量制御部4は、処理対象であるピクチャが原画であると判定した場合には(ステップS112をYesに分岐)、原画モードに決定し(ステップS117)、符号化処理手順RT10(図7)のステップS44に戻る。
一方、符号量制御部4は、処理対象であるピクチャが非原画であると判定した場合(ステップS112をNoに分岐)、ダビングモードで処理対象のピクチャを符号化した場合のバックサーチ発生符号量を予測する(ステップS113)。ここでは、符号量制御部4は、不成功MBについては、第2のプレエンコード部2の結果により求めた基本量子化パラメータQPMBを使った場合の符号量を予測する。符号量制御部4は、ビットレート(発生符号量)の条件を満たす場合には(ステップS115をYesに分岐)、本エンコード部3におけるエンコードモードをダビングモードに決定する(ステップS116)。一方、符号量制御部4は、ビットレートの条件を満たさない場合、本エンコード部3におけるエンコードモードを原画モードとし(ステップS117)、符号化処理手順RT10(図7)のステップS44に戻る。
[2−6.まとめ]
以上のように、画像符号化装置200において、前モード推定プレエンコード部40による処理は、第2のプレエンコード部2によるプレエンコード処理と並列に実行される。このように、画像符号化装置200は、第2のプレエンコード部2及び前モード推定プレエンコード部40による処理を並列に実行する。画像符号化装置200は、検出量子化パラメータQPeの推定を、第1のプレエンコード部1で決定された予測量子化パラメータQPdより小さい方向(符号量が増える方向)にも行うことが可能になり、推定による検出率を上げることができる。つまり、アクティビティグループの前回のエンコードからの変化で、MBの量子化パラメータQPが変化したことへの対応が十分に行えるようになる。
また、画像符号化装置200は、第2のプレエンコード部2の処理と前モード推定プレエンコード部40の処理を並列に行うことで、バックサーチ結果でのバックサーチ発生符号量が条件を満たさない場合に対処できる。この結果、画像符号化装置200は、検出量子化パラメータQPeの推定範囲を符号量が増える方向にも取れる様にでき、バックサーチの検出率を向上させ得る。
そして、画像符号化装置200は、前モード推定プレエンコード部40における画面内予測処理において、予測画像として入力画像91を用いることで、構成を簡易にすると共に、バックサーチの検出率を向上させる。また、画像符号化装置200は、パラメータ推定処理に量子化とエントロピー符号長計算のみを追加することで発生符号量の計算を実現し、回路規模を削減することを可能としている。
[2−7.動作及び効果]
以上の構成によれば、画像符号化装置200は、入力画像91を少なくとも量子化パラメータQPに基づいて量子化することにより、第1のプレエンコード部1によって入力画像91を簡易符号化し、簡易符号化による入力画像91の低精度発生符号量を算出する。画像符号化装置200は、簡易符号化によって算出された低精度発生符号量に基づいて、本エンコード部3によって入力画像91を符号化したときの本エンコード発生符号量が目標符号量に最も近いと予測される量子化パラメータQPを基本量子化パラメータQPMBとして決定する。画像符号化装置200は、量子化パラメータQPに基づくリスケーリングファクタRFにより入力画像91を除算したときの剰余に基づいて、入力画像91が前回符号化されたときに使用された量子化パラメータQPを符号化単位であるMBごとに検出する。画像符号化装置200は、検出された検出量子化パラメータQPeに基づいて入力画像91を符号化し、MBごとの発生符号量を算出する。画像符号化装置200は、検出量子化パラメータQPeが検出されなかったMBについての基本量子化パラメータQPMBに基づく発生符号量GenBits_not_success_revと、検出量子化パラメータQPeが検出されたMBについての発生符号量GenBits_successとを加算することにより、複数のMBから構成される制御単位であるピクチャごとの発生符号量を算出する。
これにより、画像符号化装置200は、バックサーチ処理の結果に応じて本エンコードを実行した場合のピクチャごとの発生符号量GenBits_revを予測することができる。
画像符号化装置200は、第2のプレエンコード部2及び前モード推定エンコード部40を同時並行して処理させることにより、MBごとの発生符号量を算出する。
これにより、画像符号化装置200は、入力画像91が非原画であった場合であっても、基本量子化パラメータQPMBに基づく発生符号量を算出できる。このため、画像符号化装置200は、バックサーチが不成功のMBに対して基本量子化パラメータQPMBに基づく発生符号量を用いることができ、ダビングモードにおけるピクチャごとの発生符号量GenBits_revを予測することができる。
画像符号化装置200は、検出量子化パラメータQPeの検出率に基づいて、入力画像が原画であるか非原画であるかを判定する。画像符号化装置200は、入力画像91が非原画であると判定され、かつピクチャ単位ごとの発生符号量GenBits_revが目標符号量に基づく許容値(TargetBits+α)に収まる場合、検出量子化パラメータQPeが検出されたMBについては、検出量子化パラメータQPeを本エンコードで使用する量子化パラメータQP(本エンコード量子化因子)とし、検出量子化パラメータQPeが検出されなかったMBについては、基本量子化パラメータQPMBを本エンコードで使用する量子化パラメータQPとする。
これにより、画像符号化装置200は、検出量子化パラメータQPeを用いて本エンコードする場合に、本エンコード発生符号量を確実に目標符号量に基づく許容値内に収めることができる。なお、画像符号化装置200は、画質の劣化を極力抑制するため、発生符号量の若干の超過があった場合でも、許容値(TargetBits+α)以内であればダビングモードを使用することにしている。
画像符号化装置200は、入力画像91が原画であると判定された場合には、基本量子化パラメータQPMBを本エンコードで使用する量子化パラメータQPとする。この許容値(TargetBits+α)は、目標符号量TargetBitsに対し、許容されるぶれ量αを加算した値でなる。
これにより、画像符号化装置200は、原画に対して、基本量子化パラメータQPMBを用いて本エンコードをすることができ、本エンコード発生符号量を目標符号量に抑制することができる。
画像符号化装置200は、基本量子化パラメータQPMB又はその近傍であると予測される予測量子化パラメータQPd及び当該予測量子化パラメータQPdの近傍の量子化パラメータQPに基づいて入力画像91を符号化し、符号化による入力画像91の高精度発生符号量を算出する。画像符号化装置200は、予測量子化パラメータQPd及び当該予測量子化パラメータQPdの近傍の量子化パラメータQPに基づいて入力画像91を符号化したときの高精度発生符号量から、量子化パラメータQPの変動に伴う発生符号量の変動率DiffRatioを算出する。画像符号化装置200は、予測量子化パラメータQPdに基づくMBごとの高精度発生符号量に対し、基本量子化パラメータQPMBの予測量子化パラメータQPdからの差分値と同一回数(Diff_QP)だけ変動率DiffRatioに1を加算した変動乗数((1.0+DiffRatio))を乗算する。
これにより、画像符号化装置200は、予測量子化パラメータQPd及び当該予測量子化パラメータQPdの近傍の量子化パラメータQPに基づいて基本量子化パラメータQPMBに基づく高精度発生符号量を算出することができ、構成を簡易にすることができる。
以上の構成によれば、画像符号化装置200は、検出量子化パラメータQPeが検出されたMBについては検出量子化パラメータQPeを用いたときの発生符号量を用い、検出量子化パラメータQPeが検出されなかったMBについては基本量子化パラメータQPMBを用いた発生符号量を用いることにより、ダビングモードにおけるピクチャごとのバックサーチ発生符号量を算出するようにした。
これにより、画像符号化装置200は、ダビングモードにおけるバックサーチ発生符号量を予め予測し得るようになされている。
[3.他の実施の形態]
なお上述した第1及び第2の実施の形態においては、選択量子化パラメータQPlが15だけ選択されるようにした場合について述べた。本発明はこれに限らず、その数に制限はない。また、量子化行列Q Matrixに応じて選択量子化パラメータQPlの数を変更したり、選択される間隔を変更したりしても良い。また、選択量子化パラメータQPlの間隔を任意に変更することも可能である。
また上述した第1及び第2の実施の形態においては、第1のプレコード部1において予測画像として入力画像91が用いられるようにした場合について述べた。本発明はこれに限らず、ローカルデコード画像が用いられるようにしても良い。
さらに上述した第1及び第2の実施の形態においては、第1のプレコード部1のエントロピー符号化としてCAVLCのみが実行されるようにした場合について述べた。本発明はこれに限らず、CAVLCとCABACの両方が実行されるようにしても良い。
さらに上述した第1及び第2の実施の形態においては、低精度発生符号量に基づいて予測量子化パラメータQPdが選択され、さらに当該予測量子化パラメータQPdに基づいて基本量子化パラメータQPMBが選択されるようにした場合について述べた。本発明はこれに限らず、例えば低精度発生符号量に基づいて直接基本量子化パラメータQPMBが選択されるようにしても良い。
さらに上述した第1及び第2の実施の形態においては、ピクチャごとの発生符号量を目標符号量内に抑えるようにした場合について述べた。本発明はこれに限らず、例えばスライスごとの発生符号量を目標符号量内に抑えるようにしても良い。
さらに上述した第1及び第2の実施の形態においては、符号量制御として、ピクチャごとの発生符号量を目標符号量内に抑えるようにした場合について述べた。本発明はこれに限らず、例えば複数のピクチャごとの平均発生符号量を目標符号量内に抑えるようにしても良い。
さらに上述した第1及び第2の実施の形態においては、選択量子化パラメータQPlが量子化行列Q Matrixの取り得る範囲から選択されるようにした場合について述べた。本発明はこれに限らず、量子化行列Q Matrixに拘らず一律的に選択量子化パラメータQPlが選択されるようにしても良い。
さらに上述した第1及び第2の実施の形態においては、傾斜の低い量子化行列Q Matrixから順に使用して符号化し、予測量子化行列Q MatrixDを決定するようにした場合について述べた。本発明はこれに限らず、例えば傾斜の大きい量子化行列Q Matrixから順に使用して符号化し、全て符号化し終えた後に予測量子化行列Q MatrixDを選択するようにしても良い。
さらに上述した第1及び第2の実施の形態においては、第2のプレエンコード部40において予測量子化パラメータQPdの近傍の量子化パラメータQPとして、当該予測量子化パラメータQPの前後の値を用いるようにした場合について述べた。本発明はこれに限らず、例えば2つ飛びの値を近傍の量子化パラメータQPとしても良い。この近傍の量子化パラメータQPは、例えば量子化パラメータQPの値に応じた変動率の変化に応じて適宜選択されても良い。
さらに上述した第1及び第2の実施の形態においては、第2のプレエンコード部2において、予測量子化パラメータQPd及び予測量子化パラメータQPdの近傍の量子化パラメータQPにおける高精度発生符号量の変動率に基づいて他の量子化パラメータQPによる高精度発生符号量を算出するようにした場合について述べた。本発明はこれに限らず、例えば近傍の量子化パラメータQPの数を増大させて逐次符号化することにより、高精度発生符号量を算出するようにしても良い。
さらに上述した第1及び第2の実施の形態においては、第2のプレエンコード部において、予測量子化パラメータQPdのローカルデコード画像を予測量子化パラメータQPdの近傍の量子化パラメータQPとして共用するようにした場合について述べた。本発明はこれに限らず、それぞれについてローカルデコード画像を生成するようにしても良い。
さらに上述した第1及び第2の実施の形態においては、ビットレート及び量子化パラメータQPについての誤差情報をそれぞれ有し、小さい値を有する誤差情報から誤差量を選択するようにした場合について述べた。本発明はこれに限らず、例えばビットレート及び量子化パラメータQPのいずれかに対応する誤差情報から誤差量を選択したり、ビットレート及び量子化パラメータQPの双方に対応する一つの誤差情報から誤差量を選択するようにしても良い。
さらに上述した第1及び第2の実施の形態においては、CAVLCについて補正した低精度発生符号量を補正することによりCABACについての低精度発生符号量を算出するようにした場合について述べた。本発明はこれに限らず、CAVLCについて補正前の発生符号量からCABACについての低精度発生符号量を算出するようにしても良い。
さらに上述した第2の実施の形態においては、バックサーチにより符号化単位としてMBごとに量子化パラメータQPを検出するようにした場合について述べた。本発明はこれに限らず、符号化単位として、量子化パラメータQPが設定される単位ごとであれば良く、そのサイズに制限はない。
さらに上述した第2の実施の形態においては、ダビングモードにおいて、不成功MBについて基本量子化パラメータQPMBに応じた発生符号量を用いるようにした場合について述べた。本発明はこれに限らず、さらにアクティビティを付加し、適応量子化パラメータQPtに応じた発生符号量を用いるようにしても良い。
さらに上述した第2の実施の形態においては、画質の劣化防止を優先し、バックサーチ発生符号量が許容されるぶれ量を加算した許容値以下の場合にダビングモードへ移行するようにした場合について述べた。本発明はこれに限らず、発生符号量の制御を優先し、バックサーチ発生符号量が目標符号量以下の場合にダビングモードに移行するようにしても良い。
さらに、上述した第1及び第2の実施の形態においては、AVCに本発明を適用するようにした場合について述べた。本発明はこれに限らず、適応的にVLCテーブルを選択する種々の符号化方式に本発明を適用することが可能である。
さらに上述した第1の実施の形態においては、選択発生符号量算出部としての第1のプレエンコード部1と、誤差補正部及び補間発生符号量算出部としての符号量制御部4とによって画像処理装置としての画像符号化装置100を構成するようにした場合について述べた。本発明はこれに限らず、その他種々の構成による選択発生符号量算出部と、誤差補正部と、補間発生符号量算出部とによって本発明の画像処理装置を構成するようにしても良い。
さらに上述した第2の実施の形態においては、簡易発生符号量算出部としての第1のプレエンコード部1と、基本量子化因子決定部としての第2のプレエンコード部2及び符号量制御部4と、バックサーチ部としてのバックサーチ部43と、検出発生符号量算出部としての量子化部45と、制御単位発生符号量算出部としての符号量制御部4とによって画像処理装置としての画像符号化装置200を構成するようにした場合について述べた。本発明はこれに限らず、その他種々の構成でなる簡易発生符号量算出部と、基本量子化因子決定部と、バックサーチ部と、検出発生符号量算出部と、制御単位発生符号量算出部とによって本発明の画像処理装置を構成するようにしても良い。

Claims (20)

  1. 入力画像が簡易な処理により簡易符号化されてなる簡易符号化データを、量子化因子から離散的に選択された選択量子化因子に基づく量子化ステップを用いて少なくとも量子化することにより上記入力画像を符号化し、符号化による上記入力画像の発生符号量を算出する選択発生符号量算出部と、
    上記符号化による上記入力画像の発生符号量における上記簡易な処理に応じて発生する誤差を補正する誤差補正部と、
    上記選択量子化因子に基づいて上記入力画像が符号化されたときの発生符号量に対する補間処理により、選択量子化パラメータ以外の量子化パラメータに基づいて上記入力画像が符号化されたときの発生符号量を算出する補間発生符号量算出部と
    を有する画像処理装置。
  2. 上記選択発生符号量算出部及び上記補間発生符号量算出部によって算出された上記発生符号量に基づいて、上記入力画像を符号化したときの発生符号量が目標符号量に最も近いと予測される量子化因子を基本量子化因子として決定する基本量子化因子決定部と、
    上記基本量子化因子決定部によって決定された基本量子化因子に基づいて入力画像を符号化する本符号化部と
    をさらに有する請求項1に記載の画像処理装置。
  3. 上記選択発生符号量算出部は、
    量子化の際に使用する量子化行列が取り得る量子化因子の範囲内から選択された上記選択量子化因子を使用する
    請求項2に記載の画像処理装置。
  4. 上記選択発生符号量算出部及び上記補間発生符号量算出部によって算出された上記発生符号量において、目標符号量に最も近い発生符号量に対応する量子化因子を予測量子化因子として選択する予測量子化因子選択部
    をさらに有し、
    上記基本量子化因子決定部は、
    上記予測量子化因子選択部によって選択された上記予測量子化因子及び当該予測量子化因子の近傍の量子化因子に基づいて上記入力画像を符号化し、符号化による上記入力画像の発生符号量を算出する近傍発生符号量算出部と、
    上記予測量子化因子及び当該予測量子化因子の近傍の量子化因子のいずれかに基づいて上記入力画像を符号化したときの発生符号量が上記目標符号量に最も近い場合に、上記予測量子化因子及び当該予測量子化因子の近傍の量子化因子から、目標符号量に最も近い発生符号量に対応する量子化因子を上記基本量子化因子として選択する選択部とを有する
    請求項4に記載の画像処理装置。
  5. 上記選択発生符号量算出部は、
    上記傾斜の小さい量子化行列から順に使用して符号化による上記入力画像の発生符号量を算出し、上記予測量子化因子が使用した量子化行列の取り得る範囲内であった場合に、上記使用した量子化行列を本符号化部によって使用する量子化行列に決定する
    請求項4に記載の画像処理装置。
  6. 上記近傍発生符号量算出部は、
    当該予測量子化因子の直前及び直後の量子化因子を上記予測量子化因子の近傍の量子化因子とし、
    上記選択部は、
    上記予測量子化因子及び当該予測量子化因子の近傍の量子化因子に基づいて上記入力画像を符号化したときの発生符号量の範囲内に、上記目標符号量が入る場合には、上記予測量子化因子及び当該予測量子化因子の近傍の量子化因子から、目標符号量に最も近い発生符号量に対応する量子化因子を上記基本量子化因子として選択する
    請求項5に記載の画像処理装置。
  7. 上記基本量子化因子決定部は、
    上記予測量子化因子及び当該予測量子化因子の近傍の量子化因子に基づいて上記入力画像を符号化したときの発生符号量の範囲内に、上記目標符号量が入らない場合には、上記予測量子化因子及び当該予測量子化因子の近傍の量子化因子に基づいて上記入力画像を符号化したときの発生符号量から、量子化因子の変動に伴う発生符号量の変動率を算出する変動率算出部と、
    上記変動率算出部によって算出された上記変動率から、上記予測量子化因子及び当該予測量子化因子の近傍の量子化因子以外の量子化因子に基づいて上記入力画像を符号化したときの発生符号量を算出する変動発生符号量算出部とをさらに有し、 上記選択部は、
    変動発生符号量算出部によって算出された発生符号量において、上記目標符号量に最も近い発生符号量に対応する量子化因子を上記基本量子化因子として選択する
    請求項4に記載の画像処理装置。
  8. 上記基本量子化因子決定部によって決定された基本量子化因子に基づいて入力画像を符号化する本符号化部をさらに有し、
    上記選択発生符号量算出部は、
    上記本符号化部と比して、簡易な処理により入力画像を簡易符号化する
    請求項1に記載の画像処理装置。
  9. 上記本符号化部は、
    量子化の前にローカルデコード画像を予測画像とする画面内予測を実行し、
    上記選択発生符号量算出部は、
    量子化の前に入力画像を上記予測画像とする画面内予測を実行することにより、上記入力画像の符号化による発生符号量を算出し、当該発生符号量に対し、上記予測画像を入力画像としたことに応じて発生する誤差を補正する
    請求項8に記載の画像処理装置。
  10. 上記選択発生符号量算出部は、
    予め統計によりモデル化された誤差情報を用いて上記予測画像を入力画像としたことに応じて発生する誤差を補正する
    を有する請求項9に記載の画像処理装置。
  11. 上記誤差情報は、
    上記量子化因子及び上記入力画像の符号化による発生符号量の関数として定義されている
    請求項10に記載の画像処理装置。
  12. 上記選択発生符号量算出部は、
    上記量子化因子及び上記入力画像の符号化による発生符号量を指標としてそれぞれモデル化された誤差情報を有し、より小さい誤差量を示す誤差情報から補正量を決定する
    請求項11に記載の画像処理装置。
  13. 上記本符号化部は、
    上記入力画像の量子化の後に、可変長符号化又は算術符号化を入力画像に応じて切り替えて実行し、
    上記選択発生符号量算出部は、
    上記簡易符号化データの量子化の後に、上記可変長符号化を実行することにより、上記可変長符号化による上記入力画像の発生符号量を算出し、上記本符号化部が上記入力画像に対して上記算術符号化を実行する場合には、上記可変長符号化による上記入力画像の発生符号量を補正することにより、上記算術符号化による上記入力画像の発生符号量を算出する
    請求項8に記載の画像処理装置。
  14. 上記本符号化部は、
    量子化の前にローカルデコード画像を予測画像とする画面内予測を実行し、
    上記基本量子化因子決定部は、
    近傍発生符号量算出部は、
    上記予測量子化因子選択部によって選択された上記予測量子化因子及び当該予測量子化因子の近傍の量子化因子に基づいて上記入力画像を符号化する際、上記予測量子化因子に基づくローカルデコード画像を当該予測量子化因子の近傍の量子化因子に対する予測画像とする
    請求項4に記載の画像処理装置。
  15. 入力画像を少なくとも量子化因子に基づいて量子化することにより上記入力画像を簡易符号化し、簡易符号化による上記入力画像の発生符号量を算出する簡易発生符号量算出部と、
    上記簡易発生符号量算出部によって算出された上記発生符号量に基づいて、上記入力画像を符号化したときの発生符号量が目標符号量に最も近いと予測される量子化因子を基本量子化因子として決定する基本量子化因子決定部と、
    上記量子化因子に基づくリスケーリングファクタにより上記入力画像を除算したときの剰余に基づいて、上記入力画像が前回符号化されたときに使用された量子化因子を検出量子化因子として符号化単位ごとに検出するバックサーチ部と、
    上記バックサーチ部によって検出された検出量子化因子に基づいて上記入力画像を符号化し、上記符号化単位ごとの発生符号量を算出する検出発生符号量算出部と、
    上記バックサーチ部によって上記検出量子化因子が検出されなかった上記符号化単位についての上記基本量子化因子に基づく発生符号量と、上記バックサーチ部によって上記量子化因子が検出された上記符号化単位についての上記検出発生符号量算出部によって算出された発生符号量とを加算することにより、複数の符号化単位から構成される制御単位ごとの発生符号量を算出する制御単位発生符号量算出部と
    を有する画像処理装置。
  16. 上記基本発生符号量算出部及び上記検出発生符号量算出部は、
    同時並行して上記符号化単位ごとの発生符号量を算出する
    を有する請求項15に記載の画像処理装置。
  17. 上記バックサーチ部による上記量子化因子の検出率に基づいて、上記入力画像が原画であるか非原画であるかを判定する判定部と
    本エンコード量子化因子に基づいて入力画像を符号化する本符号化部とをさらに有し、
    上記符号量単位発生符号量算出部は、
    上記判定部により上記入力画像が非原画であると判定され、かつ上記制御単位発生符号量算出部によって算出された制御単位ごとの発生符号量が目標符号量に基づく許容値に収まる場合、上記バックサーチ部によって上記量子化因子が検出された上記符号化単位については、上記バックサーチ部によって検出された検出量子化因子を本エンコード量子化因子とし、上記バックサーチ部によって上記量子化因子が検出されなかった上記符号化単位については、上記基本量子化因子決定部によって決定された基本量子化因子を上記本エンコード量子化因子とする
    請求項16に記載の画像処理装置。
  18. 上記符号量単位発生符号量算出部は、
    上記判定部により上記入力画像が原画であると判定された場合には、上記基本量子化因子決定部によって決定された基本量子化因子を上記本エンコード量子化因子とする
    請求項17に記載の画像処理装置。
  19. 上記基本量子化因子決定部は、
    基本量子化因子又はその近傍であると予測される予測量子化因子及び当該予測量子化因子の近傍の量子化因子に基づいて上記入力画像を符号化し、符号化による上記入力画像の発生符号量を算出する近傍発生符号量算出部と、
    上記予測量子化因子及び当該予測量子化因子の近傍の量子化因子に基づいて上記入力画像を符号化したときの発生符号量から、量子化因子の変動に伴う発生符号量の変動率を算出する変動率算出部とを有し、
    上記制御単位発生符号量算出部は、上記予測量子化因子に基づく量子化単位ごとの発生符号量に対し、上記基本量子化因子の上記予測量子化因子からの差分値と同一回数だけ上記変動率に1を加算した変動乗数を乗算する
    請求項16に記載の画像処理装置。
  20. 入力画像が簡易な処理により簡易符号化されてなる簡易符号化データを、量子化因子から離散的に選択された選択量子化因子に基づく量子化ステップを用いて少なくとも量子化することにより上記入力画像を符号化し、符号化による上記入力画像の発生符号量を算出する選択発生符号量算出ステップと、
    上記符号化による上記入力画像の発生符号量における上記簡易な処理に応じて発生する誤差を補正する誤差補正ステップと、
    上記選択量子化因子に基づいて上記入力画像が符号化されたときの発生符号量に対する補間処理により、選択量子化パラメータ以外の量子化パラメータに基づいて上記入力画像が符号化されたときの発生符号量を算出する補間発生符号量算出ステップと
    を有する画像処理方法。
JP2010518087A 2008-06-27 2009-06-23 画像処理装置及び画像処理方法 Expired - Fee Related JP5472105B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2010518087A JP5472105B2 (ja) 2008-06-27 2009-06-23 画像処理装置及び画像処理方法

Applications Claiming Priority (6)

Application Number Priority Date Filing Date Title
JP2008169393 2008-06-27
JP2008169393 2008-06-27
JP2008169391 2008-06-27
JP2008169391 2008-06-27
PCT/JP2009/061800 WO2009157577A1 (ja) 2008-06-27 2009-06-23 画像処理装置及び画像処理方法
JP2010518087A JP5472105B2 (ja) 2008-06-27 2009-06-23 画像処理装置及び画像処理方法

Publications (2)

Publication Number Publication Date
JPWO2009157577A1 true JPWO2009157577A1 (ja) 2011-12-15
JP5472105B2 JP5472105B2 (ja) 2014-04-16

Family

ID=41444636

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010518087A Expired - Fee Related JP5472105B2 (ja) 2008-06-27 2009-06-23 画像処理装置及び画像処理方法

Country Status (7)

Country Link
US (1) US8270744B2 (ja)
EP (1) EP2192785B1 (ja)
JP (1) JP5472105B2 (ja)
CN (1) CN101779469A (ja)
BR (1) BRPI0904323A2 (ja)
RU (1) RU2502213C2 (ja)
WO (1) WO2009157577A1 (ja)

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4569840B2 (ja) * 2007-09-12 2010-10-27 ソニー株式会社 画像符号化装置、画像符号化方法
BRPI0904324A2 (pt) * 2008-06-27 2015-06-30 Sony Corp Dispositivo de processamento de imagem, e, método de processamento de imagem
JPWO2009157581A1 (ja) * 2008-06-27 2011-12-15 ソニー株式会社 画像処理装置及び画像処理方法
WO2009157577A1 (ja) 2008-06-27 2009-12-30 ソニー株式会社 画像処理装置及び画像処理方法
BRPI0904320A2 (pt) * 2008-06-27 2015-06-30 Sony Corp Dispositivo e método de processamento de imagem
JP5340289B2 (ja) * 2008-11-10 2013-11-13 パナソニック株式会社 画像復号装置、画像復号方法、集積回路及びプログラム
JP5257215B2 (ja) * 2009-04-16 2013-08-07 ソニー株式会社 画像符号化装置と画像符号化方法
CA2820014C (en) 2010-12-17 2016-09-27 Mitsubishi Electric Corporation Image coding device, image decoding device, image coding method, and image decoding method
ES2883132T3 (es) * 2011-01-13 2021-12-07 Canon Kk Aparato de codificación de imagen, procedimiento de codificación de imagen y programa, y aparato de decodificación de imagen, procedimiento de decodificación de imagen y programa
JP6056122B2 (ja) 2011-01-24 2017-01-11 ソニー株式会社 画像符号化装置と画像復号装置およびその方法とプログラム
US9832460B2 (en) * 2011-03-09 2017-11-28 Canon Kabushiki Kaisha Image coding apparatus, method for coding image, program therefor, image decoding apparatus, method for decoding image, and program therefor
JP5762243B2 (ja) * 2011-10-18 2015-08-12 日本電信電話株式会社 映像符号化方法,装置,映像復号方法,装置およびそれらのプログラム
IN2015DN00926A (ja) * 2012-02-29 2015-07-10 Sony Corp
JP5900163B2 (ja) * 2012-05-30 2016-04-06 ソニー株式会社 画像処理装置、画像処理方法およびプログラム
CN110852421B (zh) * 2019-11-11 2023-01-17 北京百度网讯科技有限公司 模型生成方法和装置
CN111240640B (zh) * 2020-01-21 2022-05-10 苏州浪潮智能科技有限公司 基于硬件环境的数据量化方法、装置及可读存储介质

Family Cites Families (64)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3085465B2 (ja) * 1989-10-31 2000-09-11 オリンパス光学工業株式会社 画像データの符号化装置および符号化方法
JPH04114585A (ja) 1990-09-04 1992-04-15 Matsushita Electric Ind Co Ltd 動き補償フレーム間符号化装置
JP2908550B2 (ja) 1990-09-28 1999-06-21 株式会社東芝 養液栽培装置
DE69126512T2 (de) * 1990-12-28 1997-11-06 Canon Kk Bildcodierungsgerät mit Optimierung der erzeugten Codemenge
EP0741497B1 (en) * 1991-02-21 1999-11-03 Nec Corporation Motion image data compression coding apparatus
US5703646A (en) * 1993-04-09 1997-12-30 Sony Corporation Picture encoding method, picture encoding apparatus and picture recording medium
JP3358620B2 (ja) 1993-04-09 2002-12-24 ソニー株式会社 画像符号化方法及び画像符号化装置
WO1994024822A1 (en) 1993-04-09 1994-10-27 Sony Corporation Method and apparatus for coding image, and image recording medium
JP3264043B2 (ja) 1993-04-30 2002-03-11 ソニー株式会社 量子化コントロール装置および方法
JP2968666B2 (ja) * 1993-06-10 1999-10-25 日本電気株式会社 画像符号化方法および装置
DE69423734T2 (de) * 1993-09-28 2000-07-20 Sony Corp Gerät zur kodierung/dekodierung mit rundung auf ausschliesslich gerade oder ungerade werte
JP2720926B2 (ja) 1993-10-26 1998-03-04 富士ゼロックス株式会社 画像符号化装置
JPH07322252A (ja) 1994-05-23 1995-12-08 Canon Inc 画像符号化装置
JP2882287B2 (ja) 1994-08-22 1999-04-12 日本電気株式会社 動画像符号化装置
JPH08115205A (ja) 1994-10-14 1996-05-07 Matsushita Electric Ind Co Ltd 高速剰余演算装置
JP3431331B2 (ja) * 1995-03-01 2003-07-28 株式会社日立製作所 動画像符号化装置及び動画像伝送装置並びにテレビ会議装置
DE69637335T2 (de) * 1995-03-09 2008-10-09 Sony Corp. Bildsignalkodierungsmethode und -vorrichtung
US5612900A (en) * 1995-05-08 1997-03-18 Kabushiki Kaisha Toshiba Video encoding method and system which encodes using a rate-quantizer model
JPH09247675A (ja) 1996-03-13 1997-09-19 Fuji Film Micro Device Kk 画像圧縮方法および画像圧縮システム
US6100931A (en) * 1996-03-19 2000-08-08 Sony Corporation Method and apparatus for controlling a target amount of code and for compressing video data
JPH1023413A (ja) 1996-07-03 1998-01-23 Fuji Xerox Co Ltd 符号化装置
US6337879B1 (en) * 1996-08-14 2002-01-08 Sony Corporation Video data compression apparatus and method of same
JP3864461B2 (ja) * 1996-08-30 2006-12-27 ソニー株式会社 映像データ圧縮装置およびその方法
US6366614B1 (en) * 1996-10-11 2002-04-02 Qualcomm Inc. Adaptive rate control for digital video compression
JP4114210B2 (ja) 1996-12-12 2008-07-09 ソニー株式会社 映像データ圧縮装置およびその方法
US6163573A (en) * 1996-12-12 2000-12-19 Sony Corporation Equipment and method for compressing picture data
JP3432392B2 (ja) 1997-04-07 2003-08-04 三菱電機株式会社 画像符号化装置、画像符号化方法および画像蓄積/伝送装置
EP0924933A4 (en) * 1997-07-08 2008-03-12 Sony Corp ENCODER, ENCODING METHOD, TRANSMITTER, AND VIDEO DATA RECORDING MEDIUM
EP0940042B1 (en) 1997-07-29 2005-07-27 Koninklijke Philips Electronics N.V. Variable bitrate video coding method and corresponding video coder
JPH1198502A (ja) 1997-09-25 1999-04-09 Toshiba Corp 動画像符号化装置
JP3356663B2 (ja) * 1997-10-22 2002-12-16 松下電器産業株式会社 画像符号化装置、画像符号化方法および画像符号化プログラムを記録した記録媒体
JP2000261805A (ja) 1999-03-10 2000-09-22 Fuji Film Microdevices Co Ltd 画像圧縮システム
JP3324551B2 (ja) 1999-03-18 2002-09-17 日本電気株式会社 画像信号の符号化制御装置
JP2002359853A (ja) 2001-03-26 2002-12-13 Sony Corp 画像処理装置、画像処理方法、画像処理プログラムおよび記録媒体
EP1377070A4 (en) * 2001-03-28 2010-08-11 Sony Corp QUANTIZATION DEVICE, QUANTIZATION PROCESS, QUANTIZATION PROGRAM AND RECORDING MEDIUM
JP2003032677A (ja) * 2001-07-18 2003-01-31 Hitachi Ltd 動画像圧縮符号化装置
JP4135427B2 (ja) 2001-08-01 2008-08-20 ソニー株式会社 画像処理装置および方法、ならびに、画像処理プログラム
US6934330B2 (en) * 2001-08-01 2005-08-23 Sony Corporation Image processing apparatus
JP4042597B2 (ja) 2002-03-28 2008-02-06 ソニー株式会社 画像符号化装置及び方法、プログラム、記録媒体
RU2322770C2 (ru) * 2002-04-23 2008-04-20 Нокиа Корпорейшн Способ и устройство для указания параметров квантователя в системе видеокодирования
JP2004056680A (ja) 2002-07-23 2004-02-19 Ricoh Co Ltd 画像処理装置および画像処理方法
JP2003158742A (ja) * 2002-09-06 2003-05-30 Mega Chips Corp 画像符号化装置
JP4114585B2 (ja) 2002-09-27 2008-07-09 東洋インキ製造株式会社 ガスバリア性積層体の製造方法
JP2005203905A (ja) * 2004-01-13 2005-07-28 Sony Corp 画像符号化装置、画像符号化方法並びに画像符号化プログラム
US20050259730A1 (en) * 2004-05-18 2005-11-24 Sharp Laboratories Of America, Inc. Video coding with residual color conversion using reversible YCoCg
JP2006067302A (ja) 2004-08-27 2006-03-09 Toshiba Corp 画像符号化装置、画像符号化方法および画像符号化プログラム
US20060062481A1 (en) * 2004-09-21 2006-03-23 Markus Suvanto Apparatuses, computer program product and method for bit rate control of digital image encoder
JP2006222555A (ja) 2005-02-08 2006-08-24 Matsushita Electric Ind Co Ltd 符号化装置及び符号化方法
JP4543971B2 (ja) * 2005-03-07 2010-09-15 ソニー株式会社 符号化方法、符号化装置、符号化処理のプログラム及び符号化処理のプログラムを記録した記録媒体
JP4828925B2 (ja) 2005-11-30 2011-11-30 パナソニック株式会社 符号化装置
JP4529919B2 (ja) * 2006-02-28 2010-08-25 日本ビクター株式会社 適応量子化装置及び適応量子化プログラム
US7885471B2 (en) * 2006-07-10 2011-02-08 Sharp Laboratories Of America, Inc. Methods and systems for maintenance and use of coded block pattern information
EP2091257B1 (en) * 2006-11-30 2017-12-27 Panasonic Corporation Coder
GB2444991A (en) * 2006-12-21 2008-06-25 Tandberg Television Asa Method of selecting quantizer values in video compression systems
ATE515889T1 (de) * 2007-03-14 2011-07-15 Nippon Telegraph & Telephone Vorrichtung und verfahren zur schätzung von codemengen, programm und aufzeichnungsmedium dafür
JP2008283560A (ja) 2007-05-11 2008-11-20 Canon Inc 画像処理装置およびその方法
WO2009035149A1 (ja) * 2007-09-12 2009-03-19 Sony Corporation 画像処理装置及び画像処理方法
JP4569840B2 (ja) * 2007-09-12 2010-10-27 ソニー株式会社 画像符号化装置、画像符号化方法
CN101637026B (zh) * 2007-09-12 2012-03-28 索尼株式会社 图像处理装置和方法
EP2286595A1 (en) * 2008-06-16 2011-02-23 Dolby Laboratories Licensing Corporation Rate control model adaptation based on slice dependencies for video coding
BRPI0904324A2 (pt) * 2008-06-27 2015-06-30 Sony Corp Dispositivo de processamento de imagem, e, método de processamento de imagem
WO2009157577A1 (ja) 2008-06-27 2009-12-30 ソニー株式会社 画像処理装置及び画像処理方法
JP5257215B2 (ja) * 2009-04-16 2013-08-07 ソニー株式会社 画像符号化装置と画像符号化方法
US8411750B2 (en) * 2009-10-30 2013-04-02 Qualcomm Incorporated Global motion parameter estimation using block-based motion vectors

Also Published As

Publication number Publication date
EP2192785A4 (en) 2013-03-06
CN101779469A (zh) 2010-07-14
WO2009157577A1 (ja) 2009-12-30
RU2010105038A (ru) 2011-08-20
EP2192785B1 (en) 2014-12-31
EP2192785A1 (en) 2010-06-02
RU2502213C2 (ru) 2013-12-20
JP5472105B2 (ja) 2014-04-16
BRPI0904323A2 (pt) 2015-06-30
US20110188769A1 (en) 2011-08-04
US8270744B2 (en) 2012-09-18

Similar Documents

Publication Publication Date Title
JP5472105B2 (ja) 画像処理装置及び画像処理方法
JP5472106B2 (ja) 画像処理装置及び画像処理方法
US6587508B1 (en) Apparatus, method and computer program product for transcoding a coded moving picture sequence
US9282329B2 (en) Methods and devices for data compression using offset-based adaptive reconstruction levels
US8238423B2 (en) Image processing apparatus and method
JP5257215B2 (ja) 画像符号化装置と画像符号化方法
JP5152402B2 (ja) 動画像符号化装置、動画像符号化方法及び動画像符号化用コンピュータプログラム
US8396311B2 (en) Image encoding apparatus, image encoding method, and image encoding program
US20060140267A1 (en) Method and apparatus for providing intra coding frame bit budget
US9131249B2 (en) Apparatus for encoding moving images to minimize an amount of generated code
US20110090955A1 (en) Predictive Adaptive Scan Ordering for Video Coding
US9979972B2 (en) Method and apparatus for rate control accuracy in video encoding and decoding
JP5770476B2 (ja) ビデオ符号化に於いてレート制御を正確にする方法及び装置
US9479781B2 (en) Motion video encoding apparatus, motion video encoding method, and motion video encoding computer program
JP5900163B2 (ja) 画像処理装置、画像処理方法およびプログラム
WO2009157581A1 (ja) 画像処理装置及び画像処理方法
JP2006295535A (ja) 動画像符号化装置および方法
US20110019735A1 (en) Image encoding device and image encoding method
US8582639B2 (en) Methods and devices for data compression using adaptive reconstruction levels
US8755617B2 (en) Image encoding device and image encoding method
JP2008271213A (ja) 画像符号化装置
EP2405656A1 (en) Methods and devices for data compression using adaptive reconstruction levels
KR101307469B1 (ko) 비디오 인코더, 비디오 디코더, 비디오 인코딩 방법 및 비디오 디코딩 방법

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120315

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20120315

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130618

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130809

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20131022

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20131203

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140107

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140120

R151 Written notification of patent or utility model registration

Ref document number: 5472105

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees