JP2012178660A - 動画像符号化装置及び動画像符号化方法 - Google Patents

動画像符号化装置及び動画像符号化方法 Download PDF

Info

Publication number
JP2012178660A
JP2012178660A JP2011039699A JP2011039699A JP2012178660A JP 2012178660 A JP2012178660 A JP 2012178660A JP 2011039699 A JP2011039699 A JP 2011039699A JP 2011039699 A JP2011039699 A JP 2011039699A JP 2012178660 A JP2012178660 A JP 2012178660A
Authority
JP
Japan
Prior art keywords
unit
code amount
encoding
rate control
coding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2011039699A
Other languages
English (en)
Other versions
JP5717465B2 (ja
Inventor
Masashi Takahashi
昌史 高橋
Nobuhiro Chihara
信博 知原
Muneaki Yamaguchi
宗明 山口
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Kokusai Electric Inc
Original Assignee
Hitachi Kokusai Electric Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Kokusai Electric Inc filed Critical Hitachi Kokusai Electric Inc
Priority to JP2011039699A priority Critical patent/JP5717465B2/ja
Priority to US13/400,907 priority patent/US9210435B2/en
Publication of JP2012178660A publication Critical patent/JP2012178660A/ja
Application granted granted Critical
Publication of JP5717465B2 publication Critical patent/JP5717465B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/192Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding the adaptation method, adaptation tool or adaptation type being iterative or recursive
    • H04N19/194Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding the adaptation method, adaptation tool or adaptation type being iterative or recursive involving only two passes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/13Adaptive entropy coding, e.g. adaptive variable length coding [AVLC] or context adaptive binary arithmetic coding [CABAC]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/174Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a slice, e.g. a line of blocks or a group of blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

【課題】算術符号化を用いるCABAC等を可変長符号化方式として利用する場合、リアルタイム符号化を実現するためには計算量の高い算術符号化処理をその他の処理とは切り離し、別のプロセスで行うなどの工夫が必要となる。しかしこの場合、算術符号化処理の結果を逐次的に取得して発生符号量を測定することができないため、設定ビットレートと発生符号量の関係に基づいて量子化パラメータの値を決定するレート制御機能がうまく働かないといった問題があった。
【解決手段】
算術符号化後の発生符号量を推定し、設定ビットレートと推定符号量の関係に基づいてレート制御を行う。上記発生符号量の推定は、算術符号化前の符号長と各符号の出現割合に基づいて、例えば統計的データに基づいて設計された近似関数を用いて行うと効果的である。
【選択図】 図17

Description

本発明は、動画像符号化装置に関し、特に発生符号量を推定してレート制御を行う動画像符号化装置に関する。
大容量の動画像情報をデジタルデータ化して記録、伝達する手法として、MPEG (Moving Picture
Experts Group)方式等の符号化方式が策定され、MPEG−1規格、MPEG−2規格、MPEG−4規格、H.264/AVC(Advanced Video Coding)規格等として国際標準の符号化方式となっている。
これらの規格では、符号化処理が完了した画像情報(復号画像)を利用して符号化対象画像をブロック単位で予測し、原画像との差分(予測差分)を符号化することによって、動画像の持つ冗長性を排除して符号量を減らしている。具体的には、上記予測差分に対して周波数変換方式の一種であるDCT(Discrete Cosine Transform)等を施し、その係数を量子化する。また、一般的に画質と符号量の間にはトレードオフの関係が成立するが、量子化時のパラメータ(以後、量子化パラメータ)の値を制御することによってこういったトレードオフの関係を調節することができる。そのため、伝送路や入出力バッファ容量等の制限により符号化ストリームを所望のビットレートに抑える必要がある場合、符号化レート制御機能により、設定ビットレートと発生符号量の関係に基づいて量子化パラメータの値を適応的に決定する必要がある。
一方、H.264/AVC規格では、量子化後の各シンタックス要素に対する可変長符号化方式として、テーブル引きにより高速に処理が可能なCAVLC(Context-based Adaptive Variable Length Coding)方式に加えて、計算量の高い算術符号化を用いるCABAC(Context-based Binary Arithmetic Coding)が採用されている。CABACを用いることによりCAVLCを用いた場合と比べて符号量を10〜20%程度削減できるが、その分処理量は劇的に増加するため、リアルタイム処理を実現するためには、計算量の高い算術符号化処理を別のプロセスにて独立に動作させるなどの工夫が必要となる。
特開2010−219842号公報 特開2009−021775号公報 特開2008−011204号公報
しかしながら、算術符号化処理を独立に動作させた場合、その結果をマクロブロック単位で逐次的に取得して発生符号量を測定することが困難であるため、設定ビットレートと発生符号量の関係に基づいて量子化パラメータの値を決定するレート制御がうまく動作しないといった問題があった。
本発明では、量子化パラメータの値を決定する際に算術符号化処理の結果を利用できない場合にでも、好適にレート制御を行うことができる動画像符号化装置等を提供する。
本発明に係る動画像符号化装置は、算術符号化後の発生符号量を推定し、設定ビットレートと推定符号量の関係に基づいてレート制御を行う。特に、上記発生符号量の推定を、算術符号化前の符号長と各符号の出現割合に基づいて、例えば統計的データに基づいて設計された近似関数を用いて行うことを特徴とする。
具体的には、予測差分もしくは原画像に対して直交変換を行う周波数変換部と、該周波数変換部が出力する変換係数に対して量子化を行う量子化部と、該量子化された変換係数およびヘッダ情報に対して符号の発生頻度に応じた符号化を行う可変長符号化部と、該可変長符号化部が出力する符号化ストリームを所望のビットレートレートに保つよう制御するレート制御部とを有し、前記可変長符号化部または前記レート制御部は、前記符号化の前のビット列の長さと該ビット列に含まれるシンボルの発生頻度に基づいて、符号化後の符号量を推定し、前記レート制御部は、該推定された符号量に基づいてレート制御を行うことを特徴とする。
また、本発明の動画像符号化装置において、前記シンボルの単位は1ビットであって、前記シンボルの発生頻度は前記ビット列に含まれる0または1の数を計数して得るものであり、前記可変長符号化部は、ピクチャ、スライスもしくはブロックの単位でのレート制御を受けて算術符号化を行うものであり、該単位の中で前記可変長符号化が完了した部分では実符号量を用い、未完了の部分では前記推定された符号量を用いて、該単位の発生符号量を計算することを特徴とする。
本発明によれば、量子化パラメータの値を決定する際に算術符号化処理の結果を利用できない場合にでも、好適にレート制御を行うことができ、もって所望のビットレートで効率的に動画像を符号化することができる。
本実施例で用いる画像符号化装置のブロック図 本実施例で用いる画像符号化装置のブロック図 マクロブロック単位の符号化処理を説明する模式図 画面間予測処理に関する概念的な説明図 画面内予測処理に関する概念的な説明図 予測時のブロックサイズ決定に関する概念的な説明図 符号化モードに関する概念的な説明図 CABACに関する概念的な説明図 レート制御に関する概念的な説明図 発生符号量の推定方法に関する概念的な説明図 マクロブロック単位のBinString長と発生符号量の関係を示すシミュレーション結果 BinString長と発生符号量の関係を示すシミュレーション結果(シンボル発生割合:0〜0.6) BinString長と発生符号量の関係を示すシミュレーション結果(シンボル発生割合:0.6〜1) 過去スライスの発生符号量を推定する方法の概念的な説明図 実施例1における1スライス分の符号化処理の流れ図 実施例1におけるスライス単位レート制御処理の流れ図 実施例1におけるMB単位レート制御処理の流れ図 BinString長と発生符号量の関係を示すシミュレーション結果(シンボル発生割合ごとの平均)
以下、本発明の実施例に係る動画像符号化装置を、図面を参照して説明する。本例の動画像符号化装置は、H.264/AVCに基づいて符号化を行うものであり、最初に、H.264/AVC符号化について概説する。
図3は、マクロブロック単位の符号化処理を説明する模式図である。H.264/AVCは、符号化処理が完了した画像情報を利用して符号化対象画像を予測し、原画像との予測差分を符号化するものであり、その際には、画像を細かく分割したブロック単位でDCT(Discrete Cosine Transform)を施し、各係数値を量子化して可変長符号化を行う。各ブロックは、固定サイズ(16×16画素)のマクロブロックを分割したものである。
図3に示すとおり、符号化処理は、対象画像に対してラスタースキャンの順序(矢印で示す)31に従い、マクロブロック単位で実行される。
図4は、H.264/AVCの画面間予測処理の動作に関する概念的な説明図である。
41は、動画像符号化装置に入力される映像(時系列の画像群)であり、参照画像は43及び符号化対象画像43はそれぞれ、映像41に含まれる1フレームである。
画面間予測を行う際には、符号化対象画像43と同じ元映像41に含まれる符号化済みの画像の復号画像を参照画像42とし、符号化対象画像43中の対象ブロック44と相関の高いブロック(予測画像)45を参照画像42中から探索する。
このとき、両ブロックの差分として計算される予測差分に加えて、予測に必要なヘッダ情報として、両ブロックの座標値の差分として表される動きベクトル46を符号化する。一方復号化の際には上記の逆の手順を行えばよく、復号化された予測差分を参照画像中のブロック45に加算することにより、復号化画像を取得できる。
図5は、H.264/AVCによる画面内予測処理の動作に関する概念的な説明図である。画面内予測では、符号化対象ブロックの左、左上、上、右上に隣接する符号化済みのブロックの復号画像を用いて予測を行う。すなわち、予測にはこれらの隣接ブロックに含まれる13個の復号画素を参照画素51として利用し、予測方向ベクトル52を傾きとする同一直線上の画素はすべて同一の参照画素から予測される。予測方向ベクトル52には、縦、横、斜めなど、8種類の予測方向の中から最適なものをブロック単位で選択することができる。ただし、上記のような方向性に基づく予測モードに加えて、参照画素の平均値によって符号化対象ブロックに含まれるすべての画素を予測するDC予測(予測モード2)も用意されており、これら9種類の予測モードの中からどのモードを選択したのかを示す情報は、ヘッダ情報として予測差分とともに符号化される。
図6は、予測時のブロックサイズ決定に関する概念的な説明図である。H.264/AVCでは、マクロブロックをさらに小さなサイズのブロックに階層分割して予測を行うことができ、図6は画面間予測を行う際に許容されているマクロブロックの分割パターンについて示している。すなわち、対象画像61の中のすべてのマクロブロック(例えば62)は、あらかじめ定義された16×16画素サイズから8×8画素サイズまでの4種類の分割パターンの中から最適なものを選択して予測を行うことができ、8×8画素サイズの分割パターン63が選ばれた場合はさらに細かなサブブロックに分割可能であり、各ブロックに対して8×8画素サイズから4×4画素サイズまでの4種類のパターンの中から最適なものを選択できる。こういったマクロブロックの分割パターンは、予測方法の識別子と組み合わせて符号化モードとし、ヘッダ情報として符号化される。
図7は、符号化モードに関する概念的な説明図であり、符号化モードは少なくとも、単方向画面間予測71と、画面間予測72とに分類できる。単方向画面間予測71の識別子は"P"(Predictive)であり、画面間予測72の識別子は"I"(Intra)である。
図8は、CABACに関する概念的な説明図であり、上述のヘッダ情報や予測差分情報を可変長符号化する手順について示している。H.264/AVCでは、可変長符号として、処理量の低いCAVLC(Context-based
Adaptive Variable Length Coding)と、処理量は高いが高い符号化効率を実現できるCABAC(Context-based Binary Arithmetic Coding)の2種類が規定されている。CABACでは、まずヘッダ情報や予測差分情報などのSyntax要素81に対して2値化処理82を行い、0/1の2値で構成されるビット列BinString83に変換される。続いて、BinStringに対して算術符号化84を行って圧縮を実行し、符号化ストリーム85を生成する。
図9は、レート制御に関する概念的な説明図である。図9ではまず、スライス単位のレート制御を行い、対象スライスにおいて基準となるQP(Quantization Parameter:量子化パラメータ)を決定する。続いて対象スライス内のMB(Macro Block:マクロブロック)単位のレート制御により、上記基準QPに基づいて各MBのQPを最終決定する。具体的には、スライス単位のレート制御では、過去スライスで発生した符号量と設定ビットレートのセット91から、対象スライスにて許容できる発生符号量(符号量予算)を計算し、それに応じたQPの基準値(基準QP93)を決定する。続いて、MB単位のレート制御では、各MBで実際に発生した符号量をフィードバックして符号量の変動を検知し、符号量予測に対して補正を行って残りの各MBのQPを決定する。
しかし前述の通り、算術符号化を他の処理とは別に実行した場合、MB単位のレート制御において各MBの発生符号量を検知することが困難である。また、過去スライスの中にも、まだ算術符号化が完了していないMBが存在する可能性も高く、スライス単位のレート制御もうまく働かない。そのため、算術符号化処理が未完了のMBに対しては、発生符号量を推定することが必要である。
図10は、本例の特徴である、発生符号量の推定方法に関する概念的な説明図である。この方法ではまず、Syntax要素を2値化して生成されたBinString83に対して、0/1シンボルの長さと出現確率86をそれぞれ計算し、これらの情報に基づいて推定符号量87を算出する。
図11は、マクロブロック単位のBinString長と発生符号量の関係を示すシミュレーション結果である。両者の間にはある程度の相関性が観測されるものの、分散値が比較的に大きい。もし、MB単位の発生符号量を、予測差分情報を2値化したBinString長のみから推定しようとすると、推定精度はそれほど高くないことが分かる。
図12及び図13は、BinString長と発生符号量、およびシンボル発生割合の関係を示すシミュレーション結果である。このシミュレーションでは、ITE((社)映像情報メディア学会)の評価映像26種類の開始後30フレームをつなぎ合わせた映像を用いた。カテゴリ分けは、対象MB内の量子化済み変換係数(Coeff)のBinStringにおける0の発生割合を0.1刻みで10分割したものとし、横軸をBinString長、縦軸を発生符号量として示してある。
このように同一シンボルの発生割合が近いMB群(カテゴリ)の夫々において、特徴点が局所集中するようになり、発生符号量の推定精度が改善する。例えば、Coeffに関してシンボル”0”の発生割合が0.6以上0.7未満であるカテゴリに属するMBの場合、BinString長と発生符号量の関係は領域131内に集中することになる。他のカテゴリにおいても分散値が劇的に減少するものがあり、カテゴリごとにBinString長と発生符号量の関係をモデル化することによりBinString長とシンボルの発生割合から発生符号量の推定が可能となり、推定精度が大幅に向上する。
上記モデル化はどのような手法を用いて行っても良いが、発生符号量のランダム性を除去するため、最小二乗法などを用いて近似関数を計算すると効果的である。
図18は、図12などと同条件でBinString長毎に平均化して示したグラフであるが、”0”発生割合が低いときはサンプル自体が少ないこともあり凹凸が生じるので、これらを平坦化することが望ましい。近似関数は、区分的直線近似(折れ線グラフ)でもよく、予め用意しておいても良いし、符号化を行う際に動的に関数を更新しても良い。
BinString長と発生符号量の関係の局在化は、画面内予測と画面間予測の違いやQPなどに若干依存するため、モデルはそれらに応じて複数設けてもよい。
なお、シンボルの発生割合の計算方法は特に問わない。本例では対象MBの予測差分情報に対してのみ発生割合の計算を行っており、それで十分な精度が得られることを確認しているが、動きベクトルや符号化モードなどの別Syntax要素を含んでいても問題はなく、Syntax要素ごとの発生割合を計算し、それらの加重和として計算しても良い。また、対象MBだけでなく、例えば1つ前のMBなど符号化済みの周辺MBにおけるシンボルを考慮しても良い。さらに本例ではMB単位で符号量の推定を行っているが、例えば画像単位、スライス単位、ブロック単位などどのような処理単位で符号量推定を行っても構わない。
図14は、過去スライスの発生符号量を推定する方法の概念的な説明図である。スライス単位のレート制御では、符号化順で先行する過去スライス(142等)の符号量と設定ビットレートに基づいて対象スライス141の基準QPを決定するが、算術符号化の処理量は極端に高いため、過去スライス142においても算術符号化が完了していない可能性が高い。この場合、過去スライスは算術符号化が完了した完了領域143と、まだ未完了領域144に分割されるが、すでに完了した領域に対しては算術符号化後の実符号量を、一方でまだ完了していない領域についてはすでに述べた方法で各MBの発生符号量を推定した結果を利用し、それらの和を計算することによって符号量推定を行う。
図1は、実施例1に係る動画像符号化装置のブロック図である。本例の動画像符号化装置は、入力された原画像101を保持する入力画像メモリ102と、入力画像を小領域に分割するブロック分割部103と、ブロック単位で画面内予測を行う画面内予測部105と、動き探索部104にて検出された動き量をもとにブロック単位で画面間予測を行う画面間予測部106と、画像の性質に合った予測モード(予測手段およびブロックサイズ)を決定するモード選択部107と、予測差分を生成するための減算部108と、予測差分を量子化済み変換係数へ処理する周波数変換部109および量子化処理部110と、量子化済み変換係数等のシンタックス要素を符号化する可変長符号化部111と、符号化ストリームが所望のビットレートに納まるように量子化パラメータを制御するレート制御部112と、量子化済み変換係数から予測差分を復元(復号化)する逆量子化処理部113および逆周波数変換部114と、復元された予測差分を用いて復号化画像を生成するための加算部115と、復号化画像を保持して後の予測に活用するための参照画像メモリ116を有する。このように、図1に現れる範囲では、本例の動画像符号化装置の構成は、従来と同等である。
入力画像メモリ102は、原画像101(映像41と同義)の中から一枚の画像を符号化対象画像として保持し、これをブロック分割部103にて細かなブロックに分割し、動き探索部104、画面内予測部105、画面間予測部106、および減算部108に渡す。
動き探索部104では、参照画像メモリ116に格納されている復号化済み画像を用いて該当ブロックの動き量を計算し、動きベクトルを画面間予測部106に渡す。
画面内予測部105および画面間予測部106は、それぞれ、周辺ブロックの原画像を用いた画面内予測処理および符号化済みの別画像を参照した画面間予測処理を、複数のブロックサイズで実行する。
モード選択部107は、両予測部において複数のブロックサイズで実行された中から、最適な予測モードを選択し、その予測画像を減算部108および加算部115に送る。
減算部108は、対象ブロックの原画像と、モード選択部107で選択された予測画像との差分(予測差分)を生成し、周波数変換部109に渡す。
周波数変換部109および量子化処理部110は、送られてきた予測差分に対して指定された大きさのブロック単位で、DCTなどによる直交変換および量子化マトリクスによる量子化処理をそれぞれ行い、得られた量子化済み直交変換係数を可変長符号化部111および逆量子化部113に渡す。
可変長符号化処理部111は、量子化済み直交変換係数とヘッダ情報を、記号の発生確率に基づいて符号化し符号化ストリームを生成するとともに、符号化レート制御に必要な情報(符号量推定値)を符号化完了前に算出してレート制御部112へ送る。
レート制御部112は、送られてきた情報を基に最適なQPの値を決定して量子化処理部110へ送る。詳細は図17等で後述する。
逆量子化処理部113および逆周波数変換部114では、量子化済み直交変換係数に対して、それぞれ逆量子化および逆DCTなどの逆直交変換を施し、予測差分を取得して加算部115に送る。続いて加算部115では、予測画像と復号化済み予測差分を加算して復号化画像を生成し、参照画像メモリ116に格納する。
図2は、本実施例1における可変長符号化部111について、その詳細の一例を示したものである。可変長符号化部は、各シンタックス要素に対して2値化処理を行うための2値化処理部201と、2値化により得られるBinStringを格納するためのBinString格納メモリ202と、図9等で前述した方法にてMB単位の発生符号量を推定する符号量推定部203と、BinString格納メモリ202に蓄えられた2値情報に対して算術符号化を別プロセスで行う算術符号化部204を有する。
2値化処理部201は、従来の2値化処理82に相当し、モード選択部107や量子化処理部110から入力されたシンタックス要素を、0/1の2値で構成される文字列BinStringに変換し、BinString格納メモリ202と符号量推定部203へと送る。
符号量推定部203は、BinString長と、0/1シンボルの出現割合の両方に基づいてMB単位の発生符号量を推定し、レート制御部112へと送る。
算術符号化部204は、従来の算術符号化84に相当し、BinString格納メモリに蓄えられた2値情報に対して算術符号化を別プロセスで行う。
図15は、本例における1スライス分の符号化処理の流れ図である。
まず151では、レート制御部112が、図9で概説したスライス単位のレート制御(図16で詳述)を行い、対象スライスの基準QPを決定する。
次に152では、対象スライス内のすべてのMBに対してループ1内の153〜155の処理が完了するまで該ループ1を続ける。なお、予測・符号化モード選択・DCT処理153は、動き探索部104〜周波数変換部109により行われ、MB単位のレート制御154(図17で詳述)はレート制御部112で行われ、量子化・2値化処理155は、量子化処理部110と2値化処理部201で行われる処理である。
ループ1を抜けると次に、すべてのMBに対してループ2内の157の処理が完了するまで該ループ2を続ける。157は、別プロセスにてBinStringを算術符号化する処理であり、算術符号化部204で行われる。
ループ2を抜けると、1スライス分のレート制御が終了する(158)。
図16は、本例における1スライス分のスライス単位レート制御151の流れ図である。
まず、対象スライスが最初のスライスである場合(161)、目標ビットレートに応じてあらかじめ設定しておいた基準QPを取得する(162)。
一方で最初のスライスでない場合、図14で説明した手順で過去スライスの発生符号量を推定し(163)、推定された符号量と設定ビットレートの関係から該当スライスにて許容できる発生量(符号量予算)を算出する(164)。なお163は、過去スライスの領域全てで算術符号化が完了しているのであれば、推定ではなく実符号量でよい。
続いて、符号量予算の大きさに基づいて対象スライスの基準QPを決定し(165)、1スライス分のスライス単位レート制御を終了する(166)。
図17は、MB単位レート制御154について、1スライス分の処理を示す流れ図である。
171では、対象スライス内のすべてのMBに対して、ループ内の172〜177の処理が完了するまで該ループを続ける。すなわち、対象MBが対象スライス内で最初のMBである場合(172)、スライス単位のレート制御で決定した基準QPを対象MBに適用する(173)。
一方、最初のMBでない場合は、符号量推定部203が、前MBのSyntax要素に対してBinString長と0/1シンボルの割合を計算し(174)、図12と図13の説明で述べた方法で前MBの発生符号量を推定する(175)。続いてレート制御部112が、推定された前MBの発生符号量を用いて符号量予算の値を更新し(176)、更新後の符号量予算に基づいて対象MBのQPを決定する(177)。
以上の処理をすべてのMBに対して完了すれば、1スライス分のMB単位レート制御処理を終了する(178)。
本実施例1の説明では、予測および周波数変換をブロック単位で行うものとしたが、それ以外にも例えば画像の背景から分離したオブジェクト単位で行っても良い。また、周波数変換の一例としてDCTを挙げているが、DST(Discrete Sine Transformation:離散サイン変換)、DWT(Discrete Wavelet Transformation:離散ウェーブレット変換)、DFT(Discrete Fourier Transformation:離散フーリエ変換)、KLT(Karhunen-Loeve Transformation:カルーネン-レーブ変換)など、画素間相関除去に利用する直交変換ならどのようなものでも構わない。
また、イントラモードでは特に画面内予測を行わなくても、MPEG-1やMPEG-2のイントラ符号化や静止画の符号化方式JPEGやJPEG2000のように、原画像に対して直接周波数変換を施しても構わない。
また、可変長符号化方式としてはCABACに限らず、算術符号化を用いる方式ならどのようなものでも構わないし、特に算術符号化でなくてもシンボルの発生頻度の偏りを用いて圧縮を行うものならどのような符号化方式を用いても良い。
本発明は、動画像符号化方式H.264/AVCだけでなく、静止画像符号化方式JPEG2000、および今後策定されるであろう次世代標準など、レート制御(符号化率の変更)が可能なあらゆる画像符号化方式に適用可能である。
101…原画像、102…入力画像メモリ、103…ブロック分割部、104…動き探索部、105…画面内予測部、106…画面間予測部、107…モード選択部、108…現残部、109…周波数変換部、110…量子化処理部、112…レート制御部、113…逆量子化処理部、114…逆周波数変換部、115…加算部、116…参照画像メモリ、201…2値化処理部、202…BinString格納メモリ、203…符号量推定部、204…算術符号化部。

Claims (3)

  1. 予測差分もしくは原画像に対して直交変換を行う周波数変換部と、該周波数変換部が出力する変換係数に対して量子化を行う量子化部と、該量子化された変換係数およびヘッダ情報に対して符号の発生頻度に応じた符号化を行う可変長符号化部と、該可変長符号化部が出力する符号化ストリームを所望のビットレートレートに保つよう制御するレート制御部とを有し、
    前記可変長符号化部または前記レート制御部は、前記符号化の前のビット列の長さと該ビット列に含まれるシンボルの発生頻度に基づいて、符号化後の符号量を推定し、前記レート制御部は、該推定された符号量に基づいてレート制御を行うことを特徴とする画像符号化装置。
  2. 前記シンボルの単位は1ビットであって、前記シンボルの発生頻度は前記ビット列に含まれる0または1の数を計数して得るものであり、
    前記可変長符号化部は、ピクチャ、スライスもしくはブロックの単位でのレート制御を受けて算術符号化を行うものであり、該単位の中で前記可変長符号化が完了した部分では実符号量を用い、未完了の部分では前記推定された符号量を用いて、該単位の発生符号量を計算することを特徴とする請求項2記載の画像符号化装置。
  3. 予測差分もしくは原画像に対して周波数変換を行い、続いて変換係数に対して量子化を施し、さらに変換係数およびヘッダ情報に対して可変長符号化を行う画像符号化方式において、符号化前のビット列長及び該ビット列に含まれるシンボルの発生頻度から符号化後の発生符号量を推定してレート制御を行うことを特徴とする画像符号化方法。
JP2011039699A 2011-02-25 2011-02-25 動画像符号化装置及び動画像符号化方法 Active JP5717465B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2011039699A JP5717465B2 (ja) 2011-02-25 2011-02-25 動画像符号化装置及び動画像符号化方法
US13/400,907 US9210435B2 (en) 2011-02-25 2012-02-21 Video encoding method and apparatus for estimating a code amount based on bit string length and symbol occurrence frequency

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011039699A JP5717465B2 (ja) 2011-02-25 2011-02-25 動画像符号化装置及び動画像符号化方法

Publications (2)

Publication Number Publication Date
JP2012178660A true JP2012178660A (ja) 2012-09-13
JP5717465B2 JP5717465B2 (ja) 2015-05-13

Family

ID=46718982

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011039699A Active JP5717465B2 (ja) 2011-02-25 2011-02-25 動画像符号化装置及び動画像符号化方法

Country Status (2)

Country Link
US (1) US9210435B2 (ja)
JP (1) JP5717465B2 (ja)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5396302B2 (ja) * 2010-02-08 2014-01-22 パナソニック株式会社 映像信号符号化装置及び映像信号符号化方法
US9491475B2 (en) * 2012-03-29 2016-11-08 Magnum Semiconductor, Inc. Apparatuses and methods for providing quantized coefficients for video encoding
CN103841418B (zh) * 2012-11-22 2016-12-21 中国科学院声学研究所 一种3g网络中视频监控器码率控制的优化方法及***
US9392286B2 (en) 2013-03-15 2016-07-12 Magnum Semiconductor, Inc. Apparatuses and methods for providing quantized coefficients for video encoding
US9298420B2 (en) 2013-07-26 2016-03-29 International Business Machines Corporation Identification of the bit position of a selected instance of a particular bit value in a binary bit string
US9794575B2 (en) 2013-12-18 2017-10-17 Magnum Semiconductor, Inc. Apparatuses and methods for optimizing rate-distortion costs in video encoding
WO2016076515A1 (ko) * 2014-11-13 2016-05-19 삼성전자 주식회사 영상의 주파수 특성 정보를 포함하는 메타 데이터를 생성하는 방법 및 장치
US9686556B2 (en) * 2015-09-30 2017-06-20 Apple Inc. Rate-estimation for encoding rate control
US10574988B2 (en) * 2015-11-19 2020-02-25 Qualcomm Incorporated System and methods for reducing slice boundary visual artifacts in display stream compression (DSC)
KR102401851B1 (ko) * 2017-06-14 2022-05-26 삼성디스플레이 주식회사 영상 압축 방법 및 이를 수행하는 표시 장치
US11212531B2 (en) * 2019-06-07 2021-12-28 The University Of North Carolina At Chapel Hill Methods, systems, and computer readable media for decoding video using rate sorted entropy coding

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005318296A (ja) * 2004-04-28 2005-11-10 Toshiba Corp 動画像符号化方法と装置及びプログラム
JP2008011431A (ja) * 2006-06-30 2008-01-17 Toshiba Corp 画像符号化装置
JP2009038746A (ja) * 2007-08-03 2009-02-19 Panasonic Corp 画像情報符号化装置
JP2009055384A (ja) * 2007-08-28 2009-03-12 Sony Corp 符号化装置、符号化方法、符号化方法のプログラム及び符号化方法のプログラムを記録した記録媒体
US20100238056A1 (en) * 2009-03-17 2010-09-23 Yukinaga Seki Code amount estimating device, image coding apparatus including the code amount estimating device, and code amount estimating method

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006140758A (ja) * 2004-11-12 2006-06-01 Toshiba Corp 動画像符号化方法、動画像符号化装置および動画像符号化プログラム
JP4787100B2 (ja) * 2006-07-27 2011-10-05 パナソニック株式会社 画像符号化装置

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005318296A (ja) * 2004-04-28 2005-11-10 Toshiba Corp 動画像符号化方法と装置及びプログラム
JP2008011431A (ja) * 2006-06-30 2008-01-17 Toshiba Corp 画像符号化装置
JP2009038746A (ja) * 2007-08-03 2009-02-19 Panasonic Corp 画像情報符号化装置
JP2009055384A (ja) * 2007-08-28 2009-03-12 Sony Corp 符号化装置、符号化方法、符号化方法のプログラム及び符号化方法のプログラムを記録した記録媒体
US7688234B2 (en) * 2007-08-28 2010-03-30 Sony Corporation Coding apparatus, coding method, program for executing the method, and recording medium storing the program
US20100238056A1 (en) * 2009-03-17 2010-09-23 Yukinaga Seki Code amount estimating device, image coding apparatus including the code amount estimating device, and code amount estimating method
JP2010219842A (ja) * 2009-03-17 2010-09-30 Panasonic Corp 符号量推定装置、符号量推定方法、符号量推定プログラムおよび、符号量推定集積回路

Also Published As

Publication number Publication date
JP5717465B2 (ja) 2015-05-13
US20120219057A1 (en) 2012-08-30
US9210435B2 (en) 2015-12-08

Similar Documents

Publication Publication Date Title
JP5717465B2 (ja) 動画像符号化装置及び動画像符号化方法
JP4937741B2 (ja) 映像符号化方法及び装置、映像復号方法及び装置、それらのプログラムおよびそれらプログラムを記録した記録媒体
EP2520093B1 (en) Data compression for video
EP2522143A2 (en) Data compression for video
KR101712097B1 (ko) 유연한 직교 변환에 기초한 영상 부호화, 복호화 방법 및 장치
WO2011101452A2 (en) Data compression for video
JP2009111691A (ja) 画像符号化装置及び符号化方法、画像復号化装置及び復号化方法
TW201334547A (zh) 推導量化參數的方法
JP2006157881A (ja) 可変長符号化装置及びその方法
US20110243227A1 (en) Moving picture decoding method and device, and moving picture encoding method and device
JP2014530557A (ja) 映像復号化装置
JP6837110B2 (ja) 動画像復号方法
WO2016194380A1 (ja) 動画像符号化装置、動画像符号化方法および動画像符号化プログラムを記憶する記録媒体
JP2009049969A (ja) 動画像符号化装置及び方法並びに動画像復号化装置及び方法
JP5832263B2 (ja) 画像符号化装置及び画像符号化方法
JP5171658B2 (ja) 画像符号化装置
JP2008153802A (ja) 動画像符号化装置及び動画像符号化プログラム
JP2007243859A (ja) 画像符号化装置及び画像符号化プログラム
Heo et al. VLC Table Prediction Algorithm for CAVLC in H. 264 Using the Characteristics of Mode Information

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20140106

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20141014

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20141113

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150109

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150212

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150216

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20150312

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20150317

R150 Certificate of patent or registration of utility model

Ref document number: 5717465

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250