JP2005244346A - 動画像符号化装置及びその方法、プログラム - Google Patents

動画像符号化装置及びその方法、プログラム Download PDF

Info

Publication number
JP2005244346A
JP2005244346A JP2004048173A JP2004048173A JP2005244346A JP 2005244346 A JP2005244346 A JP 2005244346A JP 2004048173 A JP2004048173 A JP 2004048173A JP 2004048173 A JP2004048173 A JP 2004048173A JP 2005244346 A JP2005244346 A JP 2005244346A
Authority
JP
Japan
Prior art keywords
encoding
input image
filter
unit
coding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2004048173A
Other languages
English (en)
Other versions
JP4478480B2 (ja
JP2005244346A5 (ja
Inventor
Katsumi Otsuka
克己 大塚
Hideaki Hattori
秀昭 服部
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2004048173A priority Critical patent/JP4478480B2/ja
Priority to US11/003,461 priority patent/US20050123038A1/en
Publication of JP2005244346A publication Critical patent/JP2005244346A/ja
Publication of JP2005244346A5 publication Critical patent/JP2005244346A5/ja
Application granted granted Critical
Publication of JP4478480B2 publication Critical patent/JP4478480B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

【課題】 符号量と符号化歪み量が最適な動画像符号化データを生成することができる動画像符号化装置を提供する。
【解決手段】 入力画像の分散を算出する分散算出部105と、入力画像に対してフィルタ処理を行うプリフィルタ部101と、フィルタ処理された入力画像に対して量子化と符号化する符号化部102と、符号化データに対して復号化を行う局所復号化部103と、符号化部102の入力画像と前記復号化部103の出力である再構成画像からブロック歪みを検出する検出部106と、符号化部102における符号量と符号化歪み量との関係を規定するR−Dモデル算出部109と、視覚感度を評価するための視覚感度モデル算出部107と、入力ピクチャの目標符号量、前記規定及び前記視覚感度評価に基づいて、プリフィルタ部101におけるフィルタ特性及び量子化処理における重み付けパラメータを算出するパラメータ算出部108とを具える。
【選択図】 図1

Description

本発明は、動画像を所定単位で符号化する動画像符号化において、量子化処理における重み付けパラメータを用いて、入力画像を所定の目標符号量に符号化する動画像符号化装置及びその方法、プログラムに関するものである。
近年のデジタル信号処理技術の飛躍的な進歩により、従来ならば困難であった動画像の蓄積メディアへの記録や伝送路を介した動画像の伝送が行われている。この場合に、動画像を構成する各々のピクチャは、圧縮符号化処理が施されデータ量が大幅に削減されている。この圧縮符号化処理として、代表的な手法の一つに、例えば、MPEG(Moving Picture Experts Group)方式がある。
MPEG方式に準拠して、動画像中の一連のピクチャを一定のビット・レートという条件下で圧縮符号化する場合には、動画像中のシーンやピクチャの空間周波数特性、及び量子化スケール(Qスケール)値に応じて符号量が大きく異なる。このような符号化特性をもつ圧縮符号化装置を実現する上で、符号化歪みを最小限にするための重要な技術が符号量制御である。
符号量制御を実現するためのアルゴリズムについては、これまで数多く提案されてきている。その中でも、MPEG−2符号化方式の標準化の過程で提案されたTM5(Test Model 5(Test Model Editing Commitee: "Test Model 5", ISO/IEC JTC/SC29/WG11/N0400(Apr.1993)))で使用されているアルゴリズム(以下、TM5:特許文献1)は良く知られているものの一つである。
<従来技術1>
TM5では、次の3つのステップ(ステップ1〜3)から構成され、GOP(Group of Pictures)毎にビット・レートが一定になるように、Q(量子化(quantization))スケールを制御している。
[ステップ1:ビット割当]:GOP内の残り符号量から、次に符号化するピクチャの目標符号量を算出する。
[ステップ2:符号量制御]:ステップ1で算出した目標符号量から仮想バッファの状態に応じて、Qスケールを算出する。
[ステップ3:Qスケールの調整]:マクロブロックの空間アクティビチィに基づいて、最終的なQスケールを決定する。
前記3つのステップの内、符号化歪みに最も影響の大きいステップ1の詳細な処理を次に説明する。
[ステップ1:ビット割当]
今、図14に示す通りに、現GOP内の10番目のピクチャP3(Pピクチャ)の符号化に先立ち、ピクチャP3の目標符号量を算出するものとする。ステップ1の処理は、次式で表される。
Figure 2005244346
但し、Rgopは現GOPに対して割り当てられる符号量、Ni、Np及びNbはそれぞれI、P及びBピクチャの現GOPにおける残りのピクチャ数、bits_rateは目標ビット・レート、picture_rateはピクチャ・レートを表す。更には、I、P及びBピクチャ毎に、符号化結果からピクチャの複雑度Xi、Xp及びXbを次式で算出する。
Figure 2005244346
但し、Ri、Rp及びRbは、それぞれI、P及びBピクチャを符号化して得られる符号量、Qi、Qp及びQbはそれぞれI、P及びBピクチャ内のすべてのマクロブロックに対するQスケールの平均値である。式(1)及び式(2)から、次式を用いて、I、P及びBピクチャそれぞれについて目標符号量Ti、Tp及びTbを算出する。
Figure 2005244346
但し、Kp=1.0及びKb=1.4である。
以上の処理から算出したピクチャP3の目標符号量Tpに基づき、ステップ2以降において、Qスケールを算出する。
<従来技術2>
プリフィルタを用いる符号量制御手法として、特許文献1として、「動画像符号化におけるプリフィルタ制御方法及び装置」がある。この手法によれば、符号化部の前段にあるプリフィルタであるLPF(以下、プリフィルタLPF)によって、符号化部に入力される各ピクチャの空間周波数を制御することで、量子化歪みを低減している。
プリフィルタLPFの制御には、図15に示すバランス関数なるものを定義し、量子化歪みと画像鮮鋭度劣化との整合を取る。図15の2本の曲線は、以下の2つの関数F1及びF2にそれぞれ相当する。
F1(動き量、フィルタ係数、Qスケール、符号量)
F2(フィルタ係数、Qスケール)
関数F1及びF2の交差点をバランス点と称して、この点において符号量と画質の整合が最も優れているQスケールとプリフィルタLPFのフィルタ係数が得られるとしている。
<従来技術3>
同様に、プリフィルタを用いる符号量制御手法のもう一つの従来技術として、特許文献2として、「動画像符号化方法」が提案されている。
この手法によれば、まず、符号化難易度Yを、以下の通りI、P及びBピクチャ毎に関数Fを使用して算出する。
Y= F(累積符号量,平均Qスケール)
次に、I、P及びBそれぞれについて算出した符号化難易度Yi、Yp及びYbからフィルタ係数パラメータZを次式から算出する。
Figure 2005244346
式(4)により得られたフィルタ係数パラメータZの値に応じて、図16に示すグラフから実際のフィルタ係数Sを、予め設定してある所定値S0、S1あるいはS3から選択する。
即ち、各フィルタ係数Sに対応するフィルタ係数Zに幅をもたせることによって、急激なフィルタ係数Zの変化を回避している。
Test Model 5(Test Model Editing Commitee: "Test Model 5", ISO/IEC JTC/SC29/WG11/N0400(Apr.1993)) 特許2894137号公報 特開2002−247576号公報
しかしながら、非特許文献1で示される従来技術1のTM5には、次のような課題がある。
ステップ2及びステップ3において、最終的なQスケールを得る場合には、ピクチャの目標符号量と現マクロブロックまでのピクチャ内の符号量との乖離、及びマクロブロックの空間アクティビティのみを使用している。
即ち、TM5は、符号化対象となるピクチャの目標符号量が既に決定された後、実際に符号化処理を行いながら視覚特性を調整しようとするものである。よって、画質の定量的な劣化具合や人間の視覚特性が十分反映されていない課題がある。
特許文献1で示される従来技術2は、プリフィルタLPFを用いることで、TM5の課題の解決を試みている。しかし、関数F1において、引数である動き量を算出するための大規模な回路が必要となる。また、関数F1及びF2の定義や図15で示したバランス点の算出方法については、何ら言及しておらず、プリフィルタLPFの制御方法及び効果が不明瞭である。
更に、特許文献2で示される従来技術3は、フィルタ係数を変更する際に、急激な変化を回避することで、従来技術2の課題の解決を試みている。しかし、単純に累積符号量と平均Qスケールの情報からのみ、フィルタ係数を予測しているにすぎないので、依然として画質の劣化具合や人間の視覚特性が考慮されているとは言い難い。
本発明は上記の課題に鑑みてなされたものであり、画質の劣化具合や人間の視覚特性を考慮して、割り当てられた目標符号量の条件下において符号量と符号化歪み量が最適な動画像符号化データを生成することができる動画像符号化装置及びその制御方法、プログラムを提供することを目的とする。
上記の目的を達成するための本発明による動画像符号化装置は以下の構成を備える。即ち、
動画像を所定単位で符号化する動画像符号化において、量子化処理における重み付けパラメータを用いて、入力画像を所定の目標符号量に符号化する動画像符号化装置であって
前記入力画像の分散を算出する分散算出手段と、
前記入力画像に対して、与えられたフィルタ特性によりフィルタ処理を行うフィルタ手段と、
前記フィルタ手段でフィルタ処理された入力画像に対して、量子化処理を行い、符号化する符号化手段と、
前記符号化手段が出力する符号化データに対して復号化処理を行う復号化手段と、
前記符号化手段の入力画像と前記復号化手段の出力である再構成ピクチャからブロック歪みを検出する検出手段と、
前記符号化手段における符号量と符号化歪み量との関係を規定する規定式を決定する規定式決定手段と、
前記分散算出手段で算出された分散及び少なくとも前記検出手段の検出結果を含む、視覚感度を評価するための評価式を決定する評価式決定手段と、
前記入力画像の目標符号量、前記規定式及び前記度評価式に基づいて、前記フィルタ手段における前記フィルタ特性及び量子化処理における重み付けパラメータを算出するパラメータ算出手段と
を備える。
また、好ましくは、前記規定式決定手段は、前記規定式を、前記フィルタ手段でフィルタ処理された入力画像の分散及び前記符号化手段の符号化歪み量を用いて決定する。
また、好ましくは、前記評価式は、前記検出手段の検出結果と、前記フィルタ手段でフィルタ処理された入力画像の分散及び前記符号化手段における符号化歪み量を含む。
また、好ましくは、前記パラメータ算出手段は、前記入力画像の目標符号量を拘束条件として、前記規定式と前記評価式の二つの式を最適にする前記フィルタ手段でフィルタ処理された入力画像の分散と、前記符号化手段における符号化歪み量を算出する。
また、好ましくは、前記パラメータ算出手段は、前記符号化手段における符号化歪み量から前記入力画像の目標符号量を算出することで、前記量子化処理の重み付けパラメータを算出する。
また、好ましくは、前記パラメータ算出手段は、前記フィルタ手段でフィルタ処理された入力画像の分散及び前記符号化手段における符号化歪み量を、前記入力画像の目標符号量が、前記規定式から得られる前記符号化手段の符号量と等しいことを拘束条件として、前記評価式が最大あるいは最小となるラグランジュ未定乗数法を用いて算出する。
上記の目的を達成するための本発明による動画像符号化方法は以下の構成を備える。即ち、
動画像を所定単位で符号化する動画像符号化において、量子化処理における重み付けパラメータを用いて、入力画像を所定の目標符号量に符号化する動画像符号化方法であって
前記入力画像の分散を算出する分散算出工程と、
前記入力画像に対して、与えられたフィルタ特性によりフィルタ処理を行うフィルタ工程と、
前記フィルタ工程でフィルタ処理された入力画像に対して、量子化処理を行い、符号化する符号化工程と、
前記符号化工程が出力する符号化データに対して復号化処理を行う復号化工程と、
前記符号化工程の入力画像と前記復号化工程の出力である再構成ピクチャからブロック歪みを検出する検出工程と、
前記符号化工程における符号量と符号化歪み量との関係を規定する規定式を決定する規定式決定工程と、
前記分散算出工程で算出された分散及び少なくとも前記検出工程の検出結果を含む、視覚感度を評価するための評価式を決定する評価式決定工程と、
前記入力画像の目標符号量、前記規定式及び前記評価式に基づいて、前記フィルタ工程における前記フィルタ特性及び量子化処理における重み付けパラメータを算出するパラメータ算出工程と
を備える。
上記の目的を達成するための本発明によるプログラムは以下の構成を備える。即ち、
動画像を所定単位で符号化する動画像符号化において、量子化処理における重み付けパラメータを用いて、入力画像を所定の目標符号量に符号化する動画像符号化装置の制御を実現するプログラムであって
前記入力画像の分散を算出する分散算出工程のプログラムコードと、
前記入力画像に対して、与えられたフィルタ特性によりフィルタ処理を行うフィルタ工程のプログラムコードと、
前記フィルタ工程でフィルタ処理された入力画像に対して、量子化処理を行い、符号化する符号化工程のプログラムコードと、
前記符号化工程が出力する符号化データに対して復号化処理を行う復号化工程と、
前記符号化工程の入力画像と前記復号化工程の出力である再構成ピクチャからブロック歪みを検出する検出工程のプログラムコードと、
前記符号化工程における符号量と符号化歪み量との関係を規定する規定式を決定する規定式決定工程のプログラムコードと、
前記分散算出工程で算出された分散及び少なくとも前記検出工程の検出結果を含む、視覚感度を評価するための評価式を決定する評価式決定工程のプログラムコードと、
前記入力画像の目標符号量、前記規定式及び前記評価式に基づいて、前記フィルタ工程における前記フィルタ特性及び量子化処理における重み付けパラメータを算出するパラメータ算出工程のプログラムコードと
を備える。
上記の目的を達成するための本発明による動画像符号化装置は以下の構成を備える。即ち、
動画像を所定単位で符号化する動画像符号化において、量子化処理における重み付けパラメータを用いて、入力画像を所定の目標符号量に符号化する動画像符号化装置であって
前記入力画像の分散を算出する分散算出手段と、
前記入力画像に対して、与えられたフィルタ特性によりフィルタ処理を行うフィルタ手段と、
前記フィルタ手段でフィルタ処理された入力画像に対して、量子化処理を行い、符号化する符号化手段と、
前記符号化手段が出力する符号化データに対して復号化処理を行う復号化手段と、
前記符号化手段の入力画像と前記復号化手段の出力である再構成画像からブロック歪みを検出する検出手段と、
前記入力画像の目標符号量、前記分散算出手段の出力及び前記検出手段の出力に応じて、前記フィルタ手段における前記フィルタ特性及び量子化処理における重み付けパラメータを算出するパラメータ算出手段と
を備えることを特徴とする。
上記の目的を達成するための本発明による動画像符号化方法は以下の構成を備える。即ち
動画像を所定単位で符号化する動画像符号化において、量子化処理における重み付けパラメータを用いて、入力画像を所定の目標符号量に符号化する動画像符号化方法であって
前記入力画像の分散を算出する分散算出工程と、
前記入力画像に対して、与えられたフィルタ特性によりフィルタ処理を行うフィルタ工程と、
前記フィルタ工程でフィルタ処理された入力画像に対して、量子化処理を行い、符号化する符号化工程と、
前記符号化工程が出力する符号化データに対して復号化処理を行う復号化工程と、
前記符号化工程の入力画像と前記復号化工程の出力である再構成画像からブロック歪みを検出する検出工程と、
前記入力画像の目標符号量、前記分散算出工程の算出結果及び前記検出工程の検出結果に応じて、前記フィルタ特性及び量子化処理における重み付けパラメータを算出するパラメータ算出工程と
を備えることを特徴とする。
本発明によれば、画質の劣化具合や人間の視覚特性を考慮して、割り当てられた目標符号量の条件下において符号量と符号化歪み量が最適な動画像符号化データを生成することができる動画像符号化装置及びその方法、プログラムを提供できる。
以下、本発明の実施の形態について図面を用いて詳細に説明する。
本発明では、符号化歪みを伴う不可逆符号化方式に適用した例を詳細に説明する。
実施形態1においては、符号化方式を限定せずに、一般的な不可逆符号化方式に適用した例を示す。実施形態2においては、MPEG符号化方式に適用した例を示す。
<実施形態1>
図1は本発明の実施形態1の動画像符号化装置の構成を示すブロック図である。また、図2は本発明の実施形態1の動画像符号化装置が実行する処理を示すフローチャートである。
以下、図1及び図2を用いて、実施形態1の動画像符号化装置100の動作の詳細について説明する。
尚、動画像符号化装置における量子化処理の重み付けパラメータは、Qスケールであるとする。
図1に示すように、動画像符号化装置100は、大きく分けて、プリフィルタ部101、符号化部102、局所復号化部103及び符号量制御部104のブロックから構成される。また、これらの各ブロックは、ハードウェアで実現されても良いし、ブロックの一部あるいはすべてがソフトウェアとして、CPUやRAM、ROMを用いる制御によって実現されても良い。
動画像符号化装置100の動作を説明するにあたり、現時点においては、図3に示すように、ピクチャI2までの符号化処理が完了しており、次に、ピクチャI3の符号化処理を行うものとする。
まず、図2のステップS200で、外部ブロック(不図示)からピクチャI3の目標符号量Rtが設定される。Rtの算出方法は、本発明に依存するものではなく、例えば、従来例で示されるCBR方式であれば、TM5のステップ1の処理に相当するものである。
動画像符号化装置100では、符号化部102のQスケールを、設定された目標符号量Rtから直接算出するのではなく、目標符号量Rtから想定される符号化歪み量を、視覚感度モデル算出部107及びR−Dモデル算出部109を用いて、プリフィルタ部101と符号化部102に最適に分割する。
ステップS201で、ピクチャI3の分散Siを、分散算出部105で算出する。分散Siの算出方法は、例えば、以下のように算出する。
座標(x,y)、ピクチャサイズをM×N画素、着目するピクチャの平均をAVEとした場合、ピクチャの分散Siは、次式で算出される。
Figure 2005244346
次に、ステップS203〜204で用いる符号化部102のR−Dモデル(R−D規定式)及び視覚感度モデル(視覚感度評価式)について説明する。
実施形態1において適用する符号化部102のR−DモデルRc(Sf,MSEc)は、次式を用いて算出する。
Figure 2005244346
ここで、Ic及びΘcは定数であり、Ic=1及びΘc=0.5の場合には、情報理論において、Rate Distortion理論として知られる符号量と符号化歪み量の関係を表す公知の式である。
fは、符号化部102の入力ピクチャの分散であり、プリフィルタ部101の出力ピクチャの分散に相当する。分散Sfは、実施形態1における動画像符号化装置100の入力ピクチャの分散Si及びプリフィルタ部101のフィルタ特性に応じて変化する変数である。
MSEcは、符号化部102によって生じる符号化歪み量である。MSEcは、符号化部102の入力ピクチャと、局所復号化部103の出力ピクチャとの差分二乗和に相当する変数である。
c及びΘiは、符号化部102の符号化方式に依存するパラメータとして定義する。実施形態1では、符号化部102の符号化方式を限定しない場合を想定しているので、I=1及びΘc=0.5を適用する。
ここで、図4に、式(5)の特性を表す図として、Sf=2300、Ic=1及びΘc=0.5の場合の符号量Rcと符号化歪み量MSEcとの関係を示す。
ステップS203で用いる視覚感度モデルHvs(Sf,MSEc)は、実施形態1では、次式として定義する。
Figure 2005244346
ここで、MSEfは、プリフィルタ部101において生じるフィルタ歪み量、Bcprevは直前ピクチャの符号化処理時にブロック歪み検出部106で検出したブロック歪み量、及びScprevは符号化部102の直前入力ピクチャの分散Sfである。
更に、式(6)中のフィルタ歪み量MSEfは、次式として定義する。
Figure 2005244346
ここで、αはプリフィルタ部101のフィルタの種類に依存する定数である。
尚、式(5)〜式(7)で使用される変数及び定数の一覧を図5に示す。
次に、実施形態1において使用する式(6)及び(7)の視覚感度モデルHvs(Sf,MSEc)の特徴を、以下に示す。
特徴1:符号化部102において生じる符号化歪み量MSEcのみならず、プリフィルタ部101で生じるフィルタ歪み量MSEf(Sf)を考慮することで、動画像符号化装置100全体の歪み量の評価が可能であり、高精度な画質の制御が可能である。
特徴2:ブロック歪み量Bcpfevを評価量として追加することにより、人間の視覚感度に近い画質の評価が可能である。
式(6)及び式(7)を用いて、ステップS202で、動画像符号化装置100の入力ピクチャの分散Si、符号化部102の直前入力ピクチャの分散Scprev及び直前ピクチャのブロック歪み量Bcprevから、視覚感度モデルHvs(Sf,MSEc)を算出する。
次に、ステップS203のパラメータ算出部108における分散Sf及び符号化歪み量MSEcの算出方法について説明する。
実施形態1においては、動画像符号化装置100に与えられたピクチャの目標符号量の拘束条件下で、ラグランジュ未定乗数法を用いて、二つの視覚感度モデルHvs(Sf,MSEc)及びR−DモデルRc(Sf,MSEc)の関係を最適する分散Sf及び符号化歪み量MSEcを算出する。
即ち、動画像符号化装置100に与えられたピクチャの目標符号量をRtとすれば、拘束条件式は、次式で表せる。
[拘束条件式]
Figure 2005244346
更に、未定乗数をλと定義すれば、
Figure 2005244346
となる。
また、必要条件式として次式を定義する。
[必要条件式]
Figure 2005244346
よって、式(10)及び式(8)から分散Sf及び符号化歪み量MSEcの最適解を算出するためには、ステップS203において、次式を演算する。
Figure 2005244346
但し、実施形態1においてはIc=1及びΘc=0.5である。
また、αはプリフィルタ部101を構成したフィルタの種類に依存する係数であり、動画像符号化装置100を構成した際に予め定める定数である。
次に、ステップS204で、フィルタ特性算出部110において、プリフィルタ部101のフィルタ特性を決定する。実施形態1においては、プリフィルタ部101の入力及び出力ピクチャの分散の変化を用いてフィルタ特性を選択する。
尚、入力ピクチャの分散SiはステップS201で、出力ピクチャの分散SfはステップS203で、算出済みである。
これら二つの分散Si及びSfの関係と、予め定めておいた複数のフィルタ係数の変化に応じた、プリフィルタ部101の入力及び出力ピクチャの分散特性の中から、最も特性の近いフィルタ係数を一つ選択する。
図6は、予め定めておいたフィルタ係数C1〜C5にそれぞれに対応する、プリフィルタ部101の入力及び出力ピクチャの分散特性を示す5つの曲線から、算出した分散Si及びSfの関係に最も近いフィルタ係数C2が選択されていることを示している。
プリフィルタ部101は、パラメータC1〜C5をフィルタ係数算出部110から受け取ることで、対応するフィルタ特性になるようにフィルタ係数を変更する。
ステップS205で、R−Dモデル算出部109において、式(11)から得られた符号化歪み量MSEc及び分散Sfを用いて、R−DモデルRc(Sf,MSEc)から符号化部102の目標符号量Rcを算出する。
これは、式(5)のR−DモデルRc(Sf,MSEc)に、当該符号化歪み量MSEc及び分散Sfを代入することで算出する。
ステップS206で、ステップS205で算出した目標符号量Rcを用いて、符号化部102のQスケールを算出する。Qスケールの算出には、符号化部102のR−Qモデルを使用する。実施形態1においては、符号化部102のR−QモデルRQc(Rc,Sf)として、次の一次式で表現する。
Figure 2005244346
ここで、RcはステップS205において算出した目標符号量Rcであり、SfはステップS203において算出した符号化部102の入力ピクチャの分散Sfである。
また、βcは定数であり、直前のピクチャにおいて使用したRc、Si及びQcの値を、式(12)に再度代入することで得る。但し、実施形態1においては、Qスケールを算出する精度を高めるために、次式を用いてステップS209で、R−QモデルRQc(Rc,Sf)を更新する。
Figure 2005244346
但し、nはR−QモデルRQc(Rc,Sf)に反映させる過去のピクチャ数に相当する。
以上、ステップS200〜ステップS206までの処理が完了した後、ステップS207で、プリフィルタ部101及び符号化部102の処理を実行する。
また、符号化部102の符号化処理と並行して、ステップS208ではブロック歪み検出部106で、ブロック歪み量Bcprevの検出を行う。ブロック歪み量Bcprevは、符号化部102の入力ピクチャと局所復号化部103の出力ピクチャを用いる。
ここで、人間の視覚感度として、ブロック歪みに非常に敏感であることが知られている。このブロック歪みは、8×8画素の正方ブロック単位で直交変換及び量子化処理を施していることがその発生原因である。
ブロック歪み量Bcprevの検出方法は、本発明には依存せずに自由に実装が可能であるが、たとえ同じピクチャに対してブロック歪みを検出したとしても、ブロック歪み量Bcprevは検出方法に依存して異なる。
しかし、その違いは、式(6)の視覚モデルHvs(Sf,MSEc)を考慮し、定数をBcprevに乗じれば良い。この定数は、ブロック歪み検出部106の検出方法が定まれば、実施形態1の動画像符号化装置100を構成した際には一意に決定される値である。
実施形態1においては、ブロック歪み検出部106の検出方法として、8×8ブロック境界の差分二乗和MSEblkとピクチャ全体の差分二乗和MSEallの比を使って算出する。
ここで、符号化部102の入力ピクチャの水平方向の画素数をx_size及び垂直方向の画素数をy_sizeとする。水平方向の座標がJ及び垂直方向の座標がIの、符号化部102の入力ピクチャの画素値をCIN(J,I)とし、同様に、局所復号化部103の出力ピクチャの画素値をCOUT(J,I)とすれば、ブロック歪み量Bcprevは、以下の(14)式で算出する。
Figure 2005244346
ここで、MSEallは,CIN(J,I)とCOU(J,I)とのピクチャ全体における差分二乗和であり、γはブロック歪み検出部106の検出方法に依存する定数である。
以上説明したように、実施形態1によれば、以上のステップS200〜ステップS209の処理を、動画像符号化処理装置100にピクチャを入力する毎に繰り返し行うことにより、画質の劣化具合や人間の視覚特性を考慮した、プリフィルタ部101及び符号化部102の制御を実現することができる。
よって、割り当てられた目標符号量の条件下において符号量と符号化歪み量が最適な符号化動画像データを得ることができる。
<実施形態2>
実施形態2として、符号化部にMPEG−4符号化方式に適用した例を詳細に説明する。
図7は本発明の実施形態2の動画像符号化装置の構成を示すブロック図である。また、図8は本発明の実施形態2の動画像符号化装置が実行する処理を示すフローチャートである。
ここで、図7の実施形態2の動画像符号化装置800を構成する各ブロックと、図1の実施形態1の動画像符号化装置100を構成する各ブロックとの相違点は、次の二つである。
ブロックの相違点1:図1のプリフィルタ部101が、図7のバターワースフィルタ部801に相当する。
ブロックの相違点2:図1の符号化部102が、図7のMPEG符号化部802に相当する。
尚、符号量制御部804の内部ブロック構成は、図1の符号量制御部104の内部ブロック構成と同様である。
また、MPEG符号化部802は、動き検出部(ME)805、DCT部806、量子化部(QTZ)807、可変長符号化部(VLC)808を有している。また、局所MPEG復号化部803は、動き補償部(MC)809、逆DCT部(IDCT)810、逆量子化部(IQTZ)811のブロックを有している。
また、これらの各ブロックは、ハードウェアで実現されても良いし、ブロックの一部あるいはすべてがソフトウェアとして、CPUやRAM、ROMを用いる制御によって実現されても良い。
次に、図8の実施形態2の動画像符号化装置が実行する処理を示すフローチャートと、図1の実施形態1の動画像符号化装置100が実行する処理を示すフローチャートとの相違点は、次の二つである。
処理の相違点1:図8のステップS904及び906の処理で用いるR−Dモデルが、図2のステップS203及び205で用いるR−Dモデルと異なる。
処理の相違点2:図8のステップS905で行うフィルタ特性の選択方法が、図2のステップS204で行うフィルタ特性の選択方法と異なる。
以後、MPEG−4符号化方式における全体の処理の中で、実施形態2の動画像符号化装置800の処理が対応する部分について説明した後、前記2つの処理の相違点ついて、それぞれ詳細に説明する。
[全体の処理の中で対応する部分]
実施形態2では、図9に示すように、ストリーム全体を、複数のピクチャからなるシーケンスに分割する。符号量制御は、このシーケンスを一つの単位として行い、シーケンス単位で、それぞれ同一のビット・レートになるように符号化する。例えば、このシーケンスは、MPEG−4符号化方式のシンタックスにおいて、Group_of_VideoObjectPlane()に対応する。
図10は、一つのシーケンスにおけるMPEG−4符号化方式の処理を示すフローチャートである。シーケンスを構成するピクチャの数及びシーケンスの目標符号量は、本発明には依存しない。
例えば、ステップS1000で、シーケンスの目標符号量が、従来技術の式(1)中のRgopに対応しているとする。この場合、ステップS1001で、シーケンスを構成する一つのピクチャの目標符号量Rtを算出するため、従来技術の式(2)及び(3)を用いることができる。
シーケンスを構成する一つのピクチャの目標符号量Rtが算出された後、ステップS1002で、図8の処理を繰り返すことで、シーケンスを構成するすべてのピクチャの符号化を行う。
[処理の相違点1]
実施形態2においても、実施形態1と同様に、MPEG符号化部802のR−DモデルRc(Sf,MSEc)を定義する。尚、実施形態2の動画像符号化処理装置800が対象とするピクチャ・タイプはIピクチャ及びPピクチャの2つとする。
式(5)のR−DモデルRc(Sf,MSEc)の2つの定数Ic及びΘcの値を、実施形態2のMPEG符号化部801の符号量Rcと符号化歪み量MSEcとの関係を表すように定義する。
MPEG−4符号化方式のPピクチャの符号化においては、ピクチャ内のみ情報を用いるIピクチャの符号化と異なり、隣り合うピクチャ間の相関を利用して差分演算を行う。
この差分演算は、図7中の動き検出処理を行うME805及び動き補償処理を行うMC809のそれぞれ2つのブロックにより実現される。
即ち、MPEG符号化部802の入力ピクチャが同一である場合でも、IピクチャあるいはPピクチャを符号化しているのかによって、直交変換処理を行うDCT806の入力ピクチャの分散が異なってしまい、MPEG符号化部802のR−DモデルRc(Sf,MSEc)を表現することができないという課題が生じる。
この課題を解決するためには、Iピクチャ及びPピクチャのいずれの符号化時においても、DCT806の入力ピクチャの分散Sfを算出して、それを式(5)中の分散Sfと定義すれば良い。但し、この場合には、新たに、ME805及びMC809の処理を考慮した分散モデルを新たに定義する必要がある。
そこで、実施形態2においては、ピクチャ・タイプに応じた二つのR−DモデルRc(Sf,MSEc)を定義する。
図11は、MPEG符号化部801のIピクチャにおけるR−DモデルRic(Sf,MSEc)の符号量Rcと符号化歪み量MSEcの関係を示した図である。
図11中の「−▲−」で示される曲線は、式(5)中の二つの定数Ic及びΘcをそれぞれ、Ic=1及びΘc=0.5としたR−Dモデルに、「−■−」で示される曲線は、Ic=0.1及びΘc=0.25とした実施形態2のMPEG符号化部802のIピクチャに対応したIピクチャR−DモデルRic(Sf,MSEc)にそれぞれ対応する。更には、「−◆−」で示される曲線は、実際にMPEG−4符号化方式でIピクチャを符号化した場合の実測値を示している。
図11において、符号量Rcが0.5以上の領域において、実測値の曲線とIピクチャR−DモデルRic(Sf,MSEc)の曲線の間に大きな乖離が生じている。
尚、符号量Rc=0.5に相当するビット・レートは、MPEG符号化部802の入力ピクチャの画像サイズがVGA、サブサンプル4−2−0及びフレーム・レート30fpsの場合に、6.6Mbpsという非常に高いビット・レートに相当する。
ここで、MPEG符号化部802において、このような高ビット・レートによる符号化を行った際には、視覚的に目立つ程度にブロック歪みが発生することは稀であり、そもそもバターワースフィルタ部801においてブロック歪みを緩和するようなプリフィルタ処理が必要とされない。
即ち、ステップS903〜ステップS906までのバターワースフィルタ部801のフィルタ特性を制御するための処理を省略することができる。
よって、ステップS902で、動画像符号化装置800に与えられたピクチャの目標符号量が0.5bit/pixel以上の場合には、ステップS907へ分岐することとする。
一方、MPEG符号化部801のPピクチャに対応した、PピクチャR−DモデルRpc(Sf,MSEc)の符号量Rcと符号化歪み量MSEcの関係を図12に示す。
PピクチャR−DモデルRpc(Sf,MSEc)は、図12中の「−■−」で示される曲線に対応し、式(5)中の二つの定数Ic及びΘcが、それぞれIc=0.15及びΘc=0.15である。また、「−▲−」は図11と同様のR−Dモデルに対応し、「−◆−」で示される曲線は、実際にMPEG−4符号化方式でPピクチャを符号化した場合の実測値を示している。
図12において、IピクチャR−DモデルRic(Sf,MSEc)と同様に、符号量Rcが0.5以上の領域において実測値と大きく乖離を生じるが、この領域においてはPピクチャR−DモデルRpc(Sf,MSEc)を使用しない。
前記の通りにステップS904及び906が、図2に示す実施形態1のステップS203及びステップS205とそれぞれ異なる点は、実施形態1のR−DモデルRc(Sf,MSEc)の代わりに、ピクチャ・タイプに応じて、2つのIピクチャR−DモデルRic(Sf,MSEc)及びPピクチャR−DモデルRpc(Sf,MSEc)を使用する点のみである。
よって、ステップS904及び906においては、実施形態1で示したステップS203及びステップS205の処理をピクチャ・タイプに応じて、式(5)の定数Ic及びΘcを前記の通り定義して行えば良い。
次に、ステップS905における処理について説明する。
実施形態2の動画符号化装置800では、プリフィルタ部としてバターワース特性をもつバターワースフィルタ部801を用いる。
バターワースフィルタは、最大平坦特性をもつことが知られており、周波数応答特性が次数により決定されることが特徴である。
実施形態2においては、カットオフ周波数を固定とし、バターワースフィルタの次数を変化させることでバターワースフィルタ部801のフィルタ特性を変化させる。
次数を1から5まで変化させた場合のバターワースフィルタ部801の入力ピクチャの周波数Fiと当該フィルタ通過後の周波数Ffとの関係を表すグラフを図13に示す。
ステップS901で算出したバターワースフィルタ部801の入力ピクチャの分散Siと、ステップS904で得られたバターワースフィルタ部801の出力ピクチャの分散Sfの関係を用いて、予め定めておいた図13に示す次数に応じたバターワースフィルタ部801の周波数FiとFfの関係を表す曲線の中から、分散SiとSfの関係と、最も近い周波数FiとFfの関係を表す次数を選択すれば良い。
尚、次数0の場合には、バターワースフィルタの機能はオフになる。
以上説明したように、実施形態2によれば、MPEG−4符号化方式においても、実施形態1と同様の効果を得ることができる。
以上説明したように、本発明によれば、プリフィルタ部及び符号化部から構成される動画像符号化装置において、画質の劣化具合や人間の視覚特性を考慮し、プリフィルタ部及び符号化部を制御することで、割り当てられた目標符号量の条件下において、符号量と符号化歪み量が最適な符号化動画像データを得ることができる。
具体的には、動画像符号化装置に対して予め決定したピクチャの目標符号量を設定する。次に、動画像符号化装置への入力ピクチャの分散Siを算出する。直前のピクチャを符号化する際に、ブロック歪み量Bcprevを、符号化部の入力ピクチャと局所復号化部の出力ピクチャから予め算出しておく。
分散Siとブロック歪み量Bcprevから視覚感度モデルの評価式を決定する。
決定した視覚感度モデルの評価式及び符号化部の符号量と符号化歪み量の関係を規定する規定式(R−Dモデル)を用いて、プリフィルタ部の通過後のピクチャの分散Sf及び符号化部で発生する符号化歪み量MSEcを、入力ピクチャの目標符号量を拘束条件としたラグランジュ未定乗数法の解として算出する。
分散Si及びSfをパラメータとして、プリフィルタ部のフィルタ特性を決定する。
更には、符号化歪み量MSEcとR−Dモデルから符号化部の目標符号量Rcを決定する。
決定した目標符号量Rcを用いて、符号化部の符号量及び量子化処理の重み付けパラメータの関係を規定する規定式(R−Qモデル)から、量子化処理の重み付けパラメータを算出する。
尚、視覚感度モデルは、実施形態1で使用した式(6)の評価式に限定されるものではなく、符号化部のR−Dモデルの符号化歪み量MSEcに相当する変数と、プリフィルタ部の出力ピクチャの分散Sfを変数として含めば良い。
更には、R−Dモデルから得られる符号化部の目標符号量から、Qスケールを算出するR−Qモデルも式(12)に限定されないことは言うまでもない。
以上、実施形態例を詳述したが、本発明は、例えば、システム、装置、方法、プログラムもしくは記憶媒体等としての実施態様をとることが可能であり、具体的には、複数の機器から構成されるシステムに適用しても良いし、また、一つの機器からなる装置に適用しても良い。
尚、本発明は、前述した実施形態の機能を実現するソフトウェアのプログラム(実施形態では図に示すフローチャートに対応したプログラム)を、システムあるいは装置に直接あるいは遠隔から供給し、そのシステムあるいは装置のコンピュータが該供給されたプログラムコードを読み出して実行することによっても達成される場合を含む。
従って、本発明の機能処理をコンピュータで実現するために、該コンピュータにインストールされるプログラムコード自体も本発明を実現するものである。つまり、本発明は、本発明の機能処理を実現するためのコンピュータプログラム自体も含まれる。
その場合、プログラムの機能を有していれば、オブジェクトコード、インタプリタにより実行されるプログラム、OSに供給するスクリプトデータ等の形態であっても良い。
プログラムを供給するための記録媒体としては、例えば、フロッピー(登録商標)ディスク、ハードディスク、光ディスク、光磁気ディスク、MO、CD−ROM、CD−R、CD−RW、磁気テープ、不揮発性のメモリカード、ROM、DVD(DVD−ROM,DVD−R)などがある。
その他、プログラムの供給方法としては、クライアントコンピュータのブラウザを用いてインターネットのホームページに接続し、該ホームページから本発明のコンピュータプログラムそのもの、もしくは圧縮され自動インストール機能を含むファイルをハードディスク等の記録媒体にダウンロードすることによっても供給できる。また、本発明のプログラムを構成するプログラムコードを複数のファイルに分割し、それぞれのファイルを異なるホームページからダウンロードすることによっても実現可能である。つまり、本発明の機能処理をコンピュータで実現するためのプログラムファイルを複数のユーザに対してダウンロードさせるWWWサーバも、本発明に含まれるものである。
また、本発明のプログラムを暗号化してCD−ROM等の記憶媒体に格納してユーザに配布し、所定の条件をクリアしたユーザに対し、インターネットを介してホームページから暗号化を解く鍵情報をダウンロードさせ、その鍵情報を使用することにより暗号化されたプログラムを実行してコンピュータにインストールさせて実現することも可能である。
また、コンピュータが、読み出したプログラムを実行することによって、前述した実施形態の機能が実現される他、そのプログラムの指示に基づき、コンピュータ上で稼動しているOSなどが、実際の処理の一部または全部を行ない、その処理によっても前述した実施形態の機能が実現され得る。
さらに、記録媒体から読み出されたプログラムが、コンピュータに挿入された機能拡張ボードやコンピュータに接続された機能拡張ユニットに備わるメモリに書き込まれた後、そのプログラムの指示に基づき、その機能拡張ボードや機能拡張ユニットに備わるCPUなどが実際の処理の一部または全部を行ない、その処理によっても前述した実施形態の機能が実現される。
本発明の実施形態1の動画像符号化装置の構成を示すブロック図である。 本発明の実施形態1の動画像符号化装置が実行する処理を示すフローチャートである。 本発明の実施形態の符号化対象となるピクチャを説明するための図である。 本発明の実施形態1で使用するR−Dモデルの特性を示す図である。 本発明の実施形態1で使用するパラメータと係数の関係を説明する図である。 本発明の実施形態1のプリフィルタの特性の選択を説明するための図である。 本発明の実施形態2の動画像符号化装置の構成を示すブロック図である。 本発明の実施形態2の動画像符号化装置が実行する処理を示すフローチャートである。 本発明の実施形態2におけるシーケンスの構造を説明するための図である。 本発明の実施形態2のMPEG−4符号化方式の処理を示すフローチャートである。 本発明の実施形態2で使用するIピクチャR−Dモデルの特性を示す図である。 本発明の実施形態2で使用するIピクチャR−Dモデルの特性を示す図である。 本発明の実施形態2の入力ピクチャの周波数とフィルタ通過後の周波数との関係を示す図である。 従来技術のTM5を説明するための図である。 従来の技術のバランス関数を説明するグラフを示す図である。 従来の技術のフィルタ係数を決定するグラフを示す図である。
符号の説明
100 動画像符号化装置
101 プリフィルタ部
102 符号化部
103 局所復号化部
104 符号量制御部
105 分散算出部
106 ブロック歪み検出部
107 視覚感度モデル算出部
108 パラメータ算出部
109 R−Dモデル算出部
110 フィルタ特性算出部
111 R−Qモデル算出部

Claims (10)

  1. 動画像を所定単位で符号化する動画像符号化において、量子化処理における重み付けパラメータを用いて、入力画像を所定の目標符号量に符号化する動画像符号化装置であって
    前記入力画像の分散を算出する分散算出手段と、
    前記入力画像に対して、与えられたフィルタ特性によりフィルタ処理を行うフィルタ手段と、
    前記フィルタ手段でフィルタ処理された入力画像に対して、量子化処理を行い、符号化する符号化手段と、
    前記符号化手段が出力する符号化データに対して復号化処理を行う復号化手段と、
    前記符号化手段の入力画像と前記復号化手段の出力である再構成画像からブロック歪みを検出する検出手段と、
    前記符号化手段における符号量と符号化歪み量との関係を規定する規定式を決定する規定式決定手段と、
    前記分散算出手段で算出された分散及び少なくとも前記検出手段の検出結果を含む、視覚感度を評価するための評価式を決定する評価式決定手段と、
    前記入力画像の目標符号量、前記規定式及び前記評価式に基づいて、前記フィルタ手段における前記フィルタ特性及び量子化処理における重み付けパラメータを算出するパラメータ算出手段と
    を備えることを特徴とする動画像符号化装置。
  2. 前記規定式決定手段は、前記規定式を、前記フィルタ手段でフィルタ処理された入力画像の分散及び前記符号化手段の符号化歪み量を用いて決定する
    ことを特徴とする請求項1に記載の動画像符号化装置。
  3. 前記評価式は、前記検出手段の検出結果と、前記フィルタ手段でフィルタ処理された入力画像の分散及び前記符号化手段における符号化歪み量を含む
    ことを特徴とする請求項1に記載の動画像符号化装置。
  4. 前記パラメータ算出手段は、前記入力画像の目標符号量を拘束条件として、前記規定式と前記評価式の二つの式を最適にする前記フィルタ手段でフィルタ処理された入力画像の分散と、前記符号化手段における符号化歪み量を算出する
    ことを特徴する請求項1に記載の動画像符号化装置。
  5. 前記パラメータ算出手段は、前記符号化手段における符号化歪み量から前記入力画像の目標符号量を算出することで、前記量子化処理の重み付けパラメータを算出する
    ことを特徴とする請求項4に記載の動画像符号化装置。
  6. 前記パラメータ算出手段は、前記フィルタ手段でフィルタ処理された入力画像の分散及び前記符号化手段における符号化歪み量を、前記入力画像の目標符号量が、前記規定式から得られる前記符号化手段の符号量と等しいことを拘束条件として、前記評価式が最大あるいは最小となるラグランジュ未定乗数法を用いて算出する
    ことを特徴とする請求項1に記載の動画像符号化装置。
  7. 動画像を所定単位で符号化する動画像符号化において、量子化処理における重み付けパラメータを用いて、入力画像を所定の目標符号量に符号化する動画像符号化方法であって
    前記入力画像の分散を算出する分散算出工程と、
    前記入力画像に対して、与えられたフィルタ特性によりフィルタ処理を行うフィルタ工程と、
    前記フィルタ工程でフィルタ処理された入力画像に対して、量子化処理を行い、符号化する符号化工程と、
    前記符号化工程が出力する符号化データに対して復号化処理を行う復号化工程と、
    前記符号化工程の入力画像と前記復号化工程の出力である再構成画像からブロック歪みを検出する検出工程と、
    前記符号化工程における符号量と符号化歪み量との関係を規定する規定式を決定する規定式決定工程と、
    前記分散算出工程で算出された分散及び少なくとも前記検出工程の検出結果を含む、視覚感度を評価するための評価式を決定する評価式決定工程と、
    前記入力画像の目標符号量、前記規定式及び前記評価式に基づいて、前記フィルタ工程における前記フィルタ特性及び量子化処理における重み付けパラメータを算出するパラメータ算出工程と
    を備えることを特徴とする動画像符号化方法。
  8. 動画像を所定単位で符号化する動画像符号化において、量子化処理における重み付けパラメータを用いて、入力画像を所定の目標符号量に符号化する動画像符号化装置の制御を実現するプログラムであって
    前記入力画像の分散を算出する分散算出工程のプログラムコードと、
    前記入力画像に対して、与えられたフィルタ特性によりフィルタ処理を行うフィルタ工程のプログラムコードと、
    前記フィルタ工程でフィルタ処理された入力画像に対して、量子化処理を行い、符号化する符号化工程のプログラムコードと、
    前記符号化工程が出力する符号化データに対して復号化処理を行う復号化工程と、
    前記符号化工程の入力画像と前記復号化工程の出力である再構成画像からブロック歪みを検出する検出工程のプログラムコードと、
    前記符号化工程における符号量と符号化歪み量との関係を規定する規定式を決定する規定式決定工程のプログラムコードと、
    前記分散算出工程で算出された分散及び少なくとも前記検出工程の検出結果を含む、視覚感度を評価するための評価式を決定する評価式決定工程のプログラムコードと、
    前記入力画像の目標符号量、前記規定式及び前記評価式に基づいて、前記フィルタ工程における前記フィルタ特性及び量子化処理における重み付けパラメータを算出するパラメータ算出工程のプログラムコードと
    を備えることを特徴とするプログラム。
  9. 動画像を所定単位で符号化する動画像符号化において、量子化処理における重み付けパラメータを用いて、入力画像を所定の目標符号量に符号化する動画像符号化装置であって
    前記入力画像の分散を算出する分散算出手段と、
    前記入力画像に対して、与えられたフィルタ特性によりフィルタ処理を行うフィルタ手段と、
    前記フィルタ手段でフィルタ処理された入力画像に対して、量子化処理を行い、符号化する符号化手段と、
    前記符号化手段が出力する符号化データに対して復号化処理を行う復号化手段と、
    前記符号化手段の入力画像と前記復号化手段の出力である再構成画像からブロック歪みを検出する検出手段と、
    前記入力画像の目標符号量、前記分散算出手段の出力及び前記検出手段の出力に応じて、前記フィルタ手段における前記フィルタ特性及び量子化処理における重み付けパラメータを算出するパラメータ算出手段と
    を備えることを特徴とする動画像符号化装置。
  10. 動画像を所定単位で符号化する動画像符号化において、量子化処理における重み付けパラメータを用いて、入力画像を所定の目標符号量に符号化する動画像符号化方法であって
    前記入力画像の分散を算出する分散算出工程と、
    前記入力画像に対して、与えられたフィルタ特性によりフィルタ処理を行うフィルタ工程と、
    前記フィルタ工程でフィルタ処理された入力画像に対して、量子化処理を行い、符号化する符号化工程と、
    前記符号化工程が出力する符号化データに対して復号化処理を行う復号化工程と、
    前記符号化工程の入力画像と前記復号化工程の出力である再構成画像からブロック歪みを検出する検出工程と、
    前記入力画像の目標符号量、前記分散算出工程の算出結果及び前記検出工程の検出結果に応じて、前記フィルタ特性及び量子化処理における重み付けパラメータを算出するパラメータ算出工程と
    を備えることを特徴とする動画像符号化方法。
JP2004048173A 2003-12-08 2004-02-24 動画像符号化装置及びその方法 Expired - Lifetime JP4478480B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2004048173A JP4478480B2 (ja) 2004-02-24 2004-02-24 動画像符号化装置及びその方法
US11/003,461 US20050123038A1 (en) 2003-12-08 2004-12-06 Moving image encoding apparatus and moving image encoding method, program, and storage medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004048173A JP4478480B2 (ja) 2004-02-24 2004-02-24 動画像符号化装置及びその方法

Publications (3)

Publication Number Publication Date
JP2005244346A true JP2005244346A (ja) 2005-09-08
JP2005244346A5 JP2005244346A5 (ja) 2007-04-12
JP4478480B2 JP4478480B2 (ja) 2010-06-09

Family

ID=35025651

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004048173A Expired - Lifetime JP4478480B2 (ja) 2003-12-08 2004-02-24 動画像符号化装置及びその方法

Country Status (1)

Country Link
JP (1) JP4478480B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4999865B2 (ja) * 2006-12-28 2012-08-15 日本電信電話株式会社 映像処理方法および装置、映像処理プログラム並びにプログラムを記録した記憶媒体

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4999865B2 (ja) * 2006-12-28 2012-08-15 日本電信電話株式会社 映像処理方法および装置、映像処理プログラム並びにプログラムを記録した記憶媒体
US8467460B2 (en) 2006-12-28 2013-06-18 Nippon Telegraph And Telephone Corporation Video processing method and apparatus, video processing program, and storage medium which stores the program

Also Published As

Publication number Publication date
JP4478480B2 (ja) 2010-06-09

Similar Documents

Publication Publication Date Title
JP4901772B2 (ja) 動画像符号化方法及び動画像符号化装置
KR101339566B1 (ko) 모션 벡터 선택
US20200275104A1 (en) System and method for controlling video coding at frame level
JP2000506687A (ja) 知覚量を用いて符号化を最適化し自動操作可能な画像圧縮を実行する装置及び方法
JPH05252507A (ja) 適応的ビット割振り及び量子化を用いたモーション・ビデオ圧縮システム
US11134250B2 (en) System and method for controlling video coding within image frame
JP4908943B2 (ja) 画像符号化装置及び画像符号化方法
KR20000023174A (ko) 엔코딩 장치 및 방법
JP4023324B2 (ja) 透かし埋め込み及び画像圧縮部
JP2007318617A (ja) 画像符号化装置、及び画像符号化プログラム
JP2009188826A (ja) 動画像符号化装置
JP4478480B2 (ja) 動画像符号化装置及びその方法
JP4534106B2 (ja) 動画像符号化システム及び方法
JP2006005466A (ja) 画像符号化方法及び装置
KR20230053243A (ko) 분산형 병렬 인코딩 방법 및 장치
JP2008301270A (ja) 動画像符号化装置及び動画像符号化方法
JP3560958B2 (ja) 動画符号化制御方法および装置
US6404812B1 (en) Method and apparatus for controlling video encoder output bit rate using progressive re-quantization
KR100911098B1 (ko) H.263 영상 부호화에 의한 왜곡량 예측 장치 및 그 방법
JP2008098980A (ja) 動画像符号化装置
JP4177278B2 (ja) 量子化ステップサイズ変更方法、量子化ステップサイズ変更装置、量子化ステップサイズ変更プログラムおよびそのプログラムを記録したコンピュータ読み取り可能な記録媒体
US20080298465A1 (en) Encoding control apparatus, encoding control method, and storage medium
JP2008072608A (ja) 画像符号化装置及び画像符号化方法
JP4747109B2 (ja) 演算量調整装置
JP2007300557A (ja) 画像符号化装置及び画像符号化方法

Legal Events

Date Code Title Description
A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070222

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070222

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20081117

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090302

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090430

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100308

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100315

R150 Certificate of patent (=grant) or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (prs date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130319

Year of fee payment: 3