JP4246722B2 - 動画像予測符号化方法、動画像予測符号化装置、動画像予測符号化プログラム及びそのプログラムを記録したコンピュータ読み取り可能な記録媒体 - Google Patents

動画像予測符号化方法、動画像予測符号化装置、動画像予測符号化プログラム及びそのプログラムを記録したコンピュータ読み取り可能な記録媒体 Download PDF

Info

Publication number
JP4246722B2
JP4246722B2 JP2005245209A JP2005245209A JP4246722B2 JP 4246722 B2 JP4246722 B2 JP 4246722B2 JP 2005245209 A JP2005245209 A JP 2005245209A JP 2005245209 A JP2005245209 A JP 2005245209A JP 4246722 B2 JP4246722 B2 JP 4246722B2
Authority
JP
Japan
Prior art keywords
encoding
encoding target
flatness
moving image
residual signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2005245209A
Other languages
English (en)
Other versions
JP2007060452A (ja
Inventor
淳 清水
隆一 谷田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2005245209A priority Critical patent/JP4246722B2/ja
Publication of JP2007060452A publication Critical patent/JP2007060452A/ja
Application granted granted Critical
Publication of JP4246722B2 publication Critical patent/JP4246722B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

本発明は、動き補償予測を行って動画像を符号化する動画像予測符号化方法及びその装置と、その動画像予測符号化方法の実現に用いられる動画像予測符号化プログラム及びそのプログラムを記録したコンピュータ読み取り可能な記録媒体とに関する。
H.264(例えば、非特許文献1参照)など多くの映像符号化方式では、動き補償予測符号化方式を採用している。この動き補償予測符号化方式は、参照フレームと符号化対象フレームとの間で、映像の動きを補償することで符号化効率を向上させている。
動き補償予測符号化方式の符号化データは、主に、予測残差信号の符号化データと動きベクトルなどのオーバヘッド部の符号化データとからなる。一般に符号化効率は、符号化歪の大きさと発生符号量とにより決まるため、単に予測残差信号の小さい予測符号化モード(動き補償ブロックサイズや参照フレーム、予測方向など動き補償予測信号を生成する方法を示すもの)を選択しても、オーバヘッド部の符号量が多い場合は、必ずしも符号化効率が良くなるとは限らない。
そこで、オーバヘッド部の符号量を考慮して符号化処理を行うことで、符号化効率を向上させることができる。
図5に、一般的な符号化処理のフローチャートを図示する。この図に示すように、符号化処理は、動きベクトルを探索し、予測符号化モードを選択し、予測残差信号及びオーバヘッド部を符号化するという手順をとる。
H.264の参照ソフトウェア(例えば、非特許文献2参照)では、予測符号化モードの選択だけでなく、動き探索でも、オーバヘッド部の符号量を考慮している。その参照ソフトウェアの評価関数は、次式で表現される。
Cost=SAD+λ・MVCost
ここで、この式中、SADは予測残差電力、MVCostは動きベクトルの発生符号量を示している。
H.264では、動きベクトルの符号化は、近傍ブロックの動きベクトルから求めた予測ベクトルとの差分を符号化する。このため、予測ベクトルとの距離が短い動きベクトルほどMVCostが小さくなる。
λは、量子化ステップサイズによって変化させる値である。λを量子化ステップサイズに応じて変化させるのは、次の理由による。量子化ステップサイズが大きくなると、量子化が粗くなることで予測残差信号の発生符号量が小さくなり、符号化コストの多くはオーバヘッド部の符号量となる。逆に、量子化ステップサイズが小さくなると、符号化コストの多くが予測残差信号の発生符号量となる。つまり、予測残差電力に対し、量子化ステップサイズに応じてオーバヘッド部のコストが相対的に変化することになる。これから、λを量子化ステップサイズに応じて変化させるのである。
このような評価関数で符号化コストを算出し、その符号化コストを最小とする動きベクトルや予測符号化モードを選択することで、符号化効率を最大化できる。
ITU-T Rec. H.264, "Advanced video coding for generic audiovisual services," 2003. http://iphome.hhi.de/suehring/tml/download/
先に述べたように、予測残差信号の大きさとオーバヘッド部の符号量とを考慮して符号化を行うことで、符号化効率を向上させることができる。
しかし、一般に符号化歪の指標として用いられるPSNR(Peak Signal to Noise Ratio:入力画像と復号画像との符号化誤差)は、必ずしも主観画質と一致しないことが知られている。例えば、同じPSNRであっても、平坦領域とテクスチャ領域では、主観画質は異なる。
このため、従来のような予測残差信号の大きさとオーバヘッド部の符号量とを考慮した符号化方法では、PSNRを符号化歪の指標とした符号化効率は向上するものの、主観画質を符号化歪の指標とした場合の符号化効率が向上するとは言えない。
一般に、平坦領域では、予測残差電力が小さいことが多く、かつ、予測残差電力が最小となる動きベクトルと、その近傍での予測残差電力の差が小さい場合が多い。このため、符号化コストを計算する際、予測残差信号の大きさよりもオーバヘッド部の符号量が支配的となった場合、予測残差信号を最小とする予測符号化モードは選択されず、符号化歪が増加する可能性がある。上述したように、平坦領域では、歪が目立ちやすいため、符号化歪の増加は、主観画質の低下につながる可能性がある。
また、動きベクトルの符号量は、近傍ブロックの動きベクトル情報から算出される予測ベクトルに依存するため、符号化コストでオーバヘッド部の符号量が支配的になると、実際の動きベクトルではなく、予測ベクトルに近いベクトルを符号化用の動きベクトルとして選択する可能性がある。このため、予測残差信号が十分に伝送されない場合、復号画像では、実際の映像とは異なった動きをする領域や、フレーム毎に被写体の形状が変化する問題が発生する。
次に、図6を使い、雲の映像を符号化する際を例にして、この問題について具体的に説明する。雲の領域は、画素値がほぼ平坦ではあるが、雲の輪郭や影から形状を認識できる。また、雲は、ゆっくりと流れて(動いて)いる場合が多い。図6の例では、左から右に移動していると仮定する。
従来の符号化コストを最小として、雲の領域の動きベクトルを検出すると、予測残差信号の大きさよりも、より小さい動きベクトル符号量の動きベクトルを選択する可能性がある。
例えば、図6の動きベクトルAと動きベクトルBでは、動きベクトルBが実際の動きを表現している。しかし、周辺の空が静止領域と仮定すれば、予測ベクトルが(0,0)に近くなり、結果、動きベクトルAが選択される。動きベクトルAで動き補償を行う際、量子化ステップサイズが大きくなると、予測残差信号が伝送されず、予測残差信号の形状がそのまま復号画像となる。これにより、図6に示すように、徐々に雲が伸びるように見える。これ以外にも、雲がゆっくり動いており、予測ベクトルと雲の動きとが一致しない場合、復号画像での雲の動きが不自然に見える。
このように、平坦領域では、主観画質が低下しやすく、かつ、動き補償予測による不自然な動きが発生する問題がある。
一方、単純に、オーバヘッド部の符号量を考慮せずに動きベクトル探索や予測符号化モードを決定した場合、平坦領域での主観画質低下や不自然な動きの発生は抑えられる。しかし、その場合、発生符号量が増加する問題がある。
以上説明したように、従来の符号化コストの算出方法では、符号化コストとしてオーバヘッド部の符号量が支配的になった場合、PSNRを符号化歪の指標とした符号化効率を最適化することが可能となるものの、主観画質が低下するという問題があった。また、単純に予測残差信号の大きさから符号化コストを算出して符号化処理を行うようにすると、発生符号量が増加するという問題があった。
本発明はかかる事情に鑑みてなされたものであって、符号化効率の低下を抑えつつ、主観画質を向上させることができるようにする新たな動画像予測符号化技術の提供を目的とする。
〔1〕本発明の構成
この目的を達成するために、本発明の動画像予測符号化装置は、動き補償予測を行って動画像を符号化する処理を行うために、(1)符号化対象領域の平坦さの度合いを算出する算出手段と、(2)算出手段の算出した平坦度合いに基づいて、符号化対象領域が平坦領域であるのか否かを判定する判定手段と、(3)判定手段の判定に従って符号化対象領域が平坦領域であることを判定する場合に、予測残差信号の大きさのみに基づいて符号化コストを算出するように制御し、符号化対象領域が平坦領域でないことを判定する場合に、予測残差信号の大きさと予測残差信号以外の情報の符号化に要する発生符号量とに基づいて符号化コストを算出するように制御する制御手段と、(4)符号化対象領域の量子化ステップサイズと予め与えられている閾値とを比較して、量子化ステップサイズがその閾値よりも大きい場合にのみ、制御手段による制御を行うことができるようにする実行手段とを備えるように構成する。
そして、制御手段は、判定手段の判定に従って符号化対象領域が平坦領域であることを判定する場合に、符号化対象領域の符号化に利用可能となる予測符号化モードを、予測残差信号の生成に必要となる動きベクトルの本数が所定の閾値以下となる予測符号化モード制限するように制御する。例えば、符号化対象領域の符号化に利用可能となる予測符号化モードを、1本の動きベクトルから予測残差信号を生成する動き補償予測符号化モードと、動きベクトルを伝送しないスキップモードとの2つに制限するように制御する。
また、判定手段は、符号化対象フレームまたは符号化済みフレームの平坦度合いの平均値と算出手段の算出した符号化対象領域の平坦度合いとを比較するとともに、予め与えられている閾値と算出手段の算出した符号化対象領域の平坦度合いとを比較して、算出手段の算出した符号化対象領域の平坦度合いがその平均値よりも小さく、かつ、算出手段の算出した符号化対象領域の平坦度合いがその閾値よりも小さい場合に、符号化対象領域を平坦領域と判定することがある。
また、算出手段は、符号化対象領域を複数の小ブロックに分割して各小ブロック毎に平坦度合いを算出し、それらの平坦度合いの最小値、最大値を算出することで符号化対象領域の平坦度合いを算出することがあり、この場合には、判定手段は、符号化対象フレームまたは符号化済みフレームの平坦度合いの平均値とその最大値とを比較するとともに、予め与えられている閾値とその最小値とを比較して、その最大値がその平均値よりも小さく、かつ、その最小値がその閾値よりも小さい場合に、符号化対象領域を平坦領域と判定することがある。
以上の各処理手段が動作することで実現される本発明の動画像予測符号化方法はコンピュータプログラムでも実現できるものであり、このコンピュータプログラムは、適当なコンピュータ読み取り可能な記録媒体に記録して提供されたり、ネットワークを介して提供され、本発明を実施する際にインストールされてCPUなどの制御手段上で動作することにより本発明を実現することになる。
〔2〕本発明の処理
このように構成される本発明の動画像予測符号化装置では、画素値の分散、画素間差分の絶対値和、画素間差分の自乗和などを算出することで、符号化対象領域の平坦度合いを算出する。
このとき、符号化対象領域に複数の平坦度合いを持つ領域が含まれる可能性があることを考慮して、符号化対象領域を複数の小ブロックに分割して各小ブロック毎に平坦度合いを算出し、それらの平坦度合いの最小値、最大値を算出することで符号化対象領域の平坦度合いを算出することがある。
この算出した平坦度合いにより符号化対象領域が平坦な領域であることが判定できる場合には、主観画質低下や不自然な動きの発生を抑えるべく、その符号化対象領域について予測残差信号の大きさのみで符号化コストを算出することで、動きベクトルの探索を行い予測符号化モードを決定するように処理することになるが、フレーム全体について予測残差信号の大きさのみで符号化コストを算出するようにしてしまうと、今度は発生符号量が増加してしまうという問題がでる。
そこで、フレームの中で相対的に目立ちやすい符号化対象領域を抽出して、その抽出した符号化対象領域が絶対的な意味においても平坦であるのか否かを判断することで、符号化対象領域が平坦な領域であるのか否かを判定するようにしている。
具体的には、符号化対象フレームまたは符号化済みフレームの平坦度合いの平均値と算出した符号化対象領域の平坦度合いとを比較するとともに、予め与えられている閾値と算出した符号化対象領域の平坦度合いとを比較して、算出した符号化対象領域の平坦度合いがその平均値よりも小さいことで相対的に目立ちやすく、かつ、算出した符号化対象領域の平坦度合いがその閾値よりも小さいことで絶対的な意味においても平坦である場合には、符号化対象領域を平坦領域と判定する。
また、符号化対象領域を複数の小ブロックに分割して各小ブロック毎に平坦度合いを算出して、その最小値、最大値を算出するという構成を採る場合には、符号化対象フレームまたは符号化済みフレームの平坦度合いの平均値とその最大値とを比較するとともに、予め与えられている閾値とその最小値とを比較して、その最大値がその平均値よりも小さいことで相対的に目立ちやすく、かつ、その最小値がその閾値よりも小さいことで絶対的な意味においても平坦である場合には、符号化対象領域を平坦領域と判定する。
このようにして、符号化対象領域が平坦な領域であるのか否かを判定すると、符号化対象領域が平坦領域に属する場合には、主観画質低下や不自然な動きの発生を抑えるべく、その符号化対象領域について予測残差信号の大きさのみで符号化コストを算出することで、動きベクトルの探索を行い予測符号化モードを決定するようにし、一方、符号化対象領域が平坦領域以外に属する場合には、発生符号量の増加を防止すべく、予測残差信号の大きさと予測残差信号以外の情報の符号化に要する発生符号量とから符号化コストを算出することで、動きベクトルの探索を行い予測符号化モードを決定するようにする。
そして、符号化対象領域が平坦領域に属する場合には、予測残差信号の大きさのみで符号化コストを算出することでオーバヘッド部のコスト増加により発生符号量が増大する可能性があることを考慮して、符号化対象領域の符号化に利用可能となる予測符号化モードを、予測残差信号の生成に必要となる動きベクトルの本数が所定の閾値以下となる予測符号化モード制限するように制御して、その中から符号化コストを最小化する予測符号化モードを選択するようにする。例えば、符号化対象領域の符号化に利用可能となる予測符号化モードを、1本の動きベクトルから予測残差信号を生成する動き補償予測符号化モードと、動きベクトルを伝送しないスキップモードとの2つに制限するように制御する。
一方、符号化対象領域が平坦領域以外に属する場合には、予測残差信号の大きさと予測残差信号以外の情報の符号化に要する発生符号量とから符号化コストを算出することに合わせ、符号化コストの最小化を実現可能にするためには予測符号化モードに制限を加えることはできないので、利用可能な予測符号化モードに制限を加えないように制御する。
この処理を行うにあたって、量子化ステップサイズが小さい場合には、予測残差信号の発生符号量が大きくなりオーバヘッド部の符号量が支配的でなくなるので、主観画質の低下が検知されにくくなることを考慮して、符号化対象領域が平坦領域であるのか否かに関わらずに、予測残差信号の大きさと予測残差信号以外の情報の符号化に要する発生符号量とから符号化コストを算出するように制御する。
以上説明したように、本発明によれば、符号化歪や不自然な動きが目立ちやすい平坦領域を抽出し、平坦領域の符号化コスト算出を予測残差信号の大きさのみから計算して符号化処理を行うことで、発生符号量の増加を抑えつつ、平坦領域での主観画質を向上させることができるようになる。
以下、実施の形態に従って本発明を詳細に説明する。
本発明では、主観画質が低下しやすい平坦領域を検出し、符号化制御方法を切り替えることで、符号化効率の低下を抑えつつ、主観画質を向上させることを実現する。
図1に、これを実現するために本発明の実行するフローチャートを図示する。このフローチャートに示すように、本発明では、
〔1〕画素値の分散などを算出することにより、符号化対象領域の平坦度合いを算出し (ステップ10)、
〔2〕その算出した平坦度合いに基づいて、符号化対象領域が主観画質の低下しやすい 平坦領域であるのか否かを評価することで、符号化対象領域の領域種別を判定し (ステップ11,12)、
〔3〕その判定結果に基づいて、平坦な符号化対象領域については、予測残差信号を最 小化するコスト関数で動きベクトルを探索し(ステップ13)、平坦でない符号 化対象領域については、オーバヘッド部の符号量も含めた符号化コストを最小化 するコスト関数で動きベクトルを探索し(ステップ15)、
〔4〕その探索に基づいて、平坦な符号化対象領域については、予測符号化モードを制 限して予測符号化モードを選択し(ステップ14)、平坦でない符号化対象領域 については、予測符号化モードの制限なしに予測符号化モードを選択し(ステッ プ16)、
〔5〕そして、符号化を行う(ステップ17)
という手順をとる。
次に、各ステップで実行する詳細処理について説明する。
(i)平坦度合いの算出方法
先ず最初に、ステップ10で実行する符号化対象領域の平坦度合いの算出方法について説明する。
平坦度合いは、画素値の分散、画素間差分の絶対値和、画素間差分の自乗和などから算出する。
すなわち、下式に示すL2分散やL1分散に従って画素値の分散を算出することで、符号化対象領域の平坦度合いを算出する。ここで、s(i,j)は符号化対象領域内の位置(i,j)の画素値を示し、<s>はその平均値を示す。
Figure 0004246722
また、下式に従って画素間差分の絶対値和actを算出することで、符号化対象領域の平坦度合いを算出する。
Figure 0004246722
また、下式に従って画素間差分の自乗和actを算出することで、符号化対象領域の平坦度合いを算出する。
Figure 0004246722
ここで、符号化対象領域が広い場合、複数の平坦度合いを持つ領域が含まれる可能性があるため、符号化対象領域を小ブロックに分割して平坦度合いを算出することもできる。この場合、符号化対象領域の平坦度合いは小ブロックの数だけ求まるため、それらの中の最小値や最大値を符号化対象領域の平坦度合いとする。
(ii)主観画質が低下しやすい平坦領域の検出方法
次に、ステップ11,12で実行する符号化対象領域が主観画質の低下が目立ちやすい平坦領域であるのか否かの検出方法について説明する。
平坦領域であるのか否かについては、
・予め与えられている固定された閾値
・符号化対象フレームまたは符号化済みフレームの平坦度合いの平均値
という2つの値と平坦度合いとの比較結果から判定する。
なお、符号化対象フレームの平坦度合いの平均値を用いる場合は、事前に符号化対象フレームの平坦度合いを求めておく必要がある。
上記の2つの値よりも符号化対象領域の平坦度合いが小さい場合は、符号化対象領域は平坦領域であると判定する。上記の1つ目の条件は、平坦度合いの絶対的な大きさを評価し、上記の2つ目の条件は、符号化対象フレーム内での平坦度合いの相対的な大きさを評価する。
これらの評価を行う理由は、予測残差を最小化する必要がない領域を排除するためである。例えば、フレーム全体がテクスチャ領域のような映像では、たとえ符号化対象領域の平坦度合いが平均値以下の領域であってもその絶対的な値が大きいため、符号化効率を優先した符号化制御を行ったほうが良い。逆に、画面全体が平坦な映像では、ほとんどの領域が平坦と判断され、発生符号量の増加を招く恐れがある。割り当て符号量が十分にない場合は、符号量割り当て制御に支障が出る可能性がある。そこで、相対的に目立ちやすい符号化対象領域のみについて予測残差信号最小化の符号化制御を行う。
符号化対象領域を小ブロックに分割して平坦度合いを算出している場合、次のような方法により平坦領域であるのか否かを判定することもできる。
まず、小ブロックに分割して求めた平坦度合いについて、最小値と最大値を求める。平坦度合いの小ブロック最大値は、符号化対象領域内で最も歪が目立ちにくい領域の平坦度合いであり、一方、平坦度合いの小ブロック最小値は、符号化対象領域内で最も歪が目立ち易い領域の平坦度合いである。
続いて、平坦度合いの小ブロック最大値と、符号化対象フレームまたは符号化済みフレームの平坦度合いの平均値とを比較する。それと同時に、平坦度合いの小ブロック最小値と、予め与えられている固定された閾値との比較を行う。これら2つの条件を満たす符号化対象領域(小ブロック最大値が平均値以下で、小ブロック最小値が閾値以下の条件を満たす符号化対象領域)は、フレーム内では相対的に歪が目立ちやすい領域であり、かつ、主観画質低下が検知されやすい平坦領域を含むことがわかる。
(iii)符号化制御方法の切り替え方法
次に、ステップ13〜16で実行する平坦領域の判定結果に基づく符号化制御方法の切り替えについて説明する。
符号化制御方法の切り替えは、コスト関数の切り替えと、予測符号化モードの制限とにより実施する。
すなわち、平坦領域では、予測残差信号を最小化するコスト関数を採用し、それ以外の領域では、符号化コストを最小化するコスト関数を採用する。平坦領域では、予測残差信号を最小化するコスト関数を採用するため、オーバヘッド部のコストの増加により発生符号量が増大する可能性がある。そこで、オーバヘッド部のコストを制限するために、予測符号化モードを制限して、制限した予測符号化モードの中から、予測残差信号を最小化する予測符号化モードを選択する。例えば、平坦領域では、動きベクトルの本数が最小の予測符号化モードのみに制限する(動きベクトルの本数に合わせて予測符号化モードを制限する)。
従来方法で問題となっている主観画質の低下は、オーバヘッド部の符号量が支配的になった場合に問題が顕在化する。
つまり、量子化ステップサイズが小さい場合は、予測残差信号の発生符号量が大きくなりオーバヘッド部の符号量が支配的でなくなるので、主観画質の低下は検知されにくい。そこで、符号化制御を切り替えるよりも前に、符号化対象領域の量子化ステップサイズにより、主観画質低下の発生しやすさを評価してもよい。例えば、予め与えられた閾値と比較して、符号化対象領域の量子化ステップサイズが閾値より大きい場合にのみ、その符号化対象領域について、平坦領域の検出と符号化制御の切り替えとを行う。
図2に、この方法を用いる場合の本発明のフローチャートを図示する。この例では、最初にステップ100で量子化ステップサイズを評価し、主観画質低下が顕在化するかどうかを判定して、図1に示したフローチャートの処理に入るのか否かを決定するようにしている。
次に、実施例に従って、本発明について詳細に説明する。
図3に、本発明を具備する動画像符号化装置1の一実施例を図示する。
本発明の動画像符号化装置1は、符号化処理部10と、L1分散算出部11と、L1分散平均値算出部12と、L1分散比較部13と、予測モード制御部14と、切替部15と、量子化ステップ評価部16とを備える。
この符号化処理部10は、予測残差信号の大きさと予測残差信号以外の情報の符号化に要する発生符号量とから符号化コストを算出する“第1のコスト関数算出部”と、予測残差信号の大きさのみから符号化コストを算出する“第2のコスト関数算出部”とを備えて、これらのコスト関数算出部が算出する符号化コストを使って、動きベクトルの探索や予測符号化モードの決定を行うことで符号化対象領域(符号化対象ブロック)の符号化処理を実行する。
L1分散算出部11は、符号化対象ブロックを分割した各小ブロックについて、輝度信号のL1分散を算出することで平坦度合いを算出して、“最大値算出部”を使って、その中の最大L1分散を算出するとともに、“最小値算出部”を使って、その中の最小L1分散を算出する。
L1分散平均値算出部12は、直前に符号化したフレームにおける最小L1分散の平均値を算出することで、平坦度合いの平均値を算出する。
L1分散比較部13は、L1分散算出部11の算出した最大L1分散とL1分散平均値算出部12の算出した平坦度合いの平均値とを比較する“最大値比較部”と、L1分散算出部11の算出した最小L1分散と規定の閾値とを比較する“最小値比較部”とを備えて、それらの比較結果に基づいて、符号化対象ブロックが平坦領域であるのか否かを判定する。
予測モード制御部14は、L1分散比較部13の判定結果に基づいて、符号化処理部10に対して、利用可能な予測符号化モードの情報と使用するコスト関数の種別の情報とを通知する。
切替部15は、予測モード制御部14による制御指示か、予測モード制御部14によらない制御指示(従来技術における制御指示)のいずれか一方を選択して、符号化処理部10に通知する。
量子化ステップ評価部16は、符号化処理部10の用いる量子化ステップサイズを評価して、それに基づいて、切替部15に対して、どちらの制御指示を選択するのかを指示する。
このように構成される本発明の動画像符号化装置1では、符号化対象ブロックを16×16画素とし、4つの小ブロック8×8画素に分割して平坦度合いを算出する。平坦度合いは、輝度信号のL1分散で算出し、符号化対象ブロック内の最小L1分散と最大L1分散とを求める。平坦度合いの平均値は、直前に符号化したフレームにおける最小L1分散の平均値とする。平坦領域の判定には、最小L1分散と最大L1分散とを用いる。また、主観画質の低下が顕在化するかどうかを判断するため、量子化ステップサイズによる判定も行う。
符号化対象ブロックが平坦領域であると判定した場合には、動き補償予測のブロックサイズは16×16画素とし、予測符号化モード選択時には、16×16動き補償予測符号化モードとスキップモード(符号化対象ブロックについて動きベクトルを伝送しない動き補償予測モード)の中から予測符号化モードを選択する。一方、符号化対象ブロックが平坦領域でないと判定した場合には、予測残差信号の大きさと予測残差信号以外の情報の符号化に要する発生符号量とから符号化コストを算出するという構成を採って、それに基づいて動きベクトルや予測符号化モードを決定する。
図4に、このように構成される本発明の動画像符号化装置1の実行するフローチャートを図示する。次に、このフローチャートに従って、本発明の動画像符号化装置1の実行する処理について詳細に説明する。
〔1〕量子化ステップサイズの評価
本発明の動画像符号化装置1では、先ず最初に、ステップ20で、符号化対象ブロックについて、量子化ステップサイズQPと予め定めた定数である閾値THQPとを比較する。QP≧THQPが成立する場合には、次のステップ21の処理に進み、QP<THQPが成立する場合には、後述するステップ27の処理へ直ちに移行する。
〔2〕L1分散の算出
続いて、ステップ21で、符号化対象ブロックを4つに分割した8×8サイズの小ブロックのそれぞれについて、下式に従って、輝度信号のL1分散“ actn ”を算出する。
Figure 0004246722
ここで、sy (i,j)は小ブロックnの輝度信号の画素値、<sy >は小ブロックnの輝度信号の平均値を示す。
〔3〕L1分散の最小値と最大値を算出
続いて、ステップ22で、ステップ21で求めた4つのL1分散に対して下記の演算を施すことで、
actmin = min( act0 , act1 , act2 , act3
actmax = max( act0 , act1 , act2 , act3
L1分散の最小値actmin と最大値actmax を算出する。
〔4〕領域種別の判定
続いて、ステップ23,24で、L1分散の最小値actmin と最大値actmax について、下記の2つの条件が成立するのか否かを評価して、
・actmax <actavg
・actmin <THACT
この2つの条件を同時に満たした場合、符号化対象ブロックを平坦領域と判定する。
ここで、actavg は直前に符号化したフレームのactmin の平均値、THACT は平坦領域判定のための閾値である。
この判定処理に従って平坦な領域であると判断した場合には、ステップ25の処理に進み、平坦でない領域と判断した場合には、ステップ27の処理に進む。
〔5〕16×16サイズで動きベクトル探索
平坦領域であると判断した符号化対象ブロックについては、続いて、ステップ25で、16×16サイズのみで動きベクトルを探索する。その際、動きベクトル情報の符号量(オーバヘッド部の符号量)は考慮せずに、予測残差電力が最小となる動きベクトルを探索する。
〔6〕スキップモード判定
平坦領域であると判断した符号化対象ブロックについては、続いて、ステップ26で、スキップモードの予測残差電力を算出し、16×16サイズの動きベクトル探索の結果と比較して、予測残差信号の差が一定の値OFFSETSAD 以下の場合には、スキップモードとし、OFFSETSAD 以下でない場合には、1本の動きベクトルから予測残差信号を生成する予測符号化モードとする。
ここで、上述の差が一定の値OFFSETSAD 以下の場合にスキップモードとするのは、一般的にスキップモードの方が発生符号量が少なくなるからである。これから、上述の差を求めるのではなくて、それぞれについて実際に符号化コストを算出して、その算出値に基づいて符号化コストの小さくなる方を選択することで、スキップモードにするのか、1本の動きベクトルから予測残差信号を生成する予測符号化モードにするのかを決定するようにしてもよい。
〔7〕動きベクトル探索
平坦領域でないと判断した符号化対象ブロックについては、続いて、ステップ27で、各ブロックサイズ(符号化対象ブロックにおいて利用可能な各ブロックサイズ)で、動きベクトル等のオーバヘッド部の符号量を含めて、符号化コストが最小となる動きベクトルを探索する。
〔8〕予測符号化モード選択
平坦領域でないと判断した符号化対象ブロックについては、続いて、ステップ28で、オーバヘッド部の符号量を含めて、符号化コストが最小となる予測符号化モードを選択する。
〔9〕符号化処理
ステップ26,28の処理を終了すると、最後に、ステップ29で、符号化処理を実行する。
このようにして、図3のように構成される本発明の動画像符号化装置1は、このような処理手順に従って、符号化対象ブロックについて平坦な領域であるのか否かを判定し、その判定結果に基づいて、符号化コストの算出方法の切り替え、予測符号化モードの制限を実行することにより、発生符号量の増加を抑えつつ、平坦領域での主観画質を向上させることを実現するのである。
本発明の実行するフローチャートである。 本発明の実行するフローチャートである。 本発明の動画像符号化装置の一実施例である。 本発明の動画像符号化装置の実行するフローチャートである。 一般的な符号化処理のフローチャートである。 従来技術の問題を説明する説明図である。
符号の説明
1 動画像符号化装置
10 符号化処理部
11 L1分散算出部
12 L1分散平均値算出部
13 L1分散比較部
14 予測モード制御部
15 切替部
16 量子化ステップ評価部

Claims (15)

  1. 動き補償予測を行って動画像を符号化する動画像予測符号化方法において、
    符号化対象領域の平坦さの度合いを算出する過程と、
    上記算出した平坦度合いに基づいて、符号化対象領域が平坦領域であるのか否かを判定する過程と、
    上記判定に従って符号化対象領域が平坦領域であることを判定する場合に、予測残差信号の大きさのみに基づいて符号化コストを算出するように制御するとともに、符号化対象領域の符号化に利用可能となる予測符号化モードを、予測残差信号の生成に必要となる動きベクトルの本数が所定の閾値以下となる予測符号化モードに制限するように制御し、一方、符号化対象領域が平坦領域でないことを判定する場合に、予測残差信号の大きさと予測残差信号以外の情報の符号化に要する発生符号量とに基づいて符号化コストを算出するように制御する過程とを備えることを、
    特徴とする動画像予測符号化方法。
  2. 動き補償予測を行って動画像を符号化する動画像予測符号化方法において、
    符号化対象領域の平坦さの度合いを算出する過程と、
    上記算出した平坦度合いに基づいて、符号化対象領域が平坦領域であるのか否かを判定する過程と、
    上記判定に従って符号化対象領域が平坦領域であることを判定する場合に、予測残差信号の大きさのみに基づいて符号化コストを算出するように制御し、符号化対象領域が平坦領域でないことを判定する場合に、予測残差信号の大きさと予測残差信号以外の情報の符号化に要する発生符号量とに基づいて符号化コストを算出するように制御する過程とを備えることを、
    特徴とする動画像予測符号化方法。
  3. 請求項に記載の動画像予測符号化方法において、
    上記制御する過程では、上記判定に従って符号化対象領域が平坦領域であることを判定する場合に、符号化対象領域の符号化に利用可能となる予測符号化モードを、予測残差信号の生成に必要となる動きベクトルの本数が所定の閾値以下となる予測符号化モードに制限するように制御することを、
    特徴とする動画像予測符号化方法。
  4. 請求項1または3に記載の動画像予測符号化方法において、
    上記制御する過程では、上記判定に従って符号化対象領域が平坦領域であることを判定する場合に、符号化対象領域の符号化に利用可能となる予測符号化モードを、1本の動きベクトルから予測残差信号を生成する動き補償予測符号化モードと、動きベクトルを伝送しないスキップモードとの2つに制限するように制御することを、
    特徴とする動画像予測符号化方法。
  5. 請求項1ないし4のいずれか1項に記載の動画像予測符号化方法において、
    符号化対象領域の量子化ステップサイズと予め与えられている閾値とを比較して、該量子化ステップサイズが該閾値よりも大きい場合にのみ、上記制御を行うことができるようにする過程を備えることを、
    特徴とする動画像予測符号化方法。
  6. 請求項1ないしのいずれか1項に記載の動画像予測符号化方法において、
    記判定する過程では、符号化対象フレームまたは符号化済みフレームの平坦度合いの平均値と上記算出した符号化対象領域の平坦度合いとを比較するとともに、予め与えられている閾値と上記算出した符号化対象領域の平坦度合いとを比較して、上記算出した符号化対象領域の平坦度合いが該平均値よりも小さく、かつ、上記算出した符号化対象領域の平坦度合いが該閾値よりも小さい場合に、符号化対象領域を平坦領域と判定することを、
    特徴とする動画像予測符号化方法。
  7. 請求項1ないしのいずれか1項に記載の動画像予測符号化方法において、
    記算出する過程では、符号化対象領域を複数の小ブロックに分割して各小ブロック毎に平坦度合いを算出し、それらの平坦度合いの最小値、最大値を算出することで符号化対象領域の平坦度合いを算出することを、
    特徴とする動画像予測符号化方法。
  8. 請求項に記載の動画像予測符号化方法において、
    記判定する過程では、符号化対象フレームまたは符号化済みフレームの平坦度合いの平均値と上記最大値とを比較するとともに、予め与えられている閾値と上記最小値とを比較して、上記最大値が該平均値よりも小さく、かつ、上記最小値が該閾値よりも小さい場合に、符号化対象領域を平坦領域と判定することを、
    特徴とする動画像予測符号化方法。
  9. 請求項1ないしのいずれか1項に記載の動画像予測符号化方法において、
    記算出する過程では、画素値の分散、画素間差分の絶対値和、画素間差分の自乗和のいずれかを用いて符号化対象領域の平坦度合いを算出することを、
    特徴とする動画像予測符号化方法。
  10. 動き補償予測を行って動画像を符号化する動画像予測符号化装置において、
    符号化対象領域の平坦さの度合いを算出する手段と、
    上記算出した平坦度合いに基づいて、符号化対象領域が平坦領域であるのか否かを判定する手段と、
    上記判定に従って符号化対象領域が平坦領域であることを判定する場合に、予測残差信号の大きさのみに基づいて符号化コストを算出するように制御するとともに、符号化対象領域の符号化に利用可能となる予測符号化モードを、予測残差信号の生成に必要となる動きベクトルの本数が所定の閾値以下となる予測符号化モードに制限するように制御し、一方、符号化対象領域が平坦領域でないことを判定する場合に、予測残差信号の大きさと予測残差信号以外の情報の符号化に要する発生符号量とに基づいて符号化コストを算出するように制御する手段とを備えることを、
    特徴とする動画像予測符号化装置。
  11. 動き補償予測を行って動画像を符号化する動画像予測符号化装置において、
    符号化対象領域の平坦さの度合いを算出する手段と、
    上記算出した平坦度合いに基づいて、符号化対象領域が平坦領域であるのか否かを判定する手段と、
    上記判定に従って符号化対象領域が平坦領域であることを判定する場合に、予測残差信号の大きさのみに基づいて符号化コストを算出するように制御し、符号化対象領域が平坦領域でないことを判定する場合に、予測残差信号の大きさと予測残差信号以外の情報の符号化に要する発生符号量とに基づいて符号化コストを算出するように制御する手段とを備えることを、
    特徴とする動画像予測符号化装置。
  12. 請求項11に記載の動画像予測符号化装置において、
    上記制御する手段は、上記判定に従って符号化対象領域が平坦領域であることを判定する場合に、符号化対象領域の符号化に利用可能となる予測符号化モードを、予測残差信号の生成に必要となる動きベクトルの本数が所定の閾値以下となる予測符号化モードに制限するように制御することを、
    特徴とする動画像予測符号化装置。
  13. 請求項10ないし12のいずれか1項に記載の動画像予測符号化装置において、
    符号化対象領域の量子化ステップサイズと予め与えられている閾値とを比較して、該量子化ステップサイズが該閾値よりも大きい場合にのみ、上記制御を行うことができるようにする手段を備えることを、
    特徴とする動画像予測符号化装置。
  14. 請求項1ないし9のいずれか1項に記載の動画像予測符号化方法の各過程をコンピュータに実行させるための動画像予測符号化プログラム。
  15. 請求項1ないし9のいずれか1項に記載の動画像予測符号化方法の各過程をコンピュータに実行させるための動画像予測符号化プログラムを記録したコンピュータ読み取り可能な記録媒体。
JP2005245209A 2005-08-26 2005-08-26 動画像予測符号化方法、動画像予測符号化装置、動画像予測符号化プログラム及びそのプログラムを記録したコンピュータ読み取り可能な記録媒体 Active JP4246722B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005245209A JP4246722B2 (ja) 2005-08-26 2005-08-26 動画像予測符号化方法、動画像予測符号化装置、動画像予測符号化プログラム及びそのプログラムを記録したコンピュータ読み取り可能な記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005245209A JP4246722B2 (ja) 2005-08-26 2005-08-26 動画像予測符号化方法、動画像予測符号化装置、動画像予測符号化プログラム及びそのプログラムを記録したコンピュータ読み取り可能な記録媒体

Publications (2)

Publication Number Publication Date
JP2007060452A JP2007060452A (ja) 2007-03-08
JP4246722B2 true JP4246722B2 (ja) 2009-04-02

Family

ID=37923508

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005245209A Active JP4246722B2 (ja) 2005-08-26 2005-08-26 動画像予測符号化方法、動画像予測符号化装置、動画像予測符号化プログラム及びそのプログラムを記録したコンピュータ読み取り可能な記録媒体

Country Status (1)

Country Link
JP (1) JP4246722B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012096146A1 (ja) * 2011-01-13 2012-07-19 日本電気株式会社 映像符号化装置、映像復号装置、映像符号化方法、映像復号方法及びプログラム
JP5702820B2 (ja) * 2013-04-02 2015-04-15 日本電信電話株式会社 予測モード決定方法、動画像符号化装置、及び予測モード決定プログラム

Also Published As

Publication number Publication date
JP2007060452A (ja) 2007-03-08

Similar Documents

Publication Publication Date Title
JP4246723B2 (ja) フレーム内予測符号化制御方法、フレーム内予測符号化制御装置、フレーム内予測符号化制御プログラムおよびそのプログラムを記録したコンピュータ読み取り可能な記録媒体
JP5211263B2 (ja) 符号化ユニットの映像符号化時に局所的多重仮説予測を行う方法および装置
EP2106146A2 (en) Encoding and decoding motion vector information
EP1667464B1 (en) Method and apparatus for encoding moving pictures
JP2008252176A (ja) 動画像符号化装置及び方法
JP4764136B2 (ja) 動画像符号化装置、及びフェードシーン検出装置
JP4074868B2 (ja) 画像符号化制御方法及びその装置
JP4748603B2 (ja) 動画像符号化装置
EP1613091B1 (en) Intra-frame prediction for high-pass temporal-filtered frames in wavelet video coding
JP2007228077A (ja) 動画像符号化装置及びその制御方法、コンピュータプログラム、記憶媒体
JP5649296B2 (ja) 画像符号化装置
US8897585B2 (en) Prediction of pixels in image coding
JP4246722B2 (ja) 動画像予測符号化方法、動画像予測符号化装置、動画像予測符号化プログラム及びそのプログラムを記録したコンピュータ読み取り可能な記録媒体
JP2010041191A (ja) 画像符号化方法及び画像符号化装置
JP2005348008A (ja) 動画像符号化方法、動画像符号化装置、動画像符号化プログラム及びそのプログラムを記録したコンピュータ読み取り可能な記録媒体
JP4759537B2 (ja) 画像符号化方法,画像復号方法,画像符号化装置,画像復号装置,画像符号化プログラム,画像復号プログラムおよびコンピュータ読み取り可能な記録媒体
JP4688170B2 (ja) 動画像符号化装置
JP5171658B2 (ja) 画像符号化装置
JP4829951B2 (ja) フレーム内予測符号化制御方法、フレーム内予測符号化制御装置、フレーム内予測符号化制御プログラムおよびそのプログラムを記録したコンピュータ読み取り可能な記録媒体
JP4676513B2 (ja) 符号化ピクチャタイプ決定方法,装置,そのプログラムおよびその記録媒体
US9948932B2 (en) Image processing apparatus and control method of image processing apparatus
JP4177278B2 (ja) 量子化ステップサイズ変更方法、量子化ステップサイズ変更装置、量子化ステップサイズ変更プログラムおよびそのプログラムを記録したコンピュータ読み取り可能な記録媒体
JP2009232324A (ja) 画像符号化装置、画像符号化方法および画像符号化プログラム
WO2022196133A1 (ja) 符号化装置及び方法
JP7222421B2 (ja) 動画像符号化装置、動画像圧縮装置、動画像符号化方法、及びプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070314

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20080529

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20080828

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080909

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20081022

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20090106

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20090108

R150 Certificate of patent or registration of utility model

Ref document number: 4246722

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120116

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130116

Year of fee payment: 4

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350