JP5513333B2 - 動画像符号化装置、動画像符号化方法、およびプログラム - Google Patents

動画像符号化装置、動画像符号化方法、およびプログラム Download PDF

Info

Publication number
JP5513333B2
JP5513333B2 JP2010212181A JP2010212181A JP5513333B2 JP 5513333 B2 JP5513333 B2 JP 5513333B2 JP 2010212181 A JP2010212181 A JP 2010212181A JP 2010212181 A JP2010212181 A JP 2010212181A JP 5513333 B2 JP5513333 B2 JP 5513333B2
Authority
JP
Japan
Prior art keywords
interpolation filter
filter coefficient
pixel position
decimal pixel
prediction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2010212181A
Other languages
English (en)
Other versions
JP2012070152A (ja
Inventor
知伸 吉野
整 内藤
茂之 酒澤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
KDDI Corp
Original Assignee
KDDI Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by KDDI Corp filed Critical KDDI Corp
Priority to JP2010212181A priority Critical patent/JP5513333B2/ja
Publication of JP2012070152A publication Critical patent/JP2012070152A/ja
Application granted granted Critical
Publication of JP5513333B2 publication Critical patent/JP5513333B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

本発明は、動画像符号化装置、動画像符号化方法、およびプログラムに関する。
非特許文献1には、フレーム間予測を許容する映像圧縮符号化の標準規格が示されている。フレーム間予測では、既に符号化を行った画像から、符号化対象領域の絵柄に類似した絵柄を有する領域を探し、探した領域の画素値を符号化対象領域の予測値とする。以降では、フレーム間予測により予測誤差を求める処理を、動き補償と呼び、符号化対象領域から符号化済みである類似領域までの空間的なベクトルを、動きベクトル(MV;Motion Vector)と呼ぶものとする。
非特許文献1に記載の手法では、類似領域の探索(動き探索)の際に、整数サンプリング位置(整数精度画素)の画素値だけでなく、中間的な位置(小数精度画素)の画素値を補間により生成して、この補間により生成した画素値を予測値とすることもできる。非特許文献1に記載の手法では、1/4精度画素までフレーム間予測が許容される。
一方、非特許文献2には、小数精度の動き探索における補間処理(補間フィルタ係数を用いる処理)について、映像特徴などに適応的に処理する手法(適応的な補間フィルタ係数を用いる手法)が示されている。この非特許文献2に記載の手法によれば、上述の非特許文献1に記載の手法と比べて、高い符号化性能を得ることができる。
また、非特許文献3には、第1の手法と、第2の手法と、が示されている。第1の手法では、画面を複数の領域に分割し、分割領域ごとに最適な補間フィルタ係数を算出して設定する。この第1の手法によれば、同一フレーム内で動きといった特徴の異なるオブジェクトが混在している場合に、オブジェクトごとに最適な補間フィルタ係数を設定することができる。このため、同一フレーム内で共通の補間フィルタ係数を設定する、非特許文献1に記載の手法や非特許文献2に記載の手法と比べて、高い符号化性能を得ることができる。ところが、第1の手法では、スライスごとに、分割領域の位置や形状を示す情報を付与する必要があり、画面内で局所的に最適な補間フィルタ係数を設定するために必要な情報量が増加してしまう。
これに対して、第2の手法では、動きベクトルの大きさや向きといった映像特徴ごとに、適切な補間フィルタ係数を算出して設定する。この第2の手法によれば、上述の第1の手法のように画面を複数の領域に分割する必要がないので、分割領域の位置や形状を示す情報が不要となり、画面内で局所的に最適な補間フィルタ係数を設定するために必要な情報量が増加してしまうのを抑制できる。
Joint Video Team(JVT) of ISO/IEC MPEG and ITU-T VCEG, "Text of ISO/IEC 14496-10 Advanced Video Coding," July 2004. Thomas Wedi, "Adaptive Interpolation Filters and High-Resolution Displacements for Video Coding," IEEE Trans. On Circuits and Systems for Video Technology, Vol.16, No.4, April 2006. 松尾他, "符号化情報を利用した適応補間フィルタ改善手法に関する検討", 電子情報通信学会 総合大会2010, March 2010. G. J. Sullivan, Thomas Wiegand, "Rate-Distortion Optimization for Video Compression," IEEE Signal Processing Magazine, pp.74-90, Nov. 1998.
ところが、非特許文献3に示された第2の手法では、補間フィルタ係数の切替精度が不十分であり、符号化性能を十分には向上させることができない場合があった。
そこで、本発明は、上述の課題に鑑みてなされたものであり、画面内で局所的に最適な補間フィルタ係数を設定でき、かつ、画面内で局所的に最適な補間フィルタ係数を設定するために必要な情報量を抑制できる動画像符号化装置、動画像符号化方法、およびプログラムを提供することを目的とする。
本発明は、上記の課題を解決するために、以下の事項を提案している。
(1) 本発明は、フレーム間予測において小数画素位置(例えば、図3の1/2画素位置や1/4画素位置に相当)における補間値の参照を許容する動画像符号化装置であって、小数画素位置ごとに補間フィルタ係数を設定する補間フィルタ係数設定手段(例えば、図2のフィルタ係数算出部21に相当)と、前記補間フィルタ係数設定手段により設定された補間フィルタ係数を用いて、動き補償予測画像を生成する予測画像生成手段(例えば、図2の動き補償処理部23に相当)と、を備えることを特徴とする動画像符号化装置を提案している。
この発明によれば、フレーム間予測において小数画素位置における補間値の参照を許容する動画像符号化装置に、補間フィルタ係数設定手段および予測画像生成手段を設けた。そして、補間フィルタ係数設定手段により、小数画素位置ごとに補間フィルタ係数を設定し、予測画像生成手段により、補間フィルタ係数設定手段により設定された補間フィルタ係数を用いて、動き補償予測画像を生成することとした。
このため、(1)の動画像符号化装置は、小数画素位置ごとに最適な補間フィルタ係数を設定することで、画面内で局所的に最適な補間フィルタ係数を設定することができる。また、上述の非特許文献3に示された第1の手法と比べて、分割領域の位置や形状を示す情報をスライスごとに付与する必要がないため、画面内で局所的に最適な補間フィルタ係数を設定するために必要な情報量を抑制できる。
(2) (1)の動画像符号化装置について、前記補間フィルタ係数設定手段は、小数画素位置ごとに、予め定められた複数種類の補間フィルタ係数の中から1つを設定することを特徴とする動画像符号化装置を提案している。
この発明によれば、(1)の動画像符号化装置において、補間フィルタ係数設定手段により、小数画素位置ごとに、予め定められた複数種類の補間フィルタ係数の中から1つを設定することとした。
このため、(2)の動画像符号化装置は、小数画素位置ごとに設定する補間フィルタ係数を、予め定められた複数種類の補間フィルタ係数の中から選択することができる。
(3) (2)の動画像符号化装置について、前記補間フィルタ係数設定手段は、R−D最適化法におけるR−Dコストの評価値に基づいて、小数画素位置ごとに補間フィルタ係数を設定することを特徴とする動画像符号化装置を提案している。
この発明によれば、(2)の動画像符号化装置において、補間フィルタ係数設定手段により、R−D最適化法におけるR−Dコストの評価値に基づいて、小数画素位置ごとに補間フィルタ係数を設定することとした。
このため、(3)の動画像符号化装置は、R−D最適化法におけるR−Dコストの評価値に基づいて、最適な補間フィルタ係数を、小数画素位置ごとに設定することができる。
(4) (2)の動画像符号化装置について、前記補間フィルタ係数設定手段は、予測誤差の絶対値和または2乗和の評価値に基づいて、小数画素位置ごとに補間フィルタ係数を設定することを特徴とする動画像符号化装置を提案している。
この発明によれば、(2)の動画像符号化装置において、補間フィルタ係数設定手段により、予測誤差の絶対値和または2乗和の評価値に基づいて、小数画素位置ごとに補間フィルタ係数を設定することとした。
このため、(4)の動画像符号化装置は、予測誤差の絶対値和または2乗和の評価値に基づいて、最適な補間フィルタ係数を、小数画素位置ごとに設定することができる。
(5) (3)または(4)の動画像符号化装置について、前記補間フィルタ係数設定手段は、画面全体で前記評価値を評価し、評価結果に基づいて、小数画素位置ごとに補間フィルタ係数を設定することを特徴とする動画像符号化装置を提案している。
この発明によれば、(3)または(4)の動画像符号化装置において、補間フィルタ係数設定手段により、画面全体で評価値を評価し、評価結果に基づいて、小数画素位置ごとに補間フィルタ係数を設定することとした。
このため、(5)の動画像符号化装置は、(3)または(4)の評価値を画面全体で評価し、評価結果に基づいて、小数画素位置ごとに設定する補間フィルタ係数を設定する。したがって、画面内で局所的に最適な補間フィルタ係数を設定しつつ、画面全体としても最適な補間フィルタ係数を設定することができる。
(6) (3)または(4)の動画像符号化装置について、前記補間フィルタ係数設定手段は、各小数画素位置を参照する動きベクトルに限定して前記評価値を評価し、評価結果に基づいて、小数画素位置ごとに補間フィルタ係数を設定することを特徴とする動画像符号化装置を提案している。
この発明によれば、(3)または(4)の動画像符号化装置において、補間フィルタ係数設定手段により、各小数画素位置を参照する動きベクトルに限定して評価値を評価し、評価結果に基づいて、小数画素位置ごとに補間フィルタ係数を設定することとした。
このため、(6)の動画像符号化装置は、(3)または(4)の評価値を各小数画素位置を参照する動きベクトルに限定して評価し、評価結果に基づいて、小数画素位置ごとに設定する補間フィルタ係数を設定することができる。
(7) 本発明は、フレーム間予測において小数画素位置(例えば、図3の1/2画素位置や1/4画素位置に相当)における補間値の参照を許容する動画像符号化方法であって、小数画素位置ごとに補間フィルタ係数を設定する第1のステップ(例えば、図8のステップS4の処理に相当)と、前記第1のステップにおいて設定した補間フィルタ係数を用いて、動き補償予測画像を生成する第2のステップ(例えば、図8のステップS6の処理に相当)と、を備えることを特徴とする動画像符号化方法を提案している。
この発明によれば、小数画素位置ごとに補間フィルタ係数を設定し、設定した補間フィルタ係数を用いて、動き補償予測画像を生成することとした。これによれば、上述した効果と同様の効果を奏することができる。
(8) 本発明は、フレーム間予測において小数画素位置(例えば、図3の1/2画素位置や1/4画素位置に相当)における補間値の参照を許容する動画像符号化方法を、コンピュータに実行させるためのプログラムであって、小数画素位置ごとに補間フィルタ係数を設定する第1のステップ(例えば、図8のステップS4の処理に相当)と、前記第1のステップにおいて設定した補間フィルタ係数を用いて、動き補償予測画像を生成する第2のステップ(例えば、図8のステップS6の処理に相当)と、をコンピュータに実行させるためのプログラムを提案している。
この発明によれば、プログラムをコンピュータに実行させることで、小数画素位置ごとに補間フィルタ係数を設定し、設定した補間フィルタ係数を用いて、動き補償予測画像を生成することとした。これによれば、上述した効果と同様の効果を奏することができる。
本発明によれば、画面内で局所的に最適な補間フィルタ係数を設定でき、かつ、画面内で局所的に最適な補間フィルタ係数を設定するために必要な情報量を抑制できる。
本発明の一実施形態に係る動画像符号化装置の構成を示すブロック図である。 前記動画像符号化装置が備えるインター符号化予測値生成部の構成を示すブロック図である。 1/4精度動き補償における小数画素位置を示す図である。 予め定められた複数種類の補間フィルタ係数の一例を示す図である。 小数画素位置ごとに補間フィルタ係数を設定した一例を示す図である。 小数画素位置ごとに補間フィルタ係数を設定した一例を示す図である。 小数画素位置ごとに補間フィルタ係数を設定した一例を示す図である。 前記動画像符号化装置の動作を示すフローチャートである。 本発明の一実施形態に係る動画像復号装置の構成を示すブロック図である。 前記動画像復号装置が備えるインター予測値生成部の構成を示すブロック図である。
以下、本発明の実施の形態について図面を参照しながら説明する。なお、以下の実施形態における構成要素は適宜、既存の構成要素等との置き換えが可能であり、また、他の既存の構成要素との組合せを含む様々なバリエーションが可能である。したがって、以下の実施形態の記載をもって、特許請求の範囲に記載された発明の内容を限定するものではない。
[動画像符号化装置AAの構成]
図1は、本発明の一実施形態に係る動画像符号化装置AAの構成を示すブロック図である。動画像符号化装置AAは、イントラ符号化予測値生成部1、インター符号化予測値生成部2、モード判定制御部3、DCT/量子化部4、IDCT/逆量子化部5、エントロピー符号化部6、第1のローカルメモリ7、および第2のローカルメモリ8を備え、マクロブロック単位で符号化を行う。
イントラ符号化予測値生成部1は、入力映像aと、符号化済みブロックにおける局所復号値dと、符号化済みブロックにおける予測方向情報eと、を入力とする。このイントラ符号化予測値生成部1は、符号化済みブロックにおける局所復号値dに基づいて、予測値を生成し、生成した予測値と入力信号との差分を求めることで、符号化歪みを算出する。そして、算出した符号化歪みと、符号化済みブロックにおける予測方向情報eと、に基づいて、符号化に要する符号化コスト値hを算出する。そして、イントラ予測値fと、イントラ予測情報(動きベクトルを含む)gと、符号化コスト値hと、を出力する。
インター符号化予測値生成部2は、入力映像aと、符号化済みブロックにおける局所復号値dと、符号化済みブロックにおける予測方向情報eと、を入力とする。このインター符号化予測値生成部2は、これら入力に基づいて、インター予測値iと、インター予測情報(動きベクトルを含む)jと、係数情報bと、符号化コスト値mと、を出力する。係数情報bには、小数画素位置ごとに設定した補間フィルタ係数が含まれる。
図2は、インター符号化予測値生成部2の構成を示すブロック図である。インター符号化予測値生成部2は、フィルタ係数算出部21、小数位置補間値生成部22、および動き補償処理部23を備える。
フィルタ係数算出部21は、入力映像aと、符号化済みブロックにおける局所復号値dと、を入力とする。このフィルタ係数算出部21は、これら入力に基づいて、小数画素位置ごとに補間フィルタ係数を設定し、小数画素位置ごとに設定した補間フィルタ係数を含む係数情報bを出力する。小数画素位置ごとに補間フィルタ係数を設定する方法としては、例えば、上述の非特許文献4に示されたR−D最適化法に基づく設定方法や、予測誤差情報に基づく設定方法を適用することができる。
<R−D最適化法に基づく設定方法>
R−D最適化法に基づく設定方法には、フレームでのR−Dコスト比較による設定方法と、各小数画素位置を参照する動きベクトルに限定したR−Dコスト比較による設定方法と、がある。
(フレームでのR−Dコスト比較による設定方法)
フレームでのR−Dコスト比較による設定方法では、まず、同一フレーム内の全ての小数画素位置のそれぞれについて、予め定められた複数種類の補間フィルタ係数のそれぞれを用いて符号化する。例えば、N種類の補間フィルタ係数について、M個の小数画素位置が存在する場合には、N通りの符号化を行うこととなる。なお、上述の予め定められた複数種類の補間フィルタ係数は、例えば非特許文献1に記載の手法により、定めることができる。
次に、符号化に用いた補間フィルタ係数ごとに、フレーム全体での符号量Rおよび符号化歪み(原画像と符号化画像との差分二乗和)Dを算出し、式(1)に示すR−Dコスト関数を用いてR−Dコスト値Jを算出する。なお、式(1)において、λは、量子化パラメータによって定まるラグランジュ乗数である。
次に、小数画素位置ごとに、符号化に用いた補間フィルタ係数ごとのR−Dコスト値Jを比較して、R−Dコスト値Jの最も小さい補間フィルタ係数を、その小数画素位置における補間フィルタ係数として設定する。
ここで、R−Dコスト値は、マクロブロックごとに独立であり、フレーム全体のR−Dコスト値は、同一フレーム内の各マクロブロックにおけるR−Dコスト値の合計に等しくなる。このため、十分な性能を得られない場合のR−Dコスト値の算出(符号化処理)について、途中で打ち切ることができる。
具体的には、ある補間フィルタ係数を用いた符号化において、各マクロブロックの符号化が完了するたびに、R−Dコスト値を加算する。そして、R−Dコスト値の総計が、フレーム全体のR−Dコスト値の算出を完了した場合におけるR−Dコスト値を上回った場合には、符号化中である補間フィルタ係数が選択されることはないので、この補間フィルタ係数についてのR−Dコスト値の算出を打ち切ることができる。これによれば、各小数画素位置における補間フィルタ係数を設定する際の処理量を、削減することができる。
(各小数画素位置を参照する動きベクトルに限定したR−Dコスト比較による設定方法)
各小数画素位置を参照する動きベクトルに限定したR−Dコスト比較による設定方法では、まず、フレーム単位でR−Dコスト値Jを算出する。例えば、P種類の補間フィルタ係数について、Q個の小数画素位置が存在する場合には、P×Q通りの符号化を行うこととなる。なお、上述の予め定められた複数種類の補間フィルタ係数は、例えば、非特許文献1に記載の手法により、定めることができる。また、小数画素位置のうち、補間フィルタ係数を設定する小数画素位置を除くものについては、上述の非特許文献1に記載の手法により求めることのできる補間フィルタ係数を用いる。また、R−Dコスト値Jの算出は、上述の式(1)により行う。
次に、小数画素位置ごとに、符号化に用いた補間フィルタ係数ごとのR−Dコスト値Jを比較して、R−Dコスト値Jの最も小さい補間フィルタ係数を、その小数画素位置における補間フィルタ係数として設定する。
なお、各小数画素位置に限定したR−Dコスト比較による設定方法では、上述のフレームでのR−Dコスト比較による設定方法と同様に、十分な性能を得られない場合のR−Dコスト値の算出(符号化処理)を途中で打ち切って、各小数画素位置における補間フィルタ係数を設定する際の処理量を、削減することができる。
<予測誤差情報に基づく設定方法>
予測誤差情報に基づく設定方法には、フレームでの予測誤差情報比較による設定方法と、各小数画素位置を参照する動きベクトルに限定した予測誤差情報比較による設定方法と、がある。ここで、予測誤差情報とは、予測誤差に関する絶対値和(SAD;Sum of Absolute Difference)、または、予測誤差に関する2乗誤差和(SSD;Sum of Square Difference)のことである。
(フレームでの予測誤差情報比較による設定方法)
フレームでの予測誤差情報比較による設定方法では、まず、上述のフレームでのR−Dコスト比較による設定方法と同様に、同一フレーム内の全ての小数画素位置のそれぞれについて、予め定められた複数種類の補間フィルタ係数のそれぞれを用いて符号化する。次に、符号化に用いた補間フィルタ係数ごとに、フレーム全体でのSADまたはSSDを算出する。
次に、小数画素位置ごとに、符号化に用いた補間フィルタ係数ごとのSADまたはSSDを比較して、SADまたはSSDの最も小さい補間フィルタ係数を、その小数画素位置における補間フィルタ係数として設定する。
なお、フレームでの予測誤差情報比較による設定方法では、上述のフレームでのR−Dコスト比較による設定方法と同様に、十分な性能を得られない場合のSADまたはSSDの算出を途中で打ち切って、各小数画素位置における補間フィルタ係数を設定する際の処理量を、削減することができる。
(各小数画素位置を参照する動きベクトルに限定した予測誤差情報比較による設定方法)
各小数画素位置を参照する動きベクトルに限定した予測誤差情報比較による設定方法では、まず、上述の各小数画素位置を参照する動きベクトルに限定したR−Dコスト比較による設定方法と同様に、フレーム単位でSADまたはSSDを算出する。なお、小数画素位置のうち、補間フィルタ係数を設定する小数画素位置を除くものについては、上述の非特許文献1に記載の手法により求めることのできる補間フィルタ係数を用いる。
次に、小数画素位置ごとに、符号化に用いた補間フィルタ係数ごとのSADまたはSSDを比較して、SADまたはSSDの最も小さい補間フィルタ係数を、その小数画素位置における補間フィルタ係数として設定する。
なお、フレームでの予測誤差情報比較による設定方法では、上述の各小数画素位置を参照する動きベクトルに限定したR−Dコスト比較による設定方法と同様に、十分な性能を得られない場合のSADまたはSSDの算出を途中で打ち切って、各小数画素位置における補間フィルタ係数を設定する際の処理量を、削減することができる。
図3は、1/4精度動き補償における小数画素位置を示す図である。1/4精度動き補償においては、1つの整数画素位置に対して15種類の小数画素位置X1〜X15が存在する。
ここで、上述の予め定められた複数種類の補間フィルタ係数として、図4の(a)に示す第1の補間フィルタ係数と、図4の(b)に示す第2の補間フィルタ係数と、が定められたものとする。すると、フィルタ係数算出部21は、上述のフレームでのR−Dコスト比較による設定方法や、上述の各小数画素位置を参照する動きベクトルに限定したR−Dコスト比較による設定方法や、上述のフレームでの予測誤差情報比較による設定方法や、上述の各小数画素位置を参照する動きベクトルに限定した予測誤差情報比較による設定方法により、小数画素位置X1〜X15のそれぞれについて、第1の補間フィルタ係数または第2の補間フィルタ係数を設定することとなる。
図5、図6、図7は、小数画素位置X1〜X15のそれぞれについて、第1の補間フィルタ係数または第2の補間フィルタ係数を設定した一例を示す図である。
図2に戻って、小数位置補間値生成部22は、係数情報bと、符号化済みブロックにおける局所復号値dと、を入力とする。この小数位置補間値生成部22は、符号化済みブロックにおける局所復号値dに対して、係数情報bに含まれる小数画素位置ごとの補間フィルタ係数を用いて小数画素位置における補間値を生成し、局所復号値dに関する小数画素位置における補間値qとして出力する。
動き補償処理部23は、入力映像aと、符号化済みブロックにおける局所復号値dと、符号化済みブロックにおける予測方向情報eと、局所復号値dに関する小数画素位置における補間値qと、を入力とする。この動き補償処理部23は、入力映像aと、符号化済みブロックにおける局所復号値dと、局所復号値dに関する小数画素位置における補間値qと、に基づいて、この符号化済みブロックにおける動き補償予測を行って動きベクトルを求める。そして、求めた動きベクトルと、符号化済みブロックにおける予測方向情報eから求められる予測ベクトルと、の差分を計算し、符号化すべきインター予測情報を求める。また、予測誤差および発生符号量に基づいて、インター符号化におけるコスト値を求める。そして、インター予測値i、インター予測情報(動きベクトルを含む)j、および符号化コスト値mとして出力する。
図1に戻って、モード判定制御部3は、イントラ符号化予測値生成部1から出力される符号化コスト値hと、インター符号化予測値生成部2から出力される符号化コスト値mと、を入力とする。このモード判定制御部3は、これら入力される符号化コスト値h、mの比較を行い、処理ブロックに適する符号化モードを選択する。
DCT/量子化部4は、入力映像aと、イントラ予測値fおよびインター予測値iのうちモード判定制御部3により選択された符号化モードに応じたものと、の差分を入力とする。ここで、イントラ予測値fおよびインター予測値iのうちモード判定制御部3により選択された符号化モードに応じたものとは、モード判定制御部3によりイントラ符号化が選択された場合にはイントラ予測値fのことであり、モード判定制御部3によりインター符号化が選択された場合にはインター予測値iのことである。このDCT/量子化部4は、入力される信号に対してDCT処理および量子化処理を施し、量子化されたDCT係数(残差信号)nとして出力する。
IDCT/逆量子化部5は、量子化されたDCT係数(残差信号)nを入力とする。このIDCT/逆量子化部5は、入力される信号に対して逆量子化処理および逆DCT処理を施し、逆DCTされた画素信号pとして出力する。
エントロピー符号化部6は、係数情報bと、量子化されたDCT係数(残差信号)nと、イントラ予測情報gおよびインター予測情報jのうちモード判定制御部3により選択された符号化モードに応じたものと、を入力とする。ここで、イントラ予測情報gおよびインター予測情報jのうちモード判定制御部3により選択された符号化モードに応じたものとは、モード判定制御部3によりイントラ符号化が選択された場合にはイントラ予測情報gのことであり、モード判定制御部3によりインター符号化が選択された場合にはインター予測情報jのことである。このエントロピー符号化部6は、入力される信号に対してエントロピー符号化を行ったり、小数画素位置ごとに設定された補間フィルタ係数をスライスヘッダに記述してエントロピー符号化を行ったりして、符号化データcとして出力する。
第1のローカルメモリ7は、イントラ予測値fおよびインター予測値iのうちモード判定制御部3により選択された符号化モードに応じたものと、逆DCTされた画素信号pと、の和をとった信号、すなわち符号化済みブロックにおける局所復号値dを入力とする。この第1のローカルメモリ7は、符号化済みブロックにおける局所復号値dを蓄積し、適宜、イントラ符号化予測値生成部1およびインター符号化予測値生成部2に供給する。
第2のローカルメモリ8は、イントラ予測情報gおよびインター予測情報jのうちモード判定制御部3により選択された符号化モードに応じたもの、すなわち符号化済みブロックにおける予測方向情報eを入力とする。ここで、イントラ予測情報gおよびインター予測情報jのうちモード判定制御部3により選択された符号化モードに応じたものとは、モード判定制御部3によりイントラ符号化が選択された場合にはイントラ予測情報gのことであり、モード判定制御部3によりインター符号化が選択された場合にはインター予測情報jのことである。この第2のローカルメモリ8は、符号化済みブロックにおける予測方向情報eを蓄積し、適宜、イントラ符号化予測値生成部1およびインター符号化予測値生成部2に供給する。
[動画像符号化装置AAの動作]
図8は、動画像符号化装置AAの動作を示すフローチャートである。
ステップS1において、動画像符号化装置AAは、モード判定制御部3により、処理ブロックに適する符号化モードがインター符号化であるか否かを判別する。そして、インター符号化であると判別した場合には、ステップS3に処理を移し、インター符号化ではないと判別した場合には、ステップS2に処理を移す。
ステップS2において、動画像符号化装置AAは、イントラ符号化予測値生成部1によりイントラ符号化を行った結果をエントロピー符号化部6に出力し、図8の処理を終了する。
ステップS3において、動画像符号化装置AAは、インター符号化予測値生成部2により、例えば非特許文献1に記載の手法により、複数種類の補間フィルタ係数を定め、ステップS4に処理を移す。
ステップS4において、動画像符号化装置AAは、インター符号化予測値生成部2により、上述のフレームでのR−Dコスト比較による設定方法や、上述の各小数画素位置を参照する動きベクトルに限定したR−Dコスト比較による設定方法や、上述のフレームでの予測誤差情報比較による設定方法や、上述の各小数画素位置を参照する動きベクトルに限定した予測誤差情報比較による設定方法により、小数画素位置ごとに、ステップS3において定めた複数種類の補間フィルタ係数の中から最適なものを1つ設定し、ステップS5に処理を移す。
ステップS5において、動画像符号化装置AAは、インター符号化予測値生成部2により、全ての小数画素位置について、補間フィルタ係数を設定したか否かを判別する。そして、設定したと判別した場合には、ステップS6に処理を移し、設定していないと判別した場合には、ステップS4に処理を移す。
ステップS6において、動画像符号化装置AAは、ステップS4において設定した補間フィルタ係数を用いてインター符号化予測値生成部2によりインター符号化を行った結果をエントロピー符号化部6に出力し、図8の処理を終了する。
[動画像復号装置BBの構成]
図9は、本発明の一実施形態に係る動画像復号装置BBの構成を示すブロック図である。動画像復号装置BBは、符号化データ解析部110、予測手法制御部120、インター予測値生成部130、イントラ予測値生成部140、およびメモリ150を備え、動画像符号化装置AAにおいて生成された符号化データcを復号する。
符号化データ解析部110は、符号化データcを入力とする。この符号化データ解析部110は、まず、符号化シンタックスに従って、符号化データcに記載されている内容を解析し、エントロピー復号する。そして、エントロピー復号の結果として得られる、エントロピー復号された残差信号Bと、上述の小数画素位置ごとに設定された補間フィルタ係数Cと、エントロピー復号された予測情報Dと、を出力する。
予測手法制御部120は、エントロピー復号された予測情報Dを入力とする。この予測手法制御部120は、エントロピー復号された予測情報Dが、イントラ予測に関するものであるのか、インター予測に関するものであるのかを識別し、イントラ予測とインター予測とを切り替えるための制御信号Eを出力する。
インター予測値生成部130には、小数画素位置ごとに設定された補間フィルタ係数Cが入力されるとともに、制御信号Eに応じて、復号済み画素値Aと、エントロピー復号された予測情報Dと、が入力される場合がある。具体的には、復号済み画素値Aと、エントロピー復号された予測情報Dとは、エントロピー復号された予測情報Dがインター予測に関するものであると予測手法制御部120により識別された場合に、インター予測値生成部130に入力される。このインター予測値生成部130は、復号済み画素値Aを元に、エントロピー復号された予測情報Dに従ってインター予測値Fを生成し、出力する。
図5は、インター予測値生成部130の構成を示すブロック図である。インター予測値生成部130は、小数位置補間値生成部131および動き補償処理部132を備える。
小数位置補間値生成部131は、復号済み画素値Aと、小数画素位置ごとに設定された補間フィルタ係数Cと、を入力とする。この小数位置補間値生成部131は、復号済み画素値Aに対して、小数画素位置ごとに設定された補間フィルタ係数Cに従って、復号済み画素値Aに関する小数画素位置における補間値Hを生成し、出力する。
動き補償処理部132は、復号済み画素値Aと、小数画素位置ごとに設定された補間フィルタ係数Cと、エントロピー復号された予測情報Dと、復号済み画素値Aに関する小数画素位置における補間値Hと、を入力とする。この動き補償処理部132は、エントロピー復号された予測情報Dから生成される動きベクトルに基づいて、復号済み画素値Aを参照してインター予測値Fを生成し、出力する。
図9に戻って、イントラ予測値生成部140には、制御信号Eに応じて、復号済み画素値Aと、エントロピー復号された予測情報Dと、が入力される場合がある。具体的には、復号済み画素値Aと、エントロピー復号された予測情報Dとは、エントロピー復号された予測情報Dがイントラ予測に関するものであると予測手法制御部120により識別された場合に、イントラ予測値生成部140に入力される。このイントラ予測値生成部140は、復号済み画素値Aを元に、エントロピー復号された予測情報Dに従ってイントラ予測値Gを生成し、出力する。
メモリ150は、エントロピー復号された残差信号Bと、インター予測値Fおよびイントラ予測値Gのうち制御信号Eに応じたものと、の和をとった信号、すなわち復号済み画素値Aを入力とする。ここで、インター予測値Fおよびイントラ予測値Gのうち制御信号Eに応じたものとは、エントロピー復号された予測情報Dがインター予測に関するものであると予測手法制御部120により識別された場合には、インター予測値Fのことであり、エントロピー復号された予測情報Dがイントラ予測に関するものであると予測手法制御部120により識別された場合には、イントラ予測値Gのことである。メモリ150は、入力された復号済み画素値Aを蓄積し、未復号ブロックの復号処理を行う際に、適宜、インター予測値生成部130またはイントラ予測値生成部140に供給する。
以上の動画像符号化装置AAによれば、小数画素位置ごとに、予め定められた複数種類の補間フィルタ係数の中から最適なものを選択し、小数画素位置ごとに補間フィルタ係数を設定する。このため、画面内で局所的に最適な補間フィルタ係数を設定することができる。
また、動画像符号化装置AAによれば、非特許文献3に示された第1の手法と比べて、分割領域の位置や形状を示す情報をスライスごとに付与する必要がないため、画面内で局所的に最適な補間フィルタ係数を設定するために必要な情報量を抑制できる。
なお、本発明の動画像符号化装置AAの処理や、動画像復号装置BBの処理を、コンピュータ読み取り可能な記録媒体に記憶し、記録媒体に記録されたプログラムを動画像符号化装置AAや、動画像復号装置BBに読み込ませ、実行することによって、本発明を実現できる。
また、上述のプログラムは、このプログラムを記憶装置などに格納した動画像符号化装置AAや動画像復号装置BBから、伝送媒体を介して、あるいは、伝送媒体中の伝送波により他のコンピュータシステムに伝送されてもよい。ここで、プログラムを伝送する「伝送媒体」は、インターネットなどのネットワーク(通信網)や電話回線などの通信回線(通信線)のように情報を伝送する機能を有する媒体のことをいう。
また、上述のプログラムは、上述の機能の一部を実現するためのものであってもよい。さらに、上述の機能を動画像符号化装置AAや動画像復号装置BBにすでに記録されているプログラムとの組合せで実現できるもの、いわゆる差分ファイル(差分プログラム)であってもよい。
以上、この発明の実施形態につき、図面を参照して詳述してきたが、具体的な構成はこの実施形態に限られるものではなく、この発明の要旨を逸脱しない範囲の設計なども含まれる。
例えば、上述の実施形態では、1/4精度動き補償を行う場合について説明したが、これに限らず、例えば1/2精度動き補償や1/8精度動き補償を行う場合についても、本発明を適用することができる。また、上述の実施形態では、予め定められた複数種類の補間フィルタ係数として、2種類の補間フィルタ係数を用いる場合について説明したが、これに限らず、2種類以上の補間フィルタ係数を用いる場合について、本発明を適用することができる。なお、予め定められた補間フィルタ係数の数が、小数画素位置の数より多くなることが好ましい。
また、上述の実施形態では、小数画素位置ごとの補間フィルタ係数について、上述のフレームでのR−Dコスト比較による設定方法や、上述の各小数画素位置を参照する動きベクトルに限定したR−Dコスト比較による設定方法や、上述のフレームでの予測誤差情報比較による設定方法や、上述の各小数画素位置を参照する動きベクトルに限定した予測誤差情報比較による設定方法により、設定するものとしたが、これに限らない。例えば、上述のような設定方法により、小数画素位置ごとに補間フィルタ係数を決定した後に、決定した補間フィルタ係数の数が、予め定められた複数種類の補間フィルタ係数の種類間で略等しくなるように、決定した補間フィルタ係数を適宜変更して、小数画素位置ごとに補間フィルタ係数を設定してもよい。これによれば、予め定められた複数種類の補間フィルタ係数のそれぞれについて、小数画素位置ごとに設定された数が略等しくなる。このため、予め定められた複数種類の補間フィルタ係数において、小数画素位置ごとに設定される補間フィルタ係数の種類に偏りが発生してしまうのを防止できる。したがって、仮に、設定した補間フィルタ係数が小数画素位置にとって最適ではなかった場合でも、符号化性能の低下を抑制できる。よって、画面内で局所的に最適な補間フィルタ係数を設定しつつ、画面全体としても最適な補間フィルタ係数を設定することができる。
また、上述の各実施形態では、動き補償予測におけるフィルタ処理に本発明を適用する場合について説明したが、これに限らず、本発明は、スケーラブル符号化におけるレイヤ間予測や、多視点映像符号化における視差補償予測など、動き補償予測と同様の処理に対しても適用することができる。
AA・・・動画像符号化装置
BB・・・動画像復号装置
1・・・イントラ符号化予測値生成部
2・・・インター符号化予測値生成部
3・・・モード判定制御部
4・・・DCT/量子化部
5・・・IDCT/逆量子化部
6・・・エントロピー符号化部
7・・・第1のローカルメモリ
8・・・第2のローカルメモリ
21・・・フィルタ係数算出部
22・・・小数位置補間値生成部
23・・・動き補償処理部
110・・・符号化データ解析部
120・・・予測手法制御部
130・・・インター予測値生成部
140・・・イントラ予測値生成部
150・・・メモリ
131・・・小数位置補間値生成部
132・・・動き補償処理部

Claims (7)

  1. フレーム間予測において小数画素位置における補間値の参照を許容する動画像符号化装置であって、
    小数画素位置ごとに補間フィルタ係数を設定する補間フィルタ係数設定手段と、
    前記補間フィルタ係数設定手段により設定された補間フィルタ係数を用いて、動き補償予測画像を生成する予測画像生成手段と、を備え
    前記補間フィルタ係数設定手段は、
    小数画素位置ごとに、予め定められた複数種類の補間フィルタ係数の中から1つを設定して、
    フレームごとに、小数画素位置ごとに設定した補間フィルタ係数の数を、前記複数種類の補間フィルタ係数の種類間で等しくすることを特徴とする動画像符号化装置。
  2. 請求項に記載の動画像符号化装置において、
    前記補間フィルタ係数設定手段は、R−D最適化法におけるR−Dコストの評価値に基づいて、小数画素位置ごとに補間フィルタ係数を設定することを特徴とする動画像符号化装置。
  3. 請求項に記載の動画像符号化装置において、
    前記補間フィルタ係数設定手段は、予測誤差の絶対値和または2乗和の評価値に基づいて、小数画素位置ごとに補間フィルタ係数を設定することを特徴とする動画像符号化装置。
  4. 請求項またはに記載の動画像符号化装置において、
    前記補間フィルタ係数設定手段は、画面全体で前記評価値を評価し、評価結果に基づいて、小数画素位置ごとに補間フィルタ係数を設定することを特徴とする動画像符号化装置。
  5. 請求項またはに記載の像画像符号化装置において、
    前記補間フィルタ係数設定手段は、各小数画素位置を参照する動きベクトルに限定して前記評価値を評価し、評価結果に基づいて、小数画素位置ごとに補間フィルタ係数を設定することを特徴とする動画像符号化装置。
  6. フレーム間予測において小数画素位置における補間値の参照を許容する動画像符号化方法であって、
    小数画素位置ごとに補間フィルタ係数を設定する第1のステップと、
    前記第1のステップにおいて設定した補間フィルタ係数を用いて、動き補償予測画像を生成する第2のステップと、を備え
    前記第1のステップでは、
    小数画素位置ごとに、予め定められた複数種類の補間フィルタ係数の中から1つを設定して、
    フレームごとに、小数画素位置ごとに設定した補間フィルタ係数の数を、前記複数種類の補間フィルタ係数の種類間で等しくすることを特徴とする動画像符号化方法。
  7. フレーム間予測において小数画素位置における補間値の参照を許容する動画像符号化方法を、コンピュータに実行させるためのプログラムであって、
    小数画素位置ごとに補間フィルタ係数を設定する第1のステップと、
    前記第1のステップにおいて設定した補間フィルタ係数を用いて、動き補償予測画像を生成する第2のステップと、をコンピュータに実行させ
    前記第1のステップでは、
    小数画素位置ごとに、予め定められた複数種類の補間フィルタ係数の中から1つを設定して、
    フレームごとに、小数画素位置ごとに設定した補間フィルタ係数の数を、前記複数種類の補間フィルタ係数の種類間で等しくするためのプログラム。
JP2010212181A 2010-09-22 2010-09-22 動画像符号化装置、動画像符号化方法、およびプログラム Expired - Fee Related JP5513333B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2010212181A JP5513333B2 (ja) 2010-09-22 2010-09-22 動画像符号化装置、動画像符号化方法、およびプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010212181A JP5513333B2 (ja) 2010-09-22 2010-09-22 動画像符号化装置、動画像符号化方法、およびプログラム

Publications (2)

Publication Number Publication Date
JP2012070152A JP2012070152A (ja) 2012-04-05
JP5513333B2 true JP5513333B2 (ja) 2014-06-04

Family

ID=46166897

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010212181A Expired - Fee Related JP5513333B2 (ja) 2010-09-22 2010-09-22 動画像符号化装置、動画像符号化方法、およびプログラム

Country Status (1)

Country Link
JP (1) JP5513333B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6071618B2 (ja) * 2013-02-20 2017-02-01 日本放送協会 画像処理装置及びプログラム
US9628808B2 (en) * 2013-03-26 2017-04-18 Dolby Laboratories Licensing Corporation Encoding perceptually-quantized video content in multi-layer VDR coding

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8811484B2 (en) * 2008-07-07 2014-08-19 Qualcomm Incorporated Video encoding by filter selection

Also Published As

Publication number Publication date
JP2012070152A (ja) 2012-04-05

Similar Documents

Publication Publication Date Title
JP6545838B2 (ja) マージ候補ブロック誘導方法及びこのような方法を用いる装置
JP3879741B2 (ja) 画像情報符号化装置および画像情報符号化方法
US8094714B2 (en) Speculative start point selection for motion estimation iterative search
RU2547634C2 (ru) Способ и устройство обработки изображения
JP4987322B2 (ja) 動画像復号装置及び動画像復号方法
JP2010135864A (ja) 画像符号化方法及び装置並びに画像復号化方法及び装置
WO2010143583A1 (ja) 画像処理装置および方法
JP4317814B2 (ja) 動画像情報の符号化装置及び符号化方法
KR20120140592A (ko) 움직임 보상의 계산 복잡도 감소 및 부호화 효율을 증가시키는 방법 및 장치
JP2007329693A (ja) 画像符号化装置、及び画像符号化方法
US8144766B2 (en) Simple next search position selection for motion estimation iterative search
JP5649523B2 (ja) 映像符号化方法,装置,映像復号方法,装置およびそれらのプログラム
JP6607040B2 (ja) 動きベクトル探索装置、動きベクトル探索方法、及び動きベクトル探索プログラムを記憶する記録媒体
KR20140029434A (ko) 영상 부호화 방법, 장치, 영상 복호 방법, 장치 및 그 프로그램
JP5670226B2 (ja) 動画像符号化装置、動画像符号化方法、およびプログラム
JP2006100871A (ja) 符号化装置、符号化方法、符号化方法のプログラム及び符号化方法のプログラムを記録した記録媒体
TW201328362A (zh) 影像編碼方法、裝置、影像解碼方法、裝置及該等之程式
JP5439162B2 (ja) 動画像符号化装置および動画像復号装置
JP5513333B2 (ja) 動画像符号化装置、動画像符号化方法、およびプログラム
JP2007251815A (ja) 再符号化装置及び再符号化用プログラム
KR20150100355A (ko) 화면간 예측 방법 및 장치
JP5570363B2 (ja) 動画像符号化装置、動画像復号装置、動画像符号化方法、動画像復号方法、およびプログラム
JP2008054182A (ja) 動画像予測符号化方法および装置
JP5750191B2 (ja) 画像復号化方法
KR102183366B1 (ko) 부호화 모드 결정 방법 및 그 장치

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20130311

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130930

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20131022

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20131119

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20131224

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140325

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140327

R150 Certificate of patent or registration of utility model

Ref document number: 5513333

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees