JP2006279917A - 動画像符号化装置、動画像復号装置及び動画像伝送システム - Google Patents

動画像符号化装置、動画像復号装置及び動画像伝送システム Download PDF

Info

Publication number
JP2006279917A
JP2006279917A JP2005306267A JP2005306267A JP2006279917A JP 2006279917 A JP2006279917 A JP 2006279917A JP 2005306267 A JP2005306267 A JP 2005306267A JP 2005306267 A JP2005306267 A JP 2005306267A JP 2006279917 A JP2006279917 A JP 2006279917A
Authority
JP
Japan
Prior art keywords
image
frame
motion vector
moving image
interpolation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2005306267A
Other languages
English (en)
Inventor
Yuichi Izuhara
優一 出原
Shunichi Sekiguchi
俊一 関口
Kazuo Sugimoto
和夫 杉本
Kotaro Asai
光太郎 浅井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP2005306267A priority Critical patent/JP2006279917A/ja
Publication of JP2006279917A publication Critical patent/JP2006279917A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Television Systems (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

【課題】動きベクトル推定のために必要な情報を入力ストリームから取り出すことで、改めて多くの演算を行わず、更に閾値処理を少なくしてもロバストにフレーム補間処理を行うことが出来る動画像符号化装置及び動画像復号装置を得ることを目的とする。
【解決手段】動画像復号装置28は、可変長復号部2、逆量子化部7、逆直交変換部8、動き補償部10、フレームメモリ11、切替器9、加算部13、フレーム補間処理部17、動きベクトル保存用メモリ18、符号化モード情報保存用メモリ19、予測残差絶対値和保存用メモリ20、切替器24を有している。
【選択図】図1

Description

この発明は、電子情報化された動画像の品質改善、特に、動画像の時間解像度(フレーム数/秒)の改善を可能とする動画像符号化装置、動画像復号装置及び動画像伝送システムに関するものである。
従来、MPEGやITU−T H.26x等の国際標準映像符号化方式では、映像信号の各フレームについて、輝度信号16×16画素とそれに対応する色差信号8×8画素分をまとめたブロックデータ(以下、マクロブロック)を単位として、動き補償技術及び直交変換/変換係数量子化技術に基づいて圧縮する方法が採用されている。
動き補償技術とは、ビデオフレーム間に存在する高い相関を利用してマクロブロック毎に時間方向の信号の冗長度を削減する技術であり、過去に符号化済みの画像を参照画像としてメモリ内に蓄積しておき、参照画像中の所定の探索範囲内で、動き補償予測の対象となっている現マクロブロックと最も差分電力の小さいブロック領域を探索して、現マクロブロックの空間位置と探索結果ブロックの空間位置とのずれを動きベクトルとして符号化する技術である。
上記動きベクトルは、ビデオフレーム間の各ブロックにおける局所的な動きを表していることが多く、その動きベクトル情報を利用して補間フレームを生成する研究がなされている。最も単純なモデルでは、例えば、時間的に隣接するビデオフレーム同士の丁度中間位置に補間フレームを生成する場合、動きベクトルの値を半分にした値を補間フレームの動きベクトルとして採用し、前後のフレームから動き補償するという方法がある。これはビデオフレーム間の動きがリニアであることを仮定した場合のモデルであり、ビデオフレームの間隔が短いほど、また動きベクトルが小さい程その仮定が成り立つため、ある程度の補間フレームを生成することが可能である。
上記動きベクトルは、ビデオフレーム間の各ブロックにおける局所的な動きを表していることが多いものの、実際は最も差分電力の小さいブロック領域を探索して求められるものであり、局所的な動きを表さないこともある。そのような場合、補間フレームに乱れが発生し、非常に目立つことが多いため、そのような「動きを表していないベクトル」を如何に判定し、如何に処理するかが問題となっている。
上記動きベクトルの推定問題に関して、ベクトルの信頼性を判定するのに、フレーム内のイントラマクロブロックの割合や、隣接マクロブロックに対するベクトル同士の差や、フレーム内におけるベクトル差が大きいマクロブロックの個数や、フレーム内の動きベクトルの分散値等を用い、それら全ての閾値処理を行うことで、比較的少ない演算量でベクトルの信頼性の判定を行っている。演算量が少ないところは利点として強調できるものの、映像の内容により適切な閾値は各々敏感に変化する性質があるため、そのような固定値の閾値をもつ処理は、ロバストな設計が困難であった(例えば、非特許文献1参照)。
H.Sasai,S.Kondoh and S.Kadono,"Frame−rate Up−conversion using Reliable Analysis of Transmitted Motion Information". IEEE International Conference on Acoustic,Speech and Signal Processing (ICASSP) 2004,ITT−L1.5,May 2004.
従来のフレーム補間処理は、以上のように行われていたので、動画像の時間解像度改善の問題に対し、少ない演算量で、ロバストにフレーム補間処理を行うことは困難であった。
この発明は上記のような課題を解消するためになされたもので、動きベクトル推定のために必要な情報を入力ストリーム(動画像符号化データ)から取り出すことで、改めて多くの演算を行わず、更に閾値処理を少なくしてもロバストにフレーム補間処理を行うことが出来る動画像符号化装置、動画像復号装置及び動画像伝送システムを得ることを目的とする。
この発明に係る動画像復号装置は、動画像符号化データを解析してブロック単位の符号化シンボルを抽出する解析手段と、前記符号化シンボルを用いて動画像の各フレームを復元して出力する復号手段と、前記符号化シンボルに基づいて、補間フレームの生成方法と補間フレームの動きベクトルとを推定して、前記補間フレームを生成する画像生成部と、前記復号手段からの動画像の出力と前記画像生成部からの補間フレームの出力とを所定のタイミングで切り替える切替器とを備えている。
この発明によれば、少ない処理で効率的かつロバストなフレーム補間処理を実現することができる。
実施の形態1.
以下、この発明の実施の形態1について説明する。実施の形態1では、映像の各フレームを用い、時間的に各フレームの間に存在する補間フレームを生成する動画像復号装置について説明する。動画像復号装置内部では、動画像符号化データを入力として、同データを復号/伸張した後、復号されたフレームを用いたフレーム補間処理を施して補間フレームを生成し、元からある映像の各フレームに生成された補間フレームを合わせた形で再生画像を得る処理を行っている。以下、このような処理に該当する画像生成処理を「フレーム補間処理」と呼ぶ。
実施の形態1に係る動画像復号装置の特徴は、補間フレームを生成するための各種情報を動画像符号化データから取り出すことが可能であり、改めて演算を必要としない点にある。図1は、実施の形態1に係る動画像復号装置の構成図である。図1において、動画像復号装置28は、可変長復号部2、逆量子化部7、逆直交変換部8、動き補償部10、フレームメモリ11、切替器9、加算部13、補間画像生成部17、動きベクトル保存用メモリ18、符号化モード情報保存用メモリ19、予測残差絶対値和保存用メモリ20、切替器24を有している。
次に、図1の動画像復号装置28の動作について説明する。図1の動画像復号装置28では、外部から動画像符号化データ1を受け取ると、可変長復号部2(解析手段)にてエントロピー復号処理が行われ、動きベクトル3、符号化モード情報4、直交変換係数データ5、量子化ステップパラメータ6等が抽出される。これらの抽出データを“符号化シンボル”とする。
直交変換係数データ5、量子化ステップパラメータ6は、それぞれ逆直交変換部8、逆量子化部7(両者を併せて復号部とする)によって復号される。
また、切替器9は、符号化モード情報4が動き予測モードを示している場合は、動き補償部10において、動きベクトル3と符号化モード情報4に基づいて、フレームメモリ11中の参照画像から予測画像12を生成して出力する一方、イントラモードを示している場合は、“0”を出力する。
動き予測モードでは、逆直交変換部8の出力は、動き補償予測結果の予測誤差信号であるので、動きベクトル3を用いて参照画像から符号化側(動画像符号化装置)で生成したものと同じ予測画像12を生成し、加算部13において逆直交変換部8の出力15と加算することで復号画像14を再現する。
イントラモードでは、参照画像を全く利用せずにフレーム内符号化される。また、この場合は前述のように切替器9の出力が“0”であるため、逆直交変換部8の出力15がそのまま復号画像14となる。
復号画像14は、以降のフレームの予測画像生成に用いられるため、フレームメモリ11に格納される。復号画像14はまた、切替器24のスイッチが上側にある時は、動画像復号装置28の外部へ出力27される。
それと同時に、動きベクトル3を動きベクトル保存用メモリ18へ保存し、符号化モード情報4を符号化モード情報保存用メモリ19へ保存し、逆直行変換部8の出力15の絶対値和を取得して予測残差絶対値和保存メモリ20へ保存し、補間画像生成部17におけるフレーム補間処理に備える。
フレーム補間処理を行う時は、所定のタイミング26により切替器24のスイッチを下側へ切り替え、直後に補間画像生成部17が動作する。フレーム補間処理が終わったところで補間フレームの画像出力25を行い、切替器24のスイッチを上側に戻すことにより、動画像符号化装置から外部へ出力27される。
図2は、実施の形態1において、通常フレーム同士の時間的な中間位置に、補間フレームの生成を行う場合を示す図である。所定のタイミング26とは、例えば、図2に示すような補間フレームの生成を行う場合、動画像復号装置28の上位制御部が生成する補間フレームの表示時刻に基づくタイミングを用いる。
次に、補間画像生成部17について詳細に説明する。図3は、図1の補間画像生成部17の内部構成図である。図3に示すように、補間画像生成部17は、動きベクトル推定部301と補間画像生成部302を有している。動きベクトル推定部301は、動きベクトル推定コア部305を備えている。補間画像生成部17は、フレームをブロック分割し、ブロック単位で処理を行う。実施の形態1では、ブロックを8×8ピクセルとして説明を行う。
図4は、図3の補間画像生成部17の処理フローを示したフローチャートである。
図4は、補間対象ブロックxをフレーム補間処理する場合を示している。図4において、tは時間を、f(x,t)はFrame tのブロックxの画素値を示す。df(x,t)はブロックxの推定動きベクトルMV(forward)、db(x,t)は同推定動きベクトルMV(backward)、m(x,t+1)は時刻“t+1”の補間対象直後フレームにおけるブロックxの符号化モードを示す。補間画像生成部17は、フレーム内全てのブロックに関して図4の処理を行い、補間フレームを生成する。
以下、図3の動きベクトル推定部301の動作について説明する。所定のタイミング26により、図4の処理フローが開始される。処理フローが開始されると、動きベクトル推定部301は符号化モード情報保存用メモリ19からの出力22で計算対象ブロックの符号化モード情報を取得する。ステップST101で、符号化モードm(x,t+1)が“skipped”であるかどうかをチェックする。
図5は、図4のステップST102における、「片方向補間」を示す図である。図4のステップST101で“skipped”の場合、補間対象ブロックxの動きは極小であるため、次の補間画像生成部302にて図5に示すような「片方向補間」を実施する。従って、動きベクトル推定部301は、補間画像生成部302に対して、「片方向補間」の出力303、及び「動きベクトル(0,0)」の出力304を行う。
図6は、図4のステップST104における、「両方向補間」を示す図である。図4のステップST101で“skipped”ではない場合、次の補間画像生成部302にて図6に示すような両方向補間を実施する。従って、動きベクトル推定部301は、補間画像生成部302に対して、「両方向補間」の出力303を行う。そして、動きベクトル推定コア部305にて、補間対象ブロックの動きベクトル値を推定し、補間画像生成部302に対して、「推定された動きベクトル値」の出力304を行う。動きベクトル推定コア部305における、動きベクトルの推定処理(ステップST103)については後述する。
以下、補間画像生成部302の動作について説明する。補間画像生成部302には、動きベクトル推定部301からの出力303で、「片方向補間」または「両方向補間」が入力される。また、出力304で動きベクトル値が入力される。出力303の入力データにより、補間画像生成部302の動作は以下の2種類に場合分けされる。
先ず、出力303が「片方向補間」の場合について説明する。Frame tの補間対象ブロックxに関し、図5に示す「片方向補間」を実施する。図5は、符号化されたFrame t−1及びFrame t+1に対し、Frame tを補間する場合の例である。「片方向補間」の場合は、出力304による動きベクトルが(0,0)であるため、図5に示すように、Frame t+1の符号化画像において、ブロックxと同じ位置のブロックの画像データを用いて補間を行う。
次に、出力303が「両方向補間」の場合について説明する。Frame tの補間対象ブロックxに関し、図6に示す「両方向補間」を実施する。図6は、符号化されたFrame t−1及びFrame t+1に対し、時間的に中間位置にあるFrame tを補間する場合の例である。ブロックxに関し補間する式は、数式1で与えられる。
Figure 2006279917
動きベクトルdf(x,t)及びdb(x,t)は、出力304により入力された動きベクトルを用いる。「両方向補間」は、Frame t−1とFrame t+1の両方からFrame tに対して補間を行う。Frame t−1は、補間対象ブロックと同位置からdf(x,t)ずれた場所を補間に用いる。Frame t+1は、Frame tが時間的に中間位置にあることを利用すると、“db(x,t)=−df(x,t)”が成り立つため、補間対象ブロックから−df(x,t)ずれた場所を補間に用いる。
以上より、図6において、補間対象ブロックを求めるための式は、数式1に“db(x,t)=−df(x,t)”を代入することで、数式2のようになる。
Figure 2006279917
以下、動きベクトル推定コア部305の動作について説明する。図7は、図3の動きベクトル推定コア部305の動作を示した図である。動きベクトル推定コア部305は、前述の通り、動きベクトル推定部301にて、計算対象ブロックの符号化モードが“skipped”ではない場合に動作し、補間フレーム上での動きベクトルの推定を行う(図4のステップST103参照)。
具体的には、図7のFrame t+1における領域“R”で示すような、補間対象ブロックxと同じ位置のブロック(計算対象ブロック)と、その周囲の8ブロックに関し、動きベクトル保存用メモリ18からの出力21で復号画像上の動きベクトルを参照する。また、符号化モード情報保存用メモリ19からの出力22で符号化モード情報を参照し、予測残差絶対値和保存用メモリ20からの出力23で予測残差絶対値和を参照する。
図7のように、符号化ベクトル(動きベクトル)をd(x+vi,t+1),0≦i≦8,(v4=0)、予測残差をe(x+vi,t+1),0≦i≦8,(v4=0)とした時、数式3の演算を行うことで、補間フレーム上での補間対象ブロックxにおける、Frame t−1に対する動きベクトルdf(x,t)の推定を行う。
Figure 2006279917
Figure 2006279917
であり、数式4の分母は、viにおける予測残差絶対値和である。
予測残差絶対値和の逆数で動きベクトルを重み付けすることで、予測残差絶対値和の小さいブロックにおける動きベクトルに強い重みが与えられる。予測残差絶対値和が小さい程、動きベクトル自体の信頼性が高く、予測残差絶対値和が大きい程ベクトル自体の信頼性が低いという性質に基づく手法である。
また、実施の形態1では、図2のような時間的に丁度中間位置のフレームを補間する場合の例であるため、α=1/2となり、また、Frame t+1に対する動きベクトルdb(x,t)は、“db(x,t)=−df(x,t)”で与えられる。
但し、図7の領域Rで示す9つの計算対象ブロックのうち、イントラブロックは上記演算から除外する。“skipped”のブロックは、符号化ベクトル(0,0)、予測残差をある固定値Aとして上記演算を実施する。また、インターのブロックでも、DCT係数がなく、予測残差絶対値和が“0”になる場合は、ある固定値Bとして上記演算を実施する。9つの計算対象ブロック全てがイントラブロックであった場合は、例外的に、“df(x,t)=(0,0)”とする。
上記のように動きベクトル推定コア部305で推定されたベクトルdf(x,t)及びdb(x,t)を、補間画像生成部302に出力する。
以上のようなフレーム補間処理を行うことにより、動きベクトル推定のために必要な情報を入力ストリーム(動画像符号化データ1)から取り出すことが可能であり、改めて演算を必要としない点、閾値処理がほとんどなくロバストに機能する点が、利点として挙げられる。
図8は、実施の形態1における任意の時刻におけるフレーム補間の様子を示した図である。実施の形態1では、図2のような時間的に丁度中間位置にあるフレームを補間する例で説明を行ってきたが、例えば図8のような補間を行い、コマ数を4倍にするといったことも可能である。図8に示すような相対値αの値を用い、時間的に任意の場所に補間フレームを生成することが可能である(スケーリング)。図8のような相対時間値0<α<1を定義した場合、図7のdf(x,t)の推定式(数式3)において、α倍しているところを(α―1)倍とすると、db(x,t)をその向きまで考慮した形で求めることが可能となる。
実施の形態1の動画像復号装置を用いたアプリケーション事例としては、携帯カメラ動画、DVDレコーダ高圧縮モードといったものが挙げられる。携帯カメラ動画やDVDレコーダの高圧縮モードでは、コマ数を落とした形でデータ保存をしておき、再生する際に、実施の形態1の手法を用いてフレーム補間処理を行いながら再生することで、時間解像度の高い映像を閲覧することが可能となる。
図9は、従来の動画像復号装置と実施の形態1に係る動画像復号装置の比較例を示した図である。30fpsの同じ映像ソースを入力する例を用いて比較を行っている。上側は従来の動画像復号装置を用いた動画像出力の例であり、下側が実施の形態1に係る動画像復号装置を用いた動画像出力の例を示している。従来例では、15fpsにて符号化し、動画像復号装置に対して符号化データの出力を行うと、動画像復号装置では15fpsの符号化データが蓄積され、15fpsにて再生が行われる。
それに対して、実施の形態1では、動画像復号装置28に対して出力を行うことを想定した動画像出力の例であり、動画像符号化装置で符号化する段階で、動画像復号装置28にてフレーム補間を行うことを想定し、より高圧縮で符号化するためコマを落として7.5fpsで符号化を行い、出力を行う。動画像復号装置28では、7.5fpsの符号化データが蓄積される。これにより、従来例と比較して伝送量や蓄積量が半分ですむ上、フレーム補間処理を行い、例えば4倍にコマを増やすことで30fpsの再生が可能となる。
以上のように、この実施の形態1によれば、動画像復号装置28を用いると、従来と比較して伝送量や蓄積量を削減することが可能であり、更に時間解像度の高い動画を再生し閲覧することが可能となる。
また、実施の形態1はMPEG−2の片フィールド補間へも適用可能である。例えば片フィールドのみを符号化データとして保存し、残りの片フィールドを実施の形態1の手法を用いて補間を行うことで適用可能となる。以下に、図10を用いて説明する。
図10は、実施の形態1に係る動画像符号化装置及び動画像復号装置を、MPEG−2の片フィールド補間に適用した例を示す図である。図10は、あるインターレース動画像の出力を行う場合の例であり、動画像符号化装置1201に入力する前段階でField抽出を行い、Top Fieldのみを動画像符号化装置1201に入力し、順次符号化し出力を行う。動画像復号装置28では、Top Fieldの復号データからBottom Fieldを補間し、再生を行う。
また一方で、MPEG−4等の動画像符号化において、両方向予測による動き補償を利用するピクチャタイプの予測画像生成において、MPEG−4等で規定されている予測画像生成方式により生成された予測画像ではなく、実施の形態1により生成される補間フレームを予測画像として用いることで、圧縮率が向上できる。
実施の形態2.
以下、この発明の実施の形態2について説明する。実施の形態2では、動きベクトル推定コア部305(図3参照)が実施の形態1と別処理を行う。その他の構成は実施の形態1と同様であるので説明を省略する。図11は、実施の形態2に係る動画像復号装置の動きベクトル推定コア部305の動作を示した図である。
下記の演算を行うことで、補間フレーム上での補間対象ブロックxにおける、Frame t−1に対する動きベクトルdf(x,t)の推定を行う。
Figure 2006279917
ここで、φi(m)、φi(n)はそれぞれ数式6で表される。また、gi(m)、gi(n)はそれぞれ、数式7で表される。h(x)は実施の形態2では、x-1に依存する非線形関数とし、gi(m)、gi(n)は分散の逆数の意味を持つ。
Figure 2006279917
Figure 2006279917
この時、σd(m)、σd(n)は図11における領域Rの分散の各成分を表しており、数式8のようになる。また、図2のように時間的に丁度中間位置のフレームを補間する場合は、α=1/2となる。
Figure 2006279917
実施の形態2は、実施の形態1と比較すると、領域Rのベクトルに関して、分散値の逆数をブロックxと同位置の計算対象ブロックのみに強く重み付けすることで、領域Rの動きベクトルの分散が小さい場合に、計算対象ブロックのベクトルが強く重み付けされる。
実施の形態1では、領域Rのベクトルが全体的に小さい場合、領域Rのある特定の予測残差絶対値和が小さなブロックに対する重みが必要以上に大き過ぎ、そのような予測残差絶対値和が小さいブロックの動きベクトルはほとんどの場合(0,0)である。その結果、必要以上に推定動きベクトルがゼロベクトルとなるブロックが多発する場合がある。従って、実施の形態2では、分散値を使うアルゴリズムを導入している。
以上のように、この実施の形態2によれば、分散値を使うアルゴリズムの導入により、実施の形態1と比較して、元々の動き量が少ないために分散の小さい動きベクトルを有する領域であっても、必要以上にゼロベクトルに落とすことなく、その分散の度合いを推定動きベクトルに適切に反映させる効果がある。
実施の形態3.
以下、この発明の実施の形態3について説明する。図12は、実施の形態3に係る動画像符号化装置から動画像復号装置へのデータ出力を示す図である。実施の形態3に係る動画像符号化装置1201は、実施の形態1、2に係る動画像復号装置28が行うフレーム補間処理に対して補助を行う(以下、補間アシスト)。具体的には、動画像符号化装置1201が、通常の符号化データ1に加えて、フレーム補間処理を補助するための付加情報を出力する。この付加情報を生成する部分を付加情報生成部と呼ぶ。
第1の補間アシスト(フレーム補間処理における参照画像種別の出力)について説明する。動画像符号化装置1201は、動画像復号装置28におけるフレーム補間処理に際して、「時間的に前方のフレームのみを参照して補間する方法」、「時間的に後方のフレームのみを参照して補間する方法」、「前後両方のフレームを参照して補間する方法」の3種類の補間方法のうち、最適な補間方法に関する情報(最適な参照画像を示す情報)を、フレーム内の全てのブロックに関して個別に生成し、付加情報として出力する。フレームが該当ブロックを含んでいることを示す識別フラグを、付加情報の前等に付加する。その付加情報を示すビット列を、例えば算術符号化等を用いて圧縮した形で動画像復号装置28へ出力する。
図13は、実施の形態3に係る動画像符号化装置の構成図である。なお、動画像符号化装置1301は、図12の動画像符号化装置1201に相当する。図13において、動画像符号化装置1301は、動画像符号化部1302、切替器1304、最適参照画像判定部1305、ビット列生成部1306を備えている。また、動画像符号化部1302は、メモリ1303を備える。最適参照画像判定部1305及びビット列生成部1306が付加情報生成部である。
次に、動画像符号化装置1301の動作について説明する。動画像符号化装置1301は、動画像符号化部1302への入力画像の入力1307により符号化を行った後、動画像復号装置28へ出力1を行う。一方、最適参照画像判定部1305にも入力画像の入力1307を行い、メモリ1303を参照して符号化内容を把握し、上記3種類の補間方法による補間フレームを仮生成し、補間されたフレームと略同時刻の入力画像とをブロック毎に比較し、ブロック毎にどの補間方法が最適かを判定する。その判定結果を出力1309としてビット列生成部1306へ入力し、同時に出力1308で切替器1304のスイッチを下側に切り替える。ビット列生成部1306では、最適参照画像判定部1305からの出力1309で上記判定結果のデータを受け取り、そのデータに関して算術符号化等を行い、動画像復号装置28へ出力する。出力が終わったところで、切替器1304のスイッチを上側に戻す。
以上のように、この実施の形態3によれば、動画像符号化装置1301には入力画像があるため、符号化を行ったデータを用いて補間フレームを仮生成し、入力画像との比較を行うことで最適な補間方法を判定することが可能であり、このような第1の補間アシストで最適な補間方法を動画像復号装置28に出力することにより、フレーム補間処理された動画像の画質向上が期待できる効果がある。
実施の形態4.
以下、この発明の実施の形態4について説明する。実施の形態4では、図12の動画像符号化装置1201が、第2の補間アシスト(予測残差の出力)を行う。符号化する際の動きベクトルがばらばらである場合に、動画像復号装置28において通常のフレーム補間処理を行うと、画質の低いブロックを含む補間フレームが生成されてしまう。
実施の形態4では、上記の場合、動画像符号化装置1201が通常の動画像符号化データに加えて、補間フレーム上の該当ブロックにおける予測残差を出力する。フレームが該当ブロックを含んでいることを示す識別フラグを、予測残差データの前等に付加する。動画像復号装置28は、先ず、フレーム単位で予測残差の出力の有無を判断する。予測残差データを出力する時は、該当ブロック位置と予測残差を符号化データの付加情報として出力する。その付加情報を示すビット列は、例えばMPEG−4で用いられているDCTや量子化、VLC(可変長符号化)等を用い、圧縮した形で動画像復号装置28へ出力する。
図14は、実施の形態4に係る動画像符号化装置の構成図である。なお、図14の動画像符号化装置1401は、図12の動画像符号化装置1201に相当する。図14において、動画像符号化装置1401は、動画像符号化部1302、切替器1304、予測残差伝送判定部1405、ビット列生成部1406を備えている。また、動画像符号化部1302は、メモリ1303を備える。予測残差伝送判定部1405及びビット列生成部1406が付加情報生成部である。
次に、動画像符号化装置1401の動作について説明する。動画像符号化装置1301は、動画像符号化部1302への入力画像の入力1307により符号化を行った後、動画像復号装置28へ動画像符号化データ1を出力する。一方、予測残差伝送判定部1405にも入力画像の入力1307を行い、メモリ1303を参照して符号化内容を把握し、補間フレームを仮生成し、補間されたフレームと略同時刻の入力画像とをブロック毎に比較し、ブロック毎に予測残差を送る必要があるかどうかを判定する。その結果、1ブロックでも予測残差を送る必要があれば、出力1309でビット列生成部1406にブロック位置と予測残差を伝え、同時に出力1308経由で切替器1304のスイッチを下側に切り替える。ビット列生成部1406では、出力1309で予測残差伝送判定部1405からのデータ(ブロック位置と予測残差)を受け取り、そのデータに関して適切な圧縮等を行い、動画像復号装置28へ出力する。出力が終わったところで、切替器1304のスイッチを上側に戻す。
以上のように、この実施の形態4によれば、動画像符号化装置には入力画像があるため、符号化を行ったデータを用いて補間フレームを仮生成して入力画像との比較を行うことで、著しく画質の低いブロックを含む補間フレームを調べることが可能であり、このような第2の補間アシストで補間フレーム上の該当ブロックにおける予測残差を動画像復号装置28へ出力することにより、フレーム補間処理されたフレームの画質向上が期待できる効果がある。
実施の形態5.
以下、この発明の実施の形態5について説明する。実施の形態5では、図12の動画像符号化装置1201が、第3の補間アシスト(補間フレーム上の動きベクトルの出力)を行う。符号化する際の動きベクトルがばらばらで、動画像復号装置1において実施の形態1や実施の形態2に示すような通常の動きベクトル推定コア部305の処理(図4のステップST103)を行うと、画質の低いブロックを含む補間フレームになってしまう。特にイントラブロックの場合は、元々符号化データの中に動きベクトル自体が存在しないため、そのような状態になり易い。
実施の形態5では、上記の場合、動画像符号化装置1201が、通常の符号化データに加え、補間フレーム上の該当ブロックにおける動きベクトルも付加情報として出力する。フレームが該当ブロックを含んでいることを示す識別フラグを、動きベクトルデータの前等に付加する。動画像復号装置28は、先ずフレーム単位で動きベクトルの出力の有無を判断する。動きベクトルデータを出力する時は、該当ブロック位置と動きベクトルを付加情報として出力する。
図15は、実施の形態5に係る動画像符号化装置の構成図である。なお、図15の動画像符号化装置1501は、図12の動画像符号化装置1201に相当する。図15において、動画像符号化装置1501は、動画像符号化部1302、切替器1304、動きベクトル伝送判定部1505、ビット列生成部1506を備えている。また、動画像符号化部1302は、メモリ1303を備える。動きベクトル伝送判定部1505及びビット列生成部1506が付加情報生成部である。
次に、動画像符号化装置1501の動作について説明する。動画像符号化装置1301は、動画像符号化部1302への入力画像の入力1307により符号化を行った後、動画像復号装置28へ動画像符号化データ1を出力する。一方、動きベクトル伝送判定部1505にも入力画像の入力1307を行い、メモリ1303を参照して符号化内容を把握し、補間フレームを仮生成し、補間されたフレームと略同時刻の入力画像とをブロック毎に比較し、著しく画質が落ちていないかどうか判定する。画質の落ちているブロックがあれば補間フレーム上の動きベクトルの変更により画質が改善されるかどうか判定を行うことで、動きベクトルを送る必要があるかどうかを判定する。その結果、1ブロックでも動きベクトルを送る必要があれば、出力1309でビット列生成部1506にブロック位置と伝送すべき動きベクトル値を伝え、同時に出力1308経由で切替器1304のスイッチを下側に切り替える。ビット列生成部1506では、1309経由で動きベクトル伝送判定部1505からのデータを受け、そのデータに関して適切な圧縮等を行い、動画像復号装置28へ出力する。出力が終わったところで、切替器1304のスイッチを上側に戻す。
以上のように、この実施の形態5によれば、動画像符号化装置には入力画像があるため、符号化を行ったデータを用いて補間フレームを仮生成して入力画像との比較を行うことで、通常の動きベクトル推定コア部の処理では著しく画質の低いブロックを含む補間フレームを調べることが可能であるため、このような第3の補間アシストで補間フレーム上の該当ブロックにおける補間フレーム上の最適な動きベクトルを出力することにより、フレーム補間処理されたフレームの画質向上が期待できる効果がある。
実施の形態6.
以下、この発明の実施の形態6について説明する。実施の形態6では、図12の動画像符号化装置1201が、第4の補間アシスト(予測残差絶対値和の出力)を行う。実映像を対象とした符号化においては、一般的に予測残差絶対値和がゼロになることはほとんどない。しかし、DCT係数なしのブロックがあった場合、動画像復号装置28において、そのブロックにおける予測残差絶対値和はゼロとなってしまう。
実施の形態6では、上記の場合、動画像符号化装置1201が、通常の符号化データに加え、該当ブロックのみ予測残差絶対値和も出力する。フレームが該当ブロックを含んでいることを示す識別フラグを、予測残差絶対値和データの前等に付加する。動画像復号装置28は、先ずフレーム単位で予測残差絶対値和の出力の有無を判断する。予測残差絶対値和データを出力する時は、該当ブロック位置と予測残差絶対値和を付加情報として出力する。その付加情報を示すビット列は、例えば算術符号化等で圧縮し、ごく短い符号に変換した形で動画像復号装置28へ出力する。
図16は、実施の形態6に係る動画像符号化装置の構成図である。なお、図16の動画像符号化装置1601は、図12の動画像符号化装置1201に相当する。図16において、動画像符号化装置1601は、動画像符号化部1302、切替器1304、予測残差絶対値和伝送判定部1605、ビット列生成部1606を備えている。また、動画像符号化部1302は、メモリ1303を備える。予測残差絶対値和伝送判定部1605、ビット列生成部1506が付加情報生成部である。
次に、動画像符号化装置1601の動作について説明する。動画像符号化装置1301は、動画像符号化部1302への入力画像の入力1307により符号化を行った後、動画像復号装置28へ動画像符号化データ1を出力する。一方、予測残差絶対値和伝送判定部1605にも入力画像の入力1307を行い、メモリ1303を参照して符号化内容を把握し、補間フレームを仮生成し、補間されたフレームと略同時刻の入力画像とをブロック毎に比較し、著しく画質が落ちていないかどうか判定する。画質の落ちているブロックがあれば補間フレーム上の予測残差絶対値和の補正により画質が改善されるかどうか判定を行うことで、予測残差絶対値和を送る必要があるかどうかを判定する。その結果、1ブロックでも予測残差絶対値和を送る必要があれば、出力1309でビット列生成部1606にブロック位置と出力すべき動きベクトル値を伝え、同時に出力1308で切替機1304のスイッチを下側に切り替える。ビット列生成部1606では、出力1309で予測残差絶対値和伝送判定部1605からのデータを受け取り、そのデータに関して適切な圧縮等を行い、動画像復号装置28へ出力する。出力が終わったところで、切替器1304のスイッチを上側に戻す。
以上のように、この実施の形態6によれば、動画像符号化装置1601には入力画像があるため、符号化を行ったデータを用いて補間フレームを仮生成して入力画像との比較を行うことで、通常の動きベクトル推定コア部の処理では著しく画質の低いブロックを含む補間フレームを調べることが可能であるため、このような第4の補間アシストで補間フレーム上の該当ブロックにおける予測残差絶対値和を出力することにより、フレーム補間処理されたフレームの画質向上が期待できる効果がある。
なお、上記実施の形態3〜6に示した第1〜第4の補間アシストを行う場合、付加情報の種別を示す種別フラグを付加情報の前等に付加することで、付加情報種別を出力する手段とする。
実施の形態7.
以下、この発明の実施の形態7について説明する。実施の形態7では、図12の動画像符号化装置1201が第5の補間アシスト(符号化画像上の動きベクトルの制限)を行う。動画像符号化装置1201は、符号化する際、フレーム外を参照する動きベクトルを使用しないようにする。
図17は、実施の形態7に係る動画像符号化装置の構成図である。なお、図17の動画像符号化装置1701は、図12の動画像符号化装置1201に相当する。図17における動画像符号化装置1701は、動画像符号化部1702を備えている。また、動画像符号化部1702は動き探索部1703を備える。
次に、動画像符号化部1701の動作について説明する。動画像符号化装置1701は、動画像符号化部1702への入力画像の入力1307により符号化を行った後、動画像復号装置28へ動画像符号化データ1を出力する。動画像符号化部1702における符号化処理において、動き探索部1703は、フレーム外を参照する動きベクトルを発生させないような動き探索を行い、動画像符号化データ1の生成を行う。
以上のように、この実施の形態7によれば、フレーム外を参照する動きベクトルを使用しないように符号化を行うことにより、フレーム補間処理における参照画像が、少なくとも前後どちらかは確保できるという効果がある。
実施の形態8.
以下、この発明の実施の形態8について説明する。実施の形態8では、実施の形態1及び実施の形態2における動きベクトル推定コア部305の別処理について述べる。その他の構成は実施の形態1と同様であるので説明を省略する。図18、図19にそれぞれ詳細を記載した。
先ず、実施の形態1における動きベクトル推定コア部305の処理と別処理(実施の形態8における処理)について述べる。図18は、実施の形態8におけるMVDを用いた重み推定の説明図1である。
図18において、補間画像(補間フレーム)上での処理該当ブロックxにおける、Frame t−1に対する参照ベクトルdf(x,t)の計算式は、実施の形態1で示した数式3と同様である。数式3における重みφiの計算式が実施の形態1(数式4)とは異なり、下記の数式9のような計算式で計算を行う。
Figure 2006279917
数式9の分母は数式4の分母と同様であり、viにおける予測残差絶対値和を表す。分子の部分p(ki)が数式4の分子と異なる部分であり、p(x)はx-1に依存するような非線形関数であり、kiはMVD(Motion Vector Difference:動きベクトル差分値)のベクトルの大きさである。p(ki)の部分は全体としてはMVDの大きさの逆数を表す。
p(x)はx-1に依存するような非線形関数であるが、実際の応用においては割り算の演算量が大きい場合もあるので、xとp(x)とを1対1に対応させたテーブルをルックアップすることで、xからp(x)を算出することも考えられる。
MVDの大きさはベクトルの孤立度を表し、MVDが大きいほど孤立度が大きい可能性が高いので、重みφiの計算式(数式9)にMVDの大きさの逆数を取り入れることにより、孤立したベクトルの重みを小さくできる効果がある。孤立したベクトルは信頼性が低い確率が高いという推定が根拠である。孤立したベクトルの重みを小さくすることにより、ベクトルの推定精度を向上させる効果がある。
また、MVDは、例えばMPEG−4の場合は、符号化データに記述された値をそのまま用いることが可能であるため、演算量が少なくて済むという効果もある。
ここまでが実施の形態1における動きベクトル推定コア部305の別の処理についての記述である。
次に実施の形態2における動きベクトル推定コア部305の別処理(実施の形態8の処理)について述べる。図19は、実施の形態8におけるMVDを用いた重み推定の説明図2である。
図19において、補間画像上での処理該当ブロックxにおける、Frame t−1に対する参照ベクトルdf(x,t)の計算式は、実施の形態2で示した数式5と同様である。更に、数式5における重みφi(m),φi(n)の計算式も、実施の形態2で示した数式6と同様である。数式6におけるgi(m),gi(n)の計算式が実施の形態2(数式7)とは異なり、下記の数式10のように行う。
Figure 2006279917
数式10におけるh(σd(m)),h(σd(n))は実施の形態2と同じ意味であり、分散の逆数に依存するファクタである。p(ki)は、数式9と同じ意味であり、MVDの大きさの逆数に依存するファクタである。実際の応用においては割り算の演算量が大きい場合もあるので、xとh(x)とを1対1に対応させたテーブルをルックアップすることで、xからh(x)を算出することも考えられるし、iの値に応じてテーブルを切り替える等して、同様に直接gi(x)自体をテーブルルックアップすることも考えられる。
実施の形態2に更にMVDのファクタを加味することにより、実施の形態1にMVDのファクタを加味するよりも更に参照ベクトルdf(x,t)の推定精度を向上させる効果がある。
以上のように、この実施の形態8によれば、実施の形態1または実施の形態2に対してMVDのファクタを加味することにより、参照ベクトルdf(x,t)の推定精度を更に向上させることができる。
また、MVDについては、採用する標準規格によっては符号化データ内の数値をそのまま利用できるため、演算量が減少するという効果がある。
実施の形態9.
以下、この発明の実施の形態9について説明する。実施の形態9では、実施の形態1及び実施の形態2における動きベクトル推定コア部305の別の処理について述べる。その他の構成は実施の形態1と同様であるので説明を省略する。図20、図21にそれぞれ詳細を記載した。
先ず、実施の形態1における動きベクトル推定コア部305の別の処理について述べる。図20は、実施の形態9におけるラプラシアン値を用いた重み推定の説明図1である。
図20において、補間画像上での処理該当ブロックにおける、Frame t−1に対する参照ベクトルdf(x,t)の計算式は、実施の形態1で示した数式3と同様である。数式3における重みφiの計算式が実施の形態1(数式4)とは異なり、下記の数式11のような計算式で計算を行う。
Figure 2006279917
数式11の分母は数式4の分母と同様であり、viにおける予測残差絶対値和を表す。分子の部分z(li)が数式4の分子と異なる部分であり、z(x)はx-1に依存するような非線形関数であり、liは以下の数式12で表される、ラプラシアン値の大きさである。z(li)の部分は全体としてはラプラシアン値の大きさの逆数を表す。
Figure 2006279917
z(x)はx-1に依存するような非線形関数であるが、実際の応用においては割り算の演算量が大きい場合もあるので、xとz(x)とを1対1に対応させたテーブルをルックアップすることで、xからz(x)を算出することも考えられる。
ラプラシアン値の大きさはベクトルの孤立度を表し、ラプラシアン値が大きいほど孤立度が大きいので、このように重みφiの計算式にラプラシアン値の大きさの逆数を取り入れることにより、孤立したベクトルの重みを小さくできる効果がある。孤立したベクトルは信頼性が低い確率が高いという推定が根拠である。孤立したベクトルの重みを小さくすることにより、ベクトルの推定精度を向上させる効果がある。
また、実施の形態8におけるMVDと実施の形態9におけるラプラシアン値の違いとしては、ラプラシアン値は演算量がMVDより大きくなってしまうが、ラプラシアン値の方がMVDより推定精度向上が大きい効果がある。
ラプラシアン値の各成分であるli(m),li(n)の計算方法に関しては、図22に詳細を記述した。図22は、実施の形態9におけるラプラシアン値の算出方法の説明図である。図22の領域Rにおける中心ブロックのラプラシアン値であるl4(m),l4(n)に関し、それぞれ数式13のように計算を行う。
Figure 2006279917
そして、画像内全ての領域Rに関し、この数式13の計算を行うことにより、全てのブロックのラプラシアン値を算出することで、任意のRにおけるli(m),li(n)(0≦i≦8)を算出できる。
ここまでが実施の形態1における動きベクトル推定コア部305の別の処理についての記述である。
次に実施の形態2における動きベクトル推定コア部305の別の処理について述べる。図21は、実施の形態9におけるラプラシアン値を用いた重み推定の説明図1である。
図21において、補間画像上での処理該当ブロックにおける、Frame t−1に対する参照ベクトルdf(x,t)の計算式は、実施の形態2で示した数式5と同様である。更に、数式5における重みφi(m),φi(n)の計算式も、実施の形態2で示した数式6と同様である。数式6におけるgi(m),gi(n)の計算式が実施の形態2(数式7)とは異なり、下記の数式14や数式15のように行う。
Figure 2006279917
Figure 2006279917
数式14は分散を用いない場合であり、数式15は分散を用いる場合である。数式15におけるh(σd(m)),h(σd(n))は実施の形態2と同じ意味であり、分散の逆数に依存するファクタである。z(|li(m)|),z(|li(n)|)は、数式13のz(li)と同じ意味であり、ラプラシアン値の大きさの逆数に依存するファクタである。実際の応用においては割り算の演算量が大きい場合もあるので、xとh(x)とを1対1に対応させたテーブルをルックアップすることで、xからh(x)を算出することも考えられるし、iの値に応じてテーブルを切り替える等して、同様に直接gi(x)自体をテーブルルックアップすることも考えられる。
実施の形態2で示した分散も利用する方法に対し、更にラプラシアン値のファクタを加味する数式15のような計算を行うことにより、実施の形態1のように分散を利用しない方法に対しラプラシアン値のファクタを加味するよりも更に参照ベクトルdf(x,t)の推定精度を向上させる効果がある。
その他にも、各ブロックの複雑度により重み付け演算する方法も考えられる。ブロックの複雑度が高いほどベクトルの信頼性が大きいことに基づく方法である。複雑度は例えば、画素の輝度値の分散値とし、複雑度が大きいほど重みを重くする方法である。
以上のように、この実施の形態9によれば、実施の形態1または実施の形態2に対してラプラシアン値のファクタを加味することにより、参照ベクトルdf(x,t)の推定精度を更に向上させることができる。
実施の形態10.
以下、この発明の実施の形態10について説明する。実施の形態10では、実施の形態1、実施の形態2、実施の形態8、実施の形態9で計算された輝度ベクトル推定結果を用いて色差ベクトル推定を行う手法について述べる。図23に詳細を記載した。図23は、実施の形態10における色差ベクトルの推定の説明図である。
図23において、実施の形態1、実施の形態2、実施の形態8、実施の形態9で得られた、あるマクロブロックにおける、各ブロックの輝度ベクトルの推定結果をそれぞれdf1〜df4とし、その結果を用いて当該マクロブロックの色差ベクトルdfcを数式16のように計算する。
Figure 2006279917
以上のように、この実施の形態10によれば、輝度ベクトルの推定結果から色差ベクトルの推定を行うことにより、補間画像をカラー化することが可能となる効果がある。
実施の形態11.
以下、この発明の実施の形態11について説明する。実施の形態11では、実施の形態1における図4のステップST104における別の処理について述べる。その他の構成は実施の形態1と同様であるので説明を省略する。図24に詳細を記載した。図24は、実施の形態11における量子化係数値による補間重み付けの説明図である。
実施の形態1におけるステップST104の処理は、数式1や数式2で示される単純加算平均であったが、本実施の形態においては、復号画像における全マクロブロックの量子化係数の平均値を用いて重み付け加算する。Frame t−1における量子化係数の平均値をq(t−1)、Frame t+1における量子化係数の平均値をq(t+1)とし、数式17のように、を求めるための重み付け計算を行う。
Figure 2006279917
以上のように、この実施の形態11によれば、数式17のように重み付けの計算を行うことで、量子化係数の小さい画像、つまり画質のよい復号画像により大きな重みがかかるため、補間フレームとしても画質が向上する効果がある。
実施の形態12.
以下、この発明の実施の形態12について説明する。実施の形態12では、補間フレームにおける端のブロックの処理に関して記述を行う。図25に概要を記載する。図25は、実施の形態12における端に位置するブロックの処理方法の説明図である。
端のブロックは、推定された輝度ベクトル次第であるが、両方向補間を行うと片方のベクトルが画面外を指すことが多く、それが画質低下の原因になることがある。
片方のベクトルが画面外を指した場合は、画面内を指す推定ベクトルのみを用いて片方向補間を行う方法が考えられるが、画面内を指すベクトルが存在しない場合もある。
そこで、図25に示すように、画面の端に位置するブロックの補間は行わず、表示直前の段階にて黒で埋める方法、或いは、端に位置するブロックそのものを表示しないようにする方法が考えられる。また、端に位置するブロックを表示しないようにした上で、ある所定の色で枠線を引く等の手段も考えられる。
以上のように、この実施の形態12によれば、図25のように端に位置するブロックを処理することで、実質的な解像度は小さくなるものの、画質は向上する効果がある。
実施の形態13.
以下、この発明の実施の形態13について説明する。実施の形態13では、補間フレームを作成するか否かを予め動画像符号化データの情報から判断する方法と、補間しない場合の処理について記述する。図26、図27、図28に詳細を記述した。
図26は、実施の形態13における補間画像を生成する場合としない場合の説明図である。図26は、動画像符号化データ(入力ストリーム)の情報から判断して、補間画像を生成する場合と生成しない場合とを示している。
補間すると判断された場合は、図26の左側に示す通り、実施の形態1、2、8、9のようなベクトル推定を行い、補間フレームの作成を行い、補間フレームの表示を行う。
一方、補間しないと判断された場合は、図26の右側に示す通り、補間フレームを作成せず、Frame t−1の画像をそのままFrame tとして表示するか、或いは、Frame t−1の画像をそのまま表示しておき、Frame t+1まで表示を更新しない等の方法がある。
図27は、実施の形態13における補間画像を生成しない場合の判断材料の説明図である。図27は、補間画像を生成しない場合の条件を示している。例えば、左の図にあるように、ベクトルの分散が大きい領域Rが画像内に一つでも存在する場合は、補間フレームのその領域付近の画質が著しく低下する可能性があり、補間を行わないと判断する。
また、予測差分絶対値和が大きいブロックが存在する場合は、符号化側で動き探索(ME)を行っているにもかかわらず予測差分絶対値和が大きいということになり、それはつまり該領域に似た画像が該領域近傍にないということになるので、該領域における画質が著しく低下する可能性があるため、補間を行わないと判断する。
また別の例としては、例えばシーンチェンジのような、復号画像内にイントラMBが多い場合や、Frame t+1がI−VOP(Video Object Plane)である場合等に補間を行わないと判断する。
図28は、実施の形態13における、補間制御部を構成要素として追加した動画像復号装置のブロック図である。図28のブロック図は、図1に示した動画像復号装置のブロック図に補間制御部11201が追加された動画像復号装置である。図27のような補間するか補間しないかの判断を、動きベクトル保存用メモリ18や符号化モード情報保存メモリ19や、予測残差絶対値和保存メモリ20を参照しながら補間制御部11201で行い、タイミング26を制御して切り替え器24の制御を行う。
以上のように、この実施の形態13によれば、補間するか否かの判断をその都度行うことにより、補間しないと判断された場合には、補間を行った場合に著しく画質が低下する可能性のある補間フレームを表示しないので、結果としてトータルの画質を向上させる効果がある。
実施の形態14.
以下、この発明の実施の形態14について説明する。実施の形態14では、可変フレームレートの動画像符号化データにおける補間方法を記述する。図29に概要を記載した。図29は、実施の形態14における可変フレームレートの動画像符号化データにおける補間方法の説明図である。
一般の符号化装置の動作として、伝送帯域の制限等からデータ量を帯域に納めるために、可変フレームレートの動画像符号化データを作成することはよくあることである。そのような可変フレームレートの動画像符号化データに対して補間を行う方法として、予め図29で示すAの値(表示レート情報)を符号化側から復号側へ送出しておく方法がある。
また、Aの値を符号化側と復号側を含めた全体システムとして予め決めておくことで、動画像符号化装置側と動画像復号装置側で共に既知としておき、その上で復号側はA fpsになるよう補間をするという方法がある。
或いは、Aの値を符号化側と復号側で共有する別の方法としては、例えば動画像符号化データの中にあるuser_data等の領域にAの値を格納し、符号化側から復号側へAの値を送出するという方法もある。
動画像符号化装置側では、必要に応じて、実際に符号化を行うフレーム画像を選択する符号化画像選択手段を備える。
動画像復号装置側では、必要に応じて、動画像符号化装置側からの表示レート情報を復号する表示レート復号手段を備えるものとする。
Aの値は、符号化側で例えば通常のカメラ等を用いた場合、カメラから動画像符号化装置へ入力される全ての画像が符号化画像の候補となる場合であれば、A=30となる。
また、例えば、もともと最大フレームレートをフレーム間隔固定の10fpsとするシステムであれば、A=10ということも考えられる。
補間方法としては実施の形態1の図8にて説明した形で、αの値を変化させて用いることで補間を行うことが可能である。
以上のように、この実施の形態14によれば、可変フレームレートの動画像符号化データを固定フレームレートに補間することにより、単純にフレームの間を1枚補間するという方式と比較して、動きがより滑らかになるという効果がある。
実施の形態1に係る動画像復号装置の構成図である。 実施の形態1において、通常フレーム同士の時間的な中間位置に、補間フレームの生成を行う場合を示す図である。 図1の補間画像生成部の内部構成図である。 図3の補間画像生成部の処理フローを示したフローチャートである。 図4のステップST102における、「片方向補間」を示す図である。 図4のステップST104における、「両方向補間」を示す図である。 図3の動きベクトル推定コア部の動作を示した図である。 実施の形態1における任意の時刻におけるフレーム補間の様子を示した図である。 従来の動画像復号装置と実施の形態1に係る動画像復号装置の比較例を示した図である。 実施の形態1に係る動画像符号化装置及び動画像復号装置を、MPEG−2の片フィールド補間に適用した例を示す図である。 実施の形態2に係る動画像復号装置の動きベクトル推定コア部の動作を示した図である。 実施の形態3に係る動画像符号化装置から動画像復号装置へのデータ出力を示す図である。 実施の形態3に係る動画像符号化装置の構成図である。 実施の形態4に係る動画像符号化装置の構成図である。 実施の形態5に係る動画像符号化装置の構成図である。 実施の形態6に係る動画像符号化装置の構成図である。 実施の形態7に係る動画像符号化装置の構成図である。 実施の形態8におけるMVDを用いた重み推定の説明図1である。 実施の形態8におけるMVDを用いた重み推定の説明図2である。 実施の形態9におけるラプラシアン値を用いた重み推定の説明図1である。 実施の形態9におけるラプラシアン値を用いた重み推定の説明図2である。 実施の形態9におけるラプラシアン値の算出方法の説明図である。 実施の形態10における色差ベクトルの推定の説明図である。 実施の形態11における量子化係数値による補間重み付けの説明図である。 実施の形態12における端に位置するブロックの処理方法の説明図である。 実施の形態13における補間画像を生成する場合としない場合の説明図である。 実施の形態13における補間画像を生成しない場合の判断材料の説明図である。 実施の形態13における、補間制御部を構成要素として追加した動画像復号装置のブロック図である。 実施の形態14における可変フレームレートの動画像符号化データにおける補間方法の説明図である。
符号の説明
1 動画像符号化データ、2 可変長復号部、3 動きベクトル、4 符号化モード情報、5 直交変換係数データ、6 量子化ステップパラメータ、7 逆量子化部、8 逆直交変換部、9 切替器、10 動き補償部、11 フレームメモリ、12 予測画像、13 加算部、14 復号画像、15 出力、16 出力、17 補間画像生成部、18 動きベクトル保存用メモリ、19 符号化モード情報保存用メモリ、20 予測残差絶対値和保存用メモリ、21 出力、22 出力、23 出力、24 切替器、25 画像出力、26 タイミング、27 出力、28 動画像復号装置、301 動きベクトル推定部、302 補間画像生成部、303 出力、304 出力、305 動きベクトル推定コア部、1301 動画像符号化装置、1302 動画像符号化部、1303 メモリ、1304 切替器、1305 最適参照画像判定部、1306 ビット列生成部、1307 入力、1308 出力、1309 出力、1401 動画像符号化装置、1405 予測残差伝送判定部、1406 ビット列生成部、1501 動画像符号化装置、1505 動きベクトル伝送判定部、1506 ビット列生成部、1601 動画像符号化装置、1605 予測残差絶対値和伝送判定部、1606 ビット列生成部、1701 動画像符号化装置、1702 動画像符号化部、1703 動き探索部、11201 補間制御部。

Claims (22)

  1. 動画像符号化データを解析してブロック単位の符号化シンボルを抽出する解析手段と、
    前記符号化シンボルを用いて動画像の各フレームを復元して出力する復号手段と、
    前記符号化シンボルに基づいて、補間フレームの生成方法と補間フレームの動きベクトルとを推定して、前記補間フレームを生成する画像生成部と、
    前記復号手段からの動画像の出力と前記画像生成部からの補間フレームの出力とを所定の規則で切り替える切替器とを備えた動画像復号装置。
  2. 前記符号化シンボルが動きベクトルと符号化モード情報と予測残差とを含み、
    前記画像生成部が、
    前記符号化モード情報に従って、前記復号手段から得られる動画像フレームのうち少なくとも1つ以上の動画像フレームを参照画像として選択する第1のステップと、
    前記参照画像上の計算対象ブロックとその周辺のブロックにおいて、予測残差の逆数を重みに用い、動きベクトルの各成分に関する重み付け加算平均計算を行ない、前記補間フレームの時間的位置に応じてスケーリングを行うことで、前記参照画像の参照位置を示す前記補間フレームの動きベクトルの推定を行なう第2のステップと、
    前記参照ベクトルにより、前記参照画像の参照位置にある画素を用いて前記補間フレームを生成する第3のステップとを備えることを特徴とする請求項1記載の動画像復号装置。
  3. 前記第2のステップにおいて、
    前記参照画像上の計算対象ブロックとその周辺のブロックにおいて、動きベクトルの分散値を計算し、前記計算対象ブロックに関しては予測残差の逆数と前記分散値の逆数との積を重みに用い、前記周辺のブロックに関しては前記予測残差の逆数を重みに用い、前記動きベクトルの各成分に関する重み付け加算平均計算を行ない、前記補間フレームの時間的位置に応じてスケーリングを行うことで、前記参照画像の参照位置を示す前記補間フレームの動きベクトルの推定を行なうことを特徴とする請求項2記載の動画像復号装置。
  4. 前記動きベクトルを保存する動きベクトル保存用メモリと、
    前記符号化モード情報を保存する符号化モード情報保存用メモリと、
    前記予測残差を保存する予測残差絶対値和保存用メモリとを備えることを特徴とする請求項2または請求項3記載の動画像復号装置。
  5. 動画像符号化データを解析してブロック単位の符号化シンボルを抽出する第1の解析手段と、
    前記画像生成部を補助するための情報を含むデータを解析する第2の解析手段と、
    前記符号化シンボルを用いて動画像の各フレームを復元して出力する復号手段と、
    前記符号化シンボルに基づいて、補間フレームの生成方法と補間フレームの動きベクトルとを推定して、前記補間フレームを生成する画像生成部と、
    前記復号手段からの動画像の出力と前記画像生成部からの補間フレームの出力とを所定の規則で切り替える切替器とを備えた動画像復号装置。
  6. 動画像を符号化して動画像符号化データを生成する動画像符号化部と、
    入力画像と仮生成した補間フレームとをブロック毎に比較し、フレーム補間処理を補助するための付加情報を生成する付加情報生成部とを備え、
    前記動画像符号化データと前記付加情報とを出力することを特徴とする動画像符号化装置。
  7. 前記付加情報の有無を示す識別フラグを、前記付加情報に付加して出力することを特徴とする請求項6記載の動画像符号化装置。
  8. 前記付加情報の種別を示す種別フラグを、前記付加情報に付加して出力することを特徴とする請求項6または請求項7記載の動画像符号化装置。
  9. 前記付加情報は、補間フレームを生成する場合に最適な参照画像を示すデータを含むことを特徴とする請求項6から請求項8のうちのいずれか1項記載の動画像符号化装置。
  10. 前記付加情報は、前記補間フレームにおけるブロックのブロック位置と予測残差とを示すデータを含むことを特徴とする請求項6から請求項8のうちのいずれか1項記載の動画像符号化装置。
  11. 前記付加情報は、前記補間フレームにおけるブロックのブロック位置と動きベクトルとを示すデータを含むことを特徴とする請求項6から請求項8のうちのいずれか1項記載の動画像符号化装置。
  12. 前記付加情報は、前記補間フレームにおけるブロックのブロック位置と予測残差絶対値和とを示すデータを含むことを特徴とする請求項6から請求項8のうちのいずれか1項記載の動画像符号化装置。
  13. 前記動画像符号化部は、フレーム外を参照する動きベクトルを発生させないように動き探索を行う動き探索部を備えることを特徴とする請求項6から請求項12のうちのいずれか1項記載の動画像符号化装置。
  14. 請求項5記載の動画像復号装置と、
    請求項6記載の動画像符号化装置とを備え、
    前記動画像符号化装置は前記動画像符号化データに前記画像生成部を補助するための情報を付加して出力し、前記動画像復号装置は前記動画像符号化データと前記付加情報とを入力して前記第2の解析手段で前記付加情報を解析することにより、相互に連携した画像生成処理を行なうことを特徴とする動画像伝送システム。
  15. 前記符号化シンボルは動きベクトル差分値を含み、
    前記第2のステップにおいて、
    前記参照画像上の計算対象ブロックとその周辺のブロックにおいて、動きベクトル差分値の逆数と予測残差の逆数との積を重みに用い、前記動きベクトルの各成分に関する重み付け加算平均計算を行ない、前記補間フレームの時間的位置に応じてスケーリングを行うことで、前記参照画像の参照位置を示す前記補間フレームの動きベクトルの推定を行うことを特徴とする請求項2記載の動画像復号装置。
  16. 前記第2のステップにおいて、
    前記参照画像上の計算対象ブロックとその周辺のブロックにおいて、算出した動きベクトルのラプラシアン値の逆数と予測残差の逆数との積を重みに用い、前記動きベクトルの各成分に関する重み付け加算平均計算を行ない、前記補間フレームの時間的位置に応じてスケーリングを行うことで、前記参照画像の参照位置を示す前記補間フレームの動きベクトルの推定を行うことを特徴とする請求項2記載の動画像復号装置。
  17. 前記第3のステップにおいて、
    前記参照画像の量子化係数の平均値を計算し、前記参照ベクトルにより、前記参照画像の参照位置にある画素を用い、前記量子化係数の平均値にて前記画素の重み付け加算を行うことにより、前記補間フレームを生成することを特徴とする請求項2記載の動画像復号装置。
  18. 前記第3のステップにおいて、
    前記参照ベクトルにより、前記参照画像の参照位置にある画素を用いて前記補間フレームを計算し、計算した補間フレームの端に位置するブロック全てに関してある特定の色で塗りつぶしたものを補間フレームとして生成することを特徴とする請求項2記載の動画像復号装置。
  19. 前記所定の規則を所定の時間間隔に依存する規則とし、
    前記復号手段からの動画像の出力と前記画像生成部からの補間フレームの出力とを切り替えることを特徴とする請求項1記載の動画像復号装置。
  20. 前記所定の規則を前記符号化シンボルに依存する規則とし、
    前記符号化シンボルを用いて、前記復号手段からの動画像の出力と前記画像生成部からの補間フレームの出力との切り替えを決定する補間制御部を備えることを特徴とする請求項1記載の動画像復号装置。
  21. 所定の表示レートに従って入力される動画像の各フレーム画像に対して、実際に符号化を行うフレーム画像を選択する符号化画像選択手段を備え、
    前記符号化画像選択手段にて選択されたフレーム画像に関してのみ、動画像符号化データを生成し、前記動画像符号化データに前記入力動画像信号の表示レート情報を多重化して送出することを特徴とする動画像符号化装置。
  22. 前記動画像符号化データに含まれる表示レート情報を復号する表示レート復号手段を備え、
    前記表示レート復号手段で復号された前記表示レート情報に基づいて、前記復号手段からの動画像の出力と前記画像生成部からの補間フレームの出力とを切り替えることを特徴とする請求項1記載の動画像復号装置。
JP2005306267A 2005-03-04 2005-10-20 動画像符号化装置、動画像復号装置及び動画像伝送システム Pending JP2006279917A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005306267A JP2006279917A (ja) 2005-03-04 2005-10-20 動画像符号化装置、動画像復号装置及び動画像伝送システム

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2005061056 2005-03-04
JP2005306267A JP2006279917A (ja) 2005-03-04 2005-10-20 動画像符号化装置、動画像復号装置及び動画像伝送システム

Publications (1)

Publication Number Publication Date
JP2006279917A true JP2006279917A (ja) 2006-10-12

Family

ID=37214115

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005306267A Pending JP2006279917A (ja) 2005-03-04 2005-10-20 動画像符号化装置、動画像復号装置及び動画像伝送システム

Country Status (1)

Country Link
JP (1) JP2006279917A (ja)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008193691A (ja) * 2007-02-02 2008-08-21 Samsung Electronics Co Ltd 復元されたフレームのフレーム率をアップコンバートする装置および方法
WO2008120330A1 (ja) * 2007-03-28 2008-10-09 Pioneer Corporation 画像処理装置、画像処理方法、画像処理プログラムおよび記録媒体
JP2009200985A (ja) * 2008-02-25 2009-09-03 Hitachi Ltd 映像処理装置
US7991050B2 (en) 2008-05-30 2011-08-02 Kabushiki Kaisha Toshiba Moving picture decoding apparatus and moving picture decoding method
US8218632B2 (en) 2006-09-20 2012-07-10 Mitsubishi Electric Corporation Frame interpolation apparatus and frame interpolation method
US8395700B2 (en) 2006-12-27 2013-03-12 Sharp Kabushiki Kaisha Image displaying device and method, and image processing device and method
JP2014027600A (ja) * 2012-07-30 2014-02-06 Oki Electric Ind Co Ltd 動画像復号装置及びプログラム、並びに、動画像符号化システム
US8768103B2 (en) 2007-03-19 2014-07-01 Hitachi Consumer Electronics Co., Ltd. Video processing apparatus and video display apparatus
KR101443701B1 (ko) 2010-11-22 2014-09-29 한국전자통신연구원 적응형 움직임 탐색 범위 결정 장치 및 방법
JP2017085598A (ja) * 2016-12-08 2017-05-18 株式会社東芝 画像処理装置、画像処理方法、画像処理プログラム、および立体画像表示装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003333540A (ja) * 2002-05-13 2003-11-21 Hitachi Ltd フレームレート変換装置及びそれを用いた映像表示装置、テレビジョン放送受信装置
JP2005006275A (ja) * 2002-11-22 2005-01-06 Matsushita Electric Ind Co Ltd 補間フレーム作成装置、補間フレーム作成方法、および補間フレーム作成プログラム
JP2005012798A (ja) * 2003-06-16 2005-01-13 Samsung Electronics Co Ltd 動きベクトルの生成装置及び方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003333540A (ja) * 2002-05-13 2003-11-21 Hitachi Ltd フレームレート変換装置及びそれを用いた映像表示装置、テレビジョン放送受信装置
JP2005006275A (ja) * 2002-11-22 2005-01-06 Matsushita Electric Ind Co Ltd 補間フレーム作成装置、補間フレーム作成方法、および補間フレーム作成プログラム
JP2005012798A (ja) * 2003-06-16 2005-01-13 Samsung Electronics Co Ltd 動きベクトルの生成装置及び方法

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8218632B2 (en) 2006-09-20 2012-07-10 Mitsubishi Electric Corporation Frame interpolation apparatus and frame interpolation method
US8395700B2 (en) 2006-12-27 2013-03-12 Sharp Kabushiki Kaisha Image displaying device and method, and image processing device and method
JP2008193691A (ja) * 2007-02-02 2008-08-21 Samsung Electronics Co Ltd 復元されたフレームのフレーム率をアップコンバートする装置および方法
US8768103B2 (en) 2007-03-19 2014-07-01 Hitachi Consumer Electronics Co., Ltd. Video processing apparatus and video display apparatus
WO2008120330A1 (ja) * 2007-03-28 2008-10-09 Pioneer Corporation 画像処理装置、画像処理方法、画像処理プログラムおよび記録媒体
JP5038400B2 (ja) * 2007-03-28 2012-10-03 パイオニア株式会社 画像処理装置、画像処理方法、画像処理プログラムおよび記録媒体
JP2009200985A (ja) * 2008-02-25 2009-09-03 Hitachi Ltd 映像処理装置
US7991050B2 (en) 2008-05-30 2011-08-02 Kabushiki Kaisha Toshiba Moving picture decoding apparatus and moving picture decoding method
KR101443701B1 (ko) 2010-11-22 2014-09-29 한국전자통신연구원 적응형 움직임 탐색 범위 결정 장치 및 방법
JP2014027600A (ja) * 2012-07-30 2014-02-06 Oki Electric Ind Co Ltd 動画像復号装置及びプログラム、並びに、動画像符号化システム
JP2017085598A (ja) * 2016-12-08 2017-05-18 株式会社東芝 画像処理装置、画像処理方法、画像処理プログラム、および立体画像表示装置

Similar Documents

Publication Publication Date Title
CN108848376B (zh) 视频编码、解码方法、装置和计算机设备
JP4542447B2 (ja) 画像の符号化/復号化装置、符号化/復号化プログラム及び符号化/復号化方法
US7379501B2 (en) Differential coding of interpolation filters
CN108924553B (zh) 视频编码、解码方法、装置、计算机设备和存储介质
JP2006279917A (ja) 動画像符号化装置、動画像復号装置及び動画像伝送システム
US20030112864A1 (en) Method for sub-pixel value interpolation
KR20060088461A (ko) 영상신호의 엔코딩/디코딩시에 영상블록을 위한 모션벡터를베이스 레이어 픽처의 모션벡터로부터 유도하는 방법 및장치
KR101442608B1 (ko) 영상을 효율적으로 부호화/복호화하는 방법 및 장치
JPH11112973A (ja) 映像信号変換装置及び映像信号変換方法
JPH09154137A (ja) 動き依存予測を使用したビデオ情報の圧縮方法と装置
CN108848377B (zh) 视频编码、解码方法、装置、计算机设备和存储介质
KR20060027779A (ko) 영상 블록의 시간상 및 공간상 상관관계를 이용한영상신호의 엔코딩 및 디코딩 방법과 장치
KR20060027778A (ko) 베이스 레이어를 이용하는 영상신호의 엔코딩/디코딩 방법및 장치
US20060067403A1 (en) Information processing device and information processing method
US8767831B2 (en) Method and system for motion compensated picture rate up-conversion using information extracted from a compressed video stream
KR20060069227A (ko) 영상신호의 엔코딩/디코딩시에 영상블록을 위한 모션벡터를베이스 레이어 픽처의 모션벡터로부터 유도하는 방법 및장치
JP5742049B2 (ja) カラー動画像符号化方法及びカラー動画像符号化装置
KR20060059770A (ko) 영상신호의 엔코딩/디코딩시에 영상블록을 위한 모션벡터를베이스 레이어 픽처의 모션벡터로부터 유도하는 방법 및장치
JP6222756B2 (ja) 復号化方法
Ratnottar et al. Comparative study of motion estimation & motion compensation for video compression
JP4909592B2 (ja) 動画像再生方法及び装置並びにプログラム
JP3289695B2 (ja) 動画符号化方法および装置
JP5913474B2 (ja) 復号化方法
JP4061505B2 (ja) 画像符号化装置および方法
JP5236088B2 (ja) 画像の符号化/復号化装置、符号化/復号化プログラム及び符号化/復号化方法

Legal Events

Date Code Title Description
RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20071003

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20080625

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080728

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110427

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110517

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110714

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20110906