JP2006345446A - 動画像変換装置、動画像変換方法、及びコンピュータ・プログラム - Google Patents

動画像変換装置、動画像変換方法、及びコンピュータ・プログラム Download PDF

Info

Publication number
JP2006345446A
JP2006345446A JP2005171626A JP2005171626A JP2006345446A JP 2006345446 A JP2006345446 A JP 2006345446A JP 2005171626 A JP2005171626 A JP 2005171626A JP 2005171626 A JP2005171626 A JP 2005171626A JP 2006345446 A JP2006345446 A JP 2006345446A
Authority
JP
Japan
Prior art keywords
motion vector
image sequence
image
thinned
processing unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2005171626A
Other languages
English (en)
Other versions
JP4735063B2 (ja
Inventor
Takahiro Ishii
隆寛 石井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP2005171626A priority Critical patent/JP4735063B2/ja
Priority to US11/434,876 priority patent/US8149913B2/en
Publication of JP2006345446A publication Critical patent/JP2006345446A/ja
Application granted granted Critical
Publication of JP4735063B2 publication Critical patent/JP4735063B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/577Motion compensation with bidirectional frame interpolation, i.e. using B-pictures
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/44Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/53Multi-resolution motion estimation; Hierarchical motion estimation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/537Motion estimation other than block-based
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/573Motion compensation with multiple frame prediction using two or more reference frames in a given prediction direction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/59Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial sub-sampling or interpolation, e.g. alteration of picture size or resolution

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

【課題】動きベクトルを付随しない間引き画像から復元画像を再構成する。
【解決手段】 初期動きベクトル検出部43は、間引き画像のみをもとに初期動きベクトルを検出し、動きベクトル画像列バッファ44に格納する。再構成処理部45は動きベクトル画像列バッファ44に格納された動きベクトルと間引き画像とをもとに復元画像を再構成し、動きベクトル検出部47は動きベクトル画像列バッファ44に格納された動きベクトルと復元画像とをもとに新たな動きベクトルを検出する。精度検出部48は、直前に再構成した復元画像と新たに再構成した復元画像との差を求め、再構成の前後における画像の差が十分小さくなったとき、再構成処理部45と動きベクトル検出部47との繰り返し処理を打ち切る。
【選択図】図8

Description

本発明は、動画像変換装置、動画像変換方法、及びコンピュータ・プログラムに関する。特に画素間引き圧縮データから復元画像を再構成する動画像変換装置、動画像変換方法、及びコンピュータ・プログラムに関する。
動画像データは、ハードディスク、DVDなどの記憶媒体への保存、あるいはネットワークを介した配信などにおいて、データ量を削減するためのデータ変換、すなわち圧縮処理が行なわれる。特に、近年、動画像データの高品質化、例えばHD(High Difinition)データなど、データ品質の改善が進んでおり、このデータの高品質化に伴ってデータ量が急激に増大している。このような状況において、動画像データの圧縮、復元処理における圧縮効率の改善や、復元データの品質劣化防止に関する技術について多くの検討、研究がなされている。
動画像の圧縮処理方法としては、例えば、動画像データを構成する画像フレームの構成画素の間引き処理、すなわち空間方向の間引き処理と、フレームレートを間引く処理、すなわち時間方向の間引き処理などが知られている。
このようなデータ変換によるデータ量削減により記憶媒体への保存やネットワークを介したデータ転送が効率的に行なわれるという利点がある。しかしながら、圧縮されたデータを復元し再生する場合、画質の劣化が発生してしまうという問題がある。特にオリジナルデータが高精細画像である場合には、その品質劣化がより顕著になってしまう。
このような画質劣化をいかに低減するかについては様々な検討がなされている。例えば、特許文献1には、画像の明るさの情報に基づくパラメータを設定し、画像の明るさに従って圧縮態様を変更する画像圧縮処理構成を開示している。また、特許文献2には、画面を複数の領域に分割し、領域毎に圧縮態様を変更した圧縮処理構成を開示している。
特開2003−169284号公報 特開2002−27466号公報
ところで、上述した圧縮データには、間引き画像とともに動きベクトルが含まれる。ここで、動きベクトルデータの圧縮量を試算してみる。1画素毎に1ベクトルを割り当て8ビット要素で2次元とすれば、フルHD(Full High-Definition:1920×1080=約200万画素、1画素24ビット)のベクトル画像列の転送量はf×1920×1080×8×2/8=約4fMB/秒となる。ハフマン符号化やそのほかの符号化方法で可逆圧縮しても圧縮率は1/3乃至1/4倍程度である。そのため動きベクトルを可逆圧縮したときには、1fMB/秒の伝送速度が必要となる。一般のフルHDの圧縮データの場合、画像を含め、最大でも0.5fMB/秒程度の伝送/記録速度なので、1fMB/秒では、動きベクトルデータが圧縮率向上の阻害要因になってしまう。
本発明は、このような問題点に鑑みてなされたものであり、動きベクトルを付随しない間引き画像から復元画像を再構成する動画像変換装置、動画像変換方法、及びコンピュータ・プログラムを提供することを目的とする。
上述した目的を達成するために、本発明にかかる動画像変換装置、動画像変換方法、及びコンピュータ・プログラムを実行するコンピュータは、元画像列の画素を間引いて得られた間引き画像列を入力し、間引き画像列をもとに動きベクトルを検出し、新たな動きベクトルが検出される毎に、新たな動きベクトル画像列と間引き画像列とをもとに復元画像列を再構成する処理と、新たな復元画像列が再構成される毎に、新たな復元画像列と直前に検出した動きベクトルとをもとに新たな動きベクトルを検出する動きベクトル検出処理とを繰り返し、この繰り返しの最後に再構成された復元画像を出力する。
本発明の構成によれば、間引き画像をもとに初期値となる動きベクトルを検出し、まず、初期値となる動きベクトルと間引き画像とをもとに最初の復元画像を再構成し、最初の復元画像と初期値となる動きベクトルとをもとに新たな動きベクトルを検出する。次いで、間引き画像と新たな動きベクトルに基づく復元画像の再構成と、新たな復元画像と動きベクトルに基づく新たな動きベクトルの検出とを繰り返すことにより、動きベクトルの精度を徐々に高め、復元画像の画質を向上させる。本発明の構成によれば、動きベクトルを付随しない間引き画像から元画像が復元される。そのため、動きベクトルのデータ量を削減することができる。
以下、図面を参照しながら、本発明の動画像変換装置、動画像変換方法、及びコンピュータ・プログラムの構成について説明する。なお、説明は、以下の項目に従って行なう。
(1)超解像効果を利用した動画像変換装置の基本構成
(2)動きベクトルを付随しない圧縮データをもとに復元画像を生成する動画像変換装置および動画像変換方法
[(1)超解像効果を利用した動画像変換装置の基本構成]
まず、本発明のベースとなる超解像効果を利用した動画像圧縮を実行する動画像変換装置の基本構成について説明する。なお、この基本構成は、本出願人が先に出願した特願2003−412501の明細書及び図面に詳細を記載しているものであり、画像を小領域(ブロック)に分割し、各領域の移動速度に応じて画素数の間引きや、フレームレートの間引きを適応的に行うことでデータ量の圧縮を実現した構成である。
図1に特願2003−412501の明細書及び図面に記載した動画像変換装置10の構成例を示す。この動画像変換装置10は、超解像効果を利用した動画像変換処理を行うことにより、データ量の削減による画質劣化を観測者が知覚しないようにデータ量の削減を行うことができる構成としたものである。
なお、超解像効果とは、観測者が、空間方向に離散的にサンプリングされた移動被写体を追従視する際に、表示画素数以上の解像度を知覚するという視覚的効果である。これは、人間は、ある時間内に呈示された複数の画像が加算されたものを知覚するという視覚特性を持つためである。この特性は、ブロックの法則として知られる視覚の時間的積分機能に起因しており、例えば、"視覚情報ハンドブック,日本視覚学会編,pp.219−220"などに記載されている。ブロックの法則が成り立つ積分時間は、背景光の強度などの呈示条件によって変化するが、およそ25ms乃至100msであるという報告がある。
図1に示す動画像変換装置10は、時間的積分機能によって引き起こされる超解像効果を利用した動画像変換処理を行うことにより、画質劣化を観測者が知覚しないようにデータを削減する圧縮を行う構成としたものである。図1の動画像変換装置10の構成について説明する。
ブロック分割部11は、入力された動画像の各フレームを、所定画素の区分領域としてのブロックに分割し移動量検出部12に供給する。移動量検出部12は、ブロック分割部11から供給された各ブロックについての移動量を検出し、ブロックとその移動量を、ブロック処理部13に送信する。ブロック処理部13は、移動量検出部12から供給されたブロックに対して、その移動量に応じた動画像変換処理、すなわち圧縮処理を施し、データ量を削減する。ブロック処理部13は、その処理の結果得られた、データ量が削減されたブロックについてのデータを、出力部14に供給する。出力部14は、ブロック処理部13から供給された、データ量が削減されたブロックについてのデータを、ストリームデータとしてまとめて出力する。
次に、図2を参照して、各部の詳細について説明する。ブロック分割部11の画像蓄積部21には、動画像変換装置10に供給された動画像のフレームが入力される。画像蓄積部21は、入力されたフレームを蓄積する。画像蓄積部21は、蓄積したフレームの数がN枚(Nは正の整数)になる度に、そのN枚のフレームを、ブロック分割部22に供給するとともに、N枚のフレームの中のM番目に記憶したフレーム(以下、M番目のフレームと称する)を、移動量検出部12(移動量検出部31)に供給する。例えば、N=4とする。
ブロック分割部22は、画像蓄積部21から供給されたN枚のフレーム(連続するN枚のフレーム)のそれぞれを、ある大きさ(例えば8×8、16×16)のブロックに分割し、移動量検出部12(ブロック分配部32)に出力する。ブロック分割部22はまた、N枚のフレームの中の、画像蓄積部21でP番目に記憶されたフレーム(以下、P番目のフレームと称する)の各ブロックを移動量検出部12(移動量検出部31)に供給する。P番目のフレームは、M番目のフレームと異なるフレームである。
次に、移動量検出部12について説明する。移動量検出部12の移動量検出部31は、ブロック分割部11のブロック分割部22から供給されたP番目のフレームの各ブロックの動きベクトルを、画像蓄積部21から供給されたM番目のフレームを参照して例えばフレーム間のブロックマッチング処理を実行して検出し、検出した動きベクトルをブロック分配部32に供給する。動きベクトルは、フレーム間の水平方向(X軸方向)および垂直方向(Y軸方向)の移動量を表している。なお、移動量検出部31は、移動量検出の精度を向上させるために画像を拡大し、拡大画像を適用した移動量検出を行なう構成としてもよい。
移動量検出部12のブロック分配部32には、ブロック分割部22から、N個単位でブロック(N枚のフレームのそれぞれの同一位置にある合計N個のブロック)が供給され、移動量検出部31から、そのN個のブロックの中のP番目のフレームのブロックの移動量が供給される。ブロック分配部32は、供給されたN個のブロックと移動量とを、ブロック処理部13の、その移動量に対応する処理を行うブロック処理部51乃至53の中のいずかに供給する。
具体的にはブロック分配部32は、移動量検出部31から供給された、1フレーム間の水平方向(X軸方向)または垂直方向(Y軸方向)の移動量が2ピクセル(画素)以上である場合、ブロック分割部22から供給されたN個のブロックと移動量検出部31から供給された移動量を、ブロック処理部51に出力する。また、1フレーム間の水平方向と垂直方向の移動量がともに2ピクセル未満で、かつ1ピクセル以上の場合、ブロック分配部32は、N個のブロックと移動量を、ブロック処理部53に出力する。移動量がそのほかの場合には、ブロック分配部32は、N個のブロックと移動量をブロック処理部52に供給する。
すなわちブロック分配部32は、移動量検出部21から供給された移動量に基づき、最適なフレームレートおよび空間解像度を決定し、そのフレームレートおよび空間解像度にしたがって画像データを変換する処理を行うブロック処理部51乃至53に、ブロック画像を分配する。
次に、ブロック処理部13の詳細を説明する。ブロック処理部31は、上述したように3個のブロック処理部51乃至53で構成されている。ブロック処理部51は、移動量検出部12のブロック分配部32から供給された、連続するN(例えばN=4)枚のフレームのそれぞれの同一位置にある合計N個のブロック(水平方向または垂直方向の移動量が2ピクセル以上である場合のN個のブロック)に対して、画素数を、同様にブロック分配部32から供給された移動量に応じて間引く処理(空間方向間引き処理)を行う。
具体的には、1フレーム間の水平方向の移動量が2ピクセル(画素)以上である場合、ブロック処理部51は、処理対象のブロックが図3(a)に示すように4×4ピクセルで構成されているとき、水平方向の4画素のうち1つの画素値のみを選択して代表値とする。図3(b)の例では、P00乃至P30の4画素のうちP10のみを代表値(標本点)として有効にする。その他の画素値は無効とする。同様に、P01乃至P31の4画素に対してはP11を代表値(標本点)とし、P02乃至P32の4画素に対してはP12を代表値(標本点)とし、P03乃至P33の4画素に対してはP13を代表値(標本点)とする。
1フレーム間の垂直方向の移動量が2ピクセル以上である場合、ブロック処理部51は、ブロックが図3(a)に示すように4×4ピクセルで構成されているとき、垂直方向の4画素のうち1つの画素値を標本点として有効とする。図3(c)の例では、P00乃至P03の4画素のうちP01のみを標本点として有効にする。その他の画素値は無効とする。同様に、P10乃至P13の4画素に対してはP11を標本点とし、P20乃至P23の4画素に対してはP21を標本点とし、P30乃至P33の4画素に対してはP31を標本点とする。
ブロック処理部51は、このような空間方向間引き処理を、供給された連続するN(例えばN=4)枚のフレームのそれぞれの同一位置にある合計N=4個のブロックに対してそれぞれ施すので、各ブロックのデータ量が1/4に削減され、4個のブロック全体のデータ量が1/4に削減される。ブロック処理部51は、データ量が1/4に削減された4個のブロックについてのデータを、出力部14に供給する。
次に、図2に示すブロック処理部52の実行する処理について説明する。図2に示すブロック処理部52は、移動量検出部12のブロック分配部32から供給された連続するN枚のフレームのそれぞれの同一位置ある合計Nブロック(水平方向と垂直方向の移動量がともに1ピクセル未満である場合のN個のブロック)に対して、フレーム数を間引く処理(時間方向間引き処理)を行う。
具体的にはブロック処理部52は、図4に示すように、連続する4枚のフレームF1乃至F4のそれぞれの同一位置ある4個のブロックBiを、その中の1つのブロック(この例の場合、フレームF1のブロックBi)にするフレーム数の間引き(4フレーム間のフレーム数の間引き)を行う。ブロック処理部52は、このような時間方向間引き処理により、データ量が1/4に削減された4個のブロックについてのデータ(1個のブロック)を、出力部14に供給する。選択された1つのブロックの画素データが4フレームに対応する標本点データとなる。
ブロック処理部53は、移動量検出部12のブロック分配部32から供給された、連続するN枚のフレームのそれぞれの同一位置にある合計N個のブロック(水平方向と垂直方向の移動量が1ピクセル以上で、2ピクセル未満である場合のN個のブロック)に対して、画素数の間引き処理(空間方向間引き処理)とフレーム数の間引き処理(時間方向間引き処理)をそれぞれ行う。
ブロック処理部53は、ブロック処理部51における間引き処理とは異なり、図5に示すように、1フレーム間の水平方向の移動量が1ピクセル以上で、2ピクセル未満である場合、ブロック処理部53は、処理対象のブロックが図5(a)に示すように4×4ピクセルで構成されているとき、水平方向の4画素のうち2つの画素値のみを選択して代表値とする。図5(b)の例では、P00乃至P30の4画素のうちP00とP20のみを代表値(標本点)として有効にする。その他の画素値は無効とする。同様に、P01乃至P31の4画素に対してはP01とP21のみを代表値(標本点)とし、P02乃至P32の4画素に対してはP02とP22のみを代表値(標本点)とし、P03乃至P33の4画素に対してはP03とP23のみを代表値(標本点)とする。
1フレーム間の垂直方向の移動量が1ピクセル以上で、2ピクセル未満である場合、ブロック処理部53は、処理対象ブロックが図5(a)に示すように4×4ピクセルで構成されているとき、垂直方向の4画素のうち2つの画素値を有効とする。図5(c)の例では、P00乃至P03の4画素のうちP00およびP02のみを代表値(標本点)として有効にする。その他の画素値は無効とする。同様に、P10乃至P13の4画素に対してはP10およびP12を代表値(標本点)とし、P20乃至P23の4画素に対してはP20およびP22を代表値(標本点)とし、P30乃至P33の4画素に対してはP30およびP32を代表値(標本点)とする。
さらにブロック処理部53は、フレーム数の間引き処理を行う。具体的にはブロック処理部53は、連続する4枚のフレームF1乃至F4のそれぞれの同一位置ある4個のブロックに対して、その中の2つのブロックを有効にするフレーム数の間引き処理を実行する。フレーム数の間引き処理においては、ブロック処理部53は、ブロック処理部52における間引き処理と異なり、図6に示すように、連続する4枚のフレームF1乃至F4のぞれぞれの同一位置にある合計4個のブロックBiを、その中のいずれか2つ(図の例では、フレームF1、F3の2個のブロック)にするフレーム数の間引きを行う(2フレーム間のフレーム数の間引き)を行う。選択された2つのブロックの画素データが4フレームに対応する標本点データとなる。この場合、図5を参照して説明した空間方向の間引きにおいて、すでに1ブロックに8つの標本点選択が実行済みであり、2ブロックから総計16の標本点が選択され、これらが4フレームに対応する標本点データとして設定されることになる。
ブロック処理部53は、図5を参照して説明したデータ量を1/2とする空間方向間引き処理と、図6を参照して説明したデータ量を1/2とする時間方向間引き処理を、供給された4個のブロックに対して施すので、結果として4個のブロックのデータ量が(1/2)×(1/2)=1/4に削減される。ブロック処理部53は、データ量が1/4に削減された4個のブロックについてのデータを、出力部14に供給する。
出力部14は、ブロック処理部13のブロック処理部51乃至53のそれぞれから供給された、データ量が削減されたN個のブロックについてのデータからストリームデータを生成する。
図7を参照して、動画像変換装置10における具体的な処理例について説明する。図7は、動画像変換装置10において処理された連続する5枚のフレームF1乃至F5を示し、各フレームから選択された有効データの配置を表している。動画像変換装置10において選択された有効画素が図7に示す空白以外の画素部分であり、空白部は、動画像変換装置10において選択されなかった無効画素部を示している。
各フレームF1乃至F5は時系列に沿った同一位置のフレームであり、それぞれ4×4ピクセルのブロック101乃至116を持つ。
ブロック101乃至116中、ブロック101および102は、ブロック処理部51により水平方向に空間方向間引き処理が施されるブロックである。ブロック111および112は、ブロック処理部51により垂直方向に空間方向間引き処理が施されるブロックである。ブロック103および104は、ブロック処理部53により水平方向に空間方向間引き処理、および時間方向間引き処理が施されるブロックである。ブロック113および114は、ブロック処理部53により垂直方向に空間方向間引き処理、および時間方向間引き処理が施されるブロックである。ブロック105,106,115,116は、ブロック処理部52により時間方向間引き処理が施されるブロックである。
最初のフレームF1では、ブロック101および102は、ブロック処理部51によって水平方向に1/4に間引き処理されて、有効データはそれぞれ4画素となる。ブロック111および112は、ブロック処理部51によって垂直方向に1/4に間引き処理されて、有効データはそれぞれ4画素となる。ブロック103および104は、ブロック処理部53によって水平方向に1/2に間引き処理されて、有効データはそれぞれ8画素となる。ブロック113および114は、ブロック処理部53によって垂直方向に1/2に間引き処理されて、有効データはそれぞれ8画素となる。ブロック105,106,115,116は、ブロック処理部52によって時間方向間引き処理されるが、最初のフレームでは全画素が有効データとなる。
第2フレームF2では、ブロック101および102、並びにブロック111および112は、フレームF1と同様の処理により、それぞれ4画素が有効データとなる。ブロック103および104、並びにブロック113および114は、ブロック処理部53によって時間方向間引き処理されて、全画素が無効となる。ブロック105,106,115,116は、ブロック処理部52によって時間方向間引き処理されて、全画素が無効となる。
第3フレームF3では、ブロック101および102、並びにブロック111および112は、フレームF1と同様の処理により、それぞれ4画素が有効データとなる。ブロック103および104、並びにブロック113および114は、有効なフレームとなり、フレームF1と同様の処理により、それぞれ8画素が有効データとなる。ブロック105,106,115,116は、ブロック処理部52によって時間方向間引き処理されて、全画素が無効となる。
第4フレームF4では、ブロック101および102、並びにブロック111および112は、フレームF1と同様の処理により、それぞれ4画素が有効データとなる。ブロック103および104、並びにブロック113および114は、ブロック処理部53によって時間方向間引き処理されて、全画素が無効となる。ブロック105,106,115,116は、ブロック処理部52によって時間方向間引き処理されて、全画素が無効となる。
ここではN=4としているため、第5フレームF5は、第1フレームF1と同様のデータ配置となる。このようにして、各ブロックのデータは移動速度情報に応じて最適な間引き処理が施され、最終的には1/4のデータ量削減が実現される。
このように、図1に示す動画像変換装置10は、入力された動画像を、そのデータ量が削減された動画像(圧縮データ)に変換する処理を行なうものであるが、その際、所定の視覚特性に基づいて実現される超解像効果を利用した動画像変換処理を行うことにより、データ量の削減による画質劣化を観測者に知覚させないようにした装置である。
具体的には、ブロック分配部32が、移動量検出部21から供給された移動量に基づき、最適なフレームレートおよび空間解像度を決定し、最適なフレームレートおよび空間解像度にしたがった画像データ変換を実行するブロック処理部51乃至53に供給して、各ブロック処理部51乃至53において異なる態様のデータ変換処理を実行する構成としたものであり、本構成により、画質劣化を観測者に知覚させることのない動画像変換処理を実現している。なお、超解像効果とは、前述したように観測者が、空間方向に離散的にサンプリングされた移動被写体を追従視する際に、表示画素数以上の解像度を知覚するという視覚的効果である。これは、人間の視覚における時間的積分機能に起因しており、図1に示す動画像変換装置10は、時間的積分機能によって引き起こされる超解像効果を利用した動画像変換処理を行う構成を有する。
なお、人間の視覚特性および超解像効果に関する原理や説明等は、特願2003−412501の明細書及び図面において詳しく解説がなされている。特願2003−412501の明細書及び図面に説明されている超解像効果の発生条件の概略について、以下に説明する。
間引き量m(ピクセル)の画素数間引きを行った場合に超解像効果が発生するには、間引きによる1次乃至m−1次の折り返し成分が全て打ち消される必要がある。k(=1、2、・・・、m−1)次の折り返し成分が打ち消される条件は、下記式(式1)、(式2)を満足することである。
Figure 2006345446
上記式において、φtは画素数の間引きにおけるサンプリング位置のずれ量であり、時間t(=0、1T、2T、・・・)、信号の移動速度v、時間間隔(フレームレートの逆数)T、を用いて、下記式(式3)によって定義される値である。
Figure 2006345446
間引き量m、小領域の移動量vという条件下で上記式(式1)および(式2)が満たされれば超解像効果が発生し、画質の劣化は観測者に知覚されにくい。
これは、入力動画像のフレームレートと同じフレームレートにおいて表示を行う場合、空間方向に間引きされたブロックは、人間の視覚の時間積分機能により前後のフレーム画像との足し合わせが行われ、結果として元画像と同等の画像を知覚するためである。
動画像変換装置10による間引き処理では、データ量を1/4に圧縮できる。例えば、圧縮していないフルHD(Full High-Definition:1920×1080=約200万画素、1画素24ビット)映像のデータ量は、1フレームあたり6MBである。この映像を1秒間にfフレーム転送するときには、転送量が6fMB/秒となる。フルHD映像に間引き処理を施すと、転送量を1/4の1.5fMB/秒に圧縮できる。さらに、間引き処理とMPEG(Moving Picture Expert Group)4などの高効率の非可逆圧縮法を組み合わせれば、転送量を1/100倍程度、約0.015fMB/秒まで圧縮することができる。
これらの一連の圧縮過程では、動きベクトルが生成される。間引き画像と同様に、動きベクトルを非可逆圧縮で圧縮すると、復元画像にジャギーやノイズ、画像歪みなどのアーティファクトが発生する。これは復元方法の原理から自明である。このように、動きベクトルは、高精度が要求されるため可逆圧縮で圧縮されるが、可逆圧縮は、圧縮率を高くすることができないという問題がある。
ここで、動きベクトルデータの圧縮量を試算してみる。1画素毎に1ベクトルを割り当て8ビット要素で2次元とすれば、元ベクトル画像列の転送量はf×1920×1080×8×2/8=約4fMB/秒となる。ハフマン符号化やそのほかの符号化方法で可逆圧縮しても圧縮率は1/3乃至1/4倍程度である。そのため動きベクトルを可逆圧縮したときには、1fMB/秒の伝送速度が必要となる。また、多少精度を犠牲にして、4×4の画素を1ブロックとした画像ブロックに1ベクトルを割り当てると、転送量が1f/(4×4)=0.0625fMB/秒となるが、画像データ量0.015fMB/秒の4倍以上となる。これでは、動きベクトルデータが圧縮率向上のボトルネックになってしまう。
[(2)動きベクトルを付随しない圧縮データをもとに復元画像を生成する動画像変換装置および動画像変換方法]
上述したように、圧縮画像データに動きベクトルを付随させると、動きベクトルの容量が圧縮率向上の阻害要因になってしまう。本発明を適用した動画像変換装置40では、動きベクトルを付随しない間引き画像のみからなる圧縮画像データから動きベクトルを推定しつつ復元画像の再構成を行い、動きベクトルによる圧縮率の低下を回避する。
図8は、本発明を適用した動画像変換装置40の構成を示すブロック図である。図の括弧内の文字は、バッファに格納される画像の枚数を意味する。本実施の形態では、1フレーム分の動きベクトルの集合も画像とみなし、動きベクトル画像と表現する。また、本実施の形態では、連続する複数の画像を画像列と記す。連続する複数の動きベクトル画像も動きベクトル画像列と表現する。
前提として、間引き画像は、{4×4画素の画像ブロック}×4フレームを1ブロック単位として様々な間引きパターンにより間引かれた画像列とする。
また、この間引き画像列から生成される動きベクトルは、図9に示すように、現在フレームから次フレームへの順方向動きベクトル91の集合と現在フレームから前フレームへの反方向ベクトル92の集合である。つまり、1フレーム中の1画素毎に2個の動きベクトルが割り当てられることになる。順方向動き動きベクトル91と反方向動きベクトル92とは、現在フレーム当該画素近傍の絵柄が次フレームまたは前フレームでどの方向にどれだけ移動したかを表す2次元ベクトルとする。もちろん、ブロックのサイズや動きベクトルの本数などは変更してもよい。
まず、図8を参照して動画像変換装置40のおおまかな構成について説明する。
入力部41は、間引き画像を入力し、入力した間引き画像を間引き画像列バッファ42に格納する。間引き画像列バッファ42は、N枚の間引き画像列を格納する。初期動きベクトル検出部43は、間引き画像列バッファ42に格納された間引き画像から初期動きベクトルを検出し、初期動きベクトルを動きベクトル画像列バッファ44に格納する。
再構成処理部45は、動きベクトル画像列バッファ44に格納された初期動きベクトルと間引き画像列バッファ42に格納された間引き画像とを元に復元画像を再構成する。復元画像列バッファ46は、N枚の復元画像を格納する。動きベクトル検出部47は、再構成処理部45が作成した復元画像を元に初期動きベクトルより精度の高い動きベクトルを検出し、検出した動きベクトルを動きベクトル画像列バッファ44に格納する。
再構成処理部45は、動きベクトル画像列バッファ44に格納された新しい動きベクトルと間引き画像とを元に復元画像を再構成する。動きベクトル検出部47は、再構成された復元画像を元により精度の高い動きベクトルを検出する。以後、再構成処理部45による復元画像の再構成と、動きベクトル検出部47による動きベクトル検出を交互に繰り返す。
精度検出部48は、復元画像を再構成する都度、直前に再構成した復元画像と今回再構成した復元画像との差を求め、再構成の前後における画像の差が十分に小さくなったとき、再構成処理部45と動きベクトル検出部47との繰り返し処理を打ち切る。その結果得られた画像が最終的な復元画像となる。
このように、本発明を適用した動画像変換装置40では、間引き画像に基づく初期動きベクトルを初期値として、間引き画像の再構成と動きベクトルの検出とを交互に繰り返すことにより、間引き画像のみから元の動画像を復元することができる。
次いで、動画像変換装置40の各構成について詳述する。
初期動きベクトル検出部43は、間引き画像のみに基づき初期動きベクトルを検出する。初期動きベクトルは、再構成処理部45が復元画像を再構成するための初期値として使用する動きベクトルである。本発明を適用した動画像変換装置40では、初期動きベクトルを初期値とすることにより、再構成処理部45と動きベクトル検出部とのループ処理を素早く完了させることができる。
図10乃至図12に初期動きベクトル検出部43の構成を示す。本実施の形態では、3種類の初期動きベクトル検出部43について説明する。図10に示す初期動きベクトル検出部43を第1の初期動きベクトル検出部43aと記し、図11に示す空間補間処理を省略した初期動きベクトル検出部43を第2の初期動きベクトル検出部43bと記し、図12に示す空間補間処理および時間補間処理を省略した初期動きベクトル検出部43を第3の初期動きベクトル検出部43cと記す。
第1の初期動きベクトル検出部43aは、図10に示すように、間引き画像を縮小する縮小処理部61と、補間前動きベクトル検出処理の初期値となる前初期動きベクトルを検出する前初期動きベクトル検出部62と、縮小した間引き画像から復元画像よりも低解像度かつ低フレームレートである疎な補間前動きベクトルを検出する補間前動きベクトル検出部63と、補間前動きベクトル検出部63が検出した補間前動きベクトルを補間して初期動きベクトルを生成する動きベクトル補間処理部64とを備える。
前初期動きベクトル検出部62は、補間前動きベクトル検出処理の出発点となる動きベクトルである前初期動きベクトルを検出する。前初期動きベクトル検出部62は、間引き画像からブロックを抜き出し、このブロックの間引きパターンからブロック毎のおおまかな動きベクトルである前初期動きベクトルを推定する。前初期動きベクトル検出部62は、N/4フレーム分の前初期動きベクトルを前初期動きベクトルバッファ66に格納する。
具体的に説明すると、間引き画像を生成する際、上述した動画像変換装置40では、1フレームを4×4ピクセルのブロックに分割し、1フレーム間のブロックの移動量が水平方向に2ピクセル以上である場合、図3に示すように水平方向の4画素のうち1つの画素値のみを選択して代表値とする。このときブロックの間引きパターンは、図3(b)のようになる。
前初期動きベクトル検出部62は、これを利用して、ブロックの間引きパターンが図3(b)のようであれば、1フレーム間に2ピクセル以上水平移動したことを検出する。同様に、ブロックの間引きパターンが図3(c)のようであれば、垂直方向の移動を検出することもできる。
また、水平方向の移動量が1ピクセル以上で、2ピクセル未満である場合、図5に示すように、水平方向の4画素のうち2つの画素値のみを選択して代表値とする。前初期動きベクトル検出部62は、これを利用して、ブロックの間引きパターンが図5(b)のようであれば、1フレーム間に1ピクセル以上で、2ピクセル未満水平移動したことを検出する。同様に、ブロックの間引きパターンが図5(c)のようであれば、1フレーム間に1ピクセル以上で、2ピクセル未満垂直移動したことを検出する。
さらに、水平方向と垂直方向の移動量がともに1ピクセル未満である場合、連続する4枚のフレームの同一位置にある4個のブロックのうち3枚フレーム分のブロックを間引きする。前初期動きベクトル検出部62は、間引きされていないブロックとそのブロックの前後合わせて3フレームのブロックが間引かれているときには、ブロックの移動量が1ピクセル未満であることを検出する。
前初期動きベクトル検出部62は、間引きパターンとブロックの移動量との関係を元に、ブロックのおおまかな移動量を示す前初期動きベクトルを検出する。
縮小処理部61は、間引き画像列バッファ42に格納されたN枚(Nは整数)の間引き画像の中から4フレーム毎に1フレームを選択し、選択した1フレームに対して横方向1/4倍、縦方向1/4倍の縮小処理を施す。縮小処理により、間引き画像が解像度が1/4に減少し、フレームレートも1/4に減少する。縮小された間引き画像は、縮小画像列として縮小画像列バッファ65に格納される。
縮小処理部61では、時間方向の間引き処理が行われたブロック内の残り画素数が最も多くなるフレームを選択対象とする。また、上述したように、画素のパターンは、ブロックの移動量に応じて、1ブロックのうちの、縦1列の4画素、横1列の4画素、縦2列の8画素、横2列の8画素を残す4つのパターンが存在する。ある移動量に対して常にブロック内の定位置の画素群を残すような間引きパターンの場合、1/4に縮小しても、元の間引きパターンを推定することができる。
補間前動きベクトル検出部63では、縮小画像列バッファ65にアクセスし、局所的探索を用いて縮小画像間の動きベクトルである補間前動きベクトルを検出する。局所的探索では、ある初期値から開始し解を探索する。ここで使用する初期値は、前初期ベクトルである。補間前動きベクトル検出部63では、補間前動きベクトルの解に近い前初期動きベクトルから探索を出発させることにより、補間前動きベクトルの検出に必要な繰り返し計算を早く終えることができる。
補間前動きベクトル検出部63は、検出した動きベクトルを動きベクトル補間処理部64に出力する。補間前動きベクトル画像列は、復元画像より低解像度かつ低フレームレートの縮小画像に基づいて検出された疎な動きベクトルである。なお、補間前動きベクトル検出部63の動きベクトル検出処理は、動きベクトル検出部47の動きベクトル処理と同様の処理である。動きベクトル検出処理については、後に詳しく説明する。
動きベクトル補間処理部64は、補間前動きベクトルを、復元画像と同解像度で同フレームレートになるように補間する。具体的には、動きベクトル補間処理部64は、空間方向補間とフレーム間の時間方向補間を行う。空間方向補間では、補間前動きベクトルに、例えば、4近傍の双線形補間を施す。時間方向補間では、被写体が4フレームに亘って一定速度で移動していると仮定して、中間の3フレーム分の動きベクトルを生成し、各フレーム間を結ぶ動きベクトルと各フレームにおける動きベクトルの起点を求める。そして、求めた動きベクトルの起点が画素中心となるようにフレーム毎にリサンプリング処理を施す。動きベクトル補間処理部64は、このように生成した初期動きベクトルを動きベクトル画像列バッファ44に格納する。
次いで、第2の初期動きベクトル検出部43bについて説明する。第2の初期動きベクトル検出部43bは、縮小画像を復元画像と同じ解像度にアップコンバートした拡大画像を作成し、拡大画像から補間前動きベクトルを検出することにより、補間前動きベクトルに施す空間補間処理を省略できるのが特徴である。
第2の初期動きベクトル検出部43bは、図11に示すように、間引き画像を縮小する縮小処理部71と、補間前動きベクトル検出処理の初期値となる前初期動きベクトルを検出する前初期動きベクトル検出部72と、縮小した間引き画像を拡大する拡大処理部73と、拡大画像から復元画像と同じ解像度の補間前動きベクトルを検出する補間前動きベクトル検出部74と、補間前動きベクトルを補間して初期動きベクトルを生成する動きベクトル補間処理部75とを備える。
前初期動きベクトル検出部72は、間引き画像からブロックを抜き出し、このブロックの間引きパターンからブロック毎のおおまかな動きベクトルである前初期動きベクトルを推定する。ここまでは、第1の初期動きベクトル検出部43aにおける前初期動きベクトル検出部62と同様の処理である。第2の初期動きベクトル検出部43bにおける前初期動きベクトル検出部72は、さらに、前初期動きベクトルをリサンプリングして復元画像と同解像度にする。前初期動きベクトル検出部72は、解像度を上げた前初期動きベクトルを補間前動きベクトル検出部74に出力する。
縮小処理部71は、第1の初期動きベクトル検出部43aにおける縮小処理部61と同様の処理を行い、縮小した間引き画像を間引き縮小画像列バッファ77に格納する。縮小画像列バッファ77には、N/4枚の縮小画像が格納される。
拡大処理部73は、縮小画像列バッファ77に格納された縮小画像に、例えば、4近傍双線形補間処理などを施し、縮小画像の解像度を復元画像の解像度までアップコンバートする。拡大処理部73は、拡大した縮小画像を拡大画像列バッファ78に格納する。拡大画像列バッファ78には、N/4枚の拡大画像が格納される。
補間前動きベクトル検出部75は、拡大画像列バッファ78にアクセスし、拡大画像の動きベクトルである補間前動きベクトルを検出する。拡大画像から検出された補間前動きベクトルは、復元画像よりもフレームレートの低い画像に基づく動きベクトルである。
動きベクトル補間処理部74は、フレーム間の時間方向補間を行う。時間方向補間では、被写体が4フレームに亘って一定速度で移動していると仮定して、中間の3フレーム分の動きベクトルを生成し、各フレーム間を結ぶ動きベクトルの各フレームにおける動きベクトルの起点を求める。そして、求めた動きベクトルの起点が画素中心となるようにフレーム毎にリサンプリング処理を施す。動きベクトル補間処理部75は、このように生成した初期動きベクトルを動きベクトル画像列バッファ44に格納する。
このように、第2の初期動きベクトル検出部43bでは、復元画像と同じ解像度に縮小画像を拡大し、拡大画像から補間前動きベクトルを検出するため、動きベクトル補間処理部75における空間方向補間処理を省略することができる。
次いで、第3の初期動きベクトル検出部43cについて説明する。第3の初期動きベクトル検出部43cは、縮小画像を復元画像と同じ解像度かつ同じフレームレートに変換した還元画像を作成し、還元画像を元に補間前動きベクトルを検出することにより、補間前動きベクトルに施す空間補間処理とフレーム間の時間補間処理とを省略できるのが特徴である。
第3の初期動きベクトル検出部43cは、図12に示すように、間引き画像を縮小する縮小処理部81と、補間前動きベクトル検出処理の初期値となる前初期動きベクトルを検出する前初期動きベクトル検出部82と、前初期動きベクトルを初期値として補間前動きベクトルを検出する補間前動きベクトル検出部83と、補間前動きベクトルを用いて縮小画像を復元画像と同解像度かつ同フレームレートに変換した補間画像を生成する画像補間処理部84と、間引き画像と補間画像とを合成する合成処理部85と、合成画像から初期動きベクトルを検出する初期動きベクトル検出処理部86とを備える。
前初期動きベクトル検出部82は、第1の初期動きベクトル検出部43aにおける前初期動きベクトル検出部62と同様に、間引き画像からブロックを抜き出し、このブロックの間引きパターンからブロック毎のおおまかな動きベクトルである前初期動きベクトルを推定する。
縮小処理部81は、第1の初期動きベクトル検出部43aにおける縮小処理部61と同様の処理を行い、縮小した間引き画像を縮小画像列バッファ87に格納する。縮小画像列バッファ87には、N/4枚の縮小画像が格納される。
補間前動きベクトル検出部83は、第1の初期動きベクトル検出部43aにおける補間前動きベクトル検出部63と同様の処理を行い、縮小画像列バッファ87にアクセスし、縮小画像間の動きベクトルである補間前動きベクトルを検出する。ここで使用する初期値は、前初期動きベクトルである。補間前動きベクトル画像列バッファ88は、N/4フレーム分の動きベクトルを格納する。補間前動きベクトル画像列バッファ88に格納される動きベクトルは、復元画像より低解像度かつ低フレームレートの縮小画像に基づく疎な動きベクトルである。
画像補間処理部84は、補間前動きベクトルを用いて、縮小画像を復元画像と同解像度かつ同フレームレートに補間する。縮小画像の解像度を上げるには、例えば、4近傍の双線形補間などのリサンプリング処理を用いる。フレームレートを上げるには、例えば、MPEG(Moving Picture Expert Group)で用いられている動き補償のフレーム再生技術を用いる。これにより、補間前の2枚のフレームごとに中間3フレームが生成される。
合成処理部85は、画像補間処理部84から入力した補間済画像と間引き画像列バッファ42から入力した間引き画像とを合成して合成画像を生成する。画像の合成には、間引き画像の有効画素を優先して合成する。
初期動きベクトル検出処理部86は、N枚の合成画像を元に、Nフレーム分の初期動きベクトルを検出する。初期動きベクトル検出処理部86は、検出した初期動きベクトルを動きベクトル画像列バッファ44に格納する。初期動きベクトル検出処理部86における動きベクトルの検出処理は、動きベクトル検出部47と同様の処理である。この動きベクトル検出処理について後に詳しく説明する。
このように、第3の初期動きベクトル検出部43cでは、復元画像と同フレームレートかつ同解像度である補間済画像から動きベクトルを求めることにより、動きベクトルの空間方向の補間処理及び時間方向の補間処理を実行しなくてよい。
再構成処理部45は、入力部から入力した間引き画像と動きベクトル画像列バッファ44に格納された動きベクトルとをもとに空間方向間引き処理により間引かれた画素と、時間方向間引き処理により間引かれた画素を復元する。
まず、空間方向間引き処理により情報が欠落した動画像から原画像を復元する原理について説明する。図13は、右方向に移動する被写体(車)を撮影した原画像I1乃至I4に対して、水平方向に1/4の空間間引き処理を行った結果画像S1乃至S4を示している。フレームF1において、原画像I1は、右方向に移動する被写体を撮影した画像である。
被写体(車)の移動速度が、図2に示す動画像変換装置10のブロック分配部32において、ブロック処理部51(空間方向間引き処理)に分配される条件、すなわちフレームあたりの移動量があらかじめ定めた条件に合致している場合、ブロック処理部51において空間方向間引き処理が実行される。この結果、原画像I1は、図13の矢印で示すサンプリング点において水平方向に1/4に間引きされる。ここで、間引き処理におけるサンプリング点(図3の代表画素(標本点)に相当する)の位置は、フレームに対して固定である。間引き処理された画像S1は、原画像I1に対して1/4のデータ量になっている。
フレームF2において、原画像I2は、原画像I1に対して被写体が移動速度v(ピクセル/フレーム)だけ右に移動している。この状態で、フレームF1と同様に間引き処理を行い、間引き画像S2を得る。このとき、サンプリング点(標本点)の位置はフレームF1と同じであるため、間引き画像S2は、間引き画像S1と異なる画像となる。
同様に、フレームF3、フレームF4において、原画像I3,I4に対して間引き処理を行い、間引き画像S3,S4を得る。この例では、v=1(ピクセル/フレーム)であり、通常表示時に1/4間引き処理において超解像効果が得られるものとする。
間引き画像S1乃至S4は、同じ位置のサンプリング点(標本点)で間引き処理された画像であるが、被写体の移動速度vが間引き量(本実施例では4)の整数倍になっていなければ、それぞれ異なる位置でサンプリングされた画像となっている。したがって、各間引き画像S1乃至S4は、原画像に対して情報が欠落しており、それぞれが異なる情報を持つ。これらの複数の画像を、移動速度情報に基づき位置を合わせながら足し合わせることにより原画像の復元が可能である。
図14は、各フレームに対応する間引き画像S1乃至S4を、移動速度vに従って移動させた画像を示している。この例ではv=1(右方向)であるため、間引き画像S1に対して、間引き画像S2は被写体が右に1画素、間引き画像S3は被写体が右に2画素、間引き画像S4は被写体が右に3画素、それぞれずれている。これを位置合わせするために、間引き画像S2を左に1画素、間引き画像S3を左に2画素、間引き画像S4を左に3画素、それぞれ移動する(図14)。この結果、各間引き画像S1乃至S4の被写***置は一致し、サンプリング位置が異なるようになる。これらの画像を足し合わせると、復元画像R1が得られる。
次いで、動きベクトル検出部47における動きベクトル検出処理について説明する。動きベクトル検出処理は、局所探索であり、初期動きベクトルを第1近似として探索を開始する。
なお、第1の初期動きベクトル検出部43aの補間前動きベクトル検出部63、第2の初期動きベクトル検出部43bの補間前動きベクトル検出部74、第3の初期動きベクトル検出部43cの補間前動きベクトル検出部83及び初期動きベクトル検出処理部86もこの動きベクトル検出部47と同様の処理を行う。
(式4)に、局所探索における局所領域の類似性比較のための評価関数Eの一例を示す。動きベクトルの検出処理では、Eを最小化するvを探索する計算を行う。この評価関数Eでは、収束計算を安定させるため、間引き画像の無効画素であったところに低い信頼度、有効画素であったところに高い信頼度を与える。
Figure 2006345446
ここで、(式4)における各記号の意味は、
p:現在フレームの任意の点の座標
v:座標pから次/前フレームへの動きベクトル
d:座標pからのずれ
r(x) :現在フレームの座標xでの信頼度
r’(x):次/前フレームの座標xでの信頼度
c(x) :現在フレームの座標xでの色
c’(x):次/前フレームの座標xでの色
である。
r(x)およびr’(x)には、もし有効画素の座標とxが一致すれば1、無効画素の座標とxが一致すれば0に近い値(例えば、0.1)を与え、有効画素とも無効画素とも一致しないサブピクセル精度での座標xには4近傍双線形補間をした値を用いる。
動きベクトル検出部47は、検出した動きベクトルを動きベクトル画像列バッファ44に格納する。再構成処理部45は、新たな動きベクトルが検出される度に、新たな動きベクトルと間引き画像とを元に復元画像の再構成処理を行う。動きベクトル検出部47は、新たに再構成された復元画像を元に動きベクトルを検出する。
精度検出部48は、直前に再構成した復元画像と、今回再構成した復元画像の差を示す精度検出指標を求め、精度検出指標がある閾値を下回ると、再構成の前後における画像の差が十分に小さくなったものとして、動きベクトル検出部47と再構成処理部45との計算を終了させる。精度検出指標は、例えば、再構成の前後における再構成画像の画素あたりの輝度変化の平均値、すなわち、再構成前の画素値と再構成後の画素値との絶対差を総和したものを全画素数で割った値である。精度検出部48は、これらの精度検出指標が所定の閾値を下回ると、動きベクトル検出部47と再構成処理部45とのループ処理を終了させる。
なお、精度検出部48の他の構成として、動きベクトル検出部47と再構成処理部45とのループ回数を計数し、ループ回数が所定の回数に達したときに、動きベクトル検出部47と再構成処理部45との計算を終了させるようにしてもよい。
また、精度検出指標として、輝度変化の代わりに、動きベクトル変化を用いることもできる。このとき、動きベクトル変化とは、例えば、動きベクトル検出の前後における動きベクトルの差の平均、すなわち、直前に検出した動きベクトルと今回検出した動きベクトルの差を総和したものを全動きベクトル数で割った値である。精度検出部48は、動きベクトルの差の平均と所定の閾値を比較して、平均が閾値よりも小さくなったときにループ処理を終了させる。
以上説明したように、本発明を適用した動画像変換装置40は、動きベクトルを付随しない間引き画像のみからなる圧縮画像データから動きベクトルを推定しつつ復元画像を再構成するため、動きベクトルを付随させることによる圧縮画像データの圧縮率の低下を回避することができる。
動画像変換装置40における、動きベクトル検出部47と再構成処理部45とのループ処理では、当初、アーティファクトの多い復元画像が作成されるが、動き検出処理において一定の広さをもつ領域同士の比較で対応が求められアーティファクトが均らされて徐々に精度が向上してゆく。これにより、十分な精度の復元画像を得ることができる。
また、圧縮率が向上することにより高フレームレートの動画像であっても高い圧縮率で伝送/記録できる。高フレームレートの映像をより高い圧縮率で伝送または記録したのち、映像再生、特にスローモーション再生や任意時刻の静止画像表示が可能になる。
超解像効果を利用したデータ変換を実行する従来の動画像変換装置の基本構成を示すブロック図である。 超解像効果を利用したデータ変換を実行する動画像変換装置の基本構成の詳細を示すブロック図である。 動画像変換装置におけるブロック処理部の空間方向間引き処理について説明する説明図である。 動画像変換装置におけるブロック処理部の時間方向間引き処理について説明する説明図である。 動画像変換装置におけるブロック処理部の空間間方向間引き処理について説明する説明図である。 動画像変換装置におけるブロック処理部の時間方向間引き処理について説明する説明図である。 動画像変換装置におけるブロック処理部の処理結果の一例について説明する説明図である。 本発明を適用した動画像変換装置の基本構成を示すブロック図である。 本実施の形態で使用する動きベクトルの向きを説明する説明図である。 第1の初期動きベクトル検出部の基本構成を示すブロック図である。 第2の初期動きベクトル検出部の基本構成を示すブロック図である。 第3の初期動きベクトル検出部の基本構成を示すブロック図である。 移動被写体に対する水平方向の空間間引き処理の処理例、および原画像の復元処理について説明する説明図である。 移動被写体に対する水平方向の空間間引き処理の間引き位置をフレーム毎に変更した処理例、および復元処理について説明する説明図である。
符号の説明
40 動画像変換装置、41 入力部、42 間引き画像列バッファ、43 初期動きベクトル検出部、43a 第1の初期動きベクトル検出部、43b 第2の初期動きベクトル検出部、43c 第3の初期動きベクトル検出部、44 動きベクトル画像列バッファ、45 再構成処理部、46 復元画像列バッファ、47 動きベクトル検出部、48 精度検出部、61 縮小処理部、62 前初期動きベクトル検出部、63 補間前動きベクトル検出部、64 動きベクトル補間処理部、65 縮小画像列バッファ、71 縮小処理部、72 前初期動きベクトル検出部、73 拡大処理部、74 補間前動きベクトル検出部、75 動きベクトル補間処理部、77 縮小画像列バッファ、78 拡大画像列バッファ、81 縮小処理部、82 前初期動きベクトル検出部、83 補間前動きベクトル検出部、84 画像補間処理部、85 合成処理部、86 初期動きベクトル検出処理部、87 縮小画像列バッファ、88 補間前動きベクトル画像列バッファ、

Claims (11)

  1. 元画像列の画素を間引いて得られた間引き画像列の復元処理を実行する動画像変換装置であって、
    上記間引き画像列を入力する入力部と、
    上記間引き画像列をもとに動きベクトル画像列を検出する初期動きベクトル検出部と、
    新たな動きベクトル画像列が検出される毎に、上記新たに検出された動きベクトル画像列と上記間引き画像列とをもとに復元画像列を再構成する再構成処理部と、
    新たな復元画像列が再構成される毎に、上記新たに再構成された復元画像列と過去に検出された動きベクトル画像列とから新たな動きベクトル画像列を検出する動きベクトル検出部と、
    上記再構成処理部による再構成処理と上記動きベクトル検出部による動きベクトルの検出処理とを所定の条件に基づいて終了し、上記終了判定時に得られていた復元画像列のうち、復元対象であった復元画像を出力する終了処理部と
    を有することを特徴とする動画像変換装置。
  2. 上記終了処理部は、上記再構成処理部が新たに再構成した復元画像列と上記再構成処理部が上記新たな復元画像列の再構成処理より1つ前の処理で再構成した復元画像列との輝度変化を算出し、上記輝度変化が十分小さくなったときに上記再構成処理部における復元画像列の再構成と上記動きベクトル検出部における動きベクトル画像列の検出とを終了させることを特徴とする請求項1記載の動画像変換装置。
  3. 上記終了処理部は、上記動きベクトル検出部によって新たに検出された動きベクトル画像列と当該動きベクトル画像列の直前に検出された動きベクトルとのベクトル変化を算出し、上記ベクトル変化が十分小さくなったときに上記再構成処理部における復元画像の再構成と上記動きベクトル検出ベクトルにおける動きベクトルの検出とを終了させることを特徴とする請求項1記載の動画像変換装置。
  4. 上記動きベクトル検出部は、上記初期動きベクトルを初期値として局所探索による動きベクトルの検出を行い、上記局所探索では上記間引き画像の画素毎の信頼度に応じて局所領域に対する類似性比較の評価値を求めることを特徴とする請求項1記載の動画像変換装置。
  5. 上記初期動きベクトル検出部は、
    上記間引き画像列の一部のフレームを選択し選択したフレームを縮小して上記間引き画像列よりもフレームレート及び解像度の低い縮小画像列を生成する縮小処理部と、
    上記縮小画像列から補間前動きベクトル画像列を検出する補間前動きベクトル検出部と、
    上記補間前動きベクトル画像列のフレームレートおよび解像度を上記間引き画像に基づいて検出された動きベクトルと同じになるように補間し動きベクトル画像列を生成する補間処理部と
    を有することを特徴とする請求項1記載の動画像変換装置。
  6. 上記初期動きベクトル検出部は、
    上記間引き画像列の一部のフレームを選択し選択したフレームを縮小して上記間引き画像列よりもフレームレートかつ解像度の低い縮小画像列を生成する縮小処理部と、
    上記縮小画像列の各画像を拡大して上記間引き画像列よりも低フレームレートかつ同解像度の拡大画像列を生成する拡大処理部と、
    上記拡大画像列から補間前動きベクトル画像列を検出する補間前動きベクトル検出部と、
    上記補間前動きベクトル画像列のフレームレートが上記間引き画像列に基づく動きベクトル画像列と同じになるように補間し動きベクトル画像列を生成する補間処理部とを有することを特徴とする請求項1記載の動画像変換装置。
  7. 上記初期動きベクトル検出部は、
    上記間引き画像列の一部のフレームを選択し選択したフレームを縮小して上記間引き画像列よりもフレームレート及び解像度の低い縮小画像列を生成する縮小処理部と、
    上記縮小画像列から補間前動きベクトル画像列を検出する補間前動きベクトル検出部と、
    上記補間前動きベクトル画像列を用いて上記縮小画像列のフレームレート及び解像度が上記間引き画像列と同じになるように補間し補間済画像列を生成する画像補間処理部と、
    上記補間済画像列を構成する各補間済画像と、上記各補間済画像と時間的に一致する上記間引き画像列の間引き画像とを合成し合成画像列を生成する合成処理部と、
    上記合成画像列から初期動きベクトル画像列を検出する初期動きベクトル検出処理部と
    を有することを特徴とする請求項1記載の動画像変換装置。
  8. 上記間引き画像列は、上記元画像列を構成する各画像を分割したブロックのフレーム間の移動量に応じた間引きパターンで上記復元画像の各ブロックの画素を間引いて得られたものであり、
    上記初期動きベクトル検出部は、間引き画像をブロックに分割し、各ブロックの間引きパターンに対応するブロックの移動量をもとに前初期動きベクトルを生成する前初期動きベクトル検出部を備え、
    上記補間前動きベクトル検出部は、上記前初期動きベクトルを初期値として補間前動きベクトルを検出することを特徴とする請求項5乃至7記載の動画像変換装置。
  9. 上記補間前動きベクトル検出部は、上記前初期動きベクトルを初期値として局所探索による動きベクトルの検出を行い、上記局所探索では上記間引き画像の画素毎の信頼度に応じて局所領域に対する類似性比較の評価値を求めることを特徴とする請求項5乃至7記載の動画像変換装置。
  10. 元画像列の画素を間引いて得られた間引き画像列の復元処理を実行する動画像変換方法であって、
    上記間引き画像列を入力する入力工程と、
    上記間引き画像列をもとに動きベクトル画像列を検出する初期動きベクトル検出工程と、
    新たな動きベクトル画像列が検出される毎に、上記新たな動きベクトル画像列と上記間引き画像列とをもとに復元画像列を再構成する処理と、新たな復元画像列が再構成される毎に、上記新たな復元画像列と上記動きベクトルをもとに新たな動きベクトルを検出する動きベクトル検出処理とを繰り返す繰り返し工程と、
    上記繰り返しを所定の条件に基づいて終了し、上記終了判定時に得られていた復元画像列のうち、復元対象であった復元画像を出力する終了工程と
    を有することを特徴とする動画像変換方法。
  11. 元画像列の画素を間引いて得られた間引き画像列の復元処理を所定のコンピュータに実行させるコンピュータ・プログラムであり、
    上記間引き画像列を入力する入力工程と、
    上記間引き画像列をもとに動きベクトル画像列を検出する初期動きベクトル検出工程と、
    新たな動きベクトル画像列が検出される毎に、上記新たな動きベクトル画像列と上記間引き画像列とをもとに復元画像列を再構成する処理と、新たな復元画像列が再構成される毎に、上記新たな復元画像列と上記動きベクトルをもとに新たな動きベクトルを検出する動きベクトル検出処理とを繰り返す繰り返し工程と、
    上記繰り返しを所定の条件に基づいて終了し、上記終了判定時に得られていた復元画像列のうち、復元対象であった復元画像を出力する終了工程と
    を有するコンピュータ・プログラム。
JP2005171626A 2005-06-10 2005-06-10 動画像変換装置、動画像変換方法、及びコンピュータ・プログラム Expired - Fee Related JP4735063B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2005171626A JP4735063B2 (ja) 2005-06-10 2005-06-10 動画像変換装置、動画像変換方法、及びコンピュータ・プログラム
US11/434,876 US8149913B2 (en) 2005-06-10 2006-05-17 Moving picture converting apparatus and method, and computer program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005171626A JP4735063B2 (ja) 2005-06-10 2005-06-10 動画像変換装置、動画像変換方法、及びコンピュータ・プログラム

Publications (2)

Publication Number Publication Date
JP2006345446A true JP2006345446A (ja) 2006-12-21
JP4735063B2 JP4735063B2 (ja) 2011-07-27

Family

ID=37524088

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005171626A Expired - Fee Related JP4735063B2 (ja) 2005-06-10 2005-06-10 動画像変換装置、動画像変換方法、及びコンピュータ・プログラム

Country Status (2)

Country Link
US (1) US8149913B2 (ja)
JP (1) JP4735063B2 (ja)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7983835B2 (en) 2004-11-03 2011-07-19 Lagassey Paul J Modular intelligent transportation system
US20080278633A1 (en) * 2007-05-09 2008-11-13 Mikhail Tsoupko-Sitnikov Image processing method and image processing apparatus
KR101493325B1 (ko) * 2008-09-03 2015-02-16 삼성전자주식회사 정밀 움직임 예측을 기반으로 한 프레임 보간 장치 및 그 방법
US8718366B2 (en) * 2009-04-01 2014-05-06 Ati Technologies Ulc Moving text detection in video
ATE547775T1 (de) * 2009-08-21 2012-03-15 Ericsson Telefon Ab L M Verfahren und vorrichtung zur schätzung von interframe-bewegungsfeldern
JP5574830B2 (ja) * 2010-06-03 2014-08-20 三菱電機株式会社 画像処理装置及び方法、並びに画像表示装置及び方法
JP2012089986A (ja) * 2010-10-18 2012-05-10 Mitsubishi Electric Corp 画像処理装置及び方法、並びに画像表示装置及び方法
US20150110190A1 (en) * 2013-10-21 2015-04-23 Sony Corporation Method and apparatus for motion estimation

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01231583A (ja) * 1988-03-11 1989-09-14 Fujitsu Ltd 可変ビットレート画像符号化装置
JPH07222145A (ja) * 1994-01-31 1995-08-18 Mitsubishi Electric Corp 画像符号化装置
JPH0937243A (ja) * 1995-07-20 1997-02-07 Sanyo Electric Co Ltd 動画像符号化装置及び復号装置
JP2004023670A (ja) * 2002-06-19 2004-01-22 Nec Corp 画像符号化装置および同方式

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6463178B1 (en) * 1997-06-16 2002-10-08 Sony Corporation Image processing device and method, and transmission medium, transmission method and image format
US6470050B1 (en) * 1999-04-09 2002-10-22 Matsushita Electric Industrial Co., Ltd. Image coding apparatus and its motion vector detection method
JP2002027466A (ja) 2000-07-13 2002-01-25 Matsushita Electric Ind Co Ltd 符号化領域補正装置及び符号化装置
JP2003169284A (ja) 2001-12-04 2003-06-13 Fuji Photo Film Co Ltd 画像変換装置並びに画像変換プログラム
US20040247032A1 (en) * 2002-07-29 2004-12-09 Yuichiro Aihara Motion vector detection device and motion vector detection method

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01231583A (ja) * 1988-03-11 1989-09-14 Fujitsu Ltd 可変ビットレート画像符号化装置
JPH07222145A (ja) * 1994-01-31 1995-08-18 Mitsubishi Electric Corp 画像符号化装置
JPH0937243A (ja) * 1995-07-20 1997-02-07 Sanyo Electric Co Ltd 動画像符号化装置及び復号装置
JP2004023670A (ja) * 2002-06-19 2004-01-22 Nec Corp 画像符号化装置および同方式

Also Published As

Publication number Publication date
JP4735063B2 (ja) 2011-07-27
US20060280250A1 (en) 2006-12-14
US8149913B2 (en) 2012-04-03

Similar Documents

Publication Publication Date Title
JP4735063B2 (ja) 動画像変換装置、動画像変換方法、及びコンピュータ・プログラム
US6118488A (en) Method and apparatus for adaptive edge-based scan line interpolation using 1-D pixel array motion detection
US9210341B2 (en) Image processing device, imaging device, information storage medium, and image processing method
US20070047651A1 (en) Video prediction apparatus and method for multi-format codec and video encoding/decoding apparatus and method using the video prediction apparatus and method
JP2003501902A (ja) ビデオ信号の符号化
JP2009532984A (ja) 補償アーチファクトに対する保護を有する動き補償フレームレート変換
JP2000041223A (ja) 情報信号処理装置、画像情報変換装置および画像表示装置
JP5133038B2 (ja) 画像復元方法および画像復元装置
WO2012147523A1 (ja) 撮像装置及び画像生成方法
JP2006345445A (ja) 動画像変換装置、および動画像変換方法、並びにコンピュータ・プログラム
JP4193233B2 (ja) 動き判定装置、その方法および画像情報変換装置
JP4168490B2 (ja) 動き判定装置、その方法および画像情報変換装置
JP3946781B2 (ja) 画像情報変換装置及び方法
JP4412062B2 (ja) 動画像変換装置、および動画像変換方法、並びにコンピュータ・プログラム
JP4140091B2 (ja) 画像情報変換装置および画像情報変換方法
JP2001339695A (ja) 画像信号処理装置及び画像信号処理方法
JP3759538B2 (ja) 画像信号処理方法及び画像信号伝送装置
JPH0363275B2 (ja)
JP4470324B2 (ja) 画像信号変換装置および方法
JP4590975B2 (ja) 動画像変換装置、動画像復元装置、および方法、並びにコンピュータ・プログラム
JP4779424B2 (ja) 動画像変換装置、および動画像変換方法、並びにコンピュータ・プログラム
JP4123587B2 (ja) 画像情報処理装置および方法
JP4174891B2 (ja) 画像情報変換装置および方法
JP3800638B2 (ja) 画像情報変換装置および方法
JP4001143B2 (ja) 係数生成装置および方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080509

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20100309

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100622

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100813

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110329

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110411

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140513

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees