JPH11203483A - 画像処理装置および方法、並びに提供媒体 - Google Patents

画像処理装置および方法、並びに提供媒体

Info

Publication number
JPH11203483A
JPH11203483A JP1345698A JP1345698A JPH11203483A JP H11203483 A JPH11203483 A JP H11203483A JP 1345698 A JP1345698 A JP 1345698A JP 1345698 A JP1345698 A JP 1345698A JP H11203483 A JPH11203483 A JP H11203483A
Authority
JP
Japan
Prior art keywords
distribution image
image
motion distribution
motion
pixel
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP1345698A
Other languages
English (en)
Other versions
JP4016227B2 (ja
Inventor
Tetsujiro Kondo
哲二郎 近藤
Hideo Nakaya
秀雄 中屋
Kenji Tanaka
健司 田中
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP1345698A priority Critical patent/JP4016227B2/ja
Priority to US09/221,255 priority patent/US6285712B1/en
Priority to AU98241/98A priority patent/AU748671B2/en
Priority to CA002257669A priority patent/CA2257669C/en
Priority to KR1019990000136A priority patent/KR100590145B1/ko
Priority to EP19990100184 priority patent/EP0929192B1/en
Priority to DE1999630333 priority patent/DE69930333T2/de
Priority to CNB991010477A priority patent/CN1154361C/zh
Publication of JPH11203483A publication Critical patent/JPH11203483A/ja
Application granted granted Critical
Publication of JP4016227B2 publication Critical patent/JP4016227B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/14Picture signal circuitry for video frequency region
    • H04N5/144Movement detection
    • H04N5/145Movement estimation

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Television Systems (AREA)
  • Image Analysis (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

(57)【要約】 【課題】 画像の動き推定における空間解像度を向上さ
せるとともに、ロバスト性を確保する。 【解決手段】 推定部4は、連続する2枚のフレームか
ら画素毎の動きベクトルとその信頼性を演算し、各画素
に任意の動きベクトルと信頼性を対応させて、第kフレ
ームに対応する第1次動き分布画像を生成する。更新部
5は、入力された第k+1フレームに対応する第1次動
き分布画像と、第kフレームに対応する第4次動き分布
画像を合成して、第k+1フレームに対応する第2次動
き分布画像を生成する。予測部6は、入力された第k+
1フレームに対応する第2次動き分布画像に基づいて、
第k+1フレームに対応する第3次動き分布画像を生成
する。補間部7は、入力された第k+1フレームに対応
する第3次動き分布画像の空隙部分を補間推定量により
補間して、第k+1フレームに対応する第4次動き分布
画像を生成する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、画像処理装置およ
び方法、並びに提供媒体に関し、特に、時間的に連続す
る画像から画素単位に動きを推定できるようにする画像
処理装置および方法、並びに提供媒体に関する。
【0002】
【従来の技術】動画像から画像の動きを表すパラメータ
の値を推定(以下、動き推定と記述する)する方法とし
ては、予測残差最小規範を用いた方法が存在する。
【0003】
【発明が解決しようとする課題】予測残差最小規範を用
いた動き推定の方法は、画像を複数の画素から構成され
るブロックに分けて、ブロック毎に動き推定を行うた
め、動き推定の空間解像度が低く、平行移動する剛体に
対する動き推定しか行うことがでない。その結果、この
方法は、動きの分布が不均一である非剛体に対する動き
推定を行うことができない課題があった。
【0004】また、予測残差最小規範を用いた動き推定
の方法は、真の動きがサーチ範囲から外れた場合、動き
推定の値に大きな誤差を生じるので、ロバスト性が悪い
課題があった。
【0005】本発明はこのような状況に鑑みてなされた
ものであり、不偏推定量による非決定論的な方法を用い
ることにより、動き推定の空間解像度を向上させるとと
もに、ロバスト性を確保できるようにするものである。
【0006】
【課題を解決するための手段】請求項1に記載の画像処
理装置は、連続する2枚の静止画像から画素単位のパラ
メータを演算する演算手段と、演算手段が演算したパラ
メータの中から不偏推定量により、各画素に対応するパ
ラメータを推定し、第1次動き分布画像を生成する推定
手段と、推定手段が生成した第k+1番目の静止画像に
対応する第1次動き分布画像と第k番目の静止画像に対
応する第4次動き分布画像から第2次動き分布画像を更
新する更新手段と、更新手段が生成した第2次動き分布
画像から第k+2番目の静止画像に対応する第1次動き
分布画像を予測し、第k+2番目の静止画像に対応する
第3次動き分布画像を生成する予測手段と、予測手段が
生成した第3次動き分布画像を不偏推定量により補間
し、更新手段が用いる第4次動き分布画像を生成する補
間手段とを備えることを特徴とする。
【0007】請求項4に記載の画像処理方法は、連続す
る2枚の静止画像から画素単位のパラメータを演算する
演算ステップと、演算ステップで演算したパラメータの
中から不偏推定量により、各画素に対応するパラメータ
を推定し、第1次動き分布画像を生成する推定ステップ
と、推定ステップで生成した第k+1番目の静止画像に
対応する第1次動き分布画像と第k番目の静止画像に対
応する第4次動き分布画像から第2次動き分布画像を更
新する更新ステップと、更新ステップで生成した第2次
動き分布画像から第k+2番目の静止画像に対応する第
1次動き分布画像を予測し、第k+2番目の静止画像に
対応する第3次動き分布画像を生成する予測ステップ
と、予測ステップで生成した第3次動き分布画像を不偏
推定量により補間し、更新ステップで用いる第4次動き
分布画像を生成する補間ステップとを備えることを特徴
とする。
【0008】請求項5に記載の提供媒体は、連続する2
枚の静止画像から画素単位のパラメータを演算する演算
ステップと、演算ステップで演算したパラメータの中か
ら不偏推定量により、各画素に対応するパラメータを推
定し、第1次動き分布画像を生成する推定ステップと、
推定ステップで生成した第k+1番目の静止画像に対応
する第1次動き分布画像と第k番目の静止画像に対応す
る第4次動き分布画像から第2次動き分布画像を更新す
る更新ステップと、更新ステップで生成した第2次動き
分布画像から第k+2番目の静止画像に対応する第1次
動き分布画像を予測し、第k+2番目の静止画像に対応
する第3次動き分布画像を生成する予測ステップと、予
測ステップで生成した第3次動き分布画像を不偏推定量
により補間し、更新ステップで用いる第4次動き分布画
像を生成する補間ステップとを備えるコンピュータプロ
グラムを提供することを特徴とする。
【0009】請求項1に記載の画像処理装置において
は、演算手段が、連続する2枚の静止画像から画素単位
のパラメータを演算し、推定手段が、演算手段が演算し
たパラメータの中から不偏推定量により、各画素に対応
するパラメータを推定して、第1次動き分布画像を生成
し、更新手段が、推定手段が生成した第k+1番目の静
止画像に対応する第1次動き分布画像と第k番目の静止
画像に対応する第4次動き分布画像から第2次動き分布
画像を更新し、予測手段が、更新手段が生成した第2次
動き分布画像から第k+2番目の静止画像に対応する第
1次動き分布画像を予測して、第k+2番目の静止画像
に対応する第3次動き分布画像を生成し、補間手段が、
予測手段が生成した第3次動き分布画像を不偏推定量に
より補間して、更新手段が用いる第4次動き分布画像を
生成する。
【0010】請求項4に記載の画像処理方法、および請
求項5に記載の提供媒体においては、演算ステップで、
連続する2枚の静止画像から画素単位のパラメータを演
算し、推定ステップで、演算ステップで演算したパラメ
ータの中から不偏推定量により、各画素に対応するパラ
メータを推定して、第1次動き分布画像を生成し、更新
ステップで、推定ステップで生成した第k+1番目の静
止画像に対応する第1次動き分布画像と第k番目の静止
画像に対応する第4次動き分布画像から第2次動き分布
画像を更新し、予測ステップで、更新ステップで生成し
た第2次動き分布画像から第k+2番目の静止画像に対
応する第1次動き分布画像を予測して、第k+2番目の
静止画像に対応する第3次動き分布画像を生成し、補間
ステップで、予測ステップで生成した第3次動き分布画
像を不偏推定量により補間して、更新ステップで用いる
第4次動き分布画像を生成する。
【0011】
【発明の実施の形態】以下に本発明の実施の形態を説明
するが、特許請求の範囲に記載の発明の各手段と以下の
実施の形態との対応関係を明らかにするために、各手段
の後の括弧内に、対応する実施の形態(但し一例)を付
加して本発明の特徴を記述すると、次のようになる。
【0012】すなわち、請求項1に記載の画像処理装置
は、連続する2枚の静止画像から画素単位のパラメータ
を演算する演算手段(例えば、図1の推定部4)メータ
の中から不偏推定量により、各画素に対応するパラメー
タを推定し、第1次動き分布画像を生成する推定手段
(例えば、図1の推定部4)と、推定手段が生成した第
k+1番目の静止画像に対応する第1次動き分布画像と
第k番目の静止画像に対応する第4次動き分布画像から
第2次動き分布画像を更新する更新手段(例えば、図1
の更新部5)と、更新手段が生成した第2次動き分布画
像から第k+2番目の静止画像に対応する第1次動き分
布画像を予測し、第k+2番目の静止画像に対応する第
3次動き分布画像を生成する予測手段(例えば、図1の
予測部6)と、予測手段が生成した第3次動き分布画像
を不偏推定量により補間し、更新手段が用いる第4次動
き分布画像を生成する補間手段(例えば、図1の補間部
7)とを備えることを特徴とする。
【0013】但し勿論この記載は、各手段を記載したも
のに限定することを意味するものではない。
【0014】本発明を適用した画像処理装置の構成につ
いて、図1を参照して説明する。この画像処理装置の制
御部1は、装置全体を制御するようになされている。ハ
ードディスク2は、予め入力された動画像を記憶してお
り、制御部1の制御により、動画像を再生部3に出力す
るようになされている。なお、一連の動画像(1シー
ン)は、それぞれにシリアルなフレーム番号が付された
複数の静止画像(フレーム)により構成されている。
【0015】再生部3は、ハードディスク2から入力さ
れた動画像をフレーム毎に(静止画像として)再生し、
推定部4に出力するようになされている。
【0016】推定部4は、再生部3から入力された時系
列順序が連続する第kフレームと第k+1フレームか
ら、画素毎の動きベクトルとその信頼性を演算し、各画
素に任意の動きベクトルと信頼性を対応させて(不偏推
定して)、第kフレームに対応する第1次動き分布画像
を生成し、更新部5(第0フレームに対応する第1次動
き分布画像は、予測部6)に出力するようになされてい
る。
【0017】更新部5は、推定部4から入力された第k
+1フレームに対応する第1次動き分布画像と、補間部
7(後述)から入力された第kフレームに対応する第4
次動き分布画像を合成して、第k+1フレームに対応す
る第2次動き分布画像を生成し、予測部6に出力するよ
うになされている。
【0018】予測部6は、更新部5から入力された第k
+1フレームに対応する第2次動き分布画像(または、
推定部4から入力された第0フレームに対応する第1次
動き分布画像)に基づいて、第k+1フレームに対応す
る第3次動き分布画像を生成し、補間部7に出力するよ
うになされている。このとき、第3次動き分布画像の画
素の動きベクトルは、第2次動き分布画像(または、第
0フレームに対応する第1次動き分布画像)の画素の動
きベクトルが変化しないものと仮定して予測される。
【0019】補間部7は、入力された第k+1フレーム
に対応する第3次動き分布画像の空隙部分を不偏推定量
により補間して、第k+1フレームに対応する第4次動
き分布画像を生成し、更新部5に出力するようになされ
ている。
【0020】メモリ8は、各部の作業領域として情報を
一時的に記憶し、各部に出力するようになされている。
【0021】次に、この画像処理装置の動作について、
図2のフローチャートと図3を参照して説明する。ステ
ップS1において、制御部1は、ハードディスク2に記
憶されている1シーンを構成するフレームの総数Nを確
認するとともに、フレームの順序を表すパラメータであ
るfrを初期化する(fr=0とする)。
【0022】ステップS2において、frがNである
(最終フレームであるか)か否かが判定され、frがN
ではないと判定された場合、ステップS3に進む。
【0023】ステップS3において、推定処理が実行さ
れる。推定処理の詳細について図4のフローチャートを
参照して説明する。
【0024】ステップS11において、推定される画素
の座標(i,j)が(0,0)に初期化される。ステップS12に
おいて、(i,j)が最大値(imax,jmax)以下(フレーム内
の座標)であるか否かが判定され、(i,j)が最大値(i
max,jmax)以下(フレーム内の座標)であると判定され
た場合、ステップS13に進む。
【0025】ステップS13において、変数counterと
変数sumが0に初期化される。ステップS14におい
て、参照される画素の座標(ix,iy)が(ix-range,iy-ran
ge)に初期化される。なお、参照される画素の範囲は、
座標(i,j)を中心とした一辺が所定の長さ2×rangeの正
方形である。したがって、(ix-range,iy-range)は、参
照範囲の左上の画素を意味する。
【0026】ステップS15において、1/(推定され
る画素(i,j)の画素値と参照される画素(ix,iy)の画素値
の差分の2乗和+0.01)の値が演算され、変数sumに加
算される。なお、0.01は信頼度が無限大に発散すること
を防ぐための補正値である。
【0027】ステップS16において、参照画素の座標
(ix,iy)と推定される画素の座標(i,j)の差(ix-i,iy-j)
(動きベクトル)が演算され、その演算値(動きベクト
ル)が、参照範囲内における画素に対するシリアルな番
号counterに対応して、配列iv_hist[counter]に配置さ
れる。同様に、その変数sumが、配列sum_hist[counter]
に配置される。このsumと、sum_hist[counter]は、後述
するステップS21において、信頼度pを演算するため
のものである。
【0028】ステップS17において、参照画素の座標
(ix,iy)が最大値(ix+range,iy+range)よりも小さい
(参照範囲の中に、まだ参照していない画素がある)か
否かが判定され、小さくない(参照範囲の全ての画素を
参照した)と判定された場合、ステップS18に進む。
まだ参照していない画素が残っている場合、ステップS
23に進み、counterをインクリメントした後、ステッ
プS24に進み、座標(ix,iy)をインクリメントし、他
の画素を処理対象として、ステップS15以降の処理が
実行される。
【0029】ステップS18において、変数sum_thres
がsum×乱数(0乃至1の間の数)で定義される。すな
わち、乱数を用いて所定の閾値が定義される。ステップ
S19において、変数counterが0に初期化される。
【0030】ステップS20において、配列sum_hist[c
ounter]の値がステップS18でランダムに定義したsum
_thres(閾値)よりも小さい(参照元の画素として妥当
ではない)か否かが判定される。配列sum_hist[counte
r]の値がsum_thresより小さい場合(参照元の画素とし
て妥当ではない場合)、ステップS25に進み、counte
rをインクリメントし、ステップS20に戻る。ステッ
プS15で説明したように、sumには過去の処理の値が
順次累積されていくので、counterの値が大きくなる
と、sum_hist[counter]の値も大きくなり、その結果、s
um_hist[counter]の値がsum_thresの値より大きくなる
可能性が増加する。
【0031】sum_hist[counter]がsum_thresよりも小さ
くない(参照元の画素として妥当である)と判定された
場合、ステップS21に進む。ステップS21におい
て、推定される画素(座標(i,j)の画素)の動きベクト
ルとして、配列iv_hist[counter]に配置された動きベク
トルがコピーされ、その信頼度pとして、((sum_hist[c
ounter]-sum_hist[counter-1])/sum)の値が演算され、
設定される。
【0032】ステップS22において、座標(i,j)をイ
ンクリメントし、他の座標を処理対象として、ステップ
S12に戻る。
【0033】ステップS12において、(i,j)が最大値
(imax,jmax)以下(フレーム内の座標)ではないと判
定された場合、推定処理を終了し、図2のステップS3
にリターンする。
【0034】以上のようにして、例えば図3に示す、f
rが0の第1次動き分布画像が不偏推定量を用いて生成
されたことになる。
【0035】図2の説明に戻る。
【0036】以上のように、推定処理が行われた後、ス
テップS4において、フレームパラメータfrが0であ
るか(開始フレームであるか)否かが判定され、frが
0ではないと判定された場合、ステップS5に進む。ス
テップS5において、更新部5は更新処理を実行する。
最初はfrが0であるから、ステップS5の更新処理は
スキップされ、ステップS6に進む。
【0037】ステップS6において、図5に示すような
予測処理が実行される。すなわち、入力された第2次動
き分布画像(または、frが0の場合、第1次動き分布
画像)の画素の等速性を仮定して、動きベクトルが予測
される。また、図6に示すように、動きベクトルの候補
が複数ある場合は、その信頼度pが最大である動きベク
トルを採用する。予測処理の詳細について、図7のフロ
ーチャートを参照して説明する。
【0038】ステップS31において、入力データ配列
scr[i,j]に、入力された第2次動き分布画像(または、
frが0の場合、第1次動き分布画像)の動きベクトル
(x,y)と信頼度pが配置される。
【0039】ステップS32において、出力配列dst[i,
j]が初期化される(動きベクトルと信頼度pが全て0と
される)。ステップS33において、予測される画素の
座標(i,j)が(0,0)に初期化される。
【0040】ステップS34において、予測される画素
の座標(i,j)が最大値(imax,jmax)以下(フレーム内の
座標)であるか否かが判定され、座標(i,j)が最大値(i
max,jm ax)以下(フレーム内の座標)であると判定され
た場合、ステップS35に進む。
【0041】ステップS35において、変数(fx,fy)に
入力データ配列scr[i,j]の動きベクトル(x,y)が設定さ
れる(fxに、動きベクトルのx成分が設定され、fyに、
動きベクトルのy成分が設定される)。すなわち、上述
した図5に示す処理が実行される。
【0042】ステップS36において、dst[i+fx,j+fy]
の信頼度pがscr[i,j]の信頼度pよりも小さいか否かが
判定され、dst[i+fx,j+fy]の信頼度pがscr[i,j]の信頼
度pよりも小さいと判定された場合、ステップS37に
進む。ステップS37において、dst[i+fx,j+fy]の動き
ベクトル(第3次動き分布画像の動きベクトル)とし
て、scr[i,j]の動きベクトルが設定される。すなわち、
上述した図6に示す処理が実行される。dst[i+fx,j+fy]
の信頼度pがscr[i,j]の信頼度pよりも小さくないと判
定された場合、または、ステップS37の処理が終了し
た場合、ステップS38において、座標(i,j)をインク
リメントし、他の画素を処理対象として、ステップS3
4に戻る。
【0043】ステップS34において、予測される画素
の座標(i,j)が最大値(imax,jmax)以下(フレーム内の
座標)ではないと判定された場合、予測処理を終了し、
図2にステップS6にリターンする。以上により、図3
における予測処理により、第3次動き分布画像が得られ
たことになる。
【0044】図2の説明に戻る。
【0045】以上のように、予測処理が実行された後、
ステップS7において、補間部7は、補間処理を実行す
る。補間処理の詳細について、図8のフローチャートを
参照して説明する。
【0046】ステップS41において、補間の対象(補
間候補)とされる画素の座標(i,j)が(0,0)に初期化され
る。ステップS42において、(i,j)が最大値(imax,j
max)以下(フレーム内の座標)であるか否かが判定さ
れ、(i,j)が最大値(imax,jm ax)以下(フレーム内の座
標)である判定された場合、ステップS43に進む。
【0047】ステップS43において、補間部7は、座
標(i,j)の画素の信頼度p(i,j)が所定の基準値よりも小
さいか否かを判定し、所定の基準値よりも小さいと判定
した場合(情報欠落画素である場合)、ステップS44
に進む。信頼度p(i,j)が所定の値以上である場合、そ
の画素は情報が欠落した画素ではないので補間処理する
必要がない。そこでステップS55に進み、座標(i,j)
をインクリメントし、他の画素を処理対象とし、ステッ
プS42に戻り、同様の処理が実行される。
【0048】ステップS44において、変数counterと
変数sumが0に初期化される。ステップS45におい
て、参照される画素の座標(ix,iy)が(ix-range,iy-ran
ge)に初期化される。なお、参照される画素の範囲は、
座標(i,j)を中心とした一辺が所定の長さ2×rangeの正
方形である。したがって、上述したように、(ix-rang
e,iy-range)は、参照範囲の左上の画素を意味する。
【0049】ステップS46において、補間部7は、座
標(ix,iy)の画素の信頼度p(ix,iy)が0よりも大きいか
否かを判定し、0よりも大きいと判定した場合(情報欠
落画素に対して情報(画素値)をコピーする元の画素と
して妥当である場合)、ステップS47に進む。信頼度
pが0である場合、コピー元の画素として妥当ではない
ものとして、ステップS56に進み、座標(ix,iy)をイ
ンクリメントし、他の画素を処理対象とし、ステップS
46に戻る。
【0050】ステップS47において、L((ix,iy),(i,
j))の値が、変数sumに加算される。なお、L((ix,iy),
(i,j))は、座標(ix,iy)の画素が補間される画素(i,j)
のコピー元として妥当であるか否かを示す関数であり、
次式で表される。 L((ix,iy),(i,j))=p(ix,iy)×EXP(-D1((ix,iy),(i,j))/
a-D2((ix,iy),(i,j))/b) 但し、p(ix,iy)は参照される画素の信頼度であり、D1
((ix,iy),(i,j))は(ix,iy)と(i,j)の座標間の距離であ
り、D2((ix,iy),(i,j))は(ix,iy)と(i,j)の画素の画素
値の差である。
【0051】ステップS48において、画素値をコピー
可能な画素として、参照画素の座標(ix,iy)と補間され
る画素の座標(i,j)の差(ix-i,iy-j)(動きベクトル)が
演算され、その演算値(動きベクトル)が、参照範囲内
における画素に対するシリアルな番号counterに対応し
て、配列iv_hist[counter]に配置される。同様に、その
変数sumが、配列sum_hist[counter]に配置される。
【0052】ステップS49において、参照画素の座標
(ix,iy)が最大値(ix+range,iy+range)よりも小さい
(参照範囲の中に、まだ参照していない画素がある)か
否かが判定され、小さくない(参照範囲の全ての画素を
参照した)と判定された場合、ステップS50に進む。
まだ参照していない画素が残っている場合、ステップS
57に進み、counterをインクリメントした後、ステッ
プS56に戻り、座標(ix,iy)をインクリメントして、
他の画素を処理対象として、ステップS46以降の処理
が実行される。
【0053】ステップS50において、sumとcounterが
0よりも大きいか否かが判定され、sumとcounterの両方
が0よりも大きい(参照範囲内にコピー元として妥当な
画素がある)と判定された場合、ステップS51に進
む。sumとcounterの少なくとも一方が0である場合、参
照範囲内にコピー元として妥当な画素が存在しないの
で、ステップS58に進み、座標(ix,iy)の信頼度pに
0を設定した後、ステップS55に戻り、座標(ix,iy)
をインクリメントし、他の画素を処理対象として、ステ
ップS42以降の処理を実行する。
【0054】ステップS51において、変数sum_thres
がsum×乱数(0乃至1の間の数)で定義される。すな
わち、乱数を用いて、所定の閾値が定義される。ステッ
プS52において、変数counterが0に初期化される。
【0055】ステップS53において、配列sum_hist[c
ounter]の値がステップS51でランダムに定義したsum
_thres(閾値)よりも小さい(コピー元の画素として妥
当ではない)か否かが判定される。配列sum_hist[count
er]の値がsum_thresより小さい場合(コピー元の画素と
して妥当ではない場合)、ステップS59に進み、coun
terをインクリメントし、ステップS53に戻る。ステ
ップS47で説明したように、sumには過去の処理の値
が順次累積されていくので、counterの値が大きくなる
と、sum_hist[counter]の値も大きくなり、その結果、s
um_hist[counter]の値がsum_thresの値より大きくなる
可能性が増加する。
【0056】sum_hist[counter]がsum_thresよりも小さ
くない(コピー元の画素として妥当である)と判定され
た場合、ステップS54に進む。ステップS54におい
て、補間される画素の信頼度p(i,j)と動きベクトルV
1(i,j)として、配列iv_hist[counter]に配置されてい
る信頼度と動きベクトルがコピーされる。その後、ステ
ップS55で座標(i,j)がインクリメントされた後、ス
テップS42に戻り、それ以降の処理が実行される。
【0057】ステップS42において、(i,j)が最大値
(imax,jmax)以下(フレーム内の座標)ではないと判
定された場合(そのフレームの全ての画素を処理した場
合)、補間処理を終了し、図2のステップS7にリター
ンする。
【0058】以上のようにして、図3に示すように、不
偏推定量を用いた補間処理により、第4次動き分布画像
が生成されたことになる。
【0059】図2の説明に戻る。
【0060】以上のように、補間処理が行われた後、ス
テップS8において、frが1だけインクリメントさ
れ、ステップS2に戻る。
【0061】ステップS2,S3において、上述した処
理が同様に実行される。ステップS4において、frが
0ではないのでステップS5に進み、更新部5が更新処
理を実行する。更新処理の詳細について、図9を参照し
て説明する。
【0062】ステップS71において、更新される画素
の座標(i,j)が(0,0)に初期化される。ステップS72に
おいて、(i,j)が最大値(imax,jmax)以下(フレーム内
の座標)であるか否かが判定され、(i,j)が最大値(i
max,jmax)以下(フレーム内の座標)であると判定され
た場合、ステップS73に進む。
【0063】ステップS73において、補間部7から入
力されたfrがk(最初はk=0)である静止画像に対
応する第4次動き分布画像のデータ配列pre[i,j]の信頼
度pを変数ppに設定する。同様に、推定部7から入力さ
れたfrがk+1である静止画像に対応する第1次動き
分布画像のデータ配列cur[i,j]の信頼度pを変数cpに設
定する。
【0064】ステップS74において、ppがcpよりも大
きいか否かが判定される。ppがcpよりも大きい(第4次
動き分布画像の信頼度pが第1次動き分布画像の信頼度
pよりも大きい)と判定された場合、ステップS75に
進む。ppがcpよりも大きくない(第1次動き分布画像の
信頼度pが第4次動き分布画像の信頼度pよりも大き
い)と判定された場合、動きベクトルを更新せずにステ
ップS76に進み、(i,j)をインクリメントし、他の画
素を処理対象としてステップS72に戻る。
【0065】ステップS75において、第1次動き分布
画像の動きベクトルと第4次動き分布画像の動きベクト
ルが、次式のようにppとcpに基づいて加重平均され、第
2次動き分布画像の動きベクトルが演算され、設定され
る。 2次動き分布画像の動きベクトル=(pre[i,j]の動きベ
クトル)×{pp/(pp+cp)}+(cur[i,j]の動きベクト
ル)×{cp/(pp+cp)}
【0066】ステップS72において、(i,j)が最大値
(imax,jmax)以下ではないと判定された場合、更新処
理を終了し、図2のステップS5にリターンする。
【0067】以上のようにして、図3に示すように、更
新処理により第2次動き分布画像が得られたことにな
る。
【0068】次に、上述した画像処理装置により得られ
た動き分布画像と、従来の方法により得られた動き分布
画像を比較する。図10(A)は、本発明を適用した画像
処理装置により得られた動き分布画像であり、図10
(B)は、従来の方法の一例である最尤推定に基づいて得
られた動き分布画像である。なお、両者とも同じ映像
(固定されたテーブルの上を、トラックの模型が左方向
に移動する映像)を処理したものであり、上から順に、
frが0である静止画像に対応する第1次動き分布画
像、frが0である静止画像に対応する第3次動き分布
画像、およびfrが4である静止画像に対応する第3次
動き分布画像を示している。なお、これらの画像の画素
の濃度は、水平方向(画面左方向)の動きベクトルの大
きさを表している。
【0069】両者を比較した場合、図10(B)の画像で
は、トラックの模型の輪郭がぼやけているとともに、ト
ラックの下の不動部分であるテーブルの画素が濃度を有
している(動きを示している)。これに対して、図10
(A)の画像では、frが増加するにつれて情報が蓄積さ
れ、トラックの模型の輪郭が鮮明になってきており、不
動部分(テーブル)の画素の濃度が減少している。した
がって、図10(A)の方が誤判定の少ない動き分布画像
であるといえる。
【0070】正確な動き分布画像が得られることによ
り、映像内の動体部分の画像の切り出し、追跡、および
動き推定が可能となる。
【0071】ところで、画像をズームアウトした場合に
おける画素の動きベクトル(画像の横方向の成分)を考
えると、図11(D)に示すように、その方向は、画像の
中心線を向き、その大きさは、中心線から離れるにつれ
て増加するはずである。ここで、fr=4に対応する第
2次動き分布画像である図11(C)を観察すると、画像
の画素の濃度が左から右に徐々に濃くなっている。すわ
わち、画像の左から右にかけて、左方向を正とした動き
ベクトルが負から正に連続的に変化しており、図11
(D)と同様であることがわかる。したがって、この画像
処理装置は、ズームに対する動き推定も可能であるとい
える。
【0072】なお、本発明は奥行きを表すパラメータの
推定にも適用することができる。
【0073】上記各処理を行うコンピュータプログラム
は、磁気ディスク、CD-ROM等の情報記録媒体よりなる提
供媒体のほか、インターネット、デジタル衛星などのネ
ットワーク提供媒体を介してユーザに提供することがで
きる。
【0074】
【発明の効果】以上のように、請求項1に記載の画像処
理装置、請求項4に記載の画像処理方法、および請求項
5に記載の提供媒体によれば、不偏推定により画素単位
の動き推定を行うようにしたので、動き推定の空間解像
度を向上させるとともに、ロバスト性を確保することが
可能となる。
【図面の簡単な説明】
【図1】本発明を適用した画像処理装置の構成を示すブ
ロック図である。
【図2】図1の画像処理装置の動作を説明するフローチ
ャートである。
【図3】図1の画像処理装置の動作を説明する図であ
る。
【図4】図2のステップS3の推定処理を説明するフロ
ーチャートである。
【図5】図2のステップS6の予測処理を説明する図で
ある。
【図6】図2のステップS6の予測処理を説明する図で
ある。
【図7】図2のステップS6の予測処理を説明するフロ
ーチャートである。
【図8】図2のステップS7の補間処理を説明するフロ
ーチャートである。
【図9】図2のステップS5の更新処理を説明するフロ
ーチャートである。
【図10】本発明と従来の一例の比較を説明するディス
プレー上に表示した中間調画像の写真である。
【図11】本発明を画像のズームアウトに対する適用を
説明するディスプレー上に表示した中間調画像の写真で
ある。
【符号の説明】 1 制御部, 2 ハードディスク, 3 再生部,
4 推定部, 5 更新部, 6 予測部, 7 補間
部, 8 メモリ

Claims (5)

    【特許請求の範囲】
  1. 【請求項1】 動画像を構成する静止画像の画素単位の
    動きを推定する画像処理装置において、 連続する2枚の前記静止画像から前記画素単位のパラメ
    ータを演算する演算手段と、 前記演算手段が演算したパラメータの中から不偏推定量
    により、各画素に対応するパラメータを推定し、第1次
    動き分布画像を生成する推定手段と、 前記推定手段が生成した前記第k+1番目の前記静止画
    像に対応する前記第1次動き分布画像と第k番目の前記
    静止画像に対応する第4次動き分布画像から第2次動き
    分布画像を更新する更新手段と、 前記更新手段が生成した前記第2次動き分布画像から第
    k+2番目の前記静止画像に対応する前記第1次動き分
    布画像を予測し、前記第k+2番目の前記静止画像に対
    応する第3次動き分布画像を生成する予測手段と、 前記予測手段が生成した前記第3次動き分布画像を前記
    不偏推定量により補間し、前記更新手段が用いる前記第
    4次動き分布画像を生成する補間手段とを備えることを
    特徴とする画像処理装置。
  2. 【請求項2】 前記パラメータは、動きベクトルと信頼
    度であることを特徴とする請求項1に記載の画像処理装
    置。
  3. 【請求項3】 前記更新手段は、前記信頼度に基づい
    て、2つの前記動きベクトルを加重平均して合成するこ
    とを特徴とする請求項2に記載の画像処理装置。
  4. 【請求項4】 動画像を構成する静止画像の画素単位の
    動きを推定する画像処理方法において、 連続する2枚の前記静止画像から前記画素単位のパラメ
    ータを演算する演算ステップと、 前記演算ステップで演算したパラメータの中から不偏推
    定量により、各画素に対応するパラメータを推定し、第
    1次動き分布画像を生成する推定ステップと、 前記推定ステップで生成した前記第k+1番目の前記静
    止画像に対応する前記第1次動き分布画像と第k番目の
    前記静止画像に対応する第4次動き分布画像から第2次
    動き分布画像を更新する更新ステップと、前記更新ステ
    ップで生成した前記第2次動き分布画像から第k+2番
    目の前記 静止画像に対応する前記第1次動き分布画像を予測し、
    前記第k+2番目の前記静止画像に対応する第3次動き
    分布画像を生成する予測ステップと、 前記予測ステップで生成した前記第3次動き分布画像を
    前記不偏推定量により補間し、前記更新ステップで用い
    る前記第4次動き分布画像を生成する補間ステップとを
    備えることを特徴とする画像処理方法。
  5. 【請求項5】 動画像を構成する静止画像の画素単位の
    動きを推定する画像処理装置に使用するコンピュータプ
    ログラムを提供する提供媒体において、 連続する2枚の前記静止画像から前記画素単位のパラメ
    ータを演算する演算ステップと、 前記演算ステップで演算したパラメータの中から不偏推
    定量により、各画素に対応するパラメータを推定し、第
    1次動き分布画像を生成する推定ステップと、 前記推定ステップで生成した前記第k+1番目の前記静
    止画像に対応する前記第1次動き分布画像と第k番目の
    前記静止画像に対応する第4次動き分布画像から第2次
    動き分布画像を更新する更新ステップと、 前記更新ステップで生成した前記第2次動き分布画像か
    ら第k+2番目の前記静止画像に対応する前記第1次動
    き分布画像を予測し、前記第k+2番目の前記静止画像
    に対応する第3次動き分布画像を生成する予測ステップ
    と、 前記予測ステップで生成した前記第3次動き分布画像を
    前記不偏推定量により補間し、前記更新ステップで用い
    る前記第4次動き分布画像を生成する補間ステップとを
    備えるコンピュータプログラムを提供することを特徴と
    する提供媒体。
JP1345698A 1998-01-07 1998-01-07 画像処理装置および方法、並びに記録媒体 Expired - Fee Related JP4016227B2 (ja)

Priority Applications (8)

Application Number Priority Date Filing Date Title
JP1345698A JP4016227B2 (ja) 1998-01-07 1998-01-07 画像処理装置および方法、並びに記録媒体
US09/221,255 US6285712B1 (en) 1998-01-07 1998-12-28 Image processing apparatus, image processing method, and providing medium therefor
AU98241/98A AU748671B2 (en) 1998-01-07 1998-12-30 Image processing apparatus, image processing method, and providing medium therefor
CA002257669A CA2257669C (en) 1998-01-07 1998-12-31 Image processing apparatus, image processing method, and providing medium therefor
KR1019990000136A KR100590145B1 (ko) 1998-01-07 1999-01-06 화상 처리 장치, 화상 처리 방법, 및 이를 제공하는 매체
EP19990100184 EP0929192B1 (en) 1998-01-07 1999-01-07 Image processing method and apparatus and recording medium therefor
DE1999630333 DE69930333T2 (de) 1998-01-07 1999-01-07 Verfahren und Vorrichtung zum Verarbeiten von Bildern und Aufnahmemedium dafür
CNB991010477A CN1154361C (zh) 1998-01-07 1999-01-07 图像处理设备、图像处理方法及为其提供的媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1345698A JP4016227B2 (ja) 1998-01-07 1998-01-07 画像処理装置および方法、並びに記録媒体

Publications (2)

Publication Number Publication Date
JPH11203483A true JPH11203483A (ja) 1999-07-30
JP4016227B2 JP4016227B2 (ja) 2007-12-05

Family

ID=11833660

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1345698A Expired - Fee Related JP4016227B2 (ja) 1998-01-07 1998-01-07 画像処理装置および方法、並びに記録媒体

Country Status (8)

Country Link
US (1) US6285712B1 (ja)
EP (1) EP0929192B1 (ja)
JP (1) JP4016227B2 (ja)
KR (1) KR100590145B1 (ja)
CN (1) CN1154361C (ja)
AU (1) AU748671B2 (ja)
CA (1) CA2257669C (ja)
DE (1) DE69930333T2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007117711A3 (en) * 2006-04-07 2007-12-06 Microsoft Corp Dynamic selection of motion estimation search ranges and extended motion vector ranges
US8155195B2 (en) 2006-04-07 2012-04-10 Microsoft Corporation Switching distortion metrics during motion estimation
JP2015018353A (ja) * 2013-07-10 2015-01-29 日本電信電話株式会社 映像生成装置、方法及びプログラム

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002056589A1 (en) 2001-01-16 2002-07-18 Koninklijke Philips Electronics N.V. Reducing halo-like effects in motion-compensated interpolation
US7408989B2 (en) * 2003-01-16 2008-08-05 Vix5 Systems Inc Method of video encoding using windows and system thereof
US20060233258A1 (en) * 2005-04-15 2006-10-19 Microsoft Corporation Scalable motion estimation
US8229166B2 (en) * 2009-07-07 2012-07-24 Trimble Navigation, Ltd Image-based tracking
US20070268964A1 (en) * 2006-05-22 2007-11-22 Microsoft Corporation Unit co-location-based motion estimation
GB2479933B (en) 2010-04-30 2016-05-25 Snell Ltd Motion estimation
KR102357965B1 (ko) 2015-01-12 2022-02-03 삼성전자주식회사 객체 인식 방법 및 장치

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2648254B2 (fr) 1988-09-23 1991-08-30 Thomson Csf Procede et dispositif d'estimation de mouvement dans une sequence d'images animees
US5276513A (en) 1992-06-10 1994-01-04 Rca Thomson Licensing Corporation Implementation architecture for performing hierarchical motion analysis of video images in real time
FR2699780B1 (fr) 1992-12-22 1995-03-17 Philips Electronique Lab Dispositif de traitement récursif de signal vidéo comprenant une pluralité de branches.
KR100292138B1 (ko) * 1993-07-12 2002-06-20 이데이 노부유끼 디지탈비디오신호용송신기및수신기
JP3321936B2 (ja) * 1993-11-05 2002-09-09 株式会社豊田中央研究所 移動物体検出装置
KR0128875B1 (ko) * 1994-02-24 1998-04-10 배순훈 큰 움직임을 갖는 영상의 움직임 벡터 추정 방법
IL114475A0 (en) * 1995-07-06 1995-11-27 Grid Point Ltd Method for 2D and 3D image capturing representation processing and compression
JPH0955941A (ja) * 1995-08-16 1997-02-25 Sony Corp 画像符号化方法、画像符号化装置、及び画像符号化データの記録装置
JP3994445B2 (ja) * 1995-12-05 2007-10-17 ソニー株式会社 動きベクトル検出装置及び動きベクトル検出方法
US6078616A (en) * 1997-03-13 2000-06-20 Sony Corporation Methods and apparatus for error concealment utilizing temporal domain motion vector estimation

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007117711A3 (en) * 2006-04-07 2007-12-06 Microsoft Corp Dynamic selection of motion estimation search ranges and extended motion vector ranges
US8155195B2 (en) 2006-04-07 2012-04-10 Microsoft Corporation Switching distortion metrics during motion estimation
US8494052B2 (en) 2006-04-07 2013-07-23 Microsoft Corporation Dynamic selection of motion estimation search ranges and extended motion vector ranges
JP2015018353A (ja) * 2013-07-10 2015-01-29 日本電信電話株式会社 映像生成装置、方法及びプログラム

Also Published As

Publication number Publication date
KR19990067759A (ko) 1999-08-25
CA2257669A1 (en) 1999-07-07
US6285712B1 (en) 2001-09-04
EP0929192A2 (en) 1999-07-14
AU748671B2 (en) 2002-06-06
CA2257669C (en) 2009-09-22
KR100590145B1 (ko) 2006-06-15
AU9824198A (en) 1999-07-29
DE69930333T2 (de) 2006-10-05
EP0929192A3 (en) 1999-08-04
EP0929192B1 (en) 2006-03-15
CN1154361C (zh) 2004-06-16
JP4016227B2 (ja) 2007-12-05
DE69930333D1 (de) 2006-05-11
CN1230079A (zh) 1999-09-29

Similar Documents

Publication Publication Date Title
JP4080951B2 (ja) フレーム補間方法及び装置並びに画像表示システム
KR100492127B1 (ko) 적응형 움직임 추정장치 및 추정 방법
JP3226539B2 (ja) ビデオ画像処理
JP3847827B2 (ja) 動きベクトル検出方法
US9414060B2 (en) Method and system for hierarchical motion estimation with multi-layer sub-pixel accuracy and motion vector smoothing
US20090167959A1 (en) Image processing device and method, program, and recording medium
JP2012525042A (ja) 動き推定システムにおいてモーメント及び加速度ベクトルを使用するオブジェクト追跡
JP2004297719A (ja) フレーム補間方法及びこれを用いた画像表示システム
KR0182058B1 (ko) 움직임 추정을 위한 다중 해상도 순환 탐색 장치 및 그 방법
TWI408620B (zh) 用以決定插補畫面之移動向量的影像處理方法及其相關裝置
TW200535724A (en) Robust camera pan vector estimation using iterative center of mass
EP0624981B1 (en) Motion vector detecting circuit
KR20060083978A (ko) 움직임 벡터 필드 리-타이밍
JP4016227B2 (ja) 画像処理装置および方法、並びに記録媒体
JP2001520781A (ja) 動き又はデプス推定
KR20050097936A (ko) 효과적인 예측 이미지 파라미터 추정
JP5014987B2 (ja) ビデオモード検出による動き補償
JP2002223374A (ja) ノイズ除去装置およびノイズ除去方法
JP3175914B2 (ja) 画像符号化方法および画像符号化装置
JP3979768B2 (ja) デジタル映像分割方法及びその装置
JP3046689B2 (ja) 動きベクトル検出方法
JPH08242454A (ja) グローバル動きパラメタ検出方法
JP3025481B2 (ja) 遺伝子アルゴリズムを適用したブロック整合方法
JP4250807B2 (ja) フィールド周波数変換装置および変換方法
JP3832924B2 (ja) 画像信号処理方法、画像信号処理装置及びコンピュータ読み取り可能な記録媒体

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20041227

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20070423

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070605

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070801

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20070822

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20070904

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100928

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100928

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110928

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110928

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120928

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120928

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130928

Year of fee payment: 6

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees