JP4991712B2 - デジタル画像処理装置および処理方法ならびにコンピュータプログラムプロダクト - Google Patents

デジタル画像処理装置および処理方法ならびにコンピュータプログラムプロダクト Download PDF

Info

Publication number
JP4991712B2
JP4991712B2 JP2008519953A JP2008519953A JP4991712B2 JP 4991712 B2 JP4991712 B2 JP 4991712B2 JP 2008519953 A JP2008519953 A JP 2008519953A JP 2008519953 A JP2008519953 A JP 2008519953A JP 4991712 B2 JP4991712 B2 JP 4991712B2
Authority
JP
Japan
Prior art keywords
digital image
block
search area
motion
register
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2008519953A
Other languages
English (en)
Other versions
JP2009500931A (ja
Inventor
トゥルッキ、ジャルノ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Google LLC
Original Assignee
Google LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Google LLC filed Critical Google LLC
Publication of JP2009500931A publication Critical patent/JP2009500931A/ja
Application granted granted Critical
Publication of JP4991712B2 publication Critical patent/JP4991712B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/20Analysis of motion
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/20Analysis of motion
    • G06T7/223Analysis of motion using block-matching
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Studio Devices (AREA)
  • Image Analysis (AREA)

Description

本発明は、デジタル画像処理装置および方法ならびにデジタル画像処理のためのコンピュータプログラムプロダクトに関し、分配媒体、デジタル画像処理集積回路として実施される。本発明はまたデジタル画像間の運動を規定する方法に関する。
写真撮影ようのカメラは例えば手振れにより生じるカメラの不所望な動きはビデオサーチ分野では大きな広く研究されている問題である。この問題を解決するためにビデオ画像を安定にする種々の機械的および電子的方法が設計されている。それは安定なビデオ画像は揺れ、振動し、動き回るビデオ画像よりも快適に観察できるからである。またビデオコード化においては、安定なビデオ流はビット速度が低く、或いはディスクスペースが少くてもコード化の効率や速度に影響しない。
加速度センサのような機械的な手段によって大きな効果が得られたが、それらは許容できないような価格とスペースが必要であるため、移動電話機のような多くのビデオ撮影装置には不適当である。デジタルビデオ安定方式、特に上記の移動電話機で必要とされるような実時間ビデオ安定方式は実現するのに多くの年月が必要である。
デジタルビデオ安定方式は2つの問題を解決する必要がある。
1)2つの連続したビデオフレーム間の単一のグローバルな運動ベクトルをどのように規定するか?。この問題に対する明快な解決方法はまだ存在しない。運動している画像の各ブロックに対して最良の運動ベクトルを計算することは常に可能であるが、グローバルな運動ベクトルの計算が依然として残っている。全ての可能な状況に対して、全ての場合に局部的なものからのグローバルな運動ベクトルを完全に規定することのできるアルゴリズムは存在しないことは明らかである。どんな場合にも、これは運動評価により生じた多量の計算の大きな欠点を有する広く使用されている解決方法である。cifサイズの画像に対して、16×16ブロックおよび±16のサーチ区域を有する運動評価は(16×16×33×33×369)、すなわち約1億の演算を必要とする。
最良の解決法は画像をブロックに分割しないで全体の画像に対して1つのベクトルを評価し、例えば±16のサーチ区域における単一の画素に対する約1089の画素差に対して計算することである。この場合にもcifサイズの画像に対して、約8000万の演算が必要となる。
単一の画像から強い細部および特徴を検出し、それらに対してのみ運動評価を処理することにより運動評価フェーズ(phase) において使用されるブロックの量を減少させることによって運動評価のための膨大な計算量を減少させることが試みられている。しかしながら、これは特徴検出が計算を増加する一方でアルゴリズムの信頼性を減少させることは明らかである。
2)提供されたグローバルな運動ベクトルを有するビデオをどのように安定化するのか?。基本的にこの問題には3つの解決方法がある。それらは(1)グローバルな運動ベクトルと反対方向に次の画像フレームを動かすことにより運動を消去する。(2)例えば、カルマンフィルタまたはFIRフィルタにより運動を濾波し、その後で運動を消去する。 (3)例えば、米国特許第5317685号明細書に記載されているようにグローバルな運動ベクトルにより運動消去効果を得るために画像をズームする。最初の2つの方法は安定された画像が移動する大きな画像が必要である。第1の方法は、内側の画像が外側の画像のエッジを得るとき不連続が生じる。また第2の方法は、濾波のために計算量が多く必要になり、また内側の画像が外側の画像のエッジを越えるとき画像が詰め込まれる。さらに、第2の方法は、画像を破損することなくどのように詰め込みを行うかに問題がある。第3の方法は、単にズーム効果のために問題があるばかりでなく、計算量が増加する。第1の方法についてさらに詳細に後述する。
本発明は、改良されたデジタル画像処理装置と、改良されたデジタル画像処理方法と、デジタル画像処理のための改良されたコンピュータプログラムプロダクトを開発することを目的としており、分配媒体、改良されたデジタル画像処理集積回路およびデジタル画像間の運動を規定する方法を提供することを目的としている。
本発明の1特徴によれば、デジタル画像処理装置が提供され、そのデジタル画像処理装置は、第1のデジタル画像と第2のデジタル画像を得るための入力インターフェースと、その入力インターフェースに結合された処理装置とを有し、その処理装置は第1のデジタル画像中の少くとも1つのブロックを規定し、第2のデジタル画像中のサーチ区域を各ブロックに対して規定し、そのサーチ区域はそのブロックよりも大きく、ブロックとそのサーチ区域を等しいサイズにマップし、各ブロックと等しいサイズにマップされているサーチ区域との間の画素エラーを計算し、そのエラーを運動レジスタ中に集め、運動レジスタを使用することによって第1のデジタル画像と第2のデジタル画像との間の運動を規定するように構成されている。
本発明の1特徴によれば、デジタル画像処理装置が提供され、そのデジタル画像処理装置は、第1のデジタル画像と第2のデジタル画像を獲得する手段と、第1のデジタル画像中の少くとも1つのブロックを規定する手段と、第2のデジタル画像中のブロックよりも大きいサーチ区域を各ブロックに対して規定する手段と、 ブロックとそのサーチ区域を等しいサイズにマップする手段と、各ブロックと等しいサイズにマップされているそのサーチ区域との間の画素エラーを計算する手段と、そのエラーを運動レジスタ中に集める手段と、運動レジスタを使用することにより第1のデジタル画像と第2のデジタル画像との間の運動を規定する手段とを備えている。
本発明の別の特徴によれば、デジタル画像処理のためのコンピュータプログラムプロダクトが提供され、それは分配媒体で実行され、第1のデジタル画像と第2のデジタル画像を獲得する入力モジュールと、その入力モジュールに結合されて第1のデジタル画像中の少くとも1つのブロックを規定し、第2のデジタル画像中のブロックよりも大きいサーチ区域を各ブロックに対して規定するコンピュータモジュールとを具備し、コンピュータモジュールは、ブロックおよびそのサーチ区域を等しいサイズにマップし、各ブロックと等しいサイズにマップされているそのサーチ区域との間の画素エラーを計算し、そのエラーを運動レジスタ中に集め、運動レジスタを使用することにより第1のデジタル画像と第2のデジタル画像との間の運動を規定するように構成されている。
本発明の別の特徴によれば、デジタル画像処理集積回路が提供され、その集積回路は、第1のデジタル画像と第2のデジタル画像を獲得するための入力ブロックと、その入力ブロックに結合されて第1のデジタル画像中の少くとも1つのブロックを規定し、第2のデジタル画像中のブロックよりも大きいサーチ区域を各ブロックに対して規定する処理ブロックとを具備し、その処理ブロックは、各ブロックとそのサーチ区域を等しいサイズにマップし、各ブロックと等しいサイズにマップされているサーチ区域との間の画素エラーを計算し、そのエラーを運動レジスタ中に集め、運動レジスタを使用することにより第1のデジタル画像と第2のデジタル画像との間の運動を規定するように構成されている。
本発明の別の特徴によれば、デジタル画像間の運動を規定する方法が提供され、その方法は、第1のデジタル画像と第2のデジタル画像を獲得し、第1のデジタル画像中の少くとも1つのブロックを規定し、第2のデジタル画像中のブロックよりも大きいサーチ区域を各ブロックに対して規定し、各ブロックとそのサーチ区域を等しいサイズにマップし、各ブロックと等しいサイズにマップされているそのサーチ区域との間の画素エラーを計算し、そのエラーを運動レジスタ中に集め、運動レジスタを使用することにより第1のデジタル画像と第2のデジタル画像との間の運動を規定する。
本発明は幾つかの利点を提供する。すなわち、計算量および必要なメモリが少いグローバルな運動ベクトルに対する信頼性のある計算方法が提供される。本発明は大量の計算が必要な伝統的な遅い運動評価に依存しない。本発明はまたビデオ符号化システムと接続されたとき高速で低いメモリ容量のビデオ安定化方法を提供する。本発明はまたグローバルな運動ベクトル、局部的運動ベクトル、および運動の地勢マップにより予測可能の運動評価の方法を提供する。予測可能の運動評価方法は例えばビデオ符号化で使用される。その場合には、運動評価のサーチの要求は最も可能性の高い運動ベクトル予測することによって最小にすることができ、それによりサーチプロセスは限定された量のサーチで良好な基準ブロックを与えるようにスタートされる。本発明はまた、単一ブロックに対する運動ベクトルを効率よく発見するためにビデオ符号化システムの運動評価フェーズに対するグローバルな運動ベクトル或いは予測ベクトルのマップを提供することができる。
本発明を添付図面を参照にして、実施形態について以下詳細に説明する。
インスピレーションのもととなったのは発明者の仕事部屋の壁に貼られたフィンランドの地図であった。地図上にはただ1つの点があり、それはそれが表している同じ地点上にあるが、発明者は以下説明するような一般的な運動ベクトル計算方法を考え出した。
この方法は、他の方法とは異なり、従来技術の運動評価アルゴリズムとは全く異なり、グローバルな運動ベクトル計算のための全体的に新しい異なった方法を導入する。地図についての上述したような興味のある事実に基づいて、この発明の方法はビデオシーケンスの連続する画像から採取した1対の「地図」を使用して、例えば、互いにスケールが異なっているサーチ区域の「地図」およびブロックの「地図」が上述の地図の状態を形成している。1つの地図はもしも地図がそれが存在する地点を表している1つの、そしてただ1つの画素を有する場合には、2つの異なるスケールの地図の間の差を計算するとき、それ自身に対する画素の差に対してはその地点はゼロである。ビデオ画像は移動するだけではなく変化するから、理想的に簡単でない場合でも、その理論は多数の地図が共に結合されているときには適切で効率のよいものである。
図1は2つの連続したデジタル画像またはフレーム、すなわちビデオシーケンスの前のフレーム100 と現在のフレーム102 間のグローバルな運動ベクトルを規定するとき、現在の画像のフレーム102 がブロック104 に分割され、各ブロック104 に対してそのブロック104 より広いサーチ区域106 が前の画像100 中に規定される。ブロック104 はその後、サーチ区域106 の大きさに拡大されてブロック104 の逆マップ108 が形成される。ここで、「逆」とは通常地図はそれが表している区域よりも小さいが、本発明の場合にはマップ108 はブロック104 よりも大きいためにこのように呼んでいるのである。拡大後、アルゴリズムはこれら2つの画素マトリックス106 と108 の関係する画素の絶対差値110 を計算して、それらを運動レジスタ112 中に配置する。画像の各ブロック104 の処理後、フレーム100 と102 との間の運動の地勢的マップが運動レジスタ112 中に形成され、それにおいて最小値はフレーム間の所望のグローバルな運動ベクトルを示している。100 と102 のような等しい大きさの画像に対して、これはサーチ区域106 がフレーム102 のエッジを越えたときフレーム102 のエッジブロックをどのように処理するかの問題を生じるが、これは小さな問題に過ぎない。幸いに幾つかの実際的な解決方法が存在し、例えば、フレーム100 のエッジ画素をコピーしてサーチ区域106 を満たすか、フレーム102 が十分に大きいとき、フレーム102 のエッジブロックを無効にする等である。
現在の画像のフレーム102 と前の画像のフレーム100 が反対の順序であってもよことに注目すべきであり、逆方向「運動評価」は、順方向「運動評価」に転換される。他方で、基準画像、すなわち前の画像もまたグローバルな運動ベクトルが規定される任意の他のフレームであってもよい。
さらに、拡大は仮想のものであってもよく、そのため差の計算処理は異なったフェーズでブロックの画素とサーチ区域で行なわれてもよい。また、ブロック拡大における差の補間方法は少なくともサーチ区域がブロックの多数倍でない場合には考慮にいれられる必要がある。
k×lのサイズのサーチ区域の面積Sと拡大されたブロックの面積Bとの関係はエラーブロックEとして次式で与えられる。
E(i,j)=|B(i,j)−S(i,j)| (1)
ここで、iは0からk−1の間で変化し、jは0からl−1の間で変化する。さらに運動レジスタを満たす地勢運動マップTは次式で与えられる。
T(i,j)=ΣEi (i,j) (2)
この式で、Σはiが1からnまでの合計を表しており、フレームはn個のブロックに分割される。これらのブロックは重なってもよく、それらの結合はフレーム全体をカバーする必要はない。そのため特徴検出が適用できる。他の関数、例えば2次関数が使用されてもよく、それはまた運動評価アルゴリズムで効率がよい。
図1の形態に基づいて、図2は実際に前述した理論がどのように動作するかが示されている。再び102 はそこに人がいる現在のフレームを示しており、100 は前のフレームを示しており、そこでは人はやや異なった位置にいる。簡明にするために、ブロック103 が処理されるときの人の眼のレベルの発光データ107 の断面118 だけが示されている。対応する眼のレベルの断面116 はサーチ区域105 内で選択され、発光データ109 の断面116 が示されている。107 の拡大は108 として示されている。これら2つの発光データエレメント108, 109は111 として組合わされ、そこで絶対差が計算され、運動レジスタ112 中に追加される。運動レジスタ112 は各ブロックとサーチ区域の差情報を集め、運動の地勢的マップがブロック単位で成長する。最後に、全てのブロックが処理された後に、運動レジスタ114 はグローバルな運動ベクトルが存在する場所を示す。ブロックのマップはグローバルな運動ベクトルが存在する場所を正確に示す必要はない。その理由は、運動レジスタ112 のマップは幾つかの最小値、すなわち運動ベクトルの可能な候補を含んでいる。マップのボリュームが大きくなる場所では運動ベクトルの存在の可能は減少する。
図3は運動レジスタ中の地勢マップと運動ベクトルとの接続を示している。ブロックの寸法は3×3画素であり、サーチ区域202 は15×15画素である。ここで重要なことは運動ベクトルの周期的特性であり、それは図のエッジに示され、水平運動ベクトルに対してはトップ値を表し、垂直運動ベクトルに対してはレフト(left)値を表している。運動ベクトル周期の長さ208 はブロックの寸法とサーチ区域の寸法との比率である。ここでは周期は5=15/3である。それは地勢マップ中に反復値が存在するとを意味している。例えば同じベクトル(2,−2)に全ての点が指向している4つの値の区域210 がある。これは例えば全部の4個の値をそれらの平均値に組合わせることにより消去され、マップまたは後方を満たす。マップの最小値の位置は運動ベクトルを示し、それはチャートのエッジのちから容易に読取られ、或いは実際に計算される。
最小値は例えば、次式のような簡単なマトリックスフィルタによりマップから濾波される。
Figure 0004991712
これはこの方法のシミュレーションにおいて効率的であることを保証する。最小値はまたフィルタなしで、或いは別のフィルタにより発見されてもよい。しかしながら、濾波は最小値を発見するためにはより確実な方法であると考えられている
以下の説明において、図4のフローチャートを参照すると、2つの画像間のグローバルな運動ベクトルを発見する方法が記載されている。この方法は300 でスタートする。302 で初期化が行なわれ、それはブロックの寸法、サーチ区域の大きさ等に対する定義が含まれてもよい。次に304 で運動マップに対するレジスタが中性に初期化される。随意のブロックの選択がステップ305 で例えば特徴または詳細の検出により行なわれる、ステップ306 でブロックのデータが読取られる。そのブロックのデータは発光ではクロミナンスCbまたはCr、赤、青、或いはデジタルカラーフォーマットのいずれかでよい。ステップ308 でサーチ区域データがブロックのその位置の周囲の他の画像から読取られる。ブロックはその後サーチ区域の大きさまで(仮想的に)拡大され、それらの差がステップ310 で画素単位で計算され、その差はその後、運動レジスタ312 中に保存される。ループ306, 308, 310, 312は、ステップ314 のようにブロックが残らなくなるまで反復される。ステップ316 で、最小値が運動レジスタからサーチされ、一般的な運動ベクトルがそれによって規定される。一般的な運動ベクトルが知られると、随意的な特徴318 がそれに続き、それは例えば安定のためであり、或いはビデオエンコーダ中の予測運動評価のためであってもよい。この方法ではフレームがステップ320 で残らなくなるまでフレーム対をループする。方法はステップ322 で停止する。
図5、図6の(A)および(B)、図7の(A)および(B)は、安定化のためのグローバルな運動ベクトルの使用を示している。図5では人がテキストHANTRO OULUの前に立っている。明瞭にするためにフレーム400 により定められた領域だけが示されている。フレーム402 はカメラの撮影情景を規定する。画像情景404 は撮影情景402 の内部に認められ、例えばアプリケーション、ビデオコーディックに伝送される。区域406 はフレーム402 と404 との大きさの差であり、それはフレーム404 が自由に移動できる区域、すなわち安定化が最も効率のよい区域である。基本的に区域406 が大きくなるほど良好な安定化が得られる。
図6の(A)および(B)は撮影情景402 と画像情景404 におけるカメラの動きの影響を示している。図6の(A)は最初の状態、すなわち第1の画像を示しており、画像情景502 は撮影情景500 の内部の中央にある。図6の(B)は次の画像を示しており、それにおいてはカメラは矢印504 の方向に右に移動し、撮影される人は明瞭に画像情景と撮影情景506 の左へシフトされる。したがって図6の(A)および(B)は、運動補償が使用されなければ、意図しないカメラの動きにより画像がどのように被害を受けるかを示している。
図7の(A)および(B)は、運動規定のための前述の方法を使用することによるカメラの動きの補償が示されている。図7の(A)の内容は図6の(A)の内容に対応している。前述のように撮影情景すなわち図6の(A)の前の画像500 と画像情景、すなわち図6の(B)の画像506 との間のカメラの運動の方向と大きさが計算されてグローバルな運動ベクトルが得られる。簡明にするために示された例では水平のカメラ運動504 だけが含まれており、それはグローバルな運動ベクトルと実際上同じであるが方向は反対である。カメラ運動は(反対方向の)グローバルな運動ベクトルにより撮影情景506 の内部の画像情景508 を動かすことにより補償される。図6の(B)と図7の(B)とを比較すると、補償を使用することにより、撮影される人および彼の後方のテキストは側方にシフトされないことに注目すべきである。ビデオシーケンスが続くとき安定化は画像情景の位置に追跡維持しなければならず、そのため次の画像対において安定にされることができる。グローバルな運動ベクトルと反対の方向に次の画像フレーム移動させることにより運動を消去することは別にして、規定された運動はまた例えばカルマンフィルタまたはFIRフィルタ(FIR=有限インパルス応答)により運動を濾波するようなビデオ安定化のための従来知られている他の技術を使用することも可能であり、その後で運動が消去される。
図5にしたがって、図8はカメラ/安定化/ビデオエンコーダシステムにおける実際の情景のフェーズ400, 402, 404 を示している。人700 はカメラ702 の前に立っており、それは情景400 を示している。しかしカメラはその観察の限定された区域だけを撮影しようとしており、それは安定化フェーズ704 に採取される。安定化はそれから現在の撮影情景402 と前のフレームの撮影情景402-2 との間で行なわれる。安定化後、画像情景404 が撮影されてビデオエンコーダ710 に与えられ、現在の画像の撮影情景402 が前の画像の撮影情景402-2 と置換される。
図8はまた予測可能な運動評価装置の全体の情景を示しており、そこではグローバルな運動ベクトル706 がエンコーダ710 に供給される。その後、ビデオエンコーダ710 中の撮影情景404 が安定化されていない撮影情景402 と置換される。
デジタル画像処理装置は、第1のデジタル画像および第2のデジタル画像を得るための入力インターフェース712 と、入力インターフェース712 と結合された処理ユニット704 (および恐らくはエンコーダ710 )を具備している。処理ユニット704 (および恐らくはエンコーダ710 )は第1のデジタル画像中の少なくとも1つのブロックを規定し、第2のデジタル画像中のサーチ区域を各ブロックに対して規定し、サーチ区域はブロックよりも大きく、ブロックとそのサーチ区域を等しい大きさにマップされ、等しい大きさにマップされた各ブロックとサーチ区域との間の画素単位のエラーが計算され、そのエラーを運動レジスタ中に収集し、第1のデジタル画像と第2のデジタル画像との間の運動が運動レジスタを使用して決定される。デジタル画像処理装置は用途特定集積回路ASICのような1以上の集積回路として構成されてもよい。別々の論理コンポーネントで構成された回路、或いはソフトウエアを有するプロセッサのような他の実施形態もまた適応できる。これらの異なった実施形態のハイブリッドもまた可能である。構成方法を選択するとき、当業者は例えば装置の寸法および電力消費、必要な処理能力、生産コスト、製造容積等について必要な設定を考慮するであろう。1実施形態はデジタル画像処理のためのコンピュータプログラムプロダクトであり、分配媒体で実施される。その場合には前述の機能/構造はソフトウエアモジュールとして構成されることができる。分配媒体は(コンピュータ読取り可能な)プログラム記憶媒体、(コンピュータ読取り可能な)メモリ、(コンピュータ読取り可能な)ソフトウエア頒布パッケージ、(コンピュータ読取り可能な)信号または (コンピュータ読取り可能な)通信信号のようなソフトウエアを顧客に頒布する任意の手段でよい。
図9は(mpeg−4型)エンコーダ710 をさらに詳細に示している。第1の入力画像708 は安定化フェーズからフレームバッファ800 に到着し、そこからブロック単位で符号化フェーズ802 に送られるが、その詳細はここでは詳しく説明しない。その理由は、安定化は符号化の構成とは関係ないからである。符号化された画像は第2のフレームバッファ804 に送られて再配列される。第2の入力画像708 がフレームバッファ800 に到着すると、運動評価ブロック806 は運動の評価を開始し、ブロック単位で第1と第2の画像804 と800 の間で符号化フェーズ802 に対して同期される。符号化されるブロックは画像800 から採取され、基準ブロック、すなわちサーチ区域は画像804 から採取される。典型的に運動評価ではフルサーチ方法が使用され、それはブロック例えばその左上のコーナーからスタートして全ての可能な運動ベクトルによりサーチ区域中に適合されることを意味している。その後、最良の整合が基準ブロックに対して選択される。運動評価ブロックは安定化からグローバルな運動ベクトル706 を獲得する。運動評価はグローバルな運動ベクトルを使用することによって開始し、良好な基準ブロックが即座に発見された場合にはそこで終了する。選択された運動ベクトル808 は可変長コーダ810 に伝送され、その出力812 は圧縮されたデータを出力する。
図8および9を比較することにより、安定化装置における画像402 に対するものと、デコーダにおけるバッファ800 に対するものと二重フレームバッファが存在することが認められる。それらはエンコーダ710 がバッファ800 として画像402 に対するバッファを使用するように組合わされることができる。これは例えば、エンコーダ710 が安定化フェーズの後で安定化された画像404 を読取るために行なわれる。別の二重化は図8の安定化における画像402-2 および図9のデコーダにおけるバッファ804 から認められる。それらは同様に組合わされることができる。すなわち、安定化フェーズは814 を使用し、バッファ804 からの安定化された画像404 を基準フレーム402-2 として使用する。このようにして安定化はビデオ符号化システムにおけるメモリの必要性を(運動マップを除いて)増加させない。
図10はエンコーダの運動評価におけるグローバルな運動ベクトルの使用を示している。フレーム900 は基準フレームを表しており、そこから基準ブロックがブロックを符号化するために獲得される。ブロック902 は基準フレーム900 中の(符号化されるべき)ブロックの位置、すなわちゼロ位置を表している。このゼロ位置の付近に限定されたサーチ区域があり、それは典型的にブロック902 の大きさの多数倍である。矢印906 は符号化されるべきフレームと基準フレーム900 に対して計算されたグローバルな運動ベクトルである。それ故符号化されるべきブロックに対する最も可能性の高い基準ブロックは位置908 で発見され、それをグローバルな運動ベクトル906 が指向している。失敗の場合、すなわち基準ブロックが最良のもではないと見られる場合には、手順はマップから第2に低い値をチェックし、それが駄目な場合にはさらに第3に低い値をチェックし、以下同様に処理することによって継続する。局部的な最低はまた局部的運動ベクトルを指向しており、それ故、それらもまた検査される。
この解決法はブロックの大きさに関係しないことに注意すべきである。それはビデオ符号化基準から別のものに変化する可能性がある。例えばmpeg−4基準は4つの8×8画素のブロックから構成された16×16画素のマクロブロックを発光フレームに対して提供する。
以上、本発明を添付図面を参照にして実施形態により説明したが、本発明はそれだけに限定されるものではなく、本発明の技術的範囲を逸脱することなく多くの変形、変更が可能であることは明らかである。
一般的な運動規定方法を示す概略図。 前記方法の理論の実際を示す説明図。 運動マップと運動ベクトルとの間の関係を示す説明図。 一般的な運動規定方法を示すブロック図。 ビデオ安定化された撮影と画像情景を示す説明図。 カメラの移動が撮影する情景と画像情景にどのように影響するかを示す説明図。 カメラの動きの補償を示す説明図。 デジタル画像処理装置およびそのビデオソースの関係を示す説明図。 ビデオエンコーダの概要図。 エンコーダの運動評価におけるグローバル運動ベクトルの使用の説明図。

Claims (10)

  1. 第1のデジタル画像と第2のデジタル画像を獲得するための入力インターフェースと、
    その入力インターフェースに結合されて第1のデジタル画像中の少くとも1つのブロックを規定し、第2のデジタル画像中のサーチ区域を各ブロックに対して規定する処理ユニットとを具備し、
    前記サーチ区域はブロックよりも大きく、
    処理ユニットは、ブロックとそのサーチ区域を等しいサイズにマップし、各ブロックと等しいサイズにマップされているサーチ区域との間の画素エラーを計算し、そのエラーを運動レジスタ中に集め、運動レジスタを使用することにより第1のデジタル画像と第2のデジタル画像との間の運動を規定するように構成されてデジタル画像処理装置。
  2. 前記画素エラーはエラー関数
    E(i,j)=|B(i,j)−S(i,j)|により計算され、
    ここで、Bはブロックであり、Sはサーチ区域であり、iとjはブロックとサーチ区域のインデックスを表し、
    エラーは関数
    Figure 0004991712
    により運動レジスタ中に集められ、第1のデジタル画像はn個のブロックに分割されている請求項1記載のデジタル画像処理装置。
  3. 前記処理ユニットは、ブロックが、第1のデジタル画像全体をオーバーラップするようにおよび/またはカバーしないようにブロックを選択する請求項1記載のデジタル画像処理装置。
  4. 前記処理ユニットは、特徴検出によりブロックを選択する請求項1記載のデジタル画像処理装置。
  5. さらに、ビデオシーケンス安定化のために動作し、それにより、前記処理ユニットは運動レジスタ中のグローバルな最小を有しているグローバルな運動ベクトルとして運動を規定し、第1のデジタル画像と第2のデジタル画像との間の運動を消去するように構成されている請求項1記載のデジタル画像処理装置。
  6. さらに、ビデオ符号化のために動作し、それにより、前記処理ユニットは運動レジスタ中のグローバルな最小を有しているグローバルな運動ベクトルから、或いは運動レジスタに基づいて形成された運動マップから、或いは運動レジスタ中の局部的最小を有している少なくとも1つの局部的運動ベクトルから運動を予測するように構成されている請求項1記載のデジタル画像処理装置。
  7. 第1のデジタル画像と第2のデジタル画像を獲得する手段と、
    第1のデジタル画像中の少くとも1つのブロックを規定する手段と、
    第2のデジタル画像中のブロックよりも大きいサーチ区域を各ブロックに対して規定する手段と、
    ブロックとそのサーチ区域を等しいサイズにマップする手段と、
    各ブロックと等しいサイズにマップされているそのサーチ区域との間の画素エラーを計算する手段と、
    そのエラーを運動レジスタ中に集める手段と、
    運動レジスタを使用することにより第1のデジタル画像と第2のデジタル画像との間の運動を規定する手段とを具備しているデジタル画像処理装置。
  8. 分配媒体で実行されるデジタル画像処理のためのコンピュータプログラムプロダクトにおいて、
    第1のデジタル画像と第2のデジタル画像を獲得する入力モジュールと、
    その入力モジュールに結合されて第1のデジタル画像中の少くとも1つのブロックを規定し、第2のデジタル画像中のブロックよりも大きいサーチ区域を各ブロックに対して規定するコンピュータモジュールとを具備し、
    前記コンピュータモジュールは、
    ブロックおよびそのサーチ区域を等しいサイズにマップし、
    各ブロックと等しいサイズにマップされているそのサーチ区域との間の画素エラーを計算し、
    そのエラーを運動レジスタ中に集め、
    運動レジスタを使用することにより第1のデジタル画像と第2のデジタル画像との間の運動を規定するように構成されているコンピュータプログラムプロダクト。
  9. 第1のデジタル画像と第2のデジタル画像を獲得するための入力ブロックと、
    その入力ブロックに結合されて第1のデジタル画像中の少くとも1つのブロックを規定し、第2のデジタル画像中のブロックよりも大きいサーチ区域を各ブロックに対して規定する処理ブロックとを具備し、
    処理ブロックは、各ブロックとそのサーチ区域を等しいサイズにマップし、各ブロックと等しいサイズにマップされたサーチ区域との間の画素エラーを計算し、そのエラーを運動レジスタ中に集め、運動レジスタを使用することにより第1のデジタル画像と第2のデジタル画像との間の運動を規定するように構成されているデジタル画像処理集積回路。
  10. 第1のデジタル画像と第2のデジタル画像を獲得し、
    第1のデジタル画像中の少くとも1つのブロックを規定し、
    第2のデジタル画像中のサーチ区域を各ブロックに対して規定し、そのサーチ区域はブロックよりも大きく、
    各ブロックとそのサーチ区域を等しいサイズにマップし、
    各ブロックと等しいサイズにマップされているそのサーチ区域との間の画素エラーを計算し、
    そのエラーを運動レジスタ中に集め、
    運動レジスタを使用することにより第1のデジタル画像と第2のデジタル画像との間の運動を規定するデジタル画像間の運動を規定する方法。
JP2008519953A 2005-07-05 2006-05-29 デジタル画像処理装置および処理方法ならびにコンピュータプログラムプロダクト Expired - Fee Related JP4991712B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US11/172,972 2005-07-05
US11/172,972 US20070009034A1 (en) 2005-07-05 2005-07-05 Apparatuses, computer program product, and method for digital image processing
PCT/FI2006/050218 WO2007003694A1 (en) 2005-07-05 2006-05-29 Apparatuses, computer program product, and method for digital image processing

Publications (2)

Publication Number Publication Date
JP2009500931A JP2009500931A (ja) 2009-01-08
JP4991712B2 true JP4991712B2 (ja) 2012-08-01

Family

ID=37604111

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008519953A Expired - Fee Related JP4991712B2 (ja) 2005-07-05 2006-05-29 デジタル画像処理装置および処理方法ならびにコンピュータプログラムプロダクト

Country Status (6)

Country Link
US (1) US20070009034A1 (ja)
EP (1) EP1904974B1 (ja)
JP (1) JP4991712B2 (ja)
CN (1) CN101238486B (ja)
GB (1) GB2430831B (ja)
WO (1) WO2007003694A1 (ja)

Families Citing this family (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8396117B2 (en) * 2006-05-30 2013-03-12 Google Inc. Apparatus, arrangement, method and computer program product for digital video processing
JP4813517B2 (ja) * 2008-05-29 2011-11-09 オリンパス株式会社 画像処理装置、画像処理プログラム、画像処理方法、および電子機器
US8385404B2 (en) * 2008-09-11 2013-02-26 Google Inc. System and method for video encoding using constructed reference frame
FI20095273A0 (fi) * 2009-03-17 2009-03-17 On2 Technologies Finland Oy Digitaalinen videokoodaus
EP2405661B1 (en) 2010-07-06 2017-03-22 Google, Inc. Loss-robust video transmission using two decoders
US8503528B2 (en) 2010-09-15 2013-08-06 Google Inc. System and method for encoding video using temporal filter
US8611415B1 (en) 2010-11-15 2013-12-17 Google Inc. System and method for coding using improved motion estimation
US9154799B2 (en) 2011-04-07 2015-10-06 Google Inc. Encoding and decoding motion via image segmentation
US8638854B1 (en) 2011-04-07 2014-01-28 Google Inc. Apparatus and method for creating an alternate reference frame for video compression using maximal differences
US8724854B2 (en) 2011-04-08 2014-05-13 Adobe Systems Incorporated Methods and apparatus for robust video stabilization
US8767821B2 (en) 2011-05-09 2014-07-01 Google Inc. System and method for providing adaptive media optimization
CN102868879B (zh) * 2011-07-05 2015-04-29 北京大学 一种视频帧速率上转换方法及***
US9014265B1 (en) 2011-12-29 2015-04-21 Google Inc. Video coding using edge detection and block partitioning for intra prediction
WO2013162980A2 (en) 2012-04-23 2013-10-31 Google Inc. Managing multi-reference picture buffers for video data coding
US9609341B1 (en) 2012-04-23 2017-03-28 Google Inc. Video data encoding and decoding using reference picture lists
US9014266B1 (en) 2012-06-05 2015-04-21 Google Inc. Decimated sliding windows for multi-reference prediction in video coding
CN103517052B (zh) * 2012-06-29 2017-09-26 乐金电子(中国)研究开发中心有限公司 一种编码深度信息时的视点合成方法、装置及编码器
US9210424B1 (en) 2013-02-28 2015-12-08 Google Inc. Adaptive prediction block size in video coding
US9756331B1 (en) 2013-06-17 2017-09-05 Google Inc. Advance coded reference prediction
US9313493B1 (en) 2013-06-27 2016-04-12 Google Inc. Advanced motion estimation
US9807416B2 (en) 2015-09-21 2017-10-31 Google Inc. Low-latency two-pass video coding
WO2018078872A1 (ja) * 2016-10-31 2018-05-03 Eizo株式会社 画像処理装置、画像表示装置及びプログラム
US10591731B2 (en) * 2016-12-06 2020-03-17 Google Llc Ocular video stabilization

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR950006045B1 (ko) 1990-05-21 1995-06-07 마쯔시다덴기산교 가부시기가이샤 움직임벡터검출장치 및 화상흔들림보정장치
SE469866B (sv) * 1991-04-12 1993-09-27 Dv Sweden Ab Metod för estimering av rörelseinnehåll i videosignaler
FI92896C (fi) * 1992-12-31 1995-01-10 Salon Televisiotehdas Oy Menetelmä liikkeen estimoimiseksi videosignaalista sekä liike-estimaattori
JP3333012B2 (ja) * 1993-09-10 2002-10-07 オリンパス光学工業株式会社 画像合成装置
US5537155A (en) * 1994-04-29 1996-07-16 Motorola, Inc. Method for estimating motion in a video sequence
US5550480A (en) * 1994-07-05 1996-08-27 Motorola, Inc. Method and means for controlling movement of a chuck in a test apparatus
WO1996008114A1 (en) * 1994-09-02 1996-03-14 David Sarnoff Research Center, Inc. Method and apparatus for global-to-local block motion estimation
US5835138A (en) 1995-08-30 1998-11-10 Sony Corporation Image signal processing apparatus and recording/reproducing apparatus
CN1220020A (zh) * 1996-11-25 1999-06-16 西门子公司 计算机辅助移动估算或者移动补偿的方法和装置
JPH10262258A (ja) * 1997-03-19 1998-09-29 Sony Corp 画像符号化装置及び方法
US6140828A (en) * 1997-05-08 2000-10-31 Tokyo Electron Limited Prober and probe method
JP3356683B2 (ja) * 1998-04-04 2002-12-16 東京エレクトロン株式会社 プローブ装置
DE10039336C2 (de) * 2000-08-04 2003-12-11 Infineon Technologies Ag Verfahren zum Testen von Halbleiterschaltungen und Testvorrichtung zur Durchführung des Verfahrens
JP4782953B2 (ja) * 2001-08-06 2011-09-28 東京エレクトロン株式会社 プローブカード特性測定装置、プローブ装置及びプローブ方法
US7221776B2 (en) * 2001-10-31 2007-05-22 Arcsoft, Inc. Video stabilizer
KR100451184B1 (ko) * 2001-12-15 2004-10-02 엘지전자 주식회사 모션 벡터 탐색 방법
US7433497B2 (en) * 2004-01-23 2008-10-07 Hewlett-Packard Development Company, L.P. Stabilizing a sequence of image frames
US7447337B2 (en) * 2004-10-25 2008-11-04 Hewlett-Packard Development Company, L.P. Video content understanding through real time video motion analysis
JP4507896B2 (ja) * 2005-01-27 2010-07-21 パナソニック株式会社 動画像圧縮装置と動画像圧縮処理方法

Also Published As

Publication number Publication date
GB0625491D0 (en) 2007-02-07
EP1904974A4 (en) 2012-03-28
GB2430831A (en) 2007-04-04
EP1904974B1 (en) 2013-03-20
EP1904974A1 (en) 2008-04-02
US20070009034A1 (en) 2007-01-11
CN101238486A (zh) 2008-08-06
CN101238486B (zh) 2012-03-21
JP2009500931A (ja) 2009-01-08
GB2430831B (en) 2011-05-11
WO2007003694A1 (en) 2007-01-11

Similar Documents

Publication Publication Date Title
JP4991712B2 (ja) デジタル画像処理装置および処理方法ならびにコンピュータプログラムプロダクト
JP7335315B2 (ja) 画像予測方法および関連装置
US10728474B2 (en) Image signal processor for local motion estimation and video codec
CN111279673B (zh) 具有电子卷帘快门校正的图像拼接的***和方法
TWI572196B (zh) 用於次世代視訊編碼之投射式內插預測產生之技術
JP6140171B2 (ja) 受信されたビデオの安定化
US11490078B2 (en) Method and apparatus for deep neural network based inter-frame prediction in video coding
CN105190688A (zh) 用于查看图像的方法和装置
JP2009303236A (ja) 適応的画像安定
WO2012132168A1 (ja) 情報処理装置、情報処理方法、および位置情報のデータ構造
JP2012516637A5 (ja)
JP2009147807A (ja) 画像処理装置
JP2007068165A (ja) 向上した動き推定方法、該方法を利用したビデオエンコーディング方法及び装置
US10425656B2 (en) Method of inter-frame prediction for video encoding and decoding
WO2017205597A1 (en) Image signal processing-based encoding hints for motion estimation
KR102003460B1 (ko) 왜곡제거장치 및 방법
JP2013085252A (ja) データストリームにブロック単位で予測符号化されたビデオフレームのブロックの顕著性値を決定する方法及び装置
JP2017207818A (ja) 画像処理装置、画像処理方法、プログラム
US9549205B2 (en) Method and device for encoding video
JP6066583B2 (ja) 動画像符号化装置及び動画像符号化方法
JP2007013398A (ja) ポストフィルタ、ポストフィルタリングプログラムおよび電子情報機器
JP4100321B2 (ja) セグメント単位画像符号化装置及びセグメント単位画像符号化プログラム
US20140119448A1 (en) Moving image encoding apparatus, image capturing apparatus, and method of controlling moving image encoding apparatus
JP2018182435A (ja) 動きベクトル予測装置及びコンピュータプログラム
JP2007081548A (ja) 動きベクトル探索装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090513

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20111007

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A711

Effective date: 20111025

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20111025

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20111220

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120313

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120403

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120507

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150511

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: R3D02

LAPS Cancellation because of no payment of annual fees