JP6339358B2 - デジタル映像処理装置及び映像の代表動き予測方法 - Google Patents

デジタル映像処理装置及び映像の代表動き予測方法 Download PDF

Info

Publication number
JP6339358B2
JP6339358B2 JP2013261012A JP2013261012A JP6339358B2 JP 6339358 B2 JP6339358 B2 JP 6339358B2 JP 2013261012 A JP2013261012 A JP 2013261012A JP 2013261012 A JP2013261012 A JP 2013261012A JP 6339358 B2 JP6339358 B2 JP 6339358B2
Authority
JP
Japan
Prior art keywords
motion vector
template
video
representative
adjacent
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2013261012A
Other languages
English (en)
Other versions
JP2014123359A (ja
Inventor
活石 李
活石 李
相志 朴
相志 朴
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hanwha Vision Co Ltd
Original Assignee
Hanwha Techwin Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hanwha Techwin Co Ltd filed Critical Hanwha Techwin Co Ltd
Publication of JP2014123359A publication Critical patent/JP2014123359A/ja
Application granted granted Critical
Publication of JP6339358B2 publication Critical patent/JP6339358B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/20Analysis of motion
    • G06T7/246Analysis of motion using feature-based methods, e.g. the tracking of corners or segments
    • G06T7/248Analysis of motion using feature-based methods, e.g. the tracking of corners or segments involving reference images or patches
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/68Control of cameras or camera modules for stable pick-up of the scene, e.g. compensating for camera body vibrations
    • H04N23/681Motion detection
    • H04N23/6811Motion detection based on the image signal
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/68Control of cameras or camera modules for stable pick-up of the scene, e.g. compensating for camera body vibrations
    • H04N23/682Vibration or motion blur correction
    • H04N23/683Vibration or motion blur correction performed by a processor, e.g. controlling the readout of an image memory
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/18Closed-circuit television [CCTV] systems, i.e. systems in which the video signal is not broadcast
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30232Surveillance
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30244Camera pose

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Image Analysis (AREA)
  • Picture Signal Circuits (AREA)
  • Studio Devices (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

本発明は、デジタル映像処理装置及び映像の代表動き予測方法に係り、撮影映像の映像フレームを代表する動きを示す代表モーションベクトルを獲得するデジタル映像処理装置及び映像の代表動き予測方法に関する。
最近、ポータブル撮影装置及び/またはCCTVなどへの需要が急増するなか、撮影装置の振れによる映像の不安定性を解消するための研究開発が活発に行われつつある。特に、ユーザが撮影装置本体を直接把持して撮影するポータブル撮影装置だけではなく、指定の位置に取り付けられて作動するCCTVなどの場合にも、外部からの振動などによる撮影装置自体の振れによって映像の不安定性が問題になっている。
撮影装置の振れによる映像の不安定性を解消するためのデジタル映像処理技術として、撮影映像の映像フレームについて複数の候補モーションベクトルを導出した後、これらの複数の候補モーションベクトルに基づいて撮影映像の映像フレームを代表する動きを予測する代表動き予測技術が挙げられている。
しかしながら、このような従来の代表動き予測技術の場合、代表動きを予測する性能自体が劣る場合が多く、特に、映像内に動く物体がある場合や、撮影映像のノイズがひどいか画質自体が劣る場合には、正確な代表動きを算出し難く、映像の不安定性の解消が困難であるという技術的限界がある。
したがって、映像内に動く物体がある場合や、撮影映像のノイズがひどいか画質自体が劣る場合であっても、代表動きをさらに正確に予測できる映像処理技術が必要とされている。
韓国特許第023075号明細書
S.Erturk,"Digital Image Stabilization with Sub−Image Phase Correlation Based Global Motion Estimation",IEEE Transactions on Consumer Electronics,Vol.49,2003,1320−1325
本発明が解決しようとする技術的課題は、映像フレームを代表する動きを示す代表モーションベクトルをさらに正確に予測し、映像内に動く物体がある場合や、撮影映像のノイズがひどいか画質自体が劣る場合であっても、映像の不安定性を解消できるデジタル映像処理装置及び映像の代表動き予測方法を提供するところにある。
本発明が解決しようとする技術的課題は、以上で述べた技術的課題に制限されず、述べていない他の技術的課題は、下記の記載から当業者に明確に理解されるであろう。
前記の技術的課題を解決するためのデジタル映像処理装置は、撮影映像の映像フレームを、前記映像フレーム内の互いに異なる領域に対する複数のテンプレートにマッチングし、前記テンプレートにそれぞれ対応するテンプレートモーションベクトルを獲得するテンプレートモーションベクトル獲得部と、前記獲得されたテンプレートモーションベクトルそれぞれについて、前記テンプレートモーションベクトルそれぞれに隣接する少なくとも一つの隣接モーションベクトルとの加重和に基づいて、前記モーションベクトルそれぞれの位置を補正する位置補正部と、前記テンプレートモーションベクトルそれぞれの信頼度及び前記テンプレートモーションベクトルそれぞれに対応する前記隣接モーションベクトルの数に基づいて、前記テンプレートモーションベクトルそれぞれのスコアを算出するスコア演算部と、前記算出されたスコアに基づいて、前記テンプレートモーションベクトルから前記映像フレームを代表する代表モーションベクトルを選定する代表動き予測部と、を備える。
さらに望ましくは、前記加重和は、前記テンプレートモーションベクトル及び前記テンプレートモーションベクトルに対応する隣接モーションベクトルそれぞれの信頼度を加重値とする。
さらに望ましくは、前記隣接モーションベクトルは、前記隣接モーションベクトルに対応するテンプレートモーションベクトルとのユークリッド距離がしきい値より小さなモーションベクトルである。
さらに望ましくは、前記代表モーションベクトルに基づいて、前記映像フレームを含む撮影映像を安定化させる安定化部をさらに備える。
前記の技術的課題を解決するための映像の代表動き予測方法は、撮影映像の映像フレームを、前記映像フレーム内の互いに異なる領域に対する複数のテンプレートにマッチングし、前記テンプレートにそれぞれ対応するテンプレートモーションベクトルを獲得する段階と、前記獲得されたテンプレートモーションベクトルそれぞれについて、前記テンプレートモーションベクトルそれぞれに隣接する少なくとも一つの隣接モーションベクトルとの加重和に基づいて、前記テンプレートモーションベクトルそれぞれの位置を補正する段階と、前記テンプレートモーションベクトルそれぞれの信頼度及び前記テンプレートモーションベクトルそれぞれに対応する前記隣接モーションベクトルの数に基づいて、前記テンプレートモーションベクトルそれぞれのスコアを算出する段階と、前記算出されたスコアに基づいて、前記テンプレートモーションベクトルから前記映像フレームを代表する代表モーションベクトルを選定する段階と、を含む。
さらに望ましくは、前記加重和は、前記テンプレートモーションベクトル及び前記テンプレートモーションベクトルに対応する隣接モーションベクトルそれぞれの信頼度を加重値とする。
さらに望ましくは、前記隣接モーションベクトルは、前記隣接モーションベクトルに対応するテンプレートモーションベクトルとのユークリッド距離がしきい値より小さなモーションベクトルである。
さらに望ましくは、前記代表モーションベクトルに基づいて、前記映像フレームを含む撮影映像を安定化させる段階をさらに含む。
前記の技術的課題を解決するために、本発明は、前記映像の代表動き予測方法をコンピュータに実行させるためのプログラムを記録したコンピュータで読み取り可能な記録媒体を提供する。
本発明によれば、従来の代表動き予測技術とは異なり、映像内に動く物体がある場合や、撮影映像のノイズがひどいか画質自体が劣る場合であっても、映像フレームを代表する動きを示す代表モーションベクトルをさらに正確に予測できる。
本発明の望ましい一実施形態によるデジタル映像処理装置の構成を概略的に示すブロック図である。 本発明の望ましい一実施形態によるデジタル映像処理装置の一構成要素であるデジタル信号処理部の構成を概略的に示すブロック図である。 本発明の望ましい一実施形態による代表動き予測方法を概略的に示すフローチャートである。 従来の代表動き予測技術と本発明による代表動き予測方法との差を説明するために代表動き予測過程を例示する図面である。 従来の代表動き予測技術と本発明による代表動き予測方法との差を説明するために代表動き予測過程を例示する図面である。 従来の代表動き予測技術と本発明による代表動き予測方法との差を説明するために代表動き予測過程を例示する図面である。 従来の代表動き予測技術に比べて、本発明による代表動き予測方法が改善された性能を持つという主張を裏付けるために行った代表動き予測実験結果を例示する図面である。 従来の代表動き予測技術に比べて、本発明による代表動き予測方法が改善された性能を持つという主張を裏付けるために行った代表動き予測実験結果を例示する図面である。
以下の内容は、単に本発明の原理を例示する。したがって、当業者は、たとえ本明細書に明確に説明または図示されていないとしても、本発明の原理を具現し、本発明の概念及び範囲に含まれた多様な装置を発明できる。また、本明細書に挙げられたあらゆる条件付き用語及び実施形態は、原則的に、本発明の概念の理解を助けることだけを意図したものであり、このように特に挙げられた実施形態及び状態に本発明が限定されるものではないと理解されねばならない。また、本発明の原理、観点及び実施形態だけではなく特定の実施形態を挙げるあらゆる詳細な説明は、このような事項の構造的及び機能的な均等物を含むことを意図するものと理解されねばならない。また、このような均等物は、現在公知の均等物だけではなく、今後開発される均等物、すなわち、構造と関係なく同じ機能を行うように発明されたあらゆる要素を含むと理解されねばならない。
したがって、プロセッサまたはこれと類似した概念に表示された機能ブロックを含む図面に図示された多様な要素の機能は、専用ハードウェアだけではなく適切なソフトウェアに関してソフトウェアを実行する能力を持つハードウェアの使用で提供される。プロセッサによって提供される時、機能は、単一の専用プロセッサ、単一の共有プロセッサまたは複数の個別的プロセッサによって提供され、これらのうち一部は共有される。また、プロセッサ、コントローラまたはこれと類似した概念に提示される用語の使用は、ソフトウェアを行う能力を持つハードウェアを排他的に引用して解釈されてはならず、限定なしにデジタル信号プロセッサ(DSP)ハードウェア、ソフトウェアを保存するためのROM(Read Only Memory)、RAM及び不揮発性メモリを暗示的に含むと理解されねばならない。周知慣用の他のハードウェアも含まれる。
前述した目的、特徴及び長所は、添付した図面に関する以下の詳細な説明によりさらに明らかになる。本発明を説明するに際して、かかる公知技術についての具体的な説明が本発明の趣旨を不明瞭にすると判断される場合、その詳細な説明を略するか、または簡単に説明する。
一方、ある部分がいずれかの構成要素を“含む”という時、これは特に他の記載がない限り、他の構成要素を除外するものではなく、他の構成要素をさらに含むことができるということを意味する。
以下、添付した図面を参照して望ましい実施形態による本発明を詳細に説明する。
図1は、本発明の望ましい一実施形態によるデジタル映像処理装置の構成を概略的に示すブロック図であり、図2は、図1に図示されたデジタル映像処理装置の一構成要素であるデジタル信号処理部の構成を概略的に示すブロック図である。
図1を参照すれば、本実施形態によるデジタル映像処理装置の全体動作は、CPU 100によって統括される。そして、デジタル映像処理装置には、ユーザからの電気的信号を発生させるキーなどを含む操作部200が備えられる。この操作部200からの電気的信号はCPU 100に伝達され、CPU 100が電気的信号によってデジタル映像処理装置を制御可能にする。
撮影モードの場合、ユーザからの電気的信号がCPU 100に印加されることで、CPU 100は、その信号を把握してレンズ駆動部11、絞り駆動部21及び撮像素子制御部31を制御し、これによって、それぞれレンズ10の位置、絞り20の開放程度及び撮像素子30の感度などが制御される。撮像素子30は、入射する光から撮影映像の映像フレームに関するデータを生成し、アナログ/デジタル変換部40は、撮像素子30から出力されるアナログデータをデジタルデータに変換する。もちろん、撮像素子30の特性によってアナログ/デジタル変換部40が必要ない場合もあり得る。このようなデジタル映像処理装置の構成要素は、データ獲得部と総称されるが、もちろんデータ獲得部は、必ずしもこれらの構成要素をいずれも備える必要はなく、入射する光から撮影映像についてのデータを獲得できる構成要素ならば、データ獲得部の構成要素になる。
撮像素子30からのデータは、メモリ60を経てデジタル信号処理部50に入力されても、メモリ60を経ずにデジタル信号処理部50に入力されても、必要に応じてCPU 100に入力されてもよい。ここで、メモリ60は、ROMまたはRAMなどを含む概念である。デジタル信号処理部50は、必要に応じてガンマ補正、ホワイトバランス調整などのデジタル信号処理を行える。また後述するように、デジタル信号処理部50は、テンプレートモーションベクトル獲得部51、位置補正部52、スコア演算部53、代表動き予測部54及び安定化部55を備えることで、撮影装置自体の揺れによる映像の不安定性を低減させる機能を行える。もちろん、テンプレートモーションベクトル獲得部51、位置補正部52、スコア演算部53、代表動き予測部54及び安定化部55は、デジタル信号処理部50の一部ではない別途の構成要素であってもよく、さらには、他の構成要素の一部であってもよいなど、多様な変形が可能である。なお、テンプレートモーションベクトル獲得部51、位置補正部52、スコア演算部53、代表動き予測部54及び安定化部55は、そのうち少なくとも一部がオペレーティングシステム、アプリケーションプログラムモジュール及びその他のプログラムモジュールなどの所定のプログラムモジュールであり、物理的には、多様な種類の公知の記憶装置に保存される。また、このようなプログラムモジュールは、デジタル映像処理装置と通信可能な遠隔記憶装置に保存されることもある。一方、これらのプログラムモジュールは、本発明によって後述する特定業務を行うか、または特定の抽象データ類型を行うルーチン、サブルーチン、プログラム、オブジェクト、コンポネント、データ構造などを含むが、本発明自体がこれに限定されるものではない。テンプレートモーションベクトル獲得部51、位置補正部52、スコア演算部53、代表動き予測部54及び安定化部55の機能については、後述する。
デジタル信号処理部50から出力された撮影映像データは、メモリ60を通じて、または直接ディスプレイ制御部81に伝達される。ディスプレイ制御部81は、ディスプレイ部80を制御してディスプレイ部80に撮影映像をディスプレイする。そして、デジタル信号処理部50から出力された撮影映像データは、メモリ60を通じて、または直接保存/判読制御部71に入力されるが、この保存/判読制御部71は、ユーザからの信号によって、または自動で撮影映像データを記録媒体70に保存する。もちろん保存/判読制御部71は、記録媒体70に保存された撮影映像ファイルから撮影映像に関するデータを判読し、これをメモリ60を通じて、または他の経路を通じてディスプレイ制御部81に入力し、ディスプレイ部80に撮影映像をディスプレイさせることもできる。記録媒体70は、脱着自在なものであっても、またはデジタル映像処理装置に永久装着されたものであってもよい。
このようなデジタル映像処理装置を用いて撮影映像を安定化させるのは、撮影映像を構成するいずれかの映像フレームを基準として他の映像フレームの位置を修正することで、該映像の撮影装置自体が振れるにもかかわらず、撮影映像の映像フレーム内の被写体の位置を維持することを意味する。
このために、本実施形態によるデジタル映像処理装置は、データ獲得部を通じて撮影映像の映像フレームを獲得する。
テンプレートモーションベクトル獲得部51は、撮影映像の映像フレームを映像フレーム内の互いに異なる領域に対する複数のテンプレートにマッチングして、テンプレートにそれぞれ対応するテンプレートモーションベクトルを獲得する。
特に、本発明では、映像フレームに対するテンプレートモーションベクトルの獲得において、映像フレーム内の互いに異なる領域に対する複数のテンプレートを適用することで、撮影映像内に動く物体があっても、動く物体によって影響されないテンプレートのテンプレートモーションベクトルに基づいて代表動きを予測可能になって、動く物体による影響を相対的にさらに少なく受けるようになる。
位置補正部52は、テンプレートモーションベクトル獲得部51で獲得されたテンプレートモーションベクトルそれぞれについて、テンプレートモーションベクトルそれぞれに隣接する少なくとも一つの隣接モーションベクトルとの加重和に基づいて、テンプレートモーションベクトルそれぞれの位置を補正する。
この時、テンプレートモーションベクトルMVに対応する隣接モーションベクトルの集合Nに属する隣接モーションベクトルは、下記の数式1のように、該テンプレートモーションベクトルMVとのユークリッド距離(Euclidiean Distance、以下、ED)がしきい値より小さなモーションベクトルMVである。
このように、本発明では、単純にテンプレートモーションベクトルそれぞれの位置及び信頼度だけを考慮するのではなく、テンプレートモーションベクトルそれぞれに類似した隣接モーションベクトルの相対的な位置を共に考慮して代表動き予測性能を改善する。すなわち、抽出されたテンプレートモーションベクトルが正確でない可能性もあると仮定し、これを最大限補正するためである。
例えば、単純にテンプレートモーションベクトルそれぞれの信頼度が低い状態で該テンプレートモーションベクトルに基づいて代表動きを予測する場合には、代表動きについての正確な予測が困難になる。
したがって、本発明では、予測性能を向上させるためにテンプレートモーションベクトルそれぞれの位置及び信頼度だけではなく、テンプレートモーションベクトルそれぞれに類似した隣接モーションベクトルの相対的な位置を共に考慮している。
同時に、テンプレートモーションベクトルと、該テンプレートモーションベクトルに対応する隣接モーションベクトルとの加重和は、テンプレートモーションベクトル及び隣接モーションベクトルそれぞれの信頼度を加重値として演算でき、これによって、該テンプレートモーションベクトルの位置補正MV は、下記の数式2のように加重和演算により行える。
ここで、Cは、該モーションベクトルMVの信頼度を示す。
スコア演算部53は、位置補正部52で位置補正されたテンプレートモーションベクトルそれぞれの信頼度及びテンプレートモーションベクトルそれぞれに対応する隣接モーションベクトルの数に基づいて、テンプレートモーションベクトルそれぞれのスコアを算出する。
この時、テンプレートモーションベクトルのスコアSは、下記の数式3のように該テンプレートモーションベクトルの隣接モーションベクトルの数|N|を二乗した値に所定の加重値Wを適用し、該テンプレートモーションベクトルの信頼度Cに合算して算出する。
本発明では、テンプレートモーションベクトルそれぞれの位置補正だけではなく、テンプレートモーションベクトルそれぞれのスコアの算定時にも、単純にテンプレートモーションベクトルそれぞれの位置及び信頼度だけを考慮するものではなく、テンプレートモーションベクトルそれぞれにどれほど類似したモーションベクトルが多いかをまた共に考慮して代表動き予測性能を改善する。
この時、スコア加重値Wは、テンプレートモーションベクトルに共通に適用されるように、テンプレートモーションベクトルによって変わる変数値ではない所定の定数値に設定されることが望ましい。
代表動き予測部54は、スコア演算部53で算出されたテンプレートモーションベクトルそれぞれのスコアに基づいて、テンプレートモーションベクトルのうち該映像フレームを代表する動きを示す代表モーションベクトルを選定する。
このように、代表動き予測部54で該映像フレームの代表モーションベクトルを選定すれば、安定化部55は、このような代表モーションベクトルに基づいて該映像フレームを含む撮影映像を安定化させる。
撮影映像を安定化させる方法は、該映像フレームを代表モーションベクトルによって移動させるか、または代表モーションベクトルによって該映像フレームのデータを修正するなどの一連の映像処理過程を通じて、該映像フレームを含む撮影映像を安定化させることである。
例えば、安定化部55は、該映像フレームの代表モーションベクトルが(i,j)である場合に、該フレームの(x+i,y+j)が(x,y)画素のデータを持つように該映像フレームのデータを修正する。これは、本発明の説明の便宜のための一つの実施形態に過ぎず、本発明自体がこれらの安定化方法に限定されるものではなく、従来の公知された代表動き基盤の安定化技術がいずれも適用されるといえる。
図3は、本発明の望ましい一実施形態による代表動き予測方法を概略的に示すフローチャートであり、本実施形態による映像データ伝送方法は、図1及び/または図2に図示されたデジタル映像処理装置及び/またはデジタル信号処理部50で行われる。よって、図1及び/または図2に図示されたデジタル映像処理装置及び/またはデジタル信号処理部50と同じ事項については、これを参照する。
図3を参照すれば、先ず、撮影映像の映像フレームを前記映像フレーム内の互いに異なる領域に対する複数のテンプレートにマッチングし、前記テンプレートにそれぞれ対応するテンプレートモーションベクトルを獲得する(S301)。
S301段階で獲得されたテンプレートモーションベクトルそれぞれについて、テンプレートモーションベクトルそれぞれに隣接する少なくとも一つの隣接モーションベクトルとの加重和に基づいて、テンプレートモーションベクトルそれぞれの位置を補正する(S302)。
S302段階で位置補正されたテンプレートモーションベクトルそれぞれの信頼度及び前記テンプレートモーションベクトルそれぞれに対応する隣接モーションベクトルの数に基づいて、テンプレートモーションベクトルそれぞれのスコアを算出する(S303)。
S303段階で算出されたスコアに基づいて、テンプレートモーションベクトルから映像フレームを代表する代表モーションベクトルを選定する(S304)。
本実施形態による代表動き予測方法によれば、複数の候補モーションベクトル及び候補モーションベクトルそれぞれの信頼度値が与えられた状況(MV,C)、(MV,C)、(MV,C)、…、(MV,C)で、代表モーションベクトルMVを容易に算出する。
図4Aないし図4Cは、従来の代表動き予測技術と本発明による代表動き予測方法との差を説明するために代表動き予測過程を例示する図面である。
図4Aは、従来の代表動き予測技術及び本発明による代表動き予測の前提として、複数の候補モーションベクトル及び候補モーションベクトルそれぞれの信頼度値が与えられた状況(MV,C)、(MV,C)、(MV,C)、…、(MV,C)を例示する。
図4Aを参照すれば、4個の候補モーションベクトル#1、#2、#3、#4は、(−7,3)、(−4,2)、(−4,−2)、(5,2)の位置をそれぞれ有し、それぞれの信頼度として0.2、0.3、0.1、0.5が設定される。
そして、該フレームの実際動きベクトル(True Motion Vector、TMV)は、(−5,0)と仮定する。すなわち、代表モーションベクトルが実際動きベクトルに最も近い値、すなわち、両者間のEDが最小である場合が、代表モーションベクトルを最も正確に予測したとみられる。
図4Bは、従来の代表動き予測技術によって代表動き予測を予測した結果を例示する。
本発明による代表動き予測方法と比べるための従来の代表動き予測技術として、前述した非特許文献1に提示された3つの従来技術(先行技術1ないし3)を例示する。
前述したように、先行技術1ないし3は、いずれも複数の候補モーションベクトル及び候補モーションベクトルそれぞれの信頼度値が与えられた状況(MV,C)、(MV,C)、(MV,C)、…、(MV,C)で代表モーションベクトルMVを算出する技術である。
以下、先行技術1は、下記の数式4のように、候補モーションベクトルのうち最大信頼度を持つモーションベクトルMV を代表モーションベクトルMVと選定する、いわゆる、最大信頼度方式の技術を示す。
以下、先行技術2は、下記の数式5のように、候補モーションベクトルそれぞれに該信頼度を乗算して合算した結果を代表モーションベクトルMVと選定する、いわゆる、加重和方式の技術を示す。
以下、先行技術3は、下記の数式6のように、候補モーションベクトルのうち信頼度の大きい順にM個を選定し、これらだけを対象として加重和演算した結果を代表モーションベクトルMVと選定する、いわゆる、選択的加重和方式の技術を示す。
図4Bを参照すれば、先ず、先行技術1によって候補モーションベクトルのうち最大信頼度を持つモーションベクトルを代表モーションベクトルと選定する場合には、候補モーションベクトルである#1、#2、#3、#4のうち最大信頼度である0.5を持つ#4が代表モーションベクトルになり、該代表モーションベクトルの位置は(5,2)である。そして、先行技術1による代表モーションベクトルMVが実際動きベクトルTMVに近づいた程度を示すEDは、10.12になる。
また、先行技術2によって、候補モーションベクトルそれぞれに該信頼度を乗算して合算した加重和演算結果を代表モーションベクトルと選定する場合には、候補モーションベクトルである#1、#2、#3、#4それぞれの位置である(−7,3)、(−4,2)、(−4,−2)、(5,2)に、それぞれの信頼度である0.2、0.3、0.1、0.5を加重値として加重和演算した結果である(−0.5,2)が、代表モーションベクトルになる。そして、先行技術2による代表モーションベクトルMVが実際動きベクトルTMVに近づいた程度を示すEDは、4.95になる。
また、先行技術3によって、候補モーションベクトルそれぞれに該信頼度を乗算して合算した加重和演算結果を代表モーションベクトルと選定する場合には、候補モーションベクトルのうち信頼度が最も高い2つのモーションベクトルである#2、#4それぞれの位置である(−4,2)、(5,2)に、それぞれの信頼度である0.3、0.5を加重値として加重和演算した結果である(1.3,1.6)が代表モーションベクトルになる。そして、先行技術3による代表モーションベクトルMVが実際動きベクトルTMVに近づいた程度を示すEDは、6.45になる。
このように、先行技術1ないし3によって算出された代表モーションベクトルのEDは、それぞれ10.12、4.92、6.45と非常に高い値を持つ。これは、例えば、代表モーションベクトルの選定時にそれぞれの信頼度を考慮せず、単純に中間値(median)である(−4,2)に算定する場合に算出されるEDが2.23である点と比べても、相対的に高い値を持つという点からみれば、代表モーションベクトルの予測性能が多少落ちるという点が確認できる。
図4Cを参照すれば、本実施形態による候補モーションベクトル#1、#2、#3、#4は、図4Aに図示された実施形態と同様に、(−7,3)、(−4,2)、(−4,−2)、(5,2)の位置をそれぞれ持ち、それぞれの信頼度として0.2、0.3、0.1、0.5が設定される。
そして、候補モーションベクトルそれぞれの隣接モーションベクトルは、候補モーションベクトルそれぞれとのEDが4以下である他の候補モーションベクトルと仮定する。
これによって、候補モーションベクトル#1の隣接モーションベクトルとして#2、#3が探索され、候補モーションベクトル#2の隣接モーションベクトルとして#1、#3が探索され、候補モーションベクトル#3の隣接モーションベクトルとして#1、#2が探索され、候補モーションベクトル#4の隣接モーションベクトルは探索されない。
このような候補モーションベクトル及び隣接モーションベクトルの位置、候補モーションベクトル及び隣接モーションベクトル信頼度を加重和演算して位置補正した候補モーションベクトルの位置は、それぞれ(−5,0.167)、(−5,0.167)、(−5,0.167)、(5,2)である。
さらに、このように位置補正された候補モーションベクトルの信頼度及び隣接モーションベクトルの数に基づいて、候補モーションベクトル#1、#2、#3、#4それぞれのスコアを算定した結果は、それぞれ3.2、3.3、3.1、0.5である。この時、スコア算定に適用したスコア加重値定数値Wは、下記の数式7によって算出される。
ここで、Cは、候補モーションベクトルそれぞれの信頼度を示す。
これらのうち最もスコアの高い候補モーションベクトル#2を、代表モーションベクトルMVと選定し、その位置である(−5,0.167)と実際動きベクトルTMVのEDとを計算すれば、0.167が算出され、これは、図4Bに図示された実施形態と比べれば、相対的に非常に低い数値に当たり、本実施形態による代表動き予測方法の予測性能に優れたことを示す。
図5A及び図5Bは、従来の代表動き予測技術に比べて、本発明による代表動き予測方法が改善された性能を持つという主張を裏付けるために行った代表動き予測実験結果を例示する図面であり、総4段階の多様な程度のノイズを持つ映像noise#1、noise#2、noise#3、noise#4について、先行技術1ないし3及び本発明による代表動き予測技術をそれぞれ適用し、その代表動き予測性能を分析した結果の一部を例示する。本実験例では、代表動き予測を行った対象として、noise#4、noise#3、noise#2、noise#1の順にノイズのひどい映像を使ったことを前提とする。
先ず、図5Aは、テスト映像のうち二番目にノイズのひどい映像noise#2について、先行技術1ないし3及び本発明(score)による代表動き予測技術をそれぞれ適用した結果を例示する。
図5Aに図示されたグラフのX軸は、テンプレートサイズを意味し、先行技術1ないし3及び本発明による代表動き予測技術のように、複数の候補モーションベクトルに基づいて代表モーションベクトルを算出する技術の場合には、一般的にテンプレートサイズが大きくなるほど代表動きを予測する性能が向上する。
また、図5Aに図示されたグラフのY軸は、平均ED(Average Euclidiean Distance)を意味し、これは、該映像フレームの被写体などについて実際に肉眼で確認して測定した実際動きと、先行技術1ないし3及び本発明によって予測された代表動きとの平均EDを意味し、本数値が小さいほど、さらに正確に代表動きを予測したと分かる。
図5Aを参照すれば、テスト映像のうち二番目にノイズのひどい映像noise#2に対して、先行技術1ないし3及び本発明(score)による代表動きを予測した結果を比べれば、本発明及び先行技術2街相対的に先行技術1及び3より優れた予測性能を持つということが分かる。
併せて、本発明及び先行技術2は、最も性能の劣るテンプレートサイズである100と、最も性能の向上したテンプレートサイズである250、300とでは、互いに類似した性能を持つと示されたが、それ以外のテンプレートサイズ区間、すなわち、性能が中間程度である区間では、本発明による代表動き予測が先行技術2より相対的に優れた性能を持つということが分かる。
図5Bは、図5Aによる実験結果で最も性能の劣るテンプレートサイズと、最も性能の向上したテンプレートサイズとで互いに類似した性能を持つ本発明及び先行技術2を、それぞれテスト映像のうち最もノイズのひどい映像noise#1及び最もノイズの少ない映像noise#4に適用した結果を例示する。
図5Bを参照すれば、ノイズのひどい映像noise#1についての代表動き予測が、ノイズの少ない映像についての代表動き予測より全般的に優れた性能を持つということが分かり、本発明と先行技術2とを比べれば、大部分のテンプレート区間について本発明が優れた性能を持つということが分かる。
このように、本発明によって代表動き予測を行えば、従来の代表動き予測技術より優れた性能を提供する。
特に、候補モーションベクトルの抽出に使うテンプレートのサイズが小さな場合のように、候補モーションベクトルを抽出する性能が相対的に落ちる場合にも、相対的に優れた性能を提供する。
また、悪天候、ネットワークカメラの通信速度の制約、熱画像カメラ自体のノイズ、焦点はずれなどによって撮影映像の画質が低下した場合にも、相対的に優れた性能で代表動きを獲得する。
あわせて、映像フレームの互いに異なる領域を限定する複数のテンプレートを適用して候補モーションベクトルを抽出し、これらそれぞれの信頼度に基づいて代表動きを予測することで、撮影映像内に動く物体があっても、動く物体によって影響されていない他の領域のテンプレートによる候補モーションベクトルに基づいて代表動きを予測できるようになって、動く物体による影響を相対的に少なく受けるようになる。
さらに、本発明による映像の代表動き予測方法は、撮影映像の安定化だけではなく、H.264などの動画圧縮技術や、動画内の対象探知及び粒子追跡(Particle Filter)などにも適用でき、当業者ならば、本発明による映像の代表動き予測方法を参照及び/または変形して動き予測機能を含む多様な形態の映像処理方法を類推できる。よって、本発明は、本図面に図示された実施形態から類推できるあらゆる映像処理方法を含み、本図面に図示された実施形態だけに限定されない。
本発明による映像の代表動き予測方法は、コンピュータで読み取り可能な記録媒体にコンピュータで読み取り可能なコードとして具現できる。コンピュータで読み取り可能な記録媒体は、コンピュータシステムによって読み取られるデータが保存されるあらゆる種類の記録装置を含む。コンピュータで読み取り可能な記録媒体の例としては、ROM、RAM、CD−ROM、磁気テープ、フロッピー(登録商標)ディスク、光データ保存装置などがある。また、コンピュータで読み取り可能な記録媒体は、ネットワークに連結されたコンピュータシステムに分散され、分散方式でコンピュータで読み取り可能なコードが保存されて実行される。そして、本発明を具現するための機能的なプログラム、コード及びコードセグメントは、本発明が属する技術分野のプログラマーによって容易に推論される。
本発明は、添付した図面に図示された一実施形態を参照して説明されたが、これは例示的なものに過ぎず、当業者ならば、これ以外にも多様な変形及び均等な他の実施形態が可能であるという点を理解できるであろう。よって、本発明の真の保護範囲は特許請求の範囲のみによって定められねばならない。
本発明は、デジタル映像処理装置関連の技術分野に好適に用いられる。
10:レンズ
11:レンズ駆動部
20:絞り
21:絞り駆動部
30:撮像素子
31:撮像素子制御部
40:アナログ/デジタル変換部
50:デジタル信号処理部
51:テンプレートモーションベクトル獲得部
52:位置補正部
53:スコア演算部
54:代表動き予測部
55:安定化部
60:メモリ
70:記録媒体
71:保存/判読制御部
80:ディスプレイ部
81:ディスプレイ制御部
100:CPU
200:操作部

Claims (7)

  1. 撮影映像の映像フレームを、前記映像フレーム内の互いに異なる領域に対する複数のテンプレートにマッチングし、前記テンプレートにそれぞれ対応するテンプレートモーションベクトルを獲得するテンプレートモーションベクトル獲得部と、
    前記獲得されたテンプレートモーションベクトルそれぞれについて、テンプレートモーションベクトル及びテンプレートモーションベクトルに対応する少なくとも1つの隣接モーションベクトルそれぞれの信頼度を加重値とする加重和をテンプレートモーションベクトル及び少なくとも1つの隣接モーションベクトルそれぞれの信頼度の和で除し、前記テンプレートモーションベクトルそれぞれの位置を補正する位置補正部と、
    前記テンプレートモーションベクトルそれぞれについて、テンプレートモーションベクトルの信頼度に、前記テンプレートモーションベクトルに対応する少なくとも1つの隣接モーションベクトルの数の二乗に所定の定数値を加重値として適用した結果を加えて、前記テンプレートモーションベクトルそれぞれのスコアを算出するスコア演算部と、
    前記算出されたスコアに基づいて、前記テンプレートモーションベクトルから前記映像フレームを代表する代表モーションベクトルを選定する代表動き予測部と、
    を備えることを特徴とするデジタル映像処理装置。
  2. 前記隣接モーションベクトルは、前記隣接モーションベクトルに対応するテンプレートモーションベクトルとのユークリッド距離がしきい値より小さなモーションベクトルであることを特徴とする請求項1に記載のデジタル映像処理装置。
  3. 前記代表モーションベクトルに基づいて、前記映像フレームを含む撮影映像を安定化させる安定化部をさらに備えることを特徴とする請求項1に記載のデジタル映像処理装置。
  4. 撮影映像の映像フレームを、前記映像フレーム内の互いに異なる領域に対する複数のテンプレートにマッチングし、前記テンプレートにそれぞれ対応するテンプレートモーションベクトルを獲得する段階と、
    前記獲得されたテンプレートモーションベクトルそれぞれについて、テンプレートモーションベクトル及びテンプレートモーションベクトルに対応する少なくとも1つの隣接モーションベクトルそれぞれの信頼度を加重値とする加重和をテンプレートモーションベクトル及び少なくとも1つの隣接モーションベクトルそれぞれの信頼度の和で除し、前記テンプレートモーションベクトルそれぞれの位置を補正する段階と、
    前記テンプレートモーションベクトルそれぞれについて、テンプレートモーションベクトルの信頼度に、前記テンプレートモーションベクトルに対応する少なくとも1つの隣接モーションベクトルの数の二乗に所定の定数値を加重値として適用した結果を加えて、前記テンプレートモーションベクトルそれぞれのスコアを算出する段階と、
    前記算出されたスコアに基づいて、前記テンプレートモーションベクトルから前記映像フレームを代表する代表モーションベクトルを選定する段階と、
    を含むことを特徴とする映像の代表動き予測方法。
  5. 前記隣接モーションベクトルは、前記隣接モーションベクトルに対応するテンプレートモーションベクトルとのユークリッド距離がしきい値より小さなモーションベクトルであることを特徴とする請求項に記載の映像の代表動き予測方法。
  6. 前記代表モーションベクトルに基づいて、前記映像フレームを含む撮影映像を安定化させる段階をさらに含むことを特徴とする請求項に記載の映像の代表動き予測方法。
  7. 請求項ないしのいずれか1項に記載の方法をコンピュータに実行させるためのプログラムを記録したコンピュータで読み取り可能な記録媒体。
JP2013261012A 2012-12-21 2013-12-18 デジタル映像処理装置及び映像の代表動き予測方法 Active JP6339358B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR1020120151346A KR101783990B1 (ko) 2012-12-21 2012-12-21 디지털 영상 처리 장치 및 영상의 대표 움직임 예측 방법
KR10-2012-0151346 2012-12-21

Publications (2)

Publication Number Publication Date
JP2014123359A JP2014123359A (ja) 2014-07-03
JP6339358B2 true JP6339358B2 (ja) 2018-06-06

Family

ID=50974200

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013261012A Active JP6339358B2 (ja) 2012-12-21 2013-12-18 デジタル映像処理装置及び映像の代表動き予測方法

Country Status (3)

Country Link
US (1) US9036033B2 (ja)
JP (1) JP6339358B2 (ja)
KR (1) KR101783990B1 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9712818B2 (en) * 2013-01-11 2017-07-18 Sony Corporation Method for stabilizing a first sequence of digital image frames and image stabilization unit
JP7009252B2 (ja) * 2018-02-20 2022-01-25 キヤノン株式会社 画像処理装置、画像処理方法およびプログラム
CN110337810B (zh) * 2018-04-02 2022-01-14 北京大学 用于视频处理的方法和设备
CN109191496B (zh) * 2018-08-02 2020-10-02 阿依瓦(北京)技术有限公司 一种基于形状匹配的运动预测方法

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08251474A (ja) * 1995-03-15 1996-09-27 Canon Inc 動きベクトル検出装置,動きベクトル検出方法,画像ぶれ補正装置,画像追尾装置及び撮像装置
KR100865034B1 (ko) 2002-07-18 2008-10-23 엘지전자 주식회사 모션 벡터 예측 방법
KR100579493B1 (ko) * 2003-06-16 2006-05-15 삼성전자주식회사 움직임 벡터 생성 장치 및 방법
GB0425430D0 (en) 2004-11-18 2004-12-22 Mitsubishi Electric Inf Tech Dominant motion analysis
JP4755490B2 (ja) * 2005-01-13 2011-08-24 オリンパスイメージング株式会社 ブレ補正方法および撮像装置
JP4623368B2 (ja) * 2005-03-16 2011-02-02 ソニー株式会社 移動物体検出装置、移動物体検出方法及びプログラム
US7605845B2 (en) * 2005-04-28 2009-10-20 Texas Instruments Incorporated Motion stabilization
US7840085B2 (en) * 2006-04-06 2010-11-23 Qualcomm Incorporated Electronic video image stabilization
KR100891768B1 (ko) * 2007-05-02 2009-04-07 삼성전자주식회사 모션 벡터 탐색 방법
US8204125B2 (en) * 2007-11-28 2012-06-19 Tsai Sheng Group Llc Fast motion estimation in scalable video coding
US8175160B1 (en) * 2008-06-09 2012-05-08 Nvidia Corporation System, method, and computer program product for refining motion vectors
JP2009302731A (ja) * 2008-06-11 2009-12-24 Olympus Corp 画像処理装置、画像処理プログラム、画像処理方法、および電子機器
US8179446B2 (en) * 2010-01-18 2012-05-15 Texas Instruments Incorporated Video stabilization and reduction of rolling shutter distortion
US8488007B2 (en) * 2010-01-19 2013-07-16 Sony Corporation Method to estimate segmented motion
JP2011217044A (ja) * 2010-03-31 2011-10-27 Sony Corp 画像処理装置、画像処理方法および画像処理プログラム
US8797414B2 (en) 2010-12-23 2014-08-05 Samsung Electronics Co., Ltd. Digital image stabilization device
US9824426B2 (en) * 2011-08-01 2017-11-21 Microsoft Technology Licensing, Llc Reduced latency video stabilization
TWI456984B (zh) * 2011-10-24 2014-10-11 Univ Nat Central 視訊穩定系統及其方法
US9609217B2 (en) * 2011-11-02 2017-03-28 Mediatek Inc. Image-based motion sensor and related multi-purpose camera system
WO2013095180A1 (en) * 2011-12-22 2013-06-27 Intel Corporation Complexity scalable frame rate up-conversion

Also Published As

Publication number Publication date
US20140176740A1 (en) 2014-06-26
KR101783990B1 (ko) 2017-10-10
US9036033B2 (en) 2015-05-19
KR20140081511A (ko) 2014-07-01
JP2014123359A (ja) 2014-07-03

Similar Documents

Publication Publication Date Title
US10404917B2 (en) One-pass video stabilization
JP4755490B2 (ja) ブレ補正方法および撮像装置
JP6395506B2 (ja) 画像処理装置および方法、プログラム、並びに撮像装置
US9055217B2 (en) Image compositing apparatus, image compositing method and program recording device
JP2007166578A (ja) 画像振動補償装置とその方法
JP2012151796A (ja) 画像処理装置と画像処理方法およびプログラム
JP6339358B2 (ja) デジタル映像処理装置及び映像の代表動き予測方法
US8994838B2 (en) Motion adaptive cropping for video stabilization
US20170150054A1 (en) Image pickup apparatus for detecting moving amount of main subject or background, method for controlling image pickup apparatus, and storage medium
US10705408B2 (en) Electronic device to autofocus on objects of interest within field-of-view of electronic device
US11394870B2 (en) Main subject determining apparatus, image capturing apparatus, main subject determining method, and storage medium
CN113438409B (zh) 延迟校准方法、装置、计算机设备和存储介质
US9883105B2 (en) Image processing apparatus and control method thereof
JP6631190B2 (ja) 画像評価装置、画像評価方法及びプログラム
JP6316030B2 (ja) 撮像装置及びその制御方法
JP5868197B2 (ja) ノイズ低減装置およびその制御方法
CN115272088A (zh) 图像处理方法、图像处理器、电子设备及存储介质
US20130236055A1 (en) Image analysis device for calculating vector for adjusting a composite position between images
JP6668700B2 (ja) 撮影装置、画像評価方法及びプログラム
JP2014216830A (ja) 画像追尾装置、画像追尾方法及びプログラム
US20240233234A1 (en) Image processing apparatus, image processing method, non-transitory computer-readable storage medium
JP7292145B2 (ja) 回転半径演算装置および回転半径演算方法
JP6763826B2 (ja) 画像生成装置、画像生成方法及びプログラム
JP2018072941A (ja) 画像処理装置、画像処理方法、プログラム、記憶媒体
JP2019062528A (ja) 画像処理方法、画像処理装置、撮像装置、およびプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20161021

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20171106

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180131

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20180416

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20180510

R150 Certificate of patent or registration of utility model

Ref document number: 6339358

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R371 Transfer withdrawn

Free format text: JAPANESE INTERMEDIATE CODE: R371

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250