JP5578965B2 - オブジェクト推定装置および方法ならびにプログラム - Google Patents

オブジェクト推定装置および方法ならびにプログラム Download PDF

Info

Publication number
JP5578965B2
JP5578965B2 JP2010151865A JP2010151865A JP5578965B2 JP 5578965 B2 JP5578965 B2 JP 5578965B2 JP 2010151865 A JP2010151865 A JP 2010151865A JP 2010151865 A JP2010151865 A JP 2010151865A JP 5578965 B2 JP5578965 B2 JP 5578965B2
Authority
JP
Japan
Prior art keywords
image
difference
images
generated
smoothed
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2010151865A
Other languages
English (en)
Other versions
JP2012014554A (ja
Inventor
誠 與那覇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Corp
Original Assignee
Fujifilm Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujifilm Corp filed Critical Fujifilm Corp
Priority to JP2010151865A priority Critical patent/JP5578965B2/ja
Priority to US13/175,478 priority patent/US8634676B2/en
Publication of JP2012014554A publication Critical patent/JP2012014554A/ja
Application granted granted Critical
Publication of JP5578965B2 publication Critical patent/JP5578965B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/70Determining position or orientation of objects or cameras
    • G06T7/73Determining position or orientation of objects or cameras using feature-based methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20016Hierarchical, coarse-to-fine, multiscale or multiresolution image processing; Pyramid transform
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20212Image combination
    • G06T2207/20221Image fusion; Image merging

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)

Description

本発明は、画像内のオブジェクトの位置・サイズを推定するオブジェクト推定装置および方法ならびにプログラムに関する。
画像内の顔や人物等の特定のオブジェクトを検出する方法として、イメージピラミッドを用いた検出方法が提案されている(たとえば特許文献1、2参照)。特許文献1、2において、画像とガウシアンフィルタとの畳み込みを繰り返し行うことによりスケールの異なる複数の平滑化画像が生成される。次に、隣接するスケールの平滑化画像間の差分画像が生成される(DOG画像:difference of Gaussian)。このDOG画像の生成が解像度の異なる複数の多重解像度画像毎に生成される。そしてDOG画像の極大値および極小値を検出することによりオブジェクトの位置が検出されるとともに、多重解像度画像内のオブジェクト大きさが検出される。
また、オブジェクトの特性に合わせたガウシアンフィルタを用いてオブジェクト領域を推定する方法が提案されている(たとえば特許文献3参照)。特許文献3には、検出対象の輪郭形状に合わせたフィルタ特性を有するガウシアンフィルタを用いてフィルタリング処理を行い、検出したい輪郭形状を有する領域を強調しそれ以外の領域を抑制することにより、オブジェクトを検出することが開示されている。
特開2010−9599号公報 特開2008−257649号公報 特開2003−248824号公報
しかし、特許文献1、2において、隣接するスケール同士の差分画像を生成しなければならないため多数の解像度画像毎に差分画像を生成しなければならず、処理の高速化が図れないという問題がある。また、特許文献3のように輪郭形状に基づくガウシアンフィルタ処理を行っただけでは精度良くオブジェクトを検出することができないという問題がある。
そこで、本発明は、高速に精度良くオブジェクトを推定することができるオブジェクト推定装置および方法ならびにプログラムを提供することを目的とするものである。
本発明のオブジェクト推定装置は、オブジェクトの輪郭形状に対応したフィルタ特性を有する平滑化フィルタを画像に畳み込むことを繰り返すことにより、スケールの異なる複数の平滑化画像を生成する平滑化処理手段と、平滑化処理手段により生成された複数の平滑化画像のうち、所定のスケールだけ離れた平滑化画像間の差分を算出した差分画像を複数生成する差分画像生成手段と、差分画像生成手段により生成された複数の差分画像を合算して合算画像を生成する合算手段と、合算手段により生成された合算画像から信号値が最大もしくは最小になる位置からオブジェクトの位置を推定する位置推定手段とを備えたことを特徴とするものである。
本発明のオブジェクト推定方法は、オブジェクトの輪郭形状に対応したフィルタ特性を有する平滑化フィルタを画像に畳み込むことを繰り返すことにより、スケールの異なる複数の平滑化画像を生成し、生成した複数の平滑化画像のうち、所定のスケールだけ離れた平滑化画像間の差分を算出した差分画像を複数生成し、生成した複数の差分画像を合算して合算画像を生成し、生成した合算画像から信号値が最大もしくは最小になる位置からオブジェクトの位置を推定することを特徴とするものである。
本発明のオブジェクト推定プログラムは、コンピュータに、オブジェクトの輪郭形状に対応したフィルタ特性を有する平滑化フィルタを画像に畳み込むことを繰り返すことにより、スケールの異なる複数の平滑化画像を生成する手順と、生成した複数の平滑化画像のうち、所定のスケールだけ離れた平滑化画像間の差分を算出した差分画像を複数生成する手順と、生成した複数の差分画像を合算して合算画像を生成する手順と、生成した合算画像から信号値が最大もしくは最小になる位置からオブジェクトの位置を推定する手順とを実行させることを特徴とするものである。
ここで、画像に対し平滑化フィルタを畳み込むことを繰り返すとは、平滑化処理後の画像に対し平滑化フィルタをさらに畳み込む作業を複数回繰り返すことを意味する。
なお、平滑化フィルタは、たとえばガウシアンフィルタを用いてもよく、特に、オブジェクトの輪郭形状に合ったフィルタ特性を有する平滑化フィルタであってもよい。
なお、平滑化処理手段は、a×k枚の平滑化画像L(x,y,σ)(σは平滑化フィルタのスケールであってi=1〜a×k)を生成するものであってもよい。このとき、差分画像生成手段は、所定のスケールだけ離れた平滑化画像間の差分を算出した差分画像を複数生成するものであればよく、たとえばa×k枚の平滑化画像L(x,y,σ)を用いて式(1)によりk枚の差分画像G(x,y,σ)を生成するものであってもよい。
G(x,y,σ)=L(x,y,σ)−L(x,y,σi×a)・・・(1)
または、平滑化処理手段がk枚の前記平滑化画像L(x,y,σ)(kは2以上の整数、σは平滑化フィルタのスケールであってi=1〜k)を生成するものであり、差分画像生成手段がk枚の平滑化画像L(x,y,σ)を用いて下記式(2)によりk−p枚(pは1以上の整数)の差分画像G(x,y,σ)を生成するものであってもよい。
G(x,y,σ)=L(x,y,σ)−L(x,y,σi+p)・・・(2)
このとき、サイズ推定手段は、最も大きいもしくは最も小さい差分値を有する差分画像G(x,y,σ)を生成した平滑化画像L(x,y,σ)内のボケの広がり度合いに基づいてオブジェクトのサイズを推定するものであってもよい。
さらに、入力された原画像に対し解像度を低くした画像を生成する前処理手段をさらに備えたものであってもよい。また、画像が動画像であり、動画像に基づいてフレーム画像内から動きのある動き領域を抽出するとともに背景差分を行い、さらにコントラスト低減処理を施す前処理手段をさらに備えたものであってもよい。
合算手段は複数の差分画像を合算して合算画像を生成するものであればよく、すべての差分画像を用いて合算画像を生成してもよいし、オブジェクトのサイズ変動幅に応じて複数の差分画像の中から差分画像を選択して合算画像を生成するようにしてもよい。
また、位置推定手段50およびサイズ推定手段60は、検出対象のオブジェクトに応じて最大値もしくは最小値のいずれかを用いるかを決定し位置推定およびサイズ推定を行うようにしてもよい。オブジェクトが背景に比べて信号値が大きい場合には(たとえばオブジェクトが白、背景領域が黒)最大値を用いればよいし、オブジェクトが背景に比べて信号値が小さい場合には(たとえばオブジェクトが黒、背景領域が白)最小値を用いればよい。
また、オブジェクト推定装置は、位置推定手段により推定されたオブジェクトの位置またはサイズ推定手段により推定されたオブジェクトのサイズに基づいて画像内からオブジェクトを検出するオブジェクト検出手段をさらに備えていてもよい。
本発明のオブジェクト推定装置および方法ならびにプログラムによれば、オブジェクトの輪郭形状に対応したフィルタ特性を有する平滑化フィルタを画像に畳み込むことを繰り返すことにより、スケールの異なる複数の平滑化画像を生成し、生成した複数の平滑化画像のうち、所定のスケールだけ離れた平滑化画像間の差分を算出した差分画像を複数生成し、生成した複数の差分画像を合算して合算画像を生成し、生成した合算画像から信号値が最大もしくは最小になる位置からオブジェクトの位置を推定することにより、高速に精度良くオブジェクトの位置を推定することができる。
なお、差分画像生成手段により生成された複数の差分画像のうち最も大きいもしくは最も小さい差分値を有する差分画像からオブジェクトのサイズを推定するサイズ推定手段をさらに備えたものであるとき、従来のように多重解像度画像を生成しなくてもオブジェクトのサイズの推定が可能になり、効率的にオブジェクトのサイズを推定することができる。
また、平滑化処理手段がa×k枚の平滑化画像L(x,y,σ)(aは2以上の整数、σは平滑化フィルタのスケールであってi=1〜a×k)を生成するものであり、差分画像生成手段がa×k枚の平滑化画像L(x,y,σ)を用いて式(1)によりk枚(kは2以上の整数)の差分画像G(x,y,σ)を生成するものであれば、オブジェクトの位置およびサイズの推定を精度良く行うことができる。
さらに、入力された原画像に対し解像度を低くした画像を生成する前処理手段をさらに備えたものであれば、解像度をある程度低くしても検出精度を落とさずに検出処理の高速化を行うことができる。
また、位置推定手段により推定されたオブジェクトの位置に基づいて画像内からオブジェクトを検出するオブジェクト検出手段をさらに備えたものであれば、位置推定手段により推定された位置の周辺部位に対し重点的にオブジェクトの検出を行い、さらに精度良く効率的にオブジェクトの検出を行うことができる。
本発明のオブジェクト推定装置の好ましい実施形態を示すブロック図 図1の前処理手段により前処理された画像の一例を示す模式図 図1の平滑化処理手段および差分画像生成手段により生成される複数の平滑化画像および差分画像のイメージピラミッドの一例を示す模式図 図1の平滑化処理手段に用いられる平滑化フィルタ(ガウシアンフィルタ)の一例を示す図 図1の平滑化処理手段に用いられる平滑化フィルタ(ガウシアンフィルタ)の他の一例を示す模式図 図1の合算手段により生成される合算画像の一例を示す模式図 図1のスケールが大きくなるほどオブジェクト領域がぼけて広がっていく様子を示す模式図 画像内において検出対象であるオブジェクトが変動する様子を示す模式図 本発明のオブジェクト推定方法の好ましい実施形態を示すフローチャート
以下、図面を参照して本発明の実施の形態を詳細に説明する。図1は本発明のオブジェクト推定装置の好ましい実施形態を示すブロック図である。なお、図1のようなオブジェクト推定装置1の構成は、補助記憶装置に読み込まれたオブジェクト推定プログラムをコンピュータ(たとえばパーソナルコンピュータ等)上で実行することにより実現される。また、このオブジェクト推定プログラムは、CD−ROM等の情報記憶媒体に記憶され、もしくはインターネット等のネットワークを介して配布され、コンピュータにインストールされることになる。
図1のオブジェクト推定装置1は、たとえば動画像内の人物の頭部をオブジェクトとして検出するものであって、前処理手段10、平滑化処理手段20、差分画像生成腫だ30、合算手段40、位置推定手段50、サイズ推定手段60、照合手段70を備えている。
前処理手段10は、入力された動画像に対し前処理を施すものであって、解像度変換手段11と動き領域抽出手段12とを備えている。解像度変換手段11は動画像の解像度を低くするものであって、たとえば入力画像の1/8×1/8の画素数になるように画像を縮小する。オブジェクトを推定するのに必要十分な解像度まで原画像の解像度を低くすることにより、処理の高速化を図ることができる。
動き領域抽出手段12は、動画像を構成する所定のフレーム画像から動き領域を抽出する。ここで、動き領域の抽出方法としてたとえば背景画像やフレーム間画像の差分を算出する方法等公知の技術を用いることができる。さらに、動き領域抽出手段12は、図2に示すように動き領域を白、背景領域を黒にするようなグレースケール化処理もしくは2値化処理を行う機能を有している。
図1の平滑化処理手段20は、前処理手段10により前処理された画像P(x,y)に平滑化フィルタを畳み込むことを繰り返し、スケールσの異なる複数の平滑化画像L(x,y,σ)を生成するものである。つまり、平滑化処理手段20は、画像P(x,y)に対し平滑化フィルタを畳み込むことにより平滑化画像L(x,y,σ)を作成し、この平滑化画像L(x,y,σ)に対しさらに平滑化フィルタを畳み込むことによりスケールσi+1の平滑化画像L(x,y,σi+1)を作成する。平滑化処理手段20はこの作業を繰り返すことにより、図3に示すように、平滑化処理手段20はスケールσ(i=1〜a×k)の異なるa×k枚(たとえばa=2、a×k=60枚)の平滑化画像L(x,y,σ)を生成する。
ここで、平滑化フィルタとしてたとえばガウシアンフィルタが用いられる。特に平滑化フィルタは図4に示すように検出対象であるオブジェクト(人物の頭部)の形状に合わせたフィルタ特性になるような3×3オペレータからなるものであって、人物の頭部の形状に沿って下側のフィルタ係数が小さくなる特性(オメガ形状)を有している。このような平滑化フィルタを用いると、人物の頭部の輪郭形状を有する領域は強調され、それ以外の領域は抑制された平滑化処理が行われることになる。なお、フィルタの形状は図4の場合に限らずたとえば特開2003−248824号公報等その他の公知の技術を用いることができ、たとえば図5に示すように、オブジェクト形状がそれぞれ円形、三角形、四角形の場合には当該オブジェクト形状に合わせたフィルタ特性を有する平滑化フィルタを用いて平滑化処理が施される。
図1の差分画像生成手段30は、平滑化処理手段20により生成された複数の平滑化画像L(x,y,σ)について、スケールσが所定の値だけ離れた平滑化画像間の差分を差分画像G(x,y,σ)として複数生成するものである。具体的には、差分画像生成手段30は下記式(1)を用いてk枚の差分画像G(x,y,σ)を生成する。
G(x,y,σ)=L(x,y,σ)−L(x,y,σi×a)・・・(1)
なお、式(1)において差分値の絶対値を差分画像G(x,y,σ)としてもよい。
式(1)からわかるように、差分画像G(x,y,σ)は所定のスケールσとσi×aとの平滑化画像L間の差分からなるものである。たとえば、a=2、a×k=60枚である場合、スケールσとσ、スケールσとσ、スケールσとσ、・・・、スケールσ30とσ60の組み合わせからなる30枚の差分画像G(x,y,σ)が生成される。そして、合算手段40は、差分画像生成手段30により生成された複数の差分画像G(x,y,σ)を合算し、図6に示す合算画像AP(x,y)を生成する。なお、a=2である場合について例示しているが、aは2以上であればよく、a=3等であってもよい。
なお、スケールσとσi×aの平滑化画像L(x,y,σ)の組み合わせによる差分画像G(x,y,σ)を生成する場合について例示しているが、スケールσ、σi+p(pは1以上の整数)の平滑化画像L(x,y,σ)の組み合わせにより差分画像G(x,y,σ)を生成するようにしてもよい。
G(x,y,σ)=L(x,y,σ)−L(x,y,σi+p)・・・(2)
図1の位置推定手段50は、合算手段40により生成された合算画像AP(x,y)のうち信号値が最大になる位置(xmax,ymax)からオブジェクトの位置を推定するものであり、サイズ推定手段60は、複数の差分画像G(x,y,σ)のうち最も大きい差分値を有する差分画像G(x,y,σ)からオブジェクトのサイズを推定するものである。言い換えれば、差分画像生成手段30が式(1)または(2)によりオブジェクトの顕著性を数値化し、位置推定手段50およびサイズ推定手段60は数値化された顕著性に基づいてオブジェクトの位置およびサイズを推定する。
まず、上述した平滑化処理はオブジェクト形状に合わせたフィルタ特性を有する平滑化フィルタσを用いて行われるため、平滑化画像L(x,y,σ)は特定の形状を持つ領域が強調され他の領域が抑制された画像となる。また、平滑化処理を数十回行ったとしても平滑化画像内にオブジェクトの輪郭成分が残るが、図7に示すようにスケールiが大きくなればなるほどオブジェクトの領域はボケていくとともに広がっていく。
ここで、画像内のオブジェクトの形状およびサイズは所定の平滑化画像L(x,y,σ)におけるオブジェクトの形状およびサイズであると仮定する。さらに、この平滑化画像L(x,y,σ)でのオブジェクト形状およびサイズの顕著性を算出するために、平滑化画像L(x,y,σ)から所定のスケールだけ離れた平滑化画像L(x,y,σi×a)を背景として設定する(図5参照)。そして、上記式(1)または(2)により差分画像G(x,y,σ)が所定のスケールiの平滑化画像L(x,y,σ)におけるオブジェクトの顕著性として算出される。
ここで、画像内においてオブジェクトが理想形状(フィルタ特性に最も合致した形状)であって背景にノイズがない差分画像G(x,y,σ)が他の差分画像G(x,y,σ)に比べて最大の信号値を有するものとなる。つまり、前処理済みの画像P(x,y)内のオブジェクトを構成する各画素の成分がオブジェクトの領域にほぼ等しくなるまで広がったとき差分画像G(x,y,σ)内の差分値は最大となる。たとえば画像P(x,y)内のオブジェクトが図5に示すような直径10画素の円形形状からなる場合、複数の差分画像G(x,y,σ)のうちi=10の差分画像G(x,y,σ10)(=L(x,y,σ10)−L(x,y,σ20))が他の差分画像に比べて最も大きい差分値を有することになる。
一方で、実際に画像Pに映し出されるオブジェクトはカメラとオブジェクトとの位置関係や個体差等により写り方が異なるものであって、図8に示すように、輪郭形状およびサイズは上述した理想形状の場合だけでなく変動する。そこで、位置推定手段50は、上述した複数の差分画像G(x,y,σ)を合算した合算画像AP(x,y)を用いて位置を推定する。これにより、オブジェクトの変動を吸収しながらオブジェクトの位置を推定することができる。つまり、小さいオブジェクト(頭部)から大きいオブジェクト(頭部)に含まれる様々な輪郭形状の変動を持つオブジェクトに対して、加算処理により算出した合算画像AP(x,y)から最大値を検出することにより、変動を吸収しながら位置推定の処理が可能となる。
なお、合算手段60は、すべての差分画像G(x,y,σ)を加算処理する場合について例示しているが、吸収したいサイズ変動幅に応じて加算処理に用いる差分画像G(x,y,σ)を変更するようにしてもよい。たとえばオブジェクトの種類に応じて吸収したいサイズ変動幅を設定しておき、あるオブジェクトではi=1、2の差分画像G(x,y,σ)は加算処理に用いず、i=3〜k枚の差分画像G(x,y,σ)を加算処理することにより合算画像AP(x,y)を作成するようにしてもよい。同様にi=k−q(qは1以上の整数)〜k枚の差分画像G(x,y,σ)は加算処理に用いず、i=1〜(k−q−1)枚の差分画像G(x,y,σ)を加算処理するようにしてもよい。
また、上述したように上記式(1)、(2)におけるスケールiは、画像P内における検出対象のオブジェクトのサイズに対応するパラーメータである。オブジェクトが小さい場合にはスケールiが小さい差分画像G(x,y,σ)から最大値が検出され、サイズが大きい場合にはスケールiが大きい差分画像G(x,y,σ)から最大値が検出される。この性質を利用し、サイズ推定手段60は、複数の差分画像G(x,y,σ)のうち最も大きい差分値を有する差分画像G(x,y,σ)を検出し、検出した差分画像G(x,y,σ)のスケール、すなわち平滑化処理の繰り返し回数からオブジェクトのサイズを推定する。
なお、サイズ推定手段60は、複数の差分画像G(x,y,σ)の中から最大差分値を有する差分画像G(x,y,σ)を検出するようにしてもよいし、位置推定手段50により推定されたオブジェクトの位置において最も大きい差分値を検出するようにしてもよい。また、平滑化処理により画像P内の像はどの程度広がるか(ボケるか)は予め既知であるため、スケールiが判明すればオブジェクトのサイズが推定できる。さらに、上述のように検出対象であるオブジェクトは変動するため、最も大きい差分値を有する差分画像G(x,y,σ)から推定したサイズ±α(αは予め設定された値)をオブジェクトのサイズとして推定するようにしてもよい。
また、動き領域抽出手段12は、動き領域(オブジェクト)を白、背景領域を黒にするようなグレースケール化処理もしくは2値化処理を行っているため(図2参照)、上述の位置推定手段50およびサイズ推定手段60は最大値を用いて位置推定およびサイズ推定を行っているが、動き領域抽出手段12が動き領域を黒、背景領域を白にする処理を行った場合、位置推定手段50およびサイズ推定手段60は最小値を用いて最大値を用いて位置推定およびサイズ推定を行うことになる。この場合であっても上述した最大値を用いる場合と同様、オブジェクトの位置およびサイズを推定することができる。
さらに、図1のオブジェクト推定装置1は、位置推定手段50およびサイズ推定手段60により推定されたオブジェクトの位置およびサイズに基づいてオブジェクトを検出するオブジェクト検出手段70をさらに備えている。つまり、オブジェクト検出手段70は、位置推定手段50による推定結果をオブジェクトが存在する確率の高い候補領域として用い、位置推定手段50により特定された位置の周辺領域からオブジェクトの検出を行う。このとき、オブジェクト検出手段70は、サイズ推定手段60による推定結果をオブジェクトのサイズに基づいた検出を行う。なお、オブジェクト検出手段70によるオブジェクトの検出はパターンマッチングやニューラルネットワーク等を用いた公知の技術を用いることができる。
このように、所定のスケールσi×2(あるいはσi×aもしくはσi+p)だけ離れたスケールσ、σi×2間の差分画像を算出するだけでオブジェクトの位置およびサイズを推定することができるため、従来のDOG画像を用いてオブジェクト検出等に比べて差分画像の生成枚数を少なくし、効率的に精度良くオブジェクトの推定を行うことができる。
図9は本発明のオブジェクト推定方法の好ましい実施形態を示すフローチャートであり、図1から図9を参照してオブジェクト推定方法について説明する。まず、動画像が入力された際に、前処理手段10においてダウンサンプリングがなされる。さらに、前処理手段10において動き領域と背景領域とが抽出され、グレースケール化処理等が行われる(ステップST1、図2参照)。
次に、平滑化処理手段20により複数の平滑化画像が生成され(ステップST2、図3参照)、差分画像生成手段30により上記式(1)に基づいて平滑化画像間の差分画像G(x,y,σ)が生成される(ステップST3、図3−5参照)。その後、合算手段40により複数の差分画像G(x,y,σ)が合算された合算画像APが生成され(ステップST4、図6参照)、合算画像APに基づいて位置推定手段50によりオブジェクトが存在する位置が推定される(ステップST5)。さらに、複数の差分画像G(x,y,σ)を用いてサイズ推定手段60によりオブジェクトのサイズが推定される(ステップST6)。その後、オブジェクト検出手段70において推定された位置およびサイズに基づいてオブジェクトの検出が行われる(ステップST7)。
上記実施の形態によれば、画像P(x,y)にオブジェクトの輪郭形状に対応したフィルタ特性を有する平滑化フィルタを畳み込むことを繰り返すことにより複数の平滑化画像L(x,y,σ)を生成し、所定のスケールだけ離れた生成した複数の平滑化画像L(x,y,σ)間の差分を算出して複数の差分画像を生成し、生成した複数の差分画像G(x,y,σ)を合算した合算画像AP(x,y)を生成し、生成した合算画像AP(x,y)から信号値が最大もしくは最小になる位置(xmax,ymax)からオブジェクトの位置を推定することにより、高速に精度良くオブジェクトの位置を推定することができる。
また、差分画像生成手段30により生成された複数の差分画像G(x,y,σ)のうち最も大きい差分値を有する差分画像G(x,y,σ)からオブジェクトのサイズを推定するサイズ推定手段60をさらに備えたものであるとき、従来のように多重解像度画像を生成しなくてもオブジェクトのサイズの推定が可能になり、効率的にオブジェクトのサイズを推定することができる。
さらに、図3に示すように、平滑化処理手段20がa×k枚の平滑化画像L(x,y,σ)(σは平滑化フィルタのスケールであってi=1〜a×k)を生成するものであり、差分画像生成手段がa×k枚の平滑化画像L(x,y,σ)を用いて上記式(1)によりk枚(kは2以上の整数)の差分画像G(x,y,σ)を生成するものであれば、オブジェクトのサイズの様々な変動に合わせたオブジェクトの位置およびサイズの推定を精度良く行うことができる。
また、入力された原画像に対し解像度を低くした画像を生成する前処理手段10をさらに備えたものであれば、解像度をある程度低くしても検出精度を落とさずに検出処理の高速化を行うことができる。
また、位置推定手段50により推定されたオブジェクトの位置に基づいて画像内からオブジェクトを検出するオブジェクト検出手段70をさらに備えたものであれば、位置推定手段50により推定された位置の周辺部位に対し重点的にオブジェクトの検出を行い、さらに精度良く効率的にオブジェクトの検出を行うことができる。
本発明の実施形態は上記実施の形態に限定されない。たとえば、上記実施の形態において、動画像から特定のオブジェクトを検出する場合について例示しているが、静止画からオブジェクトを検出することも可能である。また、オブジェクトが人物の頭部である場合について例示しているが、これに限られず、たとえば顔、車等であってもよい。
1 オブジェクト推定装置
10 前処理手段
20 平滑化処理手段
30 差分画像生成手段
40 合算手段
50 位置推定手段
60 サイズ推定手段
70 オブジェクト検出手段

Claims (13)

  1. オブジェクトの輪郭形状に対応したフィルタ特性を有する平滑化フィルタを画像に畳み込むことを繰り返すことにより、スケールの異なる複数の平滑化画像を生成する平滑化処理手段と、
    該平滑化処理手段により生成された前記複数の平滑化画像のうち、所定のスケールだけ離れた前記平滑化画像間の差分を算出した差分画像を複数生成する差分画像生成手段と、
    該差分画像生成手段により生成された前記複数の差分画像を合算して合算画像を生成する合算手段と、
    該合算手段により生成された合算画像から信号値が最大もしくは最小になる位置を前記オブジェクトが存在する確率の高い位置とする位置推定手段と
    を備えたことを特徴とするオブジェクト推定装置。
  2. 前記差分画像生成手段により生成された前記複数の差分画像のうち最も大きい差分値を有する差分画像から前記オブジェクトのサイズを推定するサイズ推定手段をさらに備えたものであることを特徴とする請求項1記載のオブジェクト推定装置。
  3. 前記平滑化処理手段がa×k枚の前記平滑化画像L(x,y,σ)(aは2以上の整数、σは前記平滑化フィルタのスケールであってi=1〜a×k)を生成するものであり、
    前記差分画像生成手段が前記a×k枚の平滑化画像L(x,y,σ)を用いて下記式(1)によりk枚(kは2以上の整数)の前記差分画像G(x,y,σ)を生成するものであることを特徴とする請求項1記載のオブジェクト推定装置。
    G(x,y,σ)=L(x,y,σ)−L(x,y,σi×a)・・・(1)
  4. 前記平滑化処理手段がk枚の前記平滑化画像L(x,y,σ)(kは2以上の整数、σは前記平滑化フィルタのスケールであってi=1〜k)を生成するものであり、
    前記差分画像生成手段がk枚の前記平滑化画像L(x,y,σ)を用いて下記式(2)によりk−p枚(pは1以上の整数)の前記差分画像G(x,y,σ)を生成するものであることを特徴とする請求項1記載のオブジェクト推定装置。
    G(x,y,σ)=L(x,y,σ)−L(x,y,σi+p)・・・(2)
  5. 前記平滑化処理手段がa×k枚の前記平滑化画像L(x,y,σ )(aは2以上の整数、σ は前記平滑化フィルタのスケールであってi=1〜a×k)を生成するものであり、
    前記差分画像生成手段が前記a×k枚の平滑化画像L(x,y,σ )を用いて下記式(1)によりk枚(kは2以上の整数)の前記差分画像G(x,y,σ )を生成するものであることを特徴とする請求項2記載のオブジェクト推定装置。
    G(x,y,σ )=L(x,y,σ )−L(x,y,σ i×a )・・・(1)
  6. 前記平滑化処理手段がk枚の前記平滑化画像L(x,y,σ )(kは2以上の整数、σ は前記平滑化フィルタのスケールであってi=1〜k)を生成するものであり、
    前記差分画像生成手段がk枚の前記平滑化画像L(x,y,σ )を用いて下記式(2)によりk−p枚(pは1以上の整数)の前記差分画像G(x,y,σ )を生成するものであることを特徴とする請求項2記載のオブジェクト推定装置。
    G(x,y,σ )=L(x,y,σ )−L(x,y,σ i+p )・・・(2)
  7. 前記サイズ推定手段が、最も大きい差分値もしくは最も小さい差分値を有する前記差分画像G(x,y,σ)を生成した前記平滑化画像L(x,y,σ)内のボケの広がり度合いに基づいて前記オブジェクトのサイズを推定するものであることを特徴とする請求項または記載のオブジェクト推定装置。
  8. 前記平滑化フィルタは、予め決められたサイズのオブジェクトに対応したフィルタ特性を有するものであることを特徴とする請求項2または7に記載のオブジェクト推定装置。
  9. 入力された原画像に対し解像度を低くした前記画像を生成する前処理手段をさらに備えたものであることを特徴とする請求項1からのいずれか1項記載のオブジェクト推定装置。
  10. 前記画像が動画像であり、動画像を構成するフレーム画像内から動きのある動き領域を抽出するとともに背景差分を行前処理手段をさらに備えたものであることを特徴とする請求項1からのいずれか1項記載のオブジェクト推定装置。
  11. 前記位置推定手段により推定された前記オブジェクトの位置または前記サイズ推定手段により推定された前記オブジェクトのサイズに基づいて前記画像内から前記オブジェクトを検出するオブジェクト検出手段をさらに備えたことを特徴とする請求項2、5〜8のいずれか1項記載のオブジェクト推定装置。
  12. オブジェクトの輪郭形状に対応したフィルタ特性を有する平滑化フィルタを画像に畳み込むことを繰り返すことにより、スケールの異なる複数の平滑化画像を生成し、
    生成した前記複数の平滑化画像のうち、所定のスケールだけ離れた前記平滑化画像間の差分を算出した差分画像を複数生成し、
    生成した前記複数の差分画像を合算して合算画像を生成し、
    生成した合算画像から信号値が最大もしくは最小になる位置を前記オブジェクトが存在する確率の高い位置とする
    ことを特徴とするオブジェクト推定方法。
  13. コンピュータに、
    オブジェクトの輪郭形状に対応したフィルタ特性を有する平滑化フィルタを画像に畳み込むことを繰り返すことにより、スケールの異なる複数の平滑化画像を生成する手順と、
    生成した前記複数の平滑化画像のうち、所定のスケールだけ離れた前記平滑化画像間の差分を算出した差分画像を複数生成する手順と、
    生成した前記複数の差分画像を合算して合算画像を生成する手順と、
    生成した合算画像から信号値が最大もしくは最小になる位置を前記オブジェクトが存在する確率の高い位置とする手順と
    を実行させるためのオブジェクト推定プログラム。
JP2010151865A 2010-07-02 2010-07-02 オブジェクト推定装置および方法ならびにプログラム Active JP5578965B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2010151865A JP5578965B2 (ja) 2010-07-02 2010-07-02 オブジェクト推定装置および方法ならびにプログラム
US13/175,478 US8634676B2 (en) 2010-07-02 2011-07-01 Object estimation device, method and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010151865A JP5578965B2 (ja) 2010-07-02 2010-07-02 オブジェクト推定装置および方法ならびにプログラム

Publications (2)

Publication Number Publication Date
JP2012014554A JP2012014554A (ja) 2012-01-19
JP5578965B2 true JP5578965B2 (ja) 2014-08-27

Family

ID=45600879

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010151865A Active JP5578965B2 (ja) 2010-07-02 2010-07-02 オブジェクト推定装置および方法ならびにプログラム

Country Status (2)

Country Link
US (1) US8634676B2 (ja)
JP (1) JP5578965B2 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5777507B2 (ja) * 2011-12-27 2015-09-09 キヤノン株式会社 情報処理装置、情報処理方法、及びそのプログラム
JP5914046B2 (ja) * 2012-02-29 2016-05-11 キヤノン株式会社 画像処理装置および画像処理方法
US9235890B2 (en) * 2013-03-15 2016-01-12 Yahoo! Inc. Identifying regions characterized by labeled measurements
JP2016110215A (ja) * 2014-12-02 2016-06-20 トヨタ自動車株式会社 マーカ認識装置、マーカ認識方法及び認識プログラム
US10176543B2 (en) * 2015-01-13 2019-01-08 Sony Corporation Image processing based on imaging condition to obtain color image

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7130484B2 (en) * 2001-10-15 2006-10-31 Jonas August Biased curve indicator random field filters for enhancement of contours in images
JP3979122B2 (ja) * 2002-02-26 2007-09-19 富士ゼロックス株式会社 画像処理装置および画像処理方法
EP1850270B1 (en) * 2006-04-28 2010-06-09 Toyota Motor Europe NV Robust interest point detector and descriptor
JP4988408B2 (ja) * 2007-04-09 2012-08-01 株式会社デンソー 画像認識装置
GB0807411D0 (en) * 2008-04-23 2008-05-28 Mitsubishi Electric Inf Tech Scale robust feature-based indentfiers for image identification
US8233716B2 (en) * 2008-06-27 2012-07-31 Palo Alto Research Center Incorporated System and method for finding stable keypoints in a picture image using localized scale space properties
JP5266463B2 (ja) * 2008-12-10 2013-08-21 国立大学法人 宮崎大学 医用画像の処理装置及び方法

Also Published As

Publication number Publication date
JP2012014554A (ja) 2012-01-19
US8634676B2 (en) 2014-01-21
US20120057759A1 (en) 2012-03-08

Similar Documents

Publication Publication Date Title
JP3944647B2 (ja) 物体計測装置、物体計測方法、およびプログラム
JP4739355B2 (ja) 統計的テンプレートマッチングによる高速な物体検出方法
EP2372647B1 (en) Image Blur Identification by Image Template Matching
JP5117982B2 (ja) 情報抽出装置、情報抽出方法、プログラムおよび記録媒体
US9589328B2 (en) Globally dominant point spread function estimation
JP5524692B2 (ja) 情報処理装置および方法ならびにプログラム
US20170301093A1 (en) Image processing apparatus, image processing method, and storage medium
JP5578965B2 (ja) オブジェクト推定装置および方法ならびにプログラム
US7961968B2 (en) Image density conversion method, image enhancement processor, and program thereof
JP2016513320A (ja) 少なくとも1つの追加イメージを用いたイメージ改善及びエッジ検証のための方法及び装置
JP5534411B2 (ja) 画像処理装置
US20180122097A1 (en) Apparatus, method, and non-transitory computer-readable storage medium for storing program for position and orientation estimation
JP2012073971A (ja) 動画オブジェクト検出装置、方法、及びプログラム
JP2012208553A (ja) 画像処理装置、および画像処理方法、並びにプログラム
JP2013005258A (ja) ブレ補正装置、ブレ補正方法及び帳票
JP2005128001A (ja) 光学ナビゲーション装置に応用されるサブピクセル移動量検出方法
KR100691855B1 (ko) 영상정보의 특징 추출장치 및 그 방법
WO2018061997A1 (ja) 媒体認識装置および媒体認識方法
Chen et al. A universal reference-free blurriness measure
Kakar et al. Detecting digital image forgeries through inconsistent motion blur
KR20170115757A (ko) 깊이 정보 생성 장치 및 방법
US11501417B2 (en) Image processing apparatus for estimating the number of specific objects in an image
JP5397468B2 (ja) パタンノイズ除去装置、パタンノイズ除去方法、パタンノイズ除去プログラム
JP5419925B2 (ja) 通過物体数計測方法、通過物体数計測装置、及びプログラム
JP2007156954A (ja) 信頼度テーブル作成方法、オプティカルフロー推定方法、信頼度テーブル作成装置、オプティカルフロー推定装置、及びプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20130122

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20131108

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20131119

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140120

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140624

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140708

R150 Certificate of patent or registration of utility model

Ref document number: 5578965

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250