JP4456181B1 - 移動体検出方法及び移動体検出装置 - Google Patents

移動体検出方法及び移動体検出装置 Download PDF

Info

Publication number
JP4456181B1
JP4456181B1 JP2009549322A JP2009549322A JP4456181B1 JP 4456181 B1 JP4456181 B1 JP 4456181B1 JP 2009549322 A JP2009549322 A JP 2009549322A JP 2009549322 A JP2009549322 A JP 2009549322A JP 4456181 B1 JP4456181 B1 JP 4456181B1
Authority
JP
Japan
Prior art keywords
distance
region
movement
moving
moving body
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2009549322A
Other languages
English (en)
Other versions
JPWO2010050110A1 (ja
Inventor
正宏 岩崎
一生 登
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Corp
Panasonic Holdings Corp
Original Assignee
Panasonic Corp
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Corp, Matsushita Electric Industrial Co Ltd filed Critical Panasonic Corp
Application granted granted Critical
Publication of JP4456181B1 publication Critical patent/JP4456181B1/ja
Publication of JPWO2010050110A1 publication Critical patent/JPWO2010050110A1/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/20Analysis of motion
    • G06T7/215Motion-based segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10016Video; Image sequence
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30196Human being; Person
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30241Trajectory

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Image Analysis (AREA)

Abstract

形状が変化しながら移動する人物等の被写体を含む画像に対しても、正しく領域分割することができる移動体検出方法を提供する。
動画像を構成する複数枚のピクチャを受け付けるステップ(S101)と、ピクチャを構成する1個以上の画素からなるブロックごとに、時間的に隣接する2枚のピクチャ間での画像の動きを検出し、検出した動きを複数枚のピクチャについて連結することで、移動軌跡を算出するステップ(S102及びS103)と、算出された複数の移動軌跡について、移動軌跡間の類似性を表す距離を算出するステップ(S104)と、算出された距離のうち、閾値よりも小さい距離を連結することで測地距離に変換し、得られた測地距離の分布における不連続点を検出し、検出した不連続点よりも小さい測地距離だけ離れた移動軌跡を一つのクラスタとすることによって領域分割をするステップ(S105及びS106)とを含む。
【選択図】図7

Description

本発明は、画像中の移動体を検出する方法に関し、特に複数枚の画像から構成される動画像から、画像の動き情報に基づいて、形状が変化しながら移動する人物等の移動体の全部又は一部の領域を特定する領域分割をすることによって移動体を検出する方法に関する。
画像に基づいて、形状が変化しながら移動する人物等の移動体を検出したり、移動体を含む画像の領域分割を行う技術の1つとして、画像から対象物の候補領域を抽出する手法と、抽出した対象物の候補領域に対しあらかじめ用意した対象物モデルを当てはめる手法とを組合せた方法がある(例えば、特許文献1及び非特許文献1参照)。例えば、特許文献1では、対象物候補領域として複数の画像から人物等の対象物のシルエット画像を抽出し、前記対象物に関する知識から対象物の部位をあらかじめパラメータ化した人物等の対象物に関するモデルを用いて、抽出したシルエット画像に対してそのモデルを当てはめる方法が開示されている。これによって、形状が変化しながら移動する人物等の移動体に対してパラメータ化したモデルを当てはめることができるため、移動体の検出及び領域分割が可能となる。
また、非特許文献1では、固定された1つの移動体を複数の視点から撮影した画像を入力として、各画像における画素値データとその他の画像の画素値データとのユークリッド距離を計算し、それを測地距離変換を行った後、次元圧縮を行うことによって、類似した視点から撮影した画像が2次元空間上で近距離となるように射影することを可能にする方法が開示されている。ここでは、従来のPCA(Principal Component Analysis)等の線形次元圧縮方法と比較して、測地距離変換によって、より低次元に圧縮可能であり、さらに、非線形に分布するデータに対しても取扱いが可能なことが示されている。
特開平8−214289号公報
Joshua Tenenbaum, Vin de Silva, John Langford, "A Global Geometric Framework for Nonlinear Dimensionality Reduction", Science, VOL290, pp.2319-2322,22 December, 2000
しかしながら、上記特許文献1の技術では、特に街頭等、人物等の移動体が行き交うシーンにおいて、正しく移動体を検出することができないという問題がある。上記特許文献1に代表される移動体検出手法は、前述のように画像から対象物候補領域を抽出する必要がある。この時、正しく対象物候補領域を抽出できなければ、対象物をパラメータ化したモデルを正確に対象物候補領域に当てはめることが不可能になる。特に、混雑したシーンにおいては、対象物候補領域を正しく抽出することは困難である。例えば、画像上でさまざまな大きさの移動体が混在するような場合には、複数の移動体を1つの移動体として誤って対象物候補領域として抽出したり、抽出対象となる移動体が存在しない領域を対象物候補領域として誤って抽出したりするといった問題がある。また、移動体の一部が隠れる場合にも同様に、複数の移動体を一つの対象物候補領域として抽出したり、対象物候補領域として抽出することができないといった問題がある。さらに、対象物候補領域を正しく抽出できたとしても以下のような課題がある。特に人物等の多関節物体を対象物とした場合、対象物の様々な姿勢あるいは大きさに起因する画像上での見えのバリエーションが非常に大きいため、対象物モデルのパラメータ化を行う際に膨大な数のパラメータが必要となる。このことは、モデルの当てはめミスを誘発する。そのため、実際とは異なる姿勢に対応する対象物モデルが当てはめられることにより、領域分割が正しく行われないといった問題がある。
一方で、非特許文献1に代表される移動体検出手法では、画像間の距離を入力として非線形処理を行うことにより、効率良く圧縮された低次元空間に画像データを射影することができる。さらには、測地距離変換と次元圧縮により連続的かつ非線形に分布するデータを効率良く表現することができる。しかしながら、非特許文献1の主な目的は、複数の画像を低次元空間に射影することで画像間の類似性を可視化することにあり、形状が変化する人物等の多関節物体における様々な姿勢変化に対応しながら、正しく移動体を検出する方法は開示されていない。
そこで、本発明は、形状が変化しながら移動する人物等の移動体を含む画像に対しても、移動体の姿勢あるいは大きさの影響を受けずに、正しく領域分割することができる移動体検出方法及び移動体検出装置を提供することを目的とする。
この課題を解決するために本発明は、動画像中の移動体の全部又は一部の領域を特定する領域分割をすることによって動画像中の移動体を検出する方法であって、動画像を構成する複数枚のピクチャを受け付ける画像入力ステップと、前記ピクチャを構成する1個以上の画素からなるブロックごとに、時間的に隣接する2枚のピクチャ間での画像の動きを検出し、検出した動きを前記複数枚のピクチャについて連結することで、移動軌跡を算出する動き解析ステップと、前記動き解析ステップで算出された複数の移動軌跡について、移動軌跡間の類似性を表す距離を算出する距離算出ステップと、前記距離算出ステップで算出された距離のうち、予め定められた閾値よりも小さい距離を連結することで、前記距離算出ステップで算出された距離を測地距離に変換し、得られた測地距離の分布における不連続点を検出し、検出した不連続点よりも小さい測地距離だけ離れた移動軌跡を一つのクラスタとすることによって前記領域分割をする領域分割ステップと、前記領域分割ステップで領域分割された結果を出力する出力ステップとを含む。
なお、本発明は、上記移動体検出方法として実現できるだけでなく、上記各ステップを構成要素とする移動体検出装置、上記各ステップをコンピュータに実行させるプログラム、そのプログラムを格納したCD−ROM等のコンピュータ読み取り可能な記録媒体等として実現することもできる。
上記の方法及び装置等により、形状が変化しながら移動する人物等の移動体を正確に検出及び部位を領域分割することができる。さらに、検出と領域分割を行った結果を用いて、移動体の移動予測等を行うことも可能である。
図1は、本発明の実施の形態1における移動体検出装置の基本構成を示す機能ブロック図である。 図2は、本発明に係る移動体検出装置のハードウェア構成を示すブロック図である。 図3は、本発明の実施の形態1における移動体検出装置の基本動作を示すフローチャートである。 図4は、本発明の実施の形態1における動き解析部の処理例を示す図である。 図5(a)〜(c)は、本発明の実施の形態1における領域分割部の測地距離の効果の一例を示す図である。 図6(a)及び(b)は、本発明の実施の形態1における領域分割部の測地距離の効果の一例を示す図である。 図7(a)〜(c)は、本発明の実施の形態1における領域分割部の処理例を示す図である。 図8は、本発明の実施の形態1の変形例における移動体検出装置の基本動作を示すフローチャートである。 図9(a)〜(d)は、本発明の実施の形態1の変形例における領域分割部の処理例を示す図である。 図10は、本発明の実施の形態2における移動体検出装置の基本構成を示す機能ブロック図である。 図11は、本発明の実施の形態2における移動体検出装置の基本動作を示すフローチャートである。 図12(a)〜(f)は、本発明の実施の形態2における領域分割部の処理例を示す図である。 図13(a)〜(c)は、本発明の実施の形態2における領域分割部の階層的なクラスタリング処理例を示す図である。 図14は、本発明の実施の形態1及び2の第1変形例における移動体検出装置の構成例を示す機能ブロック図である。 図15(a)及び(b)は、本発明の実施の形態1及び2の第1変形例における画像表示部の表示例を示す図である。 図16は、本発明の実施の形態1及び2の第2変形例における移動体検出装置の構成例を示す機能ブロック図である。 図17は、本発明の実施の形態1及び2の第2変形例における記録・送信データの一例を示す図である。 図18は、本発明の実施の形態3における移動体検出装置の構成例を示す機能ブロック図である。 図19は、本発明の実施の形態3における移動体検出装置の基本動作を示すフローチャートである。 図20は、本発明の実施の形態3における動き予測の一例を示す図である。 図21(a)〜(c)は、本発明の実施の形態2の方法によって分離可能な図形の一例を示す図である。
本発明の一実施形態は、動画像中の移動体の全部又は一部の領域を特定する領域分割をすることによって動画像中の移動体を検出する方法であって、動画像を構成する複数枚のピクチャを受け付ける画像入力ステップと、前記ピクチャを構成する1個以上の画素からなるブロックごとに、時間的に隣接する2枚のピクチャ間での画像の動きを検出し、検出した動きを前記複数枚のピクチャについて連結することで、移動軌跡を算出する動き解析ステップと、前記動き解析ステップで算出された複数の移動軌跡について、移動軌跡間の類似性を表す距離を算出する距離算出ステップと、前記距離算出ステップで算出された距離のうち、予め定められた閾値よりも小さい距離を連結することで、前記距離算出ステップで算出された距離を測地距離に変換し、得られた測地距離の分布における不連続点を検出し、検出した不連続点よりも小さい測地距離だけ離れた移動軌跡を一つのクラスタとすることによって前記領域分割をする領域分割ステップと、前記領域分割ステップで領域分割された結果を出力する出力ステップとを含む。これにより、不連続点よりも小さい測地距離だけ離れた移動軌跡どうしが一つのクラスタとなるので、直線的な距離であるユークリッド距離を用いたクラスタリングに比べ、移動軌跡間の類似性に関して、時空間的な連続性を考慮したクラスタリングが行われる。そのため、ピクチャにおける各ブロックが同一の物体(又は部位)に属するか別個の物体(又は部位)に属するかが確実に弁別される。その結果、動きの異なる複数の部位からなる人物等の多関節物体を移動体として検出する場合であっても、正確な領域分割が行われ、移動体が確実に検出される。つまり、形状が変化しながら移動する人物等の移動体に対しても正しく領域分割し、これによって画像中の移動体を確実に検出することが可能である。
なお、測地距離変換のより詳細な方法として、前記領域分割ステップでは、前記距離から前記測地距離への変換において、第1の移動軌跡と第2の移動軌跡との間の距離を測地距離に変換する場合には、前記距離算出ステップで算出された距離のうち、前記予め定められた閾値よりも小さい距離だけ離れた移動軌跡をたどりながら前記第1の移動軌跡から前記第2の移動軌跡に至る経路の距離を、測地距離として算出するのが好ましい。
また、本発明のより好ましい形態は、前記領域分割ステップでは、前記距離算出ステップで算出された距離を測地距離に変換するときに、前記複数の移動軌跡の分布における密集度が大きいほど小さい測地距離となるような重み付けをしたうえで、前記変換をする構成としたものであり、移動軌跡の分布の密集度を用いて距離変換を行うことにより、類似性の高い移動軌跡をより高精度に同一クラスタとすることで、特に形状が変化しながら移動する人物等の移動体に対しても確実に検出し、同時に正しく領域分割を行うことが可能である。
また、領域分割ステップの具体的な手法の他の一つとして、前記領域分割ステップは、前記領域分割に用いられる閾値を複数生成し、生成した複数の閾値のそれぞれについて、前記距離算出ステップで算出された距離のうち、当該閾値よりも小さい距離を連結することで、前記距離算出ステップで算出された距離を前記測地距離に変換し、得られた複数の測地距離の分布における不連続点を検出し、検出した不連続点よりも小さい測地距離だけ離れた移動軌跡を一つのクラスタとすることによって前記領域分割をし、その領域分割の結果を領域分割候補として生成する領域分割候補生成ステップと、クラス数についての指示を取得し、所得したクラス数と同じもしくは最も近い個数の領域に分割された領域分割候補を前記領域分割候補生成ステップで生成された複数の領域分割候補から選択し、選択した領域分割候補を前記領域分割の結果として出力する領域分割候補選択ステップを含んでもよい。これによって、予め生成した複数の判断基準のそれぞれについてクラスタリングが行われるので、それら複数のクラスタリングから、所望の個数のクラスタが生成される。
本発明のより好ましい形態は、前記領域分割候補生成ステップでは、前記距離算出ステップで算出された複数の距離における最大値と最小値との間の複数の値を、前記閾値として、生成する構成としたものであり、これにより、閾値を効果的に設定することで、特に形状が変化しながら移動する人物等の移動体に対しても確実かつより高速に検出し、同時に正しく領域分割を行うことが可能である。
本発明のより好ましい形態は、前記領域分割候補生成ステップでは、前記距離算出ステップで算出された複数の距離について、閾値を大きい値から小さい値の順に並べた場合における最初の不連続点を検出し、検出した不連続点よりも小さい複数の値を、前記複数の閾値として、生成する構成としたものであり、これにより、閾値を効果的に設定することで、特に形状が変化しながら移動する人物等の移動体に対しても確実かつより高速に検出し、同時に正しく領域分割を行うことが可能である。
本発明のより好ましい形態は、前記領域分割候補生成ステップでは、前記距離算出ステップで算出された複数の距離について不連続点の検出を行い、閾値の大小に基づいて階層的に前記領域分割をする構成としたものであり、これにより、階層的にクラスタリングを行うことによって、特に形状が変化しながら移動する人物等の被写体に対して、被写体の画像上での位置を特定する粗い移動体抽出から、被写体の詳細な動きに基づいた精細な移動体抽出までを行うことが可能である。
本発明のより好ましい形態は、前記領域分割候補生成ステップでは、前記距離算出ステップで算出された複数の距離について、閾値を大きい値から不連続点の検出を行い、分割されたクラスタに対して、それぞれ、より小さな閾値を用いて不連続点の検出を行い、階層的に前記領域分割をする構成としたものであり、これにより、閾値を大きい値から順に階層的にクラスタリングを行うことによって、特に形状が変化しながら移動する人物等の被写体に対して、被写体の画像上での位置を特定する粗い移動体抽出から、被写体の詳細な動きに基づいた精細な移動体抽出までをより少ない計算量で行うことが可能である。
本発明のより好ましい形態は、前記領域分割候補生成ステップでは、前記距離算出ステップで算出された複数の距離の平均値又は中央値を中心に増加及び減少させて得られる複数の値を、前記複数の閾値として、生成する構成としたものであり、これにより、閾値を効果的に設定することで、特に形状が変化しながら移動する人物等の移動体に対しても確実かつより高速に検出し、同時に正しく領域分割を行うことが可能である。
本発明のより好ましい形態は、前記領域分割候補生成ステップでは、前記動き解析ステップで算出された複数の移動軌跡のそれぞれについて、当該移動軌跡との距離がN番目に小さい距離を特定し、特定した複数の距離について大きい順から選択した複数の値を、前記複数の閾値として、生成する構成としたものであり、これにより、閾値を効果的に設定することで、特に形状が変化しながら移動する人物等の移動体に対しても確実かつより高速に検出し、同時に正しく領域分割を行うことが可能である。
本発明のより好ましい形態は、前記領域分割ステップでは、前記動き解析ステップで算出された複数の移動軌跡のそれぞれについて、前記距離が小さい順に予め定められた個数の移動軌跡を選択し、選択されなかった移動軌跡との距離を無限大に変更する非線形化をした後に、前記複数の距離のそれぞれを測地距離に変換する構成としたものであり、これにより、選択された距離と選択されなかった距離とが非線形な関係となるため、線形距離と比較して、移動軌跡間の類似/非類似が強調されることとなり、人物のように関節で繋がった物体の動きを正しく表現することが可能となる。
本発明のより好ましい形態は、前記領域分割ステップでは、前記動き解析ステップで算出された複数の移動軌跡のそれぞれについて、前記距離が予め定められた閾値以下の移動軌跡を選択し、選択されなかった移動軌跡との距離を無限大に変更する非線形化をした後に、前記複数の距離のそれぞれを測地距離に変換する構成としたものであり、これにより、選択された距離と選択されなかった距離とが非線形な関係となるため、線形距離と比較して、移動軌跡間の類似/非類似が強調されることとなり、人物のように関節で繋がった物体の動きを正しく表現することが可能となる。
本発明のより好ましい形態は、前記動き解析ステップでは、前記動きの検出として、前記動きを示す2次元動きベクトル又はアフィンパラメータを算出する構成としたものであり、これにより、動きベクトルもしくはアフィンパラメータによりブロックの動きを解析することで、ブロックの移動軌跡を算出することが可能になる。
本発明のより好ましい形態は、前記距離算出ステップでは、前記距離の算出として、前記ブロックの移動軌跡間の類似性に加えて、前記ピクチャでの前記ブロック間の距離及び前記ブロックどうしを接続する直線の傾斜を示す角度の少なくとも1つを算出する構成としたものであり、これにより、人物のように関節を軸とした回転運動を伴いながら形状が変化する移動物体の動きを効率良く捉えることが可能になる。
本発明の一実施形態は、前記出力ステップは、前記領域分割ステップで得られた領域分割の結果を、前記画像入力ステップで受け付けたピクチャに重ねて表示する表示ステップを含む構成としたものであり、これにより、領域分割した部位を画像上に表示することによって、スポーツにおけるフォームの修正あるいはリハビリテーションにおける歩行の矯正等に応用が可能である。
本発明の一実施形態は、前記画像入力ステップでは、2つ以上の移動体が含まれる動画像を受け付け、前記領域分割ステップでは、前記2以上の移動体について前記領域分割をすることで、2以上の移動体を検出する構成としたものであり、これにより、形状が変化しながら移動する複数の移動体を含む画像に対しても、正しく複数の移動物体を検出することが可能である。
本発明の一実施形態は、前記移動体検出方法はさらに、前記領域分割ステップで特定された領域を構成するブロックの移動軌跡から、当該領域を代表する移動軌跡を算出し、算出した代表の移動軌跡に従って当該領域が移動すると予測することで、前記移動体の動きを予測する動き予測ステップを含む構成としたものであり、これにより、複数のブロックの移動軌跡を代表する軌跡を用いて移動体の動きを予測することにより、ノイズ耐性の高い動き予測が可能となる。
本発明の一実施形態は、前記出力ステップは、前記領域分割ステップでの領域分割の結果に基づいて、前記画像入力ステップで受け付けたピクチャにおける領域を特定し、特定した領域ごとに、対応する領域分割の結果を、記憶手段に記録する、又は、送信する記録・送信ステップを含む構成としたものであり、これにより、検出した移動体画像を分割した領域に基づいてそれぞれ別々に保持することによって、各移動体画像の中から必要な部分の画像のみを選択して保存したり、外部に出力したりすることによって、図形要素として効率的な保存及び出力が可能になる。そのため、携帯電話等、処理能力の限られた機器に保存及び送信する場合に有効に作用する。
本発明の一実施形態は、動画像を構成する複数枚のピクチャを受け付ける画像入力ステップと、前記ピクチャを構成する1個以上の画素からなるブロックごとに、時間的に隣接する2枚のピクチャ間での画像の動きを検出し、検出した動きを前記複数枚のピクチャについて連結することで、移動軌跡を算出する動き解析ステップと、前記動き解析ステップで算出された複数の移動軌跡について、移動軌跡間の類似性を表す距離を算出する距離算出ステップと、前記距離算出ステップで算出された距離が小さい順に移動軌跡のペアを同一クラスタとして統合する処理をクラスタ数が規定の数になるまで繰り返すことによって、距離が一定以上離れた不連続点をクラスタの境界として前記領域分割をする領域分割ステップと、前記領域分割ステップでの領域分割の結果を出力する出力ステップとを含む。これにより、距離が小さい順に移動軌跡のペアを統合する処理をクラスタ数が規定の数になるまで繰り返すことによって、距離が一定以上離れた不連続点をクラスタの境界として得ることができる。結果として、移動軌跡間の類似性に関する連続性を考慮したクラスタリングが行われ、移動体を検出することが可能である。
以下、本発明の実施の形態について、図面を用いて説明する。
(実施の形態1)
図1は、実施の形態1における移動体検出装置100の構成を示す機能ブロック図である。図1に示されるように、この移動体検出装置100は、画像入力部101、動き解析部102、距離算出部103、領域分割部104、出力部105を備える。そして、この移動体検出装置100は、動画像中の移動体の全部又は一部の領域を特定する領域分割をすることによって動画像中の移動体を検出する。
画像入力部101は、動画像を構成する時間的に異なる複数枚の画像(ピクチャ)の入力を受け付ける処理部であり、例えば、ビデオカメラ、あるいは、ビデオカメラと接続された通信インターフェース等である。
動き解析部102は、画像入力部101で受け付けたピクチャを構成する1個以上の画素からなるブロックごとに、時間的に隣接する2枚のピクチャ間での画像の動きを検出し、検出した動きを複数枚のピクチャについて連結することで、移動軌跡を算出する処理部である。
距離算出部103は、移動する物体の形状変化を捉えるために、動き解析部102で算出したブロックiの移動軌跡と、i以外のブロックの移動軌跡とを用いて、ブロックの動きの類似性を表す距離を算出する処理部である。例えば、N個のブロックの移動軌跡を用いた場合、算出される距離はN×Nの距離マトリクスとなる。ここでは、ブロックの動きの類似性を評価する距離を計算することによって、ブロック間の距離が動きによって変化する移動体、特に、関節物体のように形状が変化しながら移動する人物等の物体の動きを距離マトリクスとして表現することが可能である。なお、以降の説明では、ブロックiの移動軌跡を移動軌跡iと呼ぶこととする。このように、本明細書における「距離」は、2次元空間における2点間の距離だけでなく、多次元のデータ間の算術的な距離を含み、1つの値、あるいは、複数の値の集合(距離マトリクス)である。
領域分割部104は、領域分割に用いられる閾値を用いて、動き解析部102で算出された複数の移動軌跡をクラスタリングすることによって領域分割を行う処理部である。具体的には、この領域分割部104は、距離算出部103で算出した距離マトリクスに対してデータの連続性に関する閾値を用いて測地距離変換を適用し、つまり、距離算出部103で算出された複数の距離のうち当該閾値よりも小さい距離を連結することで複数の距離のそれぞれを測地距離に変換し、それぞれの閾値における測地距離変換後の移動軌跡間の距離の分布における不連続点を検出し、検出した不連続点よりも小さい測地距離だけ離れた移動軌跡どうしが一つのクラスタとなるように、連続に分布する移動軌跡をクラスタリングすることによって、前記閾値に対する領域分割を行う。
なお、この領域分割部104は、距離算出部103で算出された距離(距離マトリクス)から測地距離への変換(測地距離変換)において、第1の移動軌跡と第2の移動軌跡との間の距離を測地距離に変換する場合には、距離算出部103で算出された距離のうち、予め定められた閾値よりも小さい距離だけ離れた移動軌跡をたどりながら第1の移動軌跡から第2の移動軌跡に至る経路の距離を、測地距離として算出する。
出力部105では、領域分割部104で行った動画像中の移動体の検出結果もしくは、画像の領域分割結果を出力するメモリや記録媒体への書き込み処理部、あるいは、ディスプレイ装置に出力する出力インターフェース等である。
本明細書において、領域分割を行った結果の各領域は、それぞれの移動体に対応するため、各移動体の検出と、画像中の複数の移動体領域をそれぞれ分割する領域分割とは、特に区別しない。つまり、「移動体の検出」という処理が、即ち、「領域分割」という処理に相当する。
なお、この移動体検出装置100を構成する各構成要素(画像入力部101、動き解析部102、距離算出部103、領域分割部104、出力部105)は、図2に示されるように、カメラ2001から送られてくる画像を取得するインターフェース(I/F)2004、CPU2005、RAM2007、ROM2006、ハードディスク2008、ディスプレイ2003に映像信号を出力するビデオカード2009等を備えるコンピュータ2002上で実行されるプログラム等のソフトウェアで実現されてもよいし、電子回路等のハードウェアで実現されてもよい。つまり、本実施の形態における構成要素のうち、ディスプレイ装置等の入出力部を除く構成要素については、コンピュータで実行されるプログラム及びデータ(つまり、ソフトウェア)で実現してもよいし、電子回路、メモリ及び記録媒体等のハードウェアで実現してもよいし、それらの混在で実現してもよい。以下、他の実施の形態における移動体検出装置についても同様である。
以下に、本発明の移動体検出方法、つまり、移動体検出装置100の動作について、図3のフローチャートを用いて移動する移動体を検出(つまり、領域分割)する例について詳細に説明する。
まず、ステップS101にて、画像入力部101は、複数枚のピクチャを受け付ける。
次に、ステップS102にて、動き解析部102は、少なくとも2枚のピクチャからブロックの動きを算出する。なお、ここでは、ブロックの動きを算出する一例として、画素の動きを算出する。以下、本実施の形態では、ブロック単位の処理の一例として、画素単位の処理を説明する。なお、複数の画素からなるブロック単位で処理をする場合には、(i)画素に対応するデータをブロック分だけ合計したり、(ii)ブロック分の平均値を求めたり、(iii)ブロックの中心値を求めることで、ブロックに対応するデータ(代表値)を求め、得られた代表値を用いて画素単位の処理と同様に処理すればよい。なお、本明細書で、「ブロックの動き」及び「画素の動き」とは、それぞれ、「画像のブロックごとでの動き」及び「画像の画素ごとでの動き」を意味する。
まず、画素の動きをオプティカルフロー計算により算出する例について説明する。オプティカルフロー計算による動きベクトルの算出は、非特許文献2もしくは非特許文献3および非特許文献4に開示された技術を用いることができる。
P.Anandan,"A Computational Framework and an Algorithm for the Measurement of Visual Motion",International Journal of Computer Vision,Vol.2,pp.283−310,1989
Vladimir Kolmogorov and Ramin Zabih,"Computing Visual Correspondence with Occlusions via Graph Cuts",International Conference on Computer Vision,2001
Thomas Pock,Martin Urschler,Christopher Zach,Reinhard Beichel and Horst Bischof,"A Duality Based Algorithm for TV−L1−Optical−Flow Image Registration",International Conference on Medical Image Computing and Computer Assisted Intervention,2007
例えば、ステップS101にてT枚のピクチャが入力されたと仮定すると、動き解析部102は、時刻tと時刻t+1に入力されたピクチャを用いて、画素iの動きベクトル(ui t,vi t)を推定する。ここでは、必ずしもフレームが連続している必要はなく、例えば、時刻tと時刻t+nに入力されたピクチャを用いて画素の動きを求めてもよい。ただし、nは1以上の整数である。さらに、画素の動きとして、前記2次元動きベクトルの代わりにアフィンパラメータを推定してもよい。この時、すべての画素について動き情報を求めてもよい。また、より高速に処理を行いたい場合には、画像をグリッドに区切って一定間隔のグリッド上の画素についてのみ動き情報を求めてもよいし、上述したように、画像をブロックに区切ってブロックごとに動き情報を求めてもよい。さらに、非特許文献2を用いて動きベクトルを算出する場合は、その信頼度を計算することができるため信頼度の高い動き情報を持つ画素のみを用いてもよい。また、非特許文献3を用いて動きベクトルを算出する場合は、オクルージョンを推定することができる。そのため、遮蔽(しゃへい)されていない画素の動き情報のみを用いてもよい。また、非特許文献4は、高速に処理できることが知られており、処理の高速化が必要な場合に用いてもよい。
さらに、画素の動きを算出する手法として、前記したブロックの並進移動を仮定して動きベクトルを算出する方法の代わりに、ブロックのアフィン変形を仮定して動きベクトルを算出する方法を用いてもよい。アフィン変形を仮定して動きベクトルを算出する方法は、非特許文献5に開示された技術を用いることができる。
Jianbo Shi and Carlo Tomasi,"Good Features to Track",IEEE Conference on Computer Vision and Pattern Recognition,pp593−600,1994
上記手法は、時刻tと時刻t+1に入力されたピクチャの画素i近傍の動きに相当するアフィンパラメータAi tを推定する。画素iについて、時刻tと時刻t+1におけるピクチャ上での画素位置xi tとxi t+1は次の関係がある。
Figure 0004456181
上記手法は、特に回転運動をする物体に対して、並進移動を仮定して動きベクトルを算出する手法を用いる場合よりも、高精度に画素iの動きを推定することができる。
次に、ステップS103にて、動き解析部102は、ステップS102で算出した動き情報を用いて、時間的に異なる複数枚のピクチャに対して前記画素の動きから移動軌跡iを算出する。以下、画素iの移動軌跡を移動軌跡iと呼ぶこととする。図4に示すように、時刻tにおける入力画像301の画素i303からステップS102で算出した動き情報302を用いて、画素iの動きを追跡する。この時、画素iが通った時刻tにおけるピクチャ上での画素位置(xi t,yi t)を用いて、以下のように移動軌跡iを算出する。
Figure 0004456181
ここで、Tは移動軌跡の算出に用いたピクチャの枚数である。
次に、ステップS104にて、距離算出部103は、上記式2で算出した移動軌跡iを用いて画素の動きの類似性を含む距離マトリクスを算出する。移動軌跡iと移動軌跡jとの線形距離f(i,j)は以下の式3のように算出できる。
Figure 0004456181
ここで、wは重み係数であり、設計者が設定するパラメータである。さらに、上記式3は、次の式4のように変形してもよい。
Figure 0004456181
また、ptnij,mtnijについては、それぞれ、以下の式5及び式6に示す。
Figure 0004456181
Figure 0004456181
ここで、
Figure 0004456181
上記のように、上記式3に示されるように、上記式5に示した移動軌跡間距離の時間平均値に加えて、上記式6に示した移動軌跡間距離の時間的ばらつきを前記線形距離f(i,j)の要素とする。特に上記式6に示した移動軌跡間距離の時間的ばらつきは、画素の動きの類似性を示すものであり、これによって、画素間のなす距離の関係が時間的に変化しない剛体だけでなく、関節物体等の形状変化を捉えることができる。なお、上記式6の代わりに下記の式8から式13のような時間変動成分を用いることで、同様の効果が期待できる。
Figure 0004456181
ここで、
Figure 0004456181
であり、ut iは、時刻tからt+1への動きベクトル(ui t,vi t)、<ut i・ut i>は内積である。
また、以下のような計算を用いてもよい。
Figure 0004456181
ここで、
Figure 0004456181
Figure 0004456181
ここで、
Figure 0004456181
である。
次に、領域分割部104は、ステップS105(測地距離変換)とS106(領域分割)とを実行する。具体的には、S105では、領域分割部104は、上記式3もしくは上記式4で算出した線形距離f(i,j)に対して閾値Rを用いて、その閾値に対して以下の式14のように非線形化処理を行いf'(i,j)を算出する。
Figure 0004456181
つまり、領域分割部104は、移動軌跡iに着目した時に移動軌跡iとの線形距離が小さい順にR個の移動軌跡jを選択し、選択された移動軌跡jとの距離は変更せず、一方、選択されなかった移動軌跡jとの距離を無限大に変更する。なお、ここでは、線形距離f(i,j)が小さい順に選択したが、次式のように閾値Rを設定してもよい。
Figure 0004456181
つまり、領域分割部104は、上記式14に示すように、動き解析部102で算出された複数の移動軌跡のそれぞれについて、距離が小さい順に予め定められた個数の移動軌跡を選択し、選択されなかった移動軌跡との距離を無限大に変更する非線形化をした後に、複数の距離のそれぞれを測地距離に変換してもよいし、上記式15に示すように、移動軌跡iに着目した時に、動き解析部102で算出された複数の移動軌跡jのそれぞれについて、距離が予め定められた閾値以下の移動軌跡jを選択し、選択されなかった移動軌跡との距離を無限大に変更する非線形化をした後に、複数の距離のそれぞれを測地距離に変換してもよい。
なお、距離の非線形化に関しては、上記の関数に限定されるものではなく、移動軌跡iと移動軌跡jに関する距離に対して非線形変換を行うものであれば何でもよい。
さらには、線形距離f(i,j)に対して、以下のように式16及び式17を用いて計算した重みを掛け算して重み付けを行った後に式14もしくは式15の処理を行ってもよい。
Figure 0004456181
ここで、NNは移動軌跡の近傍点について処理することを示し、移動軌跡a及びbに対して、移動軌跡j及びiからそれぞれ一定距離以内にある移動軌跡もしくは、距離が小さい順にN個の移動軌跡を用いて計算することを示す。すなわち、Na、Nbは、一定距離以内にある移動軌跡の数もしくは、前記Nである。なお、zは設計者が設定する。
また、上記式16の代わりに次の式17のように分散を用いてもよい。
Figure 0004456181
ここで、
Figure 0004456181
Figure 0004456181
であり、近傍点については、上記式16の場合と同じである。
上記式16や上記式17の重みを用いてf(i,j)を変換することによって、移動軌跡i及びjと類似した移動軌跡が空間的に密集している場合(距離が近い移動軌跡の場合)には、f(i,j)を相対的に小さく、また、空間的に疎な場合(距離が遠い移動軌跡の場合)には、密集している場合と比較してf(i,j)が相対的に大きくなる。つまり、領域分割部104は、距離算出部103で算出された複数の距離のそれぞれを測地距離に変換するときに、動き解析部102で算出された複数の移動軌跡の分布における密集度が大きいほど小さい測地距離となるような重み付けをしたうえで、測地距離への変換をする。これによって、画素の移動軌跡の分布の密集度を考慮した距離変換が可能になる。
次に、領域分割部104は、非線形化された距離f'(i,j)を用いて、次式のように測地距離を算出する。
Figure 0004456181
なお、min(x,y)は、値xと値yのうち小さい方を返す関数である。また、sは、移動軌跡sであり、移動軌跡iから移動軌跡jに辿(たど)りつくための中継点である。ここで、f'(i,s)+f'(s,j)における中継点sは1点に限るものではない。この方法は、ダイクストラ法と呼ばれる最短経路探索手法であり、以下の非特許文献6に記載されている。
E.W.Dijkstra, " A note on two problems in connexion with graphs", Numerische Mathematik, pp.269-271, 1959
ここで、上記式14及び上記式15に示した非線形化処理について、図5(a)〜(c)の概念図を用いて説明する。ここでは、上記式15に示された非線形処理について説明するが、他の非線形化処理を行っても同様の効果が期待できる。
まず、図5(a)は2次元のデータ分布を示す。ここで、それぞれのデータ点は、上記式3もしくは上記式4に示した移動軌跡iに相当する。上記式14から上記式17の非線形化処理を行わない場合には、図5(b)に示したように、データ点iとデータ点jとの距離は、データ点iとデータ点kとの距離よりも小さくなる。しかしながら、図5(c)に示すように、例えば、上記式15の処理及び上記式17の処理を行うことによって、データ点iとデータ点jとの距離は、ユークリッド距離ではなく、測地距離と呼ばれるデータ点を矢印のように辿(たど)った距離となる。結果として、ユークリッド距離を用いる場合と異なり、データ点iとデータ点jとの距離は、データ点iとデータ点kとの距離よりも大きくなる。
ここで、このような上記式14から上記式17に示した測地距離変換の特徴を図6(a)及び(b)の概念図を用いて説明する。ここでは、線形距離f(i,j)と測地距離g(i,j)の違いを分かりやすく説明するため、上記式5に示すような時刻tにおける移動軌跡間距離を例とする。実際には、移動軌跡間距離に加えて、上記式3に示したように画素の動きの類似性として移動軌跡間距離の変動成分を用いることにより、関節物体等の形状だけではなく形状変化をも捉えることができる。図6(a)は、上記式14から上記式17の処理を行わない場合の例である。例えば、頭部の画素i802と手先部の画素j803との距離は、線形距離801に示す距離となる。一方、上記式14から上記式17のような非線形処理を行うことによって、閾値Rが適切に設定されていれば、図6(b)に示されるように、頭部の画素i802と手先部の画素j803との距離は、画素k804を通って画素jにたどり着くまでの矢印で示したような線形和としての距離となる。そのため、線形距離801では人物のような関節物体の関節が繋がった形状をデータとして連続的に表現できないのに対して、関節が繋がった形状を距離として連続性を表現することが可能となる。なお、測地距離の計算方法は、上記式17に限定されるものではない。
次に、ステップS106では、領域分割部104は、ステップS105で閾値Rに対応する測地距離変換を行ったg(i,j)を用いて、不連続点を検出することによってクラスタリングを行う。ここでは、g(i,j)が無限大となる移動軌跡iと移動軌跡jの間が不連続点である。閾値Rに対して得た測地距離変換の結果の例を図7(a)〜(c)を用いて説明する。ここで、図7(a)は移動軌跡a〜hを示す図であり、図7(b)は、図7(a)に示した移動軌跡a〜hを表す高次元空間の概念図である。なお、図7(a)では、移動軌跡a〜hの数を8本としたが、実際には、各画素に対応する移動軌跡を用いてもよいし、ブロック単位で求めた移動軌跡を用いてもよい。ここで、移動軌跡a〜hを表す高次元空間の1点が、上記式2に示した一つの移動軌跡に対応する。すなわち、高次元空間上の点は、1枚のピクチャ上の領域だけではなく時間的に異なる複数枚のピクチャに渡って画素を追跡した結果である。さらに、高次元空間上で、点と点との距離は、ベクトル間のユークリッド距離ではなく、上記式20に示すような測地距離に対応する。
図7(c)は、クラスタリング結果を示す図である。ここで、図7(c)において、上記式3もしくは上記式4に示した移動軌跡aと移動軌跡bとの距離をf(a,b)とした時に、f(e,f)>f(c,d)>f(f,g)>f(b,c)とする。また、閾値をRとして設定した場合に、距離f(f,g)は、閾値Rよりも大きな値を持つとする。この場合、上記式17によって測地距離を求めてもg(e,f)、g(c,d)、g(f,g)はそれぞれ無限大となる。よって、領域分割部104は、移動軌跡cと移動軌跡dとの間、移動軌跡eと移動軌跡fとの間、移動軌跡fと移動軌跡gとの間が不連続点であると判定する。この結果、移動軌跡a,b,cは、互いに不連続点を通らずに辿ることができるため、無限大の値はとらず、逆に、例えば、移動軌跡a,b,cから、他の移動軌跡に対しては、不連続点g(c,d)を通るため無限大となる。このように、測地距離が無限大とならない移動軌跡iと移動軌跡jの組は同じクラスタとし、無限大となる場合は別のクラスタとする。そして、測地距離が無限大となる組と無限大にならない組とを整理して、θ1、θ2、θ3、θ4の合計4つのクラスタに分離することができる。
ここで、閾値Rの性質について述べる。閾値Rが小さいほど、画像上でより小さな移動体を検出可能となる一方で、誤検出(フォルスポジティブ)が増加するというトレードオフがある。そこで、例えば、監視用途等、移動体検出を行いたい範囲が事前に分かっている場合には、検出したい移動体の最小サイズとその画像上での動きに合わせて閾値Rを設定すればよい。また、シーンに合わせて、閾値Rを変えながら検出率と誤検出率を算出し、検出率と誤検出率が等しくなる、すなわちEER(Equal Error Rate)となる閾値Rを選択することも可能であるし、検出率を優先したり、誤検出率を小さくすることを優先して閾値Rを選択することも可能である。
以上の処理によって、領域分割部104は、測地距離が無限大とならない移動軌跡の組は連続とすることで同じクラスタと判定することができ、測地距離が無限大となる移動軌跡の組は不連続とすることによって、不連続点をもとにクラスタを分離することができる。
出力部105では、S106でクラスタに分離された移動軌跡を、領域分割の結果として、装置の内部(メモリ等)又は外部(記録媒体、ディスプレイ装置等)に出力する。これによって、移動体を検出することができる。
なお、本実施の形態では、移動軌跡に対して上記式3もしくは上記式4のような距離を計算することによって、画素の位置と動きの類似性とを考慮した領域分割が可能になる。そのため、図7(a)〜(c)に示される例では、頭部の動きと腕の動きの違い、上腿と下腿との動きの違いが反映され、頭部、腕、上腿(じょうたい)、下腿(かたい)を別々のクラスタとして領域分割することができる。さらに、本方法は、同様の方法によって、一つの移動体のボディパーツの検出、領域分割だけでなく、複数人が存在するシーンにおいて、それぞれの移動体を検出、領域分割することも可能である。
このように、測地距離を用いて算出した不連続点をもとにクラスタリングを行うことで、結果として移動体を検出及び領域分割を行うことができる。
以上のようにして、画素間の距離あるいは移動軌跡の類似性に基づいてクラスタリングを行うことによって、類似する移動軌跡がまとめられて領域分割が行われるので、距離が近く、かつ、類似する動きをする部位が一つの領域として認識され、動画像中を移動する物体の領域を時間的に追跡した結果として、関節物体の姿勢によらずに、動画像中の移動体もしくは、移動体の部位の検出、移動体を含む画像の領域分割をすることができる。また、前処理として人物候補領域を設定する必要がなく、移動軌跡の類似性に基づいて複数の閾値を用いてクラスタリングを行うため、画像中でさまざまな大きさの移動体が存在する場合や、移動体の一部が隠れている場合に特に問題となる人物候補領域の検出ミス、それに起因する領域分割の失敗がない。さらには、不連続点に基づいたクラスタリングは、クラスタサイズの大きさに影響を受けないクラスタリングが可能であるため、大きな被写体と小さな被写体が混在する場合や、大きな動きの被写体と小さな動きの被写体が混在する場合においても、確実に抽出することが可能である。
以上のように、膨大なパラメータのフィッティングを必要とせずに、非線形空間でクラスタリングを行うことによって、形状が変化しながら移動する人物等を含む動画像に対しても正しく領域分割し、これによって動画像中の移動体の検出を行うことが可能となる。
なお、本発明に係る移動体検出装置は、本実施の形態における測地距離の不連続点にもとづいた領域分割とは異なる方法で領域分割をしてもよい。以下、実施の形態1における領域分割と異なる方法、ここでは、測地距離への変換をすることなく領域分割をする方法について、実施の形態1の変形例として説明する。
本変形例に係る移動体検出装置の構成は、基本的には、図1に示されるように、画像入力部101、動き解析部102、距離算出部103、領域分割部104、出力部105を備える。そして、この移動体検出装置100は、動画像中の移動体の全部又は一部の領域を特定する領域分割をすることによって動画像中の移動体を検出する。画像入力部101、動き解析部102、距離算出部103は実施の形態1と同様であるため説明を省略する。本変形例に係る領域分割部104は、実施の形態1と異なる方法で、領域分割をする。以下、本変形例に係る領域分割部104を中心に説明する。
図8は、本発明の実施の形態1の変形例における移動体検出装置の基本動作を示すフローチャートである。なお、本図において、ステップS101〜S104は、図3のステップS101〜S104と同じであるので、説明を省略する。
本変形例に係る領域分割部104は、ステップS205(クラスタリング)とS206(ラベル付け)とを実行する。ステップS205では、領域分割部104は、上記式3もしくは上記式4で算出した移動軌跡iと移動軌跡jとの距離f(i,j)を用いて、f(i,j)が小さい順に移動軌跡iと移動軌跡jとを同一クラスとして結合する処理を繰り返すことによってクラスタリングを行う。図9(a)に示すように、移動軌跡a〜hは、同一移動体であっても、姿勢変化によって大きく変化する。しかしながら、関節で繋がった物体である限り、特に近傍における移動軌跡は高い類似性を保持していることを仮定することができる。ここで、高い類似性とは、移動軌跡iと移動軌跡jとの距離f(i,j)が小さいことを意味する。さらに、f(i,j)が小さいことは、移動軌跡iと移動軌跡jとが移動軌跡からなる高次元空間上に近距離に分布していると解釈することができる。図9(b)は、移動軌跡a〜hを表す高次元空間の概念図である。なお、この概念図では、説明を容易にするため、3次元空間としたが、実際には、上記式2に示したベクトルの各要素が各次元と対応する。また、移動軌跡a〜hの数を8本としたが、実際には、各画素に対応する移動軌跡を用いてもよいし、ブロック単位で求めた移動軌跡を用いてもよい。ここで、移動軌跡a〜hを表す高次元空間の1点が、それぞれ上記式2に示した一つの移動軌跡に対応する。すなわち、高次元空間上の点は、1枚のピクチャ上の領域だけではなく時間的に異なる複数枚のピクチャに渡って画素を追跡した結果である。さらに、高次元空間上で、点と点との距離は、上記式2に示したベクトル間のユークリッド距離ではなく、上記式3もしくは上記式4に示すような距離に対応する。
そして、領域分割部104は、移動軌跡からなる高次元空間上の分布の連続性によって移動軌跡をクラスタリングしていくことによって、移動軌跡間の距離の不連続性をもとにクラスタリングを行う。その結果、各クラスタは、個別の移動体もしくは移動体の一部に対応することが期待でき、移動体の検出と領域分割を行うことができる。
まず、分割する各領域を次のように表現する。
Figure 0004456181
ここで、Mは、領域数であり利用するシーンに応じて経験的に決定する。
まず、自分自身を除くf(i,j)が小さい順に移動軌跡iと移動軌跡jとを同一領域ラベルθmとする処理を行う。この処理を行う上で、移動軌跡iもしくは移動軌跡jの一方が既に領域θkに属している場合には、まだ領域ラベルが付与されていない画素も領域θkに属するようにする。さらに、既に移動軌跡iと移動軌跡jとがそれぞれ異なる領域に属している場合には、領域ラベルを統合する。
ステップS206では、領域分割部104は、ステップS205で行った処理に対して、すべての移動軌跡に対してラベル付けをし、かつ領域数が規定のMになっているか否かを判断する。ここで、ステップS206における条件が満たされていない場合には、領域分割部104は、ステップS205のf(i,j)が小さい順に移動軌跡iと移動軌跡jとを同一領域ラベルθmとする処理を繰り返す。なお、各領域に属する移動軌跡の数が閾値N個以下であれば、外れ値(Outlier)として扱うことで領域から除外してもよい。
ここで、ステップS205とステップS206の処理の具体例を図9(c)及び(d)を用いて説明する。M=2とした場合と、M=3とした場合について説明する。ここで、図9(b)に示される例では、移動軌跡aと移動軌跡bとの距離をf(a,b)とした時に、f(a,b)<f(g,h)<f(d,e)<f(b,c)<f(f,g)<f(c,d)とする。まず、M=2の例について図9(c)を用いて説明する。ここでは、ステップS205において、移動軌跡aと移動軌跡bとの距離f(a,b)が最小であるため、領域分割部104は、移動軌跡aと移動軌跡bに同一の領域ラベルθ1を付与する。次に、移動軌跡gと移動軌跡hとの距離f(g,h)が2番目に小さいため、領域分割部104は、同一の領域ラベルθ2を付与する。さらに、3番目に小さい距離である移動軌跡dと移動軌跡eに対して、領域分割部104は、同一の領域ラベルθ3を付与する。次に距離が小さいのは、移動軌跡bと移動軌跡cとの距離f(b,c)である。ここでは、移動軌跡bがすでにラベル付けされているため、領域分割部104は、移動軌跡cに移動軌跡bと同一の領域ラベルθ1を付与する。次に距離が小さいのは、移動軌跡fと移動軌跡gとの距離f(f,g)である。ここでは、f(b,c)の場合と同様に、領域分割部104は、移動軌跡fに対して移動軌跡gと同一の領域ラベルθ3を付与する。ここでM=3とした場合は、ステップS206にて、すべての移動軌跡にラベルが付与され、M=3となると判断されるため、出力部105にて、各移動軌跡にラベル付けした結果を出力して処理を終了する。
一方、M=2と設定した場合には、ステップS206にて条件を満たさないことが起こる。そこで、再度ステップS205にて、領域分割部104は、次に小さい距離をなす移動軌跡cと移動軌跡dについて移動軌跡cが属する領域ラベルθ1と移動軌跡dが属する領域ラベルθ3とを統合して、移動軌跡aからeの移動軌跡に対して、領域ラベルθ1を付与する。そして、ステップS206にて、領域分割部104により、すべての移動軌跡にラベルが付与され、M=2となると判断されるため、出力部105にて、各移動軌跡にラベル付けした結果を出力して処理を終了する。
このように、本実施の形態1の変形例では、移動軌跡に対して上記式3もしくは上記式4のような距離を計算することによって、画素の位置と動きの類似性とを考慮した領域分割が可能になる。そのため、図9(a)〜(d)に示される例において、M=2の場合は、下半身の動きが上半身の動きと大きく異なることが反映されて、上半身と下半身とに分離される。さらに、M=3の場合は、M=2の場合に加えて、頭部の動きと腕の動きの違いが反映され、上半身、腕、下半身とを分離することが可能になる。
このように、類似した移動軌跡に対して、順々に領域ラベルを付与することによって、高次元空間上で連続している移動軌跡を一つのクラスタと判断し、移動軌跡間の距離が大きいところを不連続点として、それぞれのクラスタを分離することが可能となる。その結果、各クラスタに属する移動軌跡が移動体検出及び領域分割に対応する。
もちろん、本方法は、同様の方法によって、一つの移動体のボディパーツの検出、領域分割だけでなく、複数人が存在するシーンにおいて、それぞれの移動体を検出、領域分割することも可能である。
以上のようにして、画素間の距離あるいは移動軌跡の類似性に基づいてクラスタリングを行うことによって、類似する移動軌跡がまとめられて領域分割が行われるので、距離が近く、かつ同様の動きをする部位が一つの領域として認識され、動画像中を移動する物体の領域を時間的に追跡した結果として、関節物体の姿勢によらずに、動画像中の移動体もしくは、移動体の部位の検出、移動体を含む画像の領域分割を行うことができる。また、前処理として人物候補領域を設定する必要がなく、移動軌跡の類似性に基づいてクラスタリングを行うため、画像中でさまざまな大きさの移動体が存在する場合や、移動体の一部が隠れている場合に特に問題となる人物候補領域の検出ミス、それに起因する領域分割の失敗がない。
以上のように、膨大なパラメータのフィッティングを必要とせずに、非線形空間でクラスタリングを行うことによって、形状が変化しながら移動する人物等を含む画像に対しても正しく領域分割し、これによって動画像中の移動体の検出を行うことが可能となる。
(実施の形態2)
次に、上記実施の形態1で行った非線形空間上での領域分割を、実施の形態1とは異なる方法で実現する方法について、実施の形態2として説明する。
図10は、実施の形態2における移動体検出装置100aの構成を示す機能ブロック図である。本移動体検出装置100aは、図10に示すように、画像入力部101、動き解析部102、距離算出部103、領域分割部104a(領域分割候補生成部501と領域分割候補選択部502)及び出力部105を備える。画像入力部101、動き解析部102、距離算出部103は実施の形態1と同様であるため説明を省略する。
領域分割部104aは、距離算出部103で算出された距離に基づいて、類似する移動軌跡をもつブロックから構成される領域を特定することによって領域分割をする点で、実施の形態1の領域分割部104と同じであるが、その具体的な処理が異なる。そのために、この領域分割部104aは、領域分割候補生成部501と領域分割候補選択部502とを備える。
領域分割候補生成部501は、領域分割に用いられる判断基準を複数個生成し、生成した複数個の判断基準のそれぞれについて、当該判断基準を用いて、動き解析部102で算出された複数の移動軌跡をクラスタリングすることによって領域分割をし、その領域分割の結果を領域分割候補として生成する処理部である。具体的には、この領域分割候補生成部501は、距離算出部103で算出した距離マトリクスに対してデータの連続性に関する閾値を用いて測地距離変換を適用し、つまり、距離算出部103で算出された複数の距離のうち当該閾値よりも小さい距離を連結することで複数の距離のそれぞれを測地距離に変換し、それぞれの閾値における測地距離変換後の移動軌跡間の距離の分布における不連続点を検出し、検出した不連続点よりも小さい測地距離だけ離れた移動軌跡どうしが一つのクラスタとなるように、連続に分布する移動軌跡をクラスタリングすることによって、前記閾値に対する領域分割の候補を生成する。ここでは、前記閾値の設定によって、領域分割数が変化する。
領域分割候補選択部502は、クラス数についての指示(あるいは、予め設定されたクラス数)を取得し、取得したクラス数に近い個数の領域に分割された領域分割候補を、領域分割候補生成部501で生成された複数の領域分割候補から選択し、選択した領域分割候補を、距離算出部103で算出された距離に基づく領域分割の結果として出力する処理部である。具体的には、この領域分割候補選択部502は、領域分割候補生成部501で生成した、それぞれの前記閾値に対する領域分割の候補から、あらかじめ定めたクラス数に最も近い領域分割結果を選択する。すなわち、クラス数に応じた閾値による領域分割結果を選択することになる。
出力部105は、実施の形態1と同様である。この出力部105からの出力により、最終的な移動体の検出と領域分割結果を得ることができる。
以下に、本発明の移動体検出方法、つまり、移動体検出装置100aの動作について、図11のフローチャートを用いて移動する移動体を検出、領域分割する例について詳細に説明する。ステップS101からS104までは、実施の形態1と同様であるため説明を省略する。
領域分割候補生成部501は、ステップS601(測地距離変換)とステップS602(クラスタリング)とを実行する。ステップS601では、領域分割候補生成部501は、上記式3もしくは上記式4で算出した線形距離f(i,j)に対してK個の閾値Rkを用いて、それぞれの閾値Rkに対して以下のように非線形化処理を行いf'k(i,j)を算出する。
Figure 0004456181
つまり、領域分割候補生成部501は、移動軌跡iに着目した時に移動軌跡iとの線形距離が小さい順にRk個の移動軌跡jを選択し、選択された移動軌跡jとの距離は変更せず、選択されなかった移動軌跡jとの距離を無限大に変更する。なお、ここでは、線形距離が小さい順に選択したが、次式のように閾値Rkを設定してもよい。
Figure 0004456181
つまり、領域分割候補生成部501は、上記式22に示すように、動き解析部102で算出された複数の移動軌跡のそれぞれについて、距離が小さい順に予め定められた個数の移動軌跡を選択し、選択されなかった移動軌跡との距離を無限大に変更する非線形化をした後に、複数の距離のそれぞれを測地距離に変換してもよいし、上記式23に示すように、動き解析部102で算出された複数の移動軌跡のそれぞれについて、距離が予め定められた閾値以下の移動軌跡を選択し、選択されなかった移動軌跡との距離を無限大に変更する非線形化をした後に、複数の距離のそれぞれを測地距離に変換してもよい。
なお、距離の非線形化に関しては、上記の関数に限定されるものではなく、移動軌跡iと移動軌跡jに関する距離に対して非線形変換を行うものであれば何でもよい。
さらには、線形距離f(i,j)に対して、前述した式16及び式17を用いて計算した重みを掛け算して重み付けを行った後に上記式22もしくは上記式23の処理を行ってもよい。
上記式17や上記式18の重みを用いてf(i,j)を変換することによって、移動軌跡i及びjと類似した移動軌跡が空間的に密集している場合(距離が近い移動軌跡の場合)には、f(i,j)を相対的に小さく、また、空間的に疎な場合(距離が遠い移動軌跡の場合)には、密集している場合と比較してf(i,j)が相対的に大きくなる。つまり、距離算出部103で算出された複数の距離のそれぞれを測地距離に変換するときに、動き解析部102で算出された複数の移動軌跡の分布における密集度が大きいほど小さい測地距離となるような重み付けをしたうえで、測地距離への変換をする。これによって、画素の移動軌跡の分布の密集度を考慮した距離変換が可能になる。
次に、非線形化された距離f'k(i,j)を用いて、領域分割候補生成部501は、次式のように測地距離を算出する。
Figure 0004456181
なお、min(x,y)は、値xと値yのうち小さい方を返す関数である。また、sは、移動軌跡sであり、移動軌跡iから移動軌跡jに辿(たど)りつくための中継点である。ここで、f'k(i,s)+f'k(s,j)における中継点sは1点に限るものではない。なお、kは複数の閾値Rkに対応する。この方法は、前述したようにダイクストラ法と呼ばれる最短経路探索手法である。
次に、ステップS602では、領域分割候補生成部501にて、それぞれの閾値Rkに対応する測地距離変換を行ったgk(i,j)を用いて、不連続点を検出することによってクラスタリングを行う。ここでは、gk(i,j)が無限大となる移動軌跡iと移動軌跡jの間が不連続点である。複数の閾値Rkに対して得た測地距離変換の結果の例を図12(a)〜(f)を用いて説明する。ここで、図12(a)は移動軌跡a〜hを示す図であり、図12(b)は、図12(a)に示した移動軌跡a〜hを表す高次元空間の概念図である。また、移動軌跡a〜hの数を8本としたが、実際には、各画素に対応する移動軌跡を用いてもよいし、ブロック単位で求めた移動軌跡を用いてもよい。ここで、移動軌跡a〜hを表す高次元空間の1点が、それぞれ上記式2に示した一つの移動軌跡に対応する。すなわち、高次元空間上の点は、1枚のピクチャ上の領域だけではなく時間的に異なる複数枚のピクチャに渡って画素を追跡した結果である。さらに、高次元空間上で、点と点との距離は、ベクトル間のユークリッド距離ではなく、上記式21に示すような測地距離に対応する。
閾値Rkが十分に大きな値である場合、例えば、上記式16においてf(i,j)の最大値よりも閾値Rkが大きい場合には、図12(c)に示すように測地距離gk(i,j)は、すべてのi,jの組合せにおいて無限大にならない。すなわち、不連続点が1点もないためクラスタは1個と判断できる。一方、閾値Rkが十分に小さい場合、具体的には、上記式16においてf(i,j)の最小値よりも閾値Rkが小さい場合には、すべてのi,jの組合せにおいてgk(i,j)が無限大となる。すなわち、クラスタ数は移動軌跡の数と同数となる。ここでは、閾値Rkをf(i,j)の最大値と最小値の間の値に設定して、それぞれクラスタリングを行うことが効率的である。図12(d)に示される例について説明する。ここで、図12(b)において、上記式3もしくは上記式4に示した移動軌跡aと移動軌跡bとの距離をf(a,b)とした時に、f(e,f)>f(c,d)>f(f,g)>f(b,c)とする。また、閾値をR1として設定した場合に、距離f(e,f)は、閾値R1よりも大きな値を持つとする。この場合、上記式18によって測地距離を求めてもg1(e,f)は無限大となる。そこで、領域分割候補生成部501は、移動軌跡eと移動軌跡fとの間を不連続点と判定する。この結果、移動軌跡aからdと移動軌跡eとの測地距離は不連続点を通らないため無限大の値を取らず、逆に移動軌跡fからhの各移動軌跡と移動軌跡aからeの各移動軌跡との測地距離は、不連続点g1(e,f)を通るためそれぞれ無限大となる。このように、領域分割候補生成部501は、測地距離が無限大とならない移動軌跡iと移動軌跡jの組は同じクラスタとし、無限大となる場合は別のクラスタとする。これによって、図12(d)のようにθ1、θ2の2つのクラスタに分離することができる。さらに、いま、図12(e)に示すように、閾値をR2(ただし、R1>R2)とした場合に、無限大となる測地距離は、g2(c,d)、g2(e,f)、g2(f,g)であったとする。この場合には、領域分割候補生成部501は、それぞれ、移動軌跡cと移動軌跡dとの間、移動軌跡eと移動軌跡fとの間、移動軌跡fと移動軌跡gとの間が不連続点であると判定し、図12(d)に示される例の場合と同様に測地距離が無限大となる組と無限大にならない組とを整理して、θ1、θ2、θ3、θ4の合計4つのクラスタに分離する。以上の処理によって、測地距離が無限大とならない移動軌跡の組は連続とすることで同じクラスタと判定することができ、測地距離が無限大となる移動軌跡の組は不連続とすることによって、不連続点をもとにクラスタを分離することができる。なお、閾値Rkの設定方法については、f(i,j)の最小値から最大値の間を均等にK個設定することによって、すべての移動軌跡が一つのクラスタと判定されたり、各移動軌跡がそれぞれ個別のクラスタと判断される危険性を減らすといった効果がある。つまり、領域分割候補生成部501は、距離算出部103で算出された複数の距離における最大値と最小値との間の複数の値を、複数の領域分割候補を生成するための複数の閾値として生成してもよい。
さらに、f(i,j)の平均値あるいはメディアンを中心に一定間隔で増加、減少させた値を用いてもよい。f(i,j)の値が比較的均一な場合には、より効率的に不連続点に対応する閾値を決定することができる。つまり、領域分割候補生成部501は、距離算出部103で算出された複数の距離の平均値又は中央値を中心に増加及び減少させて得られる複数の値を、複数の領域分割候補を生成するための複数の閾値として生成してもよい。
また、最大値から一定間隔で値を減少させていき、最初に不連続点を検出した時の値をもとに、より小さい値をK−1個、閾値として決定してもよい。これにより、すべての移動軌跡が一つのクラスタと判定される危険性がなくなるといった効果がある。
さらには、ステップS601とステップS602とを閾値Rkを小さくしながら繰り返しても良い。例えば、図12(d)に示される例のように、領域分割候補生成部501は、閾値R1で、ステップS601とステップS602で、移動軌跡のクラスタリングを行い、次に、ステップS601で、図12(e)に示される例のように、閾値R1で抽出したそれぞれのクラスタに対応するf(i,j)(ここで、i,jは同一クラスタに属する移動軌跡)を、閾値R1より小さな閾値R2を用いてそれぞれ測地距離に変換し、ステップS602で、それぞれのクラスタに対応するg(i,j)(ここで、i,jは同一クラスタに属する移動軌跡)から、不連続点を検出することでクラスタリングを行うことができる。このように、閾値Rkを小さくしながら、測地距離への変換と不連続点の検出を、それぞれのクラスタに属する移動軌跡に対して行うことによって、図12(f)に示すような階層的なクラスタリングが可能になる。もちろん、逆に、閾値を小さな値から順に大きくしてクラスタリングを行うことによって、同様に階層的なクラスタリングが可能になる。ただし、閾値を大きな値から小さくしていくことによって、より大きな閾値で抽出したクラスタに対してのみ、より小さい閾値での測地距離への変換と不連続点の検出処理を行えば良いため、より少ない計算量で処理を行うことができるという効果がある。具体的には、図12(f)に示すように、閾値R2によるクラスタリングは、閾値R1で抽出されたクラスタそれぞれについて行えばよいため、計算に用いるf(i,j)(ここで、i,jは同一クラスタに属する移動軌跡)のトータルでのサイズをより小さくすることができる。そのため、計算量もより少なくてすむ。
そして、上記のように階層的なクラスタリングを行えば、図13(a)〜(c)に示すように、シーンの構造をツリー構造として表すことも可能である。例えば、図13(a)の入力に対して、閾値R1でクラスタリングを行うと、図13(c)に示すように、クラスタθ1とθ2が抽出される。さらに、閾値をより小さなR2としてクラスタリングを行うと、より小さな被写体であるクラスタθ3を抽出することができる。このように、よりカメラから離れた被写体や動きの小さな被写体がより小さな閾値によって抽出されることになるため、このようなシーンの構造を階層構造として獲得することができるという効果がある。例えば、衝突の危険性等を閾値の大きさで表現することも可能である。なお、ここでθ0は、背景に対応する。ここで、カメラが固定の場合は、動きのある移動軌跡のみを用いることで、移動物体のみを抽出することも可能であるし、カメラが動く場合には、最も移動軌跡数の大きいクラスタを背景としても良い。
さらに、上記の例よりも閾値を小さくしてクラスタリングを行った例を図13(b)を用いて説明する。ここでは、簡単のためクラスタθ2について説明するが、すべてのクラスタについてより小さな閾値でクラスタリングを行っても良いし、利用者が指示したクラスタ(被写体)に対して、クラスタリングを行っても良い。まず、クラスタθ2に対して、より小さな閾値R3でクラスタリングを行うと、図13(c)右側に示すように、右脚、左脚と上半身とに分類することができる。一般的に、歩行は、脚の動きが大きいために、他の部位と比較して大きな閾値で抽出される。さらに、より小さな閾値R4でクラスタリングを行うと、右脚、左脚がそれぞれ上腿(θ5、θ7)、下腿(θ6、θ8)に分類され、上半身から腕(θ3)が抽出される。さらに、より小さな閾値R5でクラスタリングを行うと、上半身を頭部(θ1)、胸部(θ2)、腹部(θ4)にクラスタリングすることができる。以上のように、動きの不連続さを反映した階層構造によるクラスタリングが可能になる。これによって、ユーザが見たい粒度で被写体の各部位の動きを見ることができるという効果がある。
すなわち、閾値を小さくしながら処理する場合は、一旦抽出されたクラスタに対して、より小さな閾値でそれぞれのクラスタをより詳細にクラスタリングすることで、すべての移動軌跡の分布を反映した階層的なクラスタリングが実現できる。
また、領域分割候補生成部501は、距離算出部103で算出された複数の距離について、大きい値から小さい値の順に並べた場合における最初の不連続点を検出し、検出した不連続点よりも小さい複数の値を、複数の領域分割候補を生成するための複数の閾値として生成してもよい。
さらには、次のように閾値Rkを設定してもよい。まず、移動軌跡iとN番目に小さい距離となる移動軌跡jを算出し、その値を閾値Rkとして設定し、Rkが大きい順に処理を行ってもよい。この場合、Nは、例えば処理に用いる移動軌跡の数を設定したいクラスタ数で割った値とすることで、希望のクラスタ数に近いクラスタ数となる閾値Rkを設定しやすくなる効果がある。つまり、領域分割候補生成部501は、動き解析部102で算出された複数の移動軌跡のそれぞれについて、当該移動軌跡との距離がN番目に小さい距離を特定し、特定した複数の距離について大きい順から選択した複数の値を、複数の領域分割候補を生成するための複数の閾値として生成してもよい。
次に、ステップS603にて、領域分割候補選択部502は、ステップS602で行った複数のクラスタリング結果から、あらかじめ設定したクラス数に最も近いクラスタ数となったクラスタリング結果を選択する。図12(a)〜(f)に示される例で説明すると、クラス数M=4と設定した場合には、閾値R2の時のクラスタリング結果(図12(e))が選択される。また、クラス数M=2と設定した場合には、閾値R1の時のクラスタリング結果(図12(c))が選択され、出力部105にて、各移動軌跡にラベル付けした結果を出力する。
なお、本実施の形態では、移動軌跡に対して上記式3もしくは上記式4のような距離を計算することによって、画素の位置と動きの類似性とを考慮した領域分割が可能になる。そのため、図12(a)〜(f)の例では、クラス数M=2と設定した場合には、下半身の動きが上半身の動きと大きく異なることが反映されて、上半身と下半身とが別々のクラスタとして領域分割でき、クラス数M=4と設定した場合には、M=2の場合に加えて、頭部の動きと腕の動きの違い、上腿と下腿との動きの違いが反映され、頭部、腕、上腿(じょうたい)、下腿(かたい)を別々のクラスタとして領域分割することができる。
なお、ここでは、閾値の数は2個に限るものではなく、何種類用意してもかまわない。また、設定したクラス数と同数のクラスタリング結果がない場合には、最も近いクラスタ数となったものを選択してもよいし、設定したクラス数よりも小さいクラス数の中から一番近いクラスタ数となったクラスタリング結果を選択してもよいし、同様に、設定したクラス数よりも大きいクラス数の中から一番近いクラスタ数となったクラスタリング結果を選択してもよい。
また、複数の閾値Rkを用いることによって、図12(f)に示すように、閾値R1の時のクラスタリング結果と閾値R2の時のクラスタリング結果を階層構造として得ることができるという効果がある。例えば、M=2、閾値R1の場合のクラスタリングでは、上半身と下半身に分離され、M=4、閾値R2の場合のクラスタリングでは、頭、腕等の各ボディパーツに分離される。そこで、M=2、閾値R1で上半身に分離されたクラスタθ1と、M=4、閾値R2で頭部に分離されたクラスタθ1と腕に分離されたクラスタθ4とは、図12(f)に示すように階層関係として得ることができる。このように、画像中の被写体の構造を階層構造として抽出することも可能である。
さらに、本方法は、同様の方法によって、一つの移動体のボディパーツの検出、領域分割だけでなく、複数人が存在するシーンにおいて、それぞれの移動体を検出、領域分割することも可能である。
このように、複数の閾値に対して、測地距離を用いて算出した不連続点をもとにクラスタリングを行い、規定したクラス数に最も近いクラスタリング結果を選択することによって、結果として検出及び領域分割を行うことができる。
以上のようにして、画素間の距離あるいは移動軌跡の類似性に基づいてクラスタリングを行うことによって、類似する移動軌跡がまとめられて領域分割が行われるので、距離が近く、かつ類似する動きをする部位が一つの領域として認識され、動画像中を移動する物体の領域を時間的に追跡した結果として、関節物体の姿勢によらずに、動画像中の移動体もしくは、移動体の部位の検出、移動体を含む画像の領域分割をすることができる。また、前処理として人物候補領域を設定する必要がなく、移動軌跡の類似性に基づいて複数の閾値を用いてクラスタリングを行うため、画像中でさまざまな大きさの移動体が存在する場合や、移動体の一部が隠れている場合に特に問題となる人物候補領域の検出ミス、それに起因する領域分割の失敗がない。
さらには、本実施の形態における不連続点に基づいたクラスタリングは、クラスタサイズの大きさに影響を受けないクラスタリングが可能であるため、大きな被写体と小さな被写体が混在する場合や、大きな動きの被写体と小さな動きの被写体が混在する場合においても、確実に抽出することが可能である。また、閾値を減少させながらクラスタリングを行うことで、粗いクラスタリングから詳細なクラスタリングまでを階層的に行うことができるため、シーンの構造や被写体のボディの構造を階層的に抽出することが可能になる。これにより、画像中の被写体の存在位置を抽出するような粗い画像の解析から、特定の画像領域や被写体領域の詳細な解析までを同一の方式で行えるという効果がある。また、抽出した階層構造は、すべての移動軌跡のデータ構造を示すことになるため、入力画像におけるシーンの構造を表すことも可能である。
以上のように、膨大なパラメータのフィッティングを必要とせずに、非線形空間でクラスタリングを行うことによって、形状が変化しながら移動する人物等を含む動画像に対しても正しく領域分割し、これによって動画像中の移動体の検出を行うことが可能となる。
(実施の形態1及び2の第1変形例)
次に、本発明の実施の形態1及び2の第1変形例における移動体検出装置について説明する。ここでは、実施の形態1及び2において移動体を検出及び部位を領域分割した結果を画像として表示する機能を付加した例について説明する。ここでは、実施の形態1における変形例について述べるが、実施の形態1の変形例、実施の形態2においても同様に適用可能である。このような第1変形例に係る移動体検出装置100bは、図14の機能ブロック図に示すように、画像入力部101、動き解析部102、距離算出部103、領域分割部104及び出力部105aを備える。ここで、出力部105aは、実施の形態1における出力部105の機能に加えて、画像表示部1001を有し、その画像表示部1001によって、分割した領域を画像としてモニタ等に表示することが可能である。
画像表示部1001は、領域分割部104で得られた領域分割の結果を、画像入力部101で受け付けた動画像(ピクチャ)に重ねて表示する処理部であり、例えば、LCD等のディスプレイ及びその表示制御部からなる。図15(a)及び(b)は、画像表示部1001による表示例を示す図である。ここでは、図15(a)にM=3として移動体をそれぞれ領域分割した例を、図15(b)にM=8として、1つの移動体の領域分割を行った例を示す。このように、領域θmに対応する画像上での領域を色分け等して、分割された領域をそれぞれ区別できるようにしてモニタ等に表示する。図15(a)のように移動体ごとに色分けして表示してもよいし、図15(b)のように、部位ごとに別個に表示してもよい。つまり、図15(a)及び(b)から分かるように、本発明に係る移動体検出装置は、上述した領域分割によって、複数の移動体を検出することもできるし(図15(a))、一つの移動体を構成する複数の部分を検出する、つまり、一つの移動体に対して領域を分割することもできる(図15(b))。
ここで、上記式2に示した移動軌跡iは、アウトライアを除いて領域θmのいずれかに対応する。そのため、領域θmに属する移動軌跡iに基づいてピクチャ上の画素を選択し、領域ラベルmに基づいて色分け等を行えば容易に分割した領域を画像上に表示することができる。これによって、実施の形態1及び2で説明した、形状が変化しながら移動する人物等を含む動画像に対しても正しく領域分割できるという効果に加えて、分割した領域を動画像上に表示することで、ユーザがそれぞれの移動体もしくは移動体の部位、さらにはその動きを区別しやすくなるという効果がある。
(実施の形態1及び2の第2変形例)
次に、本発明の実施の形態1及び2の第2変形例における移動体検出装置について説明する。ここでは、実施の形態1及び2において移動体を検出及び部位を領域分割した結果をそれぞれ分割した領域ごとに記録・送信する機能を付加した例について説明する。ここでは、実施の形態1における変形例について述べるが、実施の形態1の変形例、実施の形態2においても同様に適用可能である。このような第2変形例に係る移動体検出装置100cは、図16の機能ブロック図に示すように、画像入力部101、動き解析部102、距離算出部103、領域分割部104及び出力部105bを備える。ここで、出力部105bは、実施の形態1における出力部105の機能に加えて、記録・送信部1201を有する。
記録・送信部1201は、領域分割部104での領域分割の結果に基づいて、画像入力部101で受け付けたピクチャにおける領域を特定し、特定した領域ごとに、対応する領域分割の結果を、メモリやハードディスク等の記録媒体に記録する、又は、通信インターフェース等を介して外部に送信する処理部である。つまり、この記録・送信部1201は、画像表示の場合と同様に、領域分割した結果画像を領域ラベルθmに応じてそれぞれ別々に記録・送信する。また、各領域に属する動き情報を以下のように平均化することで、動き情報を圧縮することも可能である。通常であれば画素ごとに動き情報を保持する必要があるが、以下の処理を行えば1つの領域に対して1つの動きを保持するだけでよい。例えば、動き情報として画素iの動きベクトル(ui t,vi t)を用いた場合には、以下のように分割された領域ごとに平均化した動き情報を計算することができる。
Figure 0004456181
Figure 0004456181
ここで、Cmは、領域θmに属する画素数もしくは移動軌跡の数である。uCm t,vCm tは、それぞれ、領域θmに属する画素の動きベクトルである。図17に図15(a)に示される処理結果について時刻Tからt枚の画像を入力として領域分割を行い、その結果を用いてセグメント領域を記録、送信する例を示す。識別子として各領域ラベルθmと、各領域ラベルθ1からθ3に属する時刻Tにおけるピクチャの画素位置と画素値、そして、各領域ラベルに対応する時刻Tから時刻T+tまでの動きベクトルum T,vm T,um T+1,vm T+1,…,um T+t,vm T+tを記録、送信する。もちろん、画像の画素位置と画素値を用いる代わりに、時刻Tにおける1枚のピクチャに対して、画素ごとに各領域ラベルを付けて送信してもかまわない。これにより、動き情報を領域数分送信するだけで済むために、ピクチャをt枚送信する場合と比べて、効率よく記録、送信することができるといった効果がある。特には、領域数が画素数に比べて少なければ少ないほど効率がよい。さらには、図13(c)に示したように、階層的なクラスタリング結果に応じて、記録、送信しても良い。たとえば、データの記憶容量や転送容量が小さい場合は、より大きな閾値でのクラスタリング結果に対応する動きベクトルを記録、送信しても良いし、階層順に粗いクラスタリング結果に基づいた動きベクトルから、詳細なクラスタリング結果に基づいた動きベクトルを順次、記録、送信しても良い。このように、記録時間や送信容量に適応的な記録、送信が可能になるという効果がある。
なお、アフィン動きを用いて動き情報を圧縮する場合は上記、式25及び上記式26の代わりに、アフィン動きに基づいて移動した画素位置の平均値を計算するとよい。以上のようにして、画素の動き情報を圧縮しながら領域の記録、送信が可能である。これによって、実施の形態1及び2で説明した、形状が変化しながら移動する人物等を含む動画像に対しても正しく領域分割できるという効果に加えて、それぞれの領域に対して1つの動き情報を用いることで高い符号化効率を実現できるという効果がある。
さらには、別途、セグメント領域復元部を設けることによって、送信、記録した情報を復元することも可能である。具体的には、図15(a)及び(b)に示した各領域ラベルに対応する画素位置と画素値から、時刻Tのピクチャを復元する。さらに、画素の移動軌跡情報を用いて、時刻Tの各画素を移動させることによって、時刻T+1からT+tのピクチャを復元することが可能である。ここで、固定カメラを用いる場合には、画素の移動軌跡情報が0でない情報のみを用い、さらにセグメント領域復元部にて背景画像をあらかじめ取得、保持しておくことで、復元した画像を背景画像に上書きしても良い。これにより、効率よく送信、記録された情報を用いて、低計算量でピクチャとして復元できるといった効果がある。
(実施の形態1及び2の第3変形例)
次に、本発明の実施の形態1及び2の第3変形例における移動体検出装置について説明する。ここでは、2つ以上の距離尺度を用いることで、検出と領域分割をより高精度に実現する例について説明する。ここでは、実施の形態1における変形例について述べるが、実施の形態1の変形例、実施の形態2においても同様に適用可能である。このような第3変形例に係る移動体検出装置は、実施の形態1と同じ構成であるため、その構成の説明は省略する。
実施の形態1及び2と異なる点は、距離算出部103での処理である。
距離算出部103では、より高精度に処理するために、追加のパラメータを用いている点が実施の形態1と異なる。以下、実施の形態1と異なる点を中心に説明する。
距離算出部103は、移動軌跡間の画像上での距離及びその変動に関する距離尺度と、画素間が画像上で成す角度(つまり、画素どうしを接続する直線の傾斜角度(その直線とピクチャの横軸とが成す角度))及びその変動に関する距離尺度とを用い、それぞれの距離尺度について距離マトリクスを算出する。そして、両マトリクスを統合することによって、より高精度な処理を実現する。
ここでは、図3に示した処理のフローチャートに沿って説明する。まず、ステップS101からS103までは実施の形態1と同じであるため、説明を省略する。
次に、ステップS104にて、距離算出部103は、上記式2で算出した移動軌跡iを用いて画素動きの類似性を含む距離マトリクスを算出する。ここでは、上記式3もしくは上記式4に示した距離f(i,j)に加えて、2つ目の距離尺度として、画素iと画素jが成す角度に基づいた、以下の式27で示される距離f2(i,j)を用いる例について説明する。
Figure 0004456181
ここで、waは重み係数であり、設計者が設定するパラメータである。また、a_meanij、a_varijについては以下に示す。
Figure 0004456181
Figure 0004456181
ここで、
Figure 0004456181
上記のように、画素iと画素jが成す角度及びその変動成分を用いて画素の動きの類似性を表現することができる。これによって、剛体のみならず、関節物体等の特に回転運動を伴う形状変化を捉えることができる。
なお、f2(i,j)は、画素動きの類似性を評価できる距離値であれば何を用いてもよく、例えば 上記式28〜式30の代わりに下記の式31から式33を用いてもよいし、下記の式33の代わりに上記式2のアフィンパラメータAi tを用いた下記の式34を用いてもよい。下記式31から式33は、画素iと画素jの動きベクトルの角度差及びその変動成分を用いて画素の動きの類似性を表現することができる。これによって、回転を含む動きの変化を捉えることができる。下記式34は、画素iと画素jの近傍ブロックのアフィンパラメータの差及びその変動成分を用いて画素の動きの類似性を表現することができる。これによって、回転、並進移動、スケール変化を含む動きの変化を捉えることができる。
Figure 0004456181
Figure 0004456181
ただし、
Figure 0004456181
Figure 0004456181
次に、次式35のように、上記式3で求めた距離マトリクスに上記式27で算出した距離マトリクスを追加する。ここでは、画素間の距離と画素間が成す角度の2つについて説明するが、他の画素動きの類似性を表現した距離を用いて3つ以上の距離を求めてもかまわない。
Figure 0004456181
ここで、wは、設計者が設定する重み係数である。
上記式35で算出した距離マトリクスを用いて、ステップS105以降、同様の処理を行えばよいため以降の説明を省略する。
以上のようにして、本実施の形態の移動体検出装置によれば、画素間の画像上での距離及びその変動に関する距離尺度と、画素間が画像上で成す角度及びその変動に関する距離尺度とを用い、それぞれの距離尺度について距離マトリクスを算出し、それぞれの距離マトリクスを統合した後、連続性に基づいてクラスタリングを行うことで、より高精度に動画像中を移動する物体の領域を時間的に追跡した結果として検出、領域分割することができる。さらに、画素間がピクチャ上で成す角度とその変動を距離尺度として用いることによって、特に関節運動に起因する回転運動をより正確に捉えることができる。また、前処理として人物候補領域を設定する必要がなく、移動軌跡の類似性に基づいてクラスタリングを行うため、画像中でさまざまな大きさの移動体が存在する場合や、移動体の一部が隠れている場合に特に問題となる人物候補領域の検出ミス、それに起因する領域分割の失敗がない。
以上のようにして、より高精度に、形状が変化しながら移動する人物等の移動体を検出及び部位を領域分割することができる。
(実施の形態3)
本実施の形態では、実施の形態1及び2で説明した移動体検出方法を用いて、移動体を検出及び領域分割を行った結果から、移動体の動きを予測する機能を付加した移動体検出装置について説明する。ここでは、実施の形態1に沿って説明するが、実施の形態1、2、それらの変形例においても同様に実現可能である。
図18は、実施の形態3における移動体検出装置100dの構成を示す機能ブロック図である。図18に示すように、本実施の形態における移動体検出装置100dは、画像入力部101、動き解析部102、距離算出部103、領域分割部104、出力部105に動き予測部1401を付加することによって、移動体の動きを予測する機能を有する。
動き予測部1401は、領域分割した結果から、各領域に含まれる画素の移動軌跡から代表軌跡を算出し、前記代表軌跡をもとに移動体の動きを予測する。図19に実施の形態3による処理のフローチャートを示す。ステップS101からS106までは、実施の形態1と同様であるため説明を省略する。
次に、ステップS1501では、動き予測部1401は、ステップS105及びS106で行った領域分割結果を用いて、以下のようにクラスタの代表点及びその代表軌跡を求める。
ここで、領域θmに属する画素の移動軌跡をxCmと表現することとする。次の式36のように、クラスタ領域θmごとに代表の移動軌跡を求める。ここでは、代表の移動軌跡として、平均移動軌跡を算出する例について説明するが、下記の計算に対して画素の移動軌跡xCmごとに重み付け等を行ってもよいし、画像上でのクラスタの重心に対応する画素の移動軌跡を代表の移動軌跡としてもよい。
Figure 0004456181
ここで、Cmは、領域θmに属する画素数もしくは画素の移動軌跡の数である。
図20に上記式36に基づいてクラスタ領域θmごとに代表の移動軌跡を求める例を示す。ただし、見やすさを考慮して、頭部に対応するクラスタ領域θ1と脚部に対応するクラスタ領域θ8に関する代表の移動軌跡のみを示している。図中の×は、それぞれ時刻tに対応するxm-の要素であり画素位置を示している。さらに、上記式3や上記式4に示したように、非線形空間上でのクラスタリングによる領域分割は、画素動きの類似性を考慮して行われるため、単純に近接した画素の移動軌跡の時間平均を求めるような方法と比較して、動きが類似した画素の移動軌跡のみを用いて算出できるため、より高精度に代表の移動軌跡を求めることができる。このように、クラスタ領域ごとに代表の移動軌跡を求めることによって、部位ごとの動きを正確かつ簡便に表現することができる。
次に、ステップS1502では、動き予測部1401は、ステップS1501にて算出した代表の移動軌跡から、時刻Tより先の時刻における移動体の位置を予測する。初めに、代表の移動軌跡から加速度を算出し、T+1以降の移動体の位置を予測する例について説明する。3枚以上の時系列画像が入力された場合は、次の式37のように代表の移動軌跡xm-ごとに加速度ベクトルsmを得ることができる。
Figure 0004456181
ここで、um tは動きベクトルであり、次の式38のように表すことができる。
Figure 0004456181
上記式37の加速度ベクトルを用いて、図20にて破線の矢印及び○で示したように、移動体の部位ごとに、時刻T+t'における移動体の部位位置posm(T+t')を以下の式39のように予測することができる。ここでは、移動体の部位を例として挙げたが、図15(a)及び(b)に示した検出例から、移動体ごとの位置を予測することも可能である。
Figure 0004456181
そして、出力部105にて、ステップS1502で予測した移動体の位置や移動体部位の位置を出力する。これにより、加速度を加味した予測が可能である。動きが急激に早くなったり、急激に止まったりといった場合に、その加速度を反映して移動体の位置を予測することができるといった効果がある。また、動きベクトルの代わりにアフィンパラメータを用いてもかまわない。アフィンパラメータは、回転運動を含む動きの表現が可能であり、腕あるいは足の回旋運動の表現に適しているため、特に関節物体の位置をより正確に予測することができる。
さらに、前述した動きベクトルと加速度の代わりに、代表の移動軌跡xmに対して直接N次関数をフィッティングすることも可能である。T枚の時系列に並んだ画像を入力とした場合、xm-に含まれるT個の画像上での位置情報に対してN次の関数でフィッティングすることができる。これにより、フィッティングした関数の値に沿うように、時刻(T+t')における画像上での位置posm(T+t')を推定することが可能である。具体的には、関数でフィッティングすることによって、より滑らかな動きを表現することが可能となるため、より高精度な予測が可能となる。特には、フィッティングした関数に沿った予測が可能であるため、フィッティングした関数が本来の動きが近い場合に動き予測の精度が高い。もちろん、これらの画像上での位置予測は、時間的内挿にも利用可能である。
以上のように、本実施の形態によれば、動きが類似した画素の移動軌跡を同一のクラスタとして算出できるため、高精度に代表の移動軌跡を求めることができる。特に関節物体等に対して部位ごとの動きを表現することが可能であり、前処理として人物候補領域を設定することなく、高精度に移動体の部位位置を予測することが可能であるという効果がある。
以上、本発明に係る移動体検出方法及び移動体検出装置について、実施の形態及びその変形例に基づいて説明したが、本発明は、これらの実施の形態及び変形例に限定されるものではない。当業者が思いつく各種変形を、本発明の趣旨を逸脱しない範囲で各実施の形態に施して実現される形態も本発明に含まれる。
また、これまでに説明した全ての実施の形態及び全ての変形例における特徴的な構成要素を任意に組合せて実現される形態も本発明に含まれる。
(測地距離変換の補足)
最後に、測地距離変換を用いた領域分割によって分割される画像上の領域の性質について説明する。ここでは、一例として、実施の形態2で説明した方法を用いた場合に、領域分割可能な移動体の性質について補足する。図21(a)〜(c)に実施の形態2の方法を用いた場合に分離可能な図形の一例を示す。実施の形態2の方法を用いることで、それぞれ図形θ1とθ2とに領域分割することが可能である。ここでは、図21(a)〜(c)に示したそれぞれの図形θ1とθ2の移動方向は、同一であっても、異なっていてもかまわない。ただし、図形θ1に属する画素はすべて同じ動きであり、かつ図形θ2に属する画素はすべて同じ動きであることが条件である。
実施の形態2におけるステップS601では、図5に示したような特徴を持つ測地距離変換を行う。これによって、通常のユークリッド距離とは異なり、移動軌跡から移動軌跡を辿(たど)った距離を算出することができるという特徴がある。そのため、図21(a)から(c)に共通するように湾曲した形状に対して、その形状に沿った距離を算出することができる。
さらに、ステップS602では、測地距離が無限大となる移動軌跡と移動軌跡の間を不連続点としてクラスタリングを行う。このため、移動軌跡と移動軌跡の間に閾値以上の距離がある場合には、その不連続点をもとに、それぞれθ1とθ2とを領域分割することが可能である。
以上のように、測地距離変換を伴う領域分割を用いれば、湾曲した形状を含む移動体でかつ一定の不連続点がある場合に、不連続点をもとに領域を分割することが可能である。
一方で、ステップS601の処理を行わない場合には、θ1に属する移動軌跡とθ2に属する移動軌跡との距離がユークリッド距離で算出されるため、図5で説明した場合と同様に、点iと点jの距離は、点iと点kの距離より大きくなる。すなわち、同一クラスに属している点間の距離が別クラスに属している点間の距離よりも大きくなる。さらに、ステップS602の処理にて、測地距離変換を行わないとデータを辿(たど)る処理を行わないために、隣接する移動軌跡と移動軌跡の間が不連続か連続かを判断することができない。そのため、図21(a)〜(c)に示すような例では、湾曲した形状を含む移動体でかつ一定の不連続点がある場合に、不連続点をもとに領域を分割することは難しい。
よって、本発明に係る移動体検出方法及び装置では、このような測地距離を用いたクラスタリングにより、直線的な距離であるユークリッド距離を用いたクラスタリングに比べ、移動軌跡間の類似性に関する連続性を考慮したクラスタリングが行われ、入り組んだ複雑な関係の領域どうしであっても、同一の物体(又は部位)に属するか別個の物体(又は部位)に属するかが確実に弁別される。
本発明は、動画像中の移動体の全部又は一部を検出する装置、つまり、複数枚の画像における1個以上の画素からなるブロックの動きに基づいて、形状が変化しながら移動する人物等の移動体を含む画像を領域分割することによって画像中の移動体を検出する移動体検出装置として、例えば、運動解析装置、監視装置、ビデオカメラあるいはTV等のAV機器に内蔵させる移動体検出装置等として利用することが可能である。
100、100a〜100d 移動体検出装置
101 画像入力部
102 動き解析部
103 距離算出部
104、104a 領域分割部
105、105a、105b 出力部
501 領域分割候補生成部
502 領域分割候補選択部
1001 画像表示部
1201 記録・送信部
1401 動き予測部

Claims (21)

  1. 動画像中の移動体の全部又は一部の領域を分割することによって動画像中の移動体を検出する方法であって、
    動画像を構成する複数枚のピクチャを受け付ける画像入力ステップと、
    前記ピクチャを構成する1個以上の画素からなるブロックごとに、時間的に隣接する2枚のピクチャ間での画像の動きを検出し、検出した動きを前記複数枚のピクチャについて連結することで、移動軌跡を算出する動き解析ステップと、
    前記動き解析ステップで算出された複数の移動軌跡について、移動軌跡間の類似性を表す距離を算出する距離算出ステップと、
    前記距離算出ステップで算出された距離のうち、予め定められた閾値よりも小さい距離を連結することで、前記距離算出ステップで算出された距離を測地距離に変換し、得られた測地距離の分布における不連続点を検出し、検出した不連続点よりも小さい測地距離だけ離れた移動軌跡を一つのクラスタとすることによって前記領域分割をする領域分割ステップと、
    前記領域分割ステップで領域分割された結果を出力する出力ステップと
    を含む移動体検出方法。
  2. 前記領域分割ステップでは、前記距離から前記測地距離への変換において、第1の移動軌跡と第2の移動軌跡との間の距離を測地距離に変換する場合には、前記距離算出ステップで算出された距離のうち、前記予め定められた閾値よりも小さい距離だけ離れた移動軌跡をたどりながら前記第1の移動軌跡から前記第2の移動軌跡に至る経路の距離を、測地距離として算出する
    請求項1記載の移動体検出方法。
  3. 前記領域分割ステップでは、前記距離算出ステップで算出された距離を測地距離に変換するときに、前記複数の移動軌跡の分布における密集度が大きいほど小さい測地距離となるような重み付けをしたうえで、前記変換をする
    請求項1記載の移動体検出方法。
  4. 前記領域分割ステップは、前記領域分割に用いられる閾値を複数生成し、生成した複数の閾値のそれぞれについて、前記距離算出ステップで算出された距離のうち、当該閾値よりも小さい距離を連結することで、前記距離算出ステップで算出された距離を前記測地距離に変換し、得られた複数の測地距離の分布における不連続点を検出し、検出した不連続点よりも小さい測地距離だけ離れた移動軌跡を一つのクラスタとすることによって前記領域分割をし、その領域分割の結果を領域分割候補として生成する領域分割候補生成ステップと、
    クラス数についての指示を取得し、所得したクラス数と同じもしくは最も近い個数の領域に分割された領域分割候補を前記領域分割候補生成ステップで生成された複数の領域分割候補から選択し、選択した領域分割候補を前記領域分割の結果として出力する領域分割候補選択ステップを含む
    請求項1記載の移動体検出方法。
  5. 前記領域分割候補生成ステップでは、前記距離算出ステップで算出された複数の距離における最大値と最小値との間の複数の値を、前記閾値として、生成する
    請求項4記載の移動体検出方法。
  6. 前記領域分割候補生成ステップでは、前記距離算出ステップで算出された複数の距離について、閾値を大きい値から小さい値の順に並べた場合における最初の不連続点を検出し、検出した不連続点よりも小さい複数の値を、前記複数の閾値として、生成する
    請求項4記載の移動体検出方法。
  7. 前記領域分割候補生成ステップでは、前記距離算出ステップで算出された複数の距離について不連続点の検出を行い、閾値の大小に基づいて階層的に前記領域分割をする
    請求項4記載の移動体検出方法。
  8. 前記領域分割候補生成ステップでは、前記距離算出ステップで算出された複数の距離について、閾値を大きい値から不連続点の検出を行い、分割されたクラスタに対して、それぞれ、より小さな閾値を用いて不連続点の検出を行い、階層的に前記領域分割をする
    請求項7記載の移動体検出方法。
  9. 前記領域分割候補生成ステップでは、前記距離算出ステップで算出された複数の距離の平均値又は中央値を中心に増加及び減少させて得られる複数の値を、前記複数の閾値として、生成する
    請求項4記載の移動体検出方法。
  10. 前記領域分割候補生成ステップでは、前記動き解析ステップで算出された複数の移動軌跡のそれぞれについて、当該移動軌跡との距離がN番目に小さい距離を特定し、特定した複数の距離について大きい順から選択した複数の値を、前記複数の閾値として、生成する
    請求項4記載の移動体検出方法。
  11. 前記領域分割ステップでは、前記動き解析ステップで算出された複数の移動軌跡のそれぞれについて、前記距離が小さい順に予め定められた個数の移動軌跡を選択し、選択されなかった移動軌跡との距離を無限大に変更する非線形化をした後に、前記複数の距離のそれぞれを測地距離に変換する
    請求項1記載の移動体検出方法。
  12. 前記領域分割ステップでは、前記動き解析ステップで算出された複数の移動軌跡のそれぞれについて、前記距離が予め定められた閾値以下の移動軌跡を選択し、選択されなかった移動軌跡との距離を無限大に変更する非線形化をした後に、前記複数の距離のそれぞれを測地距離に変換する
    請求項1記載の移動体検出方法。
  13. 前記動き解析ステップでは、前記動きの検出として、前記動きを示す2次元動きベクトル又はアフィンパラメータを算出する
    請求項1記載の移動体検出方法。
  14. 前記距離算出ステップでは、前記距離の算出として、前記ブロックの移動軌跡間の類似性に加えて、前記ピクチャでの前記ブロック間の距離及び前記ブロックどうしを接続する直線の傾斜を示す角度の少なくとも1つを算出する
    請求項1記載の移動体検出方法。
  15. 前記出力ステップは、前記領域分割ステップで得られた領域分割の結果を、前記画像入力ステップで受け付けたピクチャに重ねて表示する表示ステップを含む
    請求項1記載の移動体検出方法。
  16. 前記画像入力ステップでは、2つ以上の移動体が含まれる動画像を受け付け、
    前記領域分割ステップでは、前記2以上の移動体について前記領域分割をすることで、2以上の移動体を検出する
    請求項1記載の移動体検出方法。
  17. 前記移動体検出方法はさらに、前記領域分割ステップで特定された領域を構成するブロックの移動軌跡から、当該領域を代表する移動軌跡を算出し、算出した代表の移動軌跡に従って当該領域が移動すると予測することで、前記移動体の動きを予測する動き予測ステップを含む
    請求項1記載の移動体検出方法。
  18. 前記出力ステップは、前記領域分割ステップでの領域分割の結果に基づいて、前記画像入力ステップで受け付けたピクチャにおける領域を特定し、特定した領域ごとに、対応する領域分割の結果を、記憶手段に記録する、又は、送信する記録・送信ステップを含む
    請求項1記載の移動体検出方法。
  19. 動画像中の移動体の全部又は一部の領域を分割することによって動画像中の移動体を検出する移動体検出装置であって、
    動画像を構成する複数枚のピクチャを受け付ける画像入力部と、
    前記ピクチャを構成する1個以上の画素からなるブロックごとに、時間的に隣接する2枚のピクチャ間での画像の動きを検出し、検出した動きを前記複数枚のピクチャについて連結することで、移動軌跡を算出する動き解析部と、
    前記動き解析部で算出された複数の移動軌跡について、移動軌跡間の類似性を表す距離を算出する距離算出部と、
    前記距離算出部で算出された距離のうち、予め定められた閾値よりも小さい距離を連結することで、前記距離算出部で算出された距離を測地距離に変換し、得られた測地距離の分布における不連続点を検出し、検出した不連続点よりも小さい測地距離だけ離れた移動軌跡を一つのクラスタとすることによって前記領域分割をする領域分割部と、
    前記領域分割部で領域分割された結果を出力する出力部と
    を備える移動体検出装置。
  20. 動画像中の移動体の全部又は一部の領域を分割することによって動画像中の移動体を検出する移動体検出装置のためのプログラムであって、
    請求項1記載の移動体検出方法に含まれるステップをコンピュータに実行させるプログラム。
  21. 動画像を構成する複数枚のピクチャを受け付ける画像入力ステップと、
    前記ピクチャを構成する1個以上の画素からなるブロックごとに、時間的に隣接する2枚のピクチャ間での画像の動きを検出し、検出した動きを前記複数枚のピクチャについて連結することで、移動軌跡を算出する動き解析ステップと、
    前記動き解析ステップで算出された複数の移動軌跡について、移動軌跡間の類似性を表す距離を算出する距離算出ステップと、
    前記距離算出ステップで算出された距離が小さい順に移動軌跡のペアを同一クラスタとして統合する処理をクラスタ数が規定の数になるまで繰り返すことによって、距離が一定以上離れた不連続点をクラスタの境界として前記領域分割をする領域分割ステップと、
    前記領域分割ステップでの領域分割の結果を出力する出力ステップと
    を含む移動体検出方法。
JP2009549322A 2008-10-27 2009-09-11 移動体検出方法及び移動体検出装置 Expired - Fee Related JP4456181B1 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2008276157 2008-10-27
JP2008276157 2008-10-27
PCT/JP2009/004523 WO2010050110A1 (ja) 2008-10-27 2009-09-11 移動体検出方法及び移動体検出装置

Publications (2)

Publication Number Publication Date
JP4456181B1 true JP4456181B1 (ja) 2010-04-28
JPWO2010050110A1 JPWO2010050110A1 (ja) 2012-03-29

Family

ID=42128484

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009549322A Expired - Fee Related JP4456181B1 (ja) 2008-10-27 2009-09-11 移動体検出方法及び移動体検出装置

Country Status (5)

Country Link
US (1) US8340357B2 (ja)
EP (1) EP2330557B1 (ja)
JP (1) JP4456181B1 (ja)
CN (1) CN101983389B (ja)
WO (1) WO2010050110A1 (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010079556A1 (ja) * 2009-01-09 2010-07-15 パナソニック株式会社 移動体検出方法および移動体検出装置
WO2011013299A1 (ja) * 2009-07-31 2011-02-03 パナソニック株式会社 移動体検出装置及び移動体検出方法
CN102741884A (zh) * 2010-07-27 2012-10-17 松下电器产业株式会社 移动体检测装置及移动体检测方法
CN103025241A (zh) * 2010-07-27 2013-04-03 欧姆龙健康医疗事业株式会社 步行变化判断装置
CN112419329A (zh) * 2020-06-03 2021-02-26 中煤华晋集团有限公司王家岭矿 一种基于matlab的散体相似模拟顶煤运移监测方法

Families Citing this family (41)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4763863B1 (ja) 2009-12-28 2011-08-31 パナソニック株式会社 関節状領域検出装置およびその方法
WO2011080900A1 (ja) * 2009-12-28 2011-07-07 パナソニック株式会社 移動体検出装置および移動体検出方法
US20110221664A1 (en) * 2010-03-11 2011-09-15 Microsoft Corporation View navigation on mobile device
JP2011210179A (ja) * 2010-03-30 2011-10-20 Sony Corp 移動物体検出装置及び方法、並びにプログラム
JP5445319B2 (ja) * 2010-05-12 2014-03-19 富士通株式会社 移動体検出プログラムおよび移動体検出装置
EP2447882B1 (en) * 2010-10-29 2013-05-15 Siemens Aktiengesellschaft Method and device for assigning sources and sinks to routes of individuals
TWI423170B (zh) * 2010-12-31 2014-01-11 Altek Corp 多畫面中物體移動的追蹤方法
JP2012151796A (ja) * 2011-01-21 2012-08-09 Sony Corp 画像処理装置と画像処理方法およびプログラム
CN103003846B (zh) * 2011-01-26 2016-07-06 松下知识产权经营株式会社 关节区域显示装置、关节区域检测装置、关节区域归属度计算装置、关节状区域归属度计算装置以及关节区域显示方法
WO2012127815A1 (ja) 2011-03-22 2012-09-27 パナソニック株式会社 移動体検出装置および移動体検出方法
JP2012212373A (ja) * 2011-03-31 2012-11-01 Casio Comput Co Ltd 画像処理装置、画像処理方法及びプログラム
CN102821241B (zh) * 2011-06-10 2015-06-03 华晶科技股份有限公司 利用对象移动趋势驱动快门的装置及方法
US20130102387A1 (en) * 2011-10-21 2013-04-25 Microsoft Corporation Calculating metabolic equivalence with a computing device
JP2015039085A (ja) * 2011-12-14 2015-02-26 パナソニック株式会社 画像処理装置及び画像処理方法
KR20130088493A (ko) * 2012-01-31 2013-08-08 삼성전자주식회사 Ui 제공 방법 및 이를 적용한 영상 수신 장치
TWI476702B (zh) * 2012-03-16 2015-03-11 Pixart Imaging Inc 使用者辨識系統及辨識使用者的方法
KR101901958B1 (ko) * 2012-03-26 2018-11-08 한국전자통신연구원 휴리스틱 함수의 학습을 이용한 고속 경로를 탐색을 위한 장치 및 그 방법
US10140717B2 (en) * 2013-02-27 2018-11-27 Hitachi Automotive Systems, Ltd. Imaging apparatus and vehicle controller
JP6433149B2 (ja) * 2013-07-30 2018-12-05 キヤノン株式会社 姿勢推定装置、姿勢推定方法およびプログラム
CN104794733B (zh) 2014-01-20 2018-05-08 株式会社理光 对象跟踪方法和装置
CN104881881B (zh) * 2014-02-27 2018-04-10 株式会社理光 运动对象表示方法及其装置
CN105096259B (zh) 2014-05-09 2018-01-09 株式会社理光 深度图像的深度值恢复方法和***
DE102014209437B3 (de) * 2014-05-19 2015-10-22 Sirona Dental Systems Gmbh Verfahren zur Erzeugung magnetresonanztomographischer Aufnahmen von zyklischer Bewegung
KR20160014418A (ko) 2014-07-29 2016-02-11 삼성전자주식회사 유저 인터페이스 장치 및 유저 인터페이스 방법
US9418546B1 (en) * 2015-11-16 2016-08-16 Iteris, Inc. Traffic detection with multiple outputs depending on type of object detected
US10248839B2 (en) * 2015-11-30 2019-04-02 Intel Corporation Locating objects within depth images
US10346949B1 (en) * 2016-05-27 2019-07-09 Augmented Pixels, Inc. Image registration
US10838067B2 (en) * 2017-01-17 2020-11-17 Aptiv Technologies Limited Object detection system
CN111145100B (zh) * 2018-11-02 2023-01-20 深圳富泰宏精密工业有限公司 动态影像生成方法及***、计算机装置、及可读存储介质
TWI673653B (zh) * 2018-11-16 2019-10-01 財團法人國家實驗研究院 移動物體偵測系統及方法
US10937169B2 (en) * 2018-12-18 2021-03-02 Qualcomm Incorporated Motion-assisted image segmentation and object detection
TWI739052B (zh) 2018-12-26 2021-09-11 華碩電腦股份有限公司 電子裝置及其操作方法
CN110135422B (zh) * 2019-05-20 2022-12-13 腾讯科技(深圳)有限公司 一种密集目标的检测方法和装置
CN110132241A (zh) * 2019-05-31 2019-08-16 吉林化工学院 一种基于时间序列分析的高精度步态识别方法及装置
CN110458046B (zh) * 2019-07-23 2020-11-24 南京邮电大学 一种基于关节点提取的人体运动轨迹分析方法
CN110456731B (zh) * 2019-08-13 2022-06-14 成都飞机工业(集团)有限责任公司 一种数控切削几何刀轨特征提取方法
CN111582025B (zh) * 2020-03-31 2023-11-24 北京明略软件***有限公司 一种移动物体的识别方法、装置、及存储介质
JP7505681B2 (ja) 2020-09-17 2024-06-25 株式会社ネクストシステム 動画データの記録方法及び動画データの再生方法
EP3985957B1 (en) * 2020-10-14 2022-11-30 Axis AB Method and system for motion segmentation
CN112288774B (zh) * 2020-10-22 2024-01-30 深圳市华宝电子科技有限公司 移动侦测方法、装置、电子设备及存储介质
TWI779454B (zh) * 2021-01-08 2022-10-01 財團法人資訊工業策進會 動作辨識裝置及動作辨識方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1166319A (ja) * 1997-08-21 1999-03-09 Omron Corp 移動体検出方法及び装置並びに移動体認識方法及び装置並びに人間検出方法及び装置
JP2000222584A (ja) * 1999-01-29 2000-08-11 Toshiba Corp 映像情報記述方法、映像検索方法及び映像検索装置
JP2005332206A (ja) * 2004-05-20 2005-12-02 Nippon Hoso Kyokai <Nhk> 映像イベント判別装置及びそのプログラム、並びに、映像イベント判別用学習データ生成装置及びそのプログラム
JP2007087049A (ja) * 2005-09-21 2007-04-05 Kddi Corp 動画像処理装置

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3780017B2 (ja) 1994-12-06 2006-05-31 オリンパス株式会社 時系列画像解析装置及びその解析方法
US7016540B1 (en) * 1999-11-24 2006-03-21 Nec Corporation Method and system for segmentation, classification, and summarization of video images
US6859554B2 (en) * 2001-04-04 2005-02-22 Mitsubishi Electric Research Laboratories, Inc. Method for segmenting multi-resolution video objects
GB0125774D0 (en) * 2001-10-26 2001-12-19 Cableform Ltd Method and apparatus for image matching
US8614741B2 (en) * 2003-03-31 2013-12-24 Alcatel Lucent Method and apparatus for intelligent and automatic sensor control using multimedia database system
US7801330B2 (en) * 2005-06-24 2010-09-21 Objectvideo, Inc. Target detection and tracking from video streams
CN101159855B (zh) * 2007-11-14 2011-04-06 南京优科漫科技有限公司 基于特征点分析的多目标分离预测方法
US8212210B2 (en) * 2008-02-04 2012-07-03 Flir Systems Ab IR camera and method for presenting IR information
JP4763863B1 (ja) * 2009-12-28 2011-08-31 パナソニック株式会社 関節状領域検出装置およびその方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1166319A (ja) * 1997-08-21 1999-03-09 Omron Corp 移動体検出方法及び装置並びに移動体認識方法及び装置並びに人間検出方法及び装置
JP2000222584A (ja) * 1999-01-29 2000-08-11 Toshiba Corp 映像情報記述方法、映像検索方法及び映像検索装置
JP2005332206A (ja) * 2004-05-20 2005-12-02 Nippon Hoso Kyokai <Nhk> 映像イベント判別装置及びそのプログラム、並びに、映像イベント判別用学習データ生成装置及びそのプログラム
JP2007087049A (ja) * 2005-09-21 2007-04-05 Kddi Corp 動画像処理装置

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010079556A1 (ja) * 2009-01-09 2010-07-15 パナソニック株式会社 移動体検出方法および移動体検出装置
JP4542207B1 (ja) * 2009-01-09 2010-09-08 パナソニック株式会社 移動体検出方法および移動体検出装置
WO2011013299A1 (ja) * 2009-07-31 2011-02-03 パナソニック株式会社 移動体検出装置及び移動体検出方法
CN102741884A (zh) * 2010-07-27 2012-10-17 松下电器产业株式会社 移动体检测装置及移动体检测方法
CN103025241A (zh) * 2010-07-27 2013-04-03 欧姆龙健康医疗事业株式会社 步行变化判断装置
CN103025241B (zh) * 2010-07-27 2015-05-13 欧姆龙健康医疗事业株式会社 步行变化判断装置
CN102741884B (zh) * 2010-07-27 2016-06-08 松下知识产权经营株式会社 移动体检测装置及移动体检测方法
CN112419329A (zh) * 2020-06-03 2021-02-26 中煤华晋集团有限公司王家岭矿 一种基于matlab的散体相似模拟顶煤运移监测方法

Also Published As

Publication number Publication date
US8340357B2 (en) 2012-12-25
WO2010050110A1 (ja) 2010-05-06
CN101983389A (zh) 2011-03-02
US20110228987A1 (en) 2011-09-22
EP2330557B1 (en) 2018-11-07
JPWO2010050110A1 (ja) 2012-03-29
EP2330557A1 (en) 2011-06-08
EP2330557A4 (en) 2013-07-24
CN101983389B (zh) 2012-11-21

Similar Documents

Publication Publication Date Title
JP4456181B1 (ja) 移動体検出方法及び移動体検出装置
JP4542207B1 (ja) 移動体検出方法および移動体検出装置
JP5054206B2 (ja) 画像処理方法及び画像処理装置
JP4643766B1 (ja) 移動体検出装置及び移動体検出方法
JP4782901B2 (ja) 移動体検出装置および移動体検出方法
JP4994525B1 (ja) 関節領域表示装置、関節領域検出装置、関節領域帰属度算出装置、関節状領域帰属度算出装置および関節領域表示方法
JP4979840B2 (ja) 移動体検出装置および移動体検出方法
JP4668360B2 (ja) 移動体検出方法及び移動体検出装置
JP5404918B2 (ja) 移動軌跡算出方法およびその装置、ならびに領域分割方法
JP4763863B1 (ja) 関節状領域検出装置およびその方法

Legal Events

Date Code Title Description
TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100105

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100204

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130212

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4456181

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130212

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140212

Year of fee payment: 4

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees