JP2018124689A - 移動物体検出装置、移動物体検出システム、及び移動物体検出方法 - Google Patents

移動物体検出装置、移動物体検出システム、及び移動物体検出方法 Download PDF

Info

Publication number
JP2018124689A
JP2018124689A JP2017014965A JP2017014965A JP2018124689A JP 2018124689 A JP2018124689 A JP 2018124689A JP 2017014965 A JP2017014965 A JP 2017014965A JP 2017014965 A JP2017014965 A JP 2017014965A JP 2018124689 A JP2018124689 A JP 2018124689A
Authority
JP
Japan
Prior art keywords
region
area
moving object
image
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2017014965A
Other languages
English (en)
Other versions
JP6947508B2 (ja
Inventor
クリンキグト,マルティン
Klinkigt Martin
健一 米司
Kenichi Yoneshi
健一 米司
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2017014965A priority Critical patent/JP6947508B2/ja
Publication of JP2018124689A publication Critical patent/JP2018124689A/ja
Application granted granted Critical
Publication of JP6947508B2 publication Critical patent/JP6947508B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Image Analysis (AREA)
  • Closed-Circuit Television Systems (AREA)

Abstract

【課題】動画像中から所定の移動物体を迅速かつ適切に検出することができるようにする。【解決手段】動画像の中から検出対象の移動物体を検出する移動物体検出装置10において、動画像を入力する画像入力部101と、2つのフレーム画像間の対応するキーポイントを特定し、キーポイントの動きベクトルを特定し、動きベクトルに基づいて、同一の移動物体を構成すると想定されるキーポイント集合を生成するキーポイント処理部103と、一方のフレーム画像における同一の集合のキーポイントを含む第1領域を推定する初期領域推定部104と、第1領域について、所定の変形を行った第2領域を決定する候補領域決定部105と、各領域に対して、検出対象の移動物体である確度の評価を行う物体分類部106と、各領域の中から検出対象の移動物体である確度が高い領域を、移動物体が存在する存在領域として決定する存在領域決定部107と、を備えるようにする。【選択図】図2

Description

本発明は、動画像中から所定の移動物体(物体の全体又は物体の部分)を検出する移動物体検出装置等に関する。
多くの画像処理のタスクの中では、物体検出が重要な役割を担っている。物体検出の背後にある動機付けは、画像の中から物体又は物体の部分を検出することにある。さらに、物体のサイズと、現実における物体までの距離との情報を受け取るためには、物体のサイズ推定において高い正確性が要求される。
物体検出においては、一般的に、いわゆるスライディングウインドウが用いられている。このアプローチの背後にあるアイデアは、画像から任意の領域を取出し、この領域が特定の移動物体を表している可能性を計算することである。もし、この可能性が、与えられている閾値を超えている場合には、物体が検出されることとなる。このスライディングウインドウのアプローチによると、高い正確性が達成される。しかしながら、このアプローチは、考えられる物体の位置についての先験的な情報が利用できない場合には、計算コストが高いという欠点を有している。この場合においては、所定の可能性の閾値に到達するためには、ウィンドウは、多くの異なる位置と大きさで配置される必要がある。物体を検出するために、しばしば数千よりも多くの領域が試されなければならないことがある。
さらに、このスライディングウインドウのアプローチは、しばしば、領域にいる特定の物体の可能性を計算するためにテンプレートマッチングを利用することがある。これらのテンプレートは、予め定義されていることがあり、物体の外観が経年により変化すると、よく適合しない。この場合には、高い正確性をもって再び適合するようにするためにテンプレートを更新しなければならない。
例えば、物体を検出する技術としては、フレーム画像毎に検出された顔の特徴点の座標をフレーム画像間で比較して検出精度を検証し、所定の検出精度に満たない顔の特徴点の座標の補正を行い、検出された顔の特徴点の検出結果を補正することにより、顔の認証の精度低下を抑止する技術が知られている(特許文献1参照)。
特開2013−65119号公報
画像から物体を検出する処理においては、画像中の物体の位置や、物体のサイズを高精度に検出することが要請されている。また、物体を検出する処理に要する計算コストを低減することが要請されている。
本発明は、上記事情に鑑みなされたものであり、その目的は、動画像中から所定の移動物体を迅速かつ適切に検出することのできる技術を提供することにある。
上記目的を達成するため、一観点に係る移動物体検出装置は、動画像の中から検出対象の移動物体を検出する移動物体検出装置において、動画像を入力する動画像入力部と、動画像における2つのフレーム画像間の対応するキーポイントを特定し、キーポイントの動きベクトルを特定し、動きベクトルに基づいて、同一の移動物体を構成すると想定されるキーポイントの集合を生成するキーポイント処理部と、2つのフレーム画像における一方のフレーム画像における同一の集合のキーポイントを含む第1領域を推定する第1領域推定部と、第1領域について、所定の変形を行った1以上の第2領域を決定する第2領域決定部と、記第1領域と、第2領域とに対して、その領域の画像が検出対象の移動物体である確からしさを示す確度の評価を行う物体分類部と、第1領域及び第2領域の中から検出対象の移動物体である確度が高い領域を、移動物体が存在する存在領域として決定する存在領域決定部と、を備える。
本発明によれば、動画像中から所定の移動物体を迅速かつ適切に検出することができる。
図1は、第1実施例に係る移動物体検出装置の全体構成図である。 図2は、第1実施例に係る移動物体検出装置の機能構成図である。 図3は、第1実施例に係るキーポイント処理部によるキーポイント処理を説明する図である。 図4は、第1実施例に係る候補領域を説明する図である。 図5は、第1実施例に係る移動物体検出処理のフローチャートである。 図6は、第2実施例に係る範囲特定情報の一例を示す図である。 図7は、第2実施例に係る移動物体検出処理のフローチャートである。 図8は、第3実施例に係る移動物体検出システムの全体構成図である。 図9は、第4実施例に係る移動物体検出処理の一部のシーケンス図である。
いくつかの実施例について、図面を参照して説明する。なお、以下に説明する実施例は特許請求の範囲に係る発明を限定するものではなく、また実施例の中で説明されている諸要素及びその組み合わせの全てが発明の解決手段に必須であるとは限らない。
<第1実施例>
図1は、第1実施例に係る移動物体検出装置の全体構成図である。
移動物体検出装置10は、例えば、PC(Personal Computer)で構成され、CPU(Central Processing Unit)11と、メモリ12と、補助記憶装置13と、外部機器I/F14と、表示装置15と、入力装置16と、各部を通信可能に接続するバス17とを備える。
外部機器I/F14は、ケーブル等を介して、外部の機器(例えば、監視カメラ20)と通信するためのインターフェースである。監視カメラ20は、監視対象箇所を観察するように設置されており、監視対象箇所の動画像データを移動物体検出装置10に出力する。
CPU11は、補助記憶装置13からメモリ12に呼び出されたプログラムを実行し、補助記憶装置13に格納されているデータを用いて、各種処理を実行する。メモリ12は、例えば、RAM(RANDOM ACCESS MEMORY)であり、CPU11で実行されるプログラムや、必要な情報を記憶する。補助記憶装置13は、例えばバードディスク、フラッシュメモリなどであり、CPU11で実行されるプログラムや、CPU11に利用されるデータを記憶する。表示装置15は、例えば、液晶ディスプレイであり、各種情報を表示する。入力装置16は、例えば、マウス、キーボード等であり、各種入力を受け付ける。
図2は、第1実施例に係る移動物体検出装置の機能構成図である。
移動物体検出装置10は、動画像入力部の一例としての画像入力部101と、背景差分処理部102と、キーポイント処理部103と、第1領域推定部の一例としての初期領域推定部104と、第2領域決定部の一例としての候補領域決定部105と、物体分類部106と、存在領域決定部107と、存在領域表示部108とを備える。画像入力部101、背景差分処理部102、キーポイント処理部103、初期領域推定部104、候補領域決定部105、物体分類部106、存在領域決定部107、及び存在領域表示部108は、CPU11がメモリ12に読み出されたプログラムを実行することにより実現される。
画像入力部101は、監視カメラ20により撮影された動画像(動画像のそれぞれのフレームの画像(フレーム画像))を入力する。
背景差分処理部102は、入力されたフレーム画像における背景差分を取得する処理(背景差分処理)を実行する。背景差分処理においては、監視カメラ20により撮影される監視箇所における、移動物体が含まれていない背景画像が必要となる。この背景画像は、例えば、監視カメラ20により予め撮影され、補助記憶装置13に記憶されている。背景画像は、フレーム画像における移動物体の検出において重要でない部分を決定する。
背景差分処理部102は、同一の監視カメラ20により撮影された、新たなフレーム画像と、背景画像とに対して、画素単位の比較を実行する。具体的には、背景差分処理部102は、フレーム画像の各画素のカラー情報と、背景画像の同一の画素のカラー情報とを比較する。画像差分処理部102は、それらの画素の色の違いが所定のしきい値を超える場合には、異なる、すなわち、移動物体を表している画素としてマークする。また、画像差分処理部102は、それらの画素が同じカラー情報の場合には、その画素が背景であるとしてマークする。この結果、フレーム画像における、異なるとしてマークされた画素群は、移動物体を示しており、この画素群中には、キーポイント(特徴点)が存在する。
キーポイント処理部103は、2つの異なるフレーム画像(例えば、時間的に連続する2つのフレーム画像)のそれぞれのキーポイント(特徴点)を抽出し、それぞれのフレーム画像間のキーポイントのマッチングを行い、フレーム画像間のマッチするキーポイントの移動ベクトルを特定し、移動ベクトルに基づいて同一の移動物体を示すキーポイントをグループ化(クラスタリング)するキーポイント処理を実行する。
図3は、第1実施例に係るキーポイント処理部によるキーポイント処理を説明する図である。
キーポイント処理では、キーポイント処理部103は、背景差分処理が行われたフレーム画像について、エッジ検出を行い、エッジにおける勾配を算出する。大きい勾配は、よいキーポイントを示す指標となる。キーポイント処理部103は、勾配に基づいて、キーポイントを抽出する。キーポイント処理部103は、キーポイントを決定した後に、エッジパターンを利用してキーポイントの特徴ベクトルを算出する。
キーポイント処理部103は、2つの異なるフレーム画像から抽出されたすべてのキーポイントについての特徴ベクトルを算出した後に、それぞれについてのユークリッド距離を算出する。キーポイント処理部103は、一方のフレーム画像におけるそれぞれのキーポイントについて、それに対応する特徴ベクトルが、他方のフレーム画像における最も近い特徴ベクトルに対応するキーポイントを最もマッチするキーポイントとみなす。図3(a)、(b)には、一方のフレーム画像f1におけるキーポイント31と、そのキーポイント31に対応する他方のフレーム画像f2におけるキーポイント32とを示している。なお、この段階では、不正確なマッチが発生する。しかしながら、不正確なマッチは、以降の段階で検出されるので問題はない。
キーポイント処理部103は、キーポイントのクラスタリングを行う際には、マッチしたキーポイント間の動きベクトルを算出する。キーポイント処理部103は、2つの連続するフレーム画像からのマッチするキーポイントを取得し、2つのフレーム画像における画素単位の位置を解析する。キーポイント処理部103は、フレーム画像の枠におけるユークリッド距離を計算することにより、動きベクトルを割り当てる。図3(c)には、このようにして求められた動きベクトル33を示している。
次に、キーポイント処理部103は、同じ移動物体に属するキーポイントを同一のクラスタ(グループ)にするためのクラスタリングを行う。キーポイント処理部103は、動きベクトルが同じ方向を示す、近接するキーポイントについては、同じ移動物体に属するとして同一のクラスタとする。また、キーポイント処理部103は、図3(d)のキーポイント35のように、動きベクトルが同じ方向であるが、大多数のキーポイントから離れているキーポイントは、異なる移動物体に属する、すなわち、同一のクラスタではないとみなしている。また、キーポイント処理部103は、図3(d)のキーポイント34に示すように、大多数のキーポイントが属するクラスタの領域内又はクラスタの領域に近接するキーポイントは、同一の移動物体に属するとみなしている。このようなキーポイントは、前の段階での、マッチするキーポイントの検出が間違っていたものであると考えられる。
初期領域推定部104は、キーポイント処理部103により同一のクラスタとされたキーポイント群に対して、図3(d)に示すように、クラスタに対応する対象の移動物体をカバーする画像領域(初期領域IR:第1領域)を推定する。ここで、初期領域IRは、同一のクラスタのキーポイント群が含まれる最小の矩形領域としてもよく、移動物体がこの領域にカバーされるように、これよりもわずかに大きい矩形領域としてもよい。
候補領域決定部105は、初期領域IRに基づいて、移動物体が存在する可能性のある複数の候補領域TR(第2領域)を決定する。
図4は、第1実施例に係る候補領域を説明する図である。なお、初期領域IRと、候補領域(TR1〜TR8)とのいずれか3辺については、全く同じ位置で重なっているが、図4においては、各領域を把握容易にするために、便宜的にわずかにずらした状態で示している。
本実施例では、候補領域決定部105は、図4に示すように、初期領域IRの右辺RSだけを右辺RSに垂直な幅(左右方向の幅)が所定の割合(例えば、10%)だけ拡大するように移動(右方向移動)させた候補領域TR1と、初期領域IRの右辺RSだけを幅が所定の割合(例えば、10%)だけ縮小するように移動(左方向移動)させた候補領域TR2と、初期領域IRの左辺LSだけを幅が所定の割合(例えば、10%)だけ拡大するように移動(左方向移動)させた候補領域TR3と、初期領域IRの左辺LSだけを幅が所定の割合(例えば、10%)だけ縮小するように移動(右方向移動)させた候補領域TR4と、初期領域IRの上辺USだけを幅(上下方向の幅)が所定の割合(例えば、10%)だけ拡大するように移動(上方向移動)させた候補領域TR5と、初期領域IRの上辺USだけを幅が所定の割合(例えば、10%)だけ縮小するように移動(下方向移動)させた候補領域TR6と、初期領域IRの下辺DSだけを幅(上下方向の幅)が所定の割合(例えば、10%)だけ拡大するように移動(下方向移動)させた候補領域TR7と、初期領域IRの下辺DSだけを幅が所定の割合(例えば、10%)だけ縮小するように移動(上方向移動)させた候補領域TR8と、を候補領域として決定している。このように、候補領域を決定することにより、対象の移動物体の大きさに適合する領域の候補を適切に検出することができるようになる。特に、初期領域IRの各辺について移動させた候補領域を用意することにより、移動物体がいずれの方向にずれていた場合であっても適切に移動物体が存在する領域を得ることができる。
物体分類部106は、初期領域IRと、候補領域TR1〜TR8との9つのそれぞれの領域について、対象の移動物体であるか否かについて評価する。対象の移動物体としては、物体の全体であってもよく、物体の一部分であってもよく、例えば、人間としてもよいし、人間の部分である顔としてもよい。本実施形態では、フレーム画像よりも小さい、これらの少数の領域のみに対して対象の移動物体が存在するか否かについて評価するので、処理量を低減することができ、処理時間を低減することができる。
物体分類部106は、対象の移動物体であるか否かについて評価として、領域が所定の移動物体である確からしさを示す確度を決定する。物体分類部106としては、例えば、CNN(Convolutional Neural Network:畳み込みニューラルネットワーク)により、領域の画像を用いて、領域が対象の移動物体である確からしさを示す確度を出力する構成としてもよい。なお、CNNは、対象とする移動物体である確度を適切に決定できるように、予め学習させておく必要がある。物体分類部106の構成として、CNNを用いることにより、非常に高い正確性と、監視システムに必要なリアルタイム性(短時間での処理の実行)とを実現することができる。
物体分類部106により決定された確度は、対象の移動物体の大きさに、より高精度に適合している領域を決定するために利用することができる。すなわち、決定された確度が高い領域ほど、対象の移動物体の大きさに高精度に適合している領域であるといえる。
存在領域決定部107は、物体分類部106により決定された、各領域についての確度に基づいて、最も高い確度に決定された領域を特定し、この領域を移動物体が存在する領域(存在領域)に決定し、フレーム画像における存在領域の位置を存在領域表示部108に通知する。なお、決定した存在領域の画像を用いて更なる処理(例えば、移動物体についてのより詳細な認識処理等)に利用するようにしてもよい。この存在領域は、移動物体の大きさに、より高精度に適合しているので、移動物体に対する更なる処理における処理精度を向上することができる。
存在領域表示部108は、存在領域決定部107から通知された存在領域の位置に基づいて、表示装置15にフレーム画像を表示させるとともに、フレーム画像中において、通知された存在領域に対応する範囲を識別可能に表示させる。これにより、表示装置15のフレーム画像中の移動物体の存在領域を適切に表示させることができ、ユーザは移動物体を適切に把握することができる。
次に、第1実施例に係る移動物体検出装置の処理動作について説明する。
図5は、第1実施例に係る移動物体検出処理のフローチャートである。
まず、画像入力部101は、監視カメラ20により撮影された動画像のそれぞれのフレーム画像を入力する(ステップS10)。
次いで、背景差分処理部102は、入力されたフレーム画像における背景差分を取得する処理を実行する(ステップS11)。
次いで、キーポイント処理部103は、2つの異なるフレーム画像のそれぞれのキーポイントを抽出し(ステップS12)、それぞれのフレーム画像間のキーポイントのマッチングを行い(ステップS13)、フレーム画像間のマッチするキーポイントの移動ベクトルを特定し、移動ベクトルに基づいて同一の移動物体を示すキーポイントをクラスタリングする(ステップS14)。
次いで、初期領域推定部104は、キーポイント処理部103により同一のクラスタとされたキーポイント群に対して、クラスタに対応する移動物体をカバーする画像の初期領域IRを推定する(ステップS15)。
次いで、候補領域決定部105は、初期領域IRに基づいて、移動物体が存在する可能性のある複数の候補領域TRを決定する(ステップS16)。
次いで、物体分類部106は、初期領域IRと、候補領域TRとのそれぞれの領域について、対象の移動物体が存在するか否かについて評価する(ステップS17)。
次いで、存在領域決定部107は、物体分類部106により決定された、各領域についての確度に基づいて、最も高い確度に決定された領域を特定し、当該領域を移動物体が存在する存在領域に決定し、フレーム画像における存在領域の位置を存在領域表示部108に通知する(ステップS18)。
次いで、存在領域表示部108は、存在領域決定部107から通知された存在領域の位置に基づいて、表示装置15にフレーム画像を表示させるとともに、フレーム画像における通知された存在領域に対応する範囲を識別可能に表示させる(ステップS19)。なお、ステップS19が終了した後には、移動物体検出装置10は、ステップS10からの処理と同様な処理を、処理に使用した2つのフレーム画像のうちの新しいフレーム画像と、その後続のフレーム画像とを対象に実行する。
上記実施例によると、初期領域IRと、他の候補領域との中から移動物体に最も適合する領域を容易かつ適切に検出することができる。
<第2実施例>
次に、第2実施例に係る移動物体検出装置について説明する。なお、図2に示す各構成を用いて第2実施例について説明する。
第2実施例は、直前のフレーム画像に対する処理時における移動物体の初期領域IRに対する存在領域の範囲を利用して、次のフレーム画像における移動物体の存在領域を検出するようにすることにより、処理の負荷を低減するようにしたものである。これは、初期領域IRに対する存在領域の範囲は、同一の移動物体であれば、フレーム画像が異なっても同様な対応関係が維持されている可能性が比較的高いことに着目したものである。
第2実施例における存在領域決定部107(範囲特定情報登録部の一例)は、初期領域に対する存在領域の範囲を特定可能な情報(範囲特定情報)を、メモリ12(記憶部の一例)に格納する。
図6は、第2実施例に係る範囲特定情報の一例を示す図である。
範囲特定情報は、図6に示すように、例えば、初期領域IRの基準位置(例えば、左上の点)から存在領域ORの基準位置(例えば、左上の点)までのベクトルVと、存在領域ORの基準点から存在領域ORの対向する点(右下の点)までのベクトルWとを含む情報であってもよい。この範囲特定情報によると、初期領域IRの基準位置を基準として、存在領域ORの範囲を適切に表すことができる。
また、存在領域決定部107(第3領域特定部の一例)は、メモリ12に直前の処理における範囲特定情報があるか否かを判定し、範囲特定情報がある場合には、現在の初期領域を基準に範囲特定情報に対応する領域を存在領域候補(第3領域の一例)に決定し、物体分類部106に通知する。また、存在領域決定部107は、物体分類部106から通知された確度が所定の閾値以上であるか否かを判定し、確度が所定の閾値以上である場合には、存在領域候補が存在候補として適切であることを意味しているので、存在領域候補を存在領域に決定する一方、確度が所定の閾値より小さい場合には、存在領域候補は存在候補には適さないので、第1実施例と同様の処理、すなわち、初期範囲IRと、複数の候補領域の中から存在領域を決定するための処理を行わせるようにする。
物体分類部106は、存在領域決定部107から通知された存在領域候補に対して、対象の移動物体である確度を特定し、特定した確度を存在領域決定部107に通知する。
次に、第2実施例に係る移動物体検出装置の処理動作について説明する。
図7は、第2実施例に係る移動物体検出処理のフローチャートである。なお、図5に示す移動物体検出処理と同様なステップには、同一の符号を付している。
ステップS10〜ステップS15の処理が終了した後に、存在領域決定部107は、メモリ12に直前の処理における範囲特定情報があるか否かを判定する(ステップS21)。この結果、直前の処理における範囲特定情報がない場合(ステップS21:NO)には、存在領域決定部107は、ステップS16〜S18の処理を実行させるようにする。
一方、直前の処理における範囲特定情報がある場合(ステップS21:YES)には、現在の初期領域(直前のステップS15で推定された初期領域)を基準に範囲特定情報に対応する領域を存在領域候補に決定し、存在領域候補を物体分類部106に通知する(ステップS22)。
次いで、物体分類部106は、通知された存在領域候補に対して、対象の移動物体である確度を特定し、存在領域決定部107に通知する(ステップS23)。
次いで、存在領域決定部107は、物体分類部106から通知された確度が所定の閾値以上であるか否かを判定する(ステップS24)。この結果、確度が所定の閾値より小さい場合(ステップS24:NO)には、存在領域決定部107は、存在領域候補は存在領域には適していないので、ステップS16〜S18の処理を実行させるようにする。
一方、確度が所定の閾値以上である場合(ステップS24:YES)には、存在領域候補が存在領域として適していることを意味しているので、存在領域決定部107は、存在領域候補を存在領域に決定し、処理をステップS26に進める(ステップS25)。
次いで、存在領域を決定した後(ステップS18、又はステップS25を実行した後)には、存在領域決定部107は、初期領域に対する存在領域の範囲を示す範囲特定情報を、メモリ12に格納し(ステップS26)、処理をステップS19に進める。
上記第2実施例によると、直前の処理における範囲特定情報を用いて、存在領域候補を決定し、その存在領域候補の画像が対象の移動物体である確からしさを示す確度が所定の閾値以上である場合には、存在領域候補を存在領域と決定するので、複数の候補領域を決定し、各候補領域の評価を行う処理を行わずに済み、処理負荷を低減できるとともに、処理時間を短縮することができる。
<第3実施例>
次に、第3実施例に係る移動物体検出システムについて説明する。
第3実施例に係る移動物体検出システムは、移動物体検出装置10による処理を、ネットワークを介して接続されたクライアント装置200と、サーバ装置300とで実現するようにしたシステムである。
移動物体検出システムは、クライアント装置200と、サーバ装置300とを備える。クライアント装置200と、サーバ装置300とは、ネットワーク400を介して接続されている。ネットワーク400は、インターネットであっても、イントラネットであってもよい。サーバ装置300は、クライアント装置200のそばに配置しなくてもよく、例えば、遠隔地(例えば、外国)に配置することができる。
クライアント装置200は、CPU201と、メモリ202と、補助記憶装置203と、外部機器I/F204と、通信I/F205と、表示装置206と、入力装置207と、各部を通信可能に接続するバス208とを備える。図1に示す移動物体検出装置10と同一の名称の構成は、同様な構成となっている。通信I/F205は、ネットワーク400を介してサーバ装置300と通信するためのインターフェースである。
クライアント装置200は、図2に示す画像入力部101を備えるとともに、画像入力部101で入力したフレーム画像を、ネットワーク400を介してサーバ装置300に送信する送信部をさらに有している。
サーバ装置300は、CPU301と、メモリ302と、補助記憶装置303と、通信I/F304と、表示装置305と、入力装置306と、各部を通信可能に接続するバス307とを備える。図1に示す移動物体検出装置10と同一の名称の構成は、同様な構成となっている。通信I/F304は、ネットワーク400を介してクライアント装置200と通信するためのインターフェースである。
サーバ装置300は、図2に示す、背景差分処理部102と、キーポイント処理部103と、初期領域推定部104と、候補領域決定部105と、物体分類部106と、存在領域決定部107とを備える。本実施例では、背景差分処理部102は、ネットワーク400を介してクライアント装置200から送信されるフレーム画像を受信する機能をさらに有している。
なお、存在領域表示部108については、クライアント装置200と、サーバ装置300のいずれか一方に設けるようにしてもよく、クライアント装置200側に設ける場合には、サーバ装置300は、ネットワーク400を介して存在領域の位置を通知する送信部を有するようにし、クライアント装置200の存在領域表示部108は、通知に基づいて、フレーム画像中に存在領域を識別可能に表示するようにすればよい。
第3実施例に係る移動物体検出システムによると、クライアント装置200における処理の負荷を軽減することができる。
<第4実施例>
次に、第4実施例に係る移動物体検出システムについて説明する。
第4実施例に係る移動物体検出システムは、ハードウエアの構成は、図8に示す移動物体検出システムと同様である。
第4実施例に係る移動物体検出システムは、クライアント装置200からサーバ装置300に対してフレーム画像の全体ではなく、フレーム画像の一部を送信することにより、送信する画像データのサイズを低減するようにしたものである。
クライアント装置200は、図2に示す画像入力部101と、背景差分処理部102と、キーポイント処理部103と、初期領域推定部104とを備える。初期領域推定部104は、推定された初期領域を含む、フレーム画像の一部の領域を送信する機能をさらに有する。初期領域推定部104は、初期領域と、サーバ装置300の存在領域決定部107により存在領域として使用される領域とを含む、フレーム画像の一部分の領域(部分画像)をサーバ装置300に送信する。
サーバ装置300は、図2に示す候補領域決定部105と、物体分類部106と、存在領域決定部107とを備える。候補領域決定部105は、ネットワーク400を介してクライアント装置200から送信される部分画像を用いて、候補領域を決定する。なお、存在領域表示部108については、クライアント装置200と、サーバ装置300のいずれに設けるようにしてもよい。
次に、第4実施例に係る移動物体検出システムの処理動作について説明する。
図9は、第4実施例に係る移動物体検出処理の一部のシーケンス図である。
まず、監視カメラ20は、フレーム画像f1を取得し(ステップS100)、取得したフレーム画像f1をクライアント装置200に送信する(ステップS101)。次いで、監視カメラ20は、次のフレーム画像f2を取得し(ステップS102)、取得したフレーム画像f2をクライアント装置200に送信する(ステップS103)。以降、監視カメラ20は、逐次フレーム画像を取得し、取得したフレーム画像をクライアント装置200に送信する。
一方、クライアント装置200のキーポイント処理部103は、監視カメラ20から送信されたフレーム画像f1を取得すると、フレーム画像f1からキーポイントkp1を特定する(ステップS201)。次いで、クライアント装置200のキーポイント処理部103は、監視カメラ20から送信されたフレーム画像f2を取得すると、フレーム画像f2からキーポイントkp2を特定する(ステップS202)。
次いで、キーポイント処理部103は、フレーム画像f1のキーポイントkp1と、フレーム画像f2のキーポイントkp2との間のマッチングを行い(ステップS203)、マッチしたキーポイント間の動きベクトルを特定し(ステップS204)、動きベクトルに基づいて、キーポイントをクラスタリングする(ステップS205)。
次いで、初期領域決定部104は、キーポイント処理部103により同一のクラスタとされたキーポイント群に対して、クラスタに対応する移動物体をカバーする画像の初期領域IRを推定し(ステップS206)、推定した初期領域IRと、サーバ装置300で候補領域とされる可能性のある領域とを含む部分画像をサーバ装置300に送信する(ステップS207)。
これに対して、サーバ装置300では、クライアント装置200から送信される部分画像を用いて、図5のステップS16以降の処理と同様な処理を実行する。
第4実施例に係る移動物体検出システムでは、クライアント装置200からサーバ装置300に対してフレーム画像の全体ではなく、フレーム画像の一部を送信するようにしたので、例えば、クライアント装置200とサーバ装置300との間のネットワークが、長距離無線通信等の帯域幅が狭い場合であっても支障なく、移動物体検出処理を行うことができる。
<第5実施例>
次に、第5実施例に係る移動物体検出装置について説明する。
第5実施例に係る移動物体検出装置10は、候補領域決定部105による処理を変更したものである、候補領域決定部105は、キーポイントの動きベクトルの大きさをキーポイント処理部103から受け取り、動きベクトルの大きさに基づいて、図4に示すような候補領域を決定する際の初期領域IRの幅に対して変動する幅の割合を変更する。例えば、動きベクトルの大きさが大きいほど、変動する幅の割合を大きくするようにしてもよい。変動する幅の基準とする動きベクトルの大きさとしては、初期領域内のすべてのキーポイントの動きベクトルの大きさの平均としてもよく、初期領域のキーポイントの動きベクトルのうちで最も大きい動きベクトルの大きさとしてもよい。
第5実施例によると、移動物体の動きに応じて、候補範囲の大きさを適切に調整することができ、候補範囲内に移動物体が存在する可能性を高くすることができる。
なお、本発明は、上述の実施例に限定されるものではなく、本発明の趣旨を逸脱しない範囲で、適宜変形して実施することが可能である。
例えば、上記実施例では、監視カメラにより撮影された動画像を逐次入力して処理対象としていたが、本発明はこれに限られず、例えば、予めカメラにより撮影され、補助記憶装置13に記憶されている動画像を処理対象としてもよく、外部の装置から送信される動画像を処理対象としてもよい。
また、上記実施例におけるキーポイントの検出方法や抽出方法としては、上記方法に限られず、SIFT(Scale−Invariant Feature Transform)、SURF(Speed Up Robust Features)、HOG(Histograms of Oriented Gradients)、BRISK(Binary Robust Invariant Scalable Keypoints)を用いるようにしてもよい。
また、上記実施例では、初期領域や候補領域の画像が対象の移動物体である確度を、CNNを用いて決定するようにしていたが、本発明はこれに限られず、CNN以外の方法、例えば、画像マッチングを行うことにより、画像が対象の移動物体である確度を決定するようにしてもよい。
また、上記実施例では、移動物体検出処理においては、連続する2つのフレーム画像を対象として処理を行うようにしていたが、本発明はこれに限られず、例えば、所定のフレームだけ離れた2つのフレーム画像を対象として処理を行うようにしてもよい。このようにすると、処理量を低減しつつ、比較的高精度に対象の移動物体の存在領域を特定することができる。
また、上記実施例では、初期領域と、それに対する候補領域との中から最も確度の高い領域を存在領域に決定するようにしていたが、本発明はこれに限られず、例えば、最も確度の高い領域の確度が所定値以下である場合には、この領域を新たな初期領域として、同様な処理を行うようにして、得られる確度が所定値以上となるまで同様な処理を繰り返し実行するようにしてもよい。このようにすると、より確度の高い領域を存在領域とすることができる。
また、上記実施例では、移動物体検出装置、移動物体検出システムの各機能部を、プロセッサがプログラムを実行することにより構成される例を示していたが、本発明はこれに限られず、各機能部の一部又は全部を、例えば集積回路等のハードウエアによって構成するようにしてもよい。また、上記実施例において、機能部を構成するプログラムは、プログラムコードを記録した記録媒体により提供されてもよい。この場合には、記録媒体のプログラムをコンピュータのプロセッサが読み出して実行することにより、機能部を実現することができる。プログラムコードを供給するための記憶媒体としては、例えば、フレキシブルディスク、CD−ROM、DVD−ROM,ハードディスク、SSD(Solid State Drive)、光ディスク、光磁気ディスク、CD−R、磁気テープ、不揮発性のメモリカード、ROMなどを用いてよい。また、機能部を構成するプログラムを、ネットワークを介して配信することによって、コンピュータのハードディスクやメモリ等の記憶部又はCD−RW、CD−R等の記憶媒体に格納し、コンピュータが備えるプロセッサが記憶部や記憶媒体に格納されたプログラムコードを読み出して実行するようにしてもよい。
10…移動体検出装置、11…CPU、12…メモリ、13…補助記憶装置、14…外部機器I/F、15…表示装置、16…入力装置、20…監視カメラ、101…画像入力部、102…背景差分処理部、103…キーポイント処理部、104…初期領域推定部、105…候補領域決定部、106…物体分類部、107…存在領域決定部、108…存在領域表示部、200…クライアント装置、300…サーバ装置、400…ネットワーク

Claims (15)

  1. 動画像の中から検出対象の移動物体を検出する移動物体検出装置において、
    動画像を入力する動画像入力部と、
    前記動画像における2つのフレーム画像間の対応するキーポイントを特定し、キーポイントの動きベクトルを特定し、前記動きベクトルに基づいて、同一の移動物体を構成すると想定されるキーポイントの集合を生成するキーポイント処理部と、
    前記2つのフレーム画像における一方のフレーム画像における同一の集合のキーポイントを含む第1領域を推定する第1領域推定部と、
    前記第1領域について、所定の変形を行った1以上の第2領域を決定する第2領域決定部と、
    前記第1領域と、前記第2領域とに対して、その領域の画像が検出対象の移動物体である確からしさを示す確度の評価を行う物体分類部と、
    前記第1領域及び前記第2領域の中から前記検出対象の移動物体である確度が高い領域を、前記移動物体が存在する存在領域として決定する存在領域決定部と、
    を備える移動物体検出装置。
  2. キーポイントを特定する2つのフレーム画像は、時間的に連続するフレーム画像である
    請求項1に記載の移動物体検出装置。
  3. 前記第1領域は、矩形の領域であり、
    前記第2領域決定手段は、前記第1領域のいずれか一辺を移動させる変形により得られる領域を前記第2領域として決定する
    請求項1又は請求項2に記載の移動物体検出装置。
  4. 前記第2領域は、前記第1領域の各辺について、前記第1領域の一辺を移動させて前記第1領域よりも拡大させた4つの拡大領域と、前記第1領域の各辺について、前記第1領域の一辺を移動させて前記第1領域よりも縮小させた4つの縮小領域とを含む
    請求項3に記載の移動物体検出装置。
  5. 前記第2領域は、前記第1領域のいずれか一辺について垂直な方向に前記第1領域のその方向の幅に対して所定の割合だけ移動させた領域である
    請求項3又は請求項4に記載の移動物体検出装置。
  6. 前記第2領域決定部は、前記第1領域に含まれる前記キーポイントの前記動きベクトルの長さに基づいて前記所定の割合を決定する
    請求項5に記載の移動物体検出装置。
  7. 前記物体分類部は、畳み込みニューラルネットワークにより、領域のデータを用いて、領域が検出対象の移動物体である確度を出力するように構成されている
    請求項1から請求項6のいずれか一項に記載の移動物体検出装置。
  8. 前記動画像の背景画像を記憶する記憶部と、
    それぞれの前記フレーム画像から背景画像の成分を取り除く背景差分処理部と、をさらに有し、
    前記キーポイント処理部は、前記背景画像の成分を取り除いたフレーム画像を用いて処理を実行する
    請求項1から請求項7のいずれか一項に記載の移動物体検出装置。
  9. 前記第1領域に対する前記存在領域の範囲を特定可能な範囲特定情報を登録する範囲特定情報登録部と、
    前記第1領域決定手段により推定された新たなフレーム画像に対する第1領域の位置を基準に、前記範囲特定情報により特定される第3領域を特定する第3領域特定部とをさらに備え、
    前記物体分類部は、前記第3領域に対して、前記所定の移動物体であるか否かの評価を行い、
    前記存在領域決定部は、前記第3領域に対する前記評価結果が所定の評価以上である場合には、前記第3領域を前記移動物体が存在する存在領域に決定する
    請求項1から請求項8のいずれか一項に記載の移動物体検出装置。
  10. 前記範囲特定情報は、前記第1領域の基準位置から前記第3領域の基準位置までのベクトルと、前記第3領域の基準位置から前記第3領域の前記基準の位置に対して対角となる位置までのベクトルとを含む
    請求項9に記載の移動物体検出装置。
  11. 前記第3領域に対する前記評価結果が所定の評価未満である場合に、前記第2領域決定手段は、第2領域を決定し、前記物体分類部は、前記第1領域と、前記第2領域とに対して、前記所定の移動物体であるか否かの評価を行い、前記存在領域決定部は、前記第1領域及び前記第2領域の中から前記移動物体である評価が高い領域を、前記移動物体が存在する存在領域として決定する
    請求項9又は請求項10に記載の移動物体検出装置。
  12. ネットワークを介して接続されたクライアント装置と、サーバ装置とを備える移動物体検出システムであって、
    前記クライアント装置は、
    動画像を入力する動画像入力部と、
    前記動画像における2つのフレーム画像間の対応するキーポイントを特定し、キーポイントの動きベクトルを特定し、前記動きベクトルに基づいて、同一の移動物を構成すると想定されるキーポイントの集合を生成するキーポイント処理部と、
    フレーム画像における同一の集合のキーポイントを含む第1領域を推定する第1領域決定部と、
    前記動画像のフレーム画像の第1領域を含む画像を前記サーバ装置に送信する送信部と、を備え、
    前記サーバ装置は、
    前記クライアント装置から送信された画像に基づいて、前記第1領域について、所定の変形を行った1以上の第2領域を決定する第2領域決定部と、
    前記第1領域と、前記第2領域とに対して、その領域の画像が前記所定の移動物体である確からしさを示す確度の評価を行う物体分類部と、
    前記第1領域及び前記第2領域の中から前記移動物体である確度が高い領域を、前記移動物体が存在する領域として決定する存在領域決定部と、
    を備える
    移動物体検出システム。
  13. 前記送信部は、フレーム画像よりも小さいサイズの画像であって、全ての前記第2領域を包含するサイズの画像を送信する
    請求項12に記載の移動物体検出システム。
  14. 前記サーバ装置は、
    前記移動物体が存在する領域の位置を示す情報を前記クライアント装置に送信する送信部をさらに有し、
    前記クライアント装置は、
    前記動画像を表示させるとともに、その動画像中の前記存在領域に対応する領域を識別可能に表示させる存在領域表示部をさらに有する
    請求項12又は請求項13に記載の移動物体検出システム。
  15. 動画像の中から所定の移動物体を検出する移動物体検出装置による移動物体検出方法であって、
    前記移動物体検出装置は、
    動画像を入力し、
    前記動画像における2つのフレーム画像間の対応するキーポイントを特定し、キーポイントの動きベクトルを特定し、
    前記動きベクトルに基づいて、同一の移動物を構成すると想定されるキーポイントの集合を生成し、
    フレーム画像における同一の集合のキーポイントを含む第1領域を推定し、
    前記第1領域について、所定の変形を行った1以上の第2領域を決定し、
    前記第1領域と、前記第2領域とに対して、その領域の画像が前記所定の移動物体である確からしさを示す確度の評価を行い、
    前記第1領域及び前記第2領域の中から前記移動物体である確度が高い領域を、前記移動物体が存在する領域として決定する
    移動物体検出方法。

JP2017014965A 2017-01-31 2017-01-31 移動物体検出装置、移動物体検出システム、及び移動物体検出方法 Active JP6947508B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2017014965A JP6947508B2 (ja) 2017-01-31 2017-01-31 移動物体検出装置、移動物体検出システム、及び移動物体検出方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017014965A JP6947508B2 (ja) 2017-01-31 2017-01-31 移動物体検出装置、移動物体検出システム、及び移動物体検出方法

Publications (2)

Publication Number Publication Date
JP2018124689A true JP2018124689A (ja) 2018-08-09
JP6947508B2 JP6947508B2 (ja) 2021-10-13

Family

ID=63111409

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017014965A Active JP6947508B2 (ja) 2017-01-31 2017-01-31 移動物体検出装置、移動物体検出システム、及び移動物体検出方法

Country Status (1)

Country Link
JP (1) JP6947508B2 (ja)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111160240A (zh) * 2019-12-27 2020-05-15 腾讯科技(深圳)有限公司 图像对象的识别处理方法、装置及智能设备、存储介质
JP2021039642A (ja) * 2019-09-05 2021-03-11 Kddi株式会社 符号化パラメータを用いて対象識別位置を決定する対象識別方法、装置及びプログラム
JP2021043773A (ja) * 2019-09-12 2021-03-18 Kddi株式会社 符号化パラメータ特徴量を利用した対象識別方法、装置及びプログラム
CN113221920A (zh) * 2021-05-20 2021-08-06 北京百度网讯科技有限公司 图像识别方法、装置、设备、存储介质以及计算机程序产品
JPWO2020240851A1 (ja) * 2019-05-31 2021-09-13 ニューラルポケット株式会社 情報処理システム、情報処理装置、サーバ装置、プログラム、又は方法
JP2021530048A (ja) * 2018-09-06 2021-11-04 ベイジン センスタイム テクノロジー デベロップメント カンパニー, リミテッド 多階層化目標類別方法及び装置、交通標識検出方法及び装置、機器並びに媒体
WO2024121900A1 (en) * 2022-12-05 2024-06-13 Nec Corporation Key-point associating apparatus, key-point associating method, and non-transitory computer-readable storage medium

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006318345A (ja) * 2005-05-16 2006-11-24 Sony Corp 物体追跡方法、物体追跡方法のプログラム、物体追跡方法のプログラムを記録した記録媒体及び物体追跡装置
WO2011013299A1 (ja) * 2009-07-31 2011-02-03 パナソニック株式会社 移動体検出装置及び移動体検出方法
JP2016085487A (ja) * 2014-10-22 2016-05-19 キヤノン株式会社 情報処理装置、情報処理方法及びコンピュータプログラム
JP2017016333A (ja) * 2015-06-30 2017-01-19 Kddi株式会社 移動物体抽出装置、方法およびプログラム

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006318345A (ja) * 2005-05-16 2006-11-24 Sony Corp 物体追跡方法、物体追跡方法のプログラム、物体追跡方法のプログラムを記録した記録媒体及び物体追跡装置
WO2011013299A1 (ja) * 2009-07-31 2011-02-03 パナソニック株式会社 移動体検出装置及び移動体検出方法
JP2016085487A (ja) * 2014-10-22 2016-05-19 キヤノン株式会社 情報処理装置、情報処理方法及びコンピュータプログラム
JP2017016333A (ja) * 2015-06-30 2017-01-19 Kddi株式会社 移動物体抽出装置、方法およびプログラム

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2021530048A (ja) * 2018-09-06 2021-11-04 ベイジン センスタイム テクノロジー デベロップメント カンパニー, リミテッド 多階層化目標類別方法及び装置、交通標識検出方法及び装置、機器並びに媒体
JPWO2020240851A1 (ja) * 2019-05-31 2021-09-13 ニューラルポケット株式会社 情報処理システム、情報処理装置、サーバ装置、プログラム、又は方法
JP2021039642A (ja) * 2019-09-05 2021-03-11 Kddi株式会社 符号化パラメータを用いて対象識別位置を決定する対象識別方法、装置及びプログラム
JP7143263B2 (ja) 2019-09-05 2022-09-28 Kddi株式会社 符号化パラメータを用いて対象識別位置を決定する対象識別方法、装置及びプログラム
JP2021043773A (ja) * 2019-09-12 2021-03-18 Kddi株式会社 符号化パラメータ特徴量を利用した対象識別方法、装置及びプログラム
JP7145830B2 (ja) 2019-09-12 2022-10-03 Kddi株式会社 符号化パラメータ特徴量を利用した対象識別方法、装置及びプログラム
CN111160240A (zh) * 2019-12-27 2020-05-15 腾讯科技(深圳)有限公司 图像对象的识别处理方法、装置及智能设备、存储介质
CN111160240B (zh) * 2019-12-27 2024-05-24 腾讯科技(深圳)有限公司 图像对象的识别处理方法、装置及智能设备、存储介质
CN113221920A (zh) * 2021-05-20 2021-08-06 北京百度网讯科技有限公司 图像识别方法、装置、设备、存储介质以及计算机程序产品
CN113221920B (zh) * 2021-05-20 2024-01-12 北京百度网讯科技有限公司 图像识别方法、装置、设备、存储介质以及计算机程序产品
WO2024121900A1 (en) * 2022-12-05 2024-06-13 Nec Corporation Key-point associating apparatus, key-point associating method, and non-transitory computer-readable storage medium

Also Published As

Publication number Publication date
JP6947508B2 (ja) 2021-10-13

Similar Documents

Publication Publication Date Title
JP6947508B2 (ja) 移動物体検出装置、移動物体検出システム、及び移動物体検出方法
US11715227B2 (en) Information processing apparatus, control method, and program
CN108256479B (zh) 人脸跟踪方法和装置
US9767570B2 (en) Systems and methods for computer vision background estimation using foreground-aware statistical models
US9747523B2 (en) Information processing apparatus, information processing method, and recording medium
US9773322B2 (en) Image processing apparatus and image processing method which learn dictionary
US20110243381A1 (en) Methods for tracking objects using random projections, distance learning and a hybrid template library and apparatuses thereof
JP6309549B2 (ja) 変形可能な表現検出器
CN108268823B (zh) 目标再识别方法和装置
US10748294B2 (en) Method, system, and computer-readable recording medium for image object tracking
CN104346811B (zh) 基于视频图像的目标实时追踪方法及其装置
US10146992B2 (en) Image processing apparatus, image processing method, and storage medium that recognize an image based on a designated object type
US11049256B2 (en) Image processing apparatus, image processing method, and storage medium
JP2015082245A (ja) 画像処理装置、画像処理方法及びプログラム
JP2015099559A (ja) 画像処理装置、画像処理方法及びプログラム
JP6527421B2 (ja) 人物認識装置及びそのプログラム
JP2021503139A (ja) 画像処理装置、画像処理方法および画像処理プログラム
CN115375917B (zh) 一种目标边缘特征提取方法、装置、终端及存储介质
JP2013206458A (ja) 画像における外観及びコンテキストに基づく物体分類
JP6613687B2 (ja) 画像処理装置、画像処理方法及びプログラム
CN111091056A (zh) 图像中的墨镜识别方法及装置、电子设备、存储介质
US11716448B2 (en) Information processing apparatus, information processing method, and storage medium
US20180060647A1 (en) Image processing apparatus, non-transitory computer readable medium, and image processing method
JP6555940B2 (ja) 被写体追跡装置、撮像装置、及び被写体追跡装置の制御方法
JP5865687B2 (ja) 画像特徴量抽出装置およびそのプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20191219

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210209

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210318

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210817

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210916

R150 Certificate of patent or registration of utility model

Ref document number: 6947508

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150