WO2022201987A1

WO2022201987A1 - 画像解析装置、画像解析システム、画像解析方法及びプログラム

Info

Publication number: WO2022201987A1
Application number: PCT/JP2022/006213
Authority: WO
Inventors: 諭史吉田; 健全劉; 祥治西村
Original assignee: 日本電気株式会社
Priority date: 2021-03-23
Filing date: 2022-02-16
Publication date: 2022-09-29
Also published as: JPWO2022201987A1; AR125574A1; JP7525055B2; TW202240470A

Abstract

画像解析装置（１００）は、時系列的に連続する複数の画像を取得する画像取得部（１０２）と、複数の画像それぞれにおいて、人及び当該人の姿勢を検出する検出部（１０３）と、検出部（１０３）によって検出された人の姿勢を用いて、互いに異なる画像にて検出された人の同一性を判断する判断部（１０４）とを備える。

Description

画像解析装置、画像解析システム、画像解析方法及びプログラム

　本発明は、画像解析装置、画像解析システム、画像解析方法及びプログラムに関する。

　カメラなどで撮影された時系列的に連続する複数の画像から、当該複数の画像における人の移動を追跡する技術がある。

　例えば、特許文献１に記載の一致判定装置は、解析グループに含まれる解析対象についての１つまたは複数の特徴量から選択した選択特徴量を特定し、異なる解析グループ間の選択特徴量の組み合わせに基づいて、複数の解析グループの間の解析対象が一致するかを評価する。また、評価が前記解析グループ間の前記解析対象の一致を示す場合、異なる解析グループそれぞれの解析対象を同一対象と特定する。なお、非特許文献１には、人物の骨格推定に関連する技術が記載されている。

国際公開第２０１９／１３８９８３号

Zhe Cao, Tomas Simon, Shih-En Wei, Yaser Sheikh, "Realtime Multi-Person 2D Pose Estimation using Part Affinity Fields";, The IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2017, P. 7291-7299

　しかしながら、特許文献１に記載の技術では、複数の画像の一部で人同士が重なり合うことや人が柱などの物の後ろに隠れてしまうことなどが生じた場合に、その前後で実際には同一対象である人を同一と判断できなくなることがある。

　本発明は、上述の事情に鑑みてなされたもので、時系列的に連続する複数の画像において精度良く同一の人を特定することが可能な画像解析装置、画像解析システム、画像解析方法及びプログラムを提供することを目的とする。

　上記目的を達成するため、本発明の第１の観点に係る画像解析装置は、
　時系列的に連続する複数の画像を取得する画像取得手段と、
　前記複数の画像それぞれにおいて、人及び当該人の姿勢を検出する検出手段と、
　前記検出された人の姿勢を用いて、互いに異なる画像にて検出された人の同一性を判断する判断手段とを備える。

　本発明の第２の観点に係る画像解析システムは、
　１つ又は複数の撮影手段と、
　上記の画像解析装置とを備える。

　本発明の第３の観点に係る画像解析方法は、
　コンピュータが、
　時系列的に連続する複数の画像を取得することと、
　前記複数の画像それぞれにおいて、人及び当該人の姿勢を検出することと、
　前記検出された人の姿勢を用いて、互いに異なる画像間における人の同一性を判断することとを含む。

　本発明の第４の観点に係るプログラムは、
　コンピュータに、
　時系列的に連続する複数の画像を取得することと、
　前記複数の画像それぞれにおいて、人及び当該人の姿勢を検出することと、
　前記検出された人の姿勢を用いて、互いに異なる画像間における人の同一性を判断することとを実行させるためのプログラムである。

　本発明によれば、時系列的に連続する複数の画像において精度良く同一の人を特定することが可能になる。

本発明の一実施の形態に係る画像解析システムの機能的な構成例を示す図である。撮影領域Ａ１～Ａ２の各々を時刻Ｔ１～Ｔ４の各時刻に撮影した画像の例を模式的に示す図である。一実施の形態に係る画像解析システムの物理的な構成例を示す図である。本発明の一実施の形態に係る画像解析処理の一例を示すフローチャートである。本発明の一実施の形態に係る画像解析処理の一例を示すフローチャートである。撮影領域Ａ１～Ａ２の各々を時刻Ｔ５～Ｔ８の各時刻に撮影した画像の例を模式的に示す図である。図４に示す検出処理の詳細を示すフローチャートである。図４に示すグループ化処理の詳細を示すフローチャートである。撮影領域Ａ１を撮影した時刻Ｔ１～Ｔ６の画像を重ね合わせて示す図である。撮影領域Ａ１を撮影した時刻Ｔ１～Ｔ６の画像にて検出された人の領域をグループ化して動線が生成された例を示す図である。図５に示す結合処理の詳細を示すフローチャートである。図５に示す結合処理の詳細を示すフローチャートである。図１０に示す途切れた動線が結合処理によって結合された例を示す図である。撮影領域Ａ２を撮影した時刻Ｔ１～Ｔ８の画像にて検出された人の領域をグループ化して動線が生成された例を示す図である。異なる撮影領域Ａ１，Ａ２の動線が結合された例を示す図である。

　以下、本発明の一実施の形態について、図面を参照しつつ説明する。全図を通じて同一の要素には同一の符号を付す。なお、すべての図面において、同様な構成要素には同様の符号を付し、適宜説明を省略する。

＜画像解析システムの構成＞
　本発明の一実施の形態に係る画像解析システムは、時系列的に連続する複数の画像に基づいて互いに異なる画像間における人の同一性を判断し、その判断の結果に基づいて人の動線を求めるなどの処理を行う。

　画像解析システムは、図１に示すように、２つのカメラ１０１ａ～１０１ｂと、画像解析装置１００とを備える。画像解析装置１００は、画像取得部１０２と、検出部１０３と、判断部１０４と、識別画像出力部１０５とを備える。

　カメラ１０１ａ～１０１ｂの各々は、駅、建造物、施設、道路上などに設けられ、予め定められた撮影領域を撮影する撮影手段の一例である。カメラ１０１ａ～１０１ｂは、例えば図２に示すように、固定の撮影領域Ａ１～Ａ２を撮影することによって時系列的に連続する複数の２次元画像を示す画像情報を生成する。

　図２は、時刻Ｔ１～Ｔ４に撮影された撮影領域Ａ１～Ａ２の各々の画像を示す。撮影領域Ａ１に示すＰ＿Ｔ１～Ｐ＿Ｔ４は、時刻Ｔ１～Ｔ４のそれぞれに撮影された人Ｐの領域を模式的に示す。撮影領域Ａ１に示すＱ＿Ｔ１～Ｑ＿Ｔ４は、時刻Ｔ１～Ｔ４のそれぞれに撮影された人Ｑの領域を模式的に示す。撮影領域Ａ２に示すＲ＿Ｔ１～Ｒ＿Ｔ４は、時刻Ｔ１～Ｔ４のそれぞれに撮影された人Ｒの領域を模式的に示す。

　なお、カメラは、画像解析システムに１つ以上備えられればよい。

　再び、図１を参照する。
　画像取得部１０２は、撮影領域Ａ１～Ａ２を撮影した時系列的に連続する複数の画像を取得する。本実施の形態では、画像取得部１０２は、カメラ１０１ａ～１０１ｂの各々によって生成された画像情報を、有線、無線又はこれらを適宜組み合わせて構成されたネットワークを介してカメラ１０１ａ～１０１ｂの各々から取得する。

　検出部１０３は、画像取得部１０２によって取得された複数の画像それぞれにおいて、人及び当該人の姿勢を検出する。

　詳細には例えば、検出部１０３は、複数の画像それぞれの画像情報に基づいて、各画像における人の領域と当該人の姿勢とを検出する。画像から人の領域及び姿勢のそれぞれを検出する手法には、公知の手法が用いられてよい。

　人の姿勢は、機械学習を用いた骨格推定技術を用いて、認識される人物の関節等の特徴に基づいて検出されるとよい。骨格推定技術の例として、非特許文献１に記載のＯｐｅｎＰｏｓｅを挙げることができる。

　判断部１０４は、検出部１０３によって検出された人の姿勢を用いて、互いに異なる画像間にて検出された人の同一性を判断する。

　詳細には、判断部１０４は、図１に示すように、特徴量取得部１０６と、特定部１０７とを含む。

　特徴量取得部１０６は、検出部１０３によって検出された人の姿勢を用いて、当該人の姿勢特徴量を求める。

　姿勢特徴量は、人の姿勢の特徴を示す値であって、例えば検出部１０３によって検出された２次元の骨格構造の特徴量である。姿勢特徴量は、骨格構造の全体の特徴量でもよいし、骨格構造の一部の特徴量でもよく、骨格構造の各部のように複数の特徴量を含んでもよい。

　姿勢特徴量の算出方法は、機械学習や正規化等の任意の方法でよく、正規化として最小値や最大値を求めてもよい。一例として、姿勢特徴量は、骨格構造を機械学習することで得られた特徴量や、骨格構造の頭部から足部までの画像上の大きさなどである。骨格構造の大きさは、画像上の骨格構造を含む骨格領域の上下方向の高さや面積などである。上下方向（高さ方向または縦方向）は、画像における上下の方向（Ｙ軸方向）であり、例えば、地面（基準面）に対し垂直な方向である。また、左右方向（横方向）は、画像における左右の方向（Ｘ軸方向）であり、例えば、地面に対し平行な方向である。

　特定部１０７は、特徴量取得部１０６によって求められた姿勢特徴量の類似度が第１基準値以上であるか否かに基づいて、当該互いに異なる画像にて検出された人の同一人を特定する。

　ここで、第１基準値は、姿勢が類似するか否かを判断するための基準として、姿勢特徴量の類似度について予め定められる値である。

　本実施の形態に係る特定部１０７は、以下の条件Ａ～Ｃのすべてを満たす場合に、互いに異なる画像にて検出された人を同一人であると判断する。また、特定部１０７は、条件Ａ～Ｃの少なくとも１つを満たさない場合に、互いに異なる画像にて検出された人を同一人ではないと判断する。

　条件Ａ：姿勢特徴量の類似度が第１基準値以上であること
　条件Ｂ：同一人が時間的に重複して存在することにならないこと
　条件Ｃ：異なる人が場所的に重複して存在することにならないこと

　なお、条件Ｂ及び条件Ｃの一方又は両方が、同一人を特定するための条件に含まれなくてもよい。

　より詳細には、特定部１０７は、グループ化部１０８と、結合部１０９とを含む。

　グループ化部１０８は、上述したように条件Ａ～条件Ｃに基づいて互いに異なる画像にて検出された人が同一人であるか否かを判断し、同一人と判断した人の画像が同じグループに属するように、複数の画像の各々に含まれる人の画像をグループ分けする。このグループ化処理において、「互いに異なる画像」には例えば、撮影された時刻が隣接する画像が時系列に沿って順次選択されるとよい。

　そして、グループ化部１０８は、同じグループに属する人の画像領域を時系列に従って接続することによって、複数の画像に含まれる各人の動線を生成する。この動線は、人の画像の重心、肩の中心など所定箇所を接続した線である。

　なお、グループ化部１０８が、後述する結合部１０９と同様に、条件Ａ～Ｇに基づいて、互いに異なる画像に含まれる人が同一人であるか否かを判断してもよい。

　結合部１０９は、グループ化部１０８によって生成される動線に途切れた動線が含まれる場合に、当該途切れた動線間を結合する。

　ここで、途切れた動線とは、撮影領域Ａ１又はＡ２の中に端部を含む動線である。

　人が移動する場合、通常、撮影領域Ａ１又はＡ２の外から撮影領域Ａ１又はＡ２の中に進入して、撮影領域Ａ１又はＡ２の外へ出て行く。そのため、多くの動線の両端は、撮影領域Ａ１又はＡ２の境界と概ね一致する。しかし、画像において人が重なり合った場合や柱などの物の後方に隠れた場合などに、途切れた動線が生じることがある。

　結合部１０９は、動線の端部となる画像、すなわち動線が途切れる前後の画像に含まれる人が同一人であるか否かを判断し、同一人であると判断した場合に、当該途切れた動線の端部間を接続する。

　本実施の形態に係る結合部１０９は、上記の条件Ａ～条件Ｃ及び以下の条件Ｄ～Ｇに基づいて、互いに異なる画像に含まれる人が同一人であるか否かを判断する。この結合処理において、「互いに異なる画像」には、動線が途切れる前後の画像が選択されるとよい。

　条件Ｄ：動線が途切れる前後の画像の撮影時間間隔が所定時間内であること
　条件Ｅ：動線が途切れる前後の画像にて検出された人の距離が所定距離内であること
　条件Ｆ：動線が途切れる前後の画像にて検出された人の向きの違いが所定の範囲内であること
　条件Ｇ：動線が途切れる前後の画像にて検出された人の画像特徴量の類似度が第２基準値以上であること

　ここで、画像の撮影時間間隔とは、当該画像が撮影された時刻の時間間隔である。時系列的に連続する画像は、例えば毎秒Ｎ（Ｎは１以上の整数）など概ね一定の時間間隔で撮影されることが多いので、撮影時間間隔について予め定められる時間（上記の所定時間）は、画像数で規定されとよい。なお、所定時間は例えば時間長さなどで規定されてもよい。

　人の距離が所定距離であるか否かは、例えば、画像における人の画像領域間の距離（例えば、画素数）に基づいて判断されてもよく、画像における人の画像領域間の距離から推定される実空間の距離に基づいて判断されてもよい。

　画像特徴量とは、人の画像領域の画像としての特徴を示す値であって、画像情報に基づいて生成される特徴量である。画像特徴量は、人の画像全体の特徴量でもよいし、当該画像の一部の特徴量でもよく、顔、胴及び脚のように複数の部分の特徴量を含んでもよい。画像特徴量の算出方法は、機械学習や正規化等の任意の方法でよく、正規化として最小値や最大値を求めてもよい。一例として、画像特徴量は、各色成分の平均輝度、チェック柄、ストライプなどの色彩パターンとの一致度などである。

　第２基準は、画像が類似するか否かを判断するための基準として、画像特徴量の類似度について予め定められる値である。

　本実施の形態に係る結合部１０９は、条件Ａ～Ｇのすべてを満たす場合に、互いに異なる画像にて検出された人を同一人であると判断する。また、結合部１０７は、条件Ａ～Ｇの少なくとも１つを満たさない場合に、互いに異なる画像にて検出された人を同一人ではないと判断する。

　なお、条件Ｂ～条件Ｇの一部又は全部が、途切れた動線を結合するための条件に含まれなくてもよい。

　識別画像出力部１０５は、判断部１０４による判断の結果に基づく識別画像情報を出力する。識別画像情報は、複数の画像それぞれにおいて検出された人に当該人を識別するための情報（すなわち、同一の人を識別するための識別情報）を対応付けた画像を含む情報である。

　識別画像出力部１０５による画像情報の出力方法は、例えば、画像情報の表示、送信などである。すなわち、識別画像出力部１０５は、ディスプレイに画像を表示させてもよく、有線、無線又はこれらを適宜組み合わせて構成されたネットワークを介して接続された他の装置へ画像を送信してもよい。

＜画像解析システムの物理的構成＞
　ここから、本実施の形態に係る画像解析システムの物理的構成の例について、図を参照して説明する。

　画像解析装置１００は物理的には、図３に示すように、バス１０１０、プロセッサ１０２０、メモリ１０３０、ストレージデバイス１０４０、ネットワークインタフェース１０５０、ユーザインタフェース１０６０を有する。

　バス１０１０は、プロセッサ１０２０、メモリ１０３０、ストレージデバイス１０４０、ネットワークインタフェース１０５０、及びユーザインタフェース１０６０が、相互にデータを送受信するためのデータ伝送路である。ただし、プロセッサ１０２０などを互いに接続する方法は、バス接続に限定されない。

　プロセッサ１０２０は、ＣＰＵ（Central Processing Unit）やＧＰＵ（Graphics Processing Unit）などで実現されるプロセッサである。

　メモリ１０３０は、ＲＡＭ（Random Access Memory）などで実現される主記憶装置である。

　ストレージデバイス１０４０は、ＨＤＤ（Hard Disk Drive）、ＳＳＤ（Solid State Drive）、メモリカード、又はＲＯＭ（Read Only Memory）などで実現される補助記憶装置である。

　ストレージデバイス１０４０は、各種の情報を保持する機能を実現する。

　また、ストレージデバイス１０４０は、画像解析装置１００の各機能部（画像取得部１０２、検出部１０３、判断部１０４（特徴量取得部１０６、特定部１０７（グループ化部１０８、結合部１０９））、識別画像出力部１０５）を実現するためのプログラムモジュールを記憶している。プロセッサ１０２０がこれら各プログラムモジュールをメモリ１０３０上に読み込んで実行することで、そのプログラムモジュールに対応する各機能部が実現される。

　ネットワークインタフェース１０５０は、有線、無線又はこれらを組み合わせて構成されるネットワークに画像解析装置１００を接続するためのインタフェースである。本実施の形態に係る画像解析装置１００は、ネットワークインタフェース１０５０を通じてネットワークに接続されることによって、カメラ１０１ａ～１０１ｂなどと互いに通信する。

　ユーザインタフェース１０７０は、ユーザから情報が入力されるインタフェース及びユーザに情報を提示するインタフェースであり、例えば、入力手段としてのマウス、キーボード、タッチセンサなど、ディスプレイ（例えば、液晶ディスプレイ、有機ＥＬディスプレイ）などを含む。

　このように画像解析装置１００の機能は、ソフトウェアプログラムを物理的な各構成要素が協働して実行することによって実現することができる。そのため、本発明は、ソフトウェアプログラム（単に「プログラム」ともいう。）として実現されてもよく、そのプログラムが記録された非一時的な記憶媒体として実現されてもよい。

＜画像解析処理＞
　ここから、本発明の一実施の形態に係る画像解析処理について図を参照して説明する。

　画像解析処理は、カメラ１０１ａ～１０１ｂによって撮影された時系列的に連続する複数の画像に基づいて互いに異なる画像間における人の同一性を判断し、その判断の結果に基づいて人の動線を求めるなどの処理である。

　画像解析処理は、例えば、ユーザから処理対象となる画像を指示することによって開始される。処理対象の画像は、例えば、撮影するカメラと、撮影の開始時刻と終了時刻とを含む撮影時刻とによって指示される。本実施の形態では、処理対象の画像として、カメラ１０１ａ～１０１ｂの各々によって、開始時刻Ｔ１～終了時刻Ｔ８に撮影された画像が指示される例により説明する。

　画像取得部１０２は、カメラ１０１ａ～１０１ｂによって撮影された撮影領域Ａ１，Ａ２の各々についての時系列的に連続する複数の画像を取得する（ステップＳ１０１）。

　詳細には例えば、ステップＳ１０１にて、画像取得部１０２は、図２及び６に示す各画像を示す画像情報をカメラ１０１ａ～１０１ｂの各々から取得する。画像情報は、撮影したカメラ１０１ａ～１０１ｂを識別するためのカメラ識別情報と、撮影時刻とを含むとよい。

　図２及び６は、カメラ１０１ａ～１０１ｂの各々によって、開始時刻Ｔ１～終了時刻Ｔ８に撮影された画像の例を示す図であり、図２は、上述の通り、時刻Ｔ１～Ｔ４に撮影された撮影領域Ａ１～Ａ２の各々の画像を示す。図６は、時刻Ｔ５～Ｔ８に撮影された撮影領域Ａ１～Ａ２の各々の画像を示す。

　図６において、撮影領域Ａ１に示すＰ＿Ｔ５～Ｐ＿Ｔ６は、時刻Ｔ５～Ｔ６のそれぞれに撮影された人Ｐの領域を模式的に示す。撮影領域Ａ１に示すＱ＿Ｔ５～Ｑ＿Ｔ６は、時刻Ｔ５～Ｔ６のそれぞれに撮影された人Ｑの領域を模式的に示す。撮影領域Ａ２に示すＰ＿Ｔ７～Ｐ＿Ｔ８は、時刻Ｔ７～Ｔ８のそれぞれに撮影された人Ｐの領域を模式的に示す。

　図４及び５に示すように、検出部１０３及び判断部１０４は、ステップＳ１０１にて取得した撮影領域Ａ１，Ａ２ごとに、ステップＳ１０３～Ｓ１１０の処理を繰り返し実行する（ステップＳ１０２；ループＡ）。

　ここで、各画像が撮影領域Ａ１，Ａ２のいずれの撮影領域の画像であるかは、ステップＳ１０１にて取得された画像情報のカメラ識別情報を参照することによって判別されるとよい。以下では、最初に撮影領域Ａ１を撮影した時刻Ｔ１～Ｔ８の各画像を対象に処理をする例により説明する。

　検出部１０３及び特徴量取得部１０６は、時系列的に連続する画像の各々について、ステップＳ１０４～Ｓ１０５の処理を繰り返す（ステップＳ１０３；ループＢ）。詳細には例えば、処理対象の撮影領域を撮影領域Ａ１として、時刻Ｔ１～Ｔ８の各画像に対して順にステップＳ１０４～Ｓ１０５の処理を繰り返す。

　検出部１０３は、検出処理を行う（ステップＳ１０４）。

　図７は、検出処理（ステップＳ１０４）の詳細を示すフローチャートである。

　同図に示すように、検出部１０３は、各画像において人の領域を検出する（ステップＳ２０１）。詳細には例えば、図２の左上の画像に示す時刻Ｔ１の画像の場合、実線の楕円Ｐ＿Ｔ１で示す人Ｐの領域と、点線の楕円Ｑ＿Ｔ１で示す人Ｑの領域とを検出する。

　検出部１０３は、ステップＳ２０１にて特定された人の領域の各々について、画像特徴量を求める（ステップＳ２０２）。詳細には例えば、ステップＳ２０１にて特定した人の領域の画像情報に基づいて、各領域の画像の特徴を示す画像特徴量を求める。

　検出部１０３は、ステップＳ２０１にて特定された人の領域の各々について、人の姿勢を検出する（ステップＳ２０３）。

　詳細には例えば、ステップＳ２０１にて特定した人の領域の画像を入力として、機械学習を用いて学習済みの骨格推定モデルを用いて、当該人の骨格の状態を推定することによって、人の姿勢を検出する。例えば、図２の左上の画像に示す時刻Ｔ１の画像の場合、実線の楕円Ｐ＿Ｔ１で示す人Ｐの姿勢と、点線の楕円Ｑ＿Ｔ１で示す人Ｑの姿勢とを検出する。これにより、検出部１０３は、検出処理（ステップＳ１０４）を終了して、図４に示す画像解析処理に戻る。

　同図に示すように、特徴量取得部１０６は、ステップＳ２０３にて検出された人の姿勢を用いて、姿勢特徴量を求める（ステップＳ１０５）。

　詳細には例えば、特徴量取得部１０６は、ステップＳ１０４にて検出された人の姿勢を入力として、機械学習を用いて学習済みの姿勢特徴量算出モデルを用いて、当該人の姿勢特徴量を出力する。例えば、図２の左上の画像に示す時刻Ｔ１の画像の場合、実線の楕円Ｐ＿Ｔ１で示す人Ｐの姿勢特徴量と、点線の楕円Ｑ＿Ｔ１で示す人Ｑの姿勢特徴量とを求める。

　なお、姿勢特徴量を求めるための入力情報に、ステップＳ２０１にて特定された人の領域の画像が、人の姿勢とともに用いられてもよい。

　このようなステップＳ１０４～Ｓ１０５の処理は、ループＡ（ステップＳ１０２）にて処理の対象とされている撮影領域Ａ１を撮影した時系列的に連続する時刻Ｔ１～Ｔ８の画像の各々について繰り返される（ステップＳ１０３；ループＢ）。

　ループＢ（ステップＳ１０３）の処理が終了すると、グループ化部１０８は、ループＡ（ステップＳ１０２）にて処理の対象とされている撮影領域Ａ１を撮影した時系列的に連続する時刻Ｔ１～Ｔ８の画像の各々にて検出された人の画像をグループ化する（ステップＳ１０６）。

　図８は、グループ化処理（ステップＳ１０６）の詳細を示すフローチャートである。

　グループ化部１０８は、ループＡ（ステップＳ１０２）にて処理の対象とされている撮影領域Ａ１を撮影した時系列的に連続する画像の組み合わせについて、ステップＳ３０２～Ｓ３０６の処理を繰り返す（ループＣ；ステップＳ３０１）。

　詳細には例えば、ループＣでの処理対象となる時系列的に連続する画像の組み合わせは、時刻Ｔ６及びＴ５の画像、時刻Ｔ５及びＴ４の画像、時刻Ｔ４及びＴ３の画像、時刻Ｔ３及びＴ２の画像、時刻Ｔ２及びＴ１の画像である。ループＣでは、例えば、時系列順に処理対象となる画像の組み合わせが選定されるとよい。以下では、時間的に後の画像から、すなわち時刻Ｔ６及びＴ５の画像の組み合わせから処理対象となる画像の組み合わせが選定される例により説明する。

　なお、撮影領域Ａ１を撮影した画像について、時刻Ｔ７及びＴ８に人は含まれていないため、ループＣの処理対象としては、時刻Ｔ７及びＴ８の画像は除外されてよい。

　グループ化部１０８は、互いに異なる画像にて検出された人の姿勢特徴量の類似度が第１基準値以上であるか否かを判断する（ステップＳ３０２）。このステップＳ３０２での姿勢特徴量に関する判断処理は、上述の条件Ａを満たすか否かの判断に相当する。

　詳細には例えば、撮影領域Ａ１を撮影した時刻Ｔ６及びＴ５の画像の組み合わせが処理対象であるとする。この場合、グループ化部１０８は、時刻Ｔ６及びＴ５の画像にて検出された人の各組み合わせについて、ステップＳ１０５にて求められた姿勢特徴量の類似度を求める。

　ここで、図９は、撮影領域Ａ１を撮影した時刻Ｔ１～Ｔ６の画像を重ね合わせて示す図である。同図において、時刻Ｔ６及びＴ５の画像にて検出された人は、領域Ｐ＿Ｔ６，Ｐ＿Ｔ５，Ｑ＿Ｔ６，Ｑ＿Ｔ５の人である。類似度は、これら４つの領域から２つの領域を抽出する場合の６個の組み合わせの各々について求められる。この例での組み合わせは、具体的には、領域Ｐ＿Ｔ６及びＰ＿Ｔ５，Ｐ＿Ｔ６及びＱ＿Ｔ６，Ｐ＿Ｔ６及びＱ＿Ｔ５，Ｐ＿Ｔ５及びＱ＿Ｔ６，Ｐ＿Ｔ５及びＱ＿Ｔ５，Ｑ＿Ｔ６及びＱ＿Ｔ５の組み合わせである。

　姿勢特徴量の類似度は、例えば、姿勢特徴量の差、比などである。そして、グループ化部１０８は、姿勢特徴量の類似度と第１基準値とを比較することによって、類似度が第１基準値以上であるか否かを判断する。

　姿勢特徴量の類似度が第１基準値以上ではないと判断した場合（ステップＳ３０２；Ｎｏ）、グループ化部１０８は、当該類似度を求めた姿勢特徴量に係る人が同一人ではないと判断する（ステップＳ３０３）。

　一般的に、移動している人の姿勢が短時間で大きく変わることは少なく、当該姿勢の変化は、一定の範囲内であることが多い。そのため、互いに異なる画像にて検出された人の姿勢特徴量の類似度が第１基準値未満である場合、当該人は同一人ではなく、当該人の姿勢特徴量の類似度が第１基準値以上である場合、当該人は同一人である、と推定することができる。

　例えば撮影領域Ａ１を撮影した時刻Ｔ６及びＴ５の画像にて検出された人の場合、上述の６つの組み合わせのうちの４つの組み合わせについて、領域が示す人が同一人ではないと判断される。この例で、同一人ではないと判断される人を示す領域の組み合わせは、具体的には、領域Ｐ＿Ｔ６及びＱ＿Ｔ６，領域Ｐ＿Ｔ６及びＱ＿Ｔ５，領域Ｐ＿Ｔ５及びＱ＿Ｔ６，領域Ｐ＿Ｔ５及びＱ＿Ｔ５である。

　姿勢特徴量の類似度が第１基準値以上であると判断した場合（ステップＳ３０２；Ｙｅｓ）、グループ化部１０８は、同一人が時間的に重複して又は異なる人が場所的に重複して存在することになるか否かを判断する（ステップＳ３０４）。このステップＳ３０４での同一人の重複に関する判断処理は、上述の条件Ｂ及びＣを満たすか否かの判断に相当する。

　例えば撮影領域Ａ１を撮影した時刻Ｔ６及びＴ５の画像にて検出された人の場合、領域Ｐ＿Ｔ６及びＰ＿Ｔ５，領域Ｑ＿Ｔ６及びＱ＿Ｔ５の組み合わせについては、姿勢特徴量の類似度が第１基準値以上であると判断される。

　領域Ｐ＿Ｔ６及びＰ＿Ｔ５は、異なる時刻Ｔ６及びＴ５の画像に含まれるので、同一人が時間的に重複して存在していない。領域Ｑ＿Ｔ６及びＱ＿Ｔ５についても同様に、異なる時刻Ｔ６及びＴ５の画像に含まれるので、同一人が時間的に重複して存在していない。

　また、領域Ｐ＿Ｔ６及びＰ＿Ｔ５は場所的に重複しておらず、領域Ｑ＿Ｔ６及びＱ＿Ｔ５も場所的に重複していない。

　そのため、この例での領域Ｐ＿Ｔ６及びＰ＿Ｔ５，領域Ｑ＿Ｔ６及びＱ＿Ｔ５の組み合わせについては、同一人が時間的に重複して存在することにならず、かつ、異なる人が場所的に重複して存在することにならない、と判断される。

　同一人が時間的に重複して存在することにならず、かつ、異なる人が場所的に重複して存在することにならないと判断した場合に（ステップＳ３０４；Ｎｏ）、グループ化部１０８は、当該領域によって示される人が同一人であると判断する（ステップＳ３０５）。

　例えば撮影領域Ａ１を撮影した時刻Ｔ６及びＴ５の画像にて検出された領域Ｐ＿Ｔ６及びＰ＿Ｔ５，領域Ｑ＿Ｔ６及びＱ＿Ｔ５の組み合わせについては、各領域によって示される人が同一人であると判断される。

　同一人が時間的に重複して存在することになる、或いは、異なる人が場所的に重複して存在することになると判断した場合に（ステップＳ３０４；Ｙｅｓ）、グループ化部１０８は、当該領域によって示される人が同一人でないと判断する（ステップＳ３０３）。

　例えば、図２及び９に示すように、時刻Ｔ４の撮影領域Ａ１では、撮影方向から見て、領域Ｑ＿Ｔ４の大部分が、領域Ｐ＿Ｔ４の奥にあって、領域Ｐ＿Ｔ４の背後に隠れている。このような場合、ステップＳ２０１にて、領域Ｑ＿Ｔ４が人の領域であると検出できないことがある。この場合、時刻Ｔ５及びＴ４の画像にて検出される人は、領域Ｐ＿Ｔ５，Ｐ＿Ｔ４，Ｑ＿Ｔ５の人となる。

　この場合において例えば、時刻Ｔ５における領域Ｐ＿Ｔ５の人と領域Ｑ＿Ｔ５の人の姿勢が類似しているときなどには、実際の人の領域とは異なる誤った組み合わせの領域の人の姿勢特徴量との類似度が第１基準値以上となることがある。

　例えば、領域Ｐ＿Ｔ５及びＱ＿Ｔ５の人の姿勢特徴量の両方と、領域Ｐ＿Ｔ４の人の姿勢特徴量の類似度が第１基準値以上となるときである。このとき、領域Ｐ＿Ｔ４の人は、領域Ｐ＿Ｔ５の人Ｐと同一人であり、かつ、領域Ｑ＿Ｔ５の人Ｑと同一人である、と判断されることになるので、異なる人Ｐ及びＱが領域Ｐ＿Ｔ４によって示される場所に重複して存在することになる。すなわち、異なる人が場所的に重複して存在することになる。

　或いは、領域Ｑ＿Ｔ４の大部分が領域Ｐ＿Ｔ４の背後に隠れているために、ステップＳ２０３にて、領域Ｑ＿Ｔ４の人の姿勢が実際の正しい姿勢で検出されないことがある。

　この場合においても、時刻Ｔ５における領域Ｐ＿Ｔ５の人と領域Ｑ＿Ｔ５の人の姿勢が類似しているときなどには、実際の人の領域とは異なる誤った組み合わせの領域の人の姿勢特徴量との類似度が第１基準値以上となることがある。

　例えば、領域Ｐ＿Ｔ５の人の姿勢特徴量と領域Ｐ＿Ｔ４及びＱ＿Ｔ４の人の姿勢特徴量の両方との類似度が第１基準値以上となることである。このとき、領域Ｐ＿Ｔ４及びＱ＿Ｔ４の人は、領域Ｐ＿Ｔ５の人Ｐと同一人であると判断されることになるので、同一人Ｐが時間Ｔ４に重複して存在することになる。すなわち、同一人が時間的に重複して存在することになる。

　また例えば、領域Ｑ＿Ｔ５の人の姿勢特徴量と領域Ｐ＿Ｔ４及びＱ＿Ｔ４の人の姿勢特徴量の両方との類似度が第１基準値以上となることもある。このとき、領域Ｐ＿Ｔ４及びＱ＿Ｔ４の人は、領域Ｑ＿Ｔ５の人Ｑと同一人であると判断されることになるので、同一人Ｑが時間Ｔ４に重複して存在することになる。

　このように、条件Ａだけでなく条件Ｂ及びＣを併せて人の同一性を判断することによって、画像にて検出された人が、実際とは異なる人と誤って同一人であると判断されることを防ぐことができる。

　なお、人の同一性の判断に誤りが生じる場合は、他の人の背後に隠れることによって人の領域や姿勢を正しく検出できない場合に限られず、柱の背後に隠れることによって人の領域や姿勢を正しく検出できない場合（図示せず）などもある。

　グループ化部１０８は、同一人と判断された人の領域をグループ化する（ステップＳ３０６）。

　詳細には例えば、図１０に、撮影領域Ａ１を撮影した時刻Ｔ１～Ｔ６の画像にて検出された人をグループ化した例を示す。

　同図に示すように、撮影領域Ａ１を撮影した時刻Ｔ６及びＴ５の画像にて検出された人の領域Ｐ＿Ｔ６，Ｐ＿Ｔ５，Ｑ＿Ｔ６，Ｑ＿Ｔ５について、グループ化部１０８は、領域Ｐ＿Ｔ６及びＰ＿Ｔ５を、同一人の画像を示すグループＧ１に帰属させる。また、グループ化部１０８は、領域Ｑ＿Ｔ６及びＱ＿Ｔ５を、同一人の画像を示すグループＧ２に帰属させる。

　グループ化部１０８は、時刻Ｔ１～Ｔ６の画像のうち時系列的に連続する画像の組み合わせの各々について、ステップＳ３０２～Ｓ３０６の処理を実行する（ループＣ；ステップＳ３０１）。これにより、図１０に示すように、時刻Ｔ１～Ｔ６の画像にて検出された人がグループＧ１～Ｇ４にグループ分けされる。

　図１０は、撮影領域Ａ１を撮影した時刻Ｔ１～Ｔ６の画像にて検出された人をグループ化した例を示す。上述の通り、領域Ｐ＿Ｔ６及びＰ＿Ｔ５はグループＧ１に、領域Ｑ＿Ｔ６及びＱ＿Ｔ５はグループＧ２にグループ化される。また、領域Ｐ＿Ｔ１～Ｐ＿Ｔ３はグループＧ３に、領域Ｑ＿Ｔ１～Ｑ＿Ｔ３はグループＧ４にグループ化される。

　これにより、グループ化部１０８は、グループ化処理（ステップＳ１０６）を終了して、図４に示す画像解析処理に戻る。

　同図に示すように、グループ化部１０８は、各グループＧ１～Ｇ４の動線を生成する（ステップＳ１０７）。

　例えば図１０に示すように、グループＧ１～Ｇ４のそれぞれに属する人の領域の所定箇所（例えば、肩の中心に相当する箇所）を滑らかに接続した動線ＭＬ＿１～ＭＬ＿４が生成される。動線ＭＬ＿１～ＭＬ＿４の矢印が示す方向は、時系列に沿った移動方向である。例えばグループＧ１では、領域Ｐ＿Ｔ５～Ｐ＿Ｔ６を接続した動線ＭＬ＿１が生成される。また、動線ＭＬ＿１の矢印から、グループＧ１に属する領域によって示される人は、画像においてやや上方へ傾斜しつつ概ね右方向へ移動していることが分かる。

　再び、図５を参照する。
　結合部１０９は、ステップＳ１０７にて生成された動線ＭＬ＿１～ＭＬ＿４に途切れた動線が含まれるか否かを判断する（ステップＳ１０８）。

　例えば図１０を参照すると、動線ＭＬ＿１の端部ＭＬ＿１Ｓは、領域Ｐ＿Ｔ５によって示される人の位置に対応しており、撮影領域Ａ１の内部にある。従って、動線ＭＬ＿１は、途切れた動線である。

　同様に、動線ＭＬ＿２の端部ＭＬ＿２Ｓ、動線ＭＬ＿３の端部ＭＬ＿３Ｅ、動線ＭＬ＿４の端部ＭＬ＿４Ｅのいずれの端部も、撮影領域Ａ１の内部にある。従って、動線ＭＬ＿２～４のいずれも、途切れた動線である。

　このように、図１０の例では、動線ＭＬ＿１～ＭＬ＿４のすべてが途切れた動線であり、結合部１０９は、途切れた動線が含まれると判断する。

　途切れた動線が含まれないと判断された場合（ステップＳ１０８；Ｎｏ）、検出部１０３及び判断部１０４は、次の撮影領域についてステップＳ１０３～Ｓ１１０の処理を実行する（ステップＳ１０２；ループＡ）。

　途切れた動線が含まれると判断した場合（ステップＳ１０８；Ｙｅｓ）、結合部１０９は、途切れた動線ＭＬ＿１～ＭＬ＿４について、結合処理（ステップＳ１１０）を繰り返し実行する（ステップＳ１０９；ループＤ）。

　詳細には、結合処理（ステップＳ１１０）では、結合部１０９は、途切れた動線ＭＬ＿１～ＭＬ＿４の各組み合わせについて、上述の条件Ａ～Ｇを満たすか否かを判断する。そして、結合部１０９は、条件Ａ～Ｇが満たされる場合に、グループを併合するとともに併合したグループ間の動線の端部を結合する。

　ここで、図１０の例では、端部ＭＬ＿１Ｓ及びＭＬ＿２Ｓは共通の時刻Ｔ５の画像に基づくものであり、端部ＭＬ＿３Ｅ及びＭＬ＿４Ｅは共通の時刻Ｔ３の画像に基づくものである。共通の時刻の画像に同一人が重複して撮影されることはあり得ないので、共通の時刻の画像に基づく端部を有する動線の組み合わせについて、併合や結合の処理をする必要はない。

　そのため、図１０の例において、ループＤ（ステップＳ１０９）の処理対象となる動線ＭＬ＿１～ＭＬ＿４の組み合わせは、異なる時刻の画像に含まれる端部ＭＬ＿１Ｓ，ＭＬ＿２Ｓ，ＭＬ＿３Ｅ，ＭＬ＿４Ｅを有する動線の組み合わせとなる。すなわち、ループＤ（ステップＳ１０９）の処理対象となる動線の組み合わせは、動線ＭＬ＿１と動線ＭＬ＿３の組、動線ＭＬ＿１と動線ＭＬ＿４の組、動線ＭＬ＿２と動線ＭＬ＿３の組、動線ＭＬ＿２と動線ＭＬ＿４の組である。

　図１１及び１２は、結合処理（ステップＳ１１０）の詳細を示すフローチャートである。

　図１１に示すように、結合部１０９は、動線ＭＬ＿１～ＭＬ＿４が途切れる前後の画像の撮影時間間隔が所定時間内であるか否かを判断する（ステップＳ４０１）。このステップＳ４０１での途切れた撮影時間間隔に関する判断処理は、上述の条件Ｄを満たすか否かの判断に相当する。

　ここで、同一人の動線が途切れる場合には、上述のように柱のような固定物に隠れる場合、人のような移動体に隠れる場合などがある。途切れる前後の画像の撮影時間間隔は、カメラ１０１ａから見て固定物や人の奥方を通過する時間に応じたものとなる。そのため、所定時間には、一般的に、人が固定物や他の人の奥方を通過する時間に応じた時間が予め定めるとよい。

　これにより、動線ＭＬ＿１～ＭＬ＿４が途切れる前後の画像の撮影時間間隔が所定時間内でない場合に、両画像から検出された人が同一人ではないと判断することができる。また、当該撮影時間間隔が所定時間内である場合に、両画像から検出された人が同一人の可能性があると判断することができる。

　図１０に示す例では、動線ＭＬ＿１～ＭＬ＿４のいずれの組み合わせにおいても、途切れている画像数は、１画像である。そのため、所定時間が例えば３画像と定められている場合、結合部１０９は、動線ＭＬ＿１～ＭＬ＿４の各組み合わせについて、途切れる前後の画像の撮影時間間隔が所定時間内であると判断する。

　なお、動線が途切れた原因を推定して、推定された原因に応じて異なる所定時間が定められてもよい。例えば上述のように、固定物に隠れる場合と移動体に隠れる場合とでは、双方が移動する後者の原因で動線が途切れる場合の方が、前者による場合よりも動線が途切れる時間間隔は短くなると考えられる。この場合、動線が途切れた原因は、固定物の位置を予め画像から求めておき、当該固定物の近傍にて動線が途切れたか否かを画像から判断することによって推定されるとよい。

　再び、図１１を参照する。
　撮影時間間隔が所定時間内であると判断した場合（ステップＳ４０１;Ｙｅｓ）、結合部１０９は、動線ＭＬ＿１～ＭＬ＿４が途切れる前後の画像にて検出された人の距離が所定距離内であるか否かを判断する（ステップＳ４０２）。このステップＳ４０２での途切れた距離に関する判断処理は、上述の条件Ｅを満たすか否かの判断に相当する。

　ここで、所定距離には、上述の所定時間で人が一般的に移動する距離が採用されるとよい。例えば、カメラ１０１ａ～１０１ｂによってＮ画像／秒で撮影され、所定時間が３画像と定められている場合、所定距離は、人が３／Ｎ［秒］の間に移動する距離に応じて定められるとよい。ここで、人が一定の時間に移動する距離は、一般的な歩行速度（例えば、時速５ｋｍ）或いはそれよりも速い速度を基に定められるとよい。

　これにより、動線ＭＬ＿１～ＭＬ＿４が途切れる前後の画像にて検出された人の距離が所定距離内でない場合に、当該人が同一人ではないと判断することができる。また、当該距離が所定距離内である場合に、当該人が同一人の可能性があると判断することができる。

　図１０の例では、端部ＭＬ＿３Ｅと端部ＭＬ＿１Ｓ及びＭＬ＿２Ｓの各々との間、端部ＭＬ＿４Ｅと端部ＭＬ＿１Ｓ及びＭＬ＿２Ｓの各々との間のいずれもが、所定距離内であるとする。この場合、結合部１０９は、動線ＭＬ＿１～ＭＬ＿４の各組み合わせについて、途切れる前後の画像にて検出された人の距離が所定距離内であると判断する。

　再び、図１１を参照する。
　検出された人の距離が所定距離内であると判断した場合（ステップＳ４０２;Ｙｅｓ）、結合部１０９は、動線ＭＬ＿１～ＭＬ＿４が途切れる前後の画像にて検出された人の向きの違いが所定の範囲内であるか否かを判断する（ステップＳ４０３）。このステップＳ４０３での人の向きに関する判断処理は、上述の条件Ｆを満たすか否かの判断に相当する。

　ここで、人の向きは、例えば顔領域が画像に含まれるか否か、両肩を結ぶ線分の方向などによって推定することができ、条件Ｆは、人がすれ違うことによって動線が交差する場合の人の同一性を判断する場合に特に有効である。

　例えば、カメラ１０１ａの撮影方向に沿ってカメラ１０１ａから遠ざかる方向へ歩く人は、カメラ１０１ａに顔領域が撮影されない。これに対して、同方向に沿ってカメラ１０１ａへ近づく方向へ歩く人は、カメラ１０１ａに顔領域が撮影される。このように、顔領域が画像に含まれるか否かによって、人の向きを推定することができる。

　また例えば、カメラ１０１ａの撮影方向に沿って移動する人（すなわち、撮影領域Ａ１の上方又は下方へ移動する人）の両肩を結ぶ線分は、撮影領域Ａ１の概ね左右方向を向く。これに対して、カメラ１０１ａの撮影方向と直行する方向へ移動する人（すなわち、撮影領域Ａ１の左方又は右方へ移動する人）の両肩を結ぶ線分は、撮影領域Ａ１の概ね上下方向を向く。このように、両肩を結ぶ線分の方向によって、人の向きを推定することができる。

　移動する人が急に向きを変えることは少ないので、動線ＭＬ＿１～ＭＬ＿４が途切れる前後の画像にて検出された人の向きが大きく異なる場合、当該人は同一人ではない可能性が高い。そのため、動線ＭＬ＿１～ＭＬ＿４が途切れる前後の画像にて検出された人の向きの違いが所定の範囲内でない場合に、当該人が同一人ではないと判断することができる。また、当該人の向きの違いが所定の範囲内である場合に、当該人が同一人の可能性があると判断することができる。

　図１０の例では、動線ＭＬ＿１及びＭＬ＿３は、撮影領域Ａ１において概ね右上方へ移動する人の動線である。動線ＭＬ＿２及びＭＬ＿４は、撮影領域Ａ１において概ね左上方へ移動する人の動線である。そのため、動線ＭＬ＿１～ＭＬ＿４の人について、顔領域はいずれも撮影されないか、撮影されたとしても比較的小さいため、顔領域から人の向きを推定することは困難なことが多い。

　また、両肩を結ぶ線分の方向も、動線ＭＬ＿１及びＭＬ＿３の人と動線ＭＬ＿２及びＭＬ＿４の人とでは直交する場合ほどの角度の違いがない。そのため、結合部１０９は、動線ＭＬ＿１～ＭＬ＿４の各組み合わせについて、途切れる前後の画像にて検出された人の向きの違いが所定の範囲内であると判断する。

　再び、図１１を参照する。
　検出された人の向きの違いが所定の範囲内であると判断した場合（ステップＳ４０３;Ｙｅｓ）、結合部１０９は、動線ＭＬ＿１～ＭＬ＿４が途切れる前後の画像にて検出された人の画像特徴量の類似度が第２基準値以上であるか否かを判断する（ステップＳ４０４）。このステップＳ４０４での画像特徴量に関する判断処理は、上述の条件Ｇを満たすか否かの判断に相当する。

　ここで、画像特徴量が大きく異なる人の画像は、異なる人の画像である可能性が高い。そのため、人の画像特徴量の類似度が第２基準値以上でない場合、当該人は同一人ではないと判断することができる。また、人の画像特徴量の類似度が第２基準値以上である場合に、当該人が同一人の可能性があると判断することができる。

　図１０の例では、動線ＭＬ＿１～ＭＬ＿４の組み合わせのそれぞれに対応する領域Ｐ＿Ｔ３，Ｐ＿Ｔ５，Ｑ＿Ｔ３，Ｑ＿Ｔ５の各組み合わせにおいて、途切れる前後の画像にて検出された人の画像特徴量の類似度が第２基準値以上であるとする。

　再び、図１１を参照する。
　画像特徴量の類似度が第２基準値以上であると判断した場合（ステップＳ４０４;Ｙｅｓ）、結合部１０９は、図１２に示すように、動線ＭＬ＿１～ＭＬ＿４が途切れる前後の画像にて検出された人の姿勢特徴量の類似度が第１基準値以上であるか否かを判断する（ステップＳ４０５）。このステップＳ４０５での姿勢特徴量に関する判断処理は、上述の条件Ａを満たすか否かの判断に相当する。

　上述した通り、移動している人の姿勢が短時間で大きく変わることは少ない。そのため、図１０の例では、動線ＭＬ＿１及び動線ＭＬ＿３の組と、動線ＭＬ＿２及び動線ＭＬ＿４の組とについて、結合部１０９は、人の姿勢特徴量の類似度が第１基準値以上であると判断する。また、これら以外の動線の組について、結合部１０９は、人の姿勢特徴量の類似度が第１基準値以上でないと判断する。

　再び、図１２を参照する。
　姿勢特徴量の類似度が第１基準値以上であると判断した場合（ステップＳ４０５;Ｙｅｓ）、結合部１０９は、同一人が時間的に重複して又は異なる人が場所的に重複して存在することになるか否かを判断する（ステップＳ４０６）。このステップＳ４０６での同一人の重複に関する判断処理は、上述の条件Ｂ及びＣを満たすか否かの判断に相当する。

　図１０の例では、動線ＭＬ＿１及び動線ＭＬ＿３の組と、動線ＭＬ＿２及び動線ＭＬ＿４の組とについて、結合部１０９は、同一人が時間的に重複して存在することにならず、かつ、異なる人が場所的に重複して存在することにならないと判断する。

　ただし、ステップＳ４０６では、同一人が時間的に重複して存在することになるか否か、また異なる人が場所的に重複して存在することになるか否かは、各グループに含まれるすべての領域、言い換えると各動線の全体について判断される。

　図１０の例とは異なり、動線Ａ，Ｂ，Ｃがそれぞれ時刻ＴＡ，ＴＢ，ＴＣに端部を有し、時刻ＴＣは時刻ＴＢよりも後であり、時刻ＴＢは時刻ＴＡよりも後であるとする。また、動線Ａ及びＢの組と、動線Ｂ及びＣの組の両方の組み合わせにおいて、条件Ｄ～Ｇが満たされるとする。

　この例において、動線Ａ及びＢの組と、動線Ｂ及びＣの組の両方の組み合わせにおいて、条件Ａが満たされると、動線Ａは、動線Ｂ及びＣの両方と結合されることになり、時刻ＴＣ以降において、同一人が時間的に重複して存在することになる。このような場合に、ステップＳ４０６では、各動線の全体に基づいて、同一人が時間的に重複して存在することになると判断される。

　同一人が時間的に重複して存在することにならず、かつ、異なる人が場所的に重複して存在することにならないと判断した場合（ステップＳ４０６；Ｎｏ）、結合部１０９は、処理対象となる動線ＭＬ＿１～ＭＬ＿４の組み合わせが同一人のものと判断する。

　そのため、結合部１０９は、同一人の動線ＭＬ＿１～ＭＬ＿４を構成する領域のグループ、すなわち同一人のグループを併合する（ステップＳ４０７）。さらに、結合部１０９は、同一人の途切れた動線ＭＬ＿１～ＭＬ＿４の端部間を結合する（ステップＳ４０８）。ステップＳ４０８の処理を行うと、結合部１０９は、結合処理（ステップＳ１１０）を終了する。

　図１０に示す例では、動線ＭＬ＿１及び動線ＭＬ＿３の組と、動線ＭＬ＿２及び動線ＭＬ＿４の組とが、これまで説明したように条件Ａ～Ｇを満たす。そのため、ステップＳ４０７において、グループＧ１とグループＧ３とは、人Ｐに関するグループとして併合される。グループＧ２とグループＧ４とは、人Ｑに関するグループとして併合される。

　また、ステップＳ４０８では、図１３に示すように、動線ＭＬ＿１と動線ＭＬ＿３とが結合され、これによって、人Ｐに関する動線ＭＬ＿Ｐが生成される。動線ＭＬ＿２と動線ＭＬ＿４とが結合され、これによって、人Ｑに関する動線ＭＬ＿Ｑが生成される。

　再び、図１１及び１２を参照する。
　ステップＳ４０１～Ｓ４０６にて上述とは異なる判断をした場合、結合部１０９は、結合処理（ステップＳ１１０）を終了する。

　すなわち、図１１を参照して、撮影時間間隔が所定時間内でないと判断した場合（ステップＳ４０１;Ｎｏ）、人の距離が所定距離内でないと判断した場合（ステップＳ４０２;Ｎｏ）、人の向きの違いが所定の範囲内でないと判断した場合（ステップＳ４０３;Ｎｏ）、又は、画像特徴量の類似度が第２基準値以上でないと判断した場合（ステップＳ４０４;Ｎｏ）、結合部１０９は、結合処理（ステップＳ１１０）を終了する。

　図１２を参照して、姿勢特徴量の類似度が第１基準値以上でないと判断した場合（ステップＳ４０５;Ｎｏ）、又は、同一人が時間的に重複して存在することになる、若しくは、異なる人が場所的に重複して存在することになると判断した場合（ステップＳ４０６；Ｙｅｓ）、結合部１０９は、結合処理（ステップＳ１１０）を終了する。

　結合処理（ステップＳ１１０）を終了すると、図５に示す画像解析処理に戻り、検出部１０３は、ループＡ（ステップＳ１０２）の処理を繰り返す。本実施の形態では、撮影領域Ａ２について、ステップＳ１０３～Ｓ１１０の処理がさらに行われる。

　撮影領域Ａ２の時刻Ｔ１～Ｔ８の画像（図２及び６参照）に基づいて、例えば図１４に示すように、領域Ｒ＿Ｔ１～Ｒ＿Ｔ４を人Ｒに関するグループＧ５にグループ化し、人Ｒに関する動線ＭＬ＿Ｒを生成する。また、領域Ｐ＿Ｔ７～Ｐ＿Ｔ８をグループＧ６にグループ化し、動線ＭＬ＿５を生成する。

　すべての撮影領域Ａ１，Ａ２についてステップＳ１０３～Ｓ１１０の処理が行われると、図５に示すように、ループＡ（ステップＳ１０２）を終了する。そして、結合部１０９は、異なる撮影領域Ａ１，Ａ２間の動線ＭＬ＿Ｐ，ＭＬ＿Ｑ，ＭＬ＿５，ＭＬ＿Ｒを結合する（ステップＳ１１１）。

　ここでも、共通の時刻の画像に同一人が重複して撮影されることはあり得ないので、異なる時刻の画像に含まれる端部を有する動線の組み合わせについて、画像特徴量に基づいて、同一人の動線であるか否かを判断する。ステップＳ１１１にて処理対象となる動線の組み合わせは、動線ＭＬ＿Ｐ，ＭＬ＿Ｑ，ＭＬ＿５，ＭＬ＿Ｒの場合、動線ＭＬ＿Ｐと動線ＭＬ＿５の組、動線ＭＬ＿Ｑと動線ＭＬ＿５の組である。

　例えば、動線の組の端部となる領域の画像特徴量の類似度が第２基準値以上である場合に、結合部１０９は、動線が同一人のものであると判断して、動線を構成する領域のグループ間を併合するとともに動線の端部間を結合する。また、画像特徴量の類似度が第２基準値以上でない場合に、結合部１０９は、動線が同一人のものでないと判断し、グループを併合せず、また動線も結合しない。

　ステップＳ１１１が行われることによって、図１５に示すように、異なる撮影領域Ａ１，Ａ２の動線が結合される。同図では人Ｐに関する動線として、図１３に示す動線ＭＬ＿Ｐに、図１４に示す動線ＭＬ＿５を結合した動線ＭＬ＿Ｐが生成される例を示す。また、撮影領域Ａ１と撮影領域Ａ２との間において、動線ＭＬ＿Ｐは、図１３に示す動線ＭＬ＿Ｐと動線ＭＬ＿５とを滑らかに接続した動線によって接続されている。

　なお、ステップＳ１１１においても、条件Ａ～Ｇの適宜の組み合わせを満たすか否かに基づいて、グループの併合や動線の結合が行われてもよい。

　再び、図５を参照する。
　識別画像出力部１０５は、判断部１０４による判断の結果に基づく識別画像情報を出力し（ステップＳ１１２）、画像解析処理を終了する。

　識別画像情報が示す画像は、例えば、複数の画像にて検出された人の動線を識別情報とし、動線が人の領域を接続することによって各画像に示される人に識別情報を対応付けた画像である（図１５参照）。また例えば、識別画像情報が示す画像は、人を識別するための数字、記号、符号（例えば、Ｐ，Ｑ，Ｒ）などを識別情報とし、当該識別情報を画像に示される人の領域に対応付けた画像である。

　なお、ここでは、時系列的に連続する複数の画像にて検出された人の同一性の判断結果が識別画像情報として出力される例を示すが、同一性の判断結果は、画像に限らず、適宜の方法で出力されて、人の移動に関する分析処理など種々の処理に利用されてもよい。

　これまで説明したように、本実施の形態によれば、時系列的に連続する複数の画像それぞれにおいて人及び当該人の姿勢が検出され、当該検出された人の姿勢を用いて互いに異なる画像にて検出された人の同一性が判断される。これにより、画像特徴量から人の同一性を判断する場合に、人の動線が途切れるなど人の追跡が困難な場合であっても、人の同一性を判断することができる。従って、時系列的に連続する複数の画像において精度良く同一の人を特定することが可能になる。

　本実施の形態によれば、複数の画像のうち、時系列的に所定の時間内に撮影された画像それぞれにおいて検出された人の姿勢を用いて、互いに異なる画像にて検出された人の同一性を判断する。これにより、より正確に人の同一性を判断することができる。従って、時系列的に連続する複数の画像において、より精度良く同一の人を特定することが可能になる。

　本実施の形態によれば、複数の画像のそれぞれにおいて検出された人のうち、所定の距離内の人の姿勢を用いて、互いに異なる画像にて検出された人の同一性を判断する。これにより、より正確に人の同一性を判断することができる。従って、時系列的に連続する複数の画像において、より精度良く同一の人を特定することが可能になる。

　本実施の形態によれば、複数の画像のそれぞれにおいて検出された人の向きを求める。そして、複数の画像のそれぞれにおいて検出された人のうち、求められた向きの違いが予め定められた範囲内である人の姿勢を用いて、互いに異なる画像にて検出された人の同一性を判断する。これにより、より正確に人の同一性を判断することができる。従って、時系列的に連続する複数の画像において、より精度良く同一の人を特定することが可能になる。

　本実施の形態によれば、検出された人の姿勢を用いて、当該人の姿勢特徴量を求める。そして、求められた姿勢特徴量の類似度が予め定められた基準値以上であるか否かに基づいて、互いに異なる画像にて検出された人の同一性を判断する。これにより、画像特徴量から人の同一性を判断する場合に、人の動線が途切れるなど人の追跡が困難な場合であっても、人の同一性を判断することができる。従って、時系列的に連続する複数の画像において精度良く同一の人を特定することが可能になる。

　本実施の形態によれば、求められた姿勢特徴量の類似度が予め定められた基準値以上である場合において、同一人が時間的に重複して又は異なる人が場所的に重複して存在することになるとき、互いに異なる画像にて検出された人を同一人ではないと判断する。これにより、人の同一性が実際には起こりえない状態で判断されることを防ぐことができる。従って、時系列的に連続する複数の画像において、より精度良く同一の人を特定することが可能になる。

　本実施の形態によれば、求められた姿勢特徴量の類似度が予め定められた基準値以上である場合において、同一人が時間的に重複して存在することにならず、かつ、異なる人が場所的に重複して存在することにならないとき、互いに異なる画像にて検出された人を同一人であると判断する。これにより、人の同一性が実際には起こりえない状態で判断されることを防ぐことができる。従って、時系列的に連続する複数の画像において、より精度良く同一の人を特定することが可能になる。

　本実施の形態によれば、検出された人の同一性に関する判断の結果に基づいて、複数の画像における人を識別する情報を各画像に示される人に対応付けた画像を出力する。このような画像を参照することによって、ユーザは画像を見て容易に人の移動を理解することができる。従って、ユーザが人の移動を容易に理解することが可能になる。

　以上、本発明の実施の形態及び変形例について説明したが、本発明は、これらに限られるものではない。例えば、本発明は、これまで説明した実施の形態及び変形例の一部又は全部を適宜組み合わせた形態、その形態に適宜変更を加えた形態をも含む。

　上記の実施の形態の一手段または全手段は、以下の付記のようにも記載されうるが、以下に限られない。

１．時系列的に連続する複数の画像を取得する画像取得手段と、
　前記複数の画像それぞれにおいて、人及び当該人の姿勢を検出する検出手段と、
　前記検出された人の姿勢を用いて、互いに異なる画像にて検出された人の同一性を判断する判断手段とを備える
　画像解析装置。
２．前記判断手段は、前記複数の画像のうち、時系列的に所定の時間内に撮影された画像それぞれにおいて検出された人の姿勢を用いて、前記互いに異なる画像にて検出された人の同一性を判断する
　１に記載の画像解析装置。
３．前記判断手段は、前記複数の画像のそれぞれにおいて検出された人のうち、所定の距離内の人の姿勢を用いて、前記互いに異なる画像にて検出された人の同一性を判断する
　１又は２に記載の画像解析装置。
４．前記判断手段は、前記複数の画像のそれぞれにおいて検出された人の向きを求め、前記複数の画像のそれぞれにおいて検出された人のうち、前記求められた向きの違いが予め定められた範囲内である人の姿勢を用いて、前記互いに異なる画像にて検出された人の同一性を判断する
　１から３のいずれか１つに記載の画像解析装置。
５．前記判断手段は、前記複数の画像のそれぞれにおいて検出された人の画像特徴量を求め、前記複数の画像のそれぞれにおいて検出された人のうち、前記求められた画像特徴量の類似度が予め定められた基準値以上であるか否かに基づいて、前記互いに異なる画像にて検出された人の同一性を判断する
　１から４のいずれか１つに記載の画像解析装置。
６．前記判断手段は、
　前記検出された人の姿勢を用いて、当該人の姿勢特徴量を求める特徴量取得手段と、
　前記求められた姿勢特徴量の類似度が予め定められた基準値以上であるか否かに基づいて、前記互いに異なる画像にて検出された人の同一性を判断する特定手段とを含む
　１から５のいずれか１つに記載の画像解析装置。
７．前記特定手段は、前記求められた姿勢特徴量の類似度が予め定められた基準値以上である場合において、同一人が時間的に重複して又は異なる人が場所的に重複して存在することになるとき、前記互いに異なる画像にて検出された人を同一人ではないと判断する
　６に記載の画像解析装置。
８．前記特定手段は、前記求められた姿勢特徴量の類似度が予め定められた基準値以上である場合において、同一人が重複して存在することにならず、かつ、異なる人が場所的に重複して存在することにならないとき、前記互いに異なる画像にて検出された人を同一人であると判断する
　６又は７に記載の画像解析装置。
９．前記判断手段による判断の結果に基づいて、前記複数の画像それぞれにおいて検出された人に当該人を識別するための情報を対応付けた画像を出力する識別画像出力手段をさらに備える
　１から８のいずれか１つに記載の画像解析装置。
１０．１つ又は複数の撮影手段と、
　１から９のいずれか１つに記載の画像解析装置とを備える
　画像解析システム。
１１．コンピュータが、
　時系列的に連続する複数の画像を取得することと、
　前記複数の画像それぞれにおいて、人及び当該人の姿勢を検出することと、
　前記検出された人の姿勢を用いて、互いに異なる画像間における人の同一性を判断することとを含む
　画像解析方法。
１２．コンピュータに、
　時系列的に連続する複数の画像を取得することと、
　前記複数の画像それぞれにおいて、人及び当該人の姿勢を検出することと、
　前記検出された人の姿勢を用いて、互いに異なる画像間における人の同一性を判断することとを実行させるためのプログラム。

　この出願は、２０２１年３月２３日に出願された日本出願特願２０２１－０４８５５０号を基礎とする優先権を主張し、その開示の全てをここに取り込む。

　　１００　画像解析装置
　　１０１ａ，１０１ｂ　カメラ
　　１０２　画像取得部
　　１０３　検出部
　　１０４　判断部
　　１０５　識別画像出力部
　　１０６　特徴量取得部
　　１０７　特定部
　　１０８　グループ化部
　　１０９　結合部

Claims

　時系列的に連続する複数の画像を取得する画像取得手段と、
　前記複数の画像それぞれにおいて、人及び当該人の姿勢を検出する検出手段と、
　前記検出された人の姿勢を用いて、互いに異なる画像にて検出された人の同一性を判断する判断手段とを備える
　画像解析装置。
　前記判断手段は、前記複数の画像のうち、時系列的に所定の時間内に撮影された画像それぞれにおいて検出された人の姿勢を用いて、前記互いに異なる画像にて検出された人の同一性を判断する
　請求項１に記載の画像解析装置。
　前記判断手段は、前記複数の画像のそれぞれにおいて検出された人のうち、所定の距離内の人の姿勢を用いて、前記互いに異なる画像にて検出された人の同一性を判断する
　請求項１又は２に記載の画像解析装置。
　前記判断手段は、前記複数の画像のそれぞれにおいて検出された人の向きを求め、前記複数の画像のそれぞれにおいて検出された人のうち、前記求められた向きの違いが予め定められた範囲内である人の姿勢を用いて、前記互いに異なる画像にて検出された人の同一性を判断する
　請求項１から３のいずれか１項に記載の画像解析装置。
　前記判断手段は、前記複数の画像のそれぞれにおいて検出された人の画像特徴量を求め、前記複数の画像のそれぞれにおいて検出された人のうち、前記求められた画像特徴量の類似度が予め定められた基準値以上であるか否かに基づいて、前記互いに異なる画像にて検出された人の同一性を判断する
　請求項１から４のいずれか１項に記載の画像解析装置。
　前記判断手段は、
　前記検出された人の姿勢を用いて、当該人の姿勢特徴量を求める特徴量取得手段と、
　前記求められた姿勢特徴量の類似度が予め定められた基準値以上であるか否かに基づいて、前記互いに異なる画像にて検出された人の同一性を判断する特定手段とを含む
　請求項１から５のいずれか１項に記載の画像解析装置。
　前記特定手段は、前記求められた姿勢特徴量の類似度が予め定められた基準値以上である場合において、同一人が時間的に重複して又は異なる人が場所的に重複して存在することになるとき、前記互いに異なる画像にて検出された人を同一人ではないと判断する
　請求項６に記載の画像解析装置。
　前記特定手段は、前記求められた姿勢特徴量の類似度が予め定められた基準値以上である場合において、同一人が重複して存在することにならず、かつ、異なる人が場所的に重複して存在することにならないとき、前記互いに異なる画像にて検出された人を同一人であると判断する
　請求項６又は７に記載の画像解析装置。
　前記判断手段による判断の結果に基づいて、前記複数の画像それぞれにおいて検出された人に当該人を識別するための情報を対応付けた画像を出力する識別画像出力手段をさらに備える
　請求項１から８のいずれか１項に記載の画像解析装置。
　１つ又は複数の撮影手段と、
　請求項１から９のいずれか１項に記載の画像解析装置とを備える
　画像解析システム。
　コンピュータが、
　時系列的に連続する複数の画像を取得することと、
　前記複数の画像それぞれにおいて、人及び当該人の姿勢を検出することと、
　前記検出された人の姿勢を用いて、互いに異なる画像間における人の同一性を判断することとを含む
　画像解析方法。
　コンピュータに、
　時系列的に連続する複数の画像を取得することと、
　前記複数の画像それぞれにおいて、人及び当該人の姿勢を検出することと、
　前記検出された人の姿勢を用いて、互いに異なる画像間における人の同一性を判断することとを実行させるためのプログラム。