JP2022123391A - 情報処理装置、情報処理方法、及びプログラム - Google Patents
情報処理装置、情報処理方法、及びプログラム Download PDFInfo
- Publication number
- JP2022123391A JP2022123391A JP2021020679A JP2021020679A JP2022123391A JP 2022123391 A JP2022123391 A JP 2022123391A JP 2021020679 A JP2021020679 A JP 2021020679A JP 2021020679 A JP2021020679 A JP 2021020679A JP 2022123391 A JP2022123391 A JP 2022123391A
- Authority
- JP
- Japan
- Prior art keywords
- likelihood
- threshold
- information processing
- partial
- area
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000010365 information processing Effects 0.000 title claims abstract description 81
- 238000003672 processing method Methods 0.000 title claims 3
- 238000003384 imaging method Methods 0.000 description 42
- 238000001514 detection method Methods 0.000 description 39
- 238000000034 method Methods 0.000 description 35
- 238000012545 processing Methods 0.000 description 35
- 238000010586 diagram Methods 0.000 description 17
- 238000004891 communication Methods 0.000 description 8
- 230000006870 function Effects 0.000 description 7
- 238000004590 computer program Methods 0.000 description 3
- 230000007423 decrease Effects 0.000 description 3
- 238000010191 image analysis Methods 0.000 description 3
- 238000005259 measurement Methods 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 238000009434 installation Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000001186 cumulative effect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/70—Determining position or orientation of objects or cameras
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/50—Context or environment of the image
- G06V20/52—Surveillance or monitoring of activities, e.g. for recognising suspicious objects
- G06V20/53—Recognition of crowd images, e.g. recognition of crowd congestion
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/11—Region-based segmentation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/22—Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/25—Determination of region of interest [ROI] or a volume of interest [VOI]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/764—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/774—Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/103—Static body considered as a whole, e.g. static pedestrian or occupant recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20021—Dividing image into blocks, subimages or windows
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20092—Interactive image processing based on input by user
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30196—Human being; Person
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30242—Counting objects in image
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Computing Systems (AREA)
- Databases & Information Systems (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Human Computer Interaction (AREA)
- Image Analysis (AREA)
Abstract
Description
本発明は、画像から特定の物体を検出する技術に関する。
特許文献1には、撮影シーンに対応する顔領域検出の尤度の閾値の設定に関する技術が開示されている。例えば、尤度のみを用いて計測対象物体の数を推測する場合には、確からしさが低い尤度もすべて計数に含まれることになるため、閾値を用いることで、確からしさが低い尤度を計数対象から除外する。
前述したように閾値を用いて確からしさの低い尤度を除外する場合、計測対象ではない物体を誤って計数してしまう誤検出を低減することが可能となる。しかしながら、特定の物体として正しく検出(正検知)されてはいるが、その尤度が低い場合には、当該正検知された尤度を誤検知として除外してしまうことがあり、正検知の尤度が減少してしまう。
そこで、本発明は、画像から計測対象となる物体の数を精度よく推定することを目的とする。
本発明の情報処理装置は、入力画像から、特定物体が存在する確からしさを示す尤度の分布を表す尤度情報を取得する取得手段と、前記尤度情報に基づいて、前記入力画像の部分領域に含まれる前記尤度が第1の所定値以上である場合には、当該部分領域に対する閾値をより低く調整する領域として決定する決定手段と、前記決定手段で決定した前記部分領域に含まれる前記尤度のうち前記調整された閾値未満の尤度を計数対象から除外して、前記部分領域ごとに尤度を計数することによって前記特定物体の数を推定する推定手段と、を有することを特徴とする。
本発明によれば、画像から計測対象となる物体の数を精度よく推定できる。
以下、実施形態について、図面を参照しながら説明する。なお、以下の実施形態において示す構成は一例に過ぎず、図示された構成に限定されるものではない。
<第1の実施形態>
監視カメラで撮影された画像や撮影後に記憶装置に記憶された画像を解析し、活用する事例が増えている。例えば、画像中に存在する人体や頭部などの特定の物体を計数対象物体とし、特定の物体としての確からしさを示す尤度を推定し、その尤度を基に、当該画像に含まれる計数対象物体のおおよその数を推定する画像解析システムがある。本実施形態では、画像における対象物体を計数する際に、領域毎に対象物体を計数するための閾値を変更することによって、計数対象物体の未検出または誤検出を抑制し、検出精度を向上させる。図1は、本実施形態の情報処理装置100が適用されるシステム構成の一例を示した図である。本実施形態におけるシステムは、情報処理装置100、撮像装置110、記録装置120、およびディスプレイ130を有している。情報処理装置100、撮像装置110、および記録装置120は、ネットワーク140を介して相互に接続されている。
<第1の実施形態>
監視カメラで撮影された画像や撮影後に記憶装置に記憶された画像を解析し、活用する事例が増えている。例えば、画像中に存在する人体や頭部などの特定の物体を計数対象物体とし、特定の物体としての確からしさを示す尤度を推定し、その尤度を基に、当該画像に含まれる計数対象物体のおおよその数を推定する画像解析システムがある。本実施形態では、画像における対象物体を計数する際に、領域毎に対象物体を計数するための閾値を変更することによって、計数対象物体の未検出または誤検出を抑制し、検出精度を向上させる。図1は、本実施形態の情報処理装置100が適用されるシステム構成の一例を示した図である。本実施形態におけるシステムは、情報処理装置100、撮像装置110、記録装置120、およびディスプレイ130を有している。情報処理装置100、撮像装置110、および記録装置120は、ネットワーク140を介して相互に接続されている。
ネットワーク140は、例えばETHERNET(登録商標)等の通信規格に準拠する複数のルータ、スイッチ、ケーブル等から実現される。なお、ネットワーク140は、インターネットや有線LAN(Local Area Network)、無線LAN(Wireless Lan)、WAN(Wide Area Network)等により実現されてもよい。
撮像装置110は、被写体等を撮像する装置である。本実施形態では、撮像装置110の一例として監視カメラを挙げ、監視カメラで撮影した画像内に映っている人体や頭部等の特定の物体が、本実施形態における推定および計測の対象物体(以下、計測対象物体とする)であるとする。撮像装置110は、撮像により取得した画像のデータと、その画像を撮像した撮像日時の情報と、当該撮像装置を識別する情報である識別情報とを関連付け、ネットワーク140を介して、情報処理装置100や記録装置120等の外部装置へ送信する。以下、撮像装置110にて撮像された画像のデータを単に画像と呼び、その画像の撮像日時や識別情報を関連情報と呼ぶことにする。なお本実施形態に係るシステムにおいて、撮像装置110は一つとするが、複数であってもよい。すなわち複数の撮像装置110が、ネットワーク140を介して、情報処理装置100や記録装置120と接続されてもよい。この場合、情報処理装置100および記録装置120は、撮像装置から送信されてきた画像の関連情報に含まれる識別情報を用いて、その送信されてきた画像が、複数の撮像装置のうちどの撮像装置によって撮像されたかを判断する。
記録装置120は、撮像装置110が撮像した画像と関連情報とを対応付けて記録する。そして、情報処理装置100からの要求に従って、記録装置120は、記録した情報(画像と関連情報)を、情報処理装置100へ送信する。
以下、撮像装置110や記録装置120から送信されて情報処理装置100に入力される画像を適宜、入力画像を呼ぶことにする。
以下、撮像装置110や記録装置120から送信されて情報処理装置100に入力される画像を適宜、入力画像を呼ぶことにする。
情報処理装置100は、撮像装置110または記録装置120から送られてきた入力画像から特定物体の確からしさを示す尤度を推定し、その尤度の分布を表す尤度情報を取得し、尤度を基に特定物体の数を推定する。また情報処理装置100は、その尤度情報に基づいて尤度の閾値調整用の部分領域を生成する。さらに情報処理装置100は、閾値調整用の部分領域内に所定値以上の高い尤度が一定数以上ある場合には、その部分領域を、閾値を低く調整する領域と判定し、その部分領域について決定した閾値未満の尤度を、特定物体の計測対象外の尤度として決定する。そして情報処理装置100は、その決定した尤度を除外して、特定物体の数を計数する。なお尤度が高いかどうかを判断する比較対象としての所定値は予め決めた値(一例として0.02など)でもよいし、さらに推定結果に応じて所定値から相対的に調整した値(推定結果に応じて相対的に例えば0.02以上に調整した値等)が用いられてもよい。本実施形態における情報処理装置100の構成および情報処理の詳細な説明は後述する。
ディスプレイ130は、LCD(Liquid Crystal Display)等により構成されており、情報処理装置100による情報処理の結果や撮像装置110が撮像した画像などを表示する。ディスプレイ130は、HDMI(登録商標)(High Definition Multimedia Interface)等の通信規格に準拠したディスプレイケーブルを介して情報処理装置100と接続されている。なお、ディスプレイ130、情報処理装置100および記録装置120の少なくともいずれか一つ又は全ては、単一の筐体に設けられてもよい。また情報処理装置100による情報処理の結果や撮像装置110による撮像画像は、ディスプレイ130に限らず、例えば次のような外部装置が有するディスプレイに表示されてもよい。例えば、ネットワーク140を介して接続されたスマートフォン、タブレット端末などのモバイルデバイスが有するディスプレイに表示されていてもよい。
次に図2は本実施形態に係る情報処理装置100の機能ブロックの一例を示した図である。以下、図2に示した機能ブロックを参照して、本実施形態に係る情報処理装置100における情報処理について説明する。なお以下の説明では、例えばパーソナルコンピュータが本実施形態に係る情報処理プログラムを実行することによって、図2の機能ブロックに示した各機能部が実現される例を挙げる。すなわち図2の各機能部は、パーソナルコンピュータのCPU(Central Processing Unit)等がROM(Read Only Memory)等に格納されたコンピュータプログラムを実行することによって実現されるとする。なお本実施形態の情報処理装置100に係る各機能を実現するパーソナルコンピュータ等のハードウェア構成等は、後に図10を用いて説明する。
通信部200は、後述する図10のI/F1040を介して、撮像装置110や記録装置120と通信する。通信部200は、例えば撮像装置110が撮像した動画像や静止画、あるいは記録装置120に記録された動画像や静止画などの入力画像と、その関連情報を受信する。なお、動画像は、時間的な連続性(あるいは関連性)を有する複数のフレームの画像により構成される。通信部200は、動画像を構成する複数フレームの画像のうち少なくとも一つの画像、あるいは静止画を、処理対象の画像として取得する。また、通信部200は、撮像装置を制御するための制御コマンドを撮像装置110へ送信したり、記録装置を制御するための制御コマンドを記録装置120へ送信したりする。なお、撮像装置に対する制御コマンドは、例えば当該撮像装置に対して画像を撮像するよう指示を行うコマンドを含む。また、記録装置に対する制御コマンドは、当該記録装置から画像を読み出すような指示を行うコマンドを含む。
出力制御部201は、入力画像、本実施形態に係る情報処理に関する設定を行う設定画面、または当該情報処理装置100による情報処理の結果を示す情報などを、外部装置に出力したり、ディスプレイ130に表示させたりする。なお、出力制御部201による情報の出力先である外部装置には、他の情報処理装置(不図示)や記録装置120が含まれる。
操作受付部202は、キーボードやマウス、タッチパネル等の入力装置(不図示)を介して、ユーザが行った操作を受け付ける。
操作受付部202は、キーボードやマウス、タッチパネル等の入力装置(不図示)を介して、ユーザが行った操作を受け付ける。
設定部203は、入力画像に対して特定物体の数を推定する推定処理の対象である複数の部分領域(第1の部分領域)を設定する。第1の部分領域とは、後述する推定部204によって画像から推定される特定物体の数を合算して計数する際の計数対象領域であり、例えばユーザが操作受付部202を介して入力画像上に指定した位置に基づいて設定部203が設定する領域である。具体的には、後述する回帰ベース推定法に入力するために入力画像を分割した部分画像(バッチ)である。なお本実施形態では、例えば入力画像の全体の領域が、所定領域として設定される場合を想定している。例えば、特定物体が存在しない領域がある場合は、入力画像の一部を所定領域として設定してもよい。
また設定部203は、所定領域を覆うように、後述する推定部204による特定物体の推定処理の対象となる複数の部分領域を並べて設定する。このときの設定部203は、入力画像上の複数の異なる地点の各々において特定物体が取り得るサイズと各位置の情報に基づいて、複数の部分領域の個々の大きさと位置を設定する。入力画像の所定領域に対して設定される複数の部分領域、およびそれら部分領域の大きさと位置の設定例の詳細は後述する。なお設定部203は、例えば操作受付部202を介してユーザが指定した領域を、特定物体を推定する処理対象となる部分領域として設定するようにしてもよい。
また設定部203は、後述する推定部204が特定物体を推定した推定結果である尤度を、計数対象の尤度に含めるか否かを判定する際の比較対象としての閾値を設定する。本実施形態において、特定物体の数を推定する処理は、入力画像に含まれる特定物体の数を示す尤度を推定する処理(物体推定処理)と、推定された尤度と閾値とを比較することによって入力画像に含まれる特定物体の数を推定する処理(数推定処理)の2つの処理を行う。ここでいう閾値は、後者の数推定処理において、特定物体の推定結果を有効とするか否かを決定するための閾値である。具体的には、閾値を0.05といった所定の値に設定し、数推定処理の際に閾値未満(あるいは閾値以下)の尤度を計数対象から除外する。尤度の閾値の詳細は後述する。
また設定部203は、後述する推定部204が特定物体を推定した推定結果である尤度を、計数対象の尤度に含めるか否かを判定する際の比較対象としての閾値を設定する。本実施形態において、特定物体の数を推定する処理は、入力画像に含まれる特定物体の数を示す尤度を推定する処理(物体推定処理)と、推定された尤度と閾値とを比較することによって入力画像に含まれる特定物体の数を推定する処理(数推定処理)の2つの処理を行う。ここでいう閾値は、後者の数推定処理において、特定物体の推定結果を有効とするか否かを決定するための閾値である。具体的には、閾値を0.05といった所定の値に設定し、数推定処理の際に閾値未満(あるいは閾値以下)の尤度を計数対象から除外する。尤度の閾値の詳細は後述する。
推定部204は、入力画像の所定領域に対して設定部203が設定した複数の部分領域(第1の部分領域)の各々において特定物体の数を推定する推定処理を実行する。本実施形態では、推定部204が特定物体の数を推定する手法(物体推定処理)として、例えば回帰ベース推定法を用いる例を想定する。回帰ベース推定法では、ある固定サイズsの小画像を入力とし、その小画像内に存在する特定物体の数を出力とする回帰器(学習済み認識モデル)を用いることで、入力画像の所定領域内の複数の部分領域における特定物体の数を推定する。回帰器を学習させるにあたっては、特定物体の位置が既知である固定サイズsの小画像を大量に用意し、当該対象の小画像を学習データとして、機械学習手法に基づいて回帰器を学習しておく。このとき、特定物体の数の推定精度を向上させるために、学習データである小画像のサイズ(固定サイズs)と当該小画像内に存在する特定物体のサイズとの比率が略一定であることが望ましい。そして推定部204は、入力画像の所定領域に設定された複数の部分領域の各々の画像を固定サイズsにリサイズしたものを小画像とし、その小画像を回帰器に入力することで、「当該部分領域内の特定物体の位置や尤度(推定値)」を回帰器からの出力として求める。そして、推定部204では、部分領域内で推定された特定物体の尤度を合算した値を、当該部分領域内における特定物体の数(推定数とする)として求める(数推定処理)。なお、それぞれの尤度について、閾値との比較を行うことで、ノイズとなる推定結果を除外することができる。本実施形態においては、ノイズとなる推定結果を除いた尤度の合計値を最終的な数の推定結果として出力する。なお以降の説明では、特定物体として人物を例に挙げているが、これに限定されるものではなく、特定物体は例えば人物の頭部、上半身、腕、足など人体の一部の部位であってもよいし、自動車やナンバープレートなど他の物体であってもよい。
記録部205は、情報処理装置100による情報処理に関わる情報や画像等のデータを記憶する。例えば、記録部205は、入力画像の所定領域に設定された複数の部分領域の各々に対する、推定部204による推定処理で取得された特定物体の数等を記録する。また記録部205は、推定部204の推定処理によって取得された情報である尤度情報を記録する。なお本実施形態において、尤度情報は、情報処理装置100の記録部205が保持するものとしたが、これに限らない。例えば、情報処理装置100とネットワーク140を介して接続される外部装置(例えば記録装置120)が、尤度情報を保持していてもよい。外部装置に尤度情報が保持される場合、情報処理装置100の通信部200は、尤度情報を要求するコマンドを当該外部装置へ送信し、そのコマンドに従って当該外部装置から送信された尤度情報を取得するようにしてもよい。
調整部206は、推定部204による推定結果の尤度情報である尤度の値および尤度の位置を取得する。また調整部206は、推定部204による尤度情報に基づいて、回帰ベース推定法の回帰器に入力する部分領域と同じするか、若しくは複数の部分領域を連結して、閾値調整用の注目部分領域(第2の部分領域)を生成する。第2の部分領域は、第1の部分領域と共通した領域であってもよいし、尤度情報に基づいて、同じくらいの尤度を含む第1の部分領域を統合することによって生成してもよい。さらに調整部206は、第2の部分領域それぞれの尤度の合計と、第1の所定値とを比較し、第1の所定値よりも尤度が大きい部分領域については、数推定処理のための閾値を設定しない領域として決定する。例えば、ある部分領域に含まれる尤度の合計値が5.4であり、第1の所定値が5であった場合に、5.4>5であるので、当該部分領域は閾値を変更する対象領域となる。なお、第1の所定値よりも尤度が小さい部分領域については、数推定処理の際に該部分領域に含まれる尤度のそれぞれと閾値を比較する処理を行う領域として決定する。調整部206は、部分領域内で第2の所定値以上の高い尤度が一定数以上存在する場合には、その部分領域内の尤度に対する閾値を低くするような閾値調整処理、或いはその部分領域内の尤度に対する閾値をなくす(設定しない)ような、閾値調整処理を行うようにしてもよい。例えば、ある部分領域に含まれる尤度のそれぞれが(0.8,0.8,0.7,0.5,0.3,0.01)であった場合に、それぞれの尤度と第2の所定値(例えば、0.1)を比較する。第2の所定値より大きい尤度の数が一定数(例えば、4以上)である場合に、その部分領域を、閾値を調整する領域として決定する。この具体例の部分領域は、0.1より大きい尤度が5つあって、条件を満たす尤度の数は5>4であるため、閾値を調整する領域として決定する。そして調整部206は、その閾値未満の尤度を、特定物体の計測対象外の尤度として決定し、推定部204で推定された尤度から、その決定した尤度を除外するようにして、特定物体の数を算出する。調整部206におけるこれらの処理の詳細は後述する。
前述したように、推定部204にて推定され、調整部206によって調整された尤度の合算値である特定物体の推定数(例えば人物の数)を示す情報は、出力制御部201により外部装置に出力される。また出力制御部201は、特定物体の推定数の情報の他、調整部206での全体の処理時間を示す情報、総フレーム処理時間を示す情報などを、外部装置の一例であるディスプレイ130に表示させる。
前述したように、本実施形態に係る情報処理装置100は、入力画像内に存在する計測対象物体である特定物体(人体や頭部など)を推定し、その推定した特定物体が存在する確からしさを示す尤度を取得する。また情報処理装置100は、その尤度に基づいて、第2の部分領域を作成し、さらにその第2の部分領域の尤度が第1の所定値以上ある場合には、当該部分領域における尤度の閾値をより低く、若しくはなくすように調整する。そして、情報処理装置100は、閾値未満の尤度については、特定物体の計数対象外として決定して当該尤度を計数から除外し、閾値以上の尤度をカウントすることで特定物体の数を推定する。
次に図3を参照して、入力画像の所定領域に対して複数の部分領域を設定する処理について説明する。図3は、撮像装置110により撮像された画像を入力画像とし、その入力画像全体を所定領域として、設定部203が設定した複数の部分領域の一例を示した図である。
設定部203は、図3に示すように、撮像装置110から入力された画像300に対して複数の部分領域301a、301b、301cを設定する。本実施形態において、設定部203は、画像300上の複数の異なる地点各々において映る人物のサイズと位置の情報に基づき、当該画像300に対して複数の部分領域を設定するものとする。撮像装置110により撮像された画像における各部分領域のサイズは、その撮像画像中に映る特定物体の大きさに依存する。図3の例では、特定物体として人体(人物)を挙げており、部分領域のサイズは、撮像画像内の位置によって大きさが異なって映る人体の大きさに依存する。例えば撮像装置110が床面等の水平面を見下ろす位置に配置されている場合、つまりレンズの光軸が水平軸より下側に向くように撮像装置110が設置されている場合、撮像画像の下部分では人体が大きく映り、上部分では人体が小さく映る。このため、画像300に対する複数の各部分領域のサイズは、画像の下部分に配される部分領域301aの方が、それより上部分に配される部分領域301bや301cよりも大きくなされる。同様に、画像の中部分に配される部分領域301bの方が、それより上部分に配される部分領域301cよりも大きなサイズとなされる。なお、撮像装置110のレンズ光軸と水平軸とがなす角度が90度に近づくほど、撮像画像に含まれる人体の大きさは、当該撮像画像内の位置によらず略均一に近づき、撮像画像の上部と下部とで部分領域のサイズの差は小さくなる。図3の例では、破線で囲まれた各矩形領域が、設定部203により設定される部分領域である。前述のような部分領域の大きさを決定するための計算パラメータは、撮像装置110の設置位置や設置角度、ズーム倍率といった撮像パラメータを用いてもよいし、ユーザが撮像画像から指定した人体等の大きさを用いてもよい。
例えばユーザの指定に基づいて部分領域の大きさを設定する場合、設定部203は、出力制御部201を介して、ディスプレイ等に部分領域の大きさ等をユーザが指定するためのGUI(GRAPHICAL USER INTERFACE)を形成する。ユーザは、操作受付部202を用い、そのGUIを通じて、入力画像の所定領域内の複数の異なる地点各々において映る人物のサイズと位置の情報を指定する。例えば、GUI上に表示された画像に対し、ユーザが上部、中部、下部各々の位置において映る人物の平均的なサイズを指定する操作を行うと、操作受付部202は、そのユーザ指示を受け付ける。そして、操作受付部202が受け付けた上部、中部、下部各々の指示に基づく人物の位置の情報と当該位置において映る人物の平均的なサイズの情報とは、記録部205によって記録される。そして設定部203は、記録部205に記録された、画像の上部、中部、下部各々における人物の位置の情報と、それら位置における人物の平均的なサイズ情報とを取得する。
また、複数の異なる地点各々において映る人物のサイズと位置の情報は、撮像装置110にて予め撮像された画像に対して画像解析を行うことによって取得されてもよい。例えば、設定部203は、撮像装置110によって予め撮像された画像に対しパターンマッチングなどを用いて人物を検出する処理を実行し、当該画像から検出された人物の位置と当該位置における当該人物のサイズとを関連付けた情報を記録部205が記録する。設定部203は、前述のように画像から検出されて記録部205に記録された、複数の異なる地点各々における人物の位置とサイズの情報を、当該記録部205から取得する。
そして設定部203は、前述したユーザの指定若しく画像解析により取得された、画像上の複数の異なる地点各々に対応する人物の位置と、当該位置において映る人物のサイズとに基づいて、画像上の任意の位置に映る人物のサイズ情報f(x,y)を推定する。画像上の任意の位置における人物のサイズ情報f(x,y)は、画像上の任意の位置座標(x、y)において映る人物の平均的なサイズを示している。サイズ情報f(x,y)は、例えば、画像上のx座標を示すx、画像上のy座標を示すy、および1個以上のパラメータによって表せると仮定する。例えば、f(x,y)=ax+by+cと仮定する。この例では、未知のパラメータはa、bおよびcである。このとき、設定部203は、記録部205から読み出された、画像上の複数の異なる地点各々における人物の位置とサイズの情報を用いて、未知のパラメータを、例えば最小二乗法等の統計処理により求めることができる。
そして、設定部203は、画像上の任意の位置における人物のサイズであるサイズ情報f(x,y)に基づき、画像(入力画像の所定領域)に対して複数の部分領域を設定する。図3に示した例では、画像300上の任意の位置における人物のサイズとして、画像300の水平方向において人物のサイズは略同一であり、画像300の垂直方向では下部から上部に向かうにつれ人物のサイズは小さくなる。図3の例の場合、まず、設定部203は、画像300の下端に沿って複数の部分領域301aを設定する。このとき、設定部203は、部分領域301aのサイズ(サイズaとする)と、部分領域301a内の下端の座標においてサイズ情報f(x,y)が示す人物のサイズとの比率が、学習データに対応する比率rと略同一になるように、部分領域301aを設定する。
次に、設定部203は、複数の部分領域301aの上端に沿って、複数の部分領域301bを設定する。このとき、設定部203は、部分領域301bのサイズ(サイズbとする)と、部分領域301b内の下端の座標においてサイズ情報f(x,y)が示す人物のサイズとの比率が、学習データに対応する比率rと略同一になるように、部分領域301bを設定する。
さらに、設定部203は、複数の部分領域301bの上端に沿って、複数の部分領域301cを設定する。このとき、設定部203は、部分領域301cのサイズ(サイズcとする)と、部分領域301c内の下端の座標においてサイズ情報f(x、y)が示す人物のサイズとの比率が、学習データに対応する比率rと略同一になるように、部分領域301cを設定する。
さらに、設定部203は、複数の部分領域301bの上端に沿って、複数の部分領域301cを設定する。このとき、設定部203は、部分領域301cのサイズ(サイズcとする)と、部分領域301c内の下端の座標においてサイズ情報f(x、y)が示す人物のサイズとの比率が、学習データに対応する比率rと略同一になるように、部分領域301cを設定する。
このように、本実施形態の設定部203は、部分領域のサイズと該部分領域における人物等の特定物体のサイズとの比率が、学習データである小画像のサイズと当該小画像に映る特定物体のサイズとの比率rと略同一になるよう、画像に対し部分領域を設定する。すなわち本実施形態では、学習データの環境に近づくよう画像に対して部分領域を設定することで、部分領域に含まれる特定物体の数の推定精度をより高めることができる。なお、図3を参照した上述の説明において、画像の下端から上端に向かう順番で部分領域を設定したが、これに限らず、他の位置から部分領域を設定してもよい。
続いて、図4に示すフローチャートを参照して、本実施形態の情報処理装置100において実行される情報処理の流れを説明する。情報処理装置100は、図4の処理を実行することで、入力画像に対し推定処理を行った結果である尤度情報を基に、計測対象ではない物体の誤検知を低減しつつ、正検知された尤度が減少してしまうことを抑制可能とする。すなわち本実施形態では、誤検知である可能性が高い尤度の低い推定結果を削減しながらも、正しい推定結果である可能性が高い正検知の尤度が計数されなくなることを抑制すること(正検知の尤度の減少量を抑えること)ができる。
なお、図4に示した処理は、例えば撮像装置110により撮像された画像に対して尤度の閾値が設定される設定モードにおいてユーザ指示に従って実行されるようにしてもよい。また、図4の処理は、例えば、撮像装置110にて撮像された画像に対して尤度の閾値の設定が有効である時に、自動的に実行されるようにしてもよい。なお、図4の処理は、例えばROMに格納されたコンピュータプログラムをCPUが実行して実現される、図2に示す機能ブロックにより実行されるものとする。以下のフローチャートにおいて用いる参照符号の「S」は処理ステップを表すものとする。
まずS401において、推定部204は、入力画像に対し、特定物体の存在を推定する学習済みモデルに基づいて、特定物体の位置と尤度を含む尤度情報を取得する。つまり、前述した特定物体(人物や頭部等)の推定およびその数を推定するような推定処理を実行する。入力画像を複数に分割した部分領域(第1の部分領域)のそれぞれを学習済みモデルに入力することによって、それぞれの部分領域に含まれる特定物体の尤度を取得する。なお、尤度は0(存在しない)から1(存在する)の間の値をとる。ここでは、特定物体として、人物の頭部の位置とその尤度を尤度情報として取得する。
次にS402において、調整部206は、設定部203による尤度の閾値設定が有効であるかを判定する。調整部206は、尤度の閾値設定が有効であると判定した場合には処理をS404へ進め、一方、尤度の閾値設定が無効であると判定した場合には処理をS410へ進める。
S403に進むと、調整部206は、推定部204にて得られる推定結果の情報、すなわち特定物体が存在する確からしさを示す尤度の分布を表す尤度情報を取得する。ここで、調整部206は、尤度情報として、例えば、画像内の位置情報と、それら位置情報に対応する尤度の値とを取得する。
次にS404において、調整部206は、S403で推定部204から取得した尤度情報に基づいて、閾値調整用の部分領域(第2の部分領域)を生成する。尤度情報に基づく閾値調整用の部分領域の作成処理の詳細は後述する。
次にS404において、調整部206は、S403で推定部204から取得した尤度情報に基づいて、閾値調整用の部分領域(第2の部分領域)を生成する。尤度情報に基づく閾値調整用の部分領域の作成処理の詳細は後述する。
次に調整部206は、S405からS408までのループ処理を、S404で作成した全ての閾値調整用の部分領域の各々に対して繰り返す。S405~S408では、閾値調整用の部分領域内に所定値以上の尤度が一定数以上あるかを判定し、一定数以上ある場合には、当該部分領域の閾値を低く若しくは閾値を設定しないように調整する領域として決定する処理が行われる。
すなわちS405~S408のループ処理のうち、S406において、調整部206は、閾値調整用の部分領域内に、所定値以上の高い尤度が一定数以上あるかを判定する。調整部206は、閾値調整用の部分領域内に高い尤度が一定数以上ある場合には、計数対象の物体である可能性が高い、つまり正検知の尤度が存在する可能性が高いと判断して、処理をS407に進める。一方、調整部206は、閾値調整用の部分領域内に所定値以上の尤度が一定数以上ない場合には、計数対象の物体が存在する可能性が低い、つまり誤検知の尤度が存在する可能性が高いと判断し、処理をS408へ進める。
S407に進んだ場合、調整部206は、閾値調整用の部分領域に対し、設定部203で設定された尤度の閾値を低くするように調整する。なおS407に進んだ場合、調整部206は、閾値調整用の部分領域に対し、尤度の閾値を0にする、つまり閾値を設定しないように調整してもよい。そして、S404で作成した全ての閾値調整用の部分領域の各々に対し、S405からS408までのループ処理が行われると、調整部206は、S409に処理を進める。
S409に進むと、調整部206は、閾値調整用の部分領域毎に調整された閾値未満の尤度を0とするように更新する。これにより閾値未満の尤度は、計数対象外となる。このS409の後、情報処理装置100の処理は、推定部204によるS410に進む。
S410に進むと、推定部204は、S409で更新された後の尤度を基に、特定物体の数を推定する。すなわち、推定部204では、S409で更新された後の尤度を計数することで、特定物体の数(人物の推定人数)を算出する処理が行われる。
次に、図5(A)から図5(C)を参照して、本実施形態の調整部206において行われる閾値調整用の部分領域の作成処理について説明する。
図5(A)は、推定部204の推定処理時に回帰器に入力する部分領域を、閾値調整用の部分領域として作成した一例を示す図である。図5(A)の画像500Aのうち、斜線部で示した閾値調整用の部分領域は尤度の閾値を低くしない領域であり、斜線部でない部分領域は尤度の閾値が低く調整される領域である。
図5(A)は、推定部204の推定処理時に回帰器に入力する部分領域を、閾値調整用の部分領域として作成した一例を示す図である。図5(A)の画像500Aのうち、斜線部で示した閾値調整用の部分領域は尤度の閾値を低くしない領域であり、斜線部でない部分領域は尤度の閾値が低く調整される領域である。
図5(B)は、所定値以上の複数の尤度が密集して分布している部分領域毎にグループを作成し、グループ単位で閾値調整用の部分領域を作成した一例を示す図である。調整部206は、所定値以上の高い尤度の間の距離によってグループを決定する。なお、図5(B)の画像500Bのうち、斜線部で示した閾値調整用の部分領域は閾値を低くしない領域であり、斜線部でない領域は尤度の閾値が低く調整されるグループになされた領域である。
図5(C)は、所定値以上の尤度を含む塊単位で、閾値調整用の部分領域を作成した一例を示す図である。図5(C)の画像500Cのうち、斜線部で示した閾値調整用の部分領域は閾値を低くしない領域であり、斜線部でない領域は塊単位で作成された領域である。塊単位は、画素同士が連続している尤度の集合としてもよいし、所定値以上の高い尤度を中心に一定範囲内の画素に存在する尤度の集合としてもよい。
なお、閾値調整用の部分領域は、画面全体が対象となされてもよい。
また動画の場合、調整部206は、フレーム間で推定結果が変われば、閾値調整用の部分領域の作成を再度実行して、閾値調整用の部分領域を再作成してもよい。
また調整部206は、所定値以上の尤度が存在しない閾値調整用の部分領域の閾値個所を、高く設定する領域としてもよい。
また動画の場合、調整部206は、フレーム間で推定結果が変われば、閾値調整用の部分領域の作成を再度実行して、閾値調整用の部分領域を再作成してもよい。
また調整部206は、所定値以上の尤度が存在しない閾値調整用の部分領域の閾値個所を、高く設定する領域としてもよい。
以上説明したように、第1の実施形態では、入力画像から推定した尤度情報を基にして、正検知が存在する可能性が高い部分領域の閾値を低く調整する。これにより、誤検知である可能性が高いとする、尤度の低い推定値を低減させながらも、正検知の尤度の減少量を抑えることを可能となる。ゆえに本実施形態によれば、推定した特定物体のカウント精度の向上を図ることが可能となる。
具体的な値等の例を用いて説明する。例えば、特定物体を人体の頭部とし、尤度が高いと判断するのに用いる所定値が0.02であり、正検知の頭部を構成する尤度として0.02以上ものが多数あり、一方、低い尤度の集合体である誤検知は非常に少ない解析結果になる場合を想定する。この例の場合、画像内に、0.02以上の尤度が一定数以上(例えば100個以上)あれば尤度の閾値を低い値(例えば0.010)にし、一方、例えば100個未満であれば尤度の閾値を0.01より高い値(例えば0.015)にする。これにより、誤検知である可能性が高いとする尤度の低い推定値を低減させながらも、正検知の尤度が削減されてしまうのを防ぐことができる。
また他の例として、正検知を構成している尤度が、例えば0.03以上0.10未満となっている高い尤度を含んでおり、誤検知の尤度として0.03を超える尤度がほとんど含まない解析結果である場合を想定する。この例の場合、画像内に、0.03以上の尤度が一定数以上(例えば100個以上)あれば尤度の閾値を例えば0(閾値なしと同じ)にし、一方、例えば10~100個あれば尤度の閾値を低い値(例えば0.010)にする。これにより、誤検知である可能性が高いとする尤度の低い推定値を低減させながらも、正検知の尤度の減少量を抑えることガ可能となる。
<第2の実施形態>
次に第2の実施形態として、所定値以上の高い尤度の数に応じて、閾値調整用の部分領域毎に閾値を決定する閾値調整処理の例を説明する。前述第1の実施形態では、所定値以上の尤度の数が一定数以上存在するか否かで閾値を低く、若しくは閾値をなくす例を説明した。これに対して、第2の本実施形態では、所定値以上の高い尤度の数に応じて、閾値調整用の部分領域毎に尤度の閾値を段階的に調整する閾値調整処理について説明する。なお、第2の実施形態におけるシステム構成や情報処理装置100の機能ブロック等は、第1の実施形態において図1及び図2を参照して説明したものと同様であるので、それらの説明は省略する。
次に第2の実施形態として、所定値以上の高い尤度の数に応じて、閾値調整用の部分領域毎に閾値を決定する閾値調整処理の例を説明する。前述第1の実施形態では、所定値以上の尤度の数が一定数以上存在するか否かで閾値を低く、若しくは閾値をなくす例を説明した。これに対して、第2の本実施形態では、所定値以上の高い尤度の数に応じて、閾値調整用の部分領域毎に尤度の閾値を段階的に調整する閾値調整処理について説明する。なお、第2の実施形態におけるシステム構成や情報処理装置100の機能ブロック等は、第1の実施形態において図1及び図2を参照して説明したものと同様であるので、それらの説明は省略する。
図6は、特定物体が例えば人物である場合において、一人分の正検知に対応する画素毎が持つ尤度値のヒストグラム(度数分布表)の一例を示した図である。ここで、尤度値0は正検知に対応する画素毎が持つ尤度値には含まない。したがって尤度値0は図6の尤度の個数にも含まれていない。例えば、尤度が高いと判断する場合の所定値を0.02以上とした場合、図6の例では、17個の尤度値が対象となる。第2の実施形態では、このように高い尤度の個数に応じて、対象の閾値調整用の部分領域の閾値を決定する。
図7は、所定値以上の高い尤度の個数に応じて、閾値調整用の部分領域毎に閾値を決定する一例を表700として示した図である。図7の例から、調整部206は、閾値調整用の部分領域内に含まれる、所定値以上の尤度の数が0個である場合には正検知がない可能性が高いとみなし、尤度の閾値を最も高くするような閾値調整を行う。また、調整部206は、所定値以上の高い尤度の数が1~100個の場合には閾値を0.01とし、高い尤度の数が101~200個の場合には閾値を0.005とし、201個以上の場合には閾値を設定なし(閾値0)とする閾値調整を行う。
図8は、図7で説明した所定値以上の高い尤度の数に応じて、閾値調整用の部分領域毎に尤度の閾値を段階的に決定する閾値調整処理が行われた結果の一例を示した図である。図7のテーブルを基に、図8の画像800では、斜線部で示した領域では閾値が0.02であるのに対し、閾値が0.01の領域は所定値以上の尤度の数が1~100個の領域を示している。また図8の画像800において、閾値が0.005の領域は所定値以上の尤度の数が101~200個の領域を示し、閾値なしの領域は所定値以上の尤度の数が200個以上の領域を示している。
なお第2の実施形態に係る処理は、例えばユーザが尤度の閾値設定を有効にし、自動調整を選択した時に実行されても良い。また、尤度の閾値設定の自動調整は、検出精度向上の処理として内部処理で実行されても良い。なお動画の場合、フレーム間で推定結果が変わったときには、自動で閾値調整用の部分領域が再作成されてもよい。
第2の実施形態の場合、画像中の尤度情報を基にして、正検知の尤度が存在する可能性が高い部分領域の正検知の数に応じて、閾値を段階的に低く調整することが行われる。これにより、所定値以上の高い尤度の数が多いほど、つまり正検知が多くなるほど、正検知が持つ低い尤度の累積値も多くなる。第2の実施形態によれば、このように尤度の閾値を段階的に決定することで、正検知が多いほど正検知の尤度の減少量が増えてしまうのを防ぐことができる。これにより第2の実施形態では、局所的に適した尤度の閾値を設定でき、推定した特定物体のカウント精度の向上を図ることが可能となる。
<第3の実施形態>
次に、第3の実施形態として、尤度の閾値等を設定するためのGUIを用い、ユーザが尤度の閾値調整用の部分領域を指定した場合に、各閾値調整用の部分領域に対して尤度の閾値を設定する例を説明する。なお、第3の実施形態におけるシステム構成や情報処理装置100の機能ブロック図等は、第1の実施形態の図1及び図2を参照して説明したものと同様であるので、それらの説明は省略する。
次に、第3の実施形態として、尤度の閾値等を設定するためのGUIを用い、ユーザが尤度の閾値調整用の部分領域を指定した場合に、各閾値調整用の部分領域に対して尤度の閾値を設定する例を説明する。なお、第3の実施形態におけるシステム構成や情報処理装置100の機能ブロック図等は、第1の実施形態の図1及び図2を参照して説明したものと同様であるので、それらの説明は省略する。
図9は、第3の実施形態において、設定部203が出力制御部201を介してディスプレイ130等に表示させるGUI画面例を示した図である。調整部206は、このGUI画面を介してユーザが設定した情報に基づいて、閾値調整用の部分領域における尤度の閾値を設定する。
図9の表示画面900は、尤度が低い誤検知を除去することを目的とした尤度の閾値設定を行うGUIの一例を示す図である。初期状態の場合と、表示画面900上でユーザがチェックボックス901を選択し、さらにOKボタン911を押下した場合、調整部206は、尤度の閾値設定を行わない。また表示画面900上で、ユーザがチェックボックス902を選択し、さらにOKボタン911を押下した場合、調整部206は、尤度の閾値設定を実行する。なお、ユーザがチェックボックス902を選択した場合、初期状態では、チェックボックス903が選択されているとする。また、ユーザが、チェックボックス903を選択し、さらにOKボタン911を押下した場合、設定部203は、ユーザにより自動決定が指示されたとして、尤度の閾値を自動で決定して設定する。一方、ユーザがチェックボックス904を選択し、さらにOKボタン911を押下した場合、設定部203は、ラジオボタン905もしくはラジオボタン906を選択可能にする。そして、ユーザがラジオボタン905を選択した場合、調整部206は、画面全体に対する尤度の閾値の指定を可能とする。これにより画面全体に対して任意の閾値未満の尤度を計数対象から除外することが可能となる。また、ユーザがラジオボタン905を選択した場合、設定部203は、エリア設定ボタン913を押下する可能とする。そして、エリア設定をしていない場合に、ユーザが、エリア設定ボタン913を押下し、エリアを設定した場合、調整部206は、設定した全てのエリアに対して、尤度の閾値を設定することが可能となる。なお、表示領域907~910は、エリア1~エリア4に各々設定された閾値(例えば0.005~0.01)が示される。そして、ユーザがOKボタン911を押下すると設定が完了し、一方、キャンセルボタンが押下された場合、調整部206は、設定した内容を反映しない。
以上説明したように、第3の実施形態の場合、ユーザがエリア指定と尤度の閾値の設定をすることができる。また本実施形態では、誤検知が出易い領域や閾値設定による正検知の推定数減少が大きくなることが予想される領域など、各々の状況に合わせて適した尤度の閾値をユーザが指定可能である。第3の実施形態によれば、誤検知が出易い領域には閾値を高く設定したり、特定物体が密集する領域には正検知の尤度の減少量を抑えるように閾値を低く設定したりすることを、ユーザが指定でき、その結果カウント精度の向上を図ることが可能となる。
<ハードウェア構成>
図10は、前述した第1~第3の各実施形態の情報処理装置100の各機能を実現可能なハードウェア構成例を示した図である。なおここでは、情報処理装置100のハードウェア構成について説明するが、記録装置120および撮像装置110も同様のハードウェア構成によって実現されてもよい。
図10は、前述した第1~第3の各実施形態の情報処理装置100の各機能を実現可能なハードウェア構成例を示した図である。なおここでは、情報処理装置100のハードウェア構成について説明するが、記録装置120および撮像装置110も同様のハードウェア構成によって実現されてもよい。
本実施形態における情報処理装置100は、CPU1000と、RAM1010と、ROM1020、HDD1030と、I/F1040と、少なくとも有している。CPU1000は情報処理装置100を統括制御する中央処理装置である。RAM1010は、CPU1000が実行するコンピュータプログラムを一時的に記憶する。また、RAM1010は、CPU1000が処理を実行する際に用いるワークエリアを提供する。また、RAM1010は、例えば、フレームメモリとして機能したり、バッファメモリとして機能したりする。ROM1020は、CPU1000が情報処理装置100を制御するためのプログラムなどを記憶する。HDD1030は、画像データ等を記録する記憶装置である。本実施形態に係る情報処理プログラムはROM1020またはHDD1030に格納されており、RAM1010に展開されてCPU1000にて実行されることにより、前述した図2の各機能部における各処理が実現される。I/F1040は、ネットワーク140を介して、TCP/IPやHTTPなどに従って、外部装置との通信を行う。
なお、上述した実施形態の説明では、CPU1000が処理を実行する例について説明したが、CPU1000の処理のうち少なくとも一部またはすべてが専用のハードウェアによって行われてもよい。例えば、ディスプレイ130にGUIや画像データを表示する処理は、GPU(GRAPHICS PROCESSING UNIT)で実行してもよい。またROM1020からプログラムコードを読み出してRAM1010に展開する処理は、転送装置として機能するDMA(DIRECT MEMORY ACCESS)によって実行されてもよい。また、情報処理装置100の各部は、図10に示すハードウェアにより実現してもよいし、ソフトウェアにより実現することもできる。
<その他の実施形態>
以上、各実施形態について説明したが、本発明はこれらの実施形態に限定されることなく、その要旨の範囲内で種々の変形および変更が可能である。
上述した各実施形態に係る情報処理装置100の1以上の機能を他の装置が有していてもよい。例えば、各実施形態に係る情報処理装置100の1以上の機能を撮像装置110が有していてもよい。なお、上述した各実施形態を任意に組み合わせて実施してもよい。
本発明は、上述の実施形態の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける一つ以上のプロセッサがプログラムを読出し実行する処理でも実現可能である。また、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。
上述の実施形態は、何れも本発明を実施するにあたっての具体化の例を示したものに過ぎず、これらによって本発明の技術的範囲が限定的に解釈されてはならないものである。即ち、本発明は、その技術思想、又はその主要な特徴から逸脱することなく、様々な形で実施することができる。
以上、各実施形態について説明したが、本発明はこれらの実施形態に限定されることなく、その要旨の範囲内で種々の変形および変更が可能である。
上述した各実施形態に係る情報処理装置100の1以上の機能を他の装置が有していてもよい。例えば、各実施形態に係る情報処理装置100の1以上の機能を撮像装置110が有していてもよい。なお、上述した各実施形態を任意に組み合わせて実施してもよい。
本発明は、上述の実施形態の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける一つ以上のプロセッサがプログラムを読出し実行する処理でも実現可能である。また、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。
上述の実施形態は、何れも本発明を実施するにあたっての具体化の例を示したものに過ぎず、これらによって本発明の技術的範囲が限定的に解釈されてはならないものである。即ち、本発明は、その技術思想、又はその主要な特徴から逸脱することなく、様々な形で実施することができる。
100:情報処理装置、110:撮像装置、120:記録装置、130:ディスプレイ、200:通信部、201:出力制御部、202:操作受付部、203:設定部、204:推定部、205:記録部、206:調整部
Claims (15)
- 入力画像から、特定物体が存在する確からしさを示す尤度の分布を表す尤度情報を取得する取得手段と、
前記尤度情報に基づいて、前記入力画像の部分領域に含まれる前記尤度が第1の所定値以上である場合には、当該部分領域に対する閾値をより低く調整する領域として決定する決定手段と、
前記決定手段で決定した前記部分領域に含まれる前記尤度のうち前記調整された閾値未満の尤度を計数対象から除外して、前記部分領域ごとに尤度を計数することによって前記特定物体の数を推定する推定手段と、
を有することを特徴とする情報処理装置。 - 前記決定手段は、前記部分領域に含まれる前記尤度のうち第2の所定値より大きい前記尤度が一定数以上である場合に、前記部分領域に対する前記閾値をより低く調整する領域として決定することを特徴とする請求項1に記載の情報処理装置。
- 前記入力画像から複数の部分領域を生成する生成手段を更に有し、
前記決定手段は、前記生成された部分領域について、前記閾値を調整するか否かを決定することを特徴とする請求項1または2に記載の情報処理装置。 - 前記取得手段は、前記入力画像を、前記特定物体の位置を推定する学習済みモデルに入力した結果として前記尤度情報を取得し、
前記学習済みモデルは、前記生成手段によって生成された複数の前記部分領域のそれぞれについて前記尤度情報を出力することを特徴とする請求項3に記載の情報処理装置。 - 前記生成された複数の前記部分領域ごとに所定の閾値を設定する設定手段を更に有し、
前記決定手段は、前記部分領域内に所定値以上の尤度が一定数以上ある場合に、当該部分領域を、前記設定手段が前記設定した前記閾値よりも閾値を低くする領域として決定することを特徴とする請求項3または4に記載の情報処理装置。 - 前記生成手段は、前記尤度情報に基づいて、前記入力画像から注目部分領域を生成し、
前記決定手段は、前記注目部分領域に含まれる前記尤度情報に基づいて、前記閾値を調整する領域を決定することを特徴とする請求項3乃至5のいずれか1項に記載の情報処理装置。 - 前記生成手段は、前記尤度情報に基づいて、前記尤度が所定の数より多い前記部分領域を前記注目部分領域として生成し、
前記決定手段は、前記注目部分領域を、前記閾値をより低くする領域として決定することを特徴とする請求項6に記載の情報処理装置。 - 前記生成手段は、前記尤度情報に基づいて、前記部分領域に含まれる所定値以上の尤度から所定の範囲に含まれる領域を注目部分領域として生成し、
前記決定手段は、前記注目部分領域を、前記閾値をより低くする領域として決定することを特徴とする請求項6に記載の情報処理装置。 - 前記生成手段は、動画のフレーム間で尤度情報が変われば、前記部分領域を更新することを特徴とする請求項3乃至8のいずれか1項に記載の情報処理装置。
- 前記生成手段は、ユーザからの指示に応じた前記部分領域を生成することを特徴とする請求項3乃至8のいずれか1項に記載の情報処理装置。
- 前記決定手段は、前記部分領域ごとに含まれる所定値以上の尤度の数に応じて、前記閾値を決定することを特徴とする請求項1乃至8のいずれか1項に記載の情報処理装置。
- 前記決定手段は、前記所定値以上の尤度が存在しない前記部分領域の閾値を、前記所定値以上の尤度が存在する部分領域の閾値よりも高く調整することを特徴とする請求項1乃至9のいずれか1項に記載の情報処理装置。
- 前記決定手段は、ユーザからの自動決定の指示或いはユーザからの閾値の指示に応じて、前記部分領域ごとに前記閾値を設定することを特徴とする請求項12に記載の情報処理装置。
- 情報処理装置が実行する情報処理方法であって、
入力画像から、特定物体が存在する確からしさを示す尤度の分布を表す尤度情報を取得する取得工程と、
前記尤度情報に基づいて、前記入力画像の部分領域に含まれる前記尤度が第1の所定値以上である場合には、当該部分領域に対する閾値をより低く調整する領域として決定する決定工程と、
前記決定工程で決定した前記部分領域に含まれる前記尤度のうち前記調整された閾値未満の尤度を計数対象から除外して、前記部分領域ごとに尤度を計数することによって前記特定物体の数を推定する推定工程と、
を有することを特徴とする情報処理方法。 - コンピュータを、請求項1乃至13のいずれか1項に記載の情報処理装置として機能させるためのプログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2021020679A JP2022123391A (ja) | 2021-02-12 | 2021-02-12 | 情報処理装置、情報処理方法、及びプログラム |
US17/667,388 US20220262031A1 (en) | 2021-02-12 | 2022-02-08 | Information processing apparatus, information processing method, and storage medium |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2021020679A JP2022123391A (ja) | 2021-02-12 | 2021-02-12 | 情報処理装置、情報処理方法、及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2022123391A true JP2022123391A (ja) | 2022-08-24 |
JP2022123391A5 JP2022123391A5 (ja) | 2024-02-14 |
Family
ID=82801468
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021020679A Pending JP2022123391A (ja) | 2021-02-12 | 2021-02-12 | 情報処理装置、情報処理方法、及びプログラム |
Country Status (2)
Country | Link |
---|---|
US (1) | US20220262031A1 (ja) |
JP (1) | JP2022123391A (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP4390861A1 (en) * | 2022-12-22 | 2024-06-26 | Axis AB | Methods and devices for setting a threshold in an object detection system |
-
2021
- 2021-02-12 JP JP2021020679A patent/JP2022123391A/ja active Pending
-
2022
- 2022-02-08 US US17/667,388 patent/US20220262031A1/en active Pending
Also Published As
Publication number | Publication date |
---|---|
US20220262031A1 (en) | 2022-08-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7272024B2 (ja) | 物体追跡装置、監視システムおよび物体追跡方法 | |
JP7059054B2 (ja) | 画像処理装置、画像処理方法およびプログラム | |
KR102199094B1 (ko) | 관심객체 검출을 위한 관심영역 학습장치 및 방법 | |
CN108010059B (zh) | 电子防抖算法的性能分析方法及装置 | |
CN110199316B (zh) | 相机和相机的图像处理方法 | |
US20210319234A1 (en) | Systems and methods for video surveillance | |
JP2020149111A (ja) | 物体追跡装置および物体追跡方法 | |
US11948363B2 (en) | Person detection device and person detection method | |
JP2018120283A (ja) | 情報処理装置、情報処理方法及びプログラム | |
JP2018182593A (ja) | 画像処理装置、画像処理方法 | |
WO2019123554A1 (ja) | 画像処理装置、画像処理方法、及び、記録媒体 | |
JP2018113660A (ja) | 情報処理装置、情報処理方法、システム | |
JP2022123391A (ja) | 情報処理装置、情報処理方法、及びプログラム | |
JP6991045B2 (ja) | 画像処理装置、画像処理装置の制御方法 | |
JP2019149119A (ja) | 画像処理装置、画像処理方法及びプログラム | |
JP2018063675A (ja) | 画像処理装置および制御方法 | |
JP2009302731A (ja) | 画像処理装置、画像処理プログラム、画像処理方法、および電子機器 | |
JPWO2018179119A1 (ja) | 映像解析装置、映像解析方法およびプログラム | |
JP2008217330A (ja) | 速度推定方法および速度推定プログラム | |
WO2023273158A1 (zh) | 车路协同中相机作用距离确定方法、装置和路侧设备 | |
US11270442B2 (en) | Motion image integration method and motion image integration system capable of merging motion object images | |
JP7386630B2 (ja) | 画像処理装置、画像処理装置の制御方法及びプログラム | |
JP2018092507A (ja) | 画像処理装置、画像処理方法及びプログラム | |
US10346680B2 (en) | Imaging apparatus and control method for determining a posture of an object | |
JP2022099120A5 (ja) |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20240205 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20240205 |