JP6920949B2

JP6920949B2 - 物体分布推定装置

Info

Publication number: JP6920949B2
Application number: JP2017188324A
Authority: JP
Inventors: 知行永橋; 龍佑野坂; 秀紀氏家
Original assignee: Secom Co Ltd
Current assignee: Secom Co Ltd
Priority date: 2017-09-28
Filing date: 2017-09-28
Publication date: 2021-08-18
Anticipated expiration: 2037-09-28
Also published as: JP2019066909A

Description

本発明は、人等の所定の物体が存在し得る空間が撮影された撮影画像から物体の分布を推定する物体分布推定装置に関し、特に、混雑が生じ得る空間が撮影された撮影画像から物体の分布を推定する物体分布推定装置に関する。

マラソンやパレード等のイベントが開催される会場のように混雑が発生し得る空間においては事故防止等のために、混雑が発生している区域に警備員を多く配置するなどの対応が求められる。そこで、会場の各所に監視カメラを配置して撮影画像から人の分布状況を推定し、分布状況を表示することによって監視効率向上が期待できる。

撮影画像からイベント会場に存在している人を検出する方法の１つとして、予め人の画像の特徴を学習した認識器によって撮影画像を探索する方法がある。

例えば、下記特許文献１に記載の物体検出装置においては、認識器として、多数の「人」の画像データおよび「人以外」の画像データを用いて予め学習させた識別器を用いて入力画像から人を検出することが記載されている。

また、下記特許文献２に記載の群衆解析装置においては、予め密度下限値を超えた人物密度の群衆が撮影された学習画像を用いて人物密度ごとに機械学習した識別器を用い人物密度を推定することによって、群衆の発生を判定することが記載されている。

以下、一人ひとりの人を認識する認識器を単体識別器、人物密度を推定する認識器を密度推定器と称する。

特開２０１１−１８６６３３号公報特開２０１７−０６８５９８号公報

ところで、イベント会場は一般に広大であるため設置・運用コストの観点から、各監視カメラの視野を広くして設置台数を減ずることが要請される。

しかしながら、単体識別器と密度推定器とは、それぞれの学習画像の特性によって確度の高い認識が可能な解像度のレンジが異なる。一方、広い視野で撮影した撮影画像においては、カメラから人までの距離に応じた人の像の解像度低下が顕著に生じる。

そのため、広い視野で撮影した撮影画像に対し、認識器をその特性を考慮せずに用いると確度の高い情報を提供することが困難となる問題があった。

すなわち、単体識別器は一人ひとりの人の位置を認識可能であるのに対して、密度推定器は一人ひとりの人の位置までは認識できない。また、一般には認識対象となる画像（撮影画像の一部）の解像度が学習画像よりも低くなると認識精度は低下すること、および単体識別器の学習は単独の人の像が占める学習画像を用いて行われるのに対して密度推定器の学習は複数の人の像が写り得る視野の学習画像を用いて行われることから、カメラから人までの距離に応じた認識精度低下は密度推定器よりも単体識別器の方が生じやすい。

よって、撮影画像におけるカメラ近傍の領域の人の分布は単体識別器により認識した方が詳細な情報を提供できるが、遠方の領域の人の分布までも単体識別器により認識しようとすれば確度の低い情報を提供してしまうことになる。他方、遠方の領域の人の分布は密度推定器により認識した方が確度の高い情報を提供できるが、カメラ近傍の領域の人の分布までも密度推定器により認識しようとすれば詳細な情報を提供し損ねてしまうことになる。

本発明は、上記問題を鑑みてなされたものであり、混雑が生じ得る空間を広い視野で撮影した撮影画像から物体の分布に関する確度の高い情報を広い範囲で推定できる物体分布推定装置を提供することを目的とする。

（１）本発明に係る物体分布推定装置は、撮影部により撮影された所定の物体が存在し得る空間の撮影画像を取得する画像取得手段と、それぞれが、撮影された前記物体の数が異なる複数種類の学習画像それぞれの特徴を予め学習した認識器を用い、前記撮影画像内の任意の位置に撮影された前記物体の数を認識する認識手段であり、認識可能な物体数の範囲が互いに異なる複数の前記認識器を用いて前記物体数の当該範囲ごとに設けられた複数の認識手段と、前記撮影画像内の位置と、前記複数の認識手段のうち当該位置にて前記物体数を予め定めた下限値以上の精度で認識可能である精度保証認識手段とを関連付けて記憶する記憶手段と、前記記憶手段に記憶される前記精度保証認識手段により前記撮影画像内にて取得した物体数から、前記空間における前記物体の分布情報を生成する分布推定手段と、を備える。

（２）上記（１）に記載の物体分布推定装置において、前記認識手段が前記下限値以上の精度で認識可能である前記物体の像に関しての解像度の下限値を当該認識手段の限界解像度と定め、前記記憶手段は、前記撮影画像内の位置に対して、前記複数の認識手段のうち、当該位置での前記物体の像の前記解像度が前記限界解像度以上となるものを前記精度保証認識手段として関連付けて記憶している構成とすることができる。

（３）上記（２）に記載の物体分布推定装置において、前記物体の像の画素数によって前記解像度を表し、前記限界解像度に対応する前記画素数を限界画素数として、前記空間内に存在する前記物体を模したモデルを前記撮影部の撮影面に投影して投影像を生成する投影手段と、前記撮影画像内の位置に対して、当該位置に生成される前記投影像の画素数と前記複数の認識手段それぞれの前記限界画素数とを比較して、当該位置に関連付ける前記精度保証認識手段を選出する選出手段と、をさらに備えた構成とすることができる。

（４）上記（２）に記載の物体分布推定装置において、前記空間における前記撮影部から前記物体までの距離によって前記解像度を推定し、前記限界解像度に対応する前記距離を限界距離として、前記記憶手段は、前記撮影画像内の位置に対して、前記複数の認識手段のうち、当該位置に撮影される前記物体についての前記距離が前記限界距離以下となるものを前記精度保証認識手段として関連付けて記憶している構成とすることができる。

（５）上記（４）に記載の物体分布推定装置において、前記撮影画像における位置を前記空間における前記物体に応じた高さの水平面に逆投影して物体仮想位置を求める投影手段と、前記撮影画像内の位置に対して、当該位置に対応する前記物体仮想位置と前記撮影部との距離と、前記複数の認識手段それぞれの前記限界距離とを比較して、当該位置に関連付ける前記精度保証認識手段を選出する選出手段と、をさらに備えた構成とすることができる。

（６）他の本発明に係る物体分布推定装置は、撮影部により撮影された所定の物体が存在し得る空間の撮影画像を取得する画像取得手段と、所定の密度ごとに当該密度にて前記物体が存在する空間を撮影した密度画像それぞれの特徴を予め学習した密度推定器を用い、前記撮影画像内の任意の位置に撮影された前記物体の前記密度を認識する密度推定手段と、単独の前記物体が撮影された単体画像の特徴を予め学習した単体識別器を用い、前記撮影画像内の任意の位置に撮影された前記物体の有無を認識する単体識別手段と、前記撮影画像内の位置と、前記密度推定手段および前記単体識別手段のうち当該位置にて前記物体の密度または有無を予め定めた下限値以上の精度で認識可能である精度保証認識手段とを関連付けて記憶する記憶手段と、前記記憶手段に記憶される前記精度保証認識手段により前記撮影画像内にて取得した前記物体の密度または有無から、前記空間における前記物体の分布情報を生成する分布推定手段と、を備える。

本発明によれば、混雑が生じ得る空間を広い視野で撮影した撮影画像から物体の分布に関する確度の高い情報を広い範囲で推定できる。

本発明の実施形態に係る物体分布推定装置の概略の構成を示すブロック図である。本発明の実施形態に係る物体分布推定装置が撮影画像を基にした分布推定処理を行うときの機能ブロック図である。本発明の実施形態に係る物体分布推定装置が手法マップ作成処理を行うときの機能ブロック図である。単体識別器記憶手段が記憶している単体識別器の情報を模式的に表した図である。撮影画像およびこれに対応する手法マップの一例を示す模式図である。図５の撮影画像に対応する分布画像の一例を示す模式図である。図５の撮影画像に対応する手法マップの一例を示す模式図である。本発明の実施形態に係る物体分布推定装置の動作の概略のフロー図である。手法マップ作成処理の概略のフロー図である。分布画像生成処理の概略のフロー図である。

以下、本発明の実施の形態（以下実施形態という）に係る物体分布推定装置１について、図面に基づいて説明する。

［物体分布推定装置１の構成］
図１は物体分布推定装置１の概略の構成を示すブロック図である。物体分布推定装置１は、撮影部２、通信部３、記憶部４、画像処理部５、操作部６、表示制御部７および表示部８からなる。

撮影部２は、監視カメラであり、通信部３を介して画像処理部５と接続され、所定の物体が混雑し得る所定の空間を所定の時間間隔で撮影して撮影画像を出力する撮影手段である。以下、撮影部２が撮影する部分を対象空間と称する。

例えば、撮影部２は、イベント会場に設置されたポールに対象空間を俯瞰する視野を有して設置される。その視野は固定されていてもよいし、通信部３を介した外部からの指示に従って変更されてもよい。また、例えば、撮影部２は対象空間をフレーム周期１／５秒で撮影してカラー画像を生成する。カラー画像の代わりにモノクロ画像を生成してもよい。

通信部３は、通信回路であり、その一端が画像処理部５に接続され、他端が同軸ケーブルまたはＬＡＮ（Local Area Network）、インターネットなどの通信網を介して撮影部２および表示制御部７と接続される。通信部３は、撮影部２から撮影画像を取得して画像処理部５に入力し、画像処理部５から入力された情報を表示制御部７に出力する。

記憶部４は、ＲＯＭ（Read Only Memory）、ＲＡＭ（Random Access Memory）等のメモリ装置であり、各種プログラムや各種データを記憶する。記憶部４は、画像処理部５と接続されて画像処理部５との間でこれらの情報を入出力する。

画像処理部５は、ＣＰＵ（Central Processing Unit）、ＤＳＰ（Digital Signal Processor）、ＭＣＵ（Micro Control Unit）等の演算装置で構成される。画像処理部５は、記憶部４と接続され、記憶部４からプログラムを読み出して実行することにより各種処理手段・制御手段として動作し、各種データを記憶部４に記憶させ、また記憶部４から読み出す。また、画像処理部５は、通信部３を介して撮影部２および表示制御部７とも接続され、通信部３経由で撮影部２から取得した撮影画像を解析することにより、撮影されている人の分布を推定し、推定結果を記した分布画像等の分布情報を通信部３経由で表示制御部７に出力する。

操作部６は表示制御部７に対する入力機器であり、キーボード及びマウス等で構成される。操作部６は表示制御部７に接続され、監視員による指示操作を受け付け、当該指示操作を表示制御部７に出力する。

表示制御部７はＰＣ（Personal Computer）等で構成され、ＲＯＭ、ＲＡＭ等のメモリ装置等で構成される記憶部（不図示）、通信部３が接続されている通信網とのインターフェース回路である通信部（不図示）、および、ＣＰＵ、ＭＣＵ、ＩＣ等の演算装置等で構成される制御部（不図示）を備える。表示制御部７は通信網を介して通信部３に接続されるとともに、操作部６および表示部８と接続される。表示制御部７は画像処理部５からの情報を通信部３から受信して記憶するとともに、監視員による操作指示を操作部６から入力され、記憶した情報のうち操作指示に応じた情報を表示部８に出力する。

表示部８は、液晶ディスプレイまたはＣＲＴ（Cathode Ray Tube）ディスプレイ等のディスプレイ装置であり、通信部３および表示制御部７を介して画像処理部５と接続され、画像処理部５により生成された情報を表示する表示手段である。監視員は表示された情報を視認して混雑の発生等を判断し、必要に応じて人員配置の変更等の対処を行う。

なお、本実施形態においては、撮影部２と画像処理部５の個数が１対１である物体分布推定装置１を例示するが、別の実施形態においては、撮影部２と画像処理部５の個数を多対１或いは多対多とすることもできる。

［物体分布推定装置１の機能］
図２および図３は物体分布推定装置１の機能を示す機能ブロック図である。そのうち、図２は撮影画像を基にした分布推定処理を行うときの機能ブロック図である。また、図３は分布推定処理に先立って手法マップ作成処理を行うときの機能ブロック図である。

（分布推定処理）
物体分布推定装置１の機能のうち、まず、分布推定処理に関して説明する。分布推定処理を行うとき（図２）、通信部３は画像取得手段３０および分布情報出力手段３１等として機能し、記憶部４は密度推定器記憶手段４０、単体識別器記憶手段４１、手法マップ記憶手段４２、物体モデル記憶手段４３（図２においては不図示）およびカメラパラメータ記憶手段４４（図２においては不図示）等として機能し、画像処理部５は密度推定手段５０、単体識別手段５１、分布推定手段５２等として機能する。

これらのうちの密度推定手段５０および単体識別手段５１のそれぞれは、撮影されている物体の数が異なる複数種類の学習画像それぞれの特徴を予め学習した認識器を用い、撮影画像内の任意の位置に撮影された物体の数を認識する認識手段であり、密度推定手段５０と単体識別手段５１とは、認識可能な物体の数の範囲が互いに異なる複数の認識器を用いて物体数の当該範囲ごとに設けられた複数の認識手段をなす。例えば、密度推定手段５０は、０人／ｍ^２の密度、０人／ｍ^２より高く２人／ｍ^２以下の密度、２人／ｍ^２より高く４人／ｍ^２以下の密度および４人／ｍ^２より高い密度の学習画像を用いて学習した認識器を用い、撮影画像内の任意の位置に設定される領域を窓として、窓内が０人／ｍ^２の密度、０人／ｍ^２より高く２人／ｍ^２以下の密度、２人／ｍ^２より高く４人／ｍ^２以下の密度および４人／ｍ^２より高い密度のいずれであるかを認識する。また例えば、単体識別手段５１は０人および１人の学習画像を用いて学習した認識器を用い、窓内が０人および１人のいずれであるかを認識する。つまり、密度推定手段５０は物体の数として窓内の物体の密度を認識し、またその範囲の下限は０人／ｍ^２である一方、上は４人／ｍ^２を超える値にまで及ぶ。これに対し、単体識別手段５１が窓内にて認識可能な物体の数の範囲は０および１である。

画像取得手段３０は、撮影手段である撮影部２から撮影画像を順次取得して、取得した撮影画像を密度推定手段５０および単体識別手段５１に順次出力する。

密度推定器記憶手段４０は、所定の密度ごとに当該密度にて物体（人）が存在する空間を撮影した密度画像それぞれの画像特徴を学習した推定密度算出関数であって、画像の特徴量を入力されると当該画像に撮影されている物体の密度の推定値（推定密度）を算出し、算出した推定密度を出力する推定器（密度推定器）の情報を予め記憶している。つまり上記推定密度算出関数の係数等のパラメータを密度推定器の情報として予め記憶している。

密度推定手段５０は、画像取得手段３０から入力された撮影画像の各所から密度推定用の特徴量（推定用特徴量）を抽出するとともに密度推定器記憶手段４０から密度推定器を読み出して、抽出した推定用特徴量のそれぞれを密度推定器に入力することによって推定密度の分布（密度分布）を推定し、推定した密度分布を分布推定手段５２に出力する。好適には密度推定手段５０はさらに密度分布を単体識別手段５１にも出力する。

密度推定の処理と密度推定器について具体的に説明する。

密度推定手段５０は、撮影画像の各画素の位置に窓（推定用抽出窓）を設定し、各推定用抽出窓における撮影画像から推定用特徴量を抽出する。推定用特徴量はＧＬＣＭ（Gray Level Co-occurrence Matrix）特徴である。

各推定用抽出窓に撮影されている対象空間内の領域は同一サイズであることが望ましい。そこで、好適には密度推定手段５０はこの点に配慮した処理を行う。当該処理に際し、密度推定手段５０はカメラパラメータ記憶手段４４（図２においては不図示）を利用する。

カメラパラメータ記憶手段４４は、撮影部２のカメラパラメータを記憶している。カメラパラメータは、実空間における撮影部２の設置位置および撮影方向といった外部パラメータ、撮影部２の焦点距離、画角、レンズ歪みその他のレンズ特性や、撮像素子の画素数といった内部パラメータを含む情報である。

密度推定手段５０はカメラパラメータ記憶手段４４から撮影部２のカメラパラメータを読み出し、カメラパラメータを用いたホモグラフィ変換により撮影画像の任意の画素に撮影されている対象空間内の領域が同一サイズとなるように撮影画像を変形してから推定用特徴量を抽出する。

密度推定器は多クラスの画像を識別する識別器で実現することができ、多クラスＳＶＭ（Support Vector Machine）法で学習した識別関数とすることができる。

密度は、例えば、人が存在しない「背景」クラス、０人／ｍ^２より高く２人／ｍ^２以下である「低密度」クラス、２人／ｍ^２より高く４人／ｍ^２以下である「中密度」クラス、４人／ｍ^２より高い「高密度」クラスの４クラスと定義することができる。

推定密度は各クラスに予め付与された値であり、分布推定の結果として出力される値である。本実施形態では各クラスに対応する値を「背景」、「低密度」、「中密度」、「高密度」と表記する。

すなわち、密度推定器は「背景」クラス、「低密度」クラス、「中密度」クラス、「高密度」クラスのそれぞれに帰属する多数の密度画像の特徴量に多クラスＳＶＭ法を適用して学習した、各クラスの画像を他のクラスと識別するための識別関数である。この学習により導出された識別関数のパラメータが密度推定器として記憶されている。なお、密度画像の特徴量は、推定用特徴量と同種であり、ＧＬＣＭ特徴である。

密度推定手段５０は、各画素に対応して抽出した推定用特徴量のそれぞれを密度推定器に入力することによってその出力値である推定密度を取得する。なお、撮影画像を変形させて推定用特徴量を抽出した場合、密度推定手段５０は、カメラパラメータを用いたホモグラフィ変換により密度分布を元の撮影画像の形状に変形させる。

こうして得られた、撮影画像の画素ごとの推定密度の集まりが密度分布である。

密度推定手段５０が出力する密度分布から撮影画像の各所における人の粗密状況が分かるが、密度分布から個々の人の位置までは分からない。これに対し、単体識別手段５１は、撮影画像の各位置における人の有無を識別することでより詳細な情報（人の位置）を得る手段である。

単体識別器記憶手段４１は、単独の人（物体）の画像特徴を学習した識別器（単体識別器）の情報を記憶している。

図４は、予め単体識別器記憶手段４１が記憶している単体識別器の情報を模式的に表した図である。

単体識別器は、画像の特徴量を入力されると当該画像が単独の人が撮影されている画像（単体画像）であることの尤もらしさを表す評価値（識別スコア）を算出して出力する評価値算出関数の係数、および識別スコアに対して適用する閾値等のパラメータで表される。

単体識別器は多数の単体画像とそれぞれが人以外しか写っていない多数の無人画像とからなる学習用画像の特徴量に線形ＳＶＭ法を適用して学習した識別器とすることができる。

学習アルゴリズムとして線形ＳＶＭを用いた場合、評価値算出関数の係数は重みベクトルである。この重みベクトルは、特徴量の各要素に対する重みであり、入力された画像の特徴量と重みベクトルとの内積の値が識別スコアを表す。学習において、当該重みベクトルと特徴量との内積が０より大きい場合は人、０以下の場合は人以外と識別されるように調整される。よって、入力された画像が単体画像であるか否かを識別する閾値は原理上は０であり、通常、閾値は０に設定することができる。ただし、単体画像を単体画像でないと識別する誤りを減じるために、閾値を０よりも小さな値に設定してもよい。

なお、学習用画像の特徴量はＨＯＧ（Histograms of Oriented Gradients）特徴量である。

単体識別器記憶手段４１が記憶している単体識別器は、密度が高いほど単独の物体を構成する部分のうちの少ない部分の画像特徴を学習した識別器となっている。単体識別器記憶手段４１は、低密度クラスを表す値と対応付けて単独の人の全身の画像特徴を学習した単体識別器である全身識別器１００、中密度クラスを表す値と対応付けて単独の人の上部２／３の画像特徴を学習した単体識別器である上半身識別器１０１、高密度クラスを表す値と対応付けて単独の人の上部１／３の画像特徴を学習した単体識別器である頭部近傍識別器１０２を記憶している。

全身識別器１００は単独の人の全身が撮影された単体画像を用いて学習した単体識別器であり、上半身識別器１０１は単独の人の上部２／３が撮影された単体画像（人の全身が撮影された単体画像の上部２／３を切り出した画像など）を用いて学習した単体識別器であり、頭部近傍識別器１０２は単独の人の上部１／３が撮影された単体画像（人の全身が撮影された単体画像の上部１／３を切り出した画像など）を用いて学習した単体識別器である。

単体識別手段５１は、画像取得手段３０から入力された撮影画像の各位置から単体識別用の特徴量（識別用特徴量）を抽出するとともに単体識別器記憶手段４１から単体識別器を読み出して、抽出した識別用特徴量のそれぞれを単体識別器に入力することによって物体の有無を識別し、各位置における物体の有無を分布推定手段５２に出力する。

具体的には単体識別手段５１は、まず、撮影画像内に所定間隔にて複数の候補位置を設定する。所定間隔は１画素であり、単体識別手段５１は撮影画像の各画素の位置を順次候補位置に設定する。なお候補位置は人の頭部重心を表すものとする。

また、単体識別手段５１は、各候補位置に単独の人の上部１／３の形状に定められた窓を設定するとともに密度推定手段５０から入力された密度分布を参照し、当該窓内の推定密度を集計する。そして、単体識別手段５１は、各候補位置における最多の推定密度を当該候補位置の密度と決定する。

また、単体識別手段５１は、各候補位置に当該候補位置の密度に応じた識別用抽出窓を設定し、識別用抽出窓内の撮影画像から識別用特徴量を抽出する。識別用抽出窓は、各密度に応じた単体識別器の学習に用いた単体画像の形状を有し、予め定めた複数の倍率で拡大・縮小した大きさの窓である。すなわち、識別用抽出窓は、候補位置の密度が低密度であれば単独の人の全身の形状に定められた窓であり、中密度であれば単独の人の上部２／３の形状に定められた窓であり、高密度であれば単独の人の上部１／３の形状に定められた窓である。

また、単体識別手段５１は、候補位置ごとに当該候補位置の密度に応じた単体識別器を単体識別器記憶手段４１から読み出す。すなわち、単体識別手段５１は、候補位置の密度が低密度であれば全身識別器を読み出し、中密度であれば上半身識別器を読み出し、高密度であれば頭部近傍識別器を読み出す。そして、単体識別手段５１は、各候補位置について、読み出した単体識別器に当該候補位置から抽出した識別用特徴量を入力し、その出力値である識別スコアを当該候補位置の評価値として取得する。

そして、単体識別手段５１は、候補位置ごとの密度、評価値を参照し、予め定めた基準を満たす評価値が算出された候補位置を物体が存在する位置、それ以外の候補位置を物体が存在しない位置と決定する。

具体的には、単体識別手段５１は、識別スコアがそれに対応する閾値以上である候補位置を抽出し、抽出した候補位置のうち対応する密度が同一であり且つ互いに近接する複数の候補位置を一つにまとめ、まとめた候補位置を人が存在する位置と決定する。

この候補位置をまとめる処理は、実際に人が撮影されている位置に加えてその近傍においても同一人物に対して高い識別スコアが算出されることに対処するために行う。具体的には、例えば、単体識別手段５１は、密度ごとに、閾値以上の識別スコアが算出された候補位置を識別スコアが高い順に順次、注目位置に設定するとともに注目位置より識別スコアが低い候補位置を比較位置に設定する。そして、単体識別手段５１は、比較位置のうち当該比較位置に設定された識別用抽出窓と注目位置に設定された識別用抽出窓との重なりが予め定めた割合より大きい比較位置の情報を削除することで複数の候補位置を一つにまとめる。

そして、単体識別手段５１は、候補位置ごとの物体有無の情報を分布推定手段５２に出力する。

手法マップ記憶手段４２は、撮影画像内の位置と、複数の認識手段のうちの、当該位置に窓が設定された場合に当該窓内に撮影されている物体の数を予め定めた下限値以上の精度で認識可能な精度保証認識手段とを関連付けた手法マップを記憶する。

図５は、撮影画像およびこれに対応する手法マップの一例を示す模式図であり、図５（ａ）が撮影画像２００を示し、図５（ｂ）が撮影画像２００に対応する手法マップ２５０を表形式で示している。密度推定手段５０および単体識別手段５１のそれぞれについては、様々な解像度のテスト画像を用いた事前の実験によって、下限値以上の精度で認識できる人の像の解像度の限界（限界解像度）が判明している。また、密度推定手段５０および単体識別手段５１には、それぞれを識別する符号（認識手段ＩＤ）として“Ａ”および“Ｂ”が予め付与されている。

図５の例において、撮影画像２００中の領域２０１は、撮影部２から遠方に存在する人が撮影され得る領域である。領域２０１内の任意の位置に推定用抽出窓を設定した場合、推定用抽出窓内の人の像の解像度は密度推定手段５０の限界解像度を下回らないため、密度推定手段５０による密度推定結果が下限値以上の精度で得られる。また、領域２０１内の任意の位置に識別用抽出窓を設定した場合、識別用抽出窓内の人の像の解像度は単体識別手段５１の限界解像度を下回り、単体識別手段５１による識別結果が下限値以上の精度で得られない。

以上のことに対応して、手法マップ２５０には、領域２０１内の画素群の座標［…，（Ｘ_２，Ｙ_２），…］と対応付けて密度推定手段５０に付与された符号Ａが記憶されている。

また、図５の例において、撮影画像２００中の領域２０２は、撮影部２の近傍に存在する人が撮影され得る領域である。領域２０２内の任意の位置に推定用抽出窓を設定した場合、推定用抽出窓内の人の像の解像度は密度推定手段５０の限界解像度を下回らないため、密度推定手段５０による密度推定結果が下限値以上の精度で得られる。また、領域２０２内の任意の位置に識別用抽出窓を設定した場合、識別用抽出窓内の人の像の解像度は単体識別手段５１の限界解像度を下回らないため、単体識別手段５１による識別結果が下限値以上の精度で得られる。

以上のことに対応して、手法マップ２５０には、領域２０２内の画素群の座標［…，（Ｘ_３，Ｙ_３），…］と対応付けて密度推定手段５０に付与された符号Ａと単体識別手段５１に付与された符号Ｂとが記憶されている。

分布推定手段５２は、複数の認識手段が認識した位置ごとの物体の数のうち、手法マップ記憶手段４２に当該位置と関連付けて記憶されている精度保証認識手段が認識した数から対象空間における物体の分布情報を生成し、生成した分布情報を分布情報出力手段３１に出力する。

具体的には、分布推定手段５２は、密度推定手段５０から入力された位置ごとの物体の密度の情報、単体識別手段５１から入力された位置ごとの物体の有無の情報、および手法マップ記憶手段４２に記憶されている手法マップを参照し、精度保証認識手段が認識した数に基づいて分布画像を生成する。

例えば、分布推定手段５２は、手法マップにおいて符号Ａおよび符号Ｂと対応付けられており且つ物体が存在すると認識された画素位置に、当該位置の推定密度に応じた色で着色した物体モデルを投影し、また、手法マップにおいて密度推定手段５０を表す符号Ａのみと対応付けられている位置の画素の値に、推定密度と対応する色をセットして分布画像を生成する。色は、例えば、推定密度が高密度であれば赤、中密度であれば黄、低密度であれば緑などとすることができる。

この分布画像の生成に際し、分布推定手段５２は物体モデル記憶手段４３に記憶されている物体モデルを利用する。物体モデル記憶手段４３は、予め物体の形状を近似した物体モデルを記憶している。物体モデルは、立位の人の頭部、胴部、脚部に対応する３つの回転楕円体から構成される立体モデルである。ちなみに、頭部重心を人の代表位置とする。なお、立体モデルはより単純化して人全体を１つの回転楕円体で表すものとすることもできるし、より詳細に例えば、人の頭部、胴部、両腕、両脚を別々の回転楕円体で表すものとすることもできる。

物体モデルの投影は、物体モデル記憶手段４３から読み出した物体モデルと、カメラパラメータ記憶手段４４から読み出したカメラパラメータとを用いて、後述する手法マップ生成処理の投影手段５３と基本的に同様にして行われる。

図６は図５の撮影画像２００に対応する分布画像の一例を示す模式図である。図５の領域２０２は上述したように符号Ａおよび符号Ｂが対応付けられており、当該領域に対応して図６には、物体が存在すると認識された画素位置に頭部重心を置いた物体モデルの投影像２１０〜２１２が当該画素位置の推定密度に応じた色で描かれる。ここで、各投影像のハッチングは推定密度に応じた色を表しており、投影像２１０の網掛けは推定密度が高密度であることに対応する色（上述の例では赤色）を表しており、同様に、投影像２１１の横線ハッチングおよび投影像２１２の斜線ハッチングは中密度、低密度に対応する色（上述の例ではそれぞれ黄色、緑色）を表している。

図５の領域２０１は上述したように符号Ａのみが対応付けられており、当該領域に対応する図６の領域２２０の各画素は推定密度に応じた色で表示される。具体的には、領域２２０内の部分領域２２１〜２２３のハッチングは上述の投影像２１０〜２１２と共通の色を表しており、部分領域２２１は高密度、部分領域２２２は中密度、部分領域２２３は低密度と推定された領域である。

なお、分布推定手段５２は、撮影画像に上記分布画像を透過合成することによって分布画像を生成してもよい。或いは、分布推定手段５２は、対象空間の地形や建造物を模した立体モデルの投影像に上記分布画像を透過合成することによって分布画像を生成してもよい。

分布情報出力手段３１は、分布推定手段５２から入力された分布情報を、表示制御部７経由で表示部８に伝送し、表示させる。

（手法マップ作成処理）
続いて、物体分布推定装置１の機能のうち手法マップ作成処理に関して説明する。手法マップ作成処理を行うとき（図３）、記憶部４は手法マップ記憶手段４２、物体モデル記憶手段４３、カメラパラメータ記憶手段４４、および限界値記憶手段４５等として機能し、画像処理部５は投影手段５３および適用手法選択手段５４等として機能する。なお、手法マップを作成するタイミングは、手法マップが未だ記憶されていないとき、視野変更が行われたとき、または推定希望領域が変更されたときである。推定希望領域は、撮影画像内において監視員が物体分布推定装置１に物体の分布を推定させたいと希望する領域である。監視員が操作部６を用いて推定希望領域を入力すると、当該領域の情報が表示制御部７および通信部３を介して画像処理部５に入力される。

投影手段５３は、操作部６を用いて入力された推定希望領域を参照するとともに、物体モデル記憶手段４３から物体モデル、カメラパラメータ記憶手段４４からカメラパラメータをそれぞれ読み出し、推定希望領域内の各画素位置に物体モデルを投影して投影像を生成し、生成した画素位置ごとの投影像を適用手法選択手段５４に出力する。

例えば、投影手段５３は、カメラパラメータを用いて、対象空間を模した仮想空間の高さ１６０ｃｍの水平面において推定希望領域内の各画素位置と対応する３次元位置を導出する。上記の高さ１６０ｃｍは、上述したように頭部重心を人の代表位置としていることに対応して、対象空間において平均的な人の頭部の高さとして予め定めた数値である。そして、投影手段５３は、導出した３次元位置を基準にして仮想空間に物体モデルを配置し、カメラパラメータを用いて、配置した物体モデルを撮影部２の撮影面に投影する。

適用手法選択手段５４は、推定希望領域内の各画素位置について、当該画素位置における物体の像の解像度を各認識手段の限界解像度と比較し、物体像の解像度が限界解像度以上である認識手段を精度保証認識手段として選択する。つまり、適用手法選択手段５４は、投影手段５３から入力された画素位置ごとの投影像の解像度と、限界値記憶手段４５に記憶されている複数の認識手段それぞれの限界解像度とを参照して、推定希望領域内の各画素位置における精度保証認識手段を選択して、画素位置と精度保証認識手段との対応関係を手法マップ記憶手段４２に記憶させる。

具体的には、解像度は物体の像の画素数によって表すことができる。つまり、物体の像に対応する画素数が多いほど、その像は高解像度である。

この場合、限界解像度に対応する画素数を限界画素数として定義し、限界値記憶手段４５には、限界解像度として当該限界画素数を記憶させることができる。また、適用手法選択手段５４は、推定希望領域内の各画素位置について、当該画素位置の投影像の画素数を計数する。画素数の計数値が当該画素位置における物体の像の解像度となり、適用手法選択手段５４は、当該計数値を各認識手段の限界画素数と比較し、計数値が限界画素数以上である認識手段を精度保証認識手段として選択する。

図７は図５の撮影画像２００に対応する手法マップの一例を示す模式図である。この例では、一点鎖線で囲む推定希望領域３００に対して手法マップが作成される。投影手段５３は、推定希望領域３００内の画素群の位置［…，（ｘ_１，ｙ_１），…，（ｘ_２，ｙ_２），…，（ｘ_３，ｙ_３），…］に物体モデルを投影して投影像群［…，投影像３１０，…，投影像３２０，…，投影像３３０，…］を生成する。これら各投影像に対応して適用手法選択手段５４は、各投影像の解像度［…，ｒ_１，…，ｒ_２，…，ｒ_３，…］を導出する。限界値記憶手段４５には、密度推定手段５０に付与された符号Ａと対応付けてその限界解像度Ｒ_Ａ、単体識別手段５１に付与された符号Ｂと対応付けてその限界解像度Ｒ_Ｂが記憶されている。本例では、画素位置（ｘ_１，ｙ_１）の投影像３１０の解像度ｒ_１についてｒ_１＜Ｒ_Ａ、ｒ_１＜Ｒ_Ｂであり、画素位置（ｘ_２，ｙ_２）の投影像３２０の解像度ｒ_２についてｒ_２＞Ｒ_Ａ、ｒ_２＜Ｒ_Ｂであり、画素位置（ｘ_３，ｙ_３）の投影像３３０の解像度ｒ_３についてｒ_３＞Ｒ_Ａ、ｒ_２＞Ｒ_Ｂであるとする。適用手法選択手段５４は、解像度［…，ｒ_１，…，ｒ_２，…，ｒ_３，…］をＲ_ＡおよびＲ_Ｂのそれぞれと比較し、［…，（ｘ_１，ｙ_１）の精度保証認識手段は無し，…，（ｘ_２，ｙ_２）の精度保証認識手段は密度推定手段５０，…，（ｘ_３，ｙ_３）の精度保証認識手段は密度推定手段５０および単体識別手段５１，…］と判定する。つまり、適用手法選択手段５４は、推定希望領域３００において画素位置（ｘ_１，ｙ_１）を含む領域３１１内の各画素位置については精度保証認識手段は無いと判定する一方、画素位置（ｘ_２，ｙ_２）を含む領域３２１内の各画素位置については符合Ａとの関連付けを手法マップ記憶手段４２に記憶させ、また、画素位置（ｘ_３，ｙ_３）を含む領域３３１内の各画素位置については符合Ａおよび符号Ｂとの関連付けを手法マップ記憶手段４２に記憶させる。

［物体分布推定装置１の動作］
図８、図９および図１０のフロー図を参照して物体分布推定装置１の動作を説明する。

図８は物体分布推定装置１の動作の概略のフロー図である。物体分布推定装置１が動作を開始すると、イベント会場に設置されている撮影部２は所定時間おきに監視空間を撮影して撮影画像を画像処理部５が設置されている画像解析センター宛に順次送信する。そして、画像処理部５は基本的に撮影画像を受信するたびに図８のフロー図に従い、ステップＳ５〜Ｓ１０の分布推定処理に関する動作を繰り返す。但し、手法マップを作成する必要がある場合は、ステップＳ５〜Ｓ１０の分布推定処理に先行してステップＳ１〜Ｓ４の手法マップ作成処理を行う。

すなわち、操作部６から画像処理部５に推定希望領域の変更指示が入力された場合（ステップＳ１にて「ＹＥＳ」の場合）、画像処理部５は手法マップ作成処理（ステップＳ４）を行う。また、物体分布推定装置１の動作開始時のように手法マップがない場合、または撮影部２の視野が変更された場合は（ステップＳ２にて「ＹＥＳ」の場合）、画像処理部５は例えば、表示部８に推定希望領域の入力を求める表示を行って、操作部６からの推定希望領域の入力を待ち（ステップＳ３にて「ＮＯ」の場合）、推定希望領域が入力されると（ステップＳ３にて「ＹＥＳ」の場合）、手法マップ作成処理Ｓ４を行う。そして、これらの場合、画像処理部５は、手法マップ作成処理Ｓ４の後に、ステップＳ５〜Ｓ１０の分布推定処理を行う。

一方、推定希望領域の変更がなく、且つ手法マップが既に存在し、且つ視野変更が生じていない場合は（ステップＳ１およびＳ２にて「ＮＯ」の場合）、画像処理部５は手法マップ作成処理Ｓ４を省略してステップＳ５〜Ｓ１０の分布推定処理を行う。

図９は手法マップ作成処理Ｓ４の概略のフロー図であり、図９を参照しつつ、手法マップ作成処理Ｓ４を説明する。

画像処理部５はステップＳ１またはＳ３にて推定希望領域が指定されると、投影手段５３として動作し、推定希望領域内の各画素を順次、注目位置に設定し（ステップＳ４０）、物体モデル記憶手段４３から読み出した物体モデルを、カメラパラメータ記憶手段４４から読み出したカメラパラメータに基づいて撮影部２の撮影面に投影する（ステップＳ４１）。次に画像処理部５は適用手法選択手段５４として動作し、適用手法選択手段５４は、投影手段５３により生成された物体の投影像の解像度を算出する（ステップＳ４２）。

適用手法選択手段５４は、注目位置における物体数を認識する複数の認識手段それぞれについて、当該位置における物体の投影像の解像度と、当該認識手段の限界解像度とを比較して精度保証認識手段か否かを判断し、精度保証認識手段であれば手法マップに記憶させる。具体的には、本実施形態では認識手段は密度推定器および単体識別器それぞれを用いた２種類であり、それぞれを上述した認識手段ＩＤである符号ＡおよびＢで識別する。

適用手法選択手段５４は、限界値記憶手段４５から、符号Ａと対応付けて記憶されている単体識別器の限界解像度を読み出し、投影像の解像度と当該限界解像度とを比較する。そして、投影像の解像度が限界解像度以上であれば（ステップＳ４３にて「ＹＥＳ」の場合）、単体識別器を注目位置の精度保証認識手段として手法マップ記憶手段４２に記憶させる（ステップＳ４４）。一方、投影像の解像度が限界解像度未満であれば（ステップＳ４３にて「ＮＯ」の場合）、単体識別器は注目位置の精度保証認識手段とはされずステップＳ４４は省略される。

ステップＳ４３，Ｓ４４での単体識別器についての精度保証認識手段の判定に続いて、ステップＳ４５，Ｓ４６にて密度推定器についての精度保証認識手段の判定を同様に行う。つまり、適用手法選択手段５４は、限界値記憶手段４５から、符号Ｂと対応付けて記憶されている密度推定器の限界解像度を読み出して、投影像の解像度と比較し、投影像の解像度が限界解像度以上であれば（ステップＳ４５にて「ＹＥＳ」の場合）、密度推定器を注目位置の精度保証認識手段として手法マップ記憶手段４２に記憶させ（ステップＳ４６）、一方、投影像の解像度が限界解像度未満であれば（ステップＳ４５にて「ＮＯ」の場合）、密度推定器は注目位置の精度保証認識手段とはされずステップＳ４６は省略される。

画像処理部５は推定希望領域内の全画素についてステップＳ４０〜Ｓ４６の処理を繰り返し（ステップＳ４７にて「ＮＯ」の場合）、全画素について完了すると（ステップＳ４７にて「ＹＥＳ」の場合）、図８のステップＳ５に処理を進める。

ステップＳ５では、通信部３が画像取得手段３０として動作し、撮影部２からの撮影画像の受信待ち状態となる。撮影画像を取得した画像取得手段３０は当該撮影画像を画像処理部５に出力する。

撮影画像を入力された画像処理部５は密度推定手段５０として動作し、撮影画像から密度分布を推定する（ステップＳ６）。具体的には、密度推定手段５０は、撮影画像における推定希望領域内の各画素を注目位置として、注目位置の推定用特徴量を抽出するとともに記憶部４の密度推定器記憶手段４０から密度推定器を読み出し、推定用特徴量を密度推定器に入力して注目位置における推定密度を取得する。

また、画像処理部５は単体識別手段５１として動作し、撮影画像から物体有無を識別する（ステップＳ７）。具体的には、単体識別手段５１は、撮影画像における推定希望領域内の各画素を注目位置として、注目位置の識別用特徴量を抽出するとともに、全身識別器１００、上半身識別器１０１および頭部近傍識別器１０２のうち、ステップＳ６で得られた注目位置の推定密度に対応する単体識別器を単体識別器記憶手段４１から読み出し、当該単体識別器に識別用特徴量を入力して物体有無を識別する。

推定希望領域内の各画素について、ステップＳ６で得られた推定密度およびステップＳ７で得られた物体有無は分布推定手段５２に入力される。

分布推定手段５２は手法マップ記憶手段４２に記憶された手法マップを読み出し（ステップＳ８）、当該手法マップと、入力された推定密度および物体有無とから分布画像を生成する（ステップＳ９）。

図１０は分布画像生成処理Ｓ９の概略のフロー図であり、図１０を参照しつつ、分布画像生成処理Ｓ９を説明する。分布推定手段５２は推定希望領域の各画素を遠方画素から順次、注目位置に設定する（ステップＳ９０）。そして、ステップＳ８にて読み出した手法マップを参照し、注目位置について単体識別手段が精度保証されているかを調べる（ステップＳ９１）。

単体識別手段が精度保証認識手段である場合（ステップＳ９１にて「ＹＥＳ」の場合）、分布推定手段５２は、注目位置についてステップＳ７の識別結果が物体有りであるならば（ステップＳ９２にて「ＹＥＳ」の場合）、注目位置における物体モデルの投影像を描画する（ステップＳ９３）。ここで、図５を用いて説明した本実施形態の分布マップの例では、単体識別手段が精度保証認識手段である画素位置では、密度推定手段も精度保証認識手段である。そこで、ステップＳ９３では描画する投影像を図６を用いて説明したように、ステップＳ６の推定密度に応じた色で描く。一方、ステップＳ７の識別結果が物体無しの場合は（ステップＳ９２にて「ＮＯ」の場合）、ステップＳ９３は省略される。

単体識別手段が精度保証されていない場合は（ステップＳ９１にて「ＮＯ」の場合）、分布推定手段５２は手法マップを参照し、注目位置について密度推定手段が精度保証されているかを調べる（ステップＳ９４）。

密度推定手段が精度保証認識手段である場合（ステップＳ９４にて「ＹＥＳ」の場合）、分布推定手段５２は、分布画像における注目位置の画素にステップＳ６の推定密度に応じた色を付与する（ステップＳ９５）。一方、密度推定手段が精度保証されていない場合は（ステップＳ９４にて「ＮＯ」の場合）、ステップＳ９５は省略される。

分布推定手段５２は推定希望領域内の全画素についてステップＳ９０〜Ｓ９５の処理を繰り返し（ステップＳ９６にて「ＮＯ」の場合）、全画素について完了すると（ステップＳ９６にて「ＹＥＳ」の場合）、図８のステップＳ１０に処理を進める。

なお、ステップＳ９０にて注目位置を遠方画素から順に設定することで、分布画像における隠面消去が塗り重ね法で行われる。

ステップＳ１０では、通信部３が分布情報出力手段３１として動作し、分布推定手段５２で生成された分布画像を表示制御部７へ出力し、表示制御部７は分布画像を表示部８に表示させる。

［変形例］
（１）上記実施形態においては、物体の像を構成する画素数を当該物体像の解像度と定義したが、物体の像の外接矩形の大きさ（すなわち画素数あるいは面積）、物体の像の高さを基準とする一定のアスペクト比の矩形の大きさ、または、物体の像の幅を基準とする一定のアスペクト比の矩形の大きさを解像度と定義しても等価である。このように定義することでテスト画像の解像度の導出が容易となる。

（２）上記実施形態およびその変形例においては、画素数または面積を物体像の解像度と定義したが、撮影部２およびその撮影倍率が決まっている場合は撮影部２から物体までの距離と解像度との関係が一意に定まるため、当該距離によって解像度を推定することができる。つまり、物体像の解像度を表す値として撮影部２から物体までの距離を用いることができる。

この場合、限界値記憶手段４５には限界解像度に対応する距離（限界距離）が記憶される。投影手段５３は推定希望領域内の各画素位置と対応する３次元位置を導出して撮影部２から当該３次元位置までの距離を算出し、適用手法選択手段５４は投影手段５３が算出した距離と限界距離とを比較して精度保証認識手段を選択する。つまり、適用手法選択手段５４は、撮影画像内の位置に対して、複数の認識手段のうち、当該位置に撮影される物体についての距離が限界距離以下となるものを精度保証認識手段として選択する。そして、手法マップ記憶手段４２は撮影画像内の位置と精度保証認識手段とを関連付けて記憶する。

例えば、投影手段５３は撮影画像における位置を対象空間における物体に応じた高さの水平面に逆投影して物体仮想位置を求め、適用手法選択手段５４は、撮影画像内の位置に対して、当該位置に対応する物体仮想位置と撮影部２との距離と、複数の認識手段それぞれの限界距離とを比較して、当該位置に関連付ける精度保証認識手段を選出する。

（３）上記実施形態およびその変形例においては、分布推定手段５２は、分布情報として分布画像を生成したが、分布情報は画像表現に限らない。例えば、分布推定手段５２は、分布マップにて単体識別手段５１が精度保証認識手段として対応付けられている画素のうち、撮影画像にて単体識別手段５１が物体の存在を認識した画素の位置を撮影部２のカメラパラメータにより対象空間に逆投影して、個々の物体が存在する３次元位置の情報を算出する。また、分布推定手段５２は、分布マップにて密度推定手段５０が精度保証認識手段として対応付けられている画素については、撮影画像の密度推定した画素を同一推定密度ごとの領域にまとめ、各領域を撮影部２のカメラパラメータにより対象空間に逆投影して各密度の３次元領域の情報を算出する。このようにして分布推定手段５２は３次元の分布情報を生成してもよい。また、この場合、密度推定手段５０および単体識別手段５１の両方が対応付けられている位置に関しては、より詳細である単体識別手段５１の情報のみから分布情報を生成してもよい。

（４）上記実施形態およびその変形例においては、検出対象の物体を人とする例を示したが、これに限らず、検出対象の物体を車両、牛や羊等の動物等とすることもできる。

（５）上記実施形態およびその各変形例においては、多クラスＳＶＭ法にて学習した密度推定器を例示したが、多クラスＳＶＭ法に代えて、決定木型のランダムフォレスト法、多クラスのアダブースト（AdaBoost）法または多クラスロジスティック回帰法などにて学習した密度推定器など種々の密度推定器とすることができる。

或いは識別型のＣＮＮ（Convolutional Neural Network）を用いた密度推定器とすることもできる。

（６）上記実施形態およびその各変形例においては、密度推定器が推定する背景以外の密度のクラスを３クラスとしたが、より細かくクラスを分けてもよい。

（７）上記実施形態およびその各変形例においては、多クラスに分類する密度推定器を例示したがこれに代えて、特徴量から密度の値（推定密度）を回帰する回帰型の密度推定器とすることもできる。すなわち、リッジ回帰法、サポートベクターリグレッション法、回帰木型のランダムフォレスト法またはガウス過程回帰（Gaussian Process Regression）などによって、特徴量から推定密度を求めるための回帰関数のパラメータを学習した密度推定器とすることができる。

或いは回帰型のＣＮＮを用いた密度推定器とすることもできる。

（８）上記実施形態およびその各変形例においては、密度推定器が学習する特徴量および推定用特徴量としてＧＬＣＭ特徴を例示したが、これらはＧＬＣＭ特徴に代えて、局所二値パターン（Local Binary Pattern：ＬＢＰ）特徴量、ハールライク（Haar-like）特徴量、ＨＯＧ特徴量、輝度パターンなどの種々の特徴量とすることができ、またはＧＬＣＭ特徴とこれらのうちの複数を組み合わせた特徴量とすることもできる。

（９）上記実施形態およびその各変形例においては、密度推定手段５０および単体識別手段５１が１画素間隔で走査して処理を行う例を示したが、これらの走査を２画素以上の間隔を空けて行うことも可能である。

（１０）上記実施形態およびその各変形例においては、線形ＳＶＭ法により学習された単体識別器を例示したが、線形ＳＶＭ法に代えてアダブースト（AdaBoost）法など、従来知られた各種の学習法を用いて学習した単体識別器とすることもできる。また、識別器の代わりにパターンマッチング器を用いることもでき、その場合の識別スコアは人の学習用画像から抽出した特徴量の平均パターンと入力画像の特徴量との内積などとなり、識別スコア算出関数は当該スコアを出力値とし入力画像の特徴量を入力値とする関数とすることができる。また単体識別器として識別型のＣＮＮを用いても良い。

（１１）上記実施形態およびその各変形例においては、単体識別器が学習する特徴量としてＨＯＧ特徴量を例示したが、これらはＨＯＧ特徴量に代えて、局所二値パターン特徴量、ハールライク特徴量、輝度パターンなどの種々の特徴量とすることができ、またはＨＯＧ特徴量とこれらのうちの複数を組み合わせた特徴量とすることもできる。

１物体分布推定装置、２撮影部、３通信部、４記憶部、５画像処理部、６操作部、７表示制御部、８表示部、３０画像取得手段、３１分布情報出力手段、４０密度推定器記憶手段、４１単体識別器記憶手段、４２手法マップ記憶手段、４３物体モデル記憶手段、４４カメラパラメータ記憶手段、４５限界値記憶手段、５０密度推定手段、５１単体識別手段、５２分布推定手段、５３投影手段、５４適用手法選択手段、１００全身識別器、１０１上半身識別器、１０２頭部近傍識別器、２００撮影画像、２５０手法マップ、３００推定希望領域。

Claims

撮影部により撮影された所定の物体が存在し得る空間の撮影画像を取得する画像取得手段と、
それぞれが、撮影された前記物体の数が異なる複数種類の学習画像それぞれの特徴を予め学習した認識器を用い、前記撮影画像内の任意の位置に撮影された前記物体の数を認識する認識手段であり、認識可能な物体数の範囲が互いに異なる複数の前記認識器を用いて前記物体数の当該範囲ごとに設けられた複数の認識手段と、
前記撮影画像内の位置と、前記複数の認識手段のうち当該位置にて前記物体数を予め定めた下限値以上の精度で認識可能である精度保証認識手段とを関連付けて記憶する記憶手段と、
前記記憶手段に記憶される前記精度保証認識手段により前記撮影画像内にて取得した物体数から、前記空間における前記物体の分布情報を生成する分布推定手段と、
を備えたことを特徴とする物体分布推定装置。
前記認識手段が前記下限値以上の精度で認識可能である前記物体の像に関しての解像度の下限値を当該認識手段の限界解像度と定め、
前記記憶手段は、前記撮影画像内の位置に対して、前記複数の認識手段のうち、当該位置での前記物体の像の前記解像度が前記限界解像度以上となるものを前記精度保証認識手段として関連付けて記憶していること、
を特徴とする請求項１に記載の物体分布推定装置。
前記物体の像の画素数によって前記解像度を表し、前記限界解像度に対応する前記画素数を限界画素数として、
前記空間内に存在する前記物体を模したモデルを前記撮影部の撮影面に投影して投影像を生成する投影手段と、
前記撮影画像内の位置に対して、当該位置に生成される前記投影像の画素数と前記複数の認識手段それぞれの前記限界画素数とを比較して、当該位置に関連付ける前記精度保証認識手段を選出する選出手段と、
をさらに備えたことを特徴とする請求項２に記載の物体分布推定装置。
前記空間における前記撮影部から前記物体までの距離によって前記解像度を推定し、前記限界解像度に対応する前記距離を限界距離として、
前記記憶手段は、前記撮影画像内の位置に対して、前記複数の認識手段のうち、当該位置に撮影される前記物体についての前記距離が前記限界距離以下となるものを前記精度保証認識手段として関連付けて記憶していること、
を特徴とする請求項２に記載の物体分布推定装置。
前記撮影画像における位置を前記空間における前記物体に応じた高さの水平面に逆投影して物体仮想位置を求める投影手段と、
前記撮影画像内の位置に対して、当該位置に対応する前記物体仮想位置と前記撮影部との距離と、前記複数の認識手段それぞれの前記限界距離とを比較して、当該位置に関連付ける前記精度保証認識手段を選出する選出手段と、
をさらに備えたことを特徴とする請求項４に記載の物体分布推定装置。
撮影部により撮影された所定の物体が存在し得る空間の撮影画像を取得する画像取得手段と、
所定の密度ごとに当該密度にて前記物体が存在する空間を撮影した密度画像それぞれの特徴を予め学習した密度推定器を用い、前記撮影画像内の任意の位置に撮影された前記物体の前記密度を認識する密度推定手段と、
単独の前記物体が撮影された単体画像の特徴を予め学習した単体識別器を用い、前記撮影画像内の任意の位置に撮影された前記物体の有無を認識する単体識別手段と、
前記撮影画像内の位置と、前記密度推定手段および前記単体識別手段のうち当該位置にて前記物体の密度または有無を予め定めた下限値以上の精度で認識可能である精度保証認識手段とを関連付けて記憶する記憶手段と、
前記記憶手段に記憶される前記精度保証認識手段により前記撮影画像内にて取得した前記物体の密度または有無から、前記空間における前記物体の分布情報を生成する分布推定手段と、
を備えたことを特徴とする物体分布推定装置。