JP2021009728A

JP2021009728A - 画像処理装置、画像処理方法及びプログラム

Info

Publication number: JP2021009728A
Application number: JP2020173083A
Authority: JP
Inventors: 康夫馬塲; Yasuo Baba
Original assignee: Canon Inc
Current assignee: Canon Inc
Priority date: 2020-10-14
Filing date: 2020-10-14
Publication date: 2021-01-28
Anticipated expiration: 2036-08-03
Also published as: JP6995960B2

Abstract

【課題】複数の人数推定法を組み合わせて、画像中の特定物体の数をより高精度に推定することを目的とする。【解決手段】本発明の画像処理装置は、画像の第１領域に含まれる特定物体の数を、第１推定処理を用いて推定する第１推定手段と、前記画像の第２領域に含まれる特定物体の数を、前記第１推定処理と異なる第２推定処理を用いて推定する第２推定手段と、前記第１推定手段による推定結果と、前記第２推定手段による推定結果とを統合する統合手段と、を有し、前記第１推定処理は、前記画像に含まれる特定物体を検出する検出処理を用いて前記特定物体の数を推定する処理であり、前記第２推定処理は、人数が既知である複数の画像を学習データとした学習により得られた認識モデルを用いて前記特定物体の数を推定する処理であることによって課題を解決する。【選択図】図２

Description

本発明は、画像処理装置、画像処理方法及びプログラムに関する。

近年、撮像装置で所定の領域を撮影して、撮影した画像を解析することによって画像中の人物の数を計測するシステムが提案されている。このようなシステムは、公共の空間での混雑の検知及び混雑時の人の流れを把握することでイベント時の混雑解消や災害時の避難誘導への活用が期待されている。
このような画像中の人物の数を計測する方法としては、人体検出手段によって検出した人物の数を計数する方法（特許文献１）がある。以下、この方法を「検出ベース人数推定法」と呼ぶ。また、機械学習によって得た認識モデルを用いて、画像の所定の領域に映る人数を直接推定する方法（非特許文献１）も提案されている。以下、この方法を「回帰ベース人数推定法」と呼ぶ。

特開２００７−２０１５５６号公報

池田浩雄，大網亮磨，宮野博義．ＣＮＮを用いた群衆パッチ学習に基づく人数推定の高精度化．ＦＩＴ，２０１４

検出ベース人数推定法は、人がまばらに存在し、かつ、所定の大きさ以上で映る場合には、高精度で人数を推定できる。しかしながら、人が高密度で存在し人体の大部分が隠れている場合、又は人体が所定の大きさより小さく映る場合には、人体検出手段の精度が劣化するため、人数推定の精度も劣化するという課題がある。
回帰ベース人数推定法は、人が高密度で存在する場合や所定の大きさより小さく映る場合においては、検出ベース人数推定法よりも高精度に人数を推定できる。一方、回帰ベース人数推定法は、人がまばらに存在し、かつ、所定の大きさ以上で映る場合においては、人数推定精度は検出ベース人数推定法に劣る。
本発明は、複数の人数推定法を組み合わせて、画像中の特定物体の数をより高精度に推定することを目的とする。

本発明の画像処理装置は、画像の第１領域に含まれる特定物体の数を、第１推定処理を用いて推定する第１推定手段と、前記画像の第２領域に含まれる特定物体の数を、前記第１推定処理と異なる第２推定処理を用いて推定する第２推定手段と、前記第１推定手段による推定結果と、前記第２推定手段による推定結果とを統合する統合手段と、を有し、前記第１推定処理は、前記画像に含まれる特定物体を検出する検出処理を用いて前記特定物体の数を推定する処理であり、前記第２推定処理は、人数が既知である複数の画像を学習データとした学習により得られた認識モデルを用いて前記特定物体の数を推定する処理であることを特徴とする。

本発明によれば、複数の人数推定法を組み合わせて、画像中の特定物体の数をより高精度に推定することができる。

画像処理装置のハードウェア構成の一例を示す図である。画像処理装置の機能構成の一例を示す図である。画像処理装置による画像処理の一例を示すフローチャートである。検出領域と回帰領域とを設定する方法を説明する図である。検出された人体の例を示す図である。回帰領域の小領域への分割例及び人数推定例を示す図である。回帰ベース人数推定時に分割した小領域の一例を示す図である。表示方法の例を示す図である。人体検出器と回帰器とが同一の畳込み層を共有する構成を示す図である。

以下、本発明の実施形態について図面に基づいて説明する。

＜第１の実施形態＞
図１は、画像処理装置１００のハードウェア構成の一例を示す図である。
画像処理装置１００は、ハードウェア構成として、ＣＰＵ１０と、メモリ１１と、ネットワークＩ／Ｆ１２と、表示装置１３と、入力装置１４と、を含む。ＣＰＵ１０は、画像処理装置１００の全体の制御を司る。メモリ１１は、ＣＰＵ１０が処理に利用するデータ、プログラム等を記憶する。入力装置１４は、マウス、又はボタン等であり、ユーザの操作を画像処理装置１００に入力する。表示装置１３は、液晶表示装置等であり、ＣＰＵ１０による処理の結果等を表示する。ネットワークＩ／Ｆ１２は、画像処理装置１００をネットワークに接続するインタフェースである。ＣＰＵ１０がメモリ１１に記憶されたプログラムに基づき処理を実行することにより、後述する図２の画像処理装置１００の機能構成及び後述する図３のフローチャートの処理が実現される。

図２は、画像処理装置１００の機能構成の一例を示す図である。
画像処理装置１００は、機能構成として、画像取得部１０１、領域決定部１０２、第１推定部１０３、第２推定部１０４、人数統合部１０５、表示部１０６を含む。
画像取得部１０１は、人数を推定する対象となる画像を取得する。
領域決定部１０２は、検出ベース人数推定を実施する領域と、回帰ベース人数推定を実施する領域と、を決定する。以下、検出ベース人数推定を実施する領域を検出領域、回帰ベース人数推定を実施する領域を回帰領域という。
第１推定部１０３は、検出領域に対して、検出ベース人数推定を実施する。検出ベース人数推定は、特定物体の検出処理の一例である。また、画像中の人は、特定物体の一例である。
第２推定部１０４は、回帰領域に対して、回帰ベース人数推定を実施する。回帰ベース人数推定は、所定の領域ごとに特定物体の数を推定する回帰処理の一例である。
人数統合部１０５は、第１推定部１０３による人数推定結果と、第２推定部１０４による人数推定結果と、を統合する。
表示部１０６は、人数統合部１０５により統合した人数推定結果を、表示装置１３に表示する。

図３は、画像処理装置１００による画像処理の一例を示すフローチャートである。
Ｓ２０１において、画像取得部１０１は、人数を推定する対象となる画像を取得する。画像取得部１０１は、ＣＭＯＳセンサやＣＣＤセンサ等の固体撮像素子から画像を取得してもよいし、ハードディスク等のメモリ１１から画像を取得してもよい。
Ｓ２０２において、領域決定部１０２は、検出領域と、回帰領域と、を決定する。領域の決定には任意の方法を取ってよい。
例えば一つ目の方法は、領域決定部１０２が検出領域と回帰領域との両方とも、画像全体とする方法である。
二つ目の方法は、領域決定部１０２が検出領域と人数推定とを実施する領域の両方を、ユーザの明示的に設定操作に基づき設定する方法である。領域決定部１０２は、例えば、表示装置１３、及び入力装置１４等を介したユーザの領域の設定操作に基づき、検出領域と人数推定とを実施する領域の両方を決定する。

三つ目の方法は、領域決定部１０２が人体の大きさに従って検出領域と回帰領域とを設定する方法である。例えば、領域決定部１０２は、人体が第一の所定の大きさ以上で映る領域を、検出領域とし、人体が第二の所定の大きさ以下で映る領域を、回帰領域と設定することができる。図４（ａ）に、所定の高さより高所に設置した撮像装置により撮像される画像の一例を示す。灰色の物体は人体を表す。撮像装置を斜めに設置した場合、図４のように、撮像装置に近い手前側の人体は大きく、撮像装置から離れた奥側の人体は小さく映る。図４（ｂ）の領域３１０は検出領域の例である。図４（ｃ）の領域３２０は回帰領域の例である。
画像上の人体の大きさは、ユーザが入力装置１４を用いて明示的に領域決定部１０２に与えてもよい。例えば、ユーザが、画像上の複数の地点における人体の平均的な大きさを教示することで、領域決定部１０２は、画像上の任意の地点における人体の平均的な大きさを補間により推定することができる。
また、領域決定部１０２は、画像上の人体の大きさを、統計処理により自動で推定してもよい。例えば、領域決定部１０２は、所定の学習画像群に対して画像全体に人体検出処理を行い、人体の位置を示す人体枠の集合を取得する。画像上の座標（ｘ，ｙ）における人体枠の大きさをｓとしたとき、ｓは、ｘ、ｙ及び未知の１個以上のパラメータによって表せると仮定する。例えば、ｓ＝ａｘ＋ｂｙ＋ｃと仮定する。この例では、未知のパラメータはａ、ｂ及びｃである。領域決定部１０２は、所定の学習画像群から取得した人体枠の集合を用いて、未知のパラメータを、例えば最小二乗法等の統計処理により求めることができる。領域決定部１０２は、この方法により、人が小さく映るために人体検出が失敗する領域における人体の大きさも推定することができる。

四つ目の方法は、領域決定部１０２が人の密集度に従って検出領域と回帰領域とを設定する方法である。例えば、領域決定部１０２は、人の密集度が所定の値以下である領域を検出領域とし、人の密集度が所定の値以上である領域を回帰領域と設定することができる。人の密集度は任意の方法で推定することができる。例えば、領域決定部１０２は、背景差分によって求めた動体領域に対して、動体が存在すると判定されたピクセル数の割合に従って密集度を推定できる。また、例えば、領域決定部１０２は、動きベクトル検出を所定の範囲に施し、動きベクトルの長さの和に従って密集度を推定できる。
領域の決定はこれらに限定されるものではない。例えば、領域決定部１０２は、三つ目の方法と四つ目の方法とを組み合わせ、人体の大きさと人の密集度との両方を考慮して領域を決定するようにしてもよい。また、領域決定部１０２は、検出領域を画面全体とし、回帰領域を三つ目の方法と四つ目の方法との内の少なくとも一方を用いて決定するようにしてもよい。領域決定部１０２は、一つ目の方法から四つ目の方法までの方法を任意に組み合わせて検出領域と回帰領域とを設定するようにしてもよい。また、領域決定部１０２は、時間帯や状況に応じて動的に領域を変化させてもよい。

Ｓ２０３において、第１推定部１０３は、Ｓ２０２にて設定された検出領域に対して、既知のパターン認識や機械学習の各種手法を利用し、人体検出を行う。ここで、人体検出とは、顔や人体の全体又はその一部等、予め定められた部位の位置を特定する処理を指す。以下では、人の頭部位置を検出する人体検出器を利用するものとする。第１推定部１０３は、例えば、画像の大きさを変更しながら照合パターンを画像全域に用いて複数の局所パターンを抽出し、それぞれの局所特徴量を算出する。そして、第１推定部１０３は、局所特徴量に重み付けを行った結果の総和から人体であるか否かを判定する。図５に、検出された人体の例を示す。矩形４０１は、人体検出処理によって得られた人体枠を表す。
ここで、第１推定部１０３は、Ｓ２０２において求められた人体の大きさの推定値を利用して、画像の大きさの変更範囲を限定することで、照合パターンの照合回数を減らし、計算量を削減してもよい。
次いで、第１推定部１０３は、検出された人体の数を数え上げ、推定人数を得る。

Ｓ２０４において、第２推定部１０４は、Ｓ２０２にて設定された回帰領域に対して、既知の回帰ベース人数推定手法を利用し、人数を直接推定する。一例として、ある固定サイズの小画像を入力とし、その小画像に映る人の数を出力とする回帰器を用いる手法について説明する。第２推定部１０４は、予め、人数が既知である大量の小画像を学習データとして、サポートベクターマシンや深層学習等既知の機械学習手法に基づいて回帰器を学習しておく。第２推定部１０４は、人数推定時には、入力画像の回帰領域を、人数推定を行う単位である小領域に分割する。そして、第２推定部１０４は、各小領域を固定サイズにリサイズして小画像とし、各小画像を回帰器の入力とすることで、各小領域の人数を推定する。図６（ａ）に回帰領域の小領域への分割例及び人数推定例を示す。この例では、第２推定部１０４は、回帰領域３２０を同一サイズの小領域５１０で分割している。また、図６（ａ）では小領域５１０ごとに回帰器を用いて推定した人数を、小領域の内部に数値で表している。第２推定部１０４が推定する人数は必ずしも整数とは限らず、実数を取ることもありえる。第２推定部１０４は、実数を四捨五入により整数に丸めて扱ってもよいし、実数のまま扱ってもよい。
第２推定部１０４は、小領域のサイズと人のサイズとの比率がほぼ一定となるように制約を加えることで、回帰器の精度向上を図ることもできる。第２推定部１０４は、Ｓ２０２で求められた人体の大きさの推定値を利用することで、小領域のサイズに対する人体のサイズがほぼ同一になるように、画像上で異なるサイズの小領域をとることができる。図６（ｂ）に回帰領域の分割例を示す。この例では、回帰領域３２０を異なるサイズの小領域５２０で分割している。分割された小領域５２０はそれぞれリサイズを経て固定サイズの小画像に変形され、回帰器に入力される。
回帰ベース人数推定については、非特許文献１を参照することができる。

Ｓ２０５において、人数統合部１０５は、第１推定部１０３による人数推定結果と、第２推定部１０４による人数推定結果と、を統合する。
検出領域と回帰領域とに重複がない場合、人数統合部１０５は、第１推定部１０３による人数推定結果と、第２推定部１０４による人数推定結果と、の両方を合計することで、統合後の人数推定結果を得ることができる。
検出領域と回帰領域とに重複がある場合の統合例について以下に詳述する。
人数統合部１０５は、入力画像のうち、検出領域のみが設定されている領域に対しては、検出ベース人数推定の結果を統合後の推定人数とする。
また、人数統合部１０５は、入力画像のうち、回帰領域のみが設定されている領域に対しては、回帰ベース人数推定の結果を統合後の推定人数とする。
また、人数統合部１０５は、入力画像のうち、検出領域と回帰領域との両方が設定されている領域に対しては、双方の人数推定の結果を用いた任意の式を用いて、統合後の推定人数を算出する。人数統合部１０５は、式として、例えば推定人数の合計値を取る式、推定人数のうち小さい方を取る式、推定人数のうち大きい方を取る式、推定人数の平均を取る式、又は任意の重みによる重みづけ平均を取る式を用いることができる。
例として、図７に、回帰ベース人数推定時に分割した小領域６０１を示す。小領域６０１に対する回帰ベース人数推定の結果は６人であったとする。また、検出ベース人数推定によって得られた人体枠のうち、その重心が小領域６００に含まれる人体枠の数が４であったとする。その人体枠を図７の６１１、６１２、６１３、６１４に示す。人数統合部１０５は、小領域６０１に対する検出ベース人数推定の推定人数は、４人とみなす。
人数統合部１０５が二つの推定人数のうち小さい方を取る場合、統合後の推定人数は４人となる。人数統合部１０５が二つの推定人数のうち大きい方を取る場合、統合後の推定
人数は６人となる。人数統合部１０５が二つの推定人数の平均を取る場合、統合後の推定人数は５人となる。人数統合部１０５が二つの推定人数を、回帰ベース人数推定の結果と検出ベース人数推定の結果とを３：５の重みで重みづけ平均をとる場合、統合後の推定人数は４．７５人となる。

推定人数の統合方法は、これらに限定されるものではない。例えば、人数統合部１０５は、画像の位置に応じて、異なる重みで重みづけ平均をとってもよい。より具体的には、人数統合部１０５は、人体が所定の大きさより大きく映る位置では検出ベース人数推定結果の重みを所定の重みより大きくし、人体が所定の大きさより小さく映る位置では回帰ベース人数推定結果の重みを所定の重みより大きくしてもよい。また、例えば、人数統合部１０５は、密集度に応じて、異なる重みで重みづけ平均をとってもよい。より具体的には、人数統合部１０５は、密集度が所定の値より小さい地点では検出ベース人数推定結果の重みを所定の値より大きくし、密集度が所定の値より大きい地点では回帰ベース人数推定結果の重みを所定の値より大きくしてもよい。

Ｓ２０６において、表示部１０６は、人数統合部１０５により統合した人数推定結果を、表示装置１３等に表示する。
まず、表示部１０６は、画像全体の統合後の人数推定結果を表示する。この際、表示部１０６は、Ｓ２０２にて設定された検出領域及び回帰領域を画像上に明示してもよい。また、表示部１０６は、Ｓ２０３において推定された検出領域における人数推定結果と、Ｓ２０４において推定された回帰領域における人数推定結果とをそれぞれ表示してもよい。
また、表示部１０６は、画像の位置ごとに推定人数が分かるように、より詳細な表示を行ってもよい。その方法の例を以下に示す。
一つ目の表示方法は、統合後の推定人数と等しい数の人体枠を画像上に重畳表示する方法である。図８（ａ）を用いて説明する。例えばＳ２０５において、図７の小領域６０１の推定人数を５人とした場合を考える。この場合、小領域６０１に対する検出ベース人数推定による推定人数は４人であったので、人体枠が１人分足りない。表示部１０６は、小領域６０１内のランダムな位置を選んで、不足する分の人体枠を重畳（ここでは枠７０１）することで、推定人数と等しい数の人体枠を画像上に重畳表示できる。この際、人体枠の大きさを、Ｓ２０２で述べた方法で推定することで、表示部１０６は、自然な大きさの人体枠を重畳できる。逆に、検出ベース人数推定結果が、統合後の推定人数を上回る場合は、表示部１０６は、ランダムに人体枠を選んで削除する処理を必要回数行えばよい。

二つ目の表示方法は、回帰ベース人数推定時に分割した小領域ごとに、推定人数を表示する方法である。図８（ｂ）を用いて説明する。例えばＳ２０５において、図７の小領域６０１の推定人数を５人とした場合を考える。この場合、表示部１０６は、小領域６０１に存在すると推定される人数を、小領域６０１に重畳して表示する。また、表示部１０６は、人数の多さに応じて、視覚的に異なる画像処理を各領域に施してもよい。例えば、表示部１０６は、人数が他の領域に比べて多い領域ほど色を濃くする（例えば、赤色）ように表示してもよい。二つ目の表示方法の処理は、所定の領域ごとに所定の領域に存在する特定物体の数に応じた表示処理を行う一例である。
三つ目の表示方法は、画像の場所によって異なる表示を行う方法である。例えば、表示部１０６は、人体枠が所定の大きさよりも大きく表示される領域においては、一つ目の表示方法を用い、それ以外の領域においては、二つ目の表示方法を用いる。三つ目の表示方法の処理は、画像の位置に応じて画像に対して異なる表示処理を行う一例である。
四つ目の表示方法は、人数によって異なる表示を行う方法である。例えば、表示部１０６は、推定人数が所定の値よりも小さい領域においては、一つ目の表示方法を用い、それ以外の領域においては、二つ目の表示方法を用いる。四つ目の表示方法の処理は、画像の特定物体の数に応じて画像に対して異なる表示処理を行う一例である。
三つ目の表示方法や四つ目の表示方法をとることにより、例えば、人が密集している領
域に対しては、図８（ｂ）のような表示を行い、人が密集していない領域に対しては、図８（ａ）のような表示を行うことができる。したがって、ユーザは、人が密集している領域において、人が何人いるか速やかに把握することができる。

＜第２の実施形態＞
検出ベース人数推定に用いる人体検出器及び回帰ベース人数推定に用いる回帰器は、共に既存の深層学習の手法を用いて学習してもよい。この際、ＣＰＵ１０は、人体検出器と回帰器とが、同一の畳込み層を共有する構成にしてもよい。構成例を図９に示す。

＜その他の実施形態＞
本発明は、上述の実施形態の１以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給する。そして、そのシステム又は装置のコンピュータにおける１つ以上のプロセッサーがプログラムを読み出し実行する処理でも実現可能である。また、１以上の機能を実現する回路（例えば、ＡＳＩＣ）によっても実現可能である。

以上、本発明の好ましい実施形態について詳述したが、本発明は係る特定の実施形態に限定されるものではない。上述した実施形態では、推定の対象として人を例にとって説明を行った。しかし、人を例えば人以外の動物や自動車、自転車等の車、微生物等の任意の特定物体に読み替えることで、上述した実施形態の構成、情報処理を任意の特定物体の数の推定に利用することができる。

以上、上述した各実施形態によれば、検出ベース人数推定法を適用する領域及び回帰ベース人数推定法を適用する領域を自動で決定し、それぞれの結果を統合することで、単独の人数推定方法を用いる場合よりも高精度に人数推定することができる。
よって、複数の人数推定法を組み合わせて、画像中の特定物体の数をより高精度に推定することができる。

１０ＣＰＵ
１１メモリ
１００画像処理装置

Claims

画像の第１領域に含まれる特定物体の数を、第１推定処理を用いて推定する第１推定手段と、
前記画像の第２領域に含まれる特定物体の数を、前記第１推定処理と異なる第２推定処理を用いて推定する第２推定手段と、
前記第１推定手段による推定結果と、前記第２推定手段による推定結果とを統合する統合手段と、を有し、
前記第１推定処理は、前記画像に含まれる特定物体を検出する検出処理を用いて前記特定物体の数を推定する処理であり、
前記第２推定処理は、人数が既知である複数の画像を学習データとした学習により得られた認識モデルを用いて前記特定物体の数を推定する処理であることを特徴とする画像処理装置。
前記画像の全体を前記第１領域、及び前記第２領域と決定する領域決定手段を更に有する請求項１記載の画像処理装置。
ユーザの設定操作に基づいて前記第１領域と前記第２領域とを決定する領域決定手段を更に有する請求項１記載の画像処理装置。
前記画像の特定物体の大きさに基づいて前記第１領域と前記第２領域との内の少なくとも一方を決定する領域決定手段を更に有する請求項１記載の画像処理装置。
前記領域決定手段は、前記特定物体の大きさを推定し、推定した前記特定物体の大きさに基づいて前記第１領域と前記第２領域との内の少なくとも一方を決定する請求項４記載の画像処理装置。
前記画像の特定物体の密集度に基づいて前記第１領域と前記第２領域との内の少なくとも一方を決定する領域決定手段を更に有する請求項１記載の画像処理装置。
前記領域決定手段は、動体、又は動きベクトルに基づいて前記密集度を推定し、推定した前記密集度に基づいて前記第１領域と前記第２領域との内の少なくとも一方を決定する請求項６記載の画像処理装置。
前記統合手段は、前記第１推定手段による推定結果と前記第２推定手段による推定結果とを合計することで統合する請求項１乃至７の何れか１項記載の画像処理装置。
前記統合手段は、前記第１領域と前記第２領域とに重複している領域がない場合、前記第１推定手段による推定結果と前記第２推定手段による推定結果とを合計することで統合する請求項８記載の画像処理装置。
前記統合手段は、前記第１領域と前記第２領域とに重複している領域がある場合、前記第１領域のみの領域に対しては前記第１推定手段による推定結果を統合後の特定物体の数とし、前記第２領域のみの領域に対しては前記第２推定手段による推定結果を統合後の特定物体の数とし、前記重複している領域に対しては前記第１推定手段による推定結果と前記第２推定手段による推定結果とに基づいて統合後の特定物体の数を求めることで統合する請求項１乃至７の何れか１項記載の画像処理装置。
前記統合手段は、前記重複している領域に対しては前記第１推定手段による推定結果と前記第２推定手段による推定結果とを合計することで統合後の特定物体の数を求める請求項１０記載の画像処理装置。
前記統合手段は、前記重複している領域に対しては前記第１推定手段による推定結果と前記第２推定手段による推定結果とに基づいて小さい方の値とすることで統合後の特定物体の数を求める請求項１０記載の画像処理装置。
前記統合手段は、前記重複している領域に対しては前記第１推定手段による推定結果と前記第２推定手段による推定結果とに基づいて大きい方の値とすることで統合後の特定物体の数を求める請求項１０記載の画像処理装置。
前記統合手段は、前記重複している領域に対しては前記第１推定手段による推定結果と前記第２推定手段による推定結果とに基づいて平均をとることで統合後の特定物体の数を求める請求項１０記載の画像処理装置。
前記統合手段は、前記重複している領域に対しては前記第１推定手段による推定結果と前記第２推定手段による推定結果とに基づいて重みづけ平均をとることで統合後の特定物体の数を求める請求項１０記載の画像処理装置。
前記統合手段は、前記画像の位置、又は特定物体の密集度に基づいて前記重みづけを変化させる請求項１５記載の画像処理装置。
前記統合手段による統合の結果、求められた前記画像の特定物体の数を表示手段に表示させる表示制御手段を更に有する請求項１乃至１６の何れか１項記載の画像処理装置。
前記表示制御手段は、前記第１領域と前記第２領域とを更に前記表示手段に表示させる請求項１７記載の画像処理装置。
前記表示制御手段は、前記第１推定手段による推定結果と前記第２推定手段による推定結果とを更に前記表示手段に表示させる請求項１７又は１８記載の画像処理装置。
前記第２推定手段は、前記画像の前記第２領域における所定領域ごとに前記第２推定処理を実行することで、前記第２領域に含まれる前記特定物体の数を推定し、
前記表示制御手段は、前記所定領域の各々について、当該所定領域において推定された前記特定物体の数を示す情報を前記表示手段に表示させる請求項１７記載の画像処理装置。
前記表示制御手段は、前記所定領域の各々について、当該所定領域において推定された前記特定物体の数に応じた表示処理を行う請求項２０記載の画像処理装置。
前記第２推定手段は、前記画像の前記第２領域における所定領域ごとに前記第２推定処理を実行することで、前記第２領域に含まれる前記特定物体の数を推定する請求項１乃至１９の何れか１項記載の画像処理装置。
前記特定物体は、人、人以外の動物、微生物、車の何れかである請求項１乃至２２の何れか１項記載の画像処理装置。
前記認識モデルは、人数が既知である前記複数の画像を学習データとした機械学習によって構築されるモデルである請求項１乃至２３の何れか１項記載の画像処理装置。
画像の第１領域に含まれる特定物体の数を、第１推定処理を用いて推定する第１推定工程と、
前記画像の第２領域に含まれる特定物体の数を、前記第１推定処理と異なる第２推定処理を用いて推定する第２推定工程と、
前記第１推定工程における推定結果と、前記第２推定工程における推定結果とを統合する統合工程と、を有し、
前記第１推定処理は、前記画像に含まれる特定物体を検出する検出処理を用いて前記特定物体の数を推定する処理であり、
前記第２推定処理は、人数が既知である複数の画像を学習データとした学習により得られた認識モデルを用いて前記特定物体の数を推定する処理であることを特徴とする画像処理方法。
コンピュータを、請求項１乃至２４の何れか１項記載の画像処理装置の各手段として機能させるためのプログラム。