JP6030457B2

JP6030457B2 - 画像検出装置及び制御プログラム並びに画像検出方法

Info

Publication number: JP6030457B2
Application number: JP2013010092A
Authority: JP
Inventors: 健太西行
Original assignee: MegaChips Corp
Current assignee: MegaChips Corp
Priority date: 2013-01-23
Filing date: 2013-01-23
Publication date: 2016-11-24
Anticipated expiration: 2033-01-23
Also published as: JP2014142760A

Description

本発明は、処理対象画像から検出対象画像を検出する技術に関する。

特許文献１〜３には、処理対象画像から検出対象画像を検出する技術が開示されている。

特開２００８−２７０５８号公報特開２００９−１７５８２１号公報特開２０１１−２２１７９１号公報

さて、処理対象画像から検出対象画像を検出する際には、処理対象画像についての処理量の低減が望まれている。

そこで、本発明は上述の点に鑑みて成されたものであり、検出対象画像の検出が行われる対象の処理対象画像についての処理量を低減することが可能な技術を提供することを目的とする。

上記課題を解決するため、本発明に係る画像検出装置の一態様は、処理対象画像から検出対象画像を検出する画像検出装置であって、検出枠を用いて、撮像画像に対して、当該検出枠と同じサイズの前記検出対象画像である可能性が高い領域を検出結果領域として検出する検出処理を行う検出部と、前記処理対象画像において前記検出対象画像を特定する検出対象画像特定部とを備え、前記検出部は、互いに異なったタイミングで撮像された、前記処理対象画像を含む複数枚の撮像画像のそれぞれに対して、互いにサイズの異なる複数種類の検出枠に含まれる少なくとも一種類の検出枠が対応するように、当該複数種類の検出枠を分散して当該複数枚の撮像画像に対応付けて、当該複数枚の撮像画像のそれぞれに対して、当該撮像画像に対応する少なくとも一種類の検出枠を用いて前記検出処理を行い、前記検出対象画像特定部は、前記検出部において前記複数枚の撮像画像について検出された前記検出結果領域に基づいて、前記処理対象画像において前記検出対象画像を特定する。

また、本発明に係る画像検出装置の一態様では、前記複数種類の検出枠は、基準サイズの基準検出枠と、当該基準サイズとは異なるサイズの非基準検出枠とを含み、前記検出部は、撮像画像について前記非基準検出枠を用いて前記検出処理を行う際には、前記基準サイズとサイズが一致するように当該非基準検出枠をサイズ変更するとともに、当該非基準検出枠のサイズ変更に応じて当該撮像画像のサイズ変更を行い、サイズ変更後の当該撮像画像であるサイズ変更画像に対して、サイズ変更後の当該非基準検出枠であるサイズ変更検出枠を移動させながら、当該サイズ変更画像での当該サイズ変更検出枠内の画像が前記検出対象画像である可能性が高いかを判定する。

また、本発明に係る画像検出装置の一態様では、前記検出部は、前記複数枚の撮像画像における、前記処理対象画像以外の撮像画像について、前記複数種類の検出枠に含まれる検出枠を用いて前記検出処理を行った結果、当該撮像画像において、当該検出枠と同じサイズの前記検出対象画像である可能性が非常に高い領域が存在する場合には、前記処理対象画像についても当該検出枠を用いて前記検出処理を行う。

また、本発明に係る画像検出装置の一態様では、前記検出対象画像特定部は、前記検出部において前記複数枚の撮像画像について検出された前記検出結果領域の外形枠である検出結果枠に基づいて、前記処理対象画像において前記検出対象画像を特定し、前記検出対象画像特定部は、前記検出結果枠が重ねられた前記処理対象画像を複数のブロックに分割し、前記検出対象画像特定部は、前記複数のブロックにおける、前記検出結果枠と重なるブロックについて、前記複数枚の撮像画像のうち、当該ブロックと重なる前記検出結果枠が得られた撮像画像の数がしきい値以下である場合には、当該ブロックと重なる前記検出結果枠を使用せずに、前記処理対象画像において前記検出対象画像を特定する。

また、本発明に係る画像検出装置の一態様では、前記検出対象画像特定部は、前記複数のブロックにおける、前記検出結果枠と重なるブロックについて、前記複数枚の撮像画像のうち、当該ブロックと重なる前記検出結果枠が得られた撮像画像の数がしきい値以下である場合であっても、当該ブロックと重なる前記検出結果枠を外形枠とする前記検出結果領域に、前記検出対象画像である可能性が非常に高い前記検出結果領域が含まれる場合には、当該ブロックと重なる前記検出結果枠を使用して、前記処理対象画像において前記検出対象画像を特定する。

また、本発明に係る画像検出装置の一態様では、前記検出対象画像特定部は、前記検出部において前記複数枚の撮像画像について検出された前記検出結果領域についての、当該検出結果領域が前記検出対象画像である確からしさを示す検出確度値に基づいて、前記処理対象画像において前記検出対象画像を特定する。

また、本発明に係る画像検出装置の一態様では、前記検出対象画像特定部は、前記検出部において前記複数枚の撮像画像について検出された前記検出結果領域についての前記検出確度値に対して重み付けを行ったうえで当該検出確度値に基づいて、前記処理対象画像において前記検出対象画像を特定し、前記検出対象画像特定部は、撮像画像について検出された前記検出結果領域についての前記検出確度値に対して重み付けを行う際には、当該撮像画像の撮像タイミングが前記処理対象画像の撮像タイミングよりも離れているほど、当該検出確度値に対する重み付けを小さくする。

また、本発明に係る画像検出装置の一態様では、前記検出対象画像は、人の顔画像である。

また、本発明に係る制御プログラムの一態様は、処理対象画像から検出対象画像を検出する画像検出装置を制御するための制御プログラムであって、前記画像検出装置に、（ａ）検出枠を用いて、撮像画像に対して、当該検出枠と同じサイズの前記検出対象画像である可能性が高い領域を検出結果領域として検出する検出処理を行う工程と、（ｂ）前記処理対象画像において前記検出対象画像を特定する工程とを実行させ、前記工程（ａ）において、互いに異なったタイミングで撮像された、前記処理対象画像を含む複数枚の撮像画像のそれぞれに対して、互いにサイズの異なる複数種類の検出枠に含まれる少なくとも一種類の検出枠が対応するように、当該複数種類の検出枠を分散して当該複数枚の撮像画像に対応付けて、当該複数枚の撮像画像のそれぞれについて、当該撮像画像に対応する少なくとも一種類の検出枠を用いて前記検出処理を行い、前記工程（ｂ）において、前記工程（ａ）で前記複数枚の撮像画像について検出された前記検出結果領域に基づいて、前記処理対象画像において前記検出対象画像を特定するように動作させるためのものである。

また、本発明に係る画像検出方法の一態様は、処理対象画像から検出対象画像を検出する画像検出方法であって、（ａ）検出枠を用いて、撮像画像に対して、当該検出枠と同じサイズの前記検出対象画像である可能性が高い領域を検出結果領域として検出する検出処理を行う工程と、（ｂ）前記処理対象画像において前記検出対象画像を特定する工程とを備え、前記工程（ａ）において、互いに異なったタイミングで撮像された、前記処理対象画像を含む複数枚の撮像画像のそれぞれに対して、互いにサイズの異なる複数種類の検出枠に含まれる少なくとも一種類の検出枠が対応するように、当該複数種類の検出枠を分散して当該複数枚の撮像画像に対応付けて、当該複数枚の撮像画像のそれぞれについて、当該撮像画像に対応する少なくとも一種類の検出枠を用いて前記検出処理を行い、前記工程（ｂ）において、前記工程（ａ）で前記複数枚の撮像画像について検出された前記検出結果領域に基づいて、前記処理対象画像において前記検出対象画像を特定する。

本発明によれば、処理対象画像についての処理量を低減することができる。

画像検出装置の構成を示す図である。画像検出装置が備える複数の機能ブロックの構成を示す図である。複数種類の検出枠が複数枚の使用撮像画像に対応付けられている様子を示す図である。検出部の動作を示すフローチャートである。検出部の構成を示す図である。検出部の動作を説明するための図である。検出部の動作を説明するための図である。検出部の動作を説明するための図である。検出部の動作を説明するための図である。検出部の動作を説明するための図である。検出部の動作を説明するための図である。検出結果枠を処理対象画像に重ねて示す図である。出力値マップの生成方法を説明するための図である。出力値マップの生成方法を説明するための図である。出力値マップを示す図である。極大点の探索方法を説明するための図である。極大点の探索方法を説明するための図である。出力値マップでの極大点付近の検出確度値の分布を示す図である。検出画像領域の決定方法を説明するための図である。検出対象画像決定部の動作を示すフローチャートである。検出画像領域及び統合後検出結果枠を処理対象画像に重ねて示す図である。検出結果枠が重ねられた処理対象画像が複数のブロックに分割されている様子を示す図である。

図１は実施の形態に係る画像検出装置１の構成を示す図である。本実施の形態に係る画像検出装置１は、入力される画像データが示す撮像画像から検出対象画像を検出する。画像検出装置１は、例えば、監視カメラシステム、デジタルカメラシステム等で使用される。本実施の形態では、検出対象画像は、例えば人の顔画像である。以後、単に「顔画像」と言えば、人の顔画像を意味するものとする。また、検出対象画像を検出する対象の撮像画像を「処理対象画像」と呼ぶ。本実施の形態に係る画像検出装置１は、処理対象画像を含む、互いに撮像タイミングが異なるもののそれらの撮像タイミングが近い複数枚の撮像画像が同じ画像を示すものとして、処理対象画像から検出対象画像を検出する際には当該複数枚の撮像画像を使用する。画像検出装置１での検出対象画像は顔画像以外の画像であっても良い。

図１に示されるように、画像検出装置１は、ＣＰＵ（Central Processing Unit）１０及び記憶部１１を備えている。記憶部１１は、ＲＯＭ（Read Only Memory）及びＲＡＭ（Random Access Memory）等で構成されている。記憶部１１には、画像検出装置１の動作を制御するための制御プログラム１２等が記憶されている。画像検出装置１の各種機能は、ＣＰＵ１０が記憶部１１内の制御プログラム１２を実行することによって実現される。画像検出装置１では、制御プログラム１２が実行されることによって、図２に示されるような複数の機能ブロックが形成される。

図２に示されるように、画像検出装置１は、機能ブロックとして、画像入力部２と、検出部３と、検出対象画像特定部７とを備えている。以下では、画像検出装置１が備える各機能ブロックの概略動作を説明した後に、当該各機能ブロックの詳細動作について説明する。画像検出装置１が備える各種機能は、機能ブロックではなくハードウェア回路で実現しても良い。

＜画像検出装置の概略動作説明＞
画像入力部２には、監視カメラシステム等が備える撮像部（カメラ）で順次撮像された複数枚の撮像画像をそれぞれ示す複数の画像データが順次入力される。画像入力部２は、処理対象画像から検出対象画像が検出される際に使用される、処理対象画像を含むＫ枚（Ｋ≧２）の撮像画像をそれぞれ示す複数の画像データを出力する。以後、当該Ｋ枚の撮像画像をまとめて「使用撮像画像群」と呼ぶことがある。また、使用撮像画像群を構成する複数枚（Ｋ枚）の撮像画像のそれぞれを「使用撮像画像」と呼ぶことがある。使用撮像画像群を構成する複数枚の使用撮像画像は互いに異なったタイミングで撮像されている。

画像入力部２は、撮像部で得られる各撮像画像を処理対象画像としても良いし、撮像部で得られる撮像画像のうち、数秒毎に得られる撮像画像を処理対象画像としても良い。撮像部では、例えば、１秒間にＬ枚（Ｌ≧２）の撮像画像が撮像される。つまり、撮像部での撮像フレームレートは、Ｌｆｐｓ(frame per second）である。例えばＬ＝３０に設定される。

また、撮像部で得られる撮像画像では、行方向にＭ個（Ｍ≧２）のピクセルが並び、列方向にＮ個（Ｎ≧２）のピクセルが並んでいる。撮像部で得られる撮像画像の解像度は、例えばＶＧＡ（Video Graphics Array）であって、Ｍ＝６４０、Ｎ＝４８０となっている。

なお以後、行方向にｍ個（ｍ≧１）のピクセルが並び、列方向にｎ個（ｎ≧１）のピクセルが並ぶ領域の大きさをｍｐ×ｎｐで表す（ｐはピクセルの意味）。また、行列状に配置された複数の値において、左上を基準にして第ｍ行目であって第ｎ列目に位置する値をｍ×ｎ番目の値と呼ぶことがある。

検出部３は、画像入力部２から出力される、使用撮像画像群を構成する複数枚の使用撮像画像をそれぞれ示す複数の画像データを使用して、当該複数枚の使用撮像画像のそれぞれについて、当該使用撮像画像において顔画像である可能性が高い領域を検出する。

検出対象画像特定部７は、マップ生成部４と、極大点探索部５と、検出対象画像決定部６とを備えている。検出対象画像特定部７は、検出部３での検出結果に基づいて、処理対象画像において顔画像を特定する。

マップ生成部４は、検出部３での検出結果に基づいて、顔画像としての確からしさを示す検出確度値についての処理対象画像での分布を示す出力値マップを生成する。極大点探索部５は、マップ生成部４で生成された出力値マップにおいて検出確度値の極大点を探索する。検出対象画像決定部６は、処理対象画像において、極大点探索部５で求められた極大点と同じ位置のピクセルを含む所定領域を顔画像であると決定する。これにより、検出対象画像特定部７では処理対象画像において顔画像が特定される。その結果、画像検出装置１では、処理対象画像から顔画像が検出される。

＜画像検出装置の詳細動作説明＞
＜検出処理＞
検出部３は、検出枠を用いて、使用撮像画像において当該検出枠と同じサイズの顔画像である可能性が高い領域を検出結果領域として検出する検出処理を行う。以後、単に「検出処理」と言えば、検出部３でのこの検出処理を意味する。検出処理については後で詳細に説明する。

検出部３は、処理対象画像における様々な大きさの顔画像を検出するために、サイズの異なる複数種類の検出枠を使用する。検出部３は、使用撮像画像群を構成するＫ枚の使用撮像画像のそれぞれに対して、Ｔ種類（Ｔ≧２）の検出枠に含まれる少なくとも一種類の検出枠が対応するように、当該複数種類の検出枠を分散して当該Ｋ枚の使用撮像画像に対応付ける。そして、検出部３は、使用撮像画像群を構成するＫ枚の使用撮像画像のそれぞれについて、当該使用撮像画像に対応する少なくとも一種類の検出枠を用いて検出処理を行う。

図３は、検出部３で使用される複数種類の検出枠１００が分散して使用撮像画像群を構成する複数枚の使用撮像画像に対応付けられている様子を示す図である。本実施の形態では、例えば、Ｋ＝３であって、使用撮像画像群は、撮像部で連続的に撮像された３枚の撮像画像で構成されている。撮像部でのフレームレートが３０ｆｐｓであるとすると、使用撮像画像群を構成する３枚の使用撮像画像における撮像間隔は（１／３０）秒となる。また本実施の形態では、使用撮像画像を構成する３枚の使用撮像画像のうち、例えば最後に撮像された使用撮像画像が処理対象画像とされる。

図３では、使用撮像画像群を構成する、（ｋ−２）フレーム目、（ｋ−１）フレーム目及びｋフレーム目の使用撮像画像に対して複数種類の検出枠１００が分散して対応付けられている様子が示されている。図３の例では、ｋフレーム目の使用撮像画像が処理対象画像となる。以下では、使用撮像画像群が、（ｋ−２）フレーム目、（ｋ−１）フレーム目及びｋフレーム目で構成されている場合を例に挙げて、画像検出装置１の動作について説明する。

図３に示されるように、互いにサイズの異なる複数種類の検出枠１００は、分散して、（ｋ−２）フレーム目、（ｋ−１）フレーム目及びｋフレーム目の使用撮像画像に対して対応付けられている。図３の例では、検出枠１００が、サイズの小さいものから順に１つずつ、（ｋ−２）フレーム目の使用撮像画像、（ｋ−１）フレーム目の使用撮像画像、ｋフレーム目の使用撮像画像という順番が繰り返された順番で使用撮像画像に対して対応付けられている。つまり、（ｋ−２）フレーム目の使用撮像画像に対しては（３×ｓ＋１）番目（ｓ＝０，１，２・・・）に小さい検出枠１００が対応付けられ、（ｋ−１）フレーム目の使用撮像画像に対しては（３×ｓ＋２）番目に小さい検出枠１００が対応付けられ、ｋフレーム目の使用撮像画像に対しては（３×ｓ＋３）番目に小さい検出枠１００が対応付けられている。

このように、本実施の形態では、使用撮像画像群を構成する３枚の使用撮像画像のそれぞれに対しては、当該３枚の使用撮像画像の間で互いに重複しないように、検出枠１００がサイズの小さいものから順に２つおきに対応付けられている。本実施の形態では、各使用撮像画像に対して複数種類の検出枠１００が対応付けられている。例えば、Ｔ＝３０である場合には、各使用撮像画像に対して１０種類の検出枠１００が対応付けられる。

なお、（ｋ−１）フレーム目の撮像画像が処理対象画像とされる場合には、使用撮像画像群は、（ｋ−３）フレーム目、（ｋ−２）フレーム目及び（ｋ−１）フレーム目の撮像画像で構成されることになる。この場合には、（ｋ−３）フレーム目の撮像画像に対しては、ｋフレーム目に対応付けられた検出枠１００と同じ検出枠１００が対応付けられる。

また、（ｋ−２）フレーム目の撮像画像が処理対象画像とされる場合には、使用撮像画像群は、（ｋ−４）フレーム目、（ｋ−３）フレーム目及び（ｋ−２）フレーム目の撮像画像で構成されることになる。この場合には、（ｋ−４）フレーム目の撮像画像に対しては、（ｋ−１）フレーム目に対応付けられた検出枠１００と同じ検出枠１００が対応付けられる。

また、（ｋ−３）フレーム目の撮像画像が処理対象画像とされる場合には、使用撮像画像群は、（ｋ−５）フレーム目、（ｋ−４）フレーム目及び（ｋ−３）フレーム目の撮像画像で構成されることになる。この場合には、（ｋ−５）フレーム目の撮像画像に対しては、（ｋ−２）フレーム目に対応付けられた検出枠１００と同じ検出枠１００が対応付けられる。

以上の点を一般化すると、使用撮像画像群に（ｋ＋３ｔ）フレーム目（ｔは零を除く整数）の撮像画像が含まれ、当該撮像画像に対して検出枠１００が対応付けられる際には、ｋフレーム目の検出枠１００と同じ検出枠１００が対応付けられる。また、使用撮像画像群に（ｋ＋３ｔ−１）フレーム目の撮像画像が含まれ、当該撮像画像に対して検出枠１００が対応付けられる際には、（ｋ−１）フレーム目の検出枠１００と同じ検出枠１００が対応付けられる。そして、使用撮像画像群に（ｋ＋３ｔ−２）フレーム目の撮像画像が含まれ、当該撮像画像に対して検出枠１００が対応付けられる際には、（ｋ−２）フレーム目の検出枠１００と同じ検出枠１００が対応付けられる。

図４は、検出部３が使用撮像画像群を構成する複数枚の使用撮像画像のそれぞれについて当該使用撮像画像に対応する複数種類の検出枠を用いて検出処理を行う際の当該検出部３の一連の動作を示すフローチャートである。

図４に示されるように、ステップｓ１において、検出部３は、画像入力部２から、（ｋ−２）フレーム目の使用撮像画像を示す画像データが入力されると、ステップｓ２において、当該画像データを用いて、（ｋ−２）フレーム目の使用撮像画像に対応する各検出枠を用いて、（ｋ−２）フレーム目の使用撮像画像について検出処理を行う。つまり、検出部３は、（ｋ−２）フレーム目の使用撮像画像に対応する各検出枠について、（ｋ−２）フレーム目の使用撮像画像において、当該検出枠と同じサイズの検出対象画像である可能性が高い領域を検出結果領域として検出する検出処理を行う。

ステップｓ２の実行後、ステップｓ３において、検出部３は、画像入力部２から、（ｋ−１）フレーム目の使用撮像画像を示す画像データが入力されると、ステップｓ４において、当該画像データを用いて、（ｋ−１）フレーム目の使用撮像画像に対応する各検出枠を用いて、（ｋ−１）フレーム目の使用撮像画像について検出処理を行う。

ステップｓ４の実行後、ステップｓ５において、検出部３は、画像入力部２から、ｋフレーム目の使用撮像画像を示す画像データが入力されると、ステップｓ６において、当該画像データを用いて、ｋフレーム目の使用撮像画像に対応する各検出枠を用いて、ｋフレーム目の使用撮像画像について検出処理を行う。

このように、本実施の形態では、使用撮像画像群を構成する、処理対象画像を含むＫ枚の使用撮像画像に対してＴ種類の検出枠が分散して対応付けられていることから、処理対象画像に対してはＴ種類の検出枠よりも少ない種類の検出枠が対応付けられる。したがって、処理対象画像については、Ｔ種類の検出枠よりも少ない種類の検出枠が使用されて検出処理が行われる。よって、処理対象画像についてＴ種類の検出枠が使用されて検出処理が行われる場合と比較して、処理対象画像についての処理量を低減することができる。

＜検出処理の詳細＞
次に検出処理の詳細について説明する。図５は検出部３の構成を示す図である。図５に示されるように、検出部３は、画像切り取り部３０と、特徴量抽出部３１と、識別器３２と、判定部３３と、画像サイズ変更部３４とを備えている。

本実施の形態では、後述するように、特徴量抽出部３１は、入力される画像から特徴量を抽出する。そして、特徴量抽出部３１においては、入力された画像から特徴量を抽出するために、基準サイズの画像を入力する必要がある。

一方で、本実施の形態では、互いにサイズが異なるＴ種類の検出枠には、基準サイズと同じサイズの検出枠と、基準サイズとは異なるサイズの検出枠とが含まれている。以後、基準サイズと同じサイズの検出枠を「基準検出枠」と呼び、基準サイズとは異なるサイズの検出枠を「非基準検出枠」と呼ぶ。本実施の形態では、Ｔ種類の検出枠のうちのサイズが最小の検出枠が基準検出枠となっている。したがって、Ｔ種類の検出枠のうち、（Ｔ−１）種類の検出枠が非基準検出枠となる。（Ｔ−１）種類の非基準検出枠のそれぞれのサイズは基準サイズよりも大きくなっている。基準検出枠のサイズは、例えば１６ｐ×１６ｐである。また、（Ｔ−１）種類の非基準検出枠には、例えば、大きさが１８ｐ×１８ｐの非基準検出枠及び大きさが２０ｐ×２０ｐの非基準検出枠などが含まれている。

本実施の形態では、検出部３は、使用撮像画像について基準検出枠を使用して検出処理を行う際には、使用撮像画像に対して基準検出枠を移動させながら、当該基準検出枠内の画像に対して顔画像の検出を行って、当該画像が顔画像である可能性が高いかを判定する。そして、検出部３は、使用撮像画像において、顔画像である可能性が高いと判定した領域（基準検出枠内の画像）を検出結果領域とする。

一方で、検出部３は、使用撮像画像について非基準検出枠を使用して検出処理を行う際には、基準サイズとサイズが一致するように非基準検出枠をサイズ変更する。そして、検出部３は、非基準検出枠のサイズ変更に応じて使用撮像画像のサイズ変更を行う。検出部３は、サイズ変更を行った使用撮像画像に対して、サイズ変更を行った非基準検出枠を移動させながら、当該非基準検出枠内の画像に対して顔画像の検出を行って、当該画像が顔画像である可能性が高いかを判定する。そして、検出部３は、サイズ変更を行った使用撮像画像において、顔画像である可能性が高いと判定した領域（サイズ変更後の非基準検出枠内の画像）に基づいて、サイズ変更が行われていない、本来のサイズの使用撮像画像において顔画像である可能性が高い領域を特定し、当該領域を検出結果領域とする。

以後、使用撮像画像に対して非基準検出枠が使用されて検出処理が行われる際のサイズ変更後の当該使用撮像画像を「サイズ変更画像」と呼ぶ。また、使用撮像画像に対して非基準検出枠が使用されて検出処理が行われる際のサイズ変更後の当該非基準検出枠を「サイズ変更検出枠」と呼ぶ。

このように、本実施の形態では、検出部３が使用撮像画像に対して基準検出枠を使用して検出処理を行う際の当該検出部３の動作と、検出部３が使用撮像画像に対して非基準検出枠を使用して検出処理を行う際の当該検出部３の動作とが異なっている。以下に検出部３の動作について詳細に説明する。

検出部３では、検出処理に基準検出枠が使用される際には、画像切り取り部３０が、使用撮像画像に対して基準検出枠を設定し、当該使用撮像画像から当該基準検出枠内の画像を切り取って特徴量抽出部３１に入力する。一方で、検出処理に非基準検出枠が使用される際には、画像切り取り部３０は、画像サイズ変更部３４で使用撮像画像がサイズ変更されることによって得られたサイズ変更画像に対して、非基準検出枠をサイズ変更して得られるサイズ変更検出枠を設定し、当該サイズ変更画像から当該サイズ変更検出枠内の画像を切り取って特徴量抽出部３１に入力する。

ここで、基準検出枠のサイズは基準サイズと一致することから、画像切り取り部３０において切り取られた基準検出枠内の画像のサイズは基準サイズとなる。また、サイズ変更検出枠のサイズは基準サイズと一致することから、画像切り取り部３０において切り取られたサイズ変更検出枠内の画像のサイズは基準サイズとなる。よって、特徴量抽出部３１には、常に基準サイズの画像が入力される。

特徴量抽出部３１は、入力された画像（使用撮像画像における基準検出枠内の画像あるいはサイズ変更画像におけるサイズ変更検出枠内の画像）から、例えばＨａａｒ−ｌｉｋｅ特徴量やＬＢＰ（Local Binary Pattern）特徴量などの特徴量を抽出する。

識別器３２は、特徴量抽出部３１で抽出された特徴量と学習データに基づいて、画像切り取り部３０で切り取られた画像に対して顔検出を行った結果として、当該画像が顔画像である確からしさを示す検出確度値を実数値として出力する。つまり、識別器３２から出力値として出力される検出確度値は、基準検出枠内の画像あるいはサイズ変更検出枠内の画像についての顔画像らしさ（顔らしさ）を示していると言える。識別器３２としては、例えば、ＳＶＭ（Support Vector Machine）あるいはＡｄａｂｏｏｓｔが使用される。

判定部３３は、識別器２２から出力される検出確度値がしきい値以上であれば、画像切り取り部３０で切り取られた画像が顔画像である可能性が高いと判定する。つまり、基準検出枠が使用される際には、判定部３３は、使用対象画像における基準検出枠内の画像が、基準検出枠と同じサイズの顔画像である可能性が高い領域であると判定する。また、非基準検出枠が使用される際には、判定部３３は、サイズ変更画像におけるサイズ変更検出枠内の画像が、サイズ変更検出枠と同じサイズの顔画像である可能性が高い領域であると判定する。

一方で、判定部３３は、識別器２２から出力される検出確度値がしきい未満であれば、画像切り取り部３０で切り取られた画像が顔画像でない可能性が高いと判定する。つまり、基準検出枠が使用される際には、判定部３３は、使用撮像画像における基準検出枠内の画像が、基準検出枠と同じサイズの顔画像である可能性が高い領域ではないと判定する。また、非基準検出枠が使用される際には、判定部３３は、サイズ変更画像におけるサイズ変更検出枠内の画像が、サイズ変更検出枠と同じサイズの顔画像である可能性が高い領域ではないと判定する。

判定部３３は、使用対象画像における基準検出枠内の画像が、基準検出枠と同じサイズの顔画像である可能性が高い領域であると判定すると、当該画像を検出結果領域とし、当該基準検出枠を検出結果枠とする。

また判定部３３は、サイズ変更画像におけるサイズ変更検出枠内の画像が、サイズ変更検出枠と同じサイズの顔画像である可能性が高い領域であると判定すると、当該領域の外形枠である当該サイズ変更枠を仮検出結果枠とする。そして、判定部３３は、仮検出結果枠に基づいて、サイズ変更前の本来のサイズの使用撮像画像において、非基準検出枠と同じサイズの顔画像である可能性が高い領域を特定し、当該領域を検出結果領域とするとともに、当該検出結果領域の外形枠を最終的な検出結果枠とする。

＜基準検出枠を用いた検出処理＞
次に、検出部３が使用撮像画像に対して基準検出枠を移動させながら、当該基準検出枠内の画像が顔画像である可能性が高いかを判定する際の当該検出部３の一連の動作について説明する。図６〜９は、検出部３の当該動作を説明するための図である。検出部３は、基準検出枠をラスタスキャンさせながら、当該基準検出枠内の画像に対して顔画像の検出を行う。本実施の形態では、基準検出枠は、最小サイズの基準枠であり、図３に示されるように最小サイズの基準枠は（ｋ−２）フレーム目の使用撮像画像に対応付けられていることから、基準検出枠が使用される際には、（ｋ−２）フレーム目の使用撮像画像に対して検出処理が行われる。

図６に示されるように、画像切り取り部３０は、基準検出枠１００が対応付けられた使用撮像画像２０（（ｋ−２）フレーム目の使用撮像画像）の左上にまず基準検出枠１００を設定して、当該基準検出枠１００内の画像を切り取る。その後、特徴量抽出部３１は、画像切り取り部３０で切り取られた画像から特徴量を抽出する。基準検出枠のサイズは基準サイズと一致することから、特徴量抽出部３１には基準サイズの画像が入力される。

識別器３２は、特徴量抽出部３１が抽出した特徴量と学習データに基づいて、画像切り取り部３０で切り取られた画像についての検出確度値を求める。判定部３３は、識別器３２で求められた検出確度値がしきい値以上である場合には、画像切り取り部３０で切り取られた画像、つまり使用撮像画像２０での左上の基準検出枠１００内の領域が顔画像である可能性が高いと判定し、当該領域を検出結果領域とし、当該領域の外形枠である当該基準検出枠１００を検出結果枠とする。

次に画像切り取り部３０は、使用撮像画像２０において基準検出枠１００を少し右に移動させる。画像切り取り部３０は、例えば、１ピクセル分あるいは数ピクセル分だけ右に基準検出枠１００を移動させる。そして、画像切り取り部３０は、使用撮像画像２０における移動後の基準検出枠１００内の画像を切り取る。

その後、特徴量抽出部３１は、画像切り取り部３０で切り取られた画像から特徴量を抽出し、識別器３２が当該特徴量と学習データに基づいて、画像切り取り部３０で切り取られた画像についての検出確度値を求める。判定部３３は、識別器３２で求められた検出確度値がしきい値以上である場合には、画像切り取り部３０で切り取られた画像が顔画像である可能性が高いと判定して、当該画像を検出結果領域とするとともに、当該画像の外形枠である、画像切り取り部３０で設定された基準検出枠１００を検出結果枠とする。

その後、検出部３は同様に動作して、図７に示されるように、基準検出枠１００が使用撮像画像２０の右端まで移動すると、検出部３は、右端の基準検出枠１００内の画像についての検出確度値を求める。そして、検出部３は、求めた検出確度値がしきい値以上であれば、右端の基準検出枠１００内の画像を検出結果領域とするとともに、当該右端の基準検出枠１００を検出結果枠とする。

次に、画像切り取り部３０は、図８に示されるように、基準検出枠１００を少し下げつつ使用撮像画像２０の左端に移動させた後、当該基準検出枠１００内の画像を切り取る。画像切り取り部３０は、上下方向（列方向）において例えば１ピクセル分あるいは数ピクセル分だけ下に基準検出枠１００を移動させる。その後、特徴量抽出部３１が、画像切り取り部３０で切り取られた画像から特徴量を抽出し、識別器３２が当該特徴量と学習データに基づいて、画像切り取り部３０で切り取られた画像についての検出確度値を求めて出力する。判定部３３は、識別器３２から出力される検出確度値がしきい値以上である場合には、画像切り取り部３０で切り取られた画像が顔画像である可能性が高いと判定して、当該画像を検出結果領域とするとともに、画像切り取り部３０で設定された基準検出枠１００を検出結果枠とする。

その後、検出部３は同様に動作して、図９に示されるように、基準検出枠１００が使用撮像画像２０の右下まで移動すると、検出部３は、右下の当該基準検出枠１００内の画像についての検出確度値を求める。そして、検出部３は、求めた検出確度値がしきい値以上であれば、右下の基準検出枠１００内の画像を検出結果領域とするとともに、当該右下の基準検出枠を検出結果枠とする。

以上のようにして、検出部３は、基準検出枠を使用して、当該基準検出枠が対応付けられた使用撮像画像において、当該基準検出枠と同じサイズの顔画像である可能性が高い領域を検出結果領域として検出する。

＜非基準検出枠を用いた検出処理＞
検出部３が非基準検出枠を使用して検出処理を行う際には、画像切り取り部３０は、非基準検出枠の大きさが基準サイズ（基準検出枠のサイズ）と一致するように、当該非基準検出枠をサイズ変更する。そして、画像サイズ変更部３４が、非基準検出枠についてのサイズ変更比率と同じだけ、非基準検出枠が対応付けられた使用撮像画像をサイズ変更する。

本実施の形態では、基準サイズは１６ｐ×１６ｐであることから、例えば、大きさがＲｐ×Ｒｐ（Ｒ＞１６）の非基準検出枠が使用される場合、画像切り取り部３０は、当該非基準検出枠の縦幅（上下方向の幅）及び横幅（左右方向の幅）をそれぞれ（１６／Ｒ）倍して当該非基準検出枠を縮小し、サイズ変更検出枠を生成する。そして、画像サイズ変更部３４は、当該非基準検出枠が対応付けられた使用撮像画像の縦幅（ピクセル数）及び横幅（ピクセル数）をそれぞれ（１６／Ｒ）倍して当該使用撮像画像を縮小し、サイズ変更画像を生成する。その後、検出部３は、上述の図６〜９を用いて説明した処理と同様に、サイズ変更画像に対してサイズ変更検出枠を移動させながら、当該サイズ変更検出枠内の画像が、当該サイズ変更検出枠と同じサイズの顔画像である可能性が高いか判定する。つまり、検出部３は、サイズ変更検出枠を用いて、サイズ変更画像において当該サイズ変更検出枠と同じサイズの顔画像である可能性が高い領域を検出する処理を行う。以後、この処理を「サイズ変更版検出処理」と呼ぶ。

検出部３は、サイズ変更版検出処理において、サイズ変更画像に対してサイズ変更検出枠を設定し、当該サイズ変更検出枠内の画像が、当該サイズ変更検出枠と同じサイズの顔画像である可能性が高いと判定すると、当該画像の外形枠である当該サイズ変更検出枠を仮検出結果枠とする。これにより、検出部３では、サイズ変更画像について少なくとも一つの仮検出結果枠が得られる。サイズ変更検出枠のサイズは基準サイズと一致することから、サイズ変更版検出処理においては、基準サイズと一致する画像が特徴量抽出部３１に入力される。

検出部３では、サイズ変更画像について少なくとも一つの仮検出結果枠が得られると、判定部３３が、当該少なくとも一つの仮検出結果枠を、本来のサイズの使用撮像画像に応じた検出結果枠に変換する。

具体的には、判定部３３は、まず、サイズ変更画像に対して、得られた少なくとも一つの仮検出結果枠を設定する。図１０は、サイズ変更画像１２０に対して仮検出結果枠１３０が設定されている様子を示す図である。図１０の例では、サイズ変更画像１２０に対して複数の仮検出結果枠１３０が設定されている。

次に判定部３３は、図１１に示されるように、仮検出結果枠１３０が設定されたサイズ変更画像１２０を拡大（サイズ変更）して元のサイズに戻すことによって、サイズ変更画像１２０を使用撮像画像２０に変換する。これにより、サイズ変更画像１２０に設定された仮検出結果枠１３０も拡大されて、仮検出結果枠１３０は、図１１に示されるように、使用撮像画像２０に応じた検出結果枠１５０に変換される。使用撮像画像２０における検出結果枠１５０内の領域が、使用撮像画像２０において非基準検出枠と同じサイズの顔画像である可能性が高い検出結果領域となる。これにより、検出部３では、サイズ変更版検出処理によって得られた仮検出結果枠１３０に基づいて、使用撮像画像において非基準検出枠と同じサイズの顔画像である可能性が高い検出結果領域が特定される。

このように、検出部３は、非基準検出枠を使用して使用撮像画像についての検出処理を行う際には、サイズが基準サイズと一致するようにサイズ変更した非基準検出枠と、当該非基準検出枠のサイズ変更に応じてサイズ変更した使用撮像画像とを使用してサイズ変更版検出処理を行う。これにより、基準サイズとは異なるサイズの検出枠が使用される場合であっても、特徴量抽出部３１には基準サイズの画像が入力される。そして、検出部３は、サイズ変更版検出処理の結果に基づいて、使用撮像画像において非基準検出枠と同じサイズの顔画像である可能性が高い検出結果領域を特定する。

なお、検出部３は、非基準検出枠を使用して使用撮像画像についての検出処理を行う際には、基準検出枠を使用する場合と同様に、当該非基準検出枠及び当該使用撮像画像をサイズ変更せずに、当該使用撮像画像に対して当該非基準検出枠を移動させながら、当該非基準検出枠内の画像が顔画像である可能性が高いかを判定しても良い。この場合には、画像切り取り部３０は、使用撮像画像に対して非基準検出枠を設定するたびに（非基準検出枠を移動させるたびに）、当該非基準検出枠内の画像のサイズを基準サイズに変更した上で当該画像を特徴量抽出部３１に入力することになる。そのため、使用撮像画像に対して非基準検出枠を設定するたびに画像のサイズ変更処理が必要となる。処理量の低減の観点からは、上記のサイズ変更版検出処理のように、非基準検出枠及び使用撮像画像をサイズ変更した上で処理を行う方が望ましい。

また、非基準検出枠のサイズが、基準検出枠のサイズ（基準サイズ）に対して、縦方向及び横方向のそれぞれで整数倍の場合には、サイズ変更画像を生成する際に、使用撮像画像の縦幅及び横幅のそれぞれを（１／整数）倍とすることができることから、平均化フィルタ等を使用して使用撮像画像を精度良く縮小することができる。よって、非基準検出枠の縦幅及び横幅は、基準検出枠の縦幅及び横幅に対してそれぞれ整数倍であることが望ましい。

また、一つの使用撮像画像に対して対応付けられる複数種類の検出枠については、当該複数種類の検出枠をサイズの小さいものから順に並べた際に、隣り合う２種類の検出枠から成る各組においては、サイズの大きい方の検出枠についての縦幅及び横幅が、サイズが小さい方の検出枠の縦幅及び横幅に対してそれぞれ固定の整数倍であることが望ましい。

例えば、（ｋ−２）フレーム目の使用撮像画像に対して、基準検出枠と、互いにサイズが異なる第１及び第２の非基準検出枠が対応付けられており、基準検出枠、第１の非基準検出枠及び第２の非基準検出枠の順でサイズが小さいものとする。この場合には、第１の非基準検出枠の縦幅及び横幅を、例えば、基準検出枠の縦幅及び横幅に対してそれぞれ２倍（面積で言うと４倍）に設定する。そして、第２の非基準検出枠の縦幅及び横幅を、第１の非基準検出枠の縦幅及び横幅に対してそれぞれ２倍に設定する。

（ｋ−２）フレーム目の使用撮像画像に対して、このようなサイズの複数種類の検出枠が対応付けられている場合には、第１の非基準検出枠を使用して検出処理を行う際に、（ｋ−２）フレーム目の使用撮像画像の縦幅及び横幅を（１／２）倍に設定して、第１の非基準検出枠についてのサイズ変更画像を生成する。そして、第２の非基準検出枠を使用して検出処理を行う際には、（ｋ−２）フレーム目の使用撮像画像を縮小するのではなく、第１の非基準検出枠についてのサイズ変更画像の縦幅及び横幅を（１／２）倍に設定して、第２の非基準検出枠についてのサイズ変更画像を生成する。これにより、同じ縮小倍率の縮小処理を行うことによって、第１及び第２の非基準検出枠についてのサイズ変更画像を生成することができる。

また、（ｋ−１）フレーム目の使用撮像画像に対して、互いにサイズが異なる第３〜第５の非基準検出枠が対応付けられており、第３〜第５の非基準検出枠の順でサイズが小さいものとする。この場合には、第３の非基準検出枠の縦幅及び横幅を、例えば、基準検出枠の縦幅及び横幅に対してそれぞれ３倍（面積で言うと９倍）に設定する。また、第４の非基準検出枠の縦幅及び横幅を、第３の非基準検出枠の縦幅及び横幅に対してそれぞれ３倍に設定する。そして、第５の非基準検出枠の縦幅及び横幅を、第４の非基準検出枠の縦幅及び横幅に対してそれぞれ３倍に設定する。

（ｋ−１）フレーム目の使用撮像画像に対して、このようなサイズの複数種類の検出枠が対応付けられている場合には、第３の非基準検出枠を使用して検出処理を行う際に、（ｋ−１）フレーム目の使用撮像画像の縦幅及び横幅を（１／３）倍に設定して、第３の非基準検出枠についてのサイズ変更画像を生成する。また、第４の非基準検出枠を使用して検出処理を行う際には、（ｋ−１）フレーム目の使用撮像画像を縮小するのではなく、第３の非基準検出枠についてのサイズ変更画像の縦幅及び横幅を（１／３）倍に設定して、第４の非基準検出枠についてのサイズ変更画像を生成する。そして、第５の非基準検出枠を使用して検出処理を行う際には、（ｋ−１）フレーム目の使用撮像画像を縮小するのではなく、第４の非基準検出枠についてのサイズ変更画像の縦幅及び横幅を（１／３）倍に設定して、第５の非基準検出枠についてのサイズ変更画像を生成する。これにより、同じ縮小倍率の縮小処理を行うことによって、第３〜第５の非基準検出枠についてのサイズ変更画像を生成することができる。

また、ｋフレーム目の使用撮像画像に対して、互いにサイズが異なる第６〜第８の非基準検出枠が対応付けられており、第６〜第８の非基準検出枠の順でサイズが小さいものとする。この場合には、第６の非基準検出枠の縦幅及び横幅を、例えば、基準検出枠の縦幅及び横幅に対してそれぞれ５倍（面積で言うと２５倍）に設定する。また、第７の非基準検出枠の縦幅及び横幅を、第６の非基準検出枠の縦幅及び横幅に対してそれぞれ５倍に設定する。そして、第８の非基準検出枠の縦幅及び横幅を、第７の非基準検出枠の縦幅及び横幅に対してそれぞれ５倍に設定する。

ｋフレーム目の使用撮像画像に対して、このようなサイズの複数種類の検出枠が対応付けられている場合には、第６の非基準検出枠を使用して検出処理を行う際に、ｋフレーム目の使用撮像画像の縦幅及び横幅を（１／５）倍に設定して、第６の非基準検出枠についてのサイズ変更画像を生成する。また、第７の非基準検出枠を使用して検出処理を行う際には、ｋフレーム目の使用撮像画像を縮小するのではなく、第６の非基準検出枠についてのサイズ変更画像の縦幅及び横幅を（１／５）倍に設定して、第７の非基準検出枠についてのサイズ変更画像を生成する。そして、第８の非基準検出枠を使用して検出処理を行う際には、ｋフレーム目の使用撮像画像を縮小するのではなく、第７の非基準検出枠についてのサイズ変更画像の縦幅及び横幅を（１／５）倍に設定して、第８の非基準検出枠についてのサイズ変更画像を生成する。これにより、同じ縮小倍率の縮小処理を行うことによって、第６〜第８の非基準検出枠についてのサイズ変更画像を生成することができる。

検出部３は、以上のような検出処理を、使用撮像画像群を構成する複数枚の使用撮像画像のそれぞれについて、当該使用撮像画像に対応付けられた複数種類の検出枠（本例では１０種類の検出枠）のそれぞれを用いて行う。これにより、各使用撮像画像に関して、当該使用撮像画像に対応付けられた複数種類の検出枠のそれぞれに対応して少なくとも一つの検出結果領域（顔画像である可能性が高い領域）及び検出結果枠（顔画像である可能性が高い領域の外形枠）が得られるとともに、各検出結果枠に対応した検出確度値が得られる。使用撮像画像について得られた検出結果枠に対応した検出確度値とは、当該使用撮像画像における当該検出結果枠内の画像が顔画像である確からしさを示している。

＜検出対象画像特定部の動作説明＞
処理対象画像から顔画像が検出される際に使用される使用撮像画像群を構成する複数枚の使用撮像画像については、それらの撮像タイミングを互いに近づけることによって、互いに同じ画像であると考えることができる。

本実施の形態では、撮像部での撮像フレームレートは３０ｆｐｓであって、撮像部で連続して撮像された３枚の撮像画像によって使用撮像画像群が構成されていることから、使用撮像画像の撮像間隔が（１／３０）秒となる。人が歩く速度を５ｋｍ／時間とすると、歩く人が（１／３０）秒の間に移動する距離は数ｃｍ程度となる。つまり、複数枚の使用撮像画像が撮像される間、人の顔はほとんど移動しない。したがって、処理対象画像から人の顔画像を検出するという観点においては、処理対象画像と、それ以外の使用撮像画像とは互いに同じ画像であると見ることができる。よって、使用撮像画像群における、処理対象画像以外の使用撮像画像について求められた検出結果枠は、処理対象画像について求められた検出結果枠と同等であると考えることができる。つまり、処理対象画像以外の使用撮像画像について求められた検出結果枠を処理対象画像に重ねて配置すると、処理対象画像における当該検出結果枠内の画像は、顔画像である可能性が高い画像であると言える。そして、処理対象画像以外の使用撮像画像について求められた検出結果枠についての検出確度値は、当該検出結果枠を処理対象画像に重ねて配置した場合における当該検出結果枠内の画像についての顔画像らしさを示していると言える。

そこで、本実施の形態に係る検出対象画像特定部７は、処理対象画像以外の使用撮像画像について得られた検出結果枠をすべて処理対象画像についての検出結果枠として使用する。つまり、検出対象画像特定部７は、使用撮像画像群について得られた検出結果枠のすべてを処理対象画像についての検出結果枠とする。そして、検出対象画像特定部７は、処理対象画像についての各検出結果枠と、当該各検出結果枠についての検出確度値とに基づいて、処理対象画像において顔画像を特定する。

このように、処理対象画像以外の使用撮像画像について得られた検出結果枠を処理対象画像についての検出結果枠として使用することによって、処理対象画像についての検出処理において、Ｔ種類の検出枠の一部しか使用していないにもかかわらず、Ｔ種類の検出枠のすべてを用いて検出処理を行った際に得られる検出結果枠と同等の検出結果枠を得ることができる。以後、特に断らない限り、検出対象画像特定部７において使用される、処理対象画像についての検出結果枠は、使用撮像画像群について得られた検出結果枠のすべてを意味するものとする。

図１２は、使用撮像画像群を構成する複数枚の使用撮像画像について得られたすべての検出結果枠１５０が処理対象画像２０ａについての検出結果枠として処理対象画像２０ａに重ねて配置された様子を示す図である。

図１２に示されるように、互いにサイズの異なる複数種類の検出枠が使用されて検出処理が行われることによって、様々な大きさの検出結果枠１５０が得られる。これは、処理対象画像２０ａに含まれる様々な大きさの顔画像が検出されていることを意味している。また、図１２に示されるように、得られた検出結果枠１５０が処理対象画像２０ａに重ねられると、一つの顔画像付近に複数の検出結果枠１５０が集中する。つまり、処理対象画像２０ａに含まれる一つの顔画像に対して複数の検出結果枠１５０が得られる。

このように、処理対象画像２０ａに含まれる一つの顔画像に対して複数の検出結果枠１５０が得られることから、このままでは、処理対象画像２０ａに含まれる顔画像の数を特定することが困難である。また、図１２のように検出結果枠１５０が重ねられた処理対象画像２０ａを表示装置に表示したとすると、処理対象画像２０ａ中に含まれる顔画像が複数の検出結果枠１５０で隠れてしまう可能性があり、当該顔画像を識別することが困難となる。

そこで、顔画像付近に集中している複数の検出結果枠１５０を一つの検出結果枠に統合して統合検出結果枠を生成し、一つの顔画像には一つの統合検出結果枠を対応させることが望ましい。

一方で、複数の検出結果枠１５０を適切に統合しないと、統合検出結果枠内に顔画像が適切に収まらず、その結果、顔画像の検出精度が低下する可能性がある。

本実施の形態に係る検出対象画像特定部７は、マップ生成部４が生成する出力値マップを用いて、処理対象画像において顔画像を特定し、その顔画像の外形枠を統合検出結果枠とすることによって、精度の良い統合検出結果枠、つまりその内側に適切に顔画像が収まっている統合検出結果枠を生成する。まず出力値マップの生成処理について説明する。

＜出力値マップ生成処理＞
マップ生成部４は、検出部３での検出結果に基づいて、顔画像としての確からしさ（顔画像らしさ）を示す検出確度値についての処理対象画像での分布を示す出力値マップを生成する。

具体的には、マップ生成部４は、処理対象画像と同様に、行方向にＭ個の値が並び、列方向にＮ個の値が並ぶ、合計（Ｍ×Ｎ）個の値から成るマップ２００を考える。そして、マップ生成部４は、処理対象画像についての一つの検出結果枠を対象検出結果枠とし、対象検出結果枠と同じ位置に、対象検出結果枠と同じ大きさの枠２１０をマップ２００に対して設定する。図１３は、マップ２００に対して枠２１０を設定した様子を示す図である。

次にマップ生成部４は、マップ２００における、枠２１０外の各値については“０”とし、枠２１０内の各値については、対象検出結果枠に対応する検出確度値（対象検出結果枠となった検出枠内の画像に対して顔画像の検出を行った結果得られた検出確度値）を用いて決定する。対象検出結果枠の大きさが、例えば１６ｐ×１６ｐであるとすると、枠２１０内には、行方向に１６個、列方向に１６個、合計２５６個の値が存在する。また、対象検出結果枠の大きさが、例えば２０ｐ×２０ｐであるとすると、枠２１０内には、行方向に２０個、列方向に２０個、合計４００個の値が存在する。図１４は、枠２１０内の各値を決定する方法を説明するための図である。

マップ生成部４は、枠２１０内の中心２１１の値を、検出部３で求められた、対象検出結果枠に対応する検出確度値とする。そして、マップ生成部４は、枠２１０内のそれ以外の複数の値を、枠２１０の中心２１１の値を最大値とした正規分布曲線に従って枠２１０内の中心２１１から外側に向けて値が徐々に小さくなるようにする。これにより、マップ２００を構成する複数の値のそれぞれが決定されて、対象検出結果枠に対応するマップ２００が完成する。

以上のようにして、マップ生成部４は、処理対象画像についての複数の検出結果枠にそれぞれ対応する複数のマップ２００を生成する。言い換えれば、マップ生成部４は、使用撮像画像群を構成する複数枚の使用撮像画像について得られた複数の検出結果枠にそれぞれ対応する複数のマップ２００を生成する。そして、マップ生成部４は、生成した複数のマップ２００を合成して出力値マップを生成する。具体的には、マップ生成部４は、生成した複数のマップ２００のｍ×ｎ番目の値を加算し、それによって得られた加算値を出力値マップのｍ×ｎ番目の検出確度値とする。マップ生成部４は、このようにして、出力値マップを構成する各検出確度値を求める。これにより、処理対象画像での検出確度値の分布を示す出力値マップが完成される。出力値マップを参照すれば、処理対象画像において顔画像らしさが高い領域を特定することができる。つまり、出力値マップを参照することによって、処理対象画像おける顔画像を特定することができる。

図１５は、図１２に示される処理対象画像２０ａについての出力値マップを当該処理対象画像２０ａに重ねて示す図である。図１５では、理解し易いように、検出確度値の大きさを例えば第１段階から第５段階の５段階に分けて出力値マップを示している。図１５に示される出力値マップにおいては、検出確度値が、最も大きい第５段階に属する領域については縦線のハッチングが示されており、２番目に大きい第４段階に属する領域については砂地のハッチングが示されている。また、図１５での出力値マップにおいては、検出確度値が、３番目に大きい第３段階に属する領域については右上がりのハッチングが示されており、４番目に大きい第２段階に属する領域については左上がりのハッチングが示されている。そして、図１５に示される出力値マップにおいては、検出確度値が、最も小さい第１段階に属する領域についてはハッチングが示されていない。

図１５を参照すると、出力値マップでは、処理対象画像２０ａに含まれる各顔画像に対応する領域での検出確度値が高くなっていることが理解できる。

＜極大点探索処理＞
図１５に示されるように、出力値マップにおいては、処理対象画像での顔画像に対応する領域での検出確度値が大きくなる可能性が高い。そして、ミクロな視点で出力値マップを見てみると、出力値マップにおいては、処理対象画像での顔画像に対応する領域での検出確度値のうち、顔画像の中心位置と同じ位置での検出確度値が最も大きくなる可能性が高い。したがって、出力値マップにおいて検出確度値の極大点を探索することによって、顔画像の中心位置を特定することができる。そして、処理対象画像において、特定した極大点（顔画像の中心位置に対応）と同じ位置のピクセルを含む所定領域を顔画像であると決定することによって、処理対象画像中での顔画像を正確に特定することができる。よって、当該所定領域の外形枠を統合検出結果枠とすることによって、精度の良い統合検出結果枠を得ることができる。

ここでは、出力値マップにおいて検出確度値の極大点を探索する方法について説明する。本実施の形態では、極大点探索部５は、例えば、Mean-Shift法を用いて出力値マップでの検出確度値の極大点を探索する。以下に極大点探索部５の動作について詳細に説明する。以後、単に「極大点」と言えば、「出力値マップでの検出確度値の極大点」を意味するものとする。

極大点探索部５は、二次元座標に配置された出力値マップにおいて、検出確度値を重み係数として、処理対象領域内に含まれる複数の検出確度値がそれぞれ存在する複数の位置についての座標値の重み付け平均値を算出し、当該処理対象領域の中心位置が当該重み付け平均値となるように当該処理対象領域を移動させる処理を繰り返すことによって極大点を探索する。本実施の形態では、処理対象画像についての複数の検出結果枠１５０の数と同じ数だけ極大点が求められる。

図１６は極大点の探索方法を説明するための図である。図１６では、二次元座標であるＸＹ座標に出力値マップ３００が配置されている。本実施の形態では、例えば、出力値マップ３００の左上をＸＹ座標の原点Ｏとし、行方向をＸ軸方向とし、列方向をＹ軸方向とする。また極大値の探索の際に移動させる処理対象領域４００の形状を例えば円形とする。

極大点探索部５は、処理対象画像２０ａについての複数の検出結果枠１５０のうちの一つの検出結果枠１５０を対象検出結果枠１５０ｔとする。

次に、極大点探索部５は、出力値マップ３００上を移動させる処理対象領域４００の移動開始位置を決定する。ここで、処理対象画像での検出結果枠１５０内の画像は顔画像である可能性が高いことから、処理対象画像において顔画像の中心は検出結果枠１５０内に存在する可能性が高い。したがって、出力値マップ３００においては、対象検出結果枠１５０ｔと同じ位置の領域内に極大点が存在する可能性が高い。特に本実施の形態では、出力値マップ３００の生成で使用される上述のマップ２００を完成する際には、枠２１０内の中心２１１の値を検出確度値としていることから、出力値マップ３００においては、対象検出結果枠１５０ｔ内の中心位置と同じ位置の近くに極大点が存在する可能性が高い。

そこで、図１６に示されるように、極大点探索部５は、対象検出結果枠１５０ｔ内の所定位置、例えば中心位置と同じ出力値マップ３００での位置４１０を、処理対象領域４００の中心位置の初期位置とする。つまり、極大点探索部５は、極大点の探索を開始する際には、処理対象領域４００の中心位置が、対象検出結果枠１５０ｔ内の中心位置と同じ位置となるように、当該処理対象領域４００を出力値マップ３００に配置する。これにより、極大点をすぐに探索することができる。

なお、処理対象領域４００の大きさは、例えば、出力値マップ３００上に配置された当該処理対象領域４００内において、その中心から半径方向に沿って５０〜６０個の検出確度値が並ぶ程度の大きさとなっている。

次に、極大点探索部５は、ＸＹ座標に配置された出力値マップ３００において、検出確度値を重み係数として、処理対象領域４００内に含まれる複数の検出確度値がそれぞれ存在する複数の位置についての座標値の重み付け平均値（ＸＭ，ＹＭ）を算出する。極大点探索部５は、以下の式（１）を用いて重み付け平均値（ＸＭ，ＹＭ）を算出する。

ここで、式（１）中のＪは、処理対象領域４００内に存在する複数の検出確度値の個数を示している。また、ｉは、処理対象領域４００内の複数の検出確度値のそれぞれに対して付された番号を示している。そして、ｖｉは、ｉ番の検出確度値を意味しており、（Ｘｉ，Ｙｉ）は、ＸＹ座標に配置された出力値マップ３００においてｉ番の検出確度値が存在する位置についてのＸＹ座標値を示している。

極大点探索部５は、重み付け平均値（ＸＭ，ＹＭ）を求めると、処理対象領域４００の中心位置のＸＹ座標が当該重み付け平均値（ＸＭ，ＹＭ）となるように処理対象領域４００を移動させる。図１６の矢印は、処理対象領域４００が移動する様子を示している。

次に極大点探索部５は、処理対象領域４００の移動距離（シフト量）がしきい値未満であるかを判定する。処理対象領域４００の移動距離は、移動前の処理対象領域４００の中心位置と移動後の処理対象領域４００の中心位置との間の距離を求めることによって得られる。極大点探索部５は、処理対象領域４００の移動距離がしきい値以上であると判定すると、移動後の処理対象領域４００内に含まれる複数の検出確度値がそれぞれ存在する複数の位置についての座標値の重み付け平均値（ＸＭ，ＹＭ）を式（１）を用いて算出する。そして、極大点探索部５は、処理対象領域４００の中心位置のＸＹ座標が、新たに求めた重み付け平均値（ＸＭ，ＹＭ）となるように当該処理対象領域４００をさらに移動させる。

一方で、極大点探索部５は、処理対象領域４００の移動量がしきい値未満であると判定すると、処理対象領域４００の移動量が収束したと判断して、処理対象領域４００の移動を終了する。そして、極大点探索部５は、現在の処理対象領域４００の中心位置を極大点とする。これより、対象検出結果枠１５０の位置付近での極大点が求められる。

以上のようにして、極大点探索部５は、処理対象画像についての複数の検出結果枠１５０のそれぞれについて、当該検出結果枠１５０の位置付近での極大点を求める。

なお、極大点探索部５は、重み付け平均値（ＸＭ，ＹＭ）を算出する際には、検出確度値が間引かれた出力値マップ３００を用いても良い。言い換えれば、極大点探索部５は、重み付け平均値（ＸＭ，ＹＭ）を算出する際には、出力値マップ３００において処理対象領域４００内に含まれる複数の検出確度値のすべてを用いなくても良い。

図１７は、検出確度値が間引かれた出力値マップ３００の一例を示す図である。図１７の例では、出力値マップ３００が、行方向（Ｘ軸方向）に等間隔で並ぶ複数の分割線５００と列方向（Ｙ軸方向）に等間隔で並ぶ複数の分割線５１０とによって格子状に分割されている。そして、出力値マップ３００においては、格子交点（分割線５００，５１０の交点）に存在する検出確度値以外の検出確度値が削除されている。これにより、出力値マップ３００においては、検出確度値が、列方向においてＰ個（Ｐ≧２）ごとに（Ｐ−１）個間引かれ、行方向においてＱ個（Ｑ≧２）ごとに（Ｑ−１）個間引かれる。図１７中の丸印は、検出確度値が間引かれた出力値マップ３００に存在する検出確度値を示している。

図１７に示される出力値マップ３００では、図１５での出力値マップと同様に、検出確度値の大きさが例えば第１段階から第５段階の５段階に分けられて各検出確度値が示されている。図１７での出力値マップ３００では、最も大きい第５段階に属する検出確度値を示す丸印には横線のハッチングが示されており、２番目に大きい第４段階に属する検出確度値を示す丸印には縦線のハッチングが示されている。また、図１７での出力値マップ３００では、３番目に大きい第３段階に属する検出確度値を示す丸印には右上がりのハッチングが示されており、４番目に大きい第２段階に属する検出確度値を示す丸印には左上がりのハッチングが示されている。そして、図１７に示される出力値マップ３００では、最も小さい第１段階に属する検出確度値を示す丸印にはハッチングが示されていない。

極大点探索部５は、重み付け平均値（ＸＭ，ＹＭ）を算出する場合に、図１７に示されるような、検出確度値が間引かれた出力値マップ３００を用いる際には、当該出力値マップ３００において処理対象領域４００内に含まれる複数の検出確度値がそれぞれ存在する複数の位置についてのＸＹ座標値と当該複数の検出確度値を上記の式（１）に代入する。これにより、重み付け平均値（ＸＭ，ＹＭ）を算出する際に使用される検出確度値の数が低減する。さらに、処理対象領域４００の移動量が収束するまでに必要な、重み付け平均値（ＸＭ，ＹＭ）の算出回数も低減する。よって、極大点を探索する処理の負荷が軽減される。

＜極大点統合処理＞
上述の説明から理解できるように、極大点探索部５では、互いに位置が異なる複数の極大点が求められることがある。出力値マップにおいて、互いに近くに位置している複数の極大点については、同じ顔画像の中心を示している可能性が高い。一方で、互いに離れて位置している複数の極大点については、別々の顔画像の中心を示している可能性が高い。

そこで、検出対象画像決定部６は、極大点探索部５で求められた極大点を用いて、処理対象画像において顔画像を特定する際には、まず、極大点探索部５で求められた、互いに近くに位置している複数の極大点を一つの極大点に統合する。以下に、互いに近くに位置する複数の極大点の統合方法の一例について説明する。

検出対象画像決定部６は、検出部３が検出処理において検出枠を処理対象画像の左上から右下にかけて移動させる場合と同様に、出力値マップを左上から右下にかけて見ていき（ラスタスキャンの方向に見ていき）、極大点探索部５で求められた極大点が現れると、当該極大点を基準点として、当該基準点と次に現れる極大点との間の距離を求める。そして、検出対象画像決定部６は、求めた距離がしきい値未満であれば、基準点を残して、後に現れた極大点を削除する。一方で、検出対象画像決定部６は、求めた距離がしきい値以上であれば、現在の基準点を残しつつ、後に現れた極大点を新たな基準点とする。

極大点の統合で使用されるしきい値については、どの程度の大きさの顔画像を検出すべきかに応じて決定される。例えば、本画像検出装置１が監視カメラシステムで使用される場合であって、カメラから比較的近いエリアを監視するのであれば、比較的大きい顔画像を検出することになるため、しきい値としては大きな値が使用される。また、本画像検出装置１が監視カメラシステムで使用される場合であって、カメラから比較的遠いエリアを監視するのであれば、比較的小さい顔画像を検出することになるため、しきい値としては小さな値が使用される。本例では、しきい値は、例えば、処理対象画像での５ピクセル分の距離に設定される。なお、しきい値は、ユーザによって調整可能（書き替え可能）とすることが好ましい。

検出対象画像決定部６は、求めた距離がしきい値未満であれば、現在の基準点を残して、後に現れた極大点を削除し、その後、現在の基準点と削除した極大点の次に現れる極大点との間の距離と、しきい値とを比較する。また、検出対象画像決定部６は、求めた距離がしきい値以上であり、後に現れた極大点を新たな基準点とすると、その新たな基準点の次に現れる極大点と当該新たな基準点との間の距離と、しきい値とを比較する。

以後、検出対象画像決定部６は同様に動作して、最後に現れる極大点と基準点との間の距離がしきい値未満の場合には、最後に現れる極大点を削除して、極大点の統合処理を終了する。一方で、検出対象画像決定部６は、最後に現れる極大点と基準点との間の距離がしきい値以上の場合には、最後に現れる極大点を削除せずに、極大点の統合処理を終了する。検出対象画像決定部６は、極大点の統合処理の終了後に残った少なくとも一つの極大点を使用して、処理対象画像において顔画像を特定する。

なお、上記の例では、基準点と後に現れた極大点との間の距離がしきい値未満であれば、基準点及び後に現れた極大点のうち基準点だけを残していたが、基準点及び後に現れた極大点のうち、その位置での検出確度値が大きい方の極大点だけを残しても良い。これにより、極大点の統合処理の終了後に残った極大点が、顔画像の中心位置を示す可能性が高くなる。

＜顔画像決定処理＞
検出対象画像決定部６は、極大点の統合処理が終了すると、その後に残った各極大点について、処理対象画像において当該極大点と同じ位置のピクセルを含む所定領域を顔画像（検出対象画像）であると決定する。そして、検出対象画像決定部６は、顔画像であると決定した当該所定領域の外形枠を統合後検出結果枠とする。以後、顔画像であると決定される当該所定領域を「検出画像領域」と呼ぶ。また、説明の対象の極大点を「対象極大点」と呼ぶことがある。

ここで、出力値マップでの顔画像に対応する領域においては、当該顔画像の中心位置と同じ位置での検出確度値が大きくなり、当該同じ位置から離れるにつれて検出確度値が小さくなる可能性が高い。そして、出力値マップにおいては、顔画像に対応する領域以外の領域では、検出確度値が零あるいは非常に小さくなる可能性が高い。したがって、出力値マップでは、ある顔画像の中心位置に相当する極大点から、当該顔画像の端に相当する位置に向かうにつれて、検出確度値が小さくなる可能性が高い。言い換えれば、出力値マップでは、ある顔画像の中心位置に相当する極大点から、当該顔画像の端に相当する位置に向かうにつれて、検出確度値が単調減少する可能性が高い。

図１８は、出力値マップでの対象極大点７００付近の検出確度値の分布の一例を示すグラフである。図１８では、対象極大点７００を中心とした左右方向の検出確度値の分布が示されている。また図１８では、縦軸は検出確度値を示しており、横軸は出力値マップ３００での左右方向の位置を示している。図１８に示されるように、検出確度値は、対象極大点７００から右方向ＤＲ１に向かうにつれて小さくなっている（単調減少している）。また、検出確度値は、対象極大点７００から左方向ＤＲ２に向かうにつれて小さくなっている（単調減少している）。

本実施の形態では、このような点に鑑みて、検出対象画像決定部６は、出力値マップにおいて、対象極大点７００から離れる方向に沿って対象極大点７００から検出確度値を見ていった際に、検出確度値が、対象極大点７００での検出確度値に対して最初に（１／Ｚ）倍以下（Ｚ＞１）となる位置と同じ処理対象画像での位置を検出画像領域の端とすることによって、顔画像の端を特定する。これにより、処理対象画像に含まれる顔画像の端を正確に特定することができる。

また、撮像部の撮像エリアにおいて複数の顔が前後に存在するなどして、処理対象画像において、複数の顔画像が互いに接している場合には、対象極大点７００から離れる方向に沿って対象極大点７００から検出確度値を見ていった際に、検出確度値が、対象極大点７００での検出確度値に対して（１／Ｚ）倍以下となる位置が現れる前に、検出確度値の変化が単調減少でなくなる可能性がある。このような場合には、検出確度値の変化が単調減少でなくなった位置と同じ処理対象画像での位置が、顔画像の端である可能性が高い。

そこで、検出対象画像決定部６は、出力値マップ３００において、対象極大点７００から離れる方向に沿って対象極大点７００から検出確度値を見ていった際に、検出確度値が、対象極大点７００での検出確度値に対して（１／Ｚ）倍以下となる位置が現れる前に、検出確度値の変化が単調減少でなくなったと判断すると、当該変化が単調減少でなくなったと判断した位置と同じ処理対象画像での位置を、検出画像領域の端とする。これにより、複数の顔画像が接している場合であっても、当該複数の顔画像のそれぞれを個別に特定することができる。以下に検出対象画像決定部６の動作について詳細に説明する。

図１９は、処理対象画像において対象極大点７００と同じ位置のピクセルを含む検出画像領域６００（以後、「対象検出画像領域６００」と呼ぶ）の決定方法を説明するための図である。図１９では出力値マップ３００が拡大して示されている。また図１９では、出力値マップ３００に対して対象検出画像領域６００の外形枠６００ａが重ねられて示されている。

本実施の形態では、検出画像領域の形状は例えば四角形に設定される。検出対象画像決定部６は、四角形の検出画像領域の右側端、左側端、上側端及び下側端を決定することによって、当該検出画像領域を決定する。

まず、検出対象画像決定部６が対象検出画像領域６００の右側端６１０を決定する際の当該検出対象画像決定部６の動作について説明する。図２０は当該動作を示すフローチャートである。

検出対象画像決定部６は、図１９に示されるように、出力値マップ３００において、対象極大点７００から右方向ＤＲ１に沿って検出確度値８００（丸印で示されている）を見ていって（抽出していって）、ペアを変えながら前後２つの検出確度値８００を比較し、その比較結果に基づいて対象検出画像領域６００の右側端６１０を決定する。このとき、検出対象画像決定部６は、検出確度値８００を一つずつ見ていっても良いし、一つ置きに見ていっても良いし、複数個置きに見ていっても良い。本例では、検出対象画像決定部６は、検出確度値８００を一つずつ見ていくものとする。

具体的に説明すると、図２０に示されるように、検出対象画像決定部６は、ステップｓ１１において、対象極大点７００での検出確度値８００（図１９に示される検出確度値８００ａ）を第１の確度値ｖ１とし、その右側の検出確度値８００を第２の確度値ｖ２とする。そして、ステップｓ１２において、検出対象画像決定部６は（ｖ１−ｖ２）を求めて、第１の確度値ｖ１と第２の確度値ｖ２を比較する。

次にステップｓ１３において、検出対象画像決定部６は、ｖ１とｖ２の比較結果が、（ｖ１−ｖ２）＜０であるかを判断する。検出対象画像決定部６は、（ｖ１−ｖ２）＜０でないと判断した場合には、検出確度値８００が単調減少していると判断して、ステップｓ１４を実行する。ステップｓ１４において、検出対象画像決定部６は、第２の確度値ｖ２が、対象極大点７００での検出確度値８００の（１／Ｚ）倍以下であるか判断する。Ｚについては、例えば３≦Ｚ≦５に設定される。検出対象画像決定部６は、第２の確度値ｖ２が、対象極大点７００での検出確度値８００ａの（１／Ｚ）倍以下であると判断すると、ステップｓ１５において、出力値マップ３００において第２の確度値ｖ２が存在する位置７１０（図１８，１９参照）と同じ処理対象画像での位置を、対象検出画像領域６００の右側端６１０とする。この位置７１０は、出力値マップ３００において、対象極大点７００から右方向ＤＲ１に沿って検出確度値８００を見ていった際に、検出確度値８００が、対象極大点７００での検出確度値８００ａに対して最初に（１／Ｚ）倍以下となる位置である。

一方でステップｓ１４において、検出対象画像決定部６は、第２の確度値ｖ２が、対象極大点７００での検出確度値８００ａの（１／Ｚ）倍以下ではないと判断すると、ステップｓ１１において、現在の第２の確度値ｖ２を新たな第１の確度値ｖ１とし、その右側の検出確度値８００を新たな第２の確度値ｖ２とする。その後、検出対象画像決定部６は同様に動作する。

またステップｓ１３において、検出対象画像決定部６は、ｖ１とｖ２の比較結果が、（ｖ１−ｖ２）＜０であると判断した場合には、ステップｓ１６を実行する。ステップｓ１６において、検出対象画像決定部６は、今回の比較結果も含めて（ｖ１−ｖ２）＜０という比較結果が連続して所定回数Ｃ（Ｃ≧２）だけ発生したかを判断する。つまり、検出対象画像決定部６は、出力値マップ３００において、対象極大点７００から右方向ＤＲ１に沿って、ペアを変えながら前後２つの検出確度値８００を比較していく際に、前の検出確度値８００が後の検出確度値８００よりも小さいという比較結果が連続して所定回数Ｃだけ発生したかを判断する。所定回数Ｃについては、例えばＣ＝２に設定される。

ステップｓ１６において、検出対象画像決定部６は、（ｖ１−ｖ２）＜０という比較結果が連続して所定回数Ｃだけ発生したと判断すると、検出確度値が、対象極大点７００での検出確度値に対して（１／Ｚ）倍以下となる位置が現れる前に、検出確度値の変化が単調減少でなくなったと判断して、ステップｓ１５を実行して、現在の第２の確度値ｖ２が存在する位置７１０と同じ処理対象画像での位置を、対象検出画像領域６００の右側端６１０とする。この位置７１０は、検出対象画像決定部６が、出力値マップ３００において、対象極大点７００から右方向ＤＲ１に沿って検出確度値８００を見ていった際に、検出確度値８００が、対象極大点７００での検出確度値８００ａに対して（１／Ｚ）倍以下となる位置が現れる前に、検出確度値の変化が単調減少でなくなったと判断した位置となる。

一方で、ステップｓ１６において、検出対象画像決定部６は、（ｖ１−ｖ２）＜０という比較結果が連続して所定回数Ｃだけ発生したと判断しない場合には、ステップｓ１１において、現在の第２の確度値ｖ２を新たな第１の確度値ｖ１とし、その右側の検出確度値８００を新たな第２の確度値ｖ２とする。その後、検出対象画像決定部６は同様に動作する。

このようにして、検出対象画像決定部６は、対象検出画像領域６００の右側端６１０を決定する。

同様にして、検出対象画像決定部６は、対象検出画像領域６００の左側端６２０を決定する際には、図１９に示されるように、出力値マップ３００において、対象極大点７００から左方向ＤＲ２に沿って検出確度値８００を見ていって、ペアを変えながら前後２つの検出確度値８００を比較し、その比較結果に基づいて対象検出画像領域６００の左側端６２０を決定する。対象検出画像領域６００の右側端６１０及び左側端６２０が決定されると、対象検出画像領域６００の左右方向（行方向）の幅Ｗ１（図１８，１９参照）が決定される。

また、検出対象画像決定部６は、対象検出画像領域６００の上側端６３０を決定する際には、図１９に示されるように、出力値マップ３００において、対象極大点７００から上方向ＤＲ３に沿って検出確度値８００を見ていって、ペアを変えながら前後２つの検出確度値８００を比較し、その比較結果に基づいて対象検出画像領域６００の上側端６３０を決定する。そして、検出対象画像決定部６は、対象検出画像領域６００の下側端６４０を決定する際には、図１９に示されるように、出力値マップ３００において、対象極大点７００から下方向ＤＲ４に沿って検出確度値８００を見ていって、ペアを変えながら前後２つの検出確度値８００を比較し、その比較結果に基づいて対象検出画像領域６００の下側端６４０を決定する。対象検出画像領域６００の上側端６３０及び下側端６４０が決定されると、対象検出画像領域６００の上下方向（列方向）の幅Ｗ２（図１９参照）が決定される。

このようにして、検出対象画像決定部６は、四角形の検出画像領域の右側端、左側端、上側端及び下側端を決定することによって、当該検出画像領域の位置及び大きさを決定する。そして、検出対象画像決定部６は、決定した検出画像領域の外形枠を、統合後検出結果枠とする。処理対象画像領域での統合後検出結果枠内の画像が、顔画像であると決定された検出画像領域となる。

検出対象画像決定部６は、極大点の統合処理が終了した後に残った各極大点について、当該極大点に対応する検出画像領域（処理対象画像での顔画像）を決定するとともに、当該検出画像領域の外形枠を統合後検出結果枠とする。これにより、処理対象画像に含まれる各顔画像に関して、一つ顔画像に対して一つの統合後検出結果枠が求められる。

なお、検出対象画像決定部６は、求めた検出画像領域の大きさがあまりにも小さい場合には、当該検出画像領域は顔画像ではないとして、当該検出画像領域を削除しても良い。言い換えれば、検出対象画像決定部６は、求めた統合後検出結果枠の大きさがあまりにも小さい場合には、当該統合後検出結果枠内の画像は顔画像ではないとして、当該統合後検出結果枠を削除しても良い。

図２１は、図１２，１５に示される処理対象画像２０ａに関して、検出対象画像決定部６で求められた検出画像領域６００及び統合後検出結果枠９００（検出画像領域６００の外形枠６００ａ）を示す図である。図２１では、検出画像領域６００及び統合後検出結果枠９００が処理対象画像２０ａに重ねて示されている。

図２１に示されるように、処理対象画像２０ａに含まれる各顔画像に対して、おおよそ一つの検出画像領域６００が求められている。つまり、処理対象画像２０ａに含まれる各顔画像に対して、おおよそ一つの統合後検出結果枠９００が求められている。これは、一つの顔画像に対して求められた複数の検出結果枠１５０（図１２参照）が統合されて、当該一つの顔画像に対して一つの統合後検出結果枠９００が求められたことを意味している。そして、各統合後検出結果枠９００内には顔画像が適切に収まっている。よって、本実施の形態に係る画像検出装置１では、適切に顔画像が検出されていると言える。

このように、本実施の形態では、検出対象画像としての確からしさを示す検出確度値についての処理対象画像での分布を示す出力値マップでの検出確度値の極大点と同じ当該処理対象画像での位置のピクセルを含む所定領域が当該検出対象画像であると決定されている。出力値マップでの検出確度値の極大点は、処理対象画像での検出対象画像の中心位置に対応すると考えられることから、処理対象画像において、当該極大点と同じ位置でのピクセルを含む所定領域を検出対象画像あると決定することによって、当該処理対象画像から当該検出対象画像を精度良く検出することができる。つまり、検出対象画像についての検出精度を向上することができる。

なお、上記の例では、ノイズの影響により、単調減少でなくなったと誤って判断することを抑制するためにステップｓ１６を実行しているが、ステップｓ１６は実行しなくても良い。この場合には、ステップｓ１３において、（ｖ１−ｖ２）＜０であると判断されると、ステップｓ１５が実行されることになる。つまり、（ｖ１−ｖ２）＜０という比較結果が１回でも得られると、検出確度値が、対象極大点７００での検出確度値に対して（１／Ｚ）倍以下となる位置が現れる前に、検出確度値の変化が単調減少でなくなったと判断されて、ステップｓ１５が実行される。

また、画像検出装置１は、処理対象画像を表示装置で表示する際に、図２１に示されるように、当該処理対象画像に対して統合後検出結果枠９００（検出画像領域６００の外形枠６００ａ）を重ねて表示しても良い。

また、画像検出装置１は、予め登録された顔画像と、処理対象画像において顔画像であると判断された検出画像領域６００（統合後検出結果枠９００内の画像）とを比較し、両者が一致するか否かを判定しても良い。そして、画像検出装置１は、予め登録された顔画像と、処理対象画像での検出画像領域６００とが一致しない場合には、当該検出画像領域６００に対してモザイク処理を行った上で、当該処理対象画像を表示装置に表示しても良い。これにより、本実施の形態に係る画像検出装置１を監視カメラシステムに使用した場合において、監視カメラによって隣家の人の顔画像が撮影された場合であっても、当該顔画像を認識できないようにすることができる。つまり、プライバシーマスクを実現することができる。

以上のように、本実施の形態では、使用撮像画像群を構成する、処理対象画像を含むＫ枚の使用撮像画像に対してＴ種類の検出枠が分散して対応付けられていることから、処理対象画像に対してはＴ種類よりも少ない種類の検出枠が対応付けられる。したがって、処理対象画像については、Ｔ種類よりも少ない種類の検出枠が使用されて検出処理が行われる。よって、処理対象画像から顔画像が検出される際に、処理対象画像だけが使用され、処理対象画像についてＴ種類の検出枠が使用されて検出処理が行われる場合と比較して、処理対象画像についての処理量を低減することができる。

処理対象画像についての処理量を低減することによって様々な効果を得ることができる。例えば、画像検出装置１において、撮像部で撮像される各撮像画像（各フレーム画像）が処理対象画像とされる場合には、つまり、撮像部で撮像される各撮像画像に対して顔画像の検出が行われる際には、各撮像画像についての処理量を低減することができる。よって、画像検出装置１で行われる、顔画像の検出の処理量を低減することができる。

上記の例では、処理対象画像については、Ｔ種類の検出枠のうち（Ｔ／３）種類の検出枠だけが使用されるため、各撮像画像が処理対象画像とされる場合には、各撮像画像については（Ｔ／３）種類の検出枠だけが使用されることになる。よって、各撮像画像についてＴ種類の検出枠のすべてが使用される場合と比較して、検出部３での処理量が（１／３）倍となり、当該処理量を低減することができる。

また、画像検出装置１において、撮像部で撮像される撮像画像がＵ枚（Ｕ＞Ｋ）ごとに処理対象画像とされる場合において、つまり、撮像部でＫ枚以上の撮像画像が得られるたびに、撮像画像から顔画像の検出が行われる場合において、本実施の形態とは異なり、処理対象画像についてＴ種類の検出枠のすべてが使用されて検出処理が行われるとすると、撮像部で得られる撮像画像のうち処理対象画像だけ処理量が非常に大きくなる。これに対して、本実施の形態のように、Ｔ種類の検出枠が用いられる検出処理が、Ｋ枚の使用撮像画像に分散して行われることによって、処理対象画像だけ処理量が大きくなることを抑制することができる。よって、撮像画像間での処理量の差異を低減することができる。

なお上記の例では、Ｋ＝３としたが、Ｋ＝２であっても良いし、Ｋ≧４であっても良い。また、上記の例では、使用撮像画像群を構成するＫ枚の使用撮像画像のうち、最後に撮像された使用撮像画像を処理対象画像としたが、他の使用撮像画像を処理対象画像としても良い。例えば、使用撮像画像群を構成するＫ枚の使用撮像画像のうち最初に撮像された使用撮像画像を処理対象画像としても良い。

＜各種変形例＞
以下に、使用撮像画像群が（ｋ−２）フレーム目、（ｋ−１）フレーム目及びｋフレーム目の使用撮像画像で構成されている場合を例に挙げて、本実施の形態についての各種変形例について説明する。

＜第１変形例＞
使用撮像画像群を構成する複数枚の使用撮像画像については互いに近いタイミングで撮像されているものの、処理対象画像とその他の使用撮像画像との間には多少の差異が存在する。したがって、顔画像の検出精度を向上させるという点だけを考慮すると、処理対象画像に対しては、できるだけ多くの種類の検出枠が使用されて検出処理が行われることが望ましい。

そこで、本変形例では、検出部３は、使用撮像画像群を構成する複数枚の使用撮像画像における、処理対象画像以外の使用撮像画像について、当該使用撮像画像に対応付けられている検出枠を用いて検出処理を行った結果、当該使用撮像画像において、当該検出枠と同じサイズの顔画像である可能性が非常に高い領域が存在する場合には、処理対象画像についても当該検出枠を用いて検出処理を行う。

例えば、検出部３は、（ｋ−２）フレーム目の使用撮像画像について得られた少なくとも一つの検出結果枠において、それに対応する検出確度値がしきい値以上の検出結果枠が含まれているかを判定する。ここでのしきい値（以後、「第２のしきい値」と呼ぶ）は、判定部３３において検出結果枠が特定される際に使用されるしきい値（以後、「第１のしきい値」と呼ぶ）よりも大きい値となっている。

検出部３は、（ｋ−２）フレーム目の使用撮像画像について、それに対応する検出確度値が第２のしきい値以上の検出結果枠を特定すると、（ｋ−２）フレーム目の使用撮像画像における、当該検出結果枠内の画像を、（ｋ−２）フレーム目の使用撮像画像において、当該検出結果枠と同じサイズの顔画像である可能性が非常に高い領域であると判断する。つまり、検出部３は、（ｋ−２）フレーム目の使用撮像画像について、それに対応する検出確度値が第２のしきい値以上の検出結果枠を特定すると、（ｋ−２）フレーム目の使用撮像画像において、当該検出結果枠に対応する検出枠（当該検出結果枠と同じサイズの検出枠）と同じサイズの顔画像である可能性が非常に高い領域が存在すると判断する。そして、検出部３は、（ｋ−２）フレーム目の使用撮像画像についての、検出確度値が第２のしきい値以上の検出結果枠に対応する検出枠を用いて処理対象画像に対して検出処理を行う。

このように、検出部３は、（ｋ−２）フレーム目の使用撮像画像について、それに対応付けられている検出枠を用いて検出処理を行った結果、検出確度値が第２のしきい値以上の検出結果枠が得られると、（ｋ−２）フレーム目の使用撮像画像において、当該検出枠と同じサイズの顔画像である可能性が非常に高い領域が存在すると判断して、処理対象画像についても当該検出枠を用いて検出処理を行う。検出対象画像特定部７では、この検出処理によって得られた検出結果枠及び検出確度値も用いられて、処理対象画像中の顔画像が特定される。

同様にして、検出部３は、（ｋ−１）フレーム目の使用撮像画像について、それに対応付けられている検出枠を用いて検出処理を行った結果、検出確度値が第２のしきい値以上の検出結果枠が得られると、（ｋ−１）フレーム目の使用撮像画像において、当該検出枠と同じサイズの顔画像である可能性が非常に高い領域が存在すると判断して、処理対象画像についても当該検出枠を用いて検出処理を行う。検出対象画像特定部７では、この検出処理によって得られた検出結果枠及び検出確度値も用いられて、処理対象画像中の顔画像が特定される。

このように、本変形例では、処理対象画像以外の使用撮像画像について、当該使用撮像画像に対応付けられている検出枠が用いられて検出処理が行われた結果、当該使用撮像画像において、当該検出枠と同じサイズの顔画像である可能性が非常に高い領域が存在する場合には、処理対象画像についても当該検出枠が用いられて検出処理が行われる。したがって、処理対象画像において顔画像が特定される際に、当該検出処理の結果も使用されることによって、顔画像が精度良く特定される。よって、顔画像の検出精度が向上する。

＜第２変形例＞
上述の図１２に示されるように、使用撮像画像群を構成する複数枚の使用撮像画像について得られたすべての検出結果枠１５０が処理対象画像２０ａについての検出結果枠として処理対象画像２０ａに重ねて配置されると、一つの顔画像付近に複数の検出結果枠１５０が集中する。つまり、一つの顔画像付近には、使用撮像画像群を構成する複数枚の使用撮像画像について得られた検出結果枠１５０が集中することになる。したがって、検出結果枠１５０が重ねられた処理対象画像２０ａにおいて、検出結果枠１５０が存在する領域であっても、複数枚の使用撮像画像において、その領域と重なる検出結果枠１５０が得られた使用撮像画像の数が少ない場合には、当該領域が顔画像である可能性は低い。よって、当該領域と重なる検出結果枠１５０に対応する検出結果領域は、顔画像である可能性が高いと誤って判定された領域であると考えることができる。したがって、当該領域と重なる検出結果枠１５０については、処理対象画像において検出対象画像が特定される際に使用されない方が好ましい。

そこで、本変形例では、検出対象画像特定部７は、図１２のように検出結果枠１５０が重ねられた処理対象画像２０ａを複数のブロックに分割する。そして、検出対象画像特定部７は、複数のブロックにおける、検出結果枠１５０と重なるブロックについて、複数枚の使用撮像画像のうち、当該ブロックと重なる検出結果枠１５０が得られた使用撮像画像の数がしきい値以下である場合には、当該ブロックと重なる検出結果枠１５０を使用せずに、処理対象画像２０ａにおいて顔画像を特定する。本変形例では、検出対象画像特定部７は、検出結果枠１５０と重なるブロックについて、複数枚の使用撮像画像のうち、当該ブロックと重なる検出結果枠１５０が得られた使用撮像画像の数が、例えば１以下、つまり１である場合には、当該ブロックと重なる検出結果枠１５０を使用せずに、処理対象画像２０ａにおいて顔画像を特定する。以下に、本変形例について具体的に説明する。以下の説明では、ｋフレーム目の使用撮像画像について得られた検出結果枠１５０を「検出結果枠１５０ａ」とし、（ｋ−１）フレーム目の使用撮像画像について得られた検出結果枠１５０を「検出結果枠１５０ｂ」とし、（ｋ−２）フレーム目の使用撮像画像について得られた検出結果枠１５０を「検出結果枠１５０ｃ」とする。

図２２は、検出結果枠１５０が重ねられた処理対象画像２０ａが複数のブロック９５０に分割されている様子の一例を示す図である。図２２の例では、処理対象画像２０ａが、行方向に９個のブロック９５０に分割され、列方向に７個のブロック９５０に分割されている。なお、処理対象画像２０ａの分割方法はこの限りではない。

複数のブロック９５０のうちのあるブロック９５０ａにおいては、検出結果枠１５０ａと、検出結果枠１５０ｂと、検出結果枠１５０ｃとが重なっている。したがって、ブロック９５０ａについては、使用撮像画像群を構成する３枚の使用撮像画像のうち、当該ブロック９５０ａと重なる検出結果枠１５０が得られた使用撮像画像の数は“３”であり、しきい値“１”よりも大きくなっている。したがって、検出対象画像特定部７は、ブロック９５０ａに重なっている検出結果枠１５０のすべてを、処理対象画像２０ａにおいて顔画像を特定する際に使用する。

また、複数のブロック９５０のうちのブロック９５０ｂにおいては、検出結果枠１５０ａと検出結果枠１５０ｂとが重なっている。したがって、ブロック９５０ｂについては、使用撮像画像群を構成する３枚の使用撮像画像のうち、当該ブロック９５０ｂと重なる検出結果枠１５０が得られた使用撮像画像の数は“２”であり、しきい値“１”よりも大きくなっている。したがって、検出対象画像特定部７は、ブロック９５０ｂに重なっている検出結果枠１５０のすべてを、処理対象画像２０ａにおいて顔画像を特定する際に使用する。

一方で、複数のブロック９５０のうちのブロック９５０ｃにおいては、検出結果枠１５０ａだけが重なっている。したがって、ブロック９５０ｃについては、使用撮像画像群を構成する３枚の使用撮像画像のうち、当該ブロック９５０ｂと重なる検出結果枠１５０が得られた使用撮像画像の数は“１”であり、しきい値“１”以下となっている。したがって、検出対象画像特定部７は、ブロック９５０ｃに重なっている検出結果枠１５０について、ノイズの影響を受けて誤って取得された検出結果枠１５０であると判断して、処理対象画像２０ａにおいて顔画像を特定する際に使用しない。

図２２の例では、ブロック９５０ａには、一つの検出結果枠１５０ａと、一つの検出結果枠１５０ｂと、一つの検出結果枠１５０ｃとが重なっているが、実際には、複数の検出結果枠１５０ａと、複数の検出結果枠１５０ｂと、複数の検出結果枠１５０ｃとが重なる可能性が高い。同様に、ブロック９５０ｂには、一つの検出結果枠１５０ａと、一つの検出結果枠１５０ｂとが重なっているが、実際には、複数の検出結果枠１５０ａと、複数の検出結果枠１５０ｂとが重なる可能性が高い。同様に、ブロック９５０ｃには、一つの検出結果枠１５０ａが重なっているが、実際には、複数の検出結果枠１５０ａが重なる可能性が高い。ブロック９５０ｃに複数の検出結果枠１５０ａが重なっている場合であっても、使用撮像画像群を構成する３枚の使用撮像画像のうち、ブロック９５０ｂと重なる検出結果枠１５０が得られた使用撮像画像の数は“１”であることから、ブロック９５０ａに重なる複数の検出結果枠１５０ａのすべてが、処理対象画像２０ａにおいて顔画像を特定する際に使用されない。

このように、本変形例では、検出対象画像特定部７は、複数のブロックにおける、検出結果枠１５０と重なるブロックについて、複数枚の使用撮像画像のうち、当該ブロックと重なる検出結果枠１５０が得られた使用撮像画像の数がしきい値以下である場合には、当該ブロックと重なる検出結果枠１５０を使用せずに、処理対象画像２０ａにおいて顔画像を特定する。したがって、使用撮像画像において、ノイズの影響により、顔画像についての特徴量とよく似た特徴量を有する画像が偶然に存在し、当該画像を顔画像である可能性が高いと誤って判断した結果によって得られた検出結果枠１５０が存在する場合であっても、検出対象画像特定部７は、当該検出結果枠１５０を除去して処理対象画像において顔画像を特定することができる。よって、顔画像の検出精度が向上する。

なお、検出対象画像特定部７は、検出結果枠１５０と重なるブロックについて、複数枚の使用撮像画像のうち、当該ブロックと重なる検出結果枠１５０が得られた使用撮像画像の数がしきい値以下である場合であっても、当該ブロックと重なる検出結果枠を外形枠とする検出結果領域に、顔画像である可能性が非常に高い検出結果領域が含まれる場合には、当該ブロックと重なる検出結果枠１５０を使用して、処理対象画像において顔画像を特定しても良い。

例えば、図２２の例において、ブロック９５０ｃに複数の検出結果枠１５０ａが重なっている場合を考える。このような場合、検出対象画像特定部７は、ブロック９５０ｃに重なっている複数の検出結果枠１５０ａにおいて、それに対応する検出確度値が第３のしきい値（＞第１のしきい値）以上である検出結果枠１５０ａが存在するかどうかを判断する。そして、検出対象画像特定部７は、ブロック９５０ｃに重なっている複数の検出結果枠１５０ａにおいて、それに対応する検出確度値が第３のしきい値以上である検出結果枠１５０ａが存在する場合には、ブロック９５０ｃと重なる検出結果枠１５０ａを外形枠とする検出結果領域に、顔画像である可能性が非常に高い検出結果領域が含まれていると判断して、ブロック９５０ａと重なる複数の検出結果枠１５０ａを使用して、処理対象画像において顔画像を特定する。これにより、処理対象画像において顔画像が特定される際に、正しい検出結果枠１５０が誤って使用されなくなることを抑制することができる。

一方で、検出対象画像特定部７は、ブロック９５０ｃに重なっている複数の検出結果枠１５０ａにおいて、それに対応する検出確度値が第３のしきい値以上である検出結果枠１５０ａが存在しない場合には、ブロック９５０ｃと重なる検出結果枠１５０ａを外形枠とする検出結果領域には、顔画像である可能性が非常に高い検出結果領域が含まれていないいと判断して、ブロック９５０ａと重なる複数の検出結果枠１５０ａを使用せずに、処理対象画像において顔画像を特定する。

＜第３変形例＞
使用撮像画像群を構成する複数枚の使用撮像画像については互いに近いタイミングで撮像されているものの、処理対象画像とその他の使用撮像画像との間には多少の差異が存在する。したがって、処理対象画像以外の使用撮像画像について得られた検出確度値については、処理対象画像についての検出確度値として見た場合には精度が低いと言える。そして、処理対象画像以外の使用撮像画像について得られた検出確度値については、当該使用撮像画像の撮像タイミングが処理対象画像の撮像タイミングから離れるほど、処理対象画像についての検出確度値として見た場合には精度が低くなると言える。

そこで、本変形例では、検出対象画像特定部７は、使用撮像画像群を構成する複数枚の使用撮像画像について得られた検出結果枠（検出結果領域）に対応する検出確度値に対して重み付けを行ったうえで当該検出確度値に基づいて、処理対象画像において顔画像を特定する。具体的には、検出対象画像特定部７のマップ生成部４は、複数枚の使用撮像画像について得られた検出結果枠に対応する検出確度値に対して重み付けを行ったうえで当該検出確度値に基づいて出力値マップを生成する。そして、マップ生成部４は、使用撮像画像について得られた検出結果枠に対応する検出確度値に対して重み付けを行う際には、当該使用撮像画像の撮像タイミングが処理対象画像の撮像タイミングよりも離れているほど、当該検出確度値に対する重み付けを小さくする。

例えば、本変形例に係るマップ生成部４は、（ｋ−２）フレーム目の使用撮像画像について得られた検出結果枠についてのマップ２００（図１３参照）を生成する際には、マップ２００に設定された枠２１０内の中心２１１の値を（図１４参照）、当該検出結果枠に対応する検出確度値に対して“０．８”を乗算して得られる値とする。そして、マップ生成部４は、枠２１０内のそれ以外の複数の値を、枠２１０の中心２１１の値を最大値とした正規分布曲線に従って枠２１０内の中心２１１から外側に向けて値が徐々に小さくなるようにする。

また、マップ生成部４は、（ｋ−１）フレーム目の使用撮像画像について得られた検出結果枠についてのマップ２００を生成する際には、マップ２００に設定された枠２１０内の中心２１１の値を、当該検出結果枠に対応する検出確度値に対して“０．９”を乗算して得られる値とする。そして、マップ生成部４は、枠２１０内のそれ以外の複数の値を、枠２１０の中心２１１の値を最大値とした正規分布曲線に従って枠２１０内の中心２１１から外側に向けて値が徐々に小さくなるようにする。

そして、マップ生成部４は、処理対象画像であるｋフレーム目の使用撮像画像について得られた検出結果枠についてのマップ２００を生成する際には、マップ２００に設定された枠２１０内の中心２１１の値を、当該検出結果枠に対応する検出確度値に対して“１．０”を乗算して得られる値とする。そして、マップ生成部４は、枠２１０内のそれ以外の複数の値を、枠２１０の中心２１１の値を最大値とした正規分布曲線に従って枠２１０内の中心２１１から外側に向けて値が徐々に小さくなるようにする。

このように、使用撮像画像について得られた検出結果領域についての検出確度値に対して重み付けが行われる際に、当該使用撮像画像の撮像タイミングが処理対象画像の撮像タイミングよりも離れているほど、当該検出確度値に対する重み付けが小さくされることによって、精度の高い出力値マップを生成することが可能となる。よって、処理対象画像において顔画像を正確に特定することが可能となる。その結果、顔画像の検出精度が向上する。

以上の第１〜第３変形例は、少なくとも２つの変形例を組み合わせて使用することも可能である。例えば、第１変形例と第２変形例とを組み合わせて使用することも可能であるし、第１〜第３変形例を組み合わせて使用することも可能である。

また、上記において画像検出装置１は詳細に説明されたが、上記した説明は、全ての局面において例示であって、この発明がそれに限定されるものではない。また、上述した各種の例は、相互に矛盾しない限り組み合わせて適用可能である。そして、例示されていない無数の変形例が、この発明の範囲から外れることなく想定され得るものと解される。

１画像検出装置
３検出部
７検出対象画像特定部
１２制御プログラム

Claims

処理対象画像から検出対象画像を検出する画像検出装置であって、
検出枠を用いて、撮像画像に対して、当該検出枠と同じサイズの前記検出対象画像である可能性が高い領域を検出結果領域として検出する検出処理を行う検出部と、
前記処理対象画像において前記検出対象画像を特定する検出対象画像特定部と
を備え、
前記検出部は、互いに異なったタイミングで撮像された、前記処理対象画像を含む複数枚の撮像画像のそれぞれに対して、互いにサイズの異なる複数種類の検出枠に含まれる少なくとも一種類の検出枠が対応するように、当該複数種類の検出枠を分散して当該複数枚の撮像画像に対応付けて、当該複数枚の撮像画像のそれぞれに対して、当該撮像画像に対応する少なくとも一種類の検出枠を用いて前記検出処理を行い、
前記検出対象画像特定部は、前記検出部において前記複数枚の撮像画像について検出された前記検出結果領域に基づいて、前記処理対象画像において前記検出対象画像を特定する、画像検出装置。
請求項１に記載の画像検出装置であって、
前記複数種類の検出枠は、基準サイズの基準検出枠と、当該基準サイズとは異なるサイズの非基準検出枠とを含み、
前記検出部は、
撮像画像について前記非基準検出枠を用いて前記検出処理を行う際には、
前記基準サイズとサイズが一致するように当該非基準検出枠をサイズ変更するとともに、当該非基準検出枠のサイズ変更に応じて当該撮像画像のサイズ変更を行い、
サイズ変更後の当該撮像画像であるサイズ変更画像に対して、サイズ変更後の当該非基準検出枠であるサイズ変更検出枠を移動させながら、当該サイズ変更画像での当該サイズ変更検出枠内の画像が前記検出対象画像である可能性が高いかを判定する、画像検出装置。
請求項１及び請求項２のいずれか一つに記載の画像検出装置であって、
前記検出部は、前記複数枚の撮像画像における、前記処理対象画像以外の撮像画像について、前記複数種類の検出枠に含まれる検出枠を用いて前記検出処理を行った結果、当該撮像画像において、当該検出枠と同じサイズの前記検出対象画像である可能性が非常に高い領域が存在する場合には、前記処理対象画像についても当該検出枠を用いて前記検出処理を行う、画像検出装置。
請求項１乃至請求項３のいずれか一つに記載の画像検出装置であって、
前記検出対象画像特定部は、前記検出部において前記複数枚の撮像画像について検出された前記検出結果領域の外形枠である検出結果枠に基づいて、前記処理対象画像において前記検出対象画像を特定し、
前記検出対象画像特定部は、前記検出結果枠が重ねられた前記処理対象画像を複数のブロックに分割し、
前記検出対象画像特定部は、
前記複数のブロックにおける、前記検出結果枠と重なるブロックについて、
前記複数枚の撮像画像のうち、当該ブロックと重なる前記検出結果枠が得られた撮像画像の数がしきい値以下である場合には、当該ブロックと重なる前記検出結果枠を使用せずに、前記処理対象画像において前記検出対象画像を特定する、画像検出装置。
請求項４に記載の画像検出装置であって、
前記検出対象画像特定部は、
前記複数のブロックにおける、前記検出結果枠と重なるブロックについて、
前記複数枚の撮像画像のうち、当該ブロックと重なる前記検出結果枠が得られた撮像画像の数がしきい値以下である場合であっても、当該ブロックと重なる前記検出結果枠を外形枠とする前記検出結果領域に、前記検出対象画像である可能性が非常に高い前記検出結果領域が含まれる場合には、当該ブロックと重なる前記検出結果枠を使用して、前記処理対象画像において前記検出対象画像を特定する、画像検出装置。
請求項１乃至請求項５のいずれか一つに記載の画像検出装置であって、
前記検出対象画像特定部は、前記検出部において前記複数枚の撮像画像について検出された前記検出結果領域についての、当該検出結果領域が前記検出対象画像である確からしさを示す検出確度値に基づいて、前記処理対象画像において前記検出対象画像を特定する、画像検出装置。
請求項６に記載の画像検出装置であって、
前記検出対象画像特定部は、前記検出部において前記複数枚の撮像画像について検出された前記検出結果領域についての前記検出確度値に対して重み付けを行ったうえで当該検出確度値に基づいて、前記処理対象画像において前記検出対象画像を特定し、
前記検出対象画像特定部は、撮像画像について検出された前記検出結果領域についての前記検出確度値に対して重み付けを行う際には、当該撮像画像の撮像タイミングが前記処理対象画像の撮像タイミングよりも離れているほど、当該検出確度値に対する重み付けを小さくする、画像検出装置。
請求項１乃至請求項７のいずれか一つに記載の画像検出装置であって、
前記検出対象画像は、人の顔画像である、画像検出装置。
処理対象画像から検出対象画像を検出する画像検出装置を制御するための制御プログラムであって、
前記画像検出装置に、
（ａ）検出枠を用いて、撮像画像に対して、当該検出枠と同じサイズの前記検出対象画像である可能性が高い領域を検出結果領域として検出する検出処理を行う工程と、
（ｂ）前記処理対象画像において前記検出対象画像を特定する工程と
を実行させ、
前記工程（ａ）において、互いに異なったタイミングで撮像された、前記処理対象画像を含む複数枚の撮像画像のそれぞれに対して、互いにサイズの異なる複数種類の検出枠に含まれる少なくとも一種類の検出枠が対応するように、当該複数種類の検出枠を分散して当該複数枚の撮像画像に対応付けて、当該複数枚の撮像画像のそれぞれについて、当該撮像画像に対応する少なくとも一種類の検出枠を用いて前記検出処理を行い、
前記工程（ｂ）において、前記工程（ａ）で前記複数枚の撮像画像について検出された前記検出結果領域に基づいて、前記処理対象画像において前記検出対象画像を特定するように動作させるための制御プログラム。
処理対象画像から検出対象画像を検出する画像検出方法であって、
（ａ）検出枠を用いて、撮像画像に対して、当該検出枠と同じサイズの前記検出対象画像である可能性が高い領域を検出結果領域として検出する検出処理を行う工程と、
（ｂ）前記処理対象画像において前記検出対象画像を特定する工程と
を備え、
前記工程（ａ）において、互いに異なったタイミングで撮像された、前記処理対象画像を含む複数枚の撮像画像のそれぞれに対して、互いにサイズの異なる複数種類の検出枠に含まれる少なくとも一種類の検出枠が対応するように、当該複数種類の検出枠を分散して当該複数枚の撮像画像に対応付けて、当該複数枚の撮像画像のそれぞれについて、当該撮像画像に対応する少なくとも一種類の検出枠を用いて前記検出処理を行い、
前記工程（ｂ）において、前記工程（ａ）で前記複数枚の撮像画像について検出された前記検出結果領域に基づいて、前記処理対象画像において前記検出対象画像を特定する、画像検出方法。