WO2020255226A1

WO2020255226A1 - 物体らしさ推定装置、物体らしさ推定方法、及び物体らしさ推定プログラム

Info

Publication number: WO2020255226A1
Application number: PCT/JP2019/023975
Authority: WO
Inventors: 峻司細野; 島村　潤; 淳嵯峨田
Original assignee: 日本電信電話株式会社
Priority date: 2019-06-17
Filing date: 2019-06-17
Publication date: 2020-12-24

Abstract

領域設定部２０が、深度画像及び可視光画像のペアについて、候補領域を設定する。エッジ検出部２２が、深度画像及び可視光画像の各々のエッジを検出するエッジ検出を行う。物体らしさ算出部２４が、深度画像における候補領域の縁部のエッジと、可視光画像における候補領域の縁部のエッジと、深度画像における候補領域の中央部のエッジとを用いて、候補領域の物体らしさを算出する。

Description

物体らしさ推定装置、物体らしさ推定方法、及び物体らしさ推定プログラム

　本開示の技術は、物体らしさ推定装置、物体らしさ推定方法、及び物体らしさ推定プログラムに関する。

　物体候補領域推定とは、画像から単一の物体のみが含まれる領域を複数出力する技術である（図８）。物体候補領域推定で出力された各候補領域について、図８に示すように物体認識を行なうことで、画像中の物体の位置と種類を推定すること、すなわち物体検出することができ、画像中に複数存在する家庭用品や看板の認識等、幅広い産業応用が期待できる。

　このとき、候補領域推定で出力された各領域に、画像認識を施すことを考えると、物体候補領域推定が高速に動作することはさることながら、個々の物体を正確に捉えていない余分な候補領域は、物体認識精度や、処理速度の低下につながると考えられる。このため、極力少数の候補領域で物体を正確に捉えることも求められる。さらに、学習データ不要なアルゴリズムで物体候補領域推定を実現できれば、物体認識用の学習データ（物体ラベルが付与された画像）のみで物体検出を実現することができる。また、一般的な物体検出の学習データ、例えば、物体ラベルと位置情報が付与された画像よりも少ない準備コストで物体検出を実現できる。

　また、一般的な物体候補領域推定では、図９に示すように、画像からスライディングウィンドウ等で切出された各領域（矩形）について、物体らしさを算出し、物体らしさの高い順に幾つかの領域を候補領域として出力する（図１０参照）。ここで、物体らしさとは、領域が単一の物体を過不足無く捉えている度合いのことである。

　物体らしさを算出する際には、物体らしさが、単一の物体領域を過不足無く捉えたときにのみ高くなることが重要である。

　公知の学習データ不要な物体候補領域技術の多くは、ある領域（矩形）に対して「物体らしさ」を算出し、物体らしさが高くなる領域を候補領域として出力している。例えば、高速かつ高精度な技術である非特許文献１では、矩形の縁領域に可視光エッジを多く含む程物体らしいという仮定のもと、物体らしさを算出している。この手法では、エッジ検出によって得られたエッジが物体と物体間の境界（物体境界）であると暗に仮定している。

C. L. Zitnick and P. Dollar, "Edge boxes: locating object proposals from edges, in Proc. on European Conf. on Computer Vision," 2014. J. Liu, T. Ren, B-K. Bao, J. Bei, "Depth-aware layered edge for object proposal," in Proc. on Int. Conf. on Multimedia and Expo, 2016. J. Liu, T. Ren, Y. Wang, S.-H. Zhong, J. Bei, S. Chen, "Object proposal on rgb-d images via elastic edge boxes," Neurocomputing, vol.236, no.2, pp.134-146, 2017.

　しかし、輝度値の局所的な変化が大きな点に検出されやすい可視光エッジは、物体間の境界からだけでなく、物体の模様からも検出されることが多い（図１１）。一般に、可視光画像から物体間の境界と物体の模様を弁別することは容易ではく、既存手法にもそのような機構は含まれていないため、模様から生じるエッジを手掛かりとした候補領域を出力してしまうこととなる。すなわち、画像中の物体を網羅的に検出するために、多くの候補領域を出力しなければならないという問題がある。

　この問題を解決するアプローチの一つとして、物体境界による変化に反応し、一方で模様の影響を受けないセンサの活用が考えられる。例えば、物体境界には深度差が生じやすく、また、家庭用品等の表面が滑らかな物体表面には深度差が生じにくいことから、深度センサにより物体境界を比較的に容易に取得できると考えられる。しかしながら単に非特許文献１を深度画像や可視光画像と深度画像を組み合わせたＲＧＢ－Ｄ画像に適用するだけでは、依然多くの余分な候補領域が出力されると考えられる。これは、矩形の縁領域にエッジを多く含むという指標が、複数の物体を含む領域においても成立してしまうからである（図１２）。

　深度画像の活用を前提とした公知の技術（例えば、非特許文献２、非特許文献３）も矩形の縁領域にＲＧＢ－Ｄ画像から抽出されたエッジを多く含むほど物体らしいという考えに基づいている。そのため、依然複数の物体を含む領域も候補領域として出力されてしまうという問題がある。

　開示の技術は、上記の点に鑑みてなされたものであり、精度よく、候補領域の物体らしさを推定することができる物体らしさ推定装置、物体らしさ推定方法、および物体らしさ推定プログラムを提供することを目的とする。

　本開示の第１態様は、物体らしさ推定装置であって、入力された、対応する深度画像及び可視光画像のペアの、物体が写る領域の候補である候補領域について、単一の物体を捉えている度合いを示す物体らしさを推定する物体らしさ推定装置であって、前記深度画像及び前記可視光画像のペアについて、前記候補領域を設定する領域設定部と、前記深度画像及び前記可視光画像の各々のエッジを検出するエッジ検出を行うエッジ検出部と、前記深度画像における前記候補領域の縁部のエッジと、前記可視光画像における前記候補領域の縁部のエッジと、前記深度画像における前記候補領域の中央部のエッジとを用いて、前記候補領域の前記物体らしさを算出する物体らしさ算出部と、を含んで構成される。

　本開示の第２態様は、物体らしさ推定方法であって、入力された、対応する深度画像及び可視光画像のペアの、物体が写る領域の候補である候補領域について、単一の物体を捉えている度合いを示す物体らしさを推定する物体らしさ推定方法であって、領域設定部が、前記深度画像及び前記可視光画像のペアについて、前記候補領域を設定し、エッジ検出部が、前記深度画像及び前記可視光画像の各々のエッジを検出するエッジ検出を行い、物体らしさ算出部が、前記深度画像における前記候補領域の縁部のエッジと、前記可視光画像における前記候補領域の縁部のエッジと、前記深度画像における前記候補領域の中央部のエッジとを用いて、前記候補領域の前記物体らしさを算出する。

　本開示の第３態様は、物体らしさ推定プログラムであって、入力された、対応する深度画像及び可視光画像のペアの、物体が写る領域の候補である候補領域について、単一の物体を捉えている度合いを示す物体らしさを推定するための物体らしさ推定プログラムであって、前記深度画像及び前記可視光画像のペアについて、前記候補領域を設定し、前記深度画像及び前記可視光画像の各々のエッジを検出するエッジ検出を行い、前記深度画像における前記候補領域の縁部のエッジと、前記可視光画像における前記候補領域の縁部のエッジと、前記深度画像における前記候補領域の中央部のエッジとを用いて、前記候補領域の前記物体らしさを算出することをコンピュータに実行させるためのプログラムである。

　開示の技術によれば、精度よく、単一の物体を捉えている度合いを示す物体らしさを推定することができる。

中央領域及び縁領域における物体境界のパターンに応じた物体らしさを説明するための図である。可視光エッジと深度エッジとを単純に統合した場合の処理の概要を示す図である。本実施形態の物体らしさ推定装置の処理の概要を示す図である。本実施形態の物体らしさ推定装置として機能するコンピュータの一例の概略ブロック図である。本実施形態の物体らしさ推定装置の構成を示すブロック図である。物体らしさの算出方法を説明するための図である。本実施形態の物体らしさ推定装置の物体らしさ推定処理ルーチンを示すフローチャートである。従来の物体らしさ推定の一例を示す図である。従来の物体らしさ推定の一例を示す図である。従来の物体らしさ推定の一例を示す図である。従来の物体らしさ推定による失敗例を示す図である。従来の物体らしさ推定による失敗例を示す図である。

　以下、開示の技術の実施形態の一例を、図面を参照しつつ説明する。なお、各図面において同一又は等価な構成要素及び部分には同一の参照符号を付与している。また、図面の寸法比率は、説明の都合上誇張されており、実際の比率とは異なる場合がある。

＜本実施形態の概要＞
　物体らしい領域（物体らしさが高くなるべき領域）とは、単一の物体境界に外接する領域であると考えられ、それを具体化すると、図１に示すように、ある領域が以下３つの条件を満たす場合に、物体らしい領域である、と考えられる。

・条件１：中央領域に物体境界を含まないこと。
・条件２：縁領域に物体境界を含むこと。
・条件３：縁領域の物体境界は均一に分布すること。

　そこで本実施形態では、上記条件がすべて満たされた場合に物体らしさが高くなるよう、物体らしさを算出する。

　ここで、可視光エッジと深度エッジを単純に統合する場合、図２に示すように、中央領域に可視光エッジ（物体の模様）が含まれるため、物体を捉えた領域であっても物体らしさが低くなる。

　画像から物体境界を取得するため、本実施形態では、図３に示すように、可視光エッジと深度エッジを適応的に統合する。表面が滑らかな物体について考えると、可視光エッジは、物体境界以外にも物体の模様から検出される。つまり誤検出が多くなる傾向がある一方、深度エッジは物体境界のみから検出されやすいが、物体が密接している場合には検出されにくい。つまり検出漏れが多くなる傾向があると考えられる。さらに、物体候補領域推定には網羅性が比較的重要視されることを鑑みると、中央領域に関する上記条件１の判定に用いるエッジには、模様の影響により不当に物体らしさが下がらないよう、深度エッジのみを用いることが好ましいと考えられる。また、縁領域に関する上記条件２、条件３の判定には、物体境界の取り漏らしを減らすため、可視光エッジと深度エッジ両方を用いることが望ましいと考えられる。つまり、本実施形態では、上記条件を以下のように具体化し、物体らしさを算出する。

・条件１’：中央領域に深度エッジを含まないこと。
・条件２’：縁領域に可視光エッジもしくは深度エッジを含むこと。
・条件３’：縁領域の可視光エッジもしくは深度エッジは均一に分布すること。

＜本実施形態に係る物体らしさ推定装置の構成＞
　図４は、本実施形態の物体らしさ推定装置１０のハードウェア構成を示すブロック図である。

　図４に示すように、物体らしさ推定装置１０は、ＣＰＵ（Ｃｅｎｔｒａｌ　Ｐｒｏｃｅｓｓｉｎｇ　Ｕｎｉｔ）１１、ＲＯＭ（Ｒｅａｄ　Ｏｎｌｙ　Ｍｅｍｏｒｙ）１２、ＲＡＭ（Ｒａｎｄｏｍ　Ａｃｃｅｓｓ　Ｍｅｍｏｒｙ）１３、ストレージ１４、入力部１５、表示部１６及び通信インタフェース（Ｉ／Ｆ）１７を有する。各構成は、バス１９を介して相互に通信可能に接続されている。

　ＣＰＵ１１は、中央演算処理ユニットであり、各種プログラムを実行したり、各部を制御したりする。すなわち、ＣＰＵ１１は、ＲＯＭ１２又はストレージ１４からプログラムを読み出し、ＲＡＭ１３を作業領域としてプログラムを実行する。ＣＰＵ１１は、ＲＯＭ１２又はストレージ１４に記憶されているプログラムに従って、上記各構成の制御及び各種の演算処理を行う。本実施形態では、ＲＯＭ１２又はストレージ１４には、候補領域の物体らしさを推定するための物体らしさ推定プログラムが格納されている。物体らしさ推定プログラムは、１つのプログラムであっても良いし、複数のプログラム又はモジュールで構成されるプログラム群であっても良い。

　ＲＯＭ１２は、各種プログラム及び各種データを格納する。ＲＡＭ１３は、作業領域として一時的にプログラム又はデータを記憶する。ストレージ１４は、ＨＤＤ（Ｈａｒｄ　Ｄｉｓｋ　Ｄｒｉｖｅ）又はＳＳＤ（Ｓｏｌｉｄ　Ｓｔａｔｅ　Ｄｒｉｖｅ）により構成され、オペレーティングシステムを含む各種プログラム、及び各種データを格納する。

　入力部１５は、マウス等のポインティングデバイス、及びキーボードを含み、各種の入力を行うために使用される。

　入力部１５は、対応する可視光画像と深度画像のペアを、入力として受け付ける。ここで、対応する可視光画像と深度画像のペアは、事前に位置合わせされているものとする。

　表示部１６は、例えば、液晶ディスプレイであり、各種の情報を表示する。表示部１６は、タッチパネル方式を採用して、入力部１５として機能しても良い。

　通信インタフェース１７は、他の機器と通信するためのインタフェースであり、例えば、イーサネット（登録商標）、ＦＤＤＩ、Ｗｉ－Ｆｉ（登録商標）等の規格が用いられる。

　次に、物体らしさ推定装置１０の機能構成について説明する。図５は、物体らしさ推定装置１０の機能構成の例を示すブロック図である。

　物体らしさ推定装置１０は、機能的には、図５に示すように、領域設定部２０、エッジ検出部２２、及び物体らしさ算出部２４を備えている。

　領域設定部２０は、対応する深度画像及び可視光画像のペアについて、候補領域を複数設定する。具体的には、領域設定部２０は、画像上の様々な位置、大きさ、及びアスペクト比の矩形を候補領域として設定する。例えば、一辺が３００画素の矩形を矩形の縦横幅５０％の間隔で走査し、その後、縦を半分の画素数として同様に走査し、その後、横を半分の画素数として同様に走査する、といった処理を一定回数繰り返すことにより、複数の候補領域を設定する。

　エッジ検出部２２は、深度画像及び可視光画像の各々のエッジを検出する。エッジ検出方法には有為なものを用いることができる。例えば、参考文献１に記載されている方法を用いることができる。この方法では、各画素がどの程度エッジらしいかというエッジ尤度を０～１の実数値で推定することができる。

［参考文献１］P. Dollar and C. L. Zitnick, “Structured forests for fast edge detection,” in Proc. IEEE Int Conf. on Computer Vision, 2013.

　物体らしさ算出部２４は、候補領域の各々について、深度画像における候補領域の縁部のエッジと、可視光画像における候補領域の縁部のエッジと、深度画像における候補領域の中央部のエッジとを用いて、候補領域の前記物体らしさを算出する。

　以下に、物体らしさ算出部２４による算出原理について説明する。

　物体らしさ算出部２４は、領域設定部２０で設定された各候補領域について、ある領域が単一の物体を捉えている度合いである、物体らしさを算出する。以下では、先述した条件１’～条件３’を満たしている度合いを算出すために、各候補領域の中央領域、縁領域のエッジ密度とその均一性を用いる方法について説明する。

　ある候補領域ｂに対する物体らしさＳ（ｂ）は下記式で定義される。

　ここで、ｂ_ｏｕｔ、ｂ_ｉｎはそれぞれ縁領域、中央領域を表し、例えば、領域の高さ、幅をそれぞれα倍（０＜α＜１）した矩形を領域中央に配置した際の領域を内部、それ以外の領域を縁部として設定される。また、１／ζ（φ_ｄ（ｂ_ｉｎ））の項は中央領域ｂ_ｉｎ中の深度エッジの密度に標準シグモイド関数ζ（・）を掛けたものであり、条件１’の成立度合いを示す。また、ζ（φ_ｒｇｂｄ（ｂ_ｏｕｔ））の項は縁領域ｂ_ｏｕｔ中の可視光エッジと深度エッジにより算出されたエッジ密度であり、条件２’の成立度合いを示す。さらにｕ_ｒｇｂｄ（ｂ_ｏｕｔ）は縁領域ｂ_ｏｕｔに含まれる可視光エッジと深度エッジの均一性であり、条件３’の成立度合いをしめす。ｗは条件３’をどの程度重視するかの重みであり、任意の実数値を事前に指定する。つまり、条件１’～３’を満たしている度合いが高いほど、物体らしさが大きくなる。以降、各項についてその詳細を説明する。

　ある候補領域ｂに対する深度のエッジ密度φ_ｄ（ｂ）は下記式で算出する。

　ここで、ｂ_ｗは候補領域ｂの幅を示し、ｂ_ｈは候補領域ｂの高さを示し、（ｐ，ｑ）∈ｂは候補領域ｂ中の画素の位置を表す。またＥ_ｄ（ｐ，ｑ）は入力された深度エッジ画像のある位置（ｐ，ｑ）の画素値（エッジ尤度）を示す。さらにκは矩形の大きさによる正規化の度合いを調整するパラメータである。次に、ある候補領域ｂに対する可視光および深度エッジの密度は下記式で定義する。

　ここで、φ_ｒｇｂ（ｂ）は、φ_ｄ（ｂ）と同様に算出された可視光エッジの密度である。最後に、エッジの均一性ｕ_ｒｇｂｄ（ｂ_ｏｕｔ）は下記により算出する。

　ここで、ｂ_ｏｕｔ ^kはｂ_ｏｕｔがＫ分割された各領域を表し、

は分割された各領域のエッジ密度の平均を表す。例えば、縁領域を４分割し、物体らしさを算出する場合を図６に示す。

　以上説明した原理に従って、物体らしさ算出部２４は、候補領域の各々について、深度画像における候補領域の縁部のエッジ密度及びエッジ均一性と、可視光画像における候補領域の縁部のエッジ密度及びエッジ均一性と、深度画像における候補領域の中央部のエッジ密度とを用いて、候補領域の前記物体らしさを算出する。

　エッジ均一性は、候補領域の縁部を任意の数の領域に分割した際の各領域の、深度画像のエッジ密度と可視光画像のエッジ密度との何れか大きい方のエッジ密度の分散により算出される。また、エッジ密度の分散は、縁部を分割した際の各領域における、深度画像のエッジ密度と可視光画像のエッジ密度との何れか大きい方のエッジ密度と、縁部を分割した各領域における何れか大きい方のエッジ密度の平均とを用いて算出される。

　以上より、物体らしさ算出部２４は、深度画像における候補領域の縁部のエッジ密度又は可視光画像における候補領域の縁部のエッジ密度が高く、かつ、深度画像における候補領域の中央部のエッジ密度が低く、かつ、深度画像における候補領域の縁部のエッジ又は可視光画像における候補領域の縁部のエッジが均一であるほど、物体らしさが高くなるように算出する。

＜本実施形態に係る物体らしさ推定装置の作用＞
　次に、本実施形態に係る物体らしさ推定装置１０の作用について説明する。

　図７は、物体らしさ推定装置１０による物体らしさ推定処理の流れを示すフローチャートである。ＣＰＵ１１がＲＯＭ１２又はストレージ１４から物体らしさ推定プログラムを読み出して、ＲＡＭ１３に展開して実行することにより、物体らしさ推定処理が行なわれる。また、物体らしさ推定装置１０に、対応する可視光画像及び深度画像のペアが入力される。

　ステップＳ１００で、ＣＰＵ１１は、領域設定部２０として、対応する深度画像及び可視光画像のペアについて、候補領域を複数設定する。

　ステップＳ１０２で、ＣＰＵ１１は、エッジ検出部２２として、深度画像及び可視光画像の各々のエッジを検出する。

　ステップＳ１０４で、ＣＰＵ１１は、物体らしさ算出部２４として、領域設定部２０で設定された各候補領域について、物体らしさを算出する。そして、ＣＰＵ１１は、物体らしさが上位ｎ個の候補領域を、表示部１６により出力し、物体らしさ推定処理を終了する。

　以上説明したように、本実施形態に係る物体らしさ推定装置は、前記深度画像における前記候補領域の縁部のエッジと、前記可視光画像における前記候補領域の縁部のエッジと、前記深度画像における前記候補領域の中央部のエッジとを用いて、前記候補領域の前記物体らしさを算出する。これにより、精度よく、単一の物体を捉えている度合いを示す物体らしさを推定することができる。また、画像から単一の物体のみが含まれる領域を少ない候補数で推定することができる。

　なお、本発明は、上述した実施形態に限定されるものではなく、この発明の要旨を逸脱しない範囲内で様々な変形や応用が可能である。

　上記実施形態でＣＰＵがソフトウェア（プログラム）を読み込んで実行した各種処理を、ＣＰＵ以外の各種のプロセッサが実行してもよい。この場合のプロセッサとしては、ＦＰＧＡ（Ｆｉｅｌｄ－Ｐｒｏｇｒａｍｍａｂｌｅ　Ｇａｔｅ　Ａｒｒａｙ）等の製造後に回路構成を変更可能なＰＬＤ（Ｐｒｏｇｒａｍｍａｂｌｅ　Ｌｏｇｉｃ　Ｄｅｖｉｃｅ）、及びＡＳＩＣ（Ａｐｐｌｉｃａｔｉｏｎ　Ｓｐｅｃｉｆｉｃ　Ｉｎｔｅｇｒａｔｅｄ　Ｃｉｒｃｕｉｔ）等の特定の処理を実行させるために専用に設計された回路構成を有するプロセッサである専用電気回路等が例示される。また、物体らしさ推定処理を、これらの各種のプロセッサのうちの１つで実行してもよいし、同種又は異種の２つ以上のプロセッサの組み合わせ（例えば、複数のＦＰＧＡ、及びＣＰＵとＦＰＧＡとの組み合わせ等）で実行してもよい。また、これらの各種のプロセッサのハードウェア的な構造は、より具体的には、半導体素子等の回路素子を組み合わせた電気回路である。

　また、上記各実施形態では、物体らしさ推定プログラムがストレージ１４に予め記憶（インストール）されている態様を説明したが、これに限定されない。プログラムは、ＣＤ－ＲＯＭ（Ｃｏｍｐａｃｔ　Ｄｉｓｋ　Ｒｅａｄ　Ｏｎｌｙ　Ｍｅｍｏｒｙ）、ＤＶＤ－ＲＯＭ（Ｄｉｇｉｔａｌ　Ｖｅｒｓａｔｉｌｅ　Ｄｉｓｋ　Ｒｅａｄ　Ｏｎｌｙ　Ｍｅｍｏｒｙ）、及びＵＳＢ（Ｕｎｉｖｅｒｓａｌ　Ｓｅｒｉａｌ　Ｂｕｓ）メモリ等の非一時的（ｎｏｎ－ｔｒａｎｓｉｔｏｒｙ）記憶媒体に記憶された形態で提供されてもよい。また、プログラムは、ネットワークを介して外部装置からダウンロードされる形態としてもよい。

　以上の実施形態に関し、更に以下の付記を開示する。

　（付記項１）
　入力された、対応する深度画像及び可視光画像のペアの、物体が写る領域の候補である候補領域について、単一の物体を捉えている度合いを示す物体らしさを推定する物体らしさ推定装置であって、
　メモリと、
　前記メモリに接続された少なくとも１つのプロセッサと、
　を含み、
　前記プロセッサは、
　前記深度画像及び前記可視光画像のペアについて、前記候補領域を設定し、
　前記深度画像及び前記可視光画像の各々のエッジを検出するエッジ検出を行い、
　前記深度画像における前記候補領域の縁部のエッジと、前記可視光画像における前記候補領域の縁部のエッジと、前記深度画像における前記候補領域の中央部のエッジとを用いて、前記候補領域の前記物体らしさを算出する、
物体らしさ推定装置。

　（付記項２）
　入力された、対応する深度画像及び可視光画像のペアの、物体が写る領域の候補である候補領域について、単一の物体を捉えている度合いを示す物体らしさを推定する物体らしさ推定処理を実行するようにコンピュータによって実行可能なプログラムを記憶した非一時的記憶媒体であって、
　前記物体らしさ推定処理は、
　前記深度画像及び前記可視光画像のペアについて、前記候補領域を設定し、
　前記深度画像及び前記可視光画像の各々のエッジを検出するエッジ検出を行い、
　前記深度画像における前記候補領域の縁部のエッジと、前記可視光画像における前記候補領域の縁部のエッジと、前記深度画像における前記候補領域の中央部のエッジとを用いて、前記候補領域の前記物体らしさを算出する、
　非一時的記憶媒体。

１０   物体らしさ推定装置
２０   領域設定部
２２   エッジ検出部
２４   物体らしさ算出部

Claims

　入力された、対応する深度画像及び可視光画像のペアの、物体が写る領域の候補である候補領域について、単一の物体を捉えている度合いを示す物体らしさを推定する物体らしさ推定装置であって、
　前記深度画像及び前記可視光画像のペアについて、前記候補領域を設定する領域設定部と、
　前記深度画像及び前記可視光画像の各々のエッジを検出するエッジ検出を行うエッジ検出部と、
　前記深度画像における前記候補領域の縁部のエッジと、前記可視光画像における前記候補領域の縁部のエッジと、前記深度画像における前記候補領域の中央部のエッジとを用いて、前記候補領域の前記物体らしさを算出する物体らしさ算出部と、
　を含む物体らしさ推定装置。
　前記物体らしさ算出部は、前記深度画像における前記候補領域の縁部のエッジ密度及びエッジ均一性と、前記可視光画像における前記候補領域の縁部のエッジ密度及びエッジ均一性と、前記深度画像における前記候補領域の中央部のエッジ密度とを用いて、前記候補領域の前記物体らしさを算出する請求項１記載の物体らしさ推定装置。
　前記エッジ均一性は、前記候補領域の縁部を任意の数の領域に分割した際の各領域の、前記深度画像のエッジ密度と前記可視光画像のエッジ密度との何れか大きい方のエッジ密度の分散により算出される請求項２記載の物体らしさ推定装置。
　前記エッジ密度の分散は、前記縁部を分割した際の各領域における、前記深度画像のエッジ密度と前記可視光画像のエッジ密度との何れか大きい方のエッジ密度と、前記各領域における前記何れか大きい方のエッジ密度の平均とを用いて算出される請求項３記載の物体らしさ推定装置。
　前記物体らしさ算出部は、
　前記深度画像における前記候補領域の縁部のエッジ密度又は前記可視光画像における前記候補領域の縁部のエッジ密度が高く、かつ、
　前記深度画像における前記候補領域の中央部のエッジ密度が低く、かつ、
　前記深度画像における前記候補領域の縁部のエッジ又は前記可視光画像における前記候補領域の縁部のエッジが均一であるほど、前記物体らしさが高くなるように算出する請求項２～請求項４の何れか１項記載の物体らしさ推定装置。
　入力された、対応する深度画像及び可視光画像のペアの、物体が写る領域の候補である候補領域について、単一の物体を捉えている度合いを示す物体らしさを推定する物体らしさ推定方法であって、
　領域設定部が、前記深度画像及び前記可視光画像のペアについて、前記候補領域を設定し、
　エッジ検出部が、前記深度画像及び前記可視光画像の各々のエッジを検出するエッジ検出を行い、
　物体らしさ算出部が、前記深度画像における前記候補領域の縁部のエッジと、前記可視光画像における前記候補領域の縁部のエッジと、前記深度画像における前記候補領域の中央部のエッジとを用いて、前記候補領域の前記物体らしさを算出する
　物体らしさ推定方法。
　入力された、対応する深度画像及び可視光画像のペアの、物体が写る領域の候補である候補領域について、単一の物体を捉えている度合いを示す物体らしさを推定するための物体らしさ推定プログラムであって、
　前記深度画像及び前記可視光画像のペアについて、前記候補領域を設定し、
　前記深度画像及び前記可視光画像の各々のエッジを検出するエッジ検出を行い、
　前記深度画像における前記候補領域の縁部のエッジと、前記可視光画像における前記候補領域の縁部のエッジと、前記深度画像における前記候補領域の中央部のエッジとを用いて、前記候補領域の前記物体らしさを算出する
　ことをコンピュータに実行させるための物体らしさ推定プログラム。