JP5946294B2 - 対象物検出装置、対象物検出方法、対象物検出プログラムおよび自動走行車両 - Google Patents

対象物検出装置、対象物検出方法、対象物検出プログラムおよび自動走行車両 Download PDF

Info

Publication number
JP5946294B2
JP5946294B2 JP2012046820A JP2012046820A JP5946294B2 JP 5946294 B2 JP5946294 B2 JP 5946294B2 JP 2012046820 A JP2012046820 A JP 2012046820A JP 2012046820 A JP2012046820 A JP 2012046820A JP 5946294 B2 JP5946294 B2 JP 5946294B2
Authority
JP
Japan
Prior art keywords
detection
image data
unit
distance image
object detection
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2012046820A
Other languages
English (en)
Other versions
JP2013182494A (ja
Inventor
吉田 睦
睦 吉田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yamaha Motor Co Ltd
Original Assignee
Yamaha Motor Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yamaha Motor Co Ltd filed Critical Yamaha Motor Co Ltd
Priority to JP2012046820A priority Critical patent/JP5946294B2/ja
Publication of JP2013182494A publication Critical patent/JP2013182494A/ja
Application granted granted Critical
Publication of JP5946294B2 publication Critical patent/JP5946294B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Control Of Position, Course, Altitude, Or Attitude Of Moving Bodies (AREA)
  • Image Analysis (AREA)

Description

本発明は、撮像対象が予め定められた検出対象物を含むか否かを判定する対象物検出装置、対象物検出方法、対象物検出プログラムおよび自動走行車両に関する。
ゴルフカート等の自動走行車両には、障害物の存在および障害物までの距離を検出するために超音波センサが用いられる。
特許文献1に記載されたゴルフカートに設けられた対象物センサは、前方に超音波を発信し、障害物により反射される超音波を受信することにより前方に障害物があることを検出するとともにその大きさを検出する。対象物センサが障害物を検出したときにはその大きさに応じてコントローラがゴルフカートの走行を制御する。
特開2009−116860号公報
Y. Freund and R. Schapire, "A decision-theoretic generalization of on-line learning and an application to boosting," Journal of Computer and System Sciences, pp. 119-139, 1997.
しかしながら、特許文献1のゴルフカートに設けられた対象物センサは、超音波を用いることから、風の影響を受けやすい。
一方、ステレオカメラから得られる左画像および右画像の対応点を求めることにより距離画像を取得するステレオマッチングの手法がある。ステレオマッチングにより得られる距離画像を用いることにより、風の影響を受けずに障害物を検出することが可能である。ステレオマッチングでは、左のカメラにより得られた左画像にマッチング窓(以下、左マッチングと呼ぶ。)が設定され、右のカメラにより得られた右画像にマッチング窓(以下、右マッチング窓と呼ぶ。)が設定される。左画像上で左マッチング窓が異なる複数の位置に順次設定される。左マッチング窓が左画像の各位置にあるときに、右画像上で右マッチング窓が移動される。左マッチング窓内の画像と右マッチング窓内の画像とが一致(マッチング)するときの左マッチング窓と右マッチング窓とのずれ量に基づいて距離画像が生成される。距離画像により物体までの距離が検出される。
ステレオマッチングでは、マッチング窓のサイズが小さいと、距離画像にノイズが発生しやすい。そのため、ノイズの影響によりマッチングエラーが生じやすい。マッチングエラーを低減するためには、マッチング窓のサイズを大きくする必要がある。しかしながら、マッチング窓のサイズを大きくすると、物体の検出に有用な輪郭情報が損なわれやすい。また、ステレオマッチングにおける計算量が増加する。
本発明の目的は、計算量を増加させることなくかつ輪郭情報を損なうことなく距離画像データにおけるノイズの影響を抑制することが可能な対象物検出装置、対象物検出方法および対象物検出プログラムを提供することである。
本発明の他の目的は、計算量を増加させることなくかつ輪郭情報を損なうことなく距離画像データにおけるノイズの影響を抑制することが可能な対象物検出装置を備える自動走行車両を提供することである。
(1)第1の発明に係る対象物検出装置は、撮像対象が予め定められた検出対象物を含むか否かを判定する対象物検出装置であって、異なる複数の位置に配置され、撮像対象の画像を撮像画像データとしてそれぞれ取得する複数の画像取得部と、複数の画像取得部により取得された複数の撮像画像データを用いたステレオマッチングにより撮像対象までの距離を示す距離画像を距離画像データとして生成する距離画像生成部と、距離画像生成部により生成された距離画像データに基づいて撮像対象が検出対象物を含むか否かを判定する処理部とを備え、処理部は、距離画像生成部により生成された距離画像データの複数の画素についてLBP(ローカルバイナリパターン)を生成するとともに、距離画像生成部により生成された距離画像データに複数の画素から構成される複数の単位領域を設定し、各単位領域について複数種類のLBPのヒストグラムを作成し、各ヒストグラムにおいて設定値以下の数の0−1遷移を有する複数種類のLBPをそれぞれ複数のビンに設定するとともに設定値を超える数の0−1遷移を有する1または複数種類のLBPを一のビンに集約して設定し、複数の単位領域についての複数のヒストグラムの複数のビンのうち予め選択された複数のビンに対応する複数種類のLBPの度数を複数の特徴量の値として用いて検出対象物の有無を判定するように構成されるものである。
その対象物検出装置においては、異なる複数の位置に配置された複数の画像取得部により撮像対象の画像が撮像画像データとしてそれぞれ取得される。取得された複数の撮像画像データを用いたステレオマッチングにより撮像対象までの距離を示す距離画像が距離画像生成部により距離画像データとして生成される。生成された距離画像データに基づいて撮像対象が検出対象物を含むか否かが処理部により判定される。
この場合、距離画像データの複数の画素についてLBPが生成されるとともに、距離画像データに複数の画素から構成される複数の単位領域が設定され、各単位領域について複数種類のLBPのヒストグラムが作成される。各ヒストグラムにおいて設定値以下の数の0−1遷移を有する複数種類のLBPがそれぞれ複数のビンに設定されるとともに設定値を超える数の0−1遷移を有する1または複数種類のLBPが一のビンに集約されて設定される。複数の単位領域についての複数のヒストグラムの複数のビンのうち予め選択された複数のビンに対応する複数種類のLBPの度数を複数の特徴量の値として用いて検出対象物の有無が判定される。
ここで、LBPを用いることにより検出対象物の輪郭を検出対象物と背景との距離差により識別することができる。ステレオマッチングのマッチング窓のサイズを小さくすることにより、ステレオマッチングにおける計算量を増加させることなく検出対象物の有無の判定に有用な輪郭情報を高精度で得ることができる。距離画像データにノイズが発生した場合には、0−1遷移の数が大きくなる。そこで、設定値を超える数の0−1遷移を有する1または複数種類のLBPが一のビンに集約されて設定される。それにより、検出対象物の有無の判定においてノイズの影響を抑制することができる。したがって、上記のように構成されたLBPのヒストグラムの度数を複数の特徴量の値として用いることにより、計算量を増加させることなくかつ輪郭情報を損なうことなく、距離画像データにおけるノイズの影響を抑制することができる。その結果、検出対象物の有無を正確に判定することが可能となる。
(2)処理部は、各特徴量の値がそれぞれ予め設定されたしきい値よりも大きいか否かに基づいて撮像対象が検出対象物を含むか否かを示す識別値を生成し、複数の特徴量についての識別値とそれぞれ予め設定された重み付け係数との積の合計に基づいて検出対象物の有無を判定するように構成されてもよい。
この場合、各特徴量についてのしきい値を適切に設定するとともに各識別値に対応する重み付け係数を適切に設定することにより、検出対象物の有無をより正確に判定することができる。
(3)しきい値、および複数の特徴量についての識別値に対応する重み付け係数は、検出対象物を含む複数の画像および検出対象物を含まない複数の画像を用いた学習により予め設定されてもよい。
この場合、検出対象物の有無の判定精度が高くなるように各特徴量についてのしきい値および重み付け係数を設定することが可能となる。それにより、検出対象物の有無をより正確に判定することができる。
(4)処理部は、距離画像生成部により生成された距離画像データに、複数の単位領域をそれぞれ含む複数の検出窓を位置および面積の少なくとも一方が異なるように順次設定し、各検出窓について検出対象物の有無を判定するように構成されてもよい。
この場合、任意の位置にある検出対象物または任意の大きさを有する検出対象物を正確に検出することができる。
(5)処理部は、複数の検出窓に含まれる複数の単位領域の数が等しくなるように各単位領域に含まれる画素の数を調整し、各ヒストグラムを対応する単位領域に含まれる画素の数を用いて正規化するように構成されてもよい。
この場合、複数の検出窓の面積が異なる場合でも、予め定められた数の特徴量を正確に選択することができる。
(6)第2の発明に係る対象物検出方法は、撮像対象が予め定められた検出対象物を含むか否かを判定する対象物検出方法であって、異なる複数の位置に配置された複数の画像取得部により撮像対象の画像を撮像画像データとしてそれぞれ取得するステップと、取得された複数の撮像画像データを用いたステレオマッチングにより撮像対象までの距離を示す距離画像を距離画像データとして生成するステップと、生成された距離画像データに基づいて撮像対象が検出対象物を含むか否かを判定するステップとを備え、撮像対象が検出対象物を含むか否かを判定するステップは、生成された距離画像データに複数の画素から構成される複数の単位領域を設定するステップと、各単位領域の複数の画素についてLBP(ローカルバイナリパターン)を生成するステップと、各単位領域について複数種類のLBPのヒストグラムを作成し、各ヒストグラムにおいて設定値以下の数の0−1遷移を有する複数種類のLBPをそれぞれ複数のビンに設定するとともに設定値を超える数の0−1遷移を有する1または複数種類のLBPを一のビンに集約して設定するステップと、複数の単位領域についての複数のヒストグラムの複数のビンのうち予め選択された複数のビンに対応する複数種類のLBPの度数を複数の特徴量の値として用いて検出対象物の有無を判定するステップとを含むものである。
その対象物検出方法によれば、LBPを用いることにより検出対象物の輪郭を検出対象物と背景との距離差により識別することができる。ステレオマッチングのマッチング窓のサイズを小さくすることにより、ステレオマッチングにおける計算量を増加させることなく検出対象物の有無の判定に有用な輪郭情報を高精度で得ることができる。距離画像データにノイズが発生した場合には、0−1遷移の数が大きくなる。そこで、設定値を超える数の0−1遷移を有する1または複数種類のLBPが一のビンに集約されて設定される。それにより、検出対象物の有無の判定においてノイズの影響を抑制することができる。したがって、上記のように構成されたLBPのヒストグラムの度数を複数の特徴量の値として用いることにより、計算量を増加させることなくかつ輪郭情報を損なうことなく、距離画像データにおけるノイズの影響を抑制することができる。その結果、検出対象物の有無を正確に判定することが可能となる。
(7)検出対象物の有無を判定するステップは、各特徴量の値がそれぞれ予め設定されたしきい値よりも大きいか否かに基づいて撮像対象が検出対象物を含むか否かを示す識別値を生成するステップと、複数の特徴量についての識別値とそれぞれ予め設定された重み付け係数との積の合計に基づいて検出対象物の有無を判定するステップとを含んでもよい。
この場合、各特徴量についてのしきい値を適切に設定するとともに各識別値に対応する重み付け係数を適切に設定することにより、検出対象物の有無をより正確に判定することができる。
(8)対象物検出方法は、しきい値、および複数の特徴量についての識別値に対応する重み付け係数を、検出対象物を含む複数の画像および検出対象物を含まない複数の画像を用いた学習により予め設定するステップをさらに備えてもよい。
この場合、検出対象物の有無の判定精度が高くなるように各特徴量についてのしきい値および重み付け係数を設定することが可能となる。それにより、検出対象物の有無をより正確に判定することができる。
(9)学習にはアダブーストが適用されてもよい。この場合、検出対象物の有無の判定の結果が環境変動の影響を受けにくくなる。
(10)第3の発明に係る対象物検出プログラムは、撮像対象が予め定められた検出対象物を含むか否かを判定するために、コンピュータにより実行可能な対象物検出プログラムであって、異なる複数の位置に配置された複数の画像取得部により撮像対象の画像を撮像画像データとしてそれぞれ取得する処理と、取得された複数の撮像画像データを用いたステレオマッチングにより撮像対象までの距離を示す距離画像を距離画像データとして生成するステップと、生成された距離画像データに基づいて撮像対象が検出対象物を含むか否かを判定する処理とを、コンピュータに実行させ、撮像対象が検出対象物を含むか否かを判定する処理は、生成された距離画像データに複数の画素から構成される複数の単位領域を設定する処理と、各単位領域の複数の画素についてLBP(ローカルバイナリパターン)を生成する処理と、各単位領域について複数種類のLBPのヒストグラムを作成し、各ヒストグラムにおいて設定値以下の数の0−1遷移を有する複数種類のLBPをそれぞれ複数のビンに設定するとともに設定値を超える数の0−1遷移を有する1または複数種類のLBPを一のビンに集約して設定する処理と、複数の単位領域についての複数のヒストグラムの複数のビンのうち予め選択された複数のビンに対応する複数種類のLBPの度数を複数の特徴量の値として用いて検出対象物の有無を判定する処理とを含むものである。
その対象物検出プログラムによれば、LBPを用いることにより検出対象物の輪郭を検出対象物と背景との距離差により識別することができる。ステレオマッチングのマッチング窓のサイズを小さくすることにより、ステレオマッチングにおける計算量を増加させることなく検出対象物の有無の判定に有用な輪郭情報を高精度で得ることができる。距離画像データにノイズが発生した場合には、0−1遷移の数が大きくなる。そこで、設定値を超える数の0−1遷移を有する1または複数種類のLBPが一のビンに集約して設定される。それにより、検出対象物の有無の判定においてノイズの影響を抑制することができる。したがって、上記のように構成されたLBPのヒストグラムの度数を複数の特徴量の値として用いることにより、計算量を増加させることなくかつ輪郭情報を損なうことなく、距離画像データにおけるノイズの影響を抑制することができる。その結果、検出対象物の有無を正確に判定することが可能となる。
(11)第4の発明に係る自動走行車両は、予め定められた経路を移動可能に構成された本体部と、本体部を移動させるように構成された駆動部と、第1の発明に係る対象物検出装置と、対象物検出装置の判定結果に基づいて駆動部を制御する制御部とを備えるものである。
その自動走行車両においては、上記の対象物検出装置が用いられるので、計算量を増加させることなくかつ輪郭情報を損なうことなく、距離画像データにおけるノイズの影響を抑制することができる。その結果、検出対象物の有無を正確に判定することが可能となる。
(12)本体部は、予め定められた経路を移動可能に構成されてもよい。この場合、対象物検出装置により検出対象物の有無を正確に判定することが可能となる。
本発明によれば、計算量を増加させることなくかつ輪郭情報を損なうことなく、距離画像データにおけるノイズの影響を抑制することができる。その結果、検出対象物の有無を正確に判定することが可能となる。
本実施の形態に係るゴルフカートの外観側面図である。 ゴルフカートの内部構成を示すブロック図である。 演算処理部の構成を示すブロック図である。 対象物検出装置の構成を示す機能ブロック図である。 (a),(b)は、それぞれカメラより得られる左画像および右画像の一例を示す図である。 (a),(b)は、それぞれ左マッチング窓および右マッチング窓を示す模式図である。 距離画像データにより表される距離画像の一例を示す図である。 LBPの生成方法を説明するための模式図である。 バイ・リニア内挿による複数の画素部分の値の取得を示す模式図である。 (a),(b)は、距離画像に設定された検出窓の例を示す図である。 図10(a)の検出窓の構成を示す模式図である。 図10(b)の検出窓の構成を示す模式図である。 1つのセルを示す図である。 1つのセルについてのLBPのヒストグラムの一例を示す図である。 1つの検出窓についての特徴量を示す図である 図4の演算処理部により行われる対象物検出処理を示すフローチャートである。 アダブーストによる学習を示すフローチャートである。 1つの特徴量についての全ポジティブサンプルおよび全ネガティブサンプルのヒストグラムの例を示す図である。
以下、本発明の一実施の形態に係る対象物検出装置およびそれを備えた自動走行車両について図面を参照しながら説明する。以下の実施の形態では、自動走行車両の一例としてゴルフカートについて説明する。
(1)ゴルフカートの構成
図1は、本実施の形態に係るゴルフカートの外観側面図である。図1に示すように、ゴルフカート100は、車体20、一対の前輪11および一対の後輪12を有する。車体20は、下部車体20a、左右側の支持枠20bおよび屋根部20cを有する。下部車体20aの四隅から上方に延びるように支持枠20bが設けられ、支持枠20bの上端部に屋根部20cが取り付けられる。一対の前輪11および一対の後輪12は、車体20を支持するように下部車体20aのそれぞれ前端部および後端部に回転可能に取り付けられる。左側の支持枠20bには、左画像用のカメラ1Lが取り付けられる。右側の支持枠20bには、右画像用のカメラ1Rが取り付けられる。図1には、右側の支持枠20bおよび右画像用のカメラ1Rは図示されていない。カメラ1L,1Rは例えばCCD(電荷結合素子)カメラである。
下部車体20a上の略中央部には前部シート13が設けられ、下部車体20a上の後部には後部シート14が設けられる。前部シート13の前方にはハンドル15が設けられる。前部シート13に着座する搭乗者がハンドル15を操作することにより、前輪11の向きが調整され、ゴルフカート100の操舵が行われる。下部車体20aの後端部には、ゴルフバッグ等を載置するためのキャリア16が設けられる。
本実施の形態に係るゴルフカート100は、搭乗者の任意の選択により、自動走行モードおよび手動走行モードのいずれかで動作を行う。自動走行モードでは、ゴルフカート100は予め定められた経路を自動的に走行する。手動走行モードでは、搭乗者によりハンドル15ならびに後述のアクセルペダルおよびブレーキペダルが操作される。
図2は、ゴルフカート100の内部構成を示すブロック図である。図2に示すように、ゴルフカート100は、対象物検出装置10、車両制御部50、バッテリ51、駆動モータ21、トランスミッション22、電磁ブレーキ23、アクセルペダル24、ブレーキペダル25およびブレーキ駆動部26を備える。
対象物検出装置10は、左画像用のカメラ1L、右画像用のカメラ1R、左画像用の画像メモリ2L、右画像用の画像メモリ2R、演算処理部30および外部記憶装置40を含む。
車両制御部50は、バッテリ51の充放電制御を行うとともに、バッテリ51の電力を用いて後述の各部の動作を制御する。
駆動モータ21、トランスミッション22および電磁ブレーキ23は、ゴルフカート100の後部に設けられる。後輪12の車軸12aにトランスミッション22が接続され、駆動モータ21および電磁ブレーキ23がトランスミッション22に取り付けられる。駆動モータ21の回転力は、トランスミッション22を介して後輪12の車軸12aに伝達される。それにより、後輪12が駆動される。
ゴルフカート100の停止動作時には、電磁ブレーキ23が作動して駆動モータ21の回転を制止する。
アクセルペダル24およびブレーキペダル25は、ゴルフカート100の前部に設けられ、前部シート13(図1)に着座する搭乗者により操作される。アクセルペダル24にはアクセルセンサ24aが接続される。アクセルペダル24の踏み込み量がアクセルセンサ24aにより検出され、その検出値が車両制御部50に与えられる。車両制御部50は、アクセルセンサ24aの検出値に基づいて駆動モータ21を制御する。
ブレーキペダル25はブレーキ駆動部26に接続される。一対の前輪11および一対の後輪12の各々には、ディスクブレーキ等のブレーキ機構BMが取り付けられる。ブレーキ駆動部26はこれらのブレーキ機構BMに接続される。搭乗者によってブレーキペダル25が踏み込まれると、ブレーキ駆動部26が各ブレーキ機構BMを駆動して前輪11および後輪12を制動する。また、ブレーキ駆動部26は車両制御部50により制御される。
車両制御部50には、誘導線センサS1が電気的に接続される。ゴルフ場には、ゴルフカート100が予め定められた経路を1方向(予め決められた方向)に走行するようにゴルフカート100を誘導するための電磁誘導線(図示せず)が埋設されている。その電磁誘導線が誘導線センサS1によって磁気的に検出され、誘導線センサS1から車両制御部50に検出信号が与えられる。自動走行モードでは、車両制御部50が誘導線センサS1からの検出信号に基づいて図示しない操舵機構を制御する。それにより、ゴルフカート100が予め定められた経路から逸脱することなく走行する。
(2)演算処理部30の構成
図3は、演算処理部30の構成を示すブロック図である。図3に示すように、演算処理部30は、例えば、入出力インタフェース31、CPU(中央演算処理装置)32、ROM(リードオンリメモリ)33、RAM(ランダムアクセスメモリ)34および内部バス35を含む。入出力インタフェース31、CPU32、ROM33およびRAM34は内部バス35に接続される。
画像メモリ2L,2Rは、例えば半導体メモリおよびハードディスク等の記憶媒体からなる。外部記憶装置40は、例えばハードディスクまたは半導体メモリ等の記憶媒体からなる。
画像メモリ2L,2Rおよび外部記憶装置40は、入出力インタフェース31に接続される。ROM33には、システムプログラムが記憶される。CPU32は、ROM33または外部記憶装置40に記憶される対象物検出プログラムをRAM34上で実行することにより後述する対象物検出処理を実行する。
(3)対象物検出装置10の構成
図4は、対象物検出装置10の構成を示す機能ブロック図である。図4に示すように、演算処理部30は、ステレオマッチング部3、LBP(ローカルバイナリパターン)生成部4、対象物検出窓設定部5および対象物検出部6を含む。ステレオマッチング部3、LBP生成部4、対象物検出窓設定部5および対象物検出部6は対象物検出プログラムを構成するモジュールに相当する。この場合、図3のCPU32がROM33または外部記憶装置40に記憶される対象物検出プログラムを実行することによりステレオマッチング部3、LBP生成部4、対象物検出窓設定部5および対象物検出部6の機能が実現される。
対象物検出用辞書8は、図3の外部記憶装置40内に構築される。対象物検出用辞書8には、予め学習により取得された対象物検出用情報が格納される。対象物検出用情報については、後述する。
カメラ1L,1Rは、ゴルフカート100の撮像対象である前方の空間の物体および背景を撮像する。カメラ1Lにより得られる画像(以下、左画像と呼ぶ。)は、左画像データLVとして画像メモリ2Lに与えられる。カメラ1Rにより得られる画像(以下、右画像と呼ぶ。)は、右画像データRVとして画像メモリ2Rに与えられる。画像メモリ2Lはカメラ1Lから与えられる左画像データLVを記憶し、画像メモリ2Rはカメラ1Rから与えられる右画像データRVを記憶する。
ステレオマッチング部3は、画像メモリ2Lに記憶された左画像データLVおよび画像メモリ2Rに記憶された右画像データRVに基づいて、ステレオマッチングにより距離画像を示す距離画像データDVを生成する。LBP生成部4は、ステレオマッチング部3により生成された距離画像データDVに関するLBP(ローカルバイナリパターン)を生成する。LBPの生成方法については後述する。また、LBP生成部4、対象物検出窓設定部5および対象物検出部6の動作については後述する。
対象物検出部6は、撮像対象が検出対象物を含むか否かを判定し、判定結果を車両制御部50に出力する。本実施の形態では、検出対象物は人間である。車両制御部50は、対象物検出部6の判定結果に基づいて駆動モータ21および電磁ブレーキ23を制御する。例えば、撮像対象が検出対象物を含む場合には、車両制御部50はゴルフカート100を減速もしくは停止させ、または警報を発生する。
(4)ステレオマッチング
次に、図5および図6を参照しながらステレオマッチングについて説明する。図5(a),(b)は、それぞれカメラ1L,1Rにより得られる左画像LIおよび右画像RIの一例を示す図である。左画像LIは、左画像データLVに基づいて表示され、右画像RIは右画像データRVに基づいて表示される。図5には、矢印によりX方向(水平方向)およびY方向(垂直方向)が示される。
図5(a)に示すように、左画像LIには、左マッチング窓LMが設定され、図5(b)に示すように、右画像RIには、右マッチング窓RMが設定される。
図4のステレオマッチング部3は、左マッチング窓LMを左画像LI上でX方向に左から右に1画素ずつ移動させた後、Y方向に下へ1画素移動させ、X方向に左から右に1画素ずつ移動させる。ステレオマッチング部3は、この操作を繰り返すことにより、左マッチング窓LMを左画像LIの全範囲で移動させる。
ステレオマッチング部3は、左マッチング窓LMが各位置にあるときに、右マッチング窓RMを右画像RI上で移動させ、左マッチング窓LM内の左画像データLVと右マッチング窓RM内の右画像データRVとの一致度合いが最大となる右マッチング窓RMの位置を探索する。
図6(a),(b)は、それぞれ左マッチング窓LMおよび右マッチング窓RMを示す模式図である。図6に示すように、左マッチング窓LMおよび右マッチング窓RMは、同じサイズの矩形形状を有し、同じ数の画素を含む。図6(a)の例では、左マッチング窓LMはm個の画素に対応する左画像データL〜Lを含む。ここで、mは例えば4以上の整数である。同様に、図6(b)の例では、右マッチング窓RMはm個の画素に対応する画像データR〜Rを含む。左画像データL〜Lおよび右画像データR〜Rは、それぞれ左画像LIおよび右画像RIの各画素の輝度値を示す。
(15)参考形態
第1の参考形態に係る対象物検出装置は、撮像対象が予め定められた検出対象物を含むか否かを判定する対象物検出装置であって、異なる複数の位置に配置され、撮像対象の画像を撮像画像データとしてそれぞれ取得する複数の画像取得部と、複数の画像取得部により取得された複数の撮像画像データを用いたステレオマッチングにより撮像対象までの距離を示す距離画像を距離画像データとして生成する距離画像生成部と、距離画像生成部により生成された距離画像データに基づいて撮像対象が検出対象物を含むか否かを判定する処理部とを備え、処理部は、距離画像生成部により生成された距離画像データの複数の画素についてLBP(ローカルバイナリパターン)を生成するとともに、距離画像生成部により生成された距離画像データに複数の画素から構成される複数の単位領域を設定し、各単位領域について複数種類のLBPのヒストグラムを作成し、各ヒストグラムにおいて設定値以下の数の0−1遷移を有する複数種類のLBPをそれぞれ複数のビンに設定するとともに設定値を超える数の0−1遷移を有する1または複数種類のLBPを一のビンに集約し、複数の単位領域についての複数のヒストグラムにおける複数種類のLBPの度数を複数の特徴量の値として用いて検出対象物の有無を判定するように構成されるものである。
その対象物検出装置においては、異なる複数の位置に配置された複数の画像取得部により撮像対象の画像が撮像画像データとしてそれぞれ取得される。取得された複数の撮像画像データを用いたステレオマッチングにより撮像対象までの距離を示す距離画像が距離画像生成部により距離画像データとして生成される。生成された距離画像データに基づいて撮像対象が検出対象物を含むか否かが処理部により判定される。
この場合、距離画像データの複数の画素についてLBPが生成されるとともに、距離画像データに複数の画素から構成される複数の単位領域が設定され、各単位領域について複数種類のLBPのヒストグラムが作成される。各ヒストグラムにおいて設定値以下の数の0−1遷移を有する複数種類のLBPがそれぞれ複数のビンに設定されるとともに設定値を超える数の0−1遷移を有する1または複数種類のLBPが一のビンに集約される。複数の単位領域についての複数のヒストグラムにおける複数種類のLBPの度数を複数の特徴量の値として用いて検出対象物の有無が判定される。
ここで、LBPを用いることにより検出対象物の輪郭を検出対象物と背景との距離差により識別することができる。ステレオマッチングのマッチング窓のサイズを小さくすることにより、ステレオマッチングにおける計算量を増加させることなく検出対象物の有無の判定に有用な輪郭情報を高精度で得ることができる。距離画像データにノイズが発生した場合には、0−1遷移の数が大きくなる。そこで、設定値を超える数の0−1遷移を有する1または複数種類のLBPが一のビンに集約される。それにより、検出対象物の有無の判定においてノイズの影響を抑制することができる。したがって、上記のように構成されたLBPのヒストグラムの度数を複数の特徴量の値として用いることにより、計算量を増加させることなくかつ輪郭情報を損なうことなく、距離画像データにおけるノイズの影響を抑制することができる。その結果、検出対象物の有無を正確に判定することが可能となる。
第2の参考形態に係る対象物検出方法は、撮像対象が予め定められた検出対象物を含むか否かを判定する対象物検出方法であって、異なる複数の位置に配置された複数の画像取得部により撮像対象の画像を撮像画像データとしてそれぞれ取得するステップと、取得された複数の撮像画像データを用いたステレオマッチングにより撮像対象までの距離を示す距離画像を距離画像データとして生成するステップと、生成された距離画像データに基づいて撮像対象が検出対象物を含むか否かを判定するステップとを備え、撮像対象が検出対象物を含むか否かを判定するステップは、生成された距離画像データに複数の画素から構成される複数の単位領域を設定するステップと、各単位領域の複数の画素についてLBP(ローカルバイナリパターン)を生成するステップと、各単位領域について複数種類のLBPのヒストグラムを作成し、各ヒストグラムにおいて設定値以下の数の0−1遷移を有する複数種類のLBPをそれぞれ複数のビンに設定するとともに設定値を超える数の0−1遷移を有する1または複数種類のLBPを一のビンに集約するステップと、複数の単位領域についての複数のヒストグラムにおける複数種類のLBPの度数を複数の特徴量の値として用いて検出対象物の有無を判定するステップとを含むものである。
その対象物検出方法によれば、LBPを用いることにより検出対象物の輪郭を検出対象物と背景との距離差により識別することができる。ステレオマッチングのマッチング窓のサイズを小さくすることにより、ステレオマッチングにおける計算量を増加させることなく検出対象物の有無の判定に有用な輪郭情報を高精度で得ることができる。距離画像データにノイズが発生した場合には、0−1遷移の数が大きくなる。そこで、設定値を超える数の0−1遷移を有する1または複数種類のLBPが一のビンに集約される。それにより、検出対象物の有無の判定においてノイズの影響を抑制することができる。したがって、上記のように構成されたLBPのヒストグラムの度数を複数の特徴量の値として用いることにより、計算量を増加させることなくかつ輪郭情報を損なうことなく、距離画像データにおけるノイズの影響を抑制することができる。その結果、検出対象物の有無を正確に判定することが可能となる。
第3の参考形態に係る対象物検出プログラムは、撮像対象が予め定められた検出対象物を含むか否かを判定するために、コンピュータにより実行可能な対象物検出プログラムであって、異なる複数の位置に配置された画像取得部により撮像対象の画像を撮像画像データとしてそれぞれ取得する処理と、取得された複数の撮像画像データを用いたステレオマッチングにより撮像対象までの距離を示す距離画像を距離画像データとして生成するステップと、生成された距離画像データに基づいて撮像対象が検出対象物を含むか否かを判定する処理とを、コンピュータに実行させ、撮像対象が検出対象物を含むか否かを判定する処理は、生成された距離画像データに複数の画素から構成される複数の単位領域を設定する処理と、各単位領域の複数の画素についてLBP(ローカルバイナリパターン)を生成する処理と、各単位領域について複数種類のLBPのヒストグラムを作成し、各ヒストグラムにおいて設定値以下の数の0−1遷移を有する複数種類のLBPをそれぞれ複数のビンに設定するとともに設定値を超える数の0−1遷移を有する1または複数種類のLBPを一のビンに集約する処理と、複数の単位領域についての複数のヒストグラムにおける複数種類のLBPの度数を複数の特徴量の値として用いて検出対象物の有無を判定する処理とを含むものである。
その対象物検出プログラムによれば、LBPを用いることにより検出対象物の輪郭を検出対象物と背景との距離差により識別することができる。ステレオマッチングのマッチング窓のサイズを小さくすることにより、ステレオマッチングにおける計算量を増加させることなく検出対象物の有無の判定に有用な輪郭情報を高精度で得ることができる。距離画像データにノイズが発生した場合には、0−1遷移の数が大きくなる。そこで、設定値を超える数の0−1遷移を有する1または複数種類のLBPが一のビンに集約される。それにより、検出対象物の有無の判定においてノイズの影響を抑制することができる。したがって、上記のように構成されたLBPのヒストグラムの度数を複数の特徴量の値として用いることにより、計算量を増加させることなくかつ輪郭情報を損なうことなく、距離画像データにおけるノイズの影響を抑制することができる。その結果、検出対象物の有無を正確に判定することが可能となる。
第4の参考形態に係る自動走行車両は、予め定められた経路を移動可能に構成された本体部と、本体部を移動させるように構成された駆動部と、第1の参考形態に係る対象物検出装置と、対象物検出装置の判定結果に基づいて駆動部を制御する制御部とを備えるものである。
その自動走行車両においては、上記の対象物検出装置が用いられるので、計算量を増加させることなくかつ輪郭情報を損なうことなく、距離画像データにおけるノイズの影響を抑制することができる。その結果、検出対象物の有無を正確に判定することが可能となる。
左マッチング窓LM内の左画像データL〜Lと右マッチング窓RM内の右画像データR〜Rとの一致度合いは、次式の絶対差合計SAD(Sum of Absolute Difference)により求められる。次式におけるiは1,2,・・・,mである。
Figure 0005946294
左マッチング窓LMの各位置において、上式(1)の絶対差合計SADが最小となる右マッチング窓RMの位置が求められる。この場合、左画像LIにおける左マッチング窓LMの特定部分と右画像RIにおける右マッチング窓RMの特定部分とのずれ量が視差に相当する。特定部分は、例えば、中央部分または左上部分等である。左画像LIまたは右画像RIの各画素について視差が求められる。視差は、カメラ1L,1Rの拘束条件に基づいてカメラ1L,1Rからの奥行き方向(前方)の距離に変換される。それにより、距離画像データDVが得られる。カメラ1L,1Rの拘束条件とは、例えば、カメラ1L,1R間の距離である。
図7は、距離画像データDVにより表される距離画像DIの一例を示す図である。図7の距離画像DIにおいては、濃いパターンほど距離が短いことを示している。
図4のステレオマッチング部3は、左画像データLVおよび右画像データRVに基づいてステレオマッチングにより距離画像データDVを算出する。距離画像データDVの各画素の値は、撮像対象までの距離を示す。
以下、左マッチング窓LMおよび右マッチング窓RMをマッチング窓と総称する。マッチング窓のサイズ(画素数)には、次のトレードオフの関係がある。マッチング窓のサイズを大きく設定すると、マッチングミスによる距離画像DI上のノイズが減少するが、物体の輪郭部分の位置ずれが増加するとともに一致度合いの計算時間が増加する。逆に、マッチング窓のサイズを小さく設定すると、物体の輪郭部分の位置ずれが減少するとともに一致度合いの計算時間が減少するが、マッチングミスによる距離画像DI上のノイズが増加する。
(5)LBP(ローカルバイナリパターン)
LBPは、任意の注目画素と、これを中心とする半径rの円周上に等間隔に並ぶn個の周辺画素(近傍画素)との濃度の大小関係を示す。
図8は、LBPの生成方法を説明するための模式図である。図8の左側には、注目画素OPおよび8個の周辺画素P1〜P8の値(画像データの値)が示される。各画素の値は、画像の濃度(階調)を表す。周辺画素P1〜P8を所定のしきい値で2値化する。それにより、図8の中央に示すように、周辺画素P1,P2,P7の値が“0”となり、周辺画素P3〜P6,P8の値が“1”となる。周辺画素P1〜P8の2値化された値を一次元に配列することにより、注目画素OPのLBP(00111101)を生成する。
図8の例では、LBPの理解を容易にするために、LBPの生成に注目画素OPを中心として矩形状に配列された周辺画素P1〜P8の値を用いているが、実際には、注目画素OPを中心とする円周上に等間隔に並ぶ複数の画素部分の値をバイ・リニア(Bi−Linear)内挿により取得する。
図9は、バイ・リニア内挿による複数の画素部分の値の取得を示す模式図である。図9において、注目画素OPの中心点Cを中心とする半径rの円周上に複数の画素部分p1〜p8を等間隔に設定する。注目画素OPおよび周辺画素P1〜P8の値を用いてバイ・リニア内挿により画素部分p1〜p8の値を取得する。画素部分p1〜p8の値の2値化および一次元への配列により、注目画素OPのLBPを生成する。
図4のLBP生成部4は、図7の距離画像DIの上端の1行、下端の1行、左端の1列および右端の1列の画素を除く他の全ての画素についてLBPを生成する。
(6)均一(uniform)パターンの定義
各画素について生成されたLBPを設定値uを用いて均一(uniform)パターンまたは不均一(nonuniform)パターンに分類する。
ここで、LBPにおける0−1遷移の数が設定値u以下である場合には、そのLBPは均一パターンであると定義する。LBPにおける0−1遷移の数が設定値uよりも大きい場合には、そのLBPは不均一パターンである。0−1遷移とは、LBPにおける“0”から“1”への遷移および“1”から“0”への遷移を含み、LBPの右端の値から左端の値への遷移も含む。例えば、LBP(00111101)には0−1遷移が4個含まれる。
均一パターンの定義をLBP n,rの形で記述する。nはLBPを生成する際の周辺画素の数であり、rは周辺画素が配置される円周の半径であり、uは上記の設定値である。図8の例では、半径rは1(画素)であり、周辺画素の数nは8である。
設定値uを2とした場合、均一パターンの定義はLBP 8,1で記述される。この場合、LBP(00111101)は不均一パターンである。設定値uを4とした場合、均一パターンの定義はLBP 8,1で記述される。この場合、LBP(00111101)は均一パターンである。周辺画素の数nが8である場合、設定値uは2以上4以下であることが好ましい。周辺画素の数nが4である場合、設定値uは2であることが好ましい。
8ビットのLBPは、256種類の配列パターンを有する。LBP 8,1の場合には、58種類の均一パターンが存在し、198種類の不均一パターンが存在する。
距離画像DIにおいて、ノイズ成分が少ない領域では、0−1遷移の数が少なくなり、LBPが均一パターンとなる。一方、距離画像DIにおいて、ノイズ成分が多い領域では、0−1遷移の数が多くなり、LBPが不均一パターンとなる。
(7)検出窓の設定
次に、図10〜図13を参照しながら検出窓の設定について説明する。図10(a),(b)は、距離画像DIに設定された検出窓DWの例を示す図である。
検出対象物の大きさおよび位置が不明であるため、図4の対象物検出窓設定部5は、距離画像DIの種々の位置に種々のサイズを有する検出窓DWを設定する。図10(a),(b)の例では、対象物検出窓設定部5は、距離画像DI上で検出窓DWをそのサイズを変化させながらX方向に左から右に移動させた後、Y方向に下へ移動させ、X方向に左から右に移動させる。対象物検出窓設定部5は、この操作を繰り返すことにより、種々のサイズを有する検出窓DWを距離画像DIの全範囲で移動させる。これにより、任意のサイズを有しかつ任意の位置に存在する検出対象物を検出することが可能となる。図10(a)には、比較的小さいサイズの検出窓DWが設定された状態が示される。また、図10(b)には、比較的大きいサイズの検出窓DWが設定された状態が示される。
図11は、図10(a)の検出窓DWの構成を示す模式図である。図12は、図10(b)の検出窓DWの構成を示す模式図である。
検出窓DWは、複数のセルCEにより構成される。各セルCEは複数の画素により構成される。検出窓DWのサイズに関らず検出窓DW内のセルCEの数は一定である。図11および図12の例では、検出窓DWは横8個および縦16個のセルCEを含む。検出窓DWのサイズが大きくなると、各セルCEのサイズが大きくなり、すなわち各セルCEを構成する画素の数が多くなる。各セルCEは、8×8個以上の画素を含むことが好ましい。図11の検出窓DWを構成する各セルCEは横8個および縦8個の画素を含む。図12の検出窓DWを構成する各セルCEは横16個および縦16個の画素を含む。
(8)LBPのヒストグラム
図4の対象物検出部6は、各検出窓DW内の各セルCEについてLBPのヒストグラムを以下の方法で作成する。
図13は、1つのセルCEを示す図である。図13の例では、1つのセルCEが8×8個の画素を含む。したがって、64個のLBPが生成される。
図14は、1つのセルCEについてのLBPのヒストグラムの一例を示す図である。図14の横軸はビンを表し、縦軸は出現頻度(度数)を表す。
ヒストグラムにおいては、設定値u以下の数の0−1遷移を有する複数種類のLBPをそれぞれビンに設定する。また、設定値uを超える数の0−1遷移を有する1以上のLBPを1つのビンに集約する。
上記の例では、LBPが8ビットを有する。したがって、LBPは、256種類の配列パターンを有する。設定値uが2である場合、58種類の均一パターンが存在し、198種類の不均一パターンが存在する。例えば、58種類の均一パターンがパターン1〜58としてヒストグラムの58個のビンに設定される。また、198種類の不均一パターンがパターン59として1つのビンに集約される。
例えば、パターン1はLBP(00000000)であり、パターン2はLBP(00000001)であり、パターン3はLBP(00000010)である。また、LBP(00000101)、LBP(00001010)、LBP(00010100)等の不均一パターンはパターン59とみなされる。
ヒストグラムの複数のビンに対応する複数のLBPが特徴量として用いられ、複数のビンにおける出現頻度が検出対象物の有無を判定のための特徴量の値として用いられる。図14のヒストグラムでは、59個の特徴量が得られる。
上記のように、検出窓DWのサイズが異なる場合、各検出窓DWに含まれるセルCEの数は一定であり、各セルCEに含まれる画素の数が異なる。そのため、各セルCEについて、ヒストグラムの出現頻度が各セルCE内の画素の数で正規化される。
1つの検出窓DWについては、セルCEの数と同数のヒストグラムが得られる。したがって、1つの検出窓DWについて、(ヒストグラムのビン数)×(セルCEの数)の特徴量が得られる。図11〜図14の例では、1つの検出窓DWのセルCEの数が8×16であり、1つのセルCEについてのヒストグラムのビン数が59であるので、1つの検出窓DWから7552個(=8×16×59)の特徴量が得られる。なお、処理負荷の軽減のために、インテグラルヒストグラムの方法を用いてもよい。
(9)検出器の動作
図4の対象物検出部6は、対象物検出窓設定部5により距離画像DIに設定される各検出窓DWについて検出器を動作させることにより、検出対象物の有無を判定する。
図15は、1つの検出窓DWについての特徴量を示す図である。対象物検出部6は、各検出窓DWから得られる複数の特徴量のうち一部または全部を検出器の演算のためのT個の特徴量v(t=1,2,…,T)として用いる。図11〜図14の例では、7552個の特徴量からT個の特徴量v(t=1,2,…,T)が予め選択される。図15に示すように、特徴量v,v,…,vにそれぞれしきい値θ,θ,…,θが予め設定される。しきい値θ(t=1,2,…,T)は、後述する学習により予め特徴量vごとに求められる。
検出器は、次式で表される弱識別器(Weak Classifier)により各特徴量vの値が肯定的結論を表すか否定的結論を表すかを識別する。
Figure 0005946294
上式(2)において、h(I)は、I番目の検出窓DWについての特徴量vの識別値(弱識別結果)を表す。ここで、Iは2以上の自然数である。上式(2)より、特徴量vの値がしきい値θよりも大きい場合には、識別値h(I)は、+1(肯定的結論を表す弱仮説(Weak Hypothesis))となる。特徴量vの値がしきい値θ以下の場合には、識別値h(I)は、−1(否定的結論を表す弱仮説)となる。T個の特徴量v,v,…,vおよびT個のしきい値θ,θ,…,θによりT個の弱識別器h,h,…,hが得られる。また、T個の弱識別器h,h,…,hによりT個の識別値h(I),h(I),…,h(I)が得られる。
各識別値h(I)(t=1,2,…,T)には、後述する学習により重み付け係数w(t=1,2,…,T)が予め設定される。検出器は、次式で示すように、T個の識別値h(I)〜h(I)とそれぞれに予め設定された重み付け係数w〜wとの積の合計からしきい値αを減算することにより、I番目の検出窓DWについて検出対象物の有無の判定結果H(I)を得る。
Figure 0005946294
上式(3)において、signは正負の符号を表す。上式(3)を識別演算式と呼ぶ。正の判定結果H(I)は、検出対象物が存在することを示す。また、負の判定結果H(I)は、検出対象物が存在しないことを示す。
また、しきい値αは、検出率と誤検出率とのバランスを適正に調整するために用いられる。検出率は、検出対象物を検出対象物として正しく検出する確率であり、例えば、人物を人物と判定する確率である。誤検出率は、検出対象物以外の対象物を検出対象物として誤って検出する確率であり、例えば、人物以外の物体を人物と判定する確率である。
しきい値αを大きく設定した場合には、検出率が高くなるが、誤検出率も高くなる。一方、しきい値αを小さく設定した場合には、誤検出率が低くなるが、検出率も低くなる。しきい値αは、対象物検出装置10が使用される状況に応じて任意に設定することができる。
T個の特徴量v〜v、T個のθ〜θ、T個の重み付け係数w〜wおよびしきい値αは、対象物検出用情報として図4の対象物検出用辞書8に予め記憶される。
(10)対象物検出処理
次に、図16を参照しながら対象物検出処理について説明する。図16は、図4の演算処理部30により行われる対象物検出処理を示すフローチャートである。
まず、図4のステレオマッチング部3が、画像メモリ2Lに記憶される左画像データLVおよび画像メモリ2Rに記憶される右画像データRVを取得する(ステップS1)。ステレオマッチング部3は、取得した左画像データLVおよび右画像データRVにステレオマッチングを行うことにより距離画像データDVを生成する(ステップS2)。
次に、図4のLBP生成部4が、ステレオマッチング部3により生成された距離画像データDVの複数の画素についてのLBPを生成する(ステップS3)。さらに、図4の対象物検出窓設定部5が、距離画像データDVに検出窓DWを設定する(ステップS4)。
次に、図4の対象物検出部6が、検出窓DW内における検出対象物の有無を判定する(ステップS5)。具体的には、検出窓DWについてのLBPのヒストグラムが作成される。次に、対象物検出用辞書8に記憶された複数の特徴量v〜vおよびしきい値θ〜θを用いてLBPのヒストグラムにおける複数の特徴量v〜vの値について上式(2)より識別値h(I)〜h(I)が算出される。さらに、識別値h(I)〜h(I)ならびに対象物検出用辞書8に記憶された重み付け係数w〜wおよびしきいαを用いて上式(3)より判定結果H(I)が算出される。
対象物検出部6は、予め設定された数の検出窓DWについての検出対象物の有無の判定が終了したか否かを判別する(ステップS6)。予め設定された数の検出窓DWについての検出対象物の有無の判定が終了していない場合には、対象物検出部6は、ステップS4に戻る。この場合、対象物検出窓設定部5が距離画像データDVに前の検出窓DWとはサイズまたは位置が異なる次の検出窓DWを設定し(ステップS4)、対象物検出部6が検出窓DW内における検出対象物の有無を判定する(ステップS5)。
ステップS4において、予め設定された数の検出窓DWについての検出対象物の有無の判定が終了した場合には、対象物検出部6は、対象物検出処理を終了する。
(11)検出対象物の判定のための学習
T個の弱識別器h〜hにおける特徴量v〜vおよびしきい値θ〜θならびにT個の重み付け係数w〜wは、事前の学習によって設定される。この学習には、例えば、非特許文献2に記載されたブースティング学習アルゴリズム(アダブースト:AdaBoost)が適用される。
図17は、アダブーストによる学習を示すフローチャートである。検出対象物を含む複数組の左画像および右画像に対応する複数組の左画像データおよび右画像データがポジティブサンプルとして予め準備される。また、検出対象物を含まない複数組の左画像および右画像に対応する複数組の左画像データおよび右画像データがネガティブサンプルとして予め準備される。
初期化処理として、全ポジティブサンプルおよび全ネガティブサンプルに均等にウェイト(重み;weight)が配分される(ステップS11)。
次に、全ポジティブサンプルおよび全ネガティブサンプルについて、ステレオマッチングによる距離画像データDVの生成、LBPの生成、検出窓DWの設定およびLBPのヒストグラムの作成を行うことにより、全ての特徴量の値が算出される(ステップS12)。
その後、T個の特徴量v〜vを選択しかつT個の弱識別器h〜hにおけるしきい値θ〜θおよびT個の重み付け係数w〜wを決定するためのT回の学習が開始される。最初は、変数tが1に設定される(ステップS13)。
まず、未選択の各特徴量について、ウェイトが与えられた全ポジティブサンプルおよび全ネガティブサンプルのヒストグラム(全サンプルの重み付きヒストグラム)がそれぞれ作成される(ステップS14)。t=1の場合には、全ての特徴量について、全サンプルの重み付きヒストグラムがそれぞれ作成される。図18は、1つの特徴量についての全ポジティブサンプルおよび全ネガティブサンプルのヒストグラムの例を示す図である。図18においては、縦軸はサンプル数を表し、横軸は特徴量の値を表す。
一般に、特徴量の値の比較的小さな範囲にネガティブサンプルの分布が現れ、特徴量の値の比較的大きな範囲にポジティブサンプルの分布が現れる。しきい値θを大きく設定すると、ネガティブサンプルをポジティブサンプルとして誤識別する確率は低くなるが、ポジティブサンプルをネガティブサンプルとして誤識別する確率は高くなる。逆に、しきい値θを小さく設定すると、ポジティブサンプルをネガティブサンプルとして誤識別する確率は低くなるが、ネガティブサンプルをポジティブサンプルとして誤識別する確率は高くなる。
例えば、ポジティブサンプルの分布範囲とネガティブサンプルの分布範囲とが互いに分離している場合には、それらの分布範囲の間の値がしきい値θとして設定される。ポジティブサンプルの分布範囲とネガティブサンプルの分布範囲とが互い重なり合う場合には、それらの重なり区間の値がしきい値θとして設定される。図18の例では、ポジティブサンプルの特徴量の値の下限θは、ネガティブサンプルの特徴量の値の上限θよりも小さい。本例では、ポジティブサンプルのヒストグラムとネガティブサンプルのヒストグラムとが交差する点における特徴量の値がしきい値θとして設定される。この場合、下限θとしきい値θとの間の特徴量の値を有するポジティブサンプルは、ネガティブサンプルとして誤識別される。また、上限θとしきい値θとの間の特徴量の値を有するネガティブサンプルは、ポジティブサンプルとして誤識別される。全ポジティブサンプルおよび全ネガティブサンプルの総数に対して誤識別されるポジティブサンプルおよびネガティブサンプルの数の割合を誤識別率(エラー率)と呼ぶ。
このようにして、未選択の全ての特徴量の各々について誤識別率が最小になるようにしきい値θが設定される(ステップS15)。これにより、未選択の全特徴量に対応する弱識別器が作成される。各特徴量に対応するしきい値θとともに、当該しきい値θに対応する誤識別率が算出される。
作成された弱識別器のうち最小の誤識別率を有する弱識別器が第t番目の弱識別器hとして決定される(ステップS16)。これにより、第t番目の特徴量vが選択されるとともにしきい値θが決定される。t=1の場合には、最小の誤識別率を有する弱識別器が第1番目の弱識別器hとして決定される。また、第1番目の特徴量vが選択されるとともにしきい値θが決定される。
また、決定された第t番目の弱識別器hの誤識別率に基づいて弱識別器hに対応する重み付け係数wが決定される(ステップS17)。この場合、誤識別率が小さいほど重み付け係数wは大きく設定される。t=1の場合には、重み付け係数wが決定される。
次に、変数tがTに等しいか否かが判定される(ステップS18)。すなわち、T個の特徴量が選択されたか否かが判定される。T個の特徴量が選択されていない場合には、ポジティブサンプルおよびネガティブサンプルにウェイトが再配分(re-weighting)される(ステップS19)。この場合、第t番目の弱識別器hにより正解が得られるサンプルには小さなウェイトが与えられ、第t番目の弱識別器hにより不正解が得られるサンプルには大きなウェイトが与えられる。
この状態で、変数tがt+1に更新され(ステップS20)、ステップS14〜S18の処理が実行される。t=2の場合には、特徴量vを除く未選択の各特徴量について、全サンプルの重み付きヒストグラムがそれぞれ作成される(ステップS14)。また、特徴量vを除く未選択の全ての特徴量の各々について誤識別率が最小になるようにしきい値θが設定される(ステップS15)。さらに、作成された弱識別器のうち最小の誤識別率を有する弱識別器が第2番目の弱識別器hとして決定される(ステップS16)。また、決定された第2番目の弱識別器hの誤識別率に基づいて弱識別器hに対応する重み付け係数wが決定される(ステップS17)。その後、tが3に更新される。
同様にして、T個の特徴量v〜vが選択されるとともにT個の弱識別器h〜hにおけるしきい値θ〜θが決定され、弱識別器h〜hにそれぞれに対応する重み付け係数w〜wが決定される。ステップS18において変数tがTに等しい場合には、学習が終了する。
このようにして決定されたT個の弱識別器h〜hとこれらに対応するT個の重み付け係数w〜wとの乗算結果を線形結合するとともに、適切なしきい値αを設定することにより、上式(3)の識別演算式が得られる。
(12)本実施の形態の効果
本実施の形態に係る対象物検出装置10においては、LBPを用いることにより検出対象物の輪郭を検出対象物と背景との距離差により識別することができる。この場合、ステレオマッチングのマッチング窓のサイズを小さくすることにより、ステレオマッチングにおける計算量を増加させることなく検出対象物の有無に有用な輪郭情報を高精度で得ることができる。また、設定値uを超える数の0−1遷移を有する1または複数種類のLBPが一のビンに集約される。それにより、検出対象物の有無の判定において距離画像データDVにおけるノイズの影響を抑制することができる。したがって、上記のように構成されたLBPのヒストグラムの度数を複数の特徴量の値として用いることにより、計算量を増加させることなくかつ輪郭情報を損なうことなく、距離画像データDVにおけるノイズの影響を抑制することができる。その結果、検出対象物の有無を正確に判定することが可能となる。
また、各特徴量v(t=1,2,…,T)についてのしきい値θ(t=1,2,…,T)を適切に設定するとともに各弱識別器h(t=1,2,…,T)に対応する重み付け係数w(t=1,2,…,T)を適切に設定することにより、検出対象物の有無をより正確に判定することができる。
さらに、学習によりT個の特徴量v〜vが選択されるとともにT個の弱識別器h〜hにおけるしきい値θ〜θが決定され、弱識別器h〜hにそれぞれに対応する重み付け係数w〜wが決定される。それにより、検出対象物の有無の判定に重要な情報を含む特徴量を用いて検出対象物の有無を高い精度で判定することが可能となる。
特に、アダブースト学習によりT個の特徴量v〜vの選択、T個の弱識別器h〜hにおけるしきい値θ〜θの決定および弱識別器h〜hにそれぞれに対応する重み付け係数w〜wの決定が行われることにより、環境変動に対して頑健な(ロバストな)対象物検出装置10が実現される。
また、距離画像データDVに複数の検出窓DWが位置およびサイズの少なくとも一方が異なるように順次設定されるので、任意の位置にある検出対象物または任意の大きさを有する検出対象物を正確に検出することができる。
この対象物検出装置10によれば、人と植物とを区別することが可能となる。ゴルフカート100の経路に成長した樹木の枝または草が延びている場合、または経路のカーブ前方に樹木等が植えられている場合に、それらの枝、草または樹木等を人として検出することが防止される。したがって、このような枝、草または樹木等が実際にはゴルフカート100の走行上問題がない場合に、ゴルフカート100の無駄な停止、減速または警告の発生が行われることが防止される。
(13)他の実施の形態
(a)上記実施の形態では、対象物検出装置10が予め定められた経路を自動的に走行するゴルフカート100に適用されているが、本発明はこれに限定されない。本発明に係る対象物検出装置は、工場等で予め定められた経路を走行する無人搬送車(AGV)、果樹園等で薬剤散布等を行う無人作業車等の他の自動走行車両にも同様に適用可能である。また、本発明に係る対象物検出装置は、任意の経路を走行可能な自動走行車両にも適用可能ある。
(b)上記実施の形態では、ステレオマッチング部3、LBP生成部4、対象物検出窓設定部5および対象物検出部6がCPU32および対象物検出プログラムにより実現されるが、本発明はこれに限定されない。例えば、ステレオマッチング部3、LBP生成部4、対象物検出窓設定部5および対象物検出部6の一部または全部が電子回路等のハードウエアにより構成されてもよい。
(c)上記実施の形態では、各特徴量vがしきい値θよりも大きい場合に識別値h(I)を1とし、その他の場合に識別値h(I)を−1としているが、検出対象物の有無の判定方法はこれに限定さない。例えば、各特徴量vがしきい値θよりも大きい場合に識別値h(I)を−1とし、その他の場合に識別値h(I)を1としてもよい。また、各特徴量vがしきい値θよりも大きい場合に識別値h(I)を他の値とし、その他の場合に識別値h(I)をさらに他の値としてもよい。
(d)上記実施の形態では、検出対象物の有無に応じて判定結果H(I)が正または負となるように識別演算式が構成されるが、識別演算式の構成はこれに限定されない。例えば、検出対象物の有無に応じて判定結果H(I)がある値以上または以下になるように識別演算式が構成されてもよい。
また、上記の識別演算式では、しきい値αが用いられるが、しきい値αが用いられなくてもよい。
(14)請求項の各構成要素と実施の形態の各部との対応関係
以下、請求項の各構成要素と実施の形態の各部との対応の例について説明するが、本発明は下記の例に限定されない。
上記実施の形態においては、カメラ1L,1Rが画像取得部の例であり、ステレオマッチング部3が距離画像生成部の例であり、LBP生成部4、対象物検出窓設定部5および対象物検出部6が処理部の例である。左画像LIおよび右画像RIが撮像対象の画像の例であり、左画像データLVおよび右画像データRVが撮像画像データの例であり、距離画像DIが距離画像の例であり、距離画像データDVが距離画像データの例であり、セルCEまたは検出窓DWが単位領域の例であり、設定値uが設定値の例であり、複数の特徴量v〜vが複数の特徴量の例である。
しきい値θ〜θがしきい値の例であり、識別値h(I)〜h(I)が識別値の例であり、重み付け係数w〜wが重み付け係数の例であり、検出窓DWが検出窓の例である。
車体20が本体部の例であり、駆動モータ21および後輪12が駆動部の例であり、CPU32がコンピュータの例である。車両制御部50が制御部の例である。
請求項の各構成要素として、上記実施の形態に記載された構成要素の他、請求項に記載されている構成または機能を有する他の種々の構成要素を用いることもできる。
本発明は、撮像対象が予め定められた検出対象物を含むか否かを判定するため等に利用することができる。
1L,1R カメラ
2L,2R 画像メモリ
3 ステレオマッチング部
4 LBP生成部
5 対象物検出窓設定部
6 対象物検出部
8 対象物検出用辞書
10 対象物検出装置
11 前輪
12 後輪
13 前部シート
14 後部シート
15 ハンドル
16 キャリア
20 車体
20a 下部車体
20b 支持枠
20c 屋根部
21 駆動モータ
22 トランスミッション
23 電磁ブレーキ
24 アクセルペダル
25 ブレーキペダル
26 ブレーキ駆動部
30 演算処理部
31 入出力インタフェース
32 CPU(中央演算処理装置)
33 ROM(リードオンリメモリ)
34 RAM(ランダムアクセスメモリ)
35 内部バス
40 外部記憶装置
50 車両制御部
51 バッテリ
57 受信部
100 ゴルフカート
CE セル
DI 距離画像
DV 距離画像データ
DW 検出窓
h,h〜h 弱識別器
LV,L〜L 左画像データ
LI 左画像
LM 左マッチング窓
OP 注目画素
p1〜p8 画素部分
P1〜P8 周辺画素
r 半径
RV,R〜R 右画像データ
RI 右画像
RM 右マッチング窓
,v〜v 特徴量
,w〜w 重み付け係数
θ 下限
θ 上限
θ,θ,θ〜θ しきい値

Claims (12)

  1. 撮像対象が予め定められた検出対象物を含むか否かを判定する対象物検出装置であって、
    異なる複数の位置に配置され、撮像対象の画像を撮像画像データとしてそれぞれ取得する複数の画像取得部と、
    前記複数の画像取得部により取得された複数の撮像画像データを用いたステレオマッチングにより撮像対象までの距離を示す距離画像を距離画像データとして生成する距離画像生成部と、
    前記距離画像生成部により生成された距離画像データに基づいて撮像対象が検出対象物を含むか否かを判定する処理部とを備え、
    前記処理部は、前記距離画像生成部により生成された距離画像データの複数の画素についてLBP(ローカルバイナリパターン)を生成するとともに、前記距離画像生成部により生成された距離画像データに複数の画素から構成される複数の単位領域を設定し、各単位領域について複数種類のLBPのヒストグラムを作成し、各ヒストグラムにおいて設定値以下の数の0−1遷移を有する複数種類のLBPをそれぞれ複数のビンに設定するとともに前記設定値を超える数の0−1遷移を有する1または複数種類のLBPを一のビンに集約して設定し、前記複数の単位領域についての複数のヒストグラムの複数のビンのうち予め選択された複数のビンに対応する複数種類のLBPの度数を複数の特徴量の値として用いて検出対象物の有無を判定するように構成される、対象物検出装置。
  2. 前記処理部は、各特徴量の値がそれぞれ予め設定されたしきい値よりも大きいか否かに基づいて撮像対象が検出対象物を含むか否かを示す識別値を生成し、前記複数の特徴量についての識別値とそれぞれ予め設定された重み付け係数との積の合計に基づいて検出対象物の有無を判定するように構成される、請求項1記載の対象物検出装置。
  3. 前記しきい値、および前記複数の特徴量についての識別値に対応する重み付け係数は、検出対象物を含む複数の画像および検出対象物を含まない複数の画像を用いた学習により予め設定される、請求項2記載の対象物検出装置。
  4. 前記処理部は、前記距離画像生成部により生成された距離画像データに、前記複数の単位領域をそれぞれ含む複数の検出窓を位置および面積の少なくとも一方が異なるように順次設定し、各検出窓について検出対象物の有無を判定するように構成される、請求項1〜3のいずれかに記載の対象物検出装置。
  5. 前記処理部は、前記複数の検出窓に含まれる前記複数の単位領域の数が等しくなるように各単位領域に含まれる画素の数を調整し、各ヒストグラムを対応する単位領域に含まれる画素の数を用いて正規化するように構成される、請求項4記載の対象物検出装置。
  6. 撮像対象が予め定められた検出対象物を含むか否かを判定する対象物検出方法であって、
    異なる複数の位置に配置された複数の画像取得部により撮像対象の画像を撮像画像データとしてそれぞれ取得するステップと、
    前記取得された複数の撮像画像データを用いたステレオマッチングにより撮像対象までの距離を示す距離画像を距離画像データとして生成するステップと、
    前記生成された距離画像データに基づいて撮像対象が検出対象物を含むか否かを判定するステップとを備え、
    撮像対象が検出対象物を含むか否かを判定するステップは、
    前記生成された距離画像データに複数の画素から構成される複数の単位領域を設定するステップと、
    各単位領域の複数の画素についてLBP(ローカルバイナリパターン)を生成するステップと、
    各単位領域について複数種類のLBPのヒストグラムを作成し、各ヒストグラムにおいて設定値以下の数の0−1遷移を有する複数種類のLBPをそれぞれ複数のビンに設定するとともに前記設定値を超える数の0−1遷移を有する1または複数種類のLBPを一のビンに集約して設定するステップと、
    前記複数の単位領域についての複数のヒストグラムの複数のビンのうち予め選択された複数のビンに対応する複数種類のLBPの度数を複数の特徴量の値として用いて検出対象物の有無を判定するステップとを含む、対象物検出方法。
  7. 検出対象物の有無を判定するステップは、
    各特徴量の値がそれぞれ予め設定されたしきい値よりも大きいか否かに基づいて撮像対象が検出対象物を含むか否かを示す識別値を生成するステップと、
    前記複数の特徴量についての識別値とそれぞれ予め設定された重み付け係数との積の合計に基づいて検出対象物の有無を判定するステップとを含む、請求項6記載の対象物検出方法
  8. 前記しきい値、および前記複数の特徴量についての識別値に対応する重み付け係数を、検出対象物を含む複数の画像および検出対象物を含まない複数の画像を用いた学習により予め設定するステップをさらに備える、請求項7記載の対象物検出方法。
  9. 前記学習にはアダブーストが適用される、請求項8記載の対象物検出方法。
  10. 撮像対象が予め定められた検出対象物を含むか否かを判定するために、コンピュータにより実行可能な対象物検出プログラムであって、
    異なる複数の位置に配置された複数の画像取得部により撮像対象の画像を撮像画像データとしてそれぞれ取得する処理と、
    前記取得された複数の撮像画像データを用いたステレオマッチングにより撮像対象までの距離を示す距離画像を距離画像データとして生成するステップと、
    前記生成された距離画像データに基づいて撮像対象が検出対象物を含むか否かを判定する処理とを、前記コンピュータに実行させ、
    撮像対象が検出対象物を含むか否かを判定する処理は、
    前記生成された距離画像データに複数の画素から構成される複数の単位領域を設定する処理と、
    各単位領域の複数の画素についてLBP(ローカルバイナリパターン)を生成する処理と、
    各単位領域について複数種類のLBPのヒストグラムを作成し、各ヒストグラムにおいて設定値以下の数の0−1遷移を有する複数種類のLBPをそれぞれ複数のビンに設定するとともに前記設定値を超える数の0−1遷移を有する1または複数種類のLBPを一のビンに集約して設定する処理と、
    前記複数の単位領域についての複数のヒストグラムの複数のビンのうち予め選択された複数のビンに対応する複数種類のLBPの度数を複数の特徴量の値として用いて検出対象物の有無を判定する処理とを含む、対象物検出プログラム。
  11. 予め定められた経路を移動可能に構成された本体部と、
    前記本体部を移動させるように構成された駆動部と、
    請求項1〜5のいずれかに記載の対象物検出装置と、
    前記対象物検出装置の判定結果に基づいて前記駆動部を制御する制御部とを備える、自動走行車両。
  12. 前記本体部は、予め定められた経路を移動可能に構成される、請求項11記載の自動走行車両。
JP2012046820A 2012-03-02 2012-03-02 対象物検出装置、対象物検出方法、対象物検出プログラムおよび自動走行車両 Active JP5946294B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2012046820A JP5946294B2 (ja) 2012-03-02 2012-03-02 対象物検出装置、対象物検出方法、対象物検出プログラムおよび自動走行車両

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012046820A JP5946294B2 (ja) 2012-03-02 2012-03-02 対象物検出装置、対象物検出方法、対象物検出プログラムおよび自動走行車両

Publications (2)

Publication Number Publication Date
JP2013182494A JP2013182494A (ja) 2013-09-12
JP5946294B2 true JP5946294B2 (ja) 2016-07-06

Family

ID=49273085

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012046820A Active JP5946294B2 (ja) 2012-03-02 2012-03-02 対象物検出装置、対象物検出方法、対象物検出プログラムおよび自動走行車両

Country Status (1)

Country Link
JP (1) JP5946294B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109094442A (zh) * 2018-07-18 2018-12-28 河海大学 一种用于混凝土坝施工的无人运输车

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6320806B2 (ja) * 2014-03-17 2018-05-09 国立大学法人豊橋技術科学大学 三次元モデル検索方法、及び三次元モデル検索システム
JP6452324B2 (ja) * 2014-06-02 2019-01-16 キヤノン株式会社 画像処理装置、画像処理方法及びプログラム
KR101598712B1 (ko) * 2014-10-15 2016-02-29 유상희 물체 검출을 위한 학습 방법 및 그 물체 검출 방법

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010067144A (ja) * 2008-09-12 2010-03-25 Muratec Automation Co Ltd 搬送システム及び衝突防止システム
WO2010140613A1 (ja) * 2009-06-03 2010-12-09 学校法人中部大学 物体検出装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109094442A (zh) * 2018-07-18 2018-12-28 河海大学 一种用于混凝土坝施工的无人运输车

Also Published As

Publication number Publication date
JP2013182494A (ja) 2013-09-12

Similar Documents

Publication Publication Date Title
CN106980871B (zh) 应用到道路场景图像的低保真分类器和高保真分类器
US10157441B2 (en) Hierarchical system for detecting object with parallel architecture and hierarchical method thereof
WO2019137137A1 (en) Activity recognition method using videotubes
KR102279350B1 (ko) 자율 주행 상황에서 장애물 검출을 위한 cnn 학습용 이미지 데이터 세트의 생성 방법 및 장치, 그리고 이를 이용한 테스트 방법 및 테스트 장치
EP3644276A1 (en) Methods and systems for the fast estimation of three-dimensional bounding boxes and drivable surfaces using lidar point clouds
US8487991B2 (en) Clear path detection using a vanishing point
US9971934B2 (en) System and method for partially occluded object detection
Jeong et al. Efficient and robust classification method using combined feature vector for lane detection
US10474930B1 (en) Learning method and testing method for monitoring blind spot of vehicle, and learning device and testing device using the same
JP5946294B2 (ja) 対象物検出装置、対象物検出方法、対象物検出プログラムおよび自動走行車両
CN110659550A (zh) 交通标志牌识别方法、装置、计算机设备和存储介质
CN112862845B (zh) 一种基于置信度评估的车道线重构方法及装置
EP2741234B1 (en) Object localization using vertical symmetry
CN113052873A (zh) 一种在线自监督学习场景适应的单目标跟踪方法
CN109325966B (zh) 一种通过时空上下文进行视觉跟踪的方法
US20070223785A1 (en) Image processor and method
CN113221739B (zh) 基于单目视觉的车距测量方法
CN113954838B (zh) 车辆换道的控制方法和装置、电子设备和存储介质
CN109726621B (zh) 行人检测方法、装置及设备
US10984262B2 (en) Learning method and testing method for monitoring blind spot of vehicle, and learning device and testing device using the same
KR101050687B1 (ko) 사후확률을 이용한 보행자 인식 장치 및 방법과 그를이용한 보행자 보호 장치
JP7230896B2 (ja) 車載センシング装置及びセンサパラメータ最適化装置。
CN110827327A (zh) 一种基于融合的长期目标跟踪方法
CN113706580B (zh) 一种基于相关滤波***的目标跟踪方法、***、设备及介质
JP2022148383A (ja) 学習方法、学習装置、及び、プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20150213

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20151023

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20151201

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160129

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20160510

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160531

R150 Certificate of patent or registration of utility model

Ref document number: 5946294

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250