JP7369921B2 - 物体識別システム、演算処理装置、自動車、車両用灯具、分類器の学習方法 - Google Patents

物体識別システム、演算処理装置、自動車、車両用灯具、分類器の学習方法 Download PDF

Info

Publication number
JP7369921B2
JP7369921B2 JP2020560058A JP2020560058A JP7369921B2 JP 7369921 B2 JP7369921 B2 JP 7369921B2 JP 2020560058 A JP2020560058 A JP 2020560058A JP 2020560058 A JP2020560058 A JP 2020560058A JP 7369921 B2 JP7369921 B2 JP 7369921B2
Authority
JP
Japan
Prior art keywords
range
image
images
identification system
object identification
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2020560058A
Other languages
English (en)
Other versions
JPWO2020121973A1 (ja
Inventor
健佑 荒井
徹 永島
晃志 伊多波
淳 狩野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koito Manufacturing Co Ltd
Original Assignee
Koito Manufacturing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Koito Manufacturing Co Ltd filed Critical Koito Manufacturing Co Ltd
Publication of JPWO2020121973A1 publication Critical patent/JPWO2020121973A1/ja
Application granted granted Critical
Publication of JP7369921B2 publication Critical patent/JP7369921B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01SRADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
    • G01S17/00Systems using the reflection or reradiation of electromagnetic waves other than radio waves, e.g. lidar systems
    • G01S17/02Systems using the reflection of electromagnetic waves other than radio waves
    • G01S17/06Systems determining position data of a target
    • G01S17/08Systems determining position data of a target for measuring distance only
    • G01S17/10Systems determining position data of a target for measuring distance only using transmission of interrupted, pulse-modulated waves
    • G01S17/18Systems determining position data of a target for measuring distance only using transmission of interrupted, pulse-modulated waves wherein range gates are used
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60QARRANGEMENT OF SIGNALLING OR LIGHTING DEVICES, THE MOUNTING OR SUPPORTING THEREOF OR CIRCUITS THEREFOR, FOR VEHICLES IN GENERAL
    • B60Q1/00Arrangement of optical signalling or lighting devices, the mounting or supporting thereof or circuits therefor
    • B60Q1/0017Devices integrating an element dedicated to another function
    • B60Q1/0023Devices integrating an element dedicated to another function the element being a sensor, e.g. distance sensor, camera
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01SRADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
    • G01S17/00Systems using the reflection or reradiation of electromagnetic waves other than radio waves, e.g. lidar systems
    • G01S17/88Lidar systems specially adapted for specific applications
    • G01S17/89Lidar systems specially adapted for specific applications for mapping or imaging
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2413Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/10Image acquisition
    • G06V10/12Details of acquisition arrangements; Constructional details thereof
    • G06V10/14Optical characteristics of the device performing the acquisition or on the illumination arrangements
    • G06V10/141Control of illumination
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/60Extraction of image or video features relating to illumination properties, e.g. using a reflectance or lighting model
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/764Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/772Determining representative reference patterns, e.g. averaging or distorting patterns; Generating dictionaries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/50Context or environment of the image
    • G06V20/56Context or environment of the image exterior to a vehicle by using sensors mounted on the vehicle
    • G06V20/58Recognition of moving objects or obstacles, e.g. vehicles or pedestrians; Recognition of traffic objects, e.g. traffic signs, traffic lights or roads
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/56Cameras or camera modules comprising electronic image sensors; Control thereof provided with illuminating means
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/61Control of cameras or camera modules based on recognised objects
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/70Circuitry for compensating brightness variation in the scene
    • H04N23/73Circuitry for compensating brightness variation in the scene by influencing the exposure time
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/70Circuitry for compensating brightness variation in the scene
    • H04N23/74Circuitry for compensating brightness variation in the scene by influencing the scene brightness using illuminating means
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/80Camera processing pipelines; Components thereof
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60QARRANGEMENT OF SIGNALLING OR LIGHTING DEVICES, THE MOUNTING OR SUPPORTING THEREOF OR CIRCUITS THEREFOR, FOR VEHICLES IN GENERAL
    • B60Q1/00Arrangement of optical signalling or lighting devices, the mounting or supporting thereof or circuits therefor
    • B60Q1/02Arrangement of optical signalling or lighting devices, the mounting or supporting thereof or circuits therefor the devices being primarily intended to illuminate the way ahead or to illuminate other areas of way or environments
    • B60Q1/04Arrangement of optical signalling or lighting devices, the mounting or supporting thereof or circuits therefor the devices being primarily intended to illuminate the way ahead or to illuminate other areas of way or environments the devices being headlights
    • B60Q1/06Arrangement of optical signalling or lighting devices, the mounting or supporting thereof or circuits therefor the devices being primarily intended to illuminate the way ahead or to illuminate other areas of way or environments the devices being headlights adjustable, e.g. remotely-controlled from inside vehicle
    • B60Q1/08Arrangement of optical signalling or lighting devices, the mounting or supporting thereof or circuits therefor the devices being primarily intended to illuminate the way ahead or to illuminate other areas of way or environments the devices being headlights adjustable, e.g. remotely-controlled from inside vehicle automatically
    • B60Q1/085Arrangement of optical signalling or lighting devices, the mounting or supporting thereof or circuits therefor the devices being primarily intended to illuminate the way ahead or to illuminate other areas of way or environments the devices being headlights adjustable, e.g. remotely-controlled from inside vehicle automatically due to special conditions, e.g. adverse weather, type of road, badly illuminated road signs or potential dangers
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60QARRANGEMENT OF SIGNALLING OR LIGHTING DEVICES, THE MOUNTING OR SUPPORTING THEREOF OR CIRCUITS THEREFOR, FOR VEHICLES IN GENERAL
    • B60Q2300/00Indexing codes for automatically adjustable headlamps or automatically dimmable headlamps
    • B60Q2300/40Indexing codes relating to other road users or special conditions
    • B60Q2300/45Special conditions, e.g. pedestrians, road signs or potential dangers
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Signal Processing (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computing Systems (AREA)
  • Medical Informatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Electromagnetism (AREA)
  • Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Remote Sensing (AREA)
  • Mathematical Physics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Molecular Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Mechanical Engineering (AREA)
  • Image Analysis (AREA)
  • Traffic Control Systems (AREA)
  • Image Processing (AREA)

Description

本発明は、物体識別システムに関する。
自動運転やヘッドランプの配光の自動制御のために、車両の周囲に存在する物体の位置および種類をセンシングする物体識別システムが利用される。物体識別システムは、センサと、センサの出力を解析する演算処理装置を含む。センサは、カメラ、LiDAR(Light Detection and Ranging、Laser Imaging Detection and Ranging)、ミリ波レーダ、超音波ソナーなどの中から、用途、要求精度やコストを考慮して選択される。
一般的な単眼のカメラからは、奥行きの情報を得ることができない。したがって、異なる距離に位置する複数の物体が重なっている場合に、それらを分離することが難しい。
奥行き情報が得られるカメラとして、TOFカメラが知られている。TOF(Time Of Flight)カメラは、発光デバイスによって赤外光を投光し、反射光がイメージセンサに戻ってくるまでの飛行時間を測定し、飛行時間を距離情報に変換した画像を得るものである。
特開2009-257983号公報 国際公開WO2017/110413A1
(項目1) 演算処理装置は、分類器を含む。分類器は、予め学習データ(訓練データともいう)を用いた機械学習により最適化される。分類器の識別率は、ひとえに学習データの選び方によるところが大きい。
本発明の第1側面は、係る状況においてなされたものであり、そのある態様の例示的な目的のひとつは、物体識別システムの識別率の改善あるいは学習コストの低減にある。
(項目2、3) 本出願人は、TOFカメラに代わるセンサ(以下、本明細書においてゲーティングカメラと称する)を提案している(特許文献1,2)。ゲーティングカメラは、撮影範囲を複数のレンジに区切り、レンジごとに露光タイミングおよび露光時間を変化させて複数回、撮像する。これにより、対象のレンジごとに画像が得られ、各画像は対応するレンジに含まれる物体のみを含む。
本発明の第2側面は、係る状況においてなされたものであり、そのある態様の例示的な目的のひとつは、ゲーティングカメラを用いた物体識別システムの提供にある。また本発明の第3側面は、ゲーティングカメラを用いた物体識別システムの識別率の改善、あるいは学習コストの低減にある。
(項目4、5)
ゲーティングカメラを用いた物体識別システムでは、複数のレンジに対応する複数の画像を処理する必要があるため、画像処理の負荷が大きくなる。したがって、低速な演算処理装置を用いる場合、フレームレートが低下し、フレームレートを高めようとすれば、高速な、言い換えれば高価な演算処理装置が必要となる。
本発明の第4側面および第5側面は、係る状況においてなされたものであり、そのある態様の例示的な目的のひとつは、ゲーティングカメラを用いた物体識別システムの演算処理量の削減および/または識別率の改善にある。
1. 本発明の第1側面のある態様は、物体識別システムに関する。物体識別システムは、カメラと、カメラの出力画像にもとづいて、物体を識別できるように機械学習された分類器を含む演算処理装置と、を備える。分類器は、奥行き方向について複数のレンジに区切り、レンジ毎に、投光と露光の時間差を変化させて撮影するゲーティングカメラにより得られた複数の画像を学習データとして機械学習されている。
2. 本発明の第2側面のある態様は、物体識別システムに関する。物体識別システムは、奥行き方向について複数のレンジに区切り、レンジ毎に、投光と露光の時間差を変化させて撮影するゲーティングカメラと、ゲーティングカメラによって得られる複数のレンジに対応する複数の画像にもとづいて、物体の種類を識別可能な演算処理装置と、を備える。演算処理装置は、アルゴリズムの異なる複数の分類器を含み、レンジに応じた分類器を選択して、物体認識を行う。
3. 本発明の第3側面のある態様は、物体識別システムに関する。物体識別システムは、奥行き方向について複数のレンジに区切り、レンジ毎に、投光と露光の時間差を変化させて撮影するゲーティングカメラと、ゲーティングカメラによって得られる複数のレンジに対応する複数の画像を、レンジ毎に規定された係数でスケーリングするスケーラと、スケーリング後の複数の画像それぞれにもとづいて、物体の種類を識別可能な分類器と、を備える。
4. 本発明の第4側面のある態様は物体識別システムに関する。物体識別システムは、奥行き方向について複数のレンジに区切り、レンジ毎に、投光と露光の時間差を変化させて撮影し、複数のレンジに対応する複数の画像を生成するゲーティングカメラと、物体が存在しうる位置が、複数の画像それぞれに固有の興味領域内に限定されているとの制約条件のもと、複数の画像それぞれに含まれる物体の種類を識別可能に構成される演算処理装置と、を備える。
本発明の第4側面の別の態様は、演算処理装置である。演算処理装置は、ゲーティングカメラとともに使用され、物体識別システムを構成する。ゲーティングカメラは、奥行き方向について複数のレンジに区切り、レンジ毎に、投光と露光の時間差を変化させて撮影し、複数のレンジに対応する複数の画像を生成する。演算処理装置は、物体が存在しうる位置が、複数の画像それぞれに固有の興味領域内に限定されているとの制約条件のもと、複数の画像それぞれに含まれる物体の種類を識別可能に構成される。
5. 本発明の第5側面のある態様は物体識別システムに関する。物体識別システムは、奥行き方向について複数のレンジに区切り、レンジ毎に、投光と露光の時間差を変化させて撮影し、複数のレンジに対応する複数の画像を生成するゲーティングカメラと、レンジ毎に、対応する画像に写る物体像のサイズの許容範囲が規定されており、許容範囲にもとづいて各画像に写る物体像の種類を識別可能に構成される演算処理装置と、を備える。
本発明の第5側面の別の態様は、演算処理装置に関する。この演算処理装置は、奥行き方向について複数のレンジに区切り、レンジ毎に、投光と露光の時間差を変化させて撮影し、複数のレンジに対応する複数の画像を生成するゲーティングカメラとともに使用され、物体識別システムを構成する演算処理装置であって、レンジ毎に、対応する画像に写る物体像のサイズの許容範囲が規定されており、各画像について、それに写る物体像の種類とサイズを検出し、複数の画像に対応する複数の検出データを生成する分類器と、複数の検出データを受け、各検出データに含まれる物体像のサイズが、許容範囲に含まれるか否かを判定する後処理部と、を備える。
本発明の第5側面のさらに別の態様もまた、演算処理装置である。この演算処理装置は、奥行き方向について複数のレンジに区切り、レンジ毎に、投光と露光の時間差を変化させて撮影し、複数のレンジに対応する複数の画像を生成するゲーティングカメラとともに使用され、物体識別システムを構成する演算処理装置であって、複数の画像それぞれについて、それに写る物体像ごとのサブ画像に切り分ける前処理部と、レンジ毎に、対応する画像に写る物体像のサイズの許容範囲が規定されており、前処理部により切り分けられたサブ画像のサイズが許容範囲に含まれる場合に、当該サブ画像に含まれる物体像の種類を判定する分類器と、を備える。
本発明のある側面によれば、識別率を改善でき、あるいは学習コストを下げることができる。
実施の形態1に係る物体識別システムのブロック図である。 ゲーティングカメラの動作を説明する図である。 図3(a)、(b)は、ゲーティングカメラを用いた学習データの取得を説明する図である。 図4(a)は、単眼カメラで撮影した画像IMGxを示す図である。 物体識別システムを備える自動車のブロック図である。 物体検出システムを備える車両用灯具を示すブロック図である。 変形例1に係る物体識別システムのブロック図である。 実施の形態2に係る物体識別システムのブロック図である。 ゲーティングカメラの動作を説明する図である。 図10(a)は、図8の物体識別システムの動作を説明するタイムチャートであり、図10(b)は、比較技術に係る物体識別システムの動作を説明するタイムチャートである。 物体識別システムを備える自動車のブロック図である。 物体検出システムを備える車両用灯具を示すブロック図である。 実施の形態3に係る物体識別システムのブロック図である。 ゲーティングカメラの動作を説明する図である。 図15(a)、(b)は、ゲーティングカメラにより得られる画像を説明する図である。 図16(a)、(b)は、ゲーティングカメラにより得られる画像を説明する図である。 図17(a)~(c)は、スケーラによるスケーリング処理の一例を説明する図である。 物体識別システムを備える自動車のブロック図である。 物体検出システムを備える車両用灯具を示すブロック図である。 図20(a)、(b)は、ゲーティングカメラにより得られる画像を説明する図である。 実施の形態4-1に係る物体識別システムのブロック図である。 ゲーティングカメラの動作を説明する図である。 図23(a)、(b)は、ゲーティングカメラにより得られる画像を説明する図である。 図24(a)、(b)は、ROIを説明する図である。 図25(a)、(b)は、図21の物体識別システムの動作を説明する図である。 実施の形態4-2に係る物体識別システムのブロック図である。 図27(a)、(b)は、図26の物体識別システムの動作を説明する図である。 図28(a)、(b)は、ROIの変形例を説明する図である。 図29(a)、(b)は、ROIの変形例を説明する図である。 図30(a)、(b)は、変形例3に係る物体識別システムの動作を説明する図である。 物体識別システムを備える自動車のブロック図である。 物体検出システムを備える車両用灯具を示すブロック図である。 実施の形態5-1に係る物体識別システムのブロック図である。 ゲーティングカメラの動作を説明する図である。 図35(a)、(b)は、ゲーティングカメラにより得られる画像を説明する図である。 図36(a)、(b)は、レンジ毎に撮影される画像を説明する図である。 サイズの許容範囲を説明する図である。 図38(a)、(b)は、図33の物体識別システムの動作を説明する図である。 実施の形態5-2に係る物体識別システムのブロック図である。 図40(a)、(b)は、図39の物体識別システムの動作を説明する図である。 物体識別システムを備える自動車のブロック図である。 物体検出システムを備える車両用灯具を示すブロック図である。
I 本発明の第1側面
I-1. 概要
本発明の第1側面に関連するある実施の形態は、物体識別システムに関する。物体識別システムは、カメラと、カメラの出力画像にもとづいて、物体を識別できるように機械学習された分類器を含む演算処理装置と、を備える。分類器は、奥行き方向について複数のレンジに区切り、レンジ毎に、投光と露光の時間差を変化させて撮影するゲーティングカメラにより得られた複数の画像を学習データとして機械学習されている。
ゲーティングカメラを用いることにより、奥行き方向に重なった複数の物体を分離した複数の画像を得ることができ、それらを別々の学習データとして用いることで、個々の物体に対する識別率を高めることができる。また、いわゆるかさ増しの効果が得られるため、学習コストを下げることができる。
カメラは、単眼カメラであってもよい。カメラは、ゲーティングカメラであってもよい。
I-2. 詳細な説明
以下、本発明の第1側面を、好適な実施の形態をもとに図面を参照しながら説明する。本明細書において、各図面に示される同一または同等の構成要素、部材、処理には、同一の符号を付するものとし、適宜重複した説明は省略する。また、実施の形態は、発明を限定するものではなく例示であって、実施の形態に記述されるすべての特徴やその組み合わせは、必ずしも発明の本質的なものであるとは限らない。
図1は、実施の形態1に係る物体識別システム10のブロック図である。この物体識別システム10は、自動車やバイクなどの車両に搭載され、車両の周囲に存在する物体OBJの種類(カテゴリ)を判定する。
物体識別システム10は、主としてカメラ30および演算処理装置40を備える。カメラ30は、単眼カメラであり、車両の周囲を撮影する。演算処理装置40は、分類器42を含む。分類器42は、カメラ30の出力画像IMGにもとづいて、物体OBJを識別できるように機械学習により得られた学習済みモデルにもとづいて実装されている。分類器42のアルゴリズムは特に限定されないが、YOLO(You Only Look Once)とSSD(Single Shot MultiBox Detector)、R-CNN(Region-based Convolutional Neural Network)、SPPnet(Spatial Pyramid Pooling)、Faster R-CNN、DSSD(Deconvolution -SSD)、Mask R-CNNなどを採用することができ、あるいは、将来開発されるアルゴリズムを採用できる。
図1には、物体識別システム10に加えて、機械学習を行う際のセットアップが示される。分類器42の機械学習には、ゲーティングカメラ50が用いられる。ゲーティングカメラ50は、奥行き方向について複数N個(N≧2)のレンジRNG~RNGに区切り、レンジ毎に、投光と露光の時間差を変化させて撮影するカメラである。ゲーティングカメラ50は、複数のレンジRNG~RNGに対応する複数の画像IMG~IMGを生成する。物体OBJの種類や向きなどを変えながら、ゲーティングカメラ50によって撮影することにより、物体OBJの種類ごとに、複数の画像IMG~IMGのセットが得られる。
こうして得られた複数の画像IMG~IMGのセットは、物体OBJの種類と対応付けて、コンピュータ60に入力される。コンピュータ60は、複数の画像IMG~IMGのセットを学習データ(訓練データ)として、分類器42の機械学習を実行する。コンピュータ60における機械学習の方法は公知技術を用いればよいため、説明を省略する。コンピュータ60によって最終的に得られた学習結果が、演算処理装置40に与えられて、分類器42が構成される。
ゲーティングカメラ50は、投光器52、イメージセンサ54およびコントローラ56を含む。ゲーティングカメラ50による撮像は、奥行き方向について複数N個(N≧2)のレンジRNG~RNGに区切って行われる。隣接するレンジ同士は、それらの境界において奥行き方向にオーバーラップしてもよい。
投光器52は、コントローラ56から与えられる投光タイミング信号S1と同期して、プローブ光L1を車両前方に照射する。プローブ光L1は赤外光であることが好ましいが、その限りでなく、所定の波長を有する可視光であってもよい。
イメージセンサ54は、コントローラ56から与えられる撮影タイミング信号S2と同期した露光制御が可能であり、画像IMGを生成可能に構成される。イメージセンサ54は、プローブ光L1と同じ波長に感度を有しており、物体OBJが反射した反射光(戻り光)L2を撮影する。
コントローラ56は、レンジ毎RNGに、投光タイミング信号S1と撮影タイミング信号S2を変化させて、投光器52による投光と、イメージセンサ54の露光の時間差を変化させる。カメラ30は、複数のレンジRNG~RNGに対応する複数の画像IMG~IMGを生成する。i番目の画像IMGには、対応するレンジRNGに含まれる物体のみが写ることとなる。
図2は、ゲーティングカメラ50の動作を説明する図である。図2にはi番目のレンジRNGを測定するときの様子が示される。投光器52は、投光タイミング信号S1と同期して、時刻t~tの間の発光期間τの間、発光する。最上段には、横軸に時間、縦軸に距離をとった光線のダイアグラムが示される。カメラ30から、レンジRNGの手前の境界までの距離をdMINi、レンジRNGの奥側の境界までの距離をdMAXiとする。
ある時刻に投光器52を出発した光が、距離dMINiに到達してその反射光がイメージセンサ54に戻ってくるまでのラウンドトリップ時間TMINiは、
MINi=2×dMINi/c
である。cは光速である。
同様に、ある時刻に投光器52を出発した光が、距離dMAXiに到達してその反射光がイメージセンサ54に戻ってくるまでのラウンドトリップ時間TMAXiは、
MAXi=2×dMAXi/c
である。
レンジRNGに含まれる物体OBJのみを撮影したいとき、コントローラ56は、時刻t=t+TMINiに露光を開始し、時刻t=t+TMAXiに露光を終了するように、撮影タイミング信号S2を生成する。これが1回の露光動作である。
i番目のレンジRNGを撮影する際に、複数回の露光を行ってもよい。この場合、コントローラ56は、所定の周期τで、上述の露光動作を複数回にわたり繰り返せばよい。
以上が物体識別システム10の構成である。続いて物体識別システム10の機械学習について説明する。
図3(a)、(b)は、ゲーティングカメラを用いた学習データの取得を説明する図である。この例ではN=2である。学習データの取得に際して、図3(a)に示すように、複数の物体OBJ,OBJが異なるレンジRNG,RNGに配置された状況を考える。この例では、OBJは歩行者であり、OBJは自動車である。
図3(b)には、図3(a)の状況で得られる、複数の画像IMG,IMGが示される。画像IMGには、手前側のレンジRNGに含まれる物体OBJのみが含まれ、画像IMGには、奥側の物体OBJのみが含まれる。つまり物体識別システム10のカメラ30から見たときに、重なって見える複数の物体OBJ,OBJを分離することができる。そして、複数の画像IMG,IMGを別々の学習データとしてコンピュータ60に入力することで、物体OBJ,OBJを別々の物体として識別可能な分類器42を構成することができる。
本実施の形態の利点は比較技術との対比によって明確となる。比較技術では、学習データとして、物体識別システム10のカメラ30と同様に、単眼カメラで撮影した画像IMGxを用いるものとする。図4(a)は、単眼カメラで撮影した画像IMGxを示す図である。図4(a)に示すように、画像IMGxでは、2つの物体OBJ,OBJが重なっている。
図4(b)には、歩行者(OBJ)を含むバウンディングボックスBBが示される。このバウンディングボックスBBの内側には、歩行者(OBJ)のみでなく、背景の車両(OBJ)の情報が含まれている。したがって図4(a)の画像IMGxを学習データとして用いると、車両の情報を込みで、歩行者OBJと識別できるように、学習が進む。言い換えれば、背景に車両が存在しない単独の歩行者を、歩行者と識別しにくくなるかもしれない。
図4(c)には、車両(OBJ)を含むバウンディングボックスBBが示される。このバウンディングボックスBBの内側には、車両(OBJ)のみでなく、手前側の歩行者(OBJ)の情報が含まれている。したがって図4(a)の画像IMGxを学習データとして用いると、歩行者の情報を込みで、車両OBJと識別できるように、学習が進む。言い換えれば、手前側に歩行者が存在しない単独の車両を、車両と識別しにくくなるかもしれない。
翻って本実施の形態に係る学習方法によれば、ゲーティングカメラを用いて、手前側の物体OBJと奥側の物体OBJを分離して、別々の画像として学習を行うことで、各物体OBJ(#=1,2)それぞれを、それ自身OBJのみの情報にもとづいて識別できるように学習が進むこととなる。これにより、ある物体OBJが単独で存在する状況であっても、それらが他の物体OBJ(i≠j)と重なっている状況であっても、物体OBJを正しく識別することができるようになる。
機械学習には、膨大な学習データが必要となるところ、状況や条件を変えて物体の画像を撮影すると、学習コストが高くなる。そこで、通常、「かさ増し」によって、1枚の基本画像を、複数の画像に増やす工夫がなされる。一般的なかさ増しの手法としては、基本画像の左右反転、回転、拡大縮小、輝度値の変更、コントラストの変更などが例示される。図4(a)の画像を基本画像として捉えた場合、ゲーティングカメラを用いることにより、それを2枚の画像に増やしているとも把握できる。つまりゲーティングカメラを用いることで、かさ増しの効果も得られている。
図5は、物体識別システム10を備える自動車のブロック図である。自動車300は、前照灯302L,302Rを備える。物体識別システム10は、前照灯302L,302Rの少なくとも一方に内蔵される。前照灯302は、車体の最も先端に位置しており、周囲の物体を検出する上で、カメラ30の設置箇所として最も有利である。
図6は、物体検出システム210を備える車両用灯具200を示すブロック図である。車両用灯具200は、車両側ECU304とともに灯具システム310を構成する。車両用灯具200は、光源202、点灯回路204、光学系206を備える。さらに車両用灯具200には、物体検出システム210が設けられる。物体検出システム210は、上述の物体識別システム10に対応しており、カメラ30および演算処理装置40を含む。
演算処理装置40が検出した物体OBJに関する情報は、車両用灯具200の配光制御に利用してもよい。具体的には、灯具側ECU208は、演算処理装置40が生成する物体OBJの種類とその位置に関する情報にもとづいて、適切な配光パターンを生成する。点灯回路204および光学系206は、灯具側ECU208が生成した配光パターンが得られるように動作する。
また演算処理装置40が検出した物体OBJに関する情報は、車両側ECU304に送信してもよい。車両側ECUは、この情報にもとづいて、自動運転を行ってもよい。
続いて、実施の形態1に関連する変形例を説明する。
(変形例1)
図7は、変形例1に係る物体識別システム10Aのブロック図である。物体識別システム10Aは、図1のカメラ30に代えて、ゲーティングカメラ20を備える。ゲーティングカメラ20の構成は、図1のゲーティングカメラ50と同様である。ゲーティングカメラ20は、奥行き方向について複数M個(M≧2)のレンジRNG~RNGに区切り、レンジ毎に、投光と露光の時間差を変化させて撮影するカメラである。ゲーティングカメラ20は、複数のレンジRNG~RNGに対応する複数の画像IMG~IMGを生成する。
分類器42は、ゲーティングカメラ20から、複数M個(M≧2)のレンジRNG~RNGに対応する複数の画像IMG~IMGを受ける。分類器42は、複数の画像IMG~IMGにもとづいて、それらに含まれる物体の種類を識別可能に構成される。分類器42の学習には、ゲーティングカメラ50によって得られた複数の画像IMG~IMGが用いられる。ゲーティングカメラ50のレンジの個数Nと、ゲーティングカメラ20のレンジの個数Mは同一であってもよいし、異なっていてもよい。
II 本発明の第2側面
II-1. 概要
本発明の第2側面に関連するある実施の形態は、車載用の物体識別システムに関する。物体識別システムは、奥行き方向について複数のレンジに区切り、レンジ毎に、投光と露光の時間差を変化させて撮影するゲーティングカメラと、ゲーティングカメラによって得られる複数のレンジに対応する複数の画像にもとづいて、物体の種類を識別可能な演算処理装置と、を備える。演算処理装置は、アルゴリズムの異なる複数の分類器を含み、レンジに応じた分類器を選択して、物体認識を行う。
この態様によると、近い物体と遠い物体とで異なるアルゴリズムを適用することにより、識別率を高めることができる。
演算処理装置は、距離が近いレンジの画像処理に、YOLO(You Only Look Once)アルゴリズムの分類器を用いてもよい。YOLOは、小さい物体の識別に不適であるが、高速であるという利点を有する。画像に含まれる物体は、物体までの距離が短い方が大きいため、YOLOを用いることで、距離が近いレンジに含まれる物体を高精度かつ高速に検出・識別できる。
演算処理装置は、距離が遠いレンジの画像処理に、SSD(Single Shot MultiBox Detector)アルゴリズムの分類器を用いてもよい。SSDは、処理速度は劣るが、小さい物体まで高精度に検出できるという利点がある。画像に含まれる物体は、物体までの距離が長い方が小さいため、SSDを用いることで、距離が遠いレンジに含まれる物体を高精度に検出・識別できる。
演算処理装置は、相対的に距離が近いレンジの画像処理に、相対的に高速なアルゴリズムの分類器を用いてもよい。
また演算処理装置は、相対的に距離が遠いレンジの画像処理に、相対的に高精度なアルゴリズムの分類器を用いてもよい。
II-2. 詳細な説明
図8は、実施の形態2に係る物体識別システム10のブロック図である。この物体識別システム10は、自動車やバイクなどの車両に搭載され、車両の周囲に存在する物体OBJの種類(カテゴリ)を判定する。
物体識別システム10は、主としてゲーティングカメラ20および演算処理装置40を備える。ゲーティングカメラ20は、投光器22、イメージセンサ24、コントローラ26を含む。ゲーティングカメラ20による撮像は、奥行き方向について複数N個(N≧2)のレンジRNG~RNGに区切って行われる。隣接するレンジ同士は、それらの境界において奥行き方向にオーバーラップしてもよい。
投光器22は、コントローラ26から与えられる投光タイミング信号S1と同期して、プローブ光L1を車両前方に照射する。プローブ光L1は赤外光であることが好ましいが、その限りでなく、所定の波長を有する可視光であってもよい。
イメージセンサ24は、コントローラ26から与えられる撮影タイミング信号S2と同期した露光制御が可能であり、画像IMGを生成可能に構成される。イメージセンサ24は、プローブ光L1と同じ波長に感度を有しており、物体OBJが反射した反射光(戻り光)L2を撮影する。
コントローラ26は、レンジ毎RNGに、投光タイミング信号S1と撮影タイミング信号S2を変化させて、投光器22による投光と、イメージセンサ24の露光の時間差を変化させる。ゲーティングカメラ20は、複数のレンジRNG~RNGに対応する複数の画像IMG~IMGを生成する。i番目の画像IMGには、対応するレンジRNGに含まれる物体のみが写ることとなる。
図9は、ゲーティングカメラ20の動作を説明する図である。図9にはi番目のレンジRNGを測定するときの様子が示される。投光器22は、投光タイミング信号S1と同期して、時刻t~tの間の発光期間τの間、発光する。最上段には、横軸に時間、縦軸に距離をとった光線のダイアグラムが示される。ゲーティングカメラ20から、レンジRNGの手前の境界までの距離をdMINi、レンジRNGの奥側の境界までの距離をdMAXiとする。
ある時刻に投光器22を出発した光が、距離dMINiに到達してその反射光がイメージセンサ24に戻ってくるまでのラウンドトリップ時間TMINiは、
MINi=2×dMINi/c
である。cは光速である。
同様に、ある時刻に投光器22を出発した光が、距離dMAXiに到達してその反射光がイメージセンサ24に戻ってくるまでのラウンドトリップ時間TMAXiは、
MAXi=2×dMAXi/c
である。
レンジRNGに含まれる物体OBJのみを撮影したいとき、コントローラ26は、時刻t=t+TMINiに露光を開始し、時刻t=t+TMAXiに露光を終了するように、撮影タイミング信号S2を生成する。これが1回の露光動作である。
i番目のレンジRNGを撮影する際に、複数回の露光を行ってもよい。この場合、コントローラ26は、所定の周期τで、上述の露光動作を複数回にわたり繰り返せばよい。
図8に戻る。演算処理装置40は、ゲーティングカメラ20によって得られる複数のレンジRNG~RNGに対応する複数の画像IMG~IMGにもとづいて、物体の種類を識別可能に構成される。演算処理装置40は、CPU(Central Processing Unit)やMPU(Micro Processing Unit)、マイコンなどのプロセッサ(ハードウェア)と、プロセッサ(ハードウェア)が実行するソフトウェアプログラムの組み合わせで実装することができる。演算処理装置40は、複数のプロセッサの組み合わせであってもよい。あるいは演算処理装置40はハードウェアのみで構成してもよい。
演算処理装置40は、アルゴリズムの異なる複数M個(M≧2)の分類器42_1~42_Mを含む。セレクタ44は、各画像IMGを、レンジRNGに応じて選択された分類器42に対して供給する。分類器42は、与えられた画像IMGを処理して、それに含まれる物体の検出・クラス分類(識別)を行う。
分類器42の個数Mは、レンジRNGの個数Nと同数であってもよいし、それより少なくてもよい。
複数のアルゴリズムのひとつは、高速であるが、精度が低い(言い換えれば、小さい物体の検出精度が低い)アルゴリズムであってもよい。また複数のアルゴリズムの別のひとつは、低速であるが、精度が高い(言い換えれば、小さい物体の検出精度が高い)アルゴリズムであってもよい。
演算処理装置40は、相対的に距離が近いレンジの画像処理に、相対的に高速で精度が低いアルゴリズムの分類器を用いるとよい。また演算処理装置40は、相対的に距離が遠いレンジの画像処理に、相対的に低速で精度が高いアルゴリズムの分類器を用いるとよい。
たとえば複数のアルゴリズムのひとつは、YOLO(You Only Look Once)アルゴリズムが好適である。また、複数のアルゴリズムの別のひとつは、SSD(Single Shot MultiBox Detector)アルゴリズムが好適である。
以上が物体識別システム10の構成である。続いてその動作を説明する。
図10(a)は、図8の物体識別システム10の動作を説明するタイムチャートである。ここでは、M=2,N=2として、1番目のレンジRNGの画像IMGの処理に、YOLOアルゴリズムの分類器42_1を割り当て、2番目のレンジRNGの画像IMGの処理に、SSDアルゴリズムの分類器42_2を割り当てるものとする。
ゲーティングカメラ20によって、レンジRNGの画像IMGが取得され、それがYOLOアルゴリズムの分類器42_1によって処理される。続いてゲーティングカメラ20によって、レンジRNGの画像IMGが取得され、それSSDアルゴリズムの分類器42_2によって処理される。
以上が物体識別システム10の動作である。この物体識別システム10によれば、互いに相補的な関係にある2つ、あるいは3個以上のアルゴリズムの分類器を用い、撮影レンジごとに分類器を割り当てることにより、近い物体と遠い物体を高精度に、短時間で検出できる。
より詳しくは、YOLOは、小さい物体の識別に不適であるが、高速であるという利点を有する。画像に含まれる物体は、物体までの距離が短い方が大きく写る。したがって、距離が近いレンジRNGの画像処理に、YOLOを用いることで、距離が近いレンジに含まれる物体を高精度かつ高速に検出・識別できる。
またSSDは、処理速度はYOLOに劣るが、小さい物体まで高精度に検出できるという利点がある。画像に含まれる物体は、物体までの距離が長い方が小さいため、SSDを用いることで、距離が遠いレンジに含まれる物体を高精度に検出・識別できる。
図8の物体識別システム10の利点は、比較技術との対比によって明確となる。比較技術では、レンジにかかわらず、高精度なアルゴリズム(SSD)の分類器によって処理する。図10(b)には、比較技術に係る物体識別システムの動作を説明するタイムチャートである。すべての画像IMG,IMGに対してSSDアルゴリズムを適用すれば、物体の距離にかかわらず高精度な検出が可能である。しかしながら、すべてのレンジについて物体認識を行うのに要する検出時間が、図10(a)と比べて長くなる。言い換えれば、比較技術ではフレームレートが低下することを意味する。比較技術において高いフレームレートを実現しようとすれば、演算処理装置40に高速なCPUやマイコンが必要となり、物体識別システム10のコストが高くなる。
翻って実施の形態2に係る物体識別システム10によれば、複数のアルゴリズムを組み合わせることにより、それほど高価(高速な)なハードウェアを用いなくても、高い検出精度と、高いフレームレートを両立させることができる。
図11は、物体識別システム10を備える自動車のブロック図である。自動車300は、前照灯302L,302Rを備える。物体識別システム10は、前照灯302L,302Rの少なくとも一方に内蔵される。前照灯302は、車体の最も先端に位置しており、周囲の物体を検出する上で、ゲーティングカメラ20の設置箇所として最も有利である。
図12は、物体検出システム210を備える車両用灯具200を示すブロック図である。車両用灯具200は、車両側ECU304とともに灯具システム310を構成する。車両用灯具200は、光源202、点灯回路204、光学系206を備える。さらに車両用灯具200には、物体検出システム210が設けられる。物体検出システム210は、上述の物体識別システム10に対応しており、ゲーティングカメラ20および演算処理装置40を含む。
演算処理装置40が検出した物体OBJに関する情報は、車両用灯具200の配光制御に利用してもよい。具体的には、灯具側ECU208は、演算処理装置40が生成する物体OBJの種類とその位置に関する情報にもとづいて、適切な配光パターンを生成する。点灯回路204および光学系206は、灯具側ECU208が生成した配光パターンが得られるように動作する。
また演算処理装置40が検出した物体OBJに関する情報は、車両側ECU304に送信してもよい。車両側ECUは、この情報にもとづいて、自動運転を行ってもよい。
続いて、実施の形態2に関連する変形例を説明する。
(変形例1)
M=2,N≧3である場合、1番目~k番目のレンジRNG~RNGの画像IMG~IMGの処理に、YOLOアルゴリズムの分類器42_1を割り当て、k+1番目~N番目のレンジRNGk+1~RNGの画像IMGk+1~IMGの処理に、SSDアルゴリズムの分類器42_2を割り当てるとよい。
(変形例2)
実施の形態2では、複数のアルゴリズムとして、YOLOとSSDを説明したが、その限りでない。物体認識のアルゴリズムとしては、R-CNN(Region-based Convolutional Neural Network)、SPPnet(Spatial Pyramid Pooling)、Faster R-CNN、DSSD(Deconvolution -SSD)、Mask R-CNNなどが知られており、それらのいずれかを採用することができ、あるいは、将来開発されるアルゴリズムを採用してもよいことはいうまでもない。
III 本発明の第3側面
III-1. 概要
本発明の第3側面に関連するある実施の形態は、物体識別システムに関する。物体識別システムは、奥行き方向について複数のレンジに区切り、レンジ毎に、投光と露光の時間差を変化させて撮影するゲーティングカメラと、ゲーティングカメラによって得られる複数のレンジに対応する複数の画像を、レンジ毎に規定された係数でスケーリングするスケーラと、スケーリング後の複数の画像それぞれにもとづいて、物体の種類を識別可能な分類器と、を備える。
この態様によると、分類器に入力される複数の画像において、同じ物体のサイズを揃えることができる。これにより分類器の識別力を高め、あるいは学習コストを下げることができる。
係数は、近いレンジほど小さく、遠いレンジほど大きくてもよい。
複数のレンジのひとつを基準レンジとしてもよい。基準レンジの係数を1とし、基準レンジより近いレンジの係数は1より小さく、基準レンジより遠いレンジの係数は1より大きく定めてもよい。これによりスケーラの処理を簡素化できる。また、学習に際しては、基準レンジに物体を配置して撮影した画像を重点化的に用いればよく、基準レンジ以外に物体を配置した撮影の回数を減らすことができる。
III-2. 詳細な説明
以下、本発明の第3側面を、好適な実施の形態をもとに図面を参照しながら説明する。
図13は、実施の形態3に係る物体識別システム10のブロック図である。この物体識別システム10は、自動車やバイクなどの車両に搭載され、車両の周囲に存在する物体OBJの種類(カテゴリ)を判定する。
物体識別システム10は、主としてゲーティングカメラ20および演算処理装置40を備える。ゲーティングカメラ20は、投光器22、イメージセンサ24、コントローラ26を含む。ゲーティングカメラ20による撮像は、奥行き方向について複数N個(N≧2)のレンジRNG~RNGに区切って行われる。隣接するレンジ同士は、それらの境界において奥行き方向にオーバーラップしてもよい。
投光器22は、コントローラ26から与えられる投光タイミング信号S1と同期して、プローブ光L1を車両前方に照射する。プローブ光L1は赤外光であることが好ましいが、その限りでなく、所定の波長を有する可視光であってもよい。
イメージセンサ24は、コントローラ26から与えられる撮影タイミング信号S2と同期した露光制御が可能であり、画像IMGを生成可能に構成される。イメージセンサ24は、プローブ光L1と同じ波長に感度を有しており、物体OBJが反射した反射光(戻り光)L2を撮影する。
コントローラ26は、レンジ毎RNGに、投光タイミング信号S1と撮影タイミング信号S2を変化させて、投光器22による投光と、イメージセンサ24の露光の時間差を変化させる。ゲーティングカメラ20は、複数のレンジRNG~RNGに対応する複数の画像IMG~IMGを生成する。i番目の画像IMGには、対応するレンジRNGに含まれる物体のみが写ることとなる。
図14は、ゲーティングカメラ20の動作を説明する図である。図14にはi番目のレンジRNGを測定するときの様子が示される。投光器22は、投光タイミング信号S1と同期して、時刻t~tの間の発光期間τの間、発光する。最上段には、横軸に時間、縦軸に距離をとった光線のダイアグラムが示される。ゲーティングカメラ20から、レンジRNGの手前の境界までの距離をdMINi、レンジRNGの奥側の境界までの距離をdMAXiとする。
ある時刻に投光器22を出発した光が、距離dMINiに到達してその反射光がイメージセンサ24に戻ってくるまでのラウンドトリップ時間TMINiは、
MINi=2×dMINi/c
である。cは光速である。
同様に、ある時刻に投光器22を出発した光が、距離dMAXiに到達してその反射光がイメージセンサ24に戻ってくるまでのラウンドトリップ時間TMAXiは、
MAXi=2×dMAXi/c
である。
レンジRNGに含まれる物体OBJのみを撮影したいとき、コントローラ26は、時刻t=t+TMINiに露光を開始し、時刻t=t+TMAXiに露光を終了するように、撮影タイミング信号S2を生成する。これが1回の露光動作である。
i番目のレンジRNGを撮影する際に、複数回の露光を行ってもよい。この場合、コントローラ26は、所定の周期τで、上述の露光動作を複数回にわたり繰り返せばよい。
図15(a)、(b)は、ゲーティングカメラ20により得られる画像を説明する図である。図15(a)の例では、レンジRNGに物体(歩行者)OBJが存在し、レンジRNGに物体(車両)OBJが存在している。図15(b)には、図15(a)の状況で得られる複数の画像IMG~IMGが示される。画像IMGを撮影するとき、イメージセンサはレンジRNGからの反射光のみにより露光されるため、画像IMGにはいかなる物体も写らない。
画像IMGを撮影するとき、イメージセンサはレンジRNGからの反射光のみにより露光されるため、画像IMGには、物体OBJのみが写る。同様に画像IMGを撮影するとき、イメージセンサはレンジRNGからの反射光のみにより露光されるため、画像IMGには、物体OBJのみが写る。このようにゲーティングカメラ20によれば、レンジごとに物体を分離して撮影することができる。
図13に戻る。演算処理装置40は、ゲーティングカメラ20によって得られる複数のレンジRNG~RNGに対応する複数の画像IMG~IMGにもとづいて、物体の種類を識別可能に構成される。演算処理装置40は、機械学習によって生成されたモデルにもとづいて実装される分類器42を備える。分類器42のアルゴリズムは特に限定されないが、YOLO(You Only Look Once)とSSD(Single Shot MultiBox Detector)、R-CNN(Region-based Convolutional Neural Network)、SPPnet(Spatial Pyramid Pooling)、Faster R-CNN、DSSD(Deconvolution -SSD)、Mask R-CNNなどを採用することができ、あるいは、将来開発されるアルゴリズムを採用できる。
演算処理装置40は、CPU(Central Processing Unit)やMPU(Micro Processing Unit)、マイコンなどのプロセッサ(ハードウェア)と、プロセッサ(ハードウェア)が実行するソフトウェアプログラムの組み合わせで実装することができる。演算処理装置40は、複数のプロセッサの組み合わせであってもよい。あるいは演算処理装置40はハードウェアのみで構成してもよい。
本発明者は、分類器42のトレーニングについて検討した結果、以下の課題を認識するに至った。
分類器42のトレーニングには、膨大な数の学習データ(トレーニングデータ)が用いられる。学習データには、ゲーティングカメラあるいは通常のカメラによって撮影された画像データが用いられる。
図16(a)、(b)は、ゲーティングカメラ20により得られる画像を説明する図である。図16(a)に示すように、同じ物体(ここでは歩行者とする)OBJが異なるレンジに存在する状況を考える。ゲーティングカメラ20はそれ自身のセンササイズおよび光学系で定まる水平画角(視野角)θおよび垂直画角を有する。ゲーティングカメラ20は、レンジにかかわらず同じ画角で撮影するため、異なる距離に位置する同じ物体を撮影すると、物体までの距離によって撮影倍率が異なることとなる。したがって図16(b)に示すように、遠くの物体ほど小さく、近くの物体ほど大きく写ることとなる。なお、この特徴はゲーティングカメラに限ったものではなく、通常のカメラで撮影した場合も同様である。
演算処理装置40には、画像IMG~IMGのいずれに対しても、それぞれに含まれる物体OBJ~OBJを歩行者に分類する識別力が要求される。このためには、あるカテゴリの物体を、異なる複数の距離で撮影した画像を用意し、それらを学習データとして用いる手法が採られる。また、ある距離で物体を撮影した基本画像を、拡大あるいは縮小して複数の画像を生成し、それらを学習データとして用いる手法も採られる(かさ増しという)。
しかしながら、これらの手法は学習コストの増加となりうる。また、これらの手法を採ったとしても、やはり十分な認識率が得られないケースが想定される。
そこで本実施の形態3では、図13に示すように、演算処理装置40は、分類器42の前段に設けられたスケーラ46を備える。スケーラ46は、ゲーティングカメラ20によって得られる複数のレンジRNG~RNGに対応する複数の画像IMG~IMGを、レンジRNG(#=1,2,…N)ごとに規定された係数Kでスケーリングする。レンジと係数の関係は、テーブルに保持しておいてもよいし、演算式の形で保持しておいてもよい。
図17(a)~(c)は、スケーラ46によるスケーリング処理の一例を説明する図である。この例では、N=3である。係数K~Kは、スケーリング処理後の画像IMGs~IMGsに含まれる物体OBJの大きさ(縦横のピクセル数x、y)が近づくように定められる。
複数のレンジから、基準レンジを選択してもよい。そして基準レンジの係数を1、もしくはその近傍に定める。レンジRNGが基準レンジであり、係数K=1であるとき、IMG=IMGsとすることができる。この例では、中央のレンジRNGが基準レンジであり、係数Kが1に選ばれる。
基準レンジよりもゲーティングカメラ20からの距離が近いレンジについては、K<1となる。係数K<1の場合、元の画像IMGが縮小される。縮小する際には、画素を間引いてもよい。結果として得られる画像IMGsのピクセル数は、元の画像IMGに比べて減少する。図17(a)の例では、K=0.8に選ばれる。
基準レンジよりもゲーティングカメラ20からの距離が遠いレンジについては、K>1となる。係数K>1の場合、元の画像IMGが拡大される。拡大する際には、画素補間を行えばよい。結果として得られる画像IMGsのピクセル数は、元の画像IMGに比べて増加する。図17(c)の例では、K=1.4に選ばれている。
図13に戻る。分類器42には、スケーラ46によるスケーリング処理後の画像データIMGs~IMGsが入力される。分類器42は、画像データIMGs~IMGsそれぞれにもとづいて、各画像データに含まれる物体OBJの種類を識別する。
以上が物体識別システム10の構成である。この物体識別システム10では、分類器42に入力される画像は、同じ物体が同じサイズ(ピクセル数)に近づくようにスケーリングされる。したがって分類器42は、物体までの距離に依存せずに、物体を検出し、そのカテゴリを識別することが可能となる。これは、分類器42の識別率(正答率)の改善をもたらす。
この物体識別システム10を採用することで、分類器42の学習コストを下げることができるという利点もある。すなわち、学習時には、スケーリングの係数が1に近いレンジに重点的に物体を配置し、そのときに得られた画像を学習データとして分類器42のパラメータの最適化に利用すればよく、スケーリングの係数が1から大きく外れたレンジについては、撮影の回数を減らすことができる。
図18は、物体識別システム10を備える自動車のブロック図である。自動車300は、前照灯302L,302Rを備える。物体識別システム10は、前照灯302L,302Rの少なくとも一方に内蔵される。前照灯302は、車体の最も先端に位置しており、周囲の物体を検出する上で、ゲーティングカメラ20の設置箇所として最も有利である。
図19は、物体検出システム210を備える車両用灯具200を示すブロック図である。車両用灯具200は、車両側ECU304とともに灯具システム310を構成する。車両用灯具200は、光源202、点灯回路204、光学系206を備える。さらに車両用灯具200には、物体検出システム210が設けられる。物体検出システム210は、上述の物体識別システム10に対応しており、ゲーティングカメラ20および演算処理装置40を含む。
演算処理装置40が検出した物体OBJに関する情報は、車両用灯具200の配光制御に利用してもよい。具体的には、灯具側ECU208は、演算処理装置40が生成する物体OBJの種類とその位置に関する情報にもとづいて、適切な配光パターンを生成する。点灯回路204および光学系206は、灯具側ECU208が生成した配光パターンが得られるように動作する。
また演算処理装置40が検出した物体OBJに関する情報は、車両側ECU304に送信してもよい。車両側ECUは、この情報にもとづいて、自動運転を行ってもよい。
続いて、実施の形態3に関連する変形例を説明する。
(変形例1)
実施の形態では、複数のレンジのうち中央付近のレンジを基準にとり、基準レンジの係数を1、それ以外のレンジの係数を1より小さく、あるいは大きくしたがその限りでない。たとえば手前のレンジを基準レンジとし、奥側のレンジの係数を1より大きくしてもよい。反対に、たとえば一番奥側のレンジを基準レンジとし、それより手前側のレンジの係数を1より小さくしてもよい。
(変形例2)
基準レンジを1個としたが、基準レンジを複数としてもよい。図20を参照して変形例2を説明する。図20(a)、(b)は、ゲーティングカメラ20により得られる画像を説明する図である。ここではレンジの数Nを4個としている。複数のレンジは、複数のセットに分けられる。各セットは、少なくともひとつのレンジを含み、基準レンジは、セット毎に設けられる。たとえば、RNG,RNGを第1のセット、RNG,RNGを第2のセットに定める。第1のセットに着目すると、それに含まれるレンジRNG,RNGのひとつを基準レンジと定め、残りのレンジの係数を、物体のサイズが基準レンジのそれに近づくように定めればよい。
同様に、第2のセットに着目すると、それに含まれるレンジRNG,RNGの一方を基準レンジと定め、残りのレンジの係数を、物体のサイズが基準レンジのそれに近づくように定めればよい。
変形例2では、レンジのセット毎に、基準レンジに物体が位置する状況で得られた画像を用いて重点的に用いて機械学習を行えばよい。
IV 本発明の第4側面
IV-1. 概要
本発明の第4側面に関連するある実施の形態は、物体識別システムに関する。物体識別システムは、奥行き方向について複数のレンジに区切り、レンジ毎に、投光と露光の時間差を変化させて撮影し、複数のレンジに対応する複数の画像を生成するゲーティングカメラと、画像ごとに物体が存在しうる領域が限定されているとの制約条件のもと、複数の画像それぞれに含まれる物体の種類を識別可能に構成される演算処理装置と、を備える。
識別対象の物体は、その種類ごとに、存在する位置が制限される。たとえば歩行者や自動車の交通参加者は地上に存在しており、空中には存在しない。つまり、画像内で交通参加者等が存在しうる位置は、地上付近の領域内に制約される。ゲーティングカメラにおいて、複数の画像が同じ画角で撮影される場合、カメラからの距離ごと、すなわち画像ごとに、地上付近の領域が変化する。
そこで一実施の形態では、画像ごとに固有の興味領域を定めておき、分類器の画像処理の範囲を制限することで、演算処理量を削減できる。
物体識別システムは、複数の画像それぞれについて、興味領域内の画像をトリミングする前処理部と、前処理部の出力を処理する分類器と、を含んでもよい。この場合、分類器に与えられる画像のサイズが小さくなるため、演算処理量を削減できる。
物体識別システムは、複数の画像それぞれについて、興味領域外の画像をマスクする前処理部と、前処理部の出力を処理する分類器と、を含んでもよい。前処理部は、興味領域外を、単一色で塗りつぶしてもよい。
また別の実施の形態において、分類器の後段あるいは内部において、物体の種類の判断に、物体の位置情報を反映させてもよい。
演算処理装置は、複数の画像それぞれについて、それに含まれる物体の種類と位置を検出し、複数の画像に対応する複数の検出データを生成する分類器と、複数の検出データを受け、各検出データに含まれる物体の位置が、元の画像に固有の興味領域に含まれるか否かを判定する後処理部と、を含んでもよい。
興味領域は、近いレンジの画像ほど大きく、遠いレンジの画像ほど小さくてもよい。
興味領域は、遠いレンジの画像ほど高さが小さくてもよい。これにより、地上付近の物体を検出するための演算処理量を削減できる。
興味領域は、遠いレンジの画像ほど幅が狭くてもよい。
IV-2. 詳細な説明
以下、本発明の第4側面を、好適な実施の形態をもとに図面を参照しながら説明する。
(実施の形態4-1)
図21は、実施の形態4-1に係る物体識別システム10のブロック図である。この物体識別システム10は、自動車やバイクなどの車両に搭載され、車両の周囲に存在する物体OBJの種類(カテゴリあるいはクラスともいう)を判定する。
物体識別システム10は、主としてゲーティングカメラ20および演算処理装置40を備える。ゲーティングカメラ20は、投光器22、イメージセンサ24、コントローラ26を含む。ゲーティングカメラ20による撮像は、奥行き方向について複数N個(N≧2)のレンジRNG~RNGに区切って行われる。隣接するレンジ同士は、それらの境界において奥行き方向にオーバーラップしてもよい。
投光器22は、コントローラ26から与えられる投光タイミング信号S1と同期して、プローブ光L1を車両前方に照射する。プローブ光L1は赤外光であることが好ましいが、その限りでなく、所定の波長を有する可視光であってもよい。
イメージセンサ24は、コントローラ26から与えられる撮影タイミング信号S2と同期した露光制御が可能であり、画像IMGを生成可能に構成される。イメージセンサ24は、プローブ光L1と同じ波長に感度を有しており、物体OBJが反射した反射光(戻り光)L2を撮影する。
コントローラ26は、レンジRNGごとに、投光タイミング信号S1と撮影タイミング信号S2を変化させて、投光器22による投光と、イメージセンサ24の露光の時間差を変化させる。ゲーティングカメラ20は、複数のレンジRNG~RNGに対応する複数の画像IMG~IMGを生成する。i番目の画像IMGには、対応するレンジRNGに含まれる物体のみが写ることとなる。
図22は、ゲーティングカメラ20の動作を説明する図である。図22にはi番目のレンジRNGを測定するときの様子が示される。投光器22は、投光タイミング信号S1と同期して、時刻t~tの間の発光期間τの間、発光する。最上段には、横軸に時間、縦軸に距離をとった光線のダイアグラムが示される。ゲーティングカメラ20から、レンジRNGの手前の境界までの距離をdMINi、レンジRNGの奥側の境界までの距離をdMAXiとする。
ある時刻に投光器22を出発した光が、距離dMINiに到達してその反射光がイメージセンサ24に戻ってくるまでのラウンドトリップ時間TMINiは、
MINi=2×dMINi/c
である。cは光速である。
同様に、ある時刻に投光器22を出発した光が、距離dMAXiに到達してその反射光がイメージセンサ24に戻ってくるまでのラウンドトリップ時間TMAXiは、
MAXi=2×dMAXi/c
である。
レンジRNGに含まれる物体OBJのみを撮影したいとき、コントローラ26は、時刻t=t+TMINiに露光を開始し、時刻t=t+TMAXiに露光を終了するように、撮影タイミング信号S2を生成する。これが1回の露光動作である。
i番目のレンジRNGを撮影する際に、複数回の露光を行ってもよい。この場合、コントローラ26は、所定の周期τで、上述の露光動作を複数回にわたり繰り返せばよい。
図23(a)、(b)は、ゲーティングカメラ20により得られる画像を説明する図である。図23(a)の例では、レンジRNGに物体(歩行者)OBJが存在し、レンジRNGに物体(車両)OBJが存在している。図23(b)には、図23(a)の状況で得られる複数の画像IMG~IMGが示される。画像IMGを撮影するとき、イメージセンサはレンジRNGからの反射光のみにより露光されるため、画像IMGにはいかなる物体も写らない。
画像IMGを撮影するとき、イメージセンサはレンジRNGからの反射光のみにより露光されるため、画像IMGには、物体OBJのみが写る。同様に画像IMGを撮影するとき、イメージセンサはレンジRNGからの反射光のみにより露光されるため、画像IMGには、物体OBJのみが写る。このようにゲーティングカメラ20によれば、レンジごとに物体を分離して撮影することができる。
図21に戻る。演算処理装置40は、ゲーティングカメラ20によって得られる複数のレンジRNG~RNGに対応する複数の画像IMG~IMGにもとづいて、物体の種類を識別可能に構成される。演算処理装置40は、機械学習によって生成された学習済みモデルにもとづいて実装される分類器42を備える。分類器42のアルゴリズムは特に限定されないが、YOLO(You Only Look Once)とSSD(Single Shot MultiBox Detector)、R-CNN(Region-based Convolutional Neural Network)、SPPnet(Spatial Pyramid Pooling)、Faster R-CNN、DSSD(Deconvolution -SSD)、Mask R-CNNなどを採用することができ、あるいは、将来開発されるアルゴリズムを採用できる。
演算処理装置40は、CPU(Central Processing Unit)やMPU(Micro Processing Unit)、マイコンなどのプロセッサ(ハードウェア)と、プロセッサ(ハードウェア)が実行するソフトウェアプログラムの組み合わせで実装することができる。演算処理装置40は、複数のプロセッサの組み合わせであってもよい。あるいは演算処理装置40はハードウェアのみで構成してもよい。
画像ごと、すなわちレンジ毎に、固有の興味領域(ROI:Region Of Interest)が定められる。ROIは、物体が存在しうる領域である。i番目(i=1,2,…N)の画像に対応するROIを、ROIと表記する。分類器42は、各画像IMGについて、物体OBJが存在しうる位置が、画像IMGに固有のROI内に限定されているとの制約条件のもと、画像IMGに含まれる物体の種類を識別する。
たとえば、分類器42の出力(検出データという)OUT(i=1,2,…N)は、i番目の画像データIMGに含まれる各物体の位置情報と、その種類(カテゴリ)の情報を含む。種類の情報は、複数の種類それぞれに該当する可能性(確率)を示してもよいし、最も確率が高い種類の識別子を含んでもよい。
図24(a)、(b)は、ROIを説明する図である。図24(a)は横から見た図であり、図24(b)にはゲーティングカメラ20により撮影される画像が示される。図24(a)に示すように、ゲーティングカメラ20による撮像範囲が画角換算で水平軸を中心に上下に±θであるとする。地面2の高さをゼロとしたとき、i番目のレンジRNGの画像IMGには、高さHより下の範囲の物体が写る。
一方、歩行者や自動車が存在する範囲は、所定の範囲(0~HROI)に限定される。そうすると、HROI~Hの範囲には、検出対称の物体は存在しないとみなすことができる。したがって図24(b)に示すように、各画像IMGについて、HROIより下の範囲をROIとし、HROIより上の範囲を除外領域(ハッチング)とすることができる。具体的にはi番目の画像IMGについて、下端からHROI/Hの割合の範囲をROIとすればよい。ROIは、近いレンジの画像ほど大きく、遠いレンジの画像ほど小さくなる。
ゲーティングカメラ20のイメージセンサ24の地上高をhcとする。またイメージセンサ24からi番目のレンジRNGの奥側の境界までの距離をdMAXiとする。この場合、
=hc+dMAXi×tanθ
となる。
図21に戻る。本実施の形態において、分類器42の前段には、前処理部46が設けられる。前処理部46は、各画像IMGからROI内の画像をトリミングする。分類器42は前処理部46の出力であるトリミング画像IMGt~IMGtを処理する。
以上が物体識別システム10の構成である。続いてその動作を説明する。図25(a)、(b)は、図21の物体識別システム10の動作を説明する図である。図25(a)はi番目のレンジの画像IMGを、図25(b)は、トリミング後の画像IMGtを示す。
図25(a)の画像IMGには、3個の図形X,Y,Xが写っている。そのうち図形XはROI内に含まれており、図形Y,Zは、ROI外である。したがって図形YやZが、歩行者や自動車である可能性は低い。
図25(b)に示すように、前処理部46によってトリミングされた画像IMGtには、図形Xのみが含まれる。分類器42によって、トリミング後の画像を処理することにより、図形Y,Zについては、演算処理の対象から除外され、図形Xのみが識別処理の対象となる。これにより演算処理装置40の演算処理量を削減できる。
また、図形Y,Zを処理の対象から除外することにより、図形Y,Zが、自動車や歩行者と誤って認識されることを防止できる。すなわち、物体識別システム10の識別率を改善することができる。
(実施の形態4-2)
実施の形態4-1では、分類器42の前処理によって、演算処理の対象をROI内に制限したがその限りでない。実施の形態4-2では、分類器42の後処理、あるいは内部処理によって、物体OBJが存在しうる位置が、複数の画像それぞれに固有の興味領域内に限定されているとの制約条件を課す。
図26は、実施の形態4-2に係る物体識別システム10Aのブロック図である。演算処理装置40Aは、分類器42の後段に設けられた後処理部48を備える。分類器42は、ゲーティングカメラ20が生成する複数の画像IMG~IMGそれぞれについて、各画像に含まれる物体の位置と種類を示す検出データOUT~OUTを生成する。後処理部48は、分類器42が生成する検出データOUT~OUTを受ける。後処理部48は、各検出データOUT(i=1~N)について、それに含まれる物体の位置が、元の画像IMGに固有のROIに含まれるか否かを判定する。そして物体の位置が、ROI外であるとき、その物体を削除する。
図27(a)、(b)は、図26の物体識別システム10Aの動作を説明する図である。図27(a)は、i番目のレンジに関する検出データOUTを画像データとして模式的に示す図である。検出データOUTは、2個のバウンディングボックスX,Yを含む。一方のバウンディングボックスXに含まれる物体は、歩行者(Human)である確率が90%と判定されており、別のバウンディングボックスYに含まれる物体は、自動車(Car)である確率が80%と判定されている。
上述のように自動車は、ROI外に存在する可能性は低い。したがって、ROI外に位置するバウンディングボックスYに含まれる物体が自動車である確率は低いといえる。そこで後処理部48は、ROI外の物体を削除し、削除後の検出データOUT’を出力する。
実施の形態4-2によれば、分類器42における演算処理量を減らすことはできないが、物体の識別率を改善できる。
続いて、実施の形態4-1,4-2に関連する変形例を説明する。
(変形例1)
図28(a)、(b)は、ROIの変形例を説明する図である。図28(a)に示すように、各画像には、地面より下が含まれる場合がある。この場合において図28(b)に示すように、各画像の上側の範囲(HROI~H)に加えて、地面2より下側の範囲(<0)についても、物体が存在しえない領域として扱ってもよい。これにより、演算処理装置40における演算処理量をさらに減らすことができる。
(変形例2)
これまでの説明では、物体が存在し得ない範囲を除外したが、その限りでなく、物体が存在したとしても検出する必要がない領域を定めておいてもよい。図29(a)、(b)は、ROIの変形例を説明する図である。図29(a)は上から見た図であり、図29(b)にはゲーティングカメラ20により撮影される画像が示される。
車載用途では、物体を検出すべき範囲を、左右方向にも制限することができる。たとえば自車から数十mも横方向に離れた歩行者は、直ちに検出する必要は無いと言える。そこで、自車を中心として、横方向に検出範囲を定め、各画像IMGについて、検出範囲に対応する部分をROIとしてもよい。これにより、演算処理量をさらに減らすことができる。
もちろん、上下方向のトリミングと左右方向のトリミングとを組み合わせてもよい。
(変形例3)
実施の形態4-1において、前処理部46の処理は上述のそれに限定されない。前処理部46は、各画像IMGから、ROI外の画像をマスクしてもよい。たとえば前処理部46は、ROI外を、単一色(たとえば黒や白)で塗りつぶしてもよい。分類器42は、マスク後の画像IMGmを処理対象とする。図30(a)、(b)は、変形例3に係る物体識別システム10の動作を説明する図である。
図30(a)の画像IMGには、3個の図形X,Y,Xが写っている。そのうち図形XはROI内に含まれており、図形Y,Zは、ROI外である。したがって図形YやZが、歩行者や自動車である可能性は低い。
図30(b)に示すように、前処理部46が、ROI外をマスクすることにより、マスク後の画像IMGmからは図形Y,Zが除去される。分類器42によって、マスク後の画像IMGmを処理することにより、図形Y,Zについては、演算処理の対象から除外され、図形Xのみが識別処理の対象となる。これにより演算処理装置40の演算処理量を削減できる。
(変形例4)
実施の形態では、レンジの異なる画像を、同じ分類器42で処理したがその限りでなく、レンジ毎に異なる分類器を用いてもよい。
(用途)
図31は、物体識別システム10を備える自動車のブロック図である。自動車300は、前照灯302L,302Rを備える。物体識別システム10は、前照灯302L,302Rの少なくとも一方に内蔵される。前照灯302は、車体の最も先端に位置しており、周囲の物体を検出する上で、ゲーティングカメラ20の設置箇所として最も有利である。
図32は、物体検出システム210を備える車両用灯具200を示すブロック図である。車両用灯具200は、車両側ECU304とともに灯具システム310を構成する。車両用灯具200は、光源202、点灯回路204、光学系206を備える。さらに車両用灯具200には、物体検出システム210が設けられる。物体検出システム210は、上述の物体識別システム10に対応しており、ゲーティングカメラ20および演算処理装置40を含む。
演算処理装置40が検出した物体OBJに関する情報は、車両用灯具200の配光制御に利用してもよい。具体的には、灯具側ECU208は、演算処理装置40が生成する物体OBJの種類とその位置に関する情報にもとづいて、適切な配光パターンを生成する。点灯回路204および光学系206は、灯具側ECU208が生成した配光パターンが得られるように動作する。
また演算処理装置40が検出した物体OBJに関する情報は、車両側ECU304に送信してもよい。車両側ECUは、この情報にもとづいて、自動運転を行ってもよい。
V 本発明の第5側面
V-1. 概要
本発明の第5側面に関連するある実施の形態は、物体識別システムに関する。物体識別システムは、奥行き方向について複数のレンジに区切り、レンジ毎に、投光と露光の時間差を変化させて撮影し、複数のレンジに対応する複数の画像を生成するゲーティングカメラと、レンジ毎に、対応する画像に写る物体像のサイズの許容範囲が規定されており、許容範囲にもとづいて各画像に写る物体像の種類を識別可能に構成される演算処理装置と、を備える。
画像に写る物体像のサイズは、物体までの距離に応じて変化する。撮像デバイスとしてゲーティングカメラを用いる場合、一枚の画像に含まれる物体までの距離は、対応するレンジの奥行き方向の情報から得ることができる。つまり、あるレンジに位置する物体を写したときに、画像に写る物体像のサイズは、ある範囲に制約される。そこで、この範囲を許容範囲として定めておくことにより、物体の識別率を高め、あるいは演算処理量を削減できる。
演算処理装置は、複数の画像それぞれについて、それに写る物体像の種類とサイズを検出し、複数の画像に対応する複数の検出データを生成する分類器と、複数の検出データを受け、各検出データに含まれる物体像のサイズが、許容範囲に含まれるか否かを判定する後処理部と、を含んでもよい。
演算処理装置は、複数の画像それぞれについて、それに写る物体像ごとのサブ画像に切り分ける前処理部と、前処理部により切り分けられたサブ画像のサイズが許容範囲に含まれる場合に、当該サブ画像に含まれる物体像の種類を判定する分類器と、を含んでもよい。
許容範囲は、垂直方向について規定されてもよい。許容範囲は、横方向について規定されてもよい。
許容範囲は、物体像の種類ごとに個別に規定されてもよい。これにより物体の識別率をさらに高めることができる。
許容範囲は、近いレンジほど大きく、遠いレンジほど小さくてもよい。許容範囲は、遠いレンジほど高さが小さくてもよい。許容範囲は、遠いレンジほど幅が狭くてもよい。
V-2. 詳細な説明
以下、本発明の第5側面を、好適な実施の形態をもとに図面を参照しながら説明する。
(実施の形態5-1)
図33は、実施の形態5-1に係る物体識別システム10Cのブロック図である。この物体識別システム10Cは、自動車やバイクなどの車両に搭載され、車両の周囲に存在する物体OBJの種類(カテゴリ、あるいはクラスともいう)を判定する。
物体識別システム10Cは、主としてゲーティングカメラ20および演算処理装置40Cを備える。ゲーティングカメラ20は、投光器22、イメージセンサ24、コントローラ26を含む。ゲーティングカメラ20による撮像は、奥行き方向について複数N個(N≧2)のレンジRNG~RNGに区切って行われる。隣接するレンジ同士は、それらの境界において奥行き方向にオーバーラップしてもよい。
投光器22は、コントローラ26から与えられる投光タイミング信号S1と同期して、プローブ光L1を車両前方に照射する。プローブ光L1は赤外光であることが好ましいが、その限りでなく、所定の波長を有する可視光であってもよい。
イメージセンサ24は、コントローラ26から与えられる撮影タイミング信号S2と同期した露光制御が可能であり、画像IMGを生成可能に構成される。イメージセンサ24は、プローブ光L1と同じ波長に感度を有しており、物体OBJが反射した反射光(戻り光)L2を撮影する。
コントローラ26は、レンジRNGごとに、投光タイミング信号S1と撮影タイミング信号S2を変化させて、投光器22による投光と、イメージセンサ24の露光の時間差を変化させる。ゲーティングカメラ20は、複数のレンジRNG~RNGに対応する複数の画像IMG~IMGを生成する。i番目の画像IMGには、対応するレンジRNGに含まれる物体のみが写ることとなる。
図34は、ゲーティングカメラ20の動作を説明する図である。図34にはi番目のレンジRNGを測定するときの様子が示される。投光器22は、投光タイミング信号S1と同期して、時刻t~tの間の発光期間τの間、発光する。最上段には、横軸に時間、縦軸に距離をとった光線のダイアグラムが示される。ゲーティングカメラ20から、レンジRNGの手前の境界までの距離をdMINi、レンジRNGの奥側の境界までの距離をdMAXiとする。
ある時刻に投光器22を出発した光が、距離dMINiに到達してその反射光がイメージセンサ24に戻ってくるまでのラウンドトリップ時間TMINiは、
MINi=2×dMINi/c
である。cは光速である。
同様に、ある時刻に投光器22を出発した光が、距離dMAXiに到達してその反射光がイメージセンサ24に戻ってくるまでのラウンドトリップ時間TMAXiは、
MAXi=2×dMAXi/c
である。
レンジRNGに含まれる物体OBJのみを撮影したいとき、コントローラ26は、時刻t=t+TMINiに露光を開始し、時刻t=t+TMAXiに露光を終了するように、撮影タイミング信号S2を生成する。これが1回の露光動作である。
i番目のレンジRNGを撮影する際に、複数回の露光を行ってもよい。この場合、コントローラ26は、所定の周期τで、上述の露光動作を複数回にわたり繰り返せばよい。
図35(a)、(b)は、ゲーティングカメラ20により得られる画像を説明する図である。図35(a)の例では、レンジRNGに物体(歩行者)OBJが存在し、レンジRNGに物体(車両)OBJが存在している。図35(b)には、図35(a)の状況で得られる複数の画像IMG~IMGが示される。画像IMGを撮影するとき、イメージセンサはレンジRNGからの反射光のみにより露光されるため、画像IMGにはいかなる物体像も写らない。
画像IMGを撮影するとき、イメージセンサはレンジRNGからの反射光のみにより露光されるため、画像IMGには、物体像OBJのみが写る。同様に画像IMGを撮影するとき、イメージセンサはレンジRNGからの反射光のみにより露光されるため、画像IMGには、物体像OBJのみが写る。このようにゲーティングカメラ20によれば、レンジ毎に物体を分離して撮影することができる。
図33に戻る。演算処理装置40Cは、ゲーティングカメラ20によって得られる複数のレンジRNG~RNGに対応する複数の画像IMG~IMGにもとづいて、物体の種類を識別可能に構成される。演算処理装置40Cは、機械学習によって生成された学習済みモデルにもとづいて実装される分類器42を備える。分類器42のアルゴリズムは特に限定されないが、YOLO(You Only Look Once)とSSD(Single Shot MultiBox Detector)、R-CNN(Region-based Convolutional Neural Network)、SPPnet(Spatial Pyramid Pooling)、Faster R-CNN、DSSD(Deconvolution -SSD)、Mask R-CNNなどを採用することができ、あるいは、将来開発されるアルゴリズムを採用できる。
演算処理装置40Cは、CPU(Central Processing Unit)やMPU(Micro Processing Unit)、マイコンなどのプロセッサ(ハードウェア)と、プロセッサ(ハードウェア)が実行するソフトウェアプログラムの組み合わせで実装することができる。演算処理装置40Cは、複数のプロセッサの組み合わせであってもよい。あるいは演算処理装置40Cはハードウェアのみで構成してもよい。
複数のレンジそれぞれについて、対応する画像に写る物体像の大きさの範囲(許容範囲という)が規定されている。分類器42は、検出対象の物体像のサイズは、許容範囲に含まれるという前提(制約)のもと、複数の画像IMGそれぞれに含まれる物体像の種類を識別する。
たとえば、分類器42の出力(検出データという)OUT(i=1,2,…N)は、i番目の画像データIMGに含まれる各物体像のサイズ情報と、その種類(カテゴリ)の情報を含む。検出データOUTが、物体ごとのバウンディングボックスの情報を含む場合、バウンディングボックスの高さと幅を、物体のサイズ情報とすることができる。種類の情報は、複数の種類それぞれに該当する可能性(所属確率)を示してもよいし、最も所属確率が高い種類の識別子を含んでもよい。
図36(a)、(b)は、レンジ毎に撮影される画像を説明する図である。図36(a)は横から見た図であり、図36(b)にはゲーティングカメラ20により撮影される画像が示される。図36(a)に示すように、ゲーティングカメラ20による撮像範囲が画角換算で水平軸を中心に上下に±θであるとする。図36(b)に示すように、各画像に写る物体像の大きさは、遠いレンジほど小さくなる。
図37は、許容範囲を説明する図である。ここでは、許容範囲は、垂直方向について規定されるものとする。i番目のレンジRNGに着目する。物体像が最も大きく写るのは、物体OBJが手前側の境界(A)に位置するときであり、物体像が最も小さく写るのは、物体OBJが奥側の境界(B)に位置するときである。
物体OBJの高さの最小値をhMIN、最大値をhMAXとする。物体OBJが、位置(A)に存在し、かつその高さが最大hMAXであるときを考える。画像IMGの垂直方向の画素数をYとするとき、画像内の物体の垂直方向の画素数yは、
MAXi=Y×hMAX/(dMINi×tanθ×2)
このyMAXiは、レンジRNGにおける許容範囲の最大値を与える。
物体OBJが、位置(B)に存在し、かつその高さが最大hMINであるときを考える。このとき画像内の物体の垂直方向の画素数yMINiは、
MINi=Y×hMIN/(dMAXi×tanθ×2)
このyMINiは、レンジRNGにおける許容範囲の最小値を与える。
つまり、許容範囲(垂直方向のピクセル数)は、yMINi~yMAXiとなる。なお、許容範囲の決め方は、上述のそれには限定されない。
図33に戻る。演算処理装置40Cは、検出した物体像のサイズが、許容範囲から外れているとき、その物体像を処理対象から除外してもよい。あるいは、検出した物体像のサイズと許容範囲の関係を、種類(カテゴリ/クラス)の所属確率に反映させてもよい。
本実施の形態において、分類器42の後段には、後処理部48が設けられる。分類器42は、複数の画像IMG~IMGそれぞれについて、それに含まれる物体像の種類とサイズを検出し、複数の画像に対応する複数の検出データOUT~OUTを生成する。
後処理部48は、分類器42が生成する検出データOUT~OUTを受ける。後処理部48は、各検出データOUT(i=1~N)について、それに含まれる物体像のサイズが、そのレンジRNGの許容範囲に含まれるか否かを判定する。そして、判定結果にもとづいて、検出データOUTを修正する。
たとえば後処理部48は、ある物体像のサイズが許容範囲から外れている場合、検出データOUT’の中から、その物体に関する情報を削除してもよい。あるいは後処理部48は、ある物体像のサイズが許容範囲から外れている場合、検出その物体が、ある種類(カテゴリ、クラス)である所属確率を、低下させてもよい。
以上が物体識別システム10Cの構成である。続いてその動作を説明する。図38(a)、(b)は、図33の物体識別システム10Cの動作を説明する図である。図38(a)は、i番目のレンジRNGに関する検出データOUTを画像データとして模式的に示しており、図38(b)は、補正後の検出データOUT’を画像データとして模式的に示す。
図38(a)に示すように、補正前の検出データOUTは、3個のバウンディングボックスα,β,γを含む。バウンディングボックスαに含まれる物体は、歩行者(Human)である所属確率が90%と判定されており、バウンディングボックスβに含まれる物体は、歩行者(Human)である所属確率が60%と判定されており、バウンディングボックスγには、電柱やビルに人が描かれたポスターが貼られているような物体の像が含まれる。この物体は、歩行者(Human)である所属確率が20%と判定されている。
バウンディングボックスαに含まれる物体については、その高さhが、yMINi<h<yMAXiの関係を満たしている。したがって、バウンディングボックスα内の物体は、検出対象(Human)である確度が高いと言える。したがって、補正後の検出データOUTは、バウンディングボックスαの物体を含んでいる。
バウンディングボックスβに含まれる物体については、その高さhが、h<yMINiとなっており、許容範囲から外れている。したがってその物体は、検出対象である確度が低いと言える。バウンディングボックスγに含まれる物体については、その高さhが、yMAXi<hとなっており、許容範囲から外れている。したがって補正後の検出データOUT’から、バウンディングボックスβ,γに含まれる物体は、検出対象である確度が低いと言える。したがって、バウンディングボックスβ,γについては、補正後の検出データOUT’から削除することができる。
以上が物体識別システム10Cの動作である。物体識別システム10Cによれば、物体の識別率を改善できる。
(実施の形態5-2)
図39は、実施の形態5-2に係る物体識別システム10Dのブロック図である。演算処理装置40Dは、分類器42と、その前段に設けられた前処理部46を含む。
前処理部46は、複数の画像IMG~IMGそれぞれについて、それに含まれる物体像ごとのサブ画像に切り分ける。
実施の形態5-1と同様に、複数のレンジRNG~RNGそれぞれについて、対応する画像に写る物体像の大きさの許容範囲が規定されている。
分類器42は、サブ画像SUBそれぞれについて、それに含まれる物体像の種類を判別可能に構成される。分類器42は、前処理部46により切り分けられたサブ画像SUBのサイズが許容範囲に含まれる場合に、当該サブ画像SUBに含まれる物体像の種類を判定する。
図40(a)、(b)は、図39の物体識別システム10Dの動作を説明する図である。図40(a)は、i番目のレンジRNGに関連して得られる画像IMGを示し、図40(b)は、画像IMGから切り出された複数のサブ画像SUBi-1~SUBi-3を示す。この例では、元の画像IMGには3個の物体が含まれている。
サブ画像SUBi-1については、その高さ(ピクセル数)が許容範囲の最大yMAXiを超えている。反対にサブ画像SUBi-3については、その高さ(ピクセル数)が許容範囲の最小値yMINiより小さい。したがって、サブ画像SUBi-1,SUBi-3については、分類器42が、物体の識別演算を行う前に除去される。サブ画像SUBi-2については、その高さ(ピクセル数)が許容範囲に含まれている。したがって、分類器42による識別演算の対象となる。
以上が物体識別システム10Dの動作である。物体識別システム10Dによれば、サイズにもとづいて、分類器42による識別処理の対象となるサブ画像を選別することにより、演算処理装置40Dの演算処理量を削減できる。
また、サブ画像SUBi-1,SUBi-3を処理の対象から除外することにより、サブ画像SUBi-1,SUBi-3が、歩行者と誤って認識されることを防止できる。すなわち、物体識別システム10Dの識別率を改善することができる。
以上、本発明について、実施の形態をもとに説明した。この実施の形態は例示であり、それらの各構成要素や各処理プロセスの組み合わせにいろいろな変形例が可能なこと、またそうした変形例も本発明の範囲にあることは当業者に理解されるところである。以下、こうした変形例について説明する。
(変形例1)
許容範囲は、水平方向についても考えることができる。ゲーティングカメラ20による撮像範囲が画角換算で左右方向に±φであるとする。また、物体の横方向の幅の最小値をwMIN、最大値をwMAXとする。このとき、あるレンジRNGにおける許容範囲の最小値XMINi,最大値XMAXiは以下のように表すことができる。
MAX=X×wMAX/(dMINi×tanφ×2)
MIN=X×wMIN/(dMAXi×tanφ×2)
演算処理装置において、垂直方向のみ、水平方向のみ、あるいはそれらの両方について、検出した物体像のサイズが、許容範囲に含まれるか否かを判定してもよい。
(変形例2)
実施の形態では、レンジの異なる画像を、同じ分類器42で処理したがその限りでなく、レンジ毎に異なる分類器を用いてもよい。
(変形例3)
許容範囲は、物体の種類ごとに個別に設定してもよい。たとえば、歩行者と自動車が検出対象である場合、歩行者の幅と、自動車の幅について、異なる許容範囲を設定してもよい。
(変形例4)
実施の形態5-1,5-2では、許容範囲について、上限と下限の両方を規定したが、それらの一方のみを規定してもよい。
(用途)
図41は、物体識別システム10を備える自動車のブロック図である。自動車300は、前照灯302L,302Rを備える。物体識別システム10は、前照灯302L,302Rの少なくとも一方に内蔵される。前照灯302は、車体の最も先端に位置しており、周囲の物体を検出する上で、ゲーティングカメラ20の設置箇所として最も有利である。
図42は、物体検出システム210を備える車両用灯具200を示すブロック図である。車両用灯具200は、車両側ECU304とともに灯具システム310を構成する。車両用灯具200は、光源202、点灯回路204、光学系206を備える。さらに車両用灯具200には、物体検出システム210が設けられる。物体検出システム210は、上述の物体識別システム10に対応しており、ゲーティングカメラ20および演算処理装置40を含む。
演算処理装置40が検出した物体OBJに関する情報は、車両用灯具200の配光制御に利用してもよい。具体的には、灯具側ECU208は、演算処理装置40が生成する物体OBJの種類とその位置に関する情報にもとづいて、適切な配光パターンを生成する。点灯回路204および光学系206は、灯具側ECU208が生成した配光パターンが得られるように動作する。
また演算処理装置40が検出した物体OBJに関する情報は、車両側ECU304に送信してもよい。車両側ECUは、この情報にもとづいて、自動運転を行ってもよい。
実施の形態にもとづき、具体的な語句を用いて本発明を説明したが、実施の形態は、本発明の原理、応用の一側面を示しているにすぎず、実施の形態には、請求の範囲に規定された本発明の思想を逸脱しない範囲において、多くの変形例や配置の変更が認められる。
本発明は、物体識別システムに関する。
S1 投光タイミング信号、 S2 撮影タイミング信号、 10 物体識別システム、 20 ゲーティングカメラ、 30 カメラ、 40 演算処理装置、 42 分類器、 50 ゲーティングカメラ、 52 投光器、 54 イメージセンサ、 56 コントローラ、 60 コンピュータ、 200 車両用灯具、 202 光源、 204 点灯回路、 206 光学系、 300 自動車、 302 前照灯、 304 車両側ECU、 310 灯具システム。

Claims (42)

  1. カメラと、
    前記カメラの出力画像にもとづいて、物体を識別できるように機械学習された分類器を含む演算処理装置と、
    を備え、
    前記分類器は、奥行き方向について複数のレンジに区切り、レンジ毎に、投光と露光の時間差を変化させて撮影するゲーティングカメラにより得られた複数の画像を学習データとして機械学習されていることを特徴とする物体識別システム。
  2. 前記カメラは、単眼カメラであることを特徴とする請求項1に記載の物体識別システム。
  3. 前記カメラは、ゲーティングカメラであることを特徴とする請求項1に記載の物体識別システム。
  4. 請求項1から3のいずれかに記載の物体識別システムを備えることを特徴とする車両用灯具。
  5. 請求項1から3のいずれかに記載の物体識別システムを備えることを特徴とする自動車。
  6. カメラの出力画像にもとづいて、物体を識別できるように機械学習された分類器を備え、
    前記分類器は、奥行き方向について複数のレンジに区切り、レンジ毎に、投光と露光の時間差を変化させて撮影するゲーティングカメラにより得られた複数の画像を学習データとして機械学習されていることを特徴とする演算処理装置。
  7. カメラの出力画像にもとづいて物体を識別する分類器の学習方法であって、
    ゲーティングカメラを用いて、奥行き方向について複数のレンジに区切り、レンジ毎に、投光と露光の時間差を変化させて撮影するステップと、
    前記ゲーティングカメラにより得られた複数の画像を学習データとして、前記分類器を機械学習するステップと、
    を備えることを特徴とする学習方法。
  8. 奥行き方向について複数のレンジに区切り、レンジ毎に、投光と露光の時間差を変化させて撮影するゲーティングカメラと、
    前記ゲーティングカメラによって得られる複数のレンジに対応する複数の画像にもとづいて、物体の種類を識別可能な演算処理装置と、
    を備え、
    前記演算処理装置は、アルゴリズムの異なる複数の分類器を含み、レンジに応じた分類器を選択して、物体認識を行うことを特徴とする物体識別システム。
  9. 前記演算処理装置は、距離が近いレンジの画像処理に、YOLO(You Only Look Once)アルゴリズムの分類器を用いることを特徴とする請求項8に記載の物体識別システム。
  10. 前記演算処理装置は、距離が遠いレンジの画像処理に、SSD(Single Shot MultiBox Detector)アルゴリズムの分類器を用いることを特徴とする請求項8に記載の物体識別システム。
  11. 前記演算処理装置は、相対的に距離が近いレンジの画像処理に、相対的に高速なアルゴリズムの分類器を用いることを特徴とする請求項8から10のいずれかに記載の物体識別システム。
  12. 前記演算処理装置は、相対的に距離が遠いレンジの画像処理に、相対的に高精度なアルゴリズムの分類器を用いることを特徴とする請求項8から11のいずれかに記載の物体識別システム。
  13. 請求項8から12のいずれかに記載の物体識別システムを備えることを特徴とする自動車。
  14. 請求項8から13のいずれかに記載の物体識別システムを備えることを特徴とする車両用灯具。
  15. 奥行き方向について複数のレンジに区切り、レンジ毎に、投光と露光の時間差を変化させて撮影するゲーティングカメラとともに物体識別システムを構成する演算処理装置であって、
    前記ゲーティングカメラによって得られる複数のレンジに対応する複数の画像にもとづいて、物体の種類を識別可能に構成され、
    アルゴリズムの異なる複数の分類器を含み、レンジに応じた分類器を選択して、物体認識を行うことを特徴とする演算処理装置。
  16. 奥行き方向について複数のレンジに区切り、レンジ毎に、投光と露光の時間差を変化させて撮影するゲーティングカメラと、
    前記ゲーティングカメラによって得られる複数のレンジに対応する複数の画像を、レンジ毎に規定された係数でスケーリングするスケーラと、
    スケーリング後の複数の画像それぞれにもとづいて、物体の種類を識別可能な分類器と、
    を備えることを特徴とする物体識別システム。
  17. 前記係数は、近いレンジほど小さく、遠いレンジほど大きいことを特徴とする請求項16に記載の物体識別システム。
  18. 前記複数のレンジのひとつを基準レンジとし、前記基準レンジの係数は1であり、前記基準レンジより近いレンジの係数は1より小さく、前記基準レンジより遠いレンジの係数は1より大きいことを特徴とする請求項16または17に記載の物体識別システム。
  19. 請求項16から18のいずれかに記載の物体識別システムを備えることを特徴とする自動車。
  20. 請求項16から18のいずれかに記載の物体識別システムを備えることを特徴とする車両用灯具。
  21. 奥行き方向について複数のレンジに区切り、レンジ毎に、投光と露光の時間差を変化させて撮影するゲーティングカメラとともに使用され、物体識別システムを構成する演算処理装置であって、
    前記ゲーティングカメラによって得られる複数のレンジに対応する複数の画像を、レンジ毎に規定された係数でスケーリングするスケーラと、
    スケーリング後の複数の画像それぞれにもとづいて、物体の種類を識別可能な分類器と、
    を備えることを特徴とする演算処理装置。
  22. 奥行き方向について複数のレンジに区切り、レンジ毎に、投光と露光の時間差を変化させて撮影し、複数のレンジに対応する複数の画像を生成するゲーティングカメラと、
    物体が存在しうる位置が、前記複数の画像それぞれに固有の興味領域内に限定されているとの制約条件のもと、前記複数の画像それぞれに含まれる物体の種類を識別可能に構成される演算処理装置と、
    を備えることを特徴とする物体識別システム。
  23. 前記演算処理装置は、
    前記複数の画像それぞれについて、前記興味領域内の画像をトリミングする前処理部と、
    前記前処理部の出力を処理する分類器と、
    を含むことを特徴とする請求項22に記載の物体識別システム。
  24. 前記演算処理装置は、
    前記複数の画像それぞれについて、前記興味領域外の画像をマスクする前処理部と、
    前記前処理部の出力を処理する分類器と、
    を含むことを特徴とする請求項22に記載の物体識別システム。
  25. 前記演算処理装置は、
    前記複数の画像それぞれについて、それに含まれる物体の種類と位置を検出し、前記複数の画像に対応する複数の検出データを生成する分類器と、
    前記複数の検出データを受け、各検出データに含まれる物体の位置が、元の画像に固有の前記興味領域に含まれるか否かを判定する後処理部と、
    を含むことを特徴とする請求項22に記載の物体識別システム。
  26. 前記興味領域は、近いレンジの画像ほど大きく、遠いレンジの画像ほど小さいことを特徴とする請求項22から25のいずれかに記載の物体識別システム。
  27. 前記興味領域は、遠いレンジの画像ほど高さが小さいことを特徴とする請求項22から26のいずれかに記載の物体識別システム。
  28. 前記興味領域は、遠いレンジの画像ほど幅が狭いことを特徴とする請求項22から27のいずれかに記載の物体識別システム。
  29. 請求項22から28のいずれかに記載の物体識別システムを備えることを特徴とする自動車。
  30. 請求項22から29のいずれかに記載の物体識別システムを備えることを特徴とする車両用灯具。
  31. 奥行き方向について複数のレンジに区切り、レンジ毎に、投光と露光の時間差を変化させて撮影し、複数のレンジに対応する複数の画像を生成するゲーティングカメラとともに使用され、物体識別システムを構成する演算処理装置であって、
    前記複数の画像ごとに固有の興味領域が定められており、前記複数の画像それぞれについて、前記興味領域内の画像をトリミングし、または前記興味領域外の画像をマスクする前処理部と、
    前記前処理部の出力を処理する分類器と、
    を備えることを特徴とする演算処理装置。
  32. 奥行き方向について複数のレンジに区切り、レンジ毎に、投光と露光の時間差を変化させて撮影し、複数のレンジに対応する複数の画像を生成するゲーティングカメラとともに使用され、物体識別システムを構成する演算処理装置であって、
    前記複数の画像それぞれについて、それに含まれる物体の種類と位置を検出し、前記複数の画像に対応する複数の検出データを生成する分類器と、
    前記複数の画像ごとに固有の興味領域が定められており、前記複数の検出データを受け、各検出データに含まれる物体の位置が、元の画像に固有の前記興味領域に含まれるか否かを判定する後処理部と、
    を備えることを特徴とする演算処理装置。
  33. 奥行き方向について複数のレンジに区切り、レンジ毎に、投光と露光の時間差を変化させて撮影し、前記複数のレンジに対応する複数の画像を生成するゲーティングカメラと、
    レンジ毎に、対応する画像に写る物体像のサイズの許容範囲が規定されており、前記許容範囲にもとづいて前記複数の画像それぞれに含まれる前記物体像の種類を識別可能に構成される演算処理装置と、
    を備えることを特徴とする物体識別システム。
  34. 前記演算処理装置は、
    前記複数の画像それぞれについて、それに含まれる物体像の種類とサイズを検出し、前記複数の画像に対応する複数の検出データを生成する分類器と、
    前記複数の検出データを受け、各検出データに含まれる物体像のサイズが、前記許容範囲に含まれるか否かを判定する後処理部と、
    を含むことを特徴とする請求項33に記載の物体識別システム。
  35. 前記演算処理装置は、
    前記複数の画像それぞれについて、それに写る物体像ごとのサブ画像に切り分ける前処理部と、
    前記前処理部により切り分けられた前記サブ画像のサイズが前記許容範囲に含まれる場合に、当該サブ画像に含まれる物体像の種類を判定する分類器と、
    を含むことを特徴とする請求項33に記載の物体識別システム。
  36. 前記許容範囲は、垂直方向について規定されることを特徴とする請求項33から35のいずれかに記載の物体識別システム。
  37. 前記許容範囲は、横方向について規定されることを特徴とする請求項33から36のいずれかに記載の物体識別システム。
  38. 前記許容範囲は、物体の種類ごとに個別に規定されることを特徴とする請求項33から37のいずれかに記載の物体識別システム。
  39. 請求項33から38のいずれかに記載の物体識別システムを備えることを特徴とする自動車。
  40. 請求項33から38のいずれかに記載の物体識別システムを備えることを特徴とする車両用灯具。
  41. 奥行き方向について複数のレンジに区切り、レンジ毎に、投光と露光の時間差を変化させて撮影し、前記複数のレンジに対応する複数の画像を生成するゲーティングカメラとともに使用され、物体識別システムを構成する演算処理装置であって、
    レンジ毎に、対応する画像における物体像のサイズの許容範囲が規定されており、前記複数の画像それぞれについて、それに含まれる物体像の種類とサイズを検出し、前記複数の画像に対応する複数の検出データを生成する分類器と、
    前記複数の検出データを受け、各検出データに含まれる物体像のサイズが、前記許容範囲に含まれるか否かを判定する後処理部と、
    を備えることを特徴とする演算処理装置。
  42. 奥行き方向について複数のレンジに区切り、レンジ毎に、投光と露光の時間差を変化させて撮影し、前記複数のレンジに対応する複数の画像を生成するゲーティングカメラとともに使用され、物体識別システムを構成する演算処理装置であって、
    前記複数の画像それぞれについて、それに写る物体像ごとのサブ画像に切り分ける前処理部と、
    レンジ毎に、対応する画像における物体像のサイズの許容範囲が規定されており、前記前処理部により切り分けられた前記サブ画像のサイズが前記許容範囲に含まれる場合に、当該サブ画像に含まれる物体像の種類を判定する分類器と、
    を備えることを特徴とする演算処理装置。
JP2020560058A 2018-12-10 2019-12-06 物体識別システム、演算処理装置、自動車、車両用灯具、分類器の学習方法 Active JP7369921B2 (ja)

Applications Claiming Priority (11)

Application Number Priority Date Filing Date Title
JP2018231048 2018-12-10
JP2018231048 2018-12-10
JP2018238313 2018-12-20
JP2018238314 2018-12-20
JP2018238314 2018-12-20
JP2018238313 2018-12-20
JP2019036462 2019-02-28
JP2019036463 2019-02-28
JP2019036462 2019-02-28
JP2019036463 2019-02-28
PCT/JP2019/047876 WO2020121973A1 (ja) 2018-12-10 2019-12-06 物体識別システム、演算処理装置、自動車、車両用灯具、分類器の学習方法

Publications (2)

Publication Number Publication Date
JPWO2020121973A1 JPWO2020121973A1 (ja) 2021-10-28
JP7369921B2 true JP7369921B2 (ja) 2023-10-27

Family

ID=71076884

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020560058A Active JP7369921B2 (ja) 2018-12-10 2019-12-06 物体識別システム、演算処理装置、自動車、車両用灯具、分類器の学習方法

Country Status (4)

Country Link
US (1) US20210295065A1 (ja)
JP (1) JP7369921B2 (ja)
CN (1) CN113243016A (ja)
WO (1) WO2020121973A1 (ja)

Families Citing this family (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10678244B2 (en) 2017-03-23 2020-06-09 Tesla, Inc. Data synthesis for autonomous control systems
US11893393B2 (en) 2017-07-24 2024-02-06 Tesla, Inc. Computational array microprocessor system with hardware arbiter managing memory requests
US11157441B2 (en) 2017-07-24 2021-10-26 Tesla, Inc. Computational array microprocessor system using non-consecutive data formatting
US10671349B2 (en) 2017-07-24 2020-06-02 Tesla, Inc. Accelerated mathematical engine
US11409692B2 (en) 2017-07-24 2022-08-09 Tesla, Inc. Vector computational unit
US11561791B2 (en) 2018-02-01 2023-01-24 Tesla, Inc. Vector computational unit receiving data elements in parallel from a last row of a computational array
US11215999B2 (en) 2018-06-20 2022-01-04 Tesla, Inc. Data pipeline and deep learning system for autonomous driving
US11361457B2 (en) 2018-07-20 2022-06-14 Tesla, Inc. Annotation cross-labeling for autonomous control systems
US11636333B2 (en) 2018-07-26 2023-04-25 Tesla, Inc. Optimizing neural network structures for embedded systems
US11562231B2 (en) 2018-09-03 2023-01-24 Tesla, Inc. Neural networks for embedded devices
SG11202103493QA (en) 2018-10-11 2021-05-28 Tesla Inc Systems and methods for training machine models with augmented data
US11196678B2 (en) 2018-10-25 2021-12-07 Tesla, Inc. QOS manager for system on a chip communications
US11816585B2 (en) 2018-12-03 2023-11-14 Tesla, Inc. Machine learning models operating at different frequencies for autonomous vehicles
US11537811B2 (en) 2018-12-04 2022-12-27 Tesla, Inc. Enhanced object detection for autonomous vehicles based on field view
US11610117B2 (en) 2018-12-27 2023-03-21 Tesla, Inc. System and method for adapting a neural network model on a hardware platform
US11150664B2 (en) 2019-02-01 2021-10-19 Tesla, Inc. Predicting three-dimensional features for autonomous driving
US10997461B2 (en) 2019-02-01 2021-05-04 Tesla, Inc. Generating ground truth for machine learning from time series elements
US11567514B2 (en) 2019-02-11 2023-01-31 Tesla, Inc. Autonomous and user controlled vehicle summon to a target
US10956755B2 (en) 2019-02-19 2021-03-23 Tesla, Inc. Estimating object properties using visual image data
EP4184242A4 (en) * 2020-07-14 2024-04-03 Koito Manufacturing Co., Ltd. TRIGGER CAMERA, VEHICLE DETECTION SYSTEM AND VEHICLE LIGHT
JPWO2022039230A1 (ja) * 2020-08-21 2022-02-24
IL300789A (en) * 2020-08-21 2023-04-01 Koito Mfg Co Ltd Vehicle sensing system and distance measuring camera
US20220107422A1 (en) * 2020-10-06 2022-04-07 Yandex Self Driving Group Llc LiDAR DETECTION METHODS AND SYSTEMS
WO2022172719A1 (ja) * 2021-02-15 2022-08-18 パナソニックIpマネジメント株式会社 物体情報生成システム、物体情報生成方法、および、物体情報生成プログラム
US11734908B2 (en) * 2021-04-13 2023-08-22 Google Llc Randomly generated blobs to improve object-detection training for framed video content
JP2023074948A (ja) * 2021-11-18 2023-05-30 オムロン株式会社 作業認識装置、作業認識方法、及び作業認識プログラム
WO2023190058A1 (ja) * 2022-03-30 2023-10-05 パナソニックIpマネジメント株式会社 画像処理方法および画像処理装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009257983A (ja) 2008-04-18 2009-11-05 Calsonic Kansei Corp 車両用距離画像データ生成装置および車両用距離画像データの生成方法
WO2017110413A1 (ja) 2015-12-21 2017-06-29 株式会社小糸製作所 車両用画像取得装置、制御装置、車両用画像取得装置または制御装置を備えた車両および車両用画像取得方法
WO2017149370A1 (en) 2016-03-01 2017-09-08 Brightway Vision Ltd. Gated imaging apparatus, system and method

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7630806B2 (en) * 1994-05-23 2009-12-08 Automotive Technologies International, Inc. System and method for detecting and protecting pedestrians
JP2011044064A (ja) * 2009-08-24 2011-03-03 Nikon Corp 画像処理装置、および画像処理プログラム
WO2014009945A1 (en) * 2012-07-09 2014-01-16 Brightway Vision Ltd. Stereo gated imaging system and method
CN104103062A (zh) * 2013-04-08 2014-10-15 富士通株式会社 图像处理设备和图像处理方法
CN103218621B (zh) * 2013-04-21 2015-12-02 北京航空航天大学 一种室外视频监控中多尺度车辆的识别方法
US9866816B2 (en) * 2016-03-03 2018-01-09 4D Intellectual Properties, Llc Methods and apparatus for an active pulsed 4D camera for image acquisition and analysis
US10306148B2 (en) * 2016-08-30 2019-05-28 Microsoft Technology Licensing, Llc Motion triggered gated imaging
US10248874B2 (en) * 2016-11-22 2019-04-02 Ford Global Technologies, Llc Brake light detection
US10614326B2 (en) * 2017-03-06 2020-04-07 Honda Motor Co., Ltd. System and method for vehicle control based on object and color detection

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009257983A (ja) 2008-04-18 2009-11-05 Calsonic Kansei Corp 車両用距離画像データ生成装置および車両用距離画像データの生成方法
WO2017110413A1 (ja) 2015-12-21 2017-06-29 株式会社小糸製作所 車両用画像取得装置、制御装置、車両用画像取得装置または制御装置を備えた車両および車両用画像取得方法
WO2017149370A1 (en) 2016-03-01 2017-09-08 Brightway Vision Ltd. Gated imaging apparatus, system and method

Also Published As

Publication number Publication date
EP3896645A1 (en) 2021-10-20
JPWO2020121973A1 (ja) 2021-10-28
CN113243016A (zh) 2021-08-10
WO2020121973A1 (ja) 2020-06-18
US20210295065A1 (en) 2021-09-23

Similar Documents

Publication Publication Date Title
JP7369921B2 (ja) 物体識別システム、演算処理装置、自動車、車両用灯具、分類器の学習方法
US11527077B2 (en) Advanced driver assist system, method of calibrating the same, and method of detecting object in the same
JP6819996B2 (ja) 交通信号認識方法および交通信号認識装置
US8055016B2 (en) Apparatus and method for normalizing face image used for detecting drowsy driving
EP2924653A1 (en) Image processing apparatus and image processing method
US20050232466A1 (en) Method of recognizing and/or tracking objects
US20050232463A1 (en) Method and apparatus for detecting a presence prior to collision
CN109409186B (zh) 用于对象检测和通知的驾驶员辅助***和方法
JP2007065924A (ja) 画像処理装置
WO2016125377A1 (ja) 画像処理装置、および車両システム
JP6782433B2 (ja) 画像認識装置
WO2020184447A1 (ja) ゲーティングカメラ、自動車、車両用灯具、物体識別システム、演算処理装置、物体識別方法、画像表示システム、検査方法、撮像装置、画像処理装置
CN111598065A (zh) 深度图像获取方法及活体识别方法、设备、电路和介质
JP2007164517A (ja) 図形中心検出方法、楕円検出方法、画像認識装置、制御装置
JP2023184572A (ja) 電子機器、移動体、撮像装置、および電子機器の制御方法、プログラム、記憶媒体
WO2021201269A1 (ja) ゲーティングカメラ、車両用センシングシステム、車両用灯具
JP4969359B2 (ja) 移動物認識装置
JP7036464B2 (ja) 物体識別装置、物体識別方法、及び制御プログラム
WO2021060397A1 (ja) ゲーティングカメラ、自動車、車両用灯具、画像処理装置、画像処理方法
JP7201706B2 (ja) 画像処理装置
JP6983334B2 (ja) 画像認識装置
WO2023013776A1 (ja) ゲーティングカメラ、車両用センシングシステム、車両用灯具
CN112153252B (zh) 车辆用灯具
WO2023095679A1 (ja) 視認状態判定装置及び視認状態判定システム
US20230394844A1 (en) System for avoiding accidents caused by wild animals crossing at dusk and at night

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220921

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20230113

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20230217

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230829

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A711

Effective date: 20230906

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230922

R150 Certificate of patent or registration of utility model

Ref document number: 7369921

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150