JP6833750B2

JP6833750B2 - 認識装置、車両システム及びプログラム

Info

Publication number: JP6833750B2
Application number: JP2018051486A
Authority: JP
Inventors: 友樹渡辺; 妍宋
Original assignee: Toshiba Corp; Toshiba Electronic Devices and Storage Corp
Current assignee: Toshiba Corp; Toshiba Electronic Devices and Storage Corp
Priority date: 2018-03-19
Filing date: 2018-03-19
Publication date: 2021-02-24
Anticipated expiration: 2038-03-19
Also published as: US20190286917A1; US10984256B2; EP3543899A1; KR20190116033A; JP2019164512A; CN110287756A

Description

本発明の実施形態は、認識装置、車両システム及びプログラムに関する。

例えば、交通標識を画像から認識する場合に、ニューラルネットワークが一般的に用いられる。認識対象とする交通標識の画像をニューラルネットワークに入力すると、当該画像に対応した交通標識の種別が識別結果として出力される。

特表２０１７−５１６１９７号公報

Forrest N. Iandola et. al., "Squeeze Net: AlexNet-level accuracy with 50x fewer parameters and <0.5MB model size," arXiv:1602.07360, 2016. Andrew G. Howard et. al., "MobileNets: Efficient Convolutional Neural Networks for Mobile Vision Applications," arXiv:1704.04861, 2017. Joseph Redmon et. al., "You Only Look Once: Unified, Real-Time Object Detection," arXiv:1506.02640, 2015. Wei Liu et. al., "SSD: Single Shot MultiBox Detector," arXiv:1512.02325, 2015.

ニューラルネットワークは、各種対象を認識するために膨大な情報量を必要とし、計算量も多い。また、新たな対象を追加学習する場合に、その対象に関する様々なパラメータ入力を必要とする。

本発明が解決しようとする課題は、ニューラルネットワークと同等の認識率で対象の標示を少ない計算量で効率的に認識することのできる認識装置、車両システム及びプログラムを提供することである。

一実施形態に係る認識装置は、第１の識別手段と、設定取得手段と、第２の識別手段とを備える。上記第１の識別手段は、入力された観測データから対象の構成要素の有無を識別する。上記設定取得手段は、種別と構成要素の有無との関係を示す設定情報を取得する。上記第２の識別手段は、上記設定取得手段によって得られた設定情報と上記第１の識別手段によって識別された構成要素の有無とに基づいて上記対象の種別を識別する。
上記構成において、上記第１の識別手段は、各種対象に関する構成要素が機械学習された識別器を用いて上記観測データから上記対象の構成要素の有無に関する第１のスコアを算出する。上記第２の識別手段は、上記設定情報に基づいて上記第１のスコアから上記対象の種別に関する第２のスコアを算出する。

図１は第１の実施形態に係る認識装置の機能構成を示すブロック図である。図２は同実施形態における交通標識と構成要素の一例を示す図である。図３は同実施形態における案内表示の一例を示す図である。図４は同実施形態における認識装置の処理動作を示すフローチャートである。図５は同実施形態における識別器として、畳み込みニューラルネットワークを用いた場合の入出力の関係を示す図である。図６は同実施形態における標示の種類と構成要素の有無の関係を示す図である。図７は同実施形態における第２のスコアの算出方法を説明するための図である。図８は第２の実施形態に係る車両システムの機能構成を示すブロック図である。図９は同実施形態における車両に認識装置を搭載した場合の構成を模式的に示す図である。図１０は同実施形態における車両システムにおける認識装置の処理動作を示すフローチャートである。図１１は上記第１および第２の実施形態における認識装置のハードウェア構成の一例を示す図である。

以下、図面を参照しながら各実施形態について説明する。なお、以下の説明において、略又は実質的に同一の機能及び構成要素については、同一符号を付し、必要に応じて説明を行う。

（第１の実施形態）
図１は第１の実施形態に係る認識装置の機能構成を示すブロック図である。

本実施形態における認識装置１００は、例えばカメラで撮影された画像などで与えられた対象の種別をその対象の構成要素から認識する装置である。ここで言う「対象」とは、図形や文字などで情報を伝えるための標示であり、標識も含まれる。

認識装置１００は、対象入力部１０１と、要素識別部１０２と、設定取得部１０３と、種別識別部１０４と、出力部１０５と、記憶部１０６とを備える。

対象入力部１０１は、対象の観測データを入力する。要素識別部１０２は、第１の識別手段として用いられる。この要素識別部１０２は、各種対象に関する構成要素が機械学習された識別器１０７を用いて、対象入力部１０１によって入力された観測データから対象の構成要素の有無を識別する。

設定取得部１０３は、種別と構成要素の有無の関係を示す設定情報を取得する。種別識別部１０４は、第２の識別手段として用いられる。この種別識別部１０４は、設定取得部１０３によって得られた設定情報と要素識別部１０２によって識別された構成要素の有無とに基づいて対象の種別を識別する。

出力部１０５は、種別識別部１０４の識別結果を出力する。記憶部１０６には、後述する要素識別部１０２や種別識別部１０４の識別処理に必要な各種情報が記憶されている。

ここで、標示として交通標識を例にして、標示と構成要素との関係について説明する。

図２は交通標識と構成要素の一例を示す図である。１列目は交通標識、２列目はその構成要素を表す。

１行目と２行目は、日本で使われている速度規制の交通標識である。なお、図面上では色が表現されていないが、これらの交通標識は実際には赤色の円と、黒色の文字で構成されている。１行目の交通標識は速度の上限が時速６０キロであることを表しており、赤色の円と数字「６０」で構成されている。２行目の交通標識は、速度の下限が時速３０キロであることを表しており、赤色の円と数字「３０」と下線で構成されている。

これらのルールの知識があれば、例えば赤色の円と数字「４０」から構成される交通標識は速度の上限が時速４０キロであることや、赤色の円と数字「１０」と下線から構成される交通標識は速度の下限が時速１０キロであることは、仮にその交通標識を過去に見たことがなくても理解できる。

３〜５行目は、欧州や米国で使われている速度規制の交通標識である。こちらも構成要素の組み合わせでデザインされていることが分かる。

ここでは、交通標識を例にして説明したが、本発明が対象とする標示は交通標識に限定されるものではなく、道路面に塗料で描かれた道路標示や、灯火の色や形状で情報を伝える信号機でも良い。

他にも、各種窓口や非常口などの場所を伝えるための案内表示や、喫煙可能・禁止などの施設の利用者に向けた注意事項や禁止事項を伝えるための掲示など、人に情報を伝えるためにデザインされた掲示物全般を対象としている。

図３に案内表示の一例として、店舗などでトイレの場所を表す標示を示す。１行目の標示は男子トレイと女子トイレの場所を男子の記号と女子の記号で表している。２行目の標示は男子トレイの場所を男子の記号で表している。なお、男子の記号は青色や黄色が使われることが多く、女子の記号は赤色や桃色が使われることが多い。

一般的に、畳み込みニューラルネットワークを利用して、例えば交通標識を認識する場合には、重みが最大となる交通標識の種類が認識結果として出力される。しかし、交通標識は膨大な種類が存在するため、正規化層で交通標識の種類の数と同数の大量の重みを出力しなければならず、計算量が多くなる。

交通標識には膨大な種類が存在するが、人はすべての交通標識を個別に認識しなくてもその意味を理解することができている。これは、交通標識や案内板などの標示は、人に情報を伝えるためにデザインされたものであり、同じ種類の標示には構成要素として同じ色や同じ図形を使うといったルールが存在しており、人はルールを知識として持っているためである。本実施形態における認識装置１００では、このようなルールに着目して、交通標識などの標示を対象として、これを効率的に認識するものである。

以下に、認識装置１００の処理動作について詳しく説明する。
図４は認識装置１００の処理動作を示すフローチャートである。

まず、対象入力部１０１は、対象の観測データを入力する（ステップＳ１１）。観測データは、例えばカメラから得られる標示の画像と標示の位置を表す座標情報や、座標情報を基に予め標示部分だけを切り出した画像などである。また、レーダーやセンサなどを通じて観測データを取得することでも良い。あるいは、通信媒体や記録媒体を通じて観測データを取得することでも良い。

次に、要素識別部１０２は、予め訓練された識別器１０７を用いて、観測データから標示の構成要素の有無を識別する。構成要素は、図２および図３に例示したように、同じ意味の標示に共通する形状、文字、色、それらの位置のことである。

ここで、識別器１０７として、例えばニューラルネットワークが用いられる。特に、高い識別性能が得られる畳み込みニューラルネットワーク（Convolutional Neural Network：CNNまたはConvNet）が好適である。その他、サポートベクターマシン（Support Vector Machine：SVM）などを用いても良い。なお、畳み込みニューラルネットワークやサポートベクターマシンについては公知であるため、ここではその詳しい説明を省略する。

識別器１０７のパラメータは、事前に記憶部１０６や外部から通信により要素識別部１０２にロードしておくか、処理時に記憶部１０６から逐次的にロードするものとする。

要素識別部１０２は、識別器１０７を利用して、標示の構成要素について、存在する可能性を表すスコア（以下、第１のスコアと称す）を算出する（ステップＳ１２）。なお、第１のスコアの値域は、０〜１の範囲で正規化し、さらに「存在することに対応するスコア」と「存在しないことに対応するスコア」の合計が１になるように正規化すると、後述の種別識別部１０４で扱いが容易となり、望ましい。

ここで、識別器１０７の訓練について述べる。
識別器１０７は、入力となる観測データのサンプルと、出力となる構成要素の有無のデータのサンプルを用いた機械学習により訓練される。

ただし、意味と図形・文字は必ずしも１対１の対応とは限らない。例えば、図２に示した４行目と５行目の交通標識はどちらも速度の上限が８０マイルであることを示すが、異なる文字で表される。そのため、識別器１０７が識別する構成要素は、形状、文字、色、位置のいずれかの類似に基づいた分類の集合とする。この方法は、構成要素の見た目が類似する場合に、識別器１０７の識別性能が高くなりやすい利点がある。

もう一つの方法として、構成要素は、形状や文字や色や位置に関わらず、同じ意味に対応するものをまとめて分類することも可能である。例えば、図２の１行目と２行目に示した構成要素であれば、日本の速度規制を意味するものとして分類される。この方法は、構成要素の種類が減少するため、後述の種別識別部１０４で使用する設定情報の記述を簡略化できる利点がある。

いずれにしても、構成要素の組み合わせで標示が表現できるように分類されており、標示の全種類数よりも構成要素の種類数が少なければ、識別器１０７の計算量を大幅に削減できる。

識別器１０７として、畳み込みニューラルネットワークを用いた場合の入出力の関係を図５に示す。

畳み込みニューラルネットワークでは、バックプロパゲーション（Backpropagation）と呼ばれる手法により訓練を行う。これは、観測データや観測データから算出した特徴量を入力し、畳み込みレイヤー等の演算を繰り返して算出した値と、出力の目標値との誤差が小さくなるように畳み込みレイヤーの重みを修正する手法である。

通常、畳み込みニューラルネットワークにおいて、各種標示（標識を含む）の情報をサンプルとして訓練する場合は、出力は標示の種別となる。つまり、例えば図２の１行目の交通標識であれば、その交通標識全体が識別結果として出力される。そのため、入力と出力との誤差をなくすためには、大量のサンプルを用いて訓練する必要がある。一方、本実施形態では、標示の構成要素について、畳み込みニューラルネットワークの一部を共有して第１のスコアを算出するだけなので、少ないサンプルで効果的に畳み込みレイヤーの重みを修正できる。

次に、設定取得部１０３は、標示の種類と構成要素の有無の関係を示す設定情報を記憶部１０６あるいは外部から通信により取得する（ステップＳ１３）。

「標示の種類と構成要素の有無の関係」とは、標示の種別毎に構成要素の有無の組み合わせを定めたルールのことである。図６に示すように、標示の種別それぞれについて、どの構成要素が含まれるか、または、どの構成要素が含まれない関係が定められたルールをテーブルで表現する。含まれる場合と含まれない場合のどちらもある構成要素があっても良い。

図６では、標示の種類として速度規制の交通標識を例にして、これらの構成要素の組み合わせのルールがテーブル化されている。例えば、図２の４行目に示した「最高速度８０ｋｍ／ｈ」といった意味を持つ交通標識に関しては、構成要素として、数字「１０」：含まれない、数字「８０」：含まれる、文字「ＳＰＥＥＤ」：含まれる、文字「ＬＩＭＩＴ」：含まれる、文字「ＭＡＸＩＭＵＭ」：どちらもある…などが定められている。文字「ＭＡＸＩＭＵＭ」が「どちらもある」になっているのは、図２の５行目に同じ意味を持つ別の交通標識が存在するからである。

なお、設定形式は、図６のようなテーブルに限らず、リストや決定木などで表現しても良い。

次に、種別識別部１０４は、設定取得部１０３で取得された関係を示す設定情報に基づいて、要素識別部１０２で識別された標示の構成要素に付けられた第１のスコアから種別に関するスコア（以下、第２のスコアと称す）を算出する（ステップＳ１４）。

図７を用いて、第２のスコアの算出方法について説明する。
要素識別部１０２によって識別された構成要素には、それぞれに存在する可能性を表す第１のスコアが付けられている。図７では、図２の４行目に示した「最高速度８０ｋｍ／ｈ」といった意味を持つ交通標識を認識する場合を例にしている。

要素識別部１０２の認識結果では、数字「１０」が存在する第１のスコア（有スコア）は０．１であり、数字「１０」が存在しない第１のスコア（無スコア）は０．９である。図６のテーブルの例では、数字「１０」は含まれない設定「−」になっているので、数字「１０」については、無スコアの０．９が第２のスコアの計算に用いられる。

また、数字「８０」が存在する第１のスコア（有スコア）は０．９であり、数字「８０」が存在しない第１のスコア（無スコア）は０．１である。図６のテーブルの例では、数字「８０」は含まれる設定「＋」になっているので、数字「８０」については、有スコアである０．９が第２のスコアの計算に用いられる。

なお、有無がどちらでもよい構成要素（図６の「＊」参照）に関する第１のスコアは、第２のスコアの計算に使用しないものとする。

このようにして、種別識別部１０４は、要素識別部１０２の認識結果として得られた標示の構成要素について、図６のテーブルを参照して第１のスコアを取得し、その中で最小値を求めて、これを第２のスコアとする。

第２のスコアとして、第１のスコアの最小値を用いる利点は、過剰な認識が抑えられることである。用途に応じて、例えば最大値や、重み付き和を用いて第２のスコアを算出しても良い。最大値の場合は未検出が抑えられる利点があり、重み付き和の場合は第１のスコアのノイズに対するロバスト性が向上する利点がある。

種別識別部１０４は、このような計算を認識対象となる各標示について繰り返し行い、最終的に第２のスコアが最大となる標示の種別、または、予め設定された閾値を超える標示の種別を識別結果とする（ステップＳ１５）。

出力部１０５は、種別識別部１０４で判別された標示の種別とそれに対応する第２のスコアも出力する。上記ステップＳ１５において、閾値を用いて種別を判定している場合には、複数の識別結果が出力されることがある。

このように第１の実施形態によれば、予め標示の種類と構成要素の有無の関係を設定しておくだけで、畳み込みニューラルネットワークと同等の認識率で対象の標示を少ない計算量で効率的に認識することが可能となる。この場合、対象とする標示の種類が増えたとしても、図６に示したテーブルの種類項目を増やすだけで、柔軟に対応できるといった利点がある。

（第２の実施形態）
次に、第２の実施形態として、上記第１の実施形態で説明した認識装置を自動車等の車両に搭載した場合を想定して説明する。

図８は第２の実施形態に係る車両システムの機能構成を示すブロック図である。図中の２００は車両システム全体を示している。

車両システム２００は、道路等に設置された交通標識、道路標示、信号機等のいずれか１つ、あるいは全てを対象にして、これらを認識装置１００で認識するように構成されている。
認識装置１００は、対象入力部１０１と、要素識別部１０２と、設定取得部１０３と、種別識別部１０４と、出力部１０５と、記憶部１０６とを備える。これらの構成については、上記第１の実施形態と同様であるため、ここではその説明を省略する。

車両システム２００には、車両関係の構成要素として、記憶部２０１、通信部２０２、ディスプレイ２０３、スピーカ２０４、外界センサ２０５、内界センサ２０６、制御部２０７、動力部２０８などが備えられており、これらが認識装置１００に直接的にあるいは間接的に接続されている。

記憶部２０１には、車両の制御に必要な各種情報を記憶している。なお、この記憶部２０１に観測データや関係の設定情報などを記憶しておき、認識装置１００からの指示により適宜読み出す構成としても良い。

通信部２０２は、無線あるいは有線で外部との間でデータ通信を行う。この通信部２０２を介して認識装置１００に必要な情報を外部から取得する構成としても良い。ディスプレイ２０３とスピーカ２０４は、車両の操作に必要な各種情報を操作者に提示するための提示手段として用いられる。

外界センサ２０５には、例えばカメラ、ＧＰＳ、レーダーなどが含まれる。内界センサ２０６は、例えば車速計、タイマー、温度計、タッチパネル等の入力センサなどが含まれる。制御部２０７は、動力部２０８の駆動制御を含む、車両全体の制御を行う。動力部２０８は、エンジンなどである。

図９に、自動車等の車両３００に認識装置１００を搭載した場合の構成を模式的に示す。なお、図中の符号は図８と対応している。

以下に、車両３００に搭載された認識装置１００の処理動作について説明する。

図１０は車両システム２００における認識装置１００の処理動作を示すフローチャートである。ステップＳ２１〜Ｓ２４までの処理は、上記図４のステップＳ１１〜１４と同様であるため、ここではその詳しい説明を省略する。

第２の実施形態では、ステップＳ２３で取得される設定情報（テーブル）が運転中の環境変化に対応して動的に切り替えられる（ステップＳ２５）。

例えば、国や地域、道路種別（市街地道路、一般道路、高速道路など）、時間帯などによって変更されるルールに対応させて、記憶部１０６（あるいは車両側の記憶部２０１）に多数のテーブルを用意しておき、これらを車両運転中の環境条件に応じて動的に変更する。

環境条件には、地域の境界を示す標示の他に、車速計によって検出される移動速度、ＧＰＳなどによって検出される現在位置、タイマ−によって計時される現在時刻、運転席などに設置されたタッチパネル等によるユーザ操作などが含まれる。このような環境条件に応じて関係設定のテーブルを適宜切り替えることで、運転中に観測データから得られる対象を正確に認識できるようになる。

以後の処理は上記第１の実施形態と同様であり、要素識別部１０２の認識結果として得られた標示の構成要素について、種別に関する第２のスコアが算出され、最終的に第２のスコアが最大となる種別、または、予め設定された閾値を超える標種別が識別結果として出力される（ステップＳ２６〜Ｓ２７）。

認識装置１００から出力された識別結果は、車両３００に設けられた制御部２０７に与えられる。制御部２０７は、以下のようにして車両３００の操作者に識別結果を提示する（ステップＳ２８）。

すなわち、例えば認識結果が速度規制の交通標識であったとする。制御部２０７は、現在の車速と認識結果として得られた交通標識の規制速度とを比較して、現在の車速が規制速度を超えている場合に、ディスプレイ２０３やスピーカ２０４を通じて音や映像で操作者に速度オーバーを通知する。あるいは、制御部２０７は、現在の車速を規制速度に合わせるように動力部２０８の駆動を制御する。

ここで、認識結果に含まれる第２のスコアを利用して、提示方法あるいは動力制御を変更することでも良い。例えば、第２のスコアが予め設定された値より低い場合には、誤認識の可能性があるので、映像のみを提示する。一方、第２のスコアが高く、誤認識の可能性が低い場合には映像と音で提示する。さらに、第２のスコアの値に応じて、音量や音程を段階的に変化させたり、映像の位置や大きさを段階的に変化させることでも良い。

また、第２のスコアが予め設定された値より高い場合には、動力部２０８の制御量を大きくして、短時間で規制速度に近づくように制御しても良い。

このように第２の実施形態によれば、車両システムに上記第１の実施形態の認識装置を適用することで、車両運転中の環境変化に順応して交通標識、道路標示、信号機等の対象を高精度に認識でき、その認識結果を車両の操作者に提示することで、運転の安全性を確保できる。

なお、上記第２の実施形態では、車両システムを例にして説明したが、例えば航空機、無人飛行物体など、車両以外の移動体に対しても同様に適用可能である。

（ハードウェア構成）
図１１は上記第１および第２の実施形態における認識装置１００のハードウェア構成の一例を示す図である。

認識装置１００は、ＣＰＵ５０１、不揮発性メモリ５０２、主メモリ５０３、通信デバイス５０４、Ｉ／Ｆ（インターフェイス）５０５等を備える。

ＣＰＵ５０１は、認識装置１００内の様々なコンポーネントの動作を制御するハードウェアプロセッサである。ＣＰＵ５０１は、ストレージデバイスである不揮発性メモリ５０２から主メモリ５０３にロードされる様々なプログラムを実行する。

ＣＰＵ５０１によって実行されるプログラムには、オペレーティングシステム（ＯＳ）の他に、図４および図１０のフローチャートに示した処理動作を実行するためのプログラム（以下、認識処理プログラムと称す）等が含まれる。また、ＣＰＵ５０１は、例えばハードウェア制御のためのプログラムである基本入出力システム（ＢＩＯＳ）等も実行する。

なお、図１および図８に示した対象入力部１０１、要素識別部１０２、設定取得部１０３、種別識別部１０４、出力部１０５の一部または全ては、ＣＰＵ５０１（コンピュータ）に認識処理プログラムを実行させることで実現される。

この認識処理プログラムは、コンピュータが読み取り可能な記録媒体に格納して頒布されてもよいし、またはネットワークを通じて認識装置１００にダウンロードされても良い。なお、対象入力部１０１、要素識別部１０２、設定取得部１０３、種別識別部１０４、出力部１０５の一部または全ては、ＩＣ（Integrated Circuit）等のハードウェアによって実現されてもよいし、当該ソフトウェア及びハードウェアの組み合わせ構成として実現されてもよい。

通信デバイス５０４は、例えば有線または無線による外部の装置との通信を実行するように構成されたデバイスである。

Ｉ／Ｆ５０５は、外部装置との間のデータの入出力処理を行う。Ｉ／Ｆ５０５は、図８に示した車両システム２００に認識装置１００を組み込む場合などに使用される。

なお、図１１の例では、ＣＰＵ５０１、不揮発性メモリ５０２、主メモリ５０３、通信デバイス５０４、Ｉ／Ｆ５０５のみが示されているが、認識装置１００は、例えばＨＤＤ（Hard Disk Drive）及びＳＳＤ（Solid State Drive）のような他の記憶装置を備えていても良いし、入力装置及び出力装置等を備えていても良い。

以上述べた少なくとも１つの実施形態によれば、ニューラルネットワークと同等の認識率で対象の標示を少ない計算量で効率的に認識することのできる認識装置、車両システム及びプログラムを提供することができる。

なお、本発明のいくつかの実施形態を説明したが、これらの実施形態は、例として提示したものであり、発明の範囲を限定することは意図していない。これら新規な実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。これら実施形態やその変形は、発明の範囲や要旨に含まれるとともに、特許請求の範囲に記載された発明とその均等の範囲に含まれる。

１００…認識装置、１０１…対象入力部、１０２…要素識別部、１０３…設定取得部、１０４…種別識別部、１０５…出力部、１０６…記憶部、１０７…識別器、２００…車両システム、２０１…記憶部、２０２…通信部、２０３…ディスプレイ、２０４…スピーカ、２０５…外界センサ、２０６…内界センサ、２０７…制御部、２０８…動力部、３００…車両。

Claims

入力された観測データから対象の構成要素の有無を識別する第１の識別手段と、
種別と構成要素の有無との関係を示す設定情報を取得する設定取得手段と、
上記設定取得手段によって得られた設定情報と上記第１の識別手段によって識別された構成要素の有無とに基づいて上記対象の種別を識別する第２の識別手段とを具備し、
上記第１の識別手段は、
各種対象に関する構成要素が機械学習された識別器を用いて上記観測データから上記対象の構成要素の有無に関する第１のスコアを算出し、
上記第２の識別手段は、
上記設定情報に基づいて上記第１のスコアから上記対象の種別に関する第２のスコアを算出する認識装置。
上記第２のスコアは、上記第１のスコアの最小値、最大値、和のいずれかである請求項１記載の認識装置。
上記識別器は、ニューラルネットワークを含み、
上記第１の識別手段は、
上記対象の構成要素について、上記ニューラルネットワークの一部を共有して上記第１のスコアを算出する請求項１記載の認識装置。
上記設定情報には、種別それぞれに構成要素が含まれる、または、含まれない関係が定められている請求項１記載の認識装置。
上記構成要素は、形状、文字、色、位置のいずれかの類似に基づいた分類である請求項１記載の認識装置。
上記構成要素は、表現される意味の一致に基づいた分類である請求項１記載の認識装置。
車両に関係する対象を認識する認識装置を備えた車両システムであって、
上記認識装置は、
観測データから上記対象の構成要素の有無を識別する第１の識別手段と、
上記車両の環境条件に応じて切り替えられ、種別と構成要素の有無との関係を示す設定情報を取得する設定取得手段と、
上記設定取得手段によって得られた設定情報と上記第１の識別手段の識別結果とに基づいて上記対象の種別を識別する第２の識別手段と、
上記第２の識別手段の識別結果を出力する出力手段と
を具備した車両システム。
上記対象には、少なくとも交通標識、道路標示、信号機のいずれかが含まれる請求項７記載の車両システム。
上記環境条件には、上記車両の現在位置、移動速度、時刻のいずれかが含まれる請求項７記載の車両システム。
上記第２の識別手段の識別結果を上記車両の操作者に提示する提示手段を具備した請求項７記載の車両システム。
上記提示手段は、上記識別結果に基づいて上記車両の操作者に提示する方法を動的に変更する請求項１０記載の車両システム。
上記出力手段から出力された識別結果に基づいて上記車両の動作を制御する制御手段を具備した請求項７記載の車両システム。
車両に関係する対象を認識する認識装置を備えた車両システムであって、
上記認識装置は、
観測データから上記対象の構成要素の有無を識別する第１の識別手段と、
種別と構成要素の有無との関係を示す設定情報を取得する設定取得手段と、
上記設定取得手段によって得られた設定情報と上記第１の識別手段の識別結果とに基づいて上記対象の種別を識別する第２の識別手段と、
上記第２の識別手段の識別結果を出力する出力手段とを具備し、
上記第１の識別手段は、
各種対象に関する構成要素が機械学習された識別器を用いて上記観測データから上記対象の構成要素の有無に関する第１のスコアを算出し、
上記第２の識別手段は、
上記設定情報に基づいて上記第１のスコアから上記対象の種別に関する第２のスコアを算出する車両システム。
上記設定情報は、上記車両の環境条件に応じて切り替えられる請求項１３記載の車両システム。
コンピュータによって実行されるプログラムであって、
上記コンピュータを、
入力された観測データから対象の構成要素の有無を識別する第１の識別手段と、
種別と構成要素の有無との関係を示す設定情報を取得する設定取得手段と、
上記設定取得手段によって得られた設定情報と上記第１の識別手段の識別結果とに基づいて上記対象の種別を識別する第２の識別手段として動作させためのプログラムであり、
上記第１の識別手段は、
各種対象に関する構成要素が機械学習された識別器を用いて上記観測データから上記対象の構成要素の有無に関する第１のスコアを算出し、
上記第２の識別手段は、
上記設定情報に基づいて上記第１のスコアから上記対象の種別に関する第２のスコアを算出するプログラム。