JP2002032766A - 画像認識装置及びその方法 - Google Patents

画像認識装置及びその方法

Info

Publication number
JP2002032766A
JP2002032766A JP2000216946A JP2000216946A JP2002032766A JP 2002032766 A JP2002032766 A JP 2002032766A JP 2000216946 A JP2000216946 A JP 2000216946A JP 2000216946 A JP2000216946 A JP 2000216946A JP 2002032766 A JP2002032766 A JP 2002032766A
Authority
JP
Japan
Prior art keywords
shape
image
model
input
vector
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2000216946A
Other languages
English (en)
Inventor
Megumi Yamaoka
めぐみ 山岡
Kenji Nagao
健司 長尾
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP2000216946A priority Critical patent/JP2002032766A/ja
Priority to EP00121115A priority patent/EP1089214A3/en
Priority to US09/676,680 priority patent/US6999623B1/en
Publication of JP2002032766A publication Critical patent/JP2002032766A/ja
Priority to US10/677,866 priority patent/US7054489B2/en
Pending legal-status Critical Current

Links

Landscapes

  • Image Processing (AREA)
  • Image Analysis (AREA)

Abstract

(57)【要約】 【課題】 モデル画像を用いて入力画像から特定の形状
の物体を認識する際、検出対象の形状をしているがモデ
ル画像にない物体も認識することを目的とする。 【解決手段】 検出対象の形状を表す形状識別子とその
形状を持つ物体の画像をモデル画像として予め登録する
画像データベース1と、各形状ごとにモデル画像から形
状特徴を抽出するモデル生成手段2と、形状特徴と形状
識別子を対にして予め格納する形状情報データベース3
と、物体を検出する画像を入力する画像入力部4と、入
力画像を部分画像として切り出す画像切り出し部5と、
部分画像と形状特徴とを照合し、検出対象の形状がある
かを判定する形状分類手段6と、形状を表す情報とその
形状の入力画像中の位置情報を出力する出力部7とを備
えることにより、入力画像から特定の形状とその位置を
高精度に検出して出力することができる。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、特定の形状の物体
を撮影した多数のモデル画像から予め検出対象となる形
状特徴を抽出し、入力画像から抽出した特徴と、モデル
の特徴とを照合することにより、入力画像から特定の形
状の物体を検出し、その位置や形状を出力する画像認識
装置及びその方法に関するものである。
【0002】
【従来の技術】従来の画像認識装置は、特開平6−21
5140号公報に記載されたものなどが知られている。
【0003】図17は、従来の画像認識装置のブロック
構成を示しており、画像を表示する表示装置101と、
全体動作を制御する主制御部102と、動作プログラム
等を格納する内部メモリ103と、参照パターンなどを
格納するディスク104と、サンプルや識別対象物など
の製品を撮影するテレビカメラ105と、テレビカメラ
105で撮影した製品の映像をデジタル画像情報に変換
する画像入力部106と、デジタル画像情報に変換され
た濃淡画像を各カテゴリー毎に製品の向きを一定方向に
向ける位置決め処理を行う画像回転部107と、回転画
像をある一定の割合でサンプリングしサブサンプリング
画像の濃淡値を特徴として抽出する画像情報抽出部10
8と、得られた特徴から各カテゴリー毎の平均ベクトル
を算出する平均ベクトル算出部109aを具備し平均ベ
クトルからなる辞書(参照パターン)を作成する辞書作成
部109と、カテゴリーの不明な識別対象物のベクトル
を求めこのベクトルとの距離が最も近い平均ベクトルを
辞書作成部109の平均ベクトルから抽出するベクトル
距離比較部110aを具備し未知の識別対象物を識別す
る識別部110と、識別対象物毎に画像入力部106、
画像回転部107、画素情報抽出部108、識別部11
0のパラメータを最適化するパラメータ設定部111か
ら構成されている。
【0004】
【発明が解決しようとする課題】このような従来の画像
認識装置は、物体をその形状で認識し形状分類しようと
したときに、同じ形状で濃淡値の大きく異なる物体の画
像を全て1つのカテゴリーに属するものとすると認識が
困難になり、濃淡値の似た画像で1つのカテゴリーを作
成する必要があるために、カテゴリー数が多くなり処理
時間がかかるという課題を有していた。
【0005】本発明は、上記従来の課題を解決するもの
で、同じ形状で濃淡値の大きくことなる物体の画像を1
つのカテゴリーとし、画像中の物体の形状を高速に認識
しその位置を出力することを目的とする。
【0006】
【課題を解決するための手段】この課題を解決するため
に、検出対象の形状を表す形状識別子とその形状を持つ
物体の画像をモデル画像として予め登録しておく画像デ
ータベースと、各形状ごとに前記モデル画像から形状特
徴を予め抽出しておくモデル生成手段と、前記形状特徴
と前記形状識別子を対にして予め格納しておく形状情報
データベースと、物体を検出する画像を入力する画像入
力部と、入力画像の一部を部分画像として切り出す画像
切り出し部と、前記部分画像を前記形状特徴と照合する
ことによって前記部分画像内に検出対象の形状があるか
どうかを判定する形状分類手段と、前記入力画像内に検
出対象の形状と一致するものがある場合にはその形状を
表す情報とその形状の入力画像中の位置を表す情報を出
力する出力部を備えたものである。
【0007】これにより、本発明は、予め多数のモデル
画像から共通の形状特徴を抽出しておき、形状特徴を入
力画像と照合することにより、少ないデータ量で入力画
像内の物体の有無を高速に検出し、位置と検出した形状
を出力することができる。
【0008】
【発明の実施の形態】本発明の請求項1に記載の発明
は、画像から特定の形状の物体を検出する装置におい
て、検出対象の形状を表す形状識別子とその形状を持つ
物体の画像をモデル画像として予め登録しておく画像デ
ータベースと、各形状ごとに前記モデル画像から形状特
徴を予め抽出しておくモデル生成手段と、前記形状特徴
と前記形状識別子を対にして予め格納しておく形状情報
データベースと、物体を検出する画像を入力する画像入
力部と、入力画像の一部を部分画像として切り出す画像
切り出し部と、前記部分画像と前記形状特徴とを照合
し、前記部分画像内に検出対象の形状があるか否かを判
定する形状分類手段と、前記検出された検出対象の形状
を表す情報とその形状の入力画像中の位置を表す情報を
出力する出力部とを備えるもので、多数のモデル画像を
代表する形状特徴を抽出し、入力画像を形状特徴と比較
することによって、少ないデータ量で入力画像から高速
に形状を検出しその位置を出力する作用を有する。
【0009】請求項2に記載の発明は、請求項1に記載
の画像認識装置において、モデル生成手段は、各形状ご
とにその形状に属する前記モデル画像の平均画像と前記
モデル画像の各画素の分散を形状特徴として抽出し、、
形状ごとに平均画像と分散と形状識別子とを対にして形
状情報データーベースに格納するもので、入力画像の形
状とモデルの形状との照合が高精度にできるという作用
を有す。
【0010】請求項3に記載の発明は、画像から特定の
形状の物体を検出する装置において、検出対象の形状を
表す形状識別子とその形状を持つ物体の画像をモデル画
像として予め登録しておく画像データベースと、前記全
てのモデル画像の画素値から特徴空間の基底ベクトルを
算出し、前記全てのモデル画像を特徴空間内にモデル画
像ベクトルとして射影し、前記形状識別子を付与した各
モデル画像ベクトルと、前記モデル画像ベクトルから形
状ごとに特徴的な統計量を形状特徴パラメタとして算出
し、前記形状識別子を付与するモデル生成手段と、前記
モデル生成手段からの基底ベクトルと形状特徴パラメタ
を前記形状識別子とともに登録しておく形状情報データ
ベースと、物体を検出する画像を入力する画像入力部
と、入力画像の一部を部分画像として切り出す画像切り
出し部と、前記基底ベクトルを用いて前記部分画像を前
記特徴空間に射影して部分画像ベクトルを求め、前記形
状特徴パラメタを用いて前記部分画像ベクトルをモデル
と照合して前記部分画像内に検出対象の形状があるかど
うかを判定する形状分類手段と、前記入力画像内に検出
対象の形状と一致するものがある場合にはその形状を表
す情報とその形状の入力画像中の位置を表す情報を出力
する出力部とを備えるもので、特徴空間内で入力画像と
モデル形状を照合することによって、効率の良い検出が
行え、処理速度が早いという作用を有する。
【0011】請求項4記載の発明は、請求項3記載の画
像認識装置において、モデル生成手段の各形状ごとの形
状特徴パラメタの算出は、同じ形状の物体のモデル画像
から算出された前記モデル画像ベクトルの平均ベクトル
と共分散から各形状ごとの形状特徴パラメタを算出する
もので、効率良くかつ高精度に入力画像から特定の形状
を検出できるという作用を有する。
【0012】請求項5記載の発明は、請求項3または4
記載の画像認識装置において、 モデル生成手段は、各
形状ごとに前記モデル画像の平均画像を求めて前記全て
の平均画像の画素値から基底ベクトルを算出し、前記全
てのモデル画像を特徴空間内にモデル画像ベクトルとし
て射影し、各モデル画像ベクトルに前記形状識別子を付
与するもので、各形状を代表する画像をよく区別する特
徴空間を生成することにより、類似した形状も良く分類
できるという作用を有する。
【0013】請求項6記載の発明は、請求項3乃至5の
いずれか記載の画像認識装置において、前記形状識別子
は、その形状が物体のどの部分の形状であるかの情報を
含むもので、物体の一部分が隠蔽されていても、部分の
形状だけで、特定の形状の物体を検出できるという作用
を有する。
【0014】請求項7記載の発明は、請求項6記載の画
像認識装置において、前記形状分類手段は、判定した部
分形状の形状識別子ごとに少なくとも1つ入力画像中の
物体全体の領域を推定し、入力の各部分画像について推
定した物体全体の領域を集計することにより物体領域の
位置を出力するもので、物体の一部分が隠蔽されていて
も、部分の形状と全体の形状との両方で、特定の形状の
物体を高精度に検出できるという作用を有する。
【0015】請求項8記載の発明は、画像から特定の形
状の物体を検出する方法において、検出対象の形状を表
す形状識別子とその形状を持つ物体の画像をモデル画像
として予め登録しておく画像データベースと、各形状ご
とに前記モデル画像から形状特徴を予め抽出するステッ
プと、前記形状特徴と前記形状識別子を対にして予め格
納しておく形状情報データベースと、物体を検出する画
像を入力するステップと、入力画像の一部を部分画像と
して切り出すステップと、前記部分画像と前記形状特徴
とを照合し、前記部分画像内に検出対象の形状があるか
否かを判定するステップと、前記検出された検出対象の
形状を表す情報とその形状の入力画像中の位置を表す情
報を出力するステップとを備えるもので、多数のモデル
画像を代表する形状特徴を抽出し、入力画像を形状特徴
と比較することによって、少ないデータ量で入力画像か
ら高速に形状を検出しその位置を出力する作用を有す
る。
【0016】以下、本発明の実施の形態について、図1
から図18を用いて説明する。
【0017】(実施の形態1)図1は、本発明の実施の形
態1における画像認識装置のブロック構成図を示してい
る。
【0018】図1において、1は認識したい形状を持つ
多数の物体の濃淡画像を、形状名と画像ファイル名と画
像中の物体に外接する矩形領域の左上角座標と右下角座
標を記した形状識別子と共に格納している画像データベ
ース、2は学習データベース1から認識したい形状ごと
にその形状の全ての濃淡画像を入力して特徴を抽出する
モデル生成手段、21は学習データベース1から入力し
た全ての濃淡画像に対して、画像が属する形状ごとに物
体に外接する矩形領域内の各画素の平均と平均からの分
散を求めて形状識別子と共に出力する特徴量抽出部、3
は特徴量抽出部21から形状ごとの平均画像と分散と形
状識別子を入力して格納している形状情報データベー
ス、4は形状の有無を判断したい画像を入力する画像入
力部、5は形状情報データベース3に格納されている形
状識別子を入力して検出対象の形状と同じサイズの画像
を入力画像から切り出す画像切り出し部、6は画像切り
出し部5から入力した画像内に検出対象の形状があるか
どうかを判断する形状分類手段、61は画像切り出し部
5から入力した画像を形状情報データベース3から抽出
したモデルの形状特徴と照合して検出対象の形状と一致
するかどうかを判断する部分形状分類部、7は形状分類
手段6から入力画像内に検出対象の形状があるという結
果を入力したときに検出した形状と入力画像内の位置と
をディスプレイなどに表示する出力部である。
【0019】また、図2はコンピュータにより画像認識
装置を実現した場合のブロック構成図であり、201は
コンピュータ、202はCPU、203はメモリ、20
4はキーボード及びディスプレイ、205は画像認識プ
ログラムを読み込むためのFD、PD、MO、DVDな
どの蓄積媒体ユニット、206〜208はI/Fユニッ
ト、209はCPUバス、210は画像を取り込むため
のカメラ、211は予め蓄積されている画像を取り込む
ための画像データベース、212は種々の形状の物体の
モデル画像をその形状を示す形状識別子と共に格納して
いる形状情報データベース、213は得られた物体の形
状と位置をI/Fユニットを介して出力する出力端子で
構成されている。
【0020】以上のように構成された画像認識装置につ
いて、以下その動作を図3と図4のフローチャートを用
いて説明する。図3は、モデル生成手段の動作を示すフ
ローチャート、図4は、認識したい画像データを入力し
てから認識結果を出力するまでの動作を示すフローチャ
ート、図5は、画像データベース1に格納されているモ
デル画像の例、図6は、形状情報データベース3に格納
されている1つの形状の平均画像と形状識別子の例、図
7は、画像入力部4から入力した画像に対して画像切り
出し部5で切り出す領域の例を矩形で表したもの、図8
は形状分類手段6で検出した結果を出力部7でディスプ
レイに出力している例である。
【0021】認識を行う前に、認識時に使う形状情報の
データを予め構築しておく。画像データベース1には、
図5に示すような物体の濃淡画像ファイルがモデル画像
として格納されている。各画像には、画像中の物体の形
状と、画像ファイル名と、物体に外接する矩形の左上角
座標と右下角座標を物体のエリアとして記述している形
状識別子が付けられている。図5は、画像を撮影したカ
メラに対する角度と、カメラからの距離が一定なセダン
のモデル画像の例である。
【0022】図5に示すようなセダンaの形状の車両を
検出対象とするとき、モデル生成手段2は、画像データ
ベース1から形状識別子の形状名がセダンaのモデル画
像を全て形状識別子と共に入力し、特徴量抽出部21
で、対象エリアで示された矩形領域画像の平均画像を求
める(ステップ301)。このとき、各モデル画像は同じ
形状の物体の画像であるから、各モデル画像の対象エリ
アで示された矩形領域は、全て同じサイズとなり、平均
画像もこのサイズとなる。
【0023】図5で示したセダンaの場合、平均画像の
サイズは横148画素、縦88画素である。次に、特徴量抽
出部21は、全てのモデル画像の対象エリアで示された
矩形領域画像の各画素の画素値と、平均画像の対応する
画素の画素値から、各画素における分散を求める(ステ
ップ302)。
【0024】最後に、特徴量抽出部21は、図6に示す
ような、セダンaの平均画像と形状識別子と、各画素ご
との分散の値とを、セダンaの形状特徴を表すものとし
て、形状情報データベース3に格納しておく(ステップ
303)。検出対象が複数ある場合には、他の形状につ
いても同様にステップ301からステップ303までの
処理を行う。
【0025】セダンaの認識を行うときは、まず、認識
対象となる画像データを画像入力部4(カメラ210ま
たは画像データベース211)から入力する(ステップ4
01)。画像切り出し部5は、図7に示すように、入力
画像から形状情報データベース3に格納されているセダ
ンaの平均画像と同じサイズの部分画像を、任意画素移
動させながら、順次切り出す(ステップ402)。
【0026】形状分類手段2は、画像切り出し部5から
部分画像を1つ入力し、また、形状情報データベース3
からセダンaの平均画像と各画素の分散値を入力して、
部分形状分類部61で、部分画像の各画素ごとに平均画
像の対応する画素との画素値の差の二乗を求め、分散で
除算した後に、それらの全画素にわたる和を求めて、部
分画像と平均画像との距離とする(ステップ403)。検
出対象の形状が複数ある場合には、部分形状分類部61
は、形状ごとにステップ403を行い(ステップ40
4)、全ての距離の値のうちの最小値が一定値より小さ
ければ(ステップ405)、その部分画像には最小の距離
を算出した平均画像の形状の物体があると判断する(ス
テップ406)。
【0027】距離の最小値が一定値以上であれば、その
部分画像には物体は存在しないと判断する(ステップ4
07)。部分形状分類部61が、入力画像から切り出し
た全ての部分画像についてステップ407までを行い
(ステップ408)、物体があると判断した部分画像があ
る場合には、出力部7は、図8に示すように、入力画像
中の物体のある部分画像の位置に、物体の形状を表す図
を重ねて出力する(ステップ409)。なお、この出力
は、I/Fユニット208を介して出力端子213から
出力される。
【0028】(実施の形態2)図9は、本発明の実施の形
態2における画像認識装置のブロック構成図を示す。
【0029】図9において、1は認識したい形状を持つ
多数の物体の濃淡画像を、形状名と画像ファイル名と画
像中の検出したい形状に外接する、形状によらず同じサ
イズの矩形領域の左上角座標と右下角座標を記した形状
識別子と共に格納している画像データベース、2は学習
データベース1から認識したい形状の全ての濃淡画像を
入力して特徴を抽出するモデル生成手段、20は学習デ
ータベース1から入力した全てのモデル画像から特徴空
間を生成してその基底ベクトルを形状情報データベース
に出力し全てのモデル画像をモデル画像ベクトルとして
特徴空間に射影する特徴空間生成部、21は特徴空間生
成部から入力する全てのモデル画像ベクトルから形状ご
とにモデル画像ベクトルの平均と分散を求めて形状識別
子と共に出力する特徴量抽出部、3は特徴空間生成部2
0から特徴空間の基底ベクトルを入力し、特徴量抽出部
21から形状ごとのモデル画像ベクトルの平均と分散を
形状識別子と共に入力して格納している形状情報データ
ベース、4は形状の有無を判断したい画像を入力する画
像入力部、5は形状情報データベース3に格納されてい
る形状識別子を入力して検出対象の形状と同じサイズの
画像を入力画像から切り出す画像切り出し部、6は画像
切り出し部5から入力した画像内に検出対象の形状があ
るかどうかを判断する形状分類手段、60は画像切り出
し部5から入力した部分画像を形状情報データベース3
から入力した基底ベクトルを用いて部分画像ベクトルと
して特徴空間に射影する特徴空間射影部、61は特徴空
間射影部60からから入力した部分画像ベクトルと形状
情報データベース3から入力したモデル画像ベクトルの
各平均との距離を求めて検出対象の形状と一致するかど
うかを判断する部分形状分類部、7は形状分類手段6か
ら入力画像内に検出対象の形状があるという結果を入力
したときに、検出した形状と入力画像内の位置とをディ
スプレイなどに表示する出力部である。
【0030】以上のように構成された画像認識装置につ
いて、以下その動作を図10と図11のフローチャート
を用いて説明する。図10は、モデル生成手段の動作を
示すフローチャート、図11は、認識したい画像データ
を入力してから認識結果を出力するまでの動作を示すフ
ローチャート、図12は、画像データベース1に格納さ
れているモデル画像の例、図7は、画像入力部4から入
力した画像に対して画像切り出し部5で切り出す領域の
例を矩形で表したもの、図8は形状分類手段6で検出し
た結果を出力部7でディスプレイに出力している例であ
る。
【0031】認識を行う前に、認識時に使う形状情報の
データを予め構築しておく。画像データベース1には、
図12に示すような物体の濃淡画像ファイルがモデル画
像として格納されている。各画像には、画像中の物体の
形状と、画像ファイル名と、検出する形状に外接する矩
形の左上角座標と右下角座標を物体のエリアとして記述
している形状識別子が付けられている。図12は、画像
を撮影したカメラに対する角度と、カメラからの距離が
一定なセダンのモデル画像とバスのモデル画像の例であ
る。
【0032】図12に示すようなセダンaの形状の車両
とバスを検出対象とするとき、モデル生成手段2は、画
像データベース1から形状識別子の形状名がセダンaの
モデル画像と形状名がバス背面部であるモデル画像を全
て形状識別子と共に特徴空間生成部20に入力する。
【0033】特徴空間生成部20は、対象エリアで示さ
れた矩形領域画像の画素値から固有値と固有ベクトルを
求める(ステップ1001)。このとき、各モデル画像の
対象エリアで示された矩形領域は、全て同じサイズであ
り、図12では横148画素、縦88画素である。図12の
バスの場合は、全てのバスの画像から同じ部分の矩形領
域を対象エリアとする。また、固有ベクトルを算出する
ときには、まず、各モデル画像に対して画素値を一列に
並べたベクトル作り、次に、それら全てのベクトルの平
均ベクトルを各々のベクトルから引いたベクトルを作成
して、固有値と固有空間を導く。
【0034】特徴空間生成部20は、大きい方からn個
の固有値に対応する固有ベクトルを、基底ベクトルとし
て形状情報データベースに格納し(ステップ1002)、
n個の固有ベクトルを用いて全てのモデル画像を固有空
間に射影してモデル画像ベクトルとする(ステップ10
03)。
【0035】特徴量抽出部21は、特徴空間生成部20
からモデル画像ベクトルと形状識別子を入力して、同じ
形状識別子を持つモデル画像ベクトルの平均と共分散を
求める(ステップ1004)。特徴量抽出部21は、全て
のモデル画像の平均と、形状ごとのモデル画像ベクトル
の平均と共分散と形状識別子とを形状情報データベース
3に格納しておく(ステップ1005)。
【0036】認識を行うときは、まず、認識対象となる
画像データを画像入力部4から入力する(ステップ11
01)。画像切り出し部5は、形状情報データベース3
に格納されている形状識別子の対象エリアからモデル画
像のサイズを算出して、入力画像から図7に示すような
同じサイズの部分画像を、任意画素移動させながら、順
次切り出す(ステップ1102)。
【0037】形状分類手段2は、画像切り出し部5から
部分画像を1つ入力し、また、形状情報データベース3
から基底ベクトルを入力して、特徴空間射影部60が、
部分画像を固有空間に部分画像ベクトルとして射影する
(ステップ1103)。部分形状分類部61は、特徴空間
射影部60から部分画像ベクトルを、また、形状情報デ
ータベース3からセダンaとバスそれぞれの平均ベクト
ルと共分散を入力して、部分画像ベクトルと各平均ベク
トルのマハラノビス距離を算出する(ステップ110
4)。
【0038】全てのマハラノビス距離の値のうちの最小
値が一定値より小さければ(ステップ1105)、その部
分画像には最小の距離を算出した平均ベクトルを持つ形
状の物体があると判断する(ステップ1106)。距離の
最小値が一定値以上であれば、その部分画像には物体は
存在しないと判断する(ステップ1107)。特徴空間射
影部60と部分形状分類部61が、入力画像から切り出
した全ての部分画像についてステップ1103からステ
ップ1107までを行い(ステップ1108)、物体があ
ると判断した部分画像がある場合には、出力部7は、図
8に示すように、入力画像中の物体のある部分画像の位
置に、物体の形状を表す図を重ねて出力する(ステップ
1109)。
【0039】なお、この出力は、I/Fユニット208
を介して出力端子213から出力される。
【0040】(実施の形態3)図13は、本発明の実施の
形態3における画像認識装置のブロック構成図を示す。
【0041】図13において、1は認識したい形状を持
つ多数の物体の濃淡画像を、各画像ごとに同じサイズの
矩形の部分領域に分割して、部分ごとに部分の形状名と
画像ファイル名と部分の矩形領域の左上角座標と右下角
座標を記した形状識別子を付けて格納している画像デー
タベース、2は学習データベース1から認識したい形状
の全ての濃淡画像を入力して特徴を抽出するモデル生成
手段、20は学習データベース1から入力した全てのモ
デル画像の全ての部分領域の画素値から特徴空間を生成
してその基底ベクトルを形状情報データベースに出力
し、全ての部分領域をモデル画像局所ベクトルとして特
徴空間に射影する特徴空間生成部、21は特徴空間生成
部20から入力する全てのモデル画像局所ベクトルから
部分形状ごとにモデル画像局所ベクトルの平均と分散を
求めて形状識別子と共に出力する特徴量抽出部、3は特
徴空間生成部20から特徴空間の基底ベクトルを入力
し、特徴量抽出部21から部分形状ごとのモデル画像局
所ベクトルの平均と分散を形状識別子と共に入力して格
納している形状情報データベース、4は形状の有無を判
断したい画像を入力する画像入力部、5は形状情報デー
タベース3に格納されている形状識別子を入力して検出
対象の部分形状と同じサイズの画像を入力画像から切り
出す画像切り出し部、6は画像切り出し部5から入力し
た画像内に検出対象の形状があるかどうかを判断する形
状分類手段、60は画像切り出し部5から入力した部分
画像を形状情報データベース3から入力した基底ベクト
ルを用いて部分画像ベクトルとして特徴空間に射影する
特徴空間射影部、61は特徴空間射影部60からから入
力した部分画像ベクトルと形状情報データベース3から
入力したモデル画像局所ベクトルの各平均との距離を求
めて検出対象の物体の部分形状と一致するかどうかを判
断する部分形状分類部、62は部分形状分類部61で検
出対象の物体の部分形状を検出したときに、検出した入
力の部分画像ごとに検出した部分形状の全体形状に対す
る位置から、入力画像内の物体全体の領域を推定する全
体形状領域推定部、63は全体形状推定部62で推定し
た物体の全体領域の位置を、部分形状を検出した全ての
入力の部分画像について集計する集計部、7は集計部6
3で物体の位置として推定された回数がある一定回以上
あった位置に物体があると判断して、その位置と検出し
た形状をディスプレイなどに表示する出力部である。
【0042】以上のように構成された画像認識装置につ
いて、以下その動作を図14と図15のフローチャート
を用いて説明する。図14は、モデル生成手段の動作を
示すフローチャート、図15は、認識したい画像データ
を入力してから認識結果を出力するまでの動作を示すフ
ローチャート、図16は、画像データベース1に格納さ
れているモデル画像の例、図17は、画像入力部4から
入力した画像に対して画像切り出し部5で切り出す領域
の例を矩形で表したもの、図18は、集計部63が出力
する集計結果の一例、図8は形状分類手段6で検出した
結果を出力部7でディスプレイに出力している例であ
る。
【0043】認識を行う前に、認識時に使う形状情報の
データを予め構築しておく。画像データベース1には、
図16に示すような物体の濃淡画像ファイルがモデル画
像として格納されている。各画像は、同じサイズの矩形
の局所領域に区切られ、各局所領域ごとに、部分の形状
名と画像ファイル名と局所領域の左上角座標と右下角座
標を記述している形状識別子が付けられている。形状名
は、その物体全体の形状名「セダンa」と局所領域がセ
ダンaのどの部分かを示す数字から成り、同じ数字は画
像によらず同じ位置を表す。局所領域間には、重なりが
あっても良い。図16は、画像を撮影したカメラに対す
る角度と、カメラからの距離が一定なセダンを検出する
ときのモデル画像の例であり、実際には、同じ見え方の
セダンの画像が多数同じように部分ごとに形状識別子を
付けて格納されている。
【0044】図16に示すようなセダンaを検出対象と
するとき、モデル生成手段2は、画像データベース1か
ら形状識別子の形状名がセダンaのモデル画像を全て形
状識別子と共に抽出し、特徴空間生成部20に入力す
る。特徴空間生成部20は、各形状識別子の対象エリア
で示された局所矩形領域を局所モデル画像として、全て
の局所モデル画像の画素値から固有値と固有ベクトルを
求める(ステップ1401)。このとき、各局所モデル画
像は、全て同じサイズであり、図16では横29画素、縦
22画素である。また、固有ベクトル算出するときは、ま
ず、各局所モデル画像に対して画素値を一列に並べたベ
クトル作り、次に、それら全てのベクトルの平均ベクト
ルを各々のベクトルから引いたベクトルを作成して、固
有値と固有ベクトルを導く。
【0045】特徴空間生成部20は、大きい方からn個
の固有値に対応する固有ベクトルを、基底ベクトルとし
て形状情報データベースに格納し(ステップ1402)、
n個の固有ベクトルを用いて全ての局所モデル画像を固
有空間に射影して局所モデル画像ベクトルとする(ステ
ップ1403)。特徴量抽出部21は、特徴空間生成部
20から局所モデル画像ベクトルと形状識別子を入力し
て、同じ形状識別子を持つ局所モデル画像ベクトルの平
均と共分散を求める(ステップ1404)。特徴量抽出部
21は、全ての局所モデル画像の平均と、形状ごとの局
所モデル画像ベクトルの平均と共分散と形状識別子とを
形状情報データベース3に格納しておく(ステップ14
05)。
【0046】認識を行うときは、まず、認識対象となる
画像データを画像入力部4から入力する(ステップ15
01)。画像切り出し部5は、形状情報データベース3
に格納されている形状識別子の対象エリアから局所モデ
ル画像のサイズを算出して、入力画像から図17に示す
ような同じサイズの部分画像を、任意画素移動させなが
ら、順次切り出す(ステップ1502)。
【0047】形状分類手段2は、画像切り出し部5から
部分画像を1つ入力し、また、形状情報データベース3
から基底ベクトルを入力して、特徴空間射影部60が、
部分画像を固有空間に部分画像ベクトルとして射影する
(ステップ1503)。部分形状分類部61は、特徴空間
射影部60から部分画像ベクトルを、また、形状情報デ
ータベース3からセダンaのそれぞれの部分の平均ベク
トルと共分散を入力して、部分画像ベクトルと各平均ベ
クトルのマハラノビス距離を算出し(ステップ150
4)、最小の距離を算出した平均ベクトルを持つ部分形
状の形状識別子を出力する。
【0048】全体形状領域推定部62は、形状識別子の
対象エリアに記述されている左上角座標と、入力の部分
画像の左上角座標との差の座標を出力し、集計部61
が、その座標に一票投票する(ステップ1505)。ここ
で投票する座標は、入力画像中での物体の位置を示して
いる。
【0049】特徴空間射影部60から集計部63まで
が、入力画像から切り出した全ての部分画像についてス
テップ1503から1505までを行うと(ステップ1
506)、集計部63では図18に示すような集計結果
が得られる。図18では、投票数の多い順に座標と投票
数が表示されている。この集計結果の各座標の投票数の
うち一定値より大きい投票数があれば(ステップ150
7)入力画像のその座標の位置に物体があると判断し(ス
テップ1508)、出力部7は、図8に示すように、入
力画像中の物体のある部分画像の位置に、物体の形状を
表す図を重ねて出力する(ステップ1510)。ステップ
1507で、一定値より大きい投票数がない場合には、
入力画像中に物体はないと判断して(ステップ150
9)、入力画像をそのまま出力する(ステップ151
0)。なお、この出力は、I/Fユニット208を介し
て出力端子213から出力される。
【0050】
【発明の効果】以上のように本発明によれば、少ないモ
デルデータで、物体表面の色が異なっていても同じ形状
の物体であれば形状特徴で検出でき、また、物体の一部
分が隠蔽されていても精度良く検出できる。また、入力
画像中の物体の形状と位置を高精度に出力することがで
きる。
【図面の簡単な説明】
【図1】本発明の実施の形態1における画像認識装置の
ブロック構成図
【図2】本発明の実施の形態1におけるコンピュータに
よる画像認識装置のブロック構成図
【図3】本発明の実施の形態1におけるモデル生成手段
の処理の流れを示すフローチャート
【図4】本発明の実施の形態1における画像入力部から
出力部までの処理の流れを示すフローチャート
【図5】本発明の実施の形態1における画像データベー
スが保管しているモデル画像と形状識別子の一例を示す
【図6】本発明の実施の形態1における形状情報データ
ベースが保管しているモデルの平均画像と形状識別子の
一例を示す図
【図7】画像切り出し部が切り出す矩形領域の例を示す
【図8】出力部が出力する検出結果の一例を示す図
【図9】本発明の実施の形態2における画像認識装置の
ブロック構成図
【図10】本発明の実施の形態2におけるモデル生成手
段の処理の流れを示すフローチャート
【図11】本発明の実施の形態2における画像入力部か
ら出力部までの処理の流れを示すフローチャート
【図12】本発明の実施の形態2における画像データベ
ースが保管しているモデル画像と形状識別子の一例を示
す図
【図13】本発明の実施の形態3における画像認識装置
のブロック構成図
【図14】本発明の実施の形態3におけるモデル生成手
段の処理の流れを示すフローチャート
【図15】本発明の実施の形態3における画像入力部か
ら出力部までの処理の流れを示すフローチャート
【図16】本発明の実施の形態3における画像データベ
ースが保管しているモデル画像と形状識別子の一例を示
す図
【図17】本発明の実施の形態3における画像切り出し
部が切り出す矩形領域の例を示す図
【図18】本発明の実施の形態3における集計部が出力
する集計の一例を示す図
【図19】従来の画像認識装置の一例を示すブロック図
【符号の説明】
1 画像データベース 2 モデル生成手段 3 形状情報データベース 4 画像入力部 5 画像切り出し部 6 形状分類手段 7 出力部 20 特徴空間生成部 21 特徴量抽出部 60 特徴空間射影部 61 部分形状分類部 62 全体形状領域推定部 63 集計部 201 コンピュータ 202 CPU 203 メモリ 204 キーボード/ディスプレイ 205 蓄積媒体ユニット 206〜208 I/Fユニット 209 CPUバス 210 カメラ 211 画像データベース 212 形状情報データベース 213 出力端子
フロントページの続き Fターム(参考) 5B057 AA06 BA02 CE09 DA02 DA07 DA16 DC09 DC22 DC33 5L096 BA04 CA02 EA35 FA18 FA32 FA33 FA81 HA08 JA11 KA04

Claims (8)

    【特許請求の範囲】
  1. 【請求項1】 画像から特定の形状の物体を検出する装
    置において、検出対象の形状を表す形状識別子とその形
    状を持つ物体の画像をモデル画像として予め登録してお
    く画像データベースと、各形状ごとに前記モデル画像か
    ら形状特徴を予め抽出しておくモデル生成手段と、前記
    形状特徴と前記形状識別子を対にして予め格納しておく
    形状情報データベースと、物体を検出する画像を入力す
    る画像入力部と、入力画像の一部を部分画像として切り
    出す画像切り出し部と、前記部分画像と前記形状特徴と
    を照合し、前記部分画像内に検出対象の形状があるか否
    かを判定する形状分類手段と、前記検出された検出対象
    の形状を表す情報とその形状の入力画像中の位置を表す
    情報を出力する出力部とを備えることを特徴とする画像
    認識装置。
  2. 【請求項2】 モデル生成手段は、各形状ごとにその形
    状に属する前記モデル画像の平均画像と前記モデル画像
    の各画素の分散を形状特徴として抽出し、、形状ごとに
    平均画像と分散と形状識別子とを対にして形状情報デー
    ターベースに格納することを特徴とする請求項1記載の
    画像認識装置。
  3. 【請求項3】 画像から特定の形状の物体を検出する装
    置において、検出対象の形状を表す形状識別子とその形
    状を持つ物体の画像をモデル画像として予め登録してお
    く画像データベースと、前記全てのモデル画像の画素値
    から特徴空間の基底ベクトルを算出し、前記全てのモデ
    ル画像を特徴空間内にモデル画像ベクトルとして射影
    し、前記形状識別子を付与した各モデル画像ベクトル
    と、前記モデル画像ベクトルから形状ごとに特徴的な統
    計量を形状特徴パラメタとして算出し、前記形状識別子
    を付与するモデル生成手段と、前記モデル生成手段から
    の基底ベクトルと形状特徴パラメタを前記形状識別子と
    ともに登録しておく形状情報データベースと、物体を検
    出する画像を入力する画像入力部と、入力画像の一部を
    部分画像として切り出す画像切り出し部と、前記基底ベ
    クトルを用いて前記部分画像を前記特徴空間に射影して
    部分画像ベクトルを求め、前記形状特徴パラメタを用い
    て前記部分画像ベクトルをモデルと照合して前記部分画
    像内に検出対象の形状があるかどうかを判定する形状分
    類手段と、前記入力画像内に検出対象の形状と一致する
    ものがある場合にはその形状を表す情報とその形状の入
    力画像中の位置を表す情報を出力する出力部とを備える
    ことを特徴とする画像認識装置。
  4. 【請求項4】 モデル生成手段の各形状ごとの形状特徴
    パラメタの算出は、同じ形状の物体のモデル画像から算
    出された前記モデル画像ベクトルの平均ベクトルと共分
    散から各形状ごとの形状特徴パラメタを算出することを
    特徴とする請求項3記載の画像認識装置。
  5. 【請求項5】 モデル生成手段は、各形状ごとに前記モ
    デル画像の平均画像を求めて前記全ての平均画像の画素
    値から基底ベクトルを算出し、前記全てのモデル画像を
    特徴空間内にモデル画像ベクトルとして射影し、各モデ
    ル画像ベクトルに前記形状識別子を付与することを特徴
    とする請求項3または4記載の画像認識装置。
  6. 【請求項6】 前記形状識別子は、その形状が物体のど
    の部分の形状であるかの情報を含むことを特徴とする請
    求項3乃至5のいずれか記載の画像認識装置。
  7. 【請求項7】 前記形状分類手段は、判定した部分形状
    の形状識別子ごとに少なくとも1つ入力画像中の物体全
    体の領域を推定し、入力の各部分画像について推定した
    物体全体の領域を集計することにより物体領域の位置を
    出力することを特徴とする請求項6記載の画像認識装
    置。
  8. 【請求項8】 画像から特定の形状の物体を検出する方
    法において、検出対象の形状を表す形状識別子とその形
    状を持つ物体の画像をモデル画像として予め登録してお
    く画像データベースと、各形状ごとに前記モデル画像か
    ら形状特徴を予め抽出するステップと、前記形状特徴と
    前記形状識別子を対にして予め格納しておく形状情報デ
    ータベースと、物体を検出する画像を入力するステップ
    と、入力画像の一部を部分画像として切り出すステップ
    と、前記部分画像と前記形状特徴とを照合し、前記部分
    画像内に検出対象の形状があるか否かを判定するステッ
    プと、前記検出された検出対象の形状を表す情報とその
    形状の入力画像中の位置を表す情報を出力するステップ
    とを備えることを特徴とする画像認識方法。
JP2000216946A 1999-09-30 2000-07-18 画像認識装置及びその方法 Pending JP2002032766A (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP2000216946A JP2002032766A (ja) 2000-07-18 2000-07-18 画像認識装置及びその方法
EP00121115A EP1089214A3 (en) 1999-09-30 2000-09-28 Apparatus and method for image recognition
US09/676,680 US6999623B1 (en) 1999-09-30 2000-09-29 Apparatus and method for recognizing an object and determining its position and shape
US10/677,866 US7054489B2 (en) 1999-09-30 2003-10-02 Apparatus and method for image recognition

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000216946A JP2002032766A (ja) 2000-07-18 2000-07-18 画像認識装置及びその方法

Publications (1)

Publication Number Publication Date
JP2002032766A true JP2002032766A (ja) 2002-01-31

Family

ID=18712127

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000216946A Pending JP2002032766A (ja) 1999-09-30 2000-07-18 画像認識装置及びその方法

Country Status (1)

Country Link
JP (1) JP2002032766A (ja)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004199695A (ja) * 2002-12-18 2004-07-15 Xerox Corp 視覚的特性を自動的に選択して背景に対して目標を強調表示する方法
WO2010147229A1 (en) 2009-06-18 2010-12-23 Canon Kabushiki Kaisha Image recognition method and image recognition apparatus
JP2011040073A (ja) * 2003-02-28 2011-02-24 Aperio Technologies Inc 画像パターン認識システム及び方法
JP2014505952A (ja) * 2011-02-18 2014-03-06 ナショナル・アイシーティ・オーストラリア・リミテッド 画像品質の評価
JP2016001489A (ja) * 2009-06-18 2016-01-07 キヤノン株式会社 画像認識方法及び画像認識装置
JP2017182606A (ja) * 2016-03-31 2017-10-05 セコム株式会社 特徴量抽出装置
JP2018067149A (ja) * 2016-10-19 2018-04-26 三菱重工業株式会社 属性判定装置、属性判定方法、コンピュータプログラム、及び記録媒体
CN108073890A (zh) * 2016-11-14 2018-05-25 安讯士有限公司 视频序列中的动作识别
CN112013921A (zh) * 2019-05-30 2020-12-01 杭州海康威视数字技术股份有限公司 一种基于水位尺测量图像获取水位信息的方法、装置和***

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07182484A (ja) * 1993-12-24 1995-07-21 Nissan Motor Co Ltd 移動車の前方認識装置ならびに車輌用走行制御装置
JPH07254068A (ja) * 1994-03-14 1995-10-03 N T T Data Tsushin Kk 物品同定システム
JPH0933232A (ja) * 1995-05-18 1997-02-07 Omron Corp 物体観測方法およびその方法を用いた物体観測装置、ならびにこの装置を用いた交通流計測装置および駐車場観測装置
JP2605295B2 (ja) * 1987-08-18 1997-04-30 スズキ株式会社 自動車の車種判別方法
JPH11306353A (ja) * 1998-04-21 1999-11-05 Matsushita Electric Ind Co Ltd 物体認識方法及び物体認識装置
JP3004501B2 (ja) * 1993-08-02 2000-01-31 三菱重工業株式会社 車種判別装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2605295B2 (ja) * 1987-08-18 1997-04-30 スズキ株式会社 自動車の車種判別方法
JP3004501B2 (ja) * 1993-08-02 2000-01-31 三菱重工業株式会社 車種判別装置
JPH07182484A (ja) * 1993-12-24 1995-07-21 Nissan Motor Co Ltd 移動車の前方認識装置ならびに車輌用走行制御装置
JPH07254068A (ja) * 1994-03-14 1995-10-03 N T T Data Tsushin Kk 物品同定システム
JPH0933232A (ja) * 1995-05-18 1997-02-07 Omron Corp 物体観測方法およびその方法を用いた物体観測装置、ならびにこの装置を用いた交通流計測装置および駐車場観測装置
JPH11306353A (ja) * 1998-04-21 1999-11-05 Matsushita Electric Ind Co Ltd 物体認識方法及び物体認識装置

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4579529B2 (ja) * 2002-12-18 2010-11-10 ゼロックス コーポレイション 視覚的特性を自動的に選択して背景に対して目標を強調表示する方法
JP2004199695A (ja) * 2002-12-18 2004-07-15 Xerox Corp 視覚的特性を自動的に選択して背景に対して目標を強調表示する方法
JP2011040073A (ja) * 2003-02-28 2011-02-24 Aperio Technologies Inc 画像パターン認識システム及び方法
JP2016001489A (ja) * 2009-06-18 2016-01-07 キヤノン株式会社 画像認識方法及び画像認識装置
JP2011022991A (ja) * 2009-06-18 2011-02-03 Canon Inc 画像認識方法及び画像認識装置
WO2010147229A1 (en) 2009-06-18 2010-12-23 Canon Kabushiki Kaisha Image recognition method and image recognition apparatus
US9852159B2 (en) 2009-06-18 2017-12-26 Canon Kabushiki Kaisha Image recognition method and image recognition apparatus
US10891329B2 (en) 2009-06-18 2021-01-12 Canon Kabushiki Kaisha Image recognition method and image recognition apparatus
JP2014505952A (ja) * 2011-02-18 2014-03-06 ナショナル・アイシーティ・オーストラリア・リミテッド 画像品質の評価
JP2017182606A (ja) * 2016-03-31 2017-10-05 セコム株式会社 特徴量抽出装置
JP2018067149A (ja) * 2016-10-19 2018-04-26 三菱重工業株式会社 属性判定装置、属性判定方法、コンピュータプログラム、及び記録媒体
CN108073890A (zh) * 2016-11-14 2018-05-25 安讯士有限公司 视频序列中的动作识别
JP2018125841A (ja) * 2016-11-14 2018-08-09 アクシス アーベー ビデオシーケンスにおける動作認識
CN112013921A (zh) * 2019-05-30 2020-12-01 杭州海康威视数字技术股份有限公司 一种基于水位尺测量图像获取水位信息的方法、装置和***
CN112013921B (zh) * 2019-05-30 2023-06-23 杭州海康威视数字技术股份有限公司 一种基于水位尺测量图像获取水位信息的方法、装置和***

Similar Documents

Publication Publication Date Title
US7054489B2 (en) Apparatus and method for image recognition
CN1977286B (zh) 对象识别方法及其设备
JP5726125B2 (ja) 奥行き画像内の物体を検出する方法およびシステム
Dornaika et al. Simultaneous facial action tracking and expression recognition in the presence of head motion
US6118887A (en) Robust multi-modal method for recognizing objects
US5864630A (en) Multi-modal method for locating objects in images
US6661907B2 (en) Face detection in digital images
JP2821348B2 (ja) 指紋照合装置
US7995805B2 (en) Image matching apparatus, image matching method, computer program and computer-readable storage medium
US7340089B2 (en) Geometric pattern matching using dynamic feature combinations
JP4479478B2 (ja) パターン認識方法および装置
JP4745207B2 (ja) 顔特徴点検出装置及びその方法
JP2009053916A (ja) 顔画像処理装置及び顔画像処理方法、並びにコンピュータ・プログラム
CN102272774B (zh) 用于提供面部姿态估计的方法、装置和计算机程序产品
JP2002032766A (ja) 画像認識装置及びその方法
US9053383B2 (en) Recognizing apparatus and method, program, and recording medium
JP2007026308A (ja) 画像処理方法、画像処理装置
JP2003044853A (ja) 顔検出装置、顔向き検出装置、部分画像抽出装置及びそれらの方法
CN112199975A (zh) 基于人脸特征的身份验证方法及装置
JP3680658B2 (ja) 画像認識方法及び画像認識装置
Wang et al. Face detection based on color template and least square matching method
JPH0991432A (ja) 不審人物抽出方法
Méndez et al. Facial landmarks detection using extended profile lbp-based active shape models
JP3659221B2 (ja) 画像認識装置及びその方法
JP3796997B2 (ja) 物体認識方法及び物体認識装置

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20041029

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20041102

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20041207

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20050201