JP6444331B2

JP6444331B2 - 対象識別装置

Info

Publication number: JP6444331B2
Application number: JP2016071934A
Authority: JP
Inventors: 徳見　修; 修徳見
Original assignee: Secom Co Ltd
Current assignee: Secom Co Ltd
Priority date: 2016-03-31
Filing date: 2016-03-31
Publication date: 2018-12-26
Anticipated expiration: 2036-03-31
Also published as: JP2017182633A

Description

本発明は、入力画像に所定の対象が撮影されているか否かを識別する対象識別装置に関する。

監視カメラやデジタルスチルカメラで撮影された画像から人などの対象が撮影された画像を識別する技術として識別器を用いる方法が知られている。識別器は、対象が撮影された対象画像および対象が撮影されていない非対象画像からなる多数の学習データを用いた学習により生成される。

また、識別器においては、対象の輪郭や模様などを表現するＨＯＧ（Histograms of Oriented Gradients）などの勾配特徴量が用いられることが多い。

識別器の識別精度を向上させるには、学習データのバリエーションを増やす必要がある。例えば、入力画像が人の写った画像であるか否かを識別するための識別器を学習する場合、姿勢、体格、服装や撮影角度が異なる人の画像を多数撮影するなどして収集し、さらに被写体や場所が異なった人以外の画像を多数撮影するなどして収集する必要があり、多大な労力を要する。

ところが、このように収集しても識別精度が頭打ちになる傾向がある。その原因のひとつに学習データの偏りが挙げられる。例えば、人の写った学習データであれば、スカートを履いた人、子供などが少数派となる場合があり、これら少数派が偏りを生じさせる。

また、識別精度頭打ちの別の原因として、服と背景の色が似ている場合などに入力画像中の人の輪郭があいまいとなり、輪郭から抽出される勾配特徴が希薄となってしまうことが挙げられる。さらには、服の模様などから抽出される勾配特徴が多様なため、人の輪郭より内側の勾配特徴がデータ不足となることも原因として挙げられる。

このような問題を回避する方法として、学習データを人工的に生成する方法が考えられる。

例えば、特許文献１に記載の対象物識別装置においては、顔画像に対して拡大、縮小および回転の少なくとも１つの変形を段階的に行うことで学習用の画像を生成することが記載されている。

特開２０１５−１９１４２６号公報

しかしながら、画像を拡大、縮小、回転させる従来技術では増やすことが困難なバリエーションがあり、データ不足の解消には不十分であった。例えば、増やすことが困難なバリエーションとして、服の模様のバリエーションなどが挙げられる。

また、従来技術においては、画像空間において変形を行っているため、変形後の画像から抽出される勾配特徴量が対象クラスを逸脱し、非対象クラスに属する学習データとなる可能性がある。対象クラスから逸脱したものを含む学習データで学習した識別器を用いると、却って性能を低下させてしまうことになる。

本発明は、上記問題を鑑みてなされたものであり、学習データに偏りや不足があっても高精度に対象を識別できる対象識別装置を提供することを目的とする。

本発明に係る対象識別装置は、入力画像に所定の対象が撮影されているか否かを識別する対象識別装置であって、入力画像から当該入力画像の勾配特徴量である入力特徴量を抽出する特徴量抽出手段と、対象が撮影された対象画像から抽出した勾配特徴量である対象特徴量を記憶している対象特徴量記憶手段と、対象のシルエット画像から抽出した勾配特徴量であるシルエット特徴量を記憶しているシルエット特徴量記憶手段と、対象特徴量とシルエット特徴量の間を線形補間して線形補間データを生成する特徴量補間手段と、対象が撮影されていない非対象画像から抽出した勾配特徴量である非対象特徴量を記憶している非対象特徴量記憶手段と、入力特徴量が非対象特徴量よりも線形補間データに類似している場合は入力画像に対象が含まれていると判定し、入力特徴量が線形補間データよりも非対象特徴量に類似している場合は入力画像に対象が含まれていないと判定する対象識別手段と、を備えたことを特徴とする。

本発明に係る対象識別装置において、特徴量補間手段は、勾配特徴量の特徴空間において対象特徴量とシルエット特徴量とを結ぶ線分を線形補間データとして生成する構成とすることができる。

本発明に係る対象識別装置において、対象特徴量記憶手段は、複数の対象特徴量を記憶し、特徴量補間手段は、複数の対象特徴量のうち入力特徴量に最も類似した対象特徴量と、シルエット特徴量の間を線形補間して線形補間データを生成する構成とすることができる。

本発明に係る対象識別装置において、シルエット特徴量記憶手段は、複数のシルエット特徴量を記憶し、特徴量補間手段は、対象特徴量と、複数のシルエット特徴量のうち入力特徴量に最も類似したシルエット特徴量との間を線形補間して線形補間データを生成する構成とすることができる。

他の本発明に係る対象識別装置は、入力画像に所定の対象が撮影されているか否かを識別する対象識別装置であって、入力画像から当該入力画像の勾配特徴量である入力量特徴量を抽出する特徴抽出手段と、対象が撮影された対象画像から抽出した勾配特徴量である対象特徴量と対象のシルエット画像から抽出した勾配特徴量であるシルエット特徴量との間を線形補間した線形補間データを記憶している補間データ記憶手段と、対象が撮影されていない非対象画像から抽出した勾配特徴量である非対象特徴量を記憶している非対象特徴量記憶手段と、入力特徴量が非対象特徴量よりも線形補間データに類似している場合は入力画像に対象が含まれていると判定し、入力特徴量が線形補間データよりも非対象特徴量に類似している場合は入力画像に対象が含まれていないと判定する対象識別手段と、を備えたことを特徴とする。

他の本発明に係る対象識別装置は、入力画像に所定の対象が撮影されているか否かを識別する対象識別装置であって、対象が撮影された対象画像から抽出した勾配特徴量と対象のシルエット画像から抽出した勾配特徴量との間を線形補間した線形補間データ、および対象が撮影されていない非対象画像から抽出した勾配特徴量を用いて学習した、対象の勾配特徴量を識別する識別関数を記憶している識別関数記憶手段と、入力画像から当該入力画像の勾配特徴量である入力特徴量を抽出する特徴量抽出手段と、入力特徴量を識別関数に入力して入力画像に対象が含まれているか否かを識別する対象識別手段と、を備えたことを特徴とする。

本発明によれば、学習データ、特に対象特徴量に偏りや不足があっても対象を高精度に識別可能な対象識別装置を提供することが可能となる。

第一の実施形態に係る侵入検知装置の構成を表すブロック図である。第一の実施形態に係る対象識別装置の機能を表すブロック図である。線形補間データを説明するイメージ図である。線形補間データにより拡張される対象クラスを説明するイメージ図である。第一の実施形態に係る対象識別装置が行う識別処理を説明するイメージ図である。第一の実施形態に係る侵入検知装置が行う処理の流れの動作を示すフローチャートである。第一の実施形態に係る対象識別装置が行う人画像識別処理の流れの動作を示すフローチャートである。第二の実施形態に係る対象識別装置の機能を表すブロック図である。第二の実施形態に係る対象識別装置が行う人画像識別処理の流れの動作を示すフローチャートである。第三の実施形態に係る対象識別装置の機能を表すブロック図である。第三の実施形態に係る対象識別装置が行う人画像識別処理の流れの動作を示すフローチャートである。

以下、本発明の実施形態による対象識別装置が実装された侵入検知装置の例について説明する。

＜第一の実施形態＞
第一の実施形態に係る侵入検知装置１０について説明する。

［侵入検知装置１０の構成］
図１は侵入検知装置１０の概略の構成を示すブロック図である。侵入検知装置１０は撮影部２０、記憶部３０、画像処理部４０および出力部５０から構成される。

撮影部２０はいわゆる監視カメラであり、ＣＣＤ素子またはＣ−ＭＯＳ素子等の撮像素子、光学系部品、Ａ／Ｄ変換機等を含んで構成される。撮影部２０は画像処理部４０と接続され、所定の監視空間を順次撮影して監視画像を生成し、各監視画像を画像処理部４０に入力する。

記憶部３０は、ＲＯＭ、ＲＡＭ等の記憶装置である。記憶部３０は画像処理部４０で用いられる各種プログラムや各種データを記憶し、画像処理部４０との間でこれらの情報を入出力する。

画像処理部４０は、ＣＰＵ、ＤＳＰ、ＭＣＵ等の演算装置を用いて構成され、撮影部２０、記憶部３０および出力部５０に接続される。画像処理部４０は記憶部３０からプログラムを読み出して実行することで後述する各手段などとして機能する。画像処理部４０は撮影部２０からの監視画像を処理し、監視画像から人を検出した場合にアラーム信号を出力部５０に出力する。

出力部５０は画像処理部４０と外部装置を接続する通信インターフェース回路である。例えば、出力部５０は監視センターのサーバーとの通信を行う通信装置であり、画像処理部４０から入力されたアラーム信号をサーバーに送信する。

図２は、第一の実施形態に係る対象識別装置の概略の機能ブロック図である。記憶部３０は対象特徴量記憶手段３００、シルエット特徴量記憶手段３０１および非対象特徴量記憶手段３０２などとして機能し、画像処理部４０は特徴量抽出手段４００、特徴量補間手段４０１および対象識別手段４０２などとして機能する。

また、図２には示さないが画像処理部４０は切り出し手段および侵入判定手段としても機能する。切り出し手段は、撮影部２０から監視画像を入力される度に監視画像から複数の部分画像を切り出して各部分画像を対象識別装置の特徴量抽出手段４００に入力する。これらの各部分画像は第一の実施形態に係る対象識別装置への入力画像となる。対象識別装置は各部分画像に人が撮影されているか否かを識別し、侵入判定手段は部分画像のいずれかに人が撮影されていると識別された場合に侵入者が検知されたとしてアラーム信号を出力する。

対象特徴量記憶手段３００は予め複数の対象特徴量を記憶している。
対象特徴量のそれぞれは人の勾配特徴を参照するために予め用意された勾配特徴量のデータである。勾配特徴量は画素間の輝度の勾配を表す特徴量であり、輪郭形状やテクスチャーなどの特徴を捉えることができる。本実施形態においては勾配特徴量としてＨＯＧを用いる。

対象画像は、背景とともに様々な人がそれぞれに撮影された複数の人画像である。対象画像は、様々な場所、アングルで、様々な人物が様々な姿勢、服装で撮影された画像から人をほぼ中央に含む矩形を手作業等により切り出し、所定の大きさ（例えば６４×１２８画素）に拡大または縮小して作成される。

これらの対象画像のそれぞれから対象特徴量が抽出され、それぞれに付与された識別符号と対応付けて対象特徴量記憶手段３００に記憶されている。なお、対象特徴量は多様な人の特徴を識別するために十分な数だけ用意され、対象特徴量記憶手段３００は例えば２０００個の対象特徴量を記憶している。

シルエット特徴量記憶手段３０１は予め複数のシルエット特徴量を記憶している。
シルエット特徴量のそれぞれは人の輪郭形状のみの勾配特徴を参照するために予め用意された勾配特徴量のデータであり、具体的にはシルエット特徴量のそれぞれは複数枚の人のシルエット画像のそれぞれから抽出したＨＯＧである。

シルエット画像のそれぞれは、人が撮影された人画像における人の輪郭形状をかたどった人領域と、人領域以外である背景領域とに異なる画素値を設定した画像である。シルエット画像は、人画像における人の輪郭画素を目視確認により特定することで作成される。例えば、特定された輪郭画素及び輪郭画素に囲まれる領域を人領域として人領域内の画素の画素値を２５５、人領域以外の画素の画素値を０に設定する。
シルエット画像は、後述する線形補間データが人の特徴量であることを高確度で担保するために、対象画像のそれぞれから作成される。

これらのシルエット画像のそれぞれからシルエット特徴量が抽出され、それぞれに付与された識別符号と対応付けてシルエット特徴量記憶手段３０１に記憶されている。
また、複数のシルエット特徴量は予めクラスタリングされ、それぞれが属するクラスタの識別符号（以下、クラスタ識別子と称する）と対応付けてシルエット特徴量記憶手段３０１に記憶されている。クラスタ識別子が同一のシルエット特徴量は、互いに類似し、例えば同一姿勢の人についてのシルエット特徴量となる。

非対象特徴量記憶手段３０２は予め複数の非対象特徴量を記憶している。
非対象特徴量は、人の勾配特徴と対比するために用意された勾配特徴量であり、人が撮影されていない複数の非対象画像のそれぞれから予め抽出されたＨＯＧである。非対象特徴量記憶手段３０２は複数の非対象特徴量をそれぞれに付与された識別符号と対応付けて記憶している。なお非対象画像の大きさは対象画像と同一である。

なお、対象特徴量、シルエット特徴量、非対象特徴量はそれぞれ１つ以上あればよい。ちなみにシルエット特徴量が１つの場合、上述したクラスタリングは不要である。

このように、対象特徴量記憶手段３００は対象が撮影された対象画像から抽出した勾配特徴量である１または複数の対象特徴量を予め記憶しており、シルエット特徴量記憶手段３０１は対象の輪郭形状をかたどった対象領域と背景領域とに異なる画素値が設定されたシルエット画像から抽出した勾配特徴量である１または複数のシルエット特徴量を予め記憶しており、非対象特徴量記憶手段３０２は対象が撮影されていない非対象画像から抽出した勾配特徴量である１または複数の非対象特徴量を予め記憶している。

特徴量抽出手段４００は、切り出し手段から入力された入力画像からＨＯＧを抽出し、抽出したＨＯＧを特徴量補間手段４０１および対象識別手段４０２に出力する。以降、入力画像から抽出された勾配特徴量を入力特徴量と称する。すなわち特徴量抽出手段４００は入力画像から当該入力画像の勾配特徴量である入力特徴量を抽出する。

特徴量補間手段４０１は、対象特徴量記憶手段３００から対象特徴量を読み出すとともにシルエット特徴量記憶手段３０１からシルエット特徴量を読み出し、ＨＯＧの特徴空間において対象特徴量とシルエット特徴量の間を線形補間して線形補間データを生成し、生成した線形補間データを対象識別手段４０２に出力する。

具体的には、特徴量補間手段４０１は、特徴量抽出手段４００から入力された入力特徴量と対象特徴量記憶手段３００に記憶されている各対象特徴量の距離を算出して最小距離の対象特徴量（以下、最近傍対象特徴量と称する）を選出するとともに、入力特徴量と各シルエット特徴量の距離を算出して、最小距離のシルエット特徴量（以下、最近傍シルエット特徴量と称する）を選出し、最近傍対象特徴量と最近傍シルエット特徴量を結ぶ線分を線形補間データとして生成する。

一般に勾配特徴量は複数の要素からなるベクトルデータであり、特徴量補間手段４０１は最近傍対象特徴量と最近傍シルエット特徴量の対応する要素ごとに線分を算出する。つまり、特徴空間における線分の端点である最近傍対象特徴量と最近傍シルエット特徴量、およびこれらの各要素を結ぶ線分の傾きからなる傾きベクトルの組が線形補間データとして生成される。

なお最近傍対象特徴量と最近傍シルエット特徴量の選出は距離の代わりに相関値を用いて行ってもよい。ただし、その場合、特徴量補間手段４０１は、入力特徴量との相関値が最も高い対象特徴量とシルエット特徴量をそれぞれ最近傍対象特徴量と最近傍シルエット特徴量として選出する。

図３は線形補間データを説明するイメージ図である。

対象特徴量６１２およびシルエット特徴量６１１は、それぞれの抽出元である対象画像６０２およびシルエット画像６０１を、画像空間６００から勾配特徴量の特徴空間６１０に射影したものである。

シルエット画像６０１とは異なり、シルエット特徴量６１１においては、対象の輪郭形状のみの勾配特徴量の成分がそれ以外の成分と高い精度で分離されていると考えられる。ヒストグラム６２１は、シルエット特徴量６１１のＨＯＧを簡略的に例示したものであり、そのビン６３１の高さは対象の輪郭形状のみの勾配特徴量の成分量をイメージしたものである。対象の輪郭形状は、勾配特徴量の中でも個体間での共通性が高く、対象の識別に最も有用な成分である。

一方、対象特徴量６１２には、対象の輪郭形状の勾配特徴量の成分とそれ以外の成分とが混在している。ヒストグラム６２２は、対象特徴量６１２のＨＯＧを簡略的に例示したものである。輪郭形状の成分量はビン６３２の高さで例示するようにシルエット特徴量６１１のそれよりも低いと考えられる。また、ビン６４２、ビン６５２、ビン６６２は対象特徴量６１２における輪郭形状以外の成分をイメージしたものである。輪郭形状以外の成分には背景の勾配特徴量も含まれ得るが、対象の部位の特徴、服の模様など、対象を非対象と識別するために有用なテクスチャー成分が含まれている。

勾配特徴量の特徴空間６１０において対象特徴量６１２とシルエット特徴量６１１を結ぶ線分６５０が線形補間データである。ヒストグラム６２３、ヒストグラム６２４はそれぞれ線分６５０上の２点である点６１３、点６１４に対応するＨＯＧをイメージしたものである。

ヒストグラム６２３、ヒストグラム６２４において対象の輪郭形状の成分に対応すると考えられるビン６３３、ビン６３４は、シルエット特徴量６１１に近い点であるほど高くなり、対象特徴量６１２に近い点であるほど低くなる。それらの高さの上限はシルエット特徴量６１１におけるビン６３１の高さであり、下限は対象特徴量６１２におけるビン６３２の高さである。このように、輪郭成分が高い精度で分離されていると考えられる特徴空間６１０において、対象の実画像である対象画像６０２から抽出された対象特徴量６１２と人が目視確認して作成したシルエット画像６０１から抽出されたシルエット特徴量６１１を線形補間して線形補間データ６５０を生成することで、対象の勾配特徴量として逸脱せず、且つ対象の識別に最も有用な輪郭形状を強調したデータを増やすことができる。

一方、ヒストグラム６２３、ヒストグラム６２４において対象の輪郭形状以外の成分に対応すると考えられるビン６４３、ビン６５３、ビン６６３、ビン６４４、ビン６５４、ビン６６４は、シルエット特徴量６１１に近い点であるほど低くなり、対象特徴量６１２に近い点であるほど高くなる。それらの高さの下限は０であり、上限は対象特徴量６１２におけるビン６４２、ビン６５２、ビン６６２の高さである。これらの成分についても、対象の実画像である対象画像６０２から抽出された対象特徴量６１２と人が目視確認して作成したシルエット画像６０１から抽出されたシルエット特徴量６１１を線形補間した線形補間データ６５０を生成することで、対象の勾配特徴量として逸脱しない範囲で、且つ輪郭形状の強調を阻害することなくデータを増やすことができる。

このように、特徴量補間手段４０１は、勾配特徴量の特徴空間において対象特徴量とシルエット特徴量の間を線形補間する線形補間データを生成する。その際、特徴量補間手段４０１は、勾配特徴量の特徴空間において対象特徴量とシルエット特徴量とを結ぶ線分を線形補間データとして生成する。また、特徴量補間手段４０１は、処理量を減じるために、複数の対象特徴量のうち入力特徴量に最も類似した対象特徴量と、複数のシルエット特徴量のうち入力特徴量に最も類似したシルエット特徴量を選出し、勾配特徴量の特徴空間において、選出した対象特徴量と選出したシルエット特徴量の間を補間する線形補間データを生成する。

こうすることによって、勾配特徴量の特徴空間において線形補間して線形補間データを生成することにより、限られた対象画像を用いて対象の勾配特徴量として逸脱しない範囲で対象の識別に最も有用な輪郭形状を保持しつつ、対象のテクスチャー成分のバリエーションを増やすことができる。

図４は、線形補間データによって特徴空間における対象クラスの領域が拡張される様子を説明するイメージ図である。

点線の楕円７００で囲んだ、円７０１を含む９個の円の中心座標はそれぞれ特徴空間における対象特徴量をイメージしている。また、点線の楕円７１０で囲んだ４個の円７１１〜７１４の中心座標はそれぞれ特徴空間におけるシルエット特徴量をイメージしている。これら４個のシルエット特徴量はクラスタ＃１に帰属している。また、点線の楕円７２０で囲んだ５個の円の中心座標はそれぞれ特徴空間における別のシルエット特徴量をイメージしている。これら５個のシルエット特徴量はクラスタ＃２に帰属している。

以下、円７０１の中心座標で表される対象特徴量を対象特徴量７０１と表記し、円７１１、７１２、７１３、７１４それぞれの中心座標で表されるシルエット特徴量をシルエット特徴量７１１、７１２、７１３、７１４と表記する。

シルエット特徴量７１１の抽出元のシルエット画像は、対象特徴量７０１の抽出元の対象画像から作成されたシルエット画像である。対象特徴量７０１とシルエット特徴量７１１の組み合わせからは線分７５０が線形補間データとして生成され得、これにより線分７５０上の領域が対象クラスの領域として追加されることになる。同様に同一の対象画像に由来する対象特徴量とシルエット特徴量の組の間にも線形補間データが生成され得る。結局、図中の太線で示した９本の線分上に同一の対象画像に由来する線形補間データが生成され得、これらの線分上の領域が対象クラスの領域として拡張される。

さらに、対象特徴量７０１に関し、同一の対象画像に由来するシルエット特徴量７１１が帰属するクラスタ＃１の他のメンバーである３つのシルエット特徴量７１２、７１３、７１４のそれぞれとの間でも線形補間データが生成され得る。同様に同一のクラスタに由来する対象特徴量とシルエット特徴量の組の間にも線形補間データが生成され得る。結局、図中の細線で示した３３本の線分上に同一のクラスタに由来する線形補間データが生成され得、これらの線分上の領域も対象クラスの領域として拡張される。

これらの線形補間データは図３を参照して説明したように、対象クラスの領域としての信頼度が高い。ちなみに識別の処理の仕組みを考慮すると、実質的には上記計４１本の線分の周辺も対象クラスの領域として拡張される。このように、線形補間データを用いることにより、限られた対象特徴量を用いて、高い信頼性の下で対象クラスの領域を拡張できる。

対象識別手段４０２は、特徴量抽出手段４００から入力された入力特徴量と特徴量補間手段４０１から入力された線形補間データとの距離（以下、ポジティブ距離と称する）を算出する。また、対象識別手段４０２は、非対象特徴量記憶手段３０２から複数の非対象特徴量を読み出して入力特徴量と読み出した各非対象特徴量のそれぞれとの距離を算出し、算出した距離のうちの最小値（以下、ネガティブ距離と称する）をポジティブ距離と比較する。そして、対象識別手段４０２は、ポジティブ距離がネガティブ距離未満である場合に入力画像に人が撮影されていると判定し、ポジティブ距離がネガティブ距離以上である場合に入力画像に人が撮影されていないと判定する識別を行い、識別結果を侵入者判定手段に出力する。

線形補間データと入力特徴量の間のポジティブ距離は、特徴空間における線分と点の間の距離となる。因みに、線形補間データと入力特徴量が、線形補間データが表す線分を伸ばした先で入力特徴量からの垂線と直交する位置関係にある場合は、線形補間データが表す線分の端点（すなわちシルエット特徴量または対象特徴量）と入力特徴量が表す点の間の距離がポジティブ距離となる。

このように、対象識別手段４０２は、入力特徴量が非対象特徴量よりも線形補間データに類似している場合は入力画像に対象が含まれていると判定し、入力特徴量が線形補間データよりも非対象特徴量に類似している場合は入力画像に対象が含まれていないと判定する。

対象識別装置においては、対象の識別に最も有用な輪郭形状を保持しつつ、対象のテクスチャー成分のバリエーションの増えた線形補間データを用いて識別するため、対象が撮影された画像を対象が撮影されていないと誤る誤識別が低減される。また、対象識別装置においては、対象の勾配特徴量として逸脱しない範囲で生成された線形補間データを用いて識別するため、バリエーションを増やしても対象が撮影されていない画像を対象が撮影されていると誤る誤識別は増加しない。
よって、対象特徴量の分布の偏りの影響を抑制して高精度な識別が可能となる。

図５を参照して、対象識別手段４０２の処理のイメージと対象識別装置が奏する効果について説明する。

星印８００の重心座標は特徴空間における入力特徴量をイメージしている。以下、星印８００の重心座標で表される入力特徴量を入力特徴量８００と表記する。この入力特徴量８００が抽出された入力画像には対象が撮影されているものとする。

点線の楕円８１０で囲んだ、円８１１を含む９個の円の中心座標はそれぞれ特徴空間における対象特徴量をイメージしている。この対象特徴量の集合は、スカートを履いた人物に関するものが少ないなど、少数派の学習データが少なく偏りがちである。入力特徴量８００は、少数派の入力画像から抽出されたものであり、対象特徴量が分布する楕円８１０から外れている。

また、点線の楕円８２０で囲んだ、円８２１を含む４個の円の中心座標はそれぞれ特徴空間におけるシルエット特徴量をイメージしている。これら４個のシルエット特徴量はクラスタ＃１に帰属している。また、点線の楕円８３０で囲んだ５個の円の中心座標はそれぞれ特徴空間における別のシルエット特徴量をイメージしている。これら５個のシルエット特徴量はクラスタ＃２に帰属している。また、点線の楕円８４０で囲んだ、円８４１を含む２０個の円の中心座標はそれぞれ特徴空間における非対象特徴量をイメージしている。

以下、円８１１の中心座標で表される対象特徴量を対象特徴量８１１と表記し、円８２１の中心座標で表されるシルエット特徴量をシルエット特徴量８２１と表記し、円８４１の中心座標で表される非対象特徴量を非対象特徴量８４１と表記する。

対象識別手段４０２は、入力特徴量８００の最近傍シルエット特徴量としてシルエット特徴量８２１を、入力特徴量８００の最近傍対象特徴量として対象特徴量８１１をそれぞれ選出し、これらの間を線形補間する線分８５０を線形補間データとして生成する。

そして、対象識別手段４０２は、入力特徴量８００と線分８５０の距離Ｄpをポジティブ距離として算出するとともに、入力特徴量８００と各非対象特徴量との距離を算出してその最小距離Ｄnをネガティブ距離とする。図の例では、非対象特徴量８４１との間でネガティブ距離Ｄnが算出されている。

対象識別手段４０２は、ポジティブ距離Ｄpがネガティブ距離Ｄn未満であることから、入力特徴量８００が抽出された入力画像は対象が撮影された画像であると正しい識別結果を出力する。

ちなみに、入力特徴量８００を、線形補間データを用いない従前の方法で識別した場合は、入力特徴量８００と最近傍対象特徴量である対象特徴量８１１の間の距離Ｄoがネガティブ距離Ｄn以上であるため、入力特徴量８００が抽出された入力画像は対象が撮影されていない画像であると誤識別される。

このように、従前の方法では誤識別されていた入力特徴量８００（が抽出された入力画像）も、線形補間データを用いることで正しく識別されるようになる。

［侵入検知装置１０の動作］
図６、図７のフローチャートを参照して、第一の実施形態に係る侵入検知装置１０の動作を説明する。

侵入検知装置１０が動作を開始した後、撮影部２０は所定のフレーム周期で監視空間を撮影して監視画像を出力する。このフレーム周期で図６に示す処理が繰り返される。

画像処理部４０は、上記フレーム周期で撮影部２０から監視画像を取得すると（Ｓ１０）、まず切り出し手段として機能し、監視画像から順次部分画像を切り出す（Ｓ２０）。例えば、切り出し手段は、６４０×４８０画素の監視画像に対し、監視画像中の人の最大サイズを１２８×２５６画素、最小サイズを６４×１２８画素と想定して、３段階の大きさ、サイズの１／４のステップ幅を設定して部分画像を切り出すことができる。この場合、切り出し手段は６４×１２８画素、９６×１９２画素、１２８×２５６画素の３通りのサイズの部分画像を、それぞれ幅１６画素・高さ３２画素刻み、幅２４画素・高さ４８画素刻み、幅３６画素・高さ６４画素刻みで監視画像の各所から順次切り出す。切り出し手段は、部分画像を必要に応じて縮小して６４×１２８画素のサイズに統一し、対象識別装置への入力画像とする。なお、入力画像と対象画像のサイズが同一となればよく、その他のサイズ、ステップ幅には撮影部２０の仕様や設置条件に応じて適宜の値を設定することができる。

部分画像（入力画像）が切り出されると、画像処理部４０および記憶部３０は対象識別装置の構成要素として機能し、当該入力画像が人画像であるか否かを識別する人画像識別処理を行う（Ｓ３０）。図７を参照してその処理を説明する。

まず画像処理部４０は、特徴量抽出手段４００として機能し、入力画像から入力特徴量を抽出する（Ｓ３００）。

次に、画像処理部４０は特徴量補間手段４０１として機能し、記憶部３０は対象特徴量記憶手段３００およびシルエット特徴量記憶手段３０１として機能する。

特徴量補間手段４０１はシルエット特徴量記憶手段３０１からシルエット特徴量を順次読み出して、各シルエット特徴量と入力特徴量の距離を算出し、シルエット特徴量のうち最小の距離が算出されたシルエット特徴量を入力特徴量の最近傍シルエット特徴量として選出する（Ｓ３０１）。

続いて特徴量補間手段４０１は対象特徴量記憶手段３００から対象特徴量を順次読み出して、各対象特徴量と入力特徴量の距離を算出し、対象特徴量のうち最小の距離が算出された対象特徴量を入力特徴量の最近傍対象特徴量として選出する（Ｓ３０２）。

続いて特徴量補間手段４０１は最近傍シルエット特徴量と最近傍対象特徴量を結ぶ線分を求めることによって線形補間データを生成する（Ｓ３０３）。

線形補間データを生成し終えると、画像処理部４０は対象識別手段４０２として機能し、記憶部３０は非対象特徴量記憶手段３０２として機能する。

対象識別手段４０２は線形補間データと入力特徴量の距離をポジティブ距離として算出する（Ｓ３０４）。

続いて対象識別手段４０２は非対象特徴量記憶手段３０２から非対象特徴量を順次読み出して、各非対象特徴量と入力特徴量の距離を算出し、算出した距離のうち最小の距離をネガティブ距離として選び出す（Ｓ３０５）。

続いて対象識別手段４０２は、ポジティブ距離とネガティブ距離を比較し（Ｓ３０６）、ポジティブ距離がネガティブ距離未満であれば（Ｓ３０６にてＹＥＳ）、入力画像は人が撮影されている人画像であると判定し（Ｓ３０７）、ポジティブ距離がネガティブ距離以上であれば（Ｓ３０６にてＮＯ）、入力画像は人画像でないと判定し（Ｓ３０８）、識別結果を出力する。

以上の処理が終了すると、処理は図６のステップＳ４０に進められる。

切り出した部分画像（入力画像）に対する識別結果が得られると、画像処理部４０は、当該識別結果を記憶部３０に一時記憶させるとともに、設定された全ての位置およびサイズでの切り出しが完了したか否かを確認する（Ｓ４０）。未だ完了していなければ（Ｓ４０にてＮＯ）、画像処理部４０は処理をステップＳ２０に戻して次の切り出しを行う。

他方、全ての位置およびサイズでの切り出しが完了すると（Ｓ４０にてＹＥＳ）、画像処理部４０は侵入判定手段として機能する。

侵入判定手段は、記憶部３０を参照して、監視画像から切り出した部分画像の中に、ステップＳ３０にて人画像との識別結果を得た部分画像が含まれているか否かを確認する（Ｓ５０）。

人画像が含まれていれば（ステップＳ５０にてＹＥＳ）、侵入判定手段は、監視空間に侵入者が存在するとして所定のアラーム信号を出力部５０に出力する（Ｓ６０）。アラーム信号を入力された出力部５０は当該信号を監視センターのサーバーに送信する。他方、部分画像の中に人画像との識別結果を得た部分画像がひとつも含まれていなければ（ステップＳ５０にてＮＯ）、ステップＳ６０の処理はスキップされる。

以上の処理を終えると、処理はステップＳ１０に戻され、新たな監視画像に対する処理が行われる。

＜第一の実施形態の変形例＞
上記実施形態においては、線形補間データを線分とする例を示したが、線形補間データを離散的な特徴量とすることもできる。この場合、特徴量補間手段４０１は勾配特徴量の特徴空間における最近傍対象特徴量と最近傍シルエット特徴量の間の１または複数の内分点に対応する勾配特徴量を算出し、最近傍対象特徴量、最近傍シルエット特徴量および各内分点に対応する勾配特徴量を線形補間データとして生成する。その際の内分点の個数は予め定めた固定の個数としてもよいし、内分点の間隔が予め定めた距離となるよう可変の個数としてもよい。また、内分点の数が複数個となる場合、対象識別手段４０２は複数の内分点に対応する勾配特徴量のうち入力特徴量に最も類似する勾配特徴量に基づいて識別を行う。
このように線形補間データを線分ではなく離散的な特徴量とする変形例においては、対象識別手段４０２が、入力特徴量と線形補間データの類似性を相関値など距離以外の尺度で判定することが可能となる。

上記実施形態およびその変形例においては、対象画像のそれぞれと対応するシルエット特徴量を用いる例を示したが、クラスタごとに当該クラスタを代表するシルエット特徴量のみを用いてもよい。例えば、クラスタの平均値に最も近いシルエット特徴量、またはクラスタの平均値を当該クラスタの識別符号と対応付けてシルエット特徴量記憶手段３０１に記憶しておく。
このようにすることで、生成可能な線形補間データの数は減るものの、シルエット特徴量の数が少なくなるため最近傍シルエット特徴量を選出する処理量を減じることができる。

上記実施形態およびその変形例においては、シルエット特徴量をクラスタリングしておく例を示したが、クラスタリングを省略してもよい。その場合、各シルエット特徴量にはその作成元となった対象画像の識別符号を対応付けてシルエット特徴量記憶手段３０１に記憶しておく。そして、特徴量補間手段４０１は、ステップＳ３０１にて最近傍シルエット特徴量を選出すると、最近傍対象特徴量を選出する代わりにステップＳ３０２にて当該最近傍シルエット特徴量に対応付けられている対象画像の識別符号と同一の識別符号が付与されている対象特徴量を選出し、選出した対象特徴量と最近傍シルエット特徴量の間を線形補間して線形補間データを生成する。
このようにすることで、生成可能な線形補間データの数は減るものの、最近傍対象特徴量を選出する処理量を減じることができる。

なお、対象画像に含まれない人画像からシルエット画像を作成してもよいが、その場合は、そのシルエット特徴量が対象画像を元とするシルエット特徴量の平均値付近となるような人画像とするなど、対象画像を元とするシルエット特徴量が分布する範囲内に含まれる人画像であることを必要とする。

＜第二の実施形態＞
第二の実施形態に係る侵入検知装置１１について説明する。

［侵入検知装置１１の構成］
侵入検知装置１１は撮影部２１、記憶部３１、画像処理部４１および出力部５１から構成される。撮影部２１、記憶部３１、画像処理部４１および出力部５１の接続関係はそれぞれ図１に示した撮影部２０、記憶部３０、画像処理部４０および出力部５０の接続関係と同様であるため構成図は省略する。

撮影部２１は、撮像部２０と同様の監視カメラであり、所定の監視空間を順次撮影して監視画像を生成し、各監視画像を画像処理部４１に入力する。

記憶部３１は、記憶部３０と同様の記憶装置であり、画像処理部４１で用いられる各種プログラムや各種データを記憶し、画像処理部４１との間でこれらの情報を入出力する。

画像処理部４１は、画像処理部４０と同様の演算装置を用いて構成され、記憶部３１からプログラムを読み出して実行することで後述する各手段などとして機能する。

出力部５１は、出力部５０と同様の通信インターフェース回路であり、画像処理部４１から入力されたアラーム信号を監視センターのサーバーに送信する。

図８は、第二の実施形態に係る対象識別装置の概略の機能ブロック図である。記憶部３１は補間データ記憶手段３１０および非対象特徴量記憶手段３１２などとして機能し、画像処理部４１は特徴量抽出手段４１０および対象識別手段４１２などとして機能する。

また、図８には示さないが画像処理部４１は切り出し手段および侵入判定手段としても機能する。切り出し手段は監視画像から複数の部分画像を切り出して各部分画像を対象識別装置の特徴抽出手段４１０に入力する。これらの各部分画像は第二の実施形態に係る対象識別装置への入力画像となる。対象識別装置は各部分画像に人が撮影されているか否かを識別し、侵入判定手段は部分画像のいずれかに人が撮影されていると識別された場合に侵入者が検知されたとしてアラーム信号を出力する。

補間データ記憶手段３１０は複数の線形補間データを予め記憶している。
具体的には、線形補間データは、ＨＯＧの特徴空間において、対象特徴量とシルエット特徴量を結ぶ線分のデータである。補間データ記憶手段３１０は線分の端点のデータとして複数の対象特徴量および複数のシルエット特徴量を記憶するとともに、対象特徴量とシルエット特徴量の組み合わせごとに線分の傾きを記憶している。

複数の対象特徴量のそれぞれは、第一の実施形態において説明した対象特徴量と同様、複数の人画像のそれぞれから抽出されたＨＯＧである。また、複数のシルエット特徴量のそれぞれは、第一の実施形態において説明したシルエット特徴量と同様、人のシルエット画像から抽出したＨＯＧである。

各シルエット画像は対象特徴量の抽出元となった人画像である。よって、各シルエット特徴量には同一の人画像を由来とする対象特徴量が存在する。また、シルエット特徴量は予めクラスタリングされている。
補間データ記憶手段３１０は、各クラスタに帰属する複数のシルエット特徴量のそれぞれと、当該クラスタに帰属する複数のシルエット特徴量のそれぞれと同一の人画像に由来する対象特徴量とを結んだ複数の線分（例えば図４にて太線および細線で示した４１本の線分）のデータを線形補間データとして記憶している。

非対象特徴量記憶手段３１２は複数の非対象特徴量を予め記憶している。
具体的には、複数の非対象特徴量のそれぞれは、第一の実施形態において説明した非対象特徴量と同様、人が撮影されていない複数の非対象画像のそれぞれから抽出したＨＯＧである。

なお、線形補間データおよび非対象特徴量はそれぞれ１つ以上あればよい。

このように、補間データ記憶手段３１０は、予め、勾配特徴量の特徴空間において、対象が撮影された複数の対象画像から抽出した勾配特徴量である対象特徴量と、対象の輪郭形状をかたどった対象領域と背景領域とに異なる画素値が設定されたシルエット画像から抽出した勾配特徴量であるシルエット特徴量の間を線形補間した１または複数の線形補間データを記憶し、非対象特徴量記憶手段３１２は、対象が撮影されていない非対象画像から抽出した勾配特徴量である１または複数の非対象特徴量を記憶している。

特徴量抽出手段４１０は、切り出し手段から入力された入力画像からＨＯＧを抽出し、抽出したＨＯＧを対象識別手段４１２に出力する。すなわち、特徴量抽出手段４１０は、特徴量抽出手段４００と同様、入力画像から当該入力画像の勾配特徴量である入力特徴量を抽出する。

対象識別手段４１２は、補間データ記憶手段３１０に記憶されている１または複数の線形補間データを読み出して、特徴量抽出手段４１０から入力された入力特徴量と読み出した各線形補間データとの距離を算出し、算出した距離の最小値であるポジティブ距離を算出する。また、対象識別手段４１２は、非対象特徴量記憶手段３１２から複数の非対象特徴量を読み出して入力特徴量と読み出した各非対象特徴量のそれぞれとの距離を算出し、算出した距離のうちの最小値であるネガティブ距離と比較する。そして、対象識別手段４１２は、ポジティブ距離がネガティブ距離未満である場合に入力画像に人が撮影されていると判定し、ポジティブ距離がネガティブ距離以上である場合に入力画像に人が撮影されていないと判定する識別を行い、識別結果を侵入者判定手段に出力する。

なお、対象識別手段４１２が読み出す線形補間データは記憶している線形補間データ全てとすることができる。或いは、第一の実施形態と同様、最近傍シルエット特徴量と最近傍対象特徴量の組み合わせに対する線形補間データのみを読み出してもよい。

このように、対象識別手段４１２は、入力特徴量が非対象特徴量よりも線形補間データに類似している場合は入力画像に対象が含まれていると判定し、入力特徴量が線形補間データよりも非対象特徴量に類似している場合は入力画像に対象が含まれていないと判定する。

第二の実施形態に係る対象識別装置においても、第一の実施形態にて説明した対象識別装置と同様、対象の識別に最も有用な輪郭形状を保持しつつ、対象のテクスチャー成分のバリエーションの増えた線形補間データを用いて識別するため、対象が撮影された画像を対象が撮影されていないと誤る誤識別が低減される。また、対象識別装置においては、対象の勾配特徴量として逸脱しない範囲で生成された線形補間データを用いて識別するため、バリエーションを増やしても対象が撮影されていない画像を対象が撮影されていると誤る誤識別は増加しない。

［侵入検知装置１１の動作］
以下、第二の実施形態に係る侵入検知装置１１の動作を説明する。

侵入検知装置１１の動作と、第一の実施形態にて示した侵入検知装置１０の動作は、人画像識別処理のサブルーチン以外においては同様の流れで行われる。まず、図６を援用して人画像識別処理のサブルーチン以外の動作を説明する。

撮影部２１は所定のフレーム周期で監視空間を撮影して監視画像を出力する。このフレーム周期で図６に示した処理が繰り返される。

画像処理部４１は撮影部２１から監視画像を取得すると（Ｓ１０）、まず切り出し手段として機能し、監視画像から順次部分画像を切り出す（Ｓ２０）。部分画像（入力画像）が切り出されると、画像処理部４１および記憶部３１は対象識別装置の構成要素として機能し、当該入力画像が人画像であるか否かを識別する人画像識別処理を行う（Ｓ３０）。人画像識別処理については後述する。

切り出した部分画像（入力画像）に対する識別結果が得られると、画像処理部４１は、当該識別結果を記憶部３１に一時記憶させ、切り出しが完了するまでステップＳ２０〜Ｓ４０の処理を繰り返す（ステップＳ４０にてＮＯ→Ｓ２０）。

切り出しが完了すると（ステップＳ４０にてＹＥＳ）、画像処理部４１は侵入判定手段として機能する。侵入判定手段は、記憶部３１を参照し、監視画像から切り出した部分画像の中に人画像が含まれていれば所定のアラーム信号を出力部５１に出力する（ステップＳ５０にてＹＥＳ→Ｓ６０）、出力部５１は入力されたアラーム信号を監視センターに送信する。人画像が含まれていなければ（ステップＳ５０にてＮＯ）、ステップＳ６０の処理はスキップされる。

以下、図９を参照して、第二の実施形態に係る対象識別装置が行うステップＳ３０の人画像識別処理について説明する。

まず画像処理部４１は、特徴量抽出手段４１０として機能し、入力画像から入力特徴量を抽出する（Ｓ３１０）。

次に、画像処理部４１は対象識別手段４１２として機能し、記憶部３１は補間データ記憶手段３１０および非対象特徴量記憶手段３１２として機能する。

対象識別手段４１２は、補間データ記憶手段３１０から線形補間データを順次読み出して（Ｓ３１１）、ステップＳ３１１にて抽出した入力特徴量と読み出した線形補間データの間の距離を算出する（Ｓ３１２）。このループ処理は、全線形補間データについて繰り返される（ステップＳ３１３にてＮＯ→Ｓ３１１）。

全ての線形補間データを処理し終えると（ステップＳ３１３にてＹＥＳ）、対象識別手段４１２はステップＳ３１２にて算出した距離の中の最小距離をポジティブ距離として選び出す（Ｓ３１４）。

続いて対象識別手段４１２は、非対象特徴量記憶手段３１２から非対象特徴量を順次読み出して、各非対象特徴量と入力特徴量の距離を算出し、算出した距離の中の最小の距離をネガティブ距離として選び出す（Ｓ３１５）。

続いて対象識別手段４１２は、ポジティブ距離とネガティブ距離を比較し（Ｓ３１６）、ポジティブ距離がネガティブ距離未満であれば（Ｓ３１６にてＹＥＳ）、入力画像は人が撮影されている人画像であると判定し（Ｓ３１７）、ポジティブ距離がネガティブ距離以上であれば（Ｓ３１６にてＮＯ）、入力画像は人画像でないと判定し（Ｓ３１８）、識別結果を出力する。

以上の処理が終了すると、処理は前述したステップＳ４０に進められる。

＜第二の実施形態の変形例＞
上記第二の実施形態においては、線形補間データを線分とする例を示したが、線形補間データを離散的な特徴量とすることもできる。この場合、補間データ記憶手段３１０は、勾配特徴量の特徴空間における対象特徴量とシルエット特徴量の間の１または複数の内分点に対応する勾配特徴量を線形補間データとして記憶する。その際の内分点の個数は予め定めた固定の個数としてもよいし、内分点の間隔が予め定めた距離となるよう可変の個数としてもよい。
このように線形補間データを線分ではなく離散的な特徴量とする変形例においては、対象識別手段４１２が、入力特徴量と線形補間データの類似性を相関値など距離以外の尺度で判定することが可能となる。

また、上記第二の実施形態の変形例において、対象識別手段４１２は、入力特徴量を中心とする探索範囲を段階的に広げて設定し、設定した探索範囲内の線形補間データに対するポジティブ距離を算出する構成とすることもできる。この場合、対象識別手段４１２は、ポジティブ距離が算出できた段階で探索を打ち切ることで、ポジティブ距離の算出処理を減じることが可能となる。

＜第三の実施形態＞
第三の実施形態に係る侵入検知装置１２について説明する。

［侵入検知装置１２の構成］
侵入検知装置１２は撮影部２２、記憶部３２、画像処理部４２および出力部５２から構成される。撮影部２２、記憶部３２、画像処理部４２および出力部５２の接続関係はそれぞれ図１に示した撮影部２０、記憶部３０、画像処理部４０および出力部５０の接続関係と同様であるため構成図は省略する。

撮影部２２は、撮像部２０と同様の監視カメラであり、所定の監視空間を順次撮影して監視画像を生成し、各監視画像を画像処理部４２に入力する。

記憶部３２は、記憶部３０と同様の記憶装置であり、画像処理部４２で用いられる各種プログラムや各種データを記憶し、画像処理部４２との間でこれらの情報を入出力する。

画像処理部４２は、画像処理部４０と同様の演算装置を用いて構成され、記憶部３２からプログラムを読み出して実行することで後述する各手段として機能する。

出力部５２は、出力部５０と同様の通信インターフェース回路であり、画像処理部４２から入力されたアラーム信号を監視センターのサーバーに送信する。

図１０は、第三の実施形態に係る対象識別装置の概略の機能ブロック図である。記憶部３２は識別関数記憶手段３２０などとして機能し、画像処理部４２は特徴量抽出手段４２０および対象識別手段４２２などとして機能する。

また、図１０には示さないが画像処理部４１は切り出し手段および侵入判定手段としても機能する。切り出し手段は監視画像から複数の部分画像を切り出して各部分画像を対象識別装置の特徴抽出手段４２０に入力する。これらの各部分画像は第三の実施形態に係る対象識別装置への入力画像となる。対象識別装置は各部分画像に人が撮影されているか否かを識別し、侵入判定手段は部分画像のいずれかに人が撮影されていると識別された場合に侵入者が検知されたとしてアラーム信号を出力する。

識別関数記憶手段３２０は、対象の識別に用いる識別関数を予め記憶している。

識別関数は、入力画像が対象の特徴を有する度合いである評価値を入力特徴量から導出する関数である。例えばサポートベクターマシン（ＳＶＭ：Support Vector Machine）法を用いて対象を識別する場合、識別関数は識別境界法線ベクトルａと識別境界バイアス項ｂの組からなるパラメータで構成され、評価値は尤度である。

識別関数は予めの学習により導出される。ここで、本実施形態における識別関数は線形補間データを用いて学習されている点に特徴がある。すなわち、識別関数記憶手段３２０が記憶している識別関数は、複数の線形補間データおよび複数の非対象特徴量を用いて学習したものである。

例えば、複数の線形補間データおよび複数の非対象特徴量にＳＶＭ法を適用すると、線形補間データにより拡張された対象クラスと非対象クラスを識別するのに適した識別境界法線ベクトルａと識別境界バイアス項ｂが導出される。

なお、ＳＶＭ法に代えて、アダブースト（AdaBoost）法、他のブースティング（Boosting）法、３層以上の層を持つパーセプトロン法またはランダムフォレスト法等など他の機械学習法を利用することもできる。ちなみにブースティング法を用いた学習では、対象を識別するのに適した入力画像中の位置、特徴量の要素、重みの組のセットで構成された識別関数が導出される。

学習に用いられる線形補間データは対象特徴量とシルエット特徴量の間を補間したデータであり、線分の形式ではなく離散的な特徴量である。すなわち、線形補間データは、複数の対象特徴量、複数のシルエット特徴量、勾配特徴量の特徴空間において、上記複数の対象特徴量と当該対象特徴量が由来するシルエット特徴量との間の１または複数の内分点に対応する勾配特徴量、および上記複数の対象特徴量と当該対象特徴量が由来するシルエット特徴量のクラスタメンバーであるシルエット特徴量との間の１または複数の内分点に対応する勾配特徴量である。

複数の対象特徴量のそれぞれは、第一の実施形態において説明した対象特徴量と同様、複数の人画像のそれぞれから抽出されたＨＯＧである。また、複数のシルエット特徴量のそれぞれは、第一の実施形態において説明したシルエット特徴量と同様、人のシルエット画像から抽出したＨＯＧである。シルエット画像のそれぞれは、対象特徴量の元となった人画像から人手で作成される。上述した対象特徴量が由来するシルエット特徴量とは、対象特徴量と共通の人画像から抽出されたシルエット特徴量である。

また、複数のシルエット特徴量は予めクラスタリングされ、その結果が線形補間データの生成に利用される。上述したクラスタメンバーとは同一クラスタにクラスタリングされたシルエット特徴量、つまり互いに類似するシルエット特徴量である。

複数の非対象特徴量のそれぞれは、第一の実施形態において説明した非対象特徴量と同様、人が撮影されていない複数の非対象画像のそれぞれから予め抽出されたＨＯＧである。

このように、識別関数記憶手段３２０は、予め、対象が撮影された対象画像から抽出した勾配特徴量と対象のシルエット画像から抽出した勾配特徴量との間を線形補間した複数の線形補間データ、および対象が撮影されていない非対象画像から抽出した複数の勾配特徴量を用いて学習した、対象の勾配特徴量を識別する識別関数を記憶している。

特徴量抽出手段４２０は、切り出し手段から入力された入力画像からＨＯＧを抽出し、抽出したＨＯＧを対象識別手段４２２に出力する。すなわち、特徴量抽出手段４２０は、特徴量抽出手段４００と同様、入力画像から当該入力画像の勾配特徴量である入力特徴量を抽出する。

対象識別手段４２２は、識別関数記憶手段３２０に記憶されている識別関数を読み出し、特徴量抽出手段４１０から入力された入力特徴量を、読み出した識別関数に入力して入力画像に対象が含まれているか否かを判定する識別を行い、識別結果を侵入者判定手段に出力する。例えば、ＳＶＭ法で学習した識別関数を利用する場合、尤度に対する閾値は０である。この場合、対象識別手段４２２は、尤度が正値であれば入力画像に対象が含まれていると判定し、尤度が０以下であれば入力画像に対象が含まれていないと判定する。

第三の実施形態に係る対象識別装置は、対象の識別に最も有用な輪郭形状を保持しつつ、対象のテクスチャー成分のバリエーションの増えた線形補間データを用いて学習した識別関数にて識別するため、対象が撮影された画像を対象が撮影されていないと誤る誤識別が低減される。また、当該対象識別装置においては、対象の勾配特徴量として逸脱しない範囲で生成された線形補間データを用いて学習した識別関数にて識別するため、バリエーションを増やしても対象が撮影されていない画像を対象が撮影されていると誤る誤識別は増加しない。

［侵入検知装置１２の動作］
以下、第三の実施形態に係る侵入検知装置１２の動作を説明する。

侵入検知装置１２の動作と、第一の実施形態にて示した侵入検知装置１０の動作は、人画像識別処理のサブルーチン以外においては同様の流れで行われる。まず、図６を援用して人画像識別処理のサブルーチン以外の動作を説明する。

撮影部２２は所定のフレーム周期で監視空間を撮影して監視画像を出力する。このフレーム周期で図６に示した処理が繰り返される。

画像処理部４２は撮影部２２から監視画像を取得すると（Ｓ１０）、まず切り出し手段として機能し、監視画像から順次部分画像を切り出す（Ｓ２０）。部分画像（入力画像）が切り出されると、画像処理部４２および記憶部３２は対象識別装置の構成要素として機能し、当該入力画像が人画像であるか否かを識別する人画像識別処理を行う（Ｓ３０）。人画像識別処理については後述する。

切り出した部分画像（入力画像）に対する識別結果が得られると、画像処理部４２は、当該識別結果を記憶部３２に一時記憶させ、切り出しが完了するまでステップＳ２０〜Ｓ４０の処理を繰り返す（ステップＳ４０にてＮＯ→Ｓ２０）。

切り出しが完了すると（ステップＳ４０にてＹＥＳ）、画像処理部４２は侵入判定手段として機能する。侵入判定手段は、記憶部３２を参照し、監視画像から切り出した部分画像の中に人画像が含まれていれば所定のアラーム信号を出力部５１に出力する（ステップＳ５０にてＹＥＳ→Ｓ６０）。人画像が含まれていなければ（ステップＳ５０にてＮＯ）、ステップＳ６０の処理はスキップされる。

以下、図１１を参照して、第三の実施形態に係る対象識別装置が行うステップＳ３０の人画像識別処理について説明する。

まず画像処理部４２は、特徴量抽出手段４２０として機能し、入力画像から入力特徴量を抽出する（Ｓ３２０）。

次に、画像処理部４２は対象識別手段４２２として機能し、記憶部３２は識別関数記憶手段３２０として機能する。

対象識別手段４２２は、識別関数記憶手段３２０から識別関数を読み出して（Ｓ３２１）、読み出した識別関数にステップＳ３２１にて抽出した入力特徴量を入力して尤度を算出する（Ｓ３２２）。

続いて対象識別手段４１２は、算出した尤度を閾値と比較し（Ｓ３２３）、尤度が正値であれば（Ｓ３２３にてＹＥＳ）、入力画像は人が撮影されている人画像であると判定し（Ｓ３２４）、尤度が０以下の値であれば（Ｓ３２３にてＮＯ）、入力画像は人画像でないと判定し（Ｓ３２５）、識別結果を出力する。

＜その他の変形例＞
上記各実施形態においては、人を識別の対象とする例を示したが、識別対象は人に限らず種々の物体とすることができる。例えば、識別対象を車両または什器など、人以外の物体とすることもでき、人の顔または手など人の特定部位とすることもできる。

上記各実施形態およびその変形例においては、勾配特徴量としてＨＯＧを用いた例を示したが、ＨＯＧ以外にも種々の勾配特徴量を用いることができる。例えば、勾配特徴量としてハールライク（Haar-Like）特徴量、ローカル・バイナリー・パターン（LBP；Local Binary Pattern）を用いることもでき、また、ソーベルオペレータ、ロバーツオペレータ、キャニーフィルタ、ラプラシアンなど公知の種々のエッジオペレータにより各画素位置において抽出したエッジを画素順に並べたベクトルを用いることもできる。

上記各実施形態およびその変形例においては、特徴抽出手段が監視画像から切り出された部分画像（入力画像）ごとに勾配特徴量を抽出する例を示した。別の変形例において、特徴抽出手段は監視画像の全体にわたり勾配特徴量を抽出して記憶部に記憶させ、各入力画像と対応する領域の勾配特徴量を記憶部から逐次読み出す構成としてもよい。この場合、切り出しの機能は特徴抽出手段に含まれるため、上述した切り出し手段は不要となる。この構成では記憶部に必要とされる容量は増すものの、同じ領域の勾配特徴量を繰り返し抽出する無駄な処理を省くことができる。
また、さらに別の変形例において、特徴量抽出手段は、後続して切り出される部分画像（入力画像）と重複する領域から抽出した勾配特徴量のみを記憶部に保持するよう制御してもよい。この構成でも、記憶部に必要とされる容量は増すものの、同じ領域の勾配特徴量を繰り返し抽出する無駄な処理を省くことができる。

１０・・・侵入検知装置
２０・・・撮影部
３０・・・記憶部
４０・・・画像処理部
５０・・・出力部
３００・・・対象特徴量記憶手段
３０１・・・シルエット特徴量記憶手段
３０２、３１２・・・非対象特徴量記憶手段
３１０・・・補間データ記憶手段
３２０・・・識別関数記憶手段
４００、４１０、４２０・・・特徴量抽出手段
４０１・・・特徴量補間手段
４０２、４１２、４２２・・・対象識別手段

Claims

入力画像に所定の対象が撮影されているか否かを識別する対象識別装置であって、
前記入力画像から当該入力画像の勾配特徴量である入力特徴量を抽出する特徴量抽出手段と、
前記対象が撮影された対象画像から抽出した勾配特徴量である対象特徴量を記憶している対象特徴量記憶手段と、
前記対象のシルエット画像から抽出した勾配特徴量であるシルエット特徴量を記憶しているシルエット特徴量記憶手段と、
前記対象特徴量と前記シルエット特徴量の間を線形補間して線形補間データを生成する特徴量補間手段と、
前記対象が撮影されていない非対象画像から抽出した勾配特徴量である非対象特徴量を記憶している非対象特徴量記憶手段と、
前記入力特徴量が前記非対象特徴量よりも前記線形補間データに類似している場合は前記入力画像に前記対象が含まれていると判定し、前記入力特徴量が前記線形補間データよりも前記非対象特徴量に類似している場合は前記入力画像に前記対象が含まれていないと判定する対象識別手段と、
を備え、
前記対象特徴量記憶手段は、複数の前記対象特徴量を記憶し、
前記特徴量補間手段は、前記複数の対象特徴量のうち前記入力特徴量に最も類似した対象特徴量と、前記シルエット特徴量の間を線形補間して前記線形補間データを生成することを特徴とする対象識別装置。
前記シルエット特徴量記憶手段は、複数の前記シルエット特徴量を記憶し、
前記特徴量補間手段は、前記対象特徴量と、前記複数のシルエット特徴量のうち前記入力特徴量に最も類似したシルエット特徴量との間を線形補間して前記線形補間データを生成する請求項１に記載の対象識別装置。
入力画像に所定の対象が撮影されているか否かを識別する対象識別装置であって、
前記入力画像から当該入力画像の勾配特徴量である入力特徴量を抽出する特徴量抽出手段と、
前記対象が撮影された対象画像から抽出した勾配特徴量である対象特徴量を記憶している対象特徴量記憶手段と、
前記対象のシルエット画像から抽出した勾配特徴量であるシルエット特徴量を記憶しているシルエット特徴量記憶手段と、
前記対象特徴量と前記シルエット特徴量の間を線形補間して線形補間データを生成する特徴量補間手段と、
前記対象が撮影されていない非対象画像から抽出した勾配特徴量である非対象特徴量を記憶している非対象特徴量記憶手段と、
前記入力特徴量が前記非対象特徴量よりも前記線形補間データに類似している場合は前記入力画像に前記対象が含まれていると判定し、前記入力特徴量が前記線形補間データよりも前記非対象特徴量に類似している場合は前記入力画像に前記対象が含まれていないと判定する対象識別手段と、
を備え、
前記シルエット特徴量記憶手段は、複数の前記シルエット特徴量を記憶し、
前記特徴量補間手段は、前記対象特徴量と、前記複数のシルエット特徴量のうち前記入力特徴量に最も類似したシルエット特徴量との間を線形補間して前記線形補間データを生成することを特徴とする対象識別装置。
前記特徴量補間手段は、前記勾配特徴量の特徴空間において前記対象特徴量と前記シルエット特徴量とを結ぶ線分を前記線形補間データとして生成する請求項１〜３のいずれかひとつに記載の対象識別装置。