JP6210856B2

JP6210856B2 - 対象物位置特定システム、および対象物位置特定方法

Info

Publication number: JP6210856B2
Application number: JP2013240316A
Authority: JP
Inventors: 三友刈屋
Original assignee: Olympus Corp
Current assignee: Olympus Corp
Priority date: 2013-11-20
Filing date: 2013-11-20
Publication date: 2017-10-11
Anticipated expiration: 2033-11-20
Also published as: JP2015099571A

Description

本発明は、対象物位置特定システム、および対象物位置特定方法に関する。

従来から、画像に写されている物体、つまり、被写体（対象物）や画像が撮影されたシーンを認識する技術がある（非特許文献１参照）。この技術では、入力された画像に対する処理を、以下の手順で行うことによって、画像に写っている対象物が、大量の画像を対象物の種類毎に分類してまとめたデータ（以下、「教師データ」という）のそれぞれ毎にどれくらい類似しているかを表す類似度を算出し、最も類似度が高い教師データが表している対象物が、入力された画像に写っている対象物であると認識する。つまり、入力された画像は、最も類似度が高い対象物が写っているシーンであると認識する。

（手順１−１）：画像の領域を細かく分割し、分割した領域毎に局所特徴ベクトルを生成する。
（手順１−２）：生成した局所特徴ベクトルに基づいて、分割した領域毎に量子化ベクトルを生成する。
（手順２）：生成した量子化ベクトルから、画像全体のヒストグラムを生成する。
（手順３）：例えば、ＳＶＭ（Ｓｕｐｐｏｒｔｖｅｃｔｏｒｍａｃｈｉｎｅ：サポートベクタマシン）演算などによって、生成した画像全体のヒストグラムと大量の教師データのそれぞれとを比較し、分類されたそれぞれの教師データ毎に類似度を算出する。

ところで、非特許文献１で開示された技術によって、最も類似度が高い対象物が写っているシーンであると認識した後に、この対象物が写っている画像内の位置を特定することが求められる場合がある。この場合には、入力された画像に対してシーン認識の処理を行った後に、再度シーン認識の処理を、この画像を予め定めた領域に分割した領域毎に行うことによって、分割したいずれの領域に対象物が写っているか、すなわち、対象物が写っている位置を特定することができると考えられる。

Ｇ．Ｃｓｕｒｋａ，Ｃ．Ｒ．Ｄａｎｃｅ，ＬｉｘｉｎＦａｎ，Ｊ．Ｗｉｌｌａｍｏｗｓｋｉ，Ｃ．Ｂｒａｙ， "ＶｉｓｕａｌＣａｔｅｇｏｒｉｚａｔｉｏｎｗｉｔｈＢａｇｓｏｆＫｅｙｐｏｉｎｔｓ"，Ｐｒｏｃ．ＥＣＣＶＷｏｒｋｓｈｏｐｏｎＳｔａｔｉｓｔｉｃａｌＬｅａｒｎｉｎｇｉｎＣｏｍｐｕｔｅｒＶｉｓｉｏｎ，ｐｐ．５９−７４，２００４．

しかしながら、入力された画像に対してシーン認識の処理を行った後に、分割した領域に対するシーン認識の処理を再度行うということは、シーン認識の処理を分割した領域の数＋１回行うことになり、対象物が写っている画像内の位置を特定するために要する演算時間が長くなってしまう、という問題になる。

本発明は、上記の課題認識に基づいてなされたものであり、演算時間が長くなるのを抑えた上で、入力された画像内で対象物が写っている位置を特定することができる対象物位置特定システム、および対象物位置特定方法を提供することを目的としている。

上記の課題を解決するため、本発明の対象物位置特定システムは、入力された画像の全体の領域を、予め定めた第１の大きさの複数の第１の領域に分割し、該分割した前記第１の領域毎に、該第１の領域に含まれる画像データにおける局所的な特徴を表す局所特徴ベクトルを生成する局所特徴ベクトル生成部と、前記局所特徴ベクトル生成部が生成した、それぞれの前記第１の領域の前記局所特徴ベクトルの値を量子化し、それぞれの前記第１の領域に対応する量子化ベクトルを生成する量子化ベクトル生成部と、前記量子化ベクトル生成部が生成したそれぞれの前記量子化ベクトルの値を、前記第１の領域毎に保存する量子化ベクトル保存部と、前記第１の領域毎のそれぞれの前記量子化ベクトルの値から、前記画像の全体または一部の領域を表すヒストグラムを生成するヒストグラム生成部と、前記ヒストグラム生成部が生成した前記ヒストグラムに対するサポートベクタマシン（ＳＶＭ）演算を行うＳＶＭ演算部と、前記局所特徴ベクトル生成部と、前記量子化ベクトル生成部と、前記ヒストグラム生成部と、前記ＳＶＭ演算部とのそれぞれを制御し、対象物が写されている前記画像のシーンを認識するシーン認識の処理を実行させた後に、該シーン認識の処理において判別した対象物が、前記画像の全体の領域を前記第１の領域よりも大きな予め定めた第２の大きさに分割した複数の第２の領域のいずれの位置に写されているかを特定するための位置特定の処理を実行させる位置特定制御部と、を備え、前記位置特定制御部は、前記シーン認識の処理において、前記ヒストグラム生成部に、それぞれの前記第１の領域毎の前記量子化ベクトルの値から、前記画像の全体を表すヒストグラムを生成させ、前記ＳＶＭ演算部に、前記画像の全体を表すヒストグラムと、複数の画像のヒストグラムが対象物の種類毎に分類してまとめられた複数の教師データのヒストグラムのそれぞれとを比較するＳＶＭ演算を実行させ、前記位置特定の処理において、前記ヒストグラム生成部に、前記量子化ベクトル保存部に保存された前記第１の領域毎のそれぞれの前記量子化ベクトルの値から、それぞれの前記第２の領域の画像を表すヒストグラムを生成させ、前記ＳＶＭ演算部に、前記第２の領域を表すヒストグラムのそれぞれに対するＳＶＭ演算を実行させる、ことを特徴とする。

また、本発明の対象物位置特定システムは、前記ヒストグラム生成部が生成した、前記画像の全体を表すヒストグラムを保存するヒストグラム保存部、をさらに備え、前記位置特定制御部は、前記位置特定の処理において、前記ＳＶＭ演算部に、前記第２の領域を表すヒストグラムのそれぞれと、前記ヒストグラム保存部に保存された前記画像の全体を表すヒストグラムとを比較するＳＶＭ演算を実行させる、ことを特徴とする。

また、本発明の前記位置特定制御部は、前記位置特定の処理において、前記ＳＶＭ演算部に、前記第２の領域を表すヒストグラムのそれぞれと、複数の前記教師データの内、予め定めた条件に応じて選択した一部の前記教師データのヒストグラムのそれぞれとを比較するＳＶＭ演算を実行させる、ことを特徴とする。

また、本発明の対象物位置特定システムは、前記ヒストグラム生成部が生成した、前記画像の全体を表すヒストグラムを保存するヒストグラム保存部と、前記ヒストグラム保存部に保存された前記画像の全体を表すヒストグラム、または複数の前記教師データの内、予め定めた条件に応じて選択した一部の前記教師データのヒストグラムのいずれか一方を選択して出力する教師データ切り替え部と、をさらに備え、前記位置特定制御部は、前記位置特定の処理において、前記ＳＶＭ演算部に、前記第２の領域を表すヒストグラムのそれぞれと、前記教師データ切り替え部を制御することによって該教師データ切り替え部から出力されたヒストグラムとを比較するＳＶＭ演算を実行させる、ことを特徴とする。

また、本発明の対象物位置特定方法は、入力された画像の全体の領域を、予め定めた第１の大きさの複数の第１の領域に分割し、該分割した前記第１の領域毎に、該第１の領域に含まれる画像データにおける局所的な特徴を表す局所特徴ベクトルを生成する局所特徴ベクトル生成部と、前記局所特徴ベクトル生成部が生成した、それぞれの前記第１の領域の前記局所特徴ベクトルの値を量子化し、それぞれの前記第１の領域に対応する量子化ベクトルを生成する量子化ベクトル生成部と、前記量子化ベクトル生成部が生成したそれぞれの前記量子化ベクトルの値を、前記第１の領域毎に保存する量子化ベクトル保存部と、前記第１の領域毎のそれぞれの前記量子化ベクトルの値から、前記画像の全体または一部の領域を表すヒストグラムを生成するヒストグラム生成部と、前記ヒストグラム生成部が生成した前記ヒストグラムに対するサポートベクタマシン（ＳＶＭ）演算を行うＳＶＭ演算部と、前記局所特徴ベクトル生成部と、前記量子化ベクトル生成部と、前記ヒストグラム生成部と、前記ＳＶＭ演算部とのそれぞれを制御し、対象物が写されている前記画像のシーンを認識するシーン認識の処理を実行させた後に、該シーン認識の処理において判別した対象物が、前記画像の全体の領域を前記第１の領域よりも大きな予め定めた第２の大きさに分割した複数の第２の領域のいずれの位置に写されているかを特定するための位置特定の処理を実行させる位置特定制御部と、を備えた対象物位置特定システムにおいて、前記位置特定制御部が、前記シーン認識の処理において、前記ヒストグラム生成部に、それぞれの前記第１の領域毎の前記量子化ベクトルの値から、前記画像の全体を表すヒストグラムを生成させる手順と、前記ＳＶＭ演算部に、前記画像の全体を表すヒストグラムと、複数の画像のヒストグラムが対象物の種類毎に分類してまとめられた複数の教師データのヒストグラムのそれぞれとを比較するＳＶＭ演算を実行させる手順と、を含み、前記位置特定の処理において、前記ヒストグラム生成部に、前記量子化ベクトル保存部に保存された前記第１の領域毎のそれぞれの前記量子化ベクトルの値から、それぞれの前記第２の領域の画像を表すヒストグラムを生成させる手順と、前記ＳＶＭ演算部に、前記第２の領域を表すヒストグラムのそれぞれに対するＳＶＭ演算を実行させる手順と、を含む、ことを特徴とする。

本発明によれば、演算時間が長くなるのを抑えた上で、入力された画像内で対象物が写っている位置を特定することができるという効果が得られる。

本発明の第１の実施形態による対象物位置特定システムの概略構成を示したブロック図である。本第１の実施形態の対象物位置特定システムにおける処理手順を示したフローチャートである。本第１の実施形態の対象物位置特定システムにおける全体の処理の一例を模式的に示した図である。本第１の実施形態の対象物位置特定システムにおいてシーン認識の処理を行う動作の一例を模式的に示した図である。本第１の実施形態の対象物位置特定システムにおいて対象物の位置を特定する処理の考え方を説明する図である。本発明の第２の実施形態による対象物位置特定システムの概略構成を示したブロック図である。本第２の実施形態の対象物位置特定システムにおける処理手順を示したフローチャートである。本第２の実施形態の対象物位置特定システムにおいて対象物の位置を簡易的に特定する処理の考え方を説明する図である。本発明の第３の実施形態による対象物位置特定システムの概略構成を示したブロック図である。本第３の実施形態の対象物位置特定システムにおける処理手順を示したフローチャートである。本第３の実施形態の対象物位置特定システムにおいて対象物の位置を簡易的に特定する処理の考え方を説明する図である。本発明の第４の実施形態による対象物位置特定システムの概略構成を示したブロック図である。

＜第１の実施形態＞
以下、本発明の実施形態について、図面を参照して説明する。図１は、本第１の実施形態による対象物位置特定システムの概略構成を示したブロック図である。図１において、対象物位置特定システム１０は、局所特徴ベクトル生成部１１０と、量子化ベクトル生成部１２０と、ヒストグラム生成部１３０と、ＳＶＭ（Ｓｕｐｐｏｒｔｖｅｃｔｏｒｍａｃｈｉｎｅ：サポートベクタマシン）演算部１４０と、教師データ群１５０と、位置特定制御部１６０と、量子化ベクトル保存部１７０と、を備えている。

対象物位置特定システム１０は、入力された画像に対して、画像に写っている物体、つまり、被写体（対象物）や画像が撮影されたシーンを認識するシーン認識の処理を行い、様々な対象物の種類毎に分類されたそれぞれの教師データとの類似度の情報を、シーン認識の処理によって判別した情報として出力する。また、対象物位置特定システム１０は、シーン認識の処理を行った画像内で、判別した対象物が写っている位置を特定する位置特定の処理を行い、特定した対象物が写っている位置を表す情報を出力する。

教師データ群１５０は、同じ対象物が写っている大量の画像のヒストグラムが、対象物の種類（カテゴリ）毎に分類されたそれぞれの教師データとして含まれているデータベースである。教師データは、例えば、人、犬、猫、花などの対象物のカテゴリ毎に分類されており、分類されたそれぞれのカテゴリ毎に、例えば、１５００枚の画像のヒストグラムから構成されている。すなわち、教師データ群１５０には、対象物が「人」である１つのカテゴリに対して、１５００個のヒストグラムが教師データとしてそれぞれ存在し、同様に、対象物が「犬」、「猫」、「花」であるそれぞれのカテゴリに対しても、それぞれ１５００個のヒストグラムが教師データとしてそれぞれ存在している。つまり、教師データ群１５０には、４つのカテゴリのそれぞれに対して１５００個のヒストグラム（合計で４×１５００＝６０００個のヒストグラム）が、教師データとして含まれている。

局所特徴ベクトル生成部１１０は、位置特定制御部１６０からの制御に応じて、対象物位置特定システム１０に入力された画像の局所特徴ベクトルを生成する。局所特徴ベクトル生成部１１０は、入力された画像の全体の領域を予め定めた大きさの領域（以下、「シーン認識分割領域」という）に細かく分割し、分割したそれぞれのシーン認識分割領域に含まれる画像データにおける局所的な特徴を表す局所特徴ベクトルを生成する。そして、局所特徴ベクトル生成部１１０は、生成したそれぞれのシーン認識分割領域の局所特徴ベクトルの値を、量子化ベクトル生成部１２０に出力する。また、局所特徴ベクトル生成部１１０は、全てのシーン認識分割領域の局所特徴ベクトルの生成が完了したとき、局所特徴ベクトルの生成が完了したことを位置特定制御部１６０に通知する。なお、局所特徴ベクトル生成部１１０において局所特徴ベクトルを生成する処理の方法は、従来の技術においてシーン認識の処理を行う際に局所特徴ベクトルを生成する処理の方法と同様であるため、詳細な説明は省略する。

量子化ベクトル生成部１２０は、位置特定制御部１６０からの制御に応じて、局所特徴ベクトル生成部１１０から入力されたそれぞれのシーン認識分割領域の局所特徴ベクトルの値を量子化し、それぞれのシーン認識分割領域に対応する量子化ベクトルを生成する。そして、量子化ベクトル生成部１２０は、生成したそれぞれのシーン認識分割領域の量子化ベクトルの値を、ヒストグラム生成部１３０に出力すると共に、生成したそれぞれのシーン認識分割領域の量子化ベクトルの値を、量子化ベクトル保存部１７０に保存させる。また、量子化ベクトル生成部１２０は、全てのシーン認識分割領域の量子化ベクトルの生成が完了したとき、量子化ベクトルの生成が完了したことを位置特定制御部１６０に通知する。なお、量子化ベクトル生成部１２０において量子化ベクトルを生成する処理の方法は、従来の技術においてシーン認識の処理を行う際に量子化ベクトルを生成する処理の方法と同様であるため、詳細な説明は省略する。

量子化ベクトル保存部１７０は、量子化ベクトル生成部１２０からの制御に応じて、量子化ベクトル生成部１２０が生成したそれぞれのシーン認識分割領域の量子化ベクトルの値を一時的に保存する、例えば、ＤＲＡＭ（ＤｙｎａｍｉｃＲａｎｄｏｍＡｃｃｅｓｓＭｅｍｏｒｙ）などのメモリである。量子化ベクトル保存部１７０は、量子化ベクトル生成部１２０から入力された、それぞれのシーン認識分割領域に対応する量子化ベクトルの値を、それぞれのシーン認識分割領域毎に保存する。量子化ベクトル保存部１７０に保存されたそれぞれのシーン認識分割領域毎の量子化ベクトルの値は、ヒストグラム生成部１３０からの制御に応じて、ヒストグラム生成部１３０に出力される。

ヒストグラム生成部１３０は、位置特定制御部１６０からの制御に応じたシーン認識の処理において、量子化ベクトル生成部１２０から入力されたそれぞれのシーン認識分割領域毎の量子化ベクトルの値から、対象物位置特定システム１０に入力された画像の全体を表すヒストグラムを生成する。そして、ヒストグラム生成部１３０は、生成した画像全体のヒストグラムを、ＳＶＭ演算部１４０に出力する。また、ヒストグラム生成部１３０は、入力された画像に対応した画像全体のヒストグラムの生成が完了したとき、画像全体のヒストグラムの生成が完了したことを位置特定制御部１６０に通知する。なお、ヒストグラム生成部１３０において画像全体のヒストグラムを生成する処理の方法は、従来の技術においてシーン認識の処理を行う際に画像全体のヒストグラムを生成する処理の方法と同様であるため、詳細な説明は省略する。

また、ヒストグラム生成部１３０は、位置特定制御部１６０からの制御に応じた対象物の位置特定の処理において、量子化ベクトル保存部１７０に保存されているそれぞれのシーン認識分割領域毎の量子化ベクトルの値から、位置特定制御部１６０から指定された、シーン認識分割領域の大きさよりも大きな、予め定めた大きさの領域（以下、「位置特定分割領域」という）のヒストグラムを生成する。この位置特定分割領域は、対象物位置特定システム１０に入力された画像全体の内で対象物が写っている位置を特定する単位を定めた領域である。そして、ヒストグラム生成部１３０は、生成したそれぞれの位置特定分割領域毎のヒストグラム（以下、「位置特定ヒストグラム」という）を、ＳＶＭ演算部１４０に出力する。また、ヒストグラム生成部１３０は、位置特定制御部１６０から指定された位置特定分割領域に対応した位置特定ヒストグラムの生成が完了したとき、指定された位置特定ヒストグラムの生成が完了したことを位置特定制御部１６０に通知する。この通知によって、位置特定制御部１６０から次の位置特定分割領域が指定され、ヒストグラム生成部１３０は、指定された位置特定分割領域に対応した位置特定ヒストグラムの生成を繰り返す。なお、ヒストグラム生成部１３０において位置特定ヒストグラムを生成する処理の方法は、ヒストグラムを生成する領域の大きさが異なる以外は、シーン認識の処理において画像全体のヒストグラムを生成する処理の方法と同様である。

ＳＶＭ演算部１４０は、位置特定制御部１６０からの制御に応じたシーン認識の処理において、ヒストグラム生成部１３０から入力された画像全体のヒストグラムと、教師データ群１５０に含まれるそれぞれの教師データのヒストグラムとを比較するＳＶＭ演算を行い、教師データ群１５０において分類された対象物のカテゴリ毎に類似度を算出する。そして、ＳＶＭ演算部１４０は、入力された画像全体のヒストグラムに対するそれぞれの対象物のカテゴリとの類似度の算出が完了したとき、すなわち、ＳＶＭ演算が完了したとき、ＳＶＭ演算によって算出したそれぞれの対象物のカテゴリ毎の類似度を表す情報を、対象物位置特定システム１０がシーン認識の処理を行って判別した情報として出力する。また、ＳＶＭ演算部１４０は、シーン認識の処理を行うＳＶＭ演算が完了したことを位置特定制御部１６０に通知する。なお、ＳＶＭ演算部１４０におけるＳＶＭ演算の方法は、従来の技術においてシーン認識の処理を行う際のＳＶＭ演算の方法と同様であるため、詳細な説明は省略する。

また、ＳＶＭ演算部１４０は、位置特定制御部１６０からの制御に応じた対象物の位置特定の処理において、ヒストグラム生成部１３０から入力されたそれぞれの位置特定ヒストグラムと、教師データ群１５０に含まれるそれぞれの教師データのヒストグラムとを比較するＳＶＭ演算を行い、それぞれの位置特定分割領域毎に、教師データ群１５０において分類された対象物のカテゴリとの類似度を算出する。また、ＳＶＭ演算部１４０は、対象物の位置特定の処理を行う位置特定分割領域毎に、ＳＶＭ演算が完了したことを位置特定制御部１６０に通知する。この通知によって、位置特定制御部１６０から次の位置特定分割領域が指定され、ＳＶＭ演算部１４０は、指定された位置特定分割領域の位置特定ヒストグラムに対するＳＶＭ演算を繰り返す。そして、ＳＶＭ演算部１４０は、全ての位置特定分割領域の位置特定ヒストグラムに対するＳＶＭ演算が完了したとき、ＳＶＭ演算によって算出したそれぞれの位置特定分割領域毎に、シーン認識の処理によって判別した対象物のカテゴリとの類似度を表す情報を、対象物位置特定システム１０が対象物の位置特定の処理を行った結果として出力する。なお、ＳＶＭ演算部１４０における位置特定ヒストグラムに対するＳＶＭ演算の方法は、ＳＶＭ演算の処理を行うヒストグラムが異なる以外、つまり、画像全体のヒストグラムが位置特定ヒストグラムとなる以外は、シーン認識の処理におけるＳＶＭ演算の方法と同様である。

位置特定制御部１６０は、対象物位置特定システム１０の全体、すなわち、対象物位置特定システム１０に備えた局所特徴ベクトル生成部１１０、量子化ベクトル生成部１２０、ヒストグラム生成部１３０、およびＳＶＭ演算部１４０のそれぞれの動作を制御する。位置特定制御部１６０は、ヒストグラム生成分割領域指定部１６１を備えている。

ヒストグラム生成分割領域指定部１６１は、対象物位置特定システム１０における対象物の位置特定の処理において、対象物位置特定システム１０に入力された画像の全体の領域を、画像内で対象物が写っている位置を特定する位置特定の処理を行うための予め定めた大きさの位置特定分割領域に分割する。そして、ヒストグラム生成分割領域指定部１６１は、分割したそれぞれの位置特定分割領域を、ヒストグラム生成部１３０に位置特定ヒストグラムを生成させる領域およびＳＶＭ演算部１４０にＳＶＭ演算をさせる領域として、順次指定する。このとき、ヒストグラム生成分割領域指定部１６１は、今回指定した位置特定分割領域に対応した位置特定ヒストグラムの生成が完了したことを表す通知をヒストグラム生成部１３０から受け取る毎に、ヒストグラム生成部１３０に指定する位置特定分割領域を、次の位置特定分割領域に順次移動させる。また、ヒストグラム生成分割領域指定部１６１は、今回指定した位置特定分割領域の位置特定ヒストグラムに対するＳＶＭ演算が完了したことを表す通知をＳＶＭ演算部１４０から受け取る毎に、ＳＶＭ演算部１４０に指定する位置特定分割領域を、次の位置特定分割領域に順次移動させる。つまり、ヒストグラム生成分割領域指定部１６１は、ＳＶＭ演算部を行う位置特定ヒストグラムを、次の位置特定分割領域の位置特定ヒストグラムに順次変更する。

このような構成よって、対象物位置特定システム１０では、シーン認識の処理において量子化ベクトル生成部１２０が生成したそれぞれのシーン認識分割領域の量子化ベクトルの値を量子化ベクトル保存部１７０に保存し、量子化ベクトル保存部１７０に保存したそれぞれのシーン認識分割領域の量子化ベクトルの値を用いて、対象物の位置特定の処理を行う際の位置特定分割領域毎の位置特定ヒストグラムを生成する。これにより、対象物位置特定システム１０では、シーン認識の処理の後に、判別した対象物が写っている画像内の位置を特定することが求められた場合でも、それぞれの位置特定分割領域に対してシーン認識の処理を再度行うよりも少ない処理で、対象物の位置特定の処理を行うことができる。

次に、対象物位置特定システム１０の動作について説明する。図２は、本第１の実施形態の対象物位置特定システム１０における処理手順を示したフローチャートである。また、図３〜図５は、本第１の実施形態の対象物位置特定システム１０におけるそれぞれの処理の一例を説明する図である。図２に示した対象物位置特定システム１０における処理のフローチャートの説明においては、適宜、図３〜図５に示した対象物位置特定システム１０におけるそれぞれの処理の一例を参照し、画像に写っている対象物が「犬」である場合の例を説明する。

対象物位置特定システム１０に画像が入力されると、位置特定制御部１６０は、まず、入力された画像に対するシーン認識の処理を行い、その後、対象物の位置特定の処理を行うように、対象物位置特定システム１０に備えたそれぞれの構成要素の動作を制御する。図３は、本第１の実施形態の対象物位置特定システム１０における全体の処理の一例を模式的に示した図である。

対象物位置特定システム１０に、図３（ａ）に示したような位置に「犬」が写っている画像が入力された場合、まず、位置特定制御部１６０は、対象物位置特定システム１０に備えたそれぞれの構成要素の動作を制御して、入力された画像（図３（ａ））に対してシーン認識の処理を行って、入力された画像に「犬」が写っていると判別する。その後、位置特定制御部１６０は、対象物位置特定システム１０に備えたそれぞれの構成要素の動作を制御して、入力された画像（図３（ａ））全体の領域を図３（ｂ）に示したように複数の位置特定分割領域に分割したそれぞれの位置特定分割領域毎に対象物の位置特定の処理を順次行って、対象物である「犬」が写っている位置特定分割領域の位置を特定する。図３（ｂ）には、画像（図３（ａ））全体の領域を水平方向および垂直方向にそれぞれ３分割した９つの位置特定分割領域Ａ１〜Ａ９に分割し、位置特定分割領域Ａ６の位置を、対象物である「犬」が写っている位置と特定した場合を示している。

対象物位置特定システム１０に画像が入力されると、対象物位置特定システム１０は、ステップＳ１００から、入力された画像のシーンを認識するシーン認識の処理を開始する。対象物位置特定システム１０におけるシーン認識の処理では、まず、ステップＳ１００において、位置特定制御部１６０は、局所特徴ベクトル生成部１１０に、入力された画像（図３（ａ））全体の領域を予め定めた大きさの細かいシーン認識分割領域に分割したそれぞれのシーン認識分割領域毎の局所特徴ベクトルを生成させる。

続いて、ステップＳ１１０において、位置特定制御部１６０は、量子化ベクトル生成部１２０に、局所特徴ベクトル生成部１１０が生成した局所特徴ベクトルに基づいて、それぞれのシーン認識分割領域毎の量子化ベクトルを生成させる。また、ステップＳ１１５において、位置特定制御部１６０は、量子化ベクトル生成部１２０に、生成したそれぞれのシーン認識分割領域の量子化ベクトルの値を、量子化ベクトル保存部１７０に保存させる。

続いて、ステップＳ１２０において、位置特定制御部１６０は、ヒストグラム生成部１３０に、量子化ベクトル生成部１２０が生成したそれぞれのシーン認識分割領域毎の量子化ベクトルの値に基づいて、対象物位置特定システム１０に入力された画像（図３（ａ））の全体を表すヒストグラムを生成させる。

続いて、ステップＳ１３０において、位置特定制御部１６０は、ＳＶＭ演算部１４０に、ヒストグラム生成部１３０が生成した画像（図３（ａ））全体のヒストグラムと、教師データ群１５０に含まれるそれぞれの教師データのヒストグラムとの類似度を算出するＳＶＭ演算を実行させる。これにより、対象物位置特定システム１０は、入力された画像（図３（ａ））に「犬」が写っていると判別することができ、それぞれの対象物のカテゴリ毎の類似度を表す情報を出力する。

ここまでの処理が、対象物位置特定システム１０におけるシーン認識の処理である。なお、対象物位置特定システム１０におけるシーン認識の処理は、従来の技術によるシーン認識の処理と同様である。

ここで、対象物位置特定システム１０によって行われる、ステップＳ１００〜ステップＳ１３０までのシーン認識の処理の一例について説明する。図４は、本第１の実施形態の対象物位置特定システム１０においてシーン認識の処理を行う動作の一例を模式的に示した図である。

対象物位置特定システム１０におけるシーン認識の処理では、まず、ステップＳ１００において、局所特徴ベクトル生成部１１０が、位置特定制御部１６０からの制御に応じて、入力された画像（図３（ａ））全体の領域を、予め定めた大きさの細かいシーン認識分割領域に分割し、分割したそれぞれのシーン認識分割領域毎に局所特徴ベクトルを生成する。そして、局所特徴ベクトル生成部１１０は、生成したそれぞれのシーン認識分割領域の局所特徴ベクトルの値を、量子化ベクトル生成部１２０に出力する。図４（ａ）には、局所特徴ベクトル生成部１１０が、入力された画像を水平方向および垂直方向にそれぞれ９分割したシーン認識分割領域の状態の一例を示している。

そして、ステップＳ１１０において、量子化ベクトル生成部１２０が、位置特定制御部１６０からの制御に応じて、局所特徴ベクトル生成部１１０が生成した局所特徴ベクトルの値を量子化し、それぞれのシーン認識分割領域毎の量子化ベクトルを生成する。そして、量子化ベクトル生成部１２０は、生成したそれぞれのシーン認識分割領域の量子化ベクトルの値を、ヒストグラム生成部１３０に出力する。また、ステップＳ１１５において、量子化ベクトル生成部１２０は、生成したそれぞれのシーン認識分割領域の量子化ベクトルの値を、量子化ベクトル保存部１７０に保存する。図４（ｂ）には、量子化ベクトル生成部１２０によって量子化ベクトルの生成が完了した状態の一例を示している。

その後、ステップＳ１２０において、ヒストグラム生成部１３０が、位置特定制御部１６０からの制御に応じて、量子化ベクトル生成部１２０が生成したそれぞれのシーン認識分割領域毎の量子化ベクトルの値から、対象物位置特定システム１０に入力された画像（図３（ａ））の全体を表すヒストグラムを生成する。そして、ヒストグラム生成部１３０は、生成した画像（図３（ａ））全体のヒストグラムを、ＳＶＭ演算部１４０に出力する。図４（ｃ）には、ヒストグラム生成部１３０が生成した画像全体のヒストグラムの一例を示している。

その後、ステップＳ１３０において、ＳＶＭ演算部１４０が、位置特定制御部１６０からの制御に応じて、ヒストグラム生成部１３０が生成した画像（図３（ａ））全体のヒストグラムと、教師データ群１５０に含まれるそれぞれの教師データのヒストグラム（例えば、上述した４つのカテゴリに含まれる１５００個のヒストグラムの合計６０００個のヒストグラム）との類似度を算出するＳＶＭ演算を行う。そして、ＳＶＭ演算部１４０は、算出したＳＶＭ演算の結果に基づいて得られる、それぞれの対象物のカテゴリ毎の類似度を表す情報を出力する。

なお、ＳＶＭ演算部１４０によるＳＶＭ演算では、ヒストグラム生成部１３０が生成した画像（図３（ａ））全体のヒストグラムとそれぞれの教師データのヒストグラムとにおける同じ階級同士の度数の差分絶対値を算出し、それぞれの階級の差分絶対値を加算する。ここで算出した差分絶対値の加算結果は、ヒストグラム生成部１３０が生成した画像（図３（ａ））全体のヒストグラムとそれぞれの教師データのヒストグラムとの差が小さいほど、つまり、それぞれのヒストグラムの類似度が高いほど、値が小さくなる。これにより、ＳＶＭ演算部１４０が算出した差分絶対値の加算結果の値が最も小さい教師データが含まれているカテゴリが、入力された画像（図３（ａ））に写っている対象物のカテゴリであると判別することができる。ＳＶＭ演算部１４０は、差分絶対値の加算結果に応じた類似度を表す情報を出力する。図４（ｄ）には、対象物が「犬」であるカテゴリに対する類似度が８０％である情報と、対象物が「猫」であるカテゴリに対する類似度が２０％である情報とを出力した場合の一例を示している。

なお、それぞれのヒストグラムで表した画像の領域の大きさが異なると、つまり、画像に含まれる画像データの合計数（画素数）が異なると、たとえ、同じ画像を表すヒストグラムであったとしても、同じ階級における度数が異なり、同じ階級同士の度数から算出した差分絶対値が大きな値になってしまう。このため、ＳＶＭ演算では、それぞれのヒストグラムで表した画像の領域の大きさが同等になるように、つまり、画像データの合計数が同等になるように、それぞれのヒストグラムに含まれる度数の数を正規化した後に、それぞれのヒストグラムにおける同じ階級同士の度数の差分絶対値を算出する。これは、従来の技術によるシーン認識の処理においても同様である。

そして、シーン認識の処理が完了すると、対象物位置特定システム１０は、ステップＳ２００から、シーン認識の処理を行った画像内で、判別した対象物が写っている位置を特定する位置特定の処理を開始する。対象物位置特定システム１０における対象物の位置特定の処理では、シーン認識の処理において量子化ベクトル生成部１２０が量子化ベクトル保存部１７０に保存したそれぞれのシーン認識分割領域の量子化ベクトルの値を用いて、シーン認識の処理における画像全体のヒストグラムの生成（ステップＳ１２０）以降の処理と同様の処理を、位置特定分割領域毎に行う。

まず、ステップＳ２００において、位置特定制御部１６０は、ヒストグラム生成部１３０に、入力された画像（図３（ａ））全体の領域を分割した９つの位置特定分割領域（図３（ｂ）参照）の内、１つ目の位置特定分割領域を指定する。そして、位置特定制御部１６０は、ヒストグラム生成部１３０に、指定した１つ目の位置特定分割領域に対応する量子化ベクトルの値を、量子化ベクトル保存部１７０から取得させる。

続いて、ステップＳ２１０において、位置特定制御部１６０は、ヒストグラム生成部１３０に、取得した１つ目の位置特定分割領域に対応する量子化ベクトルの値に基づいて、１つ目の位置特定分割領域を表す位置特定ヒストグラムを生成させる。

続いて、ステップＳ２２０において、位置特定制御部１６０は、ＳＶＭ演算部１４０に、ヒストグラム生成部１３０が生成した１つ目の位置特定分割領域を表す位置特定ヒストグラムと、教師データ群１５０に含まれる、シーン認識の処理において判別した、類似度が最も高かった対象物のカテゴリのそれぞれの教師データのヒストグラムとの類似度を算出するＳＶＭ演算を実行させる。これにより、対象物位置特定システム１０は、１つ目の位置特定分割領域内に、シーン認識の処理において類似度が最も高かった「犬」が写っているか否かを判別することができる類似度を表す情報を出力する。

ここまでの処理が、対象物位置特定システム１０における１つの位置特定分割領域に対する位置特定の処理である。対象物位置特定システム１０では、入力された画像（図３（ａ））全体の領域を分割した９つの位置特定分割領域（図３（ｂ）参照）、すなわち、全ての位置特定分割領域に対して、ステップＳ２００〜ステップＳ２２０までの位置特定の処理を行う。

より具体的には、ステップＳ２３０において、位置特定制御部１６０は、入力された画像（図３（ａ））全体の領域を分割した全ての位置特定分割領域の指定が終了したか否かを判定する。ステップＳ２３０による判定の結果、分割した全ての位置特定分割領域の指定が終了した場合には、対象物位置特定システム１０における処理を完了する。一方、ステップＳ２３０による判定の結果、分割した全ての位置特定分割領域の指定が終了していない場合には、ステップＳ２００に戻って、次の位置特定分割領域を指定して、ステップＳ２００〜ステップＳ２２０までの位置特定の処理を繰り返す。

ここで、対象物位置特定システム１０によって行われる、ステップＳ２００〜ステップＳ２２０までの位置特定の処理について説明する。図５は、本第１の実施形態の対象物位置特定システム１０において対象物の位置を特定する処理の考え方を説明する図である。

対象物位置特定システム１０における対象物の位置特定の処理では、まず、ステップＳ２００において、位置特定制御部１６０が、入力された画像（図３（ａ））全体の領域を分割した９つの位置特定分割領域（図３（ｂ）参照）の内、１つ目の位置特定分割領域Ａ１を指定する。そして、ヒストグラム生成部１３０が、位置特定制御部１６０によって指定された１つ目の位置特定分割領域Ａ１に対応する量子化ベクトルの値を量子化ベクトル保存部１７０から取得する。図５（ａ−１）には、ヒストグラム生成部１３０が、位置特定制御部１６０によって指定された１つ目の位置特定分割領域Ａ１に対応するそれぞれのシーン認識分割領域の量子化ベクトルの値を、量子化ベクトル保存部１７０から取得する状態の一例を示している。

その後、ステップＳ２１０において、ヒストグラム生成部１３０が、位置特定制御部１６０からの制御に応じて、量子化ベクトル保存部１７０から取得した１つ目の位置特定分割領域Ａ１に対応する量子化ベクトルの値から、１つ目の位置特定分割領域Ａ１を表す位置特定ヒストグラムを生成する。そして、ヒストグラム生成部１３０は、生成した１つ目の位置特定分割領域Ａ１を表す位置特定ヒストグラムを、ＳＶＭ演算部１４０に出力する。図５（ａ−２）には、ヒストグラム生成部１３０が、量子化ベクトル保存部１７０から取得した１つ目の位置特定分割領域Ａ１に対応する量子化ベクトルの値から生成した位置特定ヒストグラムの一例を示している。

その後、ステップＳ２２０において、ＳＶＭ演算部１４０が、位置特定制御部１６０からの制御に応じて、ヒストグラム生成部１３０が生成した１つ目の位置特定分割領域Ａ１を表す位置特定ヒストグラムと、教師データ群１５０に含まれる、シーン認識の処理において類似度が最も高かった「犬」であるカテゴリのそれぞれの教師データのヒストグラムとの類似度を算出するＳＶＭ演算を行う。そして、ＳＶＭ演算部１４０は、位置特定分割領域Ａ１に対して算出したＳＶＭ演算の結果に基づいて得られる、「犬」であるカテゴリとの類似度を表す情報を出力する。

なお、対象物の位置特定の処理においても、シーン認識の処理におけるＳＶＭ演算部１４０によるＳＶＭ演算と同様に、ヒストグラム生成部１３０が生成した１つ目の位置特定分割領域Ａ１を表す位置特定ヒストグラムとそれぞれの教師データのヒストグラムとにおける同じ階級同士の度数の差分絶対値を算出し、それぞれの階級の差分絶対値を加算する。これにより、ＳＶＭ演算部１４０は、算出した差分絶対値の加算結果の値が最も小さい位置特定分割領域を、対象物である「犬」が写っている位置特定分割領域であると判別し、その位置特定分割領域の位置を特定する情報を出力する。

また、ヒストグラム生成部１３０は、位置特定制御部１６０から指定された１つ目の位置特定分割領域Ａ１を表す位置特定ヒストグラムの生成が完了したとき、１つ目の位置特定分割領域Ａ１を表す位置特定ヒストグラムの生成が完了したことを位置特定制御部１６０に通知する。この通知に応じて、位置特定制御部１６０は、ステップＳ２３０の判定を行い、ステップＳ２００に戻って、２つ目の位置特定分割領域Ａ２を指定する。

そして、ヒストグラム生成部１３０が、位置特定制御部１６０によって指定された２つ目の位置特定分割領域Ａ２に対応する量子化ベクトルの値を量子化ベクトル保存部１７０から取得する。図５（ｂ−１）には、ヒストグラム生成部１３０が、位置特定制御部１６０によって指定された２つ目の位置特定分割領域Ａ２に対応するそれぞれのシーン認識分割領域の量子化ベクトルの値を、量子化ベクトル保存部１７０から取得する状態の一例を示している。

その後、ステップＳ２１０において、ヒストグラム生成部１３０が、位置特定制御部１６０からの制御に応じて、量子化ベクトル保存部１７０から取得した２つ目の位置特定分割領域Ａ２に対応する量子化ベクトルの値から、２つ目の位置特定分割領域Ａ２を表す位置特定ヒストグラムを生成する。そして、ヒストグラム生成部１３０は、生成した２つ目の位置特定分割領域Ａ２を表す位置特定ヒストグラムを、ＳＶＭ演算部１４０に出力する。図５（ｂ−２）には、ヒストグラム生成部１３０が、量子化ベクトル保存部１７０から取得した２つ目の位置特定分割領域Ａ２に対応する量子化ベクトルの値から生成した位置特定ヒストグラムの一例を示している。

その後、ステップＳ２２０において、ＳＶＭ演算部１４０が、位置特定制御部１６０からの制御に応じて、ヒストグラム生成部１３０が生成した２つ目の位置特定分割領域Ａ２を表す位置特定ヒストグラムと、教師データ群１５０に含まれる、シーン認識の処理において類似度が最も高かった「犬」であるカテゴリのそれぞれの教師データのヒストグラムとの類似度を算出するＳＶＭ演算を行う。そして、ＳＶＭ演算部１４０は、位置特定分割領域Ａ２に対して算出したＳＶＭ演算の結果に基づいて得られる、「犬」であるカテゴリとの類似度を表す情報を出力する。

以降、同様に、位置特定制御部１６０が、入力された画像（図３（ａ））全体の領域を分割した９つの位置特定分割領域を順次指定し、ヒストグラム生成部１３０が、位置特定制御部１６０によって指定されたそれぞれの位置特定分割領域を表す位置特定ヒストグラムを順次生成してＳＶＭ演算部１４０に出力する。また、同様に、ＳＶＭ演算部１４０が、ヒストグラム生成部１３０が生成したそれぞれの位置特定分割領域を表す位置特定ヒストグラムと、教師データ群１５０に含まれる、シーン認識の処理において類似度が最も高かった「犬」であるカテゴリのそれぞれの教師データのヒストグラムとの類似度を算出するＳＶＭ演算を行う。そして、ＳＶＭ演算部１４０は、算出したＳＶＭ演算の結果に基づいて得られる、それぞれの位置特定分割領域における「犬」であるカテゴリとの類似度を表す情報を出力する。

また、ＳＶＭ演算部１４０は、それぞれの位置特定分割領域における「犬」であるカテゴリとの類似度を表す情報に基づいて、類似度が最も大きい位置特定分割領域を、対象物である「犬」が写っている位置特定分割領域であると判別し、その位置特定分割領域の位置を特定する情報を出力する。

このようにして、対象物位置特定システム１０では、入力された画像（図３（ａ））全体の領域を分割した全ての位置特定分割領域に対する位置特定の処理を繰り返すことによって、それぞれの位置特定分割領域の中で、「犬」であるカテゴリとの類似度が最も高い位置特定分割領域を、シーン認識の処理によって判別した「犬」が対象物として写っている位置特定分割領域として特定することができる。これにより、対象物位置特定システム１０は、特定した位置特定分割領域の位置を表す情報を出力することができる。

本実施形態によれば、入力された画像の全体の領域を、予め定めた第１の大きさの複数の第１の領域（シーン認識分割領域）に分割し、この分割したシーン認識分割領域毎に、このシーン認識分割領域に含まれる画像データにおける局所的な特徴を表す局所特徴ベクトルを生成する局所特徴ベクトル生成部（局所特徴ベクトル生成部１１０）と、局所特徴ベクトル生成部１１０が生成した、それぞれのシーン認識分割領域の局所特徴ベクトルの値を量子化し、それぞれのシーン認識分割領域に対応する量子化ベクトルを生成する量子化ベクトル生成部（量子化ベクトル生成部１２０）と、量子化ベクトル生成部１２０が生成したそれぞれの量子化ベクトルの値を、シーン認識分割領域毎に保存する量子化ベクトル保存部（量子化ベクトル保存部１７０）と、シーン認識分割領域毎のそれぞれの量子化ベクトルの値から、画像の全体または一部の領域を表すヒストグラム（画像全体のヒストグラムまたは位置特定ヒストグラム）を生成するヒストグラム生成部（ヒストグラム生成部１３０）と、ヒストグラム生成部１３０が生成したヒストグラムに対するサポートベクタマシン（ＳＶＭ）演算を行うＳＶＭ演算部（ＳＶＭ演算部１４０）と、対象物位置特定システム１０内の構成要素のそれぞれを制御し、対象物が写されている画像のシーンを認識するシーン認識の処理を実行させた後に、このシーン認識の処理において判別した対象物（例えば、「犬」）が、画像の全体の領域をシーン認識分割領域よりも大きな予め定めた第２の大きさに分割した複数の第２の領域（位置特定分割領域）のいずれの位置に写されているかを特定するための位置特定の処理を実行させる位置特定制御部（位置特定制御部１６０）と、を備え、位置特定制御部１６０は、シーン認識の処理において、ヒストグラム生成部１３０に、それぞれのシーン認識分割領域毎の量子化ベクトルの値から、画像の全体を表すヒストグラムを生成させ、ＳＶＭ演算部１４０に、画像の全体を表すヒストグラムと、複数の画像のヒストグラムが対象物の種類毎に分類してまとめられた複数の教師データのヒストグラムのそれぞれとを比較するＳＶＭ演算を実行させ、位置特定の処理において、ヒストグラム生成部１３０に、量子化ベクトル保存部１７０に保存されたシーン認識分割領域毎のそれぞれの量子化ベクトルの値から、それぞれの位置特定分割領域の画像を表すヒストグラムを生成させ、ＳＶＭ演算部１４０に、位置特定分割領域を表すヒストグラムのそれぞれに対するＳＶＭ演算を実行させる、対象物位置特定システム（対象物位置特定システム１０）が構成される。

また、本実施形態によれば、入力された画像の全体の領域を、予め定めた第１の大きさの複数の第１の領域（シーン認識分割領域）に分割し、この分割したシーン認識分割領域毎に、このシーン認識分割領域に含まれる画像データにおける局所的な特徴を表す局所特徴ベクトルを生成する局所特徴ベクトル生成部（局所特徴ベクトル生成部１１０）と、局所特徴ベクトル生成部１１０が生成した、それぞれのシーン認識分割領域の局所特徴ベクトルの値を量子化し、それぞれのシーン認識分割領域に対応する量子化ベクトルを生成する量子化ベクトル生成部（量子化ベクトル生成部１２０）と、量子化ベクトル生成部１２０が生成したそれぞれの量子化ベクトルの値を、シーン認識分割領域毎に保存する量子化ベクトル保存部（量子化ベクトル保存部１７０）と、シーン認識分割領域毎のそれぞれの量子化ベクトルの値から、画像の全体または一部の領域を表すヒストグラム（画像全体のヒストグラムまたは位置特定ヒストグラム）を生成するヒストグラム生成部（ヒストグラム生成部１３０）と、ヒストグラム生成部１３０が生成したヒストグラムに対するサポートベクタマシン（ＳＶＭ）演算を行うＳＶＭ演算部（ＳＶＭ演算部１４０）と、対象物位置特定システム１０内の構成要素のそれぞれを制御し、対象物が写されている画像のシーンを認識するシーン認識の処理を実行させた後に、このシーン認識の処理において判別した対象物（例えば、「犬」）が、画像の全体の領域をシーン認識分割領域よりも大きな予め定めた第２の大きさに分割した複数の第２の領域（位置特定分割領域）のいずれの位置に写されているかを特定するための位置特定の処理を実行させる位置特定制御部（位置特定制御部１６０）と、を備えた対象物位置特定システムにおいて、位置特定制御部１６０が、シーン認識の処理において、ヒストグラム生成部１３０に、それぞれのシーン認識分割領域毎の量子化ベクトルの値から、画像の全体を表すヒストグラムを生成させる手順と、ＳＶＭ演算部１４０に、画像の全体を表すヒストグラムと、複数の画像のヒストグラムが対象物の種類毎に分類してまとめられた複数の教師データのヒストグラムのそれぞれとを比較するＳＶＭ演算を実行させる手順と、を含み、位置特定の処理において、ヒストグラム生成部１３０に、量子化ベクトル保存部１７０に保存されたシーン認識分割領域毎のそれぞれの量子化ベクトルの値から、それぞれの位置特定分割領域の画像を表すヒストグラムを生成させる手順と、ＳＶＭ演算部１４０に、位置特定分割領域を表すヒストグラムのそれぞれに対するＳＶＭ演算を実行させる手順と、を含む、対象物位置特定方法が構成される。

上記に述べたように、本第１の実施形態の対象物位置特定システム１０では、シーン認識の処理において量子化ベクトル生成部１２０が生成したそれぞれのシーン認識分割領域の量子化ベクトルの値を、量子化ベクトル保存部１７０に保存する。そして、本第１の実施形態の対象物位置特定システム１０における対象物の位置特定の処理では、量子化ベクトル保存部１７０に保存したそれぞれのシーン認識分割領域の量子化ベクトルの値を用いて、位置特定分割領域毎の位置特定ヒストグラムを生成する。これにより、本第１の実施形態の対象物位置特定システム１０では、対象物が写っている画像内の位置を特定するために、入力された画像に対してシーン認識の処理を行った後に、それぞれの位置特定分割領域に対してシーン認識の処理と同等の処理を再度行うよりも少ない処理で、位置特定の処理を行うことができる。つまり、本第１の実施形態の対象物位置特定システム１０における対象物の位置特定の処理では、シーン認識の処理における局所特徴ベクトルを生成する処理（ステップＳ１００）と、量子化ベクトルを生成する処理（ステップＳ１１０）とを省略することができる。このことにより、本第１の実施形態の対象物位置特定システム１０では、対象物が写っている画像内の位置を特定するために要する演算時間を短縮することができる。

なお、本第１の実施形態の対象物位置特定システム１０では、ＳＶＭ演算部１４０が、シーン認識の処理において、算出したＳＶＭ演算の結果に基づいて得られるそれぞれの対象物のカテゴリ毎の類似度を表す情報を出力し、対象物の位置特定の処理において、判別した対象物が写っている位置特定分割領域の位置を特定する情報を出力する構成について説明した。しかし、対象物のカテゴリ毎の類似度を表す情報や、判別した対象物が写っている位置特定分割領域の位置を特定する情報を出力する構成要素は、ＳＶＭ演算部１４０に限定されるものではない。例えば、位置特定制御部１６０が、ＳＶＭ演算部１４０が算出したそれぞれのＳＶＭ演算の結果に基づいて、それぞれの対象物のカテゴリ毎の類似度を表す情報や、判別した対象物が写っている位置特定分割領域の位置を特定する情報を出力する構成にすることもできる。

＜第２の実施形態＞
次に、本発明の第２の実施形態について説明する。図６は、本第２の実施形態による対象物位置特定システムの概略構成を示したブロック図である。図６において、対象物位置特定システム２０は、局所特徴ベクトル生成部１１０と、量子化ベクトル生成部１２０と、ヒストグラム生成部２３０と、ＳＶＭ演算部２４０と、教師データ群１５０と、位置特定制御部２６０と、量子化ベクトル保存部１７０と、ヒストグラム保存部２８０と、を備えている。

なお、図６に示した対象物位置特定システム２０は、図１に示した第１の実施形態の対象物位置特定システム１０に備えたヒストグラム生成部１３０がヒストグラム生成部２３０に、ＳＶＭ演算部１４０がＳＶＭ演算部２４０に、位置特定制御部１６０が位置特定制御部２６０に、それぞれ代わり、さらに、ヒストグラム保存部２８０を備えた構成である。また、対象物位置特定システム２０に備えたその他の構成要素は、図１に示した第１の実施形態の対象物位置特定システム１０に備えた構成要素と同じ構成要素である。従って、本第２の実施形態の対象物位置特定システム２０の説明においては、第１の実施形態の対象物位置特定システム１０に備えた構成要素と異なる構成要素および動作のみを説明し、第１の実施形態の対象物位置特定システム１０と同様の構成要素および動作に関する詳細な説明は省略する。

対象物位置特定システム２０は、第１の実施形態の対象物位置特定システム１０と同様に、入力された画像に対して、画像に写っている被写体（対象物）や画像が撮影されたシーンを認識するシーン認識の処理を行い、様々な対象物の種類毎に分類されたそれぞれの教師データとの類似度の情報を、シーン認識の処理によって判別した情報として出力する。また、対象物位置特定システム２０は、第１の実施形態の対象物位置特定システム１０と同様に、シーン認識の処理を行った画像内で、判別した対象物が写っている位置を特定する位置特定の処理を行い、特定した対象物が写っている位置を表す情報を出力する。

局所特徴ベクトル生成部１１０は、位置特定制御部２６０からの制御に応じて、対象物位置特定システム２０に入力された画像の局所特徴ベクトルをシーン認識分割領域毎に生成し、生成したそれぞれのシーン認識分割領域の局所特徴ベクトルの値を、量子化ベクトル生成部１２０に出力する。

量子化ベクトル生成部１２０は、位置特定制御部２６０からの制御に応じて、局所特徴ベクトル生成部１１０から入力されたそれぞれのシーン認識分割領域の局所特徴ベクトルの値を量子化したシーン認識分割領域毎の量子化ベクトルを生成し、生成したそれぞれのシーン認識分割領域の量子化ベクトルの値を、ヒストグラム生成部２３０に出力すると共に、量子化ベクトル保存部１７０に保存させる。

量子化ベクトル保存部１７０は、量子化ベクトル生成部１２０から入力された、それぞれのシーン認識分割領域に対応する量子化ベクトルの値を、それぞれのシーン認識分割領域毎に保存し、保存したそれぞれのシーン認識分割領域毎の量子化ベクトルの値を、ヒストグラム生成部２３０からの制御に応じて、ヒストグラム生成部２３０に出力する。

ヒストグラム生成部２３０は、第１の実施形態の対象物位置特定システム１０に備えたヒストグラム生成部１３０と同様に、位置特定制御部２６０からの制御に応じたシーン認識の処理において、量子化ベクトル生成部１２０から入力されたそれぞれのシーン認識分割領域毎の量子化ベクトルの値から、対象物位置特定システム２０に入力された画像の全体を表すヒストグラムを生成する。そして、ヒストグラム生成部２３０は、生成した画像全体のヒストグラムを、ＳＶＭ演算部２４０に出力する。また、ヒストグラム生成部２３０は、第１の実施形態の対象物位置特定システム１０に備えたヒストグラム生成部１３０と異なり、生成した画像全体のヒストグラムを、ヒストグラム保存部２８０に保存させる。また、ヒストグラム生成部２３０は、入力された画像に対応した画像全体のヒストグラムの生成が完了したとき、画像全体のヒストグラムの生成が完了したことを位置特定制御部２６０に通知する。なお、ヒストグラム生成部２３０において画像全体のヒストグラムを生成する処理の方法も、第１の実施形態の対象物位置特定システム１０に備えたヒストグラム生成部１３０と同様に、従来の技術においてシーン認識の処理を行う際に画像全体のヒストグラムを生成する処理の方法と同様であるため、詳細な説明は省略する。

また、ヒストグラム生成部２３０は、第１の実施形態の対象物位置特定システム１０に備えたヒストグラム生成部１３０と同様に、位置特定制御部２６０からの制御に応じた対象物の位置特定の処理において、量子化ベクトル保存部１７０に保存されているそれぞれのシーン認識分割領域毎の量子化ベクトルの値から、位置特定制御部２６０から指定された位置特定分割領域を表す位置特定ヒストグラムを生成する。そして、ヒストグラム生成部２３０は、生成したそれぞれの位置特定分割領域毎の位置特定ヒストグラムを、ＳＶＭ演算部２４０に出力する。また、ヒストグラム生成部２３０は、位置特定制御部２６０から指定された位置特定分割領域に対応した位置特定ヒストグラムの生成が完了したとき、指定された位置特定ヒストグラムの生成が完了したことを位置特定制御部２６０に通知する。この通知によって、位置特定制御部２６０から次の位置特定分割領域が指定され、ヒストグラム生成部２３０は、指定された位置特定分割領域に対応した位置特定ヒストグラムの生成を繰り返す。なお、ヒストグラム生成部２３０において位置特定ヒストグラムを生成する処理の方法も、ヒストグラムを生成する領域の大きさが異なる以外は、シーン認識の処理において画像全体のヒストグラムを生成する処理の方法と同様である。

ヒストグラム保存部２８０は、ヒストグラム生成部２３０からの制御に応じて、ヒストグラム生成部２３０が生成した画像全体のヒストグラムを一時的に保存する、例えば、ＤＲＡＭなどのメモリである。ヒストグラム保存部２８０に保存された画像全体のヒストグラムは、ＳＶＭ演算部２４０からの制御に応じて、ＳＶＭ演算部２４０に出力される。

ＳＶＭ演算部２４０は、第１の実施形態の対象物位置特定システム１０に備えたＳＶＭ演算部１４０と同様に、位置特定制御部２６０からの制御に応じたシーン認識の処理において、ヒストグラム生成部２３０から入力された画像全体のヒストグラムと、教師データ群１５０に含まれるそれぞれの教師データのヒストグラムとを比較するＳＶＭ演算を行い、教師データ群１５０において分類された対象物のカテゴリ毎に類似度を算出する。そして、ＳＶＭ演算部２４０は、入力された画像全体のヒストグラムに対するＳＶＭ演算が完了したとき、ＳＶＭ演算によって算出したそれぞれの対象物のカテゴリ毎の類似度を表す情報を、対象物位置特定システム２０がシーン認識の処理を行って判別した情報として出力する。また、ＳＶＭ演算部２４０は、シーン認識の処理を行うＳＶＭ演算が完了したことを位置特定制御部２６０に通知する。なお、ＳＶＭ演算部２４０におけるＳＶＭ演算の方法も、第１の実施形態の対象物位置特定システム１０に備えたＳＶＭ演算部１４０と同様に、従来の技術においてシーン認識の処理を行う際のＳＶＭ演算の方法と同様であるため、詳細な説明は省略する。

また、ＳＶＭ演算部２４０は、第１の実施形態の対象物位置特定システム１０に備えたＳＶＭ演算部１４０と異なり、位置特定制御部２６０からの制御に応じた対象物の位置特定の処理において、ヒストグラム生成部２３０から入力されたそれぞれの位置特定ヒストグラムと、ヒストグラム保存部２８０に保存されている画像全体のヒストグラムとを比較するＳＶＭ演算（以下、「簡易ＳＶＭ演算」という）を行い、それぞれの位置特定分割領域毎に、画像全体のヒストグラムとの類似度を算出する。また、ＳＶＭ演算部２４０は、対象物の位置特定の処理を行う位置特定分割領域毎に、簡易ＳＶＭ演算が完了したことを位置特定制御部２６０に通知する。この通知によって、位置特定制御部２６０から次の位置特定分割領域が指定され、ＳＶＭ演算部２４０は、指定された位置特定分割領域の位置特定ヒストグラムに対する簡易ＳＶＭ演算を繰り返す。なお、ＳＶＭ演算部２４０における位置特定ヒストグラムに対する簡易ＳＶＭ演算の方法も、ＳＶＭ演算の処理を行う、教師データ群１５０に含まれるそれぞれの教師データのヒストグラムが、ヒストグラム保存部２８０に保存されている画像全体のヒストグラムに代わる以外は、シーン認識の処理におけるＳＶＭ演算の方法と同様である。

また、ＳＶＭ演算部２４０は、位置特定制御部２６０からの制御に応じた対象物の位置特定の処理において、全ての位置特定分割領域の位置特定ヒストグラムに対する簡易ＳＶＭ演算が完了した後に、画像全体のヒストグラムとの類似度が最も高かった位置特定ヒストグラムと、教師データ群１５０に含まれるそれぞれの教師データのヒストグラムとを比較するＳＶＭ演算を行い、教師データ群１５０において分類された対象物のカテゴリとの類似度を算出する。そして、ＳＶＭ演算部２４０は、簡易ＳＶＭ演算において画像全体のヒストグラムとの類似度が最も高かった位置特定ヒストグラムに対するＳＶＭ演算が完了したとき、ＳＶＭ演算によって算出した位置特定分割領域の位置特定ヒストグラムの、シーン認識の処理によって判別した対象物のカテゴリとの類似度を表す情報を、対象物位置特定システム２０が対象物の位置特定の処理を行った結果として出力する。なお、ＳＶＭ演算部２４０における位置特定ヒストグラムに対するＳＶＭ演算の方法も、第１の実施形態の対象物位置特定システム１０に備えたＳＶＭ演算部１４０と同様に、ＳＶＭ演算の処理を行うヒストグラムが位置特定ヒストグラムに代わる以外は、シーン認識の処理におけるＳＶＭ演算の方法と同様である。

位置特定制御部２６０は、対象物位置特定システム２０の全体、すなわち、対象物位置特定システム２０に備えた局所特徴ベクトル生成部１１０、量子化ベクトル生成部１２０、ヒストグラム生成部２３０、およびＳＶＭ演算部２４０のそれぞれの動作を制御する。位置特定制御部２６０は、ヒストグラム生成分割領域指定部１６１と、位置特定ＳＶＭ演算判定部２６２と、を備えている。

なお、位置特定制御部２６０は、図１に示した第１の実施形態の対象物位置特定システム１０に備えた位置特定制御部１６０に、さらに、位置特定ＳＶＭ演算判定部２６２を備えた構成である。なお、位置特定制御部２６０に備えたヒストグラム生成分割領域指定部１６１は、図１に示した第１の実施形態の対象物位置特定システム１０に備えた位置特定制御部１６０内のヒストグラム生成分割領域指定部１６１と同じ動作をする。従って、ヒストグラム生成分割領域指定部１６１の動作に関する詳細な説明は省略する。

位置特定ＳＶＭ演算判定部２６２は、対象物位置特定システム２０における対象物の位置特定の処理において、ＳＶＭ演算部２４０が、ヒストグラム生成部２３０から入力されたそれぞれの位置特定ヒストグラムに対するＳＶＭ演算を行う際のヒストグラムを、ヒストグラム保存部２８０に保存されている画像全体のヒストグラム、または教師データ群１５０に含まれるそれぞれの教師データのヒストグラムのいずれか一方に切り替える。より具体的には、位置特定ＳＶＭ演算判定部２６２は、ＳＶＭ演算部２４０が、ヒストグラム生成部２３０から入力されたそれぞれの位置特定ヒストグラムに対する簡易ＳＶＭ演算を行う際に、それぞれの位置特定ヒストグラムと比較するヒストグラムを、ヒストグラム保存部２８０に保存されている画像全体のヒストグラムに切り替える。また、位置特定ＳＶＭ演算判定部２６２は、ＳＶＭ演算部２４０が、全ての位置特定分割領域の位置特定ヒストグラムに対する簡易ＳＶＭ演算が完了した後、ＳＶＭ演算部２４０がさらに、画像全体のヒストグラムとの類似度が最も高かった位置特定ヒストグラムに対するＳＶＭ演算を行う際に、画像全体のヒストグラムと最も類似度が高かった位置特定ヒストグラムと比較するヒストグラムを、シーン認識の処理において判別した、類似度が最も高かった対象物のカテゴリのそれぞれの教師データのヒストグラムに切り替える。

このような構成よって、対象物位置特定システム２０では、第１の実施形態の対象物位置特定システム１０と同様に、シーン認識の処理において量子化ベクトル生成部１２０が生成したそれぞれのシーン認識分割領域の量子化ベクトルの値を用いて、対象物の位置特定の処理を行う際の位置特定分割領域毎の位置特定ヒストグラムを生成する。さらに、対象物位置特定システム２０では、ヒストグラム生成部２３０が生成した画像全体のヒストグラムをヒストグラム保存部２８０に保存し、ヒストグラム保存部２８０に保存した画像全体のヒストグラムを用いて、対象物の位置特定の処理を行う。より具体的には、対象物位置特定システム２０による対象物の位置特定の処理において、ヒストグラム生成部２３０が生成した位置特定分割領域毎の位置特定ヒストグラムに対するＳＶＭ演算において比較する、シーン認識の処理において判別した、類似度が最も高かった対象物のカテゴリのそれぞれの教師データのヒストグラム（例えば、１つのカテゴリに含まれる１５００個のヒストグラム）の代わりに、ヒストグラム保存部２８０に保存した画像全体のヒストグラムを用いる。つまり、対象物位置特定システム２０による対象物の位置特定の処理では、ＳＶＭ演算を行う際に用いる大量の教師データの代わりに、シーン認識の処理において生成した画像全体を表す１つのヒストグラムを使用して、シーン認識の処理において判別した対象物が写っている位置特定分割領域の位置を、簡易的に特定することができる。この画像全体を表す１つのヒストグラムを大量の教師データの代わりに使用することができる理由は、シーン認識の処理において一度判別した対象物は、いずれかの位置特定分割領域内に写っていると考えられるからである。これにより、対象物位置特定システム２０では、画像全体のヒストグラムとの類似度が最も高い位置特定ヒストグラムを特定するためにＳＶＭ演算部２４０によって行う、ヒストグラム生成部２３０が生成した位置特定分割領域毎の位置特定ヒストグラムに対するＳＶＭ演算に要する時間を短縮することができる。

次に、対象物位置特定システム２０の動作について説明する。図７は、本第２の実施形態の対象物位置特定システム２０における処理手順を示したフローチャートである。また、図８は、本第２の実施形態の対象物位置特定システム２０において対象物の位置を特定する処理の一例を説明する図である。図７に示した対象物位置特定システム２０における処理のフローチャートの説明においては、適宜、図３〜図５に示した第１の実施形態の対象物位置特定システム１０におけるそれぞれの処理の一例、および図８に示した対象物位置特定システム２０において対象物の位置を特定する処理の一例を参照する。そして、対象物位置特定システム２０における処理においても、第１の実施形態の対象物位置特定システム１０と同様に、画像に写っている対象物が「犬」である場合において、画像全体の領域を９つの位置特定分割領域に分割して、対象物である「犬」が写っている位置特定分割領域を特定する場合の例を説明する。

なお、対象物位置特定システム２０の処理には、第１の実施形態の対象物位置特定システム１０の処理と同じ処理が含まれている。このため、図７に示した本第２の実施形態の対象物位置特定システム２０における処理手順を示したフローチャートには、第１の実施形態の対象物位置特定システム１０の処理と同じ処理を行う手順に、図２に示した本第１の実施形態の対象物位置特定システム１０における処理手順を示したフローチャートに付与したステップ番号と同一のステップ番号を付与している。従って、図７に示した対象物位置特定システム２０における処理のフローチャートの説明においては、第１の実施形態の対象物位置特定システム１０の処理と同じ処理を行う手順に関する詳細な説明は省略する。

対象物位置特定システム２０に画像が入力されると、位置特定制御部２６０は、第１の実施形態の対象物位置特定システム１０に備えた位置特定制御部１６０と同様に、まず、入力された画像に対するシーン認識の処理を行い、その後、対象物の位置特定の処理を行うように、対象物位置特定システム２０に備えたそれぞれの構成要素の動作を制御する（図３参照）。

対象物位置特定システム２０におけるシーン認識の処理では、まず、ステップＳ１００〜ステップＳ１１５において、位置特定制御部２６０は、局所特徴ベクトル生成部１１０に、入力された画像（図３（ａ）参照）のそれぞれのシーン認識分割領域毎の局所特徴ベクトルを生成させ、量子化ベクトル生成部１２０に、それぞれのシーン認識分割領域毎の量子化ベクトルを生成させて、生成した量子化ベクトルの値をそれぞれのシーン認識分割領域に量子化ベクトル保存部１７０に保存させる。

続いて、ステップＳ１２０において、位置特定制御部２６０は、ヒストグラム生成部２３０に、量子化ベクトル生成部１２０が生成したそれぞれのシーン認識分割領域毎の量子化ベクトルの値から、対象物位置特定システム２０に入力された画像（図３（ａ）参照）の全体を表すヒストグラムを生成させる。また、ステップＳ１２５において、位置特定制御部２６０は、ヒストグラム生成部２３０に、生成した画像（図３（ａ）参照）の全体を表すヒストグラムを、ヒストグラム保存部２８０に保存させる。

続いて、ステップＳ１３０において、位置特定制御部２６０は、ＳＶＭ演算部２４０に、ヒストグラム生成部２３０が生成した画像（図３（ａ）参照）全体のヒストグラムと、教師データ群１５０に含まれるそれぞれの教師データのヒストグラムとの類似度を算出するＳＶＭ演算を実行させる。これにより、対象物位置特定システム２０は、入力された画像（図３（ａ）参照）に「犬」が写っていると判別することができ、それぞれの対象物のカテゴリ毎の類似度を表す情報を出力する（図４参照）。

そして、ステップＳ１００〜ステップＳ１３０までのシーン認識の処理が完了すると、対象物位置特定システム２０は、ステップＳ３００から、シーン認識の処理を行った画像内で、判別した対象物が写っている位置を特定する位置特定の処理を開始する。対象物位置特定システム２０における対象物の位置特定の処理では、第１の実施形態の対象物位置特定システム１０と同様に、まず、シーン認識の処理において量子化ベクトル生成部１２０が量子化ベクトル保存部１７０に保存したそれぞれのシーン認識分割領域の量子化ベクトルの値を用いて、位置特定ヒストグラムを生成する。その後、対象物位置特定システム２０における対象物の位置特定の処理では、生成した位置特定ヒストグラムに対する簡易ＳＶＭ演算を、シーン認識の処理においてヒストグラム生成部２３０がヒストグラム保存部２８０に保存した画像の全体を表すヒストグラムを用いて、位置特定分割領域毎に行う。そして、対象物位置特定システム２０における対象物の位置特定の処理では、最後に、簡易ＳＶＭ演算によって簡易的に判別した、シーン認識の処理において判別した対象物が写っている位置特定分割領域を表す位置特定ヒストグラムに対するＳＶＭ演算を行う。

まず、ステップＳ３００において、位置特定制御部２６０は、第１の実施形態の対象物位置特定システム１０におけるステップＳ２００と同様に、ヒストグラム生成部２３０に、入力された画像全体の領域を分割した９つの位置特定分割領域の内、１つ目の位置特定分割領域を指定し、指定した１つ目の位置特定分割領域に対応する量子化ベクトルの値を、量子化ベクトル保存部１７０から取得させる。

続いて、ステップＳ３１０において、位置特定制御部２６０は、第１の実施形態の対象物位置特定システム１０におけるステップＳ２１０と同様に、ヒストグラム生成部２３０に、取得した１つ目の位置特定分割領域に対応する量子化ベクトルの値に基づいて、１つ目の位置特定分割領域を表す位置特定ヒストグラムを生成させる。

続いて、ステップＳ３２０において、位置特定制御部２６０は、ＳＶＭ演算部２４０に、ヒストグラム生成部２３０が生成した１つ目の位置特定分割領域を表す位置特定ヒストグラムと、ヒストグラム保存部２８０に保存した画像の全体を表すヒストグラムとの類似度を算出する簡易ＳＶＭ演算を実行させる。これにより、対象物位置特定システム２０は、１つ目の位置特定分割領域内に、シーン認識の処理において類似度が最も高かった対象物（図３に示した処理の一例では「犬」）が写っているか否かを、簡易的に判別することができる。

続いて、ステップＳ３３０において、位置特定制御部２６０は、入力された画像全体の領域を分割した全ての位置特定分割領域に対する簡易的な判別が終了したか否かを判定する。ステップＳ３３０による判定の結果、分割した全ての位置特定分割領域に対する簡易的な判別が終了していない場合には、ステップＳ３００に戻って、次の位置特定分割領域を指定し、分割した全ての位置特定分割領域に対する簡易的な判別が終了するまで、ステップＳ３００〜ステップＳ３２０までの簡易的な判別の処理を繰り返す。ステップＳ３３０による判定の結果、分割した全ての位置特定分割領域に対する簡易的な判別が終了した場合には、対象物位置特定システム２０における簡易的な判別の処理を終了し、ステップＳ３４０に進む。

ここで、対象物位置特定システム２０によって行われる、ステップＳ３００〜ステップＳ３２０までの簡易的な判別の処理について説明する。図８は、本第２の実施形態の対象物位置特定システム２０において対象物の位置を簡易的に特定する処理の考え方を説明する図である。

対象物位置特定システム２０における対象物の位置特定の処理では、まず、位置特定制御部２６０が、ステップＳ３００およびステップＳ３１０において、第１の実施形態の対象物位置特定システム１０におけるステップＳ２００およびステップＳ２１０と同様に、入力された画像（図３（ａ）参照）全体の領域を分割した９つの位置特定分割領域（図３（ｂ）参照）の内、１つ目の位置特定分割領域Ａ１を指定する。これにより、ヒストグラム生成部２３０は、位置特定制御部２６０によって指定された１つ目の位置特定分割領域Ａ１に対応する量子化ベクトルの値を量子化ベクトル保存部１７０から取得し（図５（ａ−１）参照）、取得した１つ目の位置特定分割領域Ａ１に対応する量子化ベクトルの値から、１つ目の位置特定分割領域Ａ１を表す位置特定ヒストグラムを生成する（図５（ａ−２）参照）。そして、ヒストグラム生成部２３０は、生成した１つ目の位置特定分割領域Ａ１を表す位置特定ヒストグラムを、ＳＶＭ演算部２４０に出力する。

その後、ステップＳ３２０において、ＳＶＭ演算部２４０が、位置特定制御部２６０からの制御に応じて、ヒストグラム保存部２８０に保存されている画像の全体を表すヒストグラムを取得する。そして、ＳＶＭ演算部２４０は、取得した画像の全体を表すヒストグラムと、ヒストグラム生成部２３０が生成した１つ目の位置特定分割領域Ａ１を表す位置特定ヒストグラムとの類似度を算出する簡易ＳＶＭ演算を行う。そして、ＳＶＭ演算部２４０は、位置特定分割領域Ａ１に対して算出した簡易ＳＶＭ演算の結果に基づいて得られる、「犬」であるカテゴリとの類似度を表す情報を、位置特定分割領域Ａ１内に「犬」が写っているか否かを簡易的に判別する情報として出力する。

なお、ＳＶＭ演算部２４０による簡易ＳＶＭ演算においても、シーン認識の処理におけるＳＶＭ演算部２４０によるＳＶＭ演算と同様に、ヒストグラム生成部２３０が生成した１つ目の位置特定分割領域Ａ１を表す位置特定ヒストグラムと、取得した画像の全体を表すヒストグラムとのそれぞれが表す領域の大きさが同等になるように正規化した後に、それぞれのヒストグラムにおける同じ階級同士の度数の差分絶対値を算出し、それぞれの階級の差分絶対値を加算する。これにより、ＳＶＭ演算部２４０は、１つ目の位置特定分割領域Ａ１内に、シーン認識の処理において類似度が最も高かった「犬」が写っているか否かを、簡易的に判別することができる、画像の全体を表すヒストグラムと１つ目の位置特定分割領域Ａ１を表す位置特定ヒストグラムとの類似度を表す情報を出力する。なお、ＳＶＭ演算部２４０による簡易ＳＶＭ演算においても、算出した差分絶対値の加算結果の値が最も小さい位置特定分割領域を、対象物である「犬」が写っている位置特定分割領域であると判別し、その位置特定分割領域の位置を特定する情報を出力することができる。

また、ＳＶＭ演算部２４０は、位置特定制御部２６０から指定された１つ目の位置特定分割領域Ａ１を表す位置特定ヒストグラムに対する簡易ＳＶＭ演算が完了したとき、１つ目の位置特定分割領域Ａ１を表す位置特定ヒストグラムに対する簡易ＳＶＭ演算が完了したことを位置特定制御部２６０に通知する。この通知に応じて、位置特定制御部２６０は、ステップＳ３３０の判定を行い、ステップＳ３００に戻って、２つ目の位置特定分割領域Ａ２を指定する。

そして、ヒストグラム生成部２３０は、位置特定制御部２６０によって指定された２つ目の位置特定分割領域Ａ２に対応する量子化ベクトルの値を量子化ベクトル保存部１７０から取得し（図５（ｂ−１）参照）、取得した２つ目の位置特定分割領域Ａ２に対応する量子化ベクトルの値から、２つ目の位置特定分割領域Ａ２を表す位置特定ヒストグラムを生成する（図５（ｂ−２）参照）。そして、ヒストグラム生成部２３０は、生成した２つ目の位置特定分割領域Ａ２を表す位置特定ヒストグラムを、ＳＶＭ演算部２４０に出力する。

その後、ステップＳ３２０において、ＳＶＭ演算部２４０が、位置特定制御部２６０からの制御に応じて、取得した画像の全体を表すヒストグラムと、ヒストグラム生成部２３０が生成した２つ目の位置特定分割領域Ａ２を表す位置特定ヒストグラムとの類似度を算出する簡易ＳＶＭ演算を行う。そして、ＳＶＭ演算部２４０は、位置特定分割領域Ａ２に対して算出した簡易ＳＶＭ演算の結果に基づいて得られる、「犬」であるカテゴリとの類似度を表す情報を、位置特定分割領域Ａ２内に「犬」が写っているか否かを簡易的に判別する情報として出力する。

以降、同様に、位置特定制御部２６０が、入力された画像（図３（ａ）参照）全体の領域を分割した９つの位置特定分割領域（図３（ｂ）参照）を順次指定し、ヒストグラム生成部２３０が、位置特定制御部２６０によって指定されたそれぞれの位置特定分割領域を表す位置特定ヒストグラムを順次生成してＳＶＭ演算部２４０に出力する。また、同様に、ＳＶＭ演算部２４０が、ヒストグラム保存部２８０から取得した画像の全体を表すヒストグラムと、ヒストグラム生成部２３０が生成したそれぞれの位置特定分割領域を表す位置特定ヒストグラムとの類似度を算出する簡易ＳＶＭ演算を行う。そして、ＳＶＭ演算部２４０は、それぞれの位置特定分割領域に対して算出した簡易ＳＶＭ演算の結果に基づいて得られる、それぞれの位置特定分割領域内に「犬」が写っているか否かを簡易的に判別する情報を出力する。図８には、ＳＶＭ演算部２４０が、ヒストグラム保存部２８０に保存されている画像全体のヒストグラムと、ヒストグラム生成部２３０が生成した位置特定ヒストグラムのそれぞれとを比較する簡易ＳＶＭ演算を実行している状態の一例を示している。

また、ＳＶＭ演算部２４０は、それぞれの位置特定分割領域における「犬」であるカテゴリとの類似度を表す情報に基づいて、類似度が最も大きい位置特定分割領域を、対象物である「犬」が写っている位置特定分割領域であると判別し、その位置特定分割領域を特定する情報を出力する。

ここまでの処理が、対象物位置特定システム２０による対象物の位置特定の処理における、シーン認識の処理において判別した対象物が写っている位置特定分割領域の簡易的な判別の処理である。

続いて、位置特定制御部２６０は、ステップＳ３３０において全ての位置特定分割領域に対する簡易的な判別が終了した場合、ＳＶＭ演算部２４０に、シーン認識の処理において類似度が最も高かった対象物（図３に示した処理の一例では「犬」）が写っていると簡易的に判別した位置特定分割領域に対するＳＶＭ演算を実行させる。より具体的には、ステップＳ３４０において、位置特定制御部２６０は、ＳＶＭ演算部２４０に、シーン認識の処理において類似度が最も高かった「犬」が写っていると簡易的に判別した位置特定分割領域を表す位置特定ヒストグラムと、教師データ群１５０に含まれる、シーン認識の処理において判別した、類似度が最も高かった対象物のカテゴリのそれぞれの教師データのヒストグラムとの類似度を算出するＳＶＭ演算を実行させる。そして、対象物位置特定システム２０が、ＳＶＭ演算の結果に基づいて得られる、「犬」であるカテゴリとの類似度を表す情報を出力し、対象物位置特定システム２０における処理を完了する。

なお、ＳＶＭ演算部２４０によるステップＳ３３０におけるＳＶＭ演算においても、シーン認識の処理におけるＳＶＭ演算部２４０によるＳＶＭ演算と同様に、簡易的に判別した位置特定分割領域を表す位置特定ヒストグラムとそれぞれの教師データのヒストグラムとにおける同じ階級同士の度数の差分絶対値を算出し、それぞれの階級の差分絶対値を加算する。

このようにして、対象物位置特定システム２０では、入力された画像（図３（ａ））全体の領域を分割した全ての位置特定分割領域に対する簡易的な判別を繰り返すことによって、それぞれの位置特定分割領域の中で、画像全体のヒストグラムとの類似度が最も高い位置特定分割領域を、シーン認識の処理によって判別した「犬」が対象物として写っている位置特定分割領域として簡易的に特定することができる。そして、対象物位置特定システム２０では、簡易的に特定した位置特定分割領域の位置を、シーン認識の処理において判別した対象物が写っている位置特定分割領域の位置として、類似度を表す情報を出力することができる。

本実施形態によれば、対象物位置特定システム２０に、ヒストグラム生成部（ヒストグラム生成部２３０）が生成した、画像の全体を表すヒストグラムを保存するヒストグラム保存部（ヒストグラム保存部２８０）、をさらに備え、位置特定制御部（位置特定制御部２６０）は、位置特定の処理において、ＳＶＭ演算部（ＳＶＭ演算部２４０）に、位置特定分割領域を表すヒストグラムのそれぞれと、ヒストグラム保存部２８０に保存された画像の全体を表すヒストグラムとを比較するＳＶＭ演算を実行させる、対象物位置特定システム（対象物位置特定システム２０）が構成される。

上記に述べたように、本第２の実施形態の対象物位置特定システム２０では、第１の実施形態の対象物位置特定システム１０と同様に、シーン認識の処理において量子化ベクトル生成部１２０が生成したそれぞれのシーン認識分割領域の量子化ベクトルの値を、量子化ベクトル保存部１７０に保存する。これにより、本第２の実施形態の対象物位置特定システム２０における対象物の位置特定の処理では、第１の実施形態の対象物位置特定システム１０と同様に、量子化ベクトル保存部１７０に保存したそれぞれのシーン認識分割領域の量子化ベクトルの値を用いて、少ない処理で位置特定分割領域毎の位置特定ヒストグラムを生成することができる。

また、本第２の実施形態の対象物位置特定システム２０では、シーン認識の処理においてヒストグラム生成部２３０が生成した画像全体のヒストグラムを、ヒストグラム保存部２８０に保存する。そして、本第２の実施形態の対象物位置特定システム２０における対象物の位置特定の処理では、シーン認識の処理において判別した、類似度が最も高かった対象物のカテゴリのそれぞれの教師データのヒストグラムの代わりに、ヒストグラム保存部２８０に保存した画像全体のヒストグラムを用いて簡易ＳＶＭ演算を行う。これにより、本第２の実施形態の対象物位置特定システム２０では、対象物が写っている画像内の位置を特定するために行う、ヒストグラム生成部２３０が生成した位置特定分割領域毎の位置特定ヒストグラムに対するＳＶＭ演算を、簡易的に行うことができる。つまり、本第２の実施形態の対象物位置特定システム２０における対象物の位置特定の処理では、１つの位置特定ヒストグラムに対すＳＶＭ演算を、類似度が最も高かった対象物のカテゴリに含まれる大量の教師データを用いて行うのではなく、ヒストグラム保存部２８０に保存した１つのヒストグラムのみを用いて行うことができる。このことにより、本第２の実施形態の対象物位置特定システム２０では、詳細なＳＶＭ演算を行う必要がある位置特定分割領域を絞り込むことができ、対象物が写っている画像内の位置を特定するために要する演算時間を、第１の実施形態の対象物位置特定システム１０よりもさらに短縮することができる。

なお、本第２の実施形態の対象物位置特定システム２０でも、第１の実施形態の対象物位置特定システム１０と同様に、ＳＶＭ演算部２４０が、対象物のカテゴリ毎の類似度を表す情報や、判別した対象物が写っている位置特定分割領域の位置を特定する情報を出力する構成について説明したが、第１の実施形態の対象物位置特定システム１０と同様に、ＳＶＭ演算部２４０以外の構成要素が出力する構成にすることもできる。例えば、位置特定制御部２６０に備えた位置特定ＳＶＭ演算判定部２６２が、ＳＶＭ演算部２４０が行ったぞれぞれの位置特定分割領域に対する簡易ＳＶＭ演算の結果から得られる対象物のカテゴリとの類似度を表す情報に基づいて、判別した対象物が写っている位置特定分割領域の位置を特定する情報を出力する構成にすることもできる。

なお、本第２の実施形態の対象物位置特定システム２０では、画像全体のヒストグラムを保存する構成、つまり、ヒストグラム保存部２８０を備えることによって、ＳＶＭ演算部２４０が行うＳＶＭ演算を簡易的にし、対象物が写っている画像内の位置を特定するために要する演算時間を短縮する構成について説明した。しかし、画像全体のヒストグラムを保存する構成を備えない場合でも、対象物が写っている画像内の位置を特定するためにＳＶＭ演算部２４０が行うＳＶＭ演算を簡易的にすることができる。

＜第３の実施形態＞
次に、本発明の第３の実施形態について説明する。図９は、本第３の実施形態による対象物位置特定システムの概略構成を示したブロック図である。図９において、対象物位置特定システム３０は、局所特徴ベクトル生成部１１０と、量子化ベクトル生成部１２０と、ヒストグラム生成部１３０と、ＳＶＭ演算部１４０と、教師データ群１５０と、位置特定制御部３６０と、量子化ベクトル保存部１７０と、教師データ切り替え部３９０と、を備えている。

なお、図９に示した対象物位置特定システム３０は、図１に示した第１の実施形態の対象物位置特定システム１０に備えた位置特定制御部１６０が位置特定制御部３６０に代わり、さらに、教師データ切り替え部３９０を備えた構成である。また、対象物位置特定システム３０に備えたその他の構成要素は、図１に示した第１の実施形態の対象物位置特定システム１０に備えた構成要素と同じ構成要素である。従って、本第３の実施形態の対象物位置特定システム３０の説明においては、第１の実施形態の対象物位置特定システム１０に備えた構成要素と異なる構成要素および動作のみを説明し、第１の実施形態の対象物位置特定システム１０と同様の構成要素および動作に関する詳細な説明は省略する。

対象物位置特定システム３０は、第１の実施形態の対象物位置特定システム１０と同様に、入力された画像に対して、画像に写っている被写体（対象物）や画像が撮影されたシーンを認識するシーン認識の処理を行い、様々な対象物の種類毎に分類されたそれぞれの教師データとの類似度の情報を、シーン認識の処理によって判別した情報として出力する。また、対象物位置特定システム３０は、第１の実施形態の対象物位置特定システム１０と同様に、シーン認識の処理を行った画像内で、判別した対象物が写っている位置を特定する位置特定の処理を行い、特定した対象物が写っている位置を表す情報を出力する。

局所特徴ベクトル生成部１１０は、位置特定制御部３６０からの制御に応じて、対象物位置特定システム３０に入力された画像の局所特徴ベクトルをシーン認識分割領域毎に生成し、生成したそれぞれのシーン認識分割領域の局所特徴ベクトルの値を、量子化ベクトル生成部１２０に出力する。

量子化ベクトル生成部１２０は、位置特定制御部３６０からの制御に応じて、局所特徴ベクトル生成部１１０から入力されたそれぞれのシーン認識分割領域の局所特徴ベクトルの値を量子化したシーン認識分割領域毎の量子化ベクトルを生成し、生成したそれぞれのシーン認識分割領域の量子化ベクトルの値を、ヒストグラム生成部１３０に出力すると共に、量子化ベクトル保存部１７０に保存させる。

ヒストグラム生成部１３０は、位置特定制御部３６０からの制御に応じたシーン認識の処理において、量子化ベクトル生成部１２０から入力されたそれぞれのシーン認識分割領域毎の量子化ベクトルの値に基づいた画像全体を表すヒストグラムを生成し、生成した画像全体のヒストグラムを、ＳＶＭ演算部２４０に出力する。また、ヒストグラム生成部１３０は、位置特定制御部３６０からの制御に応じた対象物の位置特定の処理において、量子化ベクトル保存部１７０に保存されているそれぞれのシーン認識分割領域毎の量子化ベクトルの値に基づいた位置特定分割領域毎の位置特定ヒストグラムを生成し、生成した位置特定分割領域毎の位置特定ヒストグラムのそれぞれを、ＳＶＭ演算部２４０に出力する。

ＳＶＭ演算部１４０は、位置特定制御部３６０からの制御に応じたシーン認識の処理において、ヒストグラム生成部１３０から入力された画像全体のヒストグラムと、教師データ群１５０に含まれるそれぞれの教師データのヒストグラムとを比較するＳＶＭ演算を行い、教師データ群１５０において分類された対象物のカテゴリ毎に類似度を算出する。ただし、対象物位置特定システム３０では、ＳＶＭ演算部１４０が画像全体のヒストグラムと比較するそれぞれの教師データが、教師データ切り替え部３９０を介して入力される。

また、ＳＶＭ演算部１４０は、位置特定制御部３６０からの制御に応じた対象物の位置特定の処理において、ヒストグラム生成部１３０から入力されたそれぞれの位置特定ヒストグラムと、教師データ群１５０に含まれるそれぞれの教師データのヒストグラムとを比較するＳＶＭ演算を行い、それぞれの位置特定分割領域毎に、教師データ群１５０において分類された対象物のカテゴリとの類似度を算出する。ただし、対象物位置特定システム３０では、ＳＶＭ演算部１４０がそれぞれの位置特定ヒストグラムと比較するそれぞれの教師データも、教師データ切り替え部３９０を介して入力される。なお、対象物位置特定システム３０では、第２の実施形態の対象物位置特定システム２０と同様に、まず、それぞれの位置特定ヒストグラムに対するＳＶＭ演算を簡易的に行い、全ての位置特定ヒストグラムに対する簡易ＳＶＭ演算が完了した後に、最も類似度が最も高かった位置特定ヒストグラムに対してさらにＳＶＭ演算を行って、教師データ群１５０において分類された対象物のカテゴリとの類似度を算出する。以下の説明においては、対象物位置特定システム３０における簡易的なＳＶＭ演算も、「簡易ＳＶＭ演算」という。

教師データ切り替え部３９０は、位置特定制御部３６０からの制御に応じて、ＳＶＭ演算部１４０に入力するそれぞれの教師データを切り替える。より具体的には、ＳＶＭ演算部１４０が、ヒストグラム生成部１３０から入力されたそれぞれの位置特定ヒストグラムに対する簡易ＳＶＭ演算を行う際にＳＶＭ演算部１４０に入力する教師データのヒストグラムを、予め定めた条件に応じて選択された教師データのヒストグラムのみとする。また、ＳＶＭ演算部１４０が、全ての位置特定分割領域の位置特定ヒストグラムに対する簡易ＳＶＭ演算が完了した後、さらにＳＶＭ演算を行う際にＳＶＭ演算部１４０に入力する教師データのヒストグラムを、シーン認識の処理において判別した、類似度が最も高かった対象物のカテゴリの全ての教師データのヒストグラムとする。

なお、ＳＶＭ演算部１４０が簡易ＳＶＭ演算を行う際に入力する教師データのヒストグラムは、対象物のカテゴリを代表する教師データのヒストグラムであり、例えば、対象物の正面が写った画像、対象物の側面が写った画像など、ＳＶＭ演算によって同じカテゴリの対象物を簡易的に判別することができる予め定めた条件によって選択された教師データのヒストグラムである。より具体的には、教師データ群１５０に含まれる１つのカテゴリの教師データとして１５００個のヒストグラムがある場合、上述したような条件によって、例えば、この１５００個のヒストグラムの内、１０個のヒストグラムを選択する。以下の説明においては、選択された対象物のカテゴリを代表する教師データを、「抽出教師データ」という。

位置特定制御部３６０は、対象物位置特定システム３０の全体、すなわち、対象物位置特定システム３０に備えた局所特徴ベクトル生成部１１０、量子化ベクトル生成部１２０、ヒストグラム生成部１３０、ＳＶＭ演算部１４０、および教師データ切り替え部３９０のそれぞれの動作を制御する。位置特定制御部３６０は、ヒストグラム生成分割領域指定部１６１と、位置特定ＳＶＭ演算判定部３６２と、を備えている。

なお、位置特定制御部３６０は、図６に示した第１の実施形態の対象物位置特定システム１０に備えた位置特定制御部２６０内の位置特定ＳＶＭ演算判定部２６２が、位置特定ＳＶＭ演算判定部３６２に代わった構成である。なお、位置特定制御部３６０に備えたヒストグラム生成分割領域指定部１６１は、第１の実施形態の対象物位置特定システム１０に備えた位置特定制御部１６０内のヒストグラム生成分割領域指定部１６１および第２の実施形態の対象物位置特定システム２０に備えた位置特定制御部２６０内のヒストグラム生成分割領域指定部１６１と同じ動作をする。従って、ヒストグラム生成分割領域指定部１６１の動作に関する詳細な説明は省略する。

位置特定ＳＶＭ演算判定部３６２は、対象物位置特定システム３０における対象物の位置特定の処理において、ＳＶＭ演算部１４０が、ヒストグラム生成部１３０から入力されたそれぞれの位置特定ヒストグラムに対するＳＶＭ演算を行う際のヒストグラムを、教師データ群１５０に含まれるそれぞれの教師データのヒストグラム、または予め定めた条件に応じて選択された抽出教師データのヒストグラムのいずれか一方を選択する。これにより、教師データ切り替え部３９０は、対象物位置特定システム３０における対象物の位置特定の処理において、教師データ群１５０に含まれる同じカテゴリの対象物の全ての教師データのヒストグラム、または予め定めた条件に応じて選択された教師データ群１５０内の一部の教師データのヒストグラムのいずれか一方を、ＳＶＭ演算部１４０に出力する。より具体的には、位置特定ＳＶＭ演算判定部３６２は、ＳＶＭ演算部１４０が、ヒストグラム生成部１３０から入力されたそれぞれの位置特定ヒストグラムに対する簡易ＳＶＭ演算を行う際に、それぞれの位置特定ヒストグラムと比較するヒストグラムを、シーン認識の処理において判別した、類似度が最も高かった対象物のカテゴリを代表する一部の教師データのヒストグラムとするように、教師データ切り替え部３９０を制御する。また、位置特定ＳＶＭ演算判定部３６２は、ＳＶＭ演算部１４０が、全ての位置特定分割領域の位置特定ヒストグラムに対する簡易ＳＶＭ演算が完了した後、ＳＶＭ演算部１４０がさらに、ＳＶＭ演算を行う際に、簡易ＳＶＭ演算において比較した教師データと最も類似度が高かった位置特定ヒストグラムと比較するヒストグラムを、シーン認識の処理において判別した、類似度が最も高かった対象物のカテゴリの全ての教師データのヒストグラムとするように、教師データ切り替え部３９０を制御する。

このような構成よって、対象物位置特定システム３０では、第１の実施形態の対象物位置特定システム１０と同様に、シーン認識の処理において量子化ベクトル生成部１２０が生成したそれぞれのシーン認識分割領域の量子化ベクトルの値を用いて、対象物の位置特定の処理を行う際の位置特定分割領域毎の位置特定ヒストグラムを生成する。さらに、対象物位置特定システム３０では、対象物の位置特定の処理において、ＳＶＭ演算を行う際に用いる教師データのヒストグラムを、抽出教師データまたは全ての教師データのいずれか一方を選択し、選択した教師データムを用いて、対象物の位置特定の処理を行う。より具体的には、対象物位置特定システム３０による対象物の位置特定の処理において、ヒストグラム生成部１３０が生成した位置特定分割領域毎の位置特定ヒストグラムに対するＳＶＭ演算において比較する、シーン認識の処理において判別した、類似度が最も高かった対象物のカテゴリの全ての教師データのヒストグラム（例えば、１つのカテゴリに含まれる１５００個のヒストグラム）の代わりに、予め定めた条件に応じて選択した抽出教師データのヒストグラムを用いる。つまり、対象物位置特定システム３０による対象物の位置特定の処理では、ＳＶＭ演算を行う際に用いる大量の教師データの代わりに、シーン認識の処理において判別した、類似度が最も高かった対象物のカテゴリを代表する抽出教師データのヒストグラムを使用して、シーン認識の処理において判別した対象物が写っている位置特定分割領域の位置を、簡易的に特定することができる。これにより、対象物位置特定システム３０では、対象物のカテゴリを代表する抽出教師データのヒストグラムとの類似度が最も高い位置特定ヒストグラムを特定するためにＳＶＭ演算部１４０によって行う、ヒストグラム生成部１３０が生成した位置特定分割領域毎の位置特定ヒストグラムに対するＳＶＭ演算に要する時間を短縮することができる。

次に、対象物位置特定システム３０の動作について説明する。図１０は、本第３の実施形態の対象物位置特定システム３０における処理手順を示したフローチャートである。また、図１１は、本第３の実施形態の対象物位置特定システム３０において対象物の位置を特定する処理の一例を説明する図である。図１０に示した対象物位置特定システム３０における処理のフローチャートの説明においては、適宜、図３〜図５に示した第１の実施形態の対象物位置特定システム１０におけるそれぞれの処理の一例、および図１１に示した対象物位置特定システム３０において対象物の位置を特定する処理の一例を参照する。そして、対象物位置特定システム３０における処理においても、第１の実施形態の対象物位置特定システム１０と同様に、画像に写っている対象物が「犬」である場合において、画像全体の領域を９つの位置特定分割領域に分割して、対象物である「犬」が写っている位置特定分割領域を特定する場合の例を説明する。

なお、対象物位置特定システム３０の処理には、第１の実施形態の対象物位置特定システム１０の処理と同じ処理が含まれている。このため、図１０に示した本第３の実施形態の対象物位置特定システム３０における処理手順を示したフローチャートには、第１の実施形態の対象物位置特定システム１０の処理と同じ処理を行う手順に、図２に示した本第１の実施形態の対象物位置特定システム１０における処理手順を示したフローチャートに付与したステップ番号と同一のステップ番号を付与している。従って、図１０に示した対象物位置特定システム３０における処理のフローチャートの説明においては、第１の実施形態の対象物位置特定システム１０の処理と同じ処理を行う手順に関する詳細な説明は省略する。

対象物位置特定システム３０に画像が入力されると、位置特定制御部３６０は、第１の実施形態の対象物位置特定システム１０に備えた位置特定制御部１６０と同様に、まず、入力された画像に対するシーン認識の処理を行い、その後、対象物の位置特定の処理を行うように、対象物位置特定システム３０に備えたそれぞれの構成要素の動作を制御する（図３参照）。

対象物位置特定システム３０におけるシーン認識の処理では、まず、ステップＳ１００〜ステップＳ１１５において、位置特定制御部３６０は、局所特徴ベクトル生成部１１０に、入力された画像（図３（ａ）参照）のそれぞれのシーン認識分割領域毎の局所特徴ベクトルを生成させ、量子化ベクトル生成部１２０に、それぞれのシーン認識分割領域毎の量子化ベクトルを生成させて、生成した量子化ベクトルの値をそれぞれのシーン認識分割領域に量子化ベクトル保存部１７０に保存させる。

続いて、ステップＳ１２０〜ステップＳ１３０において、位置特定制御部３６０は、ヒストグラム生成部１３０に、それぞれのシーン認識分割領域毎の量子化ベクトルの値から入力された画像（図３（ａ）参照）の全体を表すヒストグラムを生成させ、ＳＶＭ演算部１４０に、生成した画像（図３（ａ）参照）全体のヒストグラムに対するＳＶＭ演算を実行させる。これにより、対象物位置特定システム３０は、入力された画像（図３（ａ）参照）に「犬」が写っていると判別することができ、それぞれの対象物のカテゴリ毎の類似度を表す情報を出力する（図４参照）。

そして、ステップＳ１００〜ステップＳ１３０までのシーン認識の処理が完了すると、対象物位置特定システム３０は、ステップＳ４００から、シーン認識の処理を行った画像内で、判別した対象物が写っている位置を特定する位置特定の処理を開始する。対象物位置特定システム３０における対象物の位置特定の処理では、第１の実施形態の対象物位置特定システム１０および第２の実施形態の対象物位置特定システム２０と同様に、まず、シーン認識の処理において量子化ベクトル生成部１２０が量子化ベクトル保存部１７０に保存したそれぞれのシーン認識分割領域の量子化ベクトルの値を用いて、位置特定ヒストグラムを生成する。その後、対象物位置特定システム３０における対象物の位置特定の処理では、生成した位置特定ヒストグラムに対する簡易ＳＶＭ演算を、抽出教師データのヒストグラムを用いて、位置特定分割領域毎に行う。そして、対象物位置特定システム３０における対象物の位置特定の処理では、最後に、第２の実施形態の対象物位置特定システム２０と同様に、簡易ＳＶＭ演算によって簡易的に判別した、シーン認識の処理において判別した対象物が写っている位置特定分割領域を表す位置特定ヒストグラムに対するＳＶＭ演算を行う。

まず、ステップＳ４００〜ステップＳ４１０において、位置特定制御部３６０は、第１の実施形態の対象物位置特定システム１０におけるステップＳ２００〜ステップＳ２１０と同様に、ヒストグラム生成部１３０に、１つ目の位置特定分割領域を指定し、指定した１つ目の位置特定分割領域に対応する量子化ベクトルの値を量子化ベクトル保存部１７０から取得させ、１つ目の位置特定分割領域を表す位置特定ヒストグラムを生成させる。

続いて、ステップＳ４２０において、位置特定制御部３６０は、ＳＶＭ演算部１４０に、ヒストグラム生成部１３０が生成した１つ目の位置特定分割領域を表す位置特定ヒストグラムと、抽出教師データのヒストグラムとの類似度を算出する簡易ＳＶＭ演算を実行させる。これにより、対象物位置特定システム３０は、１つ目の位置特定分割領域内に、シーン認識の処理において類似度が最も高かった対象物（図３に示した処理の一例では「犬」）が写っているか否かを、簡易的に判別することができる。

続いて、ステップＳ４３０において、位置特定制御部３６０は、入力された画像全体の領域を分割した全ての位置特定分割領域に対する簡易的な判別が終了したか否かを判定する。ステップＳ４３０による判定の結果、分割した全ての位置特定分割領域に対する簡易的な判別が終了していない場合には、ステップＳ４００に戻って、次の位置特定分割領域を指定し、分割した全ての位置特定分割領域に対する簡易的な判別が終了するまで、ステップＳ４００〜ステップＳ４２０までの簡易的な判別の処理を繰り返す。ステップＳ４３０による判定の結果、分割した全ての位置特定分割領域に対する簡易的な判別が終了した場合には、対象物位置特定システム３０における簡易的な判別の処理を終了し、ステップＳ４４０に進む。

ここで、対象物位置特定システム３０によって行われる、ステップＳ４００〜ステップＳ４２０までの簡易的な判別の処理について説明する。図１１は、本第３の実施形態の対象物位置特定システム３０において対象物の位置を簡易的に特定する処理の考え方を説明する図である。

対象物位置特定システム３０における対象物の位置特定の処理では、まず、位置特定制御部３６０が、ステップＳ４００およびステップＳ４１０において、第１の実施形態の対象物位置特定システム１０におけるステップＳ２００およびステップＳ２１０と同様に、入力された画像（図３（ａ）参照）全体の領域を分割した９つの位置特定分割領域（図３（ｂ）参照）の内、１つ目の位置特定分割領域Ａ１を指定する。これにより、ヒストグラム生成部１３０は、位置特定制御部３６０によって指定された１つ目の位置特定分割領域Ａ１に対応する量子化ベクトルの値を量子化ベクトル保存部１７０から取得し（図５（ａ−１）参照）、１つ目の位置特定分割領域Ａ１を表す位置特定ヒストグラムを生成し（図５（ａ−２）参照）、生成した１つ目の位置特定分割領域Ａ１を表す位置特定ヒストグラムを、ＳＶＭ演算部１４０に出力する。

その後、ステップＳ４２０において、ＳＶＭ演算部１４０が、位置特定制御部３６０からの制御に応じて、ヒストグラム生成部１３０が生成した１つ目の位置特定分割領域Ａ１を表す位置特定ヒストグラムと、教師データ切り替え部３９０を介して入力されたそれぞれの抽出教師データのヒストグラムとの類似度を算出する簡易ＳＶＭ演算を行う。そして、ＳＶＭ演算部１４０は、位置特定分割領域Ａ１に対して算出した簡易ＳＶＭ演算の結果に基づいて得られる、「犬」であるカテゴリとの類似度を表す情報を、位置特定分割領域Ａ１内に「犬」が写っているか否かを簡易的に判別する情報として出力する。

なお、ＳＶＭ演算部１４０による簡易ＳＶＭ演算においても、シーン認識の処理におけるＳＶＭ演算部１４０によるＳＶＭ演算と同様に、ヒストグラム生成部１３０が生成した１つ目の位置特定分割領域Ａ１を表す位置特定ヒストグラムと、それぞれの抽出教師データのヒストグラムとのそれぞれが表す領域の大きさが同等になるように正規化した後に、それぞれのヒストグラムにおける同じ階級同士の度数の差分絶対値を加算する。これにより、ＳＶＭ演算部１４０は、１つ目の位置特定分割領域Ａ１内に、シーン認識の処理において類似度が最も高かった「犬」が写っているか否かを、簡易的に判別することができる、それぞれの抽出教師データのヒストグラムと１つ目の位置特定分割領域Ａ１を表す位置特定ヒストグラムとの類似度を表す情報を出力する。なお、ＳＶＭ演算部１４０による簡易ＳＶＭ演算においても、算出した差分絶対値の加算結果の値が最も小さい位置特定分割領域を、対象物である「犬」が写っている位置特定分割領域であると判別し、その位置特定分割領域の位置を特定する情報を出力する。

また、ＳＶＭ演算部１４０は、位置特定制御部３６０から指定された１つ目の位置特定分割領域Ａ１を表す位置特定ヒストグラムに対する簡易ＳＶＭ演算が完了したとき、１つ目の位置特定分割領域Ａ１を表す位置特定ヒストグラムに対する簡易ＳＶＭ演算が完了したことを位置特定制御部３６０に通知する。この通知に応じて、位置特定制御部３６０は、ステップＳ４３０の判定を行い、ステップＳ４００に戻って、２つ目の位置特定分割領域Ａ２を指定する。

そして、ヒストグラム生成部１３０は、位置特定制御部３６０によって指定された２つ目の位置特定分割領域Ａ２に対応する量子化ベクトルの値を量子化ベクトル保存部１７０から取得し（図５（ｂ−１）参照）、２つ目の位置特定分割領域Ａ２を表す位置特定ヒストグラムを生成し（図５（ｂ−２）参照）、生成した２つ目の位置特定分割領域Ａ２を表す位置特定ヒストグラムを、ＳＶＭ演算部１４０に出力する。

その後、ステップＳ４２０において、ＳＶＭ演算部１４０が、位置特定制御部３６０からの制御に応じて、ヒストグラム生成部１３０が生成した２つ目の位置特定分割領域Ａ２を表す位置特定ヒストグラムと、教師データ切り替え部３９０を介して入力されたそれぞれの抽出教師データのヒストグラムとの類似度を算出する簡易ＳＶＭ演算を行う。そして、ＳＶＭ演算部１４０は、位置特定分割領域Ａ２に対して算出した簡易ＳＶＭ演算の結果に基づいて得られる、「犬」であるカテゴリとの類似度を表す情報を、位置特定分割領域Ａ２内に「犬」が写っているか否かを簡易的に判別する情報として出力する。

以降、同様に、位置特定制御部３６０が、入力された画像（図３（ａ）参照）全体の領域を分割した９つの位置特定分割領域（図３（ｂ）参照）を順次指定し、ヒストグラム生成部１３０が、位置特定制御部３６０によって指定されたそれぞれの位置特定分割領域を表す位置特定ヒストグラムを順次生成してＳＶＭ演算部１４０に出力する。また、同様に、ＳＶＭ演算部１４０が、ヒストグラム生成部１３０が生成したそれぞれの位置特定分割領域を表す位置特定ヒストグラムと、教師データ切り替え部３９０を介して入力されたそれぞれの抽出教師データのヒストグラムとの類似度を算出する簡易ＳＶＭ演算を行う。そして、ＳＶＭ演算部１４０は、それぞれの位置特定分割領域に対して算出した簡易ＳＶＭ演算の結果に基づいて得られる、それぞれの位置特定分割領域内に「犬」が写っているか否かを簡易的に判別する情報を出力する。図１１には、ＳＶＭ演算部１４０が、対象物が「犬」であるカテゴリに含まれる１５００個のヒストグラムの内、１０個のヒストグラムが選択された抽出教師データのヒストグラムのそれぞれと、ヒストグラム生成部１３０が生成した位置特定ヒストグラムのそれぞれとを比較する簡易ＳＶＭ演算を実行している状態の一例を示している。

また、ＳＶＭ演算部１４０は、それぞれの位置特定分割領域における「犬」であるカテゴリとの類似度を表す情報に基づいて、類似度が最も大きい位置特定分割領域を、対象物である「犬」が写っている位置特定分割領域であると判別し、その位置特定分割領域を特定する情報を出力する。

ここまでの処理が、対象物位置特定システム３０による対象物の位置特定の処理における、シーン認識の処理において判別した対象物が写っている位置特定分割領域の簡易的な判別の処理である。

続いて、位置特定制御部３６０は、ステップＳ４３０において全ての位置特定分割領域に対する簡易的な判別が終了した場合、ＳＶＭ演算部１４０に、シーン認識の処理において類似度が最も高かった対象物（図３に示した処理の一例では「犬」）が写っていると簡易的に判別した位置特定分割領域に対するＳＶＭ演算を実行させる。より具体的には、ステップＳ４４０において、位置特定制御部３６０は、ＳＶＭ演算部１４０に、シーン認識の処理において類似度が最も高かった「犬」が写っていると簡易的に判別した位置特定分割領域を表す位置特定ヒストグラムと、教師データ群１５０に含まれる、シーン認識の処理において判別した、類似度が最も高かった対象物のカテゴリのそれぞれの教師データのヒストグラムとの類似度を算出するＳＶＭ演算を実行させる。そして、対象物位置特定システム３０が、ＳＶＭ演算の結果に基づいて得られる、「犬」であるカテゴリとの類似度を表す情報を出力し、対象物位置特定システム３０における処理を完了する。

なお、ＳＶＭ演算部１４０によるステップＳ４３０におけるＳＶＭ演算においても、シーン認識の処理におけるＳＶＭ演算部１４０によるＳＶＭ演算と同様に、簡易的に判別した位置特定分割領域を表す位置特定ヒストグラムとそれぞれの教師データのヒストグラムとにおける同じ階級同士の度数の差分絶対値を加算する。

このようにして、対象物位置特定システム３０でも、入力された画像（図３（ａ））全体の領域を分割した全ての位置特定分割領域に対する簡易的な判別を繰り返すことによって、それぞれの位置特定分割領域の中で、抽出教師データのヒストグラムとの類似度が最も高い位置特定分割領域を、シーン認識の処理によって判別した「犬」が対象物として写っている位置特定分割領域として簡易的に特定することができる。そして、対象物位置特定システム３０では、簡易的に特定した位置特定分割領域の位置を、シーン認識の処理において判別した対象物が写っている位置特定分割領域の位置として、類似度を表す情報を出力することができる。

本実施形態によれば、位置特定制御部（位置特定制御部３６０）は、位置特定の処理において、ＳＶＭ演算部１４０に、位置特定分割領域を表すヒストグラムのそれぞれと、複数の教師データの内、予め定めた条件に応じて選択した一部の教師データ（抽出教師データ）のヒストグラムのそれぞれとを比較するＳＶＭ演算を実行させる、対象物位置特定システム（対象物位置特定システム３０）が構成される。

上記に述べたように、本第３の実施形態の対象物位置特定システム３０でも、第１の実施形態の対象物位置特定システム１０と同様に、シーン認識の処理において量子化ベクトル生成部１２０が生成したそれぞれのシーン認識分割領域の量子化ベクトルの値を、量子化ベクトル保存部１７０に保存する。これにより、本第３の実施形態の対象物位置特定システム３０における対象物の位置特定の処理でも、第１の実施形態の対象物位置特定システム１０と同様に、量子化ベクトル保存部１７０に保存したそれぞれのシーン認識分割領域の量子化ベクトルの値を用いて、少ない処理で位置特定分割領域毎の位置特定ヒストグラムを生成することができる。

また、本第３の実施形態の対象物位置特定システム３０では、対象物の位置特定の処理において、シーン認識の処理において判別した、類似度が最も高かった対象物のカテゴリの全ての教師データのヒストグラムの代わりに、この対象物のカテゴリを代表する抽出教師データのヒストグラムを用いて簡易ＳＶＭ演算を行う。これにより、本第３の実施形態の対象物位置特定システム３０では、対象物が写っている画像内の位置を特定するために行う、ヒストグラム生成部１３０が生成した位置特定分割領域毎の位置特定ヒストグラムに対するＳＶＭ演算を、簡易的に行うことができる。つまり、本第３の実施形態の対象物位置特定システム３０における対象物の位置特定の処理では、１つの位置特定ヒストグラムに対すＳＶＭ演算を、類似度が最も高かった対象物のカテゴリに含まれる大量の教師データを用いて行うのではなく、同じ対象物のカテゴリに含まれる教師データから予め定めた条件に応じて選択した一部の教師データのヒストグラムを用いて行うことができる。このことにより、本第３の実施形態の対象物位置特定システム３０では、詳細なＳＶＭ演算を行う必要がある位置特定分割領域を絞り込むことができ、対象物が写っている画像内の位置を特定するために要する演算時間を、第１の実施形態の対象物位置特定システム１０よりもさらに短縮することができる。

なお、本第３の実施形態の対象物位置特定システム３０でも、第１の実施形態の対象物位置特定システム１０と同様に、ＳＶＭ演算部１４０が、対象物のカテゴリ毎の類似度を表す情報や、判別した対象物が写っている位置特定分割領域の位置を特定する情報を出力する構成について説明したが、第１の実施形態の対象物位置特定システム１０と同様に、ＳＶＭ演算部１４０以外の構成要素が出力する構成にすることもできる。例えば、位置特定制御部３６０に備えた位置特定ＳＶＭ演算判定部３６２が、ＳＶＭ演算部１４０が行ったぞれぞれの位置特定分割領域に対する簡易ＳＶＭ演算の結果から得られる対象物のカテゴリとの類似度を表す情報に基づいて、判別した対象物が写っている位置特定分割領域の位置を特定する情報を出力する構成にすることもできる。

なお、本第３の実施形態の対象物位置特定システム３０では、教師データ切り替え部３９０を備え、位置特定制御部３６０が教師データ切り替え部３９０を制御することによって、対象物の位置特定の処理においてＳＶＭ演算部１４０がそれぞれの位置特定ヒストグラムに対して行う簡易ＳＶＭ演算に用いる教師データのヒストグラムを、抽出教師データまたは全ての教師データのいずれか一方に切り替える構成について説明した。しかし、ＳＶＭ演算部１４０が簡易ＳＶＭ演算を行う際に用いる教師データのヒストグラムを切り替える方法は、教師データ切り替え部３９０による方法に限定されるものではない。例えば、それぞれの教師データに、対象物のカテゴリを代表する教師データ、すなわち、抽出教師データとして選択されているか否かを表すフラグなどの情報を含ませる。そして、位置特定制御部３６０が、ＳＶＭ演算部１４０が簡易ＳＶＭ演算を行う際に用いる教師データとして、抽出教師データとして選択されていることを表すフラグが含まれている教師データを使用するのか、または抽出教師データとして選択されていないことを表すフラグが含まれている教師データを使用するのかを指定する構成にする。この構成によっても、ＳＶＭ演算部１４０がそれぞれの位置特定ヒストグラムに対して行う簡易ＳＶＭ演算に用いる教師データのヒストグラムを切り替えることができる。この構成であれば、位置特定制御部３６０が直接、ＳＶＭ演算部１４０に、簡易ＳＶＭ演算を行う際に用いる教師データを指示することができ、対象物位置特定システム３０に教師データ切り替え部３９０を備えなくてもよい。

なお、第２の実施形態の対象物位置特定システム２０では、シーン認識の処理においてヒストグラム生成部２３０が生成した画像全体のヒストグラムを保存するヒストグラム保存部２８０を備え、シーン認識の処理によって判別した対象物が写っている画像内の位置を簡易的に特定するために、保存した画像全体のヒストグラムを用いる動作を示した。また、本第３の実施形態の対象物位置特定システム３０では、簡易ＳＶＭ演算の処理で用いる教師データを切り替える教師データ切り替え部３９０を備え、シーン認識の処理によって判別した対象物が写っている画像内の位置を簡易的に特定するために、シーン認識の処理において類似度が最も高かった対象物のカテゴリを代表する抽出教師データのヒストグラムを用いる動作を示した。しかし、シーン認識の処理によって判別した対象物が写っている画像内の位置を簡易的に特定するための構成は、第２の実施形態や本第３の実施形態の構成に限定されるものではない。例えば、シーン認識の処理によって判別した対象物が写っている画像内の位置を簡易的に特定するための構成として、第２の実施形態において示した対象物位置特定システム２０の構成と、第３の実施形態において示した対象物位置特定システム３０の構成とを、同時に備えた構成にすることもできる。この場合、例えば、シーン認識の処理によって判別した、教師データと対象物との類似度の大きさによって、対象物が写っている画像内の位置を簡易的に特定する方法を、第２の実施形態の対象物位置特定システム２０の動作、または本第３の実施形態の対象物位置特定システム３０のいずれか一方の動作に切り替えることができる。

＜第４の実施形態＞
ここで、第２の実施形態の対象物位置特定システム２０の構成と、第３の実施形態の対象物位置特定システム３０の構成とを同時に備えた、本発明の第４の実施形態について説明する。図１２は、本第４の実施形態による対象物位置特定システムの概略構成を示したブロック図である。図１２において、対象物位置特定システム４０は、局所特徴ベクトル生成部１１０と、量子化ベクトル生成部１２０と、ヒストグラム生成部２３０と、ＳＶＭ演算部１４０と、教師データ群１５０と、位置特定制御部４６０と、量子化ベクトル保存部１７０と、ヒストグラム保存部２８０と、教師データ切り替え部４９０と、を備えている。

なお、図１２に示した対象物位置特定システム４０は、図６に示した第２の実施形態の対象物位置特定システム２０の構成要素と、図９に示した第３の実施形態の対象物位置特定システム３０の構成要素とを合わせた構成である。従って、本第４の実施形態の対象物位置特定システム４０の説明においては、第２の実施形態の対象物位置特定システム２０の構成要素、および第３の実施形態の対象物位置特定システム３０の構成要素と異なる構成要素および動作のみを説明する。

教師データ切り替え部４９０は、位置特定制御部４６０からの制御に応じて、ＳＶＭ演算部１４０に入力するヒストグラムを切り替える。より具体的には、ＳＶＭ演算部１４０が、ヒストグラム生成部２３０から入力されたそれぞれの位置特定ヒストグラムに対する簡易ＳＶＭ演算を行う際に入力するヒストグラムを、教師データ群１５０に含まれるそれぞれの教師データのヒストグラム、ヒストグラム保存部２８０に保存されている画像全体のヒストグラム、または予め定めた条件に応じて選択された抽出教師データのヒストグラムのいずれか一つのヒストグラムとする。

位置特定制御部４６０は、対象物位置特定システム４０の全体、すなわち、対象物位置特定システム４０に備えた局所特徴ベクトル生成部１１０、量子化ベクトル生成部１２０、ヒストグラム生成部２３０、ＳＶＭ演算部１４０、および教師データ切り替え部４９０のそれぞれの動作を制御する。位置特定制御部４６０は、ヒストグラム生成分割領域指定部１６１と、位置特定ＳＶＭ演算判定部４６２と、を備えている。

位置特定ＳＶＭ演算判定部４６２は、対象物位置特定システム４０における対象物の位置特定の処理において、教師データ切り替え部４９０を制御することによって、ＳＶＭ演算部１４０が、ヒストグラム生成部２３０から入力されたそれぞれの位置特定ヒストグラムに対するＳＶＭ演算を行う際のヒストグラムを切り替える。なお、位置特定ＳＶＭ演算判定部４６２がＳＶＭ演算部１４０に入力するヒストグラムを切り替える際の動作は、第２の実施形態の対象物位置特定システム２０に備えた位置特定制御部２６０内の位置特定ＳＶＭ演算判定部２６２と、第３の実施形態の対象物位置特定システム３０に備えた位置特定制御部３６０内の位置特定ＳＶＭ演算判定部３６２とを合わせた動作として容易に理解することができるため、詳細な説明は省略する。

このような構成よって、対象物位置特定システム４０では、位置特定制御部４６０による制御によって、第２の実施形態の対象物位置特定システム２０または第３の実施形態の対象物位置特定システム３０のいずれか一方と同様の動作をすることができる。なお、対象物位置特定システム４０の動作は、図７に示した第２の実施形態の対象物位置特定システム２０、または図１０に示した第３の実施形態の対象物位置特定システム３０の動作と同様であるため、詳細な説明は省略する。

本実施形態によれば、対象物位置特定システム４０に、ヒストグラム生成部２３０が生成した、画像の全体を表すヒストグラムを保存するヒストグラム保存部２８０と、ヒストグラム保存部２８０に保存された画像の全体を表すヒストグラム、または複数の教師データの内、予め定めた条件に応じて選択した抽出教師データのヒストグラムのいずれか一方を選択して出力する教師データ切り替え部（教師データ切り替え部４９０）と、をさらに備え、位置特定制御部（位置特定制御部４６０）は、位置特定の処理において、ＳＶＭ演算部１４０に、位置特定分割領域を表すヒストグラムのそれぞれと、教師データ切り替え部を制御することによってこの教師データ切り替え部４９０から出力されたヒストグラム（ヒストグラム保存部２８０に保存された画像の全体を表すヒストグラム、または抽出教師データのヒストグラム）とを比較するＳＶＭ演算を実行させる、（対象物位置特定システム４０）が構成される。

上記に述べたように、本第４の実施形態の対象物位置特定システム４０でも、第１の実施形態の対象物位置特定システム１０と同様に、量子化ベクトル保存部１７０に保存したそれぞれのシーン認識分割領域の量子化ベクトルの値を用いて、少ない処理で位置特定分割領域毎の位置特定ヒストグラムを生成することができる。

また、本第４の実施形態の対象物位置特定システム４０では、第２の実施形態の対象物位置特定システム２０または第３の実施形態の対象物位置特定システム３０のいずれか一方と同様の方法で、対象物が写っている画像内の位置を特定するために行う、ヒストグラム生成部２３０が生成した位置特定分割領域毎の位置特定ヒストグラムに対するＳＶＭ演算を、簡易的に行うことができる。このことにより、本第４の実施形態の対象物位置特定システム４０でも、第２の実施形態の対象物位置特定システム２０または第３の実施形態の対象物位置特定システム３０と同様に、詳細なＳＶＭ演算を行う必要がある位置特定分割領域を絞り込むことができ、対象物が写っている画像内の位置を特定するために要する演算時間を、第１の実施形態の対象物位置特定システム１０よりもさらに短縮することができる。

なお、対象物が写っている画像内の位置を特定するために行う簡易ＳＶＭ演算を、第２の実施形態の対象物位置特定システム２０の動作または第３の実施形態の対象物位置特定システム３０の動作のいずれの動作で行うかは、例えば、シーン認識の処理によって判別した、教師データと対象物との類似度の大きさによって切り替えることが考えられる。より具体的には、シーン認識の処理において判別した対象物のカテゴリとの類似度が８０パーセント以上のときには、第２の実施形態の対象物位置特定システム２０の動作で簡易ＳＶＭ演算を行い、シーン認識の処理において判別した対象物のカテゴリとの類似度が６０パーセント以上、８０パーセント未満のときには、第３の実施形態の対象物位置特定システム３０の動作で簡易ＳＶＭ演算を行うようにすることができる。また、シーン認識の処理において判別した対象物のカテゴリとの類似度が６０パーセント未満のときには簡易ＳＶＭ演算を行わず、第１の実施形態の対象物位置特定システム１０の動作で、通常のＳＶＭ演算を行うようにすることができる。

上記に述べたように、本発明を実施するための形態によれば、シーン認識の処理において量子化ベクトル生成部が生成したそれぞれのシーン認識分割領域の量子化ベクトルの値を保存する量子化ベクトル保存部を備える。また、本発明を実施するための形態では、量子化ベクトル保存部に保存したそれぞれのシーン認識分割領域の量子化ベクトルの値を用いて、シーン認識の処理によって判別した対象物が写っている画像内の位置を特定するために用いる、予め定めた大きさの位置特定分割領域毎の位置特定ヒストグラムを生成する。これにより、本発明を実施するための形態では、入力された画像に対してシーン認識の処理を行った後に、対象物が写っている画像内の位置を特定するために行う、それぞれの位置特定分割領域に対する対象物の位置特定の処理を、シーン認識の処理と同等の処理を再度行うよりも少ない処理で行うことができる。このことにより、本発明を実施するための形態では、対象物が写っている画像内の位置を特定するために要する演算時間を短縮することができる。

また、本発明を実施するための形態によれば、シーン認識の処理においてヒストグラム生成部が生成した画像全体のヒストグラム、またはシーン認識の処理において類似度が最も高かった対象物のカテゴリを代表する一部の教師データのヒストグラムを用いてＳＶＭ演算を行う。これにより、本発明を実施するための形態では、それぞれの位置特定分割領域毎の位置特定ヒストグラムに対するＳＶＭ演算を簡易的に行うことができ、シーン認識の処理によって判別した対象物が写っている画像内の位置を簡易的に特定することができる。つまり、本発明を実施するための形態では、シーン認識の処理によって判別した対象物が写っている画像内の位置を特定するために、それぞれの位置特定分割領域に対して行うＳＶＭ演算の処理を、シーン認識の処理において類似度が最も高かった対象物のカテゴリに含まれる大量の教師データのヒストグラムを用いて行うのではなく、少ない数のヒストグラムを用いて簡易的に行うことができる。このことにより、本発明を実施するための形態では、対象物が写っている画像内の位置を特定するために要する演算時間を短縮することができる。

なお、本実施形態においては、１つの位置特定分割領域に対する一連の処理（すなわち、位置特定ヒストグラムの生成とＳＶＭ演算との処理）が完了した後に、処理が完了したことを表す通知に応じて、次の一連の処理を実行する動作の場合について説明した。しかし、それぞれの位置特定分割領域に対する一連の処理の動作は、本発明を実施するための形態で説明した動作に限定されるものではない。例えば、１つ目の位置特定分割領域を表す位置特定ヒストグラムの生成が完了した後、１つ目の位置特定分割領域に対するＳＶＭ演算と同時期に、２つ目の位置特定分割領域を表す位置特定ヒストグラムの生成を行うように制御することもできる。つまり、例えば、１つ目の位置特定分割領域に対するＳＶＭ演算と、２つ目の置特定分割領域に対するヒストグラムの生成とを並列に実行するように制御してもよい。

また、本実施形態においては、入力された画像を８１個のシーン認識分割領域に分割し、９つの位置特定分割領域に分割した場合の例で説明したが、入力された画像を分割するシーン認識分割領域および位置特定分割領域の数は、本発明を実施するための形態で説明した数に限定されるものではない。

以上、本発明の実施形態について、図面を参照して説明してきたが、具体的な構成はこの実施形態に限定されるものではなく、本発明の趣旨を逸脱しない範囲においての種々の変更も含まれる。

１０，２０，３０，４０・・・対象物位置特定システム
１１０・・・局所特徴ベクトル生成部
１２０・・・量子化ベクトル生成部
１３０，２３０・・・ヒストグラム生成部
１４０，２４０・・・ＳＶＭ演算部
１５０・・・教師データ群
１６０，２６０，３６０，４６０・・・位置特定制御部
１６１・・・ヒストグラム生成分割領域指定部（位置特定制御部）
１７０・・・量子化ベクトル保存部
２６２，３６２，４６２・・・位置特定ＳＶＭ演算判定部（位置特定制御部）
２８０・・・ヒストグラム保存部
３９０，４９０・・・教師データ切り替え部

Claims

入力された画像の全体の領域を、予め定めた第１の大きさの複数の第１の領域に分割し、該分割した前記第１の領域毎に、該第１の領域に含まれる画像データにおける局所的な特徴を表す局所特徴ベクトルを生成する局所特徴ベクトル生成部と、
前記局所特徴ベクトル生成部が生成した、それぞれの前記第１の領域の前記局所特徴ベクトルの値を量子化し、それぞれの前記第１の領域に対応する量子化ベクトルを生成する量子化ベクトル生成部と、
前記量子化ベクトル生成部が生成したそれぞれの前記量子化ベクトルの値を、前記第１の領域毎に保存する量子化ベクトル保存部と、
前記第１の領域毎のそれぞれの前記量子化ベクトルの値から、前記画像の全体または一部の領域を表すヒストグラムを生成するヒストグラム生成部と、
前記ヒストグラム生成部が生成した前記ヒストグラムに対するサポートベクタマシン（ＳＶＭ）演算を行うＳＶＭ演算部と、
前記局所特徴ベクトル生成部と、前記量子化ベクトル生成部と、前記ヒストグラム生成部と、前記ＳＶＭ演算部とのそれぞれを制御し、対象物が写されている前記画像のシーンを認識するシーン認識の処理を実行させた後に、該シーン認識の処理において判別した対象物が、前記画像の全体の領域を前記第１の領域よりも大きな予め定めた第２の大きさに分割した複数の第２の領域のいずれの位置に写されているかを特定するための位置特定の処理を実行させる位置特定制御部と、
を備え、
前記位置特定制御部は、
前記シーン認識の処理において、
前記ヒストグラム生成部に、それぞれの前記第１の領域毎の前記量子化ベクトルの値から、前記画像の全体を表すヒストグラムを生成させ、前記ＳＶＭ演算部に、前記画像の全体を表すヒストグラムと、複数の画像のヒストグラムが対象物の種類毎に分類してまとめられた複数の教師データのヒストグラムのそれぞれとを比較するＳＶＭ演算を実行させ、
前記位置特定の処理において、
前記ヒストグラム生成部に、前記量子化ベクトル保存部に保存された前記第１の領域毎のそれぞれの前記量子化ベクトルの値から、それぞれの前記第２の領域の画像を表すヒストグラムを生成させ、前記ＳＶＭ演算部に、前記第２の領域を表すヒストグラムのそれぞれに対するＳＶＭ演算を実行させる、
ことを特徴とする対象物位置特定システム。
前記ヒストグラム生成部が生成した、前記画像の全体を表すヒストグラムを保存するヒストグラム保存部、
をさらに備え、
前記位置特定制御部は、
前記位置特定の処理において、
前記ＳＶＭ演算部に、前記第２の領域を表すヒストグラムのそれぞれと、前記ヒストグラム保存部に保存された前記画像の全体を表すヒストグラムとを比較するＳＶＭ演算を実行させる、
ことを特徴とする請求項１に記載の対象物位置特定システム。
前記位置特定制御部は、
前記位置特定の処理において、
前記ＳＶＭ演算部に、前記第２の領域を表すヒストグラムのそれぞれと、複数の前記教師データの内、予め定めた条件に応じて選択した一部の前記教師データのヒストグラムのそれぞれとを比較するＳＶＭ演算を実行させる、
ことを特徴とする請求項１または請求項２に記載の対象物位置特定システム。
前記ヒストグラム生成部が生成した、前記画像の全体を表すヒストグラムを保存するヒストグラム保存部と、
前記ヒストグラム保存部に保存された前記画像の全体を表すヒストグラム、または複数の前記教師データの内、予め定めた条件に応じて選択した一部の前記教師データのヒストグラムのいずれか一方を選択して出力する教師データ切り替え部と、
をさらに備え、
前記位置特定制御部は、
前記位置特定の処理において、
前記ＳＶＭ演算部に、前記第２の領域を表すヒストグラムのそれぞれと、前記教師データ切り替え部を制御することによって該教師データ切り替え部から出力されたヒストグラムとを比較するＳＶＭ演算を実行させる、
ことを特徴とする請求項１から請求項３のいずれか１の項に記載の対象物位置特定システム。
入力された画像の全体の領域を、予め定めた第１の大きさの複数の第１の領域に分割し、該分割した前記第１の領域毎に、該第１の領域に含まれる画像データにおける局所的な特徴を表す局所特徴ベクトルを生成する局所特徴ベクトル生成部と、前記局所特徴ベクトル生成部が生成した、それぞれの前記第１の領域の前記局所特徴ベクトルの値を量子化し、それぞれの前記第１の領域に対応する量子化ベクトルを生成する量子化ベクトル生成部と、前記量子化ベクトル生成部が生成したそれぞれの前記量子化ベクトルの値を、前記第１の領域毎に保存する量子化ベクトル保存部と、前記第１の領域毎のそれぞれの前記量子化ベクトルの値から、前記画像の全体または一部の領域を表すヒストグラムを生成するヒストグラム生成部と、前記ヒストグラム生成部が生成した前記ヒストグラムに対するサポートベクタマシン（ＳＶＭ）演算を行うＳＶＭ演算部と、前記局所特徴ベクトル生成部と、前記量子化ベクトル生成部と、前記ヒストグラム生成部と、前記ＳＶＭ演算部とのそれぞれを制御し、対象物が写されている前記画像のシーンを認識するシーン認識の処理を実行させた後に、該シーン認識の処理において判別した対象物が、前記画像の全体の領域を前記第１の領域よりも大きな予め定めた第２の大きさに分割した複数の第２の領域のいずれの位置に写されているかを特定するための位置特定の処理を実行させる位置特定制御部と、を備えた対象物位置特定システムにおいて、
前記位置特定制御部が、
前記シーン認識の処理において、
前記ヒストグラム生成部に、それぞれの前記第１の領域毎の前記量子化ベクトルの値から、前記画像の全体を表すヒストグラムを生成させる手順と、前記ＳＶＭ演算部に、前記画像の全体を表すヒストグラムと、複数の画像のヒストグラムが対象物の種類毎に分類してまとめられた複数の教師データのヒストグラムのそれぞれとを比較するＳＶＭ演算を実行させる手順と、
を含み、
前記位置特定の処理において、
前記ヒストグラム生成部に、前記量子化ベクトル保存部に保存された前記第１の領域毎のそれぞれの前記量子化ベクトルの値から、それぞれの前記第２の領域の画像を表すヒストグラムを生成させる手順と、前記ＳＶＭ演算部に、前記第２の領域を表すヒストグラムのそれぞれに対するＳＶＭ演算を実行させる手順と、
を含む、
ことを特徴とする対象物位置特定方法。