JP6659120B2

JP6659120B2 - 情報処理装置、情報処理方法、およびプログラム

Info

Publication number: JP6659120B2
Application number: JP2015218444A
Authority: JP
Inventors: 裕一郎飯尾; 奥野　泰弘; 泰弘奥野
Original assignee: Canon Inc
Current assignee: Canon Inc
Priority date: 2015-11-06
Filing date: 2015-11-06
Publication date: 2020-03-04
Anticipated expiration: 2035-11-06
Also published as: JP2017091083A

Description

本発明は、情報処理装置、情報処理方法、およびプログラムに関し、特に、アンサンブル識別器を作成するために用いて好適なものである。

機械学習を利用した物体認識の分野で多く用いられる手法として、アンサンブル識別器を用いた認識手法がある。アンサンブル識別器を用いた認識手法は、精度の低い識別器（弱識別器）を複数組み合わせることによって教師付き学習の精度を向上させる手法である。アンサンブル識別器を用いた認識を行う方式として、BaggingやRandomized Treesといった方式がある。

基本的に、アンサンブル識別器を構成する弱識別器の個数が多いほど、アンサンブル識別器の性能が向上する。一方、アンサンブル識別器を構成する弱識別器の個数が同一である場合でも、アンサンブル識別器を構成する複数の弱識別器の組み合わせによって、アンサンブル識別器の性能が変動する。従って、適切な弱識別器の組み合わせでアンサンブル識別器を構成することで、より高性能なアンサンブル識別器を作成することが望まれる。

アンサンブル識別器を作成する手法として、作成したアンサンブル識別器を、予めラベルづけされたサンプルデータに基づいて評価し、その評価の結果が所定の条件を満たすまでアンサンブル識別器の学習を繰り返す手法がある。ここで、アンサンブル識別器の評価に用いるサンプルデータとして、ラベルが付与されたデータを用いる技術がある。ラベルは、教師データやGround Truth等とも呼ばれ、識別器における識別結果の正しい内容（正解）を示す情報である。例えば、サンプルデータにおける識別対象が属するクラスを示すクラス情報がラベルとして付与される。この種の技術として、特許文献１には、AdaBoostを用いたアンサンブル識別器の学習についての技術が開示されている。特許文献１では、まず、学習した弱識別器から合成対象となる複数の弱識別器を選択する。次に、選択した複数の弱識別器を合成したアンサンブル識別器を、ラベルが付与されたサンプル画像を入力として評価する。以上のアンサンブル識別器を構成する弱識別器の選択と、アンサンプル識別器の評価とを、アンサンブル識別器の識別精度が閾値以上となるまで繰り返す。

特許第５１２３７５９号公報

Gall, J., "Hough forests for object detection，tracking，and action recognition", IEEE Transactions on Pattern Analysis and Machine Intelligence, vol. 33,no. 11, pp. 2188-2202, 2011．

特許文献１では、学習に用いるデータの一部をサンプルデータとして、アンサンブル識別器の評価に利用する。識別器の学習に用いるデータは、学習の精度を高めるために識別対象の物体が単独で含まれているものが望ましいとされている。一方で、サンプルデータは、識別時に識別器に入力される未知のデータに対する汎化性能を確認するために用いることが目的である。このため、サンプルデータは、複数の物体が雑多に含まれているような、実際に識別時に識別器に入力されるデータであることが望ましい。そのため、学習に用いるデータをサンプルデータとして利用するよりも、識別時に用いられるデータと同種のデータ（例えば、実撮影画像データ）のセットをサンプルデータとして別途用意した方が、より有効に識別器を評価することができる。これにより、アンサンブル識別器の高性能化が見込める。

しかし、識別時に用いられるデータと同種のデータには、必ずしも、ラベルを付与することができるとは限らない。識別時に用いられるデータと同種のデータにラベルを付与するためには、例えば、人間がサンプルデータごとに、当該サンプルデータにおける識別対象の有無や当該サンプルデータにおける識別対象が属するクラス等を判定する必要がある。そして、当該サンプルデータに、判定した結果を示す情報をラベルとして設定する必要がある。しかし、サンプルデータのセットの総数が膨大である場合には、人力で全てのサンプルデータにクラス情報等を付与することは容易ではない。

例えば、非特許文献１で用いられているHough Forestでは、画像上の部分領域を入力データとする。そして、弱識別器は、入力データが、識別対象を含むときには、識別対象の物体の重心位置へのオフセットを出力する。一方、入力データが、識別対象を含まないときには、弱識別器は、ネガティブサンプルであると判定する。即ち、Hough Forestにおいては、サンプルデータにクラス情報等を付与するためには、以下のようにする必要がある。まず、サンプルデータの全ての部分領域に対して、それぞれの部分領域が識別対象の物体を含むかどうかを判定する。そして、識別対象の物体を含む場合には、識別対象の物体の重心位置へのオフセットを算出する。しかし、全てのサンプルデータのセットに対してこの作業を人力で行うことは現実的ではない。

従って、ラベルが付与されたサンプルデータを用意することが容易でない場合には、特許文献１の方式では、作成したアンサンブル識別器の性能を評価することが容易ではない。
本発明は、このような問題点に鑑みてなされたものであり、ラベルが付与されたサンプルデータを用いなくても、複数の弱識別器から識別対象の識別に有用な弱識別器の組み合わせを選択できるようにすることを目的とする。

本発明の情報処理装置は、アンサンブル識別器を構成する複数の弱識別器を選択するための処理を行う情報処理装置であって、前記アンサンブル識別器を構成する弱識別器の候補を入力する入力手段と、前記入力手段により入力された候補のうち、少なくとも２つの前記弱識別器に対して同じデータを与え、当該弱識別器のそれぞれにおいて当該データに対する識別処理を行う際に得られる情報を比較し、比較した結果に基づいて、当該少なくとも２つの弱識別器間の識別結果の多様性を表す指標を導出することを、前記少なくとも２つの弱識別器の複数の組み合わせのそれぞれについて行う導出手段と、前記導出手段により導出された、前記少なくとも２つの前記弱識別器間の識別結果の多様性を表す指標に基づいて、前記アンサンブル識別器を構成する前記複数の弱識別器の数の候補のそれぞれについて、前記複数の弱識別器の組み合わせを選択する処理手段と、を有することを特徴とする。

本発明によれば、ラベルが付与されたサンプルデータを用いなくても、複数の弱識別器から識別対象の識別に有用な弱識別器の組み合わせを選択することができる。

情報処理装置の構成を示す図である。弱識別器多様性指標算出処理の第１の例を示すフローチャートである。識別結果ばらつき度の算出過程の第１の例を示す図である。識別結果ばらつき度の算出過程の第２の例を示す図である。識別結果ばらつき度の算出過程の第３の例を示す図である。識別結果ばらつき度の算出過程の第４の例を示す図である。識別結果ばらつき度の算出過程の第５の例を示す図である。弱識別器組み合わせ選択部の処理を示すフローチャートである。弱識別器間多様性指標を示す図である。弱識別器組み合わせ選択部の処理を説明する図である。決定木による識別の流れを示す図である。弱識別器多様性指標算出処理の第２の例を示すフローチャートである。類結果ばらつき度を算出する過程を示す図である。アンサンブル識別器構築システムの構成を示す図である。アンサンブル識別器構築システムの処理を示すフローチャートである。

以下、図面を参照しながら、第１の実施形態を説明する。
（第１の実施形態）
まず、第１の実施形態について説明する。
アンサンブル識別器は、複数の弱識別器を組み合わせて高精度な識別を行う識別器である。しかし、弱識別器の数に比例してアンサンブル識別器の容量は増大する。このため、実行環境の都合でアンサンブル識別器の容量に制限がある場合には、予めアンサンブル識別器を構成する弱識別器の数を制限してアンサンブル識別器の作成を行う必要がある。

一方、高い汎化性能を持つアンサンブル識別器を構築するためには、個々の弱識別器の多様性が重要である。そこで、複数の弱識別器の組み合わせでアンサンブル識別器を作成する場合には、より多数の弱識別器を作成し、それらの弱識別器の中から多様性の大きい弱識別器の組み合わせを選択してアンサンブル識別器の作成を行うのが好ましい。より高性能なアンサンブル識別器を作成することができるからである。

本実施形態の目的は、所定の数の弱識別器群からなるアンサンブル識別器を作成するに際し、クラス情報等のラベルを持たないサンプルデータを用いて、予め用意された多数の弱識別器集合から適切な弱識別器の組み合わせを選択することである。本実施形態では、このようなサンプルデータを入力としたときの各弱識別器の識別結果のばらつき度を用いて、弱識別器間の識別結果の多様性を表す指標を導出する。そして、このような指標を用いて、アンサンブル識別器を構成するための弱識別器群の組み合わせを選択することにより、高性能なアンサンブル識別器を作成する。また、本実施形態では、取り扱うデータが画像データである場合を例に挙げて説明する。更に、本実施形態では、識別器が、入力されるデータに含まれる識別対象が属するクラスを識別する場合を例に挙げて説明する。

図１は、本実施形態における情報処理装置１００の構成の一例を示す図である。本実施形態における情報処理装置１００は、弱識別器間多様性指標算出部１１０と、弱識別器組み合わせ選択部１２０と、アンサンブル識別器生成部１３０とを有する。情報処理装置１００は、例えば、ＣＰＵ、ＲＯＭ、ＲＡＭ、ＨＤＤ、および各種のインターフェースを備える装置や専用のハードウェアを用いることにより実現される。

弱識別器間多様性指標算出部１１０は、弱識別器集合１１とサンプルデータ群１２を入力として、弱識別器間の識別結果の多様性を表す指標を算出する。以下の説明では、弱識別器間の識別結果の多様性を表す指標を、必要に応じて、弱識別器間多様性指標と称する。
弱識別器組み合わせ選択部１２０は、弱識別器間多様性指標算出部１１０によって算出された弱識別器間多様性指標に基づいて所定の数の弱識別器を選択する。所定の数は、アンサンブル識別器を構成する弱識別器の数である。
アンサンブル識別器生成部１３０は、弱識別器組み合わせ選択部１２０で選択された弱識別器を用いてアンサンブル識別器を生成する。
以下に、情報処理装置１００の動作の一例について詳細に説明する。

本実施形態においては、予め学習された複数の弱識別器から構成される弱識別器集合１１と、複数のサンプルデータから構成されるサンプルデータ群１２とが事前データとして用意される。
本実施形態のアンサンブル識別器における弱識別器は、ランダムに解を出力する識別器よりは高精度な識別を行う識別器であって、識別対象のクラス情報が付与された学習データを用いて学習が行われる識別器である。本実施形態では、弱識別器の学習は事前に行われているものとする。ただし、情報処理装置１００は、学習データ群を入力し、弱識別器間多様性指標算出部１１０による処理が実行される前に、当該学習データ群を用いて弱識別器の学習を行ってもよい。弱識別器の学習方法は、例えば、Adaboostを用いた公知の方法により実現することができるので、ここでは、その詳細な説明を省略する。

サンプルデータは、学習データとは異なり、実際に識別時に識別器に入力される画像に類する画像である。実際に識別時に識別器に入力される画像に類する画像とは、ラベル（本実施形態ではクラス情報）が付与されていない画像をいう。
また、本実施形態では、アンサンブル識別器（アンサンブル識別器を構成する弱識別器の数と同数の弱識別器の組み合わせ）の候補を、サンプルデータを用いて評価し、その結果に基づいて最終的なアンサンブル識別器を作成する。このようにすることによって、より高性能なアンサンブル識別器を作成することができる。特徴的な一部のサンプルデータの影響を小さくし、識別器に対する評価の信頼性を増すために、サンプルデータは大量に用意されることが望ましい。

次に、図２のフローチャートを参照しながら、弱識別器間多様性指標算出部１１０の処理の一例を説明する。
ステップＳ２０１では、弱識別器間多様性指標算出部１１０は、サンプルデータ群１２から未選択のサンプルデータを１つ選択する。
次に、ステップＳ２０２では、弱識別器間多様性指標算出部１１０は、予め用意された弱識別器集合１１に属する全ての弱識別器に、ステップＳ２０１で選択されたサンプルデータを入力する。そして、それらの弱識別器のそれぞれにおいて、当該サンプルデータが属するクラスの識別を行う。弱識別器間多様性指標算出部１１０は、そのサンプルデータの識別結果を取得する。この処理によって各弱識別器はそれぞれが独立に、選択されたサンプルデータの識別結果を出力する。

次に、ステップＳ２０３では、弱識別器間多様性指標算出部１１０は、ステップＳ２０２で算出された、各弱識別器におけるサンプルデータの識別結果に基づき、２つの弱識別器からなる弱識別器ペアの識別結果ばらつき度を算出する。ここで、識別結果ばらつき度とは、２つの弱識別器の識別結果が異なる度合いを表す指標である。図３Ａ〜図３Ｅに識別結果ばらつき度の算出方式について複数の事例を示す。

図３Ａは、弱識別器が単一のクラス情報を識別結果として出力する場合の識別結果ばらつき度の算出過程の一例を示す模式図である。この場合、識別結果ばらつき度は二値で表現することができる。即ち、図３Ａ（ａ）に示すように、サンプルデータｉが入力されたときの弱識別器Ａと弱識別器Ｂの識別結果が一致しているときには、弱識別器間多様性指標算出部１１０は、識別結果バラつき度として０（ゼロ）を導出する。一方、図３Ａ（ｂ）に示すように、サンプルデータｉが入力されたときの弱識別器Ａと弱識別器Ｂの識別結果が一致していないときには、弱識別器間多様性指標算出部１１０は、識別ばらつき度として「１」を導出する。

図３Ｂは、弱識別器が複数のクラス情報を識別結果として出力する場合の識別結果ばらつき度の算出過程の一例を表す模式図である。この場合、識別結果を集合、クラス情報を集合の要素とみなす。弱識別器間多様性指標算出部１１０は、集合間の類似度である集合間類似度を算出し、１から当該算出した集合間類似度を減算した値（＝１−集合間類似度）を識別結果ばらつき度として導出する。集合間類似度を表す手法として、例えば、ジャッカード係数またはダイス係数を用いて表す手法がある。ジャッカード係数は、集合Ｘと集合Ｙの共通要素数を、集合Ｘと集合Ｙの少なくとも一方にある要素の総数で割った値である。ダイス係数は、集合Ｘと集合Ｙの共通要素数を、各集合Ｘ、Ｙの要素数の平均で割った値である。即ち、集合Ｘと集合Ｙのジャッカード係数Ｊ、ダイス係数Ｄは、それぞれ、以下の（１）式、（２）式で表される。

図３Ｂに示す事例では、サンプルデータｉが入力された時に弱識別器Ａは、サンプルデータｉが属するクラスが、クラスＰ、クラスＱ、クラスＲの何れかであると識別する。一方、弱識別器Ｂは、サンプルデータｉが属するクラスが、クラスＰ、クラスＲ、クラスＳ、クラスＴの何れかであると識別する。従って、弱識別器Ａの識別結果と弱識別器Ｂの識別結果の共通要素は、クラスＰとクラスＲである。一方、弱識別器Ａの識別結果と弱識別器Ｂの識別結果の少なくとも一方にある要素は、クラスＰ、クラスＱ、クラスＲ、クラスＳ、クラスＴである。

以上より、集合間類似度としてジャッカード係数Ｊを用いる場合、弱識別器Ａと弱識別器Ｂの集合間類似度は、（１）式より０．４（＝２／５）になる。よって、集合間類似度としてジャッカード係数Ｊを用いる場合、弱識別器間多様性指標算出部１１０は、弱識別器Ａと弱識別器Ｂの識別結果ばらつき度として、０．６（＝１−０．４）を導出する。一方、集合間類似度としてダイス係数Ｄを用いる場合、弱識別器Ａと弱識別器Ｂの集合間類似度は、（２）式より０．５７（＝２／３．５）になる。よって、集合間類似度としてダイス係数Ｄを用いる場合、弱識別器間多様性指標算出部１１０は、弱識別器Ａと弱識別器Ｂの識別結果ばらつき度として、０．４３（１−０．５７）を導出する。

図３Ｃは、弱識別器が各クラスの出現尤度を識別結果として出力する場合の識別結果ばらつき度の算出過程の一例を表す模式図である。この場合、識別結果ばらつき度は、各クラスを要素とする尤度ヒストグラムの差Ｈで定義することができる。即ち、識別結果ばらつき度は、以下の（３）式で表される。

図３Ｃに示す事例では、サンプルデータｉが入力された時に、弱識別器Ａは、クラスＰの出現頻度が０．５、クラスＱの出現頻度が０．２５、クラスＲの出現頻度が０．２５であると識別する。一方、弱識別器Ｂは、クラスＰの出現頻度が０．２、クラスＲの出現頻度が０．６、クラスＴの出現頻度が０．２であると識別する。従って、クラスＰの尤度差の絶対値、クラスＱの尤度差の絶対値、クラスＲの尤度差の絶対値、クラスＴの尤度差の絶対値は、それぞれ、０．３（＝０．５−０．２）、０．２５、０．３５（＝０．６−０．２５）、０．２になる。よって、弱識別器間多様性指標算出部１１０は、（３）式より、弱識別器Ａと弱識別器Ｂの識別結果ばらつき度として、０．５５（＝（０．３＋０．２５＋０．３５＋０．２）／２）を導出する。

図２の説明に戻り、ステップＳ２０４では、弱識別器間多様性指標算出部１１０は、識別結果ばらつき度の算出を行っていない弱識別器ペアが存在するか否かを判定する。この判定の結果、識別結果ばらつき度の算出を行っていない弱識別器ペアが存在する場合には、ステップＳ２０３に戻り、弱識別器間多様性指標算出部１１０は、その弱識別器ペアの識別結果ばらつき度を算出する。ステップＳ２０３とステップＳ２０４を繰り返すことで、弱識別器集合１１の全ての弱識別器ペアについて、ステップＳ２０１で選択されたサンプルデータに対する識別結果ばらつき度が算出される。

次に、ステップＳ２０５では、弱識別器間多様性指標算出部１１０は、サンプルデータ群１２の中に未選択のサンプルデータが存在するか否かを判定する。この判定の結果、未選択のサンプルデータが存在する場合には、ステップＳ２０１に戻り、弱識別器間多様性指標算出部１１０は、そのサンプルデータを選択する。ステップＳ２０１からステップＳ２０５のループを繰り返すことで、サンプルデータ群１２の全てのサンプルデータに対して、弱識別器ペアの識別結果ばらつき度が算出される。

次に、ステップＳ２０６では、弱識別器間多様性指標算出部１１０は、ステップＳ２０１からステップＳ２０５のループで算出された各弱識別器ペアの全サンプルデータにおける識別結果ばらつき度の平均値を算出する。そして、弱識別器間多様性指標算出部１１０は、その各弱識別器ペアの全サンプルデータにおける識別結果ばらつき度の平均値を各弱識別器ペアの多様性指標として設定する。

以上の処理により、弱識別器間多様性指標算出部１１０は、弱識別器間の識別結果の多様性を表す指標を設定する。尚、本実施形態の弱識別器間多様性指標算出部１１０では、「サンプルデータの識別結果のばらつき度」を基準として弱識別器ペアの多様性指標を算出していればよい。従って、弱識別器ペアの多様性指標の算出方法や、識別結果ばらつき度の定義は、前述したものに限定されない。

ここで、弱識別器間多様性指標算出部１１０の処理の変形例を説明する。Hough Forestのように、画像の部分領域を入力として、識別対象の物体の重心への投票を行うことで、識別対象の物体を検出する方式における弱識別器多様性指標算出処理について、図３Ｄおよび図３Ｅに示す例を用いて説明する。図３Ｄ、Ｅは、各弱識別器が出力する識別結果が識別対象の物体の重心へのオフセットである場合の識別結果ばらつき度の算出過程の第１、第２の例を示す模式図である。ここでは、サンプル画像ｉが入力されたときに、弱識別器Ａは、識別結果として３つの識別対象の物体の重心へのオフセットを出力し、弱識別器Ｂは、識別結果として５つの識別対象の物体の重心へのオフセットを出力するものとする。

この事例における多様性指標算出処理では、図２に示すステップＳ２０１で選択されるデータはサンプルデータの部分領域になる。サンプルデータ群１２における全てのサンプルデータの全ての部分領域が、ステップＳ２０１からステップＳ２０５のループで評価されることになる。

また、識別結果ばらつき度は、例えば、弱識別器ごとの識別結果であるオフセット位置のばらつきで表現できる。オフセット位置のばらつきを指標化する方法の一例としては、サンプルデータの全領域を同一サイズの領域に分割し、各領域への投票が行われる頻度に応じて、識別対象の物体の重心の領域の尤度を設定する方法がある。具体的には、まず、弱識別器間多様性指標算出部１１０は、入力された部分領域を含むサンプルデータの全領域を同一サイズの領域に分割する。図３Ｄおよび図３Ｅに示す例では、サンプルデータｉが２４の領域に均等に分割される。次に、弱識別器間多様性指標算出部１１０は、各弱識別器における識別結果のオフセット位置が含まれる領域を調べ、識別対象の物体の重心が位置する領域の尤度を算出する。以下の説明では、識別対象の物体の重心が位置する領域の尤度を、必要に応じて、投票先領域尤度と称する。

投票先領域尤度は、例えば、識別結果であるオフセット位置の総数に対する、各領域に含まれるオフセット位置の割合で表すことができる。図３Ｄに示す例では、弱識別器Ａにおいて、領域４に１票、領域１８に１票、領域２３に１票で計３票投票されている。従って、領域４、領域１８、領域２３の投票先領域尤度は、それぞれ０．３３となる。一方、図３Ｅに示す例では、弱識別器Ｂにおいて、領域１０に１票、領域１４に１票、領域１８に２票、領域２３に１票で計５票投票されている。従って、領域１０、領域１４、領域２３の投票先領域尤度は、それぞれ０．２となり、領域１８の投票先領域尤度は、０．４となる。

弱識別器間多様性指標算出部１１０は、以上のようにして各弱識別器の投票先領域尤度を算出する。そして、弱識別器間多様性指標算出部１１０は、投票先領域尤度に基づいて、例えば、図３Ｃを参照しながら説明した尤度ヒストグラムの差Ｈを算出することで弱識別器Ａと弱識別器Ｂの識別結果ばらつき度を算出する（（３）式を参照）。弱識別器間多様性指標算出部１１０は、全てのサンプルデータの全ての部分領域について識別結果ばらつき度を算出し、それらの平均値を弱識別器Ａと弱識別器Ｂの弱識別器間多様性指標とする。

尚、弱識別器による識別の結果、サンプルデータの部分領域が、識別対象の物体が存在しない領域である（Hough Forestでは、入力データがネガティブサンプルである）と判定される場合がある。識別対象の物体が存在しないと判定された領域は、弱識別器による識別処理の際に、識別対象の物体の重心の検出に寄与しない領域である。そのため、ステップＳ２０３における識別結果ばらつき度の算出において、入力されたサンプルデータの部分領域に、識別対象の物体が存在しないことが何れかの弱識別器で判定された場合、弱識別器間多様性指標算出部１１０は、次のようにする。即ち、弱識別器間多様性指標算出部１１０は、この部分領域における当該弱識別器を含む弱識別器ペアの識別結果ばらつき度を算出せず、識別器間の多様性指標の算出の集計（前述した例では、識別結果ばらつき度の平均値の算出対象）から除外する。このようにすることで、識別器間の多様性指標（弱識別器間多様性指標）の算出をより適切に行うことができる。

次に、図４に示すフローチャートおよび図５Ａおよび図５Ｂに示す模式図を用いて、弱識別器組み合わせ選択部１２０の処理の一例を詳細に説明する。
弱識別器集合１１の要素数がＭであるとすると、弱識別器ペアのそれぞれに対し１つずつ弱識別器間多様性指標が算出されるので、弱識別器間多様性指標算出部１１０によって算出される弱識別器間多様性指標の総数は、以下の（４）式で表わされる。

例えば、Ｍ＝５であるときには、１０個の弱識別器ペアの弱識別器間多様性指標が算出される。図５Ａは、Ｍ＝５のときの弱識別器間多様性指標の一例を示す図である。図５Ａにおいて、各行と各列の交点の数値が各弱識別器ペアの弱識別器間多様性指標を表す。例えば、ＩＤ２の弱識別器とＩＤが４の弱識別器の弱識別器間多様性指標は０．７４９となる。弱識別器組み合わせ選択部１２０は、弱識別器間多様性指標に基づきＭ個の弱識別器集合からＬ個の弱識別器を選択する。

ステップＳ４０１では、弱識別器組み合わせ選択部１２０は、Ｍ個の弱識別器集合からＬ個を選択するＣｏｍｂ（Ｍ，Ｌ）通りの組み合わせパターンの中から、後述する総和値の算出を行っていない組み合わせパターンを１つ選択する。Ｌは、アンサンブル識別器を構成する弱識別器の数である。
次に、ステップＳ４０２では、弱識別器組み合わせ選択部１２０は、ステップＳ４０１で選択されたＬ個の弱識別器の組み合わせパターンが持つＣｏｍｂ（Ｌ，２）個の弱識別器間多様性指標の総和値を算出する。

次に、ステップＳ４０３では、弱識別器組み合わせ選択部１２０は、Ｃｏｍｂ（Ｌ，２）個の弱識別器間多様性指標の総和値の算出が行われていないＬ個の弱識別器パターンが存在するか否かを判定する。この判定の結果、Ｃｏｍｂ（Ｌ，２）個の弱識別器間多様性指標の総和値の算出が行われていないＬ個の弱識別器パターンが存在する場合には、ステップＳ４０１に戻る。そして、弱識別器組み合わせ選択部１２０は、Ｃｏｍｂ（Ｌ，２）個の弱識別器間多様性指標の総和値の算出が行われていない組み合わせパターンを選択する。ステップＳ４０１からステップＳ４０３のループを繰り返すことでＣｏｍｂ（Ｍ，Ｌ）通りの全ての組み合わせパターンに対して弱識別器間多様性指標の総和値が算出される。

そして、ステップＳ４０４では、弱識別器組み合わせ選択部１２０は、Ｌ個の組み合わせパターンの中から、ステップＳ４０２で算出した弱識別器間多様性指標の総和値が最大となる組み合わせを探索し、その弱識別器組み合わせパターンを選択する。
以上の処理によって、弱識別器間多様性指標に基づいて、アンサンブル識別器を構成する適切な弱識別器の組み合わせを選択することができる。

図５Ｂは、Ｍ＝５、Ｌ＝３、即ち５個の弱識別器集合から３個の弱識別器の組み合わせを選択する場合の弱識別器組み合わせ選択部１２０の処理の一例を説明する図である。この場合、Ｃｏｍｂ（５，３）＝２０なので、組み合わせパターンは全部で２０通り存在する。弱識別器組み合わせ選択部１２０は、それらの全ての組み合わせパターンに対して、弱識別器間多様性指標の総和値を算出する。

例えば、図５Ｂの一番左の表では、ＩＤ＝２、３、４の弱識別器の組み合わせパターンについての弱識別器間多様性指標の総和値を示す。ＩＤが２とＩＤが３の弱識別器ペアの多様性指標は０．６７５、ＩＤが２とＩＤが４の弱識別器ペアの多様性指標は０．７４９、ＩＤが３とＩＤが４の多様性指標は０．０３４である。従って、それらの総和値は１．４５８となる。弱識別器組み合わせ選択部１２０は、以上の処理を２０通りの組み合わせパターンについて繰り返すことにより、全ての組み合わせパターンのそれぞれについての弱識別器間多様性指標の総和値を個別に算出する。そして、弱識別器組み合わせ選択部１２０は、当該総和値が最大となる組み合わせパターンを選択する。図５Ｂに示す例では、ＩＤが０とＩＤが２とＩＤが３の弱識別器の組み合わせパターンについての弱識別器間多様性指標の総和値が２．３６４となり、全ての組み合わせパターンの中で最大となるため、その組み合わせパターンが選択される。

アンサンブル識別器生成部１３０は、弱識別器組み合わせ選択部１２０で選択されたＬ個の弱識別器を用いてアンサンブル識別器１３を生成する。尚、複数の弱識別器を用いてアンサンブル識別器１３を生成する方法は、公知の技術で実現できるので、ここでは、その詳細な説明を省略する。

以上のように本実施形態では、サンプルデータを弱識別器に入力して当該サンプルデータにおける識別対象の識別結果を得て、弱識別器ペアにおける識別結果のばらつき度を算出する。このような弱識別器ペアにおける識別結果のばらつき度の算出を、とり得る弱識別器ペア、複数のサンプルデータのそれぞれについて行う。そして、当該複数のサンプルデータを用いた場合の、弱識別器ペアにおける識別結果のばらつき度から、当該弱識別器ペアにおける識別結果の多様性を表す弱識別器間多様性指標を算出する。そして、アンサンブル識別器を構成する所定の個数の弱識別器の組み合わせパターンに含まれる弱識別器ペアにおける弱識別器間多様性指標に基づいて、当該所定の個数の弱識別器の組み合わせを選択する。そして、選択した弱識別器を用いてアンサンブル識別器を作成する。従って、クラス情報を持たない実撮影データを利用して、アンサンブル識別器を評価することが可能となる。このため、クラス情報を持たない実撮影データを利用しても、識別対象の識別に有用な弱識別器の組み合わせを選択することができ、高性能なアンサンブル識別器の作成が可能となる。

尚、本実施形態では、弱識別器間多様性指標算出部１１０が、弱識別器ペアの識別結果を比較して弱識別器間多様性指標を算出し、弱識別器組み合わせ選択部１２０が、弱識別器間多様性指標の総和値に基づき弱識別器の組み合わせを導出する場合を説明した。しかし、必ずしもこのようにする必要はない。例えば、以下のようにしてもよい。即ち、弱識別器間多様性指標算出部１１０においてＬ個（Ｌ＞２）の弱識別器の識別結果を比較して、Ｌ個の弱識別器ペアの弱識別器間多様性指標を算出する。そして、弱識別器組み合わせ選択部１２０においてＬ個の弱識別器のペアの弱識別器間多様性指標が最大となる弱識別器の組み合わせを選択する。Ｌ個の弱識別器のペアの弱識別器間多様性指標の算出には、既存の手法を利用することができる。例えば、各弱識別器の識別結果を、集合の各要素とみなしてＬ個の集合の類似度を求めることで、弱識別器間多様性指標の算出を行える。

また、本実施形態では、識別器における識別対象のデータが画像データである場合を例に挙げて説明した。しかしながら、識別器における識別対象のデータは、画像データに限定されない。例えば、製造実績データであってもよい。また、識別器が、入力されるデータにおける識別対象が属するクラスを識別する場合を例に挙げて説明した。しかしながら、識別器は、入力されるデータにおける識別対象を識別するものであれば、このようなものに限定されない。例えば、識別対象の有無を識別する識別器を採用してもよい。

（第２の実施形態）
次に、第２の実施形態について説明する。本実施形態では、入力されたサンプルデータに対して分類処理を行い、その分類処理の結果に基づいて、当該サンプルデータにおける識別対象の識別結果を出力する方式の弱識別器を用いたアンサンブル識別器を用いる場合を例に挙げて説明する。このように本実施形態と第１の実施形態とは、弱識別器による識別対象の識別方法が異なることによる処理が主として異なる。従って、本実施形態の説明において、第１の実施形態と同一の部分については、図１〜図５Ｂに付した符号と同一の符号を付す等して詳細な説明を省略する。具体的に、本実施形態における情報処理装置の構成は、第１の実施形態と同様の構成である。また、図１に示す情報処理装置１００における弱識別器組み合わせ選択部１２０およびアンサンブル識別器生成部１３０の処理についても第１の実施形態と同様である。従って、これらの詳細な説明を省略する。

入力されたサンプルデータに対して分類処理を行い、その分類処理の結果に基づいて、当該サンプルデータにおける識別対象の識別結果を出力する方式の弱識別器の一例として、決定木がある。図６は、決定木による識別の流れの一例を示す模式図である。まず、分類処理では、データが入力された決定木は、当該決定木の各ノードに設定されている分岐関数に当該データを当てはめ、その結果に基づき、当該データをいずれかの末端ノード（リーフ）に分類する。図６に示す例では、決定木Ａにより、入力データｉはリーフａに分類されていることを示す。

決定木の各リーフには、事前の学習処理によってクラス情報が格納されている。分類処理が行われた後、識別処理として、決定木は、入力されたデータの分類先であるリーフに格納されているクラス情報を、当該データにおける識別対象の識別結果として出力する。図６に示す例では、決定木Ａによる入力データｉの識別結果として、入力データｉの分類先であるリーフａに格納されているクラス情報｛クラスＰ、クラスＱ｝が出力される。尚、決定木自体は、公知の技術で実現することができるので、ここでは、その詳細な説明を省略する。

第１の実施形態においては、各弱識別器にサンプルデータを入力したときの識別結果に着目して弱識別器間多様性指標を算出する場合を例に挙げて説明した。これに対し、本実施形態では、各弱識別器にサンプルデータを入力したときの分類結果に着目して弱識別器間多様性指標を算出する。

図７に示すフローチャートを参照しながら、弱識別器間多様性指標算出部１１０の処理の一例を詳細に説明する。
ステップＳ７０１では、弱識別器間多様性指標算出部１１０は、サンプルデータ群１２に含まれる全てのサンプルデータを、弱識別器集合１１に含まれる全ての弱識別器に入力する。これにより、弱識別器集合１１に含まれる各弱識別器は、自身に入力されたサンプルデータを分類する。

次に、ステップＳ７０２では、弱識別器間多様性指標算出部１１０はサンプルデータ群１２から未選択のサンプルデータを１つ選択する。
次に、ステップＳ７０３では、弱識別器間多様性指標算出部１１０は、ステップＳ７０１で行った各弱識別器におけるサンプルデータの分類結果に基づき、分類結果ばらつき度が未算出である２つの弱識別器ペアの分類結果ばらつき度を算出する。ここで、分類結果ばらつき度とは、２つの弱識別器の分類結果が異なる度合いを表す指標である。２つの弱識別器間の分類結果の比較のため、ステップＳ７０１で行った全てのサンプルデータに対する分類結果を利用する。

弱識別器の分類結果であるリーフを集合、それぞれのリーフに分類された各サンプルデータを集合要素とみなす。弱識別器間多様性指標算出部１１０は、或るサンプルデータが２つの識別器へ入力されたときに、それぞれの弱識別器におけるそのサンプルデータが属する集合同士の類似度を集合間類似度として算出する。そして、弱識別器間多様性指標算出部１１０は、１から当該算出した集合間類似度を減算した値（＝１−集合間類似度）を分類結果ばらつき度として導出する。２つの集合間の類似度は、第１の実施形態において、弱識別器が複数のクラス情報を識別結果として出力する場合の識別結果ばらつき度を算出する場合と同様に、ジャッカード係数Ｊやダイス係数Ｄを用いて算出することができる。
ステップＳ７０４からステップＳ７０６の処理は、第１の実施形態におけるステップＳ２０４からステップＳ２０６の処理と同様であるため、詳細な説明を省略する。尚、ステップＳ７０６では、弱識別器間多様性指標算出部１１０は、識別結果ばらつき度を用いる代わりに、分類結果ばらつき度を用いて、各弱識別器ペアの弱識別器間多様性指標を設定（導出）する。

図８は、弱識別器Ａと弱識別器Ｂに対して、サンプルデータ１が入力されたときの分類結果ばらつき度を算出する過程の一例を示す模式図である。サンプルデータ１は、弱識別器Ａによって分類結果ａに分類され、また、弱識別器Ｂによって分類結果ｂに分類される。サンプルデータ１と同様に弱識別器Ａによって分類結果ａに分類された全てのサンプルデータを含む分類結果ａの集合と、弱識別器Ｂによって分類結果ｂに分類された全てのサンプルデータを含む分類結果ｂの集合とを比較する。この比較の結果に基づいて分類結果ばらつき度が算出される。

図８に示す事例では、分類結果ａの集合と分類結果ｂの集合との集合間類似度が算出される。分類結果ａの集合は、｛サンプルデータ１、サンプルデータ３、サンプルデータ４、サンプルデータ７｝を要素に持つ集合である。分類結果ｂの集合は、｛サンプルデータ１、サンプルデータ２、サンプルデータ３、サンプルデータ５、サンプルデータ８｝を要素に持つ集合である。この場合、分類結果ａの集合と分類結果ｂの集合との共通要素は｛サンプルデータ１、サンプルデータ３｝である。従って、ジャッカード係数Ｊを用いた場合の集合間類似度は、（１）式より、２／７、ダイス係数Ｄを用いた場合の集合間類似度は、（２）式より４／９（＝２×２／９）となる。これと同様に、弱識別器間多様性指標算出部１１０は、サンプルデータ群１２に含まれる全てのサンプルデータについて、それぞれのサンプルデータが弱識別器Ａによって分類された分類結果の集合と弱識別器Ｂによって分類された分類結果の集合とを比較する。そして、弱識別器間多様性指標算出部１１０は、算出した分類結果ばらつき度の平均をとることで弱識別器Ａと弱識別器Ｂの弱識別器間多様性指標を算出する。

以上のように本実施形態では、決定木のような、入力されるサンプルデータに対して分類処理を行い、その分類処理の結果に基づいて識別結果を出力する弱識別器を用いる場合でも、第１の実施形態で説明した効果と同様の効果を得ることができる。即ち、それぞれの弱識別器が学習したクラス情報を用いることなく、サンプルデータの分類処理の結果のみを使って弱識別器間多様性指標を算出することができる。

尚、弱識別器間多様性指標算出部１１０において、更に第１の実施形態で説明した識別結果ばらつき度に基づく弱識別器間多様性指標を算出してもよい。この場合、例えば、弱識別器組み合わせ選択部１２０は、識別結果ばらつき度に基づく弱識別器間多様性指標と分類結果ばらつき度に基づく弱識別器間多様性指標を組み合わせて、アンサンブル識別器を構成する弱識別器を選択してもよい。また、本実施形態でも、第１の実施形態で説明した変形例を採用することができる。

（第３の実施形態）
次に、第３の実施形態について説明する。本実施形態では、データの識別時に使用するメモリ量、データの識別時の処理速度、および識別結果の精度の少なくとも１つを設定し、その設定値に応じてアンサンブル識別器を構成する弱識別器の数を変更する。このように本実施形態と第１の実施形態とは、アンサンブル識別器を生成する際の構成および処理が主として異なる。従って、本実施形態の説明において、第１の実施形態と同一の部分については、図１〜図５に付した符号と同一の符号を付して詳細な説明を省略する。

アンサンブル識別器は、一般に、自身に用いられる弱識別器の個数が増すにつれ性能が向上していき、最終的に性能は飽和する。そのため、識別処理を行った際にアンサンブル識別器が所望の精度を達成しない場合には、より多数の弱識別器を用いて構成されるアンサンブル識別器を用いて識別処理を行う方法が有効である。一方で、アンサンブル識別器を構成する弱識別器の個数が増すにつれ、アンサンブル識別器の容量や識別処理にかかる時間も増大する。そのため、識別処理における実行メモリの負荷軽減や処理時間の短縮を行いたいときには、少数の弱識別器を用いて構成されるアンサンブル識別器を用いて識別を行えばよい。

図９は、アンサンブル識別器構築システムの基本的な構成の一例を示す図である。本実施形態では、アンサンブル識別器構築システムは、弱識別器の組み合わせを算出する情報処理装置２００と、識別処理を行う物体識別装置３００とを有する。
情報処理装置２００は、弱識別器間多様性指標算出部２１０と弱識別器組み合わせ選択部２２０とを有する。

弱識別器間多様性指標算出部２１０は、第１の実施形態における弱識別器間多様性指標算出部１１０と同様に、弱識別器集合２１とサンプルデータ群２２とを入力として弱識別器間の多様性を表す指標（弱識別器間多様性指標）を算出する。
弱識別器組み合わせ選択部２２０は、第１の実施形態における弱識別器組み合わせ選択部２２０と同様に、弱識別器間多様性指標算出部２１０によって算出された弱識別器間多様性指標に基づいて、所定の個数の弱識別器を選択する。ただし、第１の実施形態と異なる点として、弱識別器組み合わせ選択部２２０は、複数の弱識別器の組み合わせとして複数の組み合わせを選択する。即ち、前記所定の個数の候補が複数ある。弱識別器組み合わせ選択部２２０は、前記所定の個数のそれぞれの場合において選択した弱識別器の組み合わせを、選択弱識別器組み合わせリスト２３として出力する。

物体識別装置３００は、目標値設定部３１０と、アンサンブル識別器生成部３２０と、識別部３３０とを有する。
目標値設定部３１０は、ユーザによって入力された目標値を設定する。
アンサンブル識別器生成部３２０は、情報処理装置２００から出力された選択弱識別器組み合わせリスト２３と、目標値設定部３１０によって設定された目標値とに基づき、アンサンブル識別器を生成する。
識別部３３０は、アンサンブル識別器生成部３２０によって生成されたアンサンブル識別器を用いて識別対象データ３１の識別を行い、その結果を識別結果３２として出力する。

図１０のフローチャートを参照しながら、アンサンブル識別器構築システム（情報処理装置２００および物体識別装置３００）の処理の一例を説明する。
ステップＳ１００１では、弱識別器間多様性指標算出部２１０は、弱識別器集合２１に含まれる弱識別器群の全ての弱識別器ペアに対して弱識別器間多様性指標を算出する。具体的な処理は、第１の実施形態における図２または第２の実施形態における図７のフローチャートを参照しながら説明した処理と同様であるため、その詳細な説明を省略する。

次に、ステップＳ１００２では、弱識別器組み合わせ選択部２２０は、選択する弱識別器の個数を複数パターン設定する。予め用意された弱識別器の数をＮとすると、弱識別器組み合わせ選択部２２０は、２〜Ｎ−１までの全ての個数を指定してもよいし、計算量の削減のために所定数おきに個数を指定してもよい。

次に、ステップＳ１００３では、弱識別器組み合わせ選択部２２０は、ステップＳ１００１で算出された弱識別器間多様性指標に基づいて、ステップＳ１００３で指定した個数における適切な弱識別器の組み合わせを選択する。弱識別器の組み合わせを算出する処理は、第１の実施形態における図４のフローチャートを参照しながら説明した処理と同様であるため、その詳細な説明を省略する。

ステップＳ１００４では、目標値設定部３１０は、アンサンブル識別器を用いた識別処理における目標値を設定する。ここでは、識別処理に使用するメモリ量（容量）、識別処理時に要求される処理速度（識別処理の実行速度）のいずれかが目標値として設定されるものとする。目標値設定部３１０は、例えば、ユーザにより指定されたメモリ量を設定することができる。また、目標値設定部３１０は、識別時に使用できる最大メモリ量から、識別処理に使用するメモリ量を設定してもよい。また、目標値設定部３１０は、ユーザにより指定された処理速度を設定してもよいし、予め設定された全体の処理時間から処理速度を算出してもよい。尚、ステップＳ１００１〜１００３とステップＳ１００４は独立な処理である。ステップＳ１００１〜１００３とステップＳ１００４を並列処理してもよいし、一方を先に処理し他方を後に処理してもよい。

以上のステップＳ１００１〜Ｓ１００４の処理が終わると、ステップＳ１００５に進む。ステップＳ１００５では、アンサンブル識別器生成部３２０は、ステップＳ１００４で設定された目標値を満たす弱識別器の個数を設定する。
識別処理に使用するメモリ量は、アンサンブル識別器を構成する弱識別器のサイズから算出することができる。従って、アンサンブル識別器生成部３２０は、ステップＳ１００３で選択された弱識別器の組み合わせで識別処理を行う場合に使用するメモリ量を算出し、算出したメモリ量が目標値を満たすような個数を選択することができる。

また、アンサンブル識別器における識別処理では、弱識別器による識別処理を行い、その識別結果を集計することで最終的な識別結果を出力する。そして、アンサンブル識別器の識別処理時の実行速度は、弱識別器の個数に比例する。このため、予め弱識別器単体の識別処理時の実行速度を計測しておくことで、アンサンブル識別器生成部３２０は、要求速度（目標値）を満たす弱識別器の数を逆算することが可能である。

次に、ステップＳ１００６では、アンサンブル識別器生成部３２０は、ステップＳ１００３で選択された弱識別器の組み合わせのうち、ステップＳ１００５で設定された個数の弱識別器の組み合わせの弱識別器を用いてアンサンブル識別器を生成する。
次に、ステップＳ１００７では、識別部３３０は、ステップＳ１００６で生成されたアンサンブル識別器を用いて、入力された識別対象データ３１に対する識別処理を行う。
次に、ステップＳ１００８では、識別部３３０は、ステップＳ１００７で行った識別処理の結果（識別結果）が、所望の性能（使用メモリ量もしくは実行速度）を満たすか否かを判定する。

識別対象の物体の識別結果の他に、最大メモリ使用量や実行速度のログが識別結果に含まれる場合には、例えば、以下のようにステップＳ１００８の判定を行うことができる。即ち、ユーザがログを参照して、所望の性能を満たすかどうかを指示し、識別部３３０は、その指示の内容に基づいて、識別結果が、所望の性能を満たすか否かを判定することができる。

以上のステップＳ１００８の判定の結果、識別結果が所望の性能を満たしている場合には、識別部３３０は、識別結果３２を出力し、図１０のフローチャートによる処理を終了する。

一方、識別結果が所望の性能を満たしていない場合には、ステップＳ１００５に戻り、アンサンブル識別器生成部３２０は、より少ない弱識別器の個数を設定する。

以上のように本実施形態では、設定された目標値、即ち識別処理の際に使用するメモリ量、あるいは識別処理の際に要求される処理速度を満たす弱識別器の個数を導出し、導出した個数の弱識別器からなる弱識別器の組み合わせパターンを選択する。従って、設定された目標値に応じてアンサンブル識別器を構成する弱識別器の個数を動的に設定することで、第１の実施形態で説明した効果に加え、以下の効果を奏する。即ち、所定の条件を満たす中でより高性能なアンサンブル識別器を生成することができると共に、識別処理時の省メモリ化や識別処理の高速化を実現することができる。
尚、本実施形態の物体識別装置３００を、第２の実施形態に適用することもできる。また、アンサンブル識別器構築システム（情報処理装置２００および物体識別装置３００）を１つの装置で構成してもよい。

尚、前述した実施形態は、何れも本発明を実施するにあたっての具体化の例を示したものに過ぎず、これらによって本発明の技術的範囲が限定的に解釈されてはならないものである。すなわち、本発明はその技術思想、又はその主要な特徴から逸脱することなく、様々な形で実施することができる。

（その他の実施例）
本発明は、以下の処理を実行することによっても実現される。即ち、まず、以上の実施形態の機能を実現するソフトウェア（コンピュータプログラム）を、ネットワーク又は各種記憶媒体を介してシステム或いは装置に供給する。そして、そのシステム或いは装置のコンピュータ（又はＣＰＵやＭＰＵ等）が当該コンピュータプログラムを読み出して実行する。

１１：弱識別器集合、１２：サンプルデータ群、１３：アンサンブル識別器、１００：情報処理装置、１１０：弱識別器間多様性指標算出部、１２０：弱識別器組み合わせ選択部、１３０：アンサンブル識別器生成部

Claims

アンサンブル識別器を構成する複数の弱識別器を選択するための処理を行う情報処理装置であって、
前記アンサンブル識別器を構成する弱識別器の候補を入力する入力手段と、
前記入力手段により入力された候補のうち、少なくとも２つの前記弱識別器に対して同じデータを与え、当該弱識別器のそれぞれにおいて当該データに対する識別処理を行う際に得られる情報を比較し、比較した結果に基づいて、当該少なくとも２つの弱識別器間の識別結果の多様性を表す指標を導出することを、前記少なくとも２つの弱識別器の複数の組み合わせのそれぞれについて行う導出手段と、
前記導出手段により導出された、前記少なくとも２つの前記弱識別器間の識別結果の多様性を表す指標に基づいて、前記アンサンブル識別器を構成する前記複数の弱識別器の数の候補のそれぞれについて、前記複数の弱識別器の組み合わせを選択する処理手段と、を有することを特徴とする情報処理装置。
前記処理手段は、前記選択された前記複数の弱識別器の組み合わせを用いて前記アンサンブル識別器を生成する生成手段をさらに有することを特徴とする請求項１に記載の情報処理装置。
前記識別処理を行う際に得られる情報は、前記識別器による識別対象の識別の結果であることを特徴とする請求項１または２に記載の情報処理装置。
前記弱識別器は、入力されたデータを分類し、当該分類した結果に基づいて識別対象の識別の結果を出力し、
前記識別処理を行う際に得られる情報は、前記識別器による前記分類の結果であることを特徴とする請求項１または２に記載の情報処理装置。
前記データにはラベルが付与されていないことを特徴とする請求項１〜４の何れか１項に記載の情報処理装置。
前記導出手段は、前記入力手段により入力された候補のうち、少なくとも２つの前記弱識別器に対して同じデータを与えて、当該弱識別器のそれぞれにおいて当該データに対する識別処理を行う際に得られる情報を取得することを、複数の前記データのそれぞれについて行う手段と、
前記識別処理を行う際に得られる情報に基づいて、前記少なくとも２つの前記弱識別器における、前記識別処理を行う際に得られる情報のばらつき度を導出する手段と、
前記識別処理を行う際に得られる情報のばらつき度に基づいて、前記少なくとも２つの弱識別器間の識別結果の多様性を表す指標を導出する手段と、をさらに有することを特徴とする請求項１〜５の何れか１項に記載の情報処理装置。
前記導出手段は、前記入力手段により入力された候補のうち、少なくとも２つの前記弱識別器に対して同じデータを与え、当該弱識別器のそれぞれにおいて当該データに対する識別処理を行った結果、当該データが識別対象の識別に寄与しない場合、当該データを用いた場合の、前記識別処理を行う際に得られる情報のばらつき度の導出を行わないことを特徴とする請求項６に記載の情報処理装置。
前記複数の弱識別器の数は、所定の数であることを特徴とする請求項１〜７の何れか１項に記載の情報処理装置。
請求項１に記載の情報処理装置を有するアンサンブル識別器構築システムであって、
前記アンサンブル識別器による識別処理に関する目標値を設定する目標値設定手段と、
前記目標値を達成する前記弱識別器の数を導出し、前記選択された前記複数の弱識別器の組み合わせのうち、当該導出した数の前記複数の弱識別器の組み合わせを用いて前記アンサンブル識別器を生成する生成手段と、を有することを特徴とするアンサンブル識別器構築システム。
前記目標値は、前記アンサンブル識別器による識別が行われる際に使用されるメモリ量および前記アンサンブル識別器による識別が行われる際の処理速度のうち少なくとも１つを含むことを特徴とする請求項９に記載のアンサンブル識別器構築システム。
アンサンブル識別器を構成する複数の弱識別器を選択するための処理を行う情報処理方法であって、
前記アンサンブル識別器を構成する弱識別器の候補を入力する入力工程と、
前記入力工程により入力された候補のうち、少なくとも２つの前記弱識別器に対して同じデータを与え、当該弱識別器のそれぞれにおいて当該データに対する識別処理を行う際に得られる情報を比較し、比較した結果に基づいて、当該少なくとも２つの弱識別器間の識別結果の多様性を表す指標を導出することを、前記少なくとも２つの弱識別器の複数の組み合わせのそれぞれについて行う導出工程と、
前記導出工程により導出された、前記少なくとも２つの前記弱識別器間の識別結果の多様性を表す指標に基づいて、前記アンサンブル識別器を構成する前記複数の弱識別器の数の候補のそれぞれについて、前記複数の弱識別器の組み合わせを選択する処理工程と、を有することを特徴とする情報処理方法。
請求項１〜８の何れか１項に記載の情報処理装置の各手段としてコンピュータを機能させることを特徴とするプログラム。