JP6659120B2 - 情報処理装置、情報処理方法、およびプログラム - Google Patents

情報処理装置、情報処理方法、およびプログラム Download PDF

Info

Publication number
JP6659120B2
JP6659120B2 JP2015218444A JP2015218444A JP6659120B2 JP 6659120 B2 JP6659120 B2 JP 6659120B2 JP 2015218444 A JP2015218444 A JP 2015218444A JP 2015218444 A JP2015218444 A JP 2015218444A JP 6659120 B2 JP6659120 B2 JP 6659120B2
Authority
JP
Japan
Prior art keywords
weak
classifier
identification
ensemble
weak classifiers
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2015218444A
Other languages
English (en)
Other versions
JP2017091083A (ja
Inventor
裕一郎 飯尾
裕一郎 飯尾
奥野 泰弘
泰弘 奥野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2015218444A priority Critical patent/JP6659120B2/ja
Publication of JP2017091083A publication Critical patent/JP2017091083A/ja
Application granted granted Critical
Publication of JP6659120B2 publication Critical patent/JP6659120B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Image Analysis (AREA)

Description

本発明は、情報処理装置、情報処理方法、およびプログラムに関し、特に、アンサンブル識別器を作成するために用いて好適なものである。
機械学習を利用した物体認識の分野で多く用いられる手法として、アンサンブル識別器を用いた認識手法がある。アンサンブル識別器を用いた認識手法は、精度の低い識別器(弱識別器)を複数組み合わせることによって教師付き学習の精度を向上させる手法である。アンサンブル識別器を用いた認識を行う方式として、BaggingやRandomized Treesといった方式がある。
基本的に、アンサンブル識別器を構成する弱識別器の個数が多いほど、アンサンブル識別器の性能が向上する。一方、アンサンブル識別器を構成する弱識別器の個数が同一である場合でも、アンサンブル識別器を構成する複数の弱識別器の組み合わせによって、アンサンブル識別器の性能が変動する。従って、適切な弱識別器の組み合わせでアンサンブル識別器を構成することで、より高性能なアンサンブル識別器を作成することが望まれる。
アンサンブル識別器を作成する手法として、作成したアンサンブル識別器を、予めラベルづけされたサンプルデータに基づいて評価し、その評価の結果が所定の条件を満たすまでアンサンブル識別器の学習を繰り返す手法がある。ここで、アンサンブル識別器の評価に用いるサンプルデータとして、ラベルが付与されたデータを用いる技術がある。ラベルは、教師データやGround Truth等とも呼ばれ、識別器における識別結果の正しい内容(正解)を示す情報である。例えば、サンプルデータにおける識別対象が属するクラスを示すクラス情報がラベルとして付与される。この種の技術として、特許文献1には、AdaBoostを用いたアンサンブル識別器の学習についての技術が開示されている。特許文献1では、まず、学習した弱識別器から合成対象となる複数の弱識別器を選択する。次に、選択した複数の弱識別器を合成したアンサンブル識別器を、ラベルが付与されたサンプル画像を入力として評価する。以上のアンサンブル識別器を構成する弱識別器の選択と、アンサンプル識別器の評価とを、アンサンブル識別器の識別精度が閾値以上となるまで繰り返す。
特許第5123759号公報
Gall, J., "Hough forests for object detection,tracking,and action recognition", IEEE Transactions on Pattern Analysis and Machine Intelligence, vol. 33,no. 11, pp. 2188-2202, 2011.
特許文献1では、学習に用いるデータの一部をサンプルデータとして、アンサンブル識別器の評価に利用する。識別器の学習に用いるデータは、学習の精度を高めるために識別対象の物体が単独で含まれているものが望ましいとされている。一方で、サンプルデータは、識別時に識別器に入力される未知のデータに対する汎化性能を確認するために用いることが目的である。このため、サンプルデータは、複数の物体が雑多に含まれているような、実際に識別時に識別器に入力されるデータであることが望ましい。そのため、学習に用いるデータをサンプルデータとして利用するよりも、識別時に用いられるデータと同種のデータ(例えば、実撮影画像データ)のセットをサンプルデータとして別途用意した方が、より有効に識別器を評価することができる。これにより、アンサンブル識別器の高性能化が見込める。
しかし、識別時に用いられるデータと同種のデータには、必ずしも、ラベルを付与することができるとは限らない。識別時に用いられるデータと同種のデータにラベルを付与するためには、例えば、人間がサンプルデータごとに、当該サンプルデータにおける識別対象の有無や当該サンプルデータにおける識別対象が属するクラス等を判定する必要がある。そして、当該サンプルデータに、判定した結果を示す情報をラベルとして設定する必要がある。しかし、サンプルデータのセットの総数が膨大である場合には、人力で全てのサンプルデータにクラス情報等を付与することは容易ではない。
例えば、非特許文献1で用いられているHough Forestでは、画像上の部分領域を入力データとする。そして、弱識別器は、入力データが、識別対象を含むときには、識別対象の物体の重心位置へのオフセットを出力する。一方、入力データが、識別対象を含まないときには、弱識別器は、ネガティブサンプルであると判定する。即ち、Hough Forestにおいては、サンプルデータにクラス情報等を付与するためには、以下のようにする必要がある。まず、サンプルデータの全ての部分領域に対して、それぞれの部分領域が識別対象の物体を含むかどうかを判定する。そして、識別対象の物体を含む場合には、識別対象の物体の重心位置へのオフセットを算出する。しかし、全てのサンプルデータのセットに対してこの作業を人力で行うことは現実的ではない。
従って、ラベルが付与されたサンプルデータを用意することが容易でない場合には、特許文献1の方式では、作成したアンサンブル識別器の性能を評価することが容易ではない。
本発明は、このような問題点に鑑みてなされたものであり、ラベルが付与されたサンプルデータを用いなくても、複数の弱識別器から識別対象の識別に有用な弱識別器の組み合わせを選択できるようにすることを目的とする。
本発明の情報処理装置は、アンサンブル識別器を構成する複数の弱識別器を選択するための処理を行う情報処理装置であって、前記アンサンブル識別器を構成する弱識別器の候補を入力する入力手段と、前記入力手段により入力された候補のうち、少なくとも2つの前記弱識別器に対して同じデータを与え、当該弱識別器のそれぞれにおいて当該データに対する識別処理を行う際に得られる情報を比較し、比較した結果に基づいて、当該少なくとも2つの弱識別器間の識別結果の多様性を表す指標を導出することを、前記少なくとも2つの弱識別器の複数の組み合わせのそれぞれについて行う導出手段と、前記導出手段により導出された、前記少なくとも2つの前記弱識別器間の識別結果の多様性を表す指標に基づいて、前記アンサンブル識別器を構成する前記複数の弱識別器の数の候補のそれぞれについて、前記複数の弱識別器の組み合わせを選択する処理手段と、を有することを特徴とする。
本発明によれば、ラベルが付与されたサンプルデータを用いなくても、複数の弱識別器から識別対象の識別に有用な弱識別器の組み合わせを選択することができる。
情報処理装置の構成を示す図である。 弱識別器多様性指標算出処理の第1の例を示すフローチャートである。 識別結果ばらつき度の算出過程の第1の例を示す図である。 識別結果ばらつき度の算出過程の第2の例を示す図である。 識別結果ばらつき度の算出過程の第3の例を示す図である。 識別結果ばらつき度の算出過程の第4の例を示す図である。 識別結果ばらつき度の算出過程の第5の例を示す図である。 弱識別器組み合わせ選択部の処理を示すフローチャートである。 弱識別器間多様性指標を示す図である。 弱識別器組み合わせ選択部の処理を説明する図である。 決定木による識別の流れを示す図である。 弱識別器多様性指標算出処理の第2の例を示すフローチャートである。 類結果ばらつき度を算出する過程を示す図である。 アンサンブル識別器構築システムの構成を示す図である。 アンサンブル識別器構築システムの処理を示すフローチャートである。
以下、図面を参照しながら、第1の実施形態を説明する。
(第1の実施形態)
まず、第1の実施形態について説明する。
アンサンブル識別器は、複数の弱識別器を組み合わせて高精度な識別を行う識別器である。しかし、弱識別器の数に比例してアンサンブル識別器の容量は増大する。このため、実行環境の都合でアンサンブル識別器の容量に制限がある場合には、予めアンサンブル識別器を構成する弱識別器の数を制限してアンサンブル識別器の作成を行う必要がある。
一方、高い汎化性能を持つアンサンブル識別器を構築するためには、個々の弱識別器の多様性が重要である。そこで、複数の弱識別器の組み合わせでアンサンブル識別器を作成する場合には、より多数の弱識別器を作成し、それらの弱識別器の中から多様性の大きい弱識別器の組み合わせを選択してアンサンブル識別器の作成を行うのが好ましい。より高性能なアンサンブル識別器を作成することができるからである。
本実施形態の目的は、所定の数の弱識別器群からなるアンサンブル識別器を作成するに際し、クラス情報等のラベルを持たないサンプルデータを用いて、予め用意された多数の弱識別器集合から適切な弱識別器の組み合わせを選択することである。本実施形態では、このようなサンプルデータを入力としたときの各弱識別器の識別結果のばらつき度を用いて、弱識別器間の識別結果の多様性を表す指標を導出する。そして、このような指標を用いて、アンサンブル識別器を構成するための弱識別器群の組み合わせを選択することにより、高性能なアンサンブル識別器を作成する。また、本実施形態では、取り扱うデータが画像データである場合を例に挙げて説明する。更に、本実施形態では、識別器が、入力されるデータに含まれる識別対象が属するクラスを識別する場合を例に挙げて説明する。
図1は、本実施形態における情報処理装置100の構成の一例を示す図である。本実施形態における情報処理装置100は、弱識別器間多様性指標算出部110と、弱識別器組み合わせ選択部120と、アンサンブル識別器生成部130とを有する。情報処理装置100は、例えば、CPU、ROM、RAM、HDD、および各種のインターフェースを備える装置や専用のハードウェアを用いることにより実現される。
弱識別器間多様性指標算出部110は、弱識別器集合11とサンプルデータ群12を入力として、弱識別器間の識別結果の多様性を表す指標を算出する。以下の説明では、弱識別器間の識別結果の多様性を表す指標を、必要に応じて、弱識別器間多様性指標と称する。
弱識別器組み合わせ選択部120は、弱識別器間多様性指標算出部110によって算出された弱識別器間多様性指標に基づいて所定の数の弱識別器を選択する。所定の数は、アンサンブル識別器を構成する弱識別器の数である。
アンサンブル識別器生成部130は、弱識別器組み合わせ選択部120で選択された弱識別器を用いてアンサンブル識別器を生成する。
以下に、情報処理装置100の動作の一例について詳細に説明する。
本実施形態においては、予め学習された複数の弱識別器から構成される弱識別器集合11と、複数のサンプルデータから構成されるサンプルデータ群12とが事前データとして用意される。
本実施形態のアンサンブル識別器における弱識別器は、ランダムに解を出力する識別器よりは高精度な識別を行う識別器であって、識別対象のクラス情報が付与された学習データを用いて学習が行われる識別器である。本実施形態では、弱識別器の学習は事前に行われているものとする。ただし、情報処理装置100は、学習データ群を入力し、弱識別器間多様性指標算出部110による処理が実行される前に、当該学習データ群を用いて弱識別器の学習を行ってもよい。弱識別器の学習方法は、例えば、Adaboostを用いた公知の方法により実現することができるので、ここでは、その詳細な説明を省略する。
サンプルデータは、学習データとは異なり、実際に識別時に識別器に入力される画像に類する画像である。実際に識別時に識別器に入力される画像に類する画像とは、ラベル(本実施形態ではクラス情報)が付与されていない画像をいう。
また、本実施形態では、アンサンブル識別器(アンサンブル識別器を構成する弱識別器の数と同数の弱識別器の組み合わせ)の候補を、サンプルデータを用いて評価し、その結果に基づいて最終的なアンサンブル識別器を作成する。このようにすることによって、より高性能なアンサンブル識別器を作成することができる。特徴的な一部のサンプルデータの影響を小さくし、識別器に対する評価の信頼性を増すために、サンプルデータは大量に用意されることが望ましい。
次に、図2のフローチャートを参照しながら、弱識別器間多様性指標算出部110の処理の一例を説明する。
ステップS201では、弱識別器間多様性指標算出部110は、サンプルデータ群12から未選択のサンプルデータを1つ選択する。
次に、ステップS202では、弱識別器間多様性指標算出部110は、予め用意された弱識別器集合11に属する全ての弱識別器に、ステップS201で選択されたサンプルデータを入力する。そして、それらの弱識別器のそれぞれにおいて、当該サンプルデータが属するクラスの識別を行う。弱識別器間多様性指標算出部110は、そのサンプルデータの識別結果を取得する。この処理によって各弱識別器はそれぞれが独立に、選択されたサンプルデータの識別結果を出力する。
次に、ステップS203では、弱識別器間多様性指標算出部110は、ステップS202で算出された、各弱識別器におけるサンプルデータの識別結果に基づき、2つの弱識別器からなる弱識別器ペアの識別結果ばらつき度を算出する。ここで、識別結果ばらつき度とは、2つの弱識別器の識別結果が異なる度合いを表す指標である。図3A〜図3Eに識別結果ばらつき度の算出方式について複数の事例を示す。
図3Aは、弱識別器が単一のクラス情報を識別結果として出力する場合の識別結果ばらつき度の算出過程の一例を示す模式図である。この場合、識別結果ばらつき度は二値で表現することができる。即ち、図3A(a)に示すように、サンプルデータiが入力されたときの弱識別器Aと弱識別器Bの識別結果が一致しているときには、弱識別器間多様性指標算出部110は、識別結果バラつき度として0(ゼロ)を導出する。一方、図3A(b)に示すように、サンプルデータiが入力されたときの弱識別器Aと弱識別器Bの識別結果が一致していないときには、弱識別器間多様性指標算出部110は、識別ばらつき度として「1」を導出する。
図3Bは、弱識別器が複数のクラス情報を識別結果として出力する場合の識別結果ばらつき度の算出過程の一例を表す模式図である。この場合、識別結果を集合、クラス情報を集合の要素とみなす。弱識別器間多様性指標算出部110は、集合間の類似度である集合間類似度を算出し、1から当該算出した集合間類似度を減算した値(=1−集合間類似度)を識別結果ばらつき度として導出する。集合間類似度を表す手法として、例えば、ジャッカード係数またはダイス係数を用いて表す手法がある。ジャッカード係数は、集合Xと集合Yの共通要素数を、集合Xと集合Yの少なくとも一方にある要素の総数で割った値である。ダイス係数は、集合Xと集合Yの共通要素数を、各集合X、Yの要素数の平均で割った値である。即ち、集合Xと集合Yのジャッカード係数J、ダイス係数Dは、それぞれ、以下の(1)式、(2)式で表される。
Figure 0006659120
図3Bに示す事例では、サンプルデータiが入力された時に弱識別器Aは、サンプルデータiが属するクラスが、クラスP、クラスQ、クラスRの何れかであると識別する。一方、弱識別器Bは、サンプルデータiが属するクラスが、クラスP、クラスR、クラスS、クラスTの何れかであると識別する。従って、弱識別器Aの識別結果と弱識別器Bの識別結果の共通要素は、クラスPとクラスRである。一方、弱識別器Aの識別結果と弱識別器Bの識別結果の少なくとも一方にある要素は、クラスP、クラスQ、クラスR、クラスS、クラスTである。
以上より、集合間類似度としてジャッカード係数Jを用いる場合、弱識別器Aと弱識別器Bの集合間類似度は、(1)式より0.4(=2/5)になる。よって、集合間類似度としてジャッカード係数Jを用いる場合、弱識別器間多様性指標算出部110は、弱識別器Aと弱識別器Bの識別結果ばらつき度として、0.6(=1−0.4)を導出する。一方、集合間類似度としてダイス係数Dを用いる場合、弱識別器Aと弱識別器Bの集合間類似度は、(2)式より0.57(=2/3.5)になる。よって、集合間類似度としてダイス係数Dを用いる場合、弱識別器間多様性指標算出部110は、弱識別器Aと弱識別器Bの識別結果ばらつき度として、0.43(1−0.57)を導出する。
図3Cは、弱識別器が各クラスの出現尤度を識別結果として出力する場合の識別結果ばらつき度の算出過程の一例を表す模式図である。この場合、識別結果ばらつき度は、各クラスを要素とする尤度ヒストグラムの差Hで定義することができる。即ち、識別結果ばらつき度は、以下の(3)式で表される。
Figure 0006659120
図3Cに示す事例では、サンプルデータiが入力された時に、弱識別器Aは、クラスPの出現頻度が0.5、クラスQの出現頻度が0.25、クラスRの出現頻度が0.25であると識別する。一方、弱識別器Bは、クラスPの出現頻度が0.2、クラスRの出現頻度が0.6、クラスTの出現頻度が0.2であると識別する。従って、クラスPの尤度差の絶対値、クラスQの尤度差の絶対値、クラスRの尤度差の絶対値、クラスTの尤度差の絶対値は、それぞれ、0.3(=0.5−0.2)、0.25、0.35(=0.6−0.25)、0.2になる。よって、弱識別器間多様性指標算出部110は、(3)式より、弱識別器Aと弱識別器Bの識別結果ばらつき度として、0.55(=(0.3+0.25+0.35+0.2)/2)を導出する。
図2の説明に戻り、ステップS204では、弱識別器間多様性指標算出部110は、識別結果ばらつき度の算出を行っていない弱識別器ペアが存在するか否かを判定する。この判定の結果、識別結果ばらつき度の算出を行っていない弱識別器ペアが存在する場合には、ステップS203に戻り、弱識別器間多様性指標算出部110は、その弱識別器ペアの識別結果ばらつき度を算出する。ステップS203とステップS204を繰り返すことで、弱識別器集合11の全ての弱識別器ペアについて、ステップS201で選択されたサンプルデータに対する識別結果ばらつき度が算出される。
次に、ステップS205では、弱識別器間多様性指標算出部110は、サンプルデータ群12の中に未選択のサンプルデータが存在するか否かを判定する。この判定の結果、未選択のサンプルデータが存在する場合には、ステップS201に戻り、弱識別器間多様性指標算出部110は、そのサンプルデータを選択する。ステップS201からステップS205のループを繰り返すことで、サンプルデータ群12の全てのサンプルデータに対して、弱識別器ペアの識別結果ばらつき度が算出される。
次に、ステップS206では、弱識別器間多様性指標算出部110は、ステップS201からステップS205のループで算出された各弱識別器ペアの全サンプルデータにおける識別結果ばらつき度の平均値を算出する。そして、弱識別器間多様性指標算出部110は、その各弱識別器ペアの全サンプルデータにおける識別結果ばらつき度の平均値を各弱識別器ペアの多様性指標として設定する。
以上の処理により、弱識別器間多様性指標算出部110は、弱識別器間の識別結果の多様性を表す指標を設定する。尚、本実施形態の弱識別器間多様性指標算出部110では、「サンプルデータの識別結果のばらつき度」を基準として弱識別器ペアの多様性指標を算出していればよい。従って、弱識別器ペアの多様性指標の算出方法や、識別結果ばらつき度の定義は、前述したものに限定されない。
ここで、弱識別器間多様性指標算出部110の処理の変形例を説明する。Hough Forestのように、画像の部分領域を入力として、識別対象の物体の重心への投票を行うことで、識別対象の物体を検出する方式における弱識別器多様性指標算出処理について、図3Dおよび図3Eに示す例を用いて説明する。図3D、Eは、各弱識別器が出力する識別結果が識別対象の物体の重心へのオフセットである場合の識別結果ばらつき度の算出過程の第1、第2の例を示す模式図である。ここでは、サンプル画像iが入力されたときに、弱識別器Aは、識別結果として3つの識別対象の物体の重心へのオフセットを出力し、弱識別器Bは、識別結果として5つの識別対象の物体の重心へのオフセットを出力するものとする。
この事例における多様性指標算出処理では、図2に示すステップS201で選択されるデータはサンプルデータの部分領域になる。サンプルデータ群12における全てのサンプルデータの全ての部分領域が、ステップS201からステップS205のループで評価されることになる。
また、識別結果ばらつき度は、例えば、弱識別器ごとの識別結果であるオフセット位置のばらつきで表現できる。オフセット位置のばらつきを指標化する方法の一例としては、サンプルデータの全領域を同一サイズの領域に分割し、各領域への投票が行われる頻度に応じて、識別対象の物体の重心の領域の尤度を設定する方法がある。具体的には、まず、弱識別器間多様性指標算出部110は、入力された部分領域を含むサンプルデータの全領域を同一サイズの領域に分割する。図3Dおよび図3Eに示す例では、サンプルデータiが24の領域に均等に分割される。次に、弱識別器間多様性指標算出部110は、各弱識別器における識別結果のオフセット位置が含まれる領域を調べ、識別対象の物体の重心が位置する領域の尤度を算出する。以下の説明では、識別対象の物体の重心が位置する領域の尤度を、必要に応じて、投票先領域尤度と称する。
投票先領域尤度は、例えば、識別結果であるオフセット位置の総数に対する、各領域に含まれるオフセット位置の割合で表すことができる。図3Dに示す例では、弱識別器Aにおいて、領域4に1票、領域18に1票、領域23に1票で計3票投票されている。従って、領域4、領域18、領域23の投票先領域尤度は、それぞれ0.33となる。一方、図3Eに示す例では、弱識別器Bにおいて、領域10に1票、領域14に1票、領域18に2票、領域23に1票で計5票投票されている。従って、領域10、領域14、領域23の投票先領域尤度は、それぞれ0.2となり、領域18の投票先領域尤度は、0.4となる。
弱識別器間多様性指標算出部110は、以上のようにして各弱識別器の投票先領域尤度を算出する。そして、弱識別器間多様性指標算出部110は、投票先領域尤度に基づいて、例えば、図3Cを参照しながら説明した尤度ヒストグラムの差Hを算出することで弱識別器Aと弱識別器Bの識別結果ばらつき度を算出する((3)式を参照)。弱識別器間多様性指標算出部110は、全てのサンプルデータの全ての部分領域について識別結果ばらつき度を算出し、それらの平均値を弱識別器Aと弱識別器Bの弱識別器間多様性指標とする。
尚、弱識別器による識別の結果、サンプルデータの部分領域が、識別対象の物体が存在しない領域である(Hough Forestでは、入力データがネガティブサンプルである)と判定される場合がある。識別対象の物体が存在しないと判定された領域は、弱識別器による識別処理の際に、識別対象の物体の重心の検出に寄与しない領域である。そのため、ステップS203における識別結果ばらつき度の算出において、入力されたサンプルデータの部分領域に、識別対象の物体が存在しないことが何れかの弱識別器で判定された場合、弱識別器間多様性指標算出部110は、次のようにする。即ち、弱識別器間多様性指標算出部110は、この部分領域における当該弱識別器を含む弱識別器ペアの識別結果ばらつき度を算出せず、識別器間の多様性指標の算出の集計(前述した例では、識別結果ばらつき度の平均値の算出対象)から除外する。このようにすることで、識別器間の多様性指標(弱識別器間多様性指標)の算出をより適切に行うことができる。
次に、図4に示すフローチャートおよび図5Aおよび図5Bに示す模式図を用いて、弱識別器組み合わせ選択部120の処理の一例を詳細に説明する。
弱識別器集合11の要素数がMであるとすると、弱識別器ペアのそれぞれに対し1つずつ弱識別器間多様性指標が算出されるので、弱識別器間多様性指標算出部110によって算出される弱識別器間多様性指標の総数は、以下の(4)式で表わされる。
Figure 0006659120
例えば、M=5であるときには、10個の弱識別器ペアの弱識別器間多様性指標が算出される。図5Aは、M=5のときの弱識別器間多様性指標の一例を示す図である。図5Aにおいて、各行と各列の交点の数値が各弱識別器ペアの弱識別器間多様性指標を表す。例えば、ID2の弱識別器とIDが4の弱識別器の弱識別器間多様性指標は0.749となる。弱識別器組み合わせ選択部120は、弱識別器間多様性指標に基づきM個の弱識別器集合からL個の弱識別器を選択する。
ステップS401では、弱識別器組み合わせ選択部120は、M個の弱識別器集合からL個を選択するComb(M,L)通りの組み合わせパターンの中から、後述する総和値の算出を行っていない組み合わせパターンを1つ選択する。Lは、アンサンブル識別器を構成する弱識別器の数である。
次に、ステップS402では、弱識別器組み合わせ選択部120は、ステップS401で選択されたL個の弱識別器の組み合わせパターンが持つComb(L,2)個の弱識別器間多様性指標の総和値を算出する。
次に、ステップS403では、弱識別器組み合わせ選択部120は、Comb(L,2)個の弱識別器間多様性指標の総和値の算出が行われていないL個の弱識別器パターンが存在するか否かを判定する。この判定の結果、Comb(L,2)個の弱識別器間多様性指標の総和値の算出が行われていないL個の弱識別器パターンが存在する場合には、ステップS401に戻る。そして、弱識別器組み合わせ選択部120は、Comb(L,2)個の弱識別器間多様性指標の総和値の算出が行われていない組み合わせパターンを選択する。ステップS401からステップS403のループを繰り返すことでComb(M,L)通りの全ての組み合わせパターンに対して弱識別器間多様性指標の総和値が算出される。
そして、ステップS404では、弱識別器組み合わせ選択部120は、L個の組み合わせパターンの中から、ステップS402で算出した弱識別器間多様性指標の総和値が最大となる組み合わせを探索し、その弱識別器組み合わせパターンを選択する。
以上の処理によって、弱識別器間多様性指標に基づいて、アンサンブル識別器を構成する適切な弱識別器の組み合わせを選択することができる。
図5Bは、M=5、L=3、即ち5個の弱識別器集合から3個の弱識別器の組み合わせを選択する場合の弱識別器組み合わせ選択部120の処理の一例を説明する図である。この場合、Comb(5,3)=20なので、組み合わせパターンは全部で20通り存在する。弱識別器組み合わせ選択部120は、それらの全ての組み合わせパターンに対して、弱識別器間多様性指標の総和値を算出する。
例えば、図5Bの一番左の表では、ID=2、3、4の弱識別器の組み合わせパターンについての弱識別器間多様性指標の総和値を示す。IDが2とIDが3の弱識別器ペアの多様性指標は0.675、IDが2とIDが4の弱識別器ペアの多様性指標は0.749、IDが3とIDが4の多様性指標は0.034である。従って、それらの総和値は1.458となる。弱識別器組み合わせ選択部120は、以上の処理を20通りの組み合わせパターンについて繰り返すことにより、全ての組み合わせパターンのそれぞれについての弱識別器間多様性指標の総和値を個別に算出する。そして、弱識別器組み合わせ選択部120は、当該総和値が最大となる組み合わせパターンを選択する。図5Bに示す例では、IDが0とIDが2とIDが3の弱識別器の組み合わせパターンについての弱識別器間多様性指標の総和値が2.364となり、全ての組み合わせパターンの中で最大となるため、その組み合わせパターンが選択される。
アンサンブル識別器生成部130は、弱識別器組み合わせ選択部120で選択されたL個の弱識別器を用いてアンサンブル識別器13を生成する。尚、複数の弱識別器を用いてアンサンブル識別器13を生成する方法は、公知の技術で実現できるので、ここでは、その詳細な説明を省略する。
以上のように本実施形態では、サンプルデータを弱識別器に入力して当該サンプルデータにおける識別対象の識別結果を得て、弱識別器ペアにおける識別結果のばらつき度を算出する。このような弱識別器ペアにおける識別結果のばらつき度の算出を、とり得る弱識別器ペア、複数のサンプルデータのそれぞれについて行う。そして、当該複数のサンプルデータを用いた場合の、弱識別器ペアにおける識別結果のばらつき度から、当該弱識別器ペアにおける識別結果の多様性を表す弱識別器間多様性指標を算出する。そして、アンサンブル識別器を構成する所定の個数の弱識別器の組み合わせパターンに含まれる弱識別器ペアにおける弱識別器間多様性指標に基づいて、当該所定の個数の弱識別器の組み合わせを選択する。そして、選択した弱識別器を用いてアンサンブル識別器を作成する。従って、クラス情報を持たない実撮影データを利用して、アンサンブル識別器を評価することが可能となる。このため、クラス情報を持たない実撮影データを利用しても、識別対象の識別に有用な弱識別器の組み合わせを選択することができ、高性能なアンサンブル識別器の作成が可能となる。
尚、本実施形態では、弱識別器間多様性指標算出部110が、弱識別器ペアの識別結果を比較して弱識別器間多様性指標を算出し、弱識別器組み合わせ選択部120が、弱識別器間多様性指標の総和値に基づき弱識別器の組み合わせを導出する場合を説明した。しかし、必ずしもこのようにする必要はない。例えば、以下のようにしてもよい。即ち、弱識別器間多様性指標算出部110においてL個(L>2)の弱識別器の識別結果を比較して、L個の弱識別器ペアの弱識別器間多様性指標を算出する。そして、弱識別器組み合わせ選択部120においてL個の弱識別器のペアの弱識別器間多様性指標が最大となる弱識別器の組み合わせを選択する。L個の弱識別器のペアの弱識別器間多様性指標の算出には、既存の手法を利用することができる。例えば、各弱識別器の識別結果を、集合の各要素とみなしてL個の集合の類似度を求めることで、弱識別器間多様性指標の算出を行える。
また、本実施形態では、識別器における識別対象のデータが画像データである場合を例に挙げて説明した。しかしながら、識別器における識別対象のデータは、画像データに限定されない。例えば、製造実績データであってもよい。また、識別器が、入力されるデータにおける識別対象が属するクラスを識別する場合を例に挙げて説明した。しかしながら、識別器は、入力されるデータにおける識別対象を識別するものであれば、このようなものに限定されない。例えば、識別対象の有無を識別する識別器を採用してもよい。
(第2の実施形態)
次に、第2の実施形態について説明する。本実施形態では、入力されたサンプルデータに対して分類処理を行い、その分類処理の結果に基づいて、当該サンプルデータにおける識別対象の識別結果を出力する方式の弱識別器を用いたアンサンブル識別器を用いる場合を例に挙げて説明する。このように本実施形態と第1の実施形態とは、弱識別器による識別対象の識別方法が異なることによる処理が主として異なる。従って、本実施形態の説明において、第1の実施形態と同一の部分については、図1〜図5Bに付した符号と同一の符号を付す等して詳細な説明を省略する。具体的に、本実施形態における情報処理装置の構成は、第1の実施形態と同様の構成である。また、図1に示す情報処理装置100における弱識別器組み合わせ選択部120およびアンサンブル識別器生成部130の処理についても第1の実施形態と同様である。従って、これらの詳細な説明を省略する。
入力されたサンプルデータに対して分類処理を行い、その分類処理の結果に基づいて、当該サンプルデータにおける識別対象の識別結果を出力する方式の弱識別器の一例として、決定木がある。図6は、決定木による識別の流れの一例を示す模式図である。まず、分類処理では、データが入力された決定木は、当該決定木の各ノードに設定されている分岐関数に当該データを当てはめ、その結果に基づき、当該データをいずれかの末端ノード(リーフ)に分類する。図6に示す例では、決定木Aにより、入力データiはリーフaに分類されていることを示す。
決定木の各リーフには、事前の学習処理によってクラス情報が格納されている。分類処理が行われた後、識別処理として、決定木は、入力されたデータの分類先であるリーフに格納されているクラス情報を、当該データにおける識別対象の識別結果として出力する。図6に示す例では、決定木Aによる入力データiの識別結果として、入力データiの分類先であるリーフaに格納されているクラス情報{クラスP、クラスQ}が出力される。尚、決定木自体は、公知の技術で実現することができるので、ここでは、その詳細な説明を省略する。
第1の実施形態においては、各弱識別器にサンプルデータを入力したときの識別結果に着目して弱識別器間多様性指標を算出する場合を例に挙げて説明した。これに対し、本実施形態では、各弱識別器にサンプルデータを入力したときの分類結果に着目して弱識別器間多様性指標を算出する。
図7に示すフローチャートを参照しながら、弱識別器間多様性指標算出部110の処理の一例を詳細に説明する。
ステップS701では、弱識別器間多様性指標算出部110は、サンプルデータ群12に含まれる全てのサンプルデータを、弱識別器集合11に含まれる全ての弱識別器に入力する。これにより、弱識別器集合11に含まれる各弱識別器は、自身に入力されたサンプルデータを分類する。
次に、ステップS702では、弱識別器間多様性指標算出部110はサンプルデータ群12から未選択のサンプルデータを1つ選択する。
次に、ステップS703では、弱識別器間多様性指標算出部110は、ステップS701で行った各弱識別器におけるサンプルデータの分類結果に基づき、分類結果ばらつき度が未算出である2つの弱識別器ペアの分類結果ばらつき度を算出する。ここで、分類結果ばらつき度とは、2つの弱識別器の分類結果が異なる度合いを表す指標である。2つの弱識別器間の分類結果の比較のため、ステップS701で行った全てのサンプルデータに対する分類結果を利用する。
弱識別器の分類結果であるリーフを集合、それぞれのリーフに分類された各サンプルデータを集合要素とみなす。弱識別器間多様性指標算出部110は、或るサンプルデータが2つの識別器へ入力されたときに、それぞれの弱識別器におけるそのサンプルデータが属する集合同士の類似度を集合間類似度として算出する。そして、弱識別器間多様性指標算出部110は、1から当該算出した集合間類似度を減算した値(=1−集合間類似度)を分類結果ばらつき度として導出する。2つの集合間の類似度は、第1の実施形態において、弱識別器が複数のクラス情報を識別結果として出力する場合の識別結果ばらつき度を算出する場合と同様に、ジャッカード係数Jやダイス係数Dを用いて算出することができる。
ステップS704からステップS706の処理は、第1の実施形態におけるステップS204からステップS206の処理と同様であるため、詳細な説明を省略する。尚、ステップS706では、弱識別器間多様性指標算出部110は、識別結果ばらつき度を用いる代わりに、分類結果ばらつき度を用いて、各弱識別器ペアの弱識別器間多様性指標を設定(導出)する。
図8は、弱識別器Aと弱識別器Bに対して、サンプルデータ1が入力されたときの分類結果ばらつき度を算出する過程の一例を示す模式図である。サンプルデータ1は、弱識別器Aによって分類結果aに分類され、また、弱識別器Bによって分類結果bに分類される。サンプルデータ1と同様に弱識別器Aによって分類結果aに分類された全てのサンプルデータを含む分類結果aの集合と、弱識別器Bによって分類結果bに分類された全てのサンプルデータを含む分類結果bの集合とを比較する。この比較の結果に基づいて分類結果ばらつき度が算出される。
図8に示す事例では、分類結果aの集合と分類結果bの集合との集合間類似度が算出される。分類結果aの集合は、{サンプルデータ1、サンプルデータ3、サンプルデータ4、サンプルデータ7}を要素に持つ集合である。分類結果bの集合は、{サンプルデータ1、サンプルデータ2、サンプルデータ3、サンプルデータ5、サンプルデータ8}を要素に持つ集合である。この場合、分類結果aの集合と分類結果bの集合との共通要素は{サンプルデータ1、サンプルデータ3}である。従って、ジャッカード係数Jを用いた場合の集合間類似度は、(1)式より、2/7、ダイス係数Dを用いた場合の集合間類似度は、(2)式より4/9(=2×2/9)となる。これと同様に、弱識別器間多様性指標算出部110は、サンプルデータ群12に含まれる全てのサンプルデータについて、それぞれのサンプルデータが弱識別器Aによって分類された分類結果の集合と弱識別器Bによって分類された分類結果の集合とを比較する。そして、弱識別器間多様性指標算出部110は、算出した分類結果ばらつき度の平均をとることで弱識別器Aと弱識別器Bの弱識別器間多様性指標を算出する。
以上のように本実施形態では、決定木のような、入力されるサンプルデータに対して分類処理を行い、その分類処理の結果に基づいて識別結果を出力する弱識別器を用いる場合でも、第1の実施形態で説明した効果と同様の効果を得ることができる。即ち、それぞれの弱識別器が学習したクラス情報を用いることなく、サンプルデータの分類処理の結果のみを使って弱識別器間多様性指標を算出することができる。
尚、弱識別器間多様性指標算出部110において、更に第1の実施形態で説明した識別結果ばらつき度に基づく弱識別器間多様性指標を算出してもよい。この場合、例えば、弱識別器組み合わせ選択部120は、識別結果ばらつき度に基づく弱識別器間多様性指標と分類結果ばらつき度に基づく弱識別器間多様性指標を組み合わせて、アンサンブル識別器を構成する弱識別器を選択してもよい。また、本実施形態でも、第1の実施形態で説明した変形例を採用することができる。
(第3の実施形態)
次に、第3の実施形態について説明する。本実施形態では、データの識別時に使用するメモリ量、データの識別時の処理速度、および識別結果の精度の少なくとも1つを設定し、その設定値に応じてアンサンブル識別器を構成する弱識別器の数を変更する。このように本実施形態と第1の実施形態とは、アンサンブル識別器を生成する際の構成および処理が主として異なる。従って、本実施形態の説明において、第1の実施形態と同一の部分については、図1〜図5に付した符号と同一の符号を付して詳細な説明を省略する。
アンサンブル識別器は、一般に、自身に用いられる弱識別器の個数が増すにつれ性能が向上していき、最終的に性能は飽和する。そのため、識別処理を行った際にアンサンブル識別器が所望の精度を達成しない場合には、より多数の弱識別器を用いて構成されるアンサンブル識別器を用いて識別処理を行う方法が有効である。一方で、アンサンブル識別器を構成する弱識別器の個数が増すにつれ、アンサンブル識別器の容量や識別処理にかかる時間も増大する。そのため、識別処理における実行メモリの負荷軽減や処理時間の短縮を行いたいときには、少数の弱識別器を用いて構成されるアンサンブル識別器を用いて識別を行えばよい。
図9は、アンサンブル識別器構築システムの基本的な構成の一例を示す図である。本実施形態では、アンサンブル識別器構築システムは、弱識別器の組み合わせを算出する情報処理装置200と、識別処理を行う物体識別装置300とを有する。
情報処理装置200は、弱識別器間多様性指標算出部210と弱識別器組み合わせ選択部220とを有する。
弱識別器間多様性指標算出部210は、第1の実施形態における弱識別器間多様性指標算出部110と同様に、弱識別器集合21とサンプルデータ群22とを入力として弱識別器間の多様性を表す指標(弱識別器間多様性指標)を算出する。
弱識別器組み合わせ選択部220は、第1の実施形態における弱識別器組み合わせ選択部220と同様に、弱識別器間多様性指標算出部210によって算出された弱識別器間多様性指標に基づいて、所定の個数の弱識別器を選択する。ただし、第1の実施形態と異なる点として、弱識別器組み合わせ選択部220は、複数の弱識別器の組み合わせとして複数の組み合わせを選択する。即ち、前記所定の個数の候補が複数ある。弱識別器組み合わせ選択部220は、前記所定の個数のそれぞれの場合において選択した弱識別器の組み合わせを、選択弱識別器組み合わせリスト23として出力する。
物体識別装置300は、目標値設定部310と、アンサンブル識別器生成部320と、識別部330とを有する。
目標値設定部310は、ユーザによって入力された目標値を設定する。
アンサンブル識別器生成部320は、情報処理装置200から出力された選択弱識別器組み合わせリスト23と、目標値設定部310によって設定された目標値とに基づき、アンサンブル識別器を生成する。
識別部330は、アンサンブル識別器生成部320によって生成されたアンサンブル識別器を用いて識別対象データ31の識別を行い、その結果を識別結果32として出力する。
図10のフローチャートを参照しながら、アンサンブル識別器構築システム(情報処理装置200および物体識別装置300)の処理の一例を説明する。
ステップS1001では、弱識別器間多様性指標算出部210は、弱識別器集合21に含まれる弱識別器群の全ての弱識別器ペアに対して弱識別器間多様性指標を算出する。具体的な処理は、第1の実施形態における図2または第2の実施形態における図7のフローチャートを参照しながら説明した処理と同様であるため、その詳細な説明を省略する。
次に、ステップS1002では、弱識別器組み合わせ選択部220は、選択する弱識別器の個数を複数パターン設定する。予め用意された弱識別器の数をNとすると、弱識別器組み合わせ選択部220は、2〜N−1までの全ての個数を指定してもよいし、計算量の削減のために所定数おきに個数を指定してもよい。
次に、ステップS1003では、弱識別器組み合わせ選択部220は、ステップS1001で算出された弱識別器間多様性指標に基づいて、ステップS1003で指定した個数における適切な弱識別器の組み合わせを選択する。弱識別器の組み合わせを算出する処理は、第1の実施形態における図4のフローチャートを参照しながら説明した処理と同様であるため、その詳細な説明を省略する。
ステップS1004では、目標値設定部310は、アンサンブル識別器を用いた識別処理における目標値を設定する。ここでは、識別処理に使用するメモリ量(容量)、識別処理時に要求される処理速度(識別処理の実行速度)のいずれかが目標値として設定されるものとする。目標値設定部310は、例えば、ユーザにより指定されたメモリ量を設定することができる。また、目標値設定部310は、識別時に使用できる最大メモリ量から、識別処理に使用するメモリ量を設定してもよい。また、目標値設定部310は、ユーザにより指定された処理速度を設定してもよいし、予め設定された全体の処理時間から処理速度を算出してもよい。尚、ステップS1001〜1003とステップS1004は独立な処理である。ステップS1001〜1003とステップS1004を並列処理してもよいし、一方を先に処理し他方を後に処理してもよい。
以上のステップS1001〜S1004の処理が終わると、ステップS1005に進む。ステップS1005では、アンサンブル識別器生成部320は、ステップS1004で設定された目標値を満たす弱識別器の個数を設定する。
識別処理に使用するメモリ量は、アンサンブル識別器を構成する弱識別器のサイズから算出することができる。従って、アンサンブル識別器生成部320は、ステップS1003で選択された弱識別器の組み合わせで識別処理を行う場合に使用するメモリ量を算出し、算出したメモリ量が目標値を満たすような個数を選択することができる。
また、アンサンブル識別器における識別処理では、弱識別器による識別処理を行い、その識別結果を集計することで最終的な識別結果を出力する。そして、アンサンブル識別器の識別処理時の実行速度は、弱識別器の個数に比例する。このため、予め弱識別器単体の識別処理時の実行速度を計測しておくことで、アンサンブル識別器生成部320は、要求速度(目標値)を満たす弱識別器の数を逆算することが可能である。
次に、ステップS1006では、アンサンブル識別器生成部320は、ステップS1003で選択された弱識別器の組み合わせのうち、ステップS1005で設定された個数の弱識別器の組み合わせの弱識別器を用いてアンサンブル識別器を生成する。
次に、ステップS1007では、識別部330は、ステップS1006で生成されたアンサンブル識別器を用いて、入力された識別対象データ31に対する識別処理を行う。
次に、ステップS1008では、識別部330は、ステップS1007で行った識別処理の結果(識別結果)が、所望の性能(使用メモリ量もしくは実行速度)を満たすか否かを判定する。
識別対象の物体の識別結果の他に、最大メモリ使用量や実行速度のログが識別結果に含まれる場合には、例えば、以下のようにステップS1008の判定を行うことができる。即ち、ユーザがログを参照して、所望の性能を満たすかどうかを指示し、識別部330は、その指示の内容に基づいて、識別結果が、所望の性能を満たすか否かを判定することができる。
以上のステップS1008の判定の結果、識別結果が所望の性能を満たしている場合には、識別部330は、識別結果32を出力し、図10のフローチャートによる処理を終了する。
一方、識別結果が所望の性能を満たしていない場合には、ステップS1005に戻り、アンサンブル識別器生成部320は、より少ない弱識別器の個数を設定する。
以上のように本実施形態では、設定された目標値、即ち識別処理の際に使用するメモリ量、あるいは識別処理の際に要求される処理速度を満たす弱識別器の個数を導出し、導出した個数の弱識別器からなる弱識別器の組み合わせパターンを選択する。従って、設定された目標値に応じてアンサンブル識別器を構成する弱識別器の個数を動的に設定することで、第1の実施形態で説明した効果に加え、以下の効果を奏する。即ち、所定の条件を満たす中でより高性能なアンサンブル識別器を生成することができると共に、識別処理時の省メモリ化や識別処理の高速化を実現することができる。
尚、本実施形態の物体識別装置300を、第2の実施形態に適用することもできる。また、アンサンブル識別器構築システム(情報処理装置200および物体識別装置300)を1つの装置で構成してもよい。
尚、前述した実施形態は、何れも本発明を実施するにあたっての具体化の例を示したものに過ぎず、これらによって本発明の技術的範囲が限定的に解釈されてはならないものである。すなわち、本発明はその技術思想、又はその主要な特徴から逸脱することなく、様々な形で実施することができる。
(その他の実施例)
本発明は、以下の処理を実行することによっても実現される。即ち、まず、以上の実施形態の機能を実現するソフトウェア(コンピュータプログラム)を、ネットワーク又は各種記憶媒体を介してシステム或いは装置に供給する。そして、そのシステム或いは装置のコンピュータ(又はCPUやMPU等)が当該コンピュータプログラムを読み出して実行する。
11:弱識別器集合、12:サンプルデータ群、13:アンサンブル識別器、100:情報処理装置、110:弱識別器間多様性指標算出部、120:弱識別器組み合わせ選択部、130:アンサンブル識別器生成部

Claims (12)

  1. アンサンブル識別器を構成する複数の弱識別器を選択するための処理を行う情報処理装置であって、
    前記アンサンブル識別器を構成する弱識別器の候補を入力する入力手段と、
    前記入力手段により入力された候補のうち、少なくとも2つの前記弱識別器に対して同じデータを与え、当該弱識別器のそれぞれにおいて当該データに対する識別処理を行う際に得られる情報を比較し、比較した結果に基づいて、当該少なくとも2つの弱識別器間の識別結果の多様性を表す指標を導出することを、前記少なくとも2つの弱識別器の複数の組み合わせのそれぞれについて行う導出手段と、
    前記導出手段により導出された、前記少なくとも2つの前記弱識別器間の識別結果の多様性を表す指標に基づいて、前記アンサンブル識別器を構成する前記複数の弱識別器の数の候補のそれぞれについて、前記複数の弱識別器の組み合わせを選択する処理手段と、を有することを特徴とする情報処理装置。
  2. 前記処理手段は、前記選択された前記複数の弱識別器の組み合わせを用いて前記アンサンブル識別器を生成する生成手段をさらに有することを特徴とする請求項1に記載の情報処理装置。
  3. 前記識別処理を行う際に得られる情報は、前記識別器による識別対象の識別の結果であることを特徴とする請求項1または2に記載の情報処理装置。
  4. 前記弱識別器は、入力されたデータを分類し、当該分類した結果に基づいて識別対象の識別の結果を出力し、
    前記識別処理を行う際に得られる情報は、前記識別器による前記分類の結果であることを特徴とする請求項1または2に記載の情報処理装置。
  5. 前記データにはラベルが付与されていないことを特徴とする請求項1〜4の何れか1項に記載の情報処理装置。
  6. 前記導出手段は、前記入力手段により入力された候補のうち、少なくとも2つの前記弱識別器に対して同じデータを与えて、当該弱識別器のそれぞれにおいて当該データに対する識別処理を行う際に得られる情報を取得することを、複数の前記データのそれぞれについて行う手段と、
    前記識別処理を行う際に得られる情報に基づいて、前記少なくとも2つの前記弱識別器における、前記識別処理を行う際に得られる情報のばらつき度を導出する手段と、
    前記識別処理を行う際に得られる情報のばらつき度に基づいて、前記少なくとも2つの弱識別器間の識別結果の多様性を表す指標を導出する手段と、をさらに有することを特徴とする請求項1〜5の何れか1項に記載の情報処理装置。
  7. 前記導出手段は、前記入力手段により入力された候補のうち、少なくとも2つの前記弱識別器に対して同じデータを与え、当該弱識別器のそれぞれにおいて当該データに対する識別処理を行った結果、当該データが識別対象の識別に寄与しない場合、当該データを用いた場合の、前記識別処理を行う際に得られる情報のばらつき度の導出を行わないことを特徴とする請求項に記載の情報処理装置。
  8. 前記複数の弱識別器の数は、所定の数であることを特徴とする請求項1〜の何れか1項に記載の情報処理装置。
  9. 請求項に記載の情報処理装置を有するアンサンブル識別器構築システムであって、
    前記アンサンブル識別器による識別処理に関する目標値を設定する目標値設定手段と、
    前記目標値を達成する前記弱識別器の数を導出し、前記選択された前記複数の弱識別器の組み合わせのうち、当該導出した数の前記複数の弱識別器の組み合わせを用いて前記アンサンブル識別器を生成する生成手段と、を有することを特徴とするアンサンブル識別器構築システム。
  10. 前記目標値は、前記アンサンブル識別器による識別が行われる際に使用されるメモリ量および前記アンサンブル識別器による識別が行われる際の処理速度のうち少なくとも1つを含むことを特徴とする請求項に記載のアンサンブル識別器構築システム。
  11. アンサンブル識別器を構成する複数の弱識別器を選択するための処理を行う情報処理方法であって、
    前記アンサンブル識別器を構成する弱識別器の候補を入力する入力工程と、
    前記入力工程により入力された候補のうち、少なくとも2つの前記弱識別器に対して同じデータを与え、当該弱識別器のそれぞれにおいて当該データに対する識別処理を行う際に得られる情報を比較し、比較した結果に基づいて、当該少なくとも2つの弱識別器間の識別結果の多様性を表す指標を導出することを、前記少なくとも2つの弱識別器の複数の組み合わせのそれぞれについて行う導出工程と、
    前記導出工程により導出された、前記少なくとも2つの前記弱識別器間の識別結果の多様性を表す指標に基づいて、前記アンサンブル識別器を構成する前記複数の弱識別器の数の候補のそれぞれについて、前記複数の弱識別器の組み合わせを選択する処理工程と、を有することを特徴とする情報処理方法。
  12. 請求項1〜の何れか1項に記載の情報処理装置の各手段としてコンピュータを機能させることを特徴とするプログラム。
JP2015218444A 2015-11-06 2015-11-06 情報処理装置、情報処理方法、およびプログラム Active JP6659120B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2015218444A JP6659120B2 (ja) 2015-11-06 2015-11-06 情報処理装置、情報処理方法、およびプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2015218444A JP6659120B2 (ja) 2015-11-06 2015-11-06 情報処理装置、情報処理方法、およびプログラム

Publications (2)

Publication Number Publication Date
JP2017091083A JP2017091083A (ja) 2017-05-25
JP6659120B2 true JP6659120B2 (ja) 2020-03-04

Family

ID=58768575

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015218444A Active JP6659120B2 (ja) 2015-11-06 2015-11-06 情報処理装置、情報処理方法、およびプログラム

Country Status (1)

Country Link
JP (1) JP6659120B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022003824A1 (ja) * 2020-06-30 2022-01-06 日本電気株式会社 学習装置、学習方法および記録媒体
JP7479591B2 (ja) * 2021-02-26 2024-05-09 株式会社アダコテック アンサンブル学習システムおよびアンサンブル学習プログラム

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5123759B2 (ja) * 2008-06-30 2013-01-23 キヤノン株式会社 パターン検出器の学習装置、学習方法及びプログラム
JP5856235B2 (ja) * 2014-06-12 2016-02-09 株式会社ユニバーサルエンターテインメント 遊技用装置

Also Published As

Publication number Publication date
JP2017091083A (ja) 2017-05-25

Similar Documents

Publication Publication Date Title
Umadevi et al. A survey on data mining classification algorithms
CN108023876B (zh) 基于可持续性集成学习的入侵检测方法及入侵检测***
JP5880454B2 (ja) 画像識別装置及びプログラム
Agusta Modified balanced random forest for improving imbalanced data prediction
US20190340507A1 (en) Classifying data
JP2013250809A (ja) 多クラス識別器、方法、およびプログラム
JP7173332B2 (ja) 不正検知装置、不正検知方法および不正検知プログラム
JP2018181290A (ja) 改良した情報測定とgaに基づくフィルター式特徴選択アルゴリズム
JP2016191966A (ja) クラスタリング装置及び機械学習装置
US10635991B2 (en) Learning method, information processing device, and recording medium
KR102267487B1 (ko) 메타데이터를 이용한 독립 분류 모델의 동작 방법 및 그 장치
Shoohi et al. DCGAN for Handling Imbalanced Malaria Dataset based on Over-Sampling Technique and using CNN.
WO2016158768A1 (ja) クラスタリング装置及び機械学習装置
JPWO2015146113A1 (ja) 識別辞書学習システム、識別辞書学習方法および識別辞書学習プログラム
JP6659120B2 (ja) 情報処理装置、情報処理方法、およびプログラム
JP5765583B2 (ja) 多クラス識別器、多クラス識別方法、及びプログラム
JP5892275B2 (ja) 多クラス識別器生成装置、データ識別装置、多クラス識別器生成方法、データ識別方法、及びプログラム
CN104468276A (zh) 基于随机抽样多分类器的网络流量识别方法
CN111488400B (zh) 数据分类方法、装置和计算机可读存储介质
US9792561B2 (en) Learning method, information conversion device, and recording medium
JP6356015B2 (ja) 遺伝子発現情報解析装置、遺伝子発現情報解析方法、及びプログラム
Maheta et al. Classification of imbalanced data sets using multi objective genetic programming
CN111598116A (zh) 数据分类方法、装置、电子设备及可读存储介质
JP7306460B2 (ja) 敵対的事例検知システム、方法およびプログラム
Mandli et al. Selection of most relevant features from high dimensional data using ig-ga hybrid approach

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20181105

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190716

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190913

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20200107

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20200204

R151 Written notification of patent or utility model registration

Ref document number: 6659120

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151