JP6659120B2 - 情報処理装置、情報処理方法、およびプログラム - Google Patents
情報処理装置、情報処理方法、およびプログラム Download PDFInfo
- Publication number
- JP6659120B2 JP6659120B2 JP2015218444A JP2015218444A JP6659120B2 JP 6659120 B2 JP6659120 B2 JP 6659120B2 JP 2015218444 A JP2015218444 A JP 2015218444A JP 2015218444 A JP2015218444 A JP 2015218444A JP 6659120 B2 JP6659120 B2 JP 6659120B2
- Authority
- JP
- Japan
- Prior art keywords
- weak
- classifier
- identification
- ensemble
- weak classifiers
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Image Analysis (AREA)
Description
本発明は、このような問題点に鑑みてなされたものであり、ラベルが付与されたサンプルデータを用いなくても、複数の弱識別器から識別対象の識別に有用な弱識別器の組み合わせを選択できるようにすることを目的とする。
(第1の実施形態)
まず、第1の実施形態について説明する。
アンサンブル識別器は、複数の弱識別器を組み合わせて高精度な識別を行う識別器である。しかし、弱識別器の数に比例してアンサンブル識別器の容量は増大する。このため、実行環境の都合でアンサンブル識別器の容量に制限がある場合には、予めアンサンブル識別器を構成する弱識別器の数を制限してアンサンブル識別器の作成を行う必要がある。
弱識別器組み合わせ選択部120は、弱識別器間多様性指標算出部110によって算出された弱識別器間多様性指標に基づいて所定の数の弱識別器を選択する。所定の数は、アンサンブル識別器を構成する弱識別器の数である。
アンサンブル識別器生成部130は、弱識別器組み合わせ選択部120で選択された弱識別器を用いてアンサンブル識別器を生成する。
以下に、情報処理装置100の動作の一例について詳細に説明する。
本実施形態のアンサンブル識別器における弱識別器は、ランダムに解を出力する識別器よりは高精度な識別を行う識別器であって、識別対象のクラス情報が付与された学習データを用いて学習が行われる識別器である。本実施形態では、弱識別器の学習は事前に行われているものとする。ただし、情報処理装置100は、学習データ群を入力し、弱識別器間多様性指標算出部110による処理が実行される前に、当該学習データ群を用いて弱識別器の学習を行ってもよい。弱識別器の学習方法は、例えば、Adaboostを用いた公知の方法により実現することができるので、ここでは、その詳細な説明を省略する。
また、本実施形態では、アンサンブル識別器(アンサンブル識別器を構成する弱識別器の数と同数の弱識別器の組み合わせ)の候補を、サンプルデータを用いて評価し、その結果に基づいて最終的なアンサンブル識別器を作成する。このようにすることによって、より高性能なアンサンブル識別器を作成することができる。特徴的な一部のサンプルデータの影響を小さくし、識別器に対する評価の信頼性を増すために、サンプルデータは大量に用意されることが望ましい。
ステップS201では、弱識別器間多様性指標算出部110は、サンプルデータ群12から未選択のサンプルデータを1つ選択する。
次に、ステップS202では、弱識別器間多様性指標算出部110は、予め用意された弱識別器集合11に属する全ての弱識別器に、ステップS201で選択されたサンプルデータを入力する。そして、それらの弱識別器のそれぞれにおいて、当該サンプルデータが属するクラスの識別を行う。弱識別器間多様性指標算出部110は、そのサンプルデータの識別結果を取得する。この処理によって各弱識別器はそれぞれが独立に、選択されたサンプルデータの識別結果を出力する。
弱識別器集合11の要素数がMであるとすると、弱識別器ペアのそれぞれに対し1つずつ弱識別器間多様性指標が算出されるので、弱識別器間多様性指標算出部110によって算出される弱識別器間多様性指標の総数は、以下の(4)式で表わされる。
次に、ステップS402では、弱識別器組み合わせ選択部120は、ステップS401で選択されたL個の弱識別器の組み合わせパターンが持つComb(L,2)個の弱識別器間多様性指標の総和値を算出する。
以上の処理によって、弱識別器間多様性指標に基づいて、アンサンブル識別器を構成する適切な弱識別器の組み合わせを選択することができる。
次に、第2の実施形態について説明する。本実施形態では、入力されたサンプルデータに対して分類処理を行い、その分類処理の結果に基づいて、当該サンプルデータにおける識別対象の識別結果を出力する方式の弱識別器を用いたアンサンブル識別器を用いる場合を例に挙げて説明する。このように本実施形態と第1の実施形態とは、弱識別器による識別対象の識別方法が異なることによる処理が主として異なる。従って、本実施形態の説明において、第1の実施形態と同一の部分については、図1〜図5Bに付した符号と同一の符号を付す等して詳細な説明を省略する。具体的に、本実施形態における情報処理装置の構成は、第1の実施形態と同様の構成である。また、図1に示す情報処理装置100における弱識別器組み合わせ選択部120およびアンサンブル識別器生成部130の処理についても第1の実施形態と同様である。従って、これらの詳細な説明を省略する。
ステップS701では、弱識別器間多様性指標算出部110は、サンプルデータ群12に含まれる全てのサンプルデータを、弱識別器集合11に含まれる全ての弱識別器に入力する。これにより、弱識別器集合11に含まれる各弱識別器は、自身に入力されたサンプルデータを分類する。
次に、ステップS703では、弱識別器間多様性指標算出部110は、ステップS701で行った各弱識別器におけるサンプルデータの分類結果に基づき、分類結果ばらつき度が未算出である2つの弱識別器ペアの分類結果ばらつき度を算出する。ここで、分類結果ばらつき度とは、2つの弱識別器の分類結果が異なる度合いを表す指標である。2つの弱識別器間の分類結果の比較のため、ステップS701で行った全てのサンプルデータに対する分類結果を利用する。
ステップS704からステップS706の処理は、第1の実施形態におけるステップS204からステップS206の処理と同様であるため、詳細な説明を省略する。尚、ステップS706では、弱識別器間多様性指標算出部110は、識別結果ばらつき度を用いる代わりに、分類結果ばらつき度を用いて、各弱識別器ペアの弱識別器間多様性指標を設定(導出)する。
次に、第3の実施形態について説明する。本実施形態では、データの識別時に使用するメモリ量、データの識別時の処理速度、および識別結果の精度の少なくとも1つを設定し、その設定値に応じてアンサンブル識別器を構成する弱識別器の数を変更する。このように本実施形態と第1の実施形態とは、アンサンブル識別器を生成する際の構成および処理が主として異なる。従って、本実施形態の説明において、第1の実施形態と同一の部分については、図1〜図5に付した符号と同一の符号を付して詳細な説明を省略する。
情報処理装置200は、弱識別器間多様性指標算出部210と弱識別器組み合わせ選択部220とを有する。
弱識別器組み合わせ選択部220は、第1の実施形態における弱識別器組み合わせ選択部220と同様に、弱識別器間多様性指標算出部210によって算出された弱識別器間多様性指標に基づいて、所定の個数の弱識別器を選択する。ただし、第1の実施形態と異なる点として、弱識別器組み合わせ選択部220は、複数の弱識別器の組み合わせとして複数の組み合わせを選択する。即ち、前記所定の個数の候補が複数ある。弱識別器組み合わせ選択部220は、前記所定の個数のそれぞれの場合において選択した弱識別器の組み合わせを、選択弱識別器組み合わせリスト23として出力する。
目標値設定部310は、ユーザによって入力された目標値を設定する。
アンサンブル識別器生成部320は、情報処理装置200から出力された選択弱識別器組み合わせリスト23と、目標値設定部310によって設定された目標値とに基づき、アンサンブル識別器を生成する。
識別部330は、アンサンブル識別器生成部320によって生成されたアンサンブル識別器を用いて識別対象データ31の識別を行い、その結果を識別結果32として出力する。
ステップS1001では、弱識別器間多様性指標算出部210は、弱識別器集合21に含まれる弱識別器群の全ての弱識別器ペアに対して弱識別器間多様性指標を算出する。具体的な処理は、第1の実施形態における図2または第2の実施形態における図7のフローチャートを参照しながら説明した処理と同様であるため、その詳細な説明を省略する。
識別処理に使用するメモリ量は、アンサンブル識別器を構成する弱識別器のサイズから算出することができる。従って、アンサンブル識別器生成部320は、ステップS1003で選択された弱識別器の組み合わせで識別処理を行う場合に使用するメモリ量を算出し、算出したメモリ量が目標値を満たすような個数を選択することができる。
次に、ステップS1007では、識別部330は、ステップS1006で生成されたアンサンブル識別器を用いて、入力された識別対象データ31に対する識別処理を行う。
次に、ステップS1008では、識別部330は、ステップS1007で行った識別処理の結果(識別結果)が、所望の性能(使用メモリ量もしくは実行速度)を満たすか否かを判定する。
尚、本実施形態の物体識別装置300を、第2の実施形態に適用することもできる。また、アンサンブル識別器構築システム(情報処理装置200および物体識別装置300)を1つの装置で構成してもよい。
本発明は、以下の処理を実行することによっても実現される。即ち、まず、以上の実施形態の機能を実現するソフトウェア(コンピュータプログラム)を、ネットワーク又は各種記憶媒体を介してシステム或いは装置に供給する。そして、そのシステム或いは装置のコンピュータ(又はCPUやMPU等)が当該コンピュータプログラムを読み出して実行する。
Claims (12)
- アンサンブル識別器を構成する複数の弱識別器を選択するための処理を行う情報処理装置であって、
前記アンサンブル識別器を構成する弱識別器の候補を入力する入力手段と、
前記入力手段により入力された候補のうち、少なくとも2つの前記弱識別器に対して同じデータを与え、当該弱識別器のそれぞれにおいて当該データに対する識別処理を行う際に得られる情報を比較し、比較した結果に基づいて、当該少なくとも2つの弱識別器間の識別結果の多様性を表す指標を導出することを、前記少なくとも2つの弱識別器の複数の組み合わせのそれぞれについて行う導出手段と、
前記導出手段により導出された、前記少なくとも2つの前記弱識別器間の識別結果の多様性を表す指標に基づいて、前記アンサンブル識別器を構成する前記複数の弱識別器の数の候補のそれぞれについて、前記複数の弱識別器の組み合わせを選択する処理手段と、を有することを特徴とする情報処理装置。 - 前記処理手段は、前記選択された前記複数の弱識別器の組み合わせを用いて前記アンサンブル識別器を生成する生成手段をさらに有することを特徴とする請求項1に記載の情報処理装置。
- 前記識別処理を行う際に得られる情報は、前記識別器による識別対象の識別の結果であることを特徴とする請求項1または2に記載の情報処理装置。
- 前記弱識別器は、入力されたデータを分類し、当該分類した結果に基づいて識別対象の識別の結果を出力し、
前記識別処理を行う際に得られる情報は、前記識別器による前記分類の結果であることを特徴とする請求項1または2に記載の情報処理装置。 - 前記データにはラベルが付与されていないことを特徴とする請求項1〜4の何れか1項に記載の情報処理装置。
- 前記導出手段は、前記入力手段により入力された候補のうち、少なくとも2つの前記弱識別器に対して同じデータを与えて、当該弱識別器のそれぞれにおいて当該データに対する識別処理を行う際に得られる情報を取得することを、複数の前記データのそれぞれについて行う手段と、
前記識別処理を行う際に得られる情報に基づいて、前記少なくとも2つの前記弱識別器における、前記識別処理を行う際に得られる情報のばらつき度を導出する手段と、
前記識別処理を行う際に得られる情報のばらつき度に基づいて、前記少なくとも2つの弱識別器間の識別結果の多様性を表す指標を導出する手段と、をさらに有することを特徴とする請求項1〜5の何れか1項に記載の情報処理装置。 - 前記導出手段は、前記入力手段により入力された候補のうち、少なくとも2つの前記弱識別器に対して同じデータを与え、当該弱識別器のそれぞれにおいて当該データに対する識別処理を行った結果、当該データが識別対象の識別に寄与しない場合、当該データを用いた場合の、前記識別処理を行う際に得られる情報のばらつき度の導出を行わないことを特徴とする請求項6に記載の情報処理装置。
- 前記複数の弱識別器の数は、所定の数であることを特徴とする請求項1〜7の何れか1項に記載の情報処理装置。
- 請求項1に記載の情報処理装置を有するアンサンブル識別器構築システムであって、
前記アンサンブル識別器による識別処理に関する目標値を設定する目標値設定手段と、
前記目標値を達成する前記弱識別器の数を導出し、前記選択された前記複数の弱識別器の組み合わせのうち、当該導出した数の前記複数の弱識別器の組み合わせを用いて前記アンサンブル識別器を生成する生成手段と、を有することを特徴とするアンサンブル識別器構築システム。 - 前記目標値は、前記アンサンブル識別器による識別が行われる際に使用されるメモリ量および前記アンサンブル識別器による識別が行われる際の処理速度のうち少なくとも1つを含むことを特徴とする請求項9に記載のアンサンブル識別器構築システム。
- アンサンブル識別器を構成する複数の弱識別器を選択するための処理を行う情報処理方法であって、
前記アンサンブル識別器を構成する弱識別器の候補を入力する入力工程と、
前記入力工程により入力された候補のうち、少なくとも2つの前記弱識別器に対して同じデータを与え、当該弱識別器のそれぞれにおいて当該データに対する識別処理を行う際に得られる情報を比較し、比較した結果に基づいて、当該少なくとも2つの弱識別器間の識別結果の多様性を表す指標を導出することを、前記少なくとも2つの弱識別器の複数の組み合わせのそれぞれについて行う導出工程と、
前記導出工程により導出された、前記少なくとも2つの前記弱識別器間の識別結果の多様性を表す指標に基づいて、前記アンサンブル識別器を構成する前記複数の弱識別器の数の候補のそれぞれについて、前記複数の弱識別器の組み合わせを選択する処理工程と、を有することを特徴とする情報処理方法。 - 請求項1〜8の何れか1項に記載の情報処理装置の各手段としてコンピュータを機能させることを特徴とするプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015218444A JP6659120B2 (ja) | 2015-11-06 | 2015-11-06 | 情報処理装置、情報処理方法、およびプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015218444A JP6659120B2 (ja) | 2015-11-06 | 2015-11-06 | 情報処理装置、情報処理方法、およびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2017091083A JP2017091083A (ja) | 2017-05-25 |
JP6659120B2 true JP6659120B2 (ja) | 2020-03-04 |
Family
ID=58768575
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015218444A Active JP6659120B2 (ja) | 2015-11-06 | 2015-11-06 | 情報処理装置、情報処理方法、およびプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6659120B2 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2022003824A1 (ja) * | 2020-06-30 | 2022-01-06 | 日本電気株式会社 | 学習装置、学習方法および記録媒体 |
JP7479591B2 (ja) * | 2021-02-26 | 2024-05-09 | 株式会社アダコテック | アンサンブル学習システムおよびアンサンブル学習プログラム |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5123759B2 (ja) * | 2008-06-30 | 2013-01-23 | キヤノン株式会社 | パターン検出器の学習装置、学習方法及びプログラム |
JP5856235B2 (ja) * | 2014-06-12 | 2016-02-09 | 株式会社ユニバーサルエンターテインメント | 遊技用装置 |
-
2015
- 2015-11-06 JP JP2015218444A patent/JP6659120B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2017091083A (ja) | 2017-05-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Umadevi et al. | A survey on data mining classification algorithms | |
CN108023876B (zh) | 基于可持续性集成学习的入侵检测方法及入侵检测*** | |
JP5880454B2 (ja) | 画像識別装置及びプログラム | |
Agusta | Modified balanced random forest for improving imbalanced data prediction | |
US20190340507A1 (en) | Classifying data | |
JP2013250809A (ja) | 多クラス識別器、方法、およびプログラム | |
JP7173332B2 (ja) | 不正検知装置、不正検知方法および不正検知プログラム | |
JP2018181290A (ja) | 改良した情報測定とgaに基づくフィルター式特徴選択アルゴリズム | |
JP2016191966A (ja) | クラスタリング装置及び機械学習装置 | |
US10635991B2 (en) | Learning method, information processing device, and recording medium | |
KR102267487B1 (ko) | 메타데이터를 이용한 독립 분류 모델의 동작 방법 및 그 장치 | |
Shoohi et al. | DCGAN for Handling Imbalanced Malaria Dataset based on Over-Sampling Technique and using CNN. | |
WO2016158768A1 (ja) | クラスタリング装置及び機械学習装置 | |
JPWO2015146113A1 (ja) | 識別辞書学習システム、識別辞書学習方法および識別辞書学習プログラム | |
JP6659120B2 (ja) | 情報処理装置、情報処理方法、およびプログラム | |
JP5765583B2 (ja) | 多クラス識別器、多クラス識別方法、及びプログラム | |
JP5892275B2 (ja) | 多クラス識別器生成装置、データ識別装置、多クラス識別器生成方法、データ識別方法、及びプログラム | |
CN104468276A (zh) | 基于随机抽样多分类器的网络流量识别方法 | |
CN111488400B (zh) | 数据分类方法、装置和计算机可读存储介质 | |
US9792561B2 (en) | Learning method, information conversion device, and recording medium | |
JP6356015B2 (ja) | 遺伝子発現情報解析装置、遺伝子発現情報解析方法、及びプログラム | |
Maheta et al. | Classification of imbalanced data sets using multi objective genetic programming | |
CN111598116A (zh) | 数据分类方法、装置、电子设备及可读存储介质 | |
JP7306460B2 (ja) | 敵対的事例検知システム、方法およびプログラム | |
Mandli et al. | Selection of most relevant features from high dimensional data using ig-ga hybrid approach |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20181105 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20190716 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190913 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20200107 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20200204 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 6659120 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |