JP6279964B2 - 多クラス識別器構築装置、方法及びプログラム - Google Patents
多クラス識別器構築装置、方法及びプログラム Download PDFInfo
- Publication number
- JP6279964B2 JP6279964B2 JP2014083948A JP2014083948A JP6279964B2 JP 6279964 B2 JP6279964 B2 JP 6279964B2 JP 2014083948 A JP2014083948 A JP 2014083948A JP 2014083948 A JP2014083948 A JP 2014083948A JP 6279964 B2 JP6279964 B2 JP 6279964B2
- Authority
- JP
- Japan
- Prior art keywords
- class
- classifier
- classes
- usefulness
- classifiers
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
(1)当該時点における扱うクラス数kの値が、「k=n」である、すなわち、学習用データにおけるクラス数nに到達したこと
(2)当該時点の直近のステップS13において、枝刈り対象と判定されずに残った2クラス識別器の個数が所定閾値を超えており、多いと判定されること
Claims (9)
- 各サンプルにつき特徴ベクトルと多クラス内のいずれかの所属クラスとが与えられた学習用データを用いて、2クラス識別器の組み合わせにより最適な又は準最適な多クラス識別器を構築する多クラス識別器構築装置であって、
各2クラス識別器の識別性能を有用性として推定する有用性推定部と、
前記推定された有用性が高いと判定される2クラス識別器を含む組み合わせの中から、最適な又は準最適な多クラス識別器を探索して構築する識別器構築部と、を備え、
前記有用性推定部は、前記学習用データにおける各サンプルの特徴ベクトルの分布に基づき、クラス同士の距離を推定し、当該距離が離れているクラスを共通のクラスとして扱うような2クラス識別器ほど、その有用性が低いものとして推定することを特徴とする多クラス識別器構築装置。 - 前記学習用データの各サンプルにはnクラス{C1, C2, …, Cn}のいずれかの所属クラスが与えられ、
前記識別器構築部は、各クラスCi(i=1, 2, … , n)であるか否かを識別する2クラス識別器をMiとして、初期識別器群{Mi|i=1, 2, … ,n}と、その他の2クラス識別器の組み合わせと、の中から、最適な又は準最適な多クラス識別器を探索して構築し、
前記有用性推定部は、前記その他の2クラス識別器の各々につき、識別性能を有用性として推定することで、当該有用性の高いと判定される2クラス識別器のみを、前記識別器構築部における探索の対象とさせることを特徴とする請求項1に記載の多クラス識別器構築装置。 - 前記有用性推定部は、
入力データに対して前記初期識別器群にそれぞれのクラスに該当する確率を出力させる前段識別器群と、当該出力された確率に基づいて入力データがいずれのクラスに属するかを判定する統合識別器と、からなる初期多クラス識別器を前記学習用データを用いて構築し、
前記学習用データに対して当該初期多クラス識別器を適用して得られる混同行列に基づいて、互いに誤判定が多いクラス同士ほど、当該クラス同士の距離が近いものとして推定することを特徴とする請求項2に記載の多クラス識別器構築装置。 - 前記有用性推定部は、前記その他の2クラス識別器の各々につき、当該2クラス識別器を構築するに際してnクラス{C1, C2, …, Cn}の中で区別するのに用いるクラス数kの小さい側から順次候補を列挙すると共にその有用性を推定し、有用性の高いと判定される2クラス識別器のみを選別し、前記識別器構築部における探索の対象とさせることを特徴とする請求項2または3に記載の多クラス識別器構築装置。
- 前記有用性推定部は、前記クラス数kの大きくなる方向へと前記推定された有用性に基づく枝刈りを実施しながらビームサーチによって、有用性の高いと判定される2クラス識別器のみを選別し、前記識別器構築部における探索の対象とさせることを特徴とする請求項4に記載の多クラス識別器構築装置。
- 前記有用性推定部は、前記ビームサーチを、前記クラス数kがnに到達したこと、または、当該大きくなる方向へ変化させるクラス数kにおける2クラス識別器の候補のうち、前記枝刈りの対象とはならなかった個数が所定値を超えたこと、によって終了し、当該終了した際のクラス数kにおいて前記枝刈りの対象とはならなかった2クラス識別器を、前記識別器構築部における探索の対象とさせることを特徴とする請求項5に記載の多クラス識別器構築装置。
- 前記2クラス識別器がサポートベクトルマシンであることを特徴とする請求項1ないし6のいずれかに記載の多クラス識別器構築装置。
- 各サンプルにつき特徴ベクトルと多クラス内のいずれかの所属クラスとが与えられた学習用データを用いて、2クラス識別器の組み合わせによりコンピュータが最適な又は準最適な多クラス識別器を構築する多クラス識別器構築方法であって、
各2クラス識別器の識別性能を有用性として推定する有用性推定段階と、
前記推定された有用性が高いと判定される2クラス識別器を含む組み合わせの中から、最適な又は準最適な多クラス識別器を探索して構築する識別器構築段階と、を備え、
前記有用性推定段階では、前記学習用データにおける各サンプルの特徴ベクトルの分布に基づき、クラス同士の距離を推定し、当該距離が離れているクラスを共通のクラスとして扱うような2クラス識別器ほど、その有用性が低いものとして推定することを特徴とする多クラス識別器構築方法。 - コンピュータを請求項1ないし7のいずれかに記載の多クラス識別器構築装置として機能させることを特徴とする多クラス識別器構築プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014083948A JP6279964B2 (ja) | 2014-04-15 | 2014-04-15 | 多クラス識別器構築装置、方法及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014083948A JP6279964B2 (ja) | 2014-04-15 | 2014-04-15 | 多クラス識別器構築装置、方法及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2015204043A JP2015204043A (ja) | 2015-11-16 |
JP6279964B2 true JP6279964B2 (ja) | 2018-02-14 |
Family
ID=54597457
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014083948A Active JP6279964B2 (ja) | 2014-04-15 | 2014-04-15 | 多クラス識別器構築装置、方法及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6279964B2 (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6253744B1 (ja) * | 2016-11-04 | 2017-12-27 | ヤフー株式会社 | 情報解析装置、情報解析方法、および情報解析プログラム |
JP6976910B2 (ja) * | 2018-07-04 | 2021-12-08 | 株式会社日立製作所 | データ分類システム、データ分類方法、および、データ分類装置 |
JP7339234B2 (ja) * | 2019-12-23 | 2023-09-05 | 住友化学株式会社 | 画像分類装置、画像分類方法及び画像分類モデルの生成方法 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7386527B2 (en) * | 2002-12-06 | 2008-06-10 | Kofax, Inc. | Effective multi-class support vector machine classification |
JP2005309920A (ja) * | 2004-04-23 | 2005-11-04 | Alliance Group Inc | 多数決装置及びその学習方法と多クラス識別装置 |
US20080089591A1 (en) * | 2006-10-11 | 2008-04-17 | Hui Zhou | Method And Apparatus For Automatic Image Categorization |
JP5214760B2 (ja) * | 2011-03-23 | 2013-06-19 | 株式会社東芝 | 学習装置、方法及びプログラム |
JP5660078B2 (ja) * | 2012-05-31 | 2015-01-28 | カシオ計算機株式会社 | 多クラス識別器、方法、およびプログラム |
-
2014
- 2014-04-15 JP JP2014083948A patent/JP6279964B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2015204043A (ja) | 2015-11-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104699772B (zh) | 一种基于云计算的大数据文本分类方法 | |
Martinez-Munoz et al. | An analysis of ensemble pruning techniques based on ordered aggregation | |
JP7293498B2 (ja) | サンプル一致度評価による能動学習 | |
Hassan et al. | Evaluation of computational techniques for predicting non-synonymous single nucleotide variants pathogenicity | |
Carbonera et al. | A density-based approach for instance selection | |
CN104766098A (zh) | 一种分类器的构建方法 | |
Parmar et al. | Multiclass text classification and analytics for improving customer support response through different classifiers | |
Murty et al. | Nearest neighbour based classifiers | |
JP6279964B2 (ja) | 多クラス識別器構築装置、方法及びプログラム | |
Manne et al. | Text categorization with K-nearest neighbor approach | |
KR20220014744A (ko) | 강화 학습을 기반으로 한 데이터 전처리 시스템 및 방법 | |
Pighetti et al. | Improving SVM training sample selection using multi-objective evolutionary algorithm and LSH | |
Natarajan et al. | A survey on gene feature selection using microarray data for cancer classification | |
Wang et al. | Feature selection for MAUC-oriented classification systems | |
Largeron et al. | MCut: A thresholding strategy for multi-label classification | |
Sánchez-Monedero et al. | Evolutionary ordinal extreme learning machine | |
Zheng et al. | Collaborative work with linear classifier and extreme learning machine for fast text categorization | |
JP5633424B2 (ja) | プログラム及び情報処理システム | |
Wei et al. | Improved parallel algorithms for sequential minimal optimization of classification problems | |
US8370276B2 (en) | Rule learning method, program, and device selecting rule for updating weights based on confidence value | |
Zoghlami et al. | Multiple instance learning for sequence data with across bag dependencies | |
Hang et al. | Aerial root classifiers for predicting missing values in data stream decision tree classification | |
Prabha et al. | A HM Ant Miner using evolutionary algorithm | |
JP2014153837A (ja) | 識別装置、データ判別装置、ソフトカスケード識別器を構成する方法、データの識別方法、および、プログラム | |
Xu et al. | Learn from the information contained in the false splice sites as well as in the true splice sites using SVM |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20160823 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20170130 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20171110 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20171115 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20171218 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20171227 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20180118 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6279964 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |