JP6859247B2 - 学習装置、分析システム、学習方法および学習プログラム - Google Patents
学習装置、分析システム、学習方法および学習プログラム Download PDFInfo
- Publication number
- JP6859247B2 JP6859247B2 JP2017207227A JP2017207227A JP6859247B2 JP 6859247 B2 JP6859247 B2 JP 6859247B2 JP 2017207227 A JP2017207227 A JP 2017207227A JP 2017207227 A JP2017207227 A JP 2017207227A JP 6859247 B2 JP6859247 B2 JP 6859247B2
- Authority
- JP
- Japan
- Prior art keywords
- model
- pipelines
- prediction accuracy
- learning
- highest
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Description
本実施形態の学習装置は、入力されたデータのラベルを予測するクラス分類問題について、学習データを用いて機械学習を行って、自動的に予測モデルを構築する。ここで、図1は、クラス分類について説明するための説明図である。クラス分類とは、入力されたデータのラベルを予測する技術である。一般にクラス分類は、図1に示すように、欠損値の補完、カテゴリ変数の変換、各特徴の正規化、データの再変換および推定の5つのフェーズで構成される。図1に示すクラス分類において、データが入力され、ラベルが出力される。
図4は、学習装置の概略構成を例示する模式図である。図4に例示するように、学習装置10は、パソコン等の汎用コンピュータで実現され、入力部11、出力部12、通信制御部13、記憶部14、および制御部15を備える。
次に、図6を参照して、本実施形態に係る学習装置10による学習処理について説明する。図6は、学習処理手順を示すフローチャートである。図6のフローチャートは、例えば、学習処理の開始を指示する操作入力があったタイミングで開始される。
図8は、本実施形態の学習装置の学習処理による効果を説明するための説明図である。図8には、yeast、abalone、krvskp等の10種のデータセットのそれぞれに対するクラス分類について、従来技術による予測精度と本発明の学習処理による予測精度とが例示されている。ここで、従来技術とは、CASH問題+重みを考慮しないアンサンブル(ES、Ensemble Selection)を意味する。また、本発明の学習処理とは、CESH問題を意味する。図8に示すように、本発明の学習処理により、従来技術より予測精度が平均で約1.2%向上することが確認された。
本実施形態の学習装置10は、推薦、分類、または異常検知等の分析タスクを実行する分析システムに用いることができる。図9は、学習装置を含む分析システムの概略構成を示す模式図である。図9に示す例において、分析システム100は、学習装置10と分析装置20とを有し、ネットワークNを介して相互にデータ通信可能に接続される。
上記実施形態に係る学習装置10が実行する処理をコンピュータが実行可能な言語で記述したプログラムを作成することもできる。一実施形態として、学習装置10は、パッケージソフトウェアやオンラインソフトウェアとして上記の学習処理を実行する学習プログラムを所望のコンピュータにインストールさせることによって実装できる。例えば、上記の学習プログラムを情報処理装置に実行させることにより、情報処理装置を学習装置10として機能させることができる。ここで言う情報処理装置には、デスクトップ型またはノート型のパーソナルコンピュータが含まれる。また、その他にも、情報処理装置にはスマートフォン、携帯電話機やPHS(Personal Handyphone System)などの移動体通信端末、さらには、PDA(Personal Digital Assistants)などのスレート端末などがその範疇に含まれる。
11 入力部
12 出力部
13 通信制御部
14 記憶部
15 制御部
15a 生成部
15b 探索部
20 分析装置
21 予測部
100 分析システム
Claims (4)
- 入力されたデータのラベルを予測する予測モデルを構築する際に実行される複数の処理を組み合わせたパイプラインであって、各処理の設定内容がそれぞれ異なる複数のパイプラインを生成する生成部と、
生成されたパイプラインのそれぞれを表すモデルを重み付けして組み合わせたモデルのうち、予測精度が最も高いモデルを予測モデルとして探索する探索部と、
を備え、
前記探索部は、前記生成部が生成した複数の前記パイプラインを表すモデルのうち、予測精度が最も高いモデルに、前記生成部が再度生成した複数の前記パイプラインを表すモデルのうちのいずれかを重み付けして組み合わせ、予測精度が最も高くなる組み合わせおよび重みを探索し、予測精度が最も高い該組み合わせおよび重みに対し、前記生成部が再度生成した複数の前記パイプラインを表すモデルのうちのいずれかを重み付けして組み合わせ、予測精度が最も高くなる組み合わせおよび重みを探索する処理を所定の回数繰り返すことにより、予測精度が最も高い前記予測モデルを探索することを特徴とする学習装置。 - 学習装置と分析装置とを有する分析システムであって、
前記学習装置は、
入力されたデータのラベルを予測する予測モデルを構築する際に実行される複数の処理を組み合わせたパイプラインであって、各処理の設定内容がそれぞれ異なる複数のパイプラインを生成する生成部と、
生成されたパイプラインのそれぞれを表すモデルを重み付けして組み合わせたモデルのうち、予測精度が最も高いモデルを予測モデルとして探索する探索部と、を備え、
前記探索部は、前記生成部が生成した複数の前記パイプラインを表すモデルのうち、予測精度が最も高いモデルに、前記生成部が再度生成した複数の前記パイプラインを表すモデルのうちのいずれかを重み付けして組み合わせ、予測精度が最も高くなる組み合わせおよび重みを探索し、予測精度が最も高い該組み合わせおよび重みに対し、前記生成部が再度生成した複数の前記パイプラインを表すモデルのうちのいずれかを重み付けして組み合わせ、予測精度が最も高くなる組み合わせおよび重みを探索する処理を所定の回数繰り返すことにより、予測精度が最も高い前記予測モデルを探索し、
前記分析装置は、
前記学習装置が探索した前記予測モデルを用いて、入力されたデータのラベルを予測する予測部を備える
ことを特徴とする分析システム。 - 学習装置が実行する学習方法であって、
入力されたデータのラベルを予測する予測モデルを構築する際に実行される複数の処理を組み合わせたパイプラインであって、各処理の設定内容がそれぞれ異なる複数のパイプラインを生成する生成工程と、
生成されたパイプラインのそれぞれを表すモデルを重み付けして組み合わせたモデルのうち、予測精度が最も高いモデルを予測モデルとして探索する探索工程と、
を含み、
前記探索工程は、前記生成工程が生成した複数の前記パイプラインを表すモデルのうち、予測精度が最も高いモデルに、前記生成工程が再度生成した複数の前記パイプラインを表すモデルのうちのいずれかを重み付けして組み合わせ、予測精度が最も高くなる組み合わせおよび重みを探索し、予測精度が最も高い該組み合わせおよび重みに対し、前記生成工程が再度生成した複数の前記パイプラインを表すモデルのうちのいずれかを重み付けして組み合わせ、予測精度が最も高くなる組み合わせおよび重みを探索する処理を所定の回数繰り返すことにより、予測精度が最も高い前記予測モデルを探索することを特徴とする学習方法。 - 入力されたデータのラベルを予測する予測モデルを構築する際に実行される複数の処理を組み合わせたパイプラインであって、各処理の設定内容がそれぞれ異なる複数のパイプラインを生成する生成ステップと、
生成されたパイプラインのそれぞれを表すモデルを重み付けして組み合わせたもののうち、予測精度が最も高いモデルを予測モデルとして探索する探索ステップと、
をコンピュータに実行させ、
前記探索ステップは、前記生成ステップが生成した複数の前記パイプラインを表すモデルのうち、予測精度が最も高いモデルに、前記生成ステップが再度生成した複数の前記パイプラインを表すモデルのうちのいずれかを重み付けして組み合わせ、予測精度が最も高くなる組み合わせおよび重みを探索し、予測精度が最も高い該組み合わせおよび重みに対し、前記生成ステップが再度生成した複数の前記パイプラインを表すモデルのうちのいずれかを重み付けして組み合わせ、予測精度が最も高くなる組み合わせおよび重みを探索する処理を所定の回数繰り返すことにより、予測精度が最も高い前記予測モデルを探索することを特徴とする学習プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017207227A JP6859247B2 (ja) | 2017-10-26 | 2017-10-26 | 学習装置、分析システム、学習方法および学習プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017207227A JP6859247B2 (ja) | 2017-10-26 | 2017-10-26 | 学習装置、分析システム、学習方法および学習プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2019079392A JP2019079392A (ja) | 2019-05-23 |
JP6859247B2 true JP6859247B2 (ja) | 2021-04-14 |
Family
ID=66627901
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017207227A Active JP6859247B2 (ja) | 2017-10-26 | 2017-10-26 | 学習装置、分析システム、学習方法および学習プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6859247B2 (ja) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11139048B2 (en) | 2017-07-18 | 2021-10-05 | Analytics For Life Inc. | Discovering novel features to use in machine learning techniques, such as machine learning techniques for diagnosing medical conditions |
US11062792B2 (en) | 2017-07-18 | 2021-07-13 | Analytics For Life Inc. | Discovering genomes to use in machine learning techniques |
KR102201198B1 (ko) * | 2020-05-22 | 2021-01-11 | 서울시립대학교 산학협력단 | 기계학습 및 앙상블 기법을 이용하여 데이터를 분류하는 장치 및 방법 |
KR102490174B1 (ko) * | 2020-11-25 | 2023-01-19 | 한국기초과학지원연구원 | 전자현미경의 수차 값을 예측하기 위한 장치 및 그 동작 방법 |
JP7436652B2 (ja) * | 2020-12-29 | 2024-02-21 | イニージ | 自動学習基盤時系列データ予測及び制御方法と装置 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005309920A (ja) * | 2004-04-23 | 2005-11-04 | Alliance Group Inc | 多数決装置及びその学習方法と多クラス識別装置 |
US7529403B2 (en) * | 2005-12-06 | 2009-05-05 | Mitsubishi Electric Research Laboratories, Inc. | Weighted ensemble boosting method for classifier combination and feature selection |
JP5989576B2 (ja) * | 2013-03-07 | 2016-09-07 | 株式会社東芝 | パターン識別装置、パターン識別方法、プログラム、学習装置および学習方法 |
-
2017
- 2017-10-26 JP JP2017207227A patent/JP6859247B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2019079392A (ja) | 2019-05-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6859247B2 (ja) | 学習装置、分析システム、学習方法および学習プログラム | |
US11901045B2 (en) | Machine learning framework for finding materials with desired properties | |
US11755955B2 (en) | Anomaly detection and tuning recommendation system | |
JP6907664B2 (ja) | 非定常時系列データの予測に用いる方法及び装置 | |
US9269055B2 (en) | Data classifier using proximity graphs, edge weights, and propagation labels | |
Casas et al. | PSO-DS: a scheduling engine for scientific workflow managers | |
US20230351308A1 (en) | System and method for universal mapping of structured, semi-structured, and unstructured data for application migration in integration processes | |
CN115699041A (zh) | 利用专家模型的可扩展迁移学习 | |
JP2018200524A (ja) | 分類装置、分類方法および分類プログラム | |
JP2024516656A (ja) | 産業特定機械学習アプリケーション | |
Antequera et al. | Recommending heterogeneous resources for science gateway applications based on custom templates composition | |
Strong et al. | MABWiser: parallelizable contextual multi-armed bandits | |
US20170103331A1 (en) | Evaluation of predictions in the absence of a known ground truth | |
JP2023537933A (ja) | 簡易化された分子入力線エントリ・システム反応からの有機合成手順の生成 | |
KR20230054701A (ko) | 하이브리드 기계 학습 | |
Simaiya et al. | A hybrid cloud load balancing and host utilization prediction method using deep learning and optimization techniques | |
Son et al. | Application of slime mold algorithm to optimize time, cost and quality in construction projects | |
Georgopoulou et al. | A multi-objective metamodel-assisted memetic algorithm with strength-based local refinement | |
Chraibi et al. | A novel dynamic multi-objective task scheduling optimization based on Dueling DQN and PER | |
WO2022153412A1 (ja) | スコア統合装置、スコア統合方法、および、スコア統合プログラム | |
Atoui et al. | Virtual network function descriptors mining using word embeddings and deep neural networks | |
JP5126694B2 (ja) | 学習システム | |
Radulescu et al. | Cloud provider selection a complex multicriteria problem | |
Seno et al. | CLR: Cloud Linear Regression Environment as a More Effective Resource-Task Scheduling Environment (State-of-the-Art). | |
US11829719B2 (en) | Data processing device, data processing method, and data processing program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20191206 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20201021 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20201027 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20201215 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210323 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210325 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6859247 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |