JP7171520B2 - 機械学習システム - Google Patents
機械学習システム Download PDFInfo
- Publication number
- JP7171520B2 JP7171520B2 JP2019127431A JP2019127431A JP7171520B2 JP 7171520 B2 JP7171520 B2 JP 7171520B2 JP 2019127431 A JP2019127431 A JP 2019127431A JP 2019127431 A JP2019127431 A JP 2019127431A JP 7171520 B2 JP7171520 B2 JP 7171520B2
- Authority
- JP
- Japan
- Prior art keywords
- unit
- machine learning
- learning system
- memory
- learning
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N10/00—Quantum computing, i.e. information processing based on quantum-mechanical phenomena
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/047—Probabilistic or stochastic networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N7/00—Computing arrangements based on specific mathematical models
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Software Systems (AREA)
- Computing Systems (AREA)
- Artificial Intelligence (AREA)
- Mathematical Physics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Computational Mathematics (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Pure & Applied Mathematics (AREA)
- Probability & Statistics with Applications (AREA)
- Algebra (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Medical Informatics (AREA)
- Condensed Matter Physics & Semiconductors (AREA)
- Electrically Operated Instructional Devices (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Description
図15は計算処理の回数(Noperation)と精度の関係性の一例を示すグラフである。この例では、計算処理の回数(Noperation)が増えるに従って、精度も向上している。このような関係性となるのは、例えば計算処理の結果の値が、同一の確率分布に従いつつも、値は試行ごとに確率的に変動する場合や、計算処理ごとに結果の値がある値に収束してくような場合が考えられる。前者の場合は変動する結果の値の確率分布を想定して、最尤推定法などを用いることにより、複数回試行した計算処理の結果の値の平均値の誤差などを、計算精度として求めることができる。後者の場合は、計算処理ごとの結果の値(の変動)を外挿することによって、収束先の真値や現在の結果の値との誤差を、計算精度として求めることができる。
機械学習において、学習の進行度ごとにデータ推論時の精度を推定することにより、学習部の重み値を更新する際に必要な積和演算回数を削減することができ、これまでよりも学習時間を短縮することができる。
102:環境/ストレージ/メモリ、
103:学習部、
104:演算部、
201:データインターフェース部、
202:計算部、
203:演算制御部、
204:メモリ、
401:初期計算制御部、
402:精度計算部、
403:計算結果統合部、
404:精度比較部、
405:追加計算制御部、
501:データインターフェース部
502:メモリ、
503:初期重み処理部、
504:入力加工部、
505:学習ステップ管理部、
506:重み更新部、
507:結果加工部。
Claims (12)
- 学習部と、メモリを含む演算部とを有する機械学習システムであって、
前記演算部は、
前記メモリに、要求精度と学習器の内部状態と重み値を保持し、
前記機械学習システムに入力された入力データと、前記メモリに保持された前記重み値とを用いて計算処理を実行することにより、前記メモリに保持された前記内部状態を更新し、
前記計算処理の結果から前記内部状態の精度を算出し、
前記算出された精度が前記要求精度より高い場合、前記機械学習システムに入力された前記入力データと、前記メモリに保持された前記重み値と、前記メモリに保持された更新された前記内部状態を用いて、評価値を計算し、
前記評価値を前記学習部に送付し、
前記学習部は、
前記評価値を用いて、前記メモリに保持された前記重み値を更新し、前記重み値の更新回数を前記演算部に通知することを特徴とする機械学習システム。 - 請求項1に記載の機械学習システムにおいて、
前記演算部は、
前記算出された精度が前記要求精度より低い場合、前記内部状態を更新して前記計算処理を繰り返すことを特徴とする機械学習システム。 - 請求項2に記載の機械学習システムにおいて、
前記算出された精度は、前記演算部が前記内部状態の更新を繰り返し実行した際に、前記内部状態が収束する状態と現在の前記内部状態との差分値、または、現在の前記内部状態の分散値となることを特徴とする機械学習システム。 - 請求項2に記載の機械学習システムにおいて、
前記要求精度は、前記機械学習システムの外部から前記メモリに設定されることを特徴とする機械学習システム。 - 請求項4に記載の機械学習システムにおいて、
前記演算部は、前記内部状態の精度と前記要求精度とを比較することを特徴とする機械学習システム。 - 請求項5に記載の機械学習システムにおいて、
前記演算部は、前記比較の結果、前記内部状態の精度が前記要求精度の閾値を満たしていなければ、前記評価値を計算する前に、前記計算処理及び前記内部状態の更新を追加で実行することを特徴とする機械学習システム。 - 請求項5に記載の機械学習システムにおいて、
前記演算部は、前記比較を実行する前に、前記機械学習システムの外部より初期設定される初期計算処理回数の数だけ、前記計算処理及び前記内部状態の更新を実行することを特徴とする機械学習システム。 - 請求項7に記載の機械学習システムにおいて、
前記初期計算処理回数は、前記メモリに設定することを特徴とする機械学習システム。 - 請求項5に記載の機械学習システムにおいて、
前記演算部は、前記比較の結果にかかわらず、前記計算処理及び前記内部状態の更新の回数が最大計算処理回数以上であれば、前記評価値を計算し、前記学習部に送付することを特徴とする機械学習システム。 - 請求項1に記載の機械学習システムにおいて、
前記演算部は、ボルツマンマシンから構成される計算部を有し、
前記内部状態は2値の離散的な値をもつことを特徴とする機械学習システム。 - 請求項1に記載の機械学習システムにおいて、
前記演算部の前記内部状態が3値以上の離散的な値から構成されることを特徴とする機械学習システム。 - 学習部と、メモリを含む演算部とを有する機械学習システムにおける方法であって、
前記演算部は、
前記メモリに、要求精度と学習器の内部状態と重み値を保持し、
前記機械学習システムに入力された入力データと、前記メモリに保持された前記重み値とを用いて計算処理を実行することにより、前記メモリに保持された前記内部状態を更新し、
前記計算処理の結果から前記内部状態の精度を算出し、
前記算出された精度が前記要求精度より高い場合、前記機械学習システムに入力された前記入力データと、前記メモリに保持された前記重み値と、前記メモリに保持された更新された前記内部状態を用いて評価値を計算し、
前記評価値を前記学習部に送付し、
前記学習部は、
前記評価値を用いて、前記メモリに保持された前記重み値を更新し、前記重み値の更新回数を前記演算部に通知することを特徴とする機械学習システムの学習方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019127431A JP7171520B2 (ja) | 2019-07-09 | 2019-07-09 | 機械学習システム |
US16/913,082 US11715036B2 (en) | 2019-07-09 | 2020-06-26 | Updating weight values in a machine learning system |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019127431A JP7171520B2 (ja) | 2019-07-09 | 2019-07-09 | 機械学習システム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021012616A JP2021012616A (ja) | 2021-02-04 |
JP7171520B2 true JP7171520B2 (ja) | 2022-11-15 |
Family
ID=74101589
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019127431A Active JP7171520B2 (ja) | 2019-07-09 | 2019-07-09 | 機械学習システム |
Country Status (2)
Country | Link |
---|---|
US (1) | US11715036B2 (ja) |
JP (1) | JP7171520B2 (ja) |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2018195231A (ja) | 2017-05-22 | 2018-12-06 | コニカミノルタ株式会社 | 学習モデル作成装置、該方法および該プログラム |
Family Cites Families (44)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH01229360A (ja) * | 1988-03-09 | 1989-09-13 | Fujitsu Ltd | ボルツマン・マシンにおける学習処理方式 |
US6941264B2 (en) * | 2001-08-16 | 2005-09-06 | Sony Electronics Inc. | Retraining and updating speech models for speech recognition |
CA2936114C (en) | 2014-01-06 | 2023-10-10 | Google Inc. | Constructing and programming quantum hardware for quantum annealing processes |
US10896382B2 (en) * | 2014-08-07 | 2021-01-19 | Okinawa Institute Of Science And Technology School Corporation | Inverse reinforcement learning by density ratio estimation |
US10896383B2 (en) * | 2014-08-07 | 2021-01-19 | Okinawa Institute Of Science And Technology School Corporation | Direct inverse reinforcement learning with density ratio estimation |
JP2017097392A (ja) * | 2015-11-18 | 2017-06-01 | 日本電気株式会社 | 反復計算量推定装置、方法およびプログラム |
CN108701251B (zh) * | 2016-02-09 | 2022-08-12 | 谷歌有限责任公司 | 使用优势估计强化学习 |
US10817796B2 (en) * | 2016-03-07 | 2020-10-27 | D-Wave Systems Inc. | Systems and methods for machine learning |
US10325218B1 (en) * | 2016-03-10 | 2019-06-18 | Rigetti & Co, Inc. | Constructing quantum process for quantum processors |
US10296352B2 (en) * | 2016-06-15 | 2019-05-21 | University Of Southern California | Nested quantum annealing correction |
US10387768B2 (en) * | 2016-08-09 | 2019-08-20 | Palo Alto Research Center Incorporated | Enhanced restricted boltzmann machine with prognosibility regularization for prognostics and health assessment |
JP2018067200A (ja) * | 2016-10-20 | 2018-04-26 | 国立大学法人京都大学 | シミュレーション装置、コンピュータプログラム及びシミュレーション方法 |
US11157828B2 (en) * | 2016-12-08 | 2021-10-26 | Microsoft Technology Licensing, Llc | Tomography and generative data modeling via quantum boltzmann training |
US10891534B2 (en) * | 2017-01-11 | 2021-01-12 | International Business Machines Corporation | Neural network reinforcement learning |
JP6888312B2 (ja) * | 2017-02-02 | 2021-06-16 | 沖電気工業株式会社 | 情報処理装置、情報処理方法、およびプログラム |
CN110291539A (zh) * | 2017-02-24 | 2019-09-27 | 欧姆龙株式会社 | 用于生成学习数据的处理方法、***、程序和存储介质、以及生成学习数据的方法和*** |
EP3646250A1 (en) * | 2017-05-30 | 2020-05-06 | GTN Ltd | Tensor network machine learning system |
JP6958808B2 (ja) * | 2017-09-15 | 2021-11-02 | 富士通株式会社 | 方策改善プログラム、方策改善方法、および方策改善装置 |
JP6919856B2 (ja) * | 2017-09-15 | 2021-08-18 | 富士通株式会社 | 強化学習プログラム、強化学習方法、および強化学習装置 |
JP6855360B2 (ja) * | 2017-10-10 | 2021-04-07 | 株式会社デンソーアイティーラボラトリ | 情報推定装置及び情報推定方法 |
JP6955155B2 (ja) * | 2017-10-17 | 2021-10-27 | 富士通株式会社 | 学習装置、学習方法及び学習プログラム |
US11250329B2 (en) * | 2017-10-26 | 2022-02-15 | Nvidia Corporation | Progressive modification of generative adversarial neural networks |
US11886988B2 (en) * | 2017-11-22 | 2024-01-30 | International Business Machines Corporation | Method for adaptive exploration to accelerate deep reinforcement learning |
CN108062562B (zh) * | 2017-12-12 | 2020-03-10 | 北京图森未来科技有限公司 | 一种物体重识别方法及装置 |
GB201801627D0 (en) * | 2018-02-01 | 2018-03-21 | Siemens Healthcare Ltd | Image autoencoding for quantum machine learning |
WO2019157228A1 (en) * | 2018-02-09 | 2019-08-15 | D-Wave Systems Inc. | Systems and methods for training generative machine learning models |
US11468334B2 (en) * | 2018-06-19 | 2022-10-11 | International Business Machines Corporation | Closed loop model-based action learning with model-free inverse reinforcement learning |
US20210295193A1 (en) * | 2018-08-30 | 2021-09-23 | Georgia State University Research Foundation, Inc. | Continuous Restricted Boltzmann Machines |
US20200104715A1 (en) * | 2018-09-28 | 2020-04-02 | Xilinx, Inc. | Training of neural networks by including implementation cost as an objective |
AU2019365240A1 (en) * | 2018-10-24 | 2021-04-15 | Zapata Computing, Inc. | Hybrid quantum-classical computer system for implementing and optimizing quantum Boltzmann machines |
US20210398621A1 (en) * | 2018-11-07 | 2021-12-23 | Kuano Ltd. | A quantum circuit based system configured to model physical or chemical systems |
WO2020115273A1 (en) * | 2018-12-07 | 2020-06-11 | Telefonaktiebolaget Lm Ericsson (Publ) | Predicting network communication performance using federated learning |
JP2020095586A (ja) * | 2018-12-14 | 2020-06-18 | 富士通株式会社 | 強化学習方法、および強化学習プログラム |
US11928556B2 (en) * | 2018-12-29 | 2024-03-12 | International Business Machines Corporation | Removing unnecessary history from reinforcement learning state |
JP2020119008A (ja) * | 2019-01-18 | 2020-08-06 | 富士通株式会社 | 強化学習方法、強化学習プログラム、および強化学習装置 |
JP7159883B2 (ja) * | 2019-01-22 | 2022-10-25 | 富士通株式会社 | 強化学習方法、強化学習プログラム、および強化学習装置 |
US11455513B2 (en) * | 2019-02-01 | 2022-09-27 | International Business Machines Corporation | Hellinger distance for measuring accuracies of mean and standard deviation prediction of dynamic Boltzmann machine |
US10510002B1 (en) * | 2019-02-14 | 2019-12-17 | Capital One Services, Llc | Stochastic gradient boosting for deep neural networks |
US20200279185A1 (en) * | 2019-02-28 | 2020-09-03 | Microsoft Technology Licensing, Llc | Quantum relative entropy training of boltzmann machines |
JP7379833B2 (ja) * | 2019-03-04 | 2023-11-15 | 富士通株式会社 | 強化学習方法、強化学習プログラム、および強化学習システム |
US11816591B2 (en) * | 2019-03-20 | 2023-11-14 | Sony Group Corporation | Reinforcement learning through a double actor critic algorithm |
US11494597B2 (en) * | 2019-03-22 | 2022-11-08 | Sri International | Generative memory for lifelong machine learning |
KR20200113744A (ko) * | 2019-03-26 | 2020-10-07 | 한국전자통신연구원 | 심층 신경망 분할 방법 및 장치 |
US11314536B2 (en) * | 2019-07-08 | 2022-04-26 | Tencent America LLC | Quantum variational method, apparatus, and storage medium for simulating quantum systems |
-
2019
- 2019-07-09 JP JP2019127431A patent/JP7171520B2/ja active Active
-
2020
- 2020-06-26 US US16/913,082 patent/US11715036B2/en active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2018195231A (ja) | 2017-05-22 | 2018-12-06 | コニカミノルタ株式会社 | 学習モデル作成装置、該方法および該プログラム |
Also Published As
Publication number | Publication date |
---|---|
US20210012231A1 (en) | 2021-01-14 |
US11715036B2 (en) | 2023-08-01 |
JP2021012616A (ja) | 2021-02-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11941719B2 (en) | Learning robotic tasks using one or more neural networks | |
CN116011510A (zh) | 用于优化机器学习架构的框架 | |
US20220027792A1 (en) | Deep neural network model design enhanced by real-time proxy evaluation feedback | |
US20210081763A1 (en) | Electronic device and method for controlling the electronic device thereof | |
JP2023510566A (ja) | ニューラル・ネットワークのための適応的探索方法および装置 | |
US20210224692A1 (en) | Hyperparameter tuning method, device, and program | |
CN111065999B (zh) | 移动设备的功率状态控制 | |
US11429865B1 (en) | Optimizing neural networks | |
CN112513886A (zh) | 信息处理方法、信息处理装置和信息处理程序 | |
Maleki et al. | A hybrid approach of firefly and genetic algorithms in software cost estimation | |
CN114511042A (zh) | 一种模型的训练方法、装置、存储介质及电子装置 | |
WO2020195940A1 (ja) | ニューラルネットワークのモデル縮約装置 | |
JP7171520B2 (ja) | 機械学習システム | |
CN112749617A (zh) | 通过聚集父实例确定输出信号 | |
US11816185B1 (en) | Multi-view image analysis using neural networks | |
WO2022127603A1 (zh) | 一种模型处理方法及相关装置 | |
Morales | Deep Reinforcement Learning | |
WO2023070274A1 (en) | A method and an apparatus for continual learning | |
CN115688876A (zh) | 一种生成流模型的训练方法及相关装置 | |
CN113112400A (zh) | 一种模型训练方法及模型训练装置 | |
JP2020198135A (ja) | ハイパーパラメータチューニング方法、装置及びプログラム | |
WO2021262139A1 (en) | Distributed machine learning models | |
EP4174725A1 (en) | Memory-efficient distributed neural network training using rematerialization | |
JP6990636B2 (ja) | 情報処理システム | |
WO2023160309A1 (zh) | 一种联邦学习方法以及相关设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20211216 |
|
TRDD | Decision of grant or rejection written | ||
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20221020 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20221025 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20221102 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7171520 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |