JPH05128085A - システム制御の学習方法 - Google Patents

システム制御の学習方法

Info

Publication number
JPH05128085A
JPH05128085A JP3293072A JP29307291A JPH05128085A JP H05128085 A JPH05128085 A JP H05128085A JP 3293072 A JP3293072 A JP 3293072A JP 29307291 A JP29307291 A JP 29307291A JP H05128085 A JPH05128085 A JP H05128085A
Authority
JP
Japan
Prior art keywords
learning
rule
training
pattern
circuit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP3293072A
Other languages
English (en)
Inventor
Masatoshi Sekine
優年 関根
Chiyan Eritsuku
チヤン エリツク
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP3293072A priority Critical patent/JPH05128085A/ja
Priority to US07/972,304 priority patent/US5465204A/en
Publication of JPH05128085A publication Critical patent/JPH05128085A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B13/00Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
    • G05B13/02Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
    • G05B13/0265Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric the criterion being a learning criterion
    • G05B13/029Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric the criterion being a learning criterion using neural networks and expert systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/042Knowledge-based neural networks; Logical representations of neural networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • General Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Biophysics (AREA)
  • Data Mining & Analysis (AREA)
  • Biomedical Technology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)
  • Automation & Control Theory (AREA)
  • Image Analysis (AREA)
  • Control By Computers (AREA)

Abstract

(57)【要約】 【構成】 ニューラルネットとルールベースとを結合
し、NNの学習能力を使ってルールの最適制御を実現す
るものである。この目的を実現するために、本発明では
新たに、学習訓練パターン発生システム(TGP)をル
ールベースとNNとの間に設ける。TGPはルールを適
用した効果を計算する評価関数と、評価関数値に基づき
訓練パターンを作るパターン発生部とからなる。NNは
従来から提案されているモデルで良く本発明の実施例で
はバックプロパゲーション・モデル(BPモデル)を利
用しているが、どのモデルでも本発明に適用可能であ
る。ルールベースシステムの例として本発明では合成ル
ールを使い実施例を説明しているが、本発明の請求とし
ては、制御可能なシステムであれば良い。 【効果】 複雑なシステムの内部動作を知ることなく、
入出力の相関から制御の仕方を学習することが可能とな
る。システムの制御方法の維持管理改良などの運用時の
ランニングコストを大幅に削減することが可能になる。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は制御に基づく作用を行う
システム制御の学習方法に関し、とくに、学習を通じて
自動的に制御の仕方を変更するシステム制御の学習方法
に関係する。
【0002】
【従来の技術】従来の知識データベースシステムの内、
エキスパートシステムに代表されるルールベース他がシ
ステムは広く利用されている。このルールデータベース
システムは、ルールの制御が自動で行われるため、多数
の簡単なルールを個別に作れば良いのでシステム構築は
きわめて容易である。反面、自動制御による為、実行性
能は劣るのが実情である。
【0003】その欠点を改善するために、メタノールと
呼ばれる[ルールを制御する改善プログラム]を記述し
て使用に供している。しかし、このメタルールによる制
御はルールベースシステムの本来の特徴を損なうため好
ましい事ではない。ニューラルネット(NN)の特徴
は、学習機能をかねそなえた柔軟なパターン認識能力に
ある。この特徴を生かして、従来のシステムに組み込ん
で文字認識効率を改善した例が多く報告されている。
【0004】しかしながら、従来はNNのパータン認識
能力を単に利用しただけであり、すなわち、パターン認
識の前処理として利用しただけであった。従って、訓練
パターンを作る必要はなく単に期待値からの誤差をNN
に教えて上げれば良かった。
【0005】
【発明が解決しようとする課題】こうした従来技術によ
る例は、NNからの出力と期待値との関係が単純な場合
には実現が容易である。しかし、NNからの出力と被制
御外部システムの実行結果とがかけ離れている場合に
は、明確な対応関係がみられず実現は非常に困難であ
る。
【0006】この発明の目的は、NNからの出力と被制
御外部システムの実行結果とがかけ離れていて明確な対
応関係がみられない複雑な制御を学習することができる
システム制御の学習方法を提供することにある。
【0007】
【課題を解決するための手段】本発明は、NNとルール
ベースとを結合し、NNの学習能力を使ってルールの最
適制御を実現するものである。この目的を実現するため
に、本発明では新たに、学習訓練パターン発生システム
(TPG)をルールベースとNNとの間に設ける。TP
Gはルールを適用した効果を計算する評価関数と、評価
関数値に基づき訓練パターンを作るパターン発生部とか
らなる。NNは従来から提案されているモデルで良く本
発明の実施例ではバックプロパゲーション・モデル(B
Pモデル)を利用しているが、どのモデルでも本発明に
適用可能である。ルールベースシステムの例として本発
明では合成ルールを使い実施例を説明しているが、本発
明の請求としては、制御可能なシステムであれば良い。
【0008】
【作用】上記のように構成された学習システムでは、N
Nの出力パターンと相関のある評価結果に基づき、NN
の訓練パターンが生成でき、システムの制御を自動的に
改善する学習が実現できる。かかるシステムでは従来必
要であったシステムの制御方法の維持管理改良などが不
要となる。
【0009】
【実施例】図1にこの発明の実施例を示す。
【0010】以下、図をもとに説明する。
【0011】まずルールベースシステム3は、回路を調
べ、用意してある回路パターン一致部で使用可能な(合
成)ルールを探しだし、それをニューラルコントローラ
1に伝える。
【0012】ニューラルコントローラ1はそのルールが
実際に使われた時に、よりよい回路が実現されるかどう
か学習されている。その記憶をもとに、使用可能な候補
のうちの一つだけを選び出し、ルールベースシステム3
に伝える。ルールベースシステム3はそのルールを使用
して回路を合成する。
【0013】学習モードでは、合成された回路を評価関
数f(c) で評価し、その結果を訓練システム2に伝え
る。
【0014】訓練システム2は合成結果が良ければ、ニ
ューラルコントローラ1が選択したルールをさらに強く
選択する様にニューラルコントローラ1を訓練するパタ
ーンを出力する。反対に悪い結果のときには、弱く選択
する様な訓練パターンを出力する。この訓練パターン
は、ニューラルネットの出力段に与えられ、逆誤差伝播
法によりニューラルネットの重み付けが変化させられ
る。
【0015】以下に、実験結果を示す。
【0016】後方伝播された訓練パラメータη=0.
1、α=0.9、及び図2に示すOPTIM1回路を使
って、実験は行われた。図3は、OPTIM1を最適化
することを学習する際の回路の評価関数f(c) 及びNN
の二乗和誤差(SSE)を示している。
【0017】初めの4エポックに於て、NNは利用でき
ない筈のルールを起動させてしまうという誤動作をし
た。しかしながら、各々のエポックで23個の単純な正
しいパターンや回路上で操作されることによって発生す
るパターンが与えられるため、第5エポックまでには、
NNは使用できるルールだけを起動することを学習でき
るようになった。前記回路の評価関数f(c) を増加させ
るドモルガンの法則をネットワークは起動させ始めた。
【0018】訓練装置は、ドモルガンの法則よりも使用
可能なルールを選ぶというパターンを発生し、徐々に評
価関数f(c) を減少させるルールを起動させることを学
習した。評価関数f(c) のグラフが示す如く、NNは、
最適化過程がプラトー(最適化値が10エポック中に減
少しなかった部分として定義されている)の部分に来る
たびに初期回路とともに示されている。NNは、最終最
適回路に導かれるルールを優先していくことを徐々に学
習していく。
【0019】250エポックまでには、NNは、初期の
値43から最終値6まで回路を最適化することを既に学
習している。NNは使用できないルールを起動させ、そ
のルールは評価関数f(c) を減少させないので、5エポ
ックにかけては、平均二乗和誤差(SSE)は第5エポ
ックで6.44の高さである。しかし、200エポック
までには、5エポックに渡って0.09まで減少し、訓
練パターンに近い出力を発生するまでに向上してくる
と、500エポックまでには0.03に減少する。
【0020】NNは、OPTIM1を使用し、1000
エポックの間訓練された。その後、NNによって発生し
たルールランキングがどれ位よく新しい回路に働いたか
を試験するため、ノースカロライナ超小型電子技術セン
ターで使用されているマルチレベル論理シンセシスベン
チマークの回路CM138Aを使用した。35回のルー
ル呼出し後、NNは回路の評価関数f(c) を138から
40に減らすのに成功した。
【0021】この結果は、最適化ルールを選ぶ局部探索
に比して好ましいものだった。前記局部探索装置は各々
のステップに際し探索するが、23のルールはf(c) を
最も減少させ、その後、この局部的に最善であるルール
を実行した。この過程は、回路の評価関数が10サイク
ルの間減少しない時まで続く。
【0022】局所探索方法によって、45のルールの呼
出しに於て、CM138Aが138から40に減少し
た。従って、NNはルール選択に於てより効果が良いと
いうことになる、というのも、NNは同じ作業を少ない
ステップで行ったからである。さらに、前記局所探索装
置はどのルールを使うかを決める前に実際に各々の使用
できるルールを実行し、改良された回路を再評価した。
このように、局部探索装置では、NNに比して最適化ル
ールの選択に際し15倍長くかかった(SUN4システ
ムで151分対10分)。
【0023】我々は、また、現在使われているものの中
でさらに広範囲な論理最適化システムであるFALSY
Nを、CM138Aを最適化するために使った。図4は
ARENAとFALSYNの最適化回路を示している。
ARENAが使用している評価関数f(c) はゲートの数
とファンアウトの全体数しか考慮しないので、AREN
Aは少ない数のゲート数を使用する回路を作動させた。
【0024】一方、回路を変更するメタルールが書き込
まれているFALSYNでは、より多くのゲートを使う
がゲートへの入力数は少ない回路に変更した。この例に
よって、いかに最適化基準がルールの適応のされかた、
そしてその結果に影響するかが分かる。FALSYNは
ルールを1161回起動させようとして、24回成功し
た。ARENAは23のルールを照合し、1サイクル上
で1ルールを35サイクル分起動させた。二つの装置
は、試みたルールの数及び起動されたルールの数に於て
比較できる。
【0025】
【発明の効果】本発明によれば、複雑なシステムの内部
動作を知る事なく、入出力の相関から制御の仕方を学習
する事が可能となる。かかるシステムでは従来必要であ
ったシステムの制御方法の維持管理改良などの運用時の
ランニングコストを大幅に削減する事が可能になる。ま
た、本発明により得られた学習による制御は効率の劣化
を引き起こさない。
【図面の簡単な説明】
【図1】この発明の一実施例を示す概念図である。
【図2】実験に使われたパターン訓練装置である。
【図3】学習する際の回路の評価関数とNNの2乗和誤
差である。
【図4】ARENAとFALSYNの最適化回路であ
る。
【符号の説明】
1 ニューラルネットモデルを使った制御ユニット 2 ニューラルネット制御ユニットを訓練するシステム 3 ルールベースシステムを使用した論理合成システム 4 合成ルール選択信号 5 ニューラルネット出力の合成ルール選択信号 6 合成された回路の評価結果 7 6の評価結果のもとに作られたューラルネットの訓
練パターン 8 三層のニューラルネットモデル 9 合成ルール f(c) 評価関数

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】 外部からの学習訓練パターンによる学習
    機能を有し、該学習システムの制御に基づいて動作でき
    る外部からの制御が可能な実処理部と、該実処理部の動
    作結果を計算する評価部と、評価結果に基づき、該学習
    システム部を訓練する学習パターンを生成する訓練パタ
    ーン生成部とを具備し、該訓練パターンにより、該実処
    理部の制御を学習する機能を有する事を特徴とするシス
    テム制御の学習方法。
  2. 【請求項2】 該学習システム部が第1の制御を該実処
    理部に行い、次に第2の制御を該実処理部に行い、得ら
    れた第1と第2の評価結果とを比較し、相関関係を求め
    て、評価結果の良い制御を選択強化する学習パターンを
    有する訓練パターン生成部を有する事を特徴とする請求
    項1記載のシステム制御の学習方法。
JP3293072A 1991-11-08 1991-11-08 システム制御の学習方法 Pending JPH05128085A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP3293072A JPH05128085A (ja) 1991-11-08 1991-11-08 システム制御の学習方法
US07/972,304 US5465204A (en) 1991-11-08 1992-11-05 Heuristic control system employing expert system, neural network and training pattern generating and controlling system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3293072A JPH05128085A (ja) 1991-11-08 1991-11-08 システム制御の学習方法

Publications (1)

Publication Number Publication Date
JPH05128085A true JPH05128085A (ja) 1993-05-25

Family

ID=17790087

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3293072A Pending JPH05128085A (ja) 1991-11-08 1991-11-08 システム制御の学習方法

Country Status (2)

Country Link
US (1) US5465204A (ja)
JP (1) JPH05128085A (ja)

Families Citing this family (34)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10361802B1 (en) 1999-02-01 2019-07-23 Blanding Hovenweep, Llc Adaptive pattern recognition based control system and method
US8352400B2 (en) 1991-12-23 2013-01-08 Hoffberg Steven M Adaptive pattern recognition based controller apparatus and method and human-factored interface therefore
US5903454A (en) 1991-12-23 1999-05-11 Hoffberg; Linda Irene Human-factored interface corporating adaptive pattern recognition based controller apparatus
US6418424B1 (en) 1991-12-23 2002-07-09 Steven M. Hoffberg Ergonomic man-machine interface incorporating adaptive pattern recognition based control system
US6400996B1 (en) 1999-02-01 2002-06-04 Steven M. Hoffberg Adaptive pattern recognition based control system and method
US6850252B1 (en) 1999-10-05 2005-02-01 Steven M. Hoffberg Intelligent electronic appliance system and method
US5598532A (en) * 1993-10-21 1997-01-28 Optimal Networks Method and apparatus for optimizing computer networks
US5748943A (en) * 1995-10-04 1998-05-05 Ford Global Technologies, Inc. Intelligent CAD process
US5880966A (en) * 1995-12-14 1999-03-09 Xynetix Design Systems, Inc. Apparatus using scoring advisors having outputs combined on a back plane for evaluating designs
US6125351A (en) * 1998-05-15 2000-09-26 Bios Group, Inc. System and method for the synthesis of an economic web and the identification of new market niches
US7904187B2 (en) 1999-02-01 2011-03-08 Hoffberg Steven M Internet appliance system and method
US6549815B1 (en) * 1999-03-02 2003-04-15 Yamaha Hatsudoki Kabushiki Kaisha Method and apparatus for optimizing overall characteristics of device, using heuristic method
JP2000276206A (ja) 1999-03-24 2000-10-06 Yamaha Motor Co Ltd 総合特性最適化方法及び装置
JP2001084237A (ja) 1999-09-14 2001-03-30 Yamaha Motor Co Ltd ファジィ推論システムを備えた制御装置の実時間最適化方法
JP2001152898A (ja) 1999-12-01 2001-06-05 Sanshin Ind Co Ltd 航走特性制御装置
JP2001306137A (ja) 2000-04-24 2001-11-02 Yamaha Motor Co Ltd 制御対象の特性制御装置
DE10306726A1 (de) * 2003-02-17 2004-09-30 Claas Selbstfahrende Erntemaschinen Gmbh Methode zur Optimierung von einstellbaren Parametern
WO2006000027A1 (en) * 2004-06-23 2006-01-05 Telstra Corporation Limited A network optimisation system
US20070115916A1 (en) * 2005-11-07 2007-05-24 Samsung Electronics Co., Ltd. Method and system for optimizing a network based on a performance knowledge base
US8300798B1 (en) 2006-04-03 2012-10-30 Wai Wu Intelligent communication routing system and method
US7810062B2 (en) * 2007-09-11 2010-10-05 International Business Machines Corporation Method for eliminating negative slack in a netlist via transformation and slack categorization
US8538901B2 (en) 2010-02-05 2013-09-17 Toyota Motor Engineering & Manufacturing North America, Inc. Method for approximation of optimal control for nonlinear discrete time systems
US10192016B2 (en) * 2017-01-17 2019-01-29 Xilinx, Inc. Neural network based physical synthesis for circuit designs
US11544545B2 (en) 2017-04-04 2023-01-03 Hailo Technologies Ltd. Structured activation based sparsity in an artificial neural network
US11238334B2 (en) 2017-04-04 2022-02-01 Hailo Technologies Ltd. System and method of input alignment for efficient vector operations in an artificial neural network
US10387298B2 (en) 2017-04-04 2019-08-20 Hailo Technologies Ltd Artificial neural network incorporating emphasis and focus techniques
US11551028B2 (en) 2017-04-04 2023-01-10 Hailo Technologies Ltd. Structured weight based sparsity in an artificial neural network
US11615297B2 (en) 2017-04-04 2023-03-28 Hailo Technologies Ltd. Structured weight based sparsity in an artificial neural network compiler
US11263077B1 (en) 2020-09-29 2022-03-01 Hailo Technologies Ltd. Neural network intermediate results safety mechanism in an artificial neural network processor
US11811421B2 (en) 2020-09-29 2023-11-07 Hailo Technologies Ltd. Weights safety mechanism in an artificial neural network processor
US11237894B1 (en) 2020-09-29 2022-02-01 Hailo Technologies Ltd. Layer control unit instruction addressing safety mechanism in an artificial neural network processor
US11874900B2 (en) 2020-09-29 2024-01-16 Hailo Technologies Ltd. Cluster interlayer safety mechanism in an artificial neural network processor
US11221929B1 (en) 2020-09-29 2022-01-11 Hailo Technologies Ltd. Data stream fault detection mechanism in an artificial neural network processor
US20230025245A1 (en) * 2021-07-13 2023-01-26 Nvidia Corporation Neural network evaluation

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4922432A (en) * 1988-01-13 1990-05-01 International Chip Corporation Knowledge based method and apparatus for designing integrated circuits using functional specifications
US5046020A (en) * 1988-12-16 1991-09-03 E. I. Du Pont De Nemours And Company Distributed parallel processing network wherein the connection weights are generated using stiff differential equations
US5140530A (en) * 1989-03-28 1992-08-18 Honeywell Inc. Genetic algorithm synthesis of neural networks
JP2863550B2 (ja) * 1989-06-08 1999-03-03 株式会社日立製作所 配置最適化方法及び配置最適化装置と回路設計装置
US5121467A (en) * 1990-08-03 1992-06-09 E.I. Du Pont De Nemours & Co., Inc. Neural network/expert system process control system and method
US5228113A (en) * 1991-06-17 1993-07-13 The United States Of America As Represented By The Administrator Of The National Aeronautics And Space Administration Accelerated training apparatus for back propagation networks

Also Published As

Publication number Publication date
US5465204A (en) 1995-11-07

Similar Documents

Publication Publication Date Title
JPH05128085A (ja) システム制御の学習方法
US5606646A (en) Recurrent neural network-based fuzzy logic system
Juang et al. An online self-constructing neural fuzzy inference network and its applications
Juang et al. A recurrent self-organizing neural fuzzy inference network
Sutton et al. Dyna-style planning with linear function approximation and prioritized sweeping
El-Gallad et al. Enhancing the particle swarm optimizer via proper parameters selection
US7380224B2 (en) Method and system for non-linear state based satisfiability
EP3117274B1 (en) Method, controller, and computer program product for controlling a target system by separately training a first and a second recurrent neural network models, which are initally trained using oparational data of source systems
EP0484506A1 (en) A learning machine synapse processor system apparatus
Langari et al. Radial basis function networks, regression weights, and the expectation-maximization algorithm
CN114897144A (zh) 基于复值神经网络的复值时序信号预测方法
Yoon et al. Efficient genetic algorithms for training layered feedforward neural networks
Colangelo et al. Artificial neural network and accelerator co-design using evolutionary algorithms
Thathachar et al. Learning the global maximum with parameterized learning automata
Zhang et al. Adaptive control of chaotic systems with uncertainties
Sanfeliu et al. Active grammatical inference: a new learning methodology
Görzig et al. A comparison of module selection strategies for modular dialog systems
Qin et al. Evolving RBF neural networks for pattern classification
Darwaish et al. Dynamic programming inspired genetic programming to solve regression problems
Kaur et al. Extended Bipolar Sigmoid Algorithm for Enhancing Performance of Constructive Neural Network
Takahashi et al. Modular learning system and scheduling for behavior acquisition in multi-agent environment
Papa et al. Scheduling algorithms based on genetic approach
CN110197262A (zh) 用于lstm网络的硬件加速器
US5355510A (en) Information process system
Bontempi et al. Lazy learning: a logical method for supervised learning