JPH02226460A - 適応型学習制御システム - Google Patents

適応型学習制御システム

Info

Publication number
JPH02226460A
JPH02226460A JP1047131A JP4713189A JPH02226460A JP H02226460 A JPH02226460 A JP H02226460A JP 1047131 A JP1047131 A JP 1047131A JP 4713189 A JP4713189 A JP 4713189A JP H02226460 A JPH02226460 A JP H02226460A
Authority
JP
Japan
Prior art keywords
partial
model
output
control system
learning
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP1047131A
Other languages
English (en)
Inventor
Naoki Imazaki
直樹 今崎
Toru Yamaguchi
亨 山口
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP1047131A priority Critical patent/JPH02226460A/ja
Publication of JPH02226460A publication Critical patent/JPH02226460A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Feedback Control In General (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 [発明の目的] (産業上の利用分野ン 本発明は、複数のダイナミクスが混在し特性が安定しな
い制御対象システムに対し、適用型学習制御を行う適応
型学習制御システムに関する。
(従来の技術) 制御対象システムが、大規模である、ダイナミクスが正
確に分らない、非線形な要素が存在するといった特徴を
持つ場合、そのシステムをlil Nする制御器の設計
にあたっては該システムのモデリングが不可欠である。
また適応型制御システムや学習制御システムにおける制
御動作の学習も制御対象システムのモデリングを行って
おり、こうしたことからもモデリングは、あらゆる分野
の制御において重要な技術とされている。
(発明が解決しようとする課題) ところで、従来より、制御対象システムをそのシステム
の特徴によりあいまいに複数の部分モデルに分割し、モ
デリングを行う手法(ファジィモデリング)があること
は知られていた。
しかしこの方法では、リアルタイムでの学習は困難であ
り、しかも部分モデルとして線形関数しか選択できない
ため、表現可能なシステムには限りがあった。
また、最近、学習能力を表現するために、ニューラルネ
ットを用いたファジィモデリング法が提案されているが
、この手法では、システムの特徴の区分化と部分モデル
との結合関係を1つのニューラルネットで表現している
ので、部分的な修正がニューラルネット全体の修正につ
ながってしまう問題があった。またこの方法では、シス
テムの特徴が変化して、新たにシステムの特徴の区分化
を行う場合は、やはりリアルタイムで学習を行うことが
困難であり、しかも部分モデルの実現に線形関数を用い
ている以上はダイナミクスの学習も極めて難しい課題と
されていた。
一方、システムのダイナミクスや逆ダイナミクスを二ニ
ーラルネットでモデリングする研究が現在行われている
が、これはある特定のダイナミクスを対象にしたものに
限られ、システムの特徴の変化に伴って複数のダイナミ
クスが切り替わるような複雑なシステムのモデリングに
対しての適用は困難であった。
本発明はこのような課題を解決するためのもので、複数
のダイナミクスが混在する複雑なシステムに対しても、
優れた適応性を保持してリアルタイムで学習制御を行う
ことのできる適応型学習制御システムの提供を目的とし
ている。
[発明の構成] (課題を解決するための手段) 本発明の適応型学習制御システムは上記した目的を達成
するために、複数のダイナミクスが混在し特性が安定し
ない制御対象システムの目標出力を発生する目標出力発
生手段と、制御対象システムを、その特徴によりあいま
いに区分化してこれをニューラルネットワークまたは可
変パラメータにより合成された関数モデルからなる部分
システムモデルの集合としてモデル化するとともに、各
部分システムモデルにそれぞれ対応して、ニューラルネ
ットワークまたは可変パラメータにより合成された関数
モデルからなる部分制御器モデルを設けて構成された複
数の部分制御システムモデルと、複数の部分制御器モデ
ルの合成出力を制御人力として制御対象システムに与え
ながら、制御対象システムの出力と複数の部分制御シス
テムモデルの合成出力とが一致するよう部分制御システ
ムモデルの修正を行い、かつ制御対象システムの出力と
目標出力とが一致するよう各部分制御器モデルの修正を
行う学習制御手段と、制御対象システムの特徴を複数の
メンバシップ関数によりあいまいに記述し、この複数の
メンバシップ関数と部分制御システムモデルとの結合関
係をその確からしさとともに記憶する記憶手段とを備え
、部分制御器モデルの合成出力および部分制御システム
モデルの合成出力を、結合関係とその確からしさにUづ
いて得るようにし、かつ部分制御システムモデルの修正
および部分制御モデルの修正を、結合関係に基づいてそ
の確からしさに反比例する度合で行い、記憶手段は、記
憶している確からしさを、対応する部分制御器モデルの
習熟度に比例し、制御対象システムの出力と部分制御シ
ステムモデルの合成出力との差異に比例した度合で修正
するようにしたものである。
(作 用) 本発明の適応型学習制御システムでは、学習制御手段が
、複数の部分制御器モデルの合成出力を制御人力として
制御対象システムに与えながら、制御対象システムの出
力と複数の部分制御システムモデルの合成出力とが一致
するよう部分制御システムモデルの修正を行い、同時に
、目標出力発生手段が発生した11標出力と制御対象シ
ステムの出力とが一致するよう各部分制御器モデルの修
正を行う。
ここで、部分制御器モデルの合成出力および部分制御シ
ステムモデルの合成出力は、記憶手段に記憶された制御
対象システムの特徴を示すメンバシップ関数と部分制御
システムモデルとの結合関係とその確からしさに基づい
て得るようにする。
また、部分制御システムモデルの修正および部分制御モ
デルの修正は、前記結合関係に基づいて確からしさに反
比例する度合で行うようにする。
また、記憶手段は、記憶している確がらしさを、対応す
る部分制御器モデルの習熟度に比例し、制御対象システ
ムの出力と部分制御システムモデルの合成出力との差異
に比例した度合で修正する。
したがって、この発明によれば、複数のグイナミクスが
混在する複雑なシステムに対しても、優れた適応性を゛
保持してリアルタイムで学習制御を行うことができる。
(実施例) 以下、本発明の実施例を図面に基づいて詳細に説明する
第1図は本発明に係る一実施例の適応型学習制御システ
ムの構成を示している。
同図に示す適応型学習制御システムは、目標発生器1、
モデル部2、学習回路3がらその主体部がなっている。
上述したモデル部2は、目標発生器lが発生した目標出
力yoを基に、モデル出力合成回路2人を介してモデル
出力ymを学習回路3に出力すると同時に、制御人力合
成回路2Bを介して制御対象システム4およびL1標発
生器1にそれぞれ制御人力Uを出力するよう構成されて
いる。そして制御人力Uを受けた制御対象システム4は
11標発生器1にシステム出力yを送り、これにより[
1標発牛器1は、受は取った制御人力Uおよびシステム
出力yを受は取って、目標出力yoを発生するよう(1
ζ成されている。
学習回路3は、目標発生器1からの目標出力yoと制御
対象システム4からのシステム出力yとの偏差eo(以
下、これを目標偏差と呼ぶ)、さらにシステム出力yと
モデル部2からのモデル出力ymとの偏差em(以下、
これをモデル偏差と呼ぶ)を取り込み、これらに基づい
てシステムモデル修正情報C5および制御器修正情報c
cをモデル部2にそれぞれ出力し、モデル修正を行うよ
う構成されている。
次に上記のモデル部2の構成について詳述する。
モデル部2は、部分制御器モデルmciおよび部分シス
テムモデルmsiからなるN個の部分制御システムモデ
ルm1(i−1,2、山 N)、モデル出力合成回路2
A、制御人力合成回路2B、および区分化回路2Cを有
している。
部分制御器モデルmciは、目標出力yOを受は取って
、部分制御人力uiを対応する部分システムモデルms
iおよび制御入力合成回路2Bに出力する。部分システ
ムモデルmsiは、部分制御器モデルmciから受は取
った部分制御入力Ulにより部分モデル出力ymiを発
生し、これをモデル出力合成回路2Aに出力する。こう
してN個の部分モデル出力yml、y m2、・・・ 
ymNを受は取ったモデル出力合成回路2Aは、これら
を、区分化回路2Cがら入力された区分化情報pSに基
づいて合成し、合成したものをモデル出力ymとして出
力する。制御入力合成回路2Bは、N個の部分制御人力
u1、u2、・・・ uNを受は取ってこれらを区分化
回路2cがら入力された区分化情報psに基づいて合成
し、合成したものを制御人力Uとして制御対象システム
4および目標発生器1にそれぞれ出力する。
ここで、部分制御器モデルmcl、mc2、・・・mc
Nは、全体で制御器モデル2Dを構成し、部分システム
モデルmS1、mS2、・・・ msNは全体でシステ
ムモデル2Eを構成している。
制御器モデル2Dは、学習回路3からの制御器修正情報
CC1区分化回路2Cからの区分化情報psに基づいて
内部部分モデルの修正を行う。同様にシステムモデル2
Eは、学習回路3からのシステム修正情報C5、区分化
回路2Cからの区分化情報psに基づいて内部部分モデ
ルの修正を行う。さらに区分化回路2Cは、制御対象シ
ステム4の環境、1」標出力yo、学習回′路3が行う
学習の程度に基づいて、随時、適応型学習制御システム
の状態を把握し、各部品制御システムmi (i−1,
2、・・・ N)への寄与度および確からしさを決定し
、これを区分化情報psとして出力するよう構成されて
いる。
次にこのモデル部2について第2図を用いてさらに説明
する。
第2図はモデル部2を概念的に示す図である。
同図においてモデル部2は記憶部10と実体部11とに
大別される。さらに実体部11はIF部11AとTHE
N部11Bに別れており、IF部11Aと記憶部10、
記憶部10とTHEN部11Bはそれぞれ信号経路にて
接続さ、れている。したがって、モデル部2は全体とし
て3層構造をなしていることになる。ちなみにこれらの
構成部と第1図との関連を述べると、制御器モデル2D
およびシステムモデル2EはそれぞれTI(EN部11
Bに相当し、区分化回路2CがIF部11Aおよび記憶
部10に相当する。
IF部11Aは、制御対象システム4をあいまいに区分
化する前件部であり、M個の区分化の条件毎にカテゴリ
C1、C2、・・・ cMが設けられている。各カテゴ
リC1、C2、・・・ cMは、(1η造化されたニュ
ーラルネット(または可変パラメータにより合成される
関数モデル、例えば重み付けmin、max合成)から
なる。すなわちこれらのカテゴリci(i−1,2、・
・・、M)は、それぞれ並列に配置されたKi個のメン
バシップ関数ユニットxil、xi2、・=xiKiか
らなっている。ここでKiはカテゴリciが担当する条
件をあいまいに分割するメンバシップ関数の個数に等し
い。
THEN部11.8は、結果を出力する後件部であると
ともに、それぞれの区分化の条件α1(i−1,2、・
・・ N)に対応するモデル記述部であり、ここではそ
れぞれの条件αiが部分制御システムモデルmi(また
は可変パラメータにより合成される関数モデルの構造体
でもよい)に相当する。但し、この部分制御システムモ
デルmiは、記憶部10との結合端として寄与度ニュー
ロンhi  (i−1,2、・・・ N)を有している
また記憶部10も構造化されたニューラルネット、すな
わち並列に配置されたL個の記憶ユニットz1、Z2、
・・・ zLから構成されている。
この記憶部10は前件部であるIF部11Aと後件部で
あるT HE N部11Bとを接続する役割を持ち、各
記憶ユニットziは、現在自分が担当している記憶の想
起度を表す想起度ニューロンと、その記憶の確からしさ
を表す習熟度ニューロンをそれぞれ有している。
次に、ファジィ推論的なイメージを用いて本実施例シス
テムにおける推論機構を説明するが、この実施例システ
ムにおける推論機構は、単なるファジィ推論の枠を越え
たものであり、動的であいまいな制御対象システム4の
モデル化を学習により実現しようというものである。
次式はあいまいなルール表現の一例である。
IF (xl−N&x2−N)THENy−fNN(x
)・・・・・・(1) ここで、Xl、X2はそれぞれシステムを特徴付けるた
めの情報で、まとめて入力ベクトルXとして記述される
。またNはネガティブの特徴を表すもので、区分化にお
けるメンバシップ関数と考えることができる。yは< 
1. )式のルールから得られる部分出力であり、fN
N(x)は部分モデルを表す関数である。ちなみにfN
N(x)が線形関数の場合は、ファジィモデルと呼ぶ。
このようにモデル部2は、(1)式のようなあいまいな
推論ルールの集合からなっている。
すなわち、第2図において、(1)式のXに相当するも
のが特徴情報cxであり、N(メンノくシ・ツブ関数)
がメンパンツブ関数ユニ・ノドxil、xi2 、−x
   i  K  i   (i  −1、2、、−M
)lこ相当する。またyに相5するものがym、uであ
り、fNN (−)は部分制御システムモデルm1、m
2、−m N I:相当する。さらにI F −T H
ENの役割を果たすのかモデル部2が持つ3層構造であ
る。
IF部11Aに人力される特徴情報CXは、特徴毎に細
分化され、cxl、cx2、−cxMとしてそれぞれカ
テゴリC1、C2、・・・ cMに人力される。特徴む
1報CXとしては、制御ス・l象システム4のシステム
出力y1制御対象システム4の環境(温度、湿度等) 
目標人力yO1さらには特徴情報ax、システム出力y
の過去の値等が考えられる。
カテゴリci (i=1q 2、・・・、M )は、特
徴情報cxiを全てのメンバシップ関数ユニットxll
、x12、−xiKiに与える。メンバシップ関数ユニ
ットxll、x12、・・・ xiKlはに1個のメン
バシップ関数の働きをするように構成されており、結局
メンパンツブ関数ユニットX11、x12、−xiKi
の出力側には、特徴情報cxiの各メンバシップ関数ユ
ニットが担当するメンバシップグレードが現れる。この
ようにして特徴情報cxiが与えられた全てのカテゴリ
C1から、特徴に関するメンバシップグレードの分布が
得られる。
各カテゴリciから、0または 1個のメンパンツブ関
数ユニットを抽出しこれをまとめると、このことは細分
化された1つの特徴(の組合わせ)を表すことになる。
この細分化特徴は、記憶部10の、ある記憶ユニットz
i  (i=1.2、・・L)と双方向に結合され、記
憶ユニットzlはTHEN部11Bの1つまたは複数の
部分制御システムモデルm1、m2、・・・、mNと双
方向に結合されているため、これより 1つの推論が可
能になる。ちなみに、細分化特徴を構成するIF部11
Aのメンバシップ関数ユニットの数が少ないほど、その
細分化特徴に対応する部分制御システムモデルm1、m
2、・・・ mNは汎用的なものとなる。
モデル部2の推論機(1には連続時間または離散時間の
どちらでも実現i+J能であるが、ここでは理解を容易
にするため、サンプリング時間Tの離散時間で推論を行
っているものとして話を進める。
モデル部2の推論機構は、次式のような状態方程式で記
述することができる。
x(L+l) = f x (A 1 ・x(t)+A
2 ・c x(L) +A3 ・z(t) ) −=(
2)z (L+1> −f z (A4− z (L)
+A5・X(L))     ・・・・・・(3)h(
t+1) −f h (A6・h (t)+A7・Z(
t))     ・・・・・・(4)ym(t)=gy
 (yml(t) 、ym2(t)  ・・・ymN(
t);h(t))   −・−・=(5)u(t)  
−gu(ul(t)、u2(t)、・・・uN(L) 
 ;  h(L))      ・・・・・ (6)各
変数、定数の定義は次の通りである。
1.1+1:時刻、t−t、t+1−t+T。
x(t) =[xll(t) 、x12(t) 、・=
  xlkl(t);x Ml(t)  、 =−x 
MKM(1)1211部11Aの各カテゴリci中の メンバシップ関数ユニットX1jの 出力端ニューロンの時刻tにおける 発火底xi j (t)の並、び1 、K 1 + K 2+・・・十KM次元。
c x (t)  =[c x 1(t)、c x 2
(t)、・・・c x M(t)] zIF部11Aの各カテゴリciに入 力される部分特徴情fit c x iの時刻tにおけ
る値c x i (L)の並び、M次元。
z (L)  = Cz 1(t)、z2(t)、−z
 L(t)] ’:記憶部10の各、?C!憶ユニット
ziの時刻tにおける想起度ニューロンの 発火底z 1(t)の並び、L次元。
h  (t)  −Ch  1(t)、 h2(t)、
 ・・・  hN(t)コニ THEN部11Bの各部
分制御システムモデルmiに付属する寄与度ニ ューロンhiの時刻tにおける発火 度h i (t)の並び、N次元。
:x(t)の再帰ループの重みを表すマトリクス、 (K1+に2+・・・十KM)x (K1+に2+・・・十KM)次元。
: c x (L)のx (t)への重みを表すマトリ
クス、実体はニューラルネット、 (K1十に2+・・・十KM)xM次元。
:z(L)のx (L)への重みを表すマトリクス、 (K1十に2+・・・十KM)xL次元。
:z(t)の再帰ループの重みを表すマトリクス、LX
L次元。
:x(t)の2(【)への重みを表すマトリクス、 Lx(K1+に2+・・・十KM)次元。
A6   :h(L)の再帰ループの重みを表すマトリ
クス、NxN次元。
A7   :z(t)のh(L)への重みを表すマトリ
クス、NXL次元。
fx (・): IF部11Aの各カテゴリci中のメ
ンバシップ関数ユニットxij の出力端ニューロンの出力関数、 例えばシグモイド関数。
fz(・):記憶部10の各記憶ユニットziの出力関
数、例えばシグモイド関数。
fh(・)uTHEN部11Bの各部分制御システムモ
デルmiに付属する寄与度 ニューロンhiの出力関数、例えば シグモイド関数。
gy(・):寄与度h (t)に基づいて部分モデル出
力y m 1(L)、ym2(t)、・・・y N (
L)を合成する関数、例えばgy(・)−ΣhBt)・
y m I(L)。
gu(・):寄与度h([)に基づいて部分制御人力u
l(t)、u 2(t)、−uN(t)を合成する関数
、例えば gu (・)−Σh 1(t) ・u 1(t)。
このA1〜A7がIF部11Aおよび記憶部10、記憶
部10およびTHEN部11Bを結合している実体であ
り、例えばメモリに格納されるデータである。このデー
タを適当に設定することにより、第2図のモデル部2は
単なるファジィ推論を行ったり、引き込みによる推論機
能、安定化機能を実現したりできる。システム(2)〜
(6)式の推論結果は、A1〜A7を適切に選べば、時
間の経過にしたがっである安定状態に収束するようにで
きる。
よって、この適応型学習制御システム全体としての制御
周期Tcは、その安定状態に達するまでの時間に選定す
ることが望ましい。すなわち、Tc−kT(但しkは安
定状態までの推論回数)とし、(5) 、(6)式で示
されるym、uを出力する周期を制御周期Tcとする。
このとき、A1〜A7の要素、すなわち 2つのニュー
ロン間の結合の度合が大きいほど、この2ニユ一ロン間
の結合の確からしさは高いことを表している。また、記
憶ziに対する確からしさ、すなわち記憶ユニットzi
の習熟度ニューロンの発火度をPi(i−1,2、・・
・ L)で定義すると、 P i (tel) −P i (L) +p Z  
(1i、 em(t)、e s (t) )・・・・・
・(7)で表される。ここで、pz(・)は確からしさ
の変化を演算する関数で、11は学習回数を表す。
一般にpz(・)は、学習回数11に比例して確からし
さPiを増し、偏差e m (L)   e s (L
)に比例して確からしさPiを減少するように定義され
る。
次にこの実施例システムの動作を説明する。
A、モデル部2の事前学習 実際の制御対象システム4の学習制御を開始する前に、
学習回路3は、まずシステムモデル2Eおよび制御器モ
デル2Dの事前学習を次のように行う。
この事前学習は個々の部分制御システムモデルml(L
−1,2、・・・ N)毎にそれぞれ必要に応じて行わ
れる。
すなわち、学習回路3は、考えられる条件α1(i−1
,2、・・・ N)のうち設定可能なものを制御対象シ
ステム4に設定し、適切な基準入力USを部分システム
モデルmsiおよび制御入力合成回路2Bに人力する。
この時点では、目標発生器1からまだ目標人力yoが出
力されていないので、部分制御器モデルmetの出力u
iは「0」である。
したがって、この場合、部分システムモデルms1から
送られてきた部分出力y m iがモデル出力合成回路
2Aよりそのままモデル出力ymとして出力される。
同様に、制御人力合成回路2Bにおいても、送られてき
た基準人力usがそのまま制御人力Uとして出力される
したがって、制御対象システム4が出力するシステム出
力yとモデル出力ymとの偏差emは、条件αiの下で
の制御対象システム4のシステム出力yと部分システム
モデルmsiの部分モデル出力ymiとの偏差emを表
すことになる。
学習回路3は、この偏差emに基づいてシステムモデル
修正情報CSを生成し、これを部分システムモデルms
lに出力して、該部分システムモデルmsiを所定の修
正規則(ff1Jえばバックプロパゲーション法)にし
たがって修正する。
尚、ここで基準入力USとしては、インパルス信号、ス
テップ信号、ランプ信号等のシステムの特性が表現し品
いものを用いる。
部分システムモデルmsiの学習がある程度進行した後
、今度は目標発生器1より適当な目標出力yoを発生さ
せ、これを部分制御器モデルmciに人力する。ここで
得られる部分制御人力uiは、部分システムモデルms
iおよび1qga人力合成回路2Bに入力されるが、制
御入力合成回路2Bはこれをそのままff1lj f1
人人力として制御対象システム4に出力する。
また、部分システムモデルmsiが出力する部分出力y
miは、前述の場合と同様に、モデル出力合成回路2A
を通ってモデル出力ymとして得られるため、結局、目
標偏差eOは、目標出力yOおよび条件αiの下での制
御対象システム4のシステム出力yの偏差を表すことに
なり、この偏差eoに基づいて学習回路3は制御器モデ
ル修正情報ccを出力し、部分制御器モデルmciを所
定の修正規則にしたがって修正する。
以降、この一連の操作を、全ての設定可能な条件αiに
ついて繰返すことにより、部分制御システムモデルm1
、ml、・・・ mNの事前学習を終了する。
この後、区分化回路2Cに各部分制御システムモデルm
1、ml、・・・、mNの学習の習熟度(1からしさ)
を登録し、同時に、寄与度を決定する推論機構の初期化
を行って、モデル部2の事前学習を完了する。
B、制御人力Uおよびモデル出力ymの合成モデル部2
の事前学習を終了すると、続いて実際の制御が開始され
ることになる。
まず、目標発生器1より目標出力yoが各部分制御シス
テムモデルmiに送られると、部分制御システムモデル
mtは、モデル出力合成回路2Aおよび制御入力合成回
路2Bに、それぞれ部分モデル出力ymtおよび部分制
御人力uiを送る。
すると、モデル出力合成回路2Aおよび制御入力合成回
路2Bは、各人力データを区分化回路2Cから送られて
きた区分化情報psに基づいて合成し、その結果をモデ
ル出力ymおよび制御人力Uとして出力する。
C,モデル部2の学習方法 次に、学習回路3は、目標出力yOとシステム出力yと
の偏差eo、システム出力yとモデル出力ymとの偏差
emに基づいて、システムモデル修正情報caおよび制
御器修正情報ccをモデル部2に出力する。
モデル部2は、これらシステムモデル修正情報C8およ
び制御器修正情報ccと区分化回路2Cからの区分化情
報D S sすなわち前述した(2)〜(4)式におけ
るマトリクスA1〜A7、寄与度h(1)に基づいて、
制御器モデル2D、システムモデル2E、および区分化
回路2Cを修正する。
以上の修正の中から、まず制御器モデル2Dおよびシス
テムモデル2Eを修正(学習)する動作を説明する。
学習回路3から入力されるシステムモデル修正情報C8
および制御器修正情報CCは、偏差em。
eoに基づく、例えばプロパゲーション法(バックプロ
パゲーションやカウンタプロパゲーションが有名)によ
る制御器モデル2Dおよびシステムモデル2Eに対する
修正情報を持つものとされている。学習回路3は、当該
修正情報による部分制御器モデルm c l 、rn 
C2、・・・ mcNおよび部分システムモデルms1
、ms2、・・・ msNに対する修正mを、それぞれ
の寄与度h1、h2、・・ hNに比例し、なおかつそ
れぞれが結合している記憶(1つとは限らない)の確か
らしさPl、R2、・・・ PLに反比例するような度
合で変換して、実際の修正(学習)を行う。
次に、区分化回路2Cの修正(学習)について説明する
ここで修正の対象となるのはマトリクスA1〜A7であ
る。マトリクスA2は、IF部11Aの各カテゴリc1
、c2、・・・ cM内の各メンバシップ関数ユニット
(メンバシップ関数)を表すニューラルネットであるが
、これも必要に応じて修正する。またマトリクスA1、
A3〜A7については、各マトリクスの要素が関係する
記憶ziの確からしさPiが増大した場合は、(7)式
で示される確からしさPiに基づいてその要素の値を大
きくし、逆に確からしさPiが減少した場合には、当該
要素の値を小さくするように各マトリクスを変更して行
く。
一方、マトリクスA2については、メンバシップ関数変
更の必要性に応じて、変更後のメンバシップ関数の機能
を実現するよう、パックプロパゲーション法等を用いて
学習することにより変更する。
D、適応型学習制御システムの全体的動作次に本実施例
システムにおける全体的な動作の流れを説明する。
尚、ここでは制御対象システム4として、温度、湿度に
応じて連続的にダイナミクスが変更されるシステムを考
える。
まずこの制御対象システム4を腹数の適当な環境下、例
えば温度T1および湿度Wl (以下、(TI、Wl)
と略記する)、温度T2および湿度W2(以下、(T2
、W2) ト略記tル) ノ2f−1類(7)環境に設
定し、それぞれにおいて上述したモデル部2の事前学習
を行う。
このとき環境(Tl、 Ml)に対する記憶R1と環境
(T2、W2)に対する記憶R2が区分化回路2c上に
形成される。
この後、実際の制御に移る。このとき環境が(Tl、W
L)または(T2、ν2)付近の場合は、それぞれの環
境に対応するメンバシップ関数ユニットを通して、既に
登録されている記憶R1またはR2が想起されることに
より、事前学習による制御が行われると同時に、確から
”しさに反比例する学習量で当該記憶R1またはR2の
再学習(部分制御システムモデルms1、ms2、・・
・ msNの調整、結合度の変更)が行われて、次第に
確からしさを高めて行く。
一方環境が(T3、Wl)等、記憶にないものになった
場合、区分化回路2Cは環境がより近い記憶R1および
R2を適当に組合わせて暫定的な制御を実行する。また
これと同時に、温度T3に対応するメンバシップ関数ユ
ニットを通して記憶R3が想起され、対応する部分制御
システムモデルms1、ms2、−・−msNに環境(
T3、Wl)に対する制御則が形成されて行き、次第に
その確からしさを高めて行く。そしてその確からしさが
十分高くなったとき、環境(T3、Wl)に際しては記
憶R3により制御が行われ、記憶R1およびR2の影響
はなくなって行く。このようにして未学習の環境にリア
ルタイムで適応する。
かくしてこの実施例の適応型学習制御システムによれば
、制御対象システム4が複雑だったり、その環境が不安
定な場合、さらに制御前にこれらの事項が十分に把握で
きていない場合でも、現(1:所有する記憶を組合わせ
ることにより暫定的な制御の実行が可能になるとともに
、制御の進行に伴い制御対象システム4の詳細なダイナ
ミクスやその環境を学習して行くことができ、これによ
り優れた適応性を保持してリアルタイムで学習制御を行
うことができる。
尚、上述した実施例では、目標発生器を用いた場合の適
応型学習制御システムについて説明したが、本発明はこ
れに限らず、例えば規範モデルを用いたモデル規範型適
応制御システム等についても同様に適用できる。
[発明の効果] 以上説明したように本発明の適応型学習制御システムに
よれば、複数のダイナミクスが混在する複雑なシステム
に対しても、優れた適応性を保持してリアルタイムで学
習制御を行うことができる。
【図面の簡単な説明】
第1図は本発明の一実施例である適応型学習制御システ
ムの構成を説明するためのブロック図、第2図は第1図
におけるモデル部の構成を概念的に示したブロック図で
ある。 1・・・目標発生器、2・・・モデル部、3・・・学習
回路、4・・・制御対象システム、2A・・・モデル出
力合成回路、2B・・・制御人力合成回路、2c・・・
区分化回路、2D・・・制御器モデル、2E・・・シス
テムモデル、10・・・記憶部、11・・・実体部、I
IA・・・IF部、11B・・・THEN部。 出願人     株式会社 東芝

Claims (1)

  1. 【特許請求の範囲】  複数のダイナミクスが混在し特性が安定しない制御対
    象システムの目標出力を発生する目標出力発生手段と、 前記制御対象システムを、その特徴によりあいまいに区
    分化してこれをニューラルネットワークまたは可変パラ
    メータにより合成された関数モデルからなる部分システ
    ムモデルの集合としてモデル化するとともに、前記各部
    分システムモデルにそれぞれ対応して、ニューラルネッ
    トワークまたは可変パラメータにより合成された関数モ
    デルからなる部分制御器モデルを設けて構成された複数
    の部分制御システムモデルと、 前記複数の部分制御器モデルの合成出力を制御入力とし
    て前記制御対象システムに与えながら、前記制御対象シ
    ステムの出力と前記複数の部分制御システムモデルの合
    成出力とが一致するよう前記部分制御システムモデルの
    修正を行い、かつ前記制御対象システムの出力と前記目
    標出力とが一致するよう前記各部分制御器モデルの修正
    を行う学習制御手段と、 前記制御対象システムの特徴を複数のメンバシップ関数
    によりあいまいに記述し、この複数のメンバシップ関数
    と前記部分制御システムモデルとの結合関係をその確か
    らしさとともに記憶する記憶手段とを備え、 前記部分制御器モデルの合成出力および前記部分制御シ
    ステムモデルの合成出力を、前記結合関係とその確から
    しさに基づいて得るようにし、かつ前記部分制御システ
    ムモデルの修正および前記部分制御モデルの修正を、前
    記結合関係に基づいてその確からしさに反比例する度合
    で行い、前記記憶手段は、記憶している確からしさを、
    対応する前記部分制御器モデルの習熟度に比例し前記制
    御対象システムの出力と前記部分制御システムモデルの
    合成出力との差異に比例した度合で修正することを特徴
    とする適応型学習制御システム。
JP1047131A 1989-02-28 1989-02-28 適応型学習制御システム Pending JPH02226460A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1047131A JPH02226460A (ja) 1989-02-28 1989-02-28 適応型学習制御システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1047131A JPH02226460A (ja) 1989-02-28 1989-02-28 適応型学習制御システム

Publications (1)

Publication Number Publication Date
JPH02226460A true JPH02226460A (ja) 1990-09-10

Family

ID=12766580

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1047131A Pending JPH02226460A (ja) 1989-02-28 1989-02-28 適応型学習制御システム

Country Status (1)

Country Link
JP (1) JPH02226460A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2000004457A1 (fr) * 1998-07-17 2000-01-27 Japan Science And Technology Corporation Machine didactique pour agents
JP2010055303A (ja) * 2008-08-27 2010-03-11 Denso It Laboratory Inc 学習データ管理装置、学習データ管理方法及び車両用空調装置ならびに機器の制御装置
WO2012173283A1 (ja) * 2011-06-16 2012-12-20 日本電気株式会社 システム性能予測方法、情報処理装置およびその制御プログラム

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2000004457A1 (fr) * 1998-07-17 2000-01-27 Japan Science And Technology Corporation Machine didactique pour agents
US6529887B1 (en) * 1998-07-17 2003-03-04 Agency Of Industrial Science And Technology Agent learning machine
JP2010055303A (ja) * 2008-08-27 2010-03-11 Denso It Laboratory Inc 学習データ管理装置、学習データ管理方法及び車両用空調装置ならびに機器の制御装置
WO2012173283A1 (ja) * 2011-06-16 2012-12-20 日本電気株式会社 システム性能予測方法、情報処理装置およびその制御プログラム
JPWO2012173283A1 (ja) * 2011-06-16 2015-02-23 日本電気株式会社 システム性能予測方法、情報処理装置およびその制御プログラム

Similar Documents

Publication Publication Date Title
Ma et al. Adaptive finite-time output-feedback control design for switched pure-feedback nonlinear systems with average dwell time
US8554707B2 (en) Method for the computer-assisted control and/or regulation of a technical system where the dynamic behavior of the technical system is modeled using a recurrent neural network
CN101689044B (zh) 用于计算机辅助控制和/或调节燃气涡轮机的方法
Martínez-Soto et al. Type-1 and Type-2 fuzzy logic controller design using a Hybrid PSO–GA optimization method
Lin et al. Nonlinear system control using self-evolving neural fuzzy inference networks with reinforcement evolutionary learning
Li et al. Policy iteration based Q-learning for linear nonzero-sum quadratic differential games
Shorinwa et al. Distributed multirobot task assignment via consensus ADMM
JPH02226460A (ja) 適応型学習制御システム
Rodriguez et al. Potentials of quadratic neural unit for applications
Segall et al. Dynamic file assignment in a computer network--Part II: Decentralized control
CN106371321A (zh) 一种焦化炉炉膛压力***模糊网络优化pid控制方法
Vandegrift et al. Adaptive fuzzy logic control of discrete-time dynamical systems
Jagtap et al. Extreme-ANFIS: A novel learning approach for inverse model control of Nonlinear Dynamical Systems
Yu et al. Online fuzzy modeling with structure and parameter learning
Chen et al. Multi-valued neural network trained by differential evolution for synthesizing multiple-valued functions
Wang et al. Stability analysis and stabilization for fuzzy hyperbolic time-delay system based on delay partitioning approach
Wang et al. Medical diagnosis applications using a novel interactively recurrent self-evolving fuzzy CMAC model
Karachalios et al. Parameter Refinement of a Ballbot and Predictive Control for Reference Tracking with Linear Parameter-Varying Embedding
Yang et al. Intelligent Forecasting System Using Grey Model Combined with Neural Network.
Busoniu et al. Fuzzy approximation for convergent model-based reinforcement learning
Zhou Large-scale multi-agent decision-making using mean field game theory and reinforcement learning
Ishida Control by a policy-and-experience-driven neural network
Chatlatanagulchai et al. Robust observer backstepping neural network control of nonlinear systems in strict feedback form
Doncescu et al. The logic of hypothesis generation in kinetic modeling of system biology
Chikrii On time extension in differential games with impulse controls