JP3039814B2 - 学習制御方式 - Google Patents

学習制御方式

Info

Publication number
JP3039814B2
JP3039814B2 JP3223437A JP22343791A JP3039814B2 JP 3039814 B2 JP3039814 B2 JP 3039814B2 JP 3223437 A JP3223437 A JP 3223437A JP 22343791 A JP22343791 A JP 22343791A JP 3039814 B2 JP3039814 B2 JP 3039814B2
Authority
JP
Japan
Prior art keywords
trial
deviation
time
equation
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP3223437A
Other languages
English (en)
Other versions
JPH0546206A (ja
Inventor
裕司 中村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yaskawa Electric Corp
Original Assignee
Yaskawa Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yaskawa Electric Corp filed Critical Yaskawa Electric Corp
Priority to JP3223437A priority Critical patent/JP3039814B2/ja
Publication of JPH0546206A publication Critical patent/JPH0546206A/ja
Application granted granted Critical
Publication of JP3039814B2 publication Critical patent/JP3039814B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Feedback Control In General (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、繰り返し動作をする工
作機械、ロボット等の制御方式に関する。
【0002】
【従来の技術】繰り返し目標値に対する学習制御系の設
計法としては、本出願人が特開平1-237701号公報におい
て、提案した方式がある。この方式は、同じ目標値に対
する動作を繰り返し、過去の偏差および制御対象の動特
性に関する情報をもとに未来の偏差を予測し、その予測
値の重み付き2乗和を評価関数として、その評価関数が
最小となるように制御入力を補正していくというもの
で、最終的には目標値と出力が一致するため、高精度な
追従動作が実現される。
【0003】
【発明が解決しようとする課題】上述の方式では、現在
時刻以降の補正量は現在時刻の値から変化しないと仮定
した上で、未来の偏差を予測し現在の補正量を決定して
いた。しかし、補正量は実際には変化するため、偏差の
予測値がずれてしまい、精度が悪化するうという問題が
あった。そこで本発明は、偏差の予測をより正確に行え
る制御方式を提供することを目的とする。
【0004】
【課題を解決するための手段】上記問題点を解決するた
め、本願記載の発明では、現在時刻以降の補正量の変化
も考慮した上で未来の偏差を予測しており、それぞれ次
のような特徴を持つ。本願の請求項1記載の発明では、
同じパターンを繰り返す目標指令に制御対象の出力を追
従させるよう試行を繰り返し、k回目の試行の、時刻i
における制御 入力uk (i) を、次式 uk (i) = uk-1(i) +σk (i) σk (i) = wh1F T W[ eL (i)-HP σp (i)] ただし、 σk (i):前回の制御入力uk-1(i)からの補正量 σP (i):現在時刻に至るまでに入力してきた補正量 eL (i):前回の試行における追従偏差 wh1: 制御対象の動特性に関する情報と、未来の追従偏
差の予測値に掛ける重み行列によって決定される定数 HF,P : 制御対象の動特性に関する情報によって決定
される定数 W: 未来の追従偏差の予測値にかける重み行列 である。で与えることを特徴としている。本願の請求項
2記載の発明では、同じパターンを繰り返す目標指令に
制御対象の出力を追従させるよう試行を繰り返し、k回
目の試行の、時刻iにおける制御入力uk (i) を、次式 uk (i) = uk-1(i) +σk (i)
【0005】
【数4】
【0006】ただし、 σk (i):前回の制御入力uk-1(i)からの補正量 ek (i):k 回目の試行の時刻iにおける追従偏差 pm ,fn : 制御対象のステップ応答のサンプル値と、
未来の追従偏差の予測値に掛ける重み行列によって決定
される定数 である。で与えることを特徴としている。他の実施例で
は、同じパターンを繰り返す目標指令に制御対象の出力
を追従させるよう試行を繰り返し、k回目の試行の、時
刻iにおける制御入力uk (i) を、次式 uk (i) = uk-1(i) +σk (i)
【0007】
【数5】
【0008】ただし、 σk (i):前回の制御入力uk-1(i)からの補正量 ek (i):k回目の試行の時刻iにおける追従偏差 ΔH n : 制御対象のステップ応答のサンプル値の差分値 である。で与えることを特徴としている。
【0009】
【作用】上記手段により、未来の追従偏差の予測がより
精確になり学習性能が向上する。
【0010】
【実施例】本発明は目標指令が一定周期で連続的に繰り
返す場合にも適用可能であるが、制御入力を決定する際
に偏差の現在値を利用しないため、各試行を間欠的に行
い、各試行間に次の1試行分の制御入力をオフライン的
にまとめて算出することも可能である。ここでは、後者
の場合について本発明の具体的実施例を図を用いて説明
する。図1は本願請求項1記載の発明の実施例である。
図中1は同じパターンを間欠的に発生する指令発生器で
あり、1試行分の目標指令値の系列{r(j) } (j=i0,i
0+1,…,in ) を発生する。ここで、i0と in は、試行の
開始時刻と終了時刻である。2は減算器であり、今回の
試行時の偏差の系列{ek (j) } (j=i0,i0+1,…,in )
を出力する。3は、定数行列wh1、HF 、HP 、Wを記
憶するメモリ、4は、今回試行時の補正量σk (j)(j=
i0,i0+1,…,in ) を記憶するメモリ、5は、前回の試行
時の偏差ek-1 (j)(j=i0,i0+1,…,in ) を記憶するメモ
リであり、今回の試行の際には、減算器2の出力値すな
わち偏差のek (j)(j=i0,i0+1,…,in ) が記憶される。
6は演算器であり、 σk (i) = wh1F T W[ eL (i)-HP σP (i)] (1a) なる演算によって、時刻iにおける補正量σk (i) を算
出し、さらに、 uk (i) = uk-1 (i) + σk (i) により、今回の試行時の制御入力uk (j) (j=i0,i0+1,
…,in ) を求め出力する。
【0011】7は、1試行分の制御入力を記憶するメモ
リで、前回の試行時には前回の試行時の入力uk-1 (j)
(j=i0,i0+1, …,in ) が記憶されており、前回の試行が
終了した後に、演算器6によって算出される今回の試行
時の入力uk (j)(j=i0,i0+1,…,in ) が記憶され、今回
の試行の際に出力される。8、9はサンプリング周期T
で閉じるサンプラであり、10はホールド回路である。
11は入力がu(t) で出力がy(t) の制御対象である。
図2は本願請求項2記載の発明の実施例である。図中2
3は、定数p1 、p2、・・・ 、pM 、f1 、f2 、・・・
、fN-1 を記憶するメモリ、26は演算器であり、
【0012】
【数6】
【0013】なる演算によって、時刻iにおける補正量
σk (i) を算出し、さらに、 uk (i) = uk-1(i) +σk (i) により、今回の試行時の制御入力uk (j) (j=i0,i0+1,
, i n ) を求め出力する。図3は他の実施例である。
図中33は、制御対象のステップ応答のサンプリング値
の差分値Δ Hd , Δ Hd+1,…, Δ HN を記憶するメモ
リ、37は演算器であり、
【0014】
【数7】
【0015】なる演算によって、時刻iにおける補正量
σk (i) を算出し、さらに、uk (i) = uk-1 (i) + σ
k (i) により、今回の試行時の制御入力uk (j) (j=i0,i0+1,
, i n ) を求め出力する。(1a)〜(1c)式の導出を行
う。制御対象11はインパルス応答モデルにより、
【0016】
【数8】
【0017】と表すことができる。ここでΔ Hn は、前
もって測定された制御対象11の単位ステップ応答のサ
ンプル値{ H1 ,H2 , …,HN }(図4)の差分値である
(Δ Hn = Hn - Hn-1 )。Nは応答が十分に整定する
ように、すなわち、Δ Hn ≒0(n>N) となるように選ぶ
ものとし、ΔH0=0 である。さらに、実際の出力y(i)
と(2) 式のモデル出力
【0018】
【数9】
【0019】との差、すなわち、推定誤差をd(i) とす
る。
【0020】
【数10】
【0021】いまk回目の試行の、時刻iにおける制御
入力uk (i) を、次式で与えるものとする。 uk (i) = uk-1 (i) + σk (i) (4) ただし、kは試行回数を表わし、σk (i) は前回の制御
入力uk-1 (i) からの補正量である。ここで、未来の追
従偏差の予測値ek * を以下の手順で求める。k回目の
試行の時刻iにおいて、出力yk (i) は、次式で表すこ
とができる。
【0022】
【数11】
【0023】さらに k-1回目の試行の時刻iにおいて
は、
【0024】
【数12】
【0025】となる。(5) 式から(6) 式を引くことによ
り、次式を得る。
【0026】
【数13】
【0027】である。ここでδk (i) は、出力yk (i)
の、前回試行時の同じ時刻の出力yk-1 (i) からの変化
分である。さらに、時刻 i+mの出力変化分δk (i+m) は
次式で表される。
【0028】
【数14】
【0029】いま、時刻iにおいてMステップ先までの
出力変化分の予測値δk * (i+m) (m=1,2, …,M) を求め
る際に、(2) 式のモデルによる推定誤差は不変、すなわ
ち、dk (i+m) =dk-1(i+m) であると仮定すると、予
測値δk * (i+m) は、(10)式より、
【0030】
【数15】
【0031】となる。δk (i) の定義により、時刻 i+m
における追従偏差ek (i+m) は次式で表される。 ek (i+m) = ek-1(i+m) -δk (i+m) (12) したがって, その予測値ek * (i+m) は次式で与えられ
る。 ek * (i+m) = ek-1(i+m) -δk * (i+m) (13) (11)、(13)式より、偏差の予測値ek * (i+m) は結局次
式で与えられる。
【0032】
【数16】
【0033】書き直すと、 e* (i) = eL (i) - HP σP (i) - HF σF (i) (15) ただし、 e* (i) = [ ek * (i+1),ek * (i+2),…, ek * (i
+M) ]TL (i) = [ ek-1(i+1), ek-1(i+2), …, ek-1(i+
M) ]Tk-1(j): k-1 回目の試行の時刻j における追従偏差 σP (i) = [ σk (i-1),σk (i-2),……, σk (i-N+
1) ]T σF (i) = [ σk (i),σk (i+1),…, σk (i+M-1) ]
T
【0034】
【数17】
【0035】となる。上式より未来の追従偏差の予測値
* (i) は、前回の試行における追従偏差eL (i) 、現
在に至るまでに入力してきた補正量σP (i) 、これから
決定すべき現在時刻以降の補正量σF (i) によって予測
されている。いま、Mステップ未来までの追従偏差の予
測値e* (i) をより小さくするための指標として、次の
評価関数J J = e* (i) T We* (i) = [eL (i)-HP σP (i)-HF σF (i)]T ×W[ eL (i)-HP σP (i) - HF σF (i)] (16)
【0036】
【数18】
【0037】を考え、この評価関数Jが最小となるよう
にσF (i) を決定する。ここで wm は、mステップ未来
の追従偏差の予測値ek * (i+m) にかける重み係数であ
り、図5に一例を示す。ただし,wm >0 (m=1,2,…,M) と
する。評価関数(16)を最小にするσF (i) は、重み付き
最小2乗推定により、次式で与えられる。 σF (i) = [ HF T WHF ]-1F T W[ eL (i)-HP σP (i)] (17) したがって、現在決定すべきσk (i) は、次式で与えら
れる。 σk (i) = wh1F T W[ eL (i)-HP σP (i)] (18) ただし、wh1は、行列[ HF T WHF ]-1の1行目であ
り、wh1F T Wは、ステップ応答データ{ Hn }を測
定し、重み行列Wを適当に与えることにより、学習を行
う前にあらかじめ算出できる。したがって、時刻iにお
ける補正量σk (i) は、(1a)式に従って決定される。本
願の請求項2記載の発明では、未来の補正量σk (i+2)
以降は、すべてσk(i+1) と等しいと仮定すると、(15)
式は、 e* (i) = eL (i) - HP σP (i) - HF2σF2(i) (19) σF2(i) = [ σk (i),σk (i+1) ]T
【0038】
【数19】
【0039】となる。ここで、(16)式の評価関数Jは、 J =e* (i) T We* (i) = [eL (i)-HP σP (i)-HF2σF2(i)]T ×W[ eL (i)-HP σP (i)-HF2σF2 (i)] (20) となる。この評価関数(20)を最小にするσF2(i) は、同
様に重み付き最小2乗推定により、次式で与えられる。 σF2(i) = [ HF2 T WHF2 ]-1F2 T W[ eL (i)-HP σP (i)] (21) ここで、
【0040】
【数20】
【0041】であるから、(21)式より現在決定すべきσ
k (i) は、
【0042】
【数21】
【0043】となる。さらに、 [ c,-b ]HF2 T W = [ cw1ΔH1,cw2ΔH2-bw2H1, …, cw
M Δ HM - bwM HM-1]であるから、(22)式より、
【0044】
【数22】
【0045】書き直すと、
【0046】
【数23】
【0047】ただし、
【0048】
【数24】
【0049】であり、これらの定数は、ステップ応答デ
ータ{ Hn }を測定し、重み行列Wを適当に与えること
により、学習を行う前にあらかじめ算出できる。したが
って、時刻iにおける補正量σk (i) は(1b)式に従って
決定される。図3に示す他の実施例の発明では、制御対
象にむだ時間があり、H1=H2=… Hd-1=0, Hd ≠0 である
として、(15)式を次のように変形する。 e* d (i) = eLd(i) - HPdσPd(i) - HFdσFd(i) (25) ただし、 e* d (i) = [ ek * (i+d),ek * (i+d+1),…, ek *
(i+M) ]TLd(i) = [ ek-1 (i+d),ek-1(i+d+1), …, ek-1(i+
M) ]T σPd(i) = [ σk (i-1),σk (i-2),……, σk (i-N+d)
]T σFd(i) = [ σk (i),σk (i+1),…, σk (i+M-d) ]T
【0050】
【数25】
【0051】となる。ここで、次の評価関数J、 J = e* d (i) T We* d (i) =[ eLd(i)-HPdσPd(i)-HFdσFd(i)]T ×W[ eLd(i)-HPdσPd(i)-HFdσFd(i)] (26) を最小にするσFd(i) は、同様に重み付き最小2乗推定
により、次式で与えられる。 σFd(i) = [ HFd T WHFd ]-1Fd T W[ eLd(i)-HPdσPd(i)] (27) ここで、 [ HFd T WHFd ]-1Fd T W = HFd -1-1Fd -TFd T W = HFd -1 (28) であり、さらにHFd -1の1行目は[ Δ Hd -1,0,0, …,0
]であるから、(27)、(28)式より現在決定すべきσ
k (i) は、
【0052】
【数26】
【0053】したがって、時刻iにおける補正量σ
k (i) は(1c)式に従って決定される。以上で、(1a)〜(1
c)式で与えられる補正量σk (i) が、それぞれ、(16)、
(20)、(26)式の評価関数Jを最小にすることが示され
た。
【0054】
【発明の効果】以上述べたように、本発明によれば、同
じパターンの目標値に対する動作を繰り返す学習制御系
において、過去の偏差および制御対象の動特性に関する
情報をもとに未来の偏差を予測し、その予測値の重み付
き2乗和が最小となるように制御入力を補正しており、
その際に、時刻iの補正量σk (i) のみならずそれ以降
の未来の補正量σk (i+1),σk (i+2),…も考慮している
ため、最終的には目標値と出力が一致し、高精度な追従
動作が実現される。さらに、この補正演算は現在時刻の
偏差などの情報を必要としないため、各試行の間で実行
すれば良い。
【図面の簡単な説明】
【図1】本発明の具体的実施例を示す図
【図2】本発明の具体的実施例を示す図
【図3】本発明の具体的実施例を示す図
【図4】本発明の動作説明図
【図5】本発明の動作説明図
【符号の説明】
1 指令発生器 2 減算器 3、4、5、7 メモリ 6 演算器 8、9 サンプラ 10 ホールド回路 11 制御対象 23 メモリ 26 演算器 33 メモリ 37 演算器

Claims (2)

    (57)【特許請求の範囲】
  1. 【請求項1】 同じパターンを繰り返す目標指令に制御
    対象の出力を追従させるよう試行を繰り返し、k回目の
    試行の、時刻iにおける制御入力uk (i) をMステップ
    未来までの追従偏差予測値の重みつき2乗和が最小とな
    るように、次式 uk (i) = uk-1(i) +σk (i) σk (i) = wh1F T W[ eL (i)-HP σP (i)] (ただし、 σk (i):前回の制御入力uk-1(i)からの補正量 σP (i):現在時刻に至るまでに入力してきた補正量 eL (i):前回の試行における追従偏差 wh1: 制御対象の動特性に関する情報と、未来の追従偏
    差の予測値に掛ける重み行列によって決定される定数 HF,P : 制御対象の動特性に関する情報によって決定
    される定数 W: 未来の追従偏差の予測値にかける重み行列 eL (i) = [ ek-1(i+1), ek-1(i+2), …, ek-1(i+
    M) ]Tk-1(j): k-1 回目の試行の時刻j における追従偏差 σP (i) = [ σk (i-1),σk (i-2),……, σk (i-N+
    1) ]Th1は、行列[ HF T WHF ]-1の1行目 【数1】 Δ Hn は、前もって測定された制御対象の単位ステップ
    応答のサンプル値{ H1 ,H2 , …,HN }の差分値である
    (Δ Hn = Hn - Hn-1 )。WはMステップ未来までの
    追従偏差の予測値にかける重み係数{w1,w2,…,wM}を
    対角要素に持つ重み行列である)で与えることを特徴と
    する学習制御方式。
  2. 【請求項2】 同じパターンを繰り返す目標指令に制御
    対象の出力を追従させるよう試行を繰り返し、k回目の
    試行の、時刻iにおける制御入力uk (i) をMステップ
    未来までの追従偏差予測値の重みつき2乗和が最小とな
    るように、次式 uk (i) = uk-1(i) +σk (i) 【数2】 (ただし、 σk (i):前回の制御入力uk-1(i)からの補正量 ek (i):k 回目の試行の時刻iにおける追従偏差 であり、さらに、 pm = (cw m Δ Hm -bw m H m-1 )/(ac-b2) m=1,2,
    …,M 【数3】 であり、Δ Hn は、前もって測定された制御対象の単位
    ステップ応答のサンプル値{ H1 ,H2 , …,HN }の差分
    値であり、wm はmステップ未来の追従偏差予測値にか
    ける重み係数である)で与えることを特徴とする学習制
    御方式。
JP3223437A 1991-08-07 1991-08-07 学習制御方式 Expired - Fee Related JP3039814B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3223437A JP3039814B2 (ja) 1991-08-07 1991-08-07 学習制御方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3223437A JP3039814B2 (ja) 1991-08-07 1991-08-07 学習制御方式

Publications (2)

Publication Number Publication Date
JPH0546206A JPH0546206A (ja) 1993-02-26
JP3039814B2 true JP3039814B2 (ja) 2000-05-08

Family

ID=16798135

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3223437A Expired - Fee Related JP3039814B2 (ja) 1991-08-07 1991-08-07 学習制御方式

Country Status (1)

Country Link
JP (1) JP3039814B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6331539B2 (ja) * 2014-03-19 2018-05-30 カシオ計算機株式会社 駆動装置、光源駆動装置、光源装置、投影装置及び駆動方法

Also Published As

Publication number Publication date
JPH0546206A (ja) 1993-02-26

Similar Documents

Publication Publication Date Title
KR970003823B1 (ko) 주기적 목표치에 최적하게 추종하는 제어방식
JP3296527B2 (ja) モータ速度制御装置
KR100342788B1 (ko) 예견제어방법
KR100444806B1 (ko) 동기제어장치
JPH0695707A (ja) モデル予測制御装置
JP3039814B2 (ja) 学習制御方式
KR100267362B1 (ko) 예견제어장치
JP3036654B2 (ja) 学習制御方式
JP3109605B2 (ja) 学習制御方法
JP2541163B2 (ja) 周期的目標値に最適に追従する制御方式
JP3062606B2 (ja) ニューラルネットワークを用いた適応制御装置
JP3039573B2 (ja) 学習制御方式
JP2921056B2 (ja) 速度指令の補正による学習制御装置
JP3191836B2 (ja) 学習制御装置
JP3194395B2 (ja) 経路関数逐次生成方法
JP3152251B2 (ja) 増分値演算による学習制御方法
JPH0830979B2 (ja) 周期的目標値に最適に追従する制御方法
JP2594423B2 (ja) 産業用ロボツトの制御装置
JPH04369002A (ja) 近似ステップ応答による予見学習制御方式
JP3256950B2 (ja) 最適予見学習制御装置
JPH10323070A (ja) モータ制御装置
JP3196907B2 (ja) 出力検出にむだ時間を持つ系の学習制御装置
JP2000035804A (ja) 学習制御方法および学習制御装置
JP2958978B2 (ja) 学習制御方法
JPH05143109A (ja) 速度指令の補正による学習制御方式

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090303

Year of fee payment: 9

LAPS Cancellation because of no payment of annual fees