JPS62245401A - Learning control system - Google Patents
Learning control systemInfo
- Publication number
- JPS62245401A JPS62245401A JP8962486A JP8962486A JPS62245401A JP S62245401 A JPS62245401 A JP S62245401A JP 8962486 A JP8962486 A JP 8962486A JP 8962486 A JP8962486 A JP 8962486A JP S62245401 A JPS62245401 A JP S62245401A
- Authority
- JP
- Japan
- Prior art keywords
- value
- time
- command value
- learning control
- error
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 claims description 11
- 230000001172 regenerating effect Effects 0.000 claims description 4
- 230000008929 regeneration Effects 0.000 claims description 4
- 238000011069 regeneration method Methods 0.000 claims description 4
- 238000011156 evaluation Methods 0.000 abstract description 5
- 230000006870 function Effects 0.000 abstract description 5
- 230000001105 regulatory effect Effects 0.000 abstract 1
- 238000010586 diagram Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
Landscapes
- Numerical Control (AREA)
- Feedback Control In General (AREA)
Abstract
Description
【発明の詳細な説明】
〔産業上の利用分野〕
この発明は、プレイバック形ロボット等のように繰り返
し制御を行う対象物の学習制御方式に係り、特に収束性
の速い学習制御方式に関するものである。[Detailed Description of the Invention] [Industrial Application Field] The present invention relates to a learning control method for objects that are repeatedly controlled, such as playback robots, and in particular to a learning control method with fast convergence. be.
一般に上記のような繰り返し制御を行う対象物の位置決
め制御を行う場合には、まず教示動作を行なって対象物
に目標とする作業軌跡の位置データ(これを教示値とい
う)を覚え込ませ、この教示値にしたがって再生運転を
行うとともに、上記教示値と運転軌跡との偏差値を検出
して、この偏差値を前記の教示値に加えて次回の再生運
転のための指令値とする学習制御方式が採用されている
。Generally, when performing positioning control of an object that involves repeated control as described above, first a teaching operation is performed to make the object memorize the position data of the target work trajectory (this is called a teaching value). A learning control method that performs regenerative operation according to the taught value, detects the deviation value between the taught value and the driving trajectory, and adds this deviation value to the aforementioned taught value as a command value for the next regenerative operation. has been adopted.
また、最近では、昭和60年4月6日に開丞された特開
昭60−57409号1学習制御方法Iのように、各自
由度毎の動的遅れ時間をこの動的遅れ時間毎に測定し、
こうして得られた動的遅れ時間分だけ早く教示値または
指令値に上記偏差値を加えて再生運転することにより、
より位置決め精度が向上するという学習制御方式が提供
されている。In addition, recently, as in Japanese Patent Application Laid-Open No. 60-57409 1 Learning Control Method I published on April 6, 1985, the dynamic delay time for each degree of freedom is calculated for each dynamic delay time. measure,
By adding the above deviation value to the teaching value or command value earlier by the dynamic delay time obtained in this way and performing regenerative operation,
A learning control method has been proposed that further improves positioning accuracy.
しかしながら、いずれにせよ従来の学習制御では、ある
特定の時刻の偏差値だけで教示値または指令値を修正し
ているため、試行回数を多く繰り返さなければならない
。つまり、収束性の悪い制御しか実現できないという問
題があった。However, in any case, in conventional learning control, the taught value or the command value is corrected only based on the deviation value at a certain specific time, so many trials must be repeated. In other words, there is a problem in that only control with poor convergence can be realized.
この発明は上記のような問題点を解消するためになされ
たもので、位置決め精度が良いとともに、収束性の速い
(すなわち、試行回数の少ない)学習制御方式を得るこ
とを目的とする。This invention was made to solve the above-mentioned problems, and aims to provide a learning control method that has good positioning accuracy and fast convergence (that is, requires a small number of trials).
この発明に係る学習制御方式は、ある時刻から一定時間
先までのすべての偏差値情報を用いて。The learning control method according to the present invention uses all deviation value information from a certain time to a certain period of time.
教示値または指令値な修正するようにしたものである。The teaching value or command value can be corrected.
この発明における学習制御は、ある時刻から一定時間先
までの偏差値情報を用いて指令値を修正するため1例え
ば再生値が目標値からずっと遅れている場合には、ある
時刻の値のみで指令値を修正する場合に比べてより効果
的に修正が行えるため、収束性の早い学習制御が実現で
きる。The learning control in this invention corrects the command value using deviation value information from a certain time to a certain period of time.1 For example, if the reproduction value is far behind the target value, the command is issued only with the value at a certain time. Since the correction can be made more effectively than when correcting the value, learning control with fast convergence can be realized.
μ下、この発明の一実施例を図について説明する。第1
図において、(1)は制御対象物(6)を制御する指令
値を発生する指令値演算装置で、例えばデジタル計算機
である。(2)はこの指令値演算装置(1)からのデジ
タル信号をアナログ信号に変換するD/入コンバータ、
(3)は例えば演算増@器よりなる比較器、(4)は制
御回路、(5)はサーボ増幅器、(6)は制御対象物、
(7)はこの制御対象物(6)からの出力信号を検出す
る検出器、(8)はこの検出器(7)により帰還された
アナログ信号をデジタル信号に変換するA/Dコンバー
タ、(9)はいコンバータ(8)からのデジタル信号を
記憶するメモリである。An embodiment of the present invention will be described below with reference to the drawings. 1st
In the figure, (1) is a command value calculation device that generates a command value for controlling a controlled object (6), and is, for example, a digital computer. (2) is a D/input converter that converts the digital signal from this command value calculation device (1) into an analog signal;
(3) is a comparator consisting of an operational amplifier, (4) is a control circuit, (5) is a servo amplifier, (6) is a controlled object,
(7) is a detector that detects the output signal from this controlled object (6), (8) is an A/D converter that converts the analog signal fed back by this detector (7) into a digital signal, (9 ) is a memory that stores the digital signal from the converter (8).
この実施例の動作を第2図のフローチャートに基づいて
説明する。まず、ステップa聾の初期設定では、教示動
作等により対象物に目標とする作業軌跡の位置データを
覚え込ませるとともに、先行情報利用時間(1)等の各
種利得の設定を行う。つづいて、ステップ(2)では前
記の初期設定に基づいて再生運転を行う。このとぎ、各
サンプル時間毎の制御対象物(6)からの出力信号は、
検出器(7)、A/Dコンバータ(8)を通して、メモ
リ(9)に記憶される。The operation of this embodiment will be explained based on the flowchart of FIG. First, in the initial setting of step a, the target object is memorized with the position data of the target work trajectory by a teaching operation, and various gains such as the advance information usage time (1) are set. Subsequently, in step (2), a regeneration operation is performed based on the above-mentioned initial settings. At this point, the output signal from the controlled object (6) for each sample time is
The data is stored in a memory (9) through a detector (7) and an A/D converter (8).
1回の再生運転が終了すると、記憶されたデータをもと
に、ステップ(2)では指令値演算装置(1)において
例えば誤差2乗積分値のような評価関数(J)が計算さ
れる。もし1次のステップα尋で評価関数(J)が所定
の値(J+nin )より小さい場合(yes )には
制御を終了するが、そうでない場合(no )には、ス
テップα日である時刻(1)から(を十T)までの時間
の誤差(e(t)〜e(t+T))を用いて指令値(u
(t))を修正し、新たな指令値を用いてステップ(2
)で再度再生運転を行う。μ下問様の操作を評価関数(
J)が(Jmin )より小さくなるまで繰り返す。When one regeneration operation is completed, an evaluation function (J) such as an error squared integral value is calculated in step (2) in the command value calculation device (1) based on the stored data. If the evaluation function (J) is smaller than the predetermined value (J+nin) at the first step α (yes), the control is terminated, but if not (no), the time ( The command value (u
(t)) and step (2) using the new command value.
) to perform regeneration operation again. The evaluation function (
Repeat until J) becomes smaller than (Jmin).
上記の指令値修正に関しては、第3図の特性線図をもと
にさらに詳しく説明する。第6図において、横軸は時間
、縦軸は制御対象物の位置を表し。The above command value correction will be explained in more detail based on the characteristic diagram shown in FIG. In FIG. 6, the horizontal axis represents time and the vertical axis represents the position of the controlled object.
実線[7d(t)]が目標軌跡、一点鎖線(yk(t)
)が(旧回試行時の実際の運動軌跡を表す。従来の学習
制御では(k+1)回目の指令値CUk++ (t)
”3は1時刻(1)における誤差[ek(t))あるい
殆何等かの方法で求められた遅れ補償時間(Tc )だ
け進んだ地点での誤差値(ek (t+Tc) )だけ
を用いて修正されていたが、この発明では時刻(1)か
ら先行情報利用時間σ)の間の(TAt)個すべての誤
差値情報[e(t))〜Ce (t+T) )を用いて
指令値を修正する。このため、ある一時刻の誤差で修正
していたよりも早く目標値に達することができる。The solid line [7d(t)] is the target trajectory, and the dashed line (yk(t)
) represents the actual movement trajectory at the previous trial. In conventional learning control, the (k+1)th command value CUk++ (t)
``3 uses only the error value [ek(t)] at one time (1) or the error value (ek(t+Tc)) at a point advanced by the delay compensation time (Tc) obtained by almost any method. However, in this invention, all (TAt) pieces of error value information [e(t)) to Ce (t+T)) between time (1) and advance information usage time σ) are used to calculate the command value. As a result, the target value can be reached sooner than if it were corrected based on a one-time error.
なお、上記実施例では、サーボ制御装置および制御対象
物(6)はアナログサーボ系としたが、これをデジタル
サーボ系としてもよいことはいうまでもない。また、上
記説明では一目由4度に限って説明をしたが、同様に多
自由度を有する制御対象についても適用可能である。In the above embodiment, the servo control device and the controlled object (6) are analog servo systems, but it goes without saying that they may be digital servo systems. Further, in the above explanation, the explanation was limited to the 4 degrees at a glance, but the present invention is similarly applicable to a controlled object having multiple degrees of freedom.
μ上のように、この発明によれば、学習制御方式におい
て、各自由度毎にある時刻から一定時間先までのすべて
の誤差情報を用いて指令値を修正するように構成したの
で1位置決め精度が良いとともに、収束性の速い学習制
御が得られる効果がある。As described above, according to the present invention, in the learning control method, the command value is corrected using all error information from a certain time to a certain period of time for each degree of freedom, so one positioning accuracy is achieved. This has the effect of providing learning control with good convergence and fast convergence.
第1図はこの発明の一実施例による学習制御装置を示す
ブロック図、第2図はこの本発明の−実路側である学習
制御方式の処理手順の一例を示すフローチャート、第6
図はこの発明の詳細な説明するだめの特性線図である。
図中、(1)は指令値演算装置、(2)はD/Aコンバ
ータ、(3)は比較器、(4)は制御回路、(5)はサ
ーボ増幅器、(6)は制御対象物、(7)は検出器、(
8)はA/Dコンバータ、(9)はメモリである。
なお、各図中同一符号は同一または相当部分を示す。FIG. 1 is a block diagram showing a learning control device according to an embodiment of the present invention, FIG.
The figure is a characteristic diagram for detailed explanation of this invention. In the figure, (1) is a command value calculation device, (2) is a D/A converter, (3) is a comparator, (4) is a control circuit, (5) is a servo amplifier, (6) is a controlled object, (7) is the detector, (
8) is an A/D converter, and (9) is a memory. Note that the same reference numerals in each figure indicate the same or corresponding parts.
Claims (1)
再生運転させて教示値と再生軌跡との偏差値を測定し、
次回の再生運転時には教示値または今回の指令値に上記
偏差値を加えて再生運転する学習制御方式において、各
自由度毎にある時刻から一定時間先までのすべての偏差
値情報を用いて上記指令値を修正することを特徴とする
学習制御方式。A controlled object having multiple degrees of freedom is operated in a regenerative manner according to the taught value, and a deviation value between the taught value and the regenerated trajectory is measured;
In a learning control method that adds the above deviation value to the taught value or the current command value during the next regeneration operation, the above command is performed using all deviation value information from a certain time to a certain period of time for each degree of freedom. A learning control method characterized by modifying values.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP8962486A JPS62245401A (en) | 1986-04-18 | 1986-04-18 | Learning control system |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP8962486A JPS62245401A (en) | 1986-04-18 | 1986-04-18 | Learning control system |
Publications (1)
Publication Number | Publication Date |
---|---|
JPS62245401A true JPS62245401A (en) | 1987-10-26 |
Family
ID=13975902
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP8962486A Pending JPS62245401A (en) | 1986-04-18 | 1986-04-18 | Learning control system |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS62245401A (en) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH02140803A (en) * | 1988-11-22 | 1990-05-30 | Yaskawa Electric Mfg Co Ltd | Learning control system |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS58223806A (en) * | 1982-06-22 | 1983-12-26 | Kobe Steel Ltd | Preventing method of gunshot vibration of robot at starting |
-
1986
- 1986-04-18 JP JP8962486A patent/JPS62245401A/en active Pending
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS58223806A (en) * | 1982-06-22 | 1983-12-26 | Kobe Steel Ltd | Preventing method of gunshot vibration of robot at starting |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH02140803A (en) * | 1988-11-22 | 1990-05-30 | Yaskawa Electric Mfg Co Ltd | Learning control system |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
GB2312765A (en) | Track seeking control system | |
JPS62245401A (en) | Learning control system | |
JPH0782382B2 (en) | Learning control method | |
JP2636264B2 (en) | Automatic servo gain adjustment method for head positioning device | |
WO1991016674A1 (en) | Discrete type repetition control method and apparatus therefor | |
JPS6315303A (en) | Learning control system | |
JPH0285902A (en) | Feedforward controller | |
JPS62174804A (en) | Learning control method for industrial robot | |
JP2703099B2 (en) | Conveyor tracking method for industrial robots | |
JP3205850B2 (en) | Robot controller | |
JP2860602B2 (en) | Head position control method for magnetic disk device | |
JPS6144324B2 (en) | ||
JPS6315302A (en) | Learning control system | |
JPS6120105A (en) | Positioning control circuit for industrial robot | |
JP2876702B2 (en) | Learning control method | |
JPH02137005A (en) | Learning control method | |
JPH04100116A (en) | Learning control system adopting correction of speed command | |
JPS59171307A (en) | Tap coefficient switching system | |
JPH03262003A (en) | Digital control method | |
JPH05314687A (en) | Disk recording/reproducing device | |
JPH01220003A (en) | Method for controlling learning of industrial robot | |
JP2797415B2 (en) | Pulse width modulator | |
JP2889086B2 (en) | Scanning exposure equipment | |
JPS58160043A (en) | Numerical controller device | |
JPH01297709A (en) | Method for controlling operation of object to be controlled |