JP2020154989A - 機械学習装置、制御システム及び機械学習方法 - Google Patents
機械学習装置、制御システム及び機械学習方法 Download PDFInfo
- Publication number
- JP2020154989A JP2020154989A JP2019054837A JP2019054837A JP2020154989A JP 2020154989 A JP2020154989 A JP 2020154989A JP 2019054837 A JP2019054837 A JP 2019054837A JP 2019054837 A JP2019054837 A JP 2019054837A JP 2020154989 A JP2020154989 A JP 2020154989A
- Authority
- JP
- Japan
- Prior art keywords
- machine learning
- unit
- coefficient
- value
- filter
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B13/00—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
- G05B13/02—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
- G05B13/0265—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric the criterion being a learning criterion
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B13/00—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
- G05B13/02—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
- G05B13/04—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators
- G05B13/042—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators in which a parameter or coefficient is automatically adjusted to optimise the performance
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B19/00—Programme-control systems
- G05B19/02—Programme-control systems electric
- G05B19/18—Numerical control [NC], i.e. automatically operating machines, in particular machine tools, e.g. in a manufacturing environment, so as to execute positioning, movement or co-ordinated operations by means of programme data in numerical form
- G05B19/19—Numerical control [NC], i.e. automatically operating machines, in particular machine tools, e.g. in a manufacturing environment, so as to execute positioning, movement or co-ordinated operations by means of programme data in numerical form characterised by positioning or contouring control systems, e.g. to control position from one programmed point to another or to control movement along a programmed continuous path
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B19/00—Programme-control systems
- G05B19/02—Programme-control systems electric
- G05B19/18—Numerical control [NC], i.e. automatically operating machines, in particular machine tools, e.g. in a manufacturing environment, so as to execute positioning, movement or co-ordinated operations by means of programme data in numerical form
- G05B19/416—Numerical control [NC], i.e. automatically operating machines, in particular machine tools, e.g. in a manufacturing environment, so as to execute positioning, movement or co-ordinated operations by means of programme data in numerical form characterised by control of velocity, acceleration or deceleration
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B2219/00—Program-control systems
- G05B2219/30—Nc systems
- G05B2219/33—Director till display
- G05B2219/33034—Online learning, training
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B2219/00—Program-control systems
- G05B2219/30—Nc systems
- G05B2219/34—Director, elements to supervisory
- G05B2219/34013—Servocontroller
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B2219/00—Program-control systems
- G05B2219/30—Nc systems
- G05B2219/41—Servomotor, servo controller till figures
- G05B2219/41232—Notch filter
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Automation & Control Theory (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Manufacturing & Machinery (AREA)
- Human Computer Interaction (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Software Systems (AREA)
- Medical Informatics (AREA)
- Evolutionary Computation (AREA)
- Health & Medical Sciences (AREA)
- Feedback Control In General (AREA)
- Numerical Control (AREA)
- Control Of Electric Motors In General (AREA)
Abstract
Description
特許文献1は、チューニングモード時には、周波数をスイープした交流信号を速度指令値の信号に重畳させ、重畳の結果、速度制御部から得られたトルク指令値信号の振幅を検出し、振幅の変化率が正から負に転じたときにおけるトルク指令値信号の周波数をノッチフィルタの中心周波数として設定するサーボアクチュエータを記載している。
特許文献3は、位置指令値から速度指令のフィードフォワード項を計算して、位置制御部から出力される速度指令に加算する神経回路網と、速度指令値からトルク指令のフィードフォワード項を計算して、速度制御部から出力されるトルク指令に加算する神経回路網とを記載している。そして、各神経回路網は駆動系の慣性モーメントの変動及び駆動系の持つ共振特性などを学習して、最適なフォードフォワード項を演算する。
そして、フィルタの伝達関数の係数と速度フィードフォワード部の伝達関数の係数の両方の最適値を求めることは容易ではない。
前記モータ制御装置の外に設けられた外部測定器と、
を備えた制御システムである。
図1に示すように、制御システム10は、モータ制御装置100と、モータ制御装置100により制御される工作機械200と、工作機械200に取り付けられた加速度センサ300とを備えている。加速度センサ300はモータ制御装置100の外に設けられる外部測定器となり、測定される加速度は測定情報となる。
モータ制御装置100の制御対象として、ここでは工作機械を取り上げて説明するが、制御対象は工作機械に限定されず、例えばロボット,産業機械等であってもよい。モータ制御装置100は、工作機械、ロボット、産業機械等の制御対象の一部として設けられてもよい。
指令フィルタ110は、例えばノッチフィルタ、加減速時定数を設定するフィルタ、又は逆特性フィルタ等が用いられる。指令フィルタ110には位置指令が入力され、指令フィルタ110は、入力された位置指令の整形を行う位置指令値整形器となる。
位置指令は、上位制御装置や外部入力装置等で、所定の加工プログラムに従って、サーボモータ127の速度を変化させるためにパルス周波数を変えるように生成される。位置指令は制御指令となる。位置指令は指令フィルタ110と機械学習部140に出力される。指令フィルタ110はサーボ制御部120の外、すなわち、後述する位置フィードバックループ及び速度フィードループの外に設けられているが、サーボ制御部120の位置フィードバックループ又は速度フィードループの中に設けてもよい。例えばサーボ制御部120の後述する速度制御部125の出力側又は加算器123の出力側に指令フィルタ110を接続してもよい。
ただし、サーボ制御部120の制御ループ(位置フィードバックループ又は速度フィードバックループ)の外の振動を抑えるため、指令フィルタ110は位置フィードバックループ又は速度フィードバックループの外に設けることが好ましい。図1では指令フィルタ110は位置偏差を求める後述の減算器121の前に配置され、指令フィルタ110の出力は減算器121及び後述する位置フィードフォワード部130に出力される。指令フィルタ110の構成は特に限定されないが、2次以上のIIRフィルタ(Infinite impulse response filter;無限インパルス応答フィルタ)であることが望ましい。
数式1の係数Rは減衰係数、係数ωは中心角周波数、係数ζは比帯域である。中心周波数をfc、帯域幅をfwとすると、係数ωはω=2πfc、係数ζはζ=fw/fcで表される。
加算器126は、トルク指令値と速度フィードフォワード部131の出力値(速度フィードフォワード項)とを加算して、フィードフォワード制御されたトルク指令値としてサーボモータ127に出力する。
積分器129はロータリーエンコーダ128から出力される速度検出値を積分して位置検出値を出力する。
工作機械200は、サーボモータ127の回転軸に連結された、カップリング(軸継手)201、ボールねじ202、ボールねじ202に螺合された2つのナット203a、203bを有する機械本体203を備えている。サーボモータ127の回転駆動によって、ボールねじ202に螺着された2つのナット203a、203bがボールねじ202の軸方向に移動することで機械本体203が移動する。
加速度センサは、一軸、二軸、三軸等の加速度センサが知られているが、必要に応じて、これらの加速度センサを選択することができる。例えば、機械本体203をX方向及びY方向に移動する場合には、2軸の加速度センサを用い、機械本体203をX方向、Y方向及びZ方向に移動する場合には、3軸の加速度センサを用いることができる。加速度センサ300は、加工点に近い場所に設けることが望ましい。
加速度センサ300は機械本体203の加速度を測定して機械学習部140に出力する。加速度センサ300は、機械学習中にのみ用いる場合には、出荷前に機械学習を行って指令フィルタ110の係数を調整し、指令フィルタ110の調整後に機械本体203から取り外してもよい。出荷後に再学習を行う場合、再学習後に取り外してもよい。加速度センサ300から出力される加速度はサーボ制御部120のフィードバック制御に使ってもよいが、フィードバック制御に使わなければ加速度センサ300は取り外し可能である。この場合、工作機械200のコストを低減でき、信頼性も向上する。
機械学習部140は、予め設定された加工プログラム(以下、「学習時の加工プログラム」ともいう)を実行し、位置指令、位置偏差及び加速度センサ300からの加速度測定値を用いて、指令フィルタ110の伝達関数の係数ω、ζ、R及び速度フィードフォワード部131の伝達関数の係数ci、djを機械学習(以下、学習という)する。機械学習部140は機械学習装置となる。機械学習部140による学習は出荷前に行われるが、出荷後に再学習を行ってもよい。
ここで、モータ制御装置100は、学習時の加工プログラムによりサーボモータ127を駆動し、被加工物(ワーク)を搭載しない状態で、機械本体203を移動させる。X軸方向及びY軸方向に移動される機械本体203の任意の点の移動軌跡は、例えば、円形、四角形、八角形、又は八角形の角が一つ置きに円弧に置き換えられた形等である。図3〜図6はそれぞれ、移動軌跡が円形、四角形、八角形、又は八角形の角が一つ置きに円弧に置き換えられた形である場合のモータの動作を説明するための図である。図3〜図6において、機械本体203は時計まわりにX軸及びY軸方向に移動するものとする。
角の位置C2で、機械本体203をY軸方向に移動するモータは、回転方向が反転し、機械本体203はY軸方向に直線反転するように移動する。また、機械本体203をX軸方向に移動するモータは、位置C1から位置C2及び位置C2から位置C3にかけて、同じ回転方向で、等速度で回転する。
角の位置C3で、機械本体203をY軸方向に移動するモータは回転速度が速くなり、機械本体203をX軸方向に移動するモータは回転速度が遅くなる。
角の位置C4で、機械本体203をX軸方向に移動するモータは、回転方向が反転し、機械本体203はX軸方向に直線反転するように移動する。また、機械本体203をY軸方向に移動するモータは、位置C3から位置C4及び位置C4から次の角の位置にかけて、同じ回転方向で、等速度で回転する。
円弧の位置D2で、機械本体203をY軸方向に移動するモータは、回転方向が反転し、機械本体203はY軸方向に直線反転するように移動する。また、機械本体203をX軸方向に移動するモータは位置D1から位置D3にかけて同じ回転方向で、等速度で回転する。図5に示した移動軌跡が八角形の場合と異なり、機械本体203をY軸方向に移動するモータは位置D2の前後で円弧の移動軌跡が形成されるように、位置D2に向かって徐々に減速され、位置D2で回転が停止され、位置D2を過ぎると回転方向が徐々に増加していく。
角の位置D3で、機械本体203をY軸方向に移動するモータは回転速度が速くなり、機械本体203をX軸方向に移動するモータは回転速度が遅くなる。
円弧の位置D4で、機械本体203をX軸方向に移動するモータは、回転方向が反転し、機械本体203はX軸方向に直線反転するように移動する。また、機械本体203をY軸方向に移動するモータは位置D3から位置D4、及び位置D4から次の角の位置にかけて同じ回転方向で、等速度で回転する。機械本体203をX軸方向に移動するモータは位置D4の前後で円弧の移動軌跡が形成されるように、位置D4に向かって徐々に減速され、位置D4で回転が停止され、位置D4を過ぎると回転方向が徐々に増加していく。
さらに、本実施形態では、位置C1と位置C3、及び位置D1と位置D3により、反転しない線形制御において回転速度が変更されたとき位置偏差に対する影響を調べることで、軌跡誤差を低減するように、速度フィードフォワード部131の係数の学習を行うことができる。
以下の説明では機械学習部140が強化学習を行う場合について説明するが、機械学習部140が行う学習は特に強化学習に限定されず、例えば、教師あり学習を行う場合にも本発明は適用可能である。
教師あり学習が、完全な正解を示すのに対して、強化学習における報酬は、環境の一部の変化に基づく断片的な値であることが多い。このため、エージェントは、将来にわたっての報酬の合計を最大にするように行動を選択するように学習する。
Q学習では、或る状態Sのとき、取り得る行動Aのなかから、価値Q(S,A)の最も高い行動Aを最適な行動として選択することを目的とする。
この更新式は、状態Stにおける行動Atの価値Q(St,At)よりも、行動Atによる次の状態St+1における最良の行動の価値maxa Q(St+1,A)の方が大きければ、Q(St,At)を大きくし、逆に小さければ、Q(St,At)を小さくすることを示している。つまり、或る状態における或る行動の価値を、それによる次の状態における最良の行動の価値に近づける。ただし、その差は、割引率γと報酬rt+1のあり方により変わってくるが、基本的には、ある状態における最良の行動の価値が、それに至る一つ前の状態における行動の価値に伝播していく仕組みになっている。
「Human-level control through deep reinforcement learning」、Volodymyr Mnih1著[online]、[平成29年1月17日検索]、インターネット〈URL:http://files.davidqiu.com/research/nature14236.pdf〉
上述した強化学習を行うために、図7に示すように、機械学習部140は、状態情報取得部141、学習部142、行動情報出力部143、価値関数記憶部144、及び最適化行動情報出力部145を備える。学習部142は報酬出力部1421、価値関数更新部1422、及び行動情報生成部1423を備える。
状態情報取得部141は、取得した状態情報Sを学習部142に対して出力する。
なお、係数ω、ζ、R及び係数ci、djは予め操作者が工作機械を調整している場合には、調整済の値を初期値として機械学習してもよい。
評価関数f(r,y,e)は、以下に示す各数式6及び数式7(以下に数6及び数7として示す)を適用することができる。係数α、係数β及び係数γは所定の定数である。
なお、評価関数f(r(S´),y(S´),e(S´))が、評価関数f(r(S),y(S),e(S))と等しい場合は、報酬出力部1421は、報酬の値をゼロとする。
価値関数Qの更新は、オンライン学習で行ってもよく、バッチ学習で行ってもよく、ミニバッチ学習で行ってもよい。
オンライン学習は、或る行動Aを現在の状態Sに適用することにより、状態Sが新たな状態S´に遷移する都度、即座に価値関数Qの更新を行う学習方法である。また、バッチ学習は、或る行動Aを現在の状態Sに適用することにより、状態Sが新たな状態S´に遷移することを繰り返すことにより、学習用のデータを収集し、収集した全ての学習用データを用いて、価値関数Qの更新を行う学習方法である。更に、ミニバッチ学習は、オンライン学習と、バッチ学習の中間的な、ある程度学習用データが溜まるたびに価値関数Qの更新を行う学習方法である。
より具体的には、最適化行動情報出力部145は、価値関数記憶部144が記憶している価値関数Qを取得する。この価値関数Qは、上述したように価値関数更新部1422がQ学習を行うことにより更新したものである。そして、最適化行動情報出力部145は、価値関数Qに基づいて、行動情報を生成し、生成した行動情報を指令フィルタ110に対して出力する。この最適化行動情報には、行動情報出力部143がQ学習の過程において出力する行動情報と同様に、指令フィルタ110の伝達関数の各係数ω、ζ、R及び速度フィードフォワード部131の伝達関数の各係数ci、djを修正する情報が含まれる。
機械学習部140は、以上の動作で、指令フィルタ110の伝達関数の各係数ω、ζ、R及び速度フィードフォワード部131の伝達関数の各係数ci、djの最適化を行い、機械端の振動を抑制するように動作することができる。
以上のように、本実施形態に係る機械学習部140を利用することで、指令フィルタ110及び速度フィードフォワード部131のパラメータ調整を簡易化することができる。
これらの機能ブロックを実現するために、モータ制御装置100は、CPU(Central Processing Unit)等の演算処理装置を備える。また、モータ制御装置100は、アプリケーションソフトウェアやOS(Operating System)等の各種の制御用プログラムを格納したHDD(Hard Disk Drive)等の補助記憶装置や、演算処理装置がプログラムを実行する上で一時的に必要とされるデータを格納するためのRAM(Random Access Memory)といった主記憶装置も備える。
なお、ステップS18はオンライン更新を例示しているが、オンライン更新に替えてバッチ更新又はミニバッチ更新に置き換えてもよい。
次に、図10のフローチャートを参照して、最適化行動情報出力部145による最適化行動情報の生成時の動作について説明をする。
まず、ステップS21において、最適化行動情報出力部145は、価値関数記憶部144に記憶している価値関数Qを取得する。価値関数Qは、上述したように価値関数更新部1422がQ学習を行うことにより更新したものである。
また、位置フィードフォワード部130の伝達関数の各係数ai、bjを合わせて学習してもよい。
<機械学習装置がモータ制御装置の外部に設けられた変形例>
図13は制御システムの他の構成例を示すブロック図である。図13に示す制御システム10Aが、図1に示した制御システム10と異なる点は、n(nは2以上の自然数)個のモータ制御装置100A−1〜100A−nと、それぞれ加速度センサ300−1〜300−nが取り付けられたn個の工作機械200−1〜200−nとがネットワーク400を介して機械学習装置140A−1〜140A−nが接続されていることである。モータ制御装置100A−1〜100A−nの各々は機械学習部を備えていない点を除き、図1のモータ制御装置100と同じ構成を有している。機械学習装置140A−1〜140A−nは図7に示した機械学習部140と同じ構成を有している。
上述した実施形態では、モータ制御装置100A−1〜100A−n及び加速度センサ300−1〜300−nと、機械学習装置140A−1〜140A−nとはそれぞれ1対1の組とされて通信可能に接続されているが、例えば1台の機械学習装置が複数のモータ制御装置及び複数の加速度センサとネットワーク400を介して通信可能に接続され、各モータ制御装置と各工作機械の機械学習を実施するようにしてもよい。
その際、1台の機械学習装置の各機能を、適宜複数のサーバに分散する、分散処理システムとしてもよい。また、クラウド上で仮想サーバ機能等を利用して、1台の機械学習装置の各機能を実現してもよい。
(1)本開示の一態様は、モータを制御するモータ制御装置に設けられたフィルタの第1の係数及び該モータ制御装置に設けられたサーボ制御部の速度フィードフォワード部の第2の係数を、前記モータ制御装置の外に設けられた外部測定器による、加減速後の測定情報と、前記モータ制御装置に入力される位置指令と、該位置指令と前記サーボ制御部の検出器からの位置フィードバック情報との差である位置偏差との関数となる評価関数に基づいて前記第1の係数及び前記第2の係数を最適化する機械学習を行う機械学習装置である。
この機械学習装置によれば、フィルタの特性を決定する第1の係数と速度フィードフォワード部の第2の係数とを機械学習することで、機械端の振動低減と移動軌跡の誤差の低減を両立することが可能となる。また外部測定器は、モータ制御装置の外に配置されるため、機械学習後に外部測定器を取り外すことが可能となり、コストを低減するとともに信頼性を向上させることができる。
この機械学習装置によれば、サーボ制御部の制御ループ(位置フィードバックループ又は速度フィードバックループ)の外の振動を抑えことができる。
この機械学習装置によれば、外部測定器は取り外し可能となる。その結果、工作機械等のコストを低減でき、信頼性も向上する。
この機械学習装置によれば、外部測定器はフィルタの調整後に取り外し可能となり、その結果、工作機械等のコストを低減でき、信頼性も向上する。
この機械学習装置によれば、FIRフィルタよりタップ数を小さくすることができるため、より高速なフィルタとすることができる。
前記状態情報に含まれる前記第1及び第2の係数の調整情報を含む行動情報を前記フィルタ及び前記速度フィードフォワード部に出力する行動情報出力部と、
前記測定情報と前記位置指令と前記位置偏差との関数となる評価関数を用いた、強化学習における報酬の値を出力する報酬出力部と、
前記報酬出力部により出力される報酬の値と、前記状態情報と、前記行動情報とに基づいて行動価値関数を更新する価値関数更新部と、
を備えた上記(1)から(6)のいずれかに記載の機械学習装置。
前記モータ制御装置の外に設けられた外部測定器と、
を備えた制御システム。
この機械学習方法によれば、フィルタの特性を決定する第1の係数と速度フィードフォワード部の第2の係数とを機械学習することで、機械端の振動低減と移動軌跡の誤差の低減を両立することが可能となる。また外部測定器は、モータ制御装置の外に配置されるため、機械学習後に外部測定器を取り外すことが可能となり、コストを低減するとともに信頼性を向上させることができる。
100、100A−1〜100A−n モータ制御装置
110 指令フィルタ
120 サーボ制御部
121 減算器
122 位置制御部
123 加算器
124 減算器
125 速度制御部
126 加算器
127 サーボモータ
128 ロータリーエンコーダ
129 積分器
130 位置フィードフォワード部
131 速度フィードフォワード部
140 機械学習部
140A−1〜140A−n 機械学習装置
141 状態情報取得部
142 学習部
143 行動情報出力部
144 価値関数記憶部
145 最適化行動情報出力部
200、200−1〜200−n 工作機械
300 加速度センサ
400 ネットワーク
Claims (10)
- モータを制御するモータ制御装置に設けられたフィルタの第1の係数及び該モータ制御装置に設けられたサーボ制御部の速度フィードフォワード部の第2の係数を、前記モータ制御装置の外に設けられた外部測定器による、加減速後の測定情報と、前記モータ制御装置に入力される位置指令と、該位置指令と前記サーボ制御部の検出器からの位置フィードバック情報との差である位置偏差との関数となる評価関数に基づいて前記第1の係数及び前記第2の係数を最適化する機械学習を行う機械学習装置。
- 前記外部測定器の測定情報は、位置、速度、加速度のうち少なくとも1つを含む請求項1に記載の機械学習装置。
- 前記サーボ制御部は、位置フィードバックループ及び速度フィードバックループの少なくとも一つを有し、前記フィルタは前記位置フィードバックループ又は前記速度フィードバックループの外にある請求項1又は2に記載の機械学習装置。
- 前記サーボ制御部は、フィードバックループを有し、前記外部測定器の測定情報は前記フィードバックループのフィードバック制御に使わない請求項1又は2に記載の機械学習装置。
- 前記外部測定器は機械学習による前記フィルタの調整後に取り外される請求項1から4のいずれか1項に記載の機械学習装置。
- 前記フィルタは、2次以上のIIRフィルタである請求項1から5のいずれか1項に記載の機械学習装置。
- 前記測定情報と、前記位置指令と、前記位置偏差と、前記フィルタの前記第1の係数及び前記速度フィードフォワード部の前記第2の係数と、を含む状態情報を取得する状態情報取得部と、
前記状態情報に含まれる前記第1及び第2の係数の調整情報を含む行動情報を前記フィルタ及び前記速度フィードフォワード部に出力する行動情報出力部と、
前記測定情報と前記位置指令と前記位置偏差との関数となる評価関数を用いた、強化学習における報酬の値を出力する報酬出力部と、
前記報酬出力部により出力される報酬の値と、前記状態情報と、前記行動情報とに基づいて行動価値関数を更新する価値関数更新部と、
を備えた請求項1から6のいずれか1項に記載の機械学習装置。 - 前記価値関数更新部により更新された価値関数に基づいて、前記第1及び第2の係数の調整情報を出力する最適化行動情報出力部を備えた請求項7に記載の機械学習装置。
- 請求項1から請求項8のいずれか1項に記載の機械学習装置、モータ、速度フィードフォワード部を有するサーボ制御部及びフィルタを含み、前記モータを制御するモータ制御装置と、
前記モータ制御装置の外に設けられた外部測定器と、
を備えた制御システム。 - モータを制御するモータ制御装置に設けられたフィルタの第1の係数及び該モータ制御装置に設けられたサーボ制御部の速度フィードフォワード部の第2の係数と、前記モータ制御装置の外に設けられた外部測定器による、加減速後の測定情報と、前記モータ制御装置に入力される位置指令と、該位置指令と位置フィードバック情報との差である位置偏差とを取得し、前記測定情報と前記位置指令と前記位置偏差との関数となる評価関数に基づいて前記第1の係数及び前記第2の係数を最適化する機械学習を行う機械学習装置の機械学習方法。
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019054837A JP7000371B2 (ja) | 2019-03-22 | 2019-03-22 | 機械学習装置、制御システム及び機械学習方法 |
US16/807,804 US11243501B2 (en) | 2019-03-22 | 2020-03-03 | Machine learning device, control system, and machine learning |
DE102020203377.3A DE102020203377A1 (de) | 2019-03-22 | 2020-03-17 | Maschinenlernvorrichtung, steuersystem und maschinenlernverfahren |
CN202010196171.1A CN111722530B (zh) | 2019-03-22 | 2020-03-19 | 机器学习装置、控制***以及机器学习方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019054837A JP7000371B2 (ja) | 2019-03-22 | 2019-03-22 | 機械学習装置、制御システム及び機械学習方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020154989A true JP2020154989A (ja) | 2020-09-24 |
JP7000371B2 JP7000371B2 (ja) | 2022-01-19 |
Family
ID=72513626
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019054837A Active JP7000371B2 (ja) | 2019-03-22 | 2019-03-22 | 機械学習装置、制御システム及び機械学習方法 |
Country Status (4)
Country | Link |
---|---|
US (1) | US11243501B2 (ja) |
JP (1) | JP7000371B2 (ja) |
CN (1) | CN111722530B (ja) |
DE (1) | DE102020203377A1 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023074163A1 (ja) * | 2021-10-29 | 2023-05-04 | パナソニックIpマネジメント株式会社 | 制御パラメータの生成方法、プログラム、記録媒体、および、制御パラメータの生成装置 |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20210116888A1 (en) * | 2019-10-21 | 2021-04-22 | Semiconductor Components Industries, Llc | Systems and methods for system optimization and/or failure detection |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009110492A (ja) * | 2007-10-09 | 2009-05-21 | Okuma Corp | 位置制御装置 |
WO2015111298A1 (ja) * | 2014-01-23 | 2015-07-30 | 三菱電機株式会社 | モータ制御装置 |
WO2018151215A1 (ja) * | 2017-02-20 | 2018-08-23 | 株式会社安川電機 | 制御装置及び制御方法 |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0285902A (ja) | 1988-09-22 | 1990-03-27 | Mitsubishi Electric Corp | フィードフォワード制御装置 |
JP2923000B2 (ja) | 1990-07-27 | 1999-07-26 | 株式会社日立製作所 | サーボ制御装置 |
JPH0519858A (ja) | 1991-07-15 | 1993-01-29 | Yokogawa Electric Corp | サ―ボアクチユエ―タ |
JP2009104439A (ja) | 2007-10-24 | 2009-05-14 | Yokogawa Electric Corp | サーボアクチュエータ |
US8886359B2 (en) * | 2011-05-17 | 2014-11-11 | Fanuc Corporation | Robot and spot welding robot with learning control function |
JP2018126798A (ja) * | 2017-02-06 | 2018-08-16 | セイコーエプソン株式会社 | 制御装置、ロボットおよびロボットシステム |
JP2018126796A (ja) * | 2017-02-06 | 2018-08-16 | セイコーエプソン株式会社 | 制御装置、ロボットおよびロボットシステム |
JP6484265B2 (ja) * | 2017-02-15 | 2019-03-13 | ファナック株式会社 | 学習制御機能を備えたロボットシステム及び学習制御方法 |
JP6490127B2 (ja) * | 2017-03-15 | 2019-03-27 | ファナック株式会社 | 機械学習装置、サーボ制御装置、サーボ制御システム、及び機械学習方法 |
JP6538766B2 (ja) * | 2017-07-18 | 2019-07-03 | ファナック株式会社 | 機械学習装置、サーボモータ制御装置、サーボモータ制御システム、及び機械学習方法 |
JP6697491B2 (ja) * | 2018-01-25 | 2020-05-20 | ファナック株式会社 | 機械学習装置、サーボモータ制御装置、サーボモータ制御システム、及び機械学習方法 |
-
2019
- 2019-03-22 JP JP2019054837A patent/JP7000371B2/ja active Active
-
2020
- 2020-03-03 US US16/807,804 patent/US11243501B2/en active Active
- 2020-03-17 DE DE102020203377.3A patent/DE102020203377A1/de active Pending
- 2020-03-19 CN CN202010196171.1A patent/CN111722530B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009110492A (ja) * | 2007-10-09 | 2009-05-21 | Okuma Corp | 位置制御装置 |
WO2015111298A1 (ja) * | 2014-01-23 | 2015-07-30 | 三菱電機株式会社 | モータ制御装置 |
WO2018151215A1 (ja) * | 2017-02-20 | 2018-08-23 | 株式会社安川電機 | 制御装置及び制御方法 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023074163A1 (ja) * | 2021-10-29 | 2023-05-04 | パナソニックIpマネジメント株式会社 | 制御パラメータの生成方法、プログラム、記録媒体、および、制御パラメータの生成装置 |
Also Published As
Publication number | Publication date |
---|---|
JP7000371B2 (ja) | 2022-01-19 |
CN111722530A (zh) | 2020-09-29 |
CN111722530B (zh) | 2023-12-15 |
DE102020203377A1 (de) | 2020-11-19 |
US11243501B2 (en) | 2022-02-08 |
US20200301376A1 (en) | 2020-09-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6490127B2 (ja) | 機械学習装置、サーボ制御装置、サーボ制御システム、及び機械学習方法 | |
JP6697491B2 (ja) | 機械学習装置、サーボモータ制御装置、サーボモータ制御システム、及び機械学習方法 | |
JP6841801B2 (ja) | 機械学習装置、制御システム及び機械学習方法 | |
CN109116811B (zh) | 机器学习装置和方法、伺服控制装置、伺服控制*** | |
JP7000373B2 (ja) | 機械学習装置、制御装置及び機械学習方法 | |
JP6860540B2 (ja) | 出力装置、制御装置、及び学習パラメータの出力方法 | |
JP6748135B2 (ja) | 機械学習装置、サーボ制御装置、サーボ制御システム、及び機械学習方法 | |
JP6784722B2 (ja) | 出力装置、制御装置、及び評価関数値の出力方法 | |
JP7405537B2 (ja) | 機械学習装置、サーボ制御装置、サーボ制御システム及び機械学習方法 | |
CN111552237B (zh) | 机器学习装置、控制装置、以及机器学习的搜索范围的设定方法 | |
JP6956122B2 (ja) | フィルタの係数を最適化する機械学習システム、制御装置及び機械学習方法 | |
JP7000371B2 (ja) | 機械学習装置、制御システム及び機械学習方法 | |
JP6806746B2 (ja) | モータ制御装置 | |
WO2022030346A1 (ja) | 制御支援装置、制御システム及び制御支援方法 | |
CN110727242B (zh) | 机器学习装置、控制装置、以及机器学习方法 | |
JP7509866B2 (ja) | 機械学習装置、制御装置及び機械学習方法 | |
WO2022065190A1 (ja) | 制御支援装置、制御システム及びフィルタ調整方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200601 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200819 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20210409 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210420 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210615 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20211130 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20211223 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7000371 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |