JP6849643B2 - 出力装置、制御装置、及び評価関数と機械学習結果の出力方法 - Google Patents
出力装置、制御装置、及び評価関数と機械学習結果の出力方法 Download PDFInfo
- Publication number
- JP6849643B2 JP6849643B2 JP2018211397A JP2018211397A JP6849643B2 JP 6849643 B2 JP6849643 B2 JP 6849643B2 JP 2018211397 A JP2018211397 A JP 2018211397A JP 2018211397 A JP2018211397 A JP 2018211397A JP 6849643 B2 JP6849643 B2 JP 6849643B2
- Authority
- JP
- Japan
- Prior art keywords
- machine learning
- evaluation function
- control device
- output
- servo control
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B13/00—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
- G05B13/02—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
- G05B13/04—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators
- G05B13/042—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators in which a parameter or coefficient is automatically adjusted to optimise the performance
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B13/00—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
- G05B13/02—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
- G05B13/0265—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric the criterion being a learning criterion
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Software Systems (AREA)
- Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- General Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Medical Informatics (AREA)
- Automation & Control Theory (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Biomedical Technology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Feedback Control In General (AREA)
- Testing And Monitoring For Control Systems (AREA)
- Control Of Electric Motors In General (AREA)
Description
また、工作機械、ロボット又は産業機械の軸を駆動するサーボモータを制御するサーボ制御装置の構成要素のパラメータを機械学習装置によって機械学習する場合に、通常、機械学習装置で用いられる評価関数は表示されないため、操作者は、どのような評価関数が用いられることでどのような学習効果が得られるのを知ることはできない。
前記機械学習結果を前記サーボ制御装置と前記機械学習装置の少なくとも一方から取得する情報取得部(例えば、後述の学習情報取得部201、サーボ情報取得部207)と、
を備えた出力装置(例えば、後述の出力装置200、200A)である。
(8) 上記(1)から(7)のいずれかの出力装置において、前記複数の評価関数は、前記サーボ制御装置は、位置偏差を変数とする関数と、位置偏差の微分値を変数とする関数と、トルクの微分値を変数とする関数とをそれぞれ重み付けした和からなる評価関数を含んでもよい。
(9) 上記(3)から(7)のいずれかの出力装置において、サーボ制御装置の構成要素のパラメータは、数式モデル又はフィルタのパラメータを含んでもよい。
(10) 上記(9)の出力装置において、前記数式モデル又は前記フィルタは速度フィードフォワード処理部又は位置フィード処理部に含まれ、前記パラメータはフィルタの伝達関数の係数を含んでもよい。
(11) 本発明に係る制御装置は、上記(1)から(10)のいずれかの出力装置と、
工作機械、ロボット又は産業機械の軸を駆動するサーボモータを制御するサーボ制御装置と、
サーボ制御装置に対して機械学習を行う機械学習装置と、
を備えた制御装置である。
前記機械学習結果を前記機械学習装置と前記サーボ制御装置の少なくとも1つから取得する、
出力装置の評価関数と機械学習結果の出力方法である。
(第1実施形態)
制御装置10が、以上説明した動作を繰り返すことで、機械学習装置100は、速度フィードフォワード処理部の伝達関数の係数の最適値を求める。
出力装置200から出力される、位置偏差の時間応答又は周波数応答等の学習結果から、ユーザが意図する学習結果が得られない場合には、ユーザの操作に基づいて、出力装置200は、複数の評価関数の一部又は全部の評価関数を変更する。評価関数の変更は、例えば、評価関数の重み付け係数を別な値に変更、又は評価関数の種類を変更することである。
出力装置200は、機械学習装置100で用いられる、評価関数の重み付け係数又は評価関数の種類を設定又は変更するために、機械学習装置100に対して評価関数指示情報を出力する。
こうして、ユーザは、ユーザの意図する学習結果が得られるように、評価関数を設定又は変更することができる。
伝達関数から周波数応答を解析できるソフトウェアは公知であって、例えば、
https://jp.mathworks.com/help/signal/ug/frequency~renponse.html
https://jp.mathworks.com/help/signal/ref/freqz.html
https://docs.scipy.org/doc/scipy-0.19.1/reference/generated/scipy.signal.freqz.html
https://wiki.octave.org/Control_package
等を用いることができる。周波数応答から、減衰中心周波数fc、帯域幅fw、減衰係数Rを求めることができる。
機械学習結果は、位置偏差の時間応答又は周波数応答はグラフで示しても、表で示してもよい。機械学習結果が位置偏差の時間応答又は周波数応答である場合は、出力装置200は、位置偏差を機械学習装置100又はサーボ制御装置300から取得できる。機械学習結果が速度フィードフォワード処理部の伝達関数から求められる周波数応答である場合は、出力装置200は、当該伝達関数をサーボ制御装置300から取得できる。
出力装置200は、複数の評価関数と、各評価関数に対応する、位置偏差の時間応答等の学習結果とを出力する出力機能を備えている。
また、出力装置200は、機械学習装置100の動作の制御(例えば、機械学習装置に対する評価関数の変更指示、及び機械学習装置に対するプログラム起動指示等)を行う調整機能を備えている。
さらに、出力装置200は、サーボ制御装置300から機械学習装置100への情報(例えば、位置指令、速度指令、トルク指令等の制御指令、位置偏差、及び速度フィードフォワード処理部の係数)、機械学習装置100からサーボ制御装置310への情報(例えば、速度フィードフォワード処理部の修正された係数ai、bj)の中継を行う中継機能も備えている。
動作の制御及び情報の中継は後述する学習情報取得部201,サーボ情報取得部207及び学習情報出力部202,サーボ情報出力部208を介して行われる。
学習情報出力部202は位置指令、速度指令、トルク指令等の制御指令、及び位置偏差、速度偏差、電流偏差等のフィードバックを含むサーボ状態を示すサーボ情報、及びパラメータ(例えば、速度フィードフォワード処理部308の修正された係数ai、bj)を機械学習装置100へ出力する。
作図部203は、記憶部206に記憶された位置偏差の集合を読み出して表示部209に表示する時間応答特性図又は周波数応答特性図の画像情報を作成する。
操作部204は、マウス、キーボード等であって、制御部205に指示及びデータを入力する。
サーボ情報取得部207は、サーボ制御装置300から、位置指令、速度指令、トルク指令等の制御指令、及び位置偏差、速度偏差、電流偏差等のフィードバックを含むサーボ状態を示すサーボ情報、及びパラメータ(例えば、速度フィードフォワード処理部308の修正された係数ai、bj)を取得する。
サーボ情報出力部208は、機械学習装置100から出力された修正パラメータをサーボ制御装置300の速度フィードフォワード処理部308へ出力する。
表示部209は液晶表示装置、プリンター等であって、評価関数、及び位置偏差の時間応答特性図を含む情報を出力する。
制御部205及び表示部209は、評価関数と、この評価関数で学習されたパラメータ(例えば、速度フィードフォワード処理部の係数ai、bj)に基づいてサーボ制御装置300を駆動することで取得される位置偏差の時間応答を示す図とを出力する出力部となる。出力は記憶部206に記憶することも含まれ、その場合、出力部は制御部205及び記憶部206となる。
出力装置200の表示部209に表示可能で、機械学習装置100が用いることができる評価関数の例は以下の通りである。
評価関数fは、例えば、位置偏差をe、トルクをTmで示したときに、
また、その他、以下の評価関数を適用してもよい。
位置偏差の絶対値の積算値を算出する関数
∫|e|dt
位置偏差の絶対値に時間の重み付けをして積算値を算出する関数
∫t|e|dt
位置偏差の絶対値の2n(nは自然数)乗の積算値を算出する関数
∫e2ndt(nは自然数)
位置偏差の絶対値の最大値を算出する関数
Max{|e|}
なお、上記数式2の評価関数は、位置偏差を変数とする関数と、位置偏差の微分値を変数とする関数と、トルクの微分値を変数とする関数とをそれぞれ重み付けした和からなる評価関数である。
制御部205は、上述した評価関数の一部又は全部と、各評価関数に対応する、位置偏差の時間応答等の学習結果とを表示部209に出力する。制御部205は、ユーザからの指示により機械学習装置100で用いる評価関数の重み付け係数又は評価関数の種類を設定又は変更するための評価関数指示情報を機械学習装置100に出力する。
(具体例1:複数の重み付け係数の値が異なる複数の評価関数の例)
図3は、重み付け係数により設定される複数の評価関数と、これらの評価関数でそれぞれ学習されたパラメータに基づく位置偏差の時間応答を重ね合わせたグラフと、を表示する表示画面の一例を示す図である。
本具体例では、出力装置200が、数式2の評価関数における重み付け係数α、β、及びγに重みの値W1〜W3を設定した評価関数(以下「重みW1〜W3の評価関数」という)と、これらの重みW1〜W3の評価関数でそれぞれ学習されたパラメータに基づいてサーボ制御装置300を駆動することで取得される3つの位置偏差の時間応答を重ね合わせたグラフとを出力する際の動作について説明する。なお、評価関数の数は特に3つに限定されず、2つでも4以上であってもよい。
欄P1には、例えば、軸選択、パラメータ確認、プログラム確認・編集、プログラム起動、機械学習中、終了判定の選択項目が表示される。
欄P2には、例えば、速度フィードフォワード等の調整対象、データ採取中等のステータス(状態)、予め設定された当該機械学習終了までの試行回数(以下「最大試行回数」ともいう)に対する現在までの試行回数の累計を示す試行回数、及び学習の中断を選択するボタンが表示される。
欄P3には、例えば、数式2に示す評価関数と、この評価関数の重み付け係数α、β、及びγの3つの設定例(重みW1〜W3)を示す表と、この評価関数で学習されたパラメータに基づいて取得された位置偏差の重みW1〜W3毎の時間応答を重ね合わせたグラフとが表示される。なお、学習前には位置偏差の時間応答を示すグラフは表示されていない。
制御部205は、学習情報出力部202を介して機械学習装置100に対して、数式2の評価関数の識別情報、及び重みW1の重み付け係数(α=1、β=0、γ=0)を含む評価関数指示情報を送る。
出力装置200(サーボ情報出力部208)は、機械学習装置100から受信した修正パラメータをサーボ制御装置300に出力する。
当該試行終了後、出力装置200(サーボ情報取得部207)は、サーボ制御装置300から、当該試行時における位置指令、速度指令、トルク指令等の制御指令、及び修正パラメータに基づく位置偏差、速度偏差、電流偏差等を含むサーボ情報を取得して、位置偏差、速度偏差等を記憶部206に記憶する。また、出力装置200(学習情報出力部202)は、取得したサーボ情報を機械学習装置100に出力する。
なお、機械学習装置100は、当該学習(試行)毎に、伝達関数の係数(パラメータ)と、このパラメータを用いてサーボ制御装置300を動作させることで得られたサーボ情報及び学習結果(位置偏差の時間応答又は周波数応答等)とを記憶部(図示せず)に保存する。そうすることで、以下に説明するように、評価関数指示情報(変更指示)に基づいて評価関数を変更して再度、伝達関数の係数(パラメータ)を機械学習する場合に、当該機械学習(試行)時に、記憶部に既に保存されたパラメータと同じパラメータが選ばれたときに、サーボモータ400を駆動せずに、保存されたサーボ状態及び学習結果を用いて、変更された評価関数により評価関数値を求めることができる。それにより、同じパラメータでサーボ制御装置300を動作させてサーボ状態及び学習結果を得る動作を省くことができ、機械学習の効率化を図ることができる。
試行回数が所定の試行回数に達していないときは、制御部205は、前述した動作を続ける。
制御部205は、位置偏差の時間応答特性図を図3に示すように表示画面Pの欄P3に表示する。
評価関数指示情報を受けた後の機械学習装置100と、評価関数指示情報を送った後の出力装置200との動作は、機械学習装置100が、重み付け係数(α=1、β=1、γ=1)の数式2で示される評価関数で所定の試行回数の学習を行うこと、所定の試行回数の機械学習終了後に、作図部203が、重みW1の時間応答曲線を有する特性図に、重みW2の時間応答曲線を重ねて新たな特性図の画像情報を作成すること、制御部205が重みW1の時間応答曲線と重みW2の時間応答曲線とを有する特性図を、表示画面Pの欄P3に表示することを除いて、上述した重みW1の時間応答曲線を有する特性図を得るための動作と同様である。
ユーザによって、例えば、α=1、β=0.3、γ=0.5が入力され、表示画面Pの欄P3の「選択」が選択されると、制御部205は、学習情報出力部202を介して機械学習装置100に対して、数式2の評価関数の識別情報、及びこの評価関数の重みW3の重み付け係数(α=1、β=0.3、γ=0.5)を含む評価関数指示情報を送る。
評価関数指示情報を受けた後の機械学習装置100と、評価関数指示情報を送った後の出力装置200との動作は、機械学習装置100が、重み付け係数(α=1、β=0.3、γ=0.5)の数式2で示される評価関数で所定の試行回数の学習を行うこと、所定の試行回数の機械学習終了後に、作図部203が、重みW1及びW2の時間応答曲線を有する特性図に、重みW3の時間応答曲線を重ねて新たな特性図の画像情報を作成すること、制御部205が重みW1、W2及びW3の時間応答曲線を有する特性図を、表示画面Pの欄P3に表示することを除いて、上述した重みW1の時間応答曲線を有する特性図を得るための動作と同様である。
図3を参照すると、重みW1に関する位置偏差の時間応答曲線は、重みW2及びW3に関する位置偏差の時間応答曲線に比べて、低周波の位置偏差が抑制され、特性図の位置偏差面積が重みW1〜W3に関する位置偏差の時間応答曲線のうちで最も小さくなることが分かる。その反面、位置偏差の高周波振動が残ることが分かる。
また、重みW2に関する位置偏差の時間応答曲線は、重みW1及びW3に関する位置偏差の時間応答曲線に比べて、高周波の位置偏差が抑制され、特性図の位置偏差面積が重みW1〜W3に関する位置偏差の時間応答曲線のうちで最も大きくなることが分かる。その反面、曲線が滑らかとなってショックが最も抑制されることが分かる。
また、重みW3に関する位置偏差の時間応答曲線は、重みW1及びW2に関する位置偏差の時間応答曲線に比べて、中周波の位置偏差が抑制され、重みW1に関する位置偏差の時間応答曲線よりも、曲線が滑らかとなってショックが低減することが分かる。その反面、位置偏差面積は多少増えることが分かる。
ユーザによって、重みW1〜W3のいずれかが選択される動作は、表示画面Pの欄P3の「決定」が選択される以外は、特性図を表示するために、重みW1〜W3のいずれかが選択される動作と同様である。
すなわち、例えば重みW1を選択する場合は、ユーザによって、表示画面Pの欄P3の表の重みW1の列が選択されると、制御部205は重みW1の列を太字の四角で示す。ユーザによって表示画面Pの欄P3の「決定」が選択されると、制御部205は重み係数α=1、β=0、γ=0の重みW1の数式2の評価関数で機械学習することで得られた速度フィードフォワード処理部のパラメータをサーボ制御装置300へ送る。そうすることで、以降、サーボ制御装置300が当該パラメータにより速度フィードフォワード処理部でサーボ制御を行うことで、ユーザが意図するサーボ特性(位置偏差の時間応答等)を得ることができる。
また、制御部205は、重みW1の評価関数の識別情報を機械学習装置100へ送る。機械学習装置100が、評価関数を重みW1の評価関数に設定することで、例えば機械学習装置100が再学習を実行する場合に、重みW1の評価関数を用いることができる。
ユーザが図3で示す表示画面Pの欄P3に表示された3つの異なる重み値以外の重み値に変更して再学習する場合の処理について説明する。
ユーザによって表示画面Pの欄P3の表の重みW1の列が選択されると、制御部205は、重みW1の列を太字の四角で示し、その列の重み付け係数α、β、及びγを編集可能な状態とする。ユーザによって、例えばα=1、β=0.1、γ=0.2が入力され、表示画面Pの欄P3の「選択」が選択されると、制御部205は、学習情報出力部202を介して機械学習装置100に対して、数式2の評価関数の識別情報、及びこの評価関数の重みW1の重み付け係数(α=1、β=0.1、γ=0.2)を含む評価関数指示情報(変更指示となる)を送る。
機械学習装置100は評価関数指示情報に基づいて評価関数を重み付け係数(α=1、β=0.1、γ=0.2)の数式2の評価関数に変更し、この評価関数に基づいて機械学習を開始する。以降の処理は、上述した重みW1の時間応答曲線を有する特性図を得るための動作と同様であり、説明を省略する。
こうして、機械学習装置100の再学習が行われる。
具体例1では、複数の重み付け係数により設定される複数の評価関数から評価関数を選択又は重み付け係数を修正する例について説明した。具体例2は、重み付けと種類の異なる2つの評価関数から評価関数を選択する例について説明する。
具体例2では、出力装置200が、数式2の評価関数、及びこの評価関数で学習されたパラメータに基づいて取得される位置偏差の時間応答を示す図を示す画面と、数式3の評価関数と、この評価関数で学習されたパラメータに基づいて取得される位置偏差の時間応答を示す図とを示す画面とを並べて表示する際の動作について図4を用いて説明する。
本実施形態では、機械学習装置100がテーブルをY軸方向に駆動するためのサーボ制御装置の速度フォードフォワード処理部の係数を機械学習し、出力装置200が図4に示すように、機械学習に用いる2つの評価関数と、各評価関数で学習されたパラメータに基づいて取得される位置偏差の時間応答を示す図とを表示するものとする。
図5において、直線部L1では、Y軸方向に駆動するサーボモータは等速度で回転され、点P1で速度が減速され、直線部L2で一定に減速された速度で回転する。
図4は数式2の評価関数、及びこの評価関数で学習されたパラメータに基づいて取得される位置偏差の時間応答を示す図を示す画面と、数式3の評価関数、及びこの評価関数で学習されたパラメータに基づいて取得される位置偏差の時間応答を示す図を示す画面とを並べて表示する場合の表示画面の一例を示す図である。
表示画面Pの欄P4に示す数式3の評価関数の重み係数はα=100、γ=0であるため、位置偏差に強い重みが与えられ、図5の点P1で生じた大きな位置偏差は図6Aに示すように直線部L2で迅速に減衰する。しかし、図6Bに示すように、トルクを直線部L2で急に増減させる場合があるため、位置偏差に高周波振動が残る。
一方、表示画面Pの欄P5に示す数式2の評価関数の重み係数はα=100、β=10、γ=40であるため、トルク微分値に重みが与えられ、図7Bに示すように直線部L2でトルクが滑らかになり、図7Aに示すように直線部L2で位置偏差の高周波信号は減るが、位置偏差の時間収束は緩やかになる。
ユーザによって、評価関数の種類及び重みを図4に示す評価関数のいずれかが選択される動作は、具体例1に示した選択動作と同様である。
すなわち、ユーザによって、例えば数式3の評価関数が選択される場合は、ユーザにより、操作部204を用いて表示画面Pの欄P4の枠が選択されると、制御部205は欄P4の枠を太字の四角で示す。ユーザにより、表示画面Pの欄P4の「決定」が選択されると、数式3の評価関数が選択される。ユーザによって重み係数α=100、γ=0が変更される場合には、重み係数の変更後に、ユーザにより、表示画面Pの欄P4の「決定」が選択される。
[再学習]
ユーザが表示画面Pの欄P4及び欄P5の重み付け係数の評価関数に対応する位置偏差の時間応答を見て、評価関数の重みを変更して再学習したい場合がある。
ユーザが、例えば表示画面Pの欄P4の重み付け係数の評価関数に対応する位置偏差の時間応答を評価関数の重みを変更して再学習する場合は、ユーザによって表示画面Pの欄P4の表の枠が選択されると、制御部205は枠を太字の四角で示し、枠内の重み付け係数α及びγを編集可能とする。ユーザによって、例えば、α=100、γ=20が入力され、表示画面Pの欄P4の「選択」が選択されると、制御部205は、学習情報出力部202を介して機械学習装置100に対して、数式3の評価関数の識別情報、及びこの評価関数の重み付け係数(α=100、γ=20)を含む評価関数指示情報(変更指示となる)を送る。
機械学習装置100は評価関数指示情報に基づいて評価関数を重み付け係数(α=100、γ=20)の数式3の評価関数に変更し、この評価関数に基づいて機械学習することで速度フィードフォワード処理部の伝達関数の係数(パラメータ)が最適値に近づくように、速度フィードフォワード処理部の伝達関数の係数を微調整した修正パラメータ、試行回数を出力装置200に送る。制御部205は、修正パラメータをサーボ制御装置300に出力する。こうして、機械学習装置100の再学習が行われる。
具体例2では重み付けと、評価関数の種類とが異なる2つの評価関数のいずれかを選択する例について説明した。
具体例3は数式5の評価関数と数式6の評価関数を用い、位置偏差の絶対値の2乗の最小化を図る数式5の評価関数か、位置偏差の最大値を最小化する数式6の評価関数かのいずれかを選択するものである。
図8は数式5の評価関数(Type 1)と数式6の評価関数(Type 2)、及び各評価関数で学習されたパラメータに基づいて取得される位置偏差の時間応答曲線を重ねた図を表示する場合の表示画面の一例を示す図である。
評価関数の選択は、図8に示す四角に、ユーザにより操作部204を用いてチェックが入ったときに、制御部205はチェックが入った方の評価関数が選択されたものと判断する。機械学習装置100、出力装置200、及びサーボ制御装置300の動作は、具体例1と同様なので、ここでは説明を省略する。
具体例2では、評価関数の種類と重み付けとが異なる2つの評価関数のいずれかを選択する例について説明した。
具体例3は数式4の評価関数を用い、位置偏差の絶対値の2乗の集合の時間範囲(時刻t0〜t1の範囲)を変えた複数の評価関数から評価関数を選択するものである。
図9は数式4の評価関数、評価関数の時間範囲t0とt1(Case 1及びCase 2)を示す表、及び各評価関数で学習されたパラメータに基づいて取得される位置偏差の時間応答曲線を重ねた図を表示する場合の表示画面の一例を示す図である。
機械学習装置100、出力装置200、及びサーボ制御装置300の動作は、具体例1と同様なので、ここでは説明を省略する。
具体例1〜具体例4は、表示画面Pに位置偏差の時間応答特性を表示する例について説明したが、位置偏差の時間応答特性の替わりに又は位置偏差の時間応答特性とともに、位置偏差の周波数応答特性を表示してもよい。図10B及び図11Bは、図4の欄P4の特性図に対応する図10Aの時間応答特性図及び欄P5の特性図に対応する図11Aの時間応答特性図に替えて表示する周波数応答特性図を示す。
図10Bは機械学習装置100が数式3の評価関数を用いて学習することで、サーボ制御装置300から取得される位置偏差の周波数特性図、図11Bは機械学習装置100が数式2の評価関数を用いて学習することで、サーボ制御装置300から取得される位置偏差の周波数特性図を示している。図10Bに示す周波数特性図は高周波偏差が大きく、80Hz、140Hz付近にピークを有することを示している。図11Bに示す周波数特性図は低周波偏差が大きく、25Hz、75Hz付近にピークを有することを示している。
また、図10Bに示される周波数特性曲線と図11Bに示される周波数特性曲線とを重ねて表示することも可能である。図12は図10Bに示される周波数特性曲線と図11Bに示される周波数特性曲線とを重ねて表示した図である。
また、上記説明においては、制御部205は、サーボ制御装置300から取得した位置偏差を記憶部206に記憶し、機械学習装置100の試行回数が所定の試行回数に達したときに、評価関数、及び位置偏差の時間応答を示す図等を表示部209に表示するものとしたが、これに限られない。
例えば、試行回数に関係せずに表示を行う構成例としては以下の例がある。
構成例1:操作者(オペレータ)等のユーザが表示指示をしたときに、評価関数、及び位置偏差の時間応答を示す図等を表示する。
構成例2:機械学習の中断時に評価関数、及び位置偏差の時間応答を示す図等を表示する。
図13は、機械学習の開始から機械学習終了までの、出力装置を中心とした制御装置の動作を示すフロー図である。
ステップS31において、出力装置200は、ユーザによって例えば図3に示す、表示部209の表示画面Pの欄P1の「プログラム起動」がマウス、キーボード等の操作部204で選択されると、制御部205は、プログラム起動指示を、学習情報出力部202を介して機械学習装置100に出力する。そして、サーボ制御装置300に対して、学習のためのプログラム起動指示を機械学習装置100に出力したことを通知する学習のためのプログラム起動指示通知を出力する。
ステップS32において、出力装置200は、サーボ制御装置300に学習時の加工プログラムを出力する上位装置に学習時の加工プログラムの起動指示を行う。ステップS32はステップ31の前、ステップ31と同時に行われてもよい。上位装置は学習時の加工プログラムの起動指示を受けると、位置指令を作成してサーボ制御装置300に出力する。
ステップS33において、出力装置200は評価関数の重み付け係数の値、使用すべき評価関数の識別情報等の評価関数指示情報を機械学習装置100に送る。
ステップS21において、機械学習装置100は、プログラム起動指示を受けると、機械学習を開始する。そして、機械学習装置100は、出力装置200から評価関数指示情報を受けると、指示された重み付け係数、種類の評価関数に基づいて機械学習を行う評価関数を設定する。
ステップS11、及びステップS21は所定の試行回数まで繰り返し行われる。
ステップS36において、ユーザにより評価関数が選択されると、出力装置200は、選択された評価関数を用いた機械学習で最適化された、速度フィードフォワード処理部308の伝達関数の係数ai、bjをサーボ制御装置300へ送る。
ステップS12において、サーボ制御装置300は最適化された係数ai、bjを速度フィードフォワード処理部308の伝達関数の係数として設定(パラメータ設定)する。
<サーボ制御装置300>
図14は本発明の第1実施形態の制御装置に含まれるサーボ制御装置の一構成例を示すブロック図である。
図14に示すように、サーボ制御装置300は、構成要素として、減算器301、位置制御部302、加算器303、減算器304、速度制御部305、加算器306、積分器307、速度フィードフォワード処理部308、及び位置フィードフォワード処理部309を備えている。
位置指令は、サーボモータ400を動作させるプログラムに基づいて、上位装置によって作成される。サーボモータ400は、例えば工作機械に含まれる。工作機械において、被加工物(ワーク)を搭載するテーブルがX軸方向及びY軸方向に移動される場合には、X軸方向及びY軸方向に対してそれぞれ図14に示すサーボ制御装置300及びサーボモータ400が設けられる。テーブルを3軸以上の方向に移動させる場合には、それぞれの軸方向に対してサーボ制御装置300及びサーボモータ400が設けられる。
位置指令は、加工プログラムにより指定される加工形状となるように、送り速度が設定される。
位置制御部302は、位置偏差にポジションゲインKpを乗じた値を、速度指令値として加算器303に出力する。
加算器303は、速度指令値と位置フィードフォワード処理部309の出力値(位置フィードフォワード項)とを加算して、フィードフォワード制御された速度指令値として減算器304に出力する。減算器304は加算器303の出力と速度フィードバックされた速度検出値との差を求め、その差を速度偏差として速度制御部305に出力する。
加算器306は、トルク指令値と速度フィードフォワード処理部308の出力値(速度フィードフォワード項)とを加算して、フィードフォワード制御されたトルク指令値として不図示の電流制御部を介してサーボモータ400に出力してサーボモータ400を駆動する。
速度フィードフォワード処理部308がモータの逆特性(伝達関数はJs2)とノッチフィルタとで示される場合は、数式1で示される伝達関数F(s)は数式7の右辺で示す数式モデルとなり、イナーシャJ、中心角周波数ω、比帯域ζ、減衰係数Rを用いて数式7の右辺のように示される。
以上のように、サーボ制御装置300は構成される。
次に機械学習装置100について説明する。
機械学習装置100は、予め設定された加工プログラム(以下、「学習時の加工プログラム」ともいう)を実行することで、速度フィードフォワード処理部308の伝達関数の係数を学習する。
ここで、学習時の加工プログラムにより指定される加工形状は、例えば、八角形、又は八角形の角が一つ置きに円弧に置き換えられた形等である。なお、学習時の加工プログラムにより指定される加工形状はこれらの加工形状に限定されず、他の加工形状であってもよい。
角の位置A2で、テーブルをY軸方向に移動するモータは、回転方向が反転し、テーブルをX軸方向に移動するモータは、位置A1から位置A2及び位置A2から位置A3にかけて、同じ回転方向で、等速度で回転する。
角の位置A3で、テーブルをY軸方向に移動するモータは回転速度が速くなり、テーブルをX軸方向に移動するモータは回転速度が遅くなる。
角の位置A4で、テーブルをX軸方向に移動するモータは、回転方向が反転し、テーブルをY軸方向に移動するモータは、位置A3から位置A4及び位置A4から次の角の位置にかけて、同じ回転方向で、等速度で回転する。
円弧の位置B2で、テーブルをY軸方向に移動するモータは、回転方向が反転し、テーブルをX軸方向に移動するモータは位置B1から位置B3にかけて同じ回転方向で、等速度で回転する。図15に示した加工形状が八角形の場合と異なり、テーブルをY軸方向に移動するモータは位置B2の前後で円弧の加工形状が形成されるように、位置B2に向かって徐々に減速され、位置B2で回転が停止され、位置B2を過ぎると回転方向が徐々に増加していく。
円弧の位置B4で、テーブルをX軸方向に移動するモータは、回転方向が反転し、テーブルはX軸方向に直線反転するように移動する。また、テーブルをY軸方向に移動するモータは位置B3から位置B4、及び位置B4から次の角の位置にかけて同じ回転方向で、等速度で回転する。テーブルをX軸方向に移動するモータは位置B4の前後で円弧の加工形状が形成されるように、位置B4に向かって徐々に減速され、位置B4で回転が停止され、位置B4を過ぎると回転方向が徐々に増加していく。
伝達関数の係数の最適化に係る機械学習は、速度フィードフォワード処理部に特に限定されるものでなく、例えば、位置フィードフォワード処理部、又はサーボ制御装置の電流フィードフォワードを行う場合に設けられる電流フィードフォワード処理部にも適用可能である。その場合、位置フィードフォワード処理部、電流フィードフォワード処理部は、速度フィードフォワード処理部と同様に係数を有する伝達関数、例えば、数式1で示された伝達関数F(s)と同様な伝達関数を有する。
以下の説明では機械学習装置100が強化学習を行う場合について説明するが、機械学習装置100が行う学習は特に強化学習に限定されず、例えば、教師あり学習を行う場合にも本発明は適用可能である。
教師あり学習が、完全な正解を示すのに対して、強化学習における報酬は、環境の一部の変化に基づく断片的な値であることが多い。このため、エージェントは、将来にわたっての報酬の合計を最大にするように行動を選択するように学習する。
Q学習では、或る状態Sのとき、取り得る行動Aのなかから、価値Q(S,A)の最も高い行動Aを最適な行動として選択することを目的とする。
この更新式は、状態Stにおける行動Atの価値Q(St,At)よりも、行動Atによる次の状態St+1における最良の行動の価値maxa Q(St+1,A)の方が大きければ、Q(St,At)を大きくし、逆に小さければ、Q(St,At)を小さくすることを示している。つまり、或る状態における或る行動の価値を、それによる次の状態における最良の行動の価値に近づける。ただし、その差は、割引率γと報酬rt+1のあり方により変わってくるが、基本的には、ある状態における最良の行動の価値が、それに至る一つ前の状態における行動の価値に伝播していく仕組みになっている。
「Human-level control through deep reinforcement learning」、Volodymyr Mnih1著[online]、[平成29年1月17日検索]、インターネット〈URL:http://files.davidqiu.com/research/nature14236.pdf〉
上述した強化学習を行うために、図17に示すように、機械学習装置100は、状態情報取得部101、学習部102、行動情報出力部103、価値関数記憶部104、及び最適化行動情報出力部105を備える。学習部102は報酬出力部1021、価値関数更新部1022、及び行動情報生成部1023を備える。
また、状態情報取得部101は、出力装置200から評価関数の重み付け係数又は評価関数の種類を変更するための指示情報を出力装置200から取得する。
状態情報取得部101は、取得した状態情報S及び指示情報を学習部102に対して出力する。
なお、係数ai、bjは予め操作者が工作機械を調整している場合には、調整済の値を初期値として機械学習してもよい。
最初にQ学習を開始する時点での評価関数は、予めユーザが設定するようにする。例えば、機械学習装置100は複数の評価関数、例えば数式2〜数式6等の複数の評価関数を保存し、ユーザは保存された複数の評価関数から選択することができる。また、ユーザは重み付け係数α、β及びγを設定することができる。重み付け係数α、β及びγは、最初にQ学習を開始する時点において、工作機械メーカ等が標準的な値に設定してもよい。数式2〜数式6等の複数の評価関数に識別情報が付与されている場合には、ユーザは識別情報を選択する。
なお、具体例1〜具体例5で説明したように、出力装置200は位置偏差の時間応答を得るため、ユーザによって選択された評価関数に設定するため、及び位置偏差の時間応答を再学習したい場合に、機械学習装置100に対して評価関数指示情報を出力する。評価関数指示情報は、評価関数の識別情報又は評価関数の識別情報と重み付け係数を含んでいる。評価関数指示情報は、例えば状態情報取得部101によって取得され、状態情報取得部101は評価関数指示情報を報酬出力部1021に出力する。
報酬出力部1021は、評価関数指示情報に基づいて、評価関数の重み付け係数又は評価関数の種類を設定又は変更する。例えば、報酬出力部1021は、数3に示す評価関数fの重み付け係数α、β、γを変更する指示情報を受けた場合には、指示された値に重み付け係数α、β、γを変更する。
また、位置偏差の評価関数値f(PD(S´))が、位置偏差の評価関数値f(PD(S))と等しい場合は、報酬出力部1021は、報酬の値をゼロとする。
価値関数Qの更新は、オンライン学習で行ってもよく、バッチ学習で行ってもよく、ミニバッチ学習で行ってもよい。
オンライン学習は、或る行動Aを現在の状態Sに適用することにより、状態Sが新たな状態S´に遷移する都度、即座に価値関数Qの更新を行う学習方法である。また、バッチ学習は、或る行動Aを現在の状態Sに適用することにより、状態Sが新たな状態S´に遷移することを繰り返すことにより、学習用のデータを収集し、収集した全ての学習用データを用いて、価値関数Qの更新を行う学習方法である。更に、ミニバッチ学習は、オンライン学習と、バッチ学習の中間的な、ある程度学習用データが溜まるたびに価値関数Qの更新を行う学習方法である。
より具体的には、最適化行動情報出力部105は、価値関数記憶部104が記憶している価値関数Qを取得する。この価値関数Qは、上述したように価値関数更新部1022がQ学習を行うことにより更新したものである。そして、最適化行動情報出力部105は、価値関数Qに基づいて、行動情報を生成し、生成した行動情報を出力装置200に対して出力する。この最適化行動情報には、行動情報出力部103がQ学習の過程において出力する行動情報と同様に、速度フィードフォワード処理部308の各係数ai、bjを修正する情報及び評価関数の変更報告が含まれる。
しかし、本実施形態は、線形動作時の学習に限定されず、非線形動作の学習に適用することもできる。例えば、バックラッシュ補正のために、速度フィードフォワード処理部の係数の最適化に係る学習を行う場合、前述した加工形状の位置A2と位置A4、及び位置B2と位置B4における、位置指令値と積分器108から出力される検出位置との差を位置偏差として抽出して、これを判定情報として報酬を与えて強化学習することができる。
位置A2と位置A4、及び位置B2と位置B4とでは、Y軸方向又はX軸方向のサーボモータの回転方向は反転して非線形動作となってバックラッシが生じ、機械学習装置は非線形動作時のフィードフォワード処理部の伝達関数の係数の学習を行うことができる。
以上、第1実施形態の出力装置及び制御装置について説明したが、次に第2及び第3の実施形態の出力装置及び制御装置について説明する。
第1の実施形態では、出力装置200はサーボ制御装置300と機械学習装置100とに接続され、機械学習装置100とサーボ制御装置300との間の情報の中継、サーボ制御装置300と機械学習装置100との動作の制御を行っていた。
本実施形態では、出力装置が機械学習装置のみに接続される場合について説明する。
図18は、本発明の第2実施形態の制御装置の一構成例を示すブロック図である。制御装置10Aは、機械学習装置100、出力装置200A、サーボ制御装置300、及びサーボモータ400を備えている。
出力装置200Aは、図2に示す出力装置200と比べて、情報取得部217及び情報出力部218を備えていない。
第1の実施形態では、出力装置200はサーボ制御装置300と機械学習装置100とに接続されていたが、本実施形態では、調整装置が機械学習装置100とサーボ制御装置300とに接続され、出力装置が調整装置に接続される場合について説明する。
図19は、本発明の第3実施形態の制御装置の一構成例を示すブロック図である。制御装置10Bは、機械学習装置100、出力装置200A、サーボ制御装置300及び調整装置500を備えている。図19に示した出力装置200Aは、図18に示した出力装置200Aの構成と同一であるが、情報取得部211と情報出力部212が機械学習装置100でなく、調整装置700に接続されている。
調整装置500は、図2の出力装置200の作図部203、操作部204、表示部209及び演算部2100が除かれた構成となっている。
そうすることで、第1実施形態と比較して出力装置200の機能が、出力装置200Aと調整装置500とに分離されるので、出力装置200Aの動作が少なくなり、装置構成が簡易化できる。
上述した実施形態では、機械学習装置100、出力装置200又は200A、及びサーボ制御装置300を制御装置10として構成する第1実施形態及び第2実施形態と、さらに出力装置200を出力装置200Aと調整装置500とに分離して制御装置に設けて構成した第3実施形態について説明した。これらの実施形態では、機械学習装置100、出力装置200又は200A、サーボ制御装置300、調整装置500とは別体の装置により構成しているが、これらの装置の一つを他の装置と一体に構成してもよい。例えば、出力装置200又は200Aの機能の一部又は全部を機械学習装置100、又はサーボ制御装置300により実現するようにしてもよい。
また、出力装置200又は200Aを、機械学習装置100、及びサーボ制御装置300で構成される制御装置の外部に設けてもよい。
図20は他の構成の制御装置を示すブロック図である。制御装置10Cは、図20に示すように、n台の機械学習装置100−1〜100−n、出力装置200−1〜200−n、及びn台のサーボ制御装置300−1〜300−n、サーボモータ400−1〜400−n、及びネットワーク600を備えている。なお、nは任意の自然数である。n台の機械学習装置100−1〜100−nのそれぞれは図17に示した機械学習装置100に対応している。出力装置200−1〜200−nは図2に示した出力装置200又は図18に示した出力装置200Aに対応している。n台のサーボ制御装置300−1〜300−nのそれぞれは図2に示したサーボ制御装置300に対応している。図19に示した出力装置200A及び調整装置500は出力装置200−1〜200−nに対応している。
その際、機械学習装置100−1の各機能を、適宜複数のサーバに分散する、分散処理システムとしてもよい。また、クラウド上で仮想サーバ機能等を利用して、機械学習装置100−1の各機能を実現してもよい。
また、複数の同じ型名、同一仕様、又は同一シリーズのサーボ制御装置300−1〜300−nとそれぞれ対応する複数の機械学習装置100−1〜100−nがあった場合に、各機械学習装置100−1〜100−nにおける学習結果を共有するように構成するようにしてもよい。そうすることで、より最適なモデルを構築することが可能となる。
100 機械学習装置
200 出力装置
211 情報取得部
212 情報出力部
213 作図部
214 操作部
215 制御部
216 記憶部
217 情報取得部
218 情報出力部
219 表示部
300 サーボ制御装置
400 サーボモータ
500 調整装置
600 ネットワーク
Claims (13)
- 工作機械、ロボット又は産業機械の軸を駆動するサーボモータを制御するサーボ制御装置からサーボ情報を取得し、当該サーボ制御装置の構成要素のパラメータの機械学習を行う機械学習装置で用いる複数の評価関数と、各評価関数毎の機械学習結果とを出力する出力部と、
前記機械学習結果を前記サーボ制御装置と前記機械学習装置の少なくとも一方から取得する情報取得部と、
を備えた出力装置。 - 前記出力部は、前記複数の評価関数と、各評価関数毎に取得される前記機械学習結果とを表示画面に表示する表示部を含む請求項1に記載の出力装置。
- 前記複数の評価関数を用いて機械学習された複数のパラメータから、前記複数の評価関数の各評価関数毎の前記機械学習結果に基づいて選択されたパラメータを、前記サーボ制御装置に出力する情報出力部を備えた請求項1又は2に記載の出力装置。
- 前記複数の評価関数の中から選択された評価関数又は前記複数の評価関数とは異なる評価関数への変更指示を前記機械学習装置に出力する情報出力部を備えた請求項1から請求項3のいずれか1項に記載の出力装置。
- 前記機械学習結果は、前記サーボ制御装置における制御指令と、該制御指令に基づいて前記サーボモータを駆動したときのフィードバック情報との偏差である請求項1から請求項4のいずれか1項に記載の出力装置。
- 前記機械学習装置は、評価関数を用いて機械学習時に探索された前記サーボ制御装置の構成要素のパラメータと、該パラメータを用いて前記サーボ制御装置を動作させることで得られた機械学習結果とを保存し、前記変更指示に基づいて前記評価関数を変更して機械学習する場合に、前記パラメータと同じパラメータが選ばれたときに、保存された前記機械学習結果を用いて、変更された評価関数により評価関数値を求める請求項4に記載の制御装置。
- 前記異なる評価関数は、前記複数の評価関数のいずれかと重み付け係数の異なる評価関数である請求項4又は請求項6に記載の出力装置。
- 前記複数の評価関数は、位置偏差を変数とする関数と、位置偏差の微分値を変数とする関数と、トルクの微分値を変数とする関数とをそれぞれ重み付けした和からなる評価関数を含む請求項1から請求項7のいずれか1項に記載の出力装置。
- 前記サーボ制御装置の構成要素のパラメータは、数式モデル又はフィルタのパラメータを含む請求項3から請求項8のいずれか1項に記載の出力装置。
- 前記数式モデル又は前記フィルタは速度フィードフォワード処理部又は位置フィードフォワード処理部に含まれ、前記パラメータはフィルタの伝達関数の係数を含む、請求項9に記載の出力装置。
- 請求項1から10のいずれか1項に記載の出力装置と、
工作機械、ロボット又は産業機械の軸を駆動するサーボモータを制御するサーボ制御装置と、
サーボ制御装置に対して機械学習を行う機械学習装置と、
を備えた制御装置。 - 前記出力装置は、前記サーボ制御装置と前記機械学習装置のうちの一つに含まれる、請求項11に記載の制御装置。
- 工作機械、ロボット又は産業機械の軸を駆動するサーボモータを制御するサーボ制御装置からサーボ情報を取得し、当該サーボ制御装置に対して評価関数を用いて機械学習を行う機械学習装置で、複数の評価関数をそれぞれ用いて機械学習を行うことで得られた、各評価関数毎の機械学習結果を出力し、
前記機械学習結果を前記機械学習装置と前記サーボ制御装置の少なくとも一つから取得する、
出力装置の評価関数と機械学習結果の出力方法。
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018211397A JP6849643B2 (ja) | 2018-11-09 | 2018-11-09 | 出力装置、制御装置、及び評価関数と機械学習結果の出力方法 |
US16/573,079 US11592789B2 (en) | 2018-11-09 | 2019-09-17 | Output device, control device, and method for outputting evaluation functions and machine learning results |
CN201911071925.4A CN111176114B (zh) | 2018-11-09 | 2019-11-05 | 输出装置、控制装置、以及评价函数和机器学习结果的输出方法 |
DE102019217130.3A DE102019217130A1 (de) | 2018-11-09 | 2019-11-06 | Ausgabevorrichtung, steuervorrichtung und verfahren zum ausgeben von bewertungsfunktionen und maschinellen lernergebnissen |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018211397A JP6849643B2 (ja) | 2018-11-09 | 2018-11-09 | 出力装置、制御装置、及び評価関数と機械学習結果の出力方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020077310A JP2020077310A (ja) | 2020-05-21 |
JP6849643B2 true JP6849643B2 (ja) | 2021-03-24 |
Family
ID=70469171
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018211397A Active JP6849643B2 (ja) | 2018-11-09 | 2018-11-09 | 出力装置、制御装置、及び評価関数と機械学習結果の出力方法 |
Country Status (4)
Country | Link |
---|---|
US (1) | US11592789B2 (ja) |
JP (1) | JP6849643B2 (ja) |
CN (1) | CN111176114B (ja) |
DE (1) | DE102019217130A1 (ja) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117521725A (zh) * | 2016-11-04 | 2024-02-06 | 渊慧科技有限公司 | 加强学习*** |
US20200125722A1 (en) * | 2018-10-18 | 2020-04-23 | Denso International America, Inc. | Systems and methods for preventing runaway execution of artificial intelligence-based programs |
JP7512674B2 (ja) | 2020-05-22 | 2024-07-09 | コニカミノルタ株式会社 | 画像処理システム、画像処理装置、プログラム、制御管理システムおよび装置 |
CN111832921B (zh) * | 2020-06-30 | 2023-09-26 | 佛山科学技术学院 | 基于机器学习的工业机器人性能指标评价设备及方法 |
JP2022070451A (ja) * | 2020-10-27 | 2022-05-13 | セイコーエプソン株式会社 | ロボットのパラメーターセットの調整を支援する方法、プログラム、および情報処理装置 |
US20240193329A1 (en) * | 2021-04-07 | 2024-06-13 | Augmenta, Inc. | Cad device with utility element routing and related methods |
JP2023032289A (ja) * | 2021-08-26 | 2023-03-09 | オムロン株式会社 | 温度制御装置および温度制御方法 |
US20230102717A1 (en) * | 2021-09-24 | 2023-03-30 | Rockwell Automation Technologies, Inc. | Providing a model as an industrial automation object |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4627553B2 (ja) * | 2008-03-28 | 2011-02-09 | 株式会社日立製作所 | プラントの制御装置および火力発電プラントの制御装置 |
JP6077617B1 (ja) * | 2015-09-25 | 2017-02-08 | ファナック株式会社 | 最適な速度分布を生成する工作機械 |
JP6619192B2 (ja) * | 2015-09-29 | 2019-12-11 | ファナック株式会社 | 移動軸異常負荷警告機能を有するワイヤ放電加工機 |
JP6325504B2 (ja) | 2015-10-28 | 2018-05-16 | ファナック株式会社 | 学習制御器の自動調整を行う機能を有するサーボ制御装置 |
JP6457472B2 (ja) | 2016-12-14 | 2019-01-23 | ファナック株式会社 | 制御システム及び機械学習装置 |
JP6732676B2 (ja) * | 2017-02-10 | 2020-07-29 | 三菱日立パワーシステムズ株式会社 | シミュレーション結果の評価装置及び方法 |
JP6774637B2 (ja) * | 2017-02-20 | 2020-10-28 | 株式会社安川電機 | 制御装置及び制御方法 |
JP6490127B2 (ja) | 2017-03-15 | 2019-03-27 | ファナック株式会社 | 機械学習装置、サーボ制御装置、サーボ制御システム、及び機械学習方法 |
JP6951659B2 (ja) * | 2017-05-09 | 2021-10-20 | オムロン株式会社 | タスク実行システム、タスク実行方法、並びにその学習装置及び学習方法 |
JP6897360B2 (ja) * | 2017-06-21 | 2021-06-30 | オムロン株式会社 | 制御装置、制御プログラムおよび制御システム |
JP2019016216A (ja) * | 2017-07-07 | 2019-01-31 | 大槻 俊明 | 数値制御工作機械測定装置 |
-
2018
- 2018-11-09 JP JP2018211397A patent/JP6849643B2/ja active Active
-
2019
- 2019-09-17 US US16/573,079 patent/US11592789B2/en active Active
- 2019-11-05 CN CN201911071925.4A patent/CN111176114B/zh active Active
- 2019-11-06 DE DE102019217130.3A patent/DE102019217130A1/de active Pending
Also Published As
Publication number | Publication date |
---|---|
CN111176114B (zh) | 2023-02-17 |
US11592789B2 (en) | 2023-02-28 |
JP2020077310A (ja) | 2020-05-21 |
DE102019217130A1 (de) | 2020-05-14 |
US20200150599A1 (en) | 2020-05-14 |
CN111176114A (zh) | 2020-05-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6849643B2 (ja) | 出力装置、制御装置、及び評価関数と機械学習結果の出力方法 | |
JP6860540B2 (ja) | 出力装置、制御装置、及び学習パラメータの出力方法 | |
JP6490127B2 (ja) | 機械学習装置、サーボ制御装置、サーボ制御システム、及び機械学習方法 | |
JP6860541B2 (ja) | 出力装置、制御装置、及び評価関数値の出力方法 | |
JP6474449B2 (ja) | 調整装置及び調整方法 | |
JP6784722B2 (ja) | 出力装置、制御装置、及び評価関数値の出力方法 | |
JP6697491B2 (ja) | 機械学習装置、サーボモータ制御装置、サーボモータ制御システム、及び機械学習方法 | |
JP6748135B2 (ja) | 機械学習装置、サーボ制御装置、サーボ制御システム、及び機械学習方法 | |
JP6474456B2 (ja) | 機械学習装置、サーボ制御システム及び機械学習方法 | |
CN110376964B (zh) | 机器学习装置、控制装置以及机器学习方法 | |
JP2019185529A (ja) | 機械学習装置、制御装置、及び機械学習方法 | |
JP7405537B2 (ja) | 機械学習装置、サーボ制御装置、サーボ制御システム及び機械学習方法 | |
JP7000373B2 (ja) | 機械学習装置、制御装置及び機械学習方法 | |
JP6841801B2 (ja) | 機械学習装置、制御システム及び機械学習方法 | |
JP6806746B2 (ja) | モータ制御装置 | |
JP6978452B2 (ja) | 機械学習装置、制御装置、及び機械学習の探索範囲の設定方法 | |
JP7000371B2 (ja) | 機械学習装置、制御システム及び機械学習方法 | |
JP7101091B2 (ja) | モータ制御装置のフィードフォワード制御器導出装置、モータ制御装置、制御装置、及びフィードフォワード制御器導出方法 | |
JP6740290B2 (ja) | 機械学習装置、制御装置、及び機械学習方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200410 |
|
A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20200714 |
|
A975 | Report on accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A971005 Effective date: 20200722 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20201008 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20201013 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20201116 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210202 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210304 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6849643 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |