JP6235543B2 - 加工機のサイクル加工時間を最適化する機械学習装置、モータ制御装置、加工機、および機械学習方法 - Google Patents

加工機のサイクル加工時間を最適化する機械学習装置、モータ制御装置、加工機、および機械学習方法 Download PDF

Info

Publication number
JP6235543B2
JP6235543B2 JP2015192970A JP2015192970A JP6235543B2 JP 6235543 B2 JP6235543 B2 JP 6235543B2 JP 2015192970 A JP2015192970 A JP 2015192970A JP 2015192970 A JP2015192970 A JP 2015192970A JP 6235543 B2 JP6235543 B2 JP 6235543B2
Authority
JP
Japan
Prior art keywords
time
processing
machining
motor
machine
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2015192970A
Other languages
English (en)
Other versions
JP2017068563A (ja
Inventor
大原 卓
卓 大原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
FANUC Corp
Original Assignee
FANUC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by FANUC Corp filed Critical FANUC Corp
Priority to JP2015192970A priority Critical patent/JP6235543B2/ja
Priority to DE102016011528.9A priority patent/DE102016011528B4/de
Priority to US15/280,992 priority patent/US10289075B2/en
Priority to CN201610872792.0A priority patent/CN106557070B/zh
Publication of JP2017068563A publication Critical patent/JP2017068563A/ja
Application granted granted Critical
Publication of JP6235543B2 publication Critical patent/JP6235543B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B13/00Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
    • G05B13/02Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
    • G05B13/0265Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric the criterion being a learning criterion
    • G05B13/027Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric the criterion being a learning criterion using neural networks only
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B19/00Programme-control systems
    • G05B19/02Programme-control systems electric
    • G05B19/18Numerical control [NC], i.e. automatically operating machines, in particular machine tools, e.g. in a manufacturing environment, so as to execute positioning, movement or co-ordinated operations by means of programme data in numerical form
    • G05B19/408Numerical control [NC], i.e. automatically operating machines, in particular machine tools, e.g. in a manufacturing environment, so as to execute positioning, movement or co-ordinated operations by means of programme data in numerical form characterised by data handling or data format, e.g. reading, buffering or conversion of data
    • G05B19/4083Adapting programme, configuration
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/04Inference or reasoning models
    • G06N5/045Explanation of inference; Explainable artificial intelligence [XAI]; Interpretable artificial intelligence
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B2219/00Program-control systems
    • G05B2219/30Nc systems
    • G05B2219/39Robotics, robotics to robotics hand
    • G05B2219/39166Coordinate activity by sending pheromone messages between robots, no central control
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y04INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
    • Y04SSYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
    • Y04S10/00Systems supporting electrical power generation, transmission or distribution
    • Y04S10/50Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications

Landscapes

  • Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Medical Informatics (AREA)
  • Biomedical Technology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biophysics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Automation & Control Theory (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Human Computer Interaction (AREA)
  • Manufacturing & Machinery (AREA)
  • Numerical Control (AREA)
  • Control Of Electric Motors In General (AREA)
  • Testing And Monitoring For Control Systems (AREA)

Description

本発明は、機械学習装置、モータ制御装置、加工機、および機械学習方法に関し、特に、加工機のサイクル加工時間を最適化する機械学習装置、該機械学習装置を備えたモータ制御装置、加工機、および機械学習方法に関する。
モータを作動するとモータの巻線の温度は上昇する。そして、モータを作動してから或る時間が経過すると巻線の温度は飽和して高温に維持されるようになる(以下、このときの温度を「飽和温度」と呼ぶ。)。そして、そのような飽和温度の巻線が耐熱温度を超過した状態で電流を印加し続けていると、モータの巻線が焼損する危険性がある。また、巻線の温度が飽和しない状態でも巻線が耐熱温度を超過すると、モータの巻線が損傷する危険性がある。
そのため、モータの駆動制御においては、従前より、巻線の温度を監視し、巻線の温度が予め設定された温度閾値を超えた場合には巻線への電流印加を中止して、巻線の焼損や損傷を防止している(例えば特許文献1参照)。なお、上記した温度閾値は、「オーバヒートアラームレベル」と呼ばれている。
また、加工機においては、工具を回転させる主軸部にモータが採用されているため、主軸部のモータの温度をオーバヒートアラームレベル未満に制御して、モータの故障を防止している。
特に、加工機においては、ある決まった加工パターンの加工動作が絶えず繰返されるとモータの巻線が耐熱温度を超過してしまうので、1サイクルの加工動作時間の後に加工休止時間が設定されている。つまり、加工休止時間においては、モータ制御装置はモータの巻線に電流を印加しないようにしている。なお、本明細書においては、前述した加工動作時間と加工休止時間との合計時間を「1サイクルの加工時間」と呼ぶこととする。
特開2013−70485号公報
しかしながら、前述したような加工休止時間をモータ制御装置に設定する場合、作業者が実際に加工機を動作させながら試行錯誤を重ねて、モータの巻線の温度がアラームレベルを超えないことを満たす最短の加工休止時間を求める必要があった。また、加工休止時間の設定が正確でないと、モータの巻線の焼損や、加工機の稼働率の低下を招くこととなる。そのため、作業者は多大な労力と時間をかけて前述の加工休止時間を正確に求めていた。
そこで本発明は、上述したような実情に鑑み、作業者によらずに前述の加工休止時間を求められる機械学習装置、モータ制御装置、加工機、および機械学習方法を提供することを目的とする。
本発明の第一態様によれば、加工機の繰返しの加工動作を実施するモータの温度が予め定められる温度閾値を超えないように、1台の加工機の1サイクルの加工動作時間と加工休止時間とからなる1サイクルの加工時間のうちの加工休止時間を定める機械学習装置であって、
1台の加工機について、加工休止時間と、加工機の実際の1サイクルの加工時間および実際のモータの温度とを含む状態変数を繰返しの加工動作中に観測する状態観測部と、
状態変数と温度閾値とに基づいて、繰返しの加工動作を実施した際にモータの温度が温度閾値を超えないことを満たす最短の加工休止時間を選択する価値を学習する学習部と、
を備えた機械学習装置が提供される。
本発明の第二態様によれば、第一態様の機械学習装置であって、モータを制御するモータ制御装置に設定すべき加工休止時間を決定する意思決定部をさらに備える、機械学習装置が提供される。
本発明の第三態様によれば、第一態様または第二態様の機械学習装置であって、
学習部は、状態変数のうちの1サイクルの加工時間とモータの温度に基づいて報酬を計算する報酬計算部と、報酬に基づいて、最短の加工休止時間を選択する価値を表す価値関数を更新する関数更新部と、を備える、機械学習装置が提供される。
本発明の第四態様によれば、第三態様の機械学習装置であって、
関数更新部は、状態変数と価値関数とが対応付けられた行動価値テーブルを有し、報酬に基づいて行動価値テーブルを更新するようにした、機械学習装置が提供される。
本発明の第五態様によれば、第四態様の機械学習装置であって、
報酬計算部は、
行動価値テーブルの中で最も低い価値関数に対応する1サイクルの加工時間と比べて、状態観測部により観測された1サイクルの加工時間が減少した場合には、繰返しの加工動作を実施した際のモータの温度と温度閾値の差に基づいて報酬を増加し、
行動価値テーブルの中で最も低い価値関数に対応する1サイクルの加工時間と比べて、状態観測部により観測された1サイクルの加工時間が増加した場合、および、繰返しの加工動作を実施した際にモータの温度が温度閾値に達した場合には、報酬を減少させるようにした、機械学習装置が提供される。
本発明の第六態様によれば、第一態様から第五態様のいずれかの機械学習装置を具備するモータ制御装置が提供される。
本発明の第七態様によれば、第六態様のモータ制御装置を具備する加工機が提供される。
本発明の第八態様によれば、加工機の繰返しの加工動作を実施するモータの温度が予め定められる温度閾値を超えないように、1台の加工機の1サイクルの加工動作時間と加工休止時間とからなる1サイクルの加工時間のうちの加工休止時間を定める機械学習方法であって、
1台の加工機について、加工休止時間と、加工機の実際の1サイクルの加工時間および実際のモータの温度とを含む状態変数を繰返しの加工動作中に観測し、
状態変数と温度閾値とに基づいて、繰返しの加工動作を実施した際にモータの温度が温度閾値を超えないことを満たす最短の加工休止時間を選択する価値を学習する、
ことを含む機械学習方法が提供される。
本発明の第一態様から第八態様によれば、加工機に繰返しの加工動作を実施させる場合にモータの巻線の温度が所定の温度閾値を超えないことを満たす最短の加工休止時間を、作業者によらずにモータ制御装置に定められるようになる。これにより、加工休止時間をモータ制御装置に設定する際の作業者の労力や時間を削減することができる。
添付図面に示される本発明の典型的な実施形態の詳細な説明から、本発明のこれらの目的、特徴および利点ならびに他の目的、特徴および利点がさらに明確になるであろう。
本発明の一実施形態の加工機の構成を示すブロック図である。 繰返しの加工動作を実施した際のモータの巻線の温度の経時変化と、加工動作時間Aと加工休止時間Bとからなる1サイクルの加工時間Tとを示したグラフである。 本発明の一実施形態の機械学習装置による学習範囲を説明するための図である。 ニューロンのモデルを示す模式図である。 3層のニューラルネットワークモデルを示す模式図である。 Q学習を適用したモータ制御装置(環境)と機械学習装置(エージェント)における状態と行動を説明するための図である。 図1に示された機械学習装置の動作手順を説明するためのフローチャートである。
次に、本発明の実施形態について図面を参照して説明する。以下の図面において、同様の部材には同様の参照符号が付けられている。理解を容易にするために、これらの図面は縮尺を適宜変更している。また、図面に示される形態は本発明を実施するための一つの例であり、本発明は図示された形態に限定されるものではない。
図1は、本発明の一実施形態の加工機の構成を示すブロック図である。
図1に示される加工機10は、加工機10の主軸部に取付けられたドリル等の工具を回転させるモータ11と、モータ11を制御するモータ制御装置12と、モータ11の巻線の温度を測定する温度センサ13と、モータ11を流れる電流を測定する電流センサ14と、モータ11の回転速度を測定する速度センサ15と、を備える。
前述した加工機10は、NC工作機械や加工用ロボットであることが好ましい。モータ11は、例えば加工機10の主軸部に設置されたサーボモータである。温度センサ13はサーミスタであることが好ましい。速度センサ15はモータ11の回転数に基づいてモータ11の回転速度を測定するパルスエンコーダであることが好ましい。
モータ制御装置12は、予め記憶された動作プログラムから動作指令値を読出し、動作指令値に従ってモータ11を制御する。特に、本実施形態のモータ制御装置12には、モータ11により回転する工具を用いて繰返しの加工動作を実施するための動作プログラムが予め記憶されている。
なお、「繰返しの加工動作」とは、ある決まった加工パターンの加工動作を繰返す、例えば主軸部のドリルによってワークに一定深さの穴を掘削するといった加工を繰返すことを指す。したがって、前述した動作プログラムには、ある決まった加工パターンの加工動作でのドリル等の工具の回転数(回転速度)や加工位置データなどが書込まれている。
モータ11が前述した動作プログラムに従って動作されたかを確認するため、電流センサ14により測定されたモータ11の電流値はモータ制御装置12に送信される。速度センサ15により測定されたモータ11の回転速度値もまた、モータ制御装置12に送信される。モータ制御装置12は、電流センサ14からモータ11の電流値を取得することにより、加工動作中に工具にかかる負荷トルクを監視して制御することができる。さらに、モータ制御装置12は、速度センサ15からモータ11の回転速度を取得することにより、加工動作中の工具の回転速度を監視して制御することができる。
しかし、前述のような繰返しの加工動作を実施した場合、モータ11には絶えず電流を印加しているため、モータ11の巻線が耐熱温度を超過してしまい、巻線の焼損や破損が生じるおそれがある。そのため、背景技術の欄に説明したように、1サイクルの加工動作時間の後に加工休止時間を設定して、モータ11の巻線の温度がオーバヒートアラームレベルを超えないようにする必要がある。また、そのような加工休止時間を前述した繰返しの加工動作を実施するための動作プログラムに定めておく必要がある。
図2は、前述した繰返しの加工動作を実施した際に温度センサ13により測定されるモータ11の巻線の温度の経時変化と、加工動作時間Aと加工休止時間Bとからなる1サイクルの加工時間Tとを示したグラフである。
図2に示されるように、1サイクルの加工時間Tが繰返されると、モータ11の巻線の温度は上昇と低下を繰返す。また、加工休止時間Bを短くするほどモータ11の巻線の温度低下量が減り、加工休止時間Bを長くするほどモータ11の巻線の温度低下量が増える。そのため、加工休止時間Bが短すぎると、所定回数の繰返しの加工動作が完了する前にモータ11の巻線の温度はオーバヒートアラームレベルPに達してしまう場合がある。一方、加工休止時間Bが長いほど、加工機10に所定回数の繰返しの加工動作を実施させてもモータ11の巻線の温度はオーバヒートアラームレベルPに達しにくい。しかし、加工休止時間Bを長くするほど、所定回数の繰返しの加工動作を実施したときの加工機10の稼働時間は増えてしまう。なお、本実施形態においては加工機10が同じ加工動作を繰返す場合を前提としているので、各加工動作時間Aは殆ど変わらない。
以上の実情により、加工機10に繰返しの加工動作を実施させた場合にモータ11の巻線の温度がオーバヒートアラームレベルPを超えないことを満たす最短の加工休止時間Bを求めることが必要となる。
本願発明は、そのような加工休止時間Bの最適値を機械学習法、例えば後述のQ学習によって求めようとするものである。
そこで、本実施形態の加工機10は、繰返しの加工動作を実施する場合の加工休止時間Bの最適値を機械学習によって求めてモータ制御装置12に設定できる機械学習装置16を備えている。
図3は本実施形態の機械学習装置16による学習範囲を説明するための図である。図3中に直線Gにより示されるように、加工休止時間Bの長さに比例して1サイクルの加工時間Tは上昇する。一方、図3中の曲線Hにより示されるように、加工休止時間Bが長くなるに伴ってモータ11の巻線の温度は低下する。繰返しの加工動作を実施する場合の加工休止時間Bの最適値が直線Gと曲線Hの交点に対応する。そして、本実施形態の機械学習装置16は、図3中の曲線Iにより示されるように、加工休止時間Bの変更に対して与える報酬を変えている。
具体的には、本実施形態の機械学習装置16は、図1に示されるように、状態観測部17と、学習部18と、意思決定部22とを備えている。
状態観測部17は、繰返しの加工動作を実施している間、意思決定部22により決定された加工休止時間Bと、加工機10の実際の1サイクルの加工時間Tおよびモータ11の温度のうちの少なくとも一つとを含む状態変数を観測する。
前述した加工休止時間Bは意思決定部22から状態観測部17に出力される。実際の1サイクルの加工時間Tは、モータ制御装置12から状態観測部17に出力される。モータ11の巻線の温度は、温度センサ13から状態観測部17に出力される。
なお、モータ制御装置12から状態観測部17に出力される「実際の1サイクルの加工時間T」は、図2に示されるような実際の1サイクルの加工動作時間Aとこの加工動作時間Aに続く実際の加工休止時間Bとの合計時間(T=A+B)である。
加工動作時間Aは、動作プログラムに従って工具が加工動作をした際に実際にかかった加工時間に相当する。さらに、加工休止時間Bは、モータ制御装置12が、機械学習装置16の意思決定部22により指令された加工休止時間B通りにモータ11への給電を休止させた時間に相当する。
そして、学習部18は、前述の状態変数とオーバヒートアラームレベルPとに基づいて、繰返しの加工動作を実施した際にモータ11の巻線の温度がオーバヒートアラームレベルPを超えないことを満たす最短の加工休止時間Bを選択する価値を学習する。
なお、前述した学習部18にはオーバヒートアラームレベル入力部21が接続されていることが好ましい。学習部18に入力されるオーバヒートアラームレベルは、連続定格時の電流をモータ11に印加し続けたときのモータ11の巻線の飽和温度に対して余裕値を見積った温度閾値とする。ここでいう「連続定格時の電流」とは、モータ11の巻線が過熱することなしに巻線に連続印加できる最大電流値を意味する。
さらに、意思決定部22は、学習部18による機械学習の終了後に、学習部18により取得された複数の価値のうち最も高い価値に対応する加工休止時間Bを決定し、決定した加工休止時間Bをモータ制御装置12に送信する。但し、意思決定部22は、機械学習中は加工休止時間Bを無作為に決定してモータ制御装置12に送信する。
また、本実施形態の学習部18は、図1に示されるように、報酬計算部19と関数更新部20とを備えている。
報酬計算部19は、上述した状態変数のうち、加工機10の実際の1サイクルの加工時間Tとモータ11の巻線の温度とに基づいて、報酬を計算する。図1においては、報酬計算部19を学習部18内に設けた態様を示しているが、報酬計算部19は学習部18外に在ってもよい。
関数更新部20は、報酬に基づいて、前述した最短の加工休止時間Bを選択する価値を表す価値関数を更新する。
ここで、機械学習装置16について詳細に説明する。機械学習装置16は、装置に入力されるデータの集合から、その中にある有用な規則や知識表現、判断基準などを解析により抽出し、その判断結果を出力するとともに、知識の学習を行う機能を有する。その手法は様々であるが、大別すれば「教師あり学習」、「教師なし学習」、「強化学習」に分けられる。さらに、これらの手法を実現するうえで、特徴量そのものの抽出を学習する、「深層学習」と呼ばれる手法がある。
「教師あり学習」とは、ある入力と結果(ラベル)のデータの組を大量に学習装置に与えることで、それらのデータセットにある特徴を学習し、入力から結果を推定するモデル、即ち、その関係性を帰納的に獲得することができる。これは後述のニューラルネットワークなどのアルゴリズムを用いて実現することができる。
「教師なし学習」とは、入力データのみを大量に学習装置に与えることで、入力データがどのような分布をしているか学習し、対応する教師出力データを与えなくても、入力データに対して圧縮、分類、整形などを行う装置を学習する手法である。それらのデータセットにある特徴を似た者どうしにクラスタリングすることなどができる。この結果を使って、何らかの基準を設けてそれを最適にするような出力の割り当てを行うことで、出力の予測を実現することできる。また「教師なし学習」と「教師あり学習」との中間的な問題設定として、「半教師あり学習」と呼ばれるものもあり、これは一部のみ入力と出力のデータの組が存在し、それ以外は入力のみのデータである場合がこれに当たる。本実施形態においては、実際に加工機を動作させなくても取得することが出来るデータを教師なし学習で利用し、学習を効率的に行うことが出来る。
強化学習の問題を以下のように設定する。
・加工機は環境の状態を観測し、行動を決定する。
・環境は何らかの規則に従って変化し、さらに自分の行動が、環境に変化を与えることもある。
・行動するたびに報酬信号が帰ってくる。
・最大化したいのは将来にわたっての(割引)報酬の合計である。
・行動が引き起こす結果を全く知らない、または不完全にしか知らない状態から学習はスタートする。加工機は実際に動作して初めて、その結果をデータとして得ることが出来る。つまり、試行錯誤しながら最適な行動を探索する必要がある。
・人間の動作を真似るように事前学習(前述の教師あり学習や、逆強化学習といった手法)した状態を初期状態として、良いスタート地点から学習をスタートさせることもできる。
「強化学習」とは、判定や分類だけではなく、行動を学習することにより、環境に行動が与える相互作用を踏まえて適切な行動を学習、即ち、将来的に得られる報酬を最大にするための学習する方法である。このことは、本実施形態において、未来に影響を及ぼすような行動を獲得できることを表している。例えばQ学習の場合で説明を続けるが、それに限るものではない。
Q学習は、或る環境状態sの下で、行動aを選択する価値Q(s,a)を学習する方法である。つまり、或る状態sのとき、価値Q(s,a)の最も高い行動aを最適な行動として選択すればよい。しかし、最初は状態sと行動aとの組合せについて、価値Q(s,a)の正しい値は全く分かっていない。そこで、エージェント(行動主体)は、或る状態sの下で様々な行動aを選択し、その時の行動aに対して報酬が与えられる。それにより、エージェントはより良い行動の選択、すなわち正しい価値Q(s,a)を学習していく。
行動の結果、将来にわたって得られる報酬の合計を最大化したいので、最終的にQ(s,a)=E[Σγtt]となるようにすることを目指す(期待値は最適な行動に従って状態変化したときについてとる。もちろん、それは分かっていないので、探索しながら学習しなければならない)。そのような価値Q(s,a)の更新式は、例えば次式により表すことができる。
Figure 0006235543
ここで、stは時刻tにおける環境の状態を表し、atは時刻tにおける行動を表す。行動atにより、状態はst+1に変化する。rt+1は、その状態の変化により貰える報酬を表している。また、maxの付いた項は、状態st+1の下で、その時に分かっている最もQ値の高い行動aを選択した場合のQ値にγを乗じたものになる。γは、0<γ≦1のパラメータで、割引率と呼ばれる。αは学習係数で、0<α≦1の範囲とする。
この式は、試行atの結果帰ってきた報酬rt+1を元に、状態stにおける行動atの評価値Q(st,at)を更新する方法を表している。状態sにおける行動aの評価値Q(st,at)よりも、報酬rt+1+行動aによる次の状態における最良の行動max aの評価値Q(st+1,max at+1)の方が大きければ、Q(st,at)を大きくするし、反対に小さければ、Q(st,at)も小さくする事を示している。つまり、或る状態における或る行動の価値を、結果として即時帰ってくる報酬と、その行動による次の状態における最良の行動の価値に近付けるようにしている。
Q(s,a)の計算機上での表現方法は、すべての状態行動ペア(s,a)に対して、その値をテーブル(行動価値テーブル)として保持しておく方法と、Q(s,a)を近似するような関数を用意する方法がある。後者の方法では、前述の更新式は、確率勾配降下法などの手法で近似関数のパラメータを調整していくことで実現することが出来る。近似関数としては、後述のニューラルネットワークを用いることが出来る。
教師あり学習、教師なし学習、及び強化学習での価値関数の近似アルゴリズムとして、ニューラルネットワークを用いることができる。ニューラルネットワークは、たとえば図4に示すようなニューロンのモデルを模したニューラルネットワークを実現する演算装置及びメモリ等で構成される。図4は、ニューロンのモデルを示す模式図である。
図4に示すように、ニューロンは、複数の入力x(ここでは一例として、入力x1〜入力x3)に対する出力yを出力するものである。各入力x1〜x3には、この入力xに対応する重みw(w1〜w3)が掛けられる。これにより、ニューロンは、次の式により表現される出力yを出力する。なお、入力x、出力y及び重みwは、すべてベクトルである。
Figure 0006235543
ここで、θはバイアスであり、fkは活性化関数である。
次に、上述したニューロンを組み合わせた3層の重みを有するニューラルネットワークについて、図5を参照して説明する。図5は、D1〜D3の3層の重みを有するニューラルネットワークを示す模式図である。
図5に示すように、ニューラルネットワークの左側から複数の入力x(ここでは一例として、入力x1〜入力x3)が入力され、右側から結果y(ここでは一例として、結果y1〜結果y3)が出力される。
具体的には、入力x1〜入力x3は、3つのニューロンN11〜N13の各々に対して対応する重みが掛けられて入力される。これらの入力に掛けられる重みはまとめてw1と標記されている。
ニューロンN11〜N13は、それぞれ、z11〜z13を出力する。これらのz11〜z13はまとめて特徴ベクトルz1と標記され、入力ベクトルの特徴量を抽出したベクトルとみなすことができる。この特徴ベクトルz1は、重みw1と重みw2との間の特徴ベクトルである。
z11〜z13は、2つのニューロンN21、N22の各々に対して対応する重みが掛けられて入力される。これらの特徴ベクトルに掛けられる重みは、まとめてw2と標記されている。
ニューロンN21、N22は、それぞれ、z21、z22を出力する。これらは、まとめて特徴ベクトルz2と標記されている。この特徴ベクトルz2は、重みw2と重みw3との間の特徴ベクトルである。
特徴ベクトルz21、z22は、3つのニューロンN31〜N33の各々に対して対応する重みが掛けられて入力される。これらの特徴ベクトルに掛けられる重みは、まとめてw3と標記されている。
最後に、ニューロンN31〜N33は、それぞれ、結果y1〜結果y3を出力する。
ニューラルネットワークの動作には、学習モードと価値予測モードとがあり、学習モードにおいて学習データセットを用いて重みwを学習し、そのパラメータを用いて予測モードにおいて加工機の行動判断を行う(便宜上、予測と書いたが、検出、分類、推論など多様なタスクが可能である)。
予測モードで実際に加工機を動かして得られたデータを即時学習し、次の行動に反映させる(オンライン学習)ことも、あらかじめ収集しておいたデータ群を用いてまとめた学習を行い、以降はずっとそのパラメータで検知モードを行う(バッチ学習)こともできる。その中間的な、ある程度データが溜まるたびに学習モードを挟むということも可能である。
重みw1〜w3は、誤差逆伝搬法(バックプロパゲーション)により学習可能なものである。誤差の情報は、右側から入り左側に流れる。誤差逆伝搬法は、各ニューロンについて、入力xが入力されたときの出力yと真の出力y(教師)との差分を小さくするように、それぞれの重みを調整(学習)する手法である。
このようなニューラルネットワークは、3層以上にさらに層を増やすことも可能である(深層学習と称される)。入力の特徴抽出を段階的に行い、結果を回帰する演算装置を、教師データのみから自動的に獲得することが可能である。
そこで、上述したような状態観測部17や学習部18などを備えた機械学習装置16には、機械学習方法の一種である強化学習、例えばQ学習が採用されている。勿論、本発明に適用可能な機械学習方法は、Q学習に限定されるものではない。例えば教師あり学習を適用する場合、価値関数は学習モデル、報酬は誤差に対応する。
図6は、上述したQ学習を適用したモータ制御装置12(環境)と機械学習装置16(エージェント)における状態と行動を説明するための図である。
図6に示されるように、機械学習装置16(エージェント)の行動は、1サイクルの加工時間Tのうちの加工休止時間Bを決定することである。さらに、モータ制御装置12(環状)における状態には、前述の行動により間接的に変化する状態と、前述の行動により直接的に変化する状態とがある。行動により間接的に変化する状態には、実際の1サイクルの加工時間Tとモータ11の巻線の温度とが含まれる。行動により直接的に変化する状態は、モータ制御装置12に設定すべき加工休止時間Bである。
なお、上述した式(1)に用いられる状態sは、意思決定部22により決定された加工休止時間Bと、加工機10の実際の1サイクルの加工時間Tおよびモータ11の温度のうちの少なくとも一つとを含む状態変数が対応する。また、前述の報酬γt+1は報酬計算部19により取得される。そして、関数更新部20は、報酬γt+1に基づいて、価値Q(st,at)、すなわち価値関数を更新する。このとき、関数更新部20は、価値関数の更新の際、価値Q(st,at)を状態sと行動aの組ごとに対応付けて行動価値テーブルを作成することが好ましい。
さらに、意思決定部22は、学習部18による機械学習の終了後、前述した行動価値テーブルを参照して、最も高い価値に対応する加工休止時間Bを決定する。但し、意思決定部22は、機械学習中は加工休止時間Bを無作為に決定してモータ制御装置12に送信する。
なお、図1においては、機械学習装置16がモータ制御装置12外に設けられている態様を図示したが、機械学習装置16はモータ制御装置12内に設けられていてもよい。あるいは、機械学習装置16はクラウドサーバ(図示せず)に存在してもよい。
次に、本実施形態の加工機10に備わる機械学習装置16の動作の一例を説明する。図7は、図1に示された機械学習装置16の動作手順を説明するためのフローチャートである。
機械学習を開始する場合、まず、ステップS11において、機械学習装置20の意思決定部22は、加工休止時間Bを無作為に決定してモータ制御装置12に指令値として送信する。そして、指令値としての加工休止時間Bが、モータ制御装置12内の、繰返しの加工動作を実施するための動作プログラムに書込まれる。
続いて、ステップS12において、モータ制御装置12は、前述の加工休止時間Bが設定された動作プログラムに従って繰返しの加工動作を実施するようにモータ11を制御する。なお、本実施形態においては、所定回数の繰返しの加工動作が行われるものとする。
次いで、ステップS13において、機械学習装置20の状態観測部17は、繰返しの加工動作を実施している間、意思決定部22により決定された加工休止時間Bと加工機10の実際の1サイクルの加工時間Tおよびモータ11の温度とから少なくとも構成される状態変数を観測する。
その後、ステップS14において、学習部18は、関数更新部20内の行動価値テーブルの中で最もQ値の低い行動に対応する実際の1サイクルの加工時間Tに対し、状態観測部17により観測された1サイクルの加工時間Tが増加したかどうかを判断する。
前述の関数更新部20内の行動価値テーブルは、後述するステップS18において作成されるが、機械学習を開始する前に、出来るだけ低いQ値を初期値として行動価値テーブルに記憶させておくことが好ましい。なお、ここでいうQ値は、上述した式(1)により得られる価値関数、すなわち価値Q(st,at)を指す。
上記のステップS14において、状態観測部17により観測された1サイクルの加工時間Tが、関数更新部20内の行動価値テーブルの中で最もQ値の低い行動に対応する実際の1サイクルの加工時間Tと比べて減少した場合は、ステップS15に移行する。
ステップS15においては、学習部18は、繰返しの加工動作中にモータ11の巻線の温度がオーバヒートアラームレベルPに達したかどうかを判断する。
上記のステップS15においてモータ11の巻線の温度がオーバヒートアラームレベルPに達していない場合は、ステップS16に移行する。
そして、ステップS16において、学習部18の報酬計算部19は、上記のステップS11にて加工休止時間Bを決定した行動の価値に対して与える報酬を増額する。つまり、上述した式(1)における報酬γt+1の値が増加される。その後、ステップS18において、関数更新部20は、報酬γt+1に基づいて、価値関数(価値Q(st,at))とともに行動価値テーブルを更新する。
前述したステップS16での報酬計算においては、所定回数の繰返しの加工動作が実施された際の最後の加工動作時間Aの終了時に測定されたモータ11の巻線の温度α(図2参照)と、オーバヒートアラームレベルPとの差に応じて、報酬の増額値を減らすことが好ましい。つまり、前述の巻線の温度αとオーバヒートアラームレベルPとの差が大きいほど、報酬計算部19は報酬の増額値を小さくする。
一方、上記のステップS14において、状態観測部17により観測された1サイクルの加工時間Tが、関数更新部20内の行動価値テーブルの中で最もQ値の低い行動に対応する実際の1サイクルの加工時間Tと比べて増加した場合は、ステップS17に移行する。さらに、上記のステップS15においてモータ11の巻線の温度がオーバヒートアラームレベルPに達した場合もまた、ステップS17に移行する。
そして、ステップS17において、学習部18の報酬計算部19は、上記のステップS11にて加工休止時間Bを決定した行動の価値に対して与える報酬を減額する。つまり、上述した式(1)における報酬γt+1の値が低減される。その後、ステップS18において、関数更新部20は、報酬γt+1に基づいて、価値関数(価値Q(st,at))とともに行動価値テーブルを更新する。
以上のステップS11〜ステップS18を繰返すことにより、学習部18は行動価値テーブルを更新し続けることとなる。
なお、上述した機械学習の終了後、意思決定部22は、前述した行動価値テーブルを参照して最も高い価値に対応する加工休止時間Bを決定し、モータ制御装置12に出力することが好ましい。
また、上述したような機械学習装置16を備えた加工機10は、機械学習時に実際にドリル等の工具をモータ11により回転させ、加工機10の作業テーブル上に固定されたワークを加工している。このとき、切削液などのクーラントを工具およびワークに供給しながらモータ11を駆動することが好ましい。つまり、上述の加工休止時間Bを正確に求めるためには、本実施形態のように加工機10の加工状況を実際の状況に合致させて機械学習を行うことが好ましい。
以上に説明したように、本実施形態の機械学習装置16を備えたモータ制御装置12および加工機10は、加工機10に繰返しの加工動作を実施させる場合にモータ11の巻線の温度がオーバヒートアラームレベルPを超えないことを満たす最短の加工休止時間Bを、作業者によらずに求めることができる。これにより、加工休止時間Bをモータ制御装置12に設定する際の作業者の労力や時間が削減される。
なお、本発明に適用される機械学習は、上述したQ学習に限られない。たとえば、機械学習装置16は、深層学習(ディープラーニング)によりニューラルネットワークを用いて多層化して最適な行動を設定しても構わない。前述した価値関数(価値Q(st,at))を含む行動価値テーブルを用いる代わりに、所定の状態sを与えたときのそれぞれの行動aに対する行動価値変数を出力するニューラルネットワークを用いることができる。
また、上述した実施形態においては、図1に示されるように一つのモータ制御装置12に対して一つの機械学習装置16が設けられている。しかし、本発明においては、モータ制御装置12および機械学習装置16の各々の数は一つに限定されない。例えば、加工機10が複数のモータ11およびモータ制御装置12を備えていて、一つ以上の機械学習装置16が各々のモータ制御装置12に対応して設けられていてもよい。そして、それぞれの機械学習装置16にて学習した情報を通信ケーブルやネットワークなどを介して互いに送信できることが好ましい。これにより、或る機械学習装置16の学習部18により更新された行動価値テーブルを用いて別の機械学習装置16の学習部18内の行動価値テーブルを更新することができる。
以上では典型的な実施形態を用いて本発明を説明したが、当業者であれば、本発明の範囲から逸脱することなしに、上述の実施形態に変更および種々の他の変更、省略、追加を行うことができるのを理解できるであろう。
10 加工機
11 モータ
12 モータ制御装置
13 温度センサ
14 電流センサ
15 速度センサ
16 機械学習装置
17 状態観測部
18 学習部
19 報酬計算部
20 関数更新部
21 オーバヒートアラームレベル入力部
22 意思決定部

Claims (6)

  1. 加工機(10)の繰返しの加工動作を実施するモータ(11)の温度が予め定められる温度閾値(P)を超えないように、1台の前記加工機(10)の1サイクルの加工動作時間(A)と加工休止時間(B)とからなる1サイクルの加工時間(T)のうちの前記加工休止時間(B)を定める機械学習装置(16)であって、
    1台の前記加工機(10)について、前記加工休止時間(B)と、前記加工機(10)の実際の1サイクルの加工時間(T)および実際の前記モータ(11)の温度とを含む状態変数を前記繰返しの加工動作中に観測する状態観測部(17)と、
    前記状態変数と前記温度閾値(P)とに基づいて、前記繰返しの加工動作を実施した際に前記モータ(11)の温度が前記温度閾値(P)を超えないことを満たす最短の前記加工休止時間(B)を選択する価値を学習する学習部(18)と、
    前記状態変数のうちの、前記1サイクルの加工時間(T)と前記モータ(11)の温度に基づいて報酬を計算する報酬計算部(19)と、
    前記報酬に基づいて、前記最短の加工休止時間(B)を選択する価値を表す価値関数を更新する関数更新部(20)と、
    前記モータ(11)を制御するモータ制御装置(12)に設定すべき前記加工休止時間(B)を決定する意思決定部(22)と、
    を備えた機械学習装置。
  2. 前記関数更新部(20)は、前記状態変数と前記価値関数とが対応付けられた行動価値テーブルを有し、前記報酬に基づいて前記行動価値テーブルを更新するようにした、請求項1に記載の機械学習装置。
  3. 前記報酬計算部(19)は、
    前記行動価値テーブルの中で最も低い価値関数に対応する前記1サイクルの加工時間(T)と比べて、前記状態観測部(17)により観測された前記1サイクルの加工時間(T)が減少した場合には、前記繰返しの加工動作を実施した際の前記モータ(11)の温度と前記温度閾値(P)との差に基づいて前記報酬を増加し、
    前記行動価値テーブルの中で最も低い価値関数に対応する前記1サイクルの加工時間(T)と比べて、前記状態観測部(17)により観測された前記1サイクルの加工時間(T)が増加した場合、および、前記繰返しの加工動作を実施した際に前記モータの温度が前記温度閾値に達した場合には、前記報酬を減少させるようにした、請求項2に記載の機械学習装置。
  4. 請求項1から3のいずれか一項に記載の機械学習装置(16)を具備するモータ制御装置。
  5. 請求項4に記載のモータ制御装置(12)を具備する加工機。
  6. 加工機(10)の繰返しの加工動作を実施するモータ(11)の温度が予め定められる温度閾値(P)を超えないように、1台の前記加工機(10)の1サイクルの加工動作時間(A)と加工休止時間(B)とからなる1サイクルの加工時間(T)のうちの前記加工休止時間(B)を定める機械学習方法であって、
    1台の前記加工機(10)について、前記加工休止時間(B)と、前記加工機(10)の実際の1サイクルの加工時間(T)および実際の前記モータ(11)の温度とを含む状態変数を前記繰返しの加工動作中に観測し、
    前記状態変数と前記温度閾値(P)とに基づいて、前記繰返しの加工動作を実施した際に前記モータ(11)の温度が前記温度閾値(P)を超えないことを満たす最短の前記加工休止時間(B)を選択する価値を学習し、
    該学習の間、前記状態変数のうちの、前記1サイクルの加工時間(T)と前記モータ(11)の温度に基づいて報酬を計算し、前記報酬に基づいて、前記最短の加工休止時間(B)を選択する価値を表す価値関数を更新し、前記モータ(11)を制御する時の前記加工休止時間(B)を決定する、
    ことを含む機械学習方法。
JP2015192970A 2015-09-30 2015-09-30 加工機のサイクル加工時間を最適化する機械学習装置、モータ制御装置、加工機、および機械学習方法 Active JP6235543B2 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP2015192970A JP6235543B2 (ja) 2015-09-30 2015-09-30 加工機のサイクル加工時間を最適化する機械学習装置、モータ制御装置、加工機、および機械学習方法
DE102016011528.9A DE102016011528B4 (de) 2015-09-30 2016-09-23 Maschinelle Lernvorrichtung zur Optimierung der Zyklusprozesszeit einer Bearbeitungsmaschine, Motorsteuervorrichtung, Bearbeitungsmaschine und maschinelles Lernverfahren
US15/280,992 US10289075B2 (en) 2015-09-30 2016-09-29 Machine learning apparatus for optimizing cycle processing time of processing machine, motor control apparatus, processing machine, and machine learning method
CN201610872792.0A CN106557070B (zh) 2015-09-30 2016-09-30 机器学习装置、电动机控制装置、加工机及机器学习方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2015192970A JP6235543B2 (ja) 2015-09-30 2015-09-30 加工機のサイクル加工時間を最適化する機械学習装置、モータ制御装置、加工機、および機械学習方法

Publications (2)

Publication Number Publication Date
JP2017068563A JP2017068563A (ja) 2017-04-06
JP6235543B2 true JP6235543B2 (ja) 2017-11-22

Family

ID=58281912

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015192970A Active JP6235543B2 (ja) 2015-09-30 2015-09-30 加工機のサイクル加工時間を最適化する機械学習装置、モータ制御装置、加工機、および機械学習方法

Country Status (4)

Country Link
US (1) US10289075B2 (ja)
JP (1) JP6235543B2 (ja)
CN (1) CN106557070B (ja)
DE (1) DE102016011528B4 (ja)

Families Citing this family (48)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8977255B2 (en) 2007-04-03 2015-03-10 Apple Inc. Method and system for operating a multi-function portable electronic device using voice-activation
US8676904B2 (en) 2008-10-02 2014-03-18 Apple Inc. Electronic devices with voice command and contextual data processing capabilities
US10417037B2 (en) 2012-05-15 2019-09-17 Apple Inc. Systems and methods for integrating third party services with a digital assistant
DE112014000709B4 (de) 2013-02-07 2021-12-30 Apple Inc. Verfahren und vorrichtung zum betrieb eines sprachtriggers für einen digitalen assistenten
US10170123B2 (en) 2014-05-30 2019-01-01 Apple Inc. Intelligent assistant for home automation
US9715875B2 (en) 2014-05-30 2017-07-25 Apple Inc. Reducing the need for manual start/end-pointing and trigger phrases
US9338493B2 (en) 2014-06-30 2016-05-10 Apple Inc. Intelligent automated assistant for TV user interactions
US9886953B2 (en) 2015-03-08 2018-02-06 Apple Inc. Virtual assistant activation
US10460227B2 (en) 2015-05-15 2019-10-29 Apple Inc. Virtual assistant in a communication session
US10747498B2 (en) 2015-09-08 2020-08-18 Apple Inc. Zero latency digital assistant
US10691473B2 (en) 2015-11-06 2020-06-23 Apple Inc. Intelligent automated assistant in a messaging environment
DK201670540A1 (en) 2016-06-11 2018-01-08 Apple Inc Application integration with a digital assistant
DK180048B1 (en) 2017-05-11 2020-02-04 Apple Inc. MAINTAINING THE DATA PROTECTION OF PERSONAL INFORMATION
DK179496B1 (en) 2017-05-12 2019-01-15 Apple Inc. USER-SPECIFIC Acoustic Models
DK201770427A1 (en) 2017-05-12 2018-12-20 Apple Inc. LOW-LATENCY INTELLIGENT AUTOMATED ASSISTANT
DK201770411A1 (en) 2017-05-15 2018-12-20 Apple Inc. MULTI-MODAL INTERFACES
JP6577522B2 (ja) * 2017-06-07 2019-09-18 ファナック株式会社 制御装置及び機械学習装置
US11521045B2 (en) 2017-06-14 2022-12-06 Knowm, Inc. Anti-Hebbian and Hebbian (AHAH) computing
JP6608879B2 (ja) * 2017-07-21 2019-11-20 ファナック株式会社 機械学習装置、数値制御装置、数値制御システム、及び機械学習方法
JP6637021B2 (ja) 2017-11-24 2020-01-29 ファナック株式会社 切削液供給タイミング制御装置及び機械学習装置
JP6652549B2 (ja) * 2017-12-26 2020-02-26 ファナック株式会社 切粉除去装置及び情報処理装置
JP6680809B2 (ja) * 2018-01-09 2020-04-15 ファナック株式会社 ファイバレーザ装置及び機械学習装置
JP6703020B2 (ja) 2018-02-09 2020-06-03 ファナック株式会社 制御装置及び機械学習装置
WO2019202672A1 (ja) * 2018-04-17 2019-10-24 三菱電機株式会社 機械学習装置、放電加工機および機械学習方法
US11145294B2 (en) 2018-05-07 2021-10-12 Apple Inc. Intelligent automated assistant for delivering content from user experiences
US10928918B2 (en) 2018-05-07 2021-02-23 Apple Inc. Raise to speak
JP6753893B2 (ja) * 2018-05-16 2020-09-09 ファナック株式会社 熱変位補正装置
DK180639B1 (en) 2018-06-01 2021-11-04 Apple Inc DISABILITY OF ATTENTION-ATTENTIVE VIRTUAL ASSISTANT
WO2019239553A1 (ja) 2018-06-14 2019-12-19 三菱電機株式会社 機械学習装置、補正パラメータ調整装置および機械学習方法
CN110892344B (zh) * 2018-07-06 2021-03-16 三菱电机株式会社 机械学习装置、数控装置、工作机械及机械学习方法
US11462215B2 (en) 2018-09-28 2022-10-04 Apple Inc. Multi-modal inputs for voice commands
US11119716B2 (en) * 2018-10-31 2021-09-14 Fanuc Corporation Display system, machine learning device, and display device
DE112019006825T5 (de) * 2019-03-07 2021-10-28 Mitsubishi Electric Corporation Vorrichtung für maschinelles Lernen, numerische Steuerungseinheit, Störungsvorhersagevorrichtung und Steuerungssystem für Werkzeugmaschinen
US11348573B2 (en) 2019-03-18 2022-05-31 Apple Inc. Multimodality in digital assistant systems
JP7000376B2 (ja) 2019-04-23 2022-01-19 ファナック株式会社 機械学習装置、予測装置、及び制御装置
US11307752B2 (en) 2019-05-06 2022-04-19 Apple Inc. User configurable task triggers
DK201970509A1 (en) 2019-05-06 2021-01-15 Apple Inc Spoken notifications
US11140099B2 (en) 2019-05-21 2021-10-05 Apple Inc. Providing message response suggestions
US11227599B2 (en) 2019-06-01 2022-01-18 Apple Inc. Methods and user interfaces for voice-based control of electronic devices
WO2021005665A1 (ja) * 2019-07-05 2021-01-14 三菱電機株式会社 機械学習装置、ワイヤ放電加工システム、および機械学習方法
US11061543B1 (en) 2020-05-11 2021-07-13 Apple Inc. Providing relevant data items based on context
US11490204B2 (en) 2020-07-20 2022-11-01 Apple Inc. Multi-device audio adjustment coordination
US11438683B2 (en) 2020-07-21 2022-09-06 Apple Inc. User identification using headphones
US11181988B1 (en) * 2020-08-31 2021-11-23 Apple Inc. Incorporating user feedback into text prediction models via joint reward planning
JP7409343B2 (ja) * 2021-03-17 2024-01-09 横河電機株式会社 コントローラ、制御方法及び制御プログラム
CN113065796A (zh) * 2021-04-22 2021-07-02 哈尔滨理工大学 基于q-学习算法的空间桁架在轨装配策略
JP2023023455A (ja) * 2021-08-05 2023-02-16 横河電機株式会社 学習装置、学習方法、および、学習プログラム、並びに、制御装置
CN114918736B (zh) * 2022-06-13 2023-11-21 重庆大学 一种适用于难加工材料的智能工艺***

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0991025A (ja) * 1995-09-26 1997-04-04 Fanuc Ltd 動作デューティを考慮したロボットの最短時間制御方法
SE9703758D0 (sv) * 1997-10-15 1997-10-15 Asea Brown Boveri Metod och förfarande för processkontroll vid tillverkning av papper, massa eller board
US6529135B1 (en) 1999-10-12 2003-03-04 Csi Technology, Inc. Integrated electric motor monitor
JP2002355724A (ja) 2001-05-31 2002-12-10 Ricoh Co Ltd 組立分解工程設計支援装置
DE10144459A1 (de) 2001-09-10 2003-04-03 Werner Kluft Überwachung von Werkzeugmaschinen-Komponenten mit einem Überwachungssystem
JP2003136115A (ja) * 2001-10-30 2003-05-14 Kawasaki Steel Corp 圧延機の圧延制御方法
JP2003208205A (ja) * 2002-01-15 2003-07-25 Okuma Corp 数値制御装置
JP4461371B2 (ja) 2004-08-06 2010-05-12 マツダ株式会社 工作機械の加工条件設定方法、その加工条件設定プログラム、及び、その加工条件設定プログラムを記録した記録媒体
JP4472506B2 (ja) 2004-12-15 2010-06-02 学校法人早稲田大学 情報処理システムおよび情報処理方法、並びにプログラム
ES2378000T3 (es) 2008-02-25 2012-04-04 EXPERT-TÜNKERS GmbH Mesa giratoria con una unidad de control o regulación asociada
CN101738981B (zh) 2009-12-04 2011-06-15 清华大学 基于机器学习的机器人磨削方法
JP5276700B2 (ja) 2011-09-21 2013-08-28 ファナック株式会社 電動機の巻線過熱防止装置および電動機の制御装置
US9509131B2 (en) * 2012-08-03 2016-11-29 Mitsubishi Electric Corporation Numerical control apparatus
JP6234187B2 (ja) * 2013-11-27 2017-11-22 三菱電機株式会社 数値制御装置
CN103823409B (zh) 2014-02-27 2016-08-17 电子科技大学 数控机床加工状态多参数在线主动监控***及其实现方法

Also Published As

Publication number Publication date
CN106557070A (zh) 2017-04-05
DE102016011528B4 (de) 2019-08-01
DE102016011528A1 (de) 2017-03-30
CN106557070B (zh) 2018-10-16
JP2017068563A (ja) 2017-04-06
US20170090428A1 (en) 2017-03-30
US10289075B2 (en) 2019-05-14

Similar Documents

Publication Publication Date Title
JP6235543B2 (ja) 加工機のサイクル加工時間を最適化する機械学習装置、モータ制御装置、加工機、および機械学習方法
JP6063016B1 (ja) 電動機に対する動作指令を学習する機械学習方法および機械学習装置並びに該機械学習装置を備えた工作機械
JP6470251B2 (ja) 数値制御装置及び機械学習装置
JP6457472B2 (ja) 制御システム及び機械学習装置
JP6457563B2 (ja) 数値制御装置及び機械学習装置
JP6680756B2 (ja) 制御装置及び機械学習装置
JP6619192B2 (ja) 移動軸異常負荷警告機能を有するワイヤ放電加工機
US10962960B2 (en) Chip removal apparatus and information processing apparatus
JP2018202564A (ja) 制御装置及び機械学習装置
JP6348098B2 (ja) 機械学習を使った中子の溶着位置決定機能を備えたワイヤ放電加工機のシミュレーション装置
JP6490124B2 (ja) レーザ加工装置および機械学習装置
JP6557285B2 (ja) 制御装置及び機械学習装置
JP6659652B2 (ja) 加工条件調整装置及び機械学習装置
JP6457369B2 (ja) パラメータを自動調整する機能を有する機械学習装置及び電動機制御装置
JP6077617B1 (ja) 最適な速度分布を生成する工作機械
JP6841852B2 (ja) 制御装置及び制御方法
JP2019185125A (ja) 制御装置及び機械学習装置
JP6767416B2 (ja) 加工条件調整装置及び機械学習装置
US11897066B2 (en) Simulation apparatus
CN109725597B (zh) 测试装置以及机器学习装置
JP6412086B2 (ja) 数値制御装置
JP6940425B2 (ja) 制御装置及び機械学習装置
JP6799047B2 (ja) 暖機運転評価装置、暖機運転評価方法及び暖機運転評価プログラム

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170201

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170509

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170630

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20171003

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20171026

R150 Certificate of patent or registration of utility model

Ref document number: 6235543

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150