JP6880350B1

JP6880350B1 - 学習装置、放電加工機および学習方法

Info

Publication number: JP6880350B1
Application number: JP2021507102A
Authority: JP
Inventors: 聡昭黒川; 森田　一成; 一成森田; 貴弘塩澤
Original assignee: Mitsubishi Electric Corp
Current assignee: Mitsubishi Electric Corp
Priority date: 2020-09-15
Filing date: 2020-09-15
Publication date: 2021-06-02
Anticipated expiration: 2040-09-15
Also published as: CN116033991A; WO2022059069A1; JPWO2022059069A1

Abstract

学習装置（２３）は、目的の加工品についての情報および放電加工機で用いられる電極についての情報を含む加工対象物情報と、被加工物を目的の加工品に形彫放電加工する際に用いた加工条件と、加工条件で形彫放電加工された被加工物の加工面の加工面質を示す評価指標の値とを含む学習用データを取得するデータ取得部（２３１）と、学習用データを用いて、加工対象物情報から、加工面の加工面質が向上するような加工条件を推論するための学習済モデルを生成するモデル生成部（２３２）と、を備える。

Description

本開示は、形彫放電加工に適用される学習装置、放電加工機および学習方法に関する。

放電加工機は、加工電圧、加工パルス、加工屑の排出動作といった加工条件に従って、被加工物と電極との間隙において放電を発生させることによって被加工物を加工する。放電加工した結果、加工面に形成される放電痕の発生状況は、加工条件によって変化する。放電痕は、加工面が１発のパルス放電により除去された際に、加工面上に形成されるクレータ状のくぼみである。放電痕の形状は、パルス放電の電気条件、電極、被加工物の材質および被加工物が浸漬された加工液中の加工屑の濃度によって異なる。

特許文献１には、加工液全体の体積抵抗率を推定することによって、放電加工時における一定時間内での平均的な放電電圧が新品加工液を用いた放電電圧と同じになるための放電電流を求め、求められた放電電流に対応した加工条件を求める放電加工機が記載されている。

特許文献１に記載の放電加工機は、所望の放電痕よりも大きく加工面に形成された放電痕であるピットの発生の全体量を抑制できる。ここで、「所望の放電痕」は、目標とする放電痕径を中心としてある一定範囲内の放電痕径を有する放電痕の分布を意味する。また、「所望の放電痕よりも大きく」とは、理想的な放電痕径の分布における相対的に放電痕径が大きい放電痕の数が多い方向に外れること、および理想的な放電痕径の分布から放電痕径が大きい方向に外れること、を意味する。

特開２００５−２０５５７４号公報

しかしながら、放電加工では、ピットの発生数を抑制するだけでなく、加工面の面粗さの均一性および加工面に形成された放電痕の大きさの均一性を示す加工面質も重要である。加工面質は、加工面に発生した放電痕の大きさのばらつき、または加工面における放電痕の発生位置の偏りで示すことができる。しかし、特許文献１に記載の放電加工機は、加工面におけるピットの発生の全体量を抑制できても、加工面における放電痕の大きさのばらつきを抑制することはできない。また、特許文献１に記載の放電加工機は、加工面における放電痕の発生位置の偏りを抑制することはできない。すなわち、特許文献１に記載の放電加工機では、加工面質を向上させることができる放電加工の適正な加工条件は得られない。

本開示は、上記に鑑みてなされたものであって、加工面質を向上させることができる、放電加工の適正な加工条件を学習できる学習装置を得ることを目的とする。

上述した課題を解決し、目的を達成するために、本開示にかかる学習装置は、放電加工機における被加工物の形彫放電加工の際に用いられる加工条件を学習する学習装置である。学習装置は、目的の加工品についての情報および放電加工機で用いられる電極についての情報を含む加工対象物情報と、被加工物を目的の加工品に形彫放電加工する際に用いた加工条件と、加工条件で形彫放電加工された被加工物の加工面の加工面質を示す評価指標の値とを含む学習用データを取得するデータ取得部と、学習用データを用いて、加工対象物情報から、加工面の加工面質が向上するような加工条件を推論するための学習済モデルを生成するモデル生成部と、を備える。評価指標は、形彫放電加工された加工面の画像から取得される加工面における予め決められた大きさの放電痕よりも大きな放電痕の分布に基づいて加工面の加工面質を評価した加工面質データである。

本開示にかかる学習装置は、加工面質を向上させることができる放電加工の適正な加工条件を学習できる、という効果を奏する。

実施の形態１にかかる放電加工機の構成を示す図実施の形態１にかかる制御装置の構成を示す図実施の形態１にかかる学習装置の構成を示す図実施の形態１にかかる推論装置の構成を示す図実施の形態１にかかる放電加工機により放電加工された被加工物の加工面における、放電痕径の分布の一例と放電痕径の理想的な分布とを示す分布図実施の形態１にかかる学習装置による学習処理の処理手順を示すフローチャート実施の形態１にかかる推論装置による推論処理および実施の形態１にかかる制御装置による制御処理の処理手順を示すフローチャート実施の形態２における放電加工機の学習装置の構成を示す図実施の形態２における放電加工機による加工液中での形彫放電加工における極間距離制御およびジャンプ動作制御を説明するための図実施の形態２における放電加工機による加工液中での形彫放電加工における、加工面の面内方向における加工面と電極との間の加工屑の分布の不均一性と、ジャンプ動作の加工屑排出効果との関係性を示す特性図実施の形態２における加工面不均一パターンの例を示す図実施の形態２における加工面不均一パターンの例を示す図実施の形態２における加工面不均一パターンを記憶した加工面質データ算出部を示す図実施の形態２において分割した加工面画像の領域における第１の加工面質データを示す図実施の形態２において加工面画像の分割領域における第１の加工面質データと加工面不均一パターンの画像を重ね合わせた状態を示す図実施の形態２における学習装置による学習処理の処理手順を示すフローチャート実施の形態２における学習装置による他の学習処理の処理手順を示すフローチャート実施の形態１，２にかかる加工条件設定部を実現するハードウェア構成例を示す図

以下に、実施の形態にかかる学習装置、放電加工機および学習方法を図面に基づいて詳細に説明する。

実施の形態１．
図１は、実施の形態１にかかる放電加工機の構成を示す図である。放電加工機１は、形彫放電加工を行う装置である。放電加工機１は、加工電極である電極Ｅと被加工物１７との間に高周波パルス電圧を印加することで、加工対象となる被加工物１７と電極Ｅとの間に放電を発生させて形彫放電加工を実行する装置である。なお、以下の説明では、被加工物１７への形彫放電加工を、単に放電加工と呼ぶ場合がある。

放電加工機１は、ベッド１９と、制御装置２と、駆動部１２と、表示部１３と、定盤１８とを備えている。放電加工機１は、制御装置２の制御に従って、駆動部１２に取り付けられた電極Ｅを用いて、ベッド１９上の定盤１８に載せられた被加工物１７を加工する。電極Ｅは、被加工物１７に対向する位置に配置される。

制御装置２は、機械制御部１４と、電源制御部１５と、加工条件設定部１６とを有している。機械制御部１４と電源制御部１５とにより、放電加工機１が形彫放電加工を行う動作である形彫放電加工動作を制御する制御部が構成される。

機械制御部１４および電源制御部１５は、制御対象を制御する制御部である。機械制御部１４の制御対象は駆動部１２等であり、電源制御部１５の制御対象は電力である。

機械制御部１４は、加工条件設定部１６から送られてくる加工条件に基づいて、駆動部１２の位置等を制御する。機械制御部１４は、駆動部１２を制御することによって、電極Ｅと被加工物１７との間に放電が発生するよう、電極Ｅと被加工物１７との間隔を制御する。

電源制御部１５は、加工条件設定部１６から送られてくる加工条件に基づいて、電極Ｅと被加工物１７との間に供給する電力を制御する。すなわち、電源制御部１５は、電極Ｅと被加工物１７との間の放電を制御する。

加工条件設定部１６は、後述する加工面質データに基づいて加工条件を設定する。加工条件設定部１６は、放電加工において駆動部１２等を制御するための加工条件を指示する指令を機械制御部１４に送り、放電加工において電極Ｅと被加工物１７との間に供給する電力を制御するための加工条件を指示する指令を電源制御部１５に送る。

機械制御部１４は、加工条件設定部１６から送られてくる指令に基づいて、駆動部１２等を制御する。電源制御部１５は、加工条件設定部１６から送られてくる指令に基づいて、電極Ｅと被加工物１７との間に供給する電力を制御する。

駆動部１２は、機械制御部１４から送られてくる指令に従ってＸ方向、Ｙ方向、およびＺ方向に移動する。本実施の形態では、Ｚ方向が鉛直方向であり、ＸＹ平面が水平面である場合について説明する。

表示部１３は、加工条件設定部１６から送られてくる種々の情報を表示する。表示部１３の例は、液晶モニタである。表示部１３は、例えば、加工条件設定部１６が後述する加工面の画像から算出した加工面質データ、評価指標の値、加工条件設定部１６が修正した加工条件等を表示する。なお、表示部１３は、機械制御部１４および電源制御部１５から送られてくる情報を表示してもよい。

図２は、実施の形態１にかかる制御装置の構成を示す図である。図２では、制御装置２の構成要素である加工条件設定部１６、機械制御部１４および電源制御部１５に加えて、表示部１３を図示している。図３は、実施の形態１にかかる学習装置の構成を示す図である。図４は、実施の形態１にかかる推論装置の構成を示す図である。

加工条件設定部１６は、入力部２１と、加工面質データ算出部２２と、学習装置２３と、学習済モデル記憶部２４と、推論装置２５と、加工条件記憶部２６と、加工条件出力部２７と、を備える。放電加工機１では、加工面質データ算出部２２と、学習装置２３と、学習済モデル記憶部２４と、推論装置２５とにより、加工条件を修正する加工条件修正部２８が構成されている。

入力部２１は、被加工物１７が放電加工される際に用いられる加工対象物情報と加工条件と加工面の画像情報とを受付ける。加工面の画像情報は、加工面の画像の情報である。入力部２１は、加工対象物情報と加工条件とを、学習装置２３と加工条件記憶部２６とに送信する。また、入力部２１は、加工対象物情報を推論装置２５と加工条件出力部２７とに送信する。また、入力部２１は、加工面の画像情報を加工面質データ算出部２２に送信する。

加工対象物情報と加工条件と加工面の画像情報とは、放電加工機１の外部から入力部２１に入力される。また、放電加工機１は、放電加工された被加工物１７の加工面を撮影することによって加工面の画像情報を取得する不図示の画像情報取得部を備えてもよい。この場合、画像情報取得部において取得された加工面の画像情報が、入力部２１に入力される。画像情報取得部には、カメラなどの撮影機器が用いられる。また、加工面の画像情報は、放電加工後に放電加工機１から取り外された被加工物１７の加工面を、作業者がカメラなどの撮影機器を用いて撮影することによって取得されてもよい。この場合、撮影機器を用いて作業者によって取得された加工面の画像情報が、入力部２１に入力される。

加工対象物情報は、被加工物１７を放電加工することによって得られる目的の加工品についての情報および放電加工機１で用いられる工具である電極Ｅについての情報を含む情報である。また、加工対象物情報は、被加工物１７の放電加工において用いられる情報のうち、放電加工機１で直接制御できないパラメータの情報である。加工対象物情報には、例えば被加工物１７の材質である加工材質、被加工物１７の加工前形状と加工仕上がり形状、電極Ｅの形状、電極Ｅの材質、加工面の面粗さの目標値、放電痕の形状、放電痕径の目標値が含まれる。

加工条件は、被加工物１７を目的の加工品に形彫放電加工する際に用いられる条件である。また、加工条件は、被加工物１７の放電加工において用いられる情報のうち、放電加工時に用いられる加工の条件であり、放電加工機１で直接制御できるパラメータの設定情報である。すなわち、加工条件は、機械制御部１４と、電源制御部１５とに与える制御条件であり、推論装置２５に加工対象物情報が入力されることによって生成される、電源制御条件および機械制御条件である。加工条件には、例えば加工に使用する高周波パルスの電気条件と、電極Ｅの位置を規定した位置条件とが含まれる。

電気条件には、パルス幅、パルスの休止時間、電圧値、電流値などが含まれる。ジャンプ動作条件には、電極Ｅの移動高さ、電極Ｅの移動速度、電極Ｅの移動加速度、電極Ｅの引き上げ経路、電極Ｅの戻り位置、電極Ｅのジャンプ動作から次のジャンプ動作までの間の時間間隔であるダウンタイムなどが含まれる。

位置条件には、電極ＥのＸ座標、Ｙ座標、およびＺ座標が含まれている。Ｘ座標およびＹ座標は、加工対象物情報により導き出される加工位置に対応し、Ｚ座標は、加工対象物情報により導き出される加工深さに対応している。位置条件には、加工位置、加工深さ、複数の加工条件を組み合わせて加工する際の寄せ量の条件、加工屑排出動作の条件であるジャンプ動作条件、加工に必要な駆動制御条件が含まれる。加工に必要な駆動制御条件は、ジャンプ動作時以外に加工しているときの電極Ｅの軸の設定条件であり、極間電圧制御中の電極Ｅの軸の設定条件である。

なお、入力部２１へは、これら以外の、被加工物１７の放電加工において用いられる情報が入力されてもよい。加工内容によって、電極Ｅの電極本数、電極Ｅの情報、被加工物１７の情報、電極Ｅの位置を補正するための情報、電極Ｅの移動方法、ジャンプ動作方法などが異なるので、加工内容毎に種々の情報が入力部２１に入力される。

加工条件において用いられる位置の情報は、Ｘ軸、Ｙ軸、Ｚ軸の３軸方向における位置で指定される。加工位置は、電極ＥのＸＹ平面内における位置である。加工位置は、被加工物１７の上面における位置に対応しており、被加工物１７の中心位置に対する電極Ｅの中心位置で示される。加工深さは、被加工物１７への加工の深さである。加工深さは、被加工物１７の加工前の上面からの距離で示される。

加工条件記憶部２６は、加工対象物情報に対応付けされた加工条件を記憶する。加工条件記憶部２６は、記憶している加工条件を、同じ加工対象物情報に対応付けされて推論装置２５から送信された加工条件で更新する。加工条件記憶部２６は、推論装置２５から加工条件が送信されるたびに同一の加工対象物情報に対応付けされた加工条件を更新する。

加工条件出力部２７は、入力部２１から送信された加工対象物情報に対応する加工条件を加工条件記憶部２６から読み出す。すなわち、加工条件出力部２７は、加工対象物情報に対応付けされている、更新された最新の加工条件を加工条件記憶部２６から読み出す。加工条件出力部２７は、加工条件のうちの位置条件を機械制御部１４に出力し、加工条件のうちの電気条件を電源制御部１５に出力する。

形彫放電加工では、Ｚ方向の加工が行われながら、ＸＹ平面内での移動加工が行われる。この場合において、電極Ｅの縮小代が大きいほど、ＸＹ平面内での移動加工時におけるＸ方向およびＹ方向への電極Ｅの移動量が大きくなる。移動加工での電極Ｅは、被加工物１７のＸＹ平面内での中心位置、すなわち電極ＥのＸＹ平面内における初期位置での中心位置から、プラスＸ方向、プラスＹ方向、マイナスＸ方向、またはマイナスＹ方向に移動する。形彫放電加工では、例えば、深さ方向への加工と同時に、深さ方向に垂直な２次元平面方向への移動加工が行われる。また、形彫放電加工では、深さ方向への加工と同時に、任意の方向への移動加工が行われてもよい。放電加工では、例えば、半球体などの表面に沿った方向に移動加工されてもよい。

加工面質データ算出部２２は、放電加工された被加工物１７の加工面１７ａを撮影した画像から加工面質データを算出する。加工面質データ算出部２２は、加工面質データを学習装置２３に送信する。以下では、放電加工された被加工物１７の加工面１７ａを撮影した画像を、加工面画像と呼ぶ場合がある。加工面画像は、放電加工が完了して放電加工機１から取り外された被加工物１７の加工面１７ａが撮影された画像である。加工面画像は、放電加工された被加工物１７の加工面１７ａに形成された放電痕の大きさ、すなわち放電痕の直径を、判別可能な画像である。なお、加工面画像は、必ずしも放電加工された被加工物１７の加工面１７ａの全体が撮影されて無くてもよく、加工面１７ａを偏り無く均一に取得してあればよく、加工面１７ａの一部が均一に間引かれていてもよい。また、加工面画像は、加工面１７ａが対称的な形状の領域を有する場合には、対称的な形状の領域のうち一方の領域について取得されていれば、対称的な形状の領域のうち他方の領域については取得が省略されてもよい。また、ここでは、加工面画像は、加工面１７ａに形成された放電痕の深さを判別可能な画像であってもよい。深さは、加工面１７ａの表面からの深さである。なお、放電痕の大きさが大きくなると、放電痕の深さも深くなる。

加工面質とは、被加工物１７の加工面１７ａに形成された放電痕の均一性であり、より具体的には、加工面１７ａの面粗さの均一性および加工面１７ａに形成された放電痕の大きさの均一性である。すなわち、加工面１７ａの加工面質が高い状態は、加工面１７ａの面粗さの均一性および加工面１７ａに形成された放電痕の大きさの均一性が高い状態である。また、加工面１７ａの加工面質が低い状態は、加工面１７ａの面粗さの均一性および加工面１７ａに形成された放電痕の大きさの均一性が低い状態、加工面１７ａの面粗さおよび加工面１７ａに形成された放電痕の大きさが不均一な状態である。

加工面質データは、放電加工が完了した被加工物１７の加工面１７ａの加工面質を定量的に評価した評価結果である。すなわち、加工面質データ算出部２２は、放電加工された被加工物１７の加工面１７ａの加工面質を、加工面１７ａの画像から算出して定量化する。本実施の形態１では、放電加工された被加工物１７の加工面１７ａに形成された放電痕の大きさおよび放電痕の数から算出した、放電痕径の分布の差を定量化したデータを加工面質データとして用いる。なお、放電痕をピットとして扱うかどうかは、加工面１７ａに要求される加工面質、すなわち加工面１７ａの均一性に依る。

以下では、放電加工された被加工物１７の加工面１７ａに形成された放電痕の大きさおよび放電痕の数から算出された放電痕径の分布の差を定量化したデータを第１の加工面質データと呼ぶ。ここでは、同じ加工対象物情報の被加工物１７に対して、加工中に発生する加工屑の加工面１７ａにおける不均一が無い状態で加工した場合の放電加工が完了した被加工物１７の加工面１７ａの放電痕径の分布である理想的な放電痕径の分布と、加工対象物情報に対応する任意の加工条件で加工した場合の放電加工が完了した被加工物１７の加工面１７ａの放電痕径の分布である実際の放電痕径の分布との差を、第１の加工面質データとして、使用する。すなわち、第１の加工面質データは、形彫放電加工された加工面１７ａの画像から取得される加工面１７ａにおける予め決められた大きさの放電痕よりも大きな放電痕の分布に基づいて加工面１７ａの加工面質を評価した加工面質データである。

図５は、実施の形態１にかかる放電加工機により放電加工された被加工物の加工面における、放電痕径の分布の一例と放電痕径の理想的な分布とを示す分布図である。以下では、放電加工機１により放電加工された被加工物１７の加工面１７ａの放電痕径の分布の一例を、分布ｇ（ｒ）と呼ぶ場合がある。また、放電加工機１により放電加工された被加工物１７の加工面１７ａの放電痕径の理想的な分布を、分布ｆ（ｒ）と呼ぶ場合がある。図５における分布ｆ（ｒ）および分布ｇ（ｒ）は、放電加工された被加工物１７の加工面１７ａを撮影した画像から算出されている。

図５において、横軸は、放電加工された被加工物１７の加工面画像から取得された、被加工物１７の加工面１７ａに形成された放電痕径を示している。ここでの放電痕径は、被加工物１７の加工面１７ａに形成された放電痕の直径である。図５において、縦軸は、放電加工された被加工物１７の加工面画像から取得された、被加工物１７の加工面１７ａに形成された放電痕の数を示している。

分布ｆ（ｒ）は、電気条件毎に、被加工物１７の加工面１７ａを、加工中に発生する加工屑の加工面１７ａにおける不均一が無い状態で加工した場合の放電痕径の分布である。図５においては、分布ｆ（ｒ）を実線で示している。また、図５においては、分布ｇ（ｒ）を破線で示している。分布ｇ（ｒ）は、放電痕径がｇ０以下では、分布ｆ（ｒ）と同じ分布を有する。

被加工物１７の加工面１７ａに対して加工面質が良い加工が実施された場合には、加工面１７ａの放電痕径の分布は、図５において実線で示す分布ｆ（ｒ）のような正規分布になる。図５において、分布ｆ（ｒ）における放電痕径の中心は、被加工物１７の放電加工において発生する放電痕径として予め想定されて設定されている放電痕径設定値ｃである。すなわち、放電痕径設定値ｃは、使用した加工条件において加工面１７ａに発生すると想定されている理想的な放電痕径である。

一方、被加工物１７の加工面１７ａに対して加工面質が悪い加工が実施された場合には、加工面１７ａの放電痕径の分布は、図５において破線で示す分布ｇ（ｒ）のように、放電痕径の大きい領域の放電痕が増加し、また、放電痕径の大きい放電痕が散在する。図５における分布ｇ（ｒ）の領域（ｉ）では、分布ｆ（ｒ）における相対的に放電痕径の大きい放電痕が多くなり、また分布ｆ（ｒ）よりも放電痕径が大きい放電痕が分布ｆ（ｒ）の末端部分に存在している。図５における分布ｇ（ｒ）の領域（ｉｉ）では、領域（ｉ）よりもさらに放電痕径の大きい放電痕が局所的に集中して散在している。

形彫放電加工では、放電による熱エネルギーが弱い加工条件で加工するほど、加工面１７ａの面粗さおよび放電痕の大きさが小さくなる。しかしながら、放電による熱エネルギーが弱い加工条件で加工を行う場合は、加工時間が長くなる。このため、一般的に、放電による熱エネルギーが強い加工条件で加工が開始される。その後、放電による熱エネルギーが弱い加工条件に、段階的に加工条件が変更される。そして、最終的には、目的の面粗さを得ることができる、放電による熱エネルギーが弱い加工条件で加工が実施される。

また、形彫放電加工では、放電による熱エネルギーが強いほど、電極Ｅと被加工物１７との間の間隙を大きくする。このため、放電による熱エネルギーが強い加工条件から放電による熱エネルギーが弱い加工条件に切り替える際には、放電による熱エネルギーが強い加工条件での電極Ｅと被加工物１７との間の間隙と放電による熱エネルギーが弱い加工条件での電極Ｅと被加工物１７との間の間隙との差以上に、電極Ｅと被加工物１７との距離を近づける必要がある。

このように放電による熱エネルギーが強い加工条件での電極Ｅと被加工物１７との間の間隙から、放電による熱エネルギーが弱い加工条件での電極Ｅと被加工物１７との間の間隙に切り替える際に、電極Ｅを被加工物１７に向けて動かす量、すなわち電極Ｅと被加工物１７との距離を近づける量を寄せ量と呼ぶ。寄せ量が不足している場合には、放電による熱エネルギーが強い加工条件で加工面１７ａに形成された放電痕が残ってしまう。この場合、本来、放電による熱エネルギーが弱い加工条件で加工面１７ａに形成される放電痕の放電痕径よりも大きな放電痕が残り、加工面１７ａの面粗さが粗くなる。

このため、形彫放電加工では、加工条件における高周波パルス電圧の電圧値および電流値を調整して放電による熱エネルギーを段階的に弱くして加工を進める際の、加工条件の切替時の寄せ量が不適切な場合には、加工条件を切り替える前の加工条件で形成された放電痕が残ってしまうことにより、図５における分布ｇ（ｒ）の領域（ｉ）のピットが発生する。

また、電極Ｅと被加工物１７との間に印加する高周波パルスの条件および加工屑排出条件のうち少なくとも一方が不適切である場合は、集中放電が発生することにより、放電痕径設定値ｃよりも極端に大きな放電痕径を有する放電痕が形成され、図５における分布ｇ（ｒ）の領域（ｉｉ）のピットが発生する。このようなピットの放電痕径は、例えば放電痕径設定値ｃの１０倍から２０倍に達する場合もある。このように、加工面１７ａに形成されるピットには、発生要因および大きさが異なるピットが存在する。

そこで、加工面質データ算出部２２は、図５の分布ｆ（ｒ）および分布ｇ（ｒ）のように、加工面１７ａに形成された放電痕の放電痕径の分布図を加工面画像から生成し、放電痕の放電痕径の分布図から第１の加工面質データを算出する。加工面質データ算出部２２は、以下の式（１）を用いて図５の分布図から第１の加工面質データを算出する。

式（１）において、ｒは、分布ｇ（ｒ）におけるｇ０以降の放電痕径と放電痕径設定値ｃとの差である。また、「ｇ（ｒ）−ｆ（ｒ）」の演算は、放電痕径の分布が理想的ではない場合の放電痕径の分布と、放電痕径の分布が理想的である場合の放電痕径の分布との差を求めている。例えばｆ（ｒ）の分布曲線が横軸と接する部分である、放電痕径がｇ１である位置について考える。例えば、ｇ１の位置におけるｇ（ｒ）の放電痕径の数が５０であり、ｇ１の位置におけるｆ（ｒ）の放電痕径の数が０であるとすると、ｇ（ｒ）−ｆ（ｒ）＝５０である。

式（１）により算出される第１の加工面質データの値は、加工面１７ａの加工面質が悪いほど大きい値となり、加工面１７ａの加工面質が良いほど小さい値となる。

放電痕径が大きいピットは、放電加工が異常な状態のとき発生する。放電痕径が小さいピットは、寄せ量が適切でないときに発生する。このように加工面１７ａには、発生要因および大きさの異なるピットが存在する。式（１）により算出される第１の加工面質データの値は、加工面１７ａの加工面質が悪いほど大きい値となるため、第１の加工面質データの値が極端に大きい場合は、放電加工機１自体の状態が異常であるか、または加工条件が著しく不適切であることが予測される。このため、放電加工機１自体の状態の適正化、または加工条件の適正化を行うことで、放電痕の径が著しく大きい領域（ｉｉ）のピットを無くすことができる。

また、第１の加工面質データの値が極端に大きくない場合は、寄せ量が不適切であることに起因する、領域（ｉ）の比較的小さいピットを少なくするための適正化を学習装置２３で行うことで、ピットの発生を抑制して加工面１７ａの均一性を向上させることができる。

なお、加工面質データは、被加工物１７の加工面１７ａの加工結果の評価を示す評価指標の値であるので、加工面質データ算出部２２は、被加工物１７の加工面１７ａの加工結果の評価を示す評価指標の値を算出する評価算出部と換言できる。被加工物１７の加工面１７ａの加工結果の評価は、形彫放電加工された被加工物１７の加工面１７ａに形成された放電痕の均一性の評価である。したがって、加工面質データは、形彫放電加工された被加工物１７の加工面１７ａに形成された放電痕の均一性の評価を示す評価指標の値である。

加工面質データ算出部２２は、算出した第１の加工面質データを学習装置２３に送信する。なお、加工面質データ算出部２２は、学習装置２３の内部に配置することも可能であり、放電加工機１の外部に配置することも可能である。

学習装置２３は、実際の加工に用いられた加工条件と、この加工条件を用いた放電加工で取得された加工結果とに基づいて、目標の加工面質を実現することができる加工条件を学習する。本実施の形態では、加工結果は、加工面１７ａの加工面質である場合について説明する。

＜学習フェーズ＞
学習装置２３は、実際の加工に用いられた加工条件と、実際の加工で取得された加工面質データとに基づいて学習済モデル３０を生成するコンピュータであり、加工面１７ａの加工面質を良くすることができる加工条件を学習する。学習済モデル記憶部２４は、学習装置２３が生成した学習済モデル３０を記憶する。なお、学習済モデル記憶部２４は、学習装置２３の内部に配置してもよい。また、学習装置２３および学習済モデル記憶部２４は、放電加工機１の外部に配置することも可能である。

学習装置２３は、データ取得部２３１と、モデル生成部２３２とを備えている。

データ取得部２３１は、加工対象物情報と、加工条件と、加工面質データとを学習用データとして取得する。実施の形態１では、データ取得部２３１が、加工対象物情報と、加工条件と、第１の加工面質データとを学習用データとして取得する場合について説明する。

モデル生成部２３２は、加工対象物情報と、加工条件と、第１の加工面質データとを含む学習用データに基づいて、加工条件を学習する。すなわち、モデル生成部２３２は、加工対象物情報と加工面質データとから、被加工物１７の加工面１７ａの加工面質が向上するような加工条件を推論するための学習済モデル３０を生成する。

モデル生成部２３２が用いる学習アルゴリズムは教師あり学習、教師なし学習、強化学習等の公知のアルゴリズムを用いることができる。一例として、強化学習（Reinforcement Learning）を適用した場合について説明する。強化学習では、ある環境内におけるエージェント（行動主体）が、現在の状態（環境のパラメータ）を観測し、取るべき行動を決定する。エージェントの行動により環境が動的に変化し、エージェントには環境の変化に応じて報酬が与えられる。エージェントはこれを繰り返し、一連の行動を通じて報酬が最も多く得られる行動方針を学習する。強化学習の代表的な手法として、Ｑ学習（Q−learning）、およびＴＤ学習（TD−learning）が知られている。例えば、Ｑ学習の場合、行動価値関数Ｑ（ｓ，ａ）の一般的な更新式は以下の式（２）で表される。

式（２）において、ｓ_tは時刻ｔにおける環境を表し、ａ_tは時刻ｔにおける行動を表す。行動ａ_tにより、状態（環境）はｓ_t+1に変わる。ｒ_t+1はその状態の変化によってもらえる報酬を表し、γは割引率を表し、αは学習係数を表す。なお、γは０＜γ≦１、αは０＜α≦１の範囲とする。加工条件が行動ａ_tとなり、加工対象物情報と加工面質データとが状態ｓ_tとなり、学習装置２３は、時刻ｔの状態ｓ_tにおける最良の行動ａ_tを学習する。

式（２）で表される更新式は、時刻ｔ＋１における最もＱ値の高い行動ａの行動価値Ｑが、時刻ｔにおいて実行された行動ａの行動価値Ｑよりも大きければ、行動価値Ｑを大きくし、逆の場合は、行動価値Ｑを小さくする。換言すれば、学習装置２３は、時刻ｔにおける行動ａの行動価値Ｑを、時刻ｔ＋１における最良の行動価値Ｑに近づけるように、行動価値関数Ｑ（ｓ，ａ）を更新する。それにより、ある環境における最良の行動価値Ｑが、それ以前の環境における行動価値Ｑに順次伝播していくようになる。

上記のように、モデル生成部２３２が強化学習によって学習済モデル３０を生成する場合、モデル生成部２３２は、報酬計算部２３３と、関数更新部２３４とを有している。

報酬計算部２３３は、加工条件および評価指標の値である加工面質データに基づいて、加工条件の報酬ｒを計算する。例えば、報酬計算部２３３は、加工面質データが小さい場合には報酬ｒを増大させ（例えば「１」の報酬を与える。）、他方、加工面質データが大きい場合には報酬ｒを低減する（例えば「−１」の報酬を与える。）。報酬計算部２３３は、第１の加工面質データと比較することによって、適用した加工条件に対する報酬を増加させるか、または報酬を減じるかを判断するための基準値である第１閾値３１を記憶している。第１閾値３１は、ユーザが制御装置２に値を設定することにより、任意の値に変更可能である。

関数更新部２３４は、報酬に基づいて、次回の加工条件である行動を決定するための関数を更新する。すなわち、関数更新部２３４は、学習済モデル３０を更新する。関数更新部２３４は、報酬計算部２３３によって計算される報酬に従って、加工条件を決定するための関数を更新し、学習済モデル記憶部２４に出力する。例えばＱ学習の場合、関数更新部２３４は、式（２）で表される行動価値関数Ｑ（ｓ_t，ａ_t）を加工条件を算出するための関数として用いる。行動価値関数Ｑ（ｓ_t，ａ_t）は、加工条件を算出するための加工条件生成関数といえる。

学習装置２３は、以上のような学習を繰り返し実行する。学習済モデル記憶部２４は、関数更新部２３４によって更新された行動価値関数Ｑ（ｓ_t，ａ_t）、すなわち、学習済モデル３０を記憶する。

つぎに、図６を用いて、学習装置２３が学習する処理の処理手順について説明する。図６は、実施の形態１にかかる学習装置による学習処理の処理手順を示すフローチャートである。

データ取得部２３１は、加工対象物情報と、加工条件と、第１の加工面質データとを第１の学習用データとして取得する（ステップＳ１１０）。

モデル生成部２３２は、加工対象物情報と、加工条件と、第１の加工面質データとに基づいて、適用した加工条件に対する報酬を計算する（ステップＳ１２０）。具体的には、報酬計算部２３３は、第１の加工面質データを取得し、予め定められた報酬基準である第１閾値３１に基づいて、適用した加工条件に対する報酬を増加させるか、または報酬を減じるかを判断する。報酬計算部２３３は、第１の加工面質データが第１閾値３１未満である場合に、適用した加工条件に対する報酬を増加させると判断する。報酬計算部２３３は、第１の加工面質データが第１閾値３１以上である場合に、適用した加工条件に対する報酬を減じると判断する。

報酬計算部２３３は、第１の加工面質データが第１閾値３１未満である場合に、報酬を増やす（ステップＳ１３０）。一方、報酬計算部２３３は、第１の加工面質データが第１閾値３１以上である場合に、報酬を減らす（ステップＳ１４０）。

関数更新部２３４は、報酬計算部２３３によって計算された報酬に基づいて、学習済モデル記憶部２４が記憶する式（２）で表される行動価値関数Ｑ（ｓ_t，ａ_t）を更新する（ステップＳ１５０）。

学習装置２３は、以上のステップＳ１１０からステップＳ１５０までのステップを繰り返し実行し、生成された行動価値関数Ｑ（ｓ_t，ａ_t）を学習済モデル３０として学習済モデル記憶部２４に記憶させる。

なお、実施の形態１にかかる学習装置２３は、学習済モデル３０を学習装置２３の外部に設けられた学習済モデル記憶部２４に記憶させるものとしたが、学習済モデル記憶部２４は、学習装置２３の内部に配置されていてもよい。

本実施の形態１における加工結果の評価点である第１の加工面質データは、分布ｇ（ｒ）において分布ｆ（ｒ）よりも放電痕径が大きい放電痕径が存在するほど、値が大きくなる。また、第１の加工面質データは、分布ｆ（ｒ）において相対的に放電痕径が大きい放電痕の数が分布ｇ（ｒ）において増えるほど、値が大きくなる。したがって、学習装置２３は、第１の加工面質データを小さくする行動価値関数Ｑ（ｓ_t，ａ_t）の学習済モデル３０を生成することにより、被加工物１７の加工面１７ａの加工面質を向上させることができる加工条件、すなわち加工面１７ａの均一性を良くすることができる加工条件を推論するための加工対象物情報と加工条件との関係を学習することができる。

＜活用フェーズ＞
推論装置２５は、学習済モデル３０を用いて、加工対象物情報から加工面１７ａの加工面質を良くする加工条件を推論するコンピュータである。

推論装置２５は、データ取得部２５１と、推論部２５２とを備える。データ取得部２５１は、加工対象物情報を取得する。推論部２５２は、学習済モデル３０を用いて、加工条件を推論し、推論した加工条件を加工条件３２として加工条件記憶部２６に出力する。すなわち、推論部２５２は、学習済モデル３０にデータ取得部２５１が取得した加工対象物情報を入力することで、加工対象物情報に適した加工条件を推論することができる。なお、推論装置２５は、放電加工機１の外部に配置することも可能である。

なお、実施の形態１では、推論装置２５が、モデル生成部２３２が学習した学習済モデル３０を用いて、加工条件を推論する場合について説明したが、推論装置２５は、学習装置２３以外の他の学習装置から学習済モデル３０を取得し、この学習済モデル３０に基づいて加工条件を推論してもよい。

つぎに、図７を用いて、推論装置２５が、加工条件を推論する処理の処理手順について説明する。図７は、実施の形態１にかかる推論装置による推論処理および実施の形態１にかかる制御装置による制御処理の処理手順を示すフローチャートである。

データ取得部２５１は、加工対象物情報を推論用データとして取得する（ステップＳ２１０）。推論部２５２は、学習済モデル記憶部２４に記憶されている学習済モデル３０に、推論用データである加工対象物情報を入力し（ステップＳ２２０）、加工条件を得る。推論部２５２は、得られたデータである、加工条件を、加工条件記憶部２６に出力する（ステップＳ２３０）。

加工条件出力部２７は、加工対象物情報に対応する加工条件を加工条件記憶部２６から読み出す。加工条件出力部２７は、読み出した加工条件のうちの位置条件を機械制御部１４に出力し、読み出した加工条件のうちの電気条件を電源制御部１５に出力する。機械制御部１４および電源制御部１５は、出力された加工条件を用いて放電加工を制御する（ステップＳ２４０）。これにより、放電加工機１は、加工面１７ａの加工面質を向上させることが可能となる。

なお、実施の形態１では、推論部２５２が用いる学習アルゴリズムに強化学習を適用した場合について説明したが、これに限られるものではない。学習アルゴリズムについては、強化学習以外にも、教師あり学習、教師なし学習、又は半教師あり学習等を適用することも可能である。

また、モデル生成部２３２に用いられる学習アルゴリズムとしては、特徴量そのものの抽出を学習する、深層学習（Deep Learning）を用いることもでき、モデル生成部２３２は、他の公知の方法、例えばニューラルネットワーク、遺伝的プログラミング、機能論理プログラミング、サポートベクターマシンなどに従って機械学習を実行してもよい。

なお、学習装置２３および推論装置２５は、例えば、ネットワークを介して制御装置２に接続された、この制御装置２とは別個の装置であってもよい。また、学習装置２３および推論装置２５は、制御装置２に内蔵されていてもよい。さらに、学習装置２３および推論装置２５は、クラウドサーバ上に存在していてもよい。

また、モデル生成部２３２は、複数の制御装置２から取得される学習用データを用いて、加工条件を学習するようにしてもよい。なお、モデル生成部２３２は、同一のエリアで使用される複数の制御装置２から学習用データを取得してもよいし、異なるエリアで独立して動作する複数の制御装置２から収集される学習用データを利用して加工条件を学習してもよい。また、学習装置２３は、学習用データを収集する制御装置２を途中で対象に追加し、或いは、対象から除去することも可能である。さらに、ある制御装置２に関して加工条件を学習した学習装置２３が、この制御装置２とは別の制御装置２に適用され、当該別の制御装置２に対し、加工条件を再学習して学習済モデル３０を更新するようにしてもよい。

このように実施の形態１にかかる放電加工機１では、学習装置２３が加工条件を学習し、推論装置２５が加工条件を推論するので、ユーザによる加工条件のパラメータの調整の手間を無くすとともに被加工物１７の加工面１７ａの加工面質を向上させることができる。

形彫放電加工は、加工対象物情報が異なると、加工面質を良くする加工条件が異なるため、加工面質の良い加工面１７ａを得るための加工条件を生成することは多大な加工結果と熟練者の経験が必要であった。しかしながら、実施の形態１によれば、容易に加工面質の良い加工面１７ａを得るための加工条件を生成することが可能となる。

また、加工面１７ａにおけるピットの分布に基づいて加工面１７ａの加工面質を評価した加工面質データである第１の加工面質データを活用することで、放電加工においてピットのサイズの分布と相関の高い、加工条件の寄せ量の適正条件および高周波パルス条件の適正条件を学習することが可能となる。

したがって、実施の形態１によれば、被加工物１７の加工面１７ａの加工面質を向上させることができる、放電加工の適正な加工条件を学習できる学習装置が得られる。

実施の形態２．
図８は、実施の形態２における放電加工機の学習装置の構成を示す図である。実施の形態２においては、学習装置２３における他の学習形態について説明する。

モデル生成部２３２は、実施の形態２では、加工対象物情報と、加工条件と、後述する第２の加工面質データとを含む学習用データに基づいて、加工面１７ａの加工面質を良くすることができる加工条件を学習する。すなわち、モデル生成部２３２は、実施の形態１の場合と同様に、加工対象物情報と加工面質データとから、加工面１７ａの加工面質を良くすることができる加工条件を推論するための学習済モデル３０を生成する。

実施の形態２では、モデル生成部２３２は、第２の加工面質データと比較することによって、適用した加工条件に対する報酬を増加させるか、または報酬を減じるかを判断するための基準値である第２閾値３３を記憶している。第２閾値３３は、ユーザが制御装置２に値を設定することにより、任意の値に変更可能である。

放電加工機１を用いて加工液中で形彫放電加工を実施すると、被加工物１７の加工面１７ａと電極Ｅとの間に加工屑が発生する。そして、加工面１７ａの面内方向における加工面１７ａと電極Ｅとの間に介在する加工液中の加工屑の分布が不均一になって、加工面１７ａの面内方向において局所的な加工屑の偏りが発生することによって、加工面１７ａの加工面質の不均一性が発生する。

すなわち、加工面１７ａと電極Ｅとの間に介在する加工液中の加工屑濃度がある特定の濃度以上に増えると、加工面１７ａと電極Ｅとの間の電位が下がりすぎた状態となる。そして、加工面１７ａと電極Ｅとの間の加工液中の加工屑濃度がある特定の濃度以上になる箇所では、加工面１７ａと電極Ｅとの間の放電がアーク状態に移行しやすくなり、放電が１箇所に集中しやすくなる。このため、加工面１７ａと電極Ｅとの間の加工液中の加工屑濃度がある特定の濃度以上になる箇所では、放電の集中によって放電痕の放電痕径が大きくなり、ピットが形成される。

このため、放電加工機１を用いて加工液中で形彫放電加工を安定して進めるためには、加工面１７ａと電極Ｅとの間の電位を一定に保つ必要がある。そこで、放電加工機１を用いて加工液中で形彫放電加工を実施する際には、加工面１７ａと電極Ｅとの間の加工液中から加工屑を排出する加工屑排出動作であるジャンプ動作を定期的に行いながら加工を進める。

図９は、実施の形態２における放電加工機による加工液中での形彫放電加工における極間距離制御およびジャンプ動作制御を説明するための図である。放電加工機１は、極間距離制御の際には、加工液４３中において電極Ｅを被加工物１７の加工面１７ａに近付けて、電極Ｅと加工面１７ａとの間で放電パルス４１を発生させる（ｓ１）。この放電パルス４１によって加工面１７ａが放電加工され、加工屑４２が発生する。

この後、放電加工機１は、極間距離制御を終了して、ジャンプ動作制御を開始する。この場合において、放電加工機１は、加工面１７ａからジャンプ動作距離Ｌ１だけ電極Ｅを上昇させる（ｓ２）。この後、放電加工機１は、電極Ｅを下降させて、被加工物１７のある位置に電極Ｅを戻す（ｓ３）。ここで、電極Ｅの下降時に、加工屑４２を含んだ加工液４３が、加工済み領域４５から加工済み領域４５の外部に向かって流出する。そして、このときの加工液４３の流出動作によって、電極Ｅと加工面１７ａとの間の空間から加工屑が排出される。このようなジャンプ動作によって、電極Ｅと加工面１７ａとの間の空間から加工屑４２が排出される。放電加工機１は、上述した（ｓ１）から（ｓ３）の処理を定期的に繰り返しながら、加工液４３中で形彫放電加工を進める。このように加工面１７ａと電極Ｅとの間に介在する加工液４３中から加工屑４２を排出させるための、電極Ｅを引き上げ、その後、電極Ｅを元の位置に戻す動作をジャンプ動作と呼ぶ。ジャンプ動作は、加工方向における電極Ｅの動作だけに限定されない。ジャンプ動作は、例えば加工方向がＺ方向である加工時にＸＹ平面内の移動加工が行われている際の、電極ＥをＸＹ方向において電極Ｅを移動させた後に電極Ｅを元の位置に戻す動作も含まれる。

ジャンプ動作には、加工形状毎に適した加工屑排出効果が存在する。加工屑排出効果は、ジャンプ動作終了後の加工面１７ａと電極Ｅとの間に介在する加工液４３中の加工屑濃度を低減させる効果である。ジャンプ動作終了において、加工面１７ａと電極Ｅとの間の加工液４３中の加工屑濃度が低いほど、ジャンプ動作の加工屑４２の排出効果が高い、すなわち加工屑排出効果が高いといえる。

図１０は、実施の形態２における放電加工機による加工液中での形彫放電加工における、加工面の面内方向における加工面と電極との間の加工屑の分布の不均一性と、ジャンプ動作の加工屑排出効果との関係性を示す特性図である。また、図１０では、ジャンプ動作の加工屑排出効果と、ジャンプ動作終了直後の被加工物１７の加工面１７ａと電極Ｅとの間に介在する加工液中の加工屑量との関係性を併せて示している。以下では、加工面１７ａの面内方向における加工面１７ａと電極Ｅとの間の加工屑の分布を、単に加工屑の分布と呼ぶ場合がある。

図１０における横軸は、ジャンプ動作の加工屑排出効果を示している。横軸においては、左側がジャンプ動作の加工屑排出効果が低く、加工面１７ａと電極Ｅとの間に介在する加工液中の加工屑量が相対的に多い。また、横軸においては、右側がジャンプ動作の加工屑排出効果が高く、加工面１７ａと電極Ｅとの間に介在する加工液中の加工屑量が相対的に少ない。図１０における左側の縦軸は、加工面の面内方向における加工面と電極Ｅとの間の加工屑の分布の不均一性を示している。左側の縦軸においては、下側ほど加工屑の分布が均一であり、上側ほど加工屑の分布が不均一である。

図１０における右側の縦軸は、ジャンプ動作終了直後の加工面１７ａと電極Ｅとの間の加工液中の加工屑量を示している。右側の縦軸においては、下側ほど加工屑量が少なく、上側ほど加工屑量が多い。図１０では、加工屑の分布の不均一性と、ジャンプ動作の加工屑排出効果との関係性を示す特性曲線を実線４６で示している。図１０では、ジャンプ動作終了直後の加工面１７ａと電極Ｅとの間の加工液中の加工屑量と、ジャンプ動作の加工屑排出効果との関係性を示す特性曲線を破線４７で示している。

図１０に示すように、ジャンプ動作の加工屑排出効果が高い領域にも、ジャンプ動作の加工屑排出効果が低い領域にも、加工屑の分布が均一になる領域が存在する。ジャンプ動作の加工屑排出効果が高すぎる領域にも、ジャンプ動作の加工屑排出効果が低すぎる領域にも、加工屑の分布が不均一になる傾向の領域が存在する。

加工屑の分布の不均一性を抑制するためには、ジャンプ動作の加工屑排出効果の適正値が存在する。また、加工屑の分布の不均一性が抑制された状態の加工面１７ａと電極Ｅとの間の状態には、例えば図１０に示すように、状態Ａ、状態Ｂ、状態Ｃおよび状態Ｄがある。ここでは、電極Ｅの加工部の形状、すなわち電極Ｅが加工面１７ａと対向する部分の形状が四角形状である場合を例に示している。なお、電極Ｅの加工部の形状は、四角形状に限定されず、所望の加工面１７ａを加工可能であれば任意の形状とすることができる。したがって、加工面１７ａの加工形状は四角形状に限定されない。

状態Ａ、状態Ｂ、状態Ｃおよび状態Ｄにおいて、ハッチングが施されている領域５１は、ハッチングが施されていない領域５２に対して、ジャンプ動作終了直後の被加工物１７の加工面１７ａと電極Ｅとの間に介在する加工液中の加工屑量が相対的に多い領域である。

状態Ａは、ジャンプ動作終了直後において、状態Ｄに対して相対的に多い量の加工屑が加工面１７ａと電極Ｅとの間に均一に分布した状態である。状態Ａは、図１０の実線４６において、左側の最下点４６ＡＬを挟んだ、第１点４６Ａ１と第２点４６Ａ２との間である４６Ａの部分の状態に対応する。第１点４６Ａ１は、実線４６において、左側の最下点４６ＡＬよりも左側の点である。第２点４６Ａ２は、実線４６において、左側の最下点４６ＡＬよりも右側の点であって、実線４６における最上点４６Ｔと左側の最下点４６ＡＬとの間の点である。なお、第１点４６Ａ１と第２点４６Ａ２とは、形彫放電加工における諸条件によって変化する。状態Ｄは、ジャンプ動作終了直後において、状態Ａに対して相対的に非常に少ない量の加工屑が加工面１７ａと電極Ｅとの間に均一に分布した状態、または加工面１７ａと電極Ｅとの間の加工屑が完全に除かれた状態である。状態Ｄは、図１０の実線４６において、右側の最下点４６ＤＬを挟んだ、第３点４６Ｄ１と第４点４６Ｄ２との間である４６Ｄの部分の状態に対応する。第３点４６Ｄ１は、実線４６において、右側の最下点４６ＤＬよりも左側の点であって、最上点４６Ｔと右側の最下点４６ＤＬとの間の点である。第４点４６Ｄ２は、実線４６において、右側の最下点４６ＤＬよりも右側の点である。なお、第３点４６Ｄ１と第４点４６Ｄ２とは、形彫放電加工における諸条件によって変化する。そして、状態Ａおよび状態Ｄのそれぞれの状態を実現するための、ジャンプ動作の加工屑排出効果の適切なレベルが存在する。

状態Ａを目標とすると、ジャンプ動作の加工屑排出効果が低くジャンプ動作での加工屑排出量が少ないため、放電加工中の加工面１７ａと電極Ｅとの間の加工屑濃度が高すぎて、加工面１７ａと電極Ｅとの間の放電がアーク状態に移行して放電加工が進まなくなる。

また、状態Ａよりもジャンプ動作の加工屑排出効果が高い場合には、加工面１７ａの面内方向における加工面１７ａと電極Ｅとの間において局所的に加工屑が少ない領域が存在する状態である、状態Ｂまたは状態Ｃの状態になる。また、状態Ｄとなるジャンプ動作の加工屑排出効果の適正値よりも、ジャンプ動作の加工屑排出効果が高すぎると、電極Ｅと加工面１７ａとの間の放電電位が高い状態となり、パルス放電が発生しづらい状況となることから、微弱なパルス放電による加工の際に加工が不安定になりやすい。

電極Ｅの加工部の形状が四角形状である場合、相対的にジャンプ動作の加工屑排出効果が低いレベルであって、状態Ａよりもジャンプ動作の加工屑排出効果が高い場合には、状態Ｂに示すように、流体の流動性の性質に起因して、加工面１７ａに対してＸ形状のライン状に加工屑が残る。状態Ｂは、図１０の実線４６において、第２点４６Ａ２と最上点４６Ｔとの間である４６Ｂの部分の状態に対応する。また、加工面１７ａに対向する電極Ｅの加工部の形状が四角形状である場合、状態Ｂよりもジャンプ動作の加工屑排出効果が高いレベルであって、状態Ｄよりもジャンプ動作の加工屑排出効果が低い場合には、状態Ｃに示すように、流体の流動性の性質に起因して、加工面１７ａに対して隅の方に加工屑が残る。状態Ｃは、図１０の実線４６において、最上点４６Ｔと第３点４６Ｄ１との間である４６Ｃの部分の状態に対応する。

加工面１７ａと電極Ｅとの間の加工液中の加工屑濃度が同程度であっても、電極Ｅの加工部の形状とジャンプ動作の加工屑排出効果とに起因して、加工面１７ａに対して局所的な加工屑の偏りが発生する。このため、図１０の横軸は、加工屑濃度ではなく、ジャンプ動作の加工屑排出効果と記している。

そして、状態Ｂまたは状態Ｃの状態において放電加工された加工面１７ａは、ハッチングが施されている領域５１のパターンに対応する部分の放電痕径の均一性および面粗さが悪くなり、加工面１７ａが不均一になる。

以下において説明する加工面不均一パターン５０は、状態Ｂおよび状態Ｃの状態における、放電加工中に発生する加工面１７ａの面内方向における特徴的な加工屑濃度分布の偏りを図示したものである。加工面不均一パターンは、放電加工中に発生する加工面１７ａの面内方向における、加工屑濃度分布が良くない特徴的な加工屑濃度分布の偏りを示すパターンである。

図１１および図１２は、実施の形態２における加工面不均一パターンの例を示す図である。図１１および図１２において、ハッチングが施されている領域５３のパターンは、図１０のハッチングが施されている領域５１に対応するパターンである。図１１および図１２において、ハッチングが施されていない領域５４は、図１０のハッチングが施されていない領域５２に対応する。ハッチングが施されている領域５３のパターンが、加工面１７ａが不均一になるパターンである。

図１１の加工面不均一パターン５０は、図９に示すようにジャンプ動作における電極Ｅの上昇時において、加工面１７ａの四角形状の四隅から加工済み領域４５への加工液４３の流入により加工面１７ａの四角形状の対角線状に加工屑４２が集まる場合に発生する加工屑４２の分布を模式化した例である。図１１に示すような加工屑４２の分布は、ジャンプ動作における電極Ｅの下降時における加工済み領域４５からの加工液４３の流出動作で加工屑４２が適切に拡散しなかった場合に発生する。

図１１の加工面不均一パターン５０は、状態Ｂに対応している。加工面１７ａと電極Ｅとの間に介在する加工液４３中の加工屑の濃度を適度な濃度として加工屑４２の分布を均一に維持することが必要な形彫放電加工においては、加工屑４２の分布として状態Ａのような状態が必要となる。状態Ｂは、状態Ａよりもジャンプ動作の加工屑排出効果がやや高い場合に発生する。

また、図１２の加工面不均一パターン５０は、状態Ｄのように加工面１７ａと電極Ｅとの間の加工屑４２を完全に排出するまたは極力排出することを目標とした場合において、ジャンプ動作の加工屑排出効果が不十分であり、加工済み領域４５の加工形状の外周側に加工屑が集中する際に発生する加工屑の分布を模式化した例である。

本実施の形態２では、加工面質データ算出部２２は、放電加工された被加工物１７の加工面１７ａを撮影した画像から加工面質データを算出する。図１３は、実施の形態２における加工面不均一パターンを記憶した加工面質データ算出部を示す図である。また、加工面質データ算出部２２は、図１３に示すように加工面不均一パターンを予め記憶している。図１４は、実施の形態２において分割した加工面画像の領域における第１の加工面質データを示す図である。図１５は、実施の形態２において加工面画像の分割領域における第１の加工面質データと加工面不均一パターンの画像を重ね合わせた状態を示す図である。

加工面質データ算出部２２は、図１４に示すように加工面画像６０を複数の分割領域６１に分割する。加工面質データ算出部２２は、加工面画像において分割された各分割領域６１について、上述した実施の形態１において説明した方法で算出した第１の加工面質データを算出する。図１４において、加工面画像６０における分割された各分割領域６１に示された数値は、各分割領域６１の第１の加工面質データである。

そして、加工面質データ算出部２２は、図１５に示すように、各分割領域６１に第１の加工面質データの数値を組み込んだ加工面画像６０と加工面不均一パターン５０の画像を重ね合わせる。加工面質データ算出部２２は、加工面不均一パターン５０の領域と重なっている、第１の加工面質データが算出されている部分の割合を加工面不均一パターン５０に対する一致度とする。

すなわち、一致度は、加工面不均一パターン５０と、第１の加工面質データと、の一致度である。ここで、加工面不均一パターン５０は、形彫放電加工された加工面１７ａの加工粗さが所望の基準よりも悪い領域のパターンとして予め決められたパターンである。第１の加工面質データは、形彫放電加工された加工面１７ａの画像から取得される加工面１７ａを分割した分割領域６１における、形彫放電加工された加工面１７ａの画像から取得される加工面１７ａにおける予め決められた大きさの放電痕よりも大きな放電痕であるピットの分布に基づいて加工面１７ａの加工面質を評価した加工面質データである。所望の基準は、加工面１７ａに求められる均一性に従って適宜変えればよい。実施の形態２では、一致度を加工面質データである第２の加工面質データとする。すなわち、加工面質データ算出部２２は、実施の形態２においても、放電加工された被加工物１７の加工面１７ａの加工面質を、加工面１７ａの画像から算出して定量化する。

図１５では、図１１の加工面不均一パターン５０と第１の加工面質データとの一致度の例を示している。図１５において加工面不均一パターン５０の指定領域であるハッチングが施されている領域５３に一致する第１の加工面質データの合計は１２、加工面１７ａ全体の第１の加工面質データの合計は１４となる。この場合、一致度は８５．７６％＝１２÷１４となる。すなわち、一致度は、分割領域６１に対して算出された第１の加工面質データの合計に対する、加工面不均一パターン５０の領域と重なっている分割領域６１に対して算出された第１の加工面質データの合計の割合、と換言できる。

加工面質データ算出部２２は、加工面質データ算出部２２に記憶している複数の加工面不均一パターン５０の全てに対して、一致度を算出する。また、作業者は、加工対象物情報と加工条件とにより、加工面１７ａが不均一になるパターンが予め予測できる場合には、予測される加工面１７ａの不均一パターンに近いと考えられる、１つまたは複数の加工面不均一パターン５０を指定する情報を、加工面質データ算出部２２に対して入力してもよい。この場合、加工面質データ算出部２２は、指定された加工面不均一パターン５０に対して、一致度を算出する。

つぎに、図１６を用いて、実施の形態２において放電加工機１の学習装置２３が学習する処理の処理手順について説明する。図１６は、実施の形態２における学習装置による学習処理の処理手順を示すフローチャートである。

データ取得部２３１は、加工対象物情報と、加工条件と、第２の加工面質データとを第２の学習用データとして取得する（ステップＳ３１０）。

モデル生成部２３２は、加工対象物情報と、加工条件と、第２の加工面質データとに基づいて、適用した加工条件に対する報酬を計算する（ステップＳ３２０）。具体的には、報酬計算部２３３は、第２の加工面質データを取得し、予め定められた報酬基準である第２閾値３３に基づいて、適用した加工条件に対する報酬を増加させるか、または報酬を減じるかを判断する。報酬計算部２３３は、第２の加工面質データが第２閾値３３未満である場合に、適用した加工条件に対する報酬を増加させると判断する。報酬計算部２３３は、第２の加工面質データが第２閾値３３以上である場合に、適用した加工条件に対する報酬を減じると判断する。

報酬計算部２３３は、第２の加工面質データが第２閾値３３未満である場合に、報酬を増やす（ステップＳ３３０）。一方、報酬計算部２３３は、第２の加工面質データが第２閾値３３以上である場合に、報酬を減らす（ステップＳ３４０）。

関数更新部２３４は、報酬計算部２３３によって計算された報酬に基づいて、学習済モデル記憶部２４が記憶する式（２）で表される行動価値関数Ｑ（ｓ_t，ａ_t）を更新する（ステップＳ３５０）。

学習装置２３は、以上のステップＳ３１０からステップＳ３５０までのステップを繰り返し実行し、生成された行動価値関数Ｑ（ｓ_t，ａ_t）を学習済モデル３０として学習済モデル記憶部２４に記憶させる。

また、推論装置２５は、実施の形態１の場合と同様に、上記のようにして生成された学習済モデル３０と加工対象物情報とを用いて、加工対象物情報から加工面１７ａの加工面質を良くする加工条件を推論する。

上述したように、実施の形態２では、放電加工時における加工面の面内方向における加工面と電極Ｅとの間の加工屑の分布の不均一性、すなわち、加工屑の偏りを加工面不均一パターン５０として定義する。そして、学習装置２３は、上述した一致度を小さくする行動価値関数Ｑ（ｓ_t，ａ_t）である学習済モデル３０を生成することにより、加工面１７ａを分割した分割領域６１の第１の加工面質データが加工面不均一パターン５０に適合しないように加工面１７ａの加工を実施できる加工条件を推論するための、加工対象物情報と加工条件との関係を学習することができる。すなわち、学習装置２３は、面粗さが悪い領域が加工面不均一パターン５０に適合しない加工面１７ａを形成できる加工条件を推論するための、加工対象物情報と加工条件との関係を学習することができる。

第２の加工面質データである一致度を算出することで、放電加工において加工面１７ａの不均一性の結果と相関の高いスラッジおよび加工屑の排出動作の適正条件を学習することが可能となる。

つぎに、図１７を用いて、実施の形態２において放電加工機１の学習装置２３が学習する他の処理の処理手順について説明する。図１７は、実施の形態２における学習装置による他の学習処理の処理手順を示すフローチャートである。

データ取得部２３１は、第１の学習用データと第２の学習用データとを取得する。すなわち、データ取得部２３１は、加工対象物情報と、加工条件と、第１の加工面質データと、第２の加工面質データとを学習用データとして取得する（ステップＳ４１０）。

その後、ステップＳ４２０では、ステップＳ１２０と同じ処理が行われ、ステップＳ４３０では、ステップＳ１３０と同じ処理が行われ、ステップＳ４４０では、ステップＳ１４０と同じ処理が行われる。

また、ステップＳ４５０では、ステップＳ３２０と同じ処理が行われ、ステップＳ４６０では、ステップＳ３３０と同じ処理が行われ、ステップＳ４７０では、ステップＳ３４０と同じ処理が行われる。

関数更新部２３４は、報酬計算部２３３によって計算された報酬に基づいて、学習済モデル記憶部２４が記憶する式（２）で表される行動価値関数Ｑ（ｓ_t，ａ_t）を更新する（ステップＳ４８０）。

学習装置２３は、以上のステップＳ４１０からステップＳ４８０までのステップを繰り返し実行し、生成された行動価値関数Ｑ（ｓ_t，ａ_t）を学習済モデル３０として学習済モデル記憶部２４に記憶させる。

上記の処理を行うことにより、学習装置２３は、第１の加工面質データを小さくする行動価値関数Ｑ（ｓ_t，ａ_t）である学習済モデル３０を生成することにより、被加工物１７の加工面１７ａの加工面質を向上させることができる加工条件、すなわち加工面１７ａの均一性を良くすることができる加工条件を推論するための加工対象物情報と加工条件との関係を学習することができる。また、学習装置２３は、面粗さが悪い領域が加工面不均一パターン５０に適合しない加工面１７ａを形成できる加工条件を推論するための、加工対象物情報と加工条件との関係を学習することができる。

上記の学習により加工屑の分布の状態として状態Ａを目標とする場合、状態Ｄを目標とする場合でも適切に、加工面１７ａの不均一性を抑制するための加工条件を生成することが可能となる。

したがって、実施の形態２によれば、上述した実施の形態１の場合と同様に、被加工物１７の加工面１７ａの加工面質を向上させることができる、放電加工の適正な加工条件の学習が可能となる。

ここで、加工条件設定部１６のハードウェア構成について説明する。図１８は、実施の形態１，２にかかる加工条件設定部を実現するハードウェア構成例を示す図である。

加工条件設定部１６は、プロセッサ１００、メモリ２００、入力装置３００、および出力装置４００により実現することができる。プロセッサ１００の例は、ＣＰＵ（Central Processing Unit、中央処理装置、処理装置、演算装置、マイクロプロセッサ、マイクロコンピュータ、ＤＳＰ（Digital Signal Processor）ともいう）またはシステムＬＳＩ（Large Scale Integration）である。メモリ２００の例は、ＲＡＭ（Random Access Memory）、ＲＯＭ（Read Only Memory）である。

加工条件設定部１６は、プロセッサ１００が、メモリ２００で記憶されている制御装置２の動作を実行するための、コンピュータで実行可能な、制御プログラムを読み出して実行することにより実現される。加工条件設定部１６の動作を実行するためのプログラムである制御プログラムは、加工条件設定部１６の実行する手順または方法をコンピュータに実行させるものであるともいえる。

メモリ２００は、プロセッサ１００が各種処理を実行する際の一時メモリに使用される。メモリ２００は、例えば、加工条件設定部１６が実行する加工条件設定プログラム、加工条件などを記憶する。入力装置３００は、被加工物１７が放電加工される際に用いられる加工対象物情報と加工条件と加工面の画像情報とを受付けてプロセッサ１００に送る。出力装置４００は、加工条件などを表示部１３などの外部装置に出力する。

加工条件設定プログラムは、インストール可能な形式または実行可能な形式のファイルで、コンピュータが読み取り可能な記憶媒体に記憶されてコンピュータプログラムプロダクトとして提供されてもよい。また、加工結果評価プログラムは、インターネットなどのネットワーク経由で加工条件設定部１６に提供されてもよい。

なお、加工条件設定部１６の機能について、一部を専用回路などの専用のハードウェアで実現し、一部をソフトウェアまたはファームウェアで実現するようにしてもよい。また、制御装置２を、加工条件設定部１６と同様のハードウェア構成としてもよい。

学習装置２３の動作を実行するためのプログラムである学習プログラムは、データ取得部２３１およびモデル生成部２３２を含むモジュール構成となっている。また、推論装置２５の動作を実行するためのプログラムである推論プログラムは、データ取得部２５１および推論部２５２を含むモジュール構成となっている。

以上の実施の形態に示した構成は、一例を示すものであり、別の公知の技術と組み合わせることも可能であるし、実施の形態同士を組み合わせることも可能であるし、要旨を逸脱しない範囲で、構成の一部を省略、変更することも可能である。

１放電加工機、２制御装置、１２駆動部、１３表示部、１４機械制御部、１５電源制御部、１６加工条件設定部、１７被加工物、１７ａ加工面、１８定盤、１９ベッド、２１入力部、２２加工面質データ算出部、２３学習装置、２４学習済モデル記憶部、２５推論装置、２６加工条件記憶部、２７加工条件出力部、２８加工条件修正部、３０学習済モデル、３１第１閾値、３２加工条件、３３第２閾値、４１放電パルス、４２加工屑、４３加工液、４５加工済み領域、４６実線、４７破線、５０加工面不均一パターン、５１，５３ハッチングが施されている領域、５２，５４ハッチングが施されていない領域、６０加工面画像、６１分割領域、１００プロセッサ、２００メモリ、２３１，２５１データ取得部、２３２モデル生成部、２３３報酬計算部、２３４関数更新部、２５２推論部、３００入力装置、４００出力装置。

Claims

放電加工機における被加工物の形彫放電加工の際に用いられる加工条件を学習する学習装置であって、
目的の加工品についての情報および前記放電加工機で用いられる電極についての情報を含む加工対象物情報と、前記被加工物を前記目的の加工品に前記形彫放電加工する際に用いた加工条件と、前記加工条件で前記形彫放電加工された前記被加工物の加工面の加工面質を示す評価指標の値とを含む学習用データを取得するデータ取得部と、
前記学習用データを用いて、前記加工対象物情報から、前記加工面の加工面質が向上するような加工条件を推論するための学習済モデルを生成するモデル生成部と、
を備え、
前記評価指標は、前記形彫放電加工された前記加工面の画像から取得される前記加工面における予め決められた大きさの放電痕よりも大きな放電痕の分布に基づいて前記加工面の加工面質を評価した加工面質データであること、
を特徴とする学習装置。
放電加工機における被加工物の形彫放電加工の際に用いられる加工条件を学習する学習装置であって、
目的の加工品についての情報および前記放電加工機で用いられる電極についての情報を含む加工対象物情報と、前記被加工物を前記目的の加工品に前記形彫放電加工する際に用いた加工条件と、前記加工条件で前記形彫放電加工された前記被加工物の加工面の加工面質を示す評価指標の値とを含む学習用データを取得するデータ取得部と、
前記学習用データを用いて、前記加工対象物情報から、前記加工面の加工面質が向上するような加工条件を推論するための学習済モデルを生成するモデル生成部と、
を備え、
前記評価指標は、前記形彫放電加工された前記加工面の加工粗さが所望の基準よりも悪い領域のパターンとして予め決められたパターンである加工面不均一パターンと、前記形彫放電加工された前記加工面の画像から取得される前記加工面を分割した分割領域における、前記形彫放電加工された前記加工面の画像から取得される前記加工面における予め決められた大きさの放電痕よりも大きな放電痕の分布に基づいて前記加工面の加工面質を評価した加工面質データと、の一致度であること、
を特徴とする学習装置。
前記評価指標は、前記形彫放電加工された前記被加工物の前記加工面に形成された放電痕の均一性であること、
を特徴とする請求項１または２に記載の学習装置。
前記形彫放電加工された前記被加工物の加工面の画像を用いて前記評価指標の値を算出する加工面質データ算出部を備えること、
を特徴とする請求項１から３のいずれか１つに記載の学習装置。
前記モデル生成部は、
前記加工条件および前記評価指標の値に基づいて、前記加工条件の報酬を計算する報酬計算部と、
前記報酬に基づいて、前記学習済モデルを更新する関数更新部と、
を有することを特徴とする請求項１から４のいずれか１つに記載の学習装置。
請求項１から５のいずれか１つに記載の学習装置の学習結果である学習済モデルを取得して被加工物に対する形彫放電加工を実施する放電加工機であって、
前記学習済モデルに基づいて、加工対象物情報から加工条件を推論する推論部と、
前記推論部が推論した前記加工条件に基づいて、前記被加工物に対する形彫放電加工動作を制御する制御部と、
を備えることを特徴とする放電加工機。
放電加工機における被加工物の形彫放電加工の際に用いられる加工条件を学習する学習方法であって、
目的の加工品についての情報および前記放電加工機で用いられる電極についての情報を含む加工対象物情報と、前記被加工物を前記目的の加工品に前記形彫放電加工する際に用いた加工条件と、前記加工条件で前記形彫放電加工された前記被加工物の加工面の加工面質を示す評価指標の値とを含む学習用データを取得するステップと、
前記学習用データを用いて、前記加工対象物情報から、前記加工面の加工面質が向上するような加工条件を推論するための学習済モデルを生成するステップと、
を含み、
前記評価指標は、前記形彫放電加工された前記加工面の画像から取得される前記加工面における予め決められた大きさの放電痕よりも大きな放電痕の分布に基づいて前記加工面の加工面質を評価した加工面質データであること、
を特徴とする学習方法。
放電加工機における被加工物の形彫放電加工の際に用いられる加工条件を学習する学習方法であって、
目的の加工品についての情報および前記放電加工機で用いられる電極についての情報を含む加工対象物情報と、前記被加工物を前記目的の加工品に前記形彫放電加工する際に用いた加工条件と、前記加工条件で前記形彫放電加工された前記被加工物の加工面の加工面質を示す評価指標の値とを含む学習用データを取得するステップと、
前記学習用データを用いて、前記加工対象物情報から、前記加工面の加工面質が向上するような加工条件を推論するための学習済モデルを生成するステップと、
を含み、
前記評価指標は、前記形彫放電加工された前記加工面の加工粗さが所望の基準よりも悪い領域のパターンとして予め決められたパターンである加工面不均一パターンと、前記形彫放電加工された前記加工面の画像から取得される前記加工面を分割した分割領域における、前記形彫放電加工された前記加工面の画像から取得される前記加工面における予め決められた大きさの放電痕よりも大きな放電痕の分布に基づいて前記加工面の加工面質を評価した加工面質データと、の一致度であること、
を特徴とする学習方法。