CN108693833A

CN108693833A - 机器学习装置、伺服控制装置和***以及机器学习方法

Info

Publication number: CN108693833A
Application number: CN201810264707.1A
Authority: CN
Inventors: 园田直人; 猪饲聪史; 恒木亮太郎
Original assignee: Fanuc Corp
Current assignee: Fanuc Corp
Priority date: 2017-03-31
Filing date: 2018-03-28
Publication date: 2018-10-23
Anticipated expiration: 2038-03-28
Also published as: JP6490131B2; DE102018203956B4; CN108693833B; DE102018203956A1; US20180284702A1; US10481566B2; JP2018173777A

Abstract

本发明提供一种机器学习装置、伺服控制装置和***以及机器学习方法，避免繁杂的调整并简便地抑制干扰。该机器学习装置具备：标签取得部(220)，其取得在抑制了干扰的状态下驱动伺服控制装置的控制对象的电流指令作为标签；输入数据取得部(210)，其取得在抑制了干扰的状态下根据电流指令进行驱动的控制对象的速度作为输入数据；以及学习部(230)，其将标签与输入数据的组作为训练数据进行有监督学习，从而构建根据控制对象的速度推定驱动上述控制对象的电流的学习模型。

Description

机器学习装置、伺服控制装置和***以及机器学习方法

技术领域

本发明涉及用于抑制干扰的机器学习装置、伺服控制装置、伺服控制***及机器学习方法。

背景技术

作为机床以及工业机械的伺服控制装置，专利文献1公开了一种能够进行可以与控制对象的非线性、干扰或环境经时变化对应的高精度定位的结构。具体地说，专利文献1公开了一种伺服控制装置，其作为具有使控制对象的控制输出与目标值一致地反馈控制目标值与控制输出之间的控制偏差的控制器的伺服控制装置，包括：神经网络模型，其将控制器的输出设为输入信号；线性模型，其将控制器的输出设为输入信号；以及学习单元，其将神经网络的输出设为控制对象的输入信号，并以使控制对象的输出与线性模型的输出变得相等的方式使神经网络的各层间的权重发生变化。

上述专利文献1公开的结构，将线性模型设为参考模型，以与该线性模型的特性一致的方式进行模型参考自适应控制，所以用户需要逐一准备线性模型。

但是，用户逐一准备线性模型对用户来说比较繁杂，希望一种更简便地抑制干扰等的伺服控制装置。

专利文献1：日本特开平07-210207号公报

发明内容

本发明的目的为提供能够避免繁杂的调整并简便地抑制干扰的机器学习装置、伺服控制装置、伺服控制***及机器学习方法。

(1)本发明的机器学习装置(例如后述的机器学习装置200、200-1～200-n、201、202)具备：

标签取得部(例如后述的标签取得部220)，其取得在抑制了干扰的状态下驱动伺服控制装置的控制对象(例如后述的控制对象400)的电流指令作为标签；

输入数据取得部(例如后述的输入数据取得部210)，其取得在抑制了上述干扰的状态下根据上述电流指令进行驱动的控制对象的速度作为输入数据；以及

学习部(例如后述的学习部230)，其将上述标签与上述输入数据的组作为训练数据来进行有监督学习，由此构建用于根据上述控制对象的速度推定驱动上述控制对象的电流的学习模型。

(2)在上述(1)的机器学习装置中，上述控制对象具备电动机(例如后述的伺服电动机401)和通过该电动机进行移动的负载(例如后述的负载402)，通过上述输入数据取得部取得的上述速度可以是上述电动机的转速和上述负载的速度。

(3)在上述(1)或(2)的机器学习装置中，还具备：函数输出部(例如后述的推定电流生成函数输出部250)，其根据通过上述学习部所构建的上述学习模型，生成用于根据上述控制对象的速度推定驱动上述控制对象的电流的函数，并输出给上述伺服控制装置。

(4)在上述(1)～(3)中的任意一个机器学习装置中，上述伺服控制装置具备构成电流反馈环的电流控制部(例如后述的电流控制部180)和放大器(例如后述的放大器190)，驱动上述控制对象的电流指令经由上述电流控制部和上述放大器被施加给上述控制对象，

输入到上述标签取得部的上述电流指令可以是上述放大器的输出。

(5)本发明的伺服控制***具备上述(3)的机器学习装置(例如后述的机器学习装置200、200-1～200-n、201、202)、对该机器学习装置输出上述电流指令以及上述控制对象的速度的上述伺服控制装置(例如后述的伺服控制装置100、100-1～100-n、101、102)，

上述伺服控制装置具备：推定电流生成部(例如后述的推定电流生成部150)，其基于从上述函数输出部输出的上述函数，根据上述控制对象的速度推定驱动上述控制对象的电流；减法部(例如后述的减法器140)，其求出上述电流指令与通过上述推定电流生成部推定出的推定电流之间的差；以及干扰补偿部(例如后述的干扰补偿器160)，其根据上述差来生成用于补偿干扰的修正电流。

(6)在上述(5)的伺服控制***中，上述伺服控制装置具备构成电流反馈环的电流控制部(例如后述的电流控制部180)和放大器(例如后述的放大器190)，驱动上述控制对象的电流指令经由上述电流控制部和上述放大器被施加给上述控制对象，

(7)本发明的伺服控制装置具备：

上述(3)的机器学习装置(例如后述的机器学习装置200、200-1～200-n、201、202)；

推定电流生成部(例如后述的推定电流生成部150)，其基于从上述函数输出部输出的上述函数，根据上述控制对象的速度推定驱动上述控制对象的电流；

减法部(例如后述的减法器140)，其求出上述电流指令与通过上述推定电流生成部推定出的推定电流之间的差；以及

干扰补偿部(例如后述的干扰补偿器160)，其根据上述差来生成用于补偿干扰的修正电流。

(8)在上述(7)的伺服控制装置中，具备构成电流反馈环的电流控制部(例如后述的电流控制部180)和放大器(例如后述的放大器190)，驱动上述控制对象的电流指令经由上述电流控制部和上述放大器被施加给上述控制对象，

输入到上述标签取得部的上述电流指令是上述放大器的输出。

(9)本发明的机器学习装置的机器学习方法，

取得在抑制了干扰的状态下驱动伺服控制装置的控制对象的电流指令作为标签；

取得在抑制了上述干扰的状态下根据上述电流指令进行驱动的控制对象的速度作为输入数据；以及

将上述标签与上述输入数据的组作为训练数据进行有监督学习，由此构建用于根据上述控制对象的速度推定驱动上述控制对象的电流的学习模型。

根据本发明，能够避免繁杂的调整并简便地抑制干扰。

附图说明

图1是表示本发明第一实施方式的伺服控制***的框图。

图2是表示本发明第一实施方式的伺服控制***的伺服控制装置的结构的框图。

图3是表示本发明第一实施方式的伺服控制***的加工时的伺服控制装置的结构的框图。

图4是表示本发明第一实施方式的伺服控制***的机器学习装置的结构的框图。

图5是表示本实施方式的机器学习装置200的动作的流程图。

图6是表示本发明第二实施方式的伺服控制***中的伺服控制装置与机器学习装置的一个结构例的框图。

图7是表示本发明第二实施方式的伺服控制***的加工时的伺服控制装置的结构的框图。

图8是表示本发明第二实施方式的伺服控制***的机器学习装置的结构的框图。

图9是表示本发明第三实施方式的伺服控制***中的伺服控制装置与机器学习装置的一个结构例的框图。

图10是表示本发明第三实施方式的伺服控制***的加工时的伺服控制装置的结构的框图。

图11是表示本发明第三实施方式的伺服控制***的机器学习装置的结构的框图。

附图标记的说明

10：伺服控制***；100、100-1～100～n：伺服控制装置；110：减法器；120：速度控制部；130：加法器；140：减法器；150：推定电流生成部；160：干扰补偿器；170：低通滤波器；200、200-1～200～n：机器学习装置；210：输入数据取得部；220：标签取得部；230：学习部；240：学习模型存储部；250：推定电流生成函数输出部；300：网络；400：控制对象。

具体实施方式

以下，使用附图详细说明本发明的实施方式。另外，以下说明了三个实施方式，但是成为其前提的整体结构在各个实施方式中是相同的，所以首先说明在该各个实施方式中相同的整体结构。

<在各个实施方式中相同的整体结构>

图1是表示本发明第一实施方式的伺服控制***的框图。如图1所示，伺服控制***10具备n台伺服控制装置100-1～100-n、n台机器学习装置200-1～200-n以及网络300。另外，n是任意的自然数。

这里，伺服控制装置100-1与机器学习装置200-1为1对1的组，以可通信的方式连接。关于伺服控制装置100-2～100-n和机器学习装置200-2～200-n也与伺服控制装置100-1和机器学习装置200-1同样地连接。图1中，伺服控制装置100-1～100-n与机器学习装置200-1～200-n的n个组经由网络300连接，但是伺服控制装置100-1～100-n与机器学习装置200-1～200-n的n个组也可以经由连接接口将每个组的伺服控制装置和机器学习装置直接连接。伺服控制装置100-1～100-n与机器学习装置200-1～200-n的n个组例如可以在相同的工厂中设置多组，也可以分别设置在不同的工厂。

网络300例如是构建在工厂内的LAN(Local Area Network局域网)、因特网、公共电话网或者这些的组合。对于网络300中的具体通信方式以及是有线连接与无线连接的哪一个等没有特别限定。

<第一实施方式>

图2是表示本发明第一实施方式的伺服控制***中的一组伺服控制装置与机械控制装置的一个结构例的框图。图2所示的伺服控制装置100与机器学习装置200例如与图1所示的伺服控制装置100-1和机器学习装置200-1对应。图2中，在各个装置间存在的网络300省略其图示。

如图2所示，伺服控制装置100具备减法器110、速度控制部120、加法器130、减法器140、推定电流生成部150、干扰补偿器160以及低通滤波器170。机器学习装置200从加法器130接受电流指令值，从控制对象400接受速度检测值。机器学习装置200将电流指令值作为标签，根据将速度检测值作为输入数据的训练数据进行作为机器学习的有监督学习，并将推定电流生成函数输出给推定电流生成部150。

通过伺服控制装置100进行伺服控制的控制对象400例如是伺服电动机、或者包括伺服电动机的机床、机器人或工业机械等。伺服控制装置100可以作为机床、机器人或工业机械等的一部分而设置。在以下的说明中，说明控制对象400是包括伺服电动机的机床的情况。

在本实施方式中，伺服控制装置100在机器学习时，在不产生干扰的状态，具体地说是不加工工件的状态下，驱动控制对象400，不进行补偿干扰的控制。因此，在机器学习时，从加法器130经由减法器140、推定电流生成部150、干扰补偿器160以及低通滤波器170返回加法器130的路径不发挥功能。在路径不发挥功能的意义下，在图2中通过虚线表示该路径。伺服控制装置100为了使该路径不发挥功能，例如以不从干扰补偿器160输出输出信号的方式进行控制即可。

伺服控制***10在机器学习时，能够使用通过机床实际加工的工件的加工程序来驱动控制对象400，进行机器学习。但是，一般基于加工程序的处理时间长，所以伺服控制***10最好使用与实际的加工程序不同的用于机器学习的评价用程序。评价用程序通过机器学习时的加工形状指定轴方向的移动距离、进给速度等。机器学习时的加工形状例如是圆、方形以及带角R的方形(a square with quarter arc有四分之一圆弧的方形)等。通过这样的加工形状，能够使伺服电动机的旋转方向反转，或者从旋转状态停止。

接着，参照图2说明本实施方式的机器学习时的信号流。首先，用于控制控制对象400的驱动的速度指令从省略了图示的上位装置输入到伺服控制装置100。减法器110求出被输入到伺服控制装置100的速度指令与从控制对象400进行速度反馈的速度检测值之间的差即速度偏差，并输出给速度控制部120。

速度控制部120将积分增益K1v与速度偏差相乘并进行积分后得到的值与将比例增益K2v与速度偏差相乘后得到的值相加，将其相加值作为电流指令值，经由加法器130输出给控制对象400以及机器学习装置200。加法器130在实际的加工时，求出电流指令值与低通滤波器170的输出之间的差，并将该差输出给控制对象400。另一方面，加法器130在机器学习时将电流指令值直接输出给控制对象400以及机器学习装置200。

控制对象400中包括的伺服电动机根据电流指令值而被驱动。通过与伺服电动机关联的成为位置检测部的旋转编码器检测控制对象400的伺服电动机的旋转角度位置，检测出的信号被用作进行了速度反馈的速度检测值。另外，速度检测值被输入给机器学习装置200。

机器学习装置200进行作为机器学习的有监督学习，该机器学习将从旋转编码器输出的速度检测值用作训练数据，将电流指令值用作标签。机器学习装置200通过进行有监督学习来构建学习模型，并将控制对象400的传递函数1/Js的反函数Js作为推定电流生成函数输出给推定电流生成部150。后面详细描述机器学习装置200的有监督学习。

机器学习装置200如果在推定电流生成部150中设定反函数Js，则如图3所示，伺服控制装置100即使在通过学习后的实际加工程序进行工件的加工时产生干扰，也能够生成修正电流使得通过接下来的动作修正由于干扰产生的速度变化。图3是表示本发明第一实施方式的伺服控制***的加工时的伺服控制装置的结构的框图。在实际的加工时，不进行机器学习，因此与机器学习装置200的连接在图3中没有被图示。

如图3所示，基于学习后的实际加工程序的速度指令值被输入给减法器110。减法器110求出被输入的速度指令与从控制对象400进行速度反馈的速度检测值之间的差即速度偏差，并输出给速度控制部120。

速度控制部120将积分增益K1v与速度偏差相乘并进行积分后得到的值与将比例增益K2v与速度偏差相乘后得到的值相加，将其加法运算值作为电流指令值输出给加法器130。加法器130求出电流指令值与低通滤波器170的输出之间的差，并将该差输出给控制对象400以及减法器140。

在由于工件的加工产生干扰，且成为控制对象的伺服电动机的速度发生变化时，包括干扰造成的速度变动成分的速度检测值被输入给推定电流生成部150。推定电流生成部150的传递函数被设定为控制对象400的反函数，所以如果输入包括干扰造成的速度变动成分的速度检测值，则将包括由于干扰的影响而被施加的电流成分的推定电流值输出给减法器140。

减法器140取得电流指令值与包括干扰造成的电流成分的推定电流值之间的差，仅将干扰造成的电流成分输入干扰补偿器160。干扰补偿器160生成修正电流值，并将修正电流值经由低通滤波器170输入加法器130。加法器130将干扰造成的修正电流值与电流指令值相加并输出。这样，为了抑制干扰造成的控制对象400的伺服电动机的速度变化而修正电流指令值，根据修正后的电流指令来驱动伺服电动机。为了除去比从施加干扰到通过修正电流值抑制干扰造成的影响为止的时间短的频率成分而设置低通滤波器170。

接着，使用图4说明机器学习装置200的结构以及动作。图4是表示本发明第一实施方式的伺服控制***的机器学习装置的结构的框图。

如图4所示，机器学习装置200具备输入数据取得部210、标签取得部220、学习部230、学习模型存储部240以及推定电流生成函数输出部250。

输入数据取得部210取得根据速度指令驱动的伺服电动机的速度检测值作为输入数据(也称为特征量)，并将取得的输入数据输出给学习部230。

标签取得部220取得从加法器130输出的电流指令值作为标签，并将取得的标签输出给学习部230。

这样，作为输入数据的速度检测值与作为标签的电流指令的组被输入学习部230。该输入数据与标签的组相当于机器学习中的训练数据。

学习部230根据这样被输入的训练数据进行被称为有监督学习的机器学习，从而构建学习模型。这里，有监督学习自身对本领域技术人员来说非常熟悉，所以省略详细的说明，说明其概略。

例如，通过组合感知器而构成的神经网络进行有监督学习。具体地说，训练数据中包括的输入数据与标签的组被赋予神经网络，为了使神经网络的输出与标签相同，一边变更针对各个感知器的权重一边重复学习。

例如在进行了正向传播(Forward-propagation)之后，重复反向传播(back-propagation，也称为误差反向传播法)的处理，从而调整权重值，以便缩小各个感知器的输出误差。

这样，学习部230学习训练数据的特征，并归纳地获得用于根据输入推定结果的学习模型。

这里，有监督学习如上述那样，一边使权重的值不同，一边消除标签与输出数据之间的误差。而且，本实施方式的标签是针对控制对象400的电流指令，输入是成为控制对象400的输出的检测速度值。因此，通过学习部230重复学习而构建的学习模型，理想地相当于用于将针对控制对象400的电流指令与针对成为输入数据的速度检测值的输出数据设为相等值的反函数。

另外，学习部230用于学习的神经网络可以是三层，但是也可以是四层以上。学习部230可以通过所谓的深度学习(也称为深层学习)进行学习。

学习部230所构建的学习模型被输出给学习模型存储部240。

学习模型存储部240是存储由学习部230构建并对学习模型存储部240输出的学习模型的存储部。

推定电流生成函数输出部250在实际加工前，从学习模型存储部240取得学习模型。然后，推定电流生成函数输出部250将根据所取得的学习模型计算出的函数即推定电流生成函数输出给推定电流生成部150。该推定电流生成函数用于在通过实际的加工程序产生了干扰时，在推定电流生成部150中生成包括干扰造成的电流成分的推定电流值。

以上，说明了机器学习装置200的功能块。为了实现这些功能块，机器学习装置200具备CPU(Central Processing Unit中央处理单元)等运算处理装置。另外，机器学习装置200具备存储了各种控制用程序的HDD(Hard Disk Drive硬盘驱动器)等辅助存储装置以及用于存储在运算处理装置执行程序时暂时所需要的数据的RAM(Random Access Memory随机存取存储器)等主存储装置。

而且，在机器学习装置200中，由运算处理装置从辅助存储装置读入应用程序和OS，使读入的应用程序或OS展开到主存储装置，并进行基于这些应用程序或OS的运算处理。另外，运算处理装置根据该运算结果来控制各装置所具备的各种软件。由此，实现本实施方式中的机器学习装置200的功能块。即，本实施方式能够通过硬件与软件的协作来实现。

作为具体例，机器学习装置200通过个人计算机、服务器装置或者数值控制装置(CNC：Computerized Numerical Control计算机数值控制)的一部分等来实现。

但是，机器学习装置200随着机器学习的运算量较多，因此例如优选在个人计算机中搭载GPU(Graphics Processing Units图形处理单元)。机器学习装置200通过被称为GPGPU(General-Purpose computing on Graphics Processing Units图形处理单元的通用计算)的技术，如果将GPU用于随着机器学习的运算处理，则能够高速处理。进一步，机器学习装置200为了进行更高速的处理，使用多台搭载了这种CPU的计算机来构建计算机集群，通过该计算机集群中包括的多个计算机进行并行处理。

另外，后述的第二实施方式中的机器学习装置201以及第三实施方式中的机器学习装置202，也能够和本实施方式的机器学习装置200同样地实现。

接着，参照图5的流程图说明本实施方式中的机器学习装置200的机器学习的动作。

在步骤S11中，机器学习装置200判断机器学习是否结束。

这里，当机器学习结束时，在步骤S11中判定为“是”，处理进入到步骤S16。当机器学习没有结束时，在步骤S11中判定为“否”，处理进入到步骤S12。

在步骤S12以及步骤S13中，机器学习装置200的输入数据取得部210以及标签取得部220取得输入数据和标签。这些数据的具体内容为以上。

在步骤S14中，机器学习装置200的学习部230使用所输入的训练数据执行机器学习。使用了该训练数据的机器学习的具体内容为以上那样。

在步骤S15中，学习部230将所构建的学习模型输出给学习模型存储部240，从而更新学习模型。之后，处理再次进入步骤S11。

这样重复从步骤S11到步骤S15的处理，从而继续学习。然后，当机器学习结束时，进入步骤S16。另外，机器学习的结束，例如可以通过来自用户的指示来执行，也可以在学习模型的输出与标签的误差值在预定值以下的情况下进行，也可以在将机器学习重复预定的次数的情况下进行。

在步骤S16中，推定电流生成函数输出部250取得由学习模型存储部240存储的学习模型。

在步骤S17中，推定电流生成函数输出部250将根据所取得的学习模型计算出的函数即推定电流生成函数输出给推定电流生成部150。

这样，伺服控制装置100中的干扰补偿功能为有效。

<第二实施方式>

接着，参照图6、图7以及图8说明第二实施方式的结构。另外，关于第二实施方式的功能以及结构中与上述第一实施方式相同的功能以及结构，省略说明。另外，在图6～图8中，标注相同标记并省略重复的说明，详细说明第一实施方式与第二实施方式中的不同点。

图6是表示本发明第二实施方式的伺服控制***中的伺服控制装置与机器学习装置的一个结构例的框图。图7是表示本发明第二实施方式的伺服控制***的加工时的伺服控制装置的结构的框图。图8是表示本发明第二实施方式的伺服控制***的机器学习装置的结构的框图。

如图6以及图7所示，本实施方式的伺服控制***与图2以及图3所示的第一实施方式的伺服控制***之间的不同点为，由伺服电动机401和负载402构成控制对象，从伺服电动机401的旋转编码器输出的速度检测值与从检测负载402的速度的线位移传感器输出的负载侧的速度检测值被输入到推定电流生成部150以及机器学习装置201。

机器学习装置201与机器学习装置200的不同点为，如图8所示，负载侧的速度检测值与伺服电动机401侧的速度检测值的双方作为输入数据输入到输入数据取得部210中，学习部230根据将这两个速度检测值作为输入数据并将电流指令值作为标签的训练数据来进行被称为有监督学习的机器学习，从而构建学习模型。

与伺服电动机401连接的负载402，在机床的情况下例如相当于装载要加工的工件的工作台。伺服电动机401与工作台通过连结机构连接，如图6以及图7所示，连结机构作为机械的等价电路，通过阻尼器和弹簧表示。连结机构具备与伺服电动机401连结的联轴器、固定在联轴器上的滚珠丝杠、与滚珠丝杆螺纹结合并与工作台连接的螺母。伺服电动机401的旋转运动通过这样的连结功能而转换为工作台的直线运动。通过在滚珠丝杆3033的端部安装线位移传感器能够测量负载402的速度。

在第二实施方式中也和第一实施方式同样，在机器学习时不进行补偿干扰的控制。因此，图6中经由减法器140、推定电流生成部150、干扰补偿器160以及低通滤波器170到达加法器130的路径不发挥功能。在路径不发挥功能的意义下，在图6中通过虚线表示该路径。伺服控制装置101为了使该路径不发挥功能，例如控制成不从干扰补偿器160输出输出信号即可。另一方面，在实际加工时不进行机器学习，因此与机器学习装置201的连接在图7中未被图示。

第二实施方式的伺服控制***不限于由于工件的加工产生干扰，且伺服电动机401的转速发生了变化的情况，即使在负载402的速度由于干扰发生变化的情况下也能够修正电流指令值以便抑制该速度变化。

<第三实施方式>

接着，参照图9、图10以及图11说明第三实施方式的结构。另外，关于第三实施方式的功能以及结构中与上述第一实施方式相同的功能以及结构将省略说明。另外，在图9～图11中，标注相同标记，省略重复的说明，详细说明第一实施方式与第三实施方式中的不同点。

图9是表示本发明第三实施方式的伺服控制***中的伺服控制装置与机器学习装置的一个结构例的框图。图10是表示本发明第三实施方式的伺服控制***的加工时的伺服控制装置的结构的框图。图11是表示本发明第三实施方式的伺服控制***的机器学习装置的结构的框图。

如图9以及图10所示，本实施方式的伺服控制***与图2以及图3所示的第一实施方式的伺服控制***之间的不同点为，在加法器130的输出侧增加了电流控制部180和放大器190，形成了电流反馈环。从电流控制部180向放大器190发送电压指令，通过放大器190控制的电流被赋予控制对象400。另外，被赋予控制对象400的电流被反馈给电流控制部180，并且被赋予减法器140以及机器学习装置202。电流控制部180将电流指令与电流反馈之差输出给放大器190。

机器学习装置202与机器学习装置200的不同点为，如图11所示，放大器190的输出被输入给标签取得部220，学习部230将放大器190的输出作为标签进行被称为有监督学习的机器学习，从而构建学习模型。

以上，说明了本发明的3个实施方式。上述各个实施方式是本发明的优选实施方式，但是不将本发明的范围仅限于上述各个实施方式，能够通过在不脱离本发明主旨的范围内实施了各种变更的方式来实施。例如，能够通过实施了以下记载的变更的方式来实施。

<伺服控制装置具备机器学习装置的变形例>

在上述的实施方式中，通过与伺服控制装置100～102分离的装置构成了机器学习装置200～202，但是也可以通过伺服控制装置100～102来实现机器学习装置200～202的功能的一部分或全部。

<***结构的自由度>

在上述的实施方式中，伺服控制装置100～102与机器学习装置200～202作为1对1的组可通信地连接，但是各个实施方式的结构不限于上述结构。例如，如果以伺服控制装置100和机器学习装置200为例进行说明，则1台机器学习装置200和多个伺服控制装置100直接或经由网络可通信地连接，实施各个伺服控制装置100的机器学习。

此时，机器学习装置200的各个功能可以作为适当分散到多个服务器的分散处理***。另外，机器学习装置200的各个功能也可以在云端利用虚拟服务器功能来实现。

另外，在具有与多个相同的型号名、相同标准或者相同系列的多个伺服控制装置100分别对应的多个控制对象400时，伺服控制***可以构成为共享各个伺服控制装置100中的学习结果。通过这样，伺服控制***能够构建更加适当的模型。

<在线学习、批量学习以及小批量学习>

上述学习部230中的有监督学习可以通过在线学习进行，可以通过批量学习进行，也可以通过小批量学习进行。

在线学习是指在每次由控制对象400驱动并生成训练数据时，立刻进行有监督学习的学习方法。另外，批量学习是指在重复由控制对象400驱动并生成训练数据期间，收集与重复对应的多个训练数据并使用收集到的所有训练数据进行有监督学习的学习方法。进一步，小批量学习是指在线学习与批量学习中间的每当训练数据滞留一定程度时进行有监督学习的学习方法。

另外，上述所说明的各个实施方式能够通过硬件、软件或它们的组合来实现。这里，通过软件实现是指通过计算机读入程序并执行来实现。在通过硬件构成时，例如能够通过LSI(Large Scale Integrated circuit大规模集成电路)、ASIC(Application SpecificIntegrated circuit专用集成电路)、门阵列、FPGA(Field Programmable Gate Array现场可编程门阵列)等集成电路(IC)来构成各个实施方式的一部分或全部。

另外，通过软件和硬件的组合构成各个实施方式的一部分或全部时，计算机的CPU将运算所需要的信息存储在DRAM中，使记述了通过流程图表示的伺服控制装置的动作的全部或一部分的程序进行运行。通过存储了该程序的硬盘、ROM等存储部、存储运算所需的数据的DRAM、CPU以及连接各部的总线来构成计算机。

能够使用各种类型的计算机可读取记录介质(computer readable medium)来存储程序并提供给计算机。计算机可读取记录介质包括各种类型的有实体的记录介质(tangible storage medium)。计算机可读取记录介质包括磁记录介质(例如软盘、磁带、硬盘驱动器)、光磁记录介质(例如光磁盘)、CD-ROM(Read Only Memory)、CD-R、CD-R/W、半导体存储器(例如掩模ROM、PROM(programmable ROM)、EPROM(Erasable PROM)、闪存ROM、RAM(random access memory))。

Claims

1.一种机器学习装置，其特征在于，

具备：

标签取得部，其取得在抑制了干扰的状态下驱动伺服控制装置的控制对象的电流指令作为标签；

输入数据取得部，其取得在抑制了上述干扰的状态下根据上述电流指令进行驱动的控制对象的速度作为输入数据；以及

学习部，其将上述标签与上述输入数据的组作为训练数据来进行有监督学习，由此构建用于根据上述控制对象的速度推定驱动上述控制对象的电流的学习模型。

2.根据权利要求1所述的机器学习装置，其特征在于，

上述控制对象具备电动机和通过该电动机进行移动的负载，通过上述输入数据取得部取得的上述速度是上述电动机的转速和上述负载的速度。

3.根据权利要求1或2所述的机器学习装置，其特征在于，

该机器学习装置还具备：

函数输出部，其根据通过上述学习部构建的上述学习模型，生成用于根据上述控制对象的速度推定驱动上述控制对象的电流的函数，并输出给上述伺服控制装置。

4.根据权利要求1～3中的任意一项所述的机器学习装置，其特征在于，

上述伺服控制装置具备构成电流反馈环的电流控制部和放大器，驱动上述控制对象的电流指令经由上述电流控制部和上述放大器被施加给上述控制对象，

5.一种伺服控制***，其特征在于，

该伺服控制***具备权利要求3所述的机器学习装置、对该机器学习装置输出上述电流指令以及上述控制对象的速度的上述伺服控制装置，

上述伺服控制装置具备：推定电流生成部，其基于从上述函数输出部输出的上述函数，根据上述控制对象的速度推定驱动上述控制对象的电流；减法部，其求出上述电流指令与通过上述推定电流生成部推定出的推定电流之间的差；以及干扰补偿部，其根据上述差来生成用于补偿干扰的修正电流。

6.根据权利要求5所述的伺服控制***，其特征在于，

7.一种伺服控制装置，其特征在于，

具备：

权利要求3所述的机器学习装置；

推定电流生成部，其基于从上述函数输出部输出的上述函数，根据上述控制对象的速度来推定驱动上述控制对象的电流；

减法部，其求出上述电流指令与通过上述推定电流生成部推定出的推定电流之间的差；以及

干扰补偿部，其根据上述差来生成用于补偿干扰的修正电流。

8.根据权利要求7所述的伺服控制装置，其特征在于，

该伺服控制装置具备构成电流反馈环的电流控制部和放大器，驱动上述控制对象的电流指令经由上述电流控制部和上述放大器被施加给上述控制对象，

9.一种机器学习装置的机器学习方法，其特征在于，

将上述标签与上述输入数据的组作为训练数据来进行有监督学习，由此构建用于根据上述控制对象的速度推定驱动上述控制对象的电流的学习模型。