CN112805653A - 定位控制装置以及定位方法 - Google Patents

定位控制装置以及定位方法 Download PDF

Info

Publication number
CN112805653A
CN112805653A CN201980065678.9A CN201980065678A CN112805653A CN 112805653 A CN112805653 A CN 112805653A CN 201980065678 A CN201980065678 A CN 201980065678A CN 112805653 A CN112805653 A CN 112805653A
Authority
CN
China
Prior art keywords
parameter
position command
unit
positioning control
learning
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201980065678.9A
Other languages
English (en)
Other versions
CN112805653B (zh
Inventor
木村将哉
池田英俊
高野直人
增井秀之
松本大作
兼村厚范
麻生英树
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Publication of CN112805653A publication Critical patent/CN112805653A/zh
Application granted granted Critical
Publication of CN112805653B publication Critical patent/CN112805653B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05DSYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
    • G05D3/00Control of position or direction
    • G05D3/12Control of position or direction using feedback
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B13/00Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
    • G05B13/02Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Automation & Control Theory (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Control Of Position Or Direction (AREA)
  • Feedback Control In General (AREA)

Abstract

定位控制装置(40)具有:位置指令生成部(41),根据位置指令参数生成加速区间以及减速区间的加速度的形状被决定的位置指令;驱动控制部(12),以使马达(1)或者控制对象(3)的位置检测值追随于位置指令的方式驱动马达(1);评价部(43),根据关于控制对象(3)的定位控制的执行时的马达(1)或者控制对象(3)的位置检测值来计算与定位性能有关的评价值;以及学习部(44),一边将根据位置指令参数而决定的加速区间和减速区间中的加速度的形状分别独立地进行变更,一边学习执行多次定位控制的情况下的位置指令参数与评价值的关系,学习位置指令参数与评价值的关系,得到学习结果。

Description

定位控制装置以及定位方法
技术领域
本发明涉及关于控制对象进行定位控制的定位控制装置以及定位方法。
背景技术
在如电子部件安装机或者半导体制造装置那样通过伺服马达的驱动使作为控制对象的头部反复移动的装置中,为了提高生产性能,要求关于伺服马达进行高速的控制。当伺服马达高速地进行动作时,有时产生由于装置的刚性低而引起的机械振动。在该情况下,如果适当地调整伺服马达的位置指令的指令形状,则即使在受到机械振动的影响的状况下,也能够实现高速的定位控制。因此,要求适当地调整位置指令的指令形状。
作为用于调整伺服马达的指令形状的以往技术,提出有下述专利文献1、专利文献2以及专利文献3各自所记载的技术。专利文献1公开有如下技术:在使用了控制对象的模型的仿真中,反复进行使用了遗传算法的指令形状的探索和控制对象的模型的响应的评价,从而找到仿真中的最佳的指令形状。专利文献1所公开的技术为使用了仿真的指令形状的调整手段。
专利文献2公开有当在仿真中找到最佳的指令形状之后,使用实机来进行指令形状的探索的技术。专利文献2所公开的技术特征在于,在使用了实机的指令形状的探索中,根据在仿真中找到的最佳的指令形状来决定探索范围。专利文献1以及专利文献2都公开有活用仿真来进行指令形状的调整的技术。
专利文献3公开有如下技术:预先准备并保持多个指令形状,对这些多个指令形状一个一个地执行使用了实机的定位动作,调查响应,探索表示良好的响应的指令形状。
现有技术文献
专利文献
专利文献1:日本特开2004-240609号公报
专利文献2:日本特开2009-122779号公报
专利文献3:日本特开2016-19304号公报
发明内容
如上述那样,专利文献1以及专利文献2都公开有活用仿真来进行指令形状的调整的技术。专利文献1所公开的技术是对实机的响应进行仿真而进行指令形状的最佳化的技术,但为了对实机的响应进行仿真,需要实机的数学模型。一般而言,在数学模型中包含模型化误差,所以数学模型难以完全再现实机的响应。在仿真中发现的最佳值与实机的最佳值不同,所以即使将在仿真中找到的最佳的指令形状应用于实机,实机也不呈现如所期待那样的良好的响应。也就是说,在专利文献1所公开的技术中,存在无法得到在实机中使定位控制高速化那样的良好的指令形状这样的课题。
在专利文献2所公开的技术中,在进行仿真之后进行使用了实机的指令形状的调整。在该技术中,根据仿真的结果来决定调整时的探索范围,所以例如有可能由于模型化误差的影响而探索范围不被适当地设定。也就是说,在专利文献2所公开的技术中,包括良好的指令形状的范围有可能不被设定为探索范围。
专利文献3所公开的技术对预先准备的多个指令形状一个一个地执行使用了实机的定位动作,调查响应,找到最好的指令形状。使伺服马达进行动作的指令形状的图案存在无数个,所以如果对预先准备的多个指令形状全部进行使用了实机的定位动作,则定位动作的次数变得巨大。即使想要为了降低定位动作的次数而缩小指令形状的探索范围来进行设定,由于无法提供适当地设定探索范围的手段,所以也有可能在探索范围之中不存在表示良好的响应的指令形状。也就是说,在专利文献3所公开的技术中,存在无法找到良好的指令形状这样的课题。
如上述那样,在以往技术中,无法效率良好地进行使定位控制高速化的指令形状的调整。
本发明是鉴于上述问题而完成的,其目的在于得到效率良好地进行用于使定位控制高速化的指令形状的调整的定位控制装置。
为了解决上述课题,达到目的,本发明为一种定位控制装置,驱动马达而使控制对象移动目标移动距离,其中,所述定位控制装置具有:位置指令生成部,根据位置指令参数生成加速区间以及减速区间的加速度的形状被决定的位置指令;以及驱动控制部,以使所述马达或者所述控制对象的位置检测值追随于所述位置指令的方式驱动所述马达。本发明还具有评价部,该评价部根据关于所述控制对象的定位控制的执行时的所述马达或者所述控制对象的位置检测值,计算与定位性能有关的评价值。本发明还具有学习部,该学习部一边将根据所述位置指令参数决定的加速区间和减速区间中的加速度的形状分别独立地进行变更,一边学习执行多次定位控制的情况下的所述位置指令参数与所述评价值的关系,学习所述位置指令参数与所述评价值的关系,得到学习结果。
根据本发明,能够得到能够效率良好地进行用于使定位控制高速化的指令形状的调整这样的效果。
附图说明
图1是示出实施方式1的定位控制装置的结构的图。
图2是示出在实施方式1中使用的位置指令、作为位置指令的一阶微分的速度指令、作为位置指令的二阶微分的加速度指令以及作为加速度指令的一阶微分的急动度(加加速度)各自的形状的例子的图。
图3是示出在实施方式1中使用根据从第1组至第3组为止的位置指令参数而生成的各指令形状而进行定位控制的情况下的目标移动距离与位置检测值的偏差的时间响应的图。
图4是示出在实施方式1中使用的神经网络的图。
图5是示出实施方式1中的目标移动距离与优良参数的关系的图表。
图6是示出实施方式2的定位控制装置的结构的图。
图7是示出实施方式2中的目标停止位置与优良参数的关系的图表。
图8是示出实施方式3的定位控制装置的结构的图。
图9是示出实施方式3中的偏差的时间响应的图。
图10是示出在实施方式3中使用第4组位置指令参数和第5组位置指令参数的情况下的偏差的时间响应的图。
图11是示出实施方式1的定位控制装置所具有的位置指令生成部、驱动控制部、评价部、学习部、学习结果保持部以及参数范围设定部的一部分或者全部的功能由处理器实现的情况下的处理器的图。
图12是示出实施方式1的定位控制装置所具有的位置指令生成部、驱动控制部、评价部、学习部、学习结果保持部以及参数范围设定部的一部分或者全部由处理电路实现的情况下的处理电路的图。
图13是示出实施方式4的定位控制装置的结构的图。
图14是示出调整实施方式4的定位控制装置调整位置指令参数时的动作的过程的流程图。
图15是用于说明由实施方式4的定位控制装置得到的效果的第1图。
图16是用于说明由实施方式4的定位控制装置得到的效果的第2图。
图17是示出实施方式5的定位控制装置的结构的图。
图18是示出实施方式6的定位控制装置的结构的图。
符号说明
1:马达;2:滚珠丝杠;3:控制对象;4:位置检测器;10、20、30、40、50、60:定位控制装置;11、41、51、61:位置指令生成部;12:驱动控制部;13、33、43:评价部;14、44、54、64:学习部;15;25:学习结果保持部;16、26:参数范围设定部;17、27:运转条件;68:动作模拟部;68a:动作模拟对象;71:处理器;72:存储器;81:处理电路。
具体实施方式
以下,根据附图,详细地说明本发明的实施方式的定位控制装置以及定位方法。此外,本发明并不被该实施方式限定。
实施方式1.
图1是示出实施方式1的定位控制装置10的结构的图。定位控制装置10是驱动马达1而使控制对象3移动目标移动距离的装置,与马达1和位置检测器4连接。马达1经由滚珠丝杠2对控制对象3提供转矩以及推力,使控制对象3移动。马达1能够驱动控制对象3即可。马达1的例子为旋转型伺服马达、线性马达或者步进马达。
控制对象3通过马达1被移动所期望的目标移动距离。控制对象3为需要定位控制的机械或者部件。控制对象3的例子为电子部件安装机或者半导体制造装置的头部部分。
位置检测器4检测马达1的旋转位置或者控制对象3的位置,将表示位置检测值的信息输出到定位控制装置10。位置检测值为由位置检测器4进行的检测的结果。位置检测器4的例子为编码器或者线性刻度尺。
从定位控制装置10的外部对定位控制装置10提供运转条件17。运转条件17为包含用于驱动马达1的目标移动距离的信息。目标移动距离为控制对象3被移动时的所期望的距离。定位控制装置10以满足运转条件17的方式执行关于控制对象3的定位控制。
定位控制装置10具有位置指令生成部11,该位置指令生成部11根据规定位置指令的形状的位置指令参数来生成用于驱动马达1而使控制对象3移动目标移动距离的该位置指令。位置指令生成部11根据位置指令参数而生成加速区间以及减速区间的加速度形状被决定的位置指令。定位控制装置10还具有驱动控制部12,该驱动控制部12以使马达1或者控制对象3的位置检测值追随于由位置指令生成部11生成的位置指令的方式驱动马达1。
定位控制装置10还具有评价部13,该评价部13根据关于控制对象3的定位控制的执行时的马达1或者控制对象3的位置检测值来计算用于评价由驱动控制部12进行的定位控制的好坏的评价值。评价部13根据关于控制对象3的定位控制的执行时的马达1或者控制对象3的位置检测值来计算与定位性能有关的评价值。
定位控制装置10还具有学习部14,该学习部14学习在规定位置指令参数的上限值以及下限值的参数范围内变更位置指令参数而执行了多次关于控制对象3的定位控制的情况下的位置指令参数与由评价部13计算出的评价值的关系,得到学习结果。学习部14一边将根据位置指令参数决定的加速区间和减速区间中的加速度的形状分别独立地进行变更,一边学习执行了多次定位控制的情况下的位置指令参数与评价值的关系,学习位置指令参数与评价值的关系而得到学习结果。进一步而言,学习部14根据学习结果来决定位置指令参数。
定位控制装置10还具有学习结果保持部15,该学习结果保持部15将包含表示目标移动距离的信息的运转条件17与由学习部14得到的学习结果对应起来保持。学习结果保持部15的一部分为存储部。存储部的例子为半导体存储器。定位控制装置10还具有参数范围设定部16,该参数范围设定部16根据由学习结果保持部15保持的运转条件17和学习结果来变更参数范围。以下,进一步说明位置指令生成部11、驱动控制部12、评价部13、学习部14、学习结果保持部15以及参数范围设定部16。
位置指令生成部11根据位置指令参数和运转条件17,生成马达1的位置指令而输出。位置指令参数为规定位置指令的指令形状的参数。图2是示出在实施方式1中使用的位置指令、作为位置指令的一阶微分的速度指令、作为位置指令的二阶微分的加速度指令以及作为加速度指令的一阶微分的急动度(加加速度)各自的形状的例子的图。图2示出了包含表示目标移动距离的信息的运转条件17被提供给定位控制装置10的情况下的各指令以及急动度的形状的例子。
如图2所示,实施方式1中的加速度指令在从第1区间至第3区间为止的区间中是示出加速方向的梯形形状的指令,在第4区间中是0,在从第5区间至第7区间为止的区间中是示出减速方向的梯形形状的指令。第1区间表示加速开始的区间,第3区间表示加速结束的区间,第5区间表示减速开始的区间,第7区间表示减速结束的区间。将第m区间的时间长度设为第m时间长度Tm。m为1至7的整数。也就是说,第1区间的时间长度为第1时间长度T1。
在图2的加速度指令中,从第1区间至第3区间为止的加速区间的梯形形状与从第5区间至第7区间为止的减速区间的梯形形状也可以不全等。也可以将加速区间的第1时间长度T1和第3时间长度T3设为0,将加速度指令的形状设为矩形形状。在实施方式1中,从第1时间长度T1至第7时间长度T7为止的7个参数为位置指令参数。指令形状是根据位置指令参数和目标移动距离来规定的。指令形状的计算方法将在后面叙述。
驱动控制部12以使马达1的旋转位置追随于位置指令的方式对马达1供给电流。例如,驱动控制部12从位置检测器4获取表示马达1的旋转位置的信息,以使马达1的旋转位置与位置指令的偏差变小的方式,根据PID(Proportional-Integral-Differential,比例-积分-微粉)控制来计算向马达1供给的电流的值,将通过计算而得到的值的电流供给到马达1。此外,驱动控制部12只要使马达1的旋转位置追随于位置指令,就可以是任意的。例如,驱动控制部12也可以进行对反馈控制施加前馈控制的双自由度控制。
驱动控制部12也可以不是以使马达1的旋转位置追随于位置指令的方式驱动马达1,而是检测控制对象3的位置作为用于反馈控制的信号,以使控制对象3的位置追随于位置指令的方式驱动马达1。
评价部13从位置检测器4接收表示作为由位置检测器4进行的检测的结果的位置检测值的信息,通过后述方法来计算用于评价由驱动控制部12进行的定位控制的好坏的评价值Q而输出。驱动控制部12根据位置指令来进行动作,位置指令是根据位置指令参数来计算出的。因而,由评价部13计算的评价值Q取决于位置指令参数的值。也就是说,可以说评价值Q是用于评价位置指令参数的指标。
接下来,说明评价值Q的具体的计算方法。将从定位控制的开始至目标移动距离与位置检测值的偏差的大小变得比预先确定的容许值IMP小的定位完成为止的时间设为定位时间Tst。在定位时间Tst小的情况下,以使评价值Q示出大的值的方式设定下述式(1)。
[式1]
Q=-Tst…(1)
根据式(1),定位时间Tst越小,则评价值Q成为越大的值。也就是说,在实施方式1中,可以说评价值Q为越大的值,则位置指令参数越优良。但是,评价值Q只要能够评价定位控制,就不限定于通过式(1)确定的评价值。例如,也可以将定位时间Tst本身作为评价值Q,评价值Q为越小的值,则位置指令参数被定义为越优良。
学习部14将评价值Q和参数范围作为输入,学习位置指令参数与评价值Q的关系,输出学习结果。具体而言,在学习部14中,构成将位置指令参数作为输入,将评价值Q作为输出的神经网络,学习部14更新神经网络的权重系数来进行学习。在更新权重系数而进行学习的情况下,神经网络输出与位置指令参数对应的评价值Q的良好的推测值。学习部14使用神经网络,得到将位置指令参数作为输入,将评价值Q作为输出的函数,从而作为学习结果而得到位置指令参数与评价值Q的关系式。学习部14只要能够学习位置指令参数与评价值Q的关系,就可以不通过使用神经网络的方法来学习位置指令参数与评价值Q的关系。
学习部14从规定的参数范围之中选定用于执行接下来的定位控制的位置指令参数而输出。学习部14当进行接下来的位置指令参数的选定时,既可以根据学习结果来选定表示优良的评价值的位置指令参数,也可以从以等间隔刻画各位置指令参数的网格的点之中依次选定位置指令参数。学习部14具有更新根据位置指令参数来计算评价值Q的函数的功能。
学习结果保持部15将学习部14的学习结果作为输入,将学习结果与目标移动距离对应起来保持。学习结果保持部15根据作为学习结果的位置指令参数与评价值Q的关系式,通过数值计算,求出评价值Q最大的位置指令参数。例如,学习结果保持部15使用网格探索、随机探索或者牛顿法这样的最佳化算法来求出使评价值Q最大的位置指令参数。
学习结果保持部15求出使评价值Q最大的位置指令参数作为优良参数(第一优良参数),将优良参数与目标移动距离对应起来输出。但是,学习结果保持部15无需求出在满足位置指令参数与评价值Q的关系式的位置指令参数之中评价值Q真正的最大值的位置指令参数。学习结果保持部15将表示满足预先确定的基准的良好的定位控制的位置指令参数作为优良参数即可。学习结果保持部15具有将一个以上的位置指令参数保持为优良参数的功能。
参数范围设定部16根据优良参数和运转条件17中包含的信息所表示的目标移动距离,决定规定位置指令参数的上限值和下限值的参数范围。参数范围设定部16根据由学习部14得到的学习结果,设定规定位置指令参数的上限值以及下限值的参数范围。参数范围设定部16将比由学习结果保持部15保持的优良参数小的值作为参数范围的下限,并且将比优良参数大的值作为参数范围的上限,由此设定参数范围。
参数范围设定部16在运转条件17中包含的信息所表示的目标移动距离被变更的情况下,根据过去执行学习时的目标移动距离来进行插值计算,推测与变更后的目标移动距离对应的插值点的优良参数。除此之外,参数范围设定部16将比推测出的插值点的优良参数小的值作为参数范围的下限,并且将比推测出的插值点的优良参数大的值作为参数范围的上限,由此设定参数范围。
例如,参数范围设定部16制作表示目标移动距离与优良参数的关系的1次函数公式,如果目标移动距离被变更,则根据制作出的1次函数公式,求出关于变更后的目标移动距离的优良参数的推测值。参数范围设定部16将比优良参数的推测值大的值设定成上限值,将比优良参数的推测值小的值设定成下限值。在存在多个位置指令参数的情况下,参数范围设定部16关于多个位置指令参数分别设定上限值以及下限值。
参数范围设定部16只要能够得到与新的目标移动距离对应的优良参数的推测值,就可以根据表示优良参数与目标移动距离的关系的1次函数公式以外的规则来计算优良参数的推测值。
进一步说明实施方式1的定位控制装置10的功能。学习部14在用参数范围定义的范围内决定1组位置指令参数,将所决定的位置指令参数输出到位置指令生成部11。位置指令生成部11根据所输入的位置指令参数来计算位置指令。
说明位置指令的计算方法。将第2区间的加速度的大小定义为Aa,将第6区间的加速度的大小定义为Ad。第2区间的加速度的大小Aa和第6区间的加速度的大小Ad为位置指令参数的从属变量,所以它们没有设定自由度。位置指令生成部11使用下述式(2)、式(3)或者式(4),分别计算“0≤t<T1”的范围的时间t中的第1区间的加速度指令A1、速度指令V1以及位置指令P1。
[式2]
Figure BDA0003006958340000101
[式3]
Figure BDA0003006958340000102
[式4]
Figure BDA0003006958340000103
位置指令生成部11使用下述式(5)、式(6)或者式(7),分别计算“T1≤t<T1+T2”的范围的时间t中的第2区间的加速度指令A2、速度指令V2以及位置指令P2。
[式5]
A2(t)=Aa…(5)
[式6]
Figure BDA0003006958340000111
[式7]
Figure BDA0003006958340000112
位置指令生成部11使用下述式(8)、式(9)或者式(10),分别计算“T1+T2≤t<T1+T2+T3”的范围的时间t中的第3区间的加速度指令A3、速度指令V3以及位置指令P3。
[式8]
Figure BDA0003006958340000113
[式9]
Figure BDA0003006958340000114
[式10]
Figure BDA0003006958340000115
位置指令生成部11使用下述式(11)、式(12)或者式(13),分别计算“T1+T2+T3≤t<T1+T2+T3+T4”的范围的时间t中的第4区间的加速度指令A4、速度指令V4以及位置指令P4。
[式11]
A4(t)=0…(11)
[式12]
Figure BDA0003006958340000116
[式13]
Figure BDA0003006958340000121
位置指令生成部11使用下述式(14)、式(15)或者式(16),分别计算“T1+T2+T3+T4≤t<T1+T2+T3+T4+T5”的范围的时间t中的第5区间的加速度指令A5、速度指令V5以及位置指令P5。
[式14]
Figure BDA0003006958340000122
[式15]
Figure BDA0003006958340000123
[式16]
Figure BDA0003006958340000124
位置指令生成部11使用下述式(17)、式(18)或者式(19),分别计算“T1+T2+T3+T4+T5≤t<T1+T2+T3+T4+T5+T6”的范围的时间t中的第6区间的加速度指令A6、速度指令V6以及位置指令P6。
[式17]
A6(t)=-Ad…(17)
[式18]
Figure BDA0003006958340000125
[式19]
Figure BDA0003006958340000126
位置指令生成部11使用下述式(20)、式(21)或者式(22),分别计算“T1+T2+T3+T4+T5+T6≤t≤T1+T2+T3+T4+T5+T6+T7”的范围的时间t中的第7区间的加速度指令A7、速度指令V7以及位置指令P7。
[式20]
Figure BDA0003006958340000131
[式21]
Figure BDA0003006958340000132
[式22]
Figure BDA0003006958340000133
在终止时间t=T1+T2+T3+T4+T5+T6+T7中,速度指令需要与0一致,位置指令需要与目标移动距离D一致。因此,在终止时间中,下述式(23)以及式(24)成立。
[式23]
V7=0…(23)
[式24]
P7=D…(24)
由上述式(5)以及式(17)决定第2区间的加速度的大小Aa以及第6区间的加速度的大小Ad。如上所述,根据指令参数和目标移动距离D来计算指令形状。
如上述那样,另外,如图2所示,在第1区间、第3区间、第5区间以及第7区间,加速度为时间的一次函数。因此,在这些区间,如图2所示,作为加速度的一阶微分的急动度为非零的固定值。即,可以说第1时间长度T1、第3时间长度T3、第5时间长度T5以及第7时间长度T7规定了急动度成为非零的固定值的时间。非零的固定值为比0大的固定值或者比0小的固定值。
在这些区间,也可以选择代替时间长度而指定急动度的大小的参数。例如,当将第1区间的急动度的大小定义为J1时,急动度J1能够如下述式(25)所示,使用第1时间长度T1来计算。
[式25]
Figure BDA0003006958340000141
也就是说,将急动度为非零的固定值的区间的时间定义为参数这一情况与将急动度为非零的固定值的区间的急动度的大小定义为参数这一情况是等效的。这样,在规定指令形状的参数的选择的方式中存在任意性,规定指令形状的参数的选择不限定于上述方法。
如上所述,在实施方式1的位置指令生成部11执行的指令生成方法中,为了规定指令形状,使用7个位置指令参数。与在以往技术中大量使用的根据加速度以及速度这两个参数来规定指令形状的方法相比,实施方式1中的调整的自由度比以往的调整的自由度高。因此,只要能够适当地调整位置指令参数,则定位控制装置10即使在受到载置有控制对象3的装置的机械振动的影响的状况下,也能够实现表示良好的响应的定位控制。
另一方面,在载置有控制对象3的装置的操作者一边使该装置进行动作,一边由于试行错误而通过人手来调整上述7个参数的情况下,需要比较大的劳力以及比较长的时间。以下,说明定位控制装置10具有评价部13、学习部14以及学习结果保持部15,从而定位控制装置10不需要操作者的试行错误,就能够适当地调整位置指令参数。
根据评价部13以及学习部14的动作,反复执行由学习部14进行的位置指令参数的变更、使用变更后的位置指令参数的定位控制以及由评价部13进行的评价值Q的计算。说明该反复执行的评价部13以及学习部14的动作。
学习部14在规定位置指令参数的上限值以及下限值的参数范围内选定位置指令参数。说明执行3次评价部13以及学习部14的动作,评价直至第3组为止的位置指令参数的过程。将第1组位置指令参数记载为位置指令参数Pr1,将第2组位置指令参数记载为位置指令参数Pr2,将第3组位置指令参数记载为位置指令参数Pr3。3组位置指令参数分别具有从第1时间长度T1至第7时间长度T7为止的7个参数。
图3是示出在实施方式1中使用根据从第1组至第3组为止的位置指令参数而生成的各指令形状而进行定位控制的情况下的目标移动距离与位置检测值的偏差的时间响应的图。图3(a)示出了使用第1组位置指令参数的情况下的偏差的时间响应。图3(b)示出了使用第2组位置指令参数的情况下的偏差的时间响应。图3(c)示出了使用第3组位置指令参数的情况下的偏差的时间响应。
从学习部14输出第1组位置指令参数Pr1,位置指令生成部11根据第1组位置指令参数Pr1来生成位置指令。使用根据第1组位置指令参数Pr1而生成的位置指令,执行定位控制。评价部13根据该情况下的位置检测值,获取与第1组位置指令参数Pr1对应的定位时间Tst1。将从定位控制的开始至目标移动距离与位置检测值的偏差的大小变得比预先确定的容许值IMP小的定位完成为止的时间设为定位时间。使用下述式(26)计算与第1组位置指令参数Pr1对应的评价值Q1。
[式26]
Q1=-Tstl…(26)
学习部14接收评价值Q1,将位置指令参数变更为第2组位置指令参数Pr2。学习部14在变更位置指令参数时,既可以根据使用第1组位置指令参数Pr1的定位控制的结果来选定第2组位置指令参数Pr2,也可以不论使用第1组位置指令参数Pr1的定位控制的结果如何,都如预先确定那样选定第2组位置指令参数Pr2。
当学习部14变更位置指令参数时,使用根据第2组位置指令参数Pr2而生成的位置指令来执行定位控制。评价部13根据该情况下的位置检测值,获取与第2组位置指令参数Pr2对应的定位时间Tst2。将从定位控制的开始至目标移动距离与位置检测值的偏差的大小变得比容许值IMP小的定位完成为止的时间设为定位时间。使用下述式(27)来计算与第2组位置指令参数Pr2对应的评价值Q2。
[式27]
Q2=-Tst2…(27)
学习部14接收评价值Q2,将位置指令参数变更为第3组位置指令参数Pr3。评价部13与得到评价值Q1和评价值Q2的过程同样地,根据定位时间Tst3,使用下述式(28)计算评价值Q3。
[式28]
Q3=-Tst3…(28)
学习部14接收评价值Q3。如图3所示,当得到Tst2<Tst1<Tst3这样的结果时,在3个评价值之中,评价值Q2为最大的值。通过此前的评价部13以及学习部14的动作,学习部14得到与3组位置指令参数Pr1、位置指令参数Pr2以及位置指令参数Pr3对应的评价值Q1、评价值Q2以及评价值Q3。
评价部13以及学习部14如上所述反复实施获取与位置指令参数对应的评价值Q的动作。
学习部14将位置指令参数和与位置指令参数对应的评价值Q作为学习用数据,进行使用了神经网络的学习动作。图4是示出在实施方式1中使用的神经网络的图。该神经网络具有输入层、中间层以及输出层。对左端的输入层输入位置指令参数,从右端的输出层输出评价值Q。从输入层的各节点针对中间层的各节点的权重系数全部能够独立地设定,但在图4中,它们全部被记载为相同的权重系数W1。同样地,从中间层的各节点针对输出层的各节点的权重系数全部被记载为相同的权重系数W2。
对输入层的各节点的输出值乘以权重系数W1,通过相乘而得到的结果的线性结合被输入到中间层的各节点。对中间层的各节点的输出值乘以权重系数W2,通过相乘而得到的结果的线性结合被输入到输出层的节点。在各层的各节点处,例如也可以利用S型函数(Sigmoid函数)这样的非线性函数根据输入值来计算输出值。在输入层以及输出层,输出值也可以为输入值的线性结合。
学习部14使用位置指令参数和评价值Q,计算神经网络的权重系数W1和权重系数W2。神经网络的权重系数W1以及权重系数W2能够通过使用误差反向传播法或者梯度下降法来计算。但是,只要是得到神经网络的权重系数的计算方法,权重系数W1以及权重系数W2的计算方法就不限于上述方法。
如果神经网络的权重系数被决定,则会得到位置指令参数与评价值Q的关系式。此前,示出了进行使用了3层的神经网络的学习的例子。使用了神经网络的学习不限定于上述例子。
通过此前的评价部13以及学习部14的动作,作为学习结果而得到基于神经网络的关系式。
接下来,进一步说明学习结果保持部15。如上所述,如果通过评价部13以及学习部14的动作而得到基于神经网络的关系式,则会作为学习结果而得到将位置指令参数作为输入,将评价值Q作为输出的函数。如果使用该学习结果,则即使不对新的位置指令参数执行定位控制,也能够得到与该新的位置指令参数对应的评价值Q。
学习结果保持部15根据作为学习结果的位置指令参数与评价值Q的关系式,通过数值计算来求出评价值Q最大的位置指令参数。此时,学习结果保持部15例如使用网格探索、随机探索或者牛顿法这样的最佳化算法。
如上所述,能够通过评价部13以及学习部14的动作来学习指令参数与评价值的关系。除此之外,根据学习结果保持部15的动作,通过使用学习结果,能够找到如使评价值Q成为最大那样的优良的位置指令参数。如果使用该学习结果,则即使不实施定位控制,也能够获取与位置指令参数对应的评价值Q,所以定位控制装置10未必进行使用了优良参数的定位控制,也能够找到优良参数。因而,定位控制装置10不需要操作者的试行错误,能够适当地调整位置指令参数。
接下来,进一步说明参数范围设定部16。如上所述,学习结果保持部15根据学习结果来求出使评价值Q成为最大的位置指令参数,将所求出的位置指令参数作为优良参数。学习结果保持部15将运转条件17中包含的信息所表示的目标移动距离D与优良参数一并保持。当在多个不同的运转条件下进行了学习的情况下,学习结果保持部15保持与多个目标移动距离D对应的多个优良参数。
参数范围设定部16根据保持于学习结果保持部15的运转条件17和学习结果来设定参数范围。接下来,使用图5,说明由参数范围设定部16进行的参数范围的设定方法。图5是示出实施方式1中的目标移动距离D与优良参数的关系的图表。在图5中,优良参数用目标移动距离D的1维的函数表达。
设想已经实施关于目标移动距离D1以及目标移动距离D2的学习,找到与目标移动距离D1对应的优良参数Pex1和与目标移动距离D2对应的优良参数Pex2,并保持于学习结果保持部15。设想在该状况下,关于与目标移动距离D1和目标移动距离D2都不同的目标移动距离D3进行学习。学习结果保持部15使用下述式(29),进行插值计算,推测与目标移动距离D3对应的优良参数Pex3。
[式29]
Figure BDA0003006958340000181
如式(29)所示,学习结果保持部15作为推测优良参数Pex3的插值方法,进行使用了过去的两个学习结果的线性插值。然而,学习结果保持部15也可以不进行线性插值,而通过使用样条插值或者拉格朗日插值的方法来推测优良参数Pex3。
参数范围设定部16使用推测出的优良参数Pex3,使用下述式(30)或者式(31)计算参数范围的上限值UL和下限值LL。
[式30]
UL=1.5×Pex3…(30)
[式31]
LL=0.5×Pex3…(31)
上述上限值UL以及下限值LL的计算方法为上限值UL以及下限值LL的计算方法的一个例子。上限值UL以及下限值LL的计算方法为将比推测的优良参数Pex3大的值设为上限值UL,将比优良参数Pex3小的值设为下限值LL而计算的方法即可,不限定于上述计算方法。
参数范围设定部16将通过计算而得到的上限值UL以及下限值LL设为新的参数范围的上限值以及下限值,变更参数范围。
如上述那样,参数范围设定部16根据学习结果来计算参数范围的上限值UL和下限值LL,所以定位控制装置10无需为了变更参数范围而进行装置的操作者的试行错误。
在目标移动距离D被变更的情况下,参数范围设定部16能够将与变更后的目标移动距离D对应的优良参数的推测值的周边设定为参数范围,能够将参数范围缩小得小。因此,参数范围设定部16能够以更少的定位控制的试行次数找到优良参数。因此,定位控制装置10能够在短时间内进行位置指令的指令形状的调整。
在实施方式1中,示出了规定指令形状的位置指令参数的个数为7个的例子。在通过更多的参数来提供更高的设计自由度的情况下,也能够应用实施方式1的方法。针对设计自由度更小的情况,也能够应用实施方式1的方法。
在实施方式1中,为了构建位置指令参数与评价值Q的关系式,使用了神经网络。然而,只要能够得到位置指令参数与评价值Q的关系,就也可以不使用神经网络。例如既可以根据如2次多项式那样的简单的函数来得到位置指令参数与评价值Q的关系,也可以根据如高斯过程模型那样的概率模型来得到位置指令参数与评价值Q的关系。
在实施方式1中,叙述了在目标移动距离被变更时能够适当地设定指令形状的探索范围,但参数范围设定部16带来的效果不限于仅在目标移动距离的变更时得到。例如,在由于基于装置的连续运转的发热或者经年劣化的影响而装置的机械振动的特性发生变化的情况下,定位控制装置10能够探索通过过去的学习找到的优良参数的周边,所以能够以更少的定位控制的试行次数找到应对机械特性的变化的良好的位置指令参数。
实施方式1的定位控制装置10在目标移动距离被变更的情况下,也能够适当地设定指令形状的探索范围,进而能够效率良好地进行指令形状的调整。
因此,实施方式1的定位控制装置10能够在探索使定位控制高速化的良好的指令形状时,适当地设定指令形状的探索范围,进而能够效率良好地进行指令形状的调整。
位置指令生成部11也可以以存在作为对位置指令的信号进行二次微分的信号的加速度指令信号成为比零大的固定值或者比零小的固定值的时间的方式,规定位置指令的信号的形状。位置指令生成部11也可以以存在作为对位置指令的信号进行三次微分的信号的急动度的信号成为比零大的固定值或者比零小的固定值的时间的方式,规定位置指令的信号的形状。位置指令生成部11也可以将表示急动度的信号成为比零大的固定值或者比零小的固定值的时间的信息包含于位置指令参数。位置指令生成部11也可以将表示急动度的信号成为比零大的固定值或者比零小的固定值的时间中的急动度的信号的大小的信息包含于位置指令参数。
在实施方式1中,学习部14作为学习结果而得到将位置指令参数作为输入来计算评价值Q的推测值的函数,但除此之外,也可以将用于定位控制的位置指令参数与通过执行定位控制而得到的评价值Q的组包含于学习结果。由此,学习结果保持部15从位置指令参数与通过执行定位控制而得到的评价值Q的组之中也能够选定优良参数。
根据实施方式1的定位控制装置10,通过学习部14的学习而得到的位置指令参数设定于位置指令生成部(学习器)11,位置指令生成部(学习器)11生成位置指令,从而能够实现高速的定位控制。
实施方式2.
实施方式1的定位控制装置10在定位控制的目标移动距离被变更的情况下也适当地设定指令形状的探索范围,效率良好地探索指令形状。在实施方式2中,说明在定位控制的目标停止位置被变更的情况下也能够适当地设定指令形状的探索范围的定位控制装置。
图6是示出实施方式2的定位控制装置20的结构的图。如图6所示,定位控制装置20与马达1和位置检测器4连接。从定位控制装置20的外部对定位控制装置20提供运转条件27。运转条件27包含用于驱动马达1的目标移动距离的信息和目标停止位置的信息。定位控制装置20以满足运转条件27的方式执行定位控制。
定位控制装置20具有位置指令生成部11、驱动控制部12、评价部13、学习部14、学习结果保持部25以及参数范围设定部26。在实施方式2中,关于在实施方式1中说明的构成要素,省略详细的说明。
学习结果保持部25将学习部14的学习结果作为输入,将学习结果与目标停止位置对应起来保持。学习结果保持部25根据作为学习结果的位置指令参数与评价值的关系式,通过数值计算,求出评价值最大的位置指令参数。例如,学习结果保持部25使用网格探索、随机探索或者牛顿法这样的最佳化算法,求出使评价值成为最大的位置指令参数。学习结果保持部25求出评价值最大的位置指令参数作为优良参数(第二优良参数)并进行保持,将优良参数与目标停止位置对应起来输出。
学习结果保持部25也可以不将使评价值成为最大的位置指令参数作为优良参数,而将表示良好的定位控制的位置指令参数作为优良参数。
参数范围设定部26根据优良参数和运转条件27中包含的信息所表示的目标停止位置,决定规定位置指令参数的上限值和下限值的参数范围而输出。参数范围设定部26在运转条件27中包含的信息所表示的目标停止位置被变更的情况下,根据过去执行学习时的目标停止位置来进行插值计算,推测与变更后的目标停止位置对应的插值点的优良参数。除此之外,参数范围设定部26将比推测出的插值点的优良参数小的值作为参数范围的下限,并且将比推测出的插值点的优良参数大的值作为参数范围的上限,由此设定参数范围。
具体而言,参数范围设定部26制作表示目标停止位置与优良参数的关系的1次函数公式,如果目标停止位置被变更,则根据制作出的1次函数式,求出关于变更后的目标停止位置的优良参数的推测值。参数范围设定部26将比优良参数的推测值大的值设定为上限值,将比优良参数的推测值小的值设定为下限值。在存在多个位置指令参数的情况下,参数范围设定部26关于多个位置指令参数分别规定上限值以及下限值。
参数范围设定部26如果能够得到与变更后的目标停止位置对应的优良参数的推测值,则也可以不制作表示优良参数与目标停止位置的关系的1次函数式,而根据其它规则来进行计算。
除了参数范围设定部26根据目标停止位置来决定参数范围这点之外,定位控制装置20的动作与实施方式1的定位控制装置10的动作相同。因此,通过评价部13、学习部14以及学习结果保持部25的动作而得到的效果与在实施方式1中说明的效果相同。
学习结果保持部25根据学习部14的学习结果,求出使评价值Q成为最大的位置指令参数,将所求出的位置指令参数作为优良参数。学习结果保持部25将运转条件27中包含的信息所表示的目标停止位置和优良参数一并保持。当在多个不同的运转条件下进行了学习的情况下,学习结果保持部25保持与多个目标停止位置SP对应的多个优良参数。
参数范围设定部26根据由学习结果保持部25保持的运转条件27和学习结果来设定参数范围。使用图7,说明此时的参数范围的设定方法。图7是示出实施方式2中的目标停止位置SP与优良参数的关系的图表。在图7中,优良参数用目标停止位置SP的1维函数表达。
设想关于目标停止位置SP1和目标停止位置SP2已经实施学习,找到关于目标停止位置SP1的优良参数Pex1和关于目标停止位置SP2的优良参数Pex2,由学习结果保持部25保持。设想在该状况下,关于与目标停止位置SP1和目标停止位置SP2都不同的目标停止位置SP3进行学习。使用下述式(32),推测与目标停止位置SP3对应的优良参数Pex3。
[式32]
Figure BDA0003006958340000221
如式(32)所示,学习结果保持部25作为推测优良参数Pex3的插值方法,进行使用了过去的两个学习结果的线性插值。然而,学习结果保持部25也可以不进行线性插值,而通过使用样条插值或者拉格朗日插值的方法来推测优良参数Pex3。
参数范围设定部26使用推测出的优良参数Pex3,使用下述式(33)或者式(34)计算参数范围的上限值UL和下限值LL。
[式33]
UL=1.5×Pex3…(33)
[式34]
LL=0.5×Pex3…(34)
上述上限值UL以及下限值LL的计算方法为上限值UL以及下限值LL的计算方法的一个例子。上限值UL以及下限值LL的计算方法为将比推测的优良参数Pex3大的值设为上限值UL,将比优良参数Pex3小的值设为下限值LL而计算的方法即可,不限定于上述计算方法。
参数范围设定部26将通过计算而得到的上限值UL以及下限值LL设为新的参数范围的上限值以及下限值,变更参数范围。
参数范围设定部26根据学习结果计算参数范围的上限值UL和下限值LL,所以定位控制装置20无需为了参数范围的变更而进行装置的操作者的试行错误。
在目标停止位置SP被变更的情况下,定位控制装置20能够将与变更后的目标停止位置对应的优良参数的推测值的周边设定为参数范围,能够将参数范围缩小得小。因此,定位控制装置20能够以更少的定位控制的试行次数找到优良参数。因此,定位控制装置20能够在短时间内进行位置指令的指令形状的调整。
在具有如滚珠丝杠机构或者线性机构那样的直动式的机构的装置中的定位控制中,如果控制对象3的停止位置不同,则起因于装置的刚性低而产生的机械振动的特性不同。因此,即使目标移动量相同,当目标停止位置被变更时,在以往技术中,也有时由于机械振动的影响而无法进行高速的定位控制。
在实施方式2的定位控制装置20中,即使目标停止位置被变更,也能够适当地设定指令形状的探索范围,进而能够效率良好地进行指令形状的调整。
实施方式2中的参数范围设定部26为了计算参数范围而构建针对目标停止位置的优良参数的关系式,但也可以构建针对目标停止位置和目标移动距离这两方的优良参数的关系式。在该情况下,即使目标停止位置和目标移动距离这两方被变更,参数范围设定部26也能够推测针对两方的优良参数,设定适当的参数范围。
因此,实施方式2的定位控制装置20在探索使定位控制高速化的良好的指令形状而进行调整时,能够适当地设定指令形状的探索范围,进而能够效率良好地进行指令形状的调整。
实施方式3.
实施方式1的定位控制装置10探索使定位时间成为最小的指令形状。在实施方式3中,说明关于评价值的计算方法不同的情况也能够适当地设定指令形状的探索范围的定位控制装置。
图8是示出实施方式3的定位控制装置30的结构的图。如图8所示,定位控制装置30与马达1和位置检测器4连接。从定位控制装置30的外部对定位控制装置30提供运转条件17。运转条件17包含表示用于驱动马达1的目标移动距离的信息。定位控制装置30以满足运转条件17的方式执行定位控制。
定位控制装置30具有位置指令生成部11、驱动控制部12、评价部33、学习部14、学习结果保持部15以及参数范围设定部16。在实施方式3中,关于在实施方式1中说明的构成要素,省略详细的说明。
评价部33将位置检测值作为输入,通过后述方法计算用于评价由驱动控制部12进行的定位控制的好坏的评价值Q而输出。驱动控制部12根据位置指令进行动作。位置指令是根据位置指令参数来计算出的。因而,由评价部33计算的评价值Q取决于位置指令参数的值。即,可以说由评价值33计算的评价值Q是用于评价位置指令参数的指标。
叙述评价值Q的具体的计算方法。在此,将从定位控制的开始至目标移动距离与位置检测值的偏差的大小变得比容许值IMP小的定位完成为止的时间设为定位时间。在定位时间Tst小的情况下,进行表示评价值Q大的值的设定。在实施方式3中,关于偏差的大小变得比容许值IMP小之后的残留振动的偏差的大小也进行评价。
图9是示出实施方式3中的偏差的时间响应的图。如图9所示,将偏差的大小变得比预先确定的第2容许值IMP2小之后的残留振动的偏差的最大值设为残留振动振幅AMP。第2容许值IMP2的范围比容许值IMP的范围窄。在残留振动振幅AMP的大小比第2容许值IMP2大的情况下,评价部33对评价值Q给予惩罚。也就是说,评价部33在作为马达1或者控制对象3的位置的残留振动的振幅的残留振动振幅AMP为预先确定的值以上的情况下,进行使评价值Q减少的计算。具体而言,评价部33使用下述式(35)来计算评价值Q。
[式35]
Q=-Tst-γ×max(0,AMP-IMP2)…(35)
γ为正的值。max(x1,x2)为输出两个自变量x1和自变量x2中的大的一方的函数。
根据式(35),根据右边的第1项,定位时间Tst越小,则评价值Q成为越大的值,但根据右边的第2项,在残留振动振幅AMP比第2容许值IMP2大的情况下评价值Q成为小的值。也就是说,在定位时间Tst小,且残留振动振幅AMP比第2容许值IMP2小的情况下,评价值Q成为大的值,可以说此时的位置指令参数为良好的位置指令参数。但是,关于评价值Q,如果能够评价定位控制,则也可以不使用式(35)来计算。
除了评价部33将残留振动振幅AMP用于评价值Q的计算这点之外,定位控制装置30的动作与实施方式1的定位控制装置10的动作相同。因此,根据学习部14、学习结果保持部15以及参数范围设定部16的动作而得到的效果与在实施方式1中说明的效果相同。
根据评价部33的动作,定位控制装置30能够实现一边将残留振动振幅AMP抑制为比第2容许值IMP2的大小小的值,一边缩短定位时间那样的定位控制。
图10是示出在实施方式3中使用第4组位置指令参数和第5组位置指令参数的情况下的偏差的时间响应的图。第4组的“4”以及第5组的“5”是为了将第4组以及第5组与实施方式1的第1组至第3组进行区分而赋予的数字,在这些数字中没有区分以外的意思。图10(a)示出了使用第4组位置指令参数的情况下的偏差的时间响应。图10(b)示出了使用第5组位置指令参数的情况下的偏差的时间响应。
如图10所示,当将使用第4组位置指令参数的情况下的定位时间Tst4与使用第5组位置指令参数的情况下的定位时间Tst5进行比较时,Tst4<Tst5。也就是说,使用第4组位置指令参数的情况下的定位时间Tst4比使用第5组位置指令参数的情况下的定位时间Tst5短。但是,使用第4组位置指令参数的情况下的残留振动振幅AMP4比第2容许值IMP2大,所以对评价值Q给予惩罚。在图10(b)中,示出了使用第5组位置指令参数的情况下的残留振动振幅AMP5。
此时,以使下述式(36)成立的方式设定γ,从而能够对第5组位置指令参数的评价值Q5提供比第4组位置指令参数的评价值Q4大的值。
[式36]
-Tst4-γ×(AMP4-IMP2)<-Tst5…(36)
除了评价值Q的计算方法以外,定位控制装置30的动作与实施方式1的定位控制装置10的动作相同。也就是说,定位控制装置30能够以使评价值Q成为最大的方式调整位置指令的指令形状。
根据评价部33的动作,定位控制装置30能够在残留振动振幅AMP满足第2容许值IMP2的范围之中,调整使评价值Q成为最大的指令形状。
在目标移动距离被变更的情况下,定位控制装置30能够将与变更后的目标移动距离对应的优良参数(第一优良参数)的推测值的周边设定为参数范围,能够将参数范围缩小得小。因此,定位控制装置30能够以更少的定位控制的试行次数找到优良参数。
在电子部件安装机中,在定位控制完成之后进行电子部件的安装。此时,如果定位完成后的振动振幅大,则电子部件的安装精度有时恶化。也就是说,除了要求定位时间小之外,还要求定位完成后的残留振动振幅小。
实施方式3的定位控制装置30能够一边将定位完成后的残留振动振幅抑制为第2容许值的范围,一边探索良好的指令形状。
实施方式3中的评价部33在定位完成后的偏差的振幅的最大值比第2容许值大的情况下给予惩罚。然而,惩罚的给予方式不限于上述方法。例如,评价部33既可以对残留振动振幅极大时的多个残留振动振幅的值给予惩罚,也可以以仅对定位完成后的一定的时间的残留振动振幅进行评价的方式对参数施加关于时间的条件。
因此,实施方式3的定位控制装置30在探索使定位控制高速化的良好的指令形状时,能够适当地设定指令形状的探索范围,进而能够效率良好地进行指令形状的调整。
图11是示出实施方式1的定位控制装置10所具有的位置指令生成部11、驱动控制部12、评价部13、学习部14、学习结果保持部15以及参数范围设定部16的一部分或者全部的功能由处理器71实现的情况下的处理器71的图。也就是说,位置指令生成部11、驱动控制部12、评价部13、学习部14、学习结果保持部15以及参数范围设定部16的一部分或者全部的功能也可以由执行保存于存储器72的程序的处理器71实现。
处理器71为CPU(Central Processing Unit,中央处理单元)、处理装置、运算装置、微处理器或者DSP(Digital Signal Processor,数字信号处理器)。在图11中,还示出了存储器72。
在位置指令生成部11、驱动控制部12、评价部13、学习部14、学习结果保持部15以及参数范围设定部16的一部分或者全部的功能由处理器71实现的情况下,该一部分或者全部的功能由处理器71和软件、固件、或者软件与固件的组合实现。软件或者固件作为程序而记述,保存于存储器72。处理器71通过读出存储于存储器72的程序并执行,从而实现位置指令生成部11、驱动控制部12、评价部13、学习部14、学习结果保持部15以及参数范围设定部16的一部分或者全部的功能。
在位置指令生成部11、驱动控制部12、评价部13、学习部14、学习结果保持部15以及参数范围设定部16的一部分或者全部的功能由处理器71实现的情况下,定位控制装置10具有存储器72,该存储器72用于保存通过在结果上执行由位置指令生成部11、驱动控制部12、评价部13、学习部14、学习结果保持部15以及参数范围设定部16的一部分或者全部执行的步骤而实现的程序。保存于存储器72的程序还可以说是使计算机执行位置指令生成部11、驱动控制部12、评价部13、学习部14、学习结果保持部15以及参数范围设定部16的一部分或者全部执行的过程或者方法。
存储器72例如为RAM(Random Access Memory,随机存取存储器)、ROM(Read OnlyMemory,只读存储器)、闪存存储器、EPROM(Erasable Programmable Read Only Memory,可擦可编程只读存储器)、EEPROM(注册商标)(Electrically Erasable ProgrammableRead-Only Memory,电可擦可编程只读存储器)等非易失性或易失性的半导体存储器、磁盘、柔性盘、光盘、压缩盘、迷你盘或者DVD(Digital Versatile Disk,数字多功能盘)等。
图12是示出实施方式1的定位控制装置10所具有的位置指令生成部11、驱动控制部12、评价部13、学习部14、学习结果保持部15以及参数范围设定部16的一部分或者全部由处理电路81实现的情况下的处理电路81的图。也就是说,位置指令生成部11、驱动控制部12、评价部13、学习部14、学习结果保持部15以及参数范围设定部16的一部分或者全部也可以由处理电路81实现。
处理电路81为专用的硬件。处理电路81例如为单一电路、复合电路、编程化的处理器、并行编程化的处理器、ASIC(Application Specific Integrated Circuit,专用集成电路)、FPGA(Field-Programmable Gate Array,现场可编程门阵列)、或者将这些组合而成的电路。
位置指令生成部11、驱动控制部12、评价部13、学习部14、学习结果保持部15以及参数范围设定部16的一部分也可以是与剩余部分分开的专用的硬件。
关于位置指令生成部11、驱动控制部12、评价部13、学习部14、学习结果保持部15以及参数范围设定部16的多个功能,也可以是该多个功能的一部分由软件或者固件实现,该多个功能的剩余部分由专用的硬件实现。这样,位置指令生成部11、驱动控制部12、评价部13、学习部14、学习结果保持部15以及参数范围设定部16的多个功能能够由硬件、软件、固件或者这些的组合实现。
实施方式2的定位控制装置20所具有的位置指令生成部11、驱动控制部12、评价部13、学习部14、学习结果保持部25以及参数范围设定部26的一部分或者全部的功能也可以由与处理器71同等的处理器实现。在该一部分或者全部的功能由处理器实现的情况下,定位控制装置20具有用于保存在结果上执行由位置指令生成部11、驱动控制部12、评价部13、学习部14、学习结果保持部25以及参数范围设定部26的一部分或者全部执行的步骤的程序的存储器。该存储器为与存储器72同等的存储器。
实施方式2的定位控制装置20所具有的位置指令生成部11、驱动控制部12、评价部13、学习部14、学习结果保持部25以及参数范围设定部26的一部分或者全部的功能也可以由与处理电路81同等的处理电路实现。
实施方式3的定位控制装置30所具有的位置指令生成部11、驱动控制部12、评价部33、学习部14、学习结果保持部15以及参数范围设定部16的一部分或者全部的功能也可以由与处理器71同等的处理器实现。在该一部分或者全部的功能由处理器实现的情况下,定位控制装置30具有用于保存在结果上执行由位置指令生成部11、驱动控制部12、评价部33、学习部14、学习结果保持部15以及参数范围设定部16的一部分或者全部执行的步骤的程序的存储器。该存储器为与存储器72同等的存储器。
实施方式3的定位控制装置30所具有的位置指令生成部11、驱动控制部12、评价部33、学习部14、学习结果保持部15以及参数范围设定部16的一部分或者全部的功能也可以由与处理电路81同等的处理电路实现。
实施方式4.
图13是示出实施方式4的定位控制装置40的结构的图。在实施方式4中,关于在实施方式1中说明的构成要素,省略详细的说明。定位控制装置40具有位置指令生成部41,该位置指令生成部41根据规定位置指令的形状的位置指令参数来生成用于驱动马达1而使控制对象3移动目标移动距离的该位置指令。位置指令生成部41具有实施方式1的位置指令生成部11所具有的功能。定位控制装置40还具有驱动控制部12,该驱动控制部12以使马达1或者控制对象3的位置检测值追随于由位置指令生成部41生成的位置指令的方式驱动马达1。
位置指令生成部41生成马达1的位置指令,输出到驱动控制部12。位置指令参数为规定位置指令的指令形状的参数。在实施方式4中使用的位置指令、作为位置指令的一阶微分的速度指令、作为位置指令的二阶微分的加速度指令以及作为加速度指令的一阶微分的急动度各自的形状与在实施方式1中使用图2示出的形状相同。在图2的加速度指令中,从第1区间至第3区间为止的加速区间的梯形形状与从第5区间至第7区间为止的减速区间的梯形形状也可以不全等。也可以将加速区间的第1时间长度T1和第3时间长度T3设为0,将加速度指令的形状设为矩形形状。从第1时间长度T1至第7时间长度T7为止的7个参数为位置指令参数。
定位控制装置40还具有评价部43,该评价部43根据关于控制对象3的定位控制的执行时的马达1或者控制对象3的位置检测值,计算用于评价由驱动控制部12进行的定位控制的好坏的评价值。评价部43具有实施方式1的评价部13所具有的功能。定位控制装置40还具有学习部44,该学习部44学习位置指令参数被变更而执行多次的关于控制对象3的定位控制的情况下的位置指令参数与由评价部43计算出的评价值的关系,得到学习结果。学习部44具有实施方式1的学习部14所具有的功能。以下,进一步说明评价部43以及学习部44。
评价部43从位置检测器4接收表示作为由位置检测器4进行的检测的结果的位置检测值的信息,通过后述方法计算用于评价由驱动控制部12进行的定位控制的好坏的评价值Q而输出。驱动控制部12根据位置指令进行动作,位置指令是根据位置指令参数来计算出的。因而,由评价部43计算的评价值Q取决于位置指令参数的值。即,可以说评价值Q是用于评价位置指令参数的指标。在实施方式4中,通过与实施方式1同样的方法来计算评价值Q,可以说评价值Q为越大的值,则位置指令参数越优良。
学***均值和方差值的函数而进行学***均值和与位置指令参数对应的评价值Q的方差值而推测。作为用于计算平均值和方差值的函数,也可以使用高斯过程模型。这样,学习部44得到位置指令参数与评价值Q的关系式。
学***均值与方差值之和表示最大值的位置指令参数。
学习部44从一边变更位置指令参数一边通过直至结束预先确定的次数为止反复执行的定位控制从评价部43得到的评价值Q之中,将使评价值Q最大的位置指令参数输出到位置指令生成部41。
进一步说明实施方式4的定位控制装置40的功能。学习部44决定1组位置指令参数,将所决定的位置指令参数输出到位置指令生成部41。位置指令生成部41根据输入的位置指令参数来计算位置指令。位置指令生成部41与实施方式1的位置指令生成部11同样地,为了规定指令形状,使用7个位置指令参数。与在以往技术中大量使用的根据加速度以及速度的两个参数来规定指令形状的方法相比,实施方式4中的调整的自由度比以往的调整的自由度高。因此,如果能够适当地调整位置指令参数,则定位控制装置40即使在受到载置有控制对象3的装置的机械振动的影响的状况下,也能够实现表示良好的响应的定位控制。
另一方面,在载置有控制对象3的装置的操作者一边使该装置进行动作,一边由于试行错误而通过人手来调整上述7个参数的情况下,需要比较大的劳力以及比较长的时间。以下,说明定位控制装置40具有评价部43以及学习部44,从而定位控制装置40不需要操作者的试行错误就能够适当地调整位置指令参数。
根据评价部43以及学习部44的动作,反复执行由学习部44进行的位置指令参数的变更、使用变更后的位置指令参数的定位控制以及由评价部43进行的评价值Q的计算。说明该反复执行的评价部43以及学习部44的动作。
图14是示出实施方式4的定位控制装置40调整位置指令参数时的动作的过程的流程图。在步骤S1中,在位置指令生成部41中设定位置指令参数的初始值。位置指令参数的初始值可以为任意的值。在步骤S2中,利用根据在步骤S1中设定的位置指令参数而计算出的位置指令来执行定位控制。
在步骤S3中,评价部43计算评价值Q。在步骤S4中,定位控制装置40判定预先确定的次数的定位控制是否结束。在图14的步骤S4中,预先确定的次数记载为“预定次数”。在定位控制装置40判定为预先确定的次数的定位控制结束的情况下(在S4中为是),定位控制装置40的动作转移到步骤S7。在定位控制装置40判定为预先确定的次数的定位控制未结束的情况下(在S4中为否),定位控制装置40的动作转移到步骤S5。在步骤S5中,学***均值和评价值Q的方差值的函数。
在步骤S6中,学***均值与方差值之和最大的位置指令参数。为了利用在步骤S6中求出的位置指令参数再次执行定位控制而得到评价值,定位控制装置40的动作转移到步骤S1。另一方面,在步骤S4中,在定位控制装置40判定为预先确定的次数的定位控制结束的情况下(在S4中为是),是得到预先确定的数量的评价值Q的状态。
在步骤S7中,定位控制装置40从预先确定的数量的评价值Q之中选定使评价值Q最大的位置指令参数,设定于位置指令生成部41。当步骤S7的动作结束时,位置指令参数的调整结束。
如上所述,学***均值和方差值。学***均值与方差值之和成为最大的位置指令参数。所求出的位置指令参数用于下次的定位控制。
接下来,说明通过将使平均值与方差值之和成为最大的位置指令参数用于下次的定位控制而得到的效果。图15是用于说明由实施方式4的定位控制装置40得到的效果的第1图。图16是用于说明由实施方式4的定位控制装置40得到的效果的第2图。
说明在执行两次评价部43以及学习部44的动作之后选定第3组位置指令参数的过程。第1组位置指令参数记载为位置指令参数Pr11,第2组位置指令参数记载为位置指令参数Pr12,第3组位置指令参数记载为位置指令参数Pr13。
在图15以及图16中,为了说明而将位置指令参数简化成1维而示出。在执行两次评价部43以及学***均值和方差值的函数进行更新。
图15所示的表示平均值的曲线和表示平均值与方差值之和的曲线是根据由学***均值与方差值之和最大的与图15的星形标记的点对应的位置指令参数Pr13被选定为接下来的位置指令参数。
作为使用位置指令参数Pr13来计算位置指令而进行定位控制的结果,如图16所示,能够得到评价值Q13。假定为评价值Q13是比评价值Q11以及评价值Q12大的值。当在该阶段结束了调整的情况下,评价值Q13成为最大,所以在调整结束时间点,位置指令参数Pr13成为最优良的参数。
设想假设在选定第3组位置指令参数的阶段不选择评价值Q的平均值与方差值之和的最大值,而选择评价值Q的平均值的最大值的情况。在图15中,平均值的曲线的最大值不是位置指令参数Pr13的点,所以不会选定位置指令参数Pr13作为第3组位置指令参数。因此,在选择评价值Q的平均值的最大值的情况下,有可能无法选定优良的参数。
如上所述,方差值存在在从过去获取到的数据起的距离远的点变大的趋势。平均值存在在根据过去获取到的数据而被推测为良好的点变大的趋势。也就是说,定位控制装置40通过将平均值与方差值之和最大的点选定为接下来的位置指令参数,能够良好地保持用于得到比较大的评价值Q的探索与开发的平衡,能够找到在调整的结束时得到比较大的评价值Q的位置指令参数。
因而,实施方式4的定位控制装置40不需要操作者的试行错误,能够适当地调整位置指令参数。因此,定位控制装置40能够效率良好地进行使定位控制高速化的良好的指令形状的调整。
在实施方式4中,定位控制装置40将评价值Q的平均值与方差值之和最大的点选定为接下来的位置指令参数。然而,定位控制装置40也可以将与对评价值Q的平均值加上方差值的两倍而得到的值最大的点对应的位置指令参数选定为接下来的位置指令参数。定位控制装置40也可以使用进行学***均值和方差值,计算EI(ExpectedImprovement,期望提升)函数、PI(Probability of Improvement,提升概率)函数或者其它获得函数。
在实施方式4中,定位控制装置40将评价值Q的平均值与方差值之和最大的点选定为接下来的位置指令参数。定位控制装置40也可以当此时找到评价值Q的平均值与方差值之和最大的点时,从以等间隔刻画各位置指令参数的网格的点之中依次计算评价值Q的平均值和方差值,在网格之中限定评价值Q的平均值和方差值最大的位置指令参数。另外,定位控制装置40也可以当找到评价值Q的平均值与方差值之和最大的点时,通过基于伪随机函数的随机探索来选定评价值Q的平均值和方差值最大的位置指令参数。
实施方式5.
实施方式4的定位控制装置40使用位置指令参数与评价值Q的关系式来变更位置指令参数,从而适当地调整位置指令参数。在实施方式5中,说明使用伪随机函数适当地调整位置指令参数的定位控制装置。
图17是示出实施方式5的定位控制装置50的结构的图。在实施方式5中,关于在实施方式1中说明的构成要素,省略详细的说明。定位控制装置50具有位置指令生成部51,该位置指令生成部51根据规定位置指令的形状的位置指令参数来生成用于驱动马达1而使控制对象3移动目标移动距离的该位置指令。位置指令生成部51具有实施方式1的位置指令生成部11所具有的功能。定位控制装置50还具有驱动控制部12,该驱动控制部12以使马达1或者控制对象3的位置检测值追随于由位置指令生成部51生成的位置指令的方式驱动马达1。
位置指令生成部51生成马达1的位置指令,输出到驱动控制部12。位置指令参数为规定位置指令的指令形状的参数。在实施方式5中使用的位置指令、作为位置指令的一阶微分的速度指令、作为位置指令的二阶微分的加速度指令以及作为加速度指令的一阶微分的急动度各自的形状与在实施方式1中使用图2示出的形状相同。在图2的加速度指令中,从第1区间至第3区间为止的加速区间的梯形形状与从第5区间至第7区间为止的减速区间的梯形形状也可以不全等。也可以将加速区间的第1时间长度T1和第3时间长度T3设为0,将加速度指令的形状设为矩形形状。从第1时间长度T1至第7时间长度T7为止的7个参数为位置指令参数。
定位控制装置50还具有评价部13,该评价部13根据关于控制对象3的定位控制的执行时的马达1或者控制对象3的位置检测值,计算用于评价由驱动控制部12进行的定位控制的好坏的评价值。定位控制装置50还具有学习部54,该学习部54学习位置指令参数被变更而执行多次的关于控制对象3的定位控制的情况下的位置指令参数与由评价部13计算出的评价值的关系,得到学习结果。学习部54具有实施方式1的学习部14所具有的功能。
学习部54使用伪随机函数,变更由位置指令生成部51生成的位置指令,每当执行多次定位控制时,获取评价值Q,学习位置指令参数与评价值Q的关系。学习部54根据伪随机函数独立地变更根据位置指令参数决定的加速区间和减速区间各自中的加速度的形状。
具体而言,学习部54使用PSO(Particle Swarm Optimization,粒子群优化)。PSO为如下方法:对散布于参数空间内的各粒子计算评价值Q,使用伪随机函数反复进行各粒子的参数空间内的位置的更新,从而学习位置指令参数与评价值Q的关系,并找到如评价值Q取大的值那样的位置指令参数。1个粒子对应于1个位置指令参数。例如,在粒子数为10个,更新次数为100次的情况下,执行合计为1000次的定位控制,得到1000个位置指令参数与评价值Q的组。
在将更新前的粒子的位置设为x(i),将更新后的粒子的位置设为x(i+1)的情况下,更新后的粒子的位置x(i+1)通过下式来计算。“i”为自然数。
x(i+1)=x(i)+v(i+1)
v(i+1)=w×v(i)+c1×r1×(xp-x(i))+c2×r2×(xg-x(i))
在上述式中,w、c1以及c2分别为常数,设定为比1小的值即可。r1以及r2分别为从0以上且1以下的范围使用伪随机函数而设定的伪随机数。xp为在各粒子在第i个之前得到的评价值Q之中使评价值Q成为最大的位置指令参数。xg为在所有的粒子在第i个之前得到的评价值Q之中使评价值Q成为最大的位置指令参数。
x(i)以及v(i)各自的初始值使用伪随机函数随机地决定。学***衡,能够找到在调整的结束时得到大的评价值Q的位置指令参数。
学习部54能够通过各粒子的位置的更新,学习位置指令参数与评价值Q的关系,找到如评价值Q取大的值那样的位置指令参数。学习部54作为学习结果而得到位置指令参数与评价值Q的关系,但既可以得到位置指令参数与评价值Q的组的列表而作为学习结果,也可以得到位置指令参数与评价值Q的关系式而作为学习结果。
在实施方式5中,作为基于伪随机函数的位置指令参数的变更方法,使用PSO。然而,也可以代替PSO而例如使用利用GA(genetic algorithm,遗传算法)或者SA(simulatedannealing,模拟退火)这样的伪随机函数的算法。学习部54也可以通过随机搜索来变更位置指令参数。总之,学习部54能够作为学习结果而得到位置指令参数与评价值Q的关系。
如上述那样,学习部54能够学习位置指令参数与评价值Q的关系,找到如评价值Q取大的值那样的位置指令参数。也就是说,学习部54根据学习结果来变更用于定位控制的位置指令参数。因而,定位控制装置50不需要操作者的试行错误,能够适当地调整位置指令参数。
因此,实施方式5的定位控制装置50能够效率良好地进行使定位控制高速化的良好的指令形状的调整。
实施方式6.
实施方式4的定位控制装置40通过使用位置指令参数与评价值Q的关系式来变更位置指令参数,从而适当地调整位置指令参数。在实施方式6中,说明具有对控制对象的动作进行模拟的动作模拟部,从而适当地调整位置指令参数的定位控制装置。
图18是示出实施方式6的定位控制装置60的结构的图。在实施方式6中,关于在实施方式1中说明的构成要素,省略详细的说明。定位控制装置60具有位置指令生成部61,该位置指令生成部61根据规定位置指令的形状的位置指令参数来生成用于驱动马达1而使控制对象3移动目标移动距离的该位置指令。位置指令生成部61具有实施方式1的位置指令生成部11所具有的功能。定位控制装置60还具有驱动控制部12,该驱动控制部12以使马达1或者控制对象3的位置检测值追随于由位置指令生成部61生成的位置指令的方式驱动马达1。
定位控制装置60还具有评价部13,该评价部13根据关于控制对象3的定位控制的执行时的马达1或者控制对象3的位置检测值,计算用于评价由驱动控制部12进行的定位控制的好坏的评价值。定位控制装置60还具有学习部64,该学习部64学习位置指令参数被变更而执行多次的关于控制对象3的定位控制的情况下的位置指令参数与由评价部13计算出的评价值的关系,得到学习结果。学习部64具有实施方式1的学习部14所具有的功能。
定位控制装置60还具有动作模拟部68,该动作模拟部68将位置指令参数作为输入,对学习部64指示位置指令参数的重新选定。动作模拟部68对用图18的动作模拟对象68a表示的范围所包含的要素的动作进行模拟。也就是说,动作模拟部68将位置指令参数作为输入,对表示马达1的旋转位置或者控制对象3的位置的位置检测值的信号进行模拟。具体而言,动作模拟部68根据位置指令参数对控制对象3的动作进行模拟,在模拟的结果满足事先设定的制约条件的情况下,将在模拟动作时使用的位置指令参数输出到位置指令生成部61。
动作模拟部68根据对位置检测值进行模拟的信号和事先设定的制约条件,判定是否需要重新计算位置指令参数,在判定为需要重新计算的情况下,将作为重新计算位置指令参数的指示的重新计算指示提供给学习部64。以下,进一步说明学习部64以及动作模拟部68。
学***均值和方差值的函数,进行学***均值和与位置指令参数对应的评价值Q的方差值。作为用于计算平均值和方差值的函数,也可以使用高斯过程模型。如上所述,学习部64得到位置指令参数与评价值Q的关系式。
学***均值与方差值之和表示最大值的位置指令参数。
动作模拟部68接收由学习部64选定的位置指令参数,根据对位置检测值进行模拟的信号和事先设定的制约条件,判定是否需要重新计算位置指令参数,在判定为需要重新计算的情况下,将作为重新计算位置指令参数的指示的重新计算指示提供给学习部64。
动作模拟部68也可以在对位置检测值进行模拟的信号的振幅为预先确定的值以上的情况下,以重新计算位置指令参数的方式,对学习部64提供重新计算指示。动作模拟部68也可以在对位置检测值进行模拟的信号达到目标移动距离的值的时间为预先确定的时间以上的情况下,以重新计算位置指令参数的方式,对学习部64提供重新计算指示。也就是说,动作模拟部68不是驱动马达1来执行定位控制,而是在简易地评价位置指令参数而评价值为预先确定的不良且小的值的情况下,使学习部64再次选定位置指令参数。
在提供了位置指令参数的重新计算指示的情况下,学***均值与方差值之和为第2大的值的位置指令参数。动作模拟部68再次接收位置指令参数,判定是否需要重新计算。
在通过学习部64以及动作模拟部68的动作,简易地评价位置指令参数而评价值成为被判断为不良的小的值的情况下,变更位置指令参数。定位控制装置60能够通过基于学习部64以及动作模拟部68的动作的位置指令参数的变更来降低定位控制的执行次数,且能够效率良好地调整位置指令参数。
动作模拟部68通过仅判定与输入的位置指令参数对应的评价值Q的大小,能够降低定位控制的执行次数。对于动作模拟部68,未必需要精密的控制对象的模拟。例如,对位置指令应用低通滤波器的信号也可以为对位置检测值进行模拟的信号。
在实施方式6中,动作模拟部68根据对位置检测值进行模拟的信号,判定是否需要重新计算位置指令参数。然而,动作模拟部68的动作不限于此。图18所示的动作模拟对象68a中包含的要素不限于该要素。例如,动作模拟部68也可以对提供给马达1的电流的值进行模拟,在模拟的电流的值为预先确定的值以上的情况下,指示重新计算位置指令参数。
动作模拟部68也可以对从位置指令参数生成的位置指令进行模拟,在对位置指令进行模拟的信号达到目标移动距离的值的时间为预先确定的时间以上的情况下,指示重新计算位置指令参数。动作模拟部68也可以通过将对位置指令应用低通滤波器的信号进行微分,从而对速度指令或者加速度指令进行模拟,在对速度指令或者加速度指令进行模拟的信号的最大值为预先确定的值以上的情况下,指示重新计算位置指令参数。
因而,实施方式6的定位控制装置60不需要操作者的试行错误,能够适当地调整位置指令参数。因此,定位控制装置60能够效率良好地进行使定位控制高速化的良好的指令形状的调整。
上述实施方式1至6的定位控制装置10、定位控制装置20、定位控制装置30、定位控制装置40、定位控制装置50以及定位控制装置60的一部分或者全部也可以利用位置指令参数独立地设定加速的开始、加速的结束、减速的开始以及减速的结束的各时间点下的加速度的大小中的两个以上。
实施方式4的定位控制装置40所具有的位置指令生成部41、驱动控制部12、评价部43以及学习部44的一部分或者全部的功能也可以由与处理器71同等的处理器实现。在该一部分或者全部的功能由处理器实现的情况下,定位控制装置40具有用于保存在结果上执行由位置指令生成部41、驱动控制部12、评价部43以及学习部44的一部分或者全部执行的步骤的程序的存储器。该存储器为与存储器72同等的存储器。
实施方式4的定位控制装置40所具有的位置指令生成部41、驱动控制部12、评价部43以及学习部44的一部分或者全部的功能也可以由与处理电路81同等的处理电路实现。
实施方式5的定位控制装置50所具有的位置指令生成部51、驱动控制部12、评价部13以及学习部54的一部分或者全部的功能也可以由与处理器71同等的处理器实现。在该一部分或者全部的功能由处理器实现的情况下,定位控制装置50具有用于保存在结果上执行由位置指令生成部51、驱动控制部12、评价部13以及学习部54的一部分或者全部执行的步骤的程序的存储器。该存储器为与存储器72同等的存储器。
实施方式5的定位控制装置50所具有的位置指令生成部51、驱动控制部12、评价部13以及学习部54的一部分或者全部的功能也可以由与处理电路81同等的处理电路实现。
实施方式6的定位控制装置60所具有的位置指令生成部61、驱动控制部12、评价部13、学习部64以及动作模拟部68的一部分或者全部的功能也可以由与处理器71同等的处理器实现。在该一部分或者全部的功能由处理器实现的情况下,定位控制装置60具有用于保存在结果上执行由位置指令生成部61、驱动控制部12、评价部13、学习部64以及动作模拟部68的一部分或者全部执行的步骤的程序的存储器。该存储器为与存储器72同等的存储器。
实施方式6的定位控制装置60所具有的位置指令生成部61、驱动控制部12、评价部13、学习部64以及动作模拟部68的一部分或者全部的功能也可以由与处理电路81同等的处理电路实现。
以上的实施方式所示的结构表示本发明的内容的一个例子,既能够与其它公知的技术进行组合,还能够在不脱离本发明的要旨的范围,省略或者变更结构的一部分。

Claims (12)

1.一种定位控制装置,驱动马达而使控制对象移动目标移动距离,所述定位控制装置的特征在于,具备:
位置指令生成部,根据位置指令参数生成加速区间以及减速区间的加速度的形状被决定的位置指令;
驱动控制部,以使所述马达或者所述控制对象的位置检测值追随于所述位置指令的方式驱动所述马达;
评价部,根据关于所述控制对象的定位控制的执行时的所述马达或者所述控制对象的位置检测值,计算与定位性能有关的评价值;以及
学习部,一边将根据所述位置指令参数决定的加速区间和减速区间中的加速度的形状分别独立地进行变更,一边学习执行多次定位控制的情况下的所述位置指令参数与所述评价值的关系,通过学习所述位置指令参数与所述评价值的关系来得到学习结果。
2.根据权利要求1所述的定位控制装置,其特征在于,
所述学习部得到所述位置指令参数与所述评价值的关系式作为所述学习结果。
3.根据权利要求1所述的定位控制装置,其特征在于,
所述学习部根据伪随机函数独立地变更根据所述位置指令参数决定的加速区间和减速区间各自中的加速度的形状。
4.根据权利要求1至3中的任意一项所述的定位控制装置,其特征在于,
所述学习部根据所述学习结果,变更用于定位控制的所述位置指令参数。
5.根据权利要求1至3中的任意一项所述的定位控制装置,其特征在于,
所述定位控制装置根据所述位置指令参数,独立地设定加速的开始、加速的结束、减速的开始以及减速的结束的各时间点下的加速度的大小中的两个以上。
6.根据权利要求1至3中的任意一项所述的定位控制装置,其特征在于,
所述定位控制装置还具备动作模拟部,该动作模拟部根据所述位置指令参数模拟所述控制对象的动作,在模拟的结果满足事先设定的制约条件的情况下,将在模拟动作时使用的位置指令参数输出到所述位置指令生成部。
7.根据权利要求1至3中的任意一项所述的定位控制装置,其特征在于,
所述定位控制装置还具备参数范围设定部,该参数范围设定部根据由所述学习部得到的所述学习结果,设定规定所述位置指令参数的上限值以及下限值的参数范围。
8.根据权利要求7所述的定位控制装置,其特征在于,
所述定位控制装置还具备学习结果保持部,该学习结果保持部将包含表示所述目标移动距离的信息的运转条件与由所述学习部得到的所述学习结果对应起来保持,
所述学习结果保持部将一个以上的所述位置指令参数保持为优良参数,
所述参数范围设定部将比由所述学习结果保持部保持的所述优良参数小的值作为所述参数范围的下限,并且将比所述优良参数大的值作为所述参数范围的上限,由此设定所述参数范围。
9.根据权利要求7所述的定位控制装置,其特征在于,
所述定位控制装置还具备学习结果保持部,该学习结果保持部将包含表示所述目标移动距离的信息的运转条件与由所述学习部得到的所述学习结果对应起来保持,
所述学习结果保持部将所述评价值最大的所述位置指令参数保持为第一优良参数,
所述参数范围设定部在所述运转条件中包含的所述信息所表示的所述目标移动距离被变更的情况下,根据过去执行了学习时的目标移动距离来进行插值计算,推测与变更后的目标移动距离对应的插值点的第一优良参数,将比推测出的所述插值点的第一优良参数小的值作为所述参数范围的下限,并且将比推测出的所述插值点的第一优良参数大的值作为所述参数范围的上限,由此设定所述参数范围。
10.根据权利要求7所述的定位控制装置,其特征在于,
所述定位控制装置还具备学习结果保持部,该学习结果保持部将包含所述控制对象的目标停止位置的信息的运转条件与由所述学习部得到的所述学习结果对应起来保持,
所述学习结果保持部将所述评价值最大的所述位置指令参数保持为第二优良参数,
所述参数范围设定部在所述运转条件中包含的所述信息所表示的所述目标停止位置被变更的情况下,根据过去执行了学习时的目标停止位置来进行插值计算,推测与变更后的目标停止位置对应的插值点的第二优良参数,将比推测出的所述插值点的第二优良参数小的值作为所述参数范围的下限,并且将比推测出的所述插值点的第二优良参数大的值作为所述参数范围的上限,由此设定所述参数范围。
11.根据权利要求1所述的定位控制装置,其特征在于,
所述位置指令生成部是设定通过所述学习部的学习而得到的位置指令参数而生成所述位置指令的学习器。
12.一种定位方法,驱动马达而使控制对象移动目标移动距离,所述定位方法的特征在于,包括:
根据位置指令参数生成加速区间以及减速区间的加速度的形状被决定的位置指令的步骤;
以使所述马达或者所述控制对象的位置检测值追随于所述位置指令的方式驱动所述马达的步骤;
根据关于所述控制对象的定位控制的执行时的所述马达或者所述控制对象的位置检测值,计算与定位性能有关的评价值的步骤;以及
一边将根据所述位置指令参数决定的加速区间和减速区间中的加速度的形状分别独立地进行变更,一边学习执行多次定位控制的情况下的所述位置指令参数与所述评价值的关系,根据学习结果来决定新的位置指令参数的步骤。
CN201980065678.9A 2018-10-12 2019-01-30 定位控制装置以及定位方法 Active CN112805653B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2018-193380 2018-10-12
JP2018193380 2018-10-12
PCT/JP2019/003205 WO2020075316A1 (ja) 2018-10-12 2019-01-30 位置決め制御装置及び位置決め方法

Publications (2)

Publication Number Publication Date
CN112805653A true CN112805653A (zh) 2021-05-14
CN112805653B CN112805653B (zh) 2024-02-02

Family

ID=70164676

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201980065678.9A Active CN112805653B (zh) 2018-10-12 2019-01-30 定位控制装置以及定位方法

Country Status (4)

Country Link
KR (1) KR102494187B1 (zh)
CN (1) CN112805653B (zh)
TW (1) TWI715425B (zh)
WO (1) WO2020075316A1 (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115136095B (zh) * 2020-03-04 2023-04-04 三菱电机株式会社 定位控制装置及定位方法
CN114754477B (zh) * 2022-04-28 2023-11-28 广州奥特信息科技股份有限公司 空调控制***、方法、中央空调***、装置及存储介质

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04324507A (ja) * 1991-04-25 1992-11-13 Hitachi Ltd 駆動装置の加減速制御方法及びロボットシステム
JP2006293483A (ja) * 2005-04-06 2006-10-26 Japan Aerospace Exploration Agency ロバスト最適化問題を解く問題処理方法およびその装置
JP2007034781A (ja) * 2005-07-28 2007-02-08 Fuji Electric Fa Components & Systems Co Ltd 位置決め制御装置の制御パラメータ調整方法
JP2008217155A (ja) * 2007-02-28 2008-09-18 Fuji Heavy Ind Ltd 制御パラメータの自動適合システム
CN103853046A (zh) * 2014-02-14 2014-06-11 广东工业大学 一种压电陶瓷驱动器的自适应学习控制方法
CN104647387A (zh) * 2013-11-25 2015-05-27 佳能株式会社 机器人控制方法、***和装置
CN105027010A (zh) * 2013-03-14 2015-11-04 株式会社东芝 控制参数调整方法及控制参数调整***
CN105785918A (zh) * 2015-01-13 2016-07-20 发那科株式会社 根据加工条件调整参数的参数自动调整装置
CN106483934A (zh) * 2015-08-27 2017-03-08 发那科株式会社 数值控制装置
CN106557073A (zh) * 2015-09-30 2017-04-05 发那科株式会社 具有测定学习控制器的特性的功能的伺服控制装置
CN108393888A (zh) * 2017-02-06 2018-08-14 精工爱普生株式会社 控制装置、机器人以及机器人***

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3477792B2 (ja) * 1994-03-04 2003-12-10 三菱電機株式会社 モーション制御装置
JP4301491B2 (ja) 2003-02-05 2009-07-22 富士機械製造株式会社 電動機制御システムの自律設計方法及び自律設計装置並びに電動機制御システム
JP4324507B2 (ja) 2004-04-20 2009-09-02 浄史 松田 振動計測装置
EP2178202A1 (en) * 2007-08-03 2010-04-21 Kabushiki Kaisha Yaskawa Denki Motor control device and gain adjustment method thereof
JP4698656B2 (ja) 2007-11-12 2011-06-08 三菱電機株式会社 制御システムおよび制御支援装置
JP5642276B2 (ja) * 2011-06-09 2014-12-17 三菱電機株式会社 モータ制御装置
SG11201401228XA (en) * 2011-10-21 2014-06-27 Prime Datum Inc Direct drive fan system with variable process control
JP6338948B2 (ja) 2014-07-04 2018-06-06 株式会社日立産機システム 電動機制御装置及びそれに用いる制御パラメータ自動調整方法
DE102015107583B4 (de) * 2015-05-13 2022-11-10 Egt Eppinger Getriebe Technologie Gmbh Positionierantrieb sowie Verfahren zum Positionieren eines Abtriebselements
JP2018126796A (ja) * 2017-02-06 2018-08-16 セイコーエプソン株式会社 制御装置、ロボットおよびロボットシステム
JP6538766B2 (ja) * 2017-07-18 2019-07-03 ファナック株式会社 機械学習装置、サーボモータ制御装置、サーボモータ制御システム、及び機械学習方法
CN107968613A (zh) * 2017-11-20 2018-04-27 无锡开放大学 一种基于递归模糊神经网络的永磁同步电机转速控制器

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04324507A (ja) * 1991-04-25 1992-11-13 Hitachi Ltd 駆動装置の加減速制御方法及びロボットシステム
JP2006293483A (ja) * 2005-04-06 2006-10-26 Japan Aerospace Exploration Agency ロバスト最適化問題を解く問題処理方法およびその装置
JP2007034781A (ja) * 2005-07-28 2007-02-08 Fuji Electric Fa Components & Systems Co Ltd 位置決め制御装置の制御パラメータ調整方法
JP2008217155A (ja) * 2007-02-28 2008-09-18 Fuji Heavy Ind Ltd 制御パラメータの自動適合システム
CN105027010A (zh) * 2013-03-14 2015-11-04 株式会社东芝 控制参数调整方法及控制参数调整***
CN104647387A (zh) * 2013-11-25 2015-05-27 佳能株式会社 机器人控制方法、***和装置
CN103853046A (zh) * 2014-02-14 2014-06-11 广东工业大学 一种压电陶瓷驱动器的自适应学习控制方法
CN105785918A (zh) * 2015-01-13 2016-07-20 发那科株式会社 根据加工条件调整参数的参数自动调整装置
CN106483934A (zh) * 2015-08-27 2017-03-08 发那科株式会社 数值控制装置
CN106557073A (zh) * 2015-09-30 2017-04-05 发那科株式会社 具有测定学习控制器的特性的功能的伺服控制装置
CN108393888A (zh) * 2017-02-06 2018-08-14 精工爱普生株式会社 控制装置、机器人以及机器人***

Also Published As

Publication number Publication date
TWI715425B (zh) 2021-01-01
WO2020075316A1 (ja) 2020-04-16
CN112805653B (zh) 2024-02-02
KR102494187B1 (ko) 2023-01-31
TW202030562A (zh) 2020-08-16
KR20210042994A (ko) 2021-04-20

Similar Documents

Publication Publication Date Title
JP6664561B1 (ja) 位置決め制御装置及び位置決め方法
US10261497B2 (en) Machine tool for generating optimum acceleration/deceleration
US9815201B2 (en) Method and apparatus for industrial robotic energy saving optimization using fly-by
US20190126474A1 (en) Method of iterative motion control
JP6903240B1 (ja) モータ制御装置及びモータ制御方法
CN112805653B (zh) 定位控制装置以及定位方法
JP2018077778A (ja) 数値制御装置
US20200160210A1 (en) Method and system for predicting a motion trajectory of a robot moving between a given pair of robotic locations
Evans et al. Reward signal design for autonomous racing
da Silva et al. Design of mechatronic systems with configuration-dependent dynamics: simulation and optimization
Ng et al. Model predictive control and transfer learning of hybrid systems using lifting linearization applied to cable suspension systems
WO2020261386A1 (ja) 数値制御装置および付加製造装置の制御方法
WO2022009333A1 (ja) ロボット制御装置、ロボット制御方法、およびロボット制御プログラム
JP7353245B2 (ja) 付加製造装置および付加製造方法
JP6981579B2 (ja) 位置決め制御装置及び位置決め制御方法
JP6800384B1 (ja) 位置決め制御装置および位置決め方法
Wittmann et al. Time-optimization of trajectories using zero-clamped cubic splines and their analytical gradients
JP7415100B1 (ja) パラメータ調整装置およびパラメータ調整方法
Villagrossi et al. Optimal robot dynamics local identification using genetic-based path planning in workspace subregions
JP2007004391A (ja) 生産・物流スケジュール作成装置及び方法、生産・物流プロセス制御装置及び方法、コンピュータプログラム、並びにコンピュータ読み取り可能な記録媒体
JP2020184268A (ja) 演算処理装置、演算処理プログラム、及び演算処理方法
KR100970539B1 (ko) 최적 지령 작성 장치
US11707844B2 (en) Robot control system and robot control method
Dang et al. Accurate motion regeneration technique with robust control approach
JP2005085111A (ja) 機械システムの制御方法及び装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant