CN116619383B - 基于确定学习的机械臂pid控制方法及*** - Google Patents
基于确定学习的机械臂pid控制方法及*** Download PDFInfo
- Publication number
- CN116619383B CN116619383B CN202310741430.8A CN202310741430A CN116619383B CN 116619383 B CN116619383 B CN 116619383B CN 202310741430 A CN202310741430 A CN 202310741430A CN 116619383 B CN116619383 B CN 116619383B
- Authority
- CN
- China
- Prior art keywords
- mechanical arm
- neural network
- tracking error
- radial basis
- term
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 40
- 230000006870 function Effects 0.000 claims abstract description 53
- 238000003062 neural network model Methods 0.000 claims abstract description 29
- 239000002131 composite material Substances 0.000 claims abstract description 22
- 238000010276 construction Methods 0.000 claims abstract description 11
- 230000000737 periodic effect Effects 0.000 claims abstract description 11
- 238000012549 training Methods 0.000 claims abstract description 11
- 230000011664 signaling Effects 0.000 claims abstract description 7
- 238000013528 artificial neural network Methods 0.000 claims description 41
- PXFBZOLANLWPMH-UHFFFAOYSA-N 16-Epiaffinine Natural products C1C(C2=CC=CC=C2N2)=C2C(=O)CC2C(=CC)CN(C)C1C2CO PXFBZOLANLWPMH-UHFFFAOYSA-N 0.000 claims description 14
- 238000004590 computer program Methods 0.000 claims description 4
- 238000012935 Averaging Methods 0.000 claims description 3
- 150000001875 compounds Chemical class 0.000 claims 2
- 230000003044 adaptive effect Effects 0.000 description 9
- 238000010586 diagram Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 230000003767 neural control Effects 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 230000009471 action Effects 0.000 description 3
- 125000004122 cyclic group Chemical group 0.000 description 3
- 230000007547 defect Effects 0.000 description 3
- 239000011159 matrix material Substances 0.000 description 3
- 210000002569 neuron Anatomy 0.000 description 3
- 230000009466 transformation Effects 0.000 description 3
- 230000001052 transient effect Effects 0.000 description 3
- 230000001133 acceleration Effects 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000005284 excitation Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 230000004888 barrier function Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000005484 gravity Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 210000005036 nerve Anatomy 0.000 description 1
- 238000005312 nonlinear dynamic Methods 0.000 description 1
- 238000011426 transformation method Methods 0.000 description 1
- 238000003466 welding Methods 0.000 description 1
Classifications
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B25—HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
- B25J—MANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
- B25J9/00—Programme-controlled manipulators
- B25J9/16—Programme controls
- B25J9/1602—Programme controls characterised by the control system, structure, architecture
- B25J9/161—Hardware, e.g. neural networks, fuzzy logic, interfaces, processor
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B25—HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
- B25J—MANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
- B25J9/00—Programme-controlled manipulators
- B25J9/16—Programme controls
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B25—HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
- B25J—MANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
- B25J9/00—Programme-controlled manipulators
- B25J9/16—Programme controls
- B25J9/1628—Programme controls characterised by the control loop
- B25J9/163—Programme controls characterised by the control loop learning, adaptive, model based, rule based expert control
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/02—Total factory control, e.g. smart factories, flexible manufacturing systems [FMS] or integrated manufacturing systems [IMS]
Landscapes
- Engineering & Computer Science (AREA)
- Robotics (AREA)
- Mechanical Engineering (AREA)
- Automation & Control Theory (AREA)
- Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Fuzzy Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Feedback Control In General (AREA)
- Manipulator (AREA)
Abstract
本发明提供了一种基于确定学习的机械臂PID控制方法及***,包括:获取参考轨迹及机械臂的实时状态信息,基于获取的参考轨迹及机械臂的实时状态信息,获得跟踪误差;将所述跟踪误差输入预先构建的基于确定学习的PID控制器中,输出出对应的控制信号,并基于所述控制信号对机械臂进行实时控制;其中,所述基于确定学习的PID控制器的构建,具体为:基于复合误差项确定机械臂***内在未知动力学函数;利用径向基神经网络模型对机械臂***内在未知动力学函数进行近似;利用周期性的参考轨迹及对应的机械臂状态信息对所述径向基神经网络模型进行训练,基于训练好的径向基神经网络模型权值信息进行PID控制器的构建。
Description
技术领域
本发明属于机械臂控制技术领域,尤其涉及一种基于确定学习的机械臂PID控制方法及***。
背景技术
本部分的陈述仅仅是提供了与本发明相关的背景技术信息,不必然构成在先技术。
机械臂控制是一种广泛应用于工业自动化、医疗、军事和航天等领域的技术。机械臂控制方法是指如何控制机械臂的运动,使其按照预定的轨迹、速度和加速度执行任务。机械臂通常由关节、执行器和传感器等组成,通过对其关节和执行器进行精确的控制,可以完成各种各样的任务,如物体抓取、搬运、组装和焊接等。
随着科技的进步和人工智能技术的发展,机械臂控制方法也在不断创新和改进。传统的机械臂控制方法包括PID控制、动态面控制和模糊控制等。这些方法虽然可以实现基本的控制功能,但难以适应复杂环境和变化的任务需求。实际工业中的机械臂模型往往是复杂的带有未知动态的非线性***,如何对***中存在的不确定动态进行建模一直是一个具有挑战性的问题。机械臂自适应神经网络控制是一种基于人工智能技术的控制方法,它通过使用神经网络对机械臂进行建模和控制,以实现更加精准、高效、稳定的机械臂控制。其能够根据外部环境的变化和机械臂的自身特性进行自适应调整,从而更好地适应各种复杂的场景和任务需求。然而,传统的自适应神经控制理论主要关注***的稳定性和跟踪控制,缺少对知识获取和利用的探索。
发明内容
为克服上述现有技术的不足,本发明提供了一种基于确定学习的机械臂PID控制方法及***,所述方案充分考虑了传统PID控制器在面对复杂未知非线性***中存在的不足,通过引入神经网络去实现了对未知动态的补偿,大大改善了传统控制器的控制效果;同时,通过引入状态变换,解决了因为***仿射项的存在而导致闭环误差***无法进行学习的问题。
根据本发明实施例的第一个方面,提供了一种基于确定学习的机械臂PID控制方法,包括:
获取参考轨迹及机械臂的实时状态信息,其中,所述状态信息包括关节位置信息及关节速度信息;
基于获取的参考轨迹及机械臂的实时状态信息,获得跟踪误差;
将所述跟踪误差输入预先构建的基于确定学习的PID控制器中,输出出对应的控制信号,并基于所述控制信号对机械臂进行实时控制;
其中,所述基于确定学习的PID控制器的构建,具体为:确定机械臂***的跟踪误差变量表示,并基于所述跟踪误差变量表示确定复合误差项;基于所述复合误差项确定机械臂***内在未知动力学函数;利用径向基神经网络模型对机械臂***内在未知动力学函数进行近似;利用周期性的参考轨迹及对应的机械臂状态信息对所述径向基神经网络模型进行训练,基于训练好的径向基神经网络模型权值信息进行PID控制器的构建。
进一步的,所述机械臂***的跟踪误差变量表示的确定,具体为:构建机械臂连续时间模型,并将其转换为状态空间表达形式;基于机械臂***的状态空间表达确定机械臂***的跟踪误差变量表示。
进一步的,对于复合误差项中的仿射项,通过将复合误差项除以仿射项的上界来消除仿射项的影响。
进一步的,基于训练好的径向基神经网络模型权值信息进行PID控制器的构建,具体为:预先构建用于描述机械臂***内在未知动力学函数的径向基神经网络,并构建神经网络的权值更新律;利用周期性的参考轨迹及对应的机械臂***状态信息对所述径向基神经网络模型进行训练;对于训练好的模型知识,以常值神经网络权值方式进行存储;基于存储的模型知识进行PID控制器的构建。
进一步的,所述基于确定学习的PID控制器,具体表示如下:
其中,Kp,Ki,Kd>0分别为比例项、积分项以及微分项的控制系数;e(t)与e(s)为跟踪误差,为在预定时间段内对径向基神经网络的估计权重求平均值;S(Z)为径向基函数的输入回归向量。
进一步的,所述复合误差项具体表示如下:
z2=e2+αe+βr
其中,e2为位置误差的微分,e为跟踪误差,α为跟踪误差前面的比例系数,β为跟踪误差积分项前面的比例系数,r为跟踪误差的积分项。
进一步的,所述关节位置信息通过关节角度进行表示。
根据本发明实施例的第二个方面,提供了一种基于确定学习的机械臂PID控制***,包括:
数据获取单元,其用于获取参考轨迹及机械臂的实时状态信息,其中,所述状态信息包括关节位置信息及关节速度信息;
跟踪误差确定单元,其用于基于获取的参考轨迹及机械臂的实时状态信息,获得跟踪误差;
控制单元,其用于将所述跟踪误差输入预先构建的基于确定学习的PID控制器中,输出对应的控制信号,并基于所述控制信号对机械臂进行实时控制;其中,所述基于确定学习的PID控制器的构建,具体为:确定机械臂***的跟踪误差变量表示,并基于所述跟踪误差变量表示确定复合误差项;基于所述复合误差项确定机械臂***内在未知动力学函数;利用径向基神经网络模型对机械臂***内在未知动力学函数进行近似;利用周期性的参考轨迹及对应的机械臂状态信息对所述径向基神经网络模型进行训练,基于训练好的径向基神经网络模型权值信息进行PID控制器的构建。
根据本发明实施例的第三个方面,提供了一种电子设备,包括存储器、处理器及存储在存储器上运行的计算机程序,所述处理器执行所述程序时实现所述的一种基于确定学习的机械臂PID控制方法。
根据本发明实施例的第四个方面,提供了一种非暂态计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现所述的一种基于确定学习的机械臂PID控制方法。
以上一个或多个技术方案存在以下有益效果:
(1)本发明提供了一种基于确定学习的机械臂PID控制方法及***,所述方案充分考虑了传统PID控制器在面对复杂未知非线性***中存在的不足,通过引入神经网络去实现了对未知动态的补偿,大大改善了传统控制器的控制效果。
(2)本发明所述方案通过引入状态变换,解决了因为***仿射项的存在而导致闭环误差***无法进行学习的问题。
(3)本发明所述方案可以实现对于复杂非线性***中未知动态的精确辨识和建模,将学习到的知识经验以常值神经网络的形式进行存储,并可以有效地利用所学到的知识,在面对相同或者相似的控制任务的时候,构建经验控制器,从而大幅度改善***的瞬态表现,节省计算资源,进一步提高***的整体控制性能。
本发明附加方面的优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
构成本发明的一部分的说明书附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。
图1为本发明实施例中所述的基于自适应神经网络的PID控制(学习阶段)下跟踪性能示意图;
图2为本发明实施例中所述的自适应控制过程中神经网络权重收敛情况示意图;
图3为本发明实施例中所述的所学习神经网络对非线性未知动态的逼近情况示意图;
图4为本发明实施例中所述的自适应神经控制和学习控制作用下的跟踪误差收敛情况示意图;
图5为本发明实施例中所述的一种基于确定学习的机械臂PID控制方法流程图。
具体实施方式
应该指出,以下详细说明都是示例性的,旨在对本发明提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本发明所属技术领域的普通技术人员通常理解的相同含义。
需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本发明的示例性实施方式。
在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。
实施例一
本实施例提供了一种基于确定学习的机械臂PID控制方法。
传统的PID控制器是目前工业中最普遍应用的控制器,据相关调查表明,工业应用中约95%的控制器回路是采用PID这一结构。由此可见PID这一经典的控制器在工业应用中的地位。针对现有技术存在的问题,本实施例提出了一种基于确定学习的机械臂PID控制方法,所述方案通过引入确定学习理论,与传统的PID结合,实现了对于机械臂***中未知动态的准确辨识,从而在一定程度上克服了传统PID在面对未知非线性***的壁垒。进一步,利用学到的知识构建基于经验的PID控制器,从而大幅度提高了控制性能。本实施例所提出的方法充分体现了智能控制的理念,实现了对知识的获取,存储和利用。通过将现代的先进学习算法与传统PID控制器相结合,实现了对于机械臂***的高性能控制。面对相同或相似的任务的时候,所构建的基于知识的经验控制器避免了对控制器参数的在线调整,从而大大节省了计算时间,提高了控制***的瞬态性能。
具体的,如图5所示,一种基于确定学习的机械臂PID控制方法,包括:
获取参考轨迹及机械臂的实时状态信息,其中,所述状态信息包括关节位置信息及关节速度信息;
基于获取的参考轨迹及机械臂的实时状态信息,获得跟踪误差;
将所述跟踪误差输入预先构建的基于确定学习的PID控制器中,输出出对应的控制信号,并基于所述控制信号对机械臂进行实时控制;
其中,所述基于确定学习的PID控制器的构建,具体为:确定机械臂***的跟踪误差变量表示,并基于所述跟踪误差变量表示确定复合误差项;基于所述复合误差项确定机械臂***内在未知动力学函数;利用径向基神经网络模型对机械臂***内在未知动力学函数进行近似;利用周期性的参考轨迹及对应的机械臂状态信息对所述径向基神经网络模型进行训练,基于训练好的径向基神经网络模型权值信息进行PID控制器的构建。
在具体实施中,所述机械臂***的跟踪误差变量表示的确定,具体为:构建机械臂连续时间模型,并将其转换为状态空间表达形式;基于机械臂***的状态空间表达确定机械臂***的跟踪误差变量表示。
在具体实施中,对于复合误差项中的仿射项,通过将复合误差项除以仿射项的上界来消除仿射项的影响。
在具体实施中,基于训练好的径向基神经网络模型权值信息进行PID控制器的构建,具体为:预先构建用于描述机械臂***内在未知动力学函数的径向基神经网络,并构建神经网络的权值更新律;利用周期性的参考轨迹及对应的机械臂***状态信息对所述径向基神经网络模型进行训练;对于训练好的模型知识,以常值神经网络权值方式进行存储;基于存储的模型知识进行PID控制器的构建。
在具体实施中,所述基于确定学习的PID控制器,具体表示如下:
其中,Kp,Ki,Kd>0分别为比例项、积分项以及微分项的控制系数;e(t)与e(s)为跟踪误差,为在预定时间段内对径向基神经网络的估计权重求平均值;S(Z)为径向基函数的输入回归向量。
在具体实施中,所述复合误差项具体表示如下:
z2=e2+αe+βr
其中,e2为跟踪误差的微分,e为跟踪误差,α为跟踪误差前设置的比例系数,β为跟踪误差积分项前面的比例系数,r为跟踪误差的积分项。
在具体实施中,所述关节位置信息通过关节角度进行表示。
具体的,为了便于理解,以下结合附图从具体实施的角度对本实施例所述方案进行详细说明:
一种基于确定学习的机械臂PID控制方法,具体包括如下步骤:
步骤1:建立n关节机械臂连续时间模型:
其中,q,分别表示为机械臂的关节角度,关节速度以及关节加速度;τ代表控制器输入力矩向量;M(q)代表机械臂的未知惯性矩阵;/>表示未知的科里奥利力矩阵;G(q)表示重力向量。
步骤2:将上述n关节机械臂模型转换为状态空间表达式的形式:
其中,x1=q,表示为转换之后的***状态,分别对应于原***中的关节角度信息和关节速度信息。
步骤3:基于确定学习的智能PID控制器设计
定义***的跟踪误差:
e=x1-xd1 (3)
其中,xd1为***的循环参考轨迹,x1为***的实际关节位置变量。
记F(x1,x2)=M-1[-G(x1)-B(x1,x2)x2],Q(x1,x2)=M-1(x1)。定义复合误差项z2=e2+αe+βr,并求导:
其中,e2的具体表示α为跟踪误差项前面的比例系数,β为跟踪误差积分项前面的比例系数,r为跟踪误差的积分项,u为控制器输入,
定义要拟合的机器人内在未知动力学:
H(Z)=Q-1(F(x1,x2)-fd(xd)+αe2+βe) (5)
综合上述n关节机械臂动力学模型,即公式(2)以及公式(4)、(5),传统的PID控制器,以及确定学习理论,引入径向基神经网络(Radial basis function neural network,RBFNN),去辨识***中的未知函数H(Z),从而抵消***中的不确定性。
具体为:
其中,e(t)与e(s)为跟踪误差,为神经网络权值的估计值。
定义:Kp=Kα,Kd=K,Ki=Kβ,可以得到如下简化形式:
其中,Kp,Ki,Kd>0分别为比例项(Proportional),积分项(Integral)以及微分项(Differential)的控制系数。S(Z)是RBFNN的输入回归向量,是神经网络权值的估计值,Z=[x1,x2,xd1,xd2]T是神经网络的输入向量。
其中,xd2为模型参考输出xd1的导数。
根据李亚普诺夫稳定性设计神经网络的权值更新率,具体如下:
其中Γ=ΓT>0是一个正定对角矩阵。σ>0是一个大于0的常数。在学习阶段,即在自适应控制器,即公式(7)的作用下,图1展示了基于自适应神经网络的PID控制(学习阶段)下跟踪性能,***输出实现了对参考信号的跟踪控制。
步骤4:从闭环控制中进行学习
根据确定学习理论,当RBF NN(即径向基神经网络)的输入向量满足循环轨迹的时候,沿着轨迹附近的神经元总能满足持续激励条件。根据李亚普诺夫稳定性,上述***在控制器(即公式(7))的作用下,闭环***实现稳定,由此可以推导出神经网络的输入向量Z=[x1,x2,xd1,xd2]T在跟踪之后可以实现循环轨迹,满足持续激励的条件。但是由于机械臂模型中仿射项Q=M-1的存在,可能会放大误差,导致出现学习无法进行。为了解决这个问题,本专利采用了一种状态变换的方法,从而可以消除仿射项的影响。具体如下:E=z2/qmax,其中qmax是仿射项的上界。通过状态变换,原始沿着轨迹的闭环误差***可以转换为以下的带有扰动项的线性时变***(Linear time-varying system,LTV),具体形式如下:
通过LTV***指数稳定性定理以及非线性***的扰动定理可以证明沿着轨迹附近的神经元的权值估计误差收敛到零附近的一个小邻域内,从而实现了神经网络权值的精确收敛,***的未知非线性动态可以由轨迹附近的神经元组成的神经网络精确逼近。图2展示了自适应控制过程中神经网络权重收敛情况,在跟踪控制过程中,实现了神经网络权值的收敛。
步骤5:以下基于确定学习得到的知识再利用,构建基于经验知识的智能PID控制器,主要包括以下处理过程:
利用步骤4学习到的关于未知非线性***的知识,根据确定学习理论,将所学到的知识表示为如下:
其中,[ta,tb]表示神经网络权值收敛后的稳态阶段,由此RBF NN从控制中学到的知识就以常值神经网络的形式存储。图3展示了所学习神经网络对非线性未知动态的逼近情况,学到的常值神经网络实现了对机械臂未知内在动态的准确建模。
然后基于常值神经网络去构建基于经验知识的智能PID控制器,控制器的形式如下:
对于相同或者相似的控制任务,基于经验知识的控制器,即公式(11),可以快速被调用,而不用重新在线计算更新神经权值,大大节省了计算资源,进一步提高了智能PID控制器的控制性能。图4分别展示了自适应神经控制(Adaptive neural control,ANC)和学习控制(Learning control,LC)作用下的跟踪控制性能,可以看出PID学习控制可以获得更好的控制性能(跟踪误差更小,瞬态性能更好)。
实施例二
本实施例的目的是提供一种基于确定学习的机械臂PID控制***。
一种基于确定学习的机械臂PID控制***,包括:
数据获取单元,其用于获取参考轨迹及机械臂的实时状态信息,其中,所述状态信息包括关节位置信息及关节速度信息;
跟踪误差确定单元,其用于基于获取的参考轨迹及机械臂的实时状态信息,获得跟踪误差;
控制单元,其用于将所述跟踪误差输入预先构建的基于确定学习的PID控制器中,输出出对应的控制信号,并基于所述控制信号对机械臂进行实时控制;其中,所述基于确定学习的PID控制器的构建,具体为:确定机械臂***的跟踪误差变量表示,并基于所述跟踪误差变量表示确定复合误差项;基于所述复合误差项确定机械臂***内在未知动力学函数;利用径向基神经网络模型对机械臂***内在未知动力学函数进行近似;利用周期性的参考轨迹及对应的机械臂状态信息对所述径向基神经网络模型进行训练,基于训练好的径向基神经网络模型权值信息进行PID控制器的构建。
此处需要说明的是,本实施例中的各个模块与实施例一中的各个步骤一一对应,其具体实施过程相同,此处不再累述。
在更多实施例中,还提供:
一种电子设备,包括存储器和处理器以及存储在存储器上并在处理器上运行的计算机指令,所述计算机指令被处理器运行时,完成实施例一中所述的方法。为了简洁,在此不再赘述。
应理解,本实施例中,处理器可以是中央处理单元CPU,处理器还可以是其他通用处理器、数字信号处理器DSP、专用集成电路ASIC,现成可编程门阵列FPGA或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
存储器可以包括只读存储器和随机存取存储器,并向处理器提供指令和数据、存储器的一部分还可以包括非易失性随机存储器。例如,存储器还可以存储设备类型的信息。
一种计算机可读存储介质,用于存储计算机指令,所述计算机指令被处理器执行时,完成实施例一中所述的方法。
实施例一中的方法可以直接体现为硬件处理器执行完成,或者用处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器、闪存、只读存储器、可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器,处理器读取存储器中的信息,结合其硬件完成上述方法的步骤。为避免重复,这里不再详细描述。
本领域普通技术人员可以意识到,结合本实施例描述的各示例的单元即算法步骤,能够以电子硬件或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
上述实施例提供的一种基于确定学习的机械臂PID控制方法及***可以实现,具有广阔的应用前景。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (8)
1.一种基于确定学习的机械臂PID控制方法,其特征在于,包括:
获取参考轨迹及机械臂的实时状态信息,其中,所述状态信息包括关节位置信息及关节速度信息;
基于获取的参考轨迹及机械臂的实时状态信息,获得跟踪误差;
将所述跟踪误差输入预先构建的基于确定学习的PID控制器中,输出出对应的控制信号,并基于所述控制信号对机械臂进行实时控制;
其中,所述基于确定学习的PID控制器的构建,具体为:确定机械臂***的跟踪误差变量表示,并基于所述跟踪误差变量表示确定复合误差项;基于所述复合误差项确定机械臂***内在未知动力学函数;利用径向基神经网络模型对机械臂***内在未知动力学函数进行近似;利用周期性的参考轨迹及对应的机械臂状态信息对所述径向基神经网络模型进行训练,基于训练好的径向基神经网络模型权值信息进行PID控制器的构建;
基于训练好的径向基神经网络模型权值信息进行PID控制器的构建,具体为:预先构建用于描述机械臂***内在未知动力学函数的径向基神经网络,并构建神经网络的权值更新律;利用周期性的参考轨迹及对应的机械臂***状态信息对所述径向基神经网络模型进行训练;对于训练好的模型知识,以常值神经网络权值方式进行存储;基于存储的模型知识进行PID控制器的构建;
所述复合误差项具体表示如下:
z2=e2+αe+βr
其中,e2为位置误差的微分,e为跟踪误差,α为跟踪误差项前面的比例系数,β为跟踪误差积分项前面的比例系数,r为跟踪误差的积分项。
2.如权利要求1所述的一种基于确定学习的机械臂PID控制方法,其特征在于,所述机械臂***的跟踪误差变量表示的确定,具体为:构建机械臂连续时间模型,并将其转换为状态空间表达形式;基于机械臂***的状态空间表达确定机械臂***的跟踪误差变量表示。
3.如权利要求1所述的一种基于确定学习的机械臂PID控制方法,其特征在于,对于复合误差项中的仿射项,通过将复合误差项除以仿射项的上界来消除仿射项的影响。
4.如权利要求1所述的一种基于确定学习的机械臂PID控制方法,其特征在于,所述基于确定学习的PID控制器,具体表示如下:
其中,Kp,Ki,Kd>0分别为比例项、积分项以及微分项的控制系数;e(t)与e(s)为跟踪误差,为在预定时间段内对径向基神经网络的估计权重求平均值;S(Z)为径向基函数的输入回归向量。
5.如权利要求1所述的一种基于确定学习的机械臂PID控制方法,其特征在于,所述关节位置信息通过关节角度进行表示。
6.一种基于确定学习的机械臂PID控制***,其特征在于,包括:
数据获取单元,其用于获取参考轨迹及机械臂的实时状态信息,其中,所述状态信息包括关节位置信息及关节速度信息;
跟踪误差确定单元,其用于基于获取的参考轨迹及机械臂的实时状态信息,获得跟踪误差;
控制单元,其用于将所述跟踪误差输入预先构建的基于确定学习的PID控制器中,输出出对应的控制信号,并基于所述控制信号对机械臂进行实时控制;其中,所述基于确定学习的PID控制器的构建,具体为:确定机械臂***的跟踪误差变量表示,并基于所述跟踪误差变量表示确定复合误差项;基于所述复合误差项确定机械臂***内在未知动力学函数;利用径向基神经网络模型对机械臂***内在未知动力学函数进行近似;利用周期性的参考轨迹及对应的机械臂状态信息对所述径向基神经网络模型进行训练,基于训练好的径向基神经网络模型权值信息进行PID控制器的构建;
基于训练好的径向基神经网络模型权值信息进行PID控制器的构建,具体为:预先构建用于描述机械臂***内在未知动力学函数的径向基神经网络,并构建神经网络的权值更新律;利用周期性的参考轨迹及对应的机械臂***状态信息对所述径向基神经网络模型进行训练;对于训练好的模型知识,以常值神经网络权值方式进行存储;基于存储的模型知识进行PID控制器的构建;
所述复合误差项具体表示如下:
z2=e2+αe+βr
其中,e2为位置误差的微分,e为跟踪误差,α为跟踪误差项前面的比例系数,β为跟踪误差积分项前面的比例系数,r为跟踪误差的积分项。
7.一种电子设备,包括存储器、处理器及存储在存储器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1-5任一项所述的一种基于确定学习的机械臂PID控制方法。
8.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-5任一项所述的一种基于确定学习的机械臂PID控制方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310741430.8A CN116619383B (zh) | 2023-06-21 | 2023-06-21 | 基于确定学习的机械臂pid控制方法及*** |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310741430.8A CN116619383B (zh) | 2023-06-21 | 2023-06-21 | 基于确定学习的机械臂pid控制方法及*** |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116619383A CN116619383A (zh) | 2023-08-22 |
CN116619383B true CN116619383B (zh) | 2024-02-20 |
Family
ID=87613527
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310741430.8A Active CN116619383B (zh) | 2023-06-21 | 2023-06-21 | 基于确定学习的机械臂pid控制方法及*** |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116619383B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117231599B (zh) * | 2023-11-14 | 2024-02-02 | 上海海维工业控制有限公司 | 基于pid的液压执行机构驱动力控制方法 |
CN117539153B (zh) * | 2023-11-21 | 2024-05-28 | 山东大学 | 基于确定学习的上肢康复机器人自适应控制方法及*** |
Citations (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH07319507A (ja) * | 1994-05-26 | 1995-12-08 | Bridgestone Corp | ロボット制御装置 |
CN101320251A (zh) * | 2008-07-15 | 2008-12-10 | 华南理工大学 | 基于确定学习理论的机器人行走控制方法 |
CN102289204A (zh) * | 2011-06-03 | 2011-12-21 | 华南理工大学 | 基于确定学习理论的机械臂通用控制方法 |
CN104463118A (zh) * | 2014-12-04 | 2015-03-25 | 龙岩学院 | 一种基于Kinect的多视角步态识别方法 |
CN106393116A (zh) * | 2016-11-18 | 2017-02-15 | 山东大学 | 具有初态学习的机械臂分数阶迭代学习控制方法及*** |
CN107160398A (zh) * | 2017-06-16 | 2017-09-15 | 华南理工大学 | 基于确定学习的全状态受限刚性机械臂安全可靠控制方法 |
KR20170119197A (ko) * | 2016-04-18 | 2017-10-26 | 한국과학기술연구원 | 궤도 추적 에러의 최대 진폭을 줄이기 위한 제어기 설계 방법 및 이를 이용한 제어기 |
CN107498554A (zh) * | 2017-07-31 | 2017-12-22 | 华南理工大学 | 一种基于动态模式的机械臂智能自主控制方法 |
CN107994834A (zh) * | 2017-10-16 | 2018-05-04 | 浙江工业大学 | 基于均值耦合误差的多电机***自适应快速终端滑模同步控制方法 |
CN110376879A (zh) * | 2019-08-16 | 2019-10-25 | 哈尔滨工业大学(深圳) | 一种基于神经网络的pid型迭代学习控制方法 |
CN112904728A (zh) * | 2021-01-21 | 2021-06-04 | 青岛大学 | 一种基于改进型趋近律的机械臂滑模控制轨迹跟踪方法 |
CN114185264A (zh) * | 2021-12-06 | 2022-03-15 | 广东工业大学 | 一种基于物理信息神经网络的pid控制器参数整定方法 |
CN114995144A (zh) * | 2022-06-09 | 2022-09-02 | 南京工业大学 | 一种基于迭代学***面机械臂轨迹跟踪控制方法 |
CN115256401A (zh) * | 2022-08-29 | 2022-11-01 | 南京理工大学 | 一种基于强化学习的空间机械臂轴孔装配变阻抗控制方法 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2021188354A1 (en) * | 2020-03-14 | 2021-09-23 | DataRobot, Inc. | Automated and adaptive design and training of neural networks |
US11796977B2 (en) * | 2020-04-29 | 2023-10-24 | Honeywell International Inc. | PID controller autotuner using machine learning approaches |
-
2023
- 2023-06-21 CN CN202310741430.8A patent/CN116619383B/zh active Active
Patent Citations (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH07319507A (ja) * | 1994-05-26 | 1995-12-08 | Bridgestone Corp | ロボット制御装置 |
CN101320251A (zh) * | 2008-07-15 | 2008-12-10 | 华南理工大学 | 基于确定学习理论的机器人行走控制方法 |
CN102289204A (zh) * | 2011-06-03 | 2011-12-21 | 华南理工大学 | 基于确定学习理论的机械臂通用控制方法 |
CN104463118A (zh) * | 2014-12-04 | 2015-03-25 | 龙岩学院 | 一种基于Kinect的多视角步态识别方法 |
KR20170119197A (ko) * | 2016-04-18 | 2017-10-26 | 한국과학기술연구원 | 궤도 추적 에러의 최대 진폭을 줄이기 위한 제어기 설계 방법 및 이를 이용한 제어기 |
CN106393116A (zh) * | 2016-11-18 | 2017-02-15 | 山东大学 | 具有初态学习的机械臂分数阶迭代学习控制方法及*** |
CN107160398A (zh) * | 2017-06-16 | 2017-09-15 | 华南理工大学 | 基于确定学习的全状态受限刚性机械臂安全可靠控制方法 |
CN107498554A (zh) * | 2017-07-31 | 2017-12-22 | 华南理工大学 | 一种基于动态模式的机械臂智能自主控制方法 |
CN107994834A (zh) * | 2017-10-16 | 2018-05-04 | 浙江工业大学 | 基于均值耦合误差的多电机***自适应快速终端滑模同步控制方法 |
CN110376879A (zh) * | 2019-08-16 | 2019-10-25 | 哈尔滨工业大学(深圳) | 一种基于神经网络的pid型迭代学习控制方法 |
CN112904728A (zh) * | 2021-01-21 | 2021-06-04 | 青岛大学 | 一种基于改进型趋近律的机械臂滑模控制轨迹跟踪方法 |
CN114185264A (zh) * | 2021-12-06 | 2022-03-15 | 广东工业大学 | 一种基于物理信息神经网络的pid控制器参数整定方法 |
CN114995144A (zh) * | 2022-06-09 | 2022-09-02 | 南京工业大学 | 一种基于迭代学***面机械臂轨迹跟踪控制方法 |
CN115256401A (zh) * | 2022-08-29 | 2022-11-01 | 南京理工大学 | 一种基于强化学习的空间机械臂轴孔装配变阻抗控制方法 |
Non-Patent Citations (3)
Title |
---|
《基于确定学习理论的非线性***智能控制方法研究》;张付凯;万方学位论文;1-152 * |
不确定机器人的自适应神经网络控制与学习;吴玉香;王聪;;控制理论与应用(第08期);65-72 * |
面向模型未知的自由漂浮空间机械臂自适应神经鲁棒控制;王超等;中国工程机械学报(第02期);63-68 * |
Also Published As
Publication number | Publication date |
---|---|
CN116619383A (zh) | 2023-08-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN116619383B (zh) | 基于确定学习的机械臂pid控制方法及*** | |
Deng et al. | Model-based event-triggered tracking control of underactuated surface vessels with minimum learning parameters | |
Mohajerin et al. | Multistep prediction of dynamic systems with recurrent neural networks | |
Sun et al. | Neural network-based adaptive controller design of robotic manipulators with an observer | |
Lam et al. | Model predictive contouring control | |
Sun et al. | Tracking of unicycle robots using event-based MPC with adaptive prediction horizon | |
Hu et al. | A reinforcement learning neural network for robotic manipulator control | |
Qi et al. | Stable indirect adaptive control based on discrete-time T–S fuzzy model | |
CN111716360B (zh) | 一种基于模糊逻辑的柔性关节机械臂采样控制方法及装置 | |
Sui et al. | Active disturbance rejection control for optoelectronic stabilized platform based on adaptive fuzzy sliding mode control | |
Wang et al. | Self‐learning‐based optimal tracking control of an unmanned surface vehicle with pose and velocity constraints | |
CN109669345A (zh) | 基于eso的水下机器人模糊pid运动控制方法 | |
Pan et al. | Online data‐driven composite adaptive backstepping control with exact differentiators | |
Rego et al. | Lyapunov-based continuous-time nonlinear control using deep neural network applied to underactuated systems | |
Yan et al. | Robust nonlinear model predictive control of a bionic underwater robot with external disturbances | |
Zhang et al. | Low-level control technology of micro autonomous underwater vehicle based on intelligent computing | |
Gao et al. | Adaptive model-based dynamic event-triggered output feedback control of a robotic manipulator with disturbance | |
Hu et al. | High accuracy adaptive motion control for a robotic manipulator with model uncertainties based on multilayer neural network | |
Shang et al. | Speed control strategy of dual flexible servo system considering time‐varying parameters for flexible manipulator with an axially translating arm | |
Wang et al. | Research of manipulator trajectory tracking based on adaptive robust iterative learning control | |
Han et al. | Symmetric actor–critic deep reinforcement learning for cascade quadrotor flight control | |
Chen | Adaptive robust control of artificial swarm systems | |
Bouzid et al. | 3d trajectory tracking control of quadrotor UAV with on-line disturbance compensation | |
Liu et al. | Robust Adaptive Self‐Structuring Neural Network Bounded Target Tracking Control of Underactuated Surface Vessels | |
Wang et al. | Adaptive finite‐time fault‐tolerant control for flexible‐joint robotic stochastic systems with input saturation and sensor fault |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |