CN116038709A - 非线性多机械臂***的分布式优化控制方法、设备及介质 - Google Patents
非线性多机械臂***的分布式优化控制方法、设备及介质 Download PDFInfo
- Publication number
- CN116038709A CN116038709A CN202310049147.9A CN202310049147A CN116038709A CN 116038709 A CN116038709 A CN 116038709A CN 202310049147 A CN202310049147 A CN 202310049147A CN 116038709 A CN116038709 A CN 116038709A
- Authority
- CN
- China
- Prior art keywords
- mechanical arm
- nonlinear multi
- arm system
- nonlinear
- control
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 94
- 238000005457 optimization Methods 0.000 claims abstract description 74
- 230000009466 transformation Effects 0.000 claims abstract description 28
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 17
- 230000008859 change Effects 0.000 claims abstract description 13
- 238000011045 prefiltration Methods 0.000 claims abstract description 13
- 230000006870 function Effects 0.000 claims description 85
- 238000004891 communication Methods 0.000 claims description 35
- 230000015654 memory Effects 0.000 claims description 17
- 238000013528 artificial neural network Methods 0.000 claims description 12
- 238000003860 storage Methods 0.000 claims description 12
- 230000003767 neural control Effects 0.000 claims description 11
- 238000013461 design Methods 0.000 claims description 10
- 230000008569 process Effects 0.000 claims description 9
- 230000001133 acceleration Effects 0.000 claims description 4
- 239000011159 matrix material Substances 0.000 claims description 4
- 230000005484 gravity Effects 0.000 claims description 3
- 238000010586 diagram Methods 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 4
- 238000004088 simulation Methods 0.000 description 3
- 239000003795 chemical substances by application Substances 0.000 description 2
- 238000004590 computer program Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 230000006855 networking Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 210000005036 nerve Anatomy 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 239000013641 positive control Substances 0.000 description 1
- 238000003466 welding Methods 0.000 description 1
Images
Classifications
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B25—HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
- B25J—MANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
- B25J9/00—Programme-controlled manipulators
- B25J9/16—Programme controls
- B25J9/1679—Programme controls characterised by the tasks executed
- B25J9/1682—Dual arm manipulator; Coordination of several manipulators
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B25—HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
- B25J—MANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
- B25J9/00—Programme-controlled manipulators
- B25J9/16—Programme controls
- B25J9/1602—Programme controls characterised by the control system, structure, architecture
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/02—Total factory control, e.g. smart factories, flexible manufacturing systems [FMS] or integrated manufacturing systems [IMS]
Landscapes
- Engineering & Computer Science (AREA)
- Robotics (AREA)
- Mechanical Engineering (AREA)
- Automation & Control Theory (AREA)
- Feedback Control In General (AREA)
Abstract
本申请公开了一种非线性多机械臂***的分布式优化控制方法、设备及介质。所述方法包括:基于所述非线性多机械臂***的状态空间方程,确定目标控制函数;其中,所述状态空间方程包括未知非线性项;基于分布式比例积分优化算法,得到所述目标控制函数的全局最优估计值;将所述全局最优估计值输入至预滤波器进行重构,获得不带任何全局信息的最优控制信号;基于所述最优控制信号,构建误差变换方程;基于预设函数和所述误差变化方程,采用反步法构建径向基神经控制网络的固定时间控制器;基于所述固定时间控制器,对所述最优控制信号进行快速跟踪,使所述非线性多机械臂***达到最优共识。由此,本申请实现了***的与初始状态无关的快速收敛。
Description
技术领域
本申请涉及机械臂控制领域,尤其涉及一种非线性多机械臂***的分布式优化控制方法、设备以及存储介质。
背景技术
多机械臂的协同合作是当前机械臂研究领域的热点之一。协同多机械手***的出现,通过提供比单机械手更大的工作空间、更强的工作能力、更灵活的***结构和更大的负载能力,克服了单机械臂***的工作极限,从而给完成许多单一机械手无法完成的困难任务,如协同搬运和焊接。虽然多机械手合作比单一机械手有很多优势,然而,它也引入了许多控制问题。与单一机械臂相比,协同多机械臂***具有更为复杂的组织结构,它不是多个机械臂的简单组合。它需要解决环境相互作用的不确定性、可行的控制方法和优化协调规划的问题。因此,研究非线性多机械臂***的协调控制方法是机器人领域中的难点问题之一。随着物联网、5G、人工智能、大数据等技术的快速发展,复杂性、网络化和数据量大等点已经成为时代特征。在大数据与网络化迅速发展之际,分布式优化理论、技术及其相关应用受到越来越多的关注。分布式优化问题指将大规模复杂的优化问题分布到多个智能体上进行分布式的计算,各个智能体通过某些预先定义的协调规则进行各自的优化与决策,并通过通信网络不断交换各自信息,最终得到全局目标函数的最优解,其灵活与方便的特点使得分布式优化在诸多工业与科技领域拥有重要的应用前景,例如智能电网、传感器网络、机器学习以及信息物理***等领域。
在分布式算法中,为了摆脱***初始状态的约束,进一步提高闭环***在有限时间内的收敛性能,近年来在有限时间稳定性的基础上发展了固定时间稳定性,能够给出一个统一固定的和***初值无关的收敛时间。但针对非线性多机械臂***,关于固定时间分布式优化的结果仍少之又少,亟待解决。
申请内容
本申请的主要目的在于提供一种非线性多机械臂***的分布式优化控制方法、设备及介质,旨在解决现有非线性多机械臂***难以实现统一固定且和***初值无关的收敛时间的技术问题。
为实现上述目的,本申请提供一种非线性多机械臂***的分布式优化控制方法,所述方法包括:
基于所述非线性多机械臂***的状态空间方程,确定所述非线性多机械臂***的目标控制函数;其中,所述状态空间方程包括未知非线性项;
基于分布式比例积分优化算法,得到所述目标控制函数的全局最优估计值;
将所述全局最优估计值输入至预滤波器进行重构,获得不带任何全局信息的最优控制信号;
基于所述最优控制信号,构建所述非线性多机械臂***的误差变换方程;
基于预设Lyapunov李亚普诺夫函数和所述误差变化方程,采用反步法构建径向基神经控制网络的固定时间控制器;
基于所述固定时间控制器,对所述最优控制信号进行快速跟踪,在跟踪过程中基于所述径向基神经控制网络调整所述非线性多机械臂***中各个机械臂的控制输入力矩值,使所述非线性多机械臂***达到最优共识。
在本申请可能的一实施例中,所述误差变换方程包括跟踪误差变换方程和误差面变换方程,所述固定时间控制器包括固定时间子虚拟控制器和固定时间实际控制器;
所述基于预设Lyapunov李亚普诺夫函数和所述误差变化方程,采用反步法构建径向基神经控制网络的固定时间控制器,包括:
基于第一预设Lyapunov李亚普诺夫函数和所述跟踪误差变换方程,生成固定时间子虚拟控制器和对应的第一神经网络更新律;
基于第二预设Lyapunov李亚普诺夫函数和所述误差面变换方程,生成固定时间实际控制器和对应的第二神经网络更新律。
在本申请可能的一实施例中,所述基于所述非线性多机械臂***的状态空间方程,确定所述非线性多机械臂***的目标控制函数,包括:
构建所述非线性多机械臂***中第i个机械臂的动力学方程;其中,所述动力学方程为:;
将所述动力学方程转换为所述状态空间方程;其中,所述状态空间方程为:
;
基于所述状态空间方程,确定所述非线性多机械臂***的目标控制函数;其中,所述目标控制函数为:
;
定义全局目标函数且R为实数域,则所述目标控制函数化简为:
;
所述目标控制函数转换为寻找最优的使得每个机械臂都满足;
其中,为所述第i个机械臂中机械手关节的角位置,为所述第i个机械臂中机械手关节的角速度,为所述第i个机械臂中机械手关节的角加速度,为所述第i个机械臂的对称正定转动惯量,为所述第i个机械臂向心力,为所述第i个机械臂的重力力矩,为所述第i个机械臂的控制输入力矩,,,为输出状态,,为所述第i个机械臂的局部目标函数。
在本申请可能的一实施例中,所述基于分布式比例积分优化算法,得到所述目标控制函数的全局最优估计值,包括:
根据所述非线性多机械臂***中各个机械臂之间的通讯关系,生成所述非线性多机械臂***的通讯拓扑结构;其中,所述通讯拓扑结构表示为;为顶点集,表示为;为边集,表示为;为邻接矩阵,表示为;
在所述通讯拓扑结构中,N个机械臂中的第i个机械臂能够接受到第k个机械臂的信息时,表示为,第i个机械臂的邻居集表示为;其中,若,则相应的>0,若不成立,则=0;根据的具体取值,得到,若,则所述通讯拓扑结构为无向拓扑;
基于分布式比例积分优化算法和所述通讯拓扑结构,构建所述非线性多机械臂***的虚拟***模型;
基于所述虚拟***模型,得到所述目标控制函数的全局最优估计值;
其中,所述虚拟***模型为:
;
;
其中,和均为控制参数,为所述全局最优估计值,为所述虚拟***的状态。
在本申请可能的一实施例中,所述预滤波器为:
;
其中,为所述最优控制信号,为所述最优控制信号的最高阶导数的阶数,为正常数,且满足:构成赫尔维兹多项式。
在本申请可能的一实施例中,所述跟踪误差变换方程为:;其中,所述为跟踪误差,所述=;
所述误差面变换方程为:;其中,为所述误差面,为固定时间子虚拟控制器。
在本申请可能的一实施例中,所述基于所述非线性多机械臂***的状态空间方程,确定所述非线性多机械臂***的目标控制函数之前,所述方法还包括:
利用所述径向基神经控制网络对所述未知非线性项逼近,获得所述未知非线性项;所述未知非线性项为:
;
;
其中,和均为所述未知非线性项,所述和均为理想权重,和均为基函数,和均为逼近误差,满足和,和为任意小的正常数,为固定时间子虚拟控制器的导数。
在本申请可能的一实施例中,所述第一预设Lyapunov李亚普诺夫函数为:;
所述固定时间子虚拟控制器为:
,其中,
;
第一神经网络更新律为:
;其中,,,,,,均为第i个机械臂的设计参数;为理想权重的估计值;
所述第二预设Lyapunov李亚普诺夫函数为:;
所述固定时间实际控制器为:
,其中,
;
第二神经网络更新律为:
;其中,,,,,,均为第i个机械臂的设计参数;为理想权重的估计值。
第二方面,本申请还提供了一种非线性多机械臂***的分布式优化控制设备,包括:处理器,存储器以及存储在所述存储器中的非线性多机械臂***的分布式优化控制程序,所述非线性多机械臂***的分布式优化控制程序被所述处理器运行时实现如上所述非线性多机械臂***的分布式优化控制方法的步骤。
第三方面,本申请还提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有非线性多机械臂***的分布式优化控制程序,所述非线性多机械臂***的分布式优化控制程序被处理器执行时实现如上所述的非线性多机械臂***的分布式优化控制方法。
本申请实施例提出的一种非线性多机械臂***的分布式优化控制方法,所述方法包括:基于所述非线性多机械臂***的状态空间方程,确定所述非线性多机械臂***的目标控制函数;其中,所述状态空间方程包括未知非线性项;基于分布式比例积分优化算法,得到所述目标控制函数的全局最优估计值;将所述全局最优估计值输入至预滤波器进行重构,获得不带任何全局信息的最优控制信号;基于所述最优控制信号,构建所述非线性多机械臂***的误差变换方程;基于预设Lyapunov李亚普诺夫函数和所述误差变化方程,采用反步法构建径向基神经控制网络的固定时间控制器;基于所述固定时间控制器,对所述最优控制信号进行快速跟踪,在跟踪过程中基于所述径向基神经控制网络调整所述非线性多机械臂***中各个机械臂的控制输入力矩值,使所述非线性多机械臂***达到最优共识。
本申请中,考虑了带有未知非线性的多机械臂***的分布式优化控制问题,通过预滤波器巧妙地将分布式优化问题转换为一致最优控制问题,且本申请采用固定时间控制器,从而基于固定时间收敛理论方法,提供了一种固定时间分布式优化方法,能够给出较为准确的优化时间估计值的一个上界,该上界与***初始状态无关,由此,本申请实现了***的与初始状态无关的快速收敛。
附图说明
图1为本申请实施例方案涉及的硬件运行环境的非线性多机械臂***的分布式优化控制设备的结构示意图;
图2为本申请流程非线性多机械臂***的分布式优化控制方法第一实施例的流程示意图;
图3为本申请一示例中非线性多机械臂***的无向通信拓扑结构;
图4为四个机械臂的转动角度的变化曲线;
图5为四个机械臂的转动角速度的变化曲线;
图6为径向基神经控制网络的权值范数的变换曲线;
图7为四个机械臂的控制输入力矩值的变化曲线。
本申请目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
本申请提供一种解决方案,考虑了带有未知非线性的多机械臂***的分布式优化控制问题,通过预滤波器巧妙地将分布式优化问题转换为一致最优控制问题,且本申请采用固定时间控制器,从而基于固定时间收敛理论方法,提供了一种固定时间分布式优化方法,能够给出较为准确的优化时间估计值的一个上界,该上界与***初始状态无关,由此,本申请实现了***的与初始状态无关的快速收敛。
下面结合一些具体实施例进一步阐述本申请的发明构思。
参照图1,图1为本申请实施例方案涉及的硬件运行环境的非线性多机械臂***的分布式优化控制设备的结构示意图。
如图1所示,该播放终端可以包括:处理器1001,例如中央处理器(CentralProcessing Unit,CPU),通信总线1002、用户接口1003,网络接口1004,存储器1005。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard),可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如无线保真(WIreless-FIdelity,WI-FI)接口)。存储器1005可以是高速的随机存取存储器(RandomAccess Memory,RAM)存储器,也可以是稳定的非易失性存储器(Non-Volatile Memory,NVM),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。
本领域技术人员可以理解,图1中示出的结构并不构成对非线性多机械臂***的分布式优化控制设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
如图1所示,作为一种存储介质的存储器1005中可以包括操作***、数据存储模块、网络通信模块、用户接口模块以及非线性多机械臂***的分布式优化控制程序。
在图1所示的非线性多机械臂***的分布式优化控制设备中,网络接口1004主要用于与网络服务器进行数据通信;用户接口1003主要用于与用户进行数据交互;本申请非线性多机械臂***的分布式优化控制设备中的处理器1001、存储器1005可以设置在非线性多机械臂***的分布式优化控制设备中,非线性多机械臂***的分布式优化控制设备通过处理器1001调用存储器1005中存储的非线性多机械臂***的分布式优化控制程序,并执行本申请实施例提供的非线性多机械臂***的分布式优化控制方法。
基于上述硬件结构但不限于上述硬件结构,本申请提供一种非线性多机械臂***的分布式优化控制方法第一实施例。参照图2,图2示出了申请非线性多机械臂***的分布式优化控制第一实施例的流程示意图。
需要说明的是,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
本实施例中,所述方法包括:
步骤S100、基于所述非线性多机械臂***的状态空间方程,确定所述非线性多机械臂***的目标控制函数;其中,所述状态空间方程包括未知非线性项。
其中,首先构建所述非线性多机械臂***中第i个机械臂的动力学方程。所述动力学方程为:;
其中,为所述第i个机械臂中机械手关节的角位置,为所述第i个机械臂中机械手关节的角速度,为所述第i个机械臂中机械手关节的角加速度,为所述第i个机械臂的对称正定转动惯量,为所述第i个机械臂向心力,为所述第i个机械臂的重力力矩,为所述第i个机械臂的控制输入力矩。
考虑到复杂环境下多机械臂***受到未知非线性的影响,因此,令,,将第i个机械臂的动力学方程转换为状态空间方程;;
为输出状态,也即是机械臂的角速度,其中,和均为所述未知非线性项。在一实施例中,,。
基于所有机械臂的所述状态空间方程,确定所述非线性多机械臂***的目标控制函数;
;
其中,,R为实数域,N为非线性多机械臂***中机械臂的总数。
也即是,本实施例中,通过构建全局目标函数,该全局目标函数也即是本申请所欲解决的一致性最优控制问题。其中,为所述第i个机械臂的局部目标函数,可以理解的,在分布式控制算法中,每个机械臂均存在一个仅有自身知道的局部目标函数。
由此,本实施例中,目的是设计一个固定时间控制器,配置的控制率使得非线性多机械臂***可以解决该目标控制函数。
进一步的,可定义全局目标函数,且为实数域,则上述的目标控制函数可以化简为:
;
也即是,本申请的目标即是寻找最优的,使得每个机械臂***都满足。
步骤S200、基于分布式比例积分优化算法,得到所述目标控制函数的全局最优估计值。
具体而言,本实施例中针对每个机械臂***建立一个虚拟***,并基于虚拟***采用分布式比例积分优化算法在线估计全局最优解,也即是寻找最优的,使得每个机械臂***都满足。
具体的,步骤S200具体包括:
步骤S201、根据所述非线性多机械臂***中各个机械臂之间的通讯关系,生成所述非线性多机械臂***的通讯拓扑结构。
其中,所述通讯拓扑结构表示为;为顶点集,表示为;为边集,表示为;为邻接矩阵,表示为;
步骤S202、基于分布式比例积分优化算法和所述通讯拓扑结构,构建所述非线性多机械臂***的虚拟***模型。
步骤S203、基于所述虚拟***模型,得到所述目标控制函数的全局最优估计值。
本实施例中,首先建立描述非线性多机械臂***之间通讯关系的无向拓扑图。具体的,非线性多机械臂***之间通讯关系,即通讯拓扑结构可通过图论G来描述。由于本实施例中,非线性多机械臂***具有N个机械臂。因此,可用于表示图论中一个有向通讯拓扑,其中,为非线性多机械臂***中的顶点集,表示为;为非线性多机械臂***的边集,表示为;为邻接矩阵,表示为。
在该图论中,N个机械臂中的第i个机械臂能够接受到第k个机械臂的信息,可表示为。此时,第i个机械臂的邻居集可表示为。从而,若,则相应的>0,反之,若不成立,则=0。由此,可以根据的具体取值,得到。
值得一提的是,如果,。则认为图论G为无向拓扑。
然后,基于分布式比例积分算法和通信拓扑结构构建出虚拟***模型如下:
;
;
其中,和均为正的控制参数,和均表示虚拟***的状态,表示局部目标函数的的梯度。
然后基于所述虚拟***模型,在线估计得到所述目标控制函数的全局最优估计值。
步骤S300、将所述全局最优估计值输入至预滤波器进行重构,获得不带任何全局信息的最优控制信号。
具体而言,将生成的全局最优估计值输入到预滤波器重构一个新的优化参考信号,也即是本实施例的最优控制信息。从而通过预滤波技术巧妙地将分布式优化问题转换为一致最优控制问题。也即是本实施例中的分布优化方法是完全分布式的,不需要用到任何全局信息,如邻居机械臂的信息等,避免单点失效鲁棒性差,保密性差、时效性差等问题,能够进一步降低多机械臂***的计算量和通讯损耗,提高***的快速收敛性能。
可以理解的,本实施例中,最优控制信号为各个机械臂的输出角速度,在得到该最优控制信号,可以调整径向基神经控制网络的输出参数,以使各个机械臂的实际角速度满足该最优控制信号。
具体的,在一实施例中,所述预滤波器为:
;
其中,为所述最优控制信号,为所述最优控制信号的最高阶导数的阶数,为正常数,且满足:构成赫尔维兹多项式。可以理解的,均为正常数,构成赫尔维兹多项式。
步骤S400、基于所述最优控制信号,构建所述非线性多机械臂***的误差变换方程。
具体而言,最优控制信号也即是跟踪参考信号,在实际控制中,径向基神经控制网络对该信号进行跟踪。但是不可避免的,在跟踪中会产生跟踪误差。由此,本步骤设置了该跟踪参考信号对应的误差变换***,也即是前述的误差变换方程。
具体,在跟踪过程中,误差包括跟踪误差和误差面。在一实施例中,所述跟踪误差变换方程为:
;其中,所述为跟踪误差,所述=;
所述误差面变换方程为:
;其中,为所述误差面。为固定时间子虚拟控制器。
可以理解的,此处建立误差变换***为了方便后续的固定时间控制器设计,即根据李亚普诺夫稳定性理论,以反步法为框架,通过递归法逐步得到最终的固定时间控制器。
步骤S500、基于预设Lyapunov李亚普诺夫函数和所述误差变化方程,采用反步法构建径向基神经控制网络的固定时间控制器。
在本实施例中,预设Lyapunov李亚普诺夫函数包括:
第一预设Lyapunov李亚普诺夫函数:;
第二预设Lyapunov李亚普诺夫函数:。
具体的,步骤S500包括:
步骤S501、基于第一预设Lyapunov李亚普诺夫函数和所述跟踪误差变换方程,生成固定时间子虚拟控制器和对应的第一神经网络更新律。
由此,基于,对跟踪误差变换方程进行求导可以得到所述固定时间子虚拟控制器为:
,其中,
;
相应的第一神经网络更新律为:
;其中,,,,,,均为第i个机械臂的正的设计参数;为理想权重的估计值;
步骤S502、基于第二预设Lyapunov李亚普诺夫函数和所述误差面变换方程,生成固定时间实际控制器和对应的第二神经网络更新律。
基于对误差面变换方程进行求导,可以得到所述固定时间实际控制器为:
,其中,
;
对应的第二神经网络更新律为:
;其中,,,,,,均为第i个机械臂的正的设计参数;为理想权重的估计值。
步骤S600、基于所述固定时间控制器,对所述最优控制信号进行快速跟踪,在跟踪过程中基于所述径向基神经控制网络调整所述非线性多机械臂***中各个机械臂的控制输入力矩值,使非线性多机械臂***达到最优共识。
本步骤中,利用 lyapunov 稳定性理论,在控制过程中进行稳定性分析,保证整个***在固定时间内就能协调控制和稳定工作。
具体的,本实施例中,基于前述构建的固定时间子虚拟控制器、控制率、固定时间实际控制器和控制率,也即是径向基神经控制网络的自适应控制算法,对最优控制信号进行快速跟踪,在跟踪过程中结合每个机械臂的跟踪误差,机械手运动过程中自动调整径向基神经控制网络参数和动力学模型参数,也即是各个机械臂的控制输入力矩值,使非线性多机械臂***达到最优共识,以保证整个***在固定时间内就能协调控制和稳定工作。
作为一个实施例中,值得一提的是,方法还包括:
步骤S700、利用所述径向基神经控制网络对所述未知非线性项逼近,获得所述未知非线性项。
未知非线性项为:
;
;
其中,和均为第i个所述机械臂的所述未知非线性项,所述和均为理想权重,和均为基函数,和均为逼近误差,满足和,和为任意小的正常数,为固定时间子虚拟控制器的导数。
需要说明的是,本实施例中,径向基神经控制网络在线辨识各个机械臂中存在的未知非线性项。因此,步骤S700在方法中的具体执行顺序并不限定,例如,步骤S700可以和步骤S600一起运行,还可以在步骤S500之前进行。本实施例中,基于径向基神经控制网络在线辨识各个机械臂中存在的未知非线性项可以提高非线性多机械臂***的控制精度。
值得一提的是,可通过利用所述径向基神经控制网络对所述未知非线性项逼近,获得所述未知非线性项。
基于上述阐述,可见本实施例中,考虑了带有未知非线性的多机械臂***的分布式优化控制问题,通过预滤波器巧妙地将分布式优化问题转换为一致最优控制问题,且本申请采用固定时间控制器,从而基于固定时间收敛理论方法,提供了一种固定时间分布式优化方法,能够给出较为准确的优化时间估计值的一个上界,该上界与***初始状态无关,由此,本申请实现了***的与初始状态无关的快速收敛。
此外,本实施例中,设计的固定时间子虚拟控制器、控制率、固定时间实际控制器和控制率完全不需要用到任何全局信息,如邻居机械臂的信息等,从而可以避免单点失效鲁棒性差、保密性差,时效性差等问题,能进一步降低多机械臂***的计算量和通讯损耗,提高***的快速收敛性能。
为使得本领域技术人员,更好地理解本申请权利要求的保护范围。以下通过具体的应用场景中的具体实施示例,对本申请权利要求记载的技术方案进行解释说明,可以理解的是,以下示例仅用于解释本申请,而不用于限定本申请权利要求的保护范围。
在一示例中,非线性多机械臂***包括机械臂1、机械臂2、机械臂3和机械臂4。其中,机械臂1、机械臂2、机械臂3和机械臂4均为单机械臂。请参阅图3,该非线性多机械臂***的无向通信拓扑结构。
在非线性多机械臂协同提升工作中,初始对准是非常重要的,它可以通过使各机械臂的连杆角位置以最小的角移动距离平方之和达到一致值来完成。本示例中,将以初始校准为控制目标来实施。
首先,令,。其中,为重力加速度,为第i个机械臂中连杆到重心的距离,表示阻力系数。配置该非线性多机械臂***中的***参数为:,,。
其次,非线性多机械臂***的初始状态可以表示为:
,,,,此时,其余的初始状态均设置为0。
然后,非线性多机械臂***的控制参数和设计参数为:,,,,,,,,。
本示例中,根据初始校准这一控制目标设计目标函数为:。
可以理解的,本示例中,i=1,2,3,4。
采用本实施例提供的非线性多机械臂***的分布式优化控制方法对其进行控制。请参阅图,图4-图7是基于固定时间控制的多机械臂***的分布式优化控制仿真效果图。具体的,图4为四个机械臂的转动角度的变化曲线;图5为四个机械臂的转动角速度的变化曲线;图6为径向基神经控制网络的权值范数的变换曲线;图7为四个机械臂的控制输入力矩值的变化曲线。由以上仿真结果可知,在所提出的分布式固定时间优化算法下,所有机械臂***的转动角都能在固定时间内快速收敛到最小最优值,且转动角速度在固定时间内收敛为零的控制目标,保证了整个***的稳定运行。
可见,得益于预滤波器技术和固定时间控制,本发明采用的分布式固定时间优化算法在无向拓扑下是完全分布的,具有更低的计算和通讯成本又能保证***快速精准地达到最优共识,前述示例中的仿真结果进一步表明本申请方法的有效性。
此外,本申请实施例还提出一种计算机存储介质,存储介质上存储有非线性多机械臂***的分布式优化控制方法程序,非线性多机械臂***的分布式优化控制方法程序被处理器执行时实现如上文的非线性多机械臂***的分布式优化控制方法方法的步骤。因此,这里将不再进行赘述。另外,对采用相同方法的有益效果描述,也不再进行赘述。对于本申请所涉及的计算机可读存储介质实施例中未披露的技术细节,请参照本申请方法实施例的描述。确定为示例,程序指令可被部署为在一个计算设备上执行,或者在位于一个地点的多个计算设备上执行,又或者,在分布在多个地点且通过通信网络互连的多个计算设备上执行。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,上述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,上述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存储记忆体(RandomAccessMemory,RAM)等。
另外需说明的是,以上所描述的装置实施例仅仅是示意性的,其中作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。另外,本申请提供的装置实施例附图中,模块之间的连接关系表示它们之间具有通信连接,具体可以实现为一条或多条通信总线或信号线。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,所属领域的技术人员可以清楚地了解到本申请可借助软件加必需的通用硬件的方式来实现,当然也可以通过专用硬件包括专用集成电路、专用CPU、专用存储器、专用元器件等来实现。一般情况下,凡由计算机程序完成的功能都可以很容易地用相应的硬件来实现,而且,用来实现同一功能的具体硬件结构也可以是多种多样的,例如模拟电路、数字电路或专用电路等。但是,对本申请而言更多情况下软件程序实现是更佳的实施方式。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在可读取的存储介质中,如计算机的软盘、U盘、移动硬盘、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,RandomAccessMemory)、磁碟或者光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例的方法。
以上仅为本申请的优选实施例,并非因此限制本申请的专利范围,凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本申请的专利保护范围内。
Claims (10)
1.一种非线性多机械臂***的分布式优化控制方法,其特征在于,所述方法包括:
基于所述非线性多机械臂***的状态空间方程,确定所述非线性多机械臂***的目标控制函数;其中,所述状态空间方程包括未知非线性项;
基于分布式比例积分优化算法,得到所述目标控制函数的全局最优估计值;
将所述全局最优估计值输入至预滤波器进行重构,获得不带任何全局信息的最优控制信号;
基于所述最优控制信号,构建所述非线性多机械臂***的误差变换方程;
基于预设Lyapunov李亚普诺夫函数和所述误差变化方程,采用反步法构建径向基神经控制网络的固定时间控制器;
基于所述固定时间控制器,对所述最优控制信号进行快速跟踪,在跟踪过程中基于所述径向基神经控制网络调整所述非线性多机械臂***中各个机械臂的控制输入力矩值,使所述非线性多机械臂***达到最优共识。
2.根据权利要求1所述的非线性多机械臂***的分布式优化控制方法,其特征在于,所述误差变换方程包括跟踪误差变换方程和误差面变换方程,所述固定时间控制器包括固定时间子虚拟控制器和固定时间实际控制器;
所述基于预设Lyapunov李亚普诺夫函数和所述误差变化方程,采用反步法构建径向基神经控制网络的固定时间控制器,包括:
基于第一预设Lyapunov李亚普诺夫函数和所述跟踪误差变换方程,生成固定时间子虚拟控制器和对应的第一神经网络更新律;
基于第二预设Lyapunov李亚普诺夫函数和所述误差面变换方程,生成固定时间实际控制器和对应的第二神经网络更新律。
3.根据权利要求1所述的非线性多机械臂***的分布式优化控制方法,其特征在于,所述基于所述非线性多机械臂***的状态空间方程,确定所述非线性多机械臂***的目标控制函数,包括:
构建所述非线性多机械臂***中第i个机械臂的动力学方程;其中,所述动力学方程为:;
将所述动力学方程转换为所述状态空间方程;其中,所述状态空间方程为:
;
基于所述状态空间方程,确定所述非线性多机械臂***的目标控制函数;其中,所述目标控制函数为:
;
定义全局目标函数且R为实数域,则所述目标控制函数化简为:
;
所述目标控制函数转换为寻找最优的使得每个机械臂都满足;
其中,为所述第i个机械臂中机械手关节的角位置,为所述第i个机械臂中机械手关节的角速度,为所述第i个机械臂中机械手关节的角加速度,为所述第i个机械臂的对称正定转动惯量,为所述第i个机械臂向心力,为所述第i个机械臂的重力力矩,为所述第i个机械臂的控制输入力矩,,,为输出状态,,为所述第i个机械臂的局部目标函数,N为非线性多机械臂***中机械臂的总数。
4.根据权利要求3所述的非线性多机械臂***的分布式优化控制方法,其特征在于,所述基于分布式比例积分优化算法,得到所述目标控制函数的全局最优估计值,包括:
根据所述非线性多机械臂***中各个机械臂之间的通讯关系,生成所述非线性多机械臂***的通讯拓扑结构;其中,所述通讯拓扑结构表示为;为顶点集,表示为;为边集,表示为;为邻接矩阵,表示为;
在所述通讯拓扑结构中,N个机械臂中的第i个机械臂能够接受到第k个机械臂的信息时,表示为,第i个机械臂的邻居集表示为;其中,若,则相应的>0,若不成立,则=0;根据的具体取值,得到,若,则所述通讯拓扑结构为无向拓扑;
基于分布式比例积分优化算法和所述通讯拓扑结构,构建所述非线性多机械臂***的虚拟***模型;
基于所述虚拟***模型,得到所述目标控制函数的全局最优估计值;
其中,所述虚拟***模型为:
;
;
其中,和均为控制参数,为所述全局最优估计值,为所述虚拟***的状态。
5.根据权利要求4所述的非线性多机械臂***的分布式优化控制方法,其特征在于,所述预滤波器为:
;
其中,为所述最优控制信号,为所述最优控制信号的最高阶导数的阶数,为正常数,且满足:构成赫尔维兹多项式。
6.根据权利要求4所述的非线性多机械臂***的分布式优化控制方法,其特征在于,所述跟踪误差变换方程为:;其中,所述为跟踪误差,所述=;
所述误差面变换方程为:;其中,为所述误差面,为固定时间子虚拟控制器。
7.根据权利要求6所述的非线性多机械臂***的分布式优化控制方法,其特征在于,所述方法还包括:
利用所述径向基神经控制网络对所述未知非线性项逼近,获得所述未知非线性项;所述未知非线性项为:
;
;
其中,和均为第i个所述机械臂的所述未知非线性项,所述和均为理想权重,和均为基函数,和均为逼近误差,满足和,和为任意小的正常数,为固定时间子虚拟控制器的导数。
8.根据权利要求6所述的非线性多机械臂***的分布式优化控制方法,其特征在于,
所述第一预设Lyapunov李亚普诺夫函数为:
所述固定时间子虚拟控制器为:
,其中,
;
第一神经网络更新律为:
;其中,,,,,,均为第i个机械臂的设计参数;为理想权重的估计值;
所述第二预设Lyapunov李亚普诺夫函数为:;
所述固定时间实际控制器为:
,其中,
;
第二神经网络更新律为:
;其中,,,,,,均为第i个机械臂的设计参数;为理想权重的估计值。
9.一种非线性多机械臂***的分布式优化控制设备,其特征在于,包括:处理器,存储器以及存储在所述存储器中的非线性多机械臂***的分布式优化控制程序,所述非线性多机械臂***的分布式优化控制程序被所述处理器运行时实现如权利要求1-8中任一项所述非线性多机械臂***的分布式优化控制方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有非线性多机械臂***的分布式优化控制程序,所述非线性多机械臂***的分布式优化控制程序被处理器执行时实现如权利要求1至8任一项所述的非线性多机械臂***的分布式优化控制方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310049147.9A CN116038709A (zh) | 2023-02-01 | 2023-02-01 | 非线性多机械臂***的分布式优化控制方法、设备及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310049147.9A CN116038709A (zh) | 2023-02-01 | 2023-02-01 | 非线性多机械臂***的分布式优化控制方法、设备及介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116038709A true CN116038709A (zh) | 2023-05-02 |
Family
ID=86113009
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310049147.9A Pending CN116038709A (zh) | 2023-02-01 | 2023-02-01 | 非线性多机械臂***的分布式优化控制方法、设备及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116038709A (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090204259A1 (en) * | 2007-08-07 | 2009-08-13 | George Danko | Control method and system for hydraulic machines employing a dynamic joint motion model |
CN109465825A (zh) * | 2018-11-09 | 2019-03-15 | 广东工业大学 | 机械臂柔性关节的rbf神经网络自适应动态面控制方法 |
CN109514564A (zh) * | 2019-01-22 | 2019-03-26 | 江西理工大学 | 一种复合二次型多关节机械臂最优控制方法 |
CN110275436A (zh) * | 2019-05-31 | 2019-09-24 | 广东工业大学 | 一种多单臂机械手的rbf神经网络自适应控制方法 |
CN110977988A (zh) * | 2019-12-27 | 2020-04-10 | 青岛大学 | 基于有限时间命令滤波的多关节机械臂阻抗控制方法 |
-
2023
- 2023-02-01 CN CN202310049147.9A patent/CN116038709A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090204259A1 (en) * | 2007-08-07 | 2009-08-13 | George Danko | Control method and system for hydraulic machines employing a dynamic joint motion model |
CN109465825A (zh) * | 2018-11-09 | 2019-03-15 | 广东工业大学 | 机械臂柔性关节的rbf神经网络自适应动态面控制方法 |
CN109514564A (zh) * | 2019-01-22 | 2019-03-26 | 江西理工大学 | 一种复合二次型多关节机械臂最优控制方法 |
CN110275436A (zh) * | 2019-05-31 | 2019-09-24 | 广东工业大学 | 一种多单臂机械手的rbf神经网络自适应控制方法 |
CN110977988A (zh) * | 2019-12-27 | 2020-04-10 | 青岛大学 | 基于有限时间命令滤波的多关节机械臂阻抗控制方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11845186B2 (en) | Inverse kinematics solving method for redundant robot and redundant robot and computer readable storage medium using the same | |
Yun et al. | Self-adjusting force/bit blending control based on quantitative factor-scale factor fuzzy-PID bit control | |
Khan et al. | Tracking control of redundant mobile manipulator: An RNN based metaheuristic approach | |
Zhang et al. | RNN for perturbed manipulability optimization of manipulators based on a distributed scheme: A game-theoretic perspective | |
Guo et al. | Li-function activated ZNN with finite-time convergence applied to redundant-manipulator kinematic control via time-varying Jacobian matrix pseudoinversion | |
Juang et al. | Wall-following control of a hexapod robot using a data-driven fuzzy controller learned through differential evolution | |
TW202032437A (zh) | 物體位姿估計方法及裝置、電腦可讀儲存介質 | |
CN110682286B (zh) | 一种协作机器人实时避障方法 | |
Gao et al. | Hybrid Optimal Kinematic Parameter Identification for an Industrial Robot Based on BPNN‐PSO | |
WO2007127723A2 (en) | Control of robots from human motion descriptors | |
CN114237041B (zh) | 一种基于预设性能的空-地协同固定时间容错控制方法 | |
Zhang et al. | A 6-DOF robot-time optimal trajectory planning based on an improved genetic algorithm | |
KR102578263B1 (ko) | 샘플링 데이터에 기반한 농업용 멀티 에이전트 시스템 일관성 분산 제어 방법 | |
Li et al. | Using quadratic interpolated beetle antennae search to enhance robot arm calibration accuracy | |
Ma et al. | A novel APSO-aided weighted LSSVM method for nonlinear hammerstein system identification | |
Nguyen-Tuong et al. | Online kernel-based learning for task-space tracking robot control | |
Liang et al. | Data-driven bipartite formation for a class of nonlinear MIMO multiagent systems | |
Guo et al. | A modified Q-learning algorithm for robot path planning in a digital twin assembly system | |
Zheng et al. | Adaptive memetic differential evolution-back propagation-fuzzy neural network algorithm for robot control | |
Xu et al. | The design of a neural network-based adaptive control method for robotic arm trajectory tracking | |
Perng et al. | FOPID controller optimization based on SIWPSO-RBFNN algorithm for fractional-order time delay systems | |
Hwang et al. | A fuzzy CMAC learning approach to image based visual servoing system | |
Dib et al. | Comparative Study of Optimal Tuning PID Controller for Manipulator Robot | |
Etemadi et al. | Leader connectivity management and flocking velocity optimization using the particle swarm optimization method | |
Vatankhah et al. | Active leading through obstacles using ant-colony algorithm |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |