CN114637301A - 基于最优仿射队形变换的多机器人动态避障装置及方法 - Google Patents

基于最优仿射队形变换的多机器人动态避障装置及方法 Download PDF

Info

Publication number
CN114637301A
CN114637301A CN202210291561.6A CN202210291561A CN114637301A CN 114637301 A CN114637301 A CN 114637301A CN 202210291561 A CN202210291561 A CN 202210291561A CN 114637301 A CN114637301 A CN 114637301A
Authority
CN
China
Prior art keywords
robot
formation
gradient
obstacle avoidance
estimator
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202210291561.6A
Other languages
English (en)
Other versions
CN114637301B (zh
Inventor
方浩
吴楚
曾宪琳
杨庆凯
陈杰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Institute of Technology BIT
Original Assignee
Beijing Institute of Technology BIT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Institute of Technology BIT filed Critical Beijing Institute of Technology BIT
Priority to CN202210291561.6A priority Critical patent/CN114637301B/zh
Publication of CN114637301A publication Critical patent/CN114637301A/zh
Application granted granted Critical
Publication of CN114637301B publication Critical patent/CN114637301B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05DSYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
    • G05D1/00Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots
    • G05D1/02Control of position or course in two dimensions
    • G05D1/021Control of position or course in two dimensions specially adapted to land vehicles
    • G05D1/0276Control of position or course in two dimensions specially adapted to land vehicles using signals provided by a source external to the vehicle
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/02Total factory control, e.g. smart factories, flexible manufacturing systems [FMS] or integrated manufacturing systems [IMS]

Landscapes

  • Engineering & Computer Science (AREA)
  • Aviation & Aerospace Engineering (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Remote Sensing (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Automation & Control Theory (AREA)
  • Feedback Control In General (AREA)
  • Manipulator (AREA)
  • Control Of Position, Course, Altitude, Or Attitude Of Moving Bodies (AREA)

Abstract

本发明提供一种基于最优仿射队形变换的多机器人动态避障装置,包括梯度跟踪模块,所述梯度跟踪模块包括梯度跟踪变量更新子模块和前馈反馈控制模块;所述梯度跟踪变量更新子模块,用于根据预设的更新律计算所述梯度跟踪变量yi,使得对于所有时间t≥t0,梯度跟踪变量和局部代价函数梯度关于构型矩阵列向量的加权和始终相等,t0表示固定时间;所述前馈反馈控制模块,基于以固定时间速度估计器输出作为前馈,仿射队形约束误差以及梯度跟踪变量作为反馈设计的控制模型,计算所述控制输入,基于所述控制输入对机器人编队进行控制。基于该装置可以保证机器人队形能够快速无误差地收敛于时变最优解轨迹。

Description

基于最优仿射队形变换的多机器人动态避障装置及方法
技术领域
本发明属于多智能体控制技术领域,具体涉及一种基于最优仿射队形变换的多机器人动态避障装置及方法。
背景技术
随着国内外科技的快速发展和人类需求的日益提高,传统工作领域已经逐渐被无人车、无人机等为代表的机器人所代替。由于单个机器人在信息的获取、处理、控制等方面都存在较大的局限性,在鸟群、鱼群等自然现象的启发下,人们开始广泛研究多机器人的分布式编队控制问题。通过通信网络的连接和控制器的结构分解,各个机器人之间可以利用局部的信息交互和较小的运算负担,自组织的实现协同控制,从而有效提高工作效率和鲁棒性,增大工作范围和灵活性。
传统的多机器人分布式编队控制技术通常为基于相对位置的一致性编队控制,仅有少量领导者机器人可以获得期望队形的参考信息,而其他多机器人需要测量与邻近机器人的相对位置,通过通信和交互,最终准确的对期望队形达成一致,从而实现目标编队。但是,该方法需要事先设定每一个机器人的期望队形信息,因此只能实现固定的目标队形,无法通过队形变换以避开工作环境中的障碍物。
为了通过队形变换实现避障,文献(Mohammad Deghat,Brian DO Anderson,Zhiyun Lin.Combined flocking and distance-based shape control of multi-agentformations[J].IEEE Transactions on Automatic Control,2016,61(7):1824-1837.)利用机器人之间的相对距离表示期望的队形,通过引入刚性图理论保证队形的唯一性,进而控制机器人之间达到期望的相对距离来实现编队。该方法能够实现队形的平移和旋转变换,但是无法实现放缩等变换。文献(Shiyu Zhao,Daniel Zelazo.Bearing rigidity andalmost global bearing-only formation stabilization[J].IEEE Transactions onAutomatic Control,2016,61(5):1255-1268.)利用机器人之间的相对角度表示期望的队形,利用角度刚性条件和两个领导者机器人之间的距离变化,实现多种不同的队形。该方法仅能实现队形的平移和放缩,无法实现旋转等变换。文献(Shiyu Zhao.Affine formationmaneuver control of multi-agent systems[J],IEEE Transactions on AutomaticControl,2018,63(12):4140-4155.)提出带有可正可负权重的广义拉普拉斯矩阵实现基于角度的编队控制,并证明该方法能够实现所有的仿射队形变换,如平移、放缩和旋转等,但是需要3个以上领导者机器人获得期望队形位置,以实现唯一的队形变换轨迹。以上队形变换方法都基于领导者机器人的相对位置实现,要求领导者机器人事先获得给定的期望队形变换轨迹。而对于动态且未知的障碍环境,每个机器人只能对障碍物进行局部观测,往往无法获得障碍物的全局信息,期望队形变换轨迹无法事先给定。
为了考虑动态且未知的障碍环境,文献(Yi X,Li X,Xie L,et al.Distributedonline convex optimization with time-varying coupled inequality constraints[J].IEEE Transactions on Signal Processing,2020,68:731–746)将优化指标建立为时变代价函数,利用原始对偶镜像下降算法在线求解时变优化问题得到队形变换轨迹,但所得轨迹与优化问题的解之间存在稳态误差。为了消除稳态误差,文献(Sun C,Ye M,HuG.Distributed time-varying quadratic optimization for multiple agents underundirected graphs[J].IEEE Transactions on Automatic Control,2017,62(7):3687–3694)提出基于光滑罚函数的鲁棒梯度下降算法,但这类算法对代价函数的类型有一定要求,只适用于二次型函数或者具有相同Hessian矩阵的强凸函数,且无法处理时变安全约束。
因此,如何利用每个机器人自身对障碍物的局部观测信息以及仿射队形变换需求,合理设计具有时变代价函数和时变安全约束的优化问题,并提出分布式时变优化算法在线调整和实现期望队形变换以完成动态避障,是亟待解决的问题。
发明内容
有鉴于此,本发明提供了一种基于最优仿射队形变换的多机器人动态避障装置及方法。
实现本发明的技术方案如下:
一方面,本发明一种基于最优仿射队形变换的多机器人动态避障装置,包括梯度跟踪模块,所述梯度跟踪模块包括梯度跟踪变量更新子模块和前馈反馈控制模块;
所述梯度跟踪变量更新子模块,用于根据预设的更新律计算所述梯度跟踪变量yi,使得对于所有时间t≥t0,梯度跟踪变量和局部代价函数梯度关于构型矩阵列向量的加权和始终相等,t0表示固定时间;
所述前馈反馈控制模块,基于以固定时间速度估计器输出作为前馈,仿射队形约束误差以及梯度跟踪变量作为反馈设计的控制模型,计算所述控制输入,基于所述控制输入对机器人编队进行控制。
进一步地,本发明所述控制模型为:
Figure BDA0003560526500000031
其中,zii表示估计器针对第i个机器人的输出,
Figure BDA0003560526500000032
表示仿射队形约束误差,ωij为相邻机器人i,j之间的应力权重,xi,xj为机器人i,j的位置,
Figure BDA0003560526500000033
是第i个机器人的邻居集,α表示控制增益。
进一步地,本发明所述更新律为:
Figure BDA0003560526500000034
其中,fi(xi,t)第i个机器人的局部时变代价函数,
Figure BDA0003560526500000041
表示fi(xi,t)对于xi的导数,
Figure BDA0003560526500000042
为第i个机器人的位置的导数。
进一步地,本发明所述仿射队形约束为:
Figure BDA0003560526500000043
其中,Ω为应力矩阵,根据每一对邻居机器人(i,j)分配一个标量的应力权重ωij确定,具体如下:
Figure BDA0003560526500000044
其中,Id为d维单位矩阵,x为所有机器人的位置坐标。
进一步地,本发明所述第i个机器人的局部时变代价函数fi(xi,t)为:第i个机器人对数屏障函数和轨迹误差函数的加权和。
进一步地,本发明所述轨迹误差函数的建立过程为:针对第i个机器人,给定的期望运动轨迹为
Figure BDA0003560526500000045
其中t为时间,基于当前位置坐标xi构建轨迹误差函数。
进一步地,本发明所述屏障函数的建立过程为:基于机器人自身传感器测得的障碍物位置,计算与每一个障碍物相切且与机器人和障碍物的连线垂直的分割超平面,将所有超平面在机器人一侧区域的交集表示为一组时变的线性不等式约束,并基于该约束建立对数屏障函数。
进一步地,本发明针对第i个机器人,设计估计器状态Hi和ζi,分别用来估计全局时变代价函数的梯度
Figure BDA0003560526500000046
对x和t的导数,即
Figure BDA0003560526500000047
Figure BDA0003560526500000048
所述固定时间估计器的设计分为两个部分:
第一部分为估计器状态更新律,以每一个机器人可获得的局部时变代价函数对应的
Figure BDA0003560526500000049
Figure BDA00035605265000000410
作为参考信息,利用非连续一致性跟踪算法更新每一个机器人关于其他所有机器人的估计器状态,使得
Figure BDA00035605265000000411
第二部分为估计器输出,设计估计器输出为zi=-P(PTHiP)-1PTζi,其中P为机器人的构型矩阵。
进一步地,本发明所述构型矩阵P和应力矩阵Ω满足如下条件:
(a)应力矩阵半正定且秩为n-d-1。
(b)ΩP=PΩ=0。
(c)矩阵Ω的零空间和构型矩阵P的列空间相等。
另一方面,本发明一种基于最优仿射队形变换的多机器人动态避障方法,具体过程为:
根据预设的更新律计算所述梯度跟踪变量yi,使得对于所有时间t≥t0,梯度跟踪变量和局部代价函数梯度关于构型矩阵列向量的加权和始终相等,t0表示固定时间;
基于以固定时间速度估计器输出作为前馈,仿射队形约束误差以及梯度跟踪变量作为反馈设计的控制模型,计算所述控制输入,基于所述控制输入对机器人编队进行控制。
有益效果:
本发明基于梯度跟踪变量更新,构建基于以固定时间速度估计器输出作为前馈,仿射队形约束误差以及梯度跟踪变量作为反馈设计的控制模型,通过上述控制模型对机器人编队进行控制,可以保证机器人队形能够快速无误差地收敛于时变最优解轨迹。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
图1为本发明实施例中多机器人编队***以及工作场景示意图;
图2为本发明实施例中多机器人队形框架示意图;
图3(a)为本发明实施例中第20s时多机器人队形变换避障示意图;
图3(b)为本发明实施例中第80s时多机器人队形变换避障示意图;
图3(c)为本发明实施例中第120s时多机器人队形变换避障示意图;
图3(d)为本发明实施例中第140s时多机器人队形变换避障示意图;
图4为本发明实施例中多机器人固定时间估计器状态误差示意图;
图5为本发明实施例中多机器人最优队形条件和代价函数误差示意图;
图6为本发明实施例中多机器人最优解轨迹跟踪误差示意图。
具体实施方式
下面结合附图和实施例对本发明做进一步说明:
需说明的是,在不冲突的情况下,以下实施例及实施例中的特征可以相互组合;并且,基于本公开中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本公开保护的范围。
需要说明的是,下文描述在所附权利要求书的范围内的实施例的各种方面。应显而易见,本文中所描述的方面可体现于广泛多种形式中,且本文中所描述的任何特定结构及/或功能仅为说明性的。基于本公开,所属领域的技术人员应了解,本文中所描述的一个方面可与任何其它方面独立地实施,且可以各种方式组合这些方面中的两者或两者以上。举例来说,可使用本文中所阐述的任何数目个方面来实施设备及/或实践方法。另外,可使用除了本文中所阐述的方面中的一或多者之外的其它结构及/或功能性实施此设备及/或实践此方法。
本发明实施例提供了一种基于最优仿射队形变换的多机器人动态避障装置,包括梯度跟踪模块,所述梯度跟踪模块包括梯度跟踪变量更新子模块和前馈反馈控制模块;
梯度跟踪变量更新子模块,用于根据预设的更新律计算所述梯度跟踪变量yi;使得对于所有时间t≥t0,梯度跟踪变量和局部代价函数梯度关于构型矩阵列向量的加权和始终相等;
所述前馈反馈控制模块,基于以固定时间速度估计器输出z作为前馈,仿射队形约束误差以及梯度跟踪变量y作为反馈设计的控制模型,根据所述控制模型计算所述控制输入,基于所述控制输入对机器人编队进行控制。
基于最优仿射队形变换的多机器人动态避障方法,包括以下步骤:
步骤1:机器人的动力学和队形框架建模。
机器人动力学采用单积分器模型建模,通过一阶微分方程描述节点的运动状态。机器人队形框架建模为一个二元组
Figure BDA0003560526500000071
其中
Figure BDA0003560526500000072
为无向的通信拓扑图,即邻居机器人之间可以双向通信,而
Figure BDA0003560526500000073
为队形构型,di为第i个机器人关于队形中心的相对位置,对应的构型矩阵
Figure BDA0003560526500000074
步骤2:分配应力权重,设计应力矩阵和仿射队形约束。
基于队形框架
Figure BDA0003560526500000075
为无向图
Figure BDA0003560526500000076
中的每一对邻居机器人(i,j)分配一个标量的应力权重ωij,使得ωij=ωji,同时保证
Figure BDA0003560526500000077
其中
Figure BDA0003560526500000078
是第i个机器人的邻居集。应力矩阵设计为
Figure BDA0003560526500000079
其中ωij可以为正数、负数或者0。仿射队形约束设计为
Figure BDA00035605265000000710
其中
Figure BDA00035605265000000711
为所有机器人的位置坐标,d为空间维度,Id为d维单位矩阵。
步骤3:设计轨迹误差函数和对数屏障函数,构建仿射队形约束下的时变优化问题。
针对第i个机器人,给定的期望运动轨迹为
Figure BDA00035605265000000712
其中t为时间,基于当前位置坐标xi构建轨迹误差函数。基于机器人自身传感器测得的障碍物位置,计算与每一个障碍物相切且与机器人和障碍物的连线垂直的分割超平面,将所有超平面在机器人一侧区域的交集表示为一组时变的线性不等式约束,并基于该约束建立对数屏障函数。最终构建的时变优化问题中,第i个机器人的局部时变代价函数fi(xi,t)为该机器人对数屏障函数和轨迹误差函数的加权和,全局时变代价函数f(x,t)为所有机器人的局部代价函数之和,约束条件为步骤2中设计的仿射队形约束。
步骤四:设计固定时间速度估计器,预测优化问题解轨迹对时间的导数,即估计期望运动轨迹的导数。
针对第i个机器人,设计估计器状态Hi和ζi,分别用来估计全局时变代价函数的梯度
Figure BDA0003560526500000081
对x和t的导数,即
Figure BDA0003560526500000082
Figure BDA0003560526500000083
固定时间估计器的设计分为两个部分。第一部分为估计器状态更新律,以每一个机器人可获得的局部时变代价函数对应的
Figure BDA0003560526500000084
Figure BDA0003560526500000085
作为参考信息,利用非连续一致性跟踪算法更新每一个机器人关于其他所有机器人的估计器状态,使得
Figure BDA0003560526500000086
其中t0是一个固定时刻。第二部分为估计器输出,设计估计器输出为zi=-P(PTHiP)-1PTζi,其中P为步骤1中定义的构型矩阵。
步骤五:设计基于速度估计器的梯度跟踪算法,以分布式的方式求解时变优化问题,实现最小化时变代价函数且满足应力矩阵约束的目标队形变换。
针对第i个机器人,设计梯度跟踪变量yi,令
Figure BDA0003560526500000087
其中t0为步骤4中定义的固定时刻。基于速度估计器的梯度跟踪算法的设计分为两个部分。第一部分为梯度跟踪变量更新律,使得对于所有时间t≥t0,梯度跟踪变量和局部代价函数梯度关于构型矩阵列向量的加权和始终相等。第二部分为前馈反馈控制律,将步骤4中的估计器输出z作为前馈,仿射队形约束误差
Figure BDA0003560526500000088
以及梯度跟踪变量y作为反馈,使得仿射队形约束误差以及局部代价函数梯度加权和同时收敛于0,进而保证
Figure BDA0003560526500000089
其中
Figure BDA00035605265000000810
Figure BDA00035605265000000811
是步骤3中时变优化问题的解轨迹,t为时间。
本实施例针对时变优化问题中的时变最优解轨迹,采用固定时间估计器预测解轨迹速度,并引入估计器输出作为前馈,设计梯度跟踪变量补偿局部代价函数梯度加权和带来的误差,再利用仿射队形约束误差和梯度跟踪变量进行反馈控制,保证机器人队形能够快速无误差地收敛于时变最优解轨迹。
本实施例通过求解分布式时变优化问题,可针对环境中的动态且未知的障碍约束,利用每一个机器人的局部观测信息,在线调整期望队形,通过最优的仿射队形变换实现避障,无需事先给定领导者机器人和期望队形变换轨迹。
本实施例中每一个机器人仅利用自身位置信息,以及与邻居机器人的通信交互,即可实现整体队形的实时变换,不需要进行全局信息交互,减少了***通讯和计算负担,相对集中式控制具有更强的抗毁性与鲁棒性。
在本实施例中,步骤二中所述的应力矩阵和步骤一中所述的构型矩阵满足如下条件:
(d)应力矩阵半正定且秩为n-d-1。
(e)ΩP=PΩ=0。
(f)矩阵Ω的零空间和构型矩阵P的列空间相等。
在本实施例中,步骤三中所述的仿射队形约束下的时变优化问题,满足如下条件:
(a)每个机器人的局部时变代价函数由对数屏障函数和轨迹误差函数的加权和构成,其中轨迹误差函数为强凸函数但不一定为二次型函数。此外,对数屏障函数和轨迹误差函数两者的Hessian矩阵对于不同的机器人可以互不相同。
(b)每个机器人给定的期望运动轨迹以及局部观测到的障碍物都是动态时变的,且全局代价函数是所有局部代价函数之和,因此全局时变代价函数是所有机器人状态的时变函数,相应的优化问题的解轨迹是一个关于所有机器人位置信息的耦合项,无法被单个机器人获得,难以分布式求解。
本申请又一实施例,组建了包含6个机器人的编队控制***,以及包含多个静态和动态障碍物的工作场景,如图1所示,其中长方形代表机器人编队,圆形代表静态障碍物和动态障碍物,点划线代表机器人计算的时变安全区域。
本实施例构建机器人编队的控制律的推导过程:利用应力矩阵和刚性编队理论,在具有时变代价函数和时变安全约束的优化问题中引入仿射队形约束,将该优化问题的解轨迹构建为给定队形构型的一个时变仿射队形变换轨迹。为了处理代价函数和安全约束中的时变项,该方法设计了固定时间速度估计器,以在线预测最优仿射队形速度,从而消除时变项带来的稳态跟踪误差。为了分布式求解时变优化问题,该方法设计基于加权梯度跟踪的时变仿射队形优化算法,利用队形速度和加权梯度估计值分别作为控制前馈和反馈,保证***动力学的平衡点满足时变优化问题的最优性条件,实现多机器人队形收敛于时变优化问题的最优解轨迹。上述过程的具体实现过程如下:
步骤一:机器人的动力学和队形框架建模;
设机器人的个数n=6,则第i个机器人的单积分器动力学模型为
Figure BDA0003560526500000101
其中,
Figure BDA0003560526500000102
是第i个机器人的位置,
Figure BDA0003560526500000103
是第i个机器人的控制输入,d是空间维度。
机器人队形框架建模为一个二元组
Figure BDA0003560526500000104
如图2所示,其中
Figure BDA0003560526500000105
为无向的通信拓扑图,
Figure BDA0003560526500000106
为队形构型,对应的构型矩阵
Figure BDA0003560526500000107
Figure BDA0003560526500000108
本实例中采用6个机器人的构型矩阵具体可以为:
Figure BDA0003560526500000109
机器人之间的双向通信关系如图2中的连线所示,机器人相对于队形中心的位置如图2中的节点所示。
步骤二:分配应力权重,设计应力矩阵和仿射队形约束。
基于队形框架
Figure BDA0003560526500000111
为无向图
Figure BDA0003560526500000112
中的每一对邻居机器人(i,j)分配一个标量的应力权重
Figure BDA0003560526500000113
如图2中的连线上标注的数值所示,使得ωij=ωji,同时保证
Figure BDA0003560526500000114
其中
Figure BDA0003560526500000115
是第i个机器人的邻居集。
基于应力权重设计的应力矩阵为:
Figure BDA0003560526500000116
具体为
Figure BDA0003560526500000117
仿射队形约束设计为
Figure BDA0003560526500000118
其中
Figure BDA0003560526500000119
为所有机器人的位置坐标,d为空间维度,Id为d维单位矩阵,基于上述仿射队形约束设计,可以使机器人编队控制在所需的队形内。
步骤三:设计轨迹误差函数和时变安全约束,构建仿射队形约束下的时变优化问题。
针对第i个机器人,给定的期望运动轨迹为
Figure BDA00035605265000001110
其中,t为时间,d为空间维度。基于第i个机器人当前位置坐标xi构建轨迹误差函数如下
Figure BDA00035605265000001111
其中,ci是常数。
定义第i个机器人自身传感器测得的障碍物位置
Figure BDA00035605265000001112
其中,si是第i个机器人测得的障碍物个数。计算第i个机器人与障碍物相切且与机器人和障碍物的连线垂直的分割超平面,将所有超平面在机器人一侧区域的交集表示为一组线性不等式如下
Figure BDA0003560526500000121
即为时变安全约束,基于该时变安全约束可以避免机器人与障碍物之间发生碰撞。
二维空间aik和bik的计算方法为
Figure BDA0003560526500000122
其中,x*,1和x*,2分别为位置x*(包括xi
Figure BDA0003560526500000123
)的第1和2个分量,即位置x*的横坐标和纵坐标。
基于时变安全约束建立对数屏障函数
Figure BDA0003560526500000124
最终构建的时变优化问题中,第i个机器人的局部时变代价函数fi(xi,t)为该机器人对数屏障函数和轨迹误差函数的加权和,即
fi(xi,t)=wihi(xi,t)+(1-wi)gi(xi,t),
其中,0<wi<1。
令全局时变代价函数f(x,t)为所有机器人的局部代价函数之和,约束条件为步骤2中设计的仿射队形约束,所得仿射队形约束下的时变优化问题为:
Figure BDA0003560526500000125
Figure BDA0003560526500000126
步骤四:设计固定时间速度估计器,预测优化问题解轨迹对时间的导数。
针对第i个机器人,设计估计器状态
Figure BDA0003560526500000127
Figure BDA0003560526500000131
分别用来估计全局时变代价函数的梯度
Figure BDA0003560526500000132
对x和t的导数,即
Figure BDA0003560526500000133
Figure BDA0003560526500000134
固定时间估计器的设计分为两个部分。第一部分为估计器状态更新律,以每一个机器人可获得的局部时变代价函数对应的
Figure BDA0003560526500000135
Figure BDA0003560526500000136
作为参考信息,设计非连续一致性跟踪算法如下
Figure BDA0003560526500000137
Figure BDA0003560526500000138
Figure BDA0003560526500000139
Figure BDA00035605265000001310
其中,β,γ>0,0<μ1<1<μ2为估计器参数,sig(·)α=sgn(·)|·|α为连续的符号函数。利用上述非连续一致性跟踪算法更新每一个机器人关于其他所有机器人的估计器状态,使得
Figure BDA00035605265000001311
其中t0是一个固定时刻。
第二部分为估计器输出
Figure BDA00035605265000001312
设计估计器输出为
zi=-P(PTHiP)-1PTζi,
其中,P为步骤1中定义的构型矩阵。
步骤五:设计基于速度估计器的梯度跟踪算法,以分布式的方式求解时变优化问题,实现最小化时变代价函数且满足应力矩阵约束的目标队形变换。
针对第i个机器人,设计梯度跟踪变量
Figure BDA00035605265000001313
Figure BDA00035605265000001314
其中t0为步骤4中定义的固定时刻。基于速度估计器的梯度跟踪算法的设计分为两个部分。
第一部分为梯度跟踪变量更新律,设计如下
Figure BDA0003560526500000141
该更新律使得对于所有时间t≥t0,梯度跟踪变量和局部代价函数梯度关于构型矩阵列向量的加权和始终相等,即
Figure BDA0003560526500000142
第二部分为前馈反馈控制律,将步骤4中的估计器输出z作为前馈,仿射队形约束误差
Figure BDA0003560526500000143
以及梯度跟踪变量y作为反馈,设计如下
Figure BDA0003560526500000144
其中,zii表示估计器针对第i个机器人的输出(第i个机器人的估计器输出的时变优化问题中第i个机器人解轨迹
Figure BDA0003560526500000145
的导数)。
该控制律使得仿射队形约束误差以及局部代价函数梯度加权和同时收敛于0,进而保证
Figure BDA0003560526500000146
其中
Figure BDA0003560526500000147
是步骤3中时变优化问题的解轨迹,t为时间。
下面给出本实例的软件仿真结果以论证本发明的有效性。
如图3(a)—3(d)所示,这四幅图分别展示的是6个机器人基于最优仿射队形变换的多机器人动态避障方法,在第20s、第80s、第120s和第140s进行队形变换避障的结果。从图中可以发现,对于这6个机器人组成的编队控制***,能够通过分布式时变优化算法在线调整和实现期望队形变换以完成动态避障。
图4为本发明实施例中固定时间估计器状态误差图,图5和图6分别为基于速度估计器的梯度跟踪算法的队形变换控制误差和最优解轨迹跟踪误差图,可以看出图4中估计器状态误差固定时间收敛于0,图5中的最优队形条件和代价函数误差收敛于0,保证了最终形成的仿射队形是时变优化问题的解。图6中的最优解轨迹跟踪误差指数收敛于0,保证多机器人***能够快速实时的实现最优仿射队形,证明了本发明的有效性。
综上,以上仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种基于最优仿射队形变换的多机器人动态避障装置,其特征在于,包括梯度跟踪模块,所述梯度跟踪模块包括梯度跟踪变量更新子模块和前馈反馈控制模块;
所述梯度跟踪变量更新子模块,用于根据预设的更新律计算所述梯度跟踪变量yi,使得对于所有时间t≥t0,梯度跟踪变量和局部代价函数梯度关于构型矩阵列向量的加权和始终相等,t0表示固定时间;
所述前馈反馈控制模块,基于以固定时间速度估计器输出作为前馈,仿射队形约束误差以及梯度跟踪变量作为反馈设计的控制模型,计算所述控制输入,基于所述控制输入对机器人编队进行控制。
2.根据权利要求1所述基于最优仿射队形变换的多机器人动态避障装置,其特征在于,所述控制模型为:
Figure FDA0003560526490000011
其中,zii表示估计器针对第i个机器人的输出,
Figure FDA0003560526490000012
表示仿射队形约束误差,ωij为相邻机器人i,j之间的应力权重,xi,xj为机器人i,j的位置,
Figure FDA0003560526490000013
是第i个机器人的邻居集,α表示控制增益。
3.根据权利要求2所述基于最优仿射队形变换的多机器人动态避障装置,其特征在于,所述更新律为:
Figure FDA0003560526490000014
其中,fi(xi,t)第i个机器人的局部时变代价函数,
Figure FDA0003560526490000015
表示fi(xi,t)对于xi的导数,
Figure FDA0003560526490000016
为第i个机器人的位置的导数。
4.根据权利要求1所述基于最优仿射队形变换的多机器人动态避障装置,其特征在于,所述仿射队形约束为:
Figure FDA0003560526490000017
其中,Ω为应力矩阵,根据每一对邻居机器人(i,j)分配一个标量的应力权重ωij确定,具体如下:
Figure FDA0003560526490000021
其中,Id为d维单位矩阵,x为所有机器人的位置坐标。
5.根据权利要求3所述基于最优仿射队形变换的多机器人动态避障装置,其特征在于,所述第i个机器人的局部时变代价函数fi(xi,t)为:第i个机器人对数屏障函数和轨迹误差函数的加权和。
6.根据权利要求5所述基于最优仿射队形变换的多机器人动态避障装置,其特征在于,所述轨迹误差函数的建立过程为:针对第i个机器人,给定的期望运动轨迹为
Figure FDA0003560526490000022
其中t为时间,基于当前位置坐标xi构建轨迹误差函数。
7.根据权利要求5所述基于最优仿射队形变换的多机器人动态避障装置,其特征在于,所述屏障函数的建立过程为:基于机器人自身传感器测得的障碍物位置,计算与每一个障碍物相切且与机器人和障碍物的连线垂直的分割超平面,将所有超平面在机器人一侧区域的交集表示为一组时变的线性不等式约束,并基于该约束建立对数屏障函数。
8.根据权利要求3所述基于最优仿射队形变换的多机器人动态避障装置,其特征在于,针对第i个机器人,设计估计器状态Hi和ζi,分别用来估计全局时变代价函数的梯度
Figure FDA0003560526490000023
对x和t的导数,即
Figure FDA0003560526490000024
Figure FDA0003560526490000025
所述固定时间估计器的设计分为两个部分:
第一部分为估计器状态更新律,以每一个机器人可获得的局部时变代价函数对应的
Figure FDA0003560526490000026
Figure FDA0003560526490000027
作为参考信息,利用非连续一致性跟踪算法更新每一个机器人关于其他所有机器人的估计器状态,使得
Figure FDA0003560526490000028
第二部分为估计器输出,设计估计器输出为zi=-PT(PTHiP)-1PTζi,其中P为机器人的构型矩阵。
9.根据权利要求3所述基于最优仿射队形变换的多机器人动态避障装置,其特征在于,所述构型矩阵P和应力矩阵Ω满足如下条件:
(a)应力矩阵半正定且秩为n-d-1。
(b)ΩP=PΩ=0。
(c)矩阵Ω的零空间和构型矩阵P的列空间相等。
10.一种基于最优仿射队形变换的多机器人动态避障方法,其特征在于,具体过程为:
根据预设的更新律计算所述梯度跟踪变量yi,使得对于所有时间t≥t0,梯度跟踪变量和局部代价函数梯度关于构型矩阵列向量的加权和始终相等,t0表示固定时间;
基于以固定时间速度估计器输出作为前馈,仿射队形约束误差以及梯度跟踪变量作为反馈设计的控制模型,计算所述控制输入,基于所述控制输入对机器人编队进行控制。
CN202210291561.6A 2022-03-23 2022-03-23 基于最优仿射队形变换的多机器人动态避障装置及方法 Active CN114637301B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210291561.6A CN114637301B (zh) 2022-03-23 2022-03-23 基于最优仿射队形变换的多机器人动态避障装置及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210291561.6A CN114637301B (zh) 2022-03-23 2022-03-23 基于最优仿射队形变换的多机器人动态避障装置及方法

Publications (2)

Publication Number Publication Date
CN114637301A true CN114637301A (zh) 2022-06-17
CN114637301B CN114637301B (zh) 2023-04-11

Family

ID=81950351

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210291561.6A Active CN114637301B (zh) 2022-03-23 2022-03-23 基于最优仿射队形变换的多机器人动态避障装置及方法

Country Status (1)

Country Link
CN (1) CN114637301B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115759270A (zh) * 2022-10-24 2023-03-07 华东师范大学 一种基于量子线路的高效模拟方法

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102096415A (zh) * 2010-12-31 2011-06-15 重庆邮电大学 基于Ad-Hoc网络和leader-follower算法的多机器人编队方法
US20110317922A1 (en) * 2008-07-29 2011-12-29 Superfish Ltd. Increasing interest point coverage in an image
CN104076688A (zh) * 2014-07-17 2014-10-01 山东省科学院海洋仪器仪表研究所 一种自主式水下航行器主从式协同控制方法
CN105700527A (zh) * 2016-01-26 2016-06-22 哈尔滨工业大学 一种平面冗余度机器人避障及避奇异的路径规划方法
CN108469822A (zh) * 2018-04-04 2018-08-31 天津理工大学 一种室内导盲机器人在动态环境下的路径规划方法
CN109254298A (zh) * 2018-09-30 2019-01-22 中国安全生产科学研究院 地铁隧道内安全巡检机器人的定位***
CN110989639A (zh) * 2019-12-31 2020-04-10 中国电子科技集团公司信息科学研究院 一种基于应力矩阵的水下航行器编队控制方法
CN111522341A (zh) * 2020-04-23 2020-08-11 中国地质大学(武汉) 网络异构机器人***的多时变编队跟踪控制方法及***

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110317922A1 (en) * 2008-07-29 2011-12-29 Superfish Ltd. Increasing interest point coverage in an image
CN102096415A (zh) * 2010-12-31 2011-06-15 重庆邮电大学 基于Ad-Hoc网络和leader-follower算法的多机器人编队方法
CN104076688A (zh) * 2014-07-17 2014-10-01 山东省科学院海洋仪器仪表研究所 一种自主式水下航行器主从式协同控制方法
CN105700527A (zh) * 2016-01-26 2016-06-22 哈尔滨工业大学 一种平面冗余度机器人避障及避奇异的路径规划方法
CN108469822A (zh) * 2018-04-04 2018-08-31 天津理工大学 一种室内导盲机器人在动态环境下的路径规划方法
CN109254298A (zh) * 2018-09-30 2019-01-22 中国安全生产科学研究院 地铁隧道内安全巡检机器人的定位***
CN110989639A (zh) * 2019-12-31 2020-04-10 中国电子科技集团公司信息科学研究院 一种基于应力矩阵的水下航行器编队控制方法
CN111522341A (zh) * 2020-04-23 2020-08-11 中国地质大学(武汉) 网络异构机器人***的多时变编队跟踪控制方法及***

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115759270A (zh) * 2022-10-24 2023-03-07 华东师范大学 一种基于量子线路的高效模拟方法
CN115759270B (zh) * 2022-10-24 2024-07-09 华东师范大学 一种基于量子线路的高效模拟方法

Also Published As

Publication number Publication date
CN114637301B (zh) 2023-04-11

Similar Documents

Publication Publication Date Title
Chen et al. Distributed leader–follower affine formation maneuver control for high-order multiagent systems
Zhang et al. Distributed control of coordinated path tracking for networked nonholonomic mobile vehicles
Xiao et al. Incremental updating multirobot formation using nonlinear model predictive control method with general projection neural network
Yan et al. Consensus formation tracking for multiple AUV systems using distributed bioinspired sliding mode control
Dutta et al. A decentralized formation and network connectivity tracking controller for multiple unmanned systems
CN110658821B (zh) 一种多机器人抗干扰分组时变编队控制方法及***
CN112631335B (zh) 一种基于事件触发的多四旋翼无人机固定时间编队方法
Xu et al. Two-layer distributed hybrid affine formation control of networked Euler–Lagrange systems
CN111522341A (zh) 网络异构机器人***的多时变编队跟踪控制方法及***
CN114237041B (zh) 一种基于预设性能的空-地协同固定时间容错控制方法
CN110442134B (zh) 一种基于双层网络的多智能体群集控制方法
CN112083727B (zh) 基于速度障碍物的多自主体***分布式避碰编队控制方法
CN112947086B (zh) 一种无人机和无人车组成的异构多智能体***编队控制中执行器故障的自适应补偿方法
CN114721275B (zh) 一种基于预设性能的视觉伺服机器人自适应跟踪控制方法
CN114779645B (zh) 一种有向固定通信拓扑下胸鳍拍动式机器鱼编队控制方法
Yan et al. Decentralized formation trajectory tracking control of multi-AUV system with actuator saturation
CN115033016A (zh) 一种异构无人集群编队避障方法及***
CN114637301B (zh) 基于最优仿射队形变换的多机器人动态避障装置及方法
CN114237247A (zh) 基于预测的可变队形非完整移动机器人一致性控制方法
CN114721273B (zh) 一种固定时间收敛零化神经网络的多智能体编队控制方法
CN114333429B (zh) 一种面向多无人机目标覆盖任务的规则提取方法
CN113359626B (zh) 一种多机器人***的有限时间分层控制的方法
Wang et al. Event-Triggered Integral Formation Controller for Networked Nonholonomic Mobile Robots: Theory and Experiment
Chen et al. Collision-free formation control with global network integrity maintenance via preserving induced-subgraph connectivity
Xiao et al. Incremental Swarm Coordination Control with Self-triggered-organized Topology and Predictive-based Control Method

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant