CN114310888B - 一种协作机器人可变刚度运动技能学习与调控方法及*** - Google Patents

一种协作机器人可变刚度运动技能学习与调控方法及*** Download PDF

Info

Publication number
CN114310888B
CN114310888B CN202111628215.4A CN202111628215A CN114310888B CN 114310888 B CN114310888 B CN 114310888B CN 202111628215 A CN202111628215 A CN 202111628215A CN 114310888 B CN114310888 B CN 114310888B
Authority
CN
China
Prior art keywords
force
matrix
robot
rigidity
cooperative robot
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202111628215.4A
Other languages
English (en)
Other versions
CN114310888A (zh
Inventor
吴鸿敏
徐智浩
周雪峰
廖昭洋
瞿弘毅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Institute of Intelligent Manufacturing of Guangdong Academy of Sciences
Original Assignee
Institute of Intelligent Manufacturing of Guangdong Academy of Sciences
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Institute of Intelligent Manufacturing of Guangdong Academy of Sciences filed Critical Institute of Intelligent Manufacturing of Guangdong Academy of Sciences
Priority to CN202111628215.4A priority Critical patent/CN114310888B/zh
Publication of CN114310888A publication Critical patent/CN114310888A/zh
Priority to PCT/CN2022/123754 priority patent/WO2023124346A1/zh
Application granted granted Critical
Publication of CN114310888B publication Critical patent/CN114310888B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • BPERFORMING OPERATIONS; TRANSPORTING
    • B25HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
    • B25JMANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
    • B25J9/00Programme-controlled manipulators
    • B25J9/16Programme controls

Landscapes

  • Engineering & Computer Science (AREA)
  • Robotics (AREA)
  • Mechanical Engineering (AREA)
  • Manipulator (AREA)

Abstract

本发明公开了一种协作机器人可变刚度运动技能学习与调控方法及***,其中,所述方法包括:基于外界接触力‑刚度相关联的操作任务对协作机器人进行运动演示处理,形成数据集;基于数据集构建协作机器人与环境交互模型,获得协作机器人末端力‑刚度矩阵关联关系;进行刚度矩阵估计处理,形成末端力‑刚度矩阵数据集;基于矩阵三角分解法对末端力‑刚度矩阵数据集进行向量化处理,获得末端力‑刚度向量数据集;进行末端力‑刚度向量的运动技能建模与在线学习,获得学习结果;将条件概率分布作为高斯过程的均值函数进行协作机器人的末端力‑刚度调整与控制处理。在本发明实施例中,实现接触力发生变化时协作机器人末端刚度的自适应调制与控制。

Description

一种协作机器人可变刚度运动技能学习与调控方法及***
技术领域
本发明涉及自动化控制技术领域,尤其涉及一种协作机器人可变刚度运动技能学习与调控方法及***。
背景技术
随着制造业的智能化和柔性化发展,机器人编程技术也面临着较大的挑战。传统依赖于人为干预与反复调试的工业机器人编程技术,只适用于特定任务,当遇到相近任务或不同环境时,需要重新进行编程,无法汲取过往的操作经验,存在效率低、适应性差、灵巧性不足等问题。当前,新一代人工智能技术研发取得了重大进步,协作机器人应用广度与深度也日益提升,探索如何利用人工智能技术让协作机器人***具备一定的自主决策和学习能力,进而使协作机器人能够学习到适应于不同任务和环境的运动技能,避免对每个任务的繁琐编程,是当今协作机器人领域前沿研究热点与难点。
协作机器人运动技能模仿学习能够通过协作机器人与人类交互的方式获得运动技能,将人类运动技能传递给协作机器人,充分利用人类的操作经验,使协作机器人获得高度类人化操作能力,是目前业界与学界公认能实现协作机器人快速编程、高效适应和灵巧操作最为有效的解决方案之一。然而,已有运动技能模仿学习方法侧重于协作机器人欧几里得空间的运动特征模仿(如:位置、速度等),缺乏考虑特殊正交群和黎曼空间中具有严格几何约束的运动特征(如:姿态、刚度、可操作性等),并且依赖于时间驱动的运动轨迹,无法满足高维输入的技能学习,在任务泛化性和环境适应性两个方面存在较大的不足。
发明内容
本发明的目的在于克服现有技术的不足,本发明提供了一种协作机器人可变刚度运动技能学习与调控方法及***,实现接触力发生变化时协作机器人末端刚度的自适应调整与控制,满足精密装配、康复训练等复杂任务对协作机器人的技术需求。
为了解决上述技术问题,本发明实施例提供了一种协作机器人可变刚度运动技能学习与调控方法,所述方法包括:
基于外界接触力-刚度相关联的操作任务对协作机器人进行运动演示处理,获得协作机器人的末端位置、速度、加速度、外界接触力,形成数据集;
基于所述数据集构建协作机器人与环境交互模型,获得协作机器人末端力-刚度矩阵关联关系;
基于所述协作机器人末端力-刚度矩阵关联关系进行刚度矩阵估计处理,形成末端力-刚度矩阵数据集;
基于矩阵三角分解法对末端力-刚度矩阵数据集进行向量化处理,获得末端力-刚度向量数据集;
基于所述末端力-刚度向量数据集进行末端力-刚度向量的运动技能建模与在线学习,获得学习结果,所述学习结果为条件概率分布;
将所述条件概率分布作为高斯过程的均值函数进行协作机器人的末端力-刚度调整与控制处理。
可选的,所述基于外界接触力-刚度相关联的操作任务对协作机器人进行运动演示处理,获得协作机器人的末端位置、速度、加速度、外界接触力,形成数据集,包括:
在所述协作机器人末端安装六维力传感器,并通过交互技能数据采集与标注***在零力拖动模式下牵引所述协作机器人进行外界接触力-刚度相关联的操作任务展开多次运动演示,获得每次演示协作机器人的末端位置、速度、加速度、外界接触力的高维运动轨迹,形成数据集;
所述数据集表示形式其中,xt,m表示协作机器人在样本长度为t和训练样本数量为m时的末端位置;/>表示协作机器人在样本长度为t和训练样本数量为m时的末端速度;/>表示协作机器人在样本长度为t和训练样本数量为m时的末端加速度;/>表示协作机器人在样本长度为t和训练样本数量为m时的末端的力;T表示样本的长度;M表示训练样本的数量。
可选的,所述基于所述数据集构建协作机器人与环境交互模型,获得协作机器人末端力-刚度矩阵关联关系,包括:
在所述数据集合的基础上,假设所述协作机器人末端为受到控制力fc和外界力fe影响的单位质量体IM,其动力学模型简化为:
在所述协作机器人末端的控制力由虚拟弹簧-阻尼***产生,从而得到每一时刻所述协作机器人动力学等价于:
在此基础上,假定通过技能学习得到所述协作机器人末端理想运动力轨迹为Fd,从而可以由虚拟弹簧-阻尼***将Fd表达为:
其中,表示协作机器人的末端加速度;/>表示协作机器人末端在样本长度为t时的末端加速度;/>表示协作机器人末端在样本长度为t时的刚度矩阵;/>表示协作机器人的末端期望位置;xt表示协作机器人的末端位置;/>表示协作机器人末端在样本长度为t时的阻尼矩阵;/>表示协作机器人的末端速度;/>表示在协作机器人末端在样本长度为t时的外界力;/>表示未知刚度矩阵;Δx表示已知未知变化量;/>表示未知阻尼矩阵;J表示已知雅克比矩阵;/>表示已知关节速度。
可选的,所述基于所述数据集构建协作机器人与环境交互模型,获得协作机器人末端力-刚度矩阵关联关系之后,还包括:
使所述协作机器人不作周期性振动而又能快速地回到平衡位置,将设定未知阻尼矩阵为临界阻尼值,即:
其中,Q和Λ分别为对称正定的未知刚度矩阵的特征向量和特征值;η表示调节系数,/>
在所述协作机器人力矩控制模式下,设笛卡尔阻尼控制器实现末端理想力的执行如下:
其中,τd表示笛卡尔阻尼控制器实现末端理想力的执行;J′表示已知雅克比矩阵的转置;Fd表示协作机器人末端理想运动力轨迹;表示机器人运动学模型,其中,θ表示已知关节角度,/>表示已知关节速度,/>表示已知关节加速度;
由协作机器人末端理想运动力轨迹Fd和笛卡尔阻尼控制器实现末端理想力的执行τd可知,所述协作机器人末端理想作用力由唯一的对称正定的刚度矩阵决定,其中,/>表示对称正定流形;
通过构建所述协作机器人末端力-刚度矩阵的技能模型f(KP|F)实现可调控刚度的运动技能学习。
可选的,所述基于所述协作机器人末端力-刚度矩阵关联关系进行刚度矩阵估计处理,形成末端力-刚度矩阵数据集,包括:
通过对协作机器人末端力-刚度矩阵关联关系内的刚度矩阵进行估计,形成末端力-刚度矩阵数据集
其中,表示协作机器人在样本长度为t和训练样本数量为m时的末端的力;T表示样本的长度;M表示训练样本的数量;/>表示协作机器人在样本长度为t和训练样本数量为m时的刚度矩阵。
可选的,所述基于矩阵三角分解法对末端力-刚度矩阵数据集进行向量化处理,获得末端力-刚度向量数据集,包括:
根据刚度矩阵的对称性与正定性的几何约束,采用矩阵三角分解方法对末端力-刚度矩阵数据集内的刚度矩阵进行向量化并转换到欧几里得到空间表征的刚度向量,形成末端力-刚度向量数据集/>
其中,表示协作机器人在样本长度为t和训练样本数量为m时的末端的力;T表示样本的长度;M表示训练样本的数量;/>表示协作机器人在样本长度为t和训练样本数量为m时的刚度矩阵;/>表示协作机器人在样本长度为t和训练样本数量为m时的上三角矩阵元素的向量化描述,长度为m(m+1)/2;At,m表示协作机器人在样本长度为t和训练样本数量为m时的分解后的上三角矩阵;A′t,m为At,m的转置。
可选的,所述基于所述末端力-刚度向量数据集进行末端力-刚度向量的运动技能建模与在线学习包括:
采用高斯混合模型对末端力-刚度向量数据集的输入和输出进行联合建模,获得建模结果如下:
其中,C表示高斯混合模型中的高斯分布的数量;πc表示第c个高斯模型的先验概率,并且μc和∑c分布表示第c个高斯模型的均值及协方差;F表示末端力;/>表示高斯分布;VP协作机器人的上三角矩阵元素的向量化描述;
在给定训练样本和高斯模型数量C的前提下,高斯混合模型的参数通过期望最大化算法进行迭代优化获得;
在获得高斯混合模型的参数后,对于任意未知末端力F*输入时,均利用高斯混合回归估计得到对应刚度向量VP*的条件概率分布f(VP|F*)。
可选的,所述将所述条件概率分布作为高斯过程的均值函数进行协作机器人的末端力-刚度调整与控制处理,包括:
将所述条件概率分布作为高斯过程的均值函数,即有:
μ(F)=p(VP|F);
其中,VP协作机器人的上三角矩阵元素的向量化描述;F表示协作机器人末端的输入力;
将通过高斯过程协方差函数来应对外界给定刚度的约束情况,自动调整刚度轨迹;
假设末端力-刚度向量数据集中含有N样本潜在的函数关系VP=f(F)+ε,其中,ε~N(0,σ2)是方差为未知σ2的噪声;
当给定新的测试输入F*后,其对应的函数值为f(F*)和已有输出样本之间存在以下联合分布关系:
式中,I表示N维单位矩阵;k*=[k(F*,F1),k(F*,F2),…,k(F*,FN)],K表示由核函数定义的协方差矩阵;
由联合分布得到多变量高斯的条件概率分布P(f(F*)|VP),其均值μ(F*)=p(VP*|F*)由高斯混合模型-高斯回归获得,方差表示如下:
D(f(F*))=k(F*,F*)-k*(K+σ2I)-1k*′;
其中,k*′表示k*的转置。
可选的,述由核函数定义的协方差矩阵描述如下:
其中,k(.,.)表示核函数运算。
另外,本发明实施例还提供了一种协作机器人可变刚度运动技能学习与调控***,所述***包括:
获得模块:用于基于外界接触力-刚度相关联的操作任务对协作机器人进行运动演示处理,获得协作机器人的末端位置、速度、加速度、外界接触力,形成数据集;
构建模块:用于基于所述数据集构建协作机器人与环境交互模型,获得协作机器人末端力-刚度矩阵关联关系;
估计模块:用于基于所述协作机器人末端力-刚度矩阵关联关系进行刚度矩阵估计处理,形成末端力-刚度矩阵数据集;
向量化模块:用于基于矩阵三角分解法对末端力-刚度矩阵数据集进行向量化处理,获得末端力-刚度向量数据集;
在线学习模块:用于基于所述末端力-刚度向量数据集进行末端力-刚度向量的运动技能建模与在线学习,获得学习结果,所述学习结果为条件概率分布;
调制控制模块:用于将所述条件概率分布作为高斯过程的均值函数进行协作机器人的末端力-刚度调整与控制处理。
在本发明实施例中,从协作机器人末端运动位置、速度、加速度、外界接触力的高维运动数据中估计出满足对称性和正定性的刚度矩阵;对协作机器人末端力-刚度向量进行运动技能模仿,实现在任意未知外界接触力作为输入时估计出末端刚度向量,并在此基础上,通过三角分解逆变换与协作机器人阻抗控制器,实现接触力发生变化时协作机器人末端刚度的自适应调整与控制,满足精密装配、康复训练等复杂任务对协作机器人的技术需求。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见的,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
图1是本发明实施例中的协作机器人可变刚度运动技能学习与调控方法的流程示意图;
图2是本发明实施例中的协作机器人可变刚度运动技能学习与调控***的结构组成示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
实施例一
本发明提出了一种协作机器人可变刚度运动技能学习与调控方法,让协作机器人能够从人类多次演示的位置-外界力的运动轨迹中学习基于外界力的变刚度运动技能,当外界接触力发生变化时协作机器人末端刚度进行自适应调整与控制,实现对人类进行精密装配、康复训练等复杂任务的操作技能模仿,将有效提升协作机器人环境适应性和操作灵巧性。具体表现包括:(1)从模仿学习的角度出发,本发明提出适用于高动态非结构化、不确定性环境下协作机器人外界力-末端刚度相关联的运动技能学习方法,通过学习的方式构建数据驱动的变阻抗运动模型,有望解决现有固定阻抗建模及参数辨识两大难题;(2)通过假设协作机器人末端为受到控制力和外界力影响的单位质量体以简化协作机器人末端动力学模型。其中,协作机器人末端控制力可由虚拟弹簧阻尼***产生,进而构建协作机器人末端刚度矩阵与末端位置、速度、加速度、外界力之间的等价关系。在此基础上,本发明通过最小二乘法从人类演示的运动轨迹(末端位置、速度、加速度、外界力)中进行刚度矩阵的粗估计,再通过刚度矩阵逼近方法进行精估计以确保刚度矩阵的对称性与正定性,有效解决传统采用凸优化方法进行刚度矩阵估计存在计算效率低的问题;(3)考虑到对称正定的刚度矩阵位于黎曼空间,而非常规的欧氏空间,无法进行直接的运算,并且外界力作为输入时属于高变量输入,无法采用传统的动态运动基元模型进行建模。针对此问题,本发明首先将刚度矩阵进行三角分解得到刚度向量,再提出一种基于均值先验的高斯过程建模方法,构建外界力-刚度向量的技能模型,借助先验设置与高效的核函数运算,所提方法能够同时满足从多次演示轨迹中进行多样性和轨迹不确定性的建模与学习,使所习得技能能够保持演示运动特性的前提下快速适应外界环境的变化,提升环境适应性。
首先,在协作机器人末端安装六维力传感器,通过交互式技能数据采集与标注***在零力拖动模式下牵引协作机器人进行外界力-刚度相关联的操作任务开展多次运动演示,并获取每次演示过程中协作机器人末端运动位置、速度、加速度、外界接触力的高维运动轨迹,形成数据集。然后,在刚度矩阵对称性和正定性的几何条件下,构建“粗计算-精逼近”两阶段相结合的刚度矩阵估计方法,获得每一时刻不同外界接触力情况下协作机器人末端刚度矩阵的映射关系;再次,采用刚度矩阵三角分解方法将黎曼空间中刚度矩阵间距离度量转化到欧几里得空间,进行矩阵向量化描述,形成刚度向量;最后,在欧几里得空间下提出一种基于均值先验的高斯过程建模方法,构建协作机器人末端外力接触力-刚度相关联的运动技能模仿学习方法,在获得任意未知外界接触力作为输入时估计出末端刚度矩阵,并通过协作机器人阻抗控制器实现接触力发生变化时协作机器人末端刚度进行自适应调整与控制,满足精密装配、康复训练等复杂任务对协作机器人的技术需求。
具体的,请参阅图1,图1是本发明实施例中的协作机器人可变刚度运动技能学习与调控方法的流程示意图。
如图1所示,一种协作机器人可变刚度运动技能学习与调控方法,所述方法包括:
S11:基于外界接触力-刚度相关联的操作任务对协作机器人进行运动演示处理,获得协作机器人的末端位置、速度、加速度、外界接触力,形成数据集;
在本发明具体实施过程中,所述基于外界接触力-刚度相关联的操作任务对协作机器人进行运动演示处理,获得协作机器人的末端位置、速度、加速度、外界接触力,形成数据集,包括:在所述协作机器人末端安装六维力传感器,并通过交互技能数据采集与标注***在零力拖动模式下牵引所述协作机器人进行外界接触力-刚度相关联的操作任务展开多次运动演示,获得每次演示协作机器人的末端位置、速度、加速度、外界接触力的高维运动轨迹,形成数据集;
所述数据集表示形式其中,xt,m表示协作机器人在样本长度为t和训练样本数量为m时的末端位置;/>表示协作机器人在样本长度为t和训练样本数量为m时的末端速度;/>表示协作机器人在样本长度为t和训练样本数量为m时的末端加速度;/>表示协作机器人在样本长度为t和训练样本数量为m时的末端的力;T表示样本的长度;M表示训练样本的数量。
S12:基于所述数据集构建协作机器人与环境交互模型,获得协作机器人末端力-刚度矩阵关联关系;
在本发明具体实施过程中,所述基于所述数据集构建协作机器人与环境交互模型,获得协作机器人末端力-刚度矩阵关联关系,包括:在所述数据集合的基础上,假设所述协作机器人末端为受到控制力fc和外界力fe影响的单位质量体IM,其动力学模型简化为:
在所述协作机器人末端的控制力由虚拟弹簧-阻尼***产生,从而得到每一时刻所述协作机器人动力学等价于:
在此基础上,假定通过技能学习得到所述协作机器人末端理想运动力轨迹为Fd,从而可以由虚拟弹簧-阻尼***将Fd表达为:
其中,表示协作机器人的末端加速度;/>表示协作机器人末端在样本长度为t时的末端加速度;/>表示协作机器人末端在样本长度为t时的刚度矩阵;/>表示协作机器人的末端期望位置;xt表示协作机器人的末端位置;/>表示协作机器人末端在样本长度为t时的阻尼矩阵;/>表示协作机器人的末端速度;/>表示在协作机器人末端在样本长度为t时的外界力;/>表示未知刚度矩阵;Δx表示已知未知变化量;/>表示未知阻尼矩阵;J表示已知雅克比矩阵;/>表示已知关节速度。
进一步的,所述基于所述数据集构建协作机器人与环境交互模型,获得协作机器人末端力-刚度矩阵关联关系之后,还包括:使所述协作机器人不作周期性振动而又能快速地回到平衡位置,将设定未知阻尼矩阵为临界阻尼值,即:
其中,Q和Λ分别为对称正定的未知刚度矩阵的特征向量和特征值;η表示调节系数,/>在所述协作机器人力矩控制模式下,设笛卡尔阻尼控制器实现末端理想力的执行如下:
其中,τd表示笛卡尔阻尼控制器实现末端理想力的执行;J′表示已知雅克比矩阵的转置;Fd表示协作机器人末端理想运动力轨迹;表示机器人运动学模型,其中,θ表示已知关节角度,/>表示已知关节速度,/>表示已知关节加速度;由协作机器人末端理想运动力轨迹Fd和笛卡尔阻尼控制器实现末端理想力的执行τd可知,所述协作机器人末端理想作用力由唯一的对称正定的刚度矩阵/>决定,其中,/>表示对称正定流形(Symmetric Positive Definite Manifold,简称SPD流形);通过构建所述协作机器人末端力-刚度矩阵的技能模型f(KP|F)实现可调控刚度的运动技能学习。
S13:基于所述协作机器人末端力-刚度矩阵关联关系进行刚度矩阵估计处理,形成末端力-刚度矩阵数据集;
在本发明具体实施过程中,所述基于所述协作机器人末端力-刚度矩阵关联关系进行刚度矩阵估计处理,形成末端力-刚度矩阵数据集,包括:
通过对协作机器人末端力-刚度矩阵关联关系内的刚度矩阵进行估计,形成末端力-刚度矩阵数据集
其中,表示协作机器人在样本长度为t和训练样本数量为m时的末端的力;T表示样本的长度;M表示训练样本的数量;/>表示协作机器人在样本长度为t和训练样本数量为m时的刚度矩阵。
S14:基于矩阵三角分解法对末端力-刚度矩阵数据集进行向量化处理,获得末端力-刚度向量数据集;
在本发明具体实施过程中,所述基于矩阵三角分解法对末端力-刚度矩阵数据集进行向量化处理,获得末端力-刚度向量数据集,包括:
根据刚度矩阵的对称性与正定性的几何约束,采用矩阵三角分解方法对末端力-刚度矩阵数据集内的刚度矩阵进行向量化并转换到欧几里得到空间表征的刚度向量,形成末端力-刚度向量数据集
其中,表示协作机器人在样本长度为t和训练样本数量为m时的末端的力;T表示样本的长度;M表示训练样本的数量;/>表示协作机器人在样本长度为t和训练样本数量为m时的刚度矩阵;/>表示协作机器人在样本长度为t和训练样本数量为m时的上三角矩阵元素的向量化描述,长度为m(m+1)/2;At,m表示协作机器人在样本长度为t和训练样本数量为m时的分解后的上三角矩阵;A′t,m为At,m的转置。
S15:基于所述末端力-刚度向量数据集进行末端力-刚度向量的运动技能建模与在线学习,获得学习结果,所述学习结果为条件概率分布;
在本发明具体实施过程中,所述基于所述末端力-刚度向量数据集进行末端力-刚度向量的运动技能建模与在线学习包括:采用高斯混合模型对末端力-刚度向量数据集的输入和输出进行联合建模,获得建模结果如下:
其中,C表示高斯混合模型(Gaussian Mixture Model,GMM)中的高斯分布的数量;πc表示第c个高斯模型的先验概率,并且μc和∑c分布表示第c个高斯模型的均值及协方差;F表示末端力;/>表示高斯分布;Vp协作机器人的上三角矩阵元素的向量化描述;在给定训练样本和高斯模型数量C的前提下,高斯混合模型的参数通过期望最大化算法进行迭代优化获得;在获得高斯混合模型的参数后,对于任意未知末端力F*输入时,利用高斯混合回归(Gaussian Mixture Regression,GMR)估计得到对应刚度向量VP*的条件概率分布f(VP|F*),即:
上述同属于高斯分布,由相应的均值和方差/>进行描述,简化为:
从而,利用GMM能够从多次演示运动轨迹中学习运动的多样性与概率特性,满足于对外界未知干扰的建模。但是,GMM的参数更新需要进行重新迭代优化,难以将学习到的技能应用于与演示状态差异较大的情况。为此,本发明将在传统技能学习方法GMM-GMR的基础上,引入多输出高斯过程对未知环境或新的任务约束进行建模,实现技能的在线学习。
S16:将所述条件概率分布作为高斯过程的均值函数进行协作机器人的末端力-刚度调整与控制处理。
在本发明具体实施过程中,所述将所述条件概率分布作为高斯过程的均值函数进行协作机器人的末端力-刚度调整与控制处理,包括:针对末端力-刚度运动技能的在线控制与调整,将GMM-GMR得到的条件概率分布作为高斯过程的均值函数,即有:
μ(F)=p(VP|F);
它封装了多次演示运动轨迹的概率特性(如形状等)。下面将通过GP协方差函数来应对外界给定刚度的约束情况,自动调整刚度轨迹,以适应环境的变化等;其中,VP协作机器人的上三角矩阵元素的向量化描述;F表示协作机器人末端的输入力;将通过高斯过程协方差函数来应对外界给定刚度的约束情况,自动调整刚度轨迹;假设末端力-刚度向量数据集中含有N样本潜在的函数关系VP=f(F)+ε,其中,ε~N(0,σ2)是方差为未知σ2的噪声;当给定新的测试输入F*后,其对应的函数值为f(F*)和已有输出样本之间存在以下联合分布关系:
式中,I表示N维单位矩阵;k*=[k(F*,F1),k(F*,F2),…,k(F*,FN)],K表示由核函数定义的协方差矩阵;由联合分布得到多变量高斯的条件概率分布P(f(F*)|Vp),其均值μ(F*)=p(VP*|F*)由高斯混合模型-高斯回归获得,方差表示如下:
D(f(F*))=k(F*,F*)-k*(K+σ2I)-1k*′;
其中,k*′表示k*的转置。
所述由核函数定义的协方差矩阵描述如下:
其中,k(.,.)表示核函数运算。
从而,在传统GMM-GMR基础上联合高斯过程实现末端力-刚度的自动调整,以高效适应环境的变化。最后,采用矩阵三角分解的逆变换将得到的刚度向量f(VP|F*)从欧几里得空间恢复为黎曼空间的刚度矩阵f(KP|F*),将协作机器人末端刚度矩阵转换到末端力,并设计阻抗控制器,实现协作机器人末端力-刚度的自适应控制与调整。
在本发明实施例中,从协作机器人末端运动位置、速度、加速度、外界接触力的高维运动数据中估计出满足对称性和正定性的刚度矩阵;对协作机器人末端力-刚度向量进行运动技能模仿,实现在任意未知外界接触力作为输入时估计出末端刚度向量,并在此基础上,通过三角分解逆变换与协作机器人阻抗控制器,实现接触力发生变化时协作机器人末端刚度的自适应调整与控制,满足精密装配、康复训练等复杂任务对协作机器人的技术需求。
实施例二
请参阅图2,图2是本发明实施例中的协作机器人可变刚度运动技能学习与调控***的结构组成示意图。
如图2所示,一种协作机器人可变刚度运动技能学习与调控***,所述***包括:
获得模块21:用于基于外界接触力-刚度相关联的操作任务对协作机器人进行运动演示处理,获得协作机器人的末端位置、速度、加速度、外界接触力,形成数据集;
在本发明具体实施过程中,所述基于外界接触力-刚度相关联的操作任务对协作机器人进行运动演示处理,获得协作机器人的末端位置、速度、加速度、外界接触力,形成数据集,包括:在所述协作机器人末端安装六维力传感器,并通过交互技能数据采集与标注***在零力拖动模式下牵引所述协作机器人进行外界接触力-刚度相关联的操作任务展开多次运动演示,获得每次演示协作机器人的末端位置、速度、加速度、外界接触力的高维运动轨迹,形成数据集;
所述数据集表示形式其中,xt,m表示协作机器人在样本长度为t和训练样本数量为m时的末端位置;/>表示协作机器人在样本长度为t和训练样本数量为m时的末端速度;/>表示协作机器人在样本长度为t和训练样本数量为m时的末端加速度;/>表示协作机器人在样本长度为t和训练样本数量为m时的末端的力;T表示样本的长度;M表示训练样本的数量。
构建模块22:用于基于所述数据集构建协作机器人与环境交互模型,获得协作机器人末端力-刚度矩阵关联关系;
在本发明具体实施过程中,所述基于所述数据集构建协作机器人与环境交互模型,获得协作机器人末端力-刚度矩阵关联关系,包括:在所述数据集合的基础上,假设所述协作机器人末端为受到控制力fc和外界力fe影响的单位质量体IM,其动力学模型简化为:
在所述协作机器人末端的控制力由虚拟弹簧-阻尼***产生,从而得到每一时刻所述协作机器人动力学等价于:
在此基础上,假定通过技能学习得到所述协作机器人末端理想运动力轨迹为Fd,从而可以由虚拟弹簧-阻尼***将Fd表达为:
其中,表示协作机器人的末端加速度;/>表示协作机器人末端在样本长度为t时的末端加速度;/>表示协作机器人末端在样本长度为t时的刚度矩阵;/>表示协作机器人的末端期望位置;xt表示协作机器人的末端位置;/>表示协作机器人末端在样本长度为t时的阻尼矩阵;/>表示协作机器人的末端速度;/>表示在协作机器人末端在样本长度为t时的外界力;/>表示未知刚度矩阵;Δx表示已知未知变化量;/>表示未知阻尼矩阵;J表示已知雅克比矩阵;/>表示已知关节速度。
进一步的,所述基于所述数据集构建协作机器人与环境交互模型,获得协作机器人末端力-刚度矩阵关联关系之后,还包括:使所述协作机器人不作周期性振动而又能快速地回到平衡位置,将设定未知阻尼矩阵为临界阻尼值,即:
其中,Q和Λ分别为对称正定的未知刚度矩阵的特征向量和特征值;η表示调节系数,/>在所述协作机器人力矩控制模式下,设笛卡尔阻尼控制器实现末端理想力的执行如下:
其中,τd表示笛卡尔阻尼控制器实现末端理想力的执行;J′表示已知雅克比矩阵的转置;Fd表示协作机器人末端理想运动力轨迹;表示机器人运动学模型,其中,θ表示已知关节角度,/>表示已知关节速度,/>表示已知关节加速度;由协作机器人末端理想运动力轨迹Fd和笛卡尔阻尼控制器实现末端理想力的执行τd可知,所述协作机器人末端理想作用力由唯一的对称正定的刚度矩阵/>决定,其中,/>表示对称正定流形;通过构建所述协作机器人末端力-刚度矩阵的技能模型f(KP|F)实现可调控刚度的运动技能学习。
估计模块23:用于基于所述协作机器人末端力-刚度矩阵关联关系进行刚度矩阵估计处理,形成末端力-刚度矩阵数据集;
在本发明具体实施过程中,所述基于所述协作机器人末端力-刚度矩阵关联关系进行刚度矩阵估计处理,形成末端力-刚度矩阵数据集,包括:
通过对协作机器人末端力-刚度矩阵关联关系内的刚度矩阵进行估计,形成末端力-刚度矩阵数据集
其中,表示协作机器人在样本长度为t和训练样本数量为m时的末端的力;T表示样本的长度;M表示训练样本的数量;/>表示协作机器人在样本长度为t和训练样本数量为m时的刚度矩阵。
向量化模块24:用于基于矩阵三角分解法对末端力-刚度矩阵数据集进行向量化处理,获得末端力-刚度向量数据集;
在本发明具体实施过程中,所述基于矩阵三角分解法对末端力-刚度矩阵数据集进行向量化处理,获得末端力-刚度向量数据集,包括:
根据刚度矩阵的对称性与正定性的几何约束,采用矩阵三角分解方法对末端力-刚度矩阵数据集内的刚度矩阵进行向量化并转换到欧几里得到空间表征的刚度向量,形成末端力-刚度向量数据集/>
其中,表示协作机器人在样本长度为t和训练样本数量为m时的末端的力;T表示样本的长度;M表示训练样本的数量;/>表示协作机器人在样本长度为t和训练样本数量为m时的刚度矩阵;/>表示协作机器人在样本长度为t和训练样本数量为m时的上三角矩阵元素的向量化描述,长度为m(m+1)/2;At,m表示协作机器人在样本长度为t和训练样本数量为m时的分解后的上三角矩阵;A′t,m为At,m的转置。
在线学习模块25:用于基于所述末端力-刚度向量数据集进行末端力-刚度向量的运动技能建模与在线学习,获得学习结果,所述学习结果为条件概率分布;
在本发明具体实施过程中,所述基于所述末端力-刚度向量数据集进行末端力-刚度向量的运动技能建模与在线学习包括:采用高斯混合模型对末端力-刚度向量数据集的输入和输出进行联合建模,获得建模结果如下:
其中,C表示高斯混合模型(Gaussian Mixture Model,GMM)中的高斯分布的数量;πc表示第c个高斯模型的先验概率,并且μc和∑c分布表示第c个高斯模型的均值及协方差;F表示末端力;/>表示高斯分布;VP协作机器人的上三角矩阵元素的向量化描述;在给定训练样本和高斯模型数量C的前提下,高斯混合模型的参数通过期望最大化算法进行迭代优化获得;在获得高斯混合模型的参数后,对于任意未知末端力F*输入时,利用高斯混合回归(Gaussian Mixture Regression,GMR)估计得到对应刚度向量VP*的条件概率分布f(VP|F*),即:
上述同属于高斯分布,由相应的均值和方差/>进行描述,简化为:
从而,利用GMM能够从多次演示运动轨迹中学习运动的多样性与概率特性,满足于对外界未知干扰的建模。但是,GMM的参数更新需要进行重新迭代优化,难以将学习到的技能应用于与演示状态差异较大的情况。为此,本发明将在传统技能学习方法GMM-GMR的基础上,引入多输出高斯过程对未知环境或新的任务约束进行建模,实现技能的在线学习。
调制控制模块26:用于将所述条件概率分布作为高斯过程的均值函数进行协作机器人的末端力-刚度调整与控制处理。
在本发明具体实施过程中,所述将所述条件概率分布作为高斯过程的均值函数进行协作机器人的末端力-刚度调整与控制处理,包括:针对末端力-刚度运动技能的在线控制与调整,将GMM-GMR得到的条件概率分布作为高斯过程的均值函数,即有:
μ(F)=(VP|F);
它封装了多次演示运动轨迹的概率特性(如形状等)。下面将通过GP协方差函数来应对外界给定刚度的约束情况,自动调整刚度轨迹,以适应环境的变化等;其中,VP协作机器人的上三角矩阵元素的向量化描述;F表示协作机器人末端的输入力;将通过高斯过程协方差函数来应对外界给定刚度的约束情况,自动调整刚度轨迹;假设末端力-刚度向量数据集中含有N样本潜在的函数关系VP=f(F)+ε,其中,ε~N(0,σ2)是方差为未知σ2的噪声;当给定新的测试输入F*后,其对应的函数值为f(F*)和已有输出样本之间存在以下联合分布关系:
式中,I表示N维单位矩阵;k*=[k(F*,F1),k(F*,F2),…,k(F*,FN)],K表示由核函数定义的协方差矩阵;由联合分布得到多变量高斯的条件概率分布P(f(F*)|VP),其均值μ(F*)=p(VP*|F*)由高斯混合模型-高斯回归获得,方差表示如下:
D(f(F*))=k(F*,F*)-k*(K+σ2I)-1k*′;
其中,k*′表示k*的转置。
所述由核函数定义的协方差矩阵描述如下:
其中,k(.,.)表示核函数运算。
从而,在传统GMM-GMR基础上联合高斯过程实现末端力-刚度的自动调整,以高效适应环境的变化。最后,采用矩阵三角分解的逆变换将得到的刚度向量f(VP|F*)从欧几里得空间恢复为黎曼空间的刚度矩阵f(KP|F*),将协作机器人末端刚度矩阵转换到末端力,并设计阻抗控制器,实现协作机器人末端力-刚度的自适应控制与调整。
在本发明实施例中,从协作机器人末端运动位置、速度、加速度、外界接触力的高维运动数据中估计出满足对称性和正定性的刚度矩阵;对协作机器人末端力-刚度向量进行运动技能模仿,实现在任意未知外界接触力作为输入时估计出末端刚度向量,并在此基础上,通过三角分解逆变换与协作机器人阻抗控制器,实现接触力发生变化时协作机器人末端刚度的自适应调整与控制,满足精密装配、康复训练等复杂任务对协作机器人的技术需求。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:只读存储器(ROM,ReadOnly Memory)、随机存取存储器(RAM,Random AccessMemory)、磁盘或光盘等。
另外,以上对本发明实施例所提供的一种协作机器人可变刚度运动技能学习与调控方法及***进行了详细介绍,本文中应采用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (7)

1.一种协作机器人可变刚度运动技能学习与调控方法,其特征在于,所述方法包括:
基于外界接触力-刚度相关联的操作任务对协作机器人进行运动演示处理,获得协作机器人的末端位置、速度、加速度、外界接触力,形成数据集;
基于所述数据集构建协作机器人与环境交互模型,获得协作机器人末端力-刚度矩阵关联关系;
基于所述协作机器人末端力-刚度矩阵关联关系进行刚度矩阵估计处理,形成末端力-刚度矩阵数据集;
基于矩阵三角分解法对末端力-刚度矩阵数据集进行向量化处理,获得末端力-刚度向量数据集;
基于所述末端力-刚度向量数据集进行末端力-刚度向量的运动技能建模与在线学习,获得学习结果,所述学习结果为条件概率分布;
将所述条件概率分布作为高斯过程的均值函数进行协作机器人的末端力-刚度调整与控制处理;
所述基于所述数据集构建协作机器人与环境交互模型,获得协作机器人末端力-刚度矩阵关联关系,包括:
在所述数据集的基础上,假设所述协作机器人末端为受到控制力fc和外界力fe影响的单位质量体IM,其动力学模型简化为:
在所述协作机器人末端的控制力由虚拟弹簧-阻尼***产生,从而得到每一时刻所述协作机器人动力学模型等价于:
在此基础上,假定通过技能学习得到所述协作机器人末端理想运动力轨迹为Fd,从而可以由虚拟弹簧-阻尼***将Fd表达为:
其中,表示协作机器人的末端加速度;/>表示协作机器人末端在样本长度为t时的末端加速度;/>表示协作机器人末端在样本长度为t时的刚度矩阵;/>表示协作机器人的末端期望位置;xt表示协作机器人的末端位置;/>表示协作机器人末端在样本长度为t时的阻尼矩阵;/>表示协作机器人的末端速度;/>表示在协作机器人末端在样本长度为t时的外界力;/>表示未知刚度矩阵;Δx表示已知未知变化量;/>表示未知阻尼矩阵;J表示已知雅克比矩阵;/>表示已知关节速度;
所述基于所述数据集构建协作机器人与环境交互模型,获得协作机器人末端力-刚度矩阵关联关系之后,还包括:
使所述协作机器人不作周期性振动而又能快速地回到平衡位置,将设定未知阻尼矩阵为临界阻尼值,即:
其中,Q和Λ分别为对称正定的未知刚度矩阵的特征向量和特征值;η表示调节系数,/>
在所述协作机器人力矩控制模式下,设笛卡尔阻尼控制器实现末端理想力的执行如下:
其中,τd表示笛卡尔阻尼控制器实现末端理想力的执行;J表示已知雅克比矩阵的转置;Fd表示协作机器人末端理想运动力轨迹;表示机器人运动学模型,其中,θ表示已知关节角度,/>表示已知关节速度,/>表示已知关节加速度;
由协作机器人末端理想运动力轨迹Fd和笛卡尔阻尼控制器实现末端理想力的执行τd可知,所述协作机器人末端理想作用力由唯一的对称正定的刚度矩阵决定,其中,表示对称正定流形;
通过构建所述协作机器人末端力-刚度矩阵的技能模型f(KP|F)实现可调控刚度的运动技能学习;
所述基于所述末端力-刚度向量数据集进行末端力-刚度向量的运动技能建模与在线学习包括:
采用高斯混合模型对末端力-刚度向量数据集的输入和输出进行联合建模,获得建模结果如下:
其中,C表示高斯混合模型中的高斯分布的数量;πc表示第c个高斯模型的先验概率,并且μc和∑c分布表示第c个高斯模型的均值及协方差;F表示末端力;/>表示高斯分布;VP协作机器人的上三角矩阵元素的向量化描述;
在给定训练样本和高斯模型数量C的前提下,高斯混合模型的参数通过期望最大化算法进行迭代优化获得;
在获得高斯混合模型的参数后,对于任意未知末端力F*输入时,利用高斯混合回归估计得到对应刚度向量VP*的条件概率分布f(VP|F*)。
2.根据权利要求1所述的方法,其特征在于,所述基于外界接触力-刚度相关联的操作任务对协作机器人进行运动演示处理,获得协作机器人的末端位置、速度、加速度、外界接触力,形成数据集,包括:
在所述协作机器人末端安装六维力传感器,并通过交互技能数据采集与标注***在零力拖动模式下牵引所述协作机器人进行外界接触力-刚度相关联的操作任务展开多次运动演示,获得每次演示协作机器人的末端位置、速度、加速度、外界接触力的高维运动轨迹,形成数据集;
所述数据集表示形式其中,xt,m表示协作机器人在样本长度为t和训练样本数量为m时的末端位置;/>表示协作机器人在样本长度为t和训练样本数量为m时的末端速度;/>表示协作机器人在样本长度为t和训练样本数量为m时的末端加速度;/>表示协作机器人在样本长度为t和训练样本数量为m时的末端的力;T表示样本的长度;M表示训练样本的数量。
3.根据权利要求1所述的方法,其特征在于,所述基于所述协作机器人末端力-刚度矩阵关联关系进行刚度矩阵估计处理,形成末端力-刚度矩阵数据集,包括:
通过对协作机器人末端力-刚度矩阵关联关系内的刚度矩阵进行估计,形成末端力-刚度矩阵数据集
其中,表示协作机器人在样本长度为t和训练样本数量为m时的末端的力;T表示样本的长度;M表示训练样本的数量;/>表示协作机器人在样本长度为t和训练样本数量为m时的刚度矩阵。
4.根据权利要求1所述的方法,其特征在于,所述基于矩阵三角分解法对末端力-刚度矩阵数据集进行向量化处理,获得末端力-刚度向量数据集,包括:
根据刚度矩阵的对称性与正定性的几何约束,采用矩阵三角分解方法对末端力-刚度矩阵数据集内的刚度矩阵进行向量化并转换到欧几里得到空间表征的刚度向量,形成末端力-刚度向量数据集
其中,表示协作机器人在样本长度为t和训练样本数量为m时的末端的力;T表示样本的长度;M表示训练样本的数量;/>表示协作机器人在样本长度为t和训练样本数量为m时的刚度矩阵;/>表示协作机器人在样本长度为t和训练样本数量为m时的上三角矩阵元素的向量化描述,长度为m(m+1)/2;At,m表示协作机器人在样本长度为t和训练样本数量为m时的分解后的上三角矩阵;A′t,m为At,m的转置。
5.根据权利要求1所述的方法,其特征在于,所述将所述条件概率分布作为高斯过程的均值函数进行协作机器人的末端力-刚度调整与控制处理,包括:
将所述条件概率分布作为高斯过程的均值函数,即有:
μ(F)=p(VP|F);
其中,VP协作机器人的上三角矩阵元素的向量化描述;F表示协作机器人末端的输入力;
将通过高斯过程协方差函数来应对外界给定刚度的约束情况,自动调整刚度轨迹;
假设末端力-刚度向量数据集中含有N样本潜在的函数关系VP=f(F)+ε,其中,ε~N(0,σ2)是方差为未知σ2的噪声;
当给定新的测试输入F*后,其对应的函数值为f(F*)和已有输出样本之间存在以下联合分布关系:
式中,I表示N维单位矩阵;k*=[k(F*,F1),k(F*,F2),…,k(F*,FN)],K表示由核函数定义的协方差矩阵;
由联合分布得到多变量高斯的条件概率分布P(f(F*)|VP),其均值μ(F*)=p(VP*|F*)由高斯混合模型-高斯回归获得,方差表示如下:
D(f(F*))=k(F*,F*)-k*(K+σ2I)-1k*′;
其中,k*′表示k*的转置。
6.根据权利要求5所述的方法,其特征在于,所述由核函数定义的协方差矩阵描述如下:
其中,k*(.,.)表示核函数运算。
7.一种协作机器人可变刚度运动技能学习与调控***,其特征在于,所述***包括:
获得模块:用于基于外界接触力-刚度相关联的操作任务对协作机器人进行运动演示处理,获得协作机器人的末端位置、速度、加速度、外界接触力,形成数据集;
构建模块:用于基于所述数据集构建协作机器人与环境交互模型,获得协作机器人末端力-刚度矩阵关联关系;
估计模块:用于基于所述协作机器人末端力-刚度矩阵关联关系进行刚度矩阵估计处理,形成末端力-刚度矩阵数据集;
向量化模块:用于基于矩阵三角分解法对末端力-刚度矩阵数据集进行向量化处理,获得末端力-刚度向量数据集;
在线学习模块:用于基于所述末端力-刚度向量数据集进行末端力-刚度向量的运动技能建模与在线学习,获得学习结果,所述学习结果为条件概率分布;
调制控制模块:用于将所述条件概率分布作为高斯过程的均值函数进行协作机器人的末端力-刚度调整与控制处理;
所述基于所述数据集构建协作机器人与环境交互模型,获得协作机器人末端力-刚度矩阵关联关系,包括:
在所述数据集的基础上,假设所述协作机器人末端为受到控制力fc和外界力fe影响的单位质量体IM,其动力学模型简化为:
在所述协作机器人末端的控制力由虚拟弹簧-阻尼***产生,从而得到每一时刻所述协作机器人动力学模型等价于:
在此基础上,假定通过技能学习得到所述协作机器人末端理想运动力轨迹为Fd,从而可以由虚拟弹簧-阻尼***将Fd表达为:
其中,表示协作机器人的末端加速度;/>表示协作机器人末端在样本长度为t时的末端加速度;/>表示协作机器人末端在样本长度为t时的刚度矩阵;/>表示协作机器人的末端期望位置;xt表示协作机器人的末端位置;/>表示协作机器人末端在样本长度为t时的阻尼矩阵;/>表示协作机器人的末端速度;/>表示在协作机器人末端在样本长度为t时的外界力;/>表示未知刚度矩阵;Δx表示已知未知变化量;/>表示未知阻尼矩阵;J表示已知雅克比矩阵;/>表示已知关节速度;
所述基于所述数据集构建协作机器人与环境交互模型,获得协作机器人末端力-刚度矩阵关联关系之后,还包括:
使所述协作机器人不作周期性振动而又能快速地回到平衡位置,将设定未知阻尼矩阵为临界阻尼值,即:
其中,Q和Λ分别为对称正定的未知刚度矩阵的特征向量和特征值;η表示调节系数,/>
在所述协作机器人力矩控制模式下,设笛卡尔阻尼控制器实现末端理想力的执行如下:
其中,τd表示笛卡尔阻尼控制器实现末端理想力的执行;J′表示已知雅克比矩阵的转置;Fd表示协作机器人末端理想运动力轨迹;表示机器人运动学模型,其中,θ表示已知关节角度,/>表示已知关节速度,/>表示已知关节加速度;
由协作机器人末端理想运动力轨迹Fd和笛卡尔阻尼控制器实现末端理想力的执行τd可知,所述协作机器人末端理想作用力由唯一的对称正定的刚度矩阵决定,其中,表示对称正定流形;
通过构建所述协作机器人末端力-刚度矩阵的技能模型f(KP|F)实现可调控刚度的运动技能学习;
所述基于所述末端力-刚度向量数据集进行末端力-刚度向量的运动技能建模与在线学习包括:
采用高斯混合模型对末端力-刚度向量数据集的输入和输出进行联合建模,获得建模结果如下:
其中,C表示高斯混合模型中的高斯分布的数量;πc表示第c个高斯模型的先验概率,并且μc和∑c分布表示第c个高斯模型的均值及协方差;F表示末端力;/>表示高斯分布;VP协作机器人的上三角矩阵元素的向量化描述;
在给定训练样本和高斯模型数量C的前提下,高斯混合模型的参数通过期望最大化算法进行迭代优化获得;
在获得高斯混合模型的参数后,对于任意未知末端力F*输入时,利用高斯混合回归估计得到对应刚度向量VP*的条件概率分布f(VP|F*)。
CN202111628215.4A 2021-12-28 2021-12-28 一种协作机器人可变刚度运动技能学习与调控方法及*** Active CN114310888B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202111628215.4A CN114310888B (zh) 2021-12-28 2021-12-28 一种协作机器人可变刚度运动技能学习与调控方法及***
PCT/CN2022/123754 WO2023124346A1 (zh) 2021-12-28 2022-10-08 一种协作机器人可变刚度运动技能学习与调控方法及***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111628215.4A CN114310888B (zh) 2021-12-28 2021-12-28 一种协作机器人可变刚度运动技能学习与调控方法及***

Publications (2)

Publication Number Publication Date
CN114310888A CN114310888A (zh) 2022-04-12
CN114310888B true CN114310888B (zh) 2024-05-31

Family

ID=81015974

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111628215.4A Active CN114310888B (zh) 2021-12-28 2021-12-28 一种协作机器人可变刚度运动技能学习与调控方法及***

Country Status (2)

Country Link
CN (1) CN114310888B (zh)
WO (1) WO2023124346A1 (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114310888B (zh) * 2021-12-28 2024-05-31 广东省科学院智能制造研究所 一种协作机器人可变刚度运动技能学习与调控方法及***
CN115730475B (zh) * 2023-01-09 2023-05-19 广东省科学院智能制造研究所 一种云边端协同的柔性产线机器人学习***及方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01142812A (ja) * 1987-11-30 1989-06-05 Agency Of Ind Science & Technol 力制御機能を有する制御装置
CN111037571A (zh) * 2019-12-31 2020-04-21 广东工业大学 一种机器人自适应变阻尼阻抗控制方法
CN113084812A (zh) * 2021-04-09 2021-07-09 吉林大学 一种机器人末端刚度性能评价方法
CN113352328A (zh) * 2021-06-28 2021-09-07 深圳亿嘉和科技研发有限公司 一种铰接模型的辨识方法及机器人操作方法
CN113386136A (zh) * 2021-06-30 2021-09-14 华中科技大学 一种基于标准球阵目标估计的机器人位姿矫正方法及***

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9070083B2 (en) * 2011-12-13 2015-06-30 Iucf-Hyu Industry-University Cooperation Foundation Hanyang University Method for learning task skill and robot using thereof
US20200156241A1 (en) * 2018-11-21 2020-05-21 Ford Global Technologies, Llc Automation safety and performance robustness through uncertainty driven learning and control
WO2020118730A1 (zh) * 2018-12-14 2020-06-18 中国科学院深圳先进技术研究院 机器人柔顺性控制方法、装置、设备及存储介质
US11607806B2 (en) * 2019-10-21 2023-03-21 Autodesk, Inc. Techniques for generating controllers for robots
CN111230873B (zh) * 2020-01-31 2022-02-01 武汉大学 一种基于示教学习的协作搬运控制***及方法
CN112605973B (zh) * 2020-11-19 2022-11-01 广东省科学院智能制造研究所 一种机器人运动技能学习方法及***
CN114310888B (zh) * 2021-12-28 2024-05-31 广东省科学院智能制造研究所 一种协作机器人可变刚度运动技能学习与调控方法及***

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01142812A (ja) * 1987-11-30 1989-06-05 Agency Of Ind Science & Technol 力制御機能を有する制御装置
CN111037571A (zh) * 2019-12-31 2020-04-21 广东工业大学 一种机器人自适应变阻尼阻抗控制方法
CN113084812A (zh) * 2021-04-09 2021-07-09 吉林大学 一种机器人末端刚度性能评价方法
CN113352328A (zh) * 2021-06-28 2021-09-07 深圳亿嘉和科技研发有限公司 一种铰接模型的辨识方法及机器人操作方法
CN113386136A (zh) * 2021-06-30 2021-09-14 华中科技大学 一种基于标准球阵目标估计的机器人位姿矫正方法及***

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Safety Performance of a Variable Stiffness Actuator for Collaborative Robots;Sandoval, J等;《 ADVANCES IN SERVICE AND INDUSTRIAL ROBOTICS》;20190501;35-43 *
程韬波 ; 李晓晓 ; 徐智浩 ; 周雪峰.基于递归神经网络的多机器人智能协同控制.《机电工程技术》.2020,1-4. *

Also Published As

Publication number Publication date
WO2023124346A1 (zh) 2023-07-06
CN114310888A (zh) 2022-04-12

Similar Documents

Publication Publication Date Title
Peters et al. Reinforcement learning by reward-weighted regression for operational space control
CN114310888B (zh) 一种协作机器人可变刚度运动技能学习与调控方法及***
Muhlig et al. Task-level imitation learning using variance-based movement optimization
Lai et al. Comprehensive unified control strategy for underactuated two-link manipulators
US11992944B2 (en) Data-efficient hierarchical reinforcement learning
CN109702740B (zh) 机器人柔顺性控制方法、装置、设备及存储介质
WO2020118730A1 (zh) 机器人柔顺性控制方法、装置、设备及存储介质
Schmidts et al. Imitation learning of human grasping skills from motion and force data
KR101577711B1 (ko) 시간 및 공간적 관계를 이용한 작업 솜씨 학습 방법
KR101912918B1 (ko) 학습 로봇, 그리고 이를 이용한 작업 솜씨 학습 방법
CN113043275B (zh) 基于专家演示和强化学习的微零件装配方法
Ambhore A comprehensive study on robot learning from demonstration
Han et al. Trajectory optimization and force control with modified dynamic movement primitives under curved surface constraints
Arsenic Developmental learning on a humanoid robot
Ma et al. An efficient robot precision assembly skill learning framework based on several demonstrations
Li et al. Enhanced task parameterized dynamic movement primitives by GMM to solve manipulation tasks
CN114415507A (zh) 基于深度神经网络的灵巧手抓持过程动力学模型搭建及训练方法
Fuentes et al. Learning dextrous manipulation skills for multifingered robot hands using the evolution strategy
Abdelrahman et al. Context-aware task execution using apprenticeship learning
Yin et al. Learning cost function and trajectory for robotic writing motion
Liu et al. Demonstration Learning and Generalization of Robotic Motor Skills Based on Wearable Motion Tracking Sensors
CN114952791A (zh) 肌肉骨骼机器人控制方法及装置
KR20130067345A (ko) 작업 솜씨를 학습하는 방법 및 이를 이용한 로봇
Li et al. Target dynamic grasping during mobile robot movement based on learning methods
Tang et al. Reinforcement learning for robots path planning with rule-based shallow-trial

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant