CN114789444A - 一种基于深度强化学习和阻抗控制的柔顺人机接触方法 - Google Patents

一种基于深度强化学习和阻抗控制的柔顺人机接触方法 Download PDF

Info

Publication number
CN114789444A
CN114789444A CN202210484043.6A CN202210484043A CN114789444A CN 114789444 A CN114789444 A CN 114789444A CN 202210484043 A CN202210484043 A CN 202210484043A CN 114789444 A CN114789444 A CN 114789444A
Authority
CN
China
Prior art keywords
actuator
axis direction
contact
reinforcement learning
mechanical arm
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202210484043.6A
Other languages
English (en)
Other versions
CN114789444B (zh
Inventor
舒明雷
张铁译
陈超
王若同
刘照阳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qilu University of Technology
Shandong Institute of Artificial Intelligence
Original Assignee
Qilu University of Technology
Shandong Institute of Artificial Intelligence
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qilu University of Technology, Shandong Institute of Artificial Intelligence filed Critical Qilu University of Technology
Priority to CN202210484043.6A priority Critical patent/CN114789444B/zh
Publication of CN114789444A publication Critical patent/CN114789444A/zh
Application granted granted Critical
Publication of CN114789444B publication Critical patent/CN114789444B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • BPERFORMING OPERATIONS; TRANSPORTING
    • B25HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
    • B25JMANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
    • B25J9/00Programme-controlled manipulators
    • B25J9/16Programme controls
    • B25J9/1628Programme controls characterised by the control loop
    • B25J9/1633Programme controls characterised by the control loop compliant, force, torque control, e.g. combined with position control
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B25HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
    • B25JMANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
    • B25J9/00Programme-controlled manipulators
    • B25J9/16Programme controls
    • B25J9/1602Programme controls characterised by the control system, structure, architecture
    • B25J9/1605Simulation of manipulator lay-out, design, modelling of manipulator
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B25HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
    • B25JMANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
    • B25J9/00Programme-controlled manipulators
    • B25J9/16Programme controls
    • B25J9/1628Programme controls characterised by the control loop
    • B25J9/163Programme controls characterised by the control loop learning, adaptive, model based, rule based expert control

Landscapes

  • Engineering & Computer Science (AREA)
  • Robotics (AREA)
  • Mechanical Engineering (AREA)
  • Automation & Control Theory (AREA)
  • Manipulator (AREA)

Abstract

一种基于深度强化学习和阻抗控制的柔顺人机接触方法,根据本任务的需求,建立相关的状态空间,动作空间和奖励函数,为实现任务的柔顺性,在身体表面建立虚拟接触面,结合阻抗控制,提前获取执行器到达目标部位的虚拟接触力,并输入状态空间,通过深度强化学习算法对执行器动作的调整,实现力调整,完成任务。实现了深度强化学习和柔顺控制的结合,建立了虚拟接触面,可提前获取执行器的接触力,实现对接触力的调整,来适应复杂多变的柔顺人机接触任务。

Description

一种基于深度强化学习和阻抗控制的柔顺人机接触方法
技术领域
本发明涉及柔顺控制技术领域,具体涉及一种基于深度强化学习和阻抗控制的柔顺人机接触方法。
背景技术
近年来,随着人工智能技术的进步,机器人的感知能力和交互沟通能力越来越强,作为一个模拟人类行为的机器***,智能机器人能够协助人类完成各式各样的任务,相互之间的接触也不可避免的发生,为实现人与机器人的紧密结合,“人机共融”成为了重要的发展趋势。在这种趋势下,对机器人操作水平的要求也越来越高。在机器人的位置控制和力控方面,传统的柔顺控制技术已经发展得非常成熟。但控制***的设计依托于精确的数学模型,而在柔顺人机接触任务中,由于环境的复杂性、时变性以及不确定性,很难得到精确的数学模型。因此,传统控制技术在处理相应任务时仍存在一定的挑战和局限性。
发明内容
本发明为了克服以上技术的不足,提供了一种基于深度强化学习和阻抗控制的柔顺人机接触方法。
本发明克服其技术问题所采用的技术方案是:
一种基于深度强化学习和阻抗控制的柔顺人机接触方法,包括如下步骤:
a)根据柔顺人机接触任务,以机械臂底座建立机械臂坐标系,获得执行器的初始位置坐标{Px,Py,Pz}及目标部位在机械臂坐标系下的位置坐标{Ox,Oy,Oz},Px为执行器的X轴坐标,Py为执行器的Y轴坐标,Pz为执行器的Z轴坐标,Ox为目标部位的X轴坐标,Oy为目标部位的Y轴坐标,Oz为目标部位的Z轴坐标;
b)通过深度强化学习算法建立状态空间S和动作空间A,S={P′x,P′y,P′z,Ox,Oy,Oz,Fx,Fy,Fz},式中Fx为执行器的X轴方向上的接触力分力,Fy为执行器的Y轴方向上的接触力分力,Fz为执行器的Z轴方向上的接触力分力,P′x为执行器的实时位置的X轴坐标,P′y为执行器的实时位置的Y轴坐标,P′z为执行器的实时位置的Z轴坐标;
c)对机械臂位姿进行初始化,初始化后执行器的实时位置坐标为{P′x,P′y,P′z},得到执行器初始位置与目标部位之间的距离di及执行器当前位置与目标部位之间的距离dc
d)通过公式r1=(di-dc)/di计算得到基于距离的奖励函数r1
e)设定柔顺人机在接触任务中,执行器与目标接触的接触力在m-nN之内;
f)在距离身体距离为γ处设置虚拟接触面;
g)通过公式l=|P′z-Oz|计算得到是否接触到虚拟接触面的判定条件值l;
h)当l>γ时,判定执行器未接触到虚拟接触面,状态空间Fx,Fy,Fz均为0;
i)当0<l≤γ时,判定执行器接触到虚拟接触面,此时通过阻抗控制得到虚拟接触力Fv,Fv=(F′x,F′y,F′z)T,F′x为执行器的X轴方向上的虚拟接触力分力,F′y为执行器的Y轴方向上的虚拟接触力分力,F′z为执行器的Z轴方向上的虚拟接触力分力,T为转置,将F′x、F′y及F′z分别等同于状态空间S中的Fx、Fy及Fz
j)当执行器与身体发生接触时,真实接触力Fe≠0,此时停止对执行器的控制。
进一步的,步骤a)中通过柔顺人机中的视觉模块获得执行器的位置坐标{Px,Py,Pz}和目标部位在机械臂坐标系下的位置坐标{Ox,Oy,Oz}。
进一步的,步骤b)中通过公式A={ax,ay,az}建立动作空间,ax为执行器在机械臂坐标系下的X轴方向上的偏移量,ay为执行器在机械臂坐标系下的Y轴方向上的偏移量,az为执行器在机械臂坐标系下的Z轴方向上的偏移量。
进一步的,步骤c)中通过公式
Figure BDA0003627004080000031
计算得到执行器当前位置与目标部位之间的距离dc,通过公式
Figure BDA0003627004080000032
计算得到执行器初始位置与目标部位之间的距离di
优选的,步骤e)中m取值为1,n的取值为7。
进一步的,步骤i)中通过公式
Figure BDA0003627004080000033
计算得到虚拟接触力Fv,式中Md、Bd、Kd均为阻抗参数,
Figure BDA0003627004080000034
为执行器的速度,
Figure BDA0003627004080000035
为执行器的加速度,λ为常数,I为向量,I=[0,0,1]T,Δx为执行器与目标部位之间的距离差,Δx=(|P′x-Ox|,|P′y-Oy|,|P′z-Oz|)T
优选的,步骤b)中深度强化学习算法为PPO-clip算法。
进一步的,还包括在步骤j)后执行步骤h):当真实接触力Fe大于nN时,立即停止执行器运行,并初始化机械臂。
进一步的,还包括利用奖励函数r训练深度强化学习算法。
进一步的,奖励函数r=r1+r2+r3+r4,式中当机械臂探索范围为
Figure BDA0003627004080000036
时r2=0,如果机械臂探索范围不为
Figure BDA0003627004080000037
时r2=-1,式中Xmin为执行器在机械臂坐标系的X轴方向上所能运行到达的最小值,Xmax为执行器在机械臂坐标系的X轴方向上所能运行到达的最大值,Ymin为执行器在机械臂坐标系的Y轴方向上所能运行到达的最小值,Ymax为执行器在机械臂坐标系的Y轴方向上所能运行到达的最大值,Zmin为执行器在机械臂坐标系的Z轴方向上所能运行到达的最小值,Zmax为执行器在机械臂坐标系的Z轴方向上所能运行到达的最大值;设置机械臂最大步数为1500步,当机械臂调整步数大于1500步时,r3=-1,停止运行,初始化机械臂;如果真实接触力Fe在Z轴方向上的分力在m-nN之间时,r4=1,如果真实接触力Fe在Z轴方向上的分力不在m-nN之间时,r4=-1。
本发明的有益效果是:根据本任务的需求,建立相关的状态空间,动作空间和奖励函数,为实现任务的柔顺性,在身体表面建立虚拟接触面,结合阻抗控制,提前获取执行器到达目标部位的虚拟接触力,并输入状态空间,通过深度强化学习算法对执行器动作的调整,实现力调整,完成任务。实现了深度强化学习和柔顺控制的结合,建立了虚拟接触面,可提前获取执行器的接触力,实现对接触力的调整,来适应复杂多变的柔顺人机接触任务。
附图说明
图1为本发明的控制结构示意图。
具体实施方式
下面结合附图1对本发明做进一步说明。
一种基于深度强化学习和阻抗控制的柔顺人机接触方法,包括如下步骤:
a)根据柔顺人机接触任务,以机械臂底座建立机械臂坐标系,获得执行器的初始位置坐标{Px,Py,Pz}及目标部位在机械臂坐标系下的位置坐标{Ox,Oy,Oz},Px为执行器的X轴坐标,Py为执行器的Y轴坐标,Pz为执行器的Z轴坐标,Ox为目标部位的X轴坐标,Oy为目标部位的Y轴坐标,Oz为目标部位的Z轴坐标。
b)通过深度强化学习算法建立状态空间S和动作空间A,S={P′x,P′y,P′z,Ox,Oy,Oz,Fx,Fy,Fz},式中Fx为执行器的X轴方向上的接触力分力,Fy为执行器的Y轴方向上的接触力分力,Fz为执行器的Z轴方向上的接触力分力,P′x为执行器的实时位置的X轴坐标,P′y为执行器的实时位置的Y轴坐标,P′z为执行器的实时位置的Z轴坐标。
c)进行正确的人机接触任务,主要分为两部分进行处理,第一部分为控制执行器到达目标位置,第二部分考虑控制执行器在合适的力范围内接触目标部位,具体步骤为:对机械臂位姿进行初始化,执行器始终保持垂直向下的姿态,初始化后执行器的实时位置坐标为{P′x,P′y,P′z},得到执行器初始位置与目标部位之间的距离di及执行器当前位置与目标部位之间的距离dc
d)通过公式r1=(di-dc)/di计算得到基于距离的奖励函数r1。该奖励函数是为了完成到达任务进行的设定,执行器与目标部位越接近,奖励值越大。
e)设定柔顺人机在接触任务中,执行器与目标接触的接触力在m-nN之内。此时得到的声音信号较好,同时在该接触力内,可以保证接触力造成的压力在感觉舒适的范围之内。其中mN代表最小接触力,nN代表最大接触力。
f)在距离身体距离为γ处设置虚拟接触面。
g)当执行器在接近目标部位的过程中,判断是否接触到虚拟接触面的条件为:通过公式l=|P′z-Oz|计算得到是否接触到虚拟接触面的判定条件值l。
h)当l>γ时,判定执行器未接触到虚拟接触面,状态空间Fx,Fy,Fz均为0。
i)当0<l≤γ时,判定执行器接触到虚拟接触面,此时通过阻抗控制得到虚拟接触力Fv,Fv=(F′x,F′y,F′z)T,F′x为执行器的X轴方向上的虚拟接触力分力,F′y为执行器的Y轴方向上的虚拟接触力分力,F′z为执行器的Z轴方向上的虚拟接触力分力,T为转置,将F′x、F′y及F′z分别等同于状态空间S中的Fx、Fy及Fz
j)当执行器与身体发生接触时,真实接触力Fe≠0,此时停止对执行器的控制。根据本任务的需求,建立相关的状态空间,动作空间和奖励函数,为实现任务的柔顺性,在身体表面建立虚拟接触面,结合阻抗控制,提前获取执行器到达目标部位的虚拟接触力,并输入状态空间,通过深度强化学习算法对执行器动作的调整,实现力调整,完成任务。实现了深度强化学习和柔顺控制的结合,建立了虚拟接触面,可提前获取执行器的接触力,实现对接触力的调整,来适应复杂多变的柔顺人机接触任务。
实施例1:
步骤a)中通过柔顺人机中的视觉模块获得执行器的位置坐标{Px,Py,Pz}和目标部位在机械臂坐标系下的位置坐标{Ox,Oy,Oz}。
实施例2:
步骤b)中通过公式A={ax,ay,az}建立动作空间,ax为执行器在机械臂坐标系下的X轴方向上的偏移量,ay为执行器在机械臂坐标系下的Y轴方向上的偏移量,az为执行器在机械臂坐标系下的Z轴方向上的偏移量。
实施例3:
步骤c)中通过公式
Figure BDA0003627004080000061
计算得到执行器当前位置与目标部位之间的距离dc,通过公式
Figure BDA0003627004080000062
计算得到执行器初始位置与目标部位之间的距离di
实施例4:
步骤e)中m取值为1,n的取值为7。由于人体肌肉富有弹性,当有力接触时势必会产生凹陷,但最终控制机械臂的末端力在1-7N的范围之内,所以不会对人体造成不适或损伤。
实施例5:
步骤i)中通过公式
Figure BDA0003627004080000063
计算得到虚拟接触力Fv,式中Md、Bd、Kd均为阻抗参数,
Figure BDA0003627004080000064
为执行器的速度,
Figure BDA0003627004080000065
为执行器的加速度,λ为常数,为了防止在接触过程中虚拟接触力Fv过小甚至为0的情况发生,I为向量,尽管目标表面的部分弧度会造成虚拟接触面的弧度,但由于执行器保持方向不变接触目标部位,所以在接触到虚拟接触面时,在X,Y方向上的分力会很小,所以仅需要考虑控制执行器在Z方向上的力在安全的范围内,I=[0,0,1]T,Δx为执行器与目标部位之间的距离差,Δx=(|P′x-Ox′|,|P′y-Oy|,|P′z-Oz|)T。在执行器与目标部位不断接近的过程中,通过调整在X,Y,Z方向上的偏移量,来调整Δx、
Figure BDA0003627004080000071
实现对Fv的调整。
实施例6:
步骤b)中深度强化学习算法为PPO-clip算法。
实施例7:
由于误差的存在,还包括在步骤j)后执行步骤h):当真实接触力Fe大于nN时,立即停止执行器运行,并初始化机械臂。
实施例8:
还包括利用奖励函数r训练深度强化学习算法。
实施例9:
具体的,奖励函数r=r1+r2+r3+r4,式中当机械臂探索范围为
Figure BDA0003627004080000072
时r2=0,如果机械臂探索范围不为
Figure BDA0003627004080000073
时r2=-1,式中Xmin为执行器在机械臂坐标系的X轴方向上所能运行到达的最小值,Xmax为执行器在机械臂坐标系的X轴方向上所能运行到达的最大值,Ymin为执行器在机械臂坐标系的Y轴方向上所能运行到达的最小值,Ymax为执行器在机械臂坐标系的Y轴方向上所能运行到达的最大值,Zmin为执行器在机械臂坐标系的Z轴方向上所能运行到达的最小值,Zmax为执行器在机械臂坐标系的Z轴方向上所能运行到达的最大值;设置机械臂最大步数为1500步,当机械臂调整步数大于1500步时,r3=-1,停止运行,初始化机械臂;如果真实接触力Fe在Z轴方向上的分力在m-nN之间时,r4=1,如果真实接触力Fe在Z轴方向上的分力不在m-nN之间时,r4=-1。
最后应说明的是:以上所述仅为本发明的优选实施例而已,并不用于限制本发明,尽管参照前述实施例对本发明进行了详细的说明,对于本领域的技术人员来说,其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种基于深度强化学习和阻抗控制的柔顺人机接触方法,其特征在于,包括如下步骤:
a)根据柔顺人机接触任务,以机械臂底座建立机械臂坐标系,获得执行器的初始位置坐标{Px,Py,Pz}及目标部位在机械臂坐标系下的位置坐标{Ox,Oy,Oz},Px为执行器的X轴坐标,Py为执行器的Y轴坐标,Pz为执行器的Z轴坐标,Ox为目标部位的X轴坐标,Oy为目标部位的Y轴坐标,Oz为目标部位的Z轴坐标;
b)通过深度强化学习算法建立状态空间S和动作空间A,S={P′x,P′y,P′z,Ox,Oy,Oz,Fx,Fy,Fz},式中Fx为执行器的X轴方向上的接触力分力,Fy为执行器的Y轴方向上的接触力分力,Fz为执行器的Z轴方向上的接触力分力,P′x为执行器的实时位置的X轴坐标,P′y为执行器的实时位置的Y轴坐标,P′z为执行器的实时位置的Z轴坐标;
c)对机械臂位姿进行初始化,初始化后执行器的实时位置坐标为{P′x,P′y,P′z},得到执行器初始位置与目标部位之间的距离di及执行器当前位置与目标部位之间的距离dc
d)通过公式r1=(di-dc)/di计算得到基于距离的奖励函数r1
e)设定柔顺人机在接触任务中,执行器与目标接触的接触力在m-nN之内;
f)在距离身体距离为γ处设置虚拟接触面;
g)通过公式l=|P′z-Oz|计算得到是否接触到虚拟接触面的判定条件值l;
h)当l>γ时,判定执行器未接触到虚拟接触面,状态空间Fx,Fy,Fz均为0;
i)当0<l≤γ时,判定执行器接触到虚拟接触面,此时通过阻抗控制得到虚拟接触力Fv,Fv=(Fx′,Fy′,Fz′)T,Fx′为执行器的X轴方向上的虚拟接触力分力,Fy′为执行器的Y轴方向上的虚拟接触力分力,Fz′为执行器的Z轴方向上的虚拟接触力分力,T为转置,将Fx′、Fy′及Fz′分别等同于状态空间S中的Fx、Fy及Fz
j)当执行器与身体发生接触时,真实接触力Fe≠0,此时停止对执行器的控制。
2.根据权利要求1所述的基于深度强化学习和阻抗控制的柔顺人机接触方法,其特征在于:步骤a)中通过柔顺人机中的视觉模块获得执行器的位置坐标{Px,Py,Pz}和目标部位在机械臂坐标系下的位置坐标{Ox,Oy,Oz}。
3.根据权利要求1所述的基于深度强化学习和阻抗控制的柔顺人机接触方法,其特征在于:步骤b)中通过公式A={ax,ay,az}建立动作空间,ax为执行器在机械臂坐标系下的X轴方向上的偏移量,ay为执行器在机械臂坐标系下的Y轴方向上的偏移量,az为执行器在机械臂坐标系下的Z轴方向上的偏移量。
4.根据权利要求2所述的基于深度强化学习和阻抗控制的柔顺人机接触方法,其特征在于:步骤c)中通过公式
Figure FDA0003627004070000021
计算得到执行器当前位置与目标部位之间的距离dc,通过公式
Figure FDA0003627004070000022
计算得到执行器初始位置与目标部位之间的距离di
5.根据权利要求1所述的基于深度强化学习和阻抗控制的柔顺人机接触方法,其特征在于:步骤e)中m取值为1,n的取值为7。
6.根据权利要求1所述的基于深度强化学习和阻抗控制的柔顺人机接触方法,其特征在于:步骤i)中通过公式
Figure FDA0003627004070000023
计算得到虚拟接触力Fv,式中Md、Bd、Kd均为阻抗参数,
Figure FDA0003627004070000024
为执行器的速度,
Figure FDA0003627004070000031
为执行器的加速度,λ为常数,I为向量,I=[0,0,1]T,Δx为执行器与目标部位之间的距离差,Δx=(|Px′-Ox|,|Py′-Oy|,|Pz′-Oz|)T
7.根据权利要求1所述的基于深度强化学习和阻抗控制的柔顺人机接触方法,其特征在于:步骤b)中深度强化学习算法为PPO-clip算法。
8.根据权利要求1所述的基于深度强化学习和阻抗控制的柔顺人机接触方法,其特征在于,还包括在步骤j)后执行步骤h):当真实接触力Fe大于nN时,立即停止执行器运行,并初始化机械臂。
9.根据权利要求1所述的基于深度强化学习和阻抗控制的柔顺人机接触方法,其特征在于:还包括利用奖励函数r训练深度强化学习算法。
10.根据权利要求9所述的基于深度强化学习和阻抗控制的柔顺人机接触方法,其特征在于:奖励函数r=r1+r2+r3+r4,式中当机械臂探索范围为
Figure FDA0003627004070000032
时r2=0,如果机械臂探索范围不为
Figure FDA0003627004070000033
时r2=-1,式中Xmin为执行器在机械臂坐标系的X轴方向上所能运行到达的最小值,Xmax为执行器在机械臂坐标系的X轴方向上所能运行到达的最大值,Ymin为执行器在机械臂坐标系的Y轴方向上所能运行到达的最小值,Ymax为执行器在机械臂坐标系的Y轴方向上所能运行到达的最大值,Zmin为执行器在机械臂坐标系的Z轴方向上所能运行到达的最小值,Zmax为执行器在机械臂坐标系的Z轴方向上所能运行到达的最大值;设置机械臂最大步数为1500步,当机械臂调整步数大于1500步时,r3=-1,停止运行,初始化机械臂;如果真实接触力Fe在Z轴方向上的分力在m-nN之间时,r4=1,如果真实接触力Fe在Z轴方向上的分力不在m-nN之间时,r4=-1。
CN202210484043.6A 2022-05-05 2022-05-05 一种基于深度强化学习和阻抗控制的柔顺人机接触方法 Active CN114789444B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210484043.6A CN114789444B (zh) 2022-05-05 2022-05-05 一种基于深度强化学习和阻抗控制的柔顺人机接触方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210484043.6A CN114789444B (zh) 2022-05-05 2022-05-05 一种基于深度强化学习和阻抗控制的柔顺人机接触方法

Publications (2)

Publication Number Publication Date
CN114789444A true CN114789444A (zh) 2022-07-26
CN114789444B CN114789444B (zh) 2022-12-16

Family

ID=82462197

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210484043.6A Active CN114789444B (zh) 2022-05-05 2022-05-05 一种基于深度强化学习和阻抗控制的柔顺人机接触方法

Country Status (1)

Country Link
CN (1) CN114789444B (zh)

Citations (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013054629A (ja) * 2011-09-06 2013-03-21 Honda Motor Co Ltd 制御装置及び方法
CN105291102A (zh) * 2009-12-17 2016-02-03 库卡机器人有限公司 用于控制机械手的方法和装置
CN105583824A (zh) * 2016-01-26 2016-05-18 清华大学 力控牵引和摆位的多自由度机械臂控制装置及其控制方法
CN106483964A (zh) * 2015-08-31 2017-03-08 中南大学 一种基于接触力观测器的机器人柔顺控制方法
CN107263435A (zh) * 2016-03-30 2017-10-20 发那科株式会社 人协动型的机器人***
US20180107174A1 (en) * 2016-10-19 2018-04-19 Fanuc Corporation Human collaborative robot system having improved external force detection accuracy by machine learning
CN108052004A (zh) * 2017-12-06 2018-05-18 湖北工业大学 基于深度增强学习的工业机械臂自动控制方法
CN108153153A (zh) * 2017-12-19 2018-06-12 哈尔滨工程大学 一种学习变阻抗控制***及控制方法
JP2019020826A (ja) * 2017-07-12 2019-02-07 国立大学法人九州大学 力制御装置、力制御方法及び力制御プログラム
JP2019018340A (ja) * 2017-07-20 2019-02-07 キヤノン株式会社 作業用ロボット、作業用ロボットの制御方法
CN111290269A (zh) * 2020-02-11 2020-06-16 西北工业大学深圳研究院 一种空间机器人的自适应柔顺稳定控制方法
CN111716361A (zh) * 2020-07-03 2020-09-29 深圳市优必选科技股份有限公司 机器人控制方法、装置和面-面接触模型构建方法
CN111975746A (zh) * 2019-05-24 2020-11-24 精工爱普生株式会社 机器人的控制方法
WO2020239181A1 (en) * 2019-05-29 2020-12-03 Universal Robots A/S Detection of change in contact between robot arm and an object
CN112506044A (zh) * 2020-09-10 2021-03-16 上海交通大学 一种基于视觉反馈和强化学习的柔性臂控制与规划方法
KR20210065738A (ko) * 2019-11-27 2021-06-04 한국생산기술연구원 강화학습을 이용한 7축 로봇 제어 방법
CN112894809A (zh) * 2021-01-18 2021-06-04 华中科技大学 一种基于强化学习的阻抗控制器设计方法和***
CN112975977A (zh) * 2021-03-05 2021-06-18 西北大学 一种高效的机械臂抓取深度强化学习奖励训练方法及***
CN113134839A (zh) * 2021-04-26 2021-07-20 湘潭大学 一种基于视觉和力位图像学习的机器人精密柔性装配方法
CN113319857A (zh) * 2021-08-03 2021-08-31 季华实验室 机械臂力位混合控制方法、装置、电子设备及存储介质
CN113427483A (zh) * 2021-05-19 2021-09-24 广州中国科学院先进技术研究所 一种基于强化学习的双机器人力/位多元数据驱动方法
CN113635297A (zh) * 2021-07-05 2021-11-12 武汉库柏特科技有限公司 一种基于刚度检测的机器人自适应力接触控制方法及***
CN113967909A (zh) * 2021-09-13 2022-01-25 中国人民解放军军事科学院国防科技创新研究院 基于方向奖励的机械臂智能控制方法
CN114131617A (zh) * 2021-12-30 2022-03-04 华中科技大学 一种工业机器人的智能柔顺控制方法和装置
WO2022054947A1 (ja) * 2020-09-14 2022-03-17 株式会社アイシン ロボット装置およびその制御方法

Patent Citations (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105291102A (zh) * 2009-12-17 2016-02-03 库卡机器人有限公司 用于控制机械手的方法和装置
JP2013054629A (ja) * 2011-09-06 2013-03-21 Honda Motor Co Ltd 制御装置及び方法
CN106483964A (zh) * 2015-08-31 2017-03-08 中南大学 一种基于接触力观测器的机器人柔顺控制方法
CN105583824A (zh) * 2016-01-26 2016-05-18 清华大学 力控牵引和摆位的多自由度机械臂控制装置及其控制方法
CN107263435A (zh) * 2016-03-30 2017-10-20 发那科株式会社 人协动型的机器人***
US20180107174A1 (en) * 2016-10-19 2018-04-19 Fanuc Corporation Human collaborative robot system having improved external force detection accuracy by machine learning
JP2019020826A (ja) * 2017-07-12 2019-02-07 国立大学法人九州大学 力制御装置、力制御方法及び力制御プログラム
JP2019018340A (ja) * 2017-07-20 2019-02-07 キヤノン株式会社 作業用ロボット、作業用ロボットの制御方法
CN108052004A (zh) * 2017-12-06 2018-05-18 湖北工业大学 基于深度增强学习的工业机械臂自动控制方法
CN108153153A (zh) * 2017-12-19 2018-06-12 哈尔滨工程大学 一种学习变阻抗控制***及控制方法
CN111975746A (zh) * 2019-05-24 2020-11-24 精工爱普生株式会社 机器人的控制方法
WO2020239181A1 (en) * 2019-05-29 2020-12-03 Universal Robots A/S Detection of change in contact between robot arm and an object
KR20210065738A (ko) * 2019-11-27 2021-06-04 한국생산기술연구원 강화학습을 이용한 7축 로봇 제어 방법
CN111290269A (zh) * 2020-02-11 2020-06-16 西北工业大学深圳研究院 一种空间机器人的自适应柔顺稳定控制方法
CN111716361A (zh) * 2020-07-03 2020-09-29 深圳市优必选科技股份有限公司 机器人控制方法、装置和面-面接触模型构建方法
CN112506044A (zh) * 2020-09-10 2021-03-16 上海交通大学 一种基于视觉反馈和强化学习的柔性臂控制与规划方法
WO2022054947A1 (ja) * 2020-09-14 2022-03-17 株式会社アイシン ロボット装置およびその制御方法
CN112894809A (zh) * 2021-01-18 2021-06-04 华中科技大学 一种基于强化学习的阻抗控制器设计方法和***
CN112975977A (zh) * 2021-03-05 2021-06-18 西北大学 一种高效的机械臂抓取深度强化学习奖励训练方法及***
CN113134839A (zh) * 2021-04-26 2021-07-20 湘潭大学 一种基于视觉和力位图像学习的机器人精密柔性装配方法
CN113427483A (zh) * 2021-05-19 2021-09-24 广州中国科学院先进技术研究所 一种基于强化学习的双机器人力/位多元数据驱动方法
CN113635297A (zh) * 2021-07-05 2021-11-12 武汉库柏特科技有限公司 一种基于刚度检测的机器人自适应力接触控制方法及***
CN113319857A (zh) * 2021-08-03 2021-08-31 季华实验室 机械臂力位混合控制方法、装置、电子设备及存储介质
CN113967909A (zh) * 2021-09-13 2022-01-25 中国人民解放军军事科学院国防科技创新研究院 基于方向奖励的机械臂智能控制方法
CN114131617A (zh) * 2021-12-30 2022-03-04 华中科技大学 一种工业机器人的智能柔顺控制方法和装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
文闻等: "基于深度强化学习的空间机械臂柔顺捕获控制方法研究", 《空间控制技术与应用》 *
杜志江等: "基于模糊强化学习的微创外科手术机械臂人机交互方法", 《机器人 ROBOT》 *

Also Published As

Publication number Publication date
CN114789444B (zh) 2022-12-16

Similar Documents

Publication Publication Date Title
CN111660306B (zh) 一种基于操作者舒适度的机器人可变导纳控制方法及***
CN108241339B (zh) 仿人机械臂的运动求解和构型控制方法
US20170348858A1 (en) Multiaxial motion control device and method, in particular control device and method for a robot arm
CN108422421B (zh) 骨骼肌肉式机器人的肌肉控制和装配方法
CN112631128B (zh) 一种多模异构信息融合的机器人装配技能学习方法及***
CN108927801B (zh) 一种机械臂末端姿态调整方法及装置
Zeng et al. Encoding multiple sensor data for robotic learning skills from multimodal demonstration
CN108427282A (zh) 一种基于示教学习的机器人逆运动学求解方法
CN114516060A (zh) 用于控制机器人装置的设备和方法
CN111208730B (zh) 一种快速终端滑模阻抗控制算法
CN115686193A (zh) 一种增强现实环境下虚拟模型三维手势操纵方法及***
CN116587275A (zh) 基于深度强化学习的机械臂智能阻抗控制方法及***
CN114310888B (zh) 一种协作机器人可变刚度运动技能学习与调控方法及***
CN114789444B (zh) 一种基于深度强化学习和阻抗控制的柔顺人机接触方法
Li et al. Skill learning for robotic insertion based on one-shot demonstration and reinforcement learning
Lee et al. Physical human robot interaction in imitation learning
CN109940636A (zh) 一种用于商业表演的人形机器人
CN116175286A (zh) 一种基于dmp的复杂曲面打磨轨迹规划方法
CN111546035B (zh) 一种基于学习与预测的齿轮在线快速装配方法
CN112077841B (zh) 一种提升机器人手臂操纵精度的多关节联动方法及***
CN113967909A (zh) 基于方向奖励的机械臂智能控制方法
CN110919650A (zh) 一种基于svm的低延时抓取遥操作***
CN110703792A (zh) 基于增强学习的水下机器人姿态控制方法
CN114905514B (zh) 一种用于外肢体抓握控制的人体技能学习方法及***
CN113601498B (zh) 基于权重分配的机器人视觉伺服与人机交互混合操控方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant