CN114789444A - 一种基于深度强化学习和阻抗控制的柔顺人机接触方法 - Google Patents
一种基于深度强化学习和阻抗控制的柔顺人机接触方法 Download PDFInfo
- Publication number
- CN114789444A CN114789444A CN202210484043.6A CN202210484043A CN114789444A CN 114789444 A CN114789444 A CN 114789444A CN 202210484043 A CN202210484043 A CN 202210484043A CN 114789444 A CN114789444 A CN 114789444A
- Authority
- CN
- China
- Prior art keywords
- actuator
- axis direction
- contact
- reinforcement learning
- mechanical arm
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B25—HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
- B25J—MANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
- B25J9/00—Programme-controlled manipulators
- B25J9/16—Programme controls
- B25J9/1628—Programme controls characterised by the control loop
- B25J9/1633—Programme controls characterised by the control loop compliant, force, torque control, e.g. combined with position control
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B25—HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
- B25J—MANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
- B25J9/00—Programme-controlled manipulators
- B25J9/16—Programme controls
- B25J9/1602—Programme controls characterised by the control system, structure, architecture
- B25J9/1605—Simulation of manipulator lay-out, design, modelling of manipulator
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B25—HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
- B25J—MANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
- B25J9/00—Programme-controlled manipulators
- B25J9/16—Programme controls
- B25J9/1628—Programme controls characterised by the control loop
- B25J9/163—Programme controls characterised by the control loop learning, adaptive, model based, rule based expert control
Landscapes
- Engineering & Computer Science (AREA)
- Robotics (AREA)
- Mechanical Engineering (AREA)
- Automation & Control Theory (AREA)
- Manipulator (AREA)
Abstract
一种基于深度强化学习和阻抗控制的柔顺人机接触方法,根据本任务的需求,建立相关的状态空间,动作空间和奖励函数,为实现任务的柔顺性,在身体表面建立虚拟接触面,结合阻抗控制,提前获取执行器到达目标部位的虚拟接触力,并输入状态空间,通过深度强化学习算法对执行器动作的调整,实现力调整,完成任务。实现了深度强化学习和柔顺控制的结合,建立了虚拟接触面,可提前获取执行器的接触力,实现对接触力的调整,来适应复杂多变的柔顺人机接触任务。
Description
技术领域
本发明涉及柔顺控制技术领域,具体涉及一种基于深度强化学习和阻抗控制的柔顺人机接触方法。
背景技术
近年来,随着人工智能技术的进步,机器人的感知能力和交互沟通能力越来越强,作为一个模拟人类行为的机器***,智能机器人能够协助人类完成各式各样的任务,相互之间的接触也不可避免的发生,为实现人与机器人的紧密结合,“人机共融”成为了重要的发展趋势。在这种趋势下,对机器人操作水平的要求也越来越高。在机器人的位置控制和力控方面,传统的柔顺控制技术已经发展得非常成熟。但控制***的设计依托于精确的数学模型,而在柔顺人机接触任务中,由于环境的复杂性、时变性以及不确定性,很难得到精确的数学模型。因此,传统控制技术在处理相应任务时仍存在一定的挑战和局限性。
发明内容
本发明为了克服以上技术的不足,提供了一种基于深度强化学习和阻抗控制的柔顺人机接触方法。
本发明克服其技术问题所采用的技术方案是:
一种基于深度强化学习和阻抗控制的柔顺人机接触方法,包括如下步骤:
a)根据柔顺人机接触任务,以机械臂底座建立机械臂坐标系,获得执行器的初始位置坐标{Px,Py,Pz}及目标部位在机械臂坐标系下的位置坐标{Ox,Oy,Oz},Px为执行器的X轴坐标,Py为执行器的Y轴坐标,Pz为执行器的Z轴坐标,Ox为目标部位的X轴坐标,Oy为目标部位的Y轴坐标,Oz为目标部位的Z轴坐标;
b)通过深度强化学习算法建立状态空间S和动作空间A,S={P′x,P′y,P′z,Ox,Oy,Oz,Fx,Fy,Fz},式中Fx为执行器的X轴方向上的接触力分力,Fy为执行器的Y轴方向上的接触力分力,Fz为执行器的Z轴方向上的接触力分力,P′x为执行器的实时位置的X轴坐标,P′y为执行器的实时位置的Y轴坐标,P′z为执行器的实时位置的Z轴坐标;
c)对机械臂位姿进行初始化,初始化后执行器的实时位置坐标为{P′x,P′y,P′z},得到执行器初始位置与目标部位之间的距离di及执行器当前位置与目标部位之间的距离dc;
d)通过公式r1=(di-dc)/di计算得到基于距离的奖励函数r1;
e)设定柔顺人机在接触任务中,执行器与目标接触的接触力在m-nN之内;
f)在距离身体距离为γ处设置虚拟接触面;
g)通过公式l=|P′z-Oz|计算得到是否接触到虚拟接触面的判定条件值l;
h)当l>γ时,判定执行器未接触到虚拟接触面,状态空间Fx,Fy,Fz均为0;
i)当0<l≤γ时,判定执行器接触到虚拟接触面,此时通过阻抗控制得到虚拟接触力Fv,Fv=(F′x,F′y,F′z)T,F′x为执行器的X轴方向上的虚拟接触力分力,F′y为执行器的Y轴方向上的虚拟接触力分力,F′z为执行器的Z轴方向上的虚拟接触力分力,T为转置,将F′x、F′y及F′z分别等同于状态空间S中的Fx、Fy及Fz;
j)当执行器与身体发生接触时,真实接触力Fe≠0,此时停止对执行器的控制。
进一步的,步骤a)中通过柔顺人机中的视觉模块获得执行器的位置坐标{Px,Py,Pz}和目标部位在机械臂坐标系下的位置坐标{Ox,Oy,Oz}。
进一步的,步骤b)中通过公式A={ax,ay,az}建立动作空间,ax为执行器在机械臂坐标系下的X轴方向上的偏移量,ay为执行器在机械臂坐标系下的Y轴方向上的偏移量,az为执行器在机械臂坐标系下的Z轴方向上的偏移量。
优选的,步骤e)中m取值为1,n的取值为7。
进一步的,步骤i)中通过公式计算得到虚拟接触力Fv,式中Md、Bd、Kd均为阻抗参数,为执行器的速度,为执行器的加速度,λ为常数,I为向量,I=[0,0,1]T,Δx为执行器与目标部位之间的距离差,Δx=(|P′x-Ox|,|P′y-Oy|,|P′z-Oz|)T。
优选的,步骤b)中深度强化学习算法为PPO-clip算法。
进一步的,还包括在步骤j)后执行步骤h):当真实接触力Fe大于nN时,立即停止执行器运行,并初始化机械臂。
进一步的,还包括利用奖励函数r训练深度强化学习算法。
进一步的,奖励函数r=r1+r2+r3+r4,式中当机械臂探索范围为时r2=0,如果机械臂探索范围不为时r2=-1,式中Xmin为执行器在机械臂坐标系的X轴方向上所能运行到达的最小值,Xmax为执行器在机械臂坐标系的X轴方向上所能运行到达的最大值,Ymin为执行器在机械臂坐标系的Y轴方向上所能运行到达的最小值,Ymax为执行器在机械臂坐标系的Y轴方向上所能运行到达的最大值,Zmin为执行器在机械臂坐标系的Z轴方向上所能运行到达的最小值,Zmax为执行器在机械臂坐标系的Z轴方向上所能运行到达的最大值;设置机械臂最大步数为1500步,当机械臂调整步数大于1500步时,r3=-1,停止运行,初始化机械臂;如果真实接触力Fe在Z轴方向上的分力在m-nN之间时,r4=1,如果真实接触力Fe在Z轴方向上的分力不在m-nN之间时,r4=-1。
本发明的有益效果是:根据本任务的需求,建立相关的状态空间,动作空间和奖励函数,为实现任务的柔顺性,在身体表面建立虚拟接触面,结合阻抗控制,提前获取执行器到达目标部位的虚拟接触力,并输入状态空间,通过深度强化学习算法对执行器动作的调整,实现力调整,完成任务。实现了深度强化学习和柔顺控制的结合,建立了虚拟接触面,可提前获取执行器的接触力,实现对接触力的调整,来适应复杂多变的柔顺人机接触任务。
附图说明
图1为本发明的控制结构示意图。
具体实施方式
下面结合附图1对本发明做进一步说明。
一种基于深度强化学习和阻抗控制的柔顺人机接触方法,包括如下步骤:
a)根据柔顺人机接触任务,以机械臂底座建立机械臂坐标系,获得执行器的初始位置坐标{Px,Py,Pz}及目标部位在机械臂坐标系下的位置坐标{Ox,Oy,Oz},Px为执行器的X轴坐标,Py为执行器的Y轴坐标,Pz为执行器的Z轴坐标,Ox为目标部位的X轴坐标,Oy为目标部位的Y轴坐标,Oz为目标部位的Z轴坐标。
b)通过深度强化学习算法建立状态空间S和动作空间A,S={P′x,P′y,P′z,Ox,Oy,Oz,Fx,Fy,Fz},式中Fx为执行器的X轴方向上的接触力分力,Fy为执行器的Y轴方向上的接触力分力,Fz为执行器的Z轴方向上的接触力分力,P′x为执行器的实时位置的X轴坐标,P′y为执行器的实时位置的Y轴坐标,P′z为执行器的实时位置的Z轴坐标。
c)进行正确的人机接触任务,主要分为两部分进行处理,第一部分为控制执行器到达目标位置,第二部分考虑控制执行器在合适的力范围内接触目标部位,具体步骤为:对机械臂位姿进行初始化,执行器始终保持垂直向下的姿态,初始化后执行器的实时位置坐标为{P′x,P′y,P′z},得到执行器初始位置与目标部位之间的距离di及执行器当前位置与目标部位之间的距离dc。
d)通过公式r1=(di-dc)/di计算得到基于距离的奖励函数r1。该奖励函数是为了完成到达任务进行的设定,执行器与目标部位越接近,奖励值越大。
e)设定柔顺人机在接触任务中,执行器与目标接触的接触力在m-nN之内。此时得到的声音信号较好,同时在该接触力内,可以保证接触力造成的压力在感觉舒适的范围之内。其中mN代表最小接触力,nN代表最大接触力。
f)在距离身体距离为γ处设置虚拟接触面。
g)当执行器在接近目标部位的过程中,判断是否接触到虚拟接触面的条件为:通过公式l=|P′z-Oz|计算得到是否接触到虚拟接触面的判定条件值l。
h)当l>γ时,判定执行器未接触到虚拟接触面,状态空间Fx,Fy,Fz均为0。
i)当0<l≤γ时,判定执行器接触到虚拟接触面,此时通过阻抗控制得到虚拟接触力Fv,Fv=(F′x,F′y,F′z)T,F′x为执行器的X轴方向上的虚拟接触力分力,F′y为执行器的Y轴方向上的虚拟接触力分力,F′z为执行器的Z轴方向上的虚拟接触力分力,T为转置,将F′x、F′y及F′z分别等同于状态空间S中的Fx、Fy及Fz。
j)当执行器与身体发生接触时,真实接触力Fe≠0,此时停止对执行器的控制。根据本任务的需求,建立相关的状态空间,动作空间和奖励函数,为实现任务的柔顺性,在身体表面建立虚拟接触面,结合阻抗控制,提前获取执行器到达目标部位的虚拟接触力,并输入状态空间,通过深度强化学习算法对执行器动作的调整,实现力调整,完成任务。实现了深度强化学习和柔顺控制的结合,建立了虚拟接触面,可提前获取执行器的接触力,实现对接触力的调整,来适应复杂多变的柔顺人机接触任务。
实施例1:
步骤a)中通过柔顺人机中的视觉模块获得执行器的位置坐标{Px,Py,Pz}和目标部位在机械臂坐标系下的位置坐标{Ox,Oy,Oz}。
实施例2:
步骤b)中通过公式A={ax,ay,az}建立动作空间,ax为执行器在机械臂坐标系下的X轴方向上的偏移量,ay为执行器在机械臂坐标系下的Y轴方向上的偏移量,az为执行器在机械臂坐标系下的Z轴方向上的偏移量。
实施例3:
实施例4:
步骤e)中m取值为1,n的取值为7。由于人体肌肉富有弹性,当有力接触时势必会产生凹陷,但最终控制机械臂的末端力在1-7N的范围之内,所以不会对人体造成不适或损伤。
实施例5:
步骤i)中通过公式计算得到虚拟接触力Fv,式中Md、Bd、Kd均为阻抗参数,为执行器的速度,为执行器的加速度,λ为常数,为了防止在接触过程中虚拟接触力Fv过小甚至为0的情况发生,I为向量,尽管目标表面的部分弧度会造成虚拟接触面的弧度,但由于执行器保持方向不变接触目标部位,所以在接触到虚拟接触面时,在X,Y方向上的分力会很小,所以仅需要考虑控制执行器在Z方向上的力在安全的范围内,I=[0,0,1]T,Δx为执行器与目标部位之间的距离差,Δx=(|P′x-Ox′|,|P′y-Oy|,|P′z-Oz|)T。在执行器与目标部位不断接近的过程中,通过调整在X,Y,Z方向上的偏移量,来调整Δx、实现对Fv的调整。
实施例6:
步骤b)中深度强化学习算法为PPO-clip算法。
实施例7:
由于误差的存在,还包括在步骤j)后执行步骤h):当真实接触力Fe大于nN时,立即停止执行器运行,并初始化机械臂。
实施例8:
还包括利用奖励函数r训练深度强化学习算法。
实施例9:
具体的,奖励函数r=r1+r2+r3+r4,式中当机械臂探索范围为时r2=0,如果机械臂探索范围不为时r2=-1,式中Xmin为执行器在机械臂坐标系的X轴方向上所能运行到达的最小值,Xmax为执行器在机械臂坐标系的X轴方向上所能运行到达的最大值,Ymin为执行器在机械臂坐标系的Y轴方向上所能运行到达的最小值,Ymax为执行器在机械臂坐标系的Y轴方向上所能运行到达的最大值,Zmin为执行器在机械臂坐标系的Z轴方向上所能运行到达的最小值,Zmax为执行器在机械臂坐标系的Z轴方向上所能运行到达的最大值;设置机械臂最大步数为1500步,当机械臂调整步数大于1500步时,r3=-1,停止运行,初始化机械臂;如果真实接触力Fe在Z轴方向上的分力在m-nN之间时,r4=1,如果真实接触力Fe在Z轴方向上的分力不在m-nN之间时,r4=-1。
最后应说明的是:以上所述仅为本发明的优选实施例而已,并不用于限制本发明,尽管参照前述实施例对本发明进行了详细的说明,对于本领域的技术人员来说,其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.一种基于深度强化学习和阻抗控制的柔顺人机接触方法,其特征在于,包括如下步骤:
a)根据柔顺人机接触任务,以机械臂底座建立机械臂坐标系,获得执行器的初始位置坐标{Px,Py,Pz}及目标部位在机械臂坐标系下的位置坐标{Ox,Oy,Oz},Px为执行器的X轴坐标,Py为执行器的Y轴坐标,Pz为执行器的Z轴坐标,Ox为目标部位的X轴坐标,Oy为目标部位的Y轴坐标,Oz为目标部位的Z轴坐标;
b)通过深度强化学习算法建立状态空间S和动作空间A,S={P′x,P′y,P′z,Ox,Oy,Oz,Fx,Fy,Fz},式中Fx为执行器的X轴方向上的接触力分力,Fy为执行器的Y轴方向上的接触力分力,Fz为执行器的Z轴方向上的接触力分力,P′x为执行器的实时位置的X轴坐标,P′y为执行器的实时位置的Y轴坐标,P′z为执行器的实时位置的Z轴坐标;
c)对机械臂位姿进行初始化,初始化后执行器的实时位置坐标为{P′x,P′y,P′z},得到执行器初始位置与目标部位之间的距离di及执行器当前位置与目标部位之间的距离dc;
d)通过公式r1=(di-dc)/di计算得到基于距离的奖励函数r1;
e)设定柔顺人机在接触任务中,执行器与目标接触的接触力在m-nN之内;
f)在距离身体距离为γ处设置虚拟接触面;
g)通过公式l=|P′z-Oz|计算得到是否接触到虚拟接触面的判定条件值l;
h)当l>γ时,判定执行器未接触到虚拟接触面,状态空间Fx,Fy,Fz均为0;
i)当0<l≤γ时,判定执行器接触到虚拟接触面,此时通过阻抗控制得到虚拟接触力Fv,Fv=(Fx′,Fy′,Fz′)T,Fx′为执行器的X轴方向上的虚拟接触力分力,Fy′为执行器的Y轴方向上的虚拟接触力分力,Fz′为执行器的Z轴方向上的虚拟接触力分力,T为转置,将Fx′、Fy′及Fz′分别等同于状态空间S中的Fx、Fy及Fz;
j)当执行器与身体发生接触时,真实接触力Fe≠0,此时停止对执行器的控制。
2.根据权利要求1所述的基于深度强化学习和阻抗控制的柔顺人机接触方法,其特征在于:步骤a)中通过柔顺人机中的视觉模块获得执行器的位置坐标{Px,Py,Pz}和目标部位在机械臂坐标系下的位置坐标{Ox,Oy,Oz}。
3.根据权利要求1所述的基于深度强化学习和阻抗控制的柔顺人机接触方法,其特征在于:步骤b)中通过公式A={ax,ay,az}建立动作空间,ax为执行器在机械臂坐标系下的X轴方向上的偏移量,ay为执行器在机械臂坐标系下的Y轴方向上的偏移量,az为执行器在机械臂坐标系下的Z轴方向上的偏移量。
5.根据权利要求1所述的基于深度强化学习和阻抗控制的柔顺人机接触方法,其特征在于:步骤e)中m取值为1,n的取值为7。
7.根据权利要求1所述的基于深度强化学习和阻抗控制的柔顺人机接触方法,其特征在于:步骤b)中深度强化学习算法为PPO-clip算法。
8.根据权利要求1所述的基于深度强化学习和阻抗控制的柔顺人机接触方法,其特征在于,还包括在步骤j)后执行步骤h):当真实接触力Fe大于nN时,立即停止执行器运行,并初始化机械臂。
9.根据权利要求1所述的基于深度强化学习和阻抗控制的柔顺人机接触方法,其特征在于:还包括利用奖励函数r训练深度强化学习算法。
10.根据权利要求9所述的基于深度强化学习和阻抗控制的柔顺人机接触方法,其特征在于:奖励函数r=r1+r2+r3+r4,式中当机械臂探索范围为时r2=0,如果机械臂探索范围不为时r2=-1,式中Xmin为执行器在机械臂坐标系的X轴方向上所能运行到达的最小值,Xmax为执行器在机械臂坐标系的X轴方向上所能运行到达的最大值,Ymin为执行器在机械臂坐标系的Y轴方向上所能运行到达的最小值,Ymax为执行器在机械臂坐标系的Y轴方向上所能运行到达的最大值,Zmin为执行器在机械臂坐标系的Z轴方向上所能运行到达的最小值,Zmax为执行器在机械臂坐标系的Z轴方向上所能运行到达的最大值;设置机械臂最大步数为1500步,当机械臂调整步数大于1500步时,r3=-1,停止运行,初始化机械臂;如果真实接触力Fe在Z轴方向上的分力在m-nN之间时,r4=1,如果真实接触力Fe在Z轴方向上的分力不在m-nN之间时,r4=-1。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210484043.6A CN114789444B (zh) | 2022-05-05 | 2022-05-05 | 一种基于深度强化学习和阻抗控制的柔顺人机接触方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210484043.6A CN114789444B (zh) | 2022-05-05 | 2022-05-05 | 一种基于深度强化学习和阻抗控制的柔顺人机接触方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114789444A true CN114789444A (zh) | 2022-07-26 |
CN114789444B CN114789444B (zh) | 2022-12-16 |
Family
ID=82462197
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210484043.6A Active CN114789444B (zh) | 2022-05-05 | 2022-05-05 | 一种基于深度强化学习和阻抗控制的柔顺人机接触方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114789444B (zh) |
Citations (25)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013054629A (ja) * | 2011-09-06 | 2013-03-21 | Honda Motor Co Ltd | 制御装置及び方法 |
CN105291102A (zh) * | 2009-12-17 | 2016-02-03 | 库卡机器人有限公司 | 用于控制机械手的方法和装置 |
CN105583824A (zh) * | 2016-01-26 | 2016-05-18 | 清华大学 | 力控牵引和摆位的多自由度机械臂控制装置及其控制方法 |
CN106483964A (zh) * | 2015-08-31 | 2017-03-08 | 中南大学 | 一种基于接触力观测器的机器人柔顺控制方法 |
CN107263435A (zh) * | 2016-03-30 | 2017-10-20 | 发那科株式会社 | 人协动型的机器人*** |
US20180107174A1 (en) * | 2016-10-19 | 2018-04-19 | Fanuc Corporation | Human collaborative robot system having improved external force detection accuracy by machine learning |
CN108052004A (zh) * | 2017-12-06 | 2018-05-18 | 湖北工业大学 | 基于深度增强学习的工业机械臂自动控制方法 |
CN108153153A (zh) * | 2017-12-19 | 2018-06-12 | 哈尔滨工程大学 | 一种学习变阻抗控制***及控制方法 |
JP2019020826A (ja) * | 2017-07-12 | 2019-02-07 | 国立大学法人九州大学 | 力制御装置、力制御方法及び力制御プログラム |
JP2019018340A (ja) * | 2017-07-20 | 2019-02-07 | キヤノン株式会社 | 作業用ロボット、作業用ロボットの制御方法 |
CN111290269A (zh) * | 2020-02-11 | 2020-06-16 | 西北工业大学深圳研究院 | 一种空间机器人的自适应柔顺稳定控制方法 |
CN111716361A (zh) * | 2020-07-03 | 2020-09-29 | 深圳市优必选科技股份有限公司 | 机器人控制方法、装置和面-面接触模型构建方法 |
CN111975746A (zh) * | 2019-05-24 | 2020-11-24 | 精工爱普生株式会社 | 机器人的控制方法 |
WO2020239181A1 (en) * | 2019-05-29 | 2020-12-03 | Universal Robots A/S | Detection of change in contact between robot arm and an object |
CN112506044A (zh) * | 2020-09-10 | 2021-03-16 | 上海交通大学 | 一种基于视觉反馈和强化学习的柔性臂控制与规划方法 |
KR20210065738A (ko) * | 2019-11-27 | 2021-06-04 | 한국생산기술연구원 | 강화학습을 이용한 7축 로봇 제어 방법 |
CN112894809A (zh) * | 2021-01-18 | 2021-06-04 | 华中科技大学 | 一种基于强化学习的阻抗控制器设计方法和*** |
CN112975977A (zh) * | 2021-03-05 | 2021-06-18 | 西北大学 | 一种高效的机械臂抓取深度强化学习奖励训练方法及*** |
CN113134839A (zh) * | 2021-04-26 | 2021-07-20 | 湘潭大学 | 一种基于视觉和力位图像学习的机器人精密柔性装配方法 |
CN113319857A (zh) * | 2021-08-03 | 2021-08-31 | 季华实验室 | 机械臂力位混合控制方法、装置、电子设备及存储介质 |
CN113427483A (zh) * | 2021-05-19 | 2021-09-24 | 广州中国科学院先进技术研究所 | 一种基于强化学习的双机器人力/位多元数据驱动方法 |
CN113635297A (zh) * | 2021-07-05 | 2021-11-12 | 武汉库柏特科技有限公司 | 一种基于刚度检测的机器人自适应力接触控制方法及*** |
CN113967909A (zh) * | 2021-09-13 | 2022-01-25 | 中国人民解放军军事科学院国防科技创新研究院 | 基于方向奖励的机械臂智能控制方法 |
CN114131617A (zh) * | 2021-12-30 | 2022-03-04 | 华中科技大学 | 一种工业机器人的智能柔顺控制方法和装置 |
WO2022054947A1 (ja) * | 2020-09-14 | 2022-03-17 | 株式会社アイシン | ロボット装置およびその制御方法 |
-
2022
- 2022-05-05 CN CN202210484043.6A patent/CN114789444B/zh active Active
Patent Citations (25)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105291102A (zh) * | 2009-12-17 | 2016-02-03 | 库卡机器人有限公司 | 用于控制机械手的方法和装置 |
JP2013054629A (ja) * | 2011-09-06 | 2013-03-21 | Honda Motor Co Ltd | 制御装置及び方法 |
CN106483964A (zh) * | 2015-08-31 | 2017-03-08 | 中南大学 | 一种基于接触力观测器的机器人柔顺控制方法 |
CN105583824A (zh) * | 2016-01-26 | 2016-05-18 | 清华大学 | 力控牵引和摆位的多自由度机械臂控制装置及其控制方法 |
CN107263435A (zh) * | 2016-03-30 | 2017-10-20 | 发那科株式会社 | 人协动型的机器人*** |
US20180107174A1 (en) * | 2016-10-19 | 2018-04-19 | Fanuc Corporation | Human collaborative robot system having improved external force detection accuracy by machine learning |
JP2019020826A (ja) * | 2017-07-12 | 2019-02-07 | 国立大学法人九州大学 | 力制御装置、力制御方法及び力制御プログラム |
JP2019018340A (ja) * | 2017-07-20 | 2019-02-07 | キヤノン株式会社 | 作業用ロボット、作業用ロボットの制御方法 |
CN108052004A (zh) * | 2017-12-06 | 2018-05-18 | 湖北工业大学 | 基于深度增强学习的工业机械臂自动控制方法 |
CN108153153A (zh) * | 2017-12-19 | 2018-06-12 | 哈尔滨工程大学 | 一种学习变阻抗控制***及控制方法 |
CN111975746A (zh) * | 2019-05-24 | 2020-11-24 | 精工爱普生株式会社 | 机器人的控制方法 |
WO2020239181A1 (en) * | 2019-05-29 | 2020-12-03 | Universal Robots A/S | Detection of change in contact between robot arm and an object |
KR20210065738A (ko) * | 2019-11-27 | 2021-06-04 | 한국생산기술연구원 | 강화학습을 이용한 7축 로봇 제어 방법 |
CN111290269A (zh) * | 2020-02-11 | 2020-06-16 | 西北工业大学深圳研究院 | 一种空间机器人的自适应柔顺稳定控制方法 |
CN111716361A (zh) * | 2020-07-03 | 2020-09-29 | 深圳市优必选科技股份有限公司 | 机器人控制方法、装置和面-面接触模型构建方法 |
CN112506044A (zh) * | 2020-09-10 | 2021-03-16 | 上海交通大学 | 一种基于视觉反馈和强化学习的柔性臂控制与规划方法 |
WO2022054947A1 (ja) * | 2020-09-14 | 2022-03-17 | 株式会社アイシン | ロボット装置およびその制御方法 |
CN112894809A (zh) * | 2021-01-18 | 2021-06-04 | 华中科技大学 | 一种基于强化学习的阻抗控制器设计方法和*** |
CN112975977A (zh) * | 2021-03-05 | 2021-06-18 | 西北大学 | 一种高效的机械臂抓取深度强化学习奖励训练方法及*** |
CN113134839A (zh) * | 2021-04-26 | 2021-07-20 | 湘潭大学 | 一种基于视觉和力位图像学习的机器人精密柔性装配方法 |
CN113427483A (zh) * | 2021-05-19 | 2021-09-24 | 广州中国科学院先进技术研究所 | 一种基于强化学习的双机器人力/位多元数据驱动方法 |
CN113635297A (zh) * | 2021-07-05 | 2021-11-12 | 武汉库柏特科技有限公司 | 一种基于刚度检测的机器人自适应力接触控制方法及*** |
CN113319857A (zh) * | 2021-08-03 | 2021-08-31 | 季华实验室 | 机械臂力位混合控制方法、装置、电子设备及存储介质 |
CN113967909A (zh) * | 2021-09-13 | 2022-01-25 | 中国人民解放军军事科学院国防科技创新研究院 | 基于方向奖励的机械臂智能控制方法 |
CN114131617A (zh) * | 2021-12-30 | 2022-03-04 | 华中科技大学 | 一种工业机器人的智能柔顺控制方法和装置 |
Non-Patent Citations (2)
Title |
---|
文闻等: "基于深度强化学习的空间机械臂柔顺捕获控制方法研究", 《空间控制技术与应用》 * |
杜志江等: "基于模糊强化学习的微创外科手术机械臂人机交互方法", 《机器人 ROBOT》 * |
Also Published As
Publication number | Publication date |
---|---|
CN114789444B (zh) | 2022-12-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111660306B (zh) | 一种基于操作者舒适度的机器人可变导纳控制方法及*** | |
CN108241339B (zh) | 仿人机械臂的运动求解和构型控制方法 | |
US20170348858A1 (en) | Multiaxial motion control device and method, in particular control device and method for a robot arm | |
CN108422421B (zh) | 骨骼肌肉式机器人的肌肉控制和装配方法 | |
CN112631128B (zh) | 一种多模异构信息融合的机器人装配技能学习方法及*** | |
CN108927801B (zh) | 一种机械臂末端姿态调整方法及装置 | |
Zeng et al. | Encoding multiple sensor data for robotic learning skills from multimodal demonstration | |
CN108427282A (zh) | 一种基于示教学习的机器人逆运动学求解方法 | |
CN114516060A (zh) | 用于控制机器人装置的设备和方法 | |
CN111208730B (zh) | 一种快速终端滑模阻抗控制算法 | |
CN115686193A (zh) | 一种增强现实环境下虚拟模型三维手势操纵方法及*** | |
CN116587275A (zh) | 基于深度强化学习的机械臂智能阻抗控制方法及*** | |
CN114310888B (zh) | 一种协作机器人可变刚度运动技能学习与调控方法及*** | |
CN114789444B (zh) | 一种基于深度强化学习和阻抗控制的柔顺人机接触方法 | |
Li et al. | Skill learning for robotic insertion based on one-shot demonstration and reinforcement learning | |
Lee et al. | Physical human robot interaction in imitation learning | |
CN109940636A (zh) | 一种用于商业表演的人形机器人 | |
CN116175286A (zh) | 一种基于dmp的复杂曲面打磨轨迹规划方法 | |
CN111546035B (zh) | 一种基于学习与预测的齿轮在线快速装配方法 | |
CN112077841B (zh) | 一种提升机器人手臂操纵精度的多关节联动方法及*** | |
CN113967909A (zh) | 基于方向奖励的机械臂智能控制方法 | |
CN110919650A (zh) | 一种基于svm的低延时抓取遥操作*** | |
CN110703792A (zh) | 基于增强学习的水下机器人姿态控制方法 | |
CN114905514B (zh) | 一种用于外肢体抓握控制的人体技能学习方法及*** | |
CN113601498B (zh) | 基于权重分配的机器人视觉伺服与人机交互混合操控方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |