CN116476067A

CN116476067A - 机器人运动控制方法、设备及介质

Info

Publication number: CN116476067A
Application number: CN202310505885.XA
Authority: CN
Inventors: 徐升; 徐天添; 李冬; 黄晨阳; 吴新宇
Original assignee: Shenzhen Institute of Advanced Technology of CAS
Current assignee: Shenzhen Institute of Advanced Technology of CAS
Priority date: 2023-05-06
Filing date: 2023-05-06
Publication date: 2023-07-25

Abstract

本发明公开了一种机器人运动控制方法、设备及介质，其方法包括：确定机器人的目标点位置、目标运动路径和目标模态；根据所述目标点位置、目标运动路径和目标模态，并基于预先训练好的控制器对机器人进行点到点运动控制，控制器是基于宽度学习算法的控制器建模并进行控制器模型训练得到。本发明避免了复杂的重复调参过程，降低了对使用人员的专业性需求。

Description

机器人运动控制方法、设备及介质

技术领域

本发明涉及机器人控制技术领域，尤其涉及一种机器人运动控制方法、设备及介质。

背景技术

智能机器人现已广泛的用于包括工程制造、医疗以及微操作等多个领域。在常见的智能机器人运用中，机器人经常需要以特定的姿态完成复杂路径的运动。例如，在抛光作业中，机器人需要保证特定的姿态并完成多种复杂的运动，从而达成工件表面所需的光滑度。与此同时，机器人有时还需要避开一些不需要抛光的位置，这又涉及到了路径规划和姿态控制。这种已知目标点位置和起始点位置，需要控制机器人在满足特定条件的情况下从起始点运动到目标点的控制过程被称为点到点运动控制。

现有的部分点到点运动控制方法中，一种方法是使用基于预编程的理论计算方法针对机械臂进行点到点运动控制。该方法根据预先知道的路径，使用复杂的计算公式设计机器人在路径中多个特征位置的速度和加速度，从而实现了点到点的平滑控制，减少了机械臂运动过程中的振动。但这种方法需要针对不同的路径进行重复的计算，更多适用于路径单一重复的流水线工作。

另一种方法是使用闭环控制***实现移动机器人在动态环境中的自主导航。该方法使机器人能够自主实现类人导航行为，提高了机器人导航的安全性和效率。但该方法基于闭环控制，包含复杂的运动建模和控制器参数调整过程，且该方案在运动控制之外还需要额外设计路径规划算法，增加了整体设计的复杂性，并增加了对使用人员的专业性需求。

发明内容

本发明实施例的主要目的在于提供一种机器人运动控制方法、设备及介质，旨在实现对机器人运动控制中避免复杂的重复调参过程，降低对使用人员的专业性需求。

为实现上述目的，本发明实施例提供一种机器人运动控制方法，所述方法包括：

确定机器人的目标点位置、目标运动路径和目标模态；

根据所述目标点位置、目标运动路径和目标模态，并基于预先训练好的控制器对所述机器人进行点到点运动控制，所述控制器是基于宽度学习算法的控制器建模并进行控制器模型训练得到。

可选地，所述根据所述目标点位置、目标运动路径和目标模态，并基于预先训练好的控制器对所述机器人进行点到点运动控制的步骤包括：

根据所述目标运动路径和目标模态并基于预先训练好的控制器，计算目标控制率；

通过低阶***执行所述目标控制率，并计算所述机器人的当前位置和姿态；

重复上述步骤，计算下一个时间点所述机器人的位置和姿态，直到所述目标点位置；

基于计算得到的机器人的位置和姿态，对所述机器人进行点到点运动控制。

可选地，所述确定机器人的目标点位置、目标运动路径和目标模态的步骤之前还包括：

基于宽度学习算法进行控制器建模并对控制器模型进行训练得到训练好的控制器。

可选地，所述机器人的控制***包括：高阶动力控制***和低阶控制***，所述基于宽度学习算法进行控制器建模并对控制器模型进行训练得到训练好的控制器的步骤包括：

对机器人的运动过程进行示教和采样，得到示教数据；

通过高阶动力控制***使用宽度学习算法对控制器进行建模，得到控制器模型，以及对低阶控制***的非线性关系使用超限学习机进行拟合，并通过整合得到控制***的样本控制率；

基于所述样本控制率分析并推导***稳定性约束；

将所述示教数据及***稳定性约束导入所述控制器模型，并基于宽度学习算法、所述样本控制率以及结合优化函数求解来训练所述控制器模型，获得控制器最终各个参数，得到训练好的控制器。

可选地，所述对机器人的运动过程进行示教和采样，得到示教数据的步骤包括：

基于不同的满意性能指标，使用多个调整完备的样本控制器控制所述机器人完成同一种运动路径和模态；

记录每个取样时间下所述机器人的位置、速度、姿态和磁场数据；

针对不同的运动路径和模态重复上述两个步骤，采集得到示教数据。

可选地，所述通过高阶动力控制***使用宽度学习算法对控制器进行建模，得到控制器模型，以及对低阶控制***的非线性关系使用超限学习机进行拟合，并通过整合得到控制***的样本控制率的步骤包括：

通过高阶动力控制***使用宽度学习算法对控制器进行建模，得到控制器模型，并计算得到高阶***控制率；

对低阶控制***的非线性关系使用超限学习机进行拟合，得到低阶***控制率；

将所述高阶***控制率和低阶***控制率合并构成完整的控制***的样本控制率。

可选地，所述将所述示教数据及***稳定性约束导入所述控制器模型，并基于宽度学习算法、所述样本控制率以及结合优化函数求解来训练所述控制器模型，获得控制器最终各个参数，得到训练好的控制器的步骤中包括：

在宽度学习算法中通过李亚普诺夫理论求解控制器参数的限制条件。

可选地，所述控制器模型针对高阶动力***满足以下条件：在控制率的控制下，机器人需要在达到指定位置的同时满足指定的姿态；在点到点的运动过程中，机器人的运动需要满足特定的运动轨迹或特定的运动姿态。

可选地，所述方法还包括：

通过实时在线更新的方式，添加新的示教数据对控制器模型进行更新，得到应对不同需求的控制器。

本发明实施例还提出一种机器人控制设备，所述机器人控制设备包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述计算机程序被所述处理器执行时实现如上所述的机器人运动控制方法。

本发明实施例还提出一种计算机可读存储介质，所述计算机可读存储介质上存储有计算机程序，所述计算机程序被处理器执行时实现如上所述的机器人运动控制方法。

本发明实施例提出的一种机器人运动控制方法、设备及介质，通过确定机器人的目标点位置、目标运动路径和目标模态；根据所述目标点位置、目标运动路径和目标模态，并基于预先训练好的控制器对所述机器人进行点到点运动控制，所述控制器是基于宽度学习算法的控制器建模并进行控制器模型训练得到。本发明方案使用基于宽度学习的算法，一方面解决了预编程方法对于不同路径需要重新设计的缺点，另一方面也使得使用者在面对不同的需求时只需要手动控制机器人按照需求运动，从而收集示教数据，并通过实时在线更新的方式就可以更新出应对不同需求的控制器。据此，本发明方法避免了复杂的重复调参过程，降低了对使用人员的专业性需求，而且提高了运动控制的准确性。

相比现有技术，本发明使用的宽度学习算法具有支持在线模型更新的特点，因此，对于新添加的示教数据，本发明并不需要重新训练控制器，而是通过添加节点的方式直接获得同时具备原有控制器特点和新添加示教数据特点的控制器。这种方法非常适合解决微型机器人运动控制和运动路径的多变性，可以避免控制器的频繁调整。在保证一定精度的同时，具有快速、简洁、支持增量式在线模型更新的优点。因此，将宽度学习方法应用于微型机器人点到点运动控制问题时，可以实时快捷添加新的训练数据，从而避免对于控制器频繁的重训练。

附图说明

图1为本发明机器人运动控制装置所属设备的功能模块示意图；

图2为本发明机器人运动控制方法一实施例的流程示意图；

图3为本发明机器人运动控制方法另一实施例的流程示意图；

图4为本发明实施例中包含了高阶***和低阶***的***总图；

图5为本发明机器人运动控制方法实施例中基于宽度学习算法进行控制器建模并对控制器模型进行训练得到训练好的控制器的细化流程示意图；

图6为本发明实施例基于宽度学习算法的运动控制示意图；

图7为本发明机器人运动控制装置一实施例的功能模块示意图。

本发明目的的实现、功能特点及优点将结合实施例，参照附图做进一步说明。

具体实施方式

应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。

本发明实施例的主要解决方案是：通过确定机器人的目标点位置、目标运动路径和目标模态；根据所述目标点位置、目标运动路径和目标模态，并基于预先训练好的控制器对所述机器人进行点到点运动控制，所述控制器是基于宽度学习算法的控制器建模并进行控制器模型训练得到。本发明方案使用基于宽度学习的算法，一方面解决了预编程方法对于不同路径需要重新设计的缺点，另一方面也使得使用者在面对不同的需求时只需要手动控制机器人按照需求运动，从而收集示教数据，并通过实时在线更新的方式就可以更新出应对不同需求的控制器。据此，本发明方法避免了复杂的重复调参过程，降低了对使用人员的专业性需求。

本发明实施例考虑到：现有的点到点运动控制方法大致可分为三类。其中：

第一类方法，是通过预先编程来控制机器人进行特定路径的运动控制。这种方法一方面难以实时的做出修正和调整，另一方面无法实现复杂路径的运动控制，因为运动控制指令和机器人运动行为之间往往存在很强的非线性关系，仅依靠预编程的方法容易在路径复杂时产生很大的误差。

第二类方法，是通过经典的控制技术实现，如PID、模糊、滑模控制等。使用这种方法来实现机器人的点到点运动控制往往需要先对机器人的运动和驱动器之间的非线性关系进行建模，因此这类方法往往需要复杂的过程来确定控制器参数。与此同时，基于这种方式构建的控制器对于机器人运动和驱动器的动力学建模十分敏感，这进一步增加了确定控制器参数的难度。另一方面，使用这种方法还需要同时对点到点的运动轨迹进行单独的轨迹跟踪算法设计，这无疑也增加了机器人点到点运动控制的复杂程度。最后，针对本发明涉及的微型机器人控制领域，机器人的期望状态值会频繁的改变，因此控制器参数也需要频繁的随之调整，这对于没有控制***相关专业知识的使用者来说很难实现。

第三类方法，是通过示教学习来解决轨迹跟踪问题。示教学习方法提供了非专业人士调整控制器的解决方案，但现有的应用在微型机器人轨迹控制上的示教学习方法还存在以下几个问题。首先，一部分学习算法，例如超限学习机(Extreme Learning Machine,ELM)，在训练过程完成的情况下难以直接添加新的示教数据。对于微型机器人控制问题这种需要频繁调整控制参数和控制路径的问题，每一次添加新的示教数据都需要重新对控制器进行训练。其次，使用宽度学习算法(Broad Learning System,BLS)可以实现在不重新训练的基础上添加新的训练数据，但这种方法目前还没有应用在微型机器人点到点运动控制领域。

由此，本发明实施例提出一种解决方案，通过对人类示教的多种不同的点到点运功轨迹进行采样，从而建立一个基于数据驱动的控制模型用以控制微型机器人进行满足特定条件(例如轨迹或姿态)的点到点运动。本发明首次将宽度学习算法引入微型机器人点到点运动控制，并同时对高阶***和低阶***进行基于学习算法的建模。该方法拥有相对灵活的结构，在保证一定精度的同时，具有快速、简洁、支持增量式在线模型更新的优点。因此，将宽度学习算法应用于微型机器人点到点运动控制问题时，可以实时快捷添加新的训练数据，从而避免对于控制器频繁的重训练。

本发明主要解决微型机器人点到点运动控制中的两个难点。(1)针对给定的目标点，机器人需要在抵达目标点的同时满足特定的姿态要求。(2)机器人在抵达目标点的过程中，需要经过特殊的路径(例如避障)或满足特定的姿态。在解决上述两个问题的同时，本发明的方法还需具备足够的泛化性能，从而针对不同的微型机器人和驱动器均能通过学习算法得到足以解决上述两个难点的控制率。

本发明所提的控制器设计方法，无需专业控制或编程知识，使用者只需对机器人进行运动控制示教便可获得具有示教性能的控制器，适用于工业界人士。

此外，本发明提出的机器人点到点运动控制方法是一种通用的模仿学习方法，适用于任何一种点到点运动控制问题。

具体地，参照图1，图1是本发明机器人运动控制装置所属设备的功能模块示意图。该机器人运动控制装置可以为独立于设备的、能够数据处理的装置，其可以通过硬件或软件的形式承载于设备上。该设备可以为手机、平板电脑等具有数据处理功能的智能移动终端，还可以为具有数据处理功能的固定终端设备或服务器等。

在本实施例中，该机器人运动控制装置所属设备至少包括输出模块110、处理器120、存储器130以及通信模块140。

存储器130中存储有操作***以及机器人运动控制程序；输出模块110可为显示屏等。通信模块140可以包括WIFI模块、移动通信模块以及蓝牙模块等，通过通信模块140与外部设备或服务器进行通信。

其中，存储器130中的机器人运动控制程序被处理器执行时实现以下步骤：

确定机器人的目标点位置、目标运动路径和目标模态；

进一步地，存储器130中的机器人运动控制程序被处理器执行时还实现以下步骤：

对机器人的运动过程进行示教和采样，得到示教数据；

基于所述样本控制率分析并推导***稳定性约束；

本实施例通过上述方案，具体通过确定机器人的目标点位置、目标运动路径和目标模态；根据所述目标点位置、目标运动路径和目标模态，并基于预先训练好的控制器对所述机器人进行点到点运动控制，所述控制器是基于宽度学习算法的控制器建模并进行控制器模型训练得到。本发明方案使用基于宽度学习的算法，一方面解决了预编程方法对于不同路径需要重新设计的缺点，另一方面也使得使用者在面对不同的需求时只需要手动控制机器人按照需求运动，从而收集示教数据，并通过实时在线更新的方式就可以更新出应对不同需求的控制器。据此，本发明方法避免了复杂的重复调参过程，降低了对使用人员的专业性需求。

基于上述设备架构但不限于上述架构，提出本发明方法实施例。

本实施例方法的执行主体可以是一种机器人运动控制装置，也可以是一种机器人运动控制设备或服务器，本实施例以机器人运动控制装置进行举例，该机器人运动控制装置可以集成在具有数据处理功能的智能手机、平板电脑等终端设备上，还可以集成在固定终端或服务器上。

参照图2，图2为本发明机器人运动控制方法第一实施例的流程示意图。本实施例机器人运动控制方法主要应用于对微型机器人的点到点运动控制，该方法包括：

步骤S101，确定机器人的目标点位置、目标运动路径和目标模态；

本实施例预先基于宽度学习算法进行控制器建模及控制器模型训练得到控制器的最终各个参数，训练完成得到的控制器用于对机器人当前进行点到点运动控制。

其中，控制器模型训练使用的样本数据为预先采集的示教数据，该示教数据包括机器人完成的不同运动路径和模态，进一步还可以包括：机器人完成不同的运动路径和模态时在不同采样点的位置、速度、姿态和磁场数据等。

其中，作为一种实施方式，模态可以包括运动模式或者运动方式，以及姿态(比如运动过程中机器人和水平线的夹角)、速度、加速度等。

其中，通过模型训练完成的控制器，在后续应用中，只需要输入机器人的目标点位置、目标运动路径和目标模态到控制器中，计算得到当前的目标控制率，进而在计算得到的目标控制率下，控制机器人当前的点到点运动。

在本实施例中，机器人的目标点位置、目标运动路径和目标模态的确定方式可以根据当前实际需要进行选择或设置，本实施例对此不做具体限定。

其中，本实施例通过对人类示教的多种不同的点到点运功轨迹进行采样，从而建立一个基于数据驱动的控制模型用以控制微型机器人进行满足特定条件(例如轨迹或姿态)的点到点运动。

本实施例预先基于宽度学习算法进行控制器建模及控制器模型训练得到控制器的最终各个参数，首次将宽度学习算法引入微型机器人点到点运动控制，该方法拥有相对灵活的结构，在保证一定精度的同时，具有快速、简洁、支持增量式在线模型更新的优点。因此，将宽度学习算法应用于微型机器人点到点运动控制问题时，可以实时快捷添加新的训练数据，从而避免对于控制器频繁的重训练，也避免了复杂的重复调参过程，降低了对使用人员的专业性需求。

步骤S102，根据所述目标运动路径和目标模态，并基于预先训练好的控制器对所述机器人进行点到点运动控制，所述控制器是基于宽度学习算法的控制器建模并进行控制器模型训练得到。

本实施例针对不同的运动轨迹和模态训练有对应的控制器。

在确定好机器人的目标点位置、目标运动路径和目标模态后，将机器人的目标点位置、目标运动路径和目标模态输入到对应训练好的控制器中，计算得到机器人当前的目标控制率，进而在计算得到的目标控制率下，对机器人当前进行点到点运动控制。

具体地，作为一种实施方式，所述根据所述目标点位置、目标运动路径和目标模态，并基于预先训练好的控制器对所述机器人进行点到点运动控制的步骤可以包括：

重复上述两个步骤，计算下一个时间点所述机器人的位置和姿态，直到所述目标点位置；

通过本实施例方案，确定机器人的目标点位置、目标运动路径和目标模态；根据所述目标点位置、目标运动路径和目标模态，并基于预先训练好的控制器对所述机器人进行点到点运动控制，所述控制器是基于宽度学习算法的控制器建模并进行控制器模型训练得到。本发明方案使用基于宽度学习的算法，一方面解决了预编程方法对于不同路径需要重新设计的缺点，另一方面也使得使用者在面对不同的需求时只需要手动控制机器人按照需求运动，从而收集示教数据，并通过实时在线更新的方式就可以更新出应对不同需求的控制器。据此，本发明方法避免了复杂的重复调参过程，降低了对使用人员的专业性需求。

如图3所示，本发明另一实施例提出一种机器人运动控制方法，基于上述图2所示的实施例，本实施例中，在上述步骤S101，确定机器人的目标点位置、目标运动路径和目标模态之前还包括：

步骤S100，基于宽度学习算法进行控制器建模并对控制器模型进行训练得到训练好的控制器。

在本实施例中，主要通过预先采集的示教数据，结合对高阶***和低阶***进行基于宽度学习算法的控制器建模并对控制器模型进行训练得到训练好的控制器。

如前所述，示教学习方法提供了非专业人士调整控制器的解决方案，但现有的应用在微型机器人轨迹控制上的示教学习方法还存在以下几个问题。首先，一部分学习算法，例如超限学习机，在训练过程完成的情况下难以直接添加新的示教数据。对于微型机器人控制问题这种需要频繁调整控制参数和控制路径的问题，每一次添加新的示教数据都需要重新对控制器进行训练。其次，使用宽度学习算法可以实现在不重新训练的基础上添加新的训练数据，但这种方法目前还没有应用在微型机器人点到点运动控制领域。

由此，本发明实施例提出一种解决方案，通过对人类示教的多种不同的点到点运功轨迹进行采样，从而建立一个基于数据驱动的控制模型用以控制微型机器人进行满足特定条件(例如轨迹或姿态)的点到点运动。

本实施例方案涉及的点到点运动控制同时考虑高阶动力控制***(以下简称高阶***)和低阶控制***。

因此，作为一种实施方式，本实施例中机器人的控制***包括：高阶动力控制***和低阶控制***，如图4所示，图4为包含了高阶***和低阶***的***总图。

其中，高阶***为动力控制***，低阶***为执行机构控制***。

在高阶***中，基于宽度学习算法进行控制器建模，并结合采集的示教数据和高阶运动控制算法进行控制器模型训练，计算控制率方程中所需的速度或加速度等参数，其中，在宽度学习算法中引入增强算法性能的特殊限制条件。同时对低阶***的非线性关系使用超限学习机进行拟合，控制率同时考虑高阶***和低阶***，将两者合并构成完整的控制率。

在低阶***中，对高阶***输入的参数进行指令转换，获得对应的力、力矩或其他参数，由机器人执行机构执行，并通过测量传感器测量机器人当前的位置和姿态等，最终完成对机器人的点到点运动控制。

本实施例提出的基于宽度学习算法进行控制器建模并对控制器模型进行训练以实现机器人轨迹追踪控制的技术方案，主要包括以下几个步骤：步骤一，示教数据准备，即对机器人的运动过程进行示教和采样。步骤二，控制器训练，即使用宽度学习算法对控制器进行建模，同时对低阶***的非线性关系使用超限学习机进行拟合，将两者合并构成完整的控制率。步骤三，分析并推导***稳定性约束。步骤四，将示教数据及稳定性约束导入控制器模型，并进行学习算法训练获得控制器最终各个参数，后续即可将训练获得的控制器应用于微型机器人点到点运动控制***。

具体地，如图5所示，本实施例基于宽度学习算法进行控制器建模并对控制器模型进行训练得到训练好的控制器的步骤可以包括：

步骤S1001，对机器人的运动过程进行示教和采样，得到示教数据；

具体地，作为一种实施方式，对于示教数据的收集，首先，可以基于不同的满意性能指标，使用多个调整完备的样本控制器控制所述机器人完成同一种运动路径和模态。

然后，记录每个取样时间下所述机器人的位置、速度、姿态和磁场数据同时预处理这些数据。

然后，针对不同的运动路径和模态重复上述两个步骤，采集得到示教数据。

步骤S1002，通过高阶动力控制***使用宽度学习算法对控制器进行建模，得到控制器模型，以及对低阶控制***的非线性关系使用超限学习机进行拟合，并通过整合得到控制***的样本控制率；

具体地，作为一种实施方式，通过高阶***使用宽度学习算法对控制器进行建模，得到控制器模型，并计算得到高阶***控制率，同时对低阶控制***的非线性关系使用超限学习机进行拟合，得到低阶***控制率；

步骤S1003，基于所述样本控制率分析并推导***稳定性约束；

步骤S1004，将所述示教数据及***稳定性约束导入所述控制器模型，并基于宽度学习算法、所述样本控制率以及结合优化函数求解来训练所述控制器模型，获得控制器最终各个参数，得到训练好的控制器。

其中，针对不同的运动轨迹和模态重复上述步骤S1001-S1004，从而获得对应不同运动轨迹和模态的控制器。

其中，所述控制器模型针对高阶动力***满足以下条件：在控制率的控制下，机器人需要在达到指定位置的同时满足指定的姿态；在点到点的运动过程中，机器人的运动需要满足特定的运动轨迹或特定的运动姿态。

此外，在训练控制器模型的宽度学习算法中通过李亚普诺夫理论求解控制器参数的限制条件。

本实施例技术方案，基于宽度学习算法的点到点运动控制方法，并可将方法应用在微型机器人***中。该控制率同时考虑到了高阶***和低阶***，且具备宽度学习的众多优点，诸如结构简单，不需要针对新的示教数据重训练等。此外，李亚普诺夫理论被巧妙地结合在宽度学习算法中用以求解控制器参数的限制条件，并最终获得不仅具备示教数据的特性，而且具备很强的普遍化及误差收敛性能的点到点运动控制器。

以下结合图4及图6，对本实施例基于宽度学习算法进行控制器建模并对控制器模型进行训练得到训练好的控制器的算法原理进行详细阐述，其中，图6为基于宽度学习算法的运动控制示意图。

如图6所示，本实施例基于宽度学习算法的运动控制算法包括控制器训练部分和应用控制器对机器人进行控制的闭环控制***。

本实施例涉及的算法原理包括：

(1)对于点到点运动控制问题的建模

如图4所示，本实施例涉及的点到点运动控制同时考虑高阶动力控制***(以下简称高阶***)和低阶微型机器人控制***(以下简称低阶***)。

针对高阶***，点到点运动控制可拆解为两个部分：(1)在控制率的控制下，机器人需要在达到指定位置的同时满足指定的姿态。(2)在点到点的运动过程中，机器人的运动需要满足特定条件，例如，满足特定的运动轨迹或特定的运动姿态。针对上述两个要求，高阶运动控制的模型可以描述如下：

其中，ζ,θ分别表示机器人运动的位置和姿态，和/>分别表示位置和姿态的速度和加速度，f₁(·),f₂(·),f₃(·)表示三种不同的非线性模型。在点到点的运动控制问题中，定义唯一的终点为/>因此，当机器人的初始位置不为0时，控制指令应该是合适的速度和加速度使机器人运动并停止在目标位置。

其中，点到点运动控制所适用的低阶机器人控制***可包含多种不同的类型，在本实施例中以微型机器人磁控***进行举例。

微型机器人的运动控制包含两个方面：

其一是外部磁场模型。针对磁控常用的震荡磁场，可以用φ_B,n_P两个参数定义磁场模型。其中φ_B表示磁场震荡的夹角，n_p表示磁场震荡的中轴线方向向量。

其二是微型机器人自身对于外接磁场的响应，这部分主要由微型机器人自身的大小、尺寸和充磁情况决定，因此一旦微型机器人制作完毕这部分的控制响应将会固定。

综上所述，针对低阶微型机器人磁控***的控制率可以表达为：

其中u表示低阶***的控制率，f(·)表示低阶***的非线性方程，s(·)表示由机器人本身的特性(尺寸、磁化等)决定的控制率和最终速度之间的非线性关系。

(2)对于基于宽度学习算法的控制率设计

结合图6所示，本实施例采用基于宽度学习(broad learning system,BLS)的方法对点到点运动设计控制算法。***输入设计为c＝ζ^T,θ^T]^T，基于宽度学习算法和运动控制模型，兼顾高阶和低阶***的控制率方程如下：

/>

进一步定义：

h_j＝(r_jz_j+_j) ()

N＝J ()

其中，φ(·)和g(·)为激活函数，在本实施例中选择sigmoid函数作为激活函数，因此激活函数可以表示为：

通过上述控制率方程和相关定义，Z＝[z₁,z₂,…,z_N]为宽度学习神经网络的特征节点，H＝[h₁,h₂,…,h_J]为加强节点，ω_i,k_j分别为特征节点和加强节点的输出权重，a_i,r_j,b_i,p_j是随机生成的参数，分别为特征节点和加强节点的输入权重和偏置。因为本***的输入c＝ζ^T,θ^T]^T，可将a_i拆分成分别对应ζ,θ。据此，控制率方程可以进一步改写为：

式(11)中的各参数获取方式如下。a_i,r_j,b_i,p_j是随机生成的参数，ω_i,k_j可通过训练过程获取。在进行训练之前需要获取示教数据，针对不同的低阶***可采用人工控制或非线性控制器等方法控制机器人按照需求的路线运动。相同的运动路线将重复多次，最终可以采集多组机器人运动控制的输入数据c^o和输出数据u^o，上标o用于表示示教数据。在获取了足够多的示教数据后，可以通过如下优化函数来完成训练过程：

最终，使用常见的计算软件，如Matlab，求解上述优化问题，即可得到ω_i,k_j。

(3)对于控制***稳定性分析

首先，假设低阶***不会突然失控，设计的核心集中在高阶***控制率的稳定性分析。为了使用式(11)的控制率方程，***本身的稳定性需要保障。可以选用常见的李雅普诺夫稳定性方法。基于该方法，定义***的状态量c＝[ζ；θ]，该状态量会全局渐进稳定于c^*＝[ζ^*；θ^*]＝0。连续且连续可导的李雅普诺夫候选函数(LCF)，V(c)应当满足：

V(c^*)＝0(13c)

根据李雅普诺夫理论，可以设计满足式(13)的LCF并据此推导***的稳定限制。这里设计LCF如下：

接下来，对LCF求导，可以得到：

结合式(5)和式(4)，可以进一步推得：

将式(15)代入式(14)，求得：

下一步，选择超限学习机(ELM)算法对s(·)进行建模：

将式(17)代入式(14)，并使用中值定理改写，可以获得：

其中，φ(0)＝0，φ′(λ_l)是或/>的梯度。接下来，把式(5)中的控制率代入式(18)，可以得到：

基于中值定理，并定义φ(0)＝g(0)＝0，对式(19)进一步改写可以得到：

其中，φ′(κ_i),g′(η_j)分别是(或者/>和η_j∈(0,r_jz_j+p_j)(或者η_j∈(r_jz_j+p_j,0))的梯度。为了简化式(20)，对其中的一些参数做如下赋值：

n_l＝0 (21a)

b_i＝0,orb_j＝0 (21b)

p_j＝0 (21c)

将式(21)代入式(20)，可以得到简化的LCF：

根据式(13b)，可以推导稳定性成立的宽松限制条件：

n_l＝0 (23a)

b_i＝0,orb_j＝0 (23b)

p_j＝0 (23c)

/>

这里的符号＜0表示矩阵为负定矩阵。因为本实施例中选取激活函数(式(9，10))的斜率永远大于零，且L＝N＝J。据此，可以推导稳定性成立的严格约束条件：

n_l＝0 (24a)

b_i＝0 (24b)

p_j＝0 (24c)

基于上述的推导，稳定的控制器和学习算法设计可以表达为一个优化问题：

其中，i,j,l＝1,2,…,N，且满足以下约束：

n_l＝0 (26a)

b_i＝0 (26b)

p_j＝0 (26c)

上述优化问题可以通过使用Matlab中的fmincon函数在训练过程中求解。

本实施例通过上述方案，设计了一种基于宽度学习算法的控制器，并同时考虑到了高阶***和低阶***，同时对高阶***和低阶***进行基于学习算法的建模。这方法拥有相对灵活的结构，在保证一定精度的同时，具有快速、简洁、支持增量式在线模型更新的优点。因此，将宽度学习方法应用于微型机器人点到点运动控制问题时，可以实时快捷添加新的训练数据，从而避免对于控制器频繁的重训练。

此外，本实施例方法，将稳定性问题考虑其中，通过严格的稳定性计算，得到了保证控制稳定性的限制条件。而且通过学习微型机器人多种不同路径和姿态的运动特性，使学习算法得到的结果获得泛化能力，可以针对不同的机器人和点到点运动控制要求完成运动控制。

进一步地，所述方法还包括：

通过实时在线更新的方式，添加新的示教数据对控制器模型进行更新，得到应对不同需求的控制器。因此，本方案设计的控制器具备在线更新的能力，可以在不重新训练的前提下添加新的示教数据。

此外，本发明实施例经过仿真计算和实验测试，证明了控制算法稳定有效。

相比现有技术，本实施例提出的方法具有如下优点：

1，通过对人类示教的多种不同的点到点运功轨迹进行采样，从而建立一个基于数据驱动的控制模型用以控制微型机器人进行满足特定条件(例如轨迹或姿态)的点到点运动。

2、本发明实施例解决了微型机器人点到点运动控制中的两个难点。(1)针对给定的目标点，机器人需要在抵达目标点的同时满足特定的姿态要求。(2)机器人在抵达目标点的过程中，需要经过特殊的路径(例如避障)或满足特定的姿态。在解决上述两个问题的同时，本发明的方法还具备足够的泛化性能，从而针对不同的微型机器人和驱动器均能通过学习算法得到足以解决上述两个难点的控制率。

3，本发明实施例所提出的控制器设计方法，适用于任何一种点到点运动控制问题。无需专业控制或编程知识，使用者只需对机器人进行运动控制示教便可获得具有示教性能的控制器，适用于工业界人士。

4、本发明实施例使用的宽度学习算法具有支持在线模型更新的特点，因此，对于新添加的示教数据，本发明并不需要重新训练控制器，而是通过添加节点的方式直接获得同时具备原有控制器特点和新添加示教数据特点的控制器。这种方法非常适合解决微型机器人运动控制和运动路径的多变性，可以避免控制器的频繁调整。

因此，本发明实施例使用了基于宽度学习的算法，一方面解决了预编程方法对于不同路径需要重新设计的缺点。另一方面也使得使用者在面对不同的需求时只需要手动控制机器人按照需求运动，从而收集示教数据，并通过实时在线更新的方式就可以更新出应对不同需求的控制器。据此，本方法避免了复杂的重复调参过程，降低了对使用人员的专业性需求。

结合图6所示，在实际应用中，可以采用本发明实施例提出的基于宽度学习算法的运动控制方法，结合上述各公式，具体实现步骤包括：

步骤1：示教数据准备流程

1.1，示教数据收集。基于不同的满意性能指标，使用多个调整完备的样本控制器控制微型机器人完成同一种运动路径和模态。

1.2，记录每个取样时间下的位置、速度、姿态和磁场数据作为输入和输出，同时预处理数据。

1.3，针对不同的运动路径和模态重复上述两个步骤，采集示教数据。

步骤2：运动控制器训练过程

2.1，使用针对一种运动路径和模态的一组示教数据训练控制器。使用拟合的方式求解基于超限学习机的函数s(·)，从而求得h_l,m_l,n_l。

2.2，求解式(25)，(26)中的带有限制的优化问题。其中h_l,m_l,n_l为已知，求解w_i,a_i,k_j,r_j；

2.3，基于b_i＝0,p_j＝0，求解式(25)的优化问题。

2.4，确定式(5)所示的控制率的参数。

2.5，针对不同的运动轨迹和模态重复上述步骤(2.1)-(2.4)，从而获得对应不同运动轨迹和模态的控制器。参照图6中控制器训练部分。

步骤3：使用合适的运动轨迹和模态完成点到点运动控制。

3.1，定义目标点位置，并选择合适的运动路径和模态。

3.2，针对选定的运动路径和模态并基于式(3)中训练完成的f(ζ,θ)，计算式(6)的控制率。

3.3，由低阶***执行上述步骤的控制率，并通过测量传感器测量机器人当前的位置和姿态。

3.4，回到步骤3的(3.1)，重复流程计算下一个时间点的状态。最终完成对机器人的点到点运动控制，参照图6中闭环控制***部分。

此外，参照图6所示控制器训练部分的节点布局方式，本实施例使用的宽度学习算法具有支持在线模型更新的特点，对于新添加的示教数据，并不需要重新训练控制器，而是通过添加节点的方式直接获得同时具备原有控制器特点和新添加示教数据特点的控制器。这种方法非常适合解决微型机器人运动控制和运动路径的多变性，可以避免控制器的频繁调整。在保证一定精度的同时，具有快速、简洁、支持增量式在线模型更新的优点。因此，将宽度学习方法应用于微型机器人点到点运动控制问题时，可以实时快捷添加新的训练数据，从而避免对于控制器频繁的重训练。

此外，如图7所示，本发明实施例还提出一种机器人运动控制装置，所述装置包括：

确定模块，用于确定机器人的目标点位置、目标运动路径和目标模态；

控制模块，用于根据所述目标点位置、目标运动路径和目标模态，并基于预先训练好的控制器对所述机器人进行点到点运动控制，所述控制器是基于宽度学习算法的控制器建模并进行控制器模型训练得到。

本实施例实现机器人运动控制的原理及实施过程，请参照上述各实施例，在此不再赘述。

此外，本发明实施例还提出一种机器人控制设备，所述机器人控制设备包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述计算机程序被所述处理器执行时实现如上实施例的机器人运动控制方法。

由于本机器人运动控制程序被处理器执行时，采用了前述所有实施例的全部技术方案，因此至少具有前述所有实施例的全部技术方案所带来的所有有益效果，在此不再一一赘述。

此外，本发明实施例还提出一种计算机可读存储介质，所述计算机可读存储介质上存储有计算机程序，所述计算机程序被处理器执行时实现如上实施例所述的机器人运动控制方法。

本发明实施例提出的一种机器人运动控制方法、设备及介质，通过确定机器人的目标点位置、目标运动路径和目标模态；根据所述目标点位置、目标运动路径和目标模态，并基于预先训练好的控制器对所述机器人进行点到点运动控制，所述控制器是基于宽度学习算法的控制器建模并进行控制器模型训练得到。本发明方案使用基于宽度学习的算法，一方面解决了预编程方法对于不同路径需要重新设计的缺点，另一方面也使得使用者在面对不同的需求时只需要手动控制机器人按照需求运动，从而收集示教数据，并通过实时在线更新的方式就可以更新出应对不同需求的控制器。据此，本发明方法避免了复杂的重复调参过程，降低了对使用人员的专业性需求。

需要说明的是，在本文中，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者方法不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者方法所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括该要素的过程、方法、物品或者方法中还存在另外的相同要素。

上述本发明实施例序号仅仅为了描述，不代表实施例的优劣。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在如上的一个存储介质(如ROM/RAM、磁碟、光盘)中，包括若干指令用以使得一台终端设备(可以是手机，计算机，服务器，被控终端，或者网络设备等)执行本发明每个实施例的方法。

以上仅为本发明的优选实施例，并非因此限制本发明的专利范围，凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换，或直接或间接运用在其他相关的技术领域，均同理包括在本发明的专利保护范围内。

Claims

1.一种机器人运动控制方法，其特征在于，所述方法包括：

确定机器人的目标点位置、目标运动路径和目标模态；

2.根据权利要求1所述的方法，其特征在于，所述根据所述目标点位置、目标运动路径和目标模态，并基于预先训练好的控制器对所述机器人进行点到点运动控制的步骤包括：

执行所述目标控制率，并计算所述机器人的当前位置和姿态；

3.根据权利要求1所述的方法，其特征在于，所述确定机器人的目标点位置、目标运动路径和目标模态的步骤之前还包括：

4.根据权利要求3所述的方法，其特征在于，所述机器人的控制***包括：高阶动力控制***和低阶控制***，所述基于宽度学习算法进行控制器建模并对控制器模型进行训练得到训练好的控制器的步骤包括：

对机器人的运动过程进行示教和采样，得到示教数据；

基于所述样本控制率分析并推导***稳定性约束；

5.根据权利要求4所述的方法，其特征在于，所述对机器人的运动过程进行示教和采样，得到示教数据的步骤包括：

6.根据权利要求4所述的方法，其特征在于，所述通过高阶动力控制***使用宽度学习算法对控制器进行建模，得到控制器模型，以及对低阶控制***的非线性关系使用超限学习机进行拟合，并通过整合得到控制***的样本控制率的步骤包括：

7.根据权利要求4所述的方法，其特征在于，所述将所述示教数据及***稳定性约束导入所述控制器模型，并基于宽度学习算法、所述样本控制率以及结合优化函数求解来训练所述控制器模型，获得控制器最终各个参数，得到训练好的控制器的步骤中包括：

8.根据权利要求4所述的方法，其特征在于，所述控制器模型针对高阶动力***满足以下条件：在控制率的控制下，机器人需要在达到指定位置的同时满足指定的姿态；在点到点的运动过程中，机器人的运动需要满足特定的运动轨迹或特定的运动姿态。

9.根据权利要求4-8中任一项所述的方法，其特征在于，所述方法还包括：

通过实时在线更新的方式，添加新的示教数据对所述控制器模型进行更新，得到应对不同需求的控制器。

10.一种机器人控制设备，其特征在于，所述机器人控制设备包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述计算机程序被所述处理器执行时实现如权利要求1-9中任一项所述的机器人运动控制方法。

11.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质上存储有计算机程序，所述计算机程序被处理器执行时实现如权利要求1-9中任一项所述的机器人运动控制方法。