CN114103926A

CN114103926A - 混合动力履带车辆速度与能量协同优化方法、介质、设备

Info

Publication number: CN114103926A
Application number: CN202111495143.0A
Authority: CN
Inventors: 项昌乐; 郭凌雄; 刘洋; 刘辉; 韩立金; 徐丽丽
Original assignee: Beijing Institute of Technology BIT
Current assignee: Beijing Institute of Technology BIT
Priority date: 2021-12-08
Filing date: 2021-12-08
Publication date: 2022-03-01

Abstract

本发明属于车辆协同优化驾驶技术领域，公开了一种混合动力履带车辆速度与能量协同优化方法、介质、设备，包括：设计一种坐标变换方法将原有既定轨迹的GPS坐标转换为车辆局部坐标系坐标，以方便之后的算法应用；构建混动履带车辆速度与能量协同优化模型；利用强化学习方法，充分考虑跟踪误差与能耗，以减少车辆对路径跟随过程中可能出现的滑转、侧移、过度转向等行为，实现混动履带车辆路径跟随过程中速度与能量的协同优化。本发明通过优化履带车两侧履带运行速度序列进而改善车辆在路径跟随过程中的滑转、滑移、过度转向等行为，从而实现履带车辆速度与能量的协同优化。

Description

混合动力履带车辆速度与能量协同优化方法、介质、设备

技术领域

本发明属于车辆协同优化驾驶技术领域，尤其涉及一种混合动力履带车辆速度与能量协同优化方法、介质、设备。

背景技术

目前，结合速度规划的能量管理技术不断发展，尝试通过优化混动车辆运行速度曲线以提高车辆能源利用率，即面向混动车辆的生态驾驶技术，这可以显着降低车辆的能耗。现阶段，相关技术通常采用分层优化的方法，通常将控制器分层分为两层：1)车辆层(也称为外层)，目标车辆根据特定的驾驶环境自主规划车辆速度；2)动力总成层(内层)，基于规划的速度曲线实现各动力模块间的最优能量分配。分层优化虽然可以降低控制过程中的计算成本，但是优化过程中没有很好地处理车速与扭矩分配之间的耦合关系，无法实现速度规划和扭矩分配的协同优化。而美国能源部相关研究表明：如果可以同时优化车辆级和动力***级控制，则可以预期更多的燃料节省。因此如何实现速度规划与能量管理的协同是亟需考虑的一大难点。

当前关于如何实现速度规划和能源管理的协同优化以进一步促进混动车辆节能的研究仍较少，且研究对象主要集中于民用轮式车辆方面，面向履带车辆的协同优化问题亟待解决。基于阿克曼转向的民用轮式车辆转向过程通常视为无能量损耗，因此现有方案通常将速度和能量协同优化问题解耦为纵向速度规划与转向跟踪控制两个问题，从而简化问题难度实现有效应用。然而，与基于阿克曼转向的民用轮式车辆不同，履带车辆采用速差转向，转向功率消耗在整体能量消耗中难以忽略，因此在协同优化过程中除了考虑车辆的纵向特性，还需要协调考虑车辆的横向动力学特性，这些都对现有技术提出了更高的挑战。

通过上述分析，现有技术存在的问题及缺陷为：现有技术方案主要集中于民用轮式车辆，通常将速度与能量的协同优化问题简单解耦为纵向速度规划和转向跟踪两个维度实现，无法适用于采用速差转向的履带车辆。而现有面向履带车辆的跟踪技术中通常未考虑轨迹跟踪时的能量优化问题，导致车辆在路径跟随过程中产生不必要的能量损耗，无法实现履带车辆速度与能量的协同优化严重影响车辆的燃油经济性，在跟踪时不考虑能耗，导致的结果就是车辆的不必要的能量损耗大，燃油经济性差，从而导致资源浪费。。

解决以上问题及缺陷的难度为：需综合考虑履带车辆动力学与传动***能量流动特性，涉及参数多且各参数耦合性强，所构建优化问题自由度多，求解难度较大。

解决以上问题及缺陷的意义为：使得混合动力履带车辆在保证一定精度的路径跟随前提下，能够充分考虑跟踪时的能量损耗，达到高精度跟踪与高节能跟踪的权衡最优。

发明内容

针对现有技术存在的问题，本发明提供了一种混合动力履带车辆速度与能量协同优化方法。

本发明是这样实现的，一种混合动力履带车辆速度与能量协同优化方法，所述混合动力履带车辆速度与能量协同优化方法，包括：

步骤一，设计一种坐标变换方法将原有既定轨迹的GPS坐标转换为车辆局部坐标系坐标，以方便之后的算法应用；将GPS采集的数据转化为便于算法应用的数据。

步骤二，构建混动履带车辆速度与能量协同优化模型；构建高精度的包含混动履带车辆动力学及能量流动特性的模型，为后续控制算法的设计提供被控对象。

步骤三，利用强化学习方法，充分考虑跟踪误差与能耗，以减少车辆对路径跟随过程中可能出现的滑转、侧移、过度转向等行为，实现混动履带车辆路径跟随过程中速度与能量的协同优化。解决混动履带车辆路径跟随过程中速度与能量的协同优化问题。

进一步，所述步骤一中，将原有既定轨迹的GPS坐标转换为车辆局部坐标系坐标，具体过程为：

GPS经纬度—二维平面坐标系—车辆局部坐标系的坐标变换，首先对路径的GPS坐标通过高斯-克吕格投影法进行转化，将路径的GPS经纬度坐标信息进行处理，得到对应的二维平面坐标信息，完成GPS经纬度向二维平面坐标系的坐标变换。

进一步，所述GPS经纬度—二维平面坐标系—车辆局部坐标系的坐标变换，具体为：

设XOY为二维平面坐标系，X^*O^*Y^*为局部坐标系，

为局部坐标系原点在二维平面坐标系下的坐标；A点在二维平面坐标系下的坐标为(x_A,y_A),转化到局部坐标系后坐标为(x_A ^*,y_A ^*)；局部坐标系相对二维平面坐标系的旋转角度为φ，以逆时针方向旋转为正，则A的平面坐标转换可表示如下：

在路径跟踪问题中，局部坐标系的原点固定于无人履带车形心，且车头方向为局部坐标系X^*轴正向，则公式(1)中

和

表征车辆在全局价值系中实际位置与目标位置的误差，(x′,y′)即为车辆局部坐标系下的误差，将二维平面坐标系下的误差转换到车辆局部坐标系下，方便对车辆进行踪迹跟踪控制。

进一步，所述步骤二中，构建混动履带车辆速度与能量协同优化模型，包括：车辆运动学建模、动力学建模以及能量管理模型。

进一步，所述车辆运动学建模具体为：

履带车辆的运动动力学建模相对复杂，纵向动力学中阻力包括滚动阻力F_g、上坡阻力F_p和空气阻力F_w，三者可以分别计算得到并计算总阻力F_r，如下：

式中，θ'为坡度，C_d为空气阻力系数，A为迎风面积；

履带车辆的动力学建模考虑了履带滑转滑移的影响，首先基于整车动力学方程分别在直驶方向和旋转方向基于式建立数学模型；由于计算履带接地面的细节，会使模型的计算量急剧上升，因此将整个接触面的滑转滑移效果集中到两个履带的中心；

直线行驶方向：

式中，m和I_z分别表示履带车的整备质量和航向转动惯量，v和

分别表示履带车形心位置的速度和加速度；

为地面附着系数，F_N为地面给履带车辆的支持力，此处等于车重；F_t为地面所能提供的最大附着力，当F_drive≤F_t时车辆不发生滑转；F₁和F₂分别表示两侧驱动电机提供的轮边驱动力，T₁和T₂分别表示两侧电机的输出转矩、i₀表示轮边传动比、r是驱动轮半径，η_T是电机轴到履带的效率，

即为车辆行驶时的纵向需求功率；

旋转方向：

其中，f₁和f₂则分别表示左、右侧履带的滚动阻力，f表示两侧履带的滚阻系数；B表示两侧履带中心距，M_veh为履带车转向阻力矩，g为重力加速度，L为履带接地长度，

为车辆转弯所需的转向功率；

为转向阻力系数，其取值与履带车行驶的地面类型和转向半径有关，可用如下经验公式计算得到：

式中，

表示履带车最大转向阻力系数，由履带车行驶路面特性决定，不同路面类型最大转向阻力系数可查表得到；R表示履带车转向半径，转向半径计算公式如下所示：

式中，v_i和v_o分别代表转向时内外侧履带的速度；

综上，车辆运行的总需求功率P_dem等于纵向行驶所需功率

和转向所需功率

之和，由两侧电机提供。

进一步，所述履带车辆跟踪过程运动学建模：

根据履带车的运动过程，其运动状态方程可表示如下：

式中，x，y，θ分别表示履带车形心在大地坐标系中的坐标及相对与大地坐标系的转角；

根据两侧履带速度可得到车辆形心线速度和旋转角速度：

初始时刻车辆位于全局坐标系原点，经过时间t后其位于全局坐标系(x,y)处，并用P(x,y,θ)表征；设所需跟踪目标的位置在全局坐标系下表示为P_target(x_target,y_target,θ_target)，利用公式(1)可得，则无人履带车路径跟踪误差可以表示为：

将公式(7)代入平面坐标转换公式(1)，将路径跟踪误差转换至车辆局部坐标系下：

所涉及的路径跟踪问题本质上为优化问题，因此将参考路径上最接近车辆当前位置的点位设为跟踪目标点，以计算跟踪误差，从而减少计算量；由于X_veh方向是车辆坐标系中车辆的前进方向，因此路径跟踪误差定义为横向误差与角度误差之和，即：

进一步，所述能量管理模型构建，具体为：

使用串联混动履带车辆模型，车辆行驶所需功率由发动机-发电机组和输出功率共同提供；

EGS中发电机的输出电压和电磁转矩关系可表示为：

其中，U_g和I_g是发电机的输出电压和电流，w_g和T_g是发电机转速和转矩；K_e和K_x是电动势系数和电阻系数；根据转矩平衡，EGS中发动机和发电机间动态关系满足：

其中，J_e和J_g分别是发动机和发电机的转动惯量；另外，发动机耗油率表达为发动机转矩以及转速的查表函数，

电池模块由一阶内阻模型表示，如下

其中，R_bat和V_oc分别是电池内阻及开路电压；I_bat是电池电流，当放电时为正值，充电时为负值；Q_bat是电池电容，η_bat是电池的充放电效率，P_bat是电池输出功率；sign(I_bat)是sign函数，其取值可以表示为

由于EGS、电池和驱动电机控制器都与总线电相连，因此三者电压相等；因此，动力总成的功率分布满足以下关系：

其中，P_dem是车辆行驶的需求功率，P_g即为发电机输出功率，根据动力学模型介绍可知，包括直行功率以及转向功率。

进一步，所述步骤三中，应用深度确定性策略梯度算法构建并求解协同优化问题，分为两个阶段，即离线学习与在线应用；

离线学***横坐标x_error，车辆距预瞄点的二维数值纵坐标y_error，转角

车辆行驶速度v，车辆转弯速度w用于表征轨迹跟随中车辆运行状态，发动机转速n_e和电池SOC用于表征混合动力***状态，将上述状态选取为DDPG状态变量，即

由于状态s_t七个参数的取值范围差异较大，不利于网络训练，因此需对所选状态参数进行归一化处理，将其统一转换至取值区间[0,1]或[-1,1]；同理，选取转向内侧电机转矩T_i以及外侧电机转矩T_o，发动机转矩T_e作为DDPG算法动作变量，即a_t＝{T_i,T_o,T_e}；此外，DDPG算法反馈奖励包含4个主要项：跟踪误差、能量损耗、滑转约束、侧移约束，以保证车辆轨迹跟随过程中燃油经济性与车辆稳定性的权衡最优，最终实现轨迹跟随过程中车辆速度与能量的协同优化；因此DDPG算法中反馈奖励设置为

其中κ和λ为极大值，相当于在训练时对v0和F_drive进行约束，前者防止车辆滑转造成不必要的能量损耗，后者保证车辆转向中不发生侧移，保证车辆行驶稳定性；将所选取的状态变量、动作变量、反馈奖励输入嵌入了混动履带车速度规划模型的DDPG算法，训练DDPG内部的策略网络与评价网络直至算法收敛；

由于所涉及***较为复杂，为提高算法训练及执行效率，采用一种并行式架构对其进行训练；首先将工作站中可用的CPU内核按适当比例分配给MATLAB并行工作器，这些工作器包含两类：仿真工作器以及学习工作器；每个学习工作器都有一份代理参数的副本，包括DDPG算法及其内部网络的参数，而每个工作器不仅有代理参数副本还包含所构建的速度规划模型；在算法每次迭代时，工作器运行仿真模型并将计算所获取的状态s_t、动作a_t、奖励r_t以及网络权重参数存入数据缓存区，于此同时，每个学习器同步于数据缓存区检索并提取前一次迭代的相关数据，从而计算并更新网络权重系数；最后将学习器计算得到的网络参数传入模拟器，进行下一次的迭代计算，循环往复，直至达到预设的迭代次数；

在线应用阶段：将全局路径信息、初始状态变量

作为训练后的DDPG算法的输入，获取最优的动作变量，即最优控制变量，最后将最优控制变量序列输入所构建的混动履带车速度规划模型中进行状态迭代更新，从而获取履带车辆两侧的最优速度序列，由于履带车辆的直行、转向等车辆行为皆通过左右侧履带速度差控制，因此通过优化履带车两侧履带运行速度序列进而改善车辆在路径跟随过程中的滑转、滑移、过度转向等行为，从而实现履带车辆速度与能量的协同优化。

本发明的另一目的在于提供一种接收用户输入程序存储介质，所存储的计算机程序使电子设备执行所述混合动力履带车辆速度与能量协同优化方法包括下列步骤：

步骤一，设计一种坐标变换方法将原有既定轨迹的GPS坐标转换为车辆局部坐标系坐标，以方便之后的算法应用；

步骤二，构建混动履带车辆速度与能量协同优化模型；

步骤三，利用强化学习方法，充分考虑跟踪误差与能耗，以减少车辆对路径跟随过程中可能出现的滑转、侧移、过度转向等行为，实现混动履带车辆路径跟随过程中速度与能量的协同优化。

本发明的另一目的在于提供一种计算机设备，所述计算机设备包括存储器和处理器，所述存储器存储有计算机程序，所述计算机程序被所述处理器执行时，使得所述处理器执行所述混合动力履带车辆速度与能量协同优化方法的步骤。

结合上述的所有技术方案，本发明所具备的优点及积极效果为：本发明结合履带车辆速差转向特性，考虑车辆横纵向动力学及能量流动特性，通过优化履带车两侧履带运行速度序列进而改善车辆在路径跟随过程中的滑转、滑移、过度转向等行为，从而实现履带车辆速度与能量的协同优化。

附图说明

图1是本发明实施例提供的混合动力履带车辆速度与能量协同优化方法的流程图。

图2是本发明实施例提供的平面坐标变换示意图。

图3是本发明实施例提供的履带车辆动力学原理图。

图4是本发明实施例提供的无人履带车路径跟踪示意图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白，以下结合实施例，对本发明进行进一步详细说明。应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。

针对现有技术存在的问题，本发明提供了一种混合动力履带车辆速度与能量协同优化方法、介质、设备，下面结合附图对本发明作详细的描述。

本发明提供的混合动力履带车辆速度与能量协同优化方法业内的普通技术人员还可以采用其他的步骤实施，图1的本发明提供的混合动力履带车辆速度与能量协同优化方法仅仅是一个具体实施例而已。

如图1所示，本发明实施例提供的混合动力履带车辆速度与能量协同优化方法，包括：

S101：设计一种坐标变换方法将原有既定轨迹的GPS坐标转换为车辆局部坐标系坐标，以方便之后的算法应用。

S102：构建混动履带车辆速度与能量协同优化模型。

S103：利用强化学习方法，充分考虑跟踪误差与能耗，以减少车辆对路径跟随过程中可能出现的滑转、侧移、过度转向等行为，实现混动履带车辆路径跟随过程中速度与能量的协同优化。

本发明实施例提供的S101中，将原有既定轨迹的GPS坐标转换为车辆局部坐标系坐标，具体过程为：

在此基础上，采用如图2所示坐标变化方案实现二维平面坐标系向以履带车辆形心为原点的车辆局部坐标系的变换。

具体方案如图2所示：XOY为二维平面坐标系，X^*O^*Y^*为局部坐标系，

为局部坐标系原点在二维平面坐标系下的坐标。A点在二维平面坐标系下的坐标为(x_A,y_A),转化到局部坐标系后坐标为(x_A ^*,y_A ^*)。局部坐标系相对二维平面坐标系的旋转角度为φ，以逆时针方向旋转为正，则A的平面坐标转换可表示如下：

和

表征车辆在全局价值系中实际位置与目标位置的误差，(x′,y′)即为车辆局部坐标系下的误差，将二维平面坐标系下的误差转换到车辆局部坐标系下更为方便对车辆进行踪迹跟踪控制。

本发明实施例提供的S102中，构建混动履带车辆速度与能量协同优化模型，包括：车辆运动学建模、动力学建模以及能量管理模型。

经简化后的履带车辆二维平面车辆动力学原理如图3所示。履带车辆的运动动力学建模相对复杂，纵向动力学中阻力主要包括了滚动阻力F_g、上坡阻力F_p和空气阻力F_w，三者可以分别计算得到并计算总阻力F_r，如下：

式中，θ'为坡度，C_d为空气阻力系数，A为迎风面积。

履带车辆的动力学建模考虑了履带滑转滑移的影响，首先基于整车动力学方程分别在直驶方向和旋转方向基于式建立数学模型。由于计算履带接地面的细节，会使模型的计算量急剧上升，因此将整个接触面的滑转滑移效果集中到两个履带的中心。

直线行驶方向：

分别表示履带车形心位置的速度和加速度。

为地面附着系数，F_N为地面给履带车辆的支持力，此处等于车重。F_t为地面所能提供的最大附着力，当F_drive≤F_t时车辆不发生滑转。F₁和F₂分别表示两侧驱动电机提供的轮边驱动力，T₁和T₂分别表示两侧电机的输出转矩、i₀表示轮边传动比、r是驱动轮半径，η_T是电机轴到履带的效率，

即为车辆行驶时的纵向需求功率。

旋转方向：

其中，f₁和f₂则分别表示左、右侧履带的滚动阻力，f表示两侧履带的滚阻系数。B表示两侧履带中心距。M_veh为履带车转向阻力矩，g为重力加速度，L为履带接地长度，

为车辆转弯所需的转向功率。

式中，

表示履带车最大转向阻力系数，由履带车行驶路面特性决定，不同路面类型最大转向阻力系数可查表得到。R表示履带车转向半径，根据图3所示，转向半径计算公式如下所示：

式中，v_i和v_o分别代表转向时内外侧履带的速度。

综上，车辆运行的总需求功率P_dem等于纵向行驶所需功率

和转向所需功率

之和，由两侧电机提供。

履带车辆跟踪过程运动学建模：

根据履带车的运动过程，其运动状态方程可表示如下：

式中，x，y，θ分别表示履带车形心在大地坐标系中的坐标及相对与大地坐标系的转角。

根据两侧履带速度可得到车辆形心线速度和旋转角速度：

图4为无人履带车的路径跟踪示意图，初始时刻车辆位于全局坐标系原点，经过时间t后其位于全局坐标系(x,y)处，并用P(x,y,θ)表征。设所需跟踪目标的位置在全局坐标系下表示为P_target(x_target,y_target,θ_target)，利用公式(1)可得，则无人履带车路径跟踪误差可以表示为：

所涉及的路径跟踪问题本质上为优化问题，因此将参考路径上最接近车辆当前位置的点位设为跟踪目标点，以计算跟踪误差，从而减少计算量。由于X_veh方向是车辆坐标系中车辆的前进方向，因此方案中路径跟踪误差定义为横向误差与角度误差之和，即：

能量管理模型构建

使用串联混动履带车辆模型，车辆行驶所需功率由发动机-发电机组(EGS)和输出功率共同提供。

EGS中发电机的输出电压和电磁转矩关系可表示为：

其中，U_g和I_g是发电机的输出电压和电流，w_g和T_g是发电机转速和转矩。K_e和K_x是电动势系数和电阻系数。根据转矩平衡，EGS中发动机和发电机间动态关系满足：

其中，J_e和J_g分别是发动机和发电机的转动惯量。另外，发动机耗油率表达为发动机转矩以及转速的查表函数，

电池模块由一阶内阻模型表示，如下

其中，R_bat和V_oc分别是电池内阻及开路电压。I_bat是电池电流,当放电时为正值，充电时为负值。Q_bat是电池电容，η_bat是电池的充放电效率，P_bat是电池输出功率。sign(I_bat)是sign函数，其取值可以表示为

由于EGS、电池和驱动电机控制器都与总线电相连，因此三者电压相等。因此，动力总成的功率分布满足以下关系：

本发明实施例提供的S103中，应用深度确定性策略梯度(Deep DeterministicPolicy Gradient,DDPG)算法构建并求解协同优化问题，分为两个阶段，即离线学习与在线应用。

由于状态s_t七个参数的取值范围差异较大，不利于网络训练，因此需对所选状态参数进行归一化处理，将其统一转换至取值区间[0,1]或[-1,1]。同理，选取转向内侧电机转矩T_i以及外侧电机转矩T_o，发动机转矩T_e作为DDPG算法动作变量，即a_t＝{T_i,T_o,T_e}。此外，DDPG算法反馈奖励包含4个主要项：跟踪误差、能量损耗、滑转约束、侧移约束，以保证车辆轨迹跟随过程中燃油经济性与车辆稳定性的权衡最优，最终实现轨迹跟随过程中车辆速度与能量的协同优化。因此DDPG算法中反馈奖励设置为

其中κ和λ为极大值，相当于在训练时对v0和F_drive进行约束，前者防止车辆滑转造成不必要的能量损耗，后者保证车辆转向中不发生侧移，保证车辆行驶稳定性。而后，将所选取的状态变量、动作变量、反馈奖励输入嵌入了混动履带车速度规划模型的DDPG算法，训练DDPG内部的策略网络(actornetwork)与评价网络(critic network)直至算法收敛。

由于所涉及***较为复杂，为提高算法训练及执行效率，采用一种并行式架构对其进行训练。首先将工作站中可用的CPU内核按适当比例分配给MATLAB并行工作器，这些工作器包含两类：仿真工作器以及学习工作器。每个学习工作器都有一份代理参数的副本，包括DDPG算法及其内部网络的参数，而每个工作器不仅有代理参数副本还包含所构建的速度规划模型。在算法每次迭代时，工作器运行仿真模型并将计算所获取的状态s_t、动作a_t、奖励r_t以及网络权重参数存入数据缓存区(data buffer)，于此同时，每个学习器同步于数据缓存区检索并提取前一次迭代的相关数据，从而计算并更新网络权重系数。最后将学习器计算得到的网络参数传入模拟器，进行下一次的迭代计算，循环往复，直至达到预设的迭代次数。

在线应用阶段：将全局路径信息(通过GPS信号转化的二维局部坐标)、初始状态变量

应当注意，本发明的实施方式可以通过硬件、软件或者软件和硬件的结合来实现。硬件部分可以利用专用逻辑来实现；软件部分可以存储在存储器中，由适当的指令执行***，例如微处理器或者专用设计硬件来执行。本领域的普通技术人员可以理解上述的设备和方法可以使用计算机可执行指令和/或包含在处理器控制代码中来实现，例如在诸如磁盘、CD或DVD-ROM的载体介质、诸如只读存储器(固件)的可编程的存储器或者诸如光学或电子信号载体的数据载体上提供了这样的代码。本发明的设备及其模块可以由诸如超大规模集成电路或门阵列、诸如逻辑芯片、晶体管等的半导体、或者诸如现场可编程门阵列、可编程逻辑设备等的可编程硬件设备的硬件电路实现，也可以用由各种类型的处理器执行的软件实现，也可以由上述硬件电路和软件的结合例如固件来实现。

以上所述，仅为本发明的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等，都应涵盖在本发明的保护范围之内。

Claims

1.一种混合动力履带车辆速度与能量协同优化方法，其特征在于，所述混合动力履带车辆速度与能量协同优化方法包括：

步骤一，采用坐标变换方法将原有既定轨迹的GPS坐标转换为车辆局部坐标系坐标；

步骤二，构建混动履带车辆速度与能量协同优化模型；

步骤三，利用强化学习方法，实现混动履带车辆路径跟随过程中速度与能量的协同优化。

2.如权利要求1所述的混合动力履带车辆速度与能量协同优化方法，其特征在于，所述步骤一中，将原有既定轨迹的GPS坐标转换为车辆局部坐标系坐标的具体过程为：GPS经纬度—二维平面坐标系—车辆局部坐标系的坐标变换，对路径的GPS坐标通过高斯-克吕格投影法进行转化，将路径的GPS经纬度坐标信息进行处理，得到对应的二维平面坐标信息，完成GPS经纬度向二维平面坐标系的坐标变换。

3.如权利要求2所述的混合动力履带车辆速度与能量协同优化方法，其特征在于，所述GPS经纬度—二维平面坐标系—车辆局部坐标系的坐标变换，具体为：XOY为二维平面坐标系，X^*O^*Y^*为局部坐标系，

为局部坐标系原点在二维平面坐标系下的坐标；A点在二维平面坐标系下的坐标为(x_A,y_A),转化到局部坐标系后坐标为(x_A ^*,y_A ^*)；局部坐标系相对二维平面坐标系的旋转角度为φ，以逆时针方向旋转为正，则A的平面坐标转换表示如下：

在路径跟踪问题中，局部坐标系的原点固定于无人履带车形心，且车头方向为局部坐标系X^*轴正向，则

和

表征车辆在全局价值系中实际位置与目标位置的误差，(x′,y′)为车辆局部坐标系下的误差。

4.如权利要求1所述的混合动力履带车辆速度与能量协同优化方法，其特征在于，所述步骤二中，构建混动履带车辆速度与能量协同优化模型，包括：车辆运动学建模、动力学建模以及能量管理模型。

5.如权利要求4所述的混合动力履带车辆速度与能量协同优化方法，其特征在于，所述车辆运动学建模具体为：履带车辆的运动动力学建模相对复杂，纵向动力学中阻力包括滚动阻力F_g、上坡阻力F_p和空气阻力F_w，分别计算得到并计算总阻力F_r，如下：

式中，θ'为坡度，C_d为空气阻力系数，A为迎风面积；

直线行驶方向：

式中，m和I_z分别表示履带车的整备质量和航向转动惯量，v和v.分别表示履带车形心位置的速度和加速度；

为车辆行驶时的纵向需求功率；

旋转方向：

为车辆转弯所需的转向功率；

为转向阻力系数，用经验公式计算得到：

式中，

表示履带车最大转向阻力系数，R表示履带车转向半径，转向半径计算公式：

式中，v_i和v_o分别代表转向时内外侧履带的速度；

车辆运行的总需求功率P_dem等于纵向行驶所需功率

和转向所需功率

之和，由两侧电机提供。

6.如权利要求4所述的混合动力履带车辆速度与能量协同优化方法，其特征在于，所述履带车辆跟踪过程运动学建模：根据履带车的运动过程，其运动状态方程表示如下：

根据两侧履带速度得到车辆形心线速度和旋转角速度：

初始时刻车辆位于全局坐标系原点，经过时间t后其位于全局坐标系(x,y)处，并用P(x,y,θ)表征；所需跟踪目标的位置在全局坐标系下表示为P_target(x_target,y_target,θ_target)，无人履带车路径跟踪误差表示为：

将路径跟踪误差转换至车辆局部坐标系下：

路径跟踪误差定义为横向误差与角度误差之和：

7.如权利要求4所述的混合动力履带车辆速度与能量协同优化方法，其特征在于，所述能量管理模型构建，具体为：使用串联混动履带车辆模型，车辆行驶所需功率由发动机-发电机组和输出功率共同提供；

EGS中发电机的输出电压和电磁转矩关系表示为：

其中，J_e和J_g分别是发动机和发电机的转动惯量；另外，发动机耗油率表达为发动机转矩以及转速的查表函数：

电池模块由一阶内阻模型表示：

其中，R_bat和V_oc分别是电池内阻及开路电压；I_bat是电池电流，当放电时为正值，充电时为负值；Q_bat是电池电容，η_bat是电池的充放电效率，P_bat是电池输出功率；sign(I_bat)是sign函数，取值表示为

由于EGS、电池和驱动电机控制器都与总线电相连，动力总成的功率分布满足以下关系：

其中，P_dem是车辆行驶的需求功率，P_g为发电机输出功率。

8.如权利要求1所述的混合动力履带车辆速度与能量协同优化方法，其特征在于，所述步骤三中，应用深度确定性策略梯度算法构建并求解协同优化问题，分为两个阶段，离线学习与在线应用；

车辆行驶速度v，车辆转弯速度w用于表征轨迹跟随中车辆运行状态，发动机转速n_e和电池SOC用于表征混合动力***状态，将状态选取为DDPG状态变量，

对所选状态参数进行归一化处理，统一转换至取值区间[0,1]或[-1,1]；同理，选取转向内侧电机转矩T_i以及外侧电机转矩T_o，发动机转矩T_e作为DDPG算法动作变量，a_t＝{T_i,T_o,T_e}；DDPG算法中反馈奖励设置为

其中κ和λ为极大值；

采用并行式架构进行训练；首先将工作站中可用的CPU内核按适当比例分配给MATLAB并行工作器，工作器包含两类：仿真工作器以及学习工作器；每个学习工作器都有一份代理参数的副本，包括DDPG算法及其内部网络的参数；在算法每次迭代时，工作器运行仿真模型并将计算所获取的状态s_t、动作a_t、奖励r_t以及网络权重参数存入数据缓存区；每个学习器同步于数据缓存区检索并提取前一次迭代的相关数据，计算并更新网络权重系数；最后将学习器计算得到的网络参数传入模拟器，进行下一次的迭代计算，循环往复，直至达到预设的迭代次数；

在线应用阶段：将全局路径信息、初始状态变量

作为训练后的DDPG算法的输入，获取最优的动作变量，最优控制变量，最后将最优控制变量序列输入所构建的混动履带车速度规划模型中进行状态迭代更新，获取履带车辆两侧的最优速度序列。

9.一种接收用户输入程序存储介质，所存储的计算机程序使电子设备执行权利要求1～8任意一项所述混合动力履带车辆速度与能量协同优化方法包括下列步骤：

步骤二，构建混动履带车辆速度与能量协同优化模型；

10.一种计算机设备，其特征在于，所述计算机设备包括存储器和处理器，所述存储器存储有计算机程序，所述计算机程序被所述处理器执行时，使得所述处理器执行权利要求1～8任意一项所述混合动力履带车辆速度与能量协同优化方法的步骤。