CN109376493B

CN109376493B - 一种粒子群优化的径向基神经网络车辆速度跟踪方法

Info

Publication number: CN109376493B
Application number: CN201811541341.4A
Authority: CN
Inventors: 尹智帅; 何嘉雄; 聂琳真
Original assignee: Wuhan University of Technology WUT
Current assignee: Wuhan University of Technology WUT
Priority date: 2018-12-17
Filing date: 2018-12-17
Publication date: 2023-02-03
Anticipated expiration: 2038-12-17
Also published as: CN109376493A

Abstract

本发明公开了一种粒子群优化的径向基神经网络车辆速度跟踪方法。本发明通过引擎模型、传动***模型、车辆模型、刹车模型构建汽车动力学模型；通过梯度下降法计算径向基神经网络模型的参数，PID控制器通过径向基神经网络模型自适应调整参数；通过粒子群优化算法离线优化，得到粒子群优化后的参数；将粒子群优化后的参数初始化赋值给径向基神经网络PID控制器；通过初始化后径向基神经网络PID控制器得到初始节气门开度或初始制动踏板位置，并输入到汽车动力学模型以计算实际跟踪车速；实际跟踪车速以及PID控制器输出输入到神经网络中，根据速度的反馈误差调整径向基神经网络和PID控制器的参数。本发明实现了安全和稳定的跟踪目标速度。

Description

一种粒子群优化的径向基神经网络车辆速度跟踪方法

技术领域

本发明属于自动驾驶汽车跟踪控制技术领域，尤其涉及一种粒子群优化的径向基神经网络车辆速度跟踪方法。

背景技术

车辆速度跟踪是自动驾驶领域的热点问题，由于车辆纵向运动的非线性、时变性和不确定性等特性，其速度跟踪也是自动驾驶车辆技术中的难点问题。目前国内外对该问题的研究较多，也提出了许多解决方法，这些方法包括:自适应巡航控制(ACC),PID控制、模糊控制、滑膜结构控制等。这些方法能够有效解决一些实际问题，但在应用于自动驾驶车辆在动态城市道路工况下的行驶时依然存在一些不足，如不能良好适应动态变化的复杂场景及参数不确定性等问题。王春蕾等采用单一的增量PID控制策略实现自动巡航，但研究发现自适应巡航控制(ACC)采用单一控制算法制作的控制器不能完美的实现所有的车辆工作模式，在某些行驶模式下控制效果非常理想，一旦切换到另一些模式时就会出现速度波动大、反映时间长、误差增大等控制品质明显下降的问题。Chien等采用PID纵向控制器，解决智能交通下的车辆纵向控制的实时性问题，但由于其控制参数通过试凑法获取，难以实现对智能纵向运动的最优控制。朱晓宏等建立汽车的动力学模型，采用模糊控制方法设计巡航控制器，运用自适应神经网络模糊推理***ANFIS设计车间距控制器并通过仿真手段进行优化工作，采用速度、车间距联合控制进行车列控制，由于引入神经网络带来了未知参数，参数随机试凑也难实现最优控制。郭景华等采用经典PID控制方法设计速度跟踪***的上位控制器，采用自适应模糊滑膜控制(AFLSMC)方法设计速度跟踪的下位控制器，滑模变结构控制器可提高***的动态响应能力，有效克服车辆非线性、参数不确定性及外界干扰等特性，但是由于其控制增益的不连续性可使控制***产生振荡或失稳。

车辆速度跟踪的复杂性在于：控制对象的非线性、时变性和不确定性；安全性和控制稳定性；神经网络由于其在线学习能力受到广泛的关注，由于其不依赖精确数学模型的控制特性，对于模型未知的复杂非线性***或是动态特性常变的控制对象两方面，具有无可比拟的优势，针对车辆速度跟踪的安全性以及稳定性问题，苑毅等提出了一种基于蚁群神经网络的PID控制器参数优化方法，能够取得较好的控制效果。改进的粒子群优化算法进行搜索用于位置控制的最佳PID增益，实现初始参数的智能选择。

发明内容

本发明的目的是解决传统的控制方法不能很好的自适应动态变化的复杂场景以及初始参数选择不当引起的超调和失稳问题，提供了一种高精度跟踪和稳定控制的车辆跟踪方法。

本发明基于背景技术的难点问题，提出了一种粒子群优化的径向基神经网络车辆速度跟踪方法，利用粒子群优化算法PSO实现初始参数的离线优化智能选择，径向基函数神经网络RBFNN与PID相结合实现参数在线自适应调整，达到较高的控制精度和稳定的跟踪控制效果。

本发明概述的技术方案实施步骤：

步骤1：通过引擎模型、传动***模型、车辆模型、刹车模型构建汽车动力学模型；

步骤2：建立径向基神经网络模型，通过梯度下降法计算径向基神经网络模型的参数，PID控制器通过径向基神经网络模型自适应调整参数以构建径向基神经网络PID控制器；

步骤3：通过粒子群优化算法离线优化，得到粒子群优化后的参数；

步骤4：将粒子群优化后的参数初始化赋值给径向基神经网络PID控制器；

步骤5：通过初始化后径向基神经网络PID控制器得到初始节气门开度或初始制动踏板位置，将初始节气门开度或初始制动踏板位置输入到汽车动力学模型以计算实际跟踪车速V(τ)，τ∈[0,T_MAX]，τ为仿真时间，T_MAX为仿真最大时间；

步骤6：实际跟踪车速V(τ)以及PID控制器输出得到τ-1时刻的A(τ-1)输入到神经网络中，根据速度的反馈误差调整径向基神经网络和PID控制器的参数，仿真时间τ增加时间步长并转至步骤5，循环执行，直到仿真时间τ达到仿真最大时间T_MAX。

作为优选，步骤1中所述引擎模型为：

其中，T_e(t)为t时刻的引擎的有效转矩，N_e(t)为t时刻的曲轴的转速，A_T(t)为t时刻的节气门的开度，T_i(t)为t时刻的曲轴换挡要求的叶轮转矩,I_e是引擎曲轴的转动惯量；

步骤1中所述传动***模型为：

其中，N_e(t)为t时刻的曲轴的转速，K(t)是t时刻的容量因子，T_i(t)为t时刻的曲轴换挡要求的叶轮转矩，T_q(t)是t时刻的液力变矩器的输出轴转矩，R_TQ(t)是t时刻的转矩因子，R_TR(t)是t时刻的变速器的传动比，T_o(t)是t时刻的自动变速器的输出轴转矩，η_t是自动变速器的效率，N_m(t)是t时刻的自动变速器输入轴旋转速度，N_o(t)是t时刻的自动变速器输出轴的旋转速度，N_w(t)是t时刻的车轮的转速，R_fd是主减速器传动比,K(t)和R_TQ(t)是由如下表达式确定的：

其中，f2是容量系数，f3是变矩率系数，N_m(t)为t时刻的自动变速器输入轴旋转速度，N_e(t)为t时刻的曲轴的转速；

步骤1中所述车辆模型为：

其中，I_v是转动惯量，

是t时刻的车轮的转速的导数，R_fd是主减速器传动比，T_o(t)是t时刻的自动变速器的输出轴转矩，T_load(t)是t时刻的负载的转矩，V(t)为t时刻的实际跟踪车速，r为车轮的半径，N_w(t)是t时刻的车轮的转速，R_load,0是摩擦阻力系数，R_load,2是空气动力学阻力系数，T_u(t)是t时刻的刹车的转矩；

步骤1中所述刹车模型为：

其中，r为车轮的半径，A_B(t)为t时刻的制动踏板的位置，T_u(t)为t时刻的刹车转矩；

作为优选，步骤2中所述建立径向基神经网络模型为：

径向基神经网络的输入向量为：

X＝(x₁,x₂,x₃)^T

其中，x₁是t-1时刻的PID控制器的输出A(t-1)，x₂是t时刻的实际跟踪车速V(t)，x₃是(t-1)时刻的实际跟踪车速V(t-1)；

径向基神经网络输入层的节点数量为3；

径向基神经网络隐藏层的节点数量为6；

径向基神经网络的输出为t时刻的模型输出V_R(t)，径向基神经网络输出层的节点数量为1；

在径向基神经网络结构中，X＝[x₁,x₂,…,x_n]^T为径向基神经网络的输入向量，x_i(i＝1,2,…n)为X的第i个输入量，径向基神经网络输入层的节点数量为n＝3，h＝[h₁,h₂,…,h_m]^T为径向基神经网络隐藏层节点径向基向量，h_j(j＝1,2,…m)为第j个神经元隐藏层节点的径向基，径向基神经网络隐藏层的节点数量为m＝6，径向基函数为高斯函数:

其中，X＝[x₁,x₂,…,x_n]^T是径向基神经网络的输入向量，x_i(i＝1,2,…n)为X的第i个输入量，c_j＝[c_j,1,c_j,2,…,c_j,n]^T是第j个神经元隐藏层节点的中心向量，c_j,i(i＝1,2,…n)为第j个神经元隐藏层节点的第i个中心值，b＝[b₁,b₂,…,b_m]^T为隐藏层节点的基宽向量，b_j(j＝1,2,…m)为第j个神经元隐藏层节点的基宽，w＝[w₁,w₂,…,w_m]^T是隐藏层到输出层连接的权值向量，w_j(j＝1,2,…m)为第i个隐藏层神经元到输出层连接的权值，V_R(t)是神经网络的输出，径向基神经网络输入层的节点数量为n＝3，径向基神经网络隐藏层的节点数量为m＝6；

径向基神经网络在t时刻的输出为V_R(t),汽车动力学模型的输出为步骤1中所述的t时刻实际跟踪车速V(t)，径向基神经网络的性能指标函数为：

径向基神经网络采用监督学习，为了让t时刻的J(t)的值达到最小，采用梯度下降法，不断更新隐藏层节点的中心向量c_j＝[c_j,1,c_j,2,…,c_j,n]^T、隐藏层节点的基宽向量b＝[b₁,b₂,…,b_m]^T、以及隐藏层到输出层连接的权值向量w＝[w₁,w₂,…,w_m]^T，径向基神经网络输入层的节点数量为n＝3，径向基神经网络隐藏层的节点数量为m＝6；

步骤2中所述通过梯度下降法计算径向基神经网络模型的参数为：

其中，径向基神经网络输入层的节点数量为n＝3，径向基神经网络隐藏层的节点数量为m＝6，β为神经网络的学习率，α为动量因子，β,α∈(0,1)，c_j,i(t)为t时刻的第j个神经元隐藏层节点的第i个中心值，c_j,i(t-1)为t-1时刻的第j个神经元隐藏层节点的第i个中心值，c_j,i(t-2)为t-2时刻的第j个神经元隐藏层节点的第i个中心值，Δc_j,i(t)为t时刻的第j个神经元隐藏层节点的第i个中心值的增量；

X＝[x₁,x₂,…,x_n]^T是径向基神经网络的输入向量，c_j＝[c_j,1,c_j,2,…,c_j,n]^T是第j个神经元隐藏层节点的中心向量，b_j(j＝1,2,…m)为第j个神经元隐藏层节点的基宽，w_j(j＝1,2,…m)为第i个隐藏层神经元到输出层连接的权值，Δc_j(t)为t时刻的第j个神经元隐藏层节点的权重的增量，V_R(t)为径向基神经网络在t时刻的输出,V(t)为步骤1中所述在t时刻的实际跟踪车速；

b_j(t)为t时刻的第j个神经元隐藏层节点的基宽，b_j(t-1)为t-1时刻的第j个神经元隐藏层节点的基宽，b_j(t-2)为t-2时刻的第j个神经元隐藏层节点的基宽，Δb_j(t)为t时刻的第j个神经元隐藏层节点的基宽的增量，h_j(j＝1,2,…m)为第j个神经元隐藏层节点的径向基；

w_j(t)为t时刻的第j个神经元隐藏层节点的权重，w_j(t-1)为t-1时刻的第j个神经元隐藏层节点的权重，w_j(t-2)为t-2时刻的第j个神经元隐藏层节点的权重，Δw_j(t)为t时刻的第j个神经元隐藏层节点的权重的增量；

步骤2中所述PID控制器通过径向基神经网络模型自适应调整参数以构建径向基神经网络PID控制器为：

该控制器使用增量PID控制理论，其控制的误差为：

e(t)＝V_d(t)-V(t)(9)

其中，V_d(t)为t时刻的跟踪目标车速，V(t)为t时刻的实际跟踪车速，e(t)为t时刻的跟踪误差；

控制器的输入以及控制算法为：

其中，e(t)为t时刻的跟踪误差，e(t-1)为t-1时刻的跟踪误差，e(t-2)为t-2时刻的跟踪误差，xc(1)是PID控制器的第一输入参数，xc(2)是PID控制器的第二输入参数，xc(3)是PID控制器的第三输入参数，A(t)是t时刻的PID控制器的输出，A(t-1)为PID控制器t-1时刻的输出，ΔA(t)为t时刻的A(t)的增量，K_p(t)是PID控制器t时刻的比例系数，K_i(t)是PID控制器t时刻的积分系数，K_d(t)是PID控制器t时刻的微分系数，设置PID控制器的参数调节的性能指标为：

其中，V_d(t)为t时刻的跟踪目标车速，V(t)为t时刻的实际跟踪车速；

为了使t时刻的J_C(t)最小，使用梯度下降法调节PID的增益参数

式中，ΔK_P(t)为PID在t时刻的比例系数的增量，ΔK_i(t)为PID在t时刻的积分系数的增量，ΔK_d(t)为PID在t时刻的微分系数的增量，ηp0是PID控制器的比例系数学习率的初始值，ηi0是PID控制器的积分系数学习率的初始值，ηd0是PID控制器的微分系数学习率的初始值；

其中，x₁为径向基神经网络的输入向量为X＝(x₁,x₂,x₃)^T的第一个元素，即x₁＝A(t-1)，b_j(j＝1,2,…m)为第j个神经元隐藏层节点的基宽,w_j(j＝1,2,…m)为第i个隐藏层神经元到输出层连接的权值，h_j(j＝1,2,…m)为第j个神经元隐藏层节点的径向基,c_j,1(i＝1,2,…n)为第j个神经元隐藏层节点的第1个中心值；

t时刻的PID控制器的输出为：

A(t)＝A(t-1)+(K_P0+ΔK_P(t))xc(1)+(K_i0+ΔK_i(t))xc(2)+(K_d0+ΔK_d(t))xc(3)

其中，K_P0是PID控制器的比例系数初始值，K_i0是PID控制器的积分系数初始值，K_d0是PID控制器的微分系数初始值，ΔK_P(t)为PID在t时刻的比例系数的增量，ΔK_i(t)为PID在t时刻的积分系数的增量，ΔK_d(t)为PID在t时刻的微分系数的增量，xc(1)是PID控制器的第一输入参数，xc(2)是PID控制器的第二输入参数，xc(3)是PID控制器的第三输入参数

A(t)被引入来简化速度的控制，当A(t)为正值时，将其视为节气门的开度A_T,当A(t)为负值时，将其绝对值视为制动踏板的位置A_B；

作为优选，步骤3中通过粒子群优化算法离线优化为：

所述初始化粒子位置和速度信息，设置种群规模为N,迭代总次数为L，粒子位置信息维度为D，即待优化的D参数即粒子位置为：

其中，

表示第K次迭代第h个粒子的PID控制器的比例系数初始值，

的最大值为P_1,MAX，

的最小值为P_1,MIN，

表示第K次迭代第h个粒子的PID控制器的积分系数初始值，

的最大值为P_2,MAX，

的最小值为P_2,MAX，

表示第K次迭代第h个粒子的PID控制器的微分系数初始值，

的最大值为P_3,MAX，

的最小值为P_3,MIN,ηp0_h ^K表示第K次迭代第h个粒子的PID控制器的比例系数学习率的初始值，ηp0_h ^K的最大值为P_4,MAX，ηp0_h ^K的最小值为P_4,MIN，ηi0_h ^K表示第K次迭代第h个粒子的PID控制器的积分系数学习率的初始值，ηi0_h ^K的最大值为P_5,MAX，ηi0_h ^K的最小值为P_5,MIN，ηd0_h ^K,表示第K次迭代第h个粒子的PID控制器的微分系数学习率的初始值，设置ηd0_h ^K的最大值为P_6,MAX，ηd0_h ^K的最小值为P_6,MIN；c0_h ^K表示第K次迭代第h个粒子的神经网络的中心值的初始值，设置c0_h ^K的最大值为P_7,MAX，c0_h ^K的最小值为P_7,MIN，b0_h ^K表示第K次迭代第h个粒子的神经网络基宽值的初始值，设置b0_h ^K的最大值为P_8,MAX，b0_h ^K的最小值为P_8,MIN，w0_h ^K表示第K次迭代第h个粒子的神经网络权重值的初始值，w0_h ^K的最大值为P_9,MAX,w0_h ^K的最小值为P_9,MIN；

粒子位置上限为：

P_MAX＝[P_1,MAX,P_2,MAX,P_3,MAX,P_4,MAX,P_5,MAX,P_6,MAX,P_7,MAX,P_8,MAX,P_9,MAX]

粒子位置下限为：P_MIN＝[P_1,MIN,P_2,MIN,P_3,MIN,P_4,MIN,P_5,MIN,P_6,MIN,P_7,MIN,P_8,MIN,P_9,MIN]

设置粒子速度的最大值为V_MAX，粒子速度最小值为V_MIN，粒子速度V∈[V_MIN,V_MAX]；

设置目标函数即适应度函数为：

其中，t为控制***的仿真时间，V_d(t)为t时刻的跟踪目标车速，V(t)为t时刻的实际跟踪车速，e(t)为t时刻的跟踪误差；

粒子飞行速度更新公式为：

V_h,d ^K+1＝WV_h,d ^K+c₁rand₁(P_h,d ^K-X_h,d ^K)+c₂rand₂(P_g,d ^K-X_h,d ^K) (17)

粒子位置更新公式为：

X_h,d ^K+1＝X_h,d ^K+V_h,d ^K+1,K∈[1,L],h∈[1,N],d∈[1,D]

其中，K为算法的当前迭代次数，V_h,d ^K+1表示第K+1次迭代粒子h飞行速度矢量的第d维分量，V_h,d ^K表示第K次迭代粒子h飞行速度矢量的第d维分量，X_h,d ^K+1表示第K+1次迭代粒子h位置矢量的第d维分量，X_h,d ^K表示第K次迭代粒子h位置矢量的第d维分量，P_h,d ^K表示第K次迭代粒子h个体极值的第d维分量，P_g,d ^K表示第K次迭代群体极值的第d维分量，c₁为第一加速因子，c₂为第二加速因子，rand₁为分布在[0,1]之间的第一随机值，rand₂为分布在[0,1]之间的第二随机值，W为惯性权重；

步骤3中所述粒子群优化后的参数为：

控制***经过L次迭代优化之后的D个参数分别为：

*Kp0，*Ki0，*Kd0，*ηp0，*ηi0，*ηd0，*c0，*b0，*w0；

其中*K_P0是优化后的PID控制器的比例系数初始值，*K_i0是优化后的PID控制器的比例系数初始值，*K_d0是优化后的PID控制器的比例系数初始值；*ηp0是优化后的PID控制器的比例系数学习率的初始值，*ηi0是优化后的PID控制器的积分系数学习率的初始值，*ηd0是优化后的PID控制器的微分系数学习率的初始值；*c0是优化后神经网络的中心值的初始值，*b0是优化后神经网络的基宽值的初始值，*w0是优化后神经网络的权重值的初始值；神经网络的中心向量c的维度为3×6的矩阵，初始化让这18个值相等都为*c0，神经网络的中心向量b的维度为1×6的矩阵，初始化让这6个值相等都为*b0，神经网络的中心向量w的维度为1×6的矩阵，初始化让这6个值相等都为*w0；

作为优选，步骤6中所述速度的反馈误差为V(τ)-V_R(τ)，V_d(τ)-V(τ)；

步骤6中所述径向基神经网络的参数为：中心向量c，基宽向量b，权重向量w。

步骤6中所述PID控制器的参数为：PID控制器的比例系数K_p，PID控制器积分系数K_i，PID控制器微分系数K_d；

步骤6中所述仿真时间τ增加时间步长为：τ＝τ+△τ,△τ为时间步长；

τ∈[0,T_MAX]，τ为仿真时间，T_MAX为仿真最大时间。

以上技术是先建立径向基神经网络PID控制器模型和车辆的动力学模型组成一个前向的仿真模型，将全球轻型汽车测试循环工况下的速度作为跟踪目标速度，目标速度与前向的仿真模型形成闭环反馈回路。粒子群优化算法离线优化智能选择径向基神经网络PID控制器的初始参数。将优化选择的初始值赋给径向基神经网络PID控制器，然后在新欧洲驾驶循环的工况下实现参数的自适应在线实时调整。

本发明优点在于：该基于粒子群优化的RBF-PID控制器可以使模型不用随机初始化参数，模型智能选择优化参数，从而实现安全、稳定的速度跟踪控制。

附图说明

图1：车辆跟踪控制的***框架图；

图2：车辆跟踪控制***的控制器模型图；

图3：车辆跟踪控制***的车辆的动力学模型；

图4：全球轻型汽车测试循环工况下的速度随时间的变化关系；

图5：径向基函数神经网络的结构拓扑图；

图6：粒子群优化算法离线优化后各参数以及适应度值的最优值；

图7：新欧洲驾驶循环工况下的速度随时间的变化关系；

图8：速度跟踪的仿真实例：在目标速度为新欧洲驾驶循环工况下的速度时，三种控制器的跟踪效果图；

图9：速度跟踪的仿真实例：三种控制下的跟踪速度速度误差；

图10：速度误差的性能指标。

具体实施方式

为了便于本领域普通技术人员理解和实施本发明，下面结合附图及实施例对本发明作进一步的详细描述，应当理解，此处所描述的实施示例仅用于说明和解释本发明，并不用于限定本发明。

下面结合图1至图10介绍本发明的实施方式。本发明实施方式具体步骤为：

步骤1中所述引擎模型为：

步骤1中所述传动***模型为：

其中，N_e(t)为t时刻的曲轴的转速，K(t)是t时刻的容量因子，T_i(t)为t时刻的曲轴换挡要求的叶轮转矩，T_q(t)是t时刻的液力变矩器的输出轴转矩，R_TQ(t)是t时刻的转矩因子，R_TR(t)是t时刻的变速器的传动比，其在1-4挡对应的值分别为2.39,1.45,1,0.67，T_o(t)是t时刻的自动变速器的输出轴转矩，η_t是自动变速器的效率，N_m(t)是t时刻的自动变速器输入轴旋转速度，N_o(t)是t时刻的自动变速器输出轴的旋转速度，N_w(t)是t时刻的车轮的转速，R_fd是主减速器传动比,K(t)和R_TQ(t)是由如下表达式确定的：

步骤1中所述车辆模型为：

其中，I_v是转动惯量，

步骤1中所述刹车模型为：

步骤2中所述建立径向基神经网络模型为：

径向基神经网络的输入向量为：

X＝(x₁,x₂,x₃)^T

径向基神经网络输入层的节点数量为3；

径向基神经网络隐藏层的节点数量为6；

该控制器使用增量PID控制理论，其控制的误差为：

e(t)＝V_d(t)-V(t)(9)

控制器的输入以及控制算法为：

为了使t时刻的J_C(t)最小，使用梯度下降法调节PID的增益参数

t时刻的PID控制器的输出为：

A(t)＝A(t-1)+(K_P0+ΔK_P(t))xc(1)+(K_i0+ΔK_i(t))xc(2)+(K_d0+ΔK_d(t))xc(3)

步骤3中所述通过粒子群优化算法离线优化为：

初始化粒子位置和速度信息，设置种群规模为N＝10,迭代总次数为L＝30，粒子位置信息维度为D＝9，即待优化的D＝9参数即粒子位置为：

其中，

表示第K次迭代第h个粒子的PID控制器的比例系数初始值，

的最大值为P_1,MAX＝160，

的最小值为P_1,MIN＝0.01，

表示第K次迭代第h个粒子的PID控制器的积分系数初始值，

的最大值为P_2,MAX＝160，

的最小值为P_2,MAX＝0.01，

表示第K次迭代第h个粒子的PID控制器的微分系数初始值，

的最大值为P_3,MAX＝160，

的最小值为P_3,MIN＝0.01,ηp0_h ^K表示第K次迭代第h个粒子的PID控制器的比例系数学习率的初始值，ηp0_h ^K的最大值为P_4,MAX＝1，ηp0_h ^K的最小值为P_4,MIN＝0.01，ηi0_h ^K表示第K次迭代第h个粒子的PID控制器的积分系数学习率的初始值，ηi0_h ^K的最大值为P_5,MAX＝1，ηi0_h ^K的最小值为P_5,MIN＝0.01，ηd0_h ^K,表示第K次迭代第h个粒子的PID控制器的微分系数学习率的初始值，设置ηd0_h ^K的最大值为P_6,MAX＝1，ηd0_h ^K的最小值为P_6,MIN＝0.01；c0_h ^K表示第K次迭代第h个粒子的神经网络的中心值的初始值，设置c0_h ^K的最大值为P_7,MAX＝40，c0_h ^K的最小值为P_7,MIN＝0.01，b0_h ^K表示第K次迭代第h个粒子的神经网络基宽值的初始值，设置b0_h ^K的最大值为P_8,MAX＝40，b0_h ^K的最小值为P_8,MIN＝0.01，w0_h ^K表示第K次迭代第h个粒子的神经网络权重值的初始值，w0_h ^K的最大值为P_9,MAX＝40,w0_h ^K的最小值为P_9,MIN＝0.01；

粒子位置上限为：

设置粒子速度的最大值为V_MAX＝0.5，粒子速度最小值为V_MIN＝-0.5，粒子速度V∈[V_MIN,V_MAX]；

设置目标函数即适应度函数为：

粒子飞行速度更新公式为：

粒子位置更新公式为：

X_h,d ^K+1＝X_h,d ^K+V_h,d ^K+1,K∈[1,L],h∈[1,N],d∈[1,D]

其中，K为算法的当前迭代次数，V_h,d ^K+1表示第K+1次迭代粒子h飞行速度矢量的第d维分量，V_h,d ^K表示第K次迭代粒子h飞行速度矢量的第d维分量，X_h,d ^K+1表示第K+1次迭代粒子h位置矢量的第d维分量，X_h,d ^K表示第K次迭代粒子h位置矢量的第d维分量，P_h,d ^K表示第K次迭代粒子h个体极值的第d维分量，P_g,d ^K表示第K次迭代群体极值的第d维分量，c₁为第一加速因子，c₂为第二加速因子，c₁＝c₂＝2，rand₁为分布在[0,1]之间的第一随机值，rand₂为分布在[0,1]之间的第二随机值，W为惯性权重；

步骤3中所述粒子群优化后的参数为：

控制***经过L＝30次迭代优化之后的D＝9个参数分别为*Kp0＝1.078

*Ki0＝160，*Kd0＝0.01，*ηp0＝0.01，*ηi0＝1，*ηd0＝1，*c0＝0.01，*b0＝40，*w0＝0.01；

其中*K_P0＝1.078是优化后的PID控制器的比例系数初始值，*K_i0＝160是优化后的PID控制器的比例系数初始值，*K_d0＝0.01是优化后的PID控制器的比例系数初始值；*ηp0＝0.01是优化后的PID控制器的比例系数学习率的初始值，*ηi0＝1是优化后的PID控制器的积分系数学习率的初始值，*ηd0＝0.01是优化后的PID控制器的微分系数学习率的初始值；*c0＝0.01是优化后神经网络的中心值的初始值，*b0＝40是优化后神经网络的基宽值的初始值，*w0＝0.01是优化后神经网络的权重值的初始值；神经网络的中心向量c的维度为3×6的矩阵，初始化让这18个值相等都为*c0，神经网络的中心向量b的维度为1×6的矩阵，初始化让这6个值相等都为*b0，神经网络的中心向量w的维度为1×6的矩阵，初始化让这6个值相等都为*w0；

步骤5：通过初始化后径向基神经网络PID控制器得到初始节气门开度或初始制动踏板位置，将初始节气门开度或初始制动踏板位置输入到汽车动力学模型以计算实际跟踪车速V(τ)，τ∈[0,T_MAX]，τ为仿真时间，T_MAX为仿真最大时间，且T_MAX＝1180s；

步骤6中所述速度的反馈误差为V(τ)-V_R(τ)，V_d(τ)-V(τ)；

步骤6中所述仿真时间τ增加时间步长为：τ＝τ+△τ,△τ为时间步长，且△τ＝0.04s；

τ∈[0,T_MAX]，τ为仿真时间，T_MAX为仿真最大时间。

RBF-PID为径向基函数神经网络与PID，PSO-RBF-PID为基于粒子群的径向基函数神经网络与PID。

如图1中所示，控制***的框架包含一个纵向动力学模型和一个基于粒子群优化的径向基函数神经网络与PID的控制器模型，该控制器模型采用粒子群算法离线优化初始参数，径向基函数神经网络与PID相结合在线自适应调整参数，整个流程智能化控制，不需要人工调参，实现更高的控制精度。动力学模型作为被控的对象，其根据输入的油门开度A_T,制动踏板的位置A_B,输出跟踪车辆的实际速度V,目标车辆速度和跟踪车辆速度的误差e和跟踪车辆的速度V，作为控制模型的两个输入在线动态调节节气门的开度和制动踏板的位置，形成一个闭环的控制。

如图3所示，汽车动力学的总体框架包括一个引擎模型、传动***模型、车辆模型、刹车模型。其中传动***模型包括液力变矩器模型、传动模型、逻辑换挡模型。

如图5所示为其网络结构拓扑图，RBF神经网络是一种前馈式神经网络，结构简单、学习速度快、能够处理过拟合，有并行计算和处理非线性***的能力。

如图7中所示，选用新欧洲驾驶循环NEDC作为跟踪的目标速度，通过控制器实现在线速度的跟踪控制，新欧洲驾驶循环的工况包含城市道路和郊区道路等多场景，且速度变化的范围跨度大，在0-120km/h之间。

由图8、9中所示，循环执行结束后，其三种控制器的跟踪效果和速度跟踪误差分别，PID控制器的速度误差范围在[-1.1770m/s,1.8316m/s],RBF-PID控制器的速度误差范围在[-0.8380m/s,0.6862m/s],PSO-RBF-PID控制器的速度误差范围在[-0.1559m/s,0.2112m/s]。

选用最大的速度误差e_max,均值e_v,和方差e_m三者作为精度的性能指标。

由图10中可以看到，三种控制器的最大的速度误差e_max依次是1.8316m/s，0.6862m/s，0.2112m/s；均值e_v依次是0.2321，0.0559，0.0186；方差e_m依次是0.3249，0.0320，0.0029。

局部精度：三种控制器的最大的速度误差e_max是依次降低的，因此，采用基于粒子群优化的PID-RBF控制器的局部精度优于其他两种控制器。

全局精度：PID控制器的均值e_v比其他两种控制器的大得多，全局控制精度较低，且PSO-RBF-PID控制器的e_v值比RBF-PID控制器的小，所以采用基于粒子群优化的RBF-PID控制器的全局精度优于其他两种控制器。

稳定性：采用基于粒子群优化的RBF-PID控制器的方差e_m的值最小，因此控制最稳定，RBF-PID控制器次之，PID控制器最不稳定。

本文中所描述的具体实施案例仅仅是对本发明精神作举例说明。本发明所属技术领域的技术人员可以对所描述的具体实施案例做各种各样的修改或补充或采用类似的方式替代，但并不会偏离本发明的精神或者超越所附权利要求书所定义的范围。

Claims

1.一种粒子群优化的径向基神经网络车辆速度跟踪方法，其特征在于，包括以下步骤：

步骤5：通过初始化后径向基神经网络PID控制器得到初始节气门开度或初始制动踏板位置，将初始节气门开度或初始制动踏板位置输入到汽车动力学模型以计算实际跟踪车速V(τ)，τ∈[0，T_MAX]，τ为仿真时间，T_MAX为仿真最大时间；

步骤6：将实际跟踪车速V(τ)以及PID控制器输出得到τ-1时刻的A(τ-1)输入到神经网络中，根据速度的反馈误差调整径向基神经网络和PID控制器的参数，仿真时间τ增加时间步长并转至步骤5，循环执行，直到仿真时间τ达到仿真最大时间T_MAX；

步骤1中所述引擎模型为：

其中，T_e(t)为t时刻的引擎的有效转矩，N_e(t)为t时刻的曲轴的转速，A_T(t)为t时刻的节气门的开度，T_i(t)为t时刻的曲轴换挡要求的叶轮转矩，I_e是引擎曲轴的转动惯量；

步骤1中所述传动***模型为：

其中，N_e(t)为t时刻的曲轴的转速，K(t)是t时刻的容量因子，T_i(t)为t时刻的曲轴换挡要求的叶轮转矩，T_q(t)是t时刻的液力变矩器的输出轴转矩，R_TQ(t)是t时刻的转矩因子，R_TR(t)是t时刻的变速器的传动比，T_o(t)是t时刻的自动变速器的输出轴转矩，η_t是自动变速器的效率，N_m(t)是t时刻的自动变速器输入轴旋转速度，N_o(t)是t时刻的自动变速器输出轴的旋转速度，N_w(t)是t时刻的车轮的转速，R_fd是主减速器传动比，K(t)和R_TQ(t)是由如下表达式确定的：

步骤1中所述车辆模型为：

其中，I_v是转动惯量，

是t时刻的车轮的转速的导数，R_fd是主减速器传动比，T_o(t)是t时刻的自动变速器的输出轴转矩，T_load(t)是t时刻的负载的转矩，V(t)为t时刻的实际跟踪车速，r为车轮的半径，N_w(t)是t时刻的车轮的转速，R_load，0是摩擦阻力系数，R_load，2是空气动力学阻力系数，T_u(t)是t时刻的刹车的转矩；

步骤1中所述刹车模型为：

步骤2中所述建立径向基神经网络模型为：

径向基神经网络的输入向量为：

X＝(x₁，x₂，x₃)^T

径向基神经网络输入层的节点数量为3；

径向基神经网络隐藏层的节点数量为6；

在径向基神经网络结构中，X＝[x₁，x₂，…，x_n]^T为径向基神经网络的输入向量，x_i，i＝1，2，…n为X的第i个输入量，径向基神经网络输入层的节点数量为n＝3，h＝[h₁，h₂，…，h_m]^T为径向基神经网络隐藏层节点径向基向量，h_j，j＝1，2，…m为第j个神经元隐藏层节点的径向基，径向基神经网络隐藏层的节点数量为m＝6，径向基函数为高斯函数：

其中，X＝[x₁，x₂，…，x_n]^T是径向基神经网络的输入向量，x_i，i＝1，2，…n为X的第i个输入量，c_j＝[c_j，1，c_j，2，…，c_j，n]^T是第j个神经元隐藏层节点的中心向量，c_j，i，i＝1，2，…n为第j个神经元隐藏层节点的第i个中心值，b＝[b₁，b₂，…，b_m]^T为隐藏层节点的基宽向量，b_j，j＝1，2，…m为第j个神经元隐藏层节点的基宽，w＝[w₁，w₂，…，w_m]^T是隐藏层到输出层连接的权值向量，w_i，j＝1，2，…m为第i个隐藏层神经元到输出层连接的权值，VR(t)是神经网络的输出，径向基神经网络输入层的节点数量为n＝3，径向基神经网络隐藏层的节点数量为m＝6；

径向基神经网络在t时刻的输出为V_R(t)，汽车动力学模型的输出为t时刻实际跟踪车速V(t)，径向基神经网络的性能指标函数为：

径向基神经网络采用监督学习，为了让t时刻的J(t)的值达到最小，采用梯度下降法，不断更新隐藏层节点的中心向量c_j＝[c_j，1，c_j，2，…，c_j，n]^T、隐藏层节点的基宽向量b＝[b₁，b₂，…，b_m]^T、以及隐藏层到输出层连接的权值向量w＝[w₁，w₂，…，w_m]^T，径向基神经网络输入层的节点数量为n＝3，径向基神经网络隐藏层的节点数量为m＝6；

其中，径向基神经网络输入层的节点数量为n＝3，径向基神经网络隐藏层的节点数量为m＝6，β为神经网络的学习率，α为动量因子，β，α∈(0，1)，c_j，i(t)为t时刻的第j个神经元隐藏层节点的第i个中心值，c_j，i(t-1)为t-1时刻的第j个神经元隐藏层节点的第i个中心值，c_j，i(t-2)为t-2时刻的第j个神经元隐藏层节点的第i个中心值，Δc_j，i(t)为t时刻的第j个神经元隐藏层节点的第i个中心值的增量；

X＝[x₁，x₂，…，x_n]^T是径向基神经网络的输入向量，c_j＝[c_j，1，c_j，2，…，c_j，n]^T是第j个神经元隐藏层节点的中心向量，b_j，j＝1，2，…m为第j个神经元隐藏层节点的基宽，w_j，j＝1，2，…m为第j个隐藏层神经元到输出层连接的权值，Δc_j(t)为t时刻的第j个神经元隐藏层节点的权重的增量，V_R(t)为径向基神经网络在t时刻的输出，V(t)为步骤1中所述在t时刻的实际跟踪车速；

b_j(t)为t时刻的第j个神经元隐藏层节点的基宽，b_j(t-1)为t-1时刻的第j个神经元隐藏层节点的基宽，b_j(t-2)为t-2时刻的第j个神经元隐藏层节点的基宽，Δb_j(t)为t时刻的第j个神经元隐藏层节点的基宽的增量，h_j，j＝1，2，…m为第j个神经元隐藏层节点的径向基；

该控制器使用增量PID控制理论，其控制的误差为：

e(t)＝V_d(t)-V(t)(9)

控制器的输入以及控制算法为：

为了使t时刻的J_C(t)最小，使用梯度下降法调节PID的增益参数

式中，ΔK_P(t)为PID在t时刻的比例系数的增量，ΔK_i(t)为PID在t时刻的积分系数的增量，ΔK_d(t)为PID在t时刻的微分系数的增量，η_P0是PID控制器的比例系数学习率的初始值，η_i0是PID控制器的积分系数学习率的初始值，η_d0是PID控制器的微分系数学习率的初始值；

其中，x₁为径向基神经网络的输入向量为X＝(x₁，x₂，x₃)^T的第一个元素，即x₁＝A(t-1)，b_j，j＝1，2，…m为第j个神经元隐藏层节点的基宽，w_j，j＝1，2，…m为第j个隐藏层神经元到输出层连接的权值，h_j，j＝1，2，…m为第j个神经元隐藏层节点的径向基，c_j，1，j＝1，2，…m为第j个神经元隐藏层节点的第1个中心值；

t时刻的PID控制器的输出为：

A(t)＝A(t-1)+(K_P0+ΔK_P(t))xc(1)+(K_i0+ΔK_i(t))xc(2)+(K_d0+ΔK_d(t))xc(3)

其中，K_P0是PID控制器的比例系数初始值，K_i0是PID控制器的积分系数初始值，K_d0是PID控制器的微分系数初始值，ΔK_P(t)为PID在t时刻的比例系数的增量，ΔK_i(t)为PID在t时刻的积分系数的增量，ΔK_d(t)为PID在t时刻的微分系数的增量，xc(1)是PID控制器的第一输入参数，xc(2)是PID控制器的第二输入参数，xc(3)是PID控制器的第三输入参数；

A(t)被引入来简化速度的控制，当A(t)为正值时，将其视为节气门的开度A_T，当A(t)为负值时，将其绝对值视为制动踏板的位置A_B；

步骤3中通过粒子群优化算法离线优化为：

初始化粒子位置和速度信息，设置种群规模为N，迭代总次数为L，粒子位置信息维度为D，即待优化的D参数即粒子位置为：

其中，

表示第K次迭代第h个粒子的PID控制器的比例系数初始值，

的最大值为P_1，MAX，

的最小值为P_1，MIN，

表示第K次迭代第h个粒子的PID控制器的积分系数初始值，

的最大值为P_2，MAX，

的最小值为P_2，MAX，

表示第K次迭代第h个粒子的PID控制器的微分系数初始值，

的最大值为P_3，MAX，

的最小值为P_3，MIN，ηp0_h ^K表示第K次迭代第h个粒子的PID控制器的比例系数学习率的初始值，ηp0_h ^K的最大值为P_4，MAX，ηp0_h ^K的最小值为P_4，MIN，ηi0_h ^K表示第K次迭代第h个粒子的PID控制器的积分系数学习率的初始值，ηi0_h ^K的最大值为P_5，MAX，ηi0_h ^K的最小值为P_5，MIN，ηd0_h ^K，表示第K次迭代第h个粒子的PID控制器的微分系数学习率的初始值，设置ηd0_h ^K的最大值为P_6，MAX，ηd0_h ^K的最小值为P_6，MIN；c0_h ^K表示第K次迭代第h个粒子的神经网络的中心值的初始值，设置c0_h ^K的最大值为P_7，MAX，c0_h ^K的最小值为P_7，MIN，b0_h ^K表示第K次迭代第h个粒子的神经网络基宽值的初始值，设置b0_h ^K的最大值为P_8，MAX，b0_h ^K的最小值为P_8，MIN，w0_h ^K表示第K次迭代第h个粒子的神经网络权重值的初始值，w0_h ^K的最大值为P_9，MAX，w0_h ^K的最小值为P_9，MIN；

粒子位置上限为：

P_MAX＝[P_1，MAX，P_2，MAX，P_3，MAX，P_4，MAX，P_5，MAX，P_6，MAX，P_7，MAX，P_8，MAX，P_9，MAX]

粒子位置下限为：P_MIN＝[P_1，MIN，P_2，MIN，P_3，MIN，P_4，MIN，P_5，MIN，P_6，MIN，P_7，MIN，P_8，MIN，P_9，MIN]

设置粒子速度的最大值为V_MAX，粒子速度最小值为V_MIN，粒子速度V∈[V_MIN，V_MAX]；

设置目标函数即适应度函数为：

其中，t为控制***的仿真时间，e(t)为t时刻的跟踪误差；

粒子飞行速度更新公式为：

V_h，d ^K+1＝WV_h，d ^K+c₁rand₁(P_h，d ^K-X_h，d ^K)+c₂rand₂(P_g，d ^K-X_h，d ^K) (17)

粒子位置更新公式为：

X_h，d ^K+1＝X_h，d ^K+V_h，d ^K+1，K∈[1，L]，h∈[1，N]，d∈[1，D]

其中，K为算法的当前迭代次数，V_h，d ^K+1表示第K+1次迭代粒子h飞行速度矢量的第d维分量，V_h，d ^K表示第K次迭代粒子h飞行速度矢量的第d维分量，X_h，d ^K+1表示第K+1次迭代粒子h位置矢量的第d维分量，X_h，d ^K表示第K次迭代粒子h位置矢量的第d维分量，P_h，d ^K表示第K次迭代粒子h个体极值的第d维分量，P_g，d ^K表示第K次迭代群体极值的第d维分量，c₁为第一加速因子，c₂为第二加速因子，rand₁为分布在[0，1]之间的第一随机值，rand₂为分布在[0，1]之间的第二随机值，W为惯性权重；

步骤3中所述粒子群优化后的参数为：

控制***经过L次迭代优化之后的D个参数分别为：

*K_P0，*K_i0，*K_d0，*ηp0，*ηi0，*ηd0，*c0，*b0，*w0；

步骤6中所述速度的反馈误差为V(τ)-V_R(τ)，V_d(τ)-V(τ)；

步骤6中所述径向基神经网络的参数为：中心向量c，基宽向量b，权重向量w；

步骤6中所述仿真时间τ增加时间步长为：τ＝τ+Δτ，Δτ为时间步长；

τ∈[0，T_MAX]，τ为仿真时间，T_MAX为仿真最大时间。