CN109376493B - 一种粒子群优化的径向基神经网络车辆速度跟踪方法 - Google Patents

一种粒子群优化的径向基神经网络车辆速度跟踪方法 Download PDF

Info

Publication number
CN109376493B
CN109376493B CN201811541341.4A CN201811541341A CN109376493B CN 109376493 B CN109376493 B CN 109376493B CN 201811541341 A CN201811541341 A CN 201811541341A CN 109376493 B CN109376493 B CN 109376493B
Authority
CN
China
Prior art keywords
time
neural network
radial basis
pid controller
basis function
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811541341.4A
Other languages
English (en)
Other versions
CN109376493A (zh
Inventor
尹智帅
何嘉雄
聂琳真
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wuhan University of Technology WUT
Original Assignee
Wuhan University of Technology WUT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wuhan University of Technology WUT filed Critical Wuhan University of Technology WUT
Priority to CN201811541341.4A priority Critical patent/CN109376493B/zh
Publication of CN109376493A publication Critical patent/CN109376493A/zh
Application granted granted Critical
Publication of CN109376493B publication Critical patent/CN109376493B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B13/00Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
    • G05B13/02Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
    • G05B13/04Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators
    • G05B13/042Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators in which a parameter or coefficient is automatically adjusted to optimise the performance
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/004Artificial life, i.e. computing arrangements simulating life
    • G06N3/006Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • General Health & Medical Sciences (AREA)
  • Mathematical Physics (AREA)
  • Computing Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Automation & Control Theory (AREA)
  • Medical Informatics (AREA)
  • Computer Hardware Design (AREA)
  • Geometry (AREA)
  • Feedback Control In General (AREA)

Abstract

本发明公开了一种粒子群优化的径向基神经网络车辆速度跟踪方法。本发明通过引擎模型、传动***模型、车辆模型、刹车模型构建汽车动力学模型;通过梯度下降法计算径向基神经网络模型的参数,PID控制器通过径向基神经网络模型自适应调整参数;通过粒子群优化算法离线优化,得到粒子群优化后的参数;将粒子群优化后的参数初始化赋值给径向基神经网络PID控制器;通过初始化后径向基神经网络PID控制器得到初始节气门开度或初始制动踏板位置,并输入到汽车动力学模型以计算实际跟踪车速;实际跟踪车速以及PID控制器输出输入到神经网络中,根据速度的反馈误差调整径向基神经网络和PID控制器的参数。本发明实现了安全和稳定的跟踪目标速度。

Description

一种粒子群优化的径向基神经网络车辆速度跟踪方法
技术领域
本发明属于自动驾驶汽车跟踪控制技术领域,尤其涉及一种粒子群优化的径向基神经网络车辆速度跟踪方法。
背景技术
车辆速度跟踪是自动驾驶领域的热点问题,由于车辆纵向运动的非线性、时变性和不确定性等特性,其速度跟踪也是自动驾驶车辆技术中的难点问题。目前国内外对该问题的研究较多,也提出了许多解决方法,这些方法包括:自适应巡航控制(ACC),PID控制、模糊控制、滑膜结构控制等。这些方法能够有效解决一些实际问题,但在应用于自动驾驶车辆在动态城市道路工况下的行驶时依然存在一些不足,如不能良好适应动态变化的复杂场景及参数不确定性等问题。王春蕾等采用单一的增量PID控制策略实现自动巡航,但研究发现自适应巡航控制(ACC)采用单一控制算法制作的控制器不能完美的实现所有的车辆工作模式,在某些行驶模式下控制效果非常理想,一旦切换到另一些模式时就会出现速度波动大、反映时间长、误差增大等控制品质明显下降的问题。Chien等采用PID纵向控制器,解决智能交通下的车辆纵向控制的实时性问题,但由于其控制参数通过试凑法获取,难以实现对智能纵向运动的最优控制。朱晓宏等建立汽车的动力学模型,采用模糊控制方法设计巡航控制器,运用自适应神经网络模糊推理***ANFIS设计车间距控制器并通过仿真手段进行优化工作,采用速度、车间距联合控制进行车列控制,由于引入神经网络带来了未知参数,参数随机试凑也难实现最优控制。郭景华等采用经典PID控制方法设计速度跟踪***的上位控制器,采用自适应模糊滑膜控制(AFLSMC)方法设计速度跟踪的下位控制器,滑模变结构控制器可提高***的动态响应能力,有效克服车辆非线性、参数不确定性及外界干扰等特性,但是由于其控制增益的不连续性可使控制***产生振荡或失稳。
车辆速度跟踪的复杂性在于:控制对象的非线性、时变性和不确定性;安全性和控制稳定性;神经网络由于其在线学习能力受到广泛的关注,由于其不依赖精确数学模型的控制特性,对于模型未知的复杂非线性***或是动态特性常变的控制对象两方面,具有无可比拟的优势,针对车辆速度跟踪的安全性以及稳定性问题,苑毅等提出了一种基于蚁群神经网络的PID控制器参数优化方法,能够取得较好的控制效果。改进的粒子群优化算法进行搜索用于位置控制的最佳PID增益,实现初始参数的智能选择。
发明内容
本发明的目的是解决传统的控制方法不能很好的自适应动态变化的复杂场景以及初始参数选择不当引起的超调和失稳问题,提供了一种高精度跟踪和稳定控制的车辆跟踪方法。
本发明基于背景技术的难点问题,提出了一种粒子群优化的径向基神经网络车辆速度跟踪方法,利用粒子群优化算法PSO实现初始参数的离线优化智能选择,径向基函数神经网络RBFNN与PID相结合实现参数在线自适应调整,达到较高的控制精度和稳定的跟踪控制效果。
本发明概述的技术方案实施步骤:
步骤1:通过引擎模型、传动***模型、车辆模型、刹车模型构建汽车动力学模型;
步骤2:建立径向基神经网络模型,通过梯度下降法计算径向基神经网络模型的参数,PID控制器通过径向基神经网络模型自适应调整参数以构建径向基神经网络PID控制器;
步骤3:通过粒子群优化算法离线优化,得到粒子群优化后的参数;
步骤4:将粒子群优化后的参数初始化赋值给径向基神经网络PID控制器;
步骤5:通过初始化后径向基神经网络PID控制器得到初始节气门开度或初始制动踏板位置,将初始节气门开度或初始制动踏板位置输入到汽车动力学模型以计算实际跟踪车速V(τ),τ∈[0,TMAX],τ为仿真时间,TMAX为仿真最大时间;
步骤6:实际跟踪车速V(τ)以及PID控制器输出得到τ-1时刻的A(τ-1)输入到神经网络中,根据速度的反馈误差调整径向基神经网络和PID控制器的参数,仿真时间τ增加时间步长并转至步骤5,循环执行,直到仿真时间τ达到仿真最大时间TMAX
作为优选,步骤1中所述引擎模型为:
Figure BDA0001908158700000021
其中,Te(t)为t时刻的引擎的有效转矩,Ne(t)为t时刻的曲轴的转速,AT(t)为t时刻的节气门的开度,Ti(t)为t时刻的曲轴换挡要求的叶轮转矩,Ie是引擎曲轴的转动惯量;
步骤1中所述传动***模型为:
Figure BDA0001908158700000022
其中,Ne(t)为t时刻的曲轴的转速,K(t)是t时刻的容量因子,Ti(t)为t时刻的曲轴换挡要求的叶轮转矩,Tq(t)是t时刻的液力变矩器的输出轴转矩,RTQ(t)是t时刻的转矩因子,RTR(t)是t时刻的变速器的传动比,To(t)是t时刻的自动变速器的输出轴转矩,ηt是自动变速器的效率,Nm(t)是t时刻的自动变速器输入轴旋转速度,No(t)是t时刻的自动变速器输出轴的旋转速度,Nw(t)是t时刻的车轮的转速,Rfd是主减速器传动比,K(t)和RTQ(t)是由如下表达式确定的:
Figure BDA0001908158700000031
其中,f2是容量系数,f3是变矩率系数,Nm(t)为t时刻的自动变速器输入轴旋转速度,Ne(t)为t时刻的曲轴的转速;
步骤1中所述车辆模型为:
Figure BDA0001908158700000032
其中,Iv是转动惯量,
Figure BDA0001908158700000034
是t时刻的车轮的转速的导数,Rfd是主减速器传动比,To(t)是t时刻的自动变速器的输出轴转矩,Tload(t)是t时刻的负载的转矩,V(t)为t时刻的实际跟踪车速,r为车轮的半径,Nw(t)是t时刻的车轮的转速,Rload,0是摩擦阻力系数,Rload,2是空气动力学阻力系数,Tu(t)是t时刻的刹车的转矩;
步骤1中所述刹车模型为:
Figure BDA0001908158700000033
其中,r为车轮的半径,AB(t)为t时刻的制动踏板的位置,Tu(t)为t时刻的刹车转矩;
作为优选,步骤2中所述建立径向基神经网络模型为:
径向基神经网络的输入向量为:
X=(x1,x2,x3)T
其中,x1是t-1时刻的PID控制器的输出A(t-1),x2是t时刻的实际跟踪车速V(t),x3是(t-1)时刻的实际跟踪车速V(t-1);
径向基神经网络输入层的节点数量为3;
径向基神经网络隐藏层的节点数量为6;
径向基神经网络的输出为t时刻的模型输出VR(t),径向基神经网络输出层的节点数量为1;
在径向基神经网络结构中,X=[x1,x2,…,xn]T为径向基神经网络的输入向量,xi(i=1,2,…n)为X的第i个输入量,径向基神经网络输入层的节点数量为n=3,h=[h1,h2,…,hm]T为径向基神经网络隐藏层节点径向基向量,hj(j=1,2,…m)为第j个神经元隐藏层节点的径向基,径向基神经网络隐藏层的节点数量为m=6,径向基函数为高斯函数:
Figure BDA0001908158700000041
其中,X=[x1,x2,…,xn]T是径向基神经网络的输入向量,xi(i=1,2,…n)为X的第i个输入量,cj=[cj,1,cj,2,…,cj,n]T是第j个神经元隐藏层节点的中心向量,cj,i(i=1,2,…n)为第j个神经元隐藏层节点的第i个中心值,b=[b1,b2,…,bm]T为隐藏层节点的基宽向量,bj(j=1,2,…m)为第j个神经元隐藏层节点的基宽,w=[w1,w2,…,wm]T是隐藏层到输出层连接的权值向量,wj(j=1,2,…m)为第i个隐藏层神经元到输出层连接的权值,VR(t)是神经网络的输出,径向基神经网络输入层的节点数量为n=3,径向基神经网络隐藏层的节点数量为m=6;
径向基神经网络在t时刻的输出为VR(t),汽车动力学模型的输出为步骤1中所述的t时刻实际跟踪车速V(t),径向基神经网络的性能指标函数为:
Figure BDA0001908158700000042
径向基神经网络采用监督学习,为了让t时刻的J(t)的值达到最小,采用梯度下降法,不断更新隐藏层节点的中心向量cj=[cj,1,cj,2,…,cj,n]T、隐藏层节点的基宽向量b=[b1,b2,…,bm]T、以及隐藏层到输出层连接的权值向量w=[w1,w2,…,wm]T,径向基神经网络输入层的节点数量为n=3,径向基神经网络隐藏层的节点数量为m=6;
步骤2中所述通过梯度下降法计算径向基神经网络模型的参数为:
Figure BDA0001908158700000043
其中,径向基神经网络输入层的节点数量为n=3,径向基神经网络隐藏层的节点数量为m=6,β为神经网络的学习率,α为动量因子,β,α∈(0,1),cj,i(t)为t时刻的第j个神经元隐藏层节点的第i个中心值,cj,i(t-1)为t-1时刻的第j个神经元隐藏层节点的第i个中心值,cj,i(t-2)为t-2时刻的第j个神经元隐藏层节点的第i个中心值,Δcj,i(t)为t时刻的第j个神经元隐藏层节点的第i个中心值的增量;
X=[x1,x2,…,xn]T是径向基神经网络的输入向量,cj=[cj,1,cj,2,…,cj,n]T是第j个神经元隐藏层节点的中心向量,bj(j=1,2,…m)为第j个神经元隐藏层节点的基宽,wj(j=1,2,…m)为第i个隐藏层神经元到输出层连接的权值,Δcj(t)为t时刻的第j个神经元隐藏层节点的权重的增量,VR(t)为径向基神经网络在t时刻的输出,V(t)为步骤1中所述在t时刻的实际跟踪车速;
bj(t)为t时刻的第j个神经元隐藏层节点的基宽,bj(t-1)为t-1时刻的第j个神经元隐藏层节点的基宽,bj(t-2)为t-2时刻的第j个神经元隐藏层节点的基宽,Δbj(t)为t时刻的第j个神经元隐藏层节点的基宽的增量,hj(j=1,2,…m)为第j个神经元隐藏层节点的径向基;
wj(t)为t时刻的第j个神经元隐藏层节点的权重,wj(t-1)为t-1时刻的第j个神经元隐藏层节点的权重,wj(t-2)为t-2时刻的第j个神经元隐藏层节点的权重,Δwj(t)为t时刻的第j个神经元隐藏层节点的权重的增量;
步骤2中所述PID控制器通过径向基神经网络模型自适应调整参数以构建径向基神经网络PID控制器为:
该控制器使用增量PID控制理论,其控制的误差为:
e(t)=Vd(t)-V(t)(9)
其中,Vd(t)为t时刻的跟踪目标车速,V(t)为t时刻的实际跟踪车速,e(t)为t时刻的跟踪误差;
控制器的输入以及控制算法为:
Figure BDA0001908158700000051
Figure BDA0001908158700000052
其中,e(t)为t时刻的跟踪误差,e(t-1)为t-1时刻的跟踪误差,e(t-2)为t-2时刻的跟踪误差,xc(1)是PID控制器的第一输入参数,xc(2)是PID控制器的第二输入参数,xc(3)是PID控制器的第三输入参数,A(t)是t时刻的PID控制器的输出,A(t-1)为PID控制器t-1时刻的输出,ΔA(t)为t时刻的A(t)的增量,Kp(t)是PID控制器t时刻的比例系数,Ki(t)是PID控制器t时刻的积分系数,Kd(t)是PID控制器t时刻的微分系数,设置PID控制器的参数调节的性能指标为:
Figure BDA0001908158700000061
其中,Vd(t)为t时刻的跟踪目标车速,V(t)为t时刻的实际跟踪车速;
为了使t时刻的JC(t)最小,使用梯度下降法调节PID的增益参数
Figure BDA0001908158700000062
式中,ΔKP(t)为PID在t时刻的比例系数的增量,ΔKi(t)为PID在t时刻的积分系数的增量,ΔKd(t)为PID在t时刻的微分系数的增量,ηp0是PID控制器的比例系数学习率的初始值,ηi0是PID控制器的积分系数学习率的初始值,ηd0是PID控制器的微分系数学习率的初始值;
Figure BDA0001908158700000063
其中,x1为径向基神经网络的输入向量为X=(x1,x2,x3)T的第一个元素,即x1=A(t-1),bj(j=1,2,…m)为第j个神经元隐藏层节点的基宽,wj(j=1,2,…m)为第i个隐藏层神经元到输出层连接的权值,hj(j=1,2,…m)为第j个神经元隐藏层节点的径向基,cj,1(i=1,2,…n)为第j个神经元隐藏层节点的第1个中心值;
t时刻的PID控制器的输出为:
A(t)=A(t-1)+(KP0+ΔKP(t))xc(1)+(Ki0+ΔKi(t))xc(2)+(Kd0+ΔKd(t))xc(3)
其中,KP0是PID控制器的比例系数初始值,Ki0是PID控制器的积分系数初始值,Kd0是PID控制器的微分系数初始值,ΔKP(t)为PID在t时刻的比例系数的增量,ΔKi(t)为PID在t时刻的积分系数的增量,ΔKd(t)为PID在t时刻的微分系数的增量,xc(1)是PID控制器的第一输入参数,xc(2)是PID控制器的第二输入参数,xc(3)是PID控制器的第三输入参数
A(t)被引入来简化速度的控制,当A(t)为正值时,将其视为节气门的开度AT,当A(t)为负值时,将其绝对值视为制动踏板的位置AB
作为优选,步骤3中通过粒子群优化算法离线优化为:
所述初始化粒子位置和速度信息,设置种群规模为N,迭代总次数为L,粒子位置信息维度为D,即待优化的D参数即粒子位置为:
Figure BDA0001908158700000071
其中,
Figure BDA0001908158700000072
表示第K次迭代第h个粒子的PID控制器的比例系数初始值,
Figure BDA0001908158700000073
的最大值为P1,MAX
Figure BDA0001908158700000074
的最小值为P1,MIN
Figure BDA0001908158700000075
表示第K次迭代第h个粒子的PID控制器的积分系数初始值,
Figure BDA0001908158700000076
的最大值为P2,MAX
Figure BDA0001908158700000077
的最小值为P2,MAX
Figure BDA0001908158700000078
表示第K次迭代第h个粒子的PID控制器的微分系数初始值,
Figure BDA0001908158700000079
的最大值为P3,MAX
Figure BDA00019081587000000710
的最小值为P3,MIN,ηp0h K表示第K次迭代第h个粒子的PID控制器的比例系数学习率的初始值,ηp0h K的最大值为P4,MAX,ηp0h K的最小值为P4,MIN,ηi0h K表示第K次迭代第h个粒子的PID控制器的积分系数学习率的初始值,ηi0h K的最大值为P5,MAX,ηi0h K的最小值为P5,MIN,ηd0h K,表示第K次迭代第h个粒子的PID控制器的微分系数学习率的初始值,设置ηd0h K的最大值为P6,MAX,ηd0h K的最小值为P6,MIN;c0h K表示第K次迭代第h个粒子的神经网络的中心值的初始值,设置c0h K的最大值为P7,MAX,c0h K的最小值为P7,MIN,b0h K表示第K次迭代第h个粒子的神经网络基宽值的初始值,设置b0h K的最大值为P8,MAX,b0h K的最小值为P8,MIN,w0h K表示第K次迭代第h个粒子的神经网络权重值的初始值,w0h K的最大值为P9,MAX,w0h K的最小值为P9,MIN
粒子位置上限为:
PMAX=[P1,MAX,P2,MAX,P3,MAX,P4,MAX,P5,MAX,P6,MAX,P7,MAX,P8,MAX,P9,MAX]
粒子位置下限为:PMIN=[P1,MIN,P2,MIN,P3,MIN,P4,MIN,P5,MIN,P6,MIN,P7,MIN,P8,MIN,P9,MIN]
设置粒子速度的最大值为VMAX,粒子速度最小值为VMIN,粒子速度V∈[VMIN,VMAX];
设置目标函数即适应度函数为:
Figure BDA00019081587000000711
其中,t为控制***的仿真时间,Vd(t)为t时刻的跟踪目标车速,V(t)为t时刻的实际跟踪车速,e(t)为t时刻的跟踪误差;
粒子飞行速度更新公式为:
Vh,d K+1=WVh,d K+c1rand1(Ph,d K-Xh,d K)+c2rand2(Pg,d K-Xh,d K) (17)
粒子位置更新公式为:
Xh,d K+1=Xh,d K+Vh,d K+1,K∈[1,L],h∈[1,N],d∈[1,D]
其中,K为算法的当前迭代次数,Vh,d K+1表示第K+1次迭代粒子h飞行速度矢量的第d维分量,Vh,d K表示第K次迭代粒子h飞行速度矢量的第d维分量,Xh,d K+1表示第K+1次迭代粒子h位置矢量的第d维分量,Xh,d K表示第K次迭代粒子h位置矢量的第d维分量,Ph,d K表示第K次迭代粒子h个体极值的第d维分量,Pg,d K表示第K次迭代群体极值的第d维分量,c1为第一加速因子,c2为第二加速因子,rand1为分布在[0,1]之间的第一随机值,rand2为分布在[0,1]之间的第二随机值,W为惯性权重;
步骤3中所述粒子群优化后的参数为:
控制***经过L次迭代优化之后的D个参数分别为:
*Kp0,*Ki0,*Kd0,*ηp0,*ηi0,*ηd0,*c0,*b0,*w0;
其中*KP0是优化后的PID控制器的比例系数初始值,*Ki0是优化后的PID控制器的比例系数初始值,*Kd0是优化后的PID控制器的比例系数初始值;*ηp0是优化后的PID控制器的比例系数学习率的初始值,*ηi0是优化后的PID控制器的积分系数学习率的初始值,*ηd0是优化后的PID控制器的微分系数学习率的初始值;*c0是优化后神经网络的中心值的初始值,*b0是优化后神经网络的基宽值的初始值,*w0是优化后神经网络的权重值的初始值;神经网络的中心向量c的维度为3×6的矩阵,初始化让这18个值相等都为*c0,神经网络的中心向量b的维度为1×6的矩阵,初始化让这6个值相等都为*b0,神经网络的中心向量w的维度为1×6的矩阵,初始化让这6个值相等都为*w0;
作为优选,步骤6中所述速度的反馈误差为V(τ)-VR(τ),Vd(τ)-V(τ);
步骤6中所述径向基神经网络的参数为:中心向量c,基宽向量b,权重向量w。
步骤6中所述PID控制器的参数为:PID控制器的比例系数Kp,PID控制器积分系数Ki,PID控制器微分系数Kd
步骤6中所述仿真时间τ增加时间步长为:τ=τ+△τ,△τ为时间步长;
τ∈[0,TMAX],τ为仿真时间,TMAX为仿真最大时间。
以上技术是先建立径向基神经网络PID控制器模型和车辆的动力学模型组成一个前向的仿真模型,将全球轻型汽车测试循环工况下的速度作为跟踪目标速度,目标速度与前向的仿真模型形成闭环反馈回路。粒子群优化算法离线优化智能选择径向基神经网络PID控制器的初始参数。将优化选择的初始值赋给径向基神经网络PID控制器,然后在新欧洲驾驶循环的工况下实现参数的自适应在线实时调整。
本发明优点在于:该基于粒子群优化的RBF-PID控制器可以使模型不用随机初始化参数,模型智能选择优化参数,从而实现安全、稳定的速度跟踪控制。
附图说明
图1:车辆跟踪控制的***框架图;
图2:车辆跟踪控制***的控制器模型图;
图3:车辆跟踪控制***的车辆的动力学模型;
图4:全球轻型汽车测试循环工况下的速度随时间的变化关系;
图5:径向基函数神经网络的结构拓扑图;
图6:粒子群优化算法离线优化后各参数以及适应度值的最优值;
图7:新欧洲驾驶循环工况下的速度随时间的变化关系;
图8:速度跟踪的仿真实例:在目标速度为新欧洲驾驶循环工况下的速度时,三种控制器的跟踪效果图;
图9:速度跟踪的仿真实例:三种控制下的跟踪速度速度误差;
图10:速度误差的性能指标。
具体实施方式
为了便于本领域普通技术人员理解和实施本发明,下面结合附图及实施例对本发明作进一步的详细描述,应当理解,此处所描述的实施示例仅用于说明和解释本发明,并不用于限定本发明。
下面结合图1至图10介绍本发明的实施方式。本发明实施方式具体步骤为:
步骤1:通过引擎模型、传动***模型、车辆模型、刹车模型构建汽车动力学模型;
步骤1中所述引擎模型为:
Figure BDA0001908158700000091
其中,Te(t)为t时刻的引擎的有效转矩,Ne(t)为t时刻的曲轴的转速,AT(t)为t时刻的节气门的开度,Ti(t)为t时刻的曲轴换挡要求的叶轮转矩,Ie是引擎曲轴的转动惯量;
步骤1中所述传动***模型为:
Figure BDA0001908158700000101
其中,Ne(t)为t时刻的曲轴的转速,K(t)是t时刻的容量因子,Ti(t)为t时刻的曲轴换挡要求的叶轮转矩,Tq(t)是t时刻的液力变矩器的输出轴转矩,RTQ(t)是t时刻的转矩因子,RTR(t)是t时刻的变速器的传动比,其在1-4挡对应的值分别为2.39,1.45,1,0.67,To(t)是t时刻的自动变速器的输出轴转矩,ηt是自动变速器的效率,Nm(t)是t时刻的自动变速器输入轴旋转速度,No(t)是t时刻的自动变速器输出轴的旋转速度,Nw(t)是t时刻的车轮的转速,Rfd是主减速器传动比,K(t)和RTQ(t)是由如下表达式确定的:
Figure BDA0001908158700000102
其中,f2是容量系数,f3是变矩率系数,Nm(t)为t时刻的自动变速器输入轴旋转速度,Ne(t)为t时刻的曲轴的转速;
步骤1中所述车辆模型为:
Figure BDA0001908158700000103
其中,Iv是转动惯量,
Figure BDA0001908158700000105
是t时刻的车轮的转速的导数,Rfd是主减速器传动比,To(t)是t时刻的自动变速器的输出轴转矩,Tload(t)是t时刻的负载的转矩,V(t)为t时刻的实际跟踪车速,r为车轮的半径,Nw(t)是t时刻的车轮的转速,Rload,0是摩擦阻力系数,Rload,2是空气动力学阻力系数,Tu(t)是t时刻的刹车的转矩;
步骤1中所述刹车模型为:
Figure BDA0001908158700000104
其中,r为车轮的半径,AB(t)为t时刻的制动踏板的位置,Tu(t)为t时刻的刹车转矩;
步骤2:建立径向基神经网络模型,通过梯度下降法计算径向基神经网络模型的参数,PID控制器通过径向基神经网络模型自适应调整参数以构建径向基神经网络PID控制器;
步骤2中所述建立径向基神经网络模型为:
径向基神经网络的输入向量为:
X=(x1,x2,x3)T
其中,x1是t-1时刻的PID控制器的输出A(t-1),x2是t时刻的实际跟踪车速V(t),x3是(t-1)时刻的实际跟踪车速V(t-1);
径向基神经网络输入层的节点数量为3;
径向基神经网络隐藏层的节点数量为6;
径向基神经网络的输出为t时刻的模型输出VR(t),径向基神经网络输出层的节点数量为1;
在径向基神经网络结构中,X=[x1,x2,…,xn]T为径向基神经网络的输入向量,xi(i=1,2,…n)为X的第i个输入量,径向基神经网络输入层的节点数量为n=3,h=[h1,h2,…,hm]T为径向基神经网络隐藏层节点径向基向量,hj(j=1,2,…m)为第j个神经元隐藏层节点的径向基,径向基神经网络隐藏层的节点数量为m=6,径向基函数为高斯函数:
Figure BDA0001908158700000111
其中,X=[x1,x2,…,xn]T是径向基神经网络的输入向量,xi(i=1,2,…n)为X的第i个输入量,cj=[cj,1,cj,2,…,cj,n]T是第j个神经元隐藏层节点的中心向量,cj,i(i=1,2,…n)为第j个神经元隐藏层节点的第i个中心值,b=[b1,b2,…,bm]T为隐藏层节点的基宽向量,bj(j=1,2,…m)为第j个神经元隐藏层节点的基宽,w=[w1,w2,…,wm]T是隐藏层到输出层连接的权值向量,wj(j=1,2,…m)为第i个隐藏层神经元到输出层连接的权值,VR(t)是神经网络的输出,径向基神经网络输入层的节点数量为n=3,径向基神经网络隐藏层的节点数量为m=6;
径向基神经网络在t时刻的输出为VR(t),汽车动力学模型的输出为步骤1中所述的t时刻实际跟踪车速V(t),径向基神经网络的性能指标函数为:
Figure BDA0001908158700000112
径向基神经网络采用监督学习,为了让t时刻的J(t)的值达到最小,采用梯度下降法,不断更新隐藏层节点的中心向量cj=[cj,1,cj,2,…,cj,n]T、隐藏层节点的基宽向量b=[b1,b2,…,bm]T、以及隐藏层到输出层连接的权值向量w=[w1,w2,…,wm]T,径向基神经网络输入层的节点数量为n=3,径向基神经网络隐藏层的节点数量为m=6;
步骤2中所述通过梯度下降法计算径向基神经网络模型的参数为:
Figure BDA0001908158700000121
其中,径向基神经网络输入层的节点数量为n=3,径向基神经网络隐藏层的节点数量为m=6,β为神经网络的学习率,α为动量因子,β,α∈(0,1),cj,i(t)为t时刻的第j个神经元隐藏层节点的第i个中心值,cj,i(t-1)为t-1时刻的第j个神经元隐藏层节点的第i个中心值,cj,i(t-2)为t-2时刻的第j个神经元隐藏层节点的第i个中心值,Δcj,i(t)为t时刻的第j个神经元隐藏层节点的第i个中心值的增量;
X=[x1,x2,…,xn]T是径向基神经网络的输入向量,cj=[cj,1,cj,2,…,cj,n]T是第j个神经元隐藏层节点的中心向量,bj(j=1,2,…m)为第j个神经元隐藏层节点的基宽,wj(j=1,2,…m)为第i个隐藏层神经元到输出层连接的权值,Δcj(t)为t时刻的第j个神经元隐藏层节点的权重的增量,VR(t)为径向基神经网络在t时刻的输出,V(t)为步骤1中所述在t时刻的实际跟踪车速;
bj(t)为t时刻的第j个神经元隐藏层节点的基宽,bj(t-1)为t-1时刻的第j个神经元隐藏层节点的基宽,bj(t-2)为t-2时刻的第j个神经元隐藏层节点的基宽,Δbj(t)为t时刻的第j个神经元隐藏层节点的基宽的增量,hj(j=1,2,…m)为第j个神经元隐藏层节点的径向基;
wj(t)为t时刻的第j个神经元隐藏层节点的权重,wj(t-1)为t-1时刻的第j个神经元隐藏层节点的权重,wj(t-2)为t-2时刻的第j个神经元隐藏层节点的权重,Δwj(t)为t时刻的第j个神经元隐藏层节点的权重的增量;
步骤2中所述PID控制器通过径向基神经网络模型自适应调整参数以构建径向基神经网络PID控制器为:
该控制器使用增量PID控制理论,其控制的误差为:
e(t)=Vd(t)-V(t)(9)
其中,Vd(t)为t时刻的跟踪目标车速,V(t)为t时刻的实际跟踪车速,e(t)为t时刻的跟踪误差;
控制器的输入以及控制算法为:
Figure BDA0001908158700000131
Figure BDA0001908158700000132
其中,e(t)为t时刻的跟踪误差,e(t-1)为t-1时刻的跟踪误差,e(t-2)为t-2时刻的跟踪误差,xc(1)是PID控制器的第一输入参数,xc(2)是PID控制器的第二输入参数,xc(3)是PID控制器的第三输入参数,A(t)是t时刻的PID控制器的输出,A(t-1)为PID控制器t-1时刻的输出,ΔA(t)为t时刻的A(t)的增量,Kp(t)是PID控制器t时刻的比例系数,Ki(t)是PID控制器t时刻的积分系数,Kd(t)是PID控制器t时刻的微分系数,设置PID控制器的参数调节的性能指标为:
Figure BDA0001908158700000133
其中,Vd(t)为t时刻的跟踪目标车速,V(t)为t时刻的实际跟踪车速;
为了使t时刻的JC(t)最小,使用梯度下降法调节PID的增益参数
Figure BDA0001908158700000134
式中,ΔKP(t)为PID在t时刻的比例系数的增量,ΔKi(t)为PID在t时刻的积分系数的增量,ΔKd(t)为PID在t时刻的微分系数的增量,ηp0是PID控制器的比例系数学习率的初始值,ηi0是PID控制器的积分系数学习率的初始值,ηd0是PID控制器的微分系数学习率的初始值;
Figure BDA0001908158700000135
其中,x1为径向基神经网络的输入向量为X=(x1,x2,x3)T的第一个元素,即x1=A(t-1),bj(j=1,2,…m)为第j个神经元隐藏层节点的基宽,wj(j=1,2,…m)为第i个隐藏层神经元到输出层连接的权值,hj(j=1,2,…m)为第j个神经元隐藏层节点的径向基,cj,1(i=1,2,…n)为第j个神经元隐藏层节点的第1个中心值;
t时刻的PID控制器的输出为:
A(t)=A(t-1)+(KP0+ΔKP(t))xc(1)+(Ki0+ΔKi(t))xc(2)+(Kd0+ΔKd(t))xc(3)
其中,KP0是PID控制器的比例系数初始值,Ki0是PID控制器的积分系数初始值,Kd0是PID控制器的微分系数初始值,ΔKP(t)为PID在t时刻的比例系数的增量,ΔKi(t)为PID在t时刻的积分系数的增量,ΔKd(t)为PID在t时刻的微分系数的增量,xc(1)是PID控制器的第一输入参数,xc(2)是PID控制器的第二输入参数,xc(3)是PID控制器的第三输入参数
A(t)被引入来简化速度的控制,当A(t)为正值时,将其视为节气门的开度AT,当A(t)为负值时,将其绝对值视为制动踏板的位置AB
步骤3:通过粒子群优化算法离线优化,得到粒子群优化后的参数;
步骤3中所述通过粒子群优化算法离线优化为:
初始化粒子位置和速度信息,设置种群规模为N=10,迭代总次数为L=30,粒子位置信息维度为D=9,即待优化的D=9参数即粒子位置为:
Figure BDA0001908158700000141
其中,
Figure BDA0001908158700000142
表示第K次迭代第h个粒子的PID控制器的比例系数初始值,
Figure BDA0001908158700000143
的最大值为P1,MAX=160,
Figure BDA0001908158700000144
的最小值为P1,MIN=0.01,
Figure BDA0001908158700000145
表示第K次迭代第h个粒子的PID控制器的积分系数初始值,
Figure BDA0001908158700000146
的最大值为P2,MAX=160,
Figure BDA0001908158700000147
的最小值为P2,MAX=0.01,
Figure BDA0001908158700000148
表示第K次迭代第h个粒子的PID控制器的微分系数初始值,
Figure BDA0001908158700000149
的最大值为P3,MAX=160,
Figure BDA00019081587000001410
的最小值为P3,MIN=0.01,ηp0h K表示第K次迭代第h个粒子的PID控制器的比例系数学习率的初始值,ηp0h K的最大值为P4,MAX=1,ηp0h K的最小值为P4,MIN=0.01,ηi0h K表示第K次迭代第h个粒子的PID控制器的积分系数学习率的初始值,ηi0h K的最大值为P5,MAX=1,ηi0h K的最小值为P5,MIN=0.01,ηd0h K,表示第K次迭代第h个粒子的PID控制器的微分系数学习率的初始值,设置ηd0h K的最大值为P6,MAX=1,ηd0h K的最小值为P6,MIN=0.01;c0h K表示第K次迭代第h个粒子的神经网络的中心值的初始值,设置c0h K的最大值为P7,MAX=40,c0h K的最小值为P7,MIN=0.01,b0h K表示第K次迭代第h个粒子的神经网络基宽值的初始值,设置b0h K的最大值为P8,MAX=40,b0h K的最小值为P8,MIN=0.01,w0h K表示第K次迭代第h个粒子的神经网络权重值的初始值,w0h K的最大值为P9,MAX=40,w0h K的最小值为P9,MIN=0.01;
粒子位置上限为:
PMAX=[P1,MAX,P2,MAX,P3,MAX,P4,MAX,P5,MAX,P6,MAX,P7,MAX,P8,MAX,P9,MAX]
粒子位置下限为:PMIN=[P1,MIN,P2,MIN,P3,MIN,P4,MIN,P5,MIN,P6,MIN,P7,MIN,P8,MIN,P9,MIN]
设置粒子速度的最大值为VMAX=0.5,粒子速度最小值为VMIN=-0.5,粒子速度V∈[VMIN,VMAX];
设置目标函数即适应度函数为:
Figure BDA0001908158700000151
其中,t为控制***的仿真时间,Vd(t)为t时刻的跟踪目标车速,V(t)为t时刻的实际跟踪车速,e(t)为t时刻的跟踪误差;
粒子飞行速度更新公式为:
Vh,d K+1=WVh,d K+c1rand1(Ph,d K-Xh,d K)+c2rand2(Pg,d K-Xh,d K) (17)
粒子位置更新公式为:
Xh,d K+1=Xh,d K+Vh,d K+1,K∈[1,L],h∈[1,N],d∈[1,D]
其中,K为算法的当前迭代次数,Vh,d K+1表示第K+1次迭代粒子h飞行速度矢量的第d维分量,Vh,d K表示第K次迭代粒子h飞行速度矢量的第d维分量,Xh,d K+1表示第K+1次迭代粒子h位置矢量的第d维分量,Xh,d K表示第K次迭代粒子h位置矢量的第d维分量,Ph,d K表示第K次迭代粒子h个体极值的第d维分量,Pg,d K表示第K次迭代群体极值的第d维分量,c1为第一加速因子,c2为第二加速因子,c1=c2=2,rand1为分布在[0,1]之间的第一随机值,rand2为分布在[0,1]之间的第二随机值,W为惯性权重;
步骤3中所述粒子群优化后的参数为:
控制***经过L=30次迭代优化之后的D=9个参数分别为*Kp0=1.078
*Ki0=160,*Kd0=0.01,*ηp0=0.01,*ηi0=1,*ηd0=1,*c0=0.01,*b0=40,*w0=0.01;
其中*KP0=1.078是优化后的PID控制器的比例系数初始值,*Ki0=160是优化后的PID控制器的比例系数初始值,*Kd0=0.01是优化后的PID控制器的比例系数初始值;*ηp0=0.01是优化后的PID控制器的比例系数学习率的初始值,*ηi0=1是优化后的PID控制器的积分系数学习率的初始值,*ηd0=0.01是优化后的PID控制器的微分系数学习率的初始值;*c0=0.01是优化后神经网络的中心值的初始值,*b0=40是优化后神经网络的基宽值的初始值,*w0=0.01是优化后神经网络的权重值的初始值;神经网络的中心向量c的维度为3×6的矩阵,初始化让这18个值相等都为*c0,神经网络的中心向量b的维度为1×6的矩阵,初始化让这6个值相等都为*b0,神经网络的中心向量w的维度为1×6的矩阵,初始化让这6个值相等都为*w0;
步骤4:将粒子群优化后的参数初始化赋值给径向基神经网络PID控制器;
步骤5:通过初始化后径向基神经网络PID控制器得到初始节气门开度或初始制动踏板位置,将初始节气门开度或初始制动踏板位置输入到汽车动力学模型以计算实际跟踪车速V(τ),τ∈[0,TMAX],τ为仿真时间,TMAX为仿真最大时间,且TMAX=1180s;
步骤6:实际跟踪车速V(τ)以及PID控制器输出得到τ-1时刻的A(τ-1)输入到神经网络中,根据速度的反馈误差调整径向基神经网络和PID控制器的参数,仿真时间τ增加时间步长并转至步骤5,循环执行,直到仿真时间τ达到仿真最大时间TMAX
步骤6中所述速度的反馈误差为V(τ)-VR(τ),Vd(τ)-V(τ);
步骤6中所述径向基神经网络的参数为:中心向量c,基宽向量b,权重向量w。
步骤6中所述PID控制器的参数为:PID控制器的比例系数Kp,PID控制器积分系数Ki,PID控制器微分系数Kd
步骤6中所述仿真时间τ增加时间步长为:τ=τ+△τ,△τ为时间步长,且△τ=0.04s;
τ∈[0,TMAX],τ为仿真时间,TMAX为仿真最大时间。
RBF-PID为径向基函数神经网络与PID,PSO-RBF-PID为基于粒子群的径向基函数神经网络与PID。
如图1中所示,控制***的框架包含一个纵向动力学模型和一个基于粒子群优化的径向基函数神经网络与PID的控制器模型,该控制器模型采用粒子群算法离线优化初始参数,径向基函数神经网络与PID相结合在线自适应调整参数,整个流程智能化控制,不需要人工调参,实现更高的控制精度。动力学模型作为被控的对象,其根据输入的油门开度AT,制动踏板的位置AB,输出跟踪车辆的实际速度V,目标车辆速度和跟踪车辆速度的误差e和跟踪车辆的速度V,作为控制模型的两个输入在线动态调节节气门的开度和制动踏板的位置,形成一个闭环的控制。
如图3所示,汽车动力学的总体框架包括一个引擎模型、传动***模型、车辆模型、刹车模型。其中传动***模型包括液力变矩器模型、传动模型、逻辑换挡模型。
如图5所示为其网络结构拓扑图,RBF神经网络是一种前馈式神经网络,结构简单、学习速度快、能够处理过拟合,有并行计算和处理非线性***的能力。
如图7中所示,选用新欧洲驾驶循环NEDC作为跟踪的目标速度,通过控制器实现在线速度的跟踪控制,新欧洲驾驶循环的工况包含城市道路和郊区道路等多场景,且速度变化的范围跨度大,在0-120km/h之间。
由图8、9中所示,循环执行结束后,其三种控制器的跟踪效果和速度跟踪误差分别,PID控制器的速度误差范围在[-1.1770m/s,1.8316m/s],RBF-PID控制器的速度误差范围在[-0.8380m/s,0.6862m/s],PSO-RBF-PID控制器的速度误差范围在[-0.1559m/s,0.2112m/s]。
选用最大的速度误差emax,均值ev,和方差em三者作为精度的性能指标。
Figure BDA0001908158700000171
由图10中可以看到,三种控制器的最大的速度误差emax依次是1.8316m/s,0.6862m/s,0.2112m/s;均值ev依次是0.2321,0.0559,0.0186;方差em依次是0.3249,0.0320,0.0029。
局部精度:三种控制器的最大的速度误差emax是依次降低的,因此,采用基于粒子群优化的PID-RBF控制器的局部精度优于其他两种控制器。
全局精度:PID控制器的均值ev比其他两种控制器的大得多,全局控制精度较低,且PSO-RBF-PID控制器的ev值比RBF-PID控制器的小,所以采用基于粒子群优化的RBF-PID控制器的全局精度优于其他两种控制器。
稳定性:采用基于粒子群优化的RBF-PID控制器的方差em的值最小,因此控制最稳定,RBF-PID控制器次之,PID控制器最不稳定。
本文中所描述的具体实施案例仅仅是对本发明精神作举例说明。本发明所属技术领域的技术人员可以对所描述的具体实施案例做各种各样的修改或补充或采用类似的方式替代,但并不会偏离本发明的精神或者超越所附权利要求书所定义的范围。

Claims (1)

1.一种粒子群优化的径向基神经网络车辆速度跟踪方法,其特征在于,包括以下步骤:
步骤1:通过引擎模型、传动***模型、车辆模型、刹车模型构建汽车动力学模型;
步骤2:建立径向基神经网络模型,通过梯度下降法计算径向基神经网络模型的参数,PID控制器通过径向基神经网络模型自适应调整参数以构建径向基神经网络PID控制器;
步骤3:通过粒子群优化算法离线优化,得到粒子群优化后的参数;
步骤4:将粒子群优化后的参数初始化赋值给径向基神经网络PID控制器;
步骤5:通过初始化后径向基神经网络PID控制器得到初始节气门开度或初始制动踏板位置,将初始节气门开度或初始制动踏板位置输入到汽车动力学模型以计算实际跟踪车速V(τ),τ∈[0,TMAX],τ为仿真时间,TMAX为仿真最大时间;
步骤6:将实际跟踪车速V(τ)以及PID控制器输出得到τ-1时刻的A(τ-1)输入到神经网络中,根据速度的反馈误差调整径向基神经网络和PID控制器的参数,仿真时间τ增加时间步长并转至步骤5,循环执行,直到仿真时间τ达到仿真最大时间TMAX
步骤1中所述引擎模型为:
Figure FDA0003906134610000011
其中,Te(t)为t时刻的引擎的有效转矩,Ne(t)为t时刻的曲轴的转速,AT(t)为t时刻的节气门的开度,Ti(t)为t时刻的曲轴换挡要求的叶轮转矩,Ie是引擎曲轴的转动惯量;
步骤1中所述传动***模型为:
Figure FDA0003906134610000012
其中,Ne(t)为t时刻的曲轴的转速,K(t)是t时刻的容量因子,Ti(t)为t时刻的曲轴换挡要求的叶轮转矩,Tq(t)是t时刻的液力变矩器的输出轴转矩,RTQ(t)是t时刻的转矩因子,RTR(t)是t时刻的变速器的传动比,To(t)是t时刻的自动变速器的输出轴转矩,ηt是自动变速器的效率,Nm(t)是t时刻的自动变速器输入轴旋转速度,No(t)是t时刻的自动变速器输出轴的旋转速度,Nw(t)是t时刻的车轮的转速,Rfd是主减速器传动比,K(t)和RTQ(t)是由如下表达式确定的:
Figure FDA0003906134610000021
其中,f2是容量系数,f3是变矩率系数,Nm(t)为t时刻的自动变速器输入轴旋转速度,Ne(t)为t时刻的曲轴的转速;
步骤1中所述车辆模型为:
Figure FDA0003906134610000022
其中,Iv是转动惯量,
Figure FDA0003906134610000024
是t时刻的车轮的转速的导数,Rfd是主减速器传动比,To(t)是t时刻的自动变速器的输出轴转矩,Tload(t)是t时刻的负载的转矩,V(t)为t时刻的实际跟踪车速,r为车轮的半径,Nw(t)是t时刻的车轮的转速,Rload,0是摩擦阻力系数,Rload,2是空气动力学阻力系数,Tu(t)是t时刻的刹车的转矩;
步骤1中所述刹车模型为:
Figure FDA0003906134610000023
其中,r为车轮的半径,AB(t)为t时刻的制动踏板的位置,Tu(t)为t时刻的刹车转矩;
步骤2中所述建立径向基神经网络模型为:
径向基神经网络的输入向量为:
X=(x1,x2,x3)T
其中,x1是t-1时刻的PID控制器的输出A(t-1),x2是t时刻的实际跟踪车速V(t),x3是(t-1)时刻的实际跟踪车速V(t-1);
径向基神经网络输入层的节点数量为3;
径向基神经网络隐藏层的节点数量为6;
径向基神经网络的输出为t时刻的模型输出VR(t),径向基神经网络输出层的节点数量为1;
在径向基神经网络结构中,X=[x1,x2,…,xn]T为径向基神经网络的输入向量,xi,i=1,2,…n为X的第i个输入量,径向基神经网络输入层的节点数量为n=3,h=[h1,h2,…,hm]T为径向基神经网络隐藏层节点径向基向量,hj,j=1,2,…m为第j个神经元隐藏层节点的径向基,径向基神经网络隐藏层的节点数量为m=6,径向基函数为高斯函数:
Figure FDA0003906134610000031
其中,X=[x1,x2,…,xn]T是径向基神经网络的输入向量,xi,i=1,2,…n为X的第i个输入量,cj=[cj,1,cj,2,…,cj,n]T是第j个神经元隐藏层节点的中心向量,cj,i,i=1,2,…n为第j个神经元隐藏层节点的第i个中心值,b=[b1,b2,…,bm]T为隐藏层节点的基宽向量,bj,j=1,2,…m为第j个神经元隐藏层节点的基宽,w=[w1,w2,…,wm]T是隐藏层到输出层连接的权值向量,wi,j=1,2,…m为第i个隐藏层神经元到输出层连接的权值,VR(t)是神经网络的输出,径向基神经网络输入层的节点数量为n=3,径向基神经网络隐藏层的节点数量为m=6;
径向基神经网络在t时刻的输出为VR(t),汽车动力学模型的输出为t时刻实际跟踪车速V(t),径向基神经网络的性能指标函数为:
Figure FDA0003906134610000032
径向基神经网络采用监督学习,为了让t时刻的J(t)的值达到最小,采用梯度下降法,不断更新隐藏层节点的中心向量cj=[cj,1,cj,2,…,cj,n]T、隐藏层节点的基宽向量b=[b1,b2,…,bm]T、以及隐藏层到输出层连接的权值向量w=[w1,w2,…,wm]T,径向基神经网络输入层的节点数量为n=3,径向基神经网络隐藏层的节点数量为m=6;
步骤2中所述通过梯度下降法计算径向基神经网络模型的参数为:
Figure FDA0003906134610000033
其中,径向基神经网络输入层的节点数量为n=3,径向基神经网络隐藏层的节点数量为m=6,β为神经网络的学习率,α为动量因子,β,α∈(0,1),cj,i(t)为t时刻的第j个神经元隐藏层节点的第i个中心值,cj,i(t-1)为t-1时刻的第j个神经元隐藏层节点的第i个中心值,cj,i(t-2)为t-2时刻的第j个神经元隐藏层节点的第i个中心值,Δcj,i(t)为t时刻的第j个神经元隐藏层节点的第i个中心值的增量;
X=[x1,x2,…,xn]T是径向基神经网络的输入向量,cj=[cj,1,cj,2,…,cj,n]T是第j个神经元隐藏层节点的中心向量,bj,j=1,2,…m为第j个神经元隐藏层节点的基宽,wj,j=1,2,…m为第j个隐藏层神经元到输出层连接的权值,Δcj(t)为t时刻的第j个神经元隐藏层节点的权重的增量,VR(t)为径向基神经网络在t时刻的输出,V(t)为步骤1中所述在t时刻的实际跟踪车速;
bj(t)为t时刻的第j个神经元隐藏层节点的基宽,bj(t-1)为t-1时刻的第j个神经元隐藏层节点的基宽,bj(t-2)为t-2时刻的第j个神经元隐藏层节点的基宽,Δbj(t)为t时刻的第j个神经元隐藏层节点的基宽的增量,hj,j=1,2,…m为第j个神经元隐藏层节点的径向基;
wj(t)为t时刻的第j个神经元隐藏层节点的权重,wj(t-1)为t-1时刻的第j个神经元隐藏层节点的权重,wj(t-2)为t-2时刻的第j个神经元隐藏层节点的权重,Δwj(t)为t时刻的第j个神经元隐藏层节点的权重的增量;
步骤2中所述PID控制器通过径向基神经网络模型自适应调整参数以构建径向基神经网络PID控制器为:
该控制器使用增量PID控制理论,其控制的误差为:
e(t)=Vd(t)-V(t)(9)
其中,Vd(t)为t时刻的跟踪目标车速,V(t)为t时刻的实际跟踪车速,e(t)为t时刻的跟踪误差;
控制器的输入以及控制算法为:
Figure FDA0003906134610000041
Figure FDA0003906134610000042
其中,e(t)为t时刻的跟踪误差,e(t-1)为t-1时刻的跟踪误差,e(t-2)为t-2时刻的跟踪误差,xc(1)是PID控制器的第一输入参数,xc(2)是PID控制器的第二输入参数,xc(3)是PID控制器的第三输入参数,A(t)是t时刻的PID控制器的输出,A(t-1)为PID控制器t-1时刻的输出,ΔA(t)为t时刻的A(t)的增量,Kp(t)是PID控制器t时刻的比例系数,Ki(t)是PID控制器t时刻的积分系数,Kd(t)是PID控制器t时刻的微分系数,设置PID控制器的参数调节的性能指标为:
Figure FDA0003906134610000051
其中,Vd(t)为t时刻的跟踪目标车速,V(t)为t时刻的实际跟踪车速;
为了使t时刻的JC(t)最小,使用梯度下降法调节PID的增益参数
Figure FDA0003906134610000052
式中,ΔKP(t)为PID在t时刻的比例系数的增量,ΔKi(t)为PID在t时刻的积分系数的增量,ΔKd(t)为PID在t时刻的微分系数的增量,ηP0是PID控制器的比例系数学习率的初始值,ηi0是PID控制器的积分系数学习率的初始值,ηd0是PID控制器的微分系数学习率的初始值;
Figure FDA0003906134610000053
其中,x1为径向基神经网络的输入向量为X=(x1,x2,x3)T的第一个元素,即x1=A(t-1),bj,j=1,2,…m为第j个神经元隐藏层节点的基宽,wj,j=1,2,…m为第j个隐藏层神经元到输出层连接的权值,hj,j=1,2,…m为第j个神经元隐藏层节点的径向基,cj,1,j=1,2,…m为第j个神经元隐藏层节点的第1个中心值;
t时刻的PID控制器的输出为:
A(t)=A(t-1)+(KP0+ΔKP(t))xc(1)+(Ki0+ΔKi(t))xc(2)+(Kd0+ΔKd(t))xc(3)
其中,KP0是PID控制器的比例系数初始值,Ki0是PID控制器的积分系数初始值,Kd0是PID控制器的微分系数初始值,ΔKP(t)为PID在t时刻的比例系数的增量,ΔKi(t)为PID在t时刻的积分系数的增量,ΔKd(t)为PID在t时刻的微分系数的增量,xc(1)是PID控制器的第一输入参数,xc(2)是PID控制器的第二输入参数,xc(3)是PID控制器的第三输入参数;
A(t)被引入来简化速度的控制,当A(t)为正值时,将其视为节气门的开度AT,当A(t)为负值时,将其绝对值视为制动踏板的位置AB
步骤3中通过粒子群优化算法离线优化为:
初始化粒子位置和速度信息,设置种群规模为N,迭代总次数为L,粒子位置信息维度为D,即待优化的D参数即粒子位置为:
Figure FDA0003906134610000061
其中,
Figure FDA0003906134610000062
表示第K次迭代第h个粒子的PID控制器的比例系数初始值,
Figure FDA0003906134610000063
的最大值为P1,MAX
Figure FDA0003906134610000064
的最小值为P1,MIN
Figure FDA0003906134610000065
表示第K次迭代第h个粒子的PID控制器的积分系数初始值,
Figure FDA0003906134610000066
的最大值为P2,MAX
Figure FDA0003906134610000067
的最小值为P2,MAX
Figure FDA0003906134610000068
表示第K次迭代第h个粒子的PID控制器的微分系数初始值,
Figure FDA0003906134610000069
的最大值为P3,MAX
Figure FDA00039061346100000610
的最小值为P3,MIN,ηp0h K表示第K次迭代第h个粒子的PID控制器的比例系数学习率的初始值,ηp0h K的最大值为P4,MAX,ηp0h K的最小值为P4,MIN,ηi0h K表示第K次迭代第h个粒子的PID控制器的积分系数学习率的初始值,ηi0h K的最大值为P5,MAX,ηi0h K的最小值为P5,MIN,ηd0h K,表示第K次迭代第h个粒子的PID控制器的微分系数学习率的初始值,设置ηd0h K的最大值为P6,MAX,ηd0h K的最小值为P6,MIN;c0h K表示第K次迭代第h个粒子的神经网络的中心值的初始值,设置c0h K的最大值为P7,MAX,c0h K的最小值为P7,MIN,b0h K表示第K次迭代第h个粒子的神经网络基宽值的初始值,设置b0h K的最大值为P8,MAX,b0h K的最小值为P8,MIN,w0h K表示第K次迭代第h个粒子的神经网络权重值的初始值,w0h K的最大值为P9,MAX,w0h K的最小值为P9,MIN
粒子位置上限为:
PMAX=[P1,MAX,P2,MAX,P3,MAX,P4,MAX,P5,MAX,P6,MAX,P7,MAX,P8,MAX,P9,MAX]
粒子位置下限为:PMIN=[P1,MIN,P2,MIN,P3,MIN,P4,MIN,P5,MIN,P6,MIN,P7,MIN,P8,MIN,P9,MIN]
设置粒子速度的最大值为VMAX,粒子速度最小值为VMIN,粒子速度V∈[VMIN,VMAX];
设置目标函数即适应度函数为:
Figure FDA00039061346100000611
其中,t为控制***的仿真时间,e(t)为t时刻的跟踪误差;
粒子飞行速度更新公式为:
Vh,d K+1=WVh,d K+c1rand1(Ph,d K-Xh,d K)+c2rand2(Pg,d K-Xh,d K) (17)
粒子位置更新公式为:
Xh,d K+1=Xh,d K+Vh,d K+1,K∈[1,L],h∈[1,N],d∈[1,D]
其中,K为算法的当前迭代次数,Vh,d K+1表示第K+1次迭代粒子h飞行速度矢量的第d维分量,Vh,d K表示第K次迭代粒子h飞行速度矢量的第d维分量,Xh,d K+1表示第K+1次迭代粒子h位置矢量的第d维分量,Xh,d K表示第K次迭代粒子h位置矢量的第d维分量,Ph,d K表示第K次迭代粒子h个体极值的第d维分量,Pg,d K表示第K次迭代群体极值的第d维分量,c1为第一加速因子,c2为第二加速因子,rand1为分布在[0,1]之间的第一随机值,rand2为分布在[0,1]之间的第二随机值,W为惯性权重;
步骤3中所述粒子群优化后的参数为:
控制***经过L次迭代优化之后的D个参数分别为:
*KP0,*Ki0,*Kd0,*ηp0,*ηi0,*ηd0,*c0,*b0,*w0;
其中*Kp0是优化后的PID控制器的比例系数初始值,*Ki0是优化后的PID控制器的比例系数初始值,*Kd0是优化后的PID控制器的比例系数初始值;*ηp0是优化后的PID控制器的比例系数学习率的初始值,*ηi0是优化后的PID控制器的积分系数学习率的初始值,*ηd0是优化后的PID控制器的微分系数学习率的初始值;*c0是优化后神经网络的中心值的初始值,*b0是优化后神经网络的基宽值的初始值,*w0是优化后神经网络的权重值的初始值;神经网络的中心向量c的维度为3×6的矩阵,初始化让这18个值相等都为*c0,神经网络的中心向量b的维度为1×6的矩阵,初始化让这6个值相等都为*b0,神经网络的中心向量w的维度为1×6的矩阵,初始化让这6个值相等都为*w0;
步骤6中所述速度的反馈误差为V(τ)-VR(τ),Vd(τ)-V(τ);
步骤6中所述径向基神经网络的参数为:中心向量c,基宽向量b,权重向量w;
步骤6中所述PID控制器的参数为:PID控制器的比例系数Kp,PID控制器积分系数Ki,PID控制器微分系数Kd
步骤6中所述仿真时间τ增加时间步长为:τ=τ+Δτ,Δτ为时间步长;
τ∈[0,TMAX],τ为仿真时间,TMAX为仿真最大时间。
CN201811541341.4A 2018-12-17 2018-12-17 一种粒子群优化的径向基神经网络车辆速度跟踪方法 Active CN109376493B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811541341.4A CN109376493B (zh) 2018-12-17 2018-12-17 一种粒子群优化的径向基神经网络车辆速度跟踪方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811541341.4A CN109376493B (zh) 2018-12-17 2018-12-17 一种粒子群优化的径向基神经网络车辆速度跟踪方法

Publications (2)

Publication Number Publication Date
CN109376493A CN109376493A (zh) 2019-02-22
CN109376493B true CN109376493B (zh) 2023-02-03

Family

ID=65374094

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811541341.4A Active CN109376493B (zh) 2018-12-17 2018-12-17 一种粒子群优化的径向基神经网络车辆速度跟踪方法

Country Status (1)

Country Link
CN (1) CN109376493B (zh)

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111027235B (zh) * 2020-01-07 2022-08-30 湖南工业大学 一种具有输入饱和的重载列车滑模跟踪控制方法
CN111290263B (zh) * 2020-03-23 2022-10-11 东南大学 一种改进的基于rbfnn及bas的pid最优化控制算法
CN111862157B (zh) * 2020-07-20 2023-10-10 重庆大学 一种机器视觉与毫米波雷达融合的多车辆目标跟踪方法
CN114056386B (zh) * 2020-07-30 2023-08-08 比亚迪股份有限公司 车速控制方法及装置,存储介质及车辆
CN111950204B (zh) * 2020-08-13 2022-04-19 一汽解放汽车有限公司 一种铰链结构的优化方法、装置、计算机设备及存储介质
CN112564557B (zh) * 2020-12-14 2023-02-24 华侨大学 一种永磁同步电机的控制方法、装置、设备及存储介质
CN112644344A (zh) * 2020-12-29 2021-04-13 武汉格罗夫氢能汽车有限公司 一种基于bp神经网络功率分配优化***及优化方法
CN112947055B (zh) * 2021-03-04 2022-09-09 北京交通大学 基于回声状态网络的磁悬浮列车位移速度的跟踪控制方法
CN112947056B (zh) * 2021-03-04 2022-10-14 北京交通大学 基于igwo-bp-pid的磁浮列车位移速度跟踪控制方法
CN113085858A (zh) * 2021-04-27 2021-07-09 湖北文理学院 车辆速度跟踪控制方法、装置、设备及存储介质
CN113756973B (zh) * 2021-08-27 2023-05-12 东风商用车有限公司 一种汽车发动机最小扭矩自适应控制方法
CN114118365B (zh) * 2021-11-08 2022-09-06 北京理工大学 基于径向基网络的跨介质飞行器快速入水近似优化方法
CN115009278B (zh) * 2022-08-08 2022-11-29 潍柴动力股份有限公司 一种巡航控制方法、装置、设备及存储介质
CN115402310A (zh) * 2022-08-29 2022-11-29 潍柴动力股份有限公司 一种巡航控制方法、装置、设备及存储介质
CN116418261B (zh) * 2023-02-22 2024-05-03 深圳市一本自动化有限公司 一种基于径向基函数神经网络的电机pid控制方法

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102109821A (zh) * 2010-12-30 2011-06-29 中国科学院自动化研究所 车辆自适应巡航控制***及方法
CN105136469A (zh) * 2015-07-23 2015-12-09 江苏大学 一种基于pso和rbf神经网络的无人驾驶车辆车速控制方法
CN106128208A (zh) * 2016-08-19 2016-11-16 武汉理工大学 一种可旋转座舱的研究型汽车驾驶模拟器
CN107255923A (zh) * 2017-06-14 2017-10-17 哈尔滨工程大学 基于rbf辨识的ica‑cmac神经网络的欠驱动无人艇航迹跟踪控制方法
CN107729706A (zh) * 2017-11-29 2018-02-23 湖南科技大学 一种非线性机械***的动力学模型构建方法
CN108227491A (zh) * 2017-12-28 2018-06-29 重庆邮电大学 一种基于滑模神经网络的智能车轨迹跟踪控制方法
CN108646763A (zh) * 2018-07-18 2018-10-12 扬州大学 一种自主行驶轨迹跟踪控制方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070294017A1 (en) * 2006-06-20 2007-12-20 Eaton Corporation Method for estimating clutch engagement parameters in a strategy for clutch management in a vehicle powertrain

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102109821A (zh) * 2010-12-30 2011-06-29 中国科学院自动化研究所 车辆自适应巡航控制***及方法
CN105136469A (zh) * 2015-07-23 2015-12-09 江苏大学 一种基于pso和rbf神经网络的无人驾驶车辆车速控制方法
CN106128208A (zh) * 2016-08-19 2016-11-16 武汉理工大学 一种可旋转座舱的研究型汽车驾驶模拟器
CN107255923A (zh) * 2017-06-14 2017-10-17 哈尔滨工程大学 基于rbf辨识的ica‑cmac神经网络的欠驱动无人艇航迹跟踪控制方法
CN107729706A (zh) * 2017-11-29 2018-02-23 湖南科技大学 一种非线性机械***的动力学模型构建方法
CN108227491A (zh) * 2017-12-28 2018-06-29 重庆邮电大学 一种基于滑模神经网络的智能车轨迹跟踪控制方法
CN108646763A (zh) * 2018-07-18 2018-10-12 扬州大学 一种自主行驶轨迹跟踪控制方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于三自由度直升机模型的粒子群优化神经网络控制算法研究;王显博;《中国优秀硕士学位论文全文数据库》;20170315(第03期);第20-36页 *

Also Published As

Publication number Publication date
CN109376493A (zh) 2019-02-22

Similar Documents

Publication Publication Date Title
CN109376493B (zh) 一种粒子群优化的径向基神经网络车辆速度跟踪方法
CN106154831B (zh) 一种基于学习法的智能汽车纵向神经滑模控制方法
CN112148001B (zh) 一种基于模糊模型预测控制的智能车队纵向跟随控制方法
CN110949366B (zh) 应用智能车辆纵向速度控制的rbf神经网络的终端滑模控制方法
CN101598109B (zh) 一种风力发电机偏航***的智能控制方法
CN111267831A (zh) 一种混合动力车辆智能变时域模型预测能量管理方法
Li et al. Ecological adaptive cruise control for vehicles with step-gear transmission based on reinforcement learning
CN111608868B (zh) 风力发电***最大功率跟踪自适应鲁棒控制***及方法
CN101441441B (zh) 起重机智能防摇控制***的设计方法
CN103235620A (zh) 基于全局变量预测模型的温室环境智能控制方法
CN103324085A (zh) 基于监督式强化学习的最优控制方法
CN110347155A (zh) 一种智能车辆自动驾驶控制方法及***
CN107919813A (zh) 基于模糊神经网络的超声电机转速控制
CN110989597A (zh) 一种集成模糊神经网络的自适应路径跟踪方法
Yuan et al. Neural network based self-learning control strategy for electronic throttle valve
CN112874504B (zh) 一种可拓熵权联合控制器控制方法
CN113253779A (zh) 一种基于粒子群模糊pid算法的热泵温度控制***
CN109910863A (zh) 一种基于插电式混合动力轿车专用变速器的控制方法
CN110162910A (zh) 一种基于物联网技术的坡起优化方法
CN113093526A (zh) 一种基于强化学习的无超调pid控制器参数整定方法
CN104527637B (zh) 混合动力汽车控制方法和***
CN113741199B (zh) 一种基于智能网联信息的整车经济性速度规划方法
CN108717259A (zh) 一种直流电动装置控制***及其构建方法
CN114670856B (zh) 一种基于bp神经网络的参数自整定纵向控制方法及***
CN113232651B (zh) 一种基于adhdp的燃油汽车生态自适应巡航控制方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant