CN109927725A - 一种具有驾驶风格学习能力的自适应巡航***及实现方法 - Google Patents

一种具有驾驶风格学习能力的自适应巡航***及实现方法 Download PDF

Info

Publication number
CN109927725A
CN109927725A CN201910077516.9A CN201910077516A CN109927725A CN 109927725 A CN109927725 A CN 109927725A CN 201910077516 A CN201910077516 A CN 201910077516A CN 109927725 A CN109927725 A CN 109927725A
Authority
CN
China
Prior art keywords
vehicle
driving style
learning
driver
self
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910077516.9A
Other languages
English (en)
Other versions
CN109927725B (zh
Inventor
褚洪庆
张羽翔
高炳钊
闫勇军
陈虹
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jilin University
Original Assignee
Jilin University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jilin University filed Critical Jilin University
Priority to CN201910077516.9A priority Critical patent/CN109927725B/zh
Publication of CN109927725A publication Critical patent/CN109927725A/zh
Application granted granted Critical
Publication of CN109927725B publication Critical patent/CN109927725B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Control Of Driving Devices And Active Controlling Of Vehicle (AREA)

Abstract

本发明属于汽车智能辅助驾驶及汽车安全技术领域,具体的说是一种通过在线对驾驶员风格行为学习改变***自适应巡航跟车性能的具有驾驶风格学习能力的自适应巡航***及实现方法。本发明考虑汽车自适应巡航控制问题,设计一种具有驾驶风格自学习能力的自适应巡航控制***及实现方法。该***适用于L2级别自动驾驶车辆,目标是通过环境感知及信息融合,在实际驾驶场景中实现自适应对前方车辆进行跟随,同时,***的驾驶策略考虑特定驾驶员驾驶风格,使得***对于不同人群具有一致的满意及接受度。为了实现这个目标,本发明使用线性二次型控制方法和强化学习在线学习方法相组合的方法以更好优化***性能。

Description

一种具有驾驶风格学习能力的自适应巡航***及实现方法
技术领域
本发明属于汽车智能辅助驾驶及汽车安全技术领域,具体的说是一种通过在线对驾驶员风格行为学习改变***自适应巡航跟车性能的具有驾驶风格学习能力的自适应巡航***及实现方法。
背景技术
智能驾驶辅助技术逐步发展,并成为车辆技术研发的主要发展方向,在世界范围内引起广泛的关注。在车辆***自动化与智能化的背景下,巡航***逐步发展。在目前发展的自适应巡航***控制***的设计中,除了较为传统的PID、模糊控制等方法外,目前已有基于模型的先进控制算法在自适应巡航***中使用,申请号201810313067.9、申请号201710826862.3的专利,使用模型预测控制方法改善跟车性能。但这些方法仍主要考虑的车辆跟随性能,如安全性、舒适性和经济性等几个方面。
随着车辆技术的不断提高与成熟,对自适应巡航也提出更高的发展方向。为了更好的提高***性能,车辆的巡航控制不仅仅需要在车流下保证安全性等指标,更需要考虑驾驶员的主观意愿。由于驾驶员驾驶风格在人体驾驶员上差异较大,而控制***的设计先于车辆的实际使用。因此,当控制***需要较好适应不同的特定驾驶员的驾驶风格时,对***进一步提出了自学习能力的要求。目前此类方法尚不成熟。如申请号2010106159140的专利中通过离线的数据驾驶分析对驾驶员分类及学习,通过车辆按钮等形式改变自适应巡航控制***的参数,提高驾驶员对于***的接受性。申请号201710812719.9的专利也是通过离线学习及按键形式,学习驾驶员驾驶习性,并调整控制器参数。与申请号201710812719.9的准里不同,本申请可以自主学习驾驶员的驾驶风格。
发明内容
为了解决上述问题,本发明考虑汽车自适应巡航控制问题,设计一种具有驾驶风格学习能力的自适应巡航***及实现方法。该***适用于L2级别自动驾驶车辆,目标是通过环境感知及信息融合,在实际驾驶场景中实现自适应对前方车辆进行跟随,同时,***的驾驶策略考虑特定驾驶员驾驶风格,使得***对于不同人群具有一致的满意及接受度。为了实现这个目标,本发明使用线性二次型控制方法和强化学习在线学习方法相组合的方法以更好优化***性能。
本发明技术方案结合附图说明如下:
一种具有驾驶风格学习能力的自适应巡航***,该***包括感知融合模块A、跟车控制模块B、驾驶风格自学习模块C和底层车辆执行控制模块D;
感知融合模块A,用于得到前方车辆行驶状态信息,包括前方车辆的速度信息、相对车距;
跟车控制模块B包括车辆跟随控制模块B—a和前车加速度进行预测模块B—b,车辆跟随控制模块B—a用于建立车辆跟随模型,同时建立控制问题,确定优化的目标,得到跟车控制器;前车加速度进行预测模块B—b,用于根据确认的前方车辆及前方车辆与当前车辆的行驶状态信息,对前车加速度进行预测;
驾驶风格自学习模块C,用于针对特定驾驶员驾驶风格会有所差异的特性,基于强化学习方法对特定驾驶员的驾驶风格进行学习,进而调节最优巡航控制问题的控制参数,达到自学习***功能;
车辆执行控制模块D,用于进行跟踪控制,并最终输出车辆动力驱动***及制动***控制本车驾驶;
所述的感知融合模块A与跟车控制模块B以及驾驶风格自学习模块C单向连接;所述的跟车控制模块B与车辆执行控制模块D单向连接;所述的驾驶风格自学习模块C与跟车控制模块B单向连接;所述的车辆执行控制模块D与车辆单向连接。
一种具有驾驶风格学习能力的自适应巡航***的实现方法,该方法包括以下步骤:
步骤一、通过感知融合模块A自身融合识别算法确认前方待跟随车辆,并得到前方车辆行驶状态信息,包括前方车辆的速度信息、相对车距;并且从车辆总线即CAN网络通讯,得到当前车辆的速度,发动机力矩,制动减速度等信息;
步骤二、通过跟车控制模块B中的车辆跟随控制模块B—a建立车辆跟随模型,同时建立控制问题,确定优化的目标,得到跟车控制器;通过跟车控制模块B中的前车加速度进行预测模块B—b,根据确认的前方车辆及前方车辆与当前车辆的行驶状态信息,对前车加速度进行预测;
步骤三、通过驾驶风格自学习模块C,针对特定驾驶员驾驶风格会有所差异的特性,基于强化学习方法对特定驾驶员的驾驶风格进行学习,进而调节最优巡航控制问题的控制参数,达到自学习***功能;
步骤四、通过底层车辆执行控制模块D进行跟踪控制,并最终输出车辆动力驱动***及制动***控制本车驾驶。
所述的步骤二的具体方法如下:
2.1)车辆跟随模型建立:根据自适应跟车问题需求,以及车辆纵向运动学与动力学特性,建立车辆跟随模型;
为了描述车辆在跟车场景下的纵向动力学特性,***引入两个状态变量分别为:
δ=d-dref (1a)
其中,d是本车与前方车辆的相对距离,dref是参考相对距离,dref=d0+τvh,d0是停车安全车距,τ是期望车头时距,vh是本车车速,vt是前方车辆车速;因此,车辆在跟车场景下的纵向动力学微分方程可以使用以上两个状态变量表示:
其中,ah是本车纵向加速度,at是前车纵向加速度,τ是期望车头时距;这里假设本车的内环加速度跟踪控制模块可以被一阶近似展开为:
其中,τi是内环动态时间常数,ah是本车纵向加速度,aref是期望纵向加速度;
在连续***中,状态量选取为控制量为u=aref,将前车加速度建模为***扰动,即扰动量d=ah;因此,车辆跟随***对的连续状态空间方程可以表示为:
其中,ah是本车纵向加速度,aref是期望纵向加速度,τi是内环动态时间常数,τ是期望车头时距;
在控制器设计中,使用零阶保持方法即ZOH得到车辆跟随***的状态空间方程的离散***表达形式,定义离散***的状态向量为控制输入u(k)=aref(k),因此在k时刻可以得到:
x(k+1)=Ax(k)+Buu(k)+Bdd(k) (4)
其中d(k)=ah(k),Ts是采样时间间隔,τ是期望车头时距,τi是内环动态时间常数;
2.2)将最优巡航控制问题建立为线性二次型优化问题,具体方法如下:
2.2.1)最优二次型控制问题建立;
性能指标函数可以表示为:
其中,是半正定对称矩阵,是正定对称矩阵,x(k)为k时刻状态量,u(k)为k时刻控制量,参数矩阵Q,R代表了控制器对于驾驶风格、舒适性及经济性的要求,这里将其定义为:
将其带入式(5),性能指标函数也可以表示为:
这里可以清楚看到,惩罚项表征了跟车性能,即到达稳态状态时,本车以期望的纵向车速下与前方车辆保持期望的跟车距离,惩罚项期望最小化燃油消耗,惩罚项期望提高本车舒适性,减少频繁的加减速操作;
2.2.2)最优二次型控制问题求解;
定义离散哈密顿方程求解上述优化问题,对于求解优化问题(5),离散哈密顿方程定义为:
其中,是拉格朗日乘子,x(k),u(k),d(k),Q,R,A,Bu,Bd的定义如前所述且在下面公式推导过程中不发生改变,根据及极小值原理使哈密顿函数H(k)最小的最优解需要满足:
Qx(k)+ATλ(k+1)-λ(k)=0 (7b)
由于R的逆矩阵R-1存在,由(7a)可得:
这里对于λ(k)选择以下这种形式:
λ(k)=Px(k)+hd(x) (9)
其中,是哈密顿矩阵,将式(8)、(9)代入状态方程(4)得到:
同时把式(9)代入式(7b)得到:
(Q-R)x(k)+ATPx(k+1)+AThd(k+1)-hd(k)=0 (11)
将式(10)代入式(11)得到:
由于式(12)需对所有x(k)成立,由此得到黎卡提方程:
由于黎卡提方程(13)转化为:
因为d(k+1)在当前k时刻未知,不失一般性,假设d(k+1)=d(k),式(14)变为
因此,关于h的显式解为;
其中,由此,综合式(7b)、(8)、(9),最优控制律为:
其中,是控制器增益。由此分析得到,可以通过改变控制器增益对驾驶风格区分。
2.2.3)考虑不确定性的前车加速度估计;
使用前方车辆车速,通过两个一阶低通滤波器对前车加速度进行估计,最后使用一个曲率限制器限制加速度的异常变化;
2.3)跟车驾驶风格自学习模块
针对特定驾驶员驾驶风格会有所差异的特性,基于强化学习方法对特定驾驶员的驾驶风格进行学习,进而调节最优巡航控制问题的控制参数,达到自学习***功能;具体方法如下;
2.3.1)特定驾驶员驾驶风格定义;
基于大量驾驶员统计数据分析结果,使用通常的驾驶风格分类方法,将驾驶员分为激进,稳健,保守三类;激进驾驶员倾向于与前方车辆保持较近的距离,并且频繁加减速;而保守驾驶员倾向于与前方车辆保持较远距离,且较少加减速;***使用自适应巡航***中常用的变量车头时距去表征这种行为风格;
2.3.2)强化学习方法建立
由于实际驾驶员风格信息在***设计时未知,***使用强化学习方法对特定驾驶员驾驶风格进行学习;当黎卡提方程被求解,则强化学习完成同时***学习到驾驶员的驾驶风格习性;在线性离散***中的线性二次型问题中,Q函数是强化学习中的状态动作值函数,是关于状态量和控制量的二次形式,可以表示为:
其中,是强化学习中回报,P是黎卡提解;将***模型式(4)代入式(19)得到
其中,z(k)=[xT(k),dT(k),uT(k)]T,为了后续微分便利性,定义核矩阵:
根据贝尔曼最优性原理,最优解即使得Q函数函数值最小的控制量u(k),即:
因此,对式(20)求导得到:
由式(20),可以得到***参数A,Bd,Bu,Q,R对于核矩阵S的显示表达方式,通过学习方法对核矩阵S使用函数逼近中最小二乘方法求解;
使用线性核函数对Q函数逼近,其可写为:
其中,W=[w1,w2,...,w15]T为权值向量,是基函数,使用参数逼近形式的Q函数,对于无限时域γ=1,则强化学习中贝尔曼方程可以写做:
通过增量式学习,基于驾驶员数据逐步更新逼近最优值,对最优权值向量未知的15个未知参数逼近求解;将式(24)的求解转化为最小二乘法即LS问题求解;确定批训练样本数N,对k时刻的样本,在j次迭代计算,m为整数常数,依次计算:
得到Wj+1的最小二乘估计为:
LS算法收敛后,***将计算学得的控制器增益向量与不同跟车行为风格的驾驶员参数表中给定的三类驾驶员风格增益参数向量的2范数相互比较,选择最合适的驾驶风格类型对控制器参数进行更新;否则,保持原控制器参数,继续学习下一步学习;
具体的算法流程为:
步骤(1):基于不同跟车行为风格的驾驶员参数表中的控制器增益初始化权值向量W,N,m,以及各个驾驶风格的特征参数τAMC,rA,rM和rC
步骤(2):更新并计算得到当前数据集步骤(3):使用LS算法:对权值向量W使用式(26)更新,得到Wj+1
步骤(4):如果LS算法收敛,得到Wj+1,然后更新核矩阵:使用权值向量Wj+1反解核矩阵S各个参数,得到控制器增益估计值:评价所得参数与三种驾驶风格参数向量的2范数比较并选择不同跟车行为风格的驾驶员参数表中最合适的一组参数,更新控制器参数,设置:j=1,并结束计算;并返回车辆跟随驾驶风格;
步骤(5):否则,设置:j=j+1;继续步骤(2)-(4)。
本发明的有益效果为:
1.针对巡航***问题建立最优控制问题框架;
2.预测并在优化问题中考虑前车加速度,避免不必要的加速和制动以提高舒适度;
3.控制问题考虑综合考虑驾驶员驾驶风格,并使用自学习的方法对驾驶员风格进行学习,使得***可针对每个特定驾驶员进行驾驶风格自学习。
4.使用两个一阶低通滤波器对前车加速度进行估计,减少预测复杂度。
附图说明
图1为本发明的***结构框图;
图2为本发明驾驶风格自学习巡航控制***的总体流程示意图;
图3为前方车辆加速估计模块原理图;
图4为实施例中***不考虑驾驶员驾驶风格时的跟车行为表现曲线图;
图5为实施例中考虑驾驶员驾驶风格并进行学习后***的跟车行为表现曲线图。
具体实施方式
为了适应汽车技术的发展对智能驾驶***提出的更高要求,***在保证自适应跟车***性能的情况下,同时具有对于驾驶风格的自学习能力。本发明提出一种具有驾驶风格自学习能力的自适应巡航控制***,该***综合考虑车辆跟随性能以及驾驶员驾驶风格两个因素。首先针对自适应跟车问题建立二阶车辆跟随模型,并基于二次最优型控制方法建立优化问题求解,驾驶风格在车辆跟随控制器中表现为未知控制器参数,为了使***具有对特定驾驶的驾驶风格自学习的能力,结合强化学习方法,对于未知***参数使用函数逼近方法及最小二乘方法求解,有效提高了***对于不同驾驶风格驾驶员对驾驶性的需求。
一种具有驾驶风格学习能力的自适应巡航***,结构框图如图1所示,主要包括:感知融合模块A,跟车控制模块B,跟车驾驶风格自学习模块C,车辆执行控制模块D。感知融合模块A环境感知传感部分采用雷达摄像头融合的方案,其通过自身融合识别算法确认前方待跟随车辆,并得到前方车辆行驶状态信息,包括前方车辆的速度信息、相对车距;从车辆总线CAN网络通讯,得到当前车辆的速度,发动机力矩,制动减速度等信息。以上信息用于车辆跟随控制模块B-a及跟车驾驶风格自学习模块C使用。在跟车控制模块B中,根据确认的前方车辆及前方车辆与当前车辆的行驶状态信息,建立车辆跟随模型,同时建立控制问题,确定优化的目标。前车加速度进行预测模块(如图1模块B-b),其根据确认的前方车辆及前方车辆与当前车辆的行驶状态信息,对前车加速度进行预测;跟车控制器(如图1模块B-a),根据以上状态及预测信息,设计的车辆跟随控制模型及优化求解算法,对前方车辆实现自适应跟随任务。跟车驾驶风格自学习模块(如图1模块C)针对特定驾驶员驾驶风格会有所差异的特性设计,特定驾驶员驾驶风格定义及评价(如图1模块C-a)定义不同驾驶风格驾驶员驾驶风格的控制器相关参数,并使用均方差评价特定驾驶员所属驾驶风格属性;驾驶风格学习模块(如图1模块C-b)对于特定驾驶员,最优巡航控制器参数未知,因此需要使用强化学习方法对***模型参数进行学习;基于特定驾驶员数据,在线性二次型问题中通过对黎卡提方程求解完成强化学习过程,进而调节最优巡航控制问题的控制参数,达到自学习***功能。图2给出了本发明的整体技术方案流程图,具体实施为:车辆感知融合模块(如图1模块A)中,环境感知传感部分采用雷达摄像头融合的方案,其通过自身融合识别算法确认前方待跟随车辆,并得到前方车辆行驶状态信息,包括前方车辆的速度信息、相对车距;从车辆总线(CAN)网络通讯,得到当前车辆的速度,发动机力矩,制动减速度等信息。在***控制的情况下,前车加速度预测子模块(如图1模块B-b)对前车加速度进行估计;跟车控制模块(如图1模块B-a)根据确认的前方车辆及前方车辆与当前车辆的行驶状态信息,以及建立的车辆跟随模型与控制问题,得到优化的控制量,并作用于底层车辆执行控制模块(如图1模块D)进行跟踪控制,并最终输出车辆动力驱动***及制动***控制本车驾驶;***未控制情况下,特定驾驶员驾驶风格定义及评价模块判断驾驶员是否与当前驾驶风格参数相符(如图1模块C-a),跟车驾驶风格自学习模块(如图1模块C-b)使用学习方法,对驾驶风格进行学习,学习收敛后,将***控制参数更新到跟车控制模块中。
本发明具有驾驶风格自学习能力的自适应巡航控制***的各模块的设计及具体工作过程如下:
1)感知融合模块A
感知融合模块A环境感知传感部分采用雷达摄像头融合的方案,其通过自身融合识别算法确认前方待跟随车辆,并得到前方车辆行驶状态信息,包括前方车辆的速度信息、相对车距;从车辆总线(CAN)网络通讯,得到当前车辆的速度,发动机力矩,制动减速度等信息。以上信息用于车辆跟随模块及驾驶风格自学习模块使用。雷达摄像头的可行安装方案为,前挡风玻璃内壁上加装产品级摄像头,摄像头经过内部图像处理算法,可以输出车道线信息,前方障碍物(车辆、行人、自行车等)信息。车辆格栅后部加装产品级毫米波雷达,可以为77Ghz前向长距雷达,雷达能够提供至少40个原始目标信息,经过处理后可输出6个危险目标队列;
2)跟车控制模块B
具有以下子模块,车辆跟随控制模块(如图1模块B-a),前车加速度进行预测模块(如图1模块B-b)。建立车辆跟随模型,同时建立控制问题,确定优化的目标,得到跟车控制器;前车加速度进行预测模块,其根据确认的前方车辆及前方车辆与当前车辆的行驶状态信息,对前车加速度进行预测;包括以下工作过程:
2.1)车辆跟随模型建立(如图1模块B-a):在本模块中,根据自适应跟车问题需求,以及车辆纵向运动学与动力学特性,建立车辆跟随模型;
为了描述车辆在跟车场景下的纵向动力学特性,***引入两个状态变量分别为:
δ=d-dref (1a)
其中,d是本车与前方车辆的相对距离,dref是参考相对距离,dref=d0+τvh,d0是停车安全车距,τ是期望车头时距,vh是本车车速,vt是前方车辆车速。因此,车辆在跟车场景下的纵向动力学微分方程可以使用以上两个状态变量表示:
其中,ah是本车纵向加速度,at是前车纵向加速度,τ是期望车头时距。这里假设本车的内环加速度跟踪控制模块可以被一阶近似展开为:
其中,τi是内环动态时间常数,ah是本车纵向加速度,aref是期望纵向加速度。
在连续***中,状态量选取为控制量为u=aref,将前车加速度建模为***扰动,即扰动量d=ah。因此,车辆跟随***对的连续状态空间方程可以表示为:
其中,ah是本车纵向加速度,aref是期望纵向加速度,τi是内环动态时间常数,τ是期望车头时距。
进一步在控制器设计中,使用零阶保持方法(ZOH)可以得到车辆跟随***的状态空间方程的离散***表达形式,定义离散***的状态向量为控制输入u(k)=aref(k),因此在k时刻可以得到:
x(k+1)=Ax(k)+Buu(k)+Bdd(k)(4)
其中d(k)=ah(k),Ts是采样时间间隔,τ是期望车头时距,τi是内环动态时间常数。
2.2)最优巡航控制问题的建立
这里综合考虑车辆跟随性能中的安全性、舒适性和经济性,以及驾驶员驾驶风格作为多目标优化指标,将最优巡航控制问题建立为线性二次型优化问题。
2.2.1)最优二次型控制问题建立
综合以上所述,性能指标函数可以表示为:
其中,是半正定对称矩阵,是正定对称矩阵。x(k)为k时刻状态量,u(k)为k时刻控制量。参数矩阵Q,R代表了控制器对于驾驶风格、舒适性及经济性的要求,这里将其定义为:
将其带入式(5),性能指标函数也可以表示为:
这里可以清楚看到,惩罚项表征了跟车性能,即到达稳态状态时,本车以期望的纵向车速下与前方车辆保持期望的跟车距离。惩罚项期望最小化燃油消耗,惩罚项期望提高本车舒适性,减少频繁的加减速操作。
2.2.2)最优二次型控制问题求解
定义离散哈密顿方程求解上述优化问题,对于求解优化问题(5),离散哈密顿方程可以定义为:
其中,是拉格朗日乘子,x(k),u(k),d(k),Q,R,A,Bu,Bd的定义如前所述且在下面公式推导过程中不发生改变,根据及极小值原理使哈密顿函数H(k)最小的最优解需要满足:
Qx(k)+ATλ(k+1)-λ(k)=0 (7b)
由于R的逆矩阵R-1存在,由(7a)可得:
这里对于λ(k)选择以下这种形式:
λ(k)=Px(k)+hd(x) (9)
其中,是哈密顿矩阵。将式(8)、(9)代入状态方程(4)得到:
同时把式(9)代入式(7b)得到:
(Q-R)x(k)+ATPx(k+1)+AThd(k+1)-hd(k)=0 (11)
将式(10)代入式(11)得到:
由于式(12)需对所有x(k)成立,由此得到黎卡提方程:
由于黎卡提方程(13)转化为:
因为d(k+1)在当前k时刻未知,不失一般性,假设d(k+1)=d(k),式(14)变为
因此,关于h的显式解为;
其中,由此,综合式(7b)、(8)、(9),最优控制律为:
其中,是控制器增益。由此分析得到,可以通过改变控制器增益对驾驶风格区分。
2.2.3)考虑不确定性的前车加速度估计
在最优跟车问题中,前方车辆的加速度信息是一个重要的考察因素。因此通常需要使用速度信息的差分对前车加速度进行估计。一般有以下几种方式:直接差分方法,但噪声信息影响到估计精度;卡尔曼滤波方法;车-车通信,但存在通信延迟和信息安全问题。为了简化问题,如图3所示,使用前方车辆车速,通过两个一阶低通滤波器对前车加速度进行估计,最后使用一个曲率限制器限制加速度的异常变化。
2.3)跟车驾驶风格自学习模块
针对特定驾驶员驾驶风格会有所差异的特性,基于强化学习方法对特定驾驶员的驾驶风格进行学习,进而调节最优巡航控制问题的控制参数,达到自学习***功能。
2.3.1)特定驾驶员驾驶风格定义
基于大量驾驶员统计数据分析结果,使用通常的驾驶风格分类方法,将驾驶员分为激进,稳健,保守三类。激进驾驶员倾向于与前方车辆保持较近的距离,并且频繁加减速;而保守驾驶员倾向于与前方车辆保持较远距离,且较少加减速。***使用自适应巡航***中常用的变量车头时距去表征这种行为风格。因此,本***的控制器相关参数相应的设定为表1中所示:
表1 不同跟车行为风格的驾驶员参数
2.3.2)强化学习方法建立
由于实际驾驶员风格信息在***设计时未知,***使用强化学习方法对特定驾驶员驾驶风格进行学习。当黎卡提方程被求解,则强化学习完成同时***学习到驾驶员的驾驶风格习性。在线性离散***中的线性二次型问题中,Q函数是强化学习中的状态动作值函数,是关于状态量和控制量的二次形式,可以表示为:
其中是强化学习中回报,P是黎卡提解。对于x(k),u(k),d(k),Q,R,A,Bu,Bd等符号在本小节中,依旧保持原来的物理及数值意义。将***模型式(4)代入式(19)得到
其中,z(k)=[xT(k),dT(k),uT(k)]T。为了后续微分便利性,定义核矩阵:
根据贝尔曼最优性原理,最优解即使得Q函数函数值最小的控制量u(k),即:
因此,对式(20)求导得到:
由式(20),可以得到***参数A,Bd,Bu,Q,R对于核矩阵S的显示表达方式,通过学习方法对核矩阵S使用函数逼近中最小二乘方法求解。
使用线性核函数对Q函数逼近,其可写为:
其中,W=[w1,w2,...,w15]T为权值向量,是基函数,使用参数逼近形式的Q函数,对于无限时域γ=1,则强化学习中贝尔曼方程可以写做:
通过增量式学习,基于驾驶员数据逐步更新逼近最优值,对最优权值向量未知的15个未知参数逼近求解。将式(24)的求解转化为最小二乘法问题求解(LS)。确定批训练样本数N,对k时刻的样本,在j次迭代计算,m为整数常数,依次计算:
得到Wj+1的最小二乘估计为:
LS算法收敛后,***将计算学得的控制器增益向量与表1中给定的三类驾驶员风格增益参数向量的2范数相互比较,选择最合适的驾驶风格类型对控制器参数进行更新;否则,保持原控制器参数,继续学习下一步学习。
因此,在基于强化学习的驾驶风格学习算法学习驾驶风格的过程中,具体的算法流程为:步骤(1):基于表格1中的控制器增益初始化权值向量W,N,m,以及各个驾驶风格的特征参数τAMC,rA,rM和rC
步骤(2):更新并计算得到当前数据集步骤(3):使用LS算法:对权值向量W使用式(26)更新,得到Wj+1
步骤(4):如果LS算法收敛,得到Wj+1,然后更新核矩阵:使用权值向量Wj+1反解核矩阵S各个参数,得到控制器增益估计值:评价所得参数与三种驾驶风格参数向量的2范数比较并选择表格1中最合适的一组参数,更新控制器参数,设置:j=1,并结束计算。并返回车辆跟随驾驶风格。
步骤(5):否则,设置:j=j+1。继续步骤(2)-(4)。
对以上所述具有驾驶风格自学习能力的自适应巡航控制***及实现方法,下面使用一实际***参数,验证此方法的有效性,***控制器设计参数有,式(6)中,q11=0.15,q22=0.73,q23=0.2,内环动态时间常数τi=0.9,安全距离d0=3,前方车辆加速估计模块参数τ1=0.4,τ2=0.2。对实际采集的驾驶员进行跟车风格学习后,最终在试车中验证驾驶员的跟车表现,图4为***不考虑驾驶员驾驶风格时的跟车行为表现,图5为考虑驾驶员驾驶风格并进行学习后***的跟车行为表现。

Claims (3)

1.一种具有驾驶风格学习能力的自适应巡航***,其特征在于,该***包括感知融合模块(A)、跟车控制模块(B)、驾驶风格自学习模块(C)和车辆执行控制模块(D);
感知融合模块(A),用于得到前方车辆行驶状态信息,包括前方车辆的速度信息、相对车距;
跟车控制模块(B)包括车辆跟随控制模块(B—a)和前车加速度进行预测模块(B—b),车辆跟随控制模块(B—a)用于建立车辆跟随模型,同时建立控制问题,确定优化的目标,得到跟车控制器;前车加速度进行预测模块(B—b),用于根据确认的前方车辆及前方车辆与当前车辆的行驶状态信息,对前车加速度进行预测;
驾驶风格自学习模块(C),用于针对特定驾驶员驾驶风格会有所差异的特性,基于强化学习方法对特定驾驶员的驾驶风格进行学习,进而调节最优巡航控制问题的控制参数,达到自学习***功能;
车辆执行控制模块(D),用于进行跟踪控制,并最终输出车辆动力驱动***及制动***控制本车驾驶;
所述的感知融合模块(A)与跟车控制模块(B)以及驾驶风格自学习模块(C)单向连接;所述的跟车控制模块(B)与车辆执行控制模块(D)单向连接;所述的驾驶风格自学习模块(C)与跟车控制模块(B)单向连接;所述的车辆执行控制模块(D)与车辆单向连接。
2.根据权利要求1所述的一种具有驾驶风格学习能力的自适应巡航***的实现方法,其特征在于,该方法包括以下步骤:
步骤一、通过感知融合模块(A)自身融合识别算法确认前方待跟随车辆,并得到前方车辆行驶状态信息,包括前方车辆的速度信息、相对车距;并且从车辆总线即CAN网络通讯,得到当前车辆的速度,发动机力矩,制动减速度等信息;
步骤二、通过跟车控制模块(B)中的车辆跟随控制模块(B—a)建立车辆跟随模型,同时建立控制问题,确定优化的目标,得到跟车控制器;通过跟车控制模块(B)中的前车加速度进行预测模块(B—b),使用前方车辆车速,通过两个一阶低通滤波器对前车加速度进行估计,并使用一个曲率限制器限制加速度的异常变化,对前车加速度进行预测;
步骤三、通过驾驶风格自学习模块(C),针对特定驾驶员驾驶风格会有所差异的特性,基于强化学习方法对特定驾驶员的驾驶风格进行学习,进而调节最优巡航控制问题的控制参数,达到自学习***功能;
步骤四、通过底层车辆执行控制模块(D)进行跟踪控制,并最终输出车辆动力驱动***及制动***控制本车驾驶。
3.根据权利要求2所述的一种具有驾驶风格学习能力的自适应巡航***的实现方法,其特征在于,该方法包括以下步骤:
所述的步骤二的具体方法如下:
2.1)车辆跟随模型建立:根据自适应跟车问题需求,以及车辆纵向运动学与动力学特性,建立车辆跟随模型;
为了描述车辆在跟车场景下的纵向动力学特性,***引入两个状态变量δ,分别为:
δ=d-dref (1a)
其中,d是本车与前方车辆的相对距离,dref是参考相对距离,dref=d0+τvh,d0是停车安全车距,τ是期望车头时距,vh是本车车速,vt是前方车辆车速;因此,车辆在跟车场景下的纵向动力学微分方程可以使用以上两个状态变量表示:
其中,ah是本车纵向加速度,at是前车纵向加速度,τ是期望车头时距;这里假设本车的内环加速度跟踪控制模块可以被一阶近似展开为:
其中,τi是内环动态时间常数,ah是本车纵向加速度,aref是期望纵向加速度;
在连续***中,状态量选取为控制量为u=aref,将前车加速度建模为***扰动,即扰动量d=ah;因此,车辆跟随***对的连续状态空间方程可以表示为:
其中,ah是本车纵向加速度,aref是期望纵向加速度,τi是内环动态时间常数,τ是期望车头时距;
在控制器设计中,使用零阶保持方法即ZOH得到车辆跟随***的状态空间方程的离散***表达形式,定义离散***的状态向量为控制输入u(k)=aref(k),因此在k时刻可以得到:
x(k+1)=Ax(k)+Buu(k)+Bdd(k) (4)
其中d(k)=ah(k),Ts是采样时间间隔,τ是期望车头时距,τi是内环动态时间常数;
2.2)将最优巡航控制问题建立为线性二次型优化问题,具体方法如下:
2.2.1)最优二次型控制问题建立;
性能指标函数可以表示为:
其中,是半正定对称矩阵,是正定对称矩阵,x(k)为k时刻状态量,u(k)为k时刻控制量,参数矩阵Q,R代表了控制器对于驾驶风格、舒适性及经济性的要求,这里将其定义为:
将其带入式(5),性能指标函数也可以表示为:
这里可以清楚看到,惩罚项表征了跟车性能,即到达稳态状态时,本车以期望的纵向车速下与前方车辆保持期望的跟车距离,惩罚项期望最小化燃油消耗,惩罚项期望提高本车舒适性,减少频繁的加减速操作;
2.2.2)最优二次型控制问题求解;
定义离散哈密顿方程求解上述优化问题,对于求解优化问题(5),离散哈密顿方程定义为:
其中,是拉格朗日乘子,x(k),u(k),d(k),Q,R,A,Bu,Bd的定义如前所述且在下面公式推导过程中不发生改变,根据及极小值原理使哈密顿函数H(k)最小的最优解需要满足:
Qx(k)+ATλ(k+1)-λ(k)=0 (7b)
由于R的逆矩阵R-1存在,由(7a)可得:
这里对于λ(k)选择以下这种形式:
λ(k)=Px(k)+hd(x) (9)
其中,是哈密顿矩阵,将式(8)、(9)代入状态方程(4)得到:
同时把式(9)代入式(7b)得到:
(Q-R)x(k)+ATPx(k+1)+AThd(k+1)-hd(k)=0 (11)
将式(10)代入式(11)得到:
由于式(12)需对所有x(k)成立,由此得到黎卡提方程:
由于黎卡提方程(13)转化为:
因为d(k+1)在当前k时刻未知,不失一般性,假设d(k+1)=d(k),式(14)变为
因此,关于h的显式解为;
其中,由此,综合式(7b)、(8)、(9),最优控制律为:
其中,是控制器增益。由此分析得到,可以通过改变控制器增益对驾驶风格区分。
2.2.3)考虑不确定性的前车加速度估计;
使用前方车辆车速,通过两个一阶低通滤波器对前车加速度进行估计,最后使用一个曲率限制器限制加速度的异常变化;
2.3)跟车驾驶风格自学习模块
针对特定驾驶员驾驶风格会有所差异的特性,基于强化学习方法对特定驾驶员的驾驶风格进行学习,进而调节最优巡航控制问题的控制参数,达到自学习***功能;具体方法如下;
2.3.1)特定驾驶员驾驶风格定义;
基于大量驾驶员统计数据分析结果,使用通常的驾驶风格分类方法,将驾驶员分为激进,稳健,保守三类;激进驾驶员倾向于与前方车辆保持较近的距离,并且频繁加减速;而保守驾驶员倾向于与前方车辆保持较远距离,且较少加减速;***使用自适应巡航***中常用的变量车头时距去表征这种行为风格;
2.3.2)强化学习方法建立
由于实际驾驶员风格信息在***设计时未知,***使用强化学习方法对特定驾驶员驾驶风格进行学习;当黎卡提方程被求解,则强化学习完成同时***学习到驾驶员的驾驶风格习性;在线性离散***中的线性二次型问题中,Q函数是强化学习中的状态动作值函数,是关于状态量和控制量的二次形式,可以表示为:
其中,是强化学习中回报,P是黎卡提解;将***模型式(4)代入式(19)得到
其中,z(k)=[xT(k),dT(k),uT(k)]T,为了后续微分便利性,定义核矩阵:
根据贝尔曼最优性原理,最优解即使得Q函数函数值最小的控制量u(k),即:
因此,对式(20)求导得到:
由式(20),可以得到***参数A,Bd,Bu,Q,R对于核矩阵S的显示表达方式,通过学习方法对核矩阵S使用函数逼近中最小二乘方法求解;
使用线性核函数对Q函数逼近,其可写为:
其中,W=[w1,w2,...,w15]T为权值向量,是基函数,使用参数逼近形式的Q函数,对于无限时域γ=1,则强化学习中贝尔曼方程可以写做:
通过增量式学习,基于驾驶员数据逐步更新逼近最优值,对最优权值向量未知的15个未知参数逼近求解;将式(24)的求解转化为最小二乘法即LS问题求解;确定批训练样本数N,对k时刻的样本,在j次迭代计算,m为整数常数,依次计算:
得到Wj+1的最小二乘估计为:
LS算法收敛后,***将计算学得的控制器增益向量与不同跟车行为风格的驾驶员参数表中给定的三类驾驶员风格增益参数向量的2范数相互比较,选择最合适的驾驶风格类型对控制器参数进行更新;否则,保持原控制器参数,继续学习下一步学习;
具体的算法流程为:
步骤(1):基于不同跟车行为风格的驾驶员参数表中的控制器增益初始化权值向量W,N,m,以及各个驾驶风格的特征参数τAMC,rA,rM和rC
步骤(2):更新并计算得到当前数据集
步骤(3):使用LS算法:对权值向量W使用式(26)更新,得到Wj+1
步骤(4):如果LS算法收敛,得到Wj+1,然后更新核矩阵:使用权值向量Wj+1反解核矩阵S各个参数,得到控制器增益估计值:评价所得参数与三种驾驶风格参数向量的2范数比较并选择不同跟车行为风格的驾驶员参数表中最合适的一组参数,更新控制器参数,设置:j=1,并结束计算;并返回车辆跟随驾驶风格;
步骤(5):否则,设置:j=j+1;继续步骤(2)-(4)。
CN201910077516.9A 2019-01-28 2019-01-28 一种具有驾驶风格学习能力的自适应巡航***及实现方法 Active CN109927725B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910077516.9A CN109927725B (zh) 2019-01-28 2019-01-28 一种具有驾驶风格学习能力的自适应巡航***及实现方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910077516.9A CN109927725B (zh) 2019-01-28 2019-01-28 一种具有驾驶风格学习能力的自适应巡航***及实现方法

Publications (2)

Publication Number Publication Date
CN109927725A true CN109927725A (zh) 2019-06-25
CN109927725B CN109927725B (zh) 2020-11-03

Family

ID=66985173

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910077516.9A Active CN109927725B (zh) 2019-01-28 2019-01-28 一种具有驾驶风格学习能力的自适应巡航***及实现方法

Country Status (1)

Country Link
CN (1) CN109927725B (zh)

Cited By (36)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110341710A (zh) * 2019-07-02 2019-10-18 浙江吉利控股集团有限公司 一种自适应巡航控制方法、装置及设备
CN110568758A (zh) * 2019-09-12 2019-12-13 中汽研(天津)汽车工程研究院有限公司 一种自动驾驶汽车的参数自适应横向运动lqr控制方法
CN110949386A (zh) * 2019-11-28 2020-04-03 江苏大学 可识别驾驶倾向的车辆自适应巡航控制***及方法
CN111267847A (zh) * 2020-02-11 2020-06-12 吉林大学 一种个性化的自适应巡航控制***
CN111452630A (zh) * 2020-04-14 2020-07-28 江西精骏电控技术有限公司 一种新能源汽车电机控制器及其控制方法
CN111474934A (zh) * 2020-04-26 2020-07-31 东风汽车集团有限公司 一种基于高精度地图的个性化巡航控制***
CN111547064A (zh) * 2020-05-26 2020-08-18 吉林大学 一种用于汽车自适应巡航***的驾驶风格识别和分类方法
CN111738294A (zh) * 2020-05-21 2020-10-02 深圳海普参数科技有限公司 Ai模型的训练方法、使用方法、计算机设备及存储介质
CN111897213A (zh) * 2020-06-18 2020-11-06 中山大学 一种模型不确定下的汽车自适应巡航控制方法
CN112033429A (zh) * 2020-09-14 2020-12-04 吉林大学 一种智能汽车的目标级多传感器融合方法
CN112109708A (zh) * 2020-10-26 2020-12-22 吉林大学 一种考虑驾驶行为的自适应巡航控制***及其控制方法
CN112158200A (zh) * 2020-09-25 2021-01-01 厦门大学 基于驾驶员特性的智能电动汽车跟车控制***及方法
CN112172813A (zh) * 2020-10-14 2021-01-05 长安大学 基于深度逆强化学习的模拟驾驶风格的跟车***及方法
CN112466119A (zh) * 2020-11-26 2021-03-09 清华大学 一种利用车路协同数据的汽车跟车车速预测方法及***
CN112677982A (zh) * 2020-12-25 2021-04-20 重庆大学 基于驾驶员特性的车辆纵向速度规划方法
CN112721949A (zh) * 2021-01-12 2021-04-30 重庆大学 一种自动驾驶车辆纵向驾驶拟人化程度评价方法
CN112896161A (zh) * 2021-02-08 2021-06-04 杭州电子科技大学 一种基于强化学习的电动汽车生态自适应巡航控制***
CN112937592A (zh) * 2021-03-23 2021-06-11 武汉理工大学 基于车头时距来辨识驾驶风格的方法及***
CN113060146A (zh) * 2021-05-12 2021-07-02 中国第一汽车股份有限公司 一种纵向跟踪控制方法、装置、设备及存储介质
CN113232652A (zh) * 2021-06-16 2021-08-10 武汉光庭信息技术股份有限公司 一种基于运动学模型的车辆巡航控制方法及***
CN113401125A (zh) * 2021-07-29 2021-09-17 中国第一汽车股份有限公司 纵向跟车控制方法、装置、电子设备及存储介质
CN113428164A (zh) * 2021-07-21 2021-09-24 上汽通用五菱汽车股份有限公司 驾驶习惯学习方法、装置及计算机可读存储介质
TWI751511B (zh) * 2019-09-05 2022-01-01 日商三菱電機股份有限公司 推論裝置、機器控制系統以及學習裝置
CN114030472A (zh) * 2022-01-10 2022-02-11 智道网联科技(北京)有限公司 一种自适应巡航的控制方法、装置、设备及可读存储介质
CN114132333A (zh) * 2021-12-14 2022-03-04 阿维塔科技(重庆)有限公司 一种智能驾驶***优化方法、装置及计算机可读存储介质
CN114167406A (zh) * 2021-11-24 2022-03-11 英博超算(南京)科技有限公司 一种通过融合减小雷达误报的***
CN114312777A (zh) * 2022-01-17 2022-04-12 北京格睿能源科技有限公司 一种燃料电池重卡预见性巡航控制方法及***
CN114435379A (zh) * 2022-01-07 2022-05-06 所托(杭州)汽车智能设备有限公司 车辆经济性驾驶控制方法及装置
CN114488799A (zh) * 2022-01-11 2022-05-13 吉林大学 汽车自适应巡航***控制器参数优化方法
CN114492043A (zh) * 2022-01-27 2022-05-13 吉林大学 考虑感知受限特性的个性化驾驶员跟车建模方法
CN114771520A (zh) * 2022-03-31 2022-07-22 中南大学 一种基于强化学习的电动汽车经济性自适应巡航控制方法及***
WO2022237212A1 (zh) * 2021-05-10 2022-11-17 江苏大学 基于复杂网络的自动驾驶汽车复杂环境模型、认知***及认知方法
CN116052412A (zh) * 2022-11-23 2023-05-02 兰州大学 融合物理信息和深度强化学习的自动驾驶车辆控制方法
CN117037524A (zh) * 2023-09-26 2023-11-10 苏州易百特信息科技有限公司 智慧停车场景下车道跟车优化方法及***
CN117644870A (zh) * 2024-01-30 2024-03-05 吉林大学 一种基于情景感知的驾驶焦虑检测与车辆控制方法及***
CN114771520B (zh) * 2022-03-31 2024-08-02 中南大学 一种基于强化学习的电动汽车经济性自适应巡航控制方法及***

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101357636A (zh) * 2007-07-31 2009-02-04 通用汽车环球科技运作公司 具有地图预览时间和驾驶模式选择的弯道速度控制***
CN101633359A (zh) * 2008-07-24 2010-01-27 通用汽车环球科技运作公司 具有驾驶风格识别的自适应车辆控制***
DE102010028140A1 (de) * 2010-04-23 2013-03-21 Zf Lenksysteme Gmbh Fahrerassistenzverfahren für ein Kraftfahrzeug mit einer Spurführungsassistenzfunktion
CN104925057A (zh) * 2015-06-26 2015-09-23 武汉理工大学 一种具有多模式切换体系的汽车自适应巡航***及其控制方法
DE102016205260A1 (de) * 2016-03-31 2017-10-05 Bayerische Motoren Werke Aktiengesellschaft Verfahren zur automatisierten Anpassung der Geschwindigkeit eines Fahrzeugs
CN107499262A (zh) * 2017-10-17 2017-12-22 芜湖伯特利汽车安全***股份有限公司 基于机器学习的acc/aeb***及车辆
CN107544518A (zh) * 2017-10-17 2018-01-05 芜湖伯特利汽车安全***股份有限公司 基于拟人驾驶的acc/aeb***及车辆
CN107832517A (zh) * 2017-11-01 2018-03-23 合肥创宇新能源科技有限公司 基于相对运动关系的acc纵向运动学建模方法
CN108944930A (zh) * 2018-07-05 2018-12-07 合肥工业大学 一种基于lstm的模拟驾驶员特性的自动跟车方法及***

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101357636A (zh) * 2007-07-31 2009-02-04 通用汽车环球科技运作公司 具有地图预览时间和驾驶模式选择的弯道速度控制***
CN101633359A (zh) * 2008-07-24 2010-01-27 通用汽车环球科技运作公司 具有驾驶风格识别的自适应车辆控制***
DE102010028140A1 (de) * 2010-04-23 2013-03-21 Zf Lenksysteme Gmbh Fahrerassistenzverfahren für ein Kraftfahrzeug mit einer Spurführungsassistenzfunktion
CN104925057A (zh) * 2015-06-26 2015-09-23 武汉理工大学 一种具有多模式切换体系的汽车自适应巡航***及其控制方法
DE102016205260A1 (de) * 2016-03-31 2017-10-05 Bayerische Motoren Werke Aktiengesellschaft Verfahren zur automatisierten Anpassung der Geschwindigkeit eines Fahrzeugs
CN107499262A (zh) * 2017-10-17 2017-12-22 芜湖伯特利汽车安全***股份有限公司 基于机器学习的acc/aeb***及车辆
CN107544518A (zh) * 2017-10-17 2018-01-05 芜湖伯特利汽车安全***股份有限公司 基于拟人驾驶的acc/aeb***及车辆
CN107832517A (zh) * 2017-11-01 2018-03-23 合肥创宇新能源科技有限公司 基于相对运动关系的acc纵向运动学建模方法
CN108944930A (zh) * 2018-07-05 2018-12-07 合肥工业大学 一种基于lstm的模拟驾驶员特性的自动跟车方法及***

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
梁军: "基于Multi-Agent和驾驶行为的汽车追尾预警***关键理论与技术研究", 《中国知网全文数据库》 *
罗莉华: "汽车自适应巡航控制及相应宏观交通流模型研究", 《中国知网全文数据库》 *

Cited By (54)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110341710A (zh) * 2019-07-02 2019-10-18 浙江吉利控股集团有限公司 一种自适应巡航控制方法、装置及设备
TWI751511B (zh) * 2019-09-05 2022-01-01 日商三菱電機股份有限公司 推論裝置、機器控制系統以及學習裝置
CN110568758A (zh) * 2019-09-12 2019-12-13 中汽研(天津)汽车工程研究院有限公司 一种自动驾驶汽车的参数自适应横向运动lqr控制方法
CN110568758B (zh) * 2019-09-12 2022-07-01 中汽研(天津)汽车工程研究院有限公司 一种自动驾驶汽车的参数自适应横向运动lqr控制方法
CN110949386A (zh) * 2019-11-28 2020-04-03 江苏大学 可识别驾驶倾向的车辆自适应巡航控制***及方法
CN111267847A (zh) * 2020-02-11 2020-06-12 吉林大学 一种个性化的自适应巡航控制***
CN111267847B (zh) * 2020-02-11 2021-08-17 吉林大学 一种个性化的自适应巡航控制***
CN111452630A (zh) * 2020-04-14 2020-07-28 江西精骏电控技术有限公司 一种新能源汽车电机控制器及其控制方法
CN111474934A (zh) * 2020-04-26 2020-07-31 东风汽车集团有限公司 一种基于高精度地图的个性化巡航控制***
CN111738294A (zh) * 2020-05-21 2020-10-02 深圳海普参数科技有限公司 Ai模型的训练方法、使用方法、计算机设备及存储介质
CN111738294B (zh) * 2020-05-21 2024-05-14 深圳海普参数科技有限公司 Ai模型的训练方法、使用方法、计算机设备及存储介质
CN111547064A (zh) * 2020-05-26 2020-08-18 吉林大学 一种用于汽车自适应巡航***的驾驶风格识别和分类方法
CN111547064B (zh) * 2020-05-26 2022-07-12 吉林大学 一种用于汽车自适应巡航***的驾驶风格识别和分类方法
CN111897213A (zh) * 2020-06-18 2020-11-06 中山大学 一种模型不确定下的汽车自适应巡航控制方法
CN112033429A (zh) * 2020-09-14 2020-12-04 吉林大学 一种智能汽车的目标级多传感器融合方法
CN112033429B (zh) * 2020-09-14 2022-07-19 吉林大学 一种智能汽车的目标级多传感器融合方法
CN112158200B (zh) * 2020-09-25 2022-04-01 厦门大学 基于驾驶员特性的智能电动汽车跟车控制***及方法
CN112158200A (zh) * 2020-09-25 2021-01-01 厦门大学 基于驾驶员特性的智能电动汽车跟车控制***及方法
CN112172813A (zh) * 2020-10-14 2021-01-05 长安大学 基于深度逆强化学习的模拟驾驶风格的跟车***及方法
CN112109708B (zh) * 2020-10-26 2023-07-14 吉林大学 一种考虑驾驶行为的自适应巡航控制***及其控制方法
CN112109708A (zh) * 2020-10-26 2020-12-22 吉林大学 一种考虑驾驶行为的自适应巡航控制***及其控制方法
CN112466119A (zh) * 2020-11-26 2021-03-09 清华大学 一种利用车路协同数据的汽车跟车车速预测方法及***
CN112677982A (zh) * 2020-12-25 2021-04-20 重庆大学 基于驾驶员特性的车辆纵向速度规划方法
CN112721949B (zh) * 2021-01-12 2022-07-12 重庆大学 一种自动驾驶车辆纵向驾驶拟人化程度评价方法
CN112721949A (zh) * 2021-01-12 2021-04-30 重庆大学 一种自动驾驶车辆纵向驾驶拟人化程度评价方法
CN112896161A (zh) * 2021-02-08 2021-06-04 杭州电子科技大学 一种基于强化学习的电动汽车生态自适应巡航控制***
CN112896161B (zh) * 2021-02-08 2022-06-21 杭州电子科技大学 一种基于强化学习的电动汽车生态自适应巡航控制***
CN112937592A (zh) * 2021-03-23 2021-06-11 武汉理工大学 基于车头时距来辨识驾驶风格的方法及***
CN112937592B (zh) * 2021-03-23 2022-04-15 武汉理工大学 基于车头时距来辨识驾驶风格的方法及***
WO2022237212A1 (zh) * 2021-05-10 2022-11-17 江苏大学 基于复杂网络的自动驾驶汽车复杂环境模型、认知***及认知方法
CN113060146A (zh) * 2021-05-12 2021-07-02 中国第一汽车股份有限公司 一种纵向跟踪控制方法、装置、设备及存储介质
CN113232652A (zh) * 2021-06-16 2021-08-10 武汉光庭信息技术股份有限公司 一种基于运动学模型的车辆巡航控制方法及***
CN113428164B (zh) * 2021-07-21 2023-01-03 上汽通用五菱汽车股份有限公司 驾驶习惯学习方法、装置及计算机可读存储介质
CN113428164A (zh) * 2021-07-21 2021-09-24 上汽通用五菱汽车股份有限公司 驾驶习惯学习方法、装置及计算机可读存储介质
CN113401125A (zh) * 2021-07-29 2021-09-17 中国第一汽车股份有限公司 纵向跟车控制方法、装置、电子设备及存储介质
CN114167406B (zh) * 2021-11-24 2024-06-18 英博超算(南京)科技有限公司 一种通过融合减小雷达误报的***
CN114167406A (zh) * 2021-11-24 2022-03-11 英博超算(南京)科技有限公司 一种通过融合减小雷达误报的***
CN114132333A (zh) * 2021-12-14 2022-03-04 阿维塔科技(重庆)有限公司 一种智能驾驶***优化方法、装置及计算机可读存储介质
CN114435379B (zh) * 2022-01-07 2023-06-20 所托(杭州)汽车智能设备有限公司 车辆经济性驾驶控制方法及装置
CN114435379A (zh) * 2022-01-07 2022-05-06 所托(杭州)汽车智能设备有限公司 车辆经济性驾驶控制方法及装置
CN114030472A (zh) * 2022-01-10 2022-02-11 智道网联科技(北京)有限公司 一种自适应巡航的控制方法、装置、设备及可读存储介质
CN114488799B (zh) * 2022-01-11 2024-02-23 吉林大学 汽车自适应巡航***控制器参数优化方法
CN114488799A (zh) * 2022-01-11 2022-05-13 吉林大学 汽车自适应巡航***控制器参数优化方法
CN114312777A (zh) * 2022-01-17 2022-04-12 北京格睿能源科技有限公司 一种燃料电池重卡预见性巡航控制方法及***
CN114492043B (zh) * 2022-01-27 2023-12-19 吉林大学 考虑感知受限特性的个性化驾驶员跟车建模方法
CN114492043A (zh) * 2022-01-27 2022-05-13 吉林大学 考虑感知受限特性的个性化驾驶员跟车建模方法
CN114771520A (zh) * 2022-03-31 2022-07-22 中南大学 一种基于强化学习的电动汽车经济性自适应巡航控制方法及***
CN114771520B (zh) * 2022-03-31 2024-08-02 中南大学 一种基于强化学习的电动汽车经济性自适应巡航控制方法及***
CN116052412A (zh) * 2022-11-23 2023-05-02 兰州大学 融合物理信息和深度强化学习的自动驾驶车辆控制方法
CN116052412B (zh) * 2022-11-23 2023-08-18 兰州大学 融合物理信息和深度强化学习的自动驾驶车辆控制方法
CN117037524A (zh) * 2023-09-26 2023-11-10 苏州易百特信息科技有限公司 智慧停车场景下车道跟车优化方法及***
CN117037524B (zh) * 2023-09-26 2023-12-22 苏州易百特信息科技有限公司 智慧停车场景下车道跟车优化方法及***
CN117644870A (zh) * 2024-01-30 2024-03-05 吉林大学 一种基于情景感知的驾驶焦虑检测与车辆控制方法及***
CN117644870B (zh) * 2024-01-30 2024-03-26 吉林大学 一种基于情景感知的驾驶焦虑检测与车辆控制方法及***

Also Published As

Publication number Publication date
CN109927725B (zh) 2020-11-03

Similar Documents

Publication Publication Date Title
CN109927725A (zh) 一种具有驾驶风格学习能力的自适应巡航***及实现方法
CN109624986B (zh) 一种基于模式切换的驾驶风格的学习巡航控制***及方法
CN110568760B (zh) 适用于换道及车道保持的参数化学习决策控制***及方法
CN108944930B (zh) 一种基于lstm的模拟驾驶员特性的自动跟车方法及***
CN112162555B (zh) 混合车队中基于强化学习控制策略的车辆控制方法
CN107808027B (zh) 基于改进模型预测控制的自适应跟车方法
CN110103956A (zh) 一种无人车自动超车轨迹规划方法
CN111985614A (zh) 一种构建自动驾驶决策***的方法、***和介质
CN112498354B (zh) 考虑个性化驾驶体验的多时间尺度自学习变道方法
JP6721121B2 (ja) 制御カスタマイズシステム、制御カスタマイズ方法および制御カスタマイズプログラム
CN113791615A (zh) 一种混合车辆队列分布式模型预测控制方法
CN115598983B (zh) 一种考虑时变时延的无人车横纵向协同控制方法及装置
CN110490275A (zh) 一种基于迁移学习的驾驶行为预测方法
CN111625989A (zh) 一种基于a3c-sru的智能车汇入车流方法及***
Jiang et al. Implementation of human-like driver model based on recurrent neural networks
CN113655794A (zh) 基于鲁棒模型预测控制的多车协同控制方法
CN115257809A (zh) 一种人在环的自动驾驶车辆交互学习控制方法及设备
CN111391831A (zh) 一种基于前车速度预测的汽车跟驰速度控制方法及***
CN110103960B (zh) 车辆自适应巡航控制方法、***及车辆
CN114802306A (zh) 一种基于人机共驾理念的智能车辆集成式决策***
Li et al. Reinforcement learning based lane change decision-making with imaginary sampling
CN115352443B (zh) 一种基于旁车切入识别的自适应巡航控制方法及设备
CN115848369A (zh) 一种基于深度强化学习的个性化自适应巡航***及其控制方法
CN115700626A (zh) 用于车辆的奖励函数
Scheidel et al. A novel approach of a deep reinforcement learning based motion cueing algorithm for vehicle driving simulation

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant