CN112622886A - 一种综合考虑前后障碍物的重型营运车辆防碰撞预警方法 - Google Patents

一种综合考虑前后障碍物的重型营运车辆防碰撞预警方法 Download PDF

Info

Publication number
CN112622886A
CN112622886A CN202011512720.8A CN202011512720A CN112622886A CN 112622886 A CN112622886 A CN 112622886A CN 202011512720 A CN202011512720 A CN 202011512720A CN 112622886 A CN112622886 A CN 112622886A
Authority
CN
China
Prior art keywords
driving
vehicle
network
collision
function
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202011512720.8A
Other languages
English (en)
Other versions
CN112622886B (zh
Inventor
李旭
胡玮明
胡锦超
常彬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Southeast University
Original Assignee
Southeast University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Southeast University filed Critical Southeast University
Priority to CN202011512720.8A priority Critical patent/CN112622886B/zh
Publication of CN112622886A publication Critical patent/CN112622886A/zh
Application granted granted Critical
Publication of CN112622886B publication Critical patent/CN112622886B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W30/00Purposes of road vehicle drive control systems not related to the control of a particular sub-unit, e.g. of systems using conjoint control of vehicle sub-units
    • B60W30/08Active safety systems predicting or avoiding probable or impending collision or attempting to minimise its consequences
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W40/00Estimation or calculation of non-directly measurable driving parameters for road vehicle drive control systems not related to the control of a particular sub unit, e.g. by using mathematical models
    • B60W40/02Estimation or calculation of non-directly measurable driving parameters for road vehicle drive control systems not related to the control of a particular sub unit, e.g. by using mathematical models related to ambient conditions
    • B60W40/06Road conditions
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W40/00Estimation or calculation of non-directly measurable driving parameters for road vehicle drive control systems not related to the control of a particular sub unit, e.g. by using mathematical models
    • B60W40/08Estimation or calculation of non-directly measurable driving parameters for road vehicle drive control systems not related to the control of a particular sub unit, e.g. by using mathematical models related to drivers or passengers
    • B60W40/09Driving style or behaviour
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W40/00Estimation or calculation of non-directly measurable driving parameters for road vehicle drive control systems not related to the control of a particular sub unit, e.g. by using mathematical models
    • B60W40/10Estimation or calculation of non-directly measurable driving parameters for road vehicle drive control systems not related to the control of a particular sub unit, e.g. by using mathematical models related to vehicle motion

Landscapes

  • Engineering & Computer Science (AREA)
  • Automation & Control Theory (AREA)
  • Transportation (AREA)
  • Mechanical Engineering (AREA)
  • Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Control Of Driving Devices And Active Controlling Of Vehicle (AREA)

Abstract

本发明公开了一种综合考虑前后障碍物的重型营运车辆防碰撞预警方法。首先,针对中国的道路行驶环境,搭建驾驶模拟仿真平台,采集多种行驶工况下优秀驾驶员的典型驾驶行为。其次,引入基于最大熵的逆向强化学习算法,学习人类优秀驾驶员的驾驶行为。最后,将防碰撞预警策略问题描述为马尔科夫决策过程,建立基于正向强化学习的防碰撞驾驶决策模型,得到准确、可靠、具有适应性的防碰撞预警策略。本发明提出的方法,综合考虑前向、后向障碍物对车辆碰撞的影响,为驾驶员提供节气门开度、方向盘转角控制量等精确量化的驾驶建议,且能够适应不同的行驶工况和驾驶员操作,克服了现有的重型营运车辆防碰撞预警方法缺乏准确性、适应性的问题。

Description

一种综合考虑前后障碍物的重型营运车辆防碰撞预警方法
技术领域
本发明涉及一种车辆防碰撞预警策略,尤其涉及一种综合考虑前后障碍物的重型营运车辆防碰撞预警方法,属于汽车安全技术领域。
背景技术
营运车辆作为道路运输的主要承担者,其安全状况直接影响道路交通运输安全。不同于小型乘用车辆,营运客、货运输车辆多为大、中型车辆,具有质心位置高、外廓尺寸和总质量大等特点,且车辆运营强度大、运行时间长、运行环境复杂。运输过程中一旦发生交通事故,易导致群死群伤、货物脱落、燃烧、***等严重后果,造成财产损失、环境污染、生态破坏等恶劣影响,且极易诱发大型、特大型安全事故,严重威胁社会公共安全。
相关研究表明,碰撞是道路运输过程中最主要的事故形态,前向碰撞在碰撞事故中所占的比例最大,特别是在高速公路上的碰撞事故大多都是前向碰撞。虽然后向碰撞发生频率相对较低,但是对于以危险品运输罐车为代表的重型营运车辆而言,后向碰撞更容易导致罐体破损,进而引发罐内危险品泄漏甚至燃烧、***,产生的次生伤害远远超过事故本身所造成的伤害,具有更高的危险性。美国公路交通安全管理局的相关统计数据表明,在碰撞事故发生前,如果能对驾驶员进行预警提示并增加0.5秒的预处理时间,则会减少约30%至60%的车辆碰撞事故。因此,研究准确、可靠的重型营运车辆前后向防碰撞预警策略,对于提升危险品运输安全保障能力、提高道路交通安全具有重要的作用。
目前,已有较多专利、文献对车辆防碰撞预警策略进行了研究,但大多面向小型乘用车辆。相比于乘用车辆,重型营运车辆具有质心位置较高、载重量较大等特点,导致其制动距离较长、侧倾稳定性较差,在紧急制动或变道过程中,罐内液体或挂车上的货物晃动会进一步增加车辆的不稳定性,极易失稳而发生侧翻。因此,面向乘用车辆的防碰撞预警策略,难以适用于重型营运车辆。
在针对重型营运车辆的防碰撞预警策略研究中,目前仅针对前方或后方等单一方向的碰撞危险程度进行分级预警提示,且未考虑驾驶员操作、行驶工况等因素对车辆碰撞的影响。目前的方法虽然可以起到一定的预警作用,但存在对不同行驶工况的适应性差、预警不准确的问题,难以适应复杂多变的交通环境和波动差异的车辆行驶工况。此外,现有方法主要采用声音、灯光等形式进行预警提示,未涉及提供行驶速度、行驶轨迹等具体驾驶建议的防碰撞预警策略研究,缺乏准确性和可靠性。
总体而言,目前针对重型营运车辆的防碰撞预警策略研究,在准确性、适应性等方面仍存在较大的不足,尚缺乏准确、可靠、自适应驾驶员操作和行驶工况的重型营运车辆防碰撞预警策略研究。
发明内容
发明目的:针对重型营运车辆防碰撞预警方法缺乏准确性、适应性的问题,本发明公开了一种综合考虑前后障碍物的重型营运车辆防碰撞预警方法。该方法能够为驾驶员提供节气门开度、方向盘转角控制量等精确量化的驾驶建议,且能够适应不同的行驶工况和驾驶员操作,提高了重型营运车辆防碰撞预警方法的准确性和适应性。
技术方案:本发明针对重型营运车辆,如半挂罐车、半挂列车,提出了一种综合考虑前后障碍物的防碰撞预警策略。首先,针对中国的道路行驶环境,搭建驾驶模拟仿真平台,采集多种行驶工况下优秀驾驶员的典型驾驶行为。其次,引入基于最大熵的逆向强化学习算法,学习人类优秀驾驶员的驾驶行为。最后,将防碰撞预警策略问题描述为马尔科夫决策过程,建立基于正向强化学习的防碰撞驾驶决策模型,得到准确、可靠、具有适应性的防碰撞预警方法。包括以下步骤:
步骤一:搭建驾驶模拟仿真平台
为了降低因车辆碰撞造成的交通事故发生频率,提高重型营运车辆的安全性,本发明提出了一种防碰撞预警策略,其适用的场景为:在重型营运车辆行驶过程中,车辆前方、后方均存在障碍物,为了防止与周围车辆发生碰撞,应有效、及时地为驾驶员提供加减速、转向等决策策略,以避免碰撞事故的发生。
根据以上描述的场景,搭建驾驶模拟仿真平台,并采集优秀驾驶员在真实驾驶环境下的驾驶行为。具体包括:
首先,搭建基于Prescan的驾驶模拟仿真平台,针对中国的道路行驶环境,构建包含直道、弯道的城镇虚拟环境模型,驾驶员通过驾驶模拟器控制重型营运车辆运动。
其次,在重型营运车辆上安装厘米级高精度差分GPS、惯性测量单元和毫米波雷达,以获取精确的自车运动状态信息和相对运动状态信息,具体包括位置、速度、偏航角、加速度、相对速度和相对距离。同时,利用车身CAN总线获取驾驶员的控制信息,包括制动踏板压力、方向盘转角和节气门开度。
最后,设计车道变换、车道保持、车辆跟驰、匀速、加速、减速6种行驶工况,选取30名不同年龄、不同驾驶风格的优秀驾驶员进行数据采集试验,在时空全局统一坐标系下实现对优秀驾驶员各种典型驾驶行为的数据采集,构建优秀驾驶员的驾驶数据库。
在本发明中,前方车辆是指位于重型营运车辆行驶道路前方,且位于同一车道线内、行驶方向相同的车辆。后方车辆是指位于重型营运车辆行驶道路后方,且位于同一车道线内、行驶方向相同的车辆。
步骤二:学习人类优秀驾驶员的驾驶行为
为了提高防碰撞预警策略的适应性,本发明引入基于最大熵的逆向强化学习算法,对步骤一采集的优秀驾驶员在不同行驶工况下的驾驶行为进行学习。
在实际交通场景下,优秀驾驶员的驾驶行为通常不容易显式表达,但获取优秀驾驶行为产生的行驶轨迹相对容易。考虑到所有可能出现的轨迹中,优秀驾驶员的行驶轨迹对应的报酬值最大,本发明利用报酬函数表征人类优秀驾驶员的驾驶行为。
首先,建立优秀驾驶员行驶轨迹的报酬函数:
Figure BDA0002846912860000031
式(1)中,ξi表示第i条优秀驾驶员的行驶轨迹,且ξi={(S1,A1),(S2,A2),...,(Sm,Am)},m表示采集的优秀驾驶员的行驶轨迹数量,rθi)表示第i条优秀驾驶员行驶轨迹的特征向量,即这条驾驶轨迹的报酬函数,rθ(Si,Ai)表示这条轨迹中第i个“状态-动作”的报酬值,Si表示i时刻的状态,Ai表示i时刻的动作。
考虑到优秀驾驶员往往根据行驶速度、偏航角、与车道线的距离、与前后障碍物的距离等变量进行驾驶决策,本发明利用纵向速度、横向速度、偏航角、与前后障碍物的距离对报酬值进行线性拟合。
rθ(Si,Ai)=rθ1234)=θrT·φ (2)
式(2)中,特征值φ1=vsxcosψs2=vsysinψs3=dsf-d04=dsr-d0,vsx,vsy分别表示重型营运车辆的横向速度和纵向速度,单位为米每秒,ψs为偏航角,单位为度,dsf,dsr分别表示重型营运车辆与前方车辆、后方车辆的相对车间距,单位为米,θrT为系数矩阵,φ表示拟合后的特征值。
拥有最大熵的轨迹概率可表示为:
Figure BDA0002846912860000032
式(3)中,p(ξiθ)表示拥有最大熵的轨迹的概率,Z(θ)为配分函数,且
Figure BDA0002846912860000033
Figure BDA0002846912860000034
表示策略πt-1下的轨迹数据,n表示当前策略下采样轨迹的数量。
其次,建立优秀驾驶员行驶轨迹的概率模型,利用最大信息熵原理,求解拥有最大熵的行驶轨迹,具体如式(4)所示:
Figure BDA0002846912860000041
式(4)中,
Figure BDA0002846912860000042
表示采集的优秀驾驶员的行驶轨迹。
利用拉格朗日乘子法,将式(4)转化为:
Figure BDA0002846912860000043
式(5)中,J(θ)为损失函数。
考虑到优秀驾驶员行驶轨迹出现的概率越大,报酬函数越能表达优秀驾驶员的驾驶行为,将式(5)描述为:
Figure BDA0002846912860000044
利用梯度下降方法最小化报酬函数,得到报酬函数的全局最优解:
Figure BDA0002846912860000045
最后,利用梯度下降算法对报酬函数的参数进行优化,进而学习到报酬函数的全局最优解。根据优化后的参数θr,可以输出当前的报酬函数rθ(Si,Ai),即表征优秀驾驶员驾驶行为的函数。
步骤三:建立防碰撞驾驶决策模型
本发明采用DDPG算法,并基于步骤一采集的优秀驾驶员的驾驶行为和步骤二获取的优秀驾驶策略,建立防碰撞驾驶决策模型,研究不同驾驶员操作和行驶工况下的防碰撞预警策略。具体包括以下4个子步骤:
子步骤1:定义防碰撞驾驶决策模型的基础参数
考虑到重型营运车辆的未来运动状态同时受当前运动状态和当前动作影响,本发明将防碰撞驾驶决策问题建模为马尔科夫决策过程,并对模型的基础参数进行定义:t时刻的状态St、t+1时刻的状态St+1、t时刻的动作At以及动作At对应的回报值Rt;具体地:
(1)定义状态空间
重型营运车辆的行驶安全不仅与车辆自身的运动状态有关,还与前、后障碍物的相对运动状态有关。因此,利用步骤一获取的运动状态信息,定义状态空间:
St=(vsx,vsy,vsf,vsr,asx,asy,dsf,dsrssbrthr) (8)
式(8)中,vsf,vsr分别表示重型营运车辆与前方车辆、后方车辆的相对速度,单位为米每秒;asx,asy分别表示重型营运车辆的横向加速度和纵向加速度,单位为米每二次方秒;ωs为车辆的横摆角速度,单位为弧度每秒;θs为车辆的方向盘转角,单位为度,δbrthr分别表示车辆制动踏板开度、节气门开度,单位为百分数。
(2)定义动作决策
为了建立更为准确、可靠的防碰撞预警策略,本发明兼顾车辆的横向运动和纵向运动,同时考虑到车辆的节气门和制动踏板控制量不会同时出现,将方向盘转角和加速/制动归一量作为控制量,定义决策模型输出的预警策略,即动作决策At=[θstr_outs_out]。
其中,At为t时刻的动作决策,θstr_out表示归一化后的方向盘转角控制量,范围为[-1,1],δs_out表示加速/制动归一量,范围为[-1,1]。当δs_out=0时,表示重型营运车辆匀速运动,当δs_out=-1时,表示车辆以最大减速度进行制动,当δs_out=1时,表示车辆以最大加速度进行加速。
(3)定义奖励函数
定义奖励函数为:
Rt=r1+r2+r3 (9)
式(9)中,Rt为t时刻的奖励函数,r1为安全距离奖励函数,r2为舒适性奖励函数,r3为惩罚函数。
首先,为了防止车辆发生碰撞,设计安全距离奖励函数r1
Figure BDA0002846912860000051
式(10)中,d0安全距离阈值。
其次,为了保证车辆的驾驶舒适性,应尽可能的避免出现过大的冲击度,设计舒适性奖励函数r2=|asy(t+1)-asy(t)|。
最后,为了对车辆的错误动作进行判断,设计惩罚函数r3
Figure BDA0002846912860000052
式(11)中,Spen为惩罚项,在本发明中,取Spen=-100,表示当车辆发生碰撞或侧翻时,决策模型将得到-100的惩罚。
子步骤2:搭建防碰撞决策模型的网络架构
利用“策略-评价”网络框架搭建防碰撞驾驶决策网络,包括策略网络和值函数网络两部分。其中,策略网络用于对状态St的特征提取,并对特征进行回归,从而输出连续动作At;值函数网络用于接收状态St和动作At,从而评估当前“状态-动作”的价值。具体地:
(1)设计策略网络
利用多个全连接层结构的神经网络建立策略网络。首先,将归一化后的状态空间St输入到全连接层F1,其次,与全连接层F2、全连接层F3,最后,得到输出O1,即动作决策At
考虑到状态空间的维度为12,设置状态输入层的神经元数量为12。各全连接层的激活函数均为线性整流单元(Rectified Linear Unit,ReLU),其表达式为f(x)=max(0,x),全连接层F1、F2、F3的神经元数量分别为20,20,10。
(2)设计值函数网络
利用多个全连接层结构的神经网络建立值函数网络。首先,将归一化后的状态量St和动作At输入到全连接层F4,其次,与全连接层F5、全连接层F6,最后,得到输出O2,即Q值。
各全连接层的激活函数均为ReLU,全连接层F4、F5、F6的神经元数量分别为20,20,10。
子步骤3:训练策略网络和值函数网络
策略网络和值函数网络均存在各自的网络参数,在训练迭代时更新这两部分的网络参数,使得网络收敛以得到更佳的结果。具体训练更新步骤包括:
子步骤3.1:采集优秀驾驶员的轨迹数据
Figure BDA0002846912860000061
子步骤3.2:利用式(2)建立报酬函数,并初始化值函数网络参数θQ、策略网络参数θμ和参数θr
子步骤3.3:将式(9)作为初始策略优化目标,利用DDPG算法进行策略优化(参见文献:Lillicrap,T.,J.Hunt,A.Pritzel,N.Heess,T.Erez,Y.Tassa,D.Silver andDaanWierstra.Continuous control with deep reinforcement learning[C]//International Conference on Learning Representations(ICLR).2016:1-14.),获得初始策略π0
子步骤3.4:进行迭代求解,每一次迭代包括子步骤3.41至子步骤3.43,具体地:
子步骤3.41:收集策略πt-1下的轨迹数据
Figure BDA0002846912860000062
子步骤3.42:根据轨迹数据
Figure BDA0002846912860000063
Figure BDA0002846912860000064
拟合配分函数Z(θ);
子步骤3.43:利用随机梯度下降算法最小化式(7),优化报酬函数参数
Figure BDA0002846912860000071
子步骤3.44:将优化后的报酬函数rθ(Si,Ai)作为优化目标,利用DDPG算法进行策略优化,更新值函数网络参数θQ和策略网络参数θμ
子步骤3.45:计算报酬函数的更新幅度,当报酬函数的更新幅度小于给定阈值时,此时的报酬函数为最优的报酬函数。
子步骤3.5:按照子步骤3.4提供的方法进行迭代更新,使策略网络和值函数网络逐渐收敛。在训练过程中,若车辆发生碰撞或侧翻,则终止当前回合并开始新的回合进行训练。当重型营运车辆利用模型输出的决策策略稳定有效地避免车辆碰撞时,表示迭代完成。
子步骤4:利用防碰撞驾驶决策模型输出防碰撞预警策略
将厘米级高精度差分GPS、惯性测量单元和毫米波雷达等传感器采集的信息输入到已训练的防碰撞驾驶决策网络中,可以实时输出合理的方向盘转角和节气门开度命令,为驾驶员提供精确量化、可靠的驾驶建议,从而实现了准确、可靠、自适应驾驶员操作和行驶工况的重型营运车辆防碰撞预警策略输出。
有益效果:相比于一般的车辆防碰撞预警策略,本发明提出的方法具有更为准确、可靠、自适应的特点,具体体现在:
(1)本发明提出的方法综合考虑前向和后向障碍物对车辆碰撞的影响,以数值的形式将行驶速度、方向盘转向等驾驶策略精确量化,实现了准确、可靠的重型营运车辆防碰撞预警决策。
(2)本发明提出的方法能够适应不同的驾驶员操作和行驶工况,输出的驾驶策略能够根据驾驶员操作和行驶工况变化自适应调整,解决了现有的重型营运车辆防碰撞预警策略缺乏准确性、适应性的问题。
(3)本发明提出的方法不需进行复杂的车辆动力学建模,计算方法简单清晰。
附图说明
图1是本发明的技术路线示意图;
图2是本发明建立的防碰撞驾驶决策模型的网络架构示意图。
具体实施方式
下面结合附图对本发明的技术方案作进一步的说明。
为了建立准确、可靠、自适应驾驶员操作和行驶工况的防碰撞预警策略,本发明针对重型营运车辆,如半挂列车、半挂罐车,提出了一种综合考虑前后障碍物的防碰撞预警策略。首先,针对中国的道路行驶环境,搭建驾驶模拟仿真平台,采集多种行驶工况下优秀驾驶员的典型驾驶行为。其次,引入基于最大熵的逆向强化学习算法,学习人类优秀驾驶员的驾驶行为。最后,将防碰撞预警策略问题描述为马尔科夫决策过程,建立基于正向强化学习的防碰撞驾驶决策模型,得到准确、可靠、具有适应性的防碰撞预警策略。本发明的技术路线如图1所示,具体步骤如下:
步骤一:搭建驾驶模拟仿真平台
为了降低因车辆碰撞造成的交通事故发生频率,提高重型营运车辆的安全性,本发明提出了一种防碰撞预警策略,其适用的场景为:在重型营运车辆行驶过程中,车辆前方、后方均存在障碍物,为了防止与周围车辆发生碰撞,应有效、及时地为驾驶员提供加减速、转向等决策策略,以避免碰撞事故的发生。
根据以上描述的场景,搭建驾驶模拟仿真平台,并采集优秀驾驶员在真实驾驶环境下的驾驶行为。具体包括:
首先,搭建基于Prescan的驾驶模拟仿真平台,针对中国的道路行驶环境,构建包含直道、弯道的城镇虚拟环境模型,驾驶员通过驾驶模拟器控制重型营运车辆运动。
其次,在重型营运车辆上安装厘米级高精度差分GPS、惯性测量单元和毫米波雷达,以获取精确的自车运动状态信息和相对运动状态信息,具体包括位置、速度、偏航角、加速度、相对速度和相对距离。同时,利用车身CAN总线获取驾驶员的控制信息,包括制动踏板压力、方向盘转角和节气门开度。
最后,设计车道变换、车道保持、车辆跟驰、匀速、加速、减速6种行驶工况,选取30名不同年龄、不同驾驶风格的优秀驾驶员进行数据采集试验,在时空全局统一坐标系下实现对优秀驾驶员各种典型驾驶行为的数据采集,构建优秀驾驶员的驾驶数据库。
在本发明中,前方车辆是指位于重型营运车辆行驶道路前方,且位于同一车道线内、行驶方向相同的车辆。后方车辆是指位于重型营运车辆行驶道路后方,且位于同一车道线内、行驶方向相同的车辆。
步骤二:学习人类优秀驾驶员的驾驶行为
为了提高防碰撞预警策略的适应性,本发明引入基于最大熵的逆向强化学习算法,对步骤一采集的优秀驾驶员在不同行驶工况下的驾驶行为进行学习。
在实际交通场景下,优秀驾驶员的驾驶行为通常不容易显式表达,但获取优秀驾驶行为产生的行驶轨迹相对容易。考虑到所有可能出现的轨迹中,优秀驾驶员的行驶轨迹对应的报酬值最大,本发明利用报酬函数表征人类优秀驾驶员的驾驶行为。
首先,建立优秀驾驶员行驶轨迹的报酬函数:
Figure BDA0002846912860000081
式(1)中,ξi表示第i条优秀驾驶员的行驶轨迹,且ξi={(S1,A1),(S2,A2),...,(Sm,Am)},m表示采集的优秀驾驶员的行驶轨迹数量,rθi)表示第i条优秀驾驶员行驶轨迹的特征向量,即这条驾驶轨迹的报酬函数,rθ(Si,Ai)表示这条轨迹中第i个“状态-动作”的报酬值,Si表示i时刻的状态,Ai表示i时刻的动作。
考虑到优秀驾驶员往往根据行驶速度、偏航角、与车道线的距离、与前后障碍物的距离等变量进行驾驶决策,本发明利用纵向速度、横向速度、偏航角、与前后障碍物的距离对报酬值进行线性拟合。
rθ(Si,Ai)=rθ1234)=θrT·φ (2)
式(2)中,特征值φ1=vsxcosψs2=vsysinψs3=dsf-d04=dsr-d0,vsx,vsy分别表示重型营运车辆的横向速度和纵向速度,单位为米每秒,ψs为偏航角,单位为度,dsf,dsr分别表示重型营运车辆与前方车辆、后方车辆的相对车间距,单位为米,θrT为系数矩阵,φ表示拟合后的特征值。
拥有最大熵的轨迹概率可表示为:
Figure BDA0002846912860000091
式(3)中,p(ξiθ)表示拥有最大熵的轨迹的概率,Z(θ)为配分函数,且
Figure BDA0002846912860000092
Figure BDA0002846912860000093
表示策略πt-1下的轨迹数据,n表示当前策略下采样轨迹的数量。
其次,建立优秀驾驶员行驶轨迹的概率模型,利用最大信息熵原理,求解拥有最大熵的行驶轨迹,具体如式(4)所示:
Figure BDA0002846912860000094
式(4)中,
Figure BDA0002846912860000095
表示采集的优秀驾驶员的行驶轨迹。
利用拉格朗日乘子法,将式(4)转化为:
Figure BDA0002846912860000096
式(5)中,J(θ)为损失函数。
考虑到优秀驾驶员行驶轨迹出现的概率越大,报酬函数越能表达优秀驾驶员的驾驶行为,将式(5)描述为:
Figure BDA0002846912860000101
利用梯度下降方法最小化报酬函数,得到报酬函数的全局最优解:
Figure BDA0002846912860000102
最后,利用梯度下降算法对报酬函数的参数进行优化,进而学习到报酬函数的全局最优解。根据优化后的参数θr,可以输出当前的报酬函数rθ(Si,Ai),即表征优秀驾驶员驾驶行为的函数。
步骤三:建立防碰撞驾驶决策模型
常见的防碰撞预警策略,主要包括基于***物理模型和基于数据驱动的方法。基于***物理模型的防碰撞预警策略,是将表征碰撞危险的实际值与设定的报警阈值进行比较,当实际值超过阈值时进行碰撞预警,然而,在车辆运动过程中,车辆运动参数、道路条件和后方交通状态均存在不确定性,使得这些方法缺乏准确性和环境适应性。在基于数据驱动的方法中,深度强化学习方法将深度学习的感知能力和强化学习的决策能力相结合,对不确定性问题具有适应性特点。因此,本发明采用深度强化学习算法,并综合考虑前向、后向障碍物对车辆碰撞的影响,建立重型营运车辆的防碰撞驾驶决策模型。
基于深度强化学习的决策方法主要包括:基于值函数、基于策略搜索和基于Actor-Critic架构的决策方法三类。基于值的深度强化学习算法不能处理连续输出的问题,无法满足防碰撞决策中连续输出驾驶策略的需求。相比于基于策略搜索的方法,基于Actor-Critic架构的决策方法结合了值函数估计和策略搜索,具有较快的更新速度,其中的深度确定性策略梯度(Deep Deterministic Policy Gradient,DDPG)算法借鉴了深度Q网络(Deep Q Network,DQN)经验回放的思路,在输出连续动作空间方面取得了较好的效果。因此,本发明采用DDPG算法,并基于步骤一采集的优秀驾驶员的驾驶行为和步骤二获取的优秀驾驶策略,建立防碰撞驾驶决策模型,研究不同驾驶员操作和行驶工况下的防碰撞预警策略。具体包括以下4个子步骤:
子步骤1:定义防碰撞驾驶决策模型的基础参数
考虑到重型营运车辆的未来运动状态同时受当前运动状态和当前动作影响,本发明将防碰撞驾驶决策问题建模为马尔科夫决策过程,并对模型的基础参数进行定义:t时刻的状态St、t+1时刻的状态St+1、t时刻的动作At以及动作At对应的回报值Rt;具体地:
(1)定义状态空间
重型营运车辆的行驶安全不仅与车辆自身的运动状态有关,还与前、后障碍物的相对运动状态有关。因此,利用步骤一获取的运动状态信息,定义状态空间:
St=(vsx,vsy,vsf,vsr,asx,asy,dsf,dsrssbrthr) (8)
式(8)中,vsf,vsr分别表示重型营运车辆与前方车辆、后方车辆的相对速度,单位为米每秒;asx,asy分别表示重型营运车辆的横向加速度和纵向加速度,单位为米每二次方秒;ωs为重型营运车辆的横摆角速度,单位为弧度每秒;θs为重型营运车辆的方向盘转角,单位为度,δbrthr分别表示重型营运车辆制动踏板开度、节气门开度,单位为百分数。
(2)定义动作决策
为了建立更为准确、可靠的防碰撞预警策略,本发明兼顾车辆的横向运动和纵向运动,同时考虑到车辆的节气门和制动踏板控制量不会同时出现,将方向盘转角和加速/制动归一量作为控制量,定义决策模型输出的预警策略,即动作决策At=[θstr_outs_out]。
其中,At为t时刻的动作决策,θstr_out表示归一化后的方向盘转角控制量,范围为[-1,1],δs_out表示加速/制动归一量,范围为[-1,1]。当δs_out=0时,表示重型营运车辆匀速运动,当δs_out=-1时,表示车辆以最大减速度进行制动,当δs_out=1时,表示车辆以最大加速度进行加速。
(3)定义奖励函数
为了实现对动作决策At优劣的定量评价,通过建立回报函数的方式,将评价具体化和数值化。若执行动作At之后能够使重型营运车辆的行驶状态更加安全,则回报值为奖赏,否则,回报值为惩罚,使得防碰撞驾驶决策模型对上一次执行的错误动作有一定的判断。
不同于乘用车辆,重型营运车辆具有质心位置较高、载重量较大等特点,在紧急制动、转向、变道过程中,容易发生侧翻。因此,在建立防碰撞预警策略时,需同时考虑车辆碰撞、侧翻的发生。定义奖励函数为:
Rt=r1+r2+r3 (9)
式(9)中,Rt为t时刻的奖励函数,r1为安全距离奖励函数,r2为舒适性奖励函数,r3为惩罚函数。
首先,为了防止车辆发生碰撞,设计安全距离奖励函数r1
Figure BDA0002846912860000111
式(10)中,d0安全距离阈值。
其次,为了保证车辆的驾驶舒适性,应尽可能的避免出现过大的冲击度,设计舒适性奖励函数r2=|asy(t+1)-asy(t)|。
最后,为了对车辆的错误动作进行判断,设计惩罚函数r3
Figure BDA0002846912860000121
式(11)中,Spen为惩罚项,在本发明中,取Spen=-100,表示当车辆发生碰撞或侧翻时,决策模型将得到-100的惩罚。
子步骤2:搭建防碰撞决策模型的网络架构
利用“策略-评价”网络框架搭建防碰撞驾驶决策网络,包括策略网络和值函数网络两部分。其中,策略网络用于对状态St的特征提取,并对特征进行回归,从而输出连续动作At;值函数网络用于接收状态St和动作At,从而评估当前“状态-动作”的价值。网络架构如图2所示,具体地:
(1)设计策略网络
利用多个全连接层结构的神经网络建立策略网络。首先,将归一化后的状态空间St输入到全连接层F1,其次,与全连接层F2、全连接层F3,最后,得到输出O1,即动作决策At
考虑到状态空间的维度为12,设置状态输入层的神经元数量为12。各全连接层的激活函数均为线性整流单元(Rectified Linear Unit,ReLU),其表达式为f(x)=max(0,x),全连接层F1、F2、F3的神经元数量分别为20,20,10。
(2)设计值函数网络
利用多个全连接层结构的神经网络建立值函数网络。首先,将归一化后的状态量St和动作At输入到全连接层F4,其次,与全连接层F5、全连接层F6,最后,得到输出O2,即Q值。
各全连接层的激活函数均为ReLU,全连接层F4、F5、F6的神经元数量分别为20,20,10。
子步骤3:训练策略网络和值函数网络
策略网络和值函数网络均存在各自的网络参数,在训练迭代时更新这两部分的网络参数,使得网络收敛以得到更佳的结果。具体训练更新步骤包括:
子步骤3.1:采集优秀驾驶员的轨迹数据
Figure BDA0002846912860000122
子步骤3.2:利用式(2)建立报酬函数,并初始化值函数网络参数θQ、策略网络参数θμ和参数θr
子步骤3.3:将式(9)作为初始策略优化目标,利用DDPG算法进行策略优化(参见文献:Lillicrap,T.,J.Hunt,A.Pritzel,N.Heess,T.Erez,Y.Tassa,D.Silver andDaanWierstra.Continuous control with deep reinforcement learning[C]//International Conference on Learning Representations(ICLR).2016:1-14.),获得初始策略π0
子步骤3.4:进行迭代求解,每一次迭代包括子步骤3.41至子步骤3.43,具体地:
子步骤3.41:收集策略πt-1下的轨迹数据
Figure BDA0002846912860000131
子步骤3.42:根据轨迹数据
Figure BDA0002846912860000132
Figure BDA0002846912860000133
拟合配分函数Z(θ);
子步骤3.43:利用随机梯度下降算法最小化式(7),优化报酬函数参数
Figure BDA0002846912860000134
子步骤3.44:将优化后的报酬函数rθ(Si,Ai)作为优化目标,利用DDPG算法进行策略优化,更新值函数网络参数θQ和策略网络参数θμ
子步骤3.45:计算报酬函数的更新幅度,当报酬函数的更新幅度小于给定阈值时,此时的报酬函数为最优的报酬函数。
子步骤3.5:按照子步骤3.4提供的方法进行迭代更新,使策略网络和值函数网络逐渐收敛。在训练过程中,若车辆发生碰撞或侧翻,则终止当前回合并开始新的回合进行训练。当重型营运车辆利用模型输出的决策策略稳定有效地避免车辆碰撞时,表示迭代完成。
子步骤4:利用防碰撞驾驶决策模型输出防碰撞预警策略
将厘米级高精度差分GPS、惯性测量单元和毫米波雷达等传感器采集的信息输入到已训练的防碰撞驾驶决策网络中,可以实时输出合理的方向盘转角和节气门开度命令,为驾驶员提供精确量化、可靠的驾驶建议,从而实现了准确、可靠、自适应驾驶员操作和行驶工况的重型营运车辆防碰撞预警策略输出。

Claims (1)

1.一种综合考虑前后障碍物的重型营运车辆防碰撞预警方法,其特征在于:该方法包括如下步骤:
步骤一、搭建驾驶模拟仿真平台:
搭建一个在重型营运车辆行驶过程中,车辆前方、后方均存在障碍物的驾驶模拟仿真平台,并采集优秀驾驶员在真实驾驶环境下的驾驶行为;具体包括:
首先,搭建基于Prescan的驾驶模拟仿真平台,构建包含直道、弯道的城镇虚拟环境模型,驾驶员通过驾驶模拟器控制重型营运车辆运动;
其次,在重型营运车辆上安装厘米级高精度差分GPS、惯性测量单元和毫米波雷达,以获取精确的自车运动状态信息和相对运动状态信息,具体包括位置、速度、偏航角、加速度、相对速度和相对距离;同时,利用车身CAN总线获取驾驶员的控制信息,包括制动踏板压力、方向盘转角和节气门开度;
最后,设计车道变换、车道保持、车辆跟驰、匀速、加速、减速6种行驶工况,选取30名不同年龄、不同驾驶风格的优秀驾驶员进行数据采集试验,在时空全局统一坐标系下实现对优秀驾驶员各种典型驾驶行为的数据采集,构建优秀驾驶员的驾驶数据库;
定义前方车辆是指位于重型营运车辆行驶道路前方,且位于同一车道线内、行驶方向相同的车辆;后方车辆是指位于重型营运车辆行驶道路后方,且位于同一车道线内、行驶方向相同的车辆;
步骤二:学习人类优秀驾驶员的驾驶行为
引入基于最大熵的逆向强化学习算法,对步骤一采集的优秀驾驶员在不同行驶工况下的驾驶行为进行学习;
利用报酬函数表征人类优秀驾驶员的驾驶行为;
首先,建立优秀驾驶员行驶轨迹的报酬函数:
Figure FDA0002846912850000011
式(1)中,ξi表示第i条优秀驾驶员的行驶轨迹,且ξi={(S1,A1),(S2,A2),...,(Sm,Am)},m表示采集的优秀驾驶员的行驶轨迹数量,rθi)表示第i条优秀驾驶员行驶轨迹的特征向量,即这条驾驶轨迹的报酬函数,rθ(Si,Ai)表示这条轨迹中第i个“状态-动作”的报酬值,Si表示i时刻的状态,Ai表示i时刻的动作;
利用纵向速度、横向速度、偏航角、与前后障碍物的距离对报酬值进行线性拟合;
rθ(Si,Ai)=rθ1234)=θrT·φ (2)
式(2)中,特征值φ1=vsxcosψs2=vsysinψs3=dsf-d04=dsr-d0,vsx,vsy分别表示重型营运车辆的横向速度和纵向速度,单位为米每秒,ψs为偏航角,单位为度,dsf,dsr分别表示重型营运车辆与前方车辆、后方车辆的相对车间距,单位为米,θrT为系数矩阵,φ表示拟合后的特征值;
拥有最大熵的轨迹概率可表示为:
Figure FDA0002846912850000021
式(3)中,p(ξi|θ)表示拥有最大熵的轨迹的概率,Z(θ)为配分函数,且
Figure FDA0002846912850000022
Figure FDA0002846912850000023
表示策略πt-1下的轨迹数据,n表示当前策略下采样轨迹的数量;
其次,建立优秀驾驶员行驶轨迹的概率模型,利用最大信息熵原理,求解拥有最大熵的行驶轨迹,具体如式(4)所示:
Figure FDA0002846912850000024
式(4)中,
Figure FDA0002846912850000025
表示采集的优秀驾驶员的行驶轨迹;
利用拉格朗日乘子法,将式(4)转化为:
Figure FDA0002846912850000026
式(5)中,J(θ)为损失函数;
考虑到优秀驾驶员行驶轨迹出现的概率越大,报酬函数越能表达优秀驾驶员的驾驶行为,将式(5)描述为:
Figure FDA0002846912850000027
利用梯度下降方法最小化报酬函数,得到报酬函数的全局最优解:
Figure FDA0002846912850000028
最后,利用梯度下降算法对报酬函数的参数进行优化,进而学习到报酬函数的全局最优解;根据优化后的参数θr,可以输出当前的报酬函数rθ(Si,Ai),即表征优秀驾驶员驾驶行为的函数;
步骤三:建立防碰撞驾驶决策模型
采用DDPG算法,并基于步骤一采集的优秀驾驶员的驾驶行为和步骤二获取的优秀驾驶策略,建立防碰撞驾驶决策模型,研究不同驾驶员操作和行驶工况下的防碰撞预警策略;具体包括以下4个子步骤:
子步骤1:定义防碰撞驾驶决策模型的基础参数
将防碰撞驾驶决策问题建模为马尔科夫决策过程,并对模型的基础参数进行定义:t时刻的状态St、t+1时刻的状态St+1、t时刻的动作At以及动作At对应的回报值Rt;具体地:
(1)定义状态空间
重型营运车辆的行驶安全不仅与车辆自身的运动状态有关,还与前、后障碍物的相对运动状态有关;因此,利用步骤一获取的运动状态信息,定义状态空间:
St=(vsx,vsy,vsf,vsr,asx,asy,dsf,dsrssbrthr) (8)
式(8)中,vsf,vsr分别表示重型营运车辆与前方车辆、后方车辆的相对速度,单位为米每秒;asx,asy分别表示重型营运车辆的横向加速度和纵向加速度,单位为米每二次方秒;ωs为车辆的横摆角速度,单位为弧度每秒;θs为车辆的方向盘转角,单位为度,δbrthr分别表示车辆制动踏板开度、节气门开度,单位为百分数;
(2)定义动作决策
兼顾车辆的横向运动和纵向运动,同时考虑到车辆的节气门和制动踏板控制量不会同时出现,将方向盘转角和加速/制动归一量作为控制量,定义决策模型输出的预警策略,即动作决策At=[θstr_outs_out];
其中,At为t时刻的动作决策,θstr_out表示归一化后的方向盘转角控制量,范围为[-1,1],δs_out表示加速/制动归一量,范围为[-1,1];当δs_out=0时,表示重型营运车辆匀速运动,当δs_out=-1时,表示车辆以最大减速度进行制动,当δs_out=1时,表示车辆以最大加速度进行加速;
(3)定义奖励函数
定义奖励函数为:
Rt=r1+r2+r3 (9)
式(9)中,Rt为t时刻的奖励函数,r1为安全距离奖励函数,r2为舒适性奖励函数,r3为惩罚函数;
首先,为了防止车辆发生碰撞,设计安全距离奖励函数r1
Figure FDA0002846912850000041
式(10)中,d0安全距离阈值;
其次,为了保证车辆的驾驶舒适性,应尽可能的避免出现过大的冲击度,设计舒适性奖励函数r2=|asy(t+1)-asy(t)|;
最后,为了对车辆的错误动作进行判断,设计惩罚函数r3
Figure FDA0002846912850000042
式(11)中,Spen为惩罚项;
子步骤2:搭建防碰撞决策模型的网络架构
利用“策略-评价”网络框架搭建防碰撞驾驶决策网络,包括策略网络和值函数网络两部分;其中,策略网络用于对状态St的特征提取,并对特征进行回归,从而输出连续动作At;值函数网络用于接收状态St和动作At,从而评估当前“状态-动作”的价值;具体地:
(1)设计策略网络
利用多个全连接层结构的神经网络建立策略网络;首先,将归一化后的状态空间St输入到全连接层F1,其次,与全连接层F2、全连接层F3,最后,得到输出O1,即动作决策At
考虑到状态空间的维度为12,设置状态输入层的神经元数量为12;各全连接层的激活函数均为线性整流单元(Rectified Linear Unit,ReLU),其表达式为f(x)=max(0,x),全连接层F1、F2、F3的神经元数量分别为20,20,10;
(2)设计值函数网络
利用多个全连接层结构的神经网络建立值函数网络;首先,将归一化后的状态量St和动作At输入到全连接层F4,其次,与全连接层F5、全连接层F6,最后,得到输出O2,即Q值;
各全连接层的激活函数均为ReLU,全连接层F4、F5、F6的神经元数量分别为20,20,10;
子步骤3:训练策略网络和值函数网络
策略网络和值函数网络均存在各自的网络参数,在训练迭代时更新这两部分的网络参数,使得网络收敛以得到更佳的结果;具体训练更新步骤包括:
子步骤3.1:采集优秀驾驶员的轨迹数据
Figure FDA0002846912850000051
子步骤3.2:利用式(2)建立报酬函数,并初始化值函数网络参数θQ、策略网络参数θμ和参数θr
子步骤3.3:将式(9)作为初始策略优化目标,利用DDPG算法进行策略优化(参见文献:Lillicrap,T.,J.Hunt,A.Pritzel,N.Heess,T.Erez,Y.Tassa,D.Silver andDaanWierstra.Continuous control with deep reinforcement learning[C]//International Conference on Learning Representations(ICLR).2016:1-14.),获得初始策略π0
子步骤3.4:进行迭代求解,每一次迭代包括子步骤3.41至子步骤3.43,具体地:
子步骤3.41:收集策略πt-1下的轨迹数据
Figure FDA0002846912850000052
子步骤3.42:根据轨迹数据
Figure FDA0002846912850000053
Figure FDA0002846912850000054
拟合配分函数Z(θ);
子步骤3.43:利用随机梯度下降算法最小化式(7),优化报酬函数参数θt r
子步骤3.44:将优化后的报酬函数rθ(Si,Ai)作为优化目标,利用DDPG算法进行策略优化,更新值函数网络参数θQ和策略网络参数θμ
子步骤3.45:计算报酬函数的更新幅度,当报酬函数的更新幅度小于给定阈值时,此时的报酬函数为最优的报酬函数;
子步骤3.5:按照子步骤3.4提供的方法进行迭代更新,使策略网络和值函数网络逐渐收敛;在训练过程中,若车辆发生碰撞或侧翻,则终止当前回合并开始新的回合进行训练;当重型营运车辆利用模型输出的决策策略稳定有效地避免车辆碰撞时,表示迭代完成;
子步骤4:利用防碰撞驾驶决策模型输出防碰撞预警策略
将厘米级高精度差分GPS、惯性测量单元和毫米波雷达等传感器采集的信息输入到已训练的防碰撞驾驶决策网络中,可以实时输出合理的方向盘转角和节气门开度命令,为驾驶员提供精确量化、可靠的驾驶建议,从而实现了准确、可靠、自适应驾驶员操作和行驶工况的重型营运车辆防碰撞预警策略输出。
CN202011512720.8A 2020-12-20 2020-12-20 一种综合考虑前后障碍物的重型营运车辆防碰撞预警方法 Active CN112622886B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011512720.8A CN112622886B (zh) 2020-12-20 2020-12-20 一种综合考虑前后障碍物的重型营运车辆防碰撞预警方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011512720.8A CN112622886B (zh) 2020-12-20 2020-12-20 一种综合考虑前后障碍物的重型营运车辆防碰撞预警方法

Publications (2)

Publication Number Publication Date
CN112622886A true CN112622886A (zh) 2021-04-09
CN112622886B CN112622886B (zh) 2022-02-15

Family

ID=75317806

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011512720.8A Active CN112622886B (zh) 2020-12-20 2020-12-20 一种综合考虑前后障碍物的重型营运车辆防碰撞预警方法

Country Status (1)

Country Link
CN (1) CN112622886B (zh)

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113184040A (zh) * 2021-06-03 2021-07-30 长安大学 一种基于驾驶人转向意图的无人车线控转向控制方法及***
CN113753034A (zh) * 2021-10-21 2021-12-07 东南大学 一种考虑路面附着条件的大型营运车辆防碰撞决策方法
CN113954837A (zh) * 2021-11-06 2022-01-21 交通运输部公路科学研究所 一种基于深度学习的大型营运车辆车道变换决策方法
CN114379540A (zh) * 2022-02-21 2022-04-22 东南大学 考虑前方障碍物影响的大型营运车辆防侧翻驾驶决策方法
CN114407931A (zh) * 2022-02-21 2022-04-29 东南大学 一种高度类人的自动驾驶营运车辆安全驾驶决策方法
CN114407925A (zh) * 2022-01-20 2022-04-29 江苏大学 一种基于时空鸟瞰图和策略梯度算法的自动驾驶轨迹规划***及方法
CN114863708A (zh) * 2022-05-09 2022-08-05 东南大学 一种面向营运车辆的道路合流区路侧实时精准诱导方法
CN116946162A (zh) * 2023-09-19 2023-10-27 东南大学 考虑路面附着条件的智能网联商用车安全驾驶决策方法
CN116959260A (zh) * 2023-09-20 2023-10-27 东南大学 一种基于图神经网络的多车辆驾驶行为预测方法
CN117348415A (zh) * 2023-11-08 2024-01-05 重庆邮电大学 一种基于有限状态机的自动驾驶决策方法
CN117456753A (zh) * 2023-12-26 2024-01-26 山东高速信息集团有限公司 一种车辆间的安全预警方法及***
CN117912259A (zh) * 2024-03-19 2024-04-19 中汽数据有限公司 一种基于汽车电子数据的交通事故再现方法、装置、电子设备及存储介质
CN118153212A (zh) * 2024-05-11 2024-06-07 长春设备工艺研究所 一种基于多尺度融合的数字异构模型生成***及方法
CN118153212B (zh) * 2024-05-11 2024-07-05 长春设备工艺研究所 一种基于多尺度融合的数字异构模型生成***及方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070112514A1 (en) * 2005-04-29 2007-05-17 Jonas Ekmark Method And System For Forward Collision Avoidance In An Automotive Vehicle
CN110027553A (zh) * 2019-04-10 2019-07-19 湖南大学 一种基于深度强化学习的防碰撞控制方法
WO2020109547A1 (en) * 2018-11-29 2020-06-04 Valeo Schalter Und Sensoren Gmbh Advanced highway assist scenario
CN111696387A (zh) * 2020-05-21 2020-09-22 东南大学 一种基于前向障碍物识别的自适应防撞分级预警方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070112514A1 (en) * 2005-04-29 2007-05-17 Jonas Ekmark Method And System For Forward Collision Avoidance In An Automotive Vehicle
WO2020109547A1 (en) * 2018-11-29 2020-06-04 Valeo Schalter Und Sensoren Gmbh Advanced highway assist scenario
CN110027553A (zh) * 2019-04-10 2019-07-19 湖南大学 一种基于深度强化学习的防碰撞控制方法
CN111696387A (zh) * 2020-05-21 2020-09-22 东南大学 一种基于前向障碍物识别的自适应防撞分级预警方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
WEI LI等: "UAV environmental perception and autonomous obstacle avoidance:A deep learning and depth camera combined solution", 《COMPUTERS AND ELECTRONICS IN AGRICULTURE》 *
宋翔等: "基于两级滤波的车辆相对加速度估计", 《东南大学学报》 *

Cited By (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113184040A (zh) * 2021-06-03 2021-07-30 长安大学 一种基于驾驶人转向意图的无人车线控转向控制方法及***
CN113753034A (zh) * 2021-10-21 2021-12-07 东南大学 一种考虑路面附着条件的大型营运车辆防碰撞决策方法
CN113753034B (zh) * 2021-10-21 2022-08-02 东南大学 一种考虑路面附着条件的大型营运车辆防碰撞决策方法
CN113954837B (zh) * 2021-11-06 2023-03-14 交通运输部公路科学研究所 一种基于深度学习的大型营运车辆车道变换决策方法
CN113954837A (zh) * 2021-11-06 2022-01-21 交通运输部公路科学研究所 一种基于深度学习的大型营运车辆车道变换决策方法
CN114407925B (zh) * 2022-01-20 2024-05-14 江苏大学 一种基于时空鸟瞰图和策略梯度算法的自动驾驶轨迹规划***及方法
CN114407925A (zh) * 2022-01-20 2022-04-29 江苏大学 一种基于时空鸟瞰图和策略梯度算法的自动驾驶轨迹规划***及方法
CN114379540B (zh) * 2022-02-21 2024-04-30 东南大学 考虑前方障碍物影响的大型营运车辆防侧翻驾驶决策方法
CN114407931A (zh) * 2022-02-21 2022-04-29 东南大学 一种高度类人的自动驾驶营运车辆安全驾驶决策方法
WO2023155231A1 (zh) * 2022-02-21 2023-08-24 东南大学 一种高度类人的自动驾驶营运车辆安全驾驶决策方法
CN114379540A (zh) * 2022-02-21 2022-04-22 东南大学 考虑前方障碍物影响的大型营运车辆防侧翻驾驶决策方法
CN114407931B (zh) * 2022-02-21 2024-05-03 东南大学 一种高度类人的自动驾驶营运车辆安全驾驶决策方法
CN114863708A (zh) * 2022-05-09 2022-08-05 东南大学 一种面向营运车辆的道路合流区路侧实时精准诱导方法
CN116946162A (zh) * 2023-09-19 2023-10-27 东南大学 考虑路面附着条件的智能网联商用车安全驾驶决策方法
CN116946162B (zh) * 2023-09-19 2023-12-15 东南大学 考虑路面附着条件的智能网联商用车安全驾驶决策方法
CN116959260B (zh) * 2023-09-20 2023-12-05 东南大学 一种基于图神经网络的多车辆驾驶行为预测方法
CN116959260A (zh) * 2023-09-20 2023-10-27 东南大学 一种基于图神经网络的多车辆驾驶行为预测方法
CN117348415A (zh) * 2023-11-08 2024-01-05 重庆邮电大学 一种基于有限状态机的自动驾驶决策方法
CN117348415B (zh) * 2023-11-08 2024-06-04 重庆邮电大学 一种基于有限状态机的自动驾驶决策方法
CN117456753B (zh) * 2023-12-26 2024-03-08 山东高速信息集团有限公司 一种车辆间的安全预警方法及***
CN117456753A (zh) * 2023-12-26 2024-01-26 山东高速信息集团有限公司 一种车辆间的安全预警方法及***
CN117912259A (zh) * 2024-03-19 2024-04-19 中汽数据有限公司 一种基于汽车电子数据的交通事故再现方法、装置、电子设备及存储介质
CN118153212A (zh) * 2024-05-11 2024-06-07 长春设备工艺研究所 一种基于多尺度融合的数字异构模型生成***及方法
CN118153212B (zh) * 2024-05-11 2024-07-05 长春设备工艺研究所 一种基于多尺度融合的数字异构模型生成***及方法

Also Published As

Publication number Publication date
CN112622886B (zh) 2022-02-15

Similar Documents

Publication Publication Date Title
CN112622886B (zh) 一种综合考虑前后障碍物的重型营运车辆防碰撞预警方法
CN112633474B (zh) 一种重型营运车辆的后向防撞驾驶决策方法
CN114407931B (zh) 一种高度类人的自动驾驶营运车辆安全驾驶决策方法
CN112580148B (zh) 基于深度强化学习的重型营运车辆防侧翻驾驶决策方法
CN114312830B (zh) 一种考虑危险驾驶工况的智能车耦合决策模型及方法
CN113954837B (zh) 一种基于深度学习的大型营运车辆车道变换决策方法
CN110992695A (zh) 基于冲突消解的智能车辆城市交叉口通行决策多目标优化模型
CN114564016A (zh) 一种结合路径规划和强化学习的导航避障控制方法、***及模型
CN113753034B (zh) 一种考虑路面附着条件的大型营运车辆防碰撞决策方法
CN114379540B (zh) 考虑前方障碍物影响的大型营运车辆防侧翻驾驶决策方法
CN113722835B (zh) 拟人化随机换道驾驶行为建模方法
CN111625989A (zh) 一种基于a3c-sru的智能车汇入车流方法及***
CN109283843A (zh) 一种基于多项式与粒子群算法融合的换道轨迹规划方法
CN114580302A (zh) 基于最大熵强化学习的自动驾驶汽车决策规划方法
CN115257789A (zh) 城市低速环境下的营运车辆侧向防撞驾驶决策方法
CN115079697A (zh) 一种结合深度强化学习和rss策略的商用车队列路径规划方法、控制器、存储装置
Zhao et al. Adaptive drift control of autonomous electric vehicles after brake system failures
Hou et al. Crash mitigation controller for unavoidable T-bone collisions using reinforcement learning
Zhang et al. Minimum time lane changing problem of vehicle handling inverse dynamics considering the driver’s intention
Wang et al. A double-layered nonlinear model predictive control based control algorithm for local trajectory planning for automated trucks under uncertain road adhesion coefficient conditions
CN115292671A (zh) 驾驶员横纵耦合行为模型
CN114889589A (zh) 一种智能汽车转向与制动协同避撞控制***及方法
Sieberg et al. Side-slip angle estimation by artificial neural networks for vehicle dynamics control applications
Zhang et al. Lane Change Decision Algorithm Based on Deep Q Network for Autonomous Vehicles
Zhan et al. Risk-aware lane-change trajectory planning with rollover prevention for autonomous light trucks on curved roads

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant