CN117032203A - 基于svo的自动驾驶智能控制方法 - Google Patents

基于svo的自动驾驶智能控制方法 Download PDF

Info

Publication number
CN117032203A
CN117032203A CN202310756891.2A CN202310756891A CN117032203A CN 117032203 A CN117032203 A CN 117032203A CN 202310756891 A CN202310756891 A CN 202310756891A CN 117032203 A CN117032203 A CN 117032203A
Authority
CN
China
Prior art keywords
vehicle
model
prediction
svo
automatic driving
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310756891.2A
Other languages
English (en)
Inventor
操凤萍
柏子洋
朱林
弭娜
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Southeast university chengxian college
Original Assignee
Southeast university chengxian college
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Southeast university chengxian college filed Critical Southeast university chengxian college
Priority to CN202310756891.2A priority Critical patent/CN117032203A/zh
Publication of CN117032203A publication Critical patent/CN117032203A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Traffic Control Systems (AREA)

Abstract

基于SVO理论的自动驾驶智能控制***,1)完成高速公路行车数据集的结构化数据采集、半结构化数据解析,并抽取结构化数据来仿真高速路况;利用Matlab自动驾驶工具箱,构造不同曲率半径的S型道路;2)利用Matlab自动驾驶仿真数据集,训练自动驾驶仿真LSTM神经网络模型,模型通过引入“Social”池化层,在多辆汽车之间进行共同推理;3)根据预测结果和当前驾驶场景,基于模糊逻辑生成无人驾驶车辆的换道决策;4)采用B样条曲线算法优化模型的横向路径规划;然后基于最优化原理,规划全局路径。在路径规划中,利用动态算法纵向规划速度,B‑spline横向规划局部路径;最后利用MPC控制车辆完成自动驾驶。

Description

基于svo的自动驾驶智能控制方法
技术领域
本发明属于智能交通技术领域,涉及基于神经网络的高速车辆轨迹预测方法及基于交通预测的车辆路径规划方法。
背景技术
随着无人驾驶技术的发展,在公共道路上行驶的自动驾驶汽车迫切需要提高效率和安全性。目前,自动驾驶汽车缺乏对人类行为的理解,因此只能采取保守的驾驶策略。保守的驾驶策略会造成交通拥堵,尤其在高速路口。同时这种保守行为,可能使自动驾驶汽车更容易受到人类驾驶员的追尾撞击,或者发生其它交通事故。在美国加州自动驾驶汽车的一份交通事故的分析中,57%的车祸是自动驾驶汽车被人类司机追尾,其中许多撞车事故的发生是因为自动驾驶汽车的行为方式出乎了人类司机的预料。为了使自动驾驶汽车与人类驾驶员安全的同行在公共道路上,自动驾驶***必须了解人类驾驶员的意图和驾驶风格,并以贴合人类驾驶员的行驶方式做出驾驶行为。
自动驾驶领域是人工智能研究的一个重要的领域,其主要包括传感器、高速芯片和GPU等。如何提高汽车的视觉能力,如何在计算机***中复制人类视觉反应能力,是目前摆在研发人员面前最棘手的技术难题。目前研发的汽车Vision***,仍然非常原始。当车道上突然出现行人时,即使无人驾驶汽车扫描仪及时感知到,自动驾驶***也无法立刻做出控制自动驾驶车辆避开的操作,控制***的缺陷限制了自动驾驶的避险功能。无人驾驶汽车的难点还在于,汽车除了需要对周围其他车辆保持关注外,还必须能监测到一系列其它对象,比如路人、车道、停止线、交通指示牌以及周围的红绿灯等,目前自动驾驶预测***并不能同时处理如此多的问题,特别是处理与人相关的问题,例如:当前行驶在前方路面上的车辆,会不会在几百米以外的地方终止行驶?另外,天气的影响也不能忽略不计,例如无人驾驶汽车在路面积雪的情况下,经常会面临难以看清路牌和其它细节信息的问题,这就导致汽车借助有限的信息很难准确定位,无人驾驶***很难做出正确的决策。
经过对现有文献的检索发现,Wilko Schwarting,Alyssa Pierson等人于2019年在《Proceedings of the National Academy of Sciences of the United States ofAmerica上发表了题为“social behavior for autonomous vehicles(自动驾驶汽车的社会行为)”的文章。这些文章基于SVO理论,提出了将社会心理学工具应用到无人驾驶汽车预测上的方法。尽管将社会心理学工具应用到无人驾驶汽车预测上,但对于需要与多辆人类驾驶的交通车,共同行驶在高速公路上的无人驾驶控制***而言,它难以完全满足控制要求。
经检索还发现,为了进一步优化车辆路径规划算法,Chang Guo等人在2021年发表的题为“The inverse variance-flatness relation in stochastic gradient descentis critical for finding flat minima.(随机梯度下降中的逆方差-平坦度关系对于找到平坦最小值至关重要)”的文章中,提出了几种路径规划曲线的优劣性。自动驾驶的路径规划不同于轨迹规划,轨迹规划蕴含了时间信息,与速度有关系,影响乘坐舒适感的舒适性评价指标将占据主导,包括加速度,加加速度等指标;路径规划不包含时间信息,因此仅从路径曲线本身进行分析,参考路径长度与路径平均曲率的评价指标至关重要。
综上所述,现有技术存在的问题是:(1)现有的自动驾驶预测***并不能同时处问题复杂的情景,特别是处理与人相关的问题(2)大部分路径规划算法无法适应高速上驾驶的需求(3)无人驾驶汽车借助有限的信息很难准确定位,无人驾驶***很难做出正确的决策。解决上述技术问题的意义在于:基于目前人工智能技术的发展与智能交通技术的进步,更加高效可靠的高速车辆轨迹预测方法可以提高交通预测的准确度和丰富交通预测的信息量,为未来高速交通管理措施提供新的思路并促进智能交通领域技术及人工智能在交通领域应用的发展。
发明内容
针对现有技术存在的问题,提出一种基于SVO理论的自动驾驶智能控制方法,即将社会心理学工具(SVO)集成到自动驾驶汽车的控制中。
本发明技术方案是这样实现的,基于SVO的自动驾驶智能控制方法,包括以下步骤:步骤1:完成(美国)高速公路行车数据集(NGSIM)的结构化数据采集、半结构化数据解析,并抽取非结构化数据来仿真高速路况;利用Matlab自动驾驶工具箱,构造不同曲率半径的S型道路,获取该道路的左右两条边界,同时仿真2辆历史交通车以及它们的行驶路径;
步骤2:利用Matlab自动驾驶仿真数据集,训练LSTM神经网络,模型利用LSTM网络来捕捉周边车辆实时变化的运动特征和隐藏状态。该模型通过引入“Social”池化层,使***可以在多辆汽车之间进行共同推理,在每一段时间内,LSTM社区从相邻的LSTM社区接收到隐藏状态信息的池化,并利用社会池化的LSTM网络完成无人驾驶汽车的轨迹预测;
步骤3:根据预测结果和当前驾驶场景,利用模糊理论研究车辆行驶环境与换道决策这种复杂的非线性关系,通过一些模糊的行驶环境信息和参数来决定车辆是否换道然后,基于最优化原理,规划全局路径。
步骤4:采用B—SPLINE(B样条)曲线算法优化模型的横向路径规划,从路径曲线本身进行分析,建立参考路径长度与路径平均曲率的评价指标,从模型选择和性能评价两方面筛选模型,然后通过动态规划算法优化模型的纵向速度规划。
步骤5:采用车辆动力学车型,将模型转换为空间方程的线性状态,并引入参数完成相关控制:纵向控制——通过控制汽车制动/油门实现汽车的速度控制,横向控制——通过调节方向盘角度实现航向控制,实现模型预判控制(MPC)。
信息池化是一种灵活的工具,可以基于深度神经网络的优势和大量的开源编程,将时域空间和空域空间的智体关系抽象为低维的可量化嵌入(例如归一化连续向量)。将节点和边缘的时间信息捕获到演化图(EvolvingGraph)中。
模型中同一个场景的每个轨迹都有一个独立的LSTM网络。然后,LSTM通过社交池(S池)层相互连接。与传统的LSTM不同,此池化层可以使空间上接近的LSTM网络彼此共享信息。因此,它们可以通过平均聚合、加权聚合和图进化消息(或图消息传递)等聚合操作来表征人类驾驶者之间的互动强度。此外,池化操作可以在时域和空域维度的低维潜状态中,以不同的神经网络结构独立或同时嵌入信息。
符合社会价值取向(SVO)的自动驾驶算法如表1所示。
表1符合社会标准的自动驾驶算法
人类驾驶者在与他人互动时,会产生形形色色的社交偏好。通过对心理学倾向进行量化计算,可以得到不同的SVO心理学倾向,分别为利己主义与利他主义。SVO心理学倾向衡量车手是否将自己在道路上行驶的优先权设置为高于其他车手。本发明使用了一种非交互式基线算法,对除本自动驾驶车辆的其他驾驶员车辆模型进行计算,得到其最佳策略。利用数据集和轨迹历史,将其他驾驶员建模为动态驾驶交通车辆,同时,本发明将基线预测得到的性能标准与SVO理论模型的标准进行比较,针对不同的驾驶交互行为,产生不同的静态SVO:1)静态利己主义SVO;2)静态利他主义SVO;3)动态社会性SVO。最佳静态SVO对应整个驾驶交互过程中为保持恒定时的最佳SVO估计值。
路径规划与速度有关,影响乘坐舒适感的舒适性评价指标占据主导,如加速度,加加速度等指标;路径规划不包含时间信息,因此仅从路径曲线本身进行分析,建立参考路径长度与路径平均曲率的评价指标。
本发明采用了两个路径评价指标:路径长度与路径平均曲率。常用的多目标优化方法有:Pareto最优化前沿,线性加权法(多目标转单目标),NSGA非支配性排序遗传算法等。根据换道路径筛选这一问题的复杂程度,本发明选择线型加权法。
f=ω1flength2fcurvature
其中flength和fcurvature分别表示根据权重系数构造的路径长度与路径平均曲率函数。
本发明采用的路径规划算法为B-spline(B样条)曲线算法。B-spline曲线定义为:
其中pi是特征多边形的顶点;Bi,k称为k阶(k-1次)基函数,B-spline算法阶数为次数加1。在非零定义域中,在每个重复度k的结点中,K-1的基函数最大限度地减少;在每个复数k的内部结点中,非零基函数的p-k+1最多,其中p为基函数的次数。
模型预测控制以模型、预测、控制为核心思想。
模型一般选择车辆运动学模型或者动力学模型,并设法将车辆模型转化为线型状态空间方程。在车辆低速运行的场景中,车辆运动学模型即可满足要求,且运动学模型相对简单。很明显,本发明采用的模型需要在高速上运行,故而选择车辆动力学模型,并将车辆模型转化为线型状态空间方程。
选择状态向量,构建***状态方程是:
其中:m为车辆质量,δ为前轮转角,v为车辆速度,φ为转向速度。
预测则是根据车辆的状态空间方程模型,不断递推获得状态量,而获得一系列车辆状态量的过程,将***未来时刻的状态和输出以矩阵形式表达为:
通过公式可以看出,预测时域内的状态和输出量都可以通过x(k):***当前的状态量和Δu
控制本质为二次规划问题,在于在每一个时刻构造控制量,使得累计的目标函数最优:
其中,H=ΦTQeΦ+Re,gT=2E(t)QeΦ,Qe,Re为权重矩阵Q,R的扩充矩阵。Q,R为权重矩阵,且满足Q≥0,R>0的正定矩阵。
本发明提出了一个自动驾驶控制***框架,创造性的将社会心理学工具(SVO)集成到自动驾驶汽车的设计中。基于SVO理论的自动驾驶控制分为三个主要部分,即预测决策,路径规划,MPC控制。在搭建的预测-决策、规划、控制***框架下,以NGSIM数据集为基础建立评估模型,验证了该***能够有效的提高无人驾驶汽车在高速公路上行驶的效率和安全性。
B样条(B-spline)在数学的子学科数值分析里是样条曲线一种特殊的表示形式。B-样条是贝兹曲线(又称贝塞尔曲线)的一种一般化,可以进一步推广为非均匀有理B样条(NURBS),能给更多一般的几何体建造精确的模型。B样条曲线广泛应用于车辆以及航空航天等工业领域,例如:自动驾驶汽车路径规划时为了使得汽车运行平稳,需要使得运行路径的二阶导数连续(目前,AGV小车主要是通过直线和圆弧进行路径规划,由于两个阶段加速度不一致,因此在进行直线与圆弧转换过程中存在抖动问题),需要用到B样条曲线。利用B—Spline曲线,可以更短、更精准的规划无人驾驶车辆局部路径。
模型预测控制(简称MPC)是无人驾驶技术中优秀的过程控制模型。该模型利用优化算法,在有限的时间范围内计算出一系列控制输入序列,然后对该序列进行优化。在追踪车辆轨迹的应用领域,MPC建模选择基于运动学运动状态方程的建模,也可以根据机器人的控制方式选择基于动力学运动状态方程的建模。控制本身为二次规划问题,目的在于在每一个时刻构造控制量,使得累计的目标函数最优。MPC主要分为3个关键步骤:模型预测、滚动优化、反馈校正。利用MPC搭建控制模块,更精确的控制无人驾驶车辆。
循环神经网络(RNN,RecurrentNeuralNetworks)是一种常用的神经网络结构。循环网可以扩展到更长的序列,大多数能够处理可变长度的序列,解决了传统神经网络在处理序列信息上的局限性。
而社会价值取向(social value orientation,SVO)是基于人与人之间的社会***具有很强的交互性。人的驾驶行为受法律规范和社会规范两大类规范的支配。交通规则构成的是法律规范,而人的社会价值取向则构成社会规范。在现实交通中,人类驾驶者在推动道路高效安全行为的时候,通常会按照隐含的社会规范和法律规则驾驶,这就让人的行为难以用数学逻辑来表达。
有益效果:与现有技术相比,本发明的优点如下,(1)完善了现有的自动驾驶预测***并不能同时处问题复杂情景的缺陷,帮助无人驾驶***更好的处理与人相关的行驶问题,帮助无人驾驶***了解人类驾驶员的意图和驾驶风格,并以贴合人类驾驶员的行驶方式做出驾驶行为。(2)对比大部分路径规划算法,筛选出适应高速上驾驶的需求的路径规划算法(3)帮助无人驾驶汽车借助有限的信息准确定位,使无人驾驶***在高速行驶中做出正确的决策。
附图说明
图1是本发明实施例所采用的高速仿真无人驾驶汽车行驶场景图。
图2是本发明实施例预测模块LSTM网络轨迹预测训练结果图。
图3是本发明实施例轨迹预测X误差图。
图4是本发明实施例轨迹预测Y误差图。
图5是本发明实施例实际轨迹与预测轨迹对比图;
图6是基于Matlab获得模糊逻辑观测曲面;
图7是换道曲线换道路径对比图。
图8是换道曲线路径曲率对比图。
图9是基于多目标评价函数筛选曲线图。
图10是高速无人驾驶控制仿真图(初始),上图为控制模拟实现图及其下图S-T曲线。
图11是高速无人驾驶控制仿真图(判断),上图为控制模拟实现图及其下图S-T曲线。
图12是高速无人驾驶控制仿真图(规划),上图为控制模拟实现图及其下图S-T曲线。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图对本发明的实施例作详细说明:本实施例在以本发明技术方案为前提下进行实施,给出了详细的实施方式和具体的操作过程。应当理解,此处所描述的具体实例仅仅用以解释本发明,但本发明的保护范围不限于下述的实施例。
实施例:本实施例采用了图1的高速仿真行驶场景,提出了一个***框架,将社会心理学工具(SVO)集成到自动驾驶汽车的控制中。***分为三个主要部分,即预测决策,路径规划,MPC控制。首先将人类驾驶参数共享到LSTM网络中,即搭建具有社会池化的LSTM网络,以此来预测道路上已有的交通车的轨迹,根据预测结果和当前驾驶场景,基于模糊逻辑做无人驾驶车辆的换道决策;然后基于最优化原理,规划全局路径。在路径规划中,利用动态算法纵向规划速度,B-spline横向规划局部路径;最后利用MPC控制车辆完成自动驾驶。
本实施例的预测模块主要实现利用Matlab自动驾驶仿真获取NGSIM数据集,随着预测道路不同,获得的XY轨迹坐标差异较大,这种差异会直接体现在LSTM网络训练的精度上,故还需要进行标准化处理:利用mean函数和std函数获取数据集的平均值和标准差,进而转化为具有零均值和单位方差的标准化数据集。同时,后期在LSTM网络预测时,为方便逐步训练,利用cell类型数据存放上述若干数据集。
在线预测模块:搭建在线预测模块的基本步骤为利用Stateful Predict模块链接提前训练好的LSTM网络模型,然后利用for循环结构在每一个时刻点滚动预测80次,获得未来8s的交通车预测轨迹。首先输入交通车当前实际位置,然后将实际位置转化为标准值,再将标准值输入给Stateful Predict模块,最终获得Stateful Predict模块的输出值,并反标准化为正常位置。离线预测模块:为了能在循环里面把历史轨迹和预测轨迹合并处理后用于预测下一个循环,必须设计搭建离线预测模块。首先将历史实际行驶轨迹坐标标准化处理,然后定义预测时域长度及起始预测帧,再导入之前训练好的LSTM网络,并开始对两辆交通车每一个时刻点预测未来8s的轨迹,输出结果保存到相应变量,最后对保存的输出值反标准化为实际轨迹,并转为时序变量。
其中,网络层次设为输入层2级、输出层2级、隐含层250级。
如图2所示,最大迭代次数——'MaxEpochs',500;蓝色输出线(上方线条)表示RMSE(Root Mean Square Error)均方根误,是预测值与真实值偏差的平方与观测次数n比值的平方根。衡量的是预测值与真实值之间的偏差。图5中下方线条,展示了轨迹预测训练中L2损失,随着误差的减小,梯度也在减小。具体参数设置如表2所示。
表2轨迹预测训练重要参数设置
实际轨迹与预测轨迹:在进行轨迹预测时,需要不断的进行滚动预测,此举目的在于不断更新LSTM模型,图3,图4和图5分别为估计点的轨迹和实际轨迹的X轴、Y轴误差值及实际轨迹与预测轨迹误差,由图可以看出,误差值被控制在4以内,实际轨迹与预测轨迹几乎重合,根据Argoverse:3D Tracking and Forecasting with Rich Maps数据集提供的模型参考标准,本预测模型精确度为优秀。
本实施例的决策模块采用的是模糊逻辑算法,模糊逻辑是模仿人脑判断、推理等方面的不确定性,模糊逻辑往往用于判断、推理不确定因素。人工智能在建立智能车辆换道决策模型的过程中,利用模糊理论研究车辆行驶环境与换道决策这种复杂的非线性关系,通过一些精确的行驶环境信息和参数来决定车辆是否换道,而换道意图的产生与这些信息之间又存在着很大的非线性关系,这种非线性关系很难通过一些精确的行驶环境信息和参数来确定。
设定车辆换道满足程度,将速度差值系数与车距期望系数按照换道满足程度输入,模糊为五个等级,其中速度差值系数V选取{小、较小、中、较大、较大}为模糊子集,论域为X,取值为0、1。车距期待选{小、小、中、大、大}为模糊子集,论域为Y。图6为在MATLAB中获取的模糊逻辑观测曲面,即根据fai_d(速度差值系数)和fai_v(车距期望系数)输出换道意愿fai_h。
本实施例的路径规划算法为B-spline(B样条)曲线算法。路径规划不同于轨迹规划,轨迹规划蕴含了时间信息,与速度有关系,影响乘坐舒适感的舒适性评价指标将占据主导,包括加速度,加加速度等指标;路径规划不包含时间信息,因此仅从路径曲线本身进行分析,建立参考路径长度与路径平均曲率的评价指标,以下从模型选择和性能评价两方面陈述本模型的优越性。
将B-spline曲线,Dubins曲线和Bessel曲线三种曲线模型进行对比:换道路径的对比结果如图7所示,Dubins曲线的路径曲率出现了两次跳变,这表明,如果车辆跟随该路径行驶,无人驾驶车辆行驶到C点后立刻停车,需要立刻将方向盘回正,当无人驾驶车辆行驶到D点后,需要立刻停车,并将方向盘转到满足圆弧段转弯半径的角度,不如B样条曲线便捷。路径曲率的对比结果如图8所示,Bessel曲线的路径曲率满足了连续变化的要求,但曲率在换道点和并道点的曲率不为0,这会导致车辆行驶至并道点后转向角方向不会在原位,即方向盘方向不正确,这将会导致车辆偏离车道中心线。不如B样条曲线准确,所以本发明选择B样条曲线。而B-spline曲线在路径长度和平均曲率构成的综合评价中表现优异,所以本发明选取B-spline曲线。图9为利用路径长度和平均曲率构成的基于多目标评价函数筛选曲线,首先构建每个换道可模拟出的换道路径,再通过求每一条换道路径的评价函数值筛选出最优换道路径。
本实施例的控制模块采用的是MPC,即预测模型控制。图10,图11,图12为***仿真模拟高速道路上无人驾驶控制***的控制模拟实现图及其S-T曲线,两辆轿车模拟人类驾驶员操控交通车的历史轨迹,本车为无人驾驶***操纵的车辆,车辆前方曲线为预测模块预测的车辆行进路线。图10为第一个关键时刻,由下S-T曲线可以看出此时本车预测行驶路线(叉线)与锯齿状障碍区(交通车预测行驶区域)无相交,故而本车速度(点线)为平滑上升曲线,本车处于加速行驶状态。此时后方交通车速度明显比前方交通车快,从预测轨迹可以看出后交通车欲超车前方交通车,它的行驶路线势必会影响本车的行驶路线,此时本发明控制模块控制本车正常行驶。图11为三辆车辆行驶一段时间后的第二个关键时刻,此时本车到达了后侧的交通车附近,由下S-T曲线可以看出此时本车预测行驶路线(叉线)与锯齿状障碍区(交通车预测行驶区域)有明显相交状态,代表左侧交通车的行驶轨迹明显覆盖本车行驶路线。此时预测模块将左侧交通车心理学倾向归为利他主义倾向。当观测到右侧有车经过时,左测交通车的速度明显处于下降状态,并且不会长久占据本车前方路线,如果此时减速,那么高速将处于双车并行状态,可能造成追尾等事故,所以本发明控制模块控制本车继续处于换道前行驶阶段,并不做减速处理。图12为三辆车辆行驶一段时间后第三个关键时刻,此时本车行驶至右侧车道交通车附近,本车通过规划模块已规划出局部换道路径,车前方曲线即为规划后的换道路径,由下S-T曲线可以看出此时本车预测行驶路线(叉线)与锯齿状障碍区(交通车预测行驶区域)恢复无相交状态,故而本车速度(点线)为平滑上升曲线,本车处于加速行驶状态。本发明控制模块控制本车完成换道行为,其完成超车并继续保持速度在高速上行驶,直至仿真高速路段终点。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

Claims (4)

1.基于SVO理论的自动驾驶智能控制***,其特征在于:将社会心理学工具(SVO)集成到自动驾驶汽车的控制中包括以下步骤:
步骤1:完成高速公路行车数据集的结构化数据采集、半结构化数据解析,并抽取结构化数据来仿真高速路况;利用Matlab自动驾驶工具箱,构造不同曲率半径的S型道路,获取该S型道路的左右两条边界,同时仿真2辆历史交通车以及它们的行驶路径;
步骤2:利用Matlab自动驾驶仿真数据集,训练自动驾驶仿真LSTM神经网络模型,模型利用LSTM网络来捕捉自动驾驶仿真时周边车辆实时变化的运动特征和隐藏状态的信息;该模型通过引入“Social”池化层,在多辆汽车之间进行共同推理,在每一段时间内,LSTM神经网络的社区从相邻的LSTM神经网络的社区接收到隐藏状态信息的社会与信息池化,并利用社会与信息池化的LSTM网络完成无人驾驶汽车的轨迹预测;
步骤3:根据预测结果和当前驾驶场景,基于模糊逻辑生成无人驾驶车辆的换道决策;然后,基于最优化原理,规划全局路径;
步骤4:采用B—SPLINE(B样条)曲线算法优化模型的横向路径规划,同时通过动态规划算法优化模型的纵向速度规划;引入参数完成相关控制:纵向控制——通过控制汽车制动/油门实现汽车的速度控制,横向控制——通过调节方向盘角度实现航向控制,实现模型预判控制(MPC);
社会与信息池化LSTM网络,将时域空间和空域空间的智体关系抽象为低维的可量化嵌入LSTM网络;将节点和边缘的时间信息捕获到演化图中;
自动驾驶仿真LSTM神经网络模型中同一个场景的每个轨迹都有一个独立的LSTM网络;然后,LSTM通过社交池(社会与信息池,S池)层相互连接;池化层使空间上接近的LSTM网络彼此共享信息;通过平均聚合、加权聚合和图进化消息或图消息传递聚合操作来表征人类驾驶者之间的互动强度;池化操作在时域和空域维度的低维潜状态中,以不同的神经网络结构独立或同时嵌入信息;
符合社会价值取向(SVO)的自动驾驶算法如表1所示;
表1符合社会标准的自动驾驶算法
人类驾驶者在与他人互动时,会产生形形色色的社交偏好;通过对心理学倾向进行量化计算,得到不同的SVO心理学倾向,分别为利己主义与利他主义;SVO心理学倾向衡量车手是否将自己在道路上行驶的优先权设置为高于其他车手;使用一种非交互式基线算法,对除本自动驾驶车辆的其他驾驶员车辆模型进行计算,得到其最佳策略;利用数据集和轨迹历史,将其他驾驶员建模为动态驾驶交通车辆,同时,将基线预测得到的性能标准与SVO理论模型的标准进行比较,针对不同的驾驶交互行为,产生不同的静态SVO:1)静态利己主义SVO;2)静态利他主义SVO;3)动态社会性SVO;最佳静态SVO对应整个驾驶交互过程中为保持恒定时的最佳SVO估计值;
路径规划与速度有关,影响乘坐舒适感的舒适性评价指标占据主导,如加速度,加加速度等指标;路径规划不包含时间信息,因此仅从路径曲线本身进行分析,建立参考路径长度与路径平均曲率的评价指标;
采用两个路径评价指标:路径长度与路径平均曲率;常用的多目标优化方法有:Pareto最优化前沿,线性加权法即多目标转单目标,NSGA非支配性排序遗传算法;根据换道路径筛选这一问题的复杂程度;
选择线型加权法;
f=ω1flength2fcurvature
其中flength和fcurvature分别表示根据权重系数构造的路径长度与路径平均曲率函数;
采用路径规划算法为B-spline(B样条)曲线算法;B-spline曲线定义为:
其中pi是特征多边形的顶点;Bi,k称为k阶(k-1次)基函数,B-spline算法阶数为次数加1;在非零定义域中,在每个重复度k的结点中,K-1的基函数最大限度地减少;在每个复数k的内部结点中,非零基函数的p-k+1最多,其中p为基函数的次数;
模型预测控制以模型、预测、控制为核心思想;
模型选择车辆运动学模型或者动力学模型,并将车辆运动学模型转化为线型状态空间方程;在车辆低速运行的场景中,车辆运动学模型即满足要求,且运动学模型相对简单;
采用车辆运动学模型需要在高速上运行,故而选择车辆动力学模型,并将车辆模型转化为线型状态空间方程;
选择状态向量,构建***状态方程是:
其中:m为车辆质量,δ为前轮转角,v为车辆速度,φ为转向速度;
预测则是根据车辆的状态空间方程模型,不断递推获得状态量,而获得一系列车辆状态量的过程,将***未来时刻的状态和输出以矩阵形式表达为:
通过上式可以看出,预测时域内的状态和输出量都通过x(k):***当前的状态量和Δu
控制为二次规划问题,在于在每一个时刻构造控制量,使得累计的目标函数最优:
其中,H=ΦTQeΦ+Re,gT=2E(t)QeΦ,Qe,Re为权重矩阵Q,R的扩充矩阵;Q,R为权重矩阵,且满足Q≥0,R>0的正定矩阵。
2.根据权利要求1所述的基于SVO理论的自动驾驶智能控制方法,其特征在于:在线预测模块:搭建在线预测模块的基本步骤为利用Stateful Predict模块链接提前训练好的LSTM网络模型,然后利用for循环结构在每一个时刻点滚动预测80次,获得未来8s的交通车预测轨迹;首先输入交通车当前实际位置,然后将实际位置转化为标准值,再将标准值输入给Stateful Predict模块,最终获得Stateful Predict模块的输出值,并反标准化为正常位置;离线预测模块:为了能在循环里面把历史轨迹和预测轨迹合并处理后用于预测下一个循环,设计搭建离线预测模块;首先将历史实际行驶轨迹坐标标准化处理,然后定义预测时域长度及起始预测帧,再导入之前训练好的LSTM网络,并开始对两辆交通车每一个时刻点预测未来8s的轨迹,输出结果保存到相应变量,最后对保存的输出值反标准化为实际轨迹,并转为时序变量。
3.根据权利要求1所述的基于SVO理论的自动驾驶智能控制方法,其特征在于:数据集处理:采用不同的训练集和验证集来划分模型,进行多组不同的训练和验证;采用交叉验证法对LSTM网络进行训练以实现轨迹预测的核心内容:先将数据集分成长度相等的10组数据,将他们编号1-10,随机将1份数据作为验证集,其余9份作为训练集,利用这一份数据的4组轨迹验证所训练的网络的有效性,循环3组,最后对比3组最小值,确认训练函数;其中,网络层次设为输入层2级、输出层2级、隐含层250级;
预测值与真实值之间的偏差:轨迹预测训练中L2损失,随着误差的减小,梯度也在减小;具体参数设置:
表2轨迹预测训练重要参数设置
实际轨迹与预测轨迹:在进行轨迹预测时,需要不断的进行滚动预测,不断更新LSTM模型。
4.根据权利要求1所述的基于SVO理论的自动驾驶智能控制方法,其特征在于:决策模块采用的是模糊逻辑算法,模糊逻辑是模仿人脑判断、推理方面的不确定性,模糊逻辑往往用于判断、推理不确定因素;人工智能在建立智能车辆换道决策模型的过程中,利用模糊理论研究车辆行驶环境与换道决策的非线性关系,通过精确的行驶环境信息和参数来决定车辆是否换道,而换道意图的产生与这些信息之间又存在着很大的非线性关系,这种非线性关系很难通过一些精确的行驶环境信息和参数来确定;
设定车辆换道满足程度,将速度差值系数与车距期望系数按照换道满足程度输入,模糊为五个等级,其中速度差值系数V选取{小、较小、中、较大、较大}为模糊子集,论域为X,取值为0、1;车距期待选{小、小、中、大、大}为模糊子集,论域为Y。
CN202310756891.2A 2023-06-26 2023-06-26 基于svo的自动驾驶智能控制方法 Pending CN117032203A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310756891.2A CN117032203A (zh) 2023-06-26 2023-06-26 基于svo的自动驾驶智能控制方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310756891.2A CN117032203A (zh) 2023-06-26 2023-06-26 基于svo的自动驾驶智能控制方法

Publications (1)

Publication Number Publication Date
CN117032203A true CN117032203A (zh) 2023-11-10

Family

ID=88640152

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310756891.2A Pending CN117032203A (zh) 2023-06-26 2023-06-26 基于svo的自动驾驶智能控制方法

Country Status (1)

Country Link
CN (1) CN117032203A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117590856A (zh) * 2024-01-18 2024-02-23 北京航空航天大学 一种基于单一场景和多场景的自动驾驶方法
CN117709602A (zh) * 2024-02-05 2024-03-15 吉林大学 一种基于社会价值取向的城市智能车辆拟人化决策方法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117590856A (zh) * 2024-01-18 2024-02-23 北京航空航天大学 一种基于单一场景和多场景的自动驾驶方法
CN117590856B (zh) * 2024-01-18 2024-03-26 北京航空航天大学 一种基于单一场景和多场景的自动驾驶方法
CN117709602A (zh) * 2024-02-05 2024-03-15 吉林大学 一种基于社会价值取向的城市智能车辆拟人化决策方法
CN117709602B (zh) * 2024-02-05 2024-05-17 吉林大学 一种基于社会价值取向的城市智能车辆拟人化决策方法

Similar Documents

Publication Publication Date Title
US20230124864A1 (en) Graph Representation Querying of Machine Learning Models for Traffic or Safety Rules
Huang et al. Personalized trajectory planning and control of lane-change maneuvers for autonomous driving
CN110750877A (zh) 一种Apollo平台下的车辆跟驰行为预测方法
EP2610836B1 (en) Device and method for the on-line prediction of the driving cycle in an automotive vehicle
CN117032203A (zh) 基于svo的自动驾驶智能控制方法
Lin et al. Traffic signal optimization based on fuzzy control and differential evolution algorithm
Jayawardana et al. Learning eco-driving strategies at signalized intersections
CN112249008A (zh) 针对复杂动态环境的无人驾驶汽车预警方法
Chen et al. ES-DQN: A learning method for vehicle intelligent speed control strategy under uncertain cut-in scenario
Liu et al. Impact of sharing driving attitude information: A quantitative study on lane changing
Wei et al. Game theoretic merging behavior control for autonomous vehicle at highway on-ramp
Muzahid et al. Deep reinforcement learning-based driving strategy for avoidance of chain collisions and its safety efficiency analysis in autonomous vehicles
Lieberman et al. Comparison of intelligent transportation systems based on biocybernetic vehicle control systems
Wegener et al. Longitudinal vehicle motion prediction in urban settings with traffic light interaction
Yu et al. A dynamic lane-changing decision and trajectory planning model of autonomous vehicles under mixed autonomous vehicle and human-driven vehicle environment
CN115923833A (zh) 车辆的拟人化决策控制方法、装置、车辆及存储介质
CN113110359B (zh) 约束型智能汽车自主决策***在线训练方法及装置
CN113419521A (zh) 一种自动驾驶车辆局部避障路径的规划及跟踪方法
Shin et al. Ego-vehicle speed prediction using fuzzy Markov chain with speed constraints
Lodhi et al. Autonomous vehicular overtaking maneuver: A survey and taxonomy
Yu et al. Hierarchical framework integrating rapidly-exploring random tree with deep reinforcement learning for autonomous vehicle
Liu et al. Graph reinforcement learning application to co-operative decision-making in mixed autonomy traffic: Framework, survey, and challenges
Hua et al. Multi-Agent Reinforcement Learning for Connected and Automated Vehicles Control: Recent Advancements and Future Prospects
CN114919578B (zh) 智能车行为决策方法、规划方法、***及存储介质
CN114701517A (zh) 基于强化学习的多目标复杂交通场景下自动驾驶解决方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination