CN115432008A - 一种基于优化多任务的自动驾驶决策规划方法、电子设备及计算机存储介质 - Google Patents

一种基于优化多任务的自动驾驶决策规划方法、电子设备及计算机存储介质 Download PDF

Info

Publication number
CN115432008A
CN115432008A CN202211216861.4A CN202211216861A CN115432008A CN 115432008 A CN115432008 A CN 115432008A CN 202211216861 A CN202211216861 A CN 202211216861A CN 115432008 A CN115432008 A CN 115432008A
Authority
CN
China
Prior art keywords
decision
data
lane
speed
planning
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211216861.4A
Other languages
English (en)
Inventor
李振
邱利宏
谭炼
孔周维
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chongqing Changan Automobile Co Ltd
Original Assignee
Chongqing Changan Automobile Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chongqing Changan Automobile Co Ltd filed Critical Chongqing Changan Automobile Co Ltd
Priority to CN202211216861.4A priority Critical patent/CN115432008A/zh
Publication of CN115432008A publication Critical patent/CN115432008A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W60/00Drive control systems specially adapted for autonomous road vehicles
    • B60W60/001Planning or execution of driving tasks

Landscapes

  • Engineering & Computer Science (AREA)
  • Automation & Control Theory (AREA)
  • Human Computer Interaction (AREA)
  • Transportation (AREA)
  • Mechanical Engineering (AREA)
  • Traffic Control Systems (AREA)

Abstract

本发明提出了一种基于优化多任务的自动驾驶决策规划方法、电子设备及计算机存储介质,该方法包括:获取上游输入数据,并对上游输入数据进行安全性检查,对上游输入数据进行数据结构转换;将上游输入数据和通过数据结构转换之后的上游输入数据存储在本地或者云端;从高精地图数据及感知数据中提取候选车道集,提供交通语义信息,并通过工具方法对高精地图数据和感知数据进行自检,同时基于数据类型及质量对高精地图数据和感知数据进行认知分级。本发明优点:较优的决策场景可扩展性,较优的交规决策的可扩展性及决策性能,变道决策高效且体验感强,十字路口决策高效且体验感强,决策规划算法运行效率高。

Description

一种基于优化多任务的自动驾驶决策规划方法、电子设备及 计算机存储介质
技术领域
本发明涉及车辆自动驾驶技术领域,具体涉及一种基于优化多任务的自动驾驶决策规划技术。
背景技术
自动驾驶车辆是集环境感知、规划决策、行为控制与执行等多项功能于一体的综合智能***,涵盖了机械、控制、传感器技术、信号处理、模式识别、人工只能和计算机技术等多学科只是。研制具有自主行驶能力的智能车辆,对研发具有我国自主知识产权的车辆主动安全辅助驾驶产品、提高我国自主品牌汽车的智能化水平、改善道路交通安全状况、发展智能交通***,具有重要的现实意义。在自动驾驶车辆中,决策规划是其中的关键技术,也是当前研究的热点和难点问题,它衔接感知、预测与控制,是体现智能性的重要部分,因此,决策规划算法研究对提升自动驾驶***的性能有着重要的意义。
目前的决策规划算法主要有:
第一、基于规则状态机及几何曲线的决策规划。结合自车当前状态、周边交通参与者及交规安全情况,涉设计对应的决策状态机及其状态切换规则,并采用几何曲线方式得到可能规划规划轨迹。
第二、基于深度学习的端到端的决策规划。输入为摄像头图像、激光雷达点云、定位、高精地图等数据,通过大量的数据进行模型训练,输出为车辆控制指令。
第三、基于深度强化学习的决策规划。在模拟的环境中,设计奖励函数,通过不断试错,训练策略网络及值网络,使智能体车辆能够序列决策后得到更优的累计奖励,呈现更优的智能决策效果。
基于规则状态机及几何曲线的决策规划方法的不足:在在物理世界中,遇到场景纷繁复杂,可能难以穷举所有场景,需要对场景具有较好的抽象能力;对于几何式规划,需要设计一定的规则,可能不易综合复杂因素得到最优或近似最优解。
基于深度学***台运行开销具有一定挑战。
基于深度强化学***台运行开销具有一定挑战。
公开号为CN113879339A的中国专利文献公开了名称为“一种自动驾驶的决策规划方法、电子设备及计算机存储介质”的技术,该技术涉及方法包括:获取待决策对象在连续行为空间的行驶感知信息,其中,行驶感知信息包括:与待决策对象相关的几何信息、历史行驶轨迹信息和地图信息;根据行驶感知信息和行驶目标信息,获得符合高斯分布的多个规划策略及各个规划策略对应的策略评估;根据多个规划策略及各个规划策略对应的策略评估,为待决策对象进行决策规划。该技术可有效针对自动驾驶中的强交互场景下进行决策规划,提升决策效果。但是该技术并没有涉及到对基于Frenet坐标系的参考线的详细应用,即没有涉及到类似的手段,同时对获取的处理也不同,该技术对数据的处理较复杂,成本高,另,该技术没有提供一种具体的路径及速度的规划方式,同时也没有提供最优轨迹的计算方式。
公开号为CN113830108A的中国专利文献公开了名称为“一种自动驾驶车辆的决策规划方法和装置”的技术,该技术涉及的方法包括:获取交通参与者的参数信息,根据交通参与者的参数信息得到交通参与者的势场;构建决策序列树,决策序列树包括多个决策序列;根据交通参与者的势场为决策序列中的每个可能域构造对应的融合势场;根据融合势场和预设的***状态方程,计算时域下所有决策序列对应的规划轨迹;对所有决策序列对应的规划轨迹进行评估,得到多个评估结果;将多个评估结果进行排序,得到排序后的评估结果;对排序后的评估结果进行碰撞检测,得到检测结果;可进行长时域的决策规划,易于扩展且稳定性高。该技术获取的仅限于交通参与者的参数信息,且没涉及到基于Frenet坐标系的参考线的具体运用,同时没有涉及到速度决策、场景决策及路径、速度规划的过程。
公开号为CN110103987A的中国专利文献公开了名称为“一种应用于自动驾驶车辆的决策规划方法和装置”的技术,该技术涉及的方法包括:确定触发用信息,其中,触发用信息包括目标决策耗时和目标车速中的至少一项,目标决策耗时和目标车速分别是根据自动驾驶车辆最近预设时间段内执行决策规划操作的时长和车速所确定的;基于触发用信息,确定触发频率;根据触发频率,执行决策规划操作,该金丝狐提升了触发频率对不同车速场景和不同处理设备之间的适配性,该技术并没有涉及到对获取数据的操作,并没有涉及到基于Frenet坐标系的参考线的具体运用,同时没有涉及到速度决策、场景决策及路径、速度规划的过程,没有提供一种具体的决策规划方式。
公开号为CN114580302A的中国专利文献公开了名称为“一种基于最大熵强化学习的自动驾驶汽车决策规划方法”的技术,该技术涉及的方法包括:构建基于最大熵强化学习的决策规划模型,该模型包括:状态空间、动作空间、奖励函数、策略函数与评价模型;构建具有交互性的告诉公路仿真训练场景:使用二自由度汽车运动学模型描述训练场景中车辆的运动,并利用基于规则的智能决策规划模型控制环境车辆,使环境具有交互特性;训练基于最大熵强化学习的决策规划模型,该技术利用最大熵强化学习提高了自动驾驶汽车的告诉公路决策规划策略的最优性与稳定性。该技术的技术手段并没有涉及到基于Frenet坐标系的参考线的具体运用,同时没有涉及到速度决策、场景决策及路径规划、速度规划的过程,没有提供一种具体的决策规划方式。
发明内容
本发明的目的之一在于提供一种基于优化多任务的自动驾驶决策规划方法,解决的技术问题为:现有技术中的决策规划算法对算力的要求较高,运行效率低,同时对获取的数据没有进行处理,以方便算法模型的处理;对候选车道集没有进行校验,导致后续算法在执行任务时出现故障,导致车辆出现安全事故;没有对高精地图数据和感知数据进行认知分级,使得算法的运行效率低;传统决策规划算法没有涉及到对基于Frenet坐标系的参考线的具体运用,没有涉及路径决策规划、速度决策规划的过程,同时没有提供一种计算最优轨迹的方式;传统决策规划方法的决策场景可扩展性差、交规决策的可扩展性差及决策性能低;变道决策低效、体验感差;十字路口决策低效、体验感差;目的之二在于提供一种电子设备;目的之三在于提供一种计算机存储介质;目的之四在于提供一种计算机程序产品。
为了实现上述目的,本发明采用的技术方案如下:一种基于优化多任务的自动驾驶决策规划方法,所述方法包括:
获取上游输入数据,并对所述上游输入数据进行安全性检查,对所述上游输入数据进行数据结构转换;
将所述上游输入数据和通过数据结构转换之后的所述上游输入数据存储;
从所述上游输入数据中提取候选车道集,并对所述上游输入数据进行自检,同时基于数据类型及质量对所述上游输入数据进行认知分级;
所述候选车道集中的车道中心线结合车道边界线及车身宽度作为约束,得到基于Frenet坐标系的平滑的参考线;
基于候选Frenet坐标系及边界进行交规决策和场景决策,决策规划算法在主存中循环遍历涉及交规、场景的参数,且涉及所述交规、场景的参数通过配置文件进行扩展;
基于涉及场景的参数的取值进行路径决策和速度决策;
基于路径决策和速度决策进行基于Frenet坐标系的路径规划和速度规划;
基于多条候选车道规划出的路径轨迹,进行多轨迹特征提取,依据多轨迹评估策略,计算出最优轨迹;
基于交规决策、场景决策、速度决策规划、路径决策规划控制自车横纵向移动。
优选地,
按照下述方式得到平滑的参考线:优化变量为离散点坐标(xi,yi),其中,xi,yi皆指的坐标系中的距离;优化目标为平滑度、长度及相对原始点偏移量;
优化公式为:
Figure BDA0003876511420000041
其中,Pk为未知点;
约束条件有位置约束和曲率约束,
公式为:
Figure BDA0003876511420000042
其中xk_ref表示的是参考点,xu表示的是上边界,yu代表y轴上边界,stack表示的是松弛变量,cur表示的是曲率。
优选地,
按照以下方式进行路径规划优化:基于Frenet Frame构建路径规划;优化变量为离散的横向偏移量li,li’,li”;目标函数为横向位移li,横向位移li对于s的一阶、二阶、三阶导数;约束条件为障碍物躲避、运动学约束、路径连续性。
优选地,
按照以下方式进行速度规划优化:基于ST图构建速度规划;基于动态规划的启发式速度规划,提供符合规划目标的粗略分析代价因素;基于二次规划的速度平滑,对粗略分析结果进行精细计算。
优选地,
按照下述方式对粗略分析结果进行精细计算:优化的变量为离散点的位置、速度及加速度;目标函数为位置变量贴近对应的启发式规划位置惩罚加速度与加加速度;约束条件为速度值得连续性以及加速度、加加速度的范围。
优选地,
最优轨迹的计算方法包括:获取候选轨迹,基于主决策序列号的横纵向数据匹配,匹配横向数据、纵向数据及主决策数据;进行多轨迹特征提取;判断是否是触发式换道,如果是触发式换道,则进行触发式换道多轨迹评估,得到最优轨迹;如果不是触发式换道,则进行基于专家的轨迹评估,判断是否连续多帧选择相同变道轨迹,如果是,则进行安全性检查,最后得到最优轨迹;当不是连续多帧选择相同变道轨迹时,决策参考线优先级多轨迹评估,然后进行安全性检查得到最优轨迹。
优选地,
从以下几个维度进行基于专家的轨迹评估:参考路径长度效益、规划路径长度效益、相对速度效益、曲率效益、变道类型效益及前方空间效益;
所述参考路径长度效益为:
Rbenefit=RL-RS
其中,RS,RL分别为自车和左侧车道的参考路径长度;
所述规划路径长度效益为:
Pbenefit=PL-PS
其中,PS,PL分别为自车和左侧车道的规划路径长度;
所述相对速度效益为:
Vbenefit=min(vset-vP,vLP-vP)
其中,vset为自车的设定速度,vLP为左边目标车的速度,vP为前方目标车的速度,vP’为当前车辆的实时速度;
所述曲率效率为:
Kbenefit=KS-KL
其中,KS,KL分别为自车和左侧车道的最大曲率;
所述变道类型效益为:
Lbenefit=LL-LS
其中,LS,LL分别为自车和左侧车道的变道类型权重值;
所述前方空间效益为:
Gbenefit=GLP-GP
其中,GLP为左前方车辆与自车的车距,GP为前方车辆与自车的车距。
优选地,
在提取候选车道集之后提供交通语义信息,所述交通语义信息包括交通灯、人行横道、停止线及上下匝道。
优选地,
所述上游输入数据包括感知数据、预测数据、高精地图数据、定位数据和底盘数据。
优选地,
所述高精地图数据的自检内容包括是否存在动静态高精地图、是否存在导航信息及满足完整性、当前LinkIndex、当前RoutingIndex,车道索引及车道线索引;所述感知数据自检的内容包括是否存在感知车道线、感知车道线曲率是否满足非完整性约束;所述认知分级基于数据类型和质量分为高精地图信心级、静态地图跛行级及感知车道线缓行级;
涉及所述交规的参数的取值包括交通灯、人行横道、停车标志、让行标志、禁停区域及车道限速;
涉及所述场景的参数的取值包括车道跟随场景、有保护十字路口场景、无保护十字路口场景、靠边停车场景、垂直泊车场景、环岛场景;
涉及所述路径参数的取值包括车道内路径边界、借道避让路径边界、换道路径边界、上下匝道路径边界;
涉及所述速度参数的取值包括道路限速、车辆限速、行人限速、自行车限速、人行横道限速、减速带限速;
所述多轨迹特征包括变道类型、探索距离、相同时间区间规划轨迹长度、路径曲率、最大加减速度、离交叉路口距离及目标车道前后方目标S方向距离、TTC、速度、加速度、驾驶意图。
本发明还提供一种电子设备,包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行如上述的基于优化多任务的自动驾驶决策规划方法对应的操作。
本发明还提供一种计算机存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上述的基于优化多任务的自动驾驶决策规划方法。
本发明还提供一种计算机程序产品,包括计算机指令,所述计算机指令指示计算设备执行如上述的基于优化多任务的自动驾驶决策规划方法对应的操作。
本发明的有益效果:
(1)本发明首先获取预测数据、高精地图数据、定位数据、底盘数据和感知数据,然后将获取的数据进行数据预处理、并进行校验转存,进而建立决策用环境模型,该模型以高精地图为主,感知数据为铺,提取出候选车道集,对候选车道进行评估,基于次优候选车道集得到平滑参考线,然后基于候选Frenet坐标系及边界进行交规决策,基于交规stop_s进行障碍物决策,基于障碍物横纵向决策标记,紧接着进行场景决策,基于自车所处的场景、阶段及任务进行任务规划,然后基于Frenet坐标系下的路径边界及速度边界约束进行轨迹规划,然后通过多轨迹评估得到最优轨迹,较传统决策规划算法相比,涉及到的功能模块较少,且各个功能模块之间的协同并不是树形结构,整个算法运行起来不易出现bug,从架构的整体看,运行效率得到提升。
(2)在本发明中,对决策规划算法获取的的上游输入数据进行了数据安全性检查,并进行了数据结构转换,对数据的安全性检查对后续模块的健康运行提供了良好的基础,数据被转化成所需的结构并存储,可方便后续算法的使用,并便于后续策略优化及模型训练。
(3)本发明将上游高精地图及感知数据抽取提炼为便于决策规划算法使用的数据结构,同时作为决策规划算法与上游高精地图数据间的柔性隔离,便于上游高精地图及感知数据的扩展。
(4)本发明还对高精地图与感知数据进行了自检并给予数据类型与质量对高精地图和感知数据进行了认知分级,自检保证了数据的准确性,对数据进行认知分级方便算法对数据进行高效的利用。
(5)本发明中基于高精地图抽取车道中心线,并结合车道边界线及车身宽度作为约束得到平滑的参考线,本发明提供了具体的实现方式,得到基于Frenet坐标系的平滑的参考线成为了可能。
(6)基于候选Frenet坐标系及边界进行交规决策,决策规划算法在主存中循环遍历涉及交规的参数,且涉及交规的参数通过配置文件进行扩展,提升了交规的可扩展性,同时由于决策规划算法得到的数据较之前更加的全面,所以算法涉及交规的决策性能得到提升。
(7)本发明在进行基于Frenet坐标系及边界的场景决策的时候,决策规划算法在主存中循环遍历涉及场景的参数,且涉及场景的参数通过配置文件进行扩展,因为场景参数的取值通过配置文件变得多样,提高了决策场景的可扩展性。
(8)本发明能够在保障安全的前提下,具有变道决策高效性且兼顾体感,同时在保障安全的前提下,具有十字路口决策高效性且兼顾体感。
(9)本发明可高效决策路径、速度,合理规划路径、速度,并提供了全新的多轨迹评估策略,可得到精确的最优轨迹。
附图说明
图1为本发明的原理图之一;
图2为本发明的原理图之二;
图3为本发明的提取候选车道集的流程图;
图4为本发明中得到平滑的参考线的效果示意图;
图5为交规决策示意图;
图6为场景决策示意图;
图7为路径决策示意图;
图8为计算出最优轨迹的流程图。
具体实施方式
以下将参照附图和优选实施例来说明本发明的实施方式,本领域技术人员可由本说明书中所揭露的内容轻易地了解本发明的其他优点与功效。本发明还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本发明的精神下进行各种修饰或改变。应当理解,优选实施例仅为了说明本发明,而不是为了限制本发明的保护范围。
本实施例的目的在于:在保障安全的前提下,提高变道决策高效性且兼顾体感;在保障安全的前提下,提高十字路口决策高效性且兼顾体感;提高决策规划算法的运行效率;提高决策场景的可扩展性核提高交规决策的可扩展性及决策性能。
如图1所示,本实施例一种总的原理为:获取预测数据、高精地图数据、定位数据和底盘数据;然后再对数据进行预处理、校验、转存,然后建立决策用环境模型,以高精地图为主-感知为铺模型,众包地图与感知相结合模型,然后基于候选车道集进行候选车道的评估,基于次优候选车道集得到平滑的参考线,基于候选Frenet坐标系及边界,进行交规决策,基于交规stop_s,进行障碍物决策,基于障碍物横纵向决策标记,进行场景决策,场景决策包括车道跟随、交叉路口、车库形成、车库泊车及掉头,基于自车所处的场景、阶段及任务进行任务规划,基于Frenet坐标系下路径边界及速度边界约束,进行轨迹规划,然后记性多轨迹特征提取,多轨迹特征提取又范围多轨迹专家评估和多轨迹评估(数据驱动),然后进行安全性检查与功能数据填充,最后得到最优轨迹。
如图1和图2所示,本实施例提出了一种基于优化多任务的自动驾驶决策规划方法,该方法包括:
获取上游输入数据,并对所述上游输入数据进行安全性检查,对所述上游输入数据进行数据结构转换,其中,所述上游输入数据包括感知数据、预测数据、高精地图数据、定位数据和底盘数据;本实施例中涉及到的模块有决策用环境模型、参考线生成、构建约束、轨迹规划、轨迹选择;该方法简单的来说包括上游输入、主决策、路径规划、速度规划、后决策、下游输出。上游输入的数据包括感知数据、预测数据、高精地图数据、定位数据、底盘数据。然后对数据进行安全性检查,进行数据结构转换。
将所述上游输入数据和通过数据结构转换之后的所述上游输入数据存储在本地或者云端;将上游输入数据及中间变量数据存储在本地或云端,以便于后续策略优化及模型训练。
如图3所示,从所述高精地图数据及感知数据中提取候选车道集,提供交通语义信息,并通过工具方法对高精地图数据和感知数据进行自检,同时基于数据类型及质量对高精地图数据和感知数据进行认知分级,其中,所述候选车道集包括车道中心线、车道边界线及车道长度;涉及到的决策用环境模型是将上游高精地图及感知数据抽取提炼为便于决策规划算法使用的数据结构,同时作为算法与上游高精地图数据间一个柔性隔离,便于上游高精地图及感知数据的扩展。决策环境用模型的功能为从高精地图及环境感知中提取候选车道集合,并提供交通语义信息,交通语义信息包括交通灯、人行横道、停止线、上下匝道等。输入:高精地图道路导航及车道信息、感知车道线、定位;输出为候选车道集,候选车道集包括车道中心线、车道边界线、车道长度、工具方法包括查询、自检与修复,具体地,如下表所示,
Figure BDA0003876511420000091
Figure BDA0003876511420000101
输入:高精地图、感知车道线、定位;输出:候选工具集及工具方法;数据转换:自车位姿、目的地位置、主车所在的link_id、车道数、车道编号、主车距离所在link结束位置距离、地图数据格式转换;数据自检:当前LinkIndex、当前RoutingIndex、车道索引、车道线索引;数据矫正:主车所在车道编号、主车所在车道左右边界距离、依据感知车道线的定位矫正、依据感知车道线的车道边界矫正;生成车道候选车道集:安全性检查、建立映射表、初始可行车道填充、广度遍历探索距离内的所有车道序列;工具方法:获取汇入汇出点link_id及lane_num、前方交通灯信息、前方人行横道信息、前方停止线信息、前方交通标识牌信息、合理性检验与修复及仅静态地图跛行。数据自检与认知分级:对高精地图与感知数据进行自检,高精地图自检的内容包括是否存在动静态高精地图、是否存在导航信息及满足完整性、当前LinIndex、当前RoutingIndex、车道索引及车道线索引;感知车道线自检的内容包括是否存在感知车道线、感知车道线曲率是否满足非完整性约束;基于数据类型及质量进行认知分级,分为高精地图信心级、静态地图跛行级及感知车道线缓行级。
如图4所示,所述车道中心线结合车道边界线及车身宽度作为约束,得到基于Frenet坐标系的平滑的参考线;基于高精地图抽取车道中心线,并结合车道边界线及车身宽度作为约束,得到平滑的参考线,优化变量为离散点坐标(xi,yi),优化目标为平滑度、长度、相对原始点偏移量。优化公式为:
Figure BDA0003876511420000102
约束条件:位置约束和曲率约束,公式为:
Figure BDA0003876511420000103
其中xk_ref表示的是参考点,xu表示的是上边界,yu代表y轴上边界,stack表示的是松弛变量,cur表示的是曲率。
如图5所示,基于候选Frenet坐标系及边界进行交规决策,决策规划算法在主存中循环遍历涉及交规的参数,且涉及所述交规的参数通过配置文件进行扩展;变量“交规”的取值包括交通灯、人行横道、停车标志、让行标志、禁停区域、车道限速。
进行场景决策,所述决策规划算法在主存中循环遍历涉及场景的参数,且涉及所述场景的参数通过配置文件进行扩展;如图6所示,场景参数的取值包括车道跟随场景、有保护十字路口场景、无保护十字路口场景、靠边停车场景场景、垂直泊车场景及环岛场景。掉头场景包括接近和掉头,车道跟随场景包括车道跟随,交叉路口场景包括接近和路口巡航,车库行车场景包括接近车库入口,通过车库口,然后进行车道跟随,另,车库行车场景还包括接近车库出口,通过车库口(含升降杆),然后进行车道跟随,车库泊车场景包括接近和泊车,场景是可扩展的,阶段任务可扩展。
基于涉及场景的参数的取值进行路径决策和速度决策,其中,路径决策和速度决策分别基于涉及路径参数的取值和涉及速度参数的取值;如图7所示,路径参数的取值包括车道内路径边界、借道避让路径边界、换道路径、上下匝道路径。速度参数的取值包括道路限速、通过周边车辆和行人及自行车限速、人行横道限速、减速带限速、较为拥挤的道路限速。
基于路径决策和速度决策进行基于Frenet坐标系的路径规划和速度规划;在路径规划中,基于Frenet Frame构建路径规划优化问题;目标函数为横向位移li,横向位移li对于s的一阶、二阶、三阶导数;约束条件为障碍物躲避、运动学约束、路径连续性。在速度规划中,基于ST图构建速度规划;基于动态规划的启发式速度规划,提供符合规划目标的粗略分析代价因素;基于二次规划的速度平滑,对粗略分析结果进行精细计算。基于ST图构建速度规划优化问题;基于动态规划的启发式速度规划,提供符合规划目标的粗略分析代价因素:障碍物代价—尽量离障碍物远,空间势能代价—尽可能接近最远的s,父节点的代价用于累加,与父节点之间边代价—速度(尽可能接近目标速度)、加速度(尽量小)、加加速度(尽量小);基于二次规划的速度平滑,对粗略分析结果进行精细计算:优化变量为离散点的位置、速度、加速度,目标函数为位置变量贴近对应的启发式规划位置,惩罚加速度与加加速度,约束条件为速度值的连续性和加速度、加加速度的范围。
基于多条候选车道规划出的路径轨迹,进行多轨迹特征提取,依据多轨迹评估策略,计算出最优轨迹;轨迹特征包括变道类型(无、左、右),探索距离(探索参考线长度),相同时间区间规划轨迹长度路径曲率,最大加减速度(舒适性),目标车道前后方目标S方向距离、TCC、速度、加速度、驾驶意图(激进、常规、保守),离交叉路口距离。
最优轨迹的计算方法包括:获取候选轨迹,基于主决策序列号的横纵向数据匹配,匹配横向数据、纵向数据及主决策数据;进行多轨迹特征提取;判断是否是触发式换道,如果是触发式换道,则进行触发式换道多轨迹评估,得到最优轨迹;如果不是触发式换道,则进行基于专家的轨迹评估,判断是否连续多帧选择相同变道轨迹,如果是,则进行安全性检查,最后得到最优轨迹;当不是连续多帧选择相同变道轨迹时,决策参考线优先级多轨迹评估,然后进行安全性检查得到最优轨迹。
从以下几个维度进行基于专家的轨迹评估:参考路径长度效益、规划路径长度效益、相对速度效益、曲率效益、变道类型效益及前方空间效益;
参考线长度越长,车辆走的更远,到对应车道的意图越大,参考路径长度效益为:
Rbenefit=RL-RS
其中,RS,RL分别为自车和左侧车道的参考路径长度;
参考线道路没有考虑障碍物的情况,有可能规划的参考路径都是800m(目标暂定800m),这种情况下参考线路径长度效益评估因素会失效,所以,考虑引入规划路径长度评估因素,纵向规划的路径长度越长,到对应车道的意图越大。规划时间为8s,规划路径长度效益为:
Pbenefit=PL-PS
其中,PS,PL分别为自车和左侧车道的规划路径长度;
对于自动驾驶汽车,未来的行驶速度可以转换为前车的速度,因此,相对速度效益为:
Vbenefit=min(vset-vP,vLP-vP)
其中,vset为自车的设定速度,vLP为左边目标车的速度,vP为前方目标车的速度,vP’为当前车辆的实时速度;
左侧车道优先;
考虑舒适性的情况下,需要考虑引入路径曲率评估因素。规划出来的三条轨迹,尽量选择曲率变化不大的。曲率越平缓,到对应车道的意图越明显。曲率效率为:
Kbenefit=KS-KL
其中,KS,KL分别为自车和左侧车道的最大曲率;注意:这部分可以加入安全性,最大曲率大于阈值,认为舒适性和安全性是不足的。
认为自动驾驶车辆的变道相对于直行是一个较为不安全的操作,尽量少变道,除非变道带来的效益很大,变道类型评估因素的权重应该比较大,变道类型效益为:
Lbenefit=LL-LS
其中,LS,LL分别为自车和左侧车道的变道类型权重值,假定直行0.6,左右变道分别为0.2。前方空间越大、效益越大,到对应车道的意图越大,前方空间效益为:
Gbenefit=GLP-GP
其中,GLP为左前方车辆与自车的车距,GP为前方车辆与自车的车距。
基于交规决策、场景决策、速度决策规划、路径决策规划控制自车横纵向移动。
本实施例还提供一种电子设备,包括:处理器、存储器、通信接口和通信总线,处理器、存储器和通信接口通过所述通信总线完成相互间的通信;存储器用于存放至少一可执行指令,可执行指令使处理器执行如的基于优化多任务的自动驾驶决策规划方法对应的操作。
本实施例还提供一种计算机存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上述的基于优化多任务的自动驾驶决策规划方法。
本实施例还提供一种计算机程序产品,包括计算机指令,计算机指令指示计算设备执行如上述的基于优化多任务的自动驾驶决策规划方法对应的操作。
本发明的优点:较优的决策场景可扩展性,较优的交规决策的可扩展性及决策性能;能够在保障安全的前提下,具有变道决策高效性且兼顾体感;保障安全的前提下,具有十字路口决策高效性且兼顾体感;决策规划算法运行效率较高。本发明能够较优的完成L4级城区自动驾驶任务。本发明涉及多轨迹的特征和评估策略等。
以上实施例仅是为充分说明本发明而所举的较佳的实施例,本发明的保护范围不限于此。本技术领域的技术人员在本发明基础上所作的等同替代或变换,均在本发明的保护范围之内。

Claims (13)

1.一种基于优化多任务的自动驾驶决策规划方法,其特征在于,所述方法包括:
获取上游输入数据,并对所述上游输入数据进行安全性检查,对所述上游输入数据进行数据结构转换;
将所述上游输入数据和通过数据结构转换之后的所述上游输入数据存储;
从所述上游输入数据中提取候选车道集,并对所述上游输入数据进行自检,同时基于数据类型及质量对所述上游输入数据进行认知分级;
所述候选车道集中的车道中心线结合车道边界线及车身宽度作为约束,得到基于Frenet坐标系的平滑的参考线;
基于候选Frenet坐标系及边界进行交规决策和场景决策,决策规划算法在主存中循环遍历涉及交规、场景的参数,且涉及所述交规、场景的参数通过配置文件进行扩展;
基于涉及场景的参数的取值进行路径决策和速度决策;
基于路径决策和速度决策进行基于Frenet坐标系的路径规划和速度规划;
基于多条候选车道规划出的路径轨迹,进行多轨迹特征提取,依据多轨迹评估策略,计算出最优轨迹;
基于交规决策、场景决策、速度决策规划、路径决策规划控制自车横纵向移动。
2.根据权利要求1所述的基于优化多任务的自动驾驶决策规划方法,其特征在于,
按照下述方式得到平滑的参考线:优化变量为离散点坐标(xi,yi),其中,xi,yi皆指的坐标系中的距离;优化目标为平滑度、长度及相对原始点偏移量;
优化公式为:
Figure FDA0003876511410000011
其中,Pk为未知点;
约束条件有位置约束和曲率约束,
公式为:
Figure FDA0003876511410000012
其中xk_ref表示的是参考点,xu表示的是上边界,yu代表y轴上边界,stack表示的是松弛变量,cur表示的是曲率。
3.根据权利要求1所述的基于优化多任务的自动驾驶决策规划方法,其特征在于,
按照以下方式进行路径规划优化:基于Frenet Frame构建路径规划;优化变量为离散的横向偏移量li,li’,li”;目标函数为横向位移li,横向位移li对于s的一阶、二阶、三阶导数;约束条件为障碍物躲避、运动学约束、路径连续性。
4.根据权利要求1所述的基于优化多任务的自动驾驶决策规划方法,其特征在于,
按照以下方式进行速度规划优化:基于ST图构建速度规划;基于动态规划的启发式速度规划,提供符合规划目标的粗略分析代价因素;基于二次规划的速度平滑,对粗略分析结果进行精细计算。
5.根据权利要求4所述的基于优化多任务的自动驾驶决策规划方法,其特征在于,
按照下述方式对粗略分析结果进行精细计算:优化的变量为离散点的位置、速度及加速度;目标函数为位置变量贴近对应的启发式规划位置惩罚加速度与加加速度;约束条件为速度值得连续性以及加速度、加加速度的范围。
6.根据权利要求1所述的基于优化多任务的自动驾驶决策规划方法,其特征在于,
最优轨迹的计算方法包括:获取候选轨迹,基于主决策序列号的横纵向数据匹配,匹配横向数据、纵向数据及主决策数据;进行多轨迹特征提取;判断是否是触发式换道,如果是触发式换道,则进行触发式换道多轨迹评估,得到最优轨迹;如果不是触发式换道,则进行基于专家的轨迹评估,判断是否连续多帧选择相同变道轨迹,如果是,则进行安全性检查,最后得到最优轨迹;当不是连续多帧选择相同变道轨迹时,决策参考线优先级多轨迹评估,然后进行安全性检查得到最优轨迹。
7.根据权利要求6所述的基于优化多任务的自动驾驶决策规划方法,其特征在于,
从以下几个维度进行基于专家的轨迹评估:参考路径长度效益、规划路径长度效益、相对速度效益、曲率效益、变道类型效益及前方空间效益;
所述参考路径长度效益为:
Rbenefit=RL-RS
其中,RS,RL分别为自车和左侧车道的参考路径长度;
所述规划路径长度效益为:
Pbenefit=PL-PS
其中,PS,PL分别为自车和左侧车道的规划路径长度;
所述相对速度效益为:
Vbenefit=min(vset-vP,vLP-vP)
其中,vset为自车的设定速度,vLP为左边目标车的速度,vP为前方目标车的速度,vP’为当前车辆的实时速度;
所述曲率效率为:
Kbenefit=KS-KL
其中,KS,KL分别为自车和左侧车道的最大曲率;
所述变道类型效益为:
Lbenefit=LL-LS
其中,LS,LL分别为自车和左侧车道的变道类型权重值;
所述前方空间效益为:
Gbenefit=GLP-GP
其中,GLP为左前方车辆与自车的车距,GP为前方车辆与自车的车距。
8.根据权利要求1所述的基于优化多任务的自动驾驶决策规划方法,其特征在于,
在提取候选车道集之后提供交通语义信息,所述交通语义信息包括交通灯、人行横道、停止线及上下匝道。
9.根据权利要求1所述的基于优化多任务的自动驾驶决策规划方法,其特征在于,
所述上游输入数据包括感知数据、预测数据、高精地图数据、定位数据和底盘数据。
10.根据权利要求9所述的基于优化多任务的自动驾驶决策规划方法,其特征在于,
所述高精地图数据的自检内容包括是否存在动静态高精地图、是否存在导航信息及满足完整性、当前LinkIndex、当前RoutingIndex,车道索引及车道线索引;所述感知数据自检的内容包括是否存在感知车道线、感知车道线曲率是否满足非完整性约束;所述认知分级基于数据类型和质量分为高精地图信心级、静态地图跛行级及感知车道线缓行级;
涉及所述交规的参数的取值包括交通灯、人行横道、停车标志、让行标志、禁停区域及车道限速;
涉及所述场景的参数的取值包括车道跟随场景、有保护十字路口场景、无保护十字路口场景、靠边停车场景、垂直泊车场景、环岛场景;
涉及所述路径参数的取值包括车道内路径边界、借道避让路径边界、换道路径边界、上下匝道路径边界;
涉及所述速度参数的取值包括道路限速、车辆限速、行人限速、自行车限速、人行横道限速、减速带限速;
所述多轨迹特征包括变道类型、探索距离、相同时间区间规划轨迹长度、路径曲率、最大加减速度、离交叉路口距离及目标车道前后方目标S方向距离、TTC、速度、加速度、驾驶意图。
11.一种电子设备,包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行如权利要求1至10中任一项所述的基于优化多任务的自动驾驶决策规划方法对应的操作。
12.一种计算机存储介质,其上存储有计算机程序,该程序被处理器执行时实现如权利要求1至10中任一项所述的基于优化多任务的自动驾驶决策规划方法。
13.一种计算机程序产品,包括计算机指令,所述计算机指令指示计算设备执行如权利要求1至10中任一项所述的基于优化多任务的自动驾驶决策规划方法对应的操作。
CN202211216861.4A 2022-09-30 2022-09-30 一种基于优化多任务的自动驾驶决策规划方法、电子设备及计算机存储介质 Pending CN115432008A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211216861.4A CN115432008A (zh) 2022-09-30 2022-09-30 一种基于优化多任务的自动驾驶决策规划方法、电子设备及计算机存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211216861.4A CN115432008A (zh) 2022-09-30 2022-09-30 一种基于优化多任务的自动驾驶决策规划方法、电子设备及计算机存储介质

Publications (1)

Publication Number Publication Date
CN115432008A true CN115432008A (zh) 2022-12-06

Family

ID=84250221

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211216861.4A Pending CN115432008A (zh) 2022-09-30 2022-09-30 一种基于优化多任务的自动驾驶决策规划方法、电子设备及计算机存储介质

Country Status (1)

Country Link
CN (1) CN115432008A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP4397555A1 (en) * 2023-01-03 2024-07-10 Chongqing Changan Automobile Co., Ltd. Software architecture platform and control method for autonomous vehicle, vehicle, and medium

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP4397555A1 (en) * 2023-01-03 2024-07-10 Chongqing Changan Automobile Co., Ltd. Software architecture platform and control method for autonomous vehicle, vehicle, and medium

Similar Documents

Publication Publication Date Title
US11554785B2 (en) Driving scenario machine learning network and driving environment simulation
US11970168B2 (en) Vehicle trajectory modification for following
US11726477B2 (en) Methods and systems for trajectory forecasting with recurrent neural networks using inertial behavioral rollout
US10976741B2 (en) Safety and comfort constraints for navigation
US11532167B2 (en) State machine for obstacle avoidance
US11467586B2 (en) Gridlock solver for motion planning system of an autonomous vehicle
US20220212693A1 (en) Method and apparatus for trajectory prediction, device and storage medium
US11875681B2 (en) Drive envelope determination
WO2022052406A1 (zh) 一种自动驾驶训练方法、装置、设备及介质
US11427191B2 (en) Obstacle avoidance action
González et al. Continuous curvature planning with obstacle avoidance capabilities in urban scenarios
CN109641589B (zh) 用于自主车辆的路线规划
CN111367282B (zh) 一种基于多模感知与强化学习的机器人导航方法及***
EP3724053A1 (en) Discrete decision architecture for motion planning system of an autonomous vehicle
US10832439B1 (en) Locating entities in a mapped environment
US11480962B1 (en) Dynamic lane expansion
US11392128B1 (en) Vehicle control using directed graphs
CN111397622A (zh) 基于改进A*算法与Morphin算法的智能汽车局部路径规划方法
Chen et al. Continuous decision making for on-road autonomous driving under uncertain and interactive environments
Eraqi et al. Dynamic conditional imitation learning for autonomous driving
CN115432008A (zh) 一种基于优化多任务的自动驾驶决策规划方法、电子设备及计算机存储介质
CN117032201B (zh) 一种基于车路协同的矿井下自动驾驶车辆协调规划方法
Manikandan et al. Ad hoc-obstacle avoidance-based navigation system using deep reinforcement learning for self-driving vehicles
Raipuria et al. Road infrastructure indicators for trajectory prediction
CN114815853A (zh) 一种考虑路面障碍特征的路径规划方法和***

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination