CN115700509A - 一种基于仿真反馈数据的引导线生成方法及*** - Google Patents

一种基于仿真反馈数据的引导线生成方法及*** Download PDF

Info

Publication number
CN115700509A
CN115700509A CN202211373065.1A CN202211373065A CN115700509A CN 115700509 A CN115700509 A CN 115700509A CN 202211373065 A CN202211373065 A CN 202211373065A CN 115700509 A CN115700509 A CN 115700509A
Authority
CN
China
Prior art keywords
guide line
track
trajectory
predicted
line track
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211373065.1A
Other languages
English (en)
Inventor
姚琼杰
尹玉成
石涤文
丁豪
刘奋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Heading Data Intelligence Co Ltd
Original Assignee
Heading Data Intelligence Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Heading Data Intelligence Co Ltd filed Critical Heading Data Intelligence Co Ltd
Priority to CN202211373065.1A priority Critical patent/CN115700509A/zh
Publication of CN115700509A publication Critical patent/CN115700509A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Traffic Control Systems (AREA)

Abstract

本发明提供一种基于仿真反馈数据的引导线生成方法及***,方法包括:根据多条历史通行轨迹,基于轨迹规划模型生成预测引导线轨迹;基于预测引导线轨迹,通过仿真平台生成一条控制可行的引导线轨迹;计算预测引导线轨迹和控制可行的引导线轨迹之间的相似性;如果两条引导线轨迹不相似,则将控制可行的引导线轨迹作为预测引导线轨迹;如果相似,则保持预测引导线轨迹。本发明将规划的引导线轨迹和仿真的引导线轨迹联合,通过仿真平台对轨迹规划模型的结构的反馈,构建新数据集,用于训练和优化轨迹规划模型,使得最终生成的车道级引导线更加符合驾驶行为习惯。

Description

一种基于仿真反馈数据的引导线生成方法及***
技术领域
本发明涉及众包高精度地图制作领域,更具体地,涉及一种基于仿真反馈数据的引导线生成方法及***。
背景技术
在众包高精度地图制作中,引导线是车道的一个地图要素。车道级引导线是一条安全、舒适、可行驶的轨迹,可用于引导智能驾驶车通过该段车道。
在普通和结构化特征清晰,准确的车道内,通常将车道中心线作为车道的引导线,但是,在道路路口中,无清晰的道路结构情况下,为两个连通的车道规划一条引导线则是一件非常有挑战的工作。
引导线属于行动规划中的静态引导线,通常以离线的方式生成,预设于高精度地图中。目前的路口引导线生成方法主要可分为两类。一类是基于数学模型的方法,将其建模成非凸的数学优化问题,制定优化目标函数和遵守交规、防碰撞等约束条件,通过曲线拟合和数值优化的算法来生成安全和舒适的引导线。该方法严重依赖地图中道路元素的完备性和精确性,如车道边线、车道中心线等,而对于道路结构不清的自由空间则不适用,且生成的轨迹也难以满足人的舒适性和车辆控制上的可跟随性。另一类是基于数据驱动的学习方式,以深度神经网络为代表,构建大规模轨迹数据集,训练出一个轨迹规划模型,生成引导线轨迹更符合人驾驶行为。但基于神经网络规划模型的训练需要大量的轨迹数据,且数据集覆盖尽可能多的交通场景,以提升模型的泛化性能。此外,基于神经网络的模型结果不稳定,用实车来评估成本高,甚至难以实现。
发明内容
本发明针对现有技术中存在的技术问题,提供一种基于仿真反馈数据的引导线生成方法及***。
根据本发明的第一方面,提供了一种基于仿真反馈数据的引导线生成方法,包括:
根据多条历史通行轨迹,基于轨迹规划模型生成预测引导线轨迹;
基于所述预测引导线轨迹,通过仿真平台生成一条控制可行的引导线轨迹;
计算所述轨迹规划模型生成的预测引导线轨迹和仿真平台生成的控制可行的引导线轨迹之间的相似性;
如果所述轨迹规划模型生成的预测引导线轨迹和仿真平台生成的控制可行的引导线轨迹不相似,则将仿真平台生成的控制可行的引导线轨迹作为预测引导线轨迹;如果相似,保持所述预测引导线轨迹。
在上述技术方案的基础上,本发明还可以作出如下改进。
可选的,所述轨迹规划模型为条件变分自编码器CVAE,所述条件变分自编码器CVAE的数学基本表达式为:
T=g(z,V);
其中,已知z、V的情况下通过函数g生成所求的引导线轨迹T,T 由经纬度组成的点序列,z为服从高斯分布的固定维度的随机向量,V 为模型提取的车道驾驶行为语义向量,g为轨迹规划模型的函数表达式。
可选的,所述条件变分自编码器CVAE包括多个ST block、Fusion block、多层全连接网络和解码网络,所述轨迹规划模型的训练过程为:
获取训练样本集,所述训练样本集中包括多个样本,每一个样本包括多条历史通行轨迹和真实引导线轨迹;
基于ST block提取所述真实引导线轨迹和每一条历史通行轨迹的时空特征向量;
基于Fusion block将每一条历史通行轨迹的时空特征向量进行融合,生成车道表示向量;
将所述真实引导线轨迹的时空特征向量和所述车道表示向量联合,基于所述多层全连接网络预测先验网络的先验分布参数,所述先验分布参数包括先验多元正太分布的均值μ和方差平方的对数logσ2
从标准正太分布∈~N(0,1)中采样指定维度的向量∈,其维度与先验多元正太分布的维度一致,计算向量z=∈×σ+μ;
通过所述解码网络将向量z和所述车道表示向量进行联合,生成预测引导线。
可选的,所述ST block包括全连接层FC、卷积网络CONV和循环神经网络LSTM;
基于所述全连接层FC将所述真实引导线轨迹和每一条历史通行轨迹中的采样点的经度和纬度编码成指定维度的向量;
通过卷积网络CONV提取所述真实引导线轨迹和每一条历史通行轨迹中的采样点的空间特征;
基于循环神经网络LSTM,提取具有时序特征的所述真实引导线轨迹和每一条历史通行轨迹中的采样点的时空特征向量。
可选的,所述真实引导线轨迹和每一条历史通行轨迹均由具有时序特征的轨迹采样点序列组成,所述根据多条历史通行轨迹,基于轨迹规划模型生成预测引导线轨迹,之前还包括:
将所述真实引导线轨迹和每一条历史通行轨迹中的采样点从全局地球坐标转换为车身局部坐标,包括:
根据公式(2)将全局坐标转换为同方向的局部坐标:
Figure BDA0003925789920000041
其中x,y分别表示经度值和纬度值,上标l,g分别表示局部坐标和全局坐标,下标i表示第i个采样点;
或者,基于公式(3)和公式(4)将全局坐标转换为局部坐标:
xnew=xold cosθ-yold sinθ (3);
ynew=xold sinθ+yold cosθ (4);
其中,xnew,ynew分别表示新的局部坐标的经度和纬度,xold,yold分别表示旧的局部坐标的经度和纬度,车辆进入路口方向为y轴正方向,y轴右手边为y轴正方向的笛卡尔坐标系;
或者,基于公式(5)将全局坐标转换为局部坐标:
Figure BDA0003925789920000042
其中,当前采样点的行为坐标为其坐标值减去前一采样点坐标值
可选的,所述根据多条历史通行轨迹,基于轨迹规划模型生成预测引导线轨迹,还包括:
计算所述预测引导线轨迹与所述真实引导线轨迹之间的损失和梯度值,基于损失和梯度值调整所述轨迹规划模型的网络超参数。
可选的,所述计算所述轨迹规划模型生成的预测引导线轨迹和仿真平台生成的控制可行的引导线轨迹之间的相似性,包括:
基于LSTM孪生网络实现二分类,判断所述轨迹规划模型生成的预测引导线轨迹和仿真平台生成的控制可行的引导线轨迹的相似性。
根据本发明的第二方面,提供一种基于仿真反馈数据的***,包括轨迹规划模块、仿真平台、计算模块和更新模块;
轨迹规划模块,用于根据多条历史通行轨迹,基于轨迹规划模型生成预测引导线轨迹;
仿真平台,用于基于所述预测引导线轨迹,生成一条控制可行的引导线轨迹;
计算模块,用于计算所述轨迹规划模型生成的预测引导线轨迹和仿真平台生成的控制可行的引导线轨迹之间的相似性;
更新模块,用于如果所述轨迹规划模型生成的预测引导线轨迹和仿真平台生成的控制可行的引导线轨迹不相似,则将仿真平台生成的控制可行的引导线轨迹作为预测引导线轨迹;如果相似,保持所述预测引导线轨迹。
根据本发明的第三方面,提供了一种电子设备,包括存储器、处理器,所述处理器用于执行存储器中存储的计算机管理类程序时实现基于仿真反馈数据的引导线生成方法的步骤。
根据本发明的第四方面,提供了一种计算机可读存储介质,其上存储有计算机管理类程序,所述计算机管理类程序被处理器执行时实现基于仿真反馈数据的引导线生成方法的步骤。
本发明提供的一种基于仿真反馈数据的引导线生成方法及***,将规划的引导线轨迹和仿真的引导线轨迹联合,通过仿真平台对轨迹规划模型的结构的反馈,构建新数据集,用于训练和优化轨迹规划模型,使得最终生成的车道级引导线更加符合驾驶行为习惯。
附图说明
图1为基于仿真反馈的数据闭环框架示意图;
图2为本发明提供的一种基于仿真反馈数据的引导线生成方法流程图;
图3为基于CVAE的引导线生成的轨迹规划模型的训练过程示意图;
图4为轨迹规划模型的推断过程示意图;
图5为LSTM孪生网络示意图;
图6为本发明提供的一种基于仿真反馈数据的引导线生成***的结构示意图;
图7为本发明提供的一种可能的电子设备的硬件结构示意图;
图8为本发明提供的一种可能的计算机可读存储介质的硬件结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。另外,本发明提供的各个实施例或单个实施例中的技术特征可以相互任意结合,以形成可行的技术方案,这种结合不受步骤先后次序和/或结构组成模式的约束,但是必须是以本领域普通技术人员能够实现为基础,当技术方案的结合出现相互矛盾或无法实现时,应当认为这种技术方案的结合不存在,也不在本发明要求的保护范围之内。
现有数据驱动型的轨迹规划主要采用基于神经网络模型,对数据集要求高,且实车评估成本高的问题,本专利提出了一种自动对新场景构建数据集、评测成本低的轨迹规划方案。
参见图1,提供了一种基于仿真反馈的数据闭环框架,该框架主要包括三部分:数据集部分、基于神经网络的轨迹规划模型部分和仿真平台部分。
1)数据集部分主要用于管理训练数据,生成训练集和测试集供轨迹规划模型训练。
2)基于神经网络的轨迹规划模型核心模块,设计了一种基于条件变分自编码器(Conditional Variational Autoencoder,CVAE)的轨迹规划模型。基本数学形式描述为:
T=g(z,V);
该公式的含义是在已知z、V的情况下通过函数g生成所求的引导线轨迹T,T由经纬度组成的点序列,z为服从高斯分布的固定维度的随机向量,V为模型提取的车道驾驶行为的语义向量,g为生成模型,通过数据学习得到。本专利设计了一种用于时空特征提取模型ST-block,提取轨迹的时空特征,ST-block由有全连接层、卷积模块和循环神经网络组成。为保证模型的顺利实现,相关的技术措施需要采用。
图2为本发明提供的一种基于仿真反馈数据的引导线生方法流程图,如图1所示,该引导线生成方法包括:
S1,根据多条历史通行轨迹,基于轨迹规划模型生成预测引导线轨迹。
可以理解的是,在车辆行驶过程中,引导线轨迹需要实时生成,以引导车辆行驶。因此,可以根据生成的真实引导线轨迹和车辆行驶的多条历史通行轨迹,通过轨迹规划模型生成预测引导线。
其中,真实引导线轨迹和历史通行轨迹是以坐标点的序列所表示,每个坐标点包括经度和纬度,原始轨迹中的经度和维度是地球坐标值,无法作为模型计算的输入值。采样点坐标表示即将全局地球坐标转换为符合模型计算的局部坐标值。本发明中采用了三种坐标转换的方法: 1)与全局坐标系同方向的坐标转换;2)车辆进入车道航向角为y轴的坐标转换;3)轨迹行为序列的坐标转换。
1)与全局坐标系同方向的局部坐标转换,如公式(2),其中
Figure BDA0003925789920000081
其中x,y分别表示经度值和纬度值,上标l,g分别表示局部坐标和全局坐标,下标i表示第i个采样点。
2)车辆进入路口方向为y轴正方向,y轴右手边为y轴正方向的笛卡尔坐标系,如公式(3)和公式(4),该方法需要旋转坐标,将
xnew=xold cosθ-yold sinθ 公式(3);
ynew=xold sinθ+yold cosθ 公式(4);
全局坐标按1)中的方法转换为局部坐标,其中,xnew,ynew分别表示新的局部坐标的经度和纬度,xold,yold分别表示旧的局部坐标的经度和纬度。
3)轨迹行为序列,即当前采样点的行为坐标为其坐标值减去前一采样点坐标值,如公式(5),其中字母符号的含义如1)相同,第一个采样点的行为坐标为自身相减。
Figure BDA0003925789920000082
作为实施例,所述条件变分自编码器CVAE包括多个ST block、 Fusion block、多层全连接网络和解码网络,所述轨迹规划模型的训练过程为:获取训练样本集,所述训练样本集中包括多个样本,每一个样本包括多条历史通行轨迹和真实引导线轨迹;基于STblock提取所述真实引导线轨迹和每一条历史通行轨迹的时空特征向量;基于Fusionblock将每一条历史通行轨迹的时空特征向量进行融合,生成车道表示向量;将所述真实引导线轨迹的时空特征向量和所述车道表示向量联合,基于所述多层全连接网络预测先验网络的先验分布参数,所述先验分布参数包括先验多元正太分布的均值μ和方差平方的对数logσ2;从标准正太分布∈~N(0,1)中采样指定维度的向量∈,其维度与先验多元正太分布的维度一致,计算向量z=∈×σ+μ;通过所述解码网络将向量z和所述车道表示向量进行联合,生成预测引导线。
可理解的是,参见图3,为条件变分自编码器CVAE的结构示意图,主要包括多个STblock、Fusion block、多层全连接网络和解码网络,其中,多个子模型的功能为:
轨迹点的特征编码,即将轨迹点编码成高维的特征向量。在本发明中轨迹点为经度和纬度的二维独立特征,需要编码成更高维特征向量,以提升模型的性能。本专利采用全连接(Fully Connected,FC)神经网络,将轨迹点编码成指定维度的向量,其网络参数与整体网络一起训练。
轨迹时空特征编码子模型(Spatial-Temporal Block,ST block),即提取轨迹的时空特征向量。轨迹的点序列具有空间特征和时间序列特征,如何从原始轨迹中提取出高等级的,具有语义特征的时空向量是本方法的关键。为此,本发明设计了由FC层,卷积层(Convolution Layer, CONV)和长短期记忆人工神经网络(Long Short-Term Memory,LSTM) 组成的ST block。
车道特征表示子模型Fusion block,即提取能表示车道结构和驾驶行为的车道表示向量。车道内由多条历史通行轨迹,每条轨迹对车道表示向量都提供了一定的信息量,将多条轨迹的时空特征向量融合即可得到车道表示向量。
计算样本的先验分布,即假设样本服从正太分布N(μ,σ2),计算正太分布的均值和方差。在CVAE的训练过程中,编码阶段的输出是正太分布的均值和方差,通过FC来计算得到。
解码层,即将输入的特征向量解码成轨迹的点序列。该模型是一个自回归模型,依赖于上一次预测的轨迹点位置和车道表示向量。
图3中,ST-block为时空特征提取模块,主要由FC、CONV和LSTM 组成,提取轨迹的时空特征。FC表示全连接层,CONV表示卷积层, LSTM表示循环神经网络层。Fusion block将多条历史轨迹的时空向量融合,其结果为车道表示向量。X表示车道的引导线轨迹,VX表示引导线的时空向量,Ci车道的第i条历史通行轨迹,Vi表示第i条历史通行轨迹的时空向量。Vs表示通过Fusion block融合后的车道表示向量。μ,logσ2分别表示网络预测的先验分布均值和方差平方的对数值,z 为对先验分布的采样向量。
其中,对于基于神经网络的轨迹规划模型,包括训练和推理过程,具体的,训练过程如下:
1、向ST block中输入真实引导线轨迹X,输入Ci为历史通行轨迹。
2、将全局坐标的轨迹点转换为局部坐标,局部坐标的原点为该车道轨迹的中心点。
3、ST block对真实引导线轨迹X编码,得到它的时空特征向量VX
4、分别对每一条历史通行轨迹Ci编码,通过ST-block提取历史通行轨迹Ci的时空特征,得到Ci的时空特征向量Vi
5、将多条历史通行轨迹的时空特征向量Vi通过Fusion-block融合生成车道表示向量Vs
6、将真实引导线轨迹X的时空特征向量和VX和车道表示向量Vs联合,通过多层全连接网络(包括多个FC层)预测先验网络的均值和方差平方的对数,即先验分布参数,包括先验多元正太分布的均值μ和方差平方的对数logσ2
7、从标准正太分布∈~N(0,1)中采样指定维度的向量∈,维度与先验多元正太分布的维度一致,计算向量z=∈×σ+μ,作为解码网络的输入。
8、向量z,通过FC层与车道表示向量Vs联合;
9、通过LSTM网络循环输出多个值,FC层将LSTM的输出作为输入,生成预测轨迹点。
10、在对轨迹规划模型进行训练的过程中,生成的预测引导线轨迹与输入的真实引导线轨迹求损失函数值、求梯度值,基于损失函数值和梯度值更新轨迹规划模型的网络参数。在推理过程中,生成的轨迹点序列即为生成的预测引导线
Figure BDA0003925789920000111
其中,需要说明的是,在对轨迹规划模型进行训练的过程中,采用的损失函数为:
Figure BDA0003925789920000112
其中
Figure BDA0003925789920000113
表示识别网络,学习后验分布,pθ为先验网络,学习先验分布,Z噪声向量,X为引导线轨迹,Xi为引导线轨迹的第i个点,T 为模型生成的轨迹,Ti为模型生成轨迹的第i个点,C=(C1,C2,…,Cn),Ci表示车道内的第i条轨迹。
训练算法为基于mini-batch的BP算法,学习策略为RMSprop。
基于训练好的轨迹规划模型生成预测引导线的过程请参见图4,轨迹规划模型的推断过程如下:
1、输入Ci为车道历史轨迹。
2、分别对车道历史轨迹Ci编码,通过ST-block得到Ci的时空特征向量Vi
3、将多条轨迹的时空特征向量Vi通过Fusion-block融合生成车道表示向量Vs
4、从标准正太分布z~N(0,1)中采样指定维度的向量z,向量z,通过FC层与车道表示向量Vs联合。
5、通过LSTM网络循环输出多个值,FC层将LSTM的输出作为输入,生成预测的引导线。
其中,需要说明的是,ST block的内部结构示意图请参见图5,ST block包括全连接层FC、卷积网络CONV和循环神经网络LSTM;
基于全连接层FC将真实引导线轨迹和每一条历史通行轨迹中的采样点的经度和纬度编码成指定维度的向量;通过卷积网络CONV提取真实引导线轨迹和每一条历史通行轨迹中的采样点的空间特征;基于循环神经网络LSTM,提取具有时序特征的所述真实引导线轨迹和每一条历史通行轨迹中的采样点的时空特征向量。
可理解的是,基于ST block提取轨迹序列的时空特征向量,其中, ST block包括全连接层FC、卷积网络CONV和循环神经网络LSTM,提取轨迹序列的时空特征向量的步骤主要包括:轨迹中采样点的特征编码:采用FC层将轨迹采样点的经度和维度编码成固定维度的语义向量,它是采样点的高级特征的一种向量表示形式,将采样点从原始特征经度和维度编码成更高级的特征来表示。轨迹序列的空间特征提取:轨迹序列中邻近的点间存在空间相关系,利用卷积网络CONV来提取轨迹的空间关系。轨迹序列的特征编码:轨迹序列具有时序特征,提取出语义特征是关键,主要采用LSTM网络提取出轨迹的语义特征向量,即时空特征向量。
S2,基于所述预测引导线轨迹,通过仿真平台生成一条控制可行的引导线轨迹。
可理解的是,仿真平台主要采用Carla仿真平台,它是一种用于自动驾驶的开源模拟器,支持自动驾驶***的开发、训练和验证。仿真平台中主要包括MPC控制器,基于轨迹规划模型生成的预测引导线轨迹,规划一条控制上可行的引导线轨迹。
其中,Carla平台通过MPC控制器,满足横向力系数和曲率约束条件,生成一条控制可执行的引导线轨迹,由点序列组成:
Figure BDA0003925789920000131
S3,计算所述轨迹规划模型生成的预测引导线轨迹和仿真平台生成的控制可行的引导线轨迹之间的相似性。
S4,如果所述轨迹规划模型生成的预测引导线轨迹和仿真平台生成的控制可行的引导线轨迹不相似,则将仿真平台生成的控制可行的引导线轨迹作为预测引导线轨迹;如果相似,保持所述预测引导线轨迹。
作为实施例,基于LSTM孪生网络实现二分类,判断所述轨迹规划模型生成的预测引导线轨迹和仿真平台生成的控制可行的引导线轨迹的相似性。
可以理解的是,上述步骤分别通过轨迹规划模型生成了预测引导线轨迹和通过仿真平台生成了控制可行的引导线轨迹,本步骤通过基于LSTM孪生网络实现二分类,判断T和T'的相似性。由于T'是控制可行的引导线轨迹,因此,如果T和T'不相似,则将T'作为预测引导线轨迹,添加到新数据集中;如果T和T'相似,则表明轨迹规划模型生成的预测引导线轨迹符合控制生可行,将T作为预测引导线轨迹添加到新数据集中。
图6为本发明实施例提供的一种基于仿真反馈数据的引导线生成***结构图,如图6所示,一种基于仿真反馈数据的引导线生成***,包括轨迹规划模块601、仿真平台602、计算模块603和更新模块604,其中:
轨迹规划模块601,用于根据真实引导线轨迹和多条历史通行轨迹,基于轨迹规划模型生成预测引导线轨迹;
仿真平台602,用于基于所述预测引导线轨迹,生成一条控制可行的引导线轨迹;
计算模块603,用于计算所述轨迹规划模型生成的预测引导线轨迹和仿真平台生成的控制可行的引导线轨迹之间的相似性;
更新模块604,用于如果所述轨迹规划模型生成的预测引导线轨迹和仿真平台生成的控制可行的引导线轨迹不相似,则将仿真平台生成的控制可行的引导线轨迹作为预测引导线轨迹;如果相似,保持所述预测引导线轨迹。
可以理解的是,本发明提供的一种基于仿真反馈数据的引导线生成***与前述各实施例提供的基于仿真反馈数据的引导线生成方法相对应,基于仿真反馈数据的引导线生成***的相关技术特征可参考基于仿真反馈数据的引导线生成方法的相关技术特征,在此不再赘述。
请参阅图7,图7为本发明实施例提供的电子设备的实施例示意图。如图7所示,本发明实施例提了一种电子设备700,包括存储器710、处理器720及存储在存储器710上并可在处理器720上运行的计算机程序711,处理器720执行计算机程序711时实现基于仿真反馈数据的引导线生成方法的步骤。
请参阅图8,图8为本发明提供的一种计算机可读存储介质的实施例示意图。如图8所示,本实施例提供了一种计算机可读存储介质800,其上存储有计算机程序811,该计算机程序811被处理器执行时实现基于仿真反馈数据的引导线生成方法的步骤。
本发明实施例提供的一种基于仿真反馈数据的引导线生成方法及***,将规划的引导线轨迹和仿真的引导线轨迹联合,通过仿真平台对轨迹规划模型的结构的反馈,构建新数据集,用于训练和优化轨迹规划模型,使得最终生成的车道级引导线更加符合驾驶行为习惯。
需要说明的是,在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详细描述的部分,可以参见其它实施例的相关描述。
本领域内的技术人员应明白,本发明的实施例可提供为方法、***、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(***)、和计算机程序产品的流程图和/或方框图来描述。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式计算机或者其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包括这些改动和变型在内。

Claims (10)

1.一种基于仿真反馈数据的引导线生成方法,其特征在于,包括:
根据多条历史通行轨迹,基于轨迹规划模型生成预测引导线轨迹;
基于所述预测引导线轨迹,通过仿真平台生成一条控制可行的引导线轨迹;
计算所述轨迹规划模型生成的预测引导线轨迹和仿真平台生成的控制可行的引导线轨迹之间的相似性;
如果所述轨迹规划模型生成的预测引导线轨迹和仿真平台生成的控制可行的引导线轨迹不相似,则将仿真平台生成的控制可行的引导线轨迹作为预测引导线轨迹;如果相似,保持所述预测引导线轨迹。
2.根据权利要求1所述的引导线生成方法,其特征在于,所述轨迹规划模型为条件变分自编码器CVAE,所述条件变分自编码器CVAE的数学基本表达式为:
T=g(z,V);
其中,已知z、V的情况下通过函数g生成所求的引导线轨迹T,T由经纬度组成的点序列,z为服从高斯分布的固定维度的随机向量,V为模型提取的车道驾驶行为语义向量,g为轨迹规划模型的函数表达式。
3.根据权利要求2所述的引导线生成方法,其特征在于,所述条件变分自编码器CVAE包括多个ST block、Fusion block、多层全连接网络和解码网络,所述轨迹规划模型的训练过程为:
获取训练样本集,所述训练样本集中包括多个样本,每一个样本包括多条历史通行轨迹和真实引导线轨迹;
基于ST block提取所述真实引导线轨迹和每一条历史通行轨迹的时空特征向量;
基于Fusion block将每一条历史通行轨迹的时空特征向量进行融合,生成车道表示向量;
将所述真实引导线轨迹的时空特征向量和所述车道表示向量联合,基于所述多层全连接网络预测先验网络的先验分布参数,所述先验分布参数包括先验多元正太分布的均值μ和方差平方的对数logσ2
从标准正太分布∈~N(0,1)中采样指定维度的向量∈,其维度与先验多元正太分布的维度一致,计算向量z=∈×σ+μ;
通过所述解码网络将向量z和所述车道表示向量进行联合,生成预测引导线。
4.根据权利要求3所述的引导线生成方法,其特征在于,所述ST block包括全连接层FC、卷积网络CONV和循环神经网络LSTM;
基于所述全连接层FC将所述真实引导线轨迹和每一条历史通行轨迹中的采样点的经度和纬度编码成指定维度的向量;
通过卷积网络CONV提取所述真实引导线轨迹和每一条历史通行轨迹中的采样点的空间特征;
基于循环神经网络LSTM,提取具有时序特征的所述真实引导线轨迹和每一条历史通行轨迹中的采样点的时空特征向量。
5.根据权利要求1或4所述的引导线生成方法,其特征在于,所述真实引导线轨迹和每一条历史通行轨迹均由具有时序特征的轨迹采样点序列组成,所述根据多条历史通行轨迹,基于轨迹规划模型生成预测引导线轨迹,之前还包括:
将所述真实引导线轨迹和每一条历史通行轨迹中的采样点从全局地球坐标转换为车身局部坐标,包括:
根据公式(2)将全局坐标转换为同方向的局部坐标:
Figure FDA0003925789910000031
其中x,y分别表示经度值和纬度值,上标l,g分别表示局部坐标和全局坐标,下标i表示第i个采样点;
或者,基于公式(3)和公式(4)将全局坐标转换为局部坐标:
xnew=xoldcosθ-yoldsinθ (3);
ynew=xoldsinθ+yoldcosθ (4);
其中,xnew,ynew分别表示新的局部坐标的经度和纬度,xold,yold分别表示旧的局部坐标的经度和纬度,车辆进入路口方向为y轴正方向,y轴右手边为y轴正方向的笛卡尔坐标系;
或者,基于公式(5)将全局坐标转换为局部坐标:
Figure FDA0003925789910000032
其中,当前采样点的行为坐标为其坐标值减去前一采样点坐标值。
6.根据权利要求1所述的引导线生成方法,其特征在于,所述根据多条历史通行轨迹,基于轨迹规划模型生成预测引导线轨迹,还包括:
计算所述预测引导线轨迹与所述真实引导线轨迹之间的损失和梯度值,基于损失和梯度值调整所述轨迹规划模型的网络超参数。
7.根据权利要求1所述的引导线生成方法,其特征在于,所述计算所述轨迹规划模型生成的预测引导线轨迹和仿真平台生成的控制可行的引导线轨迹之间的相似性,包括:
基于LSTM孪生网络实现二分类,判断所述轨迹规划模型生成的预测引导线轨迹和仿真平台生成的控制可行的引导线轨迹的相似性。
8.一种基于仿真反馈数据的引导线生成***,其特征在于,包括轨迹规划模块、仿真平台、计算模块和更新模块;
轨迹规划模块,用于根据多条历史通行轨迹,基于轨迹规划模型生成预测引导线轨迹;
仿真平台,用于基于所述预测引导线轨迹,生成一条控制可行的引导线轨迹;
计算模块,用于计算所述轨迹规划模型生成的预测引导线轨迹和仿真平台生成的控制可行的引导线轨迹之间的相似性;
更新模块,用于如果所述轨迹规划模型生成的预测引导线轨迹和仿真平台生成的控制可行的引导线轨迹不相似,则将仿真平台生成的控制可行的引导线轨迹作为预测引导线轨迹;如果相似,保持所述预测引导线轨迹。
9.一种电子设备,其特征在于,包括存储器、处理器,所述处理器用于执行存储器中存储的计算机管理类程序时实现如权利要求1-7任一项所述的基于仿真反馈数据的引导线生成方法的步骤。
10.一种计算机可读存储介质,其特征在于,其上存储有计算机管理类程序,所述计算机管理类程序被处理器执行时实现如权利要求1-7任一项所述的基于仿真反馈数据的引导线生成方法的步骤。
CN202211373065.1A 2022-11-03 2022-11-03 一种基于仿真反馈数据的引导线生成方法及*** Pending CN115700509A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211373065.1A CN115700509A (zh) 2022-11-03 2022-11-03 一种基于仿真反馈数据的引导线生成方法及***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211373065.1A CN115700509A (zh) 2022-11-03 2022-11-03 一种基于仿真反馈数据的引导线生成方法及***

Publications (1)

Publication Number Publication Date
CN115700509A true CN115700509A (zh) 2023-02-07

Family

ID=85121111

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211373065.1A Pending CN115700509A (zh) 2022-11-03 2022-11-03 一种基于仿真反馈数据的引导线生成方法及***

Country Status (1)

Country Link
CN (1) CN115700509A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117251896A (zh) * 2023-10-11 2023-12-19 北京师范大学 基于上下文信息的数字孪生学习场景重建方法与***

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117251896A (zh) * 2023-10-11 2023-12-19 北京师范大学 基于上下文信息的数字孪生学习场景重建方法与***
CN117251896B (zh) * 2023-10-11 2024-02-27 北京师范大学 基于上下文信息的数字孪生学习场景重建方法与***

Similar Documents

Publication Publication Date Title
CN110610271B (zh) 一种基于长短记忆网络的多重车辆轨迹预测方法
Xu et al. Bits: Bi-level imitation for traffic simulation
Cho et al. Deep predictive autonomous driving using multi-agent joint trajectory prediction and traffic rules
CN112766561A (zh) 一种基于注意力机制的生成式对抗轨迹预测方法
Rehder et al. Lane change intention awareness for assisted and automated driving on highways
CN113044064B (zh) 基于元强化学习的车辆自适应的自动驾驶决策方法及***
Zhou et al. Learning the Car‐following Behavior of Drivers Using Maximum Entropy Deep Inverse Reinforcement Learning
CN114399743B (zh) 一种障碍物未来轨迹的生成方法
CN112347923A (zh) 一种基于对抗生成网络的路侧端行人轨迹预测算法
Pini et al. Safe real-world autonomous driving by learning to predict and plan with a mixture of experts
Harrison et al. Guiding reinforcement learning exploration using natural language
CN115547040A (zh) 安全势场下基于informer神经网络的驾驶行为预测方法
Yin et al. Diverse critical interaction generation for planning and planner evaluation
CN115700509A (zh) 一种基于仿真反馈数据的引导线生成方法及***
CN115293237A (zh) 一种基于深度学习的车辆轨迹预测方法
Alighanbari et al. Deep reinforcement learning with nmpc assistance nash switching for urban autonomous driving
Agarwal et al. Imitative planning using conditional normalizing flow
CN112418421B (zh) 一种基于图注意力自编码模型的路侧端行人轨迹预测算法
Esaid et al. Machine learning-based eco-approach and departure: Real-time trajectory optimization at connected signalized intersections
CN116304969A (zh) 基于lstm-gnn考虑道路信息的车辆轨迹多模态预测方法
CN111443701A (zh) 基于异构深度学习的无人驾驶车辆/机器人行为规划方法
EP4124999A1 (en) Method and system for predicting trajectories of agents
CN113762464B (zh) 一种基于学习的列车运行参考曲线动态生成方法
CN115562258A (zh) 基于神经网络的机器人社会自适应路径规划方法及***
Löckel et al. An adaptive human driver model for realistic race car simulations

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination