CN113033902A

CN113033902A - 一种基于改进深度学习的自动驾驶换道轨迹规划方法

Info

Publication number: CN113033902A
Application number: CN202110349255.9A
Authority: CN
Inventors: 熊明强; 陈涛; 夏芹; 谯杰
Original assignee: Cas Intelligent Network Technology Co ltd; China Automotive Engineering Research Institute Co Ltd
Current assignee: Cas Intelligent Network Technology Co ltd; China Automotive Engineering Research Institute Co Ltd
Priority date: 2021-03-31
Filing date: 2021-03-31
Publication date: 2021-06-25
Anticipated expiration: 2041-03-31
Also published as: CN113033902B

Abstract

本发明涉及车辆智能驾驶技术领域，具体涉及一种基于改进深度学习的自动驾驶换道轨迹规划方法，包括：S1、构建数学模型：根据针对的问题和已有的数据训练若干个BP神经网络，将这些神经网络以替换的方式对经典的BP神经网络中的激活函数进行替换，包括前向传播过程和反向传播过程；S2、规划最优轨迹：利用多项式曲线来模拟车辆换道过程中的行驶轨迹，得到最优轨迹曲线；S3、执行避障算法：在经典Gipps模型的基础上加入车身长度进行改进，作为最优轨迹曲线的约束条件，求解得到最小安全距离和最大安全速度。本发明能够确保换道车辆能够对突发情况做出反应，保障了车辆换道过程的安全性，解决了现有技术安全性不足的技术问题。

Description

一种基于改进深度学习的自动驾驶换道轨迹规划方法

技术领域

本发明涉及车辆智能驾驶技术领域，具体涉及一种基于改进深度学习的自动驾驶换道轨迹规划方法。

背景技术

随着科学技术的发展，智能驾驶汽车控制决策的研究也日益深入。智能驾驶汽车能够安全、高效地在复杂的交通场景中导航，例如，决定何时更改车道，超车或减慢速度以允许其他车辆进行车道合并。但是，这取决于智能驾驶车辆是否具有某种能力来预测自身以及周围车辆的轨迹，以便在与周围车辆发生相互作用之前能够主动采取措施规避此类风险。

比如说，中国专利CN111931905A公开了一种图卷积神经网络模型及利用该模型的车辆轨迹预测方法，方法包括步骤：对交通场景内被预测车及其周围车辆以5Hz的频率进行采样，获取各个车辆采样点的位置坐标以及动力学参数，包括横纵坐标和横向、纵向车速、加速度；由被预测车和周围车辆的坐标和车速，计算出被预测车和周围各车辆之间的碰撞时间TTC并判断出车辆行为；将各车历史轨迹输入模型，编码轨迹中的时序交互特征并提取的空间特征，将空间特征总结为上下文向量后输入至LSTM解码器生成车辆的未来轨迹坐标。

在上述技术方案中，采用LSTM神经网络对车辆换道轨迹进行预测，目标轨迹学习精度很高，但是忽略了换道过程中的动态变化，这样的模型对于换道条件过于苛刻，无法用于现实环境；与此同时，换道车辆无法对突发情况做出反应，在安全性方面也还存在不足。

发明内容

本发明提供一种基于改进深度学习的自动驾驶换道轨迹规划方法，解决了现有技术安全性不足的技术问题。

本发明提供的基础方案为：一种基于改进深度学习的自动驾驶换道轨迹规划方法，包括：

S1、构建数学模型：根据针对的问题和已有的数据训练若干个BP神经网络，将这些神经网络以替换的方式对经典的BP神经网络中的激活函数进行替换，包括前向传播过程和反向传播过程；

S2、规划最优轨迹：利用多项式曲线来模拟车辆换道过程中的行驶轨迹，得到最优轨迹曲线；

S3、执行避障算法：在经典Gipps模型的基础上加入车身长度进行改进，作为最优轨迹曲线的约束条件，求解得到最小安全距离和最大安全速度。

本发明的工作原理及优点在于：

(1)将所训练的LSTM神经网络模型嵌入到BP神经网络中，建立可嵌入的深度学习网络模型，使得该模型能够有效地继承以往数据的换道行为特征，同时能缩短对新数据的学习过程，从而更好地学到人类的安全换道行为。

(2)从安全性和迁移学习两个角度入手改进LSTM神经网络模型，保障了车辆换道过程的安全性，使得车辆在学习换道的过程中可以同时利用规则算法对训练过程进行监督和修正，确保了换道车辆能够对突发情况做出反应，从而提高安全性。

本发明能够确保换道车辆能够对突发情况做出反应，保障了车辆换道过程的安全性，解决了现有技术安全性不足的技术问题。

进一步，S1中，神经网络包含一个输入层、若干个隐藏层以及一个输出层；其中，输入层是整个神经网络的入口，用于输入训练数据，训练数据为需要训练的换道轨迹规划数据；隐含层包含遗忘门、输入门、输出门和细胞状态，遗忘门、输入门、输出门对训练数据进行处理；输出层用于输出训练数据经过隐藏层处理之后得到的结果。

有益效果在于：通过这样的方式，对神经网络进行改进，可以使得改进后的神经网络比改进前的神经网络相比，安全性更高、误差更低。

进一步，遗忘门、输入门、输出门对训练数据进行处理，具体过程如下：

A1、在新的训练数据传入神经网络时，遗忘门决定哪些旧的训练数据需要从细胞状态h_t-1中扔掉，如下式所示，

f_t＝σ(W_f[h_t-1,x_t]+b_f)

式中，W_f是遗忘门的权重矩阵，h_t-1是t-1时刻的细胞状态，x_t是换道轨迹规划数据，b_f是遗忘门的偏置项；

A2、输入门决定哪些值需要更新，tanh函数层创建向量作为加入到细胞状态的候选值，如下式所示，

i_t＝σ(W_i[h_t-1,x_t]+b_i)

式中，b_i是输入门的偏置项，

是准备用以更新的数据矩阵，W_c是准备用以更新的数据的权重矩阵；

A3、更新上一时刻细胞状态，从细胞状态移除掉在忘记门决定的信息，以决定对每一个状态值更新的比例来加入输入门计算出的候选值，如下式所示，

A4、决定将要输出的部分，如下式所示，

O_t＝σ(W_o[h_t-1,x_t]+b_o)

式中，W_o是输出门的权重矩阵，b_o是输出门的偏置项。

有益效果在于：通过sigmoid函数层来决定Ct中有哪些部分需要被更新，将Ct经过一个tanh函数处理使其数值落在(-1，1)区间内，并将遗忘门里sigmoid层的输出相乘从而决定输出，有利于训练误差快速趋于收敛。

进一步，S1中，反向传播过程中嵌入层和隐藏层的误差矩阵分别如下式所示，

并根据损失矩阵调整各层神经元的权重矩阵，具体如下式所示，

W_o＝W+ηδ_ZZ^T

W_i＝W+ηδ_HX^T

式中，L为损失函数。

有益效果在于：通过这样的方式，得到损失矩阵之后，调整各层神经元的权重矩阵，有利于通过多次实践对神经网络进行改进。

进一步，S2中，利用三次多项式曲线来模拟车辆换道过程中的行驶轨迹，其表达式如下：

式中，a₀、a₁、a₂、a₃均为待确定的参数，x_n为车辆n的纵向位置，y_n为车辆n的横向位置；

确定各项参数如下式所示，

式中，θ_i为规划步长起点的航向角，

为终点横向坐标。

有益效果在于：三次多项式轨迹曲率变化较为均匀，需要求解的参数较少，而且，θ_i为规划步长起点的航向角、

为终点横向坐标，均为已知量，故而轨迹方程由换道轨迹终点纵向坐标

唯一确定。

进一步，S3中，求解最小安全距离和最大安全速度的公式，分别如下式所示，

式中，最小安全距离为

最大安全速度为

x_n-1(t)为前车t时刻位置，x(t)为后车t时刻位置，v_n-1(t)、v(t)分别表示前车和后车t时刻的速度，b_n-1为前车最大制动量、b为后车最大制动量，a为后车实时加速度，τ为后车的反应时间，l_n-1为前车的车身长度，l为后车的车身长度。

有益效果在于：由于在经典的Gipps模型中，将车辆视作质点，没有考虑车辆车身长度，通过这样的方式计算得到的最小安全距离和最大安全速度更加符合实际情况。

进一步，还包括S4，采用MAE和MARE对测试结果进行评价，其中，MAE为平均绝对误差、MARE为平均绝对相对误差，MAE和MARE的计算公式分别如下式所示，

式中，N表示测试数据样本数，d_r,i表示第i辆车的真实值，d_s,i表示第i辆车的预测值。

有益效果在于：通过这样的方式，便于对神经网络训练之后的预测数据和原始数据进行比较，从而有利于对算法进行改进。

附图说明

图1为本发明一种基于改进深度学习的自动驾驶换道轨迹规划方法实施例的流程图。

图2为本发明一种基于改进深度学习的自动驾驶换道轨迹规划方法实施例的LSTM神经网络结构图。

图3为本发明一种基于改进深度学习的自动驾驶换道轨迹规划方法实施例的安全距离示意图。

图4为本发明一种基于改进深度学习的自动驾驶换道轨迹规划方法实施例的车辆成功换道场景各参数变化曲线。

具体实施方式

下面通过具体实施方式进一步详细的说明：

实施例1

实施例基本如附图1所示，包括：

在本实施例中，借鉴人类对于新事物的学习过程，将所训练的LSTM神经网络模型嵌入到BP神经网络中，建立可嵌入的深度学习网络模型，该深度学习网络有效地继承了以往数据的换道行为特征，同时能缩短对新数据的学习过程。

具体实施过程如下：

S1、构建数学模型：根据针对的问题和已有的数据训练若干个BP神经网络，将这些神经网络以替换的方式对经典的BP神经网络中的激活函数进行替换，包括前向传播过程和反向传播过程。

对于神经网络来说，从方法来讲都是在模仿人的学习过程。人对事物进行学习是从两个方面进行的：其一，对该事物已经形成的知识进行学习；其二，通过不断的实践进行学习。在本实施例中，借鉴这种思路，如附图2所示，在进行前向传播之前，根据特定的问题和已有的数据训练若干个BP神经网络，以替换的方式将经典的BP神经网络中的激活函数替换，被替换激活函数的数量需要根据训练效果不断尝试。其中，被嵌入神经网络的输入层神经元个数需要和第一级神经网络的输入层个数保持一致，输出层神经元个数也应保持一致。

神经网络包含一个输入层、若干个隐藏层以及一个输出层；其中，输入层是整个神经网络的入口，用于输入训练数据，训练数据为需要训练的换道轨迹规划数据；隐含层包含遗忘门、输入门、输出门和细胞状态，遗忘门、输入门、输出门对训练数据进行处理；输出层用于输出训练数据经过隐藏层处理之后得到的结果。

对于前向传播过程，假设一个神经网络有p个输出，当该网络进行一次前向传播时，第j个神经元的输入如下式所示，

第j个神经元的输出如下式所示，

y_j＝F(S_j)

式中，F()是激活函数，在本实施例中激活函数如下式所示，

F_k(x)＝LSTM_k(x)

遗忘门、输入门、输出门对训练数据进行处理，具体过程如下：

f_t＝σ(W_f[h_t-1,x_t]+b_f)

i_t＝σ(W_i[h_t-1,x_t]+b_i)

式中，b_i是输入门的偏置项，

A4、决定将要输出的部分，如下式所示，

O_t＝σ(W_o[h_t-1,x_t]+b_o)

式中，W_o是输出门的权重矩阵，b_o是输出门的偏置项。

这样，通过sigmoid函数层来决定Ct中有哪些部分需要被更新，将Ct经过tanh函数处理使其数值落在(-1，1)区间内，并将遗忘门里sigmoid层的输出相乘从而决定输出，有利于训练误差快速趋于收敛。

对于反向传播过程，输出层第j个神经元所对应的误差如下式所示，

对于嵌入层神经元而言，

所以得到损失矩阵如下式所示，

类似地，隐藏层所对应的误差矩阵是如下式所示，

对于LSTM神经网络的梯度进行求解而言，在本实施例中，假设LSTM神经网络的隐藏状态是h^(t)和细胞状态C^(t)，那么有以下关系成立，

式中，L是损失函数。

为了便于推导，将损失函数L(t)分为时刻t的损失值l(t)和时刻t之后的损失值L(t+1)，也即，

式中，τ是将要计算梯度值的某个时刻。

故有，

接着可由

反向推导

和

本层t时刻的输出梯度误差和大于t时刻的误差两部分共同决定

的梯度，也即，

由于h^(t)＝o^(t)⊙tanh(C^(t))，而C^(t)可以表示为：

C^(t)＝C^(t-1)·f^(t)+i^(t)·a^(t)

故有，

ΔC＝o^(t+1)·[1-tanh²(C^(t+1))]

可得，

对于W_f的梯度，可得，

如有需要，可参照上述步骤计算其他参数的梯度。在得到损失矩阵之后，需要调整各层神经元的权重矩阵，也即，

W_o＝W+ηδ_ZZ^T

W_i＝W+ηδ_HX^T

经过多次实践，在本实施例中将改进LSTM神经网络的层数设置为隐层神经元个数，也即为15*8规格的两层神经网络结构，输入变量确定为纵向位置x₀、横向位置y₁和速度v₀，输出变量为下一时刻规划的速度，采取的神经网络学习率为0.01。

S2、规划最优轨迹：利用多项式曲线来模拟车辆换道过程中的行驶轨迹，得到最优轨迹曲线。本实施例中，利用三次多项式曲线来模拟车辆换道过程中的行驶轨迹，其表达式如下：

确定各项参数如下式所示，

式中，θ_i为规划步长起点的航向角，

为终点横向坐标。

三次多项式轨迹曲率变化较为均匀，需要求解的参数较少，而且，θ_i为规划步长起点的航向角、

唯一确定。

在本实施例中，在经典Gipps模型的基础上加入车身长度进行改进，作为三次轨迹曲线的约束条件。车辆换道过程中受到周围车辆实时的影响，为了保证换道过程的安全性，需要实时检测周围车辆的行驶状态，并对周围车辆的行驶状态进行预测，也即，

x_j(t)＝x_j(t₀)+v_jt

s.t.j＝n-1,n-2,n+2

式中，j表示车辆n-1，x_j(t₀)、v_j分别表示当前状态各个车辆的纵向坐标和速度，x_j(t)表示t时刻车辆j的纵向坐标。由于在经典的Gipps模型中，车身的长度没有被考虑到，本实施例对经典Gipps模型进行改进，特别应用于车辆高速行驶的状况或者情形，也就是说，各个车辆的行驶速度均在110～120km/h之间，由于我国高速公路限速最高为120km/h，各个车辆的行驶速度均在110～120km/h之间属于最恶劣、最具代表性的情形，比如说，车辆的行驶速度为115km/h，如图3所示，后车紧急刹车距离如下式所示，

式中，

分别为前车和后车从刹车到停车之间的距离，x_n-1(t)为前车t时刻位置、x(t)为后车t时刻位置，v_n-1(t)、v(t)分别表示前车和后车t时刻的速度，b_n-1为前车最大制动量、b为后车最大制动量，a为后车实时加速度，τ为后车的反应时间。

当后车刹车时，前后两车刚好不追尾需保持的距离为

就是Gipps最小安全距离，如下式所示，

式中，l_n-1为前车的车身长度，l为后车的车身长度。

由于车辆换道的安全性与车辆速度也有关，可以根据改进的Gipps安全模型计算车辆的安全速度。也即，推算出车辆n的安全速度范围，车辆n受到车辆n-1影响的最大安全速度

如下式所示，

在本实施例中，采用CarSim仿真软件进行验证，将训练好的神经网络用于预测换道的规划轨迹输入到Carsim仿真平台，从而得到换道轨迹跟踪的效果以及换道过程中车辆的各种参数，如附图4所示。

从附图4可以得知，车辆成功换道情况下车辆的轨迹和速度跟踪效果以及车辆的性能参数，以下分别进行简单说明。

对于附图4(a)，为车辆成功换道的轨迹跟踪情况，其中红色线条表示输入CarSim中的一体化换道的规划轨迹，蓝色线条表示车辆在CarSim仿真过程中的跟踪轨迹，两条轨迹的曲线相似度很高，拟合度较高，表明所规划出的换道轨迹能够很好地被车辆跟踪。

对于附图4(b)，表示车辆换道速度的跟踪情况，结果显示换道车辆的速度平顺地发生变化，跟踪速度和仿真速度的曲线的拐点存在一定差异，但是误差较小，可见车辆速度的跟踪性较好。

对于附图4(c)，为换道过程中车辆前轮转向角随时间变化情况，红色曲线代表了车辆的右前轮转向角变化情况，蓝色曲线代表了车辆的左前轮转向角变化情况，车辆在换道准备阶段前轮转向角为零，在换道执行阶段，车辆前轮由零逐渐增大到最大值后逐渐减小至零，然后向相反方向行驶至较大值后减小至零；另外，车辆左前轮与右前轮的转向角存在差异，这个情况与车辆真实换道情况相符。

对于附图4(d)，显示了车辆轮胎的侧向滑移角，四个车轮的变化保持一致，变化的数值较小，表明车辆行驶稳定性良好。

实施例2

与实施例1不同之处仅在于，采用MAE和MARE对测试结果进行评价，MAE为平均绝对误差、MARE为平均绝对相对误差，MAE和MARE的计算公式分别如下式所示，

在本实施例中，基于LSTM神经网络训练之后的预测数据和原始数据进行比较，可得以下表格，

由此可知，测试结果的误差很小，能够满足实际应用。

以上所述的仅是本发明的实施例，方案中公知的具体结构及特性等常识在此未作过多描述，所属领域普通技术人员知晓申请日或者优先权日之前发明所属技术领域所有的普通技术知识，能够获知该领域中所有的现有技术，并且具有应用该日期之前常规实验手段的能力，所属领域普通技术人员可以在本申请给出的启示下，结合自身能力完善并实施本方案，一些典型的公知结构或者公知方法不应当成为所属领域普通技术人员实施本申请的障碍。应当指出，对于本领域的技术人员来说，在不脱离本发明结构的前提下，还可以作出若干变形和改进，这些也应该视为本发明的保护范围，这些都不会影响本发明实施的效果和专利的实用性。本申请要求的保护范围应当以其权利要求的内容为准，说明书中的具体实施方式等记载可以用于解释权利要求的内容。

Claims

1.一种基于改进深度学习的自动驾驶换道轨迹规划方法，应用于车辆的行驶速度在110～120km/h之间的场景，其特征在于，包括：

2.如权利要求1所述的基于改进深度学习的自动驾驶换道轨迹规划方法，其特征在于，S1中，神经网络包含一个输入层、若干个隐藏层以及一个输出层；其中，输入层是整个神经网络的入口，用于输入训练数据，训练数据为需要训练的换道轨迹规划数据；隐含层包含遗忘门、输入门、输出门和细胞状态，遗忘门、输入门、输出门对训练数据进行处理；输出层用于输出训练数据经过隐藏层处理之后得到的结果。

3.如权利要求2所述的基于改进深度学习的自动驾驶换道轨迹规划方法，其特征在于，遗忘门、输入门、输出门对训练数据进行处理，具体过程如下：

f_t＝σ(W_f[h_t-1,x_t]+b_f)