CN114743170B

CN114743170B - 一种基于ai算法的自动驾驶场景标注方法

Info

Publication number: CN114743170B
Application number: CN202210435027.8A
Authority: CN
Inventors: 李开兴; 郝金隆; 张霞
Original assignee: Chongqing Changan Automobile Co Ltd
Current assignee: Chongqing Changan Automobile Co Ltd
Priority date: 2022-04-24
Filing date: 2022-04-24
Publication date: 2024-06-14
Anticipated expiration: 2042-04-24
Also published as: CN114743170A

Abstract

本发明公开了一种基于AI算法的自动驾驶场景标注方法，能够对自动驾驶数据的原始数据打上对应的场景标签，让用户可根据标签对数据进行筛选，从而快速获得较为富集、且具有针对性的场景数据，既提高了对数据的筛选效率，也降低了需要进行标注的数据量。

Description

一种基于AI算法的自动驾驶场景标注方法

技术领域

本发明涉及人工智能和自动驾驶技术领域，具体涉及一种基于AI算法的自动驾驶场景标注方法。

背景技术

L2级自动驾驶已经大规模量产，L3级别自动驾驶也大量上市，对自动驾驶算法的要求也越来越高，需要处理大量的数据，尤其是各种不同场景的数据更是影响算法性能的核心因素之一。各种场景的数据越丰富，算法对各种不同场景的适应能力也就更强。但对于不同的场景，在采集的原始数据中，所需要的数据数量严重不平衡，一般算法开发过程中需要进行数据集平衡，使不同场景的数据量差异不能过大，如果在标注之前，进行数据初筛，可大大降低数据标注的工作量，但面对海量的原始数据，人工筛选费事费力。专利CN2018113066861提出了一种仿真场景数据挖掘的方法，通过比较仿真场景的特征和算法运行结果之间的差异来进行数据挖掘；专利CN2020110090940提出了一种难例数据挖掘方式，通过比对云端及车端算法结果的差异进行数据挖掘。但这两种方法还存在如下问题：1、未将场景标签和场景数据进行对应和存储，无法快速检索；2、这两种方法所针对的均不是某一算法所需要的训练数据；3、都需要一种基线方法进行比较。

发明内容

针对现有技术存在的上述不足，本发明的目的在于提供一种基于AI算法的自动驾驶场景标注方法，以解决现有技术中无法根据场景所需数据对原始数据进行有针对性的筛选的问题。

为了解决上述技术问题，本发明采用如下技术方案：

一种基于AI算法的自动驾驶场景标注方法，包括如下步骤：

S1：选择一场景，并根据不同的场景所需的数据不同，对该场景所需的数据进行标注；

S2：针对S1选择的场景，选择适用于该场景的场景识别算法；

S3：根据S1标注的数据对S2选择的场景识别算法进行训练，得到识别该场景的算法模型；

S4：获取车辆行驶过程中的原始数据，利用S3得到的所述场景的算法模型对原始数据进行识别处理，得到识别结果；

S5：对S4得到的识别结果进行筛选；

S6：根据S2选择的场景识别算法的类型，对S5筛选后的识别结果进行数据切片；

S7：根据S1所选择的场景，对S6得到的数据切片标注相应的场景标签。

与现有技术相比，本发明具有如下有益效果：

本发明所述方法能够根据不同的场景以及不同场景所需的不同场景识别算法，对其所需要的数据进行筛选，并标注该场景的标签，让用户可根据标签对数据进行筛选，从而快速获得较为富集、且具有针对性的场景数据，既提高了对数据的筛选效率，也降低了需要进行标注的数据量。

附图说明

图1为本发明针对原始数据的实施方法流程图

图2 为本发明针对切片数据的实施方法流程图。

图3为本发明中实施例的流程图。

具体实施方式

为了使本发明的实施例的目的、技术方案和优点更加清楚，下面将结合附图对本发明作进一步地详细描述，所描述的实施例不应视为对本发明的限制，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例，都属于本发明保护的范围。

本发明提供一种基于AI算法的自动驾驶场景标注方法，如图1所示，包括如下步骤：

S1：选择一场景，并根据不同的场景所需的数据不同，对该场景所需的数据进行标注。对于不同驾驶场景，所需要关注的数据并不相同，针对某一场景所需的数据进行提前标注。

S2：针对S1选择的场景，选择适用于该场景的场景识别算法。其中，场景识别算法的类型众多，包括但不限于CNN卷积神经网络类型和RNN卷积神经网络类型。

S3：根据S1标注的数据对S2选择的场景识别算法进行训练，得到识别该场景的算法模型。

S4：获取车辆行驶过程中的原始数据，利用S3得到的所述场景的算法模型对原始数据进行识别处理，得到识别结果。其中，所述原始数据包括但不限于图片数据和数值数据，本发明所述方法既能对图片数据进行场景标注，也能对该场景所需的数值数据进行场景标注。

S5：对S4得到的识别结果进行筛选，其目的是为了去除掉识别不够可靠的结果，例如，在某些算法中，识别去除波动较大的数据区间，提升识别准确率。

S6：根据S2选择的场景识别算法的类型，对S5筛选后的识别结果进行数据切片，进行数据切片需要依据一定的规则，而所述规则则需要根据场景识别算法的类型进行调整。例如，当S2选择的场景识别算法为CNN型算法时，输入为单张图像；当S2选择的场景识别算法为RNN型算法时，输入为连续多张图像。

在具体实施时，本发明所述方法能够对已经完成切片的数据进行标注，如图2所示，对于已经完成切片的数据进行如下步骤处理：

（1）重复步骤S1~S3；

（2）对已经完成切片的数据进行识别处理，得到识别结果；

（3）根据S1所选择的场景，对已经完成切片的数据标注相应的场景标签。

本发明所述方法还包括如下步骤：

将S7中得到已标注场景标签的切片数据作为S4中的原始数据，然后重复进行步骤S1~S7，以此经过多次迭代，能够进一步提高对数据标注场景标签的准确性。

通过以下实施例，对本发明所述基于AI算法的自动驾驶场景标注方法进行进一步说明。如图3所示，以弯道场景识别为例，数据以视频抽帧得到的连续图片为例，进行说明。实施步骤如下：

步骤1：标注弯道场景数据；

步骤2：采用CNN+LSTM作为场景识别算法；

步骤3：使用标注数据对CNN+LSTM算法进行训练，得到识别弯道的模型；

步骤4：利用弯道场景识别模型对原始连续图片数据进行推理预测，得到识别结果，结果包含图片的类别标签id，以及为弯道的概率p；

步骤5：将上述识别结果中，预测置信概率低于阈值thr1的图片去除；thr1需要根据实际情况设置；

步骤6：将上述识别结果中，统计属于相同类别的每个连续区间帧数，将帧数小于阈值thr2的区间去除，thr2需要根据实际情况设置；

步骤7：将上述结果中，识别波动较大的区间去除，不失一般性的，波动的以连续区间的置信概率标准差作为指标，计算公式为；；其中为区间的每一张图像的分类置信概率，为区间的平均置信概率，将标准差高于阈值thr3的区间去除。

步骤8：将每个连续区间切片，作为切片数据；

步骤9：将该连续区间的类别标签id作为该切片数据的场景标签；

进一步的，若数据已经完成切片，对已切片的数据打场景标签的步骤如下，

重复步骤1-3；

步骤10：利用弯道场景识别模型对切片连续图片数据进行推理预测，得到识别结果，结果包含图片的类别标签id，以及为弯道的概率p；

步骤11：将上述识别结果中，预测置信概率低于阈值thr1的图片去除；thr1需要根据实际情况设置；

步骤12：将上述识别结果中，统计属于相同类别的每个连续区间帧数，将帧数小于阈值thr2的区间去除，thr2需要根据实际情况设置；

步骤13：将上述结果中，识别波动较大的区间去除，不失一般性的，波动的以连续区间的置信概率标准差作为指标，计算公式为；其中为区间的每一张图像的分类置信概率，为区间的平均置信概率，将标准差高于阈值thr3的区间去除。

步骤14：若一个切片数据对应的上述已处理识别结果中仍然包含弯道区间，则给切片数据打上弯道标签。

如上所述，本发明的提醒***不限于所述配置，其他可以实现本发明的实施例的***均可落入本发明所保护的范围内。

最后需要说明的是，以上实施例仅用以说明本发明的技术方案而非限制技术方案，本领域的普通技术人员应当理解，那些对本发明的技术方案进行修改或者等同替换，而不脱离本技术方案的宗旨和范围，均应涵盖在本发明的权利要求范围当中。

Claims

1.一种基于AI算法的自动驾驶场景标注方法，其特征在于，包括如下步骤：

S2：针对S1选择的场景，选择适用于该场景的场景识别算法；

S5：对S4得到的识别结果进行筛选；

S7：根据S1所选择的场景，对S6得到的数据切片标注相应的场景标签；

当场景为弯道场景时，利用弯道场景识别模型对原始连续图片数据进行推理预测，得到识别结果，结果包含图片的类别标签id，以及为弯道的概率p；将上述识别结果中，预测置信概率低于阈值thr1的图片去除；thr1需要根据实际情况设置；将上述识别结果中，统计属于相同类别的每个连续区间帧数l，将帧数l小于阈值thr2的区间去除，thr2需要根据实际情况设置；将上述结果中，识别波动较大的区间去除，波动的以连续区间的置信概率标准差作为指标，将标准差高于阈值thr3的区间去除。

2.根据权利要求1所述基于AI算法的自动驾驶场景标注方法，其特征在于，对于已经完成切片的数据进行如下步骤处理：

(1)重复步骤S1～S3；

(2)对已经完成切片的数据进行识别处理，得到识别结果；

(3)根据S1所选择的场景，对已经完成切片的数据标注相应的场景标签。

3.根据权利要求1所述基于AI算法的自动驾驶场景标注方法，其特征在于，还包括如下步骤：

将S7中得到已标注场景标签的切片数据作为S4中的原始数据，然后重复进行步骤S1～S7。

4.根据权利要求1所述基于AI算法的自动驾驶场景标注方法，其特征在于，在S4中，所述原始数据包括但不限于图片数据和数值数据。

5.根据权利要求1所述基于AI算法的自动驾驶场景标注方法，其特征在于，在S2中，所述场景识别算法包括CNN卷积神经网络或RNN卷积神经网络。

6.根据权利要求5所述基于AI算法的自动驾驶场景标注方法，其特征在于，在S6中，当S2选择的场景识别算法为CNN型算法时，输入的图像为单张图像。

7.根据权利要求5所述基于AI算法的自动驾驶场景标注方法，其特征在于，在S6中，当S2选择的场景识别算法为RNN型算法时，输入的图像为多张连续图像。