CN113850136A

CN113850136A - 基于yolov5与BCNN的车辆朝向识别方法及***

Info

Publication number: CN113850136A
Application number: CN202110973740.3A
Authority: CN
Inventors: 周子淳; 黄志鹏; 刘建云; 李恒
Original assignee: 709th Research Institute of CSIC
Current assignee: 709th Research Institute of CSIC
Priority date: 2021-08-24
Filing date: 2021-08-24
Publication date: 2021-12-28

Abstract

本发明公开了一种基于yolov5与BCNN的车辆朝向识别方法及***，其基于yolov5算法构建车辆检测模型并进行训练，利用训练完成的车辆检测模型对测试集进行识别，输出得到测试集图片中的车辆位置信息；根据车辆位置信息将车辆区域从原图中裁剪下来，并按照车辆朝向属性对车辆数据进行标注和分开存放，形成车辆朝向数据集；基于BCNN算法构建车辆朝向识别模型，采用标注好的车辆朝向数据集对其进行训练，利用训练好的车辆检测模型和车辆朝向识别模型依次对输入的监测场景数据中的图像进行预测，输出车辆朝向的类别。本发明将yolov5算法与BCNN算法相结合，使得车辆定位更加准确、检测速度更快、鲁棒性更强，实现车辆多角度、复杂场景的识别任务。

Description

基于yolov5与BCNN的车辆朝向识别方法及***

技术领域

本发明涉及图像处理及模式识别技术领域，尤其是涉及一种基于yolov5与BCNN的车辆朝向识别方法及***。

背景技术

在大型园区的出入口通常需要对车辆出入信息进行登记，以及确定车辆在园区内的活动轨迹，便于对车辆实行智能化管理，目前大部分园区对车辆的进出采用人工登记的方式，这样做会很费时间，效率非常低，车流量很大时，对工作人员也产生很大的工作压力，也有一些地方采用了基于图像的自动化录入方式，通过识别出车头车尾，进而判断车辆的进出方向。目前这些自动化录入方式均有一定的局限性，对于一些悬挂在高处的摄像头都达不到很好的效果。

专利申请号为201710458187.3，专利名称为一种基于图像的车头朝向识别方法及装置，该方法提出一种基于图像的车头朝向识别方法及装置，通过确定待识别图像中车牌特征的区域，来确定车脸的各顶点所在区域，通过各顶点所在区域来确定车脸所在区域，再对车脸区域进行分类，进而确定车头的朝向，但是这种方法中确定车牌特征区域时用到车牌像素点的特征和相邻像素点之间的关系，但是这种方法很容易受环境因素的影响，在恶劣的天气情况下，这种方法就很有局限性，而且在对车脸区域进行分类时，分类效果很容易受车辆区域背景的影响。

专利申请号为201911315840.6，专利名称为网络训练方法、车头朝向识别方法、装置及终端设备，该方法提出一种网络训练方法、装置及终端设备，通过在包含目标车辆的图像样本中，确定能够包含所述目标车辆的最小四边形区域，通过最小四边形区域来确定第一矩形区域，进而通过设定的插值点来计算偏移量和多个目标区域，利用偏移量和多个目标区域对网络进行训练，可以识别出车辆的车头朝向，但是对于水平放置的车辆，该方法没法确定最小四边形区域，所以该方法具有很大的局限性。

发明内容

本发明提出一种基于yolov5与BCNN的车辆朝向识别方法及***，以克服上述技术不足。

为达到上述技术目的，本发明的技术方案第一方面提供一种基于yolov5与BCNN的车辆朝向识别方法，其包括如下步骤：

采集监测场景数据形成车辆检测数据集，按比例将所述车辆检测数据集分为训练集和测试集，对训练集图片中的车辆位置进行标注；

基于yolov5算法构建车辆检测模型，采用标注好的训练集对车辆检测模型进行训练，利用训练完成的车辆检测模型对测试集进行识别，输出得到测试集图片中的车辆位置信息；

根据车辆位置信息将车辆区域从原图中裁剪下来，并按照车辆朝向属性对车辆数据进行标注和分开存放，形成车辆朝向数据集；

基于BCNN算法构建车辆朝向识别模型，采用标注好的车辆朝向数据集对车辆朝向识别模型进行训练，利用训练好的车辆检测模型和车辆朝向识别模型依次对输入的监测场景数据中的图像进行预测，输出车辆朝向的类别。

本发明第二方面提供一种基于yolov5与BCNN的车辆朝向识别***，其包括如下功能模块：

数据制作模块，用于采集监测场景数据形成车辆检测数据集，按比例将所述车辆检测数据集分为训练集和测试集，对训练集图片中的车辆位置进行标注；

车辆位置识别模块，用于基于yolov5算法构建车辆检测模型，采用标注好的训练集对车辆检测模型进行训练，利用训练完成的车辆检测模型对测试集进行识别，输出得到测试集图片中的车辆位置信息；

朝向数据处理模块，用于根据车辆位置信息将车辆区域从原图中裁剪下来，并按照车辆朝向属性对车辆数据进行标注和分开存放，形成车辆朝向数据集；

朝向模型训练模块，用于基于BCNN算法构建车辆朝向识别模型，采用标注好的车辆朝向数据集对车辆朝向识别模型进行训练；

车辆朝向识别模块，用于利用训练好的车辆检测模型和车辆朝向识别模型依次对输入的监测场景数据中的图像进行预测，输出车辆朝向的类别。

本发明第三方面提供一种服务器，包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现上述一种基于yolov5与BCNN的车辆朝向识别方法的步骤。

本发明第四方面提供一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，所述计算机程序被处理器执行时实现上述一种基于yolov5与BCNN的车辆朝向识别方法的步骤。

与现有技术相比，本发明所述一种基于yolov5与BCNN的车辆朝向识别方法及***，其依次对车辆检测模型与车辆朝向识别模型进行训练和预测，通过车辆检测模型预测结果能够得到只包含车辆信息的矩形区域，可以减少矩形区域以外的其他物体的干扰，通过车辆朝向识别模型来对检测出来的车辆进行车辆朝向识别，能够在提取特征的时候着重关注物体的局部特征，更有利于区分车头车尾，进而确定车辆朝向，同时，将车辆检测模型的预测结果作为车辆朝向识别模型的输入，能够进一步提高车辆朝向识别模型的分类准确率。本发明将yolov5算法与BCNN算法相结合的方式来检测识别车辆朝向，定位更加准确，检测速度更快、鲁棒性更强，可以实现车辆多角度、复杂场景的识别任务。

附图说明

图1是本发明实施例所述一种基于yolov5与BCNN的车辆朝向识别方法的流程框图；

图2是本发明实施例所述车辆朝向识别模型的结构示意图；

图3是本发明实施例所述一种基于yolov5与BCNN的车辆朝向识别***的模块框图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本发明进行进一步详细说明。应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。

基于上述内容，本发明实施例提供一种基于yolov5与BCNN的车辆朝向识别方法，如图1所示，其包括如下步骤：

S1、采集监测场景数据形成车辆检测数据集，按比例将所述车辆检测数据集分为训练集和测试集，对训练集图片中的车辆位置进行标注。

具体的，采集监测场景数据，并自监测场景数据中提取具有运动前景的图像进行保存，形成车辆检测数据集。所述具有运动前景的图像提取方法如下：

将指定区域内没有车辆的一帧图像作为原始的模板图像，将后续图像与模板图像的对应像素点灰度值之间作差，如果差值的绝对值大于规定的阈值，就将该点作为前景，否则作为背景，如下所示：

其中img1(i,j),img2(i,j)分别为某一时刻两张图像上对应像素点的像素值,T为阈值。如果指定区域内前景像素点的数量大于50，就说明有运动前景，对于有运动前景的图像进行保存，形成车辆检测数据集。

对获取到的数据进行随机明暗亮度处理，并添加随机噪声；将预处理得到的数据再次进行cutout数据增强处理，即对图片进行随机旋转操作，旋转角度在±30°之间，并在随机位置添加一个大小为30x30马赛克。

按照9:1的比例对数据集进行划分，制作成训练集和测试集，通过labelImg软件对扩充之后的训练集来进行标注，标注每张图片上的车辆位置信息，生成yolo格式的txt标注文件，标注文件的格式为0m1 n1 m2 n2，其中0为车辆的类别信息，m1，n1，m2和n2为归一化之后的坐标。

S2、基于yolov5算法构建车辆检测模型，采用标注好的训练集对车辆检测模型进行训练，利用训练完成的车辆检测模型对测试集进行识别，输出得到测试集图片中的车辆位置信息。

本发明实施例采用resnet18预训练模型作为车辆检测模型，将标注好的训练集输入resnet18预训练模型中进行训练，具体的，训练迭代次数设置为400，优化器使用Adam，初始学习率设置为0.001。然后利用训练完成的车辆检测模型对测试集进行识别，输出得到测试集图片中的车辆位置信息及置信度。每次迭代完成之后都会将测试准确率与上一次迭代的测试准确率进行对比，如果当前的测试准确率大于上次的测试准确率，就把当前生成的训练模型作为最优模型，并进行保存，直到完成所有的迭代。

根据输出的车辆位置信息形成车辆位置预测框，根据车辆位置预测框之间的重合比例和置信度信息对车辆位置预测框进行非极大值抑制操作，通过非极大值抑制操作可以得到最终预测的车辆位置预测框。即先通过得到的置信度信息对置信度得分进行排序，选取得分最高的车辆位置预测框m，计算其他的车辆位置预测框一一与得分最高的车辆位置预测框之间面积的交集和并集，并计算出交集与并集的比值P，如果P>0.5就把其他的车辆位置预测框去掉，直到所有输入的车辆位置预测框都被处理，得到最终的车辆位置预测框。

计算最终预测的车辆位置预测框的坐标信息与车辆位置标注框的坐标信息之间两个框的最小闭包区域面积q1，交集的面积q2，通过q1和q2，计算出闭包区域中不属于两个框的区域占闭包区域的比重q＝|q1-q2|/q1，再计算车辆位置预测框的坐标信息与车辆位置标注框的坐标信息之间的GloU损失，即GloU＝p-q，将GloU损失在训练网络中进行反向传播，并使GloU损失越来越小，直至模型收敛，网络每迭代一次，上述过程重复计算一次，模型保存一次，等到训练迭代完成之后，比较每个模型中的测试精度，取精度最大的模型作为最优模型。

S3、根据车辆位置信息将车辆区域从原图中裁剪下来，并按照车辆朝向属性对车辆数据进行标注和分开存放，形成车辆朝向数据集。

即根据车辆检测模型输出的车辆位置信息将图像中检测到的车辆裁剪下来，缩放成为固定尺寸为250x250的图像，形成车辆朝向数据集，并且车辆朝向的数据量近似为1：1，其中，车辆朝向数据尽可能的包括各种视角的场景，包括正面视角、俯视视角，侧面视角。

S4、基于BCNN算法构建车辆朝向识别模型，采用标注好的车辆朝向数据集对车辆朝向识别模型进行训练。

在采用标注好的车辆朝向数据集对车辆朝向识别模型进行训练之前，需要对车辆朝向数据集进行增强处理。所述增强处理包括对数据进行中心裁剪处理、添加随机噪声处理、水平翻转处理以及在±30°之间进行随机旋转处理。其中，中心裁剪操作是先根据原图尺寸和目标尺寸进行短边适配，得到适配图img1，再结合img1的长宽尺寸和目标尺寸进行平移偏移量的计算，根据平移偏移量将适配图img1的长宽进行缩放，得到目标尺寸，即将原图缩放为目标尺寸，举例说明，要裁剪的图大小20*8，目标图的大小5*4，(20/5＝4)>(8/4＝2),这个时候应该用短边8去适配，也就是8缩小成4，长边20就变成10，也就变成了一个10*4的图像，再根据适配图像的宽边10和目标尺寸的宽边5计算平移偏移量dx，即dx＝(10-5)*0.5f＝1.5，然后根据平移偏移量对适配图进行裁剪，就将原图裁剪成了目标图尺寸，并且不会留下空白区域，

不过，在对车辆朝向数据集进行增强处理之前，在对图像进行增强之前先在输入图像的左上角和右上角各填充一个黑色的矩形区域，左上角矩形区域的左上角点与输入图像的左上角点重合，左上角矩形区域的左边和上边与输入图像的左边和上边重合，右上角矩形区域的右上角点与输入图像的右上角点重合，右上角矩形区域的右边和上边与输入图像的右边和上边重合。然后对每张添加黑色区域的图像进行所述四种增强处理，接着再随机选取其中的三种增强处理对每张添加黑色区域的图像进行叠加增强，形成最终增强的车辆朝向数据集。通过采用单一增强方式和叠加增强方式，可以丰富数据量，增加算法的鲁棒性。

对增强后的数据按照9：1的比例进行数据划分，制作成车辆朝向训练集和测试集，其中训练集的数量是测试集的9倍，并用txt文档对每张图片所属的类别信息进行记录，类别按照01来进行标注，其中0代表车头，1代表车尾，txt文档的标注格式为图像路径加类别信息，中间用空格隔开。

基于BCNN算法构建的车辆朝向识别模型在提取特征的时候能够着重关注物体的局部特征，更有利于区分车头车尾，进而确定车辆朝向，具体如图2所示，所述车辆朝向识别模型主要由一个主干网络N组成，其由一些卷积层和池化层组成，其中conv1^2表示连续进行两次卷积操作，后面的2表示卷积的次数，conv3^3表示连续进行三次卷积操作，依次类推，通过这些卷积层来进行特征提取，对最后一个conv5层进行转置操作得到conv5_T，将conv5得到的特征矩阵与conv5_T得到的特征矩阵进行矩阵相乘运算，然后进行归一化操作，对归一化之后的特征连接一个全连接层。

在预测时，对全连接层的输出进行求最大值，并记录最大值位置的索引，索引值就是最终预测得到的标签值，如全连接层的输出为(0.9，0.3)，则取0.9为全连接层输出的最大值，索引值为0，即当前图片预测的结果为车头。

对车辆朝向识别模型的训练分为两步进行，第一步先冻结除了主干网络中的所有层，训练模型直到收敛为止，第二步打开第一步中冻结的所有层，在第一步训练好的模型上进行fine-tune训练，重新微调各层的权重，直至模型收敛。在第一步训练开始时先设置一些超参数，包括设置初始学习率lr＝1，训练迭代步epochs＝150，权重衰减参数weight_decay＝1e-8，输入的图像经过归一化层和全连接层之后，得到预测值，再利用cross-entroyloss来计算预测值与真实标签之间的损失，具体的计算公式如下：

其中，p(x)是真实标签，q(x)是全连接层得到的输出值,n是车辆朝向训练类别总数，x是车辆朝向的当前训练类别。

计算得到cross-entroyloss的值，再将cross-entroyloss的值在网络里面进行反向传播，每迭代一次，cross-entroyloss的值反向传播一次，并且模型的权重更新一次，每迭代10次保存一次模型，并利用测试集来计算一次准确率，直至模型逐渐收敛，最终选取测试准确率最高的模型。

S5、利用训练好的车辆检测模型和车辆朝向识别模型依次对输入的监测场景数据中的图像进行预测，输出车辆朝向的类别。

同时，在车辆朝向识别模型对输入的车辆图像中的车辆朝向进行预测时，也需要在输入图像的左上角和右上角添加一个黑色的矩形区域，从而避免车辆朝向识别模型提取到其他车辆的一些干扰信息，从而提高分类准确率。

本发明所述一种基于yolov5与BCNN的车辆朝向识别方法，其依次对车辆检测模型与车辆朝向识别模型进行训练和预测，通过车辆检测模型预测结果能够得到只包含车辆信息的矩形区域，可以减少矩形区域以外的其他物体的干扰，通过车辆朝向识别模型来对检测出来的车辆进行车辆朝向识别，能够在提取特征的时候着重关注物体的局部特征，更有利于区分车头车尾，进而确定车辆朝向，同时，将车辆检测模型的预测结果作为车辆朝向识别模型的输入，能够进一步提高车辆朝向识别模型的分类准确率。本发明将yolov5算法与BCNN算法相结合的方式来检测识别车辆朝向，定位更加准确，检测速度更快、鲁棒性更强，可以实现车辆多角度、复杂场景的识别任务。

如图3所示，本发明实施例还提供一种基于yolov5与BCNN的车辆朝向识别***，其包括如下功能模块：

数据制作模块10，用于采集监测场景数据形成车辆检测数据集，按比例将所述车辆检测数据集分为训练集和测试集，对训练集图片中的车辆位置进行标注；

车辆位置识别模块20，用于基于yolov5算法构建车辆检测模型，采用标注好的训练集对车辆检测模型进行训练，利用训练完成的车辆检测模型对测试集进行识别，输出得到测试集图片中的车辆位置信息；

朝向数据处理模块30，用于根据车辆位置信息将车辆区域从原图中裁剪下来，并按照车辆朝向属性对车辆数据进行标注和分开存放，形成车辆朝向数据集；

朝向模型训练模块40，用于基于BCNN算法构建车辆朝向识别模型，采用标注好的车辆朝向数据集对车辆朝向识别模型进行训练；

车辆朝向识别模块50，用于利用训练好的车辆检测模型和车辆朝向识别模型依次对输入的监测场景数据中的图像进行预测，输出车辆朝向的类别。

本实施例一种基于yolov5与BCNN的车辆朝向识别***的执行方式与上述基于yolov5与BCNN的车辆朝向识别方法基本相同，故不作详细赘述。

本实施例服务器为提供计算服务的设备，通常指具有较高计算能力，通过网络提供给多个消费者使用的计算机。该实施例的服务器包括：存储器、处理器以及***总线，所述存储器包括存储其上的可运行的程序，本领域技术人员可以理解，本实施例的终端设备结构并不构成对终端设备的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。

存储器可用于存储软件程序以及模块，处理器通过运行存储在存储器的软件程序以及模块，从而执行终端的各种功能应用以及数据处理。存储器可主要包括存储程序区和存储数据区，其中，存储程序区可存储操作***、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等；存储数据区可存储根据终端的使用所创建的数据(比如音频数据、电话本等)等。此外，存储器可以包括高速随机存取存储器，还可以包括非易失性存储器，例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。

在存储器上包含一种基于yolov5与BCNN的车辆朝向识别方法的可运行程序，所述可运行程序可以被分割成一个或多个模块/单元，所述一个或多个模块/单元被存储在所述存储器中，并由处理器执行，以完成信息的获取及实现过程，所述一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段，该指令段用于描述所述计算机程序在所述服务器中的执行过程。例如，所述计算机程序可以被分割为数据制作模块10、车辆位置识别模块20、朝向数据处理模块30、朝向模型训练模块40、车辆朝向识别模块50。

处理器是服务器的控制中心，利用各种接口和线路连接整个终端设备的各个部分，通过运行或执行存储在存储器内的软件程序和/或模块，以及调用存储在存储器内的数据，执行终端的各种功能和处理数据，从而对终端进行整体监控。可选的，处理器可包括一个或多个处理单元；优选的，处理器可集成应用处理器和调制解调处理器，其中，应用处理器主要处理操作***、应用程序等，调制解调处理器主要处理无线通信。可以理解的是，上述调制解调处理器也可以不集成到处理器中。

***总线是用来连接计算机内部各功能部件，可以传送数据信息、地址信息、控制信息，其种类可以是例如PCI总线、ISA总线、VESA总线等。处理器的指令通过总线传递至存储器，存储器反馈数据给处理器，***总线负责处理器与存储器之间的数据、指令交互。当然***总线还可以接入其他设备，例如网络接口、显示设备等。

所述服务器应至少包括CPU、芯片组、内存、磁盘***等，其他构成部件在此不再赘述。

在本发明实施例中，该终端所包括的处理器执行的可运行程序具体为：一种基于yolov5与BCNN的车辆朝向识别方法，其包括如下步骤：

基于BCNN算法构建车辆朝向识别模型，采用标注好的车辆朝向数据集对车辆朝向识别模型进行训练；

利用训练好的车辆检测模型和车辆朝向识别模型依次对输入的监测场景数据中的图像进行预测，输出车辆朝向的类别。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的***，装置和单元的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

以上所述，以上实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims

1.一种基于yolov5与BCNN的车辆朝向识别方法，其特征在于，包括如下步骤：

2.根据权利要求1所述一种基于yolov5与BCNN的车辆朝向识别方法，其特征在于，所述采集监测场景数据形成车辆检测数据集，具体包括：提取监测场景数据中具有运动前景的图像进行保存，形成车辆检测数据集。

3.根据权利要求1所述一种基于yolov5与BCNN的车辆朝向识别方法，其特征在于，所述车辆检测模型的损失计算方法如下：

根据输出的车辆位置信息形成预测框，根据预测框之间的重合比例和置信度信息对预测框进行非极大值抑制操作，得到预测框的最终预测坐标信息；

根据预测框的最终预测坐标信息与标注框标注的坐标信息计算得到预测框与标注框之间的GloU损失。

4.根据权利要求1所述一种基于yolov5与BCNN的车辆朝向识别方法，其特征在于，在采用标注好的车辆朝向数据集对车辆朝向识别模型进行训练之前，需要对车辆朝向数据集进行增强处理。

5.根据权利要求4所述一种基于yolov5与BCNN的车辆朝向识别方法，其特征在于，在对车辆朝向数据集进行增强处理之前，在对图像进行增强之前先在输入图像的左上角和右上角各填充一个黑色的矩形区域，左上角矩形区域的左上角点与输入图像的左上角点重合，左上角矩形区域的左边和上边与输入图像的左边和上边重合，右上角矩形区域的右上角点与输入图像的右上角点重合，右上角矩形区域的右边和上边与输入图像的右边和上边重合。

6.根据权利要求4所述一种基于yolov5与BCNN的车辆朝向识别方法，其特征在于，所述增强处理包括对数据进行中心裁剪处理、添加随机噪声处理、水平翻转处理以及在±30°之间进行随机旋转处理。

7.根据权利要求6所述一种基于yolov5与BCNN的车辆朝向识别方法，其特征在于，对每张添加黑色区域的图像进行所述四种增强处理，然后再随机选取其中的三种增强处理对每张添加黑色区域的图像进行叠加增强，形成最终增强的车辆朝向数据集。

8.一种基于yolov5与BCNN的车辆朝向识别***，其特征在于，包括如下功能模块：

9.一种服务器，包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时实现如权利要求1至7任一项所述基于yolov5与BCNN的车辆朝向识别方法的步骤。

10.一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1至7任一项所述基于yolov5与BCNN的车辆朝向识别方法的步骤。