CN111325075B

CN111325075B - 一种视频序列目标检测方法

Info

Publication number: CN111325075B
Application number: CN201811543205.9A
Authority: CN
Inventors: 乐国庆; 张立平; 苏帅; 刘振; 许静; 刘轩
Original assignee: Beijing Huahang Radio Measurement Research Institute
Current assignee: Beijing Huahang Radio Measurement Research Institute
Priority date: 2018-12-17
Filing date: 2018-12-17
Publication date: 2023-11-07
Anticipated expiration: 2038-12-17
Also published as: CN111325075A

Abstract

本发明提供一种应用于车载视觉***的视频序列目标检测方法，包括以下步骤：步骤S1、使用Faster‑RCNN目标检测框架，获取当前车辆行驶方向的视频图像作为当前帧检测结果；步骤S2、将当前帧检测结果输入至下一帧检测前的RPN网络，计算RPN层候选框与前帧检测结果框之间的重叠度；步骤S3、将候选框进行分类和回归，输出检测结果。本发明提高目标检测算法的检测精度，而且在不降低检测算法的精度的前提下提升检测速度。

Description

一种视频序列目标检测方法

技术领域

本发明涉及计算机视觉技术领域，是一种应用于车载视觉***的视频序列目标检测策略。

背景技术

目前，对于先进辅助驾驶***(ADAS)，投资成本相对较少的方向就是计算机视觉，其目的就是通过视觉来获取车辆前方的各类目标信息，进而给予驾驶员警示，保护驾驶员的安全。针对中国的复杂交通环境，各种目标如：行人、非机动车辆、以及快递车辆等，都是建立ADAS需要的且必不可少的信息，并且对于这些目标的检测是减少事故发生率的有效方案。

近年来，基于视觉的目标检测算法可谓是百花齐放，并且都具有较高的检测精度与实时性，例如caffe-ssd、Faster-RCNN、YOLO等，但是由于车载环境的复杂性，包括：车载环境的光照变化比较明显、图像中的检测目标在自身车辆行驶过程中容易产生畸变、目标的尺度大小多种多样、和检测图像的分辨率较低等，这些问题都会对现有目标检测算法的检测精度产生一些影响。

另外，对于ADAS，目标检测算法的检测框的稳定性、检测算法的实时性也都是至关重要的影响因素，前者会影响基于视觉的测距精度，进而影响ADAS报警准确性；后者会影响ADAS响应时间。

发明内容

鉴于上述问题的分析，本发明旨在提供一种应用于车载视觉*** 的视频序列目标检测方法，提高目标检测算法的检测精度，而且在不降低检测算法的精度的前提下提升检测速度。

本发明主要是通过以下技术方案实现的，包括以下步骤：

步骤S1、使用Faster-RCNN目标检测框架，获取当前车辆行驶方向的视频图像作为当前帧检测结果；

步骤S2、将当前帧检测结果输入至下一帧检测前的RPN网络，计算RPN层候选框与前帧检测结果框之间的重叠度IOU；保留IOU＝0 和IOU＞Thershold的候选框；

Thershold为重叠率的阈值；

步骤S3、将候选框进行分类和回归；

步骤S4、重复步骤S1～S3，保存当前帧图像检测结果。

进一步，其特征在于在所述步骤2还包括对IOU＞Thershold的候选框按其IOU值从高到低排序，筛除排序较低的候选框。按其IOU 值从高到低排序，筛除排序较低的候选框。

进一步，其特征在于在所述步骤2中RPN层添加一个数据接口。

本发明有益效果如下：

本发明适用于车载视觉***应用环境中的基于视频序列的目标检测，无需重新训练目标检测模型，在原本的Faster-rcnn检测框架基础上，在侯选框的位置和数量上进行了策略优化，提升基于视频序列目标检测精度并提高检测的实时性，从而给驾驶员提供预警进而规避。

附图说明

附图仅用于示出具体实施例的目的，而并不认为是对本发明的限制，在整个附图中，相同的参考符号表示相同的部件。

图1为本发明提供的目标检测方法流程图；

图2为前帧输入图像；

图3为前帧检测结果输入下一帧RPN层效果。

图4为筛选Proposal候选框后的效果。

图5为下一帧检测结果显示。

具体实施方式

下面结合附图来具体描述本发明的优选实施例，其中，附图构成本申请一部分，并与本发明的实施例一起用于阐释本发明的原理。

Faster-RCNN框架中包含两个网络——RPN和Fast-RCNN网络，前者用于生成候选框，后者对候选框进行分类和位置回归。

本发明的一个具体实施例，公开了一种用于车载视觉***的基于视频序列的目标检测策略；如图1所示，包括以下步骤：

步骤S1、根据车载视觉***的应用场景，使用Faster-RCNN目标检测框架，获取当前行驶方向前方的视频图像作为前帧输入图像，如图2所示。将当前帧检测结果输入至下一帧检测前的RPN网络，分析帧间信息。

步骤S2、帧间信息分析，根据设置的输出候选框，如图3所示。

由于视频序列前后帧是具有上下文帧间信息的，在RPN层添加一个数据接口，将前帧的检测结果位置输入给RPN层。

1、计算RPN层候选框与前帧检测结果框之间的重叠度；

2、根据设置的输出候选框个数筛选候选框；

如果IOU＝0，即没有重叠，存在刚进入和方消失在视野中的目标，这些候选框保留；

IOU＞Thershold,Thershold为重叠率的阈值，可人为设置，即表示同一车辆和行人在前后两帧图像中的位置是相近的，这些候选框保留。对IOU＞Thershold的候选框按其IOU值从高到低排序，筛除排序较低的候选框。

通过上述策略限制候选框个数，调整RPN网络的输出，结果如图4所示。RPN网络的候选框的输出个数，是可以设置的，并且检测的精度与该参数也存在一定的正比关系，但同时也会影响检测的实时性。即个数少实时性高，但可能精度低，根据实际情况调整。

步骤S3、再将筛选后RPN网络输出的的候选框进行分类和回归，输出下一帧视频图像的检测结果，如图5所示。

步骤S4、重复步骤S1至S4，保存当前帧图像检测结果。保存当前帧图像检测结果的位置信息供下一帧使用本策略影响RPN的候选框。

经过上述所有步骤即可获得每一帧视频图像中的目标检测结果。

综上所述，本发明实施例提供的用于车载视觉***的基于视频序列的目标检测策略。

本领域技术人员可以理解，实现上述实施例方法的全部或部分流程，可以通过计算机程序来指令相关的硬件来完成，所述的程序可存储于计算机可读存储介质中。其中，所述计算机可读存储介质为磁盘、光盘、只读存储记忆体或随机存储记忆体等。

以上所述，仅为本发明较佳的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围。

Claims

1.一种视频序列目标检测方法，包括以下步骤：

步骤S2、将当前帧检测结果输入至下一帧检测前的RPN网络，计算RPN层候选框与前帧检测结果框之间的重叠度IOU；保留IOU＝0和IOU＞Thershold的候选框；

Thershold为重叠率的阈值；

步骤S3、将候选框进行分类和回归；

步骤S4、重复步骤S1～S3，保存当前帧图像检测结果。