CN112989867A

CN112989867A - 目标检测与场景分割一体化网络设计方法

Info

Publication number: CN112989867A
Application number: CN201911212008.3A
Authority: CN
Inventors: 刘振; 邰春琪; 许静; 何良; 乐国庆
Original assignee: Beijing Huahang Radio Measurement Research Institute
Current assignee: Beijing Huahang Radio Measurement Research Institute
Priority date: 2019-12-02
Filing date: 2019-12-02
Publication date: 2021-06-18

Abstract

本发明公开了一种目标检测与场景分割一体化网络设计方法，包括特征提取主体网络、目标检测子网络以及场景分割子网络，所述目标检测子网络与场景分割子网络共享特征提取主体网络。本发明将传统的多任务多网络串行改进为多任务单网络并行，从而大幅度降低模型大小，降低多任务执行时间。

Description

目标检测与场景分割一体化网络设计方法

技术领域

本发明属于计算机视觉技术领域，具体涉及目标检测与场景分割网络设计方法。

背景技术

随着深度学习技术的快速发展，目标检测识别以及场景分割成为其在计算机视觉方向的主要研究热点，两者分属两大范畴，而深度学习也在此两个方向做出重大突破，如目标检测方向的Faster-Rcnn，SSD以及YOLO系列，场景分割方向的FCN、UNet等一系列业内顶尖算法。但是，截至目前极少研究两者的并行处理问题。基于深度学习的检测分割算法往往需要大量计算资源，而在大多数的工业化应用中，要求在极其有限的计算资源与存储资源下实现任务的实时执行，这就对算法的计算复杂度以及模型精简化提出了较高要求。

在实际工程应用中，对于上述两大任务(目标检测与场景分割)分别设计不同的卷积神经网络很难满足工程对于实时性以及存储资源的要求。

发明内容

本发明需解决的技术问题是提供一种目标检测与场景分割一体化网络设计方法，实现模型精简化，降低多任务执行时间。

为解决上述技术问题，本发明提供了目标检测与场景分割一体化网络设计方法，采取技术方案如下：

所述一体化网络包括特征提取主体网络、目标检测子网络以及场景分割子网络，所述目标检测子网络与场景分割子网络共享特征提取主体网络。

进一步地，通过特征提取主体网络的卷积及降采样，于1/8分辨率、1/16分辨率上进行特征融合，引出场景分割子网络，于1/8/、1/16以及1/32分辨率上进行特征融合，引出目标检测子网络。

进一步地，所述场景分割子网络搭建方法为：

在1/16分辨率的特征图上，采用多路并行卷积网络，卷积核大小分别选用3*3、5*5以及1*1，同时利用特征金字塔模式，将1/16分辨率的特征与1/8分辨率的特征进行有效融合，并利用该融合特征执行分割任务，建立场景分割子网络。

进一步地，还包括：一体化网络训练，训练方法如下：

步骤1、保持目标检测子网络参数不变的情况下，优先训练场景分割子网络、特征提取主体网络，使场景分割子网络收敛；

步骤2、保持特征提取主体网络及场景分割子网络参数不变的情况下，训练目标检测子网络，使目标检测子网络收敛；

步骤3、在上述两步的前提下，目标检测子网络损失及场景分割子网络损失，数值保持在较小比例范围内且下降趋于平稳，而后进行一体化网络联合训练，使一体化网络收敛。

本发明通过一个深度卷积神经网络实现检测与分割任务的同步执行，从而将传统的多任务多网络串行改进为多任务单网络并行，从而大幅度降低模型大小，降低多任务执行时间。本发明可用于车辆自动驾驶(涉及行人、车辆检测与车道线场景分割)、目标探测(涉及目标检测与场景分割)等领域。

附图说明

图1为本发明实施例的一体化网络设计模式示意图；

图2为本发明实施例的主体特征提取网络示意图；

图3为本发明实施例的场景分割网络子网络示意图。

具体实施方式

下面结合附图和实施例对本发明的具体实施方式进一步说明。

基于深度学习的单任务网络设计包含两大模块：特征提取主体网络以及任务相关子网络。目标检测网络包含特征提取主体网络以及目标检测子网络，场景分割网络包含特征提取主体网络以及目标分割子网络。

本发明实施例搭建的目标检测与场景分割并行的统一化网络,如图1所示，具体如下：

所述统一化网络包含特征提取主体网络、目标检测子网络以及场景分割子网络。目标检测子网络与场景分割子网络在特征提取主体网络存在参数共享空间。为了提升目标检测与场景分割性能，通过特征提取主体网络的卷积及降采样，于1/8分辨率、1/16分辨率上进行特征融合，引出场景分割子网络，于1/8/、1/16以及1/32分辨率上进行特征融合，引出目标检测子网络。图2以车辆自动驾驶为例的主体特征提取网络示意图，其中，目标检测子网络为车辆检测子网络，场景分割子网络为车道线检测子网络。

进一步地，所述分割子网络具体设计方法如下：

基于1/8分辨率以及1/16分辨率的主体网络上的特征利用卷积层提取特征，进行场景分割子网络设计。为了保证低参数高性能运算，在1/16分辨率的特征图上，采用多路并行卷积网络，卷积核大小分别选用3*3、5*5以及1*1以有效扩增决策层(图中的SegPred1)的接受域，同时利用特征金字塔模式，将1/16分辨率的特征与1/8分辨率的特征进行有效融合，并利用该融合特征执行分割任务(图中的SegPred2)，建立场景分割子网络，具体的网络设计如图3所示(未特殊标注的卷积核大小均为3*3)。

所述目标检测子网络的搭建可采取YOLO算法的检测框架。

在此需说明的是，目标检测子网络的搭建为本领域技术人员公知技术，在此不再赘述。

进一步地，对一体化网络进行训练。

上述一体化网络在训练过程中存在下述问题：1)检测模块损失与分割模块损失失衡(两者不在一个量级)2)训练过程中两者的下降速率相差较大，具体表现为，检测模块损失迅速下降，而分割损失下降较为缓慢。因此训练过程很难收敛，基于上述问题，本发明实施例提出下述训练方法：

步骤3、在上述两步的前提下，检测目标检测子网络损失及场景分割子网络损失，数值保持在较小比例范围内且下降趋于平稳，而后进行一体化网络联合训练(包含主干特征提取主体网络、目标检测子网络以及场景分割子网络)，使一体化网络(双任务)收敛。

Claims

1.一种目标检测与场景分割一体化网络设计方法，其特征在于：包括特征提取主体网络、目标检测子网络以及场景分割子网络，所述目标检测子网络与场景分割子网络共享特征提取主体网络。

2.如权利要求1所述的一种目标检测与场景分割一体化网络设计方法，其特征在于：通过特征提取主体网络的卷积及降采样，于1/8分辨率、1/16分辨率上进行特征融合，引出场景分割子网络，于1/8/、1/16以及1/32分辨率上进行特征融合，引出目标检测子网络。

3.如权利要求2所述的一种目标检测与场景分割一体化网络设计方法，其特征在于：所述场景分割子网络搭建方法为：在1/16分辨率的特征图上，采用多路并行卷积网络，卷积核大小分别选用3*3、5*5以及1*1，同时利用特征金字塔模式，将1/16分辨率的特征与1/8分辨率的特征进行有效融合，并利用该融合特征执行分割任务，建立场景分割子网络。

4.如权利要求1、2或3所述的一种目标检测与场景分割一体化网络设计方法，其特征在于：还包括：一体化网络训练，训练方法如下：

步骤3、在上述两步的前提下，检测目标检测子网络损失及场景分割子网络损失，数值保持在较小比例范围内且下降趋于平稳，而后进行一体化网络联合训练，使一体化网络收敛。