CN108460348B

CN108460348B - 基于三维模型的道路目标检测方法

Info

Publication number: CN108460348B
Application number: CN201810147619.3A
Authority: CN
Inventors: 陈婧; 许文强; 彭伟民
Original assignee: Hangzhou Dianzi University
Current assignee: Hangzhou Dianzi University
Priority date: 2018-02-12
Filing date: 2018-02-12
Publication date: 2022-04-22
Anticipated expiration: 2038-02-12
Also published as: CN108460348A

Abstract

本发明公开了一种基于三维模型的道路目标检测方法，包括如下步骤：同步获取两张道路采样图像，计算两张道路采样图像的视差图像，获得视差图像的深度特征；根据视差图像的深度特征生成候选区域，并将候选区域的3维边界框的坐标点映射到二维图像；利用多尺度池化网络层的卷积神经网络提取二维图像的外形特征，利用3维模型获得道路目标。本发明具有如下有益效果：本发明的算法解决了二维检测过程中出现的遮挡和阴影等问题，提高了鲁棒性，降低了成本。

Description

基于三维模型的道路目标检测方法

技术领域

本发明涉及机器视觉技术领域，尤其是涉及一种能够提高检测鲁棒性，能够解决二维检测过程中出现的遮挡和阴影问题的基于三维模型的道路目标检测方法。

背景技术

稳定可靠的车辆检测过程是交通分析的第一步。与此相关的车辆计数、车辆跟踪、车型分类、辅助驾驶、事故检测和道路行为判断都建立在准确的车辆检测基础上。交通检测过程中，传统检测器能够获取到的交通信息比较单一，通常需要结合多种传感器来辅助完成一项检测任务。而由于检测数据多源异质的特点，多种交通检测数据的集成与融合成为瓶颈。这使得监视范围广，能够获取多种交通参数的基于视觉的交通检测方法越来越受到青睐。

道路上的目标检测是从交通图像中定位出车辆、行人等物体的位置。对象检测对于物体跟踪和道路行为理解等更上层的处理任务至关重要。它是整个交通图像处理流程的基础。然而，在实际的交通场景检测中，存在许多挑战性的问题。比如，遮挡、阴影等。因此，需要设计鲁棒的算法来抑制这些因素的影响，以提高算法的适应性和准确性。

发明内容

本发明为了克服现有技术中存在的二维检测过程中会出现遮挡和阴影的问题、鲁棒性低的不足，提供了一种能够提高检测鲁棒性，能够解决二维检测过程中出现的遮挡和阴影问题的基于三维模型的道路目标检测方法。

为了实现上述目的，本发明采用了以下技术方案：

一种基于三维模型的道路目标检测方法，包括如下步骤：

(1-1)同步获取两张道路采样图像，计算两张道路采样图像的视差图像，获得视差图像的深度特征；

(1-2)根据视差图像的深度特征生成候选区域，并将候选区域的3维边界框的坐标点映射到二维图像；

(1-3)利用多尺度池化网络层的卷积神经网络提取二维图像的外形特征，利用3维模型获得道路目标。

本发明通过双目立体视觉算法获得视差图像，获得视差图像的深度特征，根据深度特征获得候选区域，利用多尺度池化网络层的卷积神经网络提取二维图像的外形特征，利用3维模型获得道路目标。

作为优选，步骤(1-1)的具体步骤如下：

(2-1)同步获取两张道路采样图像，以左侧相机光心为坐标原点建立坐标系，获得视觉图像点p与双目视觉测量***的关系：

其中，A₁，A₂分别表示左侧相机内参和右侧相机内参，

R为旋转矩阵，

T为平移矩阵，

(u₁，v₁)，(u₂，v₂)分别表示左侧相机和右侧相机所拍摄的二维图像像素点坐标，

表示视觉图像点p的坐标；

(2-2)根据视觉图像点p与双目视觉测量***的关系计算视觉图像点p的坐标，获得两张道路采样图像的视差图像，获得深度值

(2-3)根据二维图像的结构特征和视差图像的深度特征建立混合模型loss函数，loss函数定义为：

L_multi-task＝λ₁L_struct+λ₂L_depth

其中，结构层的评估分类代价，L_struct由图像分类U对应的概率p_U决定：L_struct＝-logp_U，图像分类包括小汽车，行人，自行车等；深度特征从视差图像中获取，忽略了车辆的外形特征，只关注每种车型在深度方向的梯度变化，L_depth由梯度分类G(x，y)对应的概率p_G决定：L_depth＝-logp_G；λ₁，λ₂为平衡系数；

(2-4)利用一阶微分求公式L_multi-task＝λ₁L_struct+λ₂L_depth的导数获得视差图像深度方向的梯度值，获得视差图像得深度特征。

作为优选，根据视觉图像点p与双目视觉测量***的关系计算视觉图像点p的坐标的具体方法如下：

(3-1)根据公式

和

计算

和

同时使

和

(3-2)根据公式

计算得到

点p的坐标为

作为优选，G(x，y)的计算方法如下：

其中：，G_x(x，y)和G_y(x，y)分别为图像在像素点(x，y)处的水平梯度和垂直梯度，G_x(x，y)＝I(x+1，y)-I(x-1，y)，G_y(x，y)＝I(x，y+1)-I(x，y-1)；I(x，y)为图像在像素点(x，y)处的视差图像的深度值。

作为优选，步骤(1-2)的具体步骤如下：

(5-1)设定轮廓内像素点数量的最小值为W；

(5-2)根据视差图像的深度特征提取视差图像中目标区域的轮廓，如果轮廓内的像素点数量少于W，转入(5-3)；如果轮廓内的像素点数量大于等于W，转入(5-4)；

(5-3)利用深度值

对物体进行不同尺度的分割，转入(5-2)；

(5-4)如果轮廓内相邻像素点间的深度值差异小于设定值，检测视差图像的轮廓；

(5-5)根据检测到的视差图像的轮廓生成初始候选区域；

(5-6)对初始候选区域进行二阶微分的图像增强滤波，然后通过拉普拉斯算子突出渐变区域边缘的局部细节，生成最终的候选区域，并将候选区域的3维边界框的坐标点映射到二维图像。

作为优选，分割的尺度利用如下公式计算：

其中，a为规模系数。

作为优选，步骤(1-3)的具体步骤如下：

(7-1)对二维图像进行卷积和降采样处理，将处理后的图像输入到多尺度池化层；

(7-2)对不同大小的二维图像的候选区域提取一个固定维度的外形特征；

(7-3)通过正常的softmax层进行类型识别，将获得的不同类型利用三维模型获得道路目标。

因此，本发明具有如下有益效果：本发明的算法解决了二维检测过程中出现的遮挡和阴影等问题，提高了鲁棒性，降低了成本。

附图说明

图1是本发明的一种流程图。

具体实施方式

下面结合附图与具体实施方式对本发明做进一步描述：

如图1所示的实施例是一种基于三维模型的道路目标检测方法，包括如下步骤：

步骤100，同步获取两张道路采样图像，计算两张道路采样图像的视差图像，获得视差图像的深度特征

步骤101，同步获取两张道路采样图像，以左侧相机光心为坐标原点建立坐标系，获得视觉图像点p与双目视觉测量***的关系：

其中，A₁，A₂分别表示左侧相机内参和右侧相机内参，

R为旋转矩阵，

T为平移矩阵，

表示视觉图像点p的坐标；

步骤102，根据公式

和

计算

和

同时使

和

步骤103，根据公式

计算得到

获得深度值

获得点p坐标，点p的坐标为

点p的所有坐标组成两张道路采样图像的视差图像；

步骤104，根据二维图像的结构特征和视差图像的深度特征建立混合模型loss函数，loss函数定义为：

L_multi-task＝λ₁L_struct+λ₂L_depth

其中，结构层的评估分类代价，L_struct由图像分类U对应的概率p_U决定：L_struct＝-logp_U，图像分类包括小汽车，行人，自行车等；深度特征从视差图像中获取，忽略了车辆的外形特征，只关注每种车型在深度方向的梯度变化，L_depth由梯度分类G(x，y)对应的概率p_G决定：L_depth＝-logp_G；λ₁，λ₂为平衡系数；G(x，y)的计算方法如下：

其中：，G_x(x，y)和G_y(x，y)分别为图像在像素点(x，y)处的水平梯度和垂直梯度，G_x(x，y)＝I(x+1，y)-I(x-1，y)，G_y(x，y)＝I(x，y+1)-I(x，y-1)；I(x，y)为图像在像素点(x，y)处的视差图像的深度值；

步骤105，利用一阶微分求公式L_multi-task＝λ₁L_struct+λ₂L_dspth的导数获得视差图像深度方向的梯度值，获得视差图像得深度特征；

步骤200，根据视差图像的深度特征生成候选区域，并将候选区域的3维边界框的坐标点映射到二维图像

步骤201，设定轮廓内像素点数量的最小值为W；

步骤202，根据视差图像的深度特征提取视差图像中目标区域的轮廓，如果轮廓内的像素点数量少于W，转入步骤203；如果轮廓内的像素点数量大于等于W，转入步骤204；

步骤203，利用深度值

对物体进行不同尺度的分割，分割的尺度利用公式

计算，转入步骤202，其中，a为规模系数；

步骤204，如果轮廓内相邻像素点间的深度值差异小于设定值，检测视差图像的轮廓；

步骤205，根据检测到的视差图像的轮廓生成初始候选区域；

步骤206，对初始候选区域进行二阶微分的图像增强滤波，然后通过拉普拉斯算子突出渐变区域边缘的局部细节，生成最终的候选区域，并将候选区域的3维边界框的坐标点映射到二维图像。

步骤300，利用多尺度池化网络层的卷积神经网络提取二维图像的外形特征，利用3维模型获得道路目标

步骤301，对二维图像进行卷积和降采样处理，将处理后的图像输入到多尺度池化层；

步骤302，对不同大小的二维图像的候选区域提取一个固定维度的外形特征；

步骤303，通过正常的softmax层进行类型识别，将获得的不同类型利用三维模型获得道路目标。

应理解，本实施例仅用于说明本发明而不用于限制本发明的范围。此外应理解，在阅读了本发明讲授的内容之后，本领域技术人员可以对本发明作各种改动或修改，这些等价形式同样落于本申请所附权利要求书所限定的范围。

Claims

1.一种基于三维模型的道路目标检测方法，其特征在于，包括如下步骤：

步骤(1-2)的具体步骤如下：

(1-2-1)设定轮廓内像素点数量的最小值为W；

(1-2-2)根据视差图像的深度特征提取视差图像中目标区域的轮廓，如果轮廓内的像素点数量少于W，转入(1-2-3)；如果轮廓内的像素点数量大于等于W，转入(1-2-4)；

(1-2-3)利用深度值

对物体进行不同尺度的分割，转入(1-2-2)；

(1-2-4)如果轮廓内相邻像素点间的深度值差异小于设定值，检测视差图像的轮廓；

(1-2-5)根据检测到的视差图像的轮廓生成初始候选区域；

(1-2-6)对初始候选区域进行二阶微分的图像增强滤波，然后通过拉普拉斯算子突出渐变区域边缘的局部细节，生成最终的候选区域，并将候选区域的3维边界框的坐标点映射到二维图像；

(1-3)利用多尺度池化网络层的卷积神经网络提取二维图像的外形特征，利用3维模型获得道路目标；

步骤(1-3)的具体步骤如下：

(1-3-1)对二维图像进行卷积和降采样处理，将处理后的图像输入到多尺度池化层；

(1-3-2)对不同大小的二维图像的候选区域提取一个固定维度的外形特征；

(1-3-3)通过正常的softmax层进行类型识别，将获得的不同类型利用三维模型获得道路目标。

2.根据权利要求1所述的基于三维模型的道路目标检测方法，其特征在于，步骤(1-1)的具体步骤如下：

其中，A₁,A₂分别表示左侧相机内参和右侧相机内参，

R为旋转矩阵，

T为平移矩阵，

(u₁,v₁),(u₂,v₂)分别表示左侧相机和右侧相机所拍摄的二维图像像素点坐标，

表示视觉图像点p的坐标；

L_multi-task＝λ₁L_struct+λ₂L_depth

其中，结构层的评估分类代价，L_struct由图像分类U对应的概率p_U决定：L_struct＝-logp_U，图像分类包括小汽车，行人，自行车；深度特征从视差图像中获取，忽略了车辆的外形特征，只关注每种车型在深度方向的梯度变化，L_depth由梯度分类G(x,y)对应的概率p_G决定：L_depth＝-logp_G；λ₁，λ₂为平衡系数；

3.根据权利要求2所述的基于三维模型的道路目标检测方法，其特征在于，根据视觉图像点p与双目视觉测量***的关系计算视觉图像点p的坐标的具体方法如下：

(3-1)根据公式