CN110070574A

CN110070574A - 一种基于改进PSMNet的双目视觉立体匹配算法

Info

Publication number: CN110070574A
Application number: CN201910354039.6A
Authority: CN
Inventors: 秦岭; 黄庆; 雷波; 程遥; 张�杰
Original assignee: Youle Circle (wuhan) Technology Co Ltd
Current assignee: Maitewei Wuhan Technology Co ltd
Priority date: 2019-04-29
Filing date: 2019-04-29
Publication date: 2019-07-30
Anticipated expiration: 2039-04-29
Also published as: CN110070574B

Abstract

本发明公开了一种基于改进PSMNet的双目视觉立体匹配算法，包括如下步骤：采用降维的起始模块对左右图像进行特征提取，分别得到特征图，将得到的特征图输入SPP模块，SPP模块将特征图压缩之后进行上采样，并将不同级别的特征图合成最终SPP特征图，结合左右图中每个视差值，每个视差值对应的特征图与SPP特征图构成四维匹配代价卷，三维卷积模块聚合环境信息，并且通过上采样和视差回归得到最终的视差图，根据由归一化指数函数操作得到预测代价C_d来计算每一个视差的可能性，使用恒等映射进行优化，预测视差值由每一个视差值及其对应的可能性求和得到。

Description

一种基于改进PSMNet的双目视觉立体匹配算法

技术领域

本发明涉及视觉立体算法技术领域，尤其涉及一种基于改进PSMNet的双目视觉立体匹配算法。

背景技术

经过多年的发展，双目立体视觉已经在三维重建、工业测量、无人驾驶等领域发挥着重要的作用。立体匹配是双目视觉的研究核心内容，同时也是双目视觉的研究难点。到目前为止，传统双目视觉立体匹配算法主要分为以下三类：全局匹配、局部匹配和半全局匹配。全局匹配一般包括匹配代价计算、视差计算和视差优化，其核心在于构建全局能量函数以及最小化全局能量函数，从而得到最优视差图；全局匹配算法得到结果较好，但一般运行时间很长，不适合实时运行。

近几年，利用卷积神经网络进行立体匹配的方法越来越多。早期使用CNN通过相似性计算来解决匹配一致性的估计问题，CNNs计算一对图块的相似性进而判断它们是否匹配。尽管相比于传统的双目视觉立体匹配算法，基于CNN的立体匹配方法在速度上和精度上都有了一定提升，但是在不适定区域(例如遮挡区域、视差不连续区域、弱纹理区域、反光表面等)的表现依旧不理想。

发明内容

本发明提出了一种基于改进PSMNet的双目视觉立体匹配算法，以解决上述背景技术中提出的问题。

本发明提出了一种基于改进PSMNet的双目视觉立体匹配算法，包括如下步骤：

S1：采用降维的起始模块对左右图像进行特征提取，分别得到特征图；

S2：将得到的特征图输入SPP模块，SPP模块将特征图压缩之后进行上采样，并将不同级别的特征图合成最终SPP特征图，SPP特征图的生成过程为：

A、选择一个特征信息作为基础，提取特征信息上的特征连接值；

B、查找特征信息，根据基础特征信息上的特征连接值在采集的特征信息中寻找可与特征连接值相匹配的特征信息进行连接，生成更大的基础特征信息；

C、在新生成的基础特征信息上再次提取新的特征连接值，在采集的特征信息中寻找可与新的特征连接值相匹配的特征信息进行连接，依次寻找进行匹配；

D、最后，形成最终SPP特征图；

S3：结合左右图中每个视差值，每个视差值对应的特征图与SPP特征图构成四维匹配代价卷；

S4：三维卷积模块聚合环境信息，并且通过上采样和视差回归得到最终的视差图，根据由归一化指数函数操作得到预测代价C_d来计算每一个视差的可能性，使用恒等映射进行优化，预测视差值由每一个视差值及其对应的可能性求和得到。

优选的，所述S1中，起始模块对图像的采集为首先对图像进行扫描，获得数据图像，根据图像数据上特征数据的特点，对特征数据进行提取。

优选的，所述S2中，上采样过程中,采用基于原始低分辨率图像边缘的方法，首先检测低分辨率图像的边缘，然后根据检测的边缘将像素分类处理，采用传统方法插值低分辨率图像，然后检测高分辨率图像的边缘，最后对边缘及附近像素进行特殊处理，以去除模糊，增强图像的边缘。

优选的，所述S2中，SPP模块对特征图进行采样，SPP模块与各计算模块均相连，在SPP模块采集特征图后，各计算模块均可从SPP模块中提取特征图的特征信息。

优选的，所述S3中，视差值的特征图与SPP特征图匹配通过特征值上的特征数据进行匹配，SPP特征图上设置方向特征数据，方向特征之间相互匹配，形成多维度代价卷。

优选的，所述S4中，卷积模块采用1×1卷积模块，卷积模块可以对特征图厚度进行有效降维，这样可以在不增加网络参数的情况下，增加网络的宽度和增加网络对多个尺度的适应性，提高匹配精度。

优选的，所述S4中，归一化指数函数加快网络训练的收敛速度，同时，归一化使训练能够使用更高的学习率而无需太多初始化操作，结合其他网络优化操作，在对图像进行测试时，降低了测试时间。

优选的，所述S4中，求和公式为：

采用Focal loss函数训练，损失函数定义如下：

式中：

FL(x)＝-αx^γlog(1-x)，其中，d是ground-truth视差值，是预测视差值。

本发明提出的一种基于改进PSMNet的双目视觉立体匹配算法，有益效果在于：

1、通过降维的启示起始模块，能够更好进行特征提取。

2、通过对每个层增加相应的归一化层，可以使训练使用更大的学习率，加快网络训练收敛速度。

3、改进损失函数，保证匹配精度的同时提高匹配速度

具体实施方式

下面结合具体实施例来对本发明做进一步说明。

S1：采用降维的起始模块对左右图像进行特征提取，分别得到特征图，起始模块对图像的采集为首先对图像进行扫描，获得数据图像，根据图像数据上特征数据的特点，对特征数据进行提取；

S2：将得到的特征图输入SPP模块，SPP模块将特征图压缩之后进行上采样，上采样过程中,采用基于原始低分辨率图像边缘的方法，首先检测低分辨率图像的边缘，然后根据检测的边缘将像素分类处理，采用传统方法插值低分辨率图像，然后检测高分辨率图像的边缘，最后对边缘及附近像素进行特殊处理，以去除模糊，增强图像的边缘，并将不同级别的特征图合成最终SPP特征图，SPP模块对特征图进行采样，SPP模块与各计算模块均相连，在SPP模块采集特征图后，各计算模块均可从SPP模块中提取特征图的特征信息，SPP特征图的生成过程为：

D、最后，形成最终SPP特征图；

S3：结合左右图中每个视差值，每个视差值对应的特征图与SPP特征图构成四维匹配代价卷，视差值的特征图与SPP特征图匹配通过特征值上的特征数据进行匹配，SPP特征图上设置方向特征数据，方向特征之间相互匹配，形成多维度代价卷；

S4：三维卷积模块聚合环境信息，卷积模块采用1×1卷积模块，卷积模块可以对特征图厚度进行有效降维，这样可以在不增加网络参数的情况下，增加网络的宽度和增加网络对多个尺度的适应性，提高匹配精度，并且通过上采样和视差回归得到最终的视差图，根据由归一化指数函数操作得到预测代价C_d来计算每一个视差的可能性，归一化指数函数加快网络训练的收敛速度，同时，归一化使训练能够使用更高的学习率而无需太多初始化操作，结合其他网络优化操作，在对图像进行测试时，降低了测试时间，使用恒等映射进行优化，恒等映射能够很好的起到优化的效果，可以大大增加计算速度，预测视差值由每一个视差值及其对应的可能性求和得到，求和公式为：

采用Focal loss函数训练，损失函数定义如下：

式中：

以上所述，仅为本发明较佳的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，根据本发明的技术方案及其发明构思加以等同替换或改变，都应涵盖在本发明的保护范围之内。

Claims

1.一种基于改进PSMNet的双目视觉立体匹配算法，其特征在于，包括以下步骤：

D、最后，形成最终SPP特征图；

2.根据权利要求1所述的一种基于改进PSMNet的双目视觉立体匹配算法，其特征在于，所述S1中，起始模块对图像的采集为首先对图像进行扫描，获得数据图像，根据图像数据上特征数据的特点，对特征数据进行提取。

3.根据权利要求1所述的一种基于改进PSMNet的双目视觉立体匹配算法，其特征在于，所述S2中，上采样过程中,采用基于原始低分辨率图像边缘的方法，首先检测低分辨率图像的边缘，然后根据检测的边缘将像素分类处理，采用传统方法插值低分辨率图像，然后检测高分辨率图像的边缘，最后对边缘及附近像素进行特殊处理，以去除模糊，增强图像的边缘。

4.根据权利要求1所述的一种基于改进PSMNet的双目视觉立体匹配算法，其特征在于，所述S2中，SPP模块对特征图进行采样，SPP模块与各计算模块均相连，在SPP模块采集特征图后，各计算模块均可从SPP模块中提取特征图的特征信息。

5.根据权利要求1所述的一种基于改进PSMNet的双目视觉立体匹配算法，其特征在于，所述S3中，视差值的特征图与SPP特征图匹配通过特征值上的特征数据进行匹配，SPP特征图上设置方向特征数据，方向特征之间相互匹配，形成多维度代价卷。

6.根据权利要求1所述的一种基于改进PSMNet的双目视觉立体匹配算法，其特征在于，所述S4中，卷积模块采用1×1卷积模块，卷积模块可以对特征图厚度进行有效降维，这样可以在不增加网络参数的情况下，增加网络的宽度和增加网络对多个尺度的适应性，提高匹配精度。

7.根据权利要求1所述的一种基于改进PSMNet的双目视觉立体匹配算法，其特征在于，所述S4中，归一化指数函数加快网络训练的收敛速度，同时，归一化使训练能够使用更高的学习率而无需太多初始化操作，结合其他网络优化操作，在对图像进行测试时，降低了测试时间。

8.根据权利要求1所述的一种基于改进PSMNet的双目视觉立体匹配算法，其特征在于，所述S4中，求和公式为：

采用Focal loss函数训练，损失函数定义如下：

式中：