CN117078982B

CN117078982B - 基于深度学习的大倾角立体像对准密集特征匹配方法

Info

Publication number: CN117078982B
Application number: CN202311329966.5A
Authority: CN
Inventors: 姚国标; 张进; 王臣; 梁庆坤; 王子恒; 张成成; 王福尧; 黄鹏飞
Original assignee: Shandong Jianzhu University
Current assignee: Shandong Jianzhu University
Priority date: 2023-10-16
Filing date: 2023-10-16
Publication date: 2024-01-26
Anticipated expiration: 2043-10-16
Also published as: CN117078982A

Abstract

本发明面向三维立体匹配场景的影像测量匹配领域，提出一种基于深度学***面场景的语义信息，再根据多平面分割的掩码结果，进行自适应优化，实现抠图分割；最后利用高精度匹配算法进行局部各平面匹配。本方案提高了匹配的精度和鲁棒性，为目标识别、特征匹配、影像配准及三维重建等领域的发展提供有利的支撑。

Description

基于深度学习的大倾角立体像对准密集特征匹配方法

技术领域

本发明涉及影像测量匹配领域，具体涉及基于深度学习的大倾角立体像对准密集特征匹配方法。

背景技术

影像匹配是指将两幅或多幅图像中的相同场景的特征点对应起来的过程,是数字摄影测量与计算机视觉中的典型技术之一。影像匹配技术具有广泛的应用场景，在三维重建、遥感影像分析、智能交通、机器人导航等领域发挥着重要作用。传统影像匹配方法主要依赖于手工设计的特征和经验，对于不同的场景需要进行不同的调整和优化，而基于深度学习的影像匹配方法可以通过大量的数据自动学习到特征和模式，具有更强的适应性。然而在面向具有复杂几何和辐射畸变的倾斜立体三维影像时，无论经典不变特征匹配算法还是新型深度学习匹配网络，均难以得到较为可靠的匹配结果。

传统的语义分割方法通常采用手工设计特征或简单的卷积神经网络等浅层模型，无法很好地识别复杂的场景和细节，导致分割结果的精度不高。同时需要大量标注好的数据用于模型训练，而这需要耗费大量的时间和人力物力成本，影响立体场景平面分割的质量。尚未有方法将语义分割用在复杂场景的多平面分割与匹配上。

由于多平面语义分割任务的特殊性，即每个像素点都需要被分类，因此在训练和预测过程中可能会出现斑点噪声的问题，即未能很好地划分边界并分割出具体的区域，影响匹配结果。消除这些噪声往往需要人工手动消除，费时费力，这也在一定程度上限制了该方法的推广应用。

虽然深度学习在影像匹配领域已经有了不错的应用，但却存在与传统算法相同的问题，面向具有复杂畸变、大视差和弱纹理的影像区域时匹配性能不佳，均难以检测和匹配到高精度的同名特征点。因此在一定程度上限制了后续工程的应用。

发明内容

本发明目的是提供一种基于深度学习的大倾角立体像对准密集特征匹配方法，能够在面向具有复杂几何和辐射畸变的倾斜立体三维影像时提高匹配的精度和鲁棒性。

本发明为实现上述目的，通过以下技术方案实现：

基于深度学习的大倾角立体像对准密集特征匹配方法，包括步骤：

步骤1、建立与训练深度学习语义分割模型，对图像不同对象进行分割，得到分割掩码预测结果；

步骤2、根据多平面分割的掩码结果，进行自适应优化，使用优化后的掩码图与原图像进行按位与运算，得到只含前景区域的图像，实现抠图分割；

步骤3、使用SIFT算法确定待匹配的同名平面，采用深度学习局部特征增强模块高精度匹配。

优选的，步骤3中还包括，用SIFT算法得到的SIFT匹配的特征点后，通过投影变形纠正得到改正后的同名平面。

优选的，步骤1所述深度学习语义分割模型的建立与训练过程包括：

主干特征提取，获取五个初步有效的特征层；

对所述五个特征层进行上采样和特征融合，获得最终的融合了所有特征的有效特征层；

利用最终的有效特征层对每一个特征点进行分类预测。

优选的，主干特征提取的编码器采用VGG16网络，解码器采用Unet，通过不断的上采样和卷积堆叠输出各个平面的预测掩码图。

优选的，步骤2所述自适应优化的方法为：

去除白色小面积区域，采用8邻域搜索方式遍历图中所有像素点，搜索与当前像素点连接的像素点，按照下式计算搜索完毕后连通区域的面积：

（1）

式中，代表最终连通区域大小，/>表示迭代次数，/>表示第i次生长所扩展得到的区域面积，根据设定阈值/>像素将小于/>像素的连通区域/>颜色反转，得到去除小面积区域后的结果；

接着，在得到上述结果后，采用4邻域搜索方式搜索与当前像素点相连的像素点，并根据公式（1）再次计算出搜索完毕后连通区域的面积，根据设定阈值像素将小于/>像素的连通区域/>颜色反转，得到填充黑色孔洞后的结果。

优选的，抠图分割的步骤为：通过将原图像素点与掩码图像素点一一对应，对于掩码图中白色像素对应的原图像素，将它们取出并拷贝至新的图像中，形成目标平面的分割结果。

优选的，投影变形纠正包括步骤：

根据SIFT匹配的特征点计算投影变换矩阵：

式中，和/>分别代表配对的左、右影像/>、/>中的特征匹配点，为/>中的9个投影变换系数，再依照下式对右影像进行投影变形纠正：

式中，和/>分别为右影像的投影变形改正前/>和改正后/>的像素坐标。

优选的，深度学习局部特征增强模块高精度匹配的步骤包括：

特征提取，将纠正过的同名平面输入卷积神经网络进行特征提取，输出分别为原影像分辨率基础上的1/8的粗级特征图和1/2细级特征图；

生成粗级特征预测结果，将粗提取特征图、/>分别展平为一维向量，并在每个向量中添加位置编码，将含有位置编码的向量输入到由4个自注意层与交叉注意层构成深度学习局部特征增强模块进行多次迭代，得到特征/>、/>；

生成最终匹配预测结果，在细级特征图上找到粗等级特征图匹配预测的对应位置，从细提取特征图/>、/>中分别裁剪出大小为/>的局部对应窗口，所有的粗匹配将分别在细等级局部窗口内进行精化匹配，最终输出/>、/>的亚像素匹配预测/>；

坐标转换，将的坐标利用投影变换矩阵/>还原到原始影像中，得到当前同名平面的高精度弱纹理匹配结果；

坐标融合，将所有同名平面融合，即为最终的结合语义分割和局部特征增强的大倾角立体像对准密集特征匹配点。

本发明的优点在于：针对大倾角立体像对存在复杂畸变、显著遮挡、纹理匮乏等问题导致的同名特征匹配稀少问题，创新性的提出了一种基于影像语义分割和局部特征增强网络的准密集特征可靠匹配算法，通过利用局部平面的深度学***面的几何纠正、局部平面的弱纹理特征深度学习增强，使得本发明在正确匹配点数、匹配点正确率、匹配点空间分布质量等方面具有显著优势，能够较好的适用于大倾角复杂场景与弱纹理区域的匹配任务，为后续的三维重建、影像配准应用奠定了基础。具体的创新之处包含：

1）针对大倾角立体像对存在复杂畸变、显著遮挡、纹理匮乏下匹配困难等问题，首次将深度学***面分割下，提升了分割精度与效率，并首次与影像匹配的任务相结合，提升了正确匹配点数、匹配点正确率、匹配点空间分布质量。

2）提出了一种语义分割结果自适应优化方法，该方法采用邻域搜索的方式对分割结果进行自适应优化，具有自动消除斑点噪声、提高分割精度、可迁移性和可解释性等方面的优势。它可以降低人力物力成本，同时可以提高分割结果的准确性和稳定性，能够有效推动多平面语义分割结果的后续应用。

针对影像在大视角、弱纹理、复杂畸变区域匹配性能不佳等问题，本发明在深度学***面在大视角、弱纹理、复杂畸变区域的适应性，进而极大提高了整体影像的匹配点数量、匹配精度与匹配空间分布质量。

附图说明

图1为本发明流程图；

图2为本发明VGG16-UNet深度学习网络结构流程图；

图3为本发明基于深度学习高精度匹配方法的流程图；

图4为本发明用于深度学习的数据标注示意图；

图5为本发明自适应优化流程图；

图6为本发明SIFT自动识别方法示意图；

图7为本发明深度学习的高精度匹配详细流程图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述。

本发明公开了一种基于深度学***面场景分割结果自适应优化与分割和同名平面筛选与高精度匹配三个流程，具体步骤如下。

首先，利用现有的航空影像与模拟三维场景数据进行多平面数据标注，获得足量的多模态同名影像块训练数据，为接下来深度神经网络（VGG16-Unet）的训练与学***面。这种数据选择和标注方式可以为后续算法的训练和场景理解提供有代表性的数据支持。部分标注数据如图4所示。

其次，使用VGG16网络对输入图像进行编码。深度学***面提取。将编码后的特征向量传入到Unet网络中进行解码操作，使用softmax激活函数将每个像素属于不同目标的概率进行计算，本发明使用的网络结构参数如图2所示。Unet网络是一种全卷积网络(FCN)，核心思想式通过上采样和跳跃式连接的方式将编码后的特征向量进行解码，采用上采样与特征融合完成各平面的分割，解码器通过不断的上采样及卷积堆叠，将最后的输出层尺寸恢复至512× 512像素大小，进而输出各个平面的预测掩码图。

由第一步得到预测掩码图后，进行第二步分割掩码图自适应优化，以此来消除部分掩码图中存在的洞孔以及小部分预测错误的小区域。该方法通过区域生长的方式，先去除小面积区域（白色），再填补孔洞（黑色）以实现自适应优化。在得到局部预测结果的掩码图后，首先需要去除小区域。然后，遍历图中所有像素点，采用8邻域搜索方式（即搜索当前像素周围的8个像素）如图5所示，搜索与当前像素点连接的像素点，并按照下式计算出搜索完毕后连通区域的面积：

（1）

式中，代表最终连通区域大小，/>表示迭代次数，/>表示第i次生长所扩展得到的区域面积，根据设定阈值/>像素将小于/>像素的连通区域/>颜色反转，得到去除小面积区域后的结果。本实施例中阈值/>。

在得到上述结果后，采用4邻域搜索方式搜索与当前像素点相连的像素点，并根据公式（1）再次计算出搜索完毕后连通区域的面积，根据设定阈值像素将小于/>像素的连通区域/>颜色反转，得到填充黑色孔洞后的结果。本实施例中/>。

通过将原图像素点与掩码图像素点一一对应，对于掩码图中白色像素对应的原图像素，将它们取出并拷贝至新的图像中，形成目标平面的分割结果，这一方法可以有效地提高图像分割质量。其技术流程图如图5所示。

基于深度学***面筛选、同名平面纠正、基于深度学习局部特征高精度匹配三部分。

在进行高精度匹配前，需要先对左右影像进行配对筛选，并找到对应区域，以确保匹配的有效性。为了从大规模无序的多平面分割结果中准确和高效地筛选出同名平面，本实施例采用SIFT算法来自动筛选对应区域，首先将每一个左右局部进行匹配。当左右局部匹配成功时，就完成了一对对应区域的筛选。然后对余下区域进行筛选，直到所有区域都被匹配完毕，这样就完成了一对影像的局部配对，自动筛过程如图6所示。

为了消除大视角下影像畸变对影像匹配的影响，用上一步得到的SIFT匹配的特征点计算两幅图像之间的转换矩阵，然后用变换矩阵将右影像纠正到同一姿态，继而得到纠正后的同名平面。根据下式计算出投影变换矩阵：

式中，和/>分别为右影像的投影变形改正前/>和改正后/>的像素坐标。右影像经投影变形改正后，对应区域的仿射畸变得到较大程度的改善。

经过同名平面几何纠正后，匹配算法对影像的仿射畸变具有良好的适应性，在此基础上引入深度学***面纠正与高精度匹配流程图如图7所示：

Step1、特征提取，将纠正过的同名平面输入VGG卷积神经网络进行特征提取，最终输出分别为原影像分辨率基础上的1/8的粗级特征图和1/2细级特征图；

Step2、生成粗级特征预测结果，将粗提取特征图、/>分别展平为一维向量，并在每个向量中添加位置编码，将含有位置编码的向量输入到由4个自注意层与交叉注意层构成深度学习局部特征增强模块进行多次迭代，经过多迭代后的特征图向量会被转换为有较高区分度且易于匹配的特征/>、/>；

Step3、生成最终匹配预测结果，在细级特征图上找到粗等级特征图匹配预测的对应位置，从细提取特征图/>、/>中分别裁剪出大小为/>（/>）的局部对应窗口，同理所有的粗匹配将分别在细等级局部窗口内进行精化匹配，最终输出/>、/>的亚像素匹配预测/>；

Step4、坐标转换，将的坐标利用投影变换矩阵/>还原到原始影像中，得到当前同名平面的高精度弱纹理匹配结果；

Step5、坐标融合，将所有同名平面融合，即为最终的结合语义分割和局部特征增强的大倾角立体像对准密集特征匹配点。

最后应说明的是：以上所述仅为本发明的优选实施例而已，并不用于限制本发明，凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.基于深度学习的大倾角立体像对准密集特征匹配方法，其特征在于，包括步骤：

所述自适应优化的方法为：

式中，R代表最终连通区域大小，n表示迭代次数，S_i表示第i次生长所扩展得到的区域面积，根据设定阈值r像素将小于r像素的连通区域R颜色反转，得到去除小面积区域后的结果；

接着，在得到上述结果后，采用4邻域搜索方式搜索与当前像素点相连的像素点，并根据公式(1)再次计算出搜索完毕后连通区域的面积，根据设定阈值r'像素将小于r'像素的连通区域R颜色反转，得到填充黑色孔洞后的结果；

步骤3、使用SIFT算法确定待匹配的同名平面，用SIFT算法得到的SIFT匹配的特征点后，通过投影变形纠正得到改正后的同名平面，采用深度学习局部特征增强模块高精度匹配；

所述投影变形纠正包括步骤：

根据SIFT匹配的特征点计算投影变换矩阵H：

式中，(x,y)和(x',y')分别代表配对的左、右影像I_A、I_B中的特征匹配点，h₁₁,h₁₂…h₃₃为H中的9个投影变换系数，再依照下式对右影像进行投影变形纠正：

式中，(x',y')和(x”,y”)分别为右影像的投影变形改正前I_B和改正后I_B'的像素坐标；

所述深度学习局部特征增强模块高精度匹配的步骤包括：

生成粗级特征预测结果，将粗提取特征图分别展平为一维向量，并在每个向量中添加位置编码，将含有位置编码的向量输入到由4个自注意层与交叉注意层构成深度学习局部特征增强模块进行多次迭代，得到特征/>

生成最终匹配预测结果，在细级特征图上找到粗等级特征图匹配预测的对应位置从细提取特征图/>中分别裁剪出大小为w×w的局部对应窗口，所有的粗匹配将分别在细等级局部窗口内进行精化匹配，最终输出I_A、I_B'的亚像素匹配预测M_f；

坐标转换，将I_B'的坐标利用投影变换矩阵H还原到原始影像中，得到当前同名平面的高精度弱纹理匹配结果；

2.根据权利要求1所述基于深度学习的大倾角立体像对准密集特征匹配方法，其特征在于，步骤1所述深度学习语义分割模型的建立与训练过程包括：

主干特征提取，获取五个初步有效的特征层；

利用最终的有效特征层对每一个特征点进行分类预测。

3.根据权利要求2所述基于深度学***面的预测掩码图。

4.根据权利要求1所述基于深度学***面的分割结果。