CN109344845B

CN109344845B - 一种基于Triplet深度神经网络结构的特征匹配方法

Info

Publication number: CN109344845B
Application number: CN201811112938.7A
Authority: CN
Inventors: 王滨; 王栋; 刘宏; 赵京东; 柳强
Original assignee: Harbin Institute of Technology
Current assignee: Harbin Institute of Technology
Priority date: 2018-09-21
Filing date: 2018-09-21
Publication date: 2020-06-09
Anticipated expiration: 2038-09-21
Also published as: CN109344845A

Abstract

一种基于Triplet深度神经网络结构的特征匹配方法，属于图像处理技术领域。本发明的目的在于解决现有技术的SIFT及基于深度学习的TFeat、HardNet等特征描述方法存在匹配性能较差的问题。本发明设计了一个对训练样本均值和方差做约束的新型损失函数，结合Triplet深度神经网络，可得到性能优异的特征描述，用高斯分布描述匹配特征对和不匹配特征对的距离分布，根据减小特征匹配误差等价于减小两个匹配特征对距离分布重叠面积这一原则，得出对训练样本均值和方差做约束的新型损失函数。实验结果表明，与现有特征描述方法相比，本发明在匹配性能上得到了提升。

Description

一种基于Triplet深度神经网络结构的特征匹配方法

技术领域

本发明属于图像处理技术领域，涉及一种基于深度学习的图像特征匹配方法。

背景技术

在计算机视觉应用中，计算良好的特征描述是图像匹配、目标定位、三维重建等的一个重要的组成部分，对最终算法的准确性起了非常关键的作用。在过去的十几年里，计算特征描述一直是图像处理领域的研究热点。一般来说，计算特征描述可以分为人工设计和基于学习的方法。利用人工设计的方法进行特征提取时，很难做到综合考虑各种因素从而得到有效的描述；在复杂情况下很难达到良好的性能，而且调节需要大量的时间。采用基于学习的方法来计算特征描述，可以自动学习良好的特征，免去人工设计过程。传统的SIFT及基于深度学习的TFeat、HardNet等特征描述方法在匹配性能上较差，影响图像匹配的应用价值。

发明内容

本发明要解决的技术问题是：本发明的目的在于解决现有技术的SIFT及基于深度学习的TFeat、HardNet等特征描述方法存在匹配性能较差的问题，提出一种基于Triplet深度神经网络结构的特征匹配方法。

本发明为解决上述技术问题采取的技术方案是：

一种基于Triplet深度神经网络结构的特征匹配方法，所述方法包括如下步骤：

步骤一：训练基于Triplet结构的深度神经网络

Triplet结构的深度神经网络输入为三元组，该三元组由三个样本构成：一个是从训练数据集中随机选一个样本，该样本称为参考样本，然后再随机选取一个和参考样本属于同一类的样本和不同类的样本，这两个样本分别称为同类样本和异类样本；三个样本构成一个三元组，通过损失函数来训练整个网络；

基于Triplet结构的深度神经网络训练过程如下：

从训练数据库中生成三元组，其中

表示参考样本，

表示同类样本，

表示异类样本，λ表示训练间隔；

训练一个深度神经网络，由网络输出得到每组样本相应的特征表达，分别记为：

和

让

和

特征表达之间的距离尽可能小，而

和

的特征表达之间的距离尽可能大，并且要让

与

之间的距离和

与

之间的距离之间有一个最小间隔λ；将上述内容表示成下列不等式形式：

该不等式定义了同类样本和异类样本之间的距离关系，即：所有同类样本之间的距离加上最小间隔λ，要小于异类样本之间的距离；当距离关系不满足上述不等式时，可通过求解下列损失函数：

+表示[]内的值大于零的时候，取该值为误差，小于零的时候，误差为零；

根据对正负匹配对距离分布的分析，对正负匹配对的均值和方差做约束以减小重叠区域面积，其中均值采用如下约束：

其中m是两分布均值之间的最小距离的间隔因子，μ_neg表示负匹配对的距离均值，μ_pos表示正匹配对的距离均值；

对分布的方差做如下约束：

L_var＝σ_pos+σ_neg (4)

其中σ_pos表示正匹配对的方差，σ_neg表示负匹配对的方差；

将三元组误差函数、均值约束、方差约束结合起来得到最终损失函数：

L_loss＝L_tri+L_mean+L_var (5)

利用损失函数L_loss分别对

和

求偏导，可分别计算出L_loss在

和

方向的梯度，并根据反向传播算法调节深度神经网络的参数直至网络收敛到稳定状态为止；

步骤二：图像的特征点检测

对目标图像和待匹配图像分别进行特征点检测，

利用FAST(Features from Accelerated Segment Test)算法做图像特征点检测：先通过图像上各像素点与其对应圆周上像素的差值是否满足设定阈值来快速筛选出可能的兴趣点，然后，使用ID3(Iterative Dichotomiser 3)算法训练一个决策树，将特征点圆周上的16个像素输入决策树中，进一步筛选出最优的特征点；

使用非极大值抑制(NMS)算法去除局部密集特征点以减小局部特征点聚集；计算每一个特征点的响应大小，对临近特征点比较，保留响应值大的特征点，删除其余特征点；分别得到目标图像、待匹配图像的特征点；

步骤三：用训练好的神经网络计算目标图像、待匹配图像上各特征点的特征描述子，

以每个特征点为中心提取一个分辨率为32*32大小的正方形图像块，将其输入到训练好的深度神经网络中，得到输出为128维的特征描述子；

步骤四：使用高维数据的近似最近邻(FLANN)算法进行快速匹配

利用FLANN算法计算目标图像上每个特征点与待匹配图像上所有特征点的128维特征描述子的欧式距离以实现快速匹配，欧式距离越小，则相似度越高，当欧式距离小于等于设定的阈值时，判定为匹配成功；

FLANN算法是一种利用k-d树实现快速最近邻搜索算法，适用于高维特征的快速匹配。该发明的特征点匹配是利用FLANN算法，通过计算两组特征点的128维特征描述子的欧式距离实现的。欧式距离越小，则相似度越高，当欧式距离小于设定的阈值时，可以判定为匹配成功；

步骤五：计算仿射变换矩阵，完成特征匹配

由于特征匹配的结果中往往包含一些错误的匹配对，在特征匹配的基础上，利用随机抽样一致性(RANSAC)算法计算两幅图像的仿射变换矩阵。

在步骤四中，特征点匹配是利用FLANN算法，通过计算两组特征点的128维特征描述子的欧式距离实现，具体过程为：

(1)计算待匹配的特征点各维度的方差，选取方差最大一维将特征集合划分成两部分，再在各子集重复相同的过程，以此方式建立k-d树保存特征；

(2)做特征匹配时，进行基于k-d树的特征搜索，通过二叉查找和回溯操作找到最近邻匹配。

步骤五的具体实现过程为：

(1)从目标图像、待匹配图像的所有特征匹配结果中每次随机选出3组不共线点对，计算仿射变换矩阵，并测试其他所有匹配结果在此仿射变换矩阵下的误差，并统计小于设定误差阈值的匹配数目；

(2)重复第(1)步n次，并从最终结果中选择匹配数目最多的一组参数作为最终的仿射变换矩阵。

本发明的有益效果是：

本发明方法用高斯分布近似匹配特征对(正匹配对)与不匹配特征对(负匹配对)的距离分布，通过分析，得到两个匹配特征对重叠区域面积与两个分布统计信息的关系。由于两个匹配特征对距离分布中的重叠区域是容易产生误判的部分，即在这一区间的距离无法准确判定成匹配或者不匹配，因此减小这一混淆区域有利于提高特征度量时的准确性。为减小两个匹配特征对距离分布的重叠区域，本发明提出了一个新的损失函数，结合Triplet深度神经网络，可得到性能优异的特征描述，提高图像的特征匹配准确度。

本发明所述的方法弥补了图像匹配中人工设计特征描述时难于考虑各种综合因素、需要大量时间的不足。通过提出的一个对训练样本均值和方差做约束的新型损失函数，结合Triplet深度神经网络，可以自动学习到性能优异的图像特征点的特征描述，可大大提高图像的匹配准确度，可完全应用于实际的图像匹配中。

本发明提出的基于Triplet深度神经网络结构的特征匹配方法，设计了一个对训练样本均值和方差做约束的新型损失函数，结合Triplet深度神经网络，可得到性能优异的特征描述。该方法用高斯分布描述匹配特征对和不匹配特征对的距离分布，根据减小特征匹配误差等价于减小两个匹配特征对距离分布重叠面积这一原则，得出对训练样本均值和方差做约束的新型损失函数。实验结果表明，与传统SIFT及基于深度学习的TFeat、HardNet等特征描述方法相比，所提出的基于Triplet深度神经网络结构的特征描述方法，在匹配性能上得到了提升，在实际的图像匹配上具有一定的应用价值。

经测试，本发明训练的基于Triplet结构的深度神经网络的性能优于现有方法(参见表1)。用FPR95指标来评价网络性能。训练好网络后，输入从测式数据集中产生的匹配对，计算各匹配对的特征并计算匹配对的距离，基于所有匹配对的距离利用FPR95指标来评价网络性能；即对计算出来的所有距离从小到大排序，设定一距离阈值μ，在μ从最小移动到最大过程中，将小于阈值的匹配对都看作是正匹配，超过阈值的则认为是负匹配对，这样正匹配对的召回率将从0逐步增加到1。在召回率达到0.95时，低于阈值μ的匹配对中包含负匹配对的比例就是FPR95值。显然，该值越小表示误分类的样本越少，网络对距离的计算越准确。

附图说明

图1是本发明的图像匹配的流程图；

图2是本发明的Triplet深度神经网络结构；

图3是本发明的特征匹配的对比图，图中(a)为SIFT算法匹配，(b)为Triplet方法匹配。

具体实施方式

下面结合本发明的附图，对本发明进行说明。

如图1至图3所示,一种基于Triplet深度神经网络结构的特征匹配方法，包括如下步骤：

步骤一，利用UBC图像块匹配数据库，生成大量三元组训练数据，结合本发明中所提出的目标损失函数L_loss训练Triplet结构的深度神经网络并进行测试，triplet深度神经网络结构如图2所示。所用的网络结构为：三个卷积层加一个全连接层，前两个卷积层之后做非线性变换并接最大池化层，最后一层全连接层之后将特征归一化到单位向量。

步骤二，分别在原图像与目标图像中利用FAST算法检测特征点，使用ID3算法训练一个决策树，将特征点圆周上的16个像素输入决策树中，进筛选出最优的特征点，并用NMS算法去除局部密集特征点。

步骤三，分别以原图像与目标图像上得到的特征点为中心，提取一个32*32大小的正方形图像块，将其输入到训练好的深度神经网络中，得到相应为128维的特征描述子。

步骤四，利用FLANN算法，通过计算两组特征点的128维特征描述子的欧式距离实现特征匹配。

步骤五，利用随机抽样一致性(RANSAC)算法计算两幅图像的仿射变换矩阵，计算出正确的特征匹配。

图3和表1分别给出本发明方法与其他方法的定性和定量比较结果。

如图3所示的特征匹配图对比图，本发明的Triplet方法实现的图像匹配正确性明显高于基于SIFT描述子的图像匹配。

如表1所示，与传统SIFT及基于深度学习的TFeat、HardNet等特征描述方法在UBC数据库中Notredame、Yosemite和Liberty公共数据集上做相比，本发明的Triplet方法，匹配准确度均有所提高。其中的数值表示在真正率达到95％时假正率的大小，该数值越小表示性能越好。

实验表明，本发明一种基于Triplet深度神经网络结构的特征匹配方法，通过提出的一个对训练样本均值和方差做约束的新型损失函数，结合Triplet深度神经网络，得到性能优异的特征描述，大大提高图像的匹配的准确度，在实际图像匹配中具有一定的应用价值。

表1

表1是本发明的特征匹配的性能对比。