CN116824183B - 基于多重特征描述符的图像特征匹配方法和装置 - Google Patents

基于多重特征描述符的图像特征匹配方法和装置 Download PDF

Info

Publication number
CN116824183B
CN116824183B CN202310841374.5A CN202310841374A CN116824183B CN 116824183 B CN116824183 B CN 116824183B CN 202310841374 A CN202310841374 A CN 202310841374A CN 116824183 B CN116824183 B CN 116824183B
Authority
CN
China
Prior art keywords
descriptor
feature
value
threshold
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202310841374.5A
Other languages
English (en)
Other versions
CN116824183A (zh
Inventor
樊迎博
毛善君
汤璧屾
陈华州
宋春久
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Peking University
Beijing Longruan Technologies Inc
Original Assignee
Peking University
Beijing Longruan Technologies Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Peking University, Beijing Longruan Technologies Inc filed Critical Peking University
Priority to CN202310841374.5A priority Critical patent/CN116824183B/zh
Publication of CN116824183A publication Critical patent/CN116824183A/zh
Application granted granted Critical
Publication of CN116824183B publication Critical patent/CN116824183B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/74Image or video pattern matching; Proximity measures in feature spaces
    • G06V10/75Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
    • G06V10/758Involving statistics of pixels or of feature values, e.g. histogram matching
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/46Descriptors for shape, contour or point-related descriptors, e.g. scale invariant feature transform [SIFT] or bags of words [BoW]; Salient regional features
    • G06V10/462Salient features, e.g. scale invariant feature transforms [SIFT]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/50Extraction of image or video features by performing operations within image blocks; by using histograms, e.g. histogram of oriented gradients [HoG]; by summing image-intensity values; Projection analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/74Image or video pattern matching; Proximity measures in feature spaces
    • G06V10/761Proximity, similarity or dissimilarity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/11Technique with transformation invariance effect

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Multimedia (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Databases & Information Systems (AREA)
  • Computing Systems (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Image Analysis (AREA)

Abstract

本发明提出一种基于多重特征描述符的图像特征匹配方法和装置,涉及图像处理和图像特征匹配领域,在图像上检测到特征点,构建多重特征描述符,完成图像的精准匹配。本发明中的多重特征描述符使用符号、均值和中心值描述符的不同排列组合方法构建而成,考虑了特征点的方向信息、数值信息和全局信息。采用滑动窗口对特征点周围所截范围内像素矩阵进行扫描,在每个窗口内提取三种特征描述符后组合拼接,生成对应的矩阵数值分布直方图和特征描述符。根据不同图像的特征描述符进行特征点匹配,选取描述符距离最近的部分特征点作为最优点进行图像匹配,使得图像匹配效果更加精准。为矿山采掘环境、场景建模、工业生产中用到的图像匹配提供技术支持。

Description

基于多重特征描述符的图像特征匹配方法和装置
技术领域
本发明涉及图像处理和图像特征匹配领域,特别是一种基于多重特征描述符的图像特征匹配方法和图像特征匹配装置。
背景技术
特征描述符的构建和图像匹配是计算机视觉领域的关键技术,用于识别、匹配和跟踪图像中的特定特征。这些技术在许多领域都有广泛的应用,包括计算机图形学、机器人、自动驾驶、虚拟现实等。
但是由于摄像机在拍摄过程存在各类姿态变化、照明变化和噪声干扰,容易使得生成特征描述符的质量下降,导致匹配精度下降。同时在一些嵌入式设备或移动设备中,硬件资源有限,可能无法进行大规模特征提取和匹配。导致图像匹配的运算效率和应用场景受到极大限制。
目前针对上述特征描述符的构建和图像匹配存在的问题,现有技术中还没有充分考虑特征点方向信息、数值信息和全局信息的方法。部分方法采用图像统计特征点周围梯度直方图的方法生成特征描述符,这类方法容易错失图像的全局信息,导致部分梯度相同但数值差不同的特征点出现误匹配现象,从而导致这类算法在应用过程存在不稳定因素,容易造成较大的图像匹配误差。
还有部分方法采用直接对特征点周围部分区域进行暴力检索匹配的方法来解决特征描述符生成复杂的问题,但是这类方法对硬件条件要求较高,而且面对大规模特征提取和匹配时效果较差,无法满足城市或工业等大作业场景下的实际需求。
发明内容
鉴于上述问题,本发明提出了一种基于多重特征描述符的图像特征匹配方法和图像特征匹配装置。
本发明实施例提供了一种基于多重特征描述符的图像特征匹配方法,所述图像特征匹配的方法包括:
基于特征点检测算法检测每幅图像中的特征点;
根据所述特征点的分布和实际需求,设置第一阈值、第二阈值和第三阈值,其中所述第一阈值用于设定需截取的特征点周围像素矩阵的大小,所述第二阈值用于设定滑动窗口半径,所述第三阈值用于设定特征描述符的位宽;
利用所述第一阈值、所述第二阈值对所述特征点进行扫描并计算,得到符号描述符、均值描述符以及中心值描述符;
基于所述符号描述符、所述均值描述符以及所述中心值描述符,结合所述第三阈值,得到特征描述符;
对两幅或多幅图像的特征描述符进行特征点匹配,根据比较结果,选取匹配结果最优的特征点作为最终的图像匹配结果。
可选地,所述特征点检测算法仅用于每幅图像中的特征点的检测,所述特征点检测算法包括:FAST、SIFT、SURF和SuperPoint算法。
可选地,利用所述第一阈值、所述第二阈值对所述特征点进行扫描并计算,得到符号描述符、均值描述符和中心值描述符,包括:
利用滑动窗口,以所述滑动窗口半径对所述特征点周围截取的像素矩阵进行扫描并计算,得到所述描述符、所述均值描述符以及所述中心值描述符。
可选地,所述第一阈值为patch_size阈值;
所述第二阈值为radius阈值;
所述第三阈值为bit_width阈值。
可选地,所述第一阈值、所述第二阈值以及所述第三阈值各自的阈值大小,通过所述特征点的分布和实际需求进行计算或网络自训练得到。
可选地,基于所述符号描述符、所述均值描述符和所述中心值描述符,结合所述第三阈值,得到特征描述符,包括:
将所述符号描述符、所述均值描述符以及所述中心值描述符进行不同方式的拼接组合,直接生成所述第三阈值设定位宽的特征描述符;或者,
将所述符号描述符、所述均值描述符以及所述中心值描述符进行不同方式的拼接组合,生成对应的矩阵数值分布直方图,并根据所述矩阵数值分布直方图生成所述第三阈值设定位宽的特征描述符。
可选地,所述第三阈值设定位宽的特征描述符在不同的旋转、尺度、翻转和仿射变换下保持一致;所述符号描述符、所述均值描述符以及所述中心值描述符各自的计算方式包括:
计算每个滑动窗口内除中心点像素外每个周围点像素绝对值相较于所述中心点像素绝对值的大小,若所述周围点像素绝对值大于所述中心点像素绝对值则置1,小于则置0,并将结果依次排列,以此生成所述符号描述符;
计算每个滑动窗口内所有像素的平均值,并与所述特征点所在滑动窗口内的像素平均值进行比较,若所述所有像素的平均值大于所述特征点所在滑动窗口内的像素平均值则置1,小于则置0,并将结果依次排列,以此生成所述均值描述符;
计算每个滑动窗口中心点值相较于所截取的特征点周围像素矩阵平均值和全图像素矩阵平均值的大小,若所述每个滑动窗口中心点值大于所述特征点周围像素矩阵平均值和全图像素矩阵平均值则置1,小于则置0,并将结果依次排列,以此生成所述中心值描述符。
可选地,将所述符号描述符、所述均值描述符以及所述中心值描述符进行不同方式的拼接组合,包括:
按照所述中心值描述、所述符号描述符和所述均值描述符的先后顺序,进行顺序拼接生成所述特征描述符;或者,
将所述符号描述符与所述均值描述按位相加后,在高位加入所述中心值描述符,生成所述特征描述符。
可选地,对两幅或多幅图像的特征描述符进行特征点匹配,包括:
采用L1范数匹配或L2范数匹配方式,进行所述特征点匹配;或者,
采用计算第一幅图像的特征描述符与第二幅图像的特征描述符之间汉明距离的方式,进行所述特征点匹配;或者,
采用计算第一幅图像的特征描述符和第二幅图像的特征描述符各自从右到左相邻的两个位,若不全0记为一个1,并统计新1的位数的方式,进行所述特征点匹配。
本发明实施例提供了一种基于多重特征描述符的图像特征匹配装置,所述图像特征匹配装置包括:
检测模块410,用于基于特征点检测算法检测每幅图像中的特征点;
设置阈值模块420,用于根据所述特征点的分布和实际需求,设置第一阈值、第二阈值和第三阈值,其中所述第一阈值用于设定需截取的特征点周围像素矩阵的大小,所述第二阈值用于设定滑动窗口半径,所述第三阈值用于设定特征描述符的位宽;
扫描模块430,用于利用所述第一阈值、所述第二阈值对所述特征点进行扫描并计算,得到符号描述符、均值描述符以及中心值描述符;
特征描述符模块440,用于基于所述符号描述符、所述均值描述符以及所述中心值描述符,结合所述第三阈值,得到特征描述符;
匹配选取模块450,用于对两幅或多幅图像的特征描述符进行特征点匹配,根据比较结果,选取匹配结果最优的特征点作为最终的图像匹配结果。
可选地,所述扫描模块具体用于:
利用滑动窗口,以所述滑动窗口半径对所述特征点周围截取的像素矩阵进行扫描并计算,得到所述描述符、所述均值描述符以及所述中心值描述符。
可选地,所述设置阈值模块中所述第一阈值、所述第二阈值以及所述第三阈值各自的阈值大小,通过所述特征点的分布和实际需求进行计算或网络自训练得到;
其中,第一阈值为patch_size阈值;
所述第二阈值为radius阈值;
所述第三阈值为bit_width阈值。
可选地,所述特征描述符模块具体用于:
将所述符号描述符、所述均值描述符以及所述中心值描述符进行不同方式的拼接组合,直接生成所述第三阈值设定位宽的特征描述符;或者,
将所述符号描述符、所述均值描述符以及所述中心值描述符进行不同方式的拼接组合,生成对应的矩阵数值分布直方图,并根据所述矩阵数值分布直方图生成所述第三阈值设定位宽的特征描述符;
其中,将所述符号描述符、所述均值描述符以及所述中心值描述符进行不同方式的拼接组合,包括:
按照所述中心值描述、所述符号描述符和所述均值描述符的先后顺序,进行顺序拼接生成所述特征描述符;或者,
将所述符号描述符与所述均值描述按位相加后,在高位加入所述中心值描述符,生成所述特征描述符。
可选地,所述第三阈值设定位宽的特征描述符在不同的旋转、尺度、翻转和仿射变换下保持一致;所述扫描模块中所述符号描述符、所述均值描述符以及所述中心值描述符各自的计算方式包括:
计算每个滑动窗口内除中心点像素外每个周围点像素绝对值相较于所述中心点像素绝对值的大小,若所述周围点像素绝对值大于所述中心点像素绝对值则置1,小于则置0,并将结果依次排列,以此生成所述符号描述符;
计算每个滑动窗口内所有像素的平均值,并与所述特征点所在滑动窗口内的像素平均值进行比较,若所述所有像素的平均值大于所述特征点所在滑动窗口内的像素平均值则置1,小于则置0,并将结果依次排列,以此生成所述均值描述符;
计算每个滑动窗口中心点值相较于所截取的特征点周围像素矩阵平均值和全图像素矩阵平均值的大小,若所述每个滑动窗口中心点值大于所述特征点周围像素矩阵平均值和全图像素矩阵平均值则置1,小于则置0,并将结果依次排列,以此生成所述中心值描述符。
可选地,所述匹配选取模块具体用于:
采用L1范数匹配或L2范数匹配方式,进行所述特征点匹配;或者,
采用计算第一幅图像的特征描述符与第二幅图像的特征描述符之间汉明距离的方式,进行所述特征点匹配;或者,
采用计算第一幅图像的特征描述符和第二幅图像的特征描述符各自从右到左相邻的两个位,若不全0记为一个1,并统计新1的位数的方式,进行所述特征点匹配。
本发明提供的基于多重特征描述符的图像特征匹配方法,首先基于特征点检测算法检测每幅图像中的特征点;再根据特征点的分布和实际需求,分别设定需截取的特征点周围像素矩阵的大小、设定滑动窗口半径,设定特征描述符的位宽这三个阈值。
之后利用这前两个阈值对特征点进行扫描并计算,得到符号描述符、均值描述符以及中心值描述符;再基于符号描述符、均值描述符以及中心值描述符,结合第三阈值,得到特征描述符;最后对两幅或多幅图像的特征描述符进行特征点匹配,根据比较结果,选取匹配结果最优的特征点作为最终的图像匹配结果。
本发明中的多重特征描述符构建方法,使用符号描述符、均值描述符和中心值描述符的不同排列合成方法作为多重特征描述符,其充分考虑到了特征点的方向信息、数值信息和全局信息,可以使得基于此特征符的图像匹配更加精准有效。不会错失图像的全局信息,自然不会导致部分梯度相同但数值差不同的特征点出现误匹配现象,图像匹配更加精准。同时对硬件条件要求较低,面对大规模特征提取和匹配时效果较好,很好的满足了城市或工业等大作业场景下的实际需求,尤其为矿山采掘环境、场景建模、工业生产中用到的图像匹配提供了很好的技术支持。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1是本发明实施例一种基于多重特征描述符的图像特征匹配方法的流程图;
图2是本发明实施例中例举的多重特征描述符的构建方法示意图;
图3是本发明实施例中例举的多重特征描述符组合拼接方法示意图;
图4是本发明实施例一种基于多重特征描述符的图像特征匹配装置的框图。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。应当理解,此处所描述的具体实施例仅用以解释本发明,仅仅是本发明一部分实施例,而不是全部的实施例,并不用于限定本发明。
参照图1,示出了本发明实施例的基于多重特征描述符的图像特征匹配方法的流程图,该图像特征匹配方法包括:
步骤101:基于特征点检测算法检测每幅图像中的特征点。
首先基于特征点检测算法检测每幅图像中的特征点。若有多幅图像,自然每幅图像都需要检测得到特征点。下述步骤102~步骤104以任一幅图像检测得到特征点后需要执行的方法为例进行解释和说明。
在一种较优的实施例中,本发明所提特征点检测算法,其仅用于每幅图像中的特征点的检测,不再进行其它操作。该特征点检测算法包括:FAST、SIFT、SURF和SuperPoint等等算法。
步骤102:根据特征点的分布和实际需求,设置第一阈值、第二阈值和第三阈值,其中第一阈值用于设定需截取的特征点周围像素矩阵的大小,第二阈值用于设定滑动窗口半径,第三阈值用于设定特征描述符的位宽。
对于任一幅图像,得到其特征点后,再根据特征点的分布和实际需求,分别设置三个阈值,即设置:第一阈值、第二阈值和第三阈值,其中第一阈值用于设定需截取的特征点周围像素矩阵的大小,第二阈值用于设定滑动窗口半径,第三阈值用于设定特征描述符的位宽。通过设置这三个阈值,为后续将特征点的方向信息、数值信息和全局信息应用进特征描述符的构建和图像匹配打好基础。
在一种可能的实施例中,第一阈值、第二阈值和第三阈值各自的阈值大小,可以直接人为设定,也可以通过特征点的分布和实际需求进行计算或网络自训练得到。
在一种较优的实施例中,可以设定第一阈值为patch_size阈值;设定第二阈值为radius阈值;设定第三阈值为bit width阈值。
步骤103:利用第一阈值、第二阈值对特征点进行扫描并计算,得到符号描述符、均值描述符以及中心值描述符。
需截取的特征点周围像素矩阵的大小、滑动窗口半径、特征描述符的位宽均设定好之后,即可利用第一阈值、第二阈值,即:利用需截取的特征点周围像素矩阵的大小和滑动窗口半径,对特征点进行扫描并计算,以得到符号描述符、均值描述符以及中心值描述符。
一种较优的方式为:利用滑动窗口,以滑动窗口半径对特征点周围截取的像素矩阵进行扫描并计算,得到描述符、均值描述符以及中心值描述符。
以第一阈值为patch_size阈值、第二阈值为radius阈值、第三阈值为bit_width阈值为例,假设设置patch_size阈值为2,radius阈值为1,bit_width阈值为18。参照图2所示的多重特征描述符的构建方法示意图,根据参数patch_size阈值设置为2,即表示特征点周围5×5的区域被提取,在此区域内根据参数radius阈值设置,表示滑动窗口大小为3×3。
基于bit_width阈值设定位宽的特征描述符在不同的旋转、尺度、翻转和仿射变换下保持一致。在此基础上,符号描述符、均值描述符以及中心值描述符各自的计算方式包括:
计算每个滑动窗口内除中心点像素外每个周围点像素绝对值相较于中心点像素绝对值的大小,若周围点像素绝对值大于中心点像素绝对值则置1,小于则置0,并将结果依次排列,以此生成符号描述符。
计算每个滑动窗口内所有像素的平均值,并与特征点所在滑动窗口内的像素平均值进行比较,若所有像素的平均值大于特征点所在滑动窗口内的像素平均值则置1,小于则置0,并将结果依次排列,以此生成均值描述符。
计算每个滑动窗口中心点值相较于所截取的特征点周围像素矩阵平均值和全图像素矩阵平均值的大小,若每个滑动窗口中心点值大于特征点周围像素矩阵平均值和全图像素矩阵平均值则置1,小于则置0,并将结果依次排列,以此生成中心值描述符。
结合图2来说,在计算符号描述符时,如图2中最上一行所示,滑动窗口由左上至右下共9个窗口,计算每个滑动窗口内除中心点像素(例如最上行最左边图中八个阴影包围的白色小框)外每个周围点像素绝对值相较于中心点像素绝对值的大小,若周围点像素绝对值大于中心点像素绝对值则置1,小于则置0,则分别得到S1、S2、…、S8、S9,并将结果依次排列得到S,以此生成符号描述符,图2中最右边示例性的以9*xxxxxxxx表示。
在计算均值描述符时,如图2中中间一行所示,滑动窗口由左上至右下共9个窗口,计算每个滑动窗口内所有像素的平均值,与特征点所在的滑动窗口(图2中间一行最左边图中阴影)内的像素平均值进行比较,若所有像素的平均值大于特征点所在滑动窗口内的像素平均值则置1,小于则置0,分别得到M1、M2、…、M8、M9,并将结果依次排列得到M,以此生成均值描述符,图2中最右边示例性的以9*xxxxxxxx表示。
在计算中心值描述符时,如图2中最下一行所示,滑动窗口由左上至右下共9个窗口,计算每个滑动窗口中心点(例如最下行最左边图中阴影)值相较于所截取的特征点周围像素矩阵平均值和全图平均值的大小,若每个滑动窗口中心点值大于特征点周围像素矩阵平均值和全图像素矩阵平均值则置1,小于则置0,分别得到C1、C2、…、C8、C9,并将结果依次排列得到C,并将结果依次排列,以此生成中心值描述符,图2中最右边示例性的以9*xx表示。
通过上述方式即可得到符号描述符、均值描述符以及中心值描述符。
步骤104:基于符号描述符、均值描述符以及中心值描述符,结合第三阈值,得到特征描述符。
得到符号描述符、均值描述符以及中心值描述符之后,再基于符号描述符、均值描述符和中心值描述符,结合第三阈值,得到特征描述符,得到特征描述符。具体的:
可以将符号描述符、均值描述符以及中心值描述符进行不同方式的拼接组合,直接生成第三阈值设定位宽的特征描述符;或者,可以将符号描述符、均值描述符以及中心值描述符进行不同方式的拼接组合,生成对应的矩阵数值分布直方图,再根据矩阵数值分布直方图生成第三阈值设定位宽的特征描述符。
在一种可能的实施例中,将符号描述符、均值描述符以及中心值描述符进行不同方式的拼接组合的方法包括:
按照中心值描述、符号描述符和均值描述符的先后顺序,进行顺序拼接生成特征描述符;或者,将符号描述符与均值描述按位相加后,在高位加入中心值描述符,生成特征描述符。
参照图3所示的多重特征描述符组合拼接方法示意图,将三者按照中心值描述C、符号描述符S和均值描述符M进行顺序拼接,生成特征描述符为例,假设中心值描述C为10(2bit)、符号描述符S为10110100(8bit)、均值描述符M为01110011(8bit),则对应生成的多重特征描述符CSM为10101101000111011,共18bit。
当然,也可以根据实际需求的不同,调整各个描述符的先后顺序,或者,可将符号描述符与均值描述按位相加后,在高位加入中心值描述符生成特征描述符等。图3中还示例性的示出了按照中心值描述C、均值描述符M和符号描述符S进行顺序拼接,生成多重特征描述符CMS为100111001110110100;按照符号描述符S、中心值描述C、均值描述符M的顺序进行顺序拼接,生成多重特征描述符SCM为10110100100111011。
步骤105:对两幅或多幅图像的特征描述符进行特征点匹配,根据比较结果,选取匹配结果最优的特征点作为最终的图像匹配结果。
前述根据步骤102~步骤104得到每幅图像的特征描述符后,可以对两幅或多幅图像的特征描述符进行特征点匹配,再根据比较结果,选取匹配结果最优的特征点作为最终的图像匹配结果。
在一种可能的实施例中,对两幅或多幅图像的特征描述符进行特征点匹配的方法包括:
采用L1范数匹配或L2范数匹配方式,进行特征点匹配;或者,采用计算第一幅图像的特征描述符与第二幅图像的特征描述符之间汉明距离的方式,进行特征点匹配;或者,采用计算第一幅图像的特征描述符和第二幅图像的特征描述符各自从右到左相邻的两个位,若不全0记为一个1,并统计新1的位数的方式,进行特征点匹配。
在实际的匹配中,可根据不同实际需要选择匹配方式,其中计算两个特征描述符的汉明距离,也即计算所有元素中1的位数的总和。
对于匹配的比较结果,例如:将第1幅图像的每个特征描述符与第2幅图像的任意一个特征描述进行汉明距离比较,取二者汉明距离最小的一对特征描述符作为该点的最优特征描述符点对,在所有特征描述符点对中选取点对之间汉明距离最小的一部分点对作为用于图像拼接的最优特征点匹配对。
基于上述基于多重特征描述符的图像特征匹配方法,本发明实施例还提出一种基于多重特征描述符的图像特征匹配装置,参照图4所示的装置框图,所述图像特征匹配装置包括:
检测模块410,用于基于特征点检测算法检测每幅图像中的特征点;
设置阈值模块420,用于根据所述特征点的分布和实际需求,设置第一阈值、第二阈值和第三阈值,其中所述第一阈值用于设定需截取的特征点周围像素矩阵的大小,所述第二阈值用于设定滑动窗口半径,所述第三阈值用于设定特征描述符的位宽;
扫描模块430,用于利用所述第一阈值、所述第二阈值对所述特征点进行扫描并计算,得到符号描述符、均值描述符以及中心值描述符;
特征描述符模块440,用于基于所述符号描述符、所述均值描述符以及所述中心值描述符,结合所述第三阈值,得到特征描述符;
匹配选取模块450,用于对两幅或多幅图像的特征描述符进行特征点匹配,根据比较结果,选取匹配结果最优的特征点作为最终的图像匹配结果。
可选地,所述扫描模块430具体用于:
利用滑动窗口,以所述滑动窗口半径对所述特征点周围截取的像素矩阵进行扫描并计算,得到所述描述符、所述均值描述符以及所述中心值描述符。
可选地,所述设置阈值模块420中所述第一阈值、所述第二阈值以及所述第三阈值各自的阈值大小,通过所述特征点的分布和实际需求进行计算或网络自训练得到;
其中,第一阈值为patch_size阈值;
所述第二阈值为radius阈值;
所述第三阈值为bit_width阈值。
可选地,所述特征描述符模块440具体用于:
将所述符号描述符、所述均值描述符以及所述中心值描述符进行不同方式的拼接组合,直接生成所述第三阈值设定位宽的特征描述符;或者,
将所述符号描述符、所述均值描述符以及所述中心值描述符进行不同方式的拼接组合,生成对应的矩阵数值分布直方图,并根据所述矩阵数值分布直方图生成所述第三阈值设定位宽的特征描述符;
其中,将所述符号描述符、所述均值描述符以及所述中心值描述符进行不同方式的拼接组合,包括:
按照所述中心值描述、所述符号描述符和所述均值描述符的先后顺序,进行顺序拼接生成所述特征描述符;或者,
将所述符号描述符与所述均值描述按位相加后,在高位加入所述中心值描述符,生成所述特征描述符。
可选地,所述第三阈值设定位宽的特征描述符在不同的旋转、尺度、翻转和仿射变换下保持一致;所述扫描模块430中所述符号描述符、所述均值描述符以及所述中心值描述符各自的计算方式包括:
计算每个滑动窗口内除中心点像素外每个周围点像素绝对值相较于所述中心点像素绝对值的大小,若所述周围点像素绝对值大于所述中心点像素绝对值则置1,小于则置0,并将结果依次排列,以此生成所述符号描述符;
计算每个滑动窗口内所有像素的平均值,并与所述特征点所在滑动窗口内的像素平均值进行比较,若所述所有像素的平均值大于所述特征点所在滑动窗口内的像素平均值则置1,小于则置0,并将结果依次排列,以此生成所述均值描述符;
计算每个滑动窗口中心点值相较于所截取的特征点周围像素矩阵平均值和全图像素矩阵平均值的大小,若所述每个滑动窗口中心点值大于所述特征点周围像素矩阵平均值和全图像素矩阵平均值则置1,小于则置0,并将结果依次排列,以此生成所述中心值描述符。
可选地,所述匹配选取模块450具体用于:
采用L1范数匹配或L2范数匹配方式,进行所述特征点匹配;或者,
采用计算第一幅图像的特征描述符与第二幅图像的特征描述符之间汉明距离的方式,进行所述特征点匹配;或者,
采用计算第一幅图像的特征描述符和第二幅图像的特征描述符各自从右到左相邻的两个位,若不全0记为一个1,并统计新1的位数的方式,进行所述特征点匹配。
综上所述,本发明提供的基于多重特征描述符的图像特征匹配方法,首先基于特征点检测算法检测每幅图像中的特征点;再根据特征点的分布和实际需求,分别设定需截取的特征点周围像素矩阵的大小、设定滑动窗口半径,设定特征描述符的位宽这三个阈值。
之后利用这前两个阈值对特征点进行扫描并计算,得到符号描述符、均值描述符以及中心值描述符;再基于符号描述符、均值描述符以及中心值描述符,结合第三阈值,得到特征描述符;最后对两幅或多幅图像的特征描述符进行特征点匹配,根据比较结果,选取匹配结果最优的特征点作为最终的图像匹配结果。
本发明中的多重特征描述符构建方法,使用符号描述符、均值描述符和中心值描述符的不同排列合成方法作为多重特征描述符,其充分考虑到了特征点的方向信息、数值信息和全局信息,可以使得基于此特征符的图像匹配更加精准有效。不会错失图像的全局信息,自然不会导致部分梯度相同但数值差不同的特征点出现误匹配现象,图像匹配更加精准。同时对硬件条件要求较低,面对大规模特征提取和匹配时效果较好,很好的满足了城市或工业等大作业场景下的实际需求,尤其为矿山采掘环境、场景建模、工业生产中用到的图像匹配提供了很好的技术支持。
尽管已描述了本发明实施例的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明实施例范围的所有变更和修改。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者终端设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者终端设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者终端设备中还存在另外的相同要素。
上面结合附图对本发明的实施例进行了描述,但是本发明并不局限于上述的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的,本领域的普通技术人员在本发明的启示下,在不脱离本发明宗旨和权利要求所保护的范围情况下,还可做出很多形式,这些均属于本发明的保护之内。

Claims (9)

1.一种基于多重特征描述符的图像特征匹配方法,其特征在于,所述图像特征匹配方法包括:
基于特征点检测算法检测每幅图像中的特征点;
根据所述特征点的分布和实际需求,设置第一阈值、第二阈值和第三阈值,其中所述第一阈值用于设定需截取的特征点周围像素矩阵的大小,所述第二阈值用于设定滑动窗口半径,所述第三阈值用于设定特征描述符的位宽;
利用所述第一阈值、所述第二阈值对所述特征点进行扫描并计算,得到符号描述符、均值描述符以及中心值描述符;
将所述符号描述符、所述均值描述符以及所述中心值描述符进行不同方式的拼接组合,直接生成所述第三阈值设定位宽的特征描述符;或者,
将所述符号描述符、所述均值描述符以及所述中心值描述符进行不同方式的拼接组合,生成对应的矩阵数值分布直方图,并根据所述矩阵数值分布直方图生成所述第三阈值设定位宽的特征描述符;
对两幅或多幅图像的特征描述符进行特征点匹配,根据比较结果,选取匹配结果最优的特征点作为最终的图像匹配结果;
其中,所述符号描述符、所述均值描述符以及所述中心值描述符各自的计算方式包括:
计算每个滑动窗口内除中心点像素外每个周围点像素绝对值相较于所述中心点像素绝对值的大小,若所述周围点像素绝对值大于所述中心点像素绝对值则置1,小于则置0,并将结果依次排列,以此生成所述符号描述符;
计算每个滑动窗口内所有像素的平均值,并与所述特征点所在滑动窗口内的像素平均值进行比较,若所述所有像素的平均值大于所述特征点所在滑动窗口内的像素平均值则置1,小于则置0,并将结果依次排列,以此生成所述均值描述符;
计算每个滑动窗口中心点值相较于所截取的特征点周围像素矩阵平均值和全图像素矩阵平均值的大小,若所述每个滑动窗口中心点值大于所述特征点周围像素矩阵平均值和全图像素矩阵平均值则置1,小于则置0,并将结果依次排列,以此生成所述中心值描述符。
2.根据权利要求1所述的图像特征匹配方法,其特征在于,所述特征点检测算法仅用于每幅图像中的特征点的检测,所述特征点检测算法包括:FAST、SIFT、SURF和SuperPoint算法。
3.根据权利要求1所述的图像特征匹配方法,其特征在于,利用所述第一阈值、所述第二阈值对所述特征点进行扫描并计算,得到符号描述符、均值描述符和中心值描述符,包括:
利用滑动窗口,以所述滑动窗口半径对所述特征点周围截取的像素矩阵进行扫描并计算,得到所述符号描述符、所述均值描述符以及所述中心值描述符。
4.根据权利要求1所述的图像特征匹配方法,其特征在于,所述第一阈值为patch_size阈值;
所述第二阈值为radius阈值;
所述第三阈值为bit_width阈值。
5.根据权利要求1所述的图像特征匹配方法,其特征在于,所述第一阈值、所述第二阈值以及所述第三阈值各自的阈值大小,通过所述特征点的分布和实际需求进行计算或网络自训练得到。
6.根据权利要求1所述的图像特征匹配方法,其特征在于,所述第三阈值设定位宽的特征描述符在不同的旋转、尺度、翻转和仿射变换下保持一致。
7.根据权利要求1所述的图像特征匹配方法,其特征在于,将所述符号描述符、所述均值描述符以及所述中心值描述符进行不同方式的拼接组合,包括:
按照所述中心值描述、所述符号描述符和所述均值描述符的先后顺序,进行顺序拼接生成所述特征描述符;或者,
将所述符号描述符与所述均值描述按位相加后,在高位加入所述中心值描述符,生成所述特征描述符。
8.根据权利要求1所述的图像特征匹配方法,其特征在于,对两幅或多幅图像的特征描述符进行特征点匹配,包括:
采用L1范数匹配或L2范数匹配方式,进行所述特征点匹配;或者,
采用计算第一幅图像的特征描述符与第二幅图像的特征描述符之间汉明距离的方式,进行所述特征点匹配;或者,
采用计算第一幅图像的特征描述符和第二幅图像的特征描述符各自从右到左相邻的两个位,若不全0记为一个1,并统计新1的位数的方式,进行所述特征点匹配。
9.一种基于多重特征描述符的图像特征匹配装置,其特征在于,所述图像特征匹配装置包括:
检测模块,用于基于特征点检测算法检测每幅图像中的特征点;
设置阈值模块,用于根据所述特征点的分布和实际需求,设置第一阈值、第二阈值和第三阈值,其中所述第一阈值用于设定需截取的特征点周围像素矩阵的大小,所述第二阈值用于设定滑动窗口半径,所述第三阈值用于设定特征描述符的位宽;
扫描模块,用于利用所述第一阈值、所述第二阈值对所述特征点进行扫描并计算,得到符号描述符、均值描述符以及中心值描述符;
特征描述符模块,用于将所述符号描述符、所述均值描述符以及所述中心值描述符进行不同方式的拼接组合,直接生成所述第三阈值设定位宽的特征描述符;或者,
将所述符号描述符、所述均值描述符以及所述中心值描述符进行不同方式的拼接组合,生成对应的矩阵数值分布直方图,并根据所述矩阵数值分布直方图生成所述第三阈值设定位宽的特征描述符;
匹配选取模块,用于对两幅或多幅图像的特征描述符进行特征点匹配,根据比较结果,选取匹配结果最优的特征点作为最终的图像匹配结果;
其中,所述扫描模块中所述符号描述符、所述均值描述符以及所述中心值描述符各自的计算方式包括:
计算每个滑动窗口内除中心点像素外每个周围点像素绝对值相较于所述中心点像素绝对值的大小,若所述周围点像素绝对值大于所述中心点像素绝对值则置1,小于则置0,并将结果依次排列,以此生成所述符号描述符;
计算每个滑动窗口内所有像素的平均值,并与所述特征点所在滑动窗口内的像素平均值进行比较,若所述所有像素的平均值大于所述特征点所在滑动窗口内的像素平均值则置1,小于则置0,并将结果依次排列,以此生成所述均值描述符;
计算每个滑动窗口中心点值相较于所截取的特征点周围像素矩阵平均值和全图像素矩阵平均值的大小,若所述每个滑动窗口中心点值大于所述特征点周围像素矩阵平均值和全图像素矩阵平均值则置1,小于则置0,并将结果依次排列,以此生成所述中心值描述符。
CN202310841374.5A 2023-07-10 2023-07-10 基于多重特征描述符的图像特征匹配方法和装置 Active CN116824183B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310841374.5A CN116824183B (zh) 2023-07-10 2023-07-10 基于多重特征描述符的图像特征匹配方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310841374.5A CN116824183B (zh) 2023-07-10 2023-07-10 基于多重特征描述符的图像特征匹配方法和装置

Publications (2)

Publication Number Publication Date
CN116824183A CN116824183A (zh) 2023-09-29
CN116824183B true CN116824183B (zh) 2024-03-12

Family

ID=88140880

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310841374.5A Active CN116824183B (zh) 2023-07-10 2023-07-10 基于多重特征描述符的图像特征匹配方法和装置

Country Status (1)

Country Link
CN (1) CN116824183B (zh)

Citations (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007006526A (ja) * 2001-05-25 2007-01-11 Ricoh Co Ltd 画像処理装置、低線数網点部検出装置、画像読み取り装置、画像形成装置およびカラー複写装置
CN103279939A (zh) * 2013-04-27 2013-09-04 北京工业大学 一种图像拼接处理***
CN104376548A (zh) * 2014-11-07 2015-02-25 中国电子科技集团公司第二十八研究所 一种基于改进型surf算法的图像快速拼接方法
CN104809731A (zh) * 2015-05-05 2015-07-29 北京工业大学 一种基于梯度二值化的旋转尺度不变场景匹配方法
CN105590114A (zh) * 2015-12-22 2016-05-18 马洪明 一种图像特征量的生成方法
CN107945111A (zh) * 2017-11-17 2018-04-20 中国矿业大学 一种基于surf特征提取结合cs‑lbp描述符的图像拼接方法
CN110246168A (zh) * 2019-06-19 2019-09-17 中国矿业大学 一种移动巡检机器人双目图像拼接的特征匹配方法
CN111257588A (zh) * 2020-01-17 2020-06-09 东北石油大学 一种基于orb和ransac的油相流速测量方法
CN111340109A (zh) * 2020-02-25 2020-06-26 深圳市景阳科技股份有限公司 图像匹配方法、装置、设备及存储介质
CN112085117A (zh) * 2020-09-16 2020-12-15 北京邮电大学 一种基于MTLBP-Li-KAZE-R-RANSAC的机器人运动监测视觉信息融合方法
CN113095385A (zh) * 2021-03-31 2021-07-09 安徽工业大学 一种基于全局和局部特征描述的多模图像匹配方法
CN114549634A (zh) * 2021-12-27 2022-05-27 杭州环峻科技有限公司 一种基于全景图像的相机位姿估计方法及***
CN114693522A (zh) * 2022-03-14 2022-07-01 江苏大学 一种全聚焦超声图像拼接方法
CN115861640A (zh) * 2022-10-24 2023-03-28 盐城工学院 一种基于orb和surf特征的快速图像匹配方法
CN116310373A (zh) * 2022-10-24 2023-06-23 盐城工学院 基于改进surf特征的图像匹配方法

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101912748B1 (ko) * 2012-02-28 2018-10-30 한국전자통신연구원 확장성을 고려한 특징 기술자 생성 및 특징 기술자를 이용한 정합 장치 및 방법
US8958651B2 (en) * 2013-05-30 2015-02-17 Seiko Epson Corporation Tree-model-based stereo matching
WO2015170319A2 (en) * 2014-05-09 2015-11-12 Given Imaging Ltd. System and method for sequential image analysis of an in vivo image stream
CN105518709B (zh) * 2015-03-26 2019-08-09 北京旷视科技有限公司 用于识别人脸的方法、***和计算机程序产品
EP3461138B1 (en) * 2016-06-08 2021-09-22 Huawei Technologies Co., Ltd. Processing method and terminal

Patent Citations (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007006526A (ja) * 2001-05-25 2007-01-11 Ricoh Co Ltd 画像処理装置、低線数網点部検出装置、画像読み取り装置、画像形成装置およびカラー複写装置
CN103279939A (zh) * 2013-04-27 2013-09-04 北京工业大学 一种图像拼接处理***
CN104376548A (zh) * 2014-11-07 2015-02-25 中国电子科技集团公司第二十八研究所 一种基于改进型surf算法的图像快速拼接方法
CN104809731A (zh) * 2015-05-05 2015-07-29 北京工业大学 一种基于梯度二值化的旋转尺度不变场景匹配方法
CN105590114A (zh) * 2015-12-22 2016-05-18 马洪明 一种图像特征量的生成方法
CN107945111A (zh) * 2017-11-17 2018-04-20 中国矿业大学 一种基于surf特征提取结合cs‑lbp描述符的图像拼接方法
CN110246168A (zh) * 2019-06-19 2019-09-17 中国矿业大学 一种移动巡检机器人双目图像拼接的特征匹配方法
CN111257588A (zh) * 2020-01-17 2020-06-09 东北石油大学 一种基于orb和ransac的油相流速测量方法
CN111340109A (zh) * 2020-02-25 2020-06-26 深圳市景阳科技股份有限公司 图像匹配方法、装置、设备及存储介质
CN112085117A (zh) * 2020-09-16 2020-12-15 北京邮电大学 一种基于MTLBP-Li-KAZE-R-RANSAC的机器人运动监测视觉信息融合方法
CN113095385A (zh) * 2021-03-31 2021-07-09 安徽工业大学 一种基于全局和局部特征描述的多模图像匹配方法
CN114549634A (zh) * 2021-12-27 2022-05-27 杭州环峻科技有限公司 一种基于全景图像的相机位姿估计方法及***
CN114693522A (zh) * 2022-03-14 2022-07-01 江苏大学 一种全聚焦超声图像拼接方法
CN115861640A (zh) * 2022-10-24 2023-03-28 盐城工学院 一种基于orb和surf特征的快速图像匹配方法
CN116310373A (zh) * 2022-10-24 2023-06-23 盐城工学院 基于改进surf特征的图像匹配方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
基于多重匹配的可见水印去除算法;张茗茗;周诠;计算机工程与设计(第01期);全文 *
基于曲率局部二值模式的深度图像手势特征提取;尚常军;丁瑞;;计算机应用(第10期);全文 *

Also Published As

Publication number Publication date
CN116824183A (zh) 2023-09-29

Similar Documents

Publication Publication Date Title
CN108121991B (zh) 一种基于边缘候选区域提取的深度学习舰船目标检测方法
JP5775225B2 (ja) マルチレイヤ連結成分をヒストグラムと共に用いるテキスト検出
CN110032998B (zh) 自然场景图片的文字检测方法、***、装置和存储介质
CN102713938B (zh) 用于均匀和非均匀照明变化中的改善的特征检测的尺度空间正规化技术
CN102667810A (zh) 数字图像中的面部识别
GB2431793A (en) Image comparison
CN110675425B (zh) 一种视频边框识别方法、装置、设备及介质
CN112215925A (zh) 自适应采煤机随动跟踪多摄像头视频拼接方法
CN110942473A (zh) 一种基于特征点网格化匹配的运动目标跟踪检测方法
CN111626145B (zh) 一种简捷有效的残缺表格识别及跨页拼接方法
US20160048728A1 (en) Method and system for optical character recognition that short circuit processing for non-character containing candidate symbol images
Nam et al. Content-aware image resizing detection using deep neural network
KR20170066014A (ko) 시점 변화에 강인한 특징점 정합 방법
CN108830283B (zh) 一种图像特征点匹配方法
CN111832497B (zh) 一种基于几何特征的文本检测后处理方法
CN113704276A (zh) 地图更新方法、装置、电子设备及计算机可读存储介质
CN116824183B (zh) 基于多重特征描述符的图像特征匹配方法和装置
Matusiak et al. Unbiased evaluation of keypoint detectors with respect to rotation invariance
CN115345895B (zh) 用于视觉检测的图像分割方法、装置、计算机设备及介质
CN114926508B (zh) 视野分界线确定方法、装置、设备及存储介质
CN110766003A (zh) 一种基于卷积神经网络的片段和链接的场景文字的检测方法
JP4550768B2 (ja) 画像検出方法および画像検出装置
CN116403010A (zh) 一种基于fast算法的医学图像匹配方法
CN113191369B (zh) 一种基于光场角度域变化矩阵的特征点检测方法
CN116645661B (zh) 一种防重码检测方法及***

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant