CN102713938A - 用于均匀和非均匀照明变化中的改善的特征检测的尺度空间正规化技术 - Google Patents
用于均匀和非均匀照明变化中的改善的特征检测的尺度空间正规化技术 Download PDFInfo
- Publication number
- CN102713938A CN102713938A CN2011800054966A CN201180005496A CN102713938A CN 102713938 A CN102713938 A CN 102713938A CN 2011800054966 A CN2011800054966 A CN 2011800054966A CN 201180005496 A CN201180005496 A CN 201180005496A CN 102713938 A CN102713938 A CN 102713938A
- Authority
- CN
- China
- Prior art keywords
- image
- difference
- metric space
- level
- smoothed version
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/46—Descriptors for shape, contour or point-related descriptors, e.g. scale invariant feature transform [SIFT] or bags of words [BoW]; Salient regional features
- G06V10/462—Salient features, e.g. scale invariant feature transforms [SIFT]
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Image Analysis (AREA)
- Image Processing (AREA)
Abstract
将正规化过程实施于尺度空间差处以完全或大体上减小照明变化对图像中的特征/关键点检测的影响。可通过使用平滑函数逐渐地模糊图像来处理所述图像以产生所述图像的经平滑的尺度空间。可通过取得所述图像的两个不同经平滑版本之间的差而产生尺度空间差。可通过将尺度空间图像差除以所述图像的第三经平滑版本而产生经正规化的尺度空间图像差,其中所述图像的所述第三经平滑版本与所述图像的所述两个不同经平滑版本中的最平滑者一样平滑或比所述最平滑者平滑。可接着使用所述经正规化的尺度空间图像差来检测所述图像的一个或一个以上特征/关键点。
Description
根据35U.S.C.§119主张优先权
本专利申请案主张2010年1月8日申请的题为“关键点稳定化技术(KeypointStabilization Technique)”的第61/293,437号美国临时申请案的优先权,所述申请案已转让给本案受让人且在此以引用的方式明确地并入本文中。
技术领域
一个特征涉及计算机视觉,且更特定而言,涉及用于改善图像辨识***的性能和/或效率的方法和技术。
背景技术
各种应用可受益于具有能够以视觉表示(例如,图像或图片)来识别对象的机器或处理器。计算机视觉的领域试图提供准许识别图像中的对象或特征的技术和/或算法,其中对象或特征可由识别一个或一个以上关键点的描述符来表征。常常还将例如SIFT(尺度不变特征变换)等这些技术和/或算法应用到图像辨识、对象检测、图像匹配、3维结构建构、立体对应,和/或运动追踪、面部辨识(以及其它应用)。
大体上,出于特征识别、图像检索和/对象辨识的目的,对象或特征辨识可涉及识别图像中的所关注点(还称为关键点)和/或那些关键点周围的局部化特征。在这些辨识算法中,具有特征的高稳定性和可重复性非常重要。因此,所述关键点可经选择和/或处理使得其对于图像尺度改变和/或旋转为不变的且提供跨越实质范围的失真、视点的改变和/或噪声和照明的改变的稳健匹配。另外,为了良好地适合于例如图像检索和对象辨识的任务,在单一特征可相对于来自多个目标图像的特征的大数据库以高概率匹配的意义上,特征描述符可优选为独特的。
在检测并定位图像中的关键点之后,可通过使用各种描述符来识别或描述所述关键点。举例来说,描述符还可表示图像中的内容的视觉特征,例如,形状、色彩、纹理、旋转,和/或运动(以及其它图像特性)。对应于关键点且由描述符所表示的个别特征接着匹配到来自已知对象的特征的数据库。
作为识别和选择图像的关键点的部分,可能归因于缺乏精确度或置信度而必须舍弃选定的一些点。举例来说,可能由于沿边缘的不良对比度和/或不良定位而拒绝一些最初检测到的关键点。这些拒绝在相对于照明、噪声和定向变化而增加关键点稳定性方面是重要的。最小化将减小特征匹配的可重复性的错误关键点拒绝也是重要的。然而,因为例如阴影的效应可实际上使所关注特征被完全忽略从而减小对象辨识的可重复性,所以具有在空间上变化的照明变化对特征检测造成了显著问题。
因此,需要界定适应于局部和全局照明变化的阈值以用于对象辨识算法内的特征选择的方法或途径。
发明内容
下文呈现对一个或一个以上实施例的简化概述,以便提供对一些实施例的基本理解。此概述并非所有预期实施例的广泛综述,且既不意欲识别所有实施例的关键或重要要素,也不意欲描绘任何或所有实施例的范围。其唯一目的是以简化形式来呈现一个或一个以上实施例的一些概念以作为稍后所呈现的更详细描述的序言。
提供一种在图像特征检测装置中操作的用于减小照明变化对图像中的关键点/特征检测的影响的方法。可将图像与具有不同缩放宽度的多个平滑核进行卷积以获得所述图像的多个经平滑版本,所述多个经平滑版本界定尺度空间金字塔。可通过取得所述图像的两个不同经平滑版本之间的差而产生尺度空间图像差。所述图像的所述两个不同经平滑版本可处于所述经平滑的尺度空间金字塔中的邻近层级。举例来说,所述图像的第三经平滑版本可具有与所述图像的所述两个不同经平滑版本的尺度(例如,平滑核)中的较大者相等或比所述较大者宽的尺度(例如,平滑核)。可重复此过程以通过取得所述图像的不同经平滑版本对之间的差而产生尺度空间差,所述尺度空间图像差形成所述尺度空间差的部分。
可通过将所述尺度空间图像差除以所述图像的第三经平滑版本而产生经正规化的尺度空间图像差,其中所述图像的所述第三经平滑版本与所述图像的所述两个不同经平滑版本中的最平滑者一样平滑或比所述最平滑者平滑。可通过使用所述经正规化的尺度空间图像差来执行对所述图像的一个或一个以上特征的检测。可使用所述经正规化的尺度空间差通过检测所述经正规化的尺度空间图像差内的局部极值来识别所述图像的一个或一个以上特征。每一特征可包括一关键点和关于其周围点的信息。可接着基于所述所识别的一个或一个以上特征而产生所述图像的描述符。
类似地,可提供一种用于减小照明变化对图像中的关键点/特征检测的影响的图像特征检测装置。所述特征检测装置可包括:尺度空间产生器、尺度空间差产生器、尺度空间差产生器正规化器、特征检测器和/或特征描述符产生器。所述尺度空间产生器可适于将图像与具有不同缩放宽度的多个平滑核进行卷积以获得所述图像的多个经平滑版本,所述多个经平滑版本界定尺度空间金字塔。所述尺度空间差产生器可适于通过取得所述图像的两个不同经平滑版本之间的差而产生尺度空间图像差。所述图像的所述两个不同经平滑版本可为所述经平滑的尺度空间金字塔中的邻近层级。所述尺度空间差产生器可适于通过取得所述图像的不同经平滑版本对之间的差而产生尺度空间差,所述尺度空间图像差形成所述尺度空间差的部分。
所述尺度空间差产生器正规化器可适于通过将所述尺度空间图像差除以所述图像的第三经平滑版本而产生经正规化的尺度空间图像差,其中所述图像的所述第三经平滑版本与所述图像的所述两个不同经平滑版本中的最平滑者一样平滑或比所述最平滑者平滑。所述图像的所述第三经平滑版本可具有与所述图像的所述两个不同经平滑版本的所述尺度(例如,平滑核)中的较大者相等或比所述较大者宽的尺度(例如,平滑核)。
所述特征检测器可适于使用所述经正规化的尺度空间图像差以检测所述图像的一个或一个以上特征。所述特征检测器可适于使用所述经正规化的尺度空间差通过检测所述经正规化的尺度空间图像差内的局部极值来识别所述图像的特征。所述特征描述符产生器可适于基于所述所识别的一个或一个以上特征而产生所述图像的描述符。
附图说明
当结合图式阅读时,从下文阐述的详细描述可明白各种特征、本质和优点,在图式中相同参考符号始终对应地进行识别。
图1为说明用于对所查询的图像执行对象辨识的功能阶段的方框图。
图2说明示范性图像处理阶段中的高斯尺度空间产生。
图3说明示范性图像处理阶段中的特征检测。
图4说明示范性图像处理阶段中的特征描述符提取。
图5说明针对照明不变特征/关键点检测的尺度空间正规化的一实例。
图6说明可获得经正规化的尺度空间差的一个层级的方式的一个实例。
图7说明用于产生经正规化的尺度空间差以用于抵抗照明的改变来改善特征检测的方法。
图8(包含图8A、8B和8C)说明在使用传统特征检测途径中可能归因于照明的改变而影响图像的特征检测的方式。
图9(包含图9A、9B和9C)说明在不管照明变化的情况下在特征检测之前正规化尺度空间差有助于检测更多特征(与图8相比)的方式。
图10(包含图10A和10B)说明高斯尺度空间差与经正规化的高斯尺度空间差之间的比较。
图11(包含图11A和11B)说明尺度空间差正规化对关键点匹配验证的影响。
图12为说明照明不变特征检测装置的实例的方框图。
图13为说明将经正规化的尺度空间差用于特征检测的图像匹配装置的实例的方框图。
图14为说明适于执行图像处理以便实现图像或对象辨识的目的的示范性移动装置的方框图。
图15说明用于使用经正规化的尺度空间差的特征检测的方法。
具体实施方式
现参看图式来描述各种实施例,其中相同参考数字始终用以指代相同元件。在以下描述中,出于解释的目的,阐述众多特定细节,以便提供对一个或一个以上实施例的透彻理解。然而,可显而易见,可在无这些特定细节的情况下实践此(些)实施例。在其它例子中,以方框图形式来展示众所周知的结构和装置,以便促进描述一个或一个以上实施例。
综述
本文中所描述的各种特征涉及改善图像辨识的速度和/或效率。根据第一方面,通过在特征/关键点检测之前正规化尺度空间差来消除或减小跨越图像的照明(均匀或非均匀)的影响。接着对经正规化的尺度空间差执行特征/关键点检测。
大体上,应认识到,可通过空间变化函数来表示图像中的照明。因此,出于特征/关键点检测的目的,可通过析出照明函数的因子的正规化过程来抵消照明的影响(例如,遮光、亮图像、暗图像等)。举例来说,可通过使用具有一定范围的平滑因子的函数G(即,核或滤波器)逐渐地模糊图像来处理图像以产生图像的经平滑尺度空间L。可接着通过取得邻近对的经平滑的尺度空间层级(Li到Li-1)之间的差而获得图像的尺度空间差D。接着通过将每一尺度空间层级差Di除以经平滑的尺度空间层级Lk而实现尺度空间L的差的正规化,所述经平滑的尺度空间层级Lk与用以获得特定尺度空间层级差Di的尺度空间层级Li中的最平滑者一样平滑或比所述最平滑者平滑。
示范性对象辨识过程
图1为说明用于对所查询的图像执行对象辨识的功能阶段的方框图。在图像捕获阶段102处,可捕获所关注的图像108(即,所查询的图像)。图像108可由可包括一个或一个以上图像传感器和/或模/数转换器的图像捕获装置捕获以获得数字捕获图像。所述图像传感器(例如,电荷耦合装置(CCD)、互补金属半导体(CMOS))可将光转换成电子。所述电子可形成模拟信号,接着通过模/数转换器将所述模拟信号转换成数字值。以此方式,可以数字格式捕获图像108,所述数字格式可将图像I(x,y)界定为(例如)具有对应色彩、照明和/或其它特性的多个像素。
在图像处理阶段104中,接着通过产生对应尺度空间110(例如,高斯(Gaussian)尺度空间)、执行特征检测112和执行特征描述符提取116来处理所捕获的图像108。特征检测112可识别所捕获的图像108的高度独特的关键点和/或具有几何关注性的关键点,所述关键点可随后用于特征描述符提取116中以获得多个描述符。在图像比较阶段106处,这些描述符用以执行与已知描述符的数据库的特征匹配122(例如,通过比较关键点和/或关键点的其它特性或围绕关键点的小片(patch))。接着对关键点匹配执行几何验证或一致性检查124以确认正确的特征匹配且提供匹配结果126。以此方式,可将所查询的图像与目标图像的数据库进行比较和/或从所述数据库识别。
已观察到,图像中的照明的改变可对图像的特征/关键点辨识的稳定性和/或可重复性具有不利影响。即,图像中的局部和/或全局照明变化可影响对图像的特征/关键点的检测。举例来说,特征/关键点的数目和/或位置可依据图像中的照明(例如,遮光、对比度等)而改变。因此,在图像中的特征/关键点检测之前实质上消除或最小化局部和/或全局照明变化的影响将是有益的。
进行此操作的一种方式可为在开始特征/关键点检测之前处理图像自身以移除或补偿局部和/或全局照明变化。然而,此过程可为计算密集的。另外,常常难以确定在图像中是否存在局部和/或全局照明变化。此过程还必须应用到数据库中的图像。在不首先处理目标图像和数据库图像两者以校正照明变化的情况下,特征/关键点匹配可能不成功。但在先前不知晓照明可如何影响特定图像的情况下,此过程极难自动地实施。
因此,需要可在无实质的处理开销的情况下执行的替代方案。根据一个实例,出于特征检测的目的,可通过在对尺度空间差执行特征/关键点检测之前正规化尺度空间差来消除或减小跨越图像的照明(均匀或非均匀)的影响。可使用已得到的经平滑尺度空间来执行此正规化过程,因此最小化任何额外计算。
根据一个实例,可将尺度空间正规化器114实施为尺度空间产生110的部分以减小或消除照明变化对图像中的关键点/特征辨识的影响。
图2说明示范性图像处理阶段104中的高斯尺度空间产生。已开发出若干种算法(例如,尺度不变特征变换(SIFT))以执行图像中的特征检测。针对图像中的特定对象的检测的第一步骤为基于所查询的对象的局部特征来将所述对象分类。目标是识别和选择对于(例如)照明、图像噪声、旋转、缩放和/或视点的小改变不变和/或稳健的特征。即,不管查询图像与比较目标图像之间的照明、图像噪声、旋转、尺度和/或视点的差异如何,应找出所述两个图像之间的匹配。进行此操作的一种方式为对图像的小片执行极值检测(例如,局部最大值或最小值)以识别高度独特的特征(例如,图像中的独特点、像素和/或区域)。
SIFT为用于检测和提取对于照明的改变、图像噪声、旋转、缩放和/或视点的小改变适度不变的局部特征的一种途径。用于SIFT的图像处理阶段104可包括:(a)尺度空间极值检测、(b)关键点定位、(c)定向指派,和/或(d)关键点描述符的产生。应清楚,用于特征检测和后续特征描述符产生的替代算法也可受益于本文中所描述的特征,所述替代算法尤其包括加速稳健特征(SURF)、梯度定位和定向直方图(GLOH)、基于局部能量的形状直方图(LESH)、梯度的压缩直方图CHoG)。
在高斯尺度空间产生110中,数字图像I(x,y)108被逐步地高斯模糊(即,经平滑)以建构高斯金字塔202。高斯模糊(平滑)大体上涉及在尺度cσ下将原始图像I(x,y)与高斯模糊/平滑函数G(x,y,cσ)进行卷积,使得高斯模糊/平滑函数L(x,y,cσ)被界定为L(x,y,cσ)=G(x,y,cσ)*I(x,y)。此处,G为高斯核,cσ表示用于模糊图像I(x,y)的高斯函数的标准偏差。因为乘数c变化(c0<c1<c2<c3<c4),所以标准偏差cσ变化且获得逐步模糊/平滑。Sigmaσ为基本尺度变量(例如,高斯核的宽度)。较高尺度(即,较低分辨率)比较低尺度(即,较高分辨率)被模糊/平滑得更多。因此,尺度层级越宽(即,分辨率越低),则图像越平滑(越模糊)。
当将初始图像I(x,y)与高斯G递增地进行卷积以产生经模糊的图像L时,在尺度空间中以恒定因子c来分离经模糊的图像L。当经高斯模糊(平滑)的图像L的数目增大且为高斯金字塔202提供的近似接近连续空间时,两个尺度也接近一个尺度。在一个实例中,可通过八元组对经卷积的图像L进行分组,其中一八元组可对应于加倍的标准偏差σ的值。此外,选择乘数c的值(例如,c0<c1<c2<c3<c4),使得每一八元组获得固定数目个经卷积的图像L。缩放的每一八元组对应于显式的图像大小调整。因此,当通过逐步模糊/平滑函数来模糊/平滑原始图像I(x,y)时,像素的数目逐渐地减小。应注意,虽然本文中出于说明的目的而使用了高斯平滑函数,但还可使用其它类型的平滑核/函数。
通过计算高斯金字塔202中的任何两个连续经高斯模糊的图像的差来建构高斯差(DoG)金字塔204。在DoG空间204中,D(x,y,a)=L(x,y,cnσ)-L(x,y,cn-1σ)。DoG图像D(x,y,σ)为在尺度cnσ和cn-1σ下的两个邻近经高斯模糊的图像L之间的差。D(x,y,σ)的尺度位于cnσ与cn-1σ之间的某处。可针对每一八元组从邻近经高斯模糊的图像L获得DoG图像D。在每一八元组之后,可通过因子2将高斯图像下取样且接着重复所述过程。以此方式,可将图像变换成对于转译、旋转、尺度和/或其它图像参数和/或失真而稳健或不变的局部特征。
一旦产生,所查询的图像的DoG空间204便可用于极值检测以识别所关注的特征(例如,识别图像中的高度独特的点)。本文中将这些高度独特的点称作关键点。可通过围绕每一关键点的小片或局部区域的特性来识别这些关键点。可针对每一关键点和其对应小片产生描述符,所述描述符可用于比较查询图像与所存储的目标图像之间的关键点。“特征”可指代描述符(即,关键点和其对应小片)。特征(即,关键点和对应小片)的群组可称作群集。
图3说明示范性图像处理阶段104中的特征检测。在特征检测112中,DoG空间204可用以识别图像I(x,y)的关键点。特征检测112设法确定图像中的特定样本点或像素周围的局部区域或小片是否为潜在关注的小片(在几何方面而言)。
大体上,识别DoG空间204中的局部最大值和/或局部最小值且将这些最大值和最小值的位置用作DoG空间204中的关键点位置。在图3中所说明的实例中,已用小片306识别了关键点308。可通过以下动作来实现寻找局部最大值和最小值(还称为局部极值检测):比较DoG空间204中的每一像素(例如,关键点308的像素)与同一尺度下的其八个相邻像素和在关键点408的两侧上的相邻尺度中的每一者中的九个相邻像素(在邻近小片310和312中),总计26个像素(9x2+8=26)。此处,将小片界定为3x3像素区域。一般来说,如果关键点306的像素值为小片306、310和308中的所有二十六(26)个经比较像素当中的最大值或最小值,则将其选择为关键点。可进一步处理所述关键点以使得更准确地识别其位置且可舍弃所述关键点中的一些(例如,低对比度关键点和边缘关键点)。
图4说明示范性图像处理阶段104中的特征描述符提取。大体上,特征(例如,关键点和其对应小片)可由描述符来表示,描述符允许有效地比较所述特征(来自查询图像)与存储于目标图像的数据库中的特征。在特征描述符提取116的一个实例中,可基于局部图像梯度的方向来向每一关键点指派一个或一个以上定向或方向。通过基于局部图像性质将一致定向指派给每一关键点,可相对于此定向来表示关键点描述符且因此实现对于图像旋转的不变性。可针对在经高斯模糊的图像L中和/或在关键点尺度下围绕关键点308的相邻区域中的每个像素执行量值和方向计算。位于(x,y)处的关键点308的梯度的量值可表示为m(x,y),且(x,y)处的关键点的梯度的定向或方向可表示为Γ(x,y)。关键点的尺度用以选择具有最接近于关键点308的尺度的尺度的经高斯平滑的图像L,使得以尺度不变的方式来执行所有计算。对于此尺度下的每一图像样本L(x,y),使用像素差来计算梯度量值m(x,y)和定向Γ(x,y)。举例来说,可将量值m(x,y)计算为:
可将方向或定向Γ(x,y)计算为:
此处,L(x,y)为经高斯模糊的图像L(x,y,σ)在也为关键点的尺度的尺度下的样本。
可在比关键点高的尺度下针对高斯金字塔中位于DoG空间中的关键点平面上方的平面或在比关键点低的尺度下针对高斯金字塔中位于关键点平面下方的平面而一致地计算关键点308的梯度。总之,对于每一关键点而言,在围绕关键点的矩形区(小片)中,所述梯度全部在同一尺度下来计算。此外,图像信号的频率反映于经高斯模糊的图像的尺度中。然而,SIFT仅使用在小片(例如,矩形区)中的所有像素处的梯度值。在关键点周围界定小片;在块内界定子块;在子块内界定样本,且即使在关键点的尺度不同时,此结构对于所有关键点也保持相同。因此,虽然在同一八元组中图像信号的频率随着高斯平滑滤波器的连续应用而改变,但可以相同数目个样本来对在不同尺度下所识别的关键点取样,而不考虑图像信号的频率(由尺度表示)的改变。
为了表征关键点定向,可在关键点308的附近(使用在最接近关键点的尺度的尺度下的高斯图像)产生(用SIFT)梯度定向的向量。然而,还可通过使用(例如)梯度的压缩直方图(CHoG)通过梯度定向直方图(参见图4)来表示关键点定向。可通过梯度量值和高斯窗来对每一相邻像素的贡献进行加权。直方图中的峰值对应于支配性定向。可相对于关键点定向来测量关键点的所有性质,这提供对于旋转的不变性。
在一个实例中,可针对每一块计算经高斯加权的梯度的分布,其中每一块为2个子块乘2个子块,总共为4个子块。为了计算经高斯加权的梯度的分布,形成具有若干个区间(bin)的定向直方图,其中每一区间覆盖关键点周围的区的一部分。举例来说,定向直方图可具有36个区间,每一区间覆盖定向的360度范围中的10度。或者,直方图可具有8个区间,每一区间覆盖360度范围中的45度。应清楚,本文中所描述的直方图编码技术可适用于具有任何数目个区间的直方图。应注意,还可使用最终产生直方图的其它技术。
可以各种方式获得梯度分布和定向直方图。举例来说,将二维梯度分布(dx,dy)(例如,块406)转换为一维分布(例如,直方图414)。关键点408位于围绕关键点408的小片406(还称为单元或区域)的中心处。将针对金字塔的每一层级而预先计算的梯度展示为每一样本位置408处的小箭头。如所展示,样本408的4x4区域形成子块410且子块的2x2区域形成块406。块406还可称作描述符窗。高斯加权函数用圆圈402展示且用以将权重指派给每一样本点408的量值。圆形窗402中的权重平滑地减少。高斯窗402的目的在于,通过窗的位置的小改变来避免描述符的突然改变且较不强调远离描述符的中心的梯度。从在直方图的每一区间中具有8个定向的2x2子块获得定向直方图的2x2=4阵列412,从而产生(2x2)x8=32维的特征描述符向量。举例来说,定向直方图413和415可对应于子块410的梯度分布。然而,使用在每一直方图中具有8个定向的直方图(8区间直方图)的4x4阵列(针对每一关键点产生(4x4)x8=128维的特征描述符向量)可得到较佳结果。应注意,其它类型的量化区间星座(例如,具有不同Voronoi单元结构)也可用以获得梯度分布。
如本文中所使用,直方图为映射ki,所述映射ki对落入称为区间的各种不相交种类中的观察、样本或出现(例如,梯度)的数目进行计数。直方图的图表仅为表示直方图的一种方式。因此,如果k为观察、样本或出现的总数目且m为区间的总数目,则直方图ki中的频率满足以下条件:
其中∑为求和运算符。
可串联来自子块的直方图以获得关键点的特征描述符向量。如果使用来自16个子块的8区间直方图中的梯度,则可产生128维的特征描述符向量。
以此方式,可针对所识别的每一关键点获得描述符,其中此描述符可由位置(x,y)、定向和经高斯加权的梯度的分布的描述符来表征。应注意,图像可由一个或一个以上关键点描述符(还称作图像描述符)来表征。另外,描述符还可包括位置信息(例如,关键点的坐标)、尺度(例如,检测关键点所在的高斯尺度),和例如群集识别符等其它信息。
通过在高斯差空间204中操作,图像的亮度的任何水平移位(亮度的空间上均匀的附加偏移)被完全忽略。但亮度的尺度移位将会影响判断和最终选择或拒绝关键点的方式。此应用于均匀以及空间上变化的倍增亮度因子。关键点在图像内的定位与关键点检测一样重要。通过对象的特征的几何内容和其空间相互关系将对象进行分类。因此,关键点的计算位置为重要元素,使得即使检测到所述关键点,仍应以相对于任何亮度尺度改变而不变的方式来计算其定位。
因此,在识别关键点和产生描述符之前,一个特征提供用于正规化高斯差空间204,以便从检测关键点的尺度空间减小、移除和/或过滤照明的影响。
示范性尺度空间差正规化
图5说明针对照明不变特征/关键点检测的尺度空间正规化的实例。可在不同尺度ciσ下将图像I(x,y)502与平滑核G(x,y,ciσ)504进行卷积以产生经平滑的尺度空间金字塔506,其中i为0与n之间的整数。应注意,所述平滑核可为高斯核和/或其它类型的平滑函数。可获取经平滑的尺度空间金字塔506的两个邻近尺度空间之间的差以获得尺度空间差508。
首先观察到,可将尺度空间差508的每一层级界定为与图像I(x,y)502进行卷积的在不同尺度504下的平滑核差(例如,G(x,y,cj+1σ)-G(x,y,cjσ))。这等于两个对应经平滑尺度空间的差(例如,L(x,y,cj+1σ)-L(x,y,cjσ))。因此,两个平滑尺度空间的差可表示为:
D(x,y,σ)=(G(x,y,cj+1σ)-G(x,y,cjσ))*I(x,y)=L(x,y,cj+1σ)-L(x,y,cjσ)。
(等式4)
还观察到,如果将照明表示为缩放函数S(x,y),则两个平滑尺度空间的差的照明变化可表示为:
D(x,y,σ)=(G(x,y,cj+1σ)-G(x,y,cjσ))*(I(x,y)S(x,y))。 (等式5)
此处,在一般状况下,照明缩放函数S(x,y)可在空间上变化或在空间上恒定。
然而,以运行时间(runtime)来模型化照明以获得照明缩放函数S(x,y)是不实用和/或不可行的。因此,本文中揭示一种替代途径,所述替代途径获得未由于照明而从特征空间(例如,DoG空间508)偏置的基础特征(例如,关键点),通常对所述特征空间执行特征选择和/或修剪。根据此替代途径,通过利用从图像I(x,y)502提取的尺度空间信息来正规化图像I(x,y)502的亮度分布。无需关于照明的先验信息。此方法使得能够选择稳定特征且增加跨越不同照明变化的一致层级上的可重复性,而不引入任何较大计算和处理。
为此,可通过较宽尺度空间来正规化发生特征检测的尺度空间差508。此途径可通过以下等式来界定:
其中
第一高斯平滑核G(x,y,cj+1σ)比第二高斯平滑核G(x,y,cjσ)宽(即,尺度cj+1σ比尺度cjσ宽,其中j为0与n之间的正整数);
I(x,y)为正经处理的图像或其导出物(例如,图像的反射性质);
S(x,y)为照明缩放函数;且
G(x,y,cj+1+hσ)为具有与第二平滑核G(x,y,cj+1σ)一样宽或比第二平滑核G(x,y,cj+1σ)宽的尺度空间的第三平滑核,其中h为0与n之间的正整数。通过在尺度空间差508的每一层级上重复此过程,可产生经正规化的尺度空间差510。举例来说,对于由G(x,y,cj+1σ)和G(x,y,cjσ)界定的差分尺度空间,正规化函数可为G(x,y,cj+1σ)或更高尺度的任何正规化函数(即,G(x,y,cj+2σ)、G(x,y,cj+3σ)、...)。所述正规化函数无需大于差分尺度空间中所使用的两个平滑核,其仅需要与所述两个平滑核一样平滑。在另一实例中,正规化函数可为所使用的第一和第二平滑核的和(即,G(x,y,cj+1σ)+G(x,y,cjσ)),使得:
应注意,等式6还可表示为:
因为照明缩放函数S(x,y)出现于分子和分母两者(等式6、7和8的分子和分母两者)中,所以其缩放影响被约去。即,因为照明缩放函数S(x,y)存在于用于正规化的经平滑的图像L(x,y,cj+1+hσ)*S(x,y)中,所以其完全或实质上约去照明缩放函数S(x,y)在尺度空间差[L(x,y,cj+1σ)-L(x,y,cjσ)]*S(x,y)中的影响。如前所述,L(x,y,cj+1+hσ)可等于L(x,y,cj+1σ)或更高尺度的图像(即,L(x,y,cj+2σ)、L(x,y,cj+3σ)、...)。以此方式,将分母中的图像内容平滑到使得所述图像内容引入极少空间假影的程度。
在正规化尺度空间差中,应选择正规化经平滑的图像L(x,y,cj+1+hσ),以便不会过多地改变特征空间(即,尺度空间差),从而不使局部极值位置(其识别关键点/特征)移位。即,因为已知尺度空间差最佳用以实现尺度不变特征,所以应在正规化之后保持尺度空间差的紧密近似。为此,选择经平滑的图像L(x,y,cj+1+hσ)以使得其尺度层级足够平滑,以便使高频内容达到平均。即,如果经平滑的图像L(x,y,cj+1+hσ)充分平,则尺度空间差L(x,y,cj+1σ)-L(x,y,cjσ)的形状很大程度上不改变(即,特征/关键点的位置不改变)。应注意,在一个实施例中,在接近用以获得正经正规化的差分尺度层级的尺度层级的尺度层级(相同尺度层级或次高尺度层级)下选择正规化函数可为优选的,因为此避免引入过多噪声。举例来说,通过挑选比如G(x,y,cj+1σ)的平滑尺度以用于由G(x,y,cj+1σ)和G(x,y,cjσ)界定的差分尺度空间,可保留尺度空间中的那个特定层级的典型局部不规则性。
如先前所提及,在图像中检测到的特征的数目可很大程度上受图像中的倍增亮度尺度改变影响(例如,减小)。由亮度引起的缩放倾向于充当图像上的掩蔽,即使无任何几何变换,所述掩蔽也急剧地减小最终特征空间中的内容。因此,通过应用等式6和等式7而实现的正规化确保在不考虑照明变化的情况下检测到在几何意义上“相等”的特征,借此增加可重复性。
图6说明可获得经正规化的尺度空间差的一个层级的方式的一个实例。此处,图像I(x,y)602可与第一平滑核G(x,y,cjσ)进行卷积以获得第一经平滑的尺度空间图像L(x,y,cjσ)608。图像I(x,y)602还可与第二平滑核G(x,y,cj+1σ)606进行卷积以获得第二经平滑的尺度空间图像L(x,y,cj+1σ)610。可获取第二经平滑的图像610与第一经平滑的图像608之间的差以获得尺度空间层级差Dj(x,y,σ)612。可基于更高的尺度平滑核G(x,y,cj+1+hσ)616或经平滑的尺度空间图像L(x,y,cj+1+hσ)618来正规化(即,根据等式6和/或等式7)此尺度空间层级差Dj(x,y,σ)612,以获得经正规化的尺度空间层级D'j(x,y,σ)614。可通过将具有不同宽度(由缩放因子cjσ设定)的不同平滑核应用于图像I(x,y)来重复此过程,借此构造经平滑的尺度空间金字塔。可通过取得经平滑的尺度空间金字塔(例如,图5中的506)的邻近层级之间的差来构造尺度空间差(例如,图5中的508)。根据等式6和/或等式7可产生经正规化的尺度空间差(例如,图5中的510)。
图7说明用于产生经正规化的尺度空间差以用于抵抗照明的改变的经改善的特征检测的方法。将图像I(x,y)与具有不同缩放宽度(通过不同ciσ设定,其中i=0到n)的平滑核G(x,y,ciσ)进行卷积以获得组成经平滑的尺度空间金字塔的多个经平滑的图像L(x,y,ciσ)(其中i=0到n)702。应注意,图像I(x,y)可由原始图像4)来表示,将图像空间I(x,y)乘以照明缩放函数S(x,y)以获得乘以空间变化照明函数S(x,y)的经缩放的图像空间I0(x,y)。即,图像I(x,y)可由已通过照明函数S(x,y)完全或在逐像素基础上修改了的基础图像I0(x,y)来表征。在一个实例中,平滑核G(x,y,ciσ)可为高斯核,使得经平滑的尺度空间金字塔为高斯尺度空间金字塔。
接下来,通过取得跨越经平滑的尺度空间金字塔的若干邻近对经平滑图像的差L(x,y,cj+1σ)-L(x,y,cjσ)而产生尺度空间差Dj(x,y,σ)(其中j=0到n-1)704。针对多组邻近的经平滑图像重复此过程以获得具有多个层级的尺度空间差。应注意,用以获得第二经平滑图像L(x,y,cj+1σ)的第二平滑核G(x,y,cj+1σ)可比用以获得第一经平滑图像L(x,y,cj+1σ)的第一平滑核G(x,y,cj σ)宽。
可接着通过将每一尺度空间层级差Dj(x,y,σ)除以对应的经平滑的图像L(x,y,cj+1+hσ)而产生经正规化的尺度空间差D'j(x,y,σ)(其中j=0到n-1),其中每一经平滑的图像L(x,y,cj+1+hσ)与图像的两个不同经平滑版本L(x,y,cj+1σ)和L(x,y,cjσ)中的最平滑者一样平滑或比所述最平滑者平滑706。即,正规化经平滑的图像L(x,y,cj+1+hσ)可具有与图像的两个不同经平滑版本L(x,y,cj+1σ)和L(x,y,cjσ)的尺度(例如,平滑核)中的较大者相等或比所述较大者宽的尺度(例如,平滑核)。
经正规化的尺度空间差D'j(x,y,σ)(其中j=0到n-1)可接着用以识别图像I(x,y)的特征708。举例来说,可将局部极值(即,最小值或最大值)识别为关键点,可在所述关键点周围界定特征。可接着基于所识别的特征产生图像I(x,y)的描述符710。
图5、6和7中所说明的方法无需关于图像的照明的先验信息。此方法使得能够选择图像中的稳定特征且增加在跨越不同照明变化的一致层级上的可重复性,而不引入任何较大(大量)计算和处理。即,因为经平滑的尺度空间已包括用以正规化尺度空间差Dj(x,y,σ)的经平滑的图像L(x,y,cj+1+hσ),所以除了除法运算以外,正规化无需额外处理。
另外,通过调适借以选择特征的置信度,可根据检测特征所在的尺度(例如,平滑层级)而获得较多稳定特征。即,较高尺度大体上包括图像的较平滑版本(即,较模糊)且在此些尺度下检测的关键点/特征具有较高置信度。
示范性特征检测实例
图8(包含图8A、8B和8C)说明在使用传统特征检测途径的情况下可如何归因于照明的改变而影响图像的特征检测。图8A说明在大致均匀的照明下在图像中检测到的特征。图8B说明在整个图像内缩放到低层级的均匀照明下在图像中检测到的特征。即,相对于图8A,图8B中的图像归因于照明缩放(例如,图像的暗化)而在整个图像内具有较少检测到的特征。图8C更生动地说明在空间上变化(非均匀)的照明缩放可如何影响特征检测。即,相对于图8A,图8C中的图像沿图像的已受照明缩放(例如,图像的暗化)影响的下半部而具有较少检测到的特征。对于图8,显然,检测到的特征的数目取决于图像中的倍增亮度尺度改变。
图9(包含图9A、9B和9C)说明在不管照明变化的情况下在特征检测之前正规化尺度空间差如何有助于检测特征。图9A说明在尺度空间(在所述尺度空间中检测到特征)的差首先经正规化时在大致均匀的照明下在图像中检测到的特征。图9B说明在尺度空间(在所述尺度空间中检测特征)的差首先经正规化时在整个图像内缩放到低层级的均匀照明下在图像中检测到的特征。由于此正规化,在不管图9B的照明缩放(例如,图像的暗化)的情况下,在图9A和图9B中检测到大致相同的特征密度。图9C说明在不管在空间上变化的照明变化的情况下正规化在其中检测特征的尺度空间的差如何准许稳定或可重复特征检测。由于此正规化,在不管图9C的在空间上变化的照明缩放(例如,图像的下半部的暗化)的情况下,在图9A和图9C中检测到大致相同的特征密度。从图9A、9B和9C可了解,在特征检测之前正规化尺度空间差(例如,高斯空间差)的所揭示技术较大地消除或减少照明变化的影响。
图10(包含图10A和10B)说明高斯尺度空间差与经正规化的高斯尺度空间差之间的比较。图10A说明包含(具有)多个图像(在不同八元组、尺度和缩放宽度下)的高斯尺度空间差,所述图像中的每一者为原始图像的不同经平滑版本。图10A清楚地展示了亮度尺度改变对特征辨识的不利影响。图10B说明与图10A中相同的高斯尺度空间差,所述高斯尺度空间差已根据图5、6和7中所说明的技术而经正规化。图10B展示在不管亮度尺度改变的情况下可清楚地识别的更多特征。
图11(包含图11A和11B)说明尺度空间差的正规化对关键点匹配验证的影响。图11A说明在无尺度空间差(例如,DoG空间)的正规化的情况下测试图像1104中的关键点(受均匀照明缩放影响)如何与数据库图像1102匹配。此处,在测试图像1104与数据库图像1102之间匹配大约144个关键点。图11B说明在具有尺度空间差的正规化(例如,经正规化的DoG空间)的情况下测试图像1106中的关键点(受均匀照明缩放影响)如何与数据库图像1102匹配。正规化导致大约495个关键点匹配,从而与图11A的144个关键点匹配相比实现显著改善。
示范性特征检测装置
图12为说明照明不变特征检测装置的实例的方框图。特征检测装置1200可接收或获得数字查询图像1202。尺度空间产生器1204(例如,高斯尺度空间产生器)可接着将查询图像1202与具有不同尺度宽度的多个不同平滑核1203进行卷积以产生尺度空间。所述尺度空间可包含图像的多个经平滑版本,所述多个经平滑版本经平滑到不同缩放宽度。尺度空间差产生器1206接着从尺度空间产生尺度空间差。尺度空间差正规化器1208接着通过(例如)将每一尺度空间层级差除以对应经平滑的图像来正规化尺度空间差,其中此经平滑的图像具有与用以产生正被除的尺度空度差的经平滑的图像中的较大者一样宽或比所述较大者宽的尺度。关键点产生器1210接着识别或检测经正规化的尺度空间差中的关键点。此操作可(例如)通过寻找经正规化的尺度空间差的像素当中的局部极值(即,最大值或最小值)来进行。特征产生器1212可接着通过(例如)表征所识别的关键点周围的局部像素来产生特征。应注意,可通过特征检测器来执行关键点产生器1210和特征产生器1212的功能。特征描述符产生器1214接着产生每一特征的描述符以提供可用以识别查询图像的多个图像描述符1216。图12中所说明的功能可由单独电路或由一个或一个以上处理器来执行。
示范性图像匹配装置
图13为说明将经正规化的尺度空间差用于特征检测的图像匹配装置的实例的方框图。图像匹配装置1300可包括耦合到通信接口1304的处理电路1302、图像捕获装置1306,和/或存储装置1308。通信接口1304可适于经由有线/无线网络通信且接收图像和/或一个或一个以上图像的特征描述符。图像捕获装置1306可为(例如)可捕获查询图像的数码相机。处理电路1302可包括用以从图像提取特征的图像处理电路1314和使用经提取的特征使查询图像与目标图像的数据库1310匹配和/或使查询图像描述符与描述符数据库1312匹配的图像匹配电路1316。根据一个示范性实施方案,图像匹配应用程序试图使查询图像与图像数据库中的一个或一个以上图像匹配。图像数据库可包括与存储于数据库1310中的一个或一个以上图像相关联的数百万个特征描述符。
图像处理电路1314可包括特征识别电路1320,特征识别电路1320包括高斯尺度空间产生器1322、尺度空间差产生器1324、尺度空间差正规化器1326、关键点检测器1328、特征产生器1330,和/或特征描述符产生器1332。高斯尺度空间产生器1322可用以将图像与模糊函数(例如,平滑核)进行卷积以产生多个不同尺度空间,如(例如)在图2和5中所说明。尺度空间差产生器1324接着从尺度空间产生尺度空间差。尺度空间差正规化器1326接着通过(例如)将每一尺度空间层级差除以对应经平滑的图像来正规化尺度空间差,其中此经平滑的图像比用以产生正被除的尺度空度差的经平滑的图像中的任一者宽(图6中所说明)。关键点产生器1328接着识别或检测经正规化的尺度空间差中的关键点(图9中所说明)。此操作可(例如)通过寻找经正规化的尺度空间差的像素当中的局部极值(即,最大值或最小值)来进行。特征产生器1330可接着通过(例如)表征所识别的关键点周围的局部像素来产生特征(图3中所说明)。特征描述符产生器1332接着产生每一特征的描述符以提供可用以识别查询图像的多个图像描述符(图4中所说明)。
图像匹配电路1316可接着试图基于所述特征描述符使查询图像与图像数据库1310中的图像匹配。可经由通信接口提供匹配结果(例如,提供到发送图像或特征描述符的移动装置)。
应注意,在一些实施方案中,可通过图像匹配装置接收与查询图像的关键点相关联的特征描述符的集合。在此情形下,查询图像已经过处理(以获得描述符)。因此,可绕过图像处理电路1314或从图像匹配装置1300移除图像处理电路1314。
示范性移动装置
图14为说明适于执行图像处理以便实现图像或对象辨识的目的的示范性移动装置的方框图。移动装置1400可包括耦合到图像捕获装置1404的处理电路1402、通信接口1410和存储装置1408。图像捕获装置1404(例如,数码相机)可适于捕获所关注的查询图像1406且将其提供到处理电路1402。处理电路1402可包括图像处理电路1414,图像处理电路1414适于处理所捕获的图像以产生可随后传输或用于图像/对象辨识的特征描述符。举例来说,图像处理电路1414可包括或实施特征识别电路1420,特征识别电路1420包括高斯尺度空间产生器1422、尺度空间差产生器1424、尺度空间差正规化器1426、关键点检测器1428、特征产生器1430,和/或特征描述符产生器1432。高斯尺度空间产生器1422可用以将图像与模糊函数(例如,平滑核)进行卷积以产生多个不同尺度空间,如(例如)在图2和5中所说明。尺度空间差产生器1424接着从尺度空间产生尺度空间差。尺度空间差正规化器1426接着通过(例如)将每一尺度空间层级差除以对应经平滑的图像来正规化尺度空间差,其中此经平滑的图像比用以产生正被除的尺度空度差的经平滑的图像中的任一者宽(图6中所说明)。关键点产生器1428接着识别或检测经正规化的尺度空间差中的关键点(图9中所说明)。此操作可(例如)通过寻找经正规化的尺度空间差的像素当中的局部极值(即,最大值或最小值)来进行。特征产生器1430可接着通过(例如)表征所识别的关键点周围的局部像素来产生特征(图3中所说明)。特征描述符产生器1432接着产生每一特征的描述符以提供可用以识别查询图像的多个图像描述符(图4中所说明)。
处理电路1402可接着将一个或一个以上特征描述符存储于存储装置1408中和/或还可经由通信接口1410(例如,无线通信接口、收发器或电路)经由通信网络1412将特征描述符传输到图像匹配服务器,所述图像匹配服务器使用所述特征描述符来识别图像或其中的对象。即,图像匹配服务器可比较特征描述符与其自身的特征描述符数据库,以确定其数据库中的任何图像是否具有相同特征。
在一个实例中,图像处理电路1414可实施本文中所描述的一种或一种以上方法。根据一示范性实施方案,移动装置可压缩特征描述符以供传输。因为带宽往往是无线传输中的限制因素,所以通过应用本文中所描述的一种或一种以上技术,压缩特征描述符可减小经由移动网络中的无线信道和回程链路传输的数据的量。
用于经正规化的尺度空间中的特征检测的示范性方法
图15说明用于使用经正规化的尺度空间差的特征检测的方法。可产生图像的(高斯)尺度空间,其中所述尺度空间可包含所述图像的不同经模糊(经平滑)版本1502。可通过取得图像的两个不同经平滑版本之间的差(从尺度空间)而产生尺度空间图像差1504。可针对图像的多个其它(例如,邻近)经平滑版本重复此过程以获得多个尺度空间图像差。所述多个尺度空间图像差形成尺度空间差。
可接着通过将尺度空间图像差除以图像的第三经平滑版本而产生经正规化的尺度空间图像(层级)差,其中图像的第三经平滑版本与图像的两个不同经平滑版本中的最平滑者一样平滑或比所述最平滑者平滑1506。举例来说,图像的所述第三经平滑版本可具有与图像的两个不同经平滑版本的尺度(例如,平滑核)中的较大者相等或比所述较大者宽的尺度(例如,平滑核)。可针对多个差尺度空间图像重复此过程以获得多个正规化的尺度空间图像差。所述多个经正规化的尺度空间图像差形成经正规化的尺度空间差。
可通过使用经正规化的尺度空间图像差来检测或识别图像的一个或一个以上特征1508。类似地,可跨越经正规化的尺度空间差来检测额外特征。可接着基于所识别的特征产生图像的描述符1510。
可使用多种不同技艺和技术中的任一者来表示信息和信号。举例来说,可通过电压、电流、电磁波、磁场或磁粒子、光场或光粒子或其任何组合来表示可能在整个以上描述中所引用的数据、指令、命令、信息、信号等。
本文中所描述的各种说明性逻辑块、模块和电路和算法步骤可实施或执行为电子硬件、软件或两者的组合。为了清楚地说明硬件与软件的此互换性,上文已大体上在其功能性方面描述了各种说明性组件、块、模块、电路和步骤。将此功能性实施为硬件还是软件视特定应用和强加于整个***的设计约束而定。应注意,可将配置描述为过程,所述过程被描绘为流程图、流程框图、结构图或方框图。虽然流程图可将操作描述为连续过程,但操作中的许多操作可并行地或同时执行。另外,可重新布置所述操作的次序。当过程的操作完成时,所述过程终止。过程可对应于方法、函数、程序(procedure)、子例程、子程序等。当过程对应于函数时,其终止对应于所述函数返回到调用函数或主函数。
当以硬件实施时,各种实例可使用通用处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列信号(FPGA)或其它可编程逻辑装置、离散门或晶体管逻辑、离散硬件组件,或其经设计以执行本文中所描述的功能的任何合适组合。通用处理器可为微处理器,但在替代方案中,所述处理器可为任何常规处理器、控制器、微控制器或状态机。处理器还可实施为计算装置的组合,例如,DSP与微处理器的组合、多个微处理器、结合DSP核心的一个或一个以上微处理器,或任何其它此类配置。
当以软件实施时,各种实例可使用固件、中间件或微码。可将用以执行必要任务的程序代码或代码片段存储于例如存储媒体或其它存储器等计算机可读媒体中。处理器可执行必要任务。代码片段可表示程序、函数、子程序、程序、例程、子例程、模块、软件包、类,或指令、数据结构或程序语句的任何组合。可通过传递和/或接收信息、数据、自变量、参数或存储器内容而将代码片段耦合到另一代码片段或硬件电路。可经由任何合适手段(包括存储器共享、消息传递、权标传递、网络传输等)来传递、转发或传输信息、自变量、参数、数据等。
如本申请案中所使用,术语“组件”、“模块”、“***”等意欲指代计算机相关实体,所述计算机相关实体为硬件、固件、硬件与软件的组合、软件或执行中的软件。举例来说,组件可为(但不限于)在处理器上执行的进程、处理器、对象、可执行体、执行线程、程序和/或计算机。通过说明的方式,在计算装置上运行的应用程序和计算装置两者均可为组件。一个或一个以上组件可驻留于进程和/或执行线程内,且组件可位于一个计算机上和/或分布于两个或两个以上计算机之间。另外,可从其上存储有各种数据结构的各种计算机可读媒体执行这些组件。所述组件可例如根据具有一个或一个以上数据包的信号(例如,来自一个借助所述信号与在本地***、分布式***中的另一组件和/或跨越例如因特网等网络与其它***交互的组件的数据)通过本地和/或远程进程进行通信。
在本文中的一个或一个以上实例中,所描述的功能可以硬件、软件、固件或其任何组合来实施。如果以软件实施,则可将所述功能作为一个或一个以上指令或代码而存储于计算机可读媒体上或经由计算机可读媒体进行传输。计算机可读媒体包括计算机存储媒体和通信媒体两者,通信媒体包括促进将计算机程序从一处传递到另一处的任何媒体。存储媒体可为可由计算机存取的任何可用媒体。举例来说而非限制,所述计算机可读媒体可包含RAM、ROM、EEPROM、CD-ROM或其它光盘存储装置、磁盘存储装置或其它磁性存储装置,或可用以载运或存储呈指令或数据结构的形式的所要程序代码且可由计算机存取的任何其它媒体。而且,恰当地将任何连接称为计算机可读媒体。举例来说,如果使用同轴电缆、光纤缆线、双绞线、数字订户线(DSL),或例如红外线、无线电和微波的无线技术从网站、服务器或其它远程源传输软件,则同轴电缆、光纤缆线、双绞线、DSL或例如红外线、无线电和微波的无线技术包括于媒体的定义中。如本文中所使用,磁盘和光盘包括压缩光盘(CD)、激光光盘、光学光盘、数字多功能光盘(DVD)、软盘和蓝光(blu-ray)光盘,其中磁盘通常以磁性方式再现数据,而光盘用激光以光学方式再现数据。以上各者的组合也应包括于计算机可读媒体的范围内。软件可包含单一指令或许多指令,且可在若干不同代码片段上、在不同程序中和跨越多个存储媒体而分布。可将示范性存储媒体耦合到处理器,以使得处理器可从存储媒体读取信息和将信息写入到存储媒体。在替代方案中,存储媒体可与处理器成一体。
本文中所揭示的方法包含用于实现所描述方法的一个或一个以上步骤或动作。所述方法步骤和/或动作可在不脱离权利要求书的范围的情况下彼此互换。换句话说,除非正描述的实施例的适当操作需要步骤或动作的特定次序,否则,在不脱离权利要求书的范围的情况下,可修改特定步骤和/或动作的次序和/或使用。
可将各图中所说明的组件、步骤和/或功能中的一者或一者以上重新布置和/或组合为单一组件、步骤或功能或体现于若干组件、步骤或功能中。还可添加额外元件、组件、步骤和/或功能。各图中所说明的设备、装置和/或组件可经配置或调适以执行其它图中所描述的方法、特征或步骤中的一者或一者以上。举例来说,本文中所描述的算法可有效地实施于软件和/或嵌入式硬件中。
应注意,前述配置仅为实例且不应被解释为限制权利要求书。对所述配置的描述意欲为说明性的而不限制权利要求书的范围。因而,本发明的教示可易于应用于其它类型的设备,且所属领域的技术人员将明白许多替代方案、修改和变化。
Claims (28)
1.一种在图像特征检测装置中操作的方法,其包含:
通过取得图像的两个不同经平滑版本之间的差而产生尺度空间图像差;
通过将所述尺度空间图像差除以所述图像的第三经平滑版本而产生经正规化的尺度空间图像差,其中所述图像的所述第三经平滑版本与所述图像的所述两个不同经平滑版本中的最平滑者一样平滑或比所述最平滑者平滑;以及
使用所述经正规化的尺度空间图像差来检测所述图像的一个或一个以上特征。
2.根据权利要求1所述的方法,其进一步包含:
将所述图像与具有不同缩放宽度的多个平滑核进行卷积以获得所述图像的多个经平滑版本,所述多个经平滑版本界定尺度空间金字塔。
3.根据权利要求2所述的方法,其中所述图像的所述两个不同经平滑版本为所述经平滑的尺度空间金字塔中的邻近层级。
4.根据权利要求2所述的方法,其进一步包含:
通过取得所述图像的若干对不同经平滑版本之间的所述差而产生尺度空间差,所述尺度空间图像差形成所述尺度空间差的部分。
5.根据权利要求4所述的方法,其中所述图像的所述若干对不同经平滑版本为所述经平滑的尺度空间金字塔中的邻近层级。
6.根据权利要求2所述的方法,其中所述图像的所述第三经平滑版本具有与所述图像的所述两个不同经平滑版本的尺度中的较大者相等或比所述较大者宽的尺度。
7.根据权利要求1所述的方法,其进一步包含:
通过检测所述经正规化的尺度空间图像差内的局部极值而使用所述经正规化的尺度空间差来识别所述图像的所述一个或一个以上特征。
8.根据权利要求7所述的方法,其中每一特征包括关键点和关于其周围点的信息。
9.根据权利要求1所述的方法,其进一步包含:
基于所述所识别的一个或一个以上特征而产生所述图像的描述符。
10.一种图像特征检测装置,其包含:
尺度空间差产生器,其适于通过取得图像的两个不同经平滑版本之间的差而产生尺度空间图像差;
尺度空间差产生器正规化器,其适于通过将所述尺度空间图像差除以所述图像的第三经平滑版本而产生经正规化的尺度空间图像差,其中所述图像的所述第三经平滑版本与所述图像的所述两个不同经平滑版本中的最平滑者一样平滑或比所述最平滑者平滑;以及
特征检测器,其适于使用所述经正规化的尺度空间图像差来检测所述图像的一个或一个以上特征。
11.根据权利要求10所述的图像特征检测装置,其进一步包含:
尺度空间产生器,其适于将所述图像与具有不同缩放宽度的多个平滑核进行卷积以获得所述图像的多个经平滑版本,所述多个经平滑版本界定尺度空间金字塔。
12.根据权利要求11所述的图像特征检测装置,其中所述图像的所述两个不同经平滑版本为所述经平滑的尺度空间金字塔中的邻近层级。
13.根据权利要求11所述的图像特征检测装置,其中所述尺度空间差产生器适于通过取得所述图像的若干对不同经平滑版本之间的所述差而产生尺度空间差,所述尺度空间图像差形成所述尺度空间差的部分。
14.根据权利要求13所述的图像特征检测装置,其中所述图像的所述若干对不同经平滑版本为所述经平滑的尺度空间金字塔中的邻近层级。
15.根据权利要求11所述的图像特征检测装置,其中所述图像的所述第三经平滑版本具有与所述图像的所述两个不同经平滑版本的尺度中的较大者相等或比所述较大者宽的尺度。
16.根据权利要求10所述的图像特征检测装置,其中所述特征检测器适于通过检测所述经正规化的尺度空间图像差内的局部极值而使用所述经正规化的尺度空间差来识别所述图像的特征。
17.根据权利要求10所述的图像特征检测装置,其进一步包含:
特征描述符产生器,其适于基于所述所识别的一个或一个以上特征而产生所述图像的描述符。
18.一种图像特征检测装置,其包含:
用于通过取得图像的两个不同经平滑版本之间的差而产生尺度空间图像差的装置;
用于通过将所述尺度空间图像差除以所述图像的第三经平滑版本而产生经正规化的尺度空间图像差的装置,其中所述图像的所述第三经平滑版本与所述图像的所述两个不同经平滑版本中的最平滑者一样平滑或比所述最平滑者平滑;以及
用于使用所述经正规化的尺度空间图像差来检测所述图像的一个或一个以上特征的装置。
19.根据权利要求18所述的图像特征检测装置,其进一步包含:
用于将所述图像与具有不同缩放宽度的多个平滑核进行卷积以获得所述图像的多个经平滑版本的装置,所述多个经平滑版本界定尺度空间金字塔。
20.根据权利要求19所述的图像特征检测装置,其进一步包含:
用于通过取得所述图像的若干对不同经平滑版本之间的所述差而产生尺度空间差的装置,所述尺度空间图像差形成所述尺度空间差的部分。
21.根据权利要求20所述的图像特征检测装置,其中所述图像的所述若干对不同经平滑版本为经平滑的尺度空间金字塔中的邻近层级。
22.根据权利要求18所述的图像特征检测装置,其进一步包含:
用于通过检测所述经正规化的尺度空间图像差内的局部极值而使用所述经正规化的尺度空间差来识别所述图像的所述一个或一个以上特征的装置。
23.根据权利要求18所述的图像特征检测装置,其进一步包含:
用于基于所述所识别的一个或一个以上特征而产生所述图像的描述符的装置。
24.一种具有在图像特征检测装置上操作的一个或一个以上指令的处理器可读媒体,所述一个或一个以上指令在由处理器执行时致使所述处理器进行以下操作:
通过取得图像的两个不同经平滑版本之间的差而产生尺度空间图像差;
通过将所述尺度空间图像差除以所述图像的第三经平滑版本而产生经正规化的尺度空间图像差,其中所述图像的所述第三经平滑版本与所述图像的所述两个不同经平滑版本中的最平滑者一样平滑或比所述最平滑者平滑;以及
使用所述经正规化的尺度空间图像差来检测所述图像的一个或一个以上特征。
25.根据权利要求24所述的处理器可读媒体,其具有在由处理器执行时致使所述处理器进一步进行以下操作的一个或一个以上指令:
将所述图像与具有不同缩放宽度的多个平滑核进行卷积以获得所述图像的多个经平滑版本,所述多个经平滑版本界定尺度空间金字塔。
26.根据权利要求25所述的处理器可读媒体,其具有在由处理器执行时致使所述处理器进一步进行以下操作的一个或一个以上指令:
通过取得所述图像的若干对不同经平滑版本之间的所述差而产生尺度空间差,所述尺度空间图像差形成所述尺度空间差的部分。
27.根据权利要求24所述的处理器可读媒体,其具有在由处理器执行时致使所述处理器进一步进行以下操作的一个或一个以上指令:
通过检测所述经正规化的尺度空间图像差内的局部极值而使用所述经正规化的尺度空间差来识别所述图像的所述一个或一个以上特征。
28.根据权利要求24所述的处理器可读媒体,其具有在由处理器执行时致使所述处理器进一步进行以下操作的一个或一个以上指令:
基于所述所识别的一个或一个以上特征而产生所述图像的描述符。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US29343710P | 2010-01-08 | 2010-01-08 | |
US61/293,437 | 2010-01-08 | ||
US12/986,607 US8582889B2 (en) | 2010-01-08 | 2011-01-07 | Scale space normalization technique for improved feature detection in uniform and non-uniform illumination changes |
US12/986,607 | 2011-01-07 | ||
PCT/US2011/020613 WO2011085277A1 (en) | 2010-01-08 | 2011-01-08 | Scale space normalization technique for improved feature detection in uniform and non-uniform illumination changes |
Publications (2)
Publication Number | Publication Date |
---|---|
CN102713938A true CN102713938A (zh) | 2012-10-03 |
CN102713938B CN102713938B (zh) | 2015-05-13 |
Family
ID=44258568
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201180005496.6A Expired - Fee Related CN102713938B (zh) | 2010-01-08 | 2011-01-08 | 用于均匀和非均匀照明变化中的改善的特征检测的尺度空间正规化技术 |
Country Status (8)
Country | Link |
---|---|
US (1) | US8582889B2 (zh) |
EP (1) | EP2521990A1 (zh) |
JP (1) | JP5503018B2 (zh) |
KR (1) | KR101420551B1 (zh) |
CN (1) | CN102713938B (zh) |
BR (1) | BR112012016654A2 (zh) |
TW (1) | TW201142718A (zh) |
WO (1) | WO2011085277A1 (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108269244A (zh) * | 2018-01-24 | 2018-07-10 | 东北大学 | 一种基于深度学习和先验约束的图像去雾*** |
CN108780508A (zh) * | 2016-03-11 | 2018-11-09 | 高通股份有限公司 | 用于归一化图像的***和方法 |
Families Citing this family (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8965130B2 (en) * | 2010-11-09 | 2015-02-24 | Bar-Ilan University | Flexible computer vision |
JP5820236B2 (ja) * | 2011-10-28 | 2015-11-24 | キヤノン株式会社 | 画像処理装置及びその制御方法 |
CN103186762A (zh) * | 2011-12-28 | 2013-07-03 | 天津市亚安科技股份有限公司 | 基于surf特征匹配算法的车牌字符识别方法 |
US9031326B2 (en) * | 2012-02-16 | 2015-05-12 | Sony Corporation | System and method for effectively performing an image categorization procedure |
US9202108B2 (en) * | 2012-04-13 | 2015-12-01 | Nokia Technologies Oy | Methods and apparatuses for facilitating face image analysis |
ITTO20120602A1 (it) * | 2012-07-09 | 2014-01-10 | Sisvel Technology Srl | Method for transforming an image descriptor based on a gradient histogram and relative image processing apparatus. |
JP5651659B2 (ja) * | 2012-08-31 | 2015-01-14 | 株式会社東芝 | 物体検出システムおよびプログラム |
JP5633550B2 (ja) * | 2012-09-05 | 2014-12-03 | カシオ計算機株式会社 | 画像処理装置、画像処理方法及びプログラム |
ITMI20131244A1 (it) * | 2013-07-24 | 2015-01-25 | Telecom Italia Spa | Identificazione di keypoint |
KR102018046B1 (ko) * | 2014-02-24 | 2019-09-04 | 한국전자통신연구원 | 이미지 특징 추출 장치 및 방법 |
US9576218B2 (en) * | 2014-11-04 | 2017-02-21 | Canon Kabushiki Kaisha | Selecting features from image data |
KR102302621B1 (ko) * | 2015-03-09 | 2021-09-16 | 한국전자통신연구원 | 고차 라플라시안 오브 가우시안 커널을 이용한 이미지의 특징점 추출 장치 및 방법 |
US9613273B2 (en) * | 2015-05-19 | 2017-04-04 | Toyota Motor Engineering & Manufacturing North America, Inc. | Apparatus and method for object tracking |
TW201727537A (zh) * | 2016-01-22 | 2017-08-01 | 鴻海精密工業股份有限公司 | 人臉識別系統及人臉識別方法 |
US9977994B2 (en) | 2016-06-30 | 2018-05-22 | Apple Inc. | Configurable histogram-of-oriented gradients (HOG) processor |
US20190205693A1 (en) * | 2017-12-28 | 2019-07-04 | MorphoTrak, LLC | Scale-Invariant Feature Point Extraction in Edge Map |
CN109271905B (zh) * | 2018-09-03 | 2021-11-19 | 东南大学 | 一种基于单帧图像的黑烟车检测方法 |
KR102444544B1 (ko) | 2019-05-24 | 2022-09-19 | 한국전자통신연구원 | 영상의 전처리 방법 및 장치 |
KR102656662B1 (ko) | 2021-07-14 | 2024-04-12 | 한국전자통신연구원 | 리셉티브 필드의 차이 정보를 활용한 딥러닝 기반 키포인트 검출 장치 및 방법 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5784501A (en) * | 1990-05-15 | 1998-07-21 | Canon Kabushiki Kaisha | Image processing method and apparatus |
US20070183680A1 (en) * | 2005-11-15 | 2007-08-09 | Mario Aguilar | Multi-scale image fusion |
CN101329767A (zh) * | 2008-07-11 | 2008-12-24 | 西安交通大学 | 基于学习的视频中显著物体序列自动检测方法 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2004111931A2 (en) * | 2003-06-10 | 2004-12-23 | California Institute Of Technology | A system and method for attentional selection |
US7706603B2 (en) | 2005-04-19 | 2010-04-27 | Siemens Corporation | Fast object detection for augmented reality systems |
JP4459137B2 (ja) | 2005-09-07 | 2010-04-28 | 株式会社東芝 | 画像処理装置及びその方法 |
US8233716B2 (en) * | 2008-06-27 | 2012-07-31 | Palo Alto Research Center Incorporated | System and method for finding stable keypoints in a picture image using localized scale space properties |
US8363973B2 (en) * | 2008-10-01 | 2013-01-29 | Fuji Xerox Co., Ltd. | Descriptor for image corresponding point matching |
US8004576B2 (en) * | 2008-10-31 | 2011-08-23 | Digimarc Corporation | Histogram methods and systems for object recognition |
US20100303354A1 (en) * | 2009-06-01 | 2010-12-02 | Qualcomm Incorporated | Efficient coding of probability distributions for image feature descriptors |
-
2011
- 2011-01-07 US US12/986,607 patent/US8582889B2/en not_active Expired - Fee Related
- 2011-01-08 CN CN201180005496.6A patent/CN102713938B/zh not_active Expired - Fee Related
- 2011-01-08 EP EP11700709A patent/EP2521990A1/en not_active Ceased
- 2011-01-08 WO PCT/US2011/020613 patent/WO2011085277A1/en active Application Filing
- 2011-01-08 JP JP2012548197A patent/JP5503018B2/ja not_active Expired - Fee Related
- 2011-01-08 KR KR1020127020776A patent/KR101420551B1/ko active IP Right Grant
- 2011-01-08 BR BR112012016654A patent/BR112012016654A2/pt not_active IP Right Cessation
- 2011-01-10 TW TW100100837A patent/TW201142718A/zh unknown
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5784501A (en) * | 1990-05-15 | 1998-07-21 | Canon Kabushiki Kaisha | Image processing method and apparatus |
US20070183680A1 (en) * | 2005-11-15 | 2007-08-09 | Mario Aguilar | Multi-scale image fusion |
CN101329767A (zh) * | 2008-07-11 | 2008-12-24 | 西安交通大学 | 基于学习的视频中显著物体序列自动检测方法 |
Non-Patent Citations (1)
Title |
---|
DAVID G.LOWE: "distinctive image features from scale-invariant keypoints", 《INTERNATIONAL JOURNAL OF COMPUTER VISION》 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108780508A (zh) * | 2016-03-11 | 2018-11-09 | 高通股份有限公司 | 用于归一化图像的***和方法 |
CN108269244A (zh) * | 2018-01-24 | 2018-07-10 | 东北大学 | 一种基于深度学习和先验约束的图像去雾*** |
CN108269244B (zh) * | 2018-01-24 | 2021-07-06 | 东北大学 | 一种基于深度学习和先验约束的图像去雾*** |
Also Published As
Publication number | Publication date |
---|---|
KR20120116970A (ko) | 2012-10-23 |
CN102713938B (zh) | 2015-05-13 |
TW201142718A (en) | 2011-12-01 |
BR112012016654A2 (pt) | 2018-05-15 |
KR101420551B1 (ko) | 2014-07-16 |
EP2521990A1 (en) | 2012-11-14 |
JP2013516709A (ja) | 2013-05-13 |
WO2011085277A1 (en) | 2011-07-14 |
US20110170780A1 (en) | 2011-07-14 |
US8582889B2 (en) | 2013-11-12 |
JP5503018B2 (ja) | 2014-05-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102713938A (zh) | 用于均匀和非均匀照明变化中的改善的特征检测的尺度空间正规化技术 | |
US11830230B2 (en) | Living body detection method based on facial recognition, and electronic device and storage medium | |
CN102859535B (zh) | 从预先计算的尺度空间产生Daisy描述符 | |
Garcia et al. | Face-spoofing 2D-detection based on Moiré-pattern analysis | |
US8705876B2 (en) | Improving performance of image recognition algorithms by pruning features, image scaling, and spatially constrained feature matching | |
CN107967482A (zh) | 图标识别方法及装置 | |
CN103210401B (zh) | 用以改进对象辨识中的特征产生的***和方法 | |
CN108288012B (zh) | 一种基于手机实现的艺术品备案验证方法及其*** | |
US9058655B2 (en) | Region of interest based image registration | |
CN106548160A (zh) | 一种人脸微笑检测方法 | |
CN107945111B (zh) | 一种基于surf特征提取结合cs-lbp描述符的图像拼接方法 | |
CN108780507A (zh) | 用于提供图像分类器的***和方法 | |
CN102782708A (zh) | 用于图像辨识的描述符小块的快速子空间投影 | |
GB2431793A (en) | Image comparison | |
CN105427333B (zh) | 视频序列图像的实时配准方法、***及拍摄终端 | |
CN103353881B (zh) | 一种应用程序搜索方法及装置 | |
CN109413411B (zh) | 一种监控线路的黑屏识别方法、装置及服务器 | |
JP2012103758A (ja) | 局所特徴量算出装置及び方法、並びに対応点探索装置及び方法 | |
Mi et al. | Research on a Fast Human‐Detection Algorithm for Unmanned Surveillance Area in Bulk Ports | |
CN108960285B (zh) | 一种分类模型生成方法、舌体图像分类方法及装置 | |
Zhou et al. | Maximum Entropy Threshold Segmentation for Target Matching Using Speeded‐Up Robust Features | |
Jiao et al. | Individual Building Rooftop and Tree Crown Segmentation from High‐Resolution Urban Aerial Optical Images | |
CN112396551A (zh) | 一种水印嵌入方法及装置 | |
Yang et al. | Image copy–move forgery detection based on sped-up robust features descriptor and adaptive minimal–maximal suppression | |
CN116824183B (zh) | 基于多重特征描述符的图像特征匹配方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20150513 Termination date: 20220108 |