CN109784353A - 一种无向图匹配的方法、设备和存储介质 - Google Patents
一种无向图匹配的方法、设备和存储介质 Download PDFInfo
- Publication number
- CN109784353A CN109784353A CN201711124245.5A CN201711124245A CN109784353A CN 109784353 A CN109784353 A CN 109784353A CN 201711124245 A CN201711124245 A CN 201711124245A CN 109784353 A CN109784353 A CN 109784353A
- Authority
- CN
- China
- Prior art keywords
- lattice
- undirected graph
- matching
- graph
- undirected
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 41
- 239000011159 matrix material Substances 0.000 claims abstract description 22
- 238000004422 calculation algorithm Methods 0.000 claims description 51
- 230000006870 function Effects 0.000 claims description 13
- 230000015654 memory Effects 0.000 claims description 8
- 239000000203 mixture Substances 0.000 claims description 5
- 238000007781 pre-processing Methods 0.000 claims description 5
- 238000004458 analytical method Methods 0.000 claims description 4
- 238000012545 processing Methods 0.000 description 13
- PASHVRUKOFIRIK-UHFFFAOYSA-L calcium sulfate dihydrate Chemical compound O.O.[Ca+2].[O-]S([O-])(=O)=O PASHVRUKOFIRIK-UHFFFAOYSA-L 0.000 description 9
- 238000010586 diagram Methods 0.000 description 8
- 230000009466 transformation Effects 0.000 description 7
- 230000008569 process Effects 0.000 description 6
- 239000013598 vector Substances 0.000 description 5
- 238000004590 computer program Methods 0.000 description 4
- 230000002123 temporal effect Effects 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 238000005034 decoration Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000003252 repetitive effect Effects 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 239000004576 sand Substances 0.000 description 2
- 230000003595 spectral effect Effects 0.000 description 2
- PXFBZOLANLWPMH-UHFFFAOYSA-N 16-Epiaffinine Natural products C1C(C2=CC=CC=C2N2)=C2C(=O)CC2C(=CC)CN(C)C1C2CO PXFBZOLANLWPMH-UHFFFAOYSA-N 0.000 description 1
- 206010028980 Neoplasm Diseases 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000013178 mathematical model Methods 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 238000005295 random walk Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000029058 respiratory gaseous exchange Effects 0.000 description 1
- 235000013322 soy milk Nutrition 0.000 description 1
- 238000009827 uniform distribution Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T11/00—2D [Two Dimensional] image generation
- G06T11/20—Drawing from basic elements, e.g. lines or circles
- G06T11/206—Drawing of charts or graphs
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T1/00—General purpose image data processing
- G06T1/20—Processor architectures; Processor configuration, e.g. pipelining
Landscapes
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Image Analysis (AREA)
Abstract
本申请涉及一种计算机实施的将无向图进行匹配的方法,包括:接收第一无向图和第二无向图;获得分别与第一无向图和第二无向图对应的第一点阵和第二点阵;以及对第一点阵和第二点阵进行匹配。通过所述通信方法,可以将无向图的匹配问题转化为点阵之间的匹配问题,从而降低求解的复杂度,并提高匹配的精度。
Description
技术领域
本申请涉及模式识别和计算机视觉领域,具体而言,本申请涉及一种用于处理无向图的匹配问题的方法和设备。
背景技术
在由多个点构成的图中,点之间的边没有方向的图被称为无向图。在实际应用中,无向图模型是一种广泛采用的数学模型,它可以用来表达各种关系和过程。一般说来,多个无向图的匹配可以用于图像拼接、物体的位置和姿态估计等问题。无向图的匹配的效率和精度,在很大程度上将会影响这些问题的处理结果。
特别的,在图像拼接中的某些应用场景下,一些传统的图匹配算法将会失效。例如,如图1中所示的场景,其中的图像主要是重复的纹理,以及如图2中所示的场景,其中的图像缺乏灰度的变化;在类似于图1和图2的应用场景下,基于点的局部特征(例如SIFT(Scale-invariant feature transform,尺度不变特征变换)特征)的图匹配算法豆浆失效。此时,必须使用基于点之间结构信息的图匹配算法。
二次指派问题是运筹学中的一种模型,对该问题的求解属于NP难问题。对无向图的匹配问题,现有技术的一种主要处理方式是将该问题表达成一个二次指派问题,然后求该问题的近似解。具体而言,可以将无向图视为一个图模型G,其包含节点V和边E,其中,边E是没有方向的。一个无向图的点V和边E分别有相应的特征F和W。对两个无向图进行匹配其实就是要将这两个无向图的点和边的特征进行匹配。二次指派问题就是要对某个目标函数进行优化,从而使得两个无向图之间点和边之间相互匹配的特征的相似性达到最大化。
由于对二次指派问题的求解属于NP难问题,因此一般而言,没有算法可以在多项式时间内找到相应的目标函数的最优解。在实践中,现有的算法主要在于对该问题进行近似求解,然而,这些现有算法所获得的匹配精度比较低,并且时间复杂度较高。尤其是当形变较大、受噪声或外点污染、或者无向图模型的规模较大时的匹配的情况下,现有的算法难以处理对目标函数的近似最优解的求解。
发明内容
本申请的目的旨在至少解决上述技术缺陷之一,通过采用图模型来刻画结构信息。然后匹配两个图模型,找出两幅图像中的对应关系,进而实现图像的拼接。特别地,可以通过利用一个点阵来表达无向图,其中无向图的特征通过点阵的特征来表达。通过这种方法,可以将无向图的匹配问题转换成为点阵的匹配问题,从而不需要对上述的二次指派问题进行求解,因此降低了计算匹配的复杂度并提高了处理的精度。
根据本申请的一方面,提供了一种计算机实施的将无向图进行匹配的方法,包括:接收第一无向图和第二无向图;获得分别与第一无向图和第二无向图对应的第一点阵和第二点阵;以及对第一点阵和第二点阵进行匹配。
根据本申请的另一方面,提供了一种将无向图进行匹配的计算机***,包括:处理器;以及存储器,其上存储有可由所述处理器执行的指令,当所述指令由所述处理器执行时,使得所述处理器执行如下步骤:接收第一无向图和第二无向图;获得分别与第一无向图和第二无向图对应的第一点阵和第二点阵;以及对第一点阵和第二点阵进行匹配。
根据本申请的另一方面,提供了一种机器可读的存储介质,其上存储有可由所述机器执行的指令,当所述指令由所述机器执行时,使得所述机器执行如下步骤:接收第一无向图和第二无向图;获得分别与第一无向图和第二无向图对应的第一点阵和第二点阵;以及对第一点阵和第二点阵进行匹配。
通过本申请提出的将无向图进行匹配的方法、设备及存储介质,能够有效地解决对无向图进行匹配的问题,降低处理的复杂度并提高匹配的精度。
附图说明
从以下结合附图的描述中,本公开的某些实施例的上述和其它方面、特征和优点将更加明显,在附图中:
图1是示出根据实际应用场景中具备重复纹理的图像的示意图;
图2是示出根据实际应用场景中缺乏灰度变化的图像的示意图;
图3是根据本申请的一些实施例的进行无向图匹配的算法的框架的示意图;
图4是根据本申请的一些实施例的一种应用无向图匹配的场景的示意图;
图5是根据本申请的一些实施例的一种应用无向图匹配的场景的示意图;
图6示出了已有的图匹配算法对于通用的公开数据集CMU house和CMU hotel的匹配结果的曲线图;以及
图7示出了已有的图匹配算法对于通用的公开数据集Pascal 2007的匹配结果的柱状图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能解释为对本发明的限制。
贯穿本说明书对“一个实施例”、“本实施例”和类似短语的引用意味着结合该实施例描述的特定特征、结构或特性包括在一个或多个实施例中的至少一个中。因此,在整个说明书中,这些短语在各个地方的出现不一定都是指代相同的实施例。此外,特定特征、结构或特性可以以任何合适的方式在一个或多个实施例中组合。
本技术领域技术人员可以理解,除非特意声明,否则这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是,本发明的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。此外,这里使用的“连接”或“耦接”可以包括无线连接或无线耦接。这里使用的措辞“和/或”包括一个或更多个相关联的列出项的全部或任一单元和全部组合。
尽管将使用诸如“第一”、“第二”等的序数来描述各种部件,但是这些部件在本文不受限制。这些术语仅用于将一个部件与另一个部件区分开。例如,第一部件可以被称为第二部件,并且同样地,第二部件也可以被称为第一部件而没有背离创造性构思的教导。
图3中示出了本申请所提出的算法的整体框架。应当注意,该图仅为示例,并不意图限制本发明所请求保护的范围。
如图3所示,在该算法流程中,存在如下一些步骤:
首先,通过非度量的多维缩放将模板无向图和场景无向图表达为由对应的无向图导出的点阵;
随后,将得到的点阵旋转或反转,从而得到多个模板点阵和场景点阵,对于得到的模板点阵和场景点阵,分别抽取其局部特征;
基于抽取得到的局部特征、以及模板点阵和场景点阵的全局结构,通过保持全局和局部结构的点匹配算法来匹配由模板无向图和场景无向图分别导出的点阵。由于之前通过多个旋转或翻转产生了多个模板点阵,因此需要进行多次匹配,并得到多个匹配结果;
在所得到的多个匹配结果中,选择最佳的匹配结果作为最终结果。
在整个算法流程中,值得注意的是,在匹配不同的模板点阵和场景点阵时,可以通过采用并行计算的方式,从而极大地缩短了计算时间。
以下,将详细描述本申请所提出的算法。
这里,假定模板型无向图(简称模板图)的构成为其中节点的集合为,边的集合为。对于每一个节点或者边,分别存在一个对应的特征或者。对于本申请的算法,这里的特征可以存在采取多种定义,例如对于点而言,其特征可以例如为形状上下文;对于边而言,其特征可以例如为边的长度。与上述类似地,需要与上述模板型无向图相匹配的无向图为场景型无向图(简称场景图)Gs={Vs,Es,Fs,Ws},该场景型无向图中存在N个节点。这里,假定模板型无向图的节点数M小于场景型无向图的节点数N,即M≤N。当将场景型无向图与模板型无向图相匹配时,作为一种常见的处理方法,将N-M个虚拟点加入模板型无向图的节点集合Gt中,从而使得模板型无向图和场景型无向图的节点的个数保持一致,以便在进行无向图的匹配算法时提高对于外点的鲁棒性(robustness)。
这里,场景图模型中所谓的外点,就是指这个点在模板图中没有对应的点。这样的点会使图匹配算法不稳定,匹配精度下降。由于对于原始的模板型无向图和场景型无向图,并非所有的节点都存在相应的边,因此,在将该N-M个虚拟点加入模板型无向图的节点集合Gt时,不需考虑是否要加入与这些虚拟点相对应的边。
无向图的匹配算法旨在找到模板型无向图的节点集合Gt与场景型无向图的节点集合Gs之间的对应关系,并且相互匹配的特征之间的不相似程度最低。一般而言,无向图的匹配算法所得到的点与点之间是一一对应的;在匹配之后,将无向图的匹配算法优化为如下的二次指派问题:
s.t.1TX=1T,X1=1,X∈{01}N×N, (1)
其中,x是矩阵X的列向量拼接得到的向量,Xij=1表示模板图中的第i个节点与场景图中的第j个节点相匹配。1表示一个所有元素都是1的列向量。Kij;kl是在矩阵K的第((i-1)N+j)行第((k-1)N+l)列的元素,其表达了特征和之间的不相似程度。通常,Kij;kl是一个介于0和1之间的值,根据所采取的特征不同,Kij;kl可取的值的形式也有所区别。例如,Kij;kl可以是离散的值,比如0或1,或者Kij;kl可取的值是一个在0和1之间连续的空间。Kij;ij是节点i的特征和节点j的特征之间的不相似程度。s.t.表示所列出的问题需要满足其后所列的条件。
在目前来看,对于问题(1)的求解仍然是一个NP难的问题,因为在一般情况下,该问题的目标函数是不能高效求解的,并且该约束条件是组合式的。为了避免对问题(1)直接求解,这里提出一种从新的角度来处理无向图匹配问题的方法。
这里,以模板图Gt为例,描述将Gt转换为一个由该模板图导出的点阵(GIPS)的方法。
与Gt对应的GIPS被定义为其中,是一个点集,对于点阵中的每一个点,其对应于模板图中的一个节点。同时,节点的特征与点相关联,这里,与相对应。
点阵中的边的特征表达为点和之间的距离。是通过非度量多维尺度分析(NMDS)计算得到的关于图Gt的一个坐标化表达。NMDS尤其适用于无向图,因为它对数据的假设很弱,因而可适用的范围较广,并且,NMDS可以允许使用任何方法来度量节点之间的不相似性。
具体而言,NMDS首先随机生成一个点阵,然后对该点阵进行迭代处理。每次迭代操作包含如下三个步骤:
首先,计算点阵中任意两点和之间的距离;,其中点和分别与无向图中的节点和相对应;然后,用一个不包含参数的单调函数r(·),将模板图的两个节点和之间的边的特征向点阵中与该两个节点对应的点和之间的距离做回归。这里,函数r(·)是通过使得最小化而获得的;
在第三步中,更新点的坐标来使得如公式(2)中所示的克鲁斯卡压力1(Kruskal's Stress1)最小化,
如果克鲁斯卡压力Stress1已经收敛,则NMDS输出点阵。否则,对所得到的新的点阵重新执行上述迭代操作。
在克鲁斯卡压力Stress1收敛之后,使得模板图的边的特征之间的顺序关系以及点阵中的点的距离之间的顺序关系,二者之间的相关性达到最大化。通过这种处理方式,将无向图的结构信息表达为点阵的结构。
结果,点阵表达了图Gt的节点和边的特征。类似地,可以用点阵Is来表示场景图Gs。
将两个点阵GIPS相匹配
给定分别与模板图Gt和场景图Gs对应的两个点阵GIPS,其中,与模板图Gt对应的模板点阵,与场景图Gs对应的场景点阵,通过图像配准算法PR-GLS(Point set Registration by preserving Global and Local Structures,保留全局和局部结构的点集登记)来将这两个点阵进行匹配。PR-GLS算法特别适合用于将多个点阵GIPS进行匹配,因为它充分利用了点集的结构信息和局部特征V。
点阵的全局结构
模板点阵的全局结构通过一个高斯混合模型来表示。在这个高斯混合模型中,每个高斯分量的中心是,其中是一个形变。以此为基础,场景点阵被视为是从这个高斯混合模型中抽样得到的。
具体而言,假设在这个混合高斯模型中的所有高斯分量都有相等且各向同性的协方差σ2I,则通过采样获得某个场景点阵的概率为:
其中,集合是所有需要优化的参数,N是模板点阵中点的总数。这里,γ是外点的百分比。假设外点的分布为均匀分布,并且概率密度函数为。||·||表示的是矩阵的弗罗贝尼乌斯范数(Frobenius norm)。这里,公式(3)描述的是我们从现有的模型中获得的概率,其中,右侧第一项描述的概率是中的点是外点的概率,且右侧第二项是从高斯混合模型中采样得到的概率,其中πmn是属于某个高斯分量的成员概率,其满足。
点阵的局部特征
局部特征决定了公式(3)中的成员概率πmn。
具体而言,假定矩阵A为两个点阵和的局部特征的不相似矩阵,其中第i行第j列的元素Amn是特征和之间的不相似程度。基于矩阵A,可以通过求解一个指派问题来将点阵和相匹配,
其中表示模板点阵中的点与场景点阵中的点匹配。指派问题可以通过匈牙利算法在时间复杂度的级别为O(N3)内求得全局最优解。
给定了匹配后,根据下式设定成员概率:
其中,,的值可以由用户设置,并且该值反映了用户对匹配结果的信心。例如,如果用户认为公式(5)的匹配结果较为准确,则可以将的值设定为接近于1,否则可以将的值设定为接近于0。特别的,如果一个场景点阵中的点与一个模板点阵中的点相匹配,则设定
形变和匹配
现在已经在似然函数(3)中刻画了全局结构信息和局部特征。在此基础上,PR-GLS算法使用一个关于参数θ的先验概率使得所求得的形变更加平滑。
具体而言,关于形变的先验概率密度函数
这里,λ是一个正数,例如,我们可以将其设置为3。φ是一个关于的正则化函数,其形式为,其中是一个向量的reproducing kernel Hilbert空间。该空间由一个对角高斯矩阵核函数定义,其中β是高斯核函数的标准差,例如,我们可以将其设置为2。
联合公式(6)和(3),使得负对数后验概率最小化,因此θ的最大后验概率MAP解是:
其中假设采样的点是相互独立的。该问题通过期望条件最大化(ExpectationConditional Maximization,简称ECM)方法来求解。可以证明,关于形变的最优解有如下形式:
其中cn是矩阵C的第n个列向量。矩阵C由下式决定,
其中Г的第i行第j列是Гij,g(·)是取输入矩阵的对角元素形成新的对角矩阵。是后验概率矩阵,其第i行第j列的元素是
到目前为止,PR-GLS算法可以估计出能够最佳地将点阵和配准的形变,并能计算在公式(10)中定义的后验概率。
点阵之间匹配的形式
如果后验概率较高,则点阵和中相应的两个点和相互匹配。因此,多个场景点可以匹配到同一个模板点,反之亦然。可以让点阵到点阵直接的匹配是多对一的,也可以是多对多的。
同时,可以通过对指派问题进行求解,从而使得点阵到点阵之间的匹配是一对一的。为了实现这一目标,可以采用点的特征“形状上下文”作为局部特征来描述形变后的点阵和场景点阵。通过利用测试统计(test statistic)来计算不相似矩阵S,其元素smn是关于点和的形状上下文之间的不相似性。则点阵到的一对一的对应关系可以通过将如下指派问题最小化而得到,
s.t.1TM=1T,M1=1,M∈{0,1}N×N, (11)
其中Mmn=1表示点和点匹配。相应的,如果Mmn=1,则点和相匹配。
算法的并行处理
联合公式(3)和(6),可以看到问题(11)的解依赖于点阵和之间的初始对齐状态。点阵的初始对齐状态由和的坐标决定。然而,和的坐标可能旋转或翻转,如算法(1)所示。
为了取得更高的匹配准确率,对于多个模板点阵,可以对多个相应的PR-GLS算法并行处理,其中每个算法都有不同的初始对其状态,并产生不同的匹配结果。具体而言,对于模板点阵GIPS,,对于翻转后的点阵首先求解。然后,按照如下公式旋转和:
其中是均匀分布在[0,360)之间的角度。由此,总共得到了2h个点阵。对每一个点阵,对点阵GIPS进行匹配,其中和,并得到一个匹配结果Mi。总共,得到2h个匹配结果。然后,选择其中最好的匹配结果M*为
值得注意的是,对多个点阵GIPS进行匹配的过程可以并行计算,从而节省大量时间。
算法时间复杂度
上述算法的时间复杂度是O(N3),其中,N是场景图中节点的个数。具体而言,NMDS通过O(N3)的时间复杂度将一个无向图转化为一个点阵。然后,PR-GLS算法用O(N3)的时间复杂度来将两个点阵GIPS匹配。给定一对无向图,PR-GLS算法运行2h次来获得最佳的匹配精度,其中,h控制了精度和效率之间的平衡。PR-GLS算法的多个副本可以并行运行。
作为对比,传统的无向图匹配算法的运行时间通常是O(N4),因为他们需要计算在公式(1)中的N2×N2矩阵K。因此,与之前的传统算法相比,本申请所提出的算法的时间复杂度是较低的。
以下,本申请将提供算法所应用的几种场景,便于对该算法进行进一步的理解。
场景一
图像拼接是将多张有重叠部分的图像拼接成一幅图像的技术。图像拼接可以用于拼接遥感图像、制作地图,或用于天文空间图像、拼接全景图,是全景影像创作中采用的重要技术手段。它还可以用于比对医疗用图像,对于同一患者在不同时间获取的图像(检测身体的变化或监测肿瘤),可以进行图像拼接以处理由于呼吸、解剖学上的变化等而产生的变形。它可以实时地执行、运行在诸如相机和手机摄像头等的嵌入式设备中的许多不同的技术。
一般而言,图像拼接技术包含五个步骤:1.图像预处理,其中包括通过数字图像处理的基本操作(如去噪、边缘提取、直方图处理等),建立图像的匹配模板以及对图像进行某种变换等操作;2.图像配准,其中采用一定的配准策略,找出待拼接图像中的模板或特征点在参考图像中对应的位置,进而确定两幅图像之间直接的变换关系;3.建立变换模型,其中根据模板或者图像特征之间的对应关系,计算出变换模型中的各参数值;4.统一坐标变换,其中根据被建立的变换模型将待拼接的图像转换到参考图像的坐标系中;5.融合重构,其中将待拼接图像的重合区域融合,从而得到拼接重构的平滑无缝全景图像。
之前提出的算法主要应用于上述的第1步骤和第2步骤。在这两个步骤中,目标是找出两幅图像I1和I2之间的对应关系,如图4所示。具体而言,在第1步骤中,首先使用SIFT、LBP等算法找出图像中的关键点坐标,并描述关键点的局部特征。然后,根据关键点之间的空间位置关系,如距离、角度等,建立关键点与关键点之间的对应关系。这时,可以通过一个图模型来表达一幅图像。该图模型的节点表示图像中的关键点,且该图模型的边表示关键点之间的关系。在第2步中,假设用图模型G1表示图像I1,用图模型G2表示图I2,那么,图像I1和I2的配准可以通过匹配图模型G1和G2而得到。然后,基于之前提出的方法所给出的配准关系,可以进一步完成图像拼接的其余步骤。
通过上述方法,可以有效地匹配两个不同的图片,取得很高的匹配精度。
场景二
物体的位姿估计,是指对图像中物体的位置和姿态进行估计。位姿估计可以用于自动驾驶、场景理解等多种任务。例如,在自动驾驶时,可以通过分析人体、车辆的朝向和速度来判断是否存在潜在的危险。具体步骤上,物体的位姿估计可以分为如下三个步骤:第1步,建立姿态库,首先产生待分析的物体可能的姿态图像库;第2步,建立预处理姿态库,对姿态库中的图像,通过采用数字图像处理的基本操作(如去噪、边缘提取、直方图处理等),建立图像的匹配模板以及对图像进行某种变换等操作;第3步,预处理待分析的图像,这里所采取的预处理的方法类似第2步中的方法;第4步,将待分析的图像和姿态库中的图像进行匹配;第5步,根据匹配的结果,找出姿态库中与待分析的图像配准度最高的姿态图像。
本申请所提出的方法主要用于上述过程的第2步至第4步,并为第5步提供决策的信息。在第2步和第3步中,首先使用SIFT、LBP等算法找出图像中的关键点坐标,并描述关键点的局部特征。然后,根据关键点之间空间位置关系,如距离、角度等,建立关键点与关键点之间的关系。这时,可以通过一个图模型来表达一幅图像,其中,图模型的节点表示图像中的关键点,图模型的边表示关键点之间的关系。在第4步中,假设用图模型G1表示图像I1,用G2表示图I2,那么,图像I1和I2的对应关系可以通过将图模型G1和G2进行匹配而得到。如图5所示,假如I1是姿态库图像,其中物体的位置和姿态已知,则可以通过I1和I2的对应关系来估计物体在I2中的位置和姿态。在第5步中,可以通过分析当前匹配程度的高低来判断待分析的图像中的物体姿态更接近于哪一个模板库中的姿态。
本申请的技术效果
在通用的公开数据集CMU house和CMU hotel上,需要匹配的图存在一定程度的形变。CMU house和CMU hotel序列图像是目前用于测试基于图像的学习算法最为流行的实验数据,两个序列图像分别由111和110幅图像组成,每幅图具有30个标记的特征点。在下表中,示出了本申请的方法的精度为:
然而,目前已知的其它最好的图匹配算法(因式分解图匹配(FGM),重权重随机游走匹配(RRWM),谱匹配(SM),整数投影稳定点-均匀初始解(IPFP-U),整数投影稳定点-普匹配初始解(IPFP-S),谱匹配与仿射约束(SMAC),二值约束保留图匹配(BPGM))取得的精度如图6所示:
其中,横轴表示图模型的形变程度,纵轴表示不同方法的精度。对于最困难的形变,本申请的算法正确匹配了所有图的节点,而其它算法的最佳精度低于80%。
在通用的公开数据集Pascal 2007上,需要匹配的图包含一定量的外点。本申请的算法的精度为:
而目前最好的其它图匹配算法取得的精度如图7所示:
其中,横轴表示外点的数量,纵轴表示不同方法的精度。由此可见,本申请的算法极大地提高了匹配精度。
本技术领域技术人员可以理解,本发明包括涉及用于执行本申请中所述操作中的一项或多项的设备。这些设备可以为所需的目的而专门设计和制造,或者也可以包括通用计算机中的已知设备。这些设备具有存储在其内的计算机程序,这些计算机程序选择性地激活或重构。这样的计算机程序可以被存储在设备(例如,计算机)可读介质中或者存储在适于存储电子指令并分别耦联到总线的任何类型的介质中,所述计算机可读介质包括但不限于任何类型的盘(包括软盘、硬盘、光盘、CD-ROM、和磁光盘)、ROM(Read-Only Memory,只读存储器)、RAM(Random Access Memory,随即存储器)、EPROM(Erasable ProgrammableRead-Only Memory,可擦写可编程只读存储器)、EEPROM(Electrically ErasableProgrammable Read-Only Memory,电可擦可编程只读存储器)、闪存、磁性卡片或光线卡片。也就是,可读介质包括由设备(例如,计算机)以能够读的形式存储或传输信息的任何介质。
本技术领域技术人员可以理解,可以用计算机程序指令来实现这些结构图和/或框图和/或流图中的每个框以及这些结构图和/或框图和/或流图中的框的组合。本技术领域技术人员可以理解,可以将这些计算机程序指令提供给通用计算机、专业计算机或其他可编程数据处理方法的处理器来实现,从而通过计算机或其他可编程数据处理方法的处理器来执行本发明公开的结构图和/或框图和/或流图的框或多个框中指定的方案。
本技术领域技术人员可以理解,本发明中已经讨论过的各种操作、方法、流程中的步骤、措施、方案可以被交替、更改、组合或删除。进一步地,具有本发明中已经讨论过的各种操作、方法、流程中的其他步骤、措施、方案也可以被交替、更改、重排、分解、组合或删除。进一步地,现有技术中的具有与本发明中公开的各种操作、方法、流程中的步骤、措施、方案也可以被交替、更改、重排、分解、组合或删除。
以上所述仅是本发明的部分实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
Claims (12)
1.一种将无向图进行匹配的方法,包括:
接收第一无向图和第二无向图;
获得分别与第一无向图和第二无向图对应的第一点阵和第二点阵;以及对第一点阵和第二点阵进行匹配。
2.如权利要求1所述的方法,其中获得分别与第一无向图和第二无向图对应的第一点阵和第二点阵包括:
对每一个无向图,利用非度量多维尺度分析来生成对应的点阵。
3.如权利要求2所述的方法,其中,所述利用非度量多维尺度分析来生成对应的点阵包括如下步骤:
对无向图Gt={Vt,Et,F1 t,Wt},随机生成一个点阵
其中,对于无向图Gt,节点的集合为边的集合为F1 t、分别是无向图Gt和点阵It的节点特征的集合,Wt是边的特征的集合,对于每一个节点或者边分别存在一个对应的特征fi t∈F1 t或者 是一个点集,对于点阵中的每一个点其对应于无向图中的一个节点同时,节点的特征fi t∈F1 t与点相关联;
重复执行如下步骤,直到克鲁斯卡压力收敛,其中表示点阵的节点和之间的距离:
计算点阵中任意两点和之间的距离其中点和分别与无向图中的节点和相对应;
利用单调函数,将无向图的两个节点和之间的边的特征向点阵中与该两个节点对应的点之间的距离做回归;
更新点的坐标使得克鲁斯卡压力最小化;
输出点阵
4.如权利要求1-3任一项所述的方法,其中对第一点阵和第二点阵进行匹配包括:
利用图像配准算法PR-GLS来将第一点阵和第二点阵匹配。
5.如权利要求4所述的方法,其中,对第一点阵和第二点阵中的每一个,通过高斯混合模型来表示点阵的全局结构。
6.如权利要求4所述的方法,其中,基于第一点阵和第二点阵之间的不相似矩阵,通过求解指派问题将第一点阵和第二点阵匹配。
7.如权利要求6所述的方法,其中,第一点阵和第二点阵之间点的匹配是一对一的、多对一的或多对多的。
8.一种将无向图进行匹配的计算机***,包括:
处理器;以及
存储器,其上存储有可由所述处理器执行的指令,当所述指令由所述处理器执行时,使得所述处理器执行如下步骤:
接收第一无向图和第二无向图;
获得分别与第一无向图和第二无向图对应的第一点阵和第二点阵;以及
对第一点阵和第二点阵进行匹配。
9.如权利要求8所述的计算机***,其中所述存储器还包括指令,当所述指令由所述处理器执行时,使得:
对每一个无向图,利用非度量多维尺度分析来生成对应的点阵。
10.一种机器可读的存储介质,其上存储有可由所述机器执行的指令,当所述指令由所述机器执行时,使得所述机器执行如下步骤:
接收第一无向图和第二无向图;
获得分别与第一无向图和第二无向图对应的第一点阵和第二点阵;以及
对第一点阵和第二点阵进行匹配。
11.一种图像拼接方法,其特征在于,包括:
根据权利要求1至7任一项的方法,对待拼接的图像进行图像预处理和/或图像配准;
对待拼接的图像进行拼接。
12.一种对象估计方法,其特征在于,包括:
接收待处理的图像;
根据权利要求1至7任一项的方法,对图像中的对象进行位置估计和/或姿态估计。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711124245.5A CN109784353A (zh) | 2017-11-14 | 2017-11-14 | 一种无向图匹配的方法、设备和存储介质 |
KR1020180091157A KR102631980B1 (ko) | 2017-11-14 | 2018-08-06 | 복수의 무방향 그래프들 처리 방법 및 장치 |
US16/191,102 US10991120B2 (en) | 2017-11-14 | 2018-11-14 | Method and apparatus for processing a plurality of undirected graphs |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711124245.5A CN109784353A (zh) | 2017-11-14 | 2017-11-14 | 一种无向图匹配的方法、设备和存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109784353A true CN109784353A (zh) | 2019-05-21 |
Family
ID=66494149
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201711124245.5A Pending CN109784353A (zh) | 2017-11-14 | 2017-11-14 | 一种无向图匹配的方法、设备和存储介质 |
Country Status (2)
Country | Link |
---|---|
KR (1) | KR102631980B1 (zh) |
CN (1) | CN109784353A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110766061A (zh) * | 2019-10-15 | 2020-02-07 | 武汉中海庭数据技术有限公司 | 一种道路场景匹配方法及装置 |
CN111461196A (zh) * | 2020-03-27 | 2020-07-28 | 上海大学 | 基于结构特征的快速鲁棒图像识别跟踪方法和装置 |
CN112966138A (zh) * | 2021-02-22 | 2021-06-15 | 济南大学 | 一种基于轮廓特征点匹配的二维形状检索方法及*** |
CN116310417A (zh) * | 2023-03-10 | 2023-06-23 | 济南大学 | 一种基于形状上下文信息的近似图匹配方法及*** |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20070165949A1 (en) * | 2006-01-17 | 2007-07-19 | Ali Kemal Sinop | Banded graph cut segmentation algorithms with laplacian pyramids |
CN102289661A (zh) * | 2011-07-27 | 2011-12-21 | 宁波大学 | 一种基于谱匹配的三维网格模型的匹配方法 |
WO2012058902A1 (zh) * | 2010-11-02 | 2012-05-10 | 中兴通讯股份有限公司 | 全景图合成方法及装置 |
JP2015203703A (ja) * | 2014-04-16 | 2015-11-16 | タタ コンサルタンシー サービシズ リミテッドTATA Consultancy Services Limited | ステレオオブジェクト検出及び距離計算のためのシステム及び方法 |
WO2016109570A1 (en) * | 2014-12-30 | 2016-07-07 | Micron Technology, Inc | Systems and devices for accessing a state machine |
CN106471338A (zh) * | 2014-02-17 | 2017-03-01 | 牛津大学创新有限公司 | 确定移动设备在地理区域中的位置 |
CN106780303A (zh) * | 2016-12-02 | 2017-05-31 | 上海大学 | 一种基于局部配准的图像拼接方法 |
CN106940876A (zh) * | 2017-02-21 | 2017-07-11 | 华东师范大学 | 一种基于surf的快速无人机航拍图像拼接算法 |
CN107016319A (zh) * | 2016-01-27 | 2017-08-04 | 北京三星通信技术研究有限公司 | 一种关键点定位方法和装置 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8805165B2 (en) * | 2010-11-09 | 2014-08-12 | Kodak Alaris Inc. | Aligning and summarizing different photo streams |
-
2017
- 2017-11-14 CN CN201711124245.5A patent/CN109784353A/zh active Pending
-
2018
- 2018-08-06 KR KR1020180091157A patent/KR102631980B1/ko active IP Right Grant
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20070165949A1 (en) * | 2006-01-17 | 2007-07-19 | Ali Kemal Sinop | Banded graph cut segmentation algorithms with laplacian pyramids |
WO2012058902A1 (zh) * | 2010-11-02 | 2012-05-10 | 中兴通讯股份有限公司 | 全景图合成方法及装置 |
US20130208997A1 (en) * | 2010-11-02 | 2013-08-15 | Zte Corporation | Method and Apparatus for Combining Panoramic Image |
CN102289661A (zh) * | 2011-07-27 | 2011-12-21 | 宁波大学 | 一种基于谱匹配的三维网格模型的匹配方法 |
CN106471338A (zh) * | 2014-02-17 | 2017-03-01 | 牛津大学创新有限公司 | 确定移动设备在地理区域中的位置 |
US20170074665A1 (en) * | 2014-02-17 | 2017-03-16 | Oxford University Innovation Limited | Determining the position of a mobile device in a geographical area |
JP2015203703A (ja) * | 2014-04-16 | 2015-11-16 | タタ コンサルタンシー サービシズ リミテッドTATA Consultancy Services Limited | ステレオオブジェクト検出及び距離計算のためのシステム及び方法 |
WO2016109570A1 (en) * | 2014-12-30 | 2016-07-07 | Micron Technology, Inc | Systems and devices for accessing a state machine |
CN107016319A (zh) * | 2016-01-27 | 2017-08-04 | 北京三星通信技术研究有限公司 | 一种关键点定位方法和装置 |
CN106780303A (zh) * | 2016-12-02 | 2017-05-31 | 上海大学 | 一种基于局部配准的图像拼接方法 |
CN106940876A (zh) * | 2017-02-21 | 2017-07-11 | 华东师范大学 | 一种基于surf的快速无人机航拍图像拼接算法 |
Non-Patent Citations (5)
Title |
---|
EL-MASHAD, S.Y. AND SHOUKRY, A.: ""Towards a Robust Scale Invariant Feature Correspondence"", 《 PATTERN RECOGNITION AND MACHINE INTELLIGENCE. 6TH INTERNATIONAL CONFERENCE, PREMI 2015. PROCEEDINGS: LNCS 9124》, 31 December 2015 (2015-12-31), pages 33 - 43 * |
于英,张永生,薛武: ""半分辨率半路径数量的半全局匹配方法"", 《计量技术》, no. 01, 31 January 2014 (2014-01-31) * |
范翔;夏顺仁;: ""基于特征的显微图像全自动拼接"", 《浙江大学学报(工学版)》, vol. 43, no. 07, pages 1182 - 1186 * |
邵晶波;丁金凤;黄玉妍;: ""基于建构理论的计算机教材建设研究"", 《计算机教育》, no. 12 * |
郭复胜;高伟;: "基于辅助信息的无人机图像批处理三维重建方法", 《自动化学报》, no. 06, 15 June 2013 (2013-06-15) * |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110766061A (zh) * | 2019-10-15 | 2020-02-07 | 武汉中海庭数据技术有限公司 | 一种道路场景匹配方法及装置 |
CN110766061B (zh) * | 2019-10-15 | 2022-05-31 | 武汉中海庭数据技术有限公司 | 一种道路场景匹配方法及装置 |
CN111461196A (zh) * | 2020-03-27 | 2020-07-28 | 上海大学 | 基于结构特征的快速鲁棒图像识别跟踪方法和装置 |
CN111461196B (zh) * | 2020-03-27 | 2023-07-21 | 上海大学 | 基于结构特征的快速鲁棒图像识别跟踪方法和装置 |
CN112966138A (zh) * | 2021-02-22 | 2021-06-15 | 济南大学 | 一种基于轮廓特征点匹配的二维形状检索方法及*** |
CN112966138B (zh) * | 2021-02-22 | 2022-04-12 | 济南大学 | 一种基于轮廓特征点匹配的二维形状检索方法及*** |
CN116310417A (zh) * | 2023-03-10 | 2023-06-23 | 济南大学 | 一种基于形状上下文信息的近似图匹配方法及*** |
CN116310417B (zh) * | 2023-03-10 | 2024-04-26 | 济南大学 | 一种基于形状上下文信息的近似图匹配方法及*** |
Also Published As
Publication number | Publication date |
---|---|
KR102631980B1 (ko) | 2024-02-01 |
KR20190054899A (ko) | 2019-05-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10740897B2 (en) | Method and device for three-dimensional feature-embedded image object component-level semantic segmentation | |
US12046026B2 (en) | Systems and methods for keypoint detection with convolutional neural networks | |
Ma et al. | Robust feature matching for remote sensing image registration via locally linear transforming | |
Dai et al. | A 3d morphable model of craniofacial shape and texture variation | |
Zhou et al. | Factorized graph matching | |
CN108027878B (zh) | 用于面部对齐的方法 | |
Chen et al. | Wide-baseline relative camera pose estimation with directional learning | |
CN109977757B (zh) | 一种基于混合深度回归网络的多模态的头部姿态估计方法 | |
Xiong et al. | Supervised descent method for solving nonlinear least squares problems in computer vision | |
US9846974B2 (en) | Absolute rotation estimation including outlier detection via low-rank and sparse matrix decomposition | |
US20140043329A1 (en) | Method of augmented makeover with 3d face modeling and landmark alignment | |
Xia et al. | Loop closure detection for visual SLAM using PCANet features | |
US9489768B2 (en) | Semantic dense 3D reconstruction | |
CN109784353A (zh) | 一种无向图匹配的方法、设备和存储介质 | |
CN101964064A (zh) | 一种人脸比对方法 | |
Spezialetti et al. | Learning to orient surfaces by self-supervised spherical cnns | |
US20030235337A1 (en) | Non-rigid image registration using distance functions | |
US11963741B2 (en) | Systems and methods for human pose and shape recovery | |
CN111598995B (zh) | 一种基于原型分析的自监督多目三维人体姿态估计方法 | |
Weerasekera et al. | Dense monocular reconstruction using surface normals | |
Krüger et al. | Statistical appearance models based on probabilistic correspondences | |
Sun et al. | Deep Evolutionary 3D Diffusion Heat Maps for Large-pose Face Alignment. | |
Cootes | Statistical shape models | |
Trinh et al. | Unsupervised learning of stereo vision with monocular cues | |
EP2672423A1 (en) | Method and apparatus for locating features of an object using deformable models |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |