CN101901483A - 泛化置信度传播的双目立体视觉匹配方法 - Google Patents

泛化置信度传播的双目立体视觉匹配方法 Download PDF

Info

Publication number
CN101901483A
CN101901483A CN 201010193833 CN201010193833A CN101901483A CN 101901483 A CN101901483 A CN 101901483A CN 201010193833 CN201010193833 CN 201010193833 CN 201010193833 A CN201010193833 A CN 201010193833A CN 101901483 A CN101901483 A CN 101901483A
Authority
CN
China
Prior art keywords
variable
layer
state
value
transmission
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN 201010193833
Other languages
English (en)
Other versions
CN101901483B (zh
Inventor
陈胜勇
王中杰
旺晓研
王鑫
童汉阳
管秋
王万良
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang University of Technology ZJUT
Original Assignee
Zhejiang University of Technology ZJUT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University of Technology ZJUT filed Critical Zhejiang University of Technology ZJUT
Priority to CN2010101938336A priority Critical patent/CN101901483B/zh
Publication of CN101901483A publication Critical patent/CN101901483A/zh
Application granted granted Critical
Publication of CN101901483B publication Critical patent/CN101901483B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Image Analysis (AREA)

Abstract

一种泛化置信度传播的双目立体视觉匹配方法,包括以下步骤:1)采集双目的左右两幅图像,建立马尔可夫随机场;2)产生多尺度马尔可夫随机场,第k层的大小是第k+1层大小的四分之一;3)按从1到n的顺序分别对n个马尔可夫随机场进行求解,通过将一个在二维空间中搜索最小值的问题分解到多个一维空间中搜索最小值,迭代完成后,使用尺度空间的状态空间缩减策略来对状态空间进行缩减,将第i层的计算结果传递到第i+1层;4)在最底层马尔可夫随机场求解完成后,取代价值最小的那个状态作为该变量的最终状态,即为该变量所对应图像中点的视差值。本发明有效降低复杂度、减少计算量。

Description

泛化置信度传播的双目立体视觉匹配方法 
技术领域
本发明涉及图像处理、计算机视觉、计算方法、数学、数值方法领域,尤其是计算机视觉的双目立体视觉匹配方法。 
背景技术
目前,立体视觉匹配问题的研究已经取得了很大的进展。特别是基于全局优化的匹配算法,已经成为了解决匹配问题的主要方法,得到了广泛的运用。其能得到如此关注的原因是因为匹配问题可以很好地被建模为一个马尔可夫随机场(MRF)或条件随机场(CRF)的优化问题。这类问题在许多学科中都有设计,由此产生的很多算法都可以运用到匹配问题的解决当中来。 
其中,基于置信度传播(BeliefPropagation)的算法是一种目前受到广泛关注的方法。它的主要思想是通过节点之间置信度的传播实现整个模型的逐步收敛。其最初是在文献(Pearl J..Probabilistic reasoningin intelligent systems:networks of plausible inference[M](智能***中的概率推演:可信度推演网络),San Francisco:Morgan KaufmannPublishers Inc.,1988.)中提出的,然后在文献(Sun Jian,Zheng Nan-Ning,et al..Stereo matching using belief propagation[J](使用置信度传播的匹配算法).IEEE transactions on Pattern Analysis and Machine Intelligence.2003,25(7):787-800.)中第一次引入到求解匹配问题中。 
置信度传播算法的一个最大的问题是只有在无环的图结构中才被证明可以收敛,而像匹配问题中使用到的网格状的马尔可夫随机场模 型具有大量的环状结构,这样就会造成结果的不稳定。对于这个问题主要有三种解决方法,第一种是将迭代的次数设定在一个比较小的次数上,不用等到算法收敛就直接停止迭代。这也是最简单,最常用的一种解决方法;第二种是将邻近两次迭代过程中置信度变化不大或没有变化的节点移除出迭代过程,使得当迭代过程的不断进行,节点数量逐渐减少,当没有节点参与迭代时,迭代自动终止;第三种方法是在每次迭代中都先构造一棵生成树,迭代在该生成树中进行,如文献(Wainwright M.J.,Jaakkola T.S.,et al..MAP estimation via agreementon trees:message-passing and linear programming[J](使用树的统一性的最大后验概率估计:信息传递和线性规划).IEEE Transactions onInformation Theory.2005,51(11):3697-3717.)和(Kolmogorov V.Convergent tree-reweighted message passing for energy minimization[J](使用收敛的树型信息传递的能量最小化方法).IEEE Transactions onPattern Analysis and Machine Intelligence.2006.10,28(10):1568-1583.)中所示。由于生成树中没有环状结构,所以不会产生不收敛的结果。而且文献(Szeliski R.,Zabih R.,et al..A comparative study of energyminimization methods for markov random fields with smoothness-basedpriors[J](对基于光滑先验概率的马尔可夫随机场进行能量最小化的算法的比较研究).IEEE Transactions on Pattern Analysis and MachineIntelligence.2008,30(6):1068-1080.)中的实验表明,该方法在匹配问题中可以得到比传统的置信度传播算法更稳定的匹配结果。 
另外一种置信度传播算法的扩展是泛化置信度传播算法。该算法是传统置信度传播算法的一种扩展。它最早是由Yedidia及其他研究者提出的(Yedidia J.S.,Freeman W.T.,et al..Generalized belief propagation[J](泛化置信度传播算法).Neural Information ProcessingSystems.2000,13:689-695.)。泛化置信度传播算法的总体思想是将图结构中的各节点进行聚类,在各聚类间进行信息传播。它并没有制定具体的聚类或者说分块策略,只是一个框架性的算法。文献(YedidiaJ.S.,Freeman W.T.,et al..Constructing free-energy approximations andgeneralized belief propagation algorithms[J](构造自由能估计算法和泛化置信度传播算法).IEEE transactions on information theory,2005,51(7):2282-2312.)对泛化置信度传播算法的聚类方式进行了讨论,提出了用一种区域图的图结构来表示各种不同的聚类结果,同时还在区域图上讨论了泛化置信度传播算法的收敛性质。由于该算法计算量较大,所以在匹配问题中还没有出现应用实例。 
发明内容
为了克服现有的针对泛化置信度传播算法的双目图像匹配方法的较高复杂度,较大计算量的不足,本发明提出了基于最小和的缓存加速策略,使得泛化置信度传播算法的性能得到了很大加强,从而成功将其应用于双目视觉中匹配问题的求解过程中,提供了一种有效降低复杂度、减少计算量的泛化置信度传播的双目立体视觉匹配方法。 
本发明解决其技术问题所采用的技术方案是: 
一种泛化置信度传播的双目立体视觉匹配方法,所述双目立体视觉匹配方法包括以下步骤: 
1)采集双目的左右两幅图像,将左图中的每一个像素点都作为一个变量,然后保持这些变量在图像坐标中的相对位置不变,进行4邻域连接,得到马尔可夫随机场的拓扑结构,然后按公式(1)和公式(2) 分别计算马尔可夫随机场中的各变量的各状态代价值,以及各连接边的代价值: 
D ( f p ) = λ · min ( Σ c ∈ { L , a , b } ( I c L ( p ) - I c R ( p - f p ) ) 2 , T ) - - - ( 1 )
V(fp,fq)=min(|fp-fq|,K)              (2) 
其中,λ表示代价权重,它影响到点代价在整个能量函数中所占有的比重;fp和fq分别表示变量p和q的状态序号;T表示截断值;颜色向量距离采用欧氏距离来表征,K表示截断值;Ic L(p)和Ic R(p)分别表示左图和右图中p点处的c通道的颜色值; 
2)产生多尺度马尔可夫随机场,第k层的大小是第k+1层大小的四分之一; 
3)设在多尺度马尔可夫随机场中共有n层,按从1到n的顺序分别对n个马尔可夫随机场进行求解;首先,使用泛化置信度传播算法对每一层的马尔可夫随机场分别求解,原始的泛化置信度传播算法使用公式(3)和公式(4)来进行信息传递: 
Figure DEST_PATH_GDA0000026567720000043
其中,φs=φs(xs)=D(xs), 
Figure DEST_PATH_GDA0000026567720000044
ms→u=ms→u(xu)表示当变量u选定状态xu时,变量s向变量u传递的点信息,mst→uv=mst→uv(xu,xv)表示当变量u和变量v选定状态xu和xu时,变量s和变量t之间的边向变量u和变量v之间的边传递的边信息; 
对公式(3)和公式(4)进行负对数操作,并对其中的独立计算进行缓存,得到两条新的公式,即公式(5)和公式(6): 
m s → u t ( x u ) = min x s ( P s ( x s ) + Q su ( x s , x u ) ) - - - ( 5 )
m st → uv t ( x u , x u ) = min x s , x t ( Q su ′ ( x s , x u ) + Q tv ′ ( x t , x v ) + Q st ′ ( x s , x t ) ) - m s → u t - 1 - m t → v t - 1 - - - ( 6 )
其中,上标表示当前的迭代序号。 
P s ( x s ) = D ( x s ) + Σ i = { a , b , c } m i → s t - 1 ( x s ) ;
Q su ( x s , x u ) = V ( x s , x u ) + Σ i = { bd , ce } m i → su t - 1 ( x s , x u ) ;
Q su ′ = D ( x s ) + V ( x s , x u ) + m a → s t - 1 ( x s ) + m c → s t - 1 ( x s ) + m ce → su t - 1 ( x s , x u ) ;
Q tv ′ = D ( x t ) + V ( x t , x v ) + m b → t t - 1 ( x t ) + m d → t t - 1 ( x t ) + m df → tv t - 1 ( x t , x v ) ;
Q st ′ = V ( x s , x t ) + m ab → st t - 1 ( x s , x t ) 均是缓存变量; 
将公式(6)的计算过程描述成一个在二维网格中搜索最小值的问题,首先选取: 
sini=min{Qsu′(xs,xu)}              (7) 
tini=min{Qtv′(xt,xv)}                 (8) 
(7)、(8)作为搜索的起始点,然后使点P在水平方向上移动,搜索在该方向上的最小值,找到最小值后,将点P移动到该位置;接着将点P沿垂直方向进行搜索,同样找到该方向上的最小值,然后移到该位置,反复循环迭代以上步骤,直到P点不再移动位置时,其所处位置的值即被认定为该二维网格中的最小值; 
然后分点传递和边传递两部分分别进行信息传递,在点传递过程中,首先选择所有非相邻的变量同步进行上下左右四个方向的传递,再选择在前一步中没有进行传递的变量进行同样方式的传递;在边传递过程中,分为水平边传递和垂直边传递两部分,其中,水平边传递分过程中,首先选择非相邻的水平边进行同步上下两个方向的传递,再选择在前一步中没有进行传递的水平边按同样方式进行传递;然后 进行垂直边传递,其传递方式和水平边传递相同;每一层次设定迭代次数,进行迭代; 
迭代完成后,采用常值递减方法设置各层次的最少状态数量,其定义如下所示: Γ ( L ) = d Γ ( i ) = Γ ( i - 1 ) - η - - - ( 9 )
其中,Γ(i)表示第i层中最少的状态数量,d表示在最稀疏的层次上保有的状态数量,L表示多尺度空间中的尺度数量,η表示常值递减速率; 
当第i层中各变量在信息传递了一定次数收敛后,先将最终计算得到的每个变量的置信度向量中的各元素排序,挑出最好的Γ(i)个状态,作为下一层次的候选状态;然后,将由点代价函数计算得到的每个变量的各状态的代价值进行排序,选出最好的Γ(i)个状态,作为下一层次的候选状态;最后,将两次计算得到的候选状态向量进行“或”操作,得到最终传入下一层次的候选状态向量; 
将第i层的计算结果传递继承到第i+1层; 
4)在最底层马尔可夫随机场求解完成后,按下式计算每个变量的代价值: 
C s t ( x s ) = Σ i = { a , b , c , d } m i → s t ( x s ) - - - ( 10 )
然后取代价值最小的那个状态作为该变量的最终状态,即为该变量所对应图像中点的视差值。 
进一步,所述步骤1)中,点代价计算是在CIELAB颜色空间中进行。 
再进一步,所述步骤3)中,第i层的计算结果传递继承到第i+ 1层的继承过程分为点信息继承和边信息继承两部分,在点信息继承中,第i层中的任意一个变量都有4条点信息需要继承,每一条点信息由第i+1层中相对应的4个变量继承;在边信息继承中,分为水平边信息继承和垂直边信息继承两部分,水平边信息继承中,第i层中的任意一条水平边都有2条边信息需要继承,每一条边信息由第i+1层中相应的2条边继承,垂直边的继承过程和水平边继承过程相同。 
本发明的技术构思为:使用二路筛选策略在尺度空间中对状态空间进行缩减,从而加快整个算法的计算速度。本发明的有益效果主要表现在:大大加速了泛化置信度传播算法的计算速度。 
附图说明
图1是多尺度马尔可夫随机场的建立过程的示意图。 
图2和图3分别是在泛化置信度传播算法的一次迭代过程中两种信息的传递顺序的示意图。 
图4、图5、以及图6是多尺度马尔可夫随机场层次之间的信息继承过程的示意图。 
图7是使用方向集算法进行复杂度降低的流程图。 
图8是二路状态空间筛选策略的筛选过程的示意图。 
具体实施方式
下面结合附图对本发明做进一步描述。 
参照图1~图8,一种泛化置信度传播的双目图像匹配方法,所述计算机双目立体视觉匹配方法包括以下步骤: 
1)使用左右两幅图像,计算得到相对应的马尔可夫随机场。 
2)产生多尺度马尔可夫随机场,第k层的大小是第k+1层大小的四分之一。 
3)设在多尺度马尔可夫随机场中共有n层,按从1到n的顺序分别对n个马尔可夫随机场进行求解。在计算过程中,将第i层的计算结果传递到第i+1层。 
4)在最底层马尔可夫随机场求解完成后,计算每个点最终状态值,即每个像素点的视差值。 
在步骤1)中,将左图中的每一个像素点都作为一个变量,然后保持这些变量在图像坐标中的相对位置不变,进行4邻域连接,得到的就是马尔可夫随机场的拓扑结构。然后按公式(1)和公式(2)分别计算马尔可夫随机场中的各变量的各状态代价值,以及各连接边的代价值。 
D ( f p ) = λ · min ( Σ c ∈ { L , a , b } ( I c L ( p ) - I c R ( p - f p ) ) 2 , T ) - - - ( 1 )
V(fp,fq)=min(|fp-fq|,K)                       (2) 
其中,λ表示代价权重,它影响到点代价在整个能量函数中所占有的比重;fp和fq分别表示变量p和q的状态序号;T表示截断值;颜色向量距离采用欧氏距离来表征,K表示截断值;Ic L(p)和Ic R(p)分别表示左图和右图中p点处的c通道的颜色值;需要提及的是,为了使代价计算更精确,这里的点代价计算是在CIELAB(the L*a*b*standardof Commission Internationale de L′Eclairage)颜色空间中进行的。颜色向量距离采用欧氏距离来表征。K表示截断值。 
在步骤2)中,将马尔可夫随机场按图1产生多尺度结构。将每个4点变量集合中的左上变量作为上一层次马尔可夫随机场中的变 量。 
在步骤3)中,首先,使用泛化置信度传播算法对每一层的马尔可夫随机场分别求解。原始的泛化置信度传播算法使用公式(3)和公式(4)来进行信息传递。 
Figure DEST_PATH_GDA0000026567720000091
Figure DEST_PATH_GDA0000026567720000092
其中,φs=φs(xs)=D(xs), 
Figure DEST_PATH_GDA0000026567720000093
ms→u=ms→u(xu)表示当变量u选定状态xu时,变量s向变量u传递的点信息,mst→uv=mst→uv(xu,xv)表示当变量u和变量v选定状态xu和xu时,变量s和变量t之间的边向变量u和变量v之间的边传递的边信息; 
为了避免使用计算量较大的乘法和除法操作,本发明对以上两条公式进行负对数操作,并对其中的独立计算进行缓存,得到两条新的公式,即公式(5)和公式(6)。 
m s → u t ( x u ) = min x s ( P s ( x s ) + Q su ( x s , x u ) ) - - - ( 5 )
m st → uv t ( x u , x u ) = min x s , x t ( Q su ′ ( x s , x u ) + Q tv ′ ( x t , x v ) + Q st ′ ( x s , x t ) ) - m s → u t - 1 - m t → v t - 1 - - - ( 6 )
其中, 
P s ( x s ) = D ( x s ) + Σ i = { a , b , c } m i → s t - 1 ( x s )
Q su ( x s , x u ) = V ( x s , x u ) + Σ i = { bd , ce } m i → su t - 1 ( x s , x u )
Q su ′ = D ( x s ) + V ( x s , x u ) + m a → s t - 1 ( x s ) + m c → s t - 1 ( x s ) + m ce → su t - 1 ( x s , x u )
Q tv ′ = D ( x t ) + V ( x t , x v ) + m b → t t - 1 ( x t ) + m d → t t - 1 ( x t ) + m df → tv t - 1 ( x t , x v )
Q st ′ = V ( x s , x t ) + m ab → st t - 1 ( x s , x t )
都是缓存变量。 
通过分析公式(6),发现其计算复杂度为O(n4),是泛化置信度传 播算法的主要复杂度。本发明通过将一个在二维空间中搜索最小值的问题分解到多个一维空间中搜索最小值的问题,将其复杂度从O(n4)降低到O(n3)。使用的方法为方向集方法,也被称为Powell方法,在文献(Press W.H.,Teukolsky S.A.,et al..Numerical Recipes in C[M](C语言数值计算摘要),second edition.Cambridge:Cambridge UniversityPress,1992.)中有详细描述。该方法的思想是将一个N维的搜索问题转化到多个一维搜索问题,实现问题规模的线性化。将公式(6)的计算过程描述成一个在二维网格中搜索最小值的问题,首先选取: 
sini=min{Qsu′(xs,xu)}                (7) 
tini=min{Qtv′(xt,xv)}                (8) 
(7)、(8)作为搜索的起始点,然后使点P在水平方向上移动,搜索在该方向上的最小值,找到最小值后,将点P移动到该位置;接着将点P沿垂直方向进行搜索,同样找到该方向上的最小值,然后移到该位置,反复循环迭代以上步骤,直到P点不再移动位置时,其所处位置的值即被认定为该二维网格中的最小值;图7显示了以上所述过程。 
然后分点传递和边传递两部分分别进行信息传递,在点传递过程中,首先选择所有非相邻的变量同步进行上下左右四个方向的传递,再选择在前一步中没有进行传递的变量进行同样方式的传递;在边传递过程中,分为水平边传递和垂直边传递两部分,其中,水平边传递分过程中,首先选择非相邻的水平边进行同步上下两个方向的传递,再选择在前一步中没有进行传递的水平边按同样方式进行传递;然后进行垂直边传递,其传递方式和水平边传递相同,即按图2和图3方 式进行顺序计算,其中,箭头方向表明消息的传递起始点。每一层次设定一定的迭代次数,进行迭代。 
迭代完成后,本发明使用尺度空间的状态空间缩减策略来对状态空间进行缩减。在使用马尔可夫随机场建模的匹配问题中,每个变量的状态数量是一个无法避免的参数,而且随着两个摄像机之间距离的增加,以及图像分辨率的增加,该参数将会急剧增加,从而导致算法复杂度的指数级增长。在分析算法的过程中可以发现,在没有优化的情况下,很多的计算集中在一些对最终结果影响很小的状态值上。从而算法的复杂度越大,像泛化置信度传播算法,这样的冗余计算量就越大。本发明提出的基于尺度空间的状态空间缩减策略在尺度空间中逐步去除无关的状态,使得算法的复杂度增长始终在较低的水平,从而起到加速作用。首先,给定每一个层次应该保持的最少状态数量。这样的设定是为了在每一个层次上都保证一定数量的状态,从而使得信息能够得到充分传播,另外一方面也是为了保证状态空间不会过快缩减,避免算法过快收敛,保证能得到一个较好的收敛值。具体的设定值需要考虑两方面的因素,一个是在每一层次中要保证一个足够大的状态空间,使得信息得到充分传播,另一个是要保证计算量保持在一个较低的水平上。 
由于这种设置不受每个变量的实际状态数影响,而且在计算量和保证信息传递的状态空间大小的平衡方面很难做出一个最佳决策,更进一步说,该设定可能和具体的应用相关。本节介绍的方法将使用一个简单的统一设定,即常值递减方法。其定义如下所示: 
Γ ( L ) = d Γ ( i ) = Γ ( i - 1 ) - η - - - ( 9 )
其中,Γ(i)表示第i层中最少的状态数量,d表示在最稀疏的层次上保有的状态数量,L表示多尺度空间中的尺度数量,η表示常值递减速率。当给定最稀疏层次上保有的状态数量后,其他层次的状态保有数量都可以通过上式计算出来。为了适应不同的最大视差范围,即当最大视差范围大于d时,根据点代价函数得到的最佳d个状态将作为最稀疏层次上的d个候选状态。这里还要提及的是,不光是点代价函数,任意可以产生匹配准确性排序的方法都能够采用,本节直接采用点代价函数是出于简便考虑,也可采用更复杂但更稳定的方法。 
在设置好了各层次的最少状态数量后,本文采用一种二路筛选策略来选择一定数量的状态进入下一层次的传播。首先,当第i层中各变量在信息传递了一定次数收敛后,先将最终计算得到的每个变量的置信度向量中的各元素排序,挑出最好的Γ(i)个状态,作为下一层次的候选状态。然后,将由点代价函数计算得到的每个变量的各状态的代价值进行排序,选出最好的Γ(i)个状态,作为下一层次的候选状态。最后,将两次计算得到的候选状态向量进行“或”操作,得到最终传入下一层次的候选状态向量。以上描述的过程如图8所示。其中,浅色方格表示被选定的状态,深色方格表示被删除的状态,越大的点表示该状态的惩罚值越大,在图示的例子中,该变量在该层次的候选状态数量为5,下一层中的最少候选变量数,即Γ(i+1)为3。 
在经过状态空间缩减后,那些和保留的状态相关的信息将由下一层次继承; 
第i层的计算结果传递继承到第i+1层的继承过程分为点信息继承和边信息继承两部分,在点信息继承中,第i层中的任意一个变量 都有4条点信息需要继承,每一条点信息由第i+1层中相对应的4个变量继承;在边信息继承中,分为水平边信息继承和垂直边信息继承两部分,水平边信息继承中,第i层中的任意一条水平边都有2条边信息需要继承,每一条边信息由第i+1层中相应的2条边继承,垂直边的继承过程和水平边继承过程相同,继承过程如图4,图5,图6所示。 
再在步骤4)中,按下式计算每个变量的代价值 
C s t ( x s ) = Σ i = { a , b , c , d } m i → s t ( x s ) - - - ( 10 )
然后取代价值最小的那个状态作为该变量的最终状态,即为该变量所对应图像中点的视差值。 
表1给出了使用本发明进行加速和不使用本发明时的泛化置信度传播算法的运行效率的比较: 
Figure DEST_PATH_GDA0000026567720000132
表1 
本实验的实验环境为具有1.6GHz主频CPU和1G内存的个人电脑。图像对为由Middlebury提供(D.Scharstein and R.Szeliski.“Ataxonomy and evaluation of dense two-frame stereo correspondencealgorithms(一种对双目密集点匹配算法的分类和评价)”,InternationalJournal of Computer Vision,2002,47(1),pp.7-42.)的“Tsukuba”实验 图像对,大小为384×288像素。参数设置为T=30.0,λ=0.87,K=10.0,d=16,η=3,以及多尺度空间的层数为5,每个层次的迭代次数为4次。 

Claims (3)

1.一种泛化置信度传播的双目立体视觉匹配方法,其特征在于:所述双目立体视觉匹配方法包括以下步骤:
1)采集双目的左右两幅图像,将左图中的每一个像素点都作为一个变量,然后保持这些变量在图像坐标中的相对位置不变,进行4邻域连接,得到马尔可夫随机场的拓扑结构,然后按公式(1)和公式(2)分别计算马尔可夫随机场中的各变量的各状态代价值,以及各连接边的代价值:
V(fp,fq)=min(|fp-fq|,K)             (2)
其中,λ表示代价权重,它影响到点代价在整个能量函数中所占有的比重;fp和fq分别表示变量p和q的状态序号;T表示截断值;颜色向量距离采用欧氏距离来表征,K表示截断值;Ic L(p)和Ic R(p)分别表示左图和右图中p点处的c通道的颜色值;
2)产生多尺度马尔可夫随机场,第k层的大小是第k+1层大小的四分之一;
3)设在多尺度马尔可夫随机场中共有n层,按从1到n的顺序分别对n个马尔可夫随机场进行求解;首先,使用泛化置信度传播算法对每一层的马尔可夫随机场分别求解,原始的泛化置信度传播算法使用公式(3)和公式(4)来进行信息传递:
Figure DEST_PATH_FDA0000026567710000012
Figure DEST_PATH_FDA0000026567710000013
其中,φs=φs(xs)=D(xs), 
Figure DEST_PATH_FDA0000026567710000021
ms→u=ms→u(xu)表示当变量u选定状态xu时,变量s向变量u传递的点信息,mst→uv=mst→uv(xu,xv)表示当变量u和变量v选定状态xu和xu时,变量s和变量t之间的边向变量u和变量v之间的边传递的边信息;
对公式(3)和公式(4)进行负对数操作,并对其中的独立计算进行缓存,得到两条新的公式,即公式(5)和公式(6):
Figure DEST_PATH_FDA0000026567710000022
Figure DEST_PATH_FDA0000026567710000023
其中,上标表示当前的迭代序号;
Figure DEST_PATH_FDA0000026567710000024
Figure DEST_PATH_FDA0000026567710000025
Figure DEST_PATH_FDA0000026567710000028
均是缓存变量;
将公式(6)的计算过程描述成一个在二维网格中搜索最小值的问题,首先选取:
sini=min{Qsu′(xs,xu)}                         (7)
tini=min{Qtv′(xt,xv)}                         (8)
(7)、(8)作为搜索的起始点,然后使点P在水平方向上移动,搜索在该方向上的最小值,找到最小值后,将点P移动到该位置;接着将点P沿垂直方向进行搜索,同样找到该方向上的最小值,然后移到该位置,反复循环迭代以上步骤,直到P点不再移动位置时,其所处位置的值即被认定为该二维网格中的最小值;
然后分点传递和边传递两部分分别进行信息传递,在点传递过程 中,首先选择所有非相邻的变量同步进行上下左右四个方向的传递,再选择在前一步中没有进行传递的变量进行同样方式的传递;在边传递过程中,分为水平边传递和垂直边传递两部分,其中,水平边传递分过程中,首先选择非相邻的水平边进行同步上下两个方向的传递,再选择在前一步中没有进行传递的水平边按同样方式进行传递;然后进行垂直边传递,其传递方式和水平边传递相同;每一层次设定迭代次数,进行迭代;
迭代完成后,采用常值递减方法设置各层次的最少状态数量,其定义如下所示:
Figure DEST_PATH_FDA0000026567710000031
其中,Γ(i)表示第i层中最少的状态数量,d表示在最稀疏的层次上保有的状态数量,L表示多尺度空间中的尺度数量,η表示常值递减速率;
当第i层中各变量在信息传递了一定次数收敛后,先将最终计算得到的每个变量的置信度向量中的各元素排序,挑出最好的Γ(i)个状态,作为下一层次的候选状态;然后,将由点代价函数计算得到的每个变量的各状态的代价值进行排序,选出最好的Γ(i)个状态,作为下一层次的候选状态;最后,将两次计算得到的候选状态向量进行“或”操作,得到最终传入下一层次的候选状态向量;
将第i层的计算结果传递继承到第i+1层;
4)在最底层马尔可夫随机场求解完成后,按下式计算每个变量的代价值
Figure DEST_PATH_FDA0000026567710000032
然后取代价值最小的那个状态作为该变量的最终状态,即为该变量所对应图像中点的视差值。
2.如权利要求1所述的泛化置信度传播的双目立体视觉匹配方法,其特征在于:所述步骤1)中,点代价计算是在CIELAB颜色空间中进行。
3.如权利要求1或2所述的泛化置信度传播的双目立体视觉匹配方法,其特征在于:所述步骤3)中,第i层的计算结果传递继承到第i+1层的继承过程分为点信息继承和边信息继承两部分,在点信息继承中,第i层中的任意一个变量都有4条点信息需要继承,每一条点信息由第i+1层中相对应的4个变量继承;在边信息继承中,分为水平边信息继承和垂直边信息继承两部分,水平边信息继承中,第i层中的任意一条水平边都有2条边信息需要继承,每一条边信息由第i+1层中相应的2条边继承,垂直边的继承过程和水平边继承过程相同。 
CN2010101938336A 2010-06-08 2010-06-08 泛化置信度传播的双目立体视觉匹配方法 Expired - Fee Related CN101901483B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2010101938336A CN101901483B (zh) 2010-06-08 2010-06-08 泛化置信度传播的双目立体视觉匹配方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2010101938336A CN101901483B (zh) 2010-06-08 2010-06-08 泛化置信度传播的双目立体视觉匹配方法

Publications (2)

Publication Number Publication Date
CN101901483A true CN101901483A (zh) 2010-12-01
CN101901483B CN101901483B (zh) 2012-06-27

Family

ID=43226993

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2010101938336A Expired - Fee Related CN101901483B (zh) 2010-06-08 2010-06-08 泛化置信度传播的双目立体视觉匹配方法

Country Status (1)

Country Link
CN (1) CN101901483B (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102609936A (zh) * 2012-01-10 2012-07-25 四川长虹电器股份有限公司 基于置信度传播的图像立体匹配方法
CN102663415A (zh) * 2012-03-19 2012-09-12 华中科技大学 基于gpu的条件随机场模型的数据分类方法
CN102892021A (zh) * 2012-10-15 2013-01-23 浙江大学 一种合成虚拟视点图像的新方法
CN104166987A (zh) * 2014-07-08 2014-11-26 哈尔滨师范大学 一种基于改进的自适应加权和置信度传播的视差估计方法
CN109255811A (zh) * 2018-07-18 2019-01-22 南京航空航天大学 一种基于可信度图视差优化的立体匹配方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7599547B2 (en) * 2005-11-30 2009-10-06 Microsoft Corporation Symmetric stereo model for handling occlusion
CN101625761A (zh) * 2009-08-06 2010-01-13 浙江工业大学 一种基于全局和局部算法的计算机双目视觉匹配方法
CN101706957A (zh) * 2009-10-30 2010-05-12 无锡景象数字技术有限公司 一种双目立体视觉装置的自标定方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7599547B2 (en) * 2005-11-30 2009-10-06 Microsoft Corporation Symmetric stereo model for handling occlusion
CN101625761A (zh) * 2009-08-06 2010-01-13 浙江工业大学 一种基于全局和局部算法的计算机双目视觉匹配方法
CN101706957A (zh) * 2009-10-30 2010-05-12 无锡景象数字技术有限公司 一种双目立体视觉装置的自标定方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
《信号处理》 20080229 罗军等 基于匹配跟踪信息的自适应对应像素距离图像匹配跟踪算法 第72-77页 第24卷, 第1期 2 *

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102609936A (zh) * 2012-01-10 2012-07-25 四川长虹电器股份有限公司 基于置信度传播的图像立体匹配方法
CN102663415A (zh) * 2012-03-19 2012-09-12 华中科技大学 基于gpu的条件随机场模型的数据分类方法
CN102663415B (zh) * 2012-03-19 2014-03-05 华中科技大学 基于gpu的条件随机场模型的数据分类方法
CN102892021A (zh) * 2012-10-15 2013-01-23 浙江大学 一种合成虚拟视点图像的新方法
CN102892021B (zh) * 2012-10-15 2014-11-19 浙江大学 一种合成虚拟视点图像的新方法
CN104166987A (zh) * 2014-07-08 2014-11-26 哈尔滨师范大学 一种基于改进的自适应加权和置信度传播的视差估计方法
CN104166987B (zh) * 2014-07-08 2017-01-25 哈尔滨师范大学 一种基于改进的自适应加权和置信度传播的视差估计方法
CN109255811A (zh) * 2018-07-18 2019-01-22 南京航空航天大学 一种基于可信度图视差优化的立体匹配方法
CN109255811B (zh) * 2018-07-18 2021-05-25 南京航空航天大学 一种基于可信度图视差优化的立体匹配方法

Also Published As

Publication number Publication date
CN101901483B (zh) 2012-06-27

Similar Documents

Publication Publication Date Title
CN109887282B (zh) 一种基于层级时序图卷积网络的路网交通流预测方法
CN109543559B (zh) 基于孪生网络和动作选择机制的目标跟踪方法及***
Shenoy et al. Valuation-based systems for discrete optimization
CN101625768B (zh) 一种基于立体视觉的三维人脸重建方法
CN103177450B (zh) 一种基于构件集采样的图像场景分割与分层联合求解方法
CN106846425A (zh) 一种基于八叉树的散乱点云压缩方法
CN101853508A (zh) 基于方向集的泛化置信度传播的双目立体视觉匹配方法
CN101901483A (zh) 泛化置信度传播的双目立体视觉匹配方法
CN108664885B (zh) 基于多尺度级联HourGlass网络的人体关键点检测方法
CN104156943B (zh) 基于非支配邻域免疫算法的多目标模糊聚类图像变化检测方法
Li et al. ADR-MVSNet: A cascade network for 3D point cloud reconstruction with pixel occlusion
CN113449612B (zh) 一种基于子流型稀疏卷积的三维目标点云识别的方法
CN107562066A (zh) 一种航天器多目标启发式排序任务规划方法
CN102142031A (zh) 一种基于粗糙集的海量数据分割方法
CN109657794A (zh) 一种基于指令队列的分布式深度神经网络性能建模方法
CN104536831B (zh) 一种基于多目标优化的多核SoC软件映射方法
CN108038600A (zh) 一种敏捷对地卫星的任务规划方法
CN109887008A (zh) 基于前后向平滑和o(1)复杂度视差立体匹配方法、装置和设备
CN113780389B (zh) 基于一致性约束的深度学习半监督密集匹配方法及***
CN112149691B (zh) 用于双目视觉匹配的神经网络搜索方法及设备
CN101877129A (zh) 基于最小和缓存加速策略的泛化置信度传播的双目立体视觉匹配方法
CN103984794B (zh) 一种针对软模块的固定边框的集成电路布图规划方法
CN116758219A (zh) 基于神经网络的区域感知多视角立体匹配三维重建方法
CN114566048B (zh) 一种基于多视角自适应时空图网络的交通控制方法
CN102542565B (zh) 一种用于包含复杂地形遥感图像的误匹配点剔除方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20120627

CF01 Termination of patent right due to non-payment of annual fee