CN101436255B - 一种复杂图像中显著轮廓提取方法 - Google Patents

一种复杂图像中显著轮廓提取方法 Download PDF

Info

Publication number
CN101436255B
CN101436255B CN2008102366036A CN200810236603A CN101436255B CN 101436255 B CN101436255 B CN 101436255B CN 2008102366036 A CN2008102366036 A CN 2008102366036A CN 200810236603 A CN200810236603 A CN 200810236603A CN 101436255 B CN101436255 B CN 101436255B
Authority
CN
China
Prior art keywords
line segment
probability
random
formula
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN2008102366036A
Other languages
English (en)
Other versions
CN101436255A (zh
Inventor
黄锐
唐奇伶
桑农
张天序
王岳环
高峻
高常鑫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huazhong University of Science and Technology
Original Assignee
Huazhong University of Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huazhong University of Science and Technology filed Critical Huazhong University of Science and Technology
Priority to CN2008102366036A priority Critical patent/CN101436255B/zh
Publication of CN101436255A publication Critical patent/CN101436255A/zh
Application granted granted Critical
Publication of CN101436255B publication Critical patent/CN101436255B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Image Analysis (AREA)

Abstract

本发明公开了一种复杂图像中显著轮廓提取方法,其步骤为:①将理想轮廓抽象成由一个小线段集合组成,小线段之间首尾相连。理想轮廓由这个小线段集合逼近;②对线段集合W建立数学模型,满足该模型的最优解,即为对图像中显著轮廓的逼近。③运用可逆跳转马尔科夫链蒙特卡洛和模拟退火算法对最优线段集W进行求解。本发明直接对“高级”的轮廓组成单元(线段)进行描述,避免了目前边缘检测算法中“噪声”边缘的缺陷,将轮廓组成单元的检测与感知聚集统一在一个框架下,同时完成二者的实现。避免了感知聚集过程对轮廓组成单元检测算法的依赖,输出结果是对理想轮廓的逼近。逼近结果具有良好的抗干扰性,对复杂图像的显著轮廓提取,能获得良好的视觉效果。

Description

一种复杂图像中显著轮廓提取方法
技术领域
本发明属于计算机视觉领域,具体涉及一种复杂图像中显著轮廓提取方法。
背景技术
图像中显著轮廓的提取是计算机视觉中一个基础性的核心问题。对于一幅图像,显著轮廓通常为图像中物体的几何形状,或用于区分物体之间的边界,例如,图1(c)是对图1(a)中显著轮廓进行人工标注的结果。人们往往通过对这些显著轮廓的感知就可以识别出图像中有那些物体,而不需要太多关于物体颜色和纹理的信息。显著轮廓除了可以用于感知和识别,在计算机视觉中,还可以用于图像的压缩、匹配、目标跟踪等。
通常,显著轮廓提取的过程由两个步骤组成:第一步是轮廓组成单元的定义与检测方法,常用的算法是把单个像素看成轮廓的组成单元,检测的方法,就是通过对单个像素局部邻域内的像素值进行滤波,而得到该像素属于轮廓的程度,如,梯度计算,Gabor滤波等方法。近几年来,随着机器学习理论在计算机视觉中的广泛应用,基于有监督的机器学习方法被用在了轮廓检测上,例如,David R.Martin采用了基于逻辑回归的机器学习方法,图卓文采用了基于adaboost的机器学习方法,二者均给出了图像中每个像素属于轮廓的概率值。以上检测方法均为基于像素的轮廓提取方法。第二步是从第一步输出的结果中,提取出具有感知显著性的轮廓。一幅图像中,如果没有噪声,目标物体为人造的,且物体表明没有复杂的纹理,物体所在的背景也是均匀的,那么,我们根本不需要第二步的工作,仅用第一步中常用算法的输出结果就可以得到感知显著的轮廓,例如,使用最为经典的Canny边缘检测算法。然而,人们日常接触的图像,大部分来自自然场景下的,存在图像的噪声,物体表面的不规则纹理,复杂的背景等。目前,计算机视觉中,像上述第一步中基于像素的轮廓检测方法均存在两个问题,即,对像素的“漏判与误判”,有的像素应该被认为是显著轮廓上的,却被认为不是;而有的像素不应当是显著轮廓上,却被认为是,例如,图1(b)就是采用Canny边缘检测算法得到的一种结果,上述的“漏判与误判”情况导致了所检测到的边缘存在“噪声”。当然,这种“漏判与误判”之间的判断标准,应该由人眼做最终的判断。如果把人眼所感知到的显著轮廓认为是最终的理想结果,例如图1(c)就是人眼所判断的一种结果,那么上述第一步中输出的结果与这个理想结果的差距,就是上述第二步中要努力减小的。
目前,针对上述第二步要完成的目标,主要是要把第一步结果中的轮廓,有选择性的聚集成显著轮廓。聚集的依据,通常采用格式塔心理学中提供的感知要素。在目前的一些方法中,通常不直接对像素直接聚集,而是聚集一些非像素的“高级”单元,一般,这种“高级”单元为小的直线段,这样就可以方便的计算线段之间的方向、距离等,可以更为方便的利用格式塔心理学中的感知要素,如,临近性,共线性等。通常先对第一步的结果做一些预处理,比如,去掉一些“误判”的像素,这些像素可以通过其所在轮廓的长度而选取,通常在第一步的结果中,长度小于某个阈值的轮廓,可以被看成是“误判”的,这些像素被去掉。另一方面,补上一些“漏判”的像素,最简单的方法是将每个轮廓端点与其最近k邻域端点用直线段连接起来。在完成上述与处理之后,接下来就是利用格式塔心理学提供的感知聚集要素,定义一种聚集标准,然后设计算法(目前算法多采用动态规划或全局搜索),从上述小的线段集中搜索出满足聚集标准的一个子集来,这个子集构成了算法最终的结果,即显著性结构,它仍然是对理想结果的一种逼近,但与单纯的边缘检测算法相比,它减少了很多“噪声”边缘,保持了显著轮廓的大部分结构,为后续的计算机视觉应用提供了较好的输入。
类似上述的这些方法,虽然取得了一些较为满意的结果,但仍然存在不足,算法不稳定是一个主要的缺陷,对于相对简单的图像来说,算法结果比较满意,但遇到复杂的图像后,结果往往偏差较大,其原因在于,上述第二步的搜索算法依赖与上述第一步中边缘检测的结果,如果第一步的结果不理想,输入第二步之后,即使第二步的算法是最佳的,也很难得到理想的结果,正如Stahl和Wang在文献(J.S.Stahl,and S.Wang.“Edge Grouping Combining Boundary and Region Information”,IEEE Trans.ImageProcess.,16(10):377-384,oct.2007.)中提到的。
发明内容
本发明的目的在于提供一种复杂图像中显著轮廓提取方法,该方法对于复杂图像的显著轮廓提取,能够获得良好的视觉效果。
本发明提供的一种复杂图像中显著轮廓提取方法,其步骤为:
(1)对于输入图像I(x,y),首先按照式(i)获得随机生成线段中心点坐标pi=(x,y)的采样概率q(pi),i表示图像中象素的序号:
q ( p i ) = ▿ I ( x , y ) / Σ x , y ▿ I ( x , y ) - - - ( i )
其中
Figure G2008102366036D00032
为图像的梯度值,其计算公式为式(ii):
▿ I ( x , y ) = [ I ( x + 1 , y ) - I ( x , y ) ] 2 + [ I ( x , y + 1 ) - I ( x , y ) ] 2 2 - - - ( ii )
(2)按照下述过程建立线段集合W数学模型,对图像中显著轮廓的逼近:
(2.1)集合W的初始值设为空集,W={};
(2.2)根据步骤(1)得到的采样概率q(pi),采样得到线段s0的中心点坐标p0=(x0,y0),然后在预设的数值区间[lmin,lmax]上进行均匀采样,采出该线段的长度值l0,接下来在方向区间[0,π]上进行均匀采样,采出该线段的方向值θ0,将该线段s0=(p0,l0,θ0)加入集合W;
(2.3)生成一个位于0到1之间的随机数rand,记录迭代次数N=N+1,N的初始值为0;如果rand小于等于qb,进入步骤(2.4),如果rand大于qb且小于等于qd+qb,转入步骤(2.6),如果rand大于qd+qb,,转入步骤(2.8);qd为随机删除一个线段的转移形式的概率,qb为随机生成一个线段的这种转移形式的概率;
(2.4)使用步骤(2.2)中的方法随机生成一个新的线段si=(pi,li,θi),将其暂时加入集合W,此时,定义新集合W为W′,W′=W∪{si},P(,)为转移概率,其定义如下:
P ( w ′ , w ) = q d 1 card ( W ) + 1 - - - ( iii )
P(w,w′)=qbq(pi)q(li|pi)q(θi|pi)       (iv)
公式(iii)中qd为随机删除一个线段这种转移形式的概率,card(W)为当前状态下线段的个数;q(pi)为随机生成线段中心点坐标的采样概率,其分布由图像的梯度确定;q(li|pi)为随机生成线段长度的采样概率,其分布为均匀分布;q(θi|pi)为随机生成线段方向的采样概率,其分布为均匀分布;
(2.5)按照公式(v)计算线段si的接收概率α1(w,w′);在求得线段si的接收概率α1(w,w′)之后,再生成一个0到1之间的随机数r,如果α1(w,w′)大于r,则线段si将被最终添加到集合W,否则将被丢掉;然后转入步骤(3);
(2.6)在当前线段集合W中,随机选中一个线段si=(pi,li,θi),将其暂时从集合W中删除;此时,按照定义新集合W为W′,从当前线段集合W中随机删除一个线段,此时W′=W\si,P(,)仍采用公式(iii)和(iv)计算;
(2.7)按照公式(v)计算线段si的删除概率α2(w,w′),在求得线段si的删除概率α2(w,w′)之后,再生成一个0到1之间的随机数r,如果α2(w,w′)大于r,则线段si将被最终从集合W中删除,否则将不被删除;然后转入步骤(3);
(2.8)在当前线段集合W中,随机选中一个线段si=(pi,li,θi),生成一个0到1之间的随机数a,如果a<1/3,则li=li+Δl;如果1/3<a<2/3,则li=li-Δl;如果a>2/3,则li保持不变;用同样的方法调整θi的大小;线段中心点坐标pi保持不变;这样si将成为一个新的线段si′,同样定义新集合W为W′,W′=(W\si)∪{si′},其中si′=(pi,li±Δl,θi±Δθ),在这种转移形式下,P(w′,w)等于P(w,w′);
(2.9)按照公式(v)计算线段si的调整接收概率α3(w,w′);在求得线段si的调整接收概率α3(w,w′)之后,再生成一个0到1之间的随机数r,如果α3(w,w′)大于r,则线段si将被最终调整为si′,否则将保持不变;
α(w,w′)=min{1,R(w,w′)}        (v)
其中R(w,w′)为Green比值,其定义为:
R ( w , w &prime; ) = P ( w &prime; , w ) f ( w &prime; ) 1 T P ( w , w &prime; ) f ( w ) 1 T - - - ( vi )
其中P(,)为转移概率,f()为线段集合的数学模型,T为模拟退火算法中的当前温度;
(3)重复步骤(2.3),每迭代一次,N的数值加1;当温度T趋于0时,算法收敛,此时的线段集合W为该模型的最优解,得到图像的显著轮廓。
本发明针对现有复杂图像中轮廓提取方法的不足,提出了一种对显著轮廓逼近的数学模型,该模型将同时完成显出轮廓组成单元的检测与感知聚集。本发明直接对“高级”的轮廓组成单元,线段,进行描述,避免了目前边缘检测算法中“噪声”边缘的缺陷,将轮廓组成单元的检测与感知聚集统一在一个框架下,同时完成二者的实现。本发明方法还避免了感知聚集过程对轮廓组成单元检测算法的依赖,其输出的结果是对理想轮廓的一种逼近。逼近的结果具有良好的抗干扰性,对于复杂图像的显著轮廓提取,能获得良好的视觉效果。
附图说明
图1示出了自然图像,用Canny边缘检测得到的轮廓,和人工标注的理想轮廓;
图2示出了本方法的算法实现流程图;
图3示出了一个理想轮廓和一个线段集合对它的逼近;
图4(a)示出了本发明中线段的吸引区域;图4(b)示出了三个线段的连接情况;图4(c)示出了本发明中线段的排斥区域。
图5(a)示出了的一幅合成图像,图5(b)Canny边缘检测算法的结果,图5(c)本发明得到的结果。
图6(a)(b)示出了的一幅合成图像,图6(c)(d)Canny边缘检测算法的结果,图6(e)(f)本发明得到的结果。
具体实施方式
下面结合附图和实例对本发明作进一步详细的说明。
如图2所示,本发明方法包括以下步骤:
(1)对于输入图像I(x,y),首先获得随机生成线段中心点坐标pi=(x,y)的采样概率q(pi),i表示图像中象素的序号:
q ( p i ) = &dtri; I ( x , y ) / &Sigma; x , y &dtri; I ( x , y ) . - - - ( 1 )
其中
Figure G2008102366036D00052
为图像的梯度值计算公式为:
&dtri; I ( x , y ) = [ I ( x + 1 , y ) - I ( x , y ) ] 2 + [ I ( x , y + 1 ) - I ( x , y ) ] 2 2
(2)建立线段集合W数学模型,满足该模型的最优解,即为对图像中显著轮廓的逼近。本发明运用了可逆跳转马尔科夫链蒙特卡洛(Reversible Jump Markov chain Monte Carlo(RJMCMC))和模拟退火算法对最优线段集进行求解。其具体步骤如下:
(2.1)集合W的初始值设为空集,W={};
(2.2)根据公式(1)中的概率分布q(pi),进行随机采样,采样出一个小线段s0的中心点坐标p0=(x0,y0)。然后在数值区间[lmin,lmax]上进行均匀采样,采出该小线段的长度值l0。接下来在方向区间[0,π]上进行均匀采样,采出该小线段的方向值θ0,将该线段s0=(p0,l0,θ0)加入集合W。
数值区间[lmin,lmax]依据经验选取,lmin的取值范围通常为7—9,lmax的取值范围通常为15—17。线段长度如果过小,则计算量增大,同时可能会在结果中出现噪声;线段长度过长,则会影响最终图像中轮廓的逼近,逼近结果不够连续平滑。
(2.3)生成一个位于0到1之间的随机数rand。记录迭代次数N=N+1,N的初始值为0。
(2.3.1)如果rand小于1/3,使用步骤(2.2)中的方法随机生成一个新的线段si=(pi,li,θi),将其暂时加入集合W。此时,定义新集合W为W′,然后计算线段si的接收概率,接收概率计算公式为:
α(w,w′)=min{1,R(w,w′)}      (2)
其中R(w,w′)为Green比值,其定义为:
R ( w , w &prime; ) = P ( w &prime; , w ) f ( w &prime; ) 1 T P ( w , w &prime; ) f ( w ) 1 T - - - ( 3 )
其中P(,)为转移概率,f()为线段集合的数学模型(将在下面的文字中详细说明),T为模拟退火算法中的当前温度。T随迭代次数N的增加而减小,当N小于2000时,T=T0,N大于2000以后,T的计算公式为:
T = T 0 log ( 1 + k &times; 2000 ) - - - ( 4 )
其中k=floor(N/2000),即,小于N除以2000所得商的最大整数。
在求得线段si的接收概率α(w,w′)之后,再生成一个0到1之间的随机数r,如果α(w,w′)大于r,则线段si将被最终添加到集合W,否则将被丢掉。
(2.3.2)如果rand大于1/3且小于2/3,则在当前线段集合W中,随机选中一个线段si=(pi,li,θi),将其暂时从集合W中删除。此时,定义新集合W为W′,然后计算线段si的删除概率α(w,w′),计算公式仍采用公式(2)。在求得线段si的删除概率α(w,w′)之后,再生成一个0到1之间的随机数r,如果α(w,w′)大于r,则线段si将被最终从集合W中删除,否则将不被删除。
(2.3.3)如果rand大于2/3,则在当前线段集合W中,随机选中一个线段si=(pi,li,θi),生成一个0到1之间的随机数a,如果a<1/3,则li=li+Δl;如果1/3<a<2/3,则li=li-Δl;如果a>2/3,则li保持不变。用同样的方法调整θi的大小。只有线段中心点坐标pi不调整。这样si将成为一个新的线段si′,同样定义新集合W为W′,然后计算线段si的调整接收概率α(w,w′),计算公式仍采用公式(2)。在求得线段si的调整接收概率α(w,w′)之后,再生成一个0到1之间的随机数r,如果α(w,w′)大于r,则线段si将被最终调整为si′,否则将保持不变。
(2.4)重复步骤(2.3),每迭代一次,N的数值加1。当温度T趋于0时,算法收敛,此时的线段集合W即为所求结果。
下面对公式(3)中的P(,)和f()的具体说明:
①在步骤(2.3.1)中,随机生成一个新的线段,并添加到W中,此时W′=W∪{si},P(,)为转移概率,其定义如下:
P ( w &prime; , w ) = q d 1 card ( W ) + 1 - - - ( 5 )
P(w,w′)=qbq(pi)q(li|pi)q(θi|pi)   (6)
公式(5)、(6),card(W)为当前状态下线段的个数,qd为随机删除一个线段这种转移形式的概率,公式中qb为随机生成一个线段的这种转移形式的概率,q(pi)为随机生成线段中心点坐标的采样概率,其分布由图像的梯度确定;q(li|pi)为随机生成线段长度的采样概率,其分布为均匀分布;q(θi|pi)为随机生成线段方向的采样概率,其分布为均匀分布。由步骤(2.3)开始的随机数rand可知,qb和qd均为1/3。
在步骤(2.3.2)中,从当前线段集合W中随机删除一个线段,此时W′=W\si,其实与步骤(2.3.1)是一个逆过程,P(,)仍采用公式(5)和(6)计算,只是其中的w与w′不同。
在步骤(2.3.3)中,在当前线段集W中随机选取一个线段,然后,重新随机的调整其长度和方向,此时W′=(W\si)∪{si′},其中si′=(pi,li±Δl,θi±Δθ),在这种转移形式下,P(w′,w)等于P(w,w′)。
在说明线段集合的数学模型f()之前,首先说明线段的三种类型,如图(3)所示,每个小线段都有两个端点,假设为点U和点V,如果一个小线段的一个端点与另外一个小线段的一个端点之间的距离小于d,则认为这两个小线段为相连的。据此,小线段可分为3中类型,如果一个小线段的两个端点均为相连的,则称该线段为双连线段;如果只有一个端点是相连的,则称其为单连线段;如果两个端点均不相连,则称其为自由线段。
(i)小线段集合的数学模型为:
f(W)∝βnexp(-E(W))=βnexp-(EI(W)+ED(W))       (7)
该模型采用了概率形式的表达,f(W)是没有归一化的概率密度公式,β表示波松过程的密度,即用来控制小线段的个数,n表示当前状态下小线段的个数,EI(W)表示线段之间的关联能量,它描述了当前状态下小线段空间分布之间的关系。ED(W)表示线段的数据能量,它描述了小线段对实际图像中理想轮廓的拟合程度。通过上述建模,给出一幅图像,对其显著轮廓的逼近,就是求出公式(7)中使得f(W)为最大的一个集合W。其数学表示就是:
W*=arg min{EI(W)+ED(W)-nlogβ}      (8)
本发明中,将把上式的-nlogβ合并到EI(W)中。
(ii)用来描述线段空间分布几何关系的EI(W)定义为:
E 1 ( W ) = &omega; 0 n + &omega; 1 n f + &omega; 2 n s + &omega; a &Sigma; < s i , s j > I a ( s i , s j ) + &omega; r &Sigma; < s i , s j > I r ( s i , s j ) - - - ( 9 )
式中ω0就是公式(3)中的-logβ,ω1,ω2,ωr,ωa代表各项能量惩罚参数,除了ωa为负数之外,其余均为正数。n表示当前集合中线段总数,nf表示当前集合中自由线段个数,ns表示当前集合中单连线段个数。<si,sj>表示当前集合中两个相连的线段对,Ia(si,sj)表示两相连线段之间的吸引能量,Ir(si,sj)表示两相连线段之间的排斥能量。
(iii)相连线段之间的吸引与排斥能量计算为:
I a ( s i , s j ) = &Sigma; O 1 = U s i , V s i &Sigma; O 2 = U s j , V s j A ( C O 1 l s i / 4 &cap; C O 2 l s j / 4 ) min ( A ( C O 1 l s i / 4 ) , A ( C O 2 l s j / 4 ) ) (10)
I r ( s i , s j ) = A ( C P s i l s i / 2 &cap; C P s j l s j 2 ) min ( A ( C P s i l s i / 2 ) , A ( C P s j l s j / 2 ) ) (11)
以算上两式均采用了一个圆形区域的定义
Figure G2008102366036D00084
即圆心为o半径为r的圆。A(.)表示对面积的计算。图像中轮廓的分布是随机的,导致了小线段的分布也是随机的,在这种情况下,我们希望相邻的线段首尾相连起来,通过线段的吸引区域,就可以量化相连线段之间临近的程度,如图4(a)中的虚线圆形区域,其半径为线段长度的1/4,圆心为线段的端点,在公式(10)中有明确定义。然而,两线段之间应该满足共线连续性,即,线段之间的方向不应有太大差别。如图4(b),三个线段的相连,且共享一个端点,通过公式(10)的计算,线段对<s1,s2>与<s1,s3>具有相同的吸引能量,而从经验得知,s1与s3之间的连接应更为合理,与格式塔心理学更为吻合。基于这样的考虑,公式(11)考虑了两个线段之间的排斥因素,如图4(c),虚线圆为三个线段的排斥区域,其半径为对应线段的1/2,圆心为线段的中点(即公式(11)中的Ps)。
(iv)用于描述线段集数据能量的ED(W)定义为:
E D ( W ) = &omega; d &Sigma; s i &Element; W &mu; &prime; ( s i ) - - - ( 12 )
式中ωd为能量惩罚参数,取正数。μ′(si)是对单个线段对轮廓的拟合程度μ(si)的重新量化,μ(si)的定义,依赖于具体图像的类型,比如,彩色,二值,灰度图像等,具体定义在下面的具体实例中给出,但无论如何定义μ(si),本发明,对μ′(si)的定义均为:
&mu; &prime; ( s i ) = &infin; if&mu; ( s i ) < t 1 1 - 2 &mu; ( s i ) - t 1 t 2 - t 1 if t 1 &le; &mu; ( s i ) < t 2 - 1 if&mu; ( s i ) &GreaterEqual; t 2 - - - ( 13 )
本发明中实现了合成二值图像和灰度图像的轮廓提取,对于合成二值图像,如图5(a)所示,其像素值为0或255,对于这类图像μ(si)的数值为线段上所有对应像素的像素值均值,此种情况下,本发明中t1=190,t2=225。
对于真实的灰度图像,如图6(a)(b),对于这类图像,在计算μ(si)之前,对每个线段,先定义两个矩形,这两个矩形的大小为l×Δw,l为线段的当前长度,Δw=4,这两个矩形以线段为它们的一个共享边,且它们与线段同向,二者分别沿着线段的方向,处在线段的左边与右边,此种情况下, &mu; ( s i ) = | m R - m L | / &sigma; R 2 / n R + &sigma; L 2 / n L , mR,mL为右边与左边矩形中像素值的均值,
Figure G2008102366036D00094
为对应的标准差,nR,nL为右边与左边矩形中像素的个数,这里二者是相等的,此种情况下,本发明中t1=9,t2=10。
实例:
(1)初始化公式(9)(12)中的***参数:
ω0=20,ω1=220,ω2=40,ωa=-10000,ωr=10000,ωd=10
T0=25
此外,线段的宽度为1个像素,长度范围为lmin=9,lmax=17
线段随机调整的长度和方向为Δl=2,Δθ=π/12
(2)对于输入图像I(x,y),首先获得随机生成线段中心点坐标pi=(x,y)的采样概率:
q ( p i ) = &dtri; I ( x , y ) / &Sigma; x , y &dtri; I ( x , y ) .
其中
Figure G2008102366036D00102
为图像的梯度值计算公式为:
&dtri; I ( x , y ) = [ I ( x + 1 , y ) - I ( x , y ) ] 2 + [ I ( x , y + 1 ) - I ( x , y ) ] 2 2 .
(3)采用可逆跳转马尔科夫链蒙特卡洛(Reversible Jump Markov chain Monte Carlo(RJMCMC))算法进行迭代求解,迭代次数为3*105次。
图5与图6为本发明算法得到的结果。
根据本发明的典型实施例,用于实现本发明的计算机***可以包括,特别是,中央处理器(CPU)、存储器和输入/输出(I/O)接口。计算机***通常通过I/O接口与显示器和诸如鼠标和键盘此类的各种输入设备相连,配套电路可以包括像高速缓存、电源、时钟电路和通信总线这样的电路。存储器可以包括随机存储器(RAM)、只读存储器(ROM)、磁盘驱动器、磁带机等,或它们的组合。计算机平台还包括操作***和微指令代码。此处所述各种过程和功能可以是通过操作***执行的微指令代码或应用程序(或它们的组合)的一部分。此外,各种其他***设备可以连接到该计算机平台,如附加数据存储设备和打印设备。
还应理解,因为附图中所述的某些构成***的组件和方法步骤可以软件形式来实现,所以***组件(或过程步骤)之间的实际连接可能有所不同,具体视本发明的编程方式而定。基于此处提出的本发明原理,相关领域的普通专业人员可以设想本发明的这些以及类似实施方案或配置。

Claims (1)

1.一种复杂图像中显著轮廓提取方法,其步骤包括:
(1)对于输入图像I(x,y),首先按照式(i)获得随机生成线段中心点坐标pi=(x,y)的采样概率q(pi),i表示图像中象素的序号:
q(pi)=▽I(x,y)/∑x,y▽I(x,y)    (i)
其中▽I(x,y)为图像的梯度值,其计算公式为式(ii):
&dtri; I ( x , y ) = [ I ( x + 1 , y ) - I ( x , y ) ] 2 + [ I ( x , y + 1 ) - I ( x , y ) ] 2 2 - - - ( ii )
(2)按照下述所有过程建立线段集合W数学模型,对图像中显著轮廓进行逼近:
(2.1)集合W的初始值设为空集,W={};
(2.2)根据步骤(1)得到的采样概率q(pi),采样得到一个线段s0的中心点坐标p0=(x0,y0),然后在预设的数值区间[lmin,lmax]上进行均匀采样,采出该线段的长度值l0,接下来在方向区间[0,π]上进行均匀采样,采出该线段的方向值θ0,将该线段s0=(p0,l0,θ0)加入集合W;
(2.3)生成一个位于0到1之间的随机数rand,记录迭代次数N=N+1,N的初始值为0;如果rand小于等于qb,进入步骤(2.4),如果rand大于qb且小于等于qd+qb,转入步骤(2.6),如果rand大于qd+qb,,转入步骤(2.8);qd为随机删除一个线段的转移形式的概率,qb为随机生成一个线段的转移形式的概率;
(2.4)使用步骤(2.2)中的方法随机生成一个新的线段si=(pi,li,θi),将其暂时加入集合W,此时,定义新集合W为W′,W′=W∪{si},P(,)为转移概率,其定义如下:
P ( w &prime; , w ) = q d 1 card ( W ) + 1 - - - ( iii )
P(w,w′)=qbq(pi)q(li|pi)q(θi|pi)    (iv)
公式(iii)中card(W)为当前状态下线段的个数;q(pi)为随机生成线段中心点坐标的采样概率,其分布由图像的梯度确定;q(li|pi)为随机生成线段长度的采样概率,且q(li|pi)其分布为均匀分布;q(θi|pi)为随机生成线段方向的采样概率,且q(θi|pi)其分布为均匀分布;
(2.5)按照公式(v)计算线段si的接收概率α1(w,w′);在求得线段si的接收概率α1(w,w′)之后,再生成一个0到1之间的随机数r,如果α1(w,w′)大于r,则线段si将被最终添加到集合W,否则将被丢掉;然后转入步骤(3);
(2.6)在当前线段集合W中,随机选中一个线段si=(pi,li,θi),将其暂时从集合W中删除;此时,按照定义新集合W为W′,从当前线段集合W中随机删除一个线段,此时W′=W\si,P(,)仍采用公式(iii)和(iv)计算;
(2.7)按照公式(v)计算线段si的删除概率α2(w,w′),在求得线段si的删除概率α2(w,w′)之后,再生成一个0到1之间的随机数r,如果α2(w,w′)大于r,则线段si将被最终从集合W中删除,否则将不被删除;然后转入步骤(3);
(2.8)在当前线段集合W中,随机选中一个线段si=(pi,li,θi),生成一个0到l之间的随机数a,如果a<1/3,则li=li+Δl;如果1/3<a<2/3,则li=li-Δl;如果a>2/3,则li保持不变;用同样的方法调整θi的大小;线段中心点坐标pi保持不变;这样si将成为一个新的线段si′,同样定义新集合W为W′,W′=(W\si)∪{si′},其中si′=(pi,li±Δl,θi±Δθ),在这种转移形式下,P(w′,w)等于P(w,w′);
(2.9)按照公式(v)计算线段si的调整接收概率α3(w,w′);在求得线段si的调整接收概率α3(w,w′)之后,再生成一个0到1之间的随机数r,如果α3(w,w′)大于r,则线段si将被最终调整为si′,否则将保持不变;
α(w,w′)=min{1,R(w,w′)}    (v)
其中R(w,w′)为Green比值,其定义为:
R ( w , w &prime; ) = P ( w &prime; , w ) f ( w &prime; ) 1 T P ( w , w &prime; ) f ( w ) 1 T - - - ( vi )
其中f()为线段集合的数学模型,T为模拟退火算法中的当前温度;
(3)重复步骤(2.3),每迭代一次,N的数值加1;当温度T趋于0时,算法收敛,此时的线段集合W为该模型的最优解,得到图像的显著轮廓。
CN2008102366036A 2008-11-28 2008-11-28 一种复杂图像中显著轮廓提取方法 Expired - Fee Related CN101436255B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2008102366036A CN101436255B (zh) 2008-11-28 2008-11-28 一种复杂图像中显著轮廓提取方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2008102366036A CN101436255B (zh) 2008-11-28 2008-11-28 一种复杂图像中显著轮廓提取方法

Publications (2)

Publication Number Publication Date
CN101436255A CN101436255A (zh) 2009-05-20
CN101436255B true CN101436255B (zh) 2010-09-01

Family

ID=40710689

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2008102366036A Expired - Fee Related CN101436255B (zh) 2008-11-28 2008-11-28 一种复杂图像中显著轮廓提取方法

Country Status (1)

Country Link
CN (1) CN101436255B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102087737B (zh) * 2010-06-21 2012-06-13 无锡安则通科技有限公司 Dsp***中图像快速边缘提取算法
CN101916373B (zh) * 2010-08-11 2012-07-04 西安电子科技大学 基于小波检测和脊线跟踪的道路半自动提取方法
JP5683888B2 (ja) * 2010-09-29 2015-03-11 オリンパス株式会社 画像処理装置、画像処理方法、および画像処理プログラム
CN102103750B (zh) * 2011-01-07 2012-09-19 杭州电子科技大学 基于韦伯定理和中央-周围假设的视觉显著性检测方法
CN103473759B (zh) * 2013-06-24 2016-07-06 南京理工大学 一种WKPCA同质度校正nCRF抑制的微光图像显著轮廓提取方法
CN108932722A (zh) * 2018-07-12 2018-12-04 浙江工业大学 一种确定目标单像素轮廓的方法

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101093546A (zh) * 2007-07-11 2007-12-26 苏州大学 一种数字图像轮廓形态的识别方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101093546A (zh) * 2007-07-11 2007-12-26 苏州大学 一种数字图像轮廓形态的识别方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
桑农等.基于初级视皮层抑制的轮廓检测方法.红外与毫米波学报.2007,26(1),47-51,60. *
胡志萍等.一种基于图像轮廓信息的新视点图像生成算法.大连理工大学学报.2006,46(3),361-366. *

Also Published As

Publication number Publication date
CN101436255A (zh) 2009-05-20

Similar Documents

Publication Publication Date Title
CN101436255B (zh) 一种复杂图像中显著轮廓提取方法
Li et al. Region-based urban road extraction from VHR satellite images using binary partition tree
Gruen et al. Road extraction from aerial and satellite images by dynamic programming
JP4979033B2 (ja) オブジェクト・ベース視覚的注意モデルの顕著性推定
CN103699900B (zh) 卫星影像中建筑物水平矢量轮廓自动批量提取方法
CN104134217A (zh) 一种基于超体素图割的视频显著物体分割方法
CN104268583A (zh) 基于颜色区域特征的行人重识别方法及***
CN103578119A (zh) 基于超像素的Codebook动态场景中目标检测方法
CN102024258A (zh) 具有边界保持特性的遥感图像多尺度分割方法
CN107945244A (zh) 一种基于人脸照片的简笔画生成方法
CN103093470A (zh) 一种具有尺度无关特性的快速多模态图像协同分割方法
CN101840582B (zh) 一种地籍图地块的边界数字化方法
Prasad et al. Vectorized image segmentation via trixel agglomeration
CN100375124C (zh) 一种骨架化物体重建方法
CN107292896A (zh) 基于Snake模型的轮廓提取方法
CN103578107A (zh) 一种交互式图像分割方法
CN106326872A (zh) 一种扩增现实***中手势轮廓的提取方法
CN109448093B (zh) 一种风格图像生成方法及装置
Delingette Adaptive and deformable models based on simplex meshes
CN104331883A (zh) 一种基于非对称逆布局模型的图像边界提取方法
CN102270338B (zh) 基于改进图表示的重复物体有效分割方法
CN103065302B (zh) 一种基于离群数据挖掘的图像显著性检测方法
Keller et al. Extracting and visualizing structural features in environmental point cloud LiDaR data sets
Demarsin et al. Detection of closed sharp feature lines in point clouds for reverse engineering applications
Garai et al. A split and merge procedure for polygonal border detection of dot pattern

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C17 Cessation of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20100901

Termination date: 20121128