CN101447076A - 一种web图像中感兴趣区域的分割方法 - Google Patents

一种web图像中感兴趣区域的分割方法 Download PDF

Info

Publication number
CN101447076A
CN101447076A CNA2008101627467A CN200810162746A CN101447076A CN 101447076 A CN101447076 A CN 101447076A CN A2008101627467 A CNA2008101627467 A CN A2008101627467A CN 200810162746 A CN200810162746 A CN 200810162746A CN 101447076 A CN101447076 A CN 101447076A
Authority
CN
China
Prior art keywords
image
rightarrow
area
interest
deformation model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA2008101627467A
Other languages
English (en)
Other versions
CN101447076B (zh
Inventor
姚敏
朱蓉
柳一鸣
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang University ZJU
Original Assignee
Zhejiang University ZJU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University ZJU filed Critical Zhejiang University ZJU
Priority to CN2008101627467A priority Critical patent/CN101447076B/zh
Publication of CN101447076A publication Critical patent/CN101447076A/zh
Application granted granted Critical
Publication of CN101447076B publication Critical patent/CN101447076B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Image Analysis (AREA)
  • Image Processing (AREA)

Abstract

本发明公开了一种WEB图像中感兴趣区域的分割方法。首先,构造了一种新的形变模型,解决了凹陷区域和伪边界问题,改进了活动轮廓的收敛精度。其次,给出了一种在彩色空间Lab中基于图像子块和基于颜色和纹理特征的聚类方法,既实现了感兴趣区域的粗分割,又实现了活动轮廓初始位置的自动获取,加速了形变模型的执行速度,同时也避开了噪声和孤立边的干扰。最后,提出了一种形变模型的两段执行策略,有效分割WEB图像中复杂和不规则区域,使形变模型更具灵活性和实用性。本发明充分结合基于边界的形变模型和基于区域的聚类的优势,有效提高图像中感兴趣区域的分割精度,减少分割的整体执行时间。

Description

一种WEB图像中感兴趣区域的分割方法
技术领域
本发明涉及图像处理技术,尤其是涉及一种WEB图像中感兴趣区域的分割方法。
背景技术
随着互联网和社会信息化的蓬勃发展,每天都有海量的数字图像资源从各种图像采集***中产生,如何有效地利用这些WEB图像(WEB是World Wide Web的简称,也就是万维网;WEB图像是指存在于万维网上的图像)不仅是用户最迫切的需求,而且也是当前图像理解的首要任务。在相当多的情况下,用户并不关心图像所表达的整体意义,而更多关注的是图像中具有特定含义的感兴趣区域。常用的图像分割方法大致可分为两类:基于区域的分割和基于边界的分割。尽管目前有许多成熟的分割算法,但都有其自身的局限性和针对性。
基于形变模型的图像分割是一种基于边界的分割方法,采用的是自顶向下的目标提取技术,能将图像特征、对象轮廓和先验知识融于一个统一的分割过程中,适合于识别任意边界形状的感兴趣区域。自Kass等人于1987年在《Journalof Computer Vision》上发表的文章《Snake:Active Contour Models》中首次提出基于活动轮廓框架的形变模型(传统形变模型)以来,由于其具有允许与用户直接交互、易于加入形状约束、紧凑而灵活的曲线表达形式等其它图像分割方法无法比拟的特点,成为近期该领域研究的一个热点。然而,传统形变模型也有其自身的缺陷,例如:对活动轮廓的起始位置较为敏感;无法收敛到凹陷区域的边界;容易受到局部极值点的影响。
为了解决以上问题,研究者们提出了一些改进模型,其中最具代表性的有以下三种:Cohen等人通过引入向外膨胀或向内收缩的压力(气球力)控制活动轮廓的移动,并借助于气球力克服了孤立边或噪声引起的局部极值点的影响。Cohen and Cohen提出一种距离势能力,其中用于定义势能的距离映射图由图像中的每个像素点与离它最近的活动轮廓上控制点的距离计算得到。但是,这两种方法在对具有凹陷边界的感兴趣区域进行分割时,当活动轮廓接近凹陷时模型会产生水平方向上相反的力,使活动轮廓无法正确收敛到感兴趣区域的边界。Xu等人提出用梯度矢量流(GVF)扩大传统形变模型的捕捉范围,有效解决了形变模型对活动轮廓初始位置的依赖性,但GVF中梯度矢量的扩散过程速度缓慢,也很难逼近深凹陷区域的边界。其次,这些方法都是围绕灰度图像进行分割,当需要对彩色图像进行分割时,常用的方法就是先转为灰度图像。然而,WEB图像具有颜色的多样性、区域纹理的易变性和对象形状的不规则性等特点,再加上图像本身模糊和不均匀以及成像时受到噪声干扰等因素使得在这些形变模型上都难以获得理想的分割效果。因此,要精确地分割出WEB图像中的感兴趣区域,需要充分结合目标的底层视觉属性和高层语义信息,寻求一种与人类感知更为贴近的分割方法。
发明内容
由于WEB图像中感兴趣区域通常具有丰富的颜色和纹理、不规则的形状等特性,基于现有形变模型进行的分割无法获得好的效果。本发明的目的在于提供一种WEB图像中感兴趣区域的分割方法,利用了WEB图像中感兴趣区域的颜色、纹理和形状特性,弥补了传统形变模型无法对凹陷边界正确分割、对活动轮廓的初始位置依赖性大、容易受到局部极值点干扰等缺陷;同时也改善了灰度分割法对彩色图像进行分割的不足。
本发明采用的技术方案是:
一种WEB图像中感兴趣区域的分割方法,包括以下内容:
1)利用颜色梯度定义图像能量,以三角形内心引力为主、活动轮廓中心引力为辅构造约束能量,建立符合WEB图像特性的形变模型;
2)在彩色空间Lab中提取颜色和纹理信息,利用自动聚类充当初始化操作,实现对图像中感兴趣区域的粗分割;
3)对聚类结果进行二值化处理,产生仅由前景和背景构成的二值掩码图,采用生成射线法在前景区域边界上选取控制点,得到形变模型中活动轮廓的初始位置;
4)采用两段执行策略实施形变模型的具体应用,获取图像中感兴趣区域的精确分割结果。
所述建立符合WEB图像特性的形变模型,在形变模型的建立过程中,构造能量函数 E snake = ∫ 0 1 E snake ( v ( s ) ) ds = ∫ 0 1 ( E int ( v ( s ) ) + E image ( v ( s ) ) + E con ( v ( s ) ) ) ds ; 利用色度信息定义图像能量 E image = - | ▿ C H ( x , y ) | ; 利用控制点vi指向三角形Δvi-1vivi+1内心oi的矢量定义曲率,得到由三角形内心引力产生的约束能量 E con ( i ) = | v i o i → | , 并增加三点共线判断,得到来自于活动轮廓中心引力的辅助约束能量 E con ( i ) = f i cos ( cv i → , cv i + 1 → ) = ( f i / ( | cv i → | | cv i + 1 → | ) ) ( cv i → · cv i + 1 → ) .
所述实现对图像中感兴趣区域的粗分割,在感兴趣区域的粗分割过程中,利用彩色空间Lab在第i个图像子块中提取颜色特征
Figure A200810162746D00062
Figure A200810162746D00063
Figure A200810162746D00064
利用小波变换提取纹理特征
Figure A200810162746D00066
Figure A200810162746D00067
并利用k-means算法按照事先提取的六维特征将M×M的图像子块区分到不同的簇中,簇的个数选择采用自适应方式。
所述得到形变模型中活动轮廓的初始位置,在活动轮廓初始位置的自动获取过程中,对聚类结果进行二值化处理,产生仅由前景和背景构成的二值掩码图,并以前景所在区域的中心为出发点,向外生成L条射线,相邻两条射线之间的夹角为2π/L,由这些射线和前景区域边界的交点连接而成的曲线构成形变模型中活动轮廓的初始位置;
所述采用两段执行策略实施形变模型的具体应用,在形变模型的两段执行策略的实施过程中,第一段中不加入约束能量,以减少计算曲率的额外代价,利用图像能量驱使活动轮廓收敛;第二段中加入约束能量,以获得活动轮廓的整体收敛,并在第一段中用控制点取样间距较大的快速收敛;第二段中用取样间距较小的慢速收敛,实现图像中感兴趣区域的精确分割。
本发明具有的有益效果是:
本发明充分利用了WEB图像中感兴趣区域的颜色、纹理和形状特性,弥补了传统形变模型无法对凹陷边界正确分割、对活动轮廓的初始位置依赖性大、容易受到局部极值点干扰等缺陷;同时也改善了灰度分割法对彩色图像进行分割的不足。利用基于区域的自动聚类进行初始化,对图像中感兴趣区域进行粗分割;利用基于边界的形变模型发生形变,对图像中感兴趣区域进行精分割,有效提高了分割精度,减少了分割的整体执行时间。最后应用到合成图像和真实图像上,取得了令人满意的分割结果。
附图说明
图1是本发明的一种WEB图像中感兴趣区域的分割方法的流程图。
图2是各种形变模型对凹陷区域物体的分割结果比较。
图3是各种形变模型对图像中感兴趣区域的分割结果比较(275次迭代)。
图4为取不同的图像子块时本发明中提出的形变模型对图像中感兴趣区域的分割结果比较(迭代次数:第一段为100;第二段为50)。
图5为不同的活动轮廓初始位置的获取方法对各种形变模型的影响。
具体实施方式
以下结合附图和实施例对本发明作进一步详细描述。
如图1所示,本发明的一种WEB图像中感兴趣区域的分割方法主要包括以下步骤:
1、形变模型的建立:
利用颜色梯度定义图像能量,以三角形内心引力为主、活动轮廓中心引力为辅构造约束能量,建立符合WEB图像特性的形变模型,具体如下:
传统形变模型中的活动轮廓是一条可伸缩的曲线,通过对其能量函数最小化控制曲线形变过程,最后得到的具有最小能量的封闭曲线就是感兴趣区域的边界。从数学角度,活动轮廓定义为图像平面上的一条参数化曲线v(s)=[x(s),y(s)],s∈[0,1],其能量函数写为:
E snake = ∫ 0 1 E snake ( v ( s ) ) ds = ∫ 0 1 ( E int ( v ( s ) ) + E image ( v ( s ) ) + E con ( v ( s ) ) ) ds - - - ( 1 )
其中:Eint为内部能量,用于保持活动轮廓在形变过程中的连续性和平滑性;Eimage为图像能量,来源于图像自身的特征;Econ为约束能量,由外力产生。Eimage与Econ合为外部能量,用于诱导活动轮廓朝着感兴趣区域的边界移动,记为:
Eext=Eimage+Econ                 (2)
为得到活动轮廓与感兴趣区域边界的一个最佳匹配,活动轮廓需要在形变过程中不断地改变和调整自身形状,以达到能量函数最小化的目的,即:
v ′ ( s ) = aeg min s ∈ [ 0,1 ] E snake ( v ( s ) ) - - - ( 3 )
然而,传统形变模型中未对约束能量Econ明确定义,仅由图像能量构成的外部能量不足以驱使活动轮廓完全收敛到具有凹陷边界的感兴趣区域。考虑到WEB图像中感兴趣区域通常具有显著的颜色特性和形状不规则性,本发明用颜色信息重新定义图像能量
Figure A200810162746D00073
的表达式,并利用感兴趣区域边界上的特征点构造约束能量Econ,使活动轮廓在内部能量、图像能量和约束能量的共同作用下向图像中感兴趣区域的边界移动。新的形变模型中能量函数的离散化形式为:
E snake = Σ i = 1 N ( α E int 1 ( i ) + β E int 2 ( i ) + γ E image ( i ) + δ E con ( i ) ) - - - ( 4 )
其中:N为活动轮廓上控制点的个数;Eint1为内部能量中的弹性能量,即Eint1=|vi-vi-1|2/2;Eint2为内部能量中的刚性能量,即Eint2=|vi-1-2vi+vi+1|2/2;Eimage为外部能量中的图像能量,由式(5)定义;Econ为外部能量中的约束能量,由式(8)或式(20)定义。α,β,γ和δ为权值,用于调整各能量项对整体能量函数的贡献值。
1)定义图像能量
WEB图像基本上都是彩色图像,来源也极其多样化,这就使得在对WEB图像进行分割时不可避免地会遇到一些由于阴影或高光产生的伪边界情况。由于色度是一种在阴影、遮蔽及高光等因素的影响下,仍能独立于目标形状和观察角度的颜色特征,本发明中用色度代替灰度计算梯度值,能使形变模型在分割过程中辨别真伪边界。用颜色梯度定义图像能量Eimage为:
E image = - | ▿ C H ( x , y ) | - - - ( 5 )
其中:CH(x,y)表示色度图像;
Figure A200810162746D00083
为梯度算子。
鉴于彩色空间Lab是一种接近人类感知的彩色空间,且能用欧氏距离方便地度量颜色相似性,本发明在彩色空间Lab中计算色度和纹理(从a分量和b分量中提取色度;从L分量中提取纹理)。色度图像CH(x,y)利用图像的色度梯度计算色度轮廓。由于色度定义在[0,2π]的环形区域上,色度梯度的计算应当用不同色度之间的角度距离来度量。设h1和h2为两个色度值,它们之间的角度距离d(h1,h2)定义为:
d(h1,h2)=arccos(cosh1cosh2+sinh1sinh2)      (6)然后利用Canny算子检测边界点,其中色度差的计算采用式(6),分别得到在X方向上的梯度分量
Figure A200810162746D00084
和Y方向上的梯度分量
Figure A200810162746D00085
于是在位置(x,y)处控制点的梯度幅值为 C H x 2 ( x , y ) + C H y 2 ( x , y ) , 梯度方向为
Figure A200810162746D00087
2)构造约束能量
约束能量的加入目的是为了解决图像中感兴趣区域的凹陷边界收敛问题,挖掘边界上点的形状特征和运动趋势对构造约束能量极有帮助。假设vi-1、vi、vi+1是活动轮廓上三个连续的控制点,用当前控制点vi指向三角形Δvi-1vivi+1内心Oi的矢量来定义曲率,并构造由三角形内心引力产生的约束力:
F con ( i ) = κ i = v i o i → - - - ( 7 )
然后用矢量
Figure A200810162746D00092
的长度(模)定义约束力Fcon产生的能量大小:
E con ( i ) = | v i o i → | - - - ( 8 )
可以得出:活动轮廓上控制点vi在位置(xi,yi)处曲率越大,表示由vi-1、vi、vi+1三点围成的曲线的弯曲程度越大,矢量
Figure A200810162746D00094
的长度就越大,则vi受到来自于三角形内心引力的约束能量也越大;反之,曲率越小,曲线的弯曲程度越小,矢量
Figure A200810162746D00095
的长度就越小,受到三角形内心的引力也越小。
下面利用三角形的向量形式求解矢量的值。令与三角形Δvi-1vivi+1三条边方向相同的三个单位向量分别为:
e 1 → = v i - 1 v i → / | v i - 1 v i → | , e 2 → = v i v i + 1 → / | v i v i + 1 → | , e 3 → = v i + 1 v i - 1 → / | v i + 1 v i - 1 → )| - - - ( 9 )
由于三角形的内心是三角形各内角平分线的交点,运用角平分线的向量形式定义:
v i - 1 o i → = λ 1 ( e 1 → - e 3 → ) , λ 1 ≥ 0 - - - ( 10 )
v i o i → = λ 2 ( e 2 → - e 1 → ) , λ 2 ≥ 0 - - - ( 11 )
v i + 1 o i → = λ 3 ( e 3 → - e 2 → ) , λ 3 ≥ 0 - - - ( 12 )
其中:λ1,λ2,λ3均为系数,则:
v i - 1 v i → = v i - 1 o i → - v i o i → ⇔ | v i - 1 v i → | · e 1 → = λ 1 ( e 1 → - e 3 → ) - λ 2 ( e 2 → - e 1 → ) - - - ( 13 )
v i v i + 1 → = v i o i → - v i + 1 o i → ⇔ | v i v i + 1 → | · e 2 → = λ 2 ( e 2 → - e 1 → ) - λ 3 ( e 3 → - e 2 → ) - - - ( 14 )
v i + 1 v i - 1 → = v i + 1 o i → - v i - 1 o i → ⇔ | v i + 1 v i - 1 → | · e 3 → = λ 3 ( e 3 → - e 2 → ) - λ 1 ( e 1 → - e 3 → ) - - - ( 15 )
又因为:
v i - 1 v i → + v i v i + 1 → + v i + 1 v i - 1 → = 0 ⇔ | v i - 1 v i → | · e 1 → + | v i v i + 1 → | · e 2 → + | v i + 1 v i - 1 → | · e 3 → - - - ( 16 )
由(13),(14),(15),(16)可得:
λ 1 = ( | v i - 1 v i → | · | v i + 1 v i - 1 → | ) / ( | v i - 1 v i → | + | v i v i + 1 → | + | v i + 1 v i - 1 → | ) λ 2 = ( | v i v i + 1 → | · | v i - 1 v i → | ) / ( | v i - 1 v i → | + | v i v i + 1 → | + | v i + 1 v i - 1 → | ) λ 3 = ( | v i + 1 v i - 1 → | · | v i v i + 1 → | ) / ( | v i - 1 v i → | + | v i v i + 1 → | + | v i + 1 v i - 1 → | ) - - - ( 17 )
故,式(11)可以重写为:
v i o i → = λ 2 ( e 2 → - e 1 → ) = ( ( | v i v i + 1 → | · | v i - 1 v i → | ) / ( | v i - 1 v i → | + | v i v i + 1 → | + | v i + 1 v i - 1 → | ) ) ( v i v i + 1 → / | v i v i + 1 → | - v i - 1 v i → / | v i - 1 v i → | ) - - - ( 18 )
= ( | v i - 1 v i → | · v i v i + 1 → ) / ( | v i - 1 v i → | + | v i v i + 1 → | + | v i + 1 v i - 1 → | ) - ( | v i v i + 1 → | · v i - 1 v i → ) / ( | v i - 1 v i → | + | v i v i + 1 → | + | v i + 1 v i - 1 → | )
在式(18)中, | v i - 1 v i → | / ( | v i - 1 v i → | + | v i v i + 1 → | + | v i + 1 v i - 1 → | ) | v i v i + 1 → | / ( | v i - 1 v i → | + | v i v i + 1 → | + | v i + 1 v i - 1 → | ) 为常数,不妨设为k1与k2,代入式(18)中为:
v i o i → = k 1 v i v i + 1 → - k 2 v i - 1 v i →
= k 1 ( ( x i + 1 - x i ) , ( y i + 1 - y i ) ) - k 2 ( ( x i - x i - 1 ) , ( y i - y i - 1 ) )
= ( k 1 ( x i + 1 - x i ) , k 1 ( y i + 1 - y i ) ) - ( k 2 ( x i - x i - 1 ) , k 2 ( y i - y i - 1 ) ) - - - ( 19 )
= ( k 1 ( x i + 1 - x i ) - k 2 ( x i - x i - 1 ) ) , k 1 ( ( y i + 1 - y i ) - k 2 ( y i - y i - 1 ) )
= ( k 1 x i + 1 - ( k 1 + k 2 ) x i + k 2 x i - 1 , k 1 y i + 1 - ( k 1 + k 2 ) y i + k 2 y i - 1 )
由上述推导得出控制点vi在矢量
Figure A200810162746D001013
方向上的约束能量的大小为 ( k 1 x i + 1 - ( k 1 + k 2 ) x i + k 2 x i - 1 ) 2 + ( k 1 y i + 1 - ( k 1 + k 2 ) y i + k 2 x i - 1 ) 2 .
考虑到当活动轮廓上连续的三个控制点共线无法构成三角形时,由三角形内心引力产生的约束能量等于零,本发明增加三点共线判断,若三点共线判断成立则加入增补外力(来自相邻控制点之间的作用力)。假设活动轮廓中心c在矢量
Figure A200810162746D00111
方向上产生的作用力为Fci,利用余弦定理计算矢量的夹角,则作用力Fci在矢量
Figure A200810162746D00112
方向上产生的能量为:
E con ( i ) = f i cos ( cv i → , cv i + 1 → ) = ( f i / ( | cv i → | | cv i + 1 → | ) ) ( cv i → · cv i + 1 → ) - - - ( 20 )
其中:fi为作用力Fci的值;·为内积。在式(20)中,为常数,不妨设为k3,代入式(20)中为:
E con ( i ) = k 3 ( cv i → · cv i + 1 → ) = k 3 ( ( x i - x c ) ( x i + 1 - x c ) + ( y i - y c ) ( y i + 1 - y c ) ) - - - ( 21 )
其中:活动轮廓中心c的位置为(xc,yc),令 x c = Σ i = 1 N x i / N , y c = Σ i = 1 N y i / N .
2、感兴趣区域的粗分割:
在彩色空间Lab中提取颜色和纹理信息,利用自动聚类充当初始化操作,实现对图像中感兴趣区域的粗分割,具体如下:
对于来自于WEB环境中的图像,直接用形变模型对图像中的感兴趣区域进行精确分割是困难的,需要加入一个既能确定区域大致位置又能方便获取模型中活动轮廓初始位置的初始化操作。由于这个操作不需要获得精确的分割效果,主要是将感兴趣区域从背景中分割出来,故更注重的是较低的计算代价。本发明采用基于图像子块的聚类方法实现感兴趣区域的粗分割。首先将图像分成大小为M×M的不相交的子块,然后对每个子块提取图像特征,再用k-means算法进行自动聚类。子块大小的选取以保证感兴趣区域的完整性为前提,当子块大小越大时,计算时间越短,而提取的特征将越粗糙;反之,当子块大小越小时,提取的特征越细致,但计算量将增大。为了折衷计算速度和特征有效性,在本发明中用4×4的子块大小作为默认值。
1)提取图像特征
针对每个图像子块i,在彩色空间Lab中提取的图像特征中颜色为三维,是三个颜色分量在图像子块中的均值,记为:
Figure A200810162746D00118
Figure A200810162746D001110
纹理特征也为三维,是经过小波变换(小波变换对分析复杂纹理非常有效)后三个高频带HL、LH、HH上能量的平方根,假设HL频带上的系数为:{hli,j,hli,j+1,hli+1,j,hli+1,j+1};LH频带上的系数为:{lhi,j,lhi,j+1,lhi+1,j,lhi+1,j+1};HH频带上的系数为:
{hhi,j,hhi,j+1,hhi+1,j,hhi+1,j+1},则三个纹理特征分别表示为:
f i 4 = ( ( hl i , j 2 + hl i , j + 1 2 + hl i + 1 , j 2 + hl i + 1 , j + 1 2 ) / 4 ) 1 / 2 ;
f i 5 = ( ( lh i , j 2 + lh i , j + 1 2 + lh i + 1 , j 2 + lh i + 1 , j + 1 2 ) / 4 ) 1 / 2 ;
f i 6 = ( ( hh i , j 2 + hh i , j + 1 2 + hh i + 1 , j 2 + hh i + 1 , j + 1 2 ) / 4 ) 1 / 2 .
2)执行自动聚类
k-means算法是由MacQueen提出的一种快速聚类方法,本发明中利用该算法将图像子块按照提取的六维特征聚集到各个簇中,以此达到将图像分割成不同区域的目的。由于k-means算法是一种无监督聚类算法,簇的个数需要结合先验知识指定,在本发明中采用一种自适应选择簇个数的方法,即以保证目标完整性为前提,从取值2开始逐步地增加簇的个数,直到前提不能满足为止。
3、活动轮廓初始位置的自动获取:
对聚类结果进行二值化处理,产生仅由前景和背景构成的二值掩码图,采用生成射线法在前景区域边界上选取控制点,得到形变模型中活动轮廓的初始位置,具体如下:
1)生成二值掩码图
由于待分割图像的复杂程度的不同,导致自动聚类得到的簇的个数也不同。本发明中由于只需将感兴趣区域与背景区分开,故为方便起见,无论簇的个数是多少都需经过二值化处理,即获得仅由前景与背景构成的二值掩码图。操作过程为:先为原图像生成一幅相同大小的掩码图,然后对原图像中每一个像素点进行处理,若是属于感兴趣区域内(包括感兴趣区域边界上)的点,则在掩码图中对应位置上设置值为1(前景),若是属于感兴趣区域外的点,全部视作背景,则在掩码图中对应位置上设置值为0(背景),直到原图像所有的像素点都处理完毕。
2)得到活动轮廓的初始位置
利用生成射线法在前景区域边界上选取控制点,得到活动轮廓的初始位置:
a)以二值掩码图中感兴趣区域的簇中心为出发点,构造L条射线li(i=1,2,...,L),相邻的两条射线之间的夹角为2π/L。
b)对于每条射线,从簇中心出发寻找值发生改变的像素点,即为感兴趣区域的边界点。
c)依次对L条射线进行步骤c)的操作,将得到的L个边界点按顺序连接起来形成一条封闭曲线。
d)对上面得到的曲线进行样条插值,得到合适的活动轮廓上控制点的个数(一般设定两个控制点之间的最大间距和最小间距),此曲线即为进行形变的活动轮廓的初始位置。
4、形变模型的两段执行:
采用两段执行策略实施形变模型的具体应用,获取图像中感兴趣区域的精确分割结果,具体如下:
两段执行策略是在实现形变模型时采用的一种加快分割执行速度的方法。
由于形变模型在每次迭代中都要计算活动轮廓上每个控制点的曲率值,需要花费的计算时间与控制点个数成正比。其次,过早地在形变模型中加入约束能量,如果没有调整好参数的取值,当外力过弱时活动轮廓的收敛速度会变慢;反之,当外力过强时,即使除凹陷以外的其它区域都已收敛到正确边界,随着活动轮廓继续向凹陷区域逼近,已正确到达感兴趣区域边界位置的曲线段也会越过边界,出现过收敛的现象。考虑到以上这些情况,提出两段执行策略。
1)第一段:利用传统形变模型能较好收敛到非凹陷区域且不需要增加计算控制点曲率的额外代价的优势,先使活动轮廓迅速收敛到一个较好的范围。
2)第二段:加入来自三角形内心引力(活动轮廓中心引力做增补)的约束能量。凹陷区域陷得越深,约束能量就加得越大,驱动活动轮廓快速收敛到凹陷区域的边界。
两点说明:
a)两段迭代次数的划分主要根据感兴趣区域的边界特点而定,例如:当区域边界总体比较平坦,有一到两个凹陷或凸出时,可适当放大第一段比例;当区域边界相对复杂,出现的凹陷或凸出较多时,可适当放大第二段比例。若要自动设置划分比例,折衷的方法是对半分。
b)活动轮廓上控制点的取样采用的是重抽样机制,即在每次迭代中不规定取样的控制点个数,而只是规定控制点之间的最大和最小间距,以自适应地增加和删减控制点。考虑到间距与分割速度、处理精度有关,间距越大、控制点个数越少、分割速度越快、处理就越粗糙;相反,间距越小、控制点个数越多、分割速度越慢、处理就越精细,故第一段中采用间距较大的快速收敛;第二段中采用间距较小的慢速收敛。这样做的好处是当活动轮廓接近感兴趣区域的边界时,允许活动轮廓做缓慢移动,得到更为精细的分割效果。这种用两段策略实现的方法,使分割效果更好、速度也更快,不但适合弱边界的场合,而且当遇到需要分割的区域边界非常复杂时,也可通过调整每段迭代次数比例、改变控制点取样间距和扩充段数来得到令人满意的分割结果,使形变模型更具灵活性和实用性。
为验证本发明中提出的分割方法的有效性,设计四组实施例子用于比较本发明中形变模型与其它模型的分割结果。所用实验对象有合成图像、也有来自于Corel图像库和WEB环境中的真实图像。实验环境为1.86GHZ T2350 CPU 2G内存,所有程序用MATLAB7.0编程实现。
实施例1:图2为各种形变模型对凹陷区域物体的分割结果比较。图像大小
为64×64。((a)传统形变模型(α=1,β=0.2,γ=10,δ=0)(200次迭代);(b)气球力模型(α=1,β=0.2,γ=10,δ=0.05)(200次迭代);(c)距离势能模型(α=0.05,β=0,γ=0.5,δ=0)(200次迭代);(d)GVF模型(α=0.05,β=0,γ=1,δ=0.5)(200次迭代);(e)本发明中的改进模型(α=1,β=0.2,γ=10,δ=4)(180次迭代);(f)本发明中的改进模型的两段执行策略(α=1,β=0.2,γ=10,δ=0;δ=4)(140次迭代))。
形变模型中各能量项的权值选择既考虑不同模型之间的统一,也尽量保证每种模型都能在规定的迭代次数内获得较好的边界分割效果,故最终权值的确定是在实施中不断调试得到。活动轮廓的初始位置由画圆法得到。从图2中可见,(a)到(c)都不能对凹陷区域物体的边界进行正确分割。尽管(d)获得比前三种模型更好的边界分割结果,但由于同样存在收敛范围有限的缺陷,对于深凹陷区域活动轮廓不能在较少的迭代次数内收敛到正确边界。(e)和(f)都能正确分割凹陷区域物体的边界,(e)需要经过180次迭代,而(f)只需经过140次迭代就获得了正确的分割结果,执行速度大大加快了。
实施例2:图3为各种形变模型对图像中感兴趣区域的分割结果比较(275次迭代)。图像来源于Corel图像库,图像大小为100×100。((a)原图;(b)传统形变模型(α=1,β=0,γ=6,δ=0);(c)气球力模型(α=0.6,β=0,γ=2,δ=0.15);(d)距离势能模型(α=0.05,β=0,γ=0.5,δ=0);(e)为仅用产生自三角形内心引力的约束能量的模型(α=1,β=0,γ=8,δ=3);(f)为本发明中采用两段执行策略的形变模型(α=1,β=0,γ=6,δ=0;δ=3))。
本实施例中活动轮廓的初始位置由画圆法得到。利用色度梯度形成图像中感兴趣区域(“图像中央的花朵区域”)的色度轮廓。从图3中可见,由于感兴趣区域的边界不很复杂,(b)到(e)都能分割得到图像中感兴趣区域的大致边界位置,但是在区域左边的类似尖点的凹陷处和右边的凸出处分割地还不够准确,没有达到较高的分割精度。(f)中根据图像中待分割的感兴趣区域的边界特点,将第一段与第二段的迭代次数比例划分为2/3和1/3;同时在第一段中设置控制点间距最大为2最小为0.8,第二段中设置取控制点间距最大为1最小为0.2,这种情况下得到的分割结果最好。
实施例3:图4为取不同的图像子块时本发明中提出的形变模型对图像中感兴趣区域的分割结果比较(迭代次数:第一段为100;第二段为50)。(原图与实施例2一样;(a)子块大小=2×2的聚类;(b)子块大小=4×4的聚类;(c)子块大小=5×5的聚类;(d)是与(a)对应的分割结果;(e)是与(b))对应的分割结果;(f)是与(c)对应的分割结果;(α=1,β=0,γ=6,δ=0;δ=3))。
本实施例中活动轮廓的初始位置由自动聚类得到。从图4中可见,尽管三种情况下聚类结果不一样((a)的获得了比(b)和(c)都好的聚类结果),但是经过采用两段策略的形变模型后,在相同的150次迭代次数内得到了精确程度基本相同的分割结果((d)到(f))。由此可见,本发明中的方法只要能保证聚类操作能将图像中的感兴趣区域基本上分割出来,聚类结果的质量好坏与形变模型的执行性能无关。然而,由于自动聚类的执行时间会影响整体分割速度。例如:在彩色空间Lab中对本实施例中所用的图像大小为100×100的彩色图像实现基于颜色和纹理特征的自动聚类,(a)执行时间为3.547秒;(b)执行时间为1.078秒;(c)执行时间为0.593秒。因此,当需要对大批量的WEB图像进行处理时,在不影响感兴趣区域完整性的前提下,在聚类中应尽可能取稍大一些的图像子块,以获得快速的分割过程。
实施例4:图5为不同的活动轮廓初始位置的获取方法对各种形变模型的影响。图像下载自WEB环境,大小为100×100。((a)原图;(b)传统形变模型(α=1,β=0.2,γ=8,δ=0);(c)气球力模型(α=1,β=0.2,γ=2,δ=0.08);(d)为本发明中采用两段执行策略的形变模型(α=1,β=0.2,γ=8,δ=0;δ=3.6);(e)为本发明中采用两段执行策略的形变模型(α=1,β=0.2,γ=8,δ=0;δ=3),其中(b)到(d)的活动轮廓的初始位置来自于自动生成的矩形区域(350次迭代);(e)的活动轮廓的初始位置来自于自动聚类(150次迭代))。
从图5中可见,(b)中活动轮廓非但没有收敛到感兴趣区域(“图像中央的兔子”)的边界,还受到了图像左上角的某个局部极值点的吸引。(c)中活动轮廓不受局部极值点的干扰,获得了基本准确的区域边界,但是在一些部位,比如兔子的头部与身体连接的凹陷处、两只脚之间的间隙处没有完全逼近真实边界。(d)为本发明中用两段策略执行形变模型得到的分割结果。考虑到此实施例中的的感兴趣区域边界比实施例2中的复杂,扩展原来的两段,将原来第二段中的形变过程再次分解,350次迭代过程中,第一段占3/7(150次),控制点取样的最大间距为4、最小间距为2;第二段(I)占3/7(150次),控制点取样的最大间距为2、最小间距为0.5;第二段(I)占1/7(50次),控制点取样的最大间距为0.5、最小间距为0.2。活动轮廓不但准确地逼近兔子的头部与身体连接处、两只脚之间的空隙处,而且就连兔子嘴巴的突出部分也被分割出来,真正实现了感兴趣区域的精确分割。(e)中给出了先由自动聚类获取活动轮廓的初始位置,再用形变模型的两段策略实施分割的结果。由于利用图像的颜色和纹理特征实现的聚类操作已经得到了一个基本接近区域真实边界的活动轮廓初始位置,因此仅用150次迭代就得到了与(d)一样精确的分割结果。由此可见,本发明中提出的形变模型能有效提高分割精度、减少活动轮廓的迭代次数;同时若使用自动聚类作为初始化,既能使形变模型不受活动轮廓初始位置的影响和局部极值点的干扰,也能缩短图像中感兴趣区域分割的整体执行时间。

Claims (5)

1、一种WEB图像中感兴趣区域的分割方法,其特征在于包括以下内容:
1)利用颜色梯度定义图像能量,以三角形内心引力为主、活动轮廓中心引力为辅构造约束能量,建立符合WEB图像特性的形变模型;
2)在彩色空间Lab中提取颜色和纹理信息,利用自动聚类充当初始化操作,实现对图像中感兴趣区域的粗分割;
3)对聚类结果进行二值化处理,产生仅由前景和背景构成的二值掩码图,采用生成射线法在前景区域边界上选取控制点,得到形变模型中活动轮廓的初始位置;
4)采用两段执行策略实施形变模型的具体应用,获取图像中感兴趣区域的精确分割结果。
2、根据权利要求1所述的一种WEB图像中感兴趣区域的分割方法,其特征在于:所述建立符合WEB图像特性的形变模型,在形变模型的建立过程中,构造能量函数 E snake = ∫ 0 1 E snake ( v ( s ) ) ds = ∫ 0 1 ( E int ( v ( s ) ) + E image ( v ( s ) ) + E con ( v ( s ) ) ) ds ; 利用色度信息定义图像能量 E image = - | ▿ C H ( x , y ) | ; 利用控制点vi指向三角形Δvi-1vivi+1内心oi的矢量定义曲率,得到由三角形内心引力产生的约束能量 E con ( i ) = | v i o i → | , 并增加三点共线判断,得到来自于活动轮廓中心引力的辅助约束能量 E con ( i ) = f i cos ( cv i → , cv i + 1 → ) = ( f i / ( | cv i → | | cv i + 1 → ) ) ) ( cv i → · cv i + 1 → ) .
3、根据权利要求1所述的一种WEB图像中感兴趣区域的分割方法,其特征在于:所述实现对图像中感兴趣区域的粗分割,在感兴趣区域的粗分割过程中,利用彩色空间Lab在第f个图像子块中提取颜色特征
Figure A200810162746C00025
Figure A200810162746C00026
利用小波变换提取纹理特征
Figure A200810162746C00028
并利用k-means算法按照事先提取的六维特征将M×M的图像子块区分到不同的簇中,簇的个数选择采用自适应方式。
4、根据权利要求1所述的一种WEB图像中感兴趣区域的分割方法,其特征在于:所述得到形变模型中活动轮廓的初始位置,在活动轮廓初始位置的自动获取过程中,对聚类结果进行二值化处理,产生仅由前景和背景构成的二值掩码图,并以前景所在区域的中心为出发点,向外生成L条射线,相邻两条射线之间的夹角为2π/L,由这些射线和前景区域边界的交点连接而成的曲线构成形变模型中活动轮廓的初始位置;
5、根据权利要求1所述的一种WEB图像中感兴趣区域的分割方法,其特征在于:所述采用两段执行策略实施形变模型的具体应用,在形变模型的两段执行策略的实施过程中,第一段中不加入约束能量,以减少计算曲率的额外代价,利用图像能量驱使活动轮廓收敛;第二段中加入约束能量,以获得活动轮廓的整体收敛,并在第一段中用控制点取样间距较大的快速收敛;第二段中用取样间距较小的慢速收敛,实现图像中感兴趣区域的精确分割。
CN2008101627467A 2008-12-02 2008-12-02 一种web图像中感兴趣区域的分割方法 Expired - Fee Related CN101447076B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2008101627467A CN101447076B (zh) 2008-12-02 2008-12-02 一种web图像中感兴趣区域的分割方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2008101627467A CN101447076B (zh) 2008-12-02 2008-12-02 一种web图像中感兴趣区域的分割方法

Publications (2)

Publication Number Publication Date
CN101447076A true CN101447076A (zh) 2009-06-03
CN101447076B CN101447076B (zh) 2010-09-22

Family

ID=40742743

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2008101627467A Expired - Fee Related CN101447076B (zh) 2008-12-02 2008-12-02 一种web图像中感兴趣区域的分割方法

Country Status (1)

Country Link
CN (1) CN101447076B (zh)

Cited By (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101576953A (zh) * 2009-06-10 2009-11-11 北京中星微电子有限公司 一种人体姿态的分类方法和装置
CN101710418B (zh) * 2009-12-22 2012-06-27 上海大学 基于测地距离的交互方式图象分割方法
CN102592271A (zh) * 2012-01-16 2012-07-18 龙翔 一种基于边界提取的运动分割的边界连接方法
CN102800100A (zh) * 2012-08-06 2012-11-28 哈尔滨工业大学 基于距离势场和自适应气球力的图像分割方法
CN102903103A (zh) * 2012-09-11 2013-01-30 西安电子科技大学 基于迁移活动轮廓模型的胃部ct序列图像分割方法
CN103258333A (zh) * 2013-04-17 2013-08-21 东北林业大学 基于Lab颜色空间的竹材横断面提取算法
WO2014169822A1 (zh) * 2013-04-19 2014-10-23 广东图图搜网络科技有限公司 图像分割方法和***
CN105261051A (zh) * 2015-09-25 2016-01-20 沈阳东软医疗***有限公司 一种获取图像掩码的方法及装置
WO2016127883A1 (zh) * 2015-02-12 2016-08-18 阿里巴巴集团控股有限公司 一种图像区域检测方法及装置
CN105894496A (zh) * 2016-03-18 2016-08-24 常州大学 一种基于半局部纹理特征的二阶段图像分割方法
CN106651889A (zh) * 2016-11-30 2017-05-10 太原科技大学 一种x射线焊接接头缺陷分割方法及其分割***
CN107403183A (zh) * 2017-07-21 2017-11-28 桂林电子科技大学 整合目标检测和图像分割为一体的智能分割方法
CN108829808A (zh) * 2018-06-07 2018-11-16 麒麟合盛网络技术股份有限公司 一种页面个性化排序方法、装置及电子设备
CN109145755A (zh) * 2018-07-25 2019-01-04 昆明聚信丰科技有限公司 一种结合透视变换与k-均值算法的课桌区域识别方法
CN111340824A (zh) * 2020-02-26 2020-06-26 青海民族大学 一种基于数据挖掘的图像特征分割方法
WO2020221177A1 (zh) * 2019-04-30 2020-11-05 深圳数字生命研究院 图像的识别方法及装置、存储介质和电子装置
CN112734777A (zh) * 2021-01-26 2021-04-30 中国人民解放军国防科技大学 一种基于簇形状边界闭包聚类的图像分割方法及***
CN113837171A (zh) * 2021-11-26 2021-12-24 成都数之联科技有限公司 候选区域提取方法及***及装置及介质及目标检测方法
CN114078139A (zh) * 2021-11-25 2022-02-22 四川长虹电器股份有限公司 基于人像分割模型生成结果的图像后处理方法

Cited By (32)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101576953A (zh) * 2009-06-10 2009-11-11 北京中星微电子有限公司 一种人体姿态的分类方法和装置
CN101576953B (zh) * 2009-06-10 2014-04-23 北京中星微电子有限公司 一种人体姿态的分类方法和装置
CN101710418B (zh) * 2009-12-22 2012-06-27 上海大学 基于测地距离的交互方式图象分割方法
CN102592271A (zh) * 2012-01-16 2012-07-18 龙翔 一种基于边界提取的运动分割的边界连接方法
CN102592271B (zh) * 2012-01-16 2014-02-26 龙翔 一种基于边界提取的运动分割的边界连接方法
CN102800100A (zh) * 2012-08-06 2012-11-28 哈尔滨工业大学 基于距离势场和自适应气球力的图像分割方法
CN102800100B (zh) * 2012-08-06 2015-04-15 哈尔滨工业大学 基于距离势场和自适应气球力的图像分割方法
CN102903103B (zh) * 2012-09-11 2014-12-17 西安电子科技大学 基于迁移活动轮廓模型的胃部ct序列图像分割方法
CN102903103A (zh) * 2012-09-11 2013-01-30 西安电子科技大学 基于迁移活动轮廓模型的胃部ct序列图像分割方法
CN103258333A (zh) * 2013-04-17 2013-08-21 东北林业大学 基于Lab颜色空间的竹材横断面提取算法
WO2014169822A1 (zh) * 2013-04-19 2014-10-23 广东图图搜网络科技有限公司 图像分割方法和***
WO2016127883A1 (zh) * 2015-02-12 2016-08-18 阿里巴巴集团控股有限公司 一种图像区域检测方法及装置
CN105989594A (zh) * 2015-02-12 2016-10-05 阿里巴巴集团控股有限公司 一种图像区域检测方法及装置
CN105989594B (zh) * 2015-02-12 2019-02-12 阿里巴巴集团控股有限公司 一种图像区域检测方法及装置
CN105261051A (zh) * 2015-09-25 2016-01-20 沈阳东软医疗***有限公司 一种获取图像掩码的方法及装置
US10192293B2 (en) 2015-09-25 2019-01-29 Shenyang Neusoft Medical Systems Co., Ltd. Obtaining image mask
CN105261051B (zh) * 2015-09-25 2018-10-02 沈阳东软医疗***有限公司 一种获取图像掩码的方法及装置
CN105894496A (zh) * 2016-03-18 2016-08-24 常州大学 一种基于半局部纹理特征的二阶段图像分割方法
CN106651889A (zh) * 2016-11-30 2017-05-10 太原科技大学 一种x射线焊接接头缺陷分割方法及其分割***
CN106651889B (zh) * 2016-11-30 2019-08-16 太原科技大学 一种x射线焊接接头缺陷分割方法及其分割***
CN107403183A (zh) * 2017-07-21 2017-11-28 桂林电子科技大学 整合目标检测和图像分割为一体的智能分割方法
CN108829808A (zh) * 2018-06-07 2018-11-16 麒麟合盛网络技术股份有限公司 一种页面个性化排序方法、装置及电子设备
CN108829808B (zh) * 2018-06-07 2021-07-13 麒麟合盛网络技术股份有限公司 一种页面个性化排序方法、装置及电子设备
CN109145755A (zh) * 2018-07-25 2019-01-04 昆明聚信丰科技有限公司 一种结合透视变换与k-均值算法的课桌区域识别方法
WO2020221177A1 (zh) * 2019-04-30 2020-11-05 深圳数字生命研究院 图像的识别方法及装置、存储介质和电子装置
CN111340824A (zh) * 2020-02-26 2020-06-26 青海民族大学 一种基于数据挖掘的图像特征分割方法
CN112734777A (zh) * 2021-01-26 2021-04-30 中国人民解放军国防科技大学 一种基于簇形状边界闭包聚类的图像分割方法及***
CN112734777B (zh) * 2021-01-26 2022-10-11 中国人民解放军国防科技大学 一种基于簇形状边界闭包聚类的图像分割方法及***
CN114078139A (zh) * 2021-11-25 2022-02-22 四川长虹电器股份有限公司 基于人像分割模型生成结果的图像后处理方法
CN114078139B (zh) * 2021-11-25 2024-04-16 四川长虹电器股份有限公司 基于人像分割模型生成结果的图像后处理方法
CN113837171A (zh) * 2021-11-26 2021-12-24 成都数之联科技有限公司 候选区域提取方法及***及装置及介质及目标检测方法
CN113837171B (zh) * 2021-11-26 2022-02-08 成都数之联科技有限公司 候选区域提取方法及***及装置及介质及目标检测方法

Also Published As

Publication number Publication date
CN101447076B (zh) 2010-09-22

Similar Documents

Publication Publication Date Title
CN101447076B (zh) 一种web图像中感兴趣区域的分割方法
CN107093205B (zh) 一种基于无人机图像的三维空间建筑物窗户检测重建方法
CN110853026B (zh) 一种融合深度学习与区域分割的遥感影像变化检测方法
CN102324102B (zh) 一种图像场景空洞区域结构和纹理信息自动填补方法
CN103839267B (zh) 一种基于形态学建筑物指数的建筑物提取方法
CN104299263B (zh) 一种基于单幅图像建模云场景的方法
CN106250895B (zh) 一种光学遥感图像感兴趣区域检测方法
CN107730528A (zh) 一种基于grabcut算法的交互式图像分割与融合方法
CN105894502A (zh) 基于超图模型的rgbd图像显著性检测方法
CN105956557A (zh) 一种面向对象的时序遥感影像云覆盖区域自动检测方法
CN103871076A (zh) 基于光流法和超像素分割的运动目标提取方法
CN102034247B (zh) 一种基于背景建模对双目视觉图像的运动捕捉方法
CN105528794A (zh) 基于混合高斯模型与超像素分割的运动目标检测方法
CN109146948A (zh) 基于视觉的作物长势表型参数量化与产量相关性分析方法
CN101271591A (zh) 一种交互式多视点三维模型重建方法
CN109712143B (zh) 一种基于超像素多特征融合的快速图像分割方法
CN106295613A (zh) 一种无人机目标定位方法及***
CN105160700B (zh) 一种用于三维模型重建的截面曲线重构方法
CN104616349A (zh) 基于局部曲面变化因子的散乱点云数据精简处理方法
US20190370987A1 (en) Texture synthesis method, and device for same
CN103870834A (zh) 基于分层分割的滑动窗搜索方法
CN103903280A (zh) 一种改进水平集目标提取的子块权重Mean-Shift跟踪方法
CN105513060A (zh) 一种视觉感知启发的高分辨率遥感图像分割方法
Hu et al. Geometric feature enhanced line segment extraction from large-scale point clouds with hierarchical topological optimization
CN103761717A (zh) 一种基于全色遥感影像的城市水体提取方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20100922

Termination date: 20141202

EXPY Termination of patent right or utility model