CN101447076A

CN101447076A - 一种web图像中感兴趣区域的分割方法

Info

Publication number: CN101447076A
Application number: CNA2008101627467A
Authority: CN
Inventors: 姚敏; 朱蓉; 柳一鸣
Original assignee: Zhejiang University ZJU
Current assignee: Zhejiang University ZJU
Priority date: 2008-12-02
Filing date: 2008-12-02
Publication date: 2009-06-03
Anticipated expiration: 2028-12-02
Also published as: CN101447076B

Abstract

本发明公开了一种WEB图像中感兴趣区域的分割方法。首先，构造了一种新的形变模型，解决了凹陷区域和伪边界问题，改进了活动轮廓的收敛精度。其次，给出了一种在彩色空间Lab中基于图像子块和基于颜色和纹理特征的聚类方法，既实现了感兴趣区域的粗分割，又实现了活动轮廓初始位置的自动获取，加速了形变模型的执行速度，同时也避开了噪声和孤立边的干扰。最后，提出了一种形变模型的两段执行策略，有效分割WEB图像中复杂和不规则区域，使形变模型更具灵活性和实用性。本发明充分结合基于边界的形变模型和基于区域的聚类的优势，有效提高图像中感兴趣区域的分割精度，减少分割的整体执行时间。

Description

一种WEB图像中感兴趣区域的分割方法

技术领域

本发明涉及图像处理技术，尤其是涉及一种WEB图像中感兴趣区域的分割方法。

背景技术

随着互联网和社会信息化的蓬勃发展，每天都有海量的数字图像资源从各种图像采集***中产生，如何有效地利用这些WEB图像(WEB是World Wide Web的简称，也就是万维网；WEB图像是指存在于万维网上的图像)不仅是用户最迫切的需求，而且也是当前图像理解的首要任务。在相当多的情况下，用户并不关心图像所表达的整体意义，而更多关注的是图像中具有特定含义的感兴趣区域。常用的图像分割方法大致可分为两类：基于区域的分割和基于边界的分割。尽管目前有许多成熟的分割算法，但都有其自身的局限性和针对性。

基于形变模型的图像分割是一种基于边界的分割方法，采用的是自顶向下的目标提取技术，能将图像特征、对象轮廓和先验知识融于一个统一的分割过程中，适合于识别任意边界形状的感兴趣区域。自Kass等人于1987年在《Journalof Computer Vision》上发表的文章《Snake：Active Contour Models》中首次提出基于活动轮廓框架的形变模型(传统形变模型)以来，由于其具有允许与用户直接交互、易于加入形状约束、紧凑而灵活的曲线表达形式等其它图像分割方法无法比拟的特点，成为近期该领域研究的一个热点。然而，传统形变模型也有其自身的缺陷，例如：对活动轮廓的起始位置较为敏感；无法收敛到凹陷区域的边界；容易受到局部极值点的影响。

为了解决以上问题，研究者们提出了一些改进模型，其中最具代表性的有以下三种：Cohen等人通过引入向外膨胀或向内收缩的压力(气球力)控制活动轮廓的移动，并借助于气球力克服了孤立边或噪声引起的局部极值点的影响。Cohen and Cohen提出一种距离势能力，其中用于定义势能的距离映射图由图像中的每个像素点与离它最近的活动轮廓上控制点的距离计算得到。但是，这两种方法在对具有凹陷边界的感兴趣区域进行分割时，当活动轮廓接近凹陷时模型会产生水平方向上相反的力，使活动轮廓无法正确收敛到感兴趣区域的边界。Xu等人提出用梯度矢量流(GVF)扩大传统形变模型的捕捉范围，有效解决了形变模型对活动轮廓初始位置的依赖性，但GVF中梯度矢量的扩散过程速度缓慢，也很难逼近深凹陷区域的边界。其次，这些方法都是围绕灰度图像进行分割，当需要对彩色图像进行分割时，常用的方法就是先转为灰度图像。然而，WEB图像具有颜色的多样性、区域纹理的易变性和对象形状的不规则性等特点，再加上图像本身模糊和不均匀以及成像时受到噪声干扰等因素使得在这些形变模型上都难以获得理想的分割效果。因此，要精确地分割出WEB图像中的感兴趣区域，需要充分结合目标的底层视觉属性和高层语义信息，寻求一种与人类感知更为贴近的分割方法。

发明内容

由于WEB图像中感兴趣区域通常具有丰富的颜色和纹理、不规则的形状等特性，基于现有形变模型进行的分割无法获得好的效果。本发明的目的在于提供一种WEB图像中感兴趣区域的分割方法，利用了WEB图像中感兴趣区域的颜色、纹理和形状特性，弥补了传统形变模型无法对凹陷边界正确分割、对活动轮廓的初始位置依赖性大、容易受到局部极值点干扰等缺陷；同时也改善了灰度分割法对彩色图像进行分割的不足。

本发明采用的技术方案是：

一种WEB图像中感兴趣区域的分割方法，包括以下内容：

1)利用颜色梯度定义图像能量，以三角形内心引力为主、活动轮廓中心引力为辅构造约束能量，建立符合WEB图像特性的形变模型；

2)在彩色空间Lab中提取颜色和纹理信息，利用自动聚类充当初始化操作，实现对图像中感兴趣区域的粗分割；

3)对聚类结果进行二值化处理，产生仅由前景和背景构成的二值掩码图，采用生成射线法在前景区域边界上选取控制点，得到形变模型中活动轮廓的初始位置；

4)采用两段执行策略实施形变模型的具体应用，获取图像中感兴趣区域的精确分割结果。

所述建立符合WEB图像特性的形变模型，在形变模型的建立过程中，构造能量函数

E_{snake} = {&Integral;}_{0}^{1} E_{snake} (v (s)) ds = {&Integral;}_{0}^{1} (E_{int} (v (s)) + E_{image} (v (s)) + E_{con} (v (s))) ds;

利用色度信息定义图像能量

E_{image} = - | &dtri; C_{H} (x, y) |;

利用控制点v_i指向三角形Δv_i-1v_iv_i+1内心o_i的矢量定义曲率，得到由三角形内心引力产生的约束能量

E_{con} (i) = | \overset{&RightArrow;}{v_{i} o_{i}} |,

并增加三点共线判断，得到来自于活动轮廓中心引力的辅助约束能量

E_{con} (i) = f_{i} \cos (\overset{&RightArrow;}{{cv}_{i}}, \overset{&RightArrow;}{{cv}_{i + 1}}) = (f_{i} / (| \overset{&RightArrow;}{{cv}_{i}} | | \overset{&RightArrow;}{{cv}_{i + 1}} |)) (\overset{&RightArrow;}{{cv}_{i}} \cdot \overset{&RightArrow;}{{cv}_{i + 1}}) .

所述实现对图像中感兴趣区域的粗分割，在感兴趣区域的粗分割过程中，利用彩色空间Lab在第i个图像子块中提取颜色特征

和

利用小波变换提取纹理特征

和

并利用k-means算法按照事先提取的六维特征将M×M的图像子块区分到不同的簇中，簇的个数选择采用自适应方式。

所述得到形变模型中活动轮廓的初始位置，在活动轮廓初始位置的自动获取过程中，对聚类结果进行二值化处理，产生仅由前景和背景构成的二值掩码图，并以前景所在区域的中心为出发点，向外生成L条射线，相邻两条射线之间的夹角为2π/L，由这些射线和前景区域边界的交点连接而成的曲线构成形变模型中活动轮廓的初始位置；

所述采用两段执行策略实施形变模型的具体应用，在形变模型的两段执行策略的实施过程中，第一段中不加入约束能量，以减少计算曲率的额外代价，利用图像能量驱使活动轮廓收敛；第二段中加入约束能量，以获得活动轮廓的整体收敛，并在第一段中用控制点取样间距较大的快速收敛；第二段中用取样间距较小的慢速收敛，实现图像中感兴趣区域的精确分割。

本发明具有的有益效果是：

本发明充分利用了WEB图像中感兴趣区域的颜色、纹理和形状特性，弥补了传统形变模型无法对凹陷边界正确分割、对活动轮廓的初始位置依赖性大、容易受到局部极值点干扰等缺陷；同时也改善了灰度分割法对彩色图像进行分割的不足。利用基于区域的自动聚类进行初始化，对图像中感兴趣区域进行粗分割；利用基于边界的形变模型发生形变，对图像中感兴趣区域进行精分割，有效提高了分割精度，减少了分割的整体执行时间。最后应用到合成图像和真实图像上，取得了令人满意的分割结果。

附图说明

图1是本发明的一种WEB图像中感兴趣区域的分割方法的流程图。

图2是各种形变模型对凹陷区域物体的分割结果比较。

图3是各种形变模型对图像中感兴趣区域的分割结果比较(275次迭代)。

图4为取不同的图像子块时本发明中提出的形变模型对图像中感兴趣区域的分割结果比较(迭代次数：第一段为100；第二段为50)。

图5为不同的活动轮廓初始位置的获取方法对各种形变模型的影响。

具体实施方式

以下结合附图和实施例对本发明作进一步详细描述。

如图1所示，本发明的一种WEB图像中感兴趣区域的分割方法主要包括以下步骤：

1、形变模型的建立：

利用颜色梯度定义图像能量，以三角形内心引力为主、活动轮廓中心引力为辅构造约束能量，建立符合WEB图像特性的形变模型，具体如下：

传统形变模型中的活动轮廓是一条可伸缩的曲线，通过对其能量函数最小化控制曲线形变过程，最后得到的具有最小能量的封闭曲线就是感兴趣区域的边界。从数学角度，活动轮廓定义为图像平面上的一条参数化曲线v(s)＝[x(s)，y(s)]，s∈[0，1]，其能量函数写为：

E_{snake} = {&Integral;}_{0}^{1} E_{snake} (v (s)) ds = {&Integral;}_{0}^{1} (E_{int} (v (s)) + E_{image} (v (s)) + E_{con} (v (s))) ds - - - (1)

其中：E_int为内部能量，用于保持活动轮廓在形变过程中的连续性和平滑性；E_image为图像能量，来源于图像自身的特征；E_con为约束能量，由外力产生。E_image与E_con合为外部能量，用于诱导活动轮廓朝着感兴趣区域的边界移动，记为：

E_ext＝E_image+E_con (2)

为得到活动轮廓与感兴趣区域边界的一个最佳匹配，活动轮廓需要在形变过程中不断地改变和调整自身形状，以达到能量函数最小化的目的，即：

v' (s) = aeg \min_{s &Element; [0,1]} E_{snake} (v (s)) - - - (3)

然而，传统形变模型中未对约束能量E_con明确定义，仅由图像能量构成的外部能量不足以驱使活动轮廓完全收敛到具有凹陷边界的感兴趣区域。考虑到WEB图像中感兴趣区域通常具有显著的颜色特性和形状不规则性，本发明用颜色信息重新定义图像能量

的表达式，并利用感兴趣区域边界上的特征点构造约束能量E_con，使活动轮廓在内部能量、图像能量和约束能量的共同作用下向图像中感兴趣区域的边界移动。新的形变模型中能量函数的离散化形式为：

E_{snake} = Σ_{i = 1}^{N} (α E_{int 1} (i) + β E_{int 2} (i) + γ E_{image} (i) + δ E_{con} (i)) - - - (4)

其中：N为活动轮廓上控制点的个数；E_int1为内部能量中的弹性能量，即E_int1＝|v_i-v_i-1|²/2；E_int2为内部能量中的刚性能量，即E_int2＝|v_i-1-2v_i+v_i+1|²/2；E_image为外部能量中的图像能量，由式(5)定义；E_con为外部能量中的约束能量，由式(8)或式(20)定义。α，β，γ和δ为权值，用于调整各能量项对整体能量函数的贡献值。

1)定义图像能量

WEB图像基本上都是彩色图像，来源也极其多样化，这就使得在对WEB图像进行分割时不可避免地会遇到一些由于阴影或高光产生的伪边界情况。由于色度是一种在阴影、遮蔽及高光等因素的影响下，仍能独立于目标形状和观察角度的颜色特征，本发明中用色度代替灰度计算梯度值，能使形变模型在分割过程中辨别真伪边界。用颜色梯度定义图像能量E_image为：

E_{image} = - | &dtri; C_{H} (x, y) | - - - (5)

其中：C_H(x，y)表示色度图像；

为梯度算子。

鉴于彩色空间Lab是一种接近人类感知的彩色空间，且能用欧氏距离方便地度量颜色相似性，本发明在彩色空间Lab中计算色度和纹理(从a分量和b分量中提取色度；从L分量中提取纹理)。色度图像C_H(x，y)利用图像的色度梯度计算色度轮廓。由于色度定义在[0，2π]的环形区域上，色度梯度的计算应当用不同色度之间的角度距离来度量。设h₁和h₂为两个色度值，它们之间的角度距离d(h₁，h₂)定义为：

d(h₁，h₂)＝arccos(cosh₁cosh₂+sinh₁sinh₂) (6)然后利用Canny算子检测边界点，其中色度差的计算采用式(6)，分别得到在X方向上的梯度分量

和Y方向上的梯度分量

于是在位置(x，y)处控制点的梯度幅值为

\sqrt{{C_{H_{x}}}^{2} (x, y) + {C_{H_{y}}}^{2} (x, y)},

梯度方向为

2)构造约束能量

约束能量的加入目的是为了解决图像中感兴趣区域的凹陷边界收敛问题，挖掘边界上点的形状特征和运动趋势对构造约束能量极有帮助。假设v_i-1、v_i、v_i+1是活动轮廓上三个连续的控制点，用当前控制点v_i指向三角形Δv_i-1v_iv_i+1内心O_i的矢量来定义曲率，并构造由三角形内心引力产生的约束力：

F_{con} (i) = κ_{i} = \overset{&RightArrow;}{v_{i} o_{i}} - - - (7)

然后用矢量

的长度(模)定义约束力F_con产生的能量大小：

E_{con} (i) = | \overset{&RightArrow;}{v_{i} o_{i}} | - - - (8)

可以得出：活动轮廓上控制点v_i在位置(x_i，y_i)处曲率越大，表示由v_i-1、v_i、v_i+1三点围成的曲线的弯曲程度越大，矢量

的长度就越大，则v_i受到来自于三角形内心引力的约束能量也越大；反之，曲率越小，曲线的弯曲程度越小，矢量

的长度就越小，受到三角形内心的引力也越小。

下面利用三角形的向量形式求解矢量的值。令与三角形Δv_i-1v_iv_i+1三条边方向相同的三个单位向量分别为：

\overset{&RightArrow;}{e_{1}} = \overset{&RightArrow;}{v_{i - 1} v_{i}} / | \overset{&RightArrow;}{v_{i - 1} v_{i}} |, \overset{&RightArrow;}{e_{2}} = \overset{&RightArrow;}{v_{i} v_{i + 1}} / | \overset{&RightArrow;}{v_{i} v_{i + 1}} |, \overset{&RightArrow;}{e_{3}} = \overset{&RightArrow;}{v_{i + 1} v_{i - 1}} / | \overset{&RightArrow;}{v_{i + 1} v_{i - 1}})| - - - (9)

由于三角形的内心是三角形各内角平分线的交点，运用角平分线的向量形式定义：

\overset{&RightArrow;}{v_{i - 1} o_{i}} = λ_{1} (\overset{&RightArrow;}{e_{1}} - \overset{&RightArrow;}{e_{3}}), λ_{1} &GreaterEqual; 0 - - - (10)

\overset{&RightArrow;}{v_{i} o_{i}} = λ_{2} (\overset{&RightArrow;}{e_{2}} - \overset{&RightArrow;}{e_{1}}), λ_{2} &GreaterEqual; 0 - - - (11)

\overset{&RightArrow;}{v_{i + 1} o_{i}} = λ_{3} (\overset{&RightArrow;}{e_{3}} - \overset{&RightArrow;}{e_{2}}), λ_{3} &GreaterEqual; 0 - - - (12)

其中：λ₁，λ₂，λ₃均为系数，则：

\overset{&RightArrow;}{v_{i - 1} v_{i}} = \overset{&RightArrow;}{v_{i - 1} o_{i}} - \overset{&RightArrow;}{v_{i} o_{i}} &DoubleLeftRightArrow; | \overset{&RightArrow;}{v_{i - 1} v_{i}} | \cdot \overset{&RightArrow;}{e_{1}} = λ_{1} (\overset{&RightArrow;}{e_{1}} - \overset{&RightArrow;}{e_{3}}) - λ_{2} (\overset{&RightArrow;}{e_{2}} - \overset{&RightArrow;}{e_{1}}) - - - (13)

\overset{&RightArrow;}{v_{i} v_{i + 1}} = \overset{&RightArrow;}{v_{i} o_{i}} - \overset{&RightArrow;}{v_{i + 1} o_{i}} &DoubleLeftRightArrow; | \overset{&RightArrow;}{v_{i} v_{i + 1}} | \cdot \overset{&RightArrow;}{e_{2}} = λ_{2} (\overset{&RightArrow;}{e_{2}} - \overset{&RightArrow;}{e_{1}}) - λ_{3} (\overset{&RightArrow;}{e_{3}} - \overset{&RightArrow;}{e_{2}}) - - - (14)

\overset{&RightArrow;}{v_{i + 1} v_{i - 1}} = \overset{&RightArrow;}{v_{i + 1} o_{i}} - \overset{&RightArrow;}{v_{i - 1} o_{i}} &DoubleLeftRightArrow; | \overset{&RightArrow;}{v_{i + 1} v_{i - 1}} | \cdot \overset{&RightArrow;}{e_{3}} = λ_{3} (\overset{&RightArrow;}{e_{3}} - \overset{&RightArrow;}{e_{2}}) - λ_{1} (\overset{&RightArrow;}{e_{1}} - \overset{&RightArrow;}{e_{3}}) - - - (15)

又因为：

\overset{&RightArrow;}{v_{i - 1} v_{i}} + \overset{&RightArrow;}{v_{i} v_{i + 1}} + \overset{&RightArrow;}{v_{i + 1} v_{i - 1}} = 0 &DoubleLeftRightArrow; | \overset{&RightArrow;}{v_{i - 1} v_{i}} | \cdot \overset{&RightArrow;}{e_{1}} + | \overset{&RightArrow;}{v_{i} v_{i + 1}} | \cdot \overset{&RightArrow;}{e_{2}} + | \overset{&RightArrow;}{v_{i + 1} v_{i - 1}} | \cdot \overset{&RightArrow;}{e_{3}} - - - (16)

由(13)，(14)，(15)，(16)可得：

\{\begin{matrix} λ_{1} = (| \overset{&RightArrow;}{v_{i - 1} v_{i}} | \cdot | \overset{&RightArrow;}{v_{i + 1} v_{i - 1}} |) / (| \overset{&RightArrow;}{v_{i - 1} v_{i}} | + | \overset{&RightArrow;}{v_{i} v_{i + 1}} | + | \overset{&RightArrow;}{v_{i + 1} v_{i - 1}} |) \\ λ_{2} = (| \overset{&RightArrow;}{v_{i} v_{i + 1}} | \cdot | \overset{&RightArrow;}{v_{i - 1} v_{i}} |) / (| \overset{&RightArrow;}{v_{i - 1} v_{i}} | + | \overset{&RightArrow;}{v_{i} v_{i + 1}} | + | \overset{&RightArrow;}{v_{i + 1} v_{i - 1}} |) \\ λ_{3} = (| \overset{&RightArrow;}{v_{i + 1} v_{i - 1}} | \cdot | \overset{&RightArrow;}{v_{i} v_{i + 1}} |) / (| \overset{&RightArrow;}{v_{i - 1} v_{i}} | + | \overset{&RightArrow;}{v_{i} v_{i + 1}} | + | \overset{&RightArrow;}{v_{i + 1} v_{i - 1}} |) \end{matrix} - - - (17)

故，式(11)可以重写为：

\overset{&RightArrow;}{v_{i} o_{i}} = λ_{2} (\overset{&RightArrow;}{e_{2}} - \overset{&RightArrow;}{e_{1}}) = ((| \overset{&RightArrow;}{v_{i} v_{i + 1}} | \cdot | \overset{&RightArrow;}{v_{i - 1} v_{i}} |) / (| \overset{&RightArrow;}{v_{i - 1} v_{i}} | + | \overset{&RightArrow;}{v_{i} v_{i + 1}} | + | \overset{&RightArrow;}{v_{i + 1} v_{i - 1}} |)) (\overset{&RightArrow;}{v_{i} v_{i + 1}} / | \overset{&RightArrow;}{v_{i} v_{i + 1}} | - \overset{&RightArrow;}{v_{i - 1} v_{i}} / | \overset{&RightArrow;}{v_{i - 1} v_{i}} |) - - - (18)

= (| \overset{&RightArrow;}{v_{i - 1} v_{i}} | \cdot \overset{&RightArrow;}{v_{i} v_{i + 1}}) / (| \overset{&RightArrow;}{v_{i - 1} v_{i}} | + | \overset{&RightArrow;}{v_{i} v_{i + 1}} | + | \overset{&RightArrow;}{v_{i + 1} v_{i - 1}} |) - (| \overset{&RightArrow;}{v_{i} v_{i + 1}} | \cdot \overset{&RightArrow;}{v_{i - 1} v_{i}}) / (| \overset{&RightArrow;}{v_{i - 1} v_{i}} | + | \overset{&RightArrow;}{v_{i} v_{i + 1}} | + | \overset{&RightArrow;}{v_{i + 1} v_{i - 1}} |)

在式(18)中，

| \overset{&RightArrow;}{v_{i - 1} v_{i}} | / (| \overset{&RightArrow;}{v_{i - 1} v_{i}} | + | \overset{&RightArrow;}{v_{i} v_{i + 1}} | + | \overset{&RightArrow;}{v_{i + 1} v_{i - 1}} |)

与

| \overset{&RightArrow;}{v_{i} v_{i + 1}} | / (| \overset{&RightArrow;}{v_{i - 1} v_{i}} | + | \overset{&RightArrow;}{v_{i} v_{i + 1}} | + | \overset{&RightArrow;}{v_{i + 1} v_{i - 1}} |)

为常数，不妨设为k₁与k₂，代入式(18)中为：

\overset{&RightArrow;}{v_{i} o_{i}} = k_{1} \overset{&RightArrow;}{v_{i} v_{i + 1}} - k_{2} \overset{&RightArrow;}{v_{i - 1} v_{i}}

= k_{1} ((x_{i + 1} - x_{i}), (y_{i + 1} - y_{i})) - k_{2} ((x_{i} - x_{i - 1}), (y_{i} - y_{i - 1}))

= (k_{1} (x_{i + 1} - x_{i}), k_{1} (y_{i + 1} - y_{i})) - (k_{2} (x_{i} - x_{i - 1}), k_{2} (y_{i} - y_{i - 1})) - - - (19)

= (k_{1} (x_{i + 1} - x_{i}) - k_{2} (x_{i} - x_{i - 1})), k_{1} ((y_{i + 1} - y_{i}) - k_{2} (y_{i} - y_{i - 1}))

= (k_{1} x_{i + 1} - (k_{1} + k_{2}) x_{i} + k_{2} x_{i - 1}, k_{1} y_{i + 1} - (k_{1} + k_{2}) y_{i} + k_{2} y_{i - 1})

由上述推导得出控制点v_i在矢量

方向上的约束能量的大小为

\sqrt{{(k_{1} x_{i + 1} - (k_{1} + k_{2}) x_{i} + k_{2} x_{i - 1})}^{2} + {(k_{1} y_{i + 1} - (k_{1} + k_{2}) y_{i} + k_{2} x_{i - 1})}^{2}} .

考虑到当活动轮廓上连续的三个控制点共线无法构成三角形时，由三角形内心引力产生的约束能量等于零，本发明增加三点共线判断，若三点共线判断成立则加入增补外力(来自相邻控制点之间的作用力)。假设活动轮廓中心c在矢量

方向上产生的作用力为F_ci，利用余弦定理计算矢量的夹角，则作用力F_ci在矢量

方向上产生的能量为：

E_{con} (i) = f_{i} \cos (\overset{&RightArrow;}{{cv}_{i}}, \overset{&RightArrow;}{{cv}_{i + 1}}) = (f_{i} / (| \overset{&RightArrow;}{{cv}_{i}} | | \overset{&RightArrow;}{{cv}_{i + 1}} |)) (\overset{&RightArrow;}{{cv}_{i}} \cdot \overset{&RightArrow;}{{cv}_{i + 1}}) - - - (20)

其中：f_i为作用力F_ci的值；·为内积。在式(20)中，为常数，不妨设为k₃，代入式(20)中为：

E_{con} (i) = k_{3} (\overset{&RightArrow;}{{cv}_{i}} \cdot \overset{&RightArrow;}{{cv}_{i + 1}}) = k_{3} ((x_{i} - x_{c}) (x_{i + 1} - x_{c}) + (y_{i} - y_{c}) (y_{i + 1} - y_{c})) - - - (21)

其中：活动轮廓中心c的位置为(x_c，y_c)，令

x_{c} = Σ_{i = 1}^{N} x_{i} / N,

y_{c} = Σ_{i = 1}^{N} y_{i} / N .

2、感兴趣区域的粗分割：

在彩色空间Lab中提取颜色和纹理信息，利用自动聚类充当初始化操作，实现对图像中感兴趣区域的粗分割，具体如下：

对于来自于WEB环境中的图像，直接用形变模型对图像中的感兴趣区域进行精确分割是困难的，需要加入一个既能确定区域大致位置又能方便获取模型中活动轮廓初始位置的初始化操作。由于这个操作不需要获得精确的分割效果，主要是将感兴趣区域从背景中分割出来，故更注重的是较低的计算代价。本发明采用基于图像子块的聚类方法实现感兴趣区域的粗分割。首先将图像分成大小为M×M的不相交的子块，然后对每个子块提取图像特征，再用k-means算法进行自动聚类。子块大小的选取以保证感兴趣区域的完整性为前提，当子块大小越大时，计算时间越短，而提取的特征将越粗糙；反之，当子块大小越小时，提取的特征越细致，但计算量将增大。为了折衷计算速度和特征有效性，在本发明中用4×4的子块大小作为默认值。

1)提取图像特征

针对每个图像子块i，在彩色空间Lab中提取的图像特征中颜色为三维，是三个颜色分量在图像子块中的均值，记为：

和

纹理特征也为三维，是经过小波变换(小波变换对分析复杂纹理非常有效)后三个高频带HL、LH、HH上能量的平方根，假设HL频带上的系数为：{hl_i，j，hl_i，j+1，hl_i+1，j，hl_i+1，j+1}；LH频带上的系数为：{lh_i，j，lh_i，j+1，lh_i+1，j，lh_i+1，j+1}；HH频带上的系数为：

{hh_i，j，hh_i，j+1，hh_i+1，j，hh_i+1，j+1}，则三个纹理特征分别表示为：

f_{i}^{4} = {(({hl}_{i, j}^{2} + {hl}_{i, j + 1}^{2} + {hl}_{i + 1, j}^{2} + {hl}_{i + 1, j + 1}^{2}) / 4)}^{1 / 2};

f_{i}^{5} = {(({lh}_{i, j}^{2} + {lh}_{i, j + 1}^{2} + {lh}_{i + 1, j}^{2} + {lh}_{i + 1, j + 1}^{2}) / 4)}^{1 / 2};

f_{i}^{6} = {(({hh}_{i, j}^{2} + {hh}_{i, j + 1}^{2} + {hh}_{i + 1, j}^{2} + {hh}_{i + 1, j + 1}^{2}) / 4)}^{1 / 2} .

2)执行自动聚类

k-means算法是由MacQueen提出的一种快速聚类方法，本发明中利用该算法将图像子块按照提取的六维特征聚集到各个簇中，以此达到将图像分割成不同区域的目的。由于k-means算法是一种无监督聚类算法，簇的个数需要结合先验知识指定，在本发明中采用一种自适应选择簇个数的方法，即以保证目标完整性为前提，从取值2开始逐步地增加簇的个数，直到前提不能满足为止。

3、活动轮廓初始位置的自动获取：

对聚类结果进行二值化处理，产生仅由前景和背景构成的二值掩码图，采用生成射线法在前景区域边界上选取控制点，得到形变模型中活动轮廓的初始位置，具体如下：

1)生成二值掩码图

由于待分割图像的复杂程度的不同，导致自动聚类得到的簇的个数也不同。本发明中由于只需将感兴趣区域与背景区分开，故为方便起见，无论簇的个数是多少都需经过二值化处理，即获得仅由前景与背景构成的二值掩码图。操作过程为：先为原图像生成一幅相同大小的掩码图，然后对原图像中每一个像素点进行处理，若是属于感兴趣区域内(包括感兴趣区域边界上)的点，则在掩码图中对应位置上设置值为1(前景)，若是属于感兴趣区域外的点，全部视作背景，则在掩码图中对应位置上设置值为0(背景)，直到原图像所有的像素点都处理完毕。

2)得到活动轮廓的初始位置

利用生成射线法在前景区域边界上选取控制点，得到活动轮廓的初始位置：

a)以二值掩码图中感兴趣区域的簇中心为出发点，构造L条射线l_i(i＝1，2，...，L)，相邻的两条射线之间的夹角为2π/L。

b)对于每条射线，从簇中心出发寻找值发生改变的像素点，即为感兴趣区域的边界点。

c)依次对L条射线进行步骤c)的操作，将得到的L个边界点按顺序连接起来形成一条封闭曲线。

d)对上面得到的曲线进行样条插值，得到合适的活动轮廓上控制点的个数(一般设定两个控制点之间的最大间距和最小间距)，此曲线即为进行形变的活动轮廓的初始位置。

4、形变模型的两段执行：

采用两段执行策略实施形变模型的具体应用，获取图像中感兴趣区域的精确分割结果，具体如下：

两段执行策略是在实现形变模型时采用的一种加快分割执行速度的方法。

由于形变模型在每次迭代中都要计算活动轮廓上每个控制点的曲率值，需要花费的计算时间与控制点个数成正比。其次，过早地在形变模型中加入约束能量，如果没有调整好参数的取值，当外力过弱时活动轮廓的收敛速度会变慢；反之，当外力过强时，即使除凹陷以外的其它区域都已收敛到正确边界，随着活动轮廓继续向凹陷区域逼近，已正确到达感兴趣区域边界位置的曲线段也会越过边界，出现过收敛的现象。考虑到以上这些情况，提出两段执行策略。

1)第一段：利用传统形变模型能较好收敛到非凹陷区域且不需要增加计算控制点曲率的额外代价的优势，先使活动轮廓迅速收敛到一个较好的范围。

2)第二段：加入来自三角形内心引力(活动轮廓中心引力做增补)的约束能量。凹陷区域陷得越深，约束能量就加得越大，驱动活动轮廓快速收敛到凹陷区域的边界。

两点说明：

a)两段迭代次数的划分主要根据感兴趣区域的边界特点而定，例如：当区域边界总体比较平坦，有一到两个凹陷或凸出时，可适当放大第一段比例；当区域边界相对复杂，出现的凹陷或凸出较多时，可适当放大第二段比例。若要自动设置划分比例，折衷的方法是对半分。

b)活动轮廓上控制点的取样采用的是重抽样机制，即在每次迭代中不规定取样的控制点个数，而只是规定控制点之间的最大和最小间距，以自适应地增加和删减控制点。考虑到间距与分割速度、处理精度有关，间距越大、控制点个数越少、分割速度越快、处理就越粗糙；相反，间距越小、控制点个数越多、分割速度越慢、处理就越精细，故第一段中采用间距较大的快速收敛；第二段中采用间距较小的慢速收敛。这样做的好处是当活动轮廓接近感兴趣区域的边界时，允许活动轮廓做缓慢移动，得到更为精细的分割效果。这种用两段策略实现的方法，使分割效果更好、速度也更快，不但适合弱边界的场合，而且当遇到需要分割的区域边界非常复杂时，也可通过调整每段迭代次数比例、改变控制点取样间距和扩充段数来得到令人满意的分割结果，使形变模型更具灵活性和实用性。

为验证本发明中提出的分割方法的有效性，设计四组实施例子用于比较本发明中形变模型与其它模型的分割结果。所用实验对象有合成图像、也有来自于Corel图像库和WEB环境中的真实图像。实验环境为1.86GHZ T2350 CPU 2G内存，所有程序用MATLAB7.0编程实现。

实施例1：图2为各种形变模型对凹陷区域物体的分割结果比较。图像大小

为64×64。((a)传统形变模型(α＝1，β＝0.2，γ＝10，δ＝0)(200次迭代)；(b)气球力模型(α＝1，β＝0.2，γ＝10，δ＝0.05)(200次迭代)；(c)距离势能模型(α＝0.05，β＝0，γ＝0.5，δ＝0)(200次迭代)；(d)GVF模型(α＝0.05，β＝0，γ＝1，δ＝0.5)(200次迭代)；(e)本发明中的改进模型(α＝1，β＝0.2，γ＝10，δ＝4)(180次迭代)；(f)本发明中的改进模型的两段执行策略(α＝1，β＝0.2，γ＝10，δ＝0；δ＝4)(140次迭代))。

形变模型中各能量项的权值选择既考虑不同模型之间的统一，也尽量保证每种模型都能在规定的迭代次数内获得较好的边界分割效果，故最终权值的确定是在实施中不断调试得到。活动轮廓的初始位置由画圆法得到。从图2中可见，(a)到(c)都不能对凹陷区域物体的边界进行正确分割。尽管(d)获得比前三种模型更好的边界分割结果，但由于同样存在收敛范围有限的缺陷，对于深凹陷区域活动轮廓不能在较少的迭代次数内收敛到正确边界。(e)和(f)都能正确分割凹陷区域物体的边界，(e)需要经过180次迭代，而(f)只需经过140次迭代就获得了正确的分割结果，执行速度大大加快了。

实施例2：图3为各种形变模型对图像中感兴趣区域的分割结果比较(275次迭代)。图像来源于Corel图像库，图像大小为100×100。((a)原图；(b)传统形变模型(α＝1，β＝0，γ＝6，δ＝0)；(c)气球力模型(α＝0.6，β＝0，γ＝2，δ＝0.15)；(d)距离势能模型(α＝0.05，β＝0，γ＝0.5，δ＝0)；(e)为仅用产生自三角形内心引力的约束能量的模型(α＝1，β＝0，γ＝8，δ＝3)；(f)为本发明中采用两段执行策略的形变模型(α＝1，β＝0，γ＝6，δ＝0；δ＝3))。

本实施例中活动轮廓的初始位置由画圆法得到。利用色度梯度形成图像中感兴趣区域(“图像中央的花朵区域”)的色度轮廓。从图3中可见，由于感兴趣区域的边界不很复杂，(b)到(e)都能分割得到图像中感兴趣区域的大致边界位置，但是在区域左边的类似尖点的凹陷处和右边的凸出处分割地还不够准确，没有达到较高的分割精度。(f)中根据图像中待分割的感兴趣区域的边界特点，将第一段与第二段的迭代次数比例划分为2/3和1/3；同时在第一段中设置控制点间距最大为2最小为0.8，第二段中设置取控制点间距最大为1最小为0.2，这种情况下得到的分割结果最好。

实施例3：图4为取不同的图像子块时本发明中提出的形变模型对图像中感兴趣区域的分割结果比较(迭代次数：第一段为100；第二段为50)。(原图与实施例2一样；(a)子块大小＝2×2的聚类；(b)子块大小＝4×4的聚类；(c)子块大小＝5×5的聚类；(d)是与(a)对应的分割结果；(e)是与(b))对应的分割结果；(f)是与(c)对应的分割结果；(α＝1，β＝0，γ＝6，δ＝0；δ＝3))。

本实施例中活动轮廓的初始位置由自动聚类得到。从图4中可见，尽管三种情况下聚类结果不一样((a)的获得了比(b)和(c)都好的聚类结果)，但是经过采用两段策略的形变模型后，在相同的150次迭代次数内得到了精确程度基本相同的分割结果((d)到(f))。由此可见，本发明中的方法只要能保证聚类操作能将图像中的感兴趣区域基本上分割出来，聚类结果的质量好坏与形变模型的执行性能无关。然而，由于自动聚类的执行时间会影响整体分割速度。例如：在彩色空间Lab中对本实施例中所用的图像大小为100×100的彩色图像实现基于颜色和纹理特征的自动聚类，(a)执行时间为3.547秒；(b)执行时间为1.078秒；(c)执行时间为0.593秒。因此，当需要对大批量的WEB图像进行处理时，在不影响感兴趣区域完整性的前提下，在聚类中应尽可能取稍大一些的图像子块，以获得快速的分割过程。

实施例4：图5为不同的活动轮廓初始位置的获取方法对各种形变模型的影响。图像下载自WEB环境，大小为100×100。((a)原图；(b)传统形变模型(α＝1，β＝0.2，γ＝8，δ＝0)；(c)气球力模型(α＝1，β＝0.2，γ＝2，δ＝0.08)；(d)为本发明中采用两段执行策略的形变模型(α＝1，β＝0.2，γ＝8，δ＝0；δ＝3.6)；(e)为本发明中采用两段执行策略的形变模型(α＝1，β＝0.2，γ＝8，δ＝0；δ＝3)，其中(b)到(d)的活动轮廓的初始位置来自于自动生成的矩形区域(350次迭代)；(e)的活动轮廓的初始位置来自于自动聚类(150次迭代))。

从图5中可见，(b)中活动轮廓非但没有收敛到感兴趣区域(“图像中央的兔子”)的边界，还受到了图像左上角的某个局部极值点的吸引。(c)中活动轮廓不受局部极值点的干扰，获得了基本准确的区域边界，但是在一些部位，比如兔子的头部与身体连接的凹陷处、两只脚之间的间隙处没有完全逼近真实边界。(d)为本发明中用两段策略执行形变模型得到的分割结果。考虑到此实施例中的的感兴趣区域边界比实施例2中的复杂，扩展原来的两段，将原来第二段中的形变过程再次分解，350次迭代过程中，第一段占3/7(150次)，控制点取样的最大间距为4、最小间距为2；第二段(I)占3/7(150次)，控制点取样的最大间距为2、最小间距为0.5；第二段(I)占1/7(50次)，控制点取样的最大间距为0.5、最小间距为0.2。活动轮廓不但准确地逼近兔子的头部与身体连接处、两只脚之间的空隙处，而且就连兔子嘴巴的突出部分也被分割出来，真正实现了感兴趣区域的精确分割。(e)中给出了先由自动聚类获取活动轮廓的初始位置，再用形变模型的两段策略实施分割的结果。由于利用图像的颜色和纹理特征实现的聚类操作已经得到了一个基本接近区域真实边界的活动轮廓初始位置，因此仅用150次迭代就得到了与(d)一样精确的分割结果。由此可见，本发明中提出的形变模型能有效提高分割精度、减少活动轮廓的迭代次数；同时若使用自动聚类作为初始化，既能使形变模型不受活动轮廓初始位置的影响和局部极值点的干扰，也能缩短图像中感兴趣区域分割的整体执行时间。

Claims

1、一种WEB图像中感兴趣区域的分割方法，其特征在于包括以下内容：

2、根据权利要求1所述的一种WEB图像中感兴趣区域的分割方法，其特征在于：所述建立符合WEB图像特性的形变模型，在形变模型的建立过程中，构造能量函数

E_{snake} = {&Integral;}_{0}^{1} E_{snake} (v (s)) ds = {&Integral;}_{0}^{1} (E_{int} (v (s)) + E_{image} (v (s)) + E_{con} (v (s))) ds;

利用色度信息定义图像能量

E_{image} = - | &dtri; C_{H} (x, y) |;

E_{con} (i) = | \overset{&RightArrow;}{v_{i} o_{i}} |,

E_{con} (i) = f_{i} \cos (\overset{&RightArrow;}{{cv}_{i}}, \overset{&RightArrow;}{{cv}_{i + 1}}) = (f_{i} / (| \overset{&RightArrow;}{{cv}_{i}} | | \overset{&RightArrow;}{{cv}_{i + 1}}))) (\overset{&RightArrow;}{{cv}_{i}} \cdot \overset{&RightArrow;}{{cv}_{i + 1}}) .

3、根据权利要求1所述的一种WEB图像中感兴趣区域的分割方法，其特征在于：所述实现对图像中感兴趣区域的粗分割，在感兴趣区域的粗分割过程中，利用彩色空间Lab在第f个图像子块中提取颜色特征

和

利用小波变换提取纹理特征和

4、根据权利要求1所述的一种WEB图像中感兴趣区域的分割方法，其特征在于：所述得到形变模型中活动轮廓的初始位置，在活动轮廓初始位置的自动获取过程中，对聚类结果进行二值化处理，产生仅由前景和背景构成的二值掩码图，并以前景所在区域的中心为出发点，向外生成L条射线，相邻两条射线之间的夹角为2π/L，由这些射线和前景区域边界的交点连接而成的曲线构成形变模型中活动轮廓的初始位置；

5、根据权利要求1所述的一种WEB图像中感兴趣区域的分割方法，其特征在于：所述采用两段执行策略实施形变模型的具体应用，在形变模型的两段执行策略的实施过程中，第一段中不加入约束能量，以减少计算曲率的额外代价，利用图像能量驱使活动轮廓收敛；第二段中加入约束能量，以获得活动轮廓的整体收敛，并在第一段中用控制点取样间距较大的快速收敛；第二段中用取样间距较小的慢速收敛，实现图像中感兴趣区域的精确分割。