WO2015180527A1

WO2015180527A1 - 一种图像显著性检测方法

Info

Publication number: WO2015180527A1
Application number: PCT/CN2015/075514
Authority: WO
Inventors: 袁春; 陈刚彪
Original assignee: 清华大学深圳研究生院
Priority date: 2014-05-26
Filing date: 2015-03-31
Publication date: 2015-12-03
Also published as: CN103996195B; CN103996195A

Abstract

本发明公开了一种图像显著性检测方法，包括以下步骤：1）对图像进行分块处理，划分为K个大小为M×N的图像块；其中，K，M和N的值由用户设定；2）计算各图像块的特征值，所述特征值包括亮度特征值、颜色特征值、方向特征值，深度特征值和稀疏特征值；3）将图像块的各特征值量化到同一区间范围，将各特征值融合计算得到各图像块与其余图像块之间的差异值；4）确定加权系数，将各图像块与其余图像块之间的差异值加权求和计算得到各图像块的显著性值。本发明的图像显著性检测方法，通过在传统的特征值基础上引入了深度特征和稀疏特征，较符合人类视觉***观察图像的特点，从而确保处理得到的显著性图较符合人类视觉***，显著性图较准确。

Description

一种图像显著性检测方法

【技术领域】

本发明涉及计算机视觉领域，特别是涉及一种图像显著性检测方法。

【背景技术】

人类在观察图像时，通常只关注整幅图像或整段视频中很小的较为显著的一部分。因此，计算机模拟人类视觉***时，主要通过检测图像中显著性区域进行模拟。显著性检测已逐渐成为计算机视觉领域非常重要的一个研究课题。显著性检测在人机交互、智能监控、图像分割、图像检索和自动标注等方面有很大的发展前景。在这个研究领域中，如何运用有效的方法从图像中准确的检测出显著区域，是一个非常重要的问题。传统的显著性检测方法有多种，但对于某些图像，如图像中存在近景和远景，且远景距离观察者较远的图像，对于这类图像的显著性检测，结果不太符合人类视觉***，检测结果还不太准确。

【发明内容】

本发明所要解决的技术问题是：弥补上述现有技术的不足，提出一种图像显著性检测方法，对图像的显著性检测更符合人类视觉***，检测结果较准确。

本发明的技术问题通过以下的技术方案予以解决：

一种图像显著性检测方法，包括以下步骤：1)对图像进行分块处理，划分为K个大小为M×N的图像块；其中，K，M和N的值由用户设定；2)计算各图像块的特征值，所述特征值包括亮度特征值、颜色特征值、方向特征值，深度特征值和稀疏特征值，其中，深度特征值

其中，λ₁和λ₂为常数，由用户根据所述图像中深度值的范围和特征值融合时的量化区间范围进行设定；max(deep(x，y))表示待计算的图像块中的像素的深度值的最大值；稀疏特征值f＝W×I，其中W＝A^-1，A表示稀疏编码单元，根据独立变量分析ICA算法得到的多个稀疏编码单元中前M×N个；I表示待计算的图像块中的M×N个像素点的像素值矩阵；3)将图像块的各特征值量化到同一区间范围，将各特征值融合计算得到各图像块与其余图像块之间的差异值；4)确定加权系数，将各图像块与其余图像块之间的差异值加权求和计算得到各图像块的显著性值。

本发明与现有技术对比的有益效果是：

本发明的图像显著性检测方法，在传统的特征值基础上引入了深度特征和稀疏特征，引入深度特征区分图像中的近景和远景，使得到的显著性图中距离观测者较近的近景较远景更突出，从而更符合人类视觉***较关注距离人眼较近部分的观测原理。而引入稀疏特征，借助稀疏编码单元表征，而稀疏编码单元借助ICA算法训练得到，与人类初级视皮层感受野的特点非常类似，从而进一步确保得到的显著性图符合人类视觉***。当得到的显著性图更加符合人类视觉***时，显著性图更为准确。特别是对于图像中存在较远的远景时，本发明的图像的显著性检测方法较传统的显著性检测方法较准确。

【附图说明】

图1是本发明具体实施方式的图像显著性检测方法的流程图；

图2是本发明具体实施方式的检测方法处理包含近景的图像的处理结果图；

图3是本发明具体实施方式的检测方法处理包含远景的图像的处理结果图。

【具体实施方式】

下面结合具体实施方式并对照附图对本发明做进一步详细说明。

本发明的构思是：基于目前效果较好的基于区域对比度的显著性检测方法，通过图像块与图像块之间的差异值加权求和计算图像块的显著性值，最终得到整幅图像的显著性图。检测过程中，在传统的对比度特征值诸如强度、颜色和方向等的基础上，引入了深度特征和稀疏特征。深度信息和稀疏编码这两种视觉特征被引入显著图的计算过程，使得检测结果更加符合人类视觉感受。进一步地，本发明中还引入中央位移方法对图像分块过程中的中心点进行了位置修正，以初始显著性图中的显著中心为中心点划分图像，从而模仿人眼聚焦的转移过程，使最终得到的显著性图更加符合人类视觉***的特点。更进一步地，利用人类视觉尖锐系数来对各图像块的差异值进行加权，距离中心块越近的图像块，设置其加权系数越大，且较符合人类视觉***的特点，使检测结果更加准确。

如图1所示，为本具体实施方式中图像显著性检测方法的流程图，包括以下步骤：

P1)分块处理：对图像进行分块处理，划分为K个大小为M×N的图像块；其中，K，M和N的值由用户设定。如果设定M×N较小，K较大，即划分的块较多越精细，则后续计算结果较精确，但相应计算量也较大。如果设定M×N较大，K较小，即划分的块较少越粗糙，则后续计算量会小一些，但计算结果的精确度会差一些。优选地，根据多次实验测试，将图像块划分为8×8大小的尺寸时，计算量不会太大，同时也能满足计算精确度的要求。

优选地，分块处理时，采用区域生长法对图像进行分块，区域生长法分块时选取图像的显著中心块作为中心进行分块处理。采取该优选设置时，需要事先得到图像的初始显著性图，取该初始显著性图中显著性值最大的块作为中心即可。传统的区域生长法中进行分块处理时，一般采用图像的物理中心作为中心进行分块，而该优选设置中采用显著中心作为中心，可模仿人眼聚焦的转移过程，使最终得到的显著性图更加符合人类视觉***的特点。这是因为：当寻找场景中的特定目标时，根据图像特征的分布规律，人眼焦点的分布会从图像中心向其它位置转移。因此，视野中心，也即显著中心具有重要的地位，而非图像的物理中心。按照显著中心划分图像块，使得图像块的划分更加符合人类视觉***较为关注图像中显著区域的特点，相对于以图像中心划分计算的显著性图，以显著中心划分图像块计算的显著性图的准确度较高，效果较好。

P2)计算各图像块的特征值。具体地，特征值包括：亮度特征值、颜色特征值、方向特征值，深度特征值和稀疏特征值。

该步骤中，亮度特征、颜色特征和方向特征属于传统的对比度特征，可以利用高斯金字塔和center-surround操作符来提取，有相应成熟的计算方法可计算得到，如下列举部分计算公式仅做示例说明，不再详述该三个特征值的具体计算过程。

亮度特征值：M＝(r+g+b)/3；

红绿颜色特征值：

蓝黄颜色特征值：

方向特征值：M₀(σ)＝||M*G₀(θ)||+||M*G_π/2(θ)||；

上述计算公式中，r，g，b分别表示待计算图像块的r通道像素值，g通道像素值和b通道像素值。σ表示高斯金字塔层数，为0～8之间的整数。θ表示角度，取值为0°，45°，90°或135°。G₀(θ)表示0度方向的Gabor滤波算子，Gπ_/2(θ)表示90度方向的Gabor滤波算子。

引入的深度特征值按照如下公式计算：

其中，λ₁和λ₂为常数，由用户根据所述图像中深度值的范围和特征值融合时的区间范围进行设定。例如，待处理的图像中深度值d的范围在0～255，则exp(-1/d)取值在0-0.996之间，而特征值融合时所有特征值均需量化到0～255的区间范围内，此时设定λ₁＝255，λ₂＝1，则深度特征值的取值范围就调节到了0～255，即满足要求。而如果量化区间范围为0～1，则可以按照上述原则调整λ₁和λ₂的取值。再例如，待处理的图像中深度值d集中在其它区间范围，为调节到0～255的量化区间范围，同样调整λ₁和λ₂的取值，从而满足预期的量化区间范围的要求。总的来说，在具体应用过程中，λ₁和λ₂由用户根据图像中深度值的范围和特征值融合时的量化区间范围进行综合设定。

其中，max(deep(x，y))表示待计算的图像块中的像素的深度值的最大值。例如，计算图像块p的深度特征值时，即带入图像块p中像素的深度值的最大值作为max(deep(x，y))进行计算。计算图像块q时，相应带入图像块q中像素的深度值的最大值作为max(deep(x，y))进行计算。

引入的稀疏特征值按照如下公式计算：f＝W×I；

其中W＝A^-1，A表示稀疏编码单元，根据独立变量分析ICA算法(independent component analysis)得到的多个稀疏编码单元中前M×N个。如上述分块时M＝N＝8，则此处即取前64个。I表示待计算的图像块中的M×N个像素点的像素值矩阵。例如计算图像块p时，即带入图像块p的M×N个像素点的像素值组成的矩阵。如计算图像块q，则相应带入图像块q中相应像素点的像素值组成的矩阵。

上述采用稀疏特征，即是试图找到一个理想的可逆加权矩阵W，使得图像I可以通过矩阵W使用稀疏特征来表达。而在图片的线性变换的基础上，ICA算法把图片分解为独立成分即稀疏编码单元，图像可以表示为一组稀疏编码单元的线性组合，I＝∑f×A，其中，稀疏编码单元A通过用ICA算法训练大量的图像块计算得到。根据ICA算法，即可确定W＝A^-1，从而确定得到可逆加权矩阵W。

上述通过ICA算法确定稀疏编码单元A的具体方法有多种，优选地，采用固定点算法，取固定点算法训练大量的图像块可计算得到192个数据，取前M×N个数据作为稀疏编码单元。

综上，计算得到各图像块的各特征值后，进入步骤P3)。

P3)将图像块的各特征值量化到同一区间范围，将各特征值融合计算得到各图像块与其余图像块之间的差异值。

该步骤中，具体地，可根据如下公式进行融合计算当前图像块p与图像块q之间的差异值D_pq：

其中，Fi(p)表示特征i时的当前图像块p的量化后特征值，Fi(q)表示特征i时的图像块q的量化后特征值。具体地，将图像块p、图像块q的亮度特征值、颜色特征值、方向特征值，深度特征值和稀疏特征值量化到同一区间范围，然后将各特征下的图像块p的特征值与图像块q的特征值差值的绝对值求加和计算得到图像块p与图像块q的差异值。以当前图像块p为中心，遍历图像中其余的(K-1)个图像块，计算得到当前图像块p与其余(K-1)个图像块之间的差异值。

P4)确定加权系数，将各图像块与其余图像块之间的差异值加权求和计算得到各图像块的显著性值。

该步骤中，一般可以图像块与图像块之间的欧式距离Ds(pq)作为加权系数，计算图像块p的显著性值Sp＝∑Ds(pq)×D_pq。优选地，以人类视觉尖锐系数作为加权系数，从而使图像的显著性计算结果更加符合真实的反应图像的显著区域。具体地，

定义人类视觉尖锐系数

其中，T(f，e)表示对比度阈值，基于实验结果，对比度阈值可以用一个关于空间频率和视网膜离心率的函数表示，

式子中，T₀是对比度阈值的最小值，T₀＝1/64；α是空间频率衰减常数，α＝0.106；f是空间频率，f＝4；e₂是半分辨率离心率，e₂＝2.3；e是视网膜离心率，由两个图像块的中心点决定。

以人类视觉尖锐系数作为加权系数后，计算显著性值为：

其中，e_pq表示图像块q的中心点相对于图像块p的中心点的视网膜离心率，带入函数T(f，e)中即可计算得到对比度阈值，从而计算得到图像块p与图像块q的差异值的加权系数C(f，e)。D_pq表示图像块p与图像块q之间的差异值。以当前图像块p为中心，遍历图像中其余的(K-1)个图像块，根据当前图像块p与其余(K-1)个图像块的视网膜离心率计算得到相应的人类视觉尖锐系数，利用该系数加权当前图像块p与其余(K-1)个图像块之间的差异值，加权计算得到当前图像块p的显著性值。类似地，计算各个图像块的显著性值。

引入上述视觉尖锐系数，根据视网膜离心率的规律，越靠近当前图像块p的图像块具有越低的视网膜离心率e，相应地，对比度阈值T(f，e)也越低，设置人类视觉尖锐系数

则越靠近的图像块具有较高的视觉尖锐系数，越远的图像块具有较低的视觉尖锐系数。引入视觉尖锐系数对不同的图像块之间的差异值进行加权，视觉尖锐系数符合人眼视觉对显著区域较关注的原理，相比于欧氏距离作为系数进行加权，较符合生物学特点，从而计算的当前图像块p的显著性值较接近人眼观察的结果，计算较准确。

综上，通过步骤P1)至P4)，即计算得到各图像块的显著性值，将各图像块的显著性值整合，即得到原始图像的显著性图。本具体实施方式中计算显著性值时，引入深度特征和稀疏特征，引入深度特征，可使检测结果更符合人类视觉***较关注距离人眼较近的部分的区域的特点，而引入稀疏特征，借助ICA算法计算得到稀疏编码单元，该系数编码单元与人类的初级视皮层感受野的特点非常相似，从而可模拟人类的初级视皮层感受野的特点，同样使结果更加符合人类视觉***。本具体实施方式中，引入两种视觉特征，深度信息和稀疏编码，使得检测结果更加符合人类视觉感受，显著性图更为准确。特别是对于图像中存在较远的远景时，本发明的图像的显著性检测方法较传统的显著性检测方法较准确。

如图2和图3所示，分别为采用本具体实施方式的方法处理近景和远景图像的测试结果。图2a为原始的包含近景的图像，图2b为处理后得到的显著性图。图3a为原始的包含远景的图像，图3b为处理后得到的显著性图。从处理结果来看，能够得到准确的显著区域检测结果，在距离观察者较远的稀疏的目标也能够更好的分割到背景中，对距离观察者较远的稀疏目标有较好的分割效果。而即使不在图像中心的显著区域也能够准确的检测到，较符合人类视觉***。本具体实施方式中的显著区域检测方法在图像分割、检索、目标识别等方面都可有很好的应用。

以上内容是结合具体的优选实施方式对本发明所作的进一步详细说明，不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的普通技术人员来说，在不脱离本发明构思的前提下做出若干替代或明显变型，而且性能或用途相同，都应当视为属于本发明的保护范围。

Claims

一种图像显著性检测方法，其特征在于：包括以下步骤：

1)对图像进行分块处理，划分为K个大小为M×N的图像块；其中，K，M和N的值由用户设定；

2)计算各图像块的特征值，所述特征值包括亮度特征值、颜色特征值、方向特征值，深度特征值和稀疏特征值，其中，深度特征值
其中，λ₁和λ₂为常数，由用户根据所述图像中深度值的范围和特征值融合时的量化区间范围进行设定；max(deep(x，y))表示待计算的图像块中的像素的深度值的最大值；稀疏特征值f＝W×I，其中W＝A^-1，A表示稀疏编码单元，根据独立变量分析ICA算法得到的多个稀疏编码单元中前M×N个；I表示待计算的图像块中的M×N个像素点的像素值矩阵；

3)将图像块的各特征值量化到同一区间范围，将各特征值融合计算得到各图像块与其余图像块之间的差异值；

4)确定加权系数，将各图像块与其余图像块之间的差异值加权求和计算得到各图像块的显著性值。
根据权利要求1所述的图像显著性检测方法，其特征在于：所述步骤1)中采用区域生长法对图像进行分块处理，分块时选取图像的显著中心块作为中心进行分块处理，所述图像的显著中心块为图像的初始显著图中显著值最大的块。
根据权利要求1所述的图像显著性检测方法，其特征在于：所述步骤4)中，以人类视觉尖锐系数作为加权系数进行加权求和，所述人类视觉尖锐系数
其中，T(f，e)表示对比度阈值，
其中，T₀是对比度阈值的最小值，T₀＝1/64；α是空间频率衰减常数，α＝0.106；f是空间频率，f＝4；e是视网膜离心率；e₂是半分辨率离心率，e₂＝2.3；当前图像块p的显著性值
其中，e_pq表示图像块q的中心点相对于图像块p的中心点的视网膜离心率，D_pq表示图像块p与图像块q之间的差异值。
根据权利要求1所述的图像显著性检测方法，其特征在于：所述步骤2)中，所述图像中深度值的范围在0～255，特征值融合时的量化区间范围为0～255，设定λ₁＝255，λ₂＝1。
根据权利要求1所述的图像显著性检测方法，其特征在于：所述步骤3)中，根据如下公式进行融合计算当前图像块p与图像块q之间的差异值D_pq：
其中，Fi(p)表示特征i时的当前图像块p的量化后特征值，Fi(q)表示特征i时的图像块q的量化后特征值。
根据权利要求1所述的图像显著性检测方法，其特征在于：所述步骤1)中设定M＝8，N＝8；所述步骤2)中A为根据独立变量分析ICA算法得到的多个稀疏编码单元中前64个。
根据权利要求1所述的图像显著性检测方法，其特征在于：所述步骤2)中所述独立变量分析ICA算法为固定点算法。