CN103324753B - 基于共生稀疏直方图的图像检索方法 - Google Patents

基于共生稀疏直方图的图像检索方法 Download PDF

Info

Publication number
CN103324753B
CN103324753B CN201310283992.9A CN201310283992A CN103324753B CN 103324753 B CN103324753 B CN 103324753B CN 201310283992 A CN201310283992 A CN 201310283992A CN 103324753 B CN103324753 B CN 103324753B
Authority
CN
China
Prior art keywords
component
represent
histogram
image
color space
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201310283992.9A
Other languages
English (en)
Other versions
CN103324753A (zh
Inventor
刘广海
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CN201310283992.9A priority Critical patent/CN103324753B/zh
Publication of CN103324753A publication Critical patent/CN103324753A/zh
Application granted granted Critical
Publication of CN103324753B publication Critical patent/CN103324753B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Image Analysis (AREA)
  • Color Image Communication Systems (AREA)

Abstract

本发明提出了一种基于共生稀疏直方图的图像检索方法,该方法基于初级视觉特征以及视觉显著性区域的图像特征表达以及图像检索,提出共生稀疏直方图的新型图像特征表达方法。共生稀疏直方图可专门用于自然图像分析,并且能够比MPEG-7的边缘直方图描述子和MTH方法获得更高的检索精确度。它整合了共生矩阵,稀疏性和直方图的优点,利用直方图来表达稀疏特征,能够表达初级视觉特征以及它们之间的空间属性,在一定程度上符合人类视觉注意选择性机制。

Description

基于共生稀疏直方图的图像检索方法
技术领域
本发明涉及图像检索领域,具体涉及一种基于共生稀疏直方图的图像检索方法。
背景技术
图像检索是人工智能和模式识别领域的一个研究热点。20世纪70年代以来,国际上广泛开展了图像检索研究。图像检索技术对大规模图像信息的管理和访问提供了有力的支持,广泛应用于社会安全,知识产权保护,电子商务,数字图书馆以及辅助医疗诊断等诸多领域。目前,图像检索已经成为一种非常受欢迎的服务以及潜在着巨大财富。微软,Google,Yahoo和百度以及移动通讯设备运营商都推出了图像检索服务。目前,图像检索性能仍然无法满足用户需求,主要原因是:图像特征描述和人类感知图像内容之间存在所谓的“语义鸿沟”。
人类视觉***具有非常突出的信息筛选能力,能够迅速找到相关的重要信息,忽略掉不相关信息,这就是视觉注意机制,因此研究视觉注意机制的计算模型,可以降低图像处理的复杂性,减少计算资源耗费,极大提高信息处理的效率。此外,人类视觉***对细微的纹理差别具有很强的检测能力,而这些细微的纹理差别产生于某个集合的基本结构或者元素。在自然图像中,颜色和纹理通过自然图像的基本微结构产生了密切关系,可看作是前视觉注意阶段的原子。Julesz提出的“基元”概念是一个非常有用的纹理分析概念,已经用于开发高效的模型并且应用到纹理识别或者对象识别中。尽管如此,如何结合基元模型和视觉注意模型,并且应用于基于内容的图像检索还是比较少见。
发明内容
本发明所要解决的技术问题是:提供一种基于共生稀疏直方图的图像检索方法,其能够利用直方图来表达初级视觉特征,显著性信息以及稀疏特征,并且还能够表达初级视觉特征所包含的空间属性。
为解决上述问题,本发明是通过以下方案实现的:
基于共生稀疏直方图的图像检索方法,包括如下步骤:
(1)将彩色图像从RGB颜色空间转换到HSV彩色空间和Lab颜色空间;
(2)在HSV彩色空间中,将H,S和V通道分别均匀量化为8柄,3柄和3柄,得到72种颜色组合C1(x,y);在Lab彩色空间中,将L,a和b通道分别均匀量化为10柄,3柄和3柄,得到90种颜色组合C2(x,y);其中(x,y)代表图像坐标点,C1(x,y)的取值变化范围是0~71,C2(x,y)的取值变化范围是0~89;
(3)计算C1(x,y)和C2(x,y)的颜色直方图,其中C1(x,y)的颜色直方图表示为H1(i)=w,w∈{0,1,..,71},C2(x,y)的颜色直方图表示为H2(i)=v,v∈{0,1,..,89};
(4)在HSV颜色空间中,用Sobel边缘检测算子对彩色图像中的每个像素f(x,y)的H,S和V三个分量进行操作,即将像素f(x,y)沿着x和y方向的梯度表示为两个向量a(Hx,Sx,Vx)和b(Hy,Sy,Vy),它们的点积可定义为:
| a | = ( H x ) 2 + ( S x ) 2 + ( V x ) 2 - - - ( 1 )
| b | = ( H y ) 2 + ( S y ) 2 + ( V y ) 2 - - - ( 2 )
a·b=Hx·Hy+Sx·Sy+Vx·Vy(3)
式中,a表示像素f(x,y)沿着x方向的梯度向量,b表示像素f(x,y)沿着y方向的梯度向量,Hx表示H分量中的垂直分量,Sx表示S分量中的垂直分量,Vx表示V分量中的垂直分量;Hy表示H分量中的水平分量,Sy表示S分量中的水平分量,Vy表示V分量中的水平分量;则边缘方向可以定义为:
θ hsv ( x , y ) = arccos [ a · b | a | · | b | ] - - - ( 4 )
式中,θhsv(x,y)表示边缘方向,θhsv(x,y)∈[0°,180°],a表示像素f(x,y)沿着x方向的梯度向量,b表示像素f(x,y)沿着y方向的梯度向量;
对每个像素f(x,y)都计算其纹理方向θhsv(x,y)后,将所有的纹理方向以10°为步长进行均匀量化,量化方法为w=Round(θhsv(x,y)/10),其中Round(.)表示取整数,这样就可以将纹理方向均匀量化为18个方向,则在HSV颜色空间中,量化后的边缘方向映射定义为θ1(x,y),并且θ1(x,y)=w',w'∈{0,1,..,17};
在Lab颜色空间中,同样采用上述方法,对每个像素f(x,y)都计算其纹理方向θlab(x,y)后,将所有的纹理方向以10°为步长,同样可以将纹理方向均匀量化为18个方向,则在Lab颜色空间中,量化后的边缘方向映射定义为θ2(x,y),并且θ2(x,y)=v',v'∈{0,1,..,17};
(5)计算θ1(x,y)和θ2(x,y)的直方图,其中θ1(x,y)的直方图表示为Hθ1(i)=w'',w''∈{0,1,...,17},θ2(x,y)的直方图表示为Hθ2(i)=v'',v''∈{0,1,...,17};
(6)在HSV颜色空间中,将H,S和V三个分量用于构建高斯金字塔H(σ),S(σ)和V(σ),其中σ∈[0...5]表示尺度,然后通过跨尺度抽样并产生所谓的特征映射:
F(c,s,H)=|H(c)口H(s)|(5)
F(c,s,S)=|S(c)口S(s)|(6)
F(c,s,V)=|V(c)口V(s)|(7)
式中,F(c,s,H)表示H分量的特征映射,F(c,s,S)表示S分量的特征映射,F(c,s,V)表示V分量的特征映射,H(c)表示H分量细尺度c的高斯金字塔,H(s)表示H分量粗尺度s的高斯金字塔,S(c)表示S分量细尺度c的高斯金字塔,S(s)表示S分量粗尺度s的高斯金字塔,V(c)表示V分量细尺度c的高斯金字塔,V(s)表示V分量粗尺度s的高斯金字塔,口表示中心-周边差操作,它是在“中心”细尺度c和“周边”粗尺度s之间进行,并产生特征映射图;
将每个特征映射图缩小到尺度5,然后进行逐点相加,最后得到3个独立显著性图像映射
H ‾ = 4 5 ⊕ ⊕ c = 0 s = 5 N ( F ( c , s , H ) ) - - - ( 8 )
S ‾ = 4 5 ⊕ ⊕ c = 0 s = 5 N ( F ( c , s , S ) ) - - - ( 9 )
V ‾ = 4 5 ⊕ ⊕ c = 0 s = 5 N ( F ( c , s , V ) ) - - - ( 10 )
式中,表示H分量的显著性图像映射,表示S分量的显著性图像映射,表示V分量的显著性图像映射,c表示细尺度,s表示粗尺度,表示映射图的跨尺度相加,N(.)表示标准化;
三个3个独立显著性图像映射整合为一个显著图Shsv
S hsv = 1 3 ( N ( H ‾ ) + N ( S ‾ ) + N ( V ‾ ) ) - - - ( 11 )
式中,Shsv表示显著图,N(.)表示标准化;
在Lab颜色空间中,同样采用上述方法,则可以得到在Lab颜色空间的显著图Slab
(7)将HSV颜色空间的显著图Shsv和Lab颜色空间的显著图Slab进行整合可以得到一个总体显著图S,
S = 1 2 ( S hsv + S lab ) - - - ( 12 )
式中,Shsv表示HSV颜色空间的显著图,Slab表示Lab颜色空间的显著图,S表示整合后的总体显著图;
(8)在总体显著图像S中,从左到右,从上到下,以2个像素作为步长,不断地移动2×2方格,历遍整幅图像;如果检测出一个基元,则该2×2方格中的原始像素保持不变,否则将其全部设置为零值,将最终得到一个基元图像T(x,y),该基元图像T(x,y)的取值变化范围是0~255;
(9)假设基元图像T(x,y)的值表示为l∈{0,1,..,L-1};(x,y)和(x',y')为两个相邻像素,并且它们的值为T(x,y)=l1和T(x',y')=l2;此时在(x,y)处,θ1(x,y)=m1,θ2(x,y)=m2,C1(x,y)=v1,C2(x,y)=v2;设(x,y)和(x',y')两个像素之间的距离为1,即是max(|x-x'|,|y-y'|)=1,共生稀疏直方图定义如下:
H=concac{H(C1(x,y)),H(C2(x,y)),H(θ1(x,y)),H(θ2(x,y))}(17)
式中,H(C1(x,y))表示C1(x,y)的共生稀疏直方图,H(C2(x,y))表示(C2(x,y))的共生稀疏直方图,H(θ1(x,y))表示(θ1(x,y))的共生稀疏直方图,H(θ2(x,y))表示(θ2(x,y))的共生稀疏直方图,concac{.}表示将上述四个直方图串联起来形成一个最终的共生稀疏直方图,其具有72+90+18+18=198维向量;H1(.)<H2(.)或者Hθ1(.)<Hθ2(.)均表示在相同坐标点位置,在寻找不同颜色空间中的那种颜色或者那种方向出现次数最少,并且以出现最少次数的颜色或者方向作为共生稀疏直方图的下标,即需找那个颜色空间的颜色和方向具有更强稀少性。
(10)将共生稀疏直方图中的198维特征向量作为最终特征应用于图像检索,在检索过程中采用L1距离进行图像匹配,也可以采用其他距离或者其他匹配方法进行图像匹配。
上述方案中,步骤(6)中,标准化N(.)由如下步骤组成:
(6.1)归一化映射图中像素值,将其固定到[0,1]之间的范围,以消除依赖于模态的幅值差异;
(6.2)计算出映射图中最大值M的位置和其它所有局部极大值的平均值
(6.3)整幅映射图乘以
与现有技术相比,本发明基于初级视觉特征以及视觉显著性区域的图像特征表达以及图像检索,提出共生稀疏直方图的新型图像特征表达方法。共生稀疏直方图可看作为发明人前期工作(多基元直方图(MTH))的重要改进版,专门用于自然图像分析,并且能够比MPEG-7的边缘直方图描述子和MTH方法获得更高的检索精确度。它整合了共生矩阵,稀疏性和直方图的优点,利用直方图来表达稀疏特征,能够表达初级视觉特征以及它们之间的空间属性,在一定程度上符合人类视觉注意选择性机制。
附图说明
图1为用于基元检测的六种基元模版,其中(a)2×2方格;(b)T1;(c)T2;(d)T3;(e)T4,(f)T5,(g)T6。
图2为基元检测的流程;其中(a)是一个2×2方格;(b)为一幅输入图像,(c)基元位置和基元类型,(d)为最终基元图像。
具体实施方式
一种基于共生稀疏直方图的图像检索方法,包括如下步骤:
(1)将彩色图像从RGB颜色空间转换到HSV彩色空间和Lab颜色空间。
(2)众所周知,甚至在缺少形状信息的条件下,颜色仍然能够提供丰富的信息来进行图像检索或者对象识别。此外,HSV和Lab颜色空间与人类感知颜色模式具有相似性,因此很多研究者采用它来进行颜色量化。为了提取颜色信息和简化操作,本发明同时采用HSV和Lab颜色空间的颜色量化模式,在HSV彩色空间中,将H,S和V通道分别均匀量化为8柄,3柄和3柄,得到72种颜色组合C1(x,y)。在Lab彩色空间中,将L,a和b通道分别均匀量化为10柄,3柄和3柄,得到90种颜色组合C2(x,y)。其中(x,y)图像坐标点,C1(x,y)的取值变化范围是0~71,C2(x,y)的取值变化范围是0~89。
(3)计算C1(x,y)和C2(x,y)的颜色直方图,它们的颜色直方图分别表示为H1(i)=w,w∈{0,1,..,71}和H2(i)=v,v∈{0,1,..,89}。
(4)边缘方向分析在计算机视觉与模式识别领域具有很重要的地位。例如,边缘方向在前期视觉注意阶段用于描述基元属性。纹理图像的边缘方向信息对人类感知纹理图像具有非常强的影响。边缘方向也可以用于判断纹理图像的形状信息。图像中的方向映射可以表达边界和纹理结构,并且能够提供图像中的大量语义信息。在发明中,我们将采用一种高效的计算方法来进行纹理边缘方向检测。
在灰度图像中,采用Sobel等边缘检测算子对灰度图像进行垂直和水平方向的梯度检测,可获得两个梯度图像gx和gy,然后可以计算出梯度映射g(x,y),它的幅值和方向分别定义为和θ(x,y)=arctan(gx/gy)。
彩色图像具有红、绿和蓝三图像分量,在转换到HSV和Lab颜色空间时,仍然具有三个图像分量。为了尽量防止过多色彩信息丧失,同时也为了能够检测到色彩变化引起的边缘,本发明采用Sobel边缘检测算子对彩色f(x,y)的图像分量进行操作。本发明采用Sobel边缘算子主要原因是因为Sobel边缘算子相比其他边缘检测算子,它对噪声不敏感并且效果很好。在HSV颜色空间中,用Sobel边缘检测算子对彩色图像中的每个像素f(x,y)的H,S和V三个分量进行操作,即将像素f(x,y)沿着x和y方向的梯度表示为两个向量a(Hx,Sx,Vx)和b(Hy,Sy,Vy),它们的点积可定义为:
| a | = ( H x ) 2 + ( S x ) 2 + ( V x ) 2 - - - ( 1 )
| b | = ( H y ) 2 + ( S y ) 2 + ( V y ) 2 - - - ( 2 )
a·b=Hx·Hy+Sx·Sy+Vx·Vy(3)
式中,Hx表示H分量中的垂直分量,Sx表示S分量中的垂直分量,Vx表示V分量中的垂直分量。Hy表示H分量中的水平分量,Sy表示S分量中的水平分量,Vy表示V分量中的水平分量。则边缘方向可以定义为:
&theta; hsv ( x , y ) = arccos &lsqb; a &CenterDot; b | a | &CenterDot; | b | &rsqb; - - - ( 4 )
式中,θhsv(x,y)∈[0°,180°];
对每个像素f(x,y)都计算其纹理方向θhsv(x,y)后,本发明将所有的纹理方向以10°为步长进行均匀量化,量化方法为w=Round(θhsv(x,y)/10),Round(.)表示取整数,这样就可以均匀量化为18个方向,则量化后的边缘方向映射定义为θ1(x,y),并且θ1(x,y)=w',w'∈{0,1,..,17}。
在Lab颜色空间中,同样采用上述办法,对每个像素f(x,y)都计算其纹理方向θlab(x,y)后,将所有的纹理方向以10°为步长,同样可以均匀量化为18个方向,则量化后的边缘方向映射定义为θ2(x,y),并且θ2(x,y)=v',v'∈{0,1,..,17}。
(5)计算θ1(x,y)和θ2(x,y)的直方图,它们的直方图分别表示为Hθ1(i)=w'',w''∈{0,1,...,17}和Hθ2(i)=v'',v''∈{0,1,...,17}。
(6)人类视觉***具有非常突出的信息筛选能力,能够迅速找到相关的重要信息,忽略掉不相关信息,这就是视觉注意机制,因此研究视觉注意机制的计算模型,可以降低图像处理的复杂性,减少计算资源耗费,极大提高信息处理的效率。因此,本发明需要进行视觉显著区域检测,然后得到视觉显著图。在进行显著性检测之前,本发明将定义若干初级视觉特征应用于视觉显著性区域检测。鉴于HSV和Lab颜色空间都和人类颜色感知具有一定的相似性,所以本发明对它们都进行显著性检测,它们的显著性检测原理一样。首先以HSV颜色空间为例子,它由H,S和V分量图像构成。将H,S和V用于构建高斯金字塔H(σ),S(σ)和V(σ),其中σ∈[0...5]表示尺度,然后通过跨尺度抽样并产生所谓的特征映射:
F(c,s,H)=|H(c)H(s)|(5)
F(c,s,S)=|S(c)S(s)|(6)
F(c,s,V)=|V(c)V(s)|(7)
式中,表示中心-周边差操作,它是在“中心”细尺度c和“周边”粗尺度s之间进行,并产生特征映射图。
将每个特征映射图缩小到尺度5,然后进行逐点相加,最后得到3个独立显著性图像映射
H &OverBar; = 4 5 &CirclePlus; &CirclePlus; c = 0 s = 5 N ( F ( c , s , H ) ) - - - ( 8 )
S &OverBar; = 4 5 &CirclePlus; &CirclePlus; c = 0 s = 5 N ( F ( c , s , S ) ) - - - ( 9 )
V &OverBar; = 4 5 &CirclePlus; &CirclePlus; c = 0 s = 5 N ( F ( c , s , V ) ) - - - ( 10 )
式中,⊕表示映射图的跨尺度相加;
三个3个独立显著性图像映射整合为一个显著图Shsv
S hsv = 1 3 ( N ( H &OverBar; ) + N ( S &OverBar; ) + N ( V &OverBar; ) ) - - - ( 11 )
式中,N(.)表示标准化,N(.)由如下步骤组成:(1)归一化映射图中像素值,将其固定到[0,1]之间的范围,以消除依赖于模态的幅值差异。(2)计算出映射图中最大值M的位置和其它所有局部极大值的平均值(3)整幅映射图乘以
同样道理,采用上述方法,同样可以得到在Lab颜色空间的显著图Slab,将HSV颜色空间的显著图Shsv和Lab颜色空间显著图Slab进行整合可以得到一个总体显著图S,如下所示:
S = 1 2 ( S hsv + S lab ) - - - ( 12 )
总体显著图S则应用于基元检测。
(7)“基元”概念诞生于20多年前,是一个非常有用的纹理分析工具。一般情况下,基元被定义为一系列图像块或者在整幅图像中具有共同属性的模式。本发明采用2×2图像块来进行基元检测。在一个2×2方格上定义了6种特殊的基元类型,假设4个像素为V1,V2,V3和V4,如果这4个像素中的2个相像素具有相同像素值,则该方格形成一个基元,6种基元类型分别定义为T1,T2,T3,T4,T5和T6,例如图1所示。
(8)在显著图像S中,从左到右,从上倒下,以2个像素作为步长,不断地移动2×2方格,历遍整幅图像。如果检测出一个基元,则该2×2方格中的原始像素保持不变,否则将其全部设置为零值,将最终得到一个基元图像T(x,y),基元图像T(x,y)的取值变化范围是0~255。例如图2所示。
(9)共生矩阵能够描述相邻像素的空间关系,而基于直方图具有高效的索引性能以及计算简单的特点。如果我们直接利用共生矩阵来表达图像特征,特征维数会很高并且性能也会降低。如果我们只采用直方图来描述特征,则丧失了空间关系。为了保持共生矩阵和直方图的优点,同时也为了引入稀疏属性以及显著性信息,在本发明中,我们提出了共生稀疏直方图(co-occurrencesparsehistogram)。
假设基元图像T的值表示为l∈{0,1,..,L-1}。(x,y)和(x',y')为两个相邻像素,并且它们的值为T(x,y)=l1和T(x',y')=l2,此时在(x,y)处,θ1(x,y)=m1和θ2(x,y)=m2,它们的值m1和m2不一定相同。同样道理,C1(x,y)=v1和C2(x,y)=v2它们的值v1和v2也不一定相同。设两个像素之间的距离为1,即是max(|x-x'|,|y-y'|)=1,共生稀疏直方图定义如下:
H=concac{H(C1(x,y)),H(C2(x,y)),H(θ1(x,y)),H(θ2(x,y))}(17)
式中,concac{.}表示将上述四个直方图串联起来形成一个最终的直方图。在上述公式中H1(.)<H2(.)或者Hθ1(.)<Hθ2(.)表示在相同坐标点位置,在寻找不同颜色空间中的那种颜色或者那种方向出现次数最少,并且以出现最少次数的颜色或者方向作为共生稀疏直方图的下标,即需找那个颜色空间的颜色和方向具有更强稀少性。它具有72+90+18+18=198维向量,能够利用颜色信息来表达相关性。
本发明提出了一种称之为共生稀疏直方图(CSH)的新方法,用于描述图像特征和图像检索。共生稀疏直方图在基元基础上能够同时表达纹理方向和纹理颜色的空间关系,将共生活矩阵和直方图整合为一个描述子,并且采用直方图来描述共生矩阵属性。稀疏共生直方图不需要任何图像分割以及学习和训练过程,非常容易实现。它很适合于大规模的图像检索。共生稀疏直方图可看作是一种广义的视觉属性描述子。此外,作为一种彩色纹理描述子,它在自然纹理提取方面能够取得良好性能。稀疏共生直方图的特征维数只有198维,能够满足图像检索要求。本发明具有很强的颜色、纹理以及形状特征描述能力,检索性能明显高发明人前期工作MTH方法。本发明还具有非常强的扩展性,完全可以采用相同方式扩展到RGB,拮抗颜色空间,HIS颜色空间等颜色空间中去。
(10)将共生稀疏直方图中的198维特征向量作为最终特征应用于图像检索,在检索过程中采用L1距离进行图像匹配。采用L1距离的主要原因是L1距离计算简单,计算量小,不要开方和开根号计算。

Claims (2)

1.基于共生稀疏直方图的图像检索方法,其特征是包括如下步骤:
(1)将彩色图像从RGB颜色空间转换到HSV颜色空间和Lab颜色空间;
(2)在HSV颜色空间中,将H,S和V通道分别均匀量化为8柄,3柄和3柄,得到72种颜色组合C1(x,y);在Lab颜色空间中,将L,a和b通道分别均匀量化为10柄,3柄和3柄,得到90种颜色组合C2(x,y);其中(x,y)代表图像坐标点,C1(x,y)的取值变化范围是0~71,C2(x,y)的取值变化范围是0~89;
(3)计算C1(x,y)和C2(x,y)的颜色直方图,其中C1(x,y)的颜色直方图表示为H1(i)=w,w∈{0,1,..,71},C2(x,y)的颜色直方图表示为H2(i)=v,v∈{0,1,..,89};
(4)在HSV颜色空间中,用Sobel边缘检测算子对彩色图像中的每个像素f(x,y)的H,S和V三个分量进行操作,即将像素f(x,y)沿着x和y方向的梯度表示为两个向量a(Hx,Sx,Vx)和b(Hy,Sy,Vy),它们的点积定义为:
| a | = ( H x ) 2 + ( S x ) 2 + ( V x ) 2 - - - ( 1 )
| b | = ( H y ) 2 + ( S y ) 2 + ( V y ) 2 - - - ( 2 )
a·b=Hx·Hy+Sx·Sy+Vx·Vy(3)
式中,a表示像素f(x,y)沿着x方向的梯度向量,b表示像素f(x,y)沿着y方向的梯度向量,Hx表示H分量中的垂直分量,Sx表示S分量中的垂直分量,Vx表示V分量中的垂直分量;Hy表示H分量中的水平分量,Sy表示S分量中的水平分量,Vy表示V分量中的水平分量;则边缘方向定义为:
&theta; h s v ( x , y ) = arccos &lsqb; a &CenterDot; b | a | &CenterDot; | b | &rsqb; - - - ( 4 )
式中,θhsv(x,y)表示边缘方向,θhsv(x,y)∈[0°,180°],a表示像素f(x,y)沿着x方向的梯度向量,b表示像素f(x,y)沿着y方向的梯度向量;
对每个像素f(x,y)都计算其边缘方向θhsv(x,y)后,将所有的边缘方向以10°为步长进行均匀量化,量化方法为w=Round(θhsv(x,y)/10),其中Round(.)表示四舍五入取整数,这样就可以将边缘方向均匀量化为18个方向,则在HSV颜色空间中,量化后的边缘方向映射定义为θ1(x,y),并且θ1(x,y)=w',w'∈{0,1,..,17};
在Lab颜色空间中,同样采用上述办法,对每个像素f(x,y)都计算其边缘方向θlab(x,y)后,将所有的边缘方向以10°为步长,同样可以将边缘方向均匀量化为18个方向,则在Lab颜色空间中,量化后的边缘方向映射定义为θ2(x,y),并且θ2(x,y)=v',v'∈{0,1,..,17};
(5)计算θ1(x,y)和θ2(x,y)的直方图,其中θ1(x,y)的直方图表示为Hθ1(i)=w”,w”∈{0,1,...,17},θ2(x,y)的直方图表示为Hθ2(i)=v”,v”∈{0,1,...,17};
(6)在HSV颜色空间中,将H,S和V三个分量用于构建高斯金字塔H(σ),S(σ)和V(σ),其中σ∈[0...5]表示尺度,然后通过跨尺度抽样并产生所谓的特征映射:
F(c,s,H)=|H(c)H(s)|(5)
F(c,s,S)=|S(c)S(s)|(6)
F(c,s,V)=|V(c)V(s)|(7)
式中,F(c,s,H)表示H分量的特征映射,F(c,s,S)表示S分量的特征映射,F(c,s,V)表示V分量的特征映射,H(c)表示H分量细尺度c的高斯金字塔,H(s)表示H分量粗尺度s的高斯金字塔,S(c)表示S分量细尺度c的高斯金字塔,S(s)表示S分量粗尺度s的高斯金字塔,V(c)表示V分量细尺度c的高斯金字塔,V(s)表示V分量粗尺度s的高斯金字塔,表示中心-周边差操作,它是在“中心”细尺度c和“周边”粗尺度s之间进行,并产生特征映射图;
将每个特征映射图缩小到尺度5,然后进行逐点相加,最后得到3个独立显著性图像映射
H &OverBar; = &CirclePlus; c = 0 4 &CirclePlus; s = 5 5 N ( F ( c , s , H ) ) - - - ( 8 )
S &OverBar; = &CirclePlus; c = 0 4 &CirclePlus; s = 5 5 N ( F ( c , s , S ) ) - - - ( 9 )
V &OverBar; = &CirclePlus; c = 0 4 &CirclePlus; s = 5 5 N ( F ( c , s , V ) ) - - - ( 10 )
式中,表示H分量的显著性图像映射,表示S分量的显著性图像映射,表示V分量的显著性图像映射,c表示细尺度,s表示粗尺度,表示映射图的跨尺度相加,N(.)表示标准化;
三个3个独立显著性图像映射整合为一个显著图Shsv
S h s v = 1 3 ( N ( H &OverBar; ) + N ( S &OverBar; ) + N ( V &OverBar; ) ) - - - ( 11 )
式中,Shsv表示显著图,N(.)表示标准化;
在Lab颜色空间中,同样采用上述方法,则可以得到在Lab颜色空间的显著图Slab
(7)将HSV颜色空间的显著图Shsv和Lab颜色空间的显著图Slab进行整合可以得到一个总体显著图S,
S = 1 2 ( S h s v + S l a b ) - - - ( 12 )
式中,Shsv表示HSV颜色空间的显著图,Slab表示Lab颜色空间的显著图,S表示整合后的总体显著图;
(8)在总体显著图像S中,从左到右,从上到下,以2个像素作为步长,不断地移动2×2方格,历遍整幅图像;如果检测出一个基元,则该2×2方格中的原始像素保持不变,否则将其全部设置为零值,将最终得到一个基元图像T(x,y),该基元图像T(x,y)的取值变化范围是0~255;
(9)假设基元图像T(x,y)的值表示为l∈{0,1,..,L-1};(x,y)和(x',y')为两个相邻像素,并且它们的值为T(x,y)=l1和T(x',y')=l2;此时在(x,y)处,θ1(x,y)=m1,θ2(x,y)=m2,C1(x,y)=v1,C2(x,y)=v2;设(x,y)和(x',y')两个像素之间的距离为1,即是max(|x-x'|,|y-y'|)=1,共生稀疏直方图定义如下:
H=concac{H(C1(x,y)),H(C2(x,y)),H(θ1(x,y)),H(θ2(x,y))}(17)
式中,H(C1(x,y))表示C1(x,y)的共生稀疏直方图,H(C2(x,y))表示(C2(x,y))的共生稀疏直方图,H(θ1(x,y))表示(θ1(x,y))的共生稀疏直方图,H(θ2(x,y))表示(θ2(x,y))的共生稀疏直方图,concac{.}表示将上述四个直方图串联起来形成一个最终的共生稀疏直方图,其具有72+90+18+18=198维向量;H1(.)<H2(.)或者Hθ1(.)<Hθ2(.)均表示在相同坐标点位置,寻找不同颜色空间中的哪种颜色或者哪种方向出现次数最少,并且以出现最少次数的颜色或者方向作为共生稀疏直方图的下标;
(10)将共生稀疏直方图中的198维特征向量作为最终特征应用于图像检索,在检索过程中采用L1距离进行图像匹配。
2.根据权利要求1所述基于共生稀疏直方图的图像检索方法,其特征是:步骤(6)中,标准化N(.)由如下步骤组成:
(6.1)归一化映射图中像素值,将其固定到[0,1]之间的范围,以消除依赖于模态的幅值差异;
(6.2)计算出映射图中最大值M的位置和其它所有局部极大值的平均值
(6.3)整幅映射图乘以
CN201310283992.9A 2013-07-08 2013-07-08 基于共生稀疏直方图的图像检索方法 Expired - Fee Related CN103324753B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310283992.9A CN103324753B (zh) 2013-07-08 2013-07-08 基于共生稀疏直方图的图像检索方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310283992.9A CN103324753B (zh) 2013-07-08 2013-07-08 基于共生稀疏直方图的图像检索方法

Publications (2)

Publication Number Publication Date
CN103324753A CN103324753A (zh) 2013-09-25
CN103324753B true CN103324753B (zh) 2016-03-23

Family

ID=49193496

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310283992.9A Expired - Fee Related CN103324753B (zh) 2013-07-08 2013-07-08 基于共生稀疏直方图的图像检索方法

Country Status (1)

Country Link
CN (1) CN103324753B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104252710A (zh) * 2014-09-02 2014-12-31 江苏大学 基于动态阈值的Susan算子彩色图像边缘检测方法
CN105447451B (zh) * 2015-11-13 2019-01-22 东方网力科技股份有限公司 一种检索物体标志物的方法及设备
CN105512175B (zh) * 2015-11-23 2019-01-29 东莞市凡豆信息科技有限公司 一种基于颜色特征和纹理特征的快速图像检索方法
CN106326902B (zh) * 2016-08-30 2019-05-14 广西师范大学 基于显著性结构直方图的图像检索方法
CN108399620B (zh) * 2018-03-19 2022-04-19 嘉兴学院 一种基于低秩稀疏矩阵分解的图像质量评价方法
CN110210502B (zh) * 2019-06-13 2023-03-31 广西师范大学 整合蜜蜂和人类视觉感知机制的特征提取和图像检索方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7062083B2 (en) * 2001-01-09 2006-06-13 Samsung Electronics Co., Ltd. Image retrieval method based on combination of color and texture features
CN101488129A (zh) * 2008-01-14 2009-07-22 夏普株式会社 图像检索装置及图像检索方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7062083B2 (en) * 2001-01-09 2006-06-13 Samsung Electronics Co., Ltd. Image retrieval method based on combination of color and texture features
CN101488129A (zh) * 2008-01-14 2009-07-22 夏普株式会社 图像检索装置及图像检索方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
基于分块直方图和共生矩阵的图像检索方法;李伟奇等;《电子测量技术》;20090131;第32卷(第1期);1-4 *
基于颜色体积直方图的图像检索;刘广海;《计算机科学》;20120131;第39卷(第1期);273-280 *

Also Published As

Publication number Publication date
CN103324753A (zh) 2013-09-25

Similar Documents

Publication Publication Date Title
CN103324753B (zh) 基于共生稀疏直方图的图像检索方法
CN111310773B (zh) 一种高效的卷积神经网络的车牌定位方法
WO2019169816A1 (zh) 一种用于精细化识别车辆属性的深度神经网络及训练方法
CN103927511B (zh) 基于差异特征描述的图像识别方法
Karim et al. Impact of compressed and down-scaled training images on vehicle detection in remote sensing imagery
WO2023082784A1 (zh) 一种基于局部特征注意力的行人重识别方法和装置
WO2012139228A1 (en) Video-based detection of multiple object types under varying poses
CN102622607A (zh) 一种基于多特征融合的遥感图像分类方法
WO2021082168A1 (zh) 一种场景图像中特定目标对象的匹配方法
US12056943B2 (en) Object recognition method and system, and readable storage medium
CN107862702A (zh) 一种结合边界连通性与局部对比性的显著性检测方法
CN103544488B (zh) 一种人脸识别方法及装置
CN103678552A (zh) 基于显著区域特征的遥感影像检索方法及***
Zang et al. Traffic lane detection using fully convolutional neural network
Qu et al. Visual cross-image fusion using deep neural networks for image edge detection
Zhang et al. Semantic segmentation of very high-resolution remote sensing image based on multiple band combinations and patchwise scene analysis
CN104751175A (zh) 基于增量支持向量机的sar图像多类标场景分类方法
Cai et al. A comparative study of deep learning approaches to rooftop detection in aerial images
CN115631344A (zh) 一种基于特征自适应聚合的目标检测方法
CN104050674B (zh) 一种显著性区域检测方法及装置
Chen et al. Multiscale attention feature aggregation network for cloud and cloud shadow segmentation
Cheng et al. Multi-scale Feature Fusion and Transformer Network for urban green space segmentation from high-resolution remote sensing images
Kumar et al. A hybrid cluster technique for improving the efficiency of colour image segmentation
CN114519819A (zh) 一种基于全局上下文感知的遥感图像目标检测方法
CN104463091A (zh) 一种基于图像lgbp特征子向量的人脸图像识别方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20160323

Termination date: 20160708