CN106778763B

CN106778763B - 一种基于属性图的图像表示方法

Info

Publication number: CN106778763B
Application number: CN201610993025.5A
Authority: CN
Inventors: 宁建红
Original assignee: Shanghai Dianji University
Current assignee: Shanghai Dianji University
Priority date: 2016-11-11
Filing date: 2016-11-11
Publication date: 2020-05-26
Anticipated expiration: 2036-11-11
Also published as: CN106778763A

Abstract

本发明提供了一种基于属性图的图像表示方法，用非直接完全图(V，E)来表示图像，称为属性图；V＝{V_l，V_g}是图的顶点；V_l表示本地节点，描述图像中包含的所有对象；V_g表示全局节点，描述图像的背景信息或者整体的场景信息；E表示图的边，分为两种边：局部边和全局边；属性图中的边表示图像中对象之间的空间关系以及对象在整个图像中的空间位置。本发明提供的方法用属性图来表示图像，对那些包含了相同对象却表示不同的图像语义的图像能够进行精确分类。属性图既考虑了图像的局部特征，又考虑了图像的全局特征，同时用边的信息描述了对象和对象之间的空间关系，以及对象在整个图像中的空间位置，对图像分类识别有着积极的意义。

Description

一种基于属性图的图像表示方法

技术领域

本发明涉及一种图像的表示方法，尤其涉及一种基于属性图的图像表示方法，属于图像识别技术领域。

背景技术

基于学习的图像识别方法在过去的几年中取得了很大进步。对特定的对象类，特别是人脸和汽车，都有比较可靠和高效的基于底层特征(例如SIFT特征或者HOG特征)的识别。但是这些图像的底层特征不能很好地反映图像类别信息。

最近，新的研究资料提出使用图像固有属性进行分类的方法。属性是指可以由人指定名称并且能在图像中观察到的特性，可以表示图像中对象是否存在，可以描述图像中对象的颜色、形状、材质、部件、类别及功能，也可以表示图像中场景的类别以及上下文信息等。因此，基于图像的属性特征进行分类的研究越来越多。Fahadi等(A.Farhadi，I.Endres，D.Hoiem，and D.Forsyth.Describing objects by their attributes.In CVPR，2009.2，5，6)用属性直接表示图像，并把它应用到对象分类；Patterson等(G.Patterson andJ.Hays.Sun attribute database：Discovering， annotating，and recognizing sceneattributes.In CVPR，2012.2)用属性来描述场景图像，并把它应用于场景图像的分类；While Lan等(T.Lan，W.Yang，Y.W.0003，and G.Mori.Image retrieval with structuredobject queries using latent ranking svm.In ECCV，2012，2)认为可以建立图像中所有对象的空间关系，并用此来表示图像，但是没有考虑所有对象在整个图像中的几何分布，以及单个对象的特征；Kulkarni (G.Kulkarni，V.Premraj，V.Ordonez，S.Dhar，S.Li，Y.Choi，A.C.Berg，and T.L.Berg. Babytalk：Understanding and generating simple imagedescriptions)建立了对象和对象之间相互关系的模型，但是没有考虑到图像整体的背景信息；Zheng等(L.Zheng， S.Wang，Z.Liu，and Q.Tian.Packing and padding：Coupledmulti-index for accurate image retrieval.In CVPR，2014.2)把图像的底层特征SIFT和颜色的信息加入到多维索引中，用这种方式来表示图像，Douze等(M.Douze，A.Ramisa，and C.Schmid. Combining attributes and fisher vectors for efficient imageretrieval.In CVPR，2011.2，6，7)把属性加入到Fisher向量中来表示图像，这些技术只考虑到图像的整体信息，却没有关注图像中的对象和这些对象的局部特征；Cao等(X.Cao，X.wei，X.Guo，Y.Han，and J.Tang.Augmented image retrieval using multi-orderobject layout with attributes.In ACM MM，2014.2，6，7)构建了一个基于属性的三角形对象结构来表示图像，但是却没有考虑图像全局的场景信息；

综上所述，现有技术有的直接用属性描述图像，却忽略了图像中对象的空间信息；有的用对象和对象之间的相互关系来表示图像，但却没有考虑到图像的整体背景信息；还有的考虑了图像的整体特征，但是却忽略了图像中的对象以及这些对象的局部特征。

发明内容

本发明要解决的技术问题是提供一种既考虑了图像的局部特征，又考虑了图像的全局特征，同时兼顾对象和对象之间的空间关系，以及对象在整个图像中的空间位置的图像表示方法。

为了解决上述技术问题，本发明的技术方案是提供一种基于属性图的图像表示方法，其特征在于：用非直接完全图(V，E)来表示图像，称为属性图；

V＝{V_l，V_g}是图的顶点；

V_l表示本地节点集合，描述图像中包含的所有对象；

V_g表示全局节点集合，描述图像的背景信息或者整体的场景信息；

e_i，j∈E表示图的边，分为两种边：局部边和全局边；局部边表示本地节点之间的连线，全局边表示本地节点和全局节点之间的连线；属性图中的边表示图像中对象之间的空间关系以及对象在整个图像中的空间位置。

优选地，所述V_l用本地属性进行描述，本地属性包括对象的颜色、形状、材质。

优选地，所述V_g用全局属性进行描述，全局属性包括图像场景和整体的上下文信息。

优选地，所述属性图中的边的获得方法如下：

其中，e_ij表示属性图中的边，

表示属性图中边的取值；v_i和v_j表示属性图中任意一个顶点；μ_ij表示两个对象几何中心的像素距离；θ_ij表示局部边和水平方向逆时针方向的夹角；δ_ij表示两个对象的边界盒子重叠部分；μ_ig表示对象的几何中心和全局几何中心的像素距离；θ_ig表示全局边和水平方向逆时针方向的夹角；area(V_i)表示对象边界框区域；weigh表示每个对象的权重；

更优选地，所述全局几何中心为所有对象几何中心的平均值。

优选地，具体步骤为：

步骤1：进行图像对象检测，生成各个对象的边界盒子；

步骤2：根据对象边界盒子，进行对象类别分类，得到对象类别；

步骤3：提取每个对象纹理、HOG、边缘和颜色特征进行分类，得到每个本地节点V_l的本地属性；

步骤4：对全局节点V_g进行分类，得到全局节点的全局属性；

步骤5：构建局部边；

步骤6：构建全局边。

优选地，所述步骤1中，运用卷积神经网络的方法进行图像对象检测。

优选地，所述步骤2中，采用支持向量机方法进行对象类别分类。

优选地，所述步骤4中，用深度神经网络对全局节点V_g进行分类。

本发明提供的方法用属性图来表示图像，对那些包含了相同对象却表示不同的图像语义的图像能够进行精确分类。属性图用局部节点、全局节点、局部边、全局边、局部节点属性和全局节点属性来描述一副图像，既考虑了图像的局部特征，又考虑了图像的全局特征，同时用边的信息描述了对象和对象之间的空间关系，以及对象在整个图像中的空间位置。

相比现有技术，本发明提供的方法具有如下有益效果；

1、研究方法上的更新，构建了具有对象权重的属性图，是一种新的图像表示方式。

2、对于图像中包含相同的对象，但却表达不同的语义的图像分类有较好的效果，适合精细图像分类。

3、由于图像中对象众多，可以通过权重的方式，忽略对图像语义贡献度不大的对象，减少计算量，对图像分类识别有着积极的意义。

具体实施方式

下面结合具体实施例，进一步阐述本发明。应理解，这些实施例仅用于说明本发明而不用于限制本发明的范围。此外应理解，在阅读了本发明讲授的内容之后，本领域技术人员可以对本发明作各种改动或修改，这些等价形式同样落于本申请所附权利要求书所限定的范围。

一种基于属性图的图像表示方法，其用非直接完全图(V，E)来表示图像，称为属性图。V＝{V_l，V_g}是图的顶点；V_l表示本地节点，描述图像中包含的所有对象；V_g表示全局节点，描述图像的背景信息或者整体的场景信息。V_l用本地属性进行描述，如对象的颜色、形状、材质等。V_g用全局属性来描述，如图像场景和整体的上下文信息。E表示图的边，分为两种边：局部边和全局边。属性图中的边表示图像中对象之间的空间关系以及对象在整个图像中的空间位置。

其中，e_ij表示属性图中的边，

表示属性图中边的取值；v_i和v_j表示属性图中任意一个顶点；μ_ij表示两个对象几何中心的像素距离，θ_ij表示局部边和水平方向逆时针方向的夹角，δ _ij表示两个对象的边界盒子重叠部分；

μ_ig表示对象的几何中心和全局几何中心的像素距离，c_g表示全局几何中心，全局几何中心是所有对象几何中心的平均值。

N表示所有对象几何中心的个数，C_k表示某个对象几何中心，k＝1，2，……，N。

θ_ig表示全局边和水平方向逆时针方向的夹角，area(V_i)和area(V_j)表示对象边界框区域，min(area(v_i)，area(v_j))表示两个对象边界区域取较小的。 weigh表示每个对象的权重，因为在整个图像中，并不是每个对象作用都是一样的，人们总是关注大一些的对象，关注度大的对象，权重大一些，关注度小的图像，权重小一些。

本实施例提供的基于属性图的图像表示方法概括即为：

输入：图像Image(I)；

输出：图像中各个对象边界盒子Bounding boxes(R₁，R₂，……，R_N)，对象类 M₁，M₂，……，M_N，本地节点属性，全局节点属性，全局边，局部边。

具体实施步骤如下：

步骤1：运用卷积神经网络的方法进行对象检测，生成各个对象的边界盒子 R₁，R₂，……，R_N。

步骤2：根据对象边界盒子R₁，R₂，……，R_N，采用SVM支持向量机方法进行对象类别分类得到对象类别M₁，M₂，……，M_N。

步骤3：提取每个对象纹理、HOG(方向梯度直方图)、边缘和颜色特征，用属性分类器SVM进行分类，得到每个本地节点V_l(即每个对象)的本地属性，由三个方面的属性构成：形状属性、组成部分属性和材料属性。

步骤4：用深度神经网络对全局节点V_g进行分类，得到全局节点的全局属性。

步骤5：构建局部边e_ij，V_i，Vj∈V_l，

步骤6：计算全局几何中心c_g。

步骤7：构建全局边e_ij，V_i∈V_l，V_j＝V_g，

属性图的优势在于：

1)运用了图像属性的特征，符合人类识别图像的基本过程，属性作为人们可理解的对象类别间共享的性质，有助于复杂易变环境中的机器学习。

2)构建的属性图，既考虑了图像的局部特征，又考虑了图像的全局特征，同时用边的信息描述了对象和对象之间的空间关系，已及对象在整个图像中的空间位置。

3)在图像全局边中加入了权重，对于表达一定语义的图像来说，人们总是关注面积比较大的对象，大的对象获取的关注度多，从而对图像语义表达贡献度较大。

Claims

1.一种基于属性图的图像表示方法，其特征在于：用非直接完全图(V，E)来表示图像，称为属性图；

V＝{V_l，V_g}是图的顶点；

V_l表示本地节点，描述图像中包含的所有对象；

V_g表示全局节点，描述图像的背景信息或者整体的场景信息；

E表示图的边，分为两种边：局部边和全局边；局部边表示本地节点之间的连线，全局边表示本地节点和全局节点之间的连线；属性图中的边表示图像中对象之间的空间关系以及对象在整个图像中的空间位置；

所述属性图中的边的获得方法如下：

其中，e_ij表示属性图中的边，e_ij∈E，

表示属性图中边的取值；v_i和v_j表示属性图中任意一个顶点；μ_ij表示两个对象几何中心的像素距离；θ_ij表示局部边和水平方向逆时针方向的夹角；δ_ij表示两个对象的边界盒子重叠部分除以两个对象边界区域中较小的部分；μ_ig表示对象的几何中心和全局几何中心的像素距离；θ_ig表示全局边和水平方向逆时针方向的夹角；area(V_i)表示对象边界框区域；weigh表示每个对象的权重。

2.如权利要求1所述的一种基于属性图的图像表示方法，其特征在于：所述V_l用本地属性进行描述，本地属性包括对象的颜色、形状、材质。

3.如权利要求1所述的一种基于属性图的图像表示方法，其特征在于：所述V_g用全局属性进行描述，全局属性包括图像场景和整体的上下文信息。

4.如权利要求1所述的一种基于属性图的图像表示方法，其特征在于：所述全局几何中心为所有对象几何中心的平均值。

5.如权利要求1所述的一种基于属性图的图像表示方法，其特征在于：具体步骤为：

步骤1：进行图像对象检测，生成各个对象的边界盒子；

步骤4：对全局节点V_g进行分类，得到全局节点的全局属性；

步骤5：构建局部边；

步骤6：构建全局边。

6.如权利要求5所述的一种基于属性图的图像表示方法，其特征在于：所述步骤1中，运用卷积神经网络的方法进行图像对象检测。

7.如权利要求5所述的一种基于属性图的图像表示方法，其特征在于：所述步骤2中，采用支持向量机方法进行对象类别分类。

8.如权利要求5所述的一种基于属性图的图像表示方法，其特征在于：所述步骤4中，用深度神经网络对全局节点V_g进行分类。