CN104598898A - 一种基于多任务拓扑学习的航拍图像快速识别***及其快速识别方法 - Google Patents

一种基于多任务拓扑学习的航拍图像快速识别***及其快速识别方法 Download PDF

Info

Publication number
CN104598898A
CN104598898A CN201510080478.4A CN201510080478A CN104598898A CN 104598898 A CN104598898 A CN 104598898A CN 201510080478 A CN201510080478 A CN 201510080478A CN 104598898 A CN104598898 A CN 104598898A
Authority
CN
China
Prior art keywords
aerial images
images
classification
topological
individual
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201510080478.4A
Other languages
English (en)
Other versions
CN104598898B (zh
Inventor
汪萌
张鹿鸣
郭丹
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hefei University of Technology
Original Assignee
Hefei University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hefei University of Technology filed Critical Hefei University of Technology
Priority to CN201510080478.4A priority Critical patent/CN104598898B/zh
Publication of CN104598898A publication Critical patent/CN104598898A/zh
Application granted granted Critical
Publication of CN104598898B publication Critical patent/CN104598898B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/10Terrestrial scenes
    • G06V20/13Satellite images
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/26Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
    • G06V10/267Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion by performing operations on regions, e.g. growing, shrinking or watersheds

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Multimedia (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Astronomy & Astrophysics (AREA)
  • Remote Sensing (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种基于多任务拓扑学习的航拍图像快速识别***及其快速识别方法,其特征包括:特征构建模块、拓扑特征构建模块、拓扑特征投影模块、多任务拓扑学习模块、特征选择模块和分类识别模块;特征构建模块用于获取航拍图像和训练航拍图像的拓扑特征矩阵;拓扑特征构建模块用于获得训练航拍图像的拓扑特征投影矩阵;多任务拓扑学习模块用于获得航拍图像的拓扑字典;特征选择模块用于获得训练航拍图像的特征选择二元组;分类识别模块用于构建拓扑Boosting学习模型并实现目标航拍图像的分类。本发明采用多任务学习框架能够快速识别航拍图像的图像分类,提高了分类精度和效率。

Description

一种基于多任务拓扑学习的航拍图像快速识别***及其快速识别方法
技术领域
本发明属于图像处理、计算机视觉和模式识别技术领域,主要涉及一种基于多任务拓扑学习的航拍图像快速识别***及其快速识别方法。
背景技术
航拍图像作为遥感图像的重要组成部分,以其大量的数据信息和几何分辨率受到普遍的重视,因此对航拍图像进行识别分类意义重大。航拍图像的快速识别分类是一种智能图像分析方法,其目的就是为了对航拍图像进行快速准确的识别和分类,是计算机视觉领域热门研究课题之一。航拍图像的分类可以应用于场景标注、视频监控、机器人路径规划、异常检测等方面。
随着现代图像处理技术的发展,航拍图像分类技术也得到了巨大的发展,但是仍然面临以下几点问题:
一、已有方法中,构建的航拍图像中区域元分布图代表性不高,不能准确的表示航拍图像的组成成分。
例如2011年,Duchenne等作者在顶级国际会议IEEE International Conference on ComputerVision(ICCV)上发表的《A Graph-Matching Kernel for Object Categorization》这篇文章中提出的一种基于核匹配的图结构的目标分类方法,该方法中,图的节点代表着图像网格,几何连接边表示的是网格之间的连接关系,用这样的一种基于网格的图的匹配实现目标的分类,但是由于构建的航拍图像的图结构的代表性不高,不能准确的表示航拍图像的组成成分,降低了航拍图像分类的效率。
二、很多的航拍图像分类过程中缺少考虑图像的拓扑结构。
例如2010年,Yong Jae Lee等作者在顶级国际会议IEEE Conference on Computer Visionand Pattern Recognition(CVPR)上发表的《Object-Graphs for Context-Aware Category Discovery》这篇文章中提出的图像分类方法,该方法中图的节点表示已知和未知的目标,每个未知目标的语义利用其k空间最近邻已知目标的语义推断出来,然而仅仅考虑了空间上相邻部分的知识,即语义推断另一个重要线索。而拓扑结构在分类的过程中并没有考虑,从而降低图像分类的效率。
三、现有的很多考虑拓扑关系的航拍图像识别分类基于随机游走和树策略的匹配,限制了航拍图像中拓扑关系的匹配范围。
例如2007年,Harchaoui等作者在国际会议IEEE Conference on Computer Vision andPattern Recognition上发表的《Image Classification with Segmentation Graph Kernels》这篇文章中提出的一种图像分类方法,该方法利用随机游走核和树核函数的方法使用有限序列的邻近区域去提取局部图像灰度之间的随机游走和树的空间拓扑关系,最后利用随机游走和树策略的匹配实现图像的识别分类,然而该方法具有蹒跚的现象,从而引入了噪声,限制了航拍图像拓扑的匹配,从而降低了航拍图像分类的范围,实际生活中很难得到应用。
四、现有的很多航拍图像在分类的过程中对于结构很相似的图像不能区分图像的空间布局,降低了图像分类的精确度。
例如2006年,Svetlana Lazebnik等作者在顶级国际会议IEEE Conference on ComputerVision and Pattern Recognition(CVPR)上发表的《Spatial Pyramid Matching for RecognizingNatural Scene Categories》这篇文章中提出的一种基于空间金字塔匹配的自然场景分类的识别方法,该方法中每个图像被划分成越来越细的网格,每个网格通过局部特征直方图来计算得到其特征描述符,但是当两个图像的空间布局很相似时,该方法不能将其区别,从而降低了图像分类的精确度,并且复杂度高,很难在实际中得到应用。
五、已有的航拍图像分类的分类器的设计基本上是基于SVM分类器的,缺乏考虑多个相关任务的分类器之间信息的共享,导致计算的过程比较复杂,分类的效率低。
例如2006年,Svetlana Lazebnik等作者在顶级国际会议IEEE Conference on ComputerVision and Pattern Recognition(CVPR)上发表的《Spatial Pyramid Matching for RecognizingNatural Scene Categories》该方法在航拍图像分类器的设计是一种非线性SVM分类器,但是该方法中在分类过程中由于缺乏考虑多个相关任务之间的分类器信息的共享,导致了航拍图像分类的精确度不高,有一定的局限性。
因此,到目前为止,依然没有出现一种考虑图像拓扑关系的分类精度和效率高的并且可以工程应用的航拍图像分类方法。
发明内容
本发明为了解决现有技术存在的不足之处,提出一种基于多任务拓扑学习的航拍图像快速识别***及其快速识别方法,以期能实现航拍图像的快速分类,从而提高分类的速度和精度。
本发明为解决方法问题采用如下方法方案:
本发明一种基于多任务拓扑学习的航拍图像快速识别***的特点包括:特征构建模块、拓扑特征构建模块、拓扑特征投影模块、多任务拓扑学习模块、特征选择模块和分类识别模块;
所述特征构建模块根据所设定的N个图像分类,分别获取每个图像分类下的若干个分类标签,并分别获取每个图像分类下的若干个包含自身标签的训练航拍图像;
所述特征构建模块获取一个待识别的目标航拍图像;由所述目标航拍图像和所述训练航拍图像构成航拍图像;
利用SLIC分割方法对所述航拍图像中的每个航拍图像分割成为多个区域元,并构成区域元集合;对所述区域元集合利用概率SVM分类器方法计算每个区域元的信息熵,并衡量每个区域元的信息熵是否小于所设定的信息熵阈值;从所述区域元集合中去除小于所述信息熵阈值的区域元,从而生成优化后的区域元集合;根据所述优化后的区域元集合中各区域元在所述航拍图像中的位置信息,以及由位置信息获得的任意两个相邻的区域元所生成的一条连接边,构建所述航拍图像中的每个航拍图像的区域分布图;
由所述每个航拍图像的区域分布图生成若干个区域邻接子图;由所述区域邻接子图中各区域元的位置信息及连接边构成所述区域邻接子图各自的拓扑结构;由所有的区域邻接子图构成每个航拍图像的区域邻接图;
利用子图特征构建方法和核主成分分析法对所述每个航拍图像的若干个区域邻接子图进行处理,分别获得每个航拍图像的若干个区域邻接子图的特征向量,每个区域邻接子图的特征向量与各自所对应的区域邻接子图的拓扑结构一一对应;由所述每个航拍图像的若干个区域邻接子图的特征向量构成所述航拍图像中各自航拍图像的特征矩阵;所述航拍图像的特征矩阵包括目标航拍图像的特征矩阵和训练航拍图像的特征矩阵;
所述拓扑特征构建模块将所述训练航拍图像的特征矩阵中具有相同拓扑结构的特征向量进行融合处理,获得所述训练航拍图像的拓扑特征矩阵;从而获得所述每个图像分类下的所有训练航拍图像的拓扑特征矩阵;
所述拓扑特征投影模块根据所述若干个分类标签以及所述每个训练航拍图像的自身标签和拓扑特征矩阵,获得所述每个航拍图像分类下的训练航拍图像的拓扑特征投影矩阵;
所述多任务拓扑学习模块利用多任务学习框架以及主成分分析方法对所述拓扑特征投影矩阵进行迭代,从而获得所述训练航拍图像的拓扑编码矩阵;利用F-范式对所述拓扑编码矩阵的行向量进行计算,获得的计算结果按降序进行排序,选择前S个行向量所对应的拓扑结构,构成所述航拍图像的拓扑字典;
所述特征选择模块根据所述拓扑字典中各拓扑结构与所述航拍图像的特征矩阵中各特征向量对应的拓扑结构进行匹配,若匹配成功,则由所述航拍图像的特征矩阵中匹配成功的特征向量构成所述航拍图像的特征选择向量;所述航拍图像的特征选择向量包括目标航拍图像的特征选择向量和训练航拍图像的特征选择向量;由每个训练航拍图像的特征选择向量及所述训练航拍图像各自所对应的图像分类,构成每个训练航拍图像的特征选择二元组;
所述分类识别模块对所述拓扑字典采用SVM分类器构建多个分类模型;并根据所述训练航拍图像的特征选择二元组采用概率SVM方法获得优化的多个分类模型;由所述优化的多个分类模型构建拓扑Boosting学习模型;将所述目标航拍图像的特征选择向量输入到所述拓扑Boosting学习模型中,从而获得所述目标航拍图像的分类。
本发明一种基于多任务拓扑学习的航拍图像快速识别***的快速识别方法的特点是:
定义N个图像分类为C={c1,c2,…,cn,…,cN};cn表示第n个图像分类;每个图像分类中包含若干个分类标签;记所述第n个分类cn的分类标签为kn表示标签编号,1≤kn≤Kn表示第kn个分类标签;Kn表示所述第n个图像分类cn中分类标签的总数;则所述N个图像分类C的分类标签集合为T={T1,T2,…,Tn,…,TN};记κ为所述分类标签集合T中所有分类标签的总数,并有
记所述第n个图像分类cn中包含自身标签的训练航拍图像为 表示第n个图像分类cn中第mn个训练航拍图像,表示所述第n个图像分类cn中第mn个训练航拍图像的自身标签集合,1≤mn≤Mn;Mn表示所述第n个图像分类cn中所有训练航拍图像的总数;则所述N个图像分类C的训练航拍图像集合为I={I1,I2,…,In,…,IN};记目标航拍图像为I0
所述快速识别方法是按如下步骤进行:
步骤1、构建所述第n个图像分类cn中第mn个训练航拍图像的区域分布图从而获得所述第n个图像分类cn中所有训练航拍图像的区域分布图 RAG n = { RAG 1 ( n ) , RAG 2 ( n ) , . . . , RAG m n ( n ) , . . . , RAG M n ( n ) } ; 从而获得所述N个图像分类C的训练航拍图像集合I的区域分布图集合RAG={RAG1,RAG2,…,RAGn,…,RAGN};以及所述目标航拍图像I0的区域分布图RAG0
步骤1.1、利用SLIC分割方法将所述第n个图像分类cn中第mn个训练航拍图像分割为个区域元,获得所述第mn个训练航拍图像的区域元集合 表示所述第n个图像分类cn中第mn个训练航拍图像的第个区域元;所述第mn个训练航拍图像中包含所述第个区域元的位置信息;
步骤1.2、利用概率SVM分类器方法计算所述第mn个区域元集合中第个区域元属于第n个图像分类cn的概率从而获得所述第个区域元属于所述图像分类C中每个分类的概率;
步骤1.3、利用式(1)计算所述第个区域元的信息熵从而获得所述第mn个区域元集合中每个区域元的信息熵:
ϵ ( r h m n ( n , m n ) ) = - Σ c n ∈ C p ( r h m n ( n , m n ) → c n ) × log p ( r h m n ( n , m n ) → c n ) - - - ( 1 )
步骤1.4、判断所述信息熵是否小于信息熵阈值δ,若小于,从所述第mn个区域元集合中去除小于所述信息熵阈值δ的区域元;从而获得所述第mn个训练航拍图像的优化后的区域元集合
步骤1.5、以所述第mn个训练航拍图像的优化后的区域元集合中各区域元的位置中心点作为质点,将所述各区域元中任意两个相邻的区域元的质点采用邻接边进行连接,从而获得所述第mn个训练航拍图像的区域分布图
步骤2、构建所述第n个图像分类cn中第mn个训练航拍图像的区域邻接图
从所述第mn个训练航拍图像的区域分布图中穷举包含连接边的若干个质点,由所述若干个质点和相应连接边构成所述第mn个训练航拍图像的区域邻接子图 表示第个区域邻接子图,由所述区域邻接子图中各区域元的位置信息及连接边构成所述区域邻接子图的拓扑结构;表示所述第mn个训练航拍图像的区域邻接子图的总数;由所述第mn个训练航拍图像的区域邻接子图构成所述第n个图像分类cn中第mn个训练航拍图像的区域邻接图从而获得所述第n个图像分类cn中所有训练航拍图像的区域邻接图从而获得所述N个图像分类C的训练航拍图像集合I的区域邻接图集合G={G1,G2,…,Gn,…,GN};以及所述目标航拍图像I0的区域分布图G0
步骤3、获得所述第n个图像分类cn中第mn个训练航拍图像的特征矩阵从而获得所述第n个图像分类cn的训练航拍图像的特征矩阵从而获得所述N个图像分类C的训练航拍图像集合I的特征矩阵集合X={X1,X2,…,Xn,…,XN};以及所述目标航拍图像I0的特征矩阵X0
步骤3.1、对所述第mn个航拍图像的区域邻接图中质点个数相同的区域邻接子图采用子图特征构建方法分别得到子图特征矩阵 1 ≤ i m n , j m n ≤ Q m n ;
步骤3.2、利用式(2)获得所述子图特征矩阵的Golub-Werman距离 d GW ( B i m n ( n , m n ) , B j m n ( n , m n ) ) :
d GW ( B i m n ( n , m n ) , B j m n ( n , m n ) ) = | | ( B i m n ( n , m n ) ) U - ( B j m n ( n , m n ) ) V | | 2 - - - ( 2 )
式(2)中,分别表示所述子图特征矩阵的正交基;||·||2表示2-范式;
步骤3.3、利用式(3)计算所述区域邻接子图的高斯核
式(3)中,表示高斯核参数;
步骤3.4、重复步骤3.1到步骤3.3,从而获得所述第mn个区域邻接图中所有具有相同质点的区域邻接子图的高斯核;
步骤3.5、采用核主成分分析法获得所述第mn个航拍图像的特征矩阵 X m n ( n ) = [ x 1 ( n , m n ) , x 2 ( n , m n ) , . . . , x q m n ( n , m n ) , . . . , x Q m n ( n , m n ) ] ; 为所述第个区域邻接子图的特征向量,d为第个特征向量的维度;所述第个区域邻接子图的特征向量与所述第个区域邻接子图的拓扑结构一一对应;
步骤4、获得所述第n个图像分类cn中第mn个训练航拍图像的拓扑特征向量从而获得所述第n个图像分类cn中训练航拍图像的拓扑特征矩阵从而获得所述N个图像分类C的训练航拍图像集合I的拓扑特征矩阵集合X′={X′1,X′2,…,X′n,…,X′N};
步骤4.1、保留所述第n个图像分类cn中第mn个训练航拍图像的特征矩阵中所有特征向量所对应的拓扑结构中拓扑结构不相同的且质点个数不超过上限ν的拓扑结构,从而获得所述第n个图像分类cn中第mn个训练航拍图像的拓扑结构集合从而获得所述第n个图像分类cn的训练航拍图像的拓扑结构集合利用并集处理从而获得所述N个图像分类C的训练航拍图像集合I的拓扑结构集合tp;
步骤4.2、对所述N个图像分类C的训练航拍图像集合I的拓扑结构集合tp中的每个拓扑结构进行编号,获得σ个拓扑结构记为{tp′1,tp′2,…,tp′ο,…,tp′σ};tp′ο表示第ο个拓扑结构;1≤ο≤σ;
步骤4.3、将所述第mn个航拍图像的特征矩阵中各特征向量所对应的拓扑结构与所述第ο个拓扑结构tp′ο进行比较,选出具有相同拓扑结构的特征向量进行求和并取平均处理;获得所述第mn个航拍图像在第ο个拓扑结构tp′ο上的拓扑融合向量 从而获得所述第mn个航拍图像在所述σ个拓扑结构{tp′1,tp′2,…,tp′ο,…,tp′σ}上的拓扑融合向量
步骤4.3、将所述第mn个航拍图像在所述σ个拓扑结构{tp′1,tp′2,…,tp′ο,…,tp′σ}上的拓扑融合向量进行首尾相连的融合处理,获得所述第mn个训练航拍图像的拓扑特征向量并有dσ=d×σ;
步骤5、获得所述N个图像分类C的训练航拍图像集合I的拓扑投影矩阵集合M={M1,M2,…,Mn,…,MN}:
步骤5.1、利用式(4)获得所述第n个图像分类cn中训练航拍图像In的拓扑过渡矩阵
X ‾ n = X n ′ ( I M n - 1 M n 1 M n ( 1 M n ) T ) - - - ( 4 )
式(4)中, 为单位矩阵, 表示Mn个元素都为1的一维列向量,
步骤5.2、利用式(5)获得所述第n个图像分类cn中第mn个训练航拍图像的第kn个标签元素从而获得所述第n个图像分类cn中第mn个训练航拍图像的标签向量 y m n ( n ) = [ y 1 ( n , m n ) , y 2 ( n , m n ) , . . . , y k n ( n , m n ) , . . . , y K n ( n , m n ) ] , 从而获得所述第n个图像分类cn的训练航拍图像In的标签矩阵 Y n = [ y 1 ( n ) , y 2 ( n ) , . . . , y m n ( n ) , . . . , y M n ( n ) ] ; 并有
y k n ( n , m n ) = 1 if ( t k n ( n ) ∈ Tag m n ( n ) ) 0 else - - - ( 5 )
步骤5.3、利用式(6)获得所述第n个图像分类cn中训练航拍图像In的标签测量指示矩阵Fn
Fn=Yn[(Yn)TYn]-1/2  (6)
步骤5.4、利用式(7)获得所述第n个图像分类cn中训练航拍图像In的拓扑投影矩阵Mn从而获得所述N个图像分类C的训练航拍图像集合I的拓扑投影矩阵集合M={M1,M2,…,Mn,…,MN};
M n = [ X ‾ n ( I M n - ( F n ) T F n ) ( X ‾ n ) T - γ ( X ‾ n ) T X ‾ n ] T - - - ( 7 )
步骤6、多任务拓扑学习特征编码:
步骤6.1、定义迭代次数为t;初始化所述迭代次数t=1;
并初始化第t次迭代时所述第t次迭代的拓扑编码矩阵为并有第t次迭代时第n个拓扑编码子矩阵中的各元素由随机函数获得;
步骤6.2、利用式(8)获得所述第t次迭代的拓扑编码矩阵为W(t)的编码权重矩阵D(t)的第v行第v列元素从而获得第t次迭代时的编码权重矩阵D(t)
d v , v t = 1 2 | | w v ( t ) | | 2 - - - ( 8 )
式(4)中,表示所述第t次迭代的拓扑编码矩阵为W(t)的第v行行向量,所述编码权重矩阵D(t)为对角矩阵,
步骤6.3、定义任务学习次数为l;1≤l≤N;并初始化所述任务学习次数l=1;
步骤6.4、利用式(9)获得第t次迭代第l次任务学习的权重选择矩阵中第v行第v列元素从而获得第t次迭代第l次任务学习的权重选择矩阵
d l , v , v ( t ) = 1 2 | | w l , v ( t - 1 ) | | 2 - - - ( 9 )
式(4)中,表示第t次迭代时第l个拓扑编码子矩阵的第v行向量,所述权重选择矩阵为对角矩阵,
步骤6.5、从所述拓扑特征投影矩阵集合M={M1,M2,…,Mn,…,MN}中抽取第l个拓扑特征投影矩阵Ml;利用式(10)获得第t次迭代第l次任务学习的编码优化矩阵
U l ( t ) = M l + λ ( D l ( t ) + μ D ( t ) ) - - - ( 10 )
式(8)中,λ表示编码优化参数;μ表示编码内部协调参数;
步骤6.6、记Kl为所述N个图像分类C中的第l个图像分类cl中分类标签的总数;采用主成分分析方法获得第t次迭代第l次任务学习的编码优化矩阵的多个特征值及与多个特征值相对应的特征向量,将所述多个特征值从小到大排序,并选出前Kl个特征值所对应的特征向量作为所述第t次迭代时第n个拓扑编码子矩阵
步骤6.7、判断l=N是否成立,若成立,则完成N次任务学习,从而获得第t+1次迭代的拓扑编码矩阵并执行步骤6.8;否则将l+1的值赋给l,重复执行步骤6.4-步骤6.7;
步骤6.8、判断t=Γ是否成立,Γ为迭代总次数;若成立,执行步骤6.9;否则将t+1的值赋给t,返回步骤6.2顺序执行;
步骤6.9、利用F-范式对所述第t+1次迭代拓扑编码矩阵W(t+1)的行向量进行计算,获得的计算结果按降序进行排序,选择所述第t+1次迭代拓扑编码矩阵W(t+1)中排序前S个行向量,获得所述前S个行向量在所述第t+1次迭代拓扑编码矩阵W(t+1)中所对应的行编号{h1,h2,…,hs,…,hS},hs表示所述排序前S个行向量中第s个行向量在所述第t+1次迭代拓扑编码矩阵W(t+1)中的行编号;1≤s≤S;
步骤6.10、从所述拓扑结构{tp′1,tp′2,…,tp′ο,…,tp′σ}中选择第个拓扑结构,从而获得所述排序前S个行向量中第s个行向量所对应的拓扑结构;从而获得所述排序前S个行向量所对应的拓扑结构,并构成所述航拍图像的拓扑字典Tp={tp″1,tp″2,…,tp″s′,…,tp″S′};tp″s′表示所述拓扑字典Tp中第s′个拓扑结构;1≤s′≤S′;
步骤7、获得所述第n个图像分类cn中第mn个训练航拍图像的特征选择向量以及所述目标航拍图像I0的特征选择向量x″0;从而获得所述第n个图像分类cn中第mn个训练航拍图像的特征选择二元组从而获得所述第n个图像分类cn中训练航拍图像In的特征选择二元组 X FS ( n ) = { < x 1 &prime; &prime; ( n ) , c n > , < x 2 &prime; &prime; ( n ) , c n > , . . . , < x m n &prime; &prime; ( n ) , c n > , . . . , < x M n &prime; &prime; ( n ) , c n > } ; 从而获得所述N个图像分类C的训练航拍图像集合I的特征选择二元组集合 X FS = { X FS ( 1 ) , X FS ( 2 ) , . . . , X FS ( m n ) , . . . , X FS ( M n ) } ; X FS = { < x 1 FS , c 1 FS > , < x 2 FS , c 2 FS > , . . . , < x e FS , c e FS > , . . . , < x E FS , c E FS > } ; 表示所述N个图像分类C的训练航拍图像集合I的特征选择二元组集合XFS的第e个特征选择二元组,1≤e≤E;
步骤7.1、定义选择次数为ρ,并初始化ρ=1;1≤ρ≤S′;
定义所述第ρ次所述第mn个训练航拍图像的特征选择矩阵为并初始化所述第ρ次所述第mn个训练航拍图像的特征选择矩阵为为空;定义第ρ次所述第mn个训练航拍图像的特征抽取矩阵为并初始化
步骤7.2、从拓扑字典Tp中选取第ρ个拓扑结构tp″ρ
步骤7.3、判断所述第ρ个拓扑结构tp″ρ中的质点个数是否大于所述第mn个训练航拍图像的区域分布图的质点个数,若大于,则将ρ+1的值赋给ρ后执行步骤7.2;否则,执行步骤7.4;
步骤7.4、将所述第ρ个拓扑结构tp″ρ与第ρ次所述第mn个训练航拍图像的特征矩阵中每个特征向量所对应的拓扑结构进行匹配;若匹配成功,则从第ρ次所述第mn个训练航拍图像的特征抽取矩阵中移除与所述第ρ个拓扑结构tp″ρ匹配成功的拓扑结构所对应的特征向量,并放入第ρ次所述第mn个训练航拍图像的特征选择矩阵为中;
步骤7.5、将ρ+1的值赋给ρ,判断ρ=S′是否成立,若成立,采用最大池策略对所述第mn个训练航拍图像的特征选择矩阵进行处理,获得所述第mn个训练航拍图像的特征选择向量否则,重复执行步骤7.2-步骤7.5;
步骤8、构建拓扑Boosting学习模型:
步骤8.1、利用SVM分类器的一对多方法构建所述拓扑字典Tp中第s′个拓扑结构tp″s′的分类模型ψs′;从而获得所述拓扑字典Tp的S′个分类模型{ψ12,...,ψs′,...,ψS′};
步骤8.2、定义Boosting学习模型的迭代次数为τ,并初始化所述迭代次数τ=1;
定义表示第τ次迭代时所述N个图像分类C的训练航拍图像集合I的特征选择二元组集合XFS的第e个特征选择二元组的类别权重;则第τ次迭代时所述N个图像分类C的训练航拍图像集合I的特征选择二元组集合XFS的类别权重为并初始化 &omega; e ( &tau; ) = 1 E ;
步骤8.3、利用式(11)获得第τ次迭代的优化的分类模型ψ(τ)
&psi; ( &tau; ) = arg min &psi; ( &tau; ) &Element; { &psi; 1 , &psi; 2 , . . . , &psi; s &prime; , . . . , &psi; S &prime; } &Sigma; e = 1 E &omega; e ( &tau; ) &times; [ 1 - p &tau; ( x e FS &RightArrow; c e FS ) ] - - - ( 11 )
式(11)中,表示采用概率SVM方法对所述分类模型ψ(τ)进行处理获得的所述第e个特征选择二元组的特征选择向量属于图像分类的概率;
步骤8.4、利用式(12)计算第τ次迭代时的识别错误errτ
err &tau; = &Sigma; e = 1 E &omega; e ( &tau; ) &times; [ 1 - p &tau; ( x e FS &RightArrow; c e FS ) ] - - - ( 12 )
步骤8.5、利用式(13)计算第τ次迭代时的识别权重ατ
&alpha; &tau; = log ( 1 - err &tau; ) err &tau; + log ( N - 1 ) - - - ( 13 )
步骤8.6、利用式(14)计算第τ次迭代时所述第e个类别权重对应的类别过渡权重从而获得E个类别过渡权重
&omega; e &prime; ( &tau; ) = &omega; e ( &tau; ) &times; exp { &alpha; &tau; &times; [ 1 - p &tau; ( x e FS &RightArrow; c e FS ) ] } - - - ( 14 )
步骤8.7、对所述E个类别过渡权重进行归一化处理,获得第τ+1次迭代时的类别权重
步骤8.8、将τ+1的值赋给τ,重复执行步骤8.3-步骤8.8;直至τ等于迭代次数A为止,从而获得识别权重集合{α12,…,αa,…,αA}和所述A次迭代的优化的分类模型{ψ(1)(2),…,ψ(a),…,ψ(A)};αa表示所述识别权重集合中第a个识别权重;ψ(a)表示与所述第a个识别权重相对应的优化的分类模型;
步骤8.9、利用式(15)所示的拓扑Boosting学习模型获得所述目标航拍图像I0的图像分类Δ;从而实现目标航拍图像的快速识别:
&Delta; = arg min &Delta; &Element; C = { c 1 , c 2 , . . . , c n , . . . , c N } &Sigma; a = 1 A &alpha; a &times; p a ( x 0 &prime; &prime; &RightArrow; &Delta; ) - - - ( 15 )
式(15)中,pa(x″0→Δ)表示采用概率SVM方法对所述第a个优化的分类模型ψ(a)进行处理所获得的所述目标航拍图像I0的特征选择向量x″0属于图像分类Δ的概率。
与已有技术相比,本发明有益效果体现在:
1、本发明考虑了航拍图像的拓扑关系,采用了拓扑结构分类识别、多任务学习框架和Boosting学习模型的思想:首先,利用SLIC分割方法和信息熵优化方法,构建各航拍图像的区域分布图和区域邻接图,保留了航拍图像中的拓扑信息;接着,利用子图特征构建方法获得航拍图像的特征矩阵,进而获得所述每个图像分类下的所有训练航拍图像的拓扑特征矩阵以及拓扑特征投影矩阵;随后,利用多任务学习框架实现训练航拍图像的拓扑编码矩,获得拓扑字典;依据拓扑字典进行特征选择,获得目标航拍图像的特征选择向量和训练航拍图像的特征选择二元组;最后,依据选择的训练航拍图像的特征选择二元组构建拓扑Boosting学习模型;将所述目标航拍图像的特征选择向量输入到所述拓扑Boosting学习模型中,从而获得所述目标航拍图像的分类;与以往的航拍图像分类的方法相比,本发明有效的保留了航拍图像中的拓扑信息;利用多任务学习框架实现了多任务之间的信息共享;提高了分类的精确度;拓扑Boosting学习模型一旦建成,一次计算即可快速得到目标航拍图像的分类识别,提高了航拍图像分类的效率,可以在实际生活中得到广泛的应用。
2、本发明按照信息熵的原理对航拍图像分割所得的区域元经行了筛选,去除区域元噪音,得到优化后的区域元,从而提高了最终分类的效率。
3、本发明利用构造航拍图像的区域分布图代替以往的网格图,使得航拍图像中各区域元的拓扑结构能很好的保留下来,克服了以往网格图的缺点,提高了航拍图像拓扑信息的精确度。
4、本发明中利用子图特征构建的方法得到子图的特征矩阵,更具代表性,包含了丰富的航拍图像的信息,既能包含颜色、纹理等视觉特征,又能包含拓扑分布的几何空间关系,能够提高最终分类的精度。
5、本发明利用基于子图与子图之间的特征匹配,扩展了航拍图像拓扑特征被识别的范围,克服了现有方法中因采用随机游走和树核的方法,而导致的航拍图像拓扑关系在是否匹配上不能准确的被描述,从而导致分类精度低的问题。
6、和以往研究的航拍图像分类方法相比,本发明进而获得其拓扑特征向量,融合了同一航拍图像的各子图特征矩阵在不同拓扑结构上的特征描述,提高了拓扑结构特征的精度。
7、本发明中依据拓扑特征向量来实现拓扑特征在不同图像分类上的投影度量,而本发明中提出的拓扑特征投影矩阵的计算方法简单,利用的数学公式简单易求,从而降低了计算的复杂度。
8、本发明依据拓扑特征投影矩阵来实现最终的拓扑特征的编码,解决了现有方法航拍图像在分类的过程中对于结构很相似的图像不能区分其空间布局,从而降低了图像分类的精确度的问题。
9、和以往研究的航拍图像分类方法相比,本发明利用多任务学习框架,对多个相关图像分类任务之间实现信息的共享,实现拓扑特征编码,使得在拓扑特征具有识别性,克服了以往方法中因缺乏考虑相关任务之间信息的共享,而导致的分类的效率低的问题。
10、本发明通过利用基于多任务拓扑学习特征编码获得拓扑字典,利用拓扑字典来抽取具有鉴别性的子图特征,拓扑字典能够辅助筛选出航拍图像中具有判别性的子图的特征向量,为后面的建立分类模型提取出有效的分类信息。
11、本发明中构建的拓扑Boosting学习模型,将多个弱分类器集成成强学习的分类器模型,具有精确度高复杂度低的特点,提高了学习模型的精度和效率。
12、本发明中构建的拓扑Boosting学习模型一旦依据训练图像建成,即每次只需将任意目标航拍图像输入,采用学习模型的计算公式一次计算,就能实现目标航拍图像的快速识别,计算量小且快速。
附图说明
图1是本发明***模块结构图;
图2是本发明方法流程图;
图3a是本发明方法中航拍图像示例图;
图3b是本发明方法中航拍图像的区域分布图示例图;
图3c是本发明方法中航拍图像的多个区域邻接子图示例图;
图4a是本发明方法中航拍图像的拓扑结构示例图;
图4b是本发明方法中具有相同拓扑结构的区域邻接子图示例图1;
图4c是本发明方法中具有相同拓扑结构的区域邻接子图示例图2;
图4d是本发明方法中具有相同拓扑结构的区域邻接子图示例图3。
具体实施方式
本实施例中,一种基于多任务拓扑学习的航拍图像快速识别***与方法是用于目标航拍图像分类类别识别任务,如图1所示,一种基于多任务拓扑学习的航拍图像快速识别***,包括:特征构建模块、拓扑特征构建模块、拓扑特征投影模块、多任务拓扑学习模块、特征选择模块和分类识别模块;
特征构建模块根据所设定的N个图像分类,分别获取每个图像分类下的若干个分类标签,并分别获取每个图像分类下的若干个包含自身标签的训练航拍图像;
特征构建模块获取一个待识别的目标航拍图像;由目标航拍图像和训练航拍图像构成航拍图像;训练航拍图像用于建模;
利用SLIC分割方法对航拍图像中的每个航拍图像分割成为多个区域元,并构成区域元集合;对区域元集合利用概率SVM分类器方法计算每个区域元的信息熵,并衡量每个区域元的信息熵是否小于所设定的信息熵阈值;从区域元集合中去除小于信息熵阈值的区域元,从而生成优化后的区域元集合;根据优化后的区域元集合中各区域元在航拍图像中的位置信息,以及由位置信息获得的任意两个相邻的区域元所生成的一条连接边,构建航拍图像中的每个航拍图像的区域分布图;
由每个航拍图像的区域分布图生成若干个区域邻接子图;由区域邻接子图中各区域元的位置信息及连接边构成区域邻接子图各自的拓扑结构;由所有的区域邻接子图构成每个航拍图像的区域邻接图;
利用子图特征构建方法和核主成分分析法对每个航拍图像的若干个区域邻接子图进行处理,分别获得每个航拍图像的若干个区域邻接子图的特征向量,每个区域邻接子图的特征向量与各自所对应的区域邻接子图的拓扑结构一一对应;由每个航拍图像的若干个区域邻接子图的特征向量构成航拍图像中各自航拍图像的特征矩阵;航拍图像的特征矩阵包括目标航拍图像的特征矩阵和训练航拍图像的特征矩阵;
拓扑特征构建模块将训练航拍图像的特征矩阵中具有相同拓扑结构的特征向量进行融合处理,获得训练航拍图像的拓扑特征矩阵;从而获得每个图像分类下的所有训练航拍图像的拓扑特征矩阵;
拓扑特征投影模块根据若干个分类标签以及每个训练航拍图像的自身标签和拓扑特征矩阵,获得每个航拍图像分类下的训练航拍图像的拓扑特征投影矩阵;
多任务拓扑学习模块利用多任务学习框架以及主成分分析方法对拓扑特征投影矩阵进行迭代,从而获得训练航拍图像的拓扑编码矩阵;利用F-范式对拓扑编码矩阵的行向量进行计算,获得的计算结果按降序进行排序,选择前S个行向量所对应的拓扑结构,构成航拍图像的拓扑字典;
特征选择模块根据拓扑字典中各拓扑结构与航拍图像的特征矩阵中各特征向量对应的拓扑结构进行匹配,若匹配成功,则由航拍图像的特征矩阵中匹配成功的特征向量构成航拍图像的特征选择向量;航拍图像的特征选择向量包括目标航拍图像的特征选择向量和训练航拍图像的特征选择向量;由每个训练航拍图像的特征选择向量及训练航拍图像各自所对应的图像分类,构成每个训练航拍图像的特征选择二元组;
分类识别模块对拓扑字典采用SVM分类器构建多个分类模型;并根据训练航拍图像的特征选择二元组采用概率SVM方法获得优化的多个分类模型;由优化的多个分类模型构建拓扑Boosting学习模型;将目标航拍图像的特征选择向量输入到拓扑Boosting学习模型中,从而获得目标航拍图像的分类。
本实施例中,定义N个图像分类为C={c1,c2,…,cn,…,cN};cn表示第n个图像分类;每个图像分类中包含若干个分类标签;记第n个分类cn的分类标签为kn表示标签编号,1≤kn≤Kn表示第kn个分类标签;Kn表示第n个图像分类cn中分类标签的总数,Kn∈[10,50],具体实施中,Kn=10;则N个图像分类C的分类标签集合为T={T1,T2,…,Tn,…,TN};记κ为分类标签集合T中所有分类标签的总数,并有 &kappa; = &Sigma; n = 1 N K n ;
记第n个图像分类cn中包含自身标签的训练航拍图像为 表示第n个图像分类cn中第mn个训练航拍图像,表示第n个图像分类cn中第mn个训练航拍图像的自身标签集合,1≤mn≤Mn;Mn表示第n个图像分类cn中所有训练航拍图像的总数,例如,Mn∈[5000,10000];则N个图像分类C的训练航拍图像集合为I={I1,I2,…,In,…,IN},即如图2所示,有记目标航拍图像为I0
如图2所示,一种基于多任务拓扑学习的航拍图像快速识别***的识别方法是按如下步骤进行:
步骤1、构建第n个图像分类cn中第mn个训练航拍图像的区域分布图从而获得第n个图像分类cn中所有训练航拍图像的区域分布图 RAG n = { RAG 1 ( n ) , RAG 2 ( n ) , . . . , RAG m n ( n ) , . . . , RAG M n ( n ) } ; 从而获得N个图像分类C的训练航拍图像集合I的区域分布图集合RAG={RAG1,RAG2,…,RAGn,…,RAGN},即如图2所示,有以及目标航拍图像I0的区域分布图RAG0
步骤1.1、利用SLIC分割方法将第n个图像分类cn中第mn个训练航拍图像分割为个区域元,获得第mn个训练航拍图像的区域元集合 表示第n个图像分类cn中第mn个训练航拍图像的第个区域元;第mn个训练航拍图像中包含第个区域元的位置信息;具体的SLIC分割方法可参考文献《SLIC Superpixels Compared to State-of-the-artSuperpixel Methods》中的介绍;SLIC分割方法是一种基于聚类算法的超像素分割,由LAB空间以及x,y像素坐标表共5维空间来计算;此方法不仅可以分割彩色图像,也可以兼容分割灰度图,而且还可以人为的设置需要分割的区域的数量;SLIC分割方法的优点在于:一方面,提高效率,并且划分的子区域很好的保留了源图像的信息,准确度高;另一方面,计算量小,时间代价随超像素个数线性增长;本实施中,通过设置不同的SLIC容错率参数{0.1,0.2,0.3,0.4,0.5},对航拍图像进行多次分割;
步骤1.2、利用概率SVM分类器方法计算第mn个区域元集合中第个区域元属于第n个图像分类cn的概率从而获得第个区域元属于图像分类C中每个分类的概率;具体的概率SVM分类器方法可参考文献《Probabilistic Outputs for SupportVector Machines and Comparisons to Regularized Likelihood Method》中的介绍;概率SVM分类器方法即后验概率的支持向量方法,是标准SVM分类器的扩展和推广;都是先根据先验知识事先选定非线性映射,利用其将输入向量映射到一个高维特征空间,在这个空间中构造最优超平面;在SVM中,训练样本总是具有明确的类别信息,而对于一些不确定性问题并不恰当;概率SVM则受贝叶斯决策规则的启发,利用样本的后验概率来表示这种不确定性,将贝叶斯决策规则与SVM相结合,建立后验概率支持向量机方法,用以解决非确定性问题;本发明利用此方法能提高得到分类精度;
步骤1.3、利用式(1)计算第个区域元的信息熵从而获得第mn个区域元集合中每个区域元的信息熵:
&epsiv; ( r h m n ( n , m n ) ) = - &Sigma; c n &Element; C p ( r h m n ( n , m n ) &RightArrow; c n ) &times; log p ( r h m n ( n , m n ) &RightArrow; c n ) - - - ( 1 )
步骤1.4、判断信息熵是否小于信息熵阈值δ,若小于,从第mn个区域元集合中去除小于信息熵阈值δ的区域元;从而获得第mn个训练航拍图像的优化后的区域元集合δ∈[0.1,0.5];δ可以以步长为0.05进行调节;
步骤1.5、以第mn个训练航拍图像的优化后的区域元集合中各区域元的位置中心点作为质点,将各区域元中任意两个相邻的区域元的质点采用邻接边进行连接,从而获得第mn个训练航拍图像的区域分布图
例如,图3a为一个航拍图像示例;图3b所示则为图3a中航拍图像所对应的优化后的区域元集合所获得的区域分布图;
步骤2、构建第n个图像分类cn中第mn个训练航拍图像的区域邻接图
从第mn个训练航拍图像的区域分布图中穷举包含连接边的若干个质点,由若干个质点和相应连接边构成第mn个训练航拍图像的区域邻接子图 表示第个区域邻接子图,由区域邻接子图中各区域元的位置信息及连接边构成区域邻接子图的拓扑结构;表示第mn个训练航拍图像的区域邻接子图的总数;由第mn个训练航拍图像的区域邻接子图构成第n个图像分类cn中第mn个训练航拍图像的区域邻接图如图3c所示,由图3b中区域分布图所获得的多个区域邻接子图;图3c所示仅为部分区域邻接子图示例;从而获得第n个图像分类cn中所有训练航拍图像的区域邻接图从而获得N个图像分类C的训练航拍图像集合I的区域邻接图集合G={G1,G2,…,Gn,…,GN},即如图2所示,有以及目标航拍图像I0的区域分布图G0
步骤3、获得第n个图像分类cn中第mn个训练航拍图像的特征矩阵从而获得第n个图像分类cn的训练航拍图像的特征矩阵从而获得N个图像分类C的训练航拍图像集合I的特征矩阵集合X={X1,X2,…,Xn,…,XN},即如图2所示,有以及目标航拍图像I0的特征矩阵X0
步骤3.1、对第mn个航拍图像的区域邻接图中质点个数相同的区域邻接子图采用子图特征构建方法分别得到子图特征矩阵 具体的子图特征构建方法参考文献《Probabilistic Graphlet Transfer for PhotoCropping》;子图特征构建方法利用经典的图像颜色特征提取方法和纹理特征提取方法获得每个区域邻接子图的颜色和纹理视觉特征,并提取其几何结构特征,对每个区域邻接子图,将这三个特征依次相连构成特征矩阵;即子图特征矩阵;
步骤3.2、利用式(2)获得子图特征矩阵的Golub-Werman距离 d GW ( B i m n ( n , m n ) , B j m n ( n , m n ) ) :
d GW ( B i m n ( n , m n ) , B j m n ( n , m n ) ) = | | ( B i m n ( n , m n ) ) U - ( B j m n ( n , m n ) ) V | | 2 - - - ( 2 )
式(2)中,分别表示子图特征矩阵的正交基;||·||2表示2-范式;
步骤3.3、利用式(3)计算区域邻接子图的高斯核
式(3)中,表示高斯核参数,
步骤3.4、重复步骤3.1到步骤3.3,从而获得第mn个区域邻接图中所有具有相同质点的区域邻接子图的高斯核;
步骤3.5、采用核主成分分析法(Kernel PCA方法)获得第mn个航拍图像的特征矩阵 X m n ( n ) = [ x 1 ( n , m n ) , x 2 ( n , m n ) , . . . , x q m n ( n , m n ) , . . . , x Q m n ( n , m n ) ] ; 为第个区域邻接子图的特征向量,d为第个特征向量的维度;第个区域邻接子图的特征向量与第个区域邻接子图的拓扑结构一一对应;具体的核主成分分析法(KernelPCA方法)可参考文献《Kernel PCA for Feature Extraction and De-Noising in NonlinearRegression》;核主成分分析法(Kernel PCA方法)一种非线性的主元分析方法(PCA方法),其主要的思想是通过某种事先选择的非线性映射将输入矢量映射到一个高维线性特征空间之中,然后在高维线性特征空间中使用主成分分析法计算主元成分,它具有能有效的捕捉数据的非线性特征、对原始空间中的数据的分布情况没有要求等优点;基于此优点,本发明可以利用此方法将原本相关性很高的变量转化成彼此相互独立或不相关的变量,得到每个区域邻接图的特征向量相互独立性更强;
步骤4、获得第n个图像分类cn中第mn个训练航拍图像的拓扑特征向量从而获得第n个图像分类cn中训练航拍图像的拓扑特征矩阵从而获得N个图像分类C的训练航拍图像集合I的拓扑特征矩阵集合X′={X′1,X′2,…,X′n,…,X′N},即如图2所示,有
步骤4.1、保留第n个图像分类cn中第mn个训练航拍图像的特征矩阵中所有特征向量所对应的拓扑结构中拓扑结构不相同的且质点个数不超过上限ν的拓扑结构,从而获得第n个图像分类cn中第mn个训练航拍图像的拓扑结构集合从而获得第n个图像分类cn的训练航拍图像的拓扑结构集合利用并集处理即对拓扑结构集合{tp1,tp2,…,tpn,…,tpN}中所有的拓扑结构做并集操作:保留不同的拓扑结构,对相同的拓扑结构只保留一个;如图4b、4c和4d所示不同航拍图像产生的多个区域邻接子图具有相同的拓扑结构,相同的拓扑结构如所图4a所示;对此类拓扑结构做并集处理时,只需要保留一个拓扑结构即可,不需要重复保留;从而获得N个图像分类C的训练航拍图像集合I的拓扑结构集合tp;
步骤4.2、对N个图像分类C的训练航拍图像集合I的拓扑结构集合tp中的每个拓扑结构进行编号,获得σ个拓扑结构记为{tp′1,tp′2,…,tp′ο,…,tp′σ};tp′ο表示第ο个拓扑结构;1≤ο≤σ;本实施例中,当ν=7时,σ取值在160左右;
步骤4.3、将第mn个航拍图像的特征矩阵中各特征向量所对应的拓扑结构与第ο个拓扑结构tp′ο进行比较,选出具有相同拓扑结构的特征向量进行求和并取平均处理;获得第mn个航拍图像在第ο个拓扑结构tp′ο上的拓扑融合向量 从而获得第mn个航拍图像在σ个拓扑结构{tp′1,tp′2,…,tp′ο,…,tp′σ}上的拓扑融合向量 { x tp 1 &prime; &prime; ( n , m n ) , x tp 2 &prime; &prime; ( n , m n ) , . . . , x tp o &prime; &prime; ( n , m n ) , . . . , x tp &sigma; &prime; &prime; ( n , m n ) } ;
步骤4.3、将第mn个航拍图像在σ个拓扑结构{tp′1,tp′2,…,tp′ο,…,tp′σ}上的拓扑融合向量进行首尾相连的融合处理,获得第mn个训练航拍图像的拓扑特征向量并有dσ=d×σ;
步骤5、获得N个图像分类C的训练航拍图像集合I的拓扑投影矩阵集合M={M1,M2,…,Mn,…,MN}:
步骤5.1、利用式(4)获得第n个图像分类cn中训练航拍图像In的拓扑过渡矩阵
X &OverBar; n = X n &prime; ( I M n - 1 M n 1 M n ( 1 M n ) T ) - - - ( 4 )
式(4)中, 为单位矩阵, 表示Mn个元素都为1的一维列向量,
步骤5.2、利用式(5)获得第n个图像分类cn中第mn个训练航拍图像的第kn个标签元素从而获得第n个图像分类cn中第mn个训练航拍图像的标签向量 y m n ( n ) = [ y 1 ( n , m n ) , y 2 ( n , m n ) , . . . , y k n ( n , m n ) , . . . , y K n ( n , m n ) ] , 从而获得第n个图像分类cn的训练航拍图像In的标签矩阵 Y n = [ y 1 ( n ) , y 2 ( n ) , . . . , y m n ( n ) , . . . , y M n ( n ) ] ; 并有
y k n ( n , m n ) = 1 if ( t k n ( n ) &Element; Tag m n ( n ) ) 0 else - - - ( 5 )
步骤5.3、利用式(6)获得第n个图像分类cn中训练航拍图像In的标签测量指示矩阵Fn
Fn=Yn[(Yn)TYn]-1/2  (6)
步骤5.4、利用式(7)获得第n个图像分类cn中训练航拍图像In的拓扑投影矩阵Mn从而获得N个图像分类C的训练航拍图像集合I的拓扑投影矩阵集合M={M1,M2,…,Mn,…,MN},即如图2所示,有
M n = [ X &OverBar; n ( I M n - ( F n ) T F n ) ( X &OverBar; n ) T - &gamma; ( X &OverBar; n ) T X &OverBar; n ] T - - - ( 7 )
步骤6、多任务拓扑学习特征编码:
步骤6.1、定义迭代次数为t;初始化迭代次数t=1;
并初始化第t次迭代时第t次迭代的拓扑编码矩阵为并有第t次迭代时第n个拓扑编码子矩阵中的各元素由随机函数获得;
步骤6.2、利用式(8)获得第t次迭代的拓扑编码矩阵为W(t)的编码权重矩阵D(t)的第v行第v列元素从而获得第t次迭代时的编码权重矩阵D(t)
d v , v t = 1 2 | | w v ( t ) | | 2 - - - ( 8 )
式(4)中,表示第t次迭代的拓扑编码矩阵为W(t)的第v行行向量,编码权重矩阵D(t)为对角矩阵,
步骤6.3、定义任务学习次数为l;1≤l≤N;并初始化任务学习次数l=1;
步骤6.4、利用式(9)获得第t次迭代第l次任务学习的权重选择矩阵中第v行第v列元素从而获得第t次迭代第l次任务学习的权重选择矩阵
d l , v , v ( t ) = 1 2 | | w l , v ( t - 1 ) | | 2 - - - ( 9 )
式(4)中,表示第t次迭代时第l个拓扑编码子矩阵的第v行向量,权重选择矩阵为对角矩阵,
步骤6.5、从拓扑特征投影矩阵集合M={M1,M2,…,Mn,…,MN}中抽取第l个拓扑特征投影矩阵Ml;利用式(10)获得第t次迭代第l次任务学习的编码优化矩阵
U l ( t ) = M l + &lambda; ( D l ( t ) + &mu; D ( t ) ) - - - ( 10 )
式(8)中,λ表示编码优化参数,λ∈[0,0.1];μ表示编码内部协调参数,μ∈[0,0.5];例如,λ=0.01,μ=0.3;
步骤6.6、记Kl为N个图像分类C中的第l个图像分类cl中分类标签的总数;采用主成分分析方法(PCA方法)获得第t次迭代第l次任务学习的编码优化矩阵的多个特征值及与多个特征值相对应的特征向量,将多个特征值从小到大排序,并选出前Kl个特征值所对应的特征向量作为第t次迭代时第n个拓扑编码子矩阵主成分分析法(PCA方法)是一种基于二阶统计的数据分析方法,它把给定的一组相关变量通过线性变换转成另一组不相关的变量,这些新的变量按照方差依次递减的顺序排列,在数学变换中保持变量的总方差不变;主成分分析法的主要的目的是用较少的变量去解释原来资料中的大部分变量;本方面利用此方法选出比编码优化矩阵中特征向量个数少但能解释大部分编码优化矩阵中特征向量的几个新向量;
步骤6.7、判断l=N是否成立,若成立,则完成N次任务学习,从而获得第t+1次迭代的拓扑编码矩阵并执行步骤6.8;否则将l+1的值赋给l,重复执行步骤6.4-步骤6.7;
步骤6.8、判断t=Γ是否成立,Γ为迭代总次数,例如,Γ=1000;若成立,执行步骤6.9;否则将t+1的值赋给t,返回步骤6.2顺序执行;
步骤6.9、利用F-范式对第t+1次迭代拓扑编码矩阵W(t+1)的行向量进行计算,获得的计算结果按降序进行排序,选择第t+1次迭代拓扑编码矩阵W(t+1)中排序前S个行向量,获得前S个行向量在第t+1次迭代拓扑编码矩阵W(t+1)中所对应的行编号{h1,h2,…,hs,…,hS},hs表示排序前S个行向量中第s个行向量在第t+1次迭代拓扑编码矩阵W(t+1)中的行编号;1≤s≤S;第t+1次迭代拓扑编码矩阵W(t+1)中的行编号以1开始计数;
步骤6.10、从拓扑结构{tp′1,tp′2,…,tp′ο,…,tp′σ}中选择第个拓扑结构,从而获得排序前S个行向量中第s个行向量所对应的拓扑结构;从而获得排序前S个行向量所对应的拓扑结构,由于前S个行向量所对应的拓扑结构中可能存在相同的拓扑结构,本实施中仅保留不同的拓扑结构,并构成航拍图像的拓扑字典Tp={tp″1,tp″2,…,tp″s′,…,tp″S′};tp″s′表示拓扑字典Tp中第s′个拓扑结构;1≤s′≤S′;
步骤7、获得第n个图像分类cn中第mn个训练航拍图像的特征选择向量以及目标航拍图像I0的特征选择向量x″0;从而获得第n个图像分类cn中第mn个训练航拍图像的特征选择二元组从而获得第n个图像分类cn中训练航拍图像In的特征选择二元组 X FS ( n ) = { < x 1 &prime; &prime; ( n ) , c n > , < x 2 &prime; &prime; ( n ) , c n > , . . . , < x m n &prime; &prime; ( n ) , c n > , . . . , < x M n &prime; &prime; ( n ) , c n > } ; 从而获得N个图像分类C的训练航拍图像集合I的特征选择二元组集合 X FS = { X FS ( 1 ) , X FS ( 2 ) , . . . , X FS ( m n ) , . . . , X FS ( M n ) } ;
X FS = { < x 1 FS , c 1 FS > , < x 2 FS , c 2 FS > , . . . , < x e FS , c e FS > , . . . , < x E FS , c E FS > } ; 即如图2所示,有 表示N个图像分类C的训练航拍图像集合I的特征选择二元组集合XFS的第e个特征选择二元组,1≤e≤E;
步骤7.1、定义选择次数为ρ,并初始化ρ=1;1≤ρ≤S′;
定义第ρ次第mn个训练航拍图像的特征选择矩阵为并初始化第ρ次第mn个训练航拍图像的特征选择矩阵为为空;定义第ρ次第mn个训练航拍图像的特征抽取矩阵为并初始化 X &rho; ( n , m n ) = X m n ( n ) ;
步骤7.2、从拓扑字典Tp中选取第ρ个拓扑结构tp″ρ
步骤7.3、判断第ρ个拓扑结构tp″ρ中的质点个数是否大于第mn个训练航拍图像的区域分布图的质点个数,若大于,则将ρ+1的值赋给ρ后执行步骤7.2;否则,执行步骤7.4;
步骤7.4、将第ρ个拓扑结构tp″ρ与第ρ次第mn个训练航拍图像的特征矩阵中每个特征向量所对应的拓扑结构进行匹配;若匹配成功,则从第ρ次第mn个训练航拍图像的特征抽取矩阵中移除与第ρ个拓扑结构tp″ρ匹配成功的拓扑结构所对应的特征向量,并放入第ρ次第mn个训练航拍图像的特征选择矩阵为中;
步骤7.5、将ρ+1的值赋给ρ,判断ρ=S′是否成立,若成立,采用最大池策略对第mn个训练航拍图像的特征选择矩阵进行处理,获得第mn个训练航拍图像的特征选择向量否则,重复执行步骤7.2-步骤7.5;采用最大池策略即由矩阵中每行保留最大值元素构成一个新的向量;
步骤8、构建拓扑Boosting学习模型:
Boosting方法是一种用来提高弱分类算法准确度的方法,通过构造一个预测函数系列,然后以一定的方式将他们组合成一个预测函数;每个单个的分类器的识别率不一定很高,但他们联合后的结果有很高的识别率,本实施采用此方法,能够提高分类模型的识别率;
步骤8.1、利用SVM分类器的一对多方法(One-Against-All)构建拓扑字典Tp中第s′个拓扑结构tp″s′的分类模型ψs′;从而获得拓扑字典Tp的S′个分类模型{ψ12,...,ψs′,...,ψS′};SVM分类器的一对多方法.一对多法(one-against-all),训练时依次把某个类别的样本归为一类,其他剩余的样本归为另一类,这样k个类别的样本就构造出了k个SVM。分类时将未知样本分类为具有最大分类函数值的那类;本发明中利用此方法实现航拍图像的分类,可以实现航拍图像分类的多类别识别;
步骤8.2、定义Boosting学习模型的迭代次数为τ,并初始化迭代次数τ=1;
定义表示第τ次迭代时N个图像分类C的训练航拍图像集合I的特征选择二元组集合XFS的第e个特征选择二元组的类别权重;则第τ次迭代时N个图像分类C的训练航拍图像集合I的特征选择二元组集合XFS的类别权重为并初始化 &omega; e ( &tau; ) = 1 E ;
步骤8.3、利用式(11)获得第τ次迭代的优化的分类模型ψ(τ)
&psi; ( &tau; ) = arg min &psi; ( &tau; ) &Element; { &psi; 1 , &psi; 2 , . . . , &psi; s &prime; , . . . , &psi; S &prime; } &Sigma; e = 1 E &omega; e ( &tau; ) &times; [ 1 - p &tau; ( x e FS &RightArrow; c e FS ) ] - - - ( 11 )
式(11)中,表示采用概率SVM方法对分类模型ψ(τ)进行处理获得的第e个特征选择二元组的特征选择向量属于图像分类的概率;同步骤1.2中概率SVM分类器解释一样,具体的概率SVM分类器方法可参考文献《Probabilistic Outputs forSupport Vector Machines and Comparisons to Regularized Likelihood Method》中的介绍,本发明利用此方法能提高得到分类精度;
步骤8.4、利用式(12)计算第τ次迭代时的识别错误errτ
err &tau; = &Sigma; e = 1 E &omega; e ( &tau; ) &times; [ 1 - p &tau; ( x e FS &RightArrow; c e FS ) ] - - - ( 12 )
步骤8.5、利用式(13)计算第τ次迭代时的识别权重ατ
&alpha; &tau; = log ( 1 - err &tau; ) err &tau; + log ( N - 1 ) - - - ( 13 )
步骤8.6、利用式(14)计算第τ次迭代时第e个类别权重对应的类别过渡权重从而获得E个类别过渡权重
&omega; e &prime; ( &tau; ) = &omega; e ( &tau; ) &times; exp { &alpha; &tau; &times; [ 1 - p &tau; ( x e FS &RightArrow; c e FS ) ] } - - - ( 14 )
步骤8.7、对E个类别过渡权重进行归一化处理,获得第τ+1次迭代时的类别权重
步骤8.8、将τ+1的值赋给τ,重复执行步骤8.3-步骤8.8;直至τ等于迭代次数A为止,例如,A=1000,从而获得识别权重集合{α12,…,αa,…,αA}和A次迭代的优化的分类模型{ψ(1)(2),…,ψ(a),…,ψ(A)};αa表示识别权重集合中第a个识别权重;ψ(a)表示与第a个识别权重相对应的优化的分类模型;
步骤8.9、利用式(15)所示的拓扑Boosting学习模型获得目标航拍图像I0的图像分类Δ;从而实现目标航拍图像的快速识别:
&Delta; = arg min &Delta; &Element; C = { c 1 , c 2 , . . . , c n , . . . , c N } &Sigma; a = 1 A &alpha; a &times; p a ( x 0 &prime; &prime; &RightArrow; &Delta; ) - - - ( 15 )
式(15)中,pa(x″0→Δ)表示采用概率SVM方法对第a个优化的分类模型ψ(a)进行处理所获得的目标航拍图像I0的特征选择向量x″0属于图像分类Δ的概率;同步骤1.2中概率SVM分类器解释一样,具体的概率SVM分类器方法看参考文献《Probabilistic Outputs for SupportVectorMachines and Comparisons to Regularized Likelihood Method》中的介绍,本发明利用此方法能提高得到分类精度。
以上,仅为本发明较佳的一种实施方式,其他研究人员根据上面,完全可以在其他相关领域内,比如图像区域目标、图像场景、图像位置分类识别等,取得相同的效果。必须说明的是,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,根据本发明的技术方案及其发明构思加以等同替换或相关参数改变,都应涵盖在本发明的保护范围之内。

Claims (2)

1.一种基于多任务拓扑学习的航拍图像快速识别***,其特征是包括:特征构建模块、拓扑特征构建模块、拓扑特征投影模块、多任务拓扑学习模块、特征选择模块和分类识别模块;
所述特征构建模块根据所设定的N个图像分类,分别获取每个图像分类下的若干个分类标签,并分别获取每个图像分类下的若干个包含自身标签的训练航拍图像;
所述特征构建模块获取一个待识别的目标航拍图像;由所述目标航拍图像和所述训练航拍图像构成航拍图像;
利用SLIC分割方法对所述航拍图像中的每个航拍图像分割成为多个区域元,并构成区域元集合;对所述区域元集合利用概率SVM分类器方法计算每个区域元的信息熵,并衡量每个区域元的信息熵是否小于所设定的信息熵阈值;从所述区域元集合中去除小于所述信息熵阈值的区域元,从而生成优化后的区域元集合;根据所述优化后的区域元集合中各区域元在所述航拍图像中的位置信息,以及由位置信息获得的任意两个相邻的区域元所生成的一条连接边,构建所述航拍图像中的每个航拍图像的区域分布图;
由所述每个航拍图像的区域分布图生成若干个区域邻接子图;由所述区域邻接子图中各区域元的位置信息及连接边构成所述区域邻接子图各自的拓扑结构;由所有的区域邻接子图构成每个航拍图像的区域邻接图;
利用子图特征构建方法和核主成分分析法对所述每个航拍图像的若干个区域邻接子图进行处理,分别获得每个航拍图像的若干个区域邻接子图的特征向量,每个区域邻接子图的特征向量与各自所对应的区域邻接子图的拓扑结构一一对应;由所述每个航拍图像的若干个区域邻接子图的特征向量构成所述航拍图像中各自航拍图像的特征矩阵;所述航拍图像的特征矩阵包括目标航拍图像的特征矩阵和训练航拍图像的特征矩阵;
所述拓扑特征构建模块将所述训练航拍图像的特征矩阵中具有相同拓扑结构的特征向量进行融合处理,获得所述训练航拍图像的拓扑特征矩阵;从而获得所述每个图像分类下的所有训练航拍图像的拓扑特征矩阵;
所述拓扑特征投影模块根据所述若干个分类标签以及所述每个训练航拍图像的自身标签和拓扑特征矩阵,获得所述每个航拍图像分类下的训练航拍图像的拓扑特征投影矩阵;
所述多任务拓扑学习模块利用多任务学习框架以及主成分分析方法对所述拓扑特征投影矩阵进行迭代,从而获得所述训练航拍图像的拓扑编码矩阵;利用F-范式对所述拓扑编码矩阵的行向量进行计算,获得的计算结果按降序进行排序,选择前S个行向量所对应的拓扑结构,构成所述航拍图像的拓扑字典;
所述特征选择模块根据所述拓扑字典中各拓扑结构与所述航拍图像的特征矩阵中各特征向量对应的拓扑结构进行匹配,若匹配成功,则由所述航拍图像的特征矩阵中匹配成功的特征向量构成所述航拍图像的特征选择向量;所述航拍图像的特征选择向量包括目标航拍图像的特征选择向量和训练航拍图像的特征选择向量;由每个训练航拍图像的特征选择向量及所述训练航拍图像各自所对应的图像分类,构成每个训练航拍图像的特征选择二元组;
所述分类识别模块对所述拓扑字典采用SVM分类器构建多个分类模型;并根据所述训练航拍图像的特征选择二元组采用概率SVM方法获得优化的多个分类模型;由所述优化的多个分类模型构建拓扑Boosting学习模型;将所述目标航拍图像的特征选择向量输入到所述拓扑Boosting学习模型中,从而获得所述目标航拍图像的分类。
2.一种利用权利要求1所述的基于多任务拓扑学习的航拍图像快速识别***的快速识别方法,其特征是,
定义N个图像分类为C={c1,c2,…,cn,…,cN};cn表示第n个图像分类;每个图像分类中包含若干个分类标签;记所述第n个分类cn的分类标签为kn表示标签编号,1≤kn≤Kn表示第kn个分类标签;Kn表示所述第n个图像分类cn中分类标签的总数;则所述N个图像分类C的分类标签集合为T={T1,T2,…,Tn,…,TN};记κ为所述分类标签集合T中所有分类标签的总数,并有
记所述第n个图像分类cn中包含自身标签的训练航拍图像为 表示第n个图像分类cn中第mn个训练航拍图像,表示所述第n个图像分类cn中第mn个训练航拍图像的自身标签集合,1≤mn≤Mn;Mn表示所述第n个图像分类cn中所有训练航拍图像的总数;则所述N个图像分类C的训练航拍图像集合为I={I1,I2,…,In,…,IN};记目标航拍图像为I0
所述快速识别方法是按如下步骤进行:
步骤1、构建所述第n个图像分类cn中第mn个训练航拍图像的区域分布图从而获得所述第n个图像分类cn中所有训练航拍图像的区域分布图 RAG n = { RAG 1 ( n ) , RAG 2 ( n ) , &CenterDot; &CenterDot; &CenterDot; , RAG m n ( n ) , &CenterDot; &CenterDot; &CenterDot; , RAG M n ( n ) } ; 从而获得所述N个图像分类C的训练航拍图像集合I的区域分布图集合RAG={RAG1,RAG2,…,RAGn,…,RAGN};以及所述目标航拍图像I0的区域分布图RAG0
步骤1.1、利用SLIC分割方法将所述第n个图像分类cn中第mn个训练航拍图像分割为个区域元,获得所述第mn个训练航拍图像的区域元集合 表示所述第n个图像分类cn中第mn个训练航拍图像的第个区域元;所述第mn个训练航拍图像中包含所述第个区域元的位置信息;
步骤1.2、利用概率SVM分类器方法计算所述第mn个区域元集合中第个区域元属于第n个图像分类cn的概率从而获得所述第个区域元属于所述图像分类C中每个分类的概率;
步骤1.3、利用式(1)计算所述第个区域元的信息熵从而获得所述第mn个区域元集合中每个区域元的信息熵:
&epsiv; ( r h m n ( n , m n ) ) = - &Sigma; c n &Element; C p ( r h m n ( n , m n ) &RightArrow; c n ) &times; log p ( r h m n ( n , m n ) &RightArrow; c n ) - - - ( 1 )
步骤1.4、判断所述信息熵是否小于信息熵阈值δ,若小于,从所述第mn个区域元集合中去除小于所述信息熵阈值δ的区域元;从而获得所述第mn个训练航拍图像的优化后的区域元集合
步骤1.5、以所述第mn个训练航拍图像的优化后的区域元集合中各区域元的位置中心点作为质点,将所述各区域元中任意两个相邻的区域元的质点采用邻接边进行连接,从而获得所述第mn个训练航拍图像的区域分布图
步骤2、构建所述第n个图像分类cn中第mn个训练航拍图像的区域邻接图
从所述第mn个训练航拍图像的区域分布图中穷举包含连接边的若干个质点,由所述若干个质点和相应连接边构成所述第mn个训练航拍图像的区域邻接子图 表示第个区域邻接子图,由所述区域邻接子图中各区域元的位置信息及连接边构成所述区域邻接子图的拓扑结构;表示所述第mn个训练航拍图像的区域邻接子图的总数;1≤qmn≤Qmn;由所述第mn个训练航拍图像的区域邻接子图构成所述第n个图像分类cn中第mn个训练航拍图像的区域邻接图从而获得所述第n个图像分类cn中所有训练航拍图像的区域邻接图从而获得所述N个图像分类C的训练航拍图像集合I的区域邻接图集合G={G1,G2,…,Gn,…,GN};以及所述目标航拍图像I0的区域分布图G0
步骤3、获得所述第n个图像分类cn中第mn个训练航拍图像的特征矩阵从而获得所述第n个图像分类cn的训练航拍图像的特征矩阵从而获得所述N个图像分类C的训练航拍图像集合I的特征矩阵集合X={X1,X2,…,Xn,…,XN};以及所述目标航拍图像I0的特征矩阵X0
步骤3.1、对所述第mn个航拍图像的区域邻接图中质点个数相同的区域邻接子图采用子图特征构建方法分别得到子图特征矩阵 1 &le; i m n , j m n &le; Q m n ;
步骤3.2、利用式(2)获得所述子图特征矩阵的Golub-Werman距离
d GW ( B i m n ( n , m n ) , B j m n ( n , m n ) ) = | | ( B i m n ( n , m n ) ) U - ( B j m n ( n , m n ) ) V | | 2 - - - ( 2 )
式(2)中,分别表示所述子图特征矩阵的正交基;||·||2表示2-范式;
步骤3.3、利用式(3)计算所述区域邻接子图的高斯核
式(3)中,表示高斯核参数;
步骤3.4、重复步骤3.1到步骤3.3,从而获得所述第mn个区域邻接图中所有具有相同质点的区域邻接子图的高斯核;
步骤3.5、采用核主成分分析法获得所述第mn个航拍图像的特征矩阵 为所述第个区域邻接子图的特征向量,d为第个特征向量的维度;所述第个区域邻接子图的特征向量与所述第个区域邻接子图的拓扑结构一一对应;
步骤4、获得所述第n个图像分类cn中第mn个训练航拍图像的拓扑特征向量从而获得所述第n个图像分类cn中训练航拍图像的拓扑特征矩阵从而获得所述N个图像分类C的训练航拍图像集合I的拓扑特征矩阵集合X′={X′1,X′2,…,X′n,…,X′N};
步骤4.1、保留所述第n个图像分类cn中第mn个训练航拍图像的特征矩阵中所有特征向量所对应的拓扑结构中拓扑结构不相同的且质点个数不超过上限ν的拓扑结构,从而获得所述第n个图像分类cn中第mn个训练航拍图像的拓扑结构集合从而获得所述第n个图像分类cn的训练航拍图像的拓扑结构集合利用并集处理从而获得所述N个图像分类C的训练航拍图像集合I的拓扑结构集合tp;
步骤4.2、对所述N个图像分类C的训练航拍图像集合I的拓扑结构集合tp中的每个拓扑结构进行编号,获得σ个拓扑结构记为{tp′1,tp′2,…,tp′ο,…,tp′σ};tp′ο表示第ο个拓扑结构;1≤ο≤σ;
步骤4.3、将所述第mn个航拍图像的特征矩阵中各特征向量所对应的拓扑结构与所述第ο个拓扑结构tp′ο进行比较,选出具有相同拓扑结构的特征向量进行求和并取平均处理;获得所述第mn个航拍图像在第ο个拓扑结构tp′ο上的拓扑融合向量 从而获得所述第mn个航拍图像在所述σ个拓扑结构{tp′1,tp′2,…,tp′ο,…,tp′σ}上的拓扑融合向量
步骤4.3、将所述第mn个航拍图像在所述σ个拓扑结构{tp′1,tp′2,…,tp′ο,…,tp′σ}上的拓扑融合向量进行首尾相连的融合处理,获得所述第mn个训练航拍图像的拓扑特征向量并有dσ=d×σ;
步骤5、获得所述N个图像分类C的训练航拍图像集合I的拓扑投影矩阵集合M={M1,M2,…,Mn,…,MN}:
步骤5.1、利用式(4)获得所述第n个图像分类cn中训练航拍图像In的拓扑过渡矩阵
X &OverBar; n = X n &prime; ( I M n - 1 M n 1 M n ( 1 M n ) T ) - - - ( 4 )
式(4)中, 为单位矩阵, 表示Mn个元素都为1的一维列向量,
步骤5.2、利用式(5)获得所述第n个图像分类cn中第mn个训练航拍图像的第kn个标签元素从而获得所述第n个图像分类cn中第mn个训练航拍图像的标签向量 y m n ( n ) = [ y 1 ( n , m n ) , y 2 ( n , m n ) , &CenterDot; &CenterDot; &CenterDot; , y k n ( n , m n ) , &CenterDot; &CenterDot; &CenterDot; , y K n ( n , m n ) ] , 从而获得所述第n个图像分类cn的训练航拍图像In的标签矩阵 Y n = [ y 1 ( n ) , y 2 ( n ) , &CenterDot; &CenterDot; &CenterDot; , y m n ( n ) , &CenterDot; &CenterDot; &CenterDot; , y M n ( n ) ] ; 并有
y k n ( n , m n ) = 1 if ( t k n ( n ) &Element; Tag m n ( n ) ) 0 else - - - ( 5 )
步骤5.3、利用式(6)获得所述第n个图像分类cn中训练航拍图像In的标签测量指示矩阵Fn
Fn=Yn[(Yn)TYn]-1/2     (6)
步骤5.4、利用式(7)获得所述第n个图像分类cn中训练航拍图像In的拓扑投影矩阵Mn从而获得所述N个图像分类C的训练航拍图像集合I的拓扑投影矩阵集合M={M1,M2,…,Mn,…,MN};
M n = [ X &OverBar; n ( I M n - ( F n ) T F n ) ( X &OverBar; n ) T - &gamma; ( X &OverBar; n ) T X &OverBar; n ] T - - - ( 7 )
步骤6、多任务拓扑学习特征编码:
步骤6.1、定义迭代次数为t;初始化所述迭代次数t=1;
并初始化第t次迭代时所述第t次迭代的拓扑编码矩阵为并有第t次迭代时第n个拓扑编码子矩阵中的各元素由随机函数获得;
步骤6.2、利用式(8)获得所述第t次迭代的拓扑编码矩阵为W(t)的编码权重矩阵D(t)的第v行第v列元素从而获得第t次迭代时的编码权重矩阵D(t)
d v , v ( t ) = 1 2 | | w v ( t ) | | 2 - - - ( 8 )
式(4)中,表示所述第t次迭代的拓扑编码矩阵为W(t)的第v行行向量,所述编码权重矩阵D(t)为对角矩阵,
步骤6.3、定义任务学习次数为l;1≤l≤N;并初始化所述任务学习次数l=1;
步骤6.4、利用式(9)获得第t次迭代第l次任务学习的权重选择矩阵中第v行第v列元素从而获得第t次迭代第l次任务学习的权重选择矩阵
d l , v , v ( t ) = 1 2 | | w l , v ( t - 1 ) | | 2 - - - ( 9 )
式(4)中,表示第t次迭代时第l个拓扑编码子矩阵的第v行向量,所述权重选择矩阵为对角矩阵,
步骤6.5、从所述拓扑特征投影矩阵集合M={M1,M2,…,Mn,…,MN}中抽取第l个拓扑特征投影矩阵Ml;利用式(10)获得第t次迭代第l次任务学习的编码优化矩阵
U l ( t ) = M l + &lambda; ( D l ( t ) + &mu; D ( t ) ) - - - ( 10 )
式(8)中,λ表示编码优化参数;μ表示编码内部协调参数;
步骤6.6、记Kl为所述N个图像分类C中的第l个图像分类cl中分类标签的总数;采用主成分分析方法获得第t次迭代第l次任务学习的编码优化矩阵的多个特征值及与多个特征值相对应的特征向量,将所述多个特征值从小到大排序,并选出前Kl个特征值所对应的特征向量作为所述第t次迭代时第n个拓扑编码子矩阵
步骤6.7、判断l=N是否成立,若成立,则完成N次任务学习,从而获得第t+1次迭代的拓扑编码矩阵并执行步骤6.8;否则将l+1的值赋给l,重复执行步骤6.4-步骤6.7;
步骤6.8、判断t=Γ是否成立,Γ为迭代总次数;若成立,执行步骤6.9;否则将t+1的值赋给t,返回步骤6.2顺序执行;
步骤6.9、利用F-范式对所述第t+1次迭代拓扑编码矩阵W(t+1)的行向量进行计算,获得的计算结果按降序进行排序,选择所述第t+1次迭代拓扑编码矩阵W(t+1)中排序前S个行向量,获得所述前S个行向量在所述第t+1次迭代拓扑编码矩阵W(t+1)中所对应的行编号{h1,h2,…,hs,…,hS},hs表示所述排序前S个行向量中第s个行向量在所述第t+1次迭代拓扑编码矩阵W(t+1)中的行编号;1≤s≤S;
步骤6.10、从所述拓扑结构{tp′1,tp′2,…,tp′ο,…,tp′σ}中选择第个拓扑结构,从而获得所述排序前S个行向量中第s个行向量所对应的拓扑结构;从而获得所述排序前S个行向量所对应的拓扑结构,并构成所述航拍图像的拓扑字典Tp={tp″1,tp″2,…,tp″s′,…,tp″S′};tp″s′表示所述拓扑字典Tp中第s′个拓扑结构;1≤s′≤S′;
步骤7、获得所述第n个图像分类cn中第mn个训练航拍图像的特征选择向量以及所述目标航拍图像I0的特征选择向量x″0;从而获得所述第n个图像分类cn中第mn个训练航拍图像的特征选择二元组从而获得所述第n个图像分类cn中训练航拍图像In的特征选择二元组 X FS ( n ) = { < x 1 &prime; &prime; ( n ) , c n > , < x 2 &prime; &prime; ( n ) , c n > , &CenterDot; &CenterDot; &CenterDot; , < x m n &prime; &prime; ( n ) , c n > , &CenterDot; &CenterDot; &CenterDot; , < x M n &prime; &prime; ( n ) , c n > } ; 从而获得所述N个图像分类C的训练航拍图像集合I的特征选择二元组集合 X FS = { X FS ( 1 ) , X FS ( 2 ) , &CenterDot; &CenterDot; &CenterDot; , X FS ( m n ) , &CenterDot; &CenterDot; &CenterDot; , X FS ( M n ) } ; X FS = { < x 1 FS , c 1 FS > , < x 2 FS , c 2 FS > , &CenterDot; &CenterDot; &CenterDot; , < x e FS , c e FS > , &CenterDot; &CenterDot; &CenterDot; , < x E FS , c E FS > } ; 表示所述N个图像分类C的训练航拍图像集合I的特征选择二元组集合XFS的第e个特征选择二元组,1≤e≤E;
步骤7.1、定义选择次数为ρ,并初始化ρ=1;1≤ρ≤S′;
定义所述第ρ次所述第mn个训练航拍图像的特征选择矩阵为并初始化所述第ρ次所述第mn个训练航拍图像的特征选择矩阵为为空;定义第ρ次所述第mn个训练航拍图像的特征抽取矩阵为并初始化
步骤7.2、从拓扑字典Tp中选取第ρ个拓扑结构tp″ρ
步骤7.3、判断所述第ρ个拓扑结构tp″ρ中的质点个数是否大于所述第mn个训练航拍图像的区域分布图的质点个数,若大于,则将ρ+1的值赋给ρ后执行步骤7.2;否则,执行步骤7.4;
步骤7.4、将所述第ρ个拓扑结构tp″ρ与第ρ次所述第mn个训练航拍图像的特征矩阵中每个特征向量所对应的拓扑结构进行匹配;若匹配成功,则从第ρ次所述第mn个训练航拍图像的特征抽取矩阵中移除与所述第ρ个拓扑结构tp″ρ匹配成功的拓扑结构所对应的特征向量,并放入第ρ次所述第mn个训练航拍图像的特征选择矩阵为中;
步骤7.5、将ρ+1的值赋给ρ,判断ρ=S′是否成立,若成立,采用最大池策略对所述第mn个训练航拍图像的特征选择矩阵进行处理,获得所述第mn个训练航拍图像的特征选择向量否则,重复执行步骤7.2-步骤7.5;
步骤8、构建拓扑Boosting学习模型:
步骤8.1、利用SVM分类器的一对多方法构建所述拓扑字典Tp中第s′个拓扑结构tp″s′的分类模型ψs′;从而获得所述拓扑字典Tp的S′个分类模型{ψ12,...,ψs′,...,ψS′};
步骤8.2、定义Boosting学习模型的迭代次数为τ,并初始化所述迭代次数τ=1;
定义表示第τ次迭代时所述N个图像分类C的训练航拍图像集合I的特征选择二元组集合XFS的第e个特征选择二元组的类别权重;则第τ次迭代时所述N个图像分类C的训练航拍图像集合I的特征选择二元组集合XFS的类别权重为并初始化
步骤8.3、利用式(11)获得第τ次迭代的优化的分类模型ψ(τ)
&psi; ( &tau; ) = arg min &psi; ( &tau; ) &Element; { &psi; 1 , &psi; 2 , . . . , &psi; s &prime; , . . . , &psi; S &prime; } &Sigma; e = 1 E &omega; e ( &tau; ) &times; [ 1 - p &tau; ( x e FS &RightArrow; c e FS ) ] - - - ( 11 )
式(11)中,表示采用概率SVM方法对所述分类模型ψ(τ)进行处理获得的所述第e个特征选择二元组的特征选择向量属于图像分类的概率;
步骤8.4、利用式(12)计算第τ次迭代时的识别错误errτ
err &tau; = &Sigma; e = 1 E &omega; e ( &tau; ) &times; [ 1 - p &tau; ( x e FS &RightArrow; c e FS ) ] - - - ( 12 )
步骤8.5、利用式(13)计算第τ次迭代时的识别权重ατ
&alpha; &tau; = log ( 1 - err &tau; ) err &tau; + log ( N - 1 ) - - - ( 13 )
步骤8.6、利用式(14)计算第τ次迭代时所述第e个类别权重对应的类别过渡权重从而获得E个类别过渡权重
&omega; e &prime; ( &tau; ) = &omega; e ( &tau; ) &times; exp { &alpha; &tau; &times; [ 1 - p &tau; ( x e FS &RightArrow; c e FS ) ] } - - - ( 14 )
步骤8.7、对所述E个类别过渡权重进行归一化处理,获得第τ+1次迭代时的类别权重
步骤8.8、将τ+1的值赋给τ,重复执行步骤8.3-步骤8.8;直至τ等于迭代次数A为止,从而获得识别权重集合{α12,…,αa,…,αA}和所述A次迭代的优化的分类模型{ψ(1)(2),…,ψ(a),…,ψ(A)};αa表示所述识别权重集合中第a个识别权重;ψ(a)表示与所述第a个识别权重相对应的优化的分类模型;
步骤8.9、利用式(15)所示的拓扑Boosting学习模型获得所述目标航拍图像I0的图像分类Δ;从而实现目标航拍图像的快速识别:
&Delta; = arg min &Delta; &Element; C = { c 1 , c 2 , &CenterDot; &CenterDot; &CenterDot; , c n , &CenterDot; &CenterDot; &CenterDot; , c N } &Sigma; a = 1 A &alpha; a &times; p a ( x 0 &prime; &prime; &RightArrow; &Delta; ) - - - ( 15 )
式(15)中,pa(x″0→Δ)表示采用概率SVM方法对所述第a个优化的分类模型ψ(a)进行处理所获得的所述目标航拍图像I0的特征选择向量x0″属于图像分类Δ的概率。
CN201510080478.4A 2015-02-13 2015-02-13 一种基于多任务拓扑学习的航拍图像快速识别***及其快速识别方法 Active CN104598898B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510080478.4A CN104598898B (zh) 2015-02-13 2015-02-13 一种基于多任务拓扑学习的航拍图像快速识别***及其快速识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510080478.4A CN104598898B (zh) 2015-02-13 2015-02-13 一种基于多任务拓扑学习的航拍图像快速识别***及其快速识别方法

Publications (2)

Publication Number Publication Date
CN104598898A true CN104598898A (zh) 2015-05-06
CN104598898B CN104598898B (zh) 2018-02-06

Family

ID=53124671

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510080478.4A Active CN104598898B (zh) 2015-02-13 2015-02-13 一种基于多任务拓扑学习的航拍图像快速识别***及其快速识别方法

Country Status (1)

Country Link
CN (1) CN104598898B (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106845549A (zh) * 2017-01-22 2017-06-13 珠海习悦信息技术有限公司 一种基于多任务学习的场景与目标识别的方法及装置
CN109543708A (zh) * 2018-10-11 2019-03-29 上海交通大学 融合拓扑特征的面向图数据的模式识别方法
CN109948395A (zh) * 2017-12-20 2019-06-28 翔升(上海)电子技术有限公司 基于无人机的动物识别及数量统计方法与无人机
CN111079544A (zh) * 2019-11-21 2020-04-28 湖南理工学院 一种基于加权联合最近邻的多任务稀疏表示检测方法
CN115223661A (zh) * 2022-06-24 2022-10-21 西湖大学 生物组学数据分析***

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103116766A (zh) * 2013-03-20 2013-05-22 南京大学 一种基于增量神经网络和子图编码的图像分类方法
CN103177264A (zh) * 2013-03-14 2013-06-26 中国科学院自动化研究所 基于视觉词典全局拓扑表达的图像分类方法
CN104021396A (zh) * 2014-06-23 2014-09-03 哈尔滨工业大学 基于集成学习的高光谱遥感数据分类方法
US8885887B1 (en) * 2012-01-23 2014-11-11 Hrl Laboratories, Llc System for object detection and recognition in videos using stabilization

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8885887B1 (en) * 2012-01-23 2014-11-11 Hrl Laboratories, Llc System for object detection and recognition in videos using stabilization
CN103177264A (zh) * 2013-03-14 2013-06-26 中国科学院自动化研究所 基于视觉词典全局拓扑表达的图像分类方法
CN103116766A (zh) * 2013-03-20 2013-05-22 南京大学 一种基于增量神经网络和子图编码的图像分类方法
CN104021396A (zh) * 2014-06-23 2014-09-03 哈尔滨工业大学 基于集成学习的高光谱遥感数据分类方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
张华: "遥感数据可靠性分类方法研究", 《中国博士学位论文全文数据库》 *

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106845549A (zh) * 2017-01-22 2017-06-13 珠海习悦信息技术有限公司 一种基于多任务学习的场景与目标识别的方法及装置
CN106845549B (zh) * 2017-01-22 2020-08-21 珠海习悦信息技术有限公司 一种基于多任务学习的场景与目标识别的方法及装置
CN109948395A (zh) * 2017-12-20 2019-06-28 翔升(上海)电子技术有限公司 基于无人机的动物识别及数量统计方法与无人机
CN109543708A (zh) * 2018-10-11 2019-03-29 上海交通大学 融合拓扑特征的面向图数据的模式识别方法
CN109543708B (zh) * 2018-10-11 2021-05-25 上海交通大学 融合拓扑特征的面向图数据的模式识别方法
CN111079544A (zh) * 2019-11-21 2020-04-28 湖南理工学院 一种基于加权联合最近邻的多任务稀疏表示检测方法
CN115223661A (zh) * 2022-06-24 2022-10-21 西湖大学 生物组学数据分析***

Also Published As

Publication number Publication date
CN104598898B (zh) 2018-02-06

Similar Documents

Publication Publication Date Title
Lin et al. Transfer learning based traffic sign recognition using inception-v3 model
Trnovszky et al. Animal recognition system based on convolutional neural network
US9811718B2 (en) Method and a system for face verification
WO2019001071A1 (zh) 一种基于邻接矩阵的图特征提取***、图分类***和方法
CN108108751B (zh) 一种基于卷积多特征和深度随机森林的场景识别方法
WO2019001070A1 (zh) 一种基于邻接矩阵的连接信息规整***、图特征提取***、图分类***和方法
CN109002755B (zh) 基于人脸图像的年龄估计模型构建方法及估计方法
CN104036255A (zh) 一种人脸表情识别方法
CN103177265B (zh) 基于核函数与稀疏编码的高清图像分类方法
CN104598898A (zh) 一种基于多任务拓扑学习的航拍图像快速识别***及其快速识别方法
CN105930834A (zh) 基于球哈希二值编码的人脸识别方法及装置
CN105825233B (zh) 一种基于在线学习随机蕨分类器的行人检测方法
CN111311702B (zh) 一种基于BlockGAN的图像生成和识别模块及方法
CN103914705A (zh) 一种基于多目标免疫克隆的高光谱图像分类和波段选择的方法
CN112990282B (zh) 一种细粒度小样本图像的分类方法及装置
Zhang et al. Large-scale aerial image categorization using a multitask topological codebook
CN105930792A (zh) 一种基于视频局部特征字典的人体动作分类方法
CN110009045A (zh) 物联网终端的识别方法和装置
Singh et al. Leaf identification using feature extraction and neural network
Soumya et al. Emotion recognition from partially occluded facial images using prototypical networks
CN112464877A (zh) 基于自适应实例分类器细化的弱监督目标检测方法与***
CN114037056A (zh) 一种生成神经网络的方法、装置、计算机设备和存储介质
CN113822134A (zh) 一种基于视频的实例跟踪方法、装置、设备及存储介质
CN113657389A (zh) 一种软件定义卫星语义分割方法、装置和介质
CN105975921B (zh) 基于局部特征共生性和偏最小二乘法的行人检测方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant