CN107563445A - 一种基于半监督学习的提取图像特征的方法与装置 - Google Patents

一种基于半监督学习的提取图像特征的方法与装置 Download PDF

Info

Publication number
CN107563445A
CN107563445A CN201710796349.4A CN201710796349A CN107563445A CN 107563445 A CN107563445 A CN 107563445A CN 201710796349 A CN201710796349 A CN 201710796349A CN 107563445 A CN107563445 A CN 107563445A
Authority
CN
China
Prior art keywords
msub
mrow
training sample
represent
sample
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710796349.4A
Other languages
English (en)
Inventor
张召
张妍
张莉
李凡长
王邦军
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou University
Original Assignee
Suzhou University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou University filed Critical Suzhou University
Priority to CN201710796349.4A priority Critical patent/CN107563445A/zh
Publication of CN107563445A publication Critical patent/CN107563445A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Image Analysis (AREA)

Abstract

本发明实施例公开了一种基于半监督学习的提取图像特征的方法与装置,初始化模型参数,对图像数据进行预处理得到图像样本;并将图像样本划分为包括有标签样本和无标签样本的训练样本、只包含无标签样本的测试样本;依据成对约束条件,确定出训练样本中有标签样本对应的约束集;利用近邻搜索算法,构建所有训练样本对应的近邻图,并计算权重矩阵;通过最小化特征近似错误,对训练样本进行低维流形特征处理,得到低维流形特征和线性投影矩阵;利用线性投影矩阵提取训练样本和测试样本的图像特征。通过该技术方案可以同时保持样本数据间的全局和局部结构信息,提高特征的可鉴别性。并且实现快速将新的测试数据映射到低维,提高图像特征提取的性能。

Description

一种基于半监督学习的提取图像特征的方法与装置
技术领域
本发明涉及计算机视觉与图像识别技术领域,特别是涉及一种基于半监督学习的提取图像特征的方法与装置。
背景技术
在大量的实际应用中,现实中的数据可用高维的属性或特征进行描述。但是原始特征的维度可能很大,或者说样本是处于一个很高维的空间中,而通过特征映射或特征变换的方法,可将高维数据变换到一个低维空间。
从高维特征中提取得到对分类最有效的特征一直以来是计算机视觉与图像识别等研究领域中非常重要而困难的研究课题之一。等距离映射算法(Isomap)是一种经典的非线性流形学习方法,它的主要思想是寻找能最好得保留样本点之间的测地距离的子空间。对于原始的高维图像数据是其对应的低维空间的表示。其中N为样本数量,n、d分别为降维前后的数据维度(d<<n)。
Isomap的主要步骤为:1)使用K近邻或ε近邻方法确定每个样本点的近邻点;2)构造一个无向图G(V,E),其中每个节点vi∈V对应每个样本点xi,dG(xi,xj)表示图G中数据点xi和xj间的最短路径距离;3)通过求得低维嵌入Y。
近年来,很多基于Isomap的改进算法被相继提出。其中,多流形判别等距映射算法(MMD-Isomap)是一个全监督的多流形算法。它采用成对约束的思想,根据样本的标签信息将样本点划分为ML和CL,并使ML约束下的数据点间的距离最小化,使CL约束下的数据点尽可能分离,因此样本的全局结构得以保持。但是MMD-Isomap是一个直推式方法,无法快速解决外来测试数据的映射问题,此外在实际应用中,有标签的样本数据是稀缺的,且通过人工标定数据的过程会耗费大量人力和时间。
可见,如何提高图像特征提取的性能,是本领域技术人员亟待解决的问题。
发明内容
本发明实施例的目的是提供一种基于半监督学习的提取图像特征的方法与装置,可以提升图像特征提取的性能。
为解决上述技术问题,本发明实施例提供一种基于半监督学习的提取图像特征的方法,包括:
初始化模型参数,对获取的图像数据进行预处理,得到图像样本;并将所述图像样本划分包括有标签样本和无标签样本的训练集作为训练样本、只包含无标签样本的测试集作为测试样本;
依据成对约束条件,确定出所述训练样本中有标签样本对应的约束集;
利用近邻搜索算法,构建所述训练样本对应的近邻图,并计算得到权重矩阵,用于度量测试样本之间的近邻结构信息;
依据所述约束集和所述权重矩阵,通过最小化特征近似错误,对所述训练样本进行低维流形特征处理,得到所述训练样本的低维流形特征,以及用于获取低维流形特征的线性投影矩阵;
利用所述线性投影矩阵提取所述训练样本和所述测试样本的图像特征。
可选的,所述依据成对约束条件,确定出所述训练样本中有标签样本对应的约束集包括:
依据成对约束条件,将所述训练样本的数据点对划分为约束集ML和约束集CL,
ML={(xi,xj)|i≠j,l(xi)=l(xj)};
CL={(xi,xj)|i≠j,l(xi)≠l(xj)};
其中,l(xi)∈{1,2,...,c}表示图像样本xi(i=1,2,...,N)的类别标签;l(xj)表示图像样本xj(j=1,2,...,N)的类别标签;
根据最小化类内距离公式对所述约束集ML中的点对进行紧凑处理;
根据最大化类间距离公式对所述约束集CL中的点对进行分散处理;
其中,d(yi,yj)表示低维yi和yj间的欧氏距离,yi表示图像样本xi的低维表示,yj表示图像样本xj的低维表示,dG(xi,xj)表示用于近似测地距离的最短路径距离。
可选的,所述利用近邻搜索算法,构建所述训练样本对应的近邻图,并计算得到权重矩阵包括:
利用K最近邻分类算法,对所述训练样本进行处理,得到各个所述训练样本各自对应K个近邻,构造近邻图;
根据公式计算得到权重矩阵W;
其中,xi为约束集中的第i个数据,xj为所述约束集中的第j个数据,NN(xi)为训练样本xi的近邻集合,xj∈NN(xi)表示xj为训练样本xi近邻,||·||表示向量的l2范数,Wij代表顶点i指向顶点j的边对应的权重。
可选的,所述依据所述约束集和所述权重矩阵,通过最小化特征近似错误,对所述训练样本进行低维流形特征处理,得到所述训练样本的低维流形特征,以及用于获取低维流形特征的线性投影矩阵包括:
根据如下公式,最小化特征近似错误项得到所述训练样本对应的低维流形特征Y,以及用于获取低维流形特征的线性投影矩阵P:
其中,α、β、γ为权衡参数,α∈(0,1),|ML|表示约束集ML中的元素个数,|CL|表示约束集CL中的元素个数。
本发明实施例还提供了一种基于半监督学习的提取图像特征的装置,包括处理单元,确定单元、计算单元、得到单元和提取单元,所述处理单元,用于初始化模型参数,对获取的图像数据进行预处理,得到图像样本;并将所述图像样本划分包括有标签样本和无标签样本的训练集作为训练样本、只包含无标签样本的测试集作为测试样本;
所述确定单元,用于依据成对约束条件,确定出所述训练样本中有标签样本对应的约束集;
所述计算单元,用于利用近邻搜索算法,构建所述训练样本对应的近邻图,并计算得到权重矩阵,用于度量测试样本之间的近邻结构信息;
所述得到单元,用于依据所述约束集和所述权重矩阵,通过最小化特征近似错误,对所述训练样本进行低维流形特征处理,得到所述训练样本的低维流形特征,以及用于获取低维流形特征的线性投影矩阵;
所述提取单元,用于利用所述线性投影矩阵提取所述训练样本和所述测试样本的图像特征。
可选的,所述确定单元包括划分子单元、紧凑子单元和分散子单元,所述划分子单元,用于依据成对约束条件,将所述训练样本的数据点对划分为约束集ML和约束集CL,
ML={(xi,xj)|i≠j,l(xi)=l(xj)};
CL={(xi,xj)|i≠j,l(xi)≠l(xj)};
其中,l(xi)∈{1,2,...,c}表示图像样本xi(i=1,2,...,N)的类别标签;l(xj)表示图像样本xj(j=1,2,...,N)的类别标签;
所述紧凑子单元,用于根据最小化类内距离公式对所述约束集ML中的点对进行紧凑处理;
所述分散子单元,用于根据最大化类间距离公式对所述约束集CL中的点对进行分散处理;
其中,d(yi,yj)表示低维yi和yj间的欧氏距离,yi表示图像样本xi的低维表示,yj表示图像样本xj的低维表示,dG(xi,xj)表示用于近似测地距离的最短路径距离。
可选的,所述计算单元具体用于利用K最近邻分类算法,对所述训练样本进行处理,得到各个所述训练样本各自对应K个近邻,构造近邻图;并根据公式计算得到权重矩阵W;
其中,xi为约束集中的第i个数据,xj为所述约束集中的第j个数据,NN(xi)为训练样本xi的近邻集合,xj∈NN(xi)表示xj为训练样本xi近邻,||·||表示向量的l2范数,Wij代表顶点i指向顶点j的边对应的权重。
可选的,所述得到单元具体用于根据如下公式,最小化特征近似错误项得到所述训练样本对应的低维流形特征Y,以及用于获取低维流形特征的线性投影矩阵P:
其中,α、β、γ为权衡参数,α∈(0,1),|ML|表示约束集ML中的元素个数,|CL|表示约束集CL中的元素个数。
由上述技术方案可以看出,初始化模型参数,对获取的图像数据进行预处理,得到图像样本;并将所述图像样本划分包括有标签样本和无标签样本的训练集作为训练样本、只包含无标签样本的测试集作为测试样本;依据成对约束条件,确定出所述训练样本中有标签样本对应的约束集;利用近邻搜索算法,构建所述训练样本对应的近邻图,并计算得到权重矩阵;依据所述约束集和所述权重矩阵,通过最小化特征近似错误,对所述训练样本进行低维流形特征处理,得到所述训练样本的低维流形特征,以及用于获取低维流形特征的线性投影矩阵;利用所述线性投影矩阵便可以提取所述测试样本的图像特征。通过成对约束条件和最小化特征近似错误,实现了同时保持样本数据间的全局和局部结构信息,有效提高了特征的可鉴别性。通过最小化特征近似错误,学习得到线性投影矩阵,实现了快速将新的测试数据映射到低维,提高图像特征提取的性能。
附图说明
为了更清楚地说明本发明实施例,下面将对实施例中所需要使用的附图做简单的介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种基于半监督学习的提取图像特征的方法的流程图;
图2为本发明实施例提供的一种基于半监督学习的提取图像特征的装置的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下,所获得的所有其他实施例,都属于本发明保护范围。
为了使本技术领域的人员更好地理解本发明方案,下面结合附图和具体实施方式对本发明作进一步的详细说明。
接下来,详细介绍本发明实施例所提供的一种基于半监督学习的提取图像特征的方法。图1为本发明实施例提供的一种基于半监督学习的提取图像特征的方法的流程图,该方法包括:
S101:初始化模型参数,对获取的图像数据进行预处理,得到图像样本;并将所述图像样本划分包括有标签样本和无标签样本的训练集作为训练样本、只包含无标签样本的测试集作为测试样本。
模型参数可以包括近邻个数K、控制参数α,β,γ。原始的图像数据由于受到种种条件限制和随机干扰,往往不能直接在视觉***中直接使用,因此需要对原始的图像数据进行数据归一化等预处理。
对于图像数据其中,n是样本的维度,N是样本的数量,可以划分为包含有类别标签(共c个类别,c>2)的训练样本和包含无标签的测试样本且满足样本数量l+u=N。
S102:依据成对约束条件,确定出所述训练样本中有标签样本对应的约束集。
在本发明实施例中,依据成对约束条件,可以将所述训练样本的数据点对划分为约束集ML和约束集CL,
ML={(xi,xj)|i≠j,l(xi)=l(xj)};
CL={(xi,xj)|i≠j,l(xi)≠l(xj)};
其中,l(xi)∈{1,2,...,c}表示图像样本xi(i=1,2,...,N)的类别标签;l(xj)表示图像样本xj(j=1,2,...,N)的类别标签;
根据最小化类内距离公式对所述约束集ML中的点对进行紧凑处理;
根据最大化类间距离公式对所述约束集CL中的点对进行分散处理;
其中,d(yi,yj)表示低维yi和yj间的欧氏距离,yi表示图像样本xi的低维表示,yj表示图像样本xj的低维表示,dG(xi,xj)表示用于近似测地距离的最短路径距离。
通过最小化类内距离,最大化类间距离,可以保持训练样本全局结构信息,便于后续对图像样本进行准确的分类处理,减小图像分类的误差。
S103:利用近邻搜索算法,构建所述训练样本对应的近邻图,并计算得到权重矩阵,用于度量测试样本之间的近邻结构信息。
在本发明实施例中,可以利用K最近邻分类算法,对所述训练样本进行处理,得到各个所述训练样本各自对应K个近邻,构造近邻图;
对于原始的像数据G表示一个有N个顶点的图,其中,每个顶点对应一个数据样本xi,用i~j表示顶点i指向顶点j的边。进而对每条边进行加权,并用W表示权重矩阵,其中Wij代表边i~j上的权重,Wij=0表示连接的两个顶点不是近邻关系。
对于权重矩阵W可通过最小化如下优化问题求得,
其中,xi为约束集中的第i个数据,xj为所述约束集中的第j个数据,NN(xi)为训练样本xi的近邻集合,xj∈NN(xi)表示xj为训练样本xi近邻,||·||表示向量的l2范数,Wij代表顶点i指向顶点j的边对应的权重。
S104:依据所述约束集和所述权重矩阵,通过最小化特征近似错误,对所述训练样本进行低维流形特征处理,得到所述训练样本的低维流形特征,以及用于获取低维流形特征的线性投影矩阵。
对于训练样本的低维非线性流形特征,可将训练样本中的训练数据投影到低维空间(其中,d<<n),得到训练数据的低维非线性流形特征
在本发明实施例中通过引入线性投影矩阵P建立流形特征与训练样本数据之间的关系,最小化特征近似错误项使得到的线性投影矩阵P具备直接从样本提取得到非线性流形特征的能力。
具体的,可以根据如下公式,最小化特征近似错误项得到所述训练样本对应的低维流形特征Y,以及用于获取低维流形特征的线性投影矩阵P:
其中,α、β、γ为权衡参数,α∈(0,1),|ML|表示约束集ML中的元素个数,|CL|表示约束集CL中的元素个数。
在求解低维流形特征Y和线性投影矩阵P时,可将上述公式转换成如下特征分解问题:
K=γ(I-XT(XXT)-1X);
其中,I为N×N的单位矩阵,|ML|表示约束ML中的元素个数。
令A=RML+VCL-M-K,对其进行特征分解,得到前d个最大的特征值所对应的特征向量构成的集合即为所求的d维的流形特征Y。
通过步骤S101至步骤S103的训练准备阶段,可以获取到训练样本的约束集ML和CL,并且获取到每个训练样本的K个近邻(K近邻集合)。对于每个ML约束下的点对(xi,xj)∈ML,运用Dijkstra或Floyd算法计算其最短路径距离dG(xi,xj)。
在本发明实施例中可以按照如下步骤1至步骤7的训练过程,得到低维流形特征Y和线性投影矩阵P,
步骤1.初始化e为全1向量,I为N×N的单位矩阵。
步骤2.计算H=I-eeT/N,
步骤3.通过RML=-(1-α)(H(QML)2H)/2|ML|计算RML
步骤4.计算
步骤5.通过M=β(I-WT)(I-W),K=γ(I-XT(XXT)-1X),计算M,K。
步骤6.计算A=RML+VCL-M-K。
步骤7.对矩阵A特征分解,得到前d个最大的特征值对应的特征向量即构成低维流形特征Y,并通过计算P=YXT(XXT)-1求得线性投影矩阵P。
S105:利用所述线性投影矩阵提取所述训练样本和所述测试样本的图像特征。
通过最小化特征近似错误,学习得到线性投影矩阵,利用该线性投影矩阵,可以快速将新的测试数据映射到低维。
在本发明实施例中,可以通过测试样本,对得到的线性投影矩阵的性能进行检验。对测试样本xtest,可用线性投影矩阵P将测试样本嵌入得到的线性投影空间,完成测试样本的特征提取。测试样本xtest的嵌入结果表达如下:其中为测试样本的显著特征,将其输入最近邻分类器,得到待测的软类别标签,根据软类别标签中最大值对应的位置,可以确定出测试样本的类别,进而得到分类准确率作为量化指标,评价模型的特征提取效果。
由上述技术方案可以看出,初始化模型参数,对获取的图像数据进行预处理,得到图像样本;并将所述图像样本划分包括有标签样本和无标签样本的训练集作为训练样本、只包含无标签样本的测试集作为测试样本;依据成对约束条件,确定出所述训练样本中有标签样本对应的约束集;利用近邻搜索算法,构建所述训练样本对应的近邻图,并计算得到权重矩阵;依据所述约束集和所述权重矩阵,通过最小化特征近似错误,对所述训练样本进行低维流形特征处理,得到所述训练样本的低维流形特征,以及用于获取低维流形特征的线性投影矩阵;利用所述线性投影矩阵便可以提取所述测试样本的图像特征。通过成对约束条件和最小化特征近似错误,实现了同时保持样本数据间的全局和局部结构信息,有效提高了特征的可鉴别性。通过最小化特征近似错误,学习得到线性投影矩阵,实现了快速将新的测试数据映射到低维,提高图像特征提取的性能。
图2为本发明实施例提供的一种基于半监督学习的提取图像特征的装置的结构示意图,包括处理单元21,确定单元22、计算单元23、得到单元24和提取单元25,所述处理单元21,用于初始化模型参数,对获取的图像数据进行预处理,得到图像样本;并将所述图像样本划分包括有标签样本和无标签样本的训练集作为训练样本、只包含无标签样本的测试集作为测试样本;
所述确定单元22,用于依据成对约束条件,确定出所述训练样本中有标签样本对应的约束集;
所述计算单元23,用于利用近邻搜索算法,构建所述训练样本对应的近邻图,并计算得到权重矩阵,用于度量测试样本之间的近邻结构信息;
所述得到单元24,用于依据所述约束集和所述权重矩阵,通过最小化特征近似错误,对所述训练样本进行低维流形特征处理,得到所述训练样本的低维流形特征,以及用于获取低维流形特征的线性投影矩阵;
所述提取单元25,用于利用所述线性投影矩阵提取所述训练样本和所述测试样本的图像特征。
可选的,所述确定单元包括划分子单元、紧凑子单元和分散子单元,所述划分子单元,用于依据成对约束条件,将所述训练样本的数据点对划分为约束集ML和约束集CL,
ML={(xi,xj)|i≠j,l(xi)=l(xj)};
CL={(xi,xj)|i≠j,l(xi)≠l(xj)};
其中,l(xi)∈{1,2,...,c}表示图像样本xi(i=1,2,...,N)的类别标签;l(xj)表示图像样本xj(j=1,2,...,N)的类别标签;
所述紧凑子单元,用于根据最小化类内距离公式对所述约束集ML中的点对进行紧凑处理;
所述分散子单元,用于根据最大化类间距离公式对所述约束集CL中的点对进行分散处理;
其中,d(yi,yj)表示低维yi和yj间的欧氏距离,yi表示图像样本xi的低维表示,yj表示图像样本xj的低维表示,dG(xi,xj)表示用于近似测地距离的最短路径距离。
可选的,所述计算单元具体用于利用K最近邻分类算法,对所述训练样本进行处理,得到各个所述训练样本各自对应K个近邻,构造近邻图;并根据公式计算得到权重矩阵W;
其中,xi为约束集中的第i个数据,xj为所述约束集中的第j个数据,NN(xi)为训练样本xi的近邻集合,xj∈NN(xi)表示xj为训练样本xi近邻,||·||表示向量的l2范数,Wij代表顶点i指向顶点j的边对应的权重。
可选的,所述得到单元具体用于根据如下公式,最小化特征近似错误项得到所述训练样本对应的低维流形特征Y,以及用于获取低维流形特征的线性投影矩阵P:
其中,α、β、γ为权衡参数,α∈(0,1),|ML|表示约束集ML中的元素个数,|CL|表示约束集CL中的元素个数。
图2所对应实施例中特征的说明可以参见图1所对应实施例的相关说明,这里不再一一赘述。
由上述技术方案可以看出,初始化模型参数,对获取的图像数据进行预处理,得到图像样本;并将所述图像样本划分包括有标签样本和无标签样本的训练集作为训练样本、只包含无标签样本的测试集作为测试样本;依据成对约束条件,确定出所述训练样本中有标签样本对应的约束集;利用近邻搜索算法,构建所述训练样本对应的近邻图,并计算得到权重矩阵;依据所述约束集和所述权重矩阵,通过最小化特征近似错误,对所述训练样本进行低维流形特征处理,得到所述训练样本的低维流形特征,以及用于获取低维流形特征的线性投影矩阵;利用所述线性投影矩阵便可以提取所述测试样本的图像特征。通过成对约束条件和最小化特征近似错误,实现了同时保持样本数据间的全局和局部结构信息,有效提高了特征的可鉴别性。通过最小化特征近似错误,学习得到线性投影矩阵,实现了快速将新的测试数据映射到低维,提高图像特征提取的性能。
以上对本发明实施例所提供的一种基于半监督学习的提取图像特征的方法与装置进行了详细介绍。说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以对本发明进行若干改进和修饰,这些改进和修饰也落入本发明权利要求的保护范围内。
专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。

Claims (8)

1.一种基于半监督学习的提取图像特征的方法,其特征在于,包括:
初始化模型参数,对获取的图像数据进行预处理,得到图像样本;并将所述图像样本划分包括有标签样本和无标签样本的训练集作为训练样本、只包含无标签样本的测试集作为测试样本;
依据成对约束条件,确定出所述训练样本中有标签样本对应的约束集;
利用近邻搜索算法,构建所述训练样本对应的近邻图,并计算得到权重矩阵,用于度量测试样本之间的近邻结构信息;
依据所述约束集和所述权重矩阵,通过最小化特征近似错误,对所述训练样本进行低维流形特征处理,得到所述训练样本的低维流形特征,以及用于获取低维流形特征的线性投影矩阵;
利用所述线性投影矩阵提取所述训练样本和所述测试样本的图像特征。
2.根据权利要求1所述的方法,其特征在于,所述依据成对约束条件,确定出所述训练样本中有标签样本对应的约束集包括:
依据成对约束条件,将所述训练样本的数据点对划分为约束集ML和约束集CL,
ML={(xi,xj)|i≠j,l(xi)=l(xj)};
CL={(xi,xj)|i≠j,l(xi)≠l(xj)};
其中,l(xi)∈{1,2,...,c}表示图像样本xi(i=1,2,...,N)的类别标签;l(xj)表示图像样本xj(j=1,2,...,N)的类别标签;
根据最小化类内距离公式对所述约束集ML中的点对进行紧凑处理;
根据最大化类间距离公式对所述约束集CL中的点对进行分散处理;
其中,d(yi,yj)表示低维yi和yj间的欧氏距离,yi表示图像样本xi的低维表示,yj表示图像样本xj的低维表示,dG(xi,xj)表示用于近似测地距离的最短路径距离。
3.根据权利要求2所述的方法,其特征在于,所述利用近邻搜索算法,构建所述训练样本对应的近邻图,并计算得到权重矩阵包括:
利用K最近邻分类算法,对所述训练样本进行处理,得到各个所述训练样本各自对应K个近邻,构造近邻图;
根据公式计算得到权重矩阵W;
其中,xi为约束集中的第i个数据,xj为所述约束集中的第j个数据,NN(xi)为训练样本xi的近邻集合,xj∈NN(xi)表示xj为训练样本xi近邻,||·||表示向量的l2范数,Wij代表顶点i指向顶点j的边对应的权重。
4.根据权利要求3所述的方法,其特征在于,所述依据所述约束集和所述权重矩阵,通过最小化特征近似错误,对所述训练样本进行低维流形特征处理,得到所述训练样本的低维流形特征,以及用于获取低维流形特征的线性投影矩阵包括:
根据如下公式,最小化特征近似错误项得到所述训练样本对应的低维流形特征Y,以及用于获取低维流形特征的线性投影矩阵P,
<mrow> <munder> <mi>min</mi> <mrow> <mi>Y</mi> <mo>,</mo> <mi>P</mi> </mrow> </munder> <mfenced open = "(" close = ")"> <mtable> <mtr> <mtd> <mrow> <mfrac> <mrow> <mn>1</mn> <mo>-</mo> <mi>&amp;alpha;</mi> </mrow> <mrow> <mo>|</mo> <mi>M</mi> <mi>L</mi> <mo>|</mo> </mrow> </mfrac> <munder> <mo>&amp;Sigma;</mo> <mrow> <mo>(</mo> <msub> <mi>x</mi> <mi>i</mi> </msub> <mo>,</mo> <msub> <mi>x</mi> <mi>j</mi> </msub> <mo>)</mo> <mo>&amp;Element;</mo> <mi>M</mi> <mi>L</mi> </mrow> </munder> <msup> <mrow> <mo>(</mo> <mi>d</mi> <mo>(</mo> <mrow> <msub> <mi>y</mi> <mi>i</mi> </msub> <mo>,</mo> <msub> <mi>y</mi> <mi>j</mi> </msub> </mrow> <mo>)</mo> <mo>-</mo> <msub> <mi>d</mi> <mi>G</mi> </msub> <mo>(</mo> <mrow> <msub> <mi>x</mi> <mi>i</mi> </msub> <mo>,</mo> <msub> <mi>x</mi> <mi>j</mi> </msub> </mrow> <mo>)</mo> <mo>)</mo> </mrow> <mn>2</mn> </msup> <mo>-</mo> <mfrac> <mi>&amp;alpha;</mi> <mrow> <mo>|</mo> <mi>C</mi> <mi>L</mi> <mo>|</mo> </mrow> </mfrac> <munder> <mo>&amp;Sigma;</mo> <mrow> <mo>(</mo> <msub> <mi>x</mi> <mi>i</mi> </msub> <mo>,</mo> <msub> <mi>x</mi> <mi>j</mi> </msub> <mo>)</mo> <mo>&amp;Element;</mo> <mi>C</mi> <mi>L</mi> </mrow> </munder> <msup> <mi>d</mi> <mn>2</mn> </msup> <mrow> <mo>(</mo> <msub> <mi>y</mi> <mi>i</mi> </msub> <mo>,</mo> <msub> <mi>y</mi> <mi>j</mi> </msub> <mo>)</mo> </mrow> </mrow> </mtd> </mtr> <mtr> <mtd> <mrow> <mo>+</mo> <msubsup> <mi>&amp;beta;&amp;Sigma;</mi> <mrow> <mi>i</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>N</mi> </msubsup> <mo>|</mo> <mo>|</mo> <msub> <mi>y</mi> <mi>i</mi> </msub> <mo>-</mo> <munder> <mo>&amp;Sigma;</mo> <mrow> <mi>j</mi> <mo>:</mo> <msub> <mi>x</mi> <mi>j</mi> </msub> <mo>&amp;Element;</mo> <mi>N</mi> <mi>N</mi> <mrow> <mo>(</mo> <msub> <mi>x</mi> <mi>i</mi> </msub> <mo>)</mo> </mrow> </mrow> </munder> <msub> <mi>W</mi> <mrow> <mi>i</mi> <mi>j</mi> </mrow> </msub> <msub> <mi>y</mi> <mi>j</mi> </msub> <mo>|</mo> <msubsup> <mo>|</mo> <mn>2</mn> <mn>2</mn> </msubsup> <mo>+</mo> <msubsup> <mi>&amp;gamma;&amp;Sigma;</mi> <mrow> <mi>i</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>N</mi> </msubsup> <mo>|</mo> <mo>|</mo> <msub> <mi>Px</mi> <mi>i</mi> </msub> <mo>-</mo> <msub> <mi>y</mi> <mi>i</mi> </msub> <mo>|</mo> <msubsup> <mo>|</mo> <mn>2</mn> <mn>2</mn> </msubsup> </mrow> </mtd> </mtr> </mtable> </mfenced> <mo>;</mo> </mrow>
其中,α、β、γ为权衡参数,α∈(0,1),|ML|表示约束集ML中的元素个数,|CL|表示约束集CL中的元素个数。
5.一种基于半监督学习的提取图像特征的装置,其特征在于,包括处理单元,确定单元、计算单元、得到单元和提取单元,所述处理单元,用于初始化模型参数,对获取的图像数据进行预处理,得到图像样本;并将所述图像样本划分包括有标签样本和无标签样本的训练集作为训练样本、只包含无标签样本的测试集作为测试样本;
所述确定单元,用于依据成对约束条件,确定出所述训练样本中有标签样本对应的约束集;
所述计算单元,用于利用近邻搜索算法,构建所述训练样本对应的近邻图,并计算得到权重矩阵,用于度量测试样本之间的近邻结构信息;
所述得到单元,用于依据所述约束集和所述权重矩阵,通过最小化特征近似错误,对所述训练样本进行低维流形特征处理,得到所述训练样本的低维流形特征,以及用于获取低维流形特征的线性投影矩阵;
所述提取单元,用于利用所述线性投影矩阵提取所述训练样本和所述测试样本的图像特征。
6.根据权利要求5所述的装置,其特征在于,所述确定单元包括划分子单元、紧凑子单元和分散子单元,所述划分子单元,用于依据成对约束条件,将所述训练样本的数据点对划分为约束集ML和约束集CL,
ML={(xi,xj)|i≠j,l(xi)=l(xj)};
CL={(xi,xj)|i≠j,l(xi)≠l(xj)};
其中,l(xi)∈{1,2,...,c}表示图像样本xi(i=1,2,...,N)的类别标签;l(xj)表示图像样本xj(j=1,2,...,N)的类别标签;
所述紧凑子单元,用于根据最小化类内距离公式对所述约束集ML中的点对进行紧凑处理;
所述分散子单元,用于根据最大化类间距离公式对所述约束集CL中的点对进行分散处理;
其中,d(yi,yj)表示低维yi和yj间的欧氏距离,yi表示图像样本xi的低维表示,yj表示图像样本xj的低维表示,dG(xi,xj)表示用于近似测地距离的最短路径距离。
7.根据权利要求6所述的装置,其特征在于,所述计算单元具体用于利用K最近邻分类算法,对所述训练样本进行处理,得到各个所述训练样本各自对应K个近邻,构造近邻图;并根据公式计算得到权重矩阵W;
其中,xi为约束集中的第i个数据,xj为所述约束集中的第j个数据,NN(xi)为训练样本xi的近邻集合,xj∈NN(xi)表示xj为训练样本xi近邻,||·||表示向量的l2范数,Wij代表顶点i指向顶点j的边对应的权重。
8.根据权利要求7所述的装置,其特征在于,所述得到单元具体用于根据如下公式,最小化特征近似错误项得到所述训练样本对应的低维流形特征Y,以及用于获取低维流形特征的线性投影矩阵P:
<mrow> <munder> <mi>min</mi> <mrow> <mi>Y</mi> <mo>,</mo> <mi>P</mi> </mrow> </munder> <mfenced open = "(" close = ")"> <mtable> <mtr> <mtd> <mfrac> <mrow> <mn>1</mn> <mo>-</mo> <mi>&amp;alpha;</mi> </mrow> <mrow> <mo>|</mo> <mi>M</mi> <mi>L</mi> <mo>|</mo> </mrow> </mfrac> <mstyle> <munder> <mo>&amp;Sigma;</mo> <mrow> <mo>(</mo> <msub> <mi>x</mi> <mi>i</mi> </msub> <mo>,</mo> <msub> <mi>x</mi> <mi>j</mi> </msub> <mo>)</mo> <mo>&amp;Element;</mo> <mi>M</mi> <mi>L</mi> </mrow> </munder> </mstyle> <msup> <mrow> <mo>(</mo> <mrow> <mi>d</mi> <mrow> <mo>(</mo> <mrow> <msub> <mi>y</mi> <mi>i</mi> </msub> <mo>,</mo> <msub> <mi>y</mi> <mi>j</mi> </msub> </mrow> <mo>)</mo> </mrow> <mo>-</mo> <msub> <mi>d</mi> <mi>G</mi> </msub> <mrow> <mo>(</mo> <mrow> <msub> <mi>x</mi> <mi>i</mi> </msub> <mo>,</mo> <msub> <mi>x</mi> <mi>j</mi> </msub> </mrow> <mo>)</mo> </mrow> </mrow> <mo>)</mo> </mrow> <mn>2</mn> </msup> <mo>-</mo> <mfrac> <mi>&amp;alpha;</mi> <mrow> <mo>|</mo> <mi>C</mi> <mi>L</mi> <mo>|</mo> </mrow> </mfrac> <mstyle> <munder> <mo>&amp;Sigma;</mo> <mrow> <mo>(</mo> <msub> <mi>x</mi> <mi>i</mi> </msub> <mo>,</mo> <msub> <mi>x</mi> <mi>j</mi> </msub> <mo>)</mo> <mo>&amp;Element;</mo> <mi>C</mi> <mi>L</mi> </mrow> </munder> </mstyle> <msup> <mi>d</mi> <mn>2</mn> </msup> <mo>(</mo> <msub> <mi>y</mi> <mi>i</mi> </msub> <mo>,</mo> <msub> <mi>y</mi> <mi>j</mi> </msub> <mo>)</mo> </mtd> </mtr> <mtr> <mtd> <mo>+</mo> <mi>&amp;beta;</mi> <msubsup> <mi>&amp;Sigma;</mi> <mrow> <mi>i</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>N</mi> </msubsup> <mo>|</mo> <mo>|</mo> <msub> <mi>y</mi> <mi>i</mi> </msub> <mo>-</mo> <munder> <mo>&amp;Sigma;</mo> <mrow> <mi>j</mi> <mo>:</mo> <msub> <mi>x</mi> <mi>j</mi> </msub> <mo>&amp;Element;</mo> <mi>N</mi> <mi>N</mi> <mrow> <mo>(</mo> <msub> <mi>x</mi> <mi>i</mi> </msub> <mo>)</mo> </mrow> </mrow> </munder> <msub> <mi>W</mi> <mrow> <mi>i</mi> <mi>j</mi> </mrow> </msub> <msub> <mi>y</mi> <mi>j</mi> </msub> <mo>|</mo> <msubsup> <mo>|</mo> <mn>2</mn> <mn>2</mn> </msubsup> <mo>+</mo> <mi>&amp;gamma;</mi> <msubsup> <mi>&amp;Sigma;</mi> <mrow> <mi>i</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>N</mi> </msubsup> <mo>|</mo> <mo>|</mo> <mi>P</mi> <msub> <mi>x</mi> <mi>i</mi> </msub> <mo>-</mo> <msub> <mi>y</mi> <mi>i</mi> </msub> <mo>|</mo> <msubsup> <mo>|</mo> <mn>2</mn> <mn>2</mn> </msubsup> </mtd> </mtr> </mtable> </mfenced> <mo>;</mo> </mrow>
其中,α、β、γ为权衡参数,α∈(0,1),|ML|表示约束集ML中的元素个数,|CL|表示约束集CL中的元素个数。
CN201710796349.4A 2017-09-06 2017-09-06 一种基于半监督学习的提取图像特征的方法与装置 Pending CN107563445A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710796349.4A CN107563445A (zh) 2017-09-06 2017-09-06 一种基于半监督学习的提取图像特征的方法与装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710796349.4A CN107563445A (zh) 2017-09-06 2017-09-06 一种基于半监督学习的提取图像特征的方法与装置

Publications (1)

Publication Number Publication Date
CN107563445A true CN107563445A (zh) 2018-01-09

Family

ID=60979330

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710796349.4A Pending CN107563445A (zh) 2017-09-06 2017-09-06 一种基于半监督学习的提取图像特征的方法与装置

Country Status (1)

Country Link
CN (1) CN107563445A (zh)

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108491930A (zh) * 2018-03-23 2018-09-04 腾讯科技(深圳)有限公司 一种样本数据的处理方法以及数据处理装置
CN108537269A (zh) * 2018-04-04 2018-09-14 中山大学 一种弱交互式的物体检测深度学习方法及其***
CN108596027A (zh) * 2018-03-18 2018-09-28 西安电子科技大学 基于监督学习分类模型的未知类别信号的检测方法
CN109961088A (zh) * 2019-02-13 2019-07-02 苏州大学 无监督非线性自适应流形学习方法
CN110210335A (zh) * 2019-05-16 2019-09-06 上海工程技术大学 一种行人重识别学习模型的训练方法、***和装置
CN110232690A (zh) * 2019-06-05 2019-09-13 广东工业大学 一种图像分割的方法、***、设备及计算机可读存储介质
CN110648276A (zh) * 2019-09-25 2020-01-03 重庆大学 基于流形映射与字典学习的高维图像数据降维方法
CN111353516A (zh) * 2018-12-21 2020-06-30 华为技术有限公司 一种用于在线学习的样本分类方法及模型更新方法
CN111914906A (zh) * 2020-07-10 2020-11-10 云南电网有限责任公司带电作业分公司 半监督近邻重构分析的半监督数据特征提取方法、装置、***和存储介质
CN112966790A (zh) * 2021-04-30 2021-06-15 咪咕文化科技有限公司 图像的分类方法、装置、电子设备及存储介质
CN113902950A (zh) * 2021-10-16 2022-01-07 江苏大学 一种基于几何保持双投影的图像多标签分类方法
CN115861720A (zh) * 2023-02-28 2023-03-28 人工智能与数字经济广东省实验室(广州) 一种小样本亚类图像分类识别方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013177586A1 (en) * 2012-05-25 2013-11-28 The Johns Hopkins University An integrated real-time tracking system for normal and anomaly tracking and the methods therefor
CN104751191A (zh) * 2015-04-23 2015-07-01 重庆大学 一种稀疏自适应半监督多流形学习的高光谱影像分类方法
CN105608471A (zh) * 2015-12-28 2016-05-25 苏州大学 一种鲁棒直推式标签估计及数据分类方法和***
CN105608478A (zh) * 2016-03-30 2016-05-25 苏州大学 一种图像的特征提取与分类联合方法及***

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013177586A1 (en) * 2012-05-25 2013-11-28 The Johns Hopkins University An integrated real-time tracking system for normal and anomaly tracking and the methods therefor
CN104751191A (zh) * 2015-04-23 2015-07-01 重庆大学 一种稀疏自适应半监督多流形学习的高光谱影像分类方法
CN105608471A (zh) * 2015-12-28 2016-05-25 苏州大学 一种鲁棒直推式标签估计及数据分类方法和***
CN105608478A (zh) * 2016-03-30 2016-05-25 苏州大学 一种图像的特征提取与分类联合方法及***

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
BO YANG等: "Multi-manifold Discriminant Isomap for visualization and classification", 《PATTERN RECOGNITION》 *

Cited By (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108596027A (zh) * 2018-03-18 2018-09-28 西安电子科技大学 基于监督学习分类模型的未知类别信号的检测方法
CN108491930A (zh) * 2018-03-23 2018-09-04 腾讯科技(深圳)有限公司 一种样本数据的处理方法以及数据处理装置
CN108537269A (zh) * 2018-04-04 2018-09-14 中山大学 一种弱交互式的物体检测深度学习方法及其***
CN111353516A (zh) * 2018-12-21 2020-06-30 华为技术有限公司 一种用于在线学习的样本分类方法及模型更新方法
CN109961088A (zh) * 2019-02-13 2019-07-02 苏州大学 无监督非线性自适应流形学习方法
CN109961088B (zh) * 2019-02-13 2020-09-29 苏州大学 无监督非线性自适应流形学习方法
CN110210335A (zh) * 2019-05-16 2019-09-06 上海工程技术大学 一种行人重识别学习模型的训练方法、***和装置
CN110210335B (zh) * 2019-05-16 2021-05-11 上海工程技术大学 一种行人重识别学习模型的训练方法、***和装置
CN110232690A (zh) * 2019-06-05 2019-09-13 广东工业大学 一种图像分割的方法、***、设备及计算机可读存储介质
CN110648276A (zh) * 2019-09-25 2020-01-03 重庆大学 基于流形映射与字典学习的高维图像数据降维方法
CN111914906A (zh) * 2020-07-10 2020-11-10 云南电网有限责任公司带电作业分公司 半监督近邻重构分析的半监督数据特征提取方法、装置、***和存储介质
CN111914906B (zh) * 2020-07-10 2022-12-16 云南电网有限责任公司带电作业分公司 半监督近邻重构分析的半监督数据特征提取方法、装置、***和存储介质
CN112966790A (zh) * 2021-04-30 2021-06-15 咪咕文化科技有限公司 图像的分类方法、装置、电子设备及存储介质
CN112966790B (zh) * 2021-04-30 2024-02-27 咪咕文化科技有限公司 图像的分类方法、装置、电子设备及存储介质
CN113902950A (zh) * 2021-10-16 2022-01-07 江苏大学 一种基于几何保持双投影的图像多标签分类方法
CN113902950B (zh) * 2021-10-16 2024-03-19 江苏大学 一种基于几何保持双投影的图像多标签分类方法
CN115861720A (zh) * 2023-02-28 2023-03-28 人工智能与数字经济广东省实验室(广州) 一种小样本亚类图像分类识别方法

Similar Documents

Publication Publication Date Title
CN107563445A (zh) 一种基于半监督学习的提取图像特征的方法与装置
Bonham Measurements for terrestrial vegetation
CN108647741A (zh) 一种基于迁移学习的图像分类方法和***
CN102982165B (zh) 一种大规模人脸图像检索方法
CN109242041A (zh) 一种电能表异常数据检测方法、装置、设备及存储介质
CN107133213A (zh) 一种基于算法的文本摘要自动提取方法与***
CN108446711A (zh) 一种基于迁移学习的软件缺陷预测方法
CN108399414A (zh) 样本选择方法及装置
CN104166731A (zh) 一种社交网络重叠社区发现***及其方法
CN110135459A (zh) 一种基于双三元组深度度量学习网络的零样本分类方法
CN105678261B (zh) 基于有监督图的直推式数据降维方法
CN106203483A (zh) 一种基于语义相关多模态映射方法的零样本图像分类方法
CN106055573A (zh) 一种多示例学习框架下的鞋印图像检索方法及***
CN111738355A (zh) 注意力融合互信息的图像分类方法、装置及存储介质
CN105608478A (zh) 一种图像的特征提取与分类联合方法及***
CN106845358A (zh) 一种手写体字符图像特征识别的方法及***
CN113032613B (zh) 一种基于交互注意力卷积神经网络的三维模型检索方法
CN103839074B (zh) 一种基于素描线段信息和空间金字塔匹配的图像分类方法
CN108897750A (zh) 融合多元上下文信息的个性化地点推荐方法及设备
CN109840466A (zh) 基于聚类及全局/局部距离综合的多重度量学习方法
CN110378872A (zh) 一种面向裂缝图像检测的多源自适应平衡迁移学习方法
CN106971201A (zh) 基于集成学习的多标签分类方法
CN107392129A (zh) 基于Softmax的人脸检索方法和***
Tu et al. Scale effect on fusing remote sensing and human sensing to portray urban functions
CN109360191A (zh) 一种基于变分自编码器的图像显著性检测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20180109

RJ01 Rejection of invention patent application after publication