CN115393666A - 图像分类中基于原型补全的小样本扩充方法及*** - Google Patents

图像分类中基于原型补全的小样本扩充方法及*** Download PDF

Info

Publication number
CN115393666A
CN115393666A CN202210923952.5A CN202210923952A CN115393666A CN 115393666 A CN115393666 A CN 115393666A CN 202210923952 A CN202210923952 A CN 202210923952A CN 115393666 A CN115393666 A CN 115393666A
Authority
CN
China
Prior art keywords
data
features
prototype
support
base class
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210923952.5A
Other languages
English (en)
Inventor
曹江中
姚梓杰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong University of Technology
Original Assignee
Guangdong University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong University of Technology filed Critical Guangdong University of Technology
Priority to CN202210923952.5A priority Critical patent/CN115393666A/zh
Publication of CN115393666A publication Critical patent/CN115393666A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/774Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/764Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Databases & Information Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Image Analysis (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提出一种图像分类中基于原型补全的小样本扩充方法及***,涉及图像分类中样本处理的技术领域,首先采集原样本图像数据集,将原样本图像数据集划分为基类数据集、支持集和查询集,基于特征提取器分别提取三类数据集的特征,将样本由空间映射至特征空间,在特征空间中基于样本特征的相似程度进行原型特征的补全,得到原型特征,整体上仅需一个基类数据集的特征库和特征提取器即可对少量样本进行原型补全以及伪样本集合的生成,极大程度上弥补了小样本图像分类的缺点,避免引入额外网络参数的同时,节省后续图像分类的时间,普适性佳。

Description

图像分类中基于原型补全的小样本扩充方法及***
技术领域
本发明涉及图像分类中样本处理的技术领域,更具体地,涉及一种图像分类中基于原型补全的小样本扩充方法及***。
背景技术
图像分类问题,是指在图像输入后,输出对该图像内容分类描述的问题。根据图像的语义信息将不同类别图像区分开来,是计算机视觉中重要的基本问题,也是图像检测、图像分割、物体跟踪、行为分析等其他高层视觉任务的基础。图像分类在很多领域均有应用,包括安防领域的人脸识别和智能视频分析等,交通领域的交通场景识别,互联网领域基于内容的图像检索和相册自动归类,医学领域的图像识别等。
过去,图像分类是基于人工特征或简单机器学习的方法进行的,该方法的缺点是精度不够,且需要的样本数量较丰富,并需要部分人工设计。随着深度学习的发展,用于图像分类的手段取得了阶段性的进步,但在对样本数量的需求方面并没有改善,深度学习的方式依然需要巨大数量的样本来满足训练要求,因为在样本数量足够充足的情况下,性能表现较佳,分类准确率高,但是在样本稀少的情况下,会导致过拟合,分类准确率急剧下降。但是很多场景下,样本的获取及标记需要耗费过多的资源,而且充足的训练样本也通常会包含一定的噪声干扰。
在小样本的设定下,许多方法是利用小样本训练一个深度网络,如现有技术中公开了一种图像分类模型的构建方法和图像分类方法,首先建立神经网络,然后使用有限图像数据集对神经网络进行训练,形成图像分类模型,最后利用图像分类模型完成图像分类任务,但这种方式在某种程度上引入了过量的网络参数,并且网络接受一个输入,然后反馈一个输出,本质上是一种从x到y的非线性映射,但无法显式或隐式地表达成某种逻辑规则,因此,也存在着网络难以解释的问题,此外,这些训练出的网络参数普适性较差,且在实际应用中,少量的训练样本还可能存在着错误标记或者样本质量差的问题,更无法保障图像分类的准确性。
发明内容
为解决现有利用小样本训练神经网络以进行图像分类的方法容易引入过量网络参数且普适性差的问题,本发明提供了一种图像分类中基于原型补全的小样本扩充方法及***,对少量样本进行原型补全,避免引入额外网络参数的同时,弥补小样本图像分类的缺陷,节省后续图像分类的时间,普适性佳。
为了达到上述技术效果,本发明的技术方案如下:
一种图像分类中基于原型补全的小样本扩充方法,所述方法包括以下步骤:
S1.采集原样本图像数据集,根据原样本图像数据集中的图像数据类别将原样本图像数据集划分为基类数据集、支持集和查询集;
S2.选择特征提取器,并利用基类数据集训练该特征提取器,利用训练好的特征提取器分别提取基类数据集数据特征、支持集数据特征和查询集数据特征;
S3.基于空间度量距离函数,计算支持集数据特征与全部基类数据集数据特征的距离,根据距离确定与支持集数据特征最相似的K个样本;
S4.将K个样本与支持集数据特征的相似度进行加权计算,得到支持集的原型特征;
S5.基于支持集的原型特征,生成伪样本集合;
S6.将生成的伪样本集合和支持集数据特征共同作为训练数据,将查询集数据特征作为测试数据,进行图像分类。
在本技术方案中,首先采集原样本图像数据集,将原样本图像数据集划分为基类数据集、支持集和查询集,基于特征提取器分别提取三类数据集的特征,将样本由空间映射至特征空间,在特征空间中基于样本特征的相似程度进行原型特征的补全,得到原型特征,整体上仅需一个基类数据集的特征库和特征提取器即可对少量样本进行原型补全以及伪样本集合的生成,极大程度上弥补了小样本图像分类的缺点,而且没有引入额外的需要训练的参数,节省后续图像分类的时间以及设备需求而且与“黑盒”神经网络模型相比,具有极强的可解释性。
优选地,在步骤S1中,设原样本图像数据集中的图像数据类别共Z类,基类数据集属于X类,支持集与查询集属于Y类,满足:
X+Y=Z,
Figure BDA0003778832770000021
优选地,在步骤S2中,特征提取器选取为Wide ResNet网络,在采用基类数据集训练Wide ResNet网络的过程中,设置Wide ResNet网络的损失函数,采用反向传播的方式,更新Wide ResNet网络的权值参数,直至损失函数收敛,训练完成后固定网络参数,训练好的特征提取器提取设定目标任务的数据特征。
优选地,以基类数据集第i类数据特征的均值作为该类数据特征的统称,则满足:
Figure BDA0003778832770000031
其中,μ1i表示基类数据集第i类数据特征的均值,xj表示基类数据集第i类数据特征中第j个数据特征;ni表示基类数据集第i类数据特征的数量;
设支持数据集数据特征的均值为μ2,以μ2作为支持数据集数据特征的统称,设空间度量距离函数统称为fd(),则基于空间度量距离函数,计算支持集数据特征与全部基类数据集数据特征的距离时,满足:
di=fdi,xs)
其中,di表示支持集数据特征与基类数据集第i类数据特征的距离;最终,得到距离集合D,表示为:
D={d1,d2,...,di,...,dq}
其中,q表示基类数据集数据特征的种类数,将距离集合D中所有距离元素的值按从小到大的顺序排列,根据排列顺序,选出前K个距离元素分别对应的基类数据集数据特征,作为支持集数据特征最相似的K个样本。
优选地,在获取支持集数据特征与全部基类数据集数据特征的距离后,将距离归一化,表达式为:
Figure BDA0003778832770000032
Figure BDA0003778832770000033
其中,d'i表示距离归一化后的值,
Figure BDA0003778832770000034
表示距离中的最大值,
Figure BDA0003778832770000035
表示距离中的最小值。
优选地,在步骤S4中,K个样本与支持集数据特征的相似度即K个样本与支持集数据特征均值μ2的距离,利用空间度量距离函数fd()求取,在距离归一化的前提下,进行加权计算的表达式为:
Figure BDA0003778832770000041
其中,e是自然常数,ws为支持集数据特征的权重,根据支持集中样本的个数预先设定,w'g表示K个样本中第g个样本的权重,d'g表示K个样本中第g个样本与支持集数据特征的距离;
原型特征的表达是为:
Figure BDA0003778832770000042
其中,nK表示相似样本数量与支持集数据特征的数量之和,μ'表示原型特征;
原型特征对应的协方差矩阵C'为:
Figure BDA0003778832770000043
其中,Cg表示K个样本中第g个相似样本数据特征的协方差矩阵,α为一个超参数。
优选地,在步骤S5中,生成的伪样本集合为Dy,表达式为:
Figure BDA0003778832770000044
其中,y表示新生成的类别,
Figure BDA0003778832770000045
表示新生成的伪样本,服从高斯分布。
优选地,在步骤S6中,选用分类器,将生成的伪样本集合和支持集数据特征共同作为训练数据,训练分类器,然后将查询集数据特征作为测试数据,测试训练好的分类器,完成进行图像分类。
优选地,分类器为线性回归分类或支持向量机。
本申请提出一种图像分类中基于原型补全的小样本扩充***,所述***包括:
原样本图像采集划分单元,用于采集原样本图像数据集,根据原样本图像数据集中的图像数据类别将原样本图像数据集划分为基类数据集、支持集和查询集;
特征提取单元,用于选择特征提取器,并利用基类数据集训练该特征提取器,利用训练好的特征提取器分别提取基类数据集数据特征、支持集数据特征和查询集数据特征;
相似样本确定单元,基于空间度量距离函数,计算支持集数据特征与全部基类数据集数据特征的距离,根据距离确定与支持集数据特征最相似的K个样本;
原型特征确定单元,用于将K个样本与支持集数据特征的相似度进行加权计算,得到支持集的原型特征;
伪样本集合生成单元,基于支持集的原型特征,生成伪样本集合;
图像分类单元,将生成的伪样本集合和支持集数据特征共同作为训练数据,将查询集数据特征作为测试数据,进行图像分类。
与现有技术相比,本发明技术方案的有益效果是:
本发明提出一种图像分类中基于原型补全的小样本扩充方法及***,首先采集原样本图像数据集,将原样本图像数据集划分为基类数据集、支持集和查询集,基于特征提取器分别提取三类数据集的特征,将样本由空间映射至特征空间,在特征空间中基于样本特征的相似程度进行原型特征的补全,得到原型特征,整体上仅需一个基类数据集的特征库和特征提取器即可对少量样本进行原型补全以及伪样本集合的生成,极大程度上弥补了小样本图像分类的缺点,避免引入额外网络参数的同时,节省后续图像分类的时间,普适性佳。
附图说明
图1表示本发明实施例1中提出的图像分类中基于原型补全的小样本扩充方法的流程示意图;
图2表示本发明实施例1中提出的图像分类中基于原型补全的小样本扩充的执行过程框图。
图3表示本发明实施例2中提出的TSNE可视化图;
图4表示本发明实施例3中提出的图像分类中基于原型补全的小样本扩充***的结构图。
具体实施方式
附图仅用于示例性说明,不能理解为对本专利的限制;
为了更好地说明本实施例,附图某些部位会有省略、放大或缩小,并不代表实际尺寸;
对于本领域技术人员来说,附图中某些公知内容说明可能省略是可以理解的。
下面结合附图和实施例对本发明的技术方案做进一步的说明。
附图中描述位置关系的仅用于示例性说明,不能理解为对本专利的限制;
实施例1
如图1所示,本实施例提出一种图像分类中基于原型补全的小样本扩充方法,该方法包括以下步骤:
S1.采集原样本图像数据集,根据原样本图像数据集中的图像数据类别将原样本图像数据集划分为基类数据集、支持集和查询集;
在步骤S1中,这时的原样本图像数据集即小样本图像数据集,是待扩充的,所述“根据原样本图像数据集中的图像数据类别”即是指在采集的原样本图像数据集中有一定类别数的图像数据,如原样本图像数据集为手机图像,集合里含有不同品牌的手机图像,每种品牌分别作为一种类别,设原样本图像数据集中的图像数据类别共Z类,基类数据集属于X类,支持集与查询集属于Y类,满足:
X+Y=Z,
Figure BDA0003778832770000061
在此,在原样本图像数据集中的所有类别Z中,基类数据集所属的类别与后两者所述的类别不属于同一类,支持集与查询集属于同一类。
S2.选择特征提取器,并利用基类数据集训练该特征提取器,利用训练好的特征提取器分别提取基类数据集数据特征、支持集数据特征和查询集数据特征;
在步骤S2中,特征提取器选取为Wide ResNet网络,在采用基类数据集训练WideResNet网络的过程中,设置Wide ResNet网络的损失函数,采用反向传播的方式,更新WideResNet网络的权值参数,直至损失函数收敛,训练完成后固定网络参数,训练好的特征提取器提取设定目标任务的数据特征。
在此,考虑到实际应用上的普适性问题,采用的是预训练好的特征提取器进行特征提取。
S3.基于空间度量距离函数,计算支持集数据特征与全部基类数据集数据特征的距离,根据距离确定与支持集数据特征最相似的K个样本;
以基类数据集第i类数据特征的均值作为该类数据特征的统称,则满足:
Figure BDA0003778832770000062
其中,μ1i表示基类数据集第i类数据特征的均值,xj表示基类数据集第i类数据特征中第j个数据特征;ni表示基类数据集第i类数据特征的数量;
此外,对应的协方差矩阵表示为:
Figure BDA0003778832770000063
设支持数据集数据特征的均值为μ2,以μ2作为支持数据集数据特征的统称,设空间度量距离函数统称为fd(),则基于空间度量距离函数,计算支持集数据特征与全部基类数据集数据特征的距离时,满足:
di=fdi,xs)
其中,di表示支持集数据特征与基类数据集第i类数据特征的距离;最终,得到距离集合D,表示为:
D={d1,d2,...,di,...,dq}
其中,q表示基类数据集数据特征的种类数,将距离集合D中所有距离元素的值按从小到大的顺序排列,根据排列顺序,选出前K个距离元素分别对应的基类数据集数据特征,作为支持集数据特征最相似的K个样本。
在此,空间度量距离函数可以选用不同的、具体的度量函数,考虑到此实施过程是建立与对不同的空间度量距离函数均适用的前提下,在获取支持集数据特征与全部基类数据集数据特征的距离后,将距离归一化,本实施方式适用于不同的空间度量函数,以L1相似度为例的函数,相似度越高,函数数值越大,则采用此式,表达式为:
Figure BDA0003778832770000071
而以JS散度为例的函数,相似度越高函数值越低,则可以使用:
Figure BDA0003778832770000072
其中,d'i表示距离归一化后的值,
Figure BDA0003778832770000073
表示距离中的最大值,
Figure BDA0003778832770000074
表示距离中的最小值。
S4.将K个样本与支持集数据特征的相似度进行加权计算,得到支持集的原型特征;
利用softmax函数使得距离的和为1,在步骤S4中,K个样本与支持集数据特征的相似度即K个样本与支持集数据特征均值μ2的距离,利用空间度量距离函数fd()求取,在距离归一化的前提下,进行加权计算的表达式为:
Figure BDA0003778832770000075
其中,e是自然常数,ws为支持集数据特征的权重,一般设定支持集数据样本仅有一个或有五个,在只有一个支持集样本的情况下ws设为1.5,5个支持集样本就设为2.5,根据支持集中样本的个数预先设定,w'g表示K个样本中第g个样本的权重,d'g表示K个样本中第g个样本与支持集数据特征的距离;
原型特征的表达是为:
Figure BDA0003778832770000081
其中,nK表示相似样本数量与支持集数据特征的数量之和,μ'表示原型特征;
原型特征对应的协方差矩阵C'为:
Figure BDA0003778832770000082
其中,Cg表示K个样本中第g个相似样本数据特征的协方差矩阵,α为一个超参数。
S5.基于支持集的原型特征,生成伪样本集合;
在步骤S5中,生成的伪样本集合为Dy,表达式为:
Figure BDA0003778832770000083
其中,y表示新生成的类别,
Figure BDA0003778832770000084
表示新生成的伪样本,服从高斯分布。
S6.将生成的伪样本集合和支持集数据特征共同作为训练数据,将查询集数据特征作为测试数据,进行图像分类。
在本步骤中,选用分类器,分类器可以为线性回归分类或支持向量机,实际实施时,选一种即可以,将生成的伪样本集合和支持集数据特征共同作为训练数据,训练分类器,然后将查询集数据特征作为测试数据,测试训练好的分类器,完成进行图像分类。
整体上,在本实施例中,参见图2,首先采集原样本图像数据集,将原样本图像数据集划分为基类数据集、支持集和查询集,对应图2中的基类图像、支持集图像及查询集图像,探后基于特征提取器分别提取三类数据集的特征,将样本由空间映射至特征空间,在特征空间中基于样本特征的相似程度进行原型特征的补全,得到原型特征,整体上仅需一个基类数据集的特征库和特征提取器即可对少量样本进行原型补全以及伪样本集合的生成,极大程度上弥补了小样本图像分类的缺点,而且没有引入额外的需要训练的参数,节省后续图像分类的时间以及设备需求而且与“黑盒”神经网络模型相比,具有极强的可解释性。
实施例2
本实施例通过具体实验验证本申请所提方法的有效性,实验中使用的miniImagenet和CUB数据集是小样本数据集,miniImagenet数据集包含100个类,包括600个大小为84×84像素的图像。它被分为64个基类、16个验证类和20个新类。CUB数据集是一个包含200种鸟类的鸟类图像数据集,共有11,788张图像,大小为84×84像素。它被分为100个基类、50个验证类和50个新类。
涉及到的对比算法类型有:基于优化的方法、基于度量的方法、基于生成的方法。对比结果如表1所示。
表1
Figure BDA0003778832770000091
Figure BDA0003778832770000101
从表1的结果可以发现,本申请所提出方法的分类性能优于其他对比方法。通过以上仿真实验可以验证本发明的有效性,图3为利用本申请所提出的方法生成的伪样本集合的降维可视化图,由图3可知,生成的伪样本簇都是围绕着支持集的样本高斯分布的,而且类与类之间具有明显的判别边界。
实施例3
如图4所示,本实施例提出一种图像分类中基于原型补全的小样本扩充***,所述***包括:
原样本图像采集划分单元,用于采集原样本图像数据集,根据原样本图像数据集中的图像数据类别将原样本图像数据集划分为基类数据集、支持集和查询集;
特征提取单元,用于选择特征提取器,并利用基类数据集训练该特征提取器,利用训练好的特征提取器分别提取基类数据集数据特征、支持集数据特征和查询集数据特征;
相似样本确定单元,基于空间度量距离函数,计算支持集数据特征与全部基类数据集数据特征的距离,根据距离确定与支持集数据特征最相似的K个样本;
原型特征确定单元,用于将K个样本与支持集数据特征的相似度进行加权计算,得到支持集的原型特征;
伪样本集合生成单元,基于支持集的原型特征,生成伪样本集合;
图像分类单元,将生成的伪样本集合和支持集数据特征共同作为训练数据,将查询集数据特征作为测试数据,进行图像分类。
显然,本发明的上述实施例仅是为清楚地说明本发明所作的举例,而并非是对本发明的实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明权利要求的保护范围之内。

Claims (10)

1.一种图像分类中基于原型补全的小样本扩充方法,其特征在于,所述方法包括以下步骤:
S1.采集原样本图像数据集,根据原样本图像数据集中的图像数据类别将原样本图像数据集划分为基类数据集、支持集和查询集;
S2.选择特征提取器,并利用基类数据集训练该特征提取器,利用训练好的特征提取器分别提取基类数据集数据特征、支持集数据特征和查询集数据特征;
S3.基于空间度量距离函数,计算支持集数据特征与全部基类数据集数据特征的距离,根据距离确定与支持集数据特征最相似的K个样本;
S4.将K个样本与支持集数据特征的相似度进行加权计算,得到支持集的原型特征;
S5.基于支持集的原型特征,生成伪样本集合;
S6.将生成的伪样本集合和支持集数据特征共同作为训练数据,将查询集数据特征作为测试数据,进行图像分类。
2.根据权利要求1所述的图像分类中基于原型补全的小样本扩充方法,其特征在于,在步骤S1中,设原样本图像数据集中的图像数据类别共Z类,基类数据集属于X类,支持集与查询集属于Y类,满足:
Figure FDA0003778832760000011
3.根据权利要求1所述的图像分类中基于原型补全的小样本扩充方法,其特征在于,在步骤S2中,特征提取器选取为Wide ResNet网络,在采用基类数据集训练Wide ResNet网络的过程中,设置Wide ResNet网络的损失函数,采用反向传播的方式,更新Wide ResNet网络的权值参数,直至损失函数收敛,训练完成后固定网络参数,训练好的特征提取器提取设定目标任务的数据特征。
4.根据权利要求3所述的图像分类中基于原型补全的小样本扩充方法,其特征在于,以基类数据集第i类数据特征的均值作为该类数据特征的统称,则满足:
Figure FDA0003778832760000012
其中,μ1i表示基类数据集第i类数据特征的均值,xj表示基类数据集第i类数据特征中第j个数据特征;ni表示基类数据集第i类数据特征的数量;
设支持数据集数据特征的均值为μ2,以μ2作为支持数据集数据特征的统称,设空间度量距离函数统称为fd(),则基于空间度量距离函数,计算支持集数据特征与全部基类数据集数据特征的距离时,满足:
di=fdi,xs)
其中,di表示支持集数据特征与基类数据集第i类数据特征的距离;最终,得到距离集合D,表示为:
D={d1,d2,...,di,...,dq}
其中,q表示基类数据集数据特征的种类数,将距离集合D中所有距离元素的值按从小到大的顺序排列,根据排列顺序,选出前K个距离元素分别对应的基类数据集数据特征,作为支持集数据特征最相似的K个样本。
5.根据权利要求4所述的图像分类中基于原型补全的小样本扩充方法,其特征在于,在获取支持集数据特征与全部基类数据集数据特征的距离后,将距离归一化,表达式为:
Figure FDA0003778832760000021
Figure FDA0003778832760000022
其中,di'表示距离归一化后的值,
Figure FDA0003778832760000023
表示距离中的最大值,
Figure FDA0003778832760000024
表示距离中的最小值。
6.根据权利要求5所述的图像分类中基于原型补全的小样本扩充方法,其特征在于,在步骤S4中,K个样本与支持集数据特征的相似度即K个样本与支持集数据特征均值μ2的距离,利用空间度量距离函数fd()求取,在距离归一化的前提下,进行加权计算的表达式为:
Figure FDA0003778832760000025
其中,e是自然常数,ws为支持集数据特征的权重,根据支持集中样本的个数预先设定,w'g表示K个样本中第g个样本的权重,d'g表示K个样本中第g个样本与支持集数据特征的距离;
原型特征的表达是为:
Figure FDA0003778832760000031
其中,nK表示相似样本数量与支持集数据特征的数量之和,μ'表示原型特征;
原型特征对应的协方差矩阵C'为:
Figure FDA0003778832760000032
其中,Cg表示K个样本中第g个相似样本数据特征的协方差矩阵,α为一个超参数。
7.根据权利要求6所述的图像分类中基于原型补全的小样本扩充方法,其特征在于,在步骤S5中,生成的伪样本集合为Dy,表达式为:
Figure FDA0003778832760000033
其中,y表示新生成的类别,
Figure FDA0003778832760000034
表示新生成的伪样本,服从高斯分布。
8.根据权利要求7所述的图像分类中基于原型补全的小样本扩充方法,其特征在于,在步骤S6中,选用分类器,将生成的伪样本集合和支持集数据特征共同作为训练数据,训练分类器,然后将查询集数据特征作为测试数据,测试训练好的分类器,完成进行图像分类。
9.根据权利要求8所述的图像分类中基于原型补全的小样本扩充方法,其特征在于,分类器为线性回归分类或支持向量机。
10.一种图像分类中基于原型补全的小样本扩充***,其特征在于,所述***包括:
原样本图像采集划分单元,用于采集原样本图像数据集,根据原样本图像数据集中的图像数据类别将原样本图像数据集划分为基类数据集、支持集和查询集;
特征提取单元,用于选择特征提取器,并利用基类数据集训练该特征提取器,利用训练好的特征提取器分别提取基类数据集数据特征、支持集数据特征和查询集数据特征;
相似样本确定单元,基于空间度量距离函数,计算支持集数据特征与全部基类数据集数据特征的距离,根据距离确定与支持集数据特征最相似的K个样本;
原型特征确定单元,用于将K个样本与支持集数据特征的相似度进行加权计算,得到支持集的原型特征;
伪样本集合生成单元,基于支持集的原型特征,生成伪样本集合;
图像分类单元,将生成的伪样本集合和支持集数据特征共同作为训练数据,将查询集数据特征作为测试数据,进行图像分类。
CN202210923952.5A 2022-08-02 2022-08-02 图像分类中基于原型补全的小样本扩充方法及*** Pending CN115393666A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210923952.5A CN115393666A (zh) 2022-08-02 2022-08-02 图像分类中基于原型补全的小样本扩充方法及***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210923952.5A CN115393666A (zh) 2022-08-02 2022-08-02 图像分类中基于原型补全的小样本扩充方法及***

Publications (1)

Publication Number Publication Date
CN115393666A true CN115393666A (zh) 2022-11-25

Family

ID=84118165

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210923952.5A Pending CN115393666A (zh) 2022-08-02 2022-08-02 图像分类中基于原型补全的小样本扩充方法及***

Country Status (1)

Country Link
CN (1) CN115393666A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116168257A (zh) * 2023-04-23 2023-05-26 安徽大学 基于样本生成的小样本图像分类方法、设备及存储介质
CN117078853A (zh) * 2023-08-18 2023-11-17 广东工业大学 一种基于数字孪生体的工件缺陷样本扩增方法及存储介质

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116168257A (zh) * 2023-04-23 2023-05-26 安徽大学 基于样本生成的小样本图像分类方法、设备及存储介质
CN117078853A (zh) * 2023-08-18 2023-11-17 广东工业大学 一种基于数字孪生体的工件缺陷样本扩增方法及存储介质
CN117078853B (zh) * 2023-08-18 2024-03-19 广东工业大学 一种基于数字孪生体的工件缺陷样本扩增方法及存储介质

Similar Documents

Publication Publication Date Title
Gosselin et al. Revisiting the fisher vector for fine-grained classification
CN112396027A (zh) 基于图卷积神经网络的车辆重识别方法
CN108288051B (zh) 行人再识别模型训练方法及装置、电子设备和存储介质
CN103425996B (zh) 一种并行分布式的大规模图像识别方法
Kadam et al. Detection and localization of multiple image splicing using MobileNet V1
CN111652317B (zh) 基于贝叶斯深度学习的超参数图像分割方法
CN115393666A (zh) 图像分类中基于原型补全的小样本扩充方法及***
CN114998220B (zh) 一种基于改进的Tiny-YOLO v4自然环境下舌像检测定位方法
CN110751027B (zh) 一种基于深度多示例学习的行人重识别方法
CN112949740B (zh) 一种基于多级度量的小样本图像分类方法
CN115115825B (zh) 图像中的对象检测方法、装置、计算机设备和存储介质
CN110502989A (zh) 一种小样本高光谱人脸识别方法及***
CN112528058A (zh) 基于图像属性主动学习的细粒度图像分类方法
CN109670423A (zh) 一种基于深度学习的图像识别***、方法及介质
CN115203408A (zh) 一种多模态试验数据智能标注方法
CN114782752A (zh) 基于自训练的小样本图像集成分类方法及装置
CN108960013B (zh) 一种行人再识别方法及装置
CN105844299B (zh) 一种基于词袋模型的图像分类方法
CN116935138A (zh) 图片主题内容多样性计算与自动选择方法及***
Dong et al. Scene-oriented hierarchical classification of blurry and noisy images
CN108830302B (zh) 一种图像分类方法、训练方法、分类预测方法及相关装置
CN111652265A (zh) 一种基于自调整图的鲁棒半监督稀疏特征选择方法
WO2010134539A1 (ja) 特徴量生成装置、特徴量生成方法および特徴量生成プログラム、ならびにクラス判別装置、クラス判別方法およびクラス判別プログラム
CN113780335B (zh) 一种小样本商品图像分类方法、装置、设备及存储介质
CN111598144B (zh) 图像识别模型的训练方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination