CN110717554B - 图像识别方法、电子设备及存储介质 - Google Patents

图像识别方法、电子设备及存储介质 Download PDF

Info

Publication number
CN110717554B
CN110717554B CN201911233317.9A CN201911233317A CN110717554B CN 110717554 B CN110717554 B CN 110717554B CN 201911233317 A CN201911233317 A CN 201911233317A CN 110717554 B CN110717554 B CN 110717554B
Authority
CN
China
Prior art keywords
query
image
classification result
query image
classification
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201911233317.9A
Other languages
English (en)
Other versions
CN110717554A (zh
Inventor
赖锦祥
胡永涛
戴景文
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong Virtual Reality Technology Co Ltd
Original Assignee
Guangdong Virtual Reality Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong Virtual Reality Technology Co Ltd filed Critical Guangdong Virtual Reality Technology Co Ltd
Priority to CN201911233317.9A priority Critical patent/CN110717554B/zh
Publication of CN110717554A publication Critical patent/CN110717554A/zh
Application granted granted Critical
Publication of CN110717554B publication Critical patent/CN110717554B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • G06F18/254Fusion techniques of classification results, e.g. of results related to same input data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/20Ensemble learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Medical Informatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请公开了图像识别方法、电子设备及存储介质。该图像识别方法包括:从待识别图像集中抽取第一查询集和第一支持集,第一支持集包括第一数量个类别的带有类别标签的第一支持图像,第一查询集包括一张或多张未标记类别的第一查询图像;将第一查询集和第一支持集输入预先训练的小样本网络模型,得到每张第一查询图像的综合分类结果。通过上述方式,能够对图像进行分类。

Description

图像识别方法、电子设备及存储介质
技术领域
本申请涉及机器学习算法领域,特别是涉及一种图像识别方法、电子设备及存储介质。
背景技术
如今深度学习被运用得越来越广泛。但由于深度学习依赖于大量的数据才能实现,因此前期收集数据量的工作量很大,有时现有数据的数量无法满足深度学习的要求;另一方面,人类只需要根据观察到的少数样本就可以认识新物体,例如,儿童可以在看到一张或几张图片之后辨别出苹果。因此人类辨别的能力远远超出机器深度学习辨别物体的能力。而小样本学习可以在每个类别只有1个或几个样本的情况下,就能学习到一个很好的分类模型,因此小样本模型更加贴近人们的需求。
发明内容
本申请实施例提供了一种基于小样本学习的图像识别方法、电子设备与计算机可读取存储介质,能够对图像进行分类。
本申请第一方面提供了一种基于小样本学习的图像识别方法,该方法包括:从待识别图像集中抽取第一查询集和第一支持集,第一支持集包括第一数量个类别的带有类别标签的第一支持图像,第一查询集包括一张或多张未标记类别的第一查询图像;
将第一查询集和第一支持集输入预先训练的小样本网络模型,得到每张第一查询图像的综合分类结果,其中,小样本网络模型包括集成层和第一元学习器、第二元学习器、第三元学习器,第一元学习器用于基于第一查询图像与第一支持图像之间的相似度获取第一查询图像的第一分类结果,第二元学习器用于基于第一查询图像与第一支持图像之间的第一距离获取第一查询图像的第二分类结果,第三元学习器用于对第一查询集包含的第一查询图像进行分类以获取第一查询图像的第三分类结果,集成层用于集成同一张第一查询图像的第一分类结果、第二分类结果、第三分类结果而得到每张第一查询图像的综合分类结果。
本申请第二方面提供了一种电子设备,该电子设备包括处理器、与处理器耦接的存储器,其中,存储器存储有计算机程序,处理器用于执行存储器存储的计算机程序以执行第一方面提供的方法。
本申请第三方面提供了一种计算机可读取存储介质,该计算机可读取存储介质中存储有程序代码,程序代码可被处理器调用执行第一方面提供的方法。
本申请实施例提供的基于小样本学习的图像识别方法,能够将从待识别图像集中抽取第一查询集和第一支持集输入小样本网络模型,小样本网络模型中的第一元学习器、第二元学习器、第三元学习器可分别得到第一查询图像的第一分类结果、第二分类结果、第三分类结果。其中,三个元学习器的分类标准不同,第一元学习器的分类标准为第一查询图像与第一支持集之间的相似度,第二元学习器的分类标准为第一查询图像与第一支持集之间的相似度之间的第一距离,第三元学习器为普通的样本分类器,可对第一查询图像直接分类。然后由小样本网络模型中的集成层整合三个分类结果作为综合分类结果,从而能够提高小样本网络对图像分类的准确性。
附图说明
图1是本申请第一实施例提供的基于小样本学习的图像识别方法的流程示意图;
图2是本申请第二实施例提供的小样本学习的网络模型架构图;
图3是本申请第三实施例提供的基于小样本学习的图像识别方法的流程示意图;
图4是本申请第四实施例提供的基于小样本学习的网络模型训练方法的流程示意图;
图5是本申请第五实施例提供的验证小样本网络模型的流程示意图;
图6是本申请第六实施例提供的电子设备的结构示意图。
具体实施方式
下面结合附图和实施例对本申请进行详细说明。
请参阅图1,图1是本申请第一实施例提供的基于小样本学习的图像识别方法的流程示意图。如图1所示,本实施例基于小样本学习的图像识别方法包括:
S110:从待识别图像集中抽取第一查询集和第一支持集。
其中,第一支持集包括第一数量个类别的带有类别标签的第一支持图像,第一查询集包括一张或多张未标记类别的第一查询图像。
待识别图像集中的具体类别不一定已知,即待识别图像集包括少量已知类别的图像,和其余未标记类别的未识别图像,可抽取带有类别标签的图像作为第一支持集,并将未标记类别的图像作为第一查询集。
在一个实施例中,从待识别图像集中的P个类别中选择S个类别,其中,S和P可为正整数,且S≤P。然后在选取的每个类别中选择Y个带有类别标签的样本组成第一支持集,即第一支持集中包含S×Y张第一支持图像,可从未标记类别的图像中选取一张或多张图像作为第一查询图像,组成第一查询集。
S120:将第一查询集和第一支持集输入预先训练的小样本网络模型,得到每张第一查询图像的综合分类结果。
其中,小样本网络模型包括集成层和第一元学习器、第二元学习器、第三元学习器,第一元学习器用于基于第一查询图像与第一支持图像之间的相似度获取第一查询图像的第一分类结果,第二元学习器用于基于第一查询图像与第一支持图像之间的第一距离获取第一查询图像的第二分类结果,第三元学习器用于对第一查询集包含的第一查询图像进行分类以获取第一查询图像的第三分类结果,集成层用于集成同一张第一查询图像的第一分类结果、第二分类结果、第三分类结果而得到每张第一查询图像的综合分类结果。
在一个实施例中,第一元学习器可以是Relation-Networks。Relation-Networks可以使用可训练的卷积层计算第一查询集中的第一查询图像与第一支持集中图像类别特征之间的相似度。比如,第一支持集聚类得到以A为聚类中心的类别a、以B为聚类中心的类别b,对于第一查询集中的一张第一查询图像,则将该张第一查询图像作为第一查询集的一部分输入小样本网络模型后,经卷积神经网络提取该张第一查询图像的特征,然后Relation-Networks可根据该张第一查询图像的特征分别计算该张第一查询图像的特征与第一支持集中的聚类中心A、聚类中心B之间的相似度,若该张第一查询图像的特征与第一支持集中的聚类中心A之间的相似度较高,则该张第一查询图像属于图像类别a;反之,该张第一查询图像属于图像类别b。
可以理解的是,将集合中的多个物理或抽象对象分成由类似的对象组成的多个类的过程被称为聚类。在本实施例中,将第一查询集和/或第一支持集中的图像聚为多个类,聚类中心即为各类别中的图像特征求得的均值。
可选地,第一元学习器包括关系模块,关系模块用于计算卷积神经网络提取得到的第一查询图像的特征与第一支持集的聚类中心之间的相似度。根据Relation-Networks计算每张第一查询图像的特征与每个聚类中心的相似度,分别将每张第一查询图像归属到与该第一查询图像相似度最大的类别里,从而得到第一分类结果。
第二元学习器可以是Proto-Networks。Proto-Networks可使用可训练的卷积层来计算第一查询集中的第一查询图像与第一支持集中图像类别之间的距离。该距离可以是欧式距离,也可以是余弦距离。比如,第一支持集聚类得到以A为聚类中心的类别a、以B为聚类中心的类别b,对于第一查询集中的一张第一查询图像,则将该第一查询图像作为第一查询集的一部分输入小样本网络模型后,经卷积神经网络提取该第一查询图像的特征,然后Proto-Networks可根据该第一查询图像的特征分别计算该张第一查询图像与第一支持集中的聚类中心A、聚类中心B之间的欧式距离,若该张第一查询图像的特征与第一支持集中的聚类中心A之间的欧式距离较小,则该张第一查询图像属于图像类别a;反之,该张第一查询图像属于图像类别b。
可选地,第二元学习器可以用于基于第一查询图像与第一支持集的聚类中心之间的第一距离获取第一查询图像的第二分类结果。具体而言,根据ProtoNetworks计算每张第一查询图像的特征与每个聚类中心之间的距离,该距离可以是欧式距离,也可以是余弦距离。分别将每张第一查询图像归属到与该第一查询图像距离最小的类别里,从而得到第二分类结果。
第三元学习器可以为Classifier-Networks。Classifier-Networks可直接根据卷积网络提取的图像特征对图像进行分类预测。与前两个元学习器不同,第三元学习器的输入不包括第一支持集的聚类中心。
第三元学***面内某一位置及其相邻位置的特征值进行统计,并将汇总后的结果作为这一位置在该像素平面的值。在本实施例中,经池化层对图像特征矩阵进行池化,可降低卷积层输出的图像特征向量的维度。池化层的过滤器大小可以为1*1、2*2、5*5等。当池化层的过滤器大小可以为1*1时,图像特征矩阵实际上没有被池化。
距离计算模块用于计算池化后的第一查询图像的特征与自由向量之间的第二距离。自由向量为一个可调的向量,该自由向量的初始值可以是被随机赋予的值,也可以是人为指定的值,其在训练过程中可被不断调整。具体而言,根据Classifier-Networks计算池化后的图像的特征与自由向量之间的距离,该距离可以是欧式距离,也可以是余弦距离。
在第三元学习器中,计算得到的距离会被归一化处理,以得到每张第一查询图像与各类别之间的的距离权重,分别将每张第一查询图像归属到最小距离的权重值对应的的类别里,从而得到第三分类结果。
可选地,第一距离与第二距离的计算方式相同。即,当第一距离为欧式距离时,第二距离也为欧式距离;当第一距离为余弦距离时,第二距离也为余弦距离。
集成层可以用于集成第一分类结果、第二分类结果、第三分类结果而得到第一查询图像的综合分类结果。
在一个实施例中,根据第一分类结果、第二分类结果、第三分类结果得到综合分类结果的计算方式如下:
将第一查询图像的第一分类结果和第二分类结果映射到固定的数值区间,分别对第一查询图像的第三分类结果、映射后的第一分类结果及映射后的第二分类结果进行归一化处理;计算归一化处理后的第一分类结果、第二分类结果及第三分类结果的和,得到第一查询图像在第一数量个类别中各个类别的概率,并将概率最大的类别作为第一查询图像的综合分类结果。上述计算方式也可以表示为:
Figure DEST_PATH_IMAGE001
其中
Figure 938903DEST_PATH_IMAGE002
为第一查询图像的综合分类结果,
Figure 234755DEST_PATH_IMAGE003
为第一查询图像的第一分类结果,
Figure 376892DEST_PATH_IMAGE004
为第一查询图像的第二分类结果,
Figure 229442DEST_PATH_IMAGE005
为第一查询图像的第三分类结果。通过上述公式,可得到第一查询图像的综合分类结果。
可以理解的是,各元学习器的最终分类结果为向量,sigmoid函数为回归函数,可将元学习器得到的分类结果向量映射到固定的数值空间,从而保证输出数值是有限的。其中,数值空间可以为(0,1)。softmax为归一化指数函数,可将元学习器的分类结果向量作归一化处理,即将结果向量中的各元素映射为概率。
由于第一分类结果
Figure 829050DEST_PATH_IMAGE003
和第二分类结果
Figure 826962DEST_PATH_IMAGE004
均为特征间的相似性度量结果,所以第一分类结果
Figure 613653DEST_PATH_IMAGE003
和第二分类结果
Figure 962902DEST_PATH_IMAGE004
中可能存在较大数值(大于1的数值),因此需要用sigmoid函数将第一分类结果
Figure 744913DEST_PATH_IMAGE003
和第二分类结果
Figure 618453DEST_PATH_IMAGE004
映射到0~1之间,再用softmax函数将映射到0~1之间的结果向量作归一化处理,使最终输出的第一分类结果
Figure 158019DEST_PATH_IMAGE003
和第二分类结果
Figure 804901DEST_PATH_IMAGE004
为分类概率结果。而第三分类结果
Figure 910260DEST_PATH_IMAGE005
为分类概率结果,其数值小于1),因此可直接用于最终分类结果的计算。
如图2所示,在本申请提供的第二实施例中,小样本网络模型包括卷积层、聚类层、第一元学习器、第二元学习器、第三元学习器和集成层。
其中,小样本网络模型的输入为第一支持集Strain(N×J)与第一查询集Qtrain(N×K),二者送入卷积层,使用卷积神经网络提取输入的第一支持图像以及第一查询图像的特征。聚类层用于对卷积层提取到的所有第一支持图像的特征进行聚类,得到N个聚类中心,每个聚类中心可分别对应一个类别。然后通过第一元学习器、第二元学习器、第三元学习器分别计算得到第一分类结果、第二分类结果、第三分类结果,最后集成层集成第一分类结果、第二分类结果、第三分类结果而得到的第一查询图像的综合分类结果。
通过上述方式,能够将从待识别图像集中抽取第一查询集和第一支持集输入小样本网络模型,小样本网络模型中的第一元学习器、第二元学习器、第三元学习器可分别得到第一查询图像的第一分类结果、第二分类结果、第三分类结果。其中,三个元学习器的分类标准不同,第一元学习器的分类标准为第一查询集与第一支持集之间的相似度,第二元学习器的分类标准为第一查询集与第一支持集之间的相似度之间的第一距离,第三元学习器为样本分类器,可对第一查询图像直接分类。然后由小样本网络模型中的集成层整合三个分类结果作为综合分类结果。从而能够提高对第一查询集中的第一查询图像分类的准确性。
请参阅图3,图3是本申请第三实施例提供的基于小样本学习的图像识别方法的流程示意图。
S310:利用第一支持集的第一支持图像对预先训练的第三元学习器进行微调。
第一支持集中的图像类别大于1。可选地,第一支持集的第一支持图像为带有类别标签的图像,利用这些带有类别标签的图像对预先训练好的第三元学习器重新训练,微调小样本网络模型中第三元学习器的参数(自由变量),优化小样本网络模型以提高后续待识别图像集中的未知类别图像的分类结果的准确性。对第三元学习器进行微调之前可以提高池化层过滤器的大小。比如,可以将池化层过滤器的大小提高为3*3。
S320:从待识别图像集中抽取第一查询集和第一支持集。
S330:将第一查询集和第一支持集输入预先训练的小样本网络模型,得到每张第一查询图像的综合分类结果。
本实施例S320、S330详细描述请对应参照第一实施例中的S110、S120,此处不再重复。
通过上述方式,在图像识别过程进行之前,利用第一支持集的第一支持图像(带有类别标签的图像)对小样本网络模型中的第三元学习器所用参数(自由变量)作微调,再运用微调后的小样本网络模型对第一查询集中的图像进行识别,进一步提高了分类结果的准确性。
请参阅图4,图4是本申请第四实施例提供的基于小样本学习的网络模型训练方法的流程示意图。如图4所示,本申请基于小样本学习的网络模型训练方法包括:
S410:从训练图像集中抽取第二查询集和第二支持集。
其中,训练图像集包括第二数量个类别的带有类别标签的图像,训练图像集的图像的类别区别于待识别图像集的图像的类别,第二支持集包括第三数量个类别的带有类别标签的第二支持图像,第二查询集包括第三数量个类别的带有类别标签的第二查询图像,第三数量小于或等于第二数量。
训练图像集中的图像分为第二数量个类别,并且每个类别均有指定数量的图像。不同类别的图像的数量可以相同,也可以不同。第二查询集和第二支持集中均包括第三数量个类别的图像,并且第二查询集和第二支持集中的图像类别相同。而第二查询集和第二支持集的类别数量小于或等于训练图像集中的类别数量,即第三数量小于或等于第二数量。
举例说明,从训练图像集Xtrain的M(即第二数量)个类别中选择N(第三数量)个类别,N≤M。然后在选取的每个类别中选择K个样本组成第二查询集Qtrain,即第二查询集Qtrain中包含N×K张第二图像;并且在上述选取的每个类别中选择J个样本组成第二支持集Strain,第二支持集Strain中包含N×J张图像。J和K可以相等,也可以不相等。在其他实施例中,第二查询集中的图像类别属于第二支持集中的图像类别,而第二查询集和第二支持集中的不同类别的图像的数量可以相同,也可以不同。
S420:将第二查询集和第二支持集输入小样本网络模型。
S430:对第二支持集中包含的第二支持图像进行聚类,得到第三数量个聚类中心。
先通过小样本网络的卷积层提取输入的第二支持图像以及第二查询图像的特征。聚类层用于对卷积层提取到的所有第二支持图像的特征进行聚类,得到第三数量个聚类中心作为第二支持集的聚类中心。
S440:通过小样本网络模型的第一元学习器确定当前输入的第二查询图像与第二支持集的各个聚类中心之间的相似度,并获取第二查询图像的第一分类结果,通过小样本网络模型的第二元学习器确定第二查询图像与各个聚类中心之间的第一距离,并获取第二查询图像的第二分类结果,通过小样本网络模型的第三元学习器对第二查询集包含的第二查询图像进行分类以获取第二查询图像的第三分类结果。
S440的详细说明请参见第一实施例,在此不作赘述。
S450:计算当前输入的第二查询图像带有的类别标签与第一分类结果、第二分类结果及第三分类结果之间的分类误差,得到综合误差。
可以理解的是,综合误差越小,代表训练出的小样本网络模型分类越准确。
根据当前输入的第二查询图像带有的类别标签与第一分类结果、第二分类结果及第三分类结果之间的分类误差,得到综合误差的过程如下:
将第二查询图像的第一分类结果映射到固定的数值区间,并计算所述第二查询图像的类别标签与映射后的第一分类结果之间的均方误差,得到第一分类误差;对第二查询图像的第二分类结果进行归一化处理,并计算第二查询图像的类别标签与归一化处理后的第二分类结果之间的交叉熵误差,得到第二分类误差;对第二查询图像的第三分类结果进行归一化处理,并计算第二查询图像的类别标签与归一化处理后的第三分类结果之间的交叉熵误差,得到第三分类误差;获取第一分类误差、第二分类误差及第三分类误差之和,得到综合误差。综合误差的计算公式可以为:
Figure 594182DEST_PATH_IMAGE006
其中,
Figure DEST_PATH_IMAGE007
为分类误差,代表小样本网络模型得到的分类结果与真实分类之间的误差。
Figure 201138DEST_PATH_IMAGE008
为第二查询图像的类别标签,即第二查询图像的真实分类,
Figure 651711DEST_PATH_IMAGE009
表示第一分类结果
Figure 424626DEST_PATH_IMAGE003
与真实分类
Figure 545028DEST_PATH_IMAGE008
之间的均方误差,
Figure 183820DEST_PATH_IMAGE010
为第二分类结果
Figure 625035DEST_PATH_IMAGE004
与真实分类
Figure 642669DEST_PATH_IMAGE008
之间的交叉熵误差,
Figure 589765DEST_PATH_IMAGE011
为第三分类结果
Figure 781100DEST_PATH_IMAGE005
与真实分类
Figure 183262DEST_PATH_IMAGE008
之间的交叉熵误差。
当然,三个分类结果与真实分类之间的分类误差计算方式也可以是相同的。比如,三个分类结果与真实分类之间的分类误差可以都为与真实分类之间的均方误差。
S460:利用计算出来的综合误差判断当前的小样本网络模型是否满足预设条件。若是,则执行步骤470;若否,则执行S480。
S470:完成本次对小样本网络模型的训练。
S480:按照综合误差调整小样本网络模型的参数,根据调整后的小样本网络模型获取下一输入的第二查询图像的第一分类结果、第二分类结果及第三分类结果,计算得到综合误差。
本步骤,用调整后的小样本网络模型对输入的第二查询图像进行再分类的方式来减小小样本网络模型的综合误差,使其满足预设条件,以优化小样本网络模型。
可选地,小样本网络中的参数可以包括卷积神经网络参数、聚类中心的计算参数、第一元学习器的参数、第三元学习器的自由向量中的至少一种。执行完本步骤之后跳转至S420以重复上述过程,直至完成本次训练或者循环次数达到预设条件。
停止训练的预设条件一般包括分类误差小于预设阈值。预设阈值可以根据实际经验或者多次试验等方式确定,在此不做限制。
除了综合误差之外,还可以计算小样本网络的样本内原型方差(ISPV)和样本原型间方差(IPV)。其中,样本内原型方差用于评估第二查询图像分类的类内距离,样本原型间方差用于评估第二查询图像分类的类间距离。
在本实施例中,类内距离为同一图像类别中的不同图像特征之间的均方距离,而类间距离为图像类别的图像特征之间的均方距离。通常认为类间距离越大、而类内距离越小,模型越优。其中,样本内原型方差(ISPV)和原型间方差(IPV)的计算公式分别为:
Figure 117720DEST_PATH_IMAGE012
Figure 970139DEST_PATH_IMAGE013
其中,
Figure 662151DEST_PATH_IMAGE014
表示类别,
Figure 8950DEST_PATH_IMAGE015
表示
Figure 797914DEST_PATH_IMAGE014
类别对应的聚类中心,
Figure 431021DEST_PATH_IMAGE016
表示
Figure 543DEST_PATH_IMAGE014
类别中的图像
Figure 806825DEST_PATH_IMAGE017
Figure 653558DEST_PATH_IMAGE018
表示
Figure 97046DEST_PATH_IMAGE014
类别中的图像
Figure 763651DEST_PATH_IMAGE017
Figure 701520DEST_PATH_IMAGE014
类别对应的聚类中心之间的距离,
Figure 465077DEST_PATH_IMAGE019
表示
Figure 439986DEST_PATH_IMAGE014
类别与
Figure 734832DEST_PATH_IMAGE017
类别之间的距离。
在训练小样本网络模型的过程中,可通过观察样本内原型方差和原型间方差的变化来观察小样本网络模型的优劣。具体地,停止训练的预设条件可以进一步包括样本内原型方差小于第一阈值和/或原型间方差大于第二阈值。
完成本次训练之后,可以跳转至步骤S410重新抽取第二查询集和第二支持集以循环执行。每次抽取的第二查询集和第二支持集的类别数量和每一类的图像数量可以相同,也可以不同。需要注意的是,小样本网络模型彻底完成训练的条件包括训练图像集Xtrain中的所有图像类别均被抽取-训练过,但并不限制必须一次完成抽取-训练。
需要说明的是,在训练过程中,第三学习器的池化层的过滤器大小可以为1*1,即不进行池化。本实施例中,经过训练的小样本网络模型可以对图像进行识别。
参阅图5,图5是本申请第五实施例提供的验证小样本网络模型的流程示意图。如图5所示,在完成小样本网络模型的训练之后,可以进一步对小样本网络模型进行验证,包括:
S510:从测试图像集中抽取第三查询集和第三支持集。
可选地,测试图像集包括第四数量个类别的带有类别标签的图像,测试图像集的图像的类别区别于训练图像集的图像的类别,第三支持集包括第五数量个类别的第三支持图像,第三查询集包括第五数量个类别的带有类别标签的第三查询图像,第五数量小于或等于第四数量。
S520:将第三查询集和第三支持集输入小样本网络模型。
利用第三查询集和第三支持集可以验证经上述实施例训练出的小样本网络模型。可以将第三查询集和第三支持集输入已利用训练图像集完成训练的小样本网络模型,得到第三查询集中的第三查询图像的综合分类结果,具体的获取过程可参考之前的描述,在此不再重复。然后将第三查询集中的第三查询图像的综合分类结果与类别标签进行比较以验证小样本网络模型的识别效果。
由于已利用训练图像集完成训练的小样本网络模型中第三元学习器的分类是对第二查询集独立完成的,其中的自由向量仅受第二查询集影响,在验证过程中,第二查询集变成了第三查询集,二者并不相同,因此需要根据实际输入的第三查询集调整第三元学习器的参数再进行验证。
在验证小样本网络模型的过程中,同样可通过观察样本内原型方差和原型间方差的变化来观察小样本网络模型的优劣。
S530:提高第三元学习器中池化层的过滤器的大小。
由于测试图像集中的图像数量一般少于训练图像集中的图像数量,提高第三元学习器中池化层的过滤器的大小可以防止模型过拟合,提高模型泛化能力。例如,可以将第三元学习器中池化层的过滤器的大小调整为5*5。
S540:利用第三查询集和第三支持集训练第三元学习器。
本步骤中,仅根据第三元学习器输出的第三分类结果与类别标签之间的误差对第三元学习器进行微调,调整的对象为自由向量。该过程为微调阶段,即在此过程中,第一元学习器和第二元学习器的参数不变。该阶段目的在于进一步微调第三元学习器的参数,提高小样本网络模型对不同图像集的适应性,从而提高小样本网络模型的准确性。
S550:通过第三支持图像及第三查询图像验证小样本网络模型。
通过从测试图像集中抽取第三查询集(第三查询图像)和第三支持集(第三支持图像)对训练得到的小样本网络模型进行验证,以检验小样本网络模型在类别不同的测试图像集上的识别效果。
本实施例中,对训练过的小样本学习网络模型进行进一步验证,验证后的小样本网络模型可以对图像进行识别。
参阅图6,图6是本申请第六实施例提供的电子设备的结构示意图。如图6所示,该电子设备包括处理器610、与处理器610耦接的存储器620,其中,存储器620存储有计算机程序,处理器610用于执行存储器620存储的计算机程序以执行以上任一实施例以及可能的结合所提供的方法。
处理器610还可以称为CPU(Central Processing Unit,中央处理单元)。处理器610可能是一种集成电路芯片,具有信号的处理能力。处理器610还可以是通用处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现成可编程门阵列(FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
在一个实施例中,还提供一种计算机可读取存储介质,该计算机可读取存储介质中存储有程序代码,该程序代码可被处理器调用以执行上述任一实施例以及可能的结合所提供的方法。
需要说明的是,本申请实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,计算机程序可存储于一计算机可读取存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,计算机程序包括计算机程序代码,计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。计算机可读取介质可以包括:能够携带计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟.光盘、计算机存储器、只读存储器(ROM,Read-0nly Memory) 、随机存取存储器(RAM, Random Access Memory) 、电载波信号、电信信号以及软件分发介质等。
以上所述仅为本申请的实施例,并非限制本申请的专利范围,凡是利用本申请说明书及附图内容所作的等效结构或等效流程的变换,或直接或间接运用在其他相关的技术领域,均同理包括在本申请的专利保护范围内。

Claims (9)

1.一种基于小样本学习的图像识别方法,其特征在于,包括:
从待识别图像集中抽取第一查询集和第一支持集,所述第一支持集包括第一数量个类别的带有类别标签的第一支持图像,所述第一查询集包括一张或多张未标记类别的第一查询图像;
将所述第一查询集和所述第一支持集输入预先训练的小样本网络模型,得到每张所述第一查询图像的综合分类结果,其中,所述小样本网络模型包括集成层和第一元学习器、第二元学习器、第三元学习器,所述第一元学习器用于基于所述第一查询图像与所述第一支持图像之间的相似度获取所述第一查询图像的第一分类结果,所述第二元学习器用于基于所述第一查询图像与所述第一支持图像之间的第一距离获取所述第一查询图像的第二分类结果,所述第三元学习器用于对所述第一查询集包含的第一查询图像进行分类以获取所述第一查询图像的第三分类结果,所述集成层用于集成同一张所述第一查询图像的第一分类结果、第二分类结果、第三分类结果而得到所述每张第一查询图像的综合分类结果;
所述小样本网络模型的训练方式,包括:
从训练图像集中抽取第二查询集和第二支持集,所述训练图像集包括第二数量个类别的带有类别标签的图像,所述训练图像集的图像的类别区别于所述待识别图像集的图像的类别,所述第二支持集包括第三数量个类别的带有类别标签的第二支持图像,所述第二查询集包括第三数量个类别的带有类别标签的第二查询图像,所述第三数量小于或等于所述第二数量;
将所述第二查询集和所述第二支持集输入小样本网络模型;
对所述第二支持集中包含的所述第二支持图像进行聚类,得到所述第三数量个聚类中心;
通过所述小样本网络模型的所述第一元学习器确定当前输入的所述第二查询图像与所述第二支持集的各个所述聚类中心之间的相似度,并获取所述第二查询图像的所述第一分类结果,通过所述小样本网络模型的所述第二元学习器确定所述第二查询图像与所述各个聚类中心之间的第一距离,并获取所述第二查询图像的所述第二分类结果,通过所述小样本网络模型的所述第三元学习器对所述第二查询集包含的所述第二查询图像进行分类以获取所述第二查询图像的所述第三分类结果;
计算所述当前输入的所述第二查询图像带有的类别标签与所述第一分类结果、第二分类结果及第三分类结果之间的分类误差,得到综合误差,并按照所述综合误差调整所述小样本网络模型的参数,根据调整后的所述小样本网络模型获取下一输入的所述第二查询图像的所述第一分类结果、第二分类结果及第三分类结果,计算得到所述综合误差,直至所述综合误差满足预设条件。
2.根据权利要求1所述的方法,其特征在于,在得到每张查询图像的综合分类结果之前,还包括:
利用所述第一支持集的所述第一支持图像对预先训练的所述第三元学习器进行微调。
3.根据权利要求1所述的方法,其特征在于,
所述第三元学习器包括池化层和距离计算模块,所述池化层用于对所述第一查询图像的特征进行池化,所述距离计算模块用于计算池化后的所述第一查询图像的特征与自由向量之间的第二距离,其中,所述自由向量为所述第三元学习器中的可调参数。
4.根据权利要求1所述的方法,其特征在于,所述第一查询图像的综合分类结果的计算方式,包括:
将所述第一查询图像的所述第一分类结果和所述第二分类结果映射到固定的数值区间;
分别对所述第一查询图像的所述第三分类结果、映射后的所述第一分类结果及映射后的所述第二分类结果进行归一化处理;
计算归一化处理后的所述第一分类结果、第二分类结果及第三分类结果的和,得到所述第一查询图像在所述第一数量个类别中各个类别的概率,并将概率最大的类别作为所述第一查询图像的所述综合分类结果。
5.根据权利要求1所述的方法,其特征在于,在所述将所述第二查询集和所述第二支持集输入小样本网络模型之后,还包括:
通过所述小样本网络模型的卷积层提取输入的图像的图像特征;
所述通过所述小样本网络模型的所述第一元学习器确定当前输入的所述第二查询图像与所述第二支持集的各个聚类中心之间的相似度,包括:
通过所述第一元学习器的关系模块计算所述第二查询图像的图像特征与所述第二支持集的各个所述聚类中心之间的相似度。
6.根据权利要求1所述的方法,其特征在于,所述计算所述当前输入的所述第二查询图像带有的类别标签与所述第一分类结果、第二分类结果及第三分类结果之间的分类误差,得到综合误差,包括:
将所述第二查询图像的所述第一分类结果映射到固定的数值区间,并计算所述第二查询图像的类别标签与映射后的所述第一分类结果之间的均方误差,得到第一分类误差;
对所述第二查询图像的所述第二分类结果进行归一化处理,并计算所述第二查询图像的类别标签与归一化处理后的所述第二分类结果之间的交叉熵误差,得到第二分类误差;
对所述第二查询图像的所述第三分类结果进行归一化处理,并计算所述第二查询图像的类别标签与归一化处理后的所述第三分类结果之间的交叉熵误差,得到第三分类误差;
获取所述第一分类误差、第二分类误差及第三分类误差之和,得到所述综合误差。
7.根据权利要求1所述的方法,其特征在于,所述小样本网络模型的验证方式,包括:
从测试图像集中抽取第三查询集和第三支持集,所述测试图像集包括第四数量个类别的带有类别标签的图像,所述测试图像集的图像的类别区别于所述训练图像集的图像的类别,所述第三支持集包括第五数量个类别的第三支持图像,所述第三查询集包括第五数量个类别的带有类别标签的第三查询图像,所述第五数量小于或等于所述第四数量;
将所述第三查询集和所述第三支持集输入所述小样本网络模型;
提高所述第三元学习器中池化层的过滤器的大小;
利用所述第三查询集和所述第三支持集训练所述第三元学习器;
通过所述第三支持图像及所述第三查询图像验证所述小样本网络模型。
8.一种电子设备,其特征在于,所述电子设备包括处理器、与所述处理器耦接的存储器,其中,所述存储器存储有计算机程序,所述处理器用于执行所述存储器存储的所述计算机程序以执行如权利要求1-7任一所述的方法。
9.一种计算机可读取存储介质,其特征在于,所述计算机可读取存储介质中存储有程序代码,所述程序代码可被处理器调用执行如权利要求1-7任一项所述的方法。
CN201911233317.9A 2019-12-05 2019-12-05 图像识别方法、电子设备及存储介质 Active CN110717554B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911233317.9A CN110717554B (zh) 2019-12-05 2019-12-05 图像识别方法、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911233317.9A CN110717554B (zh) 2019-12-05 2019-12-05 图像识别方法、电子设备及存储介质

Publications (2)

Publication Number Publication Date
CN110717554A CN110717554A (zh) 2020-01-21
CN110717554B true CN110717554B (zh) 2023-02-28

Family

ID=69215740

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911233317.9A Active CN110717554B (zh) 2019-12-05 2019-12-05 图像识别方法、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN110717554B (zh)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111639679B (zh) * 2020-05-09 2022-03-04 西北工业大学 一种基于多尺度度量学习的小样本学习方法
CN112434721B (zh) * 2020-10-23 2023-09-01 特斯联科技集团有限公司 一种基于小样本学习的图像分类方法、***、存储介质及终端
CN112949693B (zh) * 2021-02-02 2024-04-26 北京嘀嘀无限科技发展有限公司 图像分类模型的训练方法、图像分类方法、装置和设备
CN113065634B (zh) * 2021-02-26 2024-07-09 华为技术有限公司 一种图像处理方法、神经网络的训练方法以及相关设备
CN113052802B (zh) * 2021-03-11 2024-04-09 南京大学 基于医学图像的小样本图像分类方法、装置及设备
CN113298150A (zh) * 2021-05-25 2021-08-24 东北林业大学 一种基于迁移学习与自学习的小样本植物病害识别方法
CN113673583A (zh) * 2021-07-30 2021-11-19 浙江大华技术股份有限公司 一种图像识别方法、识别网络的训练方法及相关装置
CN115424053B (zh) * 2022-07-25 2023-05-02 北京邮电大学 小样本图像识别方法、装置、设备及存储介质
CN118038190A (zh) * 2024-04-09 2024-05-14 深圳精智达技术股份有限公司 一种深度原型网络的训练方法、装置及存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109522850A (zh) * 2018-11-22 2019-03-26 中山大学 一种基于小样本学习的动作相似度评估方法
CN109800811A (zh) * 2019-01-24 2019-05-24 吉林大学 一种基于深度学习的小样本图像识别方法
CN110276394A (zh) * 2019-06-21 2019-09-24 扬州大学 一种小样本下基于深度学习的电力设备分类方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109522850A (zh) * 2018-11-22 2019-03-26 中山大学 一种基于小样本学习的动作相似度评估方法
CN109800811A (zh) * 2019-01-24 2019-05-24 吉林大学 一种基于深度学习的小样本图像识别方法
CN110276394A (zh) * 2019-06-21 2019-09-24 扬州大学 一种小样本下基于深度学习的电力设备分类方法

Also Published As

Publication number Publication date
CN110717554A (zh) 2020-01-21

Similar Documents

Publication Publication Date Title
CN110717554B (zh) 图像识别方法、电子设备及存储介质
CN111126482B (zh) 一种基于多分类器级联模型的遥感影像自动分类方法
Chen et al. Model Metric Co-Learning for Time Series Classification.
Zaibi et al. A Lightweight Model for Traffic Sign Classification Based on Enhanced LeNet‐5 Network
CN109919252B (zh) 利用少数标注图像生成分类器的方法
CN109952614A (zh) 生物粒子的分类***和方法
CN111709311A (zh) 一种基于多尺度卷积特征融合的行人重识别方法
JP5214760B2 (ja) 学習装置、方法及びプログラム
CN115937655B (zh) 多阶特征交互的目标检测模型及其构建方法、装置及应用
CN110047506B (zh) 一种基于卷积神经网络和多核学习svm的关键音频检测方法
CN102385592B (zh) 图像概念的检测方法和装置
JP6897749B2 (ja) 学習方法、学習システム、および学習プログラム
CN111444765B (zh) 图像重识别方法及相关模型的训练方法及相关装置、设备
CN112990282B (zh) 一种细粒度小样本图像的分类方法及装置
Zhang et al. Large-scale aerial image categorization using a multitask topological codebook
JP5214679B2 (ja) 学習装置、方法及びプログラム
US7233692B2 (en) Method and computer program product for identifying output classes with multi-modal dispersion in feature space and incorporating multi-modal structure into a pattern recognition system
CN113489685A (zh) 一种基于核主成分分析的二次特征提取及恶意攻击识别方法
CN104978569A (zh) 一种基于稀疏表示的增量人脸识别方法
Xiong et al. RGB-D scene recognition via spatial-related multi-modal feature learning
CN111898704A (zh) 对内容样本进行聚类的方法和装置
Kouzani Road-sign identification using ensemble learning
Najibi et al. Towards the success rate of one: Real-time unconstrained salient object detection
CN111860601B (zh) 预测大型真菌种类的方法及装置
CN115830401B (zh) 一种小样本图像分类方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant