CN114782752B - 基于自训练的小样本图像集成分类方法及装置 - Google Patents

基于自训练的小样本图像集成分类方法及装置 Download PDF

Info

Publication number
CN114782752B
CN114782752B CN202210487571.7A CN202210487571A CN114782752B CN 114782752 B CN114782752 B CN 114782752B CN 202210487571 A CN202210487571 A CN 202210487571A CN 114782752 B CN114782752 B CN 114782752B
Authority
CN
China
Prior art keywords
classifier
training
self
support set
integrated
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210487571.7A
Other languages
English (en)
Other versions
CN114782752A (zh
Inventor
李晓旭
郭晓伟
刘俊
金志宇
汤卓和
曾俊瑀
李睿凡
马占宇
陶剑
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Lanzhou University of Technology
Original Assignee
Lanzhou University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Lanzhou University of Technology filed Critical Lanzhou University of Technology
Priority to CN202210487571.7A priority Critical patent/CN114782752B/zh
Publication of CN114782752A publication Critical patent/CN114782752A/zh
Application granted granted Critical
Publication of CN114782752B publication Critical patent/CN114782752B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T10/00Road transport of goods or passengers
    • Y02T10/10Internal combustion engine [ICE] based vehicles
    • Y02T10/40Engine management systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computational Linguistics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于自训练的小样本图像集成分类方法及装置,通过迁移基类数据的卷积特征提取,使用查询样本进行基分类器的自训练,不断地将伪标签集加到支持集扩充支持集,并运用到下一次基分类器自训练中,提高了基分类器自训练结果的可靠性。自训练过程中产生的基分类器,不断通过模型平均得到集成分类器,经过多次迭代自训练和分类器集成过程,得到最终的集成分类器,通过构建损失函数,使得基分类器在查询样本上有确定的、不同的预测,实现了基分类器的不同,解决现有小样本分类方法中,基于特征迁移和查询样本自训练的小样本图像集成分类中基学习器的多样性问题,对于提升图像的分类效果非常显著,具有很高的使用价值。

Description

基于自训练的小样本图像集成分类方法及装置
技术领域
本发明涉及图像分类技术领域,尤其涉及一种基于自训练的小样本图像集成分类方法及装置。
背景技术
近年来,随着计算机技术的发展,人们浏览的信息日益丰富,每天都有大量图片被上传到网络,由于数量巨大,人工已经无法对此进行分类。在很多大样本图像分类任务上,机器的识别性能已经超越人类。然而,当样本量比较少时,机器的识别水平仍与人类存在较大差距。因此,研究高效可靠的图片分类算法有很迫切的社会需求。
小样本分类(Few-shot Classification)属于小样本学习(Few-shot Learning)范畴,往往包含类别空间不相交的两类数据,即基类数据和新类数据。小样本分类旨在利用基类数据学习的知识和新类数据的少量标记样本(支持样本)来学习分类规则,准确预测新类任务中未标记样本(查询样本)的类别。
小样本图像分类是当前计算机视觉、人工智能领域中亟待解决的研究问题。现有的、较为成功的大样本图像分类方法严重依赖样本的数量,而现实世界中事物的样本量是服从长尾分布的,即大量事物的样本量都是严重不足的,例如在军事、医疗、工业,天文等领域,样本采集需要消耗大量的人力、物力、时间和经济成本,很难采集大规模的图像样本。因此,开展小样本图像分类的研究对图像分类技术的广泛应用具有重要价值。另外,小样本图像分类的研究目标就是通过少量图像样本的学***相当的识别能力。因此,开展小样本图像分类的研究对响应我国的人工智能发展规划以及突破人工智能的理论瓶颈具有重要意义。
目前小样本图像分类的研究中,特征迁移旨在通过引入源数据特征来帮助完成目标数据特征域的机器学习任务。一个机器学习任务中,可能由于目标特征域缺少足够的标签而导致学习的效果很差。通过挖掘源数据与目标数据的交叉特征结构,或者借助中间数据进行“桥接”,可以帮助我们在目标数据特征上进行的机器学习任务实现不同特征空间之间的知识迁移。例如,我们在进行图片数据分类时缺少足够带有标记的训练数据,就可以借助已经标注好的文本数据,以及具有交叉特征的中间数据来协助提高在图片数据上的学习效果。然而,基于特征迁移的基于自训练的小样本图像集成分类中存在基学习器的多样性问题。因此,本发明主要通过迁移基类数据的卷积特征提取,并基于查询样本进行自训练,通过构建损失函数,使得基分类器在查询样本上有确定的、不同的预测,实现基分类器的不同。
发明内容
本发明针对上述技术问题,提出一种基于自训练的小样本图像集成分类方法及装置,使用查询样本进行基分类器的自训练,不断地将伪标签集加到支持集扩充支持集。自训练过程中产生的基分类器,不断通过模型平均得到集成分类器,经过多次迭代自训练和分类器集成过程,得到最终的集成分类器,旨在解决现有小样本分类方法中,基于特征迁移的基于自训练的小样本图像集成分类中基学习器的多样性问题。
为了实现上述目的,本发明提供如下技术方案:
一方面,本发明提供了一种基于自训练的小样本图像集成分类方法,包括以下步骤:
S1、对数据进行预处理,其中数据包括训练集和测试集;
S2、构建基于自训练的小样本图像集成分类的模型:使用Baseline++网络结构构建基分类器,使用查询样本进行基分类器的自训练,不断地将伪标签集加到支持集扩充支持集,自训练过程中产生的基分类器,不断通过模型平均得到集成分类器,经过多次迭代自训练和分类器集成过程,得到最终的集成分类器;
S3、使用测试集数据对基于自训练的小样本图像集成分类的模型进行训练,优化模型参数;
S4、通过新类数据上所有任务中查询集标签的预测值和真实值,评估模型的最终性能。
进一步地,步骤S1的预处理方法为:
S11,将数据分为训练集和测试集两部分,且这两部分的类别空间互斥,将Dtrain作为基类数据用于训练模型,Dtest作为新类数据用于测评模型性能;
S12,对于C-way K-shot分类任务,从Dtrain中随机选出C个类别,每个类别中随机选出M个样本,其中K个样本作为支持样本Sc,其余M-K个样本作为查询样本Qc,Sc和Qc构成一个任务Ti;同样地,对于Dtest有任务
进一步地,步骤S2中,使用Baseline++网络结构,对支持集进行训练得到m个基分类器,在此阶段,建立特征提取模块、关系网络模块和基分类器模块;其中,特征提取模块基于卷积特征提取支持集的特征,关系网络模块基于特征提取模块输出的支持集特征和表示每个类的学习权重向量之间的余弦距离进行预测,上述两个模块在此阶段共享一个,基分类器模块由前两个模块参与构建;对于每次任务Ti抽取三个数据集:有标签的支持集无标签的支持集/>和查询集/>步骤包括:
S21,在支持集上,训练得到基分类器0,同时将基分类器0赋给集成分类器0;
S22,使用基分类器0对查询集样本进行预测,得到预测较为准确的样本伪标签预测集1,将其加入支持集进行训练得到基分类器1;
S23,将集成分类器0和基分类器1通过模型平均进行集成,得到集成分类器1;
S24,上述步骤S21-S23迭代多次,得到最终的集成分类器。
进一步地,每次更新得到当前层次的分类器,集成分类器和伪标签预测集,其中,分类器由有标签的支持集Sc和无标签的支持集U更新,具体公式为:
该公式为最大似然估计公式的变形,其中,为分类器,当k=0时,/>由支持集直接训练得到,/>为特征提取模块,fψ为关系网络模块,C为任务个数,Ac为当前无标签支持集到所有支持集之间的距离总和求平均。
进一步地,特征提取模块采用如下公式:
该公式为最大似然估计公式的变形,特征提取时,在基分类器下对每个查询样本进行特征提取,它们的和进行最大似然估计处理,得到的是特征提取模块需要的结果。
进一步地,关系网络模块采用如下公式:
该公式为最大似然估计公式的变形,fψ为关系网络模块,用于获取两个参数之间的距离,在中,第一个参数/>为提取的无标签支持集特征,第二个参数Ac表示当前无标签支持集到所有支持集之间的距离总和求平均,将所有样本的数据进行最大似然估计处理,得到的是关系网络模块需要的结果。
进一步地,步骤S3具体包括:
S31,对于每一个任务抽取三个数据集:有标签的支持集/>无标签的支持集/>和查询集/>
S32,通过有标签支持集和无标签支持集U*进一步微调训练过的分类器,更新公式如下:
其中,表示整个支持集,即包括有标签支持集和无标签支持集两部分,为度量在支持集下当前迭代下生成的分类器和上一次迭代过程生成的集成分类器两个参数的概率分布之间的差异;
S33,集成分类器参数更新如下:
γk=ω1θk2γk-1 (5)
其中,γk-1为集成分类器k-1的参数,θk为基分类器k的参数,ω1和ω2为集成分类器k-1和基分类器k的权重,当k=0时,γ0=θ0
S34,查询集的标签更新如下:
其中,为查询集的标签,/>为第m个集成分类器的参数,/>为提取特征模块,为查询集的样本,其中/>属于有理数集。
进一步地,步骤S4中,通过新类数据上所有任务中查询集标签的预测值和真实值,评估集成分类方法的最终性能。
另一方面,本发明还提供了一种基于自训练的小样本图像集成分类装置,用以实现上述的任一项方法,包括以下模块:
预训练模块:使用基类数据上预训练得到特征提取模块;
自训练模块:用于构建基分类器,并使用查询样本进行基分类器的自训练,不断地将伪标签集加到支持集扩充支持集;
集成分类模块:用于自训练过程中产生的基分类器,不断通过模型平均得到集成分类器。
与现有技术相比,本发明的有益效果为:
本发明建立了一种基于自训练的小样本图像集成分类方法及装置,通过迁移基类数据的卷积特征提取,使用查询样本进行基分类器的自训练,不断地将伪标签集加到支持集扩充支持集,并运用到下一次基分类器自训练中,提高了基分类器自训练结果的可靠性。自训练过程中产生的基分类器,不断通过模型平均得到集成分类器,经过多次迭代自训练和分类器集成过程,得到最终的集成分类器,通过构建损失函数,使得基分类器在查询样本上有确定的、不同的预测,实现了基分类器的不同,解决现有小样本分类方法中,基于特征迁移和查询样本自训练的小样本图像集成分类中基学习器的多样性问题,对于提升图像的分类效果非常显著,具有很高的使用价值。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明中记载的一些实施例,对于本领域普通技术人员来讲,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的基于自训练的小样本图像集成分类方法的流程图。
图2为本发明实施例提供的基于查询样本自训练和模型平均的基于自训练的小样本图像集成分类的模型结构图。
图3为本发明实施例提供的Baseline++网络结构图。
图4为本发明实施例提供的基于自训练的小样本图像集成分类装置功能模块示意图。
具体实施方式
下面结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。本发明中的实施例,本领域技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
根据本文公开的一个方面,本发明拟使用查询样本进行基分类器的自训练,不断地将伪标签集加到支持集扩充支持集,自训练过程中产生基分类器,不断通过模型平均得到集成分类器。如图1所示,本发明提供了一种基于自训练的小样本图像集成分类方法,包括以下步骤:
S1、对数据进行预处理,其中数据包括训练集和测试集;
具体地,步骤S1的预处理方法为:
S11,将数据分为训练集和测试集两部分,且这两部分的类别空间互斥,将Dtrain作为基类数据用于训练模型,Dtest作为新类数据用于测评模型性能;
S12,对于C-way K-shot分类任务,从Dtrain中随机选出C个类别,每个类别中随机选出M个样本,其中K个样本作为支持样本Sc,其余M-K个样本作为查询样本Qc,Sc和Qc构成一个任务Ti;同样地,对于Dtest有任务
S2、使用Baseline++网络结构构建基分类器,引入基于查询样本自训练进行联合训练的方法,构建基于查询样本自训练和模型平均的基于自训练的小样本图像集成分类的模型。如图2所示。
具体地,基分类器主要采用Baseline++网络结构进行构建,也可以使用其他的网络结构进行构建,例如采用baseline网络结构来构建基分类器。如图3所示,其中关于特征提取网络模块,使用基类数据上预训练得到的特征提取模块;对于新类数据上的分类任务,抽取三个数据集:有标签的支持集无标签的支持集/>和查询集/>
如图2所示优化基分类器和集成分类器。具体地,步骤S2中,使用Baseline++网络结构,对支持集进行训练得到m个基分类器,在此阶段,建立特征提取模块、关系网络模块和基分类器模块;其中,特征提取模块基于卷积特征提取支持集的特征,关系网络模块基于特征提取模块输出的支持集特征和表示每个类的学习权重向量之间的余弦距离进行预测,上述两个模块在此阶段共享一个,基分类器模块由前两个模块参与构建;对于每次任务抽取三个数据集:有标签的支持集无标签的支持集/>和查询集步骤具体包括:
S21,在支持集上,训练得到基分类器0,同时将基分类器0赋给集成分类器0;
S22,使用基分类器0对查询集样本进行预测,得到预测较为准确的样本伪标签预测集1,将其加入支持集进行训练得到基分类器1;
S23,将集成分类器0和基分类器1通过模型平均进行集成,得到集成分类器1;
S24,上述步骤S21-S23迭代多次,得到最终的集成分类器。
S25,该模型结构类似于迭代模型,每次更新得到当前层次的分类器,集成分类器和伪标签预测集,其中,分类器由有标签的支持集Sc和无标签的支持集U更新,具体公式为:
该公式为最大似然估计公式的变形,其中,为分类器,当k=0时,/>由支持集直接训练得到,/>为特征提取模块,fψ为关系网络模块,C为任务个数,Ac为当前无标签支持集到所有支持集之间的距离总和求平均。
S26,特征提取模块采用如下公式:
该公式为最大似然估计公式的变形,特征提取时,在基分类器下对每个查询样本进行特征提取,它们的和进行最大似然估计处理,得到的是特征提取模块需要的结果。
S27,关系网络模块采用如下公式:
该公式为最大似然估计公式的变形,fψ为关系网络模块,用于获取两个参数之间的距离,在中,第一个参数/>为提取的无标签支持集特征,第二个参数Ac表示当前无标签支持集到所有支持集之间的距离总和求平均,将所有样本的数据进行最大似然估计处理,得到的是关系网络模块需要的结果。
S28,将S26的公式(2)和S27的公式(3),经过最大似然估计处理,得到的结果就是S25的公式(1)。
S3、使用测试集数据对基于自训练的小样本图像集成分类的模型进行训练,优化模型参数;
具体地,使用的数据是测试集 Dtest。其中,步骤S3具体包括:
S31,对于每一个任务抽取三个数据集:有标签的支持集/>无标签的支持集/>和查询集/>
S32,通过有标签支持集和无标签支持集U*进一步微调训练过的分类器,更新公式如下:
该公式基于S25中的公式(1),通过S3中的和U*进一步微调训练过的分类器,在此基础上进一步考虑各分布之间的交叉熵,即KL散度这一因素,得到此处公式(4)。
其中,表示整个支持集,即包括有标签支持集和无标签支持集两部分,为度量在支持集下当前迭代下生成的分类器和上一次迭代过程生成的集成分类器两个参数的概率分布之间的差异;
S33,集成分类器参数更新如下:
γk=ω1θk2γk-1 (5)
其中,γk-1为集成分类器k-1的参数,θk为基分类器k的参数,ω1和ω2为集成分类器k-1和基分类器k的权重,当k=0时,γ0=θ0
S34,查询集的标签更新如下:
其中,为查询集的标签,/>为第m个集成分类器的参数,/>为提取特征模块,为查询样数据的数据,其中/>属于有理数集。
S4、通过新类数据上所有任务中查询集标签的预测值和真实值,评估模型的最终性能。
另一方面,本发明还提供了一种基于自训练的小样本图像集成分类装置,用以实现上述的任一项基于自训练的小样本图像集成分类方法,如图4所示,包括以下模块:
预训练模块:使用基类数据上预训练得到特征提取模块;
自训练模块:用于构建基分类器,并使用查询样本进行基分类器的自训练,不断地将伪标签集加到支持集扩充支持集;
集成分类模块:用于自训练过程中产生的基分类器,不断通过模型平均得到集成分类器。
经过自训练模块多次迭代自训练和集成分类模块分类器集成过程,得到最终的集成分类器。
从上述技术方案可以了解到,本发明的基于查询样本自训练和模型平均的基于自训练的小样本图像集成分类装置具有以下有益效果:
融合了查询样本自训练和模型平均的小样本集成分类装置,拟迁移基类数据的卷积特征提取,并基于查询样本自训练,通过构建损失函数,使得基分类器在查询样本上有确定的、不同的预测,实现了基分类器的不同,解决了现有的小样本分类方法中,基于特征迁移和查询样本自训练的小样本图像集成分类中,基学习器的多样性问题,对于提升图像的分类效果非常显著,具有很高的使用价值。
以上结合附图对所提出的基于自训练的小样本图像集成分类方法及模型的具体实施方式进行了阐述。通过以上实施方式的描述,所属领域的技术人员可以清楚的了解该方法以及装置的实施。
在此提供的算法和显示不与任何特定计算机、虚拟***或者其他设备固有相关。各种通用***也可以与基于在此的启示一起使用。根据上面的描述,构造这类***所要求的结构是显而易见的。此外,本文公开的也不针对任何特定的编程语言。但是应当了解,可以利用各种编程语言实现在此描述的本文公开的内容,并且上面对特定语言所做的描述是为了披露本文公开的最佳实施方式。
类似的,应当理解,为了使本文尽量精简并且帮助理解各个公开方面中的一个或多个,在上面对本文公开的示例性实施例的描述中,本文公开的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下示意图:即要求所保护的本文公开的要求比在每个权力要求中所明确记载的特征具有更多的特征。更确切地说,如下面的权力要求书所反映的那样,公开方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本公开的单独实施例子。
以上所述实施例,仅为本申请的具体实施方式,用以说明本申请的技术方案,而非对其限制,本申请的保护范围并不局限于此,尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特殊进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本申请实施例技术方案的精神和范围。都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应所述以权利要求的保护范围为准。

Claims (3)

1.一种基于自训练的小样本图像集成分类方法,其特征在于,包括以下步骤:
S1、对数据进行预处理,其中数据包括训练集和测试集;预处理方法为:
S11,将数据分为训练集和测试集两部分,且这两部分的类别空间互斥,将Dtrain作为基类数据用于训练模型,Dtest作为新类数据用于测评模型性能;
S12、对于C-way K-shot分类任务,从Dtrain中随机选出C个类别,每个类别中随机选出M个样本,M个样本中K个样本作为支持集Sc,其余M-K个样本作为查询集Qc,Sc和Qc构成一个任务Ti;同样地,对于Dtest有任务
S2、构建基于自训练的小样本图像集成分类的模型:使用Baseline++网络结构构建基分类器,使用查询样本进行基分类器的自训练,不断地将伪标签集加到支持集扩充支持集,自训练过程中产生的基分类器,不断通过模型平均得到集成分类器,经过多次迭代自训练和分类器集成过程,得到最终的集成分类器;
在使用Baseline++网络结构构建基分类器阶段,建立特征提取模块、关系网络模块和基分类器模块;其中,特征提取模块基于卷积特征提取支持集的特征,特征提取模块的公式如下:
该公式为最大似然估计公式的变形,公式中,是特征提取模块;/>为分类器,当k=0时,/>由支持集直接训练得到;
关系网络模块基于特征提取模块输出的支持集特征和表示每个类的学习权重向量之间的余弦距离进行预测,关系网络模块的公式如下:
该公式为最大似然估计公式的变形,公式中,fψ为关系模块,用于获取两个参数之间的距离,在中,第一个参数/>为提取的无标签支持集特征,第二个参数Ac表示当前无标签支持集到所有支持集之间的距离总和求平均;
基分类器模块由前两个模块参与构建,每次更新得到当前层次的分类器、集成分类器和伪标签预测集,其中,基分类器由有标签的支持集Sc和无标签的支持集U更新,基分类器模块的公式如下:
该公式为最大似然估计公式的变形,公式中,为分类器,当k=0时,/>由支持集直接训练得到,/>为特征提取模块,fψ为关系网络模块,C为任务个数;
对于每次任务抽Ti取三个数据集:有标签的支持集无标签的支持集和查询集/>步骤包括:
S21,在支持集上,训练得到基分类器0,同时将基分类器0赋给集成分类器0;
S22,使用基分类器0对查询集样本进行预测,得到预测较为准确的样本伪标签预测集1,将其加入支持集进行训练得到基分类器1;
S23,将集成分类器0和基分类器1通过模型平均进行集成,得到集成分类器1;
S24,上述步骤S21-S23迭代多次,得到最终的集成分类器;
S3、使用测试集数据对基于自训练的小样本图像集成分类的模型进行训练,优化模型参数;
具体包括:
S31,对于每一个任务抽取三个数据集:有标签的支持集/>无标签的支持集/>和查询集/>
S32,通过有标签支持集和无标签支持集U*进一步微调训练过的分类,更新公式如下:
其中,表示整个支持集,即包括有标签支持集和无标签支持集两部分,为度量在支持集下当前迭代下生成的分类器和上一次迭代过程中生成的集成分类器两个参数的概率分布之间的差异;
S33,集成分类器参数更新如下:
γk=ω1θk2γk-1 (5)
公式中,γk-1为集成分类器k-1的参数,θk为基分类器k的参数,ω1和ω2为集成分类器k-1和基分类器k的权重,当k=0时,γ0=θ0
S34、查询集的标签更新如下:
公式中,为查询集的标签,/>为第m个集成分类器的参数,/>提取特征模块,/>为查询集的样本,其中/>属于有理数集;
S4、通过新类数据上所有任务中查询集标签的预测值和真实值,评估模型的最终性能。
2.根据权利要求1所述的基于自训练的小样本图像集成分类方法,其特征在于,在步骤S4中,通过新类数据上所有任务中查询集标签的预测值和真实值,评估集成分类方法的最终性能。
3.一种基于自训练的小样本图像集成分类装置,其特征在于,用以实现权利要求1-2任一项所述的基于自训练的小样本图像集成分类方法,包括以下模块:
预训练模块:使用基类数据上预训练得到特征提取模块;
自训练模块:用于构建基分类器,并使用查询样本进行基分类器的自训练,不断地将伪标签集加到支持集扩充支持集;
集成分类模块:用于自训练过程中产生的基分类器,不断通过模型平均得到集成分类器。
CN202210487571.7A 2022-05-06 2022-05-06 基于自训练的小样本图像集成分类方法及装置 Active CN114782752B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210487571.7A CN114782752B (zh) 2022-05-06 2022-05-06 基于自训练的小样本图像集成分类方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210487571.7A CN114782752B (zh) 2022-05-06 2022-05-06 基于自训练的小样本图像集成分类方法及装置

Publications (2)

Publication Number Publication Date
CN114782752A CN114782752A (zh) 2022-07-22
CN114782752B true CN114782752B (zh) 2023-09-05

Family

ID=82434445

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210487571.7A Active CN114782752B (zh) 2022-05-06 2022-05-06 基于自训练的小样本图像集成分类方法及装置

Country Status (1)

Country Link
CN (1) CN114782752B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116778268A (zh) * 2023-04-20 2023-09-19 江苏济远医疗科技有限公司 一种适用于医学影像目标分类的样本选择偏差缓解方法
CN116168257B (zh) * 2023-04-23 2023-07-04 安徽大学 基于样本生成的小样本图像分类方法、设备及存储介质

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108154156A (zh) * 2017-11-30 2018-06-12 兰州理工大学 基于神经主题模型的图像集成分类方法及装置
CN113076437A (zh) * 2021-04-13 2021-07-06 华南理工大学 一种基于标签重分配的小样本图像分类方法及***
CN113222011A (zh) * 2021-05-10 2021-08-06 西北工业大学 一种基于原型校正的小样本遥感图像分类方法
CN113378941A (zh) * 2021-06-16 2021-09-10 中国石油大学(华东) 多决策融合的小样本图像分类方法
CN113378942A (zh) * 2021-06-16 2021-09-10 中国石油大学(华东) 基于多头特征协作的小样本图像分类方法
CN113408606A (zh) * 2021-06-16 2021-09-17 中国石油大学(华东) 基于图协同训练的半监督小样本图像分类方法
CN113706487A (zh) * 2021-08-17 2021-11-26 西安电子科技大学 基于自监督特征小样本学习的多器官分割方法
CN114299362A (zh) * 2021-12-27 2022-04-08 南京邮电大学 一种基于k-means聚类的小样本图像分类方法
CN114329124A (zh) * 2021-12-16 2022-04-12 南京理工大学 基于梯度重优化的半监督小样本分类方法
CN114387473A (zh) * 2022-01-12 2022-04-22 南通大学 一种基于基类样本特征合成的小样本图像分类方法

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108154156A (zh) * 2017-11-30 2018-06-12 兰州理工大学 基于神经主题模型的图像集成分类方法及装置
CN113076437A (zh) * 2021-04-13 2021-07-06 华南理工大学 一种基于标签重分配的小样本图像分类方法及***
CN113222011A (zh) * 2021-05-10 2021-08-06 西北工业大学 一种基于原型校正的小样本遥感图像分类方法
CN113378941A (zh) * 2021-06-16 2021-09-10 中国石油大学(华东) 多决策融合的小样本图像分类方法
CN113378942A (zh) * 2021-06-16 2021-09-10 中国石油大学(华东) 基于多头特征协作的小样本图像分类方法
CN113408606A (zh) * 2021-06-16 2021-09-17 中国石油大学(华东) 基于图协同训练的半监督小样本图像分类方法
CN113706487A (zh) * 2021-08-17 2021-11-26 西安电子科技大学 基于自监督特征小样本学习的多器官分割方法
CN114329124A (zh) * 2021-12-16 2022-04-12 南京理工大学 基于梯度重优化的半监督小样本分类方法
CN114299362A (zh) * 2021-12-27 2022-04-08 南京邮电大学 一种基于k-means聚类的小样本图像分类方法
CN114387473A (zh) * 2022-01-12 2022-04-22 南通大学 一种基于基类样本特征合成的小样本图像分类方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于集成策略的半监督小样本学习方法研究;叶萌;《中国优秀硕士学位论文全文数据库》(第2期);第6-22、37-49页 *

Also Published As

Publication number Publication date
CN114782752A (zh) 2022-07-22

Similar Documents

Publication Publication Date Title
WO2023087558A1 (zh) 基于嵌入平滑图神经网络的小样本遥感图像场景分类方法
US11256952B2 (en) Image privacy perception method based on deep learning
CN106504233B (zh) 基于Faster R-CNN的无人机巡检图像电力小部件识别方法及***
CN114241282A (zh) 一种基于知识蒸馏的边缘设备场景识别方法及装置
Liu et al. Open-world semantic segmentation via contrasting and clustering vision-language embedding
CN114782752B (zh) 基于自训练的小样本图像集成分类方法及装置
CN112115783A (zh) 基于深度知识迁移的人脸特征点检测方法、装置及设备
US20160140425A1 (en) Method and apparatus for image classification with joint feature adaptation and classifier learning
Zhang et al. Auxiliary training: Towards accurate and robust models
CN114912612A (zh) 鸟类识别方法、装置、计算机设备及存储介质
CN111079847A (zh) 一种基于深度学习的遥感影像自动标注方法
CN112101437A (zh) 基于图像检测的细粒度分类模型处理方法、及其相关设备
CN113807399A (zh) 一种神经网络训练方法、检测方法以及装置
CN112819065A (zh) 基于多重聚类信息的无监督行人难样本挖掘方法和***
An et al. Weather classification using convolutional neural networks
Palle et al. Automated image and video object detection based on hybrid heuristic-based U-net segmentation and faster region-convolutional neural network-enabled learning
CN113762331A (zh) 关系型自蒸馏方法、装置和***及存储介质
CN117095252A (zh) 目标检测方法
CN116109834A (zh) 一种基于局部正交特征注意力融合的小样本图像分类方法
CN114818945A (zh) 融入类别自适应度量学习的小样本图像分类方法及装置
CN114612961A (zh) 一种多源跨域表情识别方法、装置及存储介质
Wang et al. Insulator defect detection based on improved you-only-look-once v4 in complex scenarios
Yang et al. A deep learning approach for automated segmentation of magnetic bright points in the solar photosphere
CN113869193B (zh) 行人再识别模型的训练方法、行人再识别方法及***
CN113011568B (zh) 一种模型的训练方法、数据处理方法及设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant