CN113344144A - 半监督的小样本类别增量学习方法、装置及分类识别方法 - Google Patents

半监督的小样本类别增量学习方法、装置及分类识别方法 Download PDF

Info

Publication number
CN113344144A
CN113344144A CN202110860696.5A CN202110860696A CN113344144A CN 113344144 A CN113344144 A CN 113344144A CN 202110860696 A CN202110860696 A CN 202110860696A CN 113344144 A CN113344144 A CN 113344144A
Authority
CN
China
Prior art keywords
model
stage
current stage
incremental
training
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110860696.5A
Other languages
English (en)
Inventor
刘丽
崔亚文
张雪毅
黄安
刘文哲
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
National University of Defense Technology
Original Assignee
National University of Defense Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by National University of Defense Technology filed Critical National University of Defense Technology
Priority to CN202110860696.5A priority Critical patent/CN113344144A/zh
Publication of CN113344144A publication Critical patent/CN113344144A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • G06F18/2155Generating training patterns; Bootstrap methods, e.g. bagging or boosting characterised by the incorporation of unlabelled data, e.g. multiple instance learning [MIL], semi-supervised techniques using expectation-maximisation [EM] or naïve labelling
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种半监督的小样本类别增量学习方法、装置及分类识别方法,包括:在基本阶段时,利用基本阶段获得的基础数据集对初始模型进行训练学习获得基本阶段的模型,并将基础数据集加入初始总集获得基本阶段的总集;在每一个增量阶段时,从上一阶段的总集中采样获得当前阶段的累积训练集,利用当前阶段获取的增量训练集和累积训练集对上一阶段的模型进行半监督学习,获取当前阶段的模型,并更新总集;在模型训练过程结束后,输出训练完成的目标模型,以利用目标模型对所有见过类别进行分类。本发明在少量标记数据样本和大量未标记数据样本情况下增量学习新类别,同时避免大篇幅遗忘先前学习过的旧类别,提高了小样本类别的分类性能。

Description

半监督的小样本类别增量学习方法、装置及分类识别方法
技术领域
本发明涉及数据处理技术领域,尤其涉及一种半监督的小样本类别增量学习方法、装置及分类识别方法。
背景技术
人们通过不断学习新的观念来了解周围的环境,例如,通过学习一些猫的例子来识别猫,并通过比较学习一些狗的例子进一步区分猫和狗,如此,可以将人们大脑不断地接收一些样本学习新概念,并更新学习到的概念之间的边界,这种能力称为FSCIL(Few-ShotClass-Incremental Learning,小样本类别增量学习)。在一些智能识别***中,例如医学图像分析***和汽车自动驾驶***等,给智能识别***配备这种能力是十分重要的,然而,针对智能识别***收集标记数据仍具有一定的挑战性,具体表现在数据集的时效性、昂贵的成本、涉及到的隐私问题和涉及领域的专业知识等。
FSCIL具有两个挑战性的问题,分别为小样本学习和增量学习。显然接收当前阶段带有有限标记数据的新类别,同时避免大篇幅遗忘前一个阶段的旧类别,这一问题在FSCIL仍然未被克服。
发明内容
本发明实施例的目的在于提供一种半监督的小样本类别增量学习方法、装置及分类识别方法,以解决现有技术中的小样本类别增量学习方法无法克服从少量标记数据样本和大量未标记数据样本的情况下增量学习新类别,同时避免大篇幅遗忘先前学习过的旧类别的问题。
基于上述目的,本发明实施例提供一种半监督的小样本类别增量学习方法,包括:
构建初始模型和初始总集;
在基本阶段时,利用基本阶段获得的基础数据集对所述初始模型进行训练学习获得所述基本阶段的模型,并将所述基础数据集加入所述初始总集获得基本阶段的总集;
在每一个增量阶段时,从上一阶段的总集中采样获得当前阶段的累积训练集,利用当前阶段获取的所述增量训练集和所述累积训练集对上一阶段的模型进行半监督学习,获取当前阶段的模型,并更新当前阶段的总集;其中,所述增量训练集包含标记数据集和未标记数据集;
在模型训练过程结束后,输出训练完成的目标模型,以利用所述目标模型对所有见过类别进行分类;其中,所述模型训练过程包含一个所述基本阶段和多个所述增量阶段。
可选的,所述在每一个增量阶段时,从上一阶段的总集中采样获得当前阶段的累积训练集,利用当前阶段获取的所述增量训练集和所述累积训练集对上一阶段的模型进行半监督学习,获取当前阶段的模型,并更新当前阶段的总集,包括:
对于每一个增量阶段,从上一阶段的总集中采样获得当前阶段的累积训练集,并在未标记数据集为非空集时,利用当前阶段的累积训练集和标记数据集对上一阶段的模型进行更新,得到迭代更新后的模型;
通过迭代更新后的模型预测所述未标记数据集,从所述未标记数据集中选取至少一个未标记数据样本和对应的伪标签加入所述标记数据集中,并从所述未标记数据集中移除,以更新所述增量训练集;
检测当前阶段是否满足迭代更新的结束条件;
若当前阶段满足迭代更新的结束条件,则结束当前阶段的迭代更新过程,并输出当前阶段的模型,并将更新后的所述增量训练集加入上一阶段的总集,得到当前阶段的总集;
若当前阶段不满足迭代更新的结束条件,则利用当前阶段更新后的所述增量训练集和所述累积训练集对模型再次进行迭代更新,直至当前阶段满足迭代更新的结束条件,输出当前阶段的模型,并将更新后的所述增量训练集加入上一阶段的总集,得到当前阶段的总集。
可选的,所述检测当前阶段是否满足迭代更新的结束条件,包括:
通过知识蒸馏算法计算损失值,并检测所述损失值是否小于等于损失阈值;
若所述损失值小于等于损失阈值,则确定当前阶段满足迭代更新的结束条件;否则检测当前阶段的迭代次数是否达到最大迭代次数;
若当前阶段的迭代次数达到最大迭代次数,则确定当前阶段满足迭代更新的结束条件;否则确定当前阶段不满足迭代更新的结束条件。
可选的,所述知识蒸馏算法为:
Figure 331035DEST_PATH_IMAGE001
其中,
Figure 841958DEST_PATH_IMAGE002
为交叉熵损失函数;
Figure 76630DEST_PATH_IMAGE003
为蒸馏损失函数;
Figure 841455DEST_PATH_IMAGE004
为超参数;
Figure 782866DEST_PATH_IMAGE005
为增量训练集;
Figure 224212DEST_PATH_IMAGE006
为从总集中提取旧类别获得的累积训练集,
Figure 618284DEST_PATH_IMAGE007
为模型;
Figure 950914DEST_PATH_IMAGE008
具体表示为:
Figure 481253DEST_PATH_IMAGE009
其中,
Figure 359079DEST_PATH_IMAGE010
为增量训练集
Figure 974868DEST_PATH_IMAGE005
的数据样本数量;
Figure 81496DEST_PATH_IMAGE011
为数据样本
Figure 590974DEST_PATH_IMAGE012
的真实标签,
Figure 249489DEST_PATH_IMAGE013
为数据样本
Figure 994984DEST_PATH_IMAGE012
的预测标签;
Figure 888991DEST_PATH_IMAGE014
具体表示为:
Figure 925080DEST_PATH_IMAGE015
其中,
Figure 364283DEST_PATH_IMAGE016
为累积训练集
Figure 220243DEST_PATH_IMAGE006
的数据样本数量;
Figure 183520DEST_PATH_IMAGE017
为当前阶段
Figure 542957DEST_PATH_IMAGE018
获得的模型,
Figure 182755DEST_PATH_IMAGE019
为上一阶段
Figure 260432DEST_PATH_IMAGE020
获得的模型。
基于同一发明构思,本发明实施例还提供一种半监督的小样本类别增量学习装置,包括:
初始化模块,用于构建初始模型和初始总集;
基本阶段模块,用于在基本阶段时,利用基本阶段获得的基础数据集对所述初始模型进行训练学习获得所述基本阶段的模型,并将所述基础数据集加入所述初始总集获得基本阶段的总集;
增量阶段模块,用于在每一个增量阶段时,从上一阶段的总集中采样获得当前阶段的累积训练集,利用当前阶段获取的所述增量训练集和所述累积训练集对上一阶段的模型进行半监督学习,获取当前阶段的模型,并更新当前阶段的总集;其中,所述增量训练集包含标记数据集和未标记数据集;
模型输出模块,用于在模型训练过程结束后,输出训练完成的目标模型,以利用所述目标模型对所有见过类别进行分类;其中,所述模型训练过程包含一个所述基本阶段和多个所述增量阶段。
可选的,所述增量阶段模块包括:
模型更新子模块,用于对于每一个增量阶段,从上一阶段的总集中采样获得当前阶段的累积训练集,并在未标记数据集为非空集时,利用当前阶段的累积训练集和标记数据集对上一阶段的模型进行更新,得到迭代更新后的模型;
数据集更新子模块,用于通过迭代更新后的模型预测所述未标记数据集,从所述未标记数据集中选取至少一个未标记数据样本和对应的伪标签加入所述标记数据集中,并从所述未标记数据集中移除,以更新所述增量训练集;
条件检测子模块,用于检测当前阶段是否满足迭代更新的结束条件;
迭代更新子模块,用于若当前阶段满足迭代更新的结束条件,则结束当前阶段的迭代更新过程,并输出当前阶段的模型,并将更新后的所述增量训练集加入上一阶段的总集,得到当前阶段的总集;若当前阶段不满足迭代更新的结束条件,则利用当前阶段更新后的所述增量训练集和所述累积训练集对模型再次进行迭代更新,直至当前阶段满足迭代更新的结束条件,输出当前阶段的模型,并将更新后的所述增量训练集加入上一阶段的总集,得到当前阶段的总集。
可选的,所述条件检测子模块包括:
知识蒸馏单元,用于通过知识蒸馏算法计算损失值,并检测所述损失值是否小于等于损失阈值;
损失值检测单元,用于若所述损失值小于等于损失阈值,则确定当前阶段满足迭代更新的结束条件;否则检测当前阶段的迭代次数是否达到最大迭代次数;
迭代次数检测单元,用于若当前阶段的迭代次数达到最大迭代次数,则确定当前阶段满足迭代更新的结束条件;否则确定当前阶段不满足迭代更新的结束条件。
基于同一发明构思,本发明实施例还提供一种用于图像数据的分类识别方法,包括:
构建用于图像数据分类的初始卷积神经网络模型;
采用上述半监督的小样本类别增量学习方法,利用基本数据集和增量数据集对所述初始卷积神经网络模型进行半监督学习,获得目标卷积神经网络模型;其中,所述增量数据集包含标记数据集和未标记数据集;
获取包含多个待识别图像的图像数据集,通过所述目标卷积神经网络模型对所述图像数据集中所有待识别图像进行分类识别,以获得每一个所述待识别图像的类别。
由上可知,本发明实施例提供的半监督的小样本类别增量学习方法,首先在大规模标记数据集对始化模型进行训练学习,然后在每个增量阶段中,从此前的总集中采样获得累积训练集,并结合由标记数据集和未标记数据集构成的增量训练集对模型进行半监督学习,逐步向模型引入新类别,相较于现有技术中的小样本类别增量学习方法,本发明实施例提供的半监督的小样本类别增量学习方法可以在少量标记数据样本和大量未标记数据样本的情况下增量学习新类别,同时避免大篇幅遗忘先前学习过的旧类别,提高了小样本类别的分类性能。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明一实施例中半监督的小样本类别增量学习方法的流程示意图;
图2为本发明一实施例中半监督的小样本类别增量学习方法的步骤S30的流程示意图;
图3为本发明一实施例中半监督的小样本类别增量学习装置的结构示意图。
具体实施方式
为使本公开的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本公开进一步详细说明。
本发明中涉及的部分名词解释如下:
SSFSCIL:Semi-Supervised for Few-Shot Class-Incremental Learning,半监督的小样本类别增量学习。
如图1所示,本发明一实施例提供的一种半监督的小样本类别增量学习方法,具体包括以下步骤:
步骤S10,构建初始模型和初始总集。
在本实施例中,基于神经网络模型结构构建初始模型
Figure 27400DEST_PATH_IMAGE021
,并构建初始总集
Figure 772502DEST_PATH_IMAGE022
,该初始总集
Figure 209300DEST_PATH_IMAGE022
为空集,相应地,对于任一阶段的总集
Figure 649639DEST_PATH_IMAGE023
,可以包含模型训练过程中每个阶段所有见过的样本数据以及样本数据的类别。
步骤S20,在基本阶段时,利用基本阶段获得的基础数据集对初始模型进行训练学习获得基本阶段的模型,并将基础数据集加入初始总集获得基本阶段的总集。
在本实施例中,若检测到当前阶段
Figure 830085DEST_PATH_IMAGE024
为模型训练过程中的基本阶段,也即
Figure 288748DEST_PATH_IMAGE025
,则获取基本阶段的基础数据集
Figure 896447DEST_PATH_IMAGE026
,并利用基础数据集
Figure 325548DEST_PATH_IMAGE026
训练初始模型
Figure 637580DEST_PATH_IMAGE027
,获得基本阶段的模型
Figure 91695DEST_PATH_IMAGE028
,以及将基础数据集
Figure 11241DEST_PATH_IMAGE026
加入初始总集
Figure 550807DEST_PATH_IMAGE029
,获得基本阶段的总集
Figure 197689DEST_PATH_IMAGE030
。其中,基础数据集
Figure 506310DEST_PATH_IMAGE026
由基础类组成,且包含大规模的标记数据样本,可以表示为
Figure 829713DEST_PATH_IMAGE031
Figure 590996DEST_PATH_IMAGE032
为基础数据集
Figure 41569DEST_PATH_IMAGE026
中的第
Figure 204697DEST_PATH_IMAGE033
个数据样本,
Figure 590679DEST_PATH_IMAGE034
为第
Figure 980203DEST_PATH_IMAGE033
个数据样本
Figure 844254DEST_PATH_IMAGE032
的类别。
步骤S30,在每一个增量阶段时,从上一阶段的总集中采样获得当前阶段的累积训练集,利用当前阶段获取的增量训练集和累积训练集对上一阶段的模型进行半监督学习,获取当前阶段的模型,并更新当前阶段的总集;其中,增量训练集包含标记数据集和未标记数据集。
在本实施例中,若检测到当前阶段
Figure 252101DEST_PATH_IMAGE018
为模型训练过程中的增量阶段,也即
Figure 808985DEST_PATH_IMAGE035
Figure 921691DEST_PATH_IMAGE036
为模型训练过程的总阶段数),则从上一阶段
Figure 589432DEST_PATH_IMAGE020
的总集
Figure 727153DEST_PATH_IMAGE037
中采样获取当前阶段
Figure 579571DEST_PATH_IMAGE018
的累积训练集
Figure 68321DEST_PATH_IMAGE038
,并获取当前阶段
Figure 149541DEST_PATH_IMAGE018
的增量训练集
Figure 141767DEST_PATH_IMAGE039
,该增量训练集
Figure 165087DEST_PATH_IMAGE039
包含标记数据集
Figure 875554DEST_PATH_IMAGE040
和未标记数据集
Figure 885098DEST_PATH_IMAGE041
,可以表示为
Figure 636892DEST_PATH_IMAGE042
。其中,标记数据集
Figure 440899DEST_PATH_IMAGE040
包含少量的标记数据样本,且由
Figure 763296DEST_PATH_IMAGE043
个类组成,每个类包含
Figure 310952DEST_PATH_IMAGE044
个标记数据样本,可以表示为
Figure 543351DEST_PATH_IMAGE045
;未标记数据集
Figure 393626DEST_PATH_IMAGE046
包含大量的未标记数据样本,可以表示为
Figure 78685DEST_PATH_IMAGE047
;其次,标记数据集
Figure 820245DEST_PATH_IMAGE048
中的样本数量远远小于未标记数据集
Figure 641571DEST_PATH_IMAGE046
中的样本数量,即
Figure 318540DEST_PATH_IMAGE049
,且标记数据集
Figure 613866DEST_PATH_IMAGE048
中的标记数据样本和未标记数据集
Figure 362379DEST_PATH_IMAGE046
中的未标记数据样本在同一增量阶段中属于同一个领域。
进一步的,利用当前阶段
Figure 303790DEST_PATH_IMAGE018
的增量训练集
Figure 495868DEST_PATH_IMAGE050
和累积训练集
Figure 155520DEST_PATH_IMAGE051
对上一阶段
Figure 848669DEST_PATH_IMAGE020
获得的模型
Figure 769221DEST_PATH_IMAGE052
进行半监督学习,获得当前阶段
Figure 787992DEST_PATH_IMAGE018
的模型
Figure 43262DEST_PATH_IMAGE053
,以及将增量训练集
Figure 274523DEST_PATH_IMAGE050
加入上一阶段
Figure 49581DEST_PATH_IMAGE020
的总集
Figure 973675DEST_PATH_IMAGE054
,以更新总集获得当前阶段
Figure 217705DEST_PATH_IMAGE018
的总集
Figure 252657DEST_PATH_IMAGE055
,即
Figure 23167DEST_PATH_IMAGE056
特别的是,对于第一个增量阶段,即
Figure 242796DEST_PATH_IMAGE057
,对应的上一阶段为基本阶段。而对于最后一个阶段,即
Figure 98757DEST_PATH_IMAGE058
,可以提示模型训练完成。需要说明的是,不同的增量阶段向模型输入的增量训练集没有任何重叠,即
Figure 48651DEST_PATH_IMAGE059
Figure 673668DEST_PATH_IMAGE060
如图2所示,作为优选,步骤S30具体包括以下步骤:
步骤S301,对于每一个增量阶段,从上一阶段的总集中采样获得当前阶段的累积训练集,并在未标记数据集为非空集时,利用当前阶段的累积训练集和标记数据集对上一阶段的模型进行更新,得到迭代更新后的模型。
在步骤S301中,对于模型训练过程中的任一一个增量阶段,首先从上一阶段
Figure 329777DEST_PATH_IMAGE020
的总集
Figure 407455DEST_PATH_IMAGE061
中随机采样获得当前阶段
Figure 315368DEST_PATH_IMAGE018
的累积训练集
Figure 670257DEST_PATH_IMAGE062
,该采样过程用于保持模型在旧类别上的性能;然后检测增量训练集
Figure 107054DEST_PATH_IMAGE063
中的未标记数据集
Figure 62241DEST_PATH_IMAGE064
是否为空集,若未标记数据集
Figure 977107DEST_PATH_IMAGE065
为非空集,则利用当前阶段
Figure 950617DEST_PATH_IMAGE018
的累积训练集
Figure 558316DEST_PATH_IMAGE066
和标记数据集
Figure 735220DEST_PATH_IMAGE067
对上一阶段
Figure 719356DEST_PATH_IMAGE020
获得的模型
Figure 173471DEST_PATH_IMAGE068
进行迭代更新,得到迭代更新后的模型
Figure 827438DEST_PATH_IMAGE069
。需要说明的是,当未标记数据集
Figure 632582DEST_PATH_IMAGE070
中的未标记数据样本全部添加到标记数据集
Figure 279464DEST_PATH_IMAGE040
时,未标记数据集
Figure 588086DEST_PATH_IMAGE070
被检测为空集,此时由标记数据集
Figure 803167DEST_PATH_IMAGE067
和未标记数据集
Figure 941280DEST_PATH_IMAGE070
构成的增量训练集
Figure 860695DEST_PATH_IMAGE063
中所有数据样本均具有一个标签。
可理解的,若未标记数据集
Figure 23823DEST_PATH_IMAGE070
为空集,利用当前阶段
Figure 19592DEST_PATH_IMAGE024
的累积训练集
Figure 392804DEST_PATH_IMAGE071
和标记数据集
Figure 256855DEST_PATH_IMAGE067
对上一阶段
Figure 838272DEST_PATH_IMAGE020
获得的模型
Figure 237898DEST_PATH_IMAGE068
进行迭代更新,直至满足迭代更新的结束条件,结束当前阶段的迭代更新过程,输出当前阶段
Figure 708193DEST_PATH_IMAGE018
的模型
Figure 234990DEST_PATH_IMAGE017
,并利用增量训练集
Figure 372710DEST_PATH_IMAGE063
加入上一阶段
Figure 975861DEST_PATH_IMAGE020
的总集
Figure 199032DEST_PATH_IMAGE072
中,以更新总集得到当前阶段
Figure 795098DEST_PATH_IMAGE018
的总集
Figure 787325DEST_PATH_IMAGE073
。优选地,迭代更新的结束条件包括通过知识蒸馏算法计算得到的损失值
Figure 686011DEST_PATH_IMAGE074
小于等于损失阈值
Figure 761590DEST_PATH_IMAGE075
,或者当前阶段的迭代次数
Figure 630189DEST_PATH_IMAGE076
达到最大迭代次数
Figure 476922DEST_PATH_IMAGE077
步骤S302,通过迭代更新后的模型预测未标记数据集,从未标记数据集中选取至少一个未标记数据样本和对应的伪标签加入标记数据集,并从未标记数据集中移除,以更新增量训练集。
在步骤S302中,通过迭代更新后的模型
Figure 421876DEST_PATH_IMAGE078
预测未标记数据集
Figure 619639DEST_PATH_IMAGE041
中所有未标记数据样本
Figure 432874DEST_PATH_IMAGE079
的伪标签
Figure 524327DEST_PATH_IMAGE080
,从未标记数据集
Figure 499236DEST_PATH_IMAGE064
中选取
Figure 823776DEST_PATH_IMAGE081
个预测可信度达到可信度阈值的未标记数据样本,将选定的未标记数据样本
Figure 175123DEST_PATH_IMAGE079
和对应的伪标签
Figure 121082DEST_PATH_IMAGE080
添加至标记数据集
Figure 266893DEST_PATH_IMAGE082
,并从未标记数据集
Figure 439248DEST_PATH_IMAGE064
中移除,以更新标记数据集
Figure 469652DEST_PATH_IMAGE082
和未标记数据集
Figure 411063DEST_PATH_IMAGE064
,进而更新增量训练集
Figure 117988DEST_PATH_IMAGE063
步骤S303,检测当前阶段是否满足迭代更新的结束条件。
作为优选,迭代更新的结束条件包含通过知识蒸馏算法计算得到的损失值
Figure 777639DEST_PATH_IMAGE083
小于等于损失阈值
Figure 470789DEST_PATH_IMAGE084
,或者当前阶段的迭代次数
Figure 643538DEST_PATH_IMAGE085
达到最大迭代次数
Figure 396730DEST_PATH_IMAGE086
,此时,步骤S303包括以下步骤:
步骤一,通过知识蒸馏算法计算损失值
Figure 402732DEST_PATH_IMAGE083
,并检测损失值
Figure 899573DEST_PATH_IMAGE083
是否小于等于损失阈值
Figure 815576DEST_PATH_IMAGE084
其中,知识蒸馏算法包含交叉熵损失函数和蒸馏损失函数两部分,具体表示为:
Figure 615036DEST_PATH_IMAGE087
(1)
公式(1)中,
Figure 983700DEST_PATH_IMAGE088
为交叉熵损失函数;
Figure 408865DEST_PATH_IMAGE089
为蒸馏损失函数;
Figure 913796DEST_PATH_IMAGE090
为超参数;
Figure 382692DEST_PATH_IMAGE005
为增量训练集;
Figure 238653DEST_PATH_IMAGE006
为从总集中提取旧类别获得的累积训练集,
Figure 77296DEST_PATH_IMAGE091
为模型。
相应地,通过交叉熵损失函数
Figure 826946DEST_PATH_IMAGE088
计算得到的交叉熵损失值可以评估真实标签和伪标签之间的差距,而通过蒸馏损失函数
Figure 358422DEST_PATH_IMAGE089
计算得到的蒸馏损失值可以评估连续两个阶段的预测结果变化。
优选的,
Figure 311465DEST_PATH_IMAGE092
具体表示为:
Figure 688220DEST_PATH_IMAGE093
(2)
公式(2)中,
Figure 292377DEST_PATH_IMAGE094
为增量训练集
Figure 994753DEST_PATH_IMAGE005
的数据样本数量;
Figure 559727DEST_PATH_IMAGE095
为数据样本
Figure 117004DEST_PATH_IMAGE096
的真实标签,
Figure 982192DEST_PATH_IMAGE097
为数据样本
Figure 448945DEST_PATH_IMAGE096
的伪标签。
并且,
Figure 235635DEST_PATH_IMAGE098
具体表示为:
Figure 95138DEST_PATH_IMAGE099
(3)
公式(3)中,
Figure 549253DEST_PATH_IMAGE016
为累积训练集
Figure 452487DEST_PATH_IMAGE100
的数据样本数量;
Figure 992053DEST_PATH_IMAGE101
为当前阶段
Figure 888202DEST_PATH_IMAGE102
获得的模型,
Figure 462403DEST_PATH_IMAGE103
为上一阶段
Figure 411905DEST_PATH_IMAGE020
获得的模型。
步骤二,若损失值
Figure 563400DEST_PATH_IMAGE104
小于等于损失阈值
Figure 623760DEST_PATH_IMAGE105
,则确定当前阶段满足迭代更新的结束条件;否则检测当前阶段的迭代次数
Figure 193413DEST_PATH_IMAGE106
是否达到最大迭代次数
Figure 313816DEST_PATH_IMAGE107
步骤三,若当前阶段的迭代次数
Figure 687028DEST_PATH_IMAGE106
达到最大迭代次数
Figure 551079DEST_PATH_IMAGE107
,则确定当前阶段满足迭代更新的结束条件;否则确定当前阶段不满足迭代更新的结束条件。
也即,若
Figure 99872DEST_PATH_IMAGE108
,或者
Figure 768007DEST_PATH_IMAGE109
,则确定当前阶段满足迭代更新的结束条件,进一步地进入步骤S304结束当前阶段的迭代更新过程,进入下一阶段训练模型;而若
Figure 566199DEST_PATH_IMAGE110
,且
Figure 888070DEST_PATH_IMAGE111
,则确定当前阶段不满足迭代更新的结束条件,进一步地进入步骤S305再次对模型进行迭代更新。可理解的,本实施例通过知识蒸馏算法计算损失值,并基于损失值来迭代更新模型,这种基于知识蒸馏的类增量学习,可以避免大篇幅遗忘旧类别的问题。
步骤S304,若当前阶段满足迭代更新的结束条件,则结束当前阶段的迭代更新过程,并输出当前阶段的模型,并将更新后的增量训练集加入上一阶段的总集,得到当前阶段的总集。
步骤S305,若当前阶段不满足迭代更新的结束条件,则利用当前阶段更新后的增量训练集和累积训练集对模型再次进行迭代更新,直至当前阶段满足迭代更新的结束条件,输出当前阶段的模型,并将更新后的增量训练集加入上一阶段的总集,得到当前阶段的总集。
作为优选,在增量阶段的迭代更新过程中,若检测到通过知识蒸馏算法得到的损失值
Figure 619265DEST_PATH_IMAGE083
小于等于损失阈值
Figure 815891DEST_PATH_IMAGE084
,或者当前阶段
Figure 412964DEST_PATH_IMAGE112
的迭代次数
Figure 25342DEST_PATH_IMAGE113
达到最大迭代次数
Figure 659979DEST_PATH_IMAGE114
,则结束当前阶段
Figure 417719DEST_PATH_IMAGE112
的迭代更新过程,并将迭代更新后的模型
Figure 393766DEST_PATH_IMAGE115
作为当前阶段
Figure 278676DEST_PATH_IMAGE112
的模型
Figure 125409DEST_PATH_IMAGE116
输出,同时将更新后的增量训练集
Figure 319630DEST_PATH_IMAGE117
加入上一阶段
Figure 517393DEST_PATH_IMAGE118
的总集
Figure 330629DEST_PATH_IMAGE119
,以更新总集得到当前阶段
Figure 405770DEST_PATH_IMAGE112
的总集
Figure 911837DEST_PATH_IMAGE120
;而若检测到通过知识蒸馏算法得到的损失值
Figure 455951DEST_PATH_IMAGE083
大于损失阈值
Figure 807298DEST_PATH_IMAGE084
,且当前阶段的迭代次数
Figure 503990DEST_PATH_IMAGE113
未达到最大迭代次数
Figure 180959DEST_PATH_IMAGE121
,则返回步骤S301对模型再次进行迭代更新,直至通过知识蒸馏算法得到的损失值
Figure 87735DEST_PATH_IMAGE083
小于等于损失阈值
Figure 367407DEST_PATH_IMAGE084
,或者当前阶段的迭代次数
Figure 308818DEST_PATH_IMAGE113
达到最大迭代次数
Figure 267940DEST_PATH_IMAGE121
,结束当前阶段
Figure 662012DEST_PATH_IMAGE112
的迭代更新过程,进入下一阶段训练模型。
可理解的,本实施例在增量阶段逐渐向模型提供新类别,并结合从此前的总集中采样获得的旧类别,对模型进行半监督学习,半监督学习得到的模型可以对所有见过的样本类别(包括各增量阶段逐渐加入的新类别和此前的旧类别)进行准确分类。
步骤S40,在模型训练过程结束后,输出训练完成的目标模型,以利用目标模型对所有见过类别进行分类,其中,该模型训练过程包含一个基本阶段和多个增量阶段。
可理解的,本实施例具有自训练的SSFSCIL过程如下:
对于第一阶段(即基本阶段),获取大规模的基础数据集
Figure 479795DEST_PATH_IMAGE122
,并将大规模的基础数据集
Figure 10134DEST_PATH_IMAGE122
加入初始总集
Figure 373113DEST_PATH_IMAGE123
,得到第一阶段的总集
Figure 254482DEST_PATH_IMAGE124
;利用第一阶段的总集
Figure 875956DEST_PATH_IMAGE125
对初始模型
Figure 791959DEST_PATH_IMAGE126
进行训练学习,得到第一阶段的模型
Figure 89954DEST_PATH_IMAGE127
对于第二阶段(即第一个增量阶段),从总集
Figure 193039DEST_PATH_IMAGE124
中采样得到第二阶段的累积训练集
Figure 493571DEST_PATH_IMAGE128
,结合第二阶段获得的增量训练集
Figure 388714DEST_PATH_IMAGE129
,对模型
Figure 483709DEST_PATH_IMAGE127
进行半监督学习,得到第二阶段的模型
Figure 215036DEST_PATH_IMAGE130
;根据增量训练集
Figure 53679DEST_PATH_IMAGE131
更新总集
Figure 803329DEST_PATH_IMAGE132
,得到第二阶段的总集
Figure 69226DEST_PATH_IMAGE133
。可理解的,在半监督学习过程中,将未标记数据样本包含在每个新类别中,可以显著提高SSFSCIL算法的性能。
当一个新的增量阶段开始时,从上一阶段
Figure 412482DEST_PATH_IMAGE020
的总集
Figure 166068DEST_PATH_IMAGE134
中采样获得累积训练集
Figure 645591DEST_PATH_IMAGE135
,进一步地在获取到增量阶段的增量训练集
Figure 472602DEST_PATH_IMAGE063
时,重复第二阶段的半监督学习过程,直至完成所有阶段,将最后一个阶段得到的模型
Figure 37575DEST_PATH_IMAGE136
作为目标模型
Figure 93387DEST_PATH_IMAGE137
输出,此时得到的目标模型
Figure 692995DEST_PATH_IMAGE138
具有较高准确率,且具有对所有见过类别进行分类的能力。
由上可知,本实施例提供的半监督的小样本类别增量学习方法,首先在大规模标记数据集对始化模型进行训练学习,然后在每个增量阶段中,从此前的总集中采样获得累积训练集,并结合由标记数据集和未标记数据集构成的增量训练集对模型进行半监督学习,逐步向模型引入新类别,相较于现有技术中的小样本类别增量学习方法,本实施例提供的半监督的小样本类别增量学习方法可以在少量标记数据样本和大量未标记数据样本的情况下增量学习新类别,同时避免大篇幅遗忘先前学习过的旧类别,提高了小样本类别的分类性能。
基于同一发明构思,如图3所示,本发明一实施例还提供了一种半监督的小样本类别增量学习装置,包括初始化模块110、基本阶段模块120、增量阶段模块130和模型输出模块140,各功能模块的详细说明如下:
初始化模块110,用于构建初始模型和初始总集。
基本阶段模块120,用于在基本阶段时,利用基本阶段获得的基础数据集对初始模型进行训练学习获得基本阶段的模型,并将基础数据集加入初始总集获得基本阶段的总集。
增量阶段模块130,用于在每一个增量阶段时,从上一阶段的总集中采样获得当前阶段的累积训练集,利用当前阶段获取的增量训练集和累积训练集对上一阶段的模型进行半监督学习,获取当前阶段的模型,并更新当前阶段的总集;其中,该增量训练集包含标记数据集和未标记数据集。
模型输出模块140,用于在模型训练过程结束后,输出训练完成的目标模型,以利用目标模型对所有见过类别进行分类;其中,该模型训练过程包含一个基本阶段和多个增量阶段。
上述实施例的装置用于实现前述实施例中相应的方法,并且具有相应的方法实施例的有益效果,在此不再赘述。
进一步地,所述增量阶段模块130包括以下子模块,各功能子模块的详细说明如下:
模型更新子模块,用于对于每一个增量阶段,从上一阶段的总集中采样获得当前阶段的累积训练集,并在未标记数据集为非空集时,利用当前阶段的累积训练集和标记数据集对上一阶段的模型进行更新,得到迭代更新后的模型。
数据集更新子模块,用于通过迭代更新后的模型预测未标记数据集,从未标记数据集中选取至少一个未标记数据样本和对应的伪标签加入标记数据集中,并从未标记数据集中移除,以更新增量训练集。
条件检测子模块,用于检测当前阶段是否满足迭代更新的结束条件。
迭代更新子模块,用于若当前阶段满足迭代更新的结束条件,则结束当前阶段的迭代更新过程,并输出当前阶段的模型,并将更新后的增量训练集加入上一阶段的总集,得到当前阶段的总集;若当前阶段不满足迭代更新的结束条件,则利用当前阶段更新后的增量训练集和累积训练集对模型再次进行迭代更新,直至当前阶段满足迭代更新的结束条件,输出当前阶段的模型,并将更新后的增量训练集加入上一阶段的总集,得到当前阶段的总集。
进一步地,所述条件检测子模块包括以下单元,各功能单元的详细说明如下:
知识蒸馏单元,用于通过知识蒸馏算法计算损失值,并检测损失值是否小于等于损失阈值。
损失值检测单元,用于若损失值小于等于损失阈值,则确定当前阶段满足迭代更新的结束条件;否则检测当前阶段的迭代次数是否达到最大迭代次数。
迭代次数检测单元,用于若当前阶段的迭代次数达到最大迭代次数,则确定当前阶段满足迭代更新的结束条件;否则确定当前阶段不满足迭代更新的结束条件。
基于同一发明构思,本发明一实施例还提供了一种用于图像数据的分类识别方法,具体包括以下步骤:
步骤一,构建用于图像数据分类的初始卷积神经网络模型。
步骤二,采用上述任一实施例中的半监督的小样本类别增量学习方法,利用基本数据集和增量数据集对初始卷积神经网络模型进行半监督学习,获得目标卷积神经网络模型;其中,增量数据集包含标记数据集和未标记数据集。
步骤三,获取包含多个待识别图像的图像数据集,通过目标卷积神经网络模型对图像数据集中所有待识别图像进行分类识别,以获得每一个待识别图像的类别。
为验证本实施例中技术方案的有效性,下面结合具有自训练的SSFSCIL算法描述实现SSFSCIL的应用算例,以对SSFSCIL方法的效果进行验证分析。
本实施例中具有自训练的SSFSCIL算法描述如下:
算法一:具有自训练的SSFSCIL算法
输入:基本数据集
Figure 300694DEST_PATH_IMAGE139
,每一个阶段的增量训练集
Figure 477598DEST_PATH_IMAGE140
,初始模型
Figure 461734DEST_PATH_IMAGE141
,初始总集
Figure 289751DEST_PATH_IMAGE142
,第
Figure 68351DEST_PATH_IMAGE143
个阶段的最大迭代次数
Figure 873496DEST_PATH_IMAGE144
,总阶段数
Figure 254799DEST_PATH_IMAGE145
输出:目标模型
Figure 828999DEST_PATH_IMAGE146
,用于分类所有见过的类别
1:
Figure 653867DEST_PATH_IMAGE147
2:
Figure 680729DEST_PATH_IMAGE148
3:利用
Figure 131302DEST_PATH_IMAGE139
Figure 294430DEST_PATH_IMAGE141
进行训练学习,得到
Figure 45524DEST_PATH_IMAGE149
4:将
Figure 294103DEST_PATH_IMAGE139
加入
Figure 282788DEST_PATH_IMAGE150
,得到
Figure 566001DEST_PATH_IMAGE151
5:Else
6:
Figure 732672DEST_PATH_IMAGE152
7:从
Figure 468546DEST_PATH_IMAGE153
中采样获得
Figure 401867DEST_PATH_IMAGE038
8:当
Figure 664221DEST_PATH_IMAGE154
为非空集时,利用
Figure 126427DEST_PATH_IMAGE155
Figure 989078DEST_PATH_IMAGE156
进行迭代更新,获得迭代更新后的模型
Figure 194932DEST_PATH_IMAGE157
9:通过
Figure 311792DEST_PATH_IMAGE158
预测
Figure 210478DEST_PATH_IMAGE159
10:从
Figure 186524DEST_PATH_IMAGE159
中选取
Figure 805856DEST_PATH_IMAGE160
个未标记数据样本
Figure 918168DEST_PATH_IMAGE161
11:将选定的未标记数据样本
Figure 112389DEST_PATH_IMAGE161
和对应的伪标签
Figure 310152DEST_PATH_IMAGE162
加入
Figure 234639DEST_PATH_IMAGE163
12:将选定的未标记数据样本
Figure 467038DEST_PATH_IMAGE161
Figure 707526DEST_PATH_IMAGE164
中删除,以更新
Figure 251640DEST_PATH_IMAGE165
13:通过知识蒸馏算法计算损失值
Figure 868566DEST_PATH_IMAGE166
14:
Figure 565258DEST_PATH_IMAGE167
15:将更新后的
Figure 976647DEST_PATH_IMAGE168
加入
Figure 149003DEST_PATH_IMAGE169
获得
Figure 163095DEST_PATH_IMAGE170
,并输出
Figure 104506DEST_PATH_IMAGE171
16:Else
17:利用更新后的
Figure 326278DEST_PATH_IMAGE168
Figure 720350DEST_PATH_IMAGE172
对模型再次进行迭代更新
18:End For
19:End For
首先,基于现有的图像分类数据库如Mini-ImageNet数据库、CUB200数据库,构建基本阶段的基本数据集和增量阶段的训练集。
其中,Mini-ImageNet数据库是ImageNet的一个子集,每100个类包含600张图像,图像的大小为84×84。CUB200数据库包含超过200种鸟类类别的约6000张训练图像和6000张测试图像,且图像的大小被调整到256×256,再裁剪到224×224作为训练。
对于Mini-ImageNet数据库,选择60个类作为基础类别,40个类作为新颖类别,并采用5-way 5-shot的方式将40个类分为8个阶段进行增量学习,此时模型训练过程包含1个用于基本类别学习的基本阶段,以及8个用于新颖类别学习的增量阶。对于CUB200数据库,选择100个类作为基础类,100个类作为新颖类别,并采用10-way 5-shot的方式将100个类分为10个阶段进行增量学习,此时模型训练过程包含1个用于基本类别学习的基本阶段,以及10个用于新颖类别学习的增量阶段。
也即,对于学习新颖类别的阶段,从每个阶段的训练集中随机选择5个数据样本来构建标记数据集,来构造5-way 5-shot或10-way 5-shot的任务,其余未选定的数据样本选取预设数量的数据样本,例如50个数据样本将其标签丢弃来构建未标记数据集。
然后,选择网络模型,并设置网络模型的学习速率和迭代次数。
对于Mini-ImageNet数据库,使用ResNet-32网络模型,且第一阶段的学习速率从0.1开始,在迭代次数分别达到80和100时,学习速率除以10,剩余增量的学习速率设置为0.001,最大迭代次数设置为40。对于CUB200数据库,使用ResNet-32网络模型,且第一阶段的学习速率从0.001开始,在迭代次数分别达到80和120时学习速率除以10,剩余阶段的学习速率设置为0.001,最大迭代次数设置为40。
当未标记数据集为非空集时,在每次迭代后,从未标记数据集中选取3个未标记数据样本加入标记数据集,从而更新增量训练集,并使用随机梯度下降算法训练模型,每个增量阶段输入的累积训练集最多包含500个数据样本。
表1 有监督训练方法和半监督训练方法的分类准确度对比(%)
Figure 538134DEST_PATH_IMAGE173
最后,基于通过半监督的iCaRL分类器、半监督的NCM分类器和半监督的CNN网络进行增强学习来实现SSFSCIL方法,以获得不同数据库对应的分类识别结果。
在表1中,比较了利用iCaRL、NCM和NCM-CNN这三种有监督训练方法实现的FSCIL方法与利用SS-iCaRL、SS-NCM和SS-NCM-CNN这三种半监督训练方法实现的SSFSCIL方法,在CUB200数据库上获得的分类准确度,结果表明,相较于FSCIL方法,SSFSCIL方法在CUB200数据库上具有显著的性能,也即分类准确度更高。
可见,在增量阶段中引入无标记数据样本的新类别进行增量学习,可以提高小样本类别分类识别的性能。本实施例的SSFSCIL方法有利于解决医学图像分析和汽车自动驾驶等应用***中存在的复杂、具有挑战性的问题。
此外,本实施例还验证了在每个增量阶段加入不同数量的未标记数据样本对SSFSCIL方法的分类性能所造成的影响。
表2 不同数量的未标记数据样本时不同半监督训练方法的分类准确度对比(%)
Figure 334051DEST_PATH_IMAGE174
在表2中,比较了在每个增量阶段中分别添加25、50和75个未标记数据样本,不同半监督训练方法所实现的SSFSCIL方法,在Mini-ImageNet数据库上获得的分类准确度,当未标记数据样本的数量为50时,分类准确度较好。
需要说明的是,还可以基于其他图像数据库,如CIFAR100数据库,来验证实施例中技术方案的有效性。
所属领域的普通技术人员应当理解:以上任何实施例的讨论仅为示例性的,并非旨在暗示本公开的范围(包括权利要求)被限于这些例子;在本公开的思路下,以上实施例或者不同实施例中的技术特征之间也可以进行组合,步骤可以以任意顺序实现,并存在如上所述的本发明实施例的,不同方面的许多其它变化,为了简明它们没有在细节中提供。
本发明实施例旨在涵盖落入所附权利要求的宽泛范围之内的所有这样的替换、修改和变型。因此,凡在本发明实施例的精神和原则之内,所做的任何省略、修改、等同替换、改进等,均应包含在本公开的保护范围之内。

Claims (8)

1.一种半监督的小样本类别增量学习方法,其特征是,包括:
构建初始模型和初始总集;
在基本阶段时,利用基本阶段获得的基础数据集对所述初始模型进行训练学习获得所述基本阶段的模型,并将所述基础数据集加入所述初始总集获得基本阶段的总集;
在每一个增量阶段时,从上一阶段的总集中采样获得当前阶段的累积训练集,利用当前阶段获取的所述增量训练集和所述累积训练集对上一阶段的模型进行半监督学习,获取当前阶段的模型,并更新当前阶段的总集;其中,所述增量训练集包含标记数据集和未标记数据集;
在模型训练过程结束后,输出训练完成的目标模型,以利用所述目标模型对所有见过类别进行分类;其中,所述模型训练过程包含一个所述基本阶段和多个所述增量阶段。
2.根据权利要求1所述的半监督的小样本类别增量学习方法,其特征在于,所述在每一个增量阶段时,从上一阶段的总集中采样获得当前阶段的累积训练集,利用当前阶段获取的所述增量训练集和所述累积训练集对上一阶段的模型进行半监督学习,获取当前阶段的模型,并更新当前阶段的总集,包括:
对于每一个增量阶段,从上一阶段的总集中采样获得当前阶段的累积训练集,并在未标记数据集为非空集时,利用当前阶段的累积训练集和标记数据集对上一阶段的模型进行更新,得到迭代更新后的模型;
通过迭代更新后的模型预测所述未标记数据集,从所述未标记数据集中选取至少一个未标记数据样本和对应的伪标签加入所述标记数据集中,并从所述未标记数据集中移除,以更新所述增量训练集;
检测当前阶段是否满足迭代更新的结束条件;
若当前阶段满足迭代更新的结束条件,则结束当前阶段的迭代更新过程,并输出当前阶段的模型,并将更新后的所述增量训练集加入上一阶段的总集,得到当前阶段的总集;
若当前阶段不满足迭代更新的结束条件,则利用当前阶段更新后的所述增量训练集和所述累积训练集对模型再次进行迭代更新,直至当前阶段满足迭代更新的结束条件,输出当前阶段的模型,并将更新后的所述增量训练集加入上一阶段的总集,得到当前阶段的总集。
3.根据权利要求2所述的半监督的小样本类别增量学习方法,其特征在于,所述检测当前阶段是否满足迭代更新的结束条件,包括:
通过知识蒸馏算法计算损失值,并检测所述损失值是否小于等于损失阈值;
若所述损失值小于等于损失阈值,则确定当前阶段满足迭代更新的结束条件;否则检测当前阶段的迭代次数是否达到最大迭代次数;
若当前阶段的迭代次数达到最大迭代次数,则确定当前阶段满足迭代更新的结束条件;否则确定当前阶段不满足迭代更新的结束条件。
4.根据权利要求3所述的半监督的小样本类别增量学习方法,其特征在于,所述知识蒸馏算法包含交叉熵损失函数和蒸馏损失函数两部分,具体表示为:
Figure 420951DEST_PATH_IMAGE001
其中,
Figure 669530DEST_PATH_IMAGE002
为交叉熵损失函数;
Figure 910412DEST_PATH_IMAGE003
为蒸馏损失函数;
Figure 459205DEST_PATH_IMAGE004
为超参数;
Figure 750509DEST_PATH_IMAGE005
为增量训练集;
Figure 611018DEST_PATH_IMAGE006
为从总集中提取旧类别获得的累积训练集,
Figure 544339DEST_PATH_IMAGE007
为模型;
Figure 291846DEST_PATH_IMAGE008
具体表示为:
Figure 347527DEST_PATH_IMAGE009
其中,
Figure 570698DEST_PATH_IMAGE010
为增量训练集
Figure 150452DEST_PATH_IMAGE011
的数据样本数量;
Figure 408258DEST_PATH_IMAGE012
为数据样本
Figure 900420DEST_PATH_IMAGE013
的真实标签,
Figure 876466DEST_PATH_IMAGE014
为数据样本
Figure 495797DEST_PATH_IMAGE013
的预测标签;
Figure 608110DEST_PATH_IMAGE015
具体表示为:
Figure 802331DEST_PATH_IMAGE016
其中,
Figure 94DEST_PATH_IMAGE017
为累积训练集
Figure 813329DEST_PATH_IMAGE006
的数据样本数量;
Figure 145260DEST_PATH_IMAGE018
为当前阶段
Figure 385749DEST_PATH_IMAGE019
获得的模型,
Figure 929863DEST_PATH_IMAGE020
为上一阶段
Figure 281209DEST_PATH_IMAGE021
获得的模型。
5.一种半监督的小样本类别增量学习装置,其特征在于,包括:
初始化模块,用于构建初始模型和初始总集;
基本阶段模块,用于在基本阶段时,利用基本阶段获得的基础数据集对所述初始模型进行训练学习获得所述基本阶段的模型,并将所述基础数据集加入所述初始总集获得基本阶段的总集;
增量阶段模块,用于在每一个增量阶段时,从上一阶段的总集中采样获得当前阶段的累积训练集,利用当前阶段获取的所述增量训练集和所述累积训练集对上一阶段的模型进行半监督学习,获取当前阶段的模型,并更新当前阶段的总集;其中,所述增量训练集包含标记数据集和未标记数据集;
模型输出模块,用于在模型训练过程结束后,输出训练完成的目标模型,以利用所述目标模型对所有见过类别进行分类;其中,所述模型训练过程包含一个所述基本阶段和多个所述增量阶段。
6.根据权利要求5所述的半监督的小样本类别增量学习装置,其特征在于,所述增量阶段模块包括:
模型更新子模块,用于对于每一个增量阶段,从上一阶段的总集中采样获得当前阶段的累积训练集,并在未标记数据集为非空集时,利用当前阶段的累积训练集和标记数据集对上一阶段的模型进行更新,得到迭代更新后的模型;
数据集更新子模块,用于通过迭代更新后的模型预测所述未标记数据集,从所述未标记数据集中选取至少一个未标记数据样本和对应的伪标签加入所述标记数据集中,并从所述未标记数据集中移除,以更新所述增量训练集;
条件检测子模块,用于检测当前阶段是否满足迭代更新的结束条件;
迭代更新子模块,用于若当前阶段满足迭代更新的结束条件,则结束当前阶段的迭代更新过程,并输出当前阶段的模型,并将更新后的所述增量训练集加入上一阶段的总集,得到当前阶段的总集;若当前阶段不满足迭代更新的结束条件,则利用当前阶段更新后的所述增量训练集和所述累积训练集对模型再次进行迭代更新,直至当前阶段满足迭代更新的结束条件,输出当前阶段的模型,并将更新后的所述增量训练集加入上一阶段的总集,得到当前阶段的总集。
7.根据权利要求6所述的半监督的小样本类别增量学习装置,其特征在于,所述条件检测子模块包括:
知识蒸馏单元,用于通过知识蒸馏算法计算损失值,并检测所述损失值是否小于等于损失阈值;
损失值检测单元,用于若所述损失值小于等于损失阈值,则确定当前阶段满足迭代更新的结束条件;否则检测当前阶段的迭代次数是否达到最大迭代次数;
迭代次数检测单元,用于若当前阶段的迭代次数达到最大迭代次数,则确定当前阶段满足迭代更新的结束条件;否则确定当前阶段不满足迭代更新的结束条件。
8.一种用于图像数据的分类识别方法,其特征在于,包括:
构建用于图像数据分类的初始卷积神经网络模型;
采用权利要求1至4中任一项所述的半监督的小样本类别增量学习方法,利用基本数据集和增量数据集对所述初始卷积神经网络模型进行半监督学习,获得目标卷积神经网络模型;其中,所述增量数据集包含标记数据集和未标记数据集;
获取包含多个待识别图像的图像数据集,通过所述目标卷积神经网络模型对所述图像数据集中所有待识别图像进行分类识别,以获得每一个所述待识别图像的类别。
CN202110860696.5A 2021-07-29 2021-07-29 半监督的小样本类别增量学习方法、装置及分类识别方法 Pending CN113344144A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110860696.5A CN113344144A (zh) 2021-07-29 2021-07-29 半监督的小样本类别增量学习方法、装置及分类识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110860696.5A CN113344144A (zh) 2021-07-29 2021-07-29 半监督的小样本类别增量学习方法、装置及分类识别方法

Publications (1)

Publication Number Publication Date
CN113344144A true CN113344144A (zh) 2021-09-03

Family

ID=77480447

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110860696.5A Pending CN113344144A (zh) 2021-07-29 2021-07-29 半监督的小样本类别增量学习方法、装置及分类识别方法

Country Status (1)

Country Link
CN (1) CN113344144A (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114254702A (zh) * 2021-12-16 2022-03-29 南方电网数字电网研究院有限公司 母线负荷异常数据识别方法、装置、设备、介质和产品
CN114386482A (zh) * 2021-12-15 2022-04-22 同济大学 一种基于半监督增量学习的图片分类***及分类方法
CN114580484A (zh) * 2022-04-28 2022-06-03 西安电子科技大学 一种基于增量学习的小样本通信信号自动调制识别方法
CN114785890A (zh) * 2021-12-31 2022-07-22 北京泰迪熊移动科技有限公司 骚扰电话识别方法及装置
CN115438755A (zh) * 2022-11-08 2022-12-06 腾讯科技(深圳)有限公司 分类模型的增量训练方法、装置和计算机设备
CN115827879A (zh) * 2023-02-15 2023-03-21 山东山大鸥玛软件股份有限公司 基于样本增强和自训练的低资源文本智能评阅方法和装置
CN116306875A (zh) * 2023-05-18 2023-06-23 成都理工大学 基于空间预学习与拟合的排水管网样本增量学习方法
CN116977635A (zh) * 2023-07-19 2023-10-31 中国科学院自动化研究所 类别增量语义分割学习方法及语义分割方法

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114386482A (zh) * 2021-12-15 2022-04-22 同济大学 一种基于半监督增量学习的图片分类***及分类方法
CN114386482B (zh) * 2021-12-15 2023-09-26 同济大学 一种基于半监督增量学习的图片分类***及分类方法
CN114254702A (zh) * 2021-12-16 2022-03-29 南方电网数字电网研究院有限公司 母线负荷异常数据识别方法、装置、设备、介质和产品
CN114785890A (zh) * 2021-12-31 2022-07-22 北京泰迪熊移动科技有限公司 骚扰电话识别方法及装置
CN114580484A (zh) * 2022-04-28 2022-06-03 西安电子科技大学 一种基于增量学习的小样本通信信号自动调制识别方法
CN115438755A (zh) * 2022-11-08 2022-12-06 腾讯科技(深圳)有限公司 分类模型的增量训练方法、装置和计算机设备
CN115438755B (zh) * 2022-11-08 2024-04-02 腾讯科技(深圳)有限公司 分类模型的增量训练方法、装置和计算机设备
CN115827879A (zh) * 2023-02-15 2023-03-21 山东山大鸥玛软件股份有限公司 基于样本增强和自训练的低资源文本智能评阅方法和装置
CN116306875A (zh) * 2023-05-18 2023-06-23 成都理工大学 基于空间预学习与拟合的排水管网样本增量学习方法
CN116306875B (zh) * 2023-05-18 2023-08-01 成都理工大学 基于空间预学习与拟合的排水管网样本增量学习方法
CN116977635A (zh) * 2023-07-19 2023-10-31 中国科学院自动化研究所 类别增量语义分割学习方法及语义分割方法
CN116977635B (zh) * 2023-07-19 2024-04-16 中国科学院自动化研究所 类别增量语义分割学习方法及语义分割方法

Similar Documents

Publication Publication Date Title
CN113344144A (zh) 半监督的小样本类别增量学习方法、装置及分类识别方法
CN104217225B (zh) 一种视觉目标检测与标注方法
CN113688665B (zh) 一种基于半监督迭代学习的遥感影像目标检测方法及***
CN109086811B (zh) 多标签图像分类方法、装置及电子设备
JP2018097807A (ja) 学習装置
CN112734803B (zh) 基于文字描述的单目标跟踪方法、装置、设备及存储介质
CN112052818A (zh) 无监督域适应的行人检测方法、***及存储介质
KR20230171966A (ko) 이미지 프로세싱 방법 및 장치 및 컴퓨터 판독 가능 저장 매체
CN114175068A (zh) 一种通过使用自适应超参数集的多阶段学习对自动驾驶汽车的机器学习网络进行设备上学习的方法及使用其的设备上学习装置
CN112541372A (zh) 一种困难样本筛选方法及装置
CN115641529A (zh) 基于上下文建模与背景抑制的弱监督时序行为检测方法
CN115456166A (zh) 一种无源域数据的神经网络分类模型知识蒸馏方法
CN111160526A (zh) 基于mape-d环形结构的深度学习***在线测试方法与装置
CN113283467A (zh) 一种基于平均损失和逐类选择的弱监督图片分类方法
CN113128410A (zh) 一种基于轨迹关联学习的弱监督行人重识别方法
CN113177554A (zh) 甲状腺结节识别与分割方法、***、存储介质及设备
CN116016365B (zh) 一种加密流量下基于数据包长度信息的网页识别方法
CN116977859A (zh) 基于多尺度图像切割和实例困难度的弱监督目标检测方法
CN111914949A (zh) 基于强化学习的零样本学习模型的训练方法及装置
CN113469176B (zh) 一种目标检测模型训练方法、目标检测方法及其相关设备
Alfaz et al. A deep convolutional neural network based approach to classify and detect crack in concrete surface using xception
CN113408546B (zh) 基于相互全局上下文注意力机制的单样本目标检测方法
CN109767457A (zh) 在线多示例学习目标跟踪方法、终端设备及存储介质
Sirhan et al. Multilabel CNN model for asphalt distress classification
CN112001211B (zh) 对象检测方法、装置、设备及计算机可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20210903