CN112288004A - 一种无需一致性约束的半监督方法及移动终端 - Google Patents

一种无需一致性约束的半监督方法及移动终端 Download PDF

Info

Publication number
CN112288004A
CN112288004A CN202011175534.XA CN202011175534A CN112288004A CN 112288004 A CN112288004 A CN 112288004A CN 202011175534 A CN202011175534 A CN 202011175534A CN 112288004 A CN112288004 A CN 112288004A
Authority
CN
China
Prior art keywords
distribution
data
obtaining
feature extractor
data set
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202011175534.XA
Other languages
English (en)
Other versions
CN112288004B (zh
Inventor
毛经纬
罗智泉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chinese University of Hong Kong CUHK
Original Assignee
Chinese University of Hong Kong CUHK
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chinese University of Hong Kong CUHK filed Critical Chinese University of Hong Kong CUHK
Priority to CN202011175534.XA priority Critical patent/CN112288004B/zh
Publication of CN112288004A publication Critical patent/CN112288004A/zh
Application granted granted Critical
Publication of CN112288004B publication Critical patent/CN112288004B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/217Validation; Performance evaluation; Active pattern learning techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请提供一种无需一致性约束的半监督方法及移动终端,该方法包括:预设数据集和分类模型,数据集包括有标签数据集和无标签数据集,分类模型包括特征抽取器;基于梯度的迭代优化算法,在分类模型中对数据集进行最小化问题的迭代,得到最小化分布信息;在分类模型中对数据集进行最大化问题的迭代,得到最大化分布信息;根据最小化分布信息、最大化分布信息和无需一致性约束半监督算法公式得到计算结果。通过将有标签数据在特征空间和无标签数据在特征空间的经验分布之间的距离来约束特征抽取器的训练,使得特征抽取器让有标签数据在特征空间分布和无标签数据特征分布靠近,提升模型对于真实分布数据的分类效果,提升了模型的泛化能力。

Description

一种无需一致性约束的半监督方法及移动终端
技术领域
本申请涉及深度学习技术领域,具体涉及一种无需一致性约束的半监督方法及移动终端。
背景技术
半监督学习算法是指可以同时利用有标签数据和无标签数据进行学习的一类算法,通常用于有大量无标签数据但是只有少量有标签数据的场景中。通过设法利用无标签数据,半监督学习可以达到比有监督学习算法更好有时甚至是好很多的效果。
据我们所知,半监督学习算法最早可以追溯到上世纪60年代。那时候的思想是自训练,即先用有标签数据训练一个初始模型,然后用这个初始模型给一部分无标签数据打上标签,然后再用这些打上标签的数据和有标签数据一起训练第二个模型,这样迭代一定次数。
自2012年以来,有监督深度学习算法在图像分类、语音识别和机器翻译等领域取得了重大突破。近些年来,半监督深度学习引起了越来越多研究人员的关注并有一系列算法被提出来。比如2017年提出的派模型和即时集成算法,2018年提出的Mean Teacher算法和VAT算法,以及2019年提出的ICT算法。
应用于深度学***滑的,基于这个假设,它们会对每个无标签输入数据定义两个输出,并把这两个输出的距离作为正则项。这些算法的区别在于它们定义这两个输出的方式不一样。
本申请的发明人在长期研发中发现,现有的半监督深度学***滑模型具有好的泛化能力,因此把平滑性作为模型训练的一个辅助目标。虽然在这某些实验中,这些算法表现出了有效性,但是它们基于的这一假设目前还没有在理论上被证明成立,导致模型在数据真实分布上的效果不佳,模型的泛化能力较低。
发明内容
本申请提供一种无需一致性约束的半监督方法及移动终端,以解决现有技术中基于假设的模型在数据真实分布上的效果不佳,模型的泛化能力较低的问题。
为解决上述技术问题,本申请采用的一个技术方案是:提供无需一致性约束的半监督方法,所述方法包括:
预设数据集和分类模型,所述数据集包括有标签数据集和无标签数据集,所述分类模型包括特征抽取器;
基于梯度的迭代优化算法,在所述分类模型中对所述数据集进行最小化问题的迭代,得到最小化分布信息;
基于梯度的迭代优化算法,在所述分类模型中对所述数据集进行最大化问题的迭代,得到最大化分布信息;
根据所述最小化分布信息、所述最大化分布信息和无需一致性约束半监督算法公式得到计算结果。
为解决上述技术问题,本申请采用的另一个技术方案是:提供一种移动终端,所述移动终端包括相互耦接的处理器和存储器,所述存储器用于存储计算机程序,所述处理器用于加载所述计算机程序并执行。
为解决上述技术问题,本申请采用的又一个技术方案是:提供一种计算机存储介质,其上存有计算机程序,所述计算机程序用于实现上述实施方式中任一项方法的步骤。
本申请的有益效果是:区别于现有技术的情况,本申请提供一种无需一致性约束的半监督方法及移动终端,该方法包括:预设数据集和分类模型,数据集包括有标签数据集和无标签数据集,分类模型包括特征抽取器;基于梯度的迭代优化算法,在分类模型中对数据集进行最小化问题的迭代,得到最小化分布信息;基于梯度的迭代优化算法,在分类模型中对数据集进行最大化问题的迭代,得到最大化分布信息;根据最小化分布信息、最大化分布信息和无需一致性约束半监督算法公式得到计算结果。通过将有标签数据在特征空间和无标签数据在特征空间的经验分布之间的距离作为正则项来约束特征抽取器的训练,使得特征抽取器在学习抽取特征用于分类的同时兼顾让有标签数据在特征空间分布和无标签数据特征分布靠近,从而提升模型对于真实分布数据的分类效果,即提升了模型的泛化能力,解决了现有技术中基于假设的模型在数据真实分布上的效果不佳,模型的泛化能力较低的问题。
附图说明
为了更清楚地说明申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的情况下,还可以根据这些附图获得其他的附图,其中:
图1是本申请一种无需一致性约束的半监督方法一实施例的流程示意图;
图2是本申请一种无需一致性约束的半监督方法另一实施例的流程示意图;
图3是本申请一种移动终端一实施例的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动情况下所获得的所有其他实施例,均属于本申请保护的范围。
需要说明,若本申请实施例中有涉及方向性指示(诸如上、下、左、右、前、后......),则该方向性指示仅用于解释在某一特定姿态(如附图所示)下各部件之间的相对位置关系、运动情况等,如果该特定姿态发生改变时,则该方向性指示也相应地随之改变。
另外,若本申请实施例中有涉及″第一″、″第二″等的描述,则该″第一″、″第二″等的描述仅用于描述目的,而不能理解为指示或暗示其相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有″第一″、″第二″的特征可以明示或者隐含地包括至少一个该特征。另外,各个实施例之间的技术方案可以相互结合,但是必须是以本领域普通技术人员能够实现为基础,当技术方案的结合出现相互矛盾或无法实现时应当认为这种技术方案的结合不存在,也不在本申请要求的保护范围之内。
请参阅图1,图1是本申请一种无需一致性约束的半监督方法一实施例的流程示意图。本实施例揭示的方法包括以下步骤:
S11:预设数据集和分类模型,数据集包括有标签数据集和无标签数据集,分类模型包括特征抽取器。
在神经网络中预设数据集和分类模型,在本实施例中,输入数据是d维,包含Nc个类别,每个数据点属于多个类别中的某一个。分类模型设定为能够将输入空间转化为类别分布的一个参数化的函数,在本实施例中的函数为
Figure BDA0002748463860000051
用于对输入数据进行分类。由该函数可知,M可以看成由两部分组成,即M=C(F())。其中,F和C都是参数化的函数,F称为特征抽取器,C称为分类器。
假设特征空间的维度是k,那么特征抽取器F是一个从数据空间映射到特征空间的参数化的函数,即F(·;θf):Rd→Rk。而分类器C则是一个从特征空间映射到类别分布的参数化函数,即
Figure BDA0002748463860000052
Figure BDA0002748463860000053
输入数据为数据集,在输入数据中存在有标签数据和无标签数据,相应的,数据集中包含有标签数据集和无标签数据集。在本实施例中,将输入数据的真实分布记为P*,有标签数据的经验分布记为Pl,无标签数据的经验分布记为Pu。这三个分布经过F映射后的分布分别记为H*,Hl和Hu。若期望分类模型对来自真实分布的数据具有好的分类效果,则需要分类器C对来自分布H*的数据有好的分类效果。
若有标签数据的量很大,那么Pl可以近似P*,相应地,Hl可以近似H*。但是在有标签数据少的时候,Pl和P*很不一样,因此Hl和H*一般来讲也很不一样,从而导致分类器C对H*的数据无法分类准确。数据在特征空间的分布是由特征抽取器F决定,而F是参数化的。无标签数据量大的情况下,Pu可以近似P*,从而Hu可以近似H*。因此在本实施例中,可以通过调整特征抽取器F的参数来实现Hl和H*的靠近。
因此在本实施例中,转化为minmax问题来解决,即通过交替进行最小化问题和最大化问题的求解。
S12:基于梯度的迭代优化算法,在分类模型中对数据集进行最小化问题的迭代,得到最小化分布信息。
在本实施例中,对于最大化问题和最小化问题的求解,都使用基于梯度的迭代优化算法。在分类模型中对数据集进行最小化问题的迭代,得到最小化分布信息,可以包括有标签数据和无标签数据分别在经过特征抽取器F后的分布。其中,假设最小化问题的迭代步数为N,每一步最小化问题的迭代中会进行n步最大化问题的迭代。
S13:基于梯度的迭代优化算法,在分类模型中对数据集进行最大化问题的迭代,得到最大化分布信息。
在进行最小化问题的迭代后,基于梯度的迭代优化算法进行n步最大化问题求解的迭代,得到最大化分布信息。
S14:根据最小化分布信息、最大化分布信息和无需一致性约束半监督算法公式得到计算结果。
在得到最小化分布信息、最大化分布信息后,根据本实施例中无需一致性约束半监督算法公式进行最小化问题和最大化问题的求解。
本申请提供一种无需一致性约束的半监督方法,该方法包括:预设数据集和分类模型,数据集包括有标签数据集和无标签数据集,分类模型包括特征抽取器;基于梯度的迭代优化算法,在分类模型中对数据集进行最小化问题的迭代,得到最小化分布信息;基于梯度的迭代优化算法,在分类模型中对数据集进行最大化问题的迭代,得到最大化分布信息;根据最小化分布信息、最大化分布信息和无需一致性约束半监督算法公式得到计算结果。通过将有标签数据在特征空间和无标签数据在特征空间的经验分布之间的距离作为正则项来约束特征抽取器的训练,使得特征抽取器在学习抽取特征用于分类的同时兼顾让有标签数据在特征空间分布和无标签数据特征分布靠近,从而提升模型对于真实分布数据的分类效果,即提升了模型的泛化能力。
请参阅图2,图2是本申请一种无需一致性约束的半监督方法另一实施例的流程示意图。本实施例揭示的方法包括以下步骤:
S21:预设数据集和分类模型,数据集包括有标签数据集和无标签数据集,分类模型包括特征抽取器。
S22:基于梯度的迭代优化算法,在分类模型中对数据集进行最小化问题的迭代,得到最小化分布信息。
最小化问题的迭代步数为N,每一步最小化问题的迭代中会进行n步最大化问题的迭代。具体来说,最小化问题每一步迭代步骤包括步骤S221~S224。
S221:在有标签数据集中进行采样,得到第一数量个有标签数据。
在有标签数据集中采样B个有标签数据,根据公式(1)得到有标签数据。
Figure BDA0002748463860000071
其中,B为第一数量,j表示第j个样本,1表示有标签数据,x表示输入数据,y表示图片类别;
Figure BDA0002748463860000072
表示第j个有标签数据,
Figure BDA0002748463860000073
表示第j个有标签图片类别。比如在图像分类任务中,x就是图片,y就是图片的类别,如猫、狗等。
S222:根据有标签数据和特征抽取器得到第一分布。
将公式(1)中的有标签数据
Figure BDA0002748463860000074
输入特征抽取器F,根据公式(2)得到第一分布。
Figure BDA0002748463860000075
其中,
Figure BDA0002748463860000081
为第一分布,F为特征抽取器。
S223:在无标签数据集中进行采样,得到第一数量个无标签数据。
无标签数据集中采样B个无标签数据,根据公式(3)得到无标签数据。
Figure BDA0002748463860000082
其中,u表示无标签数据,j表示第j个样本,
Figure BDA0002748463860000083
表示第j个无标签数据
S224:根据无标签数据和特征抽取器得到第二分布。
将公式(3)中的无标签数据
Figure BDA0002748463860000084
输入特征抽取器F,根据公式(4)得到第二分布。
Figure BDA0002748463860000085
其中,
Figure BDA0002748463860000086
为第二分布,F为特征抽取器。
S23:基于梯度的迭代优化算法,在分类模型中对数据集进行最大化问题的迭代,得到最大化分布信息。
在进行n步最大化问题求解的迭代时,具体可以包括步骤S231~S236。
S231:根据第一分布、第二分布和域批判器得到第一损失。
将第一分布和第二分布输入域批判器D,根据公式(5)计算得到第一损失。
Figure BDA0002748463860000087
其中,D为域批判器。
S232:计算第一分布和第二分布之间的插值。
根据公式(6)计算第一分布和第二分布之间的插值。
Figure BDA0002748463860000091
其中,α是在[0,1]均匀分布采样得到的一个值。
S233:根据插值和域批判器得到第二损失。
根据公式(7)计算第二损失。
Figure BDA0002748463860000092
S234:根据第一损失、第二损失计算域批判器中第一参数的梯度,更新域批判器中第一参数的梯度。
得到第一损失、第二损失之后,就可以计算最大化问题中目标函数关于优化变量(即域批判器的第一参数)的梯度然后对域批判器的第一参数进行一次更新。
S235:根据第一分布、第二分布和域批判器再次计算第一损失。
域批判器D经过上述n次更新之后,将第一分布
Figure BDA0002748463860000093
和第二分布
Figure BDA0002748463860000094
输入域批判器D中计算第一损失。
S236:根据第一分布和特征抽取器,得到监督损失。
将第一分布
Figure BDA0002748463860000095
输入特征抽取器C,根据公式(8)计算监督损失,
Figure BDA0002748463860000096
其中,Lsup为监督损失,C为分类器。
得到Lsup和第一损失之后,根据公式(9)得到最小化问题的目标函数。
L=Lsup+ω(T)·Lwd
(9)
其中,ω(T)是一个随最小化问题迭代步数变化的函数。
S24:根据最小化分布信息、最大化分布信息和无需一致性约束半监督算法公式得到计算结果。
根据公式(10)计算得到计算结果。
Figure BDA0002748463860000101
其中,θf为特征抽取器的第二参数,θc为分类器的第三参数,θd为域批判器的第一参数,γ为加权参数。
S25:计算特征抽取器的第二参数的梯度、分类器的第三参数的梯度,对第二参数和第三参数进行更新。
本申请提供一种无需一致性约束的半监督方法,该方法包括:预设数据集和分类模型,数据集包括有标签数据集和无标签数据集,分类模型包括特征抽取器;在有标签数据集中进行采样,得到第一数量个有标签数据;根据有标签数据和特征抽取器得到第一分布;在无标签数据集中进行采样,得到第一数量个无标签数据;根据无标签数据和特征抽取器得到第二分布;基于梯度的迭代优化算法,在分类模型中对数据集进行最大化问题的迭代,得到最大化分布信息;根据最小化分布信息、最大化分布信息和无需一致性约束半监督算法公式得到计算结果。通过将有标签数据在特征空间和无标签数据在特征空间的经验分布之间的距离作为正则项来约束特征抽取器的训练,使得特征抽取器在学习抽取特征用于分类的同时兼顾让有标签数据在特征空间分布和无标签数据特征分布靠近,从而提升模型对于真实分布数据的分类效果,即提升了模型的泛化能力。
对应上述的方法,本申请提出一种移动终端,请参阅图3,图3是本申请一种移动终端一实施例的结构示意图。本申请揭示的移动终端100包括相互耦接的存储器12和处理器14,存储器12用于存储计算机程序,处理器14用于执行计算机程序实现上述实施方式中任一项方法的步骤。
具体来说,处理器14用于:
预设数据集和分类模型,数据集包括有标签数据集和无标签数据集,分类模型包括特征抽取器。
基于梯度的迭代优化算法,在分类模型中对数据集进行最小化问题的迭代,得到最小化分布信息。
基于梯度的迭代优化算法,在分类模型中对数据集进行最大化问题的迭代,得到最大化分布信息。
根据最小化分布信息、最大化分布信息和无需一致性约束半监督算法公式得到计算结果。
本实施例移动终端100能够提升模型对于真实分布数据的分类效果,即提升了模型的泛化能力。
在本申请所提供的几个实施方式中,应该理解到本申请所揭露的***,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施方式仅仅是示意性的,例如,所述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个***,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施方式方案的目的。
另外,在本申请各个实施方式中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器(processor)执行本申请各个实施方式所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上仅为本申请的实施方式,并非因此限制本申请的专利范围,凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本申请的专利保护范围内。

Claims (10)

1.一种无需一致性约束的半监督方法,其特征在于,所述方法包括:
预设数据集和分类模型,所述数据集包括有标签数据集和无标签数据集,所述分类模型包括特征抽取器;
基于梯度的迭代优化算法,在所述分类模型中对所述数据集进行最小化问题的迭代,得到最小化分布信息;
基于梯度的迭代优化算法,在所述分类模型中对所述数据集进行最大化问题的迭代,得到最大化分布信息;
根据所述最小化分布信息、所述最大化分布信息和无需一致性约束半监督算法公式得到计算结果。
2.根据权利要求1所述的方法,其特征在于,基于梯度的迭代优化算法,在所述分类模型中对所述数据集进行最小化问题的迭代,得到最小化分布信息的步骤包括:
在所述有标签数据集中进行采样,得到第一数量个有标签数据;
根据所述有标签数据和所述特征抽取器得到第一分布;
在所述无标签数据集中进行采样,得到第一数量个无标签数据;
根据所述无标签数据和所述特征抽取器得到第二分布。
3.根据权利要求2所述的方法,其特征在于,在所述有标签数据集中进行采样,得到第一数量个有标签数据的步骤包括:
根据公式(1)得到所述有标签数据,
Figure FDA0002748463850000011
其中,B为第一数量,j表示第j个样本,1表示有标签数据,x表示输入数据,y表示图片类别;
Figure FDA0002748463850000021
表示第j个有标签数据,
Figure FDA0002748463850000022
表示第j个有标签图片类别;
根据所述有标签数据和所述特征抽取器得到第一分布的步骤包括:
Figure FDA0002748463850000023
输入所述特征抽取器,根据公式(2)得到第一分布,
Figure FDA0002748463850000024
其中,
Figure FDA0002748463850000025
为所述第一分布,F为所述特征抽取器。
4.根据权利要求3所述的方法,其特征在于,在所述无标签数据集中进行采样,得到第一数量个无标签数据的步骤包括:
根据公式(3)得到所述无标签数据,
Figure FDA0002748463850000026
其中,u表示无标签数据,j表示第j个样本,
Figure FDA0002748463850000027
表示第j个无标签数据;
根据所述无标签数据和所述特征抽取器得到第二分布的步骤包括:
Figure FDA0002748463850000028
输入所述特征抽取器,根据公式(4)得到第二分布,
Figure FDA0002748463850000029
其中,
Figure FDA00027484638500000210
为所述第二分布,F为所述特征抽取器。
5.根据权利要求4所述的方法,其特征在于,基于梯度的迭代优化算法,在所述分类模型中对所述数据集进行最大化问题的迭代,得到最大化分布信息的步骤包括:
根据所述第一分布、所述第二分布和域批判器得到第一损失;
计算所述第一分布和所述第二分布之间的插值;
根据所述插值和所述域批判器得到第二损失;
根据所述第一损失、所述第二损失计算所述域批判器中第一参数的梯度,更新所述域批判器中所述第一参数的梯度;
根据所述第一分布、所述第二分布和所述域批判器再次计算所述第一损失;
根据所述第一分布和所述特征抽取器,得到监督损失。
6.根据权利要求5所述的方法,其特征在于,根据所述第一分布、所述第二分布和域批判器得到第一损失的步骤包括:
将所述第一分布和所述第二分布输入所述域批判器,根据公式(5)计算得到所述第一损失,
Figure FDA0002748463850000031
其中,D为所述域批判器;
计算所述第一分布和所述第二分布之间的插值的步骤包括:
根据公式(6)计算所述第一分布和所述第二分布之间的插值,
Figure FDA0002748463850000032
其中,α是在[0,1]均匀分布采样得到的一个值;
根据所述插值和所述域批判器得到第二损失的步骤包括:
根据公式(7)计算所述第二损失,
Figure FDA0002748463850000033
Figure FDA0002748463850000041
根据所述第一分布和所述特征抽取器,得到监督损失的步骤包括:
根据公式(8)计算所述监督损失,
Figure FDA0002748463850000042
其中,Lsup为所述监督损失,C为分类器。
7.根据权利要求6所述的方法,其特征在于,根据所述第一分布和所述特征抽取器,得到监督损失的步骤之后包括:
根据公式(9)得到最小化问题的目标函数,
L=Lsup+ω(T).Lwd(9)
其中,ω(T)是一个随最小化问题迭代步数变化的函数。
8.根据权利要求1所述的方法,其特征在于,所述根据所述最小化分布信息、所述最大化分布信息和无需一致性约束半监督算法公式得到计算结果的步骤包括:
根据公式(10)计算得到计算结果,
Figure FDA0002748463850000043
其中,θf为所述特征抽取器的第二参数,θc为所述分类器的第三参数,θd为所述域批判器的所述第一参数,γ为加权参数;
所述方法进一步包括:
计算所述特征抽取器的所述第二参数的梯度、所述分类器的所述第三参数的梯度,对所述第二参数和所述第三参数进行更新。
9.一种移动终端,其特征在于,所述移动终端包括相互耦接的处理器和存储器,所述存储器用于存储计算机程序,所述处理器用于加载所述计算机程序并执行。
10.一种计算机存储介质,其上存有计算机程序,其特征在于,所述计算机程序用于实现上述权利要求1~8中任一项方法的步骤。
CN202011175534.XA 2020-10-28 2020-10-28 一种无需一致性约束的半监督方法及移动终端 Active CN112288004B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011175534.XA CN112288004B (zh) 2020-10-28 2020-10-28 一种无需一致性约束的半监督方法及移动终端

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011175534.XA CN112288004B (zh) 2020-10-28 2020-10-28 一种无需一致性约束的半监督方法及移动终端

Publications (2)

Publication Number Publication Date
CN112288004A true CN112288004A (zh) 2021-01-29
CN112288004B CN112288004B (zh) 2024-07-23

Family

ID=74372594

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011175534.XA Active CN112288004B (zh) 2020-10-28 2020-10-28 一种无需一致性约束的半监督方法及移动终端

Country Status (1)

Country Link
CN (1) CN112288004B (zh)

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110320387A1 (en) * 2010-06-28 2011-12-29 International Business Machines Corporation Graph-based transfer learning
CN107316049A (zh) * 2017-05-05 2017-11-03 华南理工大学 一种基于半监督自训练的迁移学习分类方法
CN108881196A (zh) * 2018-06-07 2018-11-23 中国民航大学 基于深度生成模型的半监督入侵检测方法
CN109034205A (zh) * 2018-06-29 2018-12-18 西安交通大学 基于直推式半监督深度学习的图像分类方法
CN109741328A (zh) * 2019-02-02 2019-05-10 东北大学 一种基于生成式对抗网络的汽车表观质量检测方法
CN110533193A (zh) * 2019-08-20 2019-12-03 武汉理工大学 半监督场景下特征和实例联合迁移学习方法
CN111160553A (zh) * 2019-12-23 2020-05-15 中国人民解放军军事科学院国防科技创新研究院 一种新的领域自适应学习方法
CN111832627A (zh) * 2020-06-19 2020-10-27 华中科技大学 抑制标签噪声的图像分类模型训练方法、分类方法及***

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110320387A1 (en) * 2010-06-28 2011-12-29 International Business Machines Corporation Graph-based transfer learning
CN107316049A (zh) * 2017-05-05 2017-11-03 华南理工大学 一种基于半监督自训练的迁移学习分类方法
CN108881196A (zh) * 2018-06-07 2018-11-23 中国民航大学 基于深度生成模型的半监督入侵检测方法
CN109034205A (zh) * 2018-06-29 2018-12-18 西安交通大学 基于直推式半监督深度学习的图像分类方法
CN109741328A (zh) * 2019-02-02 2019-05-10 东北大学 一种基于生成式对抗网络的汽车表观质量检测方法
CN110533193A (zh) * 2019-08-20 2019-12-03 武汉理工大学 半监督场景下特征和实例联合迁移学习方法
CN111160553A (zh) * 2019-12-23 2020-05-15 中国人民解放军军事科学院国防科技创新研究院 一种新的领域自适应学习方法
CN111832627A (zh) * 2020-06-19 2020-10-27 华中科技大学 抑制标签噪声的图像分类模型训练方法、分类方法及***

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
CHUNJIE ZHANG等: "Unsupervised and Semi-Supervised Image Classification With Weak Semantic Consistency", 《IEEE TRANSACTIONS ON MULTIMEDIA》, vol. 21, no. 10, pages 2482 - 2491, XP011747279, DOI: 10.1109/TMM.2019.2903628 *
WEIWEI SHI等: "Transductive Semi-Supervised Deep Learning using Min-Max Features", 《ECCV》, pages 1 - 17 *
任硕: "基于生成对抗网络的无监督图像翻译方法研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》, no. 2020, pages 138 - 537 *
李才子等: "面向心脏MRI分割的半监督空间一致性约束网络", 《计算机辅助设计与图形学学报》, vol. 32, no. 7, pages 1145 - 1153 *
沈建国: "一种高性能改进型半监督维数约减算法", 《西南师范大学学报(自然科学版)》, vol. 40, no. 11, pages 137 - 145 *

Also Published As

Publication number Publication date
CN112288004B (zh) 2024-07-23

Similar Documents

Publication Publication Date Title
Kim et al. Attract, perturb, and explore: Learning a feature alignment network for semi-supervised domain adaptation
WO2021120752A1 (zh) 域自适应模型训练、图像检测方法、装置、设备及介质
CN110163239B (zh) 一种基于超像素和条件随机场的弱监督图像语义分割方法
CN107103326B (zh) 基于超像素聚类的协同显著性检测方法
Tahir et al. An open-ended continual learning for food recognition using class incremental extreme learning machines
CN109063743B (zh) 基于半监督多任务学习的医疗数据分类模型的构建方法
CN110674323A (zh) 基于虚拟标签回归的无监督跨模态哈希检索方法及***
CN116644755B (zh) 基于多任务学习的少样本命名实体识别方法、装置及介质
CN111612100B (zh) 对象再识别方法、装置、存储介质及计算机设备
CN115731441A (zh) 基于数据跨模态迁移学习的目标检测和姿态估计方法
CN110889865A (zh) 一种基于局部加权稀疏特征选择的视频目标跟踪方法
CN111126464A (zh) 一种基于无监督域对抗领域适应的图像分类方法
Zhao et al. Feature and region selection for visual learning
CN113535947A (zh) 一种带有缺失标记的不完备数据的多标记分类方法及装置
CN112668482A (zh) 人脸识别训练方法、装置、计算机设备及存储介质
Ren et al. Deep metric learning via subtype fuzzy clustering
CN108388918B (zh) 具有结构保持特性的数据特征选择方法
CN113052236A (zh) 一种基于NASNet的肺炎图像分类方法
CN115797642B (zh) 基于一致性正则化与半监督领域自适应图像语义分割算法
CN111832435A (zh) 基于迁移与弱监督的美丽预测方法、装置及存储介质
CN112288004A (zh) 一种无需一致性约束的半监督方法及移动终端
CN114281985A (zh) 样本特征空间增强方法及装置
Yu et al. Shared subspace least squares multi-label linear discriminant analysis
CN114387489A (zh) 电力设备识别方法、装置和终端设备
CN115545181A (zh) 一种高效处理新增视图的深度多视图学习方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant