CN113139664A - 一种跨模态的迁移学习方法 - Google Patents

一种跨模态的迁移学习方法 Download PDF

Info

Publication number
CN113139664A
CN113139664A CN202110477456.7A CN202110477456A CN113139664A CN 113139664 A CN113139664 A CN 113139664A CN 202110477456 A CN202110477456 A CN 202110477456A CN 113139664 A CN113139664 A CN 113139664A
Authority
CN
China
Prior art keywords
data
classification
domain
modal
representing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110477456.7A
Other languages
English (en)
Other versions
CN113139664B (zh
Inventor
蒋鑫龙
陈前
陈益强
张腾
�谷洋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Institute of Computing Technology of CAS
Original Assignee
Institute of Computing Technology of CAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Institute of Computing Technology of CAS filed Critical Institute of Computing Technology of CAS
Priority to CN202110477456.7A priority Critical patent/CN113139664B/zh
Publication of CN113139664A publication Critical patent/CN113139664A/zh
Application granted granted Critical
Publication of CN113139664B publication Critical patent/CN113139664B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Medical Informatics (AREA)
  • Image Analysis (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明实施例提供了一种跨模态的迁移学习方法,该方法通过构建迁移学习模型,用全局领域判别模块对齐边缘分布,用局部类别判别模块细粒度地从类别角度对齐特征的条件分布,用局部模态判别模块细粒度地从模态角度对齐特征的条件分布,该模型架构基于对抗网络的迁移学习的思想,能在训练过程中适配跨模态迁移学习中边缘分布差异和条件分布差异,并利用对抗训练去自适应学到更多可迁移特征,从而提高分类模型的性能。

Description

一种跨模态的迁移学习方法
技术领域
本发明涉及机器学习、个性化适配领域,具体来说涉及跨模态迁移学习领域,更具体地说,涉及一种跨模态的迁移学习方法。
背景技术
随着计算资源和数据规模的爆发式增长,机器学习技术在理论方法和实际应用领域都取得了显著的进展。机器学习是人工智能中的重要方法,也是目前发展最迅速、效果最显著的方法。对于传统的机器学习技术,学习的目标是在给定充足训练数据的基础上来学习一个模型,然后将这个学习的模型应用到新的待测试数据上进行预测。然而,实际应用往往复杂多变,在不同场景、不同计算条件和不同的用户需求下具有极强的动态变化性,传统的机器学习方法难以在适应这些场景动态性的同时保证良好的模型效果。
传统机器学习的目标是希望构建一个尽可能通用的模型,使得模型对于不同的用户,不同的计算环境,不同的需求都可以表现出很好的预测性能,这就要求模型具有足够的泛化性能去适应不同的用户、不同的数据类型、和不同的需求来服务于现实应用。然而,由于每个用户的个性化需求不同,短期内无法用一个通用的模型去满足。针对不同的用户需求,需要对通用的模型加以改造和适配,使其更好地服务于人们的个性化需求。此外,对于海量的数据,需要更多的计算资源去存储和训练机器学习模型,为了获得更好的性能,一些常用的模型通常具有很高的计算复杂度,训练周期较长,而雄厚的计算资源通常掌握在一些大公司手上,绝大多数普通用户很难具有这些强计算能力,这也是机器学习模型构建者需要考虑的重要问题。
上述问题在一定程度上阻碍了机器学习技术的发展和广泛应用。迁移学习作为机器学习中的一个代表性方法应运而生,是机器学习中一个重要的研究方向,其区别于传统机器学习方法之处在于,通过找寻待标定数据和已知标签数据之间的联系,将某个领域上学习到的知识应用到不同但相关的领域中。迁移学习试图实现人通过类比学习的能力,是从当前的监督学习、半监督学习,进一步过渡到无监督学习的重要工具。迁移学习在解决数据分布动态变化、数据类别多样以及个性化学习的问题时具有明显的优势,可以大大增强机器学习模型的泛化能力。
在数据模态多样、特征多变的应用场景中,由于收集途径和难度的差异,多模态数据通常存在严重的非均衡性和动态性挑战,如何将源域充足的知识向目标域迁移,根据应用场景的数据模态和变化进行有效的跨模态迁移和任务推理已经成为亟待解决的重要问题。在跨模态的迁移学习中,多模态数据的边缘分布和条件分布对于迁移学习的贡献往往不同,自适应的表征边缘分布和条件分布的相对重要性困难,难以学到单模态深度特征与多模态特征分布之间更本质关系等问题。
发明内容
因此,本发明的目的在于克服上述现有技术的缺陷,提供一种跨模态的迁移学习方法。
本发明的目的是通过以下技术方案实现的:
根据本发明的第一方面,提供一种迁移学习模型,包括:分类模型,其是基于带类别标签的单模态的源域的数据预先训练得到的,包括:特征提取模块,用于根据输入样本数据提取样本的特征,和分类预测模块,用于根据样本的特征计算特征在各个类别上的概率分布;模态预测模块,其是基于带模态标签的多模态的目标域的数据预先训练得到的,用于根据样本的特征计算特征在各个模态上的概率分布;全局领域判别模块,用于根据域标签和样本的特征对齐源域和目标域的特征的边缘分布;局部领域判别模块,包括:局部类别判别模块,用于对多个类别分别基于样本的特征和特征在类别上的概率分布对齐源域和目标域的特征的条件分布,和局部模态判别模块,用于对多个模态分别对齐源域和目标域的特征的条件分布。
在本发明的一些实施例中,基于动态对抗因子自适应地调整源域和目标域之间数据特征分布的边缘分布和条件分布的重要度,减少源域和目标域之间数据特征分布的差异。
在本发明的一些实施例中,所述全局领域判别模块包括依次连接的梯度反转层和全局判别器,输入的样本的特征经过其梯度反转层后发送给全局判别器。
在本发明的一些实施例中,局部类别判别模块包括并行的多组梯度反转层和子类别判别器,其中,一组梯度反转层和子类别判别器对应一个类别,输入的样本的特征在输入该组的梯度反转层之前与其在对应类别上的概率分布进行基于注意力机制的加权操作。
在本发明的一些实施例中,所述局部模态判别模块包括并行的多组梯度反转层和子模态判别器,其中,一组梯度反转层和子模态判别器对应一个模态,输入的样本的特征在输入该组的梯度反转层之前与其在对应模态上的概率分布进行基于注意力机制的加权操作。
在本发明的一些实施例中,在训练过程中执行以下操作:通过特征提取模块对源域数据和目标域数据的样本提取特征;通过分类预测模块基于特征对源域数据和目标域数据中的样本进行类别分类,得到特征在各个类别上的概率分布和第一类别分类子损失;通过模态预测模块基于特征对源域数据和目标域数据中的样本进行模态分类,得到特征在各个模态上的概率分布和第一模态分类子损失;通过全局领域判别模块基于特征对源域数据和目标域数据中样本的域进行全局判别,得到全局子损失;通过局部类别判别模块基于特征和对应类别上的概率分布对样本进行细粒度的类别分类,得到第二类别分类子损失;通过局部模态判别模块基于特征和对应模态上的概率分布对样本进行细粒度的模态分类,得到第二模态分类子损失;通过第一类别分类子损失、第一模态分类子损失、全局子损失、第二类别分类子损失、第二模态分类子损失以及相应特征分布之间的最大均值差异距离计算总损失,根据总损失反向传播更新迁移学习模型的各个组成模块的权重参数。
在本发明的一些实施例中,按照以下公式计算总损失:
Figure BDA0003047804800000031
其中,
Figure BDA0003047804800000032
Figure BDA0003047804800000033
表示第一类别分类子损失,
Figure BDA0003047804800000034
表示第一模态分类子损失,d表示两个域的图像数据特征分布之间的最大均值差异距离,dmodal表示目标域中除图像数据以外的其余模态数据与图像数据的特征分布之间模态的最大均值差异距离,dlocal(p(c),q(c))表示两个域的数据的特征分布之间类别的最大均值差异距离,μ1、μ2、μ3是用于d、dmodal和dlocal(p(c),q(c))的超参数,λ表示用于平衡Ly
Figure BDA0003047804800000041
的第四超参数,ω表示动态对抗因子,Lg表示全局子损失,
Figure BDA0003047804800000042
表示第二类别分类子损失,
Figure BDA0003047804800000043
表示第二模态分类子损失。
在本发明的一些实施例中,按照以下公式在每批次更新动态对抗因子:
Figure BDA0003047804800000044
其中,
Figure BDA0003047804800000045
Figure BDA0003047804800000046
Ds表示源域数据集,Dt表示目标域数据集,C表示类别分类的类别数量,
Figure BDA0003047804800000047
表示来自源域中类别c的样本,
Figure BDA0003047804800000048
表示来自目标域中类别c的样本,M表示模态的数量,
Figure BDA0003047804800000049
表示来自源域中模态m的样本,
Figure BDA00030478048000000410
表示来自目标域中模态m的样本。
根据本发明的第二方面,提供一种基于第一方面所述的迁移学习模型进行迁移学习的方法,包括:A1、分批次用单模态的源域和多模态的目标域的数据对所述迁移学习模型进行训练,直至模型收敛,以调整分类模型的权重参数的方式将分类模型原来在单模态的源域学习的知识迁移到多模态的目标域。
在本发明的一些实施例中,所述基于第一方面所述的迁移学习模型进行迁移学习的方法还包括:A2、通过通道剪枝法对分类模型进行压缩,得到轻量化分类模型。
根据本发明的第三方面,还提供一种分类模型,所述分类模型包括特征提取模块和分类预测模块,所述特征提取模块用于对输入数据提取特征,所述分类预测模块用于基于特征对输入数据进行分类,输出预测的类别,其特征在于,所述分类模型是根第二方面所述的方法训练得到的分类模型或者经通道剪枝法剪枝后的轻量化分类模型。
附图说明
以下参照附图对本发明实施例作进一步说明,其中:
图1为根据本发明实施例的迁移学习模型的模型结构原理示意图;
图2为用于对边缘分布和条件分布进行介绍的示意图;
图3为根据本发明实施例的用于训练分类模型的方法的流程示意图。
具体实施方式
为了使本发明的目的,技术方案及优点更加清楚明白,以下结合附图通过具体实施例对本发明进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
如在背景技术部分提到的,在跨模态的迁移学习中,多模态数据的边缘分布和条件分布对于迁移学习的贡献往往不同,自适应的表征边缘分布和条件分布的相对重要性困难,难以学到单模态深度特征与多模态特征分布之间更本质关系等问题。因此,本发明构建迁移学习模型,用全局领域判别模块对齐边缘分布,用局部类别判别模块细粒度地从类别角度对齐特征的条件分布,用局部模态判别模块细粒度地从模态角度对齐特征的条件分布,该模型架构基于对抗网络的迁移学习的思想,能在训练过程中适配跨模态迁移学习中边缘分布差异和条件分布差异,并利用对抗训练去自适应学到更多可迁移特征,从而提高分类模型的性能。此外,本发明还基于动态对抗因子自适应地调整两个域之间数据特征分布的边缘分布和条件分布的重要度,减少两个域之间数据特征分布的差异,以使源域的知识逐渐迁移至多模态的目标域。本发明针对不同场景、不同数据模态和不同计算条件下具有极强的动态变化性,实现自适应的快速适配和动态个性化学习。
在对本发明的实施例进行具体介绍之前,先对其中使用到的部分术语作如下解释:
迁移学习,也称为归纳迁移、领域适配,其目标是将某个领域(源域)或任务上学习到的知识或模式应用到不同的但相关的领域(目标域)或问题中。
源域(Source Domain),是指在迁移学习中已有的知识所在的域。
目标域(Target Domain),是指在迁移学习中要学习的新知识所在的域。
边缘分布,可以是指多维数据概率分布的部分数据所服从的概率分布。
条件分布,可以是指数据和标签之间的后验概率分布。条件分布和学习任务有关。
参见图1,一种迁移学习模型,包括:分类模型,其是基于带类别标签的单模态的源域的数据预先训练得到的,所述分类模型包括:特征提取模块Gf,用于根据输入样本数据提取样本的特征,和分类预测模块
Figure BDA0003047804800000061
用于根据样本的特征计算特征在各个类别上的概率分布;模态预测模块
Figure BDA0003047804800000062
其是基于带模态标签的多模态的目标域的数据预先训练得到的,用于根据样本的特征计算特征在各个模态上的概率分布;全局领域判别模块Gdg,用于根据域标签和样本的特征对齐源域和目标域的特征的边缘分布;局部领域判别模块Gdl,包括:局部类别判别模块Gdlc,用于对多个类别分别基于样本的特征和特征在类别上的概率分布对齐源域和目标域的特征的条件分布,和局部模态判别模块Gdlm,用于对多个模态分别对齐源域和目标域的特征的条件分布。
此处通过图2来示意性说明边缘分布和条件分布,以便更直观地理解两个分布的含义:自适应迁移学习方法通常将目标域数据和源域数据通过一个深度神经网络提取特征,然后在这个特征空间中对两个领域的特征分布进行对齐(Alignment),希望通过特征分布对齐减少两个领域间的特征差异。在实际应用中,特征的边缘分布和条件分布对迁移学习的贡献往往不同。数据的边缘分布不同,就是数据整体不相似。数据的条件分布不同,就是数据整体相似,但是具体到每个类里,都不太相似。当两个领域分布非常不同时(图2中源域→目标域I),针对边缘分布的全局对齐显得更重要,而当边缘分布很相似(图2中源域→目标域II),这时候应该关注局部特征分布,即针对条件分布的局部对齐更加重要。
在该迁移学习模型中,单模态的源域(例如,为图像数据)和多模态的目标域(例如,包括图像数据以及非图像数据,如图1所示的图像、声音、文本、视频等数据或者其组合)的数据x输入到特征提取模块Gf,用以提取特征f(也可称特征图或者特性向量)。特征提取模块Gf连接于迁移学习模型的其余组成模块。该迁移学习模型的主要任务是训练分类模型将单模态的源域上学习到的分类知识迁移到多模态的目标域。分类包括但不限于动物分类、人物分类、物体分类。以动物分类为例,源域的图像数据包括不同动物的图像及对应的类别标签(例如,马、牛、猫、狗、猪)。目标域的图像数据包括不同动物的图像(没有类别标签或者可以在部分图像设置类别标签)。目标域的声音数据则是对应动物的叫声数据(可以在部分声音数据设置类别标签)。目标域的文本数据则是对应动物的描述文本(可以在部分文本数据设置类别标签)。目标域的视频数据则是对应动物的视频影像(可以在部分图像数据设置类别标签)。在输入到特征提取模块之前,可以将不同的模态数据转换为统一的数据形式,例如,将图像、声音、文本和视频均转换为N×N的数据矩阵,以便输入特征提取模块用神经网络进行处理。具体的转换方式有很多现有技术可用,本发明对此不作任何限定。
根据本发明的一个实施例,该迁移学习模型按照该结构形式进行组织的目的是:通过特征提取模块并行地对来自源域的单模态数据和目标域的多模态数据进行特征提取(分批次,每批次提取一部分源域数据和一部分目标域数据),将数据映射到特定的特征空间,使分类预测模块Gyc能够分辨出来自源域数据的类别的同时,使各领域判别模块无法区分数据来自哪个域,其中,让全局领域判别模块难以判断数据来自源域还是目标域,让局部类别判别模块难以判断数据来自某个特定的类别,让局部模态判别模块难以判断数据来自某个特定的模态,从而通过对抗迁移的思想减少两个域之间数据特征分布的差异,以使源域的知识逐渐迁移至多模态的目标域。对抗训练的过程相当于特征生成模块和判别模块(包括全局领域判别模块和局部领域判别模块)的博弈游戏,特征生成模块想要产生更具欺骗性的特征,在迁移学习领域里也代表更本质的特征,而判别模块想尽可能的判别输入的特征是来自源域还是目标域,以及判别来自某个模态,通过对抗训练,特征生成器会最小化源域和目标域的特征分布差异,以及不同模态的特征分别的差异,生成更加具有本质性的特征,从而在目标域的任务上达到更好的泛化性能。
根据本发明的一个实施例,特征提取模块Gf可以为深度神经网络。进一步地,特征提取模块所采用深度神经网络包括但不限于ResNet、AlexNet、VGG Net及其组合。提取特征时,将源域数据和目标域数据分为多个批次(Batch),每个批次通过特征提取模块获取该批次内源域数据和目标域数据对应的样本对应的特征。
根据本发明的一个实施例,分类预测模块
Figure BDA0003047804800000071
用于预测分类(标签),模态预测模块
Figure BDA0003047804800000072
用于预测模态(标签),因此,两者可以视为标签预测模块Gy的子模块。标签预测模块Gy用来对输入的源域数据提取的特征做分类,是一个有监督学习过程。
对于分类预测模块
Figure BDA0003047804800000073
其对应的第一类别分类子损失是一个标准的交叉熵损失,可以形式化地表示为:
Figure BDA0003047804800000081
其中,ns表示当前批次中来自源域的样本的数量,xi表示样本xi,Ds表示源域数据集,c表示类别,C表示源域数据的类别总数,
Figure BDA0003047804800000082
表示输入样本xi属于类别c的概率,Gf(·)表示特征提取模块的权重参数,
Figure BDA0003047804800000083
表示分类预测模块的权重参数。应当理解的是,
Figure BDA0003047804800000084
中的c仅是表示该损失是对应于类别分类的损失,并不是一个变量;
Figure BDA0003047804800000085
中的c仅是表示该模块是对应于类别分类的模块,并不是一个变量;
Figure BDA0003047804800000086
中的c是变量,c∈[1,C]。
对于模态预测模块
Figure BDA0003047804800000087
其对应的第一模态分类子损失
Figure BDA0003047804800000088
也是一个标准的交叉熵损失,可以形式化地表示为:
Figure BDA0003047804800000089
其中,nt表示当前批次中来自目标域的样本的数量,xi表示样本xi,Dt表示目标域数据集,m表示模态,M表示目标域数据的模态总数,
Figure BDA00030478048000000810
表示输入样本xi属于模态m的概率,Gf(·)表示特征提取模块的权重参数,
Figure BDA00030478048000000811
表示模态预测模块的权重参数。应当理解的是,
Figure BDA00030478048000000812
中的m仅是表示该损失是对应于模态分类的损失,并不是一个变量,
Figure BDA00030478048000000813
中的m仅是表示该模块是对应于模态分类的模块,并不是一个变量;
Figure BDA00030478048000000814
中的m是变量,m∈[1,M]。
分类预测模块在更新权重参数的过程中,还涉及到跨模态的知识共享和子领域自适应的过程,下面分别来进行说明。
(1)、跨模态知识共享
跨模态知识共享旨在将知识从源域中的单个模态转移到目标域中的所有模态,从而提供与模态无关的补充知识来促进跨模态的联合表示学习。特征提取模块将源域和目标域的多模态数据(例如,包括图像、音频、视频、文本等)映射到一个统一的特征空间中,得到多模态特征的联合表示R={RImage,RAudio,RVideo,…,RText}对于所有模态,R中的特征维数都是相同的,因此可以通过直接计算跨模态特征之间的相似性。
在进行跨模态知识迁移时,输入的样本主题或类别是密切相关的,联合表示中的各模态表征并行地输入迁移学习模型,假设源域拥有充足的图像数据,目标域拥有稀疏的多模态数据。首先,需要构建领域之间进行知识迁移的桥梁,例如,根据本发明的一个实施例,源域和目标域都存在的模态为图像的数据可以作为连接源域和目标域的桥梁,采用特征自适应方法,以最小化两个域之间的图像数据特征分布的最大均值差异(Maximum MeanDiscrepancy,MMD):
Figure BDA0003047804800000091
其中,
Figure BDA0003047804800000092
表示当前批次从源域中获取的数量为n的图像数据的特征,
Figure BDA0003047804800000093
指当前批次从目标域中获取的数量为m的图像数据特征,
Figure BDA0003047804800000094
指再生核希尔伯特空间(Reproducing Kernel Hilbert Space,RKHS),φ(·)是一个映射函数,用于把原变量映射到再生核希尔伯特空间中。通过最小化d,模型将被引导以匹配目标域的分布,以便源域中的知识可以有效地转移到目标域中。根据本发明的一个实施例,在迁移学习过程中,利用源域和目标域都具有的模态为图像的数据作为连接源域和目标域的关联点,采用特征自适应方法,以最小化两个域之间的图像数据的特征分布的最大均值差异。
在利用图像数据作为桥梁将源域和目标域知识进行连接后,构建跨模态的知识共享。跨模态的知识共享旨在对齐各种的表示(RImage,RAudio,RVideo,…,RText)并实现知识共享,根据任务目标分别计算目标域中各模态的MMD,目标域中除图像数据以外的其余模态数据与图像数据的特征分布之间模态的最大均值差异距离可表示为
Figure BDA0003047804800000095
其中,
Figure BDA0003047804800000096
表示当前批次从目标域中获取的数量为k的多模态数据特征,modal={Audio,Video,Text},
Figure BDA0003047804800000097
表示当前批次从目标域中获取的数量为m的图像数据特征。通过最小化dmodal,可以减少跨模态的分布差异,以实现跨模式的知识共享和迁移。
(2)、子领域自适应
在分类预测模块的基础上,本发明引入了子领域的概念,一个领域下可以依据一些条件,将相似的样本划分到一个子领域,比如使用类标签作为划分依据,同一类放到一个子领域,分别对相关的子领域进行对齐。基于数据的类别,将源域数据集Ds和目标域数据集Dt划分为C个子领域
Figure BDA0003047804800000098
Figure BDA0003047804800000101
对应的分布分别记为p(c)和q(c),其中c∈{1,2,…,C},代表来自C个不同类别的子领域。子领域的自适应使具有相同标签的样本的相关子领域实现了更加细粒度的分布对齐,在本发明中,采用局部的MMD方法,面向不同类别的数据实现更加细粒度的分布差异度量,细粒度地分布差异度量,两个域的数据的特征分布之间类别的最大均值差异距离可以形式化地表示为:
Figure BDA0003047804800000102
其中,
Figure BDA0003047804800000103
指再生核希尔伯特空间,φ(·)是一个映射函数,用于把原变量映射到再生核希尔伯特空间中。
Figure BDA0003047804800000104
表示源域数据
Figure BDA0003047804800000105
在类别c中所占的权重或比例,
Figure BDA0003047804800000106
表示目标域数据
Figure BDA0003047804800000107
在类别c中所占的权重或比例,则
Figure BDA0003047804800000108
Figure BDA0003047804800000109
都是加权求和项。
基于子领域自适应,能够根据类别将源域划分成若干子领域,以子领域对象细粒度地对源域单模态数据和目标域跨模态数据进行分布对齐和后续的对抗训练。
结合以上信息,标签预测模Gy的损失函数Ly可表示为:
Figure BDA00030478048000001010
其中,
Figure BDA00030478048000001011
表示第一类别分类子损失,
Figure BDA00030478048000001012
表示第一模态分类子损失,d表示两个域的图像数据特征分布之间的最大均值差异距离,dmodal表示目标域中除图像数据以外的其余模态数据与图像数据的特征分布之间模态的最大均值差异距离,dlocal(p(c),q(c))表示两个域的数据的特征分布之间类别的最大均值差异,μ1、μ2、μ3是用于d、dmodal和dlocal(p(c),q(c))的超参数。
根据本发明的一个实施例,全局领域判别模块Gdg可以包括依次连接的梯度反转层和全局判别器,输入的样本的特征经过其梯度反转层GRL后发送给全局判别器
Figure BDA00030478048000001013
全局领域判别模块Gdg的设计是用来对齐源域和目标域中特征的边缘分布,对输入的源域和目标域数据的特征进行全局判别,在训练过程中通过梯度反转层(Gradient Reversal Layer,GRL)进行负梯度反传,来对源域和目标域的数据进行全局特征适配,从而减小领域分布差异。全局领域判别模块Gdg对应的损失函数,全局子损失Lg可表示为:
Figure BDA0003047804800000111
其中,
Figure BDA0003047804800000112
表示全局判别器的损失,是一个标准的交叉熵损失,ns表示当前批次中来自源域的样本的数量,nt表示当前批次中来自目标域的样本的数量,Gdg(·)表示全局领域判别模块的权重参数,di代表输入样本的领域标签。例如,0表示样本来自源域,1表示样本来自目标域。
根据本发明的一个实施例,局部类别判别模块Gdl包括并行的多组梯度反转层GRL和子类别判别器
Figure BDA0003047804800000113
(相当于指代任意类别c对应的子类别判别器,
Figure BDA0003047804800000114
一组梯度反转层GRL和子类别判别器
Figure BDA0003047804800000115
对应一个类别c,输入的样本的特征在输入该组的梯度反转层GRL之前与其在对应类别上的概率分布进行基于注意力机制的加权操作。相当于局部领域判别模块可以被拆分为C个类别的子模块,包括梯度反转层GRL和子类别判别器
Figure BDA0003047804800000116
用于负责对齐该类别c的特征分布,由于无法获得目标域数据的类别标签,所以此处用输入特征经过Softmax函数后的概率分布来表示有多大权重的特征来自当前类别,这里隐式的用到了注意力机制。此处基于注意力机制的加权操作以更多地关注该组中的子类别判别器所判断的类别有关的特征,弱化或者遗忘与该组中的子类别判别器所判断的类别无关的特征,从而提高模型性能。类别判别模块对应的损失函数,第二类别分类子损失
Figure BDA0003047804800000117
表示为:
Figure BDA0003047804800000118
其中,
Figure BDA0003047804800000119
表示类别c的局部领域判别模块,
Figure BDA00030478048000001110
表示对应子类别判别器
Figure BDA00030478048000001111
的交叉熵损失,
Figure BDA00030478048000001112
表示输入样本的特征在类别c上的概率分布,di代表输入样本的领域标签。
根据本发明的一个实施例,局部模态判别模块Gdlm包括并行的多组梯度反转层GRL和子模态判别器
Figure BDA00030478048000001113
(相当于指代任意模态m对应的子模态判别器,
Figure BDA00030478048000001114
一组梯度反转层GRL和子模态判别器
Figure BDA00030478048000001115
对应一个模态m,输入的样本的特征在输入该组的梯度反转层GRL之前与其在对应模态上的概率分布进行基于注意力机制的加权操作。此处基于注意力机制的加权操作以更多地关注该组中的子模态判别器所判断的模态有关的特征,弱化或者遗忘与该组中的子模态判别器所判断的模态无关的特征,从而提高模型性能。源域和目标域数据存在非均衡性,源域标签充足,目标域标签往往不足或缺失;本发明中的迁移学习问题不是“冷启动问题”,目标域可以有部分标签可用作训练的,例如,对于目标域中一部分非图像数据,也标注其对应的分类标签用于训练。但是,模态和类别一样,人直观感觉容易区分,但是机器识别的时候往往要将它们进行编码(如one-hot),机器拿到的只是提取后的特征,无法直接判断所属的类别/模态,需要去估计,然后在训练过程中估计值不断逼近真实值,训练网络参数,最后利用训练好的参数,输入特征去推理得到类别/模态。因此,模态判别模块旨在区分不同的模态,同类别判别模块的划分思想相似,被划分为M个模态判别模块
Figure BDA0003047804800000121
M为模态种类的数量。类别判别模块对应的损失函数,第二模态分类子损失
Figure BDA0003047804800000122
可以表示为:
Figure BDA0003047804800000123
其中,
Figure BDA0003047804800000124
(·)表示模态m的局部领域判别模块的权重参数,modal={Audio,Video,…,Text},
Figure BDA0003047804800000125
表示对应子模态判别器
Figure BDA0003047804800000126
的交叉熵损失,
Figure BDA0003047804800000127
表示输入样本的特征在模态m上的概率分布,di代表输入样本的领域标签。
为了更好地减少两个域之间的数据特征分布的差异,提高模型的性能,根据本发明的一个实施例,迁移学习模型被配置为:基于动态对抗因子ω自适应地调整源域和目标域之间数据特征分布的边缘分布和条件分布的重要度,减少源域和目标域之间数据特征分布的差异。动态对抗因子ω用于简单、动态且定量地评估全局特征分布与局部特征分布的重要度,进而根据数据分布的差异化自适应地调整这两种分布的权重。全局特征分布和局部特征分布对应上述边缘分布和条件分布,可以用A-distance距离的标准定义式子计算全局领域判别模块的全局A-distance距离:
Figure BDA0003047804800000128
其中,A-distance距离用来估计不同分布之间的差异性,通常被用来计算两个领域数据的相似性程度,以便与实验结果进行验证对比。
局部A-distance距离分为类别和模态两部分,分别可计算为:
Figure BDA0003047804800000129
Figure BDA00030478048000001210
其中,
Figure BDA0003047804800000131
表示来自源域的类别c的样本,
Figure BDA0003047804800000132
表示来自目标域的类别c的样本,
Figure BDA0003047804800000133
表示来自源域的模态m的样本,
Figure BDA0003047804800000134
表示来自目标域的模态m的样本。假设m=0,1,2,3,其中,0表示图像,1表示声音,2表示文本,3表示视频。应当理解,本发明假设
Figure BDA0003047804800000135
样本均为单模态的图像数据。单模态的源域的样本
Figure BDA0003047804800000136
的m均为1。
根据本发明的一个实施例,迁移学习模型可以被配置为:按照以下公式在每批次更新动态对抗因子:
Figure BDA0003047804800000137
其中,
Figure BDA0003047804800000138
Figure BDA0003047804800000139
Ds表示源域数据集,Dt表示目标域数据集,C表示类别分类的类别数量,
Figure BDA00030478048000001310
表示来自源域中类别c的样本,
Figure BDA00030478048000001311
表示来自目标域中类别c的样本,M表示模态的数量,
Figure BDA00030478048000001312
表示来自源域中模态m的样本,
Figure BDA00030478048000001313
表示来自目标域中模态m的样本。在实际训练过程中,当ω→0,代表全局特征分布(对应于边缘分布)对齐更重要。当ω→1,代表两个领域之间的全局特征分布差异较小,每个类别的局部特征分布(对应于条件分布)差异占主导作用。但是在实际应用中,随着应用场景的不同,往往存在多个不同的目标域,这些领域各自数据分布差异性存在动态性,源域和目标域的全局特征分布和局部特征分布差异程度不确定,因此在这种情况下,通过学习动态对抗因子ω,使得本发明能够被成功应用到各种各样的实际迁移学习场景中,提高不同迁移学习场景下最终得到的分类模型的性能。
根据本发明的一个实施例,该迁移学习模型被配置为在迁移学习过程中:通过特征提取模块对源域数据和目标域数据的样本提取特征;通过分类预测模块基于特征对源域数据和目标域数据中的样本进行类别分类,得到特征在各个类别上的概率分布和第一类别分类子损失;通过模态预测模块基于特征对源域数据和目标域数据中的样本进行模态分类,得到特征在各个模态上的概率分布和第一模态分类子损失;通过全局领域判别模块基于特征对源域数据和目标域数据中样本的域进行全局判别,得到全局子损失;通过局部类别判别模块基于特征和对应类别上的概率分布对样本进行细粒度的类别分类,得到第二类别分类子损失;通过局部模态判别模块基于特征和对应模态上的概率分布对样本进行细粒度的模态分类,得到第二模态分类子损失;通过第一类别分类子损失、第一模态分类子损失、全局子损失、第二类别分类子损失、第二模态分类子损失以及相应特征分布之间的最大均值差异距离计算总损失,根据总损失反向传播更新迁移学习模型的各个组成模块的权重参数。根据本发明的一个实施例,迁移学习模型的训练目的,是让总损失不断减小,以提高模型性能。其中,特征提取模块和分类预测模块构成了一个前馈神经网络,特征提取器和模态预测模块构成了一个前馈神经网络。在特征提取模块后接入各个域判别器,中间通过一个梯度反转层(gradient reversal layer,GRL)连接(在反向传播优化过程中,从领域判别器到特征提取器的梯度需要乘以一个负常数)。在训练的过程中,对来自源域的带标签数据,网络不断最小化标签预测模块的损失;对来自源域和目标域的全部数据,网络不断最小化全局领域判别模块的损失和局部领域判别模块的损失。
根据本发明的一个实施例,迁移学习模型被配置为:按照以下公式计算总损失:
Figure BDA0003047804800000141
其中,
Figure BDA0003047804800000142
Figure BDA0003047804800000143
表示第一类别分类子损失,
Figure BDA0003047804800000144
表示第一模态分类子损失,d表示两个域的图像数据特征分布之间的最大均值差异距离,dmodal表示目标域中除图像数据以外的其余模态数据与图像数据的特征分布之间模态的最大均值差异距离,dlocal(p(c),q(c))表示两个域的数据的特征分布之间类别的最大均值差异,μ1、μ2、μ3是用于d、dmodal和dlocal(p(c),q(c))的超参数,λ表示用于平衡Ly
Figure BDA0003047804800000145
的第四超参数,ω表示动态对抗因子,Lg表示全局子损失,
Figure BDA0003047804800000146
表示第二类别分类子损失,
Figure BDA0003047804800000147
表示第二模态分类子损失。
根据本发明的一个实施例,参见图3,本发明还提供一种基于前述实施例的迁移学习模型进行迁移学习的方法,包括:A1、分批次用单模态的源域和多模态的目标域的数据对迁移学习模型进行训练,直至模型收敛,以调整分类模型的权重参数的方式将分类模型原来在单模态的源域学习的知识迁移到多模态的目标域。经过步骤A1,本发明可以获得经迁移学习的方式训练好的分类模型。为了提升模型训练的效率,获取到预先建立和训练好的基线模型后,要对这个基线模型利用通道剪枝的方法进行压缩。根据本发明的一个实施例,该用于训练分类模型的方法还包括:A2、通过通道剪枝法对经迁移学习的方式训练好的分类模型进行压缩,得到轻量化分类模型。通道剪枝方法的关键是如何准确评估哪些层的输出通道对于一个任务来说是重要的和哪些层的通道对于一个任务来说是不怎么重要的甚至冗余的,尤其是对于迁移学习,因为训练的时候,目标域数据并没有标签,所以不能直接用常规的通道剪枝评估方法。因此,在一个实施例中,可以采用发明人之前的申请的发明CN110598848A一种基于通道剪枝的用于加速迁移学习的方法中的通道剪枝法进行剪枝;为了说明书的简要,通过引用将该发明申请的全文作为本发明的一个实施例。由此,本发明考虑模型的计算复杂度,在降低计算复杂度的情况下,保证模型效果,得到轻量级、个性化模型,实现通用机器学习模型的跨模态、自适应、轻量化和个性化学习,保证模型在动态场景下的高准确度和快速适配。
根据本发明的一个实施例,本发明还提供一种分类模型,所述分类模型包括特征提取模块和分类预测模块,所述特征提取模块用于对输入数据提取特征,所述分类预测模块用于基于特征对输入数据进行分类,输出预测的类别,所述分类模型是根据前述方法训练得到的分类模型或者轻量化分类模型。
需要说明的是,虽然上文按照特定顺序描述了各个步骤,但是并不意味着必须按照上述特定顺序来执行各个步骤,实际上,这些步骤中的一些可以并发执行,甚至改变顺序,只要能够实现所需要的功能即可。
本发明可以是***、方法和/或计算机程序产品。计算机程序产品可以包括计算机可读存储介质,其上载有用于使处理器实现本发明的各个方面的计算机可读程序指令。
计算机可读存储介质可以是保持和存储由指令执行设备使用的指令的有形设备。计算机可读存储介质例如可以包括但不限于电存储设备、磁存储设备、光存储设备、电磁存储设备、半导体存储设备或者上述的任意合适的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、静态随机存取存储器(SRAM)、便携式压缩盘只读存储器(CD-ROM)、数字多功能盘(DVD)、记忆棒、软盘、机械编码设备、例如其上存储有指令的打孔卡或凹槽内凸起结构、以及上述的任意合适的组合。
以上已经描述了本发明的各实施例,上述说明是示例性的,并非穷尽性的,并且也不限于所披露的各实施例。在不偏离所说明的各实施例的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。本文中所用术语的选择,旨在最好地解释各实施例的原理、实际应用或对市场中的技术改进,或者使本技术领域的其它普通技术人员能理解本文披露的各实施例。

Claims (11)

1.一种迁移学习模型,其特征在于,包括:
分类模型,其是基于带类别标签的单模态的源域的数据预先训练得到的,包括:
特征提取模块,用于根据输入样本数据提取样本的特征,和
分类预测模块,用于根据样本的特征计算特征在各个类别上的概率分布;
模态预测模块,其是基于带模态标签的多模态的目标域的数据预先训练得到的,用于根据样本的特征计算特征在各个模态上的概率分布;
全局领域判别模块,用于根据域标签和样本的特征对齐源域和目标域的特征的边缘分布;
局部领域判别模块,包括:
局部类别判别模块,用于对多个类别分别基于样本的特征和特征在类别上的概率分布对齐源域和目标域的特征的条件分布,和
局部模态判别模块,用于对多个模态分别对齐源域和目标域的特征的条件分布。
2.根据权利要求1所述的迁移学习模型,其特征在于,基于动态对抗因子自适应地调整源域和目标域之间数据特征分布的边缘分布和条件分布的重要度,减少源域和目标域之间数据特征分布的差异。
3.根据权利要求1所述的迁移学习模型,其特征在于,所述全局领域判别模块包括依次连接的梯度反转层和全局判别器,输入的样本的特征经过其梯度反转层后发送给全局判别器。
4.根据权利要求1所述的迁移学习模型,其特征在于,局部类别判别模块包括并行的多组梯度反转层和子类别判别器,其中,一组梯度反转层和子类别判别器对应一个类别,输入的样本的特征在输入该组的梯度反转层之前与其在对应类别上的概率分布进行基于注意力机制的加权操作。
5.根据权利要求1所述的迁移学习模型,其特征在于,所述局部模态判别模块包括并行的多组梯度反转层和子模态判别器,其中,一组梯度反转层和子模态判别器对应一个模态,输入的样本的特征在输入该组的梯度反转层之前与其在对应模态上的概率分布进行基于注意力机制的加权操作。
6.根据权利要求1所述的迁移学习模型,其特征在于,在训练过程中执行以下操作:
通过特征提取模块对源域数据和目标域数据的样本提取特征;
通过分类预测模块基于特征对源域数据和目标域数据中的样本进行类别分类,得到特征在各个类别上的概率分布和第一类别分类子损失;
通过模态预测模块基于特征对源域数据和目标域数据中的样本进行模态分类,得到特征在各个模态上的概率分布和第一模态分类子损失;
通过全局领域判别模块基于特征对源域数据和目标域数据中样本的域进行全局判别,得到全局子损失;
通过局部类别判别模块基于特征和对应类别上的概率分布对样本进行细粒度的类别分类,得到第二类别分类子损失;
通过局部模态判别模块基于特征和对应模态上的概率分布对样本进行细粒度的模态分类,得到第二模态分类子损失;
通过第一类别分类子损失、第一模态分类子损失、全局子损失、第二类别分类子损失、第二模态分类子损失以及相应特征分布之间的最大均值差异距离计算总损失,根据总损失反向传播更新迁移学习模型的各个组成模块的权重参数。
7.根据权利要求6所述的迁移学习模型,其特征在于,按照以下公式计算总损失:
Figure FDA0003047804790000021
其中,
Figure FDA0003047804790000022
Figure FDA0003047804790000023
表示第一类别分类子损失,
Figure FDA0003047804790000024
表示第一模态分类子损失,d表示两个域的图像数据特征分布之间的最大均值差异距离,dmodal表示目标域中除图像数据以外的其余模态数据与图像数据的特征分布之间模态的最大均值差异距离,dlocal(p(c),q(c))表示两个域的数据的特征分布之间类别的最大均值差异距离,μ1、μ2、μ3是用于d、dmodal和dlocal(p(c),q(c))的超参数,λ表示用于平衡Ly
Figure FDA0003047804790000025
的第四超参数,ω表示动态对抗因子,Lg表示全局子损失,
Figure FDA0003047804790000026
表示第二类别分类子损失,
Figure FDA0003047804790000027
表示第二模态分类子损失。
8.根据权利要求7所述的迁移学习模型,其特征在于,按照以下公式在每批次更新动态对抗因子:
Figure FDA0003047804790000031
其中,
Figure FDA0003047804790000032
Figure FDA0003047804790000033
Ds表示源域数据集,Dt表示目标域数据集,C表示类别分类的类别数量,
Figure FDA0003047804790000034
表示来自源域中类别c的样本,
Figure FDA0003047804790000035
表示来自目标域中类别c的样本,M表示模态的数量,
Figure FDA0003047804790000036
表示来自源域中模态m的样本,
Figure FDA0003047804790000037
表示来自目标域中模态m的样本。
9.一种基于权利要求1至8任一项所述的迁移学习模型进行迁移学习的方法,其特征在于,包括:
A1、分批次用单模态的源域和多模态的目标域的数据对所述迁移学习模型进行训练,直至模型收敛,以调整分类模型的权重参数的方式将分类模型原来在单模态的源域学习的知识迁移到多模态的目标域。
10.根据权利要求9所述的方法,其特征在于,所述方法还包括:A2、通过通道剪枝法对分类模型进行压缩,得到轻量化分类模型。
11.一种分类模型,所述分类模型包括特征提取模块和分类预测模块,所述特征提取模块用于对输入数据提取特征,所述分类预测模块用于基于特征对输入数据进行分类,输出预测的类别,其特征在于,所述分类模型是根据权利要求9所述的方法训练得到的分类模型或者根据权利要求10所述的方法训练得到的轻量化分类模型。
CN202110477456.7A 2021-04-30 2021-04-30 一种跨模态的迁移学习方法 Active CN113139664B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110477456.7A CN113139664B (zh) 2021-04-30 2021-04-30 一种跨模态的迁移学习方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110477456.7A CN113139664B (zh) 2021-04-30 2021-04-30 一种跨模态的迁移学习方法

Publications (2)

Publication Number Publication Date
CN113139664A true CN113139664A (zh) 2021-07-20
CN113139664B CN113139664B (zh) 2023-10-10

Family

ID=76816498

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110477456.7A Active CN113139664B (zh) 2021-04-30 2021-04-30 一种跨模态的迁移学习方法

Country Status (1)

Country Link
CN (1) CN113139664B (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113567130A (zh) * 2021-07-28 2021-10-29 江南大学 基于设备多工况的轴承故障诊断方法
CN114139641A (zh) * 2021-12-02 2022-03-04 中国人民解放军国防科技大学 基于局部结构传递的多模态表征学习方法和***
CN114666218A (zh) * 2022-04-18 2022-06-24 中国科学技术大学苏州高等研究院 一种基于模型迁移的高效联邦训练方法和装置
CN114926716A (zh) * 2022-04-08 2022-08-19 山东师范大学 一种学习参与度识别方法、装置、设备及可读存储介质
CN115146675A (zh) * 2022-06-28 2022-10-04 江苏大学 一种深度多特征动态对抗的变工况下旋转机械迁移诊断方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106778804A (zh) * 2016-11-18 2017-05-31 天津大学 基于类别属性迁移学习的零样本图像分类方法
CN108960073A (zh) * 2018-06-05 2018-12-07 大连理工大学 面向生物医学文献的跨模态图像模式识别方法
US20190018933A1 (en) * 2016-01-15 2019-01-17 Preferred Networks, Inc. Systems and methods for multimodal generative machine learning
CN109993197A (zh) * 2018-12-07 2019-07-09 天津大学 一种基于深度端对端示例差异化的零样本多标签分类方法
CN111476805A (zh) * 2020-05-22 2020-07-31 南京大学 一种基于多重约束的跨源无监督域适应分割模型
CN112084891A (zh) * 2020-08-21 2020-12-15 西安理工大学 基于多模态特征与对抗学习的跨域人体动作识别方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20190018933A1 (en) * 2016-01-15 2019-01-17 Preferred Networks, Inc. Systems and methods for multimodal generative machine learning
CN106778804A (zh) * 2016-11-18 2017-05-31 天津大学 基于类别属性迁移学习的零样本图像分类方法
CN108960073A (zh) * 2018-06-05 2018-12-07 大连理工大学 面向生物医学文献的跨模态图像模式识别方法
CN109993197A (zh) * 2018-12-07 2019-07-09 天津大学 一种基于深度端对端示例差异化的零样本多标签分类方法
CN111476805A (zh) * 2020-05-22 2020-07-31 南京大学 一种基于多重约束的跨源无监督域适应分割模型
CN112084891A (zh) * 2020-08-21 2020-12-15 西安理工大学 基于多模态特征与对抗学习的跨域人体动作识别方法

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113567130A (zh) * 2021-07-28 2021-10-29 江南大学 基于设备多工况的轴承故障诊断方法
CN114139641A (zh) * 2021-12-02 2022-03-04 中国人民解放军国防科技大学 基于局部结构传递的多模态表征学习方法和***
CN114139641B (zh) * 2021-12-02 2024-02-06 中国人民解放军国防科技大学 基于局部结构传递的多模态表征学习方法和***
CN114926716A (zh) * 2022-04-08 2022-08-19 山东师范大学 一种学习参与度识别方法、装置、设备及可读存储介质
CN114666218A (zh) * 2022-04-18 2022-06-24 中国科学技术大学苏州高等研究院 一种基于模型迁移的高效联邦训练方法和装置
CN114666218B (zh) * 2022-04-18 2023-11-10 中国科学技术大学苏州高等研究院 一种基于模型迁移的高效联邦训练方法和装置
CN115146675A (zh) * 2022-06-28 2022-10-04 江苏大学 一种深度多特征动态对抗的变工况下旋转机械迁移诊断方法
CN115146675B (zh) * 2022-06-28 2023-09-26 江苏大学 一种深度多特征动态对抗的变工况下旋转机械迁移诊断方法

Also Published As

Publication number Publication date
CN113139664B (zh) 2023-10-10

Similar Documents

Publication Publication Date Title
Wang et al. Generalizing from a few examples: A survey on few-shot learning
Alzubaidi et al. A survey on deep learning tools dealing with data scarcity: definitions, challenges, solutions, tips, and applications
Hao et al. An end-to-end architecture for class-incremental object detection with knowledge distillation
CN113139664B (zh) 一种跨模态的迁移学习方法
CN109086658B (zh) 一种基于生成对抗网络的传感器数据生成方法与***
JP7213358B2 (ja) アイデンティティ検証方法、アイデンティティ検証装置、コンピュータ機器、及びコンピュータプログラム
CN112800292B (zh) 一种基于模态特定和共享特征学习的跨模态检索方法
CN109783666A (zh) 一种基于迭代精细化的图像场景图谱生成方法
CN110826639B (zh) 一种利用全量数据训练零样本图像分类方法
CN111460201B (zh) 一种基于生成性对抗网络的模态一致性跨模态检索方法
Liang et al. An expressive deep model for human action parsing from a single image
KR20190013011A (ko) 교사 모델로부터 학생 모델을 트레이닝하는데 사용되는 학습 데이터를 생성하는 장치 및 방법
CN110598759A (zh) 一种基于多模态融合的生成对抗网络的零样本分类方法
WO2023088174A1 (zh) 目标检测方法及装置
Wickramanayake et al. Explanation-based data augmentation for image classification
CN111985207A (zh) 一种访问控制策略的获取方法、装置及电子设备
Mehyadin et al. Classification based on semi-supervised learning: A review
Wang et al. Sin: Semantic inference network for few-shot streaming label learning
CN114511023A (zh) 分类模型训练方法以及分类方法
KR102272921B1 (ko) 확장형 카테고리를 위한 계층적 객체 검출 방법
Kamil et al. Literature Review of Generative models for Image-to-Image translation problems
Balgi et al. Contradistinguisher: a vapnik’s imperative to unsupervised domain adaptation
CN113723111B (zh) 一种小样本意图识别方法、装置、设备及存储介质
CN116108853A (zh) 一种基于知识迁移的跨领域情感分析方法及存储介质
Saad et al. Practical aspects of zero-shot learning

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant