CN110533193A - 半监督场景下特征和实例联合迁移学习方法 - Google Patents

半监督场景下特征和实例联合迁移学习方法 Download PDF

Info

Publication number
CN110533193A
CN110533193A CN201910770868.2A CN201910770868A CN110533193A CN 110533193 A CN110533193 A CN 110533193A CN 201910770868 A CN201910770868 A CN 201910770868A CN 110533193 A CN110533193 A CN 110533193A
Authority
CN
China
Prior art keywords
data
matrix
aiming field
sample
label
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910770868.2A
Other languages
English (en)
Inventor
黄浩然
文江辉
邓兵
肖新平
饶从军
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wuhan University of Technology WUT
Original Assignee
Wuhan University of Technology WUT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wuhan University of Technology WUT filed Critical Wuhan University of Technology WUT
Priority to CN201910770868.2A priority Critical patent/CN110533193A/zh
Publication of CN110533193A publication Critical patent/CN110533193A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/10Machine learning using kernel methods, e.g. support vector machines [SVM]

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Artificial Intelligence (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种半监督场景下特征和实例联合迁移学***衡分布适应方法和自学习实例迁移方法;并以此为基础构建特征和实例联合迁移学习方法FSJT。

Description

半监督场景下特征和实例联合迁移学习方法
技术领域
本发明涉及机器学习中迁移学习技术领域,具体地指一种半监督场景下特征和实例联合迁移学习方法。
背景技术
在2005年美国国防部高级研究计划局(DARPA)信息处理技术办公室的公告中正式给出迁移学习一个定义,即把其他任务中学到的知识和技能应用于新任务的能力。与多任务学习相比,迁移学习更关心的是目标任务,而不是同时学习所有的源任务和目标任务。源任务和目标任务在迁移学习中的角色不再是对称的。在迁移学习中需要研究的任务空间称为目标域(Target domain),而之前与之相关的任务空间称为源域(Source domain)。现阶段迁移学习的发展主要有以下几个方向,基于实例的迁移学习、基于特征的迁移学习,基于参数的迁移等。
基于实例的迁移较为直观,主要思想为:尽管源域数据不能直接利用,但数据的某些部分仍然可以与目标域中的已有的训练数据一起使用。如何筛选可以使用的源域数据也成为实例迁移学习的重点,例如经典的实例迁移方法TrAdaBoost算法。另外从分布的比值角度进行相关研究,提出传递迁移学习方法(Transitive Transfer Learning,TTL)等。
基于特征的迁移是指通过特征变换的方式对领域间的数据进行迁移,以减少源域和目标域的差距。迁移成分分析方法(Transfer Component Analysis,TCA)作为经典的特征迁移方法由Pan等人提出,该方法利用最大均值差异(Maximum Mean Discrepancy,MMD)作为领域间概率分布的度量准则,目标是将分布差异最小化。
目前,有学者在结合实例和特征的迁移方法中做出探索。Long等人提出在最小化分布距离的同时,加入实例选择的迁移联合匹配(Tranfer Joint Matching,TJM)方法,将实例和特征迁移学习方法进行了有机的结合。但是当前的迁移学习方法主要利用目标域中的少量带标签数据,或直接利用无标签数据。而传统的半监督学习同时利用一个领域内的两类数据,因此,如果在迁移学习中考虑半监督场景,就能学习到更多的目标领域已有的知识。
发明内容
本发明的目的是为了解决上述背景技术存在的问题,而提出的一种半监督场景下特征和实例联合迁移学习方法(Feature and Sample Jointed Transfer,简称FSJT),针对目标域有少量带标签数据和大量无标签数据的情形,且源域和目标域差异较大的情形,以期提升目标域上分类的准确率。
为实现上述目的,本发明所设计的半监督场景下特征和实例联合迁移学习方法,其特殊之处在于,所述方法包括以下步骤:
步骤1:定义模型中数据:给定一个领域,已知该领域中每一个数据所属类别用“0”或“1”表示,记为源域Ds,包含的n个样本用特征矩阵和类别标签向量形式表示为简记为{xs,ys};给定另一个领域,记为目标域Dt,其中m个样本组成带标签数据集记为不带标签数据集记为两类数据集共记为包含m+k个训练样本,且假设中样本数量不足以训练一个可靠的分类器;
假设特征空间Xs=Xt,即两个领域的特征种类与数量相同,类别空间Ys=Yt,但边缘分布Ps(xs)≠Pt(xt),条件分布Ps(ys|xs)≠Pt(yt|xt),目标是利用源域Ds中数据集{xs,ys}和目标域Dt中数据集学习目标域中未标注数据的类别其中r=1,...,l,n、m、k、l均为大于1的自然数;
步骤2:利用平衡参数μ,构建目标函数并进行化简求解得到:
其中min表示求目标函数最小值,s.t.表示目标函数的约束条件。tr()表示求矩阵的迹,X是由源域与目标域数据集组成的输入矩阵,且满足X=[xs,xt],其中映射函数ψ:由核函数K=ψ(X)Tψ(X)给出,λ为正则化系数,表示F范数的平方,平衡因子为μ,A表示转换矩阵,H=I-(1/n)1为中心矩阵,I∈R(n+m+k+l)×(n+m+k+l)为单位矩阵,M0,Mc为MMD矩阵,构造方式如下:
其中c∈{0,1},分别表示在源域和目标域中属于c类的样本的个数,nc表示源域数据集{xs,ys}中属于c类的样本的个数;mc表示目标域带标签数据集中属于c类的样本的个数;kc表示目标域不带标签数据集中属于c类的样本的个数;lc表示目标域测试数据集{xtest}中属于c类的样本的个数;
步骤3:使用拉格朗日乘子法求解,设定拉格朗日算子为Φ=(φ12,...,φd),d为A的最小特征值,推导出拉格朗日函数后求转换矩阵A的偏导:
步骤4:利用Matlab计算变换后的矩阵ATψ(X);
步骤5:针对变换后的源域和目标域数据,进行实例迁移学习,以筛选出源域中与目标域差异较大的样本,具体为:
5.1:数据准备,变换后的源域训练数据集{zs,ys}、目标域带标签训练数据集目标域不带标签训练数据集和目标域的测试数据集{xtest};
5.2:初始化权重向量其中1到n的权重为1/n;n+1到n+m的权重为1/m,设置N为迭代次数;
5.3:迭代计算更新样本权重向量wv+1,其中源域Ds上的权重更新为其中i=1,...,n,目标域Dt上的权重更新为其中i=n+1,...,n+m;
利用如下式计算置信度筛选置信度大于γ的δu个样本,其中γ表示置信度阈值,加入数据集,其中u=1,...,U,U表示迭代次数,更新m=m+δu,并从中删除这些样本;
5.5:重复步骤5.2~5.4,直到u=U;
5.6:利用更新完成的数据集重复步骤5.2和5.3各一次,计算{ztest}的预测标签hf(ztest)。
优选地,所述步骤4包括以下子步骤:
4.1:数据准备,源域训练数据集{xs,ys}、目标域训练数据集数据和目标域测试数据集{xtest};
4.2:数据集合并,将源域特征矩阵xs和目标域特征矩阵组合成矩阵X=[xs,xt];
4.3:利用已有标签集合计算初始mc,用源域数据{xs,ys}训练一个分类器,预测目标域中无标签数据集和测试数据集{xtest}的初始伪标签集并计算初始kc和lc,计算初始M0和Mc
4.4:迭代T次,T为大于1的自然数,更新Mc矩阵,直到迭代结束;
4.5:利用步骤3的公式计算矩阵A,得到变换后的矩阵{ATψ(xs),ys},在其上训练同一类型的分类器,预测目标域有标签数据集的伪标签集根据上的准确率重复步骤3,利用PSO优化算法调整参数μ、d,并得到最优的参数组合;
4.6利用更新后参数重复步骤3,计算ATψ(X)矩阵,并分解为的形式。
优选地,所述步骤5.3中每次迭代的计算步骤包括:
(1)计算使权重的分量相加为1,v=1,...,N;
(2)利用样本权重ωv训练基分类器hv,预测目标域中无标签训练数据集的标签,记为并计算在目标域带标签数据上的误差εv
(3)设置βv=εv/(1-εv),并更新样本权重向量wv+1,源域Ds上的权重更新为其中i=1,...,n,目标域Dt上的权重更新为其中i=n+1,...,n+m。
优选地,所述步骤4.4中每次迭代包括以下步骤:
(1)设定参数λ,核函数K为固定值,设定参数μ、d的初始值,利用函数eigs求解矩阵A;
(2)在{ATψ(xs),ys}上训练同一分类器,预测和{AT(xtest)}的标签集并更新kc和lc,计算上分类准确率η;
(3)更新Mc矩阵,直到迭代结束。
优选地,所述步骤5.3中计算中数据的预测标签的公式为:
优选地,所述步骤5.3中计算置信度的公式为:
本发明针对某些领域分类模型训练时带标签数据不足的问题,而引入其他领域的数据以及该领域的无标签数据辅助训练,同时考虑领域间数据分布的差异,提出了一种半监督场景下特征和实例联合迁移学***衡分布适应方法和自学习实例迁移方法;并以此为基础构建特征和实例联合迁移学习方法FSJT。
相对于现有技术,本发明的具有如下优点:
1、本发明针对源域和目标域数据集的特征空间,进行迁移特征变换,以缩小两领域特征空间的差异,适用于源域和目标域差异较大的情形;
2、本发明考虑半监督场景中目标域中数据的边缘概率分布和条件概率分布与监督场景中的差异,为了使领域间数据的统计分布差异最小化,将其转化为求解目标函数最小值的问题;利用平衡参数将两领域数据的边缘特征分布函数间距离,以及条件分布函数间的距离同时引入目标函数;
3、本发明构建学习目标域无标签数据信息的方法,将无标签数据引入实例迁移学习算法,以适用于半监督学习场景
4、本发明利用自学习思想对实例迁移方法进行拓展,使模型适用于半监督学习场景,通过在训练时提高有利于目标分类任务的实例权重,降低不利于目标分类任务的实例权重,去除源域中差异较大的样本。
附图说明
图1为本发明半监督场景下特征和实例联合迁移学习方法的流程图。
图2为实现本发明半监督场景下特征和实例联合迁移学习方法的计算机模型结构示意图。
具体实施方式
下面结合实施例及附图对本发明作进一步详细的描述,但本发明的实施方式不限于此。
本发明的基本流程如图1所示,本发明实施例提供的一种半监督场景下特征和实例联合迁移学习方法,包括以下步骤:
步骤1:定义模型中数据如下:
给定一个领域,已知该领域中每一个数据所属类别用“0”或“1”表示,记为源域Ds。包含的n个样本用特征矩阵和类别标签向量形式表示为简记为{xs,ys}。给定另一个领域,记为目标域Dt。其中m个样本组成带标签数据集记为不带标签数据集记为其中q=1,...,k。两类数据集共记为包含m+k个训练样本,且假设中样本数量不足以训练一个可靠的分类器。
假设特征空间Xs=Xt,即两个领域的特征种类与数量相同,类别空间Ys=Yt,但边缘分布Ps(xs)≠Pt(xt),条件分布Ps(ys|xs)≠Pt(yt|xt)。所考虑的问题是利用源域Ds中数据集{xs,ys}和目标域Dt中数据集学习目标域中未标注数据的类别其中r=1,...,l。
步骤2:利用平衡参数μ,利用平衡参数μ,构建目标函数并进行化简求解。
2.1:利用平衡参数μ,同时考虑两领域数据的边缘特征分布函数间距离,以及条件分布函数间的距离。将使目标域与源域的差异最小化转化为求解目标函数最小值问题,构建的目标函数如下:
其中,当a=1,...,m时,分别表示当a=m+1,...,m+k时,表示的伪标签,分别表示 表示的伪标签。当a=m+k+1,...,m+k+l时,表示的伪标签,分别表示 表示的伪标签。表示条件分布P(yt|xt)的估计值。
2.2:利用MMD距离度量将步骤二中目标函数化简为数值表达形式:
其中,H表示再生核希尔伯特空间(reproducing kernel Hilbert space简称RKHS)。表示再生核希尔伯特空间上的范数(简称H范数)的平方。c∈{0,1},分别表示在源域和目标域中属于c类的样本的个数。nc表示源域数据集{xs,ys}中属于c类的样本的个数;mc表示目标域带标签数据集中属于c类的样本的个数;kc表示目标域不带标签数据集中属于c类的样本的个数;lc表示目标域测试数据集{xtest}中属于c类的样本的个数。
2.3:利用矩阵技巧和正则化将其化简:
其中min表示求目标函数最小值,s.t.表示目标函数的约束条件。tr()表示求矩阵的迹,。X是由源域与目标域数据集组成的输入矩阵,且满足X=[xs,xt],其中映射函数ψ:由核函数K=ψ(X)Tψ(X)给出。λ为正则化系数,表示F范数的平方,平衡因子为μ。约束条件确保转换后的数据ATψ(X)保留原始数据的内部属性。其中A表示转换矩阵,H=I-(1/n)1为中心矩阵,I∈R(n+m+k+l)×(n+m+k+l)为单位矩阵。M0,Mc为MMD矩阵,构造方式如下所示:
步骤3:使用拉格朗日乘子法求解,设定拉格朗日算子为Φ=(φ12,...,φd),推导出拉格朗日函数后求A的偏导得到如下结果:
该式为广义特征值问题通过求解A的d个最小特征值可以得到矩阵A,进而求得变换后的数据ATψ(X)。
步骤4:利用Matlab计算变换后的矩阵ATψ(X),利用更新后参数计算ATψ(X)矩阵,并分解为的形式。
具体地:
4.1:数据准备,源域训练数据集{xs,ys}、目标域训练数据集数据和目标域测试数据集{xtest}。
4.2:数据集合并,将源域特征矩阵xs和目标域特征矩阵组合成矩阵X=[xs,xt]。
4.3:利用已有标签集合计算初始mc,用源域数据{xs,ys}训练一个分类器,预测目标域中无标签数据集和测试数据集{xtest}的初始伪标签集并计算初始kc和lc,利用步骤四中M0和Mc表达式计算初始M0和Mc
4.4:迭代T次,每次的操作为:
1).设定参数λ,核函数K为固定值,设定参数μ、d的初始值,利用函数eigs求解矩阵A。
2).在{ATψ(xs),ys}上训练同一分类器,预测和{AT(xtest)}的标签集并更新kc和lc,计算上分类准确率η。
3).更新Mc矩阵,直到迭代结束。
4.5:利用步骤3的公式计算出的矩阵A,可得到变换后的矩阵{ATψ(xs),ys},在其上训练同一类型的分类器,预测目标域有标签数据集的伪标签集根据上的准确率重复步骤(4),利用PSO优化算法调整参数μ、d,并得到最优的参数组合。
4.6:利用更新后参数重复步骤(4),计算ATψ(X)矩阵,并分解为的形式。
步骤5:针对变换后的源域和目标域数据,进行实例迁移学习,以筛选出源域中与目标域差异较大的样本,具体为:
5.1:数据准备,变换后的源域训练数据集{zs,ys}、目标域带标签训练数据集目标域不带标签训练数据集和目标域的测试数据集{xtest}。
5.2:初始化权重向量其中1到n的权重为1/n;n+1到n+m的权重为1/m。设置其中N为迭代次数。
5.3:迭代计算更新样本权重向量wv+1,其中源域Ds上的权重更新为其中i=1,...,n,目标域Dt上的权重更新为其中i=n+1,...,n+m。
对于每次迭代需要计算下面几个步骤(v=1,...,N):
1).计算使权重的分量相加为1。
2).利用样本权重ωv训练基分类器hv,预测目标域中无标签训练数据集的标签,记为并利用如下式计算在目标域带标签数据上的误差εv
3).设置βv=εv/(1-εv),并更新样本权重向量wv+1。源域Ds上的权重更新为其中i=1,...,n。目标域Dt上的权重更新为其中i=n+1,...,n+m。
5.4:利用如下式计算中数据的预测标签
利用如下式计算置信度筛选置信度大于γ的δu个样本,其中γ表示置信度阈值。加入数据集,其中u=1,...,U,U表示迭代次数。更新m=m+δu,并从中删除这些样本。
5.5:重复步骤5.2~5.4,直到u=U;
5.6:利用更新完成的数据集重复步骤5.2和5.3各一次,计算{ztest}的预测标签hf(ztest)。
通过上述流程,可以对特征变换后的源域和目标域训练数据进行自学习实例迁移,并预测目标域待测试数据的标签。
实例分析:
1.数据集准备:
使用迁移学习通用数据集为OFFICE,它由三个领域的数据组成,依次为Amazon、Webcam和DSLR。每个领域分别有985、295、295张图片。每个图片离散化为800维的特征构成的向量。这三个领域分别简写为A、W、D。
2.数据预处理:
源域和目标域样本的选择。共有四种待实验方案,依次为A为源域样本,D为目标域样本;A为源域样本,W为目标域样本;D为源域样本,W为目标域样本;W为源域样本,D为目标域样本。每个实验方案中,目标域训练样本为随机抽取的90%的数据,10%的数据作为验证。
3.参数的设置:
基本分类器设置为K近邻分类器,参数k设置为8。迭代次数T设置为10,参数λ是优化问题中的系数,即F范数的正则参数,这里设置为λ=0.01,核函数选择高斯核函数。μ和d是算法中需要调优的,在求解过程中μ平衡了M0、Mc矩阵的重要性,进一步讲μ用来平衡边缘分布与条件分布的所占权重,而得到的矩阵A由d维特征向量组成。首先设置初始的μ和d参数,通过目标域带标签训练数据上的准确率来调整这两个参数。设置好参数后,输入每个方案的数据,运行程序即可得到测试数据上的分类准确率。
4.不同模型的精度比较:
选择一个已有的迁移学***衡的分布适应方法(BDA)算法进行比较,但由于BDA适用无监督场景,训练BDA时目标域只选取MBDA使用的无标签训练数据。
同时为了验证所提方法在处理领域间差异的性能,与三种机器学习中的分类算法进行对比。这里选择支持向量机(SVM)、逻辑回归(LR)、决策树(DT)三种算法。每种算法使用的数据与FSJT模型一致,利用一个数据集训练,另一个数据集预测。
由于OFFICE数据集有三个领域,因此给出几组不同领域分别作为训练和测试数据集时模型的结果,如表1所示。
表1 各模型的分类效果对比结果
从表中结果可知,FSJT和BDA方法在领域A向其他两个领域的迁移效果都较差,可能由A数据集与其他两个领域的差距较大造成。但是W和D领域间的迁移学习效果较好,FSJT达到了88.41%和89.27%,且均高于BDA方法中D→W和W→D的准确率85.37%和86.02%。由于FSJT利用了目标域上的少量带标签数据,因此可以学习到更多的目标域特征,使精度有所提高。三种机器学习方法的结果中SVM模型在四种数据上的准确率最高,在利用W数据集训练,D数据集测试的精度达到了77.71%,其次是LR模型和DT模型的72.33%。而综合五类方法的结果,两类迁移学习方法在四种情形的结果都高于三种机器学习算法。可能由于机器学习需要保证训练数据和测试数据同分布假设,而迁移学习方法可以处理两类数据的差异,使得模型的泛化能力得到了一定提升。综上,FSJT方法在标准数据上的表现验证了该模型的有效性。
应当理解的是,上述针对较佳实施例的较为详细,并不能因此而认为是对本发明专利保护范围的限制,本领域的普通技术人员在本发明的启示下,在不脱离本发明权利要求所保护的范围情况下,还可以做出替换或变形,均落入本发明的保护范围内,本发明的请求保护范围应以所附权利要求为准。

Claims (6)

1.一种半监督场景下特征和实例联合迁移学习方法,其特征在于:所述方法包括以下步骤:
步骤1:定义模型中数据:给定一个领域,已知该领域中每一个数据所属类别用“0”或“1”表示,记为源域Ds,包含的n个样本用特征矩阵和类别标签向量形式表示为简记为{xs,ys};给定另一个领域,记为目标域Dt,其中m个样本组成带标签数据集记为不带标签数据集记为q=1,...,k,两类数据集共记为包含m+k个训练样本,且假设中样本数量不足以训练一个可靠的分类器;
假设特征空间Xs=Xt,即两个领域的特征种类与数量相同,类别空间Ys=Yt,但边缘分布Ps(xs)≠Pt(xt),条件分布Ps(ys|xs)≠Pt(yt|xt),目标是利用源域Ds中数据集{xs,ys}和目标域Dt中数据集学习目标域中未标注数据的类别其中r=1,...,l,n、m、k、l均为大于1的自然数;
步骤2:利用平衡参数μ,构建目标函数并进行化简求解得到:
其中min表示求目标函数最小值,tr()表示求矩阵的迹,X是由源域与目标域数据集组成的输入矩阵,且满足X=[xs,xt],其中映射函数ψ:由核函数K=ψ(X)Tψ(X)给出,λ为正则化系数,表示F范数的平方,平衡因子为μ,A表示转换矩阵,H=I-(1/n)1为中心矩阵,I∈R(n+m+k+l)×(n+m+k+l)为单位矩阵,M0,Mc为MMD矩阵,构造方式如下:
其中c∈{0,1},分别表示在源域和目标域中属于c类的样本的个数,nc表示源域数据集{xs,ys}中属于c类的样本的个数;mc表示目标域带标签数据集中属于c类的样本的个数;kc表示目标域不带标签数据集中属于c类的样本的个数;lc表示目标域测试数据集{xtest}中属于c类的样本的个数;
步骤3:使用拉格朗日乘子法求解,设定拉格朗日算子为Φ=(φ12,...,φd),d为A的最小特征值,推导出拉格朗日函数后求转换矩阵A的偏导:
步骤4:利用Matlab计算变换后的矩阵ATψ(X);
步骤5:针对变换后的源域和目标域数据,进行实例迁移学习,以筛选出源域中与目标域差异较大的样本,具体为:
5.1:数据准备,变换后的源域训练数据集{zs,ys}、目标域带标签训练数据集目标域不带标签训练数据集和目标域的测试数据集{xtest};
5.2:初始化权重向量其中1到n的权重为1/n;n+1到n+m的权重为1/m,设置N为迭代次数;
5.3:迭代计算更新样本权重向量wv+1,其中源域Ds上的权重更新为其中i=1,...,n,目标域Dt上的权重更新为其中i=n+1,...,n+m;
5.4:利用下式计算中数据的预测标签
利用如下式计算置信度筛选置信度大于γ的δu个样本,其中γ表示置信度阈值,加入数据集,其中u=1,...,U,U表示迭代次数,更新m=m+δu,并从中删除这些样本,
5.5:重复步骤5.2~5.4,直到u=U;
5.6:利用更新完成的数据集重复步骤5.2和5.3各一次,计算{ztest}的预测标签hf(ztest)。
2.根据权利要求1所述的半监督场景下特征和实例联合迁移学习方法,其特征在于:所述步骤4包括以下子步骤:
4.1:数据准备,源域训练数据集{xs,ys}、目标域训练数据集数据和目标域测试数据集{xtest};
4.2:数据集合并,将源域特征矩阵xs和目标域特征矩阵组合成矩阵X=[xs,xt];
4.3:利用已有标签集合计算初始mc,用源域数据{xs,ys}训练一个分类器,预测目标域中无标签数据集和测试数据集{xtest}的初始伪标签集并计算初始kc和lc,计算初始M0和Mc
4.4:迭代T次,T为大于1的自然数,更新Mc矩阵,直到迭代结束;
4.5:利用步骤3的公式计算矩阵A,得到变换后的矩阵{ATψ(xs),ys},在其上训练同一类型的分类器,预测目标域有标签数据集的伪标签集根据上的准确率重复步骤3,利用PSO优化算法调整参数μ、d,并得到最优的参数组合;
4.6利用更新后参数重复步骤3,计算ATψ(X)矩阵,并分解为的形式。
3.根据权利要求1所述的半监督场景下特征和实例联合迁移学习方法,其特征在于:所述步骤5.3中每次迭代的计算步骤包括:
(1)计算使权重的分量相加为1,v=1,...,N;
(2)利用样本权重ωv训练基分类器hv,预测目标域中无标签训练数据集的标签,记为并计算在目标域带标签数据上的误差εv
(3)设置βv=εv/(1-εv),并更新样本权重向量wv+1,源域Ds上的权重更新为其中i=1,...,n,目标域Dt上的权重更新为其中i=n+1,...,n+m。
4.根据权利要求1所述的半监督场景下特征和实例联合迁移学习方法,其特征在于:所述步骤4.4中每次迭代包括以下步骤:
(1)设定参数λ,核函数K为固定值,设定参数μ、d的初始值,利用函数eigs求解矩阵A;
(2)在{ATψ(xs),ys}上训练同一分类器,预测和{AT(xtest)}的标签集并更新kc和lc,计算上分类准确率η;
(3)更新Mc矩阵,直到迭代结束。
5.根据权利要求1所述的半监督场景下特征和实例联合迁移学习方法,其特征在于:所述步骤5.3中计算中数据的预测标签的公式为:
6.根据权利要求1所述的半监督场景下特征和实例联合迁移学习方法,其特征在于:所述步骤5.3中计算置信度的公式为:
CN201910770868.2A 2019-08-20 2019-08-20 半监督场景下特征和实例联合迁移学习方法 Pending CN110533193A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910770868.2A CN110533193A (zh) 2019-08-20 2019-08-20 半监督场景下特征和实例联合迁移学习方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910770868.2A CN110533193A (zh) 2019-08-20 2019-08-20 半监督场景下特征和实例联合迁移学习方法

Publications (1)

Publication Number Publication Date
CN110533193A true CN110533193A (zh) 2019-12-03

Family

ID=68662299

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910770868.2A Pending CN110533193A (zh) 2019-08-20 2019-08-20 半监督场景下特征和实例联合迁移学习方法

Country Status (1)

Country Link
CN (1) CN110533193A (zh)

Cited By (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111312403A (zh) * 2020-01-21 2020-06-19 山东师范大学 基于实例和特征共享级联的疾病预测***、设备及介质
CN111581380A (zh) * 2020-04-29 2020-08-25 南京理工大学紫金学院 一种单双点平滑结合的流形正则化半监督文本分类方法
CN111667000A (zh) * 2020-06-05 2020-09-15 成都理工大学 自适应领域深度神经网络的地震预警方法
CN111724487A (zh) * 2020-06-19 2020-09-29 广东浪潮大数据研究有限公司 一种流场数据可视化方法、装置、设备及存储介质
CN111914708A (zh) * 2020-07-23 2020-11-10 杭州电子科技大学 迁移半监督宽度学习的脑电信号分类方法
CN112070236A (zh) * 2020-09-11 2020-12-11 福州大学 基于迁移学习解决在线复杂优化计算的稀疏特征学习方法
CN112085085A (zh) * 2020-09-03 2020-12-15 哈尔滨工业大学 一种基于图结构的多源迁移学习方法
CN112288004A (zh) * 2020-10-28 2021-01-29 香港中文大学(深圳) 一种无需一致性约束的半监督方法及移动终端
CN112285565A (zh) * 2020-09-21 2021-01-29 电子科技大学 基于rkhs域匹配的迁移学习预测电池soh方法
CN112395879A (zh) * 2020-11-10 2021-02-23 华中科技大学 一种科技文本命名实体识别方法
CN112861929A (zh) * 2021-01-20 2021-05-28 河南科技大学 一种基于半监督加权迁移判别分析的图像分类方法
CN112883994A (zh) * 2020-12-28 2021-06-01 重庆邮电大学 一种均衡分布适配的旋转机械变工况故障诊断方法
CN113030197A (zh) * 2021-03-26 2021-06-25 哈尔滨工业大学 一种气体传感器漂移补偿方法
CN113283489A (zh) * 2021-05-19 2021-08-20 浙大宁波理工学院 一种基于联合分布匹配的半监督域适应学习的分类方法
CN113420775A (zh) * 2021-03-31 2021-09-21 中国矿业大学 基于非线性度自适应子域领域适应的极少量训练样本下图片分类方法
CN114500325A (zh) * 2022-01-27 2022-05-13 重庆邮电大学 一种基于无监督迁移学习的sdn控制器故障自适应智能检测方法
CN116167288A (zh) * 2023-04-19 2023-05-26 中国科学技术大学 一种ua2ft半监督迁移学习建模方法、介质及设备
CN116488158A (zh) * 2023-04-24 2023-07-25 国能日新科技股份有限公司 一种基于迁移学习的风电中长期电量预测的方法及装置
CN117096070A (zh) * 2023-10-19 2023-11-21 合肥综合性国家科学中心人工智能研究院(安徽省人工智能实验室) 一种基于领域自适应的半导体加工工艺异常检测方法

Cited By (31)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111312403A (zh) * 2020-01-21 2020-06-19 山东师范大学 基于实例和特征共享级联的疾病预测***、设备及介质
CN111581380A (zh) * 2020-04-29 2020-08-25 南京理工大学紫金学院 一种单双点平滑结合的流形正则化半监督文本分类方法
CN111667000A (zh) * 2020-06-05 2020-09-15 成都理工大学 自适应领域深度神经网络的地震预警方法
CN111667000B (zh) * 2020-06-05 2023-02-07 成都理工大学 自适应领域深度神经网络的地震预警方法
CN111724487A (zh) * 2020-06-19 2020-09-29 广东浪潮大数据研究有限公司 一种流场数据可视化方法、装置、设备及存储介质
WO2021253666A1 (zh) * 2020-06-19 2021-12-23 广东浪潮智慧计算技术有限公司 一种流场数据可视化方法、装置、设备及存储介质
CN111724487B (zh) * 2020-06-19 2023-05-16 广东浪潮大数据研究有限公司 一种流场数据可视化方法、装置、设备及存储介质
CN111914708B (zh) * 2020-07-23 2023-09-12 杭州电子科技大学 迁移半监督宽度学习的脑电信号分类方法
CN111914708A (zh) * 2020-07-23 2020-11-10 杭州电子科技大学 迁移半监督宽度学习的脑电信号分类方法
CN112085085B (zh) * 2020-09-03 2024-02-23 哈尔滨工业大学 一种基于图结构的多源迁移学习方法
CN112085085A (zh) * 2020-09-03 2020-12-15 哈尔滨工业大学 一种基于图结构的多源迁移学习方法
CN112070236A (zh) * 2020-09-11 2020-12-11 福州大学 基于迁移学习解决在线复杂优化计算的稀疏特征学习方法
CN112285565A (zh) * 2020-09-21 2021-01-29 电子科技大学 基于rkhs域匹配的迁移学习预测电池soh方法
CN112285565B (zh) * 2020-09-21 2021-07-13 电子科技大学 基于rkhs域匹配的迁移学习预测电池soh方法
CN112288004A (zh) * 2020-10-28 2021-01-29 香港中文大学(深圳) 一种无需一致性约束的半监督方法及移动终端
CN112395879A (zh) * 2020-11-10 2021-02-23 华中科技大学 一种科技文本命名实体识别方法
CN112883994A (zh) * 2020-12-28 2021-06-01 重庆邮电大学 一种均衡分布适配的旋转机械变工况故障诊断方法
CN112883994B (zh) * 2020-12-28 2022-05-10 重庆邮电大学 一种均衡分布适配的旋转机械变工况故障诊断方法
CN112861929A (zh) * 2021-01-20 2021-05-28 河南科技大学 一种基于半监督加权迁移判别分析的图像分类方法
CN113030197A (zh) * 2021-03-26 2021-06-25 哈尔滨工业大学 一种气体传感器漂移补偿方法
CN113420775B (zh) * 2021-03-31 2024-03-29 中国矿业大学 基于非线性度自适应子域领域适应的极少量训练样本下图片分类方法
CN113420775A (zh) * 2021-03-31 2021-09-21 中国矿业大学 基于非线性度自适应子域领域适应的极少量训练样本下图片分类方法
CN113283489A (zh) * 2021-05-19 2021-08-20 浙大宁波理工学院 一种基于联合分布匹配的半监督域适应学习的分类方法
CN113283489B (zh) * 2021-05-19 2023-06-30 浙大宁波理工学院 一种基于联合分布匹配的半监督域适应学习的分类方法
CN114500325B (zh) * 2022-01-27 2023-07-18 重庆邮电大学 一种基于无监督迁移学习的sdn控制器故障自适应智能检测方法
CN114500325A (zh) * 2022-01-27 2022-05-13 重庆邮电大学 一种基于无监督迁移学习的sdn控制器故障自适应智能检测方法
CN116167288A (zh) * 2023-04-19 2023-05-26 中国科学技术大学 一种ua2ft半监督迁移学习建模方法、介质及设备
CN116488158A (zh) * 2023-04-24 2023-07-25 国能日新科技股份有限公司 一种基于迁移学习的风电中长期电量预测的方法及装置
CN116488158B (zh) * 2023-04-24 2023-09-15 国能日新科技股份有限公司 一种基于迁移学习的风电中长期电量预测的方法及装置
CN117096070A (zh) * 2023-10-19 2023-11-21 合肥综合性国家科学中心人工智能研究院(安徽省人工智能实验室) 一种基于领域自适应的半导体加工工艺异常检测方法
CN117096070B (zh) * 2023-10-19 2024-01-05 合肥综合性国家科学中心人工智能研究院(安徽省人工智能实验室) 一种基于领域自适应的半导体加工工艺异常检测方法

Similar Documents

Publication Publication Date Title
CN110533193A (zh) 半监督场景下特征和实例联合迁移学习方法
Gauci et al. Horizon: Facebook's open source applied reinforcement learning platform
US20200074246A1 (en) Capturing network dynamics using dynamic graph representation learning
Liu et al. Energy-based imitation learning
CN110880019B (zh) 通过无监督域适应训练目标域分类模型的方法
Yao et al. RDAM: A reinforcement learning based dynamic attribute matrix representation for virtual network embedding
CN109002845A (zh) 基于深度卷积神经网络的细粒度图像分类方法
CN111881342A (zh) 一种基于图孪生网络的推荐方法
CN114841257B (zh) 一种基于自监督对比约束下的小样本目标检测方法
CN106157154B (zh) 用于自媒体网络数据的自适应进化蝙蝠算法下的复杂网络社区发现方法
Mu et al. Multi-objective ant colony optimization algorithm based on decomposition for community detection in complex networks
CN111931801B (zh) 一种基于路径多样性与一致性的动态路由网络学习方法
CN115270007B (zh) 一种基于混合图神经网络的poi推荐方法及***
CN112115993A (zh) 一种基于元学习的零样本和小样本证件照异常检测方法
CN113807176A (zh) 一种基于多知识融合的小样本视频行为识别方法
CN115269861A (zh) 基于生成式对抗模仿学习的强化学习知识图谱推理方法
J. Toal et al. Performance of an ensemble of ordinary, universal, non-stationary and limit Kriging predictors
CN114819091A (zh) 基于自适应任务权重的多任务网络模型训练方法及***
Lin et al. Localization-aware meta tracker guided with adversarial features
Deng et al. Label propagation on k-partite graphs with heterophily
CN116595543A (zh) 一种基于互联网平台用软件开发应用数据的处理***
CN111369124A (zh) 一种基于自生成全局特征和注意力的图像美学预测方法
CN113887723A (zh) 一种基于关系型的动态路由网络学习方法
CN114254199A (zh) 基于二分图投影和node2vec的课程推荐方法
CN111612572A (zh) 一种基于推荐***的自适应局部低秩矩阵近似建模方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20191203