CN102521656A - 非平衡样本分类的集成迁移学习方法 - Google Patents

非平衡样本分类的集成迁移学习方法 Download PDF

Info

Publication number
CN102521656A
CN102521656A CN201110452050XA CN201110452050A CN102521656A CN 102521656 A CN102521656 A CN 102521656A CN 201110452050X A CN201110452050X A CN 201110452050XA CN 201110452050 A CN201110452050 A CN 201110452050A CN 102521656 A CN102521656 A CN 102521656A
Authority
CN
China
Prior art keywords
sample
training
data
classification
samples
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201110452050XA
Other languages
English (en)
Other versions
CN102521656B (zh
Inventor
于重重
谭励
田蕊
刘宇
吴子珺
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Technology and Business University
Original Assignee
Beijing Technology and Business University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Technology and Business University filed Critical Beijing Technology and Business University
Priority to CN201110452050.XA priority Critical patent/CN102521656B/zh
Publication of CN102521656A publication Critical patent/CN102521656A/zh
Application granted granted Critical
Publication of CN102521656B publication Critical patent/CN102521656B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

一种非平衡样本分类的集成迁移学***衡数据的分类问题提供了新的方法,保证了分类中数量少的负样本在分类训练中的作用,有效地提高了负样本的贡献率,提高了分类的效率和精度。

Description

非平衡样本分类的集成迁移学习方法
技术领域
本发明属于机器学***衡的辅助训练数据,提出了一种改进集成迁移学习算法,利用这些辅助训练数据迁移帮助目标数据进行分类。
背景技术
迁移学习是近年来机器学习领域研究的热门,它针对新任务中标记数据量小的特点,提出有效地利用已过时的数据迁移应用到新的任务中:虽然大量过时数据与待解决问题领域有所差异,但是其中肯定会存在一些对新的分类问题有所帮助的数据。为了能够找到这些有用的数据,利用少量已被分类的新数据,来挖掘旧数据中的有价值信息。最后根据两部分数据中所有的有用信息来训练一个较高效的分类模型,实现旧数据到新数据的知识迁移。
目前,针对不同迁移学习任务有多种解决方法:
Q.Yang等人提出将朴素贝叶斯分类器(Naive Bayes Classifier)推广成一个支持跨领域文本分类的分类器,实现了不同领域文本之间知识的迁移。(WDai,G.-R.Xue,QYang,andYYu.Transferring naive bayes classifiers for text classification[A].The Twenty-Second NationalConference on Artificial Intelligence[C],2007.540-545.)
Dai等人提出将集成学习应用到迁移学习中,通过boosting技术将弱学习算法“提升”为强学习的算法-TrAdaboost,该算法将迁移辅助数据和目标数据这两部分数据集直接组合在一起,组成一个混合数据集作为训练集,然后在这个数据集上利用TrAdaboost算法训练分类模型。(YLiu and PStone.Value-function-based transfer for reinforcement learning using structuremapping[A].In Proceedings of theTwenty-First National Conference on Artificial Intelligence[C],2006.877-882.)
将集成学习算法应用到迁移学习中,可以在不改变弱分类器分类精度的情况下,通过集成将弱学习算法“提升”为强学习算法,从而有效提升迁移学习效果,然而该方法也存在一些问题:
TrAdaboost算法适用于解决基于对称的二分类问题,正负数据同等看待。然而,在现实世界中表征两类不同类别的样本分布上有可能是极度不平衡的,并且重要性也存在很大的差异。
另外,辅助数据中往往存在大量冗余数据,这些数据可能与目标数据集很不相似,它们的存在不但会影响模型的训练速度,还会导致分类精度的下降。
发明内容
本发明的目的是提供一种新的方法,通过优化样本权重分配及调整策略,提高数据量小、信息量大的一类样本(负样本)的贡献率;并在训练过程中动态剔除“不相关”数据,根据设定好的样本阈值下限,淘汰权重值过小的那部分数据,经过T轮的迭代训练,辅助训练数据将不断趋于优化。
本发明的原理是:利用迁移的方法,针对正负样本不平衡的数据进行分类,首先将辅助训练数据与目标数据提取出的特征属性向量混合成训练集,然后将该训练集上的每维特征属性分别应用弱学习算法。在初始化时,将正负样本赋予不同的权重,保证占总样本比例小但信息量大的负样本初始权重大。每轮训练过程中按比例抽取部分样本作为训练子集进行训练,训练结束后,从若干个简单分类器中选择误差最小的那个,作为一个弱分类器h,并按照冗余数据动态剔除算法调整训练数据集。这样,经过T轮迭代后就可以得到一个弱分类器序列(h1,h2,...,hT),最终的分类函数f(x)采用一种投票方式产生,即将多个弱分类器通过一定的方法叠加(boost)起来组合成一个强分类器。方法流程如图5所示。
本发明提供的技术方案如下:
一种非平衡样本分类的集成迁移学习方法,其特征是,包括如下步骤:
1)将迁移辅助数据集A与目标数据集O按比例混合成训练数据集C;
2)初始化样本权重;
3)求出归一化样本权重;
设迭代总次数为T,从1到T每轮迭代训练依次完成下面4)~9)步:
4)随机抽取训练子集D;
5)如果训练子集D中含有正负两类样本,则执行第6)步;否则,在不包含的另一类中抽取部分样本填入训练子集D,以确保训练子集D中存在正负两类样本;
6)在训练子集D上,用弱学习算法P,训练基分类器并集成求和得到弱分类器;
7)计算弱分类器ht在目标训练数据上的训练错误率,其中t为迭代因子;
8)根据分类错误率调整样本权值;
9)动态剔除冗余数据;
10)得到最终集成分类器输出正样本和负样本。
步骤1)中,分别在迁移辅助数据集A与目标数据集O中抽取部分数据按比例混合成训练数据集C,C={(X1,Y1),(X2,Y2),…,(XN,YN)},其中(Xi,Yi)是由样本特征属性向量和样本类别组合成的训练样本,i=1,2,…,N;训练数据集C中前n个样本为A中数据,剩下的m个样本为O中的数据,n+m=N;其中Xi∈X,X为输入样本数据,Xi是样本的特征属性向量,维数为q,Yi∈{0,+1}是样本的类别标签。
步骤3)中,归一化样本权重的计算方法为:将每个样本的初始化权重除以总的样本权重,即得到归一化后的样本权重。
步骤4)中,抽取的训练子集D中所含样本数量为C中的一半。
步骤6)中,所述弱学习算法为决策树,人工神经网络,SVM。
步骤7)中,弱分类器ht在目标训练数据上的训练错误率εt如下计算:
ϵ t = Σ i = n + 1 n + m ω i t | h t ( x i ) - y i | Σ i = n + 1 n + m ω i t
其中
Figure BDA0000126690150000032
是第i个样本在第t次迭代时的权重,ht(xi)是第i个样本在第t次迭代时的输出,yi是第i个样本的真实类别标签;如果计算出的εt大于1/2,则将其值设置为1/2,即εt不大于1/2。
步骤9)中,每轮训练结束后当训练样本的权重值低于设定好的阈值下限时被视为冗余数据,从训练样本删除该部分数据。
步骤9)中,当训练样本总数小于等于设定好的最低样本个数时停止训练,即停止步骤4)~9)的迭代。
步骤10)中,最终的集成分类器输出为
Figure BDA0000126690150000033
即以多数弱分类器的投票结果作为最终分类结果;其中取值1代表在不平衡数据中占多数的一类样本,取值0则代表占少数的另一类样本;x为训练样本,T为总迭代次数,t为迭代因子,ht(x)是样本x在第t次迭代时的输出,
Figure BDA0000126690150000041
将前面所述集成迁移学习方法应用于桥梁监测,对于最终的集成分类器输出值Z,Z为1表示该样本为正样本,表征桥梁健康状况良好;Z为0表示该样本为副样本,表征桥梁为损伤状态。
本发明的有益效果:利用本发明提供的技术方案,可以有效利用已有旧数据的分类规律找出近似分布的新数据的分类规律,尤其是针对分类不平衡数据的分类问题提供了新的方法,保证了分类中数量少的负样本在分类训练中的作用,有效地提高了负样本的贡献率,提高了分类的效率和精度。
附图说明
图1实施例步骤框图
图2本发明在训练数据及测试数据上的错误率
图3TrAdaboost随训练数据增加相对误差
图4本发明随训练数据增加相对误差
图5本发明方法流程图
表1输入数据
表2训练数据组成成分
表3TrAdaboost算法与本发明算法的测试结果
具体实施方式
本发明提供的非平衡样本分类的集成迁移学习方法(称之为UBITLA),步骤如下(参图1):
1.输入:输入数据源于两部分:迁移辅助数据集A,目标数据集O。分别在这两部分数据中抽取部分数据按比例混合成训练数据集C={(X1,Y1),(X2,Y2),…,(XN,YN)},其中(Xi,Yi)是由样本特征属性向量和样本类别组合成的训练样本。i=1,2,…,N。C中前n个样本为A中数据,C中剩下的m个样本为O中的数据(n+m=N)。预定的迭代次数为T。其中Xi∈X,X为输入样本数据,Xi是样本的特征属性向量,维数为q,Yi∈{0,+1}是样本的类别标签。
2.初始化样本权重:
Figure BDA0000126690150000051
其中,
Figure BDA0000126690150000052
为第i个样本的初始化权重,其中的1表示该权值是初始化状态,i0表示该初始化权重值未经归一化处理,其中i=1,2,…,N。d,l分别为A和O中正样本数量。
3.求出归一化样本权重:
ω i 1 = ω i 0 1 Σ i = 1 N ω i 0 1
Figure BDA0000126690150000054
是第i个样本经过归一化的样本权重,分别将每个样本的初始化权重除以总的样本权重,即得到归一化后的样本权重。
设迭代总次数为T,从1到T每轮迭代训练依次完成4-9步:
4.随机抽取训练子集D(其中D中所含样本数为C中的一半,D从C中随机抽取。)
5.判断训练子集D中是否含有正负两类样本。如果含有两类样本则执行第6步,如果只含其中一类样本,则直接在另一类中抽取部分样本并填入训练子集D。确保训练子集中存在正负两类样本。
6.在训练子集D上,用弱学习算法P(如决策树,人工神经网络,SVM等基本分类算法),训练每一维特征属性的基分类器j=1,2,…,q,其中h表示由基本分类算法训练构造的基分类器,q表示特征属性向量的维数,t表示第t轮迭代。由基分类器求和得到弱分类器:
h t = Σ j = 1 q h t j
7.计算弱分类器ht在目标训练数据上的训练错误率:
ϵ t = Σ i = n + 1 n + m ω i t | h t ( x i ) - y i | Σ i = n + 1 n + m ω i t
其中
Figure BDA0000126690150000062
是第i个样本在第t次迭代时的权重,ht(xi)是第i个样本在第t次迭代时的输出,yi是第i个样本的真实类别标签。
如果计算出的εt大于1/2,则需要将其值设置为1/2。即εt不大于1/2。
8.调整样本权值:
如果yi=0并且ht(x)≠yi,其中1≤i≤n,则
ω i t + 1 = ω i t β | h t ( x i ) - y i | + dr × ω i t (0≤dr≤1)
否则
ω i t + 1 = ω i t β | h t ( x i ) - y i | , 1 ≤ i ≤ n ω i t β t - | h t ( x i ) - y i | , n + 1 ≤ i ≤ m + n
Figure BDA0000126690150000065
Figure BDA0000126690150000066
如果第i个样本为负样本,并且与第t次分类器的输出不等时,按照上述第一个公式调整权重,否则按照第二个公式进行调整。其中,dr是一个衰减因子,作用是使被分错的负样本权值调整具有记忆功能,保证其不致迅速变小。
9.动态剔除冗余数据:
每轮训练结束后当训练样本的权重值低于设定好的阈值下限r时被视为冗余数据,从训练样本删除该部分数据。当训练样本总数低于设定好的最低样本个数时停止训练。
10.输出:最终的集成分类器输出为:
Figure BDA0000126690150000067
即以多数弱分类器的投票结果为最终分类结果,其中1代表在不平衡数据中占多数的一类样本,0则代表占少数的另一类样本。
实施例采用一座已有两年监测历史的跨海大桥监测数据集(DataS1)和一座新建公路桥监测数据集(DataS2)作为研究对象,从两座桥的实际监测应变数据中按照早,中,晚高峰时段和上下午低峰时段分别抽取一定比例的数据作为迁移辅助训练数据集和目标数据集,数据组成成分如表2所示。其中正、负样本比例为5∶1,分别采用两座桥的桥板上14个关键监测点静应变数据,作为14维输入数据。输出数据:1代表正常,0代表损伤。在每轮的训练过程中随机抽取1/2的数据作为训练数据子集,同样随机抽取一部分目标数据作为测试数据子集。
在上述第1步中,实际输入部分数据见表1,其中,辅助训练数据与目标数据的比例约为5∶1,正负类别比例约为5∶1,样本总数6000个。第10步,输出为1表示正样本,表征桥梁健康状况良好;输出为0表示负样本,表征桥梁为损伤状态。
本实施例将非平衡样本分类的集成迁移学***衡的特点,合理利用已过时的数据帮助新数据进行分类,可以有效地提高数据量小但信息量大的桥梁损伤数据的贡献率,从而提高正负样本的识别率,可以有效指导相关人员对产生损伤数据的桥梁结构进行更密切监测,及时采取相应修护措施。
图2说明迁移数据辅助建立分类模型的有效性。图3,图4说明通过优化辅助训练样本集可以提高最终分类器精度。有此例证明本发明能优化辅助训练数据集,从而达到效率和精度的双赢,提升了迁移学习效果。
  1   2   3   4   5   6   7   8   9   10   11   12   13   输出
  样本1   44   53.7   20.8   24.8   26.8   30.8   33.7   31.9   30   29.2   71.3   43.8   89.6   0
  样本2   23   24.3   43.8   55.7   20.2   25   27.1   30.6   33.3   31.7   20.7   29.9   70.9   1
  样本3   42.6   89.4   26.3   21.8   67.9   48.8   54.8   22.1   30.8   70.6   42.5   89.4   26.5   1
  样本4   20.8   23.8   42.8   58.9   19   25.8   28.5   30.6   32.1   30.7   31   31.5   69.6   1
  样本5   32.9   46.8   20.1   14.7   39.4   50.7   14.3   18.1   21.9   28.9   28.5   28.1   40.7   1
  样本6   44.9   53.6   20.1   22.1   41.8   51.7   19   23.5   29.1   27.9   31.7   30.1   19.5   1
  样本7   20.5   17.5   58.5   32.2   46.6   21.1   14.2   41.2   48.4   15.3   16.8   20.7   28.9   0
  样本8   29.9   70.9   42.6   89.4   26.3   21.8   67.9   48.8   54.8   22.1   30.8   70.6   42.5   1
  样本9   31.5   69.6   41.3   88.6   26.5   20.7   66.1   47.2   53.6   20.8   23.5   42.5   59.7   0
  样本10   32.6   79.1   55.2   95.2   32.3   27.3   76.6   54.1   59.1   18.3   33.9   78.7   54.4   1
表1输入数据
Figure BDA0000126690150000071
Figure BDA0000126690150000081
表2训练数据组成成分
Figure BDA0000126690150000082
表3TrAdaboost算法与本发明算法的测试结果

Claims (10)

1.一种非平衡样本分类的集成迁移学习方法,其特征是,包括如下步骤:
1)将迁移辅助数据集A与目标数据集O按比例混合成训练数据集C;
2)初始化样本权重;
3)求出归一化样本权重;
设迭代总次数为T,从1到T每轮迭代训练依次完成下面4)~9)步:
4)随机抽取训练子集D;
5)如果训练子集D中含有正负两类样本,则执行第6)步;否则,在不包含的另一类中抽取部分样本填入训练子集D,以确保训练子集D中存在正负两类样本;
6)在训练子集D上,用弱学习算法P,训练基分类器并集成求和得到弱分类器;
7)计算弱分类器ht在目标训练数据上的训练错误率,其中t为迭代因子;
8)根据分类错误率调整样本权值;
9)动态剔除冗余数据;
10)得到最终集成分类器输出正样本和负样本。
2.如权利要求1所述的集成迁移学习方法,其特征是,步骤1)中,分别在迁移辅助数据集A与目标数据集O中抽取部分数据按比例混合成训练数据集C,C={(X1,Y1),(X2,Y2),…,(XN,YN)},其中(Xi,Yi)是由样本特征属性向量和样本类别组合成的训练样本,i=1,2,…,N;训练数据集C中前n个样本为A中数据,剩下的m个样本为O中的数据,n+m=N;其中Xi∈X,X为输入样本数据,Xi是样本的特征属性向量,维数为q,Yi∈{0,+1}是样本的类别标签。
3.如权利要求1所述的集成迁移学习方法,其特征是,步骤3)中,归一化样本权重的计算方法为:将每个样本的初始化权重除以总的样本权重,即得到归一化后的样本权重。
4.如权利要求1所述的集成迁移学习方法,其特征是,步骤4)中,抽取的训练子集D中所含样本数量为C中的一半。
5.如权利要求1所述的集成迁移学习方法,其特征是,步骤6)中,所述弱学习算法为决策树,人工神经网络,SVM。
6.如权利要求2所述的集成迁移学习方法,其特征是,步骤7)中,弱分类器ht在目标训练数据上的训练错误率εt如下计算:
ϵ t = Σ i = n + 1 n + m ω i t | h t ( x i ) - y i | Σ i = n + 1 n + m ω i t
其中
Figure FDA0000126690140000022
是第i个样本在第t次迭代时的权重,ht(xi)是第i个样本在第t次迭代时的输出,yi是第i个样本的真实类别标签;如果计算出的εt大于1/2,则将其值设置为1/2,即εt不大于1/2。
7.如权利要求1所述的集成迁移学习方法,其特征是,步骤9)中,每轮训练结束后当训练样本的权重值低于设定好的阈值下限时被视为冗余数据,从训练样本删除该部分数据。
8.如权利要求1所述的集成迁移学习方法,其特征是,步骤9)中,当训练样本总数小于等于设定好的最低样本个数时停止训练,即停止步骤4)~9)的迭代。
9.如权利要求6所述的集成迁移学习方法,其特征是,步骤10)中,最终的集成分类器输出为
即以多数弱分类器的投票结果作为最终分类结果;其中取值1代表在不平衡数据中占多数的一类样本,取值0则代表占少数的另一类样本;x为训练样本,T为总迭代次数,t为迭代因子,ht(x)是样本x在第t次迭代时的输出,
Figure FDA0000126690140000024
10.将权利要求1~9所述的集成迁移学习方法应用于桥梁监测,对于最终的集成分类器输出值Z,Z为1表示该样本为正样本,表征桥梁健康状况良好;Z为0表示该样本为副样本,表征桥梁为损伤状态。
CN201110452050.XA 2011-12-29 2011-12-29 非平衡样本分类的集成迁移学习方法 Expired - Fee Related CN102521656B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201110452050.XA CN102521656B (zh) 2011-12-29 2011-12-29 非平衡样本分类的集成迁移学习方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201110452050.XA CN102521656B (zh) 2011-12-29 2011-12-29 非平衡样本分类的集成迁移学习方法

Publications (2)

Publication Number Publication Date
CN102521656A true CN102521656A (zh) 2012-06-27
CN102521656B CN102521656B (zh) 2014-02-26

Family

ID=46292567

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201110452050.XA Expired - Fee Related CN102521656B (zh) 2011-12-29 2011-12-29 非平衡样本分类的集成迁移学习方法

Country Status (1)

Country Link
CN (1) CN102521656B (zh)

Cited By (37)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104573708A (zh) * 2014-12-19 2015-04-29 天津大学 组合降采样极限学习机
CN104751234A (zh) * 2013-12-31 2015-07-01 华为技术有限公司 一种用户资产的预测方法及装置
CN104951809A (zh) * 2015-07-14 2015-09-30 西安电子科技大学 基于不平衡分类指标与集成学***衡数据分类方法
CN105243394A (zh) * 2015-11-03 2016-01-13 中国矿业大学 一种类不平衡对分类模型性能影响程度的评价方法
CN105589037A (zh) * 2016-03-16 2016-05-18 合肥工业大学 基于集成学习的电力电子开关器件网络故障诊断方法
CN106570164A (zh) * 2016-11-07 2017-04-19 中国农业大学 一种基于深度学习的集成式食品安全文本分类方法
CN106909981A (zh) * 2015-12-23 2017-06-30 阿里巴巴集团控股有限公司 模型训练、样本平衡方法及装置以及个人信用评分***
CN106934462A (zh) * 2017-02-09 2017-07-07 华南理工大学 基于迁移的对抗性环境下的防御毒化攻击的学习方法
CN107291739A (zh) * 2016-03-31 2017-10-24 阿里巴巴集团控股有限公司 网络用户健康状况的评价方法、***及设备
CN107316061A (zh) * 2017-06-22 2017-11-03 华南理工大学 一种深度迁移学***衡分类集成方法
CN107644057A (zh) * 2017-08-09 2018-01-30 天津大学 一种基于迁移学***衡文本分类方法
CN107728476A (zh) * 2017-09-20 2018-02-23 浙江大学 一种基于SVM‑forest的从非平衡类数据中提取敏感数据的方法
CN107944874A (zh) * 2017-12-13 2018-04-20 阿里巴巴集团控股有限公司 基于迁移学习的风控方法、装置及***
CN108154237A (zh) * 2016-12-06 2018-06-12 华为技术有限公司 一种数据处理***及方法
CN108520220A (zh) * 2018-03-30 2018-09-11 百度在线网络技术(北京)有限公司 模型生成方法和装置
CN108629419A (zh) * 2017-03-21 2018-10-09 发那科株式会社 机器学习装置以及热位移修正装置
CN109145943A (zh) * 2018-07-05 2019-01-04 四川斐讯信息技术有限公司 一种基于特征迁移的集成分类方法及***
CN109143199A (zh) * 2018-11-09 2019-01-04 大连东软信息学院 基于迁移学习的海杂波小目标检测方法
CN109272056A (zh) * 2018-10-30 2019-01-25 成都信息工程大学 基于伪负样本的数据平衡方法及提高数据分类性能的方法
CN109462610A (zh) * 2018-12-24 2019-03-12 哈尔滨工程大学 一种基于主动学习和迁移学习的网络入侵检测方法
CN109508457A (zh) * 2018-10-31 2019-03-22 浙江大学 一种基于机器阅读到序列模型的迁移学习方法
CN109523018A (zh) * 2019-01-08 2019-03-26 重庆邮电大学 一种基于深度迁移学习的图片分类方法
CN109800807A (zh) * 2019-01-18 2019-05-24 北京市商汤科技开发有限公司 分类网络的训练方法及分类方法和装置、电子设备
CN109886303A (zh) * 2019-01-21 2019-06-14 武汉大学 一种基于粒子群优化的TrAdaboost样本迁移航空影像分类方法
CN109948478A (zh) * 2019-03-06 2019-06-28 中国科学院自动化研究所 基于神经网络的大规模非均衡数据的人脸识别方法、***
CN110245232A (zh) * 2019-06-03 2019-09-17 网易传媒科技(北京)有限公司 文本分类方法、装置、介质和计算设备
CN110688983A (zh) * 2019-08-22 2020-01-14 中国矿业大学 基于多模态优化和集成学习的微震信号识别方法
CN110998648A (zh) * 2018-08-09 2020-04-10 北京嘀嘀无限科技发展有限公司 一种分配订单的***和方法
CN111046924A (zh) * 2019-11-26 2020-04-21 成都旷视金智科技有限公司 一种数据处理方法、装置、***及存储介质
CN111291818A (zh) * 2020-02-18 2020-06-16 浙江工业大学 一种面向云掩膜的非均匀类别的样本均衡化方法
CN111881289A (zh) * 2020-06-10 2020-11-03 北京启明星辰信息安全技术有限公司 分类模型的训练方法、数据风险类别的检测方法及装置
CN112465152A (zh) * 2020-12-03 2021-03-09 中国科学院大学宁波华美医院 一种适用于情绪脑-机接口的在线迁移学习方法
CN112819076A (zh) * 2021-02-03 2021-05-18 中南大学 基于深度迁移学习的医学图像分类模型的训练方法及装置
US11049007B2 (en) 2016-05-06 2021-06-29 Fujitsu Limited Recognition apparatus based on deep neural network, training apparatus and methods thereof
CN113421122A (zh) * 2021-06-25 2021-09-21 创络(上海)数据科技有限公司 改进的迁移学习框架下的首购用户精细化流失预判方法
CN113657428A (zh) * 2021-06-30 2021-11-16 北京邮电大学 网络流量数据的抽取方法及装置
CN114765772A (zh) * 2021-01-04 2022-07-19 ***通信有限公司研究院 终端信息的输出方法、装置及可读存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101794396A (zh) * 2010-03-25 2010-08-04 西安电子科技大学 基于迁移网络学习的遥感图像目标识别***及方法
CN101840569A (zh) * 2010-03-19 2010-09-22 西安电子科技大学 基于迁移学习的投影寻踪高光谱图像分割方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101840569A (zh) * 2010-03-19 2010-09-22 西安电子科技大学 基于迁移学习的投影寻踪高光谱图像分割方法
CN101794396A (zh) * 2010-03-25 2010-08-04 西安电子科技大学 基于迁移网络学习的遥感图像目标识别***及方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
刘伟,等: "非平衡样本分类的集成迁移学习算法", 《计算机工程与应用》 *
张彦峰,等: "一种改进的AdaBoost算法_M_AsyAdaBoost", 《北京理工大学学报》 *

Cited By (57)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104751234B (zh) * 2013-12-31 2018-10-19 华为技术有限公司 一种用户资产的预测方法及装置
CN104751234A (zh) * 2013-12-31 2015-07-01 华为技术有限公司 一种用户资产的预测方法及装置
CN104573708A (zh) * 2014-12-19 2015-04-29 天津大学 组合降采样极限学习机
CN104951809A (zh) * 2015-07-14 2015-09-30 西安电子科技大学 基于不平衡分类指标与集成学***衡数据分类方法
CN105243394A (zh) * 2015-11-03 2016-01-13 中国矿业大学 一种类不平衡对分类模型性能影响程度的评价方法
CN105243394B (zh) * 2015-11-03 2019-03-19 中国矿业大学 一种类不平衡对分类模型性能影响程度的评价方法
CN106909981B (zh) * 2015-12-23 2020-08-25 阿里巴巴集团控股有限公司 模型训练、样本平衡方法及装置以及个人信用评分***
CN106909981A (zh) * 2015-12-23 2017-06-30 阿里巴巴集团控股有限公司 模型训练、样本平衡方法及装置以及个人信用评分***
CN105589037A (zh) * 2016-03-16 2016-05-18 合肥工业大学 基于集成学习的电力电子开关器件网络故障诊断方法
CN107291739A (zh) * 2016-03-31 2017-10-24 阿里巴巴集团控股有限公司 网络用户健康状况的评价方法、***及设备
US11049007B2 (en) 2016-05-06 2021-06-29 Fujitsu Limited Recognition apparatus based on deep neural network, training apparatus and methods thereof
CN106570164A (zh) * 2016-11-07 2017-04-19 中国农业大学 一种基于深度学习的集成式食品安全文本分类方法
CN108154237A (zh) * 2016-12-06 2018-06-12 华为技术有限公司 一种数据处理***及方法
CN108154237B (zh) * 2016-12-06 2022-04-05 华为技术有限公司 一种数据处理***及方法
CN106934462A (zh) * 2017-02-09 2017-07-07 华南理工大学 基于迁移的对抗性环境下的防御毒化攻击的学习方法
CN108629419B (zh) * 2017-03-21 2023-07-14 发那科株式会社 机器学习装置以及热位移修正装置
CN108629419A (zh) * 2017-03-21 2018-10-09 发那科株式会社 机器学习装置以及热位移修正装置
CN107316061B (zh) * 2017-06-22 2020-09-22 华南理工大学 一种深度迁移学***衡分类集成方法
CN107316061A (zh) * 2017-06-22 2017-11-03 华南理工大学 一种深度迁移学***衡分类集成方法
CN107644057B (zh) * 2017-08-09 2020-03-03 天津大学 一种基于迁移学***衡文本分类方法
CN107644057A (zh) * 2017-08-09 2018-01-30 天津大学 一种基于迁移学***衡文本分类方法
CN107728476A (zh) * 2017-09-20 2018-02-23 浙江大学 一种基于SVM‑forest的从非平衡类数据中提取敏感数据的方法
CN107728476B (zh) * 2017-09-20 2020-05-22 浙江大学 一种基于SVM-forest的从非平衡类数据中提取敏感数据的方法
CN107944874A (zh) * 2017-12-13 2018-04-20 阿里巴巴集团控股有限公司 基于迁移学习的风控方法、装置及***
CN107944874B (zh) * 2017-12-13 2021-07-20 创新先进技术有限公司 基于迁移学习的风控方法、装置及***
CN108520220B (zh) * 2018-03-30 2021-07-09 百度在线网络技术(北京)有限公司 模型生成方法和装置
CN108520220A (zh) * 2018-03-30 2018-09-11 百度在线网络技术(北京)有限公司 模型生成方法和装置
CN109145943A (zh) * 2018-07-05 2019-01-04 四川斐讯信息技术有限公司 一种基于特征迁移的集成分类方法及***
CN110998648A (zh) * 2018-08-09 2020-04-10 北京嘀嘀无限科技发展有限公司 一种分配订单的***和方法
CN109272056B (zh) * 2018-10-30 2021-09-21 成都信息工程大学 基于伪负样本的数据平衡方法及提高数据分类性能的方法
CN109272056A (zh) * 2018-10-30 2019-01-25 成都信息工程大学 基于伪负样本的数据平衡方法及提高数据分类性能的方法
CN109508457A (zh) * 2018-10-31 2019-03-22 浙江大学 一种基于机器阅读到序列模型的迁移学习方法
CN109143199A (zh) * 2018-11-09 2019-01-04 大连东软信息学院 基于迁移学习的海杂波小目标检测方法
CN109462610A (zh) * 2018-12-24 2019-03-12 哈尔滨工程大学 一种基于主动学习和迁移学习的网络入侵检测方法
CN109523018B (zh) * 2019-01-08 2022-10-18 重庆邮电大学 一种基于深度迁移学习的图片分类方法
CN109523018A (zh) * 2019-01-08 2019-03-26 重庆邮电大学 一种基于深度迁移学习的图片分类方法
CN109800807A (zh) * 2019-01-18 2019-05-24 北京市商汤科技开发有限公司 分类网络的训练方法及分类方法和装置、电子设备
CN109800807B (zh) * 2019-01-18 2021-08-31 北京市商汤科技开发有限公司 分类网络的训练方法及分类方法和装置、电子设备
CN109886303A (zh) * 2019-01-21 2019-06-14 武汉大学 一种基于粒子群优化的TrAdaboost样本迁移航空影像分类方法
CN109948478B (zh) * 2019-03-06 2021-05-11 中国科学院自动化研究所 基于神经网络的大规模非均衡数据的人脸识别方法、***
CN109948478A (zh) * 2019-03-06 2019-06-28 中国科学院自动化研究所 基于神经网络的大规模非均衡数据的人脸识别方法、***
CN110245232B (zh) * 2019-06-03 2022-02-18 网易传媒科技(北京)有限公司 文本分类方法、装置、介质和计算设备
CN110245232A (zh) * 2019-06-03 2019-09-17 网易传媒科技(北京)有限公司 文本分类方法、装置、介质和计算设备
CN110688983A (zh) * 2019-08-22 2020-01-14 中国矿业大学 基于多模态优化和集成学习的微震信号识别方法
CN111046924A (zh) * 2019-11-26 2020-04-21 成都旷视金智科技有限公司 一种数据处理方法、装置、***及存储介质
CN111046924B (zh) * 2019-11-26 2023-12-19 成都旷视金智科技有限公司 一种数据处理方法、装置、***及存储介质
CN111291818A (zh) * 2020-02-18 2020-06-16 浙江工业大学 一种面向云掩膜的非均匀类别的样本均衡化方法
CN111881289A (zh) * 2020-06-10 2020-11-03 北京启明星辰信息安全技术有限公司 分类模型的训练方法、数据风险类别的检测方法及装置
CN111881289B (zh) * 2020-06-10 2023-09-08 北京启明星辰信息安全技术有限公司 分类模型的训练方法、数据风险类别的检测方法及装置
CN112465152B (zh) * 2020-12-03 2022-11-29 中国科学院大学宁波华美医院 一种适用于情绪脑-机接口的在线迁移学习方法
CN112465152A (zh) * 2020-12-03 2021-03-09 中国科学院大学宁波华美医院 一种适用于情绪脑-机接口的在线迁移学习方法
CN114765772A (zh) * 2021-01-04 2022-07-19 ***通信有限公司研究院 终端信息的输出方法、装置及可读存储介质
CN114765772B (zh) * 2021-01-04 2024-06-11 ***通信有限公司研究院 终端信息的输出方法、装置及可读存储介质
CN112819076A (zh) * 2021-02-03 2021-05-18 中南大学 基于深度迁移学习的医学图像分类模型的训练方法及装置
CN112819076B (zh) * 2021-02-03 2022-06-17 中南大学 基于深度迁移学习的医学图像分类模型的训练方法及装置
CN113421122A (zh) * 2021-06-25 2021-09-21 创络(上海)数据科技有限公司 改进的迁移学习框架下的首购用户精细化流失预判方法
CN113657428A (zh) * 2021-06-30 2021-11-16 北京邮电大学 网络流量数据的抽取方法及装置

Also Published As

Publication number Publication date
CN102521656B (zh) 2014-02-26

Similar Documents

Publication Publication Date Title
CN102521656B (zh) 非平衡样本分类的集成迁移学习方法
CN105373606A (zh) 一种改进c4.5决策树算法下的不平衡数据抽样方法
CN105487526B (zh) 一种Fast RVM污水处理故障诊断方法
CN106709754A (zh) 一种用基于文本挖掘的电力用户分群方法
CN104966105A (zh) 一种鲁棒机器错误检索方法与***
CN103886330A (zh) 基于半监督svm集成学习的分类方法
CN104657718A (zh) 一种基于人脸图像特征极限学习机的人脸识别方法
CN106203534A (zh) 一种基于Boosting的代价敏感软件缺陷预测方法
CN103020122A (zh) 一种基于半监督聚类的迁移学习方法
CN110188047A (zh) 一种基于双通道卷积神经网络的重复缺陷报告检测方法
CN104598920B (zh) 基于Gist特征与极限学习机的场景分类方法
CN103177265B (zh) 基于核函数与稀疏编码的高清图像分类方法
CN104951987B (zh) 基于决策树的作物育种评价方法
CN112925908A (zh) 一种基于Attention的图注意力网络的文本分类方法及***
CN110738232A (zh) 一种基于数据挖掘技术的电网电压越限成因诊断方法
CN105809360A (zh) 一种p2p行业风险评估方法
CN106681305A (zh) 一种Fast RVM污水处理在线故障诊断方法
CN106156805A (zh) 一种样本标签缺失数据的分类器训练方法
CN110348608A (zh) 一种基于模糊聚类算法改进lstm的预测方法
CN106022954A (zh) 基于灰色关联度的多重bp神经网络负荷预测方法
CN105975611A (zh) 自适应组合降采样增强学习机
CN108664633A (zh) 一种利用多样化文本特征进行文本分类的方法
CN106127333A (zh) 电影上座率预测方法和***
CN102629272A (zh) 一种基于聚类的考试***试题库优化方法
CN109784488A (zh) 一种适用于嵌入式平台的二值化卷积神经网络的构建方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C53 Correction of patent of invention or patent application
CB03 Change of inventor or designer information

Inventor after: Tan Li

Inventor after: Su Weijun

Inventor after: Yu Zhongzhong

Inventor after: Tian Rui

Inventor after: Liu Yu

Inventor after: Wu Zijun

Inventor after: Ma Meng

Inventor before: Yu Zhongzhong

Inventor before: Tan Li

Inventor before: Tian Rui

Inventor before: Liu Yu

Inventor before: Wu Zijun

COR Change of bibliographic data

Free format text: CORRECT: INVENTOR; FROM: YU CHONGCHONG TAN LI TIAN RUI LIU YU WU ZIJUN TO: TAN LI SU WEIJUN YU CHONGCHONG TIAN RUI LIU YU WU ZIJUN MA MENG

C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20140226

Termination date: 20161229