CN101944122A - 一种融合增量学习的支持向量机多类分类方法 - Google Patents

一种融合增量学习的支持向量机多类分类方法 Download PDF

Info

Publication number
CN101944122A
CN101944122A CN 201010289451 CN201010289451A CN101944122A CN 101944122 A CN101944122 A CN 101944122A CN 201010289451 CN201010289451 CN 201010289451 CN 201010289451 A CN201010289451 A CN 201010289451A CN 101944122 A CN101944122 A CN 101944122A
Authority
CN
China
Prior art keywords
training
sample
class
sample set
support vector
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN 201010289451
Other languages
English (en)
Inventor
琚春华
郑丽丽
梅铮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang Gongshang University
Original Assignee
Zhejiang Gongshang University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang Gongshang University filed Critical Zhejiang Gongshang University
Priority to CN 201010289451 priority Critical patent/CN101944122A/zh
Publication of CN101944122A publication Critical patent/CN101944122A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及一种融合增量学习的支持向量机多类分类方法。本发明的目的是提供一种融合增量学习的支持向量机多类分类方法,旨在减少样本的训练时间、提高分类器的分类精度及抗干扰性。本发明的技术方案是:1、在总的样本中随机抽取一部分作为训练样本集D,另一部分作为测试样本集T;2、对训练样本集D进行预抽取支持向量;3、用循环迭代法对预抽取训练样本集PTS进行支持向量机训练,得到多类分类模型M-SVM;4、对多类分类模型M-SVM进行二叉树处理,得到支持向量机多类分类模型BTMSVM0;5、对多类分类模型BTMSVM0进行增量学习训练,得到模型BTMSVM1;6、将步骤1中的测试样本集T输入到多类分类模型BTMSVM1进行分类。本发明用于通过增量学习对海量信息进行高效多类分类。

Description

一种融合增量学习的支持向量机多类分类方法
技术领域
本发明涉及智能信息处理和机器学习技术领域,尤其是一种融合增量学习的支持向量机多类分类方法。适用于在复杂属性条件下,通过增量学习的方式对海量信息进行高效多类分类。
背景技术
支持向量机(SupportVector Machine)是近几年发展起来的一种机器学习方法,它是基于结构风险最小化原则构建的,具有很强的学习能力和泛化性能,能够较好地解决小样本、高维数、非线性、局部极小等问题,广泛的应用于模式分类和非线性回归。传统的支持向量机是针对二类分类问题而提出的,不能直接用于多类分类,但在实际的应用中更多的是多类分类问题,如何将传统支持向量分类机推广到多类分类仍是目前支持向量机领域研究的热点。
增量学习技术相比于传统的学习方法具有明显的优越性,主要表现为:(1)增量学习算法可以充分利用历史的训练结果,从而减少后继训练时间;(2)无须保存历史数据且可舍弃无用样本减小训练集,从而减少了存储空间的占用;(3)随着增量学习过程的不断进行,所获得分类器的分类精度将不断提高。
Syed.N(1999年)是最早开始基于支持向量机增量算法研究的学者,在该算法中给出了增量学习的增加策略,每次增量学习后只保留支持向量,丢弃其他的样本。G.Cauwenberghs(2003年)等人提出了在线增量训练的精确解释,即增减一个训练样本对Lagrange系数和支持向量的影响。该算法是有效的,但其缺点是忽略了新增样本分布对已有样本分布的影响,其训练结果并不令人满意。萧嵘等(2001年)提出了一种支持增量学习的方法ISVM,其训练集的来源为支持向量、误分数据或有选择地淘汰一些样本而来,算法具有较高的学习精度。C.Domeniconi(2001年)提出了一种快速支持向量机增量学习算法。上述的这些算法的学习或存在振荡现象或因引入的淘汰机制缺乏新增样本对支持向量集影响的考虑而导致分类知识丢失。Liao DP等人(2007年)提出一种基于密度法的增量学习淘汰算法,该方法能准确地提出边界向量,淘汰掉非边界向量,有效地淘汰掉无用样本,保留重要信息,既保证训练的精度又提高训练的速度,计算简单且易于实现。尽管关于样本的增量学习取得上述一些成果,但有关该领域的增量学习方法的研究还处于初级阶段,且都局限于在两类分类中样本的增加,然而实际中存在大量的多分类问题,如文本分类、信用评估、人脸识别等,因此针对多类别增量学习的研究很必要也很重要。
目前对支持向量机多类分类算法的研究比较多,包括1-a-r(one-against-rest)算法.1-a-1(one-against-one)算法、DDAGSVM(directed acyclicraph SVM)算法等。Ying w等人(2006年)在克服上述算法缺点的基础上提出基于二叉树的支持向量机多分类算法(简称BTSVM),有较好的分类效果和分类效率,但是该算法的抗干扰能力较差,对训练数据的要求较高,在一定程度上阻碍了其应用。
发明内容
本发明要解决的技术问题是:提供一种融合增量学习的支持向量机多类分类方法,旨在减少样本的训练时间、提高分类器的分类精度及抗干扰性。
本发明所采用的技术方案是:一种融合增量学习的支持向量机多类分类方法,其特征在于包括步骤:
步骤1、在总的样本中随机抽取一部分作为训练样本集D,另一部分作为测试样本集T;
步骤2、对训练样本集D进行预抽取支持向量,获得最终的预抽取训练样本集PTS,剩下的训练样本作为增量样本集B0
步骤3、用循环迭代法对预抽取训练样本集PTS进行支持向量机训练,得到多类分类模型M-SVM;
步骤4、对多类分类模型M-SVM进行二叉树处理,得到基于二叉树的支持向量机多类分类模型BTMSVM0
步骤5、对多类分类模型BTMSVM0进行增量学习训练,得到新的多类分类模型BTMSVM1
步骤6、将步骤1中的测试样本集T输入到多类分类模型BTMSVM1进行分类。
步骤2中所述的预抽取支持向量按以下步骤进行:
2.1、对K类样本根据各类样本的数量进行由多到少排序,训练样本中出现最多的类为第1类,以此类推,直至第K类,形成分类序列集合{s1,s2...sk};
2.2、确定训练样本的类型,对于K类的训练样本,训练K-1个支持向量机,第i个支持向量机以第i类样本为正的训练样本,将第i+1,i+2.....K类训练样本作为负的训练样本训练SVM(i)(i=1....K-1),第K-1个支持向量机将以第K-1类样本作为正样本,以第K类样本为负样本训练SVM(K-1);
2.3、从训练样本集D中的第i类样本集中选取一个样本,根据类均值距离法求其与第i+1类所有样本间的距离δi,j(i=1,2...k,j=1,2,...k):
δi,j=||mi-mj||2-ri-rj
Figure BSA00000280382400031
集的均值向量,||mi-mj||2为i类和j类均值向量间的距离,ri和rj分别为i类及j类的类平均半径,ni为i类中的样本数目,称δi,j为i类和i类之间的类均值距离;
2.4、找出这些距离中的最小值及与这个最小距离所对应的第i+1类中的样本,将其放在预抽取样本集合PTS0中;
2.5、返回到步骤2.3,遍历完训练样本集D中第i类中的所有样本;
2.6、返回到步骤2.1,遍历完训练样本集D中第i+1类中的所有样本;
2.7、对预抽取样本集合PTS0中的样本做唯一化处理,获得最终的预抽取训练样本集合PTS。
步骤3中所述的循环迭代法按以下步骤进行:
3.1、以步骤2最终获取的预抽取向量集PTS,构造数据集的分类超平面;
3.2、利用所得到的分类超平面对训练样本集D进行测试,计算训练样本集D中样本与分类超平面间距离d,以及训练正确率P;
3.3、当分类正确率P较小时,减少加入预抽取训练样本集PTS中违反KKT条件(KKT条件是使每个样本满足优化问题的条件,在本发明中该条件定义为
Figure BSA00000280382400032
Figure BSA00000280382400033
Figure BSA00000280382400034
其中非零的ai为SV,f(x)=h为SVM分类决策函数,{xi,yi}为训练样本,C为指定常数。可知f(x)=0为分类面,f(x)=±1为分类间隔面,则a=0对应的样本分布在分类器分类间隔面之外,0<a<C对应的样本位于分类间隔面之上,a=C对应的样本位于分类间隔面关于本类的异侧。违背KKT条件等价于yif(xi)<1。)的样本的数量,以求减少求解二次规划问题的规模;当分类正确率P较大时,加大加入预抽取训练样本集PTS中违反KKT条件的样本的数量,以求减少循环迭代的次数,并加入到预抽取训练样本集PTS中,取代原预抽取训练样本集PTS,作为下次循环迭代的训练样本集;
3.4、当训练正确率P<1时,重复3.3;当训练正确率P=1时跳出循环,结束迭代,训练结束,得到多类分类模型M-SVM。
步骤4包括:
4.1、将步骤3训练得到的SVM1作为二叉树的根节点,将属于第1类的测试样本决策出来;
4.2、将不属于第1类的样本通过SVM2继续进行分类,依次类推直到SVMK-1将第K类样本训练完,从而得到基于二叉树的SVM多类分类模型BTMSVM0
步骤5中所述的增量学习按以下步骤进行:
5.1、将增量样本集B0输入BTMSVM0,将增量样本集分为满足BTMSVM0的KKT条件和不满足KKT条件的2个集合;
5.2、对满足KKT条件的增量样本集和BTMSVM0的负例样本集分别进行密度法淘汰处理,得到剩余集;
5.3、将剩余集与BTMSVM0的正例样本集及增量样本集的不满足KKT条件的集合并得到新增量训练集B1
5.4、将新增量训练集B1输入BTMSVM0进行训练,得到新的多类分类模型BTMSVM1
本发明的有益效果是:本方法通过将支持向量机和二叉树的基本思想相结合,以类均值距离作为二叉树的生成算法,让与其他类相隔最远的类最先分隔出来,这种方法构造的最优超平面具有较好的推广性,能有效的避免孤立点带来的问题,使其具有一定的抗干扰性,而且只需构造k-1个(k为样本类别总数)支持向量机分类器,测试时并不一定需要计算所有的分类器判别函数,从而可节省测试时间。同时将基于密度法的增量学习算法加入本发明的多类分类器,在实现多分类能力的同时提升其增量学习的能力。
附图说明
图1是本发明的工作流程图。
图2是本发明中BTIMSVM增量学习过程。
具体实施方式
本发明融合增量学习的支持向量机多类分类方法按以下步骤进行:
步骤1、在总的样本中随机抽取一部分作为训练样本集D,另一部分作为测试样本集T。
步骤2、对训练样本集D进行预抽取支持向量,进一步包括步骤:
2.1、对K类样本根据各类样本的数量进行由多到少排序,训练样本中出现最多的类为第1类,以此类推,直至第K类,形成分类序列集合{s1,s2...sk};
2.2、确定训练样本的类型,对于K类的训练样本,训练K-1个支持向量机,第i个支持向量机以第i类样本为正的训练样本,将第i+1,i+2....K类训练样本作为负的训练样本训练SVM(i)(i=1....K-1),第K-1个支持向量机将以第K-1类样本作为正样本,以第K类样本为负样本训练SVM(K-1);
2.3、从训练样本集D中的第i类样本集中选取一个样本,根据类均值距离法求其与第i+1类所有样本间的距离δi,j(i=1,2...k,j=1,2,...k):
δi,j=||mi-mj||2-ri-rj
Figure BSA00000280382400051
集的均值向量,||mi-mj||2为i类和j类均值向量间的距离,ri和rj分别为i类及j类的类平均半径,ni为i类中的样本数目,称δi,j为i类和i类之间的类均值距离;
2.4、找出这些距离中的最小值及与这个最小距离所对应的第i+1类中的样本,将其放在预抽取样本集合PTS0中;
2.5、返回到步骤2.3,遍历完训练样本集D中第i类中的所有样本;
2.6、返回到步骤2.1,遍历完训练样本集D中第i+1类中的所有样本;
2.7、对预抽取样本集合PTS0中的样本做唯一化处理,获得最终的预抽取训练样本集合PTS,剩下的训练样本作为增量样本集B0
步骤3、用循环迭代法对预抽取训练样本集PTS进行支持向量机训练,进一步包括步骤:
3.1、以步骤2最终获取的预抽取向量集PTS,构造数据集的分类超平面;
3.2、利用所得到的分类超平面对训练样本集D进行测试,计算训练样本集D中样本与分类超平面间距离d,以及训练正确率P;
3.3、当分类正确率P较小时,减少加入预抽取训练样本集PTS中违反KKT条件的样本的数量,以求减少求解二次规划问题的规模;当分类正确率P较大时,加大加入预抽取训练样本集PTS中违反KKT条件的样本的数量,以求减少循环迭代的次数,并加入到预抽取训练样本集PTS中,取代原预抽取训练样本集PTS,作为下次循环迭代的训练样本集;
3.4、当训练正确率P<1时,重复3.3;当训练正确率P=1时跳出循环,结束迭代,训练结束,得到多类分类模型M-SVM。
步骤4、对多类分类模型M-SVM进行二叉树处理,包括:
4.1、将步骤3训练得到的SVM1作为二叉树的根节点,将属于第1类的测试样本决策出来;
4.2、将不属于第1类的样本通过SVM2继续进行分类,依次类推直到SVMK-1将第K类样本训练完,从而得到基于二叉树的SVM多类分类模型BTMSVM0
步骤5、对多类分类模型BTMSVM0进行增量学习训练,进一步包括:
5.1、将增量样本集B0输入BTMSVM0,将增量样本集分为满足BTMSVM0的KKT条件和不满足KKT条件的2个集合;
5.2、对满足KKT条件的增量样本集和BTMSVM0的负例样本集分别进行密度法淘汰处理,得到剩余集;
5.3、将剩余集与BTMSVM0的正例样本集及增量样本集的不满足KKT条件的集合并得到新增量训练集B1
5.4、将新增量训练集B1输入BTMSVM0进行训练,得到新的多类分类模型BTMSVM1
步骤6、将步骤1中的测试样本集T输入到多类分类模型BTMSVM1进行分类。
下面将通过两个具体的案例来说明本发明的技术方案。
以某商业银行过去18个月的一组***用户数据为实验样本集。经过处理的实验样本集共920条,划分为训练样本集D和测试样本集T两部分,其中训练样本240条,测试样本包括680条记录。训练样本中首先抽取80条,此后是新增20条、30条、40条、70条的增量进行训练。
实施例1:未使用增量学习训练的BTMSVM实验结果
第1步,对训练样本集进行预抽取得到80条记录组成的预抽取训练样本集PTS;
第2步,用PTS进行循环迭代法支持向量机训练,得到多类分类模型M-SVM;
第3步,对M-SVM进行二叉树处理,得到基于二叉树的支持向量机多类分类模型BTMSVM0,训练时间10.92秒,提取680条测试样本测试分类模型,分类正确率为70.49%;
第4步,新增20条训练样本,与原训练样本80条合并,共100条记录,输入BTMSVM0进行训练,训练时间为23.75秒。因为不能利用已经训练好的分类器(训练样本为80时),需要重新训练,所以实际花费的时间等于利用80条训练样本进行训练的时间与重新利用100条训练样本进行训练的时间的和,即10.92秒与16.43秒的和,共27.35秒;
第5步,再依次新增30、40、70条训练样本,迭加后的训练样本分别为130、170、240条,输入BTMSVM0进行训练,训练时间分别为46.98秒、70.89秒、108.87秒。
第6步,以上四组增量训练后,分别提取680条测试样本测试分类模型分类正确率,分别为:72.34%,74.16%,75.47%,87.02%。
实验结果如表1所示。
表1未使用增量训练的实验结果
Figure BSA00000280382400081
实施例2:使用增量学习训练的BTMSVM实验结果
第1步,对训练样本集D进行预抽取得到80条记录组成的预抽取训练样本集PTS;
第2步,用PTS进行循环迭代法支持向量机训练,得到多类分类模型M-SVM;
第3步,对M-SVM进行二叉树处理,得到基于二叉树的支持向量机多类分类模型BTMSVM0,训练时间10.92秒;
第4步,提取680条测试样本集T经过多类分类模型BTMSVM0分类,分类正确率70.49%;
第5步,将20条记录增量样本集B0与80条初始训练样本PTS输入BTMSVM0进行增量训练,增量训练时间2.56秒,经过密度法淘汰规则,共淘汰5条记录,剩余95条记录为新的增量训练集B1
第6步,将新的增量训练集输入进行训练,得到新的二叉树支持向量机多类分类模型BTMSVM1
第7步,提取680条测试样本经过BTMSVM1分类,通过第1次增量训练的分类模型分类正确率提高到71.82%;
第8步,将B1作为初始训练集,新增30条记录为增量样本集B2,重复第5步到第7步,淘汰样本8条,分类正确率提高到73.85%;
第9步,继续以40条和70条记录作为新增样本重复第5步到第6步,分类正确率分别为74.09%和86.97%。
实验结果如表2所示。表2使用增量学习后的实验结果
Figure BSA00000280382400091
实验结果表明,支持增量学习的BTMISVM模型可以充分利用以前的训练成果,大大减少训练时间,分类正确率也随着样本的增加而加速提高。本发明可以在一定程度上满足***行为评估对于增量学习的需求。

Claims (5)

1.一种融合增量学习的支持向量机多类分类方法,其特征在于包括步骤:
步骤1、在总的样本中随机抽取一部分作为训练样本集D,另一部分作为测试样本集T;
步骤2、对训练样本集D进行预抽取支持向量,获得最终的预抽取训练样本集PTS,剩下的训练样本作为增量样本集B0
步骤3、用循环迭代法对预抽取训练样本集PTS进行支持向量机训练,得到多类分类模型M-SVM;
步骤4、对多类分类模型M-SVM进行二叉树处理,得到基于二叉树的支持向量机多类分类模型BTMSVM0
步骤5、对多类分类模型BTMSVM0进行增量学习训练,得到新的多类分类模型BTMSVM1
步骤6、将步骤1中的测试样本集T输入到多类分类模型BTMSVM1进行分类。
2.根据权利要求1所述的融合增量学习的支持向量机多类分类方法,其特征在于步骤2中所述的预抽取支持向量按以下步骤进行:
2.1、对K类样本根据各类样本的数量进行由多到少排序,训练样本中出现最多的类为第1类,以此类推,直至第K类,形成分类序列集合{s1,s2...sk};
2.2、确定训练样本的类型,对于K类的训练样本,训练K-1个支持向量机,第i个支持向量机以第i类样本为正的训练样本,将第i+1,i+2.....K类训练样本作为负的训练样本训练SVM(i)(i=1....K-1),第K-1个支持向量机将以第K-1类样本作为正样本,以第K类样本为负样本训练SVM(K-1);
2.3、从训练样本集D中的第i类样本集中选取一个样本,根据类均值距离法求其与第i+1类所有样本间的距离δi,j(i=1,2...k,j=1,2,...k):
δi,j=||mi-mj||2-ri-rj
r i = 1 n Σ k = 1 n i | | x k i - m i | | 2
其中
Figure FSA00000280382300022
表示第i类样本集的均值向量,||mi-mj||2为i类和j类均值向量间的距离,ri和rj分别为i类及j类的类平均半径,ni为i类中的样本数目,称δi,j为i类和j类之间的类均值距离;
2.4、找出这些距离中的最小值及与这个最小距离所对应的第i+1类中的样本,将其放在预抽取样本集合PTS0中;
2.5、返回到步骤2.3,遍历完训练样本集D中第i类中的所有样本;
2.6、返回到步骤2.1,遍历完训练样本集D中第i+1类中的所有样本;
2.7、对预抽取样本集合PTS0中的样本做唯一化处理,获得最终的预抽取训练样本集合PTS。
3.根据权利要求1所述的融合增量学习的支持向量机多类分类方法,其特征在于步骤3中所述的循环迭代法按以下步骤进行:
3.1、以步骤2最终获取的预抽取向量集PTS,构造数据集的分类超平面;
3.2、利用所得到的分类超平面对训练样本集D进行测试,计算训练样本集D中样本与分类超平面间距离d,以及训练正确率P;
3.3、当分类正确率P较小时,减少加入预抽取训练样本集PTS中违反KKT条件(请解释一下KKT条件)的样本的数量,以求减少求解二次规划问题的规模;当分类正确率P较大时,加大加入预抽取训练样本集PTS中违反KKT条件的样本的数量,以求减少循环迭代的次数,并加入到预抽取训练样本集PTS中,取代原预抽取训练样本集PTS,作为下次循环迭代的训练样本集;
3.4、当训练正确率P<1时,重复3.3;当训练正确率P=1时跳出循环,结束迭代,训练结束,得到多类分类模型M-SVM。
4.根据权利要求1所述的融合增量学习的支持向量机多类分类方法,其特征在于步骤4包括:
4.1、将步骤3训练得到的SVM1作为二叉树的根节点,将属于第1类的测试样本决策出来;
4.2、将不属于第1类的样本通过SVM2继续进行分类,依次类推直到SVMK-1将第K类样本训练完,从而得到基于二叉树的SVM多类分类模型BTMSVM0
5.根据权利要求1所述的融合增量学习的支持向量机多类分类方法,其特征在于步骤5中所述的增量学习按以下步骤进行:
5.1、将增量样本集B0输入BTMSVM0,将增量样本集分为满足BTMSVM0的KKT条件和不满足KKT条件的2个集合;
5.2、对满足KKT条件的增量样本集和BTMSVM0的负例样本集分别进行密度法淘汰处理,得到剩余集;
5.3、将剩余集与BTMSVM0的正例样本集及增量样本集的不满足KKT条件的集合并得到新增量训练集B1
5.4、将新增量训练集B1输入BTMSVM0进行训练,得到新的多类分类模型BTMSVM1
CN 201010289451 2010-09-17 2010-09-17 一种融合增量学习的支持向量机多类分类方法 Pending CN101944122A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN 201010289451 CN101944122A (zh) 2010-09-17 2010-09-17 一种融合增量学习的支持向量机多类分类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN 201010289451 CN101944122A (zh) 2010-09-17 2010-09-17 一种融合增量学习的支持向量机多类分类方法

Publications (1)

Publication Number Publication Date
CN101944122A true CN101944122A (zh) 2011-01-12

Family

ID=43436113

Family Applications (1)

Application Number Title Priority Date Filing Date
CN 201010289451 Pending CN101944122A (zh) 2010-09-17 2010-09-17 一种融合增量学习的支持向量机多类分类方法

Country Status (1)

Country Link
CN (1) CN101944122A (zh)

Cited By (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103258217A (zh) * 2013-05-15 2013-08-21 中国科学院自动化研究所 一种基于增量学习的行人检测方法
CN103279761A (zh) * 2013-05-20 2013-09-04 浙江大学 一种用于支持向量机的在线向量选取方法
CN104508671A (zh) * 2012-06-21 2015-04-08 菲利普莫里斯生产公司 用于通过集成的偏差校正和分类预测生成生物标记签名的***和方法
CN104751200A (zh) * 2015-04-10 2015-07-01 中国电力科学研究院 一种svm网络业务分类的方法
CN106407237A (zh) * 2015-08-03 2017-02-15 科大讯飞股份有限公司 在线学习试题推荐方法及***
CN106897705A (zh) * 2017-03-01 2017-06-27 上海海洋大学 一种基于增量学习的海洋观测大数据分布方法
CN107633265A (zh) * 2017-09-04 2018-01-26 深圳市华傲数据技术有限公司 用于优化信用评估模型的数据处理方法及装置
CN107766418A (zh) * 2017-09-08 2018-03-06 广州汪汪信息技术有限公司 一种基于融合模型的信用评估方法、电子设备和存储介质
CN108537227A (zh) * 2018-03-21 2018-09-14 华中科技大学 一种基于宽度学习和广角显微图像的商品离线鉴伪方法
CN108564105A (zh) * 2018-02-28 2018-09-21 浙江工业大学 一种针对肌电个体差异问题的在线手势识别方法
CN108877947A (zh) * 2018-06-01 2018-11-23 重庆大学 基于迭代均值聚类的深度样本学习方法
CN109033079A (zh) * 2018-07-06 2018-12-18 龙马智芯(珠海横琴)科技有限公司 语言模型的训练方法、训练装置及检验方法
CN109767545A (zh) * 2017-01-10 2019-05-17 中国人民银行印制科学技术研究所 有价票据的缺陷分类方法及缺陷分类***
CN109871889A (zh) * 2019-01-31 2019-06-11 内蒙古工业大学 突发事件下大众心理评估方法
CN110334580A (zh) * 2019-05-04 2019-10-15 天津开发区精诺瀚海数据科技有限公司 基于集成增量的动态权重组合的设备故障分类方法
CN110688944A (zh) * 2019-09-26 2020-01-14 西南交通大学 一种基于图像识别和机器学习的螺栓松弛监测方法
CN110728313A (zh) * 2019-09-29 2020-01-24 北京声智科技有限公司 一种用于意图分类识别的分类模型训练方法及装置
CN111382757A (zh) * 2018-12-28 2020-07-07 深圳市优必选科技有限公司 深度学习分类算法中动态调节训练样本的方法及终端设备
CN111523710A (zh) * 2020-04-10 2020-08-11 三峡大学 基于pso-lssvm在线学习的电力设备温度预测方法
CN112463815A (zh) * 2020-10-30 2021-03-09 贵州力创科技发展有限公司 一种基于移动通信数据的tb级数据快速检索方法及***
CN113326857A (zh) * 2020-02-28 2021-08-31 合肥美亚光电技术股份有限公司 模型训练方法及装置
CN113449779A (zh) * 2021-06-11 2021-09-28 南京航空航天大学 基于样本分布密度改进kkt条件的svm增量学习方法

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101206667A (zh) * 2007-12-06 2008-06-25 上海交通大学 减少训练时间与支持向量的方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101206667A (zh) * 2007-12-06 2008-06-25 上海交通大学 减少训练时间与支持向量的方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
《浙江工商大学硕士学位论文》 20100811 郑丽丽 基于遗传算法和多类支持向量机的***行为评估模型研究 论文第41-49页,图4-4至4-7 1-5 , 2 *

Cited By (33)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104508671A (zh) * 2012-06-21 2015-04-08 菲利普莫里斯生产公司 用于通过集成的偏差校正和分类预测生成生物标记签名的***和方法
US10339464B2 (en) 2012-06-21 2019-07-02 Philip Morris Products S.A. Systems and methods for generating biomarker signatures with integrated bias correction and class prediction
CN104508671B (zh) * 2012-06-21 2018-10-19 菲利普莫里斯生产公司 通过偏差校正和分类预测生成生物标记签名的***和方法
CN103258217A (zh) * 2013-05-15 2013-08-21 中国科学院自动化研究所 一种基于增量学习的行人检测方法
CN103279761A (zh) * 2013-05-20 2013-09-04 浙江大学 一种用于支持向量机的在线向量选取方法
CN104751200A (zh) * 2015-04-10 2015-07-01 中国电力科学研究院 一种svm网络业务分类的方法
CN104751200B (zh) * 2015-04-10 2019-05-21 中国电力科学研究院 一种svm网络业务分类的方法
CN106407237A (zh) * 2015-08-03 2017-02-15 科大讯飞股份有限公司 在线学习试题推荐方法及***
CN106407237B (zh) * 2015-08-03 2020-02-07 科大讯飞股份有限公司 在线学习试题推荐方法及***
CN109767545B (zh) * 2017-01-10 2021-06-08 中钞印制技术研究院有限公司 有价票据的缺陷分类方法及缺陷分类***
CN109767545A (zh) * 2017-01-10 2019-05-17 中国人民银行印制科学技术研究所 有价票据的缺陷分类方法及缺陷分类***
CN106897705A (zh) * 2017-03-01 2017-06-27 上海海洋大学 一种基于增量学习的海洋观测大数据分布方法
CN106897705B (zh) * 2017-03-01 2020-04-10 上海海洋大学 一种基于增量学习的海洋观测大数据分布方法
CN107633265A (zh) * 2017-09-04 2018-01-26 深圳市华傲数据技术有限公司 用于优化信用评估模型的数据处理方法及装置
CN107633265B (zh) * 2017-09-04 2021-03-30 深圳市华傲数据技术有限公司 用于优化信用评估模型的数据处理方法及装置
CN107766418A (zh) * 2017-09-08 2018-03-06 广州汪汪信息技术有限公司 一种基于融合模型的信用评估方法、电子设备和存储介质
CN108564105A (zh) * 2018-02-28 2018-09-21 浙江工业大学 一种针对肌电个体差异问题的在线手势识别方法
CN108537227A (zh) * 2018-03-21 2018-09-14 华中科技大学 一种基于宽度学习和广角显微图像的商品离线鉴伪方法
CN108877947B (zh) * 2018-06-01 2021-10-15 重庆大学 基于迭代均值聚类的深度样本学习方法
CN108877947A (zh) * 2018-06-01 2018-11-23 重庆大学 基于迭代均值聚类的深度样本学习方法
CN109033079A (zh) * 2018-07-06 2018-12-18 龙马智芯(珠海横琴)科技有限公司 语言模型的训练方法、训练装置及检验方法
CN111382757A (zh) * 2018-12-28 2020-07-07 深圳市优必选科技有限公司 深度学习分类算法中动态调节训练样本的方法及终端设备
CN111382757B (zh) * 2018-12-28 2023-09-08 深圳市优必选科技有限公司 深度学习分类算法中动态调节训练样本的方法及终端设备
CN109871889A (zh) * 2019-01-31 2019-06-11 内蒙古工业大学 突发事件下大众心理评估方法
CN110334580A (zh) * 2019-05-04 2019-10-15 天津开发区精诺瀚海数据科技有限公司 基于集成增量的动态权重组合的设备故障分类方法
CN110688944B (zh) * 2019-09-26 2022-06-21 西南交通大学 一种基于图像识别和机器学习的螺栓松弛监测方法
CN110688944A (zh) * 2019-09-26 2020-01-14 西南交通大学 一种基于图像识别和机器学习的螺栓松弛监测方法
CN110728313A (zh) * 2019-09-29 2020-01-24 北京声智科技有限公司 一种用于意图分类识别的分类模型训练方法及装置
CN113326857A (zh) * 2020-02-28 2021-08-31 合肥美亚光电技术股份有限公司 模型训练方法及装置
CN111523710A (zh) * 2020-04-10 2020-08-11 三峡大学 基于pso-lssvm在线学习的电力设备温度预测方法
CN112463815A (zh) * 2020-10-30 2021-03-09 贵州力创科技发展有限公司 一种基于移动通信数据的tb级数据快速检索方法及***
CN113449779A (zh) * 2021-06-11 2021-09-28 南京航空航天大学 基于样本分布密度改进kkt条件的svm增量学习方法
CN113449779B (zh) * 2021-06-11 2024-04-16 南京航空航天大学 基于样本分布密度改进kkt条件的svm增量学习方法

Similar Documents

Publication Publication Date Title
CN101944122A (zh) 一种融合增量学习的支持向量机多类分类方法
CN102521656B (zh) 非平衡样本分类的集成迁移学习方法
CN106529503B (zh) 一种集成卷积神经网络人脸情感识别方法
CN101587493B (zh) 文本分类方法
CN104616030A (zh) 一种基于极限学习机算法的识别方法
CN107291688A (zh) 基于主题模型的裁判文书相似度分析方法
CN106126751A (zh) 一种具有时间适应性的分类方法及装置
CN105389583A (zh) 图像分类器的生成方法、图像分类方法和装置
Juhász et al. The who, what, when, and how of industrial policy: A text-based approach
CN103631874A (zh) 社交平台的ugc标签类别确定方法和装置
CN104599159A (zh) 一种基于支持向量机原理的用户行为识别方法
CN103942214B (zh) 基于多模态矩阵填充的自然图像分类方法及装置
Caciularu et al. Long context question answering via supervised contrastive learning
Di Liello et al. Efficient pre-training objectives for transformers
CN106227720B (zh) 一种app软件用户评论模式识别方法
CN111429155A (zh) 银行卡争议处理方法及装置
CN106203515A (zh) 多准则融合应用于高维小样本数据特征选择的方法
Görg et al. Price cost margins and exporting behaviour: Evidence from firm level data
CN110222737A (zh) 一种基于长短时记忆网络的搜索引擎用户满意度评估方法
CN105512914A (zh) 一种信息处理方法及电子设备
Choudhary et al. Loan payment date prediction model using machine learning regression algorithms
CN108287902A (zh) 一种基于数据非随机缺失机制的推荐***方法
Ahmadov The Development of the Innovative SMEs in Slovakia in the Context of Macroeconomic Environment
CN110162629B (zh) 一种基于多基模型框架的文本分类方法
CN103207893A (zh) 基于向量组映射的两类文本的分类方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Open date: 20110112