CN108304876A - 分类模型训练方法、装置及分类方法及装置 - Google Patents

分类模型训练方法、装置及分类方法及装置 Download PDF

Info

Publication number
CN108304876A
CN108304876A CN201810098964.2A CN201810098964A CN108304876A CN 108304876 A CN108304876 A CN 108304876A CN 201810098964 A CN201810098964 A CN 201810098964A CN 108304876 A CN108304876 A CN 108304876A
Authority
CN
China
Prior art keywords
data
source domain
domain
vector
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810098964.2A
Other languages
English (en)
Other versions
CN108304876B (zh
Inventor
孙源良
樊雨茂
刘萌
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guoxin Youe Data Co Ltd
Original Assignee
Guoxin Youe Data Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guoxin Youe Data Co Ltd filed Critical Guoxin Youe Data Co Ltd
Priority to CN201810098964.2A priority Critical patent/CN108304876B/zh
Publication of CN108304876A publication Critical patent/CN108304876A/zh
Application granted granted Critical
Publication of CN108304876B publication Critical patent/CN108304876B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computational Linguistics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Image Analysis (AREA)

Abstract

本发明提供了一种分类模型训练方法、装置以及分类方法及装置,其中,该分类模型训练方法包括:使用第一神经网络对源域数据和目标域数据进行共有特征捕捉,使第一目标域特征向量学习源域数据和目标域数据的共有特征;使用第二神经网络对源域数据和目标域数据进行差异性特征捕捉,使第二目标域特征向量学习源域数据和目标域数据的差异特征;分别对第一目标域特征向量以及第二目标域特征向量进行聚类;根据聚类的结果及第一分类结果,对第一神经网络以及第一分类器进行本轮训练。该方法既能够将源域和目标域之间的相同特征利用起来,也能够将源域和目标域之间的差异特征进行利用,训练所得的分类模型能够获得更加准确的分类结果。

Description

分类模型训练方法、装置及分类方法及装置
技术领域
本发明涉及深度学习技术领域,具体而言,涉及一种分类模型训练方法、装置以及分类方法及装置。
背景技术
迁移学习可以利用已知领域中有标签的训练样本(可称为源域数据)训练分类模型来对目标领域的数据(可称为目标域数据)进行标定,而并不要求源域数据和目标域数据具有相同的数据分布。迁移学习实际上是通过找寻待标定数据和已知标签数据之间的联系,例如采用核函数的方式将源域和目标域数据映射到同一空间中,在该空间下源域数据和目标域数据拥有相同的分布,从而可以利用该空间表示的有标签的源域样本数据训练分类器来对目标领域进行标定。
已有的迁移学习方法中,通常使用源域数据和目标域数据训练同一神经网络,获得参数共享网络。该网络训练过程能够找出源域数据和目标域数据之间的共性,通常将源域数据和目标域数据映射在具有高可比性的高位空间,从而得到两个域的分布特征。这种训练方法虽然能够将源域数据和目标域数据之间的相同特征利用起来,却使源域和目标域之间的差异特征丢失严重,导致训练得到的分类模型在对目标域数据进行分类时存在一定的误差。
发明内容
有鉴于此,本发明实施例的目的在于提供一种分类模型训练方法、装置及分类方法及装置,既能够将源域和目标域之间的相同特征利用起来,也能够将源域和目标域之间的差异特征进行利用,训练所得的分类模型能够获得更加准确的分类结果。
第一方面,本发明实施例提供了一种分类模型训练方法,该方法包括:
获取携带标签的源域数据以及未携带标签的目标域数据;
将所述源域数据以及所述目标域数据输入第一神经网络,为所述源域数据提取第一源域特征向量,为所述目标域数据提取第一目标域特征向量;并
对所述源域数据和所述目标域数据进行共有特征捕捉,使所述第一目标域特征向量学习所述源域数据和所述目标域数据的共有特征;并
将所述第一源域特征向量输入第一分类器得到第一分类结果;
将所述源域数据以及所述目标域数据输入第二神经网络,为所述目标域数据提取第二目标域特征向量;并
对所述源域数据和所述目标域数据进行差异性特征捕捉,使所述第二目标域特征向量学习所述源域数据和所述目标域数据的差异特征;
分别对所述第一目标域特征向量以及所述第二目标域特征向量进行聚类;
根据聚类的结果,以及所述第一分类结果,对所述第一神经网络以及所述第一分类器进行本轮训练;
经过对所述第一神经网络和所述第一分类器进行多轮训练,得到分类模型。
第二方面,本发明实施例还提供一种分类方法,该方法包括:
获取待分类数据;
将所述待分类数据输入至通过本申请实施例提供的分类模型训练方法得到的分类模型中,得到所述待分类数据的分类结果;
其中,所述分类模型包括:所述第一神经网络和所述第一分类器。
第二方面,本发明实施例还提供一种分类模型训练装置,包括:
获取模块,用于获取携带标签的源域数据以及未携带标签的目标域数据;
第一处理模块,用于将源域数据以及目标域数据输入第一神经网络,为源域数据提取第一源域特征向量,为目标域数据提取第一目标域特征向量;并对源域数据和目标域数据进行共有特征捕捉,使第一目标域特征向量学习源域数据和目标域数据的共有特征;并将第一源域特征向量输入第一分类器得到第一分类结果;
第二处理模块,用于将源域数据以及目标域数据输入第二神经网络,为目标域数据提取第二目标域特征向量;并对源域数据和目标域数据进行差异性特征捕捉,使第二目标域特征向量学习源域数据和目标域数据的差异特征;
聚类模块,用于分别对第一目标域特征向量以及第二目标域特征向量进行聚类;
训练模块,用于根据聚类的结果,以及的第一分类结果,对第一神经网络以及第一分类器进行本轮训练;经过对第一神经网络和第一分类器进行多轮训练,得到分类模型。
第四方面,本发明实施例还提供一种分类装置,包括:待分类数据获取模块,用于获取待分类数据;
分类模块,用于将待分类数据输入至通过本申请实施例提供的分类模型训练方法得到的分类模型中,得到待分类数据的分类结果;其中,分类模型包括:第一神经网络和第一分类器。
第五方面,本发明实施例还提供一种计算机设备,该设备包括存储器、处理器及存储在该存储器上并可在该处理器上运行的计算机程序,其中,上述处理器执行上述计算机程序时实现本申请实施例提供的分类模型训练方法的步骤。
第六方面,本发明实施例还提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行本方实施例所提供的分类模型训练方法的步骤。
本发明实施例利用第一神经网络,为源域数据提取第一源域特征向量,为目标域数据提取第一目标域特征向量时,能够对源域数据和目标域数据进行共有特征的捕捉,使第一目标域特征向量学习源域数据和目标域数据的共有特征的同时,会利用第二神经网络为目标域数据提取第二目标域特征向量;能够对源域数据和目标域数据进行差异性特征捕捉,使第二目标域特征向量学习源域数据和目标域数据的差异特征,然后根据捕捉到的相同特征和差异性特征,对第一神经网络和第一分类器进行训练,得到的分类模型,既能够将源域和目标域之间的相同特征利用起来,也能够将源域和目标域之间的差异特征进行利用,进而该分类模型能够获得更加准确的分类结果。
为使本发明的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1示出了本发明实施例所提供的一种分类模型训练方法的流程图;
图2示出了本发明实施例所提供的分类模型训练方法中,对源域数据和目标域数据进行共有特征捕捉的具体方法的流程图;
图3示出了本发明实施例所提供的分类模型训练方法中,根据域分类结果,对第一神经网络进行参数调整的具体方法的流程图;
图4示出了本发明实施例所提供的分类模型训练方法中,对源域数据和目标域数据进行差异性特征捕捉的具体方法的流程图;
图5示出了本发明实施例所提供的分类模型训练方法中,根据域分类结果,对第二神经网络进行参数调整的具体方法的流程图;
图6示出了本发明实施例所提供的分类模型训练方法中,根据聚类结果对第一神经网络进行本轮训练的具体方法的流程图;
图7示出了本发明实施例所提供的分类模型训练方法中,相似度计算操作的具体方法的流程图;
图8示出了本发明实施例所提供的一种分类方法的流程图;
图9示出了本发明实施例所提供的一种分类模型训练装置的结构示意图;
图10示出了本发明实施例所提供的一种分类装置的结构示意图;
图11示出了本发明实施例所提供的一种计算机设备的结构示意图
具体实施方式
与现有技术不同,本发明实施例利用第一神经网络,为源域数据提取第一源域特征向量,为目标域数据提取第一目标域特征向量时,能够对源域数据和目标域数据进行共有特征的捕捉,使第一目标域特征向量学习源域数据和目标域数据的共有特征的同时,会利用第二神经网络为目标域数据提取第二目标域特征向量;能够对源域数据和所述目标域数据进行差异性特征捕捉,使第二目标域特征向量学习源域数据和目标域数据的差异特征,然后根据捕捉到的相同特征和差异性特征,对第一神经网络和第一分类器进行训练,得到的分类模型,既能够将源域和目标域之间的相同特征利用起来,也能够将源域和目标域之间的差异特征进行利用,进而该分类模型能够获得更加准确的分类结果。
为便于对本实施例进行理解,首先对本发明实施例所公开的一种分类模型训练方法进行详细介绍,该方法用于对各种数据的分类模型的训练,所得的分类模型能够对对应数据进行分类。
参见图1所示,本发明实施例提供的分类模型训练方法包括:
S101:获取携带标签的源域数据以及未携带标签的目标域数据。
在具体实现的时候,源域数据为带有标签的数据,目标域数据为不带有标签的数据。源域数据和目标域数据具有一定的共性,又有一定的差异性。
可以认为源域数据作为训练样本数量充足,而现实需求需要对具有预设特征的目标域数据进行分类,而具有预设特征的第二目标域数据作为训练样本数量不足,或者训练过程中困难较大,那么,需要通过迁移学习,在对源域数据学习的过程中,同时学习预设特征,从而将预设特征与源域数据特征融合;同时,还需要通过迁移学习,在对源域数据学习的过程中,同时学习到源域数据与目标域数据之间的差异特征,从而将预设特征、源域数据与目标域数据的差异特征均和源域数据特征融合,充分学习目标域特征空间,对目标域数据的分类更加的准确。
此处,源域数据以及目标域数据可以是图像、视频、语言等可以采用神经网络学习进行分类的数据。
例如当源域数据和目标域数据均为图像数据时,源域数据可以为质量较好的图像,如使用分辨率较高的图像获取设备在均匀光照条件下,所获得的面部无遮挡物的清晰人脸图像。源域数据中的人脸可以是多种角度的人脸图像,例如人脸正视图像、侧视图像、斜视图像、仰视图像、俯视图像等。
目标域数据均为具有预设特征的图像,如图像质量较差的图像,可以是用分辨率较低的图像获取设备在非均匀的多种不同光照条件下所获取的不清晰的人脸图像。目标域数据中的人脸也可以是多种角度的人脸图像。
又例如,当源域数据和目标域数据均为语言数据时,源域数据为法语词汇,目标域数据为西班牙语词汇,由于法语和西班牙语同属于拉丁语系,因此两者之间具有部分共同的特征;但两者属于两种不同的语言,因此又具有一定的差异。使用能够识别的法语对西班牙语的特征进行学习,从而能够识别西班牙语。
又例如,源域数据和目标域数据为语言数据时,要对某些词汇或者话术进行情感分析;源域数据为已经标注了情感标签的词汇,目标域数据是未标注情感标签的话术。
S102:将源域数据以及目标域数据输入第一神经网络,为源域数据提取第一源域特征向量,为目标域数据提取第一目标域特征向量;并对源域数据和目标域数据进行共有特征捕捉,使第一目标域特征向量学习源域数据和目标域数据的共有特征;并将第一源域特征向量输入第一分类器得到第一分类结果。
在具体实现的时候,第一神经网络可以采用卷积神经网络(ConvolutionalNeural Network,CNN)来为源域数据提取第一源域特征向量,为目标域数据提取第一目标域特征向量。
源域数据为携带有标签的数据,该标签用于指示源域数据的正确分类结果;目标域数据为不携带标签的数据。在将源域数据和目标域数据输入第一神经网络后,第一神经网络对源域数据以及目标域数据进行共享参数的特征学习。在这个过程中,由于第一神经网络对源域数据进行有监督学习,而对目标域数据进行无监督学习,在使用同一第一神经网络对源域数据和目标域数据进行共享参数的学习过程中,会不断调整第一神经网络中所使用的参数,从而在对第一神经网络训练的过程中,让第一神经网络的参数受到目标域数据的影响,进而使得第一神经网络在对源域数据和目标域数据进行特征学习后,对每个源域数据进行特征提取所得到的第一源域特征向量中会受到目标域数据的干扰,实现源域数据和目标域数据的域间混合。
同时,在为源域数据提取第一源域特征向量,并为目标域数据提取第一目标域特征向量后,还会对源域数据和目标域数据进行共有特征的捕捉,这使得在对第一神经网络训练的时候,为源域数据提取得到的第一源域特征向量受到的目标域数据的干扰,就是受到源域数据和目标域数据共有特征的干扰,从而在实现源域数据和目标域数据的域间融合的时候,将源域数据和目标域数据的共有域进行融合,最终使得第一源域特征向量学习到源域数据和目标域数据的共有特征。
参见图2所示,本发明实施例还提供一种对源域数据和目标域数据进行共有特征捕捉的具体方法。该方法包括:
S201:在为源域数据提取第一源域特征向量,并为目标域数据提取第一目标域特征向量之后,将第一源域特征向量和第一目标域特征向量进行梯度反向处理。
S202:将进行梯度反向处理的第一源域特征向量和第一目标域特征向量输入第一域分类器。
S203:根据第一域分类器对第一源域特征向量以及第一目标域特征向量分别表征的源域数据和目标域数据的域分类结果,对第一神经网络进行参数调整。
在具体实现的时候,由于在使用源域数据和目标域数据对第一神经网络进行训练的过程,实际上是要将源域数据和目标域数据进行域混合的过程。即使用第一神经网络对源域数据进行特征提取所获得的第一源域特征向量要受到目标域数据中特征的影响,也即,使得第一源域特征向量向目标域数据的特征接近;同时,使用第一神经网络对源域数据进行特征提取所获取的第一目标域特征向量受到源域数据中特征的影响,也即,使得第一目标域特征向量向源域数据的特征接近。因此,为了实现对源域数据和目标域数据的域混合,在为目标域数据中的每个目标域数据提取第一目标域特征向量,并为源域数据中的每个源域数据提取第一源域特征向量后,要将第一目标域特征向量和第一源域特征向量进行梯度反向处理,然后将经过梯度反向处理的第一目标域特征向量和第一源域特征向量输入至第一域分类器,使用第一域分类器对第一目标域特征向量和第一源域特征向量进行域分类。
域分类的结果正确,也即第一域分类器能够正确对第一源域特征向量和第一目标域特征向量进行正确分类的概率越大,则说明域混合的程度越小;域分类的结果错误的概率越大,也即域分类器对第一源域特征向量和第一目标域特征向量进行分类正确的概率越小,说明域混合的程度越大,因此,要基于第一域分类器对第一目标域特征向量和第一源域特征向量分别表征的源域数据和目标域数据进行分类的结果,对第一神经网络进行参数调整。
此处,参见图3所示,可以通过执行下述域分类损失确定操作,来实现根据域分类结果,对第一神经网络进行参数调整:
S301:确定当前第一源域特征向量以及第一目标域特征向量分别表征的源域数据和目标域数据的本次域分类的域分类损失。
此处,通过域分类损失来表征域混合的程度。源域数据的域分类损失是指在基于第一源域特征向量和第一目标域特征向量对源域数据和目标域数据进行分类的过程中,分类结果为被分到目标域中的源域数据的数量。目标域数据的域分类损失是指在基于第一源域特征向量和第一目标域特征向量对源域数据和目标域数据进行分类的过程中,分类结果为被分到源域中的目标域数据的数量。在使用第一域分类器对第一源域特征向量以及第一目标域特征向量分别表征的源域数据和目标域数据进行域分类后,就能够获得域分类结果,然后按照域分类结果,确定源域数据合目标域数据分别对应的域分类损失。
S302:针对最近预设次数的域分类损失之间的差别不小于预设差别阈值,生成第三反馈信息,并基于该第三反馈信息对第一神经网络进行参数调。
此处,使用预设差别阈值来对域混合的程度进行约束。第一域分类器中预先存储有第一源域特征向量和第一目标域特征向量分别所属域的分布,当最近预设次数的域分类损失之间的差别不小于预设差别阈值时,则认为域分类还未达到稳定的状态,也就是说,在某次域分类中,第一域分类器能正确区分第一源域特征向量和第一目标域特征向量分别所属的域,某次域分类中,域分类器又不能正确区分第一源域特征向量和第一目标域特征向量分别所属的域,域混合程度还不稳定,那么,需要对第一神经网络的参数进行调整,因此会生成域分类损失差别过大的第三反馈信息,并反馈给第一神经网络。第一神经网络在接收到该域分类损失差别过大的第三反馈信息后,会对自身的参数进行调整。
S303:基于调整后的参数,使用第一神经网络为源域数据提取新的第一源域特征向量,并为目标域数据提取新的第一目标域特征向量,并执行域分类损失确定操作,直至差别大于预设差别阈值,完成基于第一域分类器对第一神经网络的本轮训练。
基于第一域分类器对第一神经网络的训练,是要根据第一域分类器的对第一源域特征向量和第一目标域特征向量的分类结果所确定的域分类损失维持在一定的值上,尽可能分不清楚目标域数据和源域数据到底是属于源域还是属于目标域,提取两者的公用特征。
此处,需要注意的是,当最近预设次数的域分类损失之间的差别小于预设差别阈值时,也会生成域分类损失合适的反馈信息,并将之反馈给第一神经网络。第一神经网络在接收到该域分类损失合适的反馈信息后,还会对自身的参数进行幅度较小的调整,力求梯度下降到局部最优。
S103:将源域数据以及目标域数据输入第二神经网络,为目标域数据提取第二目标域特征向量;并对源域数据和目标域数据进行差异性特征捕捉,使第二目标域特征向量学习源域数据和目标域数据的差异特征。
在具体实现的时候,第二神经网络可以采用卷积神经网络(ConvolutionalNeural Network,CNN)来为源域数据提取第二源域特征向量,为目标域数据提取第二目标域特征向量。
可选地,第一神经网络和第二神经网络为结构相同的神经网络。
源域数据为携带有标签的数据,该标签用于指示源域数据的正确分类结果;目标域数据为不携带标签的数据。在将源域数据和目标域数据输入第二神经网络后,第二神经网络对源域数据以及目标域数据进行共享参数的特征学习。在这个过程中,由于第二神经网络对源域数据进行有监督学习,而对目标域数据进行无监督学习,在使用同一第二神经网络对源域数据和目标域数据进行共享参数的学习过程中,会不断调整第一神经网络中所使用的参数,从而在对第二神经网络训练的过程中,让第二神经网络的参数受到目标域数据的影响,进而使得第二神经网络在对源域数据和目标域数据进行特征学习后,对每个源域数据进行特征提取所得到的第二源域特征向量中会受到目标域数据的干扰,实现源域数据和目标域数据的域间混合。
同时,在为源域数据提取第二源域特征向量,并为目标域数据提取第二目标域特征向量后,还会对源域数据和目标域数据进行差异性特征的捕捉,这使得在对第二神经网络训练的时候,为源域数据提取得到的第二源域特征向量受到的目标域数据的干扰,也即,受到源域数据和目标域数据差异性特征的干扰,从而在实现源域数据和目标域数据的域间融合的时候,将源域数据和目标域数据的差异性域进行融合,最终使得第二源域特征向量学习到源域数据和目标域数据的差异性特征。
在对源域数据和目标域数据进行差异性特征捕捉之前,要为源域数据提取第二源域特征向量。
参见图4所示,本发明实施例还提供一种对源域数据和目标域数据进行差异性特征捕捉的具体方法。该方法包括:
S401:将所第二源域特征向量和第二目标域特征向量输入第二域分类器。
S402:根据第二域分类器的对第二源域特征向量以及第二目标域特征向量分别表征的源域数据和目标域数据的域分类结果,对第二神经网络进行参数调整。
在具体实现的时候,在不对第二源域特征向量和第二目标域特征向量进行梯度反向处理,而是将两者直接输入第二域分类器,使用第二域分类器对第二源域特征向量以及第二目标域特征向量分别表征的源域数据和目标域数据进行域分类,所得到的域分类损失越小,才能够尽可能区分出源域数据和目标域数据所属的域。使得第二神经网络能够捕捉到源域数据和目标域数据之间的差异性特征,拉远两者之间的距离。
具体地,参见图5所示,可以通过执行下述域分类损失确定操作,来实现根据域分类结果,对第二神经网络进行参数调整:
S501:确定当前第二源域特征向量以及第二目标域特征向量分别表征的源域数据和目标域数据的本次域分类的域分类损失。
此处,通过域分类损失来表征第二源域特征向量和第二目标域特征向量进行域混合的程度。源域数据的域分类损失是指在基于第二源域特征向量和第二目标域特征向量对源域数据和目标域数据进行分类的过程中,分类结果为目标域数据的源域数据的数量。目标域数据的域分类损失是指在基于第二源域特征向量和第二目标域特征向量对源域数据和目标域数据进行分类的过程中,分类结果为源域数据的目标域数据的数量。在使用地域分类器对第二源域特征向量以及第二目标域特征向量分别表征的源域数据和目标域数据进行域分类后,就能够获得域分类结果,然后按照域分类结果,确定源域数据合目标域数据分别对应的域分类损失。
S502:针对域分类结果错误的情况,生成第四反馈信息,并基于第四反馈信息对第二神经网络进行参数调整。
此处,由于要保证域分类结果的正确性,只有域分类结果是正确的,才会拉远源域数据和目标域数据之间的距离,也即提取到源域数据和目标域数据之间的差异性数据,因此要在域分类结果错误的时候,生成第四反馈信息,并基于第四反馈信息对第二神经网络进行参数调整。
S503:基于调整后的参数,使用第二神经网络为源域数据提取新的第二源域特征向量,并为目标域数据提取新的第二目标域特征向量,并执行域分类损失确定操作。
直至域分类结果正确,或者域分类结果的正确率达到预设的阈值。
S104:分别对第一目标域特征向量以及第二目标域特征向量进行聚类。
S105:根据聚类的结果,以及的第一分类结果,对第一神经网络以及第一分类器进行本轮训练。
在具体实现的时候,根据聚类的结果,以及的第一分类结果,对第一神经网络以及第一分类器进行本轮训练,是要根据聚类的结果,对第一神经网络在训练过程中的参数进行调整,并根据第一分类结果,度第一神经网络和第一分类器在训练过程中的参数进行调整。
其一:根据聚类的结果,对第一神经网络在训练过程中的参数进行调整时,由于是要使用第一神经网络为目标域数据提取第一目标域特征向量,并使用第二神经网络为目标域数据提取第二目标域特征向量,模型最终的训练结果,是要对目标域数据进行尽可能正确的分类,因此在对第一神经网络和第二神经网络进行训练的过程中,要保证两者分别提取的第一目标域特征向量和第二目标域特征向量的分布的相似性在一定范围之内。
这里的第一目标域特征向量和第二目标域特征向量的分布的相似性,是指,目标域数据包括了多个数据。这多个数据均属于目标域数据。在对每个目标域数据提取特征向量的时候,是为这多个数据中的每个分别提取特征向量;多个数据的第一目标域特征向量和第二目标域特征向量在空间上的分布是相似的。
因此,此处要对第一目标域特征向量和第二目标域特征向量分别进行聚类。
参见图6所示,在根据聚类结果对第一神经网络进行本轮训练的时候,包括:
S601:根据对第一目标域特征向量进行聚类的结果,生成第一邻接矩阵。
具体地,由于在将第一目标域特征向量进行聚类的时候,可以将每个第一目标域数据看作是映射到高维空间中的点,根据点与点之间的距离,对这些点进行聚类操作,将距离在预设阈值以内的点划分到同一类中。然后根据聚类操作的结果,形成点到点之间距离的第一邻接矩阵。
在第一邻接矩阵中,如果两个点在聚类时属于同一类,则两者之间的距离为1;如果两个点在聚类时不属于同一类,则两点之间的距离为0。
例如,目标域数据有5个,得到的第一目标域特征向量分别为:1、2、3、4、5。其中,对第一目标域特征向量进行聚类的结果为:{1,3}、{2}、{4,5},则形成的邻接矩阵为:
S602:根据对第二目标域特征向量进行聚类的结果,生成第二邻接矩阵。
此处,生成第二邻接矩阵的方法与生成第一邻接矩阵的方法类似,在此不再赘述。
S603:根据第一邻接矩阵以及第二邻接矩阵之间的相似度,对第一神经网络进行训练。
此处,在根据第一邻接矩阵以及第二邻接矩阵之间的相似度,对第一神经网络进行训练时,执行如下相似度计算操作,直至第一邻接矩阵和第二邻接矩阵之间的相似度小于预设的相似度阈值。
参见图7所示,相似度计算操作包括:
S701:计算当前得到的第一邻接矩阵和第二邻接矩阵之间的相似度。
在具体实现的时候,在计算当前得到的第一邻接矩阵和第二邻接矩阵之间的相似度时,计算第一邻接矩阵的迹和第二邻接矩阵的迹,第一邻接矩阵的迹和第二邻接矩阵的迹之间的距离越近,则第一邻接矩阵和第二邻接矩阵之间的相似度越高。在对第一邻接矩阵的迹和第二邻接矩阵的迹之间的距离进行求解时,可以将第一邻接矩阵的迹与第二邻接矩阵的迹之间的差作为第一邻接矩阵和第二邻接矩阵之间的相似度,也即第一邻接矩阵的迹与第二邻接矩阵的迹之间的差的绝对值越大,第一邻接矩阵和第二邻接矩阵的相似度越低。
S702:针对相似度不小于预设的相似度阈值的情况,生成第一反馈信息,并基于第一反馈信息对第一神经网络和第二神经网络进行参数调整。
S703:基于调整后的参数,使用第一神经网络为目标域数提取新的第一目标域特征向量,以及使用第二神经网络为目标域数据提取新的第二目标域特征向量;
S704:对新的第一目标域特征向量进行聚类,生成新的第一邻接矩阵,以及,对新的第二目标域特征向量进行聚类,生成新的第二邻接矩阵,并再次执行相似度计算操作。
由于第一邻接矩阵和第二邻接矩阵之间的相似度越高,则第一邻接矩阵表征的对第一目标域特征向量进行分类的分类结果,和第二邻接矩阵表征的对第二目标域特征向量进行分类的分类结果越相似,因此要根据第一邻接矩阵和第二邻接矩阵之间的相似度,对第一神经网络进行参数调整,使得第一神经网络在对源域数据和目标域数据之间的差异特征进行限制,加快模型收敛。
其二,根据第一分类结果,对第一神经网络和第一分类器在训练过程中的参数进行调整。
具体地,在根据第一分类结果,对对第一神经网络和第一分类器在训练过程中的参数进行调整时,执行如下分类操作,知道得到的第一分类结果正确,则完成基于第二神经网络对第一神经网络和第一分类器的本轮训练。
该分类操作包括:
使用第一分类器对当前提取的第一源域特征向量进行分类;
针对分类结果错误的情况,生成第二反馈信息,并将于第二反馈信息,对第一神经网络以及第一分类器的参数进行调整;
基于调整后的参数,使用第一神经网络为源域数据提取新的第一源域特征向量,并再次执行分类操作。
此处,由于分类模型要对目标域数据进行分类,要尽量保证分类的正确性的前提下,在利用源域和目标域支架的差异性特征的同时,要保证对源域数据的分类结果是正确的,因此要使用第一分类结果对第一神经网络和第一分类器的参数进行约束。
S106:经过对第一神经网络和第一分类器进行多轮训练,得到分类模型。
在具体实现的时候,对第一神经网络和第一分类器进行一轮训练,是指使用一组源域数据和目标域数据对第一神经网络和第一分类器进行训练。之后,还会继续输入多组域数据和目标域数据对第一神经网络和第一分类器进行训练,直至得到满足要求的第一神经网络和第一分类器,并将得到的第一神经网络和第一分类器作为得到的分类模型。
上述过程中,S102和S103之间并无先后执行顺序。
本发明实施例提供的分类模型训练方法中,利用第一神经网络,为源域数据提取第一源域特征向量,为目标域数据提取第一目标域特征向量时,能够对源域数据和目标域数据进行共有特征的捕捉,使第一目标域特征向量学习源域数据和目标域数据的共有特征的同时,会利用第二神经网络为目标域数据提取第二目标域特征向量;能够对源域数据和目标域数据进行差异性特征捕捉,使第二目标域特征向量学习源域数据和目标域数据的差异特征,然后根据捕捉到的相同特征和差异性特征,对第一神经网络和第一分类器进行训练,得到的分类模型,既能够将源域和目标域之间的相同特征利用起来,也能够将源域和目标域之间的差异特征进行利用,进而该分类模型能够获得更加准确的分类结果。
在另一实施例中,由于要基于第二神经网络对第一神经网络和第一分类器,因此,在对第一神经网络训练的同时,还会对第二神经网络进行同步训练。在对第二神经网络进行训练的时候,其一会根据聚类的结果,对第二神经网络的参数进行调整。其二,还要保证第二神经网络对源域数据的分类结果是准确的。
因此在为源域数据提取第二源域特征向量之后,还要将第二源域特征向量输入第二分类器得到第二分类结果;
根据第二分类器的对第二源域特征向量表征的源域数据的第二分类结果,对第二神经网络进行参数调整。
此处,根据第二分类器的对第二源域特征向量表征的源域数据的第二分类结果,对第二神经网络进行参数调整,具体包括:
执行下述分类操作,直至得到的第二分类结果正确,则完成对第二神经网络和第二分类器的本轮训练;
分类操作包括:
使用第二分类器对当前提取的第二源域特征向量进行分类;
针对分类结果错误的情况,生成第五反馈信息,并将于第五反馈信息,对第二神经网络以及第二分类器的参数进行调整;
基于调整后的参数,使用第二神经网络为源域数据提取新的第二源域特征向量,并再次执行分类操作。
使用第二分类结果对第二神经网络和第二分类器进行参数调整的过程,与使用第一分类结果对第一神经网络和第一分类器进行参数调整的过程类似,在此不再赘述。
参见图8所示,本发明实施例还提供一种分类方法,该方法包括:
S801:获取待分类数据;
S802:将待分类数据输入至本申请实施例所提供的分类模型训练方法得到的分类模型中,得到待分类数据的分类结果;
其中,分类模型包括:第一神经网络和第一分类器。
基于同一发明构思,本发明实施例中还提供了与分类模型训练方法对应的分类模型训练装置,由于本发明实施例中的装置解决问题的原理与本发明实施例上述分类模型训练方法相似,因此装置的实施可以参见方法的实施,重复之处不再赘述。
参见图9所示,本发明实施例提供的分类模型训练装置,包括:
获取模块901,用于获取携带标签的源域数据以及未携带标签的目标域数据;
第一处理模块902,用于将源域数据以及目标域数据输入第一神经网络,为源域数据提取第一源域特征向量,为目标域数据提取第一目标域特征向量;并对源域数据和目标域数据进行共有特征捕捉,使第一目标域特征向量学习源域数据和目标域数据的共有特征;并将第一源域特征向量输入第一分类器得到第一分类结果;
第二处理模块903,用于将源域数据以及目标域数据输入第二神经网络,为目标域数据提取第二目标域特征向量;并对源域数据和目标域数据进行差异性特征捕捉,使第二目标域特征向量学习源域数据和目标域数据的差异特征;
聚类模块904,用于分别对第一目标域特征向量以及第二目标域特征向量进行聚类;
训练模块905,用于根据聚类的结果,以及的第一分类结果,对第一神经网络以及第一分类器进行本轮训练;经过对第一神经网络和第一分类器进行多轮训练,得到分类模型。
本发明实施例利用第一神经网络,为源域数据提取第一源域特征向量,为目标域数据提取第一目标域特征向量时,能够对源域数据和目标域数据进行共有特征的捕捉,使第一目标域特征向量学习源域数据和目标域数据的共有特征的同时,会利用第二神经网络为目标域数据提取第二目标域特征向量;能够对源域数据和目标域数据进行差异性特征捕捉,使第二目标域特征向量学习源域数据和目标域数据的差异特征,然后根据捕捉到的相同特征和差异性特征,对第一神经网络和第一分类器进行训练,得到的分类模型,既能够将源域和目标域之间的相同特征利用起来,也能够将源域和目标域之间的差异特征进行利用,进而该分类模型能够获得更加准确的分类结果。
可选地,第一处理模块902用于如下方式对源域数据和目标域数据进行共有特征捕捉:
在为源域数据提取第一源域特征向量,并为目标域数据提取第一目标域特征向量之后,将第一源域特征向量和第一目标域特征向量进行梯度反向处理;
将进行梯度反向处理的第一源域特征向量和第一目标域特征向量输入第一域分类器;
根据第一域分类器对第一源域特征向量以及第一目标域特征向量分别表征的源域数据和目标域数据的域分类结果,对第一神经网络进行参数调整。
可选地,第二处理模块903在将源域数据以及目标域数据输入第二神经网络,对源域数据以及目标域数据进行特征学习后,为源域数据提取第二源域特征向量;
第二处理模块903用于采用如下方式对源域数据和目标域数据进行差异性特征捕捉:
将第二源域特征向量和第二目标域特征向量输入第二域分类器;
根据第二域分类器的对第二源域特征向量以及第二目标域特征向量分别表征的源域数据和目标域数据的域分类结果,对第二神经网络进行参数调整。
可选地,还包括第二训练模块,用于为源域数据提取第二源域特征向量之后,将第二源域特征向量输入第二分类器得到第二分类结果;
根据第二分类器的对第二源域特征向量表征的源域数据的第二分类结果,对第二神经网络进行参数调整。
可选地,训练模块905,具体用于根据对第一目标域特征向量进行聚类的结果,生成第一邻接矩阵;
根据对第二目标域特征向量进行聚类的结果,生成第二邻接矩阵;
根据第一邻接矩阵以及第二邻接矩阵之间的相似度,以及的第一分类结果,对第一神经网络以及第一分类器进行本轮训练。
可选地,训练模块905,具体用于:执行如下相似度计算操作以及分类操作,直至第一邻接矩阵和第二邻接矩阵之间的相似度小于预设的相似度阈值,以及得到的第一分类结果正确,则完成基于第二神经网络对第一神经网络和第一分类器的本轮训练;
相似度计算操作包括:
计算当前得到的第一邻接矩阵和第二邻接矩阵之间的相似度;
针对相似度不小于预设的相似度阈值的情况,生成第一反馈信息,并基于第一反馈信息对第一神经网络和第二神经网络进行参数调整;
基于调整后的参数,使用第一神经网络为目标域数提取新的第一目标域特征向量,以及使用第二神经网络为目标域数据提取新的第二目标域特征向量;
对新的第一目标域特征向量进行聚类,生成新的第一邻接矩阵,以及,对新的第二目标域特征向量进行聚类,生成新的第二邻接矩阵,并再次执行相似度计算操作;
分类操作包括:
使用第一分类器对当前提取的第一源域特征向量进行分类;
针对分类结果错误的情况,生成第二反馈信息,并将于第二反馈信息,对第一神经网络以及第一分类器的参数进行调整;
基于调整后的参数,使用第一神经网络为源域数据提取新的第一源域特征向量,并再次执行分类操作。
可选地,训练模块905,具体用于根据下述方式计算当前得到的第一邻接矩阵和第二邻接矩阵之间的相似度:
计算第一邻接矩阵的迹和第二邻接矩阵的迹;
将第一邻接矩阵的迹与第二邻接矩阵的迹之间的差作为第一邻接矩阵和第二邻接矩阵之间的相似度。
可选地,第二训练模块,还用于采用下述方式对第二神经网络进行参数调整:
执行如下域分类损失确定操作:
确定当前第二源域特征向量以及第二目标域特征向量分别表征的源域数据和目标域数据的本次域分类的域分类损失;
针对域分类结果错误的情况,生成第四反馈信息,并基于第四反馈信息对第二神经网络进行参数调整;
基于调整后的参数,使用第二神经网络为源域数据提取新的第二源域特征向量,并为目标域数据提取新的第二目标域特征向量,并执行域分类损失确定操作。
本发明又一实施例还提供一种分类装置,参见图10所示,本发明实施例所提供的分类装置包括:
待分类数据获取模块1001,用于获取待分类数据;
分类模块1002,用于将待分类数据输入至通过本申请实施例提供的分类模型训练方法得到的分类模型中,得到待分类数据的分类结果;其中,分类模型包括:第一神经网络和第一分类器。
对应于图1中的分类模型训练方法,本发明实施例还提供了一种计算机设备,如图11所示,该设备包括存储器1000、处理器2000及存储在该存储器1000上并可在该处理器2000上运行的计算机程序,其中,上述处理器2000执行上述计算机程序时实现上述分类模型训练方法的步骤。
具体地,上述存储器1000和处理器2000能够为通用的存储器和处理器,这里不做具体限定,当处理器2000运行存储器1000存储的计算机程序时,能够执行上述分类模型训练方法,从而解决在对分类模型训练过程中是能够利用源域数据和目标域数据之间的相同特征,而无法利用源域数据和莫标语数据之间的差异数据导致的分类模型在对目标域数据进行分类时存在的误差问题,进而达到既能够将源域和目标域之间的相同特征利用起来,也能够将源域和目标域之间的差异特征进行利用,训练所得的分类模型能够获得更加准确的分类结果的效果。
对应于图1中的分类模型训练方法,本发明实施例还提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行上述分类模型训练方法的步骤。
具体地,该存储介质能够为通用的存储介质,如移动磁盘、硬盘等,该存储介质上的计算机程序被运行时,能够执行上述分类模型训练方法,从而解决在对分类模型训练过程中是能够利用源域数据和目标域数据之间的相同特征,而无法利用源域数据和莫标语数据之间的差异数据导致的分类模型在对目标域数据进行分类时存在的误差问题,进而达到既能够将源域和目标域之间的相同特征利用起来,也能够将源域和目标域之间的差异特征进行利用,训练所得的分类模型能够获得更加准确的分类结果的效果。
本发明实施例所提供的分类模型训练方法、装置以及分类方法及装置的计算机程序产品,包括存储了程序代码的计算机可读存储介质,所述程序代码包括的指令可用于执行前面方法实施例中所述的方法,具体实现可参见方法实施例,在此不再赘述。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的***和装置的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。

Claims (10)

1.一种分类模型训练方法,其特征在于,该方法包括:
获取携带标签的源域数据以及未携带标签的目标域数据;
将所述源域数据以及所述目标域数据输入第一神经网络,为所述源域数据提取第一源域特征向量,为所述目标域数据提取第一目标域特征向量;并
对所述源域数据和所述目标域数据进行共有特征捕捉,使所述第一目标域特征向量学习所述源域数据和所述目标域数据的共有特征;并
将所述第一源域特征向量输入第一分类器得到第一分类结果;
将所述源域数据以及所述目标域数据输入第二神经网络,为所述目标域数据提取第二目标域特征向量;并
对所述源域数据和所述目标域数据进行差异性特征捕捉,使所述第二目标域特征向量学习所述源域数据和所述目标域数据的差异特征;
分别对所述第一目标域特征向量以及所述第二目标域特征向量进行聚类;
根据聚类的结果,以及所述第一分类结果,对所述第一神经网络以及所述第一分类器进行本轮训练;
经过对所述第一神经网络和所述第一分类器进行多轮训练,得到分类模型。
2.根据权利要求1所述的方法,其特征在于,采用如下方式对所述源域数据和所述目标域数据进行共有特征捕捉:
在为所述源域数据提取第一源域特征向量,并为所述目标域数据提取第一目标域特征向量之后,将所述第一源域特征向量和所述第一目标域特征向量进行梯度反向处理;
将进行梯度反向处理的第一源域特征向量和第一目标域特征向量输入第一域分类器;
根据所述第一域分类器对第一源域特征向量以及第一目标域特征向量分别表征的所述源域数据和所述目标域数据的域分类结果,对所述第一神经网络进行参数调整。
3.根据权利要求1所述的方法,其特征在于,所述将所述源域数据以及所述目标域数据输入第二神经网络,对所述源域数据以及所述目标域数据进行特征学习后,还包括:
为所述源域数据提取第二源域特征向量;
采用如下方式对所述源域数据和所述目标域数据进行差异性特征捕捉:
将所述第二源域特征向量和第二目标域特征向量输入第二域分类器;
根据所述第二域分类器的对第二源域特征向量以及第二目标域特征向量分别表征的所述源域数据和所述目标域数据的域分类结果,对所述第二神经网络进行参数调整。
4.根据权利要求3所述的方法,其特征在于,为所述源域数据提取第二源域特征向量之后,还包括:
将所述第二源域特征向量输入第二分类器得到第二分类结果;
根据所述第二分类器的对第二源域特征向量表征的源域数据的第二分类结果,对所述第二神经网络进行参数调整。
5.根据权利要求1-4任意一项所述的方法,其特征在于,所述根据聚类的结果,以及所述的第一分类结果,对所述第一神经网络以及所述第一分类器进行本轮训练,具体包括:
根据对所述第一目标域特征向量进行聚类的结果,生成第一邻接矩阵;
根据对所述第二目标域特征向量进行聚类的结果,生成第二邻接矩阵;
根据所述第一邻接矩阵以及第二邻接矩阵之间的相似度,以及所述的第一分类结果,对所述第一神经网络以及所述第一分类器进行本轮训练。
6.根据权利要求5所述的方法,其特征在于,所述根据所述第一邻接矩阵以及第二邻接矩阵之间的相似度,以及所述的第一分类结果,对所述第一神经网络以及所述第一分类器进行本轮训练,具体包括:
执行如下相似度计算操作以及分类操作,直至第一邻接矩阵和第二邻接矩阵之间的相似度小于预设的相似度阈值,以及得到的第一分类结果正确,则完成基于第二神经网络对所述第一神经网络和所述第一分类器的本轮训练;
所述相似度计算操作包括:
计算当前得到的第一邻接矩阵和第二邻接矩阵之间的相似度;
针对相似度不小于预设的相似度阈值的情况,生成第一反馈信息,并基于所述第一反馈信息对所述第一神经网络和所述第二神经网络进行参数调整;
基于调整后的参数,使用第一神经网络为所述目标域数提取新的第一目标域特征向量,以及使用第二神经网络为所述目标域数据提取新的第二目标域特征向量;
对新的第一目标域特征向量进行聚类,生成新的第一邻接矩阵,以及,对新的第二目标域特征向量进行聚类,生成新的第二邻接矩阵,并再次执行所述相似度计算操作;
所述分类操作包括:
使用所述第一分类器对当前提取的所述第一源域特征向量进行分类;
针对分类结果错误的情况,生成第二反馈信息,并将于所述第二反馈信息,对所述第一神经网络以及所述第一分类器的参数进行调整;
基于调整后的参数,使用第一神经网络为所述源域数据提取新的第一源域特征向量,并再次执行所述分类操作。
7.根据权利要求6所述的方法,其特征在于,所述计算当前得到的第一邻接矩阵和第二邻接矩阵之间的相似度,具体包括:
计算第一邻接矩阵的迹和所述第二邻接矩阵的迹;
将第一邻接矩阵的迹与所述第二邻接矩阵的迹之间的差作为第一邻接矩阵和所述第二邻接矩阵之间的相似度。
8.根据权利要求2所述的方法,其特征在于,所述根据所述第一域分类器对第一源域特征向量以及第一目标域特征向量分别表征的所述源域数据和所述目标域数据的域分类结果,对所述第一神经网络进行参数调整,具体包括:
执行如下域分类损失确定操作:
确定当前第一源域特征向量以及所述第一目标域特征向量分别表征的源域数据和目标域数据的本次域分类的域分类损失;
针对最近预设次数的域分类损失之间的差别不小于预设差别阈值,生成第三反馈信息,并基于所述第三反馈信息对所述第一神经网络进行参数调整;
基于调整后的参数,使用第一神经网络为所述源域数据提取新的第一源域特征向量,并为所述目标域数据提取新的第一目标域特征向量,并执行所述域分类损失确定操作,直至差别大于预设差别阈值,完成基于所述第一域分类器对所述第一神经网络的本轮训练。
9.根据权利要求3所述的方法,其特征在于,所述根据所述第二域分类器的对第二源域特征向量以及第二目标域特征向量分别表征的所述源域数据和所述目标域数据的域分类结果,对所述第二神经网络进行参数调整,具体包括:
执行如下域分类损失确定操作:
确定当前第二源域特征向量以及所述第二目标域特征向量分别表征的源域数据和目标域数据的本次域分类的域分类损失;
针对域分类结果错误的情况,生成第四反馈信息,并基于所述第四反馈信息对所述第二神经网络进行参数调整;
基于调整后的参数,使用第二神经网络为所述源域数据提取新的第二源域特征向量,并为所述目标域数据提取新的第二目标域特征向量,并执行所述域分类损失确定操作。
10.一种分类方法,其特征在于,该方法包括:
获取待分类数据;
将所述待分类数据输入至通过权利要求1-9任意一项的分类模型训练方法得到的分类模型中,得到所述待分类数据的分类结果;
其中,所述分类模型包括:所述第一神经网络和所述第一分类器。
CN201810098964.2A 2018-01-31 2018-01-31 分类模型训练方法、装置及分类方法及装置 Active CN108304876B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810098964.2A CN108304876B (zh) 2018-01-31 2018-01-31 分类模型训练方法、装置及分类方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810098964.2A CN108304876B (zh) 2018-01-31 2018-01-31 分类模型训练方法、装置及分类方法及装置

Publications (2)

Publication Number Publication Date
CN108304876A true CN108304876A (zh) 2018-07-20
CN108304876B CN108304876B (zh) 2021-07-06

Family

ID=62850685

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810098964.2A Active CN108304876B (zh) 2018-01-31 2018-01-31 分类模型训练方法、装置及分类方法及装置

Country Status (1)

Country Link
CN (1) CN108304876B (zh)

Cited By (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109189921A (zh) * 2018-08-07 2019-01-11 阿里巴巴集团控股有限公司 评论评估模型的训练方法和装置
CN109214421A (zh) * 2018-07-27 2019-01-15 阿里巴巴集团控股有限公司 一种模型训练方法、装置、及计算机设备
CN109409896A (zh) * 2018-10-17 2019-03-01 北京芯盾时代科技有限公司 银行欺诈识别模型训练方法、银行欺诈识别方法和装置
CN109522867A (zh) * 2018-11-30 2019-03-26 国信优易数据有限公司 一种视频分类方法、装置、设备和介质
CN110070535A (zh) * 2019-04-23 2019-07-30 东北大学 一种基于实例迁移学习的视网膜血管图像分割方法
CN110210561A (zh) * 2019-05-31 2019-09-06 北京市商汤科技开发有限公司 神经网络的训练方法、目标检测方法及装置、存储介质
CN110728294A (zh) * 2019-08-30 2020-01-24 北京影谱科技股份有限公司 一种基于迁移学习的跨领域图像分类模型构建方法和装置
CN110825853A (zh) * 2018-08-07 2020-02-21 阿里巴巴集团控股有限公司 数据训练方法和装置
CN111090753A (zh) * 2018-10-24 2020-05-01 马上消费金融股份有限公司 分类模型的训练方法、分类方法、装置、计算机存储介质
CN111600734A (zh) * 2019-02-21 2020-08-28 烽火通信科技股份有限公司 一种网络故障处理模型的构建方法、故障处理方法及***
CN112000072A (zh) * 2020-08-25 2020-11-27 唐山惠米智能家居科技有限公司 一种带有人脸识别的智能卫浴***及控制方法
CN112116025A (zh) * 2020-09-28 2020-12-22 北京嘀嘀无限科技发展有限公司 用户分类模型的训练方法、装置、电子设备及存储介质
CN112184640A (zh) * 2020-09-15 2021-01-05 中保车服科技服务股份有限公司 一种图像检测模型的构建及图像检测方法和装置
CN112417940A (zh) * 2019-08-20 2021-02-26 通用汽车环球科技运作有限责任公司 用于图像分析的域适应
CN112634048A (zh) * 2020-12-30 2021-04-09 第四范式(北京)技术有限公司 一种反洗钱模型的训练方法及装置
CN112836753A (zh) * 2021-02-05 2021-05-25 北京嘀嘀无限科技发展有限公司 用于域自适应学习的方法、装置、设备、介质和产品
CN113065662A (zh) * 2020-01-02 2021-07-02 阿里巴巴集团控股有限公司 数据处理方法、自学习***及电子设备
CN113343087A (zh) * 2021-06-09 2021-09-03 南京星云数字技术有限公司 用于获取营销用户的方法及***
CN113535951A (zh) * 2021-06-21 2021-10-22 深圳大学 用于进行信息分类的方法、装置、终端设备及存储介质

Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070250468A1 (en) * 2006-04-24 2007-10-25 Captive Traffic, Llc Relevancy-based domain classification
CN101794396A (zh) * 2010-03-25 2010-08-04 西安电子科技大学 基于迁移网络学习的遥感图像目标识别***及方法
JP2013229656A (ja) * 2012-04-24 2013-11-07 Nippon Telegr & Teleph Corp <Ntt> メール処理方法及びシステム
CN104318214A (zh) * 2014-10-27 2015-01-28 中国科学院自动化研究所 一种基于结构化词典域转移的交叉视角人脸识别方法
US9122664B2 (en) * 2007-10-29 2015-09-01 International Business Machines Corporation Method for automatically creating transforms
EP2993618A1 (en) * 2014-09-04 2016-03-09 Xerox Corporation Domain adaptation for image classification with class priors
CN105469109A (zh) * 2015-11-19 2016-04-06 中国地质大学(武汉) 一种用于遥感图像分类的基于类心对齐的迁移学习方法
CN105894074A (zh) * 2016-04-15 2016-08-24 大连声鹭科技有限公司 一种防伪条形码标签、防伪条形码标签信息采集器、采集方法及防伪验证***
CN106157375A (zh) * 2016-07-06 2016-11-23 南京大学 一种三维模型部件类别自动标注方法
CN106469560A (zh) * 2016-07-27 2017-03-01 江苏大学 一种基于无监督域适应的语音情感识别方法
CN106599922A (zh) * 2016-12-16 2017-04-26 中国科学院计算技术研究所 用于大规模数据标定的迁移学习方法及***
CN106980876A (zh) * 2017-03-13 2017-07-25 南京邮电大学 一种基于鉴别性样本属性学习的零样本图像识别方法
US20170220951A1 (en) * 2016-02-02 2017-08-03 Xerox Corporation Adapting multiple source classifiers in a target domain

Patent Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070250468A1 (en) * 2006-04-24 2007-10-25 Captive Traffic, Llc Relevancy-based domain classification
US9122664B2 (en) * 2007-10-29 2015-09-01 International Business Machines Corporation Method for automatically creating transforms
CN101794396A (zh) * 2010-03-25 2010-08-04 西安电子科技大学 基于迁移网络学习的遥感图像目标识别***及方法
JP2013229656A (ja) * 2012-04-24 2013-11-07 Nippon Telegr & Teleph Corp <Ntt> メール処理方法及びシステム
EP2993618A1 (en) * 2014-09-04 2016-03-09 Xerox Corporation Domain adaptation for image classification with class priors
CN104318214A (zh) * 2014-10-27 2015-01-28 中国科学院自动化研究所 一种基于结构化词典域转移的交叉视角人脸识别方法
CN105469109A (zh) * 2015-11-19 2016-04-06 中国地质大学(武汉) 一种用于遥感图像分类的基于类心对齐的迁移学习方法
US20170220951A1 (en) * 2016-02-02 2017-08-03 Xerox Corporation Adapting multiple source classifiers in a target domain
CN105894074A (zh) * 2016-04-15 2016-08-24 大连声鹭科技有限公司 一种防伪条形码标签、防伪条形码标签信息采集器、采集方法及防伪验证***
CN106157375A (zh) * 2016-07-06 2016-11-23 南京大学 一种三维模型部件类别自动标注方法
CN106469560A (zh) * 2016-07-27 2017-03-01 江苏大学 一种基于无监督域适应的语音情感识别方法
CN106599922A (zh) * 2016-12-16 2017-04-26 中国科学院计算技术研究所 用于大规模数据标定的迁移学习方法及***
CN106980876A (zh) * 2017-03-13 2017-07-25 南京邮电大学 一种基于鉴别性样本属性学习的零样本图像识别方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
ADITI SHARAN等: "A Novel Model of Selecting High Quality Pseudo-Relevance Feedback Documents using Classification Approach for Query Expansion", 《2015 IEEE WORKSHOP ON COMPUTATIONAL INTELLIGENCE》 *
金龙: "基于集成半监督学习的标签噪声研究", 《中国优秀硕士学位论文全文数据库(信息科技辑)》 *

Cited By (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109214421A (zh) * 2018-07-27 2019-01-15 阿里巴巴集团控股有限公司 一种模型训练方法、装置、及计算机设备
CN109214421B (zh) * 2018-07-27 2022-01-28 创新先进技术有限公司 一种模型训练方法、装置、及计算机设备
CN109189921B (zh) * 2018-08-07 2021-09-07 创新先进技术有限公司 评论评估模型的训练方法和装置
CN110825853B (zh) * 2018-08-07 2023-05-26 阿里巴巴集团控股有限公司 数据训练方法和装置
CN109189921A (zh) * 2018-08-07 2019-01-11 阿里巴巴集团控股有限公司 评论评估模型的训练方法和装置
CN110825853A (zh) * 2018-08-07 2020-02-21 阿里巴巴集团控股有限公司 数据训练方法和装置
CN109409896A (zh) * 2018-10-17 2019-03-01 北京芯盾时代科技有限公司 银行欺诈识别模型训练方法、银行欺诈识别方法和装置
CN111090753A (zh) * 2018-10-24 2020-05-01 马上消费金融股份有限公司 分类模型的训练方法、分类方法、装置、计算机存储介质
CN109522867A (zh) * 2018-11-30 2019-03-26 国信优易数据有限公司 一种视频分类方法、装置、设备和介质
CN111600734A (zh) * 2019-02-21 2020-08-28 烽火通信科技股份有限公司 一种网络故障处理模型的构建方法、故障处理方法及***
CN110070535A (zh) * 2019-04-23 2019-07-30 东北大学 一种基于实例迁移学习的视网膜血管图像分割方法
CN110210561A (zh) * 2019-05-31 2019-09-06 北京市商汤科技开发有限公司 神经网络的训练方法、目标检测方法及装置、存储介质
CN112417940B (zh) * 2019-08-20 2024-02-23 通用汽车环球科技运作有限责任公司 用于图像分析的域适应
CN112417940A (zh) * 2019-08-20 2021-02-26 通用汽车环球科技运作有限责任公司 用于图像分析的域适应
CN110728294A (zh) * 2019-08-30 2020-01-24 北京影谱科技股份有限公司 一种基于迁移学习的跨领域图像分类模型构建方法和装置
CN113065662A (zh) * 2020-01-02 2021-07-02 阿里巴巴集团控股有限公司 数据处理方法、自学习***及电子设备
CN112000072A (zh) * 2020-08-25 2020-11-27 唐山惠米智能家居科技有限公司 一种带有人脸识别的智能卫浴***及控制方法
CN112184640A (zh) * 2020-09-15 2021-01-05 中保车服科技服务股份有限公司 一种图像检测模型的构建及图像检测方法和装置
CN112116025A (zh) * 2020-09-28 2020-12-22 北京嘀嘀无限科技发展有限公司 用户分类模型的训练方法、装置、电子设备及存储介质
CN112634048A (zh) * 2020-12-30 2021-04-09 第四范式(北京)技术有限公司 一种反洗钱模型的训练方法及装置
CN112836753A (zh) * 2021-02-05 2021-05-25 北京嘀嘀无限科技发展有限公司 用于域自适应学习的方法、装置、设备、介质和产品
WO2022166578A1 (zh) * 2021-02-05 2022-08-11 北京嘀嘀无限科技发展有限公司 用于域自适应学习的方法、装置、设备、介质和产品
CN112836753B (zh) * 2021-02-05 2024-06-18 北京嘀嘀无限科技发展有限公司 用于域自适应学习的方法、装置、设备、介质和产品
CN113343087A (zh) * 2021-06-09 2021-09-03 南京星云数字技术有限公司 用于获取营销用户的方法及***
CN113535951A (zh) * 2021-06-21 2021-10-22 深圳大学 用于进行信息分类的方法、装置、终端设备及存储介质
CN113535951B (zh) * 2021-06-21 2023-02-17 深圳大学 用于进行信息分类的方法、装置、终端设备及存储介质

Also Published As

Publication number Publication date
CN108304876B (zh) 2021-07-06

Similar Documents

Publication Publication Date Title
CN108304876A (zh) 分类模型训练方法、装置及分类方法及装置
CN108399431A (zh) 分类模型训练方法以及分类方法
CN106290378B (zh) 缺陷分类方法和缺陷检查***
CN107451607B (zh) 一种基于深度学习的典型人物的身份识别方法
CN110880019B (zh) 通过无监督域适应训练目标域分类模型的方法
CN108960278A (zh) 使用生成式对抗网络的鉴别器的新奇检测
CN103544506A (zh) 一种基于卷积神经网络的图像分类方法和装置
CN108229580A (zh) 一种基于注意力机制及特征融合的眼底图中糖网特征分级装置
CN108460415A (zh) 伪标签生成模型训练方法及伪标签生成方法
CN107818343A (zh) 计数方法及装置
CN103559504A (zh) 图像目标类别识别方法及装置
CN110288007A (zh) 数据标注的方法、装置及电子设备
CN108647595A (zh) 基于多属性深度特征的车辆重识别方法
CN108460427A (zh) 一种分类模型训练方法、装置以及分类方法及装置
WO2023284465A1 (zh) 图像检测方法、装置、计算机可读存储介质及计算机设备
CN109858505A (zh) 分类识别方法、装置及设备
CN112633382A (zh) 一种基于互近邻的少样本图像分类方法及***
CN106296734B (zh) 基于极限学习机和boosting多核学习的目标跟踪方法
CN108647571A (zh) 视频动作分类模型训练方法、装置及视频动作分类方法
CN109993021A (zh) 人脸正脸检测方法、装置及电子设备
CN112766334A (zh) 一种基于伪标签域适应的跨域图像分类方法
Zhang et al. Web-supervised network for fine-grained visual classification
CN110796260B (zh) 一种基于类扩张学习的神经网络模型优化方法
CN114444374A (zh) 一种基于相似性度量的多源到多目标域自适应的方法
Liu et al. Evaluation framework for large-scale federated learning

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information
CB02 Change of applicant information

Address after: 101-8, 1st floor, building 31, area 1, 188 South Fourth Ring Road West, Fengtai District, Beijing

Applicant after: Guoxin Youyi Data Co., Ltd

Address before: 100070, No. 188, building 31, headquarters square, South Fourth Ring Road West, Fengtai District, Beijing

Applicant before: SIC YOUE DATA Co.,Ltd.

GR01 Patent grant
GR01 Patent grant