CN112287994A - 伪标签处理方法、装置、设备及计算机可读存储介质 - Google Patents

伪标签处理方法、装置、设备及计算机可读存储介质 Download PDF

Info

Publication number
CN112287994A
CN112287994A CN202011159224.9A CN202011159224A CN112287994A CN 112287994 A CN112287994 A CN 112287994A CN 202011159224 A CN202011159224 A CN 202011159224A CN 112287994 A CN112287994 A CN 112287994A
Authority
CN
China
Prior art keywords
label
pseudo
data
target
trained
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011159224.9A
Other languages
English (en)
Inventor
刘炳宇
郭玉红
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Didi Infinity Technology and Development Co Ltd
Original Assignee
Beijing Didi Infinity Technology and Development Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Didi Infinity Technology and Development Co Ltd filed Critical Beijing Didi Infinity Technology and Development Co Ltd
Priority to CN202011159224.9A priority Critical patent/CN112287994A/zh
Publication of CN112287994A publication Critical patent/CN112287994A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Software Systems (AREA)
  • Molecular Biology (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Mathematical Physics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Probability & Statistics with Applications (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本公开的实施例提供一种伪标签处理方法、装置、设备及计算机可读存储介质。该方法包括:获取目标域数据集,其中,目标域数据集中包括多组未设置类别标签的未标注数据;根据域自适应技术及预设的第一标签识别模型确定各未标注数据对应的待选伪标签;采用预设的深度强化学习网络模型对各待选伪标签进行筛选,以获得目标伪标签。从而能够兼顾伪标签的准确性以及表达能力,进而后续在使用通过该伪标签扩充的目标域数据集进行模型的训练时,能够提高模型的识别精准度。

Description

伪标签处理方法、装置、设备及计算机可读存储介质
技术领域
本公开的实施例涉及图像识别技术,尤其涉及一种伪标签处理方法、装置、设备及计算机可读存储介质。
背景技术
随着计算机视觉领域的发展,深度卷积神经网络已经展现出了极大的优越性。但是,在很多数据集中标注数据是非常困难的,因此可以采用基于迁移学习的方法利用容易进行标注的数据集(源域数据集)来提高在只包含无标签数据的目标域数据集上的识别效果。
采用上述迁移学习方法进行模型训练的过程中,当已标注数据有限时,可以采用伪标签技术(Pseudo-Labeling,简称PL)进行已标注数据的标签扩展。具体地,现有技术中一般都采用通过源域数据集训练过的待训练模型对目标域数据集中的未标注数据进行伪标签的识别操作,并通过阈值比较的方式进行伪标签的筛选操作。
但是,采用上述方法进行伪标签的选择时,所选择的伪标签的质量一般与该分数阈值有关。具体地,当分数阈值较高时,一般会选择准确性较高的伪标签,而选择出的伪标签对真实的目标域分布不能进行很好的表达。当阈值较低时,会选择分布更广的伪标签,但是这样的伪标签准确性并不能保证。
发明内容
本公开的实施例提供一种伪标签处理方法、装置、设备及计算机可读存储介质,用以解决现有的伪标签处理方法得到的伪标签准确性以及表达能力不佳的技术问题。
第一方面,本公开的实施例提供一种伪标签处理方法,包括:
获取目标域数据集,其中,目标域数据集中包括多组未设置类别标签的未标注数据;
根据域自适应技术及预设的第一标签识别模型确定各未标注数据对应的待选伪标签;
采用预设的深度强化学习网络模型对各待选伪标签进行筛选,以获得目标伪标签。
第二方面,本公开的实施例提供一种伪标签处理装置,包括:
获取模块,用于获取目标域数据集,其中,目标域数据集中包括多组未设置类别标签的未标注数据;
确定模块,用于根据域自适应技术及预设的第一标签识别模型确定各未标注数据对应的待选伪标签;
筛选模块,用于采用预设的深度强化学习网络模型对各待选伪标签进行筛选,以获得目标伪标签。
第三方面,本公开的实施例提供一种伪标签处理设备,包括:存储器和处理器;
所述存储器用于存储程序指令;
所述处理器用于调用所述存储器中的程序指令执行如第一方面所述的方法。
第四方面,本公开的实施例提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序;所述计算机程序被执行时,实现如第一方面所述的方法。
本公开的实施例提供的伪标签处理方法、装置、设备及计算机可读存储介质,在获取到目标域数据集之后,采用域自适应技术及预设的第一标签识别模型确定各未标注数据对应的待选伪标签。通过预设的深度强化学习网络模型对各待选伪标签进行筛选,获得目标伪标签,从而能够兼顾伪标签的准确性以及表达能力,进而后续在使用通过该伪标签扩充的目标域数据集进行模型的训练时,能够提高模型的识别精准度。
本公开的各种可行实施例及其技术优势将在下文详述。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。
图1为本公开基于的***架构示意图;
图2为本公开实施例一提供的伪标签处理方法的流程示意图;
图3为本公开实施例二提供的伪标签处理方法的流程示意图;
图4为本公开实施例提供的网络模型的架构示意图;
图5为本公开实施例三提供的伪标签处理方法的流程示意图;
图6为本公开实施例提供的又一网络模型的架构图;
图7为本公开实施例四提供的伪标签处理方法的流程示意图;
图8为本公开实施例提供的第一损失函数对应的分类决策边界示意图;
图9为本公开实施例提供的目标域大间距损失函数的分类决策边界示意图;
图10为本公开实施例五提供的伪标签处理装置的结构示意图;
图11为本公开实施例六提供的伪标签处理设备的结构示意图。
通过上述附图,已示出本公开明确的实施例,后文中将有更详细的描述。这些附图和文字描述并不是为了通过任何方式限制本公开构思的范围,而是通过参考特定实施例为本领域技术人员说明本公开的概念。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
首先对本公开的实施例所涉及的名词进行解释:
域自适应技术(Domain Adaptation,简称DA):是迁移学习的一个重要分支,通过从有标注的源域数据中学习知识,并迁移到无标签的目标域数据中,使得源域和目标域数据的特征分布差异尽可能小。
无监督域自适应技术(Unsupervised Domain Adaptation,简称UDA):通过从有标注的源域数据中学习知识,并迁移到完全没有标注数据,只有无标签数据的目标域数据中,使得源域和目标域数据的特征分布差异尽可能小。
半监督域自适应技术(Semi-Supervised Domain Adaptation,简称SSDA):是指通过从有标注的源域数据中学习知识,并迁移到含有少量的标注数据以及大量的未标注数据的目标域数据中,使得源域和目标域数据的特征分布差异尽可能小。
深度强化学习:是指将深度学习的感知能力和强化学习的决策能力相结合,可以直接根据输入的图像进行控制,是一种更接近人类思维方式的人工智能方法。
DQN算法:是指融合了神经网络和Q learning的方法,全称为Deep Q Network。
针对上述提及的现有的伪标签处理方法得到的伪标签准确性以及表达能力不佳的技术问题,本公开提供了一种伪标签处理方法、装置、设备及计算机可读存储介质。
需要说明的是,本公开伪标签处理方法、装置、设备及计算机可读存储介质可运用各种域自适应技术的模型训练的场景中。
随着计算机视觉领域的发展,由于数据标注往往需要耗费大量的人力物力,因此,域自适应技术越来越多的应用在了网络模型训练的场景中。由于域自适应技术需要从有标注的源域数据中学习知识,并迁移到无标注的目标域数据中,当目标域数据集中无标注数据较多时,就需要采用伪标签技术(Pseudo-Labeling,简称PL)对目标域数据集中无标注数据进行标签的扩充。现有技术中一般都是通过设置伪标签分数阈值,根据该分数阈值对伪标签进行筛选操作。但是,采用上述方法往往无法同时保证伪标签的准确度以及表达能力,进而采用根据上述方法筛选的伪标签进行无标注数据标签的扩充准确性不高,后续采用该目标域数据集训练处的模型的识别精度也无法保证。
在解决上述技术问题的过程中,发明人通过研究发现,为了提高筛选出的伪标签的质量,保证后续网络模型的识别精度,需要同时考虑伪标签的准确度以及表达能力,根据上述两个特征共同进行伪标签的筛选。
发明人进一步地研究发现,可以采用预设的深度强化学习网络进行伪标签的筛选,利用在标签识别模型的训练中加入不同的伪标签产生的反馈来学习一种同时考虑准确性和表达能力的伪标签选择策略,解决现有的伪标签技术不能兼顾准确性和表达能力的问题。
图1为本公开基于的***架构示意图,如图1所示,本公开基于的***架构至少包括:数据库1以及服务器2,其中,服务器2中设置有伪标签处理装置,该伪标签处理装置可采用C/C++、Java、Shell或Python等语言编写;数据库2则可为云端服务器或服务器集群,其内存储有大量的数据。数据库1与服务器2通信连接,从而二者可以进行信息交互。
本公开的实施例具体的应用场景可以为伪标签处理装置从数据库中获取目标域数据集,并将该目标域数据集输入至预设的第一标签识别模型中,获得该目标域数据集中各未标注数据对应的待选伪标签。将该待选伪标签输入至预设的深度强化学习网络模型中,以实现对待选伪标签的筛选操作,获得目标伪标签。
下面以具体地实施例对本公开的实施例的技术方案以及本公开的技术方案如何解决上述技术问题进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例中不再赘述。下面将结合附图,对本公开的实施例的实施例进行描述。
图2为本公开实施例一提供的伪标签处理方法的流程示意图,如图2所示,该方法包括:
步骤101、获取目标域数据集,其中,目标域数据集中包括多组未设置类别标签的未标注数据。
本实施例的执行主体为伪标签处理装置,该伪标签处理装置可耦合于服务器中。
在本实施方式中,为了实现对目标域数据集中各未标注数据的标签扩充操作,首先可以获取目标域数据集,其中,该目标域数据集中可以包括多组未设置类别标签的未标注数据。该未标注数据可以为图像数据。此外,该目标域数据集中还可以包括少量已设置类别标签的数据。该目标域数据集具体可以用于对标签识别模型进行训练,使得训练后的标签识别模型能够对输入的数据进行类别识别操作。
可选地,该服务器可以与数据库通信连接,从而能够与数据库进行信息交互。基于该***架构,该目标域数据集可以为设置在服务器中的伪标签处理装置从数据库中获取的。
步骤102、根据域自适应技术及预设的第一标签识别模型确定各未标注数据对应的待选伪标签。
在本实施方式中,在获取到目标域数据集之后,可以对该目标域数据集中未标注数据的伪标签进行识别操作。具体地,可以通过自适应技术及预设的第一标签识别模型确定各未标注数据对应的待选伪标签。
其中,域自适应技术能够从有标注的源域数据中学习知识,并迁移到无标签的目标域数据中,使得源域和目标域数据的特征分布差异尽可能小。也即该第一标签识别模型可以为预先采用包括大量已标注数据的源域数据集进行训练后获得的标签识别模型。可以将目标域数据集中的未标注数据输入至该第一标签识别模型中,获取第一标签识别模型输出的各未标注数据对应的待选伪标签。
步骤103、采用预设的深度强化学习网络模型对各待选伪标签进行筛选,以获得目标伪标签。
在本实施例中,为了提高筛选出的伪标签的质量,保证后续网络模型的识别精度,需要同时考虑伪标签的准确度以及表达能力。因此,可以通过预设的深度强化学习网络模型对各待选伪标签进行筛选操作,获得目标伪标签。后续可以将该目标伪标签添加至目标域数据集中,实现对目标域数据集中无标注数据的标签扩充操作。
进一步地,在实施例一的基础上,步骤102具体包括:
按照待选伪标签的类别对各未标注数据进行分类,以获得分类后的每类未标注数据的特征数据;
将待选伪标签与对应类别的未标注数据的特征数据进行关联,以获得关联特征数据;
将所述各关联特征数据输入至所述预设的深度强化学习网络模型中;
通过所述预设的深度强化学习网络模型从关联特征数据的待选伪标签中确定出目标伪标签,并输出所述目标伪标签。
在本实施例中,为了实现对目标伪标签的筛选操作,首先可以按照待选伪标签的类别对各未标注数据进行分类,以获得分类后的每类未标注数据的特征数据。将待选伪标签与对应类别的未标注数据的特征数据进行关联,以获得关联特征数据。将各关联特征数据输入至预设的深度强化学习网络模型中。通过预设的深度强化学习网络模型从关联特征数据的待选伪标签中确定出目标伪标签,并输出目标伪标签。
本实施例提供的伪标签处理方法,通过在获取到目标域数据集之后,采用域自适应技术及预设的第一标签识别模型确定各未标注数据对应的待选伪标签。通过预设的深度强化学习网络模型对各待选伪标签进行筛选,获得目标伪标签,从而能够兼顾伪标签的准确性以及表达能力,进而后续在使用通过该伪标签扩充的目标域数据集进行模型的训练时,能够提高模型的识别精准度。
图3为本公开实施例二提供的伪标签处理方法的流程示意图,在实施例一的基础上,所述域自适应技术为半监督域自适应技术;所述目标域数据集中还包括多组已设置类别标签的已标注数据;如图3所示,步骤102具体包括:
步骤201、获取源域数据集,所述源域数据集中包括多组已设置类别标签的已标注数据。
步骤202、根据所述源域数据集和所述目标域数据集对所述预设的第一标签识别模型进行训练,以获得第一训练后的标签识别模型。
步骤203、将所述未标注数据输入至第一训练后的标签识别模型,以通过所述第一训练后的标签识别模型确定各未标注数据对应的待选伪标签。
在本实施例中,该域自适应技术具体可以为半监督域自适应技术。相应地,该目标域数据集中可以包括少量已标注数据。
具体地,首先可以获取源域数据集,其中,该源域数据集中过包括多组已设置类别标签的已标注数据。通过源域数据集以及该目标域数据集对预设的第一标签识别模型进行训练,以获得第一训练后的标签识别模型。
获得第一训练后的标签识别模型之后,可以将未标注数据输入至第一训练后的标签识别模型,以通过第一训练后的标签识别模型确定各未标注数据对应的待选伪标签。
进一步地,在上述实施例一的基础上,步骤103之后,还包括:
根据所述目标伪标签与对应未标注数据的关联关系构建更新后的目标域数据集。
采用源域数据集以及所述更新后的目标域数据集对所述第一训练后的标签识别模型继续进行训练,获得第二训练后的标签识别模型。
检测所述第二训练后的标签识别模型的识别精度是否达到预设的精度阈值。
若是,则将所述第二训练后的标签识别模型作为最终标签识别模型。
若否,则返回执行所述将所述未标注数据输入至第一训练后的标签识别模型,以通过所述第一训练后的标签识别模型确定各未标注数据对应的待选伪标签的步骤,直至所述第二训练后的标签识别模型的识别精度达到预设的精度阈值。
在本实施例中,在获得目标伪标签之后,可以根据该目标伪标签对目标域数据集中未标注数据进行标签的扩充操作。具体地,可以根据该目标伪标签与对应的未标注数据的关联关系构建更新后的目标域数据集。
为了提高标签识别模型的识别精度,获得更新后的目标域数据集之后,可以采用源域数据集以及更新后的目标域数据集对第一训练后的标签识别模型继续进行训练,获得第二训练后的标签识别模型。检测该第二训练后的标签识别模型的识别精度是否达到预设的精度阈值。若是,则表征该第二训练后的标签识别模型已经训练完毕,将该第二训练后的标签识别模型作为最终标签识别模型。反之,则表征该第二训练后的标签识别模型未训练完毕,还需要继续进行目标域数据集中未标注数据进行标签的扩充操作,并采用源域数据集以及更新后的目标域数据集对第一训练后的标签识别模型继续进行训练。因此,可以返回执行将未标注数据输入至第一训练后的标签识别模型,以通过第一训练后的标签识别模型确定各未标注数据对应的待选伪标签的步骤,直至第二训练后的标签识别模型的识别精度达到预设的精度阈值。
图4为本公开实施例提供的网络模型的架构示意图,如图4所示,该标签识别模型中具体包括特征提取层F以及分类层C,可以将源域数据集以及目标域数据集中的数据输入至该标签识别模型中,对该标签模型进行训练得到最终损失值。
本实施例提供的伪标签处理方法,通过源域数据集以及该目标域数据集对预设的第一标签识别模型进行训练,以获得第一训练后的标签识别模型,并采用该第一训练后的标签识别模型进行目标伪标签的识别操作,从而能够在标注数据量较少时,也能够实现目标伪标签的生成以及实现对未标注数据进行标签的扩充操作。
图5为本公开实施例三提供的伪标签处理方法的流程示意图,在上述任一实施例的基础上,如图5所示,所述采用源域数据集以及所述更新后的目标域数据集对所述第一训练后的标签识别模型进行训练时,所述方法还包括:
步骤301、获取对所述第一训练后的标签识别模型训练时特征提取过程提取到的中间特征数据,分类后得到的分类中间数据,以及所述第一训练后的标签识别模型输出的第一待选伪标签。
步骤302、根据所述中间特征数据及所述分类中间数据计算奖励信息。
步骤303、根据各待选伪标签、各未标注数据、所述目标伪标签、奖励信息以及所述第一待选伪标签对所述深度强化学习网络模型进行训练操作。
在本实施例中,该深度强化学习网络模型具体可以为DQN网络。该DQN网络可以将状态作为输入,并将动作作为输出。其中,该状态具体可以为各待选伪标签、各未标注数据,而动作可以为从待选伪标签中选中某一目标伪标签。
具体地,标签识别模型中具体包括特征提取层F以及分类层C,特征提取层F输出的中间特征数据可以确定选中的目标伪标签的表达能力,分类层C输出的分类中间数据可以确定选中的目标伪标签的准确性。因此,可以根据特征提取过程提取到的中间特征数据,分类后得到的分类中间数据计算奖励信息。而奖励信息可以激励深度强化学习网络模型提高输出的目标伪标签的表达能力以及准确性。
因此,后续可以根据各待选伪标签、各未标注数据、所述目标伪标签、奖励信息以及所述第一待选伪标签对所述深度强化学习网络模型进行训练操作。
图6为本公开实施例提供的又一网络模型的架构图,如图6所示,可以根据特征提取层F输出的中间特征数据、分类层C输出的分类中间数据以及第一训练后的标签识别模型输出的第一待选伪标签确定奖励信息,根据状态St:各待选伪标签、各未标注数据,动作at:目标伪标签,奖励信息以及下一状态st’:第一待选伪标签对所述深度强化学习网络模型进行训练操作。
可选地,在获得待选伪标签、各未标注数据、所述目标伪标签、奖励信息以及所述第一待选伪标签之后,可以预先将其存储值预设的经验池中,后续可以从经验池中进行采样训练,实现对深度强化学习网络模型的训练操作。
进一步地,在上述任一实施例的基础上,步骤302具体包括:
根据所述中间特征数据、所述分类中间数据以及预设的度量函数计算所述目标伪标签对应的质量数值。
根据所述质量数值以及预设的质量阈值计算所述奖励信息。
在本实施例中,由于奖励信息需要反映当前选择的目标伪标签是否是合适的,也就是说准确性和表达能力更高的样本应该具有更大的奖励值。因此,可以通过预设的度量函数来反映目标伪标签的准确性和表达能力,其中,度量函数如公式1所示:
Figure BDA0002743785960000101
其中,特征提取过程提取到的中间特征数据,分类后得到的分类中间数据的组合作为样本。
Figure BDA0002743785960000102
表示该样本相对于其伪标签的分类概率输出,pf则表示该样本相对于目标域中各类特征中心的概率情况,如公式2所示:
Figure BDA0002743785960000103
其中zj为目标域有标签数据中第j类的特征中心。
Figure BDA0002743785960000104
的这前两项可以从两个方面来反映伪标签样本的准确性,而第三项Δe表示加入伪标签样本训练后目标域无标签数据的熵的减少量,熵减少得越多就表示该伪标签样本对目标域分布的表达能力越强。
进一步地,可以根据该度量函数确定奖励函数。奖励函数如公式3所示:
Figure BDA0002743785960000105
其中τ为质量阈值。
基于上述公式,具体可以通过度量函数根据中间特征数据、所述分类中间数据计算目标伪标签对应的质量数值。将该质量数值与预设的质量阈值τ进行比较,根据比较结果确定奖励信息。
本实施例提供的伪标签处理方法,通过根据各待选伪标签、各未标注数据、所述目标伪标签、奖励信息以及所述第一待选伪标签对深度强化学习网络模型进行训练操作,从而根据该奖励信息不断地驱动深度强化学习网络输出更加精准的目标伪标签。
图7为本公开实施例四提供的伪标签处理方法的流程示意图,在上述任一实施例的基础上,如图7所示,步骤202具体包括:
步骤401、通过预设的第一损失函数以及源域数据集中的已标注数据对待训练模型进行训练,获得第一损失值。
步骤402、通过预设的目标域大间距损失函数以及目标域数据集中的已标注数据对待训练模型进行训练,获得第二损失值。
步骤403、通过预设的熵损失函数以及目标域数据集中的未标注数据对所述待训练模型进行训练,获得第三损失值。
步骤404、根据所述第一损失值、第二损失值以及第三损失值对第一标签识别模型进行反向训练,获得第一训练后的标签识别模型。
在本实施例中,针对源域数据集,则可以选择第一损失函数进行训练,获得第一损失值。其中,该第一损失函数可以为Softmax损失函数,其具体可如公式4所示:
Figure BDA0002743785960000111
其中
Figure BDA0002743785960000112
Wj为网络最后一层全连接层相对于第j个类别的权重。
相应地,由于目标域数据集中仅具有少量的已标注数据,因此,针对目标域数据集中的已标注数据,可以采用目标域大间距损失函数对其进行训练,获得第二损失值。其相对于预设的第一损失函数来说,对目标域已标注数据加入间距参数m,使得分类决策边界能给予目标域更大的空间,让目标域无标签数据能够正确分类。该目标域大间距损失函数如公式5所示:
Figure BDA0002743785960000113
其中
Figure BDA0002743785960000114
Wj为网络最后一层全连接层相对于第j个类别的权重,m为预设的间距参数。
图8为本公开实施例提供的第一损失函数对应的分类决策边界示意图,图9为本公开实施例提供的目标域大间距损失函数的分类决策边界示意图,如图8-图9所示,采用目标域大间距损失函数能够使得分类决策边界能给予目标域数据更大的空间,让目标域无标注数据能够正确分类。
进一步地,针对目标域中的无标注数据,为了让特征相似的样本聚到一起,可以采用熵损失函数以及目标域数据集中的未标注数据对所述待训练模型进行训练,获得第三损失值。其中,该熵损失函数可以如公式6所示:
Figure BDA0002743785960000121
其中,
Figure BDA0002743785960000122
表示分类器对第j类的概率预测输出。
在获得第一损失值、第二损失值以及第三损失值之后,可以根据第一损失值、第二损失值以及第三损失值对该待训练模型进行反向训练,根据该第一损失值、第二损失值以及第三损失值对待训练模型进行参数的调整,直至待训练模型收敛,获得第一训练后的标签识别模型。
进一步地,在上述任一实施例的基础上,步骤404具体包括:
根据第一损失函数、目标域大间距损失函数以及熵损失函数确定目标损失函数。
根据所述目标损失函数对第一损失值、第二损失值以及第三损失值进行计算,确定目标损失值。
根据所述目标损失值对待训练模型进行反向训练,获得第一训练后的标签识别模型。
在本实施例中,可以根据三个不同的损失函数以及预设的平衡参数α确定目标损失函数,目标损失函数如公式7所示:
L=L1+L2+αLent (7)
进而可以根据该目标损失函数对第一损失值、第二损失值以及第三损失值进行计算,确定目标损失值。根据该目标损失函数对待训练模型进行反向训练,对待训练模型的参数进行调节,直至待训练模型收敛,获得第一训练后的标签识别模型。
本实施例提供的伪标签处理方法,通过针对目标域数据集中的已标注数据,采用加入间距参数m的目标域大间距损失函数对待训练模型进行训练,从而能够使得分类决策边界能给予目标域更大的空间,让目标域无标签数据能够正确分类,提高第一训练后的标签识别模型的识别精度。
图10为本公开实施例五提供的伪标签处理装置的结构示意图,如图10所示,该装置包括:获取模块51、确定模块52以及筛选模块53。其中,获取模块51,用于获取目标域数据集,其中,目标域数据集中包括多组未设置类别标签的未标注数据。确定模块52,用于根据域自适应技术及预设的第一标签识别模型确定各未标注数据对应的待选伪标签。筛选模块53,用于采用预设的深度强化学习网络模型对各待选伪标签进行筛选,以获得目标伪标签。
进一步地,在实施例五的基础上,所述筛选模块用于:按照待选伪标签的类别对各未标注数据进行分类,以获得分类后的每类未标注数据的特征数据。将待选伪标签与对应类别的未标注数据的特征数据进行关联,以获得关联特征数据。将所述各关联特征数据输入至所述预设的深度强化学习网络模型中。通过所述预设的深度强化学习网络模型从关联特征数据的待选伪标签中确定出目标伪标签,并输出所述目标伪标签。
进一步地,在实施例五的基础上,所述域自适应技术为半监督域自适应技术;所述目标域数据集中还包括多组已设置类别标签的已标注数据;所述确定模块用于:获取源域数据集,所述源域数据集中包括多组已设置类别标签的已标注数据。根据所述源域数据集和所述目标域数据集对所述预设的第一标签识别模型进行训练,以获得第一训练后的标签识别模型。将所述未标注数据输入至第一训练后的标签识别模型,以通过所述第一训练后的标签识别模型确定各未标注数据对应的待选伪标签。
进一步地,在上述任一实施例的基础上,所述装置还包括:更新模块、第一训练模块、检测模块以及处理模块。其中,更新模块,用于根据所述目标伪标签与对应未标注数据的关联关系构建更新后的目标域数据集。第一训练模块,用于采用源域数据集以及所述更新后的目标域数据集对所述第一训练后的标签识别模型继续进行训练,获得第二训练后的标签识别模型。检测模块,用于检测所述第二训练后的标签识别模型的识别精度是否达到预设的精度阈值。处理模块,用于若是,则将所述第二训练后的标签识别模型作为最终标签识别模型。处理模块,还用于若否,则返回执行所述将所述未标注数据输入至第一训练后的标签识别模型,以通过所述第一训练后的标签识别模型确定各未标注数据对应的待选伪标签的步骤,直至所述第二训练后的标签识别模型的识别精度达到预设的精度阈值。
进一步地,在上述任一实施例的基础上,所述装置还包括:提取模块、计算模块以及第二训练模块。其中,提取模块,用于获取对所述第一训练后的标签识别模型训练时特征提取过程提取到的中间特征数据,分类后得到的分类中间数据,以及所述第一训练后的标签识别模型输出的第一待选伪标签。计算模块,用于根据所述中间特征数据及所述分类中间数据计算奖励信息。第二训练模块,用于根据各待选伪标签、各未标注数据、所述目标伪标签、奖励信息以及所述第一待选伪标签对所述深度强化学习网络模型进行训练操作。
进一步地,在上述任一实施例的基础上,所述计算模块用于:根据所述中间特征数据、所述分类中间数据以及预设的度量函数计算所述目标伪标签对应的质量数值。根据所述质量数值以及预设的质量阈值计算所述奖励信息。
进一步地,在上述任一实施例的基础上,所述确定模块用于:通过预设的第一损失函数以及源域数据集中的已标注数据对待训练模型进行训练,获得第一损失值。通过预设的目标域大间距损失函数以及目标域数据集中的已标注数据对待训练模型进行训练,获得第二损失值。通过预设的熵损失函数以及目标域数据集中的未标注数据对所述待训练模型进行训练,获得第三损失值。根据所述第一损失值、第二损失值以及第三损失值对第一标签识别模型进行反向训练,获得第一训练后的标签识别模型。
进一步地,在上述任一实施例的基础上,所述确定模块用于;根据第一损失函数、目标域大间距损失函数以及熵损失函数确定目标损失函数。根据所述目标损失函数对第一损失值、第二损失值以及第三损失值进行计算,确定目标损失值。根据所述目标损失值对待训练模型进行反向训练,获得第一训练后的标签识别模型。
图11为本公开实施例六提供的伪标签处理设备的结构示意图,如图11所示,该设备可以是移动电话,计算机,平板设备等。
设备600可以包括以下一个或多个组件:处理组件602,存储器604,电源组件606,多媒体组件608,输入/输出(I/O)接口610,以及通信组件612。
处理组件602通常控制设备600的整体操作,诸如与显示,电话呼叫,数据通信,相机操作和记录操作相关联的操作。处理组件602可以包括一个或多个处理器820来执行指令,以完成上述的方法的全部或部分步骤。此外,处理组件602可以包括一个或多个模块,便于处理组件602和其他组件之间的交互。例如,处理组件602可以包括多媒体模块,以方便多媒体组件608和处理组件602之间的交互。
存储器604被配置为存储各种类型的数据以支持在设备600的操作。这些数据的示例包括用于在设备600上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图片,视频等。存储器604可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。
电源组件606为设备600的各种组件提供电力。电源组件606可以包括电源管理***,一个或多个电源,及其他与为设备600生成、管理和分配电力相关联的组件。
多媒体组件608包括在所述设备600和用户之间的提供一个输出接口的屏幕。在一些实施例中,屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中,多媒体组件608包括一个前置摄像头和/或后置摄像头。当设备600处于操作模式,如拍摄模式或视频模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜***或具有焦距和光学变焦能力。
I/O接口610为处理组件602和***接口模块之间提供接口,上述***接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。
通信组件612被配置为便于设备600和其他设备之间有线或无线方式的通信。设备600可以接入基于通信标准的无线网络,如WiFi,2G或3G,或它们的组合。在一个示例性实施例中,通信组件612经由广播信道接收来自外部广播管理***的广播信号或广播相关信息。在一个示例性实施例中,所述通信组件612还包括近场通信(NFC)模块,以促进短程通信。例如,在NFC模块可基于射频识别(RFID)技术,红外数据协会(IrDA)技术,超宽带(UWB)技术,蓝牙(BT)技术和其他技术来实现。
在示例性实施例中,设备600可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述方法。
在示例性实施例中,还提供了一种包括指令的非临时性计算机可读存储介质,例如包括指令的存储器604,上述指令可由设备600的处理器820执行以完成上述方法。例如,所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
一种非临时性计算机可读存储介质,当该存储介质中的指令由终端设备的处理器执行时,使得终端设备能够执行上述终端设备的伪标签处理方法。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其它实施方案。本公开的实施例旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求书指出。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求书来限制。

Claims (18)

1.一种伪标签处理方法,其特征在于,包括:
获取目标域数据集,其中,目标域数据集中包括多组未设置类别标签的未标注数据;
根据域自适应技术及预设的第一标签识别模型确定各未标注数据对应的待选伪标签;
采用预设的深度强化学习网络模型对各待选伪标签进行筛选,以获得目标伪标签。
2.根据权利要求1所述的方法,其特征在于,所述采用预设的深度强化学习网络模型对各待选伪标签进行筛选,以获得目标伪标签,包括:
按照待选伪标签的类别对各未标注数据进行分类,以获得分类后的每类未标注数据的特征数据;
将待选伪标签与对应类别的未标注数据的特征数据进行关联,以获得关联特征数据;
将所述各关联特征数据输入至所述预设的深度强化学习网络模型中;
通过所述预设的深度强化学习网络模型从关联特征数据的待选伪标签中确定出目标伪标签,并输出所述目标伪标签。
3.根据权利要求1所述的方法,其特征在于,所述域自适应技术为半监督域自适应技术;所述目标域数据集中还包括多组已设置类别标签的已标注数据;
所述根据域自适应技术及预设的第一标签识别模型确定各未标注数据对应的待选伪标签,包括:
获取源域数据集,所述源域数据集中包括多组已设置类别标签的已标注数据;
根据所述源域数据集和所述目标域数据集对所述预设的第一标签识别模型进行训练,以获得第一训练后的标签识别模型;
将所述未标注数据输入至第一训练后的标签识别模型,以通过所述第一训练后的标签识别模型确定各未标注数据对应的待选伪标签。
4.根据权利要求3所述的方法,其特征在于,所述采用预设的深度强化学习网络模型对各待选伪标签进行筛选,以获得目标伪标签之后,还包括:
根据所述目标伪标签与对应未标注数据的关联关系构建更新后的目标域数据集;
采用源域数据集以及所述更新后的目标域数据集对所述第一训练后的标签识别模型继续进行训练,获得第二训练后的标签识别模型;
检测所述第二训练后的标签识别模型的识别精度是否达到预设的精度阈值;
若是,则将所述第二训练后的标签识别模型作为最终标签识别模型;
若否,则返回执行所述将所述未标注数据输入至第一训练后的标签识别模型,以通过所述第一训练后的标签识别模型确定各未标注数据对应的待选伪标签的步骤,直至所述第二训练后的标签识别模型的识别精度达到预设的精度阈值。
5.根据权利要求4所述的方法,其特征在于,所述采用源域数据集以及所述更新后的目标域数据集对所述第一训练后的标签识别模型进行训练时,所述方法还包括:
获取对所述第一训练后的标签识别模型训练时特征提取过程提取到的中间特征数据,分类后得到的分类中间数据,以及所述第一训练后的标签识别模型输出的第一待选伪标签;
根据所述中间特征数据及所述分类中间数据计算奖励信息;
根据各待选伪标签、各未标注数据、所述目标伪标签、奖励信息以及所述第一待选伪标签对所述深度强化学习网络模型进行训练操作。
6.根据权利要求5所述的方法,其特征在于,所述根据所述中间特征数据及所述分类中间数据计算奖励信息,包括:
根据所述中间特征数据、所述分类中间数据以及预设的度量函数计算所述目标伪标签对应的质量数值;
根据所述质量数值以及预设的质量阈值计算所述奖励信息。
7.根据权利要求3-6任一项所述的方法,其特征在于,所述根据所述源域数据集和所述目标域数据集对所述预设的第一标签识别模型进行训练,以获得第一训练后的标签识别模型,包括:
通过预设的第一损失函数以及源域数据集中的已标注数据对待训练模型进行训练,获得第一损失值;
通过预设的目标域大间距损失函数以及目标域数据集中的已标注数据对待训练模型进行训练,获得第二损失值;
通过预设的熵损失函数以及目标域数据集中的未标注数据对所述待训练模型进行训练,获得第三损失值;
根据所述第一损失值、第二损失值以及第三损失值对第一标签识别模型进行反向训练,获得第一训练后的标签识别模型。
8.根据权利要求7所述的方法,其特征在于,所述根据所述第一损失值、第二损失值以及第三损失值对第一标签识别模型进行反向训练,获得第一训练后的标签识别模型,包括:
根据第一损失函数、目标域大间距损失函数以及熵损失函数确定目标损失函数;
根据所述目标损失函数对第一损失值、第二损失值以及第三损失值进行计算,确定目标损失值;
根据所述目标损失值对待训练模型进行反向训练,获得第一训练后的标签识别模型。
9.一种伪标签处理装置,其特征在于,包括:
获取模块,用于获取目标域数据集,其中,目标域数据集中包括多组未设置类别标签的未标注数据;
确定模块,用于根据域自适应技术及预设的第一标签识别模型确定各未标注数据对应的待选伪标签;
筛选模块,用于采用预设的深度强化学习网络模型对各待选伪标签进行筛选,以获得目标伪标签。
10.根据权利要求9所述的装置,其特征在于,所述筛选模块用于:
按照待选伪标签的类别对各未标注数据进行分类,以获得分类后的每类未标注数据的特征数据;
将待选伪标签与对应类别的未标注数据的特征数据进行关联,以获得关联特征数据;
将所述各关联特征数据输入至所述预设的深度强化学习网络模型中;
通过所述预设的深度强化学习网络模型从关联特征数据的待选伪标签中确定出目标伪标签,并输出所述目标伪标签。
11.根据权利要求9所述的装置,其特征在于,所述域自适应技术为半监督域自适应技术;所述目标域数据集中还包括多组已设置类别标签的已标注数据;
所述确定模块用于:
获取源域数据集,所述源域数据集中包括多组已设置类别标签的已标注数据;
根据所述源域数据集和所述目标域数据集对所述预设的第一标签识别模型进行训练,以获得第一训练后的标签识别模型;
将所述未标注数据输入至第一训练后的标签识别模型,以通过所述第一训练后的标签识别模型确定各未标注数据对应的待选伪标签。
12.根据权利要求11所述的装置,其特征在于,所述装置还包括:
更新模块,用于根据所述目标伪标签与对应未标注数据的关联关系构建更新后的目标域数据集;
第一训练模块,用于采用源域数据集以及所述更新后的目标域数据集对所述第一训练后的标签识别模型继续进行训练,获得第二训练后的标签识别模型;
检测模块,用于检测所述第二训练后的标签识别模型的识别精度是否达到预设的精度阈值;
处理模块,用于若是,则将所述第二训练后的标签识别模型作为最终标签识别模型;
处理模块,还用于若否,则返回执行所述将所述未标注数据输入至第一训练后的标签识别模型,以通过所述第一训练后的标签识别模型确定各未标注数据对应的待选伪标签的步骤,直至所述第二训练后的标签识别模型的识别精度达到预设的精度阈值。
13.根据权利要求12所述的装置,其特征在于,所述装置还包括:
提取模块,用于获取对所述第一训练后的标签识别模型训练时特征提取过程提取到的中间特征数据,分类后得到的分类中间数据,以及所述第一训练后的标签识别模型输出的第一待选伪标签;
计算模块,用于根据所述中间特征数据及所述分类中间数据计算奖励信息;
第二训练模块,用于根据各待选伪标签、各未标注数据、所述目标伪标签、奖励信息以及所述第一待选伪标签对所述深度强化学习网络模型进行训练操作。
14.根据权利要求13所述的装置,其特征在于,所述计算模块用于:
根据所述中间特征数据、所述分类中间数据以及预设的度量函数计算所述目标伪标签对应的质量数值;
根据所述质量数值以及预设的质量阈值计算所述奖励信息。
15.根据权利要求11-14任一项所述的装置,其特征在于,所述确定模块用于:
通过预设的第一损失函数以及源域数据集中的已标注数据对待训练模型进行训练,获得第一损失值;
通过预设的目标域大间距损失函数以及目标域数据集中的已标注数据对待训练模型进行训练,获得第二损失值;
通过预设的熵损失函数以及目标域数据集中的未标注数据对所述待训练模型进行训练,获得第三损失值;
根据所述第一损失值、第二损失值以及第三损失值对第一标签识别模型进行反向训练,获得第一训练后的标签识别模型。
16.根据权利要求15所述的装置,其特征在于,所述确定模块用于;
根据第一损失函数、目标域大间距损失函数以及熵损失函数确定目标损失函数;
根据所述目标损失函数对第一损失值、第二损失值以及第三损失值进行计算,确定目标损失值;
根据所述目标损失值对待训练模型进行反向训练,获得第一训练后的标签识别模型。
17.一种伪标签处理设备,其特征在于,包括:存储器和处理器;
所述存储器用于存储程序指令;
所述处理器用于调用所述存储器中的程序指令执行如权利要求1-8任一项所述的方法。
18.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序;所述计算机程序被执行时,实现如权利要求1-8任一项所述的方法。
CN202011159224.9A 2020-10-26 2020-10-26 伪标签处理方法、装置、设备及计算机可读存储介质 Pending CN112287994A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011159224.9A CN112287994A (zh) 2020-10-26 2020-10-26 伪标签处理方法、装置、设备及计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011159224.9A CN112287994A (zh) 2020-10-26 2020-10-26 伪标签处理方法、装置、设备及计算机可读存储介质

Publications (1)

Publication Number Publication Date
CN112287994A true CN112287994A (zh) 2021-01-29

Family

ID=74372448

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011159224.9A Pending CN112287994A (zh) 2020-10-26 2020-10-26 伪标签处理方法、装置、设备及计算机可读存储介质

Country Status (1)

Country Link
CN (1) CN112287994A (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112906561A (zh) * 2021-02-18 2021-06-04 上海明略人工智能(集团)有限公司 用于获取动作识别模型的方法、装置及设备
CN113095413A (zh) * 2021-04-14 2021-07-09 山东建筑大学 变工况故障诊断方法、***、存储介质及设备
CN113128565A (zh) * 2021-03-25 2021-07-16 之江实验室 面向预训练标注数据不可知的图像自动标注***和装置
CN113299314A (zh) * 2021-07-27 2021-08-24 北京世纪好未来教育科技有限公司 一种音频事件识别模型的训练方法、装置及其设备
CN113378895A (zh) * 2021-05-24 2021-09-10 成都欧珀通信科技有限公司 一种分类模型生成方法、装置、存储介质及电子设备
CN114283287A (zh) * 2022-03-09 2022-04-05 南京航空航天大学 基于自训练噪声标签纠正的鲁棒领域自适应图像学习方法
CN114612961A (zh) * 2022-02-15 2022-06-10 哈尔滨工业大学(深圳) 一种多源跨域表情识别方法、装置及存储介质
CN117173491A (zh) * 2023-10-24 2023-12-05 广州思德医疗科技有限公司 医学图像的标注方法、装置、电子设备及存储介质

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180218284A1 (en) * 2017-01-31 2018-08-02 Xerox Corporation Method and system for learning transferable feature representations from a source domain for a target domain
CN108460134A (zh) * 2018-03-06 2018-08-28 云南大学 基于多源域集成迁移学习的文本主题分类模型及分类方法
CN108664989A (zh) * 2018-03-27 2018-10-16 北京达佳互联信息技术有限公司 图像标签确定方法、装置及终端
CN108764281A (zh) * 2018-04-18 2018-11-06 华南理工大学 一种基于半监督自步学习跨任务深度网络的图像分类方法
CN109543731A (zh) * 2018-11-09 2019-03-29 江南大学 一种自训练框架下的三优选半监督回归算法
CN109583583A (zh) * 2017-09-29 2019-04-05 腾讯科技(深圳)有限公司 神经网络训练方法、装置、计算机设备及可读介质
CN109977918A (zh) * 2019-04-09 2019-07-05 华南理工大学 一种基于无监督域适应的目标检测定位优化方法
CN111709315A (zh) * 2020-05-27 2020-09-25 西安交通大学 一种基于领域适配的水声目标辐射噪声识别方法

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180218284A1 (en) * 2017-01-31 2018-08-02 Xerox Corporation Method and system for learning transferable feature representations from a source domain for a target domain
CN109583583A (zh) * 2017-09-29 2019-04-05 腾讯科技(深圳)有限公司 神经网络训练方法、装置、计算机设备及可读介质
CN108460134A (zh) * 2018-03-06 2018-08-28 云南大学 基于多源域集成迁移学习的文本主题分类模型及分类方法
CN108664989A (zh) * 2018-03-27 2018-10-16 北京达佳互联信息技术有限公司 图像标签确定方法、装置及终端
CN108764281A (zh) * 2018-04-18 2018-11-06 华南理工大学 一种基于半监督自步学习跨任务深度网络的图像分类方法
CN109543731A (zh) * 2018-11-09 2019-03-29 江南大学 一种自训练框架下的三优选半监督回归算法
CN109977918A (zh) * 2019-04-09 2019-07-05 华南理工大学 一种基于无监督域适应的目标检测定位优化方法
CN111709315A (zh) * 2020-05-27 2020-09-25 西安交通大学 一种基于领域适配的水声目标辐射噪声识别方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
ERIC ARAZO ET AL: "Pseudo-Labeling and Confirmation Bias in Deep Semi-Supervised Learning", 2020 INTERNATIONAL JOINT CONFERENCE ON NEURAL NETWORKS (IJCNN), 28 September 2020 (2020-09-28), pages 1 - 8 *
单纯;王敏;: "半监督单样本深度行人重识别方法", 计算机***应用, vol. 2020, no. 01, 15 January 2020 (2020-01-15) *
李真真 等: "Learning to select pseudo labels: a semi-supervised method for named entity recognition", FRONTIERS OF INFORMATION TECHNOLOGY & ELECTRONIC ENGINEERING, vol. 2020, no. 06, 30 June 2020 (2020-06-30), pages 903 - 916 *

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112906561A (zh) * 2021-02-18 2021-06-04 上海明略人工智能(集团)有限公司 用于获取动作识别模型的方法、装置及设备
CN113128565A (zh) * 2021-03-25 2021-07-16 之江实验室 面向预训练标注数据不可知的图像自动标注***和装置
CN113095413A (zh) * 2021-04-14 2021-07-09 山东建筑大学 变工况故障诊断方法、***、存储介质及设备
CN113095413B (zh) * 2021-04-14 2023-05-23 山东建筑大学 变工况故障诊断方法、***、存储介质及设备
CN113378895A (zh) * 2021-05-24 2021-09-10 成都欧珀通信科技有限公司 一种分类模型生成方法、装置、存储介质及电子设备
CN113378895B (zh) * 2021-05-24 2024-03-01 成都欧珀通信科技有限公司 一种分类模型生成方法、装置、存储介质及电子设备
CN113299314A (zh) * 2021-07-27 2021-08-24 北京世纪好未来教育科技有限公司 一种音频事件识别模型的训练方法、装置及其设备
CN114612961A (zh) * 2022-02-15 2022-06-10 哈尔滨工业大学(深圳) 一种多源跨域表情识别方法、装置及存储介质
CN114612961B (zh) * 2022-02-15 2023-04-07 哈尔滨工业大学(深圳) 一种多源跨域表情识别方法、装置及存储介质
CN114283287A (zh) * 2022-03-09 2022-04-05 南京航空航天大学 基于自训练噪声标签纠正的鲁棒领域自适应图像学习方法
CN117173491A (zh) * 2023-10-24 2023-12-05 广州思德医疗科技有限公司 医学图像的标注方法、装置、电子设备及存储介质
CN117173491B (zh) * 2023-10-24 2024-02-23 广州思德医疗科技有限公司 医学图像的标注方法、装置、电子设备及存储介质

Similar Documents

Publication Publication Date Title
CN112287994A (zh) 伪标签处理方法、装置、设备及计算机可读存储介质
CN108038103B (zh) 一种对文本序列进行分词的方法、装置和电子设备
US11507882B2 (en) Method and device for optimizing training set for text classification and storage medium
CN109829433B (zh) 人脸图像识别方法、装置、电子设备及存储介质
CN109543714B (zh) 数据特征的获取方法、装置、电子设备及存储介质
US11288514B2 (en) Video processing method and device, and storage medium
US11887215B2 (en) Image processing apparatus and method for style transformation
CN110782034A (zh) 神经网络的训练方法、装置及存储介质
EP3923202A1 (en) Method and device for data processing, and storage medium
CN111813532A (zh) 一种基于多任务机器学习模型的图像管理方法及装置
KR20200010993A (ko) 보완된 cnn을 통해 이미지 속 얼굴의 속성 및 신원을 인식하는 전자 장치.
CN109961094B (zh) 样本获取方法、装置、电子设备及可读存储介质
WO2018005565A1 (en) Automated selection of subjectively best images from burst captured image sequences
CN113792207A (zh) 一种基于多层次特征表示对齐的跨模态检索方法
CN113111917B (zh) 一种基于双重自编码器的零样本图像分类方法及装置
KR20190053481A (ko) 사용자 관심 정보 생성 장치 및 그 방법
CN112115894A (zh) 手部关键点检测模型的训练方法、装置及电子设备
CN111814538A (zh) 目标对象的类别识别方法、装置、电子设备及存储介质
CN111275089B (zh) 一种分类模型训练方法及装置、存储介质
CN109460458B (zh) 查询改写意图的预测方法及装置
CN113486978B (zh) 文本分类模型的训练方法、装置、电子设备及存储介质
CN112742026B (zh) 游戏控制方法、装置、存储介质和电子设备
KR20210048270A (ko) 복수 객체에 대한 오디오 포커싱 방법 및 장치
WO2024131408A1 (zh) 一种模型构建方法、装置、电子设备、计算机可读介质
CN112860942B (zh) 视频评论的获取方法及、装置、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination