CN112016633A

CN112016633A - 一种模型训练方法、装置、电子设备及存储介质

Info

Publication number: CN112016633A
Application number: CN202011027593.2A
Authority: CN
Inventors: 崔程; 杨敏; 魏凯
Original assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Current assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Priority date: 2020-09-25
Filing date: 2020-09-25
Publication date: 2020-12-01

Abstract

本申请公开了一种模型训练方法、装置、电子设备及存储介质，涉及人工智能领域，具体为计算机视觉、深度学习技术，可用于图像识别方面，包括：对目标数据集进行特征提取训练，得到特征提取模型；所述目标数据集中的数据为标签数据；通过所述特征提取模型对无标签数据集进行特征提取，得到无标签数据特征；根据所述无标签数据特征训练预训练模型；对所述无标签数据集中的各个无标签数据进行数据裁剪，得到裁剪无标签数据集；根据所述裁剪无标签数据集对所述预训练模型进行优化训练，得到目标预训练模型；根据所述目标数据集对所述目标预训练模型进行训练，得到目标训练模型。本申请实施例能够提高模型在特定数据集的训练效率和识别精度。

Description

一种模型训练方法、装置、电子设备及存储介质

技术领域

本申请涉及数据处理技术领域，具体涉及人工智能技术领域中的深度学习技术。

背景技术

机器学习(Machine Learning,ML)是人工智能的核心，是使计算机具有智能的根本途径，其应用遍及人工智能的各个领域。机器学习算法是一类从数据中自动分析获得规律，并利用规律对未知数据进行预测的算法。典型的，深度学习是机器学习中的其中一个领域，深度学习的过程大概可以总结为确定模型-训练模型-使用模型的过程。其中，训练模型的过程对于模型的精度起着决定性作用。

发明内容

本申请实施例提供了一种模型训练方法、装置、电子设备及存储介质，以提高模型在特定数据集的训练效率和识别精度。

第一方面，本申请实施例提供了一种模型训练方法，包括：

对目标数据集进行特征提取训练，得到特征提取模型；所述目标数据集中的数据为标签数据；

通过所述特征提取模型对无标签数据集进行特征提取，得到无标签数据特征；

根据所述无标签数据特征训练预训练模型；

对所述无标签数据集中的各个无标签数据进行数据裁剪，得到裁剪无标签数据集；

根据所述裁剪无标签数据集对所述预训练模型进行优化训练，得到目标预训练模型；

根据所述目标数据集对所述目标预训练模型进行训练，得到目标训练模型。

第二方面，本申请实施例提供了一种模型训练装置，包括：

特征提取模型获取模块，用于对目标数据集进行特征提取训练，得到特征提取模型；所述目标数据集中的数据为标签数据；

无标签数据特征获取模块，用于通过所述特征提取模型对无标签数据集进行特征提取，得到无标签数据特征；

预训练模型训练模块，用于根据所述无标签数据特征训练预训练模型；

数据裁剪模块，用于对所述无标签数据集中的各个无标签数据进行数据裁剪，得到裁剪无标签数据集；

目标预训练模型获取模块，用于根据所述裁剪无标签数据集对所述预训练模型进行优化训练，得到目标预训练模型；

目标训练模型获取模块，用于根据所述目标数据集对所述目标预训练模型进行训练，得到目标训练模型。

第三方面，本申请实施例提供了一种电子设备，包括：

至少一个处理器；以及

与所述至少一个处理器通信连接的存储器；其中，

所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行第一方面实施例所提供的模型训练方法。

第四方面，本申请实施例还提供了一种存储有计算机指令的非瞬时计算机可读存储介质，所述计算机指令用于使所述计算机执行第一方面实施例所提供的模型训练方法。

本申请实施例通过对包括标签数据的目标数据集进行特征提取训练得到特征提取模型，以通过特征提取模型对无标签数据集进行特征提取，得到无标签数据特征，进而根据无标签数据特征训练预训练模型。得到预训练模型后，对无标签数据集中的各个无标签数据进行数据裁剪，并根据得到的裁剪无标签数据集对预训练模型进行优化训练，得到目标预训练模型。最后，根据目标数据集对目标预训练模型进行训练，得到目标训练模型，解决现有模型训练方法存在的数据标注成本高导致训练时效低的问题，能够在提高训练效率的同时，提高模型的识别精度。

应当理解，本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征，也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。

附图说明

附图用于更好地理解本方案，不构成对本申请的限定。其中：

图1是本申请实施例提供的一种模型训练方法的流程图；

图2是本申请实施例提供的一种模型训练方法的流程图；

图3是本申请实施例提供的一种模型训练装置的结构图；

图4是用来实现本申请实施例的模型训练方法的电子设备的结构示意图。

具体实施方式

以下结合附图对本申请的示范性实施例做出说明，其中包括本申请实施例的各种细节以助于理解，应当将它们认为仅仅是示范性的。因此，本领域普通技术人员应当认识到，可以对这里描述的实施例做出各种改变和修改，而不会背离本申请的范围和精神。同样，为了清楚和简明，以下的描述中省略了对公知功能和结构的描述。

在机器学习领域的深度学习技术中，模型的精度对于模型的应用效果有着举足轻重的影响。目前，对模型进行训练的样本数据包括标签数据和无标签数据两种类型。通过增加标签数据的数据量可以很好地提升模型精度，然而，这种方式会导致数据的标注成本比较高，且无法很好的利用大量的无标签数据。

当前利用无标签数据来提升模型的精度的方法一般分为两种，一种为无监督学习的方法，即通过类似对比损失函数来学习大量样本数据的特征，学习到的模型一般有较好的数据特征，可以用来在特定数据集上做迁移学习。第二种为半监督学习的方法，即将无标签数据和标签数据一起对模型进行训练，通过有监督学习的特征逐步挖掘无标签数据的特征，进而扩充模型学习到的特征。

上述利用无标签数据提升模型精度的方法中，无监督学习的方法对无标签数据学习时需要的数据量极为庞大，甚至能达到亿级别。庞大的数据量使得训练出现严重的瓶颈，训练时长严重加大，在一定的时间内很难收敛，训练时效较低。半监督学习的方法对训练样本数据的要求较严格，要求无标签数据尽可能属于目标数据集的标签范围内。其中，目标数据集也即模型在应该过程中需要进行自动识别处理的数据集。而在实际训练时，很难保证大部分无标签数据属于标签数据的标签范围之内，在正式进行训练之前，往往需要一定的时间成本对无标签数据进行整理和挑选，导致间接降低训练时效。

在一个示例中，图1是本申请实施例提供的一种模型训练方法的流程图，本实施例可适用于快速训练模型以提高模型识别精度的情况，该方法可以由模型训练装置来执行，该装置可以由软件和/或硬件的方式来实现，并一般可集成在电子设备中。该电子设备可以是计算机设备等。相应的，如图1所示，该方法包括如下操作：

S110、对目标数据集进行特征提取训练，得到特征提取模型；所述目标数据集中的数据为标签数据。

其中，目标数据集也即模型在应该过程中需要进行自动识别处理的数据集。目标数据集中的数据可以为标签数据，标签数据的类型可以是任意类型，如图像数据、音频数据或字符数据等，本申请实施例并不对标签数据的具体数据类型进行限定。特征提取模型可以为对目标数据集进行特征提取训练所得到的模型，主要用于对目标数据集反复提取数据特征。

在本申请实施例中，在训练对目标数据集进行识别的目标训练模型之前，可以首先对目标数据集进行特征提取训练，得到特征提取模型。可选的，特征提取模型可以为任意类型的CNN(Convolutional Neural Networks，卷积神经网络)，且特征提取模型的损失函数可以采用arcmargin loss或triplet loss等，只要可以对目标数据集进行特征提取即可，本申请实施例并不对特征提取模型的具体模型类型以及对应的损失函数类型进行限定。

S120、通过所述特征提取模型对无标签数据集进行特征提取，得到无标签数据特征。

其中，无标签数据集可以是与目标数据集中标签数据类型相同的无标签数据组成的数据集。示例性的，当标签数据的数据类型为图像数据时，无标签数据集中的无标签数据也为图像数据。当标签数据的数据类型为字符数据时，无标签数据集中的无标签数据也为字符数据。但需要说明的是，无标签数据的标签类型无需属于目标数据集的标签范围内，并且无标签数据不需要庞大的数据量支撑。无标签数据集可以有多种获取方式，如互联网下载相关数据或通过其他方式搜集的数据中，本申请实施例对此并不进行限制。

相应的，在得到特征提取模型后，可以利用特征提取模型对无标签数据集中的各个无标签数据进行特征提取，得到无标签数据特征。由于本申请实施例不要求无标签数据的标签类型属于目标数据集的标签范围，因此无需对无标签数据集进行整理和挑选，避免了训练数据的筛选时间，可以有效提高训练效率。

S130、根据所述无标签数据特征训练预训练模型。

其中，预训练模型可以理解为目标预训练模型之前的中间训练模型，也可以理解为目标预训练模型对应的初步训练模型。预训练模型与预训练模型的部分权重值相同。

当利用特征提取模型提取到无标签数据集的无标签数据特征后，可以利用无标签数据特征进行特征训练，得到预训练模型。预训练模型具备初始的识别功能，但识别精度还需要进一步提升。也即，本申请实施例可以利用无标签数据作为样本数据进行模型训练，从而有效降低数据标注成本。

S140、对所述无标签数据集中的各个无标签数据进行数据裁剪，得到裁剪无标签数据集。

其中，裁剪无标签数据集可以是对无标签数据进行裁剪后，根据各裁剪后的无标签数据组成的数据集。

S150、根据所述裁剪无标签数据集对所述预训练模型进行优化训练，得到目标预训练模型。

其中，目标预训练模型可以是最终训练成功的预训练模型，其识别精度要高于预训练模型，可以用于对标签数据进行训练得到最终的目标训练模型。

可以理解的是，虽然预训练模型已经初步具备识别功能，但识别精度仍不满足需求。为了进一步提高预训练模型的识别精度，可以在得到预训练模型后，对无标签数据集中的各个无标签数据进行数据裁剪，得到裁剪无标签数据集。可选的，进行数据裁剪时，可以重点裁剪无标签数据的感兴趣区域，所谓感兴趣区域也即最能体现数据特征的区域。也即，裁剪无标签数据集中的各个裁剪后的无标签数据可以反应最核心的数据特征，其数据特征纯度更高。例如，可以对各无标签图像数据裁剪出包括目标对象(如人物、动物或车辆等)的区域，裁剪后的图像数据可以包括目标对象的位置或大小等特征信息。相应的，在得到裁剪无标签数据集后，可以进一步利用裁剪无标签数据集对预训练模型进行优化训练，从而得到识别精度更高的目标预训练模型。

S160、根据所述目标数据集对所述目标预训练模型进行训练，得到目标训练模型。

相应的，在得到目标预训练模型之后，既可以根据目标数据集对目标预训练模型进行最终的学习训练过程，得到目标训练模型。该目标训练模型可以有效识别目标数据集中各标签数据，且识别精度更高。

由此可见，本申请实施例所提供的模型训练方法无须数据标注过程，可以在有效降低数据标注成本的同时，大大提升模型在特定数据集的精度。另外，本申请实施例所提供的模型训练方法不需要庞大的无标签数据支撑，可以大大节省无标签数据的数据量，从而使得模型迭代速度更快。同时，无标签数据只需要保持数据类型与标签数据的类型相同即可，不需要限定无标签数据的标签类型属于目标数据集的标签范围内，可以大大节省无标签数据的整理和挑选的时间。

在一个示例中，图2是本申请实施例提供的一种模型训练方法的流程图，本申请实施例在上述各实施例的技术方案的基础上，进行了优化改进，给出了对目标数据集进行特征提取训练、根据所述无标签数据特征训练预训练模型、对所述无标签数据集中的各个无标签数据进行数据裁剪以及根据所述目标数据集对所述目标预训练模型进行训练的多种具体实现方式。

如图2所示的一种模型训练方法，包括：

S210、通过预设特征提取模型对所述目标数据集进行度量学习，得到特征提取模型。

其中，预设特征提取模型可以是保留原始权重的未经训练的原始模型，如原始的CNN模型等。可选的，预设特征提取模型的损失函数可以采用arcmargin损失函数。

在本申请实施例中，对目标数据集进行特征提取训练时，可以通过预设特征提取模型对目标数据集进行度量学习。所谓度量学习也即相似度学习。预设特征提取模型采用arcmargin损失函数不仅可以有效训练特征提取模型，还可以在后续提取无标签数据集的无标签数据特征时，对提取的每一聚类类别的无标签数据给出相应聚类类别的置信度。

在本申请的一个可选实施例中，所述目标数据集中的标签数据为标签图像数据，所述目标训练模型用于对标签图像进行图像识别。

其中，标签图像数据也即带标签的图像数据。

在本申请实施例中，可以对标签图像数据构成的目标数据集训练目标训练模型，以利用目标训练模型实现图像识别技术。可选的，目标训练模型可以广泛应用于各类计算机视觉任务中，如动植物分类、菜品识别及地标识别等，本申请实施例并不对目标训练模型的图像识别应用领域进行限定。

S220、通过所述特征提取模型对无标签数据集进行特征提取，得到无标签数据特征。

S230、根据所述无标签数据特征训练预训练模型。

相应的，S230具体可以包括下述操作：

S231、通过所述特征提取模型对所述无标签数据特征进行聚类处理。

可选的，可以通过对无标签数据进行聚类的方法训练预训练模型。可选的，可以通过特征提取模型对无标签数据进行聚类处理。特征提取模型可以对每一个无标签数据提取一个对应的特征向量，同时对得到的每个聚类类别计算一个对应的置信度。

S232、根据所述无标签数据特征的聚类结果对所述无标签数据集中的各个无标签数据进行分类处理。

其中，所述聚类结果包括的聚类类别数量与所述目标数据集中标签数据的类别数量的差值满足特征聚类条件。

其中，聚类类别也即无标签数据特征的聚类处理得到的多个数据类别。特征聚类条件可以根据实际需求设定，如远大于某一设定阈值等，本申请实施例并不对特征聚类条件的具体条件内容进行限定。

相应的，当通过特征提取模型对无标签数据特征进行聚类处理得到多个类别后，可以通过获取的聚类类别对各无标签数据进行自动标注。需要说明的是，这里通过聚类类别对各无标签数据进行自动标注的方式并不属于通过标签进行数据标注方式，而是属于一种数据分类方式。也即，将各个无标签数据分别归属于其对应的聚类类别集合中。聚类处理方式可以是机器学习领域中的任何一种聚类方式。为了更好地利用无标签数据的无标签数据特征，可以限定聚类结果包括的聚类类别数量与目标数据集中标签数据的类别数量的差值满足特征聚类条件。例如，可以限定聚类结果包括的聚类类别数量远大于目标数据集中标签数据的类别数量。示例性的，假设目标数据集中标签数据的类别数量为200类，则聚类类别数量可以为1万类。

S233、根据所述无标签数据集的分类处理结果更新所述无标签数据集得到更新无标签数据集，并利用所述更新无标签数据集训练所述预训练模型。

其中，更新无标签数据集可以是包括了聚类类别的无标签数据集。

相应的，当将各个无标签数据分别归属于其对应的聚类类别集合中后，可以将各个包括一定数量的无标签数据的聚类类别集合组成更新无标签数据集。可以理解的是，更新无标签数据集中包括的无标签数据实际上没有发生本质变化，只是在一个完整的集合中又划分了多个子集合，每个集合属于一种聚类类别，且包括一定数量的无标签数据。也即，更新无标签数据集中各数据的数据特征更加集中，其对预训练模型的训练效果更加理想。

上述技术方案，通过对无标签数据集进行聚类处理后，根据处理结果对无标签数据集中的各个无标签数据进行分类处理，形成新的无标签数据集，从而利用无标签数据特征更加集中的新的无标签数据集训练预训练模型，可以提高预训练模型的训练效率和识别精度。

在本申请的一个可选实施例中，所述根据所述无标签数据集的分类处理结果训练所述预训练模型，可以包括：确定所述更新无标签数据集的当前分类处理结果；根据所述当前分类处理结果中各当前聚类类别的置信度对各所述当前聚类类别进行可靠性排序；根据可靠性排序结果获取前设定比例的无标签数据作为目标分类结果，并根据所述目标分类结果训练所述预训练模型；返回执行对目标数据集进行特征提取训练的操作，直至所述可靠性排序结果保持不变。其中，当前聚类处理结果可以是当前的更新无标签数据集的聚类处理结果。

其中，当前分类处理结果可以是当前更新无标签数据集的分类处理结果。当前聚类类别可以是更新无标签数据集所包括的聚类类别。当前可靠性排序可以是按照置信度的数值由大到小的排序方式。可靠性排序结果可以是通过可靠性排序方式获取的各无标签数据的排序结果。设定比例可以根据实际需求设定，如50％或80％等，本申请实施例并不对设定比例的具体数值进行限定。目标分类结果可以是可靠性满足需求的分类结果。

为了进一步提高训练效率和预训练模型的识别精度，在得到更新无标签数据集后，可以根据更新无标签数据集的当前分类处理结果中各当前聚类类别的置信度对各当前聚类类别进行可靠性排序，也即根据各当前聚类类别的置信度的数值由大到小的顺序对各个当前聚类类别进行排序。顺序越靠前的聚类类别对应的置信度的数值越大，表明其可靠性越好。此时，可以获取可靠性排序结果中前设定比例的无标签数据作为目标分类结果，并根据获取的目标分类结果训练预训练模型。该目标分类结果的置信度的数值较大，可靠性较理想，训练效果也更理想。当前更新无标签数据集训练完成后，可以返回执行对目标数据集进行特征提取训练的操作，也即反复迭代训练，直至可靠性排序结果保持不变，也即直到无标签数据集中的大多数无标签数据都参与了无标签数据特征的特征提取过程。所谓迭代训练也即后续每一次迭代训练的过程中，可以采用前一次训练得到的特征提取模型对目标数据集进行特征提取训练，并利用新的特征提取模型对前一次的更新无标签数据集进行特征提取，且利用新的预训练模型对更新无标签数据集进行训练。这样迭代训练的方式中，由于更新无标签数据集的特征越来越强，越来越细化。因此，每一次对更新无标签数据集的聚类处理得到的聚类类别的数量都比上一次的聚类类别的数量要多，可以区分无标签数据的更细化的特征。由此可见，通过迭代训练的方式可以更快速且更有效地获取最终的预训练模型。

S240、对所述无标签数据集中的各个无标签数据进行数据裁剪，得到裁剪无标签数据集。

相应的，S240具体可以包括下述操作：

S241、根据所述预训练模型预测所述无标签数据集中各所述无标签数据匹配的预测热度区域。

其中，预测热度区域可以是无标签数据的特征集中区域。

通过无标签数据集中的各个原始的无标签数据训练得到的预训练模型虽然具有一定的识别功能，但识别精度并不理想。为了进一步提高预训练模型的识别精度，可以利用获取的预训练模型预测无标签数据集中各个无标签数据匹配的预测热度区域。

S242、根据各所述预测热度区域对各所述无标签数据进行感兴趣区域进行数据裁剪。

相应的，在得到每个无标签数据匹配的预测热度区域后，可以利用各无标签数据匹配的预测热度区域对各无标签数据进行数据裁剪，以保留每个无标签数据的特征集中区域。

上述方案中，由于预训练模型具备一定的识别精度，且通过利用预训练模型对各无标签数据匹配的预测热度区域进行预测，只是简单确定特征集中区域，而无需具体识别数据特征，因此数据裁剪的准确率较高，相应得到的裁剪无标签数据集中的各个裁剪后的无标签数据可以反应最核心的数据特征，其数据特征纯度更高。

S250、根据所述裁剪无标签数据集对所述预训练模型进行优化训练，得到目标预训练模型。

S260、根据所述目标数据集对所述目标预训练模型进行训练，得到目标训练模型。

相应的，S260具体可以包括下述操作：

S261、对所述目标预训练模型确定目标学习率。

其中，目标学习率可以是数值较小的学习率，如0.1或0.01等，本申请实施例并不对目标学习率的具体数值进行限定。

由于目标预训练模型已经具备较高的识别精度，不需要过度学习。因此，可选的，在根据目标数据集对目标预训练模型进行训练时，可以对目标预训练模型确定数值较小的目标学习率，防止目标预训练模型过度学习造成权重变化。

S262、对所述目标预训练模型的预设网络层的网络参数进行参数固定处理。

S263、根据所述目标数据集对参数固定处理后的目标预训练模型进行训练。

其中，预设网络层可以是目标预训练模型的前设定数量的网络层。

为了保持目标预训练模型快速、有效地提取目标数据集中标签数据的基础特征，可以对目标预训练模型的预设网络层的网络参数进行参数固定处理。例如，假设目标预训练模型总共有100层的网络层，则可以固定前20层或前30层的网络层。参数固定处理后，可以利用参数固定处理后的目标预训练模型对原始的目标数据集进行最终的学习训练过程，以得到较高识别精度的目标训练模型。参数固定处理方式可以保证标签数据的基础特征不被打乱，从而进一步提高目标训练模型的训练效率和识别精度。

通常情况下，为了能够有效提升模型的识别精度，往往需要将规模相对小的模型换为规模相对较大的模型，或者扩充用于模型训练的数据量。然而规模相对较大的模型预测速度慢，很难用于工业部署。而数据量的扩充需要大量的数据标注工作，耗时耗力。本申请实施例提供的模型训练方法可以无须标注数据，即可提升模型在目标数据集的识别精度。相比现有的无监督学习的方式，同时可以大大节省无标签数据的数据量，从而使得模型训练迭代速度更快。相比现有的半监督学习的方式，无须关注无标签数据的标签类型是否属于目标数据集的标签范围内，可以大大节省数据的整理和挑选的时间。

在一个示例中，图3是本申请实施例提供的一种模型训练装置的结构图，本申请实施例可适用于快速训练模型以提高模型识别精度的情况，该装置通过软件和/或硬件实现，并具体配置于电子设备中。该电子设备可以是计算机设备等。

如图3所示的一种模型训练装置300，包括：特征提取模型获取模块310、无标签数据特征获取模块320、预训练模型训练模块330、数据裁剪模块340、目标预训练模型获取模块350和目标训练模型获取模块360。其中，

特征提取模型获取模块310，用于对目标数据集进行特征提取训练，得到特征提取模型；所述目标数据集中的数据为标签数据；

无标签数据特征获取模块320，用于通过所述特征提取模型对无标签数据集进行特征提取，得到无标签数据特征；

预训练模型训练模块330，用于根据所述无标签数据特征训练预训练模型；

数据裁剪模块340，用于对所述无标签数据集中的各个无标签数据进行数据裁剪，得到裁剪无标签数据集；

目标预训练模型获取模块350，用于根据所述裁剪无标签数据集对所述预训练模型进行优化训练，得到目标预训练模型；

目标训练模型获取模块360，用于根据所述目标数据集对所述目标预训练模型进行训练，得到目标训练模型。

可选的，特征提取模型获取模块310具体用于：通过预设特征提取模型对所述目标数据集进行度量学习；其中，所述预设特征提取模型的损失函数采用arcmargin损失函数。

可选的，预训练模型训练模块330具体用于：通过所述特征提取模型对所述无标签数据特征进行聚类处理；根据所述无标签数据特征的聚类结果对所述无标签数据集中的各个无标签数据进行分类处理；其中，所述聚类结果包括的聚类类别数量与所述目标数据集中标签数据的类别数量的差值满足特征聚类条件；根据所述无标签数据集的分类处理结果更新所述无标签数据集得到更新无标签数据集，并利用所述更新无标签数据集训练所述预训练模型。

可选的，预训练模型训练模块330具体用于：确定所述更新无标签数据集的当前分类处理结果；根据所述当前分类处理结果中各当前聚类类别的置信度对各所述当前聚类类别进行可靠性排序；根据可靠性排序结果获取前设定比例的无标签数据作为目标分类结果，并根据所述目标分类结果训练所述预训练模型；返回执行对目标数据集进行特征提取训练的操作，直至所述可靠性排序结果保持不变。

可选的，数据裁剪模块340具体用于：根据所述预训练模型预测所述无标签数据集中各所述无标签数据匹配的预测热度区域；根据各所述预测热度区域对各所述无标签数据进行感兴趣区域进行数据裁剪。

可选的，目标训练模型获取模块360具体用于：对所述目标预训练模型确定目标学习率；对所述目标预训练模型的预设网络层的网络参数进行参数固定处理；根据所述目标数据集对参数固定处理后的目标预训练模型进行训练。

可选的，所述目标数据集中的标签数据为标签图像数据，所述目标训练模型用于对标签图像进行图像识别。

上述模型训练装置可执行本申请任意实施例所提供的模型训练方法，具备执行方法相应的功能模块和有益效果。未在本实施例中详尽描述的技术细节，可参见本申请任意实施例提供的模型训练方法。

由于上述所介绍的模型训练装置为可以执行本申请实施例中的模型训练方法的装置，故而基于本申请实施例中所介绍的模型训练方法，本领域所属技术人员能够了解本实施例的模型训练装置的具体实施方式以及其各种变化形式，所以在此对于该模型训练装置如何实现本申请实施例中的模型训练方法不再详细介绍。只要本领域所属技术人员实施本申请实施例中模型训练方法所采用的装置，都属于本申请所欲保护的范围。

在一个示例中，本申请还提供了一种电子设备和一种可读存储介质。

图4是用来实现本申请实施例的模型训练方法的电子设备的结构示意图。如图4所示，是根据本申请实施例的模型训练方法的电子设备的框图。电子设备旨在表示各种形式的数字计算机，诸如，膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置，诸如，个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例，并且不意在限制本文中描述的和/或者要求的本申请的实现。

如图4所示，该电子设备包括：一个或多个处理器401、存储器402，以及用于连接各部件的接口，包括高速接口和低速接口。各个部件利用不同的总线互相连接，并且可以被安装在公共主板上或者根据需要以其它方式安装。处理器可以对在电子设备内执行的指令进行处理，包括存储在存储器中或者存储器上以在外部输入/输出装置(诸如，耦合至接口的显示设备)上显示GUI的图形信息的指令。在其它实施方式中，若需要，可以将多个处理器和/或多条总线与多个存储器和多个存储器一起使用。同样，可以连接多个电子设备，各个设备提供部分必要的操作(例如，作为服务器阵列、一组刀片式服务器、或者多处理器***)。图4中以一个处理器401为例。

存储器402即为本申请所提供的非瞬时计算机可读存储介质。其中，所述存储器存储有可由至少一个处理器执行的指令，以使所述至少一个处理器执行本申请所提供的模型训练方法。本申请的非瞬时计算机可读存储介质存储计算机指令，该计算机指令用于使计算机执行本申请所提供的模型训练方法。

存储器402作为一种非瞬时计算机可读存储介质，可用于存储非瞬时软件程序、非瞬时计算机可执行程序以及模块，如本申请实施例中的模型训练方法对应的程序指令/模块(例如，附图3所示的特征提取模型获取模块310、无标签数据特征获取模块320、预训练模型训练模块330、数据裁剪模块340、目标预训练模型获取模块350和目标训练模型获取模块360)。处理器401通过运行存储在存储器402中的非瞬时软件程序、指令以及模块，从而执行服务器的各种功能应用以及数据处理，即实现上述方法实施例中的模型训练方法。

存储器402可以包括存储程序区和存储数据区，其中，存储程序区可存储操作***、至少一个功能所需要的应用程序；存储数据区可存储实现模型训练方法的电子设备的使用所创建的数据等。此外，存储器402可以包括高速随机存取存储器，还可以包括非瞬时存储器，例如至少一个磁盘存储器件、闪存器件、或其他非瞬时固态存储器件。在一些实施例中，存储器402可选包括相对于处理器401远程设置的存储器，这些远程存储器可以通过网络连接至实现模型训练方法的电子设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

实现模型训练方法的电子设备还可以包括：输入装置403和输出装置404。处理器401、存储器402、输入装置403和输出装置404可以通过总线或者其他方式连接，图4中以通过总线连接为例。

输入装置403可接收输入的数字或字符信息，以及产生与实现模型训练方法的电子设备的用户设置以及功能控制有关的键信号输入，例如触摸屏、小键盘、鼠标、轨迹板、触摸板、指示杆、一个或者多个鼠标按钮、轨迹球、操纵杆等输入装置。输出装置404可以包括显示设备、辅助照明装置(例如，LED)和触觉反馈装置(例如，振动电机)等。该显示设备可以包括但不限于，液晶显示器(LCD)、发光二极管(LED)显示器和等离子体显示器。在一些实施方式中，显示设备可以是触摸屏。

此处描述的***和技术的各种实施方式可以在数字电子电路***、集成电路***、专用ASIC(专用集成电路)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括：实施在一个或者多个计算机程序中，该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程***上执行和/或解释，该可编程处理器可以是专用或者通用可编程处理器，可以从存储***、至少一个输入装置、和至少一个输出装置接收数据和指令，并且将数据和指令传输至该存储***、该至少一个输入装置、和该至少一个输出装置。

这些计算程序(也称作程序、软件、软件应用、或者代码)包括可编程处理器的机器指令，并且可以利用高级过程和/或面向对象的编程语言、和/或汇编/机器语言来实施这些计算程序。如本文使用的，术语“机器可读介质”和“计算机可读介质”指的是用于将机器指令和/或数据提供给可编程处理器的任何计算机程序产品、设备、和/或装置(例如，磁盘、光盘、存储器、可编程逻辑装置(PLD))，包括，接收作为机器可读信号的机器指令的机器可读介质。术语“机器可读信号”指的是用于将机器指令和/或数据提供给可编程处理器的任何信号。

为了提供与用户的交互，可以在计算机上实施此处描述的***和技术，该计算机具有：用于向用户显示信息的显示装置(例如，CRT(阴极射线管)或者LCD(液晶显示器)监视器)；以及键盘和指向装置(例如，鼠标或者轨迹球)，用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互；例如，提供给用户的反馈可以是任何形式的传感反馈(例如，视觉反馈、听觉反馈、或者触觉反馈)；并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。

可以将此处描述的***和技术实施在包括后台部件的计算***(例如，作为数据服务器)、或者包括中间件部件的计算***(例如，应用服务器)、或者包括前端部件的计算***(例如，具有图形用户界面或者网络浏览器的用户计算机，用户可以通过该图形用户界面或者该网络浏览器来与此处描述的***和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算***中。可以通过任何形式或者介质的数字数据通信(例如，通信网络)来将***的部件相互连接。通信网络的示例包括：局域网(LAN)、广域网(WAN)和互联网。

计算机***可以包括客户端和服务器。客户端可以是智能手机、笔记本电脑、台式计算机、平板电脑、智能音箱等，但并不局限于此。服务器可以是独立的物理服务器，也可以是多个物理服务器构成的服务器集群或者分布式***，还可以是提供云计算、云服务、云数据库、云存储等基础云计算服务的云服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。

应该理解，可以使用上面所示的各种形式的流程，重新排序、增加或删除步骤。例如，本发申请中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行，只要能够实现本申请公开的技术方案所期望的结果，本文在此不进行限制。

上述具体实施方式，并不构成对本申请保护范围的限制。本领域技术人员应该明白的是，根据设计要求和其他因素，可以进行各种修改、组合、子组合和替代。任何在本申请的精神和原则之内所作的修改、等同替换和改进等，均应包含在本申请保护范围之内。

Claims

1.一种模型训练方法，包括：

根据所述无标签数据特征训练预训练模型；

2.根据权利要求1所述的方法，其中，所述对目标数据集进行特征提取训练，包括：

通过预设特征提取模型对所述目标数据集进行度量学习；

其中，所述预设特征提取模型的损失函数采用arcmargin损失函数。

3.根据权利要求1所述的方法，其中，所述根据所述无标签数据特征训练预训练模型，包括：

通过所述特征提取模型对所述无标签数据特征进行聚类处理；

根据所述无标签数据特征的聚类结果对所述无标签数据集中的各个无标签数据进行分类处理；其中，所述聚类结果包括的聚类类别数量与所述目标数据集中标签数据的类别数量的差值满足特征聚类条件；

根据所述无标签数据集的分类处理结果更新所述无标签数据集得到更新无标签数据集，并利用所述更新无标签数据集训练所述预训练模型。

4.根据权利要求3所述的方法，其中，所述根据所述无标签数据集的分类处理结果训练所述预训练模型，包括：

确定所述更新无标签数据集的当前分类处理结果；

根据所述当前分类处理结果中各当前聚类类别的置信度对各所述当前聚类类别进行可靠性排序；

根据可靠性排序结果获取前设定比例的无标签数据作为目标分类结果，并根据所述目标分类结果训练所述预训练模型；

返回执行对目标数据集进行特征提取训练的操作，直至所述可靠性排序结果保持不变。

5.根据权利要求1所述的方法，其中，所述对所述无标签数据集中的各个无标签数据进行数据裁剪，包括：

根据所述预训练模型预测所述无标签数据集中各所述无标签数据匹配的预测热度区域；

根据各所述预测热度区域对各所述无标签数据进行感兴趣区域进行数据裁剪。

6.根据权利要求1所述的方法，其中，所述根据所述目标数据集对所述目标预训练模型进行训练，包括：

对所述目标预训练模型确定目标学习率；

对所述目标预训练模型的预设网络层的网络参数进行参数固定处理；

根据所述目标数据集对参数固定处理后的目标预训练模型进行训练。

7.根据权利要求1-6任一所述的方法，其中，所述目标数据集中的标签数据为标签图像数据，所述目标训练模型用于对标签图像进行图像识别。

8.一种模型训练装置，包括：

9.根据权利要求8所述的装置，其中，所述特征提取模型获取模块具体用于：

通过预设特征提取模型对所述目标数据集进行度量学习；

10.根据权利要求8所述的装置，其中，所述预训练模型训练模块具体用于：

11.根据权利要求10所述的装置，其中，所述预训练模型训练模块具体用于：

确定所述更新无标签数据集的当前分类处理结果；

12.根据权利要求8所述的装置，其中，所述数据裁剪模块具体用于：

13.根据权利要求8所述的装置，其中，所述目标训练模型获取模块具体用于：

对所述目标预训练模型确定目标学习率；

14.根据权利要求8-13任一所述的装置，其中，所述目标数据集中的标签数据为标签图像数据，所述目标训练模型用于对标签图像进行图像识别。

15.一种电子设备，包括：

至少一个处理器；以及

与所述至少一个处理器通信连接的存储器；其中，

所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行权利要求1-7中任一项所述的模型训练方法。

16.一种存储有计算机指令的非瞬时计算机可读存储介质，所述计算机指令用于使所述计算机执行权利要求1-7中任一项所述的模型训练方法。