CN112990312A

CN112990312A - 模型训练方法、图像识别方法、装置、设备及存储介质

Info

Publication number: CN112990312A
Application number: CN202110277856.3A
Authority: CN
Inventors: 陈嘉莉; 周超勇; 刘玉宇
Original assignee: Ping An Technology Shenzhen Co Ltd
Current assignee: Ping An Technology Shenzhen Co Ltd
Priority date: 2021-03-15
Filing date: 2021-03-15
Publication date: 2021-06-18

Abstract

本申请涉及人工智能中的模型构建，提供一种模型训练方法、图像识别方法、装置、设备及存储介质，该方法包括：获取第一样本集和第二样本集；根据第一样本集中的多个简单样本构造多个第一样本对，并根据第二样本集中的多个困难样本构造多个第二样本对；确定每个第一样本对中的两个简单样本之间的第一相似度，并确定每个第二样本对中的两个困难样本之间的第二相似度；根据多个第一相似度和多个第二相似度，计算预置的图像识别模型的目标损失函数；根据目标损失函数调整图像识别模型的模型参数，并根据第一样本集和第二样本集对调整模型参数后的图像识别模型进行迭代训练。本申请能够提升图像识别模型的训练效果。

Description

模型训练方法、图像识别方法、装置、设备及存储介质

技术领域

本申请涉及模型构建技术领域，尤其涉及一种模型训练方法、图像识别方法、装置、设备及存储介质。

背景技术

图像识别是指利用计算机对图像进行处理、分析和理解，以识别各种不同模式的目标和对象的技术，现阶段的图像识别技术包括人脸识别与商品识别。图像识别技术的用处十分广泛，由于目标识别图像之间存在较大的变化多样性，给图像识别带来了极大的挑战。目前，通过图像识别模型对待识别图像进行识别，为了提高识别准确性，可以充分利用与图像识别任务相关的先验分布来设计图像识别模型的损失函数。但是，利用先验分布设计出的图像识别模型识别简单样本(Easy Sample)的效果尚可，而在识别困难样本(HardSample)时的类间间距较大，图像识别的效果不好。因此，如何优化图像识别模型，使之提高对困难样本的识别准确性成为了亟待解决的问题。

发明内容

本申请的主要目的在于提供一种模型训练方法、图像识别方法、装置、设备及存储介质，旨在提升图像识别模型的训练效果，从而提高图像识别模型对困难样本的识别准确性。

第一方面，本申请提供一种模型训练方法，包括：

获取第一样本集和第二样本集，所述第一样本集包括多个简单样本，所述第二样本集包括多个困难样本；

根据所述第一样本集中的多个简单样本构造多个第一样本对，并根据所述第二样本集中的多个困难样本构造多个第二样本对；

确定每个所述第一样本对中的两个简单样本之间的第一相似度，并确定每个所述第二样本对中的两个困难样本之间的第二相似度；

根据所述多个第一相似度和多个第二相似度，计算预置的图像识别模型的目标损失函数；

根据目标损失函数调整所述图像识别模型的模型参数，并根据所述第一样本集和第二样本集对调整模型参数后的所述图像识别模型进行迭代训练。

第二方面，本申请还提供一种图像识别方法，包括：

获取待识别的目标图像；

通过目标图像识别模型对所述目标图像进行图像识别，得到图像识别结果；

其中，所述目标图像识别模型是根据上述的模型训练方法进行训练得到的。

第三方面，本申请还提供一种模型训练装置，所述模型训练装置包括：

获取模块，用于获取第一样本集和第二样本集，所述第一样本集包括多个简单样本，所述第二样本集包括多个困难样本；

构造模块，用于根据所述第一样本集中的多个简单样本构造多个第一样本对，并根据所述第二样本集中的多个困难样本构造多个第二样本对；

确定模块，用于确定每个所述第一样本对中的两个简单样本之间的第一相似度，并确定每个所述第二样本对中的两个困难样本之间的第二相似度；

计算模块，用于根据所述多个第一相似度和多个第二相似度，计算预置的图像识别模型的目标损失函数；

训练模块，用于根据目标损失函数调整所述图像识别模型的模型参数，并根据所述第一样本集和第二样本集对调整模型参数后的所述图像识别模型进行迭代训练。

第四方面，本申请还提供一种计算机设备，所述计算机设备包括处理器、存储器、以及存储在所述存储器上并可被所述处理器执行的计算机程序，其中所述计算机程序被所述处理器执行时，实现如上所述的模型训练方法或者图像识别方法的步骤。

第五方面，本申请还提供一种计算机可读存储介质，所述计算机可读存储介质上存储有计算机程序，其中所述计算机程序被处理器执行时，实现如上所述的模型训练方法图像识别方法的步骤。

本申请提供一种模型训练方法、图像识别方法、装置、设备及存储介质，本申请通过获取第一样本集和第二样本集，第一样本集包括多个简单样本，第二样本集包括多个困难样本，然后根据第一样本集中的多个简单样本构造多个第一样本对，根据第二样本集中的多个困难样本构造多个第二样本对，并确定每个第一样本对中的两个简单样本之间的第一相似度，确定每个第二样本对中的两个困难样本之间的第二相似度，之后根据多个第一相似度和多个第二相似度，计算预置的图像识别模型的目标损失函数，根据目标损失函数调整图像识别模型的模型参数，最后根据第一样本集和第二样本集对调整模型参数后的图像识别模型进行迭代训练，从而优化图像识别模型的模型参数，提升图像识别模型的训练效果，缩小困难样本之间的类间间距，从而提高图像识别模型对困难样本的识别准确性。

附图说明

为了更清楚地说明本申请实施例技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本申请实施例提供的一种模型训练方法的步骤流程示意图；

图2为图1中的模型训练方法的子步骤流程示意图；

图3为本申请实施例提供的一种图像识别方法的步骤流程示意图；

图4为本申请实施例提供的一种模型训练装置的示意性框图；

图5为图4中的模型训练装置的子模块的示意性框图；

图6为本申请实施例提供的一种图像识别装置的示意性框图；

图7为本申请实施例提供的一种计算机设备的结构示意性框图。

本申请目的的实现、功能特点及优点将结合实施例，参照附图做进一步说明。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

附图中所示的流程图仅是示例说明，不是必须包括所有的内容和操作/步骤，也不是必须按所描述的顺序执行。例如，有的操作/步骤还可以分解、组合或部分合并，因此实际执行的顺序有可能根据实际情况改变。另外，虽然在装置示意图中进行了功能模块的划分，但是在某些情况下，可以以不同于装置示意图中的模块划分。

本申请实施例提供一种模型训练方法、图像识别方法、装置、设备及存储介质。其中，该模型训练方法可应用于终端设备或服务器中，该终端设备可以为手机、平板电脑、笔记本电脑、台式电脑、个人数字助理和穿戴式设备等电子设备；该服务器可以为单台的服务器，也可以为由多台服务器组成的服务器集群。需要说明的是，该模型训练方法可应用于图像识别领域，例如应用于人脸识别、细粒度图像识别、人体姿态识别、商品识别等，通过该模型训练方法训练出的目标图像识别模型例如为人脸识别模型、细粒度图像识别模型、人体姿态识别模型、商品识别模型等，本申请不做具体限定。以下以该模型训练方法应用于服务器为例进行解释说明。

下面结合附图，对本申请的一些实施方式作详细说明。在不冲突的情况下，下述的实施例及实施例中的特征可以相互组合。

请参照图1，图1为本申请实施例提供的一种模型训练方法的步骤流程示意图。

如图1所示，该模型训练方法包括步骤S101至步骤S105。

步骤S101、获取第一样本集和第二样本集，所述第一样本集包括多个简单样本，所述第二样本集包括多个困难样本。

其中，获取图像识别模型的训练样本集，训练样本集包括多个样本图像。训练样本集包括第一样本集和第二样本集，第一样本集包括多个简单样本(Easy Sample，ES)，第二样本集包括多个困难样本(Hard Sample，GS)。需要说明的是，简单样本和困难样本为训练样本集中的样本图像，例如人脸图像，人体姿态图像等，可根据图像识别模型的类型而确定。

在一实施例中，训练样本集包括多个样本图像，从训练样本集中获取多个简单样本，得到第一样本集，并从训练样本集中获取多个困难样本，得到第二样本集。需要说明的是，每个样本图像标注有历史记录信息，历史记录信息用于记录每个样本图像的图像识别的历史数据，根据样本图像标注的历史记录信息确定样本图像的样本类型，该样本类型包括简单样本和困难样本。

例如，历史记录信息包括历史识别准确率，当每个样本图像标注的历史识别准确率大于等于预设识别准确率时，将该样本图像作为简单样本；当每个样本图像标注的历史识别准确率小于预设识别准确率时，将该样本图像作为困难样本。

需要说明的是，简单样本在进行图像识别时，类内间距较大，类间间距较小且相似度的重叠区域较小，图像识别模型的识别准确率较高；困难样本在进行图像识别时，类内间距较小，类间间距较大且相似度的重叠区域较大，图像识别模型的识别准确率较低。

在一实施例中，困难样本指的就是难学的样本(图像识别模型的损失loss大于等于设定值)，简单样本就是好学的样本(图像识别模型的损失loss小于设定值)，训练样本集包括多个样本图像，通过是否携带有设定参数判断样本图像的样本类型。例如，知识蒸馏模型中的T(Temperature)参数用于判断样本图像的样本类型，简单样本携带有T参数，困难样本未携带T参数，通过T参数能够准确地判断训练样本集中的样本图像为简单样本还是困难样本。

步骤S102、根据所述第一样本集中的多个简单样本构造多个第一样本对，并根据所述第二样本集中的多个困难样本构造多个第二样本对。

一个样本对由两张样本图像组成。通过多个简单样本构造多个第一样本对，第一样本对由两张简单样本组成，通过多个困难样本构造多个第二样本对，第二样本对由两张困难样本组成。第一样本对包括第一正样本对和第一负样本对，其中，第一正样本对中的两个简单样本的用户标识相同，第一负样本对中的两个简单样本的用户标识不同；第二样本对包括第二正样本对和第二负样本对，其中，第二正样本对中的两个困难样本的用户标识相同，第二负样本对中的两个困难样本的用户标识不同。

在一实施例中，从第一样本集中选取两个简单样本进行关联，得到多个第一样本对，从第二样本集中选取两个困难样本进行关联，得到多个第二样本对。具体地，第一样本对可以根据两个简单样本之间的相似度进行关联得到，第二样本对可以根据两个困难样本之间的相似度进行关联得到。例如，确定每两个简单样本之间的相似度；根据每两个简单样本之间的相似度，从多个简单样本中选取最大相似度对应的两个简单样本进行关联，并继续关联除最大相似度之外的最大相似度对应的两个简单样本，直至关联全部的简单样本，得到多个第一样本对。其中，用户标识不同的每两个简单样本之间的相似度可以通过余弦相似度的计算公式或者欧式距离的计算公式等进行计算得到。得到多个第二样本对与得到多个第一样本对的过程相对应，在此对得到多个第二样本对的过程不再赘述。

在一实施例中，根据第一样本集中的多个简单样本构造多个第一样本对，包括：获取第一样本集中的每个简单样本的用户标识；从第一样本集中选取用户标识相同的两个简单样本进行关联，得到多个第一正样本对；从第一样本集中选取用户标识不同的两个简单样本进行关联，得到多个第一负样本对。其中，简单样本标注有用户标识，用户标识具有唯一性，每个用户标识与一个用户相对应，一个用户标识可以对应一个或多个简单样本。

需要说明的是，从第一样本集中选取用户标识相同的两个简单样本进行关联，即第一正样本对包括同一人员的两个样本图像；从第一样本集中选取用户标识不同的两个简单样本进行关联，即第一负样本对包括不同人员的两个样本图像。通过第一正样本对和第一负样本对进行后续处理，有利于拉近困难样本的类间间距，减小困难样本之间的相似度的重叠区域，从而提高图像识别模型的识别准确率。

示例性的，对于两个样本图像xi和xj，若该两个样本图像xi、xj标注有相同的用户标识，则关联同一用户标识的两个样本图像xi、xj，形成一个第一正样本对，相应的标签表示为m_ij＝+1；若该两个样本图像xi、xj标注有不同的用户标识，则关联不同用户标识的两个样本图像，形成一个第一负样本对，相应的标签表示为m_ij＝-1。

进一步地，第一负样本对可以根据用户标识不同的两个简单样本之间的相似度进行关联得到。具体地，从第一样本集中选取用户标识不同的两个简单样本进行关联，得到多个第一负样本对，包括：确定用户标识不同的每两个简单样本之间的相似度；根据用户标识不同的每两个简单样本之间的相似度，从多个简单样本中选取用户标识不同的两个简单样本进行关联，得到多个第一负样本对。其中，用户标识不同的每两个简单样本之间的相似度可以通过余弦相似度的计算公式或者欧式距离的计算公式等进行计算得到。

例如，计算用户标识不同的每两个简单样本之间的余弦相似度，确定最大余弦相似度对应的用户标识不同的两个简单样本，并关联最大余弦相似度对应的两个简单样本；继续关联除最大余弦相似度之外的最大余弦相似度对应的两个简单样本，直至关联最小余弦相似度对应的两个简单样本，得到多个第一负样本对。通过关联最大余弦相似度对应的两个简单样本，有利于后续诱导困难样本向简单样本的知识迁移，拉近困难样本的类间间距。

在一实施例中，第一正样本对可以是通过离线构造得到的，第一负样本可以是通过在线构造得到的，例如通过硬负挖掘并利用标注有不同用户标识的第一特征向量在线构造第一负样本。

在一实施例中，根据第二样本集中的多个困难样本构造多个第二样本对，包括：获取第二样本集中的每个困难样本的用户标识；从第二样本集中选取用户标识相同的两个困难样本进行关联，得到多个第二正样本对；从第二样本集中选取用户标识不同的两个困难样本进行关联，得到多个第二负样本对。需要说明的是，通过困难样本构造多个第二正样本对和多个第二负样本对的步骤，与通过多个简单样本构造多个第一正样本对和多个第一负样本对的步骤相同，可参考通过上述的通过多个简单样本构造多个第一正样本对和多个第一负样本对的对应实施例，本实施例在此不再赘述。

示例性的，训练样本集包括多个批(batch)数据，每个批数据包括多个样本图像，该多个样本图像例如为用户标识相同的两个简单样本、用户标识相同的两个困难样本、用户标识不同的一个简单样本和用户标识不同的一个困难样本。通过多个批(batch)数据中的多个样本图像能够构造多个第一样本对和多个第二样本对，也能够构造多个第一正样本对和多个第一负样本对，以及能够构造多个第二正样本对和多个第二负样本对。

步骤S103、确定每个所述第一样本对中的两个简单样本之间的第一相似度，并确定每个所述第二样本对中的两个困难样本之间的第二相似度。

其中，通过预设公式计算每个第一样本对中的两个简单样本的相似度，得到多个第一相似度，以及通过预设公式计算每个第二样本对中的两个困难样本的相似度，得到多个第二相似度。预设公式例如为余弦相似度的计算公式或者欧式距离的计算公式等。

在一实施例中，若第一样本对是根据两个简单样本之间的相似度而生成的，则可直接获取每个第一样本对中的两个简单样本之间的第一相似度。若第二样本对是根据两个困难样本之间的相似度而生成的，则可直接获取每个第二样本对中的两个困难样本之间的第二相似度。通过直接获取第一相似度和第二相似度能够提高图像识别模型的训练效率。

在一实施例中，确定每个第一样本对中的两个简单样本之间的第一相似度，包括：将每个第一正样本对输入至预设分类器，得到每个第一正样本对中的两个简单样本的第一特征信息；计算每个第一正样本对中的两个简单样本的第一特征信息之间的相似度，得到多个第一正样本相似度；以及，将每个第一负样本对输入至预设分类器，得到每个第一负样本对中的两个简单样本的第二特征信息；计算每个第一负样本对中的两个简单样本的第二特征信息之间的相似度，得到多个第一负样本相似度。

其中，第一样本对包括第一正样本对或第一负样本对，第一相似度包括第一正样本相似度和第一负样本相似度，预设分类器例如为ArcFace网络、SphereFace网络、CosFace网络等，通过两个用户标识相同的两个简单样本的第一特征向量能够计算出对应的两个简单样本的相似度，从而得到多个第一正样本相似度，通过两个用户标识不同的两个简单样本的第二特征向量能够计算出对应的两个简单样本的相似度，从而得到多个第一负样本相似度。

需要说明的是，可以通过余弦相似度或者欧式距离的计算公式计算两个简单样本的相似度。示例性的，余弦相似度的计算公式为

其中，第一样本对包括第一特征向量a和b，||a||、||b||分别为两个简单样本的特征向量a和b的绝对值，cos(θ)为第一样本对中的两个简单样本的特征向量的相似度。

在一实施例中，确定每个第二样本对中的两个困难样本之间的第二相似度，包括：将每个第二正样本对输入至预设分类器，得到每个第二正样本对中的两个困难样本的第三特征信息；计算每个第二正样本对中的两个困难样本的第三特征信息之间的相似度，得到多个第二正样本相似度；以及，将每个第二负样本对输入至预设分类器，得到每个第二负样本对中的两个困难样本的第四特征信息；计算每个第二负样本对中的两个困难样本的第四特征信息之间的相似度，得到多个第二负样本相似度。其中，第二样本对包括第二正样本对或第二负样本对，第二相似度包括第二正样本相似度和第二负样本相似度，本实施例不再赘述。

步骤S104、根据所述多个第一相似度和多个第二相似度，计算预置的图像识别模型的目标损失函数。

其中，预置的图像识别模型例如为人脸识别模型、细粒度图像识别模型、人体姿态识别模型等，目标损失函数例如包括KL散度损失函数、JS散度损失函数、最大平均差异MMD损失函数等。通过多个第一相似度和多个第二相似度确定图像识别模型的目标损失函数，缩小图像识别模型在简单样本与困难样本之间的预测精度差距，提高对困难样本的识别准确性。

在一实施例中，如图2所示，步骤S104包括：子步骤S1041至子步骤S1042。

子步骤S1041、确定所述多个第一相似度的第一分布信息，并确定所述多个第二相似度的第二分布信息。

其中，第一分布信息为多个第一相似度的分布信息(相似度分布)，也即多个第一样本对的距离分布，第一分布信息也可称为教师分布，第二分布信息为多个第二相似度的分布信息(相似度分布)，也即多个第二样本对的距离分布，第二分布信息也可称为学生分布。第一分布信息和第二分布信息的确定过程与直方图损失(Histogram Loss)相似，通过一维直方图进行简单的、分段可微的方式确定，具有软分配的特质。

在一实施例中，第一相似度包括第一正样本相似度或者第一负样本相似度，第二相似度包括第二正样本相似度或者第二负样本相似度。适应性的，确定多个第一正样本相似度的分布信息，得到第一正样本分布信息；确定多个第一负样本相似度的分布信息，得到第一负样本分布信息；确定多个第二正样本相似度的分布信息，得到第二正样本分布信息；确定多个第二负样本相似度的分布信息，得到第二负样本分布信息。

子步骤S1042、通过所述第一分布信息和第二分布信息，确定预置的图像识别模型的目标损失函数。

其中，将第一分布信息和第二分布信息输入至预置的图像识别模型的损失函数，得到目标损失函数。图像识别模型的损失函数例如包括KL散度损失函数、JS散度损失函数、最大平均差异MMD损失函数等一个或多个损失函数。通过第一分布信息和第二分布信息确定图像识别模型的目标损失函数，能够缩小图像识别模型在简单样本与困难样本之间的预测精度差距，提升图像识别模型的训练效果，从而提高对困难样本的识别准确性。

在一实施例中，将第一分布信息和第二分布信息输入至预置的图像识别模型的损失函数，得到第一损失函数；将第一分布信息和第二分布信息输入至预设的顺序损失orderloss函数，得到第二损失函数；计算第一损失函数与第二损失函数之间的和，得到图像识别模型的目标损失函数。其中，图像识别模型的损失函数例如包括KL散度损失函数、JS散度损失函数、最大平均差异MMD损失函数等，顺序损失函数用于表征第一样本对和第二样本对的相似度分布的期望之间的距离。通过图像识别模型的损失函数和顺序损失函数能够最小化从第一样本对到第二样本对的相似分布之间的距离，以控制困难样本的相似度的重叠，从而提高图像识别模型对困难样本的识别准确性。

示例性的，图像识别模型的损失函数例如为KL散度损失函数

顺序损失order loss函数例如为

λ₁、λ₂和λ₃为权重，可灵活设置，P为第一分布信息，Q为第二分布信息，

为第一分布信息的KL散度损失，

为第二分布信息的KL散度损失，

为第一分布信息的期望，

为第二分布信息的期望。将第一损失函数与第二损失函数相加即可得到图像识别模型的目标损失函数。

在一实施例中，第一相似度包括第一正样本相似度或者第一负样本相似度，第二相似度包括第二正样本相似度或者第二负样本相似度；确定多个第一正样本相似度的分布信息，得到第一正样本分布信息；第一分布信息包括第一正样本分布信息或者第一负样本分布信息，第二分布信息包括第二正样本分布信息或者第二负样本分布信息。

其中，通过第一分布信息和第二分布信息，确定预置的图像识别模型的目标损失函数，包括：通过多个所述第一正样本分布信息、第一负样本分布信息、第二正样本分布信息和第二负样本分布信息，计算预置的图像识别模型的损失函数；通过多个所述第一正样本相似度、第一负样本相似度、第二正样本相似度和第二负样本相似度，计算正样本对和负样本对的距离分布之间的顺序损失order loss函数；计算图像识别模型的损失函数和顺序损失函数之间的和，得到预置的图像识别模型的目标损失函数。其中，图像识别模型的损失函数例如包括KL散度损失函数、JS散度损失函数、最大平均差异MMD损失函数等，顺序损失函数用于表征正样本对(包括第一正样本对和第二正样本对)和负样本对(包括第一负样本对和第二负样本对)相似度分布的期望之间的距离。

示例性的，第一正样本分布信息(第一正样本相似度的分布信息)为P⁺、第一负样本分布信息(第一负样本相似度的分布信息)为P^-、第二正样本分布信息(第二正样本相似度的分布信息)为Q⁺，第二负样本分布信息(第二负样本相似度的分布信息)为Q^-。KL散度损失函数

为正样本对的KL散度；

为负样本对的KL散度；λ₁和λ₂为权重。进一步地，

S为正样本对或者负样本对的集合。

示例性的，多个第一正样本相似度为

多个第一负样本相似度为

多个第二正样本相似度为

多个第二负样本相似度为

正样本对和负样本对的距离分布之间的顺序损失函数

λ₃为权重，

为正样本对的相似度分布的期望，包括第一正样本的相似度分布的期望

和第二正样本的相似度分布的期望

为负样本对的相似度分布的期望，包括第一负样本的相似度分布的期望

和第二负样本的相似度分布的期望

因此，

包括四种情形，分别为

和

通过顺序损失函数最小化了从负样本对到正样本对的相似分布期望之间的距离，以减小困难样本的类间间距，控制困难样本的相似度的重叠。

在一实施例中，计算正样本对和负样本对的距离分布之间的顺序损失order loss函数之后，还包括：计算所述预设分类器的损失函数；根据所述预设分类器的损失函数、图像识别模型的损失函数，以及正样本对和负样本对的距离分布之间的顺序损失函数，确定预置的图像识别模型的目标损失函数。预设分类器的损失函数例如为ArcFace损失函数、sospmax损失函数等，示例性的，目标损失函数＝arcface损失函数+KL散度损失函数+顺序损失函数。通过分布蒸馏损失函数使困难样本的相似度分布靠近容易样本的相似度分布，缩小容易样本与困难样本之间的性能差距，减小困难样本的类间间距，从而提升图像识别模型的训练效果，并提高图像识别模型对困难样本的识别准确性。

步骤S105、根据目标损失函数调整所述图像识别模型的模型参数，并根据所述第一样本集和第二样本集对调整模型参数后的所述图像识别模型进行迭代训练。

确定目标损失函数之后，根据该目标损失函数对图像识别模型进行新一轮的模型训练，从而更新图像识别模型的模型参数，根据第一样本集和第二样本集对调整模型参数后的所述图像识别模型进行迭代训练，直至调整模型参数后的图像识别模型收敛，以得到目标图像识别模型。

需要说明的是，由于图像识别模型对容易样本的预测精度高，对困难样本的预测精度低，通过目标损失函数更新图像识别模型的模型参数能够缩小图像识别模型在容易样本与困难样本之间的预测精度差距，从而减小困难样本的相似度分布中的同人样本对(第二正样本对)和非同人样本对(第二负样本对)的相似度重合区域，提高困难样本的识别性能。

在一实施例中，通过目标损失函数调整图像识别模型的模型参数，得到调整后的模型参数；根据第一样本集和第二样本集对调整模型参数后的图像识别模型进行训练，并确定训练的图像识别模型是否处于收敛状态；若确定训练的图像识别模型处于收敛状态，则将训练的图像识别模型作为目标图像识别模型。

其中，确定训练的图像识别模型是否处于收敛状态，包括：确定图像识别模型的迭代次数是否达到预设迭代次数，若确定图像识别模型的迭代次数达到(等于)预设迭代次数，则确定图像识别模型处于收敛状态；若确定图像识别模型的迭代次数未达到(小于)预设迭代次数，则确定图像识别模型未处于收敛状态；或者，确定图像识别模型的迭代时间是否大于等于预设迭代时间，若图像识别模型的迭代时间大于等于预设迭代时间，则确定图像识别模型处于收敛状态；若图像识别模型的迭代时间小于预设迭代时间，则确定图像识别模型未处于收敛状态。预设迭代时间和预设迭代次数可由用户灵活设置，本申请实施例不做具体限定。

进一步地，若确定图像识别模型未处于收敛状态，则根据第一样本集和第二样本集继续对调整模型参数后的图像识别模型进行训练，直至更新后的图像识别模型收敛。

需要说明的是，本申请通过知识蒸馏优化图像识别模型的损失函数和模型参数，以提高困难样本的识别性能，能够缩小困难样本的类间间距，并进一步降低困难样本之间的距离分布的重叠区域，从而提高对困难样本(Hard Sample)的图像识别效果。可以很容易地应用于解决广泛的实际应用中的各种差异，如火车站的监视人脸等低分辨率和大姿态变化的困难场景。

上述实施例提供的模型训练方法，通过获取第一样本集和第二样本集，第一样本集包括多个简单样本，第二样本集包括多个困难样本，然后根据第一样本集中的多个简单样本构造多个第一样本对，根据第二样本集中的多个困难样本构造多个第二样本对，并确定每个第一样本对中的两个简单样本之间的第一相似度，确定每个第二样本对中的两个困难样本之间的第二相似度，之后根据多个第一相似度和多个第二相似度，计算预置的图像识别模型的目标损失函数，根据目标损失函数调整图像识别模型的模型参数，最后根据第一样本集和第二样本集对调整模型参数后的图像识别模型进行迭代训练，从而优化图像识别模型的模型参数，提升图像识别模型的训练效果，缩小困难样本之间的类间间距，从而提高图像识别模型对困难样本的识别准确性。

请参照图3，图3为本申请实施例提供的一种图像识别方法的步骤流程示意图。

如图3所示，该图像识别方法包括步骤S201至S202。该图像识别方法可应用于终端设备或服务器中，该终端设备可以为手机、平板电脑、笔记本电脑、台式电脑、个人数字助理和穿戴式设备等电子设备；该服务器可以为单台的服务器，也可以为由多台服务器组成的服务器集群。

步骤S201、获取待识别的目标图像。

其中，待识别的目标图像例如为人脸图像，人体姿态图像、商品图像等，目标图像可以为困难样本，根据目标图像的类型可以确定图像识别模型，例如目标图像为人脸图像，则图像识别模型为人脸识别模型。目标图像可以从数据库或者云端获取，也可以由用户输入而获取。

步骤S202、通过目标图像识别模型对所述目标图像进行图像识别，得到图像识别结果。

其中，目标图像识别模型是根据上述实施例所述的模型训练方法进行训练得到的。通过该模型训练方法训练出的目标图像识别模型例如为人脸识别模型、细粒度图像识别模型、人体姿态识别模型、商品识别模型等，本申请不做具体限定。

将目标图像输入至目标图像识别模型，得到目标图像的图像识别结果。需要说明的是，目标图像识别模型是基于知识蒸馏优化了损失函数和模型参数得到的，相比于现有技术能够提高困难样本的识别性能，缩小困难样本的类间间距，并进一步降低困难样本之间的距离分布的重叠区域，从而提高对困难样本(Hard Sample)的图像识别效果。可以很容易地应用于解决广泛的实际应用中的各种差异，如火车站的监视人脸等低分辨率和大姿态变化的困难场景。

上述实施例提供的模型训练方法，通过目标图像识别模型对目标图像进行图像识别，得到图像识别结果，可以有效的提高对目标图像进行图像识别的准确性，应用领域广泛，应用价值高。

请参照图4，图4为本申请实施例提供的一种模型训练装置的示意性框图。

如图4所示，该模型训练装置300，包括：获取模块301、构造模块302、确定模块303、计算模块304和训练模块305。

获取模块301，用于获取第一样本集和第二样本集，所述第一样本集包括多个简单样本，所述第二样本集包括多个困难样本；

构造模块302，用于根据所述第一样本集中的多个简单样本构造多个第一样本对，并根据所述第二样本集中的多个困难样本构造多个第二样本对；

确定模块303，用于确定每个所述第一样本对中的两个简单样本之间的第一相似度，并确定每个所述第二样本对中的两个困难样本之间的第二相似度；

计算模块304，用于根据所述多个第一相似度和多个第二相似度，计算预置的图像识别模型的目标损失函数；

训练模块305，用于根据目标损失函数调整所述图像识别模型的模型参数，并根据所述第一样本集和第二样本集对调整模型参数后的所述图像识别模型进行迭代训练。

在一个实施例中，所述第一样本对包括第一正样本对和第一负样本对，其中，第一正样本对中的两个简单样本的用户标识相同，所述第一负样本对中的两个简单样本的用户标识不同；所述第二样本对包括第二正样本对和第二负样本对，其中，第二正样本对中的两个困难样本的用户标识相同，所述第二负样本对中的两个困难样本的用户标识不同。

在一个实施例中，构造模块302还用于：

获取所述第一样本集中的每个所述简单样本的用户标识；

从所述第一样本集中选取所述用户标识相同的两个简单样本进行关联，得到多个第一正样本对；

从所述第一样本集中选取所述用户标识不同的两个简单样本进行关联，得到多个第一负样本对。

在一个实施例中，确定模块303还用于：

将每个所述第一正样本对输入至预设分类器，得到每个所述第一正样本对中的两个简单样本的第一特征信息；

计算每个所述第一正样本对中的两个简单样本的第一特征信息之间的相似度，得到多个第一正样本相似度；以及

将每个所述第一负样本对输入至预设分类器，得到每个所述第一负样本对中的两个简单样本的第二特征信息；

计算每个所述第一负样本对中的两个简单样本的第二特征信息之间的相似度，得到多个第一负样本相似度。

在一个实施例中，如图5所示，计算模块304包括：

第一确定子模块3041，用于确定所述多个第一相似度的第一分布信息，并确定所述多个第二相似度的第二分布信息；

第二确定子模块3042，用于通过所述第一分布信息和第二分布信息，确定预置的图像识别模型的目标损失函数。

在一个实施例中，计算模块304还用于：

将所述第一分布信息和第二分布信息输入至预置的图像识别模型的损失函数，得到第一损失函数；

将所述第一分布信息和第二分布信息输入至预设的顺序损失order loss函数，得到第二损失函数；

计算所述第一损失函数与所述第二损失函数之间的和，得到所述图像识别模型的目标损失函数。

请参照图6，图6为本申请实施例提供的一种图像识别装置的示意性框图。

如图6所示，该图像识别装置400，包括：

获取模块401，用于获取待识别的目标图像；

图像识别模块402，用于通过目标图像识别模型对所述目标图像进行图像识别，得到图像识别结果；

其中，所述目标图像识别模型是根据说明书实施例所述的模型训练方法进行训练得到的。目标图像识别模型例如为人脸识别模型、细粒度图像识别模型、人体姿态识别模型、商品识别模型等，本申请不做具体限定。

需要说明的是，所属领域的技术人员可以清楚地了解到，为了描述的方便和简洁，上述描述的装置和各模块及单元的具体工作过程，可以参考前述模型训练方法或者图像识别方法实施例中的对应过程，在此不再赘述。

上述如图5或者图6实施例提供的装置可以实现为一种计算机程序的形式，该计算机程序可以在如图7所示的计算机设备上运行。

请参阅图7，图7为本申请实施例提供的一种计算机设备的结构示意性框图。该计算机设备可以为服务器或终端设备。

如图7所示，该计算机设备包括通过***总线连接的处理器、存储器和网络接口，其中，存储器可以包括非易失性存储介质和内存储器。

非易失性存储介质可存储操作***和计算机程序。该计算机程序包括程序指令，该程序指令被执行时，可使得处理器执行任意一种说明书实施例所述的模型训练方法或者图像识别方法。

处理器用于提供计算和控制能力，支撑整个计算机设备的运行。

内存储器为非易失性存储介质中的计算机程序的运行提供环境，该计算机程序被处理器执行时，可使得处理器执行任意一种说明书实施例所述的模型训练方法或者图像识别方法。

该网络接口用于进行网络通信，如发送分配的任务等。本领域技术人员可以理解，图7中示出的结构，仅仅是与本申请方案相关的部分结构的框图，并不构成对本申请方案所应用于其上的计算机设备的限定，具体的计算机设备可以包括比图中所示更多或更少的部件，或者组合某些部件，或者具有不同的部件布置。

应当理解的是，处理器可以是中央处理单元(Central Processing Unit，CPU)，该处理器还可以是其他通用处理器、数字信号处理器(Digital Signal Processor，DSP)、专用集成电路(Application Specific Integrated Circuit，ASIC)、现场可编程门阵列(Field-Programmable Gate Array，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。其中，通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

其中，在一个实施例中，所述处理器用于运行存储在存储器中的计算机程序，以实现如下步骤：

在一个实施例中，所述第一样本对包括第一正样本对和第一负样本对，其中，第一正样本对中的两个简单样本的用户标识相同，所述第一负样本对中的两个简单样本的用户标识不同；

所述第二样本对包括第二正样本对和第二负样本对，其中，第二正样本对中的两个困难样本的用户标识相同，所述第二负样本对中的两个困难样本的用户标识不同。

在一个实施例中，所述处理器在实现所述根据所述第一样本集中的多个简单样本构造多个第一样本对时，用于实现：

获取所述第一样本集中的每个所述简单样本的用户标识；

在一个实施例中，所述处理器在实现所述确定每个所述第一样本对中的两个简单样本之间的第一相似度时，用于实现：

在一个实施例中，所述处理器在实现所述根据所述多个第一相似度和多个第二相似度，计算预置的图像识别模型的目标损失函数时，用于实现：

确定所述多个第一相似度的第一分布信息，并确定所述多个第二相似度的第二分布信息；

通过所述第一分布信息和第二分布信息，确定预置的图像识别模型的目标损失函数。

在一个实施例中，所述处理器在实现所述通过所述第一分布信息和第二分布信息，确定预置的图像识别模型的目标损失函数时，用于实现：

获取待识别的目标图像；

其中，所述目标图像识别模型是根据前述的模型训练方法进行训练得到的。

需要说明的是，所属领域的技术人员可以清楚地了解到，为了描述的方便和简洁，上述描述计算机设备的具体工作过程，可以参考前述模型训练方法或者图像识别方法实施例中的对应过程，在此不再赘述。

本申请实施例还提供一种计算机可读存储介质，所述计算机可读存储介质上存储有计算机程序，所述计算机程序中包括程序指令，所述程序指令被执行时所实现的方法可参照本申请模型训练方法或者图像识别方法的各个实施例。

其中，所述计算机可读存储介质可以是前述实施例所述的计算机设备的内部存储单元，例如所述计算机设备的硬盘或内存。所述计算机可读存储介质也可以是所述计算机设备的外部存储设备，例如所述计算机设备上配备的插接式硬盘，智能存储卡(SmartMedia Card，SMC)，安全数字(Secure Digital，SD)卡，闪存卡(Flash Card)等。

应当理解，在此本申请说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本申请。如在本申请说明书和所附权利要求书中所使用的那样，除非上下文清楚地指明其它情况，否则单数形式的“一”、“一个”及“该”意在包括复数形式。

还应当理解，在本申请说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合，并且包括这些组合。需要说明的是，在本文中，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者***不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者***所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括该要素的过程、方法、物品或者***中还存在另外的相同要素。

上述本申请实施例序号仅仅为了描述，不代表实施例的优劣。以上所述，仅为本申请的具体实施方式，但本申请的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本申请揭露的技术范围内，可轻易想到各种等效的修改或替换，这些修改或替换都应涵盖在本申请的保护范围之内。因此，本申请的保护范围应以权利要求的保护范围为准。

Claims

1.一种模型训练方法，其特征在于，包括：

2.如权利要求1所述的模型训练方法，其特征在于，

所述第一样本对包括第一正样本对和第一负样本对，其中，第一正样本对中的两个简单样本的用户标识相同，所述第一负样本对中的两个简单样本的用户标识不同；

3.如权利要求2所述的模型训练方法，其特征在于，所述根据所述第一样本集中的多个简单样本构造多个第一样本对，包括：

获取所述第一样本集中的每个所述简单样本的用户标识；

4.如权利要求2所述的模型训练方法，其特征在于，所述确定每个所述第一样本对中的两个简单样本之间的第一相似度，包括：

5.如权利要求1-4中任一项所述的模型训练方法，其特征在于，所述根据所述多个第一相似度和多个第二相似度，计算预置的图像识别模型的目标损失函数，包括：

6.如权利要求5所述的模型训练方法，其特征在于，所述通过所述第一分布信息和第二分布信息，确定预置的图像识别模型的目标损失函数，包括：

7.一种图像识别方法，其特征在于，包括：

获取待识别的目标图像；

其中，所述目标图像识别模型是根据权利要求1至6所述的模型训练方法进行训练得到的。

8.一种模型训练装置，其特征在于，所述模型训练装置包括：

9.一种计算机设备，其特征在于，所述计算机设备包括处理器、存储器、以及存储在所述存储器上并可被所述处理器执行的计算机程序，其中所述计算机程序被所述处理器执行时，实现如权利要求1至6中任一项所述的模型训练方法，或者实现如权利要求7所述的图像识别方法的步骤。

10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质上存储有计算机程序，其中所述计算机程序被处理器执行时，实现如权利要求1至6中任一项所述的模型训练方法，或者实现如权利要求7所述的图像识别方法的步骤。