CN111368644B

CN111368644B - 图像处理方法、装置、电子设备及存储介质

Info

Publication number: CN111368644B
Application number: CN202010093686.9A
Authority: CN
Inventors: 苏英程; 吴一超
Original assignee: Shenzhen Sensetime Technology Co Ltd
Current assignee: Shenzhen Sensetime Technology Co Ltd
Priority date: 2020-02-14
Filing date: 2020-02-14
Publication date: 2024-01-05
Anticipated expiration: 2040-02-14
Also published as: CN111368644A

Abstract

本公开实施例公开了一种图像处理方法、装置、电子设备及存储介质，其中方法包括：获取至少一批待处理图像，其中，每批待处理图像包括多个待处理图像；在同一批待处理图像中，获取第一图像与所述第一图像对应的第二图像，所述第二图像的收敛程度高于所述第一图像的收敛程度；基于所述第一图像与所述第二图像，确定用于监督所述第一图像的监督参数；基于所述监督参数，对所述至少一批待处理图像进行训练，获得目标模型。

Description

图像处理方法、装置、电子设备及存储介质

技术领域

本公开涉及计算机视觉技术领域，具体涉及一种图像处理方法、装置、电子设备及存储介质。

背景技术

在图像处理领域，对人脸识别技术的探讨和应用越来越重视，人脸识别问题属于一个开集问题，即好的人脸识别算法应该能够对训练集以外的人脸也具有辨识能力。

一般地，基于深度学习的人脸识别算法通过对大量训练数据的学习，将作为样本的人脸图片映射到特征空间中，通过比较特征的余弦相似度来判定人脸样本间的相似度。但并未考虑不同样本、不同类别数据在学习难易程度、收敛特性上的差异性，以及样本间的关联性，使训练获得的模型不够精确，从而可能在应用于人脸识别场景的过程中效果不佳。

发明内容

本公开实施例提供了一种图像处理方法、装置、电子设备及存储介质。

本公开实施例第一方面提供一种图像处理方法，包括：

获取至少一批待处理图像，其中，每批待处理图像包括多个待处理图像；

在同一批待处理图像中，获取第一图像与所述第一图像对应的第二图像，所述第二图像的收敛程度高于所述第一图像的收敛程度；

基于所述第一图像与所述第二图像，确定用于监督所述第一图像的监督参数；

基于所述监督参数，对所述至少一批待处理图像进行训练，获得目标模型。

在一种可选的实施方式中，在所述获取第一图像与所述第一图像对应的第二图像之前，所述方法还包括：

将所述待处理图像映射到特征空间，获得所述待处理图像对应的特征向量；获取所述待处理图像的类中心特征向量；

获得所述待处理图像中的第一图像对应的特征向量与所述第一图像对应的类中心特征向量的夹角；

所述第二图像的收敛程度高于所述第一图像的收敛程度，包括：

所述第二图像的特征向量与所述第二图像对应的类中心特征向量的夹角，大于所述第一图像的特征向量与所述第一图像对应的类中心特征向量的夹角。

通过图像的特征向量与类中心特征向量的夹角来判断收敛程度，可以准确选择收敛程度优于第一图像的第二图像，以作为教师样本在训练中监督第一图像的优化。

在一种可选的实施方式中，所述基于所述第一图像与所述第二图像，确定用于监督所述第一图像的监督参数，包括：

获取所述第一图像的特征向量与所述第二图像的特征向量的第一角度差，获取所述第一图像对应的类中心特征向量与所述第二图像对应的类中心特征向量的第二角度差；

根据所述第一角度差与所述第二角度差确定监督角度间隔；

根据所述监督角度间隔，确定所述监督参数。

通过第一图像的特征向量与第二图像的特征向量的第一角度差，以及第一图像对应的类中心特征向量与第二图像对应的类中心特征向量的第二角度差，可以获得监督角度间隔，确定第一图像的监督参数，在训练中能够针对性地优化第一图像。

在一种可选的实施方式中，在所述第二图像为一个的情况下，所述根据所述第一角度差与所述第二角度差确定监督角度间隔，包括：

将所述第一角度差与所述第二角度差的差的绝对值确定为所述监督角度间隔；

所述根据所述监督角度间隔，确定所述监督参数，包括：

将所述监督角度间隔，确定为所述监督参数。

在一种可选的实施方式中，在所述第二图像为至少两个的情况下，所述根据所述第一角度差与所述第二角度差确定监督角度间隔，包括：

根据所述第一角度差与所述第二角度差，确定所述第一图像分别与所述至少两个第二图像中每个第二图像之间的监督角度间隔；

所述根据所述监督角度间隔，确定所述监督参数，包括：

将得到的至少两个所述监督角度间隔的平均值作为所述监督参数。

可以考虑不同情况下的数据处理量和训练效果，灵活选择第二图像的数量。

在一种可选的实施方式中，所述基于所述监督参数，对所述至少一批待处理图像进行训练，获得目标模型，包括：

在对各个待处理图像进行处理的情况下，根据所述各个待处理图像对应的监督参数和预设损失函数对所述待处理图像进行训练，获得所述目标模型。

通过参考优化效果更佳的第二图像，来为第一图像设置适应性的监督参数，考虑了样本间的差异性和关联性，充分发挥网络模型的表达能力，进一步提高上述目标模型的训练效果。

在一种可选的实施方式中，所述根据所述各个待处理图像对应的监督参数和预设损失函数对所述待处理图像进行训练，获得所述目标模型，包括：

获取预设权重值和预设阈值；

使用所述预设权重值和所述预设阈值调整所述各个待处理图像对应的监督参数，获得所述各个待处理图像对应的目标监督参数；

根据所述各个待处理图像对应的目标监督参数和预设损失函数，对所述待处理图像进行训练，获得所述目标模型。

通过预设权重值和预设阈值可以对监督参数进行进一步调整，以使监督参数更适用于当前训练样本的优化，保证优化的稳定性，提高模型训练效果。

在一种可选的实施方式中，所述待处理图像包括人脸图像。

在一种可选的实施方式中，在所述获得所述目标模型之后，所述方法还包括：

获取人脸图像；

基于所述目标模型，对所述人脸图像进行人脸识别处理。

通过上述方法获得的目标模型可以用于人脸识别处理。

在一种可选的实施方式中，所述基于所述目标模型，对所述人脸图像进行人脸识别处理，包括：

将所述人脸图像输入所述目标模型，获得所述人脸图像的特征数据；

将所述人脸图像的特征数据与数据库中存储的特征模板进行匹配，获得匹配结果，输出所述匹配结果。

在一种可选的实施方式中，所述将所述人脸图像的特征数据与数据库中存储的特征模板进行匹配，获得匹配结果，输出所述匹配结果包括：

获取所述人脸图像的特征数据与多个所述特征模板的相似度，确定所述相似度高于预设相似度阈值的特征模板所对应的人脸模板为所述匹配结果；输出所述人脸模板以及所述人脸模板对应的身份信息；或者，

获取所述人脸图像的特征数据与目标特征模板的相似度，当所述相似度高于所述预设相似度阈值的情况下，则匹配成功，输出识别成功信息。

通过上述方法获得的目标模型可以用于各种人脸识别场景中的特征提取，由于在训练时考虑了样本间的差异性和关联性，充分发挥网络模型的表达能力，使特征分类更明确，提高了网络模型的处理精度，从而使模型对多姿态、遮挡等一般模型相对难以精确处理的人脸的识别更为鲁棒，可以更准确、快速地获得上述待处理人脸图像的特征数据。

本公开实施例第二方面提供了一种图像处理装置，包括：

第一获取模块，用于获取至少一批待处理图像，其中，每批待处理图像包括多个待处理图像；

第二获取模块，用于在同一批待处理图像中，获取第一图像与所述第一图像对应的第二图像，所述第二图像的收敛程度高于所述第一图像的收敛程度；

处理模块，用于基于所述第一图像与所述第二图像，确定用于监督所述第一图像的监督参数；

训练模块，用于基于所述监督参数，对所述至少一批待处理图像进行训练，获得目标模型。

可选的，所述处理模块还用于：

在所述获取第一图像与所述第一图像对应的第二图像之前，将所述待处理图像映射到特征空间，获得所述待处理图像对应的特征向量；获取所述待处理图像的类中心特征向量；

可选的，所述处理模块具体用于：

根据所述第一角度差与所述第二角度差确定监督角度间隔；

根据所述监督角度间隔，确定所述监督参数。

可选的，在所述第二图像为一个的情况下，所述处理模块具体用于：

将所述监督角度间隔，确定为所述监督参数。

可选的，在所述第二图像为至少两个的情况下，所述处理模块具体用于：

可选的，所述训练模块具体用于：

获取预设权重值和预设阈值；

可选的，所述待处理图像包括人脸图像。

可选的，所述第一获取模块还用于：

在所述获得所述目标模型之后，获取人脸图像；

所述处理模块还用于，基于所述目标模型，对所述人脸图像进行人脸识别处理。

可选的，在一种可选的实施方式中，所述处理模块具体用于：

在一种可选的实施方式中，所述处理模块具体用于：

本公开实施例第三方面提供一种电子设备，包括处理器以及存储器，所述存储器用于存储计算机程序，所述计算机程序被配置成由所述处理器执行，所述处理器用于执行如本公开实施例第一方面任一方法中所描述的部分或全部步骤。

本公开实施例第四方面提供一种计算机可读存储介质，所述计算机可读存储介质用于存储计算机程序，其中，所述计算机程序使得计算机执行如本公开实施例第一方面任一方法中所描述的部分或全部步骤。

本公开实施例通过获取至少一批待处理图像，其中，每批待处理图像包括多个待处理图像，在同一批待处理图像中，获取第一图像与上述第一图像对应的第二图像，上述第二图像的收敛程度高于上述第一图像的收敛程度，再基于上述第一图像与上述第二图像，确定用于监督上述第一图像的监督参数，然后基于上述监督参数，对上述至少一批待处理图像进行训练，获得目标模型。通过自适应的监督参数监督图像优化过程，考虑了图像间的关联性和差异性，可以加快训练模型的收敛，提高网络模型的训练效率和模型数据处理的准确度。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分，这些附图示出了符合本公开的实施例，并与说明书一起用于说明本公开的技术方案。

图1是本公开实施例公开的一种图像处理方法的流程示意图；

图2A是本公开实施例公开的一种角度间隔的几何解释示意图；

图2B是本公开实施例公开的另一种角度间的几何解释隔示意图；

图2C是本公开实施例公开的一种样本优化中损失的几何解释示意图；

图2D是本公开实施例公开的一种样本间互监督优化中损失的几何解释示意图；

图3是本公开实施例公开的另一种图像处理方法的流程示意图；

图4是本公开实施例公开的一种图像处理装置的结构示意图；

图5是本公开实施例公开的一种电子设备的结构示意图。

具体实施方式

下面将结合本公开实施例中的附图，对本公开实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本公开一部分实施例，而不是全部的实施例。基于本公开中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本公开保护的范围。

本公开中的术语“和/或”，仅仅是一种描述关联对象的关联关系，表示可以存在三种关系，例如，A和/或B，可以表示：单独存在A，同时存在A和B，单独存在B这三种情况。另外，本文中术语“至少一种”表示多种中的任意一种或多种中的至少两种的任意组合，例如，包括A、B、C中的至少一种，可以表示包括从A、B和C构成的集合中选择的任意一个或多个元素。本公开的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别不同对象，而不是用于描述特定顺序。此外，术语“包括”和“具有”以及它们任何变形，意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、***、产品或设备没有限定于已列出的步骤或单元，而是可选地还包括没有列出的步骤或单元，或可选地还包括对于这些过程、方法、产品或设备固有的其他步骤或单元。

在本文中提及“实施例”意味着，结合实施例描述的特定特征、结构或特性可以包含在本公开的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例，也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是，本文所描述的实施例可以与其它实施例相结合。

本公开实施例所涉及到的图像处理装置是可以进行数据处理的装置，可以为电子设备，上述电子设备包括终端设备，具体实现中，上述终端设备包括但不限于诸如具有触摸敏感表面(例如，触摸屏显示器和/或触摸板)的移动电话、膝上型计算机或平板计算机之类的其它便携式设备。还应当理解的是，在某些实施例中，所述设备并非便携式通信设备，而是具有触摸敏感表面(例如，触摸屏显示器和/或触摸板)的台式计算机。

下面对本公开实施例进行详细介绍。

请参阅图1，图1是本公开实施例公开的一种图像处理方法的流程示意图，如图1所示，该图像处理方法包括如下步骤：

101、获取至少一批待处理图像，其中，每批待处理图像包括多个待处理图像。

本公开实施例中的图像处理方法的执行主体可以是上述图像处理装置，例如，上述图像处理方法可以由终端设备或其它处理设备执行。其中，终端设备可以为用户设备(User Equipment，UE)、移动设备、用户终端、终端、个人数字处理(Personal DigitalAssistant，PDA)、计算设备等。其它处理设备，例如可以为本地或云端服务器等。本公开对图像处理装置的形式并不限定。在一些可能的实现方式中，该图像处理方法可以通过处理器调用存储器中存储的计算机可读指令的方式来实现。

其中，上述待处理图像可以为同一对象的图像，比如可以为待处理人脸图像，每批待处理图像可以包括多个待处理图像，将至少一批待处理人脸图像作为训练样本以训练可用于人脸识别的模型。具体的，可以获取现有的人脸图像的训练样本集，以训练样本集中的人脸图像作为输入的待处理图像、以上述人脸图像和对应的图像特征作为标签数据，训练神经网络模型。

102、在同一批待处理图像中，获取第一图像与上述第一图像对应的第二图像，上述第二图像的收敛程度高于上述第一图像的收敛程度。

一般的，对于网络训练中的样本可以使用批处理(Batch)也称为批处理脚本，顾名思义，批处理就是对某对象进行批量的处理，通常被认为是一种简化的脚本语言。本公开实施例中，可以使用一批待处理图像进行处理，或是使用多批待处理图像进行批处理。对于使用多批待处理图像进行模型训练的过程而言，针对每批待处理图像所采用的实现方式与使用一批待处理图像进行模型训练的过程类似，其区别在于，分别对每批待处理图像进行处理并应用于训练过程。这种实现方式往往应用于待处理图像数量庞大的情况，即基于海量数据对模型进行训练的过程。在本申请实施例中，无论是对于一批待处理图像或是多批待处理图像而言，在同一批待处理图像中，以其中任一待处理图像或是按照一定规则指定的待处理图像即第一图像为参考进行描述。

可以在该同一批待处理图像中，将该第一图像作为需要被监督的学生样本(student sample)，选择出该第一图像对应的第二图像，即教师样本(teacher sample)。相对的，选出的教师样本的收敛程度高于上述第一学生样本的收敛程度，可以理解为让收敛性更好的教师样本去监督相对收敛性差的学生样本，使网络训练地更为充分。

具体的，在神经网络的训练中的收敛程度，反映了样本的训练效果，一般收敛程度越高训练效果越好。本公开实施例中上述收敛程度指的是，图像与在神经网络中预测的该图像所属归类的相似程度，及某图像与在神经网络中预测的该图像所属归类的越相近，其收敛程度越高。

本公开实施例中，可以定义图像特征与其学习到的类中心的夹角越小，收敛性越好。本公开实施例中的类中心可以理解为在对图像进行处理的网络学习过程中确定的特征(feature)参数，比如在分类任务中，分类后的一类图像特征对应一个类中心，作为该类的标准。一般在开始训练的情况下，类中心初始化，在训练过程中类中心更新，待处理图像的特征训练也可以与对应的类中心同时更新。其中，类中心初始化的方式可以包括但不限于随机初始化，比如，还可以按照预设的方式，采用特定的参数实现类中心初始化。因此，上述收敛程度可以理解为，某图像特征与其所对应的类中心的夹角的大小。

本公开实施例中，对于同一批待处理图像中的第一图像，可以筛选出比它收敛的更好的第二图像记为它的教师样本。教师样本的数量可以根据需要进行设置，一个学生样本可以选取对应的一个或者多个第二图像用作监督。比如，可以设置预设比例，从比第一图像的收敛程度好的样本中选取预设比例的教师样本。可选的，教师样本的选取可以是随机选择的，也可以是依据收敛程度由高到低排序选择靠前的预设比例的教师样本，本公开实施例对此不作限制。

在一种可选的实施方式中，在上述步骤102之前，该方法还包括：

将上述待处理图像映射到特征空间，获得上述待处理图像对应的特征向量；获取上述待处理图像的类中心特征向量；

获得上述待处理图像中的第一图像对应的特征向量与上述第一图像对应的类中心特征向量的夹角。

上述第二图像的收敛程度高于上述第一图像的收敛程度，包括：

上述第二图像的特征向量与上述第二图像对应的类中心特征向量的夹角，大于上述第一图像的特征向量与上述第一图像对应的类中心特征向量的夹角。

一般基于深度学习的人脸识别算法通过大量训练数据学习，将图片映射到特征空间中，可以通过比较特征的余弦相似度来判定人脸的相似度。本公开实施例中，可以将上述待处理图像映射到超球面特征空间，获得上述待处理图像对应的特征向量，并且可以确定当前学习到的最新的类中心，获取类中心特征向量。

前述已经提到，定义图像特征与对应的类中心的夹角越小，收敛性越好。第二图像的特征向量与第二图像对应的类中心特征向量的夹角，大于第一图像的特征向量与第一图像对应的类中心特征向量的夹角，从而挑选出比第一图像收敛性更好的第二图像作为教师样本。需要注意的是，由于类中心也在训练中更新，在训练过程中每次选取的教师样本可能发生变化。

由此可见，在本申请实施例中，可以通过得到的不同图像对应的夹角，来反映不同图像的收敛程度，以基于不同图像对应的夹角之间的大小关系，来确定不同图像收敛程度的大小关系，从而在诸多待处理图像中，以收敛程度的大小为参照，确定第一图像以及与第一图像对应的一个或是多个第二图像。

103、基于上述第一图像与上述第二图像，确定用于监督上述第一图像的监督参数。

在确定了学生样本与其教师样本的情况下，可以利用教师样本跟学生样本的收敛情况差异，作为一种监督参数加入到优化函数中，对不同的学生样本进行更好的优化。即在训练过程中让第一图像能够向第二图像学习，从而取得更好的收敛特性。

具体的，上述步骤103可以包括：

获取上述第一图像的特征向量与上述第二图像的特征向量的第一角度差，获取上述第一图像对应的类中心特征向量与上述第二图像对应的类中心特征向量的第二角度差；

根据上述第一角度差与上述第二角度差确定监督角度间隔；

根据上述监督角度间隔，确定上述监督参数。

通过获得的特征向量可以计算向量间的角度差，具体的，可以计算第一图像的特征向量与第二图像的特征向量的第一角度差，以及第一图像对应的类中心特征向量与第二图像对应的类中心特征向量的第二角度差，以确定监督角度间隔。

考虑到第二图像的数量可以为一个或是多个，而第二图像的数量往往会影响到监督角度间隔的确定，以及监督参数的确定，因此，如下提供了分别基于一个第二图像以及多个第二图像情况下，监督角度间隔及监督参数的确定方式。需要说明的是，如下仅为一种示例性的情况，并不作为对本申请实施例的限定。

在一种可选的实施方式中，在上述第二图像为一个的情况下，上述根据上述第一角度差与上述第二角度差确定监督角度间隔，包括：

将上述第一角度差与上述第二角度差的差的绝对值确定为上述监督角度间隔；

上述根据上述监督角度间隔，确定上述监督参数，包括：

将上述监督角度间隔，确定为上述监督参数。

对于第一图像及其对应的第二图像，可以通过特征向量的角度差作为监督参数，具体为上述第一角度差与上述第二角度差的差的绝对值，获得的上述监督参数即被确定为该第一图像的监督参数，可以执行步骤104。

在一种可选的实施方式中，在上述第二图像为至少两个的情况下，上述根据上述第一角度差与上述第二角度差确定监督角度间隔，包括：

根据上述第一角度差与上述第二角度差，确定上述第一图像分别与上述至少两个第二图像中每个第二图像之间的监督角度间隔；

上述根据上述监督角度间隔，确定上述监督参数，包括：

将得到的至少两个上述监督角度间隔的平均值作为上述监督参数。

其中，至少两个监督角度间隔的平均值，指的可以是至少两个监督角度间隔中所有监督角度间隔的平均值，还可以是至少两个监督角度间隔中除部分最大值及最小值以外的至少部分监督角度间隔的平均值，对于该平均值的具体获取形式，在此不予限定，可以包括但不限于上述例举的情况。

具体的，上述角度差可以理解为两个特征向量形成的角度差值。在本公开实施例中，举例来讲，考虑优化某一个样本x_i，在当前处理批次的待处理图像中挑选出比x_i优化更好的教师样本x_t，多个教师样本x_t可以看作教师样本集合S_t。

计算出x_i与各个教师样本x_t所产生的用于监督x_i的角度间隔x_t。本公开实施例中定义w_i是学生样本x_i的类中心，w_t是教师样本x_t的类中心，样本对应的类中心指的是该样本特征所属的特征类别的标准参数，通常在训练中不断更新，比如在分类预测时将待处理特征与其比较进行特征的分类提取；θ(x,y)是向量x和y的夹角。那么一个教师样本x_t与x_i所产生的角度间隔为若选择的教师样本为一个，则将该角度间隔的绝对值作为上述监督参数(也可以称为额外监督角度间隔)。

当教师样本为至少两个的情况下，可以取所有教师样本产生的角度间隔的绝对值的平均值作为最后的额外监督角度间隔，即监督参数

通过上述步骤可以获得第一图像的监督参数。可选的，可以对多个第一图像进行上述步骤以获得各个第一图像分别对应的监督参数，用于样本训练过程。

104、基于上述监督参数，对上述至少一批待处理图像进行训练，获得目标模型。

通过上述方法获得了上述至少一批待处理图像中各个第一图像的监督参数，从而可以在网络训练中利用各自的监督参数对待处理图像进行针对性地训练，以获得更优秀的目标模型。

其中，上述步骤104具体可以包括：

在对各个待处理图像进行处理的情况下，根据上述各个待处理图像对应的监督参数和预设损失函数对上述待处理图像进行训练，获得上述目标模型。

在神经网络的训练中一般使用损失函数。具体的，训练中每个样本都可以有自己的监督参数，通过相同的方法可以获得每批待处理图像中的各个待处理图像的监督参数，并用于互监督的网络训练过程，此处不再赘述。从而，在对各个待处理图像进行处理的情况下，可以根据上述各个待处理图像对应的不同监督参数和预设损失函数对上述待处理图像进行针对性的训练，以获得目标模型。

在一种实施方式中，在上述待处理图像为人脸图像的情况下，基于上述待处理图像以及监督参数的训练过程可以使用上述预设损失函数，上述预设损失函数可以为人脸识别算法的优化函数，比如SphereFace、CosFace和ArcFace方法提出的优化函数。本公开实施例采用引入角度间隔的方式，可以将人脸图像映射到超球面上，通过引入角度间隔来增大学习难度，尽可能的减小类内距离而增大类间距离。并且，通过对角度间隔的动态调整，参考优化效果更佳的其他样本，来为样本设置适应性的角度间隔，考虑了样本间的差异性和关联性，充分发挥网络模型的表达能力，进一步提高训练效果。具体的，本公开实施例中，利用教师样本与学生样本的收敛情况计算出一个额外角度间隔，作为监督参数加入到优化函数中，在训练中目的是让该额外角度间隔变小，也即让学生样本能够向教师样本学习，从而取得更好的收敛特性，提高模型训练效果，增加数据处理的准确度。

在一种实施方式中，对于待处理人脸样本的优化，可以将该监督参数Δ_i加入到优化函数中，得到最后的优化形式，即：

其中N是:一次训练所选取的样本数(batch ize)，s为是常量(scale)，θ_i是样本x_i与其类中心的特征向量夹角，θ_j是样本x_i与其他类的类中心的特征向量夹角。

在一种实施方式中，上述根据上述各个待处理图像对应的监督参数和预设损失函数对上述待处理图像进行训练，获得上述目标模型，包括：

获取预设权重值和预设阈值；

使用上述预设权重值和上述预设阈值调整上述各个待处理图像对应的监督参数，获得上述各个待处理图像对应的目标监督参数；

根据上述各个待处理图像对应的目标监督参数和预设损失函数，对上述待处理图像进行训练，获得上述目标模型。

其中，上述预设权重值和预设阈值可以根据需要进行设置，用于调整训练中的监督参数。进一步举例来讲，在前述监督参数Δ_i的基础上，增加预设权重值λ和预设阈值m，其中m可以理解为角度间隔常量，目标监督参数可以表示为m+λΔ_i，在前述优化函数的基础上，训练所使用的优化函数具体可以表示为：

为了更清楚地对上述参数进行描述，具体可以参见图2A与图2B。图2A为一种角度间隔的几何解释示意图，一般的，损失优化可以由θ_i和θ_j之间的差异来监督。其中w_i是样本x_i的类中心，w_j是其他类的类中心，θ_i是样本x_i与其类中心w_i的特征向量夹角，θ_j是样本x_i与其他类的类中心w_j的特征向量夹角，m为上述角度间隔常量。

进一步地，可以参见图2B的另一种角度间隔的几何解释示意图，在图2A的基础上，w_j是教师样本x_j的类中心，m为上述角度间隔常量，比如m＝0.5。由于x_j较为靠近w_j，可见其收敛性更佳，通过利用学生样本x_i从教师样本x_j中学习来建立不同样本的连接，以达到更好的收敛效果，如图2B中x_i′为期望样本x_i能收敛到的位置。可以对应公式(2)的互监督数据处理方式。

其他参数与前述一致，此处不再赘述。对每个批次(batch)可以重复执行前述步骤，随着类中心的更新，也更新训练中的监督参数，并利用监督参数对样本进行优化，直到训练结束，获得训练后的目标模型。

本公开实施例通过获取至少一批待处理图像，其中，每批待处理图像包括多个待处理图像，在同一批待处理图像中，获取第一图像与上述第一图像对应的第二图像，上述第二图像的收敛程度高于上述第一图像的收敛程度，再基于上述第一图像与上述第二图像，确定用于监督上述第一图像的监督参数，然后基于上述监督参数，对上述至少一批待处理图像进行训练，获得目标模型，通过自适应的监督参数监督图像优化过程，考虑了图像间的关联性和差异性，可以加快训练模型的收敛，提高网络模型的训练效率和模型数据处理的准确度。

为了形象地解释本公开实施例中涉及的损失计算中的监督任务，可以参见图2C和图2D。如图2C为一种样本优化中损失的几何解释示意图。其中不同形状的图标表示不同类别的样本，竖虚线q1、q2表示不同类别的分界线，两个分界线之间的距离L可以理解为样本的类间距离，黑色阴影的图标表示对应的类中心，该方式依赖当前样本与自己类中心以及与其他类的类中心的比较产生损失，举例来讲，如图2C中的虚线三角形a1为优化前的样本，a2为优化后的样本。

如图2D为一种样本间互监督优化损失的几何解释示意图，可以表示本公开实施例中的样本间互监督的损失。同样的，其中不同形状的图标表示不同类别的样本，竖虚线q1、q2表示不同类别的分界线，两个分界线之间的距离L可以理解为样本的类间距离，黑色阴影的三角形和圆形表示对应的类中心。举例来讲，如图2D中的虚线三角形a1为优化前的样本，灰色阴影的三角形和圆形表示a1对应的教师样本，使用收敛性更好的教师样本进行监督，a2为优化后的样本。与图2C相比可以见得，该监督方式使样本更聚集在虚线圆内，具有更优越收敛性，而类间距离L也更大了，即减小了类内距离而增大了类间距离，具有更好的优化效果。

根据特征空间中的分布，如图2C所示，损失由具有类中心的当前样本之间的角度差来监督。进一步地，如图2D所示，本公开实施例在每个小批量样本内为传统的损失优化目标提供样本间的互监督，也可以称之为同伴指导(companion guided)。在每个小批量样本中，进行教师样本与学生样本对应的优化。由于收敛速度在不同样本之间不同，所以优越收敛的样本被认为是教师样本，然后使用额外角度间隔(前述监督参数)对学生样本进行优化，以便样本间优化的差异可以进一步减少。随着训练的进行，每个学生样本在每一次优化中都可以确定不同的教师样本，因此，上述额外角度间隔是动态调整的，也可以说是自适应的。与一般的损失优化工作相比，本公开实施例中的方法利用特征向量间的角度差获得监督参数，反映了特征在空间中的结构信息，使各图像特征的优化更加明显，即减小了类内距离而增大了类间距离。

本公开实施例的图像处理方法在样本之间建立联系，将样本间的互监督引入优化函数，迫使相对的优样本与劣样本获得相似的收敛性。在每个小批量中引入了一种新的师生监督模式，在训练过程中不需要复杂的样本挖掘技术，能加快网络模型收敛，达到更好的训练效果。

图3为本公开实施例提供的另一种图像处理方法，如图3所示，该方法包括：

301、获取人脸图像。

具体的，本公开实施例中可以基于图1所示实施例中获得的目标模型，对待处理的人脸图像进行人脸识别处理。人脸识别，是基于人的脸部特征信息进行身份识别的一种生物识别技术。用摄像机或摄像头采集含有人脸的图像或视频流，并自动在采集到的包含人脸的图像(包括视频流中包含人脸的视频图像)中检测和跟踪人脸，进而对检测到的人脸进行脸部识别的一系列相关技术，通常也叫做人像识别、面部识别。

执行本公开实施例步骤的主体可以为一种图像处理装置，包括终端设备，可以为用户设备(User Equipment，UE)、移动设备、用户终端、终端、个人数字处理(PersonalDigital Assistant，PDA)、计算设备等。其它处理设备，例如可以为本地或云端服务器等。本公开对图像处理装置的形式并不限定。在一些可能的实现方式中，该图像处理方法可以通过处理器调用存储器中存储的计算机可读指令的方式来实现。

其中，上述人脸图像可以为真实人脸图像，包括通过各类摄像设备如摄像机、照相机、移动终端等拍摄的人脸图像。

302、将上述人脸图像输入上述目标模型，获得上述人脸图像的特征数据。

具体的，将获取的上述人脸图像输入上述目标模型，可以对人脸图像进行特征提取，获得该人脸图像的特征数据。

在一种可选的实施方式中，在步骤302之前，可以先对上述人脸图像进行图像预处理。

对于人脸的图像预处理是基于人脸检测结果，对图像进行处理并最终服务于特征提取的过程。***获取的原始人脸图像由于受到各种条件的限制和随机干扰，往往不会直接使用，可以在图像处理的早期阶段对它进行灰度校正、噪声过滤等图像预处理。可选的，上述图像预处理的过程可以包括对人脸图像的光线补偿、灰度变换、直方图均衡化、归一化、几何校正、滤波以及锐化等中的一项或是多项的组合。

人脸识别***可使用的特征通常分为视觉特征、像素统计特征、人脸图像变换系数特征、人脸图像代数特征等，人脸特征提取就是针对人脸的某些特征进行的。人脸特征提取，也称人脸表征，它是对人脸进行特征建模的过程。

一般可以根据人脸器官的形状描述以及他们之间的距离特性来获得有助于人脸分类的特征数据，其特征分量通常包括特征点间的欧氏距离、曲率和角度等。人脸由眼睛、鼻子、嘴、下巴等局部构成，对这些局部和它们之间结构关系的几何描述，可作为识别人脸的重要特征，这些特征被称为几何特征。

本申请所指的目标模型，由于在优化过程中将样本之间的差异性和关联性考虑进来，充分发挥网络模型的表达能力，使特征分类更明确，提高了网络模型的处理精度，从而使模型对多姿态、遮挡等一般模型相对难以精确处理的人脸的识别更为鲁棒，可以更准确、快速地获得上述待处理人脸图像的特征数据。

303、将上述人脸图像的特征数据与数据库中存储的特征模板进行匹配，获得匹配结果，输出上述匹配结果。

具体的，在特征提取之后可以进行人脸匹配。可以将提取的上述特征数据与数据库中存储的特征模板进行搜索匹配。

在一种实施方式中，上述步骤303可以包括：

获取上述人脸图像的特征数据与多个上述特征模板的相似度，确定上述相似度高于预设相似度阈值的特征模板所对应的人脸模板为上述匹配结果；输出上述人脸模板以及上述人脸模板对应的身份信息。

可以预先设定相似度阈值如95％，当相似度超过这一阈值，则把匹配得到的结果输出。可以理解为将待识别的人脸特征与已得到的人脸特征模板进行比较，根据相似程度对人脸的身份信息进行判断。该类人脸识别属于辨认，是一对多进行图像匹配对比的过程，以识别出待处理人脸图像的身份。在匹配到满足相似度的人脸特征时，可以输出匹配到的人脸模板(图像)以及对应的身份信息，其中身份信息可以是提前登记存储的。通过上述方法，提高了人脸识别的效率和准确度，可以应用于如人脸识别的考勤、门禁安防等场景，比如通过识别监控设备采集的人脸以确定出嫌犯或逃犯，协助公安部门进行抓捕；还可以应用于利用了人脸对比技术来测试与名人明星或其他好友面相的相似程度等娱乐类应用程序中。

进一步可选的，可以获取上述人脸图像的特征数据与目标特征模板的相似度，当上述相似度高于上述预设相似度阈值的情况下，则匹配成功，输出识别成功信息。

上述目标特征模板是预先存储的人脸的特征模板，该类人脸识别属于确认，是一对一进行比较的过程，通过比较采集到的人脸的特征与目标人脸特征的相似度，判断是否为目标人脸，若相似度高于预设相似度阈值则匹配成功，身份验证通过，可以输出识别成功信息，比如在支付过程中人脸识别通过并成功支付后输出“支付成功”的信息等。

上述方法可以用于通过人脸识别验证目标人物身份的各种场景中，优化特征提取的准确性和数据处理效率，比如可以应用于涉及到支付、转账、结算和交易的各项环节，本公开实施例对此不作限制。比如通过上述人脸识别步骤，刷脸支付***将会快速准确地完成身份确认、账户读取、转账支付、交易确认等一站式支付环节，为用户创建更棒的支付体验。

基于上述神经网络模型(即目标模型)的图像处理方法，在模型训练时使用了样本间互监督的动态的角度间隔的优化方法，让收敛性更好的样本去监督收敛差的样本，可以让网络训练的更为充分，考虑训练样本的差异性与关联性，可以在人脸识别的特征提取环节有准确的处理效果，特别是对多姿态、遮挡等人脸的识别更为鲁棒。

本公开实施例通过图1所示实施例中的图像处理方法所训练的目标模型，获取人脸图像，将上述人脸图像输入上述目标模型，获得上述人脸图像的特征数据；再将上述人脸图像的特征数据与数据库中存储的特征模板进行匹配，获得匹配结果，输出匹配结果，由于上述目标模型的训练中，使用了样本级别的自适应角度间隔，将样本间的互监督引入优化函数，提高了模型训练中整体的样本收敛性和模型的处理精度，可以更准确、快速地进行特征提取，完成人脸识别任务，应用场景广阔，提高了人脸识别的处理效率和准确度。

本领域技术人员可以理解，在具体实施方式的上述方法中，各步骤的撰写顺序并不意味着严格的执行顺序而对实施过程构成任何限定，各步骤的具体执行顺序应当以其功能和可能的内在逻辑确定。

上述主要从方法侧执行过程的角度对本公开实施例的方案进行了介绍。可以理解的是，图像处理装置为了实现上述功能，其包含了执行各个功能相应的硬件结构和/或软件模块。本领域技术人员应该很容易意识到，结合本文中所公开的实施例描述的各示例的单元及算法步骤，本公开能够以硬件或硬件和计算机软件的结合形式来实现。某个功能究竟以硬件还是计算机软件驱动硬件的方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对特定的应用使用不同方法来实现所描述的功能，但是这种实现不应认为超出本公开的范围。

本公开实施例可以根据上述方法示例对图像处理装置进行功能单元(模块)的划分，例如，可以对应各个功能划分各个功能单元，也可以将两个或两个以上的功能集成在一个处理单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。需要说明的是，本公开实施例中对单元的划分是示意性的，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式。

请参阅图4，图4是本公开实施例公开的一种图像处理装置的结构示意图。如图4所示，该图像处理装置400包括：

第一获取模块410，用于获取至少一批待处理图像，其中，每批待处理图像包括多个待处理图像；

第二获取模块420，用于在同一批待处理图像中，获取第一图像与上述第一图像对应的第二图像，上述第二图像的收敛程度高于上述第一图像的收敛程度；

处理模块430，用于基于上述第一图像与上述第二图像，确定用于监督上述第一图像的监督参数；

训练模块440，用于基于上述监督参数，对上述至少一批待处理图像进行训练，获得目标模型。

可选的，上述处理模块430还用于：

在上述获取第一图像与上述第一图像对应的第二图像之前，将上述待处理图像映射到特征空间，获得上述待处理图像对应的特征向量；获取上述待处理图像的类中心特征向量；

获得上述待处理图像中的第一图像对应的特征向量与上述第一图像对应的类中心特征向量的夹角；

可选的，上述处理模块430具体用于：

根据上述第一角度差与上述第二角度差确定监督角度间隔；

根据上述监督角度间隔，确定上述监督参数。

可选的，在上述第二图像为一个的情况下，上述处理模块430具体用于：

将上述监督角度间隔，确定为上述监督参数。

可选的，在上述第二图像为至少两个的情况下，上述处理模块430具体用于：

可选的，上述训练模块440具体用于：

获取预设权重值和预设阈值；

可选的，上述待处理图像包括人脸图像。

可选的，上述第一获取模块410还用于：

在上述获得上述目标模型之后，获取人脸图像；

上述处理模块430还用于，基于上述目标模型，对上述人脸图像进行人脸识别处理。

可选的，在一种可选的实施方式中，上述处理模块430具体用于：

将上述人脸图像输入上述目标模型，获得上述人脸图像的特征数据；

将上述人脸图像的特征数据与数据库中存储的特征模板进行匹配，获得匹配结果，输出上述匹配结果。

在一种可选的实施方式中，上述处理模块430具体用于：

获取上述人脸图像的特征数据与多个上述特征模板的相似度，确定上述相似度高于预设相似度阈值的特征模板所对应的人脸模板为上述匹配结果；输出上述人脸模板以及上述人脸模板对应的身份信息；或者，

获取上述人脸图像的特征数据与目标特征模板的相似度，当上述相似度高于上述预设相似度阈值的情况下，则匹配成功，输出识别成功信息。

使用本公开实施例中的图像处理装置400，可以实现前述图1和/或图3实施例中的图像处理方法。

实施图4所示的图像处理装置400，图像处理装置400可以获取至少一批待处理图像，其中，每批待处理图像包括多个待处理图像，在同一批待处理图像中，获取第一图像与上述第一图像对应的第二图像，上述第二图像的收敛程度高于上述第一图像的收敛程度，再基于上述第一图像与上述第二图像，确定用于监督上述第一图像的监督参数，然后基于上述监督参数，对上述至少一批待处理图像进行训练，获得目标模型，通过自适应的监督参数监督图像优化过程，考虑了图像间的关联性和差异性，可以加快训练模型的收敛，提高网络模型的训练效率和模型数据处理的准确度。

请参阅图5，图5是本公开实施例公开的一种电子设备的结构示意图。如图5所示，该电子设备500包括处理器501和存储器502，其中，电子设备500还可以包括总线503，处理器501和存储器502可以通过总线503相互连接，总线503可以是外设部件互连标准(Peripheral Component Interconnect，PCI)总线或扩展工业标准结构(ExtendedIndustry Standard Architecture，EISA)总线等。总线503可以分为地址总线、数据总线、控制总线等。为便于表示，图5中仅用一条粗线表示，但并不表示仅有一根总线或一种类型的总线。其中，电子设备500还可以包括输入输出设备504，输入输出设备504可以包括显示屏，例如液晶显示屏。存储器502用于存储计算机程序；处理器501用于调用存储在存储器502中的计算机程序执行上述图1和/或图3实施例中提到的部分或全部方法步骤。

实施图5所示的电子设备500，电子设备500可以获取至少一批待处理图像，其中，每批待处理图像包括多个待处理图像，在同一批待处理图像中，获取第一图像与上述第一图像对应的第二图像，上述第二图像的收敛程度高于上述第一图像的收敛程度，再基于上述第一图像与上述第二图像，确定用于监督上述第一图像的监督参数，然后基于上述监督参数，对上述至少一批待处理图像进行训练，获得目标模型，通过自适应的监督参数监督图像优化过程，考虑了图像间的关联性和差异性，可以加快训练模型的收敛，提高网络模型的训练效率和模型数据处理的准确度。

本公开实施例还提供一种计算机存储介质，其中，该计算机存储介质用于存储计算机程序，该计算机程序使得计算机执行如上述方法实施例中记载的任何一种图像处理方法的部分或全部步骤。

需要说明的是，对于前述的各方法实施例，为了简单描述，故将其都表述为一系列的动作组合，但是本领域技术人员应该知悉，本公开并不受所描述的动作顺序的限制，因为依据本公开，某些步骤可以采用其他顺序或者同时进行。其次，本领域技术人员也应该知悉，说明书中所描述的实施例均属于优选实施例，所涉及的动作和模块并不一定是本公开所必须的。

在上述实施例中，对各个实施例的描述都各有侧重，某个实施例中没有详述的部分，可以参见其他实施例的相关描述。

在本公开所提供的几个实施例中，应该理解到，所揭露的装置，可通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个***，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性或其它的形式。

所述作为分离部件说明的单元(模块)可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本公开各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储器中。基于这样的理解，本公开的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储器中，包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本公开各个实施例所述方法的全部或部分步骤。而前述的存储器包括：U盘、只读存储器(Read-Only Memory，ROM)、随机存取存储器(Random Access Memory，RAM)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。

本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成，该程序可以存储于一计算机可读存储器中，存储器可以包括：闪存盘、只读存储器、随机存取器、磁盘或光盘等。

以上对本公开实施例进行了详细介绍，本文中应用了具体个例对本公开的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本公开的方法及其核心思想；同时，对于本领域的一般技术人员，依据本公开的思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本公开的限制。

Claims

1.一种图像处理方法，其特征在于，所述方法包括：

在同一批待处理图像中，获取所述第一图像与所述第一图像对应的第二图像，所述第二图像的收敛程度高于所述第一图像的收敛程度，所述第二图像的收敛程度高于所述第一图像的收敛程度包括：所述第二图像的特征向量与所述第二图像对应的类中心特征向量的夹角，大于所述第一图像的特征向量与所述第一图像对应的类中心特征向量的夹角；

基于所述第一图像与所述第二图像，确定用于监督所述第一图像的监督参数，所述监督参数表征所述第一图像的收敛程度与所述第二图像的收敛程度的差异；

2.根据权利要求1所述的方法，其特征在于，所述基于所述第一图像与所述第二图像，确定用于监督所述第一图像的监督参数，包括：

根据所述第一角度差与所述第二角度差确定监督角度间隔；

根据所述监督角度间隔，确定所述监督参数。

3.根据权利要求2所述的方法，其特征在于，在所述第二图像为一个的情况下，所述根据所述第一角度差与所述第二角度差确定监督角度间隔，包括：

所述根据所述监督角度间隔，确定所述监督参数，包括：

将所述监督角度间隔，确定为所述监督参数。

4.根据权利要求2所述的方法，其特征在于，在所述第二图像为至少两个的情况下，所述根据所述第一角度差与所述第二角度差确定监督角度间隔，包括：

所述根据所述监督角度间隔，确定所述监督参数，包括：

5.根据权利要求1-4任一所述的方法，其特征在于，所述基于所述监督参数，对所述至少一批待处理图像进行训练，获得目标模型，包括：

6.根据权利要求5所述的方法，其特征在于，所述根据所述各个待处理图像对应的监督参数和预设损失函数对所述待处理图像进行训练，获得所述目标模型，包括：

获取预设权重值和预设阈值；

7.根据权利要求1-4任一所述的方法，其特征在于，所述待处理图像包括人脸图像。

8.根据权利要求7所述的方法，其特征在于，在所述获得所述目标模型之后，所述方法还包括：

获取人脸图像；

基于所述目标模型，对所述人脸图像进行人脸识别处理。

9.一种图像处理装置，其特征在于，包括：

处理模块，用于将所述待处理图像映射到特征空间，获得所述待处理图像对应的特征向量；获取所述待处理图像的类中心特征向量；

所述处理模块，用于获得所述待处理图像中的第一图像对应的特征向量与所述第一图像对应的类中心特征向量的夹角；

第二获取模块，用于在同一批待处理图像中，获取所述第一图像与所述第一图像对应的第二图像，所述第二图像的收敛程度高于所述第一图像的收敛程度，所述第二图像的收敛程度高于所述第一图像的收敛程度包括：所述第二图像的特征向量与所述第二图像对应的类中心特征向量的夹角，大于所述第一图像的特征向量与所述第一图像对应的类中心特征向量的夹角；

所述处理模块，用于基于所述第一图像与所述第二图像，确定用于监督所述第一图像的监督参数，所述监督参数表征所述第一图像的收敛程度与所述第二图像的收敛程度的差异；

10.根据权利要求9所述的装置，其特征在于，所述处理模块具体用于：

根据所述第一角度差与所述第二角度差确定监督角度间隔；

根据所述监督角度间隔，确定所述监督参数。

11.根据权利要求10所述的装置，其特征在于，在所述第二图像为一个的情况下，所述处理模块具体用于：

将所述监督角度间隔，确定为所述监督参数。

12.根据权利要求10所述的装置，其特征在于，在所述第二图像为至少两个的情况下，所述处理模块具体用于：

13.根据权利要求9-12任一所述的装置，其特征在于，所述训练模块具体用于：

14.根据权利要求13所述的装置，其特征在于，所述训练模块具体用于：

获取预设权重值和预设阈值；

15.根据权利要求9-12任一所述的装置，其特征在于，所述待处理图像包括人脸图像。

16.根据权利要求15所述的装置，其特征在于，所述第一获取模块还用于：

在所述获得所述目标模型之后，获取人脸图像；

17.一种电子设备，其特征在于，包括处理器以及存储器，所述存储器用于存储计算机程序，所述计算机程序被配置成由所述处理器执行，所述处理器用于执行如权利要求1-7任一项所述的方法。

18.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质用于存储计算机程序，其中，所述计算机程序使得计算机执行如权利要求1-7任一项所述的方法。