CN116912518B

CN116912518B - 图像的多尺度特征处理方法及装置

Info

Publication number: CN116912518B
Application number: CN202311168251.6A
Authority: CN
Inventors: 蒋召; 周靖宇
Original assignee: Shenzhen Xumi Yuntu Space Technology Co Ltd
Current assignee: Shenzhen Xumi Yuntu Space Technology Co Ltd
Priority date: 2023-09-12
Filing date: 2023-09-12
Publication date: 2024-01-05
Anticipated expiration: 2043-09-12
Also published as: CN116912518A

Abstract

本公开涉及图像处理技术领域，提供了一种图像的多尺度特征处理方法及装置，该方法包括：对图像的特征图进行处理，得到图像的第一尺度特征向量矩阵；对图像的第一融合特征向量矩阵进行处理，得到图像的第二尺度特征向量矩阵；对图像的第二融合特征向量矩阵进行处理，得到图像的第三尺度特征向量矩阵；根据图像的第一尺度特征向量矩阵、图像的第二尺度特征向量矩阵、以及图像的第三尺度特征向量矩阵，确定图像的多尺度特征向量矩阵；根据特定对象的图像的多尺度特征向量矩阵和至少一个重识别对象的图像的多尺度特征向量矩阵，从至少一个重识别对象中定位目标对象。本公开基于多尺度特征向量矩阵来获取目标对象，以此方式获取的目标对象更加准确。

Description

图像的多尺度特征处理方法及装置

技术领域

本公开涉及图像处理技术领域，尤其涉及一种图像的多尺度特征处理方法及装置。

背景技术

随着互联网技术的快速发展，人们可以基于图像模型来执行重识别任务，这样可以从大量图像数据中定位目标对象。现有重识别算法未考虑识别过程中的尺度特征变化，即人类在观察一个具体对象时，首先会观察其整体，然后会逐渐观察其局部信息，因此这些局部信息具有很高的分辨性，其有助于重识别任务。目前，重识别算法为了提高精度，将注意力集制引入到了识别网络中，但是这种注意力只在单一尺度上让网络学习更加有用的特征，从而导致获取的重识别任务的结果准确度不高，这样无法满足人们的实际需求，影响用户体验。

发明内容

有鉴于此，本公开实施例提供了一种图像的多尺度特征处理方法、装置、电子设备及计算机可读存储介质，以解决现有技术中重识别任务的结果准确度不高，无法满足人们的实际需求，影响用户体验的技术问题。

本公开实施例的第一方面，提供了一种图像的多尺度特征处理方法，该方法包括：获取图像的特征图，图像包括特定对象的图像和至少一个重识别对象的图像；对图像的特征图进行处理，得到图像的第一尺度特征向量矩阵；对图像的第一融合特征向量矩阵进行处理，得到图像的第二尺度特征向量矩阵，图像的第一融合特征向量矩阵是基于瓶颈层输出的特征向量矩阵和图像的特征图确定的；对图像的第二融合特征向量矩阵进行处理，得到图像的第三尺度特征向量矩阵，图像的第二融合特征向量矩阵是基于瓶颈层输出的特征向量矩阵和图像的第一融合特征向量矩阵确定的；根据图像的第一尺度特征向量矩阵、图像的第二尺度特征向量矩阵、以及图像的第三尺度特征向量矩阵，确定图像的多尺度特征向量矩阵；通过循环的方式，获取特定对象的图像的多尺度特征向量矩阵和至少一个重识别对象的图像的多尺度特征向量矩阵，根据特定对象的图像的多尺度特征向量矩阵和至少一个重识别对象的图像的多尺度特征向量矩阵，从至少一个重识别对象中定位目标对象。

本公开实施例的第二方面，提供了一种图像的多尺度特征处理装置，该装置包括：获取模块，用于获取图像的特征图，图像包括特定对象的图像和至少一个重识别对象的图像；第一处理模块，用于对图像的特征图进行处理，得到图像的第一尺度特征向量矩阵；第二处理模块，用于对图像的第一融合特征向量矩阵进行处理，得到图像的第二尺度特征向量矩阵，图像的第一融合特征向量矩阵是基于瓶颈层输出的特征向量矩阵和图像的特征图确定的；第三处理模块，用于对图像的第二融合特征向量矩阵进行处理，得到图像的第三尺度特征向量矩阵，图像的第二融合特征向量矩阵是基于瓶颈层输出的特征向量矩阵和图像的第一融合特征向量矩阵确定的；确定模块，用于根据图像的第一尺度特征向量矩阵、图像的第二尺度特征向量矩阵、以及图像的第三尺度特征向量矩阵，确定图像的多尺度特征向量矩阵；循环模块，用于通过循环的方式，获取特定对象的图像的多尺度特征向量矩阵和至少一个重识别对象的图像的多尺度特征向量矩阵，根据特定对象的图像的多尺度特征向量矩阵和至少一个重识别对象的图像的多尺度特征向量矩阵，从至少一个重识别对象中定位目标对象。

本公开实施例的第三方面，提供了一种电子设备，包括存储器、处理器以及存储在存储器中并且可在处理器上运行的计算机程序，该处理器执行计算机程序时实现上述方法的步骤。

本公开实施例的第四方面，提供了一种计算机可读存储介质，该计算机可读存储介质存储有计算机程序，该计算机程序被处理器执行时实现上述方法的步骤。

本公开实施例与现有技术相比存在的有益效果是：本公开实施例可以对图像的特征图进行处理，得到图像的第一尺度特征向量矩阵；对图像的第一融合特征向量矩阵进行处理，得到图像的第二尺度特征向量矩阵；对图像的第二融合特征向量矩阵进行处理，得到图像的第三尺度特征向量矩阵；根据图像的第一尺度特征向量矩阵、图像的第二尺度特征向量矩阵、以及图像的第三尺度特征向量矩阵，确定图像的多尺度特征向量矩阵；根据特定对象的图像的多尺度特征向量矩阵和至少一个重识别对象的图像的多尺度特征向量矩阵，从至少一个重识别对象中定位目标对象，这样可以基于多尺度特征向量矩阵来获取目标对象，以此方式获取的目标对象更加准确。

附图说明

为了更清楚地说明本公开实施例中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本公开的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其它的附图。

图1示出了可以应用本发明实施例的技术方案的示例性***架构的示意图；

图2是本公开实施例提供的一种图像的多尺度特征处理方法的流程示意图；

图3是本公开实施例提供的从至少一个重识别对象中定位目标对象的步骤的流程示意图；

图4是本公开实施例提供的一种图像的多尺度特征处理装置的结构示意图；

图5是本公开实施例提供的一种电子设备的结构示意图。

具体实施方式

以下描述中，为了说明而不是为了限定，提出了诸如特定***结构、技术之类的具体细节，以便透彻理解本公开实施例。然而，本领域的技术人员应当清楚，在没有这些具体细节的其它实施例中也可以实现本公开。在其它情况中，省略对众所周知的***、装置、电路以及方法的详细说明，以免不必要的细节妨碍本公开的描述。

需要说明的是，本公开所涉及的用户信息(包括但不限于终端设备信息、用户个人信息等)和数据(包括但不限于用于展示的数据、分析的数据等)，均为经用户授权或者经过各方充分授权的信息和数据。

图1示出了可以应用本发明实施例的技术方案的示例性***架构的示意图。

如图1所示，***架构100可以包括第一终端设备101、第二终端设备102、第三终端设备103中的一种或多种，网络104和服务器105。网络104用以在第一终端设备101、第二终端设备102、第三终端设备103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型，例如有线、无线通信链路或者光纤电缆等等。

应该理解，图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要，可以具有任意数目的终端设备、网络和服务器。比如服务器105可以是多个服务器组成的服务器集群等。

用户可以使用第一终端设备101、第二终端设备102、第三终端设备103通过网络104与服务器105交互，以接收或发送图像数据等。第一终端设备101、第二终端设备102、第三终端设备103可以是具有显示屏的各种电子设备，包括但不限于智能手机、平板电脑、便携式计算机和台式计算机等等。

服务器105可以是提供各种服务的服务器。例如服务器105可以从第一端设备103（也可以是第二终端设备102或第三终端设备103）获取特定对象的图像和至少一个重识别对象的图像，并通过服务器105获取图像的特征图，图像包括特定对象的图像和至少一个重识别对象的图像；对图像的特征图进行处理，得到图像的第一尺度特征向量矩阵；对图像的第一融合特征向量矩阵进行处理，得到图像的第二尺度特征向量矩阵，图像的第一融合特征向量矩阵是基于瓶颈层输出的特征向量矩阵和图像的特征图确定的；对图像的第二融合特征向量矩阵进行处理，得到图像的第三尺度特征向量矩阵，图像的第二融合特征向量矩阵是基于瓶颈层输出的特征向量矩阵和图像的第一融合特征向量矩阵确定的；根据图像的第一尺度特征向量矩阵、图像的第二尺度特征向量矩阵、以及图像的第三尺度特征向量矩阵，确定图像的多尺度特征向量矩阵；通过循环的方式，获取特定对象的图像的多尺度特征向量矩阵和至少一个重识别对象的图像的多尺度特征向量矩阵，根据特定对象的图像的多尺度特征向量矩阵和至少一个重识别对象的图像的多尺度特征向量矩阵，从至少一个重识别对象中定位目标对象，这样可以基于多尺度特征向量矩阵来获取目标对象，以此方式获取的目标对象更加准确。

在一些实施例中，本发明实施例所提供的图像的多尺度特征处理方法一般由服务器105执行，相应地，图像的多尺度特征处理装置一般设置于服务器105中。在另一些实施例中，某些终端设备可以具有与服务器相似的功能从而执行本方法。因此，本发明实施例所提供的图像的多尺度特征处理方法不限定在服务器端执行。

下面将结合附图详细说明根据本公开实施例的图像的多尺度特征处理方法和装置。

图2是本公开实施例提供的一种图像的多尺度特征处理方法的流程示意图。本公开实施例提供的方法可以由任意具备计算机处理能力的电子设备执行，例如电子设备可以是图1示出的服务器。

如图2所示，该图像的多尺度特征处理方法包括步骤S210至步骤S260。

在步骤S210中，获取图像的特征图，图像包括特定对象的图像和至少一个重识别对象的图像。

步骤S220，对图像的特征图进行处理，得到图像的第一尺度特征向量矩阵。

在步骤S230中，对图像的第一融合特征向量矩阵进行处理，得到图像的第二尺度特征向量矩阵，图像的第一融合特征向量矩阵是基于瓶颈层输出的特征向量矩阵和图像的特征图确定的。

在步骤S240中，对图像的第二融合特征向量矩阵进行处理，得到图像的第三尺度特征向量矩阵，图像的第二融合特征向量矩阵是基于瓶颈层输出的特征向量矩阵和图像的第一融合特征向量矩阵确定的。

在步骤S250中，根据图像的第一尺度特征向量矩阵、图像的第二尺度特征向量矩阵、以及图像的第三尺度特征向量矩阵，确定图像的多尺度特征向量矩阵。

在步骤S260中，通过循环的方式，获取特定对象的图像的多尺度特征向量矩阵和至少一个重识别对象的图像的多尺度特征向量矩阵，根据特定对象的图像的多尺度特征向量矩阵和至少一个重识别对象的图像的多尺度特征向量矩阵，从至少一个重识别对象中定位目标对象。

该方法可以对图像的特征图进行处理，得到图像的第一尺度特征向量矩阵，对图像的第一融合特征向量矩阵进行处理，得到图像的第二尺度特征向量矩阵，对图像的第二融合特征向量矩阵进行处理，得到图像的第三尺度特征向量矩阵，根据图像的第一尺度特征向量矩阵、图像的第二尺度特征向量矩阵、以及图像的第三尺度特征向量矩阵，确定图像的多尺度特征向量矩阵，根据特定对象的图像的多尺度特征向量矩阵和至少一个重识别对象的图像的多尺度特征向量矩阵，从至少一个重识别对象中定位目标对象，这样可以基于多尺度特征向量矩阵来获取目标对象，以此方式获取的目标对象更加准确。

在本公开一些实施例中，上述特定对象的图像可以是真实对象的图像。上述至少一个重识别对象的图像可以是含有真实对象的图像和含有非真实对象的图像。例如，基于真实对象的图像从一个图像集合中定位与该真实对象相同的对象。该真实图像的图像为特定对象的图像，图像集合中包含至少一个重识别对象的图像。针对小孩走失的场景，可以获取小孩本人的图像（即特定对象的图像）和该小孩在走失区域的多媒体数据中每一帧图像（至少一个重识别对象的图像），基于本申请的图像识别模型可以从多尺度特征角度分析小孩的图像和每一帧图像，以此方式可以从多媒体数据的每一帧图像中快速准确的定位到该小孩。

在本公开一些实施例中，上述图像识别模型可以包括多个尺度处理模块，该尺度处理模块用于从图像的特征图提取能够代表对象结构的全局特征，还可以用于从不同融合特征中提取能够代表对象结构局部特征。在本实施例中，每个尺度处理模块中包含一个全局平均池化层，用于提取全局特征和局部特征，在本申请中，全局特征和局部特征表示不同尺度的特征。不同融合特征可以是基于瓶颈层输出的特征向量矩阵与该图像的特征图相加得到的第一融合特征向量矩阵，和基于该第一融合特征向量矩阵与瓶颈层输出的特征向量矩阵相加得到的第二融合特征向量矩阵。

在本公开一些实施例中，在获取图像的特征图之前，上述方法还包括：获取训练样本，每个训练样本中包含第一历史图像、第二历史图像、以及第三历史图，第一历史图像和第二历史图像相同，第三历史图像与第一历史图像不同；将训练样本输入至图像识别模型，通过图像识别图像中的骨干网络提取训练样本中各个历史图像的特征图；将各个历史图像的特征图输入至第一全局平均池化层，通过第一全局平均池化层对各个历史图像的特征图进行池化处理，得到各个历史图像的第一尺度特征向量矩阵，将各个历史图像的第一尺度特征向量矩阵输入至第一全连接层，通过第一全连接层对各个历史图像的第一尺度特征向量矩阵进行处理，并根据第一全连接层输出的结果计算第一尺度下的分类损失和三元损失；将各个历史图像的特征图输入至瓶颈层，通过瓶颈层对各个图像的特征图进行处理，并将瓶颈层输出的各个图像的特征向量矩阵与各个历史图像的特征图对应相加，得到各个历史图像的第一融合特征向量矩阵，将各个历史图像的第一融合特征向量矩阵输入至第二全局平均池化层，通过第二全局平均池化层对各个历史图像的第一融合特征向量矩阵进行池化处理，得到各个历史图像的第二尺度特征向量矩阵；将各个历史图像的第二尺度特征向量矩阵输入至第二全连接层，通过第二全连接层对各个历史图像的第二尺度特征向量矩阵进行处理，并根据第二全连接层输出的结果计算第二尺度下的分类损失和三元损失；将瓶颈层输出的各个图像的特征向量与各个历史图像的第一融合特征向量矩阵相加，得到各个图像的第二融合特征向量矩阵，将各个历史图像的第二融合特征向量矩阵输入至第三全局平均池化层，通过第三全局平均池化层对各个历史图像的第二融合特征向量矩阵进行池化处理，得到各个历史图像的第三尺度特征向量矩阵；将各个历史图像的第三尺度特征向量矩阵输入至第三全连接层，通过第三全连接层对各个历史图像的第三尺度特征向量矩阵进行处理，并根据第三全连接层输出的结果计算第三尺度下的分类损失和三元损失；根据第一尺度下的分类损失和三元损失、第二尺度下的分类损失和三元损失、第三尺度下的分类损失和三元损失，确定多尺度下的总损失；通过循环迭代的方式，直至图像识别模型收敛时停止训练。以此方式可以基于总损失反向更新骨干网络与瓶颈层的参数，待骨干网络和瓶颈层的参数稳定后，停止训练。

基于前述实施例，根据第一尺度下的分类损失和三元损失、第二尺度下的分类损失和三元损失、第三尺度下的分类损失和三元损失，确定多尺度下的总损失。例如，三个不同尺度下的分类损失和三元损失相加，得到多尺度下的总损失。

在本公开一些实施例中，对图像的特征图进行处理，得到图像的第一尺度特征向量矩阵包括：将图像的特征图输入至第一全局平均池化层；通过第一全局平均池化层对图像的特征图处理，得到图像的第一尺度特征向量矩阵。以此方式可以得到图像的初始全局特征。

在本公开一些实施例中，方法还包括：将图像的特征图输入至瓶颈层，通过瓶颈层对图像的特征图进行处理，得到瓶颈层输出的特征向量矩阵；将瓶颈层输出的特征向量矩阵和图像的特征图相加，得到图像的第一融合特征向量矩阵。以此方式可以增强图像的局部特征，以使得后续可以从第一融合特征向量矩阵提取到的局部特征鲁棒性和分辨性更高。

在本公开一些实施例中，瓶颈层中包含第一卷积层、第二卷积层、第三卷积层，第一卷积层与第三卷积层的卷积核相同，第二卷积层与第三卷积层的卷积核不同；通过瓶颈层对图像的特征图进行处理，得到瓶颈层输出的特征向量矩阵包括：将图像的特征图输入至第一卷积层，通过第一卷积层对图像的特征图进行卷积处理，得到第一卷积层输出的特征向量矩阵；将第一卷积层输出的特征向量矩阵输入至第二卷积层，通过第二卷积层对第一卷积层输出的特征向量矩阵进行卷积处理，得到第二卷积层输出的特征向量矩阵；将第二卷积层输出的特征向量矩阵输入至第三卷积层，通过第三卷积层对第二卷积层输出的特征向量矩阵进行卷积处理，得到第三卷积层输出的特征向量矩阵。在本申请中，通过瓶颈层中的三个串联的卷积层可以增强特征图中的局部特征。三个卷积层的卷积核可以是1x1、3x3、1x1。

在本公开一些实施例中，对图像的第一融合特征向量矩阵进行处理，得到图像的第二尺度特征向量矩阵包括：将图像的第一融合特征向量矩阵输入至第二全局平均池化层，通过第二全局平均池化层对图像的第一融合特征向量矩阵进行池化处理，得到图像的第二尺度特征向量矩阵。以此方式得到的第二尺度特征向量矩阵更能体现图像结构的局部信息。

在本公开一些实施例中，对图像的第二融合特征向量矩阵进行处理，得到图像的第三尺度特征向量矩阵包括：将图像的第二融合特征向量矩阵输入至第三全局平均池化层，通过第三全局平均池化层对图像的第二融合特征向量矩阵进行池化处理，得到图像的第三尺度特征向量矩阵。在本实施例中，将上述瓶颈层输出的特征向量矩阵与第一融合特征向量矩阵相加，得到上述第二融合特征向量矩阵，这样可以进一步增强局部特征，以使得通过第三全局平均池化层可以从第二融合特征向量矩阵提取出鲁棒性和分辨不更高的特征。

基于前述实施例，将特定对象的图像的第一尺度特征向量矩阵、第二尺度特征向量矩阵、第三尺度特征向量矩阵相加，得到该特定对象的图像的多尺度特征向量矩阵；将至少一个重识别对象的图像的第一尺度特征向量矩阵、第二尺度特征向量矩阵、第三尺度特征向量矩阵相加，得到该至少一个重识别对象的图像的多尺度特征向量矩阵。以此方式得到的多尺度特征向量矩阵中包含了特定对象图像或重识别图像的全局特征和局部特征。基于两者的相似度可以快速准确的从至少一个重识别对象中定位到目标对象。在本实施例中，特定对象与目标对象相同。

图3是本公开实施例提供的从至少一个重识别对象中定位目标对象的步骤的流程示意图。

如图3所示，上述步骤S260中的“根据特定对象的图像的多尺度特征向量矩阵和至少一个重识别对象的图像的多尺度特征向量矩阵，从至少一个重识别对象中定位目标对象”具体了可以步骤S310和步骤S320。

在步骤S310中，根据特定对象的图像的多尺度特征向量矩阵和至少一个重识别对象的图像的多尺度特征向量矩阵，确定特定对象与各个重识别对象之间的相似度。

在步骤S320中，根据特定对象与各个重识别对象之间的相似度，从至少一个重识别对象中定位目标对象。

该方法可以根据特定对象与各个重识别对象之间的相似度，从至少一个重识别对象中定位目标对象，以此方式可以快速准确的从至少一个重识别对象中定位到目标对象，以满足应用场景的实际需求，提高使用图像识别模型的体验。

在一些实施例中，通过欧式距离公式或余弦公式，基于根据特定对象的图像的多尺度特征向量矩阵和至少一个重识别对象的图像的多尺度特征向量矩阵，可以计算出特定对象与各个重识别对象之间的相似度。

下述为本公开装置实施例，可以用于执行本公开方法实施例。下文描述的图像的多尺度特征处理装置与上文描述的图像的多尺度特征处理方法可相互对应参照。对于本公开装置实施例中未披露的细节，请参照本公开方法实施例。

图4是本公开实施例提供的一种图像的多尺度特征处理装置的结构示意图。

如图4所示，该图像的多尺度特征处理装置400包括获取模块410、第一处理模块420、第二处理模块430、第三处理模块440、确定模块450和循环模块460。

具体地，获取模块410，用于获取图像的特征图，图像包括特定对象的图像和至少一个重识别对象的图像。

第一处理模块420，用于对图像的特征图进行处理，得到图像的第一尺度特征向量矩阵。

第二处理模块430，用于对图像的第一融合特征向量矩阵进行处理，得到图像的第二尺度特征向量矩阵，图像的第一融合特征向量矩阵是基于瓶颈层输出的特征向量矩阵和图像的特征图确定的。

第三处理模块440，用于对图像的第二融合特征向量矩阵进行处理，得到图像的第三尺度特征向量矩阵，图像的第二融合特征向量矩阵是基于瓶颈层输出的特征向量矩阵和图像的第一融合特征向量矩阵确定的。

确定模块450，用于根据图像的第一尺度特征向量矩阵、图像的第二尺度特征向量矩阵、以及图像的第三尺度特征向量矩阵，确定图像的多尺度特征向量矩阵。

循环模块460，用于通过循环的方式，获取特定对象的图像的多尺度特征向量矩阵和至少一个重识别对象的图像的多尺度特征向量矩阵，根据特定对象的图像的多尺度特征向量矩阵和至少一个重识别对象的图像的多尺度特征向量矩阵，从至少一个重识别对象中定位目标对象。

该图像的多尺度特征处理装置400可以对图像的特征图进行处理，得到图像的第一尺度特征向量矩阵，对图像的第一融合特征向量矩阵进行处理，得到图像的第二尺度特征向量矩阵，对图像的第二融合特征向量矩阵进行处理，得到图像的第三尺度特征向量矩阵，根据图像的第一尺度特征向量矩阵、图像的第二尺度特征向量矩阵、以及图像的第三尺度特征向量矩阵，确定图像的多尺度特征向量矩阵，根据特定对象的图像的多尺度特征向量矩阵和至少一个重识别对象的图像的多尺度特征向量矩阵，从至少一个重识别对象中定位目标对象，这样可以基于多尺度特征向量矩阵来获取目标对象，以此方式获取的目标对象更加准确。

在本公开一些实施例中，第一处理模块420被配置为：将图像的特征图输入至第一全局平均池化层；通过第一全局平均池化层对图像的特征图处理，得到图像的第一尺度特征向量矩阵。

在本公开一些实施例中，图像的多尺度特征处理装置400还用于：将图像的特征图输入至瓶颈层，通过瓶颈层对图像的特征图进行处理，得到瓶颈层输出的特征向量矩阵；将瓶颈层输出的特征向量矩阵和图像的特征图相加，得到图像的第一融合特征向量矩阵。

在本公开一些实施例中，瓶颈层中包含第一卷积层、第二卷积层、第三卷积层，第一卷积层与第三卷积层的卷积核相同，第二卷积层与第三卷积层的卷积核不同；通过瓶颈层对图像的特征图进行处理，得到瓶颈层输出的特征向量矩阵包括：将图像的特征图输入至第一卷积层，通过第一卷积层对图像的特征图进行卷积处理，得到第一卷积层输出的特征向量矩阵；将第一卷积层输出的特征向量矩阵输入至第二卷积层，通过第二卷积层对第一卷积层输出的特征向量矩阵进行卷积处理，得到第二卷积层输出的特征向量矩阵；将第二卷积层输出的特征向量矩阵输入至第三卷积层，通过第三卷积层对第二卷积层输出的特征向量矩阵进行卷积处理，得到第三卷积层输出的特征向量矩阵。

在本公开一些实施例中，第二处理模块430被配置为：将图像的第一融合特征向量矩阵输入至第二全局平均池化层，通过第二全局平均池化层对图像的第一融合特征向量矩阵进行池化处理，得到图像的第二尺度特征向量矩阵；

对图像的第二融合特征向量矩阵进行处理，得到图像的第三尺度特征向量矩阵包括：将图像的第二融合特征向量矩阵输入至第三全局平均池化层，通过第三全局平均池化层对图像的第二融合特征向量矩阵进行池化处理，得到图像的第三尺度特征向量矩阵。

在本公开一些实施例中，根据特定对象的图像的多尺度特征向量矩阵和至少一个重识别对象的图像的多尺度特征向量矩阵，从至少一个重识别对象中定位目标对象包括：根据特定对象的图像的多尺度特征向量矩阵和至少一个重识别对象的图像的多尺度特征向量矩阵，确定特定对象与各个重识别对象之间的相似度；根据特定对象与各个重识别对象之间的相似度，从至少一个重识别对象中定位目标对象。

在本公开一些实施例中，在获取图像的特征图之前，图像的多尺度特征处理装置400还用于：获取训练样本，每个训练样本中包含第一历史图像、第二历史图像、以及第三历史图，第一历史图像和第二历史图像相同，第三历史图像与第一历史图像不同；将训练样本输入至图像识别模型，通过图像识别图像中的骨干网络提取训练样本中各个历史图像的特征图；将各个历史图像的特征图输入至第一全局平均池化层，通过第一全局平均池化层对各个历史图像的特征图进行池化处理，得到各个历史图像的第一尺度特征向量矩阵，将各个历史图像的第一尺度特征向量矩阵输入至第一全连接层，通过第一全连接层对各个历史图像的第一尺度特征向量矩阵进行处理，并根据第一全连接层输出的结果计算第一尺度下的分类损失和三元损失；将各个历史图像的特征图输入至瓶颈层，通过瓶颈层对各个图像的特征图进行处理，并将瓶颈层输出的各个图像的特征向量矩阵与各个历史图像的特征图对应相加，得到各个历史图像的第一融合特征向量矩阵，将各个历史图像的第一融合特征向量矩阵输入至第二全局平均池化层，通过第二全局平均池化层对各个历史图像的第一融合特征向量矩阵进行池化处理，得到各个历史图像的第二尺度特征向量矩阵；将各个历史图像的第二尺度特征向量矩阵输入至第二全连接层，通过第二全连接层对各个历史图像的第二尺度特征向量矩阵进行处理，并根据第二全连接层输出的结果计算第二尺度下的分类损失和三元损失；将瓶颈层输出的各个图像的特征向量与各个历史图像的第一融合特征向量矩阵相加，得到各个图像的第二融合特征向量矩阵，将各个历史图像的第二融合特征向量矩阵输入至第三全局平均池化层，通过第三全局平均池化层对各个历史图像的第二融合特征向量矩阵进行池化处理，得到各个历史图像的第三尺度特征向量矩阵；将各个历史图像的第三尺度特征向量矩阵输入至第三全连接层，通过第三全连接层对各个历史图像的第三尺度特征向量矩阵进行处理，并根据第三全连接层输出的结果计算第三尺度下的分类损失和三元损失；根据第一尺度下的分类损失和三元损失、第二尺度下的分类损失和三元损失、第三尺度下的分类损失和三元损失，确定多尺度下的总损失；通过循环迭代的方式，基于总损失反向更新所述骨干网络与所述瓶颈层的参数，直至图像识别模型收敛时停止训练。

图5是本公开实施例提供的电子设备5的示意图。如图5所示，该实施例的电子设备5包括：处理器501、存储器502以及存储在该存储器502中并且可在处理器501上运行的计算机程序503。处理器501执行计算机程序503时实现上述各个方法实施例中的步骤。或者，处理器501执行计算机程序503时实现上述各装置实施例中各模块的功能。

电子设备5可以是桌上型计算机、笔记本、掌上电脑及云端服务器等电子设备。电子设备5可以包括但不仅限于处理器501和存储器502。本领域技术人员可以理解，图5仅仅是电子设备5的示例，并不构成对电子设备5的限定，可以包括比图示更多或更少的部件，或者不同的部件。

处理器501可以是中央处理单元（Central Processing Unit，CPU），也可以是其它通用处理器、数字信号处理器（Digital Signal Processor，DSP）、专用集成电路（Application Specific Integrated Circuit，ASIC）、现场可编程门阵列（Field-Programmable Gate Array，FPGA）或者其它可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。

存储器502可以是电子设备5的内部存储单元，例如，电子设备5的硬盘或内存。存储器502也可以是电子设备5的外部存储设备，例如，电子设备5上配备的插接式硬盘，智能存储卡（Smart Media Card，SMC），安全数字（Secure Digital，SD）卡，闪存卡（Flash Card）等。存储器502还可以既包括电子设备5的内部存储单元也包括外部存储设备。存储器502用于存储计算机程序以及电子设备所需的其它程序和数据。

所属领域的技术人员可以清楚地了解到，为了描述的方便和简洁，仅以上述各功能单元、模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能单元、模块完成，即将装置的内部结构划分成不同的功能单元或模块，以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中，上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

集成的模块如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读存储介质中。基于这样的理解，本公开实现上述实施例方法中的全部或部分流程，也可以通过计算机程序来指令相关的硬件来完成，计算机程序可以存储在计算机可读存储介质中，该计算机程序在被处理器执行时，可以实现上述各个方法实施例的步骤。计算机程序可以包括计算机程序代码，计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。计算机可读介质可以包括：能够携带计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器（Read-Only Memory，ROM）、随机存取存储器（Random Access Memory，RAM）、电载波信号、电信信号以及软件分发介质等。需要说明的是，计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减，例如，在某些司法管辖区，根据立法和专利实践，计算机可读介质不包括电载波信号和电信信号。

以上实施例仅用以说明本公开的技术方案，而非对其限制；尽管参照前述实施例对本公开进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本公开各实施例技术方案的精神和范围，均应包含在本公开的保护范围之内。

Claims

1.一种图像的多尺度特征处理方法，其特征在于，所述方法包括：

获取图像的特征图，所述图像包括特定对象的图像和至少一个重识别对象的图像；

对所述图像的特征图进行处理，得到所述图像的第一尺度特征向量矩阵；

对所述图像的第一融合特征向量矩阵进行处理，得到所述图像的第二尺度特征向量矩阵，所述图像的第一融合特征向量矩阵是基于瓶颈层输出的特征向量矩阵和所述图像的特征图确定的；

对所述图像的第二融合特征向量矩阵进行处理，得到所述图像的第三尺度特征向量矩阵，所述图像的第二融合特征向量矩阵是基于所述瓶颈层输出的特征向量矩阵和所述图像的第一融合特征向量矩阵确定的；

根据所述图像的第一尺度特征向量矩阵、所述图像的第二尺度特征向量矩阵、以及所述图像的第三尺度特征向量矩阵，确定所述图像的多尺度特征向量矩阵；

通过循环的方式，获取所述特定对象的图像的多尺度特征向量矩阵和至少一个所述重识别对象的图像的多尺度特征向量矩阵，根据所述特定对象的图像的多尺度特征向量矩阵和至少一个所述重识别对象的图像的多尺度特征向量矩阵，从至少一个所述重识别对象中定位目标对象；

在获取所述图像的特征图之前，所述方法还包括：

获取训练样本，每个训练样本中包含第一历史图像、第二历史图像、以及第三历史图像，所述第一历史图像和所述第二历史图像相同，所述第三历史图像与所述第一历史图像不同；

将所述训练样本输入至图像识别模型，通过所述图像识别图像中的骨干网络提取所述训练样本中各个历史图像的特征图；

将各个历史图像的特征图输入至第一全局平均池化层，通过所述第一全局平均池化层对各个历史图像的特征图进行池化处理，得到各个历史图像的第一尺度特征向量矩阵，将各个历史图像的第一尺度特征向量矩阵输入至第一全连接层，通过所述第一全连接层对各个历史图像的第一尺度特征向量矩阵进行处理，并根据所述第一全连接层输出的结果计算第一尺度下的分类损失和三元损失；

将各个历史图像的特征图输入至所述瓶颈层，通过所述瓶颈层对各个图像的特征图进行处理，并将所述瓶颈层输出的各个图像的特征向量矩阵与各个历史图像的特征图对应相加，得到各个历史图像的第一融合特征向量矩阵，将各个历史图像的第一融合特征向量矩阵输入至第二全局平均池化层，通过所述第二全局平均池化层对各个历史图像的第一融合特征向量矩阵进行池化处理，得到各个历史图像的第二尺度特征向量矩阵；

将各个历史图像的第二尺度特征向量矩阵输入至第二全连接层，通过所述第二全连接层对各个历史图像的第二尺度特征向量矩阵进行处理，并根据所述第二全连接层输出的结果计算第二尺度下的分类损失和三元损失；

将所述瓶颈层输出的各个图像的特征向量与各个历史图像的第一融合特征向量矩阵相加，得到各个图像的第二融合特征向量矩阵，将各个历史图像的第二融合特征向量矩阵输入至第三全局平均池化层，通过所述第三全局平均池化层对各个历史图像的第二融合特征向量矩阵进行池化处理，得到各个历史图像的第三尺度特征向量矩阵；

将各个历史图像的第三尺度特征向量矩阵输入至第三全连接层，通过所述第三全连接层对各个历史图像的第三尺度特征向量矩阵进行处理，并根据所述第三全连接层输出的结果计算第三尺度下的分类损失和三元损失；

根据所述第一尺度下的分类损失和三元损失、所述第二尺度下的分类损失和三元损失、所述第三尺度下的分类损失和三元损失，确定多尺度下的总损失；

通过循环迭代的方式，基于总损失反向更新所述骨干网络与所述瓶颈层的参数，直至所述图像识别模型收敛时停止训练。

2.根据权利要求1所述的方法，其特征在于，对所述图像的特征图进行处理，得到所述图像的第一尺度特征向量矩阵包括：

将所述图像的特征图输入至第一全局平均池化层；

通过所述第一全局平均池化层对所述图像的特征图处理，得到所述图像的第一尺度特征向量矩阵。

3.根据权利要求1所述的方法，其特征在于，所述方法还包括：

将所述图像的特征图输入至所述瓶颈层，通过所述瓶颈层对所述图像的特征图进行处理，得到所述瓶颈层输出的特征向量矩阵；

将所述瓶颈层输出的特征向量矩阵和所述图像的特征图相加，得到所述图像的第一融合特征向量矩阵。

4. 根据权利要求3所述的方法，其特征在于，所述瓶颈层中包含第一卷积层、第二卷积层、第三卷积层，所述第一卷积层与所述第三卷积层的卷积核相同，所述第二卷积层与所述第三卷积层的卷积核不同；

通过所述瓶颈层对所述图像的特征图进行处理，得到所述瓶颈层输出的特征向量矩阵包括：

将所述图像的特征图输入至所述第一卷积层，通过所述第一卷积层对所述图像的特征图进行卷积处理，得到所述第一卷积层输出的特征向量矩阵；

将所述第一卷积层输出的特征向量矩阵输入至所述第二卷积层，通过所述第二卷积层对所述第一卷积层输出的特征向量矩阵进行卷积处理，得到所述第二卷积层输出的特征向量矩阵；

将所述第二卷积层输出的特征向量矩阵输入至所述第三卷积层，通过所述第三卷积层对所述第二卷积层输出的特征向量矩阵进行卷积处理，得到所述第三卷积层输出的特征向量矩阵。

5.根据权利要求1所述的方法，其特征在于，对所述图像的第一融合特征向量矩阵进行处理，得到所述图像的第二尺度特征向量矩阵包括：将所述图像的第一融合特征向量矩阵输入至第二全局平均池化层，通过所述第二全局平均池化层对所述图像的第一融合特征向量矩阵进行池化处理，得到所述图像的第二尺度特征向量矩阵；

对所述图像的第二融合特征向量矩阵进行处理，得到所述图像的第三尺度特征向量矩阵包括：将所述图像的第二融合特征向量矩阵输入至第三全局平均池化层，通过所述第三全局平均池化层对所述图像的第二融合特征向量矩阵进行池化处理，得到所述图像的第三尺度特征向量矩阵。

6.根据权利要求1所述的方法，其特征在于，根据所述特定对象的图像的多尺度特征向量矩阵和至少一个所述重识别对象的图像的多尺度特征向量矩阵，从至少一个所述重识别对象中定位目标对象包括：

根据所述特定对象的图像的多尺度特征向量矩阵和至少一个所述重识别对象的图像的多尺度特征向量矩阵，确定所述特定对象与各个重识别对象之间的相似度；

根据所述特定对象与各个重识别对象之间的相似度，从至少一个所述重识别对象中定位目标对象。

7.一种图像的多尺度特征处理装置，其特征在于，所述装置包括：

获取模块，用于获取图像的特征图，所述图像包括特定对象的图像和至少一个重识别对象的图像；

第一处理模块，用于对所述图像的特征图进行处理，得到所述图像的第一尺度特征向量矩阵；

第二处理模块，用于对所述图像的第一融合特征向量矩阵进行处理，得到所述图像的第二尺度特征向量矩阵，所述图像的第一融合特征向量矩阵是基于瓶颈层输出的特征向量矩阵和所述图像的特征图确定的；

第三处理模块，用于对所述图像的第二融合特征向量矩阵进行处理，得到所述图像的第三尺度特征向量矩阵，所述图像的第二融合特征向量矩阵是基于所述瓶颈层输出的特征向量矩阵和所述图像的第一融合特征向量矩阵确定的；

确定模块，用于根据所述图像的第一尺度特征向量矩阵、所述图像的第二尺度特征向量矩阵、以及所述图像的第三尺度特征向量矩阵，确定所述图像的多尺度特征向量矩阵；

循环模块，用于通过循环的方式，获取所述特定对象的图像的多尺度特征向量矩阵和至少一个所述重识别对象的图像的多尺度特征向量矩阵，根据所述特定对象的图像的多尺度特征向量矩阵和至少一个所述重识别对象的图像的多尺度特征向量矩阵，从至少一个所述重识别对象中定位目标对象；

在获取所述图像的特征图之前，所述图像的多尺度特征处理装置还用于：

8.一种电子设备，包括存储器、处理器以及存储在所述存储器中并且可在所述处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时实现如权利要求1至6中任一项所述方法的步骤。

9.一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1至6中任一项所述方法的步骤。