WO2021243947A1

WO2021243947A1 - 对象再识别方法及装置、终端和存储介质

Info

Publication number: WO2021243947A1
Application number: PCT/CN2020/126269
Authority: WO
Inventors: 葛艺潇; 陈大鹏; 朱烽; 赵瑞; 李鸿升
Original assignee: 商汤集团有限公司
Priority date: 2020-06-04
Filing date: 2020-11-03
Publication date: 2021-12-09
Also published as: CN111612100B; TWI780567B; KR20210151773A; JP2022548187A; TW202147156A; CN111612100A

Abstract

本公开实施例提供一种对象再识别方法、装置、存储介质及计算机设备，该方法包括获取预训练的再识别网络；获取待识别图像；通过所述再识别网络对所述待识别图像进行再识别处理，得到所述待识别图像中目标对象的再识别结果。其中，所述再识别网络的训练图像数据至少包括第一聚类图像数据以及非聚类实例图像数据，所述第一聚类图像数据和所述非聚类实例图像数据为由所述再识别网络对应的初始网络对第一图像数据集进行聚类处理得到，所述第一图像数据集中的图像数据不包含真实聚类标签。

Description

对象再识别方法及装置、终端和存储介质

相关申请的交叉引用

本公开基于申请号为202010499288.7、申请日为2020年06月04日的中国专利申请提出，并要求该中国专利申请的优先权，该中国专利申请的全部内容在此以全文引入的方式引入本公开。

技术领域

本公开涉及图像处理技术领域，尤其涉及一种对象再识别方法、装置、存储介质及计算机设备。

背景技术

近些年来，在人工智能领域，使用领域自适应策略来解决图像的识别、分类、检测等任务成为热点。应用例如对象(如行人、车辆等)的再识别(re-identification，re-ID)等。

相关技术中，通常采用伪标签(Pseudo-Labelling)技术实现跨领域的对象再识别，即通过对源域图像数据添加对应的真实标签，并使用源域图像数据对网络进行预训练，再使用预训练后的网络对目标域图像数据进行聚类生成伪标签，最后使用带有伪标签的图像数据对网络进行优化，得到最终的网络。

相关技术在对网络进行优化的情况下，仅用到目标域中带有伪标签的图像数据，而丢弃了不包含在聚类中的离群值，然而，离群值可能是困难但有价值的样本图像数据，从而限制了网络的聚类性能，进而可能对网络的聚类结果产生一定影响。

发明内容

本公开提供一种对象再识别方法、装置、存储介质及计算机设备。

本公开提供一种对象再识别方法，包括：获取预训练的再识别网络；获取待识别图像；通过所述再识别网络对所述待识别图像进行再识别处理，得到所述待识别图像中目标对象的再识别结果；其中，所述再识别网络的训练图像数据至少包括第一聚类图像数据以及非聚类实例图像数据，所述第一聚类图像数据和所述非聚类实例图像数据为由所述再识别网络对应的初始网络对第一图像数据集进行聚类处理得到，所述第一图像数据集中的图像数据不包含真实聚类标签。

这样，本公开实施例通过结合不在聚类中的离群值进行网络训练，有助于提高再识别网络的聚类性能，进而提高通过本公开的对象再识别方法得到的目标对象再识别结果的准确性。

在一个实施例中，所述再识别网络的训练图像数据还包括第二图像数据集，所述第二图像数据集中的第二聚类图像数据包含真实聚类标签；所述第二图像数据集所在的图像数据域与所述第一图像数据集所在的图像数据域不同。

这样，本公开实施例通过提供不包含真实聚类标签的第一聚类图像数据、非聚类实例图像数据以及包含真实聚类标签的第二聚类图像数据的监督，有助于提高再识别网络的聚类性能，进而提高通过本公开的对象再识别方法得到的目标对象再识别结果的准确性。

在一个实施例中，所述获取预训练的再识别网络之前，还包括：获取所述初始网络；获取所述训练图像数据；通过所述训练图像数据对所述初始网络进行训练，得到所述再识别网络。

这样，本公开实施例通过获取到的训练图像数据对初始网络进行训练，以得到再识别网络，能够提高再识别网络的图像分类和物体识别能力。

在一个实施例中，所述获取所述训练图像数据，包括：获取通过所述初始网络对所述第一图像数据集进行聚类处理得到的初始聚类结果；对所述初始聚类结果进行再聚类处理，得到所述第一聚类图像数据以及所述非聚类实例图像数据。

这样，对于本公开实施例对目标域图像数据进行处理的处理流程，可以理解为自定步长对比学习策略，即根据“由简入难”的原则，首先得到最可信的聚类，然后通过再聚类处理逐渐增加可信的聚类，从而提升学习目标的质量，通过增加可信聚类减小误差。

在一个实施例中，所述初始聚类结果包括初始聚类图像数据；所述对所述初始聚类结果进行再聚类处理，得到所述第一聚类图像数据以及所述非聚类实例图像数据，包括：根据图像特征距离，减少所述初始聚类图像数据中第一当前集群的图像数据数量，得到第二当前集群；确定所述第二当前集群的密集指数，所述密集指数为所述第二当前集群的图像数据数量与所述第一当前集群的图像数据数量的比值；在所述密集指数达到第一预设阈值的情况下，通过所述第二当前集群替换所述第一当前集群，得到所述第一聚类图像数据；将减少的图像数据更新为属于非聚类实例图像数据。

这样，通过评价聚类的密集性来进行再聚类处理，以逐渐增加可信的聚类，从而提升学习目标的质量，通过增加可信聚类减小误差。

在一个实施例中，所述初始聚类结果还包括初始非聚类图像数据；所述对所述初始聚类结果进行再聚类处理，得到所述第一聚类图像数据以及所述非聚类实例图像数据，包括：根据图像特征距离，在所述初始聚类图像数据的第三当前集群中增加其他集群的图像数据和/或所述初始非聚类图像数据中的图像数据，得到第四当前集群，所述其他集群为所述初始聚类图像数据中与所述第三当前集群不同的集群；确定所述第四当前集群的独立指数；所述独立指数为所述第三当前集群的图像数据数量与所述第四当前集群的图像数据数量的比值；在所述独立指数达到第一预设阈值的情况下，通过所述第四当前集群替换所述第三当前集群，得到所述第一聚类图像数据；在增加的图像数据包括所述其他集群的图像数据的情况下，解散所述其他集群；和/或，在增加的图像数据包括所述初始非聚类图像数据中的图像数据的情况下，将增加的图像数据更新为不属于非聚类实例图像数据。

这样，通过评价聚类的独立性来进行再聚类处理，可以逐步提高特征表示的识别率，将更多的非聚类数据加入到新的聚类中，以逐渐增加可信的聚类，从而提升学习目标的质量，通过增加可信聚类减小误差。

在一个实施例中，所述通过所述训练图像数据对所述初始网络进行训练，得到所述再识别网络，包括：基于所述训练图像数据确定图像数据中心；基于所述训练图像数据以及所述图像数据中心确定对比损失，基于所述对比损失对所述初始网络进行参数优化，得到优化网络；通过所述优化网络对所述训练图像数据中的非聚类实例图像数据进行聚类，根据聚类结果对所述第一聚类图像数据以及所述非聚类实例图像数据进行更新，得到新的训练图像数据；基于所述新的训练图像数据确定新的图像数据中心，返回基于所述新的训练图像数据以及所述新的图像数据中心确定新的对比损失的步骤，直至训练完成，得到所述再识别网络。

这样，本公开实施例通过动态优化网络、更新训练数据、更新图像数据中心，从而能够提供提高再识别网络的训练性能，进而提高通过本公开的对象再识别方法得到的目标对象再识别结果的准确性。

在一个实施例中，所述图像数据中心包括所述第一聚类图像数据对应的第一聚类中心以及所述非聚类实例图像数据对应的实例中心；或者，所述图像数据中心包括所述第一聚类图像数据对应的第一聚类中心、所述非聚类实例图像数据对应的实例中心以及所述第二聚类图像数据对应的第二聚类中心。

这样，既可以通过无监督学习进行网络训练，又可以引入第二聚类图像数据采用半监督学习进行训练，提供了网络训练的灵活性和多样性。

在一个实施例中，所述再识别网络包括残差网络。

这样，由于残差网络是由残差块(Residual block)组成的网络，网络内部的残差块使用跳跃连接，有助于解决梯度消失和梯度***问题，使得残差网络具备容易优化的特点，同时又能提高图像分类和物体识别性能。

本公开提供一种对象再识别装置，包括：网络获取模块，配置为获取预训练的再识别网络；图像获取模块，配置为获取待识别图像；再识别模块，配置为通过所述再识别网络对所述待识别图像进行再识别处理，得到所述待识别图像中目标对象的再识别结果；其中，所述再识别网络的训练图像数据至少包括第一聚类图像数据以及非聚类实例图像数据，所述第一聚类图像数据和所述非聚类实例图像数据为由所述再识别网络对应的初始网络对第一图像数据集进行聚类处理得到，所述第一图像数据集中的图像数据不包含真实聚类标签。

本公开提供一种计算机设备，包括：存储器，处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述处理器执行所述程序时实现上述对象再识别方法。

本公开提供一种计算机可读存储介质，所述计算机可读存储介质中存储有计算机执行指令，所述计算机执行指令被处理器执行时配置为实现上述对象再识别方法。

本公开实施例提供了一种计算机程序产品，其中，上述计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质，上述计算机程序可操作来使计算机执行如本公开实施例对象再识别方法中所描述的部分或全部步骤。该计算机程序产品可以为一个软件安装包。

应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，而非限制本公开实施例。

根据下面参考附图对示例性实施例的详细说明，本公开的其它特征及方面将变得清楚。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本公开的实施例，并与说明书一起用于解释本公开的原理。

图1为本公开实施例中通过网络训练得到再识别网络的示意图；

图2为本公开实施例中对目标域图像数据进行处理的示意图；

图3为本公开实施例中对初始聚类结果进行再聚类处理，得到第一聚类图像数据以及非聚类实例图像数据的示意图；

图4为本公开实施例中计算密集指数的示例图；

图5为本公开实施例中对初始聚类结果进行再聚类处理，得到第一聚类图像数据以及非聚类实例图像数据的示意图；

图6为本公开实施例中计算独立指数的示例图；

图7为本公开实施例中通过训练图像数据对初始网络进行训练，得到再识别网络的示意图；

图8为本公开实施例中通过再识别网络进行对象再识别的示意图；

图9为本公开实施例中进行再识别网络训练的方法示意图；

图10a为本公开实施例一种再聚类处理的方法示意图；

图10b为本公开实施例另一种再聚类处理的方法示意图；

图11为本公开实施例中再识别网络训练装置的示意图；

图12为本公开实施例中对象再识别装置的示意图。

通过上述附图，已示出本公开明确的实施例，后文中将有更详细的描述。这些附图和文字描述并不是为了通过任何方式限制本公开构思的范围，而是通过参考特定实施例为本领域技术人员说明本公开的概念。

具体实施方式

为使本公开实施例的目的、技术方案和优点更加清楚，下面将结合本公开实施例中的附图，对本公开实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本公开一部分实施例，而不是全部的实施例。基于本公开中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本公开保护的范围。

在本公开实施例中使用的术语是仅仅出于描述特定实施例的目的，而非旨在限制本公开。在本公开实施例中所使用的单数形式的“一种”和“该”也旨在包括多数形式，除非上下文清楚地表示其他含义。

应当理解，本文中使用的术语“和/或”仅仅是一种描述关联对象的关联关系，表示可以存在三种关系，例如，A和/或B，可以表示：单独存在A，同时存在A和B，单独存在B这三种情况。另外，本文中字符“/”，一般表示前后关联对象是一种“或”的关系。

取决于语境，如在此所使用的词语“如果”、“若”可以被解释成为“在……时”或“当……时”或“响应于确定”或“响应于检测”。类似地，取决于语境，短语“如果确定”或“如果检测(陈述的条件或事件)”可以被解释成为“当确定时”或“响应于确定”或“当检测(陈述的条件或事件)时”或“响应于检测(陈述的条件或事件)”。

还需要说明的是，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的商品或者***不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种商品或者***所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的商品或者***中还存在另外的相同要素。

人工智能(Artificial Intelligence，AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能，感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用***。换句话说，人工智能是计算机科学的一个综合技术，它企图了解智能的实质，并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法，使机器具有感知、推理与决策的功能。

人工智能技术是一门综合学科，涉及领域广泛，既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互***、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术以及机器学习/深度学习等几大方向。

计算机视觉技术(Computer Vision，CV)一门研究如何使机器“看”的科学，在本公开的一些实施例中，就是指用摄影机和电脑代替人眼对目标进行识别、跟踪和测量等机器视觉，并做图形处理，使电脑处理成为更适合人眼观察或传送给仪器检测的图像。作为一个科学学科，计算机视觉研究相关的理论和技术，试图建立能够从图像或者多维数据中获取信息的人工智能***。计算机视觉技术通常包括图像处理、图像识别、图像语义理解、图像检索、OCR(Optical Character Recognition，光学字符识别)、视频处理、视频语义理解、视频内容/行为识别、三维物体重建、3D(three dimensional，三维)技术、虚拟现实、增强现实、同步定位与地图构建等技术，还包括常见的人脸识别、指纹识别等生物特征识别技术。

机器学习(Machine Learning，ML)是一门多领域交叉学科，涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为，以获取新的知识或技能，重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心，是使计算机具有智能的根本途径，其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、示教学习等技术。

目标再识别是计算机视觉以及安防监控领域的重要问题，要求从数据集中检索出对应目标的图像，该目标可以为行人、车辆等。然而在直接将训练好的网络应用于不同的监控场景的情况下，网络表现出无法避免的性能下降，这是图像领域间的差异所导致的，如摄像环境、光线、背景、拍摄设备等等。另外，针对每个监控场景标注不同的训练数据用于网络训练是不现实的，因为标注需要耗费大量的人力和时间。

目前在针对不同领域自适应(Domain Adaptation，迁移学习的一种)的目标再识别的方法中，基于伪标签的方法是一种常用方法。该方法旨在通过在无标注的目标域上不断地聚类以生成伪标签来进行自我训练，可以取得最先进的性能。然而，由于聚类的过程会产生一定的异常点，即无法分入任何一类的边缘样本，相关方法为了确保聚类的质量，均直接丢弃这些异常点，不将其归入训练集，即在网络进行自我训练的过程中仅用到目标域中带有伪标签的图像数据，而丢弃了不包含在聚类中的离群值，然而，离群值可能是困难但有价值的样本图像数据，从而限制了网络的聚类性能，进而可能对网络的聚类结果产生一定影响。

基于此，本公开提出一种对象再识别方法，该方法所使用的再识别网络为至少基于第一聚类图像数据以及非聚类实例图像数据训练得到，从而，本公开通过结合不在聚类中的离群值进行网络训练，有助于提高再识别网络的聚类性能，进而提高通过本公开的对象再识别方法得到的目标对象再识别结果的准确性。

在本公开实施例中提出的对象再识别方法可分为两部分，包括网络训练部分和网络应用部分；其中，网络训练部分涉及到机器学习这一技术领域，在网络训练部分中，通过机器学习这一技术训练初始网络以得到训练好的再识别网络；在网络应用部分中，通过使用在网络训练部分训练得到的再识别网络，获得待识别图像中目标对象的再识别结果。

为了便于理解，首先对本公开方案中的网络训练部分进行解释说明。

可以理解，本公开中网络训练部分的方法步骤可以由终端或者服务器实现。

图1为本公开实施例中通过网络训练得到再识别网络的示意图，如图1所示，该处理流程包括以下步骤：

S100、获取初始网络；

S200、获取训练图像数据；

S300、通过训练图像数据对初始网络进行训练，得到再识别网络。

其中，初始网络为初始待训练的网络，该初始网络具备一定的对象再识别能力。

其中，初始网络可以是例如残差网络(Residual Network，ResNet)等，残差网络是由残差块(Residual block)组成的网络，网络内部的残差块使用跳跃连接，有助于解决梯度消失和梯度***问题，使得残差网络具备容易优化的特点，同时又提高了图像分类和物体识别性能。

在一些实施例中，网络训练方法可以采用无监督学习。无监督学习是指仅使用目标域中无标注的图像数据进行网络训练的处理过程，所述目标域可以是第一监控场景。

在采用无监督学习进行网络训练的情况下，再识别网络的训练图像数据包括第一聚类图像数据以及非聚类实例图像数据。其中，第一聚类图像数据和非聚类实例图像数据为由再识别网络对应的初始网络对第一图像数据集进行聚类处理得到，第一图像数据集中的图像数据不包含真实聚类标签，第一图像数据集对应目标域的图像数据。

在一些实施例中，网络训练方法可以采用半监督学习。半监督学习是指同时使用源域中有标注的图像数据以及目标域中无标注的图像数据进行网络训练的处理过程，所述源域可以是第二监控场景。源域中有标注的图像数据带有ground-truth(真值)标签，ground-truth可以是采用人工标记，ground-truth可以在网络训练过程中提供有价值的监督。

其中，在采用半监督学习进行网络训练的情况下，再识别网络的训练图像数据至少包括第一聚类图像数据、非聚类实例图像数据以及第二图像数据集。

其中，第一聚类图像数据和非聚类实例图像数据为由再识别网络对应的初始网络对第一图像数据集进行聚类处理得到，第一图像数据集中的图像数据不包含真实聚类标签，第一图像数据集对应目标域的图像数据。

第二图像数据集中的第二聚类图像数据包含真实聚类标签，第二图像数据集对应源域的图像数据；第二图像数据集所在的图像数据域与第一图像数据集所在的图像数据域不同。

在一个实施例中，在采用半监督学习进行网络训练的情况下，获取训练图像数据的步骤包括获取有标注的源域图像数据、获取无标注的目标域图像数据以及对目标域图像数据进行处理的步骤。

其中，获取源域图像数据时，可以是直接获取已完成标注的图像数据即可。

在一些实施例中，在采用无监督学习进行网络训练的情况下，获取训练图像数据的步骤包括获取无标注的目标域图像数据以及对目标域图像数据进行处理的步骤。

图2为对目标域图像数据进行处理的示意图，如图2所示，该处理流程包括以下步骤：

S220、获取通过初始网络对第一图像数据集进行聚类处理得到的初始聚类结果；

S240、对初始聚类结果进行再聚类处理，得到第一聚类图像数据以及非聚类实例图像数据。

其中，第一图像数据集对应目标域图像数据。在获取无标注的目标域图像数据后，首先通过初始网络对第一图像数据集进行初始聚类处理，得到第一图像数据集对应的初始聚类结果，然后，再对初始聚类结果进行再聚类处理，得到第一聚类图像数据以及非聚类实例图像数据。

其中，对于以上对目标域图像数据进行处理的处理流程，可以理解为自定步长对比学习策略，即根据“由简入难”的原则，首先得到最可信的聚类，然后通过再聚类处理逐渐增加可信的聚类，从而提升学习目标的质量，通过增加可信聚类减小误差。

在一个实施例中，提供一种聚类可信度评价准则，该准则通过评价聚类的密集性来对初始聚类结果进行再聚类处理，从而增加可信的聚类数量。

本实施例中，初始聚类结果包括初始聚类图像数据；

图3为本公开实施例中对初始聚类结果进行再聚类处理，得到第一聚类图像数据以及非聚类实例图像数据的示意图，如图3所示，该处理流程包括以下步骤：

S242A，根据图像特征距离，减少初始聚类图像数据中第一当前集群的图像数据数量，得到第二当前集群；

S244A，确定第二当前集群的密集指数，密集指数为第二当前集群的图像数据数量与第一当前集群的图像数据数量的比值；

S246A，在密集指数达到第一预设阈值的情况下，通过第二当前集群替换第一当前集群，得到第一聚类图像数据；

S248A，将减少的图像数据更新为属于非聚类实例图像数据。

本实施例通过提高聚类标准来进行再聚类处理，以验证聚类的密集性是否达到预设要求。

对于归为同一聚类中的各图像数据，可以理解为各图像数据的图像特征距离满足聚类标准，即△d≤d1，其中，△d为图像特征距离，d1为聚类标准对应的距离。

在提高聚类标准(减小聚类标准对应的距离)后，例如聚类标准变为d2，且d2<d1，则可能出现部分图像数据的图像特征距离大于聚类标准的情况，即△d>d2，此时，根据图像特征距离保留△d≤d2的图像数据，并将△d>d2的图像数据从第一当前集群中剔除，第一当前集群中的图像数据数量减少，得到新的第二当前集群。

在得到第二当前集群后，计算第二当前集群的密集指数，该密集指数用于评价聚类的密集性。密集指数可以通过以下公式计算得到：P＝n2/n1，其中，P为密集指数，n1为第一当前集群的图像数据数量，n2为第二当前集群的图像数据数量。

图4为计算密集指数的示例图，如图4所示，圆点表示图像数据，黑色圆点表示保留的图像数据，白色圆点表示被剔除的图像数据，实线区域表示第一当前集群clu1，虚线区域表示第二当前集群clu2，根据图4可以看出，第一当前集群clu1的图像数据数量为7，第二当前集群clu2的图像数据数量为5，则第二当前集群clu2的密集指数P为：P＝n2/n1＝5/7。

在计算得到密集指数P后，将密集指数P与相应的第一预设阈值△P进行比较，根据比较结果确定是否保留新的集群(即第二当前集群)。

其中，在P≥△P的情况下，说明第二当前集群clu2的密集指数P达到预设密集性要求，此时，解散第一当前集群，保留第二当前集群，并使用第二当前集群对第一聚类图像数据进行更新。同时，对于集群中减少(被剔除)的图像数据，将该图像数据更新为属于非聚类实例图像数据。例如，参考图4，在P为5/7，△P为0.5的情况下，P>△P，此时，通过第二当前集群替换第一当前集群，对第一聚类图像数据进行更新。

在P<△P的情况下，说明第二当前集群clu2的密集指数P未达到预设密集性要求，此时，解散第二当前集群，保留第一当前集群。

本实施例通过评价聚类的密集性来进行再聚类处理，以逐渐增加可信的聚类，从而提升学习目标的质量，通过增加可信聚类减小误差。

在一个实施例中，提供一种聚类可信度评价准则，该准则通过评价聚类的独立性来对初始聚类结果进行再聚类处理，从而增加可信的聚类数量。

本实施例中，初始聚类结果包括初始聚类图像数据以及初始非聚类图像数据。

图5为本公开实施例中对初始聚类结果进行再聚类处理，得到第一聚类图像数据以及非聚类实例图像数据的示意图，如图5所示，该处理流程包括以下步骤：

S242B，根据图像特征距离，在初始聚类图像数据的第三当前集群中增加其他集群的图像数据和/或初始非聚类图像数据中的图像数据，得到第四当前集群，其他集群为初始聚类图像数据中与第三当前集群不同的集群；

S244B，确定第四当前集群的独立指数；独立指数为第三当前集群的图像数据数量与第四当前集群的图像数据数量的比值；

S246B，在独立指数达到第一预设阈值的情况下，通过第四当前集群替换第三当前集群，得到第一聚类图像数据；

S248B，在增加的图像数据包括其他集群的图像数据的情况下，解散其他集群；和/ 或，在增加的图像数据包括初始非聚类图像数据中的图像数据的情况下，将增加的图像数据更新为不属于非聚类实例图像数据。

本实施例通过降低聚类标准来进行再聚类处理，以验证聚类的独立性是否达到预设要求。

在降低聚类标准(增大聚类标准对应的距离)后，例如聚类标准变为d3，且d3>d1，则可能出现非当前集群的图像数据(例如其他集群的图像数据和/或初始非聚类图像数据中的图像数据)的图像特征距离达到聚类标准的情况，即△d'≤d3，其中，△d'为非当前集群的图像数据的图像特征距离。

此时，根据图像特征距离将△d'≤d3的非当前集群图像数据添加至第三当前集群，第三当前集群中的图像数据数量增加，得到新的第四当前集群。

可以理解，增加的图像数据，可以是仅包括符合要求的其他集群的图像数据，可以是仅包括符合要求的初始非聚类图像数据中的图像数据，还可以是同时包括符合要求的其他集群的图像数据以及初始非聚类图像数据中的图像数据。

在得到第四当前集群后，计算第四当前集群的独立指数，该独立指数用于评价聚类的独立性。独立指数可以通过以下公式计算得到：Q＝n3/n4，其中，Q为独立指数，n3为第三当前集群的图像数据数量，n4为第四当前集群的图像数据数量。

图6为计算独立指数的示例图，如图6所示，实线区域表示再聚类之前已有的聚类集群，即初始聚类图像数据中的集群，包括第三当前集群clu3以及其他集群clui，圆点表示图像数据，黑色圆点表示初始聚类图像数据中的图像数据，白色圆点表示初始非聚类图像数据中的图像数据，虚线区域表示第四当前集群clu4，根据图6可以看出，第三当前集群clu3的图像数据数量为2，第四当前集群clu4的图像数据数量为7，则第四当前集群clu4的独立指数Q为：Q＝n3/n4＝2/7。

在计算得到独立指数Q后，将独立指数Q与相应的第二预设阈值△Q进行比较，根据比较结果确定是否保留新的集群(即第四当前集群)。

其中，在Q≥△Q的情况下，说明第四当前集群clu4的独立指数Q达到预设独立性要求，此时，解散第三当前集群，保留第四当前集群，并使用第四当前集群对第一聚类图像数据进行更新。

其中，在增加的图像数据包括其他集群的图像数据的情况下，解散其他集群，例如，在第四当前集群clu4的独立指数Q达到预设独立性要求的情况下，解散其他集群clui(i为表示集群标号的整数)。

其中，在增加的图像数据包括初始非聚类图像数据中的图像数据的情况下，将增加的图像数据更新为不属于非聚类实例图像数据。

在Q<△Q的情况下，说明第四当前集群clu4的独立指数Q未达到预设独立性要求，此时，解散第四当前集群，保留第三当前集群。

其中，在增加的图像数据包括其他集群的图像数据的情况下，保留其他集群，例如，在第四当前集群clu4的独立指数Q未达到预设独立性要求的情况下，保留其他集群clui。

其中，在增加的图像数据包括初始非聚类图像数据中的图像数据的情况下，将增加的图像数据更新为属于非聚类实例图像数据。

例如，参考图6，在Q为2/7，△Q为0.5的情况下，Q<△P，此时，解散第四当前集群clu4，保留第三当前集群clu3以及其他集群clui，同时，增加的未聚类图像数据更新为属于非聚类实例图像数据。

本实施例通过评价聚类的独立性来进行再聚类处理，可以逐步提高特征表示的识别率，将更多的非聚类数据加入到新的聚类中，以逐渐增加可信的聚类，从而提升学习目标的质量，通过增加可信聚类减小误差。

在一个实施例中，提供一种聚类可信度评价准则，该准则通过评价聚类的独立性以及密集性来对初始聚类结果进行再聚类处理，从而增加可信的聚类数量。

关于通过独立性以及密集性来对初始聚类结果进行再聚类处理的处理流程，可以参考上述实施例中的分别通过评价聚类的独立性来进行再聚类处理以及通过评价聚类的密集性来进行再聚类处理的处理步骤，在此不再赘述。

其中，在同时结合独立性以及密集性进行再聚类处理的情况下，对应的预设阈值可以根据实际情况设置，例如，设定△P和△Q都为0.5等。

本实施例通过评价聚类的独立性以及密集性来进行再聚类处理，以逐渐增加可信的聚类，从而提升学习目标的质量，通过增加可信聚类减小误差。

在一个实施例中，对网络训练的处理步骤进行解释说明。

图7为本公开实施例中通过训练图像数据对初始网络进行训练，得到再识别网络的示意图，如图7所示，该处理流程包括以下步骤：

S320、基于训练图像数据确定图像数据中心；

S340、基于训练图像数据以及图像数据中心确定对比损失，基于对比损失对初始网络进行参数优化，得到优化网络；

S360、通过优化网络对训练图像数据中的非聚类实例图像数据进行聚类，根据聚类结果对第一聚类图像数据以及非聚类实例图像数据进行更新，得到新的训练图像数据；

S380、基于新的训练图像数据确定新的图像数据中心，返回基于新的训练图像数据以及新的图像数据中心确定新的对比损失的步骤，直至训练完成，得到再识别网络。

在一些实施例中，在采用无监督学习进行网络训练的情况下，训练数据包括第一聚类图像数据以及非聚类实例图像数据，对应的，图像数据中心包括第一聚类图像数据对应的第一聚类中心以及非聚类实例图像数据对应的实例中心。

在一些实施例中，在采用半监督学习进行网络训练的情况下，训练数据包括第一聚类图像数据、非聚类实例图像数据以及第二聚类图像数据。对应的，图像数据中心包括第一聚类图像数据对应的第一聚类中心、非聚类实例图像数据对应的实例中心以及第二聚类图像数据对应的第二聚类中心。

其中，以采用半监督学习进行网络训练为例进行解释说明。

(1)首先基于获取的训练图像数据确定初始的图像数据中心。

在基于第一聚类图像数据确定对应的第一聚类中心的情况下，对于第一聚类图像数据中的每个聚类，可以使用各聚类中图像数据的平均特征向量作为各聚类对应的第一聚类中心。可以理解，在第一聚类图像数据包括多个聚类的情况下，第一聚类中心的数量对应为多个。

在基于非聚类实例图像数据确定对应的实例中心的情况下，对于非聚类实例图像数据中的每个单独实例，各单独实例对应的特征向量即为各单独实例的实例中心。可以理解，在非聚类实例图像数据包括多个单独实例的情况下，实例中心的数量对应为多个。

在基于第二聚类图像数据确定对应的第二聚类中心的情况下，对于第二聚类图像数据中的每个聚类，可以使用各聚类中图像数据的平均特征向量作为各聚类对应的第二聚类中心。可以理解，在第二聚类图像数据包括多个聚类的情况下，第二聚类中心的数量对应为多个。

(2)基于训练图像数据以及图像数据中心确定对比损失，基于对比损失对初始网络进行参数优化，得到优化网络。

其中，定义X ^s表示第二图像数据集中的第二聚类图像数据(即源域数据)，X ^t表示第一图像数据集(即目标域数据)，

表示第一聚类图像数据，

表示非聚类实例图像数据，则

对于特征向量

可以通过以下公式(1)计算对比损失，并基于对比损失对初始网络进行参数优化，得到优化网络：

其中，τ设定为0.05，<a，b>表示a、b两个特征向量之间的内积，用于度量特征向量的相似性，n ^s表示第二聚类图像数据中聚类的数量，

表示第一聚类图像数据中聚类的数量，

表示非聚类实例图像数据中单独实例的数量，w _k表示第二聚类图像数据对应的第二聚类中心，c _k表示第一聚类图像数据对应的第一聚类中心，v _k表示非聚类实例图像数据对应的实例中心。

另外，Z ⁺表示特征向量f对应的数据中心，例如，在f＝fθ(x),x∈X ^S的情况下，Z ⁺＝w _k；在

的情况下，Z ⁺＝c _k；在

的情况下，Z ⁺＝v _k。

(3)在得到优化网络后，通过优化网络对非聚类实例图像数据进行聚类，根据聚类结果对第一聚类图像数据以及非聚类实例图像数据进行更新。

其中，在本公开的处理过程中，可以使用混合内存(hybrid memory)保存第一聚类图像数据、非聚类实例图像数据以及第二聚类图像数据，以及，第一聚类图像数据对应的第一聚类中心、非聚类实例图像数据对应的实例中心以及第二聚类图像数据对应的第二聚类中心。

可以理解，在每次迭代中，每次处理的特征向量都参与混合内存的更新。

在使用优化网络进行聚类的过程中，由于会出现新的聚类结果，所以会导致第一聚类图像数据以及非聚类实例图像数据的更新变化，即得到新的训练图像数据。在得到新的训练图像数据后，根据其更新变化对混合内存进行更新即可。

(4)在得到新的训练图像数据后，基于新的训练图像数据确定新的图像数据中心，即对混合内存中保存的图像数据中心进行更新和调整。

可以理解，对于第二聚类中心的更新，可以是在原中心的基础上进行调整；而对于第一聚类中心以及实例中心的更新，则是根据第一聚类图像数据以及非聚类实例图像数据的更新变化重新计算。

其中，第二聚类中心w _k的更新可以通过以下公式(2)实现：

其中，β _k为当前处理中属于第二聚类图像数据的特征，m ^s∈[0,1]为更新第二聚类中心的动量系数，例如，m ^s可以设置为0.2。

第一聚类中心c _k的更新可以通过以下公式(3)实现：

其中，Ι _k为第一聚类图像数据中的第k个聚类集群，|Ι _k|表示集群中的特征数量。

实例中心v _k的更新可以通过以下公式(4)实现：

其中，m ^t∈[0,1]为更新实例中心的动量系数，例如，m ^t可以设置为0.2。给定非聚类实例图像数据中的图像数据，在通过优化网络确定该图像数据属于第k个聚类集群的情况下，则使用第一聚类中心c _k的更新公式更新第一聚类中心c _k。

(5)在对混合内存进行更新后，返回步骤(2)进行网络迭代训练，直至网络收敛，即得到再识别网络。

在一个实施例中，在采用无监督学习进行网络训练的情况下，除了训练图像数据不包括第二聚类图像数据，图像数据中心不包括第二聚类图像数据对应的第二聚类中心之外，其原理与采用半监督学习进行网络训练的原理类似，在此不再赘述。

在一个实施例中，对本公开方案中的网络应用部分进行解释说明。

可以理解，本公开中网络应用部分的方法步骤可以由终端或者服务器实现，网络应用部分的方法步骤的执行主体可以与网络训练部分的方法步骤的执行主体相同或不同。

图8为本公开实施例中通过再识别网络进行对象再识别的示意图，如图8所示，该处理流程包括以下步骤：

S400、获取预训练的再识别网络；

S500、获取待识别图像；

S600、通过再识别网络对待识别图像进行再识别处理，得到待识别图像中目标对象的再识别结果；

其中，再识别网络为通过本公开以上各实施例中网络训练部分的方法步骤训练得到。

在通过无监督学习训练得到再识别网络的情况下，再识别网络的训练图像数据至少包括第一聚类图像数据以及非聚类实例图像数据，第一聚类图像数据和非聚类实例图像数据为由再识别网络对应的初始网络对第一图像数据集进行聚类处理得到，第一图像数据集中的图像数据不包含真实聚类标签。

其中，在通过半监督学习训练得到再识别网络的情况下，再识别网络的训练图像数据还包括第二图像数据集，第二图像数据集中的第二聚类图像数据包含真实聚类标签；第二图像数据集所在的图像数据域与第一图像数据集所在的图像数据域不同。

本实施例提供一种对象再识别方法，该方法所使用的再识别网络为至少基于第一聚类图像数据以及非聚类实例图像数据训练得到，从而，本公开通过结合不在聚类中的离群值进行网络训练，有助于提高再识别网络的聚类性能，进而提高通过本公开的对象再识别方法得到的目标对象再识别结果的准确性。

目标再识别是计算机视觉以及安防监控领域的重要问题，要求从数据集中检索出对应目标的图片，该目标可以为行人、车辆等。然而在直接将训练好的模型应用于不同的监控场景的情况下，模型表现出无法避免的性能下降，这是由于领域间的差异，如摄像环境、光线、背景、拍摄设备等等。另外，针对每个监控场景标注不同的训练数据用于网络训练是不现实的，因为标注需要耗费大量的人力和时间。

无监督领域自适应问题旨在将源域上利用有标注的数据训练好的模型迁移到无标注的目标域上，使其在目标域上可以学习到有辨别力的特征，从而有效地进行目标再识别，所述源域可以是监控场景A，所述目标域可以是监控场景B。由于源域与目标域的目标身份不重合，目标再识别的无监督领域自适应问题是一类开放集的问题，所述目标可以是行人或车辆等。

纯无监督问题旨在无需任何有标注的数据而能够学习到有辨别力的特征，即无需源域的有标注的数据辅助而能够直接以无监督的方式在目标域上有效地进行目标再识别。

目前在针对无监督或无监督领域自适应的目标再识别的方法中，基于伪标签的方法最为有效。该类方法旨在在无标注的目标域上通过不断地聚类以生成伪标签来进行自我训练，可以取得最先进的性能。但该类方法存在以下几个缺陷，限制了他们的性能提升：第一，由于聚类的过程会产生一定的聚类异常样本，即无法分入任何一类的边缘样本，已有的方法为了确保聚类的质量，均直接丢弃这些聚类异常样本，不将其归入训练集。然而，这些聚类异常样本可以被视作有价值的困难样本，应该进行学习；第二，基于聚类的无监督领域自适应算法往往利用源域的数据进行预训练，再将训练好的模型读入，并通过聚类生成的伪标签及无标注的目标域样本进行训练，从而迁移到目标域。该算法在目标域的训练过程中丢弃了有价值的源域数据，浪费了源域上具有真实标签的数据，使得源域性能丢失。第三，在无监督领域自适应的目标再识别问题上识别度欠缺，其中无监督目标再识别问题不曾被探索。第四，相关的对比学习损失函数只考虑实例级监督。

本公开实施例提供一种在无监督目标再识别上的自步对比学习方法，提供一个统一的对比学习框架用以同时在源域和目标域上对所有的样本进行特征学习，该框架通过动态更新一个混合记忆模块，从而同时提供源域真实的类级、目标域的聚类级以及目标域未聚类的实例级的监督。

本公开实施例提出一种自步对比学习策略以及一个新颖的聚类可信度评价准则，以通过可信的聚类减小训练误差。该策略可以逐渐生成更多的可信聚类以提升特征学习，从而获得更有效的特征帮助聚类。

本公开实施例提出的方法在无监督领域自适应的行人及车辆再识别问题上达到先进的识别度，并且可以在无需人力标注的情况下有效提升源域性能。本公开实施例的方法可以简单的推广到无监督的目标再识别问题上，即通过去除训练中的源域数据以及源域类级的监督，性能比相关方法显著提升。

本公开实施例提出的统一对比学习框架包括一个基于卷积神经网络的图像编码器，以及混合记忆模块，该混合记忆模块通过图像编码器输出的图像特征进行动态更新，并且实时提供源域类级、目标域聚类级以及目标域未聚类的实例级的监督。具体来说，混合记忆模块将源域类质心、目标域聚类质心、目标域未聚类的示例特征作为监督。其中，源域编码特征用以直接更新源域类质心，而目标域编码特征用以更新实例级特征，目标域聚类质心由更新的示例特征实时计算。

本公开实施例提出的自步对比学习策略本着“由简入难”的原则，通过先学习最可信的聚类，再逐渐增加可信的聚类，来提升学习目标的质量，从而通过增加可信的聚类减小误差。该策略提供了一种聚类可信度评价准则，通过评价聚类的独立性与紧密性来选择最可信的聚类进行保留，其余聚类将退回为无聚类的样本，以提供实例级监督。

该统一对比学习框架的训练步骤主要以下两步，并不断交替执行：

通过聚类以及聚类可信度评价准则，将无标注的目标域样本分为聚类集和非聚类集两部分，分别提供聚类级和非聚类的示例级监督。

在混合记忆模块提供的源域类级、目标域聚类级以及目标域未聚类的实例级的监督基础上，通过提出的统一对比学习损失进行训练，从而优化图像编码器；图像编码器产生的图像特征用以动态更新混合记忆模块，其中源域图像以类为单位进行更新，而目标域图像以实例为单位进行更新。

本公开实施例提出一种统一对比学习框架，通过同时学习源域和目标域所有训练样本，可以获得先进的性能；本公开实施例还提出一种自步学习策略，提供了一种聚类可信度评价准则，以通过可信的聚类减小训练误差；在领域自适应学习过程中，可以同时提升源域性能；通过统一对比学习损失函数同时提供了类级、聚类级、实例级的监督；在行人再识别、车辆再识别的无监督领域自适应问题上达到了更先进的识别效果；可以更有效地利用无标注的目标域数据进行训练，以提升有标注的源域性能；通过用无标注数据扩充训练集以提升训练性能。

可以利用本公开实施例算法的图像编码器，提取目标图像的特征信息；可以利用本公开实施例算法提取的特征，对安防监控场景下的行人或车辆进行检索；可以利用本公开实施例算法，在无监督的情况下提升图像编码器的能力。

图9为本公开实施例提供的一种采用半监督学习进行再识别网络训练的方法示意图，参见图9，所述再识别网络的训练方法包括以下步骤：

步骤S901：获取残差网络(初始网络)901；

步骤S902：从混合内存902中获取第一图像数据集9021和第二图像数据集9022，所述第一图像数据集9021中包括无标注的目标域图像数据X ^t，所述第二图像数据集9022中包括包含真实聚类标签的源域图像数据X ^s，所述源域图像数据又称第二聚类图像数据；

步骤S903：通过所述残差网络901对所述第一图像数据集中的目标域图像数据X ^t进行聚类处理得到初始聚类结果，所述初始聚类结果包括初始聚类图像数据和初始非聚类图像数据；

步骤S904：对所述初始聚类结果进行再聚类处理，得到所述第一聚类图像数据以及所述非聚类实例图像数据；

步骤S905：基于所述训练图像数据确定图像数据中心；

其中，所述训练图像数据包括所述第一聚类图像数据、所述非聚类实例图像数据、所述第二聚类图像数据；所述图像数据中心包括所述第一聚类图像数据对应的第一聚类中心、所述非聚类实例图像数据对应的实例中心以及所述第二聚类图像数据对应的第二聚类中心，可以将确定出的所述第一聚类中心、所述第二聚类中心和所述实例中心均保存在混合内存902中。

在一些实施例中，步骤S905可以包括以下步骤：

步骤S9051：基于所述训练图像数据以及所述图像数据中心确定对比损失，基于所述对比损失对所述残差网络901进行参数优化，得到优化网络；

步骤S9052：通过所述优化网络对所述训练图像数据中的非聚类实例图像数据进行聚类，根据聚类结果对所述混合内存902中的第一聚类图像数据以及所述非聚类实例图像数据进行更新，得到新的训练图像数据f ^s和f ^t，所述f ^s中包括第二聚类图像数据，所述f ^t中包括更新后的第一聚类图像数据以及所述非聚类实例图像数据；

步骤S9053：基于所述新的训练图像数据确定新的图像数据中心，返回基于所述新的训练图像数据以及所述新的图像数据中心确定新的对比损失的步骤，直至训练完成，得到所述再识别网络。

其中，可以根据新的训练数据f ^s和f ^t对混合内存902进行更新。

在一些实施例中，步骤S904中对所述初始聚类结果进行再聚类处理，可以参见图 10a，可以包括以下步骤：

步骤S9041：根据图像特征距离，减少所述初始聚类图像数据中第一当前集群的图像数据数量，得到第二当前集群；

参见图10a，圆点可以表示图像数据，白色圆点可以表示初始聚类图像数据，灰色圆点可以表示初始非聚类图像数据；假设图像特征距离由d1变为d2，且d2<d1，此时由于第一当前集群101a中的图像数据1011a和图像数据1012a的图像特征距离大于d2，被从第一当前集群101a中剔除，第一当前集群101a中的图像数据减少，得到新的第二当前集群102a。

步骤S9042：确定所述第二当前集群的密集指数，所述密集指数为所述第二当前集群的图像数据数量与所述第一当前集群的图像数据数量的比值；

参见图10a，第二当前集群中的图像数据数量为5，第一当前集群中的图像数据数量为7，则第二当前集群的密集指数为5/7。

步骤S9043：在所述密集指数达到第一预设阈值的情况下，通过所述第二当前集群替换所述第一当前集群，得到所述第一聚类图像数据90211；

其中，假设第一预设阈值为0.5，则由于密集指数大于第一预设阈值，则第一聚类图像数据可以是第二当前集群102a中的图像数据。

步骤S9044：将减少的图像数据更新为属于非聚类实例图像数据90212。

参见图10a，可以将减少的图像数据1011a和图像数据1012a更新为属于非聚类实例图像数据90212，此时，非聚类实例图像数据中包括灰色圆点表示的初始非聚类图像数据，以及图像数据1011a和图像数据1012a。

在一些实施例中，步骤S904中对所述初始聚类结果进行再聚类处理，可以参见图10b，包括以下步骤：

步骤S9045：根据图像特征距离，在所述初始聚类图像数据的第三当前集群中增加其他集群的图像数据和/或所述初始非聚类图像数据中的图像数据，得到第四当前集群，所述其他集群为所述初始聚类图像数据中与所述第三当前集群不同的集群；

参见图10b，圆点可以表示图像数据，白色圆点可以表示初始聚类图像数据，灰色圆点可以表示初始非聚类图像数据；再聚类处理之前已有的第三当前集群101b和其他集群102b，假设图像特征距离由d1变为d3，且d3>d1，此时由于初始非聚类图像数据1011b、初始非聚类图像数据1012b和初始非聚类图像数据1013b的图像特征距离均小于d3，初始非聚类图像数据1011b、初始非聚类图像数据1012b、初始非聚类图像数据1013b和其他集群102b中的图像数据被从加入第三当前集群101b中，第三当前集群101b中的图像数据增加，得到新的第四当前集群103b。

步骤S9046：确定所述第四当前集群的独立指数；所述独立指数为所述第三当前集群的图像数据数量与所述第四当前集群的图像数据数量的比值；

参见图10b，第三当前集群101b中的图像数据数量为3，第四当前集群103b中的图像数据数量为9，则第四当前集群103b的独立指数为3/9。

步骤S9047：在所述独立指数达到第一预设阈值的情况下，通过所述第四当前集群替换所述第三当前集群，得到所述第一聚类图像数据；

其中，假设第一预设阈值为0.3，则由于独立指数大于第一预设阈值，则第一聚类图像数据90211可以是第四当前集群103a中的图像数据。

步骤S9048：在增加的图像数据包括所述其他集群的图像数据的情况下，解散所述其他集群；和/或，在增加的图像数据包括所述初始非聚类图像数据中的图像数据的情况下，将增加的图像数据更新为不属于非聚类实例图像数据90212。

其中，可以解散其他集群102b和第三集群101b，由于增加的图像数据包括初始聚类图像数据中的图像数据1011b、图像数据1012b和图像数据1013b，则将图像数据1011b、图像数据1012b和图像数据1013b更新为不属于非聚类实例图像数据，即非聚类实例图像数据中不包括图像数据1011b、图像数据1012b和图像数据1013b。

应该理解的是，虽然上述实施例中的流程图中的各个步骤按照箭头的指示依次显示，但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明，这些步骤的执行并没有严格的顺序限制，其可以以其他的顺序执行。而且，图中的至少一部分步骤可以包括多个子步骤或者多个阶段，这些子步骤或者阶段并不必然是在同一时刻执行完成，而是可以在不同的时刻执行，其执行顺序也不必然是依次进行，而是可以与其他步骤或者其他步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。

在一个实施例中，提供一种再识别网络训练装置。

图11为本公开实施例中再识别网络训练装置的示意图，如图11所示，该装置包括以下模块：

第一获取模块100，配置为获取初始网络；

第二获取模块200，配置为获取训练图像数据；

网络训练模块300，配置为通过训练图像数据对初始网络进行训练，得到再识别网络。

关于再识别网络训练装置的限定可以参见上文中对于再识别网络训练方法的限定，在此不再赘述。上述再识别网络训练装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中，也可以以软件形式存储于计算机设备中的存储器中，以便于处理器调用执行以上各个模块对应的操作。

在一个实施例中，提供一种对象再识别装置。

图12为本公开实施例中对象再识别装置的示意图，如图12所示，该装置包括以下模块：

网络获取模块400，配置为获取预训练的再识别网络；

图像获取模块500，配置为获取待识别图像；

再识别模块600，配置为通过再识别网络对待识别图像进行再识别处理，得到待识别图像中目标对象的再识别结果；

其中，再识别网络的训练图像数据至少包括第一聚类图像数据以及非聚类实例图像数据，第一聚类图像数据和非聚类实例图像数据为由再识别网络对应的初始网络对第一图像数据集进行聚类处理得到，第一图像数据集中的图像数据不包含真实聚类标签。

在一个实施例中，所述装置还包括：初始网络获取模块，配置为获取所述初始网络；数据获取模块，配置为获取所述训练图像数据；训练模块，配置为通过所述训练图像数据对所述初始网络进行训练，得到所述再识别网络。

在一个实施例中，所述数据获取模块，包括：结果获取单元，配置为获取通过所述初始网络对所述第一图像数据集进行聚类处理得到的初始聚类结果；聚类处理单元，配置为对所述初始聚类结果进行再聚类处理，得到所述第一聚类图像数据以及所述非聚类实例图像数据。

在一个实施例中，所述初始聚类结果包括初始聚类图像数据；所述聚类处理单元，配置为根据图像特征距离，减少所述初始聚类图像数据中第一当前集群的图像数据数量，得到第二当前集群；确定所述第二当前集群的密集指数，所述密集指数为所述第二当前集群的图像数据数量与所述第一当前集群的图像数据数量的比值；在所述密集指数达到第一预设阈值的情况下，通过所述第二当前集群替换所述第一当前集群，得到所述第一聚类图像数据；将减少的图像数据更新为属于非聚类实例图像数据。

在一个实施例中，所述初始聚类结果还包括初始非聚类图像数据；所述聚类处理单元，还配置为根据图像特征距离，在所述初始聚类图像数据的第三当前集群中增加其他集群的图像数据和/或所述初始非聚类图像数据中的图像数据，得到第四当前集群，所述其他集群为所述初始聚类图像数据中与所述第三当前集群不同的集群；确定所述第四当前集群的独立指数；所述独立指数为所述第三当前集群的图像数据数量与所述第四当前集群的图像数据数量的比值；在所述独立指数达到第一预设阈值的情况下，通过所述第四当前集群替换所述第三当前集群，得到所述第一聚类图像数据；在增加的图像数据包括所述其他集群的图像数据的情况下，解散所述其他集群；和/或，在增加的图像数据包括所述初始非聚类图像数据中的图像数据的情况下，将增加的图像数据更新为不属于非聚类实例图像数据。

在一个实施例中，所述训练模块，包括：第一确定单元，配置为基于所述训练图像数据确定图像数据中心；优化单元，配置为基于所述训练图像数据以及所述图像数据中心确定对比损失，基于所述对比损失对所述初始网络进行参数优化，得到优化网络；聚类单元，配置为通过所述优化网络对所述训练图像数据中的非聚类实例图像数据进行聚类，根据聚类结果对所述第一聚类图像数据以及所述非聚类实例图像数据进行更新，得到新的训练图像数据；第二确定单元，配置为基于所述新的训练图像数据确定新的图像数据中心，返回基于所述新的训练图像数据以及所述新的图像数据中心确定新的对比损失的步骤，直至训练完成，得到所述再识别网络。

在一个实施例中，所述再识别网络包括残差网络。

关于对象再识别装置的限定可以参见上文中对于对象再识别方法的限定，在此不再赘述。上述对象再识别装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中，也可以以软件形式存储于计算机设备中的存储器中，以便于处理器调用执行以上各个模块对应的操作。

本公开实施例还提供一种计算机程序产品，所述计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质，该计算机程序使得计算机执行如上述方法实施例中记载的任何一种对象再识别方法的部分或全部步骤。

在一个实施例中，提供一种计算机设备，包括：存储器，处理器及存储在存储器上并可在处理器上运行的计算机程序，处理器执行程序时实现以上各实施例中网络训练部分的方法步骤，和/或，网络应用部分的方法步骤。

在一个实施例中，提供一种计算机可读存储介质，计算机可读存储介质中存储有计算机执行指令，计算机执行指令被处理器执行时用于实现以上各实施例中网络训练部分的方法步骤，和/或，网络应用部分的方法步骤。

本领域技术人员在考虑说明书及实践这里公开的申请后，将容易想到本公开的其它实施方案。本公开旨在涵盖本公开的任何变型、用途或者适应性变化，这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的，本公开的真正范围和精神由下面的权利要求书指出。

应当理解的是，本公开并不局限于上面已经描述并在附图中示出的精确结构，并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求书来限制。

工业实用性

本实施例中，通过获取预训练的再识别网络；获取待识别图像；通过所述再识别网络对所述待识别图像进行再识别处理，得到所述待识别图像中目标对象的再识别结果。该方法所使用的再识别网络为至少基于第一聚类图像数据以及非聚类实例图像数据训练得到，从而，本公开通过结合不在聚类中的离群值进行网络训练，有助于提高再识别网络的聚类性能，进而提高通过本公开的对象再识别方法得到的目标对象再识别结果的准确性。

Claims

一种对象再识别方法，包括：

获取预训练的再识别网络；

获取待识别图像；

通过所述再识别网络对所述待识别图像进行再识别处理，得到所述待识别图像中目标对象的再识别结果；

其中，所述再识别网络的训练图像数据至少包括第一聚类图像数据以及非聚类实例图像数据，所述第一聚类图像数据和所述非聚类实例图像数据为由所述再识别网络对应的初始网络对第一图像数据集进行聚类处理得到，所述第一图像数据集中的图像数据不包含真实聚类标签。
根据权利要求1所述的方法，其中，所述再识别网络的训练图像数据还包括第二图像数据集，所述第二图像数据集中的第二聚类图像数据包含真实聚类标签；

所述第二图像数据集所在的图像数据域与所述第一图像数据集所在的图像数据域不同。
根据权利要求1或2所述的方法，其中，所述获取预训练的再识别网络之前，还包括：

获取所述初始网络；

获取所述训练图像数据；

通过所述训练图像数据对所述初始网络进行训练，得到所述再识别网络。
根据权利要求3所述的方法，其中，所述获取所述训练图像数据，包括：

获取通过所述初始网络对所述第一图像数据集进行聚类处理得到的初始聚类结果；

对所述初始聚类结果进行再聚类处理，得到所述第一聚类图像数据以及所述非聚类实例图像数据。
根据权利要求4所述的方法，其中，所述初始聚类结果包括初始聚类图像数据；

所述对所述初始聚类结果进行再聚类处理，得到所述第一聚类图像数据以及所述非聚类实例图像数据，包括：

根据图像特征距离，减少所述初始聚类图像数据中第一当前集群的图像数据数量，得到第二当前集群；

确定所述第二当前集群的密集指数，所述密集指数为所述第二当前集群的图像数据数量与所述第一当前集群的图像数据数量的比值；

在所述密集指数达到第一预设阈值的情况下，通过所述第二当前集群替换所述第一当前集群，得到所述第一聚类图像数据；

将减少的图像数据更新为属于非聚类实例图像数据。
根据权利要求5所述的方法，其中，所述初始聚类结果还包括初始非聚类图像数据；

所述对所述初始聚类结果进行再聚类处理，得到所述第一聚类图像数据以及所述非聚类实例图像数据，包括：

根据图像特征距离，在所述初始聚类图像数据的第三当前集群中增加其他集群的图像数据和/或所述初始非聚类图像数据中的图像数据，得到第四当前集群，所述其他集群为所述初始聚类图像数据中与所述第三当前集群不同的集群；

确定所述第四当前集群的独立指数；所述独立指数为所述第三当前集群的图像数据数量与所述第四当前集群的图像数据数量的比值；

在所述独立指数达到第一预设阈值的情况下，通过所述第四当前集群替换所述第三当前集群，得到所述第一聚类图像数据；

在增加的图像数据包括所述其他集群的图像数据的情况下，解散所述其他集群；和/或，在增加的图像数据包括所述初始非聚类图像数据中的图像数据的情况下，将增加的图像数据更新为不属于非聚类实例图像数据。
根据权利要求3所述的方法，其中，所述通过所述训练图像数据对所述初始网络进行训练，得到所述再识别网络，包括：

基于所述训练图像数据确定图像数据中心；

基于所述训练图像数据以及所述图像数据中心确定对比损失，基于所述对比损失对所述初始网络进行参数优化，得到优化网络；

通过所述优化网络对所述训练图像数据中的非聚类实例图像数据进行聚类，根据聚类结果对所述第一聚类图像数据以及所述非聚类实例图像数据进行更新，得到新的训练图像数据；

基于所述新的训练图像数据确定新的图像数据中心，返回基于所述新的训练图像数据以及所述新的图像数据中心确定新的对比损失的步骤，直至训练完成，得到所述再识别网络。
根据权利要求7所述的方法，其中，所述图像数据中心包括所述第一聚类图像数据对应的第一聚类中心以及所述非聚类实例图像数据对应的实例中心；

或者，

所述图像数据中心包括所述第一聚类图像数据对应的第一聚类中心、所述非聚类实例图像数据对应的实例中心以及所述第二聚类图像数据对应的第二聚类中心。
根据权利要求1-8任一项所述的方法，其中，所述再识别网络包括残差网络。
一种对象再识别装置，包括：

网络获取模块，配置为获取预训练的再识别网络；

图像获取模块，配置为获取待识别图像；

再识别模块，配置为通过所述再识别网络对所述待识别图像进行再识别处理，得到所述待识别图像中目标对象的再识别结果；

其中，所述再识别网络的训练图像数据至少包括第一聚类图像数据以及非聚类实例图像数据，所述第一聚类图像数据和所述非聚类实例图像数据为由所述再识别网络对应的初始网络对第一图像数据集进行聚类处理得到，所述第一图像数据集中的图像数据不包含真实聚类标签。
根据权利要求10所述的装置，其中，所述再识别网络的训练图像数据还包括第二图像数据集，所述第二图像数据集中的第二聚类图像数据包含真实聚类标签；

所述第二图像数据集所在的图像数据域与所述第一图像数据集所在的图像数据域不同。
根据权利要求10或11所述的装置，其中，所述装置还包括：初始网络获取模块，配置为获取所述初始网络；数据获取模块，配置为获取所述训练图像数据；训练模块，配置为通过所述训练图像数据对所述初始网络进行训练，得到所述再识别网络。
根据权利要求12所述的装置，其中，所述数据获取模块，包括：结果获取单元，配置为获取通过所述初始网络对所述第一图像数据集进行聚类处理得到的初始聚类结果；聚类处理单元，配置为对所述初始聚类结果进行再聚类处理，得到所述第一聚类图像数据以及所述非聚类实例图像数据。
根据权利要求13所述的装置，其中，所述初始聚类结果包括初始聚类图像数据；

所述聚类处理单元，配置为根据图像特征距离，减少所述初始聚类图像数据中第一当前集群的图像数据数量，得到第二当前集群；确定所述第二当前集群的密集指数，所述密集指数为所述第二当前集群的图像数据数量与所述第一当前集群的图像数据数量的比值；在所述密集指数达到第一预设阈值的情况下，通过所述第二当前集群替换所述第一当前集群，得到所述第一聚类图像数据；将减少的图像数据更新为属于非聚类实例图像数据。
根据权利要求14所述的装置，其中，所述初始聚类结果还包括初始非聚类图像数据；

所述聚类处理单元，还配置为根据图像特征距离，在所述初始聚类图像数据的第三当前集群中增加其他集群的图像数据和/或所述初始非聚类图像数据中的图像数据，得到第四当前集群，所述其他集群为所述初始聚类图像数据中与所述第三当前集群不同的集群；确定所述第四当前集群的独立指数；所述独立指数为所述第三当前集群的图像数据数量与所述第四当前集群的图像数据数量的比值；在所述独立指数达到第一预设阈值的情况下，通过所述第四当前集群替换所述第三当前集群，得到所述第一聚类图像数据；在增加的图像数据包括所述其他集群的图像数据的情况下，解散所述其他集群；和/或，在增加的图像数据包括所述初始非聚类图像数据中的图像数据的情况下，将增加的图像数据更新为不属于非聚类实例图像数据。
根据权利要求12所述的装置，其中，所述训练模块，包括：

第一确定单元，配置为基于所述训练图像数据确定图像数据中心；优化单元，配置为基于所述训练图像数据以及所述图像数据中心确定对比损失，基于所述对比损失对所述初始网络进行参数优化，得到优化网络；聚类单元，配置为通过所述优化网络对所述训练图像数据中的非聚类实例图像数据进行聚类，根据聚类结果对所述第一聚类图像数据以及所述非聚类实例图像数据进行更新，得到新的训练图像数据；第二确定单元，配置为基于所述新的训练图像数据确定新的图像数据中心，返回基于所述新的训练图像数据以及所述新的图像数据中心确定新的对比损失的步骤，直至训练完成，得到所述再识别网络。
根据权利要求16所述的装置，其中，所述图像数据中心包括所述第一聚类图像数据对应的第一聚类中心以及所述非聚类实例图像数据对应的实例中心；

或者，

所述图像数据中心包括所述第一聚类图像数据对应的第一聚类中心、所述非聚类实例图像数据对应的实例中心以及所述第二聚类图像数据对应的第二聚类中心。
根据权利要求10至17任一项所述的装置，其中，所述再识别网络包括残差网络。
一种计算机设备，包括：存储器，处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述处理器执行所述程序时实现如上述权利要求1至9任一项所述的对象再识别方法。
一种计算机可读存储介质，所述计算机可读存储介质中存储有计算机执行指令，所述计算机执行指令被处理器执行时配置为实现如权利要求1至9任一项所述的对象再识别方法。
一种计算机程序产品，包括计算机可读代码，在所述计算机可读代码在电子设备中运行的情况下，所述电子设备中的处理器执行如权利要求1至9任一项所述的方法。