CN111783646A

CN111783646A - 行人再识别模型的训练方法、装置、设备和存储介质

Info

Publication number: CN111783646A
Application number: CN202010615212.6A
Authority: CN
Inventors: 王之港; 王健; 文石磊; 丁二锐; 孙昊
Original assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Current assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Priority date: 2020-06-30
Filing date: 2020-06-30
Publication date: 2020-10-16
Anticipated expiration: 2040-06-30
Also published as: CN111783646B

Abstract

本申请公开了一种行人再识别模型的训练方法、装置、设备和存储介质，涉及计算机视觉、智能交通和深度学习领域。具体实现方案为：获取多个有标签的样本数据及各有标签的样本数据的来源、多个无标签的样本数据及各无标签的样本数据的来源；确定各无标签的样本数据对应的伪标签；根据所述多个有标签的样本数据及来源，以及所述多个无标签的样本数据、对应的伪标签和来源，对行人再识别模型进行训练。根据本申请的技术，可以提高行人再识别模型的精度。

Description

行人再识别模型的训练方法、装置、设备和存储介质

技术领域

本申请实施例涉及数据处理中的计算机视觉、智能交通和深度学习领域，尤其涉及一种行人再识别模型的训练方法、装置、设备和存储介质。

背景技术

行人再识别(Person Re-Identification，REID)也称行人重识别，能够利用视觉处理技术判断图像中是否存在特定的行人。

行人再识别模型的训练过程需要用到大量的样本数据。在训练完成后，可以根据训练好的模型进行行人再识别处理。目前，行人再识别模型的精度依然存在提升的空间。

发明内容

本申请提供了一种行人再识别模型的训练方法、装置、设备和存储介质。

根据本申请的第一方面，提供了一种行人再识别模型的训练方法，包括：

获取多个有标签的样本数据及各有标签的样本数据的来源、多个无标签的样本数据及各无标签的样本数据的来源；

确定各无标签的样本数据对应的伪标签；

根据所述多个有标签的样本数据及来源，以及所述多个无标签的样本数据、对应的伪标签和来源，对行人再识别模型进行训练。

根据本申请的第二方面，提供了一种行人再识别方法，包括：

获取待识别的行人图像以及所述行人图像的来源；

根据所述待识别的行人图像及其来源，通过行人再识别模型对所述行人图像进行识别；其中，所述行人再识别模型为通过第一方面所述的方法训练得到的行人再识别模型。

根据本申请的第三方面，提供了一种行人再识别模型的训练装置，包括：

第一获取单元，用于获取多个有标签的样本数据及各有标签的样本数据的来源、多个无标签的样本数据及各无标签的样本数据的来源；

确定单元，用于确定各无标签的样本数据对应的伪标签；

训练单元，用于根据所述多个有标签的样本数据及来源，以及所述多个无标签的样本数据、对应的伪标签和来源，对行人再识别模型进行训练。

根据本申请的第四方面，提供了一种行人再识别装置，包括：

第二获取单元，用于获取待识别的行人图像以及所述行人图像的来源；

识别单元，用于根据所述待识别的行人图像及其来源，通过行人再识别模型对所述行人图像进行识别；其中，所述行人再识别模型为通过第三方面所述的装置训练得到的行人再识别模型。

根据本申请的第五方面，提供了一种电子设备，包括：

至少一个处理器；以及

与所述至少一个处理器通信连接的存储器；其中，

所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行上述第一方面或第二方面所述的方法。

根据本申请的第六方面，提供了一种存储有计算机指令的非瞬时计算机可读存储介质，所述计算机指令用于使所述计算机执行上述第一方面或第二方面所述的方法。

根据本申请的第七方面，提供了一种行人再识别模型的训练方法，包括：

根据所述多个有标签的样本数据及来源，和所述多个无标签的样本数据及来源，对行人再识别模型进行训练。

根据本申请的技术，提高了行人再识别模型的精度。

应当理解，本部分所描述的内容并非旨在标识本申请的实施例的关键或重要特征，也不用于限制本申请的范围。本申请的其它特征将通过以下的说明书而变得容易理解。

附图说明

附图用于更好地理解本方案，不构成对本申请的限定。其中：

图1为本申请实施例的应用场景示意图；

图2是根据本申请第一实施例的示意图；

图3是根据本申请第二实施例的示意图；

图4为本申请第二实施例中行人再识别模型的原理示意图；

图5是根据本申请第三实施例的示意图；

图6是根据本申请第四实施例的示意图；

图7是根据本申请第五实施例的示意图；

图8是根据本申请第六实施例的示意图；

图9是根据本申请第七实施例的示意图；

图10是根据本申请第八实施例的示意图；

图11是根据本申请第九实施例的示意图；

图12是根据本申请第十实施例的示意图。

具体实施方式

以下结合附图对本申请的示范性实施例做出说明，其中包括本申请实施例的各种细节以助于理解，应当将它们认为仅仅是示范性的。因此，本领域普通技术人员应当认识到，可以对这里描述的实施例做出各种改变和修改，而不会背离本申请的范围和精神。同样，为了清楚和简明，以下的描述中省略了对公知功能和结构的描述。

本申请提供一种行人再识别模型的训练方法、装置、设备和存储介质，应用于数据处理中的计算机视觉、智能交通和深度学习领域，以提升行人再识别模型的精度。

图1为本申请实施例的应用场景示意图。如图1所示，可以通过拍摄装置101对行人102进行拍摄，根据行人再识别模型对拍摄的图像进行处理，可以识别出是否出现特定的行人102。

行人再识别模型的一种典型应用是，在目标应用场景例如商场或园区等设置拍摄装置，采集来往的行人图像，若行人102在该商场或园区出现过一次之后，又再次出现在该商场或园区，则行人再识别模型可以识别出该行人102具体是之前出现过的哪个行人102。

为了实现对行人再识别模型的优化，本申请的发明人在经过创造性地劳动之后，得到了本申请的发明构思：获取有标签的样本数据及无标签的样本数据，并根据所述有标签的样本数据、无标签的样本数据以及各样本数据的来源共同对行人再识别模型进行训练，从而提高行人再识别模型的精度。

下面以具体地实施例对本申请的技术方案以及本申请的技术方案如何解决上述技术问题进行详细说明。下面这几个具体的实施例可以相互结合，对于相同或相似的概念或过程可能在某些实施例中不再赘述。下面将结合附图，对本申请的实施例进行描述。

图2是根据本申请第一实施例的示意图。本实施例的执行主体可以是计算机等任意具有数据处理能力的装置或设备。在本申请各实施例中，虽然在图中示出了逻辑顺序，但是在某些情况下，可以以不同于此处的顺序执行所示出或描述的步骤。

如图2所示，本实施例提供的行人再识别模型的训练方法，可以包括：

201、获取多个有标签的样本数据及各有标签的样本数据的来源、多个无标签的样本数据及各无标签的样本数据的来源。

对行人再识别模型进行训练需要大量的数据。本实施例中，可以获取多个有标签的样本数据及多个无标签的样本数据。

其中，每个所述有标签的样本数据可以包括行人图像以及对应的标签，所述标签可以用于表示行人图像的ID，根据标签可以区分不同的行人。无标签的样本数据可以包括行人图像，但是不包括对应的标签。

所述有标签的样本数据可以通过多种渠道获得，例如，可以从公开的样本数据集中获取多个有标签的样本数据，或者，可以从一些应用场景获取多个有标签的样本数据。

本申请实施例中，所述应用场景可以为商场、园区、地铁、路口等任意行人可能出现的区域。在所述应用场景内可以设置有拍摄装置，通过拍摄装置可以采集包含所述应用场景的图像，然后可以裁剪出其中的行人图像。

一个示例中，在获取到拍摄装置采集的图像后，可以通过视觉识别技术确定图像中行人所在的边界框(bounding box)，并对所述边界框进行裁剪，得到感兴趣区域(RegionOf Interest，ROI)的图像即行人图像。

另一个示例中，可以通过人工裁剪的方式对图像进行裁剪，得到对应的行人图像。

在获取到行人图像后，可以通过人工标注的方式确定行人图像对应的标签。

在本实施例的201中，可以先获取到拍摄装置采集的整体图像，再根据整体图像进行裁剪、标注等操作，得到有标签的样本数据，也可以直接从公开的样本数据集或者其它渠道获取已经标注好的行人图像，从而节省裁剪和标注的时间和成本。

所述无标签的样本数据也可以通过多种渠道获取，尤其可以从目标应用场景获取，所述目标应用场景可以是应用被训练的行人识别模型的场景。也就是说，在通过有标签和无标签的样本数据对行人识别模型进行训练后，可以将所述训练得到的行人识别模型应用到所述目标应用场景中，使用所述行人识别模型对所述目标应用场景中的行人进行识别。

所述有标签的样本数据和无标签的样本数据都可以有其对应的来源。所述来源的具体体现方式可以根据实际需要来设置，本申请实施例对此不作限制。可选的，可以通过样本数据对应的应用场景、采集时段等确定其对应的来源。例如，来自不同应用场景的样本数据对应不同的来源。

202、确定各无标签的样本数据对应的伪标签。

本实施例中，所述伪标签可以是指伪ID，由于无标签的样本数据中只有行人图像，没有标签，因此，需要通过对行人图像进行处理，为其分配对应的标签，由于处理过程不同于人工标注，因此得到的标签并不一定是完全准确的，被称为伪标签。

一个示例中，可以通过有标签的样本数据训练一个模型，通过训练好的模型对无标签的样本数据进行处理，得到无标签的样本数据对应的伪标签。

另一个示例中，也可以利用已有的、已经训练好的模型，对无标签的样本数据进行处理，得到无标签的样本数据对应的伪标签。

203、根据所述多个有标签的样本数据及其来源，以及所述多个无标签的样本数据、对应的伪标签和来源，对行人再识别模型进行训练。

示例性的，可以将所述多个有标签的样本数据及其来源，以及所述多个无标签的样本数据、对应的伪标签和来源输入到行人再识别模型，从而对所述模型进行训练。可选的，所述来源可以作为所述样本数据的一个附加特征，输入到行人再识别模型进行训练。

本实施例可以使用有标签和无标签的样本数据共同对模型进行训练，相比于通过有标签的样本数据训练一个预模型、根据预模型确定无标签的样本数据的伪标签并仅根据伪标签进行训练的方案来说，能够解决模型训练时有标签的样本数据利用不充分问题。在训练完成后，可以根据训练好的模型对目标应用场景的行人进行识别，以满足目标应用场景的监控需要。

本实施例提供的行人再识别模型的训练方法，通过获取多个有标签的样本数据及各有标签的样本数据的来源、多个无标签的样本数据及各无标签的样本数据的来源，确定各无标签的样本数据对应的伪标签，并根据所述多个有标签的样本数据及其来源，以及所述多个无标签的样本数据、对应的伪标签和来源，对行人再识别模型进行训练，能够有效对有标签的数据进行利用，并且区分不同的数据来源对模型进行训练，有效提升训练得到的模型的精度。

在上述实施例提供的技术方案的基础上，可选的是，根据所述多个有标签的样本数据及来源，以及所述多个无标签的样本数据、对应的伪标签和来源，对行人再识别模型进行训练，可以包括：获取各样本数据中行人图像对应的样本特征；根据所述各有标签的样本数据对应的样本特征、标签和来源，以及所述各无标签的样本数据对应的样本特征、伪标签和来源，对行人再识别模型进行训练。

其中，根据所述各有标签的样本数据对应的样本特征、标签和来源，以及所述各无标签的样本数据对应的样本特征、伪标签和来源，对行人再识别模型进行训练，可以包括：将所述各有标签的样本数据对应的样本特征、标签，以及所述各无标签的样本数据对应的样本特征、伪标签，输入到行人再识别模型，以对所述行人再识别模型进行训练；其中，在对所述行人再识别模型进行训练的过程中，进入所述模型的批归一化层的数据，被输入到与其来源对应的批归一化分支进行处理。下面通过第二实施例来进行详细说明。

图3是根据本申请第二实施例的示意图。本实施例是在上述实施例提供的技术方案的基础上，通过在行人再识别模型中设置批归一化分支来实现对不同来源的数据的处理。如图3所示，本实施例提供的行人再识别模型的训练方法，可以包括：

301、获取多个有标签的样本数据及各有标签的样本数据的来源、多个无标签的样本数据及各无标签的样本数据的来源。

302、确定各无标签的样本数据对应的伪标签。

本实施例中，步骤301至步骤302的具体实现原理和过程可以参见前述实施例，此处不再赘述。

303、获取各样本数据中行人图像对应的样本特征。

其中，样本特征可以表现为一组特征向量，所述样本特征可以用于对行人进行识别。具体来说，若两个行人图像对应的样本特征的相似度满足一定的要求，那么可以认为这两个行人图像对应于同一个行人。

在提取各样本数据中行人图像对应的样本特征之后，可以根据所述各有标签的样本数据对应的样本特征、标签和来源，以及所述各无标签的样本数据对应的样本特征、伪标签和来源，对行人再识别模型进行训练。

通过先提取样本特征再根据样本特征对模型进行训练，可以快速、准确地实现对行人再识别模型的训练，提高模型的训练效率。

在一些示例中，在302中确定无标签的样本数据对应的伪标签时，可以采用神经网络模型提取所述无标签的样本数据对应的样本特征，并根据所述样本特征确定对应的伪标签。在这种情况下，303中获取无标签的样本数据对应的样本特征，可以是直接获取302中确定的无标签的样本数据对应的样本特征。

在另一些示例中，在302中也可以通过其它方法，直接确定无标签的样本数据对应的伪标签，而不经过样本特征的提取。在这种情况下，在303中需要根据无标签的样本数据中的行人图像进行样本特征提取的操作。

304、将所述各有标签的样本数据对应的样本特征、标签，以及所述各无标签的样本数据对应的样本特征、伪标签，输入到行人再识别模型，以对所述行人再识别模型进行训练。

305、在对所述行人再识别模型进行训练的过程中，进入所述模型的批归一化层的数据，被输入到与其来源对应的批归一化分支进行处理。

可选的，所述行人再识别模型可以为神经网络模型，所述模型中可以包括多个层，例如卷积层、池化层、全连接层、批归一化层(Batch Normalization，BN)等等。数据输入到行人再识别模型后，依次经过各个层，从而完成对模型的训练。

其中，批归一化层用于对每一批数据进行归一化处理，批归一化层可以加快模型的收敛速度，并且可以使模型训练过程更加稳定。

可选的，批归一化层中对应样本数据的多个来源，设置有多个批归一化分支。即用于对模型进行训练的样本数据的多个来源与模型中批归一化层中的多个分支一一对应。例如，有三个应用场景的样本数据，对应于三个来源，那么在批归一化层中可以设置三个分支，每个分支可以对应一个来源。通过为不同来源的样本数据设置不同的批归一化分支，可以在一定程度将数据变换到标准正态分布，减少不同来源的数据之间的风格差异，进一步提高模型训练的精度。

图4为本申请第二实施例中行人再识别模型的示意图。如图4所示，行人再识别模型可以包括输入层、卷积层、批归一化层、池化层、全连接层等。

如图4所示，样本特征经过输入层后，进入卷积层进行卷积操作，卷积得到的数据进入批归一化层，批归一化层有多个分支，假设多个分支分别对应于来源A、B、C，第一个数据对应于来源A，那么输入到第一个批归一化层进行处理，第二个数据对应于来源B，那么输入到第二个批归一化层进行处理。

在批归一化层后设置有池化层，数据从批归一化层的相应分支输出后，进入同一池化层进行处理。具体的后续处理过程属于现有技术，本实施例中不再赘述。

图4所示只是一种行人再识别模型的示例。在其它可选的实现方式中，批归一化层和其它层的位置可以调换，还可以进一步增加或删减部分层，本实施例对此不作限制。

可选的，所述批归一化层中每个批归一化分支设置有对应的参数，每一样本数据用于对其来源对应的批归一化分支的参数进行训练。具体来说，数据在神经网络的训练过程中会经过特定的批归一化分支，而非共享批归一化层的参数。这样，对应不同来源的数据设置有不同的批归一化参数，通过训练可以对参数进行优化，通过参数优化可以实现行人再识别模型的优化，简便高效且易于实现。

除批归一化层的参数之外，行人再识别模型中的其它层的参数对于所有数据来说都是共享的。

本实施例提供的行人再识别模型的训练方法，可以在所述行人再识别模型中设置批归一化层，所述批归一化层中对应样本数据的多个来源，设置有多个批归一化分支，在对所述行人再识别模型进行训练的过程中，进入所述批归一化层的数据，被输入到与其来源对应的批归一化分支进行处理，从而能够快速、准确地将训练过程中的数据根据其对应的来源输入到相应的批归一化分支中，完成对相应的批归一化分支的优化操作，快速稳定地实现对模型的训练，并且能够提高模型的训练精度。

通过上述303至305，可以实现根据所述多个有标签的样本数据及其来源，以及所述多个无标签的样本数据、对应的伪标签和来源，对行人再识别模型进行训练。

本申请实施例提供的行人再识别模型的训练方法，可以是一种多源无监督域自适应的行人再识别模型训练方法。其中，多源是指模型训练时会用到不同来源的有标签样本数据和目标应用场景的无标签样本数据，无监督是指目标应用场景的样本数据没有标签，域自适应是指利用其他场景的数据或模型来帮助目标应用场景进行模型训练。

在本申请各实施例中，获取多个有标签的样本数据及各有标签的样本数据的来源、多个无标签的样本数据及各无标签的样本数据的来源，可以通过多种方式来实现。

可选的，所述获取多个有标签的样本数据及各有标签的样本数据的来源，可以包括：获取至少一应用场景的多个有标签的样本数据；根据每一有标签的样本数据的应用场景确定所述样本数据的来源。

本实施例不限定所述应用场景的数量以及从每一应用场景获取的样本数据的数量。本领域技术人员可以根据实际需要来从至少一应用场景的多个有标签的样本数据。

可选的，样本数据的来源可以为所述样本数据对应的应用场景，例如所述样本数据来自于哪个商场或园区。由于不同场景下，图像很可能具有不同的图像风格，光照、对比度等差距较大，因此，在获取到样本数据后，可以根据应用场景为样本数据标记其来源，以便更好地对行人再识别模型进行训练。

可以理解的是，园区的光源往往为自然光，而商场和地铁的光源一般为灯光，并且不同的商场的光线、背景风格也不一样，导致图像特征差异较大，因此，可以基于样本数据对应的应用场景对所述样本数据的来源进行标记。

举例来说，样本数据1、样本数据2都来自于商场A，则可以根据商场A确定所述样本数据1和所述样本数据2的来源，样本数据3来自于商场B，则可以根据商场B确定所述样本数据3的来源。

根据每个有标签的样本数据的应用场景确定样本数据的来源，可以为不同场景的样本数据标记不同的来源，从而对不同应用场景的样本数据进行区分，减少不同的场景风格差异对模型训练的影响，提高模型训练的稳定性和精度。

其中，样本数据的来源可以标记为对应的应用场景，例如，来自商场A的样本数据对应的来源为A，来自商场B的样本数据对应的来源为B。或者，可以根据应用场景结合其它信息确定样本数据的来源。

可选的，每个所述应用场景可以设置有至少一拍摄装置；所述有标签的样本数据包括通过拍摄装置获取的行人图像以及所述行人图像对应的标签。

所述根据每一有标签的样本数据的应用场景确定所述样本数据的来源，可以包括：针对每一有标签的样本数据，确定拍摄所述样本数据中行人图像的拍摄装置；根据所述样本数据的应用场景以及对应的拍摄装置，确定所述样本数据的来源。

举例来说，在某一应用场景如商场A中包括三个拍摄装置，分别记为拍摄装置1、2、3，每个拍摄装置都可以拍摄多幅图像，从图像中可以裁剪出行人图像，对行人图像进行标注后，形成有标签的样本数据。

若某一样本数据中的行人图像是通过拍摄装置1获取的，那么该样本数据的来源可以记为A1。若样本数据中的行人图像是通过拍摄装置2或3获取的，那么该样本数据的来源可以记为A2或A3。

由于应用场景的范围往往较大，所以经常会设置多个拍摄装置，每个拍摄装置的位置和所处环境都不相同，例如，商场的入口处，自然光较强，商场的角落处，往往光线不强，商场的地下车库，基本处于比较暗的状态，因此，将应用场景内的不同的拍摄装置采集到的行人图像标记为不同的来源，能够实现对应用场景的样本数据的细分，减少不同拍摄装置所处的环境差异对模型训练的影响，进一步提高模型训练的稳定性和精度。

在其它可选的实现方式中，还可以以其他维度来确定样本数据的来源。具体来说，可以通过应用场景、时间、天气、现场光照度等综合确定样本数据的来源。

举例来说，可以将采集图像的时间划分为多个时段，例如，下午2：00-4：00，属于强自然光时段，4：00-6：00，属于弱自然光时段，下午6：-8：00，属于光线较暗的时段。若样本数据4中的行人图像拍摄于园区C的下午3：00，则标记其来源为C1，若样本数据5中的行人图像拍摄于园区C的下午5：00，则标记其来源为C2。也就是说，同一个园区获取的多个样本数据，可以基于不同的时段划分为多个来源，从而区分不同风格的图像。

可选的，所述行人再识别模块可以用于对目标应用场景的行人进行再识别。所述获取多个无标签的样本数据及各无标签的样本数据的来源，可以包括：获取所述目标应用场景的多个无标签的样本数据；根据所述目标应用场景确定每一无标签的样本数据的来源。

通过从目标应用场景获取无标签的样本数据，能够使得训练得到的行人再识别模型更加符合目标应用场景的需求，提高行人再识别模型的适应性。根据目标应用场景确定无标签的样本数据的来源，可以为不同场景的样本数据标记不同的来源，避免目标应用场景的样本数据和来自其它应用场景的样本数据混淆，避免不同的场景风格差异降低模型的精度。

其中，无标签的样本数据的来源可以直接标记为所述目标应用场景，例如，目标应用场景为商场D，则无标签的样本数据的来源可以记为D。或者，可以根据目标应用场景结合其它信息确定样本数据的来源。

可选的，所述目标应用场景设置有至少一拍摄装置，所述无标签的样本数据包括通过拍摄装置获取的行人图像；根据所述目标应用场景确定每一无标签的样本数据的来源，包括：针对每一无标签的样本数据，确定拍摄所述样本数据中行人图像的拍摄装置；根据所述目标应用场景以及对应的拍摄装置，确定所述样本数据的来源。

举例来说，在目标应用场景如商场D中包括两个拍摄装置，分别记为拍摄装置1、2，每个拍摄装置都可以拍摄多幅图像，从图像中可以裁剪出行人图像，形成无标签的样本数据。

若某一样本数据中的行人图像是通过拍摄装置1获取的，那么该样本数据的来源可以记为D1。若样本数据中的行人图像是通过拍摄装置2获取的，那么该样本数据的来源可以记为D2。

通过将目标应用场景内的不同的拍摄装置采集到的行人图像标记不同的来源，能够实现对无标签的样本数据的细分，进一步提高模型训练的稳定性和精度。

图5是根据本申请第三实施例的示意图。如图5所示，本实施例提供的行人再识别模型的训练方法，可以包括：

501、有标签的样本数据及各有标签的样本数据的来源、多个无标签的样本数据及各无标签的样本数据的来源。

502、通过所述多个有标签的样本数据，对行人再识别模型进行监督式训练。

示例性的，可以首先使用有标签的样本数据，按照一般的行人再识别监督式训练流程，训练一个初步的行人再识别模型，该初步的行人再识别模型具备一定ID区分能力，用于为无标签的样本数据分配标签。

503、根据通过所述多个有标签的样本数据训练得到的行人再识别模型，确定各无标签的样本数据对应的伪标签。

可选的，根据通过所述多个有标签的样本数据训练得到的行人再识别模型，确定各无标签的样本数据对应的伪标签，可以包括：根据通过所述多个有标签的样本数据训练得到的行人再识别模型，对各无标签的样本数据进行样本特征提取；根据提取到的样本特征，确定各无标签的样本数据对应的伪标签。

样本特征反映了行人图像的特征，通过提取样本特征的方式来确定无标签的样本数据，能够根据行人图像中的有效信息来对行人图像进行区分，提高伪标签分配的准确性。

可选的，根据提取到的样本特征，确定各无标签的样本数据对应的伪标签，可以包括：对提取到的样本特征进行聚类，根据聚类结果确定各无标签的样本数据对应的伪标签。

具体来说，在获取到各无标签的样本数据对应的样本特征后，可以对样本特征进行聚类处理。可选的，可以使用DBSCAN、k-means等聚类算法(任一种均可)对提取的样本特征进行聚类。这样，无标签的样本数据在特征空间中就被划分成了许多不同的类簇。

根据无标签的样本数据中行人图像在特征空间中对应的类簇，为其分配伪标签，其中，伪标签可以为相应的类簇索引。这样，每个无标签的样本数据就被分配好了伪标签。

通过对无标签的样本数据对应的样本特征进行聚类处理，确定各无标签的样本数据对应的伪标签，能够快速实现为无标签样本数据分配伪标签，且具有一定的准确度，满足行人再识别模型的训练需求。

504、根据所述多个有标签的样本数据及来源，以及所述多个无标签的样本数据、对应的伪标签和来源，对行人再识别模型进行训练。

本实施例提供的行人再识别模型的训练方法，可以通过多个有标签的样本数据，对行人再识别模型进行监督式训练，再根据通过所述多个有标签的样本数据训练得到的行人再识别模型，确定各无标签的样本数据对应的伪标签，能够有效利用有标签的样本数据，弥补无标签的样本数据没有标签的缺陷，在有限样本数据的基础上提高模型训练的速度和精度。

在本申请各实施例提供的技术方案的基础上，可选的是，在对行人再识别模型进行训练后，若所述行人再识别模型不收敛，则重复下述步骤，直至所述行人再识别模型收敛：通过训练得到的所述行人再识别模型确定所述无标签的样本数据对应的伪标签；根据所述多个有标签的样本数据及来源，以及所述多个无标签的样本数据、对应的伪标签和来源，对行人再识别模型进行训练。

在对模型进行训练后，判断模型是否收敛，并在模型不收敛时，通过有标签的样本数据及其来源、无标签的样本数据及其来源，进一步对模型进行训练，能够充分对有标签的样本数据和无标签的样本数据进行挖掘和利用，提高模型的稳定性和精度。

图6是根据本申请第四实施例的示意图。本实施例中，将来自于同一来源的样本数据的集合称为一数据集。具体来说，可以获取多个有标签的数据集，分别记为数据集1、2……N，每个有标签的数据集可以包括多个有标签的样本数据，一个数据集中的样本数据来自于同一来源例如来自于同一应用场景。同时，还可以获取一个无标签的数据集，无标签的数据集可以包括多个无标签的样本数据，无标签的样本数据的来源可以为目标应用场景。

如图6所示，在本实施例提供的行人再识别模型的训练过程中，可以首先利用有标签的样本数据，通过601中的监督式训练，对行人再识别模型进行训练，得到602中的Reid行人再识别模型。由于整个训练过程可以是往复迭代进行的，所以这里的模型可以是由上述601得到的行人再识别模型，也可以是后续通过606训练得到的行人再识别模型。

在得到行人再识别模型后，可以进行603的特征提取步骤。具体的，使用602中的行人再识别模型对各样本数据中的行人图像进行特征提取，得到各样本数据对应的样本特征。有标签的样本数据和无标签的样本数据都参与此过程。

在特征提取之后，可以进行604的特征聚类步骤。具体的，对样本特征进行聚类处理时，可以使用DBSCAN或k-means等聚类算法对得到的样本特征进行聚类，无标签的样本数据在特征空间中就被划分成了许多不同的类簇。有标签的样本数据可以不参与特征聚类步骤。

在聚类处理后，可以进行605的伪标签分配步骤。具体的，可以根据无标签的样本数据中行人图像在特征空间中对应的类簇，为其分配伪标签。伪标签可以为相应的类簇索引。这样，每个无标签的样本数据就被分配好了伪标签。

在606域相关的行人再识别模型的训练中，有标签和无标签的数据都可以参与此过程。可以重复上述602至606的过程，直至行人再识别模型收敛。

如前文所述，有标签的样本数据和无标签的样本数据来自于不同的场景，而不同场景下的图像很可能具有不同的图像风格，这导致直接混合使用有标签的样本数据和无标签的样本数据可能不会提升所训练模型的性能。因此，在模型中可以设置有多个批归一化分支，用于对不同来源的数据进行处理。

本实施例给出了一种详细的行人再识别模型的训练过程示例，本实施例没有详细描述的部分，可以参见前述各实施例中的描述。

图7是根据本申请第五实施例的示意图。如图7所示，本实施例提供一种行人再识别方法，包括：

701、获取待识别的行人图像以及所述行人图像的来源。

702、根据所述待识别的行人图像及其来源，通过行人再识别模型对所述行人图像进行识别。

本实施例提供的行人再识别方法中的行人再识别模型，可以是通过前述任一实施例所述的方法训练得到的行人再识别模型。所述行人再识别模型可以根据待识别的行人图像及其来源，对所述行人图像进行识别，以确定所述行人图像对应的ID。

本实施例提供的行人再识别方法，可以获取待识别的行人图像以及所述行人图像的来源，根据所述待识别的行人图像及其来源，通过行人再识别模型对所述行人图像进行识别，能够区分不同来源的行人图像，在一定程度上避免不同来源的图像风格差异导致识别不准确的问题，提高识别精度。

可选的，所述行人再识别模型可以包括批归一化层，所述批归一化层中可以设置有多个批归一化分支。在通过所述行人再识别模型对所述行人图像进行识别的过程中，进入所述批归一化层的数据，被输入到与其来源对应的批归一化分支进行处理，从而能够快速、准确地将识别过程中的数据根据其对应的来源输入到相应的批归一化分支中，完成对数据的归一化操作，快速准确地实现对不同来源的数据的修正，有效提高识别的速度和精度。

图8是根据本申请第六实施例的示意图。如图8所示，本实施例提供的行人再识别模型的训练装置，可以包括：

第一获取单元11，用于获取多个有标签的样本数据及各有标签的样本数据的来源、多个无标签的样本数据及各无标签的样本数据的来源；

确定单元12，用于确定各无标签的样本数据对应的伪标签；

训练单元13，用于根据所述多个有标签的样本数据及来源，以及所述多个无标签的样本数据、对应的伪标签和来源，对行人再识别模型进行训练。

本实施例提供的行人再识别模型的训练装置，可以执行图2-图6的实施例中的技术方案，其具体实现过程和技术原理相同，此处不再赘述。

一个示例中，所述行人再识别模型包括批归一化层，所述批归一化层中对应样本数据的多个来源，设置有多个批归一化分支。

图9是根据本申请第七实施例的示意图。如图9所示，在图8所示实施例的基础上，本实施例提供的行人再识别模型的训练装置中，所述训练单元13包括：

第一获取子单元131，用于获取各样本数据中行人图像对应的样本特征；

第一训练子单元132，用于根据所述各有标签的样本数据对应的样本特征、标签和来源，以及所述各无标签的样本数据对应的样本特征、伪标签和来源，对行人再识别模型进行训练。

一个示例中，所述第一训练子单元132具体用于：

将所述各有标签的样本数据对应的样本特征、标签和来源，以及所述各无标签的样本数据对应的样本特征、伪标签和来源，输入到行人再识别模型，以对所述行人再识别模型进行训练；

其中，在对所述行人再识别模型进行训练的过程中，进入所述批归一化层的数据，被输入到与其来源对应的批归一化分支进行处理。

一个示例中，所述第一获取单元11包括：

第二获取子单元111，用于获取至少一应用场景的多个有标签的样本数据；

第一确定子单元112，用于根据每一有标签的样本数据的应用场景确定所述样本数据的来源。

一个示例中，每个所述应用场景设置有至少一拍摄装置；所述有标签的样本数据包括通过拍摄装置获取的行人图像以及所述行人图像对应的标签；

所述第一确定子单元112包括：

第一确定模块1121，用于针对每一有标签的样本数据，确定拍摄所述样本数据中行人图像的拍摄装置；

第二确定模块1122，用于根据所述样本数据的应用场景以及对应的拍摄装置，确定所述样本数据的来源。

一个示例中，所述行人再识别模块用于对目标应用场景的行人进行再识别；所述获取单元11包括：

第三获取子单元113，用于获取所述目标应用场景的多个无标签的样本数据；

第二确定子单元114，根据所述目标应用场景确定每一无标签的样本数据的来源。

一个示例中，所述目标应用场景设置有至少一拍摄装置，所述无标签的样本数据包括通过拍摄装置获取的行人图像；

所述第二确定子单元114包括：

第三确定模块1141，用于针对每一无标签的样本数据，确定拍摄所述样本数据中行人图像的拍摄装置；

第四确定模块1142，用于根据所述目标应用场景以及对应的拍摄装置，确定所述样本数据的来源。

一个示例中，确定单元12包括：

第二训练子单元121，用于通过所述多个有标签的样本数据，对行人再识别模型进行监督式训练；

第三确定子单元122，用于根据通过所述多个有标签的样本数据训练得到的行人再识别模型，确定各无标签的样本数据对应的伪标签。

一个示例中，第三确定子单元122包括：

提取模块1221，用于根据通过所述多个有标签的样本数据训练得到的行人再识别模型，对各无标签的样本数据进行样本特征提取；

第五确定模块1222，用于根据提取到的样本特征，确定各无标签的样本数据对应的伪标签。

一个示例中，所述提取模块1221具体用于：

对提取到的样本特征进行聚类，根据聚类结果确定各无标签的样本数据对应的伪标签。

一个示例中，所述训练单元13还包括：

第三训练子单元133，用于在对行人再识别模型进行训练后，若所述行人再识别模型不收敛，则重复下述步骤，直至所述行人再识别模型收敛：通过训练得到的所述行人再识别模型确定所述无标签的样本数据对应的伪标签；根据所述多个有标签的样本数据及来源，以及所述多个无标签的样本数据、对应的伪标签和来源，对行人再识别模型进行训练。

本实施例的行人再识别模型的训练装置，可以执行上述图2-图7的实施例中的技术方案，其具体实现过程和技术原理相同，此处不再赘述。

图10是根据本申请第八实施例的示意图。如图10所示，本实施例提供的行人再识别装置，可以包括：

第二获取单元21，用于获取待识别的行人图像以及所述行人图像的来源；

识别单元22，用于根据所述待识别的行人图像及其来源，通过行人再识别模型对所述行人图像进行识别；其中，所述行人再识别模型为通过上述任一实施例所述的装置训练得到的行人再识别模型。

本实施例提供的行人再识别装置，可以执行图7的实施例中的技术方案，其具体实现过程和技术原理相同，此处不再赘述。

一个示例中，所述行人再识别模型包括批归一化层，所述批归一化层中设置有多个批归一化分支；在通过所述行人再识别模型对所述行人图像进行识别的过程中，进入所述批归一化层的数据，被输入到与其来源对应的批归一化分支进行处理。

图11是根据本申请第九实施例的示意图。如图11所示，本实施例提供一种行人再识别模型的训练方法，包括：

1101、获取多个有标签的样本数据及各有标签的样本数据的来源、多个无标签的样本数据及各无标签的样本数据的来源。

1102、根据所述多个有标签的样本数据及来源，和所述多个无标签的样本数据及来源，对行人再识别模型进行训练。

本实施例的具体实现原理和过程可以参见上述各实施例，此处不再赘述。

本实施例提供的行人再识别模型的训练方法，通过获取多个有标签的样本数据及各有标签的样本数据的来源、多个无标签的样本数据及各无标签的样本数据的来源，根据所述多个有标签的样本数据及来源，和所述多个无标签的样本数据及来源，对行人再识别模型进行训练，能够有效对有标签的数据进行利用，并且区分不同的数据来源对模型进行训练，有效提升训练得到的模型的精度。

根据本申请的实施例，本申请还提供了一种电子设备和一种可读存储介质。

图12是根据本申请第十实施例的示意图，如图12所示，本实施例提供一种电子设备，所述电子设备可以用于执行上述任一实施例所述的行人再识别模型的训练方法或者行人再识别方法。

可以理解的是，模型的训练和使用可以通过同一电子设备来实现，即同一电子设备既可以执行上述任一实施例所述的行人再识别模型的训练方法，也可以执行上述任一实施例所述的行人再识别方法。

当然，模型的训练和使用也可以通过不同的电子设备来实现，即可以通过一电子设备执行上述任一实施例所述的行人再识别模型的训练方法，通过另一电子设备执行上述任一实施例所述的行人再识别方法。

所述电子设备旨在表示各种形式的数字计算机，诸如，膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置，诸如，个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例，并且不意在限制本文中描述的和/或者要求的本申请的实现。

如图12所示，该电子设备包括：一个或多个处理器1201、存储器1202，以及用于连接各部件的接口，包括高速接口和低速接口。各个部件利用不同的总线互相连接，并且可以被安装在公共主板上或者根据需要以其它方式安装。处理器可以对在电子设备内执行的指令进行处理，包括存储在存储器中或者存储器上以在外部输入/输出装置(诸如，耦合至接口的显示设备)上显示GUI的图形信息的指令。在其它实施方式中，若需要，可以将多个处理器和/或多条总线与多个存储器和多个存储器一起使用。同样，可以连接多个电子设备，各个设备提供部分必要的操作(例如，作为服务器阵列、一组刀片式服务器、或者多处理器***)。图12中以一个处理器1201为例。

存储器1202即为本申请所提供的非瞬时计算机可读存储介质。其中，所述存储器存储有可由至少一个处理器执行的指令，以使所述至少一个处理器执行本申请所提供的任一方法。本申请的非瞬时计算机可读存储介质存储计算机指令，该计算机指令用于使计算机执行本申请所提供的任一方法。

存储器1202作为一种非瞬时计算机可读存储介质，可用于存储非瞬时软件程序、非瞬时计算机可执行程序以及模块，如本申请实施例中的任一方法对应的程序指令/模块(例如，附图8所示的第一获取单元801、确定单元802和训练单元803)。处理器1201通过运行存储在存储器1202中的非瞬时软件程序、指令以及模块，从而执行服务器的各种功能应用以及数据处理，即实现上述方法实施例中的任一方法。

存储器1202可以包括存储程序区和存储数据区，其中，存储程序区可存储操作***、至少一个功能所需要的应用程序；存储数据区可存储根据电子设备的使用所创建的数据等。此外，存储器1202可以包括高速随机存取存储器，还可以包括非瞬时存储器，例如至少一个磁盘存储器件、闪存器件、或其他非瞬时固态存储器件。在一些实施例中，存储器1202可选包括相对于处理器1201远程设置的存储器，这些远程存储器可以通过网络连接至电子设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

所述电子设备还可以包括：输入装置1203和输出装置1204。处理器1201、存储器1202、输入装置1203和输出装置1204可以通过总线或者其他方式连接，图12中以通过总线连接为例。

输入装置1203可接收输入的数字或字符信息，以及产生与电子设备的用户设置以及功能控制有关的键信号输入，例如触摸屏、小键盘、鼠标、轨迹板、触摸板、指示杆、一个或者多个鼠标按钮、轨迹球、操纵杆等输入装置。输出装置1204可以包括显示设备、辅助照明装置(例如，LED)和触觉反馈装置(例如，振动电机)等。该显示设备可以包括但不限于，液晶显示器(LCD)、发光二极管(LED)显示器和等离子体显示器。在一些实施方式中，显示设备可以是触摸屏。

此处描述的***和技术的各种实施方式可以在数字电子电路***、集成电路***、专用ASIC(专用集成电路)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括：实施在一个或者多个计算机程序中，该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程***上执行和/或解释，该可编程处理器可以是专用或者通用可编程处理器，可以从存储***、至少一个输入装置、和至少一个输出装置接收数据和指令，并且将数据和指令传输至该存储***、该至少一个输入装置、和该至少一个输出装置。

这些计算程序(也称作程序、软件、软件应用、或者代码)包括可编程处理器的机器指令，并且可以利用高级过程和/或面向对象的编程语言、和/或汇编/机器语言来实施这些计算程序。如本文使用的，术语“机器可读介质”和“计算机可读介质”指的是用于将机器指令和/或数据提供给可编程处理器的任何计算机程序产品、设备、和/或装置(例如，磁盘、光盘、存储器、可编程逻辑装置(PLD))，包括，接收作为机器可读信号的机器指令的机器可读介质。术语“机器可读信号”指的是用于将机器指令和/或数据提供给可编程处理器的任何信号。

为了提供与用户的交互，可以在计算机上实施此处描述的***和技术，该计算机具有：用于向用户显示信息的显示装置(例如，CRT(阴极射线管)或者LCD(液晶显示器)监视器)；以及键盘和指向装置(例如，鼠标或者轨迹球)，用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互；例如，提供给用户的反馈可以是任何形式的传感反馈(例如，视觉反馈、听觉反馈、或者触觉反馈)；并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。

可以将此处描述的***和技术实施在包括后台部件的计算***(例如，作为数据服务器)、或者包括中间件部件的计算***(例如，应用服务器)、或者包括前端部件的计算***(例如，具有图形用户界面或者网络浏览器的用户计算机，用户可以通过该图形用户界面或者该网络浏览器来与此处描述的***和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算***中。可以通过任何形式或者介质的数字数据通信(例如，通信网络)来将***的部件相互连接。通信网络的示例包括：局域网(LAN)、广域网(WAN)和互联网。

计算机***可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。

应该理解，可以使用上面所示的各种形式的流程，重新排序、增加或删除步骤。例如，本发申请中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行，只要能够实现本申请公开的技术方案所期望的结果，本文在此不进行限制。

上述具体实施方式，并不构成对本申请保护范围的限制。本领域技术人员应该明白的是，根据设计要求和其他因素，可以进行各种修改、组合、子组合和替代。任何在本申请的精神和原则之内所作的修改、等同替换和改进等，均应包含在本申请保护范围之内。

Claims

1.一种行人再识别模型的训练方法，包括：

确定各无标签的样本数据对应的伪标签；

2.根据权利要求1所述的方法，其中，所述行人再识别模型包括批归一化层，所述批归一化层中对应样本数据的多个来源，设置有多个批归一化分支。

3.根据权利要求2所述的方法，其中，根据所述多个有标签的样本数据及来源，以及所述多个无标签的样本数据、对应的伪标签和来源，对行人再识别模型进行训练，包括：

获取各样本数据中行人图像对应的样本特征；

根据所述各有标签的样本数据对应的样本特征、标签和来源，以及所述各无标签的样本数据对应的样本特征、伪标签和来源，对行人再识别模型进行训练。

4.根据权利要求3所述的方法，其中，根据所述各有标签的样本数据对应的样本特征、标签和来源，以及所述各无标签的样本数据对应的样本特征、伪标签和来源，对行人再识别模型进行训练，包括：

将所述各有标签的样本数据对应的样本特征、标签，以及所述各无标签的样本数据对应的样本特征、伪标签，输入到行人再识别模型，以对所述行人再识别模型进行训练；

5.根据权利要求1所述的方法，其中，所述获取多个有标签的样本数据及各有标签的样本数据的来源，包括：

获取至少一应用场景的多个有标签的样本数据；

根据每一有标签的样本数据的应用场景确定所述样本数据的来源。

6.根据权利要求5所述的方法，其中，每个所述应用场景设置有至少一拍摄装置；所述有标签的样本数据包括通过拍摄装置获取的行人图像以及所述行人图像对应的标签；

所述根据每一有标签的样本数据的应用场景确定所述样本数据的来源，包括：

针对每一有标签的样本数据，确定拍摄所述样本数据中行人图像的拍摄装置；

根据所述样本数据的应用场景以及对应的拍摄装置，确定所述样本数据的来源。

7.根据权利要求1所述的方法，其中，所述行人再识别模块用于对目标应用场景的行人进行再识别；

所述获取多个无标签的样本数据及各无标签的样本数据的来源，包括：

获取所述目标应用场景的多个无标签的样本数据；

根据所述目标应用场景确定每一无标签的样本数据的来源。

8.根据权利要求7所述的方法，其中，所述目标应用场景设置有至少一拍摄装置，所述无标签的样本数据包括通过拍摄装置获取的行人图像；

根据所述目标应用场景确定每一无标签的样本数据的来源，包括：

针对每一无标签的样本数据，确定拍摄所述样本数据中行人图像的拍摄装置；

根据所述目标应用场景以及对应的拍摄装置，确定所述样本数据的来源。

9.根据权利要求1所述的方法，其中，确定各无标签的样本数据对应的伪标签，包括：

通过所述多个有标签的样本数据，对行人再识别模型进行监督式训练；

根据通过所述多个有标签的样本数据训练得到的行人再识别模型，确定各无标签的样本数据对应的伪标签。

10.根据权利要求9所述的方法，其中，根据通过所述多个有标签的样本数据训练得到的行人再识别模型，确定各无标签的样本数据对应的伪标签，包括：

根据通过所述多个有标签的样本数据训练得到的行人再识别模型，对各无标签的样本数据进行样本特征提取；

根据提取到的样本特征，确定各无标签的样本数据对应的伪标签。

11.根据权利要求10所述的方法，其中，根据提取到的样本特征，确定各无标签的样本数据对应的伪标签，包括：

12.根据权利要求1-11任一项所述的方法，还包括：

在对行人再识别模型进行训练后，若所述行人再识别模型不收敛，则重复下述步骤，直至所述行人再识别模型收敛：

通过训练得到的所述行人再识别模型确定所述无标签的样本数据对应的伪标签；

13.一种行人再识别方法，包括：

获取待识别的行人图像以及所述行人图像的来源；

根据所述待识别的行人图像及其来源，通过行人再识别模型对所述行人图像进行识别；其中，所述行人再识别模型为通过权利要求1-12任一项所述的方法训练得到的行人再识别模型。

14.根据权利要求13所述的方法，其中，

在通过所述行人再识别模型对所述行人图像进行识别的过程中，进入所述行人再识别模型中批归一化层的数据，被输入到与其来源对应的批归一化分支进行处理。

15.一种行人再识别模型的训练装置，包括：

确定单元，用于确定各无标签的样本数据对应的伪标签；

16.一种行人再识别装置，包括：

识别单元，用于根据所述待识别的行人图像及其来源，通过行人再识别模型对所述行人图像进行识别；其中，所述行人再识别模型为通过权利要求15所述的装置训练得到的行人再识别模型。

17.一种电子设备，包括：

至少一个处理器；以及

与所述至少一个处理器通信连接的存储器；其中，

所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行权利要求1-14中任一项所述的方法。

18.一种存储有计算机指令的非瞬时计算机可读存储介质，所述计算机指令用于使所述计算机执行权利要求1-14中任一项所述的方法。

19.一种行人再识别模型的训练方法，包括：