CN116612500B - 行人重识别模型训练方法及装置 - Google Patents

行人重识别模型训练方法及装置 Download PDF

Info

Publication number
CN116612500B
CN116612500B CN202310891827.5A CN202310891827A CN116612500B CN 116612500 B CN116612500 B CN 116612500B CN 202310891827 A CN202310891827 A CN 202310891827A CN 116612500 B CN116612500 B CN 116612500B
Authority
CN
China
Prior art keywords
sample
loss
network
global
mask
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202310891827.5A
Other languages
English (en)
Other versions
CN116612500A (zh
Inventor
蒋召
程剑杰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Xumi Yuntu Space Technology Co Ltd
Original Assignee
Shenzhen Xumi Yuntu Space Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Xumi Yuntu Space Technology Co Ltd filed Critical Shenzhen Xumi Yuntu Space Technology Co Ltd
Priority to CN202310891827.5A priority Critical patent/CN116612500B/zh
Publication of CN116612500A publication Critical patent/CN116612500A/zh
Application granted granted Critical
Publication of CN116612500B publication Critical patent/CN116612500B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/764Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T10/00Road transport of goods or passengers
    • Y02T10/10Internal combustion engine [ICE] based vehicles
    • Y02T10/40Engine management systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Human Computer Interaction (AREA)
  • Computing Systems (AREA)
  • Databases & Information Systems (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Image Analysis (AREA)

Abstract

本申请涉及目标检测技术领域,提供了一种行人重识别模型训练方法及装置。该方法包括:构建掩码网络和全局网络,利用特征提取网络、掩码网络和全局网络构建行人重识别模型;获取训练样本,将训练样本输入行人重识别模型,通过特征提取网络提取训练样本的语义特征,分别通过掩码网络和全局网络对语义特征进行处理,得到训练样本的掩码特征和全局特征;分别基于掩码特征和全局特征,利用交叉熵损失函数计算第一分类损失和第二分类损失;分别基于掩码特征和全局特征,利用三元组损失函数计算第一比较损失和第二比较损失;依据第一分类损失、第二分类损失、第一比较损失和第二比较损失更新行人重识别模型的模型参数,以完成对行人重识别模型的训练。

Description

行人重识别模型训练方法及装置
技术领域
本申请涉及目标检测技术领域,尤其涉及一种行人重识别模型训练方法及装置。
背景技术
行人重识别(Person re-identification)也称行人再识别,是利用计算机视觉技术判断图像或者视频序列中是否存在特定行人的技术。目前常用的行人重识别算法,由于真实场景下行人图像会存在大量遮挡,这些遮挡会影响图像特征的提取和处理,从而导致出现识别错误的情况。
发明内容
有鉴于此,本申请实施例提供了一种行人重识别模型训练方法、装置、电子设备及计算机可读存储介质,以解决现有技术中,因为行人图像存在遮挡,导致行人重识别模型识别准确率低的问题。
本申请实施例的第一方面,提供了一种行人重识别模型训练方法,包括:构建掩码网络和全局网络,利用特征提取网络、掩码网络和全局网络构建行人重识别模型;获取训练样本,将训练样本输入行人重识别模型,通过特征提取网络提取训练样本的语义特征,分别通过掩码网络和全局网络对语义特征进行处理,得到训练样本的掩码特征和全局特征;分别基于掩码特征和全局特征,利用交叉熵损失函数计算第一分类损失和第二分类损失;分别基于掩码特征和全局特征,利用三元组损失函数计算第一比较损失和第二比较损失;依据第一分类损失、第二分类损失、第一比较损失和第二比较损失更新行人重识别模型的模型参数,以完成对行人重识别模型的训练。
本申请实施例的第二方面,提供了一种行人重识别模型训练装置,包括:构建模块,被配置为构建掩码网络和全局网络,利用特征提取网络、掩码网络和全局网络构建行人重识别模型;处理模块,被配置为获取训练样本,将训练样本输入行人重识别模型,通过特征提取网络提取训练样本的语义特征,分别通过掩码网络和全局网络对语义特征进行处理,得到训练样本的掩码特征和全局特征;分类模块,被配置为分别基于掩码特征和全局特征,利用交叉熵损失函数计算第一分类损失和第二分类损失;比较模块,被配置为分别基于掩码特征和全局特征,利用三元组损失函数计算第一比较损失和第二比较损失;更新模块,被配置为依据第一分类损失、第二分类损失、第一比较损失和第二比较损失更新行人重识别模型的模型参数,以完成对行人重识别模型的训练。
本申请实施例的第三方面,提供了一种电子设备,包括存储器、处理器以及存储在存储器中并且可在处理器上运行的计算机程序,该处理器执行计算机程序时实现上述方法的步骤。
本申请实施例的第四方面,提供了一种计算机可读存储介质,该计算机可读存储介质存储有计算机程序,该计算机程序被处理器执行时实现上述方法的步骤。
本申请实施例与现有技术相比存在的有益效果是:因为本申请实施例通过构建掩码网络和全局网络,利用特征提取网络、掩码网络和全局网络构建行人重识别模型;获取训练样本,将训练样本输入行人重识别模型,通过特征提取网络提取训练样本的语义特征,分别通过掩码网络和全局网络对语义特征进行处理,得到训练样本的掩码特征和全局特征;分别基于掩码特征和全局特征,利用交叉熵损失函数计算第一分类损失和第二分类损失;分别基于掩码特征和全局特征,利用三元组损失函数计算第一比较损失和第二比较损失;依据第一分类损失、第二分类损失、第一比较损失和第二比较损失更新行人重识别模型的模型参数,以完成对行人重识别模型的训练,因此,采用上述技术手段,可以解决现有技术中,因为行人图像存在遮挡,导致行人重识别模型识别准确率低的问题,进而提高行人重识别模型的准确率。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
图1是本申请实施例提供的一种行人重识别模型训练方法的流程示意图(一);
图2是本申请实施例提供的一种行人重识别模型训练方法的流程示意图(二);
图3是本申请实施例提供的一种行人重识别模型训练装置的结构示意图;
图4是本申请实施例提供的一种电子设备的结构示意图。
具体实施方式
以下描述中,为了说明而不是为了限定,提出了诸如特定***结构、技术之类的具体细节,以便透彻理解本申请实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本申请。在其它情况中,省略对众所周知的***、装置、电路以及方法的详细说明,以免不必要的细节妨碍本申请的描述。
图1是本申请实施例提供的一种行人重识别模型训练方法的流程示意图(一)。图1的行人重识别模型训练方法可以由计算机或服务器,或者计算机或服务器上的软件执行。如图1所示,该行人重识别模型训练方法包括:
S101,构建掩码网络和全局网络,利用特征提取网络、掩码网络和全局网络构建行人重识别模型;
S102,获取训练样本,将训练样本输入行人重识别模型,通过特征提取网络提取训练样本的语义特征,分别通过掩码网络和全局网络对语义特征进行处理,得到训练样本的掩码特征和全局特征;
S103,分别基于掩码特征和全局特征,利用交叉熵损失函数计算第一分类损失和第二分类损失;
S104,分别基于掩码特征和全局特征,利用三元组损失函数计算第一比较损失和第二比较损失;
S105,依据第一分类损失、第二分类损失、第一比较损失和第二比较损失更新行人重识别模型的模型参数,以完成对行人重识别模型的训练。
进一步地,构建掩码网络和全局网络,包括:依次连接全局平均池化层和全连接层,得到全局网络;依次连接相乘层、全局最大池化层和全连接层,得到掩码网络。
相乘层用于将训练样本的语义特征和随机掩码相乘。全局平均池化层、全局最大池化层和全连接层均是现有网络层,不再赘述。掩码网络使用全局最大池化层的目的是为了让掩码网络从特征图(本申请实施例中的各种特征均是特征图)中学***均池化层来模糊这些有区分性的特征。同理,行人重识别模型中增加掩码网络,就是为了行人重识别模型学习到有分辨性的特征。
进一步地,利用特征提取网络、掩码网络和全局网络构建行人重识别模型,包括:利用特征提取网络后接掩码网络和全局网络,得到行人重识别模型;其中,掩码网络和全局网络是并行的。
特征提取网络可以是backbone网络。
利用特征提取网络后接掩码网络和全局网络得到的行人重识别模型是最初的模型,仅用于图像或者样本特征的提取和处理,将该模型训练后再后接全连接层和softmax层作为实际使用的模型,可以输出识别结果。也就是训练后的行人重识别模型后接全连接层和softmax层,作为最终使用的行人重识别模型。
根据本申请实施例提供的技术方案,构建掩码网络和全局网络,利用特征提取网络、掩码网络和全局网络构建行人重识别模型;获取训练样本,将训练样本输入行人重识别模型,通过特征提取网络提取训练样本的语义特征,分别通过掩码网络和全局网络对语义特征进行处理,得到训练样本的掩码特征和全局特征;分别基于掩码特征和全局特征,利用交叉熵损失函数计算第一分类损失和第二分类损失;分别基于掩码特征和全局特征,利用三元组损失函数计算第一比较损失和第二比较损失;依据第一分类损失、第二分类损失、第一比较损失和第二比较损失更新行人重识别模型的模型参数,以完成对行人重识别模型的训练,因此,采用上述技术手段,可以解决现有技术中,因为行人图像存在遮挡,导致行人重识别模型识别准确率低的问题,进而提高行人重识别模型的准确率。
进一步地,通过特征提取网络提取训练样本的语义特征,分别通过掩码网络和全局网络对语义特征进行处理,得到训练样本的掩码特征和全局特征,包括:训练样本,包括:目标样本以及目标样本的正样本和负样本;通过特征提取网络分别提取目标样本、正样本和负样本的语义特征;通过掩码网络分别对目标样本、正样本和负样本的语义特征进行处理,得到目标样本、正样本和负样本的掩码特征;通过全局网络分别对目标样本、正样本和负样本的语义特征进行处理,得到目标样本、正样本和负样本的全局特征。
也就是说,将目标样本、正样本和负样本输入行人重识别模型(也是输入特征提取网络),特征提取网络输出目标样本、正样本和负样本的语义特征;目标样本、正样本和负样本的语义特征输入掩码网络分别,输出目标样本、正样本和负样本的掩码特征;目标样本、正样本和负样本的掩码特征输入全局网络,输出目标样本、正样本和负样本的全局特征。
进一步地,分别基于掩码特征和全局特征,利用交叉熵损失函数计算第一分类损失和第二分类损失,包括:训练样本,包括:目标样本以及目标样本的正样本和负样本;分别基于目标样本、正样本和负样本的掩码特征,确定目标样本、正样本和负样本的第一识别结果;分别基于目标样本、正样本和负样本的第一识别结果和标签,利用交叉熵损失函数计算第一分类损失;分别基于目标样本、正样本和负样本的全局特征,确定目标样本、正样本和负样本的第二识别结果;分别基于目标样本、正样本和负样本的第二识别结果和标签,利用交叉熵损失函数计算第二分类损失。
可以是将目标样本、正样本和负样本的掩码特征输入一个softmax层,输出目标样本、正样本和负样本的第一识别结果;利用交叉熵损失函数计算每个样本的第一识别结果和标签之间的分类损失,将目标样本、正样本和负样本对应的该分类损失相加作为第一分类损失。将目标样本、正样本和负样本的全局特征输入一个softmax层,输出目标样本、正样本和负样本的第二识别结果;利用交叉熵损失函数计算每个样本的第二识别结果和标签之间的分类损失,将目标样本、正样本和负样本对应的该分类损失相加作为第二分类损失。
进一步地,分别基于掩码特征和全局特征,利用三元组损失函数计算第一比较损失和第二比较损失,包括:训练样本,包括:目标样本以及目标样本的正样本和负样本;基于目标样本、正样本和负样本的掩码特征,利用三元组损失函数计算第一比较损失;基于目标样本、正样本和负样本的全局特征,利用三元组损失函数计算第二比较损失。
目标样本和正样本作为正样本对,目标样本和负样本作为负样本对。利用三元组损失函数计算目标样本、正样本和负样本的掩码特征的第一比较损失;利用三元组损失函数计算目标样本、正样本和负样本的全局特征的第二比较损失。
进一步地,依据第一分类损失、第二分类损失、第一比较损失和第二比较损失更新行人重识别模型的模型参数,包括:按照预设权值对第一分类损失、第二分类损失、第一比较损失和第二比较损失进行加权求和,得到总损失;依据总损失更新行人重识别模型的模型参数。
基于损失更新模型的模型参数是常用的技术手段,不再赘述。
图2是本申请实施例提供的一种行人重识别模型训练方法的流程示意图(二)。如图2所示,包括:
S201,构建掩码网络和全局网络,利用特征提取网络、掩码网络和全局网络构建行人重识别模型;
S202,获取训练样本,训练样本,包括:目标样本以及目标样本的正样本和负样本,将训练样本输入行人重识别模型:通过特征提取网络分别提取目标样本、正样本和负样本的语义特征;
S203,通过掩码网络分别对目标样本、正样本和负样本的语义特征进行处理,得到目标样本、正样本和负样本的掩码特征;
S204,通过全局网络分别对目标样本、正样本和负样本的语义特征进行处理,得到目标样本、正样本和负样本的全局特征;
S205,分别基于目标样本、正样本和负样本的掩码特征,确定目标样本、正样本和负样本的第一识别结果;
S206,分别基于目标样本、正样本和负样本的第一识别结果和标签,利用交叉熵损失函数计算第一分类损失;
S207,分别基于目标样本、正样本和负样本的全局特征,确定目标样本、正样本和负样本的第二识别结果;
S208,分别基于目标样本、正样本和负样本的第二识别结果和标签,利用交叉熵损失函数计算第二分类损失;
S209,基于目标样本、正样本和负样本的掩码特征,利用三元组损失函数计算第一比较损失;
S210,基于目标样本、正样本和负样本的全局特征,利用三元组损失函数计算第二比较损失;
S211,按照预设权值对第一分类损失、第二分类损失、第一比较损失和第二比较损失进行加权求和,得到总损失;
S212,依据总损失更新行人重识别模型的模型参数,以完成对行人重识别模型的训练。
本申请实施例通过利用掩码网络和全局网络构建行人重识别模型,通过三元组损失函数计算比较损失,通过交叉熵损失函数计算分类损失,解决现有技术中,因为行人图像存在遮挡,导致行人重识别模型识别准确率低的问题,进而提高行人重识别模型的准确率。
上述所有可选技术方案,可以采用任意结合形成本申请的可选实施例,在此不再一一赘述。
下述为本申请装置实施例,可以用于执行本申请方法实施例。对于本申请装置实施例中未披露的细节,请参照本申请方法实施例。
图3是本申请实施例提供的一种行人重识别模型训练装置的示意图。如图3所示,该行人重识别模型训练装置包括:
构建模块301,被配置为构建掩码网络和全局网络,利用特征提取网络、掩码网络和全局网络构建行人重识别模型;
处理模块302,被配置为获取训练样本,将训练样本输入行人重识别模型,通过特征提取网络提取训练样本的语义特征,分别通过掩码网络和全局网络对语义特征进行处理,得到训练样本的掩码特征和全局特征;
分类模块303,被配置为分别基于掩码特征和全局特征,利用交叉熵损失函数计算第一分类损失和第二分类损失;
比较模块304,被配置为分别基于掩码特征和全局特征,利用三元组损失函数计算第一比较损失和第二比较损失;
更新模块305,被配置为依据第一分类损失、第二分类损失、第一比较损失和第二比较损失更新行人重识别模型的模型参数,以完成对行人重识别模型的训练。
可选地,构建模块301还被配置为依次连接全局平均池化层和全连接层,得到全局网络;依次连接相乘层、全局最大池化层和全连接层,得到掩码网络。
相乘层用于将训练样本的语义特征和随机掩码相乘。全局平均池化层、全局最大池化层和全连接层均是现有网络层,不再赘述。掩码网络使用全局最大池化层的目的是为了让掩码网络从特征图(本申请实施例中的各种特征均是特征图)中学***均池化层来模糊这些有区分性的特征。同理,行人重识别模型中增加掩码网络,就是为了行人重识别模型学习到有分辨性的特征。
可选地,构建模块301还被配置为利用特征提取网络后接掩码网络和全局网络,得到行人重识别模型;其中,掩码网络和全局网络是并行的。
特征提取网络可以是backbone网络。
利用特征提取网络后接掩码网络和全局网络得到的行人重识别模型是最初的模型,仅用于图像或者样本特征的提取和处理,将该模型训练后再后接全连接层和softmax层作为实际使用的模型,可以输出识别结果。也就是训练后的行人重识别模型后接全连接层和softmax层,作为最终使用的行人重识别模型。
根据本申请实施例提供的技术方案,构建掩码网络和全局网络,利用特征提取网络、掩码网络和全局网络构建行人重识别模型;获取训练样本,将训练样本输入行人重识别模型,通过特征提取网络提取训练样本的语义特征,分别通过掩码网络和全局网络对语义特征进行处理,得到训练样本的掩码特征和全局特征;分别基于掩码特征和全局特征,利用交叉熵损失函数计算第一分类损失和第二分类损失;分别基于掩码特征和全局特征,利用三元组损失函数计算第一比较损失和第二比较损失;依据第一分类损失、第二分类损失、第一比较损失和第二比较损失更新行人重识别模型的模型参数,以完成对行人重识别模型的训练,因此,采用上述技术手段,可以解决现有技术中,因为行人图像存在遮挡,导致行人重识别模型识别准确率低的问题,进而提高行人重识别模型的准确率。
可选地,处理模块302还被配置为目标样本以及目标样本的正样本和负样本;通过特征提取网络分别提取目标样本、正样本和负样本的语义特征;通过掩码网络分别对目标样本、正样本和负样本的语义特征进行处理,得到目标样本、正样本和负样本的掩码特征;通过全局网络分别对目标样本、正样本和负样本的语义特征进行处理,得到目标样本、正样本和负样本的全局特征。
也就是说,将目标样本、正样本和负样本输入行人重识别模型(也是输入特征提取网络),特征提取网络输出目标样本、正样本和负样本的语义特征;目标样本、正样本和负样本的语义特征输入掩码网络分别,输出目标样本、正样本和负样本的掩码特征;目标样本、正样本和负样本的掩码特征输入全局网络,输出目标样本、正样本和负样本的全局特征。
可选地,分类模块303还被配置为训练样本,包括:目标样本以及目标样本的正样本和负样本;分别基于目标样本、正样本和负样本的掩码特征,确定目标样本、正样本和负样本的第一识别结果;分别基于目标样本、正样本和负样本的第一识别结果和标签,利用交叉熵损失函数计算第一分类损失;分别基于目标样本、正样本和负样本的全局特征,确定目标样本、正样本和负样本的第二识别结果;分别基于目标样本、正样本和负样本的第二识别结果和标签,利用交叉熵损失函数计算第二分类损失。
可以是将目标样本、正样本和负样本的掩码特征输入一个softmax层,输出目标样本、正样本和负样本的第一识别结果;利用交叉熵损失函数计算每个样本的第一识别结果和标签之间的分类损失,将目标样本、正样本和负样本对应的该分类损失相加作为第一分类损失。将目标样本、正样本和负样本的全局特征输入一个softmax层,输出目标样本、正样本和负样本的第二识别结果;利用交叉熵损失函数计算每个样本的第二识别结果和标签之间的分类损失,将目标样本、正样本和负样本对应的该分类损失相加作为第二分类损失。
可选地,比较模块304还被配置为训练样本,包括:目标样本以及目标样本的正样本和负样本;基于目标样本、正样本和负样本的掩码特征,利用三元组损失函数计算第一比较损失;基于目标样本、正样本和负样本的全局特征,利用三元组损失函数计算第二比较损失。
目标样本和正样本作为正样本对,目标样本和负样本作为负样本对。利用三元组损失函数计算目标样本、正样本和负样本的掩码特征的第一比较损失;利用三元组损失函数计算目标样本、正样本和负样本的全局特征的第二比较损失。
可选地,更新模块305还被配置为按照预设权值对第一分类损失、第二分类损失、第一比较损失和第二比较损失进行加权求和,得到总损失;依据总损失更新行人重识别模型的模型参数。
基于损失更新模型的模型参数是常用的技术手段,不再赘述。
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本申请实施例的实施过程构成任何限定。
图4是本申请实施例提供的电子设备4的示意图。如图4所示,该实施例的电子设备4包括:处理器401、存储器402以及存储在该存储器402中并且可在处理器401上运行的计算机程序403。处理器401执行计算机程序403时实现上述各个方法实施例中的步骤。或者,处理器401执行计算机程序403时实现上述各装置实施例中各模块/单元的功能。
电子设备4可以是桌上型计算机、笔记本、掌上电脑及云端服务器等电子设备。电子设备4可以包括但不仅限于处理器401和存储器402。本领域技术人员可以理解,图4仅仅是电子设备4的示例,并不构成对电子设备4的限定,可以包括比图示更多或更少的部件,或者不同的部件。
处理器401可以是中央处理单元(Central Processing Unit,CPU),也可以是其它通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application SpecificIntegrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其它可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。
存储器402可以是电子设备4的内部存储单元,例如,电子设备4的硬盘或内存。存储器402也可以是电子设备4的外部存储设备,例如,电子设备4上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。存储器402还可以既包括电子设备4的内部存储单元也包括外部存储设备。存储器402用于存储计算机程序以及电子设备所需的其它程序和数据。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读存储介质中。基于这样的理解,本申请实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,计算机程序可以存储在计算机可读存储介质中,该计算机程序在被处理器执行时,可以实现上述各个方法实施例的步骤。计算机程序可以包括计算机程序代码,计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。计算机可读介质可以包括:能够携带计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、电载波信号、电信信号以及软件分发介质等。需要说明的是,计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如,在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。
以上实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围,均应包含在本申请的保护范围之内。

Claims (10)

1.一种行人重识别模型训练方法,其特征在于,包括:
构建掩码网络和全局网络,利用特征提取网络、所述掩码网络和所述全局网络构建行人重识别模型;
获取训练样本,将所述训练样本输入所述行人重识别模型,通过所述特征提取网络提取所述训练样本的语义特征,分别通过所述掩码网络和所述全局网络对所述语义特征进行处理,得到所述训练样本的掩码特征和全局特征;
分别基于所述掩码特征和所述全局特征,利用交叉熵损失函数计算第一分类损失和第二分类损失;
分别基于所述掩码特征和所述全局特征,利用三元组损失函数计算第一比较损失和第二比较损失;
依据所述第一分类损失、所述第二分类损失、所述第一比较损失和所述第二比较损失更新所述行人重识别模型的模型参数,以完成对所述行人重识别模型的训练。
2.根据权利要求1所述的方法,其特征在于,通过所述特征提取网络提取所述训练样本的语义特征,分别通过所述掩码网络和所述全局网络对所述语义特征进行处理,得到所述训练样本的掩码特征和全局特征,包括:
所述训练样本,包括:目标样本以及所述目标样本的正样本和负样本;
通过所述特征提取网络分别提取所述目标样本、所述正样本和所述负样本的语义特征;
通过所述掩码网络分别对所述目标样本、所述正样本和所述负样本的语义特征进行处理,得到所述目标样本、所述正样本和所述负样本的掩码特征;
通过所述全局网络分别对所述目标样本、所述正样本和所述负样本的语义特征进行处理,得到所述目标样本、所述正样本和所述负样本的全局特征。
3.根据权利要求1所述的方法,其特征在于,分别基于所述掩码特征和所述全局特征,利用交叉熵损失函数计算第一分类损失和第二分类损失,包括:
所述训练样本,包括:目标样本以及所述目标样本的正样本和负样本;
分别基于所述目标样本、所述正样本和所述负样本的掩码特征,确定所述目标样本、所述正样本和所述负样本的第一识别结果;
分别基于所述目标样本、所述正样本和所述负样本的第一识别结果和标签,利用所述交叉熵损失函数计算所述第一分类损失;
分别基于所述目标样本、所述正样本和所述负样本的全局特征,确定所述目标样本、所述正样本和所述负样本的第二识别结果;
分别基于所述目标样本、所述正样本和所述负样本的第二识别结果和标签,利用所述交叉熵损失函数计算所述第二分类损失。
4.根据权利要求1所述的方法,其特征在于,分别基于所述掩码特征和所述全局特征,利用三元组损失函数计算第一比较损失和第二比较损失,包括:
所述训练样本,包括:目标样本以及所述目标样本的正样本和负样本;
基于所述目标样本、所述正样本和所述负样本的掩码特征,利用所述三元组损失函数计算所述第一比较损失;
基于所述目标样本、所述正样本和所述负样本的全局特征,利用所述三元组损失函数计算所述第二比较损失。
5.根据权利要求1所述的方法,其特征在于,依据所述第一分类损失、所述第二分类损失、所述第一比较损失和所述第二比较损失更新所述行人重识别模型的模型参数,包括:
按照预设权值对所述第一分类损失、所述第二分类损失、所述第一比较损失和所述第二比较损失进行加权求和,得到总损失;
依据所述总损失更新所述行人重识别模型的模型参数。
6.根据权利要求1所述的方法,其特征在于,构建掩码网络和全局网络,包括:
依次连接全局平均池化层和全连接层,得到所述全局网络;
依次连接相乘层、全局最大池化层和所述全连接层,得到所述掩码网络。
7.根据权利要求1所述的方法,其特征在于,利用特征提取网络、所述掩码网络和所述全局网络构建行人重识别模型,包括:
利用所述特征提取网络后接所述掩码网络和所述全局网络,得到所述行人重识别模型;
其中,所述掩码网络和所述全局网络是并行的。
8.一种行人重识别模型训练装置,其特征在于,包括:
构建模块,被配置为构建掩码网络和全局网络,利用特征提取网络、所述掩码网络和所述全局网络构建行人重识别模型;
处理模块,被配置为获取训练样本,将所述训练样本输入所述行人重识别模型,通过所述特征提取网络提取所述训练样本的语义特征,分别通过所述掩码网络和所述全局网络对所述语义特征进行处理,得到所述训练样本的掩码特征和全局特征;
分类模块,被配置为分别基于所述掩码特征和所述全局特征,利用交叉熵损失函数计算第一分类损失和第二分类损失;
比较模块,被配置为分别基于所述掩码特征和所述全局特征,利用三元组损失函数计算第一比较损失和第二比较损失;
更新模块,被配置为依据所述第一分类损失、所述第二分类损失、所述第一比较损失和所述第二比较损失更新所述行人重识别模型的模型参数,以完成对所述行人重识别模型的训练。
9.一种电子设备,包括存储器、处理器以及存储在所述存储器中并且可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至7中任一项所述方法的步骤。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7中任一项所述方法的步骤。
CN202310891827.5A 2023-07-20 2023-07-20 行人重识别模型训练方法及装置 Active CN116612500B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310891827.5A CN116612500B (zh) 2023-07-20 2023-07-20 行人重识别模型训练方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310891827.5A CN116612500B (zh) 2023-07-20 2023-07-20 行人重识别模型训练方法及装置

Publications (2)

Publication Number Publication Date
CN116612500A CN116612500A (zh) 2023-08-18
CN116612500B true CN116612500B (zh) 2023-09-29

Family

ID=87675112

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310891827.5A Active CN116612500B (zh) 2023-07-20 2023-07-20 行人重识别模型训练方法及装置

Country Status (1)

Country Link
CN (1) CN116612500B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116912634B (zh) * 2023-09-12 2023-12-12 深圳须弥云图空间科技有限公司 目标追踪模型的训练方法及装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023272995A1 (zh) * 2021-06-29 2023-01-05 苏州浪潮智能科技有限公司 一种行人重识别方法、装置、设备及可读存储介质
CN115984765A (zh) * 2022-12-07 2023-04-18 上海工程技术大学 基于双流分块网络的行人重识别方法、电子设备和介质
CN116052218A (zh) * 2023-02-13 2023-05-02 中国矿业大学 一种行人重识别方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111597887B (zh) * 2020-04-08 2023-02-03 北京大学 一种行人再识别方法及***

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023272995A1 (zh) * 2021-06-29 2023-01-05 苏州浪潮智能科技有限公司 一种行人重识别方法、装置、设备及可读存储介质
CN115984765A (zh) * 2022-12-07 2023-04-18 上海工程技术大学 基于双流分块网络的行人重识别方法、电子设备和介质
CN116052218A (zh) * 2023-02-13 2023-05-02 中国矿业大学 一种行人重识别方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于金字塔分割和时空注意力的视频行人重识别;王洪元,徐志晨,陈海琴,丁宗元,李鹏辉;常州大学学报(自然科学版);第66-76页 *

Also Published As

Publication number Publication date
CN116612500A (zh) 2023-08-18

Similar Documents

Publication Publication Date Title
CN110020592B (zh) 物体检测模型训练方法、装置、计算机设备及存储介质
CN109086811B (zh) 多标签图像分类方法、装置及电子设备
CN111860398B (zh) 遥感图像目标检测方法、***及终端设备
CN116612500B (zh) 行人重识别模型训练方法及装置
CN116403250A (zh) 存在遮挡的人脸识别方法及装置
CN114330565A (zh) 一种人脸识别方法及装置
CN116912632B (zh) 基于遮挡的目标追踪方法及装置
CN116912635B (zh) 目标追踪方法及装置
CN114120454A (zh) 活体检测模型的训练方法、装置、电子设备及存储介质
CN116912636A (zh) 目标识别方法及装置
CN116502700A (zh) 皮肤检测模型训练方法、皮肤检测方法、装置及电子设备
CN114155388B (zh) 一种图像识别方法、装置、计算机设备和存储介质
CN116912633B (zh) 目标追踪模型的训练方法及装置
CN116912920B (zh) 表情识别方法及装置
CN116912889B (zh) 行人重识别方法及装置
CN116912634B (zh) 目标追踪模型的训练方法及装置
CN117372818B (zh) 目标重识别方法及装置
CN117474037B (zh) 基于空间距离对齐的知识蒸馏方法及装置
CN116935167B (zh) 目标追踪模型的训练方法及装置
CN116912518B (zh) 图像的多尺度特征处理方法及装置
CN115147871B (zh) 遮挡环境下行人再识别方法
CN117475215A (zh) 目标识别模型的训练方法及装置
CN116580063B (zh) 目标追踪方法、装置、电子设备及存储介质
CN117893790A (zh) 基于特征对齐的目标重识别方法及装置
CN118229986A (zh) 密集场景下的对象数量统计方法、装置、设备及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant