CN112115780A - 一种基于深度多模型协同的半监督行人重识别方法 - Google Patents

一种基于深度多模型协同的半监督行人重识别方法 Download PDF

Info

Publication number
CN112115780A
CN112115780A CN202010803514.6A CN202010803514A CN112115780A CN 112115780 A CN112115780 A CN 112115780A CN 202010803514 A CN202010803514 A CN 202010803514A CN 112115780 A CN112115780 A CN 112115780A
Authority
CN
China
Prior art keywords
training
pseudo
data
labels
deep
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010803514.6A
Other languages
English (en)
Inventor
王进军
辛晓萌
万星宇
邓烨
惠思奇
黄文丽
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xian Jiaotong University
Original Assignee
Xian Jiaotong University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xian Jiaotong University filed Critical Xian Jiaotong University
Priority to CN202010803514.6A priority Critical patent/CN112115780A/zh
Publication of CN112115780A publication Critical patent/CN112115780A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Software Systems (AREA)
  • Molecular Biology (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Mathematical Physics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种基于深度多模型协同的半监督行人重识别方法,包括步骤:1)采用部分有标签的训练数据样本微调多个ImageNet上预训练过的深度神经网络,将这些模型作为初始模型;2)利用这些初始模型对没有标签的训练样本提取特征,接着提出一个自适应权重多视图聚类的方法对无标签训练样本产生伪标签,有标签的训练样本和带有伪标签的训练样本组合成整体的训练数据,采用这些训练数据微调训练多个结构相异构的深度神经网络;3)交替的迭代伪标签产生和深度网络训练直到伪标签不在改变。

Description

一种基于深度多模型协同的半监督行人重识别方法
技术领域
本发明属于图像特征表示和半监督学习领域,具体涉及一种基于深度多模型协同的半监督行人重识别方法。
背景技术
随着社会经济的不断发展与计算机视觉技术的不断进步,智能安防、智慧城市建设不断被推进,智能化处理不同场景的视频数据成为了计算机视觉领域广泛关注的难题。行人再识别是实现智能安防与智慧城市战略的一项关键技术,给定一个场景中的一幅或者多幅行人的图像,行人再识别技术要求能够在其他不相邻的场景中找到与该图像匹配的行人的所有图像。在不同的场景中,光照条件的不同、行人姿态的变化、图像背景的变动、成像质量的差异通常会导致同一行人类内的变化大于不同行人类间的变化,这给行人再识别任务带来了严峻的挑战。
近年来,受益于深度卷积神经网络的强大性能,行人重识别技术在大规模数据集上达到了优秀的识别准确度。但是大多数方法都是在全监督学习的基础上提出的。由于需要大量人工标记的训练数据,监督学习在实际环境和工业场景中的价值本质是有限的。随着智能安防,智慧城市的需求日益迫切,在实际场景中对已有方法进行实现和应用成为了广泛关注的问题。而现实情境下,在所有应用环境(比如大型购物中心、城市社区街道)中都进行大量数据标记是十分困难的,可以想象标注人员通过观看一组参数不同的相机在不同时间和不同地点拍摄到的视频记录并搜索定位同一个行人有多困难。因此,实际场景中行人重识别首先需要面对的问题就是标记数据的严重缺乏。为了克服全监督学习方法对大规模数据的严重依赖,已经出现了一些半监督或无监督学习方法。半监督行人重识别方法通过结合少量标记数据和大量未标记数据,最大化利用监督信息并充分挖掘无监督信息,实现行人检索的目标。
发明内容
本发明的目的在于针对上述现有技术的不足,提供了一种基于深度多模型协同的半监督行人重识别方法。
本发明采用如下技术方案来实现的:
一种基于深度多模型协同的半监督行人重识别方法,包括以下步骤:
1)采用部分有标签的训练数据样本微调多个ImageNet上预训练过的深度神经网络,将这些模型作为初始模型;
2)利用这些初始模型对没有标签的训练样本提取特征,接着提出一个自适应权重多视图聚类的方法对无标签训练样本产生伪标签,有标签的训练样本和带有伪标签的训练样本组合成整体的训练数据,采用这些训练数据微调训练多个结构相异构的深度神经网络;
3)交替的迭代伪标签产生和深度网络训练直到伪标签不在改变。
本发明进一步的改进在于,步骤1)的具体实现方法如下:
101)首先训练多个结构不同的神经网络作为多个视图下的特征提取器;
102)利用提出的自适应权重多视图聚类方法对多个异构神经网络的特征进行聚类,得到无标签数据的伪标签;
103)利用有标注数据和带有伪标签的无标注数据微调多个异构神经网络,多个深度网络的更新和伪标签的更新交替进行。
本发明进一步的改进在于,步骤2)的具体实现方法如下:
201)采用部分带有标签的数据训练多个异构神经网络作为初始参数;
202)随后采用第一步训练的多个深度神经网络对无标签数据提取特征,接着利用自适应权重多视图聚类方法对无标签数据的特征聚类,得到无标签数据的初始伪标签;
203)将第二步得到的带有伪标签的无标注数据和有标注的数据相融合再次训练多个深度神经网络,深度神经网络训练和聚类的训练交替进行直到伪标签不在改变,得到最终的伪标签。
本发明至少具有如下有益的技术效果:
1.本发明在训练深度神经网络的过程中只需要利用一部分准确标注的数据,随后通过对大量无标签数据打伪标签的方法来帮助网络训练。
2.本发明利用多个深度神经网络对无标签数据提取特征,发挥多个深度网络特征的多样性,并且利用提出的自适应权重多视图聚类方法对异构网络特征聚类,从而得到具有较好精确度的伪标签。
附图说明
图1为本发明框架的流程图。
具体实施方式
以下结合附图和实施例对本发明做出进一步的说明。
如图1所示,假设有M种形态的特征,υ=1,2,...,M.,的算法可以写成如下的形式:
Figure BDA0002628262760000031
其中xl和xu分别代表有标签和无标签的训练样本。Nl和Nu分别代表有标签和无标签训练样本的数目。wυ代表第υ个深度神经网络中的参数,yl和yu分别代表有标签的标签和无标签数据的伪标签。
Figure BDA0002628262760000032
为深度神经网络的损失函数,
Figure BDA0002628262760000033
代表多视图估计伪标签损失函数。
深度神经网络的损失函数主要依据两个不同的任务,它们分别是识别任务和验证任务。的损失函数可以写成如下的形式:
Figure BDA0002628262760000041
对于基础的特征区分性学习,将识别任务看作是一个多分类的任务。
Figure BDA0002628262760000042
可以表示为:
Figure BDA0002628262760000043
其中
Figure BDA0002628262760000044
为预测概率,p为目标概率。
针对验证部分,没有采用对比损失函数,对比损失函数强制相同的类别尽可能的距离相近。当训练数据集属于每一类的样本较少时,这可能会使得深度神经网络倾向于过拟合。本文的验证损失是一个二值的逻辑回归损失函数,定义图像特征对为(φ(xa,w),φ(xb,w))。
Figure BDA0002628262760000045
可以表示为:
Figure BDA0002628262760000046
其中
Figure BDA0002628262760000047
是预测概率。假如图像特征对预测结果为同一个人,那么q1=1,q2=0,反之q1=0,q2=1。
多视图伪标签估计部分是利用无标签数据多个异构的深度神经网络特征聚类来获得无标签数据的伪标签。一种最直接的方法是将无标签数据多个视图的特征拼接成一个特征,然后执行标准的聚类算法。但是,在这种情况下,重要视图下和次重要视图下的特征被同等对待,导致聚类算法结果不是最优的。理想情况是将不同视图下的特征同时聚类并且将每个视图下的结果联合起来得到最终的结果。为了达到这个目标,本发明的多视图伪标签估计损失函数可以写成如下形式:
Figure BDA0002628262760000048
其中
Figure BDA0002628262760000049
代表无标签数据组合成的矩阵,矩阵的每一列为一个无标签数据。
Figure BDA0002628262760000051
代表第υ个视图的深度卷积网络特征。
Figure BDA0002628262760000052
为第υ个视图下的中心点矩阵。
Figure BDA0002628262760000053
满足1-of-Ku的形式。Ku为期望聚类的数目。αυ为第υ个视图下的权重因子。
本发明方法的优化流程如下:
本发明采用交替优化迭代算法优化提出的模型,优化步骤如下:
初始化:初始化wυ采用一小部分标记的数据训练多个不同结构的深度卷积网络。B通过单个视图的Kmeans聚类初始化,权重因子αυ=1/M。
更新B:通多最小化如下的子问题来更新B:
Figure BDA0002628262760000054
为了优化式(6),将其写为:
Figure BDA0002628262760000055
其中
Hυ=Tr{(Φυ-CυBT)Dυ((Φυ-CυBT)T}, (8)
Figure BDA0002628262760000056
其中e(υ)i是如下矩阵的第i行:
Eυ=(Φυ)T-B(Cυ)T. (10)
1)固定参数B,Dυ,αυ,更新每个视图下的聚类中心Cυ,对于J计算关于Cυ的倒数,可以得到:
Figure BDA0002628262760000057
其中
Figure BDA0002628262760000061
令式(11)为零,Cυ有如下表示:
Figure BDA0002628262760000062
2)固定参数Cυ,Dυ,αυ,更新聚类中心矩阵B:
Figure BDA0002628262760000063
为了优化式(14),固定i,向量
Figure BDA0002628262760000064
最小化如下的问题:
Figure BDA0002628262760000065
其中
Figure BDA0002628262760000066
是对角矩阵
Figure BDA0002628262760000067
的第i个元素,b满足1-of-Ku的形式,对于式(15)有Ku个后选值,每一个为矩阵的第ku列,具体来说,做一个详尽的搜索找出式(15)的最优解:
Figure BDA0002628262760000068
其中ku为:
Figure BDA0002628262760000069
3)固定参数Cυ,B,αυ,根据式(9)和(10)更新Dυ
4)固定参数Cυ,B,Dυ,更新αυ
Figure BDA00026282627600000610
要使式(18)达到局部最小,αυ有如下表示:
Figure BDA00026282627600000611
交替迭代Cυ,B,Dυ,αυ,并且重复以上过程直到式(6)收敛。
更新yu:这一步骤用来更新无标签数据的伪标签。当得到B,就得到每一个无标签样本的伪标签ku。无标签样本总的类别数目为Ku,有标签样本总的类别数目为Kl。yu有如下表示:
yu=ku+Kl. (20)
更新wυ:利用有标签的数据以及带有伪标签的剩余数据训练深度卷积神经网络。更新wυ通过最小化下式:
Figure BDA0002628262760000071
对于式(21),采用随机梯度下降优化wυ
本发明提出了一种基于深度多模型协同的半监督行人重识别算法,能够在一个端到端的学习过程中实现标记数据的特征学习和未标记数据的伪标签估计。为了提高伪标签估计的准确性,本发明提出了弱模型协同的学习策略,能够标记更多有质量的数据来提升特征学习的性能。

Claims (3)

1.一种基于深度多模型协同的半监督行人重识别方法,其特征在于,包括以下步骤:
1)采用部分有标签的训练数据样本微调多个ImageNet上预训练过的深度神经网络,将这些模型作为初始模型;
2)利用这些初始模型对没有标签的训练样本提取特征,接着提出一个自适应权重多视图聚类的方法对无标签训练样本产生伪标签,有标签的训练样本和带有伪标签的训练样本组合成整体的训练数据,采用这些训练数据微调训练多个结构相异构的深度神经网络;
3)交替的迭代伪标签产生和深度网络训练直到伪标签不在改变。
2.根据权利要求1所述的一种基于深度多模型协同的半监督行人重识别方法,其特征在于,步骤1)的具体实现方法如下:
101)首先训练多个结构不同的神经网络作为多个视图下的特征提取器;
102)利用提出的自适应权重多视图聚类方法对多个异构神经网络的特征进行聚类,得到无标签数据的伪标签;
103)利用有标注数据和带有伪标签的无标注数据微调多个异构神经网络,多个深度网络的更新和伪标签的更新交替进行。
3.根据权利要求2所述的一种基于深度多模型协同的半监督行人重识别方法,其特征在于,步骤2)的具体实现方法如下:
201)采用部分带有标签的数据训练多个异构神经网络作为初始参数;
202)随后采用第一步训练的多个深度神经网络对无标签数据提取特征,接着利用自适应权重多视图聚类方法对无标签数据的特征聚类,得到无标签数据的初始伪标签;
203)将第二步得到的带有伪标签的无标注数据和有标注的数据相融合再次训练多个深度神经网络,深度神经网络训练和聚类的训练交替进行直到伪标签不在改变,得到最终的伪标签。
CN202010803514.6A 2020-08-11 2020-08-11 一种基于深度多模型协同的半监督行人重识别方法 Pending CN112115780A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010803514.6A CN112115780A (zh) 2020-08-11 2020-08-11 一种基于深度多模型协同的半监督行人重识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010803514.6A CN112115780A (zh) 2020-08-11 2020-08-11 一种基于深度多模型协同的半监督行人重识别方法

Publications (1)

Publication Number Publication Date
CN112115780A true CN112115780A (zh) 2020-12-22

Family

ID=73804030

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010803514.6A Pending CN112115780A (zh) 2020-08-11 2020-08-11 一种基于深度多模型协同的半监督行人重识别方法

Country Status (1)

Country Link
CN (1) CN112115780A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113255601A (zh) * 2021-06-29 2021-08-13 深圳市安软科技股份有限公司 一种车辆重识别模型的训练方法、***及相关设备
CN113326826A (zh) * 2021-08-03 2021-08-31 新石器慧通(北京)科技有限公司 网络模型的训练方法、装置、电子设备及存储介质
CN114186615A (zh) * 2021-11-22 2022-03-15 浙江华是科技股份有限公司 船舶检测半监督在线训练方法、装置及计算机存储介质
CN115496131A (zh) * 2022-08-30 2022-12-20 北京华控智加科技有限公司 基于多个预训练神经网络的设备健康状态分类方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100077006A1 (en) * 2008-09-22 2010-03-25 University Of Ottawa Re-identification risk in de-identified databases containing personal information
CN110555390A (zh) * 2019-08-09 2019-12-10 厦门市美亚柏科信息股份有限公司 基于半监督训练方式的行人重识别方法、装置及介质
CN111274958A (zh) * 2020-01-20 2020-06-12 福州大学 一种网络参数自纠正的行人重识别方法及***
CN111488760A (zh) * 2019-01-25 2020-08-04 复旦大学 基于深度多示例学习的少样本行人重识别方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100077006A1 (en) * 2008-09-22 2010-03-25 University Of Ottawa Re-identification risk in de-identified databases containing personal information
CN111488760A (zh) * 2019-01-25 2020-08-04 复旦大学 基于深度多示例学习的少样本行人重识别方法
CN110555390A (zh) * 2019-08-09 2019-12-10 厦门市美亚柏科信息股份有限公司 基于半监督训练方式的行人重识别方法、装置及介质
CN111274958A (zh) * 2020-01-20 2020-06-12 福州大学 一种网络参数自纠正的行人重识别方法及***

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
XIAOMENG XIN,AND ETC: "Semi-supervised person re-identification using multi-view clustering", 《PATTERN RECOGNITION》 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113255601A (zh) * 2021-06-29 2021-08-13 深圳市安软科技股份有限公司 一种车辆重识别模型的训练方法、***及相关设备
CN113326826A (zh) * 2021-08-03 2021-08-31 新石器慧通(北京)科技有限公司 网络模型的训练方法、装置、电子设备及存储介质
CN114186615A (zh) * 2021-11-22 2022-03-15 浙江华是科技股份有限公司 船舶检测半监督在线训练方法、装置及计算机存储介质
CN114186615B (zh) * 2021-11-22 2022-07-08 浙江华是科技股份有限公司 船舶检测半监督在线训练方法、装置及计算机存储介质
CN115496131A (zh) * 2022-08-30 2022-12-20 北京华控智加科技有限公司 基于多个预训练神经网络的设备健康状态分类方法
CN115496131B (zh) * 2022-08-30 2023-06-13 北京华控智加科技有限公司 基于多个预训练神经网络的设备健康状态分类方法

Similar Documents

Publication Publication Date Title
CN110689086B (zh) 基于生成式对抗网络的半监督高分遥感图像场景分类方法
CN108960140B (zh) 基于多区域特征提取和融合的行人再识别方法
CN112115780A (zh) 一种基于深度多模型协同的半监督行人重识别方法
CN110717526B (zh) 一种基于图卷积网络的无监督迁移学习方法
CN113326731B (zh) 一种基于动量网络指导的跨域行人重识别方法
CN111639564B (zh) 一种基于多注意力异构网络的视频行人重识别方法
CN110929679B (zh) 一种基于gan的无监督自适应行人重识别方法
CN111950372B (zh) 一种基于图卷积网络的无监督行人重识别方法
CN107609460A (zh) 一种融合时空双重网络流和attention机制的人体行为识别方法
CN112883839B (zh) 基于自适应样本集构造与深度学习的遥感影像解译方法
CN112347970B (zh) 一种基于图卷积神经网络的遥感影像地物识别方法
CN111027421A (zh) 一种基于图的直推式半监督行人再识别方法
CN110188827B (zh) 一种基于卷积神经网络和递归自动编码器模型的场景识别方法
CN111723645A (zh) 用于同相机内有监督场景的多相机高精度行人重识别方法
CN111274958B (zh) 一种网络参数自纠正的行人重识别方法及***
CN109635708B (zh) 一种基于三数据集交叉迁移学习的无监督行人再识别方法
CN106874862B (zh) 基于子模技术和半监督学习的人群计数方法
CN111967325A (zh) 一种基于增量优化的无监督跨域行人重识别方法
CN109829414B (zh) 一种基于标签不确定性和人体组件模型的行人再识别方法
CN107301382B (zh) 基于时间依赖约束下深度非负矩阵分解的行为识别方法
CN113642547B (zh) 一种基于密度聚类的无监督域适应人物重识别方法及***
CN108596240B (zh) 一种基于判别特征网络的图像语义分割方法
CN111695531B (zh) 一种基于异构卷积网络的跨域行人再识别方法
CN115375951A (zh) 一种基于图元迁移网络的小样本高光谱图像分类方法
CN114548256A (zh) 一种基于对比学习的小样本珍稀鸟类识别方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20201222

RJ01 Rejection of invention patent application after publication