CN109033971A

CN109033971A - 一种基于残差网络思想的高效行人重识别方法

Info

Publication number: CN109033971A
Application number: CN201810673779.1A
Authority: CN
Inventors: 庞善臣; 乔思波; 李文好; 于世行; 王丽华
Original assignee: China University of Petroleum East China
Current assignee: China University of Petroleum East China
Priority date: 2018-06-27
Filing date: 2018-06-27
Publication date: 2018-12-18

Abstract

本发明提供了一种基于残差网络思想的高效行人重识别方法。本发明将行人重识别问题看成是传统的二分类问题。在设计的卷积神经网络模型中加入了残差网络的思想，设计了两种不同的残差网络模块，可以使得模型有较大的深度，提取更加有效、精细的行人图片特征，但是不会引起梯度消失问题。在每个卷积层之后加入BatchNormalization层，可以对提取的特征做不同的归一化处理，加快网络在训练过程中前向传播的速度，使得模型效率提升，有效减少模型出现过拟合现象。在残差网络模块之后，对提取的两张图片特征做邻域差值处理，获得两张图片之间的特征局部关系，为最后进行的分类处理提供了有效保证。本发明提供的技术方案可以对行人图片达到精确识别分类，并且具有识别效率高、处理速度快的特点。

Description

一种基于残差网络思想的高效行人重识别方法

技术领域

本发明涉及行人重识别领域，具体涉及利用残差网络思想设计卷积网络模型对行人进行重识别的方法。

背景技术

行人重识别技术是智能视频分析、视频监控、人机交互等诸多领域的核心技术，如果能够对监控所拍摄的行人图片进行准确的识别，对于分析行人的运动轨迹和对行人快速检索具有重要的意义。通过行人重识别技术，不仅能够提高视频监控人员的工作效率，而且对于社会公共安全提供了有力的保障。

近年来，深度学习得到了快速的发展，卷积神经网络作为深度学习的一种方式，在图像分类、目标检测、图像语义分割等领域取得了一系列突破性的研究成果。卷积神经网络提供了一种端到端的学习模式，减少了人工对于图像处理的干预。残差网络是卷积神经网络的结构组合的形式结果，通过使用残差网络的思想，能够让模型有更大的深度，提出更加有效的图像特征，并不会引起梯度消失或者梯度***的问题，从而为图像精确匹配识别提供了良好的基础条件。

传统的行人重识别技术存在以下缺点：人工成本大，空间复杂度较高，而且对于行人识别的准确率较低。

发明内容

为了解决现有技术的缺点，本发明提出了一种基于残差网络思想的高效行人重识别方法，将行人重识别看成是传统的二分类问题，包括以下步骤：

A、对公开数据集CUHK-03中1163个行人图片重新整理；

B、设计了两种不同的残差网络模块，将整理数据集中的训练集输入到整个网络模型对模型进行训练，同时，采用验证数据集微调训练模型的超参数，保证模型的准确率和鲁棒性。

C、保存已训练好的模型，测试模型的准确率。

部分A中，将公开数据集CUHK-03整理成模型所需要的形式，即：将数据集中的所有图片分别放在a，b两个文件夹，两个文件夹下都有‘train’，‘validation’，‘test’3个子文件，‘train’子文件下有以0-1162数字命名的子文件，数字表示每个不同的行人，每个以数字命名的文件夹下有相应行人的图片。‘validation’子文件下有以0-99数字命名的子文件，每个以数字命名的文件夹下有相应行人的图片。‘test’子文件下有以0-99数字命名的子文件，每个以数字命名的文件夹下有相应行人的图片。

部分B中，网络模型详细介绍如下：该模型一共包括五层，分别是图像预处理层、残差网络模块层、特征差值处理层、特征汇聚层和全连接处理层。在图像预处理层、残差模块层中，输入的两张图像共享所有的权重矩阵参数，这样能够提取两张相同图像的相似特征。在模型中经过卷积处理之后都会采用BatchNormalization处理，目的是归一化处理提取的图像特征，加快网络前向传播的速度，有效减少模型出现过拟合现象。首先，模型将两张图片经过图像预处理层进行简单预处理之后，我们将输出的结果送入残差网络模块层，提取两张图像的深层特征。在残差网络模块中包括设计的两种不同的残差网络模块，交替使用两种模块，可以加深网络模型的深度，提取更加有效的图像特征，而且又能保证网络模型不会因为层数的增加出现梯度消失的现象。然后，将残差网络模块层输出的特征矩阵送入特征差值处理层，通过矩阵差异处理，提取每个矩阵的空间结构信息和特征差异信息，获得两张图片之间特征的局部关系。我们使用特征汇聚层总结提取的矩阵局部关系，简化处理提取的特征矩阵。最后，经过全连接处理层进行二分类，得到结果概率值，判断输入的两张图片是否是同一个人。

部分C中，将数据集按照一定的比例分为训练集、验证集和测试集，采用测试集对已调整好的模型进行测试，得到模型在测试集上的准确度。经验证，已调整好的模型在测试集上的准确率仍能和训练集一样，保持在较高水平。

本发明设计的模型带来的有益效果是：

本发明通过残差网络的思想设计出两种不同的残差网络模块，在整个网络模型中交替使用，加深了网络模型的深度，提取出更加有效的图片信息，同时，并不会引起梯度消失的问题。在残差模块之后，使用邻域差值法，提取两张图片特征的局部关系，将显著特征更加明显的表现出来，有益于分类效果。

附图说明

为了更清楚地说明本发明的技术方案，下面将对发明内容中所需要使用的附图作简要的介绍。

图1为本发明提供一种基于残差网络思想的高效行人重识别方法的CUHK-03数据集整理之后的详解图；

图2为本发明提供一种基于残差网络思想的高效行人重识别方法的流程图；

图3为本发明提供卷积神经网络模型的结构示意图。

图4为本发明提供卷积神经网络模型的详细构建示意图。

图5为本发明提供“Identityblock”模块的结构示意图。

图6为本发明提供“Convolutional block”模块的结构示意图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚，下面将对本发明实施方式作进一步地详细描述。

实施例一

本实施例的基础在于，事先处理CUHK-03数据集，得到160×60像素的行人图片，然后将其输入到残差网络模块。

在残差网络模块层中设计了两种不同的模块，一种是‘identity block’，另一种是‘convolutionalblock’。‘identityblock’，即输入层的激活值(a^l)与N次卷积之后输出层的中间状态值(z^l+n)维度相同。在本次发明模型中，输入层激活值(a^l)经过‘shortpath’与两次卷积之后的输出层中间状态值(z^l+2)相加，得到输出激活值(a^l+2),其函数表达式为a^l+2＝g(z^l+2+a^l)，g(x)为激活函数。‘convolutionalblock’，即输入层的激活值(a^l)与N次卷积之后输出层的中间状态值(z^l+n)维度不相同的时候使用。在本次发明模型中，输入层激活值(a^l)经过‘shortpath’与三次卷积之后的输出层中间状态值(z^l+3)相加，但是两者的维度不相同，于是采用了一次卷积对输入层激活值(a^l)的维度进行调整，得到与z^l+3相同的然后将与输出层中间状态值(z^l+3)相加，其函数表达式为g(x)为激活函数。

经过两种不同的残差网络模块的组合，使得模型对两张输入的图像更加有效的提取图像特征值，然后对特征矩阵做邻域差值处理，效果更加显著，从而有利于图像的分类识别。

Claims

1.一种基于残差网络思想的高效行人重识别方法，包括以下部分：

A、对公开数据集CUHK-03中1163个行人图片重新整理；

B、设计卷积神经网络模型，将整理数据集中的训练集输入到网络模型对模型进行训练，训练结束之后，采用验证数据集微调训练好模型的超参数，保证模型的准确率。

C、保存训练好的模型，测试模型的准确率。

2.根据权利要求1所述的一种基于残差网络思想的高效行人重识别方法，其特征在于，所述的部分A中，将公开数据集CUHK-03整理成模型所需要的形式，即：将数据集中的所有图片分别放在a，b两个文件夹，两个文件夹下都有‘train’，‘validation’，‘test’3个子文件，‘train’子文件下有以0-1162数字命名的子文件，数字表示每个不同的行人，每个以数字命名的文件夹下有相应行人的图片。‘validation’子文件下有以0-99数字命名的子文件，每个以数字命名的文件夹下有相应行人的图片。‘test’子文件下有以0-99数字命名的子文件，每个以数字命名的文件夹下有相应行人的图片。

3.根据权利要求1所述的一种基于残差网络思想的高效行人重识别方法，其特征在于，所述的部分B中，卷积神经网络模型详细介绍如下：该模型一共包括五层，分别是图像预处理层、残差网络模块层、特征差值处理层、特征汇聚层和全连接处理层。在图像预处理层、残差模块层中，输入的两张图像共享所有的权重矩阵参数，这样能够提取两张相同图像的相似特征。在模型中经过卷积处理之后都会采用BatchNormalization处理，目的是归一化处理提取的图像特征，加快网络前向传播的速度，有效减少模型出现过拟合现象。首先，模型将两张图片经过图像预处理层进行简单预处理之后，我们将输出的结果送入残差网络模块层，提取两张图像的深层特征。在残差网络模块中包括设计的两种不同的残差网络模块，交替使用两种模块，可以加深网络模型的深度，提取更加有效的图像特征，而且又能保证网络模型不会因为层数的增加出现梯度消失的现象。然后，将残差网络模块层输出的特征矩阵送入特征差值处理层，通过矩阵差异处理，提取每个矩阵的空间结构信息和特征差异信息，获得两张图片之间特征的局部关系。我们使用特征汇聚层总结提取的矩阵局部关系，简化处理提取的特征矩阵。最后，经过全连接处理层进行二分类，得到结果概率值，判断输入的两张图片是否是同一个人。

4.根据权利要求1所述的一种基于残差网络思想的高效行人重识别方法，其特征在于，所述的部分C中，将数据集按照一定的比例分为训练集、验证集、测试集，采用测试集对已训练好的模型进行测试，得到模型在测试集上的准确度。经验证，已训练好的模型在测试集上的准确率仍能和训练集一样，保持在较高水平。