CN111985332B

CN111985332B - 一种基于深度学习的改进损失函数的步态识别方法

Info

Publication number: CN111985332B
Application number: CN202010696163.3A
Authority: CN
Inventors: 胡海根; 汪鹏飞; 吴泽成; 周乾伟; 李小薪; 钱汉望
Original assignee: Zhejiang University of Technology ZJUT
Current assignee: Zhejiang University of Technology ZJUT
Priority date: 2020-07-20
Filing date: 2020-07-20
Publication date: 2024-05-10
Anticipated expiration: 2040-07-20
Also published as: CN111985332A

Abstract

一种基于深度学习的改进损失函数的步态识别方法，包括以下步骤：步骤1、获取行人步态数据集；步骤2、对步骤1得到的训练数据进行预处理，利用中心线原则将数据切割成64*64；步骤3、搭建深度卷积神经网络；步骤4、设计损失函数；步骤5、初始化神经网络参数；步骤6、训练搭建好的神经网络，将步骤2得到的训练样本作为输入，对应的实际身份标签作为输出，成批次地输入到网络中，计算损失后，通过反向传播算法，调整网络参数和损失函数的权重；步骤7、使用训练好的网络对未知数据进行识别，分为注册与识别两个阶段。通过本发明的方法能够更好的保留时间和空间维度上的运动信息，在背包、穿大衣等复杂场景下达到更好的识别效果。

Description

一种基于深度学习的改进损失函数的步态识别方法

技术领域

本发明属于计算机视觉技术领域，涉及一种基于深度学习的改进损失函数的步态识别方法。

技术背景

步态识别通过人们走路的姿势进行身份识别，与其它的生物特征识别技术相比，步态识别具有非接触、远距离和不容易伪装等优点，在预防犯罪、法医鉴定和社会保障方面具有广泛的应用。

目前步态识别主要分为看作图像和看作视频序列两大类方法。前者将所有的步态轮廓图压缩成一副图像，将步态识别看成一个图像匹配问题，很显然这种方法忽视了步态中的时间维度上的信息，也无法建模精细的空间维度的信息；后者从轮廓中提取特征，使用LSTM、3D-CNN或者双流法，可以很好地建模步态识别中时间、空间维度的信息，但其计算代价高昂也不易于训练。目前步态识别方法基本都是在去背景的二值化图上面进行，准确率受目标自身的穿着、打扮与摄像头的角度等因素的影响。

发明内容

为了克服现有技术的不足，在易于训练的同时不丢失时间、空间维度的信息，同时能提高在目标穿大衣、背包等复杂场景下的准确率，本发明提供一种基于深度学习的改进损失函数的步态识别方法，将步态图像看成图像集合，并对损失函数进行改进。

为了解决上述技术问题，本发明能够提供如下的技术方案：

一种基于深度学习的改进损失函数的步态识别方法，所述方法包括以下步骤：

步骤1.使用步态识别数据集或者自行建立数据集，所述步态识别数据集为CASIA-B或OU-MVLP，并对数据集进行预处理，过程如下：

1.1)若使用图像采集设备采集行人的步态图像，对采集到的图像使用deeplabv3+提取人体目标轮廓，转换成二值化图像；

1.2)利用中心线原则将图像切割成64*64；

1.3)将数据集分为训练集和测试集；

步骤2.训练阶段，即在训练集上训练深度卷积神经网络，过程如下：

2.1)搭建深度卷积神经网络，CNN模块提取图像的帧级特征，SP模块从帧级特征中提取序列级特征，MGP模块用于提取不同级别的序列信息，HPM用于同时提取局部和全局特征；

2.2)设计损失函数，定义损失函数如下：

其中，an表示原样本，po表示与an同一类别的样本，ne表示与an不同类别的样本，d(x,y)表示x和y在embedding空间上的欧式距离，margin为正整数用于扩大不同标签样本之间的距离，N表示一个batch中样本的数量，M表示类别的数量，P表示一个batch中的人数，K表示一个batch中每个人图片的数量，P(X)表示样本真实的分布，Q(X)表示网络预测的分布，L_BCE和L_BF为改进的损失函数；

2.3)将损失函数的权重σ₁和σ₂作为网络的参数；

2.4)初始化神经网络参数；

2.5)将步骤1得到的训练样本作为输入，对应的实际身份标签作为输出，成批次地输入到网络中，计算损失后，通过反向传播算法，调整网络参数和损失函数的权重；

2.6)重复2.5)，直至训练完成；

步骤3.测试阶段，测试数据为测试集或采集的数据，过程如下：

3.1)注册，输入步态图像序列集合G，通过网络前向传播对G中每一个图像序列g_i计算特征向量，得到特征向量集合F_g，保存在步态数据库中；

3.2)识别，输入步态图像序列Q，目标是在图像序列集合G中遍历全部序列找到相同的身份标签，通过网络前向传播得到特征向量F_q，与步态数据库F_g中每一个特征向量计算欧式距离，距离最小的特征向量对应的身份标签即为Q的标签。

进一步，所述步骤2中，训练阶段设置如下：优化器使用Adam，学习率为1e-4，总迭代次数为80K，batchsize为(8,8)，指一个batch取8个人，每个人8张图像，L_BA+的margin设置为2，损失函数的权重σ₁和σ₂皆初始化为0.5。

本发明的技术构思为：使用卷积神经网络提取步态的空间维度信息，使用注意力机制提取步态的时间维度信息；其次，改进损失函数，并将损失函数的权重作为网络的参数来训练，让权重能自适应。

本发明的有益效果主要表现在：输入的步态图像不需要有序，提高了在目标穿大衣、背包等复杂场景下的准确率。

附图说明

图1是本发明方法的网络结构图。

图2是中心线原则切割示意图。

图3是本发明方法的流程图。

具体实施方式

下面结合附图对本发明进一步描述。

参照图1～图3，一种基于深度学习的改进损失函数的步态识别方法，此方法将步态视为由独立帧组成的图像序列，在提取图像空间特征的同时提取了时间特征，不受帧排列的影响。网络首先对多副图像通过CNN特征提取提取出帧级特征；接着用基于SetPooling的多特征集合池化，从帧级特征中提取序列级特征；同时使用基于多层执行全流程管线MGP的多特征融合，用于不同级别的序列信息；最后，基于HPM的多尺度特征鉴别用于同时提取局部和全局特征。

中心线原则将图像切割成64*64的过程参考图2。

参照图3，基于深度学习的改进损失函数的步态识别方法，包括以下步骤：

1.2)利用中心线原则将图像切割成64*64；

1.3)将数据集分为训练集和测试集；

2.2)设计损失函数，定义损失函数如下：

2.3)将损失函数的权重σ₁和σ₂作为网络的参数；

2.4)初始化神经网络参数；

2.6)重复2.5)，直至训练完成；

本实施例的方案，通过对损失函数的改进，提高了网络在CASIA-B数据集的BG(携带包)和CL(穿大衣)两种复杂场景下的准确率。

Claims

1.一种基于深度学习的改进损失函数的步态识别方法，其特征在于，所述方法包括以下步骤：

步骤1.使用步态识别数据集或者自行建立数据集，所述步态识别数据集包括CASIA-B或OU-MVLP，并对数据集进行预处理，过程如下：

1.2)利用中心线原则将图像切割成64*64；

1.3)将数据集分为训练集和测试集；

2.2)设计损失函数，定义损失函数如下：

其中，an表示原样本，po表示与an同一类别的样本，ne表示与an不同类别的样本，d(x，y)表示x和y在embedding空间上的欧式距离，margin为正整数用于扩大不同标签样本之间的距离，N表示一个batch中样本的数量，M表示类别的数量，P表示一个batch中的人数，K表示一个batch中每个人图片的数量，P(X)表示样本真实的分布，Q(X)表示网络预测的分布，L_BCE和L_BF为改进的损失函数；

2.3)将损失函数的权重σ₁和σ₂作为网络的参数；

2.4)初始化神经网络参数；

2.6)重复2.5)，直至训练完成；

2.如权利要求1所述的一种基于深度学习的改进损失函数的步态识别方法，其特征在于，所述步骤2中，训练阶段设置如下：优化器使用Adam，学习率为1e-4，总迭代次数为80K，batchsize为(8，8)，指一个batch取8个人，每个人8张图像，L_BA+的margin设置为2，损失函数的权重σ₁和σ₂皆初始化为0.5。