CN112131970A

CN112131970A - 一种基于多通道时空网络和联合优化损失的身份识别方法

Info

Publication number: CN112131970A
Application number: CN202010926230.6A
Authority: CN
Inventors: 蒋敏兰; 吴颖; 陈昊然
Original assignee: Zhejiang Normal University CJNU
Current assignee: Zhejiang Normal University CJNU
Priority date: 2020-09-07
Filing date: 2020-09-07
Publication date: 2020-12-25

Abstract

本发明提供一种基于多通道时空网络和联合优化损失的身份识别方法，包括多通道时空网络***和联合优化损失***，所述联合优化损失***包括改进三元损失函数、标签平滑正则化交叉熵损失函数两部分，所述标签平滑正则化交叉熵损失函数为针对传统分类网络在训练过程中交叉熵损失函数，计算所述交叉熵损失中融入标签平滑正则化。解决了基于传统图像方法步态识别跨视角准确度较低且基于模型的步态识别方法计算复杂、耗时长的等问题，为实时身份识别技术提供方法保证。

Description

一种基于多通道时空网络和联合优化损失的身份识别方法

技术领域

本发明涉及身份识别方法技术领域，具体涉及一种基于多通道时空网络和联合优化损失的身份识别方法。

背景技术

近年来，人工智能技术日趋成熟并逐渐走向应用，越来越多的行业开始进入智能技术革新阶段。身份认证领域也从传统的用户名/密码认证、IC卡认证、动态口令认证，逐渐发展成现有的人体生物特征识别认证。利用计算机技术与传感器技术相结合，根据每个人独特的生理特征或者行为特征来完成个人身份的鉴定，是目前安全系数最高的身份认证技术之一。步态识别作为一种新兴的生物特征识别技术，近年来也开始逐渐被挖掘。被识别者无需接触传感器，对步态图像的采集方向和图像质量要求也不高，远距离任意角度即可完成身份认证。虽然目前的步态识别技术还未能达到商用水平，但其独特优势及广泛的应用前景吸引了越来越多的学者参与研究。在新型建设智慧城市报告中，重点强调了公民数字身份认证和网络身份识别技术的安全性，因此发展步态识别技术也可以很好的与其他生物特征识别技术形成互补，为当代智能安防建设中身份认证提供新的思路。现有的CASIA-B数据库为中科院自动化所公开的大型步态数据库CASIA－B，CASIA－B数据库包含124人(男93人，女31人)，每人11个视角(0°,18°,36°,54°,72°，90°，108°，126°，144°，162°，180°)，每个视角下有3种行走状态(普通条件,穿大衣,携带包裹)。

基于步态骨架序列的步态识别在视角变化、携带物等场景下的鲁棒性更强，但细化后的骨架序列丢了大量有效特征，降低了不同个体间的差异性，其优缺点刚好和基于步态轮廓序列的方法形成互补，结合两类步态序列的优势，提出一种多通道时空网络和联合优化损失的步态识别方法，在保证有效特征相似度学习的同时，加快网络训练收敛速度，提高视角变化、携带物等场景下的身份识别准确率。

发明内容

为了解决现有技术中存在的某种或某些技术问题，本发明提供一种基于多通道时空网络和联合优化损失的身份识别方法，解决了基于传统图像方法步态识别跨视角准确度较低且基于模型的步态识别方法计算复杂、耗时长的等问题，为实时身份识别技术提供方法保证。

为解决上述现有的技术问题，本发明采用如下方案：

一种基于多通道时空网络和联合优化损失的身份识别方法，包括多通道时空网络***和联合优化损失***，所述联合优化损失***包括改进三元损失函数、标签平滑正则化交叉熵损失函数两部分，所述标签平滑正则化交叉熵损失函数为针对传统分类网络在训练过程中交叉熵损失函数，计算所述交叉熵损失中融入标签平滑正则化，实现该方法的步骤包括：

步骤一、步态序列预处理，通过步态图像预处理算法，将CASIA－B步态数据库中的步态图像，分别通过步态序列预处理成尺寸一致、中心对齐的步态轮廓序列和骨架序列；

步骤二、将步态序列预处理所得步态骨架序列和轮廓序列共同输入多通道时空网络***，以充分提取步态序列间时空特征；

步骤三、结合三元组网络建立步态身份识别模型；

步骤四、结合改进三元损失和优化交叉熵损失共同监督网络训练。

进一步地，所述多通道时空网络***为采用多通道浅层卷积神经网络串联长短时记忆神经网络的结构作为特征提取的主干网络，并将周期内一一对应的步态骨架、轮廓序列直接作为网络的输入，以充分挖掘步态序列间时空信息。

进一步地，所述改进三元损失为针对三元损失训练过程中正负样本的挑选方式进行改进，在正负样本的选择上增加更强的约束。

进一步地，所述三元损失值的计算方法为在训练过程每个Batch中计算所有样本的空间欧氏距离，并通过距离原样本最近的负样本和距离原样本最远的正样本来计算，其计算公式为：

其中，每个Batch中输入p个类别的原样本，并且每个类别的样本选择k帧不同的步态序列，组成p*k帧步态序列，L_th为最终三元损失值，a表示原样本，A为与原样本距离最远的正样本集合，B为与原样本距离最近的负样本集合。

进一步地，所述标签平滑正则化交叉熵损失函数中的标签平滑正则化方法的计算公式为：

其中，λ为平滑标签的权重，其取值范围为λ∈[0,1]，n为标签种类的个数。

进一步地，在交叉熵损失中融入LSR后的表达式为：

进一步地，联合改进三元损失函数和标签平滑正则化交叉熵损失函数，共同监督网络训练，融合后的所述联合优化损失***损失函数表达式为：

L_total＝k×L_LSR-ce+L_th

其中，L_LSR-ce为加入LSR的交叉熵损失函数，L_th为改进的三元损失函数，k为融合两种损失函数的权重系数。

进一步地，还包括注意力机制，通过所述多通道时空网络***可捕捉到关键帧并对其步态特征重点提取，以增加网络模型的准确率和鲁棒性。

进一步地，所述注意力机制中包含有步态序列的权重，所述步态序列的权重为每类步态序列的共有帧数与对应长短时记忆神经网络输出的分数进行归一化后所得，其计算公式为：

其中，Q_j表示对应j帧步态序列的权重系数，c_j表示长短时记忆神经网络第j帧步态序列融合特征的输出值。

进一步地，根据所得权重系数Q_j进一步计算基于注意力机制的时空特征，其计算公式为：

其中，F表示基于注意力机制获得的时空特征，Q_j为attention机制所得第j帧序列所得权重系数，

为对应j帧步态骨架、轮廓序列的融合特征。

相比现有技术，本发明的有益效果在于：

现有步态骨架相比步态轮廓在视角变化、携带物等场景下的鲁棒性更强，但细化后的骨架序列丢了大量有效特征，降低了不同个体间的差异性，其优缺点刚好和步态轮廓形成互补。通过联合优化损失***首先改进三元损失训练过程中正负样本的挑选方式，从而增强度量学***滑正则化，从而提高网络分类准确率，联合以上两类改进损失函数共同监督网络训练，在保证有效特征距离度量学习的同时，提高分类识别准确率，克服网络不易收敛的问题，有效的解决了基于传统图像方法步态识别跨视角准确度较低且基于模型的步态识别方法计算复杂、耗时长的等问题，为实时身份识别技术提供方法保证，同时提高现代生物行为特征识别技术，保证携带物、穿着等复杂场景下的身份识别的安全性同时，提高步态身份识别准确率。

附图说明

图1为基于多通道时空网络和联合优化损失的身份识别框架示意图；

图2为多通道时空网络***示意图；

图3为本发明联合优化损失方案示意图。

具体实施方式

下面，结合附图以及具体实施方式，对本发明做进一步描述，需要说明的是，在不相冲突的前提下，以下描述的各实施例之间或各技术特征之间可以任意组合形成新的实施例。

如图1～3所示，一种基于多通道时空网络和联合优化损失的身份识别方法，包括多通道时空网络***和联合优化损失***，所述联合优化损失***包括改进三元损失函数、标签平滑正则化交叉熵损失函数两部分，所述标签平滑正则化交叉熵损失函数为针对传统分类网络在训练过程中交叉熵损失函数，计算所述交叉熵损失中融入标签平滑正则化，实现该方法的步骤包括：

步骤三、结合三元组网络建立步态身份识别模型；

在通过步态序列预处理时，首先通过步态图像预处理算法，想步态视频集处理成一帧帧步态图像，并结合姿态估计和图像运动目标提取方法，获取步态骨架图和轮廓图，进一步结合二插值放大及图像质心对齐中心化算法，将步态骨架、轮廓图处理成尺寸一致，中心对齐的步态序列，为后续特征度量学习和分类网络提供实验样本。

所述多通道时空网络***为采用多通道浅层卷积神经网络串联长短时记忆神经网络的结构作为特征提取的主干网络，并将周期内一一对应的步态骨架、轮廓序列直接作为网络的输入，以充分挖掘步态序列间时空信息。

基于上述发明方法，与现有方法相比具有突出的区别和贡献在于：

涉及一种新的多通道时空网络***，通过多通道浅层卷积网络串联长短时记忆网络作为多通道时空网络的主干，以充分提取步态序列时空信息，为后续步态身份识别提高更具鉴别力的步态特征，具体结构如图2所示。

基于多通道时空网络和联合优化损失的步态身份识别方法框架如图1所示，该方法包括：(1)将步态骨架序列和步态轮廓序列共同作为多通道时空网络***的输入，结合注意力机制充分提取步态序列间时空特征，为后续特征度量学***滑正则化(label smoothingregularization,LSR)方法优化交叉熵损失函数，针对传统分类网络在训练过程中，交叉熵损失函数未能有效使用负样本的标签位置造成网络分类识别准确率低，为此选择在计算交叉熵损失中融入标签平滑正则化，从而提高网络分类准确率，联合以上两类优化损失函数共同监督网络训练，在保证有效特征距离度量学习的同时，提高分类识别准确率，克服网络不易收敛的问题；(3)在CASIA-B数据库进行大量对比实验，进一步验证了本发明的有效性。

采用多通道浅层卷积神经网络***串联长短时记忆神经网络的结构作为特征提取的主干网络，并将周期内一一对应的步态骨架、轮廓序列直接作为网络的输入，以充分挖掘步态序列间时空信息。

进一步地对三元损失函数进行改进，该部分主要针对三元损失训练过程中正负样本的挑选方式进行改进，在正负样本的选择上增加更强的约束，即选择异类视角差较小的步态序列作为负样本，同类视角差较大的步态序列作为正样本。通过选取合适的正、负样本，从而有效避免正负样本间欧氏距离过远，进一步增强度量学习网络的泛化性和鲁棒性。

其改进为：所述改进三元损失为针对三元损失训练过程中正负样本的挑选方式进行改进，在正负样本的选择上增加更强的约束；三元损失函数是目前常用特征距离度量学***滑正则化方法来优化计算交叉熵损失，以提高测试网络分类精度。联合以上两类改进损失函数共同监督网络训练，在保证有效特征距离度量学习的同时，提高分类识别准确率，克服网络不易收敛的问题。

所述三元损失值的计算方法为在训练过程每个Batch中计算所有样本的空间欧氏距离，并通过距离原样本最近的负样本和距离原样本最远的正样本来计算，具体的，在训练过程每个Batch中计算所有样本的空间欧氏距离，并通过距离原样本最近的负样本(高相似负样本)和距离原样本最远的正样本(低相似正样本)来计算最终的三元损失，使网络能够快速收敛的同时避免出现震荡的情况。例如：每个Batch中输入p个类别的原样本，并且每个类别的样本选择k帧不同的步态序列，组成p*k帧步态序列。则最终三损失可表示为：

更进一步地对标签平滑正则化交叉熵损失函数进行改进，本文中由于训练集中样本类别数量较多，从而增加了负标签的数量，而在使用传统Softmax计算分类概率的交叉熵损失函数中，采用one-hot标签的计算方式忽略了负样本的标签位置。最终导致网络可以对训练集中样本分类进行良好拟合，但是由于未能有效利用负样本的标签位置，从而造成测试网络的准确率降低。为此，本文通过加入标签平滑正则化(label smoothingregularization,LSR)方法来计算交叉熵损失函数，可使Softmax激活函数的计算结果更靠近正确的输出，从而提高测试网络分类识别准确率。所述标签平滑正则化交叉熵损失函数中的标签平滑正则化方法的计算公式为：

其中，λ为平滑标签的权重，其取值范围为λ∈[0,1]，n为标签种类的个数。在交叉熵损失中融入LSR后的表达式为：

再进一步地对联合优化损失进行改进，通过以上设计和分析，本文联合改进三元损失函数和标签平滑正则化交叉熵损失函数，共同监督网络训练，融合后的所述联合优化损失***损失函数表达式为：

L_total＝k×L_LSR-ce+L_th

其中，L_LSR-ce为加入LSR的交叉熵损失函数，L_th为改进的三元损失函数，k为融合两种损失函数的权重系数。作为网络的超参数其取值范围为[0,1]，可以根据网络的训练情况对其进行调整。

通过上述联合优化损失策略，将会有效控制所设置模型的网络收敛，使网络逼近优化曲线，从而达到有效相似性计量，提高个体细粒度分类准确率。

人的步态运动实质上可看作时序问题，因此周期内的每帧步态序列也有严格的先后次序，每帧步态轮廓、骨架图均代表步态周期内的某一瞬间的运动姿态。因此，在保证提取图像形状特征的基础上，能否充分挖掘步态序列间的时序信息，是进行特征距离相似度学习和提高身份识别准确率的关键。与卷积神经网络相比，循环神经网络则更擅长序列数据的特征学习，因此本文结合卷积神经网络和长短时记忆网络提出一种多通道时空网络，并融合注意力机制重复提取步态序列间时空信息，其具体结构如图2所示。

在图2多通道时空特征提取网络中，将一一对应轮廓序列和骨架序列共同作为输入，由于步态轮廓序列为二值图，骨架序列为RGB图，因此输入前首先两两类步态序列处理成尺寸一致。进一步分别输入双通道卷积网络提取步态序列空间特征，并以张量拼接的形式融合特征。长短时记忆网络层则采用包含256个隐含节点的双层网络，将卷积网络输出融合特征图按照时间顺序作为后层网络的输入，通过LSTM模块解码，从而提取其中时序特征。

在以上的基础上还引入了注意力机制(Attention)，该方法解决了传统的连续图像序列处理网络中只能对有限帧输入进行特征提取的缺点，从而最大程度地利用步态周期中不同帧之间的关联，减弱周期中无关帧对于网络输出结果的影响。通过多通道时空网络可捕捉到关键帧并对其步态特征重点提取，以增加网络模型的准确率和鲁棒性，若每类步态序列共有Z帧，则对应长短时记忆神经网络输出Z个分数。归一化后作为每帧序列的权重，其计算方法由式为：

其中，Q_j表示对应j帧步态序列的权重系数，c_j表示长短时记忆神经网络第j帧步态序列融合特征的输出值，因此，根据所得权重系数可进一步计算基于注意力机制的时空特征，其计算公式为：

为对应j帧步态骨架、轮廓序列的融合特征。

上述实施方式仅为本发明的优选实施方式，不能以此来限定本发明保护的范围，本领域的技术人员在本发明的基础上所做的任何非实质性的变化及替换均属于本发明所要求保护的范围。

Claims

1.一种基于多通道时空网络和联合优化损失的身份识别方法，其特征在于：包括多通道时空网络***和联合优化损失***，所述联合优化损失***包括改进三元损失函数、标签平滑正则化交叉熵损失函数两部分，所述标签平滑正则化交叉熵损失函数为针对传统分类网络在训练过程中交叉熵损失函数，计算所述交叉熵损失中融入标签平滑正则化，实现该方法的步骤包括：

步骤三、结合三元组网络建立步态身份识别模型；

2.根据权利要求1所述的一种基于多通道时空网络和联合优化损失的身份识别方法，其特征在于：所述多通道时空网络***为采用多通道浅层卷积神经网络串联长短时记忆神经网络的结构作为特征提取的主干网络，并将周期内一一对应的步态骨架、轮廓序列直接作为网络的输入，以充分挖掘步态序列间时空信息。

3.根据权利要求1所述的一种基于多通道时空网络和联合优化损失的身份识别方法，其特征在于：所述改进三元损失为针对三元损失训练过程中正负样本的挑选方式进行改进，在正负样本的选择上增加更强的约束。

4.根据权利要求3所述的一种基于多通道时空网络和联合优化损失的身份识别方法，其特征在于：所述三元损失值的计算方法为在训练过程每个Batch中计算所有样本的空间欧氏距离，并通过距离原样本最近的负样本和距离原样本最远的正样本来计算，其计算公式为：

5.根据权利要求4所述的一种基于多通道时空网络和联合优化损失的身份识别方法，其特征在于：所述标签平滑正则化交叉熵损失函数中的标签平滑正则化方法的计算公式为：

6.根据权利要求5所述的一种基于多通道时空网络和联合优化损失的身份识别方法，其特征在于：在交叉熵损失中融入LSR后的表达式为：

7.根据权利要求6所述的一种基于多通道时空网络和联合优化损失的身份识别方法，其特征在于：联合改进三元损失函数和标签平滑正则化交叉熵损失函数，共同监督网络训练，融合后的所述联合优化损失***损失函数表达式为：L_total＝k×L_LSR-ce+L_th

8.根据权利要求1～7任一项所述的一种基于多通道时空网络和联合优化损失的身份识别方法，其特征在于：还包括注意力机制，通过所述多通道时空网络***可捕捉到关键帧并对其步态特征重点提取，以增加网络模型的准确率和鲁棒性。

9.根据权利要求8所述的一种基于多通道时空网络和联合优化损失的身份识别方法，其特征在于：所述注意力机制中包含有步态序列的权重，所述步态序列的权重为每类步态序列的共有帧数与对应长短时记忆神经网络输出的分数进行归一化后所得，其计算公式为：

10.根据权利要求9所述的一种基于多通道时空网络和联合优化损失的身份识别方法，其特征在于：根据所得权重系数Q_j进一步计算基于注意力机制的时空特征，其计算公式为：

为对应j帧步态骨架、轮廓序列的融合特征。