CN109598197A

CN109598197A - 基于密集连接模块的沙漏模型的设计方法

Info

Publication number: CN109598197A
Application number: CN201811283711.9A
Authority: CN
Inventors: 周东生; 孟繁明; 易鹏飞; 刘瑞
Original assignee: Dalian University
Current assignee: Dalian University
Priority date: 2018-10-31
Filing date: 2018-10-31
Publication date: 2019-04-09

Abstract

本发明涉及姿态估计领域，提出了基于密集连接模块的的沙漏模型的设计方法，实现了基于自底向上结构的姿态估计的人体关节点的预测。本发明利用密集连接网络模块实现关节点特征的提取，通过融合高斯模板函数和残差模块提取的特征图形成总响应图。通过将上一阶段的总响应图作为下一阶段的输入，实现对各关节点空间信息特征的充分学习，从而提升关节点的预测准确率。用深度学习框架中对模型进行训练，训练结果证明该模型相较原模型在部分关节点的预测准确率上有了提升。说明了该发明中新构造的模型的有效性。

Description

基于密集连接模块的沙漏模型的设计方法

技术领域

本发明涉及姿态估计领域，是一种基于密集连接模块的的沙漏模型的设计方法。具体涉及到利用密集连接模块构造一种类似沙漏结构的神经网络模型，通过训练后实现对人体关节点的预测。

背景技术

由于深度卷积神经网络在特征提取方面有着极大的优势，越来越多的学者将卷积网络应用于处理计算机视觉任务，人体姿态估计作为视觉任务的一个分支由此得到了极大的进展，在图像处理技术高速发展的今天，姿态估计由于图像背景，拍摄视角，人体衣物遮挡等因素影响关节点预测精度，故而人体姿态估计仍旧是视觉任务的一大难题。

Tompson等人通过在图像的某个小区域用一个“位置精调”来估计关节偏移位置的方法来构建模型，这个网络模型使用先进的卷积网络来级联训练这样可以提高人体关节定位精度；Wei，Shih-En等人提出的CPM方法使用了顺序化的卷积架构来表达空间信息和纹理信息，该方法对每一阶段都监督训练，采用中继监督防训练止了梯度弥散问题，提高了关节点定位的精度；Newell等人提出了Stacked Hourglass结构，使用类似沙漏状的网络形状,重复使用自顶向下到自下向上方法来推断人体的关节点位置，使得定位进度得到极大的提升。G.Huang等人提出的密集连接网络模型将网络中的所有层都互相连接，使得网络中的每一层都接受它之前的所有层的连接，从而最大化了网络中的信息流，可以学习到更丰富的特征。以解决当前人体姿态图像中在复杂关节点定位为精度不高的问题。

尽管前人在基于深度神经网络的人体姿态估计设计了多种模型，提出了很多以中继监督思想为指导的模型算法，但是在人体姿态估计领域中，对前人的沙漏模型网络的改进，新的网络架构的研究仍然有重大意义。

发明内容

本发明的目的在于提出一种就密集连接模块构造一种类似沙漏结构的神经网络模型，将密集连接网络模型与跳级网络模型相结合，通过特征融合实现对参数较少，预测结果准确的神经网络结构模型。

本发明的技术方案为：首先对图像数据预处理，通过卷积层提取64*64的图像作为输入，将该图像分两路进行处理，一路通过跳级结构处理保留图像的原始信息，一路对通过密集连接网络学习图像特征，进行图像推理，将两路的处理结果与事前生成的高斯模板函数进行融合得到总响应图，然后将得到的总响应图作为下一阶段的输入，通过之前的操作步骤，最后得到的总响应图，实现关节点预测的功能。

基于密集连接模块的沙漏模型的设计方法，具体包括以下步骤：

步骤1：加载人体姿态图像数据集；

步骤2：对数据集进行数据预处理，处理方法为，对图像数据进行卷积处理，过滤器的大小为7*7，步长为2；

步骤3：计算不同尺度下的不同部位的响应图，响应图分为两部分：经过密集连接网络处理之后再进行升采样操作所形成的特征响应图，以及密集连接模块在原尺寸上提取的特征响应图；

步骤4：融合不同部位的响应图为总体响应图，并找到各部位的最大响应点为预测值；所述的总体响应图，是由一个高斯模板函数、以及步骤3提取的特征响应图相加所得；

步骤5：将上一阶段预测的特征图作为下一阶段的输入，重复步骤2、3、4；

步骤6：每输出一次总体响应图为一个阶段，本方法总共为四个阶段。

本发明的有益效果是：

1、本发明相较于原模型在训练的每一阶段都使用权重共享，减少了训练的参数量，降低了对计算资源的需求。

2、本发明在特征提取阶段使用密集连接网络模块，相较于原模型可以获取更丰富的特征与各关节的空间信息。

3、本发明中通过对原沙漏模型的改进，将上一阶段的总响应图作为下一阶段的输入，减少了计算过程，而且提升关节点预测的准确率。

附图说明

图1为基于密集连接模块的沙漏模型的整体程序流程图；

图2为沙漏模型的特征提取模块说明图；

图3为密集连接网络模块说明图。

具体实施方式

下面结合附图和实施例对本发明作进一步说明。

结合图1的整体程序流程图，以及图2的特征提取模块图和图3的密集连接网络模块图下面进行详细步骤介绍:

步骤1：加载人体姿态图像数据集Z；

步骤2：对数据集Z进行数据预处理,输入为图像的高*宽*通道数表示为H*W*3，过滤器的大小为7*7，步长为2，得到64*64的特征图；

步骤3：原始特征图经过降采样之后，输入到密集连接模块的沙漏模型子网络中，输出结果经过线性单元处理之后，得到输出通道为256的特征图，最后经过卷积核数量k＝1，卷积步长s＝1的卷积过滤后得到H/2*W/2*K的响应图；

步骤4：将步骤3得到的响应图与残差模块在原尺寸上提取的特征响应图以及事先生成的高斯响应模板函数相加，得到总响应图，通过最小化函数f_t找到各部位的最大响应点为预测值。

其中z为数据集Z的子集，p为第p个关节点，某个关节点的响应图，为该关阶段的真值。

步骤5：本方法总共为四个阶段，每输出一次总体响应图为一个阶段，将上一阶段预测的特征图作为下一阶段的输入如将stage1的输出结果作为stage2的输入,重复步骤2、3、4。

实施例1

本发明的实施例是在以本发明技术方案为前提下进行实施的，在深度学习框架TensorFlow下运行，给出了详细的实施方式和具体的操作过程，但本发明的保护范围不限于下述实施例。本实施例以在数据集FLIC以及处理后的MPII数据集下运行

步骤1：加载人体姿态图像数据集Z；

步骤2：对数据集Z进行数据预处理,输入为H*W*3，过滤器的大小为7*7，步长为2，得到64*64的特征图；

步骤3：原始特征图经过降采样之后，输入到密集连接模块的沙漏模型子网络中，输出结果经过线性单元处理之后，得到输出通道为256的特征图，最后经过k＝1，s＝1的卷积过滤后得到H/2*W/2*K的响应图；

其中p为第p个关节点，为某个关节点的响应图，为该关阶段的真值。

步骤6：程序结束。

综上所述，利用密集连接网络模块构造的沙漏模型，通过密集连接网络模块进行特征提取，并与保留关节点原始信息的特征进行融合，通过最小化所有关节点的真值与预测值组成的L2范式，生成了总特征响应图，并通过深度学习框架TensorFlow在FLIC和MPII数据集上进行训练，实验结果进一步证明了改进后的沙漏模型的有效性，由此证明该方法是有效可行的。

表1：为在FLIC数据集上本方法与原方法对关节点的预测准确率对比

表2：为在MPII数据集上本方法与原方法对关节点的预测准确率对比

以上所述，仅为本发明较佳的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明披露的技术范围内，根据本发明的技术方案及其发明构思加以等同替换或改变，都应涵盖在本发明的保护范围内。

Claims

1.基于密集连接模块的沙漏模型的设计方法，其特征在于，包括以下步骤：

步骤1：加载人体姿态图像数据集；

步骤2：对数据集进行数据预处理；

步骤3：计算不同尺度下的不同部位的响应图；

步骤4：融合不同部位的响应图为总体响应图，并找到各部位的最大响应点为预测值；

2.根据权利要求1所述的基于密集连接模块的沙漏模型的设计方法，其特征在于：步骤2所述的数据预处理方法为，对图像数据进行卷积处理，过滤器的大小为7*7，步长为2。

3.根据权利要求1所述的基于密集连接模块的沙漏模型的设计方法，其特征在于：步骤3所述的计算不同尺寸下部件的响应图分为两部分：经过密集连接网络处理之后再进行升采样操作所形成的特征响应图，以及密集连接模块在原尺寸上提取的特征响应图。

4.根据权利要求1所述的基于密集连接模块的沙漏模型的设计方法，其特征在于：步骤4的具体操作方法为：将步骤3得到的响应图与残差模块在原尺寸上提取的特征响应图以及事先生成的高斯响应模板函数相加，得到总响应图；

通过最小化函数f_t找到各部位的最大响应点为预测值：

其中z为数据集Z的子集，p为第p个关节点，为某个关节点的响应图，为该关阶段的真值。