CN111860267A

CN111860267A - 一种基于人体骨骼关节点位的多通道健身运动识别方法

Info

Publication number: CN111860267A
Application number: CN202010667131.0A
Authority: CN
Inventors: 林型双; 蔡建平; 刘若愚; 叶力; 何喆
Original assignee: Hangzhou City University
Current assignee: Hangzhou City University
Priority date: 2020-07-13
Filing date: 2020-07-13
Publication date: 2020-10-30
Anticipated expiration: 2040-07-13
Also published as: CN111860267B

Abstract

本发明涉及一种基于人体骨骼关节点位的多通道健身运动识别方法，包括：步骤1、采集人体运动深度图像时序数据；步骤2、建立用于第一通道的人体骨骼关节点位变化数据集。本发明的有益效果是：本发明通过基于LSTM的深度学习算法的双通道模型进行学习训练后，对运动姿态进行识别，骨骼关节点位数据相比于传统的图像数据更加精确，定位和检测人体运动更加准确；引入地面方程，能准确的判断人体关节点位和所在地面的空间关系，进而能更准确的识别人体的空间关系，增强识别方法对不同环境变化的适应性；先采用NTU RGB+D数据集中的骨架数据对模型进行训练，再使用自建的人体健身运动数据集进行迁移学习训练，提升模型识别的准确率。

Description

一种基于人体骨骼关节点位的多通道健身运动识别方法

技术领域

本发明涉及图像识别技术领域，尤其涉及一种基于人体骨骼关节点位的多通道健身运动识别方法。

背景技术

为加快推动从以治病为中心转变为以人民健康为中心，政府部门动员全社会落实预防为主方针，实施健康中国行动，提高全民健康水平。在政府部门支持下，公众对健身运动也比以往更加重视。而在进行健身运动时，不标准或不规范的健身动作往往会使运动效果适得其反，不利于社会公众健康素质的提升，还有可能带来运动损伤。选用更准确的健身运动识别方法对于社会公共健康具有重要意义。

在图像识别技术中，基于传统的RGB CV的识别方法虽具有丰富的图像信息，但在提取人体运动特征时候，往往会受到环境光照水平和技术本身的限制而影响其识别的速度和识别准确率；而近些年提出的基于深度图像关节点判断，虽能提取出骨骼关节点位进行了识别判断，但很难确定其运动者在运动时的人***置(如地面)和设备间的位置关系，在运动动作准确率方面同样受限。

相关文献如下：

邓小亚于2019年刊载在西南师范大学学报(自然科学版)上的《基于RGB颜色空间的视频运动目标检测》；

许艳、侯振杰、梁久祯、陈宸、贾靓和宋毅于2018年刊载在计算机辅助设计与图形学学报上的《权重融合深度图像与骨骼关键帧的行为识别》。

发明内容

本发明的目的是克服现有技术中的不足，提供一种基于人体骨骼关节点位的多通道健身运动识别方法。

这种基于人体骨骼关节点位的多通道健身运动识别方法，包括以下步骤：

步骤1、采集人体运动深度图像时序数据：招募各年龄段的志愿者若干名，在对志愿者进行专业健身运动培训后，让志愿者在标准时间内进行健身运动动作，使用AzureKinect DK 对志愿者运动过程的深度图像时间序列数据进行采集；

步骤2、建立用于第一通道的人体骨骼关节点位变化数据集：

步骤3、建立用于第二通道的人体骨骼关节点位与地面距离数据集；

步骤4、参照人体骨骼关节点位变化数据集和人体骨骼关节点位与地面距离数据集的建立方法，对NTU RGB+D数据集中的数据进行处理，将NTU RGB+D数据集划分为基于NTURGB +D的人体骨骼关节点位变化数据集和基于NTU RGB+D的人体骨骼关节点位与地面距离数据集；

步骤5、建立基于LSTM的深度学习算法的双通道模型，使用基于LSTM的深度学习算法分别对运动时的人体骨骼关节点位变化数据集和人体骨骼关节点位与地面距离数据集进行训练，并将第一通道和第二通道的结果融合后输出，得出分类结果；

步骤6、将Azure Kinect DK深度摄像头采集到的使用者运动数据经过步骤2、步骤3和步骤4的处理后，输入步骤5建立的基于LSTM的深度学习算法的双通道模型，进行健身运动识别。

作为优选，所述步骤2具体包括如下步骤：

步骤2.1、获取采集到的深度图像中的人体t个关节点位的骨骼关节点位数据，t∈[1,32] 每一帧数据为：

x_j＝{a₁,a₂,…,a_k,…,a₃₂}

上式中，j为下标，a_i为一组三维坐标，第k组三维坐标a_k＝(a_kx,a_ky,a_kz)；a_kx、a_ky和a_kz分别为a_k的x坐标、y坐标和z坐标；

一组序列数据为：

x＝{x₁,x₂,…,x_j,…,x_n}

上式中，n为一组数据的总帧数，j为下标；每组序列数据的标签为y_i，将一组序列数组表示为(x_i,y_i)；

步骤2.2、将人体骨骼关节点位变化数据集划分为训练集和测试集。

作为优选，所述步骤3具体包括如下步骤：

步骤3.1、确定最低平面点集合：由于在实际视野中存在多个平面，因此，需要找出视野中最低的平面，通过Azure Kinect DK深度摄像头，选择沿着重力方向上垂直距离与深度相机最远的点的集合，由于三维点云图像中存在噪声，则规定高度差在设定距离μ厘米的点为一个平面，将点与单位化的重力向量相乘，得到相对于原点的高度H：

上式中，P为点云中的一个点，G为重力向量,H为相对于原点的高度；

步骤3.2、获取视野中最低的一组点：

步骤3.2.1、在空间几何中，最低平面方程为：

Ax+By+Cz+D＝0

上式中，平面的法向量n＝[A,B,C]，其中A、B、C、D均为常数；删除一个组件，指定 C＝1，则有：

Ax+By+D＝-z

步骤3.2.2、将步骤4.1中Ax+By+D＝-z转化为矩阵形式：

上式中n为这一组点的下标上限；A、B、D均为常数；

步骤3.2.3、将矩阵转置并执行最小二乘法：

上式中，n为这一组点的下标上限；A、B、D均为常数；N为点集合中点的个数，转置并执行最小二乘法的结果为：

上式中，N为点集合中点的个数，A、B、D均为常数；i为这一组点的下标上限；化简得：

上式中，N为点集合中点的个数，A、B、D均为常数；i为这一组点的下标上限；

步骤3.2.4、对上式剔除一个维度：

上式中，A、B均为常数；i为这一组点的下标上限；

步骤3.2.5、根据克拉默法则求解确定平面：

D＝∑xx∑yy-∑xy∑xy

a＝(∑yz∑xy-∑xz∑yy)/D

b＝(∑xy∑xz-xx∑yz)/D

n＝[A,B,1]

上式中，A、B、D均为常数；n为平面的法向量；

步骤3.3、确定平面后，对人体骨骼关节点位变化数据集中的数据进行处理，建立人体骨骼关节点位与地面距离数据集；

步骤3.3.1、读取序列数据中每一帧的信息

x_j＝{a₁,a₂,…,a_k,…,a₃₂}

上式中，j为下标，a_k为第k组三维坐标，a_k＝(a_kx,a_ky,a_kz)；

步骤3.3.2、计算a₁～a₃₂的距离数据：

上式中，d_k为第k组三维坐标的距离数据，a_kx、a_ky和a_kz分别为a_k的x坐标、y坐标和z坐标；A、B、C、D均为常数；

步骤3.3.3、将第二通道的帧数据更新为：

x_j＝{d₁,d₂,…,d_k,…,d₃₂}

上式中，j、k均为下标；则一组序列数据为：

x＝{x₁,x₂,…,x_j,…,x_n}

上式中，n为一组数据的总帧数，j为下标；

步骤3.3.4、每组序列数据的标签为y_i，将一组序列数组表示为(x_i,y_i)，i为下标；

步骤3.3.5、人体骨骼关节点位与地面距离数据集建立完成后，将人体骨骼关节点位与地面距离数据集划分为训练集和测试集。

作为优选，所述步骤5具体包括如下步骤：

步骤5.1、通过遗忘门决定要舍弃的信息：

f_t＝σ(W_f·[h_t-1,x_t]+b_f)

上式中，f_t为遗忘门，σ为sigmod函数，W_f为权值，h_t-1为上一时刻隐藏层的输出，x_t为当前的输入，b_f为偏置项；

步骤5.2、通过输入门决定要输入的信息：

i_t＝σ(W_i·[h_t-1,x_t]+b_i)

上式中，i_t为输入门，σ为sigmod函数，W_i为权值，h_t-1为上一时刻隐藏层的输出，x_t为当前的输入，b_i为偏置项；

步骤5.2.1、计算备选的更新内容C′_t：

C′_t＝tanh(W_C·[h_t-1,x_t]+b_C)

上式中，C′_t为备选的更新内容，W_C为权值，h_t-1为上一时刻隐藏层的输出，x_t为当前的输入，b_C为偏置项；

步骤5.2.2、更新细胞状态C_t：

C_t＝f_t*C_t-1+i_t*C′_t

上式中，C_t为更新后的细胞状态，f_t为遗忘门，C_t-1为更新前的细胞状态，i_t为输入门， C′_t为备选的更新内容；

步骤5.3、通过输出门输出：

o_t＝σ(W_o·[h_t-1,x_t]+b_o)

h_t＝o_t*tanh(C_t)

上式中，o_t为输出门，W_o为权值，h_t-1为上一时刻隐藏层的输出，x_t为当前的输入，b_o为偏置项；

步骤5.4、采用交叉熵损失函数作为损失函数：

上式中，i为下标，C为类别数；y_i为指示变量，若预测结果与实际样本类别相同，则指示变量y_i为1，反之指示变量y_i为0；p_i为预测该样本类别的概率；

步骤5.5、通过Softmax进行分类，对应的运动类别为最大值：

上式中，z_i表示神经网络输出时第i个结点的输出值，z_j表示神经网络输出时第j个结点的输出值，i、j为下标，C为类别数；

步骤5.6、采用基于NTU RGB+D的人体骨骼关节点位变化数据集和基于NTU RGB+D的人体骨骼关节点位与地面距离数据集对基于LSTM的深度学习算法的双通道模型进行训练，让基于LSTM的深度学习算法对人体的日常姿态进行学习；

步骤5.7、进行迁移学习训练：将人体骨骼关节点位变化数据集和人体骨骼关节点位与地面距离数据集输入基于LSTM的深度学习算法的双通道模型完成模型训练。

作为优选，所述步骤1中所述健身运动动作包括深蹲、后抬腿跑、平板支撑、卷腹、悬垂举腿、仰卧起坐和俯卧撑。

作为优选，所述步骤3.2.1中最低平面方程为超定的解空间。

作为优选，所述步骤3.1中规定高度差在设定距离为3厘米的点为一个平面。

本发明的有益效果是：本发明基于LSTM的深度学习算法的双通道模型对人体骨骼关节点位在运动中的时序数据进行学习训练后，对运动姿态进行识别，骨骼关节点位数据相比于传统的图像数据更加精确，定位和检测人体运动更加准确；本发明引入地面方程，能准确的判断人体关节点位和所在地面的空间关系，进而能更准确的识别人体的空间关系，增强识别方法对不同环境变化的适应性；本发明先采用NTU RGB+D数据集中的骨架数据对模型进行训练，让模型对人体日常中正常的活动动作进行学习，再使用自建的人体健身运动数据集进行迁移学习训练，提升模型识别的准确率。

附图说明

图1为Azure Kinect DK深度摄像头的示意图；

图2为基于LSTM的深度学习算法的双通道模型的处理流程图；

图3为健身运动识别流程图。

具体实施方式

下面结合实施例对本发明做进一步描述。下述实施例的说明只是用于帮助理解本发明。应当指出，对于本技术领域的普通人员来说，在不脱离本发明原理的前提下，还可以对本发明进行若干修饰，这些改进和修饰也落入本发明权利要求的保护范围内。

本发明提出一种基于人体骨骼关节点位的多通道健身运动识别方法，通过采集运动者在运动过程中人体骨骼关节点位的时序数据，并结合地面方程，从而可以准确判断人体关节点位和所在地面的空间关系，然后采用深度学习中的LSTM神经网络，建立双通道模型对运动动作进行识别，在模型的训练上，我们先采用了NTU RGB+D数据集中的骨架数据对模型进行训练，再使用自建的人体健身运动的数据集进行迁移学习训练，在运动识别率和识别速度方面得到明显改善。

作为一种实施例，如图3所示，一种基于人体骨骼关节点位的多通道健身运动识别方法，包括以下步骤：

步骤1、采集人体运动深度图像时序数据：招募各年龄段的志愿者若干名，在对志愿者进行专业健身运动培训后，让志愿者在标准时间内进行健身运动动作，使用如图1所示的 Azure Kinect DK对志愿者运动过程的深度图像时间序列数据进行采集；健身运动动作包括深蹲、后抬腿跑、平板支撑、卷腹、悬垂举腿、仰卧起坐和俯卧撑；

步骤2、建立用于第一通道的人体骨骼关节点位变化数据集：

x_j＝{a₁,a₂,…,a_k,…,a₃₂}

一组序列数据为：

x＝{x₁,x₂,…,x_j,…,x_n}

步骤2.2、将人体骨骼关节点位变化数据集划分为训练集和测试集；

步骤3.1、确定最低平面点集合：通过Azure Kinect DK深度摄像头，选择沿着重力方向上垂直距离与深度相机最远的点的集合，规定高度差在设定距离3厘米的点为一个平面，将点与单位化的重力向量相乘，得到相对于原点的高度H：

步骤3.2、获取视野中最低的一组点：

步骤3.2.1、在空间几何中，最低平面方程为：

Ax+By+Cz+D＝0

上式中，平面的法向量n＝[A,B,C]，其中A、B、C、D均为常数；最低平面方程为超定的解空间；删除一个组件，指定C＝1，则有：

Ax+By+D＝-z

步骤3.2.2、将步骤4.1中Ax+By+D＝-z转化为矩阵形式：

上式中n为这一组点的下标上限；A、B、D均为常数；

步骤3.2.3、将矩阵转置并执行最小二乘法：

步骤3.2.4、对上式剔除一个维度：

上式中，A、B均为常数；i为这一组点的下标上限；

步骤3.2.5、根据克拉默法则求解确定平面：

D＝∑xx∑yy-∑xy∑xy

a＝(∑yz∑xy-∑xz∑yy)/D

b＝(∑xy∑xz-xx∑yz)/D

n＝[A,B,1]

上式中，A、B、D均为常数；n为平面的法向量；

步骤3.3.1、读取序列数据中每一帧的信息

x_j＝{a₁,a₂,…,a_k,…,a₃₂}

上式中，j为下标，a_k为第k组三维坐标，a_k＝(a_kx,a_ky,a_kz)；

步骤3.3.2、计算a₁～a₃₂的距离数据：

步骤3.3.3、将第二通道的帧数据更新为：

x_j＝{d₁,d₂,…,d_k,…,d₃₂}

上式中，j、k均为下标；则一组序列数据为：

x＝{x₁,x₂,…,x_j,…,x_n}

上式中，n为一组数据的总帧数，j为下标；

步骤3.3.5、人体骨骼关节点位与地面距离数据集建立完成后，将人体骨骼关节点位与地面距离数据集划分为训练集和测试集；

步骤5、建立如图2所示的基于LSTM的深度学习算法的双通道模型，使用基于LSTM的深度学习算法分别对运动时的人体骨骼关节点位变化数据集和人体骨骼关节点位与地面距离数据集进行训练，并将第一通道和第二通道的结果融合后输出，得出分类结果；

步骤5.1、通过遗忘门决定要舍弃的信息：

f_t＝σ(W_f·[h_t-1,x_t]+b_f)

步骤5.2、通过输入门决定要输入的信息：

i_t＝σ(W_i·[h_t-1,x_t]+b_i)

步骤5.2.1、计算备选的更新内容C′_t：

C′_t＝tanh(W_C·[h_t-1,x_t]+b_C)

步骤5.2.2、更新细胞状态C_t：

C_t＝f_t*C_t-1+i_t*C′_t

步骤5.3、通过输出门输出：

o_t＝σ(W_o·[h_t-1,x_t]+b_o)

h_t＝o_t*tanh(C_t)

步骤5.4、采用交叉熵损失函数作为损失函数：

步骤5.5、通过Softmax进行分类，对应的运动类别为最大值：

Claims

1.一种基于人体骨骼关节点位的多通道健身运动识别方法，其特征在于，包括以下步骤：

步骤1、采集人体运动深度图像时序数据：招募各年龄段的志愿者若干名，在对志愿者进行专业健身运动培训后，让志愿者在标准时间内进行健身运动动作，使用Azure KinectDK对志愿者运动过程的深度图像时间序列数据进行采集；

步骤2、建立用于第一通道的人体骨骼关节点位变化数据集：

步骤4、参照人体骨骼关节点位变化数据集和人体骨骼关节点位与地面距离数据集的建立方法，对NTU RGB+D数据集中的数据进行处理，将NTU RGB+D数据集划分为基于NTU RGB+D的人体骨骼关节点位变化数据集和基于NTU RGB+D的人体骨骼关节点位与地面距离数据集；

2.根据权利要求1所述基于人体骨骼关节点位的多通道健身运动识别方法，其特征在于，所述步骤2具体包括如下步骤：

步骤2.1、获取采集到的深度图像中的人体t个关节点位的骨骼关节点位数据，t∈[1,32]每一帧数据为：

x_j＝{a₁,a₂,…,a_k,…,a₃₂}

一组序列数据为：

x＝{x₁,x₂,…,x_j,…,x_n}

3.根据权利要求1所述基于人体骨骼关节点位的多通道健身运动识别方法，其特征在于，所述步骤3具体包括如下步骤：

步骤3.1、确定最低平面点集合：通过Azure Kinect DK深度摄像头，选择沿着重力方向上垂直距离与深度相机最远的点的集合，规定高度差在设定距离μ厘米的点为一个平面，将点与单位化的重力向量相乘，得到相对于原点的高度H：

步骤3.2、获取视野中最低的一组点：

步骤3.2.1、在空间几何中，最低平面方程为：

Ax+By+Cz+D＝0

上式中，平面的法向量n＝[A,B,C]，其中A、B、C、D均为常数；删除一个组件，指定C＝1，则有：

Ax+By+D＝-z

步骤3.2.2、将步骤4.1中Ax+By+D＝-z转化为矩阵形式：

上式中n为这一组点的下标上限；A、B、D均为常数；

步骤3.2.3、将矩阵转置并执行最小二乘法：

步骤3.2.4、对上式剔除一个维度：

上式中，A、B均为常数；i为这一组点的下标上限；

步骤3.2.5、根据克拉默法则求解确定平面：

D＝∑xx∑yy-∑xy∑xy

a＝(∑yz∑xy-∑xz∑yy)/D

b＝(∑xy∑xz-xx∑yz)/D

n＝[A,B,1]

上式中，A、B、D均为常数；n为平面的法向量；

步骤3.3.1、读取序列数据中每一帧的信息

x_j＝{a₁,a₂,…,a_k,…,a₃₂}

上式中，j为下标，a_k为第k组三维坐标，a_k＝(a_kx,a_ky,a_kz)；

步骤3.3.2、计算a₁～a₃₂的距离数据：

步骤3.3.3、将第二通道的帧数据更新为：

x_j＝{d₁,d₂,…,d_k,…,d₃₂}

上式中，j、k均为下标；则一组序列数据为：

x＝{x₁,x₂,…,x_j,…,x_n}

上式中，n为一组数据的总帧数，j为下标；

4.根据权利要求1所述基于人体骨骼关节点位的多通道健身运动识别方法，其特征在于，所述步骤5具体包括如下步骤：

步骤5.1、通过遗忘门决定要舍弃的信息：

f_t＝σ(W_f·[h_t-1,x_t]+b_f)

步骤5.2、通过输入门决定要输入的信息：

i_t＝σ(W_i·[h_t-1,x_t]+b_i)

步骤5.2.1、计算备选的更新内容C′_t：

C′_t＝tanh(W_C·[h_t-1,x_t]+b_C)

步骤5.2.2、更新细胞状态C_t：

C_t＝f_t*C_t-1+i_t*C′_t

上式中，C_t为更新后的细胞状态，f_t为遗忘门，C_t-1为更新前的细胞状态，i_t为输入门，C′_t为备选的更新内容；

步骤5.3、通过输出门输出：

o_t＝σ(W_o·[h_t-1,x_t]+b_o)

h_t＝o_t*tanh(C_t)

步骤5.4、采用交叉熵损失函数作为损失函数：

步骤5.5、通过Softmax进行分类，对应的运动类别为最大值：

5.根据权利要求1所述基于人体骨骼关节点位的多通道健身运动识别方法，其特征在于：所述步骤1中所述健身运动动作包括深蹲、后抬腿跑、平板支撑、卷腹、悬垂举腿、仰卧起坐和俯卧撑。

6.根据权利要求3所述基于人体骨骼关节点位的多通道健身运动识别方法，其特征在于：所述步骤3.2.1中最低平面方程为超定的解空间。

7.根据权利要求3所述基于人体骨骼关节点位的多通道健身运动识别方法，其特征在于：所述步骤3.1中规定高度差在设定距离为3厘米的点为一个平面。