CN109508686B

CN109508686B - 一种基于层次化特征子空间学习的人体行为识别方法

Info

Publication number: CN109508686B
Application number: CN201811415195.0A
Authority: CN
Inventors: 盛碧云; 肖甫; 李群; 沙乐天; 黄海平; 沙超
Original assignee: Nanjing University of Posts and Telecommunications
Current assignee: Nanjing University of Posts and Telecommunications
Priority date: 2018-11-26
Filing date: 2018-11-26
Publication date: 2022-06-28
Anticipated expiration: 2038-11-26
Also published as: CN109508686A

Abstract

本发明公开了基于层次化特征子空间学习的人体行为识别方法，方法包括：将人体行为视频样本划分成训练样本和测试样本，提取并编码视频样本的手工特征和深度特征，分别以手工特征和深度特征的特征向量表示每一视频样本；设置视频样本的样本标签，采用训练样本的手工特征和深度特征的特征向量以及对应的样本标签作为输入，训练层次化特征子空间学习模型，生成子空间投影矩阵和行为类别的决策边界；利用子空间投影矩阵学习测试样本的手工特征和深度特征的子空间特征向量；计算并比较测试样本的子空间特征向量到各个行为类别的决策边界的距离，判别测试样本的行为类完成识别操作；本发明提高了子空间特征表达的辨识力，且具有良好的识别精度和效率。

Description

一种基于层次化特征子空间学习的人体行为识别方法

技术领域

本发明属于视频行为识别技术领域，具体涉及一种基于层次化特征子空间学习的人体行为识别方法。

背景技术

基于视频的行为识别是人工智能发展和计算机视觉领域的研究热点，在智能安全监控、智能机器人、人机交互、虚拟现实和游戏控制等领域都有重要的市场需求和应用价值。学习辨识力强的视频特征表达是提高行为识别精度的关键，然而，不同行为的相似性和同一行为的差异性，增加了行为描述和识别的复杂性。

目前，大多数学者致力于挖掘新的手工底层特征、或者构建更深更复杂的深度学习模型，探索包含更多信息的特征表示。这些算法虽然能够在一定程度上提高识别精度，但复杂的模型也降低了算法的效率和识别速度。

发明内容

本发明目的是针对上述现有技术的人体行为识别模型复杂、算法效率低和识别速度慢的问题，提供一种基于层次化特征子空间学习的人体行为识别方法，该方法考虑从多视角子空间学习的角度，融合基于手工特征和深度特征的互补特征表达实现对人体行为的识别操作，具体技术方案如下：

一种基于层次化特征子空间学习的人体行为识别方法，所述方法包括：

将人体行为识别的视频样本划分成训练样本和测试样本，提取并编码视频样本的手工特征和深度特征，并分别以所述手工特征和所述深度特征的特征向量表示每一视频样本；

对每一视频样本设置独有的样本标签，采用训练样本的所述手工特征和所述深度特征的特征向量以及对应视频样本的所述样本标签作为输入，训练层次化特征子空间学习模型，生成子空间投影矩阵和行为类别的决策边界；

利用所述子空间投影矩阵，学习测试样本的所述手工特征和所述深度特征的子空间特征向量；

计算并比较测试样本的子空间特征向量到各个行为类别的所述决策边界的距离，并判别测试样本的行为类，完成人体行为识别操作。

进一步的，将人体行为识别的视频样本划分成训练样本和测试样本，提取并编码视频样本的手工特征和深度特征，并分别以所述手工特征和所述深度特征的特征向量表示每一视频样本的步骤包括：

生成手工特征的特征向量：稠密采样并跟踪视频多帧图像的特征点，提取视频样本的稠密运动轨迹，并计算基于稠密运动轨迹的梯度方向直方图、光流方向直方图和运动边界方向直方图，将所述梯度方向直方图、光流方向直方图和运动边界方向直方图连接，作为手工特征；将所述手工特征进行Fisher Vector编码，生成基于所述手工特征的列向量；

生成深度特征的特征向量：将训练样本的RGB图像、光流图像分别输入两个深度卷积神经网络中，训练深度空间模型和深度时间模型，并采用所述深度空间模型或所述深度时间模型的顶层全连接层作为空间流或时间流的深度特征；并池化每个视频所有帧图像的空间流或所有光流图像的时间流深度特征，并将池化的结果连接，生成基于所述深度特征的列向量。

进一步的，对每一视频样本设置独有的样本标签，采用训练样本的所述手工特征和所述深度特征的特征向量以及对应视频样本的所述样本标签作为输入，训练层次化特征子空间学习模型，生成子空间投影矩阵和行为类别的决策边界的步骤包括：

构建训练样本的层次化特征子空间学习模型：

其中，Z_v为所述训练样本在第v个视角下的列向量表示，P_v为所述子空间投影矩阵，X表示所述手工特征向量和深度特征向量的共有特征子空间，H表示所述样本标签，W表示所述决策边界；

将所述列向量Z_v以及所述样本标签H作为所述层次化特征子空间学习模型的输入，采用迭代交替算法来优化所述层次化特征子空间学习模型，获得所述子空间投影矩阵P_v和所述决策边界W。

进一步的，利用所述子空间投影矩阵，学习测试样本的所述手工特征和所述深度特征的子空间特征向量的步骤包括：

构建测试样本的层次化特征到子空间的变换模型：

其中，P_v表示所述子空间投影矩阵，

表示测试样本的层次化特征表达，

表示测试样本的子空间特征表达。

进一步的，所述计算并比较测试样本的子空间特征向量到各个行为类别的所述决策边界的距离，并判别测试样本的行为类，完成人体行为识别操作的步骤包括：

将所述子空间特征向量和所述类决策边界做矩阵乘法运算，得到测试样本对所有行为类别的响应值，选择最大响应值对应的行为类别作为测试样本的识别结果，完成人体行为的识别操作。

与现有技术相比，本发明的基于层次化特征子空间学习的人体行为识别方法，以基于手工特征和深度特征的视频表达为基础，考虑手工特征和深度特征两个层次特征之间的互补性，采用监督多视角子空间学习的方法，充分融合手工特征和深度特征的优势，可有效提高人体识别视频特征表达的辨识力；同时具有良好的识别精度和识别效率；此外，本发明通过基于层次化特征子空间学习对人体行为进行识别，为人体行为识别的特征学习问题提供了新的研究思路。

附图说明

图1为本发明实施例所述基于层次化特征子空间学习的人体行为识别方法的基本框架图示意；

图2为本发明实施例所述基于层次化特征子空间学习的人体行为识别方法的流程图示意；

图3为本发明实施例中所述迭代交替算法的流程图示意。

具体实施方式

为了使本技术领域的人员更好地理解本发明方案，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述。

参阅图1，在本发明实施例中，提供了一种基于层次化特征子空间学习的人体行为识别方法，包括提取层次化特征表达、训练层次化特征子空间模型和识别测试样本的行为类别；具体的，参阅图2，所述方法的具体步骤过程为：

S1、将人体行为识别的视频样本划分成训练样本和测试样本，提取并编码视频样本的手工特征和深度特征，并分别以手工特征和深度特征的特征向量表示每一视频样本。

在具体实施例中，生成手工特征的特征向量的过程为：首先通过稠密采样并跟踪人体行为视频多帧图像的特征点，提取视频样本的稠密运动轨迹，对每一视频样本提取稠密运动轨迹，并计算基于稠密运动轨迹的梯度方向直方图、光流方向直方图和运动边界方向直方图，同时，将梯度方向直方图、光流方向直方图和运动边界方向直方图连接，作为手工特征；将手工特征进行Fisher Vector编码，生成基于手工特征的列向量；优选的，本发明每个视频用一个M维的基于手工特征的全局列向量特征表示。

在具体实施例中，生成深度特征的特征向量的过程为：首先，将训练样本的RGB图像、光流图像分别输入两个深度卷积神经网络中，训练深度空间模型和深度时间模型，并采用深度空间模型或深度时间模型的顶层全连接层作为空间流或时间流的深度特征；其中，提取得到的空间流的深度特征为d₁维，时间流的深度特征为d₂维；随后，池化每个视频所有帧图像的空间流或所有光流图像的时间流深度特征，并将池化的结果连接，生成基于所述深度特征的列向量；优选的，本发明每个视频用一个N维的基于深度特征的全局列向量特征表示，其中，N＝d₁+d₂。

S2、对每一视频样本设置独有的样本标签，采用训练样本的所述手工特征和所述深度特征的特征向量以及对应视频样本的所述样本标签作为输入，训练层次化特征子空间学习模型，生成子空间投影矩阵和行为类别的决策边界。

在本发明的具体实施例中，首先，构建训练样本层次化特征子空间学习模型：

其中，Z_v为训练样本在第v个视角下的列向量表示；本实施例中，Z_v即表示所述手工特征和所述深度特征两个视角下的列向量；P_v为子空间投影矩阵，X为所述手工特征和所述深度特征的共有特征子空间，H表示样本标签，W表示决策边界；然后，将层次化特征列向量Z_v以及样本标签H作为层次化特征子空间学习模型的输入；最后，采用迭代交替算法来优化层次化特征子空间学习模型，获得子空间投影矩阵P_v和决策边界W。

优选的，本实施例在采用迭代交替算法来求解层次化特征子空间学习模型时，进一步计算时，保持其他变量固定不变，只求解一个变量，直至层次化特征子空间学习模型在若干次迭代之后收敛；最后，求解出子空间投影矩阵P_v和行为类别的决策边界W；具体可参阅图3，从中可知，本发明的迭代交替算法通过固定共有特征子空间X、子空间投影矩阵P_v和决策边界W中的任意两个变量，并对另一个变量进行更新操作，直到得到的层次化特征子空间学习模型收敛即可获得子空间投影矩阵P_v和行为类别的决策边界W。

S3、利用子空间投影矩阵P_v，学习测试样本所述手工特征和所述深度特征的子空间特征向量。

具体的，构建测试样本的层次化特征到子空间的变换模型：

其中，P_v表示子空间投影矩阵，

和

分别表示测试样本的层次化特征表达、测试样本和训练样本的共有子空间特征表达，并采用最小二乘法求解测试样本的层次化特征到子空间的变换模型，其中，得到的共有子空间特征表达

为：

S4、计算并比较测试样本的子空间特征向量到各个行为类别的所述决策边界的距离，并判别测试样本的行为类，完成人体行为识别操作。

具体的，本发明的方法通过将测试样本的共有子空间特征表示

和决策边界W做矩阵乘法运算，得到测试样本对所有行为类别的响应值R＝[r₁,r₂,...,r_n]∈R^c×n，其中c表示行为类别数，n表示测试样本数；对第i(i＝1,2,…,n)个测试样本的响应向量r_i，取最大值所对应的行(即所对应的行为类别类)作为该测试样本的人体行为的识别结果，完成人体行为的识别操作。

以上仅为本发明的较佳实施例，但并不限制本发明的专利范围，尽管参照前述实施例对本发明进行了详细的说明，对于本领域的技术人员来而言，其依然可以对前述各具体实施方式所记载的技术方案进行修改，或者对其中部分技术特征进行等效替换。凡是利用本发明说明书及附图内容所做的等效结构，直接或间接运用在其他相关的技术领域，均同理在本发明专利保护范围之内。

Claims

1.一种基于层次化特征子空间学习的人体行为识别方法，其特征在于，所述方法包括：

对每一视频样本设置独有的样本标签，采用训练样本的所述手工特征和所述深度特征的特征向量以及对应视频样本的所述样本标签作为输入，训练层次化特征子空间学习模型，生成子空间投影矩阵和行为类别的决策边界；其步骤为：

构建训练样本的层次化特征子空间学习模型：

将所述列向量Z_v以及所述样本标签H作为所述层次化特征子空间学习模型的输入，采用迭代交替算法来优化所述层次化特征子空间学习模型，获得所述子空间投影矩阵P_v和所述决策边界W；

2.如权利要求1所述的层次化特征子空间学习的人体行为识别方法，其特征在于，将人体行为识别的视频样本划分成训练样本和测试样本，提取并编码视频样本的手工特征和深度特征，并分别以所述手工特征和所述深度特征的特征向量表示每一视频样本的步骤包括：

3.如权利要求1所述的基于层次化特征子空间学习的人体行为识别方法，其特征在于，利用所述子空间投影矩阵，学习测试样本的所述手工特征和所述深度特征的子空间特征向量的步骤包括：

构建测试样本的层次化特征到子空间的变换模型：

其中，P_v表示所述子空间投影矩阵，

表示测试样本的层次化特征表达，

表示测试样本的子空间特征表达。

4.如权利要求3所述的基于层次化特征子空间学习的人体行为识别方法，其特征在于，所述计算并比较测试样本的子空间特征向量到各个行为类别的所述决策边界的距离，并判别测试样本的行为类，完成人体行为识别操作的步骤包括：将所述子空间特征向量和所述决策边界做矩阵乘法运算，得到测试样本对所有行为类别的响应值，选择最大响应值对应的行为类别作为测试样本的识别结果，完成人体行为的识别操作。