CN106022236A

CN106022236A - 一种基于人体轮廓的动作识别方法

Info

Publication number: CN106022236A
Application number: CN201610314296.3A
Authority: CN
Inventors: 翁肇杰; 翟恺
Original assignee: Grand Softcom Ltd Of Upper Hypon
Current assignee: Grand Softcom Ltd Of Upper Hypon
Priority date: 2016-05-13
Filing date: 2016-05-13
Publication date: 2016-10-12

Abstract

本发明公开了一种基于人体轮廓的动作识别方法，包括以下步骤：首先，利用数学形态学以及种子区域生长法提取出人体的轮廓；然后，将人体的轮廓拟合成多边形；最后，通过多边形各个顶点的位置关系识别人体的动作。本发明并未采用相对复杂的分类器识别样本的方式，易于实现，且对硬件设备的要求较低，在某些应用场合，比如无人机操控，具备非常高的实用价值。

Description

一种基于人体轮廓的动作识别方法

技术领域

本发明属于计算机视觉与模式识别领域，具体涉及一种基于人体轮廓的动作识别方法。

背景技术

人体动作识别技术的应用范围相当广泛，在人机交互、安防监控、互动游戏以及视频标注等应用场景都发挥着不可替代的作用。

目前，常用的人体动作识别方法大体可以分为两类：（1）在人体关节处安装无线传感器和加速度感应器，采集人体的动作信息，这类方法原理简单、易于实现，但应用范围十分有限；（2）基于视觉的人体动作识别正逐渐成为计算机视觉与模式识别领域的研究热点，这类方法能够广泛地应用于智能监控、数字娱乐、视频标注等领域。

基于视觉的人体动作识别方法一般将人体动作识别看作分类或者检测问题，利用全标记的训练数据来训练分类器，但是获得全标记的训练数据是费时费力的；或者通过多摄像头监控***的搭建解决遮挡问题；或者通过多种特征融合的方式提高动作识别的性能。总体来说，这类方法可以识别各种比较复杂的人体动作，比如开车、打电话、握手、坐下和起立等，但是从难易度、成本方面考虑，这类方法代价较大，难以应用于某些场合，比如无人机操控，只需要能够识别人体的简单动作（单/双手平伸、单/双手举起等）。

发明内容

针对特定场合的应用，比如无人机操控，只需要能够识别人体的简单动作（单/双手平伸、单/双手举起等），本发明提出了一种基于人体轮廓的动作识别方法，具体包括以下步骤：

（1）视频的第m帧，标出人体区域ROI，其中1≤m<M，M为视频的全部帧数；

（2）对区域ROI内的视频数据进行预处理，即执行步骤A-C：

A、将步骤（1）的ROI进行特定比例的扩展，得到区域RExpand；

B、读取RExpand内的视频数据，得到Video；

C、将Video缩放至特定大小，得到VScale；

（3）分割出人体目标，即执行步骤A＇-H＇：

A＇、将步骤（2）的VScale进行二值化，得到VBin；

B＇、将VBin进行数学形态学处理，得到VPro；

C＇、对VPro进行轮廓提取，得到T个轮廓{C₁，C₂，…，C_t，…，C_T}，其中1≤t≤T；

D＇、从T个轮廓{C₁，C₂，…，C_t，…，C_T}中，选择最大的轮廓C_i；

E＇、对轮廓C_i包围的区域ROI_i进行数学形态学处理，得到VMM；

F＇、从VMM中选取初始的种子点；

G＇、利用最大流算法，从VMM中分割出前景目标Foreground；

H＇、对前景目标Foreground进行数学形态学处理，得到Tar；

（4）对人体目标进行多边形拟合，即执行步骤A＂-E＂：

A＂、对步骤（3）的Tar进行轮廓提取，得到ST个轮廓{SC₁，SC₂，…，SC_t，…，SC_ST}，其中1≤t≤ST；

B＂、从ST个轮廓{SC₁，SC₂，…，SC_t，…，SC_ST}中，选择最大的轮廓SC_i；

C＂、对轮廓SC_i包围的区域SROI_i进行数学形态学处理，得到SVMM；

D＂、对SVMM进行多边形拟合，得到多边形Poly，Poly的顶点数目为Num；

E＂、根据Poly各个顶点的位置关系，得到第m帧图像的动作识别结果Act；

（5）输出结果，即对步骤（4）的动作识别结果Act进行判断，若已经连续N帧的Act相同，输出Act，m加1，如果m = M，结束，否则进入步骤（1）；若尚未连续N帧的Act相同，m加1，如果m= M，结束，否则进入步骤（1）。

本发明的有益效果是：

1）本发明提出的利用多边形拟合识别人体动作的方法，易于实现，对硬件设备没有严格的限制，普通的单摄像头即可满足要求，而且在一定程度上能够克服摄像头俯仰角的影响。

2）本发明在多种场景下均可准确地识别人体的简单动作，比如单/双手平伸、单/双手举起等，在某些应用场合，比如无人机操控，具备非常高的实用价值。

附图说明

图1为动作识别的处理流程。

图2为二值图像。

图3为初始的前景种子。

图4为初始的背景种子。

图5为提取的人体目标。

图6为拟合多边形。

具体实施方式

为了使本发明的目的、技术方案以及优点更加清楚明白，以下对本发明进行进一步的详细说明。

一种基于人体轮廓的动作识别方法，处理流程如图1所示，具体包括以下步骤：

（1）视频的第m帧，标出1块包含人体的区域ROI，其中1≤m<M，M为视频的全部帧数；

（2）对区域ROI内的视频数据进行预处理，即执行步骤A-C：

A、将步骤（1）的ROI进行特定比例的扩展，得到区域RExpand；

特定比例可以根据动作的幅度计算，比如双手平伸的宽度是肩宽的2倍，则需要将ROI的水平方向至少扩展2倍；

B、读取RExpand内的视频数据，得到Video；

C、将Video缩放至特定大小，得到VScale；

（3）分割出人体目标，即执行步骤A＇-H＇：

A＇、将步骤（2）的VScale进行二值化，得到VBin；

B＇、将VBin进行数学形态学处理，得到VPro；

数学形态学处理可以包括腐蚀、膨胀等处理；

提取轮廓的方法很多，此处不再赘述；

数学形态学处理可以包括腐蚀、膨胀等处理；

F＇、从VMM中选取初始的种子点；

为了避免错误的分割，应从VMM的中央位置选取初始的前景种子点，而从VMM的边界选取初始的背景种子点，二值图像及初始的种子点如图2-图4所示；

G＇、利用最大流算法，从VMM中分割出前景目标Foreground,如图5所示；

H＇、对前景目标Foreground进行数学形态学处理，得到Tar；

（4）对人体目标进行多边形拟合，即执行步骤A＂-E＂：

D＂、对SVMM进行多边形拟合，得到多边形Poly，Poly的顶点数目为Num，Num=8；

比如，双手举起的拟合多边形如图6所示，根据各个顶点的位置关系可以判断出顶点0代表头部，顶点1和顶点2所成的直线代表左手，通过直线斜率可以判断出左手是否举起。

以上所述仅为本发明的较佳实施例而已，并不限制本发明，凡在本发明的精神和原则之内所作的的任何修改、等同替换和改进等，均应包括在本发明的保护范围之内。

Claims

1.一种基于人体轮廓的动作识别方法，其特征在于包含以下步骤：

1）视频的第m帧，标出人体区域ROI,其中1≤m<M，M为视频的全部帧数；

2）对区域ROI内的视频数据进行预处理；

3）分割出人体目标；

4）对人体目标进行多边形拟合；

5）输出结果。

2.根据权利要求1所述的一种基于人体轮廓的动作识别方法，其特征在于，所述的步骤2）为：

（1）对ROI进行特定比例的扩展，得到区域RExpand；

（2）读取RExpand内的视频数据，得到Video；

（3）将Video缩放至特定大小，得到VScale。

3.根据权利要求1所述的一种基于人体轮廓的动作识别方法，其特征在于，所述的步骤3）为：

（1）将预处理后的视频数据VScale进行二值化，得到VBin；

（2）将VBin进行数学形态学处理，得到VPro；

（3）对VPro进行轮廓提取，得到T个轮廓{C₁，C₂，…，C_t，…，C_T}，其中1≤t≤T；

（4）从T个轮廓{C₁，C₂，…，C_t，…，C_T}中，选择最大的轮廓C_i；

（5）对轮廓C_i包围的区域ROI_i进行数学形态学处理，得到VMM；

（6）从VMM中选取初始的种子点；

（7）利用最大流算法，从VMM中分割出前景目标Foreground；

（8）对前景目标Foreground进行数学形态学处理，得到Tar。

4.根据权利要求1所述的一种基于人体轮廓的动作识别方法，其特征在于，所述的步

骤4）为：

（1）对分割出的人体目标Tar进行轮廓提取，得到ST个轮廓{SC₁，SC₂，…，SC_t，…，SC_ST}，其中1≤t≤ST；

（2）从ST个轮廓{SC₁，SC₂，…，SC_t，…，SC_ST}中，选择最大的轮廓SC_i；

（3）对轮廓SC_i包围的区域SROI_i进行数学形态学处理，得SVMM；

（4）对SVMM进行多边形拟合，得到多边形Poly，Poly的顶点数目为Num；

（5）根据Poly各个顶点的位置关系，得到第m帧图像的动作识别结果Act。

5.根据权利要求1所述的一种基于人体轮廓的动作识别方法，其特征在于，所述的步

骤5）为：对步骤（4）的动作识别结果Act进行判断，若已经连续N帧的Act相同，输出Act，m加1，如果m = M，结束，否则进入步骤（1）；若尚未连续N帧的Act相同，m加1，如果m = M，结束，否则进入步骤（1）。