CN109670401A - 一种基于骨骼运动图的动作识别方法 - Google Patents

一种基于骨骼运动图的动作识别方法 Download PDF

Info

Publication number
CN109670401A
CN109670401A CN201811360598.XA CN201811360598A CN109670401A CN 109670401 A CN109670401 A CN 109670401A CN 201811360598 A CN201811360598 A CN 201811360598A CN 109670401 A CN109670401 A CN 109670401A
Authority
CN
China
Prior art keywords
skeleton
segmentation
motion
skeleton motion
color
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201811360598.XA
Other languages
English (en)
Other versions
CN109670401B (zh
Inventor
侯永宏
王利伟
王丽君
肖任意
李士超
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tianjin University
Original Assignee
Tianjin University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tianjin University filed Critical Tianjin University
Priority to CN201811360598.XA priority Critical patent/CN109670401B/zh
Publication of CN109670401A publication Critical patent/CN109670401A/zh
Application granted granted Critical
Publication of CN109670401B publication Critical patent/CN109670401B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/20Movements or behaviour, e.g. gesture recognition
    • G06V40/23Recognition of whole body movements, e.g. for sport training
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • G06F18/254Fusion techniques of classification results, e.g. of results related to same input data
    • G06F18/256Fusion techniques of classification results, e.g. of results related to same input data of results relating to different input data, e.g. multimodal recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/56Extraction of image or video features relating to colour

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Psychiatry (AREA)
  • Social Psychology (AREA)
  • Human Computer Interaction (AREA)
  • Image Analysis (AREA)

Abstract

本发明涉及一种基于骨骼运动图的动作识别方法,包括:将人体骨骼序列的每一帧分别投影到笛卡尔正交系的三个平面上,生成人体骨骼序列分布图,用来获取空间信息;使用时间金字塔方法将骨骼序列分布图分割为不同分段的两层结构,用来获取运动的时间信息;对每个面的分段的骨骼序列分布图分别累积每个关节上连续帧之间的绝对差,生成分段的骨骼运动图;对分段的骨骼运动图使用四个不同的颜色表分别进行伪彩色编码,获得更多的彩色纹理信息,得到彩色分段的骨骼运动图;使用加法更新策略,将彩色分段的骨骼运动图叠加生成最终的骨骼运动图;利用深度学习进行图片分类,从而完成人类的动作检测识别任务。

Description

一种基于骨骼运动图的动作识别方法
技术领域
本发明属于多媒体信息处理领域,涉及一种动作识别方法。
背景技术
人体动作识别在模式识别和计算机视觉中的应用非常广泛,如视频监控、手势识别、人机交互等等。人类可以通过用描述骨骼的主要关节的几个点的运动来识别动作。与基于RGB 的动作识别相比,骨骼数据包含人体关节的位置,是一种相对较高层次的运动识别特征。它对尺度和光照的变化具有较强的鲁棒性,并且对摄像机的视角、人体的旋转和运动速度都具有一定的不变性。基于骨架的动作识别可以避免视频特征提取的繁重任务,因此,单纯基于骨骼序列的人类动作识别也具有很有发展的前景。
近年来,卷积神经网络在计算机识别的领域中具有相当出色的表现。但如何有效地提取骨骼序列的空间和时间信息并适应神经网络的输入仍然是一个开放话题。
本发明提出的基于人体骨骼运动图的动作识别方法,首先采用不同的形状来表示骨骼关节,对骨骼进行可视化,有效利用空间信息。其次,对骨骼序列进行分割,并在每个分割的序列上累积每个关节上连续帧之间的绝对差,充分利用时间信息。第三,输入到神经网络之前,每个时间金字塔骨骼运动图进行伪彩色编码。将增强的不同运动模式编码到伪RGB信道。最后采用融合技术,对六个通道的分类结果进行融合,实现客观准确而高效的人体动作的识别功能。
发明内容
本发明提供一种较为准确的基于人体骨骼运动图的动作识别方法,使用时间金字塔和伪彩色编码方法,并将之与深度学习进行相连接。技术方案如下:
一种基于骨骼运动图的动作识别方法,包括下列步骤:
1)将人体骨骼序列的每一帧分别投影到笛卡尔正交系的三个平面上,使用不同形状的实体表示每个骨骼的关节点,并利用第三维度的坐标作为深度信息,生成人体骨骼序列分布图,用来获取空间信息;
2)使用时间金字塔方法将骨骼序列分布图分割为不同分段的两层结构,用来获取运动的时间信息;
3)对每个面的分段的骨骼序列分布图分别累积每个关节上连续帧之间的绝对差,生成分段的骨骼运动图;
4)对分段的骨骼运动图使用四个不同的颜色表分别进行伪彩色编码,获得更多的彩色纹理信息,得到彩色分段的骨骼运动图;
5)使用加法更新策略,将彩色分段的骨骼运动图叠加生成最终的骨骼运动图。
6)利用深度学习进行图片分类,从而完成人类的动作检测识别任务。
本发明提出的基于人体骨骼运动图的动作识别方法,首先采用不同的形状来表示骨骼关节,对骨骼进行可视化,有效利用空间信息。其次,对骨骼序列进行分割,并在每个分割的序列上累积每个关节上连续帧之间的绝对差,充分利用时间信息。第三,输入到神经网络之前,每个时间金字塔骨骼运动图进行伪彩色编码。将增强的不同运动模式编码到伪RGB信道。最后采用融合技术,对六个通道的分类结果进行融合,实现客观准确而高效的人体动作的识别功能。
附图说明
附图为整个基于骨骼序列的人类动作识别框架。
具体实施方式
1)骨骼序列到骨骼运动图片的映射
第一步,假设一个包含n帧的骨架序列S={F1,F2,...,Fn},其中表示骨骼序列的第j帧;m表示骨骼节点数;表示关节的第j帧的第i个节点的三维坐标。每一帧的骨骼数据投影到笛卡尔正交系的三个平面上,将的值作为投影的深度值,并且使用实体形状去表示每一个骨骼节点。这样的投影后,每一个骨骼序列的每一帧都能得到三张黑白的描述该动作骨骼分布的图片。具有丰富的空间信息,然而并不具备时间信息的描述。
第二步,使用时间金字塔策略对骨骼序列进行分割,一个序列可以被分割为n个片段,最常见的是n=1,2,4...。考虑到计算量和有效性,我们采用骨骼序列分割不同的值n=1,4 构造两层体系结构。
第三步,积累每个分段的骨骼序列分布图在投影平面上的连续帧之间的绝对差,得到分段的骨骼运动图,如下公式所示:
其中S-SMM表示分段的骨骼运动图,v∈{f,s,t}表示对应的笛卡尔正交系的三个平面上的三个投影视图,M为分段的骨骼序列分布图的帧数,是第k帧在视图v上的投影。
第四步,对分段的骨骼运动图使用四个不同的颜色表将灰度值映射到RGB颜色空间,分别进行伪彩色编码,得到彩色分段的骨骼运动图。其中四个颜色表的R通道和G通道的值分别为(0,0.4980),(0.4980,1)(1,0.502)和(0.5176,0),B通道的映射关系如下公式所示:
其中I表示分段的骨骼运动图的灰度值。
第五步,为了适应神经网络的输入,对四个彩色分段的骨骼运动图使用加法更新策略,合并成最终的骨骼运动图。
2)利用深度学习进行图片分类,从而完成人类的动作检测识别任务。
在这里,我们采用当今公用的深度学习框架keras,在Linux***下,通过 NvidiaGTX TITAN X显卡进行卷积神经网络训练的加速,采用Densenet121的网络结构对获取的骨骼运动图进行训练。
第一步,对数据集进行训练集和测试集划分,将两层结构的六个骨骼运动图,分别进行六个卷积神经网络的参数训练。
第二步,采用微调模型优化网络参数。
第三步,对六个神经网络的输出得分向量,并按如下公式进行融合:
其中,v表示六个神经网络的输出得分向量,代表矢量的元素相乘,Fin()函数代表将概率值最大的动作作为动作识别的结果。
下面为本发明在SYSU-3D、MSRC-12Kinect Gesture、UTD-MHAD数据集上的实验结果说明:
在Matlab-2017a平台上进行算法的仿真实现,计算训练数据集以及测试数据集的六个骨骼运动图。在linux***下使用keras深度学***台上完成。
本方法在国际公认的人类动作识别数据集中进行测试,数据集中训练集以及测试集的分配方式采用Cross Subject分配方式。测试结果如下:在包含12类动作的SYSU-12数据集上,获得了83.74%的识别准确率;在包含12类动作的MSRC-12数据集上,获得了97.675%的识别准确率;在包含27类动作的UTD-MHAD数据集上,获得了92.56%的识别精度。该实验结果对比与国际领先的基于骨骼序列的人类动作检测识别算法,均取得了高于其余算法的分类准确度。

Claims (1)

1.一种基于骨骼运动图的动作识别方法,包括下列步骤:
1)将人体骨骼序列的每一帧分别投影到笛卡尔正交系的三个平面上,使用不同形状的实体表示每个骨骼的关节点,并利用第三维度的坐标作为深度信息,生成人体骨骼序列分布图,用来获取空间信息;
2)使用时间金字塔方法将骨骼序列分布图分割为不同分段的两层结构,用来获取运动的时间信息;
3)对每个面的分段的骨骼序列分布图分别累积每个关节上连续帧之间的绝对差,生成分段的骨骼运动图;
4)对分段的骨骼运动图使用四个不同的颜色表分别进行伪彩色编码,获得更多的彩色纹理信息,得到彩色分段的骨骼运动图;
5)使用加法更新策略,将彩色分段的骨骼运动图叠加生成最终的骨骼运动图。
6)利用深度学习进行图片分类,从而完成人类的动作检测识别任务。
CN201811360598.XA 2018-11-15 2018-11-15 一种基于骨骼运动图的动作识别方法 Active CN109670401B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811360598.XA CN109670401B (zh) 2018-11-15 2018-11-15 一种基于骨骼运动图的动作识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811360598.XA CN109670401B (zh) 2018-11-15 2018-11-15 一种基于骨骼运动图的动作识别方法

Publications (2)

Publication Number Publication Date
CN109670401A true CN109670401A (zh) 2019-04-23
CN109670401B CN109670401B (zh) 2022-09-20

Family

ID=66141811

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811360598.XA Active CN109670401B (zh) 2018-11-15 2018-11-15 一种基于骨骼运动图的动作识别方法

Country Status (1)

Country Link
CN (1) CN109670401B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111339888A (zh) * 2020-02-20 2020-06-26 沈阳航空航天大学 基于关节点运动图的双人交互行为识别方法
CN111695523A (zh) * 2020-06-15 2020-09-22 浙江理工大学 基于骨骼时空及动态信息的双流卷积神经网络动作识别方法
CN111914798A (zh) * 2020-08-17 2020-11-10 四川大学 基于骨骼关节点数据的人体行为识别方法
CN112070027A (zh) * 2020-09-09 2020-12-11 腾讯科技(深圳)有限公司 网络训练、动作识别方法、装置、设备及存储介质

Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140169623A1 (en) * 2012-12-19 2014-06-19 Microsoft Corporation Action recognition based on depth maps
US20150309579A1 (en) * 2014-04-28 2015-10-29 Microsoft Corporation Low-latency gesture detection
CN105608421A (zh) * 2015-12-18 2016-05-25 中国科学院深圳先进技术研究院 一种人体动作的识别方法及装置
CN105740833A (zh) * 2016-02-03 2016-07-06 北京工业大学 一种基于深度序列的人体行为识别方法
CN105844258A (zh) * 2016-04-13 2016-08-10 中国农业大学 动作识别方法及装置
CN105912991A (zh) * 2016-04-05 2016-08-31 湖南大学 基于3d点云与关键骨骼节点的行为识别
CN106203503A (zh) * 2016-07-08 2016-12-07 天津大学 一种基于骨骼序列的动作识别方法
CN106228109A (zh) * 2016-07-08 2016-12-14 天津大学 一种基于骨骼运动轨迹的动作识别方法
CN106529441A (zh) * 2016-10-26 2017-03-22 江南大学 基于模糊边界分片的深度动作图人体行为识别方法
CN107194344A (zh) * 2017-05-16 2017-09-22 西安电子科技大学 自适应骨骼中心的人体行为识别方法
CN107301370A (zh) * 2017-05-08 2017-10-27 上海大学 一种基于Kinect三维骨架模型的肢体动作识别方法
CN107392131A (zh) * 2017-07-14 2017-11-24 天津大学 一种基于人体骨骼节点距离的动作识别方法
CN108681700A (zh) * 2018-05-04 2018-10-19 苏州大学 一种复杂行为识别方法

Patent Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140169623A1 (en) * 2012-12-19 2014-06-19 Microsoft Corporation Action recognition based on depth maps
US20150309579A1 (en) * 2014-04-28 2015-10-29 Microsoft Corporation Low-latency gesture detection
CN105608421A (zh) * 2015-12-18 2016-05-25 中国科学院深圳先进技术研究院 一种人体动作的识别方法及装置
CN105740833A (zh) * 2016-02-03 2016-07-06 北京工业大学 一种基于深度序列的人体行为识别方法
CN105912991A (zh) * 2016-04-05 2016-08-31 湖南大学 基于3d点云与关键骨骼节点的行为识别
CN105844258A (zh) * 2016-04-13 2016-08-10 中国农业大学 动作识别方法及装置
CN106203503A (zh) * 2016-07-08 2016-12-07 天津大学 一种基于骨骼序列的动作识别方法
CN106228109A (zh) * 2016-07-08 2016-12-14 天津大学 一种基于骨骼运动轨迹的动作识别方法
CN106529441A (zh) * 2016-10-26 2017-03-22 江南大学 基于模糊边界分片的深度动作图人体行为识别方法
CN107301370A (zh) * 2017-05-08 2017-10-27 上海大学 一种基于Kinect三维骨架模型的肢体动作识别方法
CN107194344A (zh) * 2017-05-16 2017-09-22 西安电子科技大学 自适应骨骼中心的人体行为识别方法
CN107392131A (zh) * 2017-07-14 2017-11-24 天津大学 一种基于人体骨骼节点距离的动作识别方法
CN108681700A (zh) * 2018-05-04 2018-10-19 苏州大学 一种复杂行为识别方法

Non-Patent Citations (6)

* Cited by examiner, † Cited by third party
Title
BESMA R.ABIDI等: ""Improving weapon detection in single energy X-ray images through pseudocoloring"", 《IEEE TRANSACTIONS ON SYSTEMS, MAN, AND CYBERNETICS—PART C: APPLICATIONS AND REVIEWS》 *
CHUANKUN LI等: ""Joint distance maps based action recognition with convolutional neural networks"", 《IEEE SIGNAL PROCESSING LETTERS》 *
JIANG WANG等: ""Learning Actionlet Ensemble for 3D Human Action Recognition"", 《IEEE TRANSACTIONS ON PATTERN ANALYSIS AND MACHINE INTELLIGENCE》 *
PICHAO WANG等: ""Action recognition based on joint trajectory maps using convolutional neural networks"", 《KNOWLEDGE-BASED SYSTEMS》 *
姜新波: ""基于三维骨架序列的人体行为识别研究"", 《中国博士学位论文全文数据库 信息科技辑》 *
李冬青: ""基于Kinect的多通道特征联合的人体行为识别"", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111339888A (zh) * 2020-02-20 2020-06-26 沈阳航空航天大学 基于关节点运动图的双人交互行为识别方法
CN111339888B (zh) * 2020-02-20 2023-11-14 沈阳航空航天大学 基于关节点运动图的双人交互行为识别方法
CN111695523A (zh) * 2020-06-15 2020-09-22 浙江理工大学 基于骨骼时空及动态信息的双流卷积神经网络动作识别方法
CN111695523B (zh) * 2020-06-15 2023-09-26 浙江理工大学 基于骨骼时空及动态信息的双流卷积神经网络动作识别方法
CN111914798A (zh) * 2020-08-17 2020-11-10 四川大学 基于骨骼关节点数据的人体行为识别方法
CN111914798B (zh) * 2020-08-17 2022-06-07 四川大学 基于骨骼关节点数据的人体行为识别方法
CN112070027A (zh) * 2020-09-09 2020-12-11 腾讯科技(深圳)有限公司 网络训练、动作识别方法、装置、设备及存储介质

Also Published As

Publication number Publication date
CN109670401B (zh) 2022-09-20

Similar Documents

Publication Publication Date Title
CN106682598B (zh) 一种基于级联回归的多姿态的人脸特征点检测方法
Arif et al. Automated body parts estimation and detection using salient maps and Gaussian matrix model
CN106203503B (zh) 一种基于骨骼序列的动作识别方法
CN109670401A (zh) 一种基于骨骼运动图的动作识别方法
CN110852182B (zh) 一种基于三维空间时序建模的深度视频人体行为识别方法
CN103310466B (zh) 一种单目标跟踪方法及其实现装置
CN105160310A (zh) 基于3d卷积神经网络的人体行为识别方法
CN105956560A (zh) 一种基于池化多尺度深度卷积特征的车型识别方法
CN109034210A (zh) 基于超特征融合与多尺度金字塔网络的目标检测方法
CN105528794A (zh) 基于混合高斯模型与超像素分割的运动目标检测方法
CN104933417A (zh) 一种基于稀疏时空特征的行为识别方法
CN107392131A (zh) 一种基于人体骨骼节点距离的动作识别方法
CN104463191A (zh) 一种基于注意机制的机器人视觉处理方法
CN103729614A (zh) 基于视频图像的人物识别方法及人物识别装置
CN105046197A (zh) 基于聚类的多模板行人检测方法
CN105046195A (zh) 基于非对称广义高斯模型的人体行为识别方法
CN102364497A (zh) 一种应用于电子导盲***的图像语义提取方法
CN105469050B (zh) 基于局部时空特征描述与金字塔词汇树的视频行为识别方法
CN107808376A (zh) 一种基于深度学习的举手检测方法
CN105069745A (zh) 基于普通图像传感器及增强现实技术的带表情变脸***及方法
CN103020614A (zh) 基于时空兴趣点检测的人体运动识别方法
CN112906520A (zh) 一种基于姿态编码的动作识别方法及装置
CN112396655A (zh) 一种基于点云数据的船舶目标6d位姿估计方法
CN109255293B (zh) 基于计算机视觉的模特走秀台步评价方法
Ye Intelligent image processing technology for badminton robot under machine vision of internet of things

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant