CN110097639A - 一种三维人体姿态估计方法 - Google Patents

一种三维人体姿态估计方法 Download PDF

Info

Publication number
CN110097639A
CN110097639A CN201910201559.3A CN201910201559A CN110097639A CN 110097639 A CN110097639 A CN 110097639A CN 201910201559 A CN201910201559 A CN 201910201559A CN 110097639 A CN110097639 A CN 110097639A
Authority
CN
China
Prior art keywords
point cloud
human body
manikin
spherical surface
body attitude
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910201559.3A
Other languages
English (en)
Other versions
CN110097639B (zh
Inventor
孔德慧
吴永鹏
王少帆
李敬华
王立春
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing University of Technology
Original Assignee
Beijing University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing University of Technology filed Critical Beijing University of Technology
Priority to CN201910201559.3A priority Critical patent/CN110097639B/zh
Publication of CN110097639A publication Critical patent/CN110097639A/zh
Priority to US16/724,608 priority patent/US11200685B2/en
Application granted granted Critical
Publication of CN110097639B publication Critical patent/CN110097639B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/20Analysis of motion
    • G06T7/246Analysis of motion using feature-based methods, e.g. the tracking of corners or segments
    • G06T7/251Analysis of motion using feature-based methods, e.g. the tracking of corners or segments involving models
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T17/00Three dimensional [3D] modelling, e.g. data description of 3D objects
    • G06T17/20Finite element generation, e.g. wire-frame surface description, tesselation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T17/00Three dimensional [3D] modelling, e.g. data description of 3D objects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T17/00Three dimensional [3D] modelling, e.g. data description of 3D objects
    • G06T17/005Tree description, e.g. octree, quadtree
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T19/00Manipulating 3D models or images for computer graphics
    • G06T19/003Navigation within 3D models or images
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T19/00Manipulating 3D models or images for computer graphics
    • G06T19/20Editing of 3D images, e.g. changing shapes or colours, aligning objects or positioning parts
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/20Analysis of motion
    • G06T7/215Motion-based segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/70Determining position or orientation of objects or cameras
    • G06T7/73Determining position or orientation of objects or cameras using feature-based methods
    • G06T7/75Determining position or orientation of objects or cameras using feature-based methods involving models
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/97Determining parameters from multiple pictures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2200/00Indexing scheme for image data processing or generation, in general
    • G06T2200/04Indexing scheme for image data processing or generation, in general involving 3D image data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2200/00Indexing scheme for image data processing or generation, in general
    • G06T2200/08Indexing scheme for image data processing or generation, in general involving all processing steps from image acquisition to 3D model generation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10028Range image; Depth image; 3D point clouds
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30196Human being; Person
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T10/00Road transport of goods or passengers
    • Y02T10/10Internal combustion engine [ICE] based vehicles
    • Y02T10/40Engine management systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Computer Graphics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Geometry (AREA)
  • Multimedia (AREA)
  • Computer Hardware Design (AREA)
  • General Engineering & Computer Science (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Remote Sensing (AREA)
  • Architecture (AREA)
  • Image Analysis (AREA)
  • Processing Or Creating Images (AREA)
  • Image Processing (AREA)

Abstract

公开一种三维人体姿态估计方法,其在不需要高配置硬件支持、和精准人体模型的条件下,实现实时且高精度的三维人体姿态估计。该方法包括步骤:(1)建立与对象匹配的三维人体模型,该模型为可见球面分布约束点云人体模型;(2)面向人体姿态跟踪的人体模型与深度点云匹配优化;(3)基于动态数据库检索的姿态跟踪错误恢复。

Description

一种三维人体姿态估计方法
技术领域
本发明涉及计算机视觉和模式识别的技术领域,尤其涉及一种三维人体姿态估计方法。
背景技术
基于计算机视觉技术的三维人体姿态估计在人类生活的众多领域得到广泛应用,如计算机动画、医学、人机交互等领域。随着低成本的RGB-D传感器(如Kinect)的推出,相比RGB视觉信息,深度图像可极大地避免复杂背景、光照条件变化所造成的数据缺陷。因此,三维人体姿态估计藉由深度信息的使用获得了性能上的明显提升,成为当前研究热点。目前存在的很多基于深度数据的三维人体姿态估计方法已经取得了较好的识别结果,但识别精度的进一步提升仍需克服传感器所获取深度数据的两个固有的严重缺陷:噪声和遮挡造成的数据缺失。
基于深度信息的三维人体姿态估计的方法可分为两类,判别方法和生成方法。前者依赖于大量的训练数据,并因此能适应不同体型的变化,但是大多不能在复杂运动的情况下获得较高的精度;后者通常依赖于复杂精确的人体模型,并因此能够在出现数据缺失的情况下获得很高的精度,但在快速复杂运动情况下容易陷入局部最优化而失去全局最优解。由此可见,实现高性能三维人体姿态估计方法往往依赖于以下几点:1)大量标注准确的训练数据集;2)用以跟踪错误恢复的庞大的姿态数据库;3)GPU加速支持;4)精准的三维人体模型。这些局限性限制了在普通硬件配置的平台上进行实时的人机交互等应用。
发明内容
为克服现有技术的缺陷,本发明要解决的技术问题是提供了一种三维人体姿态估计方法,其在不需要高配置硬件支持、和精准人体模型的条件下,实现实时且高精度的三维人体姿态估计。
本发明的技术方案是:这种三维人体姿态估计方法,该方法包括以下步骤:
(1)建立与对象匹配的三维人体模型,该模型为可见球面分布约束点云人体模型;
(2)面向人体姿态跟踪的人体模型与深度点云匹配优化;
(3)基于动态数据库检索的姿态跟踪错误恢复。
本发明以深度图序列作为输入,利用建立的三维人体模型与深度图转化的三维点云进行匹配优化,优化过程结合了全局的平移变换和局部的旋转变换,并且在跟踪错误时使用了动态数据库进行姿态的恢复,最终实现了快速准确的姿态跟踪,并且从人体模型中获得估计的关节点位置,因此在不需要高配置硬件支持、和精准人体模型的条件下,实现实时且高精度的三维人体姿态估计。
附图说明
图1示出了球集合表示人体模型以及球面点集表示人体模型,图1a是球集合表示人体模型和部位划分,图1b是球集合表面采样。
图2示出了人体11个部位命名以及部位父节点划分示意图,图2a是11个身体部位划分及命名,图2b是部位父节点。
图3示出了人体方向特征表示。
图4示出了基于PCA主方向的最小包围盒构建。
图5示出了SMMC数据集平均误差。
图6示出了PDT数据集平均误差。
图7示出了PDT数据库上的主观效果展示。
图8示出了根据本发明的三维人体姿态估计方法的流程图。
具体实施方式
如图8所示,这种三维人体姿态估计方法,该方法包括以下步骤:
(1)建立与对象匹配的三维人体模型,该模型为可见球面分布约束点云人体模型;
(2)面向人体姿态跟踪的人体模型与深度点云匹配优化;
(3)基于动态数据库检索的姿态跟踪错误恢复。
本发明以深度图序列作为输入,利用建立的三维人体模型与深度图转化的三维点云进行匹配优化,优化过程结合了全局的平移变换和局部的旋转变换,并且在跟踪错误时使用了动态数据库进行姿态的恢复,最终实现了快速准确的姿态跟踪,并且从人体模型中获得估计的关节点位置,因此在不需要高配置硬件支持、和精准人体模型的条件下,实现实时且高精度的三维人体姿态估计。
优选地,所述步骤(1)中:
利用57个球面集合表示人体表面,交互定义每个球的半径和球心位置,使球面集合更接近人体表面,将球面集合S定义为11个子集的并集,每个子集由若干个球面组成,通过公式(1)分别对应特定的人体部位:
其中表示第k个部位的第i个球的球心和半径,Nk表示第k个部位的球的总数,
优选地,所述步骤(1)中,忽略手腕和脚腕的运动。
优选地,所述步骤(1)中,
对于57个球,建立一个有向树,每个节点对应一个球,树的根节点为其它父节点为公式(2):
基于这种定义,每个身体部位的运动看作是由以其父节点为原点的局部坐标系下的旋转运动Rk加上世界坐标系下的全局平移向量t决定,使用斐波那契球面算法对球面进行密集采样得到球面点云,可见球面分布约束点云人体模型为公式(3):
其中Qk,i是k个部位的第i个球的采样总数,φ≈0.618是黄金分割比例,表示第k个部位的第i个球上第j个采样点的方向向量,对于每一个点,赋予它可见性属性,通过可见性检测决定每个点是否可见;由所有球面可见点组成的点集,用以表示人体模型,为可见球面分布约束点云人体模型。
优选地,所述步骤(2)中,
对由深度图转换得到的深度点云P进行采样得到假设模型和深度点云都处于同一个坐标系,利用深度点云对应的相机进行视角约束,对交叉部分和遮挡部分进行剔除,保留模型上在当前视角下可见的点以这些点来代表当前姿态下的模型,利用欧氏距离度量求得上的对应点重新定义:
优选地,所述步骤(2)中,
当建立了的对应关系后,将人体的运动看作是各个身体部位同时缓慢运动的过程,因此将模型与点云的匹配优化问题转换成求解人体各部位的旋转矩阵Rk和全局的平移向量t的问题,代价函数为公式(5):
s.t.(Rk)TRk=I (5)
其中λ,μk>0是权重参数,第一项Ψcorr衡量了模型表面点和输入深度点云之间的距离,表示为:
其中表示第k个部位的父节点球心坐标,该项使得模型上的点经过旋转和平移变换后与深度图转化的点云更加接近;
第二项Ψjoint为公式(6),利用前一帧的关节点位置信息以及部位的方向信息,被用来当作特殊的标记信息,约束两帧之间过大的空间移动和部位旋转,在一定程度上减少两帧之间差异性,
其中分别代表当前位姿和初始位姿上第k个部位上第m个关节的位置,分别代表当前位姿和初始位姿上第m个关节和其父节点的方向;设可自适应的权重参数αk,mk,m为公式(7):
其中ω23>0是权重参数用于控制误差范围,τkk是比例参数,通过公式(8)对应点对进行确定:
其中表示之间的平均距离,ω1>0用于确定距离误差阈值,τkk只在优化之前,第一次对应关系确定后进行求解,在迭代过程中保持不变,αk,mk,m在更新对应关系时进行更新;
第三项Ψregu为公式(9),约束了在迭代过程中每个部位大的旋转,相邻两帧之间的运动被看作是各个部位同时变化的过程:
Ψregu(Rk)=||Rk-I||2 (9)。
优选地,所述步骤(3)中,利用输入深度点云和构建的人体模型在二维平面上的重叠率θoverlap和代价函数值θcost来判断当前跟踪是否失败;假设人的肢体动作片段具有时间序列上的重复特性,用各个身体部位的方向信息表示人的三维动作,将上下躯干部分简化为两个互相垂直的主方向,四肢各部分用一个方向向量表示,忽略头部的方向,表示为公式(10):
其中v1,v2表示上下躯干方向,v3,...,v10表示除过上下躯干以及头部剩余部位的方向。
优选地,所述步骤(3)中,
对深度点云利用PCA提取主方向[e1,e2,e3],基于主方向的最小包围盒[w,d,h]来表示深度点云的特征,为公式(11):
当跟踪过程中满足匹配的代价函数小于阈值θoverlap≤θ1并且θcost≤θ2,认为跟踪成功,提取特征[e,v]更新数据库模型D,提取的特征[e,v]作为一对特征向量保存在数据库中;当跟踪失败时,利用特征e,通过和数据库中对应的深度点云特征求欧氏距离,在库中查找距离最小的前五个位利用v(i),i=1,...,5恢复可见球面分布约束点云人体模型,取和当前输入的深度点云重叠率最高的位姿并利用其进行重新初始化操作,以便于从跟踪失败中恢复。
以下更详细地说明本发明。
本发明以深度图序列作为输入,利用建立的三维人体模型与深度图转化的三维点云进行匹配优化,优化过程结合了全局的平移变换和局部的旋转变换,并且在跟踪错误时使用了动态数据库进行姿态的恢复,最终实现了快速准确的姿态跟踪,并且从人体模型中获得估计的关节点位置。本发明主要包括三个关键的技术点:1)建立与对象匹配的三维人体模型,该模型融合几何模型和网格模型的优点;2)在模型的基础上,将人体模型与点云的匹配优化问题转换成在人体模型和深度点云对应关系确定的基础上,求解全局平移变换矩阵和局部旋转变换矩阵;3)构建小型动态数据库用于跟踪失败时的重初始化。
1.可见球面分布约束点云人体模型:
本发明利用57个球面集合表示人体表面,如图1a所示,交互定义每个球的半径和球心位置,使球面集合更接近人体表面。如图2a所示,本发明将球面集合S定义为11个子集的并集,每个子集由若干个球面组成,分别对应特定的人体部位:
其中表示第k个部位的第i个球的球心和半径。Nk表示第k个部位的球的总数,为了简化,忽略手腕和脚腕的运动。
对于57个球,建立一个有向树,每个节点对应一个球,如图2b所示,树的根节点为其它父节点为:
基于这种定义,每个身体部位的运动都可以看作是由以其父节点为原点的局部坐标系下的旋转运动Rk加上世界坐标系下的全局平移向量t决定。为了让球体模型具备网格模型能表示表面细节的优势,使用斐波那契球面算法对球面进行密集采样得到球面点云。图1b表示球模型表面采样效果。球面点云可以表示为:
其中Qk,i是k个部位的第i个球的采样总数,φ≈0.618是黄金分割比例。表示第k个部位的第i个球上第j个采样点的方向向量。对于每一个点,赋予它可见性属性,可以通过可见性检测决定每个点是否可见。由所有球面可见点组成的点集,可用以表示人体模型,本文称之为可见球面分布约束点云人体模型。此时,该模型既可以通过球面定义参数的改变便捷地进行人体形状控制;又可通过与输入点云的优化匹配精准地实现人体姿态表示。
2.面向人体姿态跟踪的人体模型与深度点云匹配优化:
对由深度图转换得到的深度点云P进行采样得到假设模型和深度点云都处于同一个坐标系,利用深度点云对应的相机进行视角约束,对交叉部分和遮挡部分进行剔除,保留模型上在当前视角下可见的点以这些点来代表当前姿态下的模型。利用欧氏距离度量求得上的对应点重新定义:
当建立了的对应关系后,我们将人体的运动看作是各个身体部位同时缓慢运动的过程,因此将模型与点云的匹配优化问题转换成求解人体各部位的旋转矩阵Rk和全局的平移向量t的问题。代价函数如下:
s.t.(Rk)TRk=I (5)
其中λ,μk>0是权重参数,第一项Ψcorr衡量了模型表面点和输入深度点云之间的距离,可表示为:
其中表示第k个部位的父节点球心坐标。该项使得模型上的点经过旋转和平移变换后与深度图转化的点云更加接近。
第二项Ψjoint利用前一帧的关节点位置信息以及部位的方向信息,可以被用来当作特殊的标记信息,约束两帧之间过大的空间移动和部位旋转,在一定程度上减少两帧之间差异性。
其中分别代表当前位姿和初始位姿上第k个部位上第m个关节的位置。分别代表当前位姿和初始位姿上第m个关节和其父节点的方向。我们希望当对应的关节位置和方向误差越大,赋予的权重越大,因此设计了可自适应的权重参数αk,mk,m
其中ω23>0是权重参数用于控制误差范围。τkk是比例参数可以通过对应点对进行确定:
其中表示之间的平均距离,ω1>0用于确定距离误差阈值。τkk只在优化之前,第一次对应关系确定后进行求解,在迭代过程中保持不变。αk,mk,m需要在更新对应关系时候进行更新。
第三项Ψregu约束了在迭代过程中每个部位大的旋转,因为相邻两帧之间的运动被看作是各个部位同时变化的过程:
Ψregu(Rk)=||Rk-I||2 (9)
3.基于动态数据库检索的姿态跟踪错误恢复:
由于本发明属于无监督的姿态估计方法,在对于跟踪出现错误的时候需要进行姿态的恢复操作,在本发明中我们利用输入深度点云和构建的人体模型在二维平面上的重叠率θoverlap和代价函数值θcost来判断当前跟踪是否失败。假设人的肢体动作片段具有时间序列上的重复特性,因此提出了一种基于小型动态数据库的姿态跟踪恢复方法。本发明用各个身体部位的方向信息表示人的三维动作,如图3所示,将上下躯干部分简化为两个互相垂直的主方向,四肢各部分用一个方向向量表示,忽略头部的方向。可表示为:
其中v1,v2表示上下躯干方向,v3,...,v10表示除过上下躯干以及头部剩余部位的方向。
如图4所示,对深度点云利用PCA提取主方向[e1,e2,e3],基于主方向的最小包围盒[w,d,h]来表示深度点云的特征:
当跟踪过程中满足匹配的代价函数小于阈值θoverlap≤θ1并且θcost≤θ2认为跟踪成功,我们提取特征[e,v]更新数据库模型D。,具体来说将提取的特征[e,v]作为一对特征向量保存在数据库中。当跟踪失败时候,我们利用特征e,通过和数据库中对应的深度点云特征求欧氏距离,在库中查找距离最小的前五个位姿利用v(i),i=1,...,5恢复可见球面分布约束点云人体模型,取和当前输入的深度点云重叠率最高的位姿并利用其进行重新初始化操作,以便于从跟踪失败中恢复。
本发明已经在公开数据集SMMC和PDT数据集上得到验证,取得不错的实验效果。图5展示本发明在SMMC数据集上的平均误差,SMMC数据集动作比较简单,可以看出,我们的方法与目前最好方法的结果相当。图6展示了本发明在PDT数据集上的平均误差,PDT数据集动作复杂,具有挑战性,但是本发明的方法也能取得不错的效果。表1展示了在PDT和SMMC数据库上与其他同类方法在效率上的比较,与其他方法相比,本发明的平均速度能达到实时,且不需要GPU的加速。图7给出PDT数据集上一些复杂姿态上的主观效果,实验效果表明了在复杂的动作上,该算法仍然能取得较好的估计效果。
表1
方法 实时(Y/N) GPU(Y/N)
Ding&Fan N N
Ye&Yang Y Y
Vasileiadis et al Y Y
本发明方法 Y N
以上所述,仅是本发明的较佳实施例,并非对本发明作任何形式上的限制,凡是依据本发明的技术实质对以上实施例所作的任何简单修改、等同变化与修饰,均仍属本发明技术方案的保护范围。

Claims (8)

1.一种三维人体姿态估计方法,其特征在于:该方法包括以下步骤:
(1)建立与对象匹配的三维人体模型,该模型为可见球面分布约束点云人体模型;
(2)面向人体姿态跟踪的人体模型与深度点云匹配优化;
(3)基于动态数据库检索的姿态跟踪错误恢复。
2.根据权利要求1所述的三维人体姿态估计方法,其特征在于:所述步骤(1)中:
利用57个球面集合表示人体表面,交互定义每个球的半径和球心位置,使球面集合更接近人体表面,将球面集合s定义为11个子集的并集,每个子集由若干个球面组成,通过公式(1)分别对应特定的人体部位:
其中ri k表示第k个部位的第i个球的球心和半径,Nk表示第k个部位的球的总数,
3.根据权利要求2所述的三维人体姿态估计方法,其特征在于:所述步骤(1)中,忽略手腕和脚腕的运动。
4.根据权利要求3所述的三维人体姿态估计方法,其特征在于:所述步骤(1)中,
对于57个球,建立一个有向树,每个节点对应一个球,树的根节点为其它父节点为公式(2):
基于这种定义,每个身体部位的运动看作是由以其父节点为原点的局部坐标系下的旋转运动Rk加上世界坐标系下的全局平移向量t决定,使用斐波那契球面算法对球面进行密集采样得到球面点云,可见球面分布约束点云人体模型为公式(3):
其中Qk,i是k个部位的第i个球的采样总数,φ≈0.618是黄金分割比例,表示第k个部位的第i个球上第j个采样点的方向向量,对于每一个点,赋予它可见性属性,通过可见性检测决定每个点是否可见;由所有球面可见点组成的点集,用以表示人体模型,为可见球面分布约束点云人体模型。
5.根据权利要求4所述的三维人体姿态估计方法,其特征在于:所述步骤(2)中,
对由深度图转换得到的深度点云P进行采样得到假设模型和深度点云都处于同一个坐标系,利用深度点云对应的相机进行视角约束,对交叉部分和遮挡部分进行剔除,保留模型上在当前视角下可见的点以这些点来代表当前姿态下的模型,利用欧氏距离度量求得上的对应点重新定义:
6.根据权利要求5所述的三维人体姿态估计方法,其特征在于:所述步骤(2)中,
当建立了的对应关系后,将人体的运动看作是各个身体部位同时缓慢运动的过程,因此将模型与点云的匹配优化问题转换成求解人体各部位的旋转矩阵Rk和全局的平移向量t的问题,代价函数为公式(5):
s.t.(Rk)TRk=I (5)
其中λ,μk>0是权重参数,第一项Ψcorr衡量了模型表面点和输入深度点云之间的距离,表示为:
其中表示第k个部位的父节点球心坐标,该项使得模型上的点经过旋转和平移变换后与深度图转化的点云更加接近;
第二项Ψjoint为公式(6),利用前一帧的关节点位置信息以及部位的方向信息,被用来当作特殊的标记信息,约束两帧之间过大的空间移动和部位旋转,在一定程度上减少两帧之间差异性,
其中jk,m分别代表当前位姿和初始位姿上第k个部位上第m个关节的位置,nk,m分别代表当前位姿和初始位姿上第m个关节和其父节点的方向;可自适应的权重参数αk,m,βk,m为公式(7):
其中ω2,ω3>0是权重参数用于控制误差范围,τk,γk是比例参数,通过公式(8)对应点对进行确定:
其中表示之间的平均距离,ωi>0用于确定距离误差阈值,τk,γk只在优化之前,第一次对应关系确定后进行求解,在迭代过程中保持不变,αk,m,βk,m在更新对应关系时进行更新;
第三项Ψregu为公式(9),约束了在迭代过程中每个部位大的旋转,相邻两帧之间的运动被看作是各个部位同时变化的过程:
Ψregu(Rk)=||Rk-I||2 (9)。
7.根据权利要求6所述的三维人体姿态估计方法,其特征在于:
所述步骤(3)中,利用输入深度点云和构建的人体模型在二维平面上的重叠率θoverlap和代价函数值θcost来判断当前跟踪是否失败;假设人的肢体动作片段具有时间序列上的重复特性,用各个身体部位的方向信息表示人的三维动作,将上下躯干部分简化为两个互相垂直的主方向,四肢各部分用一个方向向量表示,忽略头部的方向,表示为公式(10):
其中v1,v2表示上下躯干方向,v3,...,v10表示除过上下躯干以及头部剩余部位的方向。
8.根据权利要求7所述的三维人体姿态估计方法,其特征在于:所述步骤(3)中,
对深度点云利用PCA提取主方向[e1,e2,e3],基于主方向的最小包围盒[w,d,h]来表示深度点云的特征,为公式(11):
当跟踪过程中满足匹配的代价函数小于阈值θoverlap≤θ1并且θcost≤θ2,认为跟踪成功,提取特征[e,v]更新数据库模型D,提取的特征[e,v]作为一对特征向量保存在数据库中;当跟踪失败时,利用特征e,通过和数据库中对应的深度点云特征求欧氏距离,在库中查找距离最小的前五个位姿利用v(i),i=1,...,5恢复可见球面分布约束点云人体模型,取和当前输入的深度点云重叠率最高的位姿并利用其进行重新初始化操作,以便于从跟踪失败中恢复。
CN201910201559.3A 2019-03-18 2019-03-18 一种三维人体姿态估计方法 Active CN110097639B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201910201559.3A CN110097639B (zh) 2019-03-18 2019-03-18 一种三维人体姿态估计方法
US16/724,608 US11200685B2 (en) 2019-03-18 2019-12-23 Method for three-dimensional human pose estimation

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910201559.3A CN110097639B (zh) 2019-03-18 2019-03-18 一种三维人体姿态估计方法

Publications (2)

Publication Number Publication Date
CN110097639A true CN110097639A (zh) 2019-08-06
CN110097639B CN110097639B (zh) 2023-04-18

Family

ID=67443231

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910201559.3A Active CN110097639B (zh) 2019-03-18 2019-03-18 一种三维人体姿态估计方法

Country Status (2)

Country Link
US (1) US11200685B2 (zh)
CN (1) CN110097639B (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111222437A (zh) * 2019-12-31 2020-06-02 浙江工业大学 一种基于多深度图像特征融合的人体姿态估计方法
CN112085105A (zh) * 2020-09-10 2020-12-15 上海庞勃特科技有限公司 一种基于人体形状与姿态估计的动作相似度评价方法
CN112232106A (zh) * 2020-08-12 2021-01-15 北京工业大学 一种二维到三维人体姿态估计方法
CN112766120A (zh) * 2021-01-11 2021-05-07 中国科学院计算技术研究所 基于深度点云的三维人体姿态估计方法与***
CN116051696A (zh) * 2023-01-10 2023-05-02 之江实验室 一种可重光照的人体隐式模型的重建方法和装置
CN117503120A (zh) * 2023-12-18 2024-02-06 北京铸正机器人有限公司 人体姿态估计方法及***

Families Citing this family (42)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6760491B2 (ja) * 2017-04-10 2020-09-23 富士通株式会社 認識装置、認識システム、認識方法および認識プログラム
US10897269B2 (en) 2017-09-14 2021-01-19 Apple Inc. Hierarchical point cloud compression
US10861196B2 (en) 2017-09-14 2020-12-08 Apple Inc. Point cloud compression
US11818401B2 (en) 2017-09-14 2023-11-14 Apple Inc. Point cloud geometry compression using octrees and binary arithmetic encoding with adaptive look-up tables
US11113845B2 (en) 2017-09-18 2021-09-07 Apple Inc. Point cloud compression using non-cubic projections and masks
US10909725B2 (en) 2017-09-18 2021-02-02 Apple Inc. Point cloud compression
US10607373B2 (en) 2017-11-22 2020-03-31 Apple Inc. Point cloud compression with closed-loop color conversion
US10939129B2 (en) 2018-04-10 2021-03-02 Apple Inc. Point cloud compression
US11010928B2 (en) 2018-04-10 2021-05-18 Apple Inc. Adaptive distance based point cloud compression
US10909726B2 (en) 2018-04-10 2021-02-02 Apple Inc. Point cloud compression
US10909727B2 (en) 2018-04-10 2021-02-02 Apple Inc. Hierarchical point cloud compression with smoothing
US11017566B1 (en) 2018-07-02 2021-05-25 Apple Inc. Point cloud compression with adaptive filtering
US11202098B2 (en) 2018-07-05 2021-12-14 Apple Inc. Point cloud compression with multi-resolution video encoding
US11012713B2 (en) 2018-07-12 2021-05-18 Apple Inc. Bit stream structure for compressed point cloud data
US11367224B2 (en) 2018-10-02 2022-06-21 Apple Inc. Occupancy map block-to-patch information compression
US11057564B2 (en) 2019-03-28 2021-07-06 Apple Inc. Multiple layer flexure for supporting a moving image sensor
US11600049B2 (en) * 2019-04-24 2023-03-07 Magic Leap, Inc. Perimeter estimation from posed monocular video
US11711544B2 (en) 2019-07-02 2023-07-25 Apple Inc. Point cloud compression with supplemental information messages
US11232629B1 (en) * 2019-08-30 2022-01-25 Amazon Technologies, Inc. Two-dimensional image collection for three-dimensional body composition modeling
US11562507B2 (en) 2019-09-27 2023-01-24 Apple Inc. Point cloud compression using video encoding with time consistent patches
US11627314B2 (en) 2019-09-27 2023-04-11 Apple Inc. Video-based point cloud compression with non-normative smoothing
US11538196B2 (en) * 2019-10-02 2022-12-27 Apple Inc. Predictive coding for point cloud compression
US11895307B2 (en) 2019-10-04 2024-02-06 Apple Inc. Block-based predictive coding for point cloud compression
US11645756B2 (en) * 2019-11-14 2023-05-09 Samsung Electronics Co., Ltd. Image processing apparatus and method
EP4075797A4 (en) * 2020-01-08 2023-05-31 LG Electronics Inc. POINT CLOUD DATA TRANSMITTING DEVICE, POINT CLOUD DATA TRANSMITTING METHOD, POINT CLOUD DATA RECEIVING DEVICE AND POINT CLOUD DATA RECEIVING METHOD
US11798196B2 (en) 2020-01-08 2023-10-24 Apple Inc. Video-based point cloud compression with predicted patches
US11475605B2 (en) 2020-01-09 2022-10-18 Apple Inc. Geometry encoding of duplicate points
US11615557B2 (en) 2020-06-24 2023-03-28 Apple Inc. Point cloud compression using octrees with slicing
US11620768B2 (en) 2020-06-24 2023-04-04 Apple Inc. Point cloud geometry compression using octrees with multiple scan orders
US11202951B1 (en) * 2020-07-27 2021-12-21 Tempo Interactive Inc. Free-standing a-frame exercise equipment cabinet
WO2022071743A1 (en) * 2020-09-29 2022-04-07 Samsung Electronics Co., Ltd. Body shape and pose estimation via volumetric regressor for raw three dimensional scan models
US11983916B2 (en) * 2020-11-11 2024-05-14 Ubtech Robotics Corp Ltd Relocation method, mobile machine using the same, and computer readable storage medium
US20220292290A1 (en) * 2021-03-09 2022-09-15 Pony Ai Inc. Distributed computing network to perform simultaneous localization and mapping
US11948338B1 (en) 2021-03-29 2024-04-02 Apple Inc. 3D volumetric content encoding using 2D videos and simplified 3D meshes
CN113129414B (zh) * 2021-04-12 2024-04-12 北京爱奇艺科技有限公司 手部动作修复方法、装置、设备及存储介质
GB2608170A (en) 2021-06-24 2022-12-28 Aistetic Ltd Method and system for obtaining human body size information from image data
CN113673327B (zh) * 2021-07-14 2023-08-18 南京邮电大学 一种基于人体姿态估计的罚球命中预测方法
CN113344986B (zh) * 2021-08-03 2021-11-09 深圳市信润富联数字科技有限公司 点云配准结果的评估方法、装置、设备及存储介质
CN113706670B (zh) * 2021-08-17 2023-12-08 复旦大学 生成动态三维人体网格模型序列的方法及装置
CN114663593B (zh) * 2022-03-25 2023-04-07 清华大学 三维人体姿态估计方法、装置、设备及存储介质
CN114565978B (zh) * 2022-04-28 2022-07-26 深圳市第二人民医院(深圳市转化医学研究院) 基于动作捕捉点云的关节旋转中心优化方法及设备
CN114627250B (zh) * 2022-05-13 2022-08-16 武汉纺织大学 一种基于Kinect的人体站姿三维重建与测量的方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102855470A (zh) * 2012-07-31 2013-01-02 中国科学院自动化研究所 基于深度图像的人体姿态估计方法
US20140334670A1 (en) * 2012-06-14 2014-11-13 Softkinetic Software Three-Dimensional Object Modelling Fitting & Tracking
US20140355825A1 (en) * 2013-06-03 2014-12-04 Samsung Electronics Co., Ltd. Method and apparatus for estimating pose
CN108629831A (zh) * 2018-04-10 2018-10-09 清华大学 基于参数化人体模板和惯性测量的三维人体重建方法及***

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7257237B1 (en) * 2003-03-07 2007-08-14 Sandia Corporation Real time markerless motion tracking using linked kinematic chains
US8428311B2 (en) * 2009-02-25 2013-04-23 Honda Motor Co., Ltd. Capturing and recognizing hand postures using inner distance shape contexts
US20150139505A1 (en) * 2013-11-18 2015-05-21 Electronics And Telecommunications Research Institute Method and apparatus for predicting human motion in virtual environment
US9911219B2 (en) * 2015-05-13 2018-03-06 Intel Corporation Detection, tracking, and pose estimation of an articulated body
CA3034058C (en) * 2016-08-14 2023-08-08 Uvic Industry Partnerships Inc. Real-time hand modeling and tracking using sphere-mesh models

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140334670A1 (en) * 2012-06-14 2014-11-13 Softkinetic Software Three-Dimensional Object Modelling Fitting & Tracking
CN102855470A (zh) * 2012-07-31 2013-01-02 中国科学院自动化研究所 基于深度图像的人体姿态估计方法
US20140355825A1 (en) * 2013-06-03 2014-12-04 Samsung Electronics Co., Ltd. Method and apparatus for estimating pose
CN108629831A (zh) * 2018-04-10 2018-10-09 清华大学 基于参数化人体模板和惯性测量的三维人体重建方法及***

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
CHEN QIAN等: "Realtime and Robust Hand Tracking from Depth", 《PROCEEDINGS OF THE IEEE CONFERENCE ON COMPUTER VISION AND PATTERN RECOGNITION (CVPR)》 *
MAO YE等: "Accurate 3d pose estimation from a single depth image", 《2011 INTERNATIONAL CONFERENCE ON COMPUTER VISION》 *
杨凯等: "基于深度图像的人体运动姿态跟踪和识别算法", 《数据采集与处理》 *

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111222437A (zh) * 2019-12-31 2020-06-02 浙江工业大学 一种基于多深度图像特征融合的人体姿态估计方法
CN112232106A (zh) * 2020-08-12 2021-01-15 北京工业大学 一种二维到三维人体姿态估计方法
CN112085105A (zh) * 2020-09-10 2020-12-15 上海庞勃特科技有限公司 一种基于人体形状与姿态估计的动作相似度评价方法
CN112766120A (zh) * 2021-01-11 2021-05-07 中国科学院计算技术研究所 基于深度点云的三维人体姿态估计方法与***
CN112766120B (zh) * 2021-01-11 2023-06-02 中国科学院计算技术研究所 基于深度点云的三维人体姿态估计方法与***
CN116051696A (zh) * 2023-01-10 2023-05-02 之江实验室 一种可重光照的人体隐式模型的重建方法和装置
CN116051696B (zh) * 2023-01-10 2023-12-22 之江实验室 一种可重光照的人体隐式模型的重建方法和装置
CN117503120A (zh) * 2023-12-18 2024-02-06 北京铸正机器人有限公司 人体姿态估计方法及***
CN117503120B (zh) * 2023-12-18 2024-04-16 北京铸正机器人有限公司 人体姿态估计方法及***

Also Published As

Publication number Publication date
US11200685B2 (en) 2021-12-14
CN110097639B (zh) 2023-04-18
US20200302621A1 (en) 2020-09-24

Similar Documents

Publication Publication Date Title
CN110097639A (zh) 一种三维人体姿态估计方法
Liu et al. Multi-view hierarchical bidirectional recurrent neural network for depth video sequence based action recognition
Mori et al. Recovering 3d human body configurations using shape contexts
CN104268138B (zh) 融合深度图和三维模型的人体运动捕捉方法
CN105389569B (zh) 一种人体姿态估计方法
CN103177269B (zh) 用于估计对象姿态的设备和方法
CN102855470B (zh) 基于深度图像的人体姿态估计方法
CN102184541B (zh) 多目标优化人体运动跟踪方法
Uddin et al. Human activity recognition using body joint‐angle features and hidden Markov model
CN110060277A (zh) 一种多特征融合的视觉slam方法
CN110008913A (zh) 基于姿态估计与视点机制融合的行人再识别方法
CN107423730A (zh) 一种基于语义折叠的人体步态行为主动检测识别***和方法
Mori et al. Hierarchical recognition of daily human actions based on continuous hidden markov models
JP2014522035A (ja) オブジェクト姿勢検索装置及び方法
CN109086706A (zh) 应用于人机协作中的基于分割人体模型的动作识别方法
CN102622766A (zh) 多目标优化的多镜头人体运动跟踪方法
CN109460267A (zh) 移动机器人离线地图保存与实时重定位方法
CN113065505B (zh) 身体动作快速识别方法及***
Geng et al. Combining features for chinese sign language recognition with kinect
CN109101864A (zh) 基于关键帧和随机森林回归的人体上半身动作识别方法
CN105243375A (zh) 一种动作特征提取方法及装置
CN111368759A (zh) 基于单目视觉的移动机器人语义地图构建***
CN110348321A (zh) 基于骨骼时空特征及长短时记忆网络的人体动作识别方法
CN110472497A (zh) 一种融合旋转量的动作特征表示方法
CN109670401A (zh) 一种基于骨骼运动图的动作识别方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant