CN115035592A

CN115035592A - 一种用于美术作品在线教育的手势识别方法及装置

Info

Publication number: CN115035592A
Application number: CN202210478919.6A
Authority: CN
Inventors: 林东姝
Original assignee: Beijing Yiqi Network Technology Co ltd
Current assignee: Beijing Yiqi Network Technology Co ltd
Priority date: 2022-05-05
Filing date: 2022-05-05
Publication date: 2022-09-09

Abstract

本发明涉及一种用于美术作品在线教育的手势识别方法及装置，所述方法包括以下步骤：利用Kinect传感器构建肤色聚类椭圆模型，根据肤色聚类椭圆模型对手势图像进行分割，以实现对手势图像提取手部；对分割后的手势图像进行轮廓简化；根据简化后的手势轮廓进行手势指尖点特征提取；将获得的手势指尖点特征与数据库进行匹配得到类匹配手势，计算手势与类匹配手势的相似度γ_i，并根据相似度γ_i与相似度阈值γ进行判别，完成手势识别。本发明能够在复杂环境下对手势进行分割，对于不同用户的手势可快速识别出手势类型，交互实时性好，同时提高了手势提取和识别工作的可靠性，能够得到更精准的识别结果。

Description

一种用于美术作品在线教育的手势识别方法及装置

技术领域

本发明涉及在线教育技术领域，尤其涉及一种用于美术作品在线教育的手势识别方法及装置。

背景技术

在线教育顾名思义，是以网络为介质的教学方式，通过网络，学员与教师即使相隔万里也可以开展教学活动；此外，借助网络课件，学员还可以随时随地进行学习，真正打破了时间和空间的限制，对于工作繁忙，学习时间不固定的职场人而言网络远程教育是最方便不过的学习方式。

随着计算机技术的突飞猛进，人机交互技术在人们的生活中越来越普及。人机交互(Human-ComputerInteraction,HCI)技术是指用户与计算机之间使用某种操作方式而执行的一种人与计算机之间的交互过，它的发展大致经历了纯手工作业阶段、语言命令控制阶段、用户界面阶段等，然而随着近年来人工智能等技术的不断发展，逐渐引起对人机交互技术发展的重视。

而在在线教育领域，美术课程方面的学习经常通过肢体语言教学，由于在肢体语言当中，手扮演着极为重要的角色，因此，基于手势行为的交互方式即手势行为识别，也即手势识别受到人们的广泛关注。

目前现有的手势识别方法，由于受到复杂背景或者其他因素的影响，在进行手势识别时，无法准确的将手势进行识别，交互实时性差，大大影响了在线教育的教学质量及效率。

发明内容

为了现有技术存在的上述技术缺陷，本发明提供了一种用于美术作品在线教育的手势识别方法及装置，可以有效解决背景技术中的问题。

为了解决上述技术问题，本发明提供的技术方案具体如下：

本发明实施例公开了一种用于美术作品在线教育的手势识别方法，所述方法包括以下步骤：

利用Kinect传感器构建肤色聚类椭圆模型，根据肤色聚类椭圆模型对手势图像进行分割，以实现对手势图像提取手部；

对分割后的手势图像进行轮廓简化；

根据简化后的手势轮廓进行手势指尖点特征提取；

将获得的手势指尖点特征与数据库进行匹配得到类匹配手势，计算手势与类匹配手势的相似度γ_i，并根据相似度γ_i与相似度阈值γ进行判别，完成手势识别。

在上述任一方案中优选的是，利用Kinect传感器获取的深度数据将用户与背景分割，再通过设置特定阈值为用户在深度图像中创建独立空间，对人体部位进行分类并识别出关节点坐标，完成骨骼三维建模。

在上述任一方案中优选的是，深度数据和骨骼数据定位包括用户手部区域的彩色感兴趣区域ROI，结合YCrCb颜色空间对ROI区域进行肤色检测并提取手部的区域。

在上述任一方案中优选的是，将YCrCb颜色空间进行非线性色彩变换，生成YCr'Cb'颜色空间，将YCr'Cb'颜色空间的肤色聚类分布情况投影至YCr'Cb'二维子空间，建立肤色聚类椭圆模型，椭圆的标准方程为：(x-ecx)²/a²+(y-ect)²/b²＝1其中，待检测图像中的像素点坐标(x,y)满足式

ecx、ecy、cx、cy、a、b为椭圆的标准方程中各常量，Cb为RGB输入信号红色部分与RGB信号亮度值之间的差异，Cr为RGB输入信号蓝色部分与RGB信号亮度值之间的差异。

在上述任一方案中优选的是，根据建立的肤色聚类椭圆模型，设

当A＞1时，则被检测像素点位于肤色聚类椭圆模型区域外，属于背景像素点；当A＜1时，则被检测像素点位于肤色聚类椭圆模型区域内，属于肤色像素点。

在上述任一方案中优选的是，通过以下方式对分割后的手势图像进行轮廓简化：

(Ⅰ)选取阈值T；

(Ⅱ)在曲线距离最远的两点之间连接一条基准线EF；

(Ⅲ)计算轮廓上其他点到该基准线之间的距离，找出距离该基准线最远的点记为G，最大距离为D_max；

(Ⅳ)若D_max比阈值T大，则将E、F、G都作为基准点，E、F、G三点之间的连线作为基准线，并重复(Ⅱ)-(Ⅳ)直至轮廓上所有的点到基准线的距离都小于等于T；若D_max比阈值T小，则所有的基准点和基准线就构成了轮廓的逼近，完成轮廓简化。

在上述任一方案中优选的是，对轮廓简化结果进行凹凸点检测，凸点包括所有指尖点和非指尖点。

在上述任一方案中优选的是，通过公式

计算凹凸点之间的夹角，其中，j为某凸点到临近凹点之间的距离，k为该凸点到另一个临近凸点之间的距离，c为该凹点的两个临近凸点之间的距离，θ为该凹点与相邻两个顶点连线的夹角，0°＜θ＜90°；对于符合公式

的凸点视为指尖点，进行手指计数，反之视为噪声点进行去除。

在上述任一方案中优选的是，通过以下方式进行手势识别：

1)输入手势，根据获得的手势指尖点特征在数据库中进行识别，得到类匹配手势；

2)计算输入手势与全部类匹配手势的相似度γ_i；

3)将计算得到的输入手势与全部类匹配手势的相似度γ_i进行排序并得到最大相似度γ_max；

4)将最大相似度γ_max与相似度阈值γ进行判别，若γ_max＜γ，则输入手势与数据库内手势均不匹配，为无效手势；若γ_max＞γ，则判断输入手势为γ_max所对应的类匹配手势，并输出手势类别。

一种用于美术作品在线教育的手势识别装置，所述装置包括：

构建模块，用于利用Kinect传感器构建肤色聚类椭圆模型，根据肤色聚类椭圆模型对手势图像进行分割，以实现对手势图像提取手部手势；

简化模块，用于根据分割后的手部手势图像进行轮廓简化；

提取模块，用于根据简化后的手势轮廓进行手势指尖点特征提取；

判别模块，用于将获得的手势指尖点特征与数据库进行匹配得到类匹配手势，计算手势与类匹配手势的相似度γ_i，并根据相似度γ_i与相似度阈值γ进行判别，完成手势识别。

与现有技术相比，本发明的有益效果：

本发明提供的一种用于美术作品在线教育的手势识别方法及装置通过利用Kinect传感器构建肤色聚类椭圆模型，根据肤色聚类椭圆模型对手势图像进行分割；对分割后的手势图像进行轮廓简化；根据简化后的手势轮廓进行手势指尖点特征提取；将获得的手势指尖点特征与数据库进行匹配得到类匹配手势，计算手势与类匹配手势的相似度γ_i，并根据相似度γ_i与相似度阈值γ进行判别，完成手势识别；能够在复杂环境下对手势进行分割，对于不同用户的手势可快速识别出手势类型，交互实时性好，同时提高了手势提取和识别工作的可靠性，能够得到更精准的识别结果。

附图说明

附图用于对本发明的进一步理解，与本发明的实施例一起用于解释本发明，并不构成对本发明的限制。

图1是本发明一种用于美术作品在线教育的手势识别方法流程图；

图2是本发明一种用于美术作品在线教育的手势识别方法逻辑图；

图3是本发明一种用于美术作品在线教育的手势识别装置模块图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本发明进行进一步详细说明。应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。

需要说明的是，当元件被称为“固定于”或“设置于”另一个元件，它可以直接在另一个元件上或者间接在该另一个元件上。当一个元件被称为是“连接于”另一个元件，它可以是直接连接到另一个元件或间接连接至该另一个元件上。

在本发明的描述中，需要理解的是，术语“长度”、“宽度”、“上”、“下”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系，仅是为了便于描述本发明和简化描述，而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作，因此不能理解为对本发明的限制。

此外，术语“第一”、“第二”仅用于描述目的，而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此，限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。在本发明的描述中，“多个”的含义是两个或两个以上，除非另有明确具体的限定。

为了更好地理解上述技术方案，下面将结合说明书附图及具体实施方式对本发明技术方案进行详细说明。

如图1所示，本发明提供了一种用于美术作品在线教育的手势识别方法，所述方法包括以下步骤：

步骤1，利用Kinect传感器构建肤色聚类椭圆模型，根据肤色聚类椭圆模型对手势图像进行分割，以实现对手势图像提取手部。

具体的，在对于美术作品的在线教育时，不同的手势往往对应不同的操作命令，在复杂的环境影响下，例如光照、复杂背景、手势的自身遮挡等因素都会影响手势的识别；进而可通过Kinect传感器采集用户的骨骼和深度信息，Kinect传感器是由微软公司推出的一款体感设备，它内置了深度传感器，可以捕捉空间的三维信息，在骨骼跟踪以及姿态估计方面有着出色的表现。

进一步的，利用深度数据将用户与背景分割，再通过设置特定阈值为用户在深度图像中创建独立空间，进而对人体部位进行分类并进一步识别出关节点坐标从而完成骨骼三维建模。

进一步的，通过深度数据和骨骼数据定位包括用户手部区域的彩色感兴趣区域ROI，结合YCrCb颜色空间对ROI区域进行肤色检测并提取手部的区域。

进一步的，由于YCrCb颜色空间是由RGB颜色空间经过线性变换得到，在YCrCb颜色空间中肤色聚类呈两头尖的纺锤形状，Y值在较大和较小的部分，肤色聚类也随之缩减，在Y值的不同地方，Cb-Cr子平面的投影是不同的；进而可将YCrCb颜色空间进行非线性色彩变换，生成YCr'Cb'颜色空间，在此空间中，肤色的亮度以及红、蓝色度相互独立，互相不会构成影响。

进一步的，将YCr'Cb'颜色空间的肤色聚类分布情况投影至YCr'Cb'二维子空间，建立肤色聚类椭圆模型，其椭圆的标准方程为：

(x-ecx)²/a²+(y-ecy)²/b²＝1，其中，待检测图像中的像素点坐标(x,y)满足式

作为优选的，椭圆的标准方程中各常量分别为cx＝109.38，cy＝152.02，ecx＝1.60，ecy＝2.41，a＝25.39，b＝14.03，Cb为RGB输入信号红色部分与RGB信号亮度值之间的差异，Cr为RGB输入信号蓝色部分与RGB信号亮度值之间的差异。

进一步的，根据建立的肤色聚类椭圆模型，设

进一步的，由于图像背景中可能存在类肤区域或者人脸等肤色区域，需先对输入图像进行肤色检测处理，遍历整个图像，将判定为肤色像素的点赋值为白色，将非肤色像素点赋值为黑色，得到肤色的二值图像，并采用“十字形”模板，对肤色二值图像进行腐蚀操作以消除图像中的噪点；其次遍历肤色二值图像，获取肤色像素点的深度值，统计出各个深度距离上肤色点个数，并得到统计直方图，获取直方图第一个波谷位置的深度值作为分割阈值；最后重新对肤色二值图像进行遍历，只保留深度距离小于分割阈值的肤色像素点，其余像素点均按背景处理，像素值设为黑色，得到分割后的手势图像。

步骤2，对分割后的手势图像进行轮廓简化。

具体的，由于不同的用户在进行手势交互时，其相同的手势往往表现不同，需要对手势轮廓进行简化，以弱化不同用户的手势差异，保证对不同用户的手势进行几何特征提取时特征值的相对稳定性。

进一步的，通过以下方式对分割后的手势图像进行轮廓简化：

(Ⅰ)选取阈值T；

(Ⅱ)在曲线距离最远的两点之间连接一条基准线EF；

步骤3，根据简化后的手势轮廓进行手势指尖点特征提取。

具体的，通过手势轮廓简化后，手势轮廓的闭合曲线在全局最优的情况下被拟合成任意顶点数的多边形，进而对多边拟合结果进行凹凸点检测，凸点包括所有指尖点和非指尖点。

进一步的，通过公式

步骤4，将获得的手势指尖点特征与数据库进行匹配得到类匹配手势，计算手势与类匹配手势的相似度γ_i，并根据相似度γ_i与相似度阈值γ进行判别，完成手势识别。

具体的，由于手势所表达的含义大多体现在其手部指尖特征上，而一个手势的指尖特征可能对应的手势含义不止一种，在手势指尖特征提取完成后，需进一步对手势的其他特征进行识别，以实现准确对手势判断类型。

进一步的，如图2所示，可通过以下方式进行手势识别：

1)输入手势，根据获得的手势指尖点特征在数据库中进行识别，得到类匹配手势。

2)计算输入手势与全部类匹配手势的相似度γ_i；其相似度γ_i的计算方式为：用梯度算子获得手势图像每个像素的横向和纵向梯度，并计算每个像素的梯度方向和梯度大小，其中梯度方向取值范围为0°-180°；将其平均分成9份，统计每个细胞中每个像素的梯度方向直方图，形成一组特征向量；在块区间内，以细胞为单位，采用l₂范数为因子对向量进行归一化处理，获得手势的HOG特征向量；通过直方图交方法计算，得到输入手势与数据库中类匹配手势的相似度γ_i。

3)将计算得到的输入手势与全部类匹配手势的相似度γ_i进行排序并得到最大相似度γ_max。

如图3所示，本发明还提供了一种用于美术作品在线教育的手势识别装置，所述装置包括：

构建模块，用于利用Kinect传感器构建肤色聚类椭圆模型，根据肤色聚类椭圆模型对手势图像进行分割，以实现对手势图像提取手部手势。

简化模块，用于根据分割后的手部手势图像进行轮廓简化。

提取模块，用于根据简化后的手势轮廓进行手势指尖点特征提取。

与现有技术相比，本发明提供的有益效果是：

以上仅为本发明的优选实施例而已，并不用于限制本发明，尽管参照前述实施例对本发明进行了详细的说明，对于本领域的技术人员来说，其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换。凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种用于美术作品在线教育的手势识别方法，其特征在于：所述方法包括以下步骤：

对分割后的手势图像进行轮廓简化；

根据简化后的手势轮廓进行手势指尖点特征提取；

2.根据权利要求1所述的用于美术作品在线教育的手势识别方法，其特征在于：利用Kinect传感器获取的深度数据将用户与背景分割，再通过设置特定阈值为用户在深度图像中创建独立空间，对人体部位进行分类并识别出关节点坐标，完成骨骼三维建模。

3.根据权利要求2所述的用于美术作品在线教育的手势识别方法，其特征在于：深度数据和骨骼数据定位包括用户手部区域的彩色感兴趣区域ROI，结合YCrCb颜色空间对ROI区域进行肤色检测并提取手部的区域。

4.根据权利要求3所述的用于美术作品在线教育的手势识别方法，其特征在于：将YCrCb颜色空间进行非线性色彩变换，生成YCr′Cb′颜色空间，将YCr′Cb′颜色空间的肤色聚类分布情况投影至YCr′Cb′二维子空间，建立肤色聚类椭圆模型，椭圆的标准方程为：(x-ecx)²/a²+(y-ecy)²/b²＝1，其中，待检测图像中的像素点坐标(x，y)满足式

5.根据权利要求4所述的用于美术作品在线教育的手势识别方法，其特征在于：根据建立的肤色聚类椭圆模型，设

6.根据权利要求5所述的用于美术作品在线教育的手势识别方法，其特征在于：通过以下方式对分割后的手势图像进行轮廓简化：

(I)选取阈值T；

(II)在曲线距离最远的两点之间连接一条基准线EF；

(III)计算轮廓上其他点到该基准线之间的距离，找出距离该基准线最远的点记为G，最大距离为D_max；

(IV)若D_max比阈值T大，则将E、F、G都作为基准点，E、F、G三点之间的连线作为基准线，并重复(II)-(IV)直至轮廓上所有的点到基准线的距离都小于等于T；若D_max比阈值T小，则所有的基准点和基准线就构成了轮廓的逼近，完成轮廓简化。

7.根据权利要求6所述的用于美术作品在线教育的手势识别方法，其特征在于：对轮廓简化结果进行凹凸点检测，凸点包括所有指尖点和非指尖点。

8.根据权利要求7所述的用于美术作品在线教育的手势识别方法，其特征在于：通过公式

9.根据权利要求8所述的用于美术作品在线教育的手势识别方法，其特征在于：通过以下方式进行手势识别：

2)计算输入手势与全部类匹配手势的相似度γ_i；

10.一种用于美术作品在线教育的手势识别装置，其特征在于：所述装置包括：

简化模块，用于根据分割后的手部手势图像进行轮廓简化；