CN104134061A - 一种基于特征融合的支持向量机的数字手势识别方法 - Google Patents

一种基于特征融合的支持向量机的数字手势识别方法 Download PDF

Info

Publication number
CN104134061A
CN104134061A CN201410401025.2A CN201410401025A CN104134061A CN 104134061 A CN104134061 A CN 104134061A CN 201410401025 A CN201410401025 A CN 201410401025A CN 104134061 A CN104134061 A CN 104134061A
Authority
CN
China
Prior art keywords
gesture
feature
carried out
digital
support vector
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201410401025.2A
Other languages
English (en)
Inventor
吴健健
闵琪
陈玮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Shanghai for Science and Technology
Original Assignee
University of Shanghai for Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Shanghai for Science and Technology filed Critical University of Shanghai for Science and Technology
Priority to CN201410401025.2A priority Critical patent/CN104134061A/zh
Publication of CN104134061A publication Critical patent/CN104134061A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Image Analysis (AREA)

Abstract

本发明涉及一种基于特征融合的支持向量机的数字手势识别方法,USB摄像头采集数字手势图片,用于分类器的训练与手势识别;对采集到的数字手势图片进行预处理;对处理后的数字手势图片提取特征;对提取到的特征向量矩阵进行降维处理;将进行降维处理后的特征向量输入到多分类的分类器中进行训练和识别,观察测试结果,并对结果做出分析。此方法基于Hu矩全局特征与HOG局部特征相融合进而得到一种更易训练识别的特征向量,而后对提取到的向量进行了LDA降维处理,易于操作,简便,并且更有效的提高了数字手势识别的识别率。

Description

一种基于特征融合的支持向量机的数字手势识别方法
技术领域
本发明涉及一种手势识别技术,特别涉及一种基于特征融合的支持向量机的数字手势识别方法。
背景技术
人机交互技术已经从以计算机为中心转移到以人为中心,手势识别交互作为一种自然、人性化的人机交互方式被越来越多的采用。然而,人手的自由度和弹性、背景、光照以及噪声等因等给手势识别带来了极大的困难,如何克服这些困难以获得更加自然、和谐、完善的手势识别***使人们当今研究的目标。
基于计算机视觉的手势识别主要由手势分割、手势特征提取、手势识别等阶段组成。手势识别主要有两大问题需要解决:首先是手势特征的选取,比较常用的特征有Hu矩、Zernike矩,HOG特征,傅里叶描述子等,其中,Zernike对于噪声不太敏感,一般应用于图像的恢复方面;傅里叶描述子虽然具有较好的轮廓描述能力,但是对于细节太敏感,容易导致误识;而Hu矩具有平移、旋转和比例不变性,而HOG特征对图像几何的和光学的形变都能保持良好的不变性;其次是分类器的选择,基于计算机视觉的手势识别算法研究一般有模板匹配法,神经网络法,支持向量机法等。支持向量机是基于结构风险最小化的一种新的模式方法,在解决小本、非线性及高维模式识别问题中具有许多特有的优势。
发明内容
本发明是针对手势识别因为背景环境的多变性识别困难的问题,提出了一种基于特征融合的支持向量机的数字手势识别方法,提高手势识别***的实用性,同时提高数字手势识别的识别率。本发明在对手势全局(即手势轮廓)进行Hu矩特征提取以及提取手势的HOG特征的基础上,并对特征进行LDA降维以后,设计了SVM分类器,用以提高数字手势识别的识别率。
本发明的技术方案为:一种基于特征融合的支持向量机的数字手势识别方法,具体包括如下步骤:
1)USB摄像头采集数字手势图片,用于分类器的训练与手势识别;
2)对采集到的数字手势图片进行预处理;
将采集到的数字手势图片转换到灰度空间以获取对应的灰度图像;利用中值滤波对图像进行降噪处理;对图像进行锐化处理,突出图像的边缘轮廓与细节特征;
3)对处理后的数字手势图片提取特征;
对步骤2)处理后的数字手势图片中图片手势全局进行Hu矩特征提取,然后对步骤2)处理后的数字手势图片中提取基于HOG的局部特征,最后将提取的Hu矩特征与提取的HOG特征相融合;
4)对提取到的特征向量矩阵进行降维处理:
5)将步骤4)进行降维处理后的特征向量输入到多分类的分类器中进行训练和识别,观察测试结果,并对结果做出分析。
所述步骤3)中手势全局进行Hu矩特征提取,通过各种不同级别的几何矩的数学组合,可以得到七个特征量,当图像移动,旋转和比例大小变化时,特征量保持其数值不变的特性。
所述步骤5)中分类器为SVM分类器,选择径向基核函数的支持向量机,将降维后的用于训练的特征向量矩阵输入到SVM分类器中,对SVM分类器进行训练,训练完成后,将用于测试的特征向量矩阵输入到SVM分类器中,观察测试结果,并对结果做出分析。
本发明的有益效果在于:本发明基于特征融合的支持向量机的数字手势识别方法,基于Hu矩全局特征与HOG局部特征相融合进而得到一种更易训练识别的特征向量,而后对提取到的向量进行了LDA降维处理,易于操作,简便,并且更有效的提高了数字手势识别的识别率。
附图说明
图1为本发明总体流程图;
图2为本发明数字手势识别程序流程图。
具体实施方式
本发明的具体实施方法如图1所示,包括如下具体步骤:
1、USB摄像头采集数字手势图片,用于分类器的训练与手势识别;
此处运用的USB摄像头属于VFW视频采集设备,运用此摄像头对数字手势进行一定数量的图像采集。
2、对采集到的数字手势图片进行预处理;
将采集到的数字手势图片转换到灰度空间以获取对应的灰度图像;利用中值滤波对图像进行降噪处理;对图像进行锐化处理,突出手势图像的边缘轮廓与细节特征。
3、对处理后的数字手势图片提取特征;
首先,对处理后的数字手势图片提取特征主要提取的是基于Hu矩的手势全局特征,根据Hu氏理论,通过各种不同级别的几何矩的数学组合,可以得到七个特征量,当图像移动,旋转和比例大小变化时,他们具有保持其数值不变的特性;
对于是在图像f(i,j),其(p+q)阶中心距为
其中p指对应于i维度上矩的阶数,q对应于j维度上矩的阶数,R为实数;
归一化的中心矩为,其中μ 00 理论对应于图像的0阶中心距,实际意义为对应于轮廓边界上点的数目,
将其组成一个七维的特征向量;
然后在处理后的数字手势图片中提取HOG特征,具体步骤为:
(1)采用Gamma校正法对输入图像进行颜色空间的标准化(归一化)目的是调节图像的对比度,降低图像局部的阴影和光照变化所造成的影响,同时可以抑制噪音的干扰;
(2)计算梯度;主要是为了捕获轮廓信息,同时进一步弱化光照的干扰;
(3)将梯度投影到单元的梯度方向;目的是为局部图像区域提供一个编码;
(4)将所有单元格在块上进行归一化;归一化能够更进一步对光照、阴影和边缘进行压缩,通常,每个单元格由多个不同的块共享,但它的归一化是基于不同块的,所以计算结果也不一样。因此,一个单元格的特征会以不同的结果多次出现在最后的向量中。我们将归一化之后的块描述符就称之为HOG描述符;
(5)收集得到检测空间所有块的HOG特征;该步骤就是将检测窗口中所有重叠的块进行HOG特征的收集,并将它们结合成最终的特征向量供分类使用。
经过上述HOG的提取,得到的是一个1764维的特征向量,而后将这个特征向量与提取的Hu矩特征相融合得到一个1771维的特征向量。
4、对提取到的特征向量矩阵进行降维处理:
由于得到的是一个1771维的特征向量,维数较高,不利于后面的分类器的训练和识别,故此处采用LDA(线性判别分析)对得到的特征向量矩阵进行降维处理,降维以后,得到的是一个7维的特征向量矩阵。
5、将提取到的特征向量输入到多分类的分类器中进行训练和识别,如图2所示数字手势识别程序流程图:
步骤4经过LDA降维处理的特征向量矩阵送入分类器,分类器为SVM分类器,在此选择径向基核函数的支持向量机,将降维后的用于训练的特征向量矩阵输入到SVM分类器中,对SVM分类器进行训练,训练完成后,将用于测试的特征向量矩阵输入到SVM分类器中,观察测试结果,并对结果做出相应的分析。
本次数字手势识别需要识别数字1,2,3,4,5,6,7,8,每个数字手势均提有30个训练样本,以及10个测试样本,首先将每个数字的训练样本共240个的7维特征向量组成一个向量矩阵输入到SVM分类器中对SVM进行训练,然后将每个数字的测试样本共80个的7维特征向量组成一个向量矩阵矩阵输入到SVM分类器中进行测试,观察测试结果,并对测试结果做出相应的分析。

Claims (3)

1.一种基于特征融合的支持向量机的数字手势识别方法,其特征在于,具体包括如下步骤:
1)USB摄像头采集数字手势图片,用于分类器的训练与手势识别;
2)对采集到的数字手势图片进行预处理;
将采集到的数字手势图片转换到灰度空间以获取对应的灰度图像;利用中值滤波对图像进行降噪处理;对图像进行锐化处理,突出图像的边缘轮廓与细节特征;
3)对处理后的数字手势图片提取特征;
对步骤2)处理后的数字手势图片中手势全局进行Hu矩特征提取,然后对步骤2)处理后的数字手势图片中提取基于HOG的局部特征,最后将提取的Hu矩特征与提取的HOG特征相融合;
4)对提取到的特征向量矩阵进行降维处理:
5)将步骤4)进行降维处理后的特征向量输入到多分类的分类器中进行训练和识别,观察测试结果,并对结果做出分析。
2.根据权利要求1所述基于特征融合的支持向量机的数字手势识别方法,其特征在于,所述步骤3)中手势全局进行Hu矩特征提取,通过各种不同级别的几何矩的数学组合,可以得到七个特征量,当图像移动,旋转和比例大小变化时,特征量保持其数值不变的特性。
3.根据权利要求1所述基于特征融合的支持向量机的数字手势识别方法,其特征在于,所述步骤5)中分类器为SVM分类器,选择径向基核函数的支持向量机,将降维后的用于训练的特征向量矩阵输入到SVM分类器中,对SVM分类器进行训练,训练完成后,将用于测试的特征向量矩阵输入到SVM分类器中,观察测试结果,并对结果做出分析。
CN201410401025.2A 2014-08-15 2014-08-15 一种基于特征融合的支持向量机的数字手势识别方法 Pending CN104134061A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410401025.2A CN104134061A (zh) 2014-08-15 2014-08-15 一种基于特征融合的支持向量机的数字手势识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410401025.2A CN104134061A (zh) 2014-08-15 2014-08-15 一种基于特征融合的支持向量机的数字手势识别方法

Publications (1)

Publication Number Publication Date
CN104134061A true CN104134061A (zh) 2014-11-05

Family

ID=51806735

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410401025.2A Pending CN104134061A (zh) 2014-08-15 2014-08-15 一种基于特征融合的支持向量机的数字手势识别方法

Country Status (1)

Country Link
CN (1) CN104134061A (zh)

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104731324A (zh) * 2015-02-13 2015-06-24 北京航空航天大学 一种基于hog+svm框架的手势内平面旋转检测模型生成方法
CN104866835A (zh) * 2015-06-01 2015-08-26 华中师范大学 一种手势识别方法
CN104992171A (zh) * 2015-08-04 2015-10-21 易视腾科技有限公司 一种基于2d视频序列的手势识别及人机交互方法和***
CN105608442A (zh) * 2016-01-14 2016-05-25 深圳市视美泰技术股份有限公司 一种高效的静态手势识别方法和装置
CN108501954A (zh) * 2018-04-03 2018-09-07 北京瑞特森传感科技有限公司 一种手势识别方法、装置、汽车和存储介质
CN109145793A (zh) * 2018-08-09 2019-01-04 东软集团股份有限公司 建立手势识别模型的方法、装置、存储介质及电子设备
CN109271840A (zh) * 2018-07-25 2019-01-25 西安电子科技大学 一种视频手势分类方法
CN110135237A (zh) * 2019-03-24 2019-08-16 北京化工大学 一种手势识别方法
CN110147764A (zh) * 2019-05-17 2019-08-20 天津科技大学 一种基于机器学习的静态手势识别方法
CN110197138A (zh) * 2019-05-15 2019-09-03 南京极目大数据技术有限公司 一种基于视频帧特征的快速手势识别方法
WO2021098441A1 (zh) * 2019-11-20 2021-05-27 Oppo广东移动通信有限公司 手部姿态估计方法、装置、设备以及计算机存储介质
CN113204995A (zh) * 2021-03-31 2021-08-03 广州朗国电子科技有限公司 行为密码智慧门锁的识别方法、设备以及介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050089225A1 (en) * 2003-01-29 2005-04-28 Industrial Technology Research Institute Method for aligning gesture features of image
US20080181459A1 (en) * 2007-01-25 2008-07-31 Stmicroelectronics Sa Method for automatically following hand movements in an image sequence
CN102467657A (zh) * 2010-11-16 2012-05-23 三星电子株式会社 手势识别***和方法
CN103544472A (zh) * 2013-08-30 2014-01-29 Tcl集团股份有限公司 一种基于手势图像的处理方法及处理装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050089225A1 (en) * 2003-01-29 2005-04-28 Industrial Technology Research Institute Method for aligning gesture features of image
US20080181459A1 (en) * 2007-01-25 2008-07-31 Stmicroelectronics Sa Method for automatically following hand movements in an image sequence
CN102467657A (zh) * 2010-11-16 2012-05-23 三星电子株式会社 手势识别***和方法
CN103544472A (zh) * 2013-08-30 2014-01-29 Tcl集团股份有限公司 一种基于手势图像的处理方法及处理装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
刘晓慧: "图像检索在焊工车间安全生产应用中的研究", 《中国优秀硕士学位论文全文数据库 工程科技Ⅰ辑》 *
董立峰: "基于Hu矩和支持向量机的静态手势识别及应用", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104731324B (zh) * 2015-02-13 2017-08-25 北京航空航天大学 一种基于hog+svm框架的手势内平面旋转检测模型生成方法
CN104731324A (zh) * 2015-02-13 2015-06-24 北京航空航天大学 一种基于hog+svm框架的手势内平面旋转检测模型生成方法
CN104866835A (zh) * 2015-06-01 2015-08-26 华中师范大学 一种手势识别方法
CN104992171A (zh) * 2015-08-04 2015-10-21 易视腾科技有限公司 一种基于2d视频序列的手势识别及人机交互方法和***
CN105608442B (zh) * 2016-01-14 2018-10-02 深圳市视美泰技术股份有限公司 一种静态手势识别方法和装置
CN105608442A (zh) * 2016-01-14 2016-05-25 深圳市视美泰技术股份有限公司 一种高效的静态手势识别方法和装置
CN108501954A (zh) * 2018-04-03 2018-09-07 北京瑞特森传感科技有限公司 一种手势识别方法、装置、汽车和存储介质
CN109271840A (zh) * 2018-07-25 2019-01-25 西安电子科技大学 一种视频手势分类方法
CN109145793A (zh) * 2018-08-09 2019-01-04 东软集团股份有限公司 建立手势识别模型的方法、装置、存储介质及电子设备
CN110135237A (zh) * 2019-03-24 2019-08-16 北京化工大学 一种手势识别方法
CN110197138A (zh) * 2019-05-15 2019-09-03 南京极目大数据技术有限公司 一种基于视频帧特征的快速手势识别方法
CN110197138B (zh) * 2019-05-15 2020-02-04 南京极目大数据技术有限公司 一种基于视频帧特征的快速手势识别方法
CN110147764A (zh) * 2019-05-17 2019-08-20 天津科技大学 一种基于机器学习的静态手势识别方法
WO2021098441A1 (zh) * 2019-11-20 2021-05-27 Oppo广东移动通信有限公司 手部姿态估计方法、装置、设备以及计算机存储介质
CN113204995A (zh) * 2021-03-31 2021-08-03 广州朗国电子科技有限公司 行为密码智慧门锁的识别方法、设备以及介质

Similar Documents

Publication Publication Date Title
CN104134061A (zh) 一种基于特征融合的支持向量机的数字手势识别方法
CN104517104B (zh) 一种基于监控场景下的人脸识别方法及***
Sikka et al. Exploring bag of words architectures in the facial expression domain
CN102938065B (zh) 基于大规模图像数据的人脸特征提取方法及人脸识别方法
CN104978550A (zh) 基于大规模人脸数据库的人脸识别方法及***
CN105574509B (zh) 一种基于光照的人脸识别***回放攻击检测方法及应用
Zhou et al. Histograms of categorized shapes for 3D ear detection
CN111126240B (zh) 一种三通道特征融合人脸识别方法
Hambalık Fingerprint recognition system using artificial neural network as feature extractor: design and performance evaluation
CN103336960A (zh) 一种基于流形学习的人脸识别方法
CN104751198A (zh) 图像中的目标物的识别方法及装置
Hobson et al. HEp-2 staining pattern recognition at cell and specimen levels: datasets, algorithms and results
CN104598888B (zh) 一种人脸性别的识别方法
CN110826408B (zh) 一种分区域特征提取人脸识别方法
CN102254188A (zh) 掌纹识别方法及装置
Guo et al. Robust object co-detection
WO2023103372A1 (zh) 一种人脸口罩佩戴状态下的识别方法
CN105117708A (zh) 人脸表情识别的方法和装置
CN103530648A (zh) 一种基于多帧图像的人脸识别方法
Jalilian et al. Enhanced segmentation-CNN based finger-vein recognition by joint training with automatically generated and manual labels
CN104156690A (zh) 一种基于图像空间金字塔特征包的手势识别方法
Lin et al. A study of real-time hand gesture recognition using SIFT on binary images
Hou et al. A cognitively motivated method for classification of occluded traffic signs
CN105760828A (zh) 一种基于视觉的静态手势识别方法
CN103942572A (zh) 一种基于双向压缩数据空间维度缩减的面部表情特征提取方法和装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20141105