CN104134061A - 一种基于特征融合的支持向量机的数字手势识别方法 - Google Patents
一种基于特征融合的支持向量机的数字手势识别方法 Download PDFInfo
- Publication number
- CN104134061A CN104134061A CN201410401025.2A CN201410401025A CN104134061A CN 104134061 A CN104134061 A CN 104134061A CN 201410401025 A CN201410401025 A CN 201410401025A CN 104134061 A CN104134061 A CN 104134061A
- Authority
- CN
- China
- Prior art keywords
- gesture
- feature
- carried out
- digital
- support vector
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Image Analysis (AREA)
Abstract
本发明涉及一种基于特征融合的支持向量机的数字手势识别方法,USB摄像头采集数字手势图片,用于分类器的训练与手势识别;对采集到的数字手势图片进行预处理;对处理后的数字手势图片提取特征;对提取到的特征向量矩阵进行降维处理;将进行降维处理后的特征向量输入到多分类的分类器中进行训练和识别,观察测试结果,并对结果做出分析。此方法基于Hu矩全局特征与HOG局部特征相融合进而得到一种更易训练识别的特征向量,而后对提取到的向量进行了LDA降维处理,易于操作,简便,并且更有效的提高了数字手势识别的识别率。
Description
技术领域
本发明涉及一种手势识别技术,特别涉及一种基于特征融合的支持向量机的数字手势识别方法。
背景技术
人机交互技术已经从以计算机为中心转移到以人为中心,手势识别交互作为一种自然、人性化的人机交互方式被越来越多的采用。然而,人手的自由度和弹性、背景、光照以及噪声等因等给手势识别带来了极大的困难,如何克服这些困难以获得更加自然、和谐、完善的手势识别***使人们当今研究的目标。
基于计算机视觉的手势识别主要由手势分割、手势特征提取、手势识别等阶段组成。手势识别主要有两大问题需要解决:首先是手势特征的选取,比较常用的特征有Hu矩、Zernike矩,HOG特征,傅里叶描述子等,其中,Zernike对于噪声不太敏感,一般应用于图像的恢复方面;傅里叶描述子虽然具有较好的轮廓描述能力,但是对于细节太敏感,容易导致误识;而Hu矩具有平移、旋转和比例不变性,而HOG特征对图像几何的和光学的形变都能保持良好的不变性;其次是分类器的选择,基于计算机视觉的手势识别算法研究一般有模板匹配法,神经网络法,支持向量机法等。支持向量机是基于结构风险最小化的一种新的模式方法,在解决小本、非线性及高维模式识别问题中具有许多特有的优势。
发明内容
本发明是针对手势识别因为背景环境的多变性识别困难的问题,提出了一种基于特征融合的支持向量机的数字手势识别方法,提高手势识别***的实用性,同时提高数字手势识别的识别率。本发明在对手势全局(即手势轮廓)进行Hu矩特征提取以及提取手势的HOG特征的基础上,并对特征进行LDA降维以后,设计了SVM分类器,用以提高数字手势识别的识别率。
本发明的技术方案为:一种基于特征融合的支持向量机的数字手势识别方法,具体包括如下步骤:
1)USB摄像头采集数字手势图片,用于分类器的训练与手势识别;
2)对采集到的数字手势图片进行预处理;
将采集到的数字手势图片转换到灰度空间以获取对应的灰度图像;利用中值滤波对图像进行降噪处理;对图像进行锐化处理,突出图像的边缘轮廓与细节特征;
3)对处理后的数字手势图片提取特征;
对步骤2)处理后的数字手势图片中图片手势全局进行Hu矩特征提取,然后对步骤2)处理后的数字手势图片中提取基于HOG的局部特征,最后将提取的Hu矩特征与提取的HOG特征相融合;
4)对提取到的特征向量矩阵进行降维处理:
5)将步骤4)进行降维处理后的特征向量输入到多分类的分类器中进行训练和识别,观察测试结果,并对结果做出分析。
所述步骤3)中手势全局进行Hu矩特征提取,通过各种不同级别的几何矩的数学组合,可以得到七个特征量,当图像移动,旋转和比例大小变化时,特征量保持其数值不变的特性。
所述步骤5)中分类器为SVM分类器,选择径向基核函数的支持向量机,将降维后的用于训练的特征向量矩阵输入到SVM分类器中,对SVM分类器进行训练,训练完成后,将用于测试的特征向量矩阵输入到SVM分类器中,观察测试结果,并对结果做出分析。
本发明的有益效果在于:本发明基于特征融合的支持向量机的数字手势识别方法,基于Hu矩全局特征与HOG局部特征相融合进而得到一种更易训练识别的特征向量,而后对提取到的向量进行了LDA降维处理,易于操作,简便,并且更有效的提高了数字手势识别的识别率。
附图说明
图1为本发明总体流程图;
图2为本发明数字手势识别程序流程图。
具体实施方式
本发明的具体实施方法如图1所示,包括如下具体步骤:
1、USB摄像头采集数字手势图片,用于分类器的训练与手势识别;
此处运用的USB摄像头属于VFW视频采集设备,运用此摄像头对数字手势进行一定数量的图像采集。
2、对采集到的数字手势图片进行预处理;
将采集到的数字手势图片转换到灰度空间以获取对应的灰度图像;利用中值滤波对图像进行降噪处理;对图像进行锐化处理,突出手势图像的边缘轮廓与细节特征。
3、对处理后的数字手势图片提取特征;
首先,对处理后的数字手势图片提取特征主要提取的是基于Hu矩的手势全局特征,根据Hu氏理论,通过各种不同级别的几何矩的数学组合,可以得到七个特征量,当图像移动,旋转和比例大小变化时,他们具有保持其数值不变的特性;
对于是在图像f(i,j),其(p+q)阶中心距为
,
其中p指对应于i维度上矩的阶数,q对应于j维度上矩的阶数,R为实数;
归一化的中心矩为,其中,μ 00 理论对应于图像的0阶中心距,实际意义为对应于轮廓边界上点的数目,
将其组成一个七维的特征向量;
然后在处理后的数字手势图片中提取HOG特征,具体步骤为:
(1)采用Gamma校正法对输入图像进行颜色空间的标准化(归一化)目的是调节图像的对比度,降低图像局部的阴影和光照变化所造成的影响,同时可以抑制噪音的干扰;
(2)计算梯度;主要是为了捕获轮廓信息,同时进一步弱化光照的干扰;
(3)将梯度投影到单元的梯度方向;目的是为局部图像区域提供一个编码;
(4)将所有单元格在块上进行归一化;归一化能够更进一步对光照、阴影和边缘进行压缩,通常,每个单元格由多个不同的块共享,但它的归一化是基于不同块的,所以计算结果也不一样。因此,一个单元格的特征会以不同的结果多次出现在最后的向量中。我们将归一化之后的块描述符就称之为HOG描述符;
(5)收集得到检测空间所有块的HOG特征;该步骤就是将检测窗口中所有重叠的块进行HOG特征的收集,并将它们结合成最终的特征向量供分类使用。
经过上述HOG的提取,得到的是一个1764维的特征向量,而后将这个特征向量与提取的Hu矩特征相融合得到一个1771维的特征向量。
4、对提取到的特征向量矩阵进行降维处理:
由于得到的是一个1771维的特征向量,维数较高,不利于后面的分类器的训练和识别,故此处采用LDA(线性判别分析)对得到的特征向量矩阵进行降维处理,降维以后,得到的是一个7维的特征向量矩阵。
5、将提取到的特征向量输入到多分类的分类器中进行训练和识别,如图2所示数字手势识别程序流程图:
步骤4经过LDA降维处理的特征向量矩阵送入分类器,分类器为SVM分类器,在此选择径向基核函数的支持向量机,将降维后的用于训练的特征向量矩阵输入到SVM分类器中,对SVM分类器进行训练,训练完成后,将用于测试的特征向量矩阵输入到SVM分类器中,观察测试结果,并对结果做出相应的分析。
本次数字手势识别需要识别数字1,2,3,4,5,6,7,8,每个数字手势均提有30个训练样本,以及10个测试样本,首先将每个数字的训练样本共240个的7维特征向量组成一个向量矩阵输入到SVM分类器中对SVM进行训练,然后将每个数字的测试样本共80个的7维特征向量组成一个向量矩阵矩阵输入到SVM分类器中进行测试,观察测试结果,并对测试结果做出相应的分析。
Claims (3)
1.一种基于特征融合的支持向量机的数字手势识别方法,其特征在于,具体包括如下步骤:
1)USB摄像头采集数字手势图片,用于分类器的训练与手势识别;
2)对采集到的数字手势图片进行预处理;
将采集到的数字手势图片转换到灰度空间以获取对应的灰度图像;利用中值滤波对图像进行降噪处理;对图像进行锐化处理,突出图像的边缘轮廓与细节特征;
3)对处理后的数字手势图片提取特征;
对步骤2)处理后的数字手势图片中手势全局进行Hu矩特征提取,然后对步骤2)处理后的数字手势图片中提取基于HOG的局部特征,最后将提取的Hu矩特征与提取的HOG特征相融合;
4)对提取到的特征向量矩阵进行降维处理:
5)将步骤4)进行降维处理后的特征向量输入到多分类的分类器中进行训练和识别,观察测试结果,并对结果做出分析。
2.根据权利要求1所述基于特征融合的支持向量机的数字手势识别方法,其特征在于,所述步骤3)中手势全局进行Hu矩特征提取,通过各种不同级别的几何矩的数学组合,可以得到七个特征量,当图像移动,旋转和比例大小变化时,特征量保持其数值不变的特性。
3.根据权利要求1所述基于特征融合的支持向量机的数字手势识别方法,其特征在于,所述步骤5)中分类器为SVM分类器,选择径向基核函数的支持向量机,将降维后的用于训练的特征向量矩阵输入到SVM分类器中,对SVM分类器进行训练,训练完成后,将用于测试的特征向量矩阵输入到SVM分类器中,观察测试结果,并对结果做出分析。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410401025.2A CN104134061A (zh) | 2014-08-15 | 2014-08-15 | 一种基于特征融合的支持向量机的数字手势识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410401025.2A CN104134061A (zh) | 2014-08-15 | 2014-08-15 | 一种基于特征融合的支持向量机的数字手势识别方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN104134061A true CN104134061A (zh) | 2014-11-05 |
Family
ID=51806735
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201410401025.2A Pending CN104134061A (zh) | 2014-08-15 | 2014-08-15 | 一种基于特征融合的支持向量机的数字手势识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN104134061A (zh) |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104731324A (zh) * | 2015-02-13 | 2015-06-24 | 北京航空航天大学 | 一种基于hog+svm框架的手势内平面旋转检测模型生成方法 |
CN104866835A (zh) * | 2015-06-01 | 2015-08-26 | 华中师范大学 | 一种手势识别方法 |
CN104992171A (zh) * | 2015-08-04 | 2015-10-21 | 易视腾科技有限公司 | 一种基于2d视频序列的手势识别及人机交互方法和*** |
CN105608442A (zh) * | 2016-01-14 | 2016-05-25 | 深圳市视美泰技术股份有限公司 | 一种高效的静态手势识别方法和装置 |
CN108501954A (zh) * | 2018-04-03 | 2018-09-07 | 北京瑞特森传感科技有限公司 | 一种手势识别方法、装置、汽车和存储介质 |
CN109145793A (zh) * | 2018-08-09 | 2019-01-04 | 东软集团股份有限公司 | 建立手势识别模型的方法、装置、存储介质及电子设备 |
CN109271840A (zh) * | 2018-07-25 | 2019-01-25 | 西安电子科技大学 | 一种视频手势分类方法 |
CN110135237A (zh) * | 2019-03-24 | 2019-08-16 | 北京化工大学 | 一种手势识别方法 |
CN110147764A (zh) * | 2019-05-17 | 2019-08-20 | 天津科技大学 | 一种基于机器学习的静态手势识别方法 |
CN110197138A (zh) * | 2019-05-15 | 2019-09-03 | 南京极目大数据技术有限公司 | 一种基于视频帧特征的快速手势识别方法 |
WO2021098441A1 (zh) * | 2019-11-20 | 2021-05-27 | Oppo广东移动通信有限公司 | 手部姿态估计方法、装置、设备以及计算机存储介质 |
CN113204995A (zh) * | 2021-03-31 | 2021-08-03 | 广州朗国电子科技有限公司 | 行为密码智慧门锁的识别方法、设备以及介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20050089225A1 (en) * | 2003-01-29 | 2005-04-28 | Industrial Technology Research Institute | Method for aligning gesture features of image |
US20080181459A1 (en) * | 2007-01-25 | 2008-07-31 | Stmicroelectronics Sa | Method for automatically following hand movements in an image sequence |
CN102467657A (zh) * | 2010-11-16 | 2012-05-23 | 三星电子株式会社 | 手势识别***和方法 |
CN103544472A (zh) * | 2013-08-30 | 2014-01-29 | Tcl集团股份有限公司 | 一种基于手势图像的处理方法及处理装置 |
-
2014
- 2014-08-15 CN CN201410401025.2A patent/CN104134061A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20050089225A1 (en) * | 2003-01-29 | 2005-04-28 | Industrial Technology Research Institute | Method for aligning gesture features of image |
US20080181459A1 (en) * | 2007-01-25 | 2008-07-31 | Stmicroelectronics Sa | Method for automatically following hand movements in an image sequence |
CN102467657A (zh) * | 2010-11-16 | 2012-05-23 | 三星电子株式会社 | 手势识别***和方法 |
CN103544472A (zh) * | 2013-08-30 | 2014-01-29 | Tcl集团股份有限公司 | 一种基于手势图像的处理方法及处理装置 |
Non-Patent Citations (2)
Title |
---|
刘晓慧: "图像检索在焊工车间安全生产应用中的研究", 《中国优秀硕士学位论文全文数据库 工程科技Ⅰ辑》 * |
董立峰: "基于Hu矩和支持向量机的静态手势识别及应用", 《中国优秀硕士学位论文全文数据库 信息科技辑》 * |
Cited By (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104731324B (zh) * | 2015-02-13 | 2017-08-25 | 北京航空航天大学 | 一种基于hog+svm框架的手势内平面旋转检测模型生成方法 |
CN104731324A (zh) * | 2015-02-13 | 2015-06-24 | 北京航空航天大学 | 一种基于hog+svm框架的手势内平面旋转检测模型生成方法 |
CN104866835A (zh) * | 2015-06-01 | 2015-08-26 | 华中师范大学 | 一种手势识别方法 |
CN104992171A (zh) * | 2015-08-04 | 2015-10-21 | 易视腾科技有限公司 | 一种基于2d视频序列的手势识别及人机交互方法和*** |
CN105608442B (zh) * | 2016-01-14 | 2018-10-02 | 深圳市视美泰技术股份有限公司 | 一种静态手势识别方法和装置 |
CN105608442A (zh) * | 2016-01-14 | 2016-05-25 | 深圳市视美泰技术股份有限公司 | 一种高效的静态手势识别方法和装置 |
CN108501954A (zh) * | 2018-04-03 | 2018-09-07 | 北京瑞特森传感科技有限公司 | 一种手势识别方法、装置、汽车和存储介质 |
CN109271840A (zh) * | 2018-07-25 | 2019-01-25 | 西安电子科技大学 | 一种视频手势分类方法 |
CN109145793A (zh) * | 2018-08-09 | 2019-01-04 | 东软集团股份有限公司 | 建立手势识别模型的方法、装置、存储介质及电子设备 |
CN110135237A (zh) * | 2019-03-24 | 2019-08-16 | 北京化工大学 | 一种手势识别方法 |
CN110197138A (zh) * | 2019-05-15 | 2019-09-03 | 南京极目大数据技术有限公司 | 一种基于视频帧特征的快速手势识别方法 |
CN110197138B (zh) * | 2019-05-15 | 2020-02-04 | 南京极目大数据技术有限公司 | 一种基于视频帧特征的快速手势识别方法 |
CN110147764A (zh) * | 2019-05-17 | 2019-08-20 | 天津科技大学 | 一种基于机器学习的静态手势识别方法 |
WO2021098441A1 (zh) * | 2019-11-20 | 2021-05-27 | Oppo广东移动通信有限公司 | 手部姿态估计方法、装置、设备以及计算机存储介质 |
CN113204995A (zh) * | 2021-03-31 | 2021-08-03 | 广州朗国电子科技有限公司 | 行为密码智慧门锁的识别方法、设备以及介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104134061A (zh) | 一种基于特征融合的支持向量机的数字手势识别方法 | |
CN104517104B (zh) | 一种基于监控场景下的人脸识别方法及*** | |
Sikka et al. | Exploring bag of words architectures in the facial expression domain | |
CN102938065B (zh) | 基于大规模图像数据的人脸特征提取方法及人脸识别方法 | |
CN104978550A (zh) | 基于大规模人脸数据库的人脸识别方法及*** | |
CN105574509B (zh) | 一种基于光照的人脸识别***回放攻击检测方法及应用 | |
Zhou et al. | Histograms of categorized shapes for 3D ear detection | |
CN111126240B (zh) | 一种三通道特征融合人脸识别方法 | |
Hambalık | Fingerprint recognition system using artificial neural network as feature extractor: design and performance evaluation | |
CN103336960A (zh) | 一种基于流形学习的人脸识别方法 | |
CN104751198A (zh) | 图像中的目标物的识别方法及装置 | |
Hobson et al. | HEp-2 staining pattern recognition at cell and specimen levels: datasets, algorithms and results | |
CN104598888B (zh) | 一种人脸性别的识别方法 | |
CN110826408B (zh) | 一种分区域特征提取人脸识别方法 | |
CN102254188A (zh) | 掌纹识别方法及装置 | |
Guo et al. | Robust object co-detection | |
WO2023103372A1 (zh) | 一种人脸口罩佩戴状态下的识别方法 | |
CN105117708A (zh) | 人脸表情识别的方法和装置 | |
CN103530648A (zh) | 一种基于多帧图像的人脸识别方法 | |
Jalilian et al. | Enhanced segmentation-CNN based finger-vein recognition by joint training with automatically generated and manual labels | |
CN104156690A (zh) | 一种基于图像空间金字塔特征包的手势识别方法 | |
Lin et al. | A study of real-time hand gesture recognition using SIFT on binary images | |
Hou et al. | A cognitively motivated method for classification of occluded traffic signs | |
CN105760828A (zh) | 一种基于视觉的静态手势识别方法 | |
CN103942572A (zh) | 一种基于双向压缩数据空间维度缩减的面部表情特征提取方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20141105 |