CN104834377A - 一种基于3d手势识别的音频控制方法 - Google Patents

一种基于3d手势识别的音频控制方法 Download PDF

Info

Publication number
CN104834377A
CN104834377A CN201510222339.0A CN201510222339A CN104834377A CN 104834377 A CN104834377 A CN 104834377A CN 201510222339 A CN201510222339 A CN 201510222339A CN 104834377 A CN104834377 A CN 104834377A
Authority
CN
China
Prior art keywords
audio
axis coordinate
gesture identification
audio frequency
control method
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201510222339.0A
Other languages
English (en)
Inventor
杨天虎
杨伟茂
孙国辉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Living Network Science And Technology Ltd On Chengdu
Original Assignee
Living Network Science And Technology Ltd On Chengdu
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Living Network Science And Technology Ltd On Chengdu filed Critical Living Network Science And Technology Ltd On Chengdu
Priority to CN201510222339.0A priority Critical patent/CN104834377A/zh
Publication of CN104834377A publication Critical patent/CN104834377A/zh
Pending legal-status Critical Current

Links

Landscapes

  • User Interface Of Digital Computer (AREA)

Abstract

本发明公开了一种基于3D手势识别的音频控制方法,包括以下步骤:S1、获取手势识别区域内的电场数据;S2、在手势识别区域内建立空间3D坐标系;S3、获取手势识别区域内电场变化区域的位置坐标;S4、重复步骤S3,得到电场变化区域位置坐标的动态变化数据;S5、根据X轴坐标的动态变化数据实时调整音频的音量大小;S6、根据Y轴坐标的动态变化数据实时控制音频之间的切换;S7、根据Z轴坐标的动态变化数据实时控制音频的播放与暂停。本发明通过对3D空间中手势动作的识别,实现了对智能设备上音频的播放/暂停、音量大小调节以及音频之间的切换等操作,具有自然性、简洁性、新颖性等特点。

Description

一种基于3D手势识别的音频控制方法
技术领域
本发明属于嵌入式软件技术领域,具体涉及一种基于3D手势识别的音频控制方法的设计。
背景技术
在用户与智能设备的交互过程中,输入方式显得尤为重要,便捷的输入方式会增强用户的体验效果。现有技术中,智能设备上音频控制的输入方式普遍采用为键盘输入或触摸输入。一方面,这两种输入方式是成熟而稳定的实现方案,基本上已经被用户接受;另一方面,这两种输入方式缺乏一定的创新性,难以实现用户对智能设备的个性化定制。
最近几年,随着计算机技术的迅猛发展,研究符合人际交流习惯的新颖人机交互技术变得异常活跃,也取得了可喜的进步,这些研究包括人脸识别、面部表情识别、唇读、头部运动跟踪、凝视跟踪、手势识别以及体势识别等等。总的来说.人机交互技术已经从以计算机为中心逐步转移到以人为中心,是多媒体、多种模式的交互技术。
手势是指在人的意识支配下,人手作出的各类动作,如手指弯曲、伸展和手在空间的运动等,可以是执行某项任务,也可以是与人的交流,以表达某种含义或意图。手势是一种自然、直观、易于学习的人机交互手段,以人手直接作为计算机的输入设备,人机间的通讯将不再需要中间的媒体,用户可以简单地定义一种适当的手势来对周围的机器进行控制。以人手直接作为输入手段与其它输入方式相比较,具有自然性、简洁性、丰富性和直接性的特点。
发明内容
本发明的目的是为了解决现有技术中智能设备上音频控制的输入方式缺乏一定的创新性,难以实现用户对智能设备的个性化定制的问题,提出了一种基于3D手势识别的音频控制方法。
本发明的技术方案为:一种基于3D手势识别的音频控制方法,包括以下步骤:
S1、获取手势识别区域内的电场数据;
S2、在手势识别区域内建立空间3D坐标系;
S3、获取手势识别区域内电场变化区域的位置坐标;
S4、重复步骤S3,得到电场变化区域位置坐标的动态变化数据;
S5、根据X轴坐标的动态变化数据实时调整音频的音量大小;
S6、根据Y轴坐标的动态变化数据实时控制音频之间的切换;
S7、根据Z轴坐标的动态变化数据实时控制音频的播放与暂停。
进一步地,步骤S2具体包括以下分步骤:
S21、在手势识别区域内选定一点作为坐标原点;
S22、确定X轴、Y轴与Z轴的正方向,建立空间3D坐标系。
进一步地,步骤S5具体包括以下分步骤:
S51、设定X轴坐标数据的变化量与音量大小变化量的对应关系;
S52、设定X轴坐标数据的采集时间间隔ΔTx
S53、根据公式(1)计算每一采集时间间隔ΔTx内X轴坐标数据的变化量:
ΔXn=Xn-Xn-1(n=1,2,3…)                   (1);
S54、根据步骤S51中设定的对应关系对音频的音量大小进行实时调整。
进一步地,步骤S6具体包括以下分步骤:
S61、设定Y轴坐标数据的采集时间间隔ΔTy
S62、根据公式(2)计算每一采集时间间隔ΔTy内Y轴坐标数据的变化量:
ΔYn=Yn-Yn-1(n=1,2,3…)                     (2);
S63、设定音频切换触发阈值Ymax与Ymin
S64、将Y轴坐标数据的变化量ΔYn分别与Ymax及Ymin进行比较,
若ΔYn>=Ymax,则切换至音频播放列表中的下一个音频;
若ΔYn<=Ymin,则切换至音频播放列表中的上一个音频;
若Ymin<ΔYn<Ymax,则继续播放当前音频。
进一步地,Ymax值为正,Ymin值为负。
进一步地,步骤S7具体包括以下分步骤:
S71、定义单击触发阈值Zm
S72、定义单击触发条件:当Z轴坐标数据首先减少,并且减少量超过单击触发阈值Zm,随后Z轴坐标数据再增加,并且增加量超过单击触发阈值Zm,则定义为触发一次单击,记单击次数Nz=1;
S73、设定单击次数判定时间间隔ΔTz
S74、根据单击次数判定时间间隔ΔTz内的单击次数Nz实时控制音频的播放与暂停:
若Nz=1,则播放音频;
若Nz=2,则暂停音频;
若Nz≠1且Nz≠2,则保持音频当前状态。
本发明的有益效果是:本发明通过对3D空间中手势动作的识别,实现了对智能设备上音频的播放/暂停、音量大小调节以及音频之间的切换等操作,能够实现产品的个性化定制功能,具有自然性、简洁性、新颖性等特点。
附图说明
图1为本发明提供的一种基于3D手势识别的音频控制方法流程图。
图2为本发明步骤S2的分步骤流程图。
图3为本发明步骤S5的分步骤流程图。
图4为本发明步骤S6的分步骤流程图。
图5为本发明步骤S7的分步骤流程图。
具体实施方式
下面结合附图对本发明的实施例作进一步的说明。
本发明提供了一种基于3D手势识别的音频控制方法,如图1所示,包括以下步骤:
S1、获取手势识别区域内的电场数据;
这里采用电场强度传感器对手势识别区域进行测量,获取手势识别区域内的初始电场数据,其目的在于:
(1)为随后在手势识别区域内建立空间3D坐标系提供参考;
(2)便于随后获取电场信号的动态变化数据。
S2、在手势识别区域内建立空间3D坐标系;
如图2所示,该步骤具体包括以下分步骤:
S21、在手势识别区域内选定一点作为坐标原点;
本发明中,对坐标原点位置的选定并无明确限制,通常坐标原点会选在靠近手势识别区域中心的位置。
S22、确定X轴、Y轴与Z轴的正方向,建立空间3D坐标系。
本发明实施例中,将电场强度传感器的背对方向作为Y轴的正方向建立Y轴;将电场强度传感器正对方向的右方作为X轴的正方向,垂直于Y轴建立X轴;将电场强度传感器正对方向的上方作为Z轴的正方向,垂直于X轴和Y轴所在平面建立Z轴,以此建立空间3D坐标系。
S3、获取手势识别区域内电场变化区域的位置坐标;
S4、重复步骤S3,得到电场变化区域位置坐标的动态变化数据;
由于用户手势的变化会切割手势识别区域内的电场线,从而造成电场信号数据的变化,因此电场变化区域的位置坐标即可反应用户手势的位置,而用户手势变化的物理动作便可以由电场变化区域位置坐标的动态变化数据来表征。
S5、根据X轴坐标的动态变化数据实时调整音频的音量大小;
如图3所示,该步骤具体包括以下分步骤:
S51、设定X轴坐标数据的变化量与音量大小变化量的对应关系;
本发明实施例中,X轴坐标数据的变化量与音量大小变化量的对应关系设定为:X轴坐标数据每增加1cm,音量大小增大1dB;X轴坐标数据每减少1cm,音量大小减小1dB。
S52、设定X轴坐标数据的采集时间间隔ΔTx
本发明实施例中,X轴坐标数据的采集时间间隔ΔTx=0.1s。
S53、根据公式(1)计算每一采集时间间隔ΔTx内X轴坐标数据的变化量:
ΔXn=Xn-Xn-1(n=1,2,3…)                (1);
S54、根据步骤S51中设定的对应关系对音频的音量大小进行实时调整。
例如,若ΔX1=5cm,则音频的音量大小增大5dB;
若ΔX2=-7cm,则音频的音量大小减小7dB。
S6、根据Y轴坐标的动态变化数据实时控制音频之间的切换;
如图4所示,该步骤具体包括以下分步骤:
S61、设定Y轴坐标数据的采集时间间隔ΔTy
本发明实施例中,Y轴坐标数据的采集时间间隔ΔTy=0.5s。
S62、根据公式(2)计算每一采集时间间隔ΔTy内Y轴坐标数据的变化量:
ΔYn=Yn-Yn-1(n=1,2,3…)               (2);
S63、设定音频切换触发阈值Ymax与Ymin
其中,Ymax值为正,Ymin值为负。
本发明实施例中,音频切换触发阈值Ymax=20cm,Ymin=-20cm。
S64、将Y轴坐标数据的变化量ΔYn分别与Ymax及Ymin进行比较,
若ΔYn>=Ymax,则切换至音频播放列表中的下一个音频;
若ΔYn<=Ymin,则切换至音频播放列表中的上一个音频;
若Ymin<ΔYn<Ymax,则继续播放当前音频。
例如,若ΔY1=18cm,则继续播放当前音频;
若ΔY2=22cm,则切换至音频播放列表中的下一个音频进行播放;
若ΔY3=-25cm,则切换至音频播放列表中的上一个音频进行播放。
S7、根据Z轴坐标的动态变化数据实时控制音频的播放与暂停。
如图5所示,该步骤具体包括以下分步骤:
S71、定义单击触发阈值Zm
本发明实施例中,单击触发阈值Zm=10cm。
S72、定义单击触发条件:当Z轴坐标数据首先减少,并且减少量超过单击触发阈值Zm,随后Z轴坐标数据再增加,并且增加量超过单击触发阈值Zm,则定义为触发一次单击,记单击次数Nz=1;
S73、设定单击次数判定时间间隔ΔTz
本发明实施例中,单击次数判定时间间隔ΔTz=1s。
S74、根据单击次数判定时间间隔ΔTz内的单击次数Nz实时控制音频的播放与暂停:
若Nz=1,则播放音频;
若Nz=2,则暂停音频;
若Nz≠1且Nz≠2,即当单击次数为1或2外的其它值时,则保持音频当前状态。
保持音频当前状态指:若音频当前正处于播放状态,则保持播放状态;若音频当前正处于暂停状态,则保持暂停状态。
本领域的普通技术人员将会意识到,这里所述的实施例是为了帮助读者理解本发明的原理,应被理解为本发明的保护范围并不局限于这样的特别陈述和实施例。本领域的普通技术人员可以根据本发明公开的这些技术启示做出各种不脱离本发明实质的其它各种具体变形和组合,这些变形和组合仍然在本发明的保护范围内。

Claims (6)

1.一种基于3D手势识别的音频控制方法,其特征在于,包括以下步骤:
S1、获取手势识别区域内的电场数据;
S2、在手势识别区域内建立空间3D坐标系;
S3、获取手势识别区域内电场变化区域的位置坐标;
S4、重复步骤S3,得到电场变化区域位置坐标的动态变化数据;
S5、根据X轴坐标的动态变化数据实时调整音频的音量大小;
S6、根据Y轴坐标的动态变化数据实时控制音频之间的切换;
S7、根据Z轴坐标的动态变化数据实时控制音频的播放与暂停。
2.根据权利要求1所述的基于3D手势识别的音频控制方法,其特征在于,所述步骤S2具体包括以下分步骤:
S21、在手势识别区域内选定一点作为坐标原点;
S22、确定X轴、Y轴与Z轴的正方向,建立空间3D坐标系。
3.根据权利要求1所述的基于3D手势识别的音频控制方法,其特征在于,所述步骤S5具体包括以下分步骤:
S51、设定X轴坐标数据的变化量与音量大小变化量的对应关系;
S52、设定X轴坐标数据的采集时间间隔ΔTx
S53、根据公式(1)计算每一采集时间间隔ΔTx内X轴坐标数据的变化量:
ΔXn=Xn-Xn-1(n=1,2,3…)        (1);
S54、根据步骤S51中设定的对应关系对音频的音量大小进行实时调整。
4.根据权利要求1所述的基于3D手势识别的音频控制方法,其特征在于,所述步骤S6具体包括以下分步骤:
S61、设定Y轴坐标数据的采集时间间隔ΔTy
S62、根据公式(2)计算每一采集时间间隔ΔTy内Y轴坐标数据的变化量:
ΔYn=Yn-Yn-1(n=1,2,3…)       (2);
S63、设定音频切换触发阈值Ymax与Ymin
S64、将Y轴坐标数据的变化量ΔYn分别与Ymax及Ymin进行比较,
若ΔYn>=Ymax,则切换至音频播放列表中的下一个音频;
若ΔYn<=Ymin,则切换至音频播放列表中的上一个音频;
若Ymin<ΔYn<Ymax,则继续播放当前音频。
5.根据权利要求4所述的基于3D手势识别的音频控制方法,其特征在于,所述Ymax值为正,所述Ymin值为负。
6.根据权利要求1所述的基于3D手势识别的音频控制方法,其特征在于,所述步骤S7具体包括以下分步骤:
S71、设定单击触发阈值Zm
S72、定义单击触发条件:当Z轴坐标数据首先减少,并且减少量超过单击触发阈值Zm,随后Z轴坐标数据再增加,并且增加量超过单击触发阈值Zm,则定义为触发一次单击,记单击次数Nz=1;
S73、设定单击次数判定时间间隔ΔTz
S74、根据单击次数判定时间间隔ΔTz内的单击次数Nz实时控制音频的播放与暂停:
若Nz=1,则播放音频;
若Nz=2,则暂停音频;
若Nz≠1且Nz≠2,则保持音频当前状态。
CN201510222339.0A 2015-05-05 2015-05-05 一种基于3d手势识别的音频控制方法 Pending CN104834377A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510222339.0A CN104834377A (zh) 2015-05-05 2015-05-05 一种基于3d手势识别的音频控制方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510222339.0A CN104834377A (zh) 2015-05-05 2015-05-05 一种基于3d手势识别的音频控制方法

Publications (1)

Publication Number Publication Date
CN104834377A true CN104834377A (zh) 2015-08-12

Family

ID=53812314

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510222339.0A Pending CN104834377A (zh) 2015-05-05 2015-05-05 一种基于3d手势识别的音频控制方法

Country Status (1)

Country Link
CN (1) CN104834377A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105912118A (zh) * 2016-04-12 2016-08-31 童雷 一种基于自然用户界面的环绕声声像控制方法及装置
CN108920076A (zh) * 2018-06-27 2018-11-30 清远墨墨教育科技有限公司 一种用户手势操作识别方法及识别***

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102314269A (zh) * 2010-07-02 2012-01-11 谊达光电科技股份有限公司 触控面板近接侦测装置与方法
CN102870078A (zh) * 2010-02-10 2013-01-09 微晶片科技德国第二公司 用于对三维移动空间中的手势进行非接触式检测与辨识的***及方法
CN103257714A (zh) * 2013-05-31 2013-08-21 深圳职业技术学院 一种支持手势识别的一体机
CN103440049A (zh) * 2013-08-28 2013-12-11 深圳超多维光电子有限公司 一种输入装置及输入方法
CN104123095A (zh) * 2014-07-24 2014-10-29 广东欧珀移动通信有限公司 一种基于矢量运算的悬浮触控方法及装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102870078A (zh) * 2010-02-10 2013-01-09 微晶片科技德国第二公司 用于对三维移动空间中的手势进行非接触式检测与辨识的***及方法
CN102314269A (zh) * 2010-07-02 2012-01-11 谊达光电科技股份有限公司 触控面板近接侦测装置与方法
CN103257714A (zh) * 2013-05-31 2013-08-21 深圳职业技术学院 一种支持手势识别的一体机
CN103440049A (zh) * 2013-08-28 2013-12-11 深圳超多维光电子有限公司 一种输入装置及输入方法
CN104123095A (zh) * 2014-07-24 2014-10-29 广东欧珀移动通信有限公司 一种基于矢量运算的悬浮触控方法及装置

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105912118A (zh) * 2016-04-12 2016-08-31 童雷 一种基于自然用户界面的环绕声声像控制方法及装置
CN108920076A (zh) * 2018-06-27 2018-11-30 清远墨墨教育科技有限公司 一种用户手势操作识别方法及识别***
CN108920076B (zh) * 2018-06-27 2021-03-02 清远墨墨教育科技有限公司 一种用户手势操作识别方法及识别***

Similar Documents

Publication Publication Date Title
CN104410883B (zh) 一种移动可穿戴非接触式交互***与方法
CN103353935B (zh) 一种用于智能家居***的3d动态手势识别方法
CN107632699B (zh) 基于多感知数据融合的人机自然交互***
CN103970264B (zh) 手势辨识与控制方法及其装置
CN102769802A (zh) 一种智能电视机的人机交互***及其交互方法
CN102789313A (zh) 一种用户交互***和方法
US20190324539A1 (en) Systems and methods for providing dynamic haptic playback for an augmented or virtual reality environments
WO2007053116A1 (en) Virtual interface system
WO2021129848A1 (zh) 一种声音播放的控制方法及装置
CN108509049A (zh) 录入手势功能的方法及***
CN102662464A (zh) 一种手势漫游控制***的手势控制方法
CN104834377A (zh) 一种基于3d手势识别的音频控制方法
WO2018028360A1 (zh) 用于智能机器人的控制方法和装置及机器人
CN108376030B (zh) 一种电子设备的控制方法、装置和电子设备
CN104898880A (zh) 一种控制方法及电子设备
US10444831B2 (en) User-input apparatus, method and program for user-input
CN113791411B (zh) 一种基于轨迹判断的毫米波雷达手势识别方法及装置
Hanagata et al. Paralogue: A remote conversation system using a hand avatar which postures are controlled with electrical muscle stimulation
CN114613362A (zh) 设备控制方法和装置、电子设备和介质
CN106293485B (zh) 一种基于触摸轨迹的终端控制方法及装置
KR102216358B1 (ko) 제스쳐를 이용하는 단말 제어 방법
CN116225256A (zh) 一种基于触摸屏的电路板移动控制方法及***
CN104391624B (zh) 一种操作输入方法及电子设备
CN103218124B (zh) 基于深度摄像头的菜单控制方法及***
CN104035560A (zh) 一种基于摄像头的人机实时交互方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
EXSB Decision made by sipo to initiate substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20150812