CN203164866U - 基于体感的人机交互设备 - Google Patents

基于体感的人机交互设备 Download PDF

Info

Publication number
CN203164866U
CN203164866U CN 201320026829 CN201320026829U CN203164866U CN 203164866 U CN203164866 U CN 203164866U CN 201320026829 CN201320026829 CN 201320026829 CN 201320026829 U CN201320026829 U CN 201320026829U CN 203164866 U CN203164866 U CN 203164866U
Authority
CN
China
Prior art keywords
human
computer interaction
body sense
central processing
voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN 201320026829
Other languages
English (en)
Inventor
余大勇
赵明
高郇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Goss Taco (beijing) Technology Co Ltd
Original Assignee
Goss Taco (beijing) Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Goss Taco (beijing) Technology Co Ltd filed Critical Goss Taco (beijing) Technology Co Ltd
Priority to CN 201320026829 priority Critical patent/CN203164866U/zh
Application granted granted Critical
Publication of CN203164866U publication Critical patent/CN203164866U/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • User Interface Of Digital Computer (AREA)

Abstract

本实用新型公开了一种基于体感的人机交互设备。该设备包括获取单元,用于获取用户动作和声音信息;中央处理器,与获取单元相连接,用于识别获取到的动作和声音信息;传输单元,与中央处理器相连接,用于将识别结果输出至被控设备,以使被控设备根据识别结果执行相应的命令。通过本实用新型,能够直接向普通被控设备输出用户动作和声音的识别结果,无需普通设备进行动作声音识别,因而能够将体感控制应用到普通设备中,用户体验好。

Description

基于体感的人机交互设备
技术领域
本实用新型涉及人机交互领域,具体而言,涉及一种基于体感的人机交互设备。
背景技术
现有传统的计算机或计算设备的输入设备中,最常用的是鼠标,键盘,触摸屏,简单遥控器等。这些输入设备具有输入简单,快捷,准确的优点,但缺点也是不够直观,人需要用手直接对输入设备进行操作才能完成信息输入。在另外一些人机交互的情况下,用户希望不接触设备也能完成设备操作,比较典型的情况如:体感游戏时希望摆脱设备束缚;公共场合信息查询时不希望触摸设备,而是希望通过语言、动作直接获取信息,更加自然,还可以避免传染性疾病;网上社区交流,通过复制人的动作,语音使得交流更加真实有效;使用机器人模仿人体动作,对机器人进行控制等等。
目前,大部分人机交互设备不具备人机交互自然的特点,无法完成人体动作、声音的捕捉和识别,为了解决该问题,微软推出了体感输入设备kinect,但是,该设备的模式识别需要在xbox或计算机上完成,对主设备处理速度要求高,使用环境受限,无法推广到普通被控设备。
针对相关技术中体感输入设备无法推广到普通被控设备的问题,目前尚未提出有效的解决方案。
实用新型内容
本实用新型的主要目的在于提供一种基于体感的人机交互设备,以解决体感输入设备无法推广到普通被控设备的问题。
为了实现上述目的,根据本实用新型的一个方面,提供了一种基于体感的人机交互设备。
根据本实用新型的基于体感的人机交互设备包括:获取单元,用于获取用户动作和声音信息;中央处理器,与获取单元相连接,用于识别获取到的动作和声音信息;传输单元,与中央处理器相连接,用于将识别结果输出至被控设备,以使被控设备根据识别结果执行相应的命令。
进一步地,获取单元包括:动作获取单元,用于获取用户动作的图像;以及语音获取单元,用于获取用户的语音信息。
进一步地,动作获取单元包括:结构光投射器,用于将结构光投射至用户所在的空间;图像采集器,用于采集结构光投射的空间内的图像;以及可编程门阵列,用于计算并输出采集到的图像的深度图。
进一步地,图像采集器为单色图像传感器;结构光投射器为单波长结构光投射器;以及单色图像传感器具有与单波长结构光投射器波长相同的带通光滤波片。
进一步地,结构光投射器与可编程门阵列通过第一数字信号线连接;图像采集器与可编程门阵列通过第二数字信号线连接;以及可编程门阵列与中央处理器通过第三数字信号线连接。
进一步地,语音获取单元包括:语音采集器,用于采集用户的声音信号,将声音信号转换为电信号;信号调理电路,用于将电信号进行放大滤波;以及音频模数转换器,用于将放大滤波后的模拟信号转换为数字信号后输出。
进一步地,语音采集器与信号调理电路通过第一模拟信号线连接;信号调理电路与音频模数转换器通过第二模拟信号线连接;以及音频模数转换器与中央处理器通过第四数字信号线连接。
进一步地,该设备还包括:无线输入设备,用于接收用户输入的控制信号;以及无线收发器,与无线输入设备和中央处理器相连接,用于将控制信号经由中央处理器和传输单元输出至被控设备。
进一步地,无线输入设备包括:无线键盘、无线鼠标、无线耳麦和/或无线手柄。
进一步地,中央处理器与无线收发器通过第五数字信号线连接。
通过本实用新型,采用包括以下结构的基于体感的人机交互设备,用于获取用户动作和声音信息的获取单元,与获取单元相连接并用于识别获取到的动作和声音信息的中央处理器;与中央处理器相连接并用于将识别结果输出至被控设备的传输单元,被控设备根据识别结果执行相应的命令,解决了体感输入设备无法推广到普通被控设备的问题,能够直接向普通被控设备输出用户动作和声音的识别结果,无需普通设备进行动作声音识别,进而达到了将体感控制应用到普通设备中,用户体验好的效果。
附图说明
构成本申请的一部分的附图用来提供对本实用新型的进一步理解,本实用新型的示意性实施例及其说明用于解释本实用新型,并不构成对本实用新型的不当限定。在附图中:
图1是根据本实用新型实施例的基于体感的人机交互设备的原理框图;以及
图2是根据本实用新型实施例的基于体感的人机交互设备连接示意图。
具体实施方式
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本实用新型。
本具体实施方式对本申请提供的基于体感的人机交互设备的实施例进行说明,该设备可获取用户动作和声音信息,然后进行识别并将识别结果传输至被控设备,例如该被控设备可以为计算机、家用电器、公共操作设备(包括提款机、银行取号机、饭店点菜机等),将本申请的基于体感的人机交互设备连接至被控设备,被控设备中设置相应的控制程序,在获取到人机交互设备输出的识别结果后,执行识别结果对应的控制命令,实现基于体感的控制。
图1是根据本实用新型实施例的基于体感的人机交互设备的原理框图,如图1所示,该基于体感的人机交互设备包括获取单元20、中央处理器40和传输单元60。
其中,获取单元20用于获取用户动作和声音信息,例如,通过摄像头连续拍摄用户动作,得到动作图像;通过麦克风获取用户说话声音,得到语音信号等。中央处理器40与获取单元20相连接,通过模式识别算法识别获取到的动作和声音信息,然后经由传输单元将识别结果输出至被控设备,以使被控设备根据识别结果执行相应的命令。其中,中央处理器应该具有较强的数据处理能力,满足实时的动作识别、语音识别、传输单元的数据打包及传输要求。
具体地,该人机交互设备的连接示意图如图2所示,获取单元20包括三位视频流获取单元(也即动作获取单元)和语音信号流获取单元(也即语音获取单元),其中,三维视频流获取单元包括结构光投射器、摄像头和可编程门阵列;语音信号流获取单元包括麦克风、信号调理电路和音频模数转换器;中央处理器作为动作、语音识别单元对三维视频流获取单元和语音信号流获取单元获取到的信息进行识别。
上述各部分的连接关系如下:结构光投射器与可编程门阵列通过数字信号线S1连接;摄像头与可编程门阵列通过数字信号线S2连接;可编程门阵列与中央处理器通过数字信号线S3连接,该数字信号线S3可使用外部存储器访问方式,并使用多比特并行数据传输;麦克风与信号调理电路通过模拟信号线M1连接;信号调理电路与音频模数转换器通过模拟信号线M2连接;音频模数转换器与中央处理器通过数字信号线S4连接;上述中央处理器支持通用串行总线,用于和外部被控设备进行数据通讯。
该人机交互设备的工作原理如下:可编程门阵列通过数字信号线S1控制结构光投射器,产生结构光,并将结构光投射到空间。被上述结构光照明区域中的物体或者人体的表面轮廓会对结构光进行调制,使原始投射的结构光产生变形。摄像头以一定的帧率连续采集照明区域内空间图像,图像数据通过数字信号线S2传给可编程门阵列。可编程门阵列预先配置了深度图获取算法,用于将原始采集的信号实时处理成深度图的视频流,提供给后续动作模式识别算法使用,因此,可编程门整列连续处理摄像头传来的数据,根据调制后结构光的变形情况计算出每个成像点的深度值,每一帧图像可以获得一帧深度图,连续帧图像获得连续帧的深度图,可编程门阵列通过数字信号线S3将连续的帧深度图送到中央处理器。中央处理器收到连续帧的深度图后,通过内部的软件算法进行动作模式识别,识别结果通过通用串行总线传给外部被控设备。
结构光投射器可以采用投射光斑或者网格的方式。优选的,可以使用单波长的结构光方案,便于在图像获取时采用一定方案滤除环境光干扰。***设计时预先设定投射方式,可编程门阵列可以控制结构光投射器的供电,方便在休眠模式下降低***功耗。
摄像头可以使用单色图像传感器。优选使用带有和上述单波长相同的带通光滤波片,利于滤除环境光干扰。传感器选择上应该尽可能使用感光面积较大的传感器,这样可以降低对结构光投射器的发光功率要求,获得较好的效果。
麦克风将环境声音信号转换成电信号,通过模拟信号线M1输出到信号调理电路。信号调理电路按照需要对麦克风传来的信号做放大滤波,通过模拟信号线M2输出到模数转换器。模数转换器把信号调理电路传来的模拟信号转换成数字信号,通过数字信号线S4输出到中央处理器。中央处理器收到数字信号线S4传来的数字信号后,通过内部的软件算法进行语音识别,识别结果通过通用串行总线传给外部设备。
信号调理电路应该具有较好的动态范围、信噪比、增益控制等功能。有利于获得高质量的语音信号,同时有利于语音识别和语音重现。
通过上述原理课得到,当结构光投射器将结构光投射到用户所在空间位置时,用户不同的动作使结构光产生不同的变形,摄像头采集变形后的可编程门阵列像,可编程门阵列输出结构光图像的深度图,中央处理器根据深度图得到识别结果,也即识别用户动作。这种基于深度图的识别方式识别准确性高,并且向主机传输的是识别结果,避免传输深度图影响传输速度和图像效果。
当用户通过语音控制外部被控设备时,麦克风能够采集到用户的说话声音,并经过信号调理电路和音频模数转换器传送给中央处理器,中央处理器根据声音数字信号得到识别结果,也即识别用户语音,并将声音识别结果传送给外部被控设备。
优选地,该人机交互设备还包括无线数据收发器,通过无线信道W1与无线设备相连接,将无线设备接收到的用户输入传输至中央处理器,其中,无线设备包括无线手柄、无线键盘和鼠标、无线耳麦等。其中,中央处理器与无线收发器通过数字信号线S5连接,无线收发器支持主流的无线收发能力和协议,比如支持蓝牙,wifi等,同时支持多设备的星状数据连接。
在该优选实施例中,无线手柄、无线键盘、无线鼠标获得用户控制信号或无线耳麦捕捉用户语音信号,通过无线信道W1传送给无线收发机,无线收发机将接收到的控制信号或语音信号通过数字信号线S5发送给中央处理器,中央处理器收到数字信号线S5传来的数字信号后,将控制信号和语音识别结果通过通用串行总线传给外部被控设备。因此,声音信号可以从麦克风获得,也可以通过无线麦克风获得,取决于使用者。对于需要排除环境声音干扰的情况,佩戴在使用者头部的麦克风会取得更好的效果。
进一步地,外部被控设备播放的数字语音信号通过通用串行总线传送给中央处理器,中央处理器收到外部被控设备播放的数字语音信号通过数字信号线S5传送给无线收发机,无线收发机将中央处理器传来的数字语音信号通过无线信道发送给无线耳麦,用户听到声音,实现信号的双向传输。
从以上的描述中,可以看出,本实用新型实现了如下技术效果:该基于体感的人机交互设备通过捕捉人体的动作和语音,并将动作和语音做模式识别,将模式识别结果传送给外部被控设备,完成人自身与被控设备进行交互的过程,其中,人机交互设备自身可完成动作、语音的获取和模式识别,直接将识别结果传给外部被控设备,外部被控设备只需要完成应用程序处理,降低了对主机速度要求,使得基于体感的控制应用更加广泛。
进一步地,该基于体感的人机交互设备对深度图传输采用多比特并行接口,解决了传输通道带宽不足的问题;支持无线连接,可以支持无线键盘、无线鼠标、无线耳麦、无线手柄等设备,解决了精细准确输入控制的问题。
以上所述仅为本实用新型的优选实施例而已,并不用于限制本实用新型,对于本领域的技术人员来说,本实用新型可以有各种更改和变化。凡在本实用新型的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本实用新型的保护范围之内。

Claims (10)

1.一种基于体感的人机交互设备,其特征在于,包括:
获取单元,用于获取用户动作和声音信息;
中央处理器,与所述获取单元相连接,用于识别获取到的动作和声音信息;
传输单元,与所述中央处理器相连接,用于将识别结果输出至被控设备,以使所述被控设备根据所述识别结果执行相应的命令。
2.根据权利要求1所述的基于体感的人机交互设备,其特征在于,所述获取单元包括:
动作获取单元,用于获取所述用户动作的图像;以及
语音获取单元,用于获取所述用户的语音信息。
3.根据权利要求2所述的基于体感的人机交互设备,其特征在于,所述动作获取单元包括:
结构光投射器,用于将结构光投射至所述用户所在的空间;
图像采集器,用于采集所述结构光投射的空间内的图像;以及
可编程门阵列,用于计算并输出采集到的图像的深度图。
4.根据权利要求3所述的基于体感的人机交互设备,其特征在于,
所述图像采集器为单色图像传感器;
所述结构光投射器为单波长结构光投射器;以及
所述单色图像传感器具有与所述单波长结构光投射器波长相同的带通光滤波片。
5.根据权利要求3所述的基于体感的人机交互设备,其特征在于,
所述结构光投射器与所述可编程门阵列通过第一数字信号线连接;
所述图像采集器与所述可编程门阵列通过第二数字信号线连接;以及
所述可编程门阵列与所述中央处理器通过第三数字信号线连接。
6.根据权利要求2所述的基于体感的人机交互设备,其特征在于,所述语音获取单元包括:
语音采集器,用于采集所述用户的声音信号,将所述声音信号转换为电信号;
信号调理电路,用于将所述电信号进行放大滤波;以及
音频模数转换器,用于将放大滤波后的模拟信号转换为数字信号后输出。
7.根据权利要求6所述的基于体感的人机交互设备,其特征在于,
所述语音采集器与信号调理电路通过第一模拟信号线连接;
所述信号调理电路与所述音频模数转换器通过第二模拟信号线连接;以及
所述音频模数转换器与所述中央处理器通过第四数字信号线连接。
8.根据权利要求1所述的基于体感的人机交互设备,其特征在于,还包括:
无线输入设备,用于接收用户输入的控制信号;以及
无线收发器,与所述无线输入设备和所述中央处理器相连接,用于将所述控制信号经由所述中央处理器和所述传输单元输出至所述被控设备。
9.根据权利要求8所述的基于体感的人机交互设备,其特征在于,所述无线输入设备包括:无线键盘、无线鼠标、无线耳麦和/或无线手柄。
10.根据权利要求8所述的基于体感的人机交互设备,其特征在于,所述中央处理器与所述无线收发器通过第五数字信号线连接。
CN 201320026829 2013-01-17 2013-01-17 基于体感的人机交互设备 Expired - Fee Related CN203164866U (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN 201320026829 CN203164866U (zh) 2013-01-17 2013-01-17 基于体感的人机交互设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN 201320026829 CN203164866U (zh) 2013-01-17 2013-01-17 基于体感的人机交互设备

Publications (1)

Publication Number Publication Date
CN203164866U true CN203164866U (zh) 2013-08-28

Family

ID=49026037

Family Applications (1)

Application Number Title Priority Date Filing Date
CN 201320026829 Expired - Fee Related CN203164866U (zh) 2013-01-17 2013-01-17 基于体感的人机交互设备

Country Status (1)

Country Link
CN (1) CN203164866U (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103599621A (zh) * 2013-11-18 2014-02-26 四川长虹电器股份有限公司 能够实现语音控制的跑步机***及其控制方法
CN104166466A (zh) * 2014-09-17 2014-11-26 北京行云时空科技有限公司 一种带辅助控制的体感操控***及方法
WO2015176467A1 (zh) * 2013-05-24 2015-11-26 文霞 机器人
WO2019080934A1 (zh) * 2017-10-27 2019-05-02 Oppo广东移动通信有限公司 图像处理方法、装置和电子装置

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015176467A1 (zh) * 2013-05-24 2015-11-26 文霞 机器人
CN103599621A (zh) * 2013-11-18 2014-02-26 四川长虹电器股份有限公司 能够实现语音控制的跑步机***及其控制方法
CN104166466A (zh) * 2014-09-17 2014-11-26 北京行云时空科技有限公司 一种带辅助控制的体感操控***及方法
WO2019080934A1 (zh) * 2017-10-27 2019-05-02 Oppo广东移动通信有限公司 图像处理方法、装置和电子装置
US11315268B2 (en) 2017-10-27 2022-04-26 Guangdong Oppo Mobile Telecommunications Corp., Ltd. Image processing methods, image processing apparatuses and electronic devices

Similar Documents

Publication Publication Date Title
CN107358007B (zh) 控制智能家居***的方法、装置和计算可读存储介质
CN104410883B (zh) 一种移动可穿戴非接触式交互***与方法
CN104049721B (zh) 信息处理方法及电子设备
CN104156065B (zh) 家庭媒体播放设备操控方法、装置及设备
CN101370096B (zh) 基于空间定位的交互式电视遥控器
CN106346487A (zh) 交互式vr沙盘展示机器人
CN106773766A (zh) 带学习功能的智能家居管家中控***及其控制方法
CN106790628A (zh) 带体感功能的智能家居管家中控***及其控制方法
CN203164866U (zh) 基于体感的人机交互设备
WO2015192631A1 (zh) 视频会议***及方法
CN106782559A (zh) 带远程通讯控制的智能家居管家中控***及其控制方法
CN103345204B (zh) 一种家庭控制***
CN205490994U (zh) 一种多功能智能音响
CN103529945A (zh) 电脑游戏的控制方法和控制***
CN208969451U (zh) 一种智能家居控制***
CN208013683U (zh) 带体感功能的智能家居管家中控设备
CN108021046A (zh) 一种实现人机交互的机器人
CN107479854A (zh) 一种投影仪及投影方法
CN102413023B (zh) 互动娱乐***及方法
WO2020151255A1 (zh) 一种基于移动终端的展示控制***及方法
CN113014960B (zh) 一种在线制作视频的方法、装置及存储介质
CN106998517A (zh) 电子装置以及音频重新聚焦的方法
CN203966055U (zh) 无线交互投影***
KR20170107033A (ko) 동적 조합 및 조정이 가능한 개인 작업 시스템
CN106681483A (zh) 一种智能设备的交互方法及***

Legal Events

Date Code Title Description
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20130828

Termination date: 20180117

CF01 Termination of patent right due to non-payment of annual fee