CN103257703A - 一种增强现实装置及方法 - Google Patents

一种增强现实装置及方法 Download PDF

Info

Publication number
CN103257703A
CN103257703A CN2012100398950A CN201210039895A CN103257703A CN 103257703 A CN103257703 A CN 103257703A CN 2012100398950 A CN2012100398950 A CN 2012100398950A CN 201210039895 A CN201210039895 A CN 201210039895A CN 103257703 A CN103257703 A CN 103257703A
Authority
CN
China
Prior art keywords
image
instruction
recognition result
user
identified
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2012100398950A
Other languages
English (en)
Other versions
CN103257703B (zh
Inventor
邵翔
付荣耀
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Lenovo Beijing Ltd
Original Assignee
Lenovo Beijing Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Lenovo Beijing Ltd filed Critical Lenovo Beijing Ltd
Priority to CN201210039895.0A priority Critical patent/CN103257703B/zh
Publication of CN103257703A publication Critical patent/CN103257703A/zh
Application granted granted Critical
Publication of CN103257703B publication Critical patent/CN103257703B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • User Interface Of Digital Computer (AREA)

Abstract

本发明公开了一种增强现实装置及方法,该装置具体包括:可佩戴的发声装置,图象采集单元和图像识别单元;其中,所述图像采集单元安装在所述发声装置上;所述图象采集单元,用于采集图象并将所述图像发送至所述图像识别单元;所述图像识别单元,用于根据预存的信息对所述图像进行识别,生成识别结果;所述发声装置,用于将所述识别结果通过语音提示给用户。本发明简化了增强现实技术的步骤,操作简单、便捷。

Description

一种增强现实装置及方法
技术领域
本发明涉及电子领域,尤其涉及一种增强现实装置及方法。
背景技术
AR(Augmented Reality)技术即增强现实技术,是指把把原本在现实世界的一定时间空间范围内很难体验到的实体信息(视觉信息,声音,味道,触觉等),通过科学技术模拟仿真后再叠加到现实世界被人类感官所感知,从而达到超越现实的感官体验。
AR技术是透过某种装置进行观看实现的。早先的装置主要是HMD<Head-Mounted Display;头罩式装置>,技术大概分成光学式<Optical>与影像<Video>两种,前者是一种透明的装置<像是柯南的眼镜之类>,使用者可以直接透过这层看到真实世界的影像,然后会有一些另外的投影装置把虚拟影像投射在这层透明装置上。另外一种是不透明装置,使用者看到的是由电脑处理好、已经虚实结合的影像。但专门佩戴头戴式的HMD比较麻烦。
最近几年较为通用的装置是安装了摄像头的移动设备如智能手机。通过在智能手机上安装摄像头进行拍摄,然后在后台进行处理获取信息以传递给用户。移动设备体积小,携带较为方便,但使用移动设备进行拍摄,需要打开移动设备,调到拍摄模式,然后对准物体进行拍摄等步骤,操作过程比较繁琐。
发明内容
本发明提供了一种增强现实装置及方法、能够简化增强现实技术的步骤,操作简单、便捷。
本发明提供了一种增强现实装置,该装置包括:
可佩戴的发声装置,图象采集单元和图像识别单元;其中,所述图像采集单元安装在所述发声装置上;
所述图象采集单元,用于采集图象并将所述图像发送至所述图像识别单元;
所述图像识别单元,用于根据预存的信息对所述图像进行识别,生成识别结果;
所述发声装置,用于将所述识别结果通过语音提示给用户。
优选的,所述装置还包括:
指令获取单元,用于获取用户的指令;
所述图像识别单元,还用于依据所述指令,根据所述预存的信息对所述图像进行识别,生成识别结果。
优选的,所述指令获取单元包括:
语音识别单元,用于接收用户通过所述发声装置发送的语音信号并进行识别,生成语音指令;
所述图像识别单元,还用于依据所述语音指令,根据所述预存的信息对所述图像进行识别,生成识别结果。
优选的,所述指令获取单元包括:
手势识别单元,用于获取用户的手势并生成手势指令;
所述图像识别单元,还用于依据所述手势指令,根据所述预存的信息对所述图像进行识别,生成识别结果。
优选的,所述图象采集单元包括:摄像头。
优选的,所述发声装置包括:耳机。
本发明还提供了一种增强现实的方法,所述方法包括:
采集现实环境中的物体的图像;
根据预存的信息对所述图像进行识别,生成识别结果;
将所述识别结果通过语音提示给用户。
优选的,所述方法还包括:
获取用户的指令;
所述根据预存的信息对所述图像进行识别,生成识别结果包括:
依据所述指令,根据所述预存的信息对所述图像进行识别,生成识别结果。
优选的,所述获取用户的指令包括:
接收用户发送的语音信号并进行识别,生成语音指令;
所述依据所述指令,根据所述预存的信息对所述图像进行识别,生成识别结果包括:
依据所述语音指令,根据所述预存的信息对所述图像进行识别,生成识别结果。
优选的,所述获取用户的指令包括:
获取用户的手势并生成手势指令;
所述依据所述指令,根据所述预存的信息对所述图像进行识别,生成识别结果包括:
依据所述手势指令,根据所述预存的信息对所述图像进行识别,生成识别结果。
与现有技术相比,本发明具有如下有益效果:
本发明通过将图像采集单元安装在可佩戴的发声装置上,能够在用户佩戴发声装置的同时进行图像的采集,通过发声装置告知用户识别结果,从而使用户得到超越现实的体验。用户不用专门携带移动设备,而且也不用在每次拍摄时,进行打开、拍摄、关闭等操作,相比现有技术,本发明简化了增强现实技术的步骤,操作简单、便捷。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例1装置结构图;
图2是本发明实施例5示意图;
图3是本发明实施例5示意图;
图4是本发明实施例7方法流程图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例1提供了一种增强现实装置,参见图1,该装置包括:
可佩戴的发声装置11,图象采集单元12和图像识别单元13;其中,所述图像采集单元12安装在所述发声装置11上。
为保证采集的图像与用户观看的图像一致,可设置该增强现实装置,使图像采集单元的视线角度与用户的视线角度一致。
所述图象采集单元12,用于采集图象并将所述图像发送至所述图像识别单元13。
所述图像识别单元13,用于根据预存的信息对所述图像进行识别,生成识别结果。
该预存的信息具体可以包括:存储的人的信息如人的脸部特征、身高、胖瘦等信息。还可以包括物体的特征如高楼大厦、标识、条形码等。
当存储的信息较多时,会减慢识别的速度。为此,可以先对存储的信息进分类,比如分为人和物体两大类。在人的类别后可以再具体分为男人、女人。在物体的类别后可以分为建筑类、食品类、标识类等。在进行识别时,显示别出其属于哪一类,然后在某一类的信息中进行查找识别。
所述发声装置11,用于将所述识别结果通过语音提示给用户。
具体的,可佩戴的发声装置可以为耳机。图像采集单元可以为摄像头。优选的,该耳机可以为蓝牙耳机。以蓝牙耳机为例,现在蓝牙耳机的应用已经越来越广,很多用户都随时佩戴该耳机。因此,将摄像头安装在蓝牙耳机上,可使用户在使用蓝牙耳机的同时进行图像采集,避免了用户额外携带其他设备。而且相对使用现有技术中的移动设备如智能手机等,本发明中的摄像头可一直处于拍摄状态,不用在每次拍摄时进行打开、拍摄、关闭等一系列操作。
有时用户并不需要对所有采集的图像进行识别,因此,在本发明的实施例2中,增强现实装置还包括:
指令获取单元,用于获取用户的指令。该指令获取单元与图像识别单元相连。
所述图像识别单元,还用于依据所述指令,根据所述预存的信息对所述图像进行识别,生成识别结果。
用户可以通过语音或手势发送指令。
因此,在本发明的实施例3中,指令获取单元可以包括:
语音识别单元,用于接收用户通过所述发声装置发送的语音信号并进行识别,生成语音指令。
所述图像识别单元,还用于依据所述语音指令,根据所述预存的信息对所述图像进行识别,生成识别结果。
比如,用户发出“此人是谁”的指令,那么图像识别单元就要对刚刚拍摄的人的图像进行识别,并告知用户结果。
在具体识别时,如果图像识别单元在预存的信息中没有找到该图像的信息,那么可以返回不能识别的信息。如果在预存的信息中找到了至少两个相似的信息,那么可以将该至少两个信息均返回给用户。
在本发明的实施例4中,所述指令获取单元包括:
手势识别单元,用于获取用户的手势并生成手势指令。
所述图像识别单元,还用于依据所述手势指令,根据所述预存的信息对所述图像进行识别,生成识别结果。
比如,当用户用手指向看到的某一物体时,手势识别单元获取到该信息并生成识别该物体的指令,图像识别单元就会根据预存的信息对其进行识别并生成识别结果。
同实施例3一样,在具体识别时,如果图像识别单元在预存的信息中没有找到对应的信息,那么可以返回不能识别的信息。如果在预存的信息中找到了至少两个相似的信息,那么可以将该至少两个信息均返回给用户。
更进一步的为节省资源,图像采集单元可只对用户要识别的物体进行拍摄。此时,该增强现实装置还包括第二指令获取单元,与图像采集单元相连,用于获取用户的指令。图像采集单元用于根据用户的指令进行图像采集。图像识别单元用于对采集的图像进行识别。
本发明实施例5,参见图2为该增强现实装置在具体场景下的一个应用。
用户佩戴蓝牙耳机行走在路上,安装在蓝牙耳机上的摄像头对用户视野范围内的物体或人进行图像采集。
用户发现前方走过一人,但记不清此人,于是用户通过蓝牙耳机发出“此人是谁”的指令。
语音识别单元接收到该指令后进行识别,生成图像识别单元可识别的语音指令。之后图像识别单元,依据该语音指令,根据预存的信息对该人进行识别,发现该人叫“John”。于是生成“该人是john”的识别结果。并通过发声装置反馈给用户。用户可以凭借该结果与该人打招呼,以避免叫不出他人姓名的尴尬。
该用户继续行走,发现某一陌生的标识,于是用手势指向该标识。
手势识别单元接收到该手势后进行识别,生成识别该标识的指令。之后图像识别单元,依据该指令,根据预存的信息对该标识进行识别,发现存储的信息中没有该标识的相关信息,于是生成“不能识别该标识”的识别结果。
该识别结果被发送至发声装置,发声装置将其转换为相应的语音信息后发送至用户。
本发明实施例6还提供了一种增强现实的方法,参见图4,该方法包括:
S1、利用安装在可佩戴的发声装置上的图像采集单元采集现实环境中的物体的图像。
为保证采集的图像与用户观看的图像一致,可设置该发声装置,使图像采集单元的视线角度与用户的视线角度一致。
S2、根据预存的信息对所述图像进行识别,生成识别结果。
该预存的信息具体可以包括:存储的人的信息如人的脸部特征、身高、胖瘦等信息。还可以包括物体的特征如高楼大厦、标识、条形码等。
当存储的信息较多时,会减慢识别的速度。为此,可以先对存储的信息进分类,比如分为人和物体两大类。在人的类别后可以再具体分为男人、女人。在物体的类别后可以分为建筑类、食品类、标识类等。在进行识别时,显示别出其属于哪一类,然后在某一类的信息中进行查找识别。
S3、将所述识别结果通过语音提示给用户。
具体的,可佩戴的发声装置可以为耳机。图像采集单元可以为摄像头。优选的,该耳机可以为蓝牙耳机。以蓝牙耳机为例,现在蓝牙耳机的应用已经越来越广,很多用户都随时佩戴该耳机。因此,将摄像头安装在蓝牙耳机上,可使用户在使用蓝牙耳机的同时进行图像采集,避免了用户额外携带其他设备。而且相对使用现有技术中的移动设备如智能手机等,本发明中的摄像头可一直处于拍摄状态,不用在每次拍摄时进行打开、拍摄、关闭等一系列操作。
有时用户并不需要对所有采集的图像进行识别,因此,在本发明的实施例7中,该方法还包括:
获取用户的指令。
所述根据预存的信息对所述图像进行识别,生成识别结果包括:
依据所述指令,根据所述预存的信息对所述图像进行识别,生成识别结果。
具体的,用户可以通过语音或手势发送指令。
因此,在本发明的实施例8中,所述获取用户的指令包括:
接收用户发送的语音信号并进行识别,生成语音指令。
所述依据所述指令,根据所述预存的信息对所述图像进行识别,生成识别结果包括:
依据所述语音指令,根据所述预存的信息对所述图像进行识别,生成识别结果。
在本发明的实施例9中,所述获取用户的指令包括:
获取用户的手势并生成手势指令;
所述依据所述指令,根据所述预存的信息对所述图像进行识别,生成识别结果包括:
依据所述手势指令,根据所述预存的信息对所述图像进行识别,生成识别结果。
值得注意的是,本发明方法与本发明的电子设备是相对应的,因此对电子设备部分不再详述,相关部分参见方法实施例即可。
以上对本发明所提供的一种组合按键的提示方法及电子设备进行了介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处。综上所述,本说明书内容不应理解为对本发明的限制。

Claims (10)

1.一种增强现实装置,其特征在于,该装置包括:
可佩戴的发声装置,图象采集单元和图像识别单元;其中,所述图像采集单元安装在所述发声装置上;
所述图象采集单元,用于采集图象并将所述图像发送至所述图像识别单元;
所述图像识别单元,用于根据预存的信息对所述图像进行识别,生成识别结果;
所述发声装置,用于将所述识别结果通过语音提示给用户。
2.根据权利要求1所述的装置,其特征在于,所述装置还包括:
指令获取单元,用于获取用户的指令;
所述图像识别单元,还用于依据所述指令,根据所述预存的信息对所述图像进行识别,生成识别结果。
3.根据权利要求2所述的装置,其特征在于,所述指令获取单元包括:
语音识别单元,用于接收用户通过所述发声装置发送的语音信号并进行识别,生成语音指令;
所述图像识别单元,还用于依据所述语音指令,根据所述预存的信息对所述图像进行识别,生成识别结果。
4.根据权利要求2所述的装置,其特征在于,所述指令获取单元包括:
手势识别单元,用于获取用户的手势并生成手势指令;
所述图像识别单元,还用于依据所述手势指令,根据所述预存的信息对所述图像进行识别,生成识别结果。
5.根据权利要求1至4任一项所述的装置,其特征在于,所述图象采集单元包括:摄像头。
6.根据权利要求1或4任一项所述的装置,其特征在于,所述发声装置包括:耳机。
7.一种增强现实的方法,其特征在于,所述方法包括:
利用安装在可佩戴的发声装置上的图像采集单元采集现实环境中的物体的图像;
根据预存的信息对所述图像进行识别,生成识别结果;
将所述识别结果通过语音提示给用户。
8.根据权利要求7所述的方法,其特征在于,所述方法还包括:
获取用户的指令;
所述根据预存的信息对所述图像进行识别,生成识别结果包括:
依据所述指令,根据所述预存的信息对所述图像进行识别,生成识别结果。
9.根据权利要求8所述的方法,其特征在于,所述获取用户的指令包括:
接收用户发送的语音信号并进行识别,生成语音指令;
所述依据所述指令,根据所述预存的信息对所述图像进行识别,生成识别结果包括:
依据所述语音指令,根据所述预存的信息对所述图像进行识别,生成识别结果。
10.根据权利要求8所述的方法,其特征在于,所述获取用户的指令包括:
获取用户的手势并生成手势指令;
所述依据所述指令,根据所述预存的信息对所述图像进行识别,生成识别结果包括:
依据所述手势指令,根据所述预存的信息对所述图像进行识别,生成识别结果。
CN201210039895.0A 2012-02-20 2012-02-20 一种增强现实装置及方法 Active CN103257703B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210039895.0A CN103257703B (zh) 2012-02-20 2012-02-20 一种增强现实装置及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210039895.0A CN103257703B (zh) 2012-02-20 2012-02-20 一种增强现实装置及方法

Publications (2)

Publication Number Publication Date
CN103257703A true CN103257703A (zh) 2013-08-21
CN103257703B CN103257703B (zh) 2016-03-30

Family

ID=48961660

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210039895.0A Active CN103257703B (zh) 2012-02-20 2012-02-20 一种增强现实装置及方法

Country Status (1)

Country Link
CN (1) CN103257703B (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103440603A (zh) * 2013-08-30 2013-12-11 苏州跨界软件科技有限公司 基于增强现实的点菜***
CN104182051A (zh) * 2014-08-29 2014-12-03 百度在线网络技术(北京)有限公司 头戴式智能设备和具有该头戴式智能设备的交互***
CN104484037A (zh) * 2014-12-12 2015-04-01 三星电子(中国)研发中心 通过可穿戴设备进行智能控制的方法及该可穿戴设备
WO2017161660A1 (zh) * 2016-03-25 2017-09-28 京东方科技集团股份有限公司 增强现实设备、***、图像处理方法及装置
CN108363556A (zh) * 2018-01-30 2018-08-03 百度在线网络技术(北京)有限公司 一种基于语音与增强现实环境交互的方法和***
CN109862274A (zh) * 2019-03-18 2019-06-07 北京字节跳动网络技术有限公司 带摄像功能的耳机、用于输出控制信号的方法和装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1302056A (zh) * 1999-12-28 2001-07-04 索尼公司 信息处理设备,信息处理方法和存储介质
US6771294B1 (en) * 1999-12-29 2004-08-03 Petri Pulli User interface
WO2010032079A2 (en) * 2008-09-17 2010-03-25 Nokia Corp. User interface for augmented reality
CN102193772A (zh) * 2010-03-19 2011-09-21 索尼公司 信息处理器、信息处理方法和程序

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1302056A (zh) * 1999-12-28 2001-07-04 索尼公司 信息处理设备,信息处理方法和存储介质
US6771294B1 (en) * 1999-12-29 2004-08-03 Petri Pulli User interface
WO2010032079A2 (en) * 2008-09-17 2010-03-25 Nokia Corp. User interface for augmented reality
CN102193772A (zh) * 2010-03-19 2011-09-21 索尼公司 信息处理器、信息处理方法和程序

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103440603A (zh) * 2013-08-30 2013-12-11 苏州跨界软件科技有限公司 基于增强现实的点菜***
CN104182051A (zh) * 2014-08-29 2014-12-03 百度在线网络技术(北京)有限公司 头戴式智能设备和具有该头戴式智能设备的交互***
CN104182051B (zh) * 2014-08-29 2018-03-09 百度在线网络技术(北京)有限公司 头戴式智能设备和具有该头戴式智能设备的交互***
CN104484037A (zh) * 2014-12-12 2015-04-01 三星电子(中国)研发中心 通过可穿戴设备进行智能控制的方法及该可穿戴设备
WO2017161660A1 (zh) * 2016-03-25 2017-09-28 京东方科技集团股份有限公司 增强现实设备、***、图像处理方法及装置
US10665021B2 (en) 2016-03-25 2020-05-26 Boe Technology Group Co., Ltd. Augmented reality apparatus and system, as well as image processing method and device
CN108363556A (zh) * 2018-01-30 2018-08-03 百度在线网络技术(北京)有限公司 一种基于语音与增强现实环境交互的方法和***
US11397559B2 (en) 2018-01-30 2022-07-26 Baidu Online Network Technology (Beijing) Co., Ltd. Method and system based on speech and augmented reality environment interaction
CN109862274A (zh) * 2019-03-18 2019-06-07 北京字节跳动网络技术有限公司 带摄像功能的耳机、用于输出控制信号的方法和装置

Also Published As

Publication number Publication date
CN103257703B (zh) 2016-03-30

Similar Documents

Publication Publication Date Title
US20220083144A1 (en) Extramissive spatial imaging digital eye glass apparatuses, methods and systems for virtual or augmediated vision, manipulation, creation, or interaction with objects, materials, or other entities
US10496910B2 (en) Inconspicuous tag for generating augmented reality experiences
US9729864B2 (en) Camera based safety mechanisms for users of head mounted displays
US9390561B2 (en) Personal holographic billboard
CN102999160B (zh) 混合现实显示器中用户控制的现实对象的消失
CN103873840B (zh) 显示方法及显示设备
CN111652678A (zh) 物品信息显示方法、装置、终端、服务器及可读存储介质
US11302086B1 (en) Providing features of an electronic product in an augmented reality environment
CN103257703A (zh) 一种增强现实装置及方法
US20200209951A1 (en) Information processing system, information processing method, and program
CN106648038A (zh) 在虚拟现实中显示交互对象的方法和装置
JP2023541125A (ja) 情報表示方法、装置及び記憶媒体
CN112684892A (zh) 一种增强现实弹药识别眼镜-手柄连携***
CN106406537A (zh) 一种显示方法以及装置
CN111918114A (zh) 图像显示方法、装置、显示设备及计算机可读存储介质
CN115857856A (zh) 信息提示方法、信息提示装置、电子设备和可读存储介质
EP4200839A1 (en) Selectively using sensors for contextual data
CN112733575A (zh) 图像处理方法、装置、电子设备及存储介质
US20230046337A1 (en) Digital assistant reference resolution
Bari et al. An Overview of the Emerging Technology: Sixth Sense Technology: A Review
US20240248678A1 (en) Digital assistant placement in extended reality
AlKassim et al. Sixth sense technology: Comparisons and future predictions
Sonekar et al. Review on intelligent spectacles to prevent road accident
KR20170093057A (ko) 미디어 중심의 웨어러블 전자 기기를 위한 손 제스쳐 명령의 처리 방법 및 장치
CN114063860A (zh) 图像显示方法及其装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant