CN111176439A - 一种基于视觉跟踪的报读控制方法、智能眼镜及*** - Google Patents

一种基于视觉跟踪的报读控制方法、智能眼镜及*** Download PDF

Info

Publication number
CN111176439A
CN111176439A CN201911136131.1A CN201911136131A CN111176439A CN 111176439 A CN111176439 A CN 111176439A CN 201911136131 A CN201911136131 A CN 201911136131A CN 111176439 A CN111176439 A CN 111176439A
Authority
CN
China
Prior art keywords
reading
content
user
unit
visual focus
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201911136131.1A
Other languages
English (en)
Inventor
张卓
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong Genius Technology Co Ltd
Original Assignee
Guangdong Genius Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong Genius Technology Co Ltd filed Critical Guangdong Genius Technology Co Ltd
Priority to CN201911136131.1A priority Critical patent/CN111176439A/zh
Publication of CN111176439A publication Critical patent/CN111176439A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/011Arrangements for interaction with the human body, e.g. for user immersion in virtual reality
    • G06F3/013Eye tracking input arrangements
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/017Gesture based interaction, e.g. based on a set of recognized hand gestures

Landscapes

  • Engineering & Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

一种基于视觉跟踪的报读控制方法、智能眼镜及***,该方法包括:获取用户的视觉焦点;对该视觉焦点进行跟踪定位,获取对应于该视觉焦点的定位位置的报读内容;在此基础上,报读该报读内容。实施本申请实施例,能够在无需用户手动选择的情况下控制智能眼镜进行内容报读,有利于提升内容报读的效率和用户的使用体验。

Description

一种基于视觉跟踪的报读控制方法、智能眼镜及***
技术领域
本申请涉及智能眼镜技术领域,尤其涉及一种基于视觉跟踪的报读控制方法、智能眼镜及***。
背景技术
当前,在使用智能眼镜进行内容报读的时候,通常需要用户使用手指或辅助设备(如点读笔)手动选择报读内容;同时,用户在手动选择报读内容之前,通常还需要开启智能眼镜识别手指或辅助设备(如点读笔)的功能以及进行内容报读的功能,而在实践中发现,用户常常会忘记开启上述功能,从而降低了用户使用智能眼镜进行内容报读的效率,并造成了不佳的使用体验。
发明内容
本申请实施例公开了一种基于视觉跟踪的报读控制方法、智能眼镜及***,能够在无需用户手动选择的情况下控制智能眼镜进行内容报读,有利于提升内容报读的效率和用户的使用体验。
本申请实施例第一方面公开一种基于视觉跟踪的报读控制方法,包括:
获取用户的视觉焦点;
对所述视觉焦点进行跟踪定位,获取对应于所述视觉焦点的定位位置的报读内容;
报读所述报读内容。
作为一种可选的实施方式,在本申请实施例第一方面中,在报读所述报读内容之后,所述方法还包括:
获取用户发出的第一语音指令;
判断所述第一语音指令是否包含对所述报读内容包括的第一特指内容的第一操作指令;
若包含,对所述第一特指内容执行所述第一操作指令对应的操作。
作为另一种可选的实施方式,在本申请实施例第一方面中,在报读所述报读内容之后,所述方法还包括:
检测所述视觉焦点的定位位置所处区域的第一操作手势;
获取所述第一操作手势对应的第二操作指令,所述第二操作指令是针对所述报读内容包括的第二特指内容的第二操作指令;
对所述第二特指内容执行所述第二操作指令对应的操作。
作为另一种可选的实施方式,在本申请实施例第一方面中,在报读所述报读内容之后,所述方法还包括:
检测所述视觉焦点的定位位置所处区域的第二操作手势;
检测用户发出的第二语音指令;
判断所述第二语音指令是否包含对所述报读内容包括的第三特指内容的第三操作指令;其中,所述第三特指内容由所述第二操作手势从所述报读内容中确定;
若包含,对所述第三特指内容执行所述第三操作指令对应的操作。
作为另一种可选的实施方式,在本申请实施例第一方面中,所述方法还包括:
输出所述报读内容至输出设备上显示。
本申请实施例第二方面公开一种智能眼镜,包括:
焦点获取单元,用于获取用户的视觉焦点;
视觉跟踪单元,用于对所述视觉焦点进行跟踪定位,获取对应于所述视觉焦点的定位位置的报读内容;
报读单元,用于报读所述报读内容。
作为一种可选的实施方式,在本申请实施例第二方面中,所述智能眼镜还包括:
第一获取单元,用于在所述报读单元报读所述报读内容之后,获取用户发出的第一语音指令;
第一判断单元,用于判断所述第一语音指令是否包含对所述报读内容包括的第一特指内容的第一操作指令;
第一执行单元,用于当所述第一判断单元判断出所述第一语音指令包括对所述报读内容包括的第一特指内容的第一操作指令时,对所述第一特指内容执行所述第一操作指令对应的操作。
作为另一种可选的实施方式,在本申请实施例第二方面中,所述智能眼镜还包括:
第一检测单元,用于在所述报读单元报读所述报读内容之后,检测所述视觉焦点的定位位置所处区域的第一操作手势;
第二获取单元,用于获取所述第一操作手势对应的第二操作指令,所述第二操作指令是针对所述报读内容包括的第二特指内容的第二操作指令;
第二执行单元,用于对所述第二特指内容执行所述第二操作指令对应的操作。
作为另一种可选的实施方式,在本申请实施例第二方面中,所述智能眼镜还包括:
第二检测单元,用于在所述报读单元报读所述报读内容之后,检测所述视觉焦点的定位位置所处区域的第二操作手势;
第三检测单元,用于检测用户发出的第二语音指令;
第二判断单元,用于判断所述第二语音指令是否包含对所述报读内容包括的第三特指内容的第三操作指令;其中,所述第三特指内容由所述第二操作手势从所述报读内容中确定;
第三执行单元,用于当所述第二判断单元判断出所述第二语音指令包括对所述报读内容包括的第三特指内容的第三操作指令时,对所述第三特指内容执行所述第三操作指令对应的操作。
作为另一种可选的实施方式,在本申请实施例第二方面中,所述智能眼镜还包括:
输出单元,用于输出所述报读内容至输出设备上显示。
本申请实施例第三方面公开一种基于视觉跟踪的报读控制***,包括:
智能眼镜,用于获取用户的视觉焦点;以及,对所述视觉焦点进行跟踪定位,获取对应于所述视觉焦点的定位位置的报读内容;以及,报读所述报读内容;
输出设备,用于显示所述报读内容;
通信设备,用于连接所述智能眼镜和所述输出设备。
本申请实施例第四方面公开另一种智能眼镜,包括:
存储有可执行程序代码的存储器;
与所述存储器耦合的处理器;
所述处理器调用所述存储器中存储的所述可执行程序代码,执行本申请实施例第一方面公开的任意一种基于视觉跟踪的报读控制方法中的全部或部分步骤。
本申请实施例第五方面公开了一种计算机可读存储介质,其存储计算机程序,其中,所述计算机程序使得计算机执行本申请实施例第一方面公开的任意一种基于视觉跟踪的报读控制方法中的全部或部分步骤。
本申请实施例第六方面公开一种计算机程序产品,当所述计算机程序产品在计算机上运行时,使得所述计算机执行本申请实施例第一方面的任意一种基于视觉跟踪的报读控制方法中的全部或部分步骤。
与现有技术相比,本申请实施例具有以下有益效果:
本申请实施例中,可以先获取用户的视觉焦点;接下来,可以对该视觉焦点进行跟踪定位,获取对应于该视觉焦点的定位位置的报读内容;在此基础上,可以报读该报读内容。可见,实施本申请实施例,应用于智能眼镜,能够在无需用户手动选择的情况下控制智能眼镜进行内容报读,有利于提升内容报读的效率和用户的使用体验。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例中所需要使用的附图作领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例公开的一种基于视觉跟踪的报读控制方法的流程示意图;
图2是本申请实施例公开的另一种基于视觉跟踪的报读控制方法的流程示意图;
图3是本申请实施例公开的又一种基于视觉跟踪的报读控制方法的流程示意图;
图4是本申请实施例公开的一种智能眼镜的模块化示意图;
图5是本申请实施例公开的另一种智能眼镜的模块化示意图;
图6是本申请实施例公开的又一种智能眼镜的模块化示意图;
图7是本申请实施例公开的一种基于视觉跟踪的报读控制***的原理示意图;
图8是本申请实施例公开的又一种智能眼镜的模块化示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整的描述,显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
需要说明的是,本申请实施例的术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、***、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
本申请实施例公开了一种基于视觉跟踪的报读控制方法、智能眼镜及***,能够在无需用户手动选择的情况下控制智能眼镜进行内容报读,有利于提升内容报读的效率和用户的使用体验。以下进行结合附图进行详细描述。
请参阅图1,图1是本申请实施例公开的一种基于视觉跟踪的报读控制方法的流程示意图。如图1所示,该报读控制方法可以包括以下步骤:
101、智能眼镜获取用户的视觉焦点。
本申请实施例中,智能眼镜设有第一拍摄模组;可选的,该智能眼镜还可以设有红外发射模组。利用上述第一拍摄模组和红外发射模组,该智能眼镜可以获取佩戴该智能眼镜的用户的人眼位置和视线方向。
进一步的,该智能眼镜还设有第二拍摄模组,用于获取该用户眼前的视野图像;根据该视野图像以及上述人眼位置和视线方向,该智能眼镜可以计算出该用户的视觉焦点。
在此基础上,该智能眼镜可以具备传统眼镜的镜片和镜架结构,也可以仅具备部分或不具备上述镜片和镜架结构,本申请实施例不作具体限定。
102、智能眼镜对该视觉焦点进行跟踪定位,获取对应于该视觉焦点的定位位置的报读内容。
本申请实施例中,当佩戴该智能眼镜的用户通过转动头部和/或移动眼球等而使该用户的视觉焦点移动时,该智能眼镜可以对该视觉焦点进行跟踪定位,获取该视觉焦点的定位位置;在此基础上,根据该定位位置和通过上述智能眼镜的第二拍摄模组获取的该用户眼前的视野图像,可以获取对应于该视觉焦点的部分视野图像;对该部分视野图像进行内容识别,可以获取对应于上述视觉焦点的图像内容,作为该智能眼镜的报读内容。
作为一种可选的实施方式,智能眼镜在对上述视觉焦点进行跟踪定位时,若检测到失去视觉焦点,且失去该视觉焦点的持续时间超过某一预设的时长阈值,该智能眼镜可以判断出佩戴该智能眼镜的用户持续闭眼或走神;进一步的,该智能眼镜可以中止对上述视觉焦点进行跟踪定位,进入休眠模式以节省电量。
103、智能眼镜报读该报读内容。
作为一种可选的实施方式,智能眼镜在报读上述报读内容时,还可以执行以下步骤:获取佩戴该智能眼镜的用户的人眼图像;根据该人眼图像判断该用户的年龄范围;获取该智能眼镜预设的与上述年龄范围相匹配的虚拟形象声纹特征,利用该虚拟形象声纹特征报读上述报读内容;进一步的,该智能眼镜还可以获取上述虚拟形象,并将该虚拟形象投射至其用户的视角膜上,以使该用户看到该虚拟形象为其报读上述报读内容,从而能够提升利用智能眼镜进行内容报读的趣味性。
可见,实施图1所描述的报读控制方法,能够在无需用户手动选择的情况下控制智能眼镜进行内容报读,有利于提升内容报读的效率和用户的使用体验。
请参阅图2,图2是本申请实施例公开的另一种基于视觉跟踪的报读控制方法的流程示意图。如图2所示,该报读方法可以包括以下步骤:
201、智能眼镜获取用户的视觉焦点。
202、智能眼镜对该视觉焦点进行跟踪定位,获取对应于该视觉焦点的定位位置的报读内容。
203、智能眼镜报读该报读内容。
204、智能眼镜获取用户发出的第一语音指令。
205、智能眼镜判断该第一语音指令是否包含对上述报读内容包括的第一特指内容的第一操作指令,若包括,执行步骤206;否则,结束本流程。
示例性的,上述第一特指内容可以根据上述视觉焦点的定位位置具体确定,例如,当上述第一语音指令包含“这个单词”或“这个字”等类似表述时,可以获取此时视觉焦点的定位位置中心的部分报读内容,具体为某一单词或某一汉字,作为第一特指内容;或者,该第一特指内容也可以根据上述第一语音指令具体确定,例如,当该第一语音指令包含上述报读内容中的某一单词或某一汉字时,可以将该单词或该汉字作为第一特指内容;又例如,当该第一语音指令包含上述报读内容中的某一单词或某一汉字在该报读内容中的具***置(如第x行第y个)时,可以获取对应于该具***置(如第x行第y个)的单词或汉字,作为第一特指内容。
进一步举例来说,当智能眼镜判断出上述第一语音指令包含对上述第一特指内容的第一操作指令时,若该第一操作指令表示对该第一特指内容进行翻译,则在接下来的步骤206中,智能眼镜可以先识别该第一特指内容的语种;若该第一特指内容的语种非汉语,智能眼镜可以通过内置词典或联网查询其汉语翻译,获得翻译结果;或者,若该第一特指内容的语种为汉语,智能眼镜可以通过内置词典或联网查询其英语翻译,获取翻译结果;在此基础上,智能眼镜可以通过语音播报或可见光投射的方式输出该翻译结果。进一步的,智能眼镜还可以检测用户发出的更改当前翻译语种的语音指令,并根据该语音指令更改当前翻译语种,重新翻译上述第一特指内容并输出翻译结果。更进一步的,智能眼镜还可以检测用户发出的更改默认翻译语种的语音指令,并根据该语音指令更改默认翻译语种,从而在下一次执行翻译的操作指令时,根据更改后的默认翻译语种进行翻译。
又举例来说,当智能眼镜判断出上述第一语音指令包含对上述第一特指内容的第一操作指令时,若该第一操作指令表示对该第一特指内容进行释义,则在接下来的步骤206中,智能眼镜可以通过内置词典或联网查询其释义,并获取相关的使用示例;在此基础上,智能眼镜可以通过语音播报或可见光投射的方式输出该释义和相关的使用示例,从而加深佩戴该智能眼镜的用户对上述报读内容的理解。
通过实施上述方法,能够在无需用户手动选择的情况下控制智能眼镜进行内容报读,并且还能够利用语音实现用户与内容的深度交互,从而实现利用智能眼镜进行内容报读的功能拓展,提升该智能眼镜的实用性。
206、智能眼镜对上述第一特指内容执行该第一操作指令对应的操作。
作为一种可选的实施方式,智能眼镜在执行上述步骤201~步骤203,报读上述报读内容之后,还可以执行以下步骤:检测上述视觉焦点的定位位置所处区域的第一操作手势;获取该第一操作手势对应的第二操作指令,其中,该第二操作指令具体是针对上述报读内容包括的第二特指内容的第二操作指令;以及,对该第二特指内容执行该第二操作指令对应的操作。
举例来说,上述第一操作手势可以是单指长按,若该第一操作手势对应的第二操作指令为选词,智能眼镜可以先根据上述单指长按的位置从上述报读内容中确定部分报读内容,具体为某一单词或某一汉字,作为第二特指内容;在此基础上,智能眼镜可以选取该第二特指内容,将其加入缓存词库中,以方便后续的进一步操作。
通过实施上述方法,能够进一步实现用户与内容的深度交互,从而丰富利用智能眼镜进行内容报读的功能拓展,提升该智能眼镜的实用性。
可见,实施图2所描述的报读控制方法,能够在无需用户手动选择的情况下控制智能眼镜进行内容报读,有利于提升内容报读的效率和用户的使用体验。
此外,实施图2所描述的报读控制方法,能够利用语音实现用户与内容的深度交互,从而实现利用智能眼镜进行内容报读的功能拓展,提升该智能眼镜的实用性。
请参阅图3,图3是本申请实施例公开的又一种基于视觉跟踪的报读控制方法的流程示意图。如图3所示,该报读方法可以包括以下步骤:
301、智能眼镜获取用户的视觉焦点。
302、智能眼镜对该视觉焦点进行跟踪定位,获取对应于该视觉焦点的定位位置的报读内容。
303、智能眼镜报读该报读内容。
304、智能眼镜检测上述视觉焦点的定位位置所处区域的第二操作手势。
305、智能眼镜检测用户发出的第二语音指令。
306、智能眼镜判断该第二语音指令是否包含对上述报读内容包括的第三特指内容的第三操作指令,若包含,执行步骤307~步骤308;否则,结束本流程。其中,该第三特指内容由上述第二操作手势从上述报读内容中确定。
307、智能眼镜对上述第三特指内容执行该第三操作指令对应的操作。
308、智能眼镜输出上述报读内容至输出设备上显示。
示例性的,上述第二操作手势可以是圈选,智能眼镜可以根据该第二操作手势,即根据圈选所确定的内容范围,从上述报读内容中确定部分报读内容,作为第三指定内容;在此基础上,若上述第二语音指令包含的对该第三指定内容的第三操作指令为对该第三指定内容进行搜题,则智能眼镜可以从联网题库中搜索与该第三指定内容相匹配的题目信息;进一步的,智能眼镜执行上述步骤308,可以输出上述报读内容至与该智能眼镜相连接的输出设备上显示,同时还可以输出上述与该第三指定内容相匹配的题目信息至该输出设备上显示。
通过实施上述方法,能够利用语音和手势实现用户与内容更深层次的交互,从而实现利用智能眼镜进行内容报读的功能拓展,提升该智能眼镜的实用性;此外,还能够实现丰富的交互方式,提升利用智能眼镜进行内容报读的趣味性和科技感。
作为一种可选的实施方式,上述报读内容可以位于上述输出设备上,智能眼镜还可以执行以下步骤:记录佩戴该智能眼镜的用户的视觉焦点的移动轨迹;若该移动轨迹符合该智能眼镜预设的上滑轨迹,则控制该输出设备将上述报读内容向上滑动,以浏览该报读内容下方的内容;或者,若该移动轨迹符合该智能眼镜预设的下滑轨迹,则控制该输出设备将上述报读内容向下滑动,以浏览该报读内容上方的内容。
其中,上述输出设备可以是与智能眼镜相连接的任意带屏电子设备,本申请实施例不作具体限定。
举例来说,上述输出设备可以是带屏智能音箱,可用于显示上述报读内容;进一步的,该智能音箱还可用于语音输出,从而可以取代智能眼镜执行上述步骤303,对上述报读内容进行报读;以及,可以执行上述第三操作指令所包含的报读操作。
可见,实施图3所描述的报读控制方法,能够在无需用户手动选择的情况下控制智能眼镜进行内容报读,有利于提升内容报读的效率和用户的使用体验。
此外,实施图3所描述的报读控制方法,能够利用语音和手势实现用户与内容更深层次的交互,从而实现利用智能眼镜进行内容报读的功能拓展,提升该智能眼镜的实用性。
此外,实施图3所描述的报读控制方法,能够实现丰富的交互方式,提升利用智能眼镜进行内容报读的趣味性和科技感。
请参阅图4,图4是本申请实施例公开的一种智能眼镜的模块化示意图。如图4所示,该智能眼镜可以包括:
焦点获取单元401,用于获取用户的视觉焦点;
视觉跟踪单元402,用于对上述视觉焦点进行跟踪定位,获取对应于该视觉焦点的定位位置的报读内容;
报读单元403,用于报读该报读内容。
作为一种可选的实施方式,上述焦点获取单元401还可以用于获取佩戴该智能眼镜的用户的人眼图像;进一步的,可以根据该人眼图像判断该用户的年龄范围;以及,获取该智能眼镜预设的与上述年龄范围相匹配的虚拟形象声纹特征,再由报读单元403利用该虚拟形象声纹特征报读上述报读内容;更进一步的,该智能眼镜还可以获取上述虚拟形象,并将该虚拟形象投射至其用户的视角膜上,以使该用户看到该虚拟形象为其报读上述报读内容,从而能够提升利用智能眼镜进行内容报读的趣味性。
可见,实施图4所描述的智能眼镜,能够在无需用户手动选择的情况下控制智能眼镜进行内容报读,有利于提升内容报读的效率和用户的使用体验。
请一并参阅图5,图5是本申请实施例公开的另一种智能眼镜的模块化示意图。其中,图5所示的智能眼镜是由图4所示的智能眼镜进行优化得到的。与图4所示的智能眼镜相比较,图5所示的智能眼镜还包括:
第一获取单元404,用于在上述报读单元403报读上述报读内容之后,获取用户发出的第一语音指令;
第一判断单元405,用于判断该第一语音指令是否包含对上述报读内容包括的第一特指内容的第一操作指令;
第一执行单元406,用于当上述第一判断单元405判断出上述第一语音指令包括对上述报读内容包括的第一特指内容的第一操作指令时,对该第一特指内容执行该第一操作指令对应的操作。
举例来说,当第一判断单元405判断出上述第一语音指令包含对上述第一特指内容的第一操作指令时,若该第一操作指令表示对该第一特指内容进行翻译,则第一执行单元406可以先识别该第一特指内容的语种;若该第一特指内容的语种非汉语,智能眼镜可以通过内置词典或联网查询其汉语翻译,获得翻译结果;或者,若该第一特指内容的语种为汉语,智能眼镜可以通过内置词典或联网查询其英语翻译,获取翻译结果;在此基础上,智能眼镜可以通过语音播报或可见光投射的方式输出该翻译结果。进一步的,第一获取单元404还可以检测用户发出的更改当前翻译语种的语音指令,并根据该语音指令更改当前翻译语种,重新翻译上述第一特指内容并输出翻译结果。更进一步的,第一获取单元404还可以检测用户发出的更改默认翻译语种的语音指令,并根据该语音指令更改默认翻译语种,从而在下一次执行翻译的操作指令时,根据更改后的默认翻译语种进行翻译。
又举例来说,当第一判断单元405判断出上述第一语音指令包含对上述第一特指内容的第一操作指令时,若该第一操作指令表示对该第一特指内容进行释义,则第一执行单元406可以通过内置词典或联网查询其释义,并获取相关的使用示例;在此基础上,智能眼镜可以通过语音播报或可见光投射的方式输出该释义和相关的使用示例,从而加深佩戴该智能眼镜的用户对上述报读内容的理解。
通过实施上述智能眼镜,能够在无需用户手动选择的情况下控制智能眼镜进行内容报读,并且还能够利用语音实现用户与内容的深度交互,从而实现利用智能眼镜进行内容报读的功能拓展,提升该智能眼镜的实用性。
作为一种可选的实施方式,图5所示的智能眼镜还可以包括:
第一检测单元407,用于在上述报读单元403报读上述报读内容之后,检测上述视觉焦点的定位位置所处区域的第一操作手势;
第二获取单元408,用于获取该第一操作手势对应的第二操作指令,该第二操作指令具体是针对上述报读内容包括的第二特指内容的第二操作指令;
第二执行单元409,用于对上述第二特指内容执行该第二操作指令对应的操作。
举例来说,当第一检测单元407检测到上述第一操作手势为单指长按时,若第二获取单元408获取到该第一操作手势对应的第二操作指令为选词,第二执行单元409可以先根据上述单指长按的位置从上述报读内容中确定部分报读内容,具体为某一单词或某一汉字,作为第二特指内容;在此基础上,第二执行单元409可以选取该第二特指内容,将其加入缓存词库中,以方便后续的进一步操作。
通过实施上述智能眼镜,能够进一步实现用户与内容的深度交互,从而丰富利用智能眼镜进行内容报读的功能拓展,提升该智能眼镜的实用性。
可见,实施图5所描述的智能眼镜,能够在无需用户手动选择的情况下控制智能眼镜进行内容报读,有利于提升内容报读的效率和用户的使用体验。
此外,实施图5所描述的智能眼镜,能够利用语音或手势实现用户与内容的深度交互,从而实现利用智能眼镜进行内容报读的功能拓展,提升该智能眼镜的实用性。
请一并参阅图6,图6是本申请实施例公开的又一种智能眼镜的模块化示意图。其中,图6所示的智能眼镜是由图4所示的智能眼镜进行优化得到的。与图4所示的智能眼镜相比较,图6所示的智能眼镜还包括:
第二检测单元410,用于在上述报读单元403报读上述报读内容之后,检测上述视觉焦点的定位位置所处区域的第二操作手势;
第三检测单元411,用于检测用户发出的第二语音指令;
第二判断单元412,用于判断该第二语音指令是否包含对上述报读内容包括的第三特指内容的第三操作指令;其中,该第三特指内容由上述第二操作手势从上述报读内容中确定;
第三执行单元413,用于当上述第二判断单元412判断出上述第二语音指令包括对上述报读内容包括的第三特指内容的第三操作指令时,对该第三特指内容执行该第三操作指令对应的操作。
输出单元414,用于输出上述报读内容至输出设备上显示。
示例性的,当第二检测单元410检测到上述第二操作手势为圈选时,第三执行单元413可以先根据该第二操作手势,即根据圈选所确定的内容范围,从上述报读内容中确定部分报读内容,作为第三指定内容;在此基础上,若第二判断单元412判断出第三检测单元411检测到的第二语音指令包含的对该第三指定内容的第三操作指令为对该第三指定内容进行搜题,则第三执行单元413可以从联网题库中搜索与该第三指定内容相匹配的题目信息;进一步的,输出单元414可以输出上述报读内容至与该智能眼镜相连接的输出设备上显示,同时还可以输出上述与该第三指定内容相匹配的题目信息至该输出设备上显示。
通过实施上述智能眼镜,能够利用语音和手势实现用户与内容更深层次的交互,从而实现利用智能眼镜进行内容报读的功能拓展,提升该智能眼镜的实用性;此外,还能够实现丰富的交互方式,提升利用智能眼镜进行内容报读的趣味性和科技感。
作为一种可选的实施方式,上述报读内容可以位于上述输出设备上,焦点获取单元401和视觉跟踪单元402还可以记录佩戴该智能眼镜的用户的视觉焦点的移动轨迹;若该移动轨迹符合该智能眼镜预设的上滑轨迹,则第三执行单元413控制该输出设备将上述报读内容向上滑动,以浏览该报读内容下方的内容;或者,若该移动轨迹符合该智能眼镜预设的下滑轨迹,则第三执行单元413控制该输出设备将上述报读内容向下滑动,以浏览该报读内容上方的内容。
可见,实施图6所描述的智能眼镜,能够在无需用户手动选择的情况下控制智能眼镜进行内容报读,有利于提升内容报读的效率和用户的使用体验。
此外,实施图6所描述的智能眼镜,能够利用语音和手势实现用户与内容更深层次的交互,从而实现利用智能眼镜进行内容报读的功能拓展,提升该智能眼镜的实用性。
此外,实施图6所描述的智能眼镜,能够实现丰富的交互方式,提升利用智能眼镜进行内容报读的趣味性和科技感。
请参阅图7,图7是本申请实施例公开的一种基于视觉跟踪的报读控制***的原理示意图。如图7所示,该报读控制***包括智能眼镜701、输出设备702以及通信设备703,其中:
智能眼镜701,用于获取用户的视觉焦点;以及,对该视觉焦点进行跟踪定位,获取对应于该视觉焦点的定位位置的报读内容;以及,报读该报读内容;
输出设备702,用于显示上述报读内容;
通信设备703,用于连接上述智能眼镜701和输出设备702。
本申请实施例中,可选的,上述输出设备702可以是带屏智能音箱,在用于显示上述报读内容的同时,还可用于语音输出。
此外,通信设备703通过连接智能眼镜701和输出设备702,可以实现两者之间的通信,进而可以辅助智能眼镜701实现图1~图3所描述的基于视觉跟踪的报读控制方法,具体过程已在前面实施例中进行了介绍,此处不作赘述。
其中,实施图7所示的智能眼镜,能够在无需用户手动选择的情况下控制智能眼镜进行内容报读,有利于提升内容报读的效率和用户的使用体验。此外,通过利用语音和手势,还能够实现用户与内容更深层次的交互,从而实现利用智能眼镜进行内容报读的功能拓展,提升该智能眼镜的实用性;以及,实现丰富的交互方式,提升利用智能眼镜进行内容报读的趣味性和科技感。
请参阅图8,图8是本申请实施例公开的又一种智能眼镜的结构示意图。如图8所示,该智能眼镜可以包括:
存储有可执行程序代码的存储器801;
与存储器801耦合的处理器802;
其中,处理器802调用存储器801中存储的可执行程序代码,执行图1~图3任意一种基于视觉跟踪的报读控制方法中的全部或部分步骤。
此外,本申请实施例进一步公开了一种计算机可读存储介质,其存储用于电子数据交换的计算机程序,其中,该计算机程序使得计算机执行图1~图3任意一种基于视觉跟踪的报读控制方法中的全部或部分步骤。
此外,本申请实施例进一步公开一种计算机程序产品,当该计算机程序产品在计算机上运行时,使得计算机图1~图3任意一种基于视觉跟踪的报读控制方法中的全部或部分步骤。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质包括只读存储器(Read-Only Memory,ROM)、随机存储器(Random Access Memory,RAM)、可编程只读存储器(Programmable Read-only Memory,PROM)、可擦除可编程只读存储器(Erasable Programmable Read Only Memory,EPROM)、一次可编程只读存储器(One-time Programmable Read-Only Memory,OTPROM)、电子抹除式可复写只读存储器(Electrically-Erasable Programmable Read-Only Memory,EEPROM)、只读光盘(CompactDisc Read-Only Memory,CD-ROM)或其他光盘存储器、磁盘存储器、磁带存储器、或者能够用于携带或存储数据的计算机可读的任何其他介质。
以上对本申请实施例公开的一种基于视觉跟踪的报读控制方法、智能眼镜及***进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (10)

1.一种基于视觉跟踪的报读控制方法,其特征在于,包括:
获取用户的视觉焦点;
对所述视觉焦点进行跟踪定位,获取对应于所述视觉焦点的定位位置的报读内容;
报读所述报读内容。
2.根据权利要求1所述的报读控制方法,其特征在于,在报读所述报读内容之后,所述方法还包括:
获取用户发出的第一语音指令;
判断所述第一语音指令是否包含对所述报读内容包括的第一特指内容的第一操作指令;
若包含,对所述第一特指内容执行所述第一操作指令对应的操作。
3.根据权利要求1所述的报读控制方法,其特征在于,在报读所述报读内容之后,所述方法还包括:
检测所述视觉焦点的定位位置所处区域的第一操作手势;
获取所述第一操作手势对应的第二操作指令,所述第二操作指令是针对所述报读内容包括的第二特指内容的第二操作指令;
对所述第二特指内容执行所述第二操作指令对应的操作。
4.根据权利要求1所述的报读控制方法,其特征在于,在报读所述报读内容之后,所述方法还包括:
检测所述视觉焦点的定位位置所处区域的第二操作手势;
检测用户发出的第二语音指令;
判断所述第二语音指令是否包含对所述报读内容包括的第三特指内容的第三操作指令;其中,所述第三特指内容由所述第二操作手势从所述报读内容中确定;
若包含,对所述第三特指内容执行所述第三操作指令对应的操作。
5.根据权利要求1~4任一项所述的报读控制方法,其特征在于,所述方法还包括:
输出所述报读内容至输出设备上显示。
6.一种智能眼镜,其特征在于,包括:
焦点获取单元,用于获取用户的视觉焦点;
视觉跟踪单元,用于对所述视觉焦点进行跟踪定位,获取对应于所述视觉焦点的定位位置的报读内容;
报读单元,用于报读所述报读内容。
7.根据权利要求6所述的智能眼镜,其特征在于,所述智能眼镜还包括:
第一获取单元,用于在所述报读单元报读所述报读内容之后,获取用户发出的第一语音指令;
第一判断单元,用于判断所述第一语音指令是否包含对所述报读内容包括的第一特指内容的第一操作指令;
第一执行单元,用于当所述第一判断单元判断出所述第一语音指令包括对所述报读内容包括的第一特指内容的第一操作指令时,对所述第一特指内容执行所述第一操作指令对应的操作。
8.根据权利要求6所述的智能眼镜,其特征在于,所述智能眼镜还包括:
第一检测单元,用于在所述报读单元报读所述报读内容之后,检测所述视觉焦点的定位位置所处区域的第一操作手势;
第二获取单元,用于获取所述第一操作手势对应的第二操作指令,所述第二操作指令是针对所述报读内容包括的第二特指内容的第二操作指令;
第二执行单元,用于对所述第二特指内容执行所述第二操作指令对应的操作。
9.根据权利要求6所述的智能眼镜,其特征在于,所述智能眼镜还包括:
第二检测单元,用于在所述报读单元报读所述报读内容之后,检测所述视觉焦点的定位位置所处区域的第二操作手势;
第三检测单元,用于检测用户发出的第二语音指令;
第二判断单元,用于判断所述第二语音指令是否包含对所述报读内容包括的第三特指内容的第三操作指令;其中,所述第三特指内容由所述第二操作手势从所述报读内容中确定;
第三执行单元,用于当所述第二判断单元判断出所述第二语音指令包括对所述报读内容包括的第三特指内容的第三操作指令时,对所述第三特指内容执行所述第三操作指令对应的操作。
10.一种基于视觉跟踪的报读控制***,其特征在于,包括:
智能眼镜,用于获取用户的视觉焦点;以及,对所述视觉焦点进行跟踪定位,获取对应于所述视觉焦点的定位位置的报读内容;以及,报读所述报读内容;
输出设备,用于显示所述报读内容;
通信设备,用于连接所述智能眼镜和所述输出设备。
CN201911136131.1A 2019-11-19 2019-11-19 一种基于视觉跟踪的报读控制方法、智能眼镜及*** Pending CN111176439A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911136131.1A CN111176439A (zh) 2019-11-19 2019-11-19 一种基于视觉跟踪的报读控制方法、智能眼镜及***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911136131.1A CN111176439A (zh) 2019-11-19 2019-11-19 一种基于视觉跟踪的报读控制方法、智能眼镜及***

Publications (1)

Publication Number Publication Date
CN111176439A true CN111176439A (zh) 2020-05-19

Family

ID=70657195

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911136131.1A Pending CN111176439A (zh) 2019-11-19 2019-11-19 一种基于视觉跟踪的报读控制方法、智能眼镜及***

Country Status (1)

Country Link
CN (1) CN111176439A (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105208194A (zh) * 2015-08-17 2015-12-30 努比亚技术有限公司 语音播报装置及方法
CN108762507A (zh) * 2018-05-30 2018-11-06 辽东学院 图像跟踪方法及装置
CN109389967A (zh) * 2018-09-04 2019-02-26 深圳壹账通智能科技有限公司 语音播报方法、装置、计算机设备及存储介质
CN208689267U (zh) * 2018-09-26 2019-04-02 上海肇观电子科技有限公司 一种智能眼镜焦点跟踪装置及智能眼镜
CN208722145U (zh) * 2018-09-26 2019-04-09 上海肇观电子科技有限公司 一种智能眼镜焦点跟踪装置及智能眼镜

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105208194A (zh) * 2015-08-17 2015-12-30 努比亚技术有限公司 语音播报装置及方法
CN108762507A (zh) * 2018-05-30 2018-11-06 辽东学院 图像跟踪方法及装置
CN109389967A (zh) * 2018-09-04 2019-02-26 深圳壹账通智能科技有限公司 语音播报方法、装置、计算机设备及存储介质
CN208689267U (zh) * 2018-09-26 2019-04-02 上海肇观电子科技有限公司 一种智能眼镜焦点跟踪装置及智能眼镜
CN208722145U (zh) * 2018-09-26 2019-04-09 上海肇观电子科技有限公司 一种智能眼镜焦点跟踪装置及智能眼镜

Similar Documents

Publication Publication Date Title
CN107193841B (zh) 媒体文件加速播放、传输及存储的方法和装置
CN108021320B (zh) 一种电子设备题目搜索方法及电子设备
US20140304605A1 (en) Information processing apparatus, information processing method, and computer program
CN106971723A (zh) 语音处理方法和装置、用于语音处理的装置
KR102284238B1 (ko) 입력 표시 장치, 입력 표시 방법, 및 프로그램
CN110502117B (zh) 电子终端中的截图方法以及电子终端
CN108958503A (zh) 输入方法和装置
CN109918685A (zh) 计算机辅助翻译方法、装置、计算机设备及存储介质
CN111680177A (zh) 数据搜索方法及电子设备、计算机可读存储介质
KR20240059509A (ko) 디스플레이 방법, 장치, 사전펜, 전자기기 및 저장 매체
CN111026901A (zh) 一种学习内容的搜索方法及学习设备
CN110858291A (zh) 字符切分方法及装置
CN112329563A (zh) 一种基于树莓派的智能阅读辅助方法及***
CN111176439A (zh) 一种基于视觉跟踪的报读控制方法、智能眼镜及***
CN111090383B (zh) 一种指令识别方法及电子设备
CN109739462A (zh) 一种内容输入的方法及装置
JP2006349845A (ja) 電子書籍表示装置
CN111077989B (zh) 一种基于电子设备的屏幕控制方法及电子设备
CN113709322A (zh) 一种扫描方法及其相关设备
CN108108350B (zh) 名词识别方法及装置
CN111079769A (zh) 一种书写内容的识别方法及电子设备
CN111327952A (zh) 视频切换处理方法和装置
CN111582281A (zh) 一种图片显示优化的方法、装置、电子设备和存储介质
CN110908556A (zh) 交互方法、交互装置、移动终端及计算机可读存储介质
CN111079498A (zh) 一种基于口型识别的学习功能切换方法及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination