CN109583401A - 一种自动生成答案的搜题方法及用户设备 - Google Patents

一种自动生成答案的搜题方法及用户设备 Download PDF

Info

Publication number
CN109583401A
CN109583401A CN201811482829.4A CN201811482829A CN109583401A CN 109583401 A CN109583401 A CN 109583401A CN 201811482829 A CN201811482829 A CN 201811482829A CN 109583401 A CN109583401 A CN 109583401A
Authority
CN
China
Prior art keywords
information
topic
answer
user
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201811482829.4A
Other languages
English (en)
Inventor
王培坤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong Genius Technology Co Ltd
Original Assignee
Guangdong Genius Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong Genius Technology Co Ltd filed Critical Guangdong Genius Technology Co Ltd
Priority to CN201811482829.4A priority Critical patent/CN109583401A/zh
Publication of CN109583401A publication Critical patent/CN109583401A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/414Extracting the geometrical structure, e.g. layout tree; Block segmentation, e.g. bounding boxes for graphics or text
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/08Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Multimedia (AREA)
  • Acoustics & Sound (AREA)
  • Human Computer Interaction (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Graphics (AREA)
  • Geometry (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明实施例涉及电子设备技术领域,公开了一种自动生成答案的搜题方法及用户设备,该方法包括:接收用户所拍摄的题目图像并识别题目图像;当识别出题目图像中的题干信息以及对应的答案填写位置后,识别题干信息的语义以确定出搜题意图信息和题干信息的关键字;查找与搜题意图信息和关键字匹配的答案信息;将答案信息填写至答案填写位置,以生成包含答案信息的图像并输出。实施上述方法,能够在用户搜索题目时,及时输出答案给用户。

Description

一种自动生成答案的搜题方法及用户设备
技术领域
本发明涉及电子设备技术领域,具体涉及一种自动生成答案的搜题方法及用户设备。
背景技术
目前的搜题软件都是通过光学字符识别技术或者以图搜图技术,针对用户所搜索的题目去题库中匹配出最相似的题目以获取对应的答案,然后再将匹配到的答案输出给用户。但是只有在题库中已经储存了用户所搜索的题目的前提下,搜题软件才能及时地将答案输出给用户。
如果在用户搜索题目时,题库中刚好没有这道题目,那么就只能通过扩充题库,将用户所搜索的题目储存至题库中后才能输出答案给用户。但是制作储存一道新题目是需要花费一定的时间的,等到题库中储存了用户所搜索的题目之后,用户可能已经通过其他渠道获取到了答案。
也就是说,若题库中未储存用户所搜索的题目,那么目前的搜题软件就无法及时地输出答案给用户。
发明内容
本发明实施例公开了一种自动生成答案的搜题方法及用户设备,能够在用户搜索题目时,及时输出答案给用户。
本发明实施例第一方面公开一种自动生成答案的搜题方法,包括:
接收用户所拍摄的题目图像并识别所述题目图像;
当识别出所述题目图像中的题干信息以及对应的答案填写位置后,识别所述题干信息的语义以确定搜题意图信息和所述题干信息的关键字;
查找与所述搜题意图信息和所述关键字匹配的答案信息;
将所述答案信息填写至所述答案填写位置,以生成包含所述答案信息的图像并输出。
作为一种可选的实施方式,在本发明实施例第一方面中,在所述查找与所述搜题意图信息和所述关键字匹配的答案信息之前,所述方法还包括:
输出第一提示信息,所述第一提示信息用于提示用户输入身份信息;
获取用户的身份信息并根据所述身份信息在数据库中确定出搜索范围;
以及,所述查找与所述搜题意图信息和所述关键字匹配的答案信息,包括:
在所述搜索范围中查找与所述搜题意图信息和所述关键字匹配的答案信息。
作为一种可选的实施方式,在本发明实施例第一方面中,在将所述答案信息填写至所述答案填写位置,以生成包含所述答案信息的图像并输出之后,所述方法还包括:
检测用户选择的菜单;
若用户所选择的菜单用于指示需要发音辅助,检测用户在所述包含所述答案信息的图像中的点击操作,以确定出需要发音辅助的目标区域;
分析所述目标区域中的目标题目和目标答案信息,以生成对应的目标语音信息输出。
作为一种可选的实施方式,在本发明实施例第一方面中,所述方法还包括:
在生成所述目标语音信息并输出之后,输出第二提示信息,所述第二提示信息用于提示用户跟读;
检测用户输入的待检验跟读语音信息,确定出所述待检验跟读语音信息与所述目标语音信息的相似度;
若所述相似度小于预设的阈值,再次输出所述目标语音信息。
作为一种可选的实施方式,在本发明实施例第一方面中,在所述接收用户所拍摄的题目图像并识别所述题目图像之后,所述方法还包括:
获取所述题目图像中的题干序号信息,以将所述题目图像分割成至少一张带序号的第一题目图像;其中,所述第一题目图像的序号与其所包括的题干序号信息相同;
按序号从小到大对所述第一题目图像进行排序,以得到排序结果;
根据所述排序结果在所述第一题目图像中依次确定出待处理题目图像并识别所述待处理题目图像;
以及,所述当识别出所述题目图像中的题干信息以及对应的答案填写位置后,识别所述题干信息的语义以确定搜题意图信息和所述题干信息的关键字,包括:
当识别出所述待处理题目图像中的题干信息以及对应的答案填写位置后,识别所述题干信息的语义以确定搜题意图信息和所述题干信息的关键字。
本发明实施例第二方面公开一种用户设备,包括:
接收单元,用于接收用户所拍摄的题目图像并识别所述题目图像;
识别单元,用于在识别出所述题目图像中的题干信息以及对应的答案填写位置后,识别所述题干信息的语义以确定搜题意图信息和所述题干信息的关键字;
查找单元,用于查找与所述搜题意图信息和所述关键字匹配的答案信息;
第一生成单元,用于将所述答案信息填写至所述答案填写位置,以生成包含所述答案信息的图像并输出。
作为一种可选的实施方式,在本发明实施例第二方面中,所述用户设备还包括:
第一提示单元,用于在所述查找单元查找出与所述搜题意图信息和所述关键字匹配的答案信息之前,输出第一提示信息,所述第一提示信息用于提示用户输入身份信息;
第一确定单元,用于获取用户的身份信息并根据所述身份信息在数据库中确定出搜索范围;
以及,所述查找单元,具体用于在所述第一确定单元确定出的搜索范围中查找与所述搜题意图信息和所述关键字匹配的答案信息。
作为一种可选的实施方式,在本发明实施例第二方面中,所述用户设备还包括:
第一检测单元,用于在所述第一生成单元将所述答案信息填写至所述答案填写位置,以生成包含所述答案信息的图像并输出之后,检测用户选择的菜单;
第二检测单元,用于在用户所选择的菜单用于指示需要发音辅助时,检测用户在所述包含所述答案信息的图像中的点击操作,以确定出需要发音辅助的目标区域;
第二生成单元,用于分析所述目标区域中的目标题目和目标答案信息,以生成对应的目标语音信息输出。
作为一种可选的实施方式,在本发明实施例第二方面中,所述用户设备还包括:
第二提示单元,用于在所述第二生成单元分析所述目标区域中的目标题目和目标答案信息,以生成对应的目标语音信息输出之后,输出第二提示信息,所述第二提示信息用于提示用户跟读;
第三检测单元,用于检测用户输入的待检验跟读语音信息,确定出所述待检验跟读语音信息与所述目标语音信息的相似度;
输出单元,用于在所述相似度小于预设的阈值时,再次输出所述目标语音信息。
作为一种可选的实施方式,在本发明实施例第二方面中,所述用户设备还包括:
分割单元,用于在所述接收单元接收用户所拍摄的题目图像并识别所述题目图像之后,获取所述题目图像中的题干序号信息,以将所述题目图像分割成至少一张带序号的第一题目图像;其中,所述第一题目图像的序号与其所包括的题干序号信息相同;
排序单元,用于按序号从小到大对所述第一题目图像进行排序,以得到排序结果;
第二确定单元,用于根据所述排序结果在所述第一题目图像中依次确定出待处理题目图像,并识别所述待处理题目图像;
以及,所述识别单元,具体用于当识别出所述待处理题目图像中的题干信息以及对应的答案填写位置后,识别所述题干信息的语义以确定搜题意图信息和所述题干信息的关键字。
本发明实施例第三方面公开一种用户设备,包括:
存储有可执行程序代码的存储器;
与所述存储器耦合的处理器;
所述处理器调用所述存储器中存储的所述可执行程序代码,执行本发明实施例第一方面公开的一种自动生成答案的搜题方法。
本发明实施例第四方面公开一种计算机可读存储介质,其存储计算机程序,其中,所述计算机程序使得计算机执行本发明实施例第一方面公开的一种自动生成答案的搜题方法。
本发明实施例第五方面公开一种计算机程序产品,当所述计算机程序产品在计算机上运行时,使得所述计算机执行本发明实施例第一方面的任意一种方法的部分或全部步骤。
本发明实施例第六方面公开一种应用发布平台,所述应用发布平台用于发布计算机程序产品,其中,当所述计算机程序产品在计算机上运行时,使得所述计算机执行本发明实施例第一方面的任意一种方法的部分或全部步骤。
与现有技术相比,本发明实施例具有以下有益效果:
本发明实施例中,用户设备可以分析用户所搜索题目的题干信息和题目图像中的对应答案填写位置后,进一步获得搜题意图和题干信息中的关键字,然后根据搜题意图和关键字匹配出对应的答案信息,最后将答案信息填写至题目图像中的答案填写位置,即可得到填写了该答案信息的图像并提供给用户。可以看出,本发明实施例不再基于题库去搜索题目,而是通过即时识别搜题意图,并根据搜题意图和关键字来快速获取答案,不仅能够在用户搜索题目时,及时输出答案给用户,提升用户的使用体验度,而且由于不再通过题库去匹配答案,也就是不用再去维护题库,节省了维护成本。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例公开的一种自动生成答案的搜题方法的流程示意图;
图2是本发明实施例公开的另一种自动生成答案的搜题方法的流程示意图;
图3是本发明实施例公开的另一种自动生成答案的搜题方法的流程示意图;
图4是本发明实施例公开的一种用户设备的结构示意图;
图5是本发明实施例公开的另一种用户设备的结构示意图;
图6是本发明实施例公开的另一种用户设备的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书中的术语“第一”、“第二”和“第三”等是用于区别不同的对象,而不是用于描述特定顺序。本发明实施例的术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、***、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
本发明实施例公开了一种自动生成答案的搜题方法及用户设备,能够在用户搜索题目时,及时输出答案给用户。
下面将结合具体实施例对本发明技术方案进行详细说明。
实施例一
请参阅图1,图1是本发明实施例公开的一种自动生成答案的搜题方法的流程示意图。如图1所示,该自动生成答案的搜题方法可以包括以下步骤:
101、用户设备接收用户所拍摄的题目图像并识别题目图像。
本发明实施例中,用户设备可以是平板电脑,智能手机、智能手表等,本发明实施例不作限定。
本发明实施例中,用户设备可以利用光学字符识别(Optical CharacterRecognition,OCR)技术识别用户所拍摄的题目图像。其中,OCR技术是一种通过扫描等光学输入方式将各种票据、报刊、书籍、文稿及其它印刷品的文字转化为图像信息,再利用文字识别技术将图像信息转化为可以使用的计算机输入技术。
作为一种可选的实施方式,用户设备在接收用户所拍摄的题目图像并识别题目图像之后,可以对题目图像进行预处理:即用户设备可以获取题目图像中的题干序号信息;并将题目图像分割成至少一张带序号的第一题目图像;其中,第一题目图像的序号与其所包括的题干序号信息相同;然后按序号从小到大对第一题目图像进行排序,以得到排序结果;最后根据排序结果在第一题目图像中依次确定出待处理题目图像并识别待处理题目图像。
之后用户设备可以根据排序结果依次对每一张待处理题目图像进行后续的答案查询以及输出。并按照先查询到答案先输出的方式,可以更快地将答案输出给用户,因为毕竟分割后的第一题目图像相比于题目图像内容更少,查询与生成对应答案所需的时间也就更短了。
作为另一种可选的实施方式,用户设备还可以在输出任一张第一题目图像所对应的答案之后,利用用户在阅读输出的答案的时间,处理下一张第一题目图像,以让搜题过程的时间规划更加合理。
102、用户设备在识别出题目图像中的题干信息以及对应的答案填写位置后,识别题干信息的语义以确定搜题意图信息和题干信息的关键字。
本发明实施例中,用户设备在别出题目图像中的题干信息以及对应的答案填写位置后,可以利用自然语言处理(Natural Language Processing,NLP)技术识别题干信息的语义以确定出搜题意图信息和题干信息的关键字。其中,NLP技术是人工智能的一个子领域,是一种处理人与计算机交互语言问题的技术。
103、用户设备查找与搜题意图信息和关键字匹配的答案信息。
本发明实施例中,用户设备可以利用穷举法在云端的数据库中查找与搜题意图信息和关键字匹配的答案信息。其中,该数据库中可以储存有字、词、拼音以及成语等数据,本发明实施例不作限定。由于数据库中储存的字、词、拼音以及成语都可以重复查询使用,可以节约数据库的维护成本。
本发明实施例中,所利用的穷举法的基本思想是根据题目的部分条件确定答案的大致范围,并在此范围内对所有可能的情况逐一验证,直到全部情况验证完毕。若某个情况验证符合题目的全部条件,则为本问题的一个解;若全部情况验证后都不符合题目的全部条件,则本题无解,穷举法也称为枚举法。
104、用户设备将答案信息填写至答案填写位置,以生成包含答案信息的图像并输出。
本发明实施例中,用户设备可以将查询到答案信息进行分类(例如,按题干序号进行分类),并根据分类结果将答案信息填写到识别出的对应答案填写位置中。
图1所描述的方法,用户设备可以分析用户所搜索题目的题干信息和题目图像中的对应答案填写位置后,进一步获得搜题意图和题干信息中的关键字,然后根据搜题意图和关键字匹配出对应的答案信息,最后将答案信息填写至题目图像中的答案填写位置,即可得到填写了该答案信息的图像并提供给用户。可以看出,本发明实施例不再基于题库去搜索题目,而是通过即时识别搜题意图,并根据搜题意图和关键字来快速获取答案,不仅能够在用户搜索题目时,及时输出答案给用户,提升用户的使用体验度,而且由于不再通过题库去匹配答案,也就是不用再去维护题库,节省了维护成本。
实施例二
请参阅图2,图2是本发明实施例公开的另一种自动生成答案的搜题方法的流程示意图。如图2所示,该自动生成答案的搜题方法可以包括以下步骤:
201-202;其中,步骤201-步骤202与实施例一中的步骤101-步骤102相同,在此不再赘述。
203、用户设备输出第一提示信息。
本发明实施例中,输出的第一提示信息用于提示用户输入身份信息;用户设备可以弹出对话框或者悬浮窗口,并在对话框或者悬浮窗口中以文字的形式显示第一提示信息;或者,用户设备可以根据第一提示信息的内容生成对应的提示语音信息并输出。
204、用户设备获取用户的身份信息并根据身份信息在数据库中确定出搜索范围。
本发明实施例中,用户设备获取的用户身份信息可以包括用户的年龄信息、年级信息等,本发明实施例不作限定。用户设备可以根据数据库中事先打好的标签,结合用户的年级信息确定出搜索范围。
例如,用户设备所获取的用户年级信息为小学5年级,则用户设备可以将数据库中打上“小学5年级”标签的数据收集起来作为搜索范围。
在实践中发现,为了节省用户设备的储存空间,一般都把数据库中的内容储存在云端,即设置有一个云端数据库。但是用户设备每次查询答案都要到云端数据库中获取数据,就降低了查询速度,如果在网络质量不好的情况下,查询的速度将更慢。
作为一种可选的实施方式,用户设备可以根据用户的身份信息在数据库中确定出搜索范围,并在获得用户同意的情况下,将搜索范围内的数据缓存到用户设备的本地数据库中。之后只要是该用户使用搜题服务,用户设备就可以直接从本地数据库中查询答案信息,加快了查询速度;另外,由于所缓存的搜索范围对应的数据只是云端数据库中的部分内容,所占的储存空间并不大;另外,通过牺牲少量的储存空间来获取更快的查询速度,可以提升用户的使用体验度。
205、用户设备在上述搜索范围中查找与搜题意图信息和关键字匹配的答案信息。
206;其中,步骤206与实施例一中的步骤104相同,在此不再赘述。
图2所描述的方法与图1所描述的方法相比较,还可以根据用户的身份信息,例如年级信息、年龄信息等,在数据库中确定出搜索范围。这样即可以缩小搜索范围,提高搜索速度;而且由于不同年级的解题思路是不一样的,所以根据用户的身份信息确定出搜索范围,还能够以用户所对应年级的知识层面去查询答案,以让用户能够理解用户设备所查询出来的答案。
实施例三
请参阅图3,图3是本发明实施例公开的另一种自动生成答案的搜题方法的流程示意图。如图3所示,该自动生成答案的搜题方法可以包括以下步骤:
301-304;其中,步骤301-步骤304与实施例一中的步骤101-步骤104相同,在此不再赘述。
305、用户设备检测用户选择的菜单。
作为一种可选的实施方式,用户设备可以检测用户所选择的菜单,并在用户所选择的菜单用于指示需要词语解释辅助时,检测用户在包含答案信息的图像中的点击操作,以确定出需要词语解释辅助的目标词语;当用户设备在数据库查询到该词语对应的解释内容时,在目标词语的周围显示对话框,并将查询到的解释内容显示到对话框中。
实施上述方式,为用户提供一种词语解释的辅助方法,能够让用户快速获得词语的解释内容。省去了翻书查字典的过程,提升了用户的使用体验度。
306、用户设备在用户所选择的菜单用于指示需要发音辅助时,检测用户在包含答案信息的图像中的点击操作,以确定出需要发音辅助的目标区域。
本发明实施例中,用户设备可以识别用户在显示屏中的点击操作,在包含答案信息的图像中确定出一个区域,例如:一个成语,一个拼音等。用户设备将该区域内的内容确定为需要发音辅助的目标区域。
307、用户设备分析目标区域中的目标题目和目标答案信息,以生成对应的目标语音信息输出。
本发明实施例中,用户设备可以通过OCR技术识别目标区域中的目标题目和目标答案信息并转化成文字信息(因为目标区域是从包含答案信息的图像中截取出来的,还是图像,所以需要先转换成文字),再通过文字语音转换技术,将上述文字信息转换成语音信息并输出。
其中,所输出的语音信息可以进行调整,例如可以用动画人物的声音来输出语音信息,这样可以提高趣味性。
作为一种可选的实施方式,用户设备在生成目标语音信息并输出之后,可以输出第二提示信息,该第二提示信息用于提示用户跟读;再检测用户输入的待检验跟读语音信息,并确定出待检验跟读语音信息与目标语音信息的相似度;若确定出的相似度小于预设的阈值,再次输出目标语音信息。
其中,用户设备可以弹出对话框或者悬浮窗口,并在对话框或者悬浮窗口中以文字的形式显示第二提示信息;或者,用户设备可以根据第二提示信息的内容生成对应的提示语音信息并输出。
实施上述方法,为用户提供了一种语音跟读以及检验的方法,可以有效地矫正用户的文字发音,提升用户的学习效率。
图3所描述的方法与图1所描述的方法相比较,还可以针对用户设备所输出的答案信息中某些发音容易读不准的文字或者拼音(例如,拼音中的前后鼻音),提供一种发音辅助的方法,以辅助用户发出正确的读音。
实施例四
请参阅图4,图4是本发明实施例公开的一种用户设备的结构示意图。如
图4所示,该用户设备可以包括:
接收单元401,用于接收用户所拍摄的题目图像并识别题目图像;
,用于在识别出题目图像中的题干信息以及对应的答案填写位置后,识别题干信息的语义以确定搜题意图信息和题干信息的关键字;
查找单元403,用于查找与搜题意图信息和关键字匹配的答案信息;
第一生成单元404,用于将答案信息填写至答案填写位置,以生成包含答案信息的图像并输出。
作为一种可选的实施方式,识别单元402可以在第一生成单元404输出任一张第一题目图像所对应的答案之后,利用用户在阅读输出的答案的时间,处理下一张第一题目图像,以让搜题过程的时间规划更加合理
图4所描述的用户设备,可以分析用户所搜索题目的题干信息和题目图像中的对应答案填写位置后,进一步获得搜题意图和题干信息中的关键字,然后根据搜题意图和关键字匹配出对应的答案信息,最后将答案信息填写至题目图像中的答案填写位置,即可得到填写了该答案信息的图像并提供给用户。可以看出,本发明实施例不再基于题库去搜索题目,而是通过即时识别搜题意图,并根据搜题意图和关键字来快速获取答案,不仅能够在用户搜索题目时,及时输出答案给用户,提升用户的使用体验度,而且由于不再通过题库去匹配答案,也就是不用再去维护题库,节省了维护成本。
实施例五
请参阅图5,图5是本发明实施例公开的另一种用户设备的结构示意图。其中,图5所示的用户设备是由图4所示的用户设备进行优化得到的。与图4所示的用户设备相比较,图5所示的用户设备还可以包括:
第一提示单元405,用于在查找单元403查找出与搜题意图信息和关键字匹配的答案信息之前,输出第一提示信息,该第一提示信息用于提示用户输入身份信息;第一提示单元
第一确定单元406,用于获取用户的身份信息并根据身份信息在数据库中确定出搜索范围;
以及,查找单元403,具体用于在第一确定单元406确定出的搜索范围中查找与搜题意图信息和关键字匹配的答案信息;
第一检测单元407,用于在第一生成单元404将答案信息填写至答案填写位置,以生成包含答案信息的图像并输出之后,检测用户选择的菜单;
第二检测单元408,用于在用户所选择的菜单用于指示需要发音辅助时,检测用户在包含答案信息的图像中的点击操作,以确定出需要发音辅助的目标区域;
第二生成单元409,用于分析目标区域中的目标题目和目标答案信息,以生成对应的目标语音信息输出;
第二提示单元410,用于在第二生成单元409分析目标区域中的目标题目和目标答案信息,以生成对应的目标语音信息输出之后,输出第二提示信息,该第二提示信息用于提示用户跟读;
第三检测单元411,用于检测用户输入的待检验跟读语音信息,确定出待检验跟读语音信息与目标语音信息的相似度;
输出单元412,用于在确定出的相似度小于预设的阈值时,再次输出目标语音信息;
分割单元413,用于在接收单元401接收用户所拍摄的题目图像并识别题目图像之后,获取题目图像中的题干序号信息,以将题目图像分割成至少一张带序号的第一题目图像;其中,第一题目图像的序号与其所包括的题干序号信息相同;
排序单元414,用于按序号从小到大对第一题目图像进行排序,以得到排序结果;
第二确定单元415,用于根据排序结果在第一题目图像中依次确定出待处理题目图像,并识别待处理题目图像;
以及,识别单元402,具体用于当识别出待处理题目图像中的题干信息以及对应的答案填写位置后,识别题干信息的语义以确定搜题意图信息和题干信息的关键字。
作为一种可选的实施方式,第一提示单元405可以通过弹出对话框或者悬浮窗口,并在对话框或者悬浮窗口中以文字的形式显示第一提示信息;或者,第一提示单元405可以内置有语音模块,用于根据第一提示信息的内容生成对应的提示语音信息并输出。
作为一种可选的实施方式,第一确定单元406可以根据用户的身份信息在数据库中确定出搜索范围,并在获得用户同意的情况下,将搜索范围内的数据缓存到用户设备的本地数据库中。之后只要是该用户使用搜题服务,第一确定单元406就可以直接从本地数据库中查询答案信息,加快了查询速度;另外,由于所缓存的搜索范围对应的数据只是云端数据库中的部分内容,所占的储存空间并不大;另外,通过牺牲少量的储存空间来获取更快的查询速度,可以提升用户的使用体验度。
作为一种可选的实施方式,第二检测单元408还可以在用户所选择的菜单用于指示需要词语解释辅助时,检测用户在包含答案信息的图像中的点击操作,以确定出需要词语解释辅助的目标词语;当在数据库查询到该词语对应的解释内容时,第二检测单元408在目标词语的周围显示对话框,并将查询到的解释内容显示到对话框中。
实施上述方式,为用户提供一种词语解释的辅助方法,能够让用户快速获得词语的解释内容。省去了翻书查字典的过程,提升了用户的使用体验度。
与图4所示的用户设备相比较,图5所示的用户设备还可以根据用户的身份信息,例如年级信息、年龄信息等,在数据库中确定出搜索范围。这样即可以缩小搜索范围,提高搜索速度;而且由于不同年级的解题思路是不一样的,所以根据用户的身份信息确定出搜索范围,还能够以用户所对应年级的知识层面去查询答案,以让用户能够理解所查询出的答案;以及,还可以针对用户设备所输出的答案信息中某些发音容易读不准的文字或者拼音(例如,拼音中的前后鼻音),提供一种发音辅助的方法,以辅助用户发出正确的读音。
实施例六
请参阅图6,图6是本发明实施例公开的另一种用户设备的结构示意图。如图6所示,该用户设备可以包括:
存储有可执行程序代码的存储器601;
与存储器601耦合的处理器602;
其中,处理器602调用存储器601中存储的可执行程序代码,执行图1~图3任意一种自动生成答案的搜题方法。
本发明实施例公开一种计算机可读存储介质,其存储计算机程序,其中,该计算机程序使得计算机执行图1~图3任意一种自动生成答案的搜题方法。
本发明实施例还公开一种应用发布平台,其中,应用发布平台用于发布计算机程序产品,其中,当计算机程序产品在计算机上运行时,使得计算机执行如以上各方法实施例中的方法的部分或全部步骤。
在本发明的各种实施例中,应理解,上述各过程的序号的大小并不意味着执行顺序的必然先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
上述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物单元,即可位于一个地方,或者也可以分布到多个网络单元上。可根据实际的需要选择其中的部分或全部单元来实现本实施例方案的目的。
另外,在本发明各实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
上述集成的单元若以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可获取的存储器中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或者部分,可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储器中,包括若干请求用以使得一台计算机设备(可以为个人计算机、服务器或者网络设备等,具体可以是计算机设备中的处理器)执行本发明的各个实施例上述方法的部分或全部步骤。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质包括只读存储器(Read-Only Memory,ROM)、随机存储器(Random Access Memory,RAM)、可编程只读存储器(Programmable Read-only Memory,PROM)、可擦除可编程只读存储器(Erasable Programmable Read Only Memory,EPROM)、一次可编程只读存储器(One-time Programmable Read-Only Memory,OTPROM)、电子抹除式可复写只读存储器(Electrically-Erasable Programmable Read-Only Memory,EEPROM)、只读光盘(CompactDisc Read-Only Memory,CD-ROM)或其他光盘存储器、磁盘存储器、磁带存储器、或者能够用于携带或存储数据的计算机可读的任何其他介质。
以上对本发明实施例公开的一种自动生成答案的搜题方法及用户设备进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (10)

1.一种自动生成答案的搜题方法,其特征在于,包括:
接收用户所拍摄的题目图像并识别所述题目图像;
当识别出所述题目图像中的题干信息以及对应的答案填写位置后,识别所述题干信息的语义以确定搜题意图信息和所述题干信息的关键字;
查找与所述搜题意图信息和所述关键字匹配的答案信息;
将所述答案信息填写至所述答案填写位置,以生成包含所述答案信息的图像并输出。
2.根据权利要求1所述的方法,其特征在于,在所述查找与所述搜题意图信息和所述关键字匹配的答案信息之前,所述方法还包括:
输出第一提示信息,所述第一提示信息用于提示用户输入身份信息;
获取用户的身份信息并根据所述身份信息在数据库中确定出搜索范围;
以及,所述查找与所述搜题意图信息和所述关键字匹配的答案信息,包括:
在所述搜索范围中查找与所述搜题意图信息和所述关键字匹配的答案信息。
3.根据权利要求1或2所述的方法,其特征在于,在将所述答案信息填写至所述答案填写位置,以生成包含所述答案信息的图像并输出之后,所述方法还包括:
检测用户选择的菜单;
若用户所选择的菜单用于指示需要发音辅助,检测用户在所述包含所述答案信息的图像中的点击操作,以确定出需要发音辅助的目标区域;
分析所述目标区域中的目标题目和目标答案信息,以生成对应的目标语音信息输出。
4.根据权利要求3所述的方法,其特征在于,所述方法还包括:
在生成所述目标语音信息并输出之后,输出第二提示信息,所述第二提示信息用于提示用户跟读;
检测用户输入的待检验跟读语音信息,确定出所述待检验跟读语音信息与所述目标语音信息的相似度;
若所述相似度小于预设的阈值,再次输出所述目标语音信息。
5.根据权利要求1所述的方法,其特征在于,在所述接收用户所拍摄的题目图像并识别所述题目图像之后,所述方法还包括:
获取所述题目图像中的题干序号信息,以将所述题目图像分割成至少一张带序号的第一题目图像;其中,所述第一题目图像的序号与其所包括的题干序号信息相同;
按序号从小到大对所述第一题目图像进行排序,以得到排序结果;
根据所述排序结果在所述第一题目图像中依次确定出待处理题目图像并识别所述待处理题目图像;
以及,所述当识别出所述题目图像中的题干信息以及对应的答案填写位置后,识别所述题干信息的语义以确定搜题意图信息和所述题干信息的关键字,包括:
当识别出所述待处理题目图像中的题干信息以及对应的答案填写位置后,识别所述题干信息的语义以确定搜题意图信息和所述题干信息的关键字。
6.一种用户设备,其特征在于,包括:
接收单元,用于接收用户所拍摄的题目图像并识别所述题目图像;
识别单元,用于在识别出所述题目图像中的题干信息以及对应的答案填写位置后,识别所述题干信息的语义以确定搜题意图信息和所述题干信息的关键字;
查找单元,用于查找与所述搜题意图信息和所述关键字匹配的答案信息;
第一生成单元,用于将所述答案信息填写至所述答案填写位置,以生成包含所述答案信息的图像并输出。
7.根据权利要求6所述的用户设备,其特征在于,所述用户设备还包括:
第一提示单元,用于在所述查找单元查找出与所述搜题意图信息和所述关键字匹配的答案信息之前,输出第一提示信息,所述第一提示信息用于提示用户输入身份信息;
第一确定单元,用于获取用户的身份信息并根据所述身份信息在数据库中确定出搜索范围;
以及,所述查找单元,具体用于在所述第一确定单元确定出的搜索范围中查找与所述搜题意图信息和所述关键字匹配的答案信息。
8.根据权利要求6或7所述的用户设备,其特征在于,所述用户设备还包括:
第一检测单元,用于在所述第一生成单元将所述答案信息填写至所述答案填写位置,以生成包含所述答案信息的图像并输出之后,检测用户选择的菜单;
第二检测单元,用于在用户所选择的菜单用于指示需要发音辅助时,检测用户在所述包含所述答案信息的图像中的点击操作,以确定出需要发音辅助的目标区域;
第二生成单元,用于分析所述目标区域中的目标题目和目标答案信息,以生成对应的目标语音信息输出。
9.根据权利要求8所述的用户设备,其特征在于,所述用户设备还包括:
第二提示单元,用于在所述第二生成单元分析所述目标区域中的目标题目和目标答案信息,以生成对应的目标语音信息输出之后,输出第二提示信息,所述第二提示信息用于提示用户跟读;
第三检测单元,用于检测用户输入的待检验跟读语音信息,确定出所述待检验跟读语音信息与所述目标语音信息的相似度;
输出单元,用于在所述相似度小于预设的阈值时,再次输出所述目标语音信息。
10.根据权利要求6所述的用户设备,其特征在于,所述用户设备还包括:
分割单元,用于在所述接收单元接收用户所拍摄的题目图像并识别所述题目图像之后,获取所述题目图像中的题干序号信息,以将所述题目图像分割成至少一张带序号的第一题目图像;其中,所述第一题目图像的序号与其所包括的题干序号信息相同;
排序单元,用于按序号从小到大对所述第一题目图像进行排序,以得到排序结果;
第二确定单元,用于根据所述排序结果在所述第一题目图像中依次确定出待处理题目图像,并识别所述待处理题目图像;
以及,所述识别单元,具体用于当识别出所述待处理题目图像中的题干信息以及对应的答案填写位置后,识别所述题干信息的语义以确定搜题意图信息和所述题干信息的关键字。
CN201811482829.4A 2018-12-05 2018-12-05 一种自动生成答案的搜题方法及用户设备 Pending CN109583401A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811482829.4A CN109583401A (zh) 2018-12-05 2018-12-05 一种自动生成答案的搜题方法及用户设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811482829.4A CN109583401A (zh) 2018-12-05 2018-12-05 一种自动生成答案的搜题方法及用户设备

Publications (1)

Publication Number Publication Date
CN109583401A true CN109583401A (zh) 2019-04-05

Family

ID=65926467

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811482829.4A Pending CN109583401A (zh) 2018-12-05 2018-12-05 一种自动生成答案的搜题方法及用户设备

Country Status (1)

Country Link
CN (1) CN109583401A (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111027537A (zh) * 2019-05-05 2020-04-17 广东小天才科技有限公司 一种搜题方法及电子设备
CN111093046A (zh) * 2019-04-22 2020-05-01 广东小天才科技有限公司 一种基于图像采集设备的显示屏开启方法及终端设备
CN111552947A (zh) * 2020-04-30 2020-08-18 尚杰 一种教育答题处理方法和装置
CN112000798A (zh) * 2019-05-27 2020-11-27 广东小天才科技有限公司 一种语文题型的答案获取方法及装置
CN112000796A (zh) * 2020-08-05 2020-11-27 深圳中兴网信科技有限公司 答案生成方法、电子设备和计算机可读存储介质
CN112270295A (zh) * 2020-11-13 2021-01-26 广东小天才科技有限公司 学生作业场景下的框题方法及装置、终端设备及存储介质
CN112288058A (zh) * 2020-11-05 2021-01-29 杭州师范大学 一种基于增强现实的答案智能填写方法
CN113673475A (zh) * 2021-09-01 2021-11-19 北京云蝶智学科技有限公司 基于图像信息的答题方法

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103902652A (zh) * 2014-02-27 2014-07-02 深圳市智搜信息技术有限公司 自动问答***
CN106021615A (zh) * 2016-07-01 2016-10-12 广东小天才科技有限公司 题目搜索优化方法及装置
CN107067833A (zh) * 2017-02-15 2017-08-18 山东顺势教育科技有限公司 一种语音识别及测评***
CN107330040A (zh) * 2017-06-27 2017-11-07 李博 一种学习题目搜索方法及其***
CN108052687A (zh) * 2018-01-29 2018-05-18 赵宇航 一种基于互联网的教育信息搜索***
CN108090135A (zh) * 2017-11-28 2018-05-29 广东小天才科技有限公司 拍照搜题方法、装置、服务器及存储介质
CN108133209A (zh) * 2016-12-01 2018-06-08 北京新唐思创教育科技有限公司 一种文本识别中的目标区域搜索方法及其装置
CN108287895A (zh) * 2018-01-19 2018-07-17 广东小天才科技有限公司 一种基于显性框调节的搜题方法及***、手持拍照设备

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103902652A (zh) * 2014-02-27 2014-07-02 深圳市智搜信息技术有限公司 自动问答***
CN106021615A (zh) * 2016-07-01 2016-10-12 广东小天才科技有限公司 题目搜索优化方法及装置
CN108133209A (zh) * 2016-12-01 2018-06-08 北京新唐思创教育科技有限公司 一种文本识别中的目标区域搜索方法及其装置
CN107067833A (zh) * 2017-02-15 2017-08-18 山东顺势教育科技有限公司 一种语音识别及测评***
CN107330040A (zh) * 2017-06-27 2017-11-07 李博 一种学习题目搜索方法及其***
CN108090135A (zh) * 2017-11-28 2018-05-29 广东小天才科技有限公司 拍照搜题方法、装置、服务器及存储介质
CN108287895A (zh) * 2018-01-19 2018-07-17 广东小天才科技有限公司 一种基于显性框调节的搜题方法及***、手持拍照设备
CN108052687A (zh) * 2018-01-29 2018-05-18 赵宇航 一种基于互联网的教育信息搜索***

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
胡昌龙: "《虚拟社会网络下群行为感知与规律研究》", 30 November 2016 *

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111093046A (zh) * 2019-04-22 2020-05-01 广东小天才科技有限公司 一种基于图像采集设备的显示屏开启方法及终端设备
CN111093046B (zh) * 2019-04-22 2021-04-30 广东小天才科技有限公司 一种基于图像采集设备的显示屏开启方法及终端设备
CN111027537A (zh) * 2019-05-05 2020-04-17 广东小天才科技有限公司 一种搜题方法及电子设备
CN111027537B (zh) * 2019-05-05 2024-03-22 广东小天才科技有限公司 一种搜题方法及电子设备
CN112000798A (zh) * 2019-05-27 2020-11-27 广东小天才科技有限公司 一种语文题型的答案获取方法及装置
CN111552947A (zh) * 2020-04-30 2020-08-18 尚杰 一种教育答题处理方法和装置
CN112000796A (zh) * 2020-08-05 2020-11-27 深圳中兴网信科技有限公司 答案生成方法、电子设备和计算机可读存储介质
CN112288058A (zh) * 2020-11-05 2021-01-29 杭州师范大学 一种基于增强现实的答案智能填写方法
CN112270295A (zh) * 2020-11-13 2021-01-26 广东小天才科技有限公司 学生作业场景下的框题方法及装置、终端设备及存储介质
CN113673475A (zh) * 2021-09-01 2021-11-19 北京云蝶智学科技有限公司 基于图像信息的答题方法

Similar Documents

Publication Publication Date Title
CN109583401A (zh) 一种自动生成答案的搜题方法及用户设备
CN105931644B (zh) 一种语音识别方法及移动终端
CN106156365B (zh) 一种知识图谱的生成方法及装置
CN109493850B (zh) 成长型对话装置
CN107291783B (zh) 一种语义匹配方法及智能设备
CN110210029A (zh) 基于垂直领域的语音文本纠错方法、***、设备及介质
CN104598644B (zh) 喜好标签挖掘方法和装置
CN108447471A (zh) 语音识别方法及语音识别装置
CN109725732B (zh) 一种知识点的查询方法及家教设备
CN107169430A (zh) 基于图像处理语义分析的阅读环境音效增强***及方法
CN110047467B (zh) 语音识别方法、装置、存储介质及控制终端
US20040163035A1 (en) Method for automatic and semi-automatic classification and clustering of non-deterministic texts
CN108399157B (zh) 实体与属性关系的动态抽取方法、服务器及可读存储介质
CN110516259B (zh) 一种技术关键词的识别方法、装置、计算机设备和存储介质
CN108920450A (zh) 一种基于电子设备的知识点复习方法及电子设备
US20090276411A1 (en) Issue trend analysis system
CN111488468A (zh) 地理信息知识点抽取方法、装置、存储介质及计算机设备
CN112256845A (zh) 意图识别方法、装置、电子设备和计算机可读存储介质
JP2017016296A (ja) 画像表示装置
CN108710653B (zh) 一种绘本朗读点播方法、装置及***
CN111782793A (zh) 智能客服处理方法和***及设备
CN111128179A (zh) 一种基于语音识别技术的智慧监管方法及***
CN109783613A (zh) 一种搜题方法及***
CN111046201A (zh) 一种基于计算机软件的垃圾分类模拟***
CN109408175B (zh) 通用高性能深度学习计算引擎中的实时交互方法及***

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20190405

RJ01 Rejection of invention patent application after publication