CN112000798A - 一种语文题型的答案获取方法及装置 - Google Patents
一种语文题型的答案获取方法及装置 Download PDFInfo
- Publication number
- CN112000798A CN112000798A CN201910447861.7A CN201910447861A CN112000798A CN 112000798 A CN112000798 A CN 112000798A CN 201910447861 A CN201910447861 A CN 201910447861A CN 112000798 A CN112000798 A CN 112000798A
- Authority
- CN
- China
- Prior art keywords
- question
- topic
- word
- types
- database
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 58
- 238000012360 testing method Methods 0.000 claims abstract description 121
- 238000010276 construction Methods 0.000 claims abstract description 28
- 238000012549 training Methods 0.000 claims description 29
- 238000012423 maintenance Methods 0.000 abstract description 8
- 230000000692 anti-sense effect Effects 0.000 description 8
- 230000006870 function Effects 0.000 description 8
- 238000005516 engineering process Methods 0.000 description 4
- 230000009193 crawling Effects 0.000 description 2
- 238000005034 decoration Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000011835 investigation Methods 0.000 description 2
- 238000002372 labelling Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明属于智能学习设备领域,公开了一种语文题型的答案获取方法及装置,其方法包括:获取待解答试题;通过预先训练好的识别模型,识别出待解答试题对应的题目题型、题目意图和题目词槽;根据待解答试题对应的题目题型、题目意图和题目词槽,在预先构建的数据库中查找待解答试题对应的答案。本发明先通过训练好的识别模型识别出待解答试题对应的题目题型、题目意图和题目词槽,然后根据题目题型和题目意图来查找每个题目词槽对应的答案,使得数据库中不需要存储与待解答试题完全相同的原题,同时,数据库中的答案可以应用于各种不同题目词槽组合而成的题目,使得数据库的建设成本和维护成本大大降低。
Description
技术领域
本发明属于智能学习设备技术领域,特别涉及一种语文题型的答案获取方法及装置。
背景技术
随着科学技术的快速发展,辅助学生学习的学习类产品越来越多。学习类产品中通常存储有大量的学习资源。学习类产品通过将学习资源按照一定的交互模式,并通过显示屏或者扬声器输出,从而能够较好的帮助用户理解或者掌握学习内容。
目前,比较常见的学习类产品为搜题或答疑,其主要是通过对试题进行拍照、扫描、键盘录入等方式将试题输入***,再通过OCR识别技术获取图片中的题目文字信息,然后从预先建立的实体题库中搜索到该题目文字信息对应的原题,然后获取该原题的答案,并将答案呈现给用户,从而辅导用户学习,为用户的学习带来极大的便利。
上述搜题方法,在实际使用过程中,为了提高用户搜索到题目答案的概率,需要建设非常庞大的实体题库,以使实体题库中包含更多的原题及答案。但是,建立庞大的题库,不仅建设成本巨大,而且维护成本也巨大。
发明内容
本发明的目的是提供一种语文题型的答案获取方法及装置,根据题目题型、题目意图和题目词槽来查找每个题目词槽对应的答案,使得数据库中不需要存储与上述待解答试题完全相同的原题,以降低数据库的建设成本和维护成本。
本发明提供的技术方案如下:
一方面,提供一种语文题型的答案获取方法,包括:
获取待解答试题;
通过预先训练好的识别模型,识别出所述待解答试题对应的题目题型、题目意图和题目词槽;
根据所述待解答试题对应的题目题型、题目意图和题目词槽,在预先构建的数据库中查找所述待解答试题对应的答案。
进一步优选地,所述识别模型的训练方法为:
收集大量语文题目素材;
标注所述语文题目素材中的每道题目的题目题型、题目意图和题目词槽;
将标注后的所述语文题目素材输入预先构建的识别模型进行训练,得到训练好的识别模型。
进一步优选地,所述数据库的构建方法为:
根据标注后的所述语文题目素材,收集并归纳语文科目对应的题目题型;
建立所述语文题目素材中的所述题目题型、所述题目意图与所述题目词槽之间的关联关系;其中,一个题目题型对应一个或多个题目意图;一个题目意图对应一个或多个题目词槽;
根据所述题目词槽对应的所述题目题型和所述题目意图,获取所述题目词槽对应的答案;
根据所述题目题型、所述题目意图、所述题目词槽和所述答案之间的关联关系,构建多个不同题目题型的数据库。
进一步优选地,所述根据所述题目题型、所述题目意图、所述题目词槽和所述答案之间的关联关系,构建多个不同题目题型的数据库具体包括:
根据所述题目题型的数量,构建多个不同题目题型的数据库;
将每个题目题型对应的题目意图、题目词槽以及题目词槽对应的答案分别存储在所述数据库中,并在存储时,将所述题目词槽作为实体、将对应的题目意图作为所述实体的属性,将对应的答案作为所述实体的属性值。
进一步优选地,根据所述待解答试题的题目题型、题目意图和题目词槽,在预先构建的数据库中查找所述待解答试题对应的答案具体包括:
根据所述待解答试题的题目题型,从预先构建的多个不同题目题型的数据库中查找到目标数据库;
根据所述待解答试题的题目意图和题目词槽,在所述目标数据库中查找对应的答案。
另一方面,还提供一种语文题型的答案获取装置,包括:
试题获取模块,用于获取待解答试题;
识别模块,用于通过预先训练好的识别模型,识别出所述待解答试题对应的题目题型、题目意图和题目词槽;
答案查找模块,用于根据所述待解答试题对应的题目题型、题目意图和题目词槽,在预先构建的数据库中查找所述待解答试题对应的答案。
进一步优选地,还包括模型训练模块;
所述模型训练模块包括:
素材收集单元,用于收集大量语文题目素材;
标注单元,用于标注所述语文题目素材中的每道题目的题目题型、题目意图和题目词槽;
模型训练单元,用于将标注后的所述语文题目素材输入预先构建的识别模型进行训练,得到训练好的识别模型。
进一步优选地,还包括数据库构建模块;
所述数据库构建模块包括:
题型收集单元,用于根据标注后的所述语文题目素材,收集并归纳语文科目对应的题目题型;
关系建立单元,用于建立所述语文题目素材中的所述题目题型、所述题目意图与所述题目词槽之间的关联关系;其中,一个题目题型对应一个或多个题目意图;一个题目意图对应一个或多个题目词槽;
答案获取单元,用于根据所述题目词槽对应的所述题目题型和所述题目意图,获取所述题目词槽对应的答案;
数据库构建单元,用于根据所述题目题型、所述题目意图、所述题目词槽和所述答案之间的关联关系,构建多个不同题目题型的数据库。
进一步优选地,所述数据库构建单元包括:
数据库构建子单元,用于根据所述题目题型的数量,构建多个不同题目题型的数据库;
存储子单元,用于将每个题目题型对应的题目意图、题目词槽以及题目词槽对应的答案分别存储在所述数据库中,并在存储时,将所述题目词槽作为实体、将对应的题目意图作为所述实体的属性,将对应的答案作为所述实体的属性值。
进一步优选地,所述答案查找模块包括:
数据库查找单元,用于根据所述待解答试题的题目题型,从预先构建的多个不同题目题型的数据库中查找到目标数据库;
答案查找单元,用于根据所述待解答试题的题目意图和题目词槽,在所述目标数据库中查找对应的答案。
与现有技术相比,本发明提供的一种语文题型的答案获取方法及装置具有的有益效果为:先通过训练好的识别模型识别出待解答试题对应的题目题型、题目意图和题目词槽,然后根据题目题型、题目意图和题目词槽来查找每个题目词槽对应的答案,使得数据库中不需要存储与上述待解答试题完全相同的原题,即存储的一个题目中需同时包括上述所有的题目词槽,同时,数据库中的答案可以应用于各种不同题目词槽组合而成的题目,使得数据库的建设成本和维护成本大大降低。
附图说明
下面将以明确易懂的方式,结合附图说明优选实施方式,对一种语文题型的答案获取方法及装置的上述特性、技术特征、优点及其实现方式予以进一步说明。
图1是本发明一种语文题型的答案获取方法的实施例一的流程示意图;
图2是本发明一种语文题型的答案获取方法的实施例二的流程示意图;
图3是本发明一种语文题型的答案获取方法的实施例三的流程示意图;
图4是本发明一种语文题型的答案获取方法的实施例四的流程示意图;
图5是本发明一种语文题型的答案获取装置的一个实施例的结构示意框图。
附图标号说明
100、试题获取模块; 200、识别模块;
300、答案查找模块; 310、数据库查找单元;
320、答案查找单元; 400、模型训练模块;
410、素材收集单元; 420、标注单元;
430、模型训练单元; 500、数据库构建模块;
510、题型收集单元; 520、关系建立单元;
530、答案获取单元; 540、数据库构建单元;
541、数据库构建子单元; 542、存储子单元。
具体实施方式
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对照附图说明本发明的具体实施方式。显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图,并获得其他的实施方式。
应当理解,当在本说明书和所附权利要求书中使用时,术语“包括”指示所述描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其他特征、整体、步骤、操作、元素、组件和/或集合的存在或添加。
为使图面简洁,各图中只示意性地表示出了与本发明相关的部分,它们并不代表其作为产品的实际结构。另外,以使图面简洁便于理解,在有些图中具有相同结构或功能的部件,仅示意性地绘示了其中的一个,或仅标出了其中的一个。在本文中,“一个”不仅表示“仅此一个”,也可以表示“多于一个”的情形。
本发明的语文题型的答案获取方法主要用于获取题目题型和知识点相对比较稳定的语文题目题型的答案,例如,语文科目中的根据拼音写汉字、根据汉字写拼音、填写词语同义词、填写词语近义词、填写成语中的某些字等题目题型。
图1是本发明实施例一提供的一种语文题型的答案获取方法的流程图,该方法可以应用于智能终端(例如:家教机,本实施例中为方便理解,都以家教机作为主语解释,但本领域的技术人员均明白该语文题型的答案获取方法也可以应用于其他智能终端设备,只要能实现相应功能即可);该语文题型的答案获取方法包括以下步骤:
S100获取待解答试题;
具体地,待解答试题的获取方法有多种:
第一种:用户通过家教机上的摄像头拍摄练习册或作业本上的待解答试题,得到待解答试题的图片,然后识别图片中的文本信息,该文本信息即为待解答试题的文本信息。
第二种:用户在家教机上通过家教机的截图功能获取用户选中的待解答试题的图片,然后将图片中的内容转换为文本信息,该文本信息即为待解答试题的文本信息。
当然,还可以是其他获取待解答试题的方式,如通过用户键盘输入或语音输入的方式获取。
S200通过预先训练好的识别模型,识别出所述待解答试题对应的题目题型、题目意图和题目词槽;
具体地,家教机获取到待解答试题后,将待解答试题输入到预先训练好的识别模型中,通过该识别模型识别出待解答试题对应的题目题型、题目意图和题目词槽。
语文科目中的题目题型可包括生字题目题型、词语题目题型、成语题目题型、拼音题目题型等。
生字题目题型对应的题目意图可以是填写包含某一部首的字、将生字加一笔组成新的字、将两个生字组成新字等。
词语题目题型对应的题目意图可以是填写词语的近义词、填写词语的反义词、词语造句、照样子写词语(胖胖的、明明白白)等。
成语题目题型对应的题目意图可以是填写成语中的某一个字、填写与成语语义相同的成语、填写成语语义等。
拼音题目题型对应的题目意图可以是根据拼音写汉字、根据汉字写拼音、给字选择正确拼音等。
题目词槽是指题目中的词,例如,题目为“填写温和的近义词”,该题目中的题目词槽为“温和”。再例如,题目为“填写美丽的拼音”,则该题目中的题目词槽为“美丽”。
示例性的,待解答试题为:
写出下列词语的近义词:
温和-()好像-()美丽-();
连忙-()居然-()高兴-()。
将该待解答试题输入识别模型后,识别模型识别出该待解答试题的题目题型为词语题目题型,题目意图为词语近义词,题目词槽分别为温和、好像、美丽、连忙、居然、高兴。
S300根据所述待解答试题对应的题目题型、题目意图和题目词槽,在预先构建的数据库中查找所述待解答试题对应的答案。
具体地,得到待解答试题对应的题目题型、题目意图和题目词槽后,根据题目题型、题目词槽和题目意图即可在预先构建的数据库中分别查找每个题目词槽对应的答案,即在数据库中分别查找温和的近义词、好像的近义词、美丽的近义词、连忙的近义词、居然的近义词以及高兴的近义词。
本实施例中,先通过训练好的识别模型识别出待解答试题对应的题目题型、题目意图和题目词槽,然后根据题目题型、题目意图和题目词槽来查找每个题目词槽对应的答案,使得数据库中不需要存储与上述待解答试题完全相同的原题,即存储的一个题目中需同时包括上述所有的题目词槽,同时,数据库中的答案可以应用于各种不同题目词槽组合而成的题目,使得数据库的建设成本和维护成本大大降低。
图2是本发明实施例二提供的一种语文题型的答案获取方法的流程图,该方法可以应用于智能终端(例如:家教机,本实施例中为方便理解,都以家教机作为主语解释,但本领域的技术人员均明白该语文题型的答案获取方法也可以应用于其他智能终端设备,只要能实现相应功能即可);该语文题型的答案获取方法包括以下步骤:
S010收集大量语文题目素材;
具体地,为了使生成的训练样本集包含的训练样本较丰富,需要收集大量不同题型的语文题目素材。
语文题目素材的收集方式有多种:
第一种:通过收集市面上的语文工具书,然后从收集的语文工具书中获取大量不同题型的语文题目素材。
第二种:通过网络爬虫技术去爬取网页中的题目,然后对题目进行归纳整理,得到大量语文题目素材。
S020标注所述语文题目素材中的每道题目的题目题型、题目意图和题目词槽;
具体地,收集大量语文题目素材后,标注出每道题目的题目题型、题目意图和题目词槽。
示例性的,题目1为:
填上合适的数字,组成成语。
()全()美()拿()稳()上()下()死()生
该题目标注出的题目题型为成语题型;题目意图为成语填字;()全()美的题目词槽为“全”和“美”;()拿()稳的题目词槽为“拿”和“稳”;()上()下的题目词槽为“上”和“下”;()死()生的题目词槽为“死”和“生”。
题目2为:辩字组词。
娇()摘()治()戚()
骄()滴()冶()威()
该题目标注的题目题型为词语题型;题目意图为组词;题目中的题目词槽分别为“娇”、“摘”、“治”、“戚”、“骄”、“滴”、“冶”、“威”。
S030将标注后的所述语文题目素材输入预先构建的识别模型进行训练,得到训练好的识别模型;
具体地,将上述标注好的大量语文题目作为训练样本集输入预先构建的识别模型进行训练,训练好的识别模型则可用于识别输入题目的题目题型、题目意图和题目词槽。预先构建的识别模型为根据开源算法构建的模型。
S100获取待解答试题;
S200通过预先训练好的识别模型,识别出所述待解答试题对应的题目题型、题目意图和题目词槽;
S300根据所述待解答试题对应的题目题型、题目意图和题目词槽,在预先构建的数据库中查找所述待解答试题对应的答案。
图3是本发明实施例三提供的一种语文题型的答案获取方法的流程图,该方法可以应用于智能终端(例如:家教机,本实施例中为方便理解,都以家教机作为主语解释,但本领域的技术人员均明白该语文题型的答案获取方法也可以应用于其他智能终端设备,只要能实现相应功能即可);该语文题型的答案获取方法包括以下步骤:
S010收集大量语文题目素材;
S020标注所述语文题目素材中的每道题目的题目题型、题目意图和题目词槽;
S030将标注后的所述语文题目素材输入预先构建的识别模型进行训练,得到训练好的识别模型;
S040根据标注后的所述语文题目素材,收集并归纳语文科目对应的题目题型;
具体地,标注出语文题目素材中的每道题目的题目题型后,根据标注的题目题型,对语文科目包含的所有题目题型进行分类整理,将属于同一类题型的题目分为一组。例如,将所有考察拼音的题型归为一类;将所有考察词语的题型归为一类;将所有考察成语的题型归为一类等等。
S050建立所述语文题目素材中的所述题目题型、所述题目意图与所述题目词槽之间的关联关系;其中,一个题目题型对应一个或多个题目意图;一个题目意图对应一个或多个题目词槽;
具体地,一个题目题型包含一个或多个题目意图;例如,词语题型中包含的题目意图可以是填写词语近义词、填写词语反义词、词语造句、照样子写词语等。一个题目意图又包含多个题目词槽,例如,填写词语近义词的题目意图中包括的题目词槽可为所有的词语。
根据收集的大量语文题目素材中标注的题目题型、题目意图和题目词槽,即可对所有的题目题型、题目意图和题目词槽进行归纳整理,并建立题目题型、题目意图与题目词槽之间的关联关系。
S060根据所述题目词槽对应的所述题目题型和所述题目意图,获取所述题目词槽对应的答案;
具体地,在建立了题目题型、题目意图和题目词槽之间的关联关系后,即可根据题目词槽对应的题目题型和题目意图,获取到每个题目词槽对应的题目意图的答案。
示例性的,题目词槽“温和”对应的题目题型为词语题型,对应的题目意图为近义词,则可获取题目词槽“温柔”对应的近义词答案为“柔顺”。
题目词槽“温和”对应的题目题型为词语题型,对应的题目意图为反义词,则获取题目词槽“温柔”对应的反义词答案为“暴烈”。
S070根据所述题目题型、所述题目意图、所述题目词槽和所述答案之间的关联关系,构建多个不同题目题型的数据库;
具体地,根据上述方法获取到每个题目词槽对应的题目意图的答案后,即可根据题目题型、题目意图、题目词槽和对应的答案,构建多个不同题目题型的数据库。即为每个题目题型构建一个数据库,将每个题型包括的题目意图、题目词槽和对应的答案都存储在对应的数据库中。
根据题目词槽和题目意图来构建数据库,数据库中只需要搜集存储大量的词语、以及常考的题目意图和对应的答案即可,存储的题目词槽、对应的题目意图和对应的答案可以应用于各个题目(各个不同题目词槽、不同题目意图组成的题目)中;数据库中不需要存储和待解答题目完全一样的题目,从而降低数据库的构建成本和维护成本。
例如,待解答试题1为:
写出下列词语的近义词:
温和-()好像-()美丽-();
连忙-()居然-()高兴-()。
待解答试题2为:
写出下列词语的近义词:
温和-()好像-()美丽-()。
现有的搜题方法构建的数据库中,则需要同时存储待解答试题1和待解答试题2,而在本方案中,是单独存储的题目词槽、题目意图和对应的答案,该单独存储的题目词槽、题目意图和对应的答案可同时应用于待解答试题1和待解答试题2。
S100获取待解答试题;
S200通过预先训练好的识别模型,识别出所述待解答试题对应的题目题型、题目意图和题目词槽;
S300根据所述待解答试题对应的题目题型、题目意图和题目词槽,在预先构建的数据库中查找所述待解答试题对应的答案。
优选地,步骤S300根据所述待解答试题对应的题目题型、题目意图和题目词槽,在预先构建的数据库中查找所述待解答试题对应的答案具体包括:
S310根据所述待解答试题的题目题型,从预先构建的多个不同题目题型的数据库中查找到目标数据库;
S320根据所述待解答试题的题目意图和题目词槽,在所述目标数据库中查找对应的答案。
具体地,在用户输入待解答试题后,通过训练好的识别模型识别出待解答试题的题目题型、题目意图和题目词槽,然后先根据待解答试题对应的题目题型,在多个数据库中查找到与待解答试题的题目题型对应的目标数据库。
然后在目标数据库中,根据待解答试题的题目意图和题目词槽,查找到每个题目词槽对应的答案。
本方案中,根据题目题型的数量构建多个数据库,可在搜索答案时,先根据题目题型确定目标数据库,然后根据题目意图和题目词槽搜索对应的答案,可减小搜索范围,提高搜索效率。
图4是本发明实施例四提供的一种语文题型的答案获取方法的流程图,该方法可以应用于智能终端(例如:家教机,本实施例中为方便理解,都以家教机作为主语解释,但本领域的技术人员均明白该语文题型的答案获取方法也可以应用于其他智能终端设备,只要能实现相应功能即可);该语文题型的答案获取方法包括以下步骤:
S010收集大量语文题目素材;
S020标注所述语文题目素材中的每道题目的题目题型、题目意图和题目词槽;
S030将标注后的所述语文题目素材输入预先构建的识别模型进行训练,得到训练好的识别模型;
S040根据标注后的所述语文题目素材,收集并归纳语文科目对应的题目题型;
S050建立所述语文题目素材中的所述题目题型、所述题目意图与所述题目词槽之间的关联关系;其中,一个题目题型对应一个或多个题目意图;一个题目意图对应一个或多个题目词槽;
S060根据所述题目词槽对应的所述题目题型和所述题目意图,获取所述题目词槽对应的答案;
S071根据所述题目题型的数量,构建多个不同题目题型的数据库;
具体地,根据题目题型的数量,构建多个不同题目题型的数据库,即一个数据库对应一个题目题型。
S072将每个题目题型对应的题目意图、题目词槽以及题目词槽对应的答案分别存储在所述数据库中,并在存储时,将所述题目词槽作为实体、将对应的题目意图作为所述实体的属性,将对应的答案作为所述实体的属性值;
具体地,在数据库中存储题目题型对应的题目词槽和题目意图时,可将题目词槽作为实体、将对应的题目意图作为实体的属性,将对应的答案作为实体的属性值进行存储。
示例性的,在词语题型对应的数据库中,题目词槽“温和”的属性有多个,分别为近义词、反义词、造句等,其每个属性对应的属性值分别为“柔顺”、“暴烈”、“温和的昆明、四季如春”。其存储的方式为(温和,近义词,柔顺),(温和,反义词,暴烈),(温和,造句,温和的昆明、四季如春)。
在数据库中,将题目意图、题目词槽和答案以实体、实体属性和实体属性值的方式进行存储,可方便答案的查找。例如,在查找答案时,还可根据答案查找题目词槽。
示例性的,若待解答试题的题目题型为词语题型,题目词槽为“柔顺”,题目意图为“近义词”,则根据数据库中存储的实体“温和”、属性“近义词”以及属性值“柔顺”,即(温和,近义词,柔顺),查找到题目词槽“柔顺”的近义词为“温和”。通过上述方式进行存储,不仅可根据题目词槽查找答案,而且还可根据答案查找题目词槽,减少数据库的题目词槽的存储量,且可降低数据库的构建成本。
S100获取待解答试题;
S200通过预先训练好的识别模型,识别出所述待解答试题对应的题目题型、题目意图和题目词槽;
S300根据所述待解答试题对应的题目题型、题目意图和题目词槽,在预先构建的数据库中查找所述待解答试题对应的答案。
应理解,在上述各实施例中,各步骤序号的大小并不意味着执行顺序的先后,各步骤的执行顺序应以功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
图5是本发明实施例五提供的一种语文题型的答案获取装置的结构示意框图,该语文题型的答案获取装置包括:
试题获取模块100,用于获取待解答试题;
具体地,待解答试题的获取方法有多种:
第一种:用户通过家教机上的摄像头拍摄练习册或作业本上的待解答试题,得到待解答试题的图片,然后识别图片中的文本信息,该文本信息即为待解答试题的文本信息。
第二种:用户在家教机上通过家教机的截图功能获取用户选中的待解答试题的图片,然后将图片中的内容转换为文本信息,该文本信息即为待解答试题的文本信息。
当然,还可以是其他获取待解答试题的方式,如通过用户键盘输入或语音输入的方式获取。
识别模块200,用于通过预先训练好的识别模型,识别出所述待解答试题对应的题目题型、题目意图和题目词槽;
具体地,家教机获取到待解答试题后,将待解答试题输入到预先训练好的识别模型中,通过该识别模型识别出待解答试题对应的题目题型、题目意图和题目词槽。
语文科目中的题目题型可包括生字题目题型、词语题目题型、成语题目题型、拼音题目题型等。
生字题目题型对应的题目意图可以是填写包含某一部首的字、将生字加一笔组成新的字、将两个生字组成新字等。
词语题目题型对应的题目意图可以是填写词语的近义词、填写词语的反义词、词语造句、照样子写词语(胖胖的、明明白白)等。
成语题目题型对应的题目意图可以是填写成语中的某一个字、填写与成语语义相同的成语、填写成语语义等。
拼音题目题型对应的题目意图可以是根据拼音写汉字、根据汉字写拼音、给字选择正确拼音等。
题目词槽是指题目中的词,例如,题目为“填写温和的近义词”,该题目中的题目词槽为“温和”。再例如,题目为“填写美丽的拼音”,则该题目中的题目词槽为“美丽”。
示例性的,待解答试题为:
写出下列词语的近义词:
温和-()好像-()美丽-();
连忙-()居然-()高兴-()。
将该待解答试题输入识别模型后,识别模型识别出该待解答试题的题目题型为词语题目题型,题目意图为词语近义词,题目词槽分别为温和、好像、美丽、连忙、居然、高兴。
答案查找模块300,用于根据所述待解答试题对应的题目题型、题目意图和题目词槽,在预先构建的数据库中查找所述待解答试题对应的答案。
具体地,得到待解答试题对应的题目题型、题目意图和题目词槽后,根据题目题型、题目词槽和题目意图即可在预先构建的数据库中分别查找每个题目词槽对应的答案,即在数据库中分别查找温和的近义词、好像的近义词、美丽的近义词、连忙的近义词、居然的近义词以及高兴的近义词。
本实施例中,先通过训练好的识别模型识别出待解答试题对应的题目题型、题目意图和题目词槽,然后根据题目题型、题目意图和题目词槽来查找每个题目词槽对应的答案,使得数据库中不需要存储与上述待解答试题完全相同的原题,即存储的一个题目中需同时包括上述所有的题目词槽,同时,数据库中的答案可以应用于各种不同题目词槽组合而成的题目,使得数据库的建设成本和维护成本大大降低。
优选地,还包括模型训练模块400;
模型训练模块400包括:
素材收集单元410,用于收集大量语文题目素材;
具体地,为了使生成的训练样本集包含的训练样本较丰富,需要收集大量不同题型的语文题目素材。
语文题目素材的收集方式有多种:
第一种:通过收集市面上的语文工具书,然后从收集的语文工具书中获取大量不同题型的语文题目素材。
第二种:通过网络爬虫技术去爬取网页中的题目,然后对题目进行归纳整理,得到大量语文题目素材。
标注单元420,用于标注所述语文题目素材中的每道题目的题目题型、题目意图和题目词槽;
具体地,收集大量语文题目素材后,标注出每道题目的题目题型、题目意图和题目词槽。
示例性的,题目1为:
填上合适的数字,组成成语。
()全()美()拿()稳()上()下()死()生
该题目标注出的题目题型为成语题型;题目意图为成语填字;()全()美的题目词槽为“全”和“美”;()拿()稳的题目词槽为“拿”和“稳”;()上()下的题目词槽为“上”和“下”;()死()生的题目词槽为“死”和“生”。
题目2为:辩字组词。
娇()摘()治()戚()
骄()滴()冶()威()
该题目标注的题目题型为词语题型;题目意图为组词;题目中的题目词槽分别为“娇”、“摘”、“治”、“戚”、“骄”、“滴”、“冶”、“威”。
模型训练单元430,用于将标注后的所述语文题目素材输入预先构建的识别模型进行训练,得到训练好的识别模型。
具体地,将上述标注好的大量语文题目作为训练样本集输入预先构建的识别模型进行训练,训练好的识别模型则可用于识别输入题目的题目题型、题目意图和题目词槽。
优选地,还包括数据库构建模块500;
数据库构建模块500包括:
题型收集单元510,用于根据标注后的所述语文题目素材,收集并归纳语文科目对应的题目题型;
具体地,标注出语文题目素材中的每道题目的题目题型后,根据标注的题目题型,对语文科目包含的所有题目题型进行分类整理,将属于同一类题型的题目分为一组。例如,将所有考察拼音的题型归为一类;将所有考察词语的题型归为一类;将所有考察成语的题型归为一类等等。
关系建立单元520,用于建立所述语文题目素材中的所述题目题型、所述题目意图与所述题目词槽之间的关联关系;其中,一个题目题型对应一个或多个题目意图;一个题目意图对应一个或多个题目词槽;
具体地,一个题目题型包含一个或多个题目意图;例如,词语题型中包含的题目意图可以是填写词语近义词、填写词语反义词、词语造句、照样子写词语等。一个题目意图又包含多个题目词槽,例如,填写词语近义词的题目意图中包括的题目词槽可为所有的词语。
根据收集的大量语文题目素材中标注的题目题型、题目意图和题目词槽,即可对所有的题目题型、题目意图和题目词槽进行归纳整理,并建立题目题型、题目意图与题目词槽之间的关联关系。
答案获取单元530,用于根据所述题目词槽对应的所述题目题型和所述题目意图,获取所述题目词槽对应的答案;
具体地,在建立了题目题型、题目意图和题目词槽之间的关联关系后,即可根据题目词槽对应的题目题型和题目意图,获取到每个题目词槽对应的题目意图的答案。
示例性的,题目词槽“温和”对应的题目题型为词语题型,对应的题目意图为近义词,则可获取题目词槽“温柔”对应的近义词答案为“柔顺”。
题目词槽“温和”对应的题目题型为词语题型,对应的题目意图为反义词,则获取题目词槽“温柔”对应的反义词答案为“暴烈”。
数据库构建单元540,用于根据所述题目题型、所述题目意图、所述题目词槽和所述答案之间的关联关系,构建多个不同题目题型的数据库。
具体地,根据上述方法获取到每个题目词槽对应的题目意图的答案后,即可根据题目题型、题目意图、题目词槽和对应的答案,构建多个不同题目题型的数据库。即为每个题目题型构建一个数据库,将每个题型包括的题目意图、题目词槽和对应的答案都存储在对应的数据库中。
根据题目词槽和题目意图来构建数据库,数据库中只需要搜集存储大量的词语、以及常考的题目意图和对应的答案即可,存储的题目词槽、对应的题目意图和对应的答案可以应用于各个题目(各个不同题目词槽、不同题目意图组成的题目)中;数据库中不需要存储和待解答题目完全一样的题目,从而降低数据库的构建成本和维护成本。
例如,待解答试题1为:
写出下列词语的近义词:
温和-()好像-()美丽-();
连忙-()居然-()高兴-()。
待解答试题2为:
写出下列词语的近义词:
温和-()好像-()美丽-()。
现有的搜题方法构建的数据库中,则需要同时存储待解答试题1和待解答试题2,而在本方案中,是单独存储的题目词槽、题目意图和对应的答案,该单独存储的题目词槽、题目意图和对应的答案可同时应用于待解答试题1和待解答试题2。
优选地,数据库构建单元540包括:
数据库构建子单元541,用于根据所述题目题型的数量,构建多个不同题目题型的数据库;
存储子单元542,用于将每个题目题型对应的题目意图、题目词槽以及题目词槽对应的答案分别存储在所述数据库中,并在存储时,将所述题目词槽作为实体、将对应的题目意图作为所述实体的属性,将对应的答案作为所述实体的属性值。
具体地,在数据库中存储题目题型对应的题目词槽和题目意图时,可将题目词槽作为实体、将对应的题目意图作为实体的属性,将对应的答案作为实体的属性值进行存储。
示例性的,在词语题型对应的数据库中,题目词槽“温和”的属性有多个,分别为近义词、反义词、造句等,其每个属性对应的属性值分别为“柔顺”、“暴烈”、“温和的昆明、四季如春”。其存储的方式为(温和,近义词,柔顺),(温和,反义词,暴烈),(温和,造句,温和的昆明、四季如春)。
在数据库中,将题目意图、题目词槽和答案以实体、实体属性和实体属性值的方式进行存储,可方便答案的查找。例如,在查找答案时,还可根据答案查找题目词槽。
示例性的,若待解答试题的题目题型为词语题型,题目词槽为“柔顺”,题目意图为“近义词”,则根据数据库中存储的实体“温和”、属性“近义词”以及属性值“柔顺”,即(温和,近义词,柔顺),查找到题目词槽“柔顺”的近义词为“温和”。通过上述方式进行存储,不仅可根据题目词槽查找答案,而且还可根据答案查找题目词槽,减少数据库的题目词槽的存储量,且可降低数据库的构建成本。
优选地,答案查找模块300包括:
数据库查找单元310,用于根据所述待解答试题的题目题型,从预先构建的多个不同题目题型的数据库中查找到目标数据库;
答案查找单元320,用于根据所述待解答试题的题目意图和题目词槽,在所述目标数据库中查找对应的答案。
具体地,在用户输入待解答试题后,通过训练好的识别模型识别出待解答试题的题目题型、题目意图和题目词槽,然后先根据待解答试题对应的题目题型,在多个数据库中查找到与待解答试题的题目题型对应的目标数据库。
然后在目标数据库中,根据待解答试题的题目意图和题目词槽,查找到每个题目词槽对应的答案。
本方案中,根据题目题型的数量构建多个数据库,可在搜索答案时,先根据题目题型确定目标数据库,然后根据题目意图和题目词槽搜索对应的答案,可减小搜索范围,提高搜索效率。
应当说明的是,上述实施例均可根据需要自由组合。以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
Claims (10)
1.一种语文题型的答案获取方法,其特征在于,包括:
获取待解答试题;
通过预先训练好的识别模型,识别出所述待解答试题对应的题目题型、题目意图和题目词槽;
根据所述待解答试题对应的题目题型、题目意图和题目词槽,在预先构建的数据库中查找所述待解答试题对应的答案。
2.根据权利要求1所述的一种语文题型的答案获取方法,其特征在于,所述识别模型的训练方法为:
收集大量语文题目素材;
标注所述语文题目素材中的每道题目的题目题型、题目意图和题目词槽;
将标注后的所述语文题目素材输入预先构建的识别模型进行训练,得到训练好的识别模型。
3.根据权利要求2所述的一种语文题型的答案获取方法,其特征在于,所述数据库的构建方法为:
根据标注后的所述语文题目素材,收集并归纳语文科目对应的题目题型;
建立所述语文题目素材中的所述题目题型、所述题目意图与所述题目词槽之间的关联关系;其中,一个题目题型对应一个或多个题目意图;一个题目意图对应一个或多个题目词槽;
根据所述题目词槽对应的所述题目题型和所述题目意图,获取所述题目词槽对应的答案;
根据所述题目题型、所述题目意图、所述题目词槽和所述答案之间的关联关系,构建多个不同题目题型的数据库。
4.根据权利要求3所述的一种语文题型的答案获取方法,其特征在于,所述根据所述题目题型、所述题目意图、所述题目词槽和所述答案之间的关联关系,构建多个不同题目题型的数据库具体包括:
根据所述题目题型的数量,构建多个不同题目题型的数据库;
将每个题目题型对应的题目意图、题目词槽以及题目词槽对应的答案分别存储在所述数据库中,并在存储时,将所述题目词槽作为实体、将对应的题目意图作为所述实体的属性,将对应的答案作为所述实体的属性值。
5.根据权利要求3所述的一种语文题型的答案获取方法,其特征在于,根据所述待解答试题的题目题型、题目意图和题目词槽,在预先构建的数据库中查找所述待解答试题对应的答案具体包括:
根据所述待解答试题的题目题型,从预先构建的多个不同题目题型的数据库中查找到目标数据库;
根据所述待解答试题的题目意图和题目词槽,在所述目标数据库中查找对应的答案。
6.一种语文题型的答案获取装置,其特征在于,包括:
试题获取模块,用于获取待解答试题;
识别模块,用于通过预先训练好的识别模型,识别出所述待解答试题对应的题目题型、题目意图和题目词槽;
答案查找模块,用于根据所述待解答试题对应的题目题型、题目意图和题目词槽,在预先构建的数据库中查找所述待解答试题对应的答案。
7.根据权利要求6所述的一种语文题型的答案获取装置,其特征在于,还包括模型训练模块;
所述模型训练模块包括:
素材收集单元,用于收集大量语文题目素材;
标注单元,用于标注所述语文题目素材中的每道题目的题目题型、题目意图和题目词槽;
模型训练单元,用于将标注后的所述语文题目素材输入预先构建的识别模型进行训练,得到训练好的识别模型。
8.根据权利要求7所述的一种语文题型的答案获取装置,其特征在于,还包括数据库构建模块;
所述数据库构建模块包括:
题型收集单元,用于根据标注后的所述语文题目素材,收集并归纳语文科目对应的题目题型;
关系建立单元,用于建立所述语文题目素材中的所述题目题型、所述题目意图与所述题目词槽之间的关联关系;其中,一个题目题型对应一个或多个题目意图;一个题目意图对应一个或多个题目词槽;
答案获取单元,用于根据所述题目词槽对应的所述题目题型和所述题目意图,获取所述题目词槽对应的答案;
数据库构建单元,用于根据所述题目题型、所述题目意图、所述题目词槽和所述答案之间的关联关系,构建多个不同题目题型的数据库。
9.根据权利要求8所述的一种语文题型的答案获取装置,其特征在于,所述数据库构建单元包括:
数据库构建子单元,用于根据所述题目题型的数量,构建多个不同题目题型的数据库;
存储子单元,用于将每个题目题型对应的题目意图、题目词槽以及题目词槽对应的答案分别存储在所述数据库中,并在存储时,将所述题目词槽作为实体、将对应的题目意图作为所述实体的属性,将对应的答案作为所述实体的属性值。
10.根据权利要求8所述的一种语文题型的答案获取装置,其特征在于,所述答案查找模块包括:
数据库查找单元,用于根据所述待解答试题的题目题型,从预先构建的多个不同题目题型的数据库中查找到目标数据库;
答案查找单元,用于根据所述待解答试题的题目意图和题目词槽,在所述目标数据库中查找对应的答案。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910447861.7A CN112000798A (zh) | 2019-05-27 | 2019-05-27 | 一种语文题型的答案获取方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910447861.7A CN112000798A (zh) | 2019-05-27 | 2019-05-27 | 一种语文题型的答案获取方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112000798A true CN112000798A (zh) | 2020-11-27 |
Family
ID=73461703
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910447861.7A Pending CN112000798A (zh) | 2019-05-27 | 2019-05-27 | 一种语文题型的答案获取方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112000798A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113569741A (zh) * | 2021-07-29 | 2021-10-29 | 小船出海教育科技(北京)有限公司 | 图像试题的答案生成方法、装置、电子设备及可读介质 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107423286A (zh) * | 2017-07-05 | 2017-12-01 | 华中师范大学 | 初等数学代数型题自动解答的方法与*** |
CN108334493A (zh) * | 2018-01-07 | 2018-07-27 | 深圳前海易维教育科技有限公司 | 一种基于神经网络的题目知识点自动提取方法 |
CN108345690A (zh) * | 2018-03-09 | 2018-07-31 | 广州杰赛科技股份有限公司 | 智能问答方法与*** |
CN108446286A (zh) * | 2017-02-16 | 2018-08-24 | 阿里巴巴集团控股有限公司 | 一种自然语言问句答案的生成方法、装置及服务器 |
CN109522393A (zh) * | 2018-10-11 | 2019-03-26 | 平安科技(深圳)有限公司 | 智能问答方法、装置、计算机设备和存储介质 |
CN109583401A (zh) * | 2018-12-05 | 2019-04-05 | 广东小天才科技有限公司 | 一种自动生成答案的搜题方法及用户设备 |
-
2019
- 2019-05-27 CN CN201910447861.7A patent/CN112000798A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108446286A (zh) * | 2017-02-16 | 2018-08-24 | 阿里巴巴集团控股有限公司 | 一种自然语言问句答案的生成方法、装置及服务器 |
CN107423286A (zh) * | 2017-07-05 | 2017-12-01 | 华中师范大学 | 初等数学代数型题自动解答的方法与*** |
CN108334493A (zh) * | 2018-01-07 | 2018-07-27 | 深圳前海易维教育科技有限公司 | 一种基于神经网络的题目知识点自动提取方法 |
CN108345690A (zh) * | 2018-03-09 | 2018-07-31 | 广州杰赛科技股份有限公司 | 智能问答方法与*** |
CN109522393A (zh) * | 2018-10-11 | 2019-03-26 | 平安科技(深圳)有限公司 | 智能问答方法、装置、计算机设备和存储介质 |
CN109583401A (zh) * | 2018-12-05 | 2019-04-05 | 广东小天才科技有限公司 | 一种自动生成答案的搜题方法及用户设备 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113569741A (zh) * | 2021-07-29 | 2021-10-29 | 小船出海教育科技(北京)有限公司 | 图像试题的答案生成方法、装置、电子设备及可读介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Chen | Developing and evaluating a web-based collocation retrieval tool for EFL students and teachers | |
US20160133148A1 (en) | Intelligent content analysis and creation | |
CN111475623A (zh) | 基于知识图谱的案件信息语义检索方法及装置 | |
CN113590956B (zh) | 知识点推荐方法、装置、终端及计算机可读存储介质 | |
CN108363743A (zh) | 一种智能问题生成方法、装置和计算机可读存储介质 | |
Nebot | Corpus-based activities in legal translator training | |
CN109947952B (zh) | 基于英语知识图谱的检索方法、装置、设备及存储介质 | |
CN111242816B (zh) | 基于人工智能的多媒体教案制作方法和*** | |
CN113886567A (zh) | 一种基于知识图谱的教学方法及*** | |
CN110853422A (zh) | 一种沉浸式语言学习***及其学习方法 | |
Nguyen et al. | Design intelligent educational chatbot for information retrieval based on integrated knowledge bases | |
Oktavianti et al. | Discourse functions of lexical bundles in Indonesian EFL learners’ argumentative essays: A corpus study | |
CN112966518A (zh) | 一种面向大规模在线学习平台的优质答案识别方法 | |
CN112000798A (zh) | 一种语文题型的答案获取方法及装置 | |
Godino et al. | Semiotic functions in teaching and learning mathematics | |
CN111241276A (zh) | 题目搜索方法、装置、设备及存储介质 | |
Ahmadi et al. | Rethinking the language learner in the post-method era the question of identity | |
Eldridge et al. | Towards a lexical framework for CLIL | |
CN111666474B (zh) | 一种整页搜题的方法及终端 | |
CN112115275A (zh) | 一种面向数学辅导问答***的知识图谱构建方法及其*** | |
Giampieri | Online corpora for second language teaching | |
CN113486650A (zh) | 一种句子扫查方法、装置及存储介质 | |
CN112164262A (zh) | 一种智能阅卷辅导*** | |
Tåqvist | " Another thing": Discourse-organising nouns in advanced learner English | |
CN111813919A (zh) | 一种基于句法分析与关键词检测的mooc课程评价方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |