WO2020063347A1

WO2020063347A1 - 针对口算题的题目批改方法、装置、电子设备和存储介质

Info

Publication number: WO2020063347A1
Application number: PCT/CN2019/105321
Authority: WO
Inventors: 石凡; 何涛; 罗欢; 陈明权
Original assignee: 杭州大拿科技股份有限公司
Priority date: 2018-09-26
Filing date: 2019-09-11
Publication date: 2020-04-02
Also published as: EP3859558A4; US20210192965A1; US11721229B2; JP7077483B2; EP3859558A1; JP2021530066A

Abstract

一种针对口算题的题目批改方法及装置，根据各个待搜索题目的题干的文字内容获得待搜索题目的特征向量，然后利用各个待搜索题目的特征向量从题库中查找与待搜索试卷相匹配的目标试卷，对于题目类型为口算题的待搜索题目，在目标试卷内部基于题目的特征向量进行二次查找，查找的标准为最短编辑距离最小，若匹配到的目标题目的题目类型也是口算题，则确认待搜索题目为待批改口算题目，同时，利用预设的口算引擎对待批改口算题目进行计算并输出计算结果作为待批改口算题目的答案。

Description

针对口算题的题目批改方法、装置、电子设备和存储介质

技术领域

本发明涉及人工智能技术领域，尤其涉及一种针对口算题的题目批改方法、装置、电子设备和计算机可读存储介质。

背景技术

随着计算机技术和教育信息化的不断推进，计算机技术已经逐步应用于日常教育教学的各项活动中，例如在教学评测场景下得到了相应的应用。国内现有的基础教育、学生学习状况的主要考察形式仍是各种类型的考试或测试，在此状况下，教师背负着很大的批改试卷的工作压力。

目前，智能终端类产品有许多解决批改作业和试卷的搜题APP，将包含待批改试卷的影像输入搜题APP，以便搜题APP根据试卷的影像内容从题库中搜索到与试卷的影像中的各个题目相对应的题目。

现有的题目搜索方法，可以根据题目的题干的文字内容生成题目的特征向量，根据该特征向量从题库中进行搜索。在生成特征向量时，不同的文字(token)基于词频所产生的权重不同，在题干的文字内容中出现越频繁表明该文字(token)越不重要(如“的”字在题干中出现次数很多，则认定“的”字不重要)，则将该文字(token)的权重设置的越低。

然而，对于口算题而言，口算题的题干的文字内容大多为数字和计算符号，而数字和计算符号的词频相对较高，即口算题的题干的文字内容中缺乏具有区分度的高权重的文字(token)，这会导致不同的口算题所对应的特征向量彼此之间的区分度较小，一旦识别引擎出现微小的识别错误，就会导致口算题匹配到另一个不同的口算题，进而导致口算题目的批改出错。可见，针对口算题的题目批改容易出现错误，准确度不高。

发明内容

本发明的目的在于提供一种针对口算题的题目批改方法、装置、电子设备和计算机可读存储介质，以解决现有的题目批改方式针对口算题进行批改容易出错，准确度不高的问题。

为解决上述技术问题，本发明提供了一种针对口算题的题目批改方法，所述方法包括：

步骤S11：对待搜索试卷的影像进行检测，检测出所述待搜索试卷上的各个待搜索题目的区域，确定各个待搜索题目的题目类型，并识别出各个待搜索题目的区域中题干的文字内容；

步骤S12：根据每一待搜索题目的题干的文字内容，获得该待搜索题目的特征向量，并根据该待搜索题目的特征向量在题库中进行搜索，查找该待搜索题目最接近的题目；

步骤S13：汇总查找到的所有待搜索题目的最接近题目所在的试卷，并将汇总的试卷与预设条件比较，若存在满足预设条件的目标试卷，则将满足预设条件的试卷确定为与所述待搜索试卷匹配的目标试卷；

步骤S14：在所述待搜索试卷中包含题目类型为口算题的待搜索题目的情况下，针对每一题目类型为口算题的待搜索题目，将该待搜索题目的特征向量与所述目标试卷中的各个题目的特征向量进行最短编辑距离匹配，确定所述目标试卷中与该待搜索题目相匹配的目标题目，若所述目标题目的题目类型为口算题，则确定该待搜索题目为待批改口算题目；以及

步骤S15：针对每一待批改口算题目，利用预设的口算引擎对该待批改口算题目进行计算，输出所述口算引擎的计算结果作为该待批改口算题目的答案，从而完成对所述待搜索试卷上待批改口算题目的批改。

可选的，在步骤S14中，在所述目标题目的题目类型为口算题，且所述目标题目在所述目标试卷中的位置与该待搜索题目在所述待搜索试卷中的位置相同的情况下，确定该待搜索题目为待批改口算题目。

可选的，在步骤S13中，若不存在满足预设条件的目标试卷，并且在所述待搜索试卷中包含题目类型为口算题的待搜索题目时，则将题目类型为口算题的待搜索题目确定为待批改口算题目，并执行步骤S15。

可选的，步骤S15还包括：检验所述口算引擎的计算结果与该待批改口算题目在所述目标试卷上对应的参***是否一致，如果一致则输出所述口算引擎的计算结果作为该待批改口算题目的答案。

可选的，当所述口算引擎的计算结果与该待批改口算题目在所述目标试卷上的参***不一致时，输出用于表示与该待批改口算题目的参***不一致的提示信息。

可选的，所述预设的口算引擎包括预先训练的第一识别模型，所述第一识别模型是基于神经网络的模型；

步骤S15中利用预设的口算引擎对该待批改口算题目进行计算，包括：

通过所述预先训练的第一识别模型识别出该待批改口算题目中的数字、字母、文字、字符以及计算类型，所述计算类型包括：四则混合运算、估算、带余数除法、分数计算、单位换算、竖式计算和脱式计算中的一种；以及

根据所识别出的数字、字母、文字、字符以及计算类型进行计算，得到该待批改口算题目的计算结果。

可选的，所述步骤S12包括：

步骤S121，将每一待搜索题目的题干的文字内容输入预先训练的题干向量化模型中，得到每一待搜索题目的题干的特征向量，作为每一待搜索题目的特征向量，其中，所述题干向量化模型是基于神经网络的模型；以及

步骤S122，针对每一待搜索题目，在题库中进行搜索，查找与该待搜索题目的特征向量相匹配的特征向量，将题库中相匹配的特征向量对应的题目确定为与该待搜索题目最接近的题目。

可选的，所述题干向量化模型通过以下步骤训练得到：

对一题目样本训练集中每个题目样本进行标注处理，标注出每个题目样本中题干的文字内容；以及

利用神经网络模型对每个题目样本中题干的文字内容进行二维特征向量提取，从而训练得到所述题干向量化模型。

可选的，在执行所述步骤S12之前，所述针对口算题的题目批改方法还包括：对题库中试卷上的各个题目的特征向量建立索引信息表；

步骤S122包括：

针对每一待搜索题目，在所述索引信息表中查找与该待搜索题目的特征向量相匹配的特征向量；以及

将相匹配的特征向量在所述索引信息表中对应的题目确定为与该待搜索题目最接近的题目。

可选的，在建立所述索引信息表之前，所述针对口算题的题目批改方法还包括：将不同长度的特征向量按照长度进行分组；

所述针对每一待搜索题目，在所述索引信息表中查找与该待搜索题目的特征向量相匹配的特征向量，包括：

针对每一待搜索题目，在所述索引信息表中与该待搜索题目的特征向量长度相同或相近的分组内，查找与该待搜索题目的特征向量相匹配的特征向量。

可选的，步骤S13中，将满足预设条件的试卷确定为与所述待搜索试卷匹配的目标试卷，包括：

将出现频率最大且大于第一预设阈值的试卷确定为与所述待搜索试卷匹配的目标试卷。

可选的，步骤S11中，对待搜索试卷的影像进行检测，检测出所述待搜索试卷上的各个待搜索题目的区域，包括：

利用预先训练好的检测模型对所述待搜索试卷的影像进行检测，检测出所述待搜索试卷上的各个待搜索题目的区域，其中，所述检测模型是基于神经网络的模型。

可选的，步骤S11中，识别出各个待搜索题目的区域中题干的文字内容，包括：

利用预先训练好的第二识别模型识别各个待搜索题目的区域中题干的文字内容，其中，所述第二识别模型是基于神经网络的模型。

可选的，在执行步骤S11之后，执行步骤S12之前，所述针对口算题的题目批改方法还包括：

利用预设的口算引擎对所述待搜索试卷中包含算式和/或公式的区域进行计算处理，得到各个区域的计算结果；

其中，在步骤S15中，针对每一待批改口算题目，将所述口算引擎在该待批改口算题目区域对应的计算结果，作为该待批改口算题目的答案，从而完成对所述待搜索试卷上待批改口算题目的批改。

为达到上述目的，本发明还提供了一种针对口算题的题目批改装置，所述装置包括：

检测识别模块，用于对待搜索试卷的影像进行检测，检测出所述待搜索试卷上的各个待搜索题目的区域，确定各个待搜索题目的题目类型，并识别出各个待搜索题目的区域中题干的文字内容；

题目查找模块，用于根据每一待搜索题目的题干的文字内容，获得该待搜索题目的特征向量，并根据该待搜索题目的特征向量在题库中进行搜索，查找该待搜索题目最接近的题目；

试卷确定模块，用于汇总查找到的所有待搜索题目的最接近题目所在的试卷，并将汇总的试卷与预设条件比较，若存在满足预设条件的目标试卷，则将满足预设条件的试卷确定为与所述待搜索试卷匹配的目标试卷；

口算题确定模块，用于在所述待搜索试卷中包含题目类型为口算题的待搜索题目的情况下，针对每一题目类型为口算题的待搜索题目，将该待搜索题目的特征向量与所述目标试卷中的各个题目的特征向量进行最短编辑距离匹配，确定所述目标试卷中与该待搜索题目相匹配的目标题目，若所述目标题目的题目类型为口算题，则确定该待搜索题目为待批改口算题目；以及

口算题批改模块，用于针对每一待批改口算题目，利用预设的口算引擎对该待批改口算题目进行计算，输出所述口算引擎的计算结果作为该待批改口算题目的答案，从而完成对所述待搜索试卷上待批改口算题目的批改。

可选的，所述口算题确定模块，还用于在所述目标题目的题目类型为口算题，且所述目标题目在所述目标试卷中的位置与该待搜索题目在所述待搜索试卷中的位置相同的情况下，确定该待搜索题目为待批改口算题目。

可选的，所述试卷确定模块，还用于在不存在满足预设条件的目标试卷，并且在所述待搜索试卷中包含题目类型为口算题的待搜索题目时，将题目类型为口算题的待搜索题目确定为待批改口算题目。

可选的，所述口算题批改模块，还用于检验所述口算引擎的计算结果与该待批改口算题目在所述目标试卷上对应的参***是否一致，如果一致则输出所述口算引擎的计算结果作为该待批改口算题目的答案。

可选的，所述口算题批改模块，还用于当所述口算引擎的计算结果与该待批改口算题目在所述目标试卷上的参***不一致时，输出用于表示与该待批改口算题目的参***不一致的提示信息。

所述口算题批改模块，用于通过所述预先训练的第一识别模型识别出该待批改口算题目中的数字、字母、文字、字符以及计算类型，所述计算类型包括：四则混合运算、估算、带余数除法、分数计算、单位换算、竖式计算和脱式计算中的一种；根据所识别出的数字、字母、文字、字符以及计算类型进行计算，得到该待批改口算题目的计算结果。

可选的，所述题目查找模块，包括：

特征向量获得单元，用于将每一待搜索题目的题干的文字内容输入预先训练的题干向量化模型中，得到每一待搜索题目的题干的特征向量，作为每一待搜索题目的特征向量，其中，所述题干向量化模型是基于神经网络的模型；

题目查找单元，用于针对每一待搜索题目，在题库中进行搜索，查找与该待搜索题目的特征向量相匹配的特征向量，将题库中相匹配的特征向量对应的题目确定为与该待搜索题目最接近的题目。

可选的，所述题干向量化模型通过以下步骤训练得到：

对一题目样本训练集中每个题目样本进行标注处理，标注出每个题目样本中题干的文字内容；

可选的，所述装置还包括：

预处理模块，用于预先对题库中试卷上的各个题目的特征向量建立索引信息表；

所述题目查找单元，具体用于针对每一待搜索题目，在所述索引信息表中查找与该待搜索题目的特征向量相匹配的特征向量；将相匹配的特征向量在所述索引信息表中对应的题目确定为与该待搜索题目最接近的题目。

可选的，所述预处理模块，还用于在建立所述索引信息表之前，将不同长度的特征向量按照长度进行分组；

所述题目查找单元，具体用于针对每一待搜索题目，在所述索引信息表中与该待搜索题目的特征向量长度相同或相近的分组内，查找与该待搜索题目的特征向量相匹配的特征向量。

可选的，所述试卷确定模块，具体用于将出现频率最大且大于第一预设阈值的试卷确定为与所述待搜索试卷匹配的目标试卷。

可选的，所述检测识别模块，具体用于利用预先训练好的检测模型对所述待搜索试卷的影像进行检测，检测出所述待搜索试卷上的各个待搜索题目的区域，其中，所述检测模型是基于神经网络的模型。

可选的，所述检测识别模块，具体用于利用预先训练好的第二识别模型识别各个待搜索题目的区域中题干的文字内容，其中，所述第二识别模型是基于神经网络的模型。

可选的，所述针对口算题的题目批改装置还包括：

计算模块，用于利用预设的口算引擎对所述待搜索试卷中包含算式和/或公式的区域进行计算处理，得到各个区域的计算结果；

其中，所述口算题批改模块用于针对每一待批改口算题目，将所述口算引擎在该待批改口算题目区域对应的计算结果，作为该待批改口算题目的答案，从而完成对所述待搜索试卷上待批改口算题目的批改。

为达到上述目的，本发明还提供了一种电子设备，包括处理器、通信接口、存储器和通信总线，其中，处理器、通信接口和存储器通过通信总线完成相互间的通信；

存储器，用于存放计算机程序；

处理器，用于执行存储器上所存放的程序时，实现如上任一所述针对口算题的题目批改方法的方法步骤。

为达到上述目的，本发明还提供了一种计算机可读存储介质，其特征在于，所述计算机可读存储介质内存储有计算机程序，所述计算机程序被处理器执行时实现如上任一所述针对口算题的题目批改方法的方法步骤。

为达到上述目的，本发明还提供了一种针对口算题的题目批改方法，所述方法包括：

步骤S41：对待搜索试卷的影像进行检测，检测出所述待搜索试卷上的各个待搜索题目的区域，确定各个待搜索题目的题目类型，并识别出各个待搜索题目的区域中题干的文字内容；

步骤S42：利用预设的口算引擎对所述待搜索试卷中包含算式和/或公式的区域进行计算处理，得到各个区域的计算结果；

步骤S43：根据每一待搜索题目的题干的文字内容，获得该待搜索题目的特征向量，并根据该待搜索题目的特征向量在题库中进行搜索，查找该待搜索题目最接近的题目；

步骤S44：汇总查找到的所有待搜索题目的最接近题目所在的试卷，并将汇总的试卷与预设条件比较，若存在满足预设条件的目标试卷，则将满足预设条件的试卷确定为与所述待搜索试卷匹配的目标试卷；

步骤S45：在所述待搜索试卷中包含题目类型为口算题的待搜索题目的情况下，针对每一题目类型为口算题的待搜索题目，将该待搜索题目的特征向量与所述目标试卷中的各个题目的特征向量进行最短编辑距离匹配，确定所述目标试卷中与该待搜索题目相匹配的目标题目，若所述目标题目的题目类型为口算题，则确定该待搜索题目为待批改口算题目；以及

步骤S46：针对每一待批改口算题目，将所述口算引擎在该待批改口算题目区域对应的计算结果，作为该待批改口算题目的答案，从而完成对所述待搜索试卷上待批改口算题目的批改。

口算题批改模块，用于针对每一待批改口算题目，将所述口算引擎在该待批改口算题目区域对应的计算结果，作为该待批改口算题目的答案，从而完成对所述待搜索试卷上待批改口算题目的批改。

与现有技术相比，本发明针对待搜索试卷，首先根据各个待搜索题目的题干的文字内容获得待搜索题目的特征向量，然后利用各个待搜索题目的特征向量从题库中查找与待搜索试卷相匹配的目标试卷，而对于题目类型为口算题的待搜索题目，在目标试卷内部基于题目的特征向量进行二次查找，查找的标准为最短编辑距离最小，若匹配到的目标题目的题目类型也是口算题，则确认待搜索题目为待批改口算题目，再利用预设的口算引擎对待批改口算题目进行计算并输出计算结果作为待批改口算题目的答案。可见，对于待批改口算题目，由于根据题干的文字内容获得的特征向量彼此间区分度较小，导致从题库中查找的目标试卷中的参***与待批改口算题目不匹配的可能性也较大，因此二次查找确定待批改口算题目并通过口算引擎进行计算，可以提高口算题目的批改准确度。

附图说明

图1是本发明一实施例提供的针对口算题的题目批改方法的流程示意图；

图2是本发明一实施例题供的针对口算题的题目批改装置的结构示意图；

图3是本发明一实施例提供的电子设备的结构示意图；

图4是本发明另一实施例提供的针对口算题的题目批改方法的流程示意图；

图5是本发明另一实施例题供的针对口算题的题目批改装置的结构示意图。

具体实施方式

以下结合附图和具体实施例对本发明提出的一种针对口算题的题目批改方法、装置、电子设备及计算机可读存储介质作进一步详细说明。根据权利要求书和下面说明，本发明的优点和特征将更清楚。

为解决现有技术的问题，本发明实施例提供了一种针对口算题的题目批改方法、装置、电子设备及计算机可读存储介质。

需要说明的是，本发明实施例的针对口算题的题目批改方法可应用于本发明实施例的针对口算题的题目批改装置，该针对口算题的题目批改装置可被配置于电子设备上。其中，该电子设备可以是个人计算机、移动终端等，该移动终端可以是手机、平板电脑等具有各种操作***的硬件设备。

【实施例一】

图1是本发明一实施例提供的一种针对口算题的题目批改方法的流程示意图。请参考图1，一种针对口算题的题目批改方法可以包括如下步骤：

步骤S11：对待搜索试卷的影像进行检测，检测出待搜索试卷上的各个待搜索题目的区域，确定各个待搜索题目的题目类型，并识别出各个待搜索题目的区域中题干的文字内容。

待搜索试卷的影像可以为包含待搜索试卷的图像。具体的，可以利用检测模型对待搜索试卷的影像进行检测，检测出待搜索试卷上的各个待搜索题目的区域，所述检测模型是基于神经网络的模型。其中，检测模型例如可以是基于深度卷积神经网络(Convolutional Neural Networks，CNN)对试卷样本训练集中的样本进行训练得到的。利用训练好的检测模型从待搜索试卷的影像中提取二维特征向量，在二维特征向量的每个网格生成不同形状的锚点，使用标注框(Groundtruth Boxes)将检测出的各个待搜索题目的区域进行标注，还可以将标注框与生成的锚点作回归(regression)处理，以使标注框更贴近题目的实际位置。识别完题目区域后会将每道待搜索题目进行切割为单个影像，或者不实际切割，而在处理时将每个待搜索题目区域区分开为单个区域影像进行处理，会根据题目位置信息进行排序。

检测出各个待搜索题目的区域后，可以利用分类识别模型确定各个待搜索题目的题目类型，所述分类识别模型是基于神经网络的模型。其中，分类识别模型例如可以是基于深度卷积神经网络对试卷样本训练集中的样本进行训练得到的，每一样本中的题目均标注有题目类型。题目类型可以分为操作题、口算题、填空题、选择题、应用题等。

同时，还可以利用第二识别模型识别出待搜索题目的区域中题干的文字内容，所述第二识别模型是基于神经网络的模型。首先标注出待搜索题目中的各个组成部分，组成部分可以包括题干、答题和/或图片，进而通过第二识别模型识别出题目中题干的文字内容。其中，第二识别模型可以是基于空洞卷积和注意力模型建立的，具体的，采用空洞卷积对题干、答题和/或图片对应的标注框进行特征提取，再通过注意力模型将提取到的特征解码成字符。

步骤S12：根据每一待搜索题目的题干的文字内容，获得该待搜索题目的特征向量，并根据该待搜索题目的特征向量在题库中进行搜索，查找该待搜索题目最接近的题目。

具体的，所述步骤S12进一步可以包括：

步骤S121，将每一待搜索题目的题干的文字内容输入预先训练的题干向量化模型中，得到每一待搜索题目的题干的特征向量，作为每一待搜索题目的特征向量，其中，所述题干向量化模型是基于神经网络的模型。

举例而言，例如待搜索题目中题干的文字内容为“4.小明走3分钟刚好到全程的一半，他家距离学校多少米？(6分)”，将该文字内容输入预先训练的题干向量化模型—sent2vec模型中，获得该题干的特征向量，特征向量可以表示为[x0,x1,x2…,xn]。

其中，所述题干向量化模型可以是基于神经网络的模型，如CNN模型，所述题干向量化模型可以通过以下步骤训练得到：对一题目样本训练集中每个题目样本进行标注处理，标注出每个题目样本中题干的文字内容；利用神经网络模型对每个题目样本中题干的文字内容进行二维特征向量提取，从而训练得到所述题干向量化模型。其中，具体的训练过程属于现有技术，在此不做赘述。

其中，可以通过向量近似搜索的方式，在题库中查找与该待搜索题目的特征向量相匹配的特征向量，具体为在题库中查找与该待搜索题目的特征向量距离最近的特征向量。可以理解的是，不同向量之间的相似性度量(Similarity Measurement)通常采用的方法就是计算向量间的“距离(Distance)”，常用的距离计算方式有：欧式距离、曼哈顿距离、夹角余弦(Cosine)等。本实施例一中采用的计算方式是夹角余弦。

优选的，为便于特征向量的查找，还可以预先对题库中试卷上的各个题目的特征向量建立索引信息表。索引信息表中可以存储题库中各个题目的特征向量、题目的具体内容以及题目所在试卷的ID等。

相应的，步骤S122进一步可以包括：针对每一待搜索题目，在所述索引信息表中查找与该待搜索题目的特征向量相匹配的特征向量；将相匹配的特征向量在所述索引信息表中对应的题目确定为与该待搜索题目最接近的题目。

可以理解的是，在索引信息表中查找到相匹配的特征向量后，在所述索引信息表中找到最接近的题目，此时可以获得最接近题目的具体内容(包括题目的题干、答案和/或图片)，以及该最接近题目所在试卷的ID信息。

优选的，在建立所述索引信息表之前，还可以将不同长度的特征向量按照长度进行分组，这样，在所述索引信息表中查找与该待搜索题目的特征向量相匹配的特征向量时，可以首先在所述索引信息表中定位到与该待搜索题目的特征向量的长度相同或相近的分组(在此，所述长度相近的分组指待搜索题目的特征向量的长度与索引信息表中的特征向量的长度差小于一特定值或一预设值)，进而在所述索引信息表中与该待搜索题目的特征向量长度相同或相近的分组内，查找与该待搜索题目的特征向量相匹配的特征向量。其中，分组时可以将长度相同的特征向量分为一组，也可以将长度在某个范围内的特征向量分成一组，本发明对此不做限定。可见，将不同长度的特征向量按照长度分组，可以使得后期搜索题目时根据特征向量的长度在相应分组内进行查询，提高题目搜索速度。可以理解的是，特征向量的长度不同是因为题干的文字数量不同导致的。

步骤S13：汇总查找到的所有待搜索题目的最接近题目所在的试卷，将满足预设条件的试卷确定为与待搜索试卷匹配的目标试卷。具体的，可通过将汇总的试卷与一预设条件比较，从而得到是否存在满足预设条件的目标试卷的信息，以及在存在满足预设条件的目标试卷时，得到相应的满足预设条件的试卷。

其中，将满足预设条件的试卷确定为与所述待搜索试卷匹配的目标试卷，具体可以为：将出现频率最大且大于第一预设阈值的试卷确定为与所述待搜索试卷匹配的目标试卷。实际在处理时，由于题库中每道题目都有相应的试卷ID信息和在当前试卷里的位置信息，因此可以根据最接近题目所在的试卷ID来判断最接近题目是属于哪张试卷的，进而可以确定出现频率最大且大于第一预设阈值的试卷ID，从而将该试卷ID确定为匹配的目标试卷。其中，某一试卷的出现频率可以用以下方式计算：最接近题目在该试卷的待搜索题目的数量与待搜索试卷中待搜索题目总数的比值，或者，该试卷与待搜索试卷相匹配的题目数量与待搜索试卷中待搜索题目总数的比值。可以理解的是，若出现频率最大的试卷的出现频率小于所述第一预设阈值，表示该出现频率最大的试卷与待搜索试卷中相匹配的题目数量太少，此时可以认为题库中不存在与待搜索试卷匹配的目标试卷。

进一步的，在步骤S13不存在满足预设条件的目标试卷的情况下，在所述待搜索试卷中包含题目类型为口算题的待搜索题目时，可以将题目类型为口算题的待搜索题目确定为待批改口算题目，针对每一待批改口算题目，利用预设的口算引擎对该待批改口算题目进行计算并输出该待批改口算题目的计算结果作为该待批改口算题目的答案，完成对所述待搜索试卷上待批改口算题目的批改。

步骤S14：在待搜索试卷中包含题目类型为口算题的待搜索题目的情况下，针对每一题目类型为口算题的待搜索题目，将该待搜索题目的特征向量与目标试卷中的各个题目的特征向量进行最短编辑距离匹配，确定目标试卷中与该待搜索题目相匹配的目标题目，若目标题目的题目类型为口算题，则确定该待搜索题目为待批改口算题目。

具体的，针对题目类型为口算题的待搜索题目，进行最短编辑距离匹配的过程可以称之为二次查找的过程，通过二次查找可以进一步确认待搜索试卷中的口算题。在二次查找时，针对每一题目类型为口算题的待搜索题目，可以将目标试卷中与该待搜索题目的最短编辑距离最小且小于第二预设阈值的题目作为该待搜索题目的搜索结果，也就是目标试卷中与该待搜索题目相匹配的目标题目。如果目标题目的题目类型也是口算题，则可以确认该待搜索题目确实为口算题，从而确定该待搜索题目为待批改口算题目。其中，对特征向量进行最短编辑距离匹配的算法属于本领域常规的计算方法，在此不做赘述。

举例而言，例如口算题A：“385×8-265＝()”和口算题B：“375×8-265＝()”，这两个题目利用题干向量化所获得的特征向量非常近似，因此，若待搜索试卷中某一题目为“385×8-265＝()”，在步骤S12中很容易将题库中的口算题B确定为该题目的最接近题目，即此时对该题目的搜索结果是不准确的。为了提高准确度，针对该题目在目标试卷中进行二次查找，查找的标准为文字的最短编辑距离最小，由于最短编辑距离不计算权重，可以很容易找到该题目在目标试卷中对应的目标题目也就是口算题A，由于口算题A的题目类型标注为口算题，从而确定该题目确实为口算题。

进一步的，在步骤S14中，还可以在所述目标题目的题目类型为口算题，且所述目标题目在所述目标试卷中的位置与该待搜索题目在所述待搜索试卷中的位置相同的情况下，确定该待搜索题目为待批改口算题目。可以理解的是，对待搜索题目和目标题目的位置进行确认，也就是将待搜索试卷中识别为口算题的题目在待搜索试卷中的位置和目标题目在目标试卷中的位置进行比较，两者位置相同表示目标题目确实是该待搜索题目的正确搜索结果，这样可以避免识别时由于向量差异，错误地将该待搜索题目识别为目标试卷中另一道近似的题目。举例而言，待批改口算题在待搜索试卷中所处的区域，与目标题目在目标试卷中所处的区域一致，则表示二者的位置相同。

步骤S15：针对每一待批改口算题目，利用预设的口算引擎对该待批改口算题目进行计算，输出口算引擎的计算结果作为该待批改口算题目的答案，完成对待搜索试卷上待批改口算题目的批改。

其中，所述预设的口算引擎可以包括预先训练的第一识别模型，所述第一识别模型是基于神经网络的模型，与第二识别模型相同，第一识别模型可以是基于空洞卷积和注意力模型建立的，具体的，采用空洞卷积对待批改口算题目进行特征提取，再通过注意力模型将提取到的特征解码成字符。

步骤S15中利用预设的口算引擎对该待批改口算题目进行计算，可以包括：首先，通过所述预先训练的第一识别模型识别出该待批改口算题目中的数字、字母、文字、字符以及计算类型，所述计算类型可以包括：四则混合运算、估算、带余数除法、分数计算、单位换算、竖式计算、脱式计算；然后，根据所识别出的数字、字母、文字、字符以及计算类型进行计算，得到该待批改口算题目的计算结果。举例而言，例如待批改口算题为“385×8-265＝()”，口算引擎通过第一识别模型可以识别出“3”、“8”、“5”、“×”、“8”、“-”、“2”、“6”、“5”、“＝”、“(”、“”、“)”，计算类型为四则混合运算，进而再自动计算得到计算结果。

进一步的，为保证口算题批改结果准确，步骤S15还可以包括：检验所述口算引擎的计算结果与该待批改口算题目在所述目标试卷上对应的参考答案是否一致，如果一致则输出所述口算引擎的计算结果作为该待批改口算题目的答案。

进一步的，当所述口算引擎的计算结果与该待批改口算题目在所述目标试卷上的参***不一致时，输出用于表示与该待批改口算题目的参***不一致的提示信息，以提示试卷批改者注意该待批改口算题目。

举例而言，若口算引擎的计算结果与该待批改口算题目在所述目标试卷上对应的参***一致，在该待批改口算题目的区域内显示口算引擎的计算结果，若不一致，在该待批改口算题目的区域内显示提示信息，提示信息可以为：“答案待确定，请手动批改”字样。

综上所述，与现有技术相比，本发明针对待搜索试卷，首先根据各个待搜索题目的题干的文字内容获得待搜索题目的特征向量，然后利用各个待搜索题目的特征向量从题库中查找与待搜索试卷相匹配的目标试卷，而对于题目类型为口算题的待搜索题目，在目标试卷内部基于题目的特征向量进行二次查找，查找的标准为最短编辑距离最小，若匹配到的目标题目的题目类型也是口算题，则确认待搜索题目为待批改口算题目，再利用预设的口算引擎对待批改口算题目进行计算并输出计算结果作为待批改口算题目的答案。可见，对于待批改口算题目，由于根据题干的文字内容获得的特征向量彼此间区分度较小，导致从题库中查找的目标试卷中的参***与待批改口算题目不匹配的可能性也较大，因此二次查找确定待批改口算题目并通过口算引擎进行计算，可以提高口算题目的批改准确度。

相应于上述针对口算题的题目批改方法实施例，本发明提供了一种针对口算题的题目批改装置，参见图2，该装置可以包括：

检测识别模块21，可以用于对待搜索试卷的影像进行检测，检测出所述待搜索试卷上的各个待搜索题目的区域，确定各个待搜索题目的题目类型，并识别出各个待搜索题目的区域中题干的文字内容；

题目查找模块22，可以用于根据每一待搜索题目的题干的文字内容，获得该待搜索题目的特征向量，并根据该待搜索题目的特征向量在题库中进行搜索，查找该待搜索题目最接近的题目；

试卷确定模块23，可以用于汇总查找到的所有待搜索题目的最接近题目所在的试卷，将满足预设条件的试卷确定为与所述待搜索试卷匹配的目标试卷；

口算题确定模块24，可以用于在所述待搜索试卷中包含题目类型为口算题的待搜索题目的情况下，针对每一题目类型为口算题的待搜索题目，将该待搜索题目的特征向量与所述目标试卷中的各个题目的特征向量进行最短编辑距离匹配，确定所述目标试卷中与该待搜索题目相匹配的目标题目，若所述目标题目的题目类型为口算题，则确定该待搜索题目为待批改口算题目；

口算题批改模块25，可以用于针对每一待批改口算题目，利用预设的口算引擎对该待批改口算题目进行计算，输出所述口算引擎的计算结果作为该待批改口算题目的答案，完成对所述待搜索试卷上待批改口算题目的批改。

可选的，所述口算题确定模块25，还可以用于在所述目标题目的题目类型为口算题，且所述目标题目在所述目标试卷中的位置与该待搜索题目在所述待搜索试卷中的位置相同的情况下，确定该待搜索题目为待批改口算题目。

可选的，所述试卷确定模块23，还可以用于在不存在满足预设条件的目标试卷的情况下，在所述待搜索试卷中包含题目类型为口算题的待搜索题目时，将题目类型为口算题的待搜索题目确定为待批改口算题目，针对每一待批改口算题目，利用预设的口算引擎对该待批改口算题目进行计算并输出该待批改口算题目的计算结果作为该待批改口算题目的答案，完成对所述待搜索试卷上待批改口算题目的批改。

可选的，所述口算题批改模块25，还可以用于检验所述口算引擎的计算结果与该待批改口算题目在所述目标试卷上对应的参***是否一致，如果一致则输出所述口算引擎的计算结果作为该待批改口算题目的答案。

可选的，所述口算题批改模块25，还可以用于当所述口算引擎的计算结果与该待批改口算题目在所述目标试卷上的参***不一致时，输出用于表示该待批改口算题目的参***不一致的提示信息，以提示试卷批改者注意该待批改口算题目。

可选的，所述预设的口算引擎可以包括预先训练的第一识别模型，所述第一识别模型是基于神经网络的模型；

所述口算题批改模块25，具体可以用于通过所述预先训练的第一识别模型识别出该待批改口算题目中的数字、字母、文字、字符以及计算类型，所述计算类型包括：四则混合运算、估算、带余数除法、分数计算、单位换算、竖式计算、脱式计算；根据所识别出的数字、字母、文字、字符以及计算类型进行计算，得到该待批改口算题目的计算结果。

可选的，所述题目查找模块22，可以包括：

特征向量获得单元，可以用于将每一待搜索题目的题干的文字内容输入预先训练的题干向量化模型中，得到每一待搜索题目的题干的特征向量，作为每一待搜索题目的特征向量，其中，所述题干向量化模型是基于神经网络的模型；

题目查找单元，可以用于针对每一待搜索题目，在题库中进行搜索，查找与该待搜索题目的特征向量相匹配的特征向量，将题库中相匹配的特征向量对应的题目确定为与该待搜索题目最接近的题目。

可选的，所述题干向量化模型可以通过以下步骤训练得到：

可选的，所述装置还可以包括：

预处理模块，可以用于预先对题库中试卷上的各个题目的特征向量建立索引信息表；

所述题目查找单元，具体可以用于针对每一待搜索题目，在所述索引信息表中查找与该待搜索题目的特征向量相匹配的特征向量；将相匹配的特征向量在所述索引信息表中对应的题目确定为与该待搜索题目最接近的题目。

可选的，所述预处理模块，还可以用于在建立所述索引信息表之前，将不同长度的特征向量按照长度进行分组；

所述题目查找单元，具体可以用于针对每一待搜索题目，在所述索引信息表中与该待搜索题目的特征向量长度相同或相近的分组内，查找与该待搜索题目的特征向量相匹配的特征向量。

可选的，所述试卷确定模块23，具体可以用于将出现频率最大且大于第一预设阈值的试卷确定为与所述待搜索试卷匹配的目标试卷。

可选的，所述检测识别模块21，具体可以用于利用预先训练好的检测模型对所述待搜索试卷的影像进行检测，检测出所述待搜索试卷上的各个待搜索题目的区域，其中，所述检测模型是基于神经网络的模型。

可选的，所述检测识别模块21，具体可以用于利用预先训练好的第二识别模型识别各个待搜索题目的区域中题干的文字内容，其中，所述第二识别模型是基于神经网络的模型。

本发明实施例一还提供了一种电子设备，如图3所示，包括处理器301、通信接口302、存储器303和通信总线304，其中，处理器301，通信接口302，存储器303通过通信总线304完成相互间的通信，

存储器303，用于存放计算机程序；

处理器301，用于执行存储器303上所存放的程序时，实现如下步骤：

步骤S13：汇总查找到的所有待搜索题目的最接近题目所在的试卷，将满足预设条件的试卷确定为与所述待搜索试卷匹配的目标试卷；

步骤S14：在所述待搜索试卷中包含题目类型为口算题的待搜索题目的情况下，针对每一题目类型为口算题的待搜索题目，将该待搜索题目的特征向量与所述目标试卷中的各个题目的特征向量进行最短编辑距离匹配，确定所述目标试卷中与该待搜索题目相匹配的目标题目，若所述目标题目的题目类型为口算题，则确定该待搜索题目为待批改口算题目；

步骤S15：针对每一待批改口算题目，利用预设的口算引擎对该待批改口算题目进行计算，输出所述口算引擎的计算结果作为该待批改口算题目的答案，完成对所述待搜索试卷上待批改口算题目的批改。

关于该方法各个步骤的具体实现以及相关解释内容可以参见上述图1所示的方法实施例，在此不做赘述。

另外，处理器301执行存储器303上所存放的程序而实现的针对口算题的题目批改方法的其他实现方式，与前述方法实施例部分所提及的实现方式相同，这里也不再赘述。

上述电子设备提到的通信总线可以是外设部件互连标准(Peripheral Component Interconnect，PCI)总线或扩展工业标准结构(Extended Industry Standard Architecture，EISA)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示，图中仅用一条粗线表示，但并不表示仅有一根总线或一种类型的总线。

通信接口用于上述电子设备与其他设备之间的通信。

存储器可以包括随机存取存储器(Random Access Memory，RAM)，也可以包括非易失性存储器(Non-Volatile Memory，NVM)，例如至少一个磁盘存储器。可选的，存储器还可以是至少一个位于远离前述处理器的存储装置。

上述的处理器可以是通用处理器，包括中央处理器(Central Processing Unit，CPU)、网络处理器(Network Processor，NP)等；还可以是数字信号处理器(Digital Signal Processing，DSP)、专用集成电路(Application Specific Integrated Circuit，ASIC)、现场可编程门阵列(Field-Programmable Gate Array，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。

本发明实施例一还提供了一种计算机可读存储介质，该计算机可读存储介质内存储有计算机程序，该计算机程序被处理器执行时实现上述的针对口算题的题目批改方法的步骤。

【实施例二】

图4是本发明另一实施例提供的针对口算题的题目批改方法的流程示意图。请参考图4，一种针对口算题的题目批改方法可以包括如下步骤：

步骤S41：对待搜索试卷的影像进行检测，检测出所述待搜索试卷上的各个待搜索题目的区域，确定各个待搜索题目的题目类型，并识别出各个待搜索题目的区域中题干的文字内容。

步骤S42：利用预设的口算引擎对待搜索试卷中包含算式和/或公式的区域进行计算处理，得到各个区域的计算结果。

步骤S42中利用预设的口算引擎对待搜索试卷中包含算式和/或公式的区域进行计算处理，可以包括：通过所述预先训练的第一识别模型识别出所述待搜索试卷中包含算式和/或公式的区域内的数字、字母、文字、字符以及计算类型，所述计算类型包括：四则混合运算、估算、带余数除法、分数计算、单位换算、竖式计算、脱式计算；根据所识别出的数字、字母、文字、字符以及计算类型进行计算，得到各个区域的计算结果。举例而言，例如待搜索试卷中某一区域包含“385×8-265＝()”，针对该区域，口算引擎通过第一识别模型可以识别出“3”、“8”、“5”、“×”、“8”、“-”、“2”、“6”、“5”、“＝”、“(”、“”、“)”，计算类型为四则混合运算，进而再自动计算得到该区域的计算结果。

步骤S43：根据每一待搜索题目的题干的文字内容，获得该待搜索题目的特征向量，并根据该待搜索题目的特征向量在题库中进行搜索，查找该待搜索题目最接近的题目。

具体的，所述步骤S43进一步可以包括：

步骤S431，将每一待搜索题目的题干的文字内容输入预先训练的题干向量化模型中，得到每一待搜索题目的题干的特征向量，作为每一待搜索题目的特征向量，其中，所述题干向量化模型是基于神经网络的模型。

步骤S432，针对每一待搜索题目，在题库中进行搜索，查找与该待搜索题目的特征向量相匹配的特征向量，将题库中相匹配的特征向量对应的题目确定为与该待搜索题目最接近的题目。

其中，可以通过向量近似搜索的方式，在题库中查找与该待搜索题目的特征向量相匹配的特征向量，具体为在题库中查找与该待搜索题目的特征向量距离最近的特征向量。可以理解的是，不同向量之间的相似性度量(Similarity Measurement)通常采用的方法就是计算向量间的“距离(Distance)”，常用的距离计算方式有：欧式距离、曼哈顿距离、夹角余弦(Cosine)等。本实施例二中采用的计算方式是夹角余弦。

相应的，步骤S432进一步可以包括：针对每一待搜索题目，在所述索引信息表中查找与该待搜索题目的特征向量相匹配的特征向量；将相匹配的特征向量在所述索引信息表中对应的题目确定为与该待搜索题目最接近的题目。

步骤S44：汇总查找到的所有待搜索题目的最接近题目所在的试卷，将满足预设条件的试卷确定为与待搜索试卷匹配的目标试卷。具体的，可通过将汇总的试卷与一预设条件比较，从而得到是否存在满足预设条件的目标试卷的信息，以及在存在满足预设条件的目标试卷时，得到相应的满足预设条件的试卷。

进一步的，在步骤S44不存在满足预设条件的目标试卷的情况下，在所述待搜索试卷中包含题目类型为口算题的待搜索题目时，可以将题目类型为口算题的待搜索题目确定为待批改口算题目，针对每一待批改口算题目，利用预设的口算引擎对该待批改口算题目进行计算并输出该待批改口算题目的计算结果作为该待批改口算题目的答案，完成对所述待搜索试卷上待批改口算题目的批改。

步骤S45：在待搜索试卷中包含题目类型为口算题的待搜索题目的情况下，针对每一题目类型为口算题的待搜索题目，将该待搜索题目的特征向量与目标试卷中的各个题目的特征向量进行最短编辑距离匹配，确定目标试卷中与该待搜索题目相匹配的目标题目，若目标题目的题目类型为口算题，则确定该待搜索题目为待批改口算题目。

举例而言，例如口算题A：“385×8-265＝()”和口算题B：“375×8-265＝()”，这两个题目利用题干向量化所获得的特征向量非常近似，因此，若待搜索试卷中某一题目为“385×8-265＝()”，在步骤S13中很容易将题库中的口算题B确定为该题目的最接近题目，即此时对该题目的搜索结果是不准确的。为了提高准确度，针对该题目在目标试卷中进行二次查找，查找的标准为文字的最短编辑距离最小，由于最短编辑距离不计算权重，可以很容易找到该题目在目标试卷中对应的目标题目也就是口算题A，由于口算题A的题目类型标注为口算题，从而确定该题目确实为口算题。

进一步的，在步骤S45中，还可以在所述目标题目的题目类型为口算题，且所述目标题目在所述目标试卷中的位置与该待搜索题目在所述待搜索试卷中的位置相同的情况下，确定该待搜索题目为待批改口算题目。可以理解的是，对待搜索题目和目标题目的位置进行确认，也就是将待搜索试卷中识别为口算题的题目在待搜索试卷中的位置和目标题目在目标试卷中的位置进行比较，两者位置相同表示目标题目确实是该待搜索题目的正确搜索结果，这样可以避免识别时由于向量差异，错误地将该待搜索题目识别为目标试卷中另一道近似的题目。举例而言，待批改口算题目在待搜索试卷中所处的区域，与目标题目在目标试卷中所处的区域一致，则表示二者的位置相同。

步骤S46：针对每一待批改口算题目，将口算引擎在该待批改口算题目区域对应的计算结果，作为该待批改口算题目的答案，并将口算引擎在所有待批改口算题目区域以外的计算结果丢弃，完成对待搜索试卷上待批改口算题目的批改。

具体的，步骤S42中口算引擎会返回很多区域的计算结果，在步骤S46中，针对每一待批改口算题目，会从很多区域的计算结果中找到和该待批改口算题目区域充分重叠的区域对应的计算结果，即为该待批改口算题目的答案。

进一步的，为保证口算题批改结果准确，步骤S46还可以包括：检验所述口算引擎的计算结果与该待批改口算题目在所述目标试卷上对应的参***是否一致，如果一致则输出所述口算引擎的计算结果作为该待批改口算题目的答案。

举例而言，若口算引擎的计算结果与该待批改口算题目在目标试卷上对应的参***一致，在该待批改口算题目的区域内显示口算引擎的计算结果，若不一致，在该待批改口算题目的区域内显示提示信息，提示信息可以为：“答案待确定，请手动批改”字样。

与现有技术相比，本发明针对待搜索试卷，利用口算引擎对待搜索试卷进行处理，同时根据各个待搜索题目的题干的文字内容获得待搜索题目的特征向量，然后利用各个待搜索题目的特征向量从题库中查找与待搜索试卷相匹配的目标试卷，而对于题目类型为口算题的待搜索题目，在目标试卷内部基于题目的特征向量进行二次查找，查找的标准为最短编辑距离最小，若匹配到的目标题目的题目类型也是口算题，则确认待搜索题目为待批改口算题目，将口算引擎在待批改口算题目区域对应的计算结果作为待批改口算题目的答案，并将口算引擎在所有待批改口算题目区域以外的计算结果丢弃。可见，对于待批改口算题目，由于根据题干的文字内容获得的特征向量彼此间区分度较小，导致从题库中查找的目标试卷中的参***与待批改口算题目不匹配的可能性也较大，因此二次查找确定待批改口算题目并采用口算引擎在待批改口算题目区域对应的计算结果作为答案，可以提高口算题目的批改准确度。

相应于上述针对口算题的题目批改方法实施例，本发明提供了一种针对口算题的题目批改装置，参见图5，该装置可以包括：

检测识别模块51，可以用于对待搜索试卷的影像进行检测，检测出所述待搜索试卷上的各个待搜索题目的区域，确定各个待搜索题目的题目类型，并识别出各个待搜索题目的区域中题干的文字内容；

计算模块52，可以用于利用预设的口算引擎对所述待搜索试卷中包含算式和/或公式的区域进行计算处理，得到各个区域的计算结果；

题目查找模块53，可以用于根据每一待搜索题目的题干的文字内容，获得该待搜索题目的特征向量，并根据该待搜索题目的特征向量在题库中进行搜索，查找该待搜索题目最接近的题目；

试卷确定模块54，可以用于汇总查找到的所有待搜索题目的最接近题目所在的试卷，将满足预设条件的试卷确定为与所述待搜索试卷匹配的目标试卷；

口算题确定模块55，可以用于在所述待搜索试卷中包含题目类型为口算题的待搜索题目的情况下，针对每一题目类型为口算题的待搜索题目，将该待搜索题目的特征向量与所述目标试卷中的各个题目的特征向量进行最短编辑距离匹配，确定所述目标试卷中与该待搜索题目相匹配的目标题目，若所述目标题目的题目类型为口算题，则确定该待搜索题目为待批改口算题目；

口算题批改模块56，可以用于针对每一待批改口算题目，将所述口算引擎在该待批改口算题目区域对应的计算结果，作为该待批改口算题目的答案，并将所述口算引擎在所有待批改口算题目区域以外的计算结果丢弃，完成对所述待搜索试卷上待批改口算题目的批改。

可选的，所述口算题确定模块55，还可以用于在所述目标题目的题目类型为口算题，且所述目标题目在所述目标试卷中的位置与该待搜索题目在所述待搜索试卷中的位置相同的情况下，确定该待搜索题目为待批改口算题目。

可选的，所述试卷确定模块54，还可以用于不存在满足预设条件的目标试卷的情况下，在所述待搜索试卷中包含题目类型为口算题的待搜索题目时，将题目类型为口算题的待搜索题目确定为待批改口算题目，针对每一待批改口算题目，将所述口算引擎在该待批改口算题目区域对应的计算结果，作为该待批改口算题目的答案，并将所述口算引擎在所有待批改口算题目区域以外的计算结果丢弃，完成对所述待搜索试卷上待批改口算题目的批改。

可选的，所述口算题批改模块56，还可以用于检验所述口算引擎的计算结果与该待批改口算题目在所述目标试卷上对应的参***是否一致，如果一致则输出所述口算引擎的计算结果作为该待批改口算题目的答案。

可选的，所述口算题批改模块56，还可以用于当所述口算引擎的计算结果与该待批改口算题目在所述目标试卷上的参***不一致时，输出用于表示与该待批改口算题目的参***不一致的提示信息，以提示试卷批改者注意该待批改口算题目。

所述计算模块52，具体可以用于通过所述预先训练的第一识别模型识别出所述待搜索试卷中包含算式和/或公式的区域内的数字、字母、文字、字符以及计算类型，所述计算类型包括：四则混合运算、估算、带余数除法、分数计算、单位换算、竖式计算、脱式计算；根据所识别出的数字、字母、文字、字符以及计算类型进行计算，得到各个区域的计算结果。

可选的，所述题目查找模块53，可以包括：

可选的，所述题干向量化模型可以通过以下步骤训练得到：

可选的，所述装置还可以包括：

可选的，所述试卷确定模块54，具体可以用于将出现频率最大且大于第一预设阈值的试卷确定为与所述待搜索试卷匹配的目标试卷。

可选的，所述检测识别模块51，具体可以用于利用预先训练好的检测模型对所述待搜索试卷的影像进行检测，检测出所述待搜索试卷上的各个待搜索题目的区域，其中，所述检测模型是基于神经网络的模型。

可选的，所述检测识别模块51，具体可以用于利用预先训练好的第二识别模型识别各个待搜索题目的区域中题干的文字内容，其中，所述第二识别模型是基于神经网络的模型。

本发明实施例二还提供了一种电子设备，可相应参考图3，包括处理器301、通信接口302、存储器303和通信总线304，其中，处理器301，通信接口302，存储器303通过通信总线304完成相互间的通信，

存储器303，用于存放计算机程序；

步骤S44：汇总查找到的所有待搜索题目的最接近题目所在的试卷，将满足预设条件的试卷确定为与所述待搜索试卷匹配的目标试卷；

步骤S45：在所述待搜索试卷中包含题目类型为口算题的待搜索题目的情况下，针对每一题目类型为口算题的待搜索题目，将该待搜索题目的特征向量与所述目标试卷中的各个题目的特征向量进行最短编辑距离匹配，确定所述目标试卷中与该待搜索题目相匹配的目标题目，若所述目标题目的题目类型为口算题，则确定该待搜索题目为待批改口算题目；

步骤S46：针对每一待批改口算题目，将所述口算引擎在该待批改口算题目区域对应的计算结果，作为该待批改口算题目的答案，并将所述口算引擎在所有待批改口算题目区域以外的计算结果丢弃，完成对所述待搜索试卷上待批改口算题目的批改。

关于该方法各个步骤的具体实现以及相关解释内容可以参见上述图4所示的方法实施例，在此不做赘述。

另外，处理器301执行存储器303上所存放的程序而实现的批改试卷中口算题的方法的其他实现方式，与前述方法实施例部分所提及的实现方式相同，这里也不再赘述。

通信接口用于上述电子设备与其他设备之间的通信。

本发明实施例二还提供了一种计算机可读存储介质，该计算机可读存储介质内存储有计算机程序，该计算机程序被处理器执行时实现上述的针对口算题的题目批改方法的步骤。

需要说明的是，本说明书中的各个实施例均采用相关的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于装置、电子设备、计算机可读存储介质实施例而言，由于其基本相似于方法实施例，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

上述描述仅是对本发明较佳实施例的描述，并非对本发明范围的任何限定，本发明领域的普通技术人员根据上述揭示内容做的任何变更、修饰，均属于权利要求书的保护范围。

Claims

一种针对口算题的题目批改方法，其特征在于，所述方法包括：

步骤S11：对待搜索试卷的影像进行检测，检测出所述待搜索试卷上的各个待搜索题目的区域，确定各个待搜索题目的题目类型，并识别出各个待搜索题目的区域中题干的文字内容；

步骤S12：根据每一待搜索题目的题干的文字内容，获得该待搜索题目的特征向量，并根据该待搜索题目的特征向量在题库中进行搜索，查找该待搜索题目最接近的题目；

步骤S13：汇总查找到的所有待搜索题目的最接近题目所在的试卷，并将汇总的试卷与预设条件比较，若存在满足预设条件的目标试卷，则将满足预设条件的试卷确定为与所述待搜索试卷匹配的目标试卷；

步骤S14：在所述待搜索试卷中包含题目类型为口算题的待搜索题目的情况下，针对每一题目类型为口算题的待搜索题目，将该待搜索题目的特征向量与所述目标试卷中的各个题目的特征向量进行最短编辑距离匹配，确定所述目标试卷中与该待搜索题目相匹配的目标题目，若所述目标题目的题目类型为口算题，则确定该待搜索题目为待批改口算题目；以及

步骤S15：针对每一待批改口算题目，利用预设的口算引擎对该待批改口算题目进行计算，输出所述口算引擎的计算结果作为该待批改口算题目的答案，从而完成对所述待搜索试卷上待批改口算题目的批改。
如权利要求1所述的针对口算题的题目批改方法，其特征在于，在步骤S14中，在所述目标题目的题目类型为口算题，且所述目标题目在所述目标试卷中的位置与该待搜索题目在所述待搜索试卷中的位置相同的情况下，确定该待搜索题目为待批改口算题目。
如权利要求1所述的针对口算题的题目批改方法，其特征在于，在步骤S13中，若不存在满足预设条件的目标试卷，并且在所述待搜索试卷中包含题目类型为口算题的待搜索题目时，则将题目类型为口算题的待搜索题目确定为待批改口算题目，并执行步骤S15。
如权利要求1所述的针对口算题的题目批改方法，其特征在于，步骤S15还包括：检验所述口算引擎的计算结果与该待批改口算题目在所述目标试卷上对应的参***是否一致，如果一致则输出所述口算引擎的计算结果作为该待批改口算题目的答案。
如权利要求4所述的针对口算题的题目批改方法，其特征在于，当所述口算引擎的计算结果与该待批改口算题目在所述目标试卷上的参***不一致时，输出用于表示与该待批改口算题目的参***不一致的提示信息。
如权利要求1所述的针对口算题的题目批改方法，其特征在于，所述预设的口算引擎包括预先训练的第一识别模型，所述第一识别模型是基于神经网络的模型；

步骤S15中利用预设的口算引擎对该待批改口算题目进行计算，包括：

通过所述预先训练的第一识别模型识别出该待批改口算题目中的数字、字母、文字、字符以及计算类型，所述计算类型包括：四则混合运算、估算、带余数除法、分数计算、单位换算、竖式计算和脱式计算中的一种；以及

根据所识别出的数字、字母、文字、字符以及计算类型进行计算，得到该待批改口算题目的计算结果。
如权利要求1所述的针对口算题的题目批改方法，其特征在于，所述步骤S12包括：

步骤S121，将每一待搜索题目的题干的文字内容输入预先训练的题干向量化模型中，得到每一待搜索题目的题干的特征向量，作为每一待搜索题目的特征向量，其中，所述题干向量化模型是基于神经网络的模型；以及

步骤S122，针对每一待搜索题目，在题库中进行搜索，查找与该待搜索题目的特征向量相匹配的特征向量，将题库中相匹配的特征向量对应的题目确定为与该待搜索题目最接近的题目。
如权利要求7所述的针对口算题的题目批改方法，其特征在于，所述题干向量化模型通过以下步骤训练得到：

对一题目样本训练集中每个题目样本进行标注处理，标注出每个题目样本中题干的文字内容；以及

利用神经网络模型对每个题目样本中题干的文字内容进行二维特征向量提取，从而训练得到所述题干向量化模型。
如权利要求7所述的针对口算题的题目批改方法，其特征在于，在执行所述步骤S12之前，所述针对口算题的题目批改方法还包括：对题库中试卷上的各个题目的特征向量建立索引信息表；

步骤S122包括：

针对每一待搜索题目，在所述索引信息表中查找与该待搜索题目的特征向量相匹配的特征向量；以及

将相匹配的特征向量在所述索引信息表中对应的题目确定为与该待搜索题目最接近的题目。
如权利要求9所述的针对口算题的题目批改方法，其特征在于，在建立所述索引信息表之前，所述针对口算题的题目批改方法还包括：将不同长度的特征向量按照长度进行分组；

所述针对每一待搜索题目，在所述索引信息表中查找与该待搜索题目的特征向量相匹配的特征向量，包括：

针对每一待搜索题目，在所述索引信息表中与该待搜索题目的特征向量长度相同或相近的分组内，查找与该待搜索题目的特征向量相匹配的特征向量。
如权利要求1所述的针对口算题的题目批改方法，其特征在于，步骤S13中，将满足预设条件的试卷确定为与所述待搜索试卷匹配的目标试卷，包括：

将出现频率最大且大于第一预设阈值的试卷确定为与所述待搜索试卷匹配的目标试卷。
如权利要求1所述的针对口算题的题目批改方法，其特征在于，步骤S11中，对待搜索试卷的影像进行检测，检测出所述待搜索试卷上的各个待搜索题目的区域，包括：

利用预先训练好的检测模型对所述待搜索试卷的影像进行检测，检测出所述待搜索试卷上的各个待搜索题目的区域，其中，所述检测模型是基于神经网络的模型。
如权利要求1所述的针对口算题的题目批改方法，其特征在于，步骤S11中，识别出各个待搜索题目的区域中题干的文字内容，包括：

利用预先训练好的第二识别模型识别各个待搜索题目的区域中题干的文字内容，其中，所述第二识别模型是基于神经网络的模型。
如权利要求1～13中任一项所述的针对口算题的题目批改方法，其特征在于，在执行步骤S11之后，执行步骤S12之前，所述针对口算题的题目批改方法还包括：

利用预设的口算引擎对所述待搜索试卷中包含算式和/或公式的区域进行计算处理，得到各个区域的计算结果；

其中，在步骤S15中，针对每一待批改口算题目，将所述口算引擎在该待批改口算题目区域对应的计算结果，作为该待批改口算题目的答案，从而完成对所述待搜索试卷上待批改口算题目的批改。
一种针对口算题的题目批改装置，其特征在于，所述装置包括：

检测识别模块，用于对待搜索试卷的影像进行检测，检测出所述待搜索试卷上的各个待搜索题目的区域，确定各个待搜索题目的题目类型，并识别出各个待搜索题目的区域中题干的文字内容；

题目查找模块，用于根据每一待搜索题目的题干的文字内容，获得该待搜索题目的特征向量，并根据该待搜索题目的特征向量在题库中进行搜索，查找该待搜索题目最接近的题目；

试卷确定模块，用于汇总查找到的所有待搜索题目的最接近题目所在的试卷，并将汇总的试卷与预设条件比较，若存在满足预设条件的目标试卷，则将满足预设条件的试卷确定为与所述待搜索试卷匹配的目标试卷；

口算题确定模块，用于在所述待搜索试卷中包含题目类型为口算题的待搜索题目的情况下，针对每一题目类型为口算题的待搜索题目，将该待搜索题目的特征向量与所述目标试卷中的各个题目的特征向量进行最短编辑距离匹配，确定所述目标试卷中与该待搜索题目相匹配的目标题目，若所述目标题目的题目类型为口算题，则确定该待搜索题目为待批改口算题目；以及

口算题批改模块，用于针对每一待批改口算题目，利用预设的口算引擎对该待批改口算题目进行计算，输出所述口算引擎的计算结果作为该待批改口算题目的答案，从而完成对所述待搜索试卷上待批改口算题目的批改。
如权利要求15所述的针对口算题的题目批改装置，其特征在于，所述口算题确定模块，还用于在所述目标题目的题目类型为口算题，且所述目标题目在所述目标试卷中的位置与该待搜索题目在所述待搜索试卷中的位置相同的情况下，确定该待搜索题目为待批改口算题目。
如权利要求15所述的针对口算题的题目批改装置，其特征在于，所述试卷确定模块，还用于在不存在满足预设条件的目标试卷，并且在所述待搜索试卷中包含题目类型为口算题的待搜索题目时，将题目类型为口算题的待搜索题目确定为待批改口算题目。
如权利要求15所述的针对口算题的题目批改装置，其特征在于，所述口算题批改模块，还用于检验所述口算引擎的计算结果与该待批改口算题目在所述目标试卷上对应的参***是否一致，如果一致则输出所述口算引擎的计算结果作为该待批改口算题目的答案；

所述口算题批改模块，还用于当所述口算引擎的计算结果与该待批改口算题目在所述目标试卷上的参***不一致时，输出用于表示与该待批改口算题目的参***不一致的提示信息。
如权利要求15所述的针对口算题的题目批改装置，其特征在于，所述预设的口算引擎包括预先训练的第一识别模型，所述第一识别模型是基于神经网络的模型；

所述口算题批改模块，用于通过所述预先训练的第一识别模型识别出该待批改口算题目中的数字、字母、文字、字符以及计算类型，所述计算类型包括：四则混合运算、估算、带余数除法、分数计算、单位换算、竖式计算和脱式计算中的一种；根据所识别出的数字、字母、文字、字符以及计算类型进行计算，得到该待批改口算题目的计算结果。
如权利要求15～19中任一项所述的针对口算题的题目批改装置，其特征在于，所述针对口算题的题目批改装置还包括：

计算模块，用于利用预设的口算引擎对所述待搜索试卷中包含算式和/或公式的区域进行计算处理，得到各个区域的计算结果；

其中，所述口算题批改模块用于针对每一待批改口算题目，将所述口算引擎在该待批改口算题目区域对应的计算结果，作为该待批改口算题目的答案，从而完成对所述待搜索试卷上待批改口算题目的批改。
一种电子设备，其特征在于，包括处理器、通信接口、存储器和通信总线，其中，所述处理器、所述通信接口和所述存储器通过所述通信总线完成相互间的通信；

所述存储器用于存放计算机程序；

所述处理器用于执行存储器上所存放的程序时，实现权利要求1-14任一所述的方法步骤。
[根据细则26改正12.10.2019]　
一种计算机可读存储介质，其特征在于，所述计算机可读存储介质内存储有计算机程序，所述计算机程序被执行时实现权利要求1-14任一项所述的方法。