WO2021073266A1

WO2021073266A1 - 基于图像检测的试题检查方法及相关设备

Info

Publication number: WO2021073266A1
Application number: PCT/CN2020/111882
Authority: WO
Inventors: 盛建达
Original assignee: 平安科技（深圳）有限公司
Priority date: 2019-10-18
Filing date: 2020-08-27
Publication date: 2021-04-22
Also published as: CN110929573A

Abstract

本申请涉及人工智能技术领域，提供一种基于图像检测的试题检查方法及相关设备。所述方法包括：获取包含有答题卡的图像；对所述图像中的文字进行识别，得到文字识别文本；对所述图像中的公式进行识别，得到公式识别文本；及建立标准答案库，利用评分深度神经网络进行标准答案学习，及利用学习后的评分深度神经网络对识别出的文字识别文本及公式识别文本对照评分规则给出得分。本申请通过建立标准答案库，利用评分深度神经网络进行标准答案学习，及利用学习后的评分深度神经网络对从图像中识别出的文字识别文本及公式识别文本对照评分规则给出得分，提高了阅卷的效率。

Description

基于图像检测的试题检查方法及相关设备

本申请要求于2019年10月18日提交中国专利局、申请号为201910996054.0，发明名称为“基于图像检测的试题检查方法及相关设备”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请涉及人工智能及图像处理领域，具体涉及一种基于图像检测的试题检查方法、装置、电子设备及计算机可读存储介质。

背景技术

现有技术仅仅只能对填图的答题卡进行自动阅卷，对于主观题仅仅只会扫描，某些考生书写比较差，但是存在大量的考生虽然书写较差但是答题过程答题逻辑完全正确。因此这时候阅卷老师就不得不仔细看试卷，在阅卷期间阅卷工作量大，阅卷任务重。然而，发明人意识到，对于现有的数学、物理试卷的填空问答题需要进行人工批阅，通常问答题都是固定答案，而简答题及主观计算题又都是公式，因而，基于传统的自然语言处理(Natural Language Processing,NLP)无法解决公式推理问题。此外，试题中的公式存在上标下标，传统的文字识别算法并未对公式识别有好的识别率，很大概率会被认为连续写的字而不被认为是上下标，因而造成阅卷效率低下。

发明内容

鉴于以上内容，有必要提出一种基于图像检测的试题检查方法、装置、电子设备及计算机可读存储介质以提高阅卷效率。

本申请的第一方面提供一种基于图像检测的试题检查方法，所述方法包括：

获取包含有答题卡的图像；

对所述图像中的文字进行识别，得到文字识别文本；

将所述图像中的公式按照连通域进行分割，将获得的字符部件序列中的字符部件两两组合为字符部件对，并使用SVM分类器将字符部件对分类，再根据分类结果将属于同一字符的字符部件组合，获得若干字符；

利用基于批量归一化和全局平均池化算法的卷积神经网络进行字符识别，获得字符的类别和字符的位置关系，对于无法识别的字符看作粘连字符，对粘连字符进行分割操作后再进行字符识别操作；

根据字符的类别和位置关系对字符的组合进行几何和语义约束，再结合CYK算法自下而上的完成公式的重构，得到公式识别文本；及

建立标准答案库，利用评分深度神经网络进行标准答案学习，及利用学习后的评分深度神经网络对识别出的文字识别文本及公式识别文本对照评分规则给出得分。

申请的第二方面提供一种基于图像检测的试题检查装置，所述装置包括：

获取模块，用于获取包含有答题卡的图像；

文字识别模块，用于对所述图像中的文字进行识别，得到文字识别文本；

公式识别模块，用于对所述图像中的公式按照连通域进行分割，将获得的字符部件序列中的字符部件两两组合为字符部件对，并使用SVM分类器将字符部件对分类，再根据分类结果将属于同一字符的字符部件组合，获得若干字符；

评分模块，用于建立标准答案库，利用评分深度神经网络进行标准答案学习，及利用学习后的评分深度神经网络对识别出的文字识别文本及公式识别文本对照评分规则给出得分。

本申请的第三方面提供一种电子设备，所述电子设备包括处理器，所述处理器用于执行存储器中存储的计算机可读指令时实现以下步骤：

获取包含有答题卡的图像；

对所述图像中的文字进行识别，得到文字识别文本；

本申请的第四方面提供一种计算机可读存储介质，所述计算机可读存储介质上存储有计算机可读指令，所述计算机可读指令被处理器执行时实现以下步骤：

获取包含有答题卡的图像；

对所述图像中的文字进行识别，得到文字识别文本；

综上所述，本申请通过建立标准答案库，利用评分深度神经网络进行标准答案学习，及利用学习后的评分深度神经网络对从图像中识别出的文字识别文本及公式识别文本对照评分规则给出得分，提高了阅卷的效率。

附图说明

图1是本申请一实施方式中基于图像检测的试题检查方法的流程图。

图2是本申请一实施方式中基于图像检测的试题检查方法的应用环境示意图。

图3是本申请一实施方式中基于图像检测的试题检查装置的示意图。

图4是本申请一实施方式中电子设备的示意图。

如下具体实施方式将结合上述附图进一步说明本申请。

具体实施方式

为了能够更清楚地理解本申请的上述目的、特征和优点，下面结合附图和具体实施例对本申请进行详细描述。需要说明的是，在不冲突的情况下，本申请的实施例及实施例中的特征可以相互组合。

在下面的描述中阐述了很多具体细节以便于充分理解本申请，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

除非另有定义，本文所使用的所有的技术和科学术语与属于本申请的技术领域的技术人员通常理解的含义相同。本文中在本申请的说明书中所使用的术语只是为了描述具体的实施例的目的，不是旨在于限制本申请。

优选地，本申请基于图像检测的试题检查方法应用在一个或者多个电子设备中。所述电子设备是一种能够按照事先设定或存储的指令，自动进行数值计算和/或信息处理的设备，其硬件包括但不限于微处理器、专用集成电路(Application Specific Integrated Circuit，ASIC)、可编程门阵列(Field－Programmable Gate Array，FPGA)、数字处理器(Digital Signal Processor，DSP)、嵌入式设备等。

所述电子设备可以是桌上型计算机、笔记本电脑、平板电脑及云端服务器等计算设备。所述设备可以与用户通过键盘、鼠标、遥控器、触摸板或声控设备等方式进行人机交互。

实施例一

图1是本申请一实施方式中基于图像检测的试题检查方法的流程图。根据不同的需求，所述流程图中步骤的顺序可以改变，某些步骤可以省略。

参阅图1所示，所述基于图像检测的试题检查方法具体包括以下步骤：

步骤S11，获取包含有答题卡的图像。

请参考图2，所示为本申请一实施方式中基于图像检测的试题检查方法的应用环境图。本实施方式中，所述方法应用在一终端装置1中。所述终端装置1包括一图像获取单元11。所述终端装置1通过所述图像获取单元11扫描所述答题卡从而获取包含有答题卡的图像。其中，所述图像获取单元11为一摄像头。在另一实施方式中，所述终端装置1可以接收与所述终端装置1通信连接的外部设备2发送的图像。

步骤S12，对所述图像中的文字进行识别，得到文字识别文本。

本实施方式中，所述对所述图像中的文字进行识别得到文字识别文本包括：利用基于深度神经网络的文字识别方法识别所述图像中的文字，得到所述文字识别文本。具体的，所述利用基于深度神经网络的文字识别方法识别所述图像中的文字，得到所述文字识别文本包括：

a)对所述图像进行预处理。

本实施方式中，对所述图像进行预处理包括对所述图像进行锐化、灰度化、二值化、矫正倾斜、降噪等处理。

b)对预处理后的图像进行分析得到多个候选文本区域。

c)将经过预处理后的图像的多个候选文本区域放入深度学习神经网络中，并将候选文本区域中的内容转换为文字识别文本。

本实施方式中，将预处理后的图像放入深度学习网络中得到多个候选文本区域。所述深度学习网络可以为卷积神经网络(CNN)，例如可以为VGG、AlexNet等卷积神经网络。本实施方式中，所述将经过预处理后的图像的多个候选文本区域放入基于深度学习神经网络中，并将候选文本区域中的内容转换为文字识别文本包括：利用全深度卷积神经网络对每个候选文本区域进行文本图像特征提取，把每个候选文本区域表示成特征向量；采用双层循环神经网络对所述特征向量进行处理，并输出关于字符集的概率分布；采用CTC网络作为转录层，将所述关于字符集的概率分布使用前向计算和反向梯度传播的动态规划算法，输出文字识别文本。

在另一实施方式中，所述利用基于深度神经网络的文字识别方法识别所述图像中的文字，得到所述文字识别文本包括：

1)将包含有答题卡的图像输入预先训练的深度神经网络中，确定所述图像中的字符区域对应的特征图；

2)通过所述深度神经网络对所述各字符区域对应的特征图进行字符识别，得到所述图像中包含的字符。

本实施方式中，所述深度神经网络是根据各样本图像、各样本图像的字符区域标定结果、以及各样本图像中包括的字符训练得到的。

在一具体实施方式中，所述特征图中的字符数据的类别包括：第一字符类别、第二字符类别、第三字符类别。本实施方式中，通过所述深度神经网络对所述各字符区域对应的特征图进行字符识别，得到所述图像中包括的字符包括：

1)获取正样本的字符数据及负样本的字符数据，并将正样本的字符数据标注字符类别，以使正样本的字符数据携带字符类别标签。

例如，分别选取500个第一字符类别、第二字符类别、第三字符类别对应的字符数据，并对每个正样本字符数据标注类别，可以以“1”作为第一字符类别的字符标签，以“2”作为第二字符类别的字符标签，以“3”作为第三字符类别的字符标签。

2)将所述正样本的字符数据及所述负样本的字符数据随机分成第一预设比例的训练集和第二预设比例的验证集，利用所述训练集训练所述深度神经网络，并利用所述验证集验证训练后的所述神经网络的准确率。

先将不同字符的训练集中的训练样本分发到不同的文件夹里。例如，将第一字符类别的训练样本分发到第一文件夹里、第二字符类别的训练样本分发到第二文件夹里、第三字符类别的训练样本分发到第三文件夹里。然后从不同的文件夹里分别提取第一预设比例(例如，70％)的训练样本作为总的训练样本进行所述深度神经网络的训练，从不同的文件夹里分别取剩余第二预设比例(例如，30％)的训练样本作为总的测试样本对训练完成的所述深度神经网络进行准确性验证。

3)若所述准确率大于或者等于预设准确率时，则结束训练，以训练后的所述深度神经网络识别所述字符数据的类别；若所述准确率小于预设准确率时，则增加正样本数量及负样本数量以重新训练所述深度神经网络直至所述准确率大于或者等于预设准确率。

本实施方式中，所述方法还包括：

显示所述图像中的答题卡上的手写字体及识别出的文字识别文本。

本申请通过在终端装置1上显示所述图像中的答题卡上的手写字体及识别出的文字识别文本，从而帮助阅卷老师快速识别潦草的字体，减少了阅卷的工作量，提高了阅卷的准确度及保证了不同考生之间阅卷结果的一致性。

步骤S13，利用卷积神经网络对所述图像中的公式进行识别，得到公式识别文本。

本实施方式中，所述利用卷积神经网络对所述图像中的公式进行识别，得到公式识别文本包括：

1)将所述图像中的公式按照连通域进行分割，将获得的字符部件序列中的字符部件两两组合为字符部件对，并使用SVM分类器将字符部件对分类，再根据分类结果将属于同一字符的字符部件组合，获得若干字符。

具体的，将所述图像中的公式按照连通域进行分割得到字符部件序列W{W0,W1,...,Wn}，根据得到的字符部件序列W{W0,W1,...,Wn}中字符部件之间的位置关系，将字符部件两两组合为字符部件对pm＝(Wi,Wj),0≤m≤n-1,0≤i,j≤n,i≠j；提取字符部件对pm＝(Wi,Wj)中两个字符部件Wi与Wj之间的几何关系特征，作为字符部件对pm的特征，其中几何关系特征包括两字符部件的包围盒中心距离、两字符部件图像质心距离、两字符部件的最短距离、包围盒水平重叠区域和/或竖直重叠区域；根据字符部件对的几何关系特征，将字符部件对分为组合类与分离类，其中属于组合类的字符部件对中两字符部件属于同一字符，属于分离类的字符部件对中两部件不属于同一字符，使用监督学习的方法训练SVM分类器，完成对字符部件对的分类；及将相邻的且属于同一字符的字符部件组合，完成断裂字符的分割。

2)利用基于批量归一化和全局平均池化算法的卷积神经网络进行字符识别，获得字符的类别和字符的位置关系；对于无法识别的字符，看作粘连字符，对粘连字符进行分割操作后再进行字符识别操作。

本实施方式中，所述基于批量归一化和全局平均池化算法的卷积神经网络，使用1×1和3×3大小的卷积核，卷积神经网络包括：依次设置的第一卷积层、第一池化层、第二卷积层、第二池化层、第三卷积层、第三池化层、第四卷积层、第四池化层、第五卷积层、全局平均池化层以及softmax层，其中，每个卷积层后都通过批量归一化算法进行归一化处理，全局平均池化层用于计算每个特征图的全局平均值。

本实施方式中，对粘连字符进行分割操作包括：使用轮廓跟踪算法，提取粘连字符M的外部轮廓C；使用凹角点检测算法，寻找字符外部轮廓C中的凹角点ci，其中0≤i≤I，I为凹角点总数；将凹角点看做候选分割点，两两连线，得到候选分割线；依次利用各候选分割线进行分割，并使用SVM分类器对分割结果进行验证识别，根据验证识别结果确定最佳分割线，从而完成粘连字符的分割操作。

3)根据字符的类别和位置关系对字符的组合进行几何和语义约束，再结合CYK算法(Cocker-Younger-Kasami algorithm)自下而上的完成公式的重构，得到所述公式识别文本。

本实施方式中，经过公式分割和字符识别以后，公式分析阶段的输入数据是字符的类别和字符的位置关系。根据字符的类别和位置关系对字符的组合进行几何和语义约束，从而完成公式的重构。具体来说：对于几何约束，通过确定当前字符的位置和大小，确定当前字符的搜索范围，对在搜索范围内的字符进行组合；对于语义约束，采用二维随机上下文无关文法对字符进行组合，从而完成公式的重构。

本实施方式中，所述方法还包括：

显示识别出的公式识别文本供用户查看。

步骤S14，建立标准答案库，利用评分深度神经网络进行标准答案学习，及利用学习后的评分深度神经网络对识别出的文字识别文本及公式识别文本对照评分规则给出得分。

在具体实施方式中，首先在评分深度神经网络中输入一份标准答案，然后随机抽取多份样本供计算机学习，答案词条匹配时采用模糊匹配方法和同义词条替换技术，在机器学习时不断更新匹配库以及词条库，输出一个新的答案库，并对答案库中的答案以N个字符为节点分解成多个模块(即标准库模块化)，将输出字符和答案库进行匹配，输出批阅结果，结合预设的评分标准给出最终的得分。

本实施方式中，所述利用学习后的评分深度神经网络对识别出的文字识别文本及公式识别文本对照评分规则给出得分包括：对所述公式识别文本中的常数进行检查分析是否正确引用，结合已有的公式数据库组成的知识图谱对公式中的每个字母表示的意义进行检查，根据常数的检查结果及公式中的字母的检查结果按照预设的评分规则计算得到最终的得分，从而提高阅卷效率。

实施例二

图3为本申请一实施方式中基于图像检测的试题检查装置40的示意图。

在一些实施例中，所述基于图像检测的试题检查装置40运行于电子设备中。所述基于图像检测的试题检查装置40可以包括多个由程序代码段所组成的功能模块。所述基于图像检测的试题检查装置40中的各个程序段的程序代码可以存储于存储器中，并由至少一个处理器所执行，以执行试题检查的功能。

本实施例中，所述基于图像检测的试题检查装置40根据其所执行的功能，可以被划分为多个功能模块。参阅图3所示，所述基于图像检测的试题检查装置40可以包括获取模块401、文字识别模块402、公式识别模块403、评分模块404及显示模块405。本申请所称的模块是指一种能够被至少一个处理器所执行并且能够完成固定功能的一系列计算机程序段，其存储在存储器中。在一些实施例中，关于各模块的功能将在后续的实施例中详述。

所述获取模块401获取包含有答题卡的图像。

所述获取模块401通过所述图像获取单元11扫描所述答题卡从而获取包含有答题卡的图像。其中，所述图像获取单元11为一摄像头。在另一实施方式中，所述获取模块401可以接收与终端装置1通信连接的外部设备2发送的图像。

所述文字识别模块402对所述图像中的文字进行识别，得到文字识别文本。

本实施方式中，所述文字识别模块402对所述图像中的文字进行识别得到文字识别文本包括：利用基于深度神经网络的文字识别方法识别所述图像中的文字，得到所述文字识别文本。具体的，所述利用基于深度神经网络的文字识别方法识别所述图像中的文字，得到所述文字识别文本包括：

a)对所述图像进行预处理。

b)对预处理后的图像进行分析得到多个候选文本区域。

本实施方式中，所述文字识别模块402将预处理后的图像放入深度学习网络中得到多个候选文本区域。所述深度学习网络可以为卷积神经网络(CNN)，例如可以为VGG、AlexNet等卷积神经网络。本实施方式中，所述文字识别模块402将经过预处理后的图像的多个候选文本区域放入深度学习神经网络中，并将候选文本区域中的内容转换为文字识别文本包括：利用全深度卷积神经网络对每个候选文本区域进行文本图像特征提取，把每个候选文本区域表示成特征向量；采用双层循环神经网络对所述特征向量进行处理，并输出关于字符集的概率分布；采用CTC网络作为转录层，将所述关于字符集的概率分布使用前向计算和反向梯度传播的动态规划算法，输出文字识别文本。

在另一实施方式中，所述文字识别模块402利用基于深度神经网络的文字识别方法识别所述图像中的文字，得到所述文字识别文本包括：

在一具体实施方式中，所述特征图中的字符数据的类别包括：第一字符类别、第二字符类别、第三字符类别。本实施方式中，所述文字识别模块402通过所述深度神经网络对所述各字符区域对应的特征图进行字符识别，得到所述图像中包括的字符包括：

本实施方式中，所述显示模块405用于显示所述图像中的答题卡上的手写字体及识别出的文字识别文本。

所述公式识别模块403利用卷积神经网络对所述图像中的公式进行识别，得到公式识别文本。具体的，所述利用卷积神经网络对所述图像中的公式进行识别，得到公式识别文本包括：

3)根据字符的类别和位置关系对字符的组合进行几何和语义约束，再结合CYK算法自下而上的完成公式的重构，得到所述公式识别文本。

本实施方式中，所述显示模块405还用于显示识别出的公式识别文本供用户查看。

所述评分模块404建立标准答案库，利用评分深度神经网络进行标准答案学习，及利用学习后的评分深度神经网络对识别出的文字识别文本及公式识别文本对照评分规则给出得分。

在具体实施方式中，所述评分模块404首先在评分深度神经网络中输入一份标准答案，然后随机抽取多份样本供计算机学习，答案词条匹配时采用模糊匹配方法和同义词条替换技术，在机器学习时不断更新匹配库以及词条库，输出一个新的答案库，并对答案库中的答案以N个字符为节点分解成多个模块(即标准库模块化)，将输出字符和答案库进行匹配，输出批阅结果，结合预设的评分标准给出最终的得分。

实施例三

图4为本申请电子设备7较佳实施例的示意图。

所述电子设备7包括存储器71、处理器72以及存储在所述存储器71中并可在所述处理器72上运行的计算机程序73。所述处理器72执行所述计算机程序73时实现上述基于图像检测的试题检查方法实施例中的步骤，例如图1所示的步骤S11～S14。或者，所述处理器72执行所述计算机程序73时实现上述基于图像检测的试题检查装置实施例中各模块/单元的功能，例如图3中的模块401～405。

示例性的，所述计算机程序73可以被分割成一个或多个模块/单元，所述一个或者多个模块/单元被存储在所述存储器71中，并由所述处理器72执行，以完成本申请。所述一个或多个模块/单元可以是能够完成特定功能的一系列计算机可读指令段，所述指令段用于描述所述计算机程序73在所述电子设备7中的执行过程。例如，所述计算机程序73可以被分割成图3中的获取模块401、文字识别模块402、公式识别模块403、评分模块404及显示模块405，各模块的具体功能参见实施例二。

本实施方式中，所述电子设备7与终端装置1为同一装置。在其他实施方式中，所述电子设备7可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。本领域技术人员可以理解，所述示意图仅仅是电子设备7的示例，并不构成对电子设备7的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件，例如所述电子设备7还可以包括输入输出设备、网络接入设备、总线等。

所称处理器72可以是中央处理模块(Central Processing Unit，CPU)，还可以是其他通用处理器、数字信号处理器(Digital Signal Processor，DSP)、专用集成电路(Application Specific Integrated Circuit，ASIC)、现场可编程门阵列(Field-Programmable Gate Array，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者所述处理器72也可以是任何常规的处理器等，所述处理器72是所述电子设备7的控制中心，利用各种接口和线路连接整个电子设备7的各个部分。

所述存储器71可用于存储所述计算机程序73和/或模块/单元，所述处理器72通过运行或执行存储在所述存储器71内的计算机程序和/或模块/单元，以及调用存储在存储器71内的数据，实现所述电子设备7的各种功能。所述存储器71可主要包括存储程序区和存储数据区，其中，存储程序区可存储操作***、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等；存储数据区可存储根据电子设备7的使用所创建的数据(比如音频数据)等。此外，存储器71可以包括非易失性和易失性存储器，例如硬盘、内存、插接式硬盘，智能存储卡(Smart Media Card,SMC)，安全数字(Secure Digital,SD)卡，闪存卡(Flash Card)、至少一个磁盘存储器件、闪存器件、或者其他能够用于携带或存储数据的计算机可读的存储介质。所述计算机可读存储介质可以是非易失性，也可以是易失性的。

所述电子设备7集成的模块/单元如果以软件功能模块的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本申请实现上述实施例方法中的全部或部分流程，也可以通过计算机程序来指令相关的硬件来完成，所述的计算机程序可存储于一计算机可读存储介质中，所述计算机程序在被处理器执行时，可实现上述各个方法实施例的步骤。其中，所述计算机程序包括计算机可读指令代码，所述计算机可读指令代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括：能够携带所述计算机可读指令代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM，Read-Only Memory)、随机存取存储器等。

在本申请所提供的几个实施例中，应该理解到，所揭露的电子设备和方法，可以通过其它的方式实现。例如，以上所描述的电子设备实施例仅仅是示意性的，例如，所述模块的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式。

另外，在本申请各个实施例中的各功能模块可以集成在相同处理模块中，也可以是各个模块单独物理存在，也可以两个或两个以上模块集成在相同模块中。上述集成的模块既可以采用硬件的形式实现，也可以采用硬件加软件功能模块的形式实现。

对于本领域技术人员而言，显然本申请不限于上述示范性实施例的细节，而且在不背离本申请的精神或基本特征的情况下，能够以其他的具体形式实现本申请。因此，无论从哪一点来看，均应将实施例看作是示范性的，而且是非限制性的，本申请的范围由所附权利要求而不是上述说明限定，因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本申请内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。此外，显然“包括”一词不排除其他模块或步骤，单数不排除复数。电子设备权利要求中陈述的多个模块或电子设备也可以由同一个模块或电子设备通过软件或者硬件来实现。第一，第二等词语用来表示名称，而并不表示任何特定的顺序。

最后应说明的是，以上实施例仅用以说明本申请的技术方案而非限制，尽管参照较佳实施例对本申请进行了详细说明，本领域的普通技术人员应当理解，可以对本申请的技术方案进行修改或等同替换，而不脱离本申请技术方案的精神和范围。

Claims

一种基于图像检测的试题检查方法，其中，所述方法包括：

获取包含有答题卡的图像；

对所述图像中的文字进行识别，得到文字识别文本；

将所述图像中的公式按照连通域进行分割，将获得的字符部件序列中的字符部件两两组合为字符部件对，并使用SVM分类器将字符部件对分类，再根据分类结果将属于同一字符的字符部件组合，获得若干字符；

利用基于批量归一化和全局平均池化算法的卷积神经网络进行字符识别，获得字符的类别和字符的位置关系，对于无法识别的字符看作粘连字符，对粘连字符进行分割操作后再进行字符识别操作；

根据字符的类别和位置关系对字符的组合进行几何和语义约束，再结合CYK算法自下而上的完成公式的重构，得到公式识别文本；及

建立标准答案库，利用评分深度神经网络进行标准答案学习，及利用学习后的评分深度神经网络对识别出的文字识别文本及公式识别文本对照评分规则给出得分。
如权利要求1所述的基于图像检测的试题检查方法，其中，所述对所述图像中的文字进行识别得到文字识别文本包括：

对所述图像进行预处理；

对预处理后的图像进行分析得到多个候选文本区域；及

将经过预处理后的图像的多个候选文本区域放入深度学习神经网络中，并将候选文本区域中的内容转换为文字识别文本。
如权利要求1所述的基于图像检测的试题检查方法，其中，所述对所述图像进行预处理包括：

对所述图像进行锐化、灰度化、二值化、矫正倾斜、降噪等处理。
如权利要求2所述的基于图像检测的试题检查方法，其中，所述将经过预处理后的图像的多个候选文本区域放入深度学习神经网络中，并将候选文本区域中的内容转换为文字识别文本包括：

利用全深度卷积神经网络对每个候选文本区域进行文本图像特征提取，把每个候选文本区域表示成特征向量；

采用双层循环神经网络对所述特征向量进行处理，并输出关于字符集的概率分布；及

采用CTC网络作为转录层，将所述关于字符集的概率分布使用前向计算和反向梯度传播的动态规划算法，输出所述文字识别文本。
如权利要求1所述的基于图像检测的试题检查方法，其中，所述对所述图像中的文字进行识别得到文字识别文本包括：

将包含有答题卡的图像输入预先训练的深度神经网络中，确定所述图像中的字符区域对应的特征图；及

通过所述深度神经网络对所述各字符区域对应的特征图进行字符识别，得到所述图像中包含的字符。
如权利要求5所述的基于图像检测的试题检查方法，其中，所述特征图中的字符数据的类别包括：第一字符类别、第二字符类别、第三字符类别，所述通过所述深度神经网络对所述各字符区域对应的特征图进行字符识别得到所述图像中包括的字符包括：

获取正样本的字符数据及负样本的字符数据，并将正样本的字符数据标注字符类别，以使正样本的字符数据携带字符类别标签；

将所述正样本的字符数据及所述负样本的字符数据随机分成第一预设比例的训练集和第二预设比例的验证集，利用所述训练集训练所述深度神经网络，并利用所述验证集验证训练后的所述神经网络的准确率；及

若所述准确率大于或者等于预设准确率时，则结束训练，以训练后的所述深度神经网络识别所述字符数据的类别；若所述准确率小于预设准确率时，则增加正样本数量及负样本数量以重新训练所述深度神经网络直至所述准确率大于或者等于预设准确率。
如权利要求1所述的基于图像检测的试题检查方法，其中，对粘连字符进行分割操作包括：

使用轮廓跟踪算法提取粘连字符的外部轮廓；使用凹角点检测算法，寻找粘连字符的外部轮廓中的凹角点；将凹角点看做候选分割点，两两连线，得到候选分割线；依次利用各候选分割线对粘连字符进行分割，并使用SVM分类器对分割结果进行验证识别，根据验证识别结果确定最佳分割线，并完成粘连字符的分割操作。
一种基于图像检测的试题检查装置，其中，所述装置包括：

获取模块，用于获取包含有答题卡的图像；

文字识别模块，用于对所述图像中的文字进行识别，得到文字识别文本；

公式识别模块，用于对所述图像中的公式按照连通域进行分割，将获得的字符部件序列中的字符部件两两组合为字符部件对，并使用SVM分类器将字符部件对分类，再根据分类结果将属于同一字符的字符部件组合，获得若干字符；

利用基于批量归一化和全局平均池化算法的卷积神经网络进行字符识别，获得字符的类别和字符的位置关系，对于无法识别的字符看作粘连字符，对粘连字符进行分割操作后再进行字符识别操作；

根据字符的类别和位置关系对字符的组合进行几何和语义约束，再结合CYK算法自下而上的完成公式的重构，得到公式识别文本；及

评分模块，用于建立标准答案库，利用评分深度神经网络进行标准答案学习，及利用学习后的评分深度神经网络对识别出的文字识别文本及公式识别文本对照评分规则给出得分。
一种电子设备，其中：所述电子设备包括处理器，所述处理器用于执行存储器中存储的计算机可读指令以实现以下步骤：

获取包含有答题卡的图像；

对所述图像中的文字进行识别，得到文字识别文本；

将所述图像中的公式按照连通域进行分割，将获得的字符部件序列中的字符部件两两组合为字符部件对，并使用SVM分类器将字符部件对分类，再根据分类结果将属于同一字符的字符部件组合，获得若干字符；

利用基于批量归一化和全局平均池化算法的卷积神经网络进行字符识别，获得字符的类别和字符的位置关系，对于无法识别的字符看作粘连字符，对粘连字符进行分割操作后再进行字符识别操作；

根据字符的类别和位置关系对字符的组合进行几何和语义约束，再结合CYK算法自下而上的完成公式的重构，得到公式识别文本；及

建立标准答案库，利用评分深度神经网络进行标准答案学习，及利用学习后的评分深度神经网络对识别出的文字识别文本及公式识别文本对照评分规则给出得分。
如权利要求9所述的电子设备，其中，所述处理器执行所述计算机可读指令以实现对所述图像中的文字进行识别得到文字识别文本时，具体包括：

对所述图像进行预处理；

对预处理后的图像进行分析得到多个候选文本区域；及

将经过预处理后的图像的多个候选文本区域放入深度学习神经网络中，并将候选文本区域中的内容转换为文字识别文本。
如权利要求9所述的电子设备，其中，所述处理器执行所述计算机可读指令以实现对所述图像进行预处理时，具体包括：

对所述图像进行锐化、灰度化、二值化、矫正倾斜、降噪等处理。
如权利要求10所述的电子设备，其中，所述处理器执行所述计算机可读指令以实现将经过预处理后的图像的多个候选文本区域放入深度学习神经网络中并将候选文本区域中的内容转换为文字识别文本时，具体包括：

利用全深度卷积神经网络对每个候选文本区域进行文本图像特征提取，把每个候选文本区域表示成特征向量；

采用双层循环神经网络对所述特征向量进行处理，并输出关于字符集的概率分布；及

采用CTC网络作为转录层，将所述关于字符集的概率分布使用前向计算和反向梯度传播的动态规划算法，输出所述文字识别文本。
如权利要求9所述的电子设备，其中，所述处理器执行所述计算机可读指令以实现对所述图像中的文字进行识别得到文字识别文本时，具体包括：

将包含有答题卡的图像输入预先训练的深度神经网络中，确定所述图像中的字符区域对应的特征图；及

通过所述深度神经网络对所述各字符区域对应的特征图进行字符识别，得到所述图像中包含的字符。
如权利要求13所述的电子设备，其中，所述特征图中的字符数据的类别包括第一字符类别、第二字符类别、第三字符类别，所述处理器执行所述计算机可读指令以实现通过所述深度神经网络对所述各字符区域对应的特征图进行字符识别得到所述图像中包括的字符时，具体包括：

获取正样本的字符数据及负样本的字符数据，并将正样本的字符数据标注字符类别，以使正样本的字符数据携带字符类别标签；

将所述正样本的字符数据及所述负样本的字符数据随机分成第一预设比例的训练集和第二预设比例的验证集，利用所述训练集训练所述深度神经网络，并利用所述验证集验证训练后的所述神经网络的准确率；及

若所述准确率大于或者等于预设准确率时，则结束训练，以训练后的所述深度神经网络识别所述字符数据的类别；若所述准确率小于预设准确率时，则增加正样本数量及负样本数量以重新训练所述深度神经网络直至所述准确率大于或者等于预设准确率。
如权利要求9所述的电子设备，其中，所述处理器执行所述计算机可读指令以实现对粘连字符进行分割操作时，具体包括：

使用轮廓跟踪算法提取粘连字符的外部轮廓；使用凹角点检测算法，寻找粘连字符的外部轮廓中的凹角点；将凹角点看做候选分割点，两两连线，得到候选分割线；依次利用各候选分割线对粘连字符进行分割，并使用SVM分类器对分割结果进行验证识别，根据验证识别结果确定最佳分割线，并完成粘连字符的分割操作。
一种计算机可读存储介质，所述计算机可读存储介质上存储有计算机可读指令，其中，所述计算机可读指令被处理器执行时实现以下步骤：

获取包含有答题卡的图像；

对所述图像中的文字进行识别，得到文字识别文本；

将所述图像中的公式按照连通域进行分割，将获得的字符部件序列中的字符部件两两组合为字符部件对，并使用SVM分类器将字符部件对分类，再根据分类结果将属于同一字符的字符部件组合，获得若干字符；

利用基于批量归一化和全局平均池化算法的卷积神经网络进行字符识别，获得字符的类别和字符的位置关系，对于无法识别的字符看作粘连字符，对粘连字符进行分割操作后再进行字符识别操作；

根据字符的类别和位置关系对字符的组合进行几何和语义约束，再结合CYK算法自下而上的完成公式的重构，得到公式识别文本；及

建立标准答案库，利用评分深度神经网络进行标准答案学习，及利用学习后的评分深度神经网络对识别出的文字识别文本及公式识别文本对照评分规则给出得分。
如权利要求16所述的计算机可读存储介质，其中，所述计算机可读指令被所述处理器执行以对所述图像中的文字进行识别得到文字识别文本时，具体包括：

对所述图像进行预处理；

对预处理后的图像进行分析得到多个候选文本区域；及

将经过预处理后的图像的多个候选文本区域放入深度学习神经网络中，并将候选文本区域中的内容转换为文字识别文本。
如权利要求16所述的计算机可读存储介质，其中，所述计算机可读指令被所述处理器执行以对所述图像进行预处理时，具体包括：

对所述图像进行锐化、灰度化、二值化、矫正倾斜、降噪等处理。
如权利要求17所述的计算机可读存储介质，其中，所述计算机可读指令被所述处理器执行以将经过预处理后的图像的多个候选文本区域放入深度学习神经网络中并将候选文本区域中的内容转换为文字识别文本时，具体包括：

利用全深度卷积神经网络对每个候选文本区域进行文本图像特征提取，把每个候选文本区域表示成特征向量；

采用双层循环神经网络对所述特征向量进行处理，并输出关于字符集的概率分布；及

采用CTC网络作为转录层，将所述关于字符集的概率分布使用前向计算和反向梯度传播的动态规划算法，输出所述文字识别文本。
如权利要求16所述的计算机可读存储介质，其中，所述计算机可读指令被所述处理器执行以对所述图像中的文字进行识别得到文字识别文本时，具体包括：

将包含有答题卡的图像输入预先训练的深度神经网络中，确定所述图像中的字符区域对应的特征图；及

通过所述深度神经网络对所述各字符区域对应的特征图进行字符识别，得到所述图像中包含的字符。