CN111832401A

CN111832401A - 一种电子阅卷识别方法

Info

Publication number: CN111832401A
Application number: CN202010498443.3A
Authority: CN
Inventors: 高峰
Original assignee: Beijing Hex Technology Co ltd
Current assignee: Beijing Hex Technology Co ltd
Priority date: 2020-06-04
Filing date: 2020-06-04
Publication date: 2020-10-27

Abstract

本发明涉及一种电子阅卷识别方法，包括构建目标检测的图像数据集，主要包括真实图像的采集、清洗以及标注，深度卷积神经网络的训练以及测试，主要包括图像的预处理、网络结构的设计、训练、测试、实测以及确定效果最优的网络模型，第三部分对最优模型的使用，主要包括给出输出图像的坐标和分类信息，排除干扰因素，提高阅卷识别准确率，因此对试卷没有特殊的印刷要求，老师可以在在试卷中可以使用任何深色笔批改，都可识别处，降低了试卷背景的要求，降低了对采集图像的清晰度要求，降低了对拍摄设备的要求。

Description

一种电子阅卷识别方法

技术领域

本发明涉及信息处理技术领域，具体是指一种电子阅卷识别方法。

背景技术

网上阅卷就是以计算机网络技术和电子扫描技术为依托，以控制主观题评卷误差、实现测试公平性原则为最终目的，实行客观题由计算机程序控制对考生填涂的信息点自动判分，主观题由评卷教师进行纸质批改后，扫描发送给计算机程序，由计算机程序对老师批改后的带有批改符号的考生答卷的进行识别评分，最后由计算机程序自动统计合成考生成绩的一种新型阅卷方式。现有的自动阅卷***的中的识别及检测方法对于答题卡或试卷的背景及清晰度都有较高的要求，要求试卷面卷面整洁，不能有涂抹，必须用规定的写字笔，否则会影响识别和检测结果，导致自动阅卷的失败。

发明内容

本发明要解决的技术问题是，提供一种新的处理试卷中老师的批改符号检测，可以有效地对批改符号的目标位置及目标分类信息进行准确读入的电子阅卷识别方法。

为解决上述技术问题，本发明提供的技术方案为：一种电子阅卷识别方法，它包括以下步骤：

步骤一，构建目标检测的图像数据集，所述构建目标检测的图像数据集包括对阅卷***中图像分割功能得到试卷图像数据进行图像采集，对图像采集后的图像数据进行清洗，抛弃不合格的样本，对清洗后的图像数据进行批改符号的位置信息以及分类信息的标注，

步骤二，对所述目标检测的图像数据集进行深度卷积神经网络的训练以及测试，所述深度卷积神经网络的训练以及测试包括对图像进行预处理，对预处理过的图像进行深度卷积神经网络的设计、训练、测试得到最优的网络模型，

所述深度卷积神经网络的设计、训练、测试包括对数据集内图像的数量、特征复杂度、计算资源设计深度卷积神经网络用于提取特征，将卷积神经网络的浅、中、深三个层次的特征图通过反卷积、合并操作后得到的特征图用于检测目标，将数据集中的样本分为训练集、交叉验证集和测试集三部分进行深度卷积神经网络训练，将深度卷积神经网络训练后的模型部署在服务器中测试线上收集的图片精度，根据测试结果确定表现最优的网络模型，

步骤三，对所述最优的网络模型输入图像进行预测，所述最优的网络模型输入图像的预测方法包括对阅卷***中图像分割功能截取试卷中待识别的图像区域，对截取的图像采集预处理和抛弃不合格的样本，使用最优的网络模型预测，获得试卷中符号的坐标信息以及分类，

步骤四，根据所述最优的网络模型返回的结果统计试卷的得分以及对答题情况进行分析显示。

采用以上结构后，本发明具有如下优点：通过使用构建目标检测的图像数据集、深度卷积神经网络的训练以及测试、确定效果最优的网络模型以及对最优模型的使用，排除干扰因素，提高阅卷识别准确率，因此对试卷没有特殊的印刷要求，老师可以在在试卷中可以使用任何深色笔批改，都可识别处，降低了试卷背景的要求，降低了对采集图像的清晰度要求，降低了对拍摄设备的要求。

作为改进，所述深度卷积神经网络卷积计算的激活函数公式设为Leaky Relu激活函数，所述深度卷积神经网络卷积计算的损失函数公式包括置信度损失、分类损失以及边界框坐标损失，其中边界框坐标损失设为GIoU_loss计算方法。

作为改进，所述图像预处理包括减均值、减方差、随机旋转、双线性插值。

作为改进，所述深度卷积神经网络训的练训练集的数量占比80％，交叉验证集的数量占比10％，测试集的数量占比10％，通过设置卷积神经网络中的超参数达到训练的目的。

具体实施方式

下面对本发明做进一步的详细说明。

一种电子阅卷识别方法，它包括以下步骤：

所述深度卷积神经网络卷积计算的激活函数公式设为Leaky Relu激活函数，所述深度卷积神经网络卷积计算的损失函数公式包括置信度损失、分类损失以及边界框坐标损失，其中边界框坐标损失设为GIoU_loss计算方法。

所述图像预处理包括减均值、减方差、随机旋转、双线性插值。

所述深度卷积神经网络训的练训练集的数量占比80％，交叉验证集的数量占比10％，测试集的数量占比10％。

本发明在具体实施时，智能阅卷***中的目标检测内容有三部分。第一部分是构建目标检测的图像数据集，主要包括真实图像的采集、清洗以及标注；第二部分是深度卷积神经网络的训练以及测试，主要包括图像的预处理、网络结构的设计、训练、测试、实测以及确定效果最优的网络模型；第三部分对最优模型的使用，主要包括给出输出图像的坐标和分类信息。具体步骤如下：

(1)构建目标检测的图像数据集

S1-1)：图像采集

根据阅卷***中图像分割功能得到试卷的待检测区域，共收集了约3万幅的图像数据集。

S1-2)：图像清洗

检测数据集中的图像样本，抛弃不合格的样本。

S1-3)：标注

使用软件对数据集中的图像数据进行标注，标注的内容包括批改符号的位置信息以及分类信息。

(2)深度卷积神经网络的训练以及测试

S2-1)：图像预处理

所有的图像进行预处理操作，减均值、减方差、随机旋转、双线性插值等操作。

S2-2)：深度卷积神经网络的设计

根据数据集内图像的数量、特征复杂度、计算资源设计了28层的深度卷积神经网络用于提取特征，其中将卷积神经网络的浅、中、深三个层次的特征图通过反卷积、合并操作后得到的特征图用于检测目标。

其主要包括以下函数：

(1-3-1)激活函数

激活函数(Activation functions)对于深度卷积神经网络模型去学习、理解非常复杂和非线性的函数来说具有十分重要的作用。激活函数加入了非线性因素的，解决线性模型所不能解决的问题。目标检测网络中使用了Leaky Relu作为激活函数，其数学公式如下所示。

其中λ_i是一个很小的常数。

(1-3-2)损失函数

网络中分别设计了置信度损失、分类损失以及边界框坐标损失，其中边界框坐标损失使用GIoU_loss的方法计算，见公式(2-2)。

其中λ是判断网格内有无物体的置信度，GroundTruth_w和GroundTruth_h表示真实框的宽度和高度，width和height表示预测框的宽度和高度。GIoU是对IoU(边界框的交并比)的一种改进，其公式如下所示：

其中C是边界框A和边界框B的最小凸集。

S2-3)：深度卷积神经网络训练

将数据集中的样本分为训练集、交叉验证集和测试集三部分：其中训练集的数量为80％，交叉验证集的数量为10％，测试集的数量为10％。通过设置卷积神经网络中的超参数达到训练的目的。

S2-4)：深度卷积神经网络的测试

将S(2-3)中的模型部署在服务器中，用于测试线上收集图片的精度。

S2-5)：得到最优网络模型

根据S2-4)中的测试结果确定表现最优的网络模型，并将其应用于实际场景。

(3)使用最优模型对输入图像进行预测

S3-1)获取试卷中待预测的图像区域

获取的图像的方法与构建数据集所使用的方法相同。

S3-2)：图像预处理

与S2-1)的处理方法相同。

S3-3)：使用模型预测目标的位置坐标及分类

实际场景中应用，获得试卷中符号的坐标信息以及分类。

S3-4)：统计得分及分析

根据网络模型返回的结果，统计试卷的得分以及对答题情况进行分析，为之后的班级学情、学生学情以及学生画像等功能提供重要的基础。

本发明通过使用构建目标检测的图像数据集、深度卷积神经网络的训练以及测试、确定效果最优的网络模型以及对最优模型的使用，排除干扰因素，提高阅卷识别准确率，因此对试卷没有特殊的印刷要求，老师可以在在试卷中可以使用任何深色笔批改，都可识别处，降低了试卷背景的要求，降低了对采集图像的清晰度要求，降低了对拍摄设备的要求。

以上对本发明及其实施方式进行了描述，这种描述没有限制性，实际的结构并不局限于此。总而言如果本领域的普通技术人员受其启示，在不脱离本发明创造宗旨的情况下，不经创造性的设计出与该技术方案相似的结构方式及实施例，均应属于本发明的保护范围。

Claims

1.一种电子阅卷识别方法，其特征在于：它包括以下步骤：

步骤二，对所述目标检测的图像数据集进行深度卷积神经网络的训练以及测试，所述深度卷积神经网络的训练以及测试包括对图像进行预处理，对预处理过的图像进行深度卷积神经网络的设计、训练、测试得到最优的网络模型，所述深度卷积神经网络的设计、训练、测试包括对数据集内图像的数量、特征复杂度、计算资源设计深度卷积神经网络用于提取特征，将卷积神经网络的浅、中、深三个层次的特征图通过反卷积、合并操作后得到的特征图用于检测目标，将数据集中的样本分为训练集、交叉验证集和测试集三部分进行深度卷积神经网络训练，将深度卷积神经网络训练后的模型部署在服务器中测试线上收集的图片精度，根据测试结果确定表现最优的网络模型，

2.根据权利要求1所述的一种电子阅卷识别方法，其特征在于：所述深度卷积神经网络卷积计算的激活函数公式设为Leaky Relu激活函数，所述深度卷积神经网络卷积计算的损失函数公式包括置信度损失、分类损失以及边界框坐标损失，其中边界框坐标损失设为GIoU_loss计算方法。

3.根据权利要求1所述的一种电子阅卷识别方法，其特征在于：所述图像预处理包括减均值、减方差、随机旋转、双线性插值。

4.根据权利要求1所述的一种电子阅卷识别方法，其特征在于：所述深度卷积神经网络训的练训练集的数量占比80％，交叉验证集的数量占比10％，测试集的数量占比10％。