CN111832401A - 一种电子阅卷识别方法 - Google Patents

一种电子阅卷识别方法 Download PDF

Info

Publication number
CN111832401A
CN111832401A CN202010498443.3A CN202010498443A CN111832401A CN 111832401 A CN111832401 A CN 111832401A CN 202010498443 A CN202010498443 A CN 202010498443A CN 111832401 A CN111832401 A CN 111832401A
Authority
CN
China
Prior art keywords
image
neural network
convolutional neural
training
deep convolutional
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN202010498443.3A
Other languages
English (en)
Inventor
高峰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Hex Technology Co ltd
Original Assignee
Beijing Hex Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Hex Technology Co ltd filed Critical Beijing Hex Technology Co ltd
Priority to CN202010498443.3A priority Critical patent/CN111832401A/zh
Publication of CN111832401A publication Critical patent/CN111832401A/zh
Withdrawn legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/413Classification of content, e.g. text, photographs or tables
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/20Education
    • G06Q50/205Education administration or guidance
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/26Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
    • G06V10/267Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion by performing operations on regions, e.g. growing, shrinking or watersheds

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • Educational Administration (AREA)
  • Economics (AREA)
  • Tourism & Hospitality (AREA)
  • Artificial Intelligence (AREA)
  • Data Mining & Analysis (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Health & Medical Sciences (AREA)
  • General Business, Economics & Management (AREA)
  • Development Economics (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Marketing (AREA)
  • Educational Technology (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Multimedia (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Game Theory and Decision Science (AREA)
  • Computing Systems (AREA)
  • Molecular Biology (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Evolutionary Biology (AREA)
  • Primary Health Care (AREA)
  • Image Analysis (AREA)

Abstract

本发明涉及一种电子阅卷识别方法,包括构建目标检测的图像数据集,主要包括真实图像的采集、清洗以及标注,深度卷积神经网络的训练以及测试,主要包括图像的预处理、网络结构的设计、训练、测试、实测以及确定效果最优的网络模型,第三部分对最优模型的使用,主要包括给出输出图像的坐标和分类信息,排除干扰因素,提高阅卷识别准确率,因此对试卷没有特殊的印刷要求,老师可以在在试卷中可以使用任何深色笔批改,都可识别处,降低了试卷背景的要求,降低了对采集图像的清晰度要求,降低了对拍摄设备的要求。

Description

一种电子阅卷识别方法
技术领域
本发明涉及信息处理技术领域,具体是指一种电子阅卷识别方法。
背景技术
网上阅卷就是以计算机网络技术和电子扫描技术为依托,以控制主观题评卷误差、实现测试公平性原则为最终目的,实行客观题由计算机程序控制对考生填涂的信息点自动判分,主观题由评卷教师进行纸质批改后,扫描发送给计算机程序,由计算机程序对老师批改后的带有批改符号的考生答卷的进行识别评分,最后由计算机程序自动统计合成考生成绩的一种新型阅卷方式。现有的自动阅卷***的中的识别及检测方法对于答题卡或试卷的背景及清晰度都有较高的要求,要求试卷面卷面整洁,不能有涂抹,必须用规定的写字笔,否则会影响识别和检测结果,导致自动阅卷的失败。
发明内容
本发明要解决的技术问题是,提供一种新的处理试卷中老师的批改符号检测,可以有效地对批改符号的目标位置及目标分类信息进行准确读入的电子阅卷识别方法。
为解决上述技术问题,本发明提供的技术方案为:一种电子阅卷识别方法,它包括以下步骤:
步骤一,构建目标检测的图像数据集,所述构建目标检测的图像数据集包括对阅卷***中图像分割功能得到试卷图像数据进行图像采集,对图像采集后的图像数据进行清洗,抛弃不合格的样本,对清洗后的图像数据进行批改符号的位置信息以及分类信息的标注,
步骤二,对所述目标检测的图像数据集进行深度卷积神经网络的训练以及测试,所述深度卷积神经网络的训练以及测试包括对图像进行预处理,对预处理过的图像进行深度卷积神经网络的设计、训练、测试得到最优的网络模型,
所述深度卷积神经网络的设计、训练、测试包括对数据集内图像的数量、特征复杂度、计算资源设计深度卷积神经网络用于提取特征,将卷积神经网络的浅、中、深三个层次的特征图通过反卷积、合并操作后得到的特征图用于检测目标,将数据集中的样本分为训练集、交叉验证集和测试集三部分进行深度卷积神经网络训练,将深度卷积神经网络训练后的模型部署在服务器中测试线上收集的图片精度,根据测试结果确定表现最优的网络模型,
步骤三,对所述最优的网络模型输入图像进行预测,所述最优的网络模型输入图像的预测方法包括对阅卷***中图像分割功能截取试卷中待识别的图像区域,对截取的图像采集预处理和抛弃不合格的样本,使用最优的网络模型预测,获得试卷中符号的坐标信息以及分类,
步骤四,根据所述最优的网络模型返回的结果统计试卷的得分以及对答题情况进行分析显示。
采用以上结构后,本发明具有如下优点:通过使用构建目标检测的图像数据集、深度卷积神经网络的训练以及测试、确定效果最优的网络模型以及对最优模型的使用,排除干扰因素,提高阅卷识别准确率,因此对试卷没有特殊的印刷要求,老师可以在在试卷中可以使用任何深色笔批改,都可识别处,降低了试卷背景的要求,降低了对采集图像的清晰度要求,降低了对拍摄设备的要求。
作为改进,所述深度卷积神经网络卷积计算的激活函数公式设为Leaky Relu激活函数,所述深度卷积神经网络卷积计算的损失函数公式包括置信度损失、分类损失以及边界框坐标损失,其中边界框坐标损失设为GIoUloss计算方法。
作为改进,所述图像预处理包括减均值、减方差、随机旋转、双线性插值。
作为改进,所述深度卷积神经网络训的练训练集的数量占比80%,交叉验证集的数量占比10%,测试集的数量占比10%,通过设置卷积神经网络中的超参数达到训练的目的。
具体实施方式
下面对本发明做进一步的详细说明。
一种电子阅卷识别方法,它包括以下步骤:
步骤一,构建目标检测的图像数据集,所述构建目标检测的图像数据集包括对阅卷***中图像分割功能得到试卷图像数据进行图像采集,对图像采集后的图像数据进行清洗,抛弃不合格的样本,对清洗后的图像数据进行批改符号的位置信息以及分类信息的标注,
步骤二,对所述目标检测的图像数据集进行深度卷积神经网络的训练以及测试,所述深度卷积神经网络的训练以及测试包括对图像进行预处理,对预处理过的图像进行深度卷积神经网络的设计、训练、测试得到最优的网络模型,
所述深度卷积神经网络的设计、训练、测试包括对数据集内图像的数量、特征复杂度、计算资源设计深度卷积神经网络用于提取特征,将卷积神经网络的浅、中、深三个层次的特征图通过反卷积、合并操作后得到的特征图用于检测目标,将数据集中的样本分为训练集、交叉验证集和测试集三部分进行深度卷积神经网络训练,将深度卷积神经网络训练后的模型部署在服务器中测试线上收集的图片精度,根据测试结果确定表现最优的网络模型,
步骤三,对所述最优的网络模型输入图像进行预测,所述最优的网络模型输入图像的预测方法包括对阅卷***中图像分割功能截取试卷中待识别的图像区域,对截取的图像采集预处理和抛弃不合格的样本,使用最优的网络模型预测,获得试卷中符号的坐标信息以及分类,
步骤四,根据所述最优的网络模型返回的结果统计试卷的得分以及对答题情况进行分析显示。
所述深度卷积神经网络卷积计算的激活函数公式设为Leaky Relu激活函数,所述深度卷积神经网络卷积计算的损失函数公式包括置信度损失、分类损失以及边界框坐标损失,其中边界框坐标损失设为GIoUloss计算方法。
所述图像预处理包括减均值、减方差、随机旋转、双线性插值。
所述深度卷积神经网络训的练训练集的数量占比80%,交叉验证集的数量占比10%,测试集的数量占比10%。
本发明在具体实施时,智能阅卷***中的目标检测内容有三部分。第一部分是构建目标检测的图像数据集,主要包括真实图像的采集、清洗以及标注;第二部分是深度卷积神经网络的训练以及测试,主要包括图像的预处理、网络结构的设计、训练、测试、实测以及确定效果最优的网络模型;第三部分对最优模型的使用,主要包括给出输出图像的坐标和分类信息。具体步骤如下:
(1)构建目标检测的图像数据集
S1-1):图像采集
根据阅卷***中图像分割功能得到试卷的待检测区域,共收集了约3万幅的图像数据集。
S1-2):图像清洗
检测数据集中的图像样本,抛弃不合格的样本。
S1-3):标注
使用软件对数据集中的图像数据进行标注,标注的内容包括批改符号的位置信息以及分类信息。
(2)深度卷积神经网络的训练以及测试
S2-1):图像预处理
所有的图像进行预处理操作,减均值、减方差、随机旋转、双线性插值等操作。
S2-2):深度卷积神经网络的设计
根据数据集内图像的数量、特征复杂度、计算资源设计了28层的深度卷积神经网络用于提取特征,其中将卷积神经网络的浅、中、深三个层次的特征图通过反卷积、合并操作后得到的特征图用于检测目标。
其主要包括以下函数:
(1-3-1)激活函数
激活函数(Activation functions)对于深度卷积神经网络模型去学习、理解非常复杂和非线性的函数来说具有十分重要的作用。激活函数加入了非线性因素的,解决线性模型所不能解决的问题。目标检测网络中使用了Leaky Relu作为激活函数,其数学公式如下所示。
Figure BDA0002523765950000031
其中λi是一个很小的常数。
(1-3-2)损失函数
网络中分别设计了置信度损失、分类损失以及边界框坐标损失,其中边界框坐标损失使用GIoUloss的方法计算,见公式(2-2)。
Figure BDA0002523765950000041
其中λ是判断网格内有无物体的置信度,GroundTruthw和GroundTruthh表示真实框的宽度和高度,width和height表示预测框的宽度和高度。GIoU是对IoU(边界框的交并比)的一种改进,其公式如下所示:
Figure BDA0002523765950000042
其中C是边界框A和边界框B的最小凸集。
S2-3):深度卷积神经网络训练
将数据集中的样本分为训练集、交叉验证集和测试集三部分:其中训练集的数量为80%,交叉验证集的数量为10%,测试集的数量为10%。通过设置卷积神经网络中的超参数达到训练的目的。
S2-4):深度卷积神经网络的测试
将S(2-3)中的模型部署在服务器中,用于测试线上收集图片的精度。
S2-5):得到最优网络模型
根据S2-4)中的测试结果确定表现最优的网络模型,并将其应用于实际场景。
(3)使用最优模型对输入图像进行预测
S3-1)获取试卷中待预测的图像区域
获取的图像的方法与构建数据集所使用的方法相同。
S3-2):图像预处理
与S2-1)的处理方法相同。
S3-3):使用模型预测目标的位置坐标及分类
实际场景中应用,获得试卷中符号的坐标信息以及分类。
S3-4):统计得分及分析
根据网络模型返回的结果,统计试卷的得分以及对答题情况进行分析,为之后的班级学情、学生学情以及学生画像等功能提供重要的基础。
本发明通过使用构建目标检测的图像数据集、深度卷积神经网络的训练以及测试、确定效果最优的网络模型以及对最优模型的使用,排除干扰因素,提高阅卷识别准确率,因此对试卷没有特殊的印刷要求,老师可以在在试卷中可以使用任何深色笔批改,都可识别处,降低了试卷背景的要求,降低了对采集图像的清晰度要求,降低了对拍摄设备的要求。
以上对本发明及其实施方式进行了描述,这种描述没有限制性,实际的结构并不局限于此。总而言如果本领域的普通技术人员受其启示,在不脱离本发明创造宗旨的情况下,不经创造性的设计出与该技术方案相似的结构方式及实施例,均应属于本发明的保护范围。

Claims (4)

1.一种电子阅卷识别方法,其特征在于:它包括以下步骤:
步骤一,构建目标检测的图像数据集,所述构建目标检测的图像数据集包括对阅卷***中图像分割功能得到试卷图像数据进行图像采集,对图像采集后的图像数据进行清洗,抛弃不合格的样本,对清洗后的图像数据进行批改符号的位置信息以及分类信息的标注,
步骤二,对所述目标检测的图像数据集进行深度卷积神经网络的训练以及测试,所述深度卷积神经网络的训练以及测试包括对图像进行预处理,对预处理过的图像进行深度卷积神经网络的设计、训练、测试得到最优的网络模型,所述深度卷积神经网络的设计、训练、测试包括对数据集内图像的数量、特征复杂度、计算资源设计深度卷积神经网络用于提取特征,将卷积神经网络的浅、中、深三个层次的特征图通过反卷积、合并操作后得到的特征图用于检测目标,将数据集中的样本分为训练集、交叉验证集和测试集三部分进行深度卷积神经网络训练,将深度卷积神经网络训练后的模型部署在服务器中测试线上收集的图片精度,根据测试结果确定表现最优的网络模型,
步骤三,对所述最优的网络模型输入图像进行预测,所述最优的网络模型输入图像的预测方法包括对阅卷***中图像分割功能截取试卷中待识别的图像区域,对截取的图像采集预处理和抛弃不合格的样本,使用最优的网络模型预测,获得试卷中符号的坐标信息以及分类,
步骤四,根据所述最优的网络模型返回的结果统计试卷的得分以及对答题情况进行分析显示。
2.根据权利要求1所述的一种电子阅卷识别方法,其特征在于:所述深度卷积神经网络卷积计算的激活函数公式设为Leaky Relu激活函数,所述深度卷积神经网络卷积计算的损失函数公式包括置信度损失、分类损失以及边界框坐标损失,其中边界框坐标损失设为GIoUloss计算方法。
3.根据权利要求1所述的一种电子阅卷识别方法,其特征在于:所述图像预处理包括减均值、减方差、随机旋转、双线性插值。
4.根据权利要求1所述的一种电子阅卷识别方法,其特征在于:所述深度卷积神经网络训的练训练集的数量占比80%,交叉验证集的数量占比10%,测试集的数量占比10%。
CN202010498443.3A 2020-06-04 2020-06-04 一种电子阅卷识别方法 Withdrawn CN111832401A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010498443.3A CN111832401A (zh) 2020-06-04 2020-06-04 一种电子阅卷识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010498443.3A CN111832401A (zh) 2020-06-04 2020-06-04 一种电子阅卷识别方法

Publications (1)

Publication Number Publication Date
CN111832401A true CN111832401A (zh) 2020-10-27

Family

ID=72897799

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010498443.3A Withdrawn CN111832401A (zh) 2020-06-04 2020-06-04 一种电子阅卷识别方法

Country Status (1)

Country Link
CN (1) CN111832401A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112990180A (zh) * 2021-04-29 2021-06-18 北京世纪好未来教育科技有限公司 判题方法、装置、设备及存储介质
CN113449727A (zh) * 2021-07-19 2021-09-28 中国电子科技集团公司第二十八研究所 一种基于深度神经网络的伪装目标检测识别方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112990180A (zh) * 2021-04-29 2021-06-18 北京世纪好未来教育科技有限公司 判题方法、装置、设备及存储介质
CN113449727A (zh) * 2021-07-19 2021-09-28 中国电子科技集团公司第二十八研究所 一种基于深度神经网络的伪装目标检测识别方法

Similar Documents

Publication Publication Date Title
CN112149667B (zh) 一种基于深度学习的指针式仪表的自动读数的方法
CN112699876B (zh) 一种用于集气站多类型仪表自动读数方法
CN107590498A (zh) 一种基于字符分割级联二分类器的自适应汽车仪表检测方法
CN202939608U (zh) 阅卷***
CN108921163A (zh) 一种基于深度学习的包装喷码检测方法
CN105787522B (zh) 基于手写笔迹的书写态度评价方法及***
CN106033535B (zh) 电子阅卷方法
CN105046200B (zh) 基于直线检测的电子阅卷方法
CN104077577A (zh) 一种基于卷积神经网络的商标检测方法
CN112819093A (zh) 基于小数据集与卷积神经网络的人机不同步识别方法
CN110414563A (zh) 考试成绩统计方法、***及计算机可读存储介质
CN112507758A (zh) 答题卡字符串识别方法、装置、终端和计算机存储介质
CN111832401A (zh) 一种电子阅卷识别方法
CN110288612B (zh) 铭牌定位与校正方法及设备
CN111753873A (zh) 一种图像检测方法和装置
CN115393861B (zh) 一种手写体文本精准分割方法
CN116798036B (zh) 用于识别和校验答题卡客观题识别结果的方法及装置
CN110659637A (zh) 一种结合深度神经网络和sift特征的电能表示数与标签自动识别方法
CN109472257B (zh) 一种字符版面确定方法及装置
CN109523514A (zh) 对逆合成孔径雷达isar的批量成像质量评估方法
CN113762274B (zh) 一种答题卡目标区域检测方法、***、存储介质及设备
CN115359295A (zh) 一种解耦知识蒸馏金具目标检测方法及***
CN108089753B (zh) 一种利用Faster-RCNN对指尖位置进行预测的定位方法
CN112699824B (zh) 电能表仪表常数检测方法、设备及存储介质
CN116612478A (zh) 一种脱机手写汉字的评分方法、装置及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WW01 Invention patent application withdrawn after publication

Application publication date: 20201027

WW01 Invention patent application withdrawn after publication