CN107729936A - 一种改错题自动评阅方法及*** - Google Patents

一种改错题自动评阅方法及*** Download PDF

Info

Publication number
CN107729936A
CN107729936A CN201710947823.9A CN201710947823A CN107729936A CN 107729936 A CN107729936 A CN 107729936A CN 201710947823 A CN201710947823 A CN 201710947823A CN 107729936 A CN107729936 A CN 107729936A
Authority
CN
China
Prior art keywords
answer
image
read
point
answer image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201710947823.9A
Other languages
English (en)
Other versions
CN107729936B (zh
Inventor
胡阳
何春江
戴文娟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
iFlytek Co Ltd
Original Assignee
iFlytek Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by iFlytek Co Ltd filed Critical iFlytek Co Ltd
Priority to CN201710947823.9A priority Critical patent/CN107729936B/zh
Publication of CN107729936A publication Critical patent/CN107729936A/zh
Application granted granted Critical
Publication of CN107729936B publication Critical patent/CN107729936B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/153Segmentation of character regions using recognition of characters or words

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Character Discrimination (AREA)

Abstract

本发明实施例提供一种改错题自动评阅方法及装置,属于图像处理领域。该方法包括:获取待阅答题介质上各书写答案对应的单点答题图像;利用预设图像检测方法和/或基于预设识别模型对获取到的各单点答题图像进行图像识别,获得识别结果;根据识别信息获得对应评阅特征,根据所述评阅特征基于预设评阅模型,对各书写答案进行评阅。本具体实施例方法能够克服由于改错题答题模式的复杂导致答题图像识别不准的技术问题,从而具有快速、准确进行改错题评阅的有益效果。

Description

一种改错题自动评阅方法及***
技术领域
本发明涉及图像信息处理技术领域,更具体地,涉及改错题自动评阅方法及***。
背景技术
在当代的语言类应试考试中,(短文)改错题属于主观试题的客观考察。既考察答题者各方面的基础知识,又考察答题者综合运用语言的能力。从设题方面,题目从词法、句法和行文逻辑三个角度考查应试者在语篇中综合运用相应语种语言的能力;细节上对时态、语态、词谓语动词、名词、冠词、形容词、连词、代词以及句子的承接方面进行考查。答题者通过手写的方式对考题中文字进行增加、删除或修改的方式进行答题。
近年来,随着计算机技术和信息技术的迅速发展,尤其是人工智能技术的快速推进,使用人工智能来代替传统人工已经成为各行各业的热点方向。应试教育领域的阅卷模式也由传统的纯人工评阅,逐步演变为由人工智能代替部分人工实现自动评阅。现有主流的试卷自动评阅,除了最早实现实用的客观题,还有部分技术发展站在行业前列的产品,已实现作文、填空题的自动评阅。
然而,对于改错题,受限于答题者作答中书写笔迹的复杂多样性(如对于“增加”的手写标志“∧”会因答题人不同出现各种手写样式),所以改错题迄今仍需要改卷者人工评阅。特别是在大规模的考试时,如中高考、语言等级考试时,人工评阅的方式耗时耗力,给评阅人员带来很大的工作压力;此外,人工评阅还常容易受评阅人员主观性影响,使得评阅结果有失公正性。
综上所述,现有技术中亟待提供一种改错题的自动评阅方案。
发明内容
为了解决上述问题,本发明实施例提供一种克服上述问题或者至少部分地解决上述问题的改错题自动评阅方法及装置。
根据本发明实施例的第一方面,提供了一种改错题自动评阅方法,该方法包括:
获取待阅答题介质上各书写答案对应的单点答题图像;
利用预设图像检测方法和/或基于预设识别模型对获取到的各单点答题图像进行图像识别,获得识别结果;
根据识别信息获得对应评阅特征,根据所述评阅特征基于预设评阅模型,对各书写答案进行评阅。
根据本发明实施例的另一方面,提供了一种改错题自动评阅装置,该装置包括:
获取模块,用于获取待阅答题介质上各书写答案对应的单点答题图像;
识别模块,用于利用预设图像检测方法和/或基于预设识别模型对获取到的各单点答题图像进行图像识别,获得识别结果;
评阅模块,用于根据识别信息获得对应评阅特征,根据所述评阅特征基于预设评阅模型,对各书写答案进行评阅。
根据本发明实施例的第三方面,提供了一种改错题自动评阅电子设备,包括:
至少一个处理器;以及
与处理器通信连接的至少一个存储器,其中:
存储器存储有可被处理器执行的程序指令,处理器调用程序指令能够执行第一方面的各种可能的实现方式中任一种可能的实现方式所提供的改错题自动评阅方法。
根据本发明的第四方面,提供了一种非暂态计算机可读存储介质,非暂态计算机可读存储介质存储计算机指令,计算机指令使计算机执行第一方面的各种可能的实现方式中任一种可能的实现方式所提供的改错题自动评阅方法。
本发明上述实施例提供一种改错题自动评阅方法及装置,所述方法能够克服由于改错题答题模式的复杂导致答题图像信息识别不准的技术问题,从而具有自动、快速并准确进行改错题评阅的有益效果。
附图说明
图1为本发明实施例的一种改错题自动评阅方法的流程示意图;
图2为本发明实施例的一种改错题自动评阅方法中对待评阅错题图像进行处理的示意图;
图3为本发明实施例的一种改错题自动评阅方法中预先构建的具体受限网络的结构示意图;
图4为本发明实施例的一种改错题自动评阅装置的框图;
图5为本发明实施例的一种改错题自动评阅电子设备的框图。
具体实施方式
下面结合附图和实施例,对本发明的具体实施方式作进一步详细描述。以下实施例用于说明本发明,但不用来限制本发明的范围。
随着图像识别技术的发展,图像识别技术的应用领域越来越广。目前,图像识别技术已经应用于教育领域。现有技术中,已经存在利用图像识别技术进行部分试题分数评阅的方法。然而,对于语言类应试考试中,(短文)改错题,由于其答题规则的复杂性(包括:添加、删除、修改等),且受限于答题人各种手写笔迹的的多样性与个性化,现有技术中,并没有于对于该种题型的自动化判卷技术方案。
针对上述情形,本发明实施例提供了一种改错题自动评阅方法。该方法适用于对于语言类改错类(短文改错类)题型的评阅;本方法可应用于带有图像采集识别功能的智能设备或***,本发明实施例对此不作具体限定。为了便于描述,本发明实施例以执行主体为智能设备为例。如图1所示,所述方法包括:S1,获取待阅答题介质上各书写答案对应的单点答题图像;S2,利用预设图像检测方法和/或基于预设识别模型对获取到的各单点答题图像进行图像识别,获得识别结果;S3,根据识别信息获得对应评阅特征,根据所述评阅特征基于预设评阅模型,对各书写答案进行评阅;所述识别信息包含所述识别结果和识别中间过程信息。
在上述具体实施例中,所述S1中所述待阅答题介质上各书写答案对应的单点答题图像为包含各个答题者手写答案的图像,所述单点答题图像的获取可以通过拍照、摄像、扫描或者直接导入预先拍摄好的图像文件的方式进行,本发明实施例对此不作具体限定。
进一步,所述S2中对于正确答案为删除时,能够通过对所述单点答题图像进行图像检测,进而判断所述单点答题图像是否存在对应的删除作答;对于正确答案为修改或添加时,既能够基于预先生成的神经网络识别模型对所述各单点答题图像整个字符串进行识别,获得识别结果;也可以先对各单点答题图像进行单个手写字符的切分,对切分后包含各单个手写字符的各子图像进行识别,获得识别结果。
进一步,所述S3根据S2中获得的识别结果,基于预先训练得到的神经网络评阅模型获得各书写答案的评阅结果。
在本发明上述任一具体实施例的基础上,提供一种改错题自动评阅方法,所述获取待阅答题介质上各书写答案对应的单点答题图像的步骤,包括:根据待阅答题介质的答题图像以及与所述待阅答题介质对应的答题介质模板,获取所述待阅答题介质上各书写答案对应的单点答题图像;其中,所述答题介质模板包括待答试题中各字符的位置信息,以及根据正确答案预先设定的至少一个单点答题区域,所述单点答题图像是根据对应的单点答题区域而获取的。
在上述具体实施例中,所述待阅答题介质的答题图像的获取可以通过拍照、摄像、扫描或者直接导入预先拍摄好的图像文件的方式进行,本发明实施例对此不作具体限定。进一步,通过对根据对所述待阅答题介质的答题模板(可以是待阅答题介质的答题卡、也可以是所述待阅答题介质的答题试卷、电子答题文本文件等其他包含题目文字的答题介质)的布局进行切分,获得所述待阅答题介质的答题图像。所述改错题图像内既可以包含整个所述待阅答题介质的答题图像,也可以包含部分所述待阅答题介质的答题图像,本发明实施例在此不作具体限定。
进一步,在本发明该实施例中,由于待阅答题介质的答题图像中必然既存所述待评阅改错题中的题目印刷字符图像,在也存在答题者作答手写的答题信息图像。所以本具体实施例预先生成待评阅试题的模板,由于在设定所述模板时,针对改错题的不同作答方式对应基于预先设定的规则选定相应的位置区域,所以能够使得所述模板中包含题目中各正确答案(即各单点答题图像)的选取位置区域。在本实施例中,再利用所述模板中的选取位置区域,从所述待阅答题介质的答题图像中获取各单点答题图像。
进一步,如图2所示,以针对改错题的改错类型预先设定答题形式,如以高考英语改错为例,改错答题类型包括修改、删除和添加。其中修改作答模式为在待修改单词下方标记横线并写出相应的正确答案(如图中打印字体parent、crowded、on、looks、where、telling和a及其对应的作答图像所示);删除的答题模式为在待删除单词上划线以示删除(如图中打印字体very及其对应的作答图像所示);添加的答题模式为在待添加两字符串中间位置下方手写标志“∧”并写出添加的答案(如图中打印字体promised和her之间“∧”及其对应的作答图像所示)。
接下来首先对本实施例中预先生成的待评阅试题模板生成过程进行进一步说明。图2中,首先对未进行答题的改错题试题图像进行水平投影,实现对试题图像的水平切分;接着对每行试题图像进行垂直投影从而实现试题中单字符切分,得到改错试题中每个字符串的位置信息。
进一步,所述单点答题区域为:当正确答案为删除时,试卷中待删除字符串所占区域增加预设比例或预设长度的宽度,和增加预设比例或预设长度的高度所围成的区域。当正确答案为修改时,试卷中待修改印刷字符串下方的预设区域。当正确答案为添加时,试卷中待添加两印刷字符串中间下方的预设区域。
优选的,所述实施例中各答题图像的选取位置区域具体为:删除答题类型的答题图像选取位置区域,题目中待删除字印刷符串所占区域及左右扩展1/n宽度、上下扩展1/m高度所围成的区域,所述n≥1,m≥1。优选的,修改答题类型的答题图像选取位置区域为,题目中待修改字印刷符串下方,宽度为单词答案左右扩1/2宽度、高度为行间距所围成的区域。优选的,添加答题类型的答题图像选取位置区域为,题目中待添加的两个印刷符串下方,宽度为基于统计得到的最宽字符的宽度,高度为行间距所围成的区域。
在本发明上述任一具体实施例的基础上,提供一种改错题自动评阅方法,所述利用预设图像检测方法和/或基于预设识别模型对获取到的各单点答题图像进行图像识别,获得识别结果,包括:
对于正确答案为删除时,通过检测对应单点答题图像内是否存在至少一个删除标记,获得是否存在删除作答的识别结果;
当正确答案为修改或添加时,基于与正确答案对应预先构建的受限网络,对对应单点答题图像进行单个手写字符切分,获得所述单点答题图像的各子图像;基于预先构建的改错题识别模型,对所述各子图像进行识别,获得所述各子图像中包含的单个手写字符的识别结果。
在上述具体实施例中,对于删除的答题模式,可以通过检测所述单点答题图像中印刷字符上是否存在至少一个删除标记,来判断所述答题点是否作答正确。其中,具体的较为简单的方案如检测预先生成的待评阅试题模板中试题中目标印刷字符串与考生答题后各单点答题图像中的所有像素点重合度,若不重合像素点数量或所占比例大于设定阈值,则认为该答题点存在删除作答。进一步优选的,关于删除答题的检测,还可采用现有技术中所存在的其他横线/斜线检测方法,在此不做赘述。
进一步,对正确答案为修改或添加的单点答题图像进行检测时,需要将单点答题图像作为输入,基于预先训练的到的改错题识别模型,对所述目标单点答题图像进行识别,获得相应的识别结果。在本发明该实施例中,具体的,为了更精准的实现对目标答题图像的识别,首先需要对所述目标单点答题图像中的整个字符串进行单个手写字符图像的切分。本实施例中采用针对各个答题样本正确答案中手写字符串建立的受限网络,遍历所述目标单点答题图像,获得所述目标单点答题图像中各单个手写字符的子图像。将所述目标单点答题图像中各单点字符的手写字符子图像作为输入,基于预先训练得到的改错题识别模型,对所述目标单点答题图像进行识别,获得所述目标单点答题图像中各单个手写字符为各字符的概率值,概率值最大的对应字符为最终识别结果。
在本发明上述任一具体实施例的基础上,提供一种改错题自动评阅方法,所述预先构建的受限网络根据其所对应正确答案预先构建,包括起始层、结束层、各单个手写字符子单元层和存在于前述各层间的吸收层:
所述各单个手写字符子单元层分别根据其所对应正确答案中各单个字符的手写样本图像构建;
所述各吸收层到所述各单个手写字符子单元层及结束层存在前跳转弧和后跳转弧。
在上述具体实施例中,所述受限网络中各个层级跳转至各个层级均有属于该层的得分值和跳转分值(一般属于吸收层会有惩罚分,属于字符子单元有一个匹配得分)。所述吸收层包括fil(噪音吸收)和sil(静音声吸收)节点。
进一步,由于待评阅试卷的正确答案已知,即预先知道题目中的哪个字符串需要对应修改为哪个字符串、哪两个字符串间需要添加哪个字符串,因而可以利用已知的正确答案信息对目标单点答题图像进行处理,即可通过预先构建的受限网络对目标单点答题图像进行单个手写字符的切分,从而获得包含单个手写字符的各子图像。
具体的,所述预先构建的受限网络的构建分为如下步骤。所述受限网络需要对每个对应答题点字符串构建一个限定网络。如示意图3所示,所述限定网络包括起始层S、结束层E、字符中各单个手写字符子单元层ai以及前述所有层之间的吸收层FS,且各吸收层到所有的单个手写字符子单元及结束层均存在跳转弧(即有前跳和后跳)、跳转至每个层级均有属于该层的得分值和跳转分值(一般属于吸收层会有惩罚分,属于字符子单元有一个匹配得分)。所述各单个手写字符子单元层分别根据其所对应答题点正确答案中各单个字符的手写样本图像构建。
在本发明上述任一具体实施例的基础上,提供一种改错题自动评阅方法,所述基于与正确答案对应预先构建的受限网络,对对应单点答题图像进行单个手写字符切分,获得所述单点答题图像的各子图像,包括:
沿x轴方向,利用预设像素宽度、所述单点答题图像高度的窗口遍历所述单点答题图像,将遍历获得的像素输入与正确答案对应预先构建的受限网络,获得所述单点答题图像的各子图像。
在上述具体实施例中,基于图3所示网络(所述图3中的a1、a2、a3、a4分别对应“that”四个字符的图像识别模型),假设先对目标单点答题图像“that”进行单个字符的切分:沿x轴方向,利用预设像素宽度(例如5个像素宽度)、所述目标单点答题图像高度的窗口遍历所述目标单点答题图像“that”,将遍历获得的像素输入与所述目标单点答题图像“that”相对应的预先构建的受限网络;对当前接收的像素沿图3中从左至右的方式分别利用所述a1至a4的单个手写字符子单元层进行解码,如果第一个单个手写字符确认为“t”,则被a1所识别;如果第二个单个手写字符“h”被a2所成功识别,则a1和a2之间不存在跳转。假设目标单点为“tthat”,当第一个单个手写字符确被a1所识别后,因第二个单个手写字符仍然为“t”,则a1进行自跳。再假设目标单点为“txhat”,当第一个单个手写字符确被a1所识别后,因第二个单个手写字符不为“that”中四个字符中的任意一个,则a1前跳至a1之前的一个吸收层FS中;再进一步假设目标单点为“tat”,当第一个单个手写字符确被a1所识别后,因第二个单个手写字符为“a”,则a1后跳至a3。
通过上述预先构建的受限网络,可以得到如下结论:前跳或自跳字符子单元占该单点答题图像中字符子单元总数的比例,与正确答案新增字符数量成正比;发生后跳字符子单元占该单点答题图像中字符子单元总数的比例,与正确答案漏写的字符数量成正比;沿x轴方向利用预设像素宽度的窗口遍历所述目标单点答题图像获得的像素被所述吸收层所吸收像素点数,占所述单点答题图像像素点总数的比例,与所述目标单点答题图像中错误字符数量也成正比关系。
在本发明上述任一具体实施例的基础上,提供一种改错题自动评阅方法,所述改错题识别模型通过以下步骤训练获得:
将样本单点答题图像进行单个手写字符切分,获得样本单点答题图像的各样本子图像;
对所述各样本子图像进行识别结果的标注;
根据各样本子图像,利用预先确定的神经网络拓扑结构和训练算法,训练得到改错题识别模型。
在上述具体实施例中,所述预先构建的改错题识别模型具体构建方法如下:首先收集修改和添加答题图像数据,并对答题图像数据进行标注(包括答题单手写字符图像的切分和各个手写字符子单元的识别结果标注);接着确定改错识别模型的拓扑结构(采用现有常见的神经网络即可,如DNN、CNN等);最后基于训练数据及确定的拓扑结构,采用现有训练算法(如BP算法)进行改错识别模型的训练。
在本发明上述任一具体实施例的基础上,提供一种改错题自动评阅方法,所述根据识别信息获得对应评阅特征,根据所述评阅特征基于预设评阅模型,对各书写答案进行评阅,包括:当待识别正确答案为删除时,根据单点答题图像是否存在删除作答的识别结果,获得相应的评阅结果;
当待识别正确答案为修改或添加时,根据对应单点答题图像的各子图像进行单个手写字符切分时的跳转信息、及各子图像中包含单个手写字符为相应字符的概率,基于预设评阅方法,获得所述单点答题图像的至少一项评阅特征;根据所述评阅特征,基于预先构建的评阅模型,得到所述目标单点答题图像的评阅结果。
在上述具体实施例中,基于所有目标单点答题图像中各字符子样本图像的评阅给出整个改错题的评阅结果,如所有目标单点答题图像评阅的均值、线性加权等。
进一步,所述根据所述评阅特征,基于预先构建的评阅模型,得到所述目标单点答题图像的评阅结果,包括:将所述各项评阅特征,作为所述预先构建的评阅模型的输入,获得所述目标单点答题图像的评阅结果,例如分数值等。
在本发明上述任一具体实施例的基础上,提供一种改错题自动评阅方法,所述根据识别信息获得对应评阅特征,根据所述评阅特征基于预设评阅模型,对各书写答案进行评阅,包括:当待识别正确答案为删除时,根据单点答题图像是否存在删除作答的识别结果,获得相应的评阅结果;
当待识别正确答案为修改或添加时,根据对应单点答题图像的各子图像进行单个手写字符切分时的跳转信息、及各子图像中包含单个手写字符为相应字符的概率,基于预设评阅方法,获得所述单点答题图像的至少一项评阅特征;根据所述评阅特征,基于预先构建的评阅模型,得到所述目标单点答题图像的评阅结果。
在本发明上述任一具体实施例的基础上,提供一种改错题自动评阅方法,所述评阅特征至少包括答题识别后验概率特征和字符切分解码路径的覆盖度特征,还能够包括增写字符比例特征、漏写字符比例特征和被吸收像素比例特征中的至少一种;其中:
所述答题识别后验概率特征,为所述单点答题图像中包含的单个手写字符为相应字符概率的平均值;
所述字符切分解码路径的覆盖度特征,为所述单点答题图像在进行单个手写字符切分时,遍历经过的单个手写字符数量与所述受限网络中手写字符子单元层数量的比值;
所述增写字符比例特征,为所述单点答题图像在进行单个手写字符切分时,前跳或自跳字符子单元占该单点答题图像中字符子单元总数的比例;
所述漏写字符比例特征,为所述单点答题图像在进行单个手写字符切分时,后跳字符子单元占该单点答题图像中字符子单元总数的比例;
所述被吸收像素比例特征,为所述单点答题图像在进行单个手写字符切分时,沿x轴方向利用预设像素宽度的窗口遍历所述目标单点答题图像获得的像素被所述吸收层所吸收像素点数,占所述单点答题图像像素点总数的比例。
如图4所示,在本发明任一上述具体实施例的基础上,提供一种改错题自动评阅装置,包括:
获取模块A1,用于获取待阅答题介质上各书写答案对应的单点答题图像;识别模块A2,用于利用预设图像检测方法和/或基于预设识别模型对获取到的各单点答题图像进行图像识别,获得识别结果;评阅模块A3,用于根据识别信息获得对应评阅特征,根据所述评阅特征基于预设评阅模型,对各书写答案进行评阅;所述识别信息包含所述识别结果和识别中间过程信息。
在本发明任一上述具体实施例的基础上,提供一种改错题自动评阅装置,所述获取模块进一步用于:
根据待阅答题介质的答题图像以及与所述待阅答题介质对应的答题介质模板,获取所述待阅答题介质上各书写答案对应的单点答题图像;其中,所述答题介质模板包括待答试题中各字符的位置信息,以及根据正确答案预先设定的至少一个单点答题区域,所述单点答题图像是根据对应的单点答题区域而获取的。
在本发明任一上述具体实施例的基础上,提供一种改错题自动评阅装置,所述识别模块,进一步用于:
对于正确答案为删除时,通过检测对应单点答题图像内是否存在至少一个删除标记,获得是否存在删除作答的识别结果;
当正确答案为修改或添加时,基于与正确答案对应预先构建的受限网络,对对应单点答题图像进行单个手写字符切分,获得所述单点答题图像的各子图像;基于预先构建的改错题识别模型,对所述各子图像进行识别,获得所述各子图像中包含的单个手写字符的识别结果。
在本发明任一上述具体实施例的基础上,提供一种改错题自动评阅装置,所述预先构建的受限网络根据其所对应正确答案预先构建,包括起始层、结束层、各单个手写字符子单元层和存在于前述各层间的吸收层:
所述各单个手写字符子单元层分别根据其所对应正确答案中各单个字符的手写样本图像构建;
所述各吸收层到所述各单个手写字符子单元层及结束层存在前跳转弧和后跳转弧。
在本发明任一上述具体实施例的基础上,提供一种改错题自动评阅装置,所述识别模块,进一步用于:
沿x轴方向,利用预设像素宽度、所述单点答题图像高度的窗口遍历所述单点答题图像,将遍历获得的像素输入与正确答案对应预先构建的受限网络,获得所述单点答题图像的各子图像。
在本发明任一上述具体实施例的基础上,提供一种改错题自动评阅装置,所述改错题识别模型通过以下步骤训练获得:
将样本单点答题图像进行单个手写字符切分,获得样本单点答题图像的各样本子图像;
对所述各样本子图像进行识别结果的标注;
根据各样本子图像,利用预先确定的神经网络拓扑结构和训练算法,训练得到改错题识别模型。
在本发明任一上述具体实施例的基础上,提供一种改错题自动评阅装置,所述评阅模块,进一步用于:
当待识别正确答案为删除时,根据单点答题图像是否存在删除作答的识别结果,获得相应的评阅结果;
当待识别正确答案为修改或添加时,根据对应单点答题图像的各子图像进行单个手写字符切分时的跳转信息、及各子图像中包含单个手写字符为相应字符的概率,基于预设评阅方法,获得所述单点答题图像的至少一项评阅特征;根据所述评阅特征,基于预先构建的评阅模型,得到所述目标单点答题图像的评阅结果。
在本发明任一上述具体实施例的基础上,提供一种改错题自动评阅装置,所述评阅特征至少包括答题识别后验概率特征和字符切分解码路径的覆盖度特征,还能够包括增写字符比例特征、漏写字符比例特征和被吸收像素比例特征中的至少一种;其中:
所述答题识别后验概率特征,为所述单点答题图像中包含的单个手写字符为相应字符概率的平均值;
所述字符切分解码路径的覆盖度特征,为所述单点答题图像在进行单个手写字符切分时,遍历经过的单个手写字符数量与所述受限网络中手写字符子单元层数量的比值;
所述增写字符比例特征,为所述单点答题图像在进行单个手写字符切分时,前跳或自跳字符子单元占该单点答题图像中字符子单元总数的比例;
所述漏写字符比例特征,为所述单点答题图像在进行单个手写字符切分时,后跳字符子单元占该单点答题图像中字符子单元总数的比例;
所述被吸收像素比例特征,为所述单点答题图像在进行单个手写字符切分时,沿x轴方向利用预设像素宽度的窗口遍历所述目标单点答题图像获得的像素被所述吸收层所吸收像素点数,占所述单点答题图像像素点总数的比例。
在本发明任一上述具体实施例的基础上,提供一种改错题自动评阅电子设备。参见图5,该改错题自动评阅电子设备包括:处理器(processor)501、存储器(memory)502和总线503;
其中,处理器501及存储器502分别通过总线503完成相互间的通信;
处理器501用于调用存储器502中的程序指令,以执行上述实施例所提供的改错题自动评阅方法,例如包括:获取待阅答题介质上各书写答案对应的单点答题图像;利用预设图像检测方法和/或基于预设识别模型对获取到的各单点答题图像进行图像识别,获得识别结果;根据识别信息获得对应评阅特征,根据所述评阅特征基于预设评阅模型,对各书写答案进行评阅。
本发明实施例提供一种非暂态计算机可读存储介质,该非暂态计算机可读存储介质存储计算机指令,该计算机指令使计算机执行上述实施例所提供的改错题自动评阅方法,例如包括:获取待阅答题介质上各书写答案对应的单点答题图像;利用预设图像检测方法和/或基于预设识别模型对获取到的各单点答题图像进行图像识别,获得识别结果;根据识别信息获得对应评阅特征,根据所述评阅特征基于预设评阅模型,对各书写答案进行评阅。
本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于一计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
以上所描述的信息交互设备等实施例仅仅是示意性的,其中作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分方法。
最后,本申请的方法仅为较佳的实施方案,并非用于限定本发明实施例的保护范围。凡在本发明实施例的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明实施例的保护范围之内。

Claims (18)

1.一种改错题自动评阅方法,其特征在于,包括:
获取待阅答题介质上各书写答案对应的单点答题图像;
利用预设图像检测方法和/或基于预设识别模型对获取到的各单点答题图像进行图像识别,获得识别结果;
根据识别信息获得对应评阅特征,根据所述评阅特征基于预设评阅模型,对各书写答案进行评阅;所述识别信息包含所述识别结果和识别中间过程信息。
2.根据权利要求1所述的方法,其特征在于,所述获取待阅答题介质上各书写答案对应的单点答题图像的步骤,包括:
根据待阅答题介质的答题图像以及与所述待阅答题介质对应的答题介质模板,获取所述待阅答题介质上各书写答案对应的单点答题图像;其中,所述答题介质模板包括待答试题中各字符的位置信息,以及根据正确答案预先设定的至少一个单点答题区域,所述单点答题图像是根据对应的单点答题区域而获取的。
3.根据权利要求1所述的方法,其特征在于,所述利用预设图像检测方法和/或基于预设识别模型对获取到的各单点答题图像进行图像识别,获得识别结果,包括:
对于正确答案为删除时,通过检测对应单点答题图像内是否存在至少一个删除标记,获得是否存在删除作答的识别结果;
当正确答案为修改或添加时,基于与正确答案对应预先构建的受限网络,对对应单点答题图像进行单个手写字符切分,获得所述单点答题图像的各子图像;基于预先构建的改错题识别模型,对所述各子图像进行识别,获得所述各子图像中包含的单个手写字符的识别结果。
4.根据权利要求3所述的方法,其特征在于,所述预先构建的受限网络根据其所对应正确答案预先构建,包括起始层、结束层、各单个手写字符子单元层和存在于前述各层间的吸收层:
所述各单个手写字符子单元层分别根据其所对应正确答案中各单个字符的手写样本图像构建;
所述各吸收层到所述各单个手写字符子单元层及结束层存在前跳转弧和后跳转弧。
5.根据权利要求4所述的方法,其特征在于,所述基于与正确答案对应预先构建的受限网络,对对应单点答题图像进行单个手写字符切分,获得所述单点答题图像的各子图像,包括:
沿x轴方向,利用预设像素宽度、所述单点答题图像高度的窗口遍历所述单点答题图像,将遍历获得的像素输入与正确答案对应预先构建的受限网络,获得所述单点答题图像的各子图像。
6.根据权利要求3所述的方法,其特征在于,所述改错题识别模型通过以下步骤训练获得:
将样本单点答题图像进行单个手写字符切分,获得样本单点答题图像的各样本子图像;
对所述各样本子图像进行识别结果的标注;
根据各样本子图像,利用预先确定的神经网络拓扑结构和训练算法,训练得到改错题识别模型。
7.根据权利要求3所述的方法,其特征在于,所述根据识别信息获得对应评阅特征,根据所述评阅特征基于预设评阅模型,对各书写答案进行评阅,包括:当待识别正确答案为删除时,根据单点答题图像是否存在删除作答的识别结果,获得相应的评阅结果;
当待识别正确答案为修改或添加时,根据对应单点答题图像的各子图像进行单个手写字符切分时的跳转信息、及各子图像中包含单个手写字符为相应字符的概率,基于预设评阅方法,获得所述单点答题图像的至少一项评阅特征;根据所述评阅特征,基于预先构建的评阅模型,得到所述目标单点答题图像的评阅结果。
8.根据权利要求7所述的方法,其特征在于,所述评阅特征至少包括答题识别后验概率特征和字符切分解码路径的覆盖度特征,还能够包括增写字符比例特征、漏写字符比例特征和被吸收像素比例特征中的至少一种;其中:
所述答题识别后验概率特征,为所述单点答题图像中包含的单个手写字符为相应字符概率的平均值;
所述字符切分解码路径的覆盖度特征,为所述单点答题图像在进行单个手写字符切分时,遍历经过的单个手写字符数量与所述受限网络中手写字符子单元层数量的比值;
所述增写字符比例特征,为所述单点答题图像在进行单个手写字符切分时,前跳或自跳字符子单元占该单点答题图像中字符子单元总数的比例;
所述漏写字符比例特征,为所述单点答题图像在进行单个手写字符切分时,后跳字符子单元占该单点答题图像中字符子单元总数的比例;
所述被吸收像素比例特征,为所述单点答题图像在进行单个手写字符切分时,沿x轴方向利用预设像素宽度的窗口遍历所述目标单点答题图像获得的像素被所述吸收层所吸收像素点数,占所述单点答题图像像素点总数的比例。
9.一种改错题自动评阅装置,其特征在于,包括:
获取模块,用于获取待阅答题介质上各书写答案对应的单点答题图像;
识别模块,用于利用预设图像检测方法和/或基于预设识别模型对获取到的各单点答题图像进行图像识别,获得识别结果;
评阅模块,用于根据识别信息获得对应评阅特征,根据所述评阅特征基于预设评阅模型,对各书写答案进行评阅;所述识别信息包含所述识别结果和识别中间过程信息。
10.根据权利要求9所述的装置,其特征在于,所述获取模块进一步用于:
根据待阅答题介质的答题图像以及与所述待阅答题介质对应的答题介质模板,获取所述待阅答题介质上各书写答案对应的单点答题图像;其中,所述答题介质模板包括待答试题中各字符的位置信息,以及根据正确答案预先设定的至少一个单点答题区域,所述单点答题图像是根据对应的单点答题区域而获取的。
11.根据权利要求9所述的装置,其特征在于,所述识别模块,进一步用于:
对于正确答案为删除时,通过检测对应单点答题图像内是否存在至少一个删除标记,获得是否存在删除作答的识别结果;
当正确答案为修改或添加时,基于与正确答案对应预先构建的受限网络,对对应单点答题图像进行单个手写字符切分,获得所述单点答题图像的各子图像;基于预先构建的改错题识别模型,对所述各子图像进行识别,获得所述各子图像中包含的单个手写字符的识别结果。
12.如权利要求11所述的装置,其特征在于,所述预先构建的受限网络根据其所对应正确答案预先构建,包括起始层、结束层、各单个手写字符子单元层和存在于前述各层间的吸收层:
所述各单个手写字符子单元层分别根据其所对应正确答案中各单个字符的手写样本图像构建;
所述各吸收层到所述各单个手写字符子单元层及结束层存在前跳转弧和后跳转弧。
13.根据权利要求12所述的装置,其特征在于,所述识别模块,进一步用于:
沿x轴方向,利用预设像素宽度、所述单点答题图像高度的窗口遍历所述单点答题图像,将遍历获得的像素输入与正确答案对应预先构建的受限网络,获得所述单点答题图像的各子图像。
14.根据权利要求11所述的装置,其特征在于,所述改错题识别模型通过以下步骤训练获得:
将样本单点答题图像进行单个手写字符切分,获得样本单点答题图像的各样本子图像;
对所述各样本子图像进行识别结果的标注;
根据各样本子图像,利用预先确定的神经网络拓扑结构和训练算法,训练得到改错题识别模型。
15.根据权利要求11所述的装置,其特征在于,所述评阅模块,进一步用于:
当待识别正确答案为删除时,根据单点答题图像是否存在删除作答的识别结果,获得相应的评阅结果;
当待识别正确答案为修改或添加时,根据对应单点答题图像的各子图像进行单个手写字符切分时的跳转信息、及各子图像中包含单个手写字符为相应字符的概率,基于预设评阅方法,获得所述单点答题图像的至少一项评阅特征;根据所述评阅特征,基于预先构建的评阅模型,得到所述目标单点答题图像的评阅结果。
16.根据权利要求15所述的装置,其特征在于,所述评阅特征至少包括答题识别后验概率特征和字符切分解码路径的覆盖度特征,还能够包括增写字符比例特征、漏写字符比例特征和被吸收像素比例特征中的至少一种;其中:
所述答题识别后验概率特征,为所述单点答题图像中包含的单个手写字符为相应字符概率的平均值;
所述字符切分解码路径的覆盖度特征,为所述单点答题图像在进行单个手写字符切分时,遍历经过的单个手写字符数量与所述受限网络中手写字符子单元层数量的比值;
所述增写字符比例特征,为所述单点答题图像在进行单个手写字符切分时,前跳或自跳字符子单元占该单点答题图像中字符子单元总数的比例;
所述漏写字符比例特征,为所述单点答题图像在进行单个手写字符切分时,后跳字符子单元占该单点答题图像中字符子单元总数的比例;
所述被吸收像素比例特征,为所述单点答题图像在进行单个手写字符切分时,沿x轴方向利用预设像素宽度的窗口遍历所述目标单点答题图像获得的像素被所述吸收层所吸收像素点数,占所述单点答题图像像素点总数的比例。
17.一种改错题自动评阅电子设备,其特征在于,包括:
至少一个处理器;以及
与所述处理器通信连接的至少一个存储器,其中:
所述存储器存储有可被所述处理器执行的程序指令,所述处理器调用所述程序指令能够执行根据权利要求1至8任一所述的方法。
18.一种非暂态计算机可读存储介质,其特征在于,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令使所述计算机执行根据权利要求1至8任一所述的方法。
CN201710947823.9A 2017-10-12 2017-10-12 一种改错题自动评阅方法及*** Active CN107729936B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710947823.9A CN107729936B (zh) 2017-10-12 2017-10-12 一种改错题自动评阅方法及***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710947823.9A CN107729936B (zh) 2017-10-12 2017-10-12 一种改错题自动评阅方法及***

Publications (2)

Publication Number Publication Date
CN107729936A true CN107729936A (zh) 2018-02-23
CN107729936B CN107729936B (zh) 2020-12-08

Family

ID=61211192

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710947823.9A Active CN107729936B (zh) 2017-10-12 2017-10-12 一种改错题自动评阅方法及***

Country Status (1)

Country Link
CN (1) CN107729936B (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108388895A (zh) * 2018-03-04 2018-08-10 南京理工大学 一种基于机器学习的试卷答题卡自动处理方法
CN110969052A (zh) * 2018-09-29 2020-04-07 杭州萤石软件有限公司 一种作业批改方法和设备
CN111008594A (zh) * 2019-12-04 2020-04-14 科大讯飞股份有限公司 改错题评阅方法、相关设备及可读存储介质
CN111104881A (zh) * 2019-12-09 2020-05-05 科大讯飞股份有限公司 一种图像处理的方法和相关装置
WO2020177531A1 (zh) * 2019-03-04 2020-09-10 杭州大拿科技股份有限公司 题目辅助方法及***
CN112257703A (zh) * 2020-12-24 2021-01-22 北京世纪好未来教育科技有限公司 图像识别方法、装置、设备和可读存储介质
CN112507879A (zh) * 2020-12-08 2021-03-16 科大讯飞股份有限公司 评阅方法、装置、电子设备及存储介质
CN112926587A (zh) * 2021-02-19 2021-06-08 北京大米未来科技有限公司 一种文本识别的方法、装置、可读存储介质和电子设备

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102568475A (zh) * 2011-12-31 2012-07-11 安徽科大讯飞信息科技股份有限公司 用于普通话水平测评的***和方法
CN103903491A (zh) * 2014-02-14 2014-07-02 广东小天才科技有限公司 一种实现书写检查的方法及装置
CN104268603A (zh) * 2014-09-16 2015-01-07 科大讯飞股份有限公司 用于文字性客观题的智能阅卷方法及***
CN104364815A (zh) * 2012-10-31 2015-02-18 Sk电信有限公司 用于自动评分的装置和方法
CN105160342A (zh) * 2015-08-11 2015-12-16 成都数联铭品科技有限公司 一种基于hmm-gmm的自动文字图片切分方法及***
CN105183712A (zh) * 2015-08-27 2015-12-23 北京时代焦点国际教育咨询有限责任公司 一种用于对英语作文进行打分的方法以及装置
CN106781784A (zh) * 2017-01-04 2017-05-31 王骁乾 一种智能批改***
CN106846203A (zh) * 2017-03-09 2017-06-13 常州工学院 一种智能阅卷方法及***

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102568475A (zh) * 2011-12-31 2012-07-11 安徽科大讯飞信息科技股份有限公司 用于普通话水平测评的***和方法
CN104364815A (zh) * 2012-10-31 2015-02-18 Sk电信有限公司 用于自动评分的装置和方法
US20150093737A1 (en) * 2012-10-31 2015-04-02 Sk Telecom Co., Ltd. Apparatus and method for automatic scoring
CN103903491A (zh) * 2014-02-14 2014-07-02 广东小天才科技有限公司 一种实现书写检查的方法及装置
CN104268603A (zh) * 2014-09-16 2015-01-07 科大讯飞股份有限公司 用于文字性客观题的智能阅卷方法及***
CN105160342A (zh) * 2015-08-11 2015-12-16 成都数联铭品科技有限公司 一种基于hmm-gmm的自动文字图片切分方法及***
CN105183712A (zh) * 2015-08-27 2015-12-23 北京时代焦点国际教育咨询有限责任公司 一种用于对英语作文进行打分的方法以及装置
CN106781784A (zh) * 2017-01-04 2017-05-31 王骁乾 一种智能批改***
CN106846203A (zh) * 2017-03-09 2017-06-13 常州工学院 一种智能阅卷方法及***

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
YA ZHOU ET AL.: "An Automatic English Composition scoring model based on neural network algorithm", 《 2014 IEEE/ACIS 13TH INTERNATIONAL CONFERENCE ON COMPUTER AND INFORMATION SCIENCE (ICIS)》 *

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108388895A (zh) * 2018-03-04 2018-08-10 南京理工大学 一种基于机器学习的试卷答题卡自动处理方法
CN108388895B (zh) * 2018-03-04 2022-02-18 南京理工大学 一种基于机器学习的试卷答题卡自动处理方法
CN110969052A (zh) * 2018-09-29 2020-04-07 杭州萤石软件有限公司 一种作业批改方法和设备
WO2020177531A1 (zh) * 2019-03-04 2020-09-10 杭州大拿科技股份有限公司 题目辅助方法及***
CN111008594A (zh) * 2019-12-04 2020-04-14 科大讯飞股份有限公司 改错题评阅方法、相关设备及可读存储介质
CN111008594B (zh) * 2019-12-04 2024-04-19 科大讯飞股份有限公司 改错题评阅方法、相关设备及可读存储介质
CN111104881A (zh) * 2019-12-09 2020-05-05 科大讯飞股份有限公司 一种图像处理的方法和相关装置
CN111104881B (zh) * 2019-12-09 2023-12-01 科大讯飞股份有限公司 一种图像处理的方法和相关装置
CN112507879A (zh) * 2020-12-08 2021-03-16 科大讯飞股份有限公司 评阅方法、装置、电子设备及存储介质
CN112257703A (zh) * 2020-12-24 2021-01-22 北京世纪好未来教育科技有限公司 图像识别方法、装置、设备和可读存储介质
CN112926587A (zh) * 2021-02-19 2021-06-08 北京大米未来科技有限公司 一种文本识别的方法、装置、可读存储介质和电子设备
CN112926587B (zh) * 2021-02-19 2024-03-29 北京大米未来科技有限公司 一种文本识别的方法、装置、可读存储介质和电子设备

Also Published As

Publication number Publication date
CN107729936B (zh) 2020-12-08

Similar Documents

Publication Publication Date Title
CN107729936A (zh) 一种改错题自动评阅方法及***
CN111753767B (zh) 一种作业自动批改的方法、装置、电子设备和存储介质
CN106781784A (zh) 一种智能批改***
CN105574090B (zh) 一种敏感词过滤方法及***
CN110516248A (zh) 语音识别结果纠错方法、装置、存储介质和电子设备
CN109101469A (zh) 从数字化文档提取可搜索的信息
CN109614944A (zh) 一种数学公式识别方法、装置、设备及可读存储介质
US20120197908A1 (en) Method and apparatus for associating a table of contents and headings
CN111274239B (zh) 试卷结构化处理方法、装置和设备
CN105653517A (zh) 一种识别率确定方法及装置
CN101622620A (zh) 控制访问计算机***和注释媒体文件的方法和装置
CN107944718A (zh) 一种企业政策评估***及方法
Valy et al. A new khmer palm leaf manuscript dataset for document analysis and recognition: Sleukrith set
CN111753120A (zh) 一种搜题的方法、装置、电子设备和存储介质
CN114730241B (zh) 触摸式用户界面输入中的手势笔画识别
CN112541095A (zh) 视频标题生成方法、装置、电子设备及存储介质
CN112149680B (zh) 错字检测识别方法、装置、电子设备及存储介质
CN110135225A (zh) 样本标注方法及计算机存储介质
CN114419636A (zh) 文本识别方法、装置、设备以及存储介质
Yu et al. Aggregating crowdsourced and automatic judgments to scale up a corpus of anaphoric reference for fiction and Wikipedia texts
CN108511036A (zh) 一种中文症状标注的方法及***
Nederhof et al. OCR of handwritten transcriptions of Ancient Egyptian hieroglyphic text
CN106339726A (zh) 用于手写识别的方法及装置
CN112905749B (zh) 一种基于意图-槽值规则树的任务型多轮对话方法
CN109343844A (zh) 一种基于Flex票据数据对比纠正的方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant