CN113762274A - 一种答题卡目标区域检测方法、***、存储介质及设备 - Google Patents
一种答题卡目标区域检测方法、***、存储介质及设备 Download PDFInfo
- Publication number
- CN113762274A CN113762274A CN202111323174.8A CN202111323174A CN113762274A CN 113762274 A CN113762274 A CN 113762274A CN 202111323174 A CN202111323174 A CN 202111323174A CN 113762274 A CN113762274 A CN 113762274A
- Authority
- CN
- China
- Prior art keywords
- frame
- answer sheet
- area
- identification
- missed
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Image Analysis (AREA)
Abstract
本发明提供一种答题卡目标区域检测方法、***、存储介质及设备,方法包括:获取待检测答题卡图片并进行预处理,对预处理后的待检测答题卡图片进行分割,得到待检测答题卡的子区域,获取子区域的边框信息,判断子区域是否存在漏识别边框;若存在漏识别边框,则获取并补全漏识别边框的边框。上述答题卡目标区域检测方法、***、存储介质及设备,通过预训练的答题卡分割检测模型对预处理后的待检测答题卡图片进行分割,从而得到待检测答题卡的多个子区域,进一步的,根据边框信息结合答题卡分割检测模型判断子区域是否存在漏识别边框,若存在漏识别边框,则获取并补全漏识别边框的边框,避免存在漏检、误检的情况,提高准确率。
Description
技术领域
本发明涉及图像识别技术领域,特别涉及一种答题卡目标区域检测方法、***、存储介质及设备。
背景技术
随着人工智能技术的兴起,人工智能技术已经应用于多个行业领域,人们也越来越多的使用自动化设备对学生考试试卷进行阅卷,使得阅卷效率更高。
在考试当中,经常需要使用答题卡来答题。答题卡一般由定位点、基本信息栏、二维码、考号填涂区域和试题区域组成,考生根据试卷题目在答题卡上进行填涂或回答。考试结束后,需要通过机器识别或者人工协助来对答题卡上的答案进行判读。而在对答题卡上的答案进行判读之前,一般需要对答题卡的区域进行划分,以便更好的识别对应的答题区域。一般基于定位点识别进行区域定位,使得对扫描后的答题卡图片质量要求较高,经常由于图像倾斜或分辨率等问题导致无法正确识别到答题卡区域;同时,由于依赖定位点进行区域定位,导致不能处理答题卡图片中的定位点不存在的情况。
现有技术当中,随着人工智能兴起,基于深度学习的答题卡检测方法也被应用到答题卡区域检测场景,但由于现有的目标检测深度学习模型复杂度高,对GPU负载要求高,检测速度慢,部署应用困难,导致深度学习模型识别结果存在漏检、误检的情况,准确率低。
发明内容
基于此,本发明的目的是提供一种答题卡目标区域检测方法、***、存储介质及设备,用于解决现有技术中识别结果存在漏检、误检的情况,导致识别结果准确率低的技术问题。
本发明一方面提供一种答题卡目标区域检测方法,所述方法包括:
获取待检测答题卡图片,并对所述待检测答题卡图片进行预处理,通过预训练的答题卡分割检测模型对预处理后的待检测答题卡图片进行分割,得到所述待检测答题卡的多个子区域,多个所述子区域包括选项区域、主观题区域;
获取所述子区域的边框信息,根据所述边框信息结合所述答题卡分割检测模型判断所述子区域是否存在漏识别边框;
若存在漏识别边框,则获取并补全所述漏识别边框的边框;
其中,补全所述漏识别边框的边框的步骤包括:
在所述选项区域中:
获取所述选项区域内的选项特征,根据所述选项特征聚类所述选项区域以获得多个区域簇,采集并对比相同区域簇的选项边框,获取漏识别选项,并补全所述漏识别选项的边框;
在所述主观题区域中:
获取所述主观题区域的区域边框并计算出相邻两所述主观题区域的边框间距;
判断所述边框间距是否大于间距阈值;
若所述边框间距大于所述间距阈值,则相邻两所述主观题区域之间存在漏识别区域,获取并补全所述漏识别区域的边框。上述答题卡目标区域检测方法,通过预训练的答题卡分割检测模型对预处理后的待检测答题卡图片进行分割,从而得到待检测答题卡的多个子区域,避免了传统的基于定位点识别进行区域定位,使得对扫描后的答题卡图片质量要求较高的方案,进一步的,根据边框信息结合答题卡分割检测模型判断子区域是否存在漏识别边框,若存在漏识别边框,则获取并补全漏识别边框的边框,避免存在漏检、误检的情况,提高准确率,具体的,对于选项区域,通过对选项区域进行簇聚类获得多个区域簇,再采集并对比相同区域簇的选项边框,获取漏识别选项,并补全漏识别选项的边框;对于主观题区域,通过获取主观题区域的区域边框并计算出相邻两主观题区域的边框间距,再判断边框间距是否大于间距阈值,若边框间距大于间距阈值,则相邻两主观题区域之间存在漏识别区域,获取并补全漏识别区域的边框,直到得到主观题区域的完整边框,从而得到更加精确的答题卡目标区域的检测信息,避免了传统技术中,由于图片质量较差导致无法正确识别到答题卡区域的技术方案,解决了现有技术中识别结果存在漏检、误检的情况,导致识别结果准确率低的技术问题。
另外,根据本发明上述的答题卡目标区域检测方法,还可以具有如下附加的技术特征:
进一步地,所述若存在漏识别边框,则获取并补全所述漏识别边框的边框的步骤之后包括:
识别补全后的漏识别边框的边框,并获取所述补全后的漏识别边框的边框线条;
结合未漏识别边框的边框线条,自适应调整所述补全后的漏识别边框的边框线条,使得所述补全后的漏识别边框的边框线条与所述未漏识别边框的边框线条相互贴合,得到所述主观题区域的完整边框。
进一步地,所述获取所述子区域的边框信息,根据所述边框信息结合所述答题卡分割检测模型判断所述子区域是否存在漏识别边框的步骤包括:
通过预训练的矩形与直线检测模型,结合所述答题卡分割检测模型对获取到的所述子区域的边框进行自适应调整,得到自适应后的子区域;
根据所述自适应后的子区域的边框信息,对答题卡进行分栏处理,得到答题卡版面结构。
进一步地,所述获取待检测答题卡图片的步骤之前包括:
获取一定数量的原始答题卡图片;
通过预训练的生成对抗网络模型对所述原始答题卡图片进行数据增强,生成数据增强后的答题卡图片;
根据所述原始答题卡图片与所述数据增强后的答题卡图片,标注答题卡图片的各个子区域,所述子区域包括准考证号区域、选择题区域、填空题区域、主观题区域、条形码、选做题区域;
通过标有各个子区域的答题卡图片对深度学习神经网络模型进行训练,得到所述答题卡分割检测模型。
进一步地,所述若所述边框间距大于所述间距阈值,则相邻两所述主观题区域之间存在漏识别区域,获取并补全所述漏识别区域的边框的步骤包括:
识别相邻两所述主观题区域之间的区域内容,根据所述区域内容判断相邻两所述主观题区域之间是否存在潜在子区域,所述潜在子区域内设有手写体文字、题号或分数;
若相邻两所述主观题区域之间存在潜在子区域,则所述潜在子区域为漏识别区域。
进一步地,所述预处理包括去燥、数据增强以及大小变化。
进一步地,所述获取并补全所述漏识别边框的边框的步骤之后还包括:
将补全边框后的漏识别边框的各个子区域与答题卡文件关联存储,生成教师阅卷模板并存储为题库。
本发明另一方面提供一种答题卡目标区域检测***,所述***包括:
获取与分割模块,用于获取待检测答题卡图片,并对所述待检测答题卡图片进行预处理,通过预训练的答题卡分割检测模型对预处理后的待检测答题卡图片进行分割,得到所述待检测答题卡的多个子区域,多个所述子区域包括选项区域、主观题区域;
判断模块,用于获取所述子区域的边框信息,根据所述边框信息结合所述答题卡分割检测模型判断所述子区域是否存在漏识别边框;
第一执行模块,用于当存在漏识别边框时,则获取并补全所述漏识别边框的边框;
其中,在所述选项区域中,第一执行模块包括:
第一补全单元,用于获取所述选项区域内的选项特征,根据所述选项特征聚类所述选项区域以获得多个区域簇,采集并对比相同区域簇的选项边框,获取漏识别选项,并补全所述漏识别选项的边框;
在所述主观题区域中,第一执行模块包括:
计算单元,用于获取所述主观题区域的区域边框并计算出相邻两所述主观题区域的边框间距;
判断单元,用于判断所述边框间距是否大于间距阈值;
第二补全单元,用于若所述边框间距大于所述间距阈值,则相邻两所述主观题区域之间存在漏识别区域,获取并补全所述漏识别区域的边框。
本发明另一方面提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上述的答题卡目标区域检测方法。
本发明另一方面还提供一种数据处理设备,包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述的答题卡目标区域检测方法。
附图说明
图1为本发明第一实施例中答题卡目标区域检测方法的流程图;
图2为本发明第一实施例中步骤S103的具体流程图;
图3为本发明第二实施例中答题卡目标区域检测方法的流程图;
图4为本发明第二实施例中步骤S202的具体流程图;
图5为本发明第二实施例中步骤S203的具体流程图;
图6为本发明第二实施例中步骤S2033的具体流程图;
图7为本发明第三实施例中答题卡目标区域检测***的框架图;
图8为本发明申请中答题卡的样式图。
如下具体实施方式将结合上述附图进一步说明本发明。
具体实施方式
为了便于理解本发明,下面将参照相关附图对本发明进行更全面的描述。附图中给出了本发明的若干实施例。但是,本发明可以以许多不同的形式来实现,并不限于本文所描述的实施例。相反地,提供这些实施例的目的是使对本发明的公开内容更加透彻全面。
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。本文中在本发明的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本发明。本文所使用的术语“及/或”包括一个或多个相关的所列项目的任意的和所有的组合。
本发明融合深度学习神经网络模型与计算机视觉算法,能有效地检测任意答题卡任意格式的子区域,并将答题卡客观题区域内所有的子区域与答题卡文件关联存储。具体的,通过对批量样本答题卡数据的区域进行批注,结合深度神经网络对样本数据进行训练,得到答题卡分割检测模型,当输入一张待检测的新答题卡时,通过答题卡分割检测模型检测得到各个子区域,从而可对检测得到的各个子区域进行填涂及作答判断。同时,结合计算机视觉算法,判断答题卡分割检测模型检测得到的各个子区域的边框是否存在缺陷,如果存在缺陷,类似于可能会漏识别个别主观区域或者选项区域,利用分栏信息和模型目标检测结果,通过融合计算机视觉算法和逻辑判断,对模型检测结果进行修改和验证,得到更加精确的目标检测信息。使得区域检测无需依靠定位点、摆脱了定位点的限制,同时,因为结合计算机视觉算法,对区域边框进行修正,从而得到更加精确的目标检测信息。
实施例一
请参阅图1,所示为本发明第一实施例中的答题卡目标区域检测方法,方法包括步骤S101至步骤S103:
S101、获取待检测答题卡图片,并对待检测答题卡图片进行预处理,通过预训练的答题卡分割检测模型对预处理后的待检测答题卡图片进行分割,得到待检测答题卡的多个子区域,多个子区域包括选项区域、主观题区域。
在本实施例中,通过预先收集批量目标答题卡图片,通过深度学习模型生成对抗网络风格迁移答题卡图片,生成新的答题卡图片,增加了图片的数量,提升了训练模型中答题卡数据的多样性。生成式对抗网络(GAN, Generative Adversarial Networks )是一种深度学习模型。进一步的,预处理包括去燥、数据增强以及大小变化。
S102、获取子区域的边框信息,根据边框信息结合答题卡分割检测模型判断子区域是否存在漏识别边框。
若存在漏识别边框,则执行步骤S103;
S103、获取并补全漏识别边框的边框。
在选项区域中,步骤S103具体包括:
获取选项区域内的选项特征,根据选项特征聚类选项区域以获得多个区域簇,采集并对比相同区域簇的选项边框,获取漏识别选项,并补全漏识别选项的边框。
进一步的,如图2所示,在主观题区域中,步骤S103具体包括步骤S1031至步骤S1033:
S1031、获取主观题区域的区域边框并计算出相邻两主观题区域的边框间距。
S1032、判断边框间距是否大于间距阈值。
若边框间距大于间距阈值,则相邻两主观题区域之间存在漏识别区域,执行步骤S1033;
S1033、获取并补全漏识别区域的边框。
综上,本发明上述实施例当中的答题卡目标区域检测方法,通过预训练的答题卡分割检测模型对预处理后的待检测答题卡图片进行分割,从而得到待检测答题卡的多个子区域,避免了传统的基于定位点识别进行区域定位,使得对扫描后的答题卡图片质量要求较高的方案,进一步的,根据边框信息结合答题卡分割检测模型判断子区域是否存在漏识别边框,若存在漏识别边框,则获取并补全漏识别边框的边框,避免存在漏检、误检的情况,提高准确率,具体的,对于选项区域,通过对选项区域进行簇聚类获得多个区域簇,再采集并对比相同区域簇的选项边框,获取漏识别选项,并补全漏识别选项的边框;对于主观题区域,通过获取主观题区域的区域边框并计算出相邻两主观题区域的边框间距,再判断边框间距是否大于间距阈值,若边框间距大于间距阈值,则相邻两主观题区域之间存在漏识别区域,获取并补全漏识别区域的边框,直到得到主观题区域的完整边框,从而得到更加精确的答题卡目标区域的检测信息,避免了传统技术中,由于图片质量较差导致无法正确识别到答题卡区域的技术方案,解决了现有技术中识别结果存在漏检、误检的情况,导致识别结果准确率低的技术问题。
实施例二
请查阅图3,所示为本发明第二实施例中的答题卡目标区域检测方法,方法包括步骤S201至步骤S205:
S201、获取待检测答题卡图片,并对待检测答题卡图片进行预处理,通过预训练的答题卡分割检测模型对预处理后的待检测答题卡图片进行分割,得到待检测答题卡的多个子区域,多个子区域包括选项区域、主观题区域。
具体的,预处理包括对待检测答题卡图片进行去燥、通过生成对抗网络GAN对原始答题卡图片进行数据增强、以及调整待检测答题卡图片的大小,从而便于对待检测答题卡图片进行分割,使得分割结果更加精准。具体的,如图8所示,为一教师阅卷模板样例整体效果图,可以通过该图了解答题卡的样式,图中的选择题区域即为本申请描述中的选项区域。
作为一个具体示例,在获取待检测答题卡图片之前需要提前获得答题卡分割检测模型,具体如下:
获取一定数量的原始答题卡图片;通过预训练的生成对抗网络模型对原始答题卡图片进行数据增强,生成数据增强后的答题卡图片;根据原始答题卡图片与数据增强后的答题卡图片,标注答题卡图片的各个子区域,子区域包括准考证号区域、选择题区域、填空题区域、主观题区域、条形码、选做题区域;通过标有各个子区域的答题卡图片对深度学习神经网络模型进行训练,得到答题卡分割检测模型。
利用深度学习模型GAN增强训练数据集,提升了答题卡样本图片的多样性,增强了目标检测模型的鲁棒性。
具体的,在模型训练环节,修改轻量级深度学习网络Yolo5,骨干网络由原始的CNN优化为Transform,整体网络模型结构为Yolov5x,提升了目标检测模型的精度,鲁棒性强,通过迁移学习训练得到答题卡目标检测模型,即为答题卡分割检测模型。进一步的,深度学习网络Yolo5为轻量级模型,模型复杂度低,对硬件GPU环境要求低,应用部署相对简单,并且识别速度快,实现了实时检测。
将得到的答题卡分割检测模型,存储于数据库中,当获取一待检测答题卡图片时,通过数据库中的答题卡分割检测模型,即可准确的分割答题卡,得到答题卡的各个子区域。
S202、获取子区域的边框信息,根据边框信息结合答题卡分割检测模型判断子区域是否存在漏识别边框。
具体的,结合答题卡版面结构,通过计算机视觉算法结合答题卡分割检测模型对比识别子区域、并根据识别结果判断子区域的边框结果是否存在漏识别。
进一步的,如图4所示,步骤S202具体包括步骤S2021至步骤S2022:
S2021、通过预训练的矩形与直线检测模型,结合答题卡分割检测模型对获取到的子区域的边框进行自适应调整,得到自适应后的子区域。
S2022、根据自适应后的子区域的边框信息,对答题卡进行分栏处理,得到答题卡版面结构。
在一些可选实施例中,深度学习模型可能存在一些缺陷,导致检测边框可能偏大或者偏小,因此通过矩形检测和直线检测算法对模型边框自适应调整,得到更为贴合的检测边框;再根据自适应后的各个子区域对答题卡进行分栏处理,得到答题卡版面结构,便于计算机视觉算法结合答题卡分割检测模型对比识别子区域。具体的,答题卡一般分为单栏、两栏、三栏等几种情况。
在一些可选实施例中,由于深度学习模型可能存在一些缺陷,不一定能正确的得到全部的检测框,类似于可能会漏识别个别主观区域或者选项区域,此时,利用分栏信息和模型目标检测结果,通过融合传统计算机视觉算法和逻辑判断,对模型检测结果进行修改和验证,可得到更加精确的目标检测信息。
若存在漏识别边框,则执行步骤S203;
S203、获取并补全漏识别边框的边框。
具体的,在选项区域中,步骤S203具体包括:
获取选项区域内的选项特征,根据选项特征聚类选项区域以获得多个区域簇,采集并对比相同区域簇的选项边框,获取漏识别选项,并补全漏识别选项的边框。
具体的,如图5所示,在主观题区域中,步骤S203具体包括步骤S2031至步骤S2034:
S2031、获取主观题区域的区域边框并计算出相邻两主观题区域的边框间距;
S2032、判断边框间距是否大于间距阈值;
若边框间距大于间距阈值,则判定相邻两主观题区域之间存在漏识别区域,执行步骤S2033;
若边框间距不大于间距阈值,则判定相邻两主观题区域之间不存在漏识别区域,执行步骤S2034;
S2033、获取并补全漏识别区域的边框。
S2034、无需补全漏识别区域的边框。
由于模型检测边框结果可能存在漏识别,因此融合计算机视觉算法和逻辑判断修改和验证模型得到的各个区域:对选项区域,通过簇聚类算法提取选择题特征,并根据上下边框位置判断是否漏识别,如果漏识别,将符合聚类条件补全为选择题;对主观题区域,通过计算各个主观题边框间距,如果间距比例大于设定阈值,判定为漏识别,并将该区域补全,补全后自适应调整,最终得到各个区域的边框。
进一步的,如图6所示,步骤S2033具体包括步骤S20331至步骤S20332:
S20331、识别相邻两主观题区域之间的区域内容,根据区域内容判断相邻两主观题区域之间是否存在潜在子区域,潜在子区域内设有手写体文字、题号或分数。
若相邻两主观题区域之间存在潜在子区域,则执行步骤S20332;
S20332、潜在子区域为漏识别区域。
如果在相邻两主观题区域之间存在手写体文字、题号或分数等,说明此区域内有内容,所以,如果该区域没有被扫描到,说明此区域为漏识别区域,需要进一步进行识别。
S204、识别补全后的漏识别边框的边框,并获取补全后的漏识别边框的边框线条。
S205、结合未漏识别边框的边框线条,自适应调整补全后的漏识别边框的边框线条,使得补全后的漏识别边框的边框线条与未漏识别边框的边框线条相互贴合,得到主观题区域的完整边框。
进一步的,在得到主观题区域的完整边框之后,为了便于后期再次使用,将补全边框后的漏识别边框的各个子区域与答题卡文件关联存储,生成教师阅卷模板并存储为题库。
在本实施例中,将含有完整边框的各个子区域与答题卡文件关联存储,生成教师阅卷模板,使得当***识别到有待批改的答题卡时,能够快速生成教师阅卷的区域,提高准确度的同时,还提高了效率。进一步的,将含有完整边框的各个子区域存储为题库,使得当***识别到有待批改的答题卡时,便于***快速、准确的划分好答题卡中的各个区域,用于教师阅卷。
综上,本发明上述实施例当中的答题卡目标区域检测方法,通过预训练的答题卡分割检测模型对预处理后的待检测答题卡图片进行分割,从而得到待检测答题卡的多个子区域,避免了传统的基于定位点识别进行区域定位,使得对扫描后的答题卡图片质量要求较高的方案,进一步的,根据边框信息结合答题卡分割检测模型判断子区域是否存在漏识别边框,若存在漏识别边框,则获取并补全漏识别边框的边框,避免存在漏检、误检的情况,提高准确率,具体的,对于选项区域,通过对选项区域进行簇聚类获得多个区域簇,再采集并对比相同区域簇的选项边框,获取漏识别选项,并补全漏识别选项的边框;对于主观题区域,通过获取主观题区域的区域边框并计算出相邻两主观题区域的边框间距,再判断边框间距是否大于间距阈值,若边框间距大于间距阈值,则相邻两主观题区域之间存在漏识别区域,获取并补全漏识别区域的边框,直到得到主观题区域的完整边框,从而得到更加精确的答题卡目标区域的检测信息,避免了传统技术中,由于图片质量较差导致无法正确识别到答题卡区域的技术方案,解决了现有技术中识别结果存在漏检、误检的情况,导致识别结果准确率低的技术问题。
实施例三
请参阅图7,所示为本发明第三实施例中的答题卡目标区域检测***,所述***包括:
获取与分割模块,用于获取待检测答题卡图片,并对所述待检测答题卡图片进行预处理,通过预训练的答题卡分割检测模型对预处理后的待检测答题卡图片进行分割,得到所述待检测答题卡的多个子区域,多个所述子区域包括选项区域、主观题区域;
判断模块,用于获取所述子区域的边框信息,根据所述边框信息结合所述答题卡分割检测模型判断所述子区域是否存在漏识别边框;
第一执行模块,用于当存在漏识别边框时,则获取并补全所述漏识别边框的边框;
其中,在所述选项区域中,第一执行模块包括:
第一补全单元,用于获取所述选项区域内的选项特征,根据所述选项特征聚类所述选项区域以获得多个区域簇,采集并对比相同区域簇的选项边框,获取漏识别选项,并补全所述漏识别选项的边框;
在所述主观题区域中,第一执行模块包括:
计算单元,用于获取所述主观题区域的区域边框并计算出相邻两所述主观题区域的边框间距;
判断单元,用于判断所述边框间距是否大于间距阈值;
第二补全单元,用于若所述边框间距大于所述间距阈值,则相邻两所述主观题区域之间存在漏识别区域,获取并补全所述漏识别区域的边框。
在一些可选实施例中,第一执行模块之后还可以包括:
识别与获取模块,用于识别补全后的漏识别边框的边框,并获取所述补全后的漏识别边框的边框线条;
自适应模块,用于结合未漏识别边框的边框线条,自适应调整所述补全后的漏识别边框的边框线条,使得所述补全后的漏识别边框的边框线条与所述未漏识别边框的边框线条相互贴合,得到所述主观题区域的完整边框。
在一些可选实施例中,判断模块还可以包括:
检测单元,用于通过预训练的矩形与直线检测模型,结合所述答题卡分割检测模型对获取到的所述子区域的边框进行自适应调整,得到自适应后的子区域;
分栏处理单元,用于根据所述自适应后的子区域的边框信息,对答题卡进行分栏处理,得到答题卡版面结构。
在一些可选实施例中,获取与分割模块之前还可以包括:
原始答题卡获取模块,用于获取一定数量的原始答题卡图片;
数据增强模块,用于通过预训练的生成对抗网络模型对所述原始答题卡图片进行数据增强,生成数据增强后的答题卡图片;
标注模块,用于根据所述原始答题卡图片与所述数据增强后的答题卡图片,标注答题卡图片的各个子区域,所述子区域包括准考证号区域、选择题区域、填空题区域、主观题区域、条形码、选做题区域;
分割检测模块,用于通过标有各个子区域的答题卡图片对深度学习神经网络模型进行训练,得到所述答题卡分割检测模型。
综上,本发明上述实施例当中的答题卡目标区域检测***,通过预训练的答题卡分割检测模型对预处理后的待检测答题卡图片进行分割,从而得到待检测答题卡的多个子区域,避免了传统的基于定位点识别进行区域定位,使得对扫描后的答题卡图片质量要求较高的方案,进一步的,根据边框信息结合答题卡分割检测模型判断子区域是否存在漏识别边框,若存在漏识别边框,则获取并补全漏识别边框的边框,避免存在漏检、误检的情况,提高准确率,具体的,对于选项区域,通过对选项区域进行簇聚类获得多个区域簇,再采集并对比相同区域簇的选项边框,获取漏识别选项,并补全漏识别选项的边框;对于主观题区域,通过获取主观题区域的区域边框并计算出相邻两主观题区域的边框间距,再判断边框间距是否大于间距阈值,若边框间距大于间距阈值,则相邻两主观题区域之间存在漏识别区域,获取并补全漏识别区域的边框,直到得到主观题区域的完整边框,从而得到更加精确的答题卡目标区域的检测信息,避免了传统技术中,由于图片质量较差导致无法正确识别到答题卡区域的技术方案,解决了现有技术中识别结果存在漏检、误检的情况,导致识别结果准确率低的技术问题。
此外,本发明的实施例还提出一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述实施例中方法的步骤。
此外,本发明的实施例还提出一种数据处理设备,包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,处理器执行程序时实现上述实施例中方法的步骤。
在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行***、装置或设备(如基于计算机的***、包括处理器的***或其他可以从指令执行***、装置或设备取指令并执行指令的***)使用,或结合这些指令执行***、装置或设备而使用。就本说明书而言,“计算机可读介质”可以是任何可以包含、存储、通信、传播或传输程序以供指令执行***、装置或设备或结合这些指令执行***、装置或设备而使用的装置。
计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式光盘只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得程序,然后将其存储在计算机存储器中。
应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行***执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、 “示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
尽管已经示出和描述了本发明的实施例,本领域的普通技术人员可以理解:在不脱离本发明的原理和宗旨的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由权利要求及其等同物限定。
Claims (10)
1.一种答题卡目标区域检测方法,其特征在于,所述方法包括:
获取待检测答题卡图片,并对所述待检测答题卡图片进行预处理,通过预训练的答题卡分割检测模型对预处理后的待检测答题卡图片进行分割,得到所述待检测答题卡的多个子区域,多个所述子区域包括选项区域、主观题区域;
获取所述子区域的边框信息,根据所述边框信息结合所述答题卡分割检测模型判断所述子区域是否存在漏识别边框;
若存在漏识别边框,则获取并补全所述漏识别边框的边框;
其中,补全所述漏识别边框的边框的步骤包括:
在所述选项区域中:
获取所述选项区域内的选项特征,根据所述选项特征聚类所述选项区域以获得多个区域簇,采集并对比相同区域簇的选项边框,获取漏识别选项,并补全所述漏识别选项的边框;
在所述主观题区域中:
获取所述主观题区域的区域边框并计算出相邻两所述主观题区域的边框间距;
判断所述边框间距是否大于间距阈值;
若所述边框间距大于所述间距阈值,则相邻两所述主观题区域之间存在漏识别区域,获取并补全所述漏识别区域的边框。
2.根据权利要求1所述的答题卡目标区域检测方法,其特征在于,所述若存在漏识别边框,则获取并补全所述漏识别边框的边框的步骤之后包括:
识别补全后的漏识别边框的边框,并获取所述补全后的漏识别边框的边框线条;
结合未漏识别边框的边框线条,自适应调整所述补全后的漏识别边框的边框线条,使得所述补全后的漏识别边框的边框线条与所述未漏识别边框的边框线条相互贴合,得到所述主观题区域的完整边框。
3.根据权利要求2所述的答题卡目标区域检测方法,其特征在于,所述获取所述子区域的边框信息,根据所述边框信息结合所述答题卡分割检测模型判断所述子区域是否存在漏识别边框的步骤包括:
通过预训练的矩形与直线检测模型,结合所述答题卡分割检测模型对获取到的所述子区域的边框进行自适应调整,得到自适应后的子区域;
根据所述自适应后的子区域的边框信息,对答题卡进行分栏处理,得到答题卡版面结构。
4.根据权利要求1所述的答题卡目标区域检测方法,其特征在于,所述获取待检测答题卡图片的步骤之前包括:
获取一定数量的原始答题卡图片;
通过预训练的生成对抗网络模型对所述原始答题卡图片进行数据增强,生成数据增强后的答题卡图片;
根据所述原始答题卡图片与所述数据增强后的答题卡图片,标注答题卡图片的各个子区域,所述子区域包括准考证号区域、选择题区域、填空题区域、主观题区域、条形码、选做题区域;
通过标有各个子区域的答题卡图片对深度学习神经网络模型进行训练,得到所述答题卡分割检测模型。
5.根据权利要求1所述的答题卡目标区域检测方法,其特征在于,所述若所述边框间距大于所述间距阈值,则相邻两所述主观题区域之间存在漏识别区域,获取并补全所述漏识别区域的边框的步骤包括:
识别相邻两所述主观题区域之间的区域内容,根据所述区域内容判断相邻两所述主观题区域之间是否存在潜在子区域,所述潜在子区域内设有手写体文字、题号或分数;
若相邻两所述主观题区域之间存在潜在子区域,则所述潜在子区域为漏识别区域。
6.根据权利要求1所述的答题卡目标区域检测方法,其特征在于,所述预处理包括去燥、数据增强以及大小变化。
7.根据权利要求1所述的答题卡目标区域检测方法,其特征在于,所述获取并补全所述漏识别边框的边框的步骤之后还包括:
将补全边框后的漏识别边框的各个子区域与答题卡文件关联存储,生成教师阅卷模板并存储为题库。
8.一种答题卡目标区域检测***,其特征在于,所述***包括:
获取与分割模块,用于获取待检测答题卡图片,并对所述待检测答题卡图片进行预处理,通过预训练的答题卡分割检测模型对预处理后的待检测答题卡图片进行分割,得到所述待检测答题卡的多个子区域,多个所述子区域包括选项区域、主观题区域;
判断模块,用于获取所述子区域的边框信息,根据所述边框信息结合所述答题卡分割检测模型判断所述子区域是否存在漏识别边框;
第一执行模块,用于当存在漏识别边框时,则获取并补全所述漏识别边框的边框;
其中,在所述选项区域中,第一执行模块包括:
第一补全单元,用于获取所述选项区域内的选项特征,根据所述选项特征聚类所述选项区域以获得多个区域簇,采集并对比相同区域簇的选项边框,获取漏识别选项,并补全所述漏识别选项的边框;
在所述主观题区域中,第一执行模块包括:
计算单元,用于获取所述主观题区域的区域边框并计算出相邻两所述主观题区域的边框间距;
判断单元,用于判断所述边框间距是否大于间距阈值;
第二补全单元,用于若所述边框间距大于所述间距阈值,则相邻两所述主观题区域之间存在漏识别区域,获取并补全所述漏识别区域的边框。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-7任一所述的答题卡目标区域检测方法。
10.一种数据处理设备,包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1-7任一所述的答题卡目标区域检测方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111323174.8A CN113762274B (zh) | 2021-11-10 | 2021-11-10 | 一种答题卡目标区域检测方法、***、存储介质及设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111323174.8A CN113762274B (zh) | 2021-11-10 | 2021-11-10 | 一种答题卡目标区域检测方法、***、存储介质及设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113762274A true CN113762274A (zh) | 2021-12-07 |
CN113762274B CN113762274B (zh) | 2022-02-15 |
Family
ID=78784824
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111323174.8A Active CN113762274B (zh) | 2021-11-10 | 2021-11-10 | 一种答题卡目标区域检测方法、***、存储介质及设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113762274B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114639108A (zh) * | 2022-05-19 | 2022-06-17 | 江西风向标智能科技有限公司 | 主观题的判分标记识别方法、***、存储介质及设备 |
CN114863095A (zh) * | 2022-03-25 | 2022-08-05 | 电子科技大学 | 一种基于颜色转换的答题卡图像分割方法 |
Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105989347A (zh) * | 2015-02-28 | 2016-10-05 | 科大讯飞股份有限公司 | 客观题智能阅卷方法及*** |
CN108171297A (zh) * | 2018-01-24 | 2018-06-15 | 谢德刚 | 一种答题卡识别方法及装置 |
CN108388892A (zh) * | 2018-05-04 | 2018-08-10 | 苏州大学 | 基于OpenCV的试卷自动处理***及方法 |
CN108416345A (zh) * | 2018-02-08 | 2018-08-17 | 海南云江科技有限公司 | 一种答题卡区域识别方法和计算设备 |
CN108764074A (zh) * | 2018-05-14 | 2018-11-06 | 山东师范大学 | 基于深度学习的主观题智能阅卷方法、***及存储介质 |
CN108805760A (zh) * | 2017-05-06 | 2018-11-13 | 南京多邦软件有限公司 | 一种智能阅卷*** |
CN110516208A (zh) * | 2019-08-12 | 2019-11-29 | 深圳智能思创科技有限公司 | 一种针对pdf文档表格提取的***及方法 |
CN110689013A (zh) * | 2019-10-10 | 2020-01-14 | 北京课程帮科技有限公司 | 一种基于特征识别的自动阅卷方法及*** |
CN110929562A (zh) * | 2019-10-12 | 2020-03-27 | 杭州电子科技大学 | 一种基于改进Hough变换的答题卡识别方法 |
US10878270B1 (en) * | 2018-06-26 | 2020-12-29 | Amazon Technologies, Inc. | Keypoint-based multi-label word segmentation and localization |
CN112270261A (zh) * | 2020-10-28 | 2021-01-26 | 广州华多网络科技有限公司 | 题干及答案混合的切分方法、装置、存储介质 |
CN113283431A (zh) * | 2021-07-26 | 2021-08-20 | 江西风向标教育科技有限公司 | 一种融合深度学习与逻辑判断的智能方法及*** |
CN113469147A (zh) * | 2021-09-02 | 2021-10-01 | 北京世纪好未来教育科技有限公司 | 答题卡识别方法、装置、电子设备以及存储介质 |
-
2021
- 2021-11-10 CN CN202111323174.8A patent/CN113762274B/zh active Active
Patent Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105989347A (zh) * | 2015-02-28 | 2016-10-05 | 科大讯飞股份有限公司 | 客观题智能阅卷方法及*** |
CN108805760A (zh) * | 2017-05-06 | 2018-11-13 | 南京多邦软件有限公司 | 一种智能阅卷*** |
CN108171297A (zh) * | 2018-01-24 | 2018-06-15 | 谢德刚 | 一种答题卡识别方法及装置 |
CN108416345A (zh) * | 2018-02-08 | 2018-08-17 | 海南云江科技有限公司 | 一种答题卡区域识别方法和计算设备 |
CN108388892A (zh) * | 2018-05-04 | 2018-08-10 | 苏州大学 | 基于OpenCV的试卷自动处理***及方法 |
CN108764074A (zh) * | 2018-05-14 | 2018-11-06 | 山东师范大学 | 基于深度学习的主观题智能阅卷方法、***及存储介质 |
US10878270B1 (en) * | 2018-06-26 | 2020-12-29 | Amazon Technologies, Inc. | Keypoint-based multi-label word segmentation and localization |
CN110516208A (zh) * | 2019-08-12 | 2019-11-29 | 深圳智能思创科技有限公司 | 一种针对pdf文档表格提取的***及方法 |
CN110689013A (zh) * | 2019-10-10 | 2020-01-14 | 北京课程帮科技有限公司 | 一种基于特征识别的自动阅卷方法及*** |
CN110929562A (zh) * | 2019-10-12 | 2020-03-27 | 杭州电子科技大学 | 一种基于改进Hough变换的答题卡识别方法 |
CN112270261A (zh) * | 2020-10-28 | 2021-01-26 | 广州华多网络科技有限公司 | 题干及答案混合的切分方法、装置、存储介质 |
CN113283431A (zh) * | 2021-07-26 | 2021-08-20 | 江西风向标教育科技有限公司 | 一种融合深度学习与逻辑判断的智能方法及*** |
CN113469147A (zh) * | 2021-09-02 | 2021-10-01 | 北京世纪好未来教育科技有限公司 | 答题卡识别方法、装置、电子设备以及存储介质 |
Non-Patent Citations (6)
Title |
---|
HAIYING ZHANG 等: "Robust Detection Method of Small Targets in Sea-Clutter via Improved Fast Clustering Segmentation", 《2016 8TH INTERNATIONAL CONFERENCE ON INTELLIGENT HUMAN-MACHINE SYSTEMS AND CYBERNETICS》 * |
HUI WEI 等: "Contour segment grouping for object detection", 《JOURNAL OF VISUAL COMMUNICATION AND IMAGE RESPRESENTATION》 * |
孙建芳 等: "扫描阅卷***中模板定制和图像聚类方法的研究", 《计算技术与自动化》 * |
孙琳 等: "一种适用于移动设备在线阅卷的答题卡自动识别算法", 《计算机测量与控制》 * |
方慧琴 等: "阅卷***中的答题区域快速智能分割算法研究", 《现代电子技术》 * |
要曙丽 等: "一种答题卡客观题识别算法", 《图学学报》 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114863095A (zh) * | 2022-03-25 | 2022-08-05 | 电子科技大学 | 一种基于颜色转换的答题卡图像分割方法 |
CN114863095B (zh) * | 2022-03-25 | 2023-11-28 | 电子科技大学 | 一种基于颜色转换的答题卡图像分割方法 |
CN114639108A (zh) * | 2022-05-19 | 2022-06-17 | 江西风向标智能科技有限公司 | 主观题的判分标记识别方法、***、存储介质及设备 |
Also Published As
Publication number | Publication date |
---|---|
CN113762274B (zh) | 2022-02-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111597908A (zh) | 试卷批改方法和试卷批改装置 | |
CN113762274B (zh) | 一种答题卡目标区域检测方法、***、存储介质及设备 | |
CN111291629A (zh) | 图像中文本的识别方法、装置、计算机设备及计算机存储介质 | |
CN105046200B (zh) | 基于直线检测的电子阅卷方法 | |
CN110582783B (zh) | 训练装置、图像识别装置、训练方法和计算机可读信息存储介质 | |
CN112307919B (zh) | 一种基于改进YOLOv3的单证图像中数字信息区域识别方法 | |
CN110866529A (zh) | 字符识别方法、装置、电子设备及存储介质 | |
CN111626284A (zh) | 一种手写字体去除的方法、装置、电子设备和存储介质 | |
CN112507758A (zh) | 答题卡字符串识别方法、装置、终端和计算机存储介质 | |
WO2021232670A1 (zh) | 一种pcb元件识别方法及装置 | |
CN111652145B (zh) | 一种公式检测的方法、装置、电子设备和存储介质 | |
CN112446259A (zh) | 图像处理方法、装置、终端和计算机可读存储介质 | |
CN116798036B (zh) | 用于识别和校验答题卡客观题识别结果的方法及装置 | |
CN115393861B (zh) | 一种手写体文本精准分割方法 | |
CN110135225A (zh) | 样本标注方法及计算机存储介质 | |
CN111144270B (zh) | 基于神经网络的手写文本工整度的评测方法与评测装置 | |
CN111144425B (zh) | 检测拍屏图片的方法、装置、电子设备及存储介质 | |
CN106033534B (zh) | 基于直线检测的电子阅卷方法 | |
CN111008594A (zh) | 改错题评阅方法、相关设备及可读存储介质 | |
CN114882204A (zh) | 船名自动识别方法 | |
CN108921006B (zh) | 手写签名图像真伪鉴别模型建立方法及真伪鉴别方法 | |
Aliev et al. | Algorithm for choosing the best frame in a video stream in the task of identity document recognition | |
CN113378852A (zh) | 关键点检测方法、装置、电子设备及存储介质 | |
JP7293658B2 (ja) | 情報処理装置、情報処理方法及びプログラム | |
CN112613367A (zh) | 票据信息文本框获取方法、***、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CP01 | Change in the name or title of a patent holder |
Address after: 330000 Building 1, maiyuan Road, Nanchang Economic and Technological Development Zone, Jiangxi Province Patentee after: Jiangxi wind vane Intelligent Technology Co.,Ltd. Address before: 330000 Building 1, maiyuan Road, Nanchang Economic and Technological Development Zone, Jiangxi Province Patentee before: JIANGXI VANEDUCATION TECHNOLOGY Inc. |
|
CP01 | Change in the name or title of a patent holder |