CN107506746A - 智能阅卷***无定位点图像识别方法及*** - Google Patents
智能阅卷***无定位点图像识别方法及*** Download PDFInfo
- Publication number
- CN107506746A CN107506746A CN201710807657.2A CN201710807657A CN107506746A CN 107506746 A CN107506746 A CN 107506746A CN 201710807657 A CN201710807657 A CN 201710807657A CN 107506746 A CN107506746 A CN 107506746A
- Authority
- CN
- China
- Prior art keywords
- paper
- region
- paper sample
- target
- sample
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 84
- 238000012545 processing Methods 0.000 claims abstract description 55
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 46
- 230000004807 localization Effects 0.000 claims description 56
- 238000012937 correction Methods 0.000 claims description 25
- 238000006243 chemical reaction Methods 0.000 claims description 15
- 230000008569 process Effects 0.000 claims description 12
- 230000005540 biological transmission Effects 0.000 claims description 3
- 238000012360 testing method Methods 0.000 abstract description 11
- 238000010586 diagram Methods 0.000 description 10
- 230000006870 function Effects 0.000 description 9
- 230000008901 benefit Effects 0.000 description 8
- 230000008859 change Effects 0.000 description 6
- 238000003860 storage Methods 0.000 description 5
- 230000000694 effects Effects 0.000 description 4
- 238000004891 communication Methods 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 235000013399 edible fruits Nutrition 0.000 description 3
- 230000009466 transformation Effects 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 230000008878 coupling Effects 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- FNMKZDDKPDBYJM-UHFFFAOYSA-N 3-(1,3-benzodioxol-5-yl)-7-(3-methylbut-2-enoxy)chromen-4-one Chemical compound C1=C2OCOC2=CC(C2=COC=3C(C2=O)=CC=C(C=3)OCC=C(C)C)=C1 FNMKZDDKPDBYJM-UHFFFAOYSA-N 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 230000001186 cumulative effect Effects 0.000 description 1
- 238000005520 cutting process Methods 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 238000010422 painting Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000010408 sweeping Methods 0.000 description 1
- 239000011800 void material Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/217—Validation; Performance evaluation; Active pattern learning techniques
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
Abstract
本发明提供了一种智能阅卷***无定位点图像识别方法及***,涉及图像处理的技术领域,该方法包括:获取待处理的试卷样本;对试卷样本进行学习处理,得到学习结果,其中,学习结果包括:试卷样本的考号区域信息,客观题区域信息,主观题区域信息;获取待处理的目标试卷;基于学习结,自适应地采用多种处理算法中的至少一种算法对目标试卷进行识别,得到目标试卷的识别结果,其中,识别结果包括以下信息:目标试卷的考号区域信息,目标试卷的客观题区域信息,目标试卷的主观题区域信息,以缓解了现有技术中存在的无法自适应地采用多种定位方法实现对试卷图像的精确定位和识别的技术问题。
Description
技术领域
本发明涉及图像处理的技术领域,尤其是涉及一种智能阅卷***无定位点图像识别方法及***。
背景技术
随着互联网的发展,数字化已经成为人们生活中不可或缺的一部分。在追求快速、高效、准确的大背景前提下,传统方式的人工阅卷已经逐渐不能满足人们日益增长的需求。人工阅卷的方式,效率低,而且容易出现误判,纸质试卷在传输过程中也需要消耗大量的人力物力。因此,数字化阅卷***成为了一种必然的趋势。通过扫描仪将试卷保存成数字图像,再用计算机程序对其进行处理,可大大提升阅卷效率。而传统的试卷中,根据类型分成两大类:一是有定位点试卷,这种试卷通过四个边角上的小正方形或三角形对题目进行定位,从而实现客观题识别和主观题切割;二是无定位的试卷,这个类型的试卷没有固定的定位点,因试卷而异,没有办法用传统的定位方式对其进行定位,因此需要寻找别的定位方法。
针对上述问题,还未提出有效解决方案。
发明内容
有鉴于此,本发明的目的在于提供一种智能阅卷***无定位点图像识别方法及***,以缓解了现有技术中存在的无法自适应地采用多种定位方法实现对试卷图像的精确定位和识别的技术问题。
第一方面,本发明实施例提供了一种智能阅卷***无定位点图像识别方法,包括:获取待处理的试卷样本;对所述试卷样本进行学习处理,得到学习结果,其中,所述学习结果包括:所述试卷样本的考号区域信息,客观题区域信息,主观题区域信息;获取待处理的目标试卷;基于所述学习结果,自适应地采用多种处理算法中的至少一种算法对所述目标试卷进行识别,得到所述目标试卷的识别结果,其中,所述识别结果包括以下信息:所述目标试卷的考号区域信息,所述目标试卷的客观题区域信息,所述目标试卷的主观题区域信息。
进一步地,获取待处理的试卷样本包括:对原始试卷样本进行二值化处理,得到二值化处理之后的所述原始试卷样本;对二值化处理之后的所述试卷样本进行纠偏处理,得到纠偏之后的所述原始试卷样本,并将纠偏之后的所述原始试卷样本作为所述待处理的试卷样本。
进一步地,对所述试卷样本进行学习处理,得到学习结果包括:在所述试卷样本中寻找至少一个定位区域,其中,所述定位区域中包括定位点;基于所述至少一个定位区域的定位点对所述试卷样本进行学习,得到所述学习结果。
进一步地,所述学习结果包括所述考号区域信息,基于所述至少一个定位区域的定位点对所述试卷样本进行学习,得到所述学习结果包括:在所述至少一个定位区域中不包括考号区域的情况下,获取用户发送的第一定位指令,其中,所述第一定位指令为在所述试卷样本中定位第一模板图像的指令;在获取到所述第一定位指令之后,实时监测所述用户所框选的区域,并将所述用户所框选的区域作为所述第一模板图像;在获取到所述用户发送的第一框选指令之后,进入框选所述考号区域的第一模式;在所述第一模式下,实时监测所述用户框选的考号区域,并记录所述考号区域的信息。
进一步地,所述学习结果包括所述客观题区域信息,基于所述至少一个定位区域的定位点对所述试卷样本进行学习,得到所述学习结果包括:在所述至少一个定位区域中不包括客观题区域的情况下,获取用户发送的第二定位指令,其中,所述第二定位指令为在所述试卷样本中定位第二模板图像的指令;在获取到所述第二定位指令之后,实时监测所述用户所框选的区域,并将所述用户所框选的区域作为所述第二模板图像;在获取到所述用户发送的第二框选指令之后,进入框选所述客观题区域的第二模式;在所述第二模式下,实时监测所述用户框选的客观题区域,并记录所述客观题区域的信息。
进一步地,所述学习结果包括所述主观题区域信息,基于所述至少一个定位区域的定位点对所述试卷样本进行学习,得到所述学习结果包括:在所述至少一个定位区域中包括主观题区域的情况下,获取到用户发送的第二框选指令;在获取到所述用户发送的第二框选指令之后,进入框选所述主观题区域的第三模式;在所述第三模式下,实时监测所述用户框选的主观题区域,并记录所述主观题区域的信息。
进一步地,在所述试卷样本中寻找至少一个定位区域包括:通过以下至少一种处理算法在所述试卷样本中寻找所述至少一个定位区域:模板匹配算法和矩形识别算法。
进一步地,对二值化处理之后的所述试卷样本进行纠偏处理,得到纠偏之后的所述原始试卷样本包括:对所述原始试卷样板进行轮廓提取,得到至少一个轮廓;在所述至少一个轮廓中选择面积最大的目标轮廓;对所述目标轮廓进行外接矩形处理,处理得到所述目标轮廓的倾斜角度;基于所述倾斜角度对所述原始试卷样本进行旋转操作,得到纠偏之后的所述原始试卷样本。
进一步地,基于所述学习结果,自适应地采用多种处理算法中的至少一种算法对所述目标试卷进行识别,得到所述目标试卷的识别结果包括:获取所述学习结果中的目标题目区域;在所述目标题目区域中查找定位点;在未查找到所述定位点的情况下,查找与所述目标题目区域相邻的定位点;通过所述处理算法,并基于所述相邻的定位点确定待识别题目区域的矩形信息,并对所述待识别题目区域的矩形信息进行切割。
结合第二方面,本发明实施例提供了一种智能阅卷***无定位点图像识别***,包括:第一获取单元,用于获取待处理的试卷样本;学习单元,用于对所述试卷样本进行学习处理,得到学习结果,其中,所述学习结果包括:所述试卷样本的考号区域信息,客观题区域信息,主观题区域信息;第二获取单元,用于获取待处理的目标试卷;识别单元,用于基于所述学习结果,自适应地采用多种处理算法中的至少一种算法对所述目标试卷进行识别,得到所述目标试卷的识别结果,其中,所述识别结果包括以下信息:所述目标试卷的考号区域信息,所述目标试卷的客观题区域信息,所述目标试卷的主观题区域信息。
在本发明实施例中,首先待处理的试卷样本,然后,对试卷样本进行学习处理,得到学习结果,其中,学习结果包括试卷样板的考号区域信息,客观题区域信息,主观题区域信息;接下来,就可以获取待处理的目标试卷,并基于学习结果对目标试卷进行识别,得到目标试卷的识别结果,其中,识别结果中包括目标试卷的考号区域信息,目标试卷的客观题区域信息,目标试卷的主观题区域信息。在本发明实施例中,对于无定位点试卷,通过首先对试卷样板进行学习来对目标试卷进行识别,从而,能够准确对无定位点试卷进行识别处理,进而缓解了现有技术中存在的无法自适应地采用多种定位方法实现对试卷图像的精确定位和识别的技术问题。
本发明的其他特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。
为使本发明的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是根据本发明实施例的一种智能阅卷***无定位点图像识别方法的流程图;
图2是根据本发明实施例的一种定位区域的学习结果的示意图;
图3是根据本发明实施例的一种框选模式的显示界面的示意图;
图4是根据本发明实施例的一种考号区域的学习结果的示意图;
图5是根据本发明实施例的一种客观题区域的学习结果的示意图;
图6是根据本发明实施例的一种用于设置选项的行数与列数的示意图;
图7是根据本发明实施例的一种客观题区域中选项学习结果的示意图;
图8是根据本发明实施例的一种主观题区域的学习结果的示意图;
图9是根据本发明实施例的一种智能阅卷***无定位点图像识别***的示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合附图对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例一:
根据本发明实施例,提供了一种智能阅卷***无定位点图像识别方法的实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机***中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
图1是根据本发明实施例的一种智能阅卷***无定位点图像识别方法的流程图,如图1所示,该方法包括如下步骤:
步骤S102,获取待处理的试卷样本;
步骤S104,对所述试卷样本进行学习处理,得到学习结果,其中,所述学习结果包括:所述试卷样本的考号区域信息,客观题区域信息,主观题区域信息;
步骤S106,获取待处理的目标试卷;
步骤S108,基于所述学习结果,自适应地采用多种处理算法中的至少一种算法对所述目标试卷进行识别,得到所述目标试卷的识别结果,其中,所述识别结果包括以下信息:所述目标试卷的考号区域信息,所述目标试卷的客观题区域信息,所述目标试卷的主观题区域信息。
需要说明的是,在本发明实施例中,可以通过预先研发的试卷阅读软件来执行。具体地,用户可以通过该软件对试卷样本进行学习,例如,通过手动操控该软件对试卷样本进行学习,或者,通过该软件的自动控制来实现对试卷样板的学习。在对试卷样本提前进行学习之后,就可以通过该软件对目标试卷进行识别处理,得到识别结果。
在本发明实施例中,首先待处理的试卷样本,然后,对试卷样本进行学习处理,得到学习结果,其中,学习结果包括试卷样板的考号区域信息,客观题区域信息,主观题区域信息;接下来,就可以获取待处理的目标试卷,并基于学习结果对目标试卷进行识别,得到目标试卷的识别结果,其中,识别结果中包括目标试卷的考号区域信息,目标试卷的客观题区域信息,目标试卷的主观题区域信息。在本发明实施例中,对于无定位点试卷,通过首先对试卷样板进行学习来对目标试卷进行识别,从而,能够准确对无定位点试卷进行识别处理,进而缓解了现有技术中存在的无法自适应地采用多种定位方法实现对试卷图像的精确定位和识别的技术问题。
在一个可选的实施方式中,获取待处理的试卷样本包括如下步骤:
步骤S1021,对原始试卷样本进行二值化处理,得到二值化处理之后的所述原始试卷样本;
步骤S1022,对二值化处理之后的所述试卷样本进行纠偏处理,得到纠偏之后的所述原始试卷样本,并将纠偏之后的所述原始试卷样本作为所述待处理的试卷样本。
在本发明实施例中,首先,调整试卷样本的二值化阈值,即对原始试卷样本进行二值化处理。一般在电脑上保存的数字试卷都是彩色或灰色的,不利于对试卷进行处理,二值化后的试卷可以凸显特征,减少干扰。二值化的方法是用户根据经验调整试卷的二值化阈值。
对原始试卷样本进行扫描之后,原始试卷样本会出现不同程度的倾斜,因此,需要对原始试卷样本进行纠偏处理,以提高识别的正确率。在本发明实施例中,可以在对试卷样本进行二值化处理之后,就可以对二值化处理之后的试卷样本进行纠偏处理,得到纠偏处理之后的原始试卷样本,并将纠偏之后的原始试卷样本作为待处理的试卷样本。
需要说明的是,在本发明实施例中,在对由于一份试卷包括多张试卷,因此,在对试卷样本执行上述步骤S1021和步骤S1022所描述的步骤时。需要依次采用上述步骤S1021和步骤S1022所描述的方法对每张试卷进行学习处理。
纠偏处理的方法有很多种,在本发明实施例中,可以采用最大轮廓纠偏或者直线拟合纠偏方式对原始试卷样本进行纠偏处理。下面,将具体介绍该两种纠偏处理方式。
方式一、最大轮廓纠偏
在一个可选的实施方式中,对二值化处理之后的所述试卷样本进行纠偏处理,得到纠偏之后的所述原始试卷样本包括如下步骤:
首先,对所述原始试卷样板进行轮廓提取,得到至少一个轮廓;
然后,在所述至少一个轮廓中选择面积最大的目标轮廓;
接下来,对所述目标轮廓进行外接矩形处理,处理得到所述目标轮廓的倾斜角度;
最后,基于所述倾斜角度对所述原始试卷样本进行旋转操作,得到纠偏之后的所述原始试卷样本。
具体地,在本发明实施例中,首先,对原始试卷样本的扫描图像进行灰度化与二值化的预处理,并对原始试卷样本进行轮廓提取,找到原始试卷样本中所有最外层的轮廓(即,上述至少一个轮廓)。比较所有最外层轮廓(即,上述至少一个轮廓)的面积大小,选取最大面积的目标轮廓,对该目标轮廓进行寻找外接矩形处理,最终可以得到最大的目标轮廓的倾斜角度,该角度就是试卷样本的倾斜角度。利用该倾斜角度,可以对试卷样本进行旋转操作,最终得到纠偏后的试卷样本图像。
在本发明实施例中,该软件可以采用Opencv函数来实现最大矩形轮廓的查找。其中,Opencv中寻找最大矩形轮廓函数为:
intcvFindContours(CvArr*image,CvMemStorage*storage,CvSeq**first_contour,intheader_size=sizeof(CvContour),intmode=CV_RETR_LIST,intmethod=CV_CHAIN_APPROX_SIMPLE,CvPointoffset=cvPoint(0,0))。
Image表示为:8比特单通道的源二值图像,灰度图像。非零像素作为1处理,0像素保存不变。从一个灰度图像得到二值图像的函数有:cvThreshold,cvAdaptiveThreshold和cvCanny。
storage表示为:返回轮廓的容器。
first_contour表示为:输出参数,用于存储指向第一个外接轮廓。
header_size表示为:header序列的尺寸。如果选择method=CV_CHAIN_CODE,则header_size>=sizeof(CvChain);其他,则header_size>=sizeof(CvContour)。
mode表示为:检索模式,可取值如下:
CV_RETR_EXTERNAL:只检索最外面的轮廓;
CV_RETR_LIST:检索所有的轮廓,并将其放入list中;
CV_RETR_CCOMP:检索所有的轮廓,并将他们组织为两层:顶层是各部分的外部边界,第二层是空洞的边界;
CV_RETR_TREE:检索所有的轮廓,并重构嵌套轮廓的整个层次。
这里我们只需要外部轮廓,因此选择CV_RETR_EXTERNAL即可。
method表示为:边缘近似方法(除了CV_RETR_RUNS使用内置的近似,其他模式均使用此设定的近似算法)。
offset表示为:偏移量,用于移动所有轮廓点。
方式二、直线拟合纠偏方式
该直线拟合纠偏方式适用于试卷答题区外不存在明显的矩形边框、边框断裂不清晰的试卷样本,具体地,该直线拟合纠偏方式的具体实现原理描述如下:
通过下采样的方式,纵向每隔固定个像数点,从左向右扫描试卷样本,当遇到第一个黑色像数点时停止扫描,记录该黑色像数点的坐标。重复该操作,直到整张试卷扫描过一次,此时将得到一组坐标,将这组坐标以横坐标的大小进行排序,剔除两端的坐标,对剩下的坐标进行最小二乘法直线拟合,这样就能得到一条直线,该直线的倾斜角度也就是试卷的倾斜角度,利用该角度,对试卷进行旋转操作,就能得到纠偏后的试卷样本。
在另一个可选的实施方式中,对所述试卷样本进行学习处理,得到学习结果包括:
在所述试卷样本中寻找至少一个定位区域,其中,所述定位区域中包括定位点;
基于所述至少一个定位区域的定位点对所述试卷样本进行学习,得到所述学习结果。
在本发明实施例中,在对原始试卷样本进行二值化处理和纠偏处理之后,就可以对处理之后得到的待分析试卷样板进行学习处理。
在对试卷样本进行学习处理时,对于无定位点试卷样本,首先在无定位点试卷样本中寻找至少一个定位区域,其中,该定位区域可以理解为能够进行定位的矩形。在寻找到定位区域之后,记录定位区域的定位信息。如图2所示,符号1,符号2和符号3所示的矩形框所框选的区域即为定位区域。
需要说明的是,在本发明实施例中,在该定位区域中包括定位点,即该矩形定位区域的中心即为该定位区域的定位点。在确定出定位点之后,就可以基于定位点对试卷样本进行学习,得到考号区域,客观题区域和主观题区域。
在另一个可选的实施方式中,在学习结果包括所述考号区域信息的情况下,基于所述至少一个定位区域的定位点对所述试卷样本进行学习,得到所述学习结果包括如下步骤:
步骤S11,在所述至少一个定位区域中不包括考号区域的情况下,获取用户发送的第一定位指令,其中,所述第一定位指令为在所述试卷样本中定位第一模板图像的指令;
步骤S12,在获取到所述第一定位指令之后,实时监测所述用户所框选的区域,并将所述用户所框选的区域作为所述第一模板图像;
步骤S13,在获取到所述用户发送的第一框选指令之后,进入框选所述考号区域的第一模式;
步骤S14,在所述第一模式下,实时监测所述用户框选的考号区域,并记录所述考号区域的信息。
在本发明实施例中,在对试卷样本进行学习时,用户可以在该软件中选择不同的学习模式,例如,如图3所示,可以在如图3所示的界面中选择“考号”,“选择题”和“主观题”,当用户选择“考号”时,将进入考号区域的学习模式。
在对试样样本中的考号区域进行学习之前,且在至少一个定位区域中不包括考号区域的情况下,用户在该软件中选择第一模板图像。具体地,用户可以在如图3所示的界面中选择“模板”,此时,即为向该软件发送第一定位指令。此时,该软件将实时监测用户所框选的区域。
例如,如图4所示的“学籍号填涂区”这几个字的框选区域即为第一模板图像,需要说明的是,在未框选“学籍号填涂区”这几个字之前,“学籍号填涂区”这几个字的框选区域是不存在的。用户可以在“学籍号填涂区”这几个字的左上角点击一下鼠标,并在“学籍号填涂区”这几个字的右下角点击一下鼠标,此时,该软件将自动记录用户所点击的位置坐标,然后,基于该位置坐标将“学籍号填涂区”这几个字进行框选,得到第一模板图像。
在对第一模板图像进行定位之后,就可以进行考号区域的框选阶段。此时,用户可以在如图3所示的界面中点击“考号”,此时就可以理解为向该软件发送第一框选指令。该软件在获取到第一框选指令之后,就可以进入框选考号区域的第一模式,并在第一模式下,实时监测用户所框选的考号区域,并记录考号区域的信息。
在框选考号区域之前,首先要预先设置第一模式,其中,该第一模式的设置过程描述如下:
首先需要确定一个最佳定位距离,该最佳定位距离的定位距离设置为试卷长度的1/3。当用户框选的是考号时,判断该考号区域的最佳定位范围中是否包含两个定位点,若该范围内没有定位点或者仅有一个定位点,则提示用户需要添加新的定位点;若该范围内有两个定位点,此时可以保证定位的精度。
如图3所示的界面中,当用户点击“考号”时,则进入第一模式。此时,用户就可以框选考号区域,如图4所示,考号区域中包括10列数字,该10列数字的前4列数字为已经被框选的考号区域,10列数字中后6列数字为还未被框选的考号区域。以第5列还未被框选的考号区域为例进行说明。用户可以通过鼠标点击该列数字的左上角,并通过鼠标点击该列数字的右下角。此时,即监控到用户所框选的考号区域,此时,基于第一模式,该软件将自动判断考号区域的最佳定位距离的范围内是否包含两个定位点,如果包含,则记录当前用户所框选的考号区域,如果不包含,则提示用户添加新的定位点。
需要说明的是,在本发明实施例中,针对如图4所示中的每列数字,均按照上述所描述的方法来进行考号区域的框选和记录。
在另一个可选的实施方式中,在学习结果包括所述客观题区域信息的情况下,基于所述至少一个定位区域的定位点对所述试卷样本进行学习,得到所述学习结果包括如下步骤:
步骤S21,在所述至少一个定位区域中不包括客观题区域的情况下,获取用户发送的第二定位指令,其中,所述第二定位指令为在所述试卷样本中定位第二模板图像的指令;
步骤S22,在获取到所述第二定位指令之后,实时监测所述用户所框选的区域,并将所述用户所框选的区域作为所述第二模板图像;
步骤S23,在获取到所述用户发送的第二框选指令之后,进入框选所述客观题区域的第二模式;
步骤S24,在所述第二模式下,实时监测所述用户框选的客观题区域,并基于所述客观题区域信息。
在本发明实施例中,在对试卷样本的客观题区域进行学习时,用户可以在该软件中选择“选择题”,当用户选择“选择题”时,将进入客观题区域的学习模式(即,第二模式)。
在对试样样本中的客观题区域进行学习之前,且在至少一个定位区域中不包括客观题区域的情况下,用户在该软件中选择第二模板图像。具体地,用户可以在如图3所示的界面中选择“模板”,此时,即为向该软件发送第二定位指令。此时,该软件将实时监测用户所框选的区域。
例如,图5中箭头所示的区域“以下为选择题答题区”即为第二模板图像,需要说明的是,在未框选“以下为选择题答题区”这几个字之前,“以下为选择题答题区”这几个字的框选区域是不存在的。用户可以在“以下为选择题答题区”这几个字的左上角点击一下鼠标,并在“以下为选择题答题区”这几个字的右下角点击一下鼠标,此时,该软件将自动记录用户所点击的位置坐标,然后,基于该位置坐标将“以下为选择题答题区”这几个字进行框选,得到第二模板图像。
在对第二模板图像进行定位之后,就可以进行客观题区域的框选阶段。此时,用户可以在如图3所示的界面中点击“选择题”,此时就可以理解为向该软件发送第二框选指令。该软件在获取到第二框选指令之后,就可以进入框选客观题区域的第二模式,并在第二模式下,实时监测用户所框选的客观题区域,并记录客观题区域的信息。
在框选客观题区域之前,首先要预先设置第二模式,其中,该第二模式的设置过程描述如下:
首先,需要确定一个最佳定位距离,该最佳定位距离的定位距离设置为试卷长度的1/3。当用户框选的是选择题时,判断该客观题区域的最佳定位范围中是否包含两个定位点,若该范围内没有定位点或者仅有一个定位点,则提示用户需要添加新的定位点;若该范围内有两个定位点,此时可以保证定位的精度。
如图3所示的界面中,当用户点击“选择题”时,则进入第二模式。此时,用户就可以框选客观题区域,如图5所示,符号4所示的区域即为客观题区域的大致区域。在框选了一个大致区域后,在如图6所示的界面中填入选项的行数与列数,该软件将自动得检测到该大致区域中每个选项的位置与大小,检测得到的每个选项的位置与大小的示意图如图7所示。
具体实现原理描述如下:通过像数遍历的方法来检测大致区域中选项的位置与大小,从选项的四周往中心进行像数点的扫描,当遇到一定数量的黑色点像数的话,停止扫描。这样就能得到选项的四个端点,从而确定选项的位置与大小。
在另一个可选的实施方式中,在所述学习结果包括所述主观题区域信息的情况下,基于所述至少一个定位区域的定位点对所述试卷样本进行学习,得到所述学习结果包括如下步骤:
步骤S31,在所述至少一个定位区域中包括主观题区域的情况下,获取到用户发送的第二框选指令;
步骤S32,在获取到所述用户发送的第二框选指令之后,进入框选所述主观题区域的第三模式;
步骤S33,在所述第三模式下,实时监测所述用户框选的主观题区域,并基于所述主观题区域信息。
在本发明实施例中,在对试卷样本的客观题区域进行学习时,用户可以如图3所示的界面中选择“主观题”,当用户选择“主观题”时,将进入主观题区域的学习模式(即,第三模式)。
在对试样样本中的客观题区域进行学习之前,且在至少一个定位区域中包括客观题区域的情况下,用户可以在如图3所示的界面中点击“主观题”,此时就可以理解为向该软件发送第三框选指令。该软件在获取到第三框选指令之后,就可以进入框选主观题区域的第三模式,并在第三模式下,实时监测用户所框选的主观题区域,并记录主观题区域的信息。
在框选客观题区域之前,首先要预先设置第三模式,其中,该第三模式的设置过程描述如下:
首先需要确定一个最佳定位距离,该最佳定位距离的定位距离设置为试卷长度的1/3。当用户框选的是主观题时,判断该主观题区域的最佳定位范围中是否包含一个定位点,若该范围内没有定位点,则提示用户需要添加新的定位点;若该范围内有一个定位点,此时可以保证定位的精度。
如图3所示的界面中,当用户点击“主观题”时,则进入第三模式。此时,用户就可以框选主观题区域。具体地,如图8所示的即为框选的一个主观题区域。在框选如图8所示的主观题区域之前,用户可以通过鼠标点击该区域的左上角,并通过鼠标点击该区域的右下角,当该软件检测到该两个点的位置坐标之后,就能够基于该位置坐标确定一个主观题区域。
在另一个可选的实施方式中,在所述试卷样本中寻找至少一个定位区域包括:通过以下至少一种方法在所述试卷样本中寻找所述至少一个定位区域:模板匹配算和矩形识别算法。
在另一个可选的实施方式中,基于所述学习结果对,自适应地采用多种处理算法中的至少一种算法所述目标试卷进行识别,得到所述目标试卷的识别结果包括如下步骤:
步骤S1081,获取所述学习结果中的目标题目区域;
步骤S1082,在所述目标题目区域中查找定位点;
步骤S1083,在未查找到所述定位点的情况下,查找与所述目标题目区域相邻的定位点;
步骤S1084,通过所述处理算法,并基于所述相邻的定位点确定待识别题目区域的矩形信息,并对所述待识别题目区域的矩形信息进行切割。
具体地,在本发明实施例中,在对目标试卷进行识别时,首先对试卷进行纠偏,纠偏的方法包括两种,一是拟合直线的纠偏方法,用户选择试卷上的直线部分,然后,抽样拟合出一条直线,计算出直线的倾斜角度,再对试卷进行纠偏;二是通过寻找最大矩形的方法,找到试卷上最大的一个矩形,计算该矩形的倾斜角度,然后进行纠偏。接下来,判断目标试卷的页码是否准确,具体地,可以通过学习库中记录的页码识别区域,对比判断试卷页码是否正确。在对比正确之后,就可以取出目标题目区域,查看目标题目区域中的定位点是否已经找到,若没有找到,则计算找出距离该区域最近的一个定位点进行定位识别,找到定位点后,将该定位点的标记记为“已识别”,供以后其他区域定位使用,而无需要再一次重新定位。找到一个定位之后,计算出试卷上目标题目区域的矩形信息,若题目是主观题,则将主观题切割出来;若题目是客观题(包括考号),则识别出填涂的选项。若全部定位点识别失败,则标记为错误的试卷;依照上面的步骤依次处理完每一张试卷,并输出结果。
需要说明的是,通过上述描述可知,在本发明实施例中,可以采用模板匹配算法和矩形识别算法对试卷样本定位区域进行识别。上述两种算法还可以用于来确定目标试卷中的矩形区域。
例如,模板匹配算法,是选取试卷样本上的一小部分(例如,目标题目区域)作为模板,通过模板匹配算法找到待识别的目标试卷上的相同地方,从而找到相似的矩形信息进行定位。矩形识别算法,在对试卷样本进行学习,得到学习结果之后,就可以基于学习结果对待识别的目标试卷进行矩形信息的定位和识别。
下面,将对上述两种算法进行详细的介绍。
方法一、模板匹配算法的计算过程描述如下:
在对试卷样本进行学习的过程中,采用模板匹配算法对试卷样本进行学习的过程描述如下:
首先,用户在试卷样本上选择模板图像后,计算模板图像的占空比,若占空比过少则舍弃该模板,提示用户重新选取,直到模板占空比达到符合要求的程度。
然后,记录模板图像的位置、宽高,并将宽高扩大20%作为匹配搜索区域,并运行cvMatchTemplate,记录模板图像在匹配搜索区域中的最佳相似度值SMax1。
在对目标试卷进行识别的过程中,采用模板匹配算法对目标试卷进行识别的过程描述如下:
1)设定最佳匹配度阈值TMax,至少匹配度阈值Tmin和匹配搜索区域N;
2)读取模板图像文件、位置、宽高、匹配搜索区域;
3)在匹配搜索区域内对模板图像进行一次cvMatchTemplate操作得到最佳相似度值SMax2,计算相似度S=SMax2/SMax1,若S>=TMax,则认为定位成功,返回模板坐标作为定位点;若S<Tmax则扩大匹配搜索区域1次,记扩大次数为n;
4)判断“n<N?”若成立,记录这n次匹配中的相似度最大值SMaxTmp和相关信息,并跳至第3步;否则,进行下一步
5)判断SMaxTmp>Tmin是否成立,若成立,则返回该最大相似度值时的位置信息,否则,返回匹配失败。
方法二、矩形识别算法
该算法分为两大步,一是试卷样本上定位区域的记录,二是待处理的目标试卷上矩形信息的定位识别。其总体的思想是先在试卷样本上记定位区域的大小、边框线段在识别出的所有直线中的排序索引和长度,根据这些记录的信息在待处理的目标试卷上做出矩形信息的识别。
步骤一、试卷样本上定位区域的记录
首先,用户大致框选矩形区域,然后,识别出该区域内的最大轮廓,并用矩形拟合;接下来,对矩形进行一次“矩形线段重叠判定”,作用是确保最大轮廓寻找出来矩形的与直线拟合出来的矩形大小一致。
“矩形线段重叠判定”方法如下:试卷中的文字会影响线段的识别,为了尽可能过滤掉干扰的像素点,首先需要对矩形区域进行清除处理,步骤如下:确定矩形框的像素宽,一般3~6个像素,根据经验设置为5;从定位区域由上至下横向扫描图像,向下依次扫描5个像素点,若其中有黑色像素点,则停止扫描,并将该行的总像素SumPix加1;当扫描完一行之后,比较SumPix与定位区域宽的大小,若SumPix大于定位区域宽的80%,则认为该行有可能是矩形的边长,并停止扫描;否则,则将该行像素全部置零。依次从上、下、左、右四个方向对图像进行清除操作,滤去尽可能多的噪声。对经过清除处理后的矩形区域图像运用霍夫变换函数进行直线检测,得到该区域的线段信息。由于图像线段有厚度、断裂等原因,霍夫变换检测出来的线段一般效果不是很完美,例如一条线段会检测出多条,因此需要对检测出来的线段进行二次处理。
处理步骤如下:1.将线段分成四类,一是垂直左边的线段,二是垂直右边的线段,三是水平上方的线段,四是水平底部的线段,分类方法:根据线段坐标计算线段的角度,再比较线段坐标与区域中心的大小关系,得出线段的分类;2.合并线段,从分类后的线段中取出两条线段,计算他们在各自方向上的距离,垂直的线段距离是y轴坐标的相减的绝对值,水平的线段距离是x轴坐标的相减的绝对值,比较距离是否在5个像素内,若是则将两条直线合并,合并的方法是取两条直线各自端点的坐标;3.将合并后的线段排序,因为要记录矩形边框线段在所有识别出的线段的索引序号。
因此需要对不同位置的线段需要作不同的排序:顶部线段:根据y轴大小排序;底部线段:根据寻找区域底部位置距离大小排序;左侧线段:根据x轴大小排序;右侧线段:根据寻找区域右侧位置距离大小排序;记录四个方向上矩形线段的序号信息。
步骤二、待处理的目标试卷上的矩形信息的定位识别
1.运用霍夫变换检测出区域信息的线段,并对检测出的线段作预处理,包括分类、合并;
2.对预处理后的线段进行加权排序。线段加权排序是基于这样的一个问题:霍夫变换会检测出很多条线段,那么就需要选择出矩形的边线。如果将所有的线段都测试一遍从而得出最优的矩形的话,假设每个方向有10条线段,那么拟合出最优矩形所需要的拟合尝试最多有可能是:10^4=10000次。这样识别的效率就会很低,因此需要对线段进行加权排序,筛选出权值最高,也就是最有可能是矩形边线上的线段,将不可能的线段抛弃,最后得到权值最高的三条线段,那么每次拟合矩形最糟糕也只是3^4=81次,而很多情况下,因为已经筛选出了权值最高的线段,因此一般只需要3-5次的尝试便可以得到最优的矩形。所以线段加权排序是非常重要的一步。线段权值包括两个方面的内容,一是线段位置误差权值,二是线段长度误差权值。因为原先在模板上已经记录了各个方向上矩形的边线序号,因此越接近该序号的线段越有可能是矩形的边线,但由于模板试卷和待识别试卷的扩大识别区域不完全一致的原因,序号相同不一定就是矩形的边线,所以还要加上线段长度的判断,长度越接近模板中矩形边线长度的线段越有可能是需要寻找的矩形边线。
线段位置误差权值由排序后的线段序号和记录的序号差值确定,其计算公式为:位置误差权值=0.8^abs(当前线段序号-记录线段序号)。其中,当序号误差为0,权值为1,当序号误差增大时,权值由于幂运算的原因迅速减少,能够较明显的把各个阶层的线段区分开来。
线段长度误差权值为了避免误差数据过大的影响,需要对误差进行归一化处理,归一化的方法是min-max标准化。首先计算每条线段与记录的矩形边线长度误差,并保存误差的最大最小值,将误差归一化的公式为:长度误差权值=(线段长度-最小线段长度)/(最大线段长度-最小线段长度)。归一化后,每个误差数据都能发挥相同的作用效果。计算得到每条线段的权值后,根据权值从大到小对线段进行排序。
3.将权值位于前三位的线段提取出来,其余舍弃。
4.从上下左右各取出一条线段进行拟合,拟合的方法是:求出上线段与左线段的交点Point1,下线段和右线段的交点Point2,拟合得到的矩形长度为:Point2.x-Point1.x;高度为:Point2.y-Point1.y。
5.比较模板中记录的矩形长高,若误差均在8个像素之内,则认为识别成功,返回拟合矩形的坐标和长高;若长度或高度的误差其中有一个超过了8个像素,则进行下一步。
6.上方线段集合中取出下一条候选线段,再次进行拟合。
7.当上方线段集合全部测试完毕并且没有找到合适的矩形时,将该方向的线段索引重置,并按照“上、左、下、右”的顺序将更改线段的权限移至下一个方向。
8.四个方向上的所有线段集合全部测试拟合完毕后,若均没找到合适的矩形则输出“矩形未找到”。
需要说明的是,除了上述几种定位方法之外,还可以选择其他的定位方法来对目标试卷中的矩形信息进行定位识别,例如,还可以采用矩形轮廓匹配算法和直线拟合矩形算法来查找定位点。
由于该软件针对的是无定位点的试卷,因此需要对试卷选择另外的定位方法,该软件选择的定位算法是模板匹配+矩形轮廓匹配算法+直线拟合矩形。三种定位方法能过对试卷进行更准确的定位,减少失误率。
模板匹配使用的方法是相关匹配法,这种方法将模板对其均值的相对值与图像对其均值的相对值进行匹配,1表示完美匹配,-1表示最糟糕的匹配,0表示没有任何相关性。矩形轮廓识别是自动地在试卷上寻找较大的矩形,通过寻找外轮廓的方法确定矩形的位置大小来作为一个定位的区域。直线拟合矩形则是通过识别矩形的四条边线段来拟合出一个矩形,判断该矩形是否与记录的大小一致,若一致的话,拟合出来的矩形便可成为一个定位点。
上述三种定位的方法各有优缺点,模板匹配的优点是不受试卷内容约束,适用于大多数无定位点的试卷,缺点是速度慢,定位效果受试卷模糊程度影响较大;矩形轮廓的方法优点是简单快速,但受试卷内容制约较大,例如试卷的矩形有两处以上的断裂会导致定位失败,同时,因为是寻找外轮廓,若矩形边上有笔画突出,也会导致矩形定位失败;直线拟合的方法优点是能够对抗试卷模糊、矩形断裂严重的情况,不过速度较慢,而且若矩形内部或外部有多条直线也会对识别造成一定的影响。通过四种方法互补,能有效提高定位效率和准确性。
下面将介绍上述矩形轮廓匹配算法和直线拟合矩形算法
方法三、矩形轮廓匹配算法
矩形轮廓匹配的思想是找到试卷样本和目标试卷中宽高相同的矩形作为试卷的定位点。该方法的难点在于需要解决试卷中的矩形存在的断裂、厚度不一、笔画干扰、倾斜等多种问题运用的方法是最大轮廓拟合矩形。通过寻找一定范围内的最大轮廓,然后用一个最小的矩形对其进行拟合,判断该拟合出来的矩形是否与模板试卷中的矩形宽高一致,若一致则将该矩形的左上角作为定位点。
在对试卷样本进行学习的过程中,采用模板匹配算法对试卷样本进行学习的过程描述如下:
(1)找到用户框选区域中最大的轮廓,并用矩形拟合;
(2)按照搜索区域大小的20%对其进行扩大;
(3)记录矩形信息。
在对目标试卷进行识别的过程中,采用模板匹配算法对目标试卷进行识别的过程描述如下:
(1)设定识别参数,参数包括:搜索区域扩大次数N,矩形宽误差接受程度WE,矩形高误差接受程度HE,轮廓大小过滤M,并初始化扩大搜索区域次数n=0;
(2)若n>N则返回寻找矩形失败;否则,进行下一步。
(3)寻找搜索区域中的所有轮廓;
(4)判断轮廓大小>M是否成立,若是,则保留该轮廓,否则,删除该轮廓;
(5)用最小矩形对轮廓进行拟合;
(6)将拟合出来的矩形按面积大小排序;
(7)取出最大的矩形,将该矩形的宽、高与模板试卷中矩形的宽、高进行相减,得到宽误差W,高误差H,若W<=WE并且H<=HE,则认定矩形寻找成功;否则,扩大搜索区域,n加1,返回第(2)步。
方法四、直线拟合矩形算法
直线拟合矩形是基于这样的考虑:虽然最大轮廓拟合能够识别出一部分矩形,但仍然有不足的地方,例如若矩形有多处断裂便会导致最大轮廓的误差很大,或者矩形线段上有笔画相连也会导致拟合出来的误差很大,而直线拟合矩形能够很好地解决这些问题。该算法的基本思想是通过霍夫变换识别一定区域的线段,对比模板试卷上记录的矩形信息从而拟合出一个大小相似的矩形作为定位点。在本发明实施例中,主要采用霍夫变换函数来实现该直线拟合算法。
在Opencv中霍夫变化函数为:void HoughLinesP(InputArray image,OutputArray lines,double rho,double theta,int threshold,double minLineLength=0,double maxLineGap=0)。
第一个参数,InputArray类型的image,输入图像,即源图像,需为8位的单通道二进制图像,可以将任意的源图载入进来后由函数修改成此格式后,再填在这里。
第二个参数,InputArray类型的lines,经过调用HoughLinesP函数后存储了检测到的线条的输出矢量,每一条线由具有四个元素的矢量(x_1,y_1,x_2,y_2)表示,其中,(x_1,y_1)和(x_2,y_2)是每个检测到的线段的结束点。
第三个参数,double类型的rho,以像素为单位的距离精度。另一种形容方式是直线搜索时的进步尺寸的单位半径。
第四个参数,double类型的theta,以弧度为单位的角度精度。另一种形容方式是直线搜索时的进步尺寸的单位角度。
第五个参数,int类型的threshold,累加平面的阈值参数,即识别某部分为图中的一条直线时它在累加平面中必须达到的值。大于阈值threshold的线段才可以被检测通过并返回到结果中。
第六个参数,double类型的minLineLength,有默认值0,表示最低线段的长度,比这个设定参数短的线段就不能被显现出来。
第七个参数,double类型的maxLineGap,有默认值0,允许将同一行点与点之间连接起来的最大的距离。
实施例二:
本发明实施例还提供了一种智能阅卷***无定位点图像识别***,该智能阅卷***无定位点图像识别***主要用于执行本发明实施例上述内容所提供的智能阅卷***无定位点图像识别方法,以下对本发明实施例提供的智能阅卷***无定位点图像识别***做具体介绍。
图9是根据本发明实施例的一种智能阅卷***无定位点图像识别***的示意图,如图9所示,该智能阅卷***无定位点图像识别***主要包括:第一获取单元91,学习单元92,第二获取单元93和识别单元94,其中:
第一获取单元,用于获取待处理的试卷样本;
学习单元,用于对所述试卷样本进行学习处理,得到学习结果,其中,所述学习结果包括:所述试卷样本的考号区域信息,客观题区域信息,主观题区域信息;
第二获取单元,用于获取待处理的目标试卷;
识别单元,用于基于所述学习结果对所述目标试卷进行识别,得到所述目标试卷的识别结果,其中,所述识别结果包括以下信息:所述目标试卷的考号区域信息,所述目标试卷的客观题区域信息,所述目标试卷的主观题区域信息。
在本发明实施例中,首先待处理的试卷样本,然后,对试卷样本进行学习处理,得到学习结果,其中,学习结果包括试卷样板的考号区域信息,客观题区域信息,主观题区域信息;接下来,就可以获取待处理的目标试卷,并基于学习结果对目标试卷进行识别,得到目标试卷的识别结果,其中,识别结果中包括目标试卷的考号区域信息,目标试卷的客观题区域信息,目标试卷的主观题区域信息。在本发明实施例中,对于无定位点试卷,通过首先对试卷样板进行学习来对目标试卷进行识别,从而,能够准确对无定位点试卷进行识别处理,进而缓解了现有技术中存在的无法自适应地采用多种定位方法实现对试卷图像的精确定位和识别的技术问题。
另外,在本发明实施例的描述中,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。
在本发明的描述中,需要说明的是,术语“中心”、“上”、“下”、“左”、“右”、“竖直”、“水平”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。此外,术语“第一”、“第二”、“第三”仅用于描述目的,而不能理解为指示或暗示相对重要性。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的***、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的***、装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个单元或组件可以结合或者可以集成到另一个***,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个处理器可执行的非易失的计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上所述实施例,仅为本发明的具体实施方式,用以说明本发明的技术方案,而非对其限制,本发明的保护范围并不局限于此,尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本发明实施例技术方案的精神和范围,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。
Claims (10)
1.一种智能阅卷***无定位点图像识别方法,其特征在于,包括:
获取待处理的试卷样本;
对所述试卷样本进行学习处理,得到学习结果,其中,所述学习结果包括:所述试卷样本的考号区域信息,客观题区域信息,主观题区域信息;
获取待处理的目标试卷;
基于所述学习结果,自适应地采用多种处理算法中的至少一种算法对所述目标试卷进行识别,得到所述目标试卷的识别结果,其中,所述识别结果包括以下信息:所述目标试卷的考号区域信息,所述目标试卷的客观题区域信息,所述目标试卷的主观题区域信息。
2.根据权利要求1所述的方法,其特征在于,获取待处理的试卷样本包括:
对原始试卷样本进行二值化处理,得到二值化处理之后的所述原始试卷样本;
对二值化处理之后的所述试卷样本进行纠偏处理,得到纠偏之后的所述原始试卷样本,并将纠偏之后的所述原始试卷样本作为所述待处理的试卷样本。
3.根据权利要求1所述的方法,其特征在于,对所述试卷样本进行学习处理,得到学习结果包括:
在所述试卷样本中寻找至少一个定位区域,其中,所述定位区域中包括定位点;
基于所述至少一个定位区域的定位点对所述试卷样本进行学习,得到所述学习结果。
4.根据权利要求3所述的方法,其特征在于,所述学习结果包括所述考号区域信息,基于所述至少一个定位区域的定位点对所述试卷样本进行学习,得到所述学习结果包括:
在所述至少一个定位区域中不包括考号区域的情况下,获取用户发送的第一定位指令,其中,所述第一定位指令为在所述试卷样本中定位第一模板图像的指令;
在获取到所述第一定位指令之后,实时监测所述用户所框选的区域,并将所述用户所框选的区域作为所述第一模板图像;
在获取到所述用户发送的第一框选指令之后,进入框选所述考号区域的第一模式;
在所述第一模式下,实时监测所述用户框选的考号区域,并记录所述考号区域的信息。
5.根据权利要求3所述的方法,其特征在于,所述学习结果包括所述客观题区域信息,基于所述至少一个定位区域的定位点对所述试卷样本进行学习,得到所述学习结果包括:
在所述至少一个定位区域中不包括客观题区域的情况下,获取用户发送的第二定位指令,其中,所述第二定位指令为在所述试卷样本中定位第二模板图像的指令;
在获取到所述第二定位指令之后,实时监测所述用户所框选的区域,并将所述用户所框选的区域作为所述第二模板图像;
在获取到所述用户发送的第二框选指令之后,进入框选所述客观题区域的第二模式;
在所述第二模式下,实时监测所述用户框选的客观题区域,并记录所述客观题区域的信息。
6.根据权利要求3所述的方法,其特征在于,所述学习结果包括所述主观题区域信息,基于所述至少一个定位区域的定位点对所述试卷样本进行学习,得到所述学习结果包括:
在所述至少一个定位区域中包括主观题区域的情况下,获取到用户发送的第二框选指令;
在获取到所述用户发送的第二框选指令之后,进入框选所述主观题区域的第三模式;
在所述第三模式下,实时监测所述用户框选的主观题区域,并记录所述主观题区域的信息。
7.根据权利要求3所述的方法,其特征在于,在所述试卷样本中寻找至少一个定位区域包括:
通过以下至少一种算法在所述试卷样本中寻找所述至少一个定位区域:模板匹配算法和矩形识别算法。
8.根据权利要求2所述的方法,其特征在于,对二值化处理之后的所述试卷样本进行纠偏处理,得到纠偏之后的所述原始试卷样本包括:
对所述原始试卷样板进行轮廓提取,得到至少一个轮廓;
在所述至少一个轮廓中选择面积最大的目标轮廓;
对所述目标轮廓进行外接矩形处理,处理得到所述目标轮廓的倾斜角度;
基于所述倾斜角度对所述原始试卷样本进行旋转操作,得到纠偏之后的所述原始试卷样本。
9.根据权利要求1所述的方法,其特征在于,基于所述学习结果,自适应地采用多种处理算法中的至少一种算法对所述目标试卷进行识别,得到所述目标试卷的识别结果包括:
获取所述学习结果中的目标题目区域;
在所述目标题目区域中查找定位点;
在未查找到所述定位点的情况下,查找与所述目标题目区域相邻的定位点;
通过所述处理算法,并基于所述相邻的定位点确定待识别题目区域的矩形信息,并对所述待识别题目区域的矩形信息进行切割。
10.一种智能阅卷***无定位点图像识别***,其特征在于,包括:
第一获取单元,用于获取待处理的试卷样本;
学习单元,用于对所述试卷样本进行学习处理,得到学习结果,其中,所述学习结果包括:所述试卷样本的考号区域信息,客观题区域信息,主观题区域信息;
第二获取单元,用于获取待处理的目标试卷;
识别单元,用于基于所述学习结果,自适应地采用多种处理算法中的至少一种算法对所述目标试卷进行识别,得到所述目标试卷的识别结果,其中,所述识别结果包括以下信息:所述目标试卷的考号区域信息,所述目标试卷的客观题区域信息,所述目标试卷的主观题区域信息。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710807657.2A CN107506746A (zh) | 2017-09-08 | 2017-09-08 | 智能阅卷***无定位点图像识别方法及*** |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710807657.2A CN107506746A (zh) | 2017-09-08 | 2017-09-08 | 智能阅卷***无定位点图像识别方法及*** |
Publications (1)
Publication Number | Publication Date |
---|---|
CN107506746A true CN107506746A (zh) | 2017-12-22 |
Family
ID=60695449
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710807657.2A Pending CN107506746A (zh) | 2017-09-08 | 2017-09-08 | 智能阅卷***无定位点图像识别方法及*** |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107506746A (zh) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108171297A (zh) * | 2018-01-24 | 2018-06-15 | 谢德刚 | 一种答题卡识别方法及装置 |
CN108287895A (zh) * | 2018-01-19 | 2018-07-17 | 广东小天才科技有限公司 | 一种基于显性框调节的搜题方法及***、手持拍照设备 |
CN108615439A (zh) * | 2018-06-14 | 2018-10-02 | 刘骋 | 用于制定能力训练方案的方法、装置、设备及介质 |
CN110348400A (zh) * | 2019-07-15 | 2019-10-18 | 京东方科技集团股份有限公司 | 一种评分获取方法、装置及电子设备 |
CN111461100A (zh) * | 2020-03-31 | 2020-07-28 | 重庆农村商业银行股份有限公司 | 一种票据识别方法、装置、电子设备和存储介质 |
CN112507758A (zh) * | 2019-09-16 | 2021-03-16 | 深圳中兴网信科技有限公司 | 答题卡字符串识别方法、装置、终端和计算机存储介质 |
CN113128247A (zh) * | 2021-05-17 | 2021-07-16 | 阳光电源股份有限公司 | 一种图像定位标识验证方法及服务器 |
Citations (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101334814A (zh) * | 2008-04-28 | 2008-12-31 | 华北电力大学 | 一种自动化的扫描阅卷***及阅卷方法 |
CN102339352A (zh) * | 2010-07-20 | 2012-02-01 | 上海海鞠电子科技有限公司 | 电子阅卷方法 |
CN103400124A (zh) * | 2013-07-03 | 2013-11-20 | 北京鸿合盛视数字媒体技术有限公司 | 一种试卷识别方法及装置 |
CN104794948A (zh) * | 2015-04-20 | 2015-07-22 | 西安青柠电子信息技术有限公司 | 自动阅卷***及其使用方法 |
CN104809677A (zh) * | 2015-05-13 | 2015-07-29 | 江苏黄金屋教育咨询有限公司 | 基于统计和分析知识点掌握情况的自动阅卷方法 |
CN105205300A (zh) * | 2014-06-20 | 2015-12-30 | 北京鸿合智能***股份有限公司 | 自动调节阅卷方法及装置 |
CN105488512A (zh) * | 2015-11-27 | 2016-04-13 | 南京理工大学 | 基于Sift特征匹配和形状上下文的试卷阅卷方法 |
CN106033535A (zh) * | 2015-03-18 | 2016-10-19 | 成都理想境界科技有限公司 | 电子阅卷方法 |
CN106033544A (zh) * | 2015-03-18 | 2016-10-19 | 成都理想境界科技有限公司 | 基于模板匹配的试卷内容区域提取方法 |
CN106650608A (zh) * | 2016-10-31 | 2017-05-10 | 广东工业大学 | 一种无定位点试卷中矩形定位框的识别方法 |
CN106778703A (zh) * | 2017-01-25 | 2017-05-31 | 华中师范大学 | 电子阅卷的方法和装置 |
CN106897749A (zh) * | 2017-03-03 | 2017-06-27 | 盐城工学院 | 自动阅卷方法及*** |
CN106934411A (zh) * | 2015-12-31 | 2017-07-07 | 成都理想境界科技有限公司 | 基于模板匹配的电子阅卷方法 |
CN107025456A (zh) * | 2017-03-20 | 2017-08-08 | 安徽七天教育科技有限公司 | 一种教师批改痕迹自动识别的方法 |
-
2017
- 2017-09-08 CN CN201710807657.2A patent/CN107506746A/zh active Pending
Patent Citations (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101334814A (zh) * | 2008-04-28 | 2008-12-31 | 华北电力大学 | 一种自动化的扫描阅卷***及阅卷方法 |
CN102339352A (zh) * | 2010-07-20 | 2012-02-01 | 上海海鞠电子科技有限公司 | 电子阅卷方法 |
CN103400124A (zh) * | 2013-07-03 | 2013-11-20 | 北京鸿合盛视数字媒体技术有限公司 | 一种试卷识别方法及装置 |
CN105205300A (zh) * | 2014-06-20 | 2015-12-30 | 北京鸿合智能***股份有限公司 | 自动调节阅卷方法及装置 |
CN106033544A (zh) * | 2015-03-18 | 2016-10-19 | 成都理想境界科技有限公司 | 基于模板匹配的试卷内容区域提取方法 |
CN106033535A (zh) * | 2015-03-18 | 2016-10-19 | 成都理想境界科技有限公司 | 电子阅卷方法 |
CN104794948A (zh) * | 2015-04-20 | 2015-07-22 | 西安青柠电子信息技术有限公司 | 自动阅卷***及其使用方法 |
CN104809677A (zh) * | 2015-05-13 | 2015-07-29 | 江苏黄金屋教育咨询有限公司 | 基于统计和分析知识点掌握情况的自动阅卷方法 |
CN105488512A (zh) * | 2015-11-27 | 2016-04-13 | 南京理工大学 | 基于Sift特征匹配和形状上下文的试卷阅卷方法 |
CN106934411A (zh) * | 2015-12-31 | 2017-07-07 | 成都理想境界科技有限公司 | 基于模板匹配的电子阅卷方法 |
CN106650608A (zh) * | 2016-10-31 | 2017-05-10 | 广东工业大学 | 一种无定位点试卷中矩形定位框的识别方法 |
CN106778703A (zh) * | 2017-01-25 | 2017-05-31 | 华中师范大学 | 电子阅卷的方法和装置 |
CN106897749A (zh) * | 2017-03-03 | 2017-06-27 | 盐城工学院 | 自动阅卷方法及*** |
CN107025456A (zh) * | 2017-03-20 | 2017-08-08 | 安徽七天教育科技有限公司 | 一种教师批改痕迹自动识别的方法 |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108287895A (zh) * | 2018-01-19 | 2018-07-17 | 广东小天才科技有限公司 | 一种基于显性框调节的搜题方法及***、手持拍照设备 |
CN108287895B (zh) * | 2018-01-19 | 2020-11-06 | 广东小天才科技有限公司 | 一种基于显性框调节的搜题方法及***、手持拍照设备 |
CN108171297A (zh) * | 2018-01-24 | 2018-06-15 | 谢德刚 | 一种答题卡识别方法及装置 |
CN108171297B (zh) * | 2018-01-24 | 2022-01-14 | 谢德刚 | 一种答题卡识别方法 |
CN108615439A (zh) * | 2018-06-14 | 2018-10-02 | 刘骋 | 用于制定能力训练方案的方法、装置、设备及介质 |
CN110348400A (zh) * | 2019-07-15 | 2019-10-18 | 京东方科技集团股份有限公司 | 一种评分获取方法、装置及电子设备 |
US11790641B2 (en) | 2019-07-15 | 2023-10-17 | Boe Technology Group Co., Ltd. | Answer evaluation method, answer evaluation system, electronic device, and medium |
CN112507758A (zh) * | 2019-09-16 | 2021-03-16 | 深圳中兴网信科技有限公司 | 答题卡字符串识别方法、装置、终端和计算机存储介质 |
CN111461100A (zh) * | 2020-03-31 | 2020-07-28 | 重庆农村商业银行股份有限公司 | 一种票据识别方法、装置、电子设备和存储介质 |
CN111461100B (zh) * | 2020-03-31 | 2023-04-28 | 重庆农村商业银行股份有限公司 | 一种票据识别方法、装置、电子设备和存储介质 |
CN113128247A (zh) * | 2021-05-17 | 2021-07-16 | 阳光电源股份有限公司 | 一种图像定位标识验证方法及服务器 |
CN113128247B (zh) * | 2021-05-17 | 2024-04-12 | 阳光电源股份有限公司 | 一种图像定位标识验证方法及服务器 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107506746A (zh) | 智能阅卷***无定位点图像识别方法及*** | |
CN105046252B (zh) | 一种人民币冠字码识别方法 | |
CN104376318B (zh) | 在保留交叉字符笔划的同时去除文档图像中的下划线和表格线 | |
US8325998B2 (en) | Multidirectional face detection method | |
CN110309687A (zh) | 一种二维码图像的校正方法及校正装置 | |
CN106650608B (zh) | 一种无定位点试卷中矩形定位框的识别方法 | |
CN102346850A (zh) | 复杂金属背景下DataMatrix条码区域定位方法 | |
CN106529591A (zh) | 一种基于改进的mser图像匹配算法 | |
CN104834933A (zh) | 一种图像显著性区域的检测方法和装置 | |
CN107506765B (zh) | 一种基于神经网络的车牌倾斜校正的方法 | |
CN109859164A (zh) | 一种通过快速型卷积神经网络对pcba外观检验的方法 | |
CN106934455B (zh) | 基于cnn的遥感影像光学适配结构选取方法及*** | |
CN105718552A (zh) | 基于服装手绘草图的服装图像检索方法 | |
CN112132153B (zh) | 基于聚类和形态学处理的番茄果实识别方法及*** | |
CN116166960B (zh) | 用于神经网络训练的大数据特征清洗方法及*** | |
CN107194938A (zh) | 基于深度卷积神经网络的图像轮廓检测方法 | |
CN106504262A (zh) | 一种多特征融合的小瓷砖智能定位方法 | |
CN109543753B (zh) | 基于自适应模糊修复机制的车牌识别方法 | |
CN107341813A (zh) | 基于结构学习和素描特性推理网络的sar图像分割方法 | |
CN113191358B (zh) | 金属零件表面文本检测方法和*** | |
CN111401145A (zh) | 一种基于深度学习与ds证据理论的可见光虹膜识别方法 | |
CN109190625A (zh) | 一种大角度透视变形的集装箱箱号识别方法 | |
CN111091124A (zh) | 一种书脊文字识别方法 | |
CN110766016A (zh) | 一种基于概率神经网络的喷码字符识别方法 | |
CN107256410A (zh) | 对类镜像图像分类的方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20171222 |