CN110569845A - 一种试卷图像的校正方法及相关装置 - Google Patents

一种试卷图像的校正方法及相关装置 Download PDF

Info

Publication number
CN110569845A
CN110569845A CN201910865722.6A CN201910865722A CN110569845A CN 110569845 A CN110569845 A CN 110569845A CN 201910865722 A CN201910865722 A CN 201910865722A CN 110569845 A CN110569845 A CN 110569845A
Authority
CN
China
Prior art keywords
test paper
paper image
image data
identifier
correcting
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910865722.6A
Other languages
English (en)
Inventor
钟宝江
言俐光
丁娜
顾平
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou University
Original Assignee
Suzhou University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou University filed Critical Suzhou University
Priority to CN201910865722.6A priority Critical patent/CN110569845A/zh
Publication of CN110569845A publication Critical patent/CN110569845A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/24Aligning, centring, orientation detection or correction of the image
    • G06V10/243Aligning, centring, orientation detection or correction of the image by compensating for image skew or non-uniform image deformations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/24Aligning, centring, orientation detection or correction of the image
    • G06V10/245Aligning, centring, orientation detection or correction of the image by locating a pattern; Special marks for positioning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/09Recognition of logos

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Image Processing (AREA)

Abstract

本申请公开了一种试卷图像的校正方法,包括:获取试卷图像数据;对所述试卷图像数据进行标识符检测,得到标识符;根据所述标识符对所述试卷图像数据进行校正,得到已校正试卷图像数据。通过对获取到的试卷图像数据进行标识符检测,得到标识符,进一步根据获取到的标识符对试卷图像数据进行校正,而不是对试卷图像数据整体进行检测,减少了图像检测的面积,提高试卷图像数据校正的效率。本申请还公开了一种试卷图像的校正***、试卷图像的校正装置以及计算机可读存储介质,具有以上有益效果。

Description

一种试卷图像的校正方法及相关装置
技术领域
本申请涉及图像处理技术领域,特别涉及一种试卷图像的校正方法、试卷图像的校正***、试卷图像的校正装置以及计算机可读存储介质。
背景技术
随着信息技术的不断发展,可以采用自动化操作对重复复杂的动作进行替代,提高操作效率的同时,减少在重复操作中的人员成本浪费。尤其是在修改大量试卷的过程中,由于试卷的特性可以采用自动化操作有效的提高修改试卷的效率。在进行自动化阅卷的过程中,通常采用扫描设备或者数码相机获取试卷的数字图像。
而使用扫描设备或者数码相机获取试卷的数字图像时,由于主观或者客观的因素,会造成获取的试卷图像产生一些问题。例如扫描设备在获取试卷图像时,操作人员无法保证试卷图像放置端正,容易发生目标试卷的倾斜或者位移。而数码相机在获取试卷图像时,除了同样会产生上述问题外,还容易受到光线和遮挡问题的干扰,造成如试卷图像之间灰度值波动剧烈,单张图像内部光照不均匀,产生透视畸变等问题。没有被校正或者校正误差较大的试卷图像,其字符的提取与识别的过程会变得非常不稳定,最终影响到阅卷***的性能,因此,需要选择稳定且精确的图像校正算法。经典的图像校正技术包括Hough变换法和图像纹理法。
但是传统的Hough变换检测直线的算法速度缓慢,且会检测出大量噪声线段,降低图像校正的准确率,而纹理校正法的计算量非常大,影响整个***的运行效率,降低试卷图像校正过程的效率,并且还无法保证图像校正的准确率。
因此,如何提高试卷图像校正过程的效率是本领域技术人员关注的重点问题。
发明内容
本申请的目的是提供一种试卷图像的校正方法、试卷图像的校正***、试卷图像的校正装置以及计算机可读存储介质,通过对试卷图像数据中的标识符进行检测,进而采用标识符进行图像校正,由于是局部信息的检测,减少计算数据,提高校正的效率。
为解决上述技术问题,本申请提供一种试卷图像的校正方法,包括:
获取试卷图像数据;
对所述试卷图像数据进行标识符检测,得到标识符;
根据所述标识符对所述试卷图像数据进行校正,得到已校正试卷图像数据。
可选的,获取试卷图像数据,包括:
通过扫描设备获取所述试卷图像数据。
可选的,对所述试卷图像数据进行标识符检测,得到标识符,包括:
对所述试卷图像数据的灰度图进行EDLines检测,得到边缘信息;
采用最小二乘法从所述边缘信息中提取得到多个直线段;
对所述多个直线段进行筛选得到所述标识符。
可选的,对所述试卷图像数据进行标识符检测,得到标识符,包括:
对所述试卷图像数据中标题栏字符的顶点进行线性回归拟合,得到直线段;
将所述直线段作为所述标识符。
可选的,根据所述标识符对所述试卷图像数据进行校正,得到,包括:
计算出所述标识符的直线段与水平直线的夹角;
根据所述夹角对所述试卷图像数据进行旋转变换,得到已旋转试卷图像数据;
根据试卷模版数据对所述已旋转试卷图像数据进行平移操作,得到所述已校正试卷图像数据。
可选的,对所述试卷图像数据进行标识符检测,得到标识符,包括:
根据所述试卷图像数据的灰度值对所述试卷图像数据进行检测,得到定位符;其中,所述试卷图像数据是通过扫描设备或数码相机获取到的;
将所述定位符的中心像素作为所述标识符。
可选的,根据所述标识符对所述试卷图像数据进行校正,得到已校正试卷图像数据,包括:
当所述试卷图像数据是由扫描设备获取的时,根据所述标识符的中心像素的坐标对所述试卷图像数据进行旋转变换和分割处理,得到所述已校正试卷图像数据;
当所述试卷图像数据是由数码相机获取的时,根据所述标识符的中心像素的坐标对所述试卷图像数据进行透视变换和分割处理,得到所述已校正试卷图像数据。
本申请还提供一种试卷图像的校正***,包括:
图像数据获取模块,用于获取试卷图像数据;
标识符检测模块,用于对所述试卷图像数据进行标识符检测,得到标识符;
试卷图像校正模块,用于根据所述标识符对所述试卷图像数据进行校正,得到已校正试卷图像数据。
本申请还提供一种试卷图像的校正装置,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现如上所述的校正方法的步骤。
本申请还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如上所述的校正方法的步骤。
本申请所提供的一种试卷图像的校正方法,包括:获取试卷图像数据;对所述试卷图像数据进行标识符检测,得到标识符;根据所述标识符对所述试卷图像数据进行校正,得到已校正试卷图像数据。
通过对获取到的试卷图像数据进行标识符检测,得到标识符,进一步根据获取到的标识符对试卷图像数据进行校正,而不是对试卷图像数据整体进行检测,减少了图像检测的面积,提高试卷图像数据校正的效率。
本申请还提供一种试卷图像的校正***、试卷图像的校正装置以及计算机可读存储介质,具有以上有益效果,在此不作赘述。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本申请实施例所提供的第一种试卷图像的校正方法的流程图;
图2为本申请实施例所提供的第二种试卷图像的校正方法的流程图;
图3为本申请实施例所提供的第三种试卷图像的校正方法的流程图;
图4为本申请实施例所提供的第三种试卷图像的校正方法的检测示例图;
图5为本申请实施例所提供的第四种试卷图像的校正方法的流程图;
图6为本申请实施例所提供的一种试卷图像的校正***的结构示意图。
具体实施方式
本申请的核心是提供一种试卷图像的校正方法、试卷图像的校正***、试卷图像的校正装置以及计算机可读存储介质,通过对试卷图像数据中的标识符进行检测,进而采用标识符进行图像校正,由于是局部信息的检测,减少计算数据,提高校正的效率。
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
现有技术中,使用扫描设备或者数码相机获取试卷的数字图像时,由于主观或者客观的因素,会造成获取的试卷图像产生一些问题。例如扫描设备在获取试卷图像时,操作人员无法保证试卷图像放置端正,容易发生目标试卷的倾斜或者位移。而数码相机在获取试卷图像时,除了同样会产生上述问题外,还容易受到光线和遮挡问题的干扰,造成如试卷图像之间灰度值波动剧烈,单张图像内部光暗不均匀,产生透视畸变等问题。没有被校正或者校正误差较大的试卷图像,其字符的提取与识别的过程会变得非常不稳定,最终影响到阅卷***的性能,因此,需要选择稳定且精确的图像校正算法。经典的图像校正技术包括Hough变换法和图像纹理法。但是传统的Hough变换检测直线的算法速度缓慢,且会检测出大量噪声线段,降低图像校正的准确率,而纹理校正法的计算量非常大,影响整个***的运行效率,降低试卷图像校正过程的效率,并且还无法保证图像校正的准确率。
因此,本申请提供一种试卷图像的校正方法,通过对获取到的试卷图像数据进行标识符检测,得到标识符,进一步根据获取到的标识符对试卷图像数据进行校正,而不是对试卷图像数据整体进行检测,减少了图像检测的面积,提高试卷图像数据校正的效率。
请参考图1,图1为本申请实施例所提供的第一种试卷图像的校正方法的流程图。
本实施例中,该方法可以包括:
S101,获取试卷图像数据;
本步骤旨在通过扫描设备或数码相机对试卷进行相应的操作,得到试卷图像数据。可见,一般的获取试卷图像数据的方式可以是通过扫描设备获取,还可以是通过数据相机获取。可以想到的是,由于不同设备的差异,获取到的试卷图像数据的效果各有差异。例如,扫描设备获取到的试卷图像数据的灰度稳定,不会受到环境光线的影响;而数码相机获取到的试卷图像数据通常会受到环境光线影响导致灰度值不稳定,并且拍摄角度会发生变化。
S102,对试卷图像数据进行标识符检测,得到标识符;
在S101的基础上,本步骤旨在对试卷图像数据进行标识符检测,得到标识符。根据不同的检测方法,检测出的标识符也不相同。例如,可以检测出试卷中的直线段,或者检测出试卷图像数据中的定位符。进一步的,直线段的检测方法可以是通过检测算法直接进行检测,还可以是通过拟合的方式检测出直线段。
可见,本实施例中对标识符进行检测的方式并不唯一,可以根据实际的应用环境选择合适的检测方法,在此不做具体限定。
而现有技术中一般是对试卷图像数据整体进行计算,得到进行校正的角度信息和距离信息,但是现有技术中进行的整体计算,由于需要对试卷图像数据的所有数据进行计算,需要的时间较长,效率较低。
可见,本步骤中只对试卷图像数据的局部进行检测,得到标识符,根据标识符的位置信息再进行校正。并不是对试卷图像数据进行整体的计算,相应的减少了计算数据,缩短校正的时长,提高校正的效率。
S103,根据标识符对试卷图像数据进行校正,得到已校正试卷图像数据。
在S102的基础上,本步骤旨在根据检测出的标识符进行校正。由于标识符表示了特定的标识,该标识符相对于试卷模板的某些信息是固定的,因此,就可以通过位置关系计算出进行校正的角度信息或距离信息。
例如,当标识符为直线段时,就可以计算出该直线段与水平轴之间的夹角,得到角度信息,进而根据角度信息对试卷图像数据进行旋转变换。
综上,本实施例通过对获取到的试卷图像数据进行标识符检测,得到标识符,进一步根据获取到的标识符对试卷图像数据进行校正,而不是对试卷图像数据整体进行检测,减少了图像检测的面积,提高试卷图像数据校正的效率。
下面通过另一实施例,对本申请所提供的试卷图像的校正方法进行进一步说明。
请参考图2,图2为本申请实施例所提供的第二种试卷图像的校正方法的流程图。
本实施例中,该校正方法可以包括:
S201,通过扫描设备获取试卷图像数据;
S202,对试卷图像数据的灰度图进行EDLines检测,得到边缘信息;
S203,采用最小二乘法从边缘信息中提取得到多个直线段;
S204,对多个直线段进行筛选得到标识符;
S205,计算出标识符的直线段与水平直线的夹角;
S206,根据夹角对试卷图像数据进行旋转变换,得到已旋转试卷图像数据;
S207,根据试卷模版数据对已旋转试卷图像数据进行平移操作,得到已校正试卷图像数据。
可见,本实施例中主要是对试卷图像数据进行直线检测。而现有的直线检测方法中,一般通过霍夫(Hough)变换法检测图像中的直线特征来对图像进行校正的方法,但是该方法往往耗用大量的时间,并且会检测很多不需要的直线。
本实施例中,主要采用EDLines(Edge Drawing Lines),一种快速并且无参数的线段检测器,准确检测图像中的直线线段并给出线段的两个端点所在的位置,其检测直线的步骤如下:
步骤1,利用Edge Drawing算法从灰度图像中提取边缘;
步骤2,使用最小二乘法,从生成的像素链中提取直线段;
步骤3,根据Helmholtz定律,从已提取的直线段中摒弃虚假线段。
采用本实施例中的方法可以检测到试卷图像数据中大部分的直线信息,过滤掉长度过短以及过长的直线,保留下来的直线为带有倾斜角度的直线段,其中,任意一条的两个端点记为(x1,y1),(x2,y2),则该直线段与水平线的夹角θ的数学表示为:
将试卷图像旋转θ弧度,完成倾斜校正操作。接着根据直线的端点,将旋转之后的图像平移至模板图像对应的端点上获得校正之后的图像。
可见,本实施例采用EDlines相比现有技术中的Hough变换,即使在图像中可用直线段的较少的情况下也能较为精确的检测到需要的直线段以完成校正任务。
下面通过另一实施例,对本申请所提供的试卷图像的校正方法进行进一步说明。
请参考图3,图3为本申请实施例所提供的第三种试卷图像的校正方法的流程图。
本实施例中,该校正方法可以包括:
S301,通过扫描设备获取试卷图像数据;
S302,对试卷图像数据中标题栏字符的顶点进行线性回归拟合,得到直线段;
S303,将直线段作为标识符;
S304,计算出标识符的直线段与水平直线的夹角;
S305,根据夹角对试卷图像数据进行旋转变换,得到已旋转试卷图像数据;
S306,根据试卷模版数据对已旋转试卷图像数据进行平移操作,得到已校正试卷图像数据。
可见,本实施例中主要是通过线性拟合的方法检测出试卷图像数据中的直线段。主要是由于试卷图像的最上方一般都会存在试卷的标题,而标题一般为平行于试卷内容,因此线性回归检测出试卷标题中的直线,进而对试卷进行矫正。具体的,该方法利用线性回归来拟合标题栏字符最上端的顶点所在直线,并依据此直线来获取试卷图像的倾斜角度。
其中,检测算法的具体描述如下:
输入:原图I,标题区域长度D,分割数n,最大探测深度H,阈值T。
步骤1,将标题所在大致区域长度D按照分割数n平均分割成n个部分,每部分的长度为d;
步骤2,令k=1,重复运行以下步骤,直到k>n:
以下步骤包括:从第k个区域的所有x=0的像素向下探测,直到探测到灰度值I(x,y)≤T的第一个像素所在位置,若探测深度h超过最大允许探测深度H,则该点的探测深度h=H;从上个步骤获取的数量为d的像素点中取出探测深度h最小的像素点位置(xk,yk);令k=k+1;
步骤3,根据步骤2中获取的n个像素点,利用最小二乘法获取n个点拟合出的直线;
步骤4,计算直线与水平轴的倾角θ并输出。
请参考图4,图4为本申请实施例所提供的第三种试卷图像的校正方法的检测示例图。
以图4为例,图中的标题所在的大致区域被平均分为5份,每一份的长度为d。首先每一部分都需要从区域顶部像素开始向下探测,直到探测到灰度值小于阈值T的第一个像素或者探测到底部蓝线标注出的最大探测深度H为止,图中方向指向标题的箭头代表的是区域中任意一次探测,其指向的圆点代表其所探测到的像素点所在位置。每个区域中探测深度x=h最小的点即为该区域的顶部像素点,指向标题且止于标题顶部的箭头表示每个区域顶部像素的探测,其对应的圆点为每个区域探测到的字符顶点像素所在的位置。最后,利用最小二乘法回归出5个顶部像素点的直线,图中以倾斜的直线段表示,该直线段的斜率为r,那么θ=arctanr为图像的倾斜弧度。
其次,根据θ对图像进行旋转得到校正图像之后,还需要寻找定位点将图像进行平移变换以与试卷模板匹配。进行平移的方法与探测区域顶点的方法类似,在标题区域W×H的区域内,从左向右进行探测,直到找到第一个灰度值小于阈值T的像素。当探测至最大宽度W时,则认为该行不存在需要的像素。如果在最大宽度之前探测到像素,则保留该像素点的位置(x,y),最终获取到n个像素所在位置,则定位点(xl,yl)的位置为探测到的一系列像素的中心位置,其定义为:
根据获取定位点P1,将试卷图像数据平移至模板图像中对应上述位置的点Pt,完成校正。
可见,利用线性回归获取直线进行校正的方法可以处理不存在直线段的试卷,并且由于只对试卷图像的一小部分区域进行处理,因此相比基于检测直线的试卷校正方法,其计算量更小,效率更高。
下面通过另一实施例,对本申请所提供的试卷图像的校正方法进行进一步说明。
请参考图5,图5为本申请实施例所提供的第四种试卷图像的校正方法的流程图。
本实施例中,该校正方法可以包括:
S401,获取试卷图像数据;
S402,根据试卷图像数据的灰度值对试卷图像数据进行检测,得到定位符;其中,试卷图像数据是通过扫描设备或数码相机获取到的;
S403,将定位符的中心像素作为标识符;
S404,当试卷图像数据是由扫描设备获取的时,根据标识符的中心像素的坐标对试卷图像数据进行旋转变换和分割处理,得到已校正试卷图像数据;
S405,当试卷图像数据是由数码相机获取的时,根据标识符的中心像素的坐标对试卷图像数据进行透视变换和分割处理,得到已校正试卷图像数据。
可见,本实施例中主要是对存在定位符的试卷的图像数据进行校正的过程。首先通过定位符在试卷图像数据中的灰度值检测出定位符,并将其像素点中心作为标识符,然后根据不同的获取方式执行不同的校正操作,解决直线检测存在的缺陷。具体来说是,采用线性回归的方法对噪声非常敏感,一旦检测区域出现噪声点,校正过程会产生不可预料的问题。由于非常细小的噪声点就会导致拟合直线发生偏斜,试卷校正失败的问题,虽然采用增加划分区域,减小划分区域步长的方法能够在一定程度上缓和这个问题,但是增加了参数选择的难度,还会在噪声频率较高时完全失效。另外其不能解决透视畸变的问题,导致其只能对扫描设备获取的图像进行校正,同样对数码相机获取的试卷图像无能为力。而检测直线与检测定位点步骤相互分离,进行了两次探测,耗费了多余的时间,降低校正效率。
因此,本实施例采用一种基于定位符的试卷检测算法。在原试卷模板的基础上在试卷的左上、右上、左下、右下4个角落设计了4个定位符。当试卷倾斜时,通过检测定位符中心像素的位置可以获取4个定位点,根据这些定位点对试卷图像进行校正。
本实施例具体采用一种圆形滑动窗口检测定位符中心像素位置的检测算法,该检测算法主要是通过直径略小于定位符圆形窗口逐像素扫描可能存在定位点的区域,由于设计的定位符中像素的灰度值接近于0,因此以其中心像素为圆心,略小于定位符边长d的2r为直径的圆中像素灰度值之和一定是探测区域IR内最小的。因此,利用定位符灰度值较低的特性,检测出定位符中心像素的位置。
其中,该检测算法的具体内容如下:
设置输入为原图I、定位符所在区域宽度B、定位符边长d、圆形窗口半径r;设置输出为目标定位符中心像素的坐标(xlocation,ylocation)。
算法的步骤如下:
步骤1,在原图I四个角落边缘分割出定位符可能存在的方形检测区域IR,区域的边长为B(B>2r);
步骤2,令x=r+1,重复运行以下步骤(1)至(2),直到x+r>B:
(1)令y=r+1,重复以下步骤(a)至(b),直到y+r>B:(a)求以区域的(x;y)位置的像素为中心,r为半径的区域内所有像素的灰度值之和,求和公式如下:
(b)令y=y+1;
(2)令x=x+1;
步骤3,计算ming(x,y);
步骤4,输出ming(x,y)对应的中心像素点(x,y),该点即为定位符中心像素的坐标(xlocation,ylocation)。
基于定位符的校正算法不仅能探测扫描设备获取的图像中的定位符,还能对数码相机在复杂拍摄环境下获取的图像进行探测。数码相机获取的图像可能面临较多的校正问题,包括由于光线变化导致的整体灰度值波动,或者受到遮挡造成的部分区域灰度突变。
而在现有技术中的大部分算法在该种环境下没有办法稳定工作,而本实施例提供的基于定位符的算法则表现出了优异的鲁棒性与适应能力,该算法无需做任何修改就能够在光线严重不足的情况下检测到图像中的定位点。
本实施例提出的定位符检测算法相较基于直线检测的图像校正算法与线性回归的方法相比有较大的有益效果,包括:(1)由于直接检测了定位点并利用定位点进行分割,不需要在旋转变换之后进行额外的平移变换;(2)只要有定位符的试卷都能够被识别,不需要针对不同的试卷设计新算法;(3)具有相当强的鲁棒性,对于噪声的抗性很强;(4)算法复杂度低,不影响***运行的效率;(5)该算法同时适应扫描设备获取的试卷图像与数码相机获取的试卷图像。
最后,利用检测出的标识符,也就是利用定位符中心点对图像进行校正,根据试卷来源的不同,需要选择不同的校正方式。扫描设备获取的图像往往灰度值较为均衡,且扫描设备在采集图像时不会发生畸变;而数码相机获取的图像则不同,不仅包括上文中描述的光线与遮挡问题,还会出现因为镜头或者摆放造成的透视畸变问题。
因此,针对两种不同的图像获取来源,本实施例提供了不同的校正过程,即S404和S405。以下通过两个实施例分别对两种情况下的校正过程进行说明。
(1)扫描设备获取图像的校正过程:
扫描设备获取的图像较为统一,不存在透视畸变。基于获取的定位符,通过旋转变换与平移变换就能对扫描设备获取的答题纸图像进行处理。设左上、右上、左下、右下四个定位符中心点的坐标为(x1,y1)、(x2,y2)、(x3,y3)、(x4,y4),则试卷图像的旋转角度θ是根据定位点连线的斜率来确定的,将左上、右上两个点所在直线的斜率与左下、右下的两个定位点所在直线的斜率加权平均,可以获取更为精确的θ,θ由如下公式求得:
依据上式获取的旋转角度θ,对试卷图像进行旋转变换,并利用试卷左上、右下两个对角定位符中心点的位置(x1,y1)和(x4,y4)对试卷进行分割,保留两点之间所围成的剩余矩形区域。可以直接获取统一的被校正之后试卷图像,而不需要进行额外的平移操作,至此就完成了对扫描设备获取的试卷图像的校正。
(2)数码相机获取图像的校正过程:
数码相机获取的图像往往存在较为严重的透视畸变问题,仅仅使用旋转与平移变换无法对发生畸变的图像进行校正。因此,本实施例中使用透视变换算法对试卷图形数据进行校正。透视变换是基于三维坐标系的变换,也叫作投影变换,仿射变换是透视变换的一种特殊情况。将试卷图像数据中的直线,在透视变换之后仍然保持直线。图像中的点(x,y,1)在经过透视变换H之后变为三维坐标(X′,Y′,Z′),该过程的数学表示为:
由于使用的是二维坐标,所以需要将变换后的三维坐标(X′,Y′,Z′)转换到二维平面的点(X,Y,1),其数学表示如下:
将X′、Y′、Z′带入上式,可以得到如下方程:
此时令h33=1,可以获得如下方程:
上式中共有8个未知数,因此如果要解这个方程至少需要4对变换前后的点。模板图像中四个定位符中心点P1、P2、P3、P4的位置分别为(X1,Y1)、(X2,Y2)、(X3,Y3)、(X4,Y4),而获取图像的四个定位块中心点P′1、P′2、P′3、P′4的位置为(x1,y1)、(x2,y2)、(x3,y3)、(x4,y4),将这四对点带入,求解如下方程:
通过上式求解出透视变换矩阵H后,我们可以使用该透视变换矩阵对数码相机获取的试卷图像中的每一个像素进行透视变换,变换之后的图像会产生空洞的区域,使用最近邻差值来进行填充。最近邻插值是一种简单的插值方法,变换之后的坐标一般为浮点数,对其进行取整得到新的坐标,然后将该坐标的像素值赋给目标点。
透视变换之后的步骤与扫描设备获取的图像相同,通过变换之后左上、右下定位符中心所在的位置对获取的图像进行分割,保留四个定位符中心部分的区域为最终的校正区域,也就是得到已校正试卷图像数据,完成试卷图像数据的校正操作。
可见,本实施例中采用定位符对试卷图像数据进行校正,不仅可以对数码相机拍摄到的试卷图像数据进行校正,还可以修正试卷图像数据的透视畸变的问题,提高校正的准确率,保证校正效果。
下面对本申请实施例提供的一种试卷图像的校正***进行介绍,下文描述的一种试卷图像的校正***与上文描述的一种试卷图像的校正方法可相互对应参照。
请参考图6,图6为本申请实施例所提供的一种试卷图像的校正***的结构示意图。
本实施例中,该***可以包括:
图像数据获取模块100,用于获取试卷图像数据;
标识符检测模块200,用于对试卷图像数据进行标识符检测,得到标识符;
试卷图像校正模块300,用于根据标识符对试卷图像数据进行校正,得到已校正试卷图像数据。
本申请实施例还提供一种试卷图像的校正装置,包括:
存储器,用于存储计算机程序;
处理器,用于执行计算机程序时实现如以上实施例的校正方法的步骤。
本申请实施例还提供一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,计算机程序被处理器执行时实现如以上实施例的校正方法的步骤。
该计算机可读存储介质可以包括:U盘、移动硬盘、只读存储器(Read-OnlyMemory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
以上对本申请所提供的一种试卷图像的校正方法、试卷图像的校正***、试卷图像的校正装置以及计算机可读存储介质进行了详细介绍。本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想。应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以对本申请进行若干改进和修饰,这些改进和修饰也落入本申请权利要求的保护范围内。

Claims (10)

1.一种试卷图像的校正方法,其特征在于,包括:
获取试卷图像数据;
对所述试卷图像数据进行标识符检测,得到标识符;
根据所述标识符对所述试卷图像数据进行校正,得到已校正试卷图像数据。
2.根据权利要求1所述的校正方法,其特征在于,获取试卷图像数据,包括:
通过扫描设备获取所述试卷图像数据。
3.根据权利要求2所述的校正方法,其特征在于,对所述试卷图像数据进行标识符检测,得到标识符,包括:
对所述试卷图像数据的灰度图进行EDLines检测,得到边缘信息;
采用最小二乘法从所述边缘信息中提取得到多个直线段;
对所述多个直线段进行筛选得到所述标识符。
4.根据权利要求2所述的校正方法,其特征在于,对所述试卷图像数据进行标识符检测,得到标识符,包括:
对所述试卷图像数据中标题栏字符的顶点进行线性回归拟合,得到直线段;
将所述直线段作为所述标识符。
5.根据权利要求3或4所述的校正方法,其特征在于,根据所述标识符对所述试卷图像数据进行校正,得到,包括:
计算出所述标识符的直线段与水平直线的夹角;
根据所述夹角对所述试卷图像数据进行旋转变换,得到已旋转试卷图像数据;
根据试卷模版数据对所述已旋转试卷图像数据进行平移操作,得到所述已校正试卷图像数据。
6.根据权利要求1所述的校正方法,其特征在于,对所述试卷图像数据进行标识符检测,得到标识符,包括:
根据所述试卷图像数据的灰度值对所述试卷图像数据进行检测,得到定位符;其中,所述试卷图像数据是通过扫描设备或数码相机获取到的;
将所述定位符的中心像素作为所述标识符。
7.根据权利要求6所述的校正方法,其特征在于,根据所述标识符对所述试卷图像数据进行校正,得到已校正试卷图像数据,包括:
当所述试卷图像数据是由扫描设备获取的时,根据所述标识符的中心像素的坐标对所述试卷图像数据进行旋转变换和分割处理,得到所述已校正试卷图像数据;
当所述试卷图像数据是由数码相机获取的时,根据所述标识符的中心像素的坐标对所述试卷图像数据进行透视变换和分割处理,得到所述已校正试卷图像数据。
8.一种试卷图像的校正***,其特征在于,包括:
图像数据获取模块,用于获取试卷图像数据;
标识符检测模块,用于对所述试卷图像数据进行标识符检测,得到标识符;
试卷图像校正模块,用于根据所述标识符对所述试卷图像数据进行校正,得到已校正试卷图像数据。
9.一种试卷图像的校正装置,其特征在于,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现如权利要求1至7任一项所述的校正方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述的校正方法的步骤。
CN201910865722.6A 2019-09-12 2019-09-12 一种试卷图像的校正方法及相关装置 Pending CN110569845A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910865722.6A CN110569845A (zh) 2019-09-12 2019-09-12 一种试卷图像的校正方法及相关装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910865722.6A CN110569845A (zh) 2019-09-12 2019-09-12 一种试卷图像的校正方法及相关装置

Publications (1)

Publication Number Publication Date
CN110569845A true CN110569845A (zh) 2019-12-13

Family

ID=68779784

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910865722.6A Pending CN110569845A (zh) 2019-09-12 2019-09-12 一种试卷图像的校正方法及相关装置

Country Status (1)

Country Link
CN (1) CN110569845A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111259908A (zh) * 2020-03-24 2020-06-09 中冶赛迪重庆信息技术有限公司 基于机器视觉的钢卷号识别方法、***、设备及存储介质
CN112132851A (zh) * 2020-11-25 2020-12-25 恒银金融科技股份有限公司 一种针对金融票据图像旋转角度的计算方法
CN112215192A (zh) * 2020-10-22 2021-01-12 常州大学 一种基于机器视觉技术的快速录入试卷成绩的试卷及方法
CN112383670A (zh) * 2020-11-10 2021-02-19 武汉天有科技有限公司 一种试卷扫描自动扶正方法及装置
CN113449607A (zh) * 2021-06-07 2021-09-28 上海电机学院 一种试卷自适应分割控制方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102819743A (zh) * 2012-08-14 2012-12-12 常州大学 一种快速识别数字图像中直线段的检测方法
CN106033534A (zh) * 2015-03-18 2016-10-19 成都理想境界科技有限公司 基于直线检测的电子阅卷方法
CN106934411A (zh) * 2015-12-31 2017-07-07 成都理想境界科技有限公司 基于模板匹配的电子阅卷方法
CN107895142A (zh) * 2017-10-26 2018-04-10 湖南考神信息科技有限责任公司 一种基于视觉标记的试卷试题内容自动分割方法及***

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102819743A (zh) * 2012-08-14 2012-12-12 常州大学 一种快速识别数字图像中直线段的检测方法
CN106033534A (zh) * 2015-03-18 2016-10-19 成都理想境界科技有限公司 基于直线检测的电子阅卷方法
CN106934411A (zh) * 2015-12-31 2017-07-07 成都理想境界科技有限公司 基于模板匹配的电子阅卷方法
CN107895142A (zh) * 2017-10-26 2018-04-10 湖南考神信息科技有限责任公司 一种基于视觉标记的试卷试题内容自动分割方法及***

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
郑行家,钟宝江: "图像直线段检测算法综述与测评", 《计算机工程与应用》 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111259908A (zh) * 2020-03-24 2020-06-09 中冶赛迪重庆信息技术有限公司 基于机器视觉的钢卷号识别方法、***、设备及存储介质
CN112215192A (zh) * 2020-10-22 2021-01-12 常州大学 一种基于机器视觉技术的快速录入试卷成绩的试卷及方法
CN112215192B (zh) * 2020-10-22 2024-01-23 常州大学 一种基于机器视觉技术的快速录入试卷成绩的方法
CN112383670A (zh) * 2020-11-10 2021-02-19 武汉天有科技有限公司 一种试卷扫描自动扶正方法及装置
CN112132851A (zh) * 2020-11-25 2020-12-25 恒银金融科技股份有限公司 一种针对金融票据图像旋转角度的计算方法
CN113449607A (zh) * 2021-06-07 2021-09-28 上海电机学院 一种试卷自适应分割控制方法

Similar Documents

Publication Publication Date Title
CN110569845A (zh) 一种试卷图像的校正方法及相关装置
US11386640B2 (en) Reading system, reading method, and storage medium
US8254683B2 (en) Code image processing method
CN107169489B (zh) 倾斜图像校正的方法和装置
US20120294528A1 (en) Method of Detecting and Correcting Digital Images of Books in the Book Spine Area
JP5507134B2 (ja) 2次元コード読取方法、2次元コード認識方法及び2次元コード読取装置
JP4908440B2 (ja) 画像処理装置及び方法
US8682080B2 (en) Image processing apparatus, image processing method, image processing program, and storage medium
CN110765992B (zh) ***鉴别方法、介质、设备及装置
CN111754536B (zh) 图像标注方法、装置、电子设备及存储介质
JP3670571B2 (ja) 画像読取装置
EP2954457A1 (en) System and method for identifying similarities in different images
JPH11110562A (ja) パターン認識方法、装置および記録媒体
JP5958101B2 (ja) 画像処理方法及び画像処理装置
CN112419207A (zh) 一种图像矫正方法及装置、***
CN110197096B (zh) 二维码校正方法、装置及设备
CN114187363A (zh) 一种获取径向畸变参数值的方法、装置以及移动终端
US7961941B2 (en) Color form dropout using dynamic geometric solid thresholding
CN116110069A (zh) 基于编码标志点的答题卡识别方法、装置及其相关介质
CN110543798A (zh) 二维码的识别方法及装置
JP2017102841A (ja) 二次元コード、二次元コードの解析方法、二次元コードの解析装置及び二次元コードを解析するプログラム
JP5761353B2 (ja) 隆線方向抽出装置、隆線方向抽出方法、隆線方向抽出プログラム
CN111523331A (zh) 一种二维码识别方法及装置
CN115410191A (zh) 文本图像识别方法、装置、设备和存储介质
CN112923852B (zh) 基于动态角点定位的sd卡位姿检测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20191213