CN109325401A - 基于边缘定位对题目区域进行标注、识别的方法及*** - Google Patents

基于边缘定位对题目区域进行标注、识别的方法及*** Download PDF

Info

Publication number
CN109325401A
CN109325401A CN201810877512.4A CN201810877512A CN109325401A CN 109325401 A CN109325401 A CN 109325401A CN 201810877512 A CN201810877512 A CN 201810877512A CN 109325401 A CN109325401 A CN 109325401A
Authority
CN
China
Prior art keywords
picture
edge
line
text
interception
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810877512.4A
Other languages
English (en)
Inventor
林辉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chengdu Foresight Nehology Science And Technology Ltd
Original Assignee
Chengdu Foresight Nehology Science And Technology Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chengdu Foresight Nehology Science And Technology Ltd filed Critical Chengdu Foresight Nehology Science And Technology Ltd
Priority to CN201810877512.4A priority Critical patent/CN109325401A/zh
Publication of CN109325401A publication Critical patent/CN109325401A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/12Edge-based segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/26Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
    • G06V10/267Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion by performing operations on regions, e.g. growing, shrinking or watersheds
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10004Still image; Photographic image
    • G06T2207/10008Still image; Photographic image from scanner, fax or copier
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30176Document

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Multimedia (AREA)
  • Artificial Intelligence (AREA)
  • Quality & Reliability (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种基于边缘定位对题目区域进行标注、识别的方法,识别答题完成后的文档页,并获得该文档页的图片;对文档页图片进行边缘检测,识别文档页图片的页边缘;根据检测出的页边缘截取并变换得到矩形的截取图片;识别得到截取图片上每一道题对应的题目区域。本发明还公开了一种基于边缘定位对题目区域进行标注、识别的***,包括图片获取模块、边缘检测模块、图片截取模块和区域识别模块。本发明通过对文档页的边缘检测定位、截取,并与标注后的原始文档页扫描图片匹配,识别得到每道题的题目区域;整个过程流畅、高效,保证了题目区域位置的准确,提高了识别准确性,提高审阅效率,减少误判,且自动识别,节省人力物力,节约成本。

Description

基于边缘定位对题目区域进行标注、识别的方法及***
技术领域
本发明涉及图像定位技术领域,具体涉及一种基于边缘定位对题目区域进行标注、识别的方法及***。
背景技术
随着互联网的发展,数字化已经成为人们生活中不可或缺的一部分。在追求快速、高效、准确的大背景前提下,传统方式的人工阅卷已经逐渐不能满足人们日益增长的需求。
人工阅卷方式,效率低,而且容易出现误判,纸质试卷在传输过程中也需要消耗大量的人力物力。
因此,数字化阅卷***成为了一种必然的趋势;数字化阅卷方式通过扫描仪将试卷保存成数字图像,再用计算机程序对其进行处理,可大大提升阅卷效率。但是,在传统的试卷中,根据类型分成两大类:一是有定位点试卷,这种试卷通过四个边角上的小正方形或三角形对题目进行定位,从而实现客观题识别和主观题切割;二是无定位的试卷,这个类型的试卷没有固定的定位点,因试卷而异,没有办法用传统的定位方式对其进行定位,因此需要寻找别的定位方法。
而,不论是有定位点还是没有定位点的试卷,传统的定位、识别方法,通常直接用拍照的图片进行分割、定位,其一方面不易准确的分割题目区域,易使题目区域分割不明确,特别对于学生手写的答题区域,容易漏掉,进而影响判断结果;另一方面定位、识别的效率低下,通常需要针对每一道题进行单独分割,既容易受噪声图像干扰,又使识别效率下降。
发明内容
基于此,针对上述问题,有必要提出一种能高效、准确识别文档的题目区域,提高效率,减少误判,且节约成本的基于边缘定位对题目区域进行标注、识别的方法及***。
本发明提供一种基于边缘定位对题目区域进行标注、识别的方法,其技术方案如下:
一种基于边缘定位对题目区域进行标注、识别的方法,设定题目区域包括题干区域和答题区域,多个题目区域组合形成一个文档页,包括以下步骤:
a、识别答题完成后的文档页,并获得该文档页的图片;
b、对文档页图片进行边缘检测,识别文档页图片的页边缘;
c、根据检测出的页边缘截取并变换得到矩形的截取图片;
d、识别得到截取图片上每一道题对应的题目区域。
在本技术方案中,待学生在教辅、试卷等文档页上面做完题后拍照,获得有学生手写答案的文档页图片,然后进行边缘检测,去除有噪声干扰的背景图片区;根据文档页的上下左右四个边缘,截取得到完整的文档页,然后根据未答题的原始文档页进行对比匹配,识别截取后的文档页上对应每道题目的题目区域,实现基于文档页的边缘定位,避免了高斯噪声图像的干扰,减少了审阅的成本;通过对文档边缘的定位,以及对原始文档页中题目区域的标注,进行综合判断,保证了题目区域识别的准确性,不会漏掉任意一道题的题目区域,特别的保证了学生所做题的答题区域的分割完整性,不至于漏掉,进而避免误判。
优选的,所述步骤b包括以下步骤:
b101、若需强制给出四个边缘点,则直接对文档页图片进行轮廓检测,提取出高斯噪声图像区域;
b102、利用边缘提取四边检测算法进行边缘检测,判断是否检测到边缘的四条直线,如果是,则确定四条直线的四个交点,并返回true;如果否,则进入步骤b103;
b103、利用漫水填充四边检测算法,进行四边直线强制拟合,并确定四条直线的四个交点;
b104、判断四个交点是否在文档页距边缘25%区域内,如果是,则确定四条直线的四个交点,并返回true;如果否,则该文档页内强制给定四个点,并返回true。
在本技术方案中,主要是基于在文档页上强制给定了四个定位点的情况,直接通过轮廓检测、边缘提取四边检测算法和漫水填充四边检测算法进行判断,轮廓检测提取文档页周围背景图片处的大块区域,然后利用边缘提取四边检测算法基于Canny算子进行边缘检测,去除该大块区域的高斯图像噪声,如果还未找到四条相交直线,再采用漫水填充四边检测算法进行判断,具体为色彩聚类平滑滤波、floodFill漫水填充,通过漫水后的图边缘区域强制进行四边直线的拟合,如果拟合的左右直线太靠近边缘,就认为有空白区域,这个时候利用之前提取的左右边区域进行寻找,寻找到了后,如果四条直线的四个交点不在上下左右各大概25%的区域,则直接给定四个定位点即可,进而实现对文档页进行边缘定位;使得能快速得到文档页图片的截取点,进而可快速、准确的获得去除背景图片干扰后的完整文档页图片,使后续对文档页题目区域的分割更准确、规范。
优选的,所述步骤b还包括以下步骤:
b201、若无需强制给出四个边缘点,则进行版面分析,根据文本行特征过滤掉不是文档页或文档页面积占比小的图片,并判断是否通过,如果是,则进入步骤b202;如果否,则返回false;
b202、进行轮廓检测,提取出高斯噪声图像区域;
b203、利用边缘提取四边检测算法进行边缘检测,判断是否检测到边缘的四条直线,如果是,则确定四条直线的四个交点,并返回true;如果否,则进入步骤b204;
b204、利用漫水填充四边检测算法,判断是否检测到边缘的四条直线,如果是,则确定四条直线的四个交点,并返回true;如果否,则检测失败,并返回false。
在本技术方案中,主要是基于在文档页上没有强制给定四个定位点的情况,需要先对文档页进行版面分析,包括本文行提取(自适应阈值、findContours寻找轮廓)和去除不符合文本行的方块区域,然后进行判断,如果文本行行数小于7直接返回false;如果文本行左右宽度太大,返回false;如果所有文本行区域面积和太小或者是整个外边框区域面积太小,则返回false;如果文本行的角度太大,则返回false;即如果未通过版面分析,则返回false;只有通过后,可进行轮廓检测、边缘提取四边检测算法和漫水填充四边检测算法的判断,其中采用漫水填充四边检测算法进行判断,具体为色彩聚类平滑滤波、floodFill漫水填充,通过漫水后的图边缘区域霍夫变换找到直线,由于未强制给定四个定位点,所以,当还是无法确定四条直线时,则检测失败,为保证文档页定位和识别的准确性,不能定位文档页的边缘。
优选的,所述步骤d包括以下步骤:
d101、扫描未答题的原始文档页,获取扫描图片;
d102、标注扫描图片中每道题对应的题目区域;
d103、分析扫描图片,获取扫描图片的文本行;
d104、分析扫描图片版面信息,获取扫描图片的分割线;
d105、分析截取图片,获取截取图片的文本行和分割线;
d106、匹配截取图片的文本行和扫描图片的文本行,识别得到截取图片上每一道题对应的题目区域。
在本技术方案中,在获取到截取的文档页图片的同时,为了准确识别文档页上的题目区域,需要提前先对未答题,也未截取页边缘的文档页进行标注和扫描,获取扫描图片的文本行,然后,根据标注的每个题的题目区域和文本行,分析每个题目的第一个文本行,左边文本行/页左边缘/分割线,右边文本行/页右边缘/分割线,下边文本行/页下边缘;扫描图片分析结束后,再分析截取后的文档页图片,获取截取图片的文本行,匹配截取图片的文本行和扫描图片的文本行,识别得到截取图片上每一道题对应的题目区域,每个题的答题区域为:
上边是第一个对应的学生文本行,左边是对应的学生文本行/页左边缘/分割线,右边是对应的学生文本行/页右边缘/分割线,下边是对应的学生文本行/页下边缘;
通过对比参照,保证了题目区域位置的准确,使分割的题目区域精确度高,避免切割题目区域后,漏掉题干和答案,影响审阅正确率。
优选的,所述步骤d106包括以下步骤:
d1061、针对扫描图片的每个对应栏位的文本行,确定扫描图片的开始行和结束行在截取图片中的候选,得到多组扫描图片开始行对应截取图片开始行,以及扫描图片结束行对应截取图片结束行的候选映射组;
d1062、针对每组候选映射组,执行递归映射,得到位置和形状都相适应的匹配行,并对匹配度进行打分;
d1063、根据所得到的匹配行,将整个文本行分成多个区域,对每个区域再次进行递归映射,并对匹配度进行打分;
d1064、综合打分结果,取得分最高的映射组为文本行匹配结果。
具体采用递归映射的方式进行文本行的匹配,针对扫描图片每个对应栏位(比如都是双栏,则左栏和左栏比较,右栏和右栏比较)的文本行做如下处理:
1)根据形状找到扫描图片开始行和结束行在截取图片中的候选,得到多组截取开始行->扫描开始行,截取结束行->拍照结束行的候选;
2)针对每组候选,做一个递归映射,在当前首尾映射的情况下,找到位置、形状都匹配较好的行并打分,根据这些匹配行,将整个文本行分成多个区域,每个区域再次递归映射;
3)最终用得分最高的那组映射为文本行匹配结果;
充分保证了匹配结果的有效性,使匹配程度最大化,进而提高对题目区域识别的准确性。
本发明还提供一种基于边缘定位对题目区域进行标注、识别的***,其技术方案如下:
一种基于边缘定位对题目区域进行标注、识别的***,包括图片获取模块、边缘检测模块、图片截取模块和区域识别模块,其中:
图片获取模块,用于识别答题完成后的文档页,并获得该文档页的图片;
边缘检测模块,用于对文档页图片进行边缘检测,识别文档页图片的页边缘;
图片截取模块,用于根据检测出的页边缘截取并变换得到矩形的截取图片;
区域识别模块,用于识别得到截取图片上每一道题对应的题目区域。
优选的,所述边缘检测模块包括强制点判断子模块、版面分析子模块、轮廓检测子模块、边缘提取子模块、漫水填充拟合子模块和交点位置判断子模块,其中:
强制点判断子模块,用于判断文档页上是否需要强制给定了四个点;
轮廓检测子模块,用于对文档页图片进行轮廓检测,提取出高斯噪声图像区域;
边缘提取子模块,利用边缘提取四边检测算法进行边缘检测,判断是否检测到边缘的四条直线;
漫水填充拟合子模块,利用漫水填充四边检测算法,进行四边直线强制拟合,并确定四条直线的四个交点;
交点位置判断子模块,用于判断四个交点是否在文档页距边缘25%区域内。
优选的,所述边缘检测模块还包括版面分析子模块和漫水填充判断子模块,其中:
版面分析子模块,用于进行版面分析,根据文本行特征过滤掉不是文档页或文档页面积占比小的图片,并判断是否通过;
漫水填充判断子模块,利用漫水填充四边检测算法,判断是否检测到边缘的四条直线。
优选的,所述区域识别模块包括扫描模块、标注模块、扫描图片分析模块、分割线获取模块、截取图片分析模块和文本行匹配模块,其中:
扫描模块,用于扫描未答题的原始文档页,获取扫描图片;
标注模块,用于标注扫描图片中每道题对应的题目区域;
扫描图片分析模块,用于分析扫描图片,获取扫描图片的文本行;
分割线获取模块,用于分析扫描图片版面信息,获取扫描图片的分割线;
截取图片分析模块,用于分析截取图片,获取截取图片的文本行和分割线;
文本行匹配模块,用于匹配截取图片的文本行和扫描图片的文本行,识别得到截取图片上每一道题对应的题目区域。
优选的,所述文本行匹配模块包括候选映射组确认子模块、递归映射子模块、区域递归映射子模块和匹配结果获取子模块,其中:
候选映射组确认子模块,用于针对扫描图片的每个对应栏位的文本行,确定扫描图片的开始行和结束行在截取图片中的候选,得到多组扫描图片开始行对应截取图片开始行,以及扫描图片结束行对应截取图片结束行的候选映射组;
递归映射子模块,用于针对每组候选映射组,执行递归映射,得到位置和形状都相适应的匹配行,并对匹配度进行打分;
区域递归映射子模块,用于根据所得到的匹配行,将整个文本行分成多个区域,对每个区域再次进行递归映射,并对匹配度进行打分;
匹配结果获取子模块,综合打分结果,取得分最高的映射组为文本行匹配结果。
本发明的有益效果是:
本发明通过对学生答题后的文档页的边缘检测定位、截取,得到无干扰的截取图片,然后通过标注后的原始文档页扫描图片与截取图片匹配,识别得到每道题的题目区域;整个识别过程流畅、高效,保证了题目区域位置的准确,提高了识别准确性,避免漏掉题干和答案,提高审阅效率,减少误判,且自动识别,节省人力物力,节约成本。
附图说明
图1是本发明实施例所述基于边缘定位对题目区域进行标注、识别的方法流程图;
图2是本发明实施例所述进行边缘检测的流程图;
图3是本发明实施例所述截取图片与扫描图片匹配并识别每一道题对应题目区域的流程图;
图4是本发明实施例所述基于边缘定位对题目区域进行标注、识别的***原理框图。
附图标记说明:
10-图片获取模块;20-边缘检测模块;201-强制点判断子模块;202-轮廓检测子模块;203-边缘提取子模块;204-漫水填充拟合子模块;205-交点位置判断子模块;206-版面分析子模块;207-漫水填充判断子模块;30-图片截取模块;40-区域识别模块;401-扫描模块;402-标注模块;403-扫描图片分析模块;404-分割线获取模块;405-截取图片分析模块;406-文本行匹配模块;4061-候选映射组确认子模块;4062-递归映射子模块;4063-区域递归映射子模块;4064-匹配结果获取子模块。
具体实施方式
下面结合附图对本发明的实施例进行详细说明。
实施例1
如图1-图3所示,一种基于边缘定位对题目区域进行标注、识别的方法,设定题目区域包括题干区域和答题区域,多个题目区域组合形成一个文档页,包括以下步骤:
a、识别答题完成后的文档页,并获得该文档页的图片;
b、对文档页图片进行边缘检测,识别文档页图片的页边缘;
c、根据检测出的页边缘截取并变换得到矩形的截取图片;
d、识别得到截取图片上每一道题对应的题目区域。
在本实施例中,待学生在教辅、试卷等文档页上面做完题后拍照,获得有学生手写答案的文档页图片,然后进行边缘检测,去除有噪声干扰的背景图片区;根据文档页的上下左右四个边缘,截取得到完整的文档页,然后根据未答题的原始文档页进行对比匹配,识别截取后的文档页上对应每道题目的题目区域,实现基于文档页的边缘定位,避免了高斯噪声图像的干扰,减少了审阅的成本;通过对文档边缘的定位,以及对原始文档页中题目区域的标注,进行综合判断,保证了题目区域识别的准确性,不会漏掉任意一道题的题目区域,特别的保证了学生所做题的答题区域的分割完整性,不至于漏掉,进而避免误判。
实施例2
本实施例在实施例1的基础上,如图2所示,所述步骤b包括以下步骤:
b101、若需强制给出四个边缘点,则直接对文档页图片进行轮廓检测,提取出高斯噪声图像区域;
b102、利用边缘提取四边检测算法进行边缘检测,判断是否检测到边缘的四条直线,如果是,则确定四条直线的四个交点,并返回true;如果否,则进入步骤b103;
b103、利用漫水填充四边检测算法,进行四边直线强制拟合,并确定四条直线的四个交点;
b104、判断四个交点是否在文档页距边缘25%区域内,如果是,则确定四条直线的四个交点,并返回true;如果否,则该文档页内强制给定四个点,并返回true。
在本实施例中,主要是基于在文档页上强制给定了四个定位点的情况,直接通过轮廓检测、边缘提取四边检测算法和漫水填充四边检测算法进行判断,轮廓检测提取文档页周围背景图片处的大块区域,然后利用边缘提取四边检测算法基于Canny算子进行边缘检测,去除该大块区域的高斯图像噪声,如果还未找到四条相交直线,再采用漫水填充四边检测算法进行判断,具体为色彩聚类平滑滤波、floodFill漫水填充,通过漫水后的图边缘区域强制进行四边直线的拟合,如果拟合的左右直线太靠近边缘,就认为有空白区域,这个时候利用之前提取的左右边区域进行寻找,寻找到了后,如果四条直线的四个交点不在上下左右各大概25%的区域,则直接给定四个定位点即可,进而实现对文档页进行边缘定位;使得能快速得到文档页图片的截取点,进而可快速、准确的获得去除背景图片干扰后的完整文档页图片,使后续对文档页题目区域的分割更准确、规范。
实施例3
本实施例在实施例2的基础上,如图2所示,所述步骤b还包括以下步骤:
b201、若无需强制给出四个边缘点,则进行版面分析,根据文本行特征过滤掉不是文档页或文档页面积占比小的图片,并判断是否通过,如果是,则进入步骤b202;如果否,则返回false;
b202、进行轮廓检测,提取出高斯噪声图像区域;
b203、利用边缘提取四边检测算法进行边缘检测,判断是否检测到边缘的四条直线,如果是,则确定四条直线的四个交点,并返回true;如果否,则进入步骤b204;
b204、利用漫水填充四边检测算法,判断是否检测到边缘的四条直线,如果是,则确定四条直线的四个交点,并返回true;如果否,则检测失败,并返回false。
在本实施例中,主要是基于在文档页上没有强制给定四个定位点的情况,需要先对文档页进行版面分析,包括本文行提取(自适应阈值、findContours寻找轮廓)和去除不符合文本行的方块区域,然后进行判断,如果文本行行数小于7直接返回false;如果文本行左右宽度太大,返回false;如果所有文本行区域面积和太小或者是整个外边框区域面积太小,则返回false;如果文本行的角度太大,则返回false;即如果未通过版面分析,则返回false;只有通过后,可进行轮廓检测、边缘提取四边检测算法和漫水填充四边检测算法的判断,其中采用漫水填充四边检测算法进行判断,具体为色彩聚类平滑滤波、floodFill漫水填充,通过漫水后的图边缘区域霍夫变换找到直线,由于未强制给定四个定位点,所以,当还是无法确定四条直线时,则检测失败,为保证文档页定位和识别的准确性,不能定位文档页的边缘。
实施例4
本实施例在实施例1的基础上,如图3所示,所述步骤d包括以下步骤:
d101、扫描未答题的原始文档页,获取扫描图片;
d102、标注扫描图片中每道题对应的题目区域;
d103、分析扫描图片,获取扫描图片的文本行;
d104、分析扫描图片版面信息,获取扫描图片的分割线;
d105、分析截取图片,获取截取图片的文本行和分割线;
d106、匹配截取图片的文本行和扫描图片的文本行,识别得到截取图片上每一道题对应的题目区域。
在本实施例中,在获取到截取的文档页图片的同时,为了准确识别文档页上的题目区域,需要提前先对未答题,也未截取页边缘的文档页进行标注和扫描,获取扫描图片的文本行,然后,根据标注的每个题的题目区域和文本行,分析每个题目的第一个文本行,左边文本行/页左边缘/分割线,右边文本行/页右边缘/分割线,下边文本行/页下边缘;扫描图片分析结束后,再分析截取后的文档页图片,获取截取图片的文本行,匹配截取图片的文本行和扫描图片的文本行,识别得到截取图片上每一道题对应的题目区域,每个题的答题区域为:
上边是第一个对应的学生文本行,左边是对应的学生文本行/页左边缘/分割线,右边是对应的学生文本行/页右边缘/分割线,下边是对应的学生文本行/页下边缘;
通过对比参照,保证了题目区域位置的准确,使分割的题目区域精确度高,避免切割题目区域后,漏掉题干和答案,影响审阅正确率。
实施例5
本实施例在实施例4的基础上,如图3所示,所述步骤d106包括以下步骤:
d1061、针对扫描图片的每个对应栏位的文本行,确定扫描图片的开始行和结束行在截取图片中的候选,得到多组扫描图片开始行对应截取图片开始行,以及扫描图片结束行对应截取图片结束行的候选映射组;
d1062、针对每组候选映射组,执行递归映射,得到位置和形状都相适应的匹配行,并对匹配度进行打分;
d1063、根据所得到的匹配行,将整个文本行分成多个区域,对每个区域再次进行递归映射,并对匹配度进行打分;
d1064、综合打分结果,取得分最高的映射组为文本行匹配结果。
具体采用递归映射的方式进行文本行的匹配,针对扫描图片每个对应栏位(比如都是双栏,则左栏和左栏比较,右栏和右栏比较)的文本行做如下处理:
1)根据形状找到扫描图片开始行和结束行在截取图片中的候选,得到多组截取开始行->扫描开始行,截取结束行->拍照结束行的候选;
2)针对每组候选,做一个递归映射,在当前首尾映射的情况下,找到位置、形状都匹配较好的行并打分,根据这些匹配行,将整个文本行分成多个区域,每个区域再次递归映射;
3)最终用得分最高的那组映射为文本行匹配结果;
充分保证了匹配结果的有效性,使匹配程度最大化,进而提高对题目区域识别的准确性。
实施例6
本实施例为实施例1的***,
如图4所示,一种基于边缘定位对题目区域进行标注、识别的***,包括图片获取模块10、边缘检测模块20、图片截取模块30和区域识别模块40,其中:
图片获取模块10,用于识别答题完成后的文档页,并获得该文档页的图片;
边缘检测模块20,用于对文档页图片进行边缘检测,识别文档页图片的页边缘;
图片截取模块30,用于根据检测出的页边缘截取并变换得到矩形的截取图片;
区域识别模块40,用于识别得到截取图片上每一道题对应的题目区域。
实施例7
本实施例为实施例2的***,
所述边缘检测模块20包括强制点判断子模块201、轮廓检测子模块202、边缘提取子模块203、漫水填充拟合子模块204和交点位置判断子模块205,其中:
强制点判断子模块201,用于判断文档页上是否需要强制给定了四个点;
轮廓检测子模块202,用于对文档页图片进行轮廓检测,提取出高斯噪声图像区域;
边缘提取子模块203,利用边缘提取四边检测算法进行边缘检测,判断是否检测到边缘的四条直线;
漫水填充拟合子模块204,利用漫水填充四边检测算法,进行四边直线强制拟合,并确定四条直线的四个交点;
交点位置判断子模块205,用于判断四个交点是否在文档页距边缘25%区域内。
实施例8
本实施例为实施例3的***,
所述边缘检测模块20还包括版面分析子模块206和漫水填充判断子模块207,其中:
版面分析子模块206,用于进行版面分析,根据文本行特征过滤掉不是文档页或文档页面积占比小的图片,并判断是否通过;
漫水填充判断子模块207,利用漫水填充四边检测算法,判断是否检测到边缘的四条直线。
实施例9
本实施例为实施例4的***,
所述区域识别模块40包括扫描模块401、标注模块402、扫描图片分析模块403、分割线获取模块404、截取图片分析模块405和文本行匹配模块406,其中:
扫描模块401,用于扫描未答题的原始文档页,获取扫描图片;
标注模块402,用于标注扫描图片中每道题对应的题目区域;
扫描图片分析模块403,用于分析扫描图片,获取扫描图片的文本行;
分割线获取模块404,用于分析扫描图片版面信息,获取扫描图片的分割线;
截取图片分析模块405,用于分析截取图片,获取截取图片的文本行和分割线;
文本行匹配模块406,用于匹配截取图片的文本行和扫描图片的文本行,识别得到截取图片上每一道题对应的题目区域。
实施例10
本实施例为实施例5的***,
所述文本行匹配模块406包括候选映射组确认子模块4061、递归映射子模块4062、区域递归映射子模块4063和匹配结果获取子模块4064,其中:
候选映射组确认子模块4061,用于针对扫描图片的每个对应栏位的文本行,确定扫描图片的开始行和结束行在截取图片中的候选,得到多组扫描图片开始行对应截取图片开始行,以及扫描图片结束行对应截取图片结束行的候选映射组;
递归映射子模块4062,用于针对每组候选映射组,执行递归映射,得到位置和形状都相适应的匹配行,并对匹配度进行打分;
区域递归映射子模块4063,用于根据所得到的匹配行,将整个文本行分成多个区域,对每个区域再次进行递归映射,并对匹配度进行打分;
匹配结果获取子模块4064,综合打分结果,取得分最高的映射组为文本行匹配结果。
以上所述实施例仅表达了本发明的具体实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。

Claims (10)

1.一种基于边缘定位对题目区域进行标注、识别的方法,其特征在于,设定题目区域包括题干区域和答题区域,多个题目区域组合形成一个文档页,包括以下步骤:
a、识别答题完成后的文档页,并获得该文档页的图片;
b、对文档页图片进行边缘检测,识别文档页图片的页边缘;
c、根据检测出的页边缘截取并变换得到矩形的截取图片;
d、识别得到截取图片上每一道题对应的题目区域。
2.根据权利要求1所述的基于边缘定位对题目区域进行标注、识别的方法,其特征在于,所述步骤b包括以下步骤:
b101、若需强制给出四个边缘点,则直接对文档页图片进行轮廓检测,提取出高斯噪声图像区域;
b102、利用边缘提取四边检测算法进行边缘检测,判断是否检测到边缘的四条直线,如果是,则确定四条直线的四个交点,并返回true;如果否,则进入步骤b103;
b103、利用漫水填充四边检测算法,进行四边直线强制拟合,并确定四条直线的四个交点;
b104、判断四个交点是否在文档页距边缘25%区域内,如果是,则确定四条直线的四个交点,并返回true;如果否,则该文档页内强制给定四个点,并返回true。
3.根据权利要求1或2所述的基于边缘定位对题目区域进行标注、识别的方法,其特征在于,所述步骤b还包括以下步骤:
b201、若无需强制给出四个边缘点,则进行版面分析,根据文本行特征过滤掉不是文档页或文档页面积占比小的图片,并判断是否通过,如果是,则进入步骤b202;如果否,则返回false;
b202、进行轮廓检测,提取出高斯噪声图像区域;
b203、利用边缘提取四边检测算法进行边缘检测,判断是否检测到边缘的四条直线,如果是,则确定四条直线的四个交点,并返回true;如果否,则进入步骤b204;
b204、利用漫水填充四边检测算法,判断是否检测到边缘的四条直线,如果是,则确定四条直线的四个交点,并返回true;如果否,则检测失败,并返回false。
4.根据权利要求1所述的基于边缘定位对题目区域进行标注、识别的方法,其特征在于,所述步骤d包括以下步骤:
d101、扫描未答题的原始文档页,获取扫描图片;
d102、标注扫描图片中每道题对应的题目区域;
d103、分析扫描图片,获取扫描图片的文本行;
d104、分析扫描图片版面信息,获取扫描图片的分割线;
d105、分析截取图片,获取截取图片的文本行和分割线;
d106、匹配截取图片的文本行和扫描图片的文本行,识别得到截取图片上每一道题对应的题目区域。
5.根据权利要求4所述的基于边缘定位对题目区域进行标注、识别的方法,其特征在于,所述步骤d106包括以下步骤:
d1061、针对扫描图片的每个对应栏位的文本行,确定扫描图片的开始行和结束行在截取图片中的候选,得到多组扫描图片开始行对应截取图片开始行,以及扫描图片结束行对应截取图片结束行的候选映射组;
d1062、针对每组候选映射组,执行递归映射,得到位置和形状都相适应的匹配行,并对匹配度进行打分;
d1063、根据所得到的匹配行,将整个文本行分成多个区域,对每个区域再次进行递归映射,并对匹配度进行打分;
d1064、综合打分结果,取得分最高的映射组为文本行匹配结果。
6.一种基于边缘定位对题目区域进行标注、识别的***,其特征在于,包括图片获取模块、边缘检测模块、图片截取模块和区域识别模块,其中:
图片获取模块,用于识别答题完成后的文档页,并获得该文档页的图片;
边缘检测模块,用于对文档页图片进行边缘检测,识别文档页图片的页边缘;
图片截取模块,用于根据检测出的页边缘截取并变换得到矩形的截取图片;
区域识别模块,用于识别得到截取图片上每一道题对应的题目区域。
7.根据权利要求6所述的基于边缘定位对题目区域进行标注、识别的***,其特征在于,所述边缘检测模块包括强制点判断子模块、版面分析子模块、轮廓检测子模块、边缘提取子模块、漫水填充拟合子模块和交点位置判断子模块,其中:
强制点判断子模块,用于判断文档页上是否需要强制给定了四个点;
轮廓检测子模块,用于对文档页图片进行轮廓检测,提取出高斯噪声图像区域;
边缘提取子模块,利用边缘提取四边检测算法进行边缘检测,判断是否检测到边缘的四条直线;
漫水填充拟合子模块,利用漫水填充四边检测算法,进行四边直线强制拟合,并确定四条直线的四个交点;
交点位置判断子模块,用于判断四个交点是否在文档页距边缘25%区域内。
8.根据权利要求6或7所述的基于边缘定位对题目区域进行标注、识别的***,其特征在于,所述边缘检测模块还包括版面分析子模块和漫水填充判断子模块,其中:
版面分析子模块,用于进行版面分析,根据文本行特征过滤掉不是文档页或文档页面积占比小的图片,并判断是否通过;
漫水填充判断子模块,利用漫水填充四边检测算法,判断是否检测到边缘的四条直线。
9.根据权利要求6所述的基于边缘定位对题目区域进行标注、识别的***,其特征在于,所述区域识别模块包括扫描模块、标注模块、扫描图片分析模块、分割线获取模块、截取图片分析模块和文本行匹配模块,其中:
扫描模块,用于扫描未答题的原始文档页,获取扫描图片;
标注模块,用于标注扫描图片中每道题对应的题目区域;
扫描图片分析模块,用于分析扫描图片,获取扫描图片的文本行;
分割线获取模块,用于分析扫描图片版面信息,获取扫描图片的分割线;
截取图片分析模块,用于分析截取图片,获取截取图片的文本行和分割线;
文本行匹配模块,用于匹配截取图片的文本行和扫描图片的文本行,识别得到截取图片上每一道题对应的题目区域。
10.根据权利要求9所述的基于边缘定位对题目区域进行标注、识别的***,其特征在于,所述文本行匹配模块包括候选映射组确认子模块、递归映射子模块、区域递归映射子模块和匹配结果获取子模块,其中:
候选映射组确认子模块,用于针对扫描图片的每个对应栏位的文本行,确定扫描图片的开始行和结束行在截取图片中的候选,得到多组扫描图片开始行对应截取图片开始行,以及扫描图片结束行对应截取图片结束行的候选映射组;
递归映射子模块,用于针对每组候选映射组,执行递归映射,得到位置和形状都相适应的匹配行,并对匹配度进行打分;
区域递归映射子模块,用于根据所得到的匹配行,将整个文本行分成多个区域,对每个区域再次进行递归映射,并对匹配度进行打分;
匹配结果获取子模块,综合打分结果,取得分最高的映射组为文本行匹配结果。
CN201810877512.4A 2018-08-03 2018-08-03 基于边缘定位对题目区域进行标注、识别的方法及*** Pending CN109325401A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810877512.4A CN109325401A (zh) 2018-08-03 2018-08-03 基于边缘定位对题目区域进行标注、识别的方法及***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810877512.4A CN109325401A (zh) 2018-08-03 2018-08-03 基于边缘定位对题目区域进行标注、识别的方法及***

Publications (1)

Publication Number Publication Date
CN109325401A true CN109325401A (zh) 2019-02-12

Family

ID=65263620

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810877512.4A Pending CN109325401A (zh) 2018-08-03 2018-08-03 基于边缘定位对题目区域进行标注、识别的方法及***

Country Status (1)

Country Link
CN (1) CN109325401A (zh)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110263736A (zh) * 2019-06-24 2019-09-20 广州偕作信息科技有限公司 一种构件识别方法、装置、存储介质及***
CN110826488A (zh) * 2019-11-06 2020-02-21 苏州思必驰信息科技有限公司 一种针对电子文档的图像识别方法、装置及存储设备
CN110956173A (zh) * 2020-02-18 2020-04-03 江西软云科技股份有限公司 题目内容识别方法、装置、可读存储介质及计算机设备
CN111767830A (zh) * 2020-06-28 2020-10-13 广东小天才科技有限公司 一种扫描页的框题方法、***、终端设备以及存储介质
CN111931730A (zh) * 2020-09-24 2020-11-13 北京易真学思教育科技有限公司 判题方法、装置、电子设备及存储介质
CN111950397A (zh) * 2020-07-27 2020-11-17 腾讯科技(深圳)有限公司 图像的文本标注方法、装置、设备及存储介质
CN112036395A (zh) * 2020-09-04 2020-12-04 联想(北京)有限公司 基于目标检测的文本分类识别方法及装置
CN112132142A (zh) * 2020-09-27 2020-12-25 平安医疗健康管理股份有限公司 文本区域确定方法、装置、计算机设备及存储介质
CN112163529A (zh) * 2020-09-30 2021-01-01 珠海读书郎网络教育有限公司 一种试卷统分的***及方法
CN113689446A (zh) * 2021-09-10 2021-11-23 上海布鲁可积木科技有限公司 图像定位及分割的方法及***

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101866415A (zh) * 2009-08-24 2010-10-20 深圳市海云天科技股份有限公司 一种计算机阅卷***的答题卡识别装置及方法
CN104143094A (zh) * 2014-07-08 2014-11-12 北京彩云动力教育科技有限公司 一种无需答题卡的试卷自动阅卷处理方法及***
CN104268603A (zh) * 2014-09-16 2015-01-07 科大讯飞股份有限公司 用于文字性客观题的智能阅卷方法及***
CN105590101A (zh) * 2015-12-28 2016-05-18 杭州淳敏软件技术有限公司 基于手机拍照的手写答题卡自动处理和阅卷方法及***

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101866415A (zh) * 2009-08-24 2010-10-20 深圳市海云天科技股份有限公司 一种计算机阅卷***的答题卡识别装置及方法
CN104143094A (zh) * 2014-07-08 2014-11-12 北京彩云动力教育科技有限公司 一种无需答题卡的试卷自动阅卷处理方法及***
CN104268603A (zh) * 2014-09-16 2015-01-07 科大讯飞股份有限公司 用于文字性客观题的智能阅卷方法及***
CN105590101A (zh) * 2015-12-28 2016-05-18 杭州淳敏软件技术有限公司 基于手机拍照的手写答题卡自动处理和阅卷方法及***

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110263736A (zh) * 2019-06-24 2019-09-20 广州偕作信息科技有限公司 一种构件识别方法、装置、存储介质及***
CN110826488A (zh) * 2019-11-06 2020-02-21 苏州思必驰信息科技有限公司 一种针对电子文档的图像识别方法、装置及存储设备
CN110826488B (zh) * 2019-11-06 2022-07-26 思必驰科技股份有限公司 一种针对电子文档的图像识别方法、装置及存储设备
CN110956173A (zh) * 2020-02-18 2020-04-03 江西软云科技股份有限公司 题目内容识别方法、装置、可读存储介质及计算机设备
CN111767830A (zh) * 2020-06-28 2020-10-13 广东小天才科技有限公司 一种扫描页的框题方法、***、终端设备以及存储介质
CN111950397B (zh) * 2020-07-27 2021-10-22 腾讯科技(深圳)有限公司 图像的文本标注方法、装置、设备及存储介质
CN111950397A (zh) * 2020-07-27 2020-11-17 腾讯科技(深圳)有限公司 图像的文本标注方法、装置、设备及存储介质
CN112036395A (zh) * 2020-09-04 2020-12-04 联想(北京)有限公司 基于目标检测的文本分类识别方法及装置
CN112036395B (zh) * 2020-09-04 2024-05-28 联想(北京)有限公司 基于目标检测的文本分类识别方法及装置
CN111931730A (zh) * 2020-09-24 2020-11-13 北京易真学思教育科技有限公司 判题方法、装置、电子设备及存储介质
CN112132142A (zh) * 2020-09-27 2020-12-25 平安医疗健康管理股份有限公司 文本区域确定方法、装置、计算机设备及存储介质
CN112163529A (zh) * 2020-09-30 2021-01-01 珠海读书郎网络教育有限公司 一种试卷统分的***及方法
CN113689446A (zh) * 2021-09-10 2021-11-23 上海布鲁可积木科技有限公司 图像定位及分割的方法及***
CN113689446B (zh) * 2021-09-10 2024-01-26 上海布鲁可积木科技有限公司 图像定位及分割的方法及***

Similar Documents

Publication Publication Date Title
CN109325401A (zh) 基于边缘定位对题目区域进行标注、识别的方法及***
JP5837205B2 (ja) 画像領域を使用するテキスト検出
CN102360419B (zh) 计算机扫描阅读管理方法及***
CN101770575B (zh) 名片图像倾斜角度的测量方法和装置
CN103543277B (zh) 一种基于灰度分析与种类识别的血型结果识别算法
WO2016127545A1 (zh) 一种字符切割识别方法
WO2018086233A1 (zh) 一种字符分割方法和装置、及元件检测方法和装置
CN104809452A (zh) 一种指纹识别方法
CN102426649A (zh) 一种简单的高准确率的钢印数字自动识别方法
CN102169542A (zh) 文字识别中粘连字符的切分方法和装置
Kennard et al. Separating lines of text in free-form handwritten historical documents
CN112149667A (zh) 一种基于深度学习的指针式仪表的自动读数的方法
CN103530600A (zh) 复杂光照下的车牌识别方法及***
CN109726717A (zh) 一种车辆综合信息检测***
CN105760901A (zh) 一种多语种倾斜文档图像的自动语言判别方法
CN101576958A (zh) 一种基于形状特征的带边框矩形***图形提取方法
CN104463138A (zh) 基于视觉结构属性的文本定位方法及***
CN103729645A (zh) 基于单目摄像头的二代证区域定位与提取的方法及装置
CN110751619A (zh) 一种绝缘子缺陷检测方法
CN102750531A (zh) 用于票据文档定位格的手写体标记符号检测方法
CN104182728A (zh) 一种基于模式识别的车标自动定位与识别方法
CN103699876A (zh) 一种基于线阵ccd图像识别车号的方法及装置
CN106033534A (zh) 基于直线检测的电子阅卷方法
CN104680142A (zh) 一种基于特征点集分割和rst不变特征的四联指比对方法
JPH09311905A (ja) 行検出方法および文字認識装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
AD01 Patent right deemed abandoned
AD01 Patent right deemed abandoned

Effective date of abandoning: 20220429