CN113673405B - 基于题目识别的习题批改方法、***及智能家教学习机 - Google Patents
基于题目识别的习题批改方法、***及智能家教学习机 Download PDFInfo
- Publication number
- CN113673405B CN113673405B CN202110933419.2A CN202110933419A CN113673405B CN 113673405 B CN113673405 B CN 113673405B CN 202110933419 A CN202110933419 A CN 202110933419A CN 113673405 B CN113673405 B CN 113673405B
- Authority
- CN
- China
- Prior art keywords
- frame
- image
- perspective
- determining
- correction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000012937 correction Methods 0.000 title claims abstract description 107
- 238000000034 method Methods 0.000 title claims abstract description 72
- 238000003702 image correction Methods 0.000 claims abstract description 42
- 238000012545 processing Methods 0.000 claims description 46
- 238000006243 chemical reaction Methods 0.000 claims description 30
- 238000001514 detection method Methods 0.000 claims description 21
- 238000000605 extraction Methods 0.000 claims description 17
- 239000000284 extract Substances 0.000 claims description 13
- 238000004590 computer program Methods 0.000 claims description 11
- 238000010276 construction Methods 0.000 claims description 7
- 238000013459 approach Methods 0.000 claims description 6
- 238000003384 imaging method Methods 0.000 description 18
- 230000000694 effects Effects 0.000 description 8
- 238000004458 analytical method Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 6
- 230000008569 process Effects 0.000 description 6
- 238000012216 screening Methods 0.000 description 6
- 230000005856 abnormality Effects 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 4
- 230000009466 transformation Effects 0.000 description 4
- 238000001914 filtration Methods 0.000 description 3
- IHQKEDIOMGYHEB-UHFFFAOYSA-M sodium dimethylarsinate Chemical class [Na+].C[As](C)([O-])=O IHQKEDIOMGYHEB-UHFFFAOYSA-M 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 230000015572 biosynthetic process Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 230000001960 triggered effect Effects 0.000 description 2
- 230000002159 abnormal effect Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000003708 edge detection Methods 0.000 description 1
- 238000009499 grossing Methods 0.000 description 1
- 210000001624 hip Anatomy 0.000 description 1
- 239000002243 precursor Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/80—Geometric correction
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/60—Analysis of geometric attributes
- G06T7/62—Analysis of geometric attributes of area, perimeter, diameter or volume
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30176—Document
Landscapes
- Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Geometry (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Image Processing (AREA)
Abstract
本申请涉及基于题目识别的习题批改方法、***及智能家教学习机,其包括确定基础图像;基于基础图像,确定作业边框;基于作业边框,确定透视边框;基于透视边框,对基础图像进行图像矫正,确定最终图像。以透视边框为模板,对基础图像进行图像矫正,使基础图像的形状变换至与透视边框的形状相对应,可以得到最终图像,最终图像的形状与作业载体实际的形状更加接近,既能反映出作业载体上原本被拍摄到的习题,并且后续的习题批改步骤中也能够更加快速、准确地进行图片文字识别,提高用户体验。
Description
技术领域
本申请涉及作业批改的领域,尤其是涉及一种基于题目识别的习题批改方法、***及智能家教学习机。
背景技术
随着计算机技术和教育信息化的不断推进,计算机技术已经逐步应用于日常的教育教学活动中,如在现有的智能终端类产品中,有许多解决批改作业或试卷中的习题批改的软件。在使用过程中,使用者可以对已经做完的习题进行拍照,并将习题的照片上传至软件;软件对照片进行图片文字识别,识别出照片中的题目和答案,然后从题库中在线搜索对应的题目和正确答案进行对比,从而判断照片中的答案是否正确来完成习题批改。
但是,使用者在对习题进行拍照时,通常是手持拍照设备对作业本或者试卷等作业载体进行拍摄,拍照设备和习题载体之间通常会发生倾斜,图像中的内容可能在存在一边大一边小的倾角问题,导致图像内容在后续的图片文字识别过程中不容易被识别出来,降低识别结果的准确率,影响用户体验。
发明内容
本申请目的一是提供一种基于题目识别的习题批改方法,具有提高图片文字识别准确率的特点。
本申请的上述发明目的一是通过以下技术方案得以实现的:
基于习题批改的图像矫正方法,可选的,包括:
确定基础图像;其中,所述基础图像的内容中包含用于记载习题的作业载体;
基于基础图像,确定作业边框;其中,所述作业边框能够反映出所述作业载体在所述基础图像中的几何形状;
基于作业边框,确定透视边框;其中,所述透视边框用于反映所述作业边框在进行透视转换后的几何形状,所述透视边框的几何形状与所述作业载体的几何形状相匹配;
基于透视边框,对基础图像进行图像矫正,确定最终图像。
通过采用上述技术方案,基础图像为基于作业载体获取的图像,基础图像的图像内容包含有作业载体本身和作业载体上的习题,通过从基础图像提取出作业边框,可以提取出作业载体在基础图像中的形状。使用者在拍摄作业载体时容易发生倾斜,由于透视问题,基础图像中的作业载体具有一边大一边小的倾角情况,因此作业边框的形状通常与作业载体实际的形状具有差异。利用作业边框轮廓的几何特征,可以生成与作业边框相对应的透视边框,透视边框能够反映作业边框在根据几何结构透视进行图形矫正后的形状,且透视边框的形状与作业载体实际的形状相对应。因此,以透视边框为模板,对基础图像进行图像矫正,使基础图像中对应的作业载体、习题和答案的成像内容进行倾角矫正,得到最终图像,最终图像的形状与作业载体实际的形状更加接近,既能反映出作业载体上原本被拍摄到的习题,并且后续的习题批改步骤中也能够更加快速、准确地进行图片文字识别,提高用户体验。
可选的,在基于作业边框,确定透视边框的具体方法中,包括:
基于作业边框,确定边框上底、边框下底以及边框高;其中,所述作业边框为四边形,所述边框上底能够反映所述作业边框中的其中一边,所述边框下底能够反映所述作业边框中所述边框上底的对边,所述边框高能够反映所述边框上底和所述边框下底之间的距离;
基于边框上底、边框下底和边框高,确定透视宽边和透视长边;其中,所述作业载体的几何形状呈矩形;所述透视宽边能够反映所述透视边框的宽;所述透视长边能够反映所述透视边框的长;
基于透视宽边和透视长边,确定透视边框。
通过采用上述技术方案,作业载体的几何形状呈矩形,矩形和四边形之间可以通过几何透视变换相互转换。作业边框的几何形状呈四边形,通过四边形的两条对边以及两条对边之间的距离,可以通过几何结构透视构造出透视宽边和透视长边,结合透视宽边和透视长边则可以得到透视边框。
可选的,所述边框上底、所述边框下底和所述边框高能够组合构成反映所述作业边框几何形状的梯形,所述边框上底的长度大于所述边框下底的长度;
在基于边框上底、边框下底和边框高,确定透视宽边和透视长边的具体方法中,包括:
基于边框上底,确定透视宽边;
基于边框上底、边框下底和边框高,确定透视长边。
通过采用上述技术方案,在基于作业载体进行拍摄时,若从作业载体的一边的斜上方进行拍摄,则作业载体在基础图像中整体呈提梯形,即作业边框整体呈梯形。其中,由于作业边框中较长的一边为作业载体在拍摄时最接近拍摄区域的一边,即作业边框的边框上底与作业载体的实际形状更加匹配,因此,通过边框上底可以直接确定透视宽边,而通过边框上底、边框下底和边框高进行几何结构透视,可以确定透视长边。利用几何图形的透视,可以直接将梯形转换为对应的矩形,更加准确方便,而选用边框上底确定为透视宽边,可以提升透视边框和作业载体之间的匹配度,使透视边框更能够体现出作业载体实际的形状。在对拍摄作业载体进行拍摄时,可固定作业载体的放置位置和作业载体的拍摄区域,使基础图像中能够稳定提取出整体呈梯形的作业边框,提升计算处理效率。
可选的,在基于基础图像,确定作业边框的具体方法中,包括:
基于基础图像,确定初始边框;
边框检测,判断初始边框的顶点数量是否大于逼近值,若是则执行边框逼近步骤,反之则执行边框确定步骤;
边框逼近,确定初始边框的模糊点对,基于模糊点对确定逼近点,将逼近点替换模糊点对,并返回边框检测步骤;其中,所述模糊点对包含所述初始边框的各个顶点中距离最近的两个顶点;
边框确定,确定初始边框为作业边框。
通过采用上述技术方案,逼近值为初始边框的最大顶点数量,当初始边框的顶点数量大于逼近值时,说明初始边框为边数大于逼近值的多边形,需要剔除掉初始边框中部分的顶点。初始边框的基本形状确定,在正常提取初始边框的情况下,初始边框的各个顶点的分布较为规律,尤其是在初始边框的预设形状呈四边形的情况下,相邻两个顶点之间形成初始边框的边;在初始边框提取异常的情况下,初始边框的顶点数量较多,其中多余的顶点与邻近的顶点之间的距离应较小。因此,可以提取初始边框的各个顶点中距离最近的两个顶点为模糊点对,通过对模糊点对进行分析,可以得到能够对模糊点对,并且更加接近初始边框的预设形状的逼近点。当初始边框提取异常时,只要初始边框在合理的处理范围内,利用不断地将模糊点对替换成逼近点,可以减少初始边框的顶点数量,使异常提取的初始边框能够朝初始边框的预设形状逼近,进而1使初始边框在后续的步骤中依然能够准确地完成几何结构透视变换,提高处理效率。
可选的,在边框逼近的具体方法中,包括:
基于初始边框的各个顶点,确定模糊点对;
基于模糊点对的位置,确定第一基准边和第二基准边;其中,所述第一基准边和所述第二基准边为所述初始边框中能够形成夹角的两条边,且所述第一基准边和所述第二基准边接近于所述模糊点对;
基于第一基准边和第二基准边之间的交点,确定逼近点;
将模糊点对从初始边框中剔除,并将逼近点作为初始边框的顶点。
通过采用上述技术方案,第一基准边和第二基准边分别为模糊点对中两个顶点最接近的边,取第一基准边和第二基准边之间的交点为逼近点,可以使逼近点的位置更加接近作业载体的实际边界,使后续得到的透视边框的形状与作业载体的实际形状更加匹配,提高后续处理结果的准确性。
可选的,在基于透视边框,对基础图像进行图像矫正,确定最终图像的具体方法中,包括:
基于透视边框,对基础图像进行图像矫正,确定初始矫正图像;
基于初始矫正图像依次进行阴影去除和轮廓增强,确定优化矫正图像;
基于初始矫正图像和优化矫正图像进行融合,确定最终图像。
通过采用上述技术方案,去除图像中的大部分阴影,可以将图像的背景整体变白,在此基础上对图像进行轮廓增强,可以获得图像中的轮廓细节,因此,优化矫正图像能够保留图像内容的基本轮廓,将初始矫正图像和优化矫正图像进行融合,以得到最终图像。最终图像即具有优化矫正图像中凸显的轮廓,又保留初始矫正图像中的内容,从而使最终图像在能够凸显细节的同时减少内容丢失,提高后续处理结果的准确性。
可选的,在基于基础图像,确定作业边框的具体方法中,还包括:
判断基础图像是否满足矫正条件,若是则基于作业边框,确定透视边框;若否则执行失败检测步骤;
其中,当基础图像无法提取出作业边框时,基础图像可以重复提取作业边框的操作,而当基础图像重复提取作业边框的操作次数达到上限时,基础图像不满足矫正条件;
失败检测步骤,判断基础图像是否已经进行过直方图处理,若否则对基础图像进行过直方图处理,并返回确定基础图像。
通过采用上述技术方案,当基础图像不满足矫正条件时,则会触发失败检测步骤,表示当前的基础图像暂时无法正常提取出作业边框。为了基础图像是否还具有提取作业边框的潜力,每个基础图像均具有进行直方图处理来对基础图像本身进行图像增强的机会。对于每一个初始图像而言,基础图像均公平地具有重复尝试提取作业边框的机会,单次的作业边框提取失败并不能直接决定放弃该基础图像,有效减少需要使用者重新拍摄基础图像的次数,提升用户体验。
本申请目的二是提供一种基于题目识别的作品批改方法,具有提高图片文字识别准确率的特点。
本申请的上述发明目的二是通过以下技术方案得以实现的:
基于题目识别的作品批改方法,包括上述一种基于题目识别的习题批改方法,作品批改方法还包括:
基于最终图像进行格式转换,确定输出图像;
将输出图像发送至批改服务器进行搜索和判断,以得到批改结果。
本申请目的三是提供一种基于题目识别的作品批改***,具有提高图片文字识别准确率的特点。
本申请的上述发明目的三是通过以下技术方案得以实现的:
对象获取子模块,用于确定基础图像;其中,所述基础图像的内容中包含用于记载习题的作业载体;
边框提取子模块,用于基于基础图像,确定作业边框;其中,所述作业边框能够反映出所述作业载体在所述基础图像中的几何形状;
模板构建子模块,用于基于作业边框,确定透视边框;其中,所述透视边框用于反映所述作业边框在进行透视转换后的几何形状,所述透视边框的几何形状与所述作业载体的几何形状相匹配;
矫正处理子模块,用于基于透视边框,对基础图像进行图像矫正,确定最终图像。
通过采用上述技术方案,基础图像为基于作业载体获取的图像,基础图像的图像内容包含有作业载体本身和作业载体上的习题,通过从基础图像提取出作业边框,可以提取出作业载体在基础图像中的形状。使用者在拍摄作业载体时容易发生倾斜,由于透视问题,基础图像中的作业载体具有一边大一边小的倾角情况,因此作业边框的形状通常与作业载体实际的形状具有差异。利用作业边框轮廓的几何特征,可以生成与作业边框相对应的透视边框,透视边框能够反映作业边框在根据几何结构透视进行图形矫正后的形状,且透视边框的形状与作业载体实际的形状相对应。因此,以透视边框为模板,对基础图像进行图像矫正,使基础图像中对应的作业载体、习题和答案的成像内容进行倾角矫正,得到最终图像,最终图像的形状与作业载体实际的形状更加接近,既能反映出作业载体上原本被拍摄到的习题,并且后续的习题批改步骤中也能够更加快速、准确地进行图片文字识别,提高用户体验。
可选的,所述对象获取子模块包括:
图像获取单元,能够基于拍摄区域进行图像拍摄,以获取基础图像;
反光镜,能够通过反射光线,来自所述拍摄区域的光线经过所述反光镜进行反射后能够进入图像获取单元。
通过采用上述技术方案,使用者在需要对作业载体进行拍摄时,可以将作业载体放置在拍摄区域中进行拍摄,通过反光镜的光线反射,作业载体在基础图像中的成像呈梯形,使作业载体所对应的作业边框更易于通过几何结构透视进行变换,在后续的习题批改步骤中能够更加快速、准确地进行图片文字识别,提高用户体验。
本申请目的四是提供一种智能家教学习机,具有提高图片文字识别准确率的特点。
本申请的上述发明目的四是通过以下技术方案得以实现的:
一种智能家教学习机,包括存储器和处理器,所述存储器上存储有能够被处理器加载并执行上述任一种图像矫正方法或方法作品批改方法的计算机程序。
本申请目的五是提供一种计算机存储介质,能够存储相应的程序,具有提高图片文字识别准确率的特点。
本申请的上述发明目的五是通过以下技术方案得以实现的:
一种计算机可读存储介质,存储有能够被处理器加载并执行上述任一种图像矫正方法或方法作品批改方法的计算机程序。
附图说明
图1是本申请实施例一的基于习题批改的图像矫正方法的流程示意图。
图2是拍摄区域处于拍摄状态时的示意图。
图3是本申请实施例一的图像矫正方法的子流程示意图。
图4是本申请实施例一的图像矫正方法中步骤S24的子流程示意图。
图5是逼近点生成并替换模糊点对的示意图。
图6是本申请实施例一的图像矫正方法中步骤S3和步骤S4的子流程示意图。
图7是作业边框生成透视边框过程的示意图。
图8是作业载体处于拍摄状态时的示意图。
图9是本申请实施例二的基于题目识别的习题批改方法的流程示意图。
图10是本申请实施例三的基于习题批改的图像矫正模块的子模块示意图。
图11是本申请实施例三的反光镜和图像获取单元的***示意图。
图12是本申请实施例四的基于题目识别的作品批改***的模块示意图。
图13是本申请实施例五的智能家教学习机的模块示意图。
图14是本申请实施例六的智能家教学习机安装有反光镜时的结构示意图。
图15是本申请实施例六的智能家教学习机和反光镜的***示意图。
图中,1、对象获取子模块;11、图像获取单元;12、反光镜;121、镜片;122、防尘透光板;123、光通道;2、边框提取子模块;3、模板构建子模块;4、矫正处理子模块;5、图像转换模块;6、作业批改模块。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本实施例中各步骤的标号仅为方便说明,不代表对各步骤执行顺序的限定,在实际应用时,可以根据需要各步骤执行顺序进行调整,或同时进行,这些调整或者替换均属于本发明的保护范围。
下面结合说明书附图1-15对本申请实施例作进一步详细描述。
实施例一:
本申请实施例提供一种基于习题批改的图像矫正方法,所述方法的主要流程描述如下。
参照图1,S1、确定基础图像。
其中,基础图像的内容中包含作业载体,作业载体可以为作业本、试卷等记录有习题的载体,作业载体不仅记录有习题,还记录有使用者在作业载体上写的对应习题的答案。在本实施例中,作业载体整体的形状呈矩形。
在步骤S1中,包括:
参照图2和图3,S11、获取初始图像。
其中,初始图像指的是基于图像获取单元11对作业载体进行拍照获取的图像。
在本实施例中,图像获取单元11指的是设置于智能移动终端的前置摄像头,智能移动终端可以为平板电脑或平板家教机,图像获取单元11配套设置有反光镜12。当使用者在作业载体上写完习题的答案后,使用者可以对作业载体进行拍摄,而在拍摄时,可以将反光镜12安装于前置摄像头的拍摄端,并将作业载体放置于智能移动终端的拍摄区域上。在反光镜12的光线反射作用下,经过拍摄区域上的作业载体的光线能够进入前置摄像头的拍摄端,从而对作业载体进行拍摄,以获取初始图像。
在本实施例中,反光镜12和前置摄像头均位于拍摄区域的一侧,由于前置摄像头并非正对作业载体进行拍摄,基于几何结构透视的原理,作业载体整体在初始图像中的成像存在倾角问题,作业载体接近反光镜12的一边在初始图像中的成像长度较长,作业载体远离反光镜12的一边在初始图像中的成像长度较短,作业载体在初始图像中的成像形状整体呈梯形,具有倾角问题的影响,对应的,作业载体上记载的习题和答案在初始图像中的成像也被倾角影响。
S12、基于初始图像进行图像处理,确定基础图像。
其中,图像处理指的是将初始图像依次进行格式转换、灰度转换和文件缩放。在本实施例中,初始图像在被获取时是基于android获取的bitmap图像,在后续的图像转换过程中,需要通过opencv对图像进行编辑,因此,需要通过格式转换,将bitmap图像转换为mat图像,并转换为灰度图。文件缩放指的是对文件大小进行缩放,使图像文件的大小在预设范围内,以提高后续的计算处理速度;在本实施例中,文件缩放会将图像文件大小调整至100K以内。初始图像依次进行格式转换、灰度转换和文件缩放后,得到基础图像。
S2、基于基础图像,确定作业边框,并判断基础图像是否满足矫正条件,若是则执行S3,若否则执行S5。
其中,作业边框指的是由基础图像中作业载体的轮廓构成的封闭图形,作业边框能够反映出作业载体在基础图像中的几何形状。由于作业载体在基础图像中的成像整体呈梯形,因此,在正常提取的情况下,作业边框整体呈四边形;在较优情况下,作业边框整体呈梯形,在这种两种情况下,基础图像均满足矫正条件。
在轻度异常提取的情况下,作业边框可能为作业边框是边数大于4的多边形,上述异常情况中的部分作业边框能够通过图像处理,从异常提取的作业边框形状转换为正常提取的作业边框形状,因此,基础图像可满足矫正条件。
在严重异常提取的情况下,作业边框可能为边数大于4的多边形,作业边框也可能是面积过小,作业边框还可能提取不出封闭的形状,此时需要从基础图像中重新提取作业边框,在多次提取作业边框依然不能正常提取时,基础图像不满足矫正条件。
参照图3,在步骤S2中,包括:
S21、判断错误参数是否等于处理阈值,若是否则执行S22,若是则执行S5。
其中,错误参数指的是基础图像重新提取作业边框的操作次数,错误参数的数值会随着对应的基础图像重新提取作业边框的操作次数而增加;处理阈值指的是***预设的操作次数阈值。在本实施例中,错误参数的初始值为0,每当当前的基础图像重新进行一次提取作业边框的操作,则错误参数的数值加1;处理阈值设置为4,相当于一张基础图像最多只能重新提取4次作业边框。
当基础图像重新提取作业边框的操作次数等于处理阈值时,说明基础图像重新提取的操作次数达到上限,则基础图像提取作业边框失败,基础图像不满足矫正条件,执行S5;当基础图像重新提取作业边框的操作次数小于处理阈值时,说明基础图像刚开始提取作业边框,或者重复提取作业边框的操作次数较少,执行S22。
S22、基于基础图像,确定初始边框。
在步骤S22的具体方法中,包括:
S221、判断基础图像是否能提取备选边框,若是则执行S222,若否则执行S28。
其中,备选边框值指的是基础图像中能够提取出来的边框。在本实施例中,备选边框的形成条件为:备选边框为多边形,备选边框的顶点数量不少于4,且备选边框的顶点数量不大于点阈值,即备选边框至少具有4个顶点,备选边框至多可以具有点阈值个顶点。若基础图像中提取的边框的顶点数量少于4,则该边框不形成备选边框;若基础图像中提取的边框的顶点数量大于点阈值,则该边框的形状与作业载体成像的形状相差较大,在后续的边框逼近中处理量较大,严重影响处理效率,不作为备选边框。
当基础图像至少能够提取出一个备选边框时,则说明基础图像具有能够提取作业载体轮廓的基础条件,执行S222;当基础图像不能提取出备选边框时,则执行S28。
优选的,为了使基础图像能够更加容易地提取出边框轮廓,在判断基础图像是否能提取备选边框之前,还需要对基础图像进行预处理。
预处理的具体方法为:
先对基础图像进行高斯滤波,以对基础图像进行降噪处理和平滑处理;
然后对基础图像进行边缘检测运算,使基础图像转换为只有轮廓的黑白图像;
最后对基础图像进行二值化处理,处理类型为THRESH_OTSU,以进一步加深基础图像中的轮廓。基础图像进行预处理后得到的图像能够更加精确地反映出图形轮廓,更容易得到备选边框,有效减少备选边框被隐藏导致基础图像需要重新提取边框的几率,提高处理效率。
S222、基于基础图像,确定备选框集合。
其中,备选框集合包含有从基础图像中提取出来的所有备选边框。
S223、确定备选框集合中面积最大的备选边框为初始边框。
其中,计算各个备选边框的面积,选取其中面积最大的备选边框作为初始边框。由于使用者在拍摄原始图像时,主要基于作业载体进行拍摄,因此基础图像中能够形成边框的最大轮廓应该为作业载体的轮廓。
S23、边框检测,判断初始边框的顶点数量是否大于逼近值,若是则执行S24,反之则执行S25。
其中,逼近值指的是初始边框的顶点数量的阈值,决定了初始边框能够具有的顶点的数量最大值,也决定了初始边框具有的边的数量最大值。在本实施例中,由于作业载体在图像中的正常成像呈梯形,因此,逼近值设定为4。
当初始边框的顶点数量等于4时,则初始边框为四边形,可以执行S24;当初始边框的顶点数量大于4时,则初始边框为边数大于4的多边形,如五边形,需要使初始边框的形状整体从五边形朝四边形进行逼近,则执行S25。
S24、边框逼近,基于初始边框确定模糊点对,基于模糊点对确定逼近点,将逼近点替换模糊点对,并返回S23。
其中,初始边框具有至少5个顶点,其中每两个顶点组成一组顶点对,比较各个顶点对中两个顶点之间的距离,可以得到距离最小的顶点对,该顶点对则为模糊点对。模糊点对中两个顶点之间的距离小于初始边框中其他任意两个顶点之间的距离。
由于作业载体实际只有4个顶点,当初始边框具有至少5个顶点时,通常的情况是作业载体一个实际的顶点并没有被识别出来,反而是位于该顶点附近的其他点被错误识别成顶点;同时,由于作业载体本身呈矩形,作业载体成像后的4个顶点之间应距离较远,因此可以确定初始边框中距离最近的两个顶点作为错误识别成的顶点,并通过这两个顶点,即通过模糊点对,来估算出一个更加逼近作业载体成像的实际形状的逼近点。
将逼近点替换模糊点对,相对于减少初始边框的顶点的数量,使初始边框逐渐向四边形逼近,同时也逐渐向作业载体成像的实际形状的逼近。
参照图4和图5,在步骤S24的具体方法中,包括:
S241、基于初始边框的各组顶点对,确定模糊点对。
其中,每一组顶点对具有两个顶点,计算各个顶点对中两个顶点之间的距离并进行比较,确定两个顶点之间的距离最小的顶点对为模糊点对。
S242、基于模糊点对的位置,确定第一基准边和第二基准边。
其中,第一基准边和第二基准边为初始边框中的边,且第一基准边和第二基准边之间能够形成夹角。第一基准边为模糊点对的其中一个顶点最接近的边,第二基准边为模糊点对的另外一个顶点最接近的边。
S243、基于第一基准边和第二基准边之间的交点,确定逼近点。
其中,逼近点为第一基准边和第二基准边之间的交点,或者第一基准边延长线和第二基准边延长线之间的交点。由于在作业载体的成像中,作业载体的各个顶点应是相邻两条边之间的交点,因此,通过确定第一基准边和第二基准边来估算逼近点的位置,可以使加入逼近点后的初始边框更加接近作业载体的成像形状。
S244、将模糊点对从初始边框中剔除,并将逼近点作为初始边框的顶点,并返回S23。
其中,将模糊点对中的两个顶点从初始边框的顶点中剔除,然后将逼近点作为新的顶点加入初始边框中,使初始边框朝四边形进行逼近。
参照图3,S25、二次检测,判断初始边框的顶点数量是否等于逼近值,若是则执行S26,反之则执行S28。
其中,在将模糊点对剔除并加入逼近点后,会对初始边框的形状和边数进行改变,若改变后的初始边框的顶点不为4,则可能在初始边框不形成四边形,需要重新选取初始边框。
S26、面积检测,判断初始边框的面积大于等于面积阈值,若是则执行S27,反之则执行S28。
参照图2和图3,其中,面积阈值指的是初始边框面积的最小值。在本实施例中,前置摄像头的广角设置固定不变,反光镜12与前置摄像头之间的位置也不变,且拍摄区域与反光镜12之间位置也不变,因此,当作业载体在拍摄区域被拍摄成像时,作业载体的实际面积与照片中成像的面积之间比例基本不变,因此,通过作业载体在照片中成像的面积,可以通过面积比例换算出作业载体的实际面积。使用者在拍摄作业载体时,作业载体成像在初始图像中的面积占比应较大,因此,作业载体的成像轮廓所具有的面积具有最小值,且当初始边框的面积过小时,代表作业载体的成像轮廓也过小,在后续的图像文字识别中难以识别出,影响计算准确性。
当初始边框的面积大于等于面积阈值时,初始边框满足面积条件的筛选要求,可以执行下一步;当初始边框的面积小于面积阈值时,初始边框不满足面积条件的筛选要求,初始边框可能没有正常将作业载体的轮廓框出,因此需要返回重新选取初始边框。
S27、边框确定,确定初始边框为作业边框。
其中,由于初始边框满足边框检测的筛选条件以及满足面积检测的筛选条件,因此可以确定本步骤中的初始边框为作业边框。
S28、基于错误参数进行累加,并返回S21。
其中,当初始边框不满足顶点数量的筛选条件,或者不满足面积阈值的筛选条件时,需要重新从当前的基础图像中提取初始边框,因此,错误参数的数值会加1,表示当前的基础图像已经提取了一次作业边框但是提取失败,在多次失败之后,则放弃从该基础图像中企图作业边框。
错误参数能够反映当前的基础图像已经重复提取作业边框的次数,当错误参数为0时,则代表当前的基础图像还没有重复提取;当错误参数为1时,则代表当前的基础图像重复提取了1次;当错误参数为2时,则代表当前的基础图像重复提取了2次;当当前的基础图像失去重新提取的机会时,错误参数会清零。
S3、基于作业边框,确定透视边框。
其中,透视边框为作业边框在进行几何结构透视转换后得到的边框,透视边框呈矩形。
在本步骤中得到的作业边框整体呈梯形,作业边框的形状轮廓与作业载体在基础图像中成像的形状轮廓相匹配;透视边框能够反映作业边框在进行几何结构透视转换后得到的形状,因此,透视边框的形状轮廓与作业载体实际的形状轮廓相匹配。
若图像获取单元11的拍摄端正对作业载体进行拍摄获取图像,则作业载体在该图像中的成像的轮廓形状应与透视边框的形状轮廓相匹配。
在步骤S3中,包括:
参照图6和图7,S31、基于作业边框,确定边框上底、边框下底以及边框高。
其中,作业边框整体呈梯形或接近于梯形,作业边框应具有下底、上底以及两条腰,其中作业边框的上底长度大于作业边框的下底长度。
在本实施例中,边框上底指的是作业边框中的上底,边框上底的两端端点分别为端点A1和端点A2;边框下底指的是作业边框中的下底,边框下底的两端端点分别为端点B1和端点B2;边框高指的是边框上底和边框下底之间的距离,即作业边框的高。
S32、基于边框上底、边框下底和边框高,确定透视宽边和透视长边。
其中,透视边框整体呈矩形,透视宽边和透视长边分别是透视边框上相邻的两条边,透视宽边和透视长边之间的夹角为直角;透视宽边对应于透视边框的宽,透视长边对应于透视边框的长。
根据几何结构透视的原理,可以将呈梯形的作业边框转换成呈矩形的透视边框,在透视转换的过程中,实际上是通过作业边框的下底、上底和高,来推算出透视边框的长和宽。
S321、基于边框上底,确定透视宽边。
参照图7和图8,其中,根据几何透视原理,在实际作业载体时,作业载体接近反光镜12的一侧在图像中成像的长度较大,作业载体远离反光镜12的一侧在图像中成像的长度较小。因此,作为作业边框中较长的底边,边框上底能够较为准确地反映出作业载体接近反光镜12一侧的实际长度,可以取边框上底的长度为透视宽边的长度,并取边框上底两端的端点为透视宽边两端的端点,即端点A1’和端点A2’。
参照图6和图7,S322、基于边框上底、边框下底和边框高,确定透视长边。
其中,根据几何透视原理,可以通过边框上底、边框下底和边框高进行透视转换,来计算得到透视长边的长度。
本步骤中透视转换的具体方法为:将边框上底的长度、边框下底的长度、边框高的长度,以及透视比例系数代入通过公式(1)中计算得到透视长边的长度。其中,透视比例系数为***预设的参数值,在本实施例中,透视比例系数为1。
(1)
其中,a为边框上底的长度, b为边框下底的长度, c为边框高的长度,y为透视长边的长度,k为比例系数。
由于透视宽边已经确定,根据透视长边计算出来的长度,以透视宽边的端点A1’或端点A2’为基础,可以得到透视长边的端点B1’。
S33、基于透视宽边和透视长边,确定透视边框。
其中,透视宽边和透视长边作为透视边框中的两条邻边已经确定,透视边框的三个顶点,顶点A1’、顶点A2’和顶点B1’的位置均已经确定,可以计算得到透视边框的最后一个顶点B2’,得到完整的透视边框。
S4、基于透视边框,对基础图像进行图像矫正,确定最终图像。
其中,透视边框能够反映作业边框在经过几何结构透视变换后得到的轮廓形状,因此,基于透视边框,对作业边框进行透视变换,使作业边框的轮廓从一个梯形转换成一个对边相等的四边形,对基础图像进行矫正,得到最终图像。
参照图6和图7,在步骤S4中,包括:
S41、基于透视边框,对基础图像进行图像矫正,确定初始矫正图像。
其中,基于透视边框的四个顶点:顶点A1’、顶点A2’、顶点B1’和顶点B2’,确定了作业边框进行透视准换后的矩形边框的四个顶点,因此,基于透视边框的四个顶点,可以对基础图像中对应于作业边框的成像内容透视转换,作业载体上的习题和答案在基础图像中的成像也能进行透视转换,从而抵消图像中倾角问题对习题和答案的影响,得到初始矫正图像。
S42、基于初始矫正图像依次进行阴影去除和轮廓增强,确定优化矫正图像。
其中,阴影去除指的是通过高阈值滤波,并进行除运算,将初始矫正图像中的大部分阴影去除,使初始矫正图像的整体背景变白。轮廓增强指的是通过一个预置进行高斯滤波处理,并进行减法运算,使初始矫正图像中的轮廓细节更加丰富,得到更加深的轮廓,并且使轮廓更加连续。
S43、基于初始矫正图像和优化矫正图像进行融合,确定最终图像。
其中,初始矫正图像具有作业载体中较为完成的习题内容和答案内容,优化矫正图像具有矫正深刻的轮廓,将初始矫正图像和优化矫正图像叠加,可以结合两者的优点,得到图像的整体增强,从而得到最终图像。最终图像中的习题内容和答案内容更加清晰、连续,在后续的图像文字识别算法中能够更加快速、准确地提取出相对应的内容。
S5、失败检测,判断当前的基础图像是否已经进行过直方图处理,若是,则执行S6;若否,则清零错误参数,对基础图像进行直方图处理,并返回S12。
其中,当基础图像不满足矫正条件时,则会触发失败检测步骤,表示当前的基础图像暂时无法正常提取出作业边框。为了基础图像是否还具有提取作业边框的潜力,每个基础图像均具有进行直方图处理来对基础图像本身进行图像增强的机会,若基础图像已经进行过直方图处理,依然没有能够提取作业边框,则执行失败处理步骤。
参照图3,S6、失败处理,基于重塑点,确定作业边框,并执行S31。
其中,重塑点指的是使用者通过手动框点确定的顶点。在本实施例中,初始图像会通过智能移动终端显示给使用者,使用者可手动在初始图像中确定四个重塑点,这四个重塑点将作为作业边框的四个顶点构成作业边框,来执行后续的步骤。
本申请实施例的基于习题批改的图像矫正方法的实施原理为:基础图像为基于作业载体获取的图像,基础图像的图像内容包含有作业载体本身、作业载体上的习题和作业载体上的答案,通过从基础图像提取出作业边框,可以提取出作业载体在基础图像中的形状,在基础图像中对应于作业边框的内容也具有习题和答案。但是,使用者在拍摄作业载体时容易发生倾斜,由于透视问题,基础图像中的作业载体具有一边大一边小的倾角情况,因此作业边框的形状通常与作业载体实际的形状具有差异。利用作业边框轮廓的几何特征,可以生成与作业边框相对应的透视边框,透视边框能够反映作业边框在根据几何结构透视进行图形矫正后的形状,且透视边框的形状与作业载体实际的形状相对应。
因此,以透视边框为模板,对基础图像进行图像矫正,使基础图像中对应的作业载体、习题和答案的成像内容进行倾角矫正,得到最终图像,最终图像的形状与作业载体实际的形状更加接近,既能反映出作业载体上原本被拍摄到的习题,并且后续的习题批改步骤中也能够更加快速、准确地进行图片文字识别,提高用户体验。
在获取作业边框的过程中,会对作业边框的前身,即对初始边框进行多次筛选,通过确保作业边框的形状符合梯形,来提高后续透视转换步骤的准确性;通过对作业边框的面积最小值的限定,减少图像中***地具有重复尝试提取作业边框的机会,单次的作业边框提取失败并不能直接决定放弃该初始图像,有效减少需要使用者重新拍摄初始图像的次数,提升用户体验。
实施例二:
本申请实施例提供一种基于题目识别的习题批改方法,所述方法包括上述实施例一中的图像矫正方法的全部内容,还包括:
参照图9,S7、基于最终图像进行格式转换,确定输出图像。
其中,格式转换指的是将最终图像从mat图像转换为bitmap图像,以便android就可以将输出图像上传至批改服务器。
S8、将输出图像发送至批改服务器进行搜索和判断,以得到批改结果。
其中,将输出图像上传至批改服务器中,可以通过OCR图片文字识别出输出图像中对应的所有题目和所有答案,并检索出各个题目所对应的标准答案,通过对比各个习题对应的答案和标准答案,可以得到各个习题的判断结果,进而得到作业载体上所有习题的批改结果。
本实施例提供的习题批改方法能够达到与前述实施例一相同的技术效果,原理分析可参见前述方法步骤的相关描述,在此不再累述。
实施例三:
在一个实施例中,基于习题批改的图像矫正模块,与上述实施例一中的基于习题批改的图像矫正方法一一对应,参照图10,图像矫正模块包括对象获取子模块1、边框提取子模块2、模板构建子模块3以及矫正处理子模块4。各功能子模块详细说明如下:
对象获取子模块1,用于确定基础图像,并向边框提取子模块2发送基础图像信息。其中,基础图像的内容中包含用于记载习题的作业载体。
边框提取子模块2,用于基于基础图像,确定作业边框,并向模板构建子模块3发送作业边框信息。其中,作业边框能够反映出作业载体在基础图像中的几何形状。
模板构建子模块3,用于基于作业边框,确定透视边框,并向矫正处理子模块4发送模板构建信息。其中,透视边框用于反映作业边框在进行透视转换后的几何形状,透视边框的几何形状与作业载体的几何形状相匹配。
矫正处理子模块4,用于基于透视边框,对基础图像进行图像矫正,确定最终图像。
参照图10和图11,具体的,对象获取子模块1包括有:
图像获取单元11,采用单目摄像头,能够基于拍摄区域进行图像拍摄,以获取基础图像。
反光镜12,包括外壳,外壳内部设置有光通道123,光通道123内固定安装有用于反射光线的镜片121,光通道的开口处还安装有防尘透光板122,来自拍摄区域的光线经过镜片121进行反射后能够进入图像获取单元11。
本实施例提供的图像矫正模块,由于其各模块本身的功能及彼此之间的逻辑连接,能实现前述实施例一的各个步骤,因此能够达到与前述实施例一相同的技术效果,原理分析可参见前述方法步骤的相关描述,在此不再累述。
实施例四:
在一个实施例中,提供一种基于题目识别的作品批改***,与上述实施例二中的基于题目识别的习题批改方法一一对应,参照图12,作品批改***包括图像矫正模块、图像转换模块5以及作业批改模块6。各功能模块详细说明如下:
图像矫正模块,包括有对象获取子模块1、边框提取子模块2、模板构建子模块3和矫正处理子模块4。其中,对象获取子模块1包括有图像获取单元11和反光镜12。
图像转换模块5,用于基于最终图像进行格式转换,确定输出图像,并向作业批改模块6发送输出图像信息。
作业批改模块6,用于将输出图像发送至批改服务器进行搜索和判断,以得到批改结果。
本实施例提供的作品批改***,由于其各模块本身的功能及彼此之间的逻辑连接,能实现前述实施例二的各个步骤,因此能够达到与前述实施例二相同的技术效果,原理分析可参见前述方法步骤的相关描述,在此不再累述。
实施例五:
在一个实施例中,提供了一种智能家教学习机。参照图13,智能家教学习机包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序。处理器用于提供计算和控制能力,处理器执行计算机程序时实现以下步骤:
S11、获取初始图像。
S12、基于初始图像进行图像处理,确定基础图像。
S21、判断错误参数是否等于处理阈值,若是否则执行S22,若是则执行S5。
S221、判断基础图像是否能提取备选边框,若是则执行S222,若否则执行S28。
S222、基于基础图像,确定备选框集合。
S223、确定备选框集合中面积最大的备选边框为初始边框。
S23、边框检测,判断初始边框的顶点数量是否大于逼近值,若是则执行S24,反之则执行S25。
S241、基于初始边框的各组顶点对,确定模糊点对。
S242、基于模糊点对的位置,确定第一基准边和第二基准边。
S243、基于第一基准边和第二基准边之间的交点,确定逼近点。
S244、将模糊点对从初始边框中剔除,并将逼近点作为初始边框的顶点,并返回S23。
S25、二次检测,判断初始边框的顶点数量是否等于逼近值,若是则执行S26,反之则执行S28。
S26、面积检测,判断初始边框的面积大于等于面积阈值,若是则执行S27,反之则执行S28。
S27、边框确定,确定初始边框为作业边框。
S28、基于错误参数进行累加,并返回S21。
S31、基于作业边框,确定边框上底、边框下底以及边框高。
S32、基于边框上底、边框下底和边框高,确定透视宽边和透视长边。
S321、基于边框上底,确定透视宽边。
S322、基于边框上底、边框下底和边框高,确定透视长边。
S41、基于透视边框,对基础图像进行图像矫正,确定初始矫正图像。
S42、基于初始矫正图像依次进行阴影去除和轮廓增强,确定优化矫正图像。
S43、基于初始矫正图像和优化矫正图像进行融合,确定最终图像。
S5、失败检测,判断当前的基础图像是否已经进行过直方图处理,若是,则执行S6;若否,则清零错误参数,对基础图像进行直方图处理,并返回S12。
S6、失败处理,基于重塑点,确定作业边框,并执行S31。
S7、基于最终图像进行格式转换,确定输出图像。
S8、将输出图像发送至批改服务器进行搜索和判断,以得到批改结果。
本实施例提供的智能家教学习机,由于其存储器中的计算机程序在处理器上运行后,会实现前述实施例的各个步骤,因此能够达到与前述实施例二相同的技术效果,原理分析可参见前述方法步骤的相关描述,在此不再累述。
实施例六:
本实施例提供一种智能家教学习机,本实施例与实施例五的不同之处在于:
参照图14,智能家教学习机可以通过内置的前置摄像头来获取基础图像。智能家教学习机的操作面设置有拍摄区域。智能家教学习机还配置有反光镜12,反光镜12包括外壳,外壳内部设置有光通道123,光通道123内固定安装有用于反射光线的镜片121,光通道的开口处还安装有防尘透光板122,来自拍摄区域的光线经过镜片121进行反射后能够进入图像获取单元11。
反光镜12还安装有磁吸件,智能家教学习机固定设置有用于吸附磁吸件的磁力部,以使反光镜12能够可拆卸固定于前置摄像头的位置上。
本实施例提供的智能家教学习机,由于其存储器中的计算机程序在处理器上运行后,会实现前述实施例的各个步骤,因此能够达到与前述实施例五相同的技术效果,原理分析可参见前述方法步骤的相关描述,在此不再累述。
实施例七:
在一个实施例中,提供了一种计算机可读存储介质,其存储有能够被处理器加载并执行上述基于题目识别的习题批改方法的计算机程序,计算机程序被处理器执行时实现以下步骤:
S11、获取初始图像。
S12、基于初始图像进行图像处理,确定基础图像。
S21、判断错误参数是否等于处理阈值,若是否则执行S22,若是则执行S5。
S221、判断基础图像是否能提取备选边框,若是则执行S222,若否则执行S28。
S222、基于基础图像,确定备选框集合。
S223、确定备选框集合中面积最大的备选边框为初始边框。
S23、边框检测,判断初始边框的顶点数量是否大于逼近值,若是则执行S24,反之则执行S25。
S241、基于初始边框的各组顶点对,确定模糊点对。
S242、基于模糊点对的位置,确定第一基准边和第二基准边。
S243、基于第一基准边和第二基准边之间的交点,确定逼近点。
S244、将模糊点对从初始边框中剔除,并将逼近点作为初始边框的顶点,并返回S23。
S25、二次检测,判断初始边框的顶点数量是否等于逼近值,若是则执行S26,反之则执行S28。
S26、面积检测,判断初始边框的面积大于等于面积阈值,若是则执行S27,反之则执行S28。
S27、边框确定,确定初始边框为作业边框。
S28、基于错误参数进行累加,并返回S21。
S31、基于作业边框,确定边框上底、边框下底以及边框高。
S32、基于边框上底、边框下底和边框高,确定透视宽边和透视长边。
S321、基于边框上底,确定透视宽边。
S322、基于边框上底、边框下底和边框高,确定透视长边。
S41、基于透视边框,对基础图像进行图像矫正,确定初始矫正图像。
S42、基于初始矫正图像依次进行阴影去除和轮廓增强,确定优化矫正图像。
S43、基于初始矫正图像和优化矫正图像进行融合,确定最终图像。
S5、失败检测,判断当前的基础图像是否已经进行过直方图处理,若是,则执行S6;若否,则清零错误参数,对基础图像进行直方图处理,并返回S12。
S6、失败处理,基于重塑点,确定作业边框,并执行S31。
S7、基于最终图像进行格式转换,确定输出图像。
S8、将输出图像发送至批改服务器进行搜索和判断,以得到批改结果。
本实施例提供的可读存储介质,由于其中的计算机程序在处理器上加载并运行后,会实现前述实施例的各个步骤,因此能够达到与前述实施例二相同的技术效果,原理分析可参见前述方法步骤的相关描述,在此不再累述。
所述计算机可读存储介质例如包括:U盘、移动硬盘、只读存储器(Read-OnlyMemory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
具体实施方式的实施例均为本申请的较佳实施例,并非依此限制本申请的保护范围,故:凡依本申请的方法、原理所做的等效变化,均应涵盖于本申请的保护范围之内。
Claims (9)
1.基于习题批改的图像矫正方法,其特征在于,包括:
确定基础图像;其中,所述基础图像的内容中包含用于记载习题的作业载体;
基于基础图像,确定作业边框;其中,所述作业边框能够反映出所述作业载体在所述基础图像中的几何形状,包括:
基于基础图像,确定初始边框;
边框检测,判断初始边框的顶点数量是否大于逼近值,若是则执行边框逼近步骤,反之则执行边框确定步骤;
边框逼近,确定初始边框的模糊点对,基于模糊点对确定逼近点,将逼近点替换模糊点对,并返回边框检测步骤;其中,所述模糊点对包含所述初始边框的各个顶点中距离最近的两个顶点,包括:
基于初始边框的各个顶点,确定模糊点对;
基于模糊点对的位置,确定第一基准边和第二基准边;其中,所述第一基准边和所述第二基准边为所述初始边框中能够形成夹角的两条边,且所述第一基准边和所述第二基准边接近于所述模糊点对;
基于第一基准边和第二基准边之间的交点,确定逼近点;
将模糊点对从初始边框中剔除,并将逼近点作为初始边框的顶点;
边框确定,确定初始边框为作业边框;
基于作业边框,确定透视边框;其中,所述透视边框用于反映所述作业边框在进行透视转换后的几何形状,所述透视边框的几何形状与所述作业载体的几何形状相匹配,包括:
基于作业边框,确定边框上底、边框下底以及边框高;其中,所述作业边框为四边形,所述边框上底能够反映所述作业边框中的其中一边,所述边框下底能够反映所述作业边框中所述边框上底的对边,所述边框高能够反映所述边框上底和所述边框下底之间的距离;
基于边框上底、边框下底和边框高,确定透视宽边和透视长边;其中,所述作业载体的几何形状呈矩形;所述透视宽边能够反映所述透视边框的宽;所述透视长边能够反映所述透视边框的长;
基于透视宽边和透视长边,确定透视边框;
基于透视边框,对基础图像进行图像矫正,确定最终图像。
2.根据权利要求1所述的图像矫正方法,其特征在于:所述边框上底、所述边框下底和所述边框高能够组合构成反映所述作业边框几何形状的梯形,所述边框上底的长度大于所述边框下底的长度;
在基于边框上底、边框下底和边框高,确定透视宽边和透视长边的具体方法中,包括:
基于边框上底,确定透视宽边;
基于边框上底、边框下底和边框高,确定透视长边。
3.根据权利要求1所述的图像矫正方法,其特征在于,在基于透视边框,对基础图像进行图像矫正,确定最终图像的具体方法中,包括:
基于透视边框,对基础图像进行图像矫正,确定初始矫正图像;
基于初始矫正图像依次进行阴影去除和轮廓增强,确定优化矫正图像;
基于初始矫正图像和优化矫正图像进行融合,确定最终图像。
4.根据权利要求1所述的图像矫正方法,其特征在于,在基于基础图像,确定作业边框的具体方法中,还包括:
判断基础图像是否满足矫正条件,若是则基于作业边框,确定透视边框;若否则执行失败检测步骤;
其中,当基础图像无法提取出作业边框时,基础图像可以重复提取作业边框的操作,而当基础图像重复提取作业边框的操作次数达到上限时,基础图像不满足矫正条件;
失败检测步骤,判断基础图像是否已经进行过直方图处理,若否则对基础图像进行过直方图处理,并返回确定基础图像。
5.基于题目识别的作品批改方法,其特征在于,包含如权利要求1-3任意一项所述的图像矫正方法,还包括:
基于最终图像进行格式转换,确定输出图像;
将输出图像发送至批改服务器进行搜索和判断,以得到批改结果。
6.基于习题批改的图像矫正模块,其特征在于,用于实现如权利要求1所述的基于习题批改的图像矫正方法,所述图像矫正模块包括:
对象获取子模块(1),用于确定基础图像;其中,所述基础图像的内容中包含用于记载习题的作业载体;
边框提取子模块(2),用于基于基础图像,确定作业边框;其中,所述作业边框能够反映出所述作业载体在所述基础图像中的几何形状;
模板构建子模块(3),用于基于作业边框,确定透视边框;其中,所述透视边框用于反映所述作业边框在进行透视转换后的几何形状,所述透视边框的几何形状与所述作业载体的几何形状相匹配;
矫正处理子模块(4),用于基于透视边框,对基础图像进行图像矫正,确定最终图像。
7.根据权利要求6所述的图像矫正模块,其特征在于,所述对象获取子模块包括:
图像获取单元(11),能够基于拍摄区域进行图像拍摄,以获取基础图像;
反光镜(12),能够通过反射光线,来自所述拍摄区域的光线经过所述反光镜(12)进行反射后能够进入图像获取单元(11)。
8.智能家教学习机,其特征在于,包括存储器和处理器,所述存储器上存储有能够被处理器加载并执行如权利要求1至5中任一种方法的计算机程序。
9.计算机可读存储介质,其特征在于,存储有能够被处理器加载并执行如权利要求1至5中任一种方法的计算机程序。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110933419.2A CN113673405B (zh) | 2021-08-14 | 2021-08-14 | 基于题目识别的习题批改方法、***及智能家教学习机 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110933419.2A CN113673405B (zh) | 2021-08-14 | 2021-08-14 | 基于题目识别的习题批改方法、***及智能家教学习机 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113673405A CN113673405A (zh) | 2021-11-19 |
CN113673405B true CN113673405B (zh) | 2024-03-29 |
Family
ID=78542854
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110933419.2A Active CN113673405B (zh) | 2021-08-14 | 2021-08-14 | 基于题目识别的习题批改方法、***及智能家教学习机 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113673405B (zh) |
Citations (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA2184865A1 (en) * | 1995-09-06 | 1997-03-07 | Mirco Carraro | Structure for rimless spectacles of the type fashioned from wire |
JP2007268281A (ja) * | 2006-03-08 | 2007-10-18 | Yasuyoshi Morosawa | 重ね貼り合わせの額縁 |
CN101147174A (zh) * | 2004-10-15 | 2008-03-19 | 微软公司 | 用于管理图像数据的传送和/或存储的***和方法 |
CN102165469A (zh) * | 2008-08-08 | 2011-08-24 | 实耐宝公司 | 具有自动校准以及图像校正功能的基于图像的库存控制*** |
CN103745104A (zh) * | 2013-12-31 | 2014-04-23 | 广东工业大学 | 一种基于增强现实技术的评卷方法 |
DE102013005462A1 (de) * | 2013-03-28 | 2014-10-02 | Ernst-Markus Baumgärtner | Zargenstützgestell, Bausatz für einen Türrahmen mit einem solchen Zargenstützgestell, Türrahmen mit einem solchen Zargenstützgestell und Verfahren zur Schaffung eines Türrahmens |
CN104889959A (zh) * | 2008-08-08 | 2015-09-09 | 实耐宝公司 | 基于图像的库存控制***和方法 |
CN109327668A (zh) * | 2018-10-29 | 2019-02-12 | 维沃移动通信有限公司 | 一种视频处理方法和装置 |
CN109559282A (zh) * | 2017-09-25 | 2019-04-02 | 德克萨斯仪器股份有限公司 | 用于通用几何校正引擎的高效处理的方法和*** |
CN109741273A (zh) * | 2018-12-26 | 2019-05-10 | 江苏优胜信息技术有限公司 | 一种手机拍照低质图像的自动处理与评分方法 |
CN110110714A (zh) * | 2019-04-28 | 2019-08-09 | 重庆学析优科技有限公司 | 一种纸质作业的线上自动批改方法及*** |
CN110555813A (zh) * | 2019-08-27 | 2019-12-10 | 成都数之联科技有限公司 | 一种无人机遥感影像的快速几何校正方法及*** |
CN110866871A (zh) * | 2019-11-15 | 2020-03-06 | 深圳市华云中盛科技股份有限公司 | 文本图像矫正方法、装置、计算机设备及存储介质 |
CN111950557A (zh) * | 2020-08-21 | 2020-11-17 | 珠海奔图电子有限公司 | 错题处理方法、图像形成装置及电子设备 |
CN112434544A (zh) * | 2020-12-09 | 2021-03-02 | 广东烟草阳江市有限责任公司 | 一种条烟编码检测识别方法及装置 |
CN112528740A (zh) * | 2020-11-06 | 2021-03-19 | 广东电网有限责任公司中山供电局 | 一种压板状态识别方法 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7249843B2 (en) * | 2004-05-14 | 2007-07-31 | Isl Technologies, Llc | Adjustable tensioning system for rimless eyewear |
US9172139B2 (en) * | 2009-12-03 | 2015-10-27 | Apple Inc. | Bezel gap antennas |
US8378508B2 (en) * | 2010-03-05 | 2013-02-19 | Authentec, Inc. | Integrally molded die and bezel structure for fingerprint sensors and the like |
-
2021
- 2021-08-14 CN CN202110933419.2A patent/CN113673405B/zh active Active
Patent Citations (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA2184865A1 (en) * | 1995-09-06 | 1997-03-07 | Mirco Carraro | Structure for rimless spectacles of the type fashioned from wire |
CN101147174A (zh) * | 2004-10-15 | 2008-03-19 | 微软公司 | 用于管理图像数据的传送和/或存储的***和方法 |
JP2007268281A (ja) * | 2006-03-08 | 2007-10-18 | Yasuyoshi Morosawa | 重ね貼り合わせの額縁 |
CN102165469A (zh) * | 2008-08-08 | 2011-08-24 | 实耐宝公司 | 具有自动校准以及图像校正功能的基于图像的库存控制*** |
CN104889959A (zh) * | 2008-08-08 | 2015-09-09 | 实耐宝公司 | 基于图像的库存控制***和方法 |
DE102013005462A1 (de) * | 2013-03-28 | 2014-10-02 | Ernst-Markus Baumgärtner | Zargenstützgestell, Bausatz für einen Türrahmen mit einem solchen Zargenstützgestell, Türrahmen mit einem solchen Zargenstützgestell und Verfahren zur Schaffung eines Türrahmens |
CN103745104A (zh) * | 2013-12-31 | 2014-04-23 | 广东工业大学 | 一种基于增强现实技术的评卷方法 |
CN109559282A (zh) * | 2017-09-25 | 2019-04-02 | 德克萨斯仪器股份有限公司 | 用于通用几何校正引擎的高效处理的方法和*** |
CN109327668A (zh) * | 2018-10-29 | 2019-02-12 | 维沃移动通信有限公司 | 一种视频处理方法和装置 |
CN109741273A (zh) * | 2018-12-26 | 2019-05-10 | 江苏优胜信息技术有限公司 | 一种手机拍照低质图像的自动处理与评分方法 |
CN110110714A (zh) * | 2019-04-28 | 2019-08-09 | 重庆学析优科技有限公司 | 一种纸质作业的线上自动批改方法及*** |
CN110555813A (zh) * | 2019-08-27 | 2019-12-10 | 成都数之联科技有限公司 | 一种无人机遥感影像的快速几何校正方法及*** |
CN110866871A (zh) * | 2019-11-15 | 2020-03-06 | 深圳市华云中盛科技股份有限公司 | 文本图像矫正方法、装置、计算机设备及存储介质 |
CN111950557A (zh) * | 2020-08-21 | 2020-11-17 | 珠海奔图电子有限公司 | 错题处理方法、图像形成装置及电子设备 |
CN112528740A (zh) * | 2020-11-06 | 2021-03-19 | 广东电网有限责任公司中山供电局 | 一种压板状态识别方法 |
CN112434544A (zh) * | 2020-12-09 | 2021-03-02 | 广东烟草阳江市有限责任公司 | 一种条烟编码检测识别方法及装置 |
Non-Patent Citations (2)
Title |
---|
一种基于火柴棒模型的图像水平倾斜矫正算法;吴震宇等;《扬州大学学报(自然科学版)》;20091115;66-69 * |
视觉文档图像识别预处理;田大增;《博士学位论文信息科技辑》;1-126 * |
Also Published As
Publication number | Publication date |
---|---|
CN113673405A (zh) | 2021-11-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110248096B (zh) | 对焦方法和装置、电子设备、计算机可读存储介质 | |
RU2601185C2 (ru) | Способ, система и компьютерный носитель данных для детектирования лица | |
CN103679636B (zh) | 基于点、线双重特征的快速图像拼接方法 | |
US7035461B2 (en) | Method for detecting objects in digital images | |
JP2835274B2 (ja) | 画像認識装置 | |
JP4234381B2 (ja) | 顔の特徴を位置確認するための方法及びコンピュータープログラム製品 | |
JP5064413B2 (ja) | 鼻筋マスクを使用した眼鏡の自動検出方法および装置 | |
US8577099B2 (en) | Method, apparatus, and program for detecting facial characteristic points | |
US20080193020A1 (en) | Method for Facial Features Detection | |
US20060017825A1 (en) | Method and apparatus for effecting automatic red eye reduction | |
CN110191287B (zh) | 对焦方法和装置、电子设备、计算机可读存储介质 | |
CN109146832B (zh) | 一种视频图像的拼接方法、装置、终端设备及存储介质 | |
CN108573184B (zh) | 一种二维码定位方法、模块及计算机可读存储介质 | |
CN111626941A (zh) | 一种基于深度学习语义分割的文档矫正方法 | |
CN109064505A (zh) | 一种基于滑动窗口张量提取的深度估计方法 | |
CN110378351A (zh) | ***鉴别方法及装置 | |
CN117456371B (zh) | 一种组串热斑检测方法、装置、设备及介质 | |
Leal et al. | Smartphone camera document detection via Geodesic Object Proposals | |
CN114612418A (zh) | 一种鼠标外壳表面缺陷检测方法及装置、***、电子设备 | |
CN114445843A (zh) | 固定版式的卡证图像文字识别方法和装置 | |
CN113673405B (zh) | 基于题目识别的习题批改方法、***及智能家教学习机 | |
CN112101058A (zh) | 一种试卷条码自动识别方法及装置 | |
US20210281742A1 (en) | Document detections from video images | |
Gasparini et al. | A review of redeye detection and removal in digital images through patents | |
CN112634298B (zh) | 图像处理方法及装置、存储介质、终端 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |