CN109948625A - 文本图像清晰度评估方法及***、计算机可读存储介质 - Google Patents

文本图像清晰度评估方法及***、计算机可读存储介质 Download PDF

Info

Publication number
CN109948625A
CN109948625A CN201910172031.8A CN201910172031A CN109948625A CN 109948625 A CN109948625 A CN 109948625A CN 201910172031 A CN201910172031 A CN 201910172031A CN 109948625 A CN109948625 A CN 109948625A
Authority
CN
China
Prior art keywords
assessed
text image
prospect
image
text
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910172031.8A
Other languages
English (en)
Inventor
刘源
徐亮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
SAIC Motor Corp Ltd
Original Assignee
SAIC Motor Corp Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by SAIC Motor Corp Ltd filed Critical SAIC Motor Corp Ltd
Priority to CN201910172031.8A priority Critical patent/CN109948625A/zh
Publication of CN109948625A publication Critical patent/CN109948625A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Image Processing (AREA)
  • Image Analysis (AREA)

Abstract

一种文本图像清晰度评估方法及***、计算机可读存储介质,所述文本图像清晰度评估方法,包括:对所述待评估文本图像的前景进行边缘化处理及轮廓提取;对经过边缘化处理及轮廓提取后的待评估文本图像的前景进行像素点分割、过滤,定位所述待评估文本图像的前景的***轮廓位置;根据所述***轮廓位置,对所述待评估文本图像进行仿射变换,得到重整后的待评估文本图像;将所述重整后的待评估文本图像输入至预设的清晰度评估模型;输出所述待评估文本图像的清晰度评估结果。采用上述方案,能够提高文本图像清晰度识别的准确性。

Description

文本图像清晰度评估方法及***、计算机可读存储介质
技术领域
本发明实施例涉及图像处理技术领域,尤其涉及一种文本图像清晰度评估方法及***、计算机可读存储介质。
背景技术
图像清晰度评测是图像处理、模式识别等现代人工智能领域中非常重要的一类前处理环节。在诸如拍照摄影、文本识别、证件识别、图像分类、工业生产、安防等应用中,图像清晰度关系到后续处理任务的成像质量、识别精度以及执行效率。
由于图像的来源和类型多种多样,其所呈现出来的噪点特征也不一而同。目前,对图像清晰度评估的准确性较低。
发明内容
本发明实施例解决的技术问题是如何提高文本图像清晰度识别的准确性。
为解决上述技术问题,本发明实施例提供一种文本图像清晰度评估方法,包括:对所述待评估文本图像的前景进行边缘化处理及轮廓提取;对经过边缘化处理及轮廓提取后的待评估文本图像的前景进行像素点分割、过滤,定位所述待评估文本图像的前景的***轮廓位置;根据所述***轮廓位置,对所述待评估文本图像进行仿射变换,得到重整后的待评估文本图像;将所述重整后的待评估文本图像输入至预设的清晰度评估模型;输出所述待评估文本图像的清晰度评估结果。
可选的,所述待评估文本图像的前景进行边缘化处理及轮廓提取,包括:对所述待评估文本图像的前景进行处理,得到所述待评估文本图像的边缘特征图;对所述待评估文本图像的边缘特征图进行多边形轮廓提取,得到由多个多边形组成的多边形集合。
可选的,所述对所经过边缘化处理及轮廓提取后的待评估文本图像的前景进行像素点分割、过滤,定位所述待评估文本图像的前景的***轮廓位置,包括:对于各多边形的轮廓,根据相邻两边的顶点坐标计算相邻两边的内夹角;当相邻两边的内夹角小于预设阈值时,过滤所述内夹角,并迭代计算得到新边以取代所述内夹角的相邻边;从过滤后的多边形集合中选择所有的四边形,将面积最大的四边形对应的轮廓作为所述待评估文本图像的前景的***轮廓位置。
可选的,在提取所述待评估文本图像的前景之前,还包括:对所述待评估文本图像进行预处理,得到均衡化图像;将所述均衡化图像从三原色通道转成LAB通道;基于转成LAB通道之后的均衡化图像,提取各像素点的特征,其中:所述各像素点的特征包括以下至少一种:各像素点的特征向量组成的特征向量集合及各特征向量对应的度量。
可选的,所述对所述待评估文本图像进行预处理,得到均衡化图像,包括:对所述待评估文本图像进行直方图均值化处理;将所述待评估文本图像的三原色通道转变成HSV通道;取V通道进行亮度处理,得到新的V通道;将所述新的V通道与H通道及S通道合并,转回三原色通道,得到所述均衡化的图像。
可选的,所述提取待评估文本图像的前景,包括:基于所述特征向量集合,进行无监督的二分类聚类分离出所述待评估文本图像的前景及背景,并提取出所述待评估文本图像的前景。
可选的,在分离出所述待评估文本图像的前景及背景之后,还包括:执行对所述待评估文本图像的前景高亮及背景暗化操作。
可选的,采用如下方式训练得到所述清晰度评估模型:获取样本文本图像;对所述样本文本图像进行图像处理,提取所述样本文本图像的前景;对所述样本文本图像的前景进行边缘化处理及轮廓提取;对经过边缘化处理及轮廓提取后的所述样本文本图像的前景进行像素点分割、过滤,定位所述样本文本图像的前景的***轮廓位置;根据所述***轮廓位置,对所述样本文本图像进行仿射变换,得到重整后的样本文本图像;对于重整后的样本文本图像中的像素点的每个颜色通道对应的像素值,获取所述样本文本图像的锐度信息指标,其中:所述样本文本图像的锐度信息指标包括以下至少一种:点锐度信息指标、高阶空域评价指标、频谱信息评价指标及统计分布评价指标;对所得到的各像素点的锐度信息指标分别进行逻辑回归训练,获取训练得到的最小值时对应的训练参数,得到所述清晰度评估模型。
本发明实施例还提供一种文本图像清晰度评估***,包括:前景提取单元,适于提取待评估文本图像的前景;第一处理单元,适于对所述待评估文本图像的前景进行边缘化处理及轮廓提取;过滤定位单元,适于对经过边缘化处理及轮廓提取后的待评估文本图像的前景进行像素点分割、过滤,定位所述待评估文本图像的前景的***轮廓位置;仿射变换单元,适于根据所述***轮廓位置,对所述待评估文本图像进行仿射变换,得到重整后的待评估文本图像;输入单元,适于将所述重整后的待评估文本图像输入至预设的清晰度评估模型;输出单元,适于输出所述待评估文本图像的清晰度评估结果。
可选的,所述第一处理单元,适于对所述待评估文本图像的前景进行处理,得到所述待评估文本图像的边缘特征图,对所述待评估文本图像的边缘特征图进行多边形轮廓提取,得到由多个多边形组成的多边形集合。
可选的,所述过滤定位单元,适于对于各多边形的轮廓,根据相邻两边的顶点坐标计算相邻两边的内夹角;当相邻两边的内夹角小于预设阈值时,过滤所述内夹角,并迭代计算得到新边以取代所述内夹角的相邻边;从过滤后的多边形集合中选择所有的四边形,将面积最大的四边形对应的轮廓作为所述待评估文本图像的前景的***轮廓位置。
可选的,所述文本图像清晰度评估***还包括:第二处理单元及特征提取单元,其中:所述第二处理单元,适于在所述前景提取单元提取所述待评估文本图像的前景之前,对所述待评估文本图像进行预处理,得到均衡化图像;所述特征提取单元,适于将所述均衡化图像从三原色通道转成LAB通道;基于转成LAB通道之后的均衡化图像,提取各像素点的特征,其中:所述各像素点的特征包括以下至少一种:各像素点的特征向量组成的特征向量集合及各特征向量对应的度量。
可选的,所述第二处理单元,适于对所述待评估文本图像进行直方图均值化处理;将所述待评估文本图像的三原色通道转变成HSV通道;取V通道进行亮度处理,得到新的V通道;将所述新的V通道与H通道及S通道合并,转回三原色通道,得到所述均衡化的图像。
可选的,所述前景提取单元,适于基于所述特征向量集合,进行无监督的二分类聚类分离出所述待评估文本图像的前景及背景,并提取出所述待评估文本图像的前景。
可选的,所述前景提取单元,还适于在分离出所述待评估文本图像的前景及背景之后,执行对所述待评估文本图像的前景高亮及背景暗化操作。
可选的,所述文本图像清晰度评估***还包括:模型训练单元,适于采用如下方式训练得到所述清晰度评估模型:获取样本文本图像;对所述样本文本图像进行图像处理,提取所述样本文本图像的前景;对所述样本文本图像的前景进行边缘化处理及轮廓提取;对经过边缘化处理及轮廓提取后的所述样本文本图像的前景进行像素点分割、过滤,定位所述样本文本图像的前景的***轮廓位置;根据所述***轮廓位置,对所述样本文本图像进行仿射变换,得到重整后的样本文本图像;对于重整后的样本文本图像中的像素点的每个颜色通道对应的像素值,采用如下至少一种方式获取所述样本文本图像的锐度信息指标:点锐度信息指标、高阶空域评价指标、频谱信息评价指标及统计分布评价指标;对所得到的各像素点的锐度信息指标分别进行逻辑回归训练,获取训练得到的最小值时对应的训练参数,得到所述清晰度评估模型。
本发明实施例还提供一种文本图像清晰度评估***,包括存储器和处理器,所述存储器上存储有可在所述处理器上运行的计算机指令,所述处理器运行所述计算机指令时执行上述任一种文本图像清晰度评估方法的步骤。
本发明实施例还提供一种计算机可读存储介质,计算机可读存储介质为非易失性存储介质或非瞬态存储介质,其上存储有计算机指令,所述计算机指令运行时执行上述任一种文本图像清晰度评估方法的步骤。
与现有技术相比,本发明实施例的技术方案具有以下有益效果:
提取待评估文本图像的前景之后,对待评估图像的前景进行边缘化处理及轮廓提取,此后采用像素点分割、过滤来定位待评估文本图像的前景的***轮廓位置。采用像素点分割、过滤的方式来定位待评估文本图像的前景的***轮廓位置,可以提高前景提取的准确性以及前景的轮廓定位的准确性,从而可以提高后续文本图像清晰度评估的精确性。
进一步,在训练清晰度评估模型时,考虑多种锐度信息指标,从而可以进一步提高文本图像清晰度评估的精确度。
附图说明
图1是本发明实施例中一种文本图像清晰度评估方法的流程图;
图2是本发明实施例中一种清晰度评估模型的训练流程图;
图3是本发明实施例中一种另一种文本图像清晰度评估方法的流程图;
图4是本发明实施例中一种文本图像清晰度评估***的结构示意图。
具体实施方式
如上所述,由于图像的来源和类型多种多样,其所呈现出来的噪点特征也不一而同。目前,对图像清晰度评估的准确性较低。
本发明实施例中,提取待评估文本图像的前景之后,对待评估图像的前景进行边缘化处理及轮廓提取,此后采用像素点分割、过滤来定位待评估文本图像的前景的***轮廓位置。采用像素点分割、过滤的方式来定位待评估文本图像的前景的***轮廓位置,可以提高前景提取的准确性以及前景的轮廓定位的准确性,从而可以提高后续文本图像清晰度评估的精确性。
为使本发明实施例的上述目的、特征和有益效果能够更为明显易懂,下面结合附图对本发明的具体实施例做详细的说明。
参照图1,给出了本发明实施例中一种文本图像清晰度评估方法的流程图,可以包括以下步骤。
步骤11,提取待评估文本图像的前景。
在具体实施中,待评估文本图像可以通过各类移动终端采集得到。例如,通过高拍仪、智能手机或嵌入终端等具有图像采集功能的设备拍摄得到。在获取到所述待评估文本图像后,可以提取所述待评估文本图像的前景。
在具体实施中,在提取所述待评估文本图像的前景之前,还可以对所述待评估文本图像进行预处理,得到均衡化图像。
具体而言,对所述待评估文本图像进行直方图均值化处理,将所述待评估文本图像的三原色通道转变成HSV通道,其中,H表示色调,S表示饱和度,V表示明度。取V通道进行亮度处理,得到新的V通道。将所述新的V通道与H通道及S通道合并,转回三原色通道RGB,得到所述均衡化图像。
在得到均衡化图像之后,还可以将所述均衡化图像从三原色通道转成LAB通道。L表示亮度,A及B表示相关的颜色,A表示从洋红色至绿色的范围,B表示从黄色至蓝色的范围。基于转成LAB通道之后的均衡化图像,提取各像素点的特征。所述各像素点的特征包括以下至少一种:各像素点的特征向量组成的特征向量集合及各特征向量对应的度量。
每个像素点值可以看成是一组五维向量,包括三维通道和两维位置信息。基于各像素点的特征向量集合,进行无监督二分类聚类。在无监督的二分类聚类时,可以采用k-means聚类、高斯混合聚类、层式聚类、基于密度的DBSCAN聚类等中的任一种。在本发明一实施例中,采用收敛速度以及聚类效果均较好的层式聚类。在无监督的二分类聚类时,采用各特征向量对应的度量。
在具体实施中,基于无监督二分类聚类,可以分离出待评估文本图像的前景及背景,并提取出待评估文本图像的前景。
在发明一实施例中,为了明显的区分出待评估文本图像的前景及背景,对前景及背景进行标记,基于标记后的前景及背景,对前景执行高亮操作,对背景执行暗化操作。
步骤12,对所述待评估文本图像的前景进行边缘化处理及轮廓提取。
在本发明一实施中,可以采用Sobel算子对待评估文本图像的前景进行处理,得到图像边缘特征图。在图像边缘特征图上进行多边形轮廓提取,得到由多个多边形组成的多边形集合。
步骤13,对经过边缘化处理及轮廓提取后的待评估文本图像的前景进行像素点分割、过滤,定位所述待评估文本图像的前景的***轮廓位置。
在具体实施中,对经过边缘化处理及轮廓提取后的待评估文本图像的前景进行像素点分割、过滤,通过对组成待评估文本图像前景的***轮廓位置的像素点进行筛选调整、删除,过滤定位得到所述待评估文本图像的前景的***轮廓位置。
在本发明一实施例中,根据相邻两边的顶点坐标计算相邻两边的内夹角,判断所计算得到的相邻两边的内夹角与设定的预设阈值之间的关系,当相邻两边的内夹角小于预设阈值时,过滤所述内夹角,并迭代计算得到新边以取代所述内夹角的相邻边。
步骤14,根据所述***轮廓位置,对所述待评估文本图像进行仿射变换,得到重整后的待评估文本图像。
在具体实施中,根据所述***轮廓位置,对待评估文本图像进行仿射变换。所述仿射变换可以包括平移、缩放、旋转或错切中的至少一种,通过对所述待评估文本图像进行仿射变换可以得到重整后的待评估文本图像。
例如,待评估文本图像为***图像,通过仿射变换可以纠正***图像采集中的***图像变形,得到与***实际形状相匹配的矩形形状的***图像。
步骤15,将所述重整后的待评估文本图像输入至预设的清晰度评估模型。
在具体实施中,可以将重整后的待评估文本图像输入预设的清晰度评估模型中,进行待评估文本图像的清晰度评估。
在本发明一实施例中,为了提高对待评估文本图像清晰度评估的准确性,所述清晰度评估模型在训练时,可以综合考虑多种锐度信息指标,如考虑点锐度信息指标、高阶空域评价指标、频谱信息评价指标及统计分布评价指标中的至少一种。
步骤16,输出所述待评估文本图像的清晰度评估结果。
由上述方案可知,提取待评估文本图像的前景之后,对待评估图像的前景进行边缘化处理及轮廓提取,此后采用像素点分割、过滤来定位待评估文本图像的前景的***轮廓位置。采用像素点分割、过滤的方式来定位待评估文本图像的前景的***轮廓位置,可以提高前景提取的准确性以及前景的轮廓定位的准确性,从而可以提高后续文本图像清晰度评估的精确性。
在本发明一实施例中,为了提高对待评估文本图像清晰度评估的准确性,可以采用如下方式训练得到所述清晰度评估模型。参照图2,给出的本发明实施例中一种清晰度评估模型的训练流程图,所述清晰度评估模型的训练过程可以包括以下步骤。
步骤21,获取样本文本图像。
在具体实施中,待评估文本图像可以为***图像。
步骤22,对所述样本文本图像进行图像处理,提取所述样本文本图像的前景。
在具体实施中,所述样本文本图像的数量可以为多张。原则上,所采用的样本文本图像的数目越大,训练得到的清晰度评估模型的精度也越高,但是样本文本图像的数目较多时,运算速度可以较慢,因此,在实际应用中,可以根据实际需要确定所采用的样本文本图像的数目。
从样本文本图像中选取一定比例的样本文本图像进行清晰度标注。例如,可以采用人工识别方式对清晰度进行标注,根据每张样本文本图像的清晰度情况标记为清晰或者模糊。将样本文本图像中的另一部分,进行图像处理,分离前景及背景,并提取所述样本文本图像的前景。
步骤23,对所述样本文本图像的前景进行边缘化处理及轮廓提取。
步骤24,对经过边缘化处理及轮廓提取后的所述样本文本图像的前景进行像素点分割、过滤,定位所述样本文本图像的前景的***轮廓位置。
步骤25,根据所述***轮廓位置,对所述样本文本图像进行仿射变换,得到重整后的样本文本图像。
步骤26,获取所述样本文本图像的锐度信息指标。
对于重整后的样本文本图像中的像素点的每个颜色通道对应的像素值,获取所述样本文本图像的锐度信息指标。所述样本文本图像的锐度信息指标包括以下至少一种:点锐度信息指标、高阶空域评价指标、频谱信息评价指标及统计分布评价指标。
步骤27,对所得到的各像素点的锐度信息指标分别进行逻辑回归训练,获取训练得到的最小值时对应的训练参数,得到所述清晰度评估模型。
在具体实施中,对所得到的各像素点的锐度信息指标分别进行逻辑回归训练。例如,锐度信息指标包括:点锐度信息指标、高阶空域评价指标、频谱信息评价指标及统计分布评价指标。分别对点锐度信息指标、高阶空域评价指标、频谱信息评价指标及统计分布评价指标进行逻辑回归训练。将目标函数最小值时对应的训练参数,作为清晰度评估模型的参数,从而得到所述清晰度评估模型。此外,可以采用已进行清晰度标注的样本文本图像对所述清晰度评估模型的精度进行验证。
为了便于本领域技术人员更好的理解和实现本发明,下面结合图3给出的本发明实施例中另一种文本图像清晰度评估方法的流程图进行举例说明。
步骤31,对待评估文本图像进行预处理,得到均衡化图像。
在具体实施中,在获取到待评估文本图像之后,可以对所述待评估文本图像进行预处理。具体而言,对待评估文本图像进行直方图均值化处理。将待评估文本图像的三原色通道变成HSV通道,其中H通道指颜色通道,S通道指饱和度通道,V通道指亮度通道。采用公式(1),取V通道进行处理。
fuv=F(fuv)*(fmax-fmin)+fmin; (1)
其中,F(i)为待评估文本图像中像素点(u,v)的原始概率分布函数;fmax为待评估文本图像中像素点的V通道的最大值;fmin为待评估文本图像中像素点的V通道的最小值;fuv为新的V通道的概率分布函数。在具体实施中,将新的V通道与H通道及S通道合并后转换回三原色通道,得到均衡化的图像。
步骤32,特征提取。
在具体实施中,将均衡化的图像从三原色转成LAB通道。对转换后的图像,其所有像素点值看成是一组五维向量集合,五维向量集合中包括三维通道和两维位置信息。在五维向量集合上进行无监督的二分类聚类。常用的无监督聚类方法有k-means聚类、高斯混合聚类、层式聚类、基于密度的DBSCAN聚类等。在本发明一实施例中,采用收敛速度和聚类效果均较好的层式聚类方法。基于所采用的层式无监督聚类,采用如下度量方式:记五维向量点为x,y和对应的分量xi,yi(i=1,…,5),记集合为A,则相应的度量d采用如下公式(2)及公式(3)得到。
其中,μi为权重;min为取最小值。
在具体实施中,由于特征向量中前三维像素点值信息与后两维空间信息的物理量纲不一致,因此可以引入上述权重μi。μi的具体取值可以通过有监督训练得到,也可以预先设定。在本发明一实施例中,μ1=μ2=μ3=0.65,μ4=μ5=0.35。可以理解的是,在实际应用中,μ1、μ2、μ3、μ4及μ5也可以存在其他取值。
步骤33,提取所述待评估文本图像的前景。
基于公式(2)及公式(3)所确定的度量函数进行无监督的层式聚类,采用公式(4)分离出文本图像的前景及背景,将前景的标签记为L1,将背景的标签记为L2。基于前景及背景的标签待评估文本图像进行前景高亮操作,背景暗化操作。
其中,χ为指示函数。
步骤34,多边形过滤定位所述待评估文本图像前景的***轮廓位置。
分离出待评估文本图像的前景及背景之后,可以提取出待评估文本图像的前景。采用Sobel算子等方法对分离过前景及背景的待评估文本图像进行边缘化处理和轮廓提取,得到由多个多边形组成的多边形轮廓集合。对所得到的多边形轮廓集合,根据相邻边的顶点坐标计算相邻边的内夹角。将计算得到的内夹角与设定的阈值进行比较,在本发明一实施例中,设定的阈值为120°,将小于120°的内夹角过滤,以过滤过于平直的内夹角。在实际应用中,所设定的阈值也可以为其他取值。
两相邻边l1和l2分别为(x1,out,y1,out,xin,yin),和(x2,out,y2,out,xin,yin),其中,(xin,yin)时内夹角顶点坐标,(x1,out,y1,out),及(x2,out,y2,out)为外接点坐标。
可以采用如下公式(5)、(6)、(7)、(8)对所述待评估文本图像前景的***轮廓位置进行定位。
(y2,out-y1,out)(x-xnew)+(x1,out-x2,out)(y-ynew)=0 (8)
公式(8)为当l1和l2的内夹角小于阈值时,将l1和l2合并得到的新的直线的l的方程式。
将直线l代替原多边形中的l1和l2,并更新其他相交点。
在过滤后的多边形集合中,选择所有的四边形,并且根据四边形的面积大小进行排序,将面积最大的四边形作为待评估文本图像的***轮廓位置。
步骤35,待评估文本图像前景仿射变换。
根据所确定的待评估文本图像的***轮廓位置,采用如下公式(9)对待评估文本图像均衡化后的图像进行仿射变换,得到重整后的待评估文本图像。
其中,是仿射变换的矩阵系数;b1、b2是位移量;m11、m12、m21、m22是旋转、缩放或者错切等仿射变换的系数。
步骤36,输入至清晰度评价指标模型。
在具体实施中,可以对待评估文本图像进行尺寸归一化处理,以使得所述待评估文本图像的尺寸符合预设的尺寸要求。对于像素点(u,v)的每个颜色通道对应的像素值,可以采用以下四种不同的方法获取图像的锐度信息。
(1)点锐度信息指标可以采用公式(10)计算。
(2)高阶空域评价指标,采用拉普拉斯算子8点差分指标具体可以采用公式(11)计算得到。
(3)频谱信息评价指标可以采用如下公式(12)计算得到。
其中,||·||表示复数模长;M及N指频率空间范围;u及v时频率值;x及y为空间位置值,f为像素值。
(4)统计分布评价指标本发明一实施例中采用信息熵,可以采用如下公式计算得到。
其中,pi是各像素点值的统计分布估计,是点(u,v)的像素点值所对应的分布信息。
将以上四种不同的指标簇作为四组特征指标参数族输入非线性耦合判别式函数(14)。
其中,为上述四种评价指标值,作为逻辑回归模型的输入特征;为每个子逻辑回归模型的待训练量模型参数。
采用逻辑回归模型,将分别输入至相对应的子逻辑回归模型中,可以得到四个子逻辑回归的模型,每个子逻辑回归的模型对应的目标函数(15)。
基于上述四个逻辑回归模型可以得到耦合模型,以及耦合模型对应的目标函数(16)。
对耦合函数进行训练,得到清晰度评估模型对应的目标函数(17)。
其中,yL是训练集中每个函数是否模糊的人工标签,是待训练参数。采用目标函数(17)进行逻辑回归训练,将L取值最小时,对应的参数作为清晰度评估模型中的参数取值,得到清晰度评估模型。
为了增强清晰度评估模型的稳定性和准确率,对耦合模型中的待估参数引入软约束条件(18):
ωk>0,λk∈[0,1]; (18)
采用上述耦合函数,通过非线性的耦合方式,可以抑制识别信心不足的模型,激活识别信心强的模型。在具体实施中,可以根据模型输出的识别结果确定模型的识别信心强弱,例如,对于同一张文本图像其中一个模型输出的清晰度评估结果为0.5,另三个模型输出的清晰度评估结果为0.7、0.7及0.6,则认为评估结果为0.5的模型的识别信心不足。可以根据各模型输出的结果,调整各模型所占的权重,以增强清晰度识别模型以及文本图像清晰度评估的稳定性和准确率。
在具体实施中,可以采用已进行清晰度标注的样本文本图像对清晰度评估模型进行检验,检验清晰度评估模型的准确性。
步骤37,输出清晰度评估结果。
由上可知,基于无监督聚类的超像素分割方法,采用本文图像的前景的多边形轮廓的提取定位和过滤方法,避免了传统前景提取方法需要人工干预、文本边缘分割毛糙造成后续仿射变换畸变等弊端,可以提高在嘈杂环境下待评估文本图像的前景及背景分离准确性。此外,采用一种耦合多种方法(点锐度判别、高阶空域差分法、傅立叶频域分析法)的监督式图像清晰度判定模型,可以解决传统方法使用固定阈值所带来的模型泛化能力不足的问题,并且基于所采用的非线性多模型耦合方式,可以提高训练模型的判别灵敏度。
为便于本领域技术人员更好的理解和实现本发明实施例,本发明实施例还提供一种文本图像清晰度评估***,下面结合图4进行说明。
所述文本图像清晰度评估***40可以包括前景提取单元41、第一处理单元42、过滤定位单元43、仿射变换单元44、输入单元45及输出单元46。
所述前景提取单元41,适于提取待评估文本图像的前景;
所述第一处理单元42,适于对所述待评估文本图像的前景进行边缘化处理及轮廓提取;
所述过滤定位单元43,适于对经过边缘化处理及轮廓提取后的待评估文本图像的前景进行像素点分割、过滤,定位所述待评估文本图像的前景的***轮廓位置;
所述仿射变换单元44,适于根据所述***轮廓位置,对所述待评估文本图像进行仿射变换,得到重整后的待评估文本图像;
所述输入单元45,适于将所述重整后的待评估文本图像输入至预设的清晰度评估模型;
所述输出单元46,适于输出所述待评估文本图像的清晰度评估结果。
在具体实施中,所述第一处理单元42,可以对所述待评估文本图像的前景进行处理,得到所述待评估文本图像的边缘特征图,对所述待评估文本图像的边缘特征图进行多边形轮廓提取,得到由多个多边形组成的多边形集合。
在具体实施中,所述过滤定位单元43,可以适于对于各多边形的轮廓,根据相邻两边的顶点坐标计算相邻两边的内夹角;当相邻两边的内夹角小于预设阈值时,过滤所述内夹角,并迭代计算得到新边以取代所述内夹角的相邻边;从过滤后的多边形集合中选择所有的四边形,将面积最大的四边形对应的轮廓作为所述待评估文本图像的前景的***轮廓位置。
在具体实施中,所述文本图像清晰度评估***40还可以包括:第二处理单元(图中未示出)及特征提取单元(图中未示出),其中:所述第二处理单元,可以适于在所述前景提取单元提取所述待评估文本图像的前景之前,对所述待评估文本图像进行预处理,得到均衡化图像;所述特征提取单元,可以适于将所述均衡化图像从三原色通道转成LAB通道;基于转成LAB通道之后的均衡化图像,提取各像素点的特征,其中:所述各像素点的特征包括以下至少一种:各像素点的特征向量组成的特征向量集合及各特征向量对应的度量。
在具体实施中,所述第二处理单元,可以适于对所述待评估文本图像进行直方图均值化处理;将所述待评估文本图像的三原色通道转变成HSV通道;取V通道进行亮度处理,得到新的V通道;将所述新的V通道与H通道及S通道合并,转回三原色通道,得到所述均衡化的图像。
在具体实施中,所述前景提取单元41,可以适于基于所述特征向量集合,进行无监督的二分类聚类分离出所述待评估文本图像的前景及背景,并提取出所述待评估文本图像的前景。
在具体实施中,所述前景提取单元41,可以还适于在分离出所述待评估文本图像的前景及背景之后,执行对所述待评估文本图像的前景高亮及背景暗化操作。
在具体实施中,所述文本图像清晰度评估***40还可以包括:模型训练单元47,适于采用如下方式训练得到所述清晰度评估模型:获取样本文本图像;对所述样本文本图像进行图像处理,提取所述样本文本图像的前景;对所述样本文本图像的前景进行边缘化处理及轮廓提取;对经过边缘化处理及轮廓提取后的所述样本文本图像的前景进行像素点分割、过滤,定位所述样本文本图像的前景的***轮廓位置;根据所述***轮廓位置,对所述样本文本图像进行仿射变换,得到重整后的样本文本图像;对于重整后的样本文本图像中的像素点的每个颜色通道对应的像素值,采用如下至少一种方式获取所述样本文本图像的锐度信息指标:点锐度信息指标、高阶空域评价指标、频谱信息评价指标及统计分布评价指标;对所得到的各像素点的锐度信息指标分别进行逻辑回归训练,获取训练得到的最小值时对应的训练参数,得到所述清晰度评估模型。
在具体实施中,所述文本图像清晰度评估***的工作原理及工作流程,可以参考本发明上述实施例中提供的任一种文本图像清晰度评估方法中的描述,此处不做赘述。
本发明实施例还提供一种文本图像清晰度评估***,包括存储器和处理器,所述存储器上存储有可在所述处理器上运行的计算机指令,所述处理器运行所述计算机指令时执行本发明实施例提供的上述任一种文本图像清晰度评估方法的步骤。
本发明实施例还提供一种文本计算机可读存储介质,计算机可读存储介质为非易失性存储介质或非瞬态存储介质,其上存储有计算机指令,所述计算机指令运行时执行本发明实施例提供的上述任一种文本图像清晰度评估方法的步骤。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指示相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:ROM、RAM、磁盘或光盘等。
虽然本发明披露如上,但本发明并非限定于此。任何本领域技术人员,在不脱离本发明的精神和范围内,均可作各种更动与修改,因此本发明的保护范围应当以权利要求所限定的范围为准。

Claims (18)

1.一种文本图像清晰度评估方法,其特征在于,包括:
提取待评估文本图像的前景;
对所述待评估文本图像的前景进行边缘化处理及轮廓提取;
对经过边缘化处理及轮廓提取后的待评估文本图像的前景进行像素点分割、过滤,定位所述待评估文本图像的前景的***轮廓位置;
根据所述***轮廓位置,对所述待评估文本图像进行仿射变换,得到重整后的待评估文本图像;
将所述重整后的待评估文本图像输入至预设的清晰度评估模型;
输出所述待评估文本图像的清晰度评估结果。
2.根据权利要求1所述的文本图像清晰度评估方法,其特征在于,所述待评估文本图像的前景进行边缘化处理及轮廓提取,包括:
对所述待评估文本图像的前景进行处理,得到所述待评估文本图像的边缘特征图;
对所述待评估文本图像的边缘特征图进行多边形轮廓提取,得到由多个多边形组成的多边形集合。
3.根据权利要求2所述的文本图像清晰度评估方法,其特征在于,所述对所经过边缘化处理及轮廓提取后的待评估文本图像的前景进行像素点分割、过滤,定位所述待评估文本图像的前景的***轮廓位置,包括:
对于各多边形的轮廓,根据相邻两边的顶点坐标计算相邻两边的内夹角;
当相邻两边的内夹角小于预设阈值时,过滤所述内夹角,并迭代计算得到新边以取代所述内夹角的相邻边;
从过滤后的多边形集合中选择所有的四边形,将面积最大的四边形对应的轮廓作为所述待评估文本图像的前景的***轮廓位置。
4.根据权利要求1至3任一项所述的文本图像清晰度评估方法,其特征在于,在提取所述待评估文本图像的前景之前,还包括:
对所述待评估文本图像进行预处理,得到均衡化图像;
将所述均衡化图像从三原色通道转成LAB通道;
基于转成LAB通道之后的均衡化图像,提取各像素点的特征,其中:所述各像素点的特征包括以下至少一种:各像素点的特征向量组成的特征向量集合及各特征向量对应的度量。
5.根据权利要求4所述的文本图像清晰度评估方法,其特征在于,所述对所述待评估文本图像进行预处理,得到均衡化图像,包括:
对所述待评估文本图像进行直方图均值化处理;
将所述待评估文本图像的三原色通道转变成HSV通道;
取V通道进行亮度处理,得到新的V通道;
将所述新的V通道与H通道及S通道合并,转回三原色通道,得到所述均衡化的图像。
6.根据权利要求4所述的文本图像清晰度评估方法,其特征在于,所述提取待评估文本图像的前景,包括:
基于所述特征向量集合,进行无监督的二分类聚类分离出所述待评估文本图像的前景及背景,并提取出所述待评估文本图像的前景。
7.根据权利要求6所述的文本图像清晰度评估方法,其特征在于,在分离出所述待评估文本图像的前景及背景之后,还包括:
执行对所述待评估文本图像的前景高亮及背景暗化操作。
8.根据权利要求1所述的文本图像清晰度评估方法,其特征在于,采用如下方式训练得到所述清晰度评估模型:
获取样本文本图像;
对所述样本文本图像进行图像处理,提取所述样本文本图像的前景;
对所述样本文本图像的前景进行边缘化处理及轮廓提取;
对经过边缘化处理及轮廓提取后的所述样本文本图像的前景进行像素点分割、过滤,定位所述样本文本图像的前景的***轮廓位置;
根据所述***轮廓位置,对所述样本文本图像进行仿射变换,得到重整后的样本文本图像;
对于重整后的样本文本图像中的像素点的每个颜色通道对应的像素值,获取所述样本文本图像的锐度信息指标,其中:所述样本文本图像的锐度信息指标包括以下至少一种:点锐度信息指标、高阶空域评价指标、频谱信息评价指标及统计分布评价指标;
对所得到的各像素点的锐度信息指标分别进行逻辑回归训练,获取训练得到的最小值时对应的训练参数,得到所述清晰度评估模型。
9.一种文本图像清晰度评估***,其特征在于,包括:
前景提取单元,适于提取待评估文本图像的前景;
第一处理单元,适于对所述待评估文本图像的前景进行边缘化处理及轮廓提取;
过滤定位单元,适于对经过边缘化处理及轮廓提取后的待评估文本图像的前景进行像素点分割、过滤,定位所述待评估文本图像的前景的***轮廓位置;
仿射变换单元,适于根据所述***轮廓位置,对所述待评估文本图像进行仿射变换,得到重整后的待评估文本图像;
输入单元,适于将所述重整后的待评估文本图像输入至预设的清晰度评估模型;
输出单元,适于输出所述待评估文本图像的清晰度评估结果。
10.根据权利要求9所述的文本图像清晰度评估***,其特征在于,所述第一处理单元,适于对所述待评估文本图像的前景进行处理,得到所述待评估文本图像的边缘特征图,对所述待评估文本图像的边缘特征图进行多边形轮廓提取,得到由多个多边形组成的多边形集合。
11.根据权利要求10所述的文本图像清晰度评估***,其特征在于,所述过滤定位单元,适于对于各多边形的轮廓,根据相邻两边的顶点坐标计算相邻两边的内夹角;当相邻两边的内夹角小于预设阈值时,过滤所述内夹角,并迭代计算得到新边以取代所述内夹角的相邻边;从过滤后的多边形集合中选择所有的四边形,将面积最大的四边形对应的轮廓作为所述待评估文本图像的前景的***轮廓位置。
12.根据权利要求9至11任一项所述的文本图像清晰度评估***,其特征在于,还包括:第二处理单元及特征提取单元,其中:
所述第二处理单元,适于在所述前景提取单元提取所述待评估文本图像的前景之前,对所述待评估文本图像进行预处理,得到均衡化图像;
所述特征提取单元,适于将所述均衡化图像从三原色通道转成LAB通道;
基于转成LAB通道之后的均衡化图像,提取各像素点的特征,其中:所述各像素点的特征包括以下至少一种:各像素点的特征向量组成的特征向量集合及各特征向量对应的度量。
13.根据权利要求12任一项所述的文本图像清晰度评估***,其特征在于,所述第二处理单元,适于对所述待评估文本图像进行直方图均值化处理;将所述待评估文本图像的三原色通道转变成HSV通道;取V通道进行亮度处理,得到新的V通道;将所述新的V通道与H通道及S通道合并,转回三原色通道,得到所述均衡化的图像。
14.根据权利要求13所述的文本图像清晰度评估***,其特征在于,所述前景提取单元,适于基于所述特征向量集合,进行无监督的二分类聚类分离出所述待评估文本图像的前景及背景,并提取出所述待评估文本图像的前景。
15.根据权利要求14所述的文本图像清晰度评估***,其特征在于,所述前景提取单元,还适于在分离出所述待评估文本图像的前景及背景之后,执行对所述待评估文本图像的前景高亮及背景暗化操作。
16.根据权利要求9所述的文本图像清晰度评估***,其特征在于,还包括:模型训练单元,适于采用如下方式训练得到所述清晰度评估模型:获取样本文本图像;对所述样本文本图像进行图像处理,提取所述样本文本图像的前景;对所述样本文本图像的前景进行边缘化处理及轮廓提取;对经过边缘化处理及轮廓提取后的所述样本文本图像的前景进行像素点分割、过滤,定位所述样本文本图像的前景的***轮廓位置;根据所述***轮廓位置,对所述样本文本图像进行仿射变换,得到重整后的样本文本图像;对于重整后的样本文本图像中的像素点的每个颜色通道对应的像素值,采用如下至少一种方式获取所述样本文本图像的锐度信息指标:点锐度信息指标、高阶空域评价指标、频谱信息评价指标及统计分布评价指标;对所得到的各像素点的锐度信息指标分别进行逻辑回归训练,获取训练得到的最小值时对应的训练参数,得到所述清晰度评估模型。
17.一种文本图像清晰度评估***,包括存储器和处理器,所述存储器上存储有可在所述处理器上运行的计算机指令,其特征在于,所述处理器运行所述计算机指令时执行权利要求1至8任一项所述的文本图像清晰度评估方法的步骤。
18.一种计算机可读存储介质,计算机可读存储介质为非易失性存储介质或非瞬态存储介质,其上存储有计算机指令,其特征在于,所述计算机指令运行时执行权利要求1至8任一项所述的文本图像清晰度评估方法的步骤。
CN201910172031.8A 2019-03-07 2019-03-07 文本图像清晰度评估方法及***、计算机可读存储介质 Pending CN109948625A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910172031.8A CN109948625A (zh) 2019-03-07 2019-03-07 文本图像清晰度评估方法及***、计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910172031.8A CN109948625A (zh) 2019-03-07 2019-03-07 文本图像清晰度评估方法及***、计算机可读存储介质

Publications (1)

Publication Number Publication Date
CN109948625A true CN109948625A (zh) 2019-06-28

Family

ID=67008513

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910172031.8A Pending CN109948625A (zh) 2019-03-07 2019-03-07 文本图像清晰度评估方法及***、计算机可读存储介质

Country Status (1)

Country Link
CN (1) CN109948625A (zh)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111461070A (zh) * 2020-04-29 2020-07-28 Oppo广东移动通信有限公司 文本识别方法、装置、电子设备及存储介质
CN111553431A (zh) * 2020-04-30 2020-08-18 上海眼控科技股份有限公司 图片清晰度检测方法、装置、计算机设备及存储介质
CN112347899A (zh) * 2020-11-03 2021-02-09 广州杰赛科技股份有限公司 一种运动目标图像提取方法、装置、设备及存储介质
CN112396050A (zh) * 2020-12-02 2021-02-23 上海优扬新媒信息技术有限公司 图像的处理方法、设备以及存储介质
CN112668640A (zh) * 2020-12-28 2021-04-16 泰康保险集团股份有限公司 一种文本图像质量评估方法、装置、设备及介质
CN112767392A (zh) * 2021-03-02 2021-05-07 百果园技术(新加坡)有限公司 图像清晰度确定方法、装置、设备及存储介质
CN112967191A (zh) * 2021-02-19 2021-06-15 泰康保险集团股份有限公司 图像处理方法、装置、电子设备和存储介质
WO2021143233A1 (zh) * 2020-01-17 2021-07-22 苏州科达科技股份有限公司 图像清晰度检测方法、***、设备及存储介质
CN113315995A (zh) * 2021-05-06 2021-08-27 北京智通东方软件科技有限公司 提高视频质量的方法、装置、可读存储介质及电子设备
CN114387331A (zh) * 2022-01-14 2022-04-22 平安科技(深圳)有限公司 车图像分割质量的评估方法、装置、设备及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107481238A (zh) * 2017-09-20 2017-12-15 众安信息技术服务有限公司 图像质量评估方法及装置
CN107679497A (zh) * 2017-10-11 2018-02-09 齐鲁工业大学 视频面部贴图特效处理方法及生成***
WO2018036276A1 (zh) * 2016-08-22 2018-03-01 平安科技(深圳)有限公司 图片品质的检测方法、装置、服务器及存储介质
CN107958455A (zh) * 2017-12-06 2018-04-24 百度在线网络技术(北京)有限公司 图像清晰度评估方法、装置、计算机设备及存储介质

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018036276A1 (zh) * 2016-08-22 2018-03-01 平安科技(深圳)有限公司 图片品质的检测方法、装置、服务器及存储介质
CN107481238A (zh) * 2017-09-20 2017-12-15 众安信息技术服务有限公司 图像质量评估方法及装置
CN107679497A (zh) * 2017-10-11 2018-02-09 齐鲁工业大学 视频面部贴图特效处理方法及生成***
CN107958455A (zh) * 2017-12-06 2018-04-24 百度在线网络技术(北京)有限公司 图像清晰度评估方法、装置、计算机设备及存储介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
薛萍: "基于超像素特征表示的图像前景背景分割算法" *
薛萍: "基于超像素特征表示的图像前景背景分割算法", 西安科技大学学报, vol. 37, no. 5, pages 731 - 735 *

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021143233A1 (zh) * 2020-01-17 2021-07-22 苏州科达科技股份有限公司 图像清晰度检测方法、***、设备及存储介质
CN111461070B (zh) * 2020-04-29 2023-12-08 Oppo广东移动通信有限公司 文本识别方法、装置、电子设备及存储介质
CN111461070A (zh) * 2020-04-29 2020-07-28 Oppo广东移动通信有限公司 文本识别方法、装置、电子设备及存储介质
CN111553431A (zh) * 2020-04-30 2020-08-18 上海眼控科技股份有限公司 图片清晰度检测方法、装置、计算机设备及存储介质
CN112347899A (zh) * 2020-11-03 2021-02-09 广州杰赛科技股份有限公司 一种运动目标图像提取方法、装置、设备及存储介质
CN112347899B (zh) * 2020-11-03 2023-09-19 广州杰赛科技股份有限公司 一种运动目标图像提取方法、装置、设备及存储介质
CN112396050B (zh) * 2020-12-02 2023-09-15 度小满科技(北京)有限公司 图像的处理方法、设备以及存储介质
CN112396050A (zh) * 2020-12-02 2021-02-23 上海优扬新媒信息技术有限公司 图像的处理方法、设备以及存储介质
CN112668640B (zh) * 2020-12-28 2023-10-17 泰康保险集团股份有限公司 一种文本图像质量评估方法、装置、设备及介质
CN112668640A (zh) * 2020-12-28 2021-04-16 泰康保险集团股份有限公司 一种文本图像质量评估方法、装置、设备及介质
CN112967191A (zh) * 2021-02-19 2021-06-15 泰康保险集团股份有限公司 图像处理方法、装置、电子设备和存储介质
CN112967191B (zh) * 2021-02-19 2023-12-05 泰康保险集团股份有限公司 图像处理方法、装置、电子设备和存储介质
CN112767392A (zh) * 2021-03-02 2021-05-07 百果园技术(新加坡)有限公司 图像清晰度确定方法、装置、设备及存储介质
CN112767392B (zh) * 2021-03-02 2024-04-09 百果园技术(新加坡)有限公司 图像清晰度确定方法、装置、设备及存储介质
CN113315995A (zh) * 2021-05-06 2021-08-27 北京智通东方软件科技有限公司 提高视频质量的方法、装置、可读存储介质及电子设备
CN114387331A (zh) * 2022-01-14 2022-04-22 平安科技(深圳)有限公司 车图像分割质量的评估方法、装置、设备及存储介质

Similar Documents

Publication Publication Date Title
CN109948625A (zh) 文本图像清晰度评估方法及***、计算机可读存储介质
CN109154978B (zh) 用于检测植物疾病的***和方法
Barron Convolutional color constancy
CN107833220B (zh) 基于深度卷积神经网络与视觉显著性的织物缺陷检测方法
Kong et al. Partitioning histopathological images: an integrated framework for supervised color-texture segmentation and cell splitting
Paris et al. A topological approach to hierarchical segmentation using mean shift
CN107862698B (zh) 基于k均值聚类的光场前景分割方法及装置
CN108765465B (zh) 一种无监督sar图像变化检测方法
Tosta et al. Segmentation methods of H&E-stained histological images of lymphoma: A review
CN105096259B (zh) 深度图像的深度值恢复方法和***
CN108537239B (zh) 一种图像显著性目标检测的方法
CN107016664B (zh) 一种大圆机的坏针瑕疵检测方法
CN107133651A (zh) 基于超网络判别子图的功能磁共振影像数据分类方法
CN104217221A (zh) 基于纹理特征的书画作品检测方法
CN110728302A (zh) 一种基于HSV和Lab颜色空间的色纺织物组织识别的方法
CN108710916A (zh) 图片分类的方法及装置
Kong et al. Towards building computerized image analysis framework for nucleus discrimination in microscopy images of diffuse glioma
CN110298817A (zh) 基于图像处理的目标物统计方法、装置、设备及存储介质
CN112102928B (zh) 病理图像染色风格归一化方法及装置
CN108805838A (zh) 一种图像处理方法、移动终端及计算机可读存储介质
Jonnalagedda et al. [regular paper] mvpnets: Multi-viewing path deep learning neural networks for magnification invariant diagnosis in breast cancer
CN106462773B (zh) 使用gabor函数的模式识别***及方法
CN113850792A (zh) 一种基于计算机视觉的细胞分类计数方法及***
CN111738310B (zh) 物料分类方法、装置、电子设备和存储介质
CN117496532A (zh) 基于0cr的智慧识别工具

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20190628