CN109003257B - 一种光学字符验证方法 - Google Patents

一种光学字符验证方法 Download PDF

Info

Publication number
CN109003257B
CN109003257B CN201810619854.6A CN201810619854A CN109003257B CN 109003257 B CN109003257 B CN 109003257B CN 201810619854 A CN201810619854 A CN 201810619854A CN 109003257 B CN109003257 B CN 109003257B
Authority
CN
China
Prior art keywords
text
character
information
characteristic
characteristic quantity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810619854.6A
Other languages
English (en)
Other versions
CN109003257A (zh
Inventor
杨洋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Huahan Weiye Technology Co ltd
Original Assignee
Shenzhen Huahan Weiye Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Huahan Weiye Technology Co ltd filed Critical Shenzhen Huahan Weiye Technology Co ltd
Priority to CN201810619854.6A priority Critical patent/CN109003257B/zh
Publication of CN109003257A publication Critical patent/CN109003257A/zh
Application granted granted Critical
Publication of CN109003257B publication Critical patent/CN109003257B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • G06T7/0004Industrial image inspection
    • G06T7/0006Industrial image inspection using a design-rule based approach
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/74Image or video pattern matching; Proximity measures in feature spaces
    • G06V10/75Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
    • G06V10/751Comparing pixel values or logical combinations thereof, or feature values having positional relevance, e.g. template matching
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/62Text, e.g. of license plates, overlay texts or captions on TV images
    • G06V20/63Scene text, e.g. street names
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30108Industrial image inspection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30108Industrial image inspection
    • G06T2207/30144Printing quality
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Computing Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Evolutionary Computation (AREA)
  • Databases & Information Systems (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Quality & Reliability (AREA)
  • Character Input (AREA)
  • Image Analysis (AREA)

Abstract

一种光学字符验证方法,包括获取待检测图像、获取待检测文本信息和待检测字符信息、确定文本信息的缺陷类型以及确定字符信息的缺陷类型。由于预设树形结构模板来获取待检测的文本信息和字符信息,利于按照模板快速识别并获取文本信息和字符信息,使得***对待检测图像的信息提取能力得到增强。而且,对待检测的文本信息和字符信息分别采用了缺陷类型的粗定位和精确定位的方式,这种策略可实现更好的缺陷定位效果。此外,由于采用了文本姿态指标、文本质量指标、字符姿态指标和字符质量指标的多重比较机制,提高了缺陷类型的判断范围,利于得到更为准确的判断结果。

Description

一种光学字符验证方法
技术领域
本发明涉及光学检测领域,具体涉及一种光学字符验证方法。
背景技术
光学字符验证(Optical Character Verification,简称OCV),是利用光学视觉技术专门对各种电子元器件、电脑键盘、印刷制品等物品表面上印刷或雕刻的字符进行识别和检测,用于检查字符的打印质量以及其易辨识性,常见的字符包括数字、英文字母、符号、汉字等。该技术除了可以检查所呈现的字符内容是否正确,还可以检查字符串的质量、对比度和清晰度,并对品质不合格的样品进行标记或剔除,用于保证不同材质印刷时的质量。
光学字符验证常常应用于各种印刷行业、激光镭雕行业,可检测的缺陷种类繁多,主要有印刷不良、模糊、丝印偏移与歪斜、肥油、字符缺失、偏暗、偏亮、麻点/白点、毛刺、连墨/堵墨、丝印轻微异色等,具体可见图1-8。
当前,光学字符验证的主要技术手段是将具有合格印刷信息的印刷图像作为模板图像,确定包括待检测信息的待检测图像相对于模板图像的移动位置和偏转方向,计算待检测图像与模板图像对准的刚性变换的变换参数,按照变换参数对待检测图像进行变换以使其对准于模板图像,此时,将待检测图像与模板图像进行逐像素点比较,以对待检测信息和合格印刷信息之间的异同点进行验证。这种光学字符验证方法存在如下缺陷:(1)对待检测图像进行变换时,需要保证较高的定位精度,若发生位置偏移,则对待检测图像和模板图像进行逐像素点的比较时将大大增加误检的概率;(2)由于是对图像进行逐像素的一一比较,不仅比较了待检测信息,还比较了图像中待检测信息以外的像素点,如此,增加了额外的比较工作量,不利于达到快速比较的效果;(3)由于图像的比较过程局限于像素点,无法有效地检查字符串之中单个字符的缺陷,并且可检测的缺陷种类较少,只能检测出丝印偏移、歪斜之类的简单缺陷,对其他的缺陷类型无能为力,致使在实际应用中,现有的光学字符验证方法无法达到全面、精准的验证效果。
发明内容
本发明主要解决的技术问题是如何克服现有光学字符验证方法的不足,以达到全面、精准的验证效果。为解决上述技术问题,本申请提供了一种光学字符验证方法。
根据第一方面,一种实施例中提供一种光学字符验证方法,包括以下步骤:
获取待检测图像,所述待检测图像包括待检测的文本信息,所述文本信息包括一个或多个字符信息;
获取所述待检测图像中的待检测的文本信息,以及所述文本信息的特征信息;
将所述文本信息的特征信息与预设的文本指标进行比较,根据比较结果确定所述文本信息的缺陷类型;
获取所述文本信息中的各个字符信息以及每个字符信息的特征信息,根据每个字符信息的特征信息确定该字符信息的缺陷类型。
所述获取所述文本信息的特征信息,包括:
根据预设的树形结构模板从所述待检测图像中获取所述文本信息;
计算获得所述文本信息的特征信息,所述文本信息的特征信息包括文本姿态特征信息和/或文本质量特征信息;其中,所述文本姿态特征信息包括X向平移量、Y向平移量、X向缩放量、Y向缩放量、旋转角度量、切变角度量这些特征量的一者或多者,所述文本质量特征信息包括对比度、互相关系数、灰度系数、面积系数、定位分数、水平投影相似度、垂直投影相似度这些特征量的一者或多者。
所述树形结构模板包括预设数目的文本区域,每个文本区域包括预设数目的字符区域,每个字符区域包括预设数目的单体字符区域;
所述文本区域用于根据自身的区域范围确定文本信息,所述字符区域用于根据自身的区域范围确定文本信息中的各个字符信息,所述单体字符区域用于确定字符信息中的各个单体字符,所述单体字符为数字、字母、符号、汉字中的任一者。
所述的光学字符验证方法,还包括:预设所述树形结构模板;所述预设所述树形结构模板,包括以下步骤:
获取具有标准文本的模板图像;
对所述模板图像进行二值化处理,得到具有所述标准文本的前景图像;
对所述前景图像进行连通处理,得到所述标准文本中的各个单体字符,将每个单体字符的外接矩形所形成的区域作为各单体字符的单体字符区域;
根据用户的操作指令选择预设数目的单体字符构建字符,将该构建的字符的外接矩形所形成的区域作为该构建的字符的字符区域;
根据用户的操作指令选择预设数目的字符构建文本,将该文本的外接矩形所述形成的区域作为文本的初始区域,对文本的初始区域进行轮廓偏移设置或ROI设置,将设置后的初始区域作为该文本的文本区域。
所述根据预设的树形结构模板从所述待检测图像中获取所述文本信息,包括:将所述待检测图像中与所述树形结构模板的文本区域相匹配的文本作为所述文本信息。
所述将所述文本信息的特征信息与预设的文本指标进行比较,根据比较结果确定所述文本信息的缺陷类型,包括:
预设的文本指标包括文本姿态指标和/或文本质量指标;所述文本姿态指标包括X向平移量、Y向平移量、X向缩放量、Y向缩放量、旋转角度量、切变角度量所分别对应的误差范围的一者或多者,所述文本质量指标包括对比度、互相关系数、灰度系数、面积系数、定位分数、水平投影相似度、垂直投影相似度所分别对应的数值范围的一者或多者;
将所述文本姿态特征信息中各特征量分别与所述文本姿态指标中相应的特征量对应的误差范围进行比较,当所述文本姿态特征信息中一特征量超过所述文本姿态指标中该特征量对应的误差范围时,则将所述文本信息标记为该特征量所对应的缺陷类型;
将所述文本质量特征信息中各特征量分别与所述文本质量指标中相应的特征量对应的误差范围进行比较,当所述文本质量特征信息中一特征量超过所述文本质量指标中该特征量对应的数值范围时,则将所述文本信息标记为该特征量所对应的缺陷类型。
所述光学字符验证方法,还包括:预设所述文本指标;所述预设所述文本指标,包括以下步骤:
至少获取两帧均具有合格文本的良品图像;
根据所述树形结构模板中的与所述合格文本相对应的文本区域确定每帧良品图像中的合格文本;
获取每帧良品图像中合格文本的文本姿态特征信息和/或文本质量特征信息,每个合格文本的文本姿态特征信息包括X向平移量、Y向平移量、X向缩放量、Y向缩放量、旋转角度量、切变角度量这些特征量的一者或多者,每个合格文本的文本质量特征信息包括对比度、互相关系数、灰度系数、面积系数、定位分数、水平投影相似度、垂直投影相似度这些特征量的一者或多者;
将各个合格文本的文本姿态特征信息中相同的特征量进行比较,分别得到各特征量的最大值和最小值,根据每个特征量的最大值和最小值确定该特征量对应的误差范围,将各个特征量的误差范围作为所述文本指标中的文本姿态指标;
将各个合格文本的文本质量特征信息中相同的特征量进行比较,分别得到各特征量的平均值和标准差,根据每个特征量的平均值和标准差确定该特征量对应的数值范围,将各个特征量的数值范围作为所述文本指标中的文本质量指标。
所述将各个合格文本的文本姿态特征信息中相同的特征量进行比较,分别得到各特征量的最大值和最小值,根据每个特征量的最大值和最小值确定该特征量对应的误差范围,包括:
对于各个合格文本的文本姿态特征信息中的每个特征量,获取该特征量的最大值和最小值;
计算该特征量的最大值和最小值的平均值,计算该特征量的最大值和最小值的差值,将差值与预设的第一系数进行求积得到第一值;
将该特征量对应的平均值和第一值进行做差得到该特征量对应的误差范围的下限值,将该特征量对应的平均值和第一值进行做和得到该特征量对应的误差范围的上限值。
所述将各个合格文本的文本质量特征信息中相同的特征量进行比较,分别得到各特征量的平均值和标准差,根据每个特征量的平均值和标准差确定该特征量对应的数值范围,包括:
对于各个合格文本的文本质量特征信息中的每个特征量,获取该特征量的平均值和标准差;
将该特征量的标准差与预设的第二系数进行求积得到第二值,将该特征量的平均值与第二值做差得到该特征量对应的数值范围的下限值,将该特征量的平均值和第二值做和得到该特征量对应的数值范围的上限值。
所述获取所述文本信息中的各个字符信息以及每个字符信息的特征信息,根据每个字符信息的特征信息确定该字符信息的缺陷类型,包括:根据所述树形结构模板对所述文本信息进行分解,得到一个或多个字符信息;获取每个字符信息的特征信息;对于每个字符信息,将该字符信息的特征信息与预设的字符指标进行比较,根据比较结果确定所述字符信息的缺陷类型。
所述根据预设的树形结构模板对所述文本信息进行分解,得到一个或多个字符信息,包括:根据所述树形结构模板中的与所述文本信息相对应的文本区域确定所述文本信息;根据所述文本信息相对应的文本区域中的多个字符区域对所述文本信息进行分解,将与每个字符区域相匹配的所有单体字符作为该字符区域对应的字符信息。
所述获取每个字符信息的特征信息,包括:对于每个字符信息,计算获得该字符信息的特征信息,该字符信息的特征信息包括字符姿态特征信息和/或字符质量特征信息;其中,所述字符姿态特征信息包括X向平移量、Y向平移量这些特征量的一者或多者,所述字符质量特征信息包括对比度、互相关系数、灰度系数、面积系数、定位分数、水平投影相似度、垂直投影相似度这些特征量的一者或多者。
所述对于每个字符信息,将该字符信息的特征信息与预设的字符指标进行比较,根据比较结果确定所述字符信息的缺陷类型,包括:
预设的字符指标包括字符姿态指标和/或字符质量指标;所述字符姿态指标包括X向平移量、Y向平移量所分别对应的误差范围的一者或多者,所述字符质量指标包括对比度、互相关系数、灰度系数、面积系数、定位分数、水平投影相似度、垂直投影相似度所分别对应的数值范围的一者或多者;
对于每个字符信息,将该字符姿态特征信息中各特征量分别与所述字符姿态指标中相应的特征量对应的误差范围进行比较,当该字符姿态特征信息中一特征量超过所述字符姿态指标中该特征量对应的误差范围时,则将该字符信息标记为该特征量所对应的缺陷类型;
对于每个字符信息,将该字符质量特征信息中各特征量分别与所述字符质量指标中相应的特征量对应的数值范围进行比较,当该字符质量特征信息中一特征量超过所述字符质量指标中该特征量对应的数值范围时,则将该字符信息标记为该特征量所对应的缺陷类型。
预设所述字符指标包括以下步骤:
至少获取两帧均具有合格文本的良品图像;
根据所述树形结构模板中的与所述合格文本相对应的文本区域确定每帧良品图像中的合格文本;
根据所述树形结构模板中的与所述合格文本相对应的文本区域中的多个字符区域,对所述合格文本进行分解,将落入每个字符区域内的所有单体字符作为该字符区域对应的合格字符,所述合格字符为所述合格文本中的且每个单体字符都合格的字符信息;
获取每个合格字符中的字符姿态特征信息和/或字符质量特征信息,每个合格字符的字符姿态特征信息包括X向平移量、Y向平移量这些特征量的一者或多者,每个合格字符的字符质量特征信息包括对比度、互相关系数、灰度系数、面积系数、定位分数、水平投影相似度、垂直投影相似度这些特征量的一者或多者;
将各个合格字符的字符姿态特征信息中相同的特征量进行比较,分别得到各特征量的最大值和最小值,根据每个特征量的最大值和最小值确定该特征量对应的误差范围,将各个特征量的误差范围作为所述字符指标中的字符姿态指标;
将各个合格字符的字符质量特征信息中相同的特征量进行比较,分别得到各特征量的平均值和标准差,根据每个特征量的平均值和标准差确定该特征量对应的数值范围,将各个特征量的数值范围作为所述字符指标中的字符质量指标。
根据第二方面,一种实施例中提供一种计算机可读存储介质,包括程序,所述程序能够被处理器执行以实现如第一方面所述的方法。
依据上述实施例的一种光学字符验证方法,包括获取待检测图像、获取待检测文本信息和待检测字符信息、确定文本信息的缺陷类型以及确定字符信息的缺陷类型。第一方面,由于预设树形结构模板来获取待检测的文本信息和字符信息,利于按照模板快速识别并获取文本信息和字符信息,使得***对待检测图像的信息提取能力得到增强。第二方面,对待检测的文本信息进行缺陷类型判断,可快速地确定当前的文本信息是否存在缺陷,实现缺陷的粗定位效果,进而对存在缺陷的文本信息中的各个字符信息进行缺陷类型判断,以实现缺陷的精确定位效果,这种粗定位和精确定位的策略实现更好的缺陷定位效果。第三方面,由于采用了文本姿态指标、文本质量指标、字符姿态指标和字符质量指标的多重比较机制,使得在判断文本信息和字符信息的缺陷类型时,即可得到关于姿态特征的缺陷类型,也可得到关于质量特征的缺陷类型,提高了缺陷类型的判断范围,利于得到更为准确的判断结果。第四方面,由于文本指标和字符指标均是通过对良品图像进行学习而得到的数值范围,使得***对待检测的文本信息和字符信息提供了更为合理的容错率,利于从众多的待检测信息中筛选出满足用户要求的光学字符。第五方面,由于在预设文本指标和字符指标时借助了树形结构模板,使得***对光学字符进行验证时的鲁棒性得到提高,增强了***的稳定性。
附图说明
图1为模板图像的示意图;
图2为印刷不良图像的示意图;
图3为模糊图像的示意图;
图4为丝印偏移与歪斜图像的示意图;
图5为肥油图像的示意图;
图6为字符缺失图像的示意图;
图7为偏暗图像的示意图;
图8为偏亮图像的示意图;
图9为光学字符验证方法的流程图;
图10为预设树形结构模板的流程图;
图11为树形结构模板的结构图;
图12为确定文本信息的缺陷类型的流程图;
图13为获取文本指标的流程图;
图14为确定字符信息的缺陷类型的流程图;
图15为获取字符指标的流程图;
图16为光学字符验证方法的整体流程图;
图17为光学字符验证***的结构图;
图18为注册图像的示意图;
图19为前景图像的示意图;
图20为单体字符区域的示意图;
图21为字符区域的示意图;
图22为文本区域的示意图。
具体实施方式
下面通过具体实施方式结合附图对本发明作进一步详细说明。其中不同实施方式中类似元件采用了相关联的类似的元件标号。在以下的实施方式中,很多细节描述是为了使得本申请能被更好的理解。然而,本领域技术人员可以毫不费力的认识到,其中部分特征在不同情况下是可以省略的,或者可以由其他元件、材料、方法所替代。在某些情况下,本申请相关的一些操作并没有在说明书中显示或者描述,这是为了避免本申请的核心部分被过多的描述所淹没,而对于本领域技术人员而言,详细描述这些相关操作并不是必要的,他们根据说明书中的描述以及本领域的一般技术知识即可完整了解相关操作。
另外,说明书中所描述的特点、操作或者特征可以以任意适当的方式结合形成各种实施方式。同时,方法描述中的各步骤或者动作也可以按照本领域技术人员所能显而易见的方式进行顺序调换或调整。因此,说明书和附图中的各种顺序只是为了清楚描述某一个实施例,并不意味着是必须的顺序,除非另有说明其中某个顺序是必须遵循的。
本文中为部件所编序号本身,例如“第一”、“第二”等,仅用于区分所描述的对象,不具有任何顺序或技术含义。而本申请所说“连接”、“联接”,如无特别说明,均包括直接和间接连接(联接)。
请参考图9,本申请公开了一种光学字符验证方法,用于根据待检测图像中文本信息的特征信息和字符信息的特征信息分别确定文本信息的缺陷类型和字符信息的缺陷类型,该方法包括步骤S100-S400,下面分别说明。
步骤S100,获取待检测图像,待检测图像包括待检测的文本信息,文本信息包括一个或多个字符信息。
这里的待检测图像可为任意类型的摄像装置拍摄的、文本信息和字符信息清晰可见的图像,文本信息为数字、字母、符号和/或汉字组成的标识信息,其中,单个的数字、字母、符号或汉字称为单体字符,一个或多个单体字符构成的字符称为字符信息,一个或多个字符信息构成的文本称为文本信息,而文本信息也为待检测图像中存在的所有字符或者部分字符(部分字符可用一行字符、一列字符来表示)的统称。
步骤S200,获取待检测图像中的待检测的文本信息,以及文本信息的特征信息。
在一实施例中,首先,预设一个树形结构模板,根据预设的树形结构模板从待检测图像中获取文本信息。下面将对预设树形结构模板的过程进行说明,详见图10中的步骤A01-A05。
步骤A01,获取具有标准文本的模板图像(也称注册图像,可参考图18),标准文本用于形成步骤S100中的文本信息,即待检测图像中的文本信息是以标准文本为模板并通过印刷、镭雕、蚀刻、影印等方式形成的。
步骤A02,对模板图像进行图像分割处理(把图像分成若干个特定的、具有独特性质的区域以及对同一区域的像素赋予相同编号的过程),优选地采用二值化处理的方式,得到具有标准文本的前景图像。在一具体实施例中,可采用自动阈值或者手动阈值的方式设置二值化阈值,例如,可将二值化阈值设为70,那么,前景图像中的标准文本会形成诸如白色的高亮颜色,更加易于将此类高亮区域提取出来形成前景图像,可参考图19。
步骤A03,对前景图像进行连通处理,以避免除前景图像外其余图像信息所带来的干扰,可增快连通处理速度,并能优化连通处理结果。在一具体实施例中,连通处理可采用现有的“图像切割”和“图像修补”技术,前者主要是将单体字符之间的连通区域进行切割使之形成单体字符与单体字符的隔离效果,后者主要将指定位置的区域进行颜色填充使之形成单体字符的各个笔画之间的连通效果。
连通处理后得到标准文本中的各个单体字符,将每个单体字符的外接矩形所形成的区域作为各单体字符的单体字符区域,可参考图20。
步骤A04,根据用户的操作指令选择预设数目的单体字符构建字符,将该构建的字符的外接矩形所形成的区域作为该构建的字符的字符区域,可参考图21。例如,用户可以选择相邻的两个大写英文字母构建字符,并将这两个大写英文字母的外接矩形区域作为一个字符区域。
步骤A05,根据用户的操作指令选择预设数目的字符构建文本,将该文本的外接矩形所述形成的区域作为文本的初始区域,对文本的初始区域进行轮廓偏移设置或ROI设置,将设置后的初始区域作为该文本的文本区域,可参考图22。这里的轮廓偏移设置是指轮廓线按照偏移量参数进行的缩小或扩大的过程,ROI设置是指轮廓线按照不规则的几何图形进行迁移的过程,进行轮廓偏移设置或者ROI设置的目的是进一步修正文本的文本区域,提高文本区域的识别度。
由步骤A01-A05的说明得知,标准文本中的各个单体字符、构建的字符以及构建的文本均具有特定的显示区域,可分别用单体字符区域、字符区域和文本区域来一一进行位置限定,那么可将这些单体字符区域、字符区域和文本区域组建成树形结构模板,来确定由标准文本形成的其它图像中的文本信息的位置。由此可见,由模板图像所得到的树形结构模板可为图11所示的结构,其包括预设数目m的文本区域,每个文本区域包括预设数目n的字符区域,每个字符区域包括预设数目x的单体字符区域;其中,文本区域用于根据自身的区域范围确定文本信息,字符区域用于根据自身的区域范围确定文本信息中的各个字符信息,单体字符区域用于确定字符信息中的各个单体字符,单体字符为数字、字母、符号、汉字中的任一者。需要说明的是,每个模板图像中,关于文本区域的预设数目m、关于字符区域的预设数目n、关于单体字符区域的预设数目x均根据标准文本的文本内容或者用户的随机性操作有关,这里不做具体限定。例如,图21为根据注册图像(可见图18)得到的关于字符区域的图像,将每一行的文本内容作为一个文本信息,则对于文本信息“ISE ASSEMBLY”而言,其外接矩形所形成的区域为文本区域,“I”、“SE”、“ASSEMBLY”的各外接矩形所形成的区域分别为字符区域,“SE”、“ASSEMBLY”中的各英文字母的外接矩形所形成的区域分别为单体字符区域,而图21中三行文本内容所处位置的文本区域、字符区域和单体字符区域共同形成了一个树形结构模板。
在一实施例中,从待检测图像中获取待检测的文本信息时,根据预设的树形结构模板从所述待检测图像中获取所述文本信息,在一具体实施例中:将待检测图像中与树形结构模板的文本区域相匹配的文本作为文本信息,即将待检测图像中各个本文的相对位置与树形结构模板的某个文本区域对应的搜索范围进行比较,若其中一个文本的相对位置符合于该文本区域的搜索范围,则认为该文本和该文本区域相匹配,实现该文本的粗定位过程,进而将该文本作为待检测的文本信息。本领域内的技术人员应当理解,为了在图像中找到发生旋转、缩放和/或剪切的目标物体,可以创建不同位姿的模板以及文本区域,也就是说将搜索空间进行离散化,这种离散化就类似于平移的情况下利用像素进行离散;与平移不同的是,模板方向、缩放的离散化取决于模板的大小,这是因为模板越大就越能区别更小角度的变化,例如,对于直径为200的大小的模板设置角度步长为1°,缩放步长为0.1,那么更大的模板需要使用更小的角度步长,反之亦然。将模板的离散化空间内的信息与待匹配图像进行相似性计算,获取相似性最高的位姿作为最终的匹配结果。为了加速匹配过程,可以采用金字塔搜索技术进行加速处理,文本的匹配可以选择灰度匹配或者特征匹配等类似的匹配方法。这里将列举例1对特征匹配的相似度计算过程进行说明,列举例2对灰度匹配的计算过程进行说明。
例1,互相关系数为待检测的文本信息与标准文本之间相似程度的表征量,用公式表示为
Figure GDA0002554868560000101
其中,n表示标准文本的边缘像素点的数量,下标i表示边缘像素点的序号,(t',u')为标准文本的边缘像素点的梯度值,
Figure GDA0002554868560000102
为标准文本对应的待匹配图像位置的梯度值。
例2,灰度匹配系数待检测图像和模板图像之间的表征量,可按照线面的相关计算,用公式表示为
Figure GDA0002554868560000103
其中,mt为模板图像的平均灰度值,
Figure GDA0002554868560000104
为模板图像所有像素点灰度值的方差,mf(r,c)和
Figure GDA0002554868560000105
分别为待检测图像中的与树形结构模板ROI范围(即文本区域表示的范围)相对应的图像像素点的灰度平均值和方差。
在一实施例中,在针对文本信息进行粗定位的过程中,计算获得待检测的文本信息的特征信息,包括文本姿态特征信息和/或文本质量特征信息。其中,文本姿态特征信息包括X向平移量、Y向平移量、X向缩放量、Y向缩放量、旋转角度量、切变角度量这些特征量的一者或多者,文本质量特征信息包括对比度、互相关系数、灰度系数、面积系数、定位分数、水平投影相似度、垂直投影相似度这些特征量的一者或多者。对各特征量的分别说明如下。
对树形结构模板中的文本区域建立X-Y坐标系,设定标准文本相对于树形结构模板中的文本区域的平移量、旋转角度量、切变角度量均为零,设定文本区域的缩放量为1。那么,X向平移量为待检测的文本信息相对于树形结构模板中的文本区域在X方向上的移动值,Y向平移量为待检测的文本信息相对于树形结构模板中的文本区域在Y方向上的移动值;X向缩放量为待检测的文本信息相对于树形结构模板中的文本区域在X方向上的缩小/放大值,Y向缩放量为待检测的文本信息相对于树形结构模板中的文本区域在Y方向上的缩小/放大值(若为各向同性缩放,则X向缩放量和Y向缩放量相等);旋转角度量为待检测的文本信息相对于树形结构模板中的文本区域围绕中心点的旋转值,切变角度量为待检测的文本信息相对于树形结构模板中的文本区域的扭曲变形值。
对比度为待检测的文本信息所在前景图像的前景灰度a与背景灰度b的比较值,用公式
Figure GDA0002554868560000111
表示,取值范围是[0,1]。互相关系数为待检测的文本信息与标准文本的相似程度,用公式
Figure GDA0002554868560000112
表示,n表示标准文本的边缘像素点的数量,i表示边缘像素点的序号,(t',u')为标准文本的边缘像素点的梯度值,
Figure GDA0002554868560000113
为标准文本对应的待匹配图像位置的梯度值。灰度系数为待检测的文本信息所在前景图像的前景灰度归一化值(即前景灰度系数),用公式
Figure GDA0002554868560000114
表示,
Figure GDA0002554868560000115
σfore分别表示前景像素灰度的平均值和标准差,或者,灰度系数为待检测的文本信息所在背景图像的背景灰度归一化值(即背景灰度系数),用公式
Figure GDA0002554868560000116
表示,
Figure GDA0002554868560000117
σback分别表示背景像素灰度的平均值和标准差。面积系数为待检测的文本信息所在前景图像的像素个数的平均值和标准差(即前景面积系数),或者,面积系数为待检测的文本信息所在背景图像的像素个数的平均值和标准差(即背景面积系数)。定位分数为待检测的文本信息的轮廓像素点的归一化值,用公式
Figure GDA0002554868560000121
表示,g为轮廓像素点的灰度值,n为轮廓像素点的总个数,或者,用公式
Figure GDA0002554868560000122
进行表示。水平投影相似度为待检测的文本信息的行像素点的向量归一化值(或归一化余弦相似度),用公式
Figure GDA0002554868560000123
表示,vt=[v1,v2……vn]为标准文本中各列像素点对应向量的集合中的一个分量(v1、v2…vn为每列像素点的灰度平均值),vi=[x1,x2……xn]为待检测的文本信息中各列像素点对应向量的集合(x1、x2…xn为每列像素点的灰度平均值),下标i为列序号,下标n为总列数。垂直投影相似度为待检测的文本信息的列像素点的向量归一化值(或归一化余弦相似度),用公式
Figure GDA0002554868560000124
表示,ht=[h1,h2,……hm]为标准文本中各行像素点对应向量的集合中的一个分量(h1、h2…hm为每行像素点的灰度平均值),hi=[y1,y2……ym]为待检测的文本信息中各行像素点对应向量的集合(y1、y2…ym为每行像素点的灰度平均值),下标i为行序号,下标m为总行数。
步骤S300,将文本信息的特征信息与预设的文本指标进行比较,根据比较结果确定文本信息的缺陷类型。在一实施例中,见图12,步骤S300可包括步骤S310-S340,分别说明如下。
步骤S310,获取已经预设的文本指标,该预设的文本指标包括文本姿态指标和/或文本质量指标。其中,文本姿态指标包括X向平移量、Y向平移量、X向缩放量、Y向缩放量、旋转角度量、切变角度量所分别对应的误差范围的一者或多者,文本质量指标包括对比度、互相关系数、灰度系数、面积系数、定位分数、水平投影相似度、垂直投影相似度所分别对应的数值范围的一者或多者。预设文本指标的过程可参考图13,包括步骤S311-S315,分别说明如下。
步骤S311,至少获取两帧均具有合格文本的良品图像,这里的合格文本是由标准文本为模板并通过印刷、镭雕、蚀刻、影印等方式形成的、且每个单体字符都合格的文本。
步骤S312,根据步骤S200中预设的树形结构模板中的与合格文本相对应的文本区域确定每帧良品图像中的合格文本,具体为:将帧良品图像中与树形结构模板的文本区域相匹配的文本作为合格文本的文本信息。
步骤S313,计算获取每帧良品图像中合格文本的文本姿态特征信息和/或文本质量特征信息。每个合格文本的文本姿态特征信息包括X向平移量、Y向平移量、X向缩放量、Y向缩放量、旋转角度量、切变角度量这些特征量的一者或多者,每个合格文本的文本质量特征信息包括对比度、互相关系数、灰度系数、面积系数、定位分数、水平投影相似度、垂直投影相似度这些特征量的一者或多者。
需要说明的是,合格文本的文本姿态特征信息中的各个特征量的具体说明可参考步骤S200,合格文本的文本质量特征信息中的各个特征量的具体说明同样可参考步骤S200,这里不再赘述。
步骤S314,将各个合格文本的文本姿态特征信息中相同的特征量进行比较,分别得到各特征量的最大值和最小值,根据每个特征量的最大值和最小值确定该特征量对应的误差范围,将各个特征量的误差范围作为所述文本指标中的文本姿态指标。
在一具体实施例中,(1)对于各个合格文本的文本姿态特征信息中的每个特征量,获取该特征量的最大值max和最小值min;(2)计算该特征量的最大值max和最小值min的平均值Cbias,用公式
Figure GDA0002554868560000131
表示,计算该特征量的最大值和最小值的差值,将差值与预设的第一系数k1/2(k1为一个预设的参数值,可默认为1.2)进行求积得到第一值Ctolerance,用公式
Figure GDA0002554868560000132
表示;(3)将该特征量对应的平均值Cbias和第一值Ctolerance进行做差得到该特征量对应的误差范围的下限值,将该特征量对应的平均值和第一值进行做和得到该特征量对应的误差范围的上限值,即该特征量对应的误差范围是[Cbias-Ctolerance,Cbias+Ctolerance]。
按照上边的实施例得到每个特征量(X向平移量、Y向平移量、X向缩放量、Y向缩放量、旋转角度量、切变角度量中的一者或多者)对应的误差范围,将各个特征量的误差范围作为文本指标中的文本姿态指标。
步骤S315,将各个合格文本的文本质量特征信息中相同的特征量进行比较,分别得到各特征量的平均值和标准差,根据每个特征量的平均值和标准差确定该特征量对应的数值范围,将各个特征量的数值范围作为所述文本指标中的文本质量指标。
在一具体实施例中,文本质量指标符合正态分布标准,可根据正态分布获得各个特征量对应的数值方位,具体为:(1)对于各个合格文本的文本质量特征信息中的每个特征量,获取该特征量的平均值
Figure GDA0002554868560000145
和标准差σ;(2)将该特征量的标准差σ与预设的第二系数k2(根据3σ准则,k2的最小值为3,可默认为3.3)进行求积得到第二值σ*k2,将该特征量的平均值平均值
Figure GDA0002554868560000141
与第二值σ*k2做差得到该特征量对应的数值范围的下限值,将该特征量的平均值平均值
Figure GDA0002554868560000142
和第二值σ*k2做和得到该特征量对应的数值范围的上限值,即该特征量对应的数值范围是
Figure GDA0002554868560000143
按照上边的实施例得到每个特征量(对比度、互相关系数、灰度系数、面积系数、定位分数、水平投影相似度、垂直投影相似度中的一者或多者)对应的数值范围,将各个特征量的数值范围作为文本指标中的文本质量指标。
步骤S320,比较确定文本信息关于姿态特征的缺陷类型,见图12,该步骤S320可包括步骤S321-S323。
步骤S321,将文本姿态特征信息中各特征量分别与文本姿态指标中相应的特征量对应的误差范围进行比较。例如,步骤S200中得到待检测的文本信息的文本姿态特征信息中的X向偏移量,步骤S314中得到文本姿态指标中的X向偏移量对应的误差范围[Cbias-Ctolerance,Cbias+Ctolerance],然后判断X偏移量是否在误差范围内。
步骤S322,判断特征量是否超过误差范围,若超过,则进入步骤S323,反之,则进入步骤S340。
步骤S323,将文本信息标记为该特征量所对应的缺陷类型。在一具体实施例中,当文本姿态特征信息中的任一特征量的数值超过其对应的误差范围时,则确定文本信息具有“偏移/歪斜”的缺陷类型。
步骤S330,比较确定文本信息关于质量特征的缺陷类型,见图12,该步骤S330可包括步骤S331-S333。
步骤S331,将文本质量特征信息中各特征量分别与文本质量指标中相应的特征量对应的数值范围进行比较。例如,步骤S200中得到待检测的文本信息的文本质量特征信息中的对比度,步骤S314中得到文本质量指标中的对比度对应的数值范围
Figure GDA0002554868560000144
然后判断对比度是否在数值范围内。
步骤S332,判断特征量是否超过数值范围,若超过,则进入步骤S333,反之,则进入步骤S340。
步骤S333,文本质量特征信息中一特征量超过文本质量指标中该特征量对应的数值范围时,将文本信息标记为该特征量所对应的缺陷类型。在一具体实施例中,关于质量特征的缺陷类型包括:
1)互相关系数s超过其对应的数值范围,确定文本信息具有“未找到”的缺陷类型;
2)面积系数中的前景面积系数超过其对应的数值范围,或者,灰度系数中的前景灰度系数超过其对应的数值范围,确定文本信息具有“肥油”的缺陷类型;
3)面积系数中的背景面积系数超过其对应的数值范围,或者,灰度系数中的背景灰度系数超过其对应的数值范围,确定文本信息具有“漏印”的缺陷类型;
4)对比度超过其对应的数值范围,确定文本信息具有“异色”的缺陷类型。
5)定位分数超过其对应的数值范围,确定文本信息具有“未找到”的缺陷类型;
6)水平投影相似度超过其对应的数值范围,确定文本信息具有“未找到”和/或“漏印”的缺陷类型;
7)垂直投影相似度超过其对应的数值范围,确定文本信息具有“未找到”和/或“漏印”的缺陷类型。
步骤S340,视为特征量合格,即文本信息不存在该特征量对应的缺陷类型。
本领域的技术人员应当理解,通过步骤S300可以初步确定哪一个文本信息存在缺陷,以及具有哪种缺陷类型。当确定一个文本信息存在缺陷时,若要进一步地确定文本信息中所存在缺陷的具***置,即确定哪一个字符信息存在缺陷,就需要对字符信息进行验证和判断,具体过程参考步骤S400,下面将具体说明。
步骤S400,获取文本信息中的各个字符信息以及每个字符信息的特征信息,根据每个字符信息的特征信息确定该字符信息的缺陷类型。在一实施例中,见图14,步骤S400可包括步骤S410-S460,分别说明如下。
步骤S410,根据步骤S200中预设的树形结构模板对文本信息进行分解,得到一个或多个字符信息。在一具体实施例中,根据树形结构模板中的与文本信息相对应的文本区域确定文本信息;根据文本信息相对应的文本区域中的多个字符区域对文本信息进行分解,将与每个字符区域相匹配的所有单体字符作为该字符区域对应的字符信息,单体字符和字符区域的匹配过程可参考文本和文本区域匹配过程的相关说明,这里不再进行赘述。
步骤S420,获取每个字符信息的特征信息。在一具体实施例中,对于每个字符信息,计算获得该字符信息的特征信息,该字符信息的特征信息包括字符姿态特征信息和/或字符质量特征信息;其中,字符姿态特征信息包括X向平移量、Y向平移量这些特征量的一者或多者,字符质量特征信息包括对比度、互相关系数、灰度系数、面积系数、定位分数、水平投影相似度、垂直投影相似度这些特征量的一者或多者。
需要说明的是,字符姿态特征信息中的各特征量(包括X向平移量、Y向平移量的一者或多者)的说明可参考步骤S200中对于文本姿态特征信息的描述,字符姿态特征信息中的各特征量是相对于树形结构模板中字符区域的变化值。字符质量特征信息中的各特征量(包括对比度、互相关系数、灰度系数、面积系数、定位分数、水平投影相似度、垂直投影相似度中的一者或多者)的说明可参考步骤S200中对于文本质量特征信息的描述,字符质量特征信息中的各特征量是相对于标准文本中各字符的计算值。
对于每个字符信息,将该字符信息的特征信息与预设的字符指标进行比较,根据比较结果确定所述字符信息的缺陷类型。那么,下面将通过步骤S430-S460对确定字符信息的缺陷类型的过程进行详细说明。
步骤S430,获取已经预设的字符指标,该预设的字符指标包括字符姿态指标和/或字符质量指标。其中,字符姿态指标包括X向平移量、Y向平移量所分别对应的误差范围的一者或多者,字符质量指标包括对比度、互相关系数、灰度系数、面积系数、定位分数、水平投影相似度、垂直投影相似度所分别对应的数值范围的一者或多者。预设字符指标的过程可参考图15,包括步骤S431-S436,分别说明如下。
步骤S431,至少获取两帧均具有合格文本的良品图像,具体请参考图13中步骤S311。
步骤S432,根据树形结构模板中的与合格文本相对应的文本区域确定每帧良品图像中的合格文本,具体请参考图13中步骤S312。
步骤S433,根据树形结构模板中的与合格文本相对应的文本区域中的多个字符区域,对合格文本进行分解,将落入每个字符区域内的所有单体字符作为该字符区域对应的合格字符,合格字符为合格文本中的且每个单体字符都合格的字符信息。
步骤S434,计算获取每帧良品图像中合格文本的字符姿态特征信息和/或字符质量特征信息。每个合格字符的字符姿态特征信息包括X向平移量、Y向平移量这些特征量的一者或多者,每个合格字符的字符质量特征信息包括对比度、互相关系数、灰度系数、面积系数、定位分数、水平投影相似度、垂直投影相似度这些特征量的一者或多者。
步骤S435,将各个合格字符的字符姿态特征信息中相同的特征量进行比较,分别得到各特征量的最大值和最小值,根据每个特征量的最大值和最小值确定该特征量对应的误差范围,将各个特征量的误差范围作为所述字符指标中的字符姿态指标。
在一具体实施例中,(1)对于各个合格字符的字符姿态特征信息中的每个特征量,获取该特征量的最大值max和最小值min;(2)计算该特征量的最大值max和最小值min的平均值Cbias,用公式
Figure GDA0002554868560000171
表示,计算该特征量的最大值和最小值的差值,将差值与预设的第一系数k1/2(k1为一个预设的参数值,可默认为1.2)进行求积得到第一值Ctolerance,用公式
Figure GDA0002554868560000172
表示;(3)将该特征量对应的平均值Cbias和第一值Ctolerance进行做差得到该特征量对应的误差范围的下限值,将该特征量对应的平均值和第一值进行做和得到该特征量对应的误差范围的上限值,即该特征量对应的误差范围是[Cbias-Ctolerance,Cbias+Ctolerance]。
按照上边的实施例得到每个特征量(X向平移量、Y向平移量中的一者或多者)对应的误差范围,将各个特征量的误差范围作为字符指标中的字符姿态指标。
步骤S436,将各个合格字符的字符质量特征信息中相同的特征量进行比较,分别得到各特征量的平均值和标准差,根据每个特征量的平均值和标准差确定该特征量对应的数值范围,将各个特征量的数值范围作为所述字符指标中的字符质量指标。
在一具体实施例中,字符质量指标符合正态分布标准,可根据正态分布获得各个特征量对应的数值方位,具体为:(1)对于各个合格字符的字符质量特征信息中的每个特征量,获取该特征量的平均值
Figure GDA0002554868560000173
和标准差σ;(2)将该特征量的标准差σ与预设的第二系数k2(根据3σ准则,k2的最小值为3,可默认为3.3)进行求积得到第二值σ*k2,将该特征量的平均值平均值
Figure GDA0002554868560000174
与第二值σ*k2做差得到该特征量对应的数值范围的下限值,将该特征量的平均值平均值
Figure GDA0002554868560000175
和第二值σ*k2做和得到该特征量对应的数值范围的上限值,即该特征量对应的数值范围是
Figure GDA0002554868560000181
按照上边的实施例得到每个特征量(对比度、互相关系数、灰度系数、面积系数、定位分数、水平投影相似度、垂直投影相似度中的一者或多者)对应的数值范围,将各个特征量的数值范围作为字符指标中的字符质量指标。
步骤S440,比较确定字符信息关于姿态特征的缺陷类型,见图14,该步骤S440可包括步骤S441-S443。
步骤S441,将字符姿态特征信息中各特征量分别与字符姿态指标中相应的特征量对应的误差范围进行比较。
步骤S442,判断特征量是否超过误差范围,若超过,则进入步骤S443,反之,则进入步骤S460。
步骤S443,将字符信息标记为该特征量所对应的缺陷类型。在一具体实施例中,当字符姿态特征信息中的任一特征量的数值超过其对应的误差范围时,则确定字符信息具有“偏移/歪斜”的缺陷类型。
步骤S450,比较确定字符信息关于质量特征的缺陷类型,见图14,该步骤S450可包括步骤S451-S453。
步骤S451,将字符质量特征信息中各特征量分别与字符质量指标中相应的特征量对应的数值范围进行比较。
步骤S452,判断特征量是否超过数值范围,若超过,则进入步骤S453,反之,则进入步骤S460。
步骤S453,字符质量特征信息中一特征量超过字符质量指标中该特征量对应的数值范围时,将字符信息标记为该特征量所对应的缺陷类型。关于字符质量特征的缺陷类型的说明可参考图12中步骤S333。
步骤S460,视为特征量合格,即字符信息不存在该特征量对应的缺陷类型。
本领域的技术人员应当理解,通过上述的步骤S100-S400可以确定待检测的本文信息的缺陷类型以及字符信息的缺陷类型,从而实现光学字符验证。为方便理解本申请提出的光学字符验证方法,提供该光学字符验证方法的整体流程图,请参考图16,图中的各个步骤的具体过程可参考上文中与该步骤序号对应的说明内容,这里不再赘述。通过图16可知,该光学字符验证方法主要包括三个部分,第一部分为模板图像的处理过程(详见步骤A01-A05),通过此过程可预设树形结构模板,以方便对待检测图像和良品图像进行处理;第二部分为良品图像的处理过程(详见步骤S311-S315,以及步骤S433-S436),通过此过程可得文本指标和字符指标,以方便判定文本信息和/或字符信息的缺陷特征;第三部分为为待检测图像的处理过程(参考步骤S100、S200、S320、S330、S410、S420、S440和S450),其中,步骤S320-S330为判定文本信息的缺陷类型的过程,方便对缺陷类型进行粗定位,进一步地,步骤S440-S450为判定字符信息的缺陷类型的过程,以便对缺陷类型进行精确定位。这种对缺陷类型进行粗定位和精确定位的策略可更好地实现了缺陷定位的效果,利于快速、准确地找到具有缺陷的字符,是一种较优的光学字符验证方法,具有推广应用价值。
本领域的技术人员应当理解,本申请还公开了一种光学字符验证***,详见图17,该光学字符验证***包括树形结构模板设置单元51、良品图像学习单元52和光学字符验证单元53。下面分别说明。
树形结构模板设置单元51主要用于预设树形结构模板,而预设树形结构模板的方法可参考步骤A01-A05,这里不再进行赘述。
良品图像学习单元52与树形结构模板设置单元51通信连接,主要用于预设文本指标和/或字符指标。其中,预设文本指标的方法可参考图13中的步骤S311-S315,预设字符指标的方法可参考图15中步骤S431-S436,这里不再进行赘述。
光学字符验证单元53与树形结构模板设置单元51、良品图像学习单元52通信连接,主要用于对待检测图像中的文本信息和字符信息进行光学字符验证,以确定文本信息和字符信息的缺陷类型。而光学字符验证的方法可参考图9中的步骤S100-S400,这里不再进行赘述。
本领域技术人员可以理解,上述实施方式中各种方法的全部或部分功能可以通过硬件的方式实现,也可以通过计算机程序的方式实现。当上述实施方式中全部或部分功能通过计算机程序的方式实现时,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:只读存储器、随机存储器、磁盘、光盘、硬盘等,通过计算机执行该程序以实现上述功能。例如,将程序存储在设备的存储器中,当通过处理器执行存储器中程序,即可实现上述全部或部分功能。另外,当上述实施方式中全部或部分功能通过计算机程序的方式实现时,该程序也可以存储在服务器、另一计算机、磁盘、光盘、闪存盘或移动硬盘等存储介质中,通过下载或复制保存到本地设备的存储器中,或对本地设备的***进行版本更新,当通过处理器执行存储器中的程序时,即可实现上述实施方式中全部或部分功能。
以上应用了具体个例对本发明进行阐述,只是用于帮助理解本发明,并不用以限制本发明。对于本发明所属技术领域的技术人员,依据本发明的思想,还可以做出若干简单推演、变形或替换。

Claims (14)

1.一种光学字符验证方法,其特征在于,包括以下步骤:
获取待检测图像,所述待检测图像包括待检测的文本信息,所述文本信息包括一个或多个字符信息;
获取所述待检测图像中的待检测的文本信息,以及所述文本信息的特征信息;具体地,根据预设的树形结构模板从所述待检测图像中获取所述文本信息,计算获得所述文本信息的特征信息,所述文本信息的特征信息包括文本姿态特征信息和/或文本质量特征信息,其中,所述文本姿态特征信息包括X向平移量、Y向平移量、X向缩放量、Y向缩放量、旋转角度量、切变角度量这些特征量的一者或多者,所述文本质量特征信息包括对比度、互相关系数、灰度系数、面积系数、定位分数、水平投影相似度、垂直投影相似度这些特征量的一者或多者;
将所述文本信息的特征信息与预设的文本指标进行比较,根据比较结果确定所述文本信息的缺陷类型;
获取所述文本信息中的各个字符信息以及每个字符信息的特征信息,根据每个字符信息的特征信息确定该字符信息的缺陷类型。
2.如权利要求1所述的光学字符验证方法,其特征在于,
所述树形结构模板包括预设数目的文本区域,每个文本区域包括预设数目的字符区域,每个字符区域包括预设数目的单体字符区域;
所述文本区域用于根据自身的区域范围确定文本信息,所述字符区域用于根据自身的区域范围确定文本信息中的各个字符信息,所述单体字符区域用于确定字符信息中的各个单体字符,所述单体字符为数字、字母、符号、汉字中的任一者。
3.如权利要求2所述的光学字符验证方法,其特征在于,还包括:预设所述树形结构模板;所述预设所述树形结构模板,包括以下步骤:
获取具有标准文本的模板图像;
对所述模板图像进行二值化处理,得到具有所述标准文本的前景图像;
对所述前景图像进行连通处理,得到所述标准文本中的各个单体字符,将每个单体字符的外接矩形所形成的区域作为各单体字符的单体字符区域;
根据用户的操作指令选择预设数目的单体字符构建字符,将该构建的字符的外接矩形所形成的区域作为该构建的字符的字符区域;
根据用户的操作指令选择预设数目的字符构建文本,将该文本的外接矩形所形成的区域作为文本的初始区域,对文本的初始区域进行轮廓偏移设置或ROI设置,将设置后的初始区域作为该文本的文本区域。
4.如权利要求3所述的光学字符验证方法,其特征在于,所述根据预设的树形结构模板从所述待检测图像中获取所述文本信息,包括:
将所述待检测图像中与所述树形结构模板的文本区域相匹配的文本作为所述文本信息。
5.如权利要求3所述的光学字符验证方法,其特征在于,所述将所述文本信息的特征信息与预设的文本指标进行比较,根据比较结果确定所述文本信息的缺陷类型,包括:
预设的文本指标包括文本姿态指标和/或文本质量指标;所述文本姿态指标包括X向平移量、Y向平移量、X向缩放量、Y向缩放量、旋转角度量、切变角度量所分别对应的误差范围的一者或多者,所述文本质量指标包括对比度、互相关系数、灰度系数、面积系数、定位分数、水平投影相似度、垂直投影相似度所分别对应的数值范围的一者或多者;
将所述文本姿态特征信息中各特征量分别与所述文本姿态指标中相应的特征量对应的误差范围进行比较,当所述文本姿态特征信息中一特征量超过所述文本姿态指标中该特征量对应的误差范围时,则将所述文本信息标记为该特征量所对应的缺陷类型;
将所述文本质量特征信息中各特征量分别与所述文本质量指标中相应的特征量对应的误差范围进行比较,当所述文本质量特征信息中一特征量超过所述文本质量指标中该特征量对应的数值范围时,则将所述文本信息标记为该特征量所对应的缺陷类型。
6.如权利要求5所述的光学字符验证方法,其特征在于,还包括:预设所述文本指标;所述预设所述文本指标,包括以下步骤:
至少获取两帧均具有合格文本的良品图像;
根据所述树形结构模板中的与所述合格文本相对应的文本区域确定每帧良品图像中的合格文本;
获取每帧良品图像中合格文本的文本姿态特征信息和/或文本质量特征信息,每个合格文本的文本姿态特征信息包括X向平移量、Y向平移量、X向缩放量、Y向缩放量、旋转角度量、切变角度量这些特征量的一者或多者,每个合格文本的文本质量特征信息包括对比度、互相关系数、灰度系数、面积系数、定位分数、水平投影相似度、垂直投影相似度这些特征量的一者或多者;
将各个合格文本的文本姿态特征信息中相同的特征量进行比较,分别得到各特征量的最大值和最小值,根据每个特征量的最大值和最小值确定该特征量对应的误差范围,将各个特征量的误差范围作为所述文本指标中的文本姿态指标;
将各个合格文本的文本质量特征信息中相同的特征量进行比较,分别得到各特征量的平均值和标准差,根据每个特征量的平均值和标准差确定该特征量对应的数值范围,将各个特征量的数值范围作为所述文本指标中的文本质量指标。
7.如权利要求6所述的光学字符验证方法,其特征在于,所述将各个合格文本的文本姿态特征信息中相同的特征量进行比较,分别得到各特征量的最大值和最小值,根据每个特征量的最大值和最小值确定该特征量对应的误差范围,包括:
对于各个合格文本的文本姿态特征信息中的每个特征量,获取该特征量的最大值和最小值;
计算该特征量的最大值和最小值的平均值,计算该特征量的最大值和最小值的差值,将差值与预设的第一系数进行求积得到第一值;
将该特征量对应的平均值和第一值进行做差得到该特征量对应的误差范围的下限值,将该特征量对应的平均值和第一值进行做和得到该特征量对应的误差范围的上限值。
8.如权利要求6所述的光学字符验证方法,其特征在于,所述将各个合格文本的文本质量特征信息中相同的特征量进行比较,分别得到各特征量的平均值和标准差,根据每个特征量的平均值和标准差确定该特征量对应的数值范围,包括:
对于各个合格文本的文本质量特征信息中的每个特征量,获取该特征量的平均值和标准差;
将该特征量的标准差与预设的第二系数进行求积得到第二值,将该特征量的平均值与第二值做差得到该特征量对应的数值范围的下限值,将该特征量的平均值和第二值做和得到该特征量对应的数值范围的上限值。
9.如权利要求3所述的光学字符验证方法,其特征在于,所述获取所述文本信息中的各个字符信息以及每个字符信息的特征信息,根据每个字符信息的特征信息确定该字符信息的缺陷类型,包括:
根据所述树形结构模板对所述文本信息进行分解,得到一个或多个字符信息;
获取每个字符信息的特征信息;
对于每个字符信息,将该字符信息的特征信息与预设的字符指标进行比较,根据比较结果确定所述字符信息的缺陷类型。
10.如权利要求9所述的光学字符验证方法,其特征在于,所述根据预设的树形结构模板对所述文本信息进行分解,得到一个或多个字符信息,包括:
根据所述树形结构模板中的与所述文本信息相对应的文本区域确定所述文本信息;
根据所述文本信息相对应的文本区域中的多个字符区域对所述文本信息进行分解,将与每个字符区域相匹配的所有单体字符作为该字符区域对应的字符信息。
11.如权利要求9所述的光学字符验证方法,其特征在于,所述获取每个字符信息的特征信息,包括:
对于每个字符信息,计算获得该字符信息的特征信息,该字符信息的特征信息包括字符姿态特征信息和/或字符质量特征信息;其中,所述字符姿态特征信息包括X向平移量、Y向平移量这些特征量的一者或多者,所述字符质量特征信息包括对比度、互相关系数、灰度系数、面积系数、定位分数、水平投影相似度、垂直投影相似度这些特征量的一者或多者。
12.如权利要求11所述的光学字符验证方法,其特征在于,所述对于每个字符信息,将该字符信息的特征信息与预设的字符指标进行比较,根据比较结果确定所述字符信息的缺陷类型,包括:
预设的字符指标包括字符姿态指标和/或字符质量指标;所述字符姿态指标包括X向平移量、Y向平移量所分别对应的误差范围的一者或多者,所述字符质量指标包括对比度、互相关系数、灰度系数、面积系数、定位分数、水平投影相似度、垂直投影相似度所分别对应的数值范围的一者或多者;
对于每个字符信息,将该字符姿态特征信息中各特征量分别与所述字符姿态指标中相应的特征量对应的误差范围进行比较,当该字符姿态特征信息中一特征量超过所述字符姿态指标中该特征量对应的误差范围时,则将该字符信息标记为该特征量所对应的缺陷类型;
对于每个字符信息,将该字符质量特征信息中各特征量分别与所述字符质量指标中相应的特征量对应的数值范围进行比较,当该字符质量特征信息中一特征量超过所述字符质量指标中该特征量对应的数值范围时,则将该字符信息标记为该特征量所对应的缺陷类型。
13.如权利要求12所述的光学字符验证方法,其特征在于,预设所述字符指标包括以下步骤:
至少获取两帧均具有合格文本的良品图像;
根据所述树形结构模板中的与所述合格文本相对应的文本区域确定每帧良品图像中的合格文本;
根据所述树形结构模板中的与所述合格文本相对应的文本区域中的多个字符区域,对所述合格文本进行分解,将落入每个字符区域内的所有单体字符作为该字符区域对应的合格字符,所述合格字符为所述合格文本中的且每个单体字符都合格的字符信息;
获取每个合格字符中的字符姿态特征信息和/或字符质量特征信息,每个合格字符的字符姿态特征信息包括X向平移量、Y向平移量这些特征量的一者或多者,每个合格字符的字符质量特征信息包括对比度、互相关系数、灰度系数、面积系数、定位分数、水平投影相似度、垂直投影相似度这些特征量的一者或多者;
将各个合格字符的字符姿态特征信息中相同的特征量进行比较,分别得到各特征量的最大值和最小值,根据每个特征量的最大值和最小值确定该特征量对应的误差范围,将各个特征量的误差范围作为所述字符指标中的字符姿态指标;
将各个合格字符的字符质量特征信息中相同的特征量进行比较,分别得到各特征量的平均值和标准差,根据每个特征量的平均值和标准差确定该特征量对应的数值范围,将各个特征量的数值范围作为所述字符指标中的字符质量指标。
14.一种计算机可读存储介质,其特征在于,包括程序,所述程序能够被处理器执行以实现如权利要求1-13中任一项所述的方法。
CN201810619854.6A 2018-06-14 2018-06-14 一种光学字符验证方法 Active CN109003257B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810619854.6A CN109003257B (zh) 2018-06-14 2018-06-14 一种光学字符验证方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810619854.6A CN109003257B (zh) 2018-06-14 2018-06-14 一种光学字符验证方法

Publications (2)

Publication Number Publication Date
CN109003257A CN109003257A (zh) 2018-12-14
CN109003257B true CN109003257B (zh) 2020-09-01

Family

ID=64600789

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810619854.6A Active CN109003257B (zh) 2018-06-14 2018-06-14 一种光学字符验证方法

Country Status (1)

Country Link
CN (1) CN109003257B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109872310A (zh) * 2019-02-01 2019-06-11 东莞中科蓝海智能视觉科技有限公司 工件漏线及表面字符方向检测识别方法
CN110222753B (zh) * 2019-05-28 2022-07-29 北京金山数字娱乐科技有限公司 字符识别验证方法、***、计算机设备、存储介质和芯片
CN113111868B (zh) * 2021-03-16 2023-08-18 广州大学 一种字符缺陷检测方法、***、装置及存储介质
CN113610649A (zh) * 2021-08-10 2021-11-05 平安国际智慧城市科技股份有限公司 基于图像识别的审核方法、装置、设备及存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103544475A (zh) * 2013-09-23 2014-01-29 方正国际软件有限公司 一种版面类型的识别方法及***
CN103868935A (zh) * 2014-02-14 2014-06-18 中国科学院合肥物质科学研究院 基于计算机视觉的烟支外观质量检测方法
CN105717477A (zh) * 2015-03-08 2016-06-29 石梦媛 电表缺陷智能化检测设备
CN106251341A (zh) * 2016-07-22 2016-12-21 凌云光技术集团有限责任公司 一种印刷品质量检测方法
CN106803244A (zh) * 2016-11-24 2017-06-06 深圳市华汉伟业科技有限公司 缺陷识别方法及***
CN107516085A (zh) * 2017-09-01 2017-12-26 山西同方知网数字出版技术有限公司 一种基于文档图像自动去除黑边的方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103499588B (zh) * 2007-10-05 2016-09-07 株式会社尼康 显示器件的缺陷检测方法及显示器件的缺陷检测装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103544475A (zh) * 2013-09-23 2014-01-29 方正国际软件有限公司 一种版面类型的识别方法及***
CN103868935A (zh) * 2014-02-14 2014-06-18 中国科学院合肥物质科学研究院 基于计算机视觉的烟支外观质量检测方法
CN105717477A (zh) * 2015-03-08 2016-06-29 石梦媛 电表缺陷智能化检测设备
CN106251341A (zh) * 2016-07-22 2016-12-21 凌云光技术集团有限责任公司 一种印刷品质量检测方法
CN106803244A (zh) * 2016-11-24 2017-06-06 深圳市华汉伟业科技有限公司 缺陷识别方法及***
CN107516085A (zh) * 2017-09-01 2017-12-26 山西同方知网数字出版技术有限公司 一种基于文档图像自动去除黑边的方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
《基于图像处理的印刷品缺陷检测技术研究》;刘海娟;《中国优秀硕士学位论文全文数据库 信息科技辑》;20140415(第4期);I138-883 *
《基于机器视觉罐装食品瓶盖字符识别与缺陷检测》;梁坤;《中国优秀硕士学位论文全文数据库 工程科技Ⅰ辑》;20170715(第7期);B024-350 *
《基于视觉特性的印刷质量在线检测技术研究》;付芦静;《中国优秀硕士学位论文全文数据库 工程科技Ⅰ辑》;20150215(第2期);第B024-702页正文第18页,第17行-23行、图3-4 *
《汽车音响面板印刷字符缺陷快速检测算法》;黄丽华等;《计算机与数字工程》;20101103;第38卷(第7期);正文第21-32页,第3节 *

Also Published As

Publication number Publication date
CN109003257A (zh) 2018-12-14

Similar Documents

Publication Publication Date Title
CN109003257B (zh) 一种光学字符验证方法
CN111028213B (zh) 图像缺陷检测方法、装置、电子设备及存储介质
CN111243032B (zh) 一种棋盘格角点全自动检测方法
CN107729899B (zh) 一种车牌号码识别方法及装置
CN113344857B (zh) 缺陷检测网络的训练方法、缺陷检测方法和存储介质
CN111160352B (zh) 一种基于图像分割的工件金属表面文字识别方法及***
CN109636815B (zh) 一种基于计算机视觉的金属板带产品标签信息识别方法
US6774889B1 (en) System and method for transforming an ordinary computer monitor screen into a touch screen
JP4006224B2 (ja) 画像品質判定方法、判定装置、判定プログラム
US8019164B2 (en) Apparatus, method and program product for matching with a template
JP5934762B2 (ja) 文字の形状特徴を使用した文字比較による文書改変検知方法、コンピュータプログラム、記録媒体および情報処理装置
KR102521386B1 (ko) 치수 계측 장치, 치수 계측 방법 및 반도체 제조 시스템
US9575935B2 (en) Document file generating device and document file generation method
CN109727279B (zh) 一种矢量数据与遥感影像的自动配准方法
JP6188052B2 (ja) 情報システム及びサーバー
CN112348019B (zh) 一种答题卡矫正方法、装置、电子设备及存储介质
CN111079592B (zh) 陶瓷指纹图像生成、提取方法及装置
CN112419260A (zh) 一种pcb文字区域缺陷检测方法
US20150015603A1 (en) Method for cutting out character, character recognition apparatus using this method, and program
CN113034492A (zh) 一种印刷质量缺陷检测方法、存储介质
CN109726722B (zh) 一种字符分割方法及装置
JP5010627B2 (ja) 文字認識装置及び文字認識方法
CN106570501A (zh) 一种仪表面板字符自动识别方法
JP5439069B2 (ja) 文字認識装置及び文字認識方法
JP4936250B2 (ja) 書込み抽出方法、書込み抽出装置および書込み抽出プログラム

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant