CN111461084A - 一种文字骨架提取方法 - Google Patents

一种文字骨架提取方法 Download PDF

Info

Publication number
CN111461084A
CN111461084A CN202010476703.7A CN202010476703A CN111461084A CN 111461084 A CN111461084 A CN 111461084A CN 202010476703 A CN202010476703 A CN 202010476703A CN 111461084 A CN111461084 A CN 111461084A
Authority
CN
China
Prior art keywords
point
pixel
image
points
skeleton
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010476703.7A
Other languages
English (en)
Inventor
杨从新
梁爽
李永传
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wuxi Hebo Yongxin Technology Co ltd
Original Assignee
Wuxi Hebo Yongxin Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wuxi Hebo Yongxin Technology Co ltd filed Critical Wuxi Hebo Yongxin Technology Co ltd
Priority to CN202010476703.7A priority Critical patent/CN111461084A/zh
Publication of CN111461084A publication Critical patent/CN111461084A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/413Classification of content, e.g. text, photographs or tables
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/255Detecting or recognising potential candidate objects based on visual cues, e.g. shapes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/28Quantising the image, e.g. histogram thresholding for discrimination between background and foreground patterns
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/30Noise filtering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Character Input (AREA)

Abstract

本发明涉及字库领域,公开了一种文字骨架提取方法,包括扫描文字的所有像素点,并判断所有的像素点能否赋值为255,直至再也没有赋值为255的图像点,解决了现有机器视觉提取的文字骨架呈“鱼骨状”的问题,而且本发明方法提取的文字骨架不用二次修改,可直接作为检测设备的骨架模板。

Description

一种文字骨架提取方法
技术领域
本发明涉及字库领域,具体涉及一种文字骨架提取方法。
背景技术
在工业生产检测过程中,常常使用机器视觉对印刷的字码的线条粗细和颜色亮度进行检测,来判断该字码是否可辨识。由于机器视觉在检测字码是否断线时会存在误检测的现象,所以需提前人工设定字码的骨架作为检测设备的检测模板。检测设备对模板图像与被检测图像执行异或算法求出缺损的骨架长度,并根据该长度判断字码是否完整。然而目前市面上的机器视觉在细化提取字码骨架时采用图像形态学方法,如图1-2所示,在对图1的原字码骨架进行提取后,图2中提取的字码骨架呈“鱼骨状”,需要人工二次修改、剔除多余的线条,耗费大量的人力,且操作人员的技术水平也有相应的要求,不利于在生产环境中推广使用。
发明内容
鉴于背景技术的不足,本发明是提供了一种文字骨架提取方法,所要解决的技术问题是现有机器视觉采用图像形态学方法提取的字码骨架呈“鱼骨状”,需人工二次修改,不利于实际应用。
为解决以上技术问题,本发明提供了如下技术方案:一种文字骨架提取方法,包括以下步骤:
S1:扫描文字骨架,获得文字骨架的图像;
S2:扫描文字骨架的图像的所有像素点,对每个像素点依次进行以下判断,如果该像素点同时是北部边界点和8simple象素点,但不是孤立点和端点,将该像素点赋值255;
S3:重新扫描文字骨架的图像的所有像素点,对每个像素点依次进行以下判断,如果该像素点同时是南部边界点和8simple象素点,但不是孤立点和端点,将该像素点赋值255;
S4:再次扫描文字骨架的图像的所有像素点,对每个图像点依次进行以下判断,如果该像素点同时是东部边界点和8simple象素点,但不是孤立点和端点,将该像素点赋值255;
S5:重新扫描文字骨架的图像的所有像素点,对每个图像点依次进行以下判断,如果该像素点同时是西部边界点和8simple象素点,但不是孤立点和端点,将该像素点赋值255;
S6:执行步骤S2-S5后完成一次迭代,重复循环执行迭代过程,直至扫描的像素点中没有可赋值为255的像素点后退出迭代过程;
北部边界点、南部边界点、东部边界点、西部边界点、8simple象素点、孤立点和端点的具体定义如下:将九宫格像素点的中间像素命名为P1,以P1正上方的像素点为起点,将P1四周的像素点按照顺时针方向依次命名为P2、P3、P4、P5、P6、P7、P8和P9;对于像素点P1,如果P2=255,则P1称作北部边界点;如果P6=255,则P1称作南部边界点;如果P4=255,则P1称作东部边界点;如果P1=255,则P1称作西部边界点;如果P1周围8个象素点的值均为255,则P1为孤立点;如果P1周围的8个象素点中有且只有一个象素点的值为255,则P1称作端点;如果P1=0,且P1的八邻域存在连续的点等于0,将P1赋值为255后,如果P1的八邻域内依然是连续的,则没有改变P1的八连通性,如果P1的八邻域不存在连续的点等于0,则P1为8simple象素点。
进一步,步骤S1中扫描文字骨架图像,获得文字骨架的所有像素点的具体步骤如下:
S10:扫描文字骨架的每一个像素点,统计像素值在0~255之间的个数,将统计结果绘制成直方图;
S11:根据直方图信息,用最大熵方法计算二值化阈值;
S12:根据二值化阈值对扫描的文字骨架进行二值化处理;
S13:对二值化后的图像进行开运算来消除二值化后的图像中的噪点或者小斑迹,最终获得文字骨架的图像。
步骤S12中,二值化处理是指如果像素点的值大于二值化阈值,则该像素点赋值0,如果像素点的值小于二值化阈值,该像素点赋值255,通过二值化处理,将文字颜色置为0,背景颜色置为255
本发明提供的一种文字骨架提取方法,通过扫描文字的所有像素点,并判断所有的像素点能否赋值为255,直至再也没有赋值为255的图像点,解决了现有机器视觉提取的文字骨架呈“鱼骨状”的问题,而且本发明方法提取的文字骨架不用二次修改,可直接作为检测设备的骨架模板。
附图说明
本发明有如下附图:
图1为实施例中的文字骨架原图;
图2为现有技术对图1进行提取后的文字骨架示意图;
图3为实施例中的文字骨架的像素点的直方图;
图4为对实施例中的文字骨架图像进行二值化后的图像;
图5为对实施例中的文字骨架图像进行开运算处理后的图像;
图6为采用本发明对实施例中的文字骨架图像进行处理后图像;
图7为九宫格像素的示意图;
图8为本发明的流程图。
具体实施方式
现在结合附图对本发明作进一步详细的说明。这些附图均为简化的示意图,仅以示意方式说明本发明的基本结构,因此其仅显示与本发明有关的构成。
如图8所示,一种文字骨架提取方法,包括以下步骤:
S1:扫描文字骨架,获得文字骨架的图像;
S2:扫描文字骨架的图像的所有像素点,对每个像素点依次进行以下判断,如果该像素点同时是北部边界点和8simple象素点,但不是孤立点和端点,将该像素点赋值255;
S3:重新扫描文字骨架的图像的所有像素点,对每个像素点依次进行以下判断,如果该像素点同时是南部边界点和8simple象素点,但不是孤立点和端点,将该像素点赋值255;
S4:再次扫描文字骨架的图像的所有像素点,对每个图像点依次进行以下判断,如果该像素点同时是东部边界点和8simple象素点,但不是孤立点和端点,将该像素点赋值255;
S5:重新扫描文字骨架的图像的所有像素点,对每个图像点依次进行以下判断,如果该像素点同时是西部边界点和8simple象素点,但不是孤立点和端点,将该像素点赋值255;
S6:执行步骤S2-S5后完成一次迭代,重复循环执行迭代过程,直至扫描的像素点中没有可赋值为255的像素点后退出迭代过程。
步骤S1中,
如图7所示,北部边界点、南部边界点、东部边界点、西部边界点、8simple象素点、孤立点和端点的定义具体如下:将九宫格像素点的中间像素命名为P1,以P1正上方的像素点为起点,将P1四周的像素点按照顺时针方向依次命名为P2、P3、P4、P5、P6、P7、P8和P9;对于像素点P1,如果P2=255,则P1称作北部边界点;如果P6=255,则P1称作南部边界点;如果P4=255,则P1称作东部边界点;如果P1=255,则P1称作西部边界点;如果P1周围8个象素点的值均为255,则P1为孤立点;如果P1周围的8个象素点中有且只有一个象素点的值为255,则P1称作端点;如果P1=0,且P1的八邻域存在连续的点等于0,将P1赋值为255后,如果P1的八邻域内依然是连续的,则没有改变P1的八连通性,如果P1的八邻域不存在连续的点等于0,则P1为8simple象素点。
进一步,步骤S14中扫描文字骨架图像,获得文字骨架的所有像素点的具体步骤如下:
S10:扫描文字骨架的每一个像素点,统计像素值在0~255之间的个数,将统计结果绘制成直方图;
S11:根据直方图信息,用最大熵方法计算二值化阈值;
S12:根据二值化阈值对扫描的文字骨架进行二值化处理;
S13:对二值化后的图像进行开运算来消除二值化后的图像中的噪点或者小斑迹,最终获得文字骨架的图像。
图3是在进行步骤S10后得到的直方图。
图4是在进行步骤S12后得到的文字骨架图像,其中,二值化处理是指如果像素点的值如果大于二值化阈值,则该像素点赋值0,如果该像素点小于二值化阈值,则该像素点赋值255。
图5是在进行步骤S13后获得的最终文字骨架的图像。从图4、图5中可以得到,在进行开运算后,图4中的噪点和小斑迹得到消除,其中开运算的直径是1。
如图6所示,采用本发明对图1的文字骨架进行提取,提取后的图像骨架光滑清晰,不用二次修改,可直接在生产环境中进行应用。
上述依据本发明为启示,通过上述的说明内容,相关工作人员完全可以在不偏离本项发明技术思想的范围内,进行多样的变更以及修改。本项发明的技术性范围并不局限于说明书上的内容,必须要根据权利要求范围来确定其技术性范围。

Claims (3)

1.一种文字骨架提取方法,其特征在于:包括以下步骤:
S1:扫描文字骨架,获得文字骨架的图像;
S2:扫描文字骨架的图像的所有像素点,对每个像素点依次进行以下判断,如果该像素点同时是北部边界点和8simple象素点,但不是孤立点和端点,将该像素点赋值255;
S3:重新扫描文字骨架的图像的所有像素点,对每个像素点依次进行以下判断,如果该像素点同时是南部边界点和8simple象素点,但不是孤立点和端点,将该像素点赋值255;
S4:再次扫描文字骨架的图像的所有像素点,对每个图像点依次进行以下判断,如果该像素点同时是东部边界点和8simple象素点,但不是孤立点和端点,将该像素点赋值255;
S5:重新扫描文字骨架的图像的所有像素点,对每个图像点依次进行以下判断,如果该像素点同时是西部边界点和8simple象素点,但不是孤立点和端点,将该像素点赋值255;
S6:执行步骤S2-S5后完成一次迭代,重复循环执行迭代过程,直至扫描的像素点中没有可赋值为255的像素点后退出迭代过程;
北部边界点、南部边界点、东部边界点、西部边界点、8simple象素点、孤立点和端点的具体定义如下:将九宫格像素点的中间像素命名为P1,以P1正上方的像素点为起点,将P1四周的像素点按照顺时针方向依次命名为P2、P3、P4、P5、P6、P7、P8和P9;对于像素点P1,如果P2=255,则P1称作北部边界点;如果P6=255,则P1称作南部边界点;如果P4=255,则P1称作东部边界点;如果P1=255,则P1称作西部边界点;如果P1周围8个象素点的值均为255,则P1为孤立点;如果P1周围的8个象素点中有且只有一个象素点的值为255,则P1称作端点;如果P1=0,且P1的八邻域存在连续的点等于0,将P1赋值为255后,如果P1的八邻域内依然是连续的,则没有改变P1的八连通性,如果P1的八邻域不存在连续的点等于0,则P1为8simple象素点。
2.权利要求1所述的一种文字骨架提取方法,其特征在于:步骤S1中扫描文字骨架图像,获得文字骨架的所有像素点的具体步骤如下:
S10:扫描文字骨架的每一个像素点,统计像素值在0~255之间的个数,将统计结果绘制成直方图;
S11:根据直方图信息,用最大熵方法计算二值化阈值;
S12:根据二值化阈值对扫描的文字骨架进行二值化处理;
S13:对二值化后的图像进行开运算来消除二值化后的图像中的噪点或者小斑迹,最终获得文字骨架的图像。
3.权利要求2所述的一种文字骨架提取方法,其特征在于:步骤S12中,二值化处理是指如果像素点的值大于二值化阈值,则该像素点赋值0,如果像素点的值小于二值化阈值,该像素点赋值255。
CN202010476703.7A 2020-05-29 2020-05-29 一种文字骨架提取方法 Pending CN111461084A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010476703.7A CN111461084A (zh) 2020-05-29 2020-05-29 一种文字骨架提取方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010476703.7A CN111461084A (zh) 2020-05-29 2020-05-29 一种文字骨架提取方法

Publications (1)

Publication Number Publication Date
CN111461084A true CN111461084A (zh) 2020-07-28

Family

ID=71682064

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010476703.7A Pending CN111461084A (zh) 2020-05-29 2020-05-29 一种文字骨架提取方法

Country Status (1)

Country Link
CN (1) CN111461084A (zh)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104794437A (zh) * 2015-04-07 2015-07-22 广东瑞德智能科技股份有限公司 一种手写输入文字图像细化处理方法
JP2017055192A (ja) * 2015-09-08 2017-03-16 富士ゼロックス株式会社 2値画像生成装置および2値画像生成プログラム

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104794437A (zh) * 2015-04-07 2015-07-22 广东瑞德智能科技股份有限公司 一种手写输入文字图像细化处理方法
JP2017055192A (ja) * 2015-09-08 2017-03-16 富士ゼロックス株式会社 2値画像生成装置および2値画像生成プログラム

Similar Documents

Publication Publication Date Title
CN109142366B (zh) 球形外壳缺陷检测方法、装置及计算机可读存储介质
CN107256406B (zh) 重叠纤维图像分割方法、装置、存储介质和计算机设备
CN111260616A (zh) 一种基于Canny算子二维阈值分割优化的绝缘子裂纹检测方法
US4516262A (en) Character data processing apparatus
CN115345885A (zh) 一种金属健身器材外观质量检测方法
CN109886921A (zh) 基于数字图像的裂纹尺寸度量方法、装置和电子设备
RU2002133897A (ru) Способ многоэтапного анализа информации растрового изображения
CN111461100A (zh) 一种票据识别方法、装置、电子设备和存储介质
CN113487563B (zh) 一种基于el图像的光伏组件隐裂自适应检测方法
CN114708325A (zh) 一种基于橡胶喷霜缺陷的橡胶生产问题快速定位方法
CN113971681A (zh) 一种复杂环境下带式输送机边缘检测方法
CN111461084A (zh) 一种文字骨架提取方法
JP4318776B2 (ja) ムラの検査方法及び装置
CN112116600A (zh) 一种基于图像处理的光伏板计数方法
CN109272480B (zh) 一种不相溶溶液分界线的检测方法
CN113096099B (zh) 基于颜色通道合并的透水沥青混合料连通空隙识别方法
CN115456996A (zh) 一种核燃料芯块的离散性缺陷检测方法及相关组件
CN110147765A (zh) 一种图像处理方法及装置
CN115619725A (zh) 电子元器件检测方法、装置、电子设备及自动质检设备
JPH04350546A (ja) 異物検出方法
JP2001028059A (ja) 色ムラ検査方法及び装置
CN109543531B (zh) 一种纤维提取和纤维视觉矫正的方法
CN108960222B (zh) 图像二值化方法、装置、设备及存储介质
US20200211199A1 (en) Image inspection method
CN114004777A (zh) 柔性屏的断裂线检测方法及装置、计算机设备及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20200728

RJ01 Rejection of invention patent application after publication