CN114694162A - 基于图像处理的***图像识别方法及*** - Google Patents

基于图像处理的***图像识别方法及*** Download PDF

Info

Publication number
CN114694162A
CN114694162A CN202210603229.9A CN202210603229A CN114694162A CN 114694162 A CN114694162 A CN 114694162A CN 202210603229 A CN202210603229 A CN 202210603229A CN 114694162 A CN114694162 A CN 114694162A
Authority
CN
China
Prior art keywords
character
corner
point
corner point
structural
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202210603229.9A
Other languages
English (en)
Other versions
CN114694162B (zh
Inventor
仇庆宇
李淼
巨东敏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Aisino Corp
Original Assignee
Shenzhen Aisino Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Aisino Corp filed Critical Shenzhen Aisino Corp
Priority to CN202210603229.9A priority Critical patent/CN114694162B/zh
Publication of CN114694162A publication Critical patent/CN114694162A/zh
Application granted granted Critical
Publication of CN114694162B publication Critical patent/CN114694162B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/11Region-based segmentation

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Character Input (AREA)

Abstract

本发明涉及图像处理技术领域,具体涉及一种基于图像处理的***图像识别方法及***。该方法包括:获得只包含机打内容的差值图像;根据差值图像中的边缘像素点的梯度直方图;选择一个预设梯度方向的边缘像素点作为角点,同时筛选获得第一角点;获得字符区域,字符区域为一个完整机打字符串的最小外接矩形;利用第一角点之间的结构参数对所有字符区域中的每个字符周围的第一角点进行筛选获得字符区域中所有字符的结构角点;根据字符区域中属于每个字符的结构角点的坐标对字符进行分割并识别。能够大大减少SIFT角点检测所保留的冗余角点,减少了所有像素点的重复运算和判断;进一步减少冗余角点对字符分割的影响,得到精确的字符分割信息。

Description

基于图像处理的***图像识别方法及***
技术领域
本发明涉及图像处理技术领域,具体涉及一种基于图像处理的***图像识别方法及***。
背景技术
随着科技的发展,现阶段内商业***主要利用机打***,传统的***统计工作是通过人工进行逐张***进行校对、审查,不仅效率低下,而且受人为因素的影响。现有技术中,利用计算机识别***号码和***代码,通过光学字符识别获取目标区域的字符识别信息,大大减少了***统计、审查工作任务。
现有技术中的问题在于:利用光学字符识别对***本身的图像质量有一定的要求。当***表面存在褶皱、偏移、虚印时,会造成光学字符识别错误、识别精度低等问题。针对上述问题,本发明提出了基于图像处理的***图像识别方法及***。利用***号码的角点结构特性等特征,对光学字符识别过程中可能出现的影响因素进行修正。
发明内容
为了解决上述技术问题,本发明的目的在于提供一种基于图像处理的***图像识别方法及***,所采用的技术方案具体如下:
第一方面,本发明一个实施例提供了一种基于图像处理的***图像识别方法:将机打***图像和标准***模板图像进行作差获得只包含机打内容的差值图像;获得差值图像中的边缘像素点,根据边缘像素点的梯度方向构建梯度直方图;利用梯度直方图选择一个预设梯度方向的边缘像素点作为角点;
根据角点邻域范围内像素点的不同梯度方向的数量,以及角点与邻域范围内像素点的梯度幅值的方差获得梯度复杂度;设定梯度阈值,梯度复杂度大于梯度阈值的角点为第一角点;对差值图像进行区域划分,获得字符区域,字符区域为一个完整机打字符串的最小外接矩形;
获得字符区域中的第一角点中的位于左上角的角点作为字符区域第一个字符的起始角点,基于起始角点与其最邻近的第一角点的水平方向的偏移距离、竖直方向上的偏移距离和偏移角度获得结构参数;设定结构阈值,将结构参数小于结构阈值的最邻近的第一角点剔除,该过程为角点剔除过程;若起始角点的最邻近的第一角点被剔除,获得与起始角点第二邻近的第一角点进行角点剔除过程,若起始角点的最邻近的第一角点未被剔除,获得与起始角点的最邻近的第一角点的最邻近的第一角点进行角点剔除过程,直至得到第一个字符的结构角点,获得字符区域中所有字符的结构角点;根据字符区域中属于每个字符的结构角点的坐标对字符进行分割,对分割后的字符进行识别。
优选地,根据边缘像素点的梯度方向构建梯度直方图包括:将360度均匀划分为预设数量的方向范围,统计属于每个方向范围的边缘像素点的个数构建梯度灰度直方图。
优选地,梯度复杂度为:
Figure 230778DEST_PATH_IMAGE002
其中,
Figure 100002_DEST_PATH_IMAGE003
表示角点的梯度复杂度;
Figure 639893DEST_PATH_IMAGE004
表示角点8邻域范围内像素点的不同梯度方向的数量;
Figure 100002_DEST_PATH_IMAGE005
表示角点8邻域范围内第i个像素点的梯度幅值;
Figure 366541DEST_PATH_IMAGE006
表示角点8邻域范围内像素点的梯度幅值的平均值;
Figure 100002_DEST_PATH_IMAGE007
表示角点8邻域范围的8个像素点。
优选地,对差值图像进行区域划分,获得字符区域包括:根据差值图像中每个完整的字符串中每个字符的最上方、最下方的第一角点以及完整字符串中最左侧和最右侧的第一角点获得每个完整的字符串的最小外接矩形,所述最小外接矩形为一个字符区域。
优选地,在获得结构参数之前还包括:在差值图像中建立直角坐标系,以x轴方向作为中心方向,向上和向下各旋转
Figure 468489DEST_PATH_IMAGE008
所得到的一个角度范围;以y轴方向作为中心方向,向左和向右各旋转
Figure 178956DEST_PATH_IMAGE008
得到的一个角度范围;将两个角度范围进行组合获得一个角度区域,获得该角度区域内的第一角点,记为待剔除角点。
优选地,结构参数为:
Figure 719659DEST_PATH_IMAGE010
其中,在差值图像中建立直角坐标系;
Figure 100002_DEST_PATH_IMAGE011
表示结构参数;
Figure 300813DEST_PATH_IMAGE012
表示起始角点在在x轴方向上,即水平方向上与其最邻近的第一角点之间的距离,为偏移距离;
Figure 100002_DEST_PATH_IMAGE013
表示起始角点在y轴方向上,即竖直方向上与其最邻近的第一角点之间的距离,为偏移距离;
Figure 573662DEST_PATH_IMAGE014
表示机打的字符在未发生偏移时字符水平方向上的宽度;
Figure 100002_DEST_PATH_IMAGE015
表示机打的字符在未发生偏移时字符竖直方向上的高度;
Figure 974688DEST_PATH_IMAGE016
表示起始角点与其最邻近的角点之间的偏移角度,偏移角度
Figure 519414DEST_PATH_IMAGE016
以x轴正方向为初始
Figure 100002_DEST_PATH_IMAGE017
,逆时针方向旋转来定义角度大小。
优选地,得到第一个字符的结构角点包括:获得字符区域中第一个字符的起始角点,计算起始角点与其最邻近的第一角点之间的结构参数,若结构参数小于结构阈值,则将最邻近的第一角点剔除,获取起始角点与第二邻近的第一角点之间的结构参数,若结构参数小于结构阈值,将第二邻近的第一角点剔除;
若结构参数大于结构阈值,则保留第二邻近的第一角点,计算与第二邻近的第一角点最邻近的第一角点与第二邻近的第一角点之间的结构参数,若结构参数大于结构阈值,将与第二邻近的第一角点最邻近的第一角点保留;
若起始角点与其最邻近的第一角点之间的结构参数大于结构阈值,则保留与起始角点最邻近的第一角点,计算与起始角点最邻近的第一角点与最邻近的第一角点的最邻近的第一角点之间的结构参数,若结构参数大于结构阈值,则将与最邻近的第一角点的最邻近的第一角点保留,其中剔除的第一角点都为待剔除角点中的角点。
优选地,在得到第一个字符的结构角点之后还包括:将第一个字符的结构节点两两之间用直线相连,若一个结构角点所对应的直线中不存在与第一个字符相交的直线,则将该结构角点不属于第一个字符的结构角点;获得不属于第一个字符的结构角点用于第二个字符的结构角点的判断。
优选地,根据字符区域中属于每个字符的结构角点的坐标对字符进行分割,对分割后的字符进行识别包括:根据一个字符区域中的每个字符的结构角点的坐标获得每个字符的最小外接矩形,完成对一个字符区域中每个字符的分割;基于字符的语义特征利用神经网络对分割后的字符进行识别。
第二方面,本发明另一个实施例提供了一种基于图像处理的***图像识别***,包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,所述计算机程序被处理器执行时实现所述一种基于图像处理的***图像识别方法的步骤。
本发明实施例至少具有如下有益效果:基于本发明充分的考虑了机打的字符的形状特性,对角点进行冗余过滤,利用梯度直方图的非主方向对边缘像素点进行滤除,同时,借助8邻域范围内的梯度复杂度,筛选有参考价值的角点,相较于现有技术有益效果在于能够大大减少SIFT角点检测所保留的冗余角点,同时,减少了所有像素点的重复运算和判断;本发明利用局部区域内的所有保留的角点之间所存在结构特征关系,对保留的角点进一步筛选,并根据筛选后的结构角点进行自适应窗口调节,实现对机打字符的分割,相较于现有技术有益效果在于能够进一步减少冗余角点对字符分割的影响,同时,能够通过自适应窗口得到精确的字符分割信息。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案和优点,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它附图。
图1为一种基于图像处理的***图像识别方法的方法流程图。
具体实施方式
为了更进一步阐述本发明为达成预定发明目的所采取的技术手段及功效,以下结合附图及较佳实施例,对依据本发明提出的一种基于图像处理的***图像识别方法及***,其具体实施方式、结构、特征及其功效,详细说明如下。在下述说明中,不同的“一个实施例”或“另一个实施例”指的不一定是同一实施例。此外,一或多个实施例中的特定特征、结构、或特点可由任何合适形式组合。
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。
下面结合附图具体的说明本发明所提供的一种基于图像处理的***图像识别方法及***的具体方案。
实施例1:
本发明的主要应用场景为:***图像识别场景,通过相机采集***表面图像,相机采用俯视视角,***应保持在固定位置,逐张进行图像采集,图像采集过程中,不存在光源造成的反光等光学影响。
请参阅图1,其示出了本发明一个实施例提供的一种基于图像处理的***图像识别方法的方法流程图,该方法包括以下步骤:
步骤一,将机打***图像和标准***模板图像进行作差获得只包含机打内容的差值图像;获得差值图像中的边缘像素点,根据边缘像素点的梯度方向构建梯度直方图;利用梯度直方图选择一个预设梯度方向的边缘像素点作为角点。
首先,通过相机获取所有待识别的***图像,并通过计算机对***图像进行存储。然后,对***图像进行灰度化处理,获取***图像灰度图像。并对图像进行噪声滤除,噪声滤除采用非线性的中值滤波器实现,最终获取预处理后的图像。
需要说明的是,机打***的机打内容和***模板是固定的,对应的机打字符和***模板的文字所在范围也是固定的,所以,通过机打***图像与标准***模板图像进行图像作差,获取差值图像。所述的,差值图像所保留的信息即为机打内容信息。当机打内容出现褶皱、偏移时,机打内容发生偏移,但是,由于标准***模板图像中并不包括机打内容,所以,差值图像中仍保留所有机打内容信息,本实施例不考虑偏移的机打内容与标准***模板图像中文字信息重叠的问题。同时,机打内容包括数字、汉字、英文字母和特殊符号等字符。
进一步的,利用角点检测算法对上述得到的差值图像进行角点检测,获取所有差值图像中所有角点的位置坐标。传统的角点检测算法一般有:SIFT角点检测、Harris角点检测等。SIFT角点检测算法是通过尺度空间进行高斯卷积,获取不同尺度空间的极值点,设定阈值选取关键点;然后,所选的关键点在不同梯度方向下的构建描述特征向量,选取具有旋转不变性的关键点,最终得到SIFT角点检测结果。
但是,由于SIFT角点检测算法是逐像素点检测,计算量较大,一般需要对局部区域像素点进行筛选,减少冗余计算;同时,SIFT角点检测所采用128维的描述符特征向量,会在局部区域内检测到部分冗余角点,该部分冗余角点可视为伪角点,对数字识别并不会造成太大的影响,需要结合机打内容的本身结构特征等特性对伪角点进一步筛选,提高SIFT检测的速度和识别精度,由于部分伪角点可能是因为倾斜导致,也可能是因为多余的角点导致,从而造成数字角点结构特征发生变化。
因此,需要对角点进行筛选,去除冗余的角点,对差值图像整体进行分析初步的对角点进行筛选,剔除一部分冗余的角点,具体过程如下:
利用Canny边缘检测算法获取差值图像中的边缘像素点位置,由于,本实施例的场景为固定相机位置和参数,所以,不存在尺度空间变化。传统的SIFT角点检测的思想为,利用传统算法的思想,将圆的360度角度范围内进行均匀的角度划分,获得的预设数量的方向范围,优选地,在本实施例中,每10度为一个方向范围,构建梯度直方图,通过梯度直方图的峰值位置进行主方向分析,与传统的SIFT角点检测不同的是,传统的SIFT角点检测利用梯度直方图的峰值点作为主方向和辅方向进行线性插值,获取所有像素点的主方向。但是,梯度直方图的主方向往往代表着大部分边缘像素点的梯度方向,这部分边缘像素点中除了角点像素点会包含大量的冗余边缘像素点。因此在本实施中,选取预设梯度方向的边缘像素点作为字符的角点,具体的,选取除了主方向和辅方向外的第Top K个方向范围内的边缘像素点作为角点的表征方向,也即是Top K个方向范围内的边缘像素点为角点,第Top K个方向范围表示将梯度直方图中每个方向范围对应的边缘像素点的数量按照从大到小的顺序进行排列,第K个方向范围内的边缘像素点。所述的,Top K中K值的大小需要通过后续的角点的结构特征进行自适应调节,此处预设梯度方向可设定为K=10对应的方向范围。至此获得了差值图像中的角点。
最后,因为***机打内容大多数为数字字符,数字字符的最优角点位置一般在边角处,由于机打数字的特殊性,边角处一般存在弧度,所以,可能包括更多的梯度方向,在梯度直方图上可能分布更广的范围,因此,选取预设梯度方向,也即是梯度直方图中第Top K=10个方向范围作为角点的表征方向能够滤掉大量的冗余边缘角点。
步骤二,根据角点邻域范围内像素点的不同梯度方向的数量,以及角点与邻域范围内像素点的梯度幅值的方差获得梯度复杂度;设定梯度阈值,梯度复杂度大于梯度阈值的角点为第一角点;对差值图像进行区域划分,获得字符区域,字符区域为一个完整机打字符串的最小外接矩形。
首先,为了进一步对步骤一中得到的角点中冗余的像素点进行判断,对每个角点的8邻域范围内的像素点进行梯度方向统计,获得每个角点8邻域范围内不同梯度方向的数量m,同时获得每个角点的8邻域内像素点的梯度幅值;计算每个角点的梯度复杂度:
Figure 751812DEST_PATH_IMAGE002
其中,
Figure 992301DEST_PATH_IMAGE003
表示角点的梯度复杂度;
Figure 411781DEST_PATH_IMAGE004
表示角点8邻域范围内像素点的不同梯度方向的数量;
Figure 763128DEST_PATH_IMAGE005
表示角点8邻域范围内第i个像素点的梯度幅值;
Figure 584453DEST_PATH_IMAGE006
表示角点8邻域范围内像素点的梯度幅值的平均值;
Figure 730264DEST_PATH_IMAGE007
表示角点8邻域范围的8个像素点。将角点的梯度复杂度进行归一化处理。
进一步的,设定梯度阈值
Figure 637040DEST_PATH_IMAGE018
,当角点的梯度复杂度大于梯度阈值时,保留该角点,当梯度复杂度小于梯度阈值时,将该角点进行剔除,保留下的角点记为第一角点。
最后,对差值图像进行区域划分,获得多个字符区域,其中每个字符区域包含一个机打的完整的字符串,一个机打的完整的字符串为表示的为***里表示同一个含义的字符串,例如***的打印日期为一个完整的字符串,根据差值图像中每个完整的字符串中每个字符的最上方、最下方的第一角点以及完整字符串中最左侧和最右侧的第一角点获得每个完整的字符串的最小外接矩形,所述最小外接矩形为一个字符区域。
步骤三,获得字符区域中的第一角点中的位于左上角的角点作为字符区域第一个字符的起始角点,基于起始角点与其最邻近的第一角点的水平方向的偏移距离、竖直方向上的偏移距离和偏移角度获得结构参数;设定结构阈值,将结构参数小于结构阈值的最邻近的第一角点剔除,该过程为角点剔除过程;若起始角点的最邻近的第一角点被剔除,获得与起始角点第二邻近的第一角点进行角点剔除过程,若起始角点的最邻近的第一角点未被剔除,获得与起始角点的最邻近的第一角点的最邻近的第一角点进行角点剔除过程,直至得到第一个字符的结构角点,获得字符区域中所有字符的结构角点;根据字符区域中属于每个字符的结构角点的坐标对字符进行分割,对分割后的字符进行识别。
首先,获得每个字符区域后,需要在每个字符区域内对每个字符的进行分析,获得所有第一角点中能够表征每个字符的角点。获得字符区域位于左上角的第一角点,将该角点记为字符区域内第一个字符的起始角点;同时,在差值图像中建立直角坐标系,以x轴方向作为中心方向,向上和向下各旋转
Figure 526499DEST_PATH_IMAGE008
所得到的一个角度范围;以y轴方向作为中心方向,向左和向右各旋转
Figure 467910DEST_PATH_IMAGE008
得到的一个角度范围;将两个角度范围进行组合获得一个角度区域,获得该角度区域内的第一角点,记为待剔除角点。
利用第一个字符的起始角点与待剔除角点的关系将需要剔除的第一角点剔除,获得能够表征第一个字符的角点,获得与第一个字符的起始角点最邻近的第一角点a的坐标,计算起始角点与最邻近的第一角点a的结构参数:
Figure 846938DEST_PATH_IMAGE010
其中,在差值图像中建立直角坐标系;
Figure 241011DEST_PATH_IMAGE011
表示结构参数;
Figure 934160DEST_PATH_IMAGE012
表示起始角点在在x轴方向上,即水平方向上与其最邻近的第一角点之间的距离,为偏移距离;
Figure 198919DEST_PATH_IMAGE013
表示起始角点在y轴方向上,即竖直方向上与其最邻近的第一角点之间的距离,为偏移距离;
Figure 952112DEST_PATH_IMAGE014
表示机打的字符在未发生偏移时字符水平方向上的宽度;
Figure 833480DEST_PATH_IMAGE015
表示机打的字符在未发生偏移时字符竖直方向上的高度;
Figure 127058DEST_PATH_IMAGE016
表示起始角点与其最邻近的角点之间的偏移角度,偏移角度
Figure 777482DEST_PATH_IMAGE016
以x轴正方向为初始
Figure 438927DEST_PATH_IMAGE017
,逆时针方向旋转来定义角度大小。同时对结构参数进行归一化。
进一步的,设置结构阈值
Figure DEST_PATH_IMAGE019
,在待剔除角点中剔除第一角点的过程是一个迭代的过程,具体如下:若结构参数小于结构阈值,则将最邻近的第一角点a剔除,若结构参数大于结构阈值,则将最邻近的第一角点a保留作为第一个字符的结构角点,这样的一个过程为一个角点剔除过程;当最邻近的第一角点a被剔除后,获得与起始角点第二邻近的第一角点b,对起始角点和第二邻近的第一角点b进行角点剔除过程,判断第二邻近的第一角点b是否需要剔除,若剔除了则继续寻找与起始角点第三邻近的第一角点c进行角点剔除过程。
同时,当结构参数大于结构阈值,则将最邻近的第一角点a保留作为第一个字符的结构角点后,获得与最邻近的第一角点a的最邻近的第一角点A,对于这两个角点进行角点去除过程,判断与最邻近的第一角点a的最邻近的第一角点A是否需要剔除;若与最邻近的第一角点a的最邻近的第一角点A保留下来,则获得与最邻近的第一角点a的最邻近的第一角点A的最邻近的第一角点B,对于这两个角点进行角点剔除过程,判断与最邻近的第一角点a的最邻近的第一角点A的最邻近的第一角点B是否需要剔除。
进行完上述的过程后,获得第一个字符的结构角点,保留下来的结构角点为与起始角点位置存在较大距离偏移或者角度偏移的相邻的第一角点;第一个字符的这些结构角点能够表征第一个字符的信息,但是里面还会有不属于第一个字符的结构角点,进一步的需要把这些第一个字符的结构角点找出来,用于后面第二个字符的结构角点的获取。将第一个字符的结构节点两两之间用直线相连,若一个结构角点所对应的直线中不存在与第一个字符相交的直线,则将该结构角点不属于第一个字符的结构角点;获得不属于第一个字符的结构角点用于第二个字符的结构角点的判断。同样的,获得第二个字符的结构角点后一样需要将这些结构角点进行两两的相连进行判断,得到不属于第二个字符的结构角点用于第三个字符的结构角点的判断。
在进行第一个字符的结构判断时,结束的条件为不再出现满足条件的第一角点为止,此时第一个字符的结构角点筛选结束,然后再通过将结构角点进行两两相连进行判断即可。需要说明的是,在进行第二个字符的结构角点的获取时,仍需要一个第二个字符对应的起始角点,此时因为第一个字符的结构角点已经得到了,利用与第一个字符的结构角点近邻的第二个字符的左上角的第一角点作为第二个字符的起始角点进行第二字符的结构角点的筛选;对于一个字符区域来说,需要将其中的所有字符的结构角点筛选出来。
至此获得所有字符区域中所有机打的字符的结构角点。
另外,对于步骤一中的预设梯度方向,也即是梯度直方图中第TOP K个梯度方向,这个K值可由随着***图像的识别过程进行不断的优化更新,进行数据统计,获得多张差值图像在各个字符区域的每个字符的结构角点,选取机打的字符结构角点出现次数最大的梯度方向作为,TOP K中的K的值,虽然步骤一中的TOP K是对于一整张的差值图像来说的,但在获得K值的最优值的时候可以针对每一个字符区域进行分析,获得的每个字符区域对应的最优的K值。
最后,获得每个字符的结构角点后,利用每个字符的结构角点的坐标获得单个字符的自适应的窗口的大小,具体的,选取单个字符中所有结构角点构建最大矩形框,作为自适应的窗口的大小,设置自适应的窗口进行滑动,将字符区域进行分割,根据分割后的图像进行字符的识别,获取各个字符的语义特征,字符的识别可通过字符识别神经网络进行实现,字符识别的网络为现有技术,在此不过多赘述,例如CNN网络。
实施例2:
本实施例提供了一种基于图像处理的***图像识别***实施例,包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,所述计算机程序被处理器执行时实现一种废钢破碎料场盘库方法的步骤。由于实施例1已经对一种基于图像处理的***识别方法进行了详细的介绍,此处不再过多介绍。
需要说明的是:上述本发明实施例先后顺序仅仅为了描述,不代表实施例的优劣。且上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种基于图像处理的***图像识别方法,其特征在于,该方法包括:将机打***图像和标准***模板图像进行作差获得只包含机打内容的差值图像;获得差值图像中的边缘像素点,根据边缘像素点的梯度方向构建梯度直方图;利用梯度直方图选择一个预设梯度方向的边缘像素点作为角点;
根据角点邻域范围内像素点的不同梯度方向的数量,以及角点与邻域范围内像素点的梯度幅值的方差获得梯度复杂度;设定梯度阈值,梯度复杂度大于梯度阈值的角点为第一角点;对差值图像进行区域划分,获得字符区域,字符区域为一个完整机打字符串的最小外接矩形;
获得字符区域中的第一角点中的位于左上角的角点作为字符区域第一个字符的起始角点,基于起始角点与其最邻近的第一角点的水平方向的偏移距离、竖直方向上的偏移距离和偏移角度获得结构参数;设定结构阈值,将结构参数小于结构阈值的最邻近的第一角点剔除,该过程为角点剔除过程;若起始角点的最邻近的第一角点被剔除,获得与起始角点第二邻近的第一角点进行角点剔除过程,若起始角点的最邻近的第一角点未被剔除,获得与起始角点的最邻近的第一角点的最邻近的第一角点进行角点剔除过程,直至得到第一个字符的结构角点,获得字符区域中所有字符的结构角点;根据字符区域中属于每个字符的结构角点的坐标对字符进行分割,对分割后的字符进行识别。
2.根据权利要求1所述的一种基于图像处理的***图像识别方法,其特征在于,所述根据边缘像素点的梯度方向构建梯度直方图包括:将360度均匀划分为预设数量的方向范围,统计属于每个方向范围的边缘像素点的个数构建梯度灰度直方图。
3.根据权利要求1所述的一种基于图像处理的***图像识别方法,其特征在于,所述梯度复杂度为:
Figure 230480DEST_PATH_IMAGE002
其中,
Figure DEST_PATH_IMAGE003
表示角点的梯度复杂度;
Figure 350883DEST_PATH_IMAGE004
表示角点8邻域范围内像素点的不同梯度方向的数量;
Figure DEST_PATH_IMAGE005
表示角点8邻域范围内第i个像素点的梯度幅值;
Figure 409581DEST_PATH_IMAGE006
表示角点8邻域范围内像素点的梯度幅值的平均值;
Figure DEST_PATH_IMAGE007
表示角点8邻域范围的8个像素点。
4.根据权利要求1所述的一种基于图像处理的***图像识别方法,其特征在于,所述对差值图像进行区域划分,获得字符区域包括:根据差值图像中每个完整的字符串中每个字符的最上方、最下方的第一角点以及完整字符串中最左侧和最右侧的第一角点获得每个完整的字符串的最小外接矩形,所述最小外接矩形为一个字符区域。
5.根据权利要求1所述的一种基于图像处理的***图像识别方法,其特征在于,在所述获得结构参数之前还包括:在差值图像中建立直角坐标系,以x轴方向作为中心方向,向上和向下各旋转
Figure 742474DEST_PATH_IMAGE008
所得到的一个角度范围;以y轴方向作为中心方向,向左和向右各旋转
Figure 25688DEST_PATH_IMAGE008
得到的一个角度范围;将两个角度范围进行组合获得一个角度区域,获得该角度区域内的第一角点,记为待剔除角点。
6.根据权利要求1所述的一种基于图像处理的***图像识别方法,其特征在于,所述结构参数为:
Figure 316992DEST_PATH_IMAGE010
其中,在差值图像中建立直角坐标系;
Figure DEST_PATH_IMAGE011
表示结构参数;
Figure 521708DEST_PATH_IMAGE012
表示起始角点在x轴方向上,即水平方向上与其最邻近的第一角点之间的距离,为偏移距离;
Figure DEST_PATH_IMAGE013
表示起始角点在y轴方向上,即竖直方向上与其最邻近的第一角点之间的距离,为偏移距离;
Figure 658291DEST_PATH_IMAGE014
表示机打的字符在未发生偏移时字符水平方向上的宽度;
Figure DEST_PATH_IMAGE015
表示机打的字符在未发生偏移时字符竖直方向上的高度;
Figure 264853DEST_PATH_IMAGE016
表示起始角点与其最邻近的角点之间的偏移角度,偏移角度
Figure 727059DEST_PATH_IMAGE016
以x轴正方向为初始
Figure DEST_PATH_IMAGE017
,逆时针方向旋转来定义角度大小。
7.根据权利要求1所述的一种基于图像处理的***图像识别方法,其特征在于,所述得到第一个字符的结构角点包括:获得字符区域中第一个字符的起始角点,计算起始角点与其最邻近的第一角点之间的结构参数,若结构参数小于结构阈值,则将最邻近的第一角点剔除,获取起始角点与第二邻近的第一角点之间的结构参数,若结构参数小于结构阈值,将第二邻近的第一角点剔除;
若结构参数大于结构阈值,则保留第二邻近的第一角点,计算与第二邻近的第一角点最邻近的第一角点与第二邻近的第一角点之间的结构参数,若结构参数大于结构阈值,将与第二邻近的第一角点最邻近的第一角点保留;
若起始角点与其最邻近的第一角点之间的结构参数大于结构阈值,则保留与起始角点最邻近的第一角点,计算与起始角点最邻近的第一角点与最邻近的第一角点的最邻近的第一角点之间的结构参数,若结构参数大于结构阈值,则将与最邻近的第一角点的最邻近的第一角点保留,其中剔除的第一角点都为待剔除角点中的角点。
8.根据权利要求1所述的一种基于图像处理的***图像识别方法,其特征在于,在所述得到第一个字符的结构角点之后还包括:将第一个字符的结构节点两两之间用直线相连,若一个结构角点所对应的直线中不存在与第一个字符相交的直线,则将该结构角点不属于第一个字符的结构角点;获得不属于第一个字符的结构角点用于第二个字符的结构角点的判断。
9.根据权利要求1所述的一种基于图像处理的***图像识别方法,其特征在于,所述根据字符区域中属于每个字符的结构角点的坐标对字符进行分割,对分割后的字符进行识别包括:根据一个字符区域中的每个字符的结构角点的坐标获得每个字符的最小外接矩形,完成对一个字符区域中每个字符的分割;基于字符的语义特征利用神经网络对分割后的字符进行识别。
10.一种基于图像处理的***图像识别***,包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至9任一项所述一种基于图像处理的***图像识别方法的步骤。
CN202210603229.9A 2022-05-31 2022-05-31 基于图像处理的***图像识别方法及*** Active CN114694162B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210603229.9A CN114694162B (zh) 2022-05-31 2022-05-31 基于图像处理的***图像识别方法及***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210603229.9A CN114694162B (zh) 2022-05-31 2022-05-31 基于图像处理的***图像识别方法及***

Publications (2)

Publication Number Publication Date
CN114694162A true CN114694162A (zh) 2022-07-01
CN114694162B CN114694162B (zh) 2022-08-16

Family

ID=82130951

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210603229.9A Active CN114694162B (zh) 2022-05-31 2022-05-31 基于图像处理的***图像识别方法及***

Country Status (1)

Country Link
CN (1) CN114694162B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117252886A (zh) * 2023-09-11 2023-12-19 广东源恒软件科技有限公司 一种基于图像分割的***识别方法及***

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014107945A1 (zh) * 2013-01-11 2014-07-17 广州广电运通金融电子股份有限公司 字符识别方法
US20170213326A1 (en) * 2016-01-26 2017-07-27 Wipro Limited Method and system for processing an image extracted from a document
CN111444948A (zh) * 2020-03-21 2020-07-24 哈尔滨工程大学 一种图像特征提取与匹配方法
CN114120051A (zh) * 2021-11-11 2022-03-01 易思维(杭州)科技有限公司 一种胶条边缘点的筛选方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014107945A1 (zh) * 2013-01-11 2014-07-17 广州广电运通金融电子股份有限公司 字符识别方法
US20170213326A1 (en) * 2016-01-26 2017-07-27 Wipro Limited Method and system for processing an image extracted from a document
CN111444948A (zh) * 2020-03-21 2020-07-24 哈尔滨工程大学 一种图像特征提取与匹配方法
CN114120051A (zh) * 2021-11-11 2022-03-01 易思维(杭州)科技有限公司 一种胶条边缘点的筛选方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
AWRANGJEB M ET AL: "Robust image corner detection based on the chord-to-Point distance accumulationtechnique", 《IEEE TRANSACTIONS ON MULTIEDIA》 *
田子怡等: "基于多尺度Gabor滤波器的角点检测", 《国外电子测量技术》 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117252886A (zh) * 2023-09-11 2023-12-19 广东源恒软件科技有限公司 一种基于图像分割的***识别方法及***

Also Published As

Publication number Publication date
CN114694162B (zh) 2022-08-16

Similar Documents

Publication Publication Date Title
CN107609549B (zh) 一种自然场景下证件图像的文本检测方法
CN106407883B (zh) 一种复杂表格及其内部手写数字识别方法
Lazzara et al. Efficient multiscale Sauvola’s binarization
CN104751142B (zh) 一种基于笔划特征的自然场景文本检测方法
US9158986B2 (en) Character segmentation device and character segmentation method
CN112183038A (zh) 一种表格识别套打方法、计算机设备及计算机可读存储介质
CN111832659B (zh) 一种基于特征点提取算法检测的激光标刻***及方法
WO2007127085A1 (en) Generating a bitonal image from a scanned colour image
CN111353961B (zh) 一种文档曲面校正方法及装置
CN116071763B (zh) 基于文字识别的教辅图书智能校编***
CN110598566A (zh) 图像处理方法、装置、终端和计算机可读存储介质
CN107195069A (zh) 一种人民币冠字号自动识别方法
CN114694162B (zh) 基于图像处理的***图像识别方法及***
CN113971792A (zh) 交通标志牌的字符识别方法、装置、设备和存储介质
CN108256518B (zh) 文字区域检测方法及装置
CN113033558A (zh) 一种用于自然场景的文本检测方法及装置、存储介质
CN116052152A (zh) 一种基于轮廓检测和深度神经网络的车牌识别***
CN112699704B (zh) 一种条形码的检测方法、装置、设备、存储装置
CN114140794A (zh) 一种基于ocr的通用图像校正方法
CN112418210B (zh) 一种杆塔巡检信息智能分类方法
CN113033562A (zh) 一种图像处理方法、装置、设备及存储介质
CN113537216B (zh) 一种点阵字体文本行倾斜校正方法及装置
Bhaskar et al. Implementing optical character recognition on the android operating system for business cards
Sherkat et al. Use of colour for hand-filled form analysis and recognition
JP2005250786A (ja) 画像認識方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant