CN102750530A - 一种字符识别方法及装置 - Google Patents

一种字符识别方法及装置 Download PDF

Info

Publication number
CN102750530A
CN102750530A CN2012101777653A CN201210177765A CN102750530A CN 102750530 A CN102750530 A CN 102750530A CN 2012101777653 A CN2012101777653 A CN 2012101777653A CN 201210177765 A CN201210177765 A CN 201210177765A CN 102750530 A CN102750530 A CN 102750530A
Authority
CN
China
Prior art keywords
character
pixel
normalization
value
edge
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2012101777653A
Other languages
English (en)
Other versions
CN102750530B (zh
Inventor
王海峰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
He Jiangtao
Original Assignee
XINZHENG ELECTRONIC TECHNOLOGY (BEIJING) Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by XINZHENG ELECTRONIC TECHNOLOGY (BEIJING) Co Ltd filed Critical XINZHENG ELECTRONIC TECHNOLOGY (BEIJING) Co Ltd
Priority to CN201210177765.3A priority Critical patent/CN102750530B/zh
Publication of CN102750530A publication Critical patent/CN102750530A/zh
Application granted granted Critical
Publication of CN102750530B publication Critical patent/CN102750530B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)

Abstract

本发明公开了一种字符识别方法及装置,该方法针对待识别字符的识别和模板创建时,进行归一化处理、确定字符边缘信息图,并确定边缘梯度数组中每个数值的取值,当确定了边缘梯度数组中相应位置的赋值后,根据待识别字符对应边缘梯度数组与每个字符对应的每个模板之间的匹配,确定匹配距离,根据匹配距离识别字符。由于本发明中根据字符中每个像素点的梯度方向,作为边缘梯度数组中的相应数值,而梯度方向具有较强的抗干扰能力,因此该字符识别方法具有较强的鲁棒性,而在识别的过程中与每个字符对应的每个模板进行匹配,将匹配距离最小值对应的字符作为识别结果,因此可以避免字符单模板匹配的鲁棒性差的问题,提高了该匹配方法的适用范围。

Description

一种字符识别方法及装置
技术领域
本发明涉及计算机图像处理技术领域,尤其涉及一种字符识别方法及装置。
背景技术
随着社会经济的发展,车辆的数量不断增加,因此通过计算机信息化、智能化的方案管理车辆成为必然。现有技术中车牌识别在智能交通领域扮演者重要的角色,其在交通流量监测、高速公路卡口收费、闯红灯违章车辆监控及社区自动收费***中具有广泛的应用。
现有的车牌类型识别的过程中主要包括:车牌定位、车牌矫正、车牌字符分割和字符识别等几个主要步骤。字符识别为车牌识别中的核心技术,将字符序列识别出后,需要通过字符识别技术将字符序列中的每个字符识别出。
目前采用的车牌字符识别算法包括:模板匹配算法和机器学习算法。其中,机器学习算法需要学习大量的字符样本,并且需要经过长时间的训练,计算量大并且效率低。模板匹配算法相对机器学习算法实现简单,但是其鲁棒性较差,这是因为模板匹配算法就是将识别字符与所存储的标准字符模板集合中的每个模板进行比较,然后选择与之距离最相近的模板作为识别结果。模板匹配方法多利用了字符的轮廓、网格、投影等统计特征,因此会导致相似字符区分能力差以及因为特征数据维数过大而导致识别速度慢等问题,对于有变形、位移、倾斜的待识别字符,模板匹配方法很容易产生误识别,识别准确性较差。
发明内容
有鉴于此,本发明实施例提供一种字符识别方法及装置,用以解决现有技术字符识别过程中鲁棒性差的问题。
本发明提供一种字符识别方法,所述方法包括:
对包含待识别字符信息的图片进行二值化处理,识别二值化处理后该图片中字符的边界,根据确定的边界,在包含待识别字符信息的样本图片中截取待识别字符区域,对该截取的字符区域进行二值化、归一化处理;
在归一化处理后的待识别字符区域中,识别像素值的跳变,根据跳变时白色像素点的位置,在字符边缘信息图中相应像素点的位置赋值255,其他像素点的位置赋其他值,其中该字符边缘信息图与该归一化后的字符区域大小相等;
识别该字符边缘信息图中每个像素点的像素值,当识别到该字符边缘信息图中像素点的像素值为255时,计算该像素点的梯度值,并确定归属方向,采用该归属方向值对边缘梯度数组中相应位置赋值,该数组的其他位置赋值为-1;
将该边缘梯度数组与保存的每个字符对应的每个模板进行匹配,确定匹配距离,将匹配距离最小值对应的字符作为识别结果。
本发明提供一种字符识别装置,所述装置包括:
归一化模块,用于对包含待识别字符信息的图片进行二值化处理,识别二值化处理后该图片中待识别字符的边界,根据确定的边界,在包含待识别字符信息的样本图片中截取待识别字符区域,对该截取的字符区域进行二值化、归一化处理;
边缘信息确定模块,用于在归一化处理后的待识别字符区域中,识别像素值的跳变,根据跳变时白色像素点的位置,在字符边缘信息图中相应像素点的位置赋值255,其他像素点的位置赋其他值,其中该字符边缘信息图与该归一化后的字符区域大小相等;
梯度方向确定模块,用于识别该字符边缘信息图中每个像素点的像素值,当识别到该字符边缘信息图中像素点的像素值为255时,计算该像素点的梯度值,并确定归属方向,采用该归属方向值对边缘梯度数组中相应位置赋值,该数组的其他位置赋值为-1;
匹配识别模块,用于将该边缘梯度数组与保存的每个模板进行匹配,确定匹配距离,将匹配距离最小值对应的字符作为识别结果。
本发明提供了一种字符识别方法及装置,该方法针对待识别字符识别和模板创建时,进行归一化处理、确定字符边缘信息图,并确定边缘梯度数组中每个数值的取值,当确定了边缘梯度数组中相应位置的赋值后,根据待识别字符对应边缘梯度数组与每个字符对应的每个模板之间的匹配,确定匹配距离,根据匹配距离识别字符。由于在本发明中根据字符中每个像素点的梯度方向,作为边缘梯度数组中的相应数值,而梯度方向具有较强的抗干扰能力,因此本字符识别方法具有较强的鲁棒性,并且在识别的过程中与每个字符对应的每个模板进行匹配,根据匹配距离,将匹配距离最小值对应的字符作为识别结果,因此可以避免字符单模板匹配的鲁棒性差的问题,提高了该匹配方法的适用范围。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本发明的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1为本发明提供的字符识别过程示意图;
图2为本发明提供的字符模板创建过程中的归一化处理的过程;
图3为本发明提供的字符模板创建过程中的特征提取过程;
图4为本发明提供的字符识别装置的结构示意图。
具体实施方式
本发明实施例为了提高字符识别的效率及精度,提供了一种字符识别方法及装置。
下面结合说明书附图,对本发明进行详细说明。
图1为本发明提供的字符识别过程示意图,该过程包括以下步骤:
S101:对包含待识别字符信息的图片进行二值化处理,识别二值化处理后该图片中待识别字符的边界,根据确定的边界,在包含待识别字符信息的样本图片中截取待识别字符区域,对该截取的字符区域进行二值化、归一化处理。
S102:在归一化处理后的待识别字符区域中,识别像素值的跳变,根据跳变时白色像素点的位置,在字符边缘信息图中相应像素点的位置赋值255,其他像素点的位置赋其他值,其中该字符边缘信息图与该归一化后的字符区域大小相等。
S103:识别该字符边缘信息图中每个像素点的像素值,当识别到该字符边缘信息图中像素点的像素值为255时,计算该像素点的梯度值,并确定归属方向,采用该归属方向值对边缘梯度数组中相应位置赋值,该数组的其他位置赋值为-1。
S104:将该边缘梯度数组与保存的每个字符对应的每个模板进行匹配,确定匹配距离,将匹配距离最小值对应的字符作为识别结果。
在对字符识别之前还包括针对每个字符,创建该字符的多个模板,在创建每个字符的每个模板时,也需要进行归一化处理、确定字符边缘信息图,并确定边缘梯度数组中每个数值的取值,即模板的创建过程与在字符识别过程中进行的步骤相同。当确定了模板对应的边缘梯度数组中相应位置的赋值后,采用相同的方法确定待识别字符对应的边缘梯度数组中每个相应位置的赋值,根据待识别字符对应边缘梯度数组与模板之间的匹配,确定匹配距离,根据匹配距离识别字符。
由于在本发明中由于根据字符中每个像素点的梯度方向,作为边缘梯度数组中的相应数值,而梯度方向具有较强的抗干扰能力,因此本字符识别方法具有较强的鲁棒性,并且在识别的过程中与每个字符对应的每个模板进行匹配,根据匹配距离,将匹配距离最小值对应的字符作为识别结果,因此可以避免字符单模板匹配的鲁棒性差的问题,提高了该匹配方法的适用范围。
下面通过具体的实施例,对本发明字符识别过程进行详细说明。
为了提高字符识别的准确性,并提高字符识别的效率,需要针对每个字符保存了多个模板,每个模板需要具有代表性,模板之间的差异比较大。在创建并保存字符的模板时,需要对字符区域进行归一化处理,并提取该归一化处理后字符区域的特征。
图2为本发明提供的字符模板创建过程中的归一化处理的过程,该过程包括以下步骤:
S201:将包含字符信息的样本图片进行二值化处理。
一般包括字符信息的样本图片为彩色图片,在对该彩色图片进行二值化之前,需要首先将该彩色图片转换为灰度图片,之后采用相应的二值化算法对该灰度图片进行二值化处理,在本发明中可以采用otsu二值化算法对灰度图片进行二值化处理。
S202:从二值化处理后的图片的四个边界开始,分别向图片内部搜索;当搜索到该图片中的白色像素点时,确定该白色像素点位于该字符的边界;根据从每个边界方向扫描到的白色像素点的位置,确定该字符的边界。
在本发明中为了在该二值化处理后的图片中检测字符所在的区域,分别从该二值化处理后的图片的四个边界开始,向图片内部扫描,即从该二值化处理后的图片的上、下、左、右四个方向分别向图片内部扫描。具体的当从上、下两个方向首次识别到白色像素点时,则认为该白色像素点所在的行为字符的上、下边界所在的行,当从左、右两个方向首次识别到白色像素点时,则认为该白色像素点所在的列为该字符的左、右边界所在的列。
S203:根据确定的字符的边界,在包含字符信息的样本图片中截取字符区域。
当确定了构成字符边界的行和列后,即可在包含字符信息的样本图片中截取字符区域的图片了。
S204:对截取的字符区域进行二值化处理,并按照设置的大小,对该二值化处理后的图片进行归一化处理。
当从彩色图片中截取了该字符区域后,对该字符区域对应的图片仍然为彩色图片,将字符区域的彩色图片转换为灰度图片,并对该灰度图片采用otsu二值化算法进行二值化处理,之后根据设置的大小,例如在本发明中该设定的大小可以为宽24,高48,对该二值化后的图片进行归一化处理,并且同时对该转换后的灰度图片,按照该设置的大小进行归一化处理。从而得到归一化后的二值图和灰度图。
图3为本发明提供的字符模板创建过程中的特征提取过程,该过程包括以下步骤:
S301:在归一化后的字符区域中,识别像素点像素值的跳变。
该归一化后的字符区域为二值字符图,该二值字符图的宽度为W,高度为H。在该二值字符图中识别像素值的跳变,即两个相邻像素点的像素值由1变为0,或由0变为1的情况。
S302:根据像素值跳变时白色像素点的位置,在字符边缘信息图中将与该白色像素点位置对应的像素点赋值为255,否则,赋值为其他值,其中该字符边缘信息图与该归一化后的字符区域大小相等。
该字符边缘信息图与该归一化后的字符区域大小相等,即该字符边缘信息图与二值字符图的大小相等,即行数、列数、像素点的数目相等。在确定该字符边缘信息图中每个像素点的像素值时,需要识别到的该而二值字符图中像素值的跳变,根据跳变时白色像素点对应的位置,在字符边缘信息图中将与该白色像素点位置对应的像素点赋值为255,该字符边缘信息图中其他像素点的位置赋值为其他值,例如可以为0。
S303:识别该字符边缘信息图中每个像素点的像素值,当识别到该字符边缘信息图中像素点的像素值为255时,计算该像素点的梯度值,并确定归属方向。
S304:将模板中与该像素点位置对应的位置赋值为该梯度方向角,其他位置赋值为-1。
在本发明中创建一个和字符边缘信息图高度和宽度相等模板,模板也可以认为是一个与该字符边缘信息图高度和宽度相等的二维数组。在确定该模板中每个位置的赋值时,扫描该字符边缘信息图,当扫描到像素点的像素值为其他值时,例如为0时,则将与该像素点位置对应的该模板中的相应位置赋值为-1;当扫描到像素点的像素值为255时,即扫描到白点时,则在归一化后的灰色图中与该像素点对应的位置上,根据下式计算该像素点的梯度值:
Gradient=dy/dx
其中,dy=g(i,j+1)-g(i,j-1),dx=g(i+1,j)-g(i-1,j),g(i,j)在归一化后的灰度图像中该像素点对应位置的灰度值,i表示该像素点所在的行,j表示该像素点所在的列,Gradient为计算的该像素点的梯度值。
将0度到360度的角度范围8等分,每一等份对应一个梯度方向,分别采用1~8来标记,根据计算出的该像素点的梯度值,计算该像素点的梯度方向角,根据计算的该梯度方向角,确定该梯度方向角归属的方向。
在针对每个字符创建了多个模板后,将每个模板保存在模板库中与每个字符对应的位置,即在模板库中针对每个字符保存了多个模板。
在针对字符进行识别时,当获取了包含待识别字符的图片后,依据上述模板的创建过程,将该图片转换为灰度图,并采用相应的二值化算法,对转换后的图片进行二值化处理,该二值化算法与模板创建过程中的二值化算法相同。
在二值化处理后的图片中,分别从图片的四个方向开始向图片内部扫描,识别每个方向上第一个白色像素点的位置,根据每个方向上识别到的白色像素点的位置,确定该待识别字符的边界;根据确定的字符边界,从该待识别字符的彩色图片中截取该待识别字符区域。
将截取的待识别字符区域转换为灰度图,并采用相应的二值化算法,对该灰度图进行二值化处理,并按照设置的大小,对该灰度图及二值化处理后的待识别字符区域进行归一化处理,其中该设置的大小,与模板创建过程中设置的大小相同,例如都是宽24,高48等,并且这里采用的二值化算法也与模板创建中归一化过程采用的二值化算法相同。
对二值化后该待识别字符区域进行归一化处理后,识别该归一化后像素点的像素值的跳变,当识别到像素值出现从0到1,或者从1到0的跳变时,根据跳变时白色像素点的位置,在字符边缘信息图中相应像素点的位置赋值为255,其余像素点的位置赋值为0。
识别赋值后字符边缘信息图中每个像素点的像素值,当识别到像素值为255的像素点时,根据归一化后的灰度图中该像素点与其相邻像素点的灰度值,计算该像素点的梯度值,根据计算的该像素点的梯度值,确定该像素点的梯度方向。
根据确定的该像素点的梯度方向,在0度到360度角度范围内等分的8个方向中,确定该梯度方向归属的方向,将其归属的方向作为待识别字符边缘梯度数组中对应该像素点位置的数值,该数组的其他位置赋值为-1。
将该边缘梯度数组与保存的每个字符对应的每个模板进行匹配,确定与每个模板的匹配距离,具体在确定匹配距离时,根据下式:
D = Σ i = 0 H Σ j = 0 W d ( i , j ) S
其中, d ( i , j ) = 0 if ( c ( i , j ) = = t ( i , j ) ) 5 if ( c ( i , j ) ! = t ( i , j ) ) , c(i,j)为待识别字符的边缘梯度数组中第i行,第j列的数值,t(i,j)为模板中第i行,第j列的数值,H为归一化后模板的高度,W为归一化后模板的宽度,S的数值根据待识别字符的边缘梯度数组中不等于-1的次数,即模板每个位置不等于-1的次数和确定。
图4为本发明提供的字符识别装置的结构示意图,该装置包括:
归一化模块41,用于对包含待识别字符信息的图片进行二值化处理,识别二值化处理后该图片中待识别字符的边界,根据确定的边界,在包含待识别字符信息的样本图片中截取待识别字符区域,对该截取的字符区域进行二值化、归一化处理;
边缘信息确定模块42,用于在归一化处理后的待识别字符区域中,识别像素值的跳变,根据跳变时白色像素点的位置,在字符边缘信息图中相应像素点的位置赋值255,其他像素点的位置赋其他值,其中该字符边缘信息图与该归一化后的字符区域大小相等;
梯度方向确定模块43,用于识别该字符边缘信息图中每个像素点的像素值,当识别到该字符边缘信息图中像素点的像素值为255时,计算该像素点的梯度值,并确定归属方向,采用该归属方向值对边缘梯度数组中相应位置赋值,该数组的其他位置赋值为-1;
匹配识别模块44,用于将该边缘梯度数组与保存的每个字符对应的每个模板进行匹配,确定匹配距离,将匹配距离最小值对应的字符作为识别结果。
所述归一化模块41,还用于在创建模板时,对包含字符信息的样本图片进行二值化处理,识别二值化处理后该图片中字符的边界;根据确定的字符边界,在包含字符信息的样本图片中截取字符区域,对该截取的字符区域进行二值化、归一化处理;
所述边缘信息确定模块42,还用于在创建模板时,在归一化处理后的字符区域中,识别像素值的跳变,根据跳变时白色像素点的位置,在字符边缘信息图中相应像素点的位置赋值255,其他像素点的位置赋其他值,其中该字符边缘信息图与该归一化后的字符区域大小相等;
所述梯度方向确定模块43,还用于在创建模板时,识别该字符边缘信息图中每个像素点的像素值,当识别到该字符边缘信息图中像素点的像素值为255时,计算该像素点的梯度值,并确定归属方向,将模板中与该像素点位置对应的位置赋值为方向值,其他位置赋值为-1。
所述归一化模块41,具体用于从二值化处理后的图片的四个边界开始,分别向图片内部搜索;当搜索到该图片中的白色像素点时,确定该白色像素点位于该字符的边界;根据从每个边界方向扫描到的白色像素点的位置,确定该字符的边界。
所述归一化模块41,还用于将该截取的字符区域转换为灰度图,并进行归一化处理;
所述梯度方向确定模块43,用于在归一化后的灰色图中与该像素点对应的位置上,根据下式计算该像素点的梯度值:
Gradient=dy/dx
其中,dy=g(i,j+1)-g(i,j-1),dx=g(i+1,j)-g(i-1,j),g(i,j)在归一化后的灰度图像中该像素点对应位置的灰度值,i表示该像素点所在的行,j表示该像素点所在的列,Gradient为计算的该像素点的梯度值;
根据计算的该梯度值,计算梯度方向角;
根据该梯度方向角,以及在0到360度间划分的8个方向,确定该梯度方向角归属的方向。
所述匹配识别模块44,具体用于根据确定匹配距离,其中, d ( i , j ) = 0 if ( c ( i , j ) = = t ( i , j ) ) 5 if ( c ( i , j ) ! = t ( i , j ) ) , c(i,j)为待识别字符的边缘梯度数组中第i行,第j列的数值,t(i,j)为模板中第i行,第j列的数值,H为归一化后模板的高度,W为归一化后模板的宽度,S的数值根据待识别字符的边缘梯度数组中不等于-1的次数,即模板每个位置不等于-1的次数和确定。
本发明提供了一种字符识别方法及装置,该方法针对待识别字符识别和模板创建时,进行归一化处理、确定字符边缘信息图,并确定边缘梯度数组中每个数值的取值,当确定了边缘梯度数组中相应位置的赋值后,根据待识别字符对应边缘梯度数组与每个字符对应的每个模板之间的匹配,确定匹配距离,根据匹配距离识别字符。由于在本发明中根据字符中每个像素点的梯度方向,作为边缘梯度数组中的相应数值,而梯度方向具有较强的抗干扰能力,因此本字符识别方法具有较强的鲁棒性,并且在识别的过程中与每个字符对应的每个模板进行匹配,根据匹配距离,将匹配距离最小值对应的字符作为识别结果,因此可以避免字符单模板匹配的鲁棒性差的问题,提高了该匹配方法的适用范围。
上述说明示出并描述了本发明的一个优选实施例,但如前所述,应当理解本发明并非局限于本文所披露的形式,不应看作是对其他实施例的排除,而可用于各种其他组合、修改和环境,并能够在本文所述发明构想范围内,通过上述构思或相关领域的技术或知识进行改进。而本领域人员所进行的改动和变化不脱离本发明的精神和范围,则都应在本发明所附权利要求的保护范围内。

Claims (10)

1.一种字符识别方法,其特征在于,所述方法包括:
对包含待识别字符信息的图片进行二值化处理,识别二值化处理后该图片中字符的边界,根据确定的边界,在包含待识别字符信息的样本图片中截取待识别字符区域,对该截取的字符区域进行二值化、归一化处理;
在归一化处理后的待识别字符区域中,识别像素值的跳变,根据跳变时白色像素点的位置,在字符边缘信息图中相应像素点的位置赋值255,其他像素点的位置赋其他值,其中该字符边缘信息图与该归一化后的字符区域大小相等;
识别该字符边缘信息图中每个像素点的像素值,当识别到该字符边缘信息图中像素点的像素值为255时,计算该像素点的梯度值,并确定归属方向,采用该归属方向值对边缘梯度数组中相应位置赋值,该数组的其他位置赋值为-1;
将该边缘梯度数组与保存的每个字符对应的每个模板进行匹配,确定匹配距离,将匹配距离最小值对应的字符作为识别结果。
2.如权利要求1所述的方法,其特征在于,创建并保存针对每个字符的每个模板包括:
对包含字符信息的样本图片进行二值化处理,识别二值化处理后该图片中字符的边界;
根据确定的字符边界,在包含字符信息的样本图片中截取字符区域,对该截取的字符区域进行二值化、归一化处理;
在归一化处理后的字符区域中,识别像素值的跳变,根据跳变时白色像素点的位置,在字符边缘信息图中相应像素点的位置赋值255,其他像素点的位置赋其他值,其中该字符边缘信息图与该归一化后的字符区域大小相等;
识别该字符边缘信息图中每个像素点的像素值,当识别到该字符边缘信息图中像素点的像素值为255时,计算该像素点的梯度值,并确定归属方向,将模板中与该像素点位置对应的位置赋值为方向值,其他位置赋值为-1。
3.如权利要求1或2所述的方法,其特征在于,所述识别二值化处理后该图片中字符的边界包括:
从二值化处理后的图片的四个边界开始,分别向图片内部搜索;
当搜索到该图片中的白色像素点时,确定该白色像素点位于该字符的边界;
根据从每个边界方向扫描到的白色像素点的位置,确定该字符的边界。
4.如权利要求1或2所述的方法,其特征在于,对该截取的字符区域进行二值化、归一化处理后,该方法还包括:
将该截取的字符区域转换为灰度图,并进行归一化处理;
所述计算该像素点的梯度值,并确定归属方向角包括:
在归一化后的灰色图中与该像素点对应的位置上,根据下式计算该像素点的梯度值:
Gradient=dy/dx
其中,dy=g(i,j+1)-g(i,j-1),dx=g(i+1,j)-g(i-1,j),g(i,j)在归一化后的灰度图像中该像素点对应位置的灰度值,i表示该像素点所在的行,j表示该像素点所在的列,Gradient为计算的该像素点的梯度值;
根据计算的该梯度值,计算梯度方向角;
根据该梯度方向角,以及在0到360度间划分的8个方向,确定该梯度方向角归属的方向。
5.如权利要求1所述的方法,其特征在于,所述将该二值化边缘梯度图与保存的每个模板进行匹配,确定匹配距离包括:
根据
Figure FDA00001713768100021
确定匹配距离,其中, d ( i , j ) = 0 if ( c ( i , j ) = = t ( i , j ) ) 5 if ( c ( i , j ) ! = t ( i , j ) ) , c(i,j)为待识别字符的边缘梯度数组中第i行,第j列的数值,t(i,j)为模板中第i行,第j列的数值,H为归一化后模板的高度,W为归一化后模板的宽度,S的数值根据待识别字符的边缘梯度数组中不等于-1的次数,即模板每个位置不等于-1的次数和确定。
6.一种字符识别装置,其特征在于,所述装置包括:
归一化模块,用于对包含待识别字符信息的图片进行二值化处理,识别二值化处理后该图片中待识别字符的边界,根据确定的边界,在包含待识别字符信息的样本图片中截取待识别字符区域,对该截取的字符区域进行二值化、归一化处理;
边缘信息确定模块,用于在归一化处理后的待识别字符区域中,识别像素值的跳变,根据跳变时白色像素点的位置,在字符边缘信息图中相应像素点的位置赋值255,其他像素点的位置赋其他值,其中该字符边缘信息图与该归一化后的字符区域大小相等;
梯度方向确定模块,用于识别该字符边缘信息图中每个像素点的像素值,当识别到该字符边缘信息图中像素点的像素值为255时,计算该像素点的梯度值,并确定归属方向,采用该归属方向值对边缘梯度数组中相应位置赋值,该数组的其他位置赋值为-1;
匹配识别模块,用于将该边缘梯度数组与保存的每个模板进行匹配,确定匹配距离,将匹配距离最小值对应的字符作为识别结果。
7.如权利要求6所述的装置,其特征在于,所述归一化模块,还用于在创建模板时,对包含字符信息的样本图片进行二值化处理,识别二值化处理后该图片中字符的边界;根据确定的字符边界,在包含字符信息的样本图片中截取字符区域,对该截取的字符区域进行二值化、归一化处理;
所述边缘信息确定模块,还用于在创建模板时,在归一化处理后的字符区域中,识别像素值的跳变,根据跳变时白色像素点的位置,在字符边缘信息图中相应像素点的位置赋值255,其他像素点的位置赋其他值,其中该字符边缘信息图与该归一化后的字符区域大小相等;
所述梯度方向确定模块,还用于在创建模板时,识别该字符边缘信息图中每个像素点的像素值,当识别到该字符边缘信息图中像素点的像素值为255时,计算该像素点的梯度值,并确定归属方向,将模板中与该像素点位置对应的位置赋值为方向值,其他位置赋值为-1。
8.如权利要求6或7所述的装置,其特征在于,所述归一化模块,具体用于从二值化处理后的图片的四个边界开始,分别向图片内部搜索;当搜索到该图片中的白色像素点时,确定该白色像素点位于该字符的边界;根据从每个边界方向扫描到的白色像素点的位置,确定该字符的边界。
9.如权利要求6或7所述的装置,其特征在于,所述归一化模块,还用于将该截取的字符区域转换为灰度图,并进行归一化处理;
所述梯度方向确定模块,用于在归一化后的灰色图中与该像素点对应的位置上,根据下式计算该像素点的梯度值:
Gradient=dy/dx
其中,dy=g(i,j+1)-g(i,j-1),dx=g(i+1,j)-g(i-1,j),g(i,j)在归一化后的灰度图像中该像素点对应位置的灰度值,i表示该像素点所在的行,j表示该像素点所在的列,Gradient为计算的该像素点的梯度值;
根据计算的该梯度值,计算梯度方向角;
根据该梯度方向角,以及在0到360度间划分的8个方向,确定该梯度方向角归属的方向。
10.如权利要求6所述的装置,其特征在于,所述匹配识别模块,具体用于根据
Figure FDA00001713768100041
确定匹配距离,其中, d ( i , j ) = 0 if ( c ( i , j ) = = t ( i , j ) ) 5 if ( c ( i , j ) ! = t ( i , j ) ) , c(i,j)为待识别字符的边缘梯度数组中第i行,第j列的数值,t(i,j)为模板中第i行,第j列的数值,H为归一化后模板的高度,W为归一化后模板的宽度,S的数值根据待识别字符的边缘梯度数组中不等于-1的次数,即模板每个位置不等于-1的次数和确定。
CN201210177765.3A 2012-05-31 2012-05-31 一种字符识别方法及装置 Expired - Fee Related CN102750530B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210177765.3A CN102750530B (zh) 2012-05-31 2012-05-31 一种字符识别方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210177765.3A CN102750530B (zh) 2012-05-31 2012-05-31 一种字符识别方法及装置

Publications (2)

Publication Number Publication Date
CN102750530A true CN102750530A (zh) 2012-10-24
CN102750530B CN102750530B (zh) 2014-11-26

Family

ID=47030696

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210177765.3A Expired - Fee Related CN102750530B (zh) 2012-05-31 2012-05-31 一种字符识别方法及装置

Country Status (1)

Country Link
CN (1) CN102750530B (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104281850A (zh) * 2013-07-09 2015-01-14 腾讯科技(深圳)有限公司 一种文字区域识别方法和装置
CN107239784A (zh) * 2017-07-03 2017-10-10 福建中金在线信息科技有限公司 一种图片识别方法、装置、电子设备及可读存储介质
CN108242058A (zh) * 2016-12-26 2018-07-03 深圳怡化电脑股份有限公司 图像边界查找方法和装置
CN108805115A (zh) * 2018-04-24 2018-11-13 五八同城信息技术有限公司 一种图片中文字的识别方法、装置、设备及存储介质
CN111079735A (zh) * 2018-10-22 2020-04-28 莱芜钢铁集团电子有限公司 一种铸坯端面字符识别方法及装置
CN113239929A (zh) * 2021-04-30 2021-08-10 南京钢铁股份有限公司 一种识别计算机显示屏幕中数字的方法
CN113255674A (zh) * 2020-09-14 2021-08-13 深圳怡化时代智能自动化***有限公司 字符识别方法、装置、电子设备及计算机可读存储介质
CN113989795A (zh) * 2021-12-02 2022-01-28 安徽翼迈科技股份有限公司 一种基于模板图遍历的水表水泡预警方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101515325A (zh) * 2009-04-08 2009-08-26 北京邮电大学 基于字符切分和颜色聚类的数字视频中的字符提取方法
CN101751565A (zh) * 2008-12-10 2010-06-23 中国科学院自动化研究所 融合二值图像与灰度图像的字符识别的方法
CN102147858A (zh) * 2011-03-31 2011-08-10 重庆大学 车牌字符识别方法
CN102426649A (zh) * 2011-10-13 2012-04-25 石家庄开发区冀科双实科技有限公司 一种简单的高准确率的钢印数字自动识别方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101751565A (zh) * 2008-12-10 2010-06-23 中国科学院自动化研究所 融合二值图像与灰度图像的字符识别的方法
CN101515325A (zh) * 2009-04-08 2009-08-26 北京邮电大学 基于字符切分和颜色聚类的数字视频中的字符提取方法
CN102147858A (zh) * 2011-03-31 2011-08-10 重庆大学 车牌字符识别方法
CN102426649A (zh) * 2011-10-13 2012-04-25 石家庄开发区冀科双实科技有限公司 一种简单的高准确率的钢印数字自动识别方法

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104281850A (zh) * 2013-07-09 2015-01-14 腾讯科技(深圳)有限公司 一种文字区域识别方法和装置
CN104281850B (zh) * 2013-07-09 2020-01-31 腾讯科技(深圳)有限公司 一种文字区域识别方法和装置
CN108242058A (zh) * 2016-12-26 2018-07-03 深圳怡化电脑股份有限公司 图像边界查找方法和装置
CN107239784A (zh) * 2017-07-03 2017-10-10 福建中金在线信息科技有限公司 一种图片识别方法、装置、电子设备及可读存储介质
CN108805115A (zh) * 2018-04-24 2018-11-13 五八同城信息技术有限公司 一种图片中文字的识别方法、装置、设备及存储介质
CN111079735A (zh) * 2018-10-22 2020-04-28 莱芜钢铁集团电子有限公司 一种铸坯端面字符识别方法及装置
CN111079735B (zh) * 2018-10-22 2023-12-22 莱芜钢铁集团电子有限公司 一种铸坯端面字符识别方法及装置
CN113255674A (zh) * 2020-09-14 2021-08-13 深圳怡化时代智能自动化***有限公司 字符识别方法、装置、电子设备及计算机可读存储介质
CN113239929A (zh) * 2021-04-30 2021-08-10 南京钢铁股份有限公司 一种识别计算机显示屏幕中数字的方法
CN113989795A (zh) * 2021-12-02 2022-01-28 安徽翼迈科技股份有限公司 一种基于模板图遍历的水表水泡预警方法

Also Published As

Publication number Publication date
CN102750530B (zh) 2014-11-26

Similar Documents

Publication Publication Date Title
CN102750530A (zh) 一种字符识别方法及装置
CN102779275B (zh) 一种纸类字符识别方法及相关装置
CN111179152B (zh) 一种道路标识识别方法及装置、介质、终端
CN100377167C (zh) 一种用于二维码识别的二维码区域精确定位方法
CN102509098B (zh) 一种鱼眼图像车辆识别方法
CN101339601B (zh) 一种基于sift算法的车牌汉字识别方法
US20070058863A1 (en) Label Detection
CN105488492B (zh) 一种彩色图像预处理方法、道路识别方法及相关装置
US20080075392A1 (en) Image region detection method, recording medium, and device therefor
CN102243705B (zh) 基于边缘检测的车牌定位方法
CN101334836A (zh) 一种融合色彩、尺寸和纹理特征的车牌定位方法
CN105160309A (zh) 基于图像形态学分割及区域生长的三车道检测方法
CN102364496A (zh) 一种基于图像分析的汽车车牌自动识别方法及***
CN105139416A (zh) 一种基于图像信息和深度信息的物体识别方法
CN108090459B (zh) 一种适用于车载视觉***的交通标志检测识别方法
CN103116751A (zh) 一种车牌字符自动识别方法
CN103729655A (zh) 一种用于片式元件视觉定位的检测方法
CN109740584B (zh) 基于深度学习的自动泊车停车位检测方法
CN104700062A (zh) 一种识别二维码的方法及设备
CN102147867B (zh) 一种基于主体的国画图像和书法图像的识别方法
CN105678315A (zh) 生成训练图像的方法以及目标识别***的学习方法
CN103530608A (zh) 车辆类型判断方法和装置
CN105303153A (zh) 一种车辆车牌识别方法及装置
CN104766078A (zh) 目标图像的倾斜角检测方法及倾斜角检测设备
CN102081732A (zh) 一种版式识别模板方法及***

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
ASS Succession or assignment of patent right

Owner name: LIU ZHONGXUAN TONG HUIYONG

Effective date: 20131121

Owner name: HE JIANGTAO

Free format text: FORMER OWNER: XINZHENG ELECTRONIC TECHNOLOGY (BEIJING) CO., LTD.

Effective date: 20131121

C41 Transfer of patent application or patent right or utility model
TA01 Transfer of patent application right

Effective date of registration: 20131121

Address after: 100085, A, block 6A, block 28, information road, Beijing, Haidian District

Applicant after: He Jiangtao

Applicant after: Liu Zhongxuan

Applicant after: Tong Huiyong

Address before: 100085, room 228, Section 2, building 1, building C, 3rd Street, Haidian District, Beijing

Applicant before: Xinzheng Electronic Technology (Beijing) Co., Ltd.

ASS Succession or assignment of patent right

Free format text: FORMER OWNER: LIU ZHONGXUAN TONG HUIYONG

Effective date: 20140418

C41 Transfer of patent application or patent right or utility model
TA01 Transfer of patent application right

Effective date of registration: 20140418

Address after: 100085, A, block 6A, block 28, information road, Beijing, Haidian District

Applicant after: He Jiangtao

Address before: 100085, A, block 6A, block 28, information road, Beijing, Haidian District

Applicant before: He Jiangtao

Applicant before: Liu Zhongxuan

Applicant before: Tong Huiyong

C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20141126

Termination date: 20190531

CF01 Termination of patent right due to non-payment of annual fee