CN104598907A - 一种基于笔画宽度图的图像中文字数据提取方法 - Google Patents
一种基于笔画宽度图的图像中文字数据提取方法 Download PDFInfo
- Publication number
- CN104598907A CN104598907A CN201310534130.9A CN201310534130A CN104598907A CN 104598907 A CN104598907 A CN 104598907A CN 201310534130 A CN201310534130 A CN 201310534130A CN 104598907 A CN104598907 A CN 104598907A
- Authority
- CN
- China
- Prior art keywords
- image
- connected domain
- bianry image
- bianry
- stroke width
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 39
- 238000001914 filtration Methods 0.000 claims abstract description 20
- 238000003708 edge detection Methods 0.000 claims abstract description 11
- 238000004458 analytical method Methods 0.000 claims abstract description 6
- 238000001514 detection method Methods 0.000 claims description 3
- 239000003550 marker Substances 0.000 claims description 3
- 239000007787 solid Substances 0.000 claims description 3
- 238000005286 illumination Methods 0.000 abstract description 4
- 238000005516 engineering process Methods 0.000 abstract description 3
- 238000004364 calculation method Methods 0.000 abstract description 2
- 239000003086 colorant Substances 0.000 abstract description 2
- 230000015556 catabolic process Effects 0.000 abstract 1
- 238000006731 degradation reaction Methods 0.000 abstract 1
- 230000000877 morphologic effect Effects 0.000 abstract 1
- 238000000605 extraction Methods 0.000 description 7
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000007547 defect Effects 0.000 description 1
- 238000003064 k means clustering Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/26—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
- G06V10/267—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion by performing operations on regions, e.g. growing, shrinking or watersheds
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/28—Character recognition specially adapted to the type of the alphabet, e.g. Latin alphabet
- G06V30/287—Character recognition specially adapted to the type of the alphabet, e.g. Latin alphabet of Kanji, Hiragana or Katakana characters
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Probability & Statistics with Applications (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
Abstract
本发明涉及一种基于笔画宽度图的图像中文字数据提取方法,包括:读入彩色图像,利用均值聚类算法对颜色进行聚类,得到第一二值图像序列;利用边缘检测算法和形态学连通域分析方法,得到第二二值图像序列;利用几何滤波器对合并后的序列进行第一次滤除,得到第三二值图像序列;计算第三二值图像序列的笔画宽度图,根据笔画宽度图对第三二值图像序列进行第二次滤除,得到第四二值图像序列;将第四二值图像序列中所有的图像叠加,得到提取的文字结果。与现有技术相比,本发明通过判断图像亮度值自适应地选取颜色聚类算法中的距离,可较好地处理光照不均匀等退化图像;通过改善传统的笔画宽度计算方法,提高了文字提取技术的性能。
Description
技术领域
本发明涉及图像处理与计算机视觉技术领域,尤其是涉及一种基于笔画宽度图的图像中文字数据提取方法。
背景技术
图像中文字对于理解图像内容起着重要作用,图像中文字提取的准确与否直接影响着文字自动处理***的后续处理结果。近年来图像中的文字提取取得了很大的进展,然而图像中的文字提取在走向实用化的过程中,却遇到了很多问题,如图像模糊不清楚、光照不均匀、背景复杂等等,这都是制约图像中文字自动提取技术实际应用的瓶颈,又是图像中文字自动提取技术研究中的热点和难点。
近几十年国内外许多研究者开始对图像中文字自动提取技术进行研究,这些方法可分为两类:第一类是基于阈值分割的文字提取方法,即通过求取阈值对图像进行二值化处理从而得到文字前景图像,常用阈值求取方法有基于全局阈值方法和局部阈值方法,这方法处理质量较好的图像会得到比较好的结果,对于低质量图像和具有复杂背景的图像常常表现得无能为力;第二类是基于区域分析的文字提取方法,通过提取一些区域前景,并判断这些区域是否满足文字特点从而排除非文字区域,常用的文字特点有:文字区域内容通常具有一致的颜色、文字区域具有相同的笔画宽度等等,这种方法比较灵活,并且可以处理各种各样复杂情况下的图像中文字提取。基于区域分析的文字提取方法,可进一步分成基于颜色聚类的文字提取方法和基于笔画宽度信息的文字提取方法。
基于颜色聚类的文字提取方法是利用聚类算法对图像中的颜色进行聚类从而形成一些区域,然后再利用文字属性特点评价这些区域,进而得到文字区域。常用的聚类算法有k均值聚类算法、Isodata算法等等。颜色空间的选取可根据图像质量进行选取,常用的颜色空间有RGB、HIS等。
基于笔画宽度信息的文字提取方法充分利用了文字的一个重要特点,文字区域通常具有相似笔画宽度,笔画之间的宽度不会相异很多。大多数提取笔画宽度信息的方法是分别在水平和垂直方向上对图像进行扫描,如果出现成对的颜色值突变,就可计算这对颜色值突变像素点之间的聚类作为笔画宽度信息,这种方法处理复杂情况下的文字提取,具有不稳定性,常常会出现误提或漏提现象。另外一种方法是利用笔画宽度转化算子检测图像中的文字,即通过每个笔画边缘点沿梯度方向发射射线寻找此点的笔画宽度,这种方法无法准确地计算出笔画拐角处笔画宽度信息,只能提取到大致的笔画宽度信息,很难提取到真实的笔画宽度信息。
发明内容
本发明的目的就是为了克服上述现有技术存在的缺陷而提供一种基于笔画宽度图的图像中文字数据提取方法。
本发明的目的可以通过以下技术方案来实现:一种基于笔画宽度图的图像中文字数据提取方法,其特征在于,包括以下步骤:
S1、读入彩色图像I,利用均值聚类算法对颜色进行聚类,在聚类后的图像中提取连通域,并得到所有连通域对应的二值图像,形成第一二值图像序列iC=1,...,nC,其中,nC为连通域个数;
S2、读入彩色图像I,利用边缘检测算法和形态学连通域分析方法,对彩色图像进行边缘提取,在边缘提取后的图像中提取连通域,并得到所有连通域对应的二值图像,形成第二二值图像序列ie=1,...,ne,其中,ne为连通域个数;
S3、将第一二值图像序列和第二二值图像序列合并,利用几何滤波器对合并后的二值图像序列进行非文字连通域的第一次滤除,将经过第一次滤除后的二值图像序列更新为第三二值图像序列iC=1,...,ng,其中,ng为第一次滤除后的连通域个数;
S4、计算第三二值图像序列中每个二值图像对应的笔画宽度图根据笔画宽度图对第三二值图像序列进行非文字连通域的第二次滤除,得到第四二值图像序列is=1,...,ns,其中,ns为第二次滤除后的连通域个数;
S5、将第四二值图像序列中所有的二值图像叠加成一幅新的二值图像Is,二值图像Is的前景即为提取到的文字结果。
步骤S1所述的利用均值聚类算法对颜色进行聚类具体步骤如下,
11)提取彩色图像I在HSL颜色空间的亮度通道L上对应的图像为Ii,预设亮度阈值trc,基于欧式距离颜色聚类的聚类数目kE,基于余弦相似性颜色聚类的聚类数目kC;
12)判断是否Il>trc,是则采用余弦相似性在RGB颜色空间对彩色图像I进行k均值聚类,把聚类后的每一类视为前景图像,得到kC个二值图像;否则采用欧式距离在RGB颜色空间对彩色图像I进行k均值聚类,得到kE个二值图像。
实施步骤S2具体步骤如下,
21)利用加权平均值法将彩色图像I灰度化,得到灰度图像Ig;
22)利用边缘检测算子对灰度图像Ig进行边缘检测得到边缘二值图像Ie1;
23)对边缘二值图像Ie1中断了的笔画在邻域内进行连接,即利用二值图像形态学8邻域像素连接操作对边缘图像Ie1进行断点连接,得到边缘二值图像Ie2;
24)提取边缘二值图像Ie2中的连通域,若连通域是闭合区域,则对其进行填充成实心连通域,视每个连通域为前景图像,得到每个连通域对应的二值图像,形成第二二值图像序列
步骤21)所述的利用加权平均值法将彩色图像I灰度化,得到灰度图像Ig,彩色图像I中每点的灰度值计算公式为:
Gray=0.2989×IR+0.587×IG+0.114×IB,
式中,IR、IG、IB分别为该点在彩色图像I中的三通道像素值,Gray为该点灰度化后的灰度值。
步骤22)所述的边缘检测算子为Canny边缘检测算子。
步骤S3所述的利用几何滤波器对合并后的二值图像序列进行非文字连通域的第一次滤除具体步骤如下,
31)设定图像I的尺寸sIh×sIw,二值图像的连通域的外接矩形尺寸下限sh×sw、最大尺寸比例rl、长宽比下限rb、长宽比上限rt以及连通域内含洞数下限nhtr;
32)判断合并后每一个二值图像是否满足任意一项几何滤波器规则,是则将当前二值图像从合并后的二值图像序列中删除,所述的几何滤波器由四项规则构成:
R1.排除过小的连通域,如果当前二值图像Ii的连通域的最小外接矩形尺寸小于连通域尺寸下限sh×sw,则认为此连通域为非文字区域;
R2.排除过大的连通域,如果当前二值图像Ii的连通域的最小外接矩形尺寸大于图像I的尺寸rl×sIh×sIw,则认为此连通域为非文字区域:
R3.排除过长或过窄的连通域,如果当前二值图像Ii的连通域的最小外接矩形长宽比小于rb或大于rt,则认为此连通域为非文字区域;
R4.排除含有过多空洞的连通域,如果当前二值图像Ii的连通域内所含空洞个数大于nhtr,则认为此连通域为非文字区域。
实施步骤S4具体步骤如下,
41)计算当前二值图像连通域前景内每个象素点j到连通域边缘点p的最短距离dpj,并用边缘点p标记像素点jp;
42)在具有相同最近边缘点p的前景象素点jp至边缘点p的最短距离dpj里选取最大距离dpj-max=max(dpj)作为前景象素点jp的笔画宽度,用dpj-max替代像素点jp,得到当前二值图像对应的笔画宽度图
43)根据当前笔画宽度图计算当前二值图像连通域的笔画标准离差率R:
式中,ni是二值图像连通域前景点的总数目;
44)判断是否R>trr,是则认为笔画宽度不一致,当前二值图像的连通域是非文字区域,将当前二值图像从第三二值图像序列中删除,其中trr为预设的笔画标准离差率阈值;
45)判断当前二值图像是否为第三二值图像序列的最后一个二值图像否则更新ig=ig+1,读取下一个二值图像返回步骤41);是则将排除非文字区域后的第三二值图像序列更新为第四二值图像序列is=1,...,ns,跳出循环,其中ns为连通域个数。
与现有技术相比,本发明通过判断图像亮度值自适应地选取颜色聚类算法中的距离,可较好地处理光照不均匀等退化图像;此外,通过改善传统的笔画宽度计算方法,在具有相同最近边缘点的前景象素点至边缘点的最短距离里选取最大距离作为前景象素点的笔画宽度,能够更准确地计算出连通域的笔画宽度,从而提高文字提取技术的性能。
附图说明
图1为本发明的流程图;
图2为本发明实施例笔画宽度图;
图2中,(a)连通域边缘图;(b)最短距离图;
图3为本发明实施例的文字提取结果示意图。
具体实施方式
下面结合附图和具体实施例对本发明进行详细说明。以下仅为本发明的优选实施例,仅仅是对本发明的举例说明,而非对本发明及其应用或用途的限制,根据本发明得出的其它实施方式,也同样属于本发明的技术创新范围,方案中有关参数的设定也并不表明只有举例值可以使用。
实施例:
选用包含英文字符、光照不均匀的低质量图像I,颜色特征空间为RGB,设定亮度阈值trc=0.9,基于欧式距离颜色聚类的聚类数目kE=3,基于余弦相似性颜色聚类的聚类数目kC=3。
如图1-3所示,一种基于笔画宽度图的图像中文字数据提取方法,其特征在于,包括以下步骤:
S1、读入彩色图像I,利用均值聚类算法对颜色进行聚类,在聚类后的图像中提取连通域,并得到所有连通域对应的二值图像,形成第一二值图像序列iC=1,...,nC,其中,nC为连通域个数;
步骤S1所述的利用均值聚类算法对颜色进行聚类具体步骤如下,
11)提取彩色图像I在HSL颜色空间的亮度通道L上对应的图像为Il,预设亮度阈值trc,基于欧式距离颜色聚类的聚类数目kE,基于余弦相似性颜色聚类的聚类数目kC;
12)判断是否II>trc,是则采用余弦相似性在RGB颜色空间对彩色图像I进行k均值聚类,把聚类后的每一类视为前景图像,得到kC个二值图像;否则采用欧式距离在RGB颜色空间对彩色图像I进行k均值聚类,得到kE个二值图像。
S2、读入彩色图像I,利用边缘检测算法和形态学连通域分析方法,对彩色图像进行边缘提取,在边缘提取后的图像中提取连通域,并得到所有连通域对应的二值图像,形成第二二值图像序列ie=1,...,ne,其中,ne为连通域个数;
实施步骤S2具体步骤如下,
21)利用加权平均值法将彩色图像II灰度化,得到灰度图像Ig;
彩色图像I中每点的灰度值计算公式为:
Gray=0.2989×IR+0.587×IG+0.114×IB,
式中,IR、IG、IB分别为该点在彩色图像I中的三通道像素值,Gray为该点灰度化后的灰度值。
22)利用Canny边缘检测算子对灰度图像Ig进行边缘检测得到边缘二值图像Ie1;
23)对边缘二值图像Ie1中断了的笔画在邻域内进行连接,即利用二值图像形态学8邻域像素连接操作对边缘图像Ie1进行断点连接,得到边缘二值图像Ie2;
24)提取边缘二值图像Ie2中的连通域,若连通域是闭合区域,则对其进行填充成实心连通域,视每个连通域为前景图像,得到每个连通域对应的二值图像,形成第二二值图像序列
S3、将第一二值图像序列和第二二值图像序列合并,利用几何滤波器对合并后的二值图像序列进行非文字连通域的第一次滤除,将经过第一次滤除后的二值图像序列更新为第三二值图像序列iC=1,...,ng,其中,ng为第一次滤除后的连通域个数;
所述的利用几何滤波器对合并后的二值图像序列进行非文字连通域的第一次滤除具体步骤如下,
31)设定图像I的尺寸sIh×sIw,二值图像的连通域的外接矩形尺寸下限sh×sw、最大尺寸比例rl、长宽比下限rb、长宽比上限rt以及连通域内含洞数下限nhtr;
32)判断合并后每一个二值图像是否满足任意一项几何滤波器规则,是则将当前二值图像从合并后的二值图像序列中删除,所述的几何滤波器由四项规则构成:
R1.排除过小的连通域,如果当前二值图像Ii的连通域的最小外接矩形尺寸小于连通域尺寸下限sh×sw,则认为此连通域为非文字区域;
R2.排除过大的连通域,如果当前二值图像Ii的连通域的最小外接矩形尺寸大于图像I的尺寸rl×sIh×sIw,则认为此连通域为非文字区域;
R3.排除过长或过窄的连通域,如果当前二值图像Ii的连通域的最小外接矩形长宽比小于rb或大于rt,则认为此连通域为非文字区域;
R4.排除含有过多空洞的连通域,如果当前二值图像Ii的连通域内所含空洞个数大于nhtr,则认为此连通域为非文字区域。
S4、计算第三二值图像序列中每个二值图像对应的笔画宽度图根据笔画宽度图对第三二值图像序列进行非文字连通域的第二次滤除,得到第四二值图像序列is=1,...,ns,其中,ns为第二次滤除后的连通域个数;
实施步骤S4具体步骤如下,
41)计算当前二值图像连通域前景内每个象素点j到连通域边缘点p的最短距离dpj,并用边缘点p标记像素点jp,如图2(a)所示;
42)在具有相同最近边缘点p的前景象素点jp至边缘点p的最短距离dpj里选取最大距离dpj-max=max(dpj)作为前景象素点jp的笔画宽度,用dpj-max替代像素点jp,得到当前二值图像对应的笔画宽度图如图2(b)所示;
43)根据当前笔画宽度图计算当前二值图像连通域的笔画标准离差率R:
式中,ni是二值图像连通域前景点的总数目;
44)判断是否R>trr,是则认为笔画宽度不一致,当前二值图像的连通域是非文字区域,将当前二值图像从第三二值图像序列中删除,其中trr为预设的笔画标准离差率阈值;
45)判断当前二值图像是否为第三二值图像序列的最后一个二值图像否则更新ig=ig+1,读取下一个二值图像返回步骤41);是则将排除非文字区域后的第三二值图像序列更新为第四二值图像序列is=1,...,ns,跳出循环,其中ns为连通域个数。
S5、将第四二值图像序列中所有的二值图像叠加成一幅新的二值图像Is,二值图像Is的前景即为提取到的文字结果,如图3所示。
Claims (7)
1.一种基于笔画宽度图的图像中文字数据提取方法,其特征在于,包括以下步骤:
S1、读入彩色图像I,利用均值聚类算法对颜色进行聚类,在聚类后的图像中提取连通域,并得到所有连通域对应的二值图像,形成第一二值图像序列iC=1,...,nC,其中,nC为连通域个数;
S2、读入彩色图像I,利用边缘检测算法和形态学连通域分析方法,对彩色图像进行边缘提取,在边缘提取后的图像中提取连通域,并得到所有连通域对应的二值图像,形成第二二值图像序列ie=1,...,ne,其中,ne为连通域个数;
S3、将第一二值图像序列和第二二值图像序列合并,利用几何滤波器对合并后的二值图像序列进行非文字连通域的第一次滤除,将经过第一次滤除后的二值图像序列更新为第三二值图像序列ic=1,...,ng,其中,ng为第一次滤除后的连通域个数;
S4、计算第三二值图像序列中每个二值图像对应的笔画宽度图根据笔画宽度图对第三二值图像序列进行非文字连通域的第二次滤除,得到第四二值图像序列is=1,...,ns,其中,ns为第二次滤除后的连通域个数;
S5、将第四二值图像序列中所有的二值图像叠加成一幅新的二值图像IS,二值图像Is的前景即为提取到的文字结果。
2.根据权利要求1所述的一种基于笔画宽度图的图像中文字数据提取方法,其特征在于,步骤S1所述的利用均值聚类算法对颜色进行聚类具体步骤如下,
11)提取彩色图像I在HSL颜色空间的亮度通道L上对应的图像为Il,预设亮度阈值trC,基于欧式距离颜色聚类的聚类数目kE,基于余弦相似性颜色聚类的聚类数目kC;
12)判断是否Il>trC,是则采用余弦相似性在RGB颜色空间对彩色图像I进行k均值聚类,把聚类后的每一类视为前景图像,得到kC个二值图像;否则采用欧式距离在RGB颜色空间对彩色图像I进行k均值聚类,得到kE个二值图像。
3.根据权利要求1所述的一种基于笔画宽度图的图像中文字数据提取方法,其特征在于,实施步骤S2具体步骤如下,
21)利用加权平均值法将彩色图像I灰度化,得到灰度图像Ig;
22)利用边缘检测算子对灰度图像Ig进行边缘检测得到边缘二值图像Ie1;
23)对边缘二值图像Ie1中断了的笔画在邻域内进行连接,即利用二值图像形态学8邻域像素连接操作对边缘图像Ie1进行断点连接,得到边缘二值图像Ie2;
24)提取边缘二值图像Ie2中的连通域,若连通域是闭合区域,则对其进行填充成实心连通域,视每个连通域为前景图像,得到每个连通域对应的二值图像,形成第二二值图像序列
4.根据权利要求3所述的一种基于笔画宽度图的图像中文字数据提取方法,其特征在于,步骤21)所述的利用加权平均值法将彩色图像I灰度化,得到灰度图像Ig,彩色图像I中每点的灰度值计算公式为:
Gray=0.2989×IR+0.587×IG+0.114×IB,
式中,IR、IG、IB分别为该点在彩色图像I中的三通道像素值,Gray为该点灰度化后的灰度值。
5.根据权利要求3所述的一种基于笔画宽度图的图像中文字数据提取方法,其特征在于,步骤22)所述的边缘检测算子为Canny边缘检测算子。
6.根据权利要求1所述的一种基于笔画宽度图的图像中文字数据提取方法,其特征在于,步骤S3所述的利用几何滤波器对合并后的二值图像序列进行非文字连通域的第一次滤除具体步骤如下,
31)设定图像I的尺寸sIh×sIw,二值图像的连通域的外接矩形尺寸下限sh×sw、最大尺寸比例rl、长宽比下限rb、长宽比上限rt以及连通域内含洞数下限nhtr;
32)判断合并后每一个二值图像是否满足任意一项几何滤波器规则,是则将当前二值图像从合并后的二值图像序列中删除,所述的几何滤波器由四项规则构成:
R1.排除过小的连通域,如果当前二值图像Ii的连通域的最小外接矩形尺寸小于连通域尺寸下限sh×sw,则认为此连通域为非文字区域;
R2.排除过大的连通域,如果当前二值图像Ii的连通域的最小外接矩形尺寸大于图像I的尺寸rl×sIh×sIw,则认为此连通域为非文字区域;
R3.排除过长或过窄的连通域,如果当前二值图像Ii的连通域的最小外接矩形长宽比小于rb或大于rt,则认为此连通域为非文字区域;
R4.排除含有过多空洞的连通域,如果当前二值图像Ii的连通域内所含空洞个数大于nhtr,则认为此连通域为非文字区域。
7.根据权利要求1所述的一种基于笔画宽度图的图像中文字数据提取方法,其特征在于,实施步骤S4具体步骤如下,
41)计算当前二值图像连通域前景内每个象素点j到连通域边缘点p的最短距离dpj,并用边缘点p标记像素点jp;
42)在具有相同最近边缘点p的前景象素点jp至边缘点p的最短距离dpj里选取最大距离dpj-max=max(dpj)作为前景象素点jp的笔画宽度,用dpj-max替代像素点jp,得到当前二值图像对应的笔画宽度图
43)根据当前笔画宽度图计算当前二值图像连通域的笔画标准离差率R:
式中,ni是二值图像连通域前景点的总数目;
44)判断是否R>trr,是则认为笔画宽度不一致,当前二值图像的连通域是非文字区域,将当前二值图像从第三二值图像序列中删除,其中trr为预设的笔画标准离差率阈值;
45)判断当前二值图像是否为第三二值图像序列的最后一个二值图像否则更新ig=ig+1,读取下一个二值图像返回步骤41);是则将排除非文字区域后的第三二值图像序列更新为第四二值图像序列is=1,...,ns,跳出循环,其中ns为连通域个数。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310534130.9A CN104598907B (zh) | 2013-10-31 | 2013-10-31 | 一种基于笔画宽度图的图像中文字数据提取方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310534130.9A CN104598907B (zh) | 2013-10-31 | 2013-10-31 | 一种基于笔画宽度图的图像中文字数据提取方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN104598907A true CN104598907A (zh) | 2015-05-06 |
CN104598907B CN104598907B (zh) | 2017-12-05 |
Family
ID=53124680
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201310534130.9A Expired - Fee Related CN104598907B (zh) | 2013-10-31 | 2013-10-31 | 一种基于笔画宽度图的图像中文字数据提取方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN104598907B (zh) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105374015A (zh) * | 2015-10-27 | 2016-03-02 | 湖北工业大学 | 基于局部对比度和笔画宽度估计的低质量文档图像二值化方法 |
CN106326895A (zh) * | 2015-06-16 | 2017-01-11 | 富士通株式会社 | 图像处理装置和图像处理方法 |
CN106650761A (zh) * | 2015-10-29 | 2017-05-10 | 富士通株式会社 | 用于自动分类***雕刻方式的装置和方法 |
CN107845094A (zh) * | 2017-11-20 | 2018-03-27 | 北京小米移动软件有限公司 | 图像文字检测方法、装置及计算机可读存储介质 |
CN110197180A (zh) * | 2019-05-30 | 2019-09-03 | 新华三技术有限公司 | 字符缺陷检测方法、装置及设备 |
CN112836541A (zh) * | 2021-02-03 | 2021-05-25 | 华中师范大学 | 一种香烟32位条码的自动采集及识别方法及装置 |
CN113822094A (zh) * | 2020-06-02 | 2021-12-21 | 苏州科瓴精密机械科技有限公司 | 基于图像识别工作位置的方法、***,机器人及存储介质 |
CN114782950A (zh) * | 2022-03-30 | 2022-07-22 | 慧之安信息技术股份有限公司 | 一种基于汉字笔画特征的2d图像文本检测方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101276461A (zh) * | 2008-03-07 | 2008-10-01 | 北京航空航天大学 | 一种利用边缘特征的视频文本增强方法 |
CN101593276A (zh) * | 2008-05-29 | 2009-12-02 | 汉王科技股份有限公司 | 一种视频ocr图文分离方法及*** |
CN102915438A (zh) * | 2012-08-21 | 2013-02-06 | 北京捷成世纪科技股份有限公司 | 一种视频字幕的提取方法及装置 |
-
2013
- 2013-10-31 CN CN201310534130.9A patent/CN104598907B/zh not_active Expired - Fee Related
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101276461A (zh) * | 2008-03-07 | 2008-10-01 | 北京航空航天大学 | 一种利用边缘特征的视频文本增强方法 |
CN101593276A (zh) * | 2008-05-29 | 2009-12-02 | 汉王科技股份有限公司 | 一种视频ocr图文分离方法及*** |
CN102915438A (zh) * | 2012-08-21 | 2013-02-06 | 北京捷成世纪科技股份有限公司 | 一种视频字幕的提取方法及装置 |
Non-Patent Citations (3)
Title |
---|
JING YU: "Double-edge-model based Character Stroke Extraction from Complex Backgrounds", 《INTERNATIONAL CONFERENCE ON PATTERN RECOGNITION》 * |
宋文: "《基于笔画宽度变换的自然场景文本检测方法》", 《计算机工程与应用》 * |
程豪: "基于笔画提取和颜色模型的视频文字分割算法", 《计算机工程》 * |
Cited By (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106326895B (zh) * | 2015-06-16 | 2020-07-07 | 富士通株式会社 | 图像处理装置和图像处理方法 |
CN106326895A (zh) * | 2015-06-16 | 2017-01-11 | 富士通株式会社 | 图像处理装置和图像处理方法 |
CN105374015A (zh) * | 2015-10-27 | 2016-03-02 | 湖北工业大学 | 基于局部对比度和笔画宽度估计的低质量文档图像二值化方法 |
CN106650761A (zh) * | 2015-10-29 | 2017-05-10 | 富士通株式会社 | 用于自动分类***雕刻方式的装置和方法 |
CN107845094A (zh) * | 2017-11-20 | 2018-03-27 | 北京小米移动软件有限公司 | 图像文字检测方法、装置及计算机可读存储介质 |
CN107845094B (zh) * | 2017-11-20 | 2020-06-19 | 北京小米移动软件有限公司 | 图像文字检测方法、装置及计算机可读存储介质 |
CN110197180A (zh) * | 2019-05-30 | 2019-09-03 | 新华三技术有限公司 | 字符缺陷检测方法、装置及设备 |
CN110197180B (zh) * | 2019-05-30 | 2022-03-01 | 新华三技术有限公司 | 字符缺陷检测方法、装置及设备 |
CN113822094A (zh) * | 2020-06-02 | 2021-12-21 | 苏州科瓴精密机械科技有限公司 | 基于图像识别工作位置的方法、***,机器人及存储介质 |
CN113822094B (zh) * | 2020-06-02 | 2024-01-16 | 苏州科瓴精密机械科技有限公司 | 基于图像识别工作位置的方法、***,机器人及存储介质 |
CN112836541A (zh) * | 2021-02-03 | 2021-05-25 | 华中师范大学 | 一种香烟32位条码的自动采集及识别方法及装置 |
CN112836541B (zh) * | 2021-02-03 | 2022-06-03 | 华中师范大学 | 一种香烟32位条码的自动采集及识别方法及装置 |
CN114782950A (zh) * | 2022-03-30 | 2022-07-22 | 慧之安信息技术股份有限公司 | 一种基于汉字笔画特征的2d图像文本检测方法 |
CN114782950B (zh) * | 2022-03-30 | 2022-10-21 | 慧之安信息技术股份有限公司 | 一种基于汉字笔画特征的2d图像文本检测方法 |
Also Published As
Publication number | Publication date |
---|---|
CN104598907B (zh) | 2017-12-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104598907A (zh) | 一种基于笔画宽度图的图像中文字数据提取方法 | |
CN104751142B (zh) | 一种基于笔划特征的自然场景文本检测方法 | |
CN107273896A (zh) | 一种基于图像识别的车牌检测识别方法 | |
CN102208023B (zh) | 基于边缘信息和分布熵的视频字幕识别设计方法 | |
CN111145209B (zh) | 一种医学图像分割方法、装置、设备及存储介质 | |
CN103336961B (zh) | 一种交互式的自然场景文本检测方法 | |
CN105205488B (zh) | 基于Harris角点和笔画宽度的文字区域检测方法 | |
CN104182750A (zh) | 一种在自然场景图像中基于极值连通域的中文检测方法 | |
CN104239909B (zh) | 一种图像的识别方法和装置 | |
CN105893949A (zh) | 一种复杂路况场景下的车道线检测方法 | |
CN1312625C (zh) | 基于游程邻接图的复杂背景彩色图像中字符提取方法 | |
CN104794479B (zh) | 基于局部笔画宽度变换的自然场景图片中文本检测方法 | |
CN101515325A (zh) | 基于字符切分和颜色聚类的数字视频中的字符提取方法 | |
CN104463134B (zh) | 一种车牌检测方法和*** | |
CN104766344B (zh) | 基于运动边缘提取器的车辆检测方法 | |
CN104463138A (zh) | 基于视觉结构属性的文本定位方法及*** | |
CN110276279B (zh) | 一种基于图像分割的任意形状场景文本探测方法 | |
CN104658003A (zh) | 舌体图像的分割方法和装置 | |
CN106228157A (zh) | 基于图像识别技术的彩色图像文字段落分割与识别方法 | |
CN103049756A (zh) | 基于cema算法和纹理块匹配修复技术的自动提取与去除彩色图像内文字的方法 | |
CN109766892A (zh) | 一种基于边缘检测的射线检测图像标记信息字符分割方法 | |
CN112102250A (zh) | 训练数据为缺失标注的病理图像检测模型建立、检测方法 | |
CN102831419B (zh) | 一种快速的街景图像中车牌的检测模糊方法 | |
Gui et al. | A fast caption detection method for low quality video images | |
CN106407969A (zh) | 一种健壮的复杂背景视频文本定位和抽取方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20171205 |