CN103093240A - 书法字识别方法 - Google Patents

书法字识别方法 Download PDF

Info

Publication number
CN103093240A
CN103093240A CN2013100205100A CN201310020510A CN103093240A CN 103093240 A CN103093240 A CN 103093240A CN 2013100205100 A CN2013100205100 A CN 2013100205100A CN 201310020510 A CN201310020510 A CN 201310020510A CN 103093240 A CN103093240 A CN 103093240A
Authority
CN
China
Prior art keywords
writing brush
brush word
image
candidate
word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2013100205100A
Other languages
English (en)
Inventor
庄越挺
吴江琴
林媛
高鹏程
夏洋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang University ZJU
Original Assignee
Zhejiang University ZJU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University ZJU filed Critical Zhejiang University ZJU
Priority to CN2013100205100A priority Critical patent/CN103093240A/zh
Publication of CN103093240A publication Critical patent/CN103093240A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Character Discrimination (AREA)

Abstract

本发明公开了一种书法字识别的方法。搜集单个书法字图像,人工标注单个书法字图像对应的汉字语义,对单个书法字图像进行二值化、去噪和归一化处理后提取单个书法字图像中书法字的特征信息,存入特征数据库,特征信息包括单个书法字图像中书法字的四个边界点位置、书法字水平和垂直方向平均笔画穿越数、投影值、轮廓点,之后对待识别的单个书法字图像也进行处理,提取待识别书法字的特征信息,初步筛选后,再进行形状匹配比较,筛选出特征数据库里与待识别书法字形状相似的书法字,最后进行权重计算、合并汉字语义相同书法字图像,给出识别结果。本发明计算量小,能够在较短时间内给准确的识别结果;对用户所提供的待识别书法字图像没有具体要求。

Description

书法字识别方法
技术领域
本发明涉及计算机数字图像分析,尤其涉及一种书法字的识别方法。 
背景技术
中国书法是一门古老的汉字的书写艺术,从甲骨文、石鼓文、金文(钟鼎文)演变而为大篆、小篆、隶书,至定型于东汉、魏、晋的草书、楷书、行书等,书法一直散发着艺术的魅力。以汉字为依托,是中国书法区别于其他种类书法的主要标志。然而,由于长期的历史变革,又许多汉字的古今字形发生了非常大的改变,有些古代字体,如小篆等,普通用户大多无法辨认。为了解决这一问题,就需要有一种书法字识别的方法,能快速把书法作品转换成为文本格式。 
目前,对于书法字的识别技术研究甚少,多采用基于形状内容的图像匹配技术,书法字在本质上是手写体汉字,因此手写体识别是与书法字识别相关的研究,与书法字识别比较接近的是脱机手写体识别。脱机手写体汉字识别又可分为有限字符集的识别和无约束的手写体汉字识别两类。有限字符集上的手写体识别多是采用模式识别或者分类的方法,用于信封识别(Proceedings of the Fifth International Conference on Document Analysis and Recognition(ICDAR1999),1999:737-740)、车票识别(光电子技术,2003,23(4):268270)和银行票据识别(计算机工程与应用,2003,39(30):219222.)等。无约束的手写体识别多采用模式识别的方法将字符与数据库中的模板进行匹配,找出最接近的模板,该模板代表的汉字即为识别结果。 
发明内容
本发明的目的是为了克服上述现有方法对于用毛笔书写的书法字识别效果差,提供一种书法字识别方法。 
一种书法字识别方法,包括以下步骤: 
1)搜集互联网上的单个书法字图像,或者从整个书法作品图像里对书法字做最小包围盒切分得到单个书法字图像,得到单个书法字图像集合,然后标注单个书法字图像对应的汉字语义,存入特征数据库; 
2)对单个书法字图像进行二值化、去噪、归一化处理,二值化时,先将单个书法字图像转为灰度图像后使用自适应迭代法,通过将新阈值置为旧阈值以上及以下两区平均值的中点不断迭代求取最佳阈值,二值化后的单个书法字图像为白底黑字的二值化颜色矩阵,微小区域的噪声使用数学形态学的方法去除,微小区域的斑点和划痕使用开运算去除,字体中的小孔洞使用闭运算填充,所述的归一化采用基于笔画穿越数均衡的非线性归一化方法,单个书 法字图像归一化的目标大小是45×45像素点阵; 
3)将步骤2)处理后的单个书法字图像对应的书法字四个边界点位置、书法字水平和垂直方向平均笔画穿越数、书法字的投影值、书法字轮廓点存入步骤1)的特征数据库,得到书法字识别特征数据库; 
4)将待识别书法字图像按照步骤2)进行二值化、去噪、归一化处理,然后提取包括单个书法字图像中书法字的四个边界点位置、书法字水平和垂直方向平均笔画穿越数、书法字的投影值、书法字轮廓点的特征; 
5)利用待识别书法字图像中书法字的四个边界点位置、书法字水平和垂直方向平均笔画穿越数、书法字的投影值这三个特征比较书法字识别特征数据库里的数据,对书法字识别特征数据库里的单个书法字图像进行初步筛选,得到候选书法字图像; 
6)对候选书法字图像再利用书法字识别特征数据库里的书法字轮廓点的特征信息进一步进行相似度计算,按相似度大小排列给出候选书法字图像; 
7)对步骤6)中按相似度大小排列给出的候选书法字图像进行权重计算,合并汉字语义相同的候选书法字图像,最后识别输出。 
所述的步骤2)中:单个书法字图像转为灰度图像时,假设某个像素点p颜色的RGB值为(p.red,p.green,p.blue),那么灰度值的计算公式为: 
p.grey=0.11×p.red+0.59×p.green+0.30×p.blue; 
去噪时噪声块的最大尺寸被定义为3×3像素点,微小区域的噪声使用数学形态学的方法去除,其中的斑点和划痕使用开运算去除,字体中的小孔洞使用闭运算填充;归一化时,令f(x,y)为归一化之前M0×N0的单个书法字图像点阵,其中参数皆为自然数,M0表示单个书法字图像的像素宽度,N0表示单个书法字图像的像素长度,x=1,2,…M0,y=1,2,…N0,g(m,n)为归一化之后M1×N1的单个书法字图像点阵,m=1,2,…M1,n=1,2,…N1,令d(x,y)为单个书法字点阵图像f(x,y)在点(x,y)的笔划密度函数,定义为: 
Figure BDA00002751763200021
令H(x),V(y)分别为密度函数在水平和垂直方向上的密度投影,则有: 
H ( x ) = Σ x = 1 M 0 d ( x , y ) , V ( y ) = Σ y = 1 N 0 d ( x , y )
归一化算子写作: 
m = Σ i = 1 m H ( i ) × M 1 Σ i = 1 M 0 H ( i )
n = Σ j = 1 n H ( j ) × N 1 Σ j = 1 N 0 H ( j )
;归一化后所有单个书法字图像为45×45像素点阵。 
所述的步骤3)得到的书法字识别特征数据库包括:单个书法字图像对应的汉字语义;记录书法字最左最上、最右最下、最上最左和最下最右四个边界点坐标依次为left_top、right_down、top_left和down_right;书法字的笔画穿越数指扫描线在扫描书法字时候穿透的笔画个数,用一组垂直扫描线从左到右扫描二值化后的书法字图像,每当扫描线上像素点颜色由白变黑,即在对应的二值矩阵中,扫描线方向上的值由0变1,扫描值就加1,当扫描线穿过的第一个像素点为黑色时,扫描值也加1,扫描值是垂直笔画穿越数,所有垂直扫描线上笔画穿越数的平均值是垂直方向平均笔画穿越数,同样计算出水平方向平均笔画穿越数;书法字的投影值就像太阳照在物体上一样,从书法字的投影值大致判断出物体的大小,用x+y两个方向的投影值,x方向45个点,y方向45个点,两个串接在一起表示投影值;对书法字轮廓进行提取,书法字的一个轮廓点有x,y两个坐标值,用于匹配形状。 
所述的步骤5)包括:对待识别书法字与数据库中的每个候选书法字的四个边界点位置逐个比较,分别计算待识别书法字四个边界点与数据库中的每个候选书法字四个边界点相差的距离dist_left、dist_right、dist_top、dist_down,计算如下: 
dist _ left = | left _ top 0 - left _ top 1 | dist _ right = | right _ down 0 - right _ down 1 | dist _ top = | top _ left 0 - top _ left 1 | dist _ down = | down _ r ight 0 - down _ right 1 | ;
设定一个阈值λ1=10,当上式中的四个距离里有两个或更多距离超过λ1时,那么候选书法字与待识别书法字的差异非常大,删去该候选书法字;将待识别书法字的平均笔画穿越数与特征数据库里的候选书法字的平均笔画穿越数进行比较,计算相差距离,设定一个阈值λ2=2,超出阈值λ2的候选书法字直接删去;将待识别书法字的投影值与特征数据库里的候选书法字的投影值进行比较,计算相差距离,设定一个阈值λ3=8,超出阈值λ3的候选书法字直接删去。 
所述的步骤6)包括:对单个书法字图像中书法字轮廓上的任意点pi构造以pi为中心的极坐标系,坐标系将整个空间从方向上平均划分出8个方向,在弦上按近似log2r的宽度把半径 划为4份,这样,整个空间就被划分为32个区域,即32个bin,计算落入每个区域的像素点个数wi(k),其中k=1,2,…,32,形成一个32维的向量;整个书法字与一个n行32列的矩阵相对应,如下所示: 
对于待识别书法字图像中书法字的每一个点mi,在候选书法字中寻找对应点nj,计算CijCij定义如下: 
c ij = c ( m i , n j ) = 1 2 Σ k = 1 a 2 [ a ik - b jk ] 2 a ik + bjk
待识别书法字图像中书法字和候选书法字图像中书法字中的点pi最近似对应点的近似匹配值PMCL按以下公式计算: 
PMCi=min{C(pi,qj):1=0,1,2…m} 
两个书法字形状匹配值TMC大小是他们的所有轮廓点的近似匹配值的总和,定义如下: 
TMC = Σ i = 1 N ( PMC i + a | | p i - corres ( p i ) | | 2 )
其中,||pi-corres(pi)||为点pi与点corres(pi)之间的欧式距离,α为惩罚因子,两点离得距离越远,惩罚值就越大,用以上方法进行相似度计算后,按相似度大小排列给出接近待识别书法字形状的特征数据库里的候选书法字图像; 
所述的步骤7)包括:当上述步骤6)所得到的形状相似候选书法字图像中存在汉字语义相同的候选书法字图像时,为了统计得到识别结果,对每个候选书法字图像根据其排序和相似度赋予权重,记输入的候选书法字图像中书法字为I0,二值化的书法字为C0,进行相似度计算得到的前N个结果为I1,I2,...,IN,其二值化的书法字为C1,C2,…,CN,则每个结果的权重δi(i=1,2,…,N)定义如下: 
δ i = μ i 2 + Similarity ( C i , C 0 )
其中μ是一个经验参数,设为μ=0.1,表示计算结果中的序号在权重中所占的重要程度;假设相似度计算结果中前N个书法字共包含M个不同的标注A1,A2,…,AM(M≤N),Ii1,Ii2,…,
Figure BDA00002751763200045
是被标注为Ai的q个书法字,那么待识别书法字图像中书法字I0识别结果为Ai 的概率是 
prob i = Σ k = 1 q i δ ik Σ j = 1 M Σ k = 1 q j δ jk ;
把M个候选识别结果根据上面公式计算出的概率进行排序,最后按概率从大到小的顺序将识别的结果返回。 
本发明与现有技术相比具有的有益效果: 
1.该方法计算量小,能够在较短时间内给出较准确的识别结果; 
2.该方法对用户所提供的待识别书法字图像没有具体要求,后台会对用户所提供的图像进行进一步处理。 
附图说明
图1是书法字识别方法框架图; 
图2是“王”字的垂直笔画穿越数示意图; 
图3是书法字极坐标系示意图; 
图4是书法识别的结果实例。 
具体实施方式
一种书法字识别方法,图1为书法字识别***框架图,包括以下步骤: 
1)搜集互联网上的单个书法字图像,或者从整个书法作品图像里对书法字做最小包围盒切分得到单个书法字图像,得到单个书法字图像集合,然后标注单个书法字图像对应的汉字语义,存入特征数据库; 
2)对单个书法字图像进行二值化、去噪、归一化处理,二值化时,先将单个书法字图像转为灰度图像后使用自适应迭代法,通过将新阈值置为旧阈值以上及以下两区平均值的中点不断迭代求取最佳阈值,二值化后的单个书法字图像为白底黑字的二值化颜色矩阵,微小区域的噪声使用数学形态学的方法去除,微小区域的斑点和划痕使用开运算去除,字体中的小孔洞使用闭运算填充,所述的归一化采用基于笔画穿越数均衡的非线性归一化方法,单个书法字图像归一化的目标大小是45×45像素点阵; 
3)将步骤2)处理后的单个书法字图像对应的书法字四个边界点位置、书法字水平和垂直方向平均笔画穿越数、书法字的投影值、书法字轮廓点存入步骤1)的特征数据库,得到书法字识别特征数据库; 
4)将待识别书法字图像按照步骤2)进行二值化、去噪、归一化处理,然后提取包括单个书法字图像中书法字的四个边界点位置、书法字水平和垂直方向平均笔画穿越数、书法字 的投影值、书法字轮廓点的特征; 
5)利用待识别书法字图像中书法字的四个边界点位置、书法字水平和垂直方向平均笔画穿越数、书法字的投影值这三个特征比较书法字识别特征数据库里的数据,对书法字识别特征数据库里的单个书法字图像进行初步筛选,得到候选书法字图像; 
6)对候选书法字图像再利用书法字识别特征数据库里的书法字轮廓点的特征信息进一步进行相似度计算,按相似度大小排列给出候选书法字图像; 
7)对步骤6)中按相似度大小排列给出的候选书法字图像进行权重计算,合并汉字语义相同的候选书法字图像,最后识别输出。 
所述的步骤2)中:单个书法字图像转为灰度图像时,假设某个像素点p颜色的RGB值为(p.red,p.green,p.blue),那么灰度值的计算公式为: 
p.grey=0.11×p.red+0.59×p.green+0.30×p.blue; 
转为灰度图像后采用的自适应迭代法算法如下: 
Figure BDA00002751763200061
迭代算法中:oldthreshold表示旧阈值,sumup表示大于旧阈值的像素点的灰度值之和,sumdown表示小于旧阈值的像素点的灰度值之和,nup表示大于旧阈值的像素点的个数,ndown表示小于就阈值的像素点的个数,pixel.color表示像素点的灰度值;去噪时噪声块的最大尺寸被定义为3×3像素点,微小区域的噪声使用数学形态学的方法去除,其中的斑点和划痕使用开运算去除,字体中的小孔洞使用闭运算填充;归一化时,令f(x,y)为归一化之前M0×N0的单个书法字图像点阵,其中参数皆为自然数,M0表示单个书法字图像的像素宽度,N0表 示单个书法字图像的像素长度,x=1,2,…M0,y=1,2,…N0,g(m,n)为归一化之后M1×N1的单个书法字图像点阵,m=1,2,…M1,n=1,2,…N1,令d(x,y)为单个书法字点阵图像f(x,y)在点(x,y)的笔划密度函数,定义为: 
Figure BDA00002751763200071
令H(x),V(y)分别为密度函数在水平和垂直方向上的密度投影,则有: 
H ( x ) = Σ x = 1 M 0 d ( x , y ) , V ( y ) = Σ y = 1 N 0 d ( x , y )
归一化算子写作: 
m = Σ i = 1 m H ( i ) × M 1 Σ i = 1 M 0 H ( i )
n = Σ j = 1 n H ( j ) × N 1 Σ j = 1 N 0 H ( j )
;归一化后所有单个书法字图像为45×45像素点阵。 
所述的步骤3)得到的书法字识别特征数据库包括:单个书法字图像对应的汉字语义;记录书法字最左最上、最右最下、最上最左和最下最右四个边界点坐标依次为left_top、right_down、top_left和down_right;书法字的笔画穿越数指扫描线在扫描书法字时候穿透的笔画个数,用一组垂直扫描线从左到右扫描二值化后的书法字图像,每当扫描线上像素点颜色由白变黑,即在对应的二值矩阵中,扫描线方向上的值由0变1,扫描值就加1,当扫描线穿过的第一个像素点为黑色时,扫描值也加1,扫描值是垂直笔画穿越数,所有垂直扫描线上笔画穿越数的平均值是垂直方向平均笔画穿越数,同样计算出水平方向平均笔画穿越数,图2是“王”字的垂直笔画穿越数示意图;书法字的投影值就像太阳照在物体上一样,从书法字的投影值大致判断出物体的大小,用x+y两个方向的投影值,x方向45个点,y方向45个点,两个串接在一起表示投影值;对书法字轮廓进行提取,书法字的一个轮廓点有x,y两个坐标值,用于匹配形状。 
所述的步骤5)包括:对待识别书法字与数据库中的每个候选书法字的四个边界点位置逐个比较,分别计算待识别书法字四个边界点与数据库中的每个候选书法字四个边界点相差的距离dist_left、dist_right、dist_top、dist_down,计算如下: 
dist _ left = | left _ top 0 - left _ top 1 | dist _ right = | right _ down 0 - right _ down 1 | dist _ top = | top _ left 0 - top _ left 1 | dist _ down = | down _ r ight 0 - down _ right 1 | ;
设定一个阈值λ1=10,当上式中的四个距离里有两个或更多距离超过λ1时,那么候选书法字与待识别书法字的差异非常大,删去该候选书法字;将待识别书法字的平均笔画穿越数与特征数据库里的候选书法字的平均笔画穿越数进行比较,计算相差距离,设定一个阈值λ2=2,超出阈值λ2的候选书法字直接删去;将待识别书法字的投影值与特征数据库里的候选书法字的投影值进行比较,计算相差距离,设定一个阈值λ3=8,超出阈值λ3的候选书法字直接删去。 
所述的步骤6)包括:对单个书法字图像中书法字轮廓上的任意点pi,构造以pi为中心的极坐标系,坐标系将整个空间从方向上平均划分出8个方向,在弦上按近似log2r的宽度把半径划为4份,这样,整个空间就被划分为32个区域,即32个bin,计算落入每个区域的像素点个数wi(k),其中k=1,2,…,32,形成一个32维的向量,图3是书法字极坐标系示意图;整个书法字与一个n行32列的矩阵相对应,如下所示: 
Figure DEST_PATH_IMAGE004
对于待识别书法字图像中书法字的每一个点mi,在候选书法字中寻找对应点nj,计算Cij,Cij定义如下: 
c ij = c ( m i , n j ) = 1 2 Σ k = 1 a 2 [ a ik - b jk ] 2 a ik + b jk
待识别书法字图像中书法字和候选书法字图像中书法字中的点pi最近似对应点的近似匹配值PMCL按以下公式计算: 
PMCi=min{C(pi,qi):1=0,1,2…m} 
两个书法字形状匹配值TMC大小是他们的所有轮廓点的近似匹配值的总和,定义如下: 
TMC = Σ i = 1 N ( PMC i + a | | p i - corres ( p i ) | | 2 )
其中,||pi-corres(pi)||为点pi与点corres(pi)之间的欧式距离,α为惩罚因子,两点离得距 离越远,惩罚值就越大,用以上方法进行相似度计算后,按相似度大小排列给出接近待识别书法字形状的特征数据库里的候选书法字图像; 
所述的步骤7)包括:当上述步骤6)所得到的形状相似候选书法字图像中存在汉字语义相同的候选书法字图像时,为了统计得到识别结果,对每个候选书法字图像根据其排序和相似度赋予权重,记输入的候选书法字图像中书法字为I0,二值化的书法字为C0,进行相似度计算得到的前N个结果为I1,I2,...,IN,其二值化的书法字为C1,C2,…,CN,则每个结果的权重δi(i=1,2,…,N)定义如下: 
δ i = μ i 2 + Similarity ( C i , C 0 )
其中μ是一个经验参数,设为μ=0.1,表示计算结果中的序号在权重中所占的重要程度;假设相似度计算结果中前N个书法字共包含M个不同的标注A1,A2,…,AM(M≤N),Ii1,Ii2,…,
Figure BDA00002751763200092
是被标注为Ai的q个书法字,那么待识别书法字图像中书法字I0识别结果为Ai的概率是 
prob i = Σ k = 1 q i δ ik Σ j = 1 M Σ k = 1 q j δ jk ;
把M个候选识别结果根据上面公式计算出的概率进行排序,最后按概率从大到小的顺序将识别的结果返回。 
实施例 
如附图4所示,给出了两个书法字识别的结果实例。下面结合本发明的方法详细说明该实例实施的具体步骤,如下: 
(1)搜集互联网上的单个书法字图像,或者从整个书法作品图像里对书法字做最小包围盒切分得到单个书法字图像,得到单个书法字图像集合,然后标注单个书法字图像对应的汉字语义,存入特征数据库; 
(2)对单个书法字图像进行二值化、去噪、归一化处理; 
(3)构建建立特征数据库,用于识别时的初步筛选以及相似度计算,特征数据库包括步骤(1)中的汉字语义、书法字四个边界点位置、书法字水平和垂直方向平均笔画穿越数、书法字的投影值、书法字轮廓点; 
(4)将待识别法字图像按照步骤2)进行二值化、去噪、归一化处理,然后提取其特征,所提取的特征包括书法字四个边界点位置、书法字水平和垂直方向平均笔画穿越数、书法字的投影值、书法字轮廓点; 
(5)利用待识别书法字的四个边界点位置、书法字水平和垂直方向平均笔画穿越数、书法字的投影值这三个特征比较特征数据库里的数据,对书法字进行初步筛选; 
(6)对候选书法字图像再利用书法字识别特征数据库里的书法字轮廓点的特征信息进一步进行相似度计算,按相似度大小排列给出候选书法字图像 
(7)对步骤6)中按相似度大小给出的候选书法字图像进行权重计算,合并汉字语义相同的书法字,最后识别输出。 
本实例的运行结果在附图4中显示,两个待识别书法字图像中的书法字都是单字黄底的书法字,将其二值化、去噪和归一化处理后提取其特征,与特征数据库里的书法字进行比较筛选,最后识别输出。 

Claims (6)

1. 一种书法字识别方法,其特征在于,包括以下步骤:
1)搜集互联网上的单个书法字图像,或者从整个书法作品图像里对书法字做最小包围盒切分得到单个书法字图像,得到单个书法字图像集合,然后标注单个书法字图像对应的汉字语义,存入特征数据库;
2)对单个书法字图像进行二值化、去噪、归一化处理,二值化时,先将单个书法字图像转为灰度图像后使用自适应迭代法,通过将新阈值置为旧阈值以上及以下两区平均值的中点不断迭代求取最佳阈值,二值化后的单个书法字图像为白底黑字的二值化颜色矩阵,微小区域的噪声使用数学形态学的方法去除,微小区域的斑点和划痕使用开运算去除,字体中的小孔洞使用闭运算填充,所述的归一化采用基于笔画穿越数均衡的非线性归一化方法,单个书法字图像归一化的目标大小是45×45像素点阵;
3)将步骤2)处理后的单个书法字图像对应的书法字四个边界点位置、书法字水平和垂直方向平均笔画穿越数、书法字的投影值、书法字轮廓点存入步骤1)的特征数据库,得到书法字识别特征数据库;
4)将待识别书法字图像按照步骤2)进行二值化、去噪、归一化处理,然后提取包括单个书法字图像中书法字的四个边界点位置、书法字水平和垂直方向平均笔画穿越数、书法字的投影值、书法字轮廓点的特征;
5)利用待识别书法字图像中书法字的四个边界点位置、书法字水平和垂直方向平均笔画穿越数、书法字的投影值这三个特征比较书法字识别特征数据库里的数据,对书法字识别特征数据库里的单个书法字图像进行初步筛选,得到候选书法字图像;
6)对候选书法字图像再利用书法字识别特征数据库里的书法字轮廓点的特征信息进一步进行相似度计算,按相似度大小排列给出候选书法字图像;
7)对步骤6)中按相似度大小排列给出的候选书法字图像进行权重计算,合并汉字语义相同的候选书法字图像,最后识别输出。
2.根据权利要求1所述的一种书法字识别方法,其特征在于,所述的步骤2)中:单个书法字图像转为灰度图像时,假设某个像素点p颜色的RGB值为(p.red,p.green,p.blue),那么灰度值的计算公式为:
p.grey=0.11×p.red+0.59×p.green+0.3×p.blue;
去噪时噪声块的最大尺寸被定义为3×3像素点,微小区域的噪声使用数学形态学的方法去除,其中的斑点和划痕使用开运算去除,字体中的小孔洞使用闭运算填充;归一化时,令f(x,y) 为归一化之前M0×N0的单个书法字图像点阵,其中参数皆为自然数,M0表示单个书法字图像的像素宽度,N0表示单个书法字图像的像素长度,x=1,2,…M0,y=1,2,…N0,g(m,n)为归一化之后M1×N1的单个书法字图像点阵,m=1,2,…M1, n=1,2,…N1,令d(x,y)为单个书法字点阵图像f(x,y)在点(x,y)的笔划密度函数,定义为:
Figure FDA0000275176311
令H(x),V(y)分别为密度函数在水平和垂直方向上的密度投影,则有:
,   
Figure FDA0000275176313
归一化算子写作:
Figure FDA0000275176314
Figure FDA0000275176315
;归一化后所有单个书法字图像为45×45像素点阵。
3.根据权利要求1所述的一种书法字识别方法,其特征在于,所述的步骤3)得到的书法字识别特征数据库包括:单个书法字图像对应的汉字语义;记录书法字最左最上、最右最下、最上最左和最下最右四个边界点坐标依次为left_top、right_down、top_left和down_right;书法字的笔画穿越数指扫描线在扫描书法字时候穿透的笔画个数,用一组垂直扫描线从左到右扫描二值化后的书法字图像,每当扫描线上像素点颜色由白变黑,即在对应的二值矩阵中,扫描线方向上的值由0变1,扫描值就加1,当扫描线穿过的第一个像素点为黑色时,扫描值也加1,扫描值是垂直笔画穿越数,所有垂直扫描线上笔画穿越数的平均值是垂直方向平均笔画穿越数,同样计算出水平方向平均笔画穿越数;书法字的投影值就像太阳照在物体上一样,从书法字的投影值大致判断出物体的大小,用x+y两个方向的投影值,x方向45个点,y方向45个点,两个串接在一起表示投影值;对书法字轮廓进行提取,书法字的一个轮廓点有x,y两个坐标值,用于匹配形状。
4.根据权利要求1所述的一种书法字识别方法,其特征在于,所述的步骤5)包括:对待识别书法字与数据库中的每个候选书法字的四个边界点位置逐个比较,分别计算待识别书法字 四个边界点与数据库中的每个候选书法字四个边界点相差的距离dist_left、dist_right、dist_top、dist_down,计算如下:
Figure FDA0000275176316
设定一个阈值λ1=10,当上式中的四个距离里有两个或更多距离超过λ1时,那么候选书法字与待识别书法字的差异非常大,删去该候选书法字;将待识别书法字的平均笔画穿越数与特征数据库里的候选书法字的平均笔画穿越数进行比较,计算相差距离,设定一个阈值λ2=2,超出阈值λ2的候选书法字直接删去;将待识别书法字的投影值与特征数据库里的候选书法字的投影值进行比较,计算相差距离,设定一个阈值λ3=8,超出阈值λ3的候选书法字直接删去。
5.根据权利要求1所述的一种书法字识别方法,其特征在于,所述的步骤6)包括:对单个书法字图像中书法字轮廓上的任意点pi,构造以pi为中心的极坐标系,坐标系将整个空间从方向上平均划分出8个方向,在弦上按近似log2r的宽度把半径划为4份,这样,整个空间就被划分为32个区域,即32个bin,计算落入每个区域的像素点个数wi(k),其中k=1,2,…,32,形成一个32维的向量;整个书法字与一个n行32列的矩阵相对应,如下所示:
Figure FDA0000275176317
对于待识别书法字图像中书法字的每一个点mi,在候选书法字中寻找对应点nj,计算Cij,Cij定义如下:
Figure FDA0000275176318
待识别书法字图像中书法字和候选书法字图像中书法字中的点pi最近似对应点的近似匹配值PMCi按以下公式计算:
PMCi=min{C(pi,qj):j=0,1,2…m}
两个书法字形状匹配值TMC大小是他们的所有轮廓点的近似匹配值的总和,定义如下:
Figure FDA0000275176319
其中,||pi-corres(pi)||为点pi与点corres(pi)之间的欧式距离,α为惩罚因子,两点离得距离越远,惩罚值就越大,用以上方法进行相似度计算后,按相似度大小排列给出接近待识别书法字形状的特征数据库里的候选书法字图像。
6.根据权利要求1所述的一种书法字识别方法,其特征在于,所述的步骤7)包括:当上述步骤6)所得到的形状相似候选书法字图像中存在汉字语义相同的候选书法字图像时,为了统计得到识别结果,对每个候选书法字图像根据其排序和相似度赋予权重,记输入的候选书法字图像中书法字为I0,二值化的书法字为C0,进行相似度计算得到的前N个结果为I1,I2,…,IN,其二值化的书法字为C1,C2,…,CN,则每个结果的权重δi(i=1,2,…,N)定义如下:
其中μ是一个经验参数,设为μ=0.1,表示计算结果中的序号在权重中所占的重要程度;假设相似度计算结果中前N个书法字共包含M个不同的标注A1,A2,…,AM(M≤N),
Figure FDA00002751763111
 是被标注为Ai的q个书法字,那么待识别书法字图像中书法字I0识别结果为Ai的概率是
Figure FDA00002751763112
把M个候选识别结果根据上面公式计算出的概率进行排序,最后按概率从大到小的顺序将识别的结果返回。 
CN2013100205100A 2013-01-18 2013-01-18 书法字识别方法 Pending CN103093240A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2013100205100A CN103093240A (zh) 2013-01-18 2013-01-18 书法字识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2013100205100A CN103093240A (zh) 2013-01-18 2013-01-18 书法字识别方法

Publications (1)

Publication Number Publication Date
CN103093240A true CN103093240A (zh) 2013-05-08

Family

ID=48205788

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2013100205100A Pending CN103093240A (zh) 2013-01-18 2013-01-18 书法字识别方法

Country Status (1)

Country Link
CN (1) CN103093240A (zh)

Cited By (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103268363A (zh) * 2013-06-06 2013-08-28 哈尔滨工业大学 一种基于弹性hog特征和ddtw匹配的中国书法图像检索方法
CN104182748A (zh) * 2014-08-15 2014-12-03 电子科技大学 一种基于拆分匹配的汉字笔画自动提取方法
CN105117741A (zh) * 2015-09-28 2015-12-02 上海海事大学 一种书法字风格的识别方法
CN105468732A (zh) * 2015-11-23 2016-04-06 中国科学院信息工程研究所 一种图像关键词检查方法及装置
CN106503688A (zh) * 2016-11-17 2017-03-15 西安理工大学 基于小波平滑的书法字最小包围盒提取方法
CN106570538A (zh) * 2015-10-10 2017-04-19 北大方正集团有限公司 字符图片处理方法和装置
CN106650716A (zh) * 2016-12-12 2017-05-10 福建字客网络科技有限公司 一种计算机字体识别方法及装置
CN107145244A (zh) * 2017-04-26 2017-09-08 北京汉王数字科技有限公司 一种异形字符输入方法、装置及电子设备
CN107578039A (zh) * 2017-10-08 2018-01-12 王奕博 基于数字图像处理技术的字迹轮廓比对方法
CN109147002A (zh) * 2018-06-27 2019-01-04 北京捷通华声科技股份有限公司 一种图像处理方法和装置
CN109272025A (zh) * 2018-08-29 2019-01-25 昆明理工大学 一种相似常用汉字查找方法
CN109344834A (zh) * 2018-09-06 2019-02-15 昆明理工大学 一种基于图像处理的残缺汉字识别方法
CN109478230A (zh) * 2016-03-18 2019-03-15 光学技术注册协会莱布尼兹研究所 通过分割概览图像来检查分布式对象的方法
CN109685059A (zh) * 2018-11-06 2019-04-26 平安科技(深圳)有限公司 文字图像标注方法、装置及计算机可读存储介质
CN110009065A (zh) * 2019-01-14 2019-07-12 岭南师范学院 一种基于图像二值化的书法比对方法
CN110532864A (zh) * 2019-07-19 2019-12-03 中科君胜(深圳)智能数据科技发展有限公司 软笔书法临摹相似性评价方法
CN111160147A (zh) * 2019-12-16 2020-05-15 华南理工大学 一种书法作品图像的裁剪和识别方法
CN112364867A (zh) * 2020-11-24 2021-02-12 上海墨说科教设备有限公司 一种书法作业智能批改方法、***、电子设备及存储介质
CN112508024A (zh) * 2020-11-11 2021-03-16 广西电网有限责任公司南宁供电局 一种变压器电气铭牌钢印字体智能识别方法
CN112840622A (zh) * 2018-12-19 2021-05-25 深圳市欢太科技有限公司 推送方法及相关产品
CN113326009A (zh) * 2021-03-05 2021-08-31 临沂大学 一种纸质书法作品的复制方法和装置
CN114610157A (zh) * 2022-03-23 2022-06-10 北京拙河科技有限公司 一种基于手势交互的方法及***

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1920819A (zh) * 2006-09-14 2007-02-28 浙江大学 毛笔书法字检索方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1920819A (zh) * 2006-09-14 2007-02-28 浙江大学 毛笔书法字检索方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
俞凯: "《计算机书法若干关键技术研究》", 15 August 2011, CNKI中国博士学位论文全文数据库 *
俞凯等: "基于骨架相似性的书法字检索", 《计算机辅助设计与图形学学报》 *
居琰: "《基于多层次信息融合的手写体汉字识别研究》", 15 June 2003, CNKI中国优秀博士学位论文全文数据库 *

Cited By (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103268363B (zh) * 2013-06-06 2016-06-22 哈尔滨工业大学 一种基于弹性hog特征和ddtw匹配的中国书法图像检索方法
CN103268363A (zh) * 2013-06-06 2013-08-28 哈尔滨工业大学 一种基于弹性hog特征和ddtw匹配的中国书法图像检索方法
CN104182748B (zh) * 2014-08-15 2018-04-13 电子科技大学 一种基于拆分匹配的汉字笔画自动提取方法
CN104182748A (zh) * 2014-08-15 2014-12-03 电子科技大学 一种基于拆分匹配的汉字笔画自动提取方法
CN105117741A (zh) * 2015-09-28 2015-12-02 上海海事大学 一种书法字风格的识别方法
CN106570538A (zh) * 2015-10-10 2017-04-19 北大方正集团有限公司 字符图片处理方法和装置
CN106570538B (zh) * 2015-10-10 2019-08-30 北大方正集团有限公司 字符图片处理方法和装置
CN105468732A (zh) * 2015-11-23 2016-04-06 中国科学院信息工程研究所 一种图像关键词检查方法及装置
CN109478230A (zh) * 2016-03-18 2019-03-15 光学技术注册协会莱布尼兹研究所 通过分割概览图像来检查分布式对象的方法
CN106503688A (zh) * 2016-11-17 2017-03-15 西安理工大学 基于小波平滑的书法字最小包围盒提取方法
CN106650716A (zh) * 2016-12-12 2017-05-10 福建字客网络科技有限公司 一种计算机字体识别方法及装置
CN107145244A (zh) * 2017-04-26 2017-09-08 北京汉王数字科技有限公司 一种异形字符输入方法、装置及电子设备
CN107578039A (zh) * 2017-10-08 2018-01-12 王奕博 基于数字图像处理技术的字迹轮廓比对方法
CN109147002A (zh) * 2018-06-27 2019-01-04 北京捷通华声科技股份有限公司 一种图像处理方法和装置
CN109147002B (zh) * 2018-06-27 2023-06-20 北京捷通华声科技股份有限公司 一种图像处理方法和装置
CN109272025A (zh) * 2018-08-29 2019-01-25 昆明理工大学 一种相似常用汉字查找方法
CN109344834A (zh) * 2018-09-06 2019-02-15 昆明理工大学 一种基于图像处理的残缺汉字识别方法
CN109685059A (zh) * 2018-11-06 2019-04-26 平安科技(深圳)有限公司 文字图像标注方法、装置及计算机可读存储介质
CN112840622B (zh) * 2018-12-19 2023-01-06 深圳市欢太科技有限公司 推送方法及相关产品
CN112840622A (zh) * 2018-12-19 2021-05-25 深圳市欢太科技有限公司 推送方法及相关产品
CN110009065A (zh) * 2019-01-14 2019-07-12 岭南师范学院 一种基于图像二值化的书法比对方法
CN110532864A (zh) * 2019-07-19 2019-12-03 中科君胜(深圳)智能数据科技发展有限公司 软笔书法临摹相似性评价方法
CN110532864B (zh) * 2019-07-19 2023-01-31 中科君胜(深圳)智能数据科技发展有限公司 软笔书法临摹相似性评价方法
CN111160147A (zh) * 2019-12-16 2020-05-15 华南理工大学 一种书法作品图像的裁剪和识别方法
CN112508024A (zh) * 2020-11-11 2021-03-16 广西电网有限责任公司南宁供电局 一种变压器电气铭牌钢印字体智能识别方法
CN112364867A (zh) * 2020-11-24 2021-02-12 上海墨说科教设备有限公司 一种书法作业智能批改方法、***、电子设备及存储介质
CN112364867B (zh) * 2020-11-24 2023-08-04 上海墨说科教设备有限公司 一种书法作业智能批改方法、***、电子设备及存储介质
CN113326009A (zh) * 2021-03-05 2021-08-31 临沂大学 一种纸质书法作品的复制方法和装置
CN114610157A (zh) * 2022-03-23 2022-06-10 北京拙河科技有限公司 一种基于手势交互的方法及***

Similar Documents

Publication Publication Date Title
CN103093240A (zh) 书法字识别方法
CN103049763B (zh) 一种基于上下文约束的目标识别方法
Lawgali A survey on Arabic character recognition
CN109948510B (zh) 一种文档图像实例分割方法及装置
Mohammad et al. Optical character recognition implementation using pattern matching
JP5379085B2 (ja) スキャンされた文書画像内の前景画素群の連結グループをマーキング種類に基づき分類する方法及びシステム
Mahmoud Recognition of writer-independent off-line handwritten Arabic (Indian) numerals using hidden Markov models
CN109871851B (zh) 一种基于卷积神经网络算法的汉字书写规范性判定方法
Burrow Arabic handwriting recognition
CN110298376B (zh) 一种基于改进b-cnn的银行票据图像分类方法
CN104408449B (zh) 智能移动终端场景文字处理方法
Singh et al. Offline script identification from multilingual indic-script documents: a state-of-the-art
CN104809481A (zh) 一种基于自适应色彩聚类的自然场景文本检测的方法
Du et al. Wavelet domain local binary pattern features for writer identification
CN110991439B (zh) 一种基于像素级多特征联合分类的手写体字符的提取方法
CN112069900A (zh) 基于卷积神经网络的票据文字识别方法及***
Vijaya Kumar et al. Classification and recognition of handwritten digits by using mathematical morphology
CN105117741A (zh) 一种书法字风格的识别方法
CN103473545A (zh) 一种基于多特征的文本图像相似度度量方法
Awaidah et al. A multiple feature/resolution scheme to Arabic (Indian) numerals recognition using hidden Markov models
CN107909073A (zh) 多维局部二值模式和机器学习手写乐谱谱线删除方法
Ntzios et al. An old greek handwritten OCR system based on an efficient segmentation-free approach
Raj et al. Grantha script recognition from ancient palm leaves using histogram of orientation shape context
Ramdan et al. A novel method to detect segmentation points of arabic words using peaks and neural network
Prommas et al. CNN-based Thai handwritten OCR: an application for automated mail sorting

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20130508