CN1664846A - 基于统计结构特征的联机手写汉字识别方法 - Google Patents

基于统计结构特征的联机手写汉字识别方法 Download PDF

Info

Publication number
CN1664846A
CN1664846A CN 200510011510 CN200510011510A CN1664846A CN 1664846 A CN1664846 A CN 1664846A CN 200510011510 CN200510011510 CN 200510011510 CN 200510011510 A CN200510011510 A CN 200510011510A CN 1664846 A CN1664846 A CN 1664846A
Authority
CN
China
Prior art keywords
point
prime
sigma
person
handwriting
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN 200510011510
Other languages
English (en)
Other versions
CN1333366C (zh
Inventor
丁晓青
鲁湛
刘长松
陈彦
彭良瑞
方弛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tsinghua University
Original Assignee
Tsinghua University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tsinghua University filed Critical Tsinghua University
Priority to CNB200510011510XA priority Critical patent/CN1333366C/zh
Publication of CN1664846A publication Critical patent/CN1664846A/zh
Application granted granted Critical
Publication of CN1333366C publication Critical patent/CN1333366C/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Character Discrimination (AREA)

Abstract

基于统计结构特征的联机手写汉字识别方法,属于汉字识别技术领域,其特征在于:先对处理的字符对象进行预处理,以消除噪声干扰,消除部分书写变形并把待识汉字所占空间映射到一个固定大小的位置;提取包括方向特征和边缘特征在内的能很好反映联机手写汉字特征在内的统计结构特征,再把得到的这些原始特征使用线性鉴别分析方法压缩变换为识别特征;最后采用改进了的高斯二次分类器模型完成训练和识别,该模型用一个事先设定的常数值代替较小的特征值以消除较小的特征值估计不准确对分类性能的不利影响。本发明的平均识别率为98.43%,取得令人满意的效果。

Description

基于统计结构特征的联机手写汉字识别方法
技术领域
基于统计结构特征的联机手写汉字识别方法属于联机手写汉字识别领域。
背景技术
所谓联机手写汉字识别,就是计算机通过一种数字化仪实时地对人的书写笔迹进行采样,然后对所得数据进行自动识别的一种技术。这种技术可以使人们以自然的书写方式将汉字输入计算机或智能设备,容易满足用户一般化和小型化的要求,并且可以与其它输入方法如语音识别技术很好的互补,形成高效的汉字输入***。所以,联机手写汉字识别方法在计算机应用中具有很重要的理论和实际意义。
到目前为止,在众多研究者的不懈努力下,联机手写汉字识别技术已经有了比较大的进展。通常的联机手写汉字识别方法有两大类:一种是基于整字模式分析的统计识别方法,强调从全局的角度描述和利用字符信息,其代表方法是用特征空间中的一组高维数值特征向量描述汉字模式,并以它们在特征空间中的分布为依据运用决策理论做出分类判决。另一种是基于局部子结构分析的识别方法,主要特征描述以结构分解后的局部笔划信息为主,代表方法有字符串模型,属性关系图模型,以及隐含Markov模型等。由于统计识别方法以整个汉字为单位进行特征提取和匹配,充分地利用了计算机的数值处理能力,有利于在特征空间中用数学方法寻找汉字的全局相关结构特征,而且具有速度快、性能好的优点,所以本发明使用了统计方法来识别联机手写汉字。
统计识别方法成功的关键在于统计特征集合的有效性,亦即取决于不同字符的模式能在多大程度上在特征空间分开。在公开文献报导中,联机汉字的统计特征主要采用变换系数特征,该特征较适用于笔划数较少和曲弧形笔划的字符,如英文数字和日文假名等。汉字内高频分量丰富,变换系数特征的效果不佳。在脱机汉字识别方法的研究中提出了一些统计结构数值特征,如方向线素特征、网格特征、边框特征、笔划密度特征、背景特征等等,取得了比较不错的识别效果。有少数文献试图在联机汉字识别中引入这些统计结构特征,但是由于没有考虑到联机手写汉字的特性,识别性能比较差。
本发明就是在必要的预处理的基础上,设计和提取能够适应联机手写汉字特性的统计结构特征,实现了高性能的联机手写汉字识别***,这是目前其它所有文献中还没有见到的。
发明内容
本发明的目的在于实现一个基于统计结构特征的联机手写汉字识别方法。本识别方法以单个的联机手写汉字字符作为处理对象,首先对处理的字符对象进行必要的预处理,然后提取出能很好反映联机手写汉字特点的统计结构特征,再将得到的这些原始特征使用线性鉴别分析LDA压缩变换为识别特征,最后用改进型二次分类器MQDF进行识别。
本发明由以下几部分组成:预处理、统计结构特征的提取、特征变换、分类器设计。
1.预处理
预处理的目的是在识别之前尽量消除笔迹中的噪声和书写变形,使待识汉字有一个更好的识别基础。其任务一是滤除笔迹采集设备和书写者造成的噪声干扰,如孤立点噪声、锯齿形噪声、笔速不匀等,主要处理方法为滤波平滑和重新采样;二是对待识汉字作整形处理以消除部分书写变形,包括线性归一化、非线性归一化两个功能,使待识汉字所占空间区域映射到一个大小固定的位置,而且整形后字符笔划在空间分布上更加均匀。
设一个联机手写汉字的笔迹为:
P(x1,y1),P(x2,y2),…,P(xi,yi),(break),P(xi+1,yi+1),…,P(xN,yN)。
这是计算机通过数字化仪实时地对书写时笔尖的移动轨迹进行采样得到的一系列从时间上依序排列的点坐标,(break)标记代表两个自然笔划间抬笔和落笔的中断。
去除孤立点噪声是指从笔迹点序列中去除只由一两个点组成的笔划。滤除锯齿形噪声的方法是对相邻点的坐标值进行加权平均,达到低通滤波的效果。滤波公式为:
x i ′ = 1 4 ( x i - 1 + 2 · x i + x i + 1 )
y i ′ = 1 4 ( y i - 1 + 2 · y i + y i + 1 )
消除笔速不匀的重新采样方法是对于书写的轨迹用一个固定长度间隔重新采样,使得一定长度的笔划用一定数量的点来代表,其公式为:
xj″=[xi′·(si+1-jL)+xi+1′·(jL-si)]/di
yj″=[yi′·(si+1-jL)+yi+1′·(jL-si)]/di
上式中,L为固定采样间隔,取值为常数1;(xi′,yi′)为待采样笔划的N个坐标点,i满足1≤i≤N且si≤jL<si+1 d i = ( x i + 1 ′ - x i ′ ) 2 + ( y i + 1 ′ - y i ′ ) 2 为两个点之间的长度; S i = Σ k = 0 i - 1 d k 为累计长度,并设定 s 0 = 0 ; ( x j ′ ′ , y j ′ ′ ) , j = 0,1 , · · · , [ s N L ] 为重新采样得到的新坐标点。
整形处理需要得到各笔迹点在变换后的新坐标,在本发明中通过密度均衡法来计算。首先将联机汉字的笔迹转换成汉字图像[f(x″,y″)]W×H,整形变换前的图像宽度为W,高度为H,任何一个笔迹点P(xi″,yi″)坐标处对应黑象素点f(xi″,yi″)=1,其余为白象素点f(x″,y″)=0。U(x″),V(y″)分别表示象素点在水平和垂直方向上的密度投影,即:
U ( x ′ ′ ) = Σ y = 1 H f ( x ′ ′ , y ′ ′ ) + α U - - x ′ ′ = 1,2 , . . . , W
V ( y ′ ′ ) = Σ x = 1 W f ( x ′ ′ , y ′ ′ ) + α V - - y ′ ′ = 1,2 , . . . , H
其中,αU,αV为偏置常数,此处设定αU=αV=6。则原坐标为(x″,y″)的笔迹点的新坐标为(x’″,y’″):
x ′ ′ ′ = Σ k = 1 x ′ ′ U ( k ) × W ′ Σ k = 1 W U ( k ) , y ′ ′ ′ = Σ l = 1 y ′ ′ V ( l ) × H ′ Σ l = 1 H V ( l )
其中,W′为处理后的最大横坐标,H′为处理后的最大纵坐标,这两个值是处理后的笔迹点坐标范围的期望值,需要在整形处理之前预先设定好,此处都设为64。
预处理的最后一个步骤是把每个自然笔划内的笔迹点都依序首尾相连,连线上与原笔迹点不重合的点***笔迹序列,并消除相邻笔迹点中的重合点。
2.统计结构特征的提取
统计结构特征的提取是在预处理之后的联机手写汉字笔迹上进行的。本发明通过仔细研究联机手写汉字的结构特性,设计和提取了两种统计结构特征,分别称为方向特征和边缘特征。
2.1方向特征的提取
方向特征的提取结果也分为两种,称为相邻点方向特征和相邻拐点方向特征。
2.1.1相邻点方向特征
首先计算每个笔迹点的方向:在笔迹点坐标序列中,任取一点Pi,除最后一点外,都有至少一个后继点Pj(j>i),我们把从Pi指向Pj的有向线段的方向设定为Pi点的方向值θi,其值域范围为[0°,360°),如图3所示,(a)为点Pi到相邻点Pi+1的方向,(b)为拐点Pi到相邻拐点Pj的方向,(c)为有向线段方向角度的计算示意图。当j=i+1时,该方向值称为相邻点方向。
θi计算方法为,设(Xi,Yi)为点Pi的坐标,(Xj,Yj)为点Pj的坐标。
由于θi的三角正切函数 tg ( θ i ) = Y j - Y i X j - X i
θ i = arctg ( Y j - Y i X j - X i )
然后计算每个笔迹点的方向属性系数。所谓笔迹点的方向属性系数,是指以该点的方向值为自变量,利用图4所示的梯形和半梯形函数,计算得到的该点的4种函数值:
横方向属性系数函数
Figure A20051001151000123
竖方向属性系数函数
Figure A20051001151000124
撇方向属性系数函数
捺方向属性系数函数
Figure A20051001151000126
上面六个参数α16是角度阈值,它们的作用是确定方向属性系数函数的形状,在本发明中分别设为:α1=-10°,α2=260°,α3=280°,α4=250°,α5=300°,α6=330°。
得到方向属性系数之后,把笔迹点图像的坐标空间均匀划分成K1×K1个子块,如图5所示。分别统计每个子块中所有笔迹点的各自4种方向属性系数之和,共得到K1×K1×4维特征。以第(k,l)(这里1≤k≤K1,1≤l≤K1)个子块为例,统计得到的4维特征分别为: F k , l ( h ) = Σ P ( x , y ) ∈ D ( k , l ) f ( h ) ( θ ) , θ为点P(x,y)的方向值; F k , l ( s ) = Σ P ( x , y ) ∈ D ( k , l ) f ( s ) ( θ ) , θ为点P(x,y)的方向值; F k , l ( p ) = Σ P ( x , y ) ∈ D ( k , l ) f ( p ) ( θ ) , θ为点P(x,y)的方向值; F k , l ( n ) = Σ P ( x , y ) ∈ D ( k , l ) f ( n ) ( θ ) , θ为点P(x,y)的方向值;
2.1.2相邻拐点方向特征
当笔迹颤动时,相邻点方向的计算会产生较大的偏差,所以我们还设计了相邻拐点方向,即把Pi和Pj设定为笔迹点中相邻的拐点,重新计算每个笔迹点的方向。所谓拐点是指笔划书写的方向前后变化剧烈的点,同时把笔划端点也设定为一种拐点。拐点的确定根据多边形逼近的基本方法:先计算笔划中每个点与相邻点间张角的余弦值。拐点的判定是当张角γ的余弦值出现最大值并大于设定阈值,设为-0.8,此时γ约为2.5弧度。
张角γ的余弦值可利用三角余弦定理计算。设a,b,c分别为当前笔迹点与前后相邻笔迹点构成的三角形的三边。张角γ为边a,b的夹角,c为张角γ的对边,先根据三角形顶点的坐标分别计算三边的长度,由余弦定理可求得 cos γ = c 2 - a 2 - b 2 2 ab . 如图6所示。
点Pi和Pj,j>i为笔迹点中相邻的拐点,所有包括Pi点在内的在这两点之间的笔迹点的方向都设定为从点Pi指向点Pj的有向线段方向。
重新计算每个笔迹点相邻拐点的方向属性系数并统计每个空间划分子块中的4种方向属性系数之和,得到另外K1×K1×4维特征。
方向特征是这两种特征的合并,共有K1×K1×8维特征。
2.2边缘特征的提取
边缘特征与方向特征不同之处在于边缘特征能较好地反映出汉字的***结构信息。
以从左到右方向为例,提取边缘特征的方法为:把预处理后的联机汉字笔迹所对应图像的左半部分空间等距分为K2个横向子区域,如图7(a)所示。在每一个子区域内,从箭头方向,即图像左边缘往右进行逐行扫描。若第i次行扫描时,首次扫描到某个坐标点为笔迹点时,计算这个笔迹点的4个相邻点方向属性系数,记做fi,1 (h)、fi,1 (s)、fi,1 (p)、fi,1 (n),如果一直没有扫描到笔迹点,则这4个系数为0;继续扫描,当再次扫描到另外某个坐标点为笔迹点时,计算这个笔迹点的相邻点方向属性系数,记做fi,2 (h)、fi,2 (s)、fi,2 (p)、fi,2 (n),同样的,如果一直没有再次扫描到笔迹点,则这4个系数为0。一直到i次行扫描完毕,分别累计各行得到的以上系数,得到8维特征: Σ i f i , 1 ( h ) , Σ i f i , 1 ( s ) , Σ i f i , 1 ( p ) , Σ i f i , 1 ( n ) , Σ i f i , 2 ( h ) , Σ i f i , 2 ( s ) , Σ i f i , 2 ( p ) , Σ i f i , 2 ( n ) . K2个子区域共得到K2×8维边缘特征。
从其余7个箭头方向,即右、上、下另三个边缘及对角线方向重复以上方法,如图7(b)所示,箭头方向为空间等分和扫描方向,共得到K2×8×8维的边缘特征。
方向特征和边缘特征合并后得到完整的一个联机手写汉字的统计结构特征V。
3.特征变换
前面提取得到的原始特征维数比较高,在样本数不是很充分的情况下,会造成计算复杂度增加并降低分类器性能。所以,在原始特征送到分类器之前,还需要对之进行特征变换,把高维原始特征变换压缩到低维特征空间。本发明采用线性鉴别分析技术LDA进行特征变换。设{{Vi (j),1≤i≤Nj},1≤j≤C}为原始特征向量集合,式中Vi (j)表示属于第j个类别的第i个样本提取的原始特征向量,Nj表示第j个类别的样本个数,C表示类别数目。每个类别代表国家标准汉字集合中的一个汉字。用下式计算每个类别的均值以及所有类别的均值:
μ j = 1 N j Σ i = 1 N j V i ( j ) , μ = 1 C Σ j = 1 C μ j
然后计算类内散度矩阵Sw和类间散度矩阵Sb
S w = 1 C Σ j = 1 C ( 1 N j Σ i = 1 N j ( V i ( j ) - μ j ) ( V i ( j ) - μ j ) T )
S b = 1 C Σ j = 1 C ( μ j - μ ) ( μ j - μ ) T
我们选取|(Sb+Sw)/Sw|作为优化准则,即求取线性变换矩阵A,使得 | A T ( S b + S w ) A A T S w A | 最大。变换矩阵A为n×m维矩阵,n为原始特征维数,设定变换后的特征维数为m。变换矩阵的求取方法如下:我们对矩阵Sw -1(Sb+Sw)进行特征值和特征向量分解,得到特征值{γi,i=1,2,...,n},特征值按值的大小降序排列,以及特征向量ξi,i=1,2,...,n。用前m个特征向量组成矩阵A=[ξ1,ξ2,...,ξm],则A就是符合前面要求的线性变换矩阵。
特征选择的公式如下:
Y=AT·V
上式中,V为原始结构特征向量,Y是经过变换后的特征向量。
4.分类器设计
本发明使用了针对高斯模型的改进型二次分类器MQDF。这里先介绍标准二次分类器QDF。QDF的判决函数为:
g j ( Y ) = Σ i = 1 m ( ( Y - μ j ) T ζ i ( j ) ) 2 λ i ( j ) + Σ i = 1 m log λ i ( j )
上式中,Y是输入的特征向量,m为特征维数,μj代表第j个类别的均值向量,ζi (j)是第j个类别的协方差阵的第i个特征向量,λi (j)是第j个类别的协方差阵的第i个特征值。对输入Y进行识别时,用如下准则进行分类:
把Y归为第i个类别,如果 g i ( Y ) = min 1 ≤ j ≤ C g j ( Y ) , 式中C为类别数目
在实际应用中,由于对小特征值的估计不准确,造成QDF的性能下降。为降低小特征值估计不准对分类性能的不利影响,我们使用改进的二次分类器MQDF。MQDF对过小的特征值用事先确定的常数代替,其判别函数如下:
g j ( Y ) = Σ i = 1 k ( ( Y - μ j ) T ζ i ( j ) ) 2 λ i ( j ) + Σ i = k + 1 m ( ( Y - μ j ) T ζ i ( j ) ) 2 λ + Σ i = 1 k log λ i ( j ) + Σ i = k + 1 m log λ - - j = 1.2 · · · · · · , C
上式中,k为小于m的正整数,λ是常数。k和λ为经验参数,由实验确定。在分类时,输入Y被划分为使gj(Y)取最小值的类别。
本发明的特征在于,它是一种基于统计结构特征的联机手写汉字识别方法。它依次含有以下步骤:
(1)对输入的联机手写汉字笔迹进行预处理。
假设一个联机手写汉字的笔迹为:P(x1,y1),P(x2,y2),…,P(xi,yi),(break),P(xi+1,yi+1),…,P(xN,yN)。依次进行如下预处理。
(1.1)去除孤立点噪声。
从笔迹点序列中去除只由一两个点组成的笔划。
(1.2)滤除锯齿形噪声。
用下式对相邻点的坐标值进行加权平均,达到低通滤波的效果:
x i ′ = 1 4 ( x i - 1 + 2 · x i + x i + 1 )
y i ′ = 1 4 ( y i - 1 + 2 · y i + y i + 1 )
(1.3)消除笔速不匀的重新采样。
对于书写的轨迹用一个固定长度间隔采用下式重新采样,使得一定长度的笔划用一定数量的点来代表:
xj″=[xi′·(si+1-jL)+xi+1′·(jL-si)]/di
yj″=[yi′·(si+1-jL)+yi+1′·(jL-si)]/di
上式中,L为固定采样间隔,取值为常数1;(xi′,yi′)为待采样笔划的N个坐标点,i满足1≤i≤N且si≤jL<si+1 d i = ( x i + 1 ′ - x i ′ ) 2 + ( y i + 1 ′ - y i ′ ) 2 为两个点之间的长度; s i = Σ k = 0 i - 1 d k 为累计长度,并设定 s 0 = 0 ; ( x j ′ ′ , y j ′ ′ ) , j = 0,1 , · · · , [ s N L ] 为重新采样得到的新坐标点。
(1.4)用密度均衡法整形处理。
首先将联机汉字的笔迹转换成汉字图像[f(x″,y″)]W×H,图像宽度为W,高度为H,任何一个笔迹点P(xi″,yi″)坐标处对应黑象素点f(xi″,yi″)=1,其余为白象素点f(x″,y″)=0。计算图像在水平和垂直方向上的密度投影U(x″),V(y″):
U ( x ′ ′ ) = Σ y = 1 H f ( x ′ ′ , y ′ ′ ) + α U - - x ′ ′ = 1,2 , . . . , W
V ( y ′ ′ ) = Σ x = 1 W f ( x ′ ′ , y ′ ′ ) + α V - - y ′ ′ = 1,2 , . . . , H
其中,αU,αV为偏置常数,此处设定αU=αV=6。则原坐标为(x″,y″)的笔迹点的新坐标为(x’″,y’″):
x ′ ′ ′ = Σ k = 1 x ′ ′ U ( k ) × W ′ Σ k = 1 W U ( k ) , y ′ ′ ′ = Σ l = 1 y ′ ′ V ( l ) × H ′ Σ l = 1 H V ( l )
其中,整形处理后的最大横坐标为W’,最大纵坐标为H’。
(1.5)插值和删除重合点。
把每个自然笔划内的笔迹点都依序首尾相连,连线上与原笔迹点不重合的点***笔迹序列,并消除相邻笔迹点中的重合点。
(2)提取统计结构特征
在预处理之后的联机手写汉字笔迹上提取方向特征和边缘特征,合并为原始的统计结构特征。其提取方法分别如下:
(2.1)提取方向特征方向特征是相邻点方向特征和相邻拐点方向特征的合并。这两种特征的提取步骤如下:
(2.1.1)提取相邻点方向特征
(a)首先计算除最后一点外的所有笔迹点的相邻点方向:从Pi指向Pi+1的有向线段的方向θi,其值域范围为[0°,360°)。最后一点的方向设为无效。
(b)然后按下式根据每个笔迹点的方向值θi计算该点的4种方向属性系数:
横方向属性系数函数
Figure A20051001151000171
竖方向属性系数函数
撇方向属性系数函数
Figure A20051001151000173
捺方向属性系数函数
Figure A20051001151000174
六个参数α16是角度阈值,它们的作用是确定方向属性系数函数的形状,在本发明中分别设为:α1=-10°,α2=260°,α31=280°,α4=250°,α5=300°,α6=330°。
(c)把笔迹点坐标所占空间均匀划分成K1×K1个子块,分别统计每个子块中所有笔迹点的4种方向属性系数之和。以第(k,l),1≤k≤K1,1≤l≤K1个子块为例,统计得到的4维特征分别为: F k , l ( h ) = Σ P ( x , y ) ∈ D ( k , l ) f ( h ) ( θ ) , θ为点P(x,y)的方向值; F k , l ( s ) = Σ P ( x , y ) ∈ D ( k , l ) f ( s ) ( θ ) , θ为点P(x,y)的方向值; F k , l ( p ) = Σ P ( x , y ) ∈ D ( k , l ) f ( p ) ( θ ) , θ为点P(x,y)的方向值; F k , l ( n ) = Σ P ( x , y ) ∈ D ( k , l ) f ( n ) ( θ ) , θ为点P(x,y)的方向值;
一共得到K1×K1×4维特征相邻点方向特征。
(2.1.2)提取相邻拐点方向特征
用多边形逼近的方法确定笔迹中的拐点,拐点即笔划书写的方向前后变化剧烈的点,包括笔划拐点在内,先计算笔划中每个点与相邻点间张角的余弦值;
张角γ的余弦值可利用三角余弦定理计算,设a,b,c分别为当前笔迹点与前后相邻笔迹点构成的三角形的三边,张角γ为边a,b的夹角,c为张角γ的对边,先根据三角形顶点的坐标分别计算三边的长度,由余弦定理可求得 cos γ = c 2 - a 2 - b 2 2 ab ;
拐点的判定是当张角γ的余弦值出现最大值并大于设定阈值,设为-0.8,此时γ约为2.5弧度;把笔划端点也设定为一种拐点。
计算每个笔迹点的相邻拐点方向:设点Pi和Pj,j>i为笔迹点中相邻的拐点,所有包括Pi点在内的在这两点之间的笔迹点的方向都设定为从点Pi指向点Pj的有向线段方向。
重复(2.1.1)中的(b)(c)两步,得到K1×K1×4维的相邻拐点方向特征。
(2.2)提取边缘特征
首先提取左→右方向扫描的边缘特征:把预处理后的联机汉字笔迹所对应图像的左半部分空间等距分为K2个横向子区域,如图7(a)所示;从箭头方向(即图像左边缘往右)进行逐行扫描。若第i次行扫描时,第一次扫描到某个坐标点为笔迹点时,计算这个笔迹点的4个相邻点方向属性系数,记做fi,1 (h)、fi,1 (s)、fi,1 (p)、fi,1 (n),如果一直没有扫描到笔迹点,则这4个系数为0;继续扫描,当第二次扫描到某个坐标点为笔迹点时,计算这个笔迹点的相邻点方向属性系数,记做fi,2 (h)、fi,2 (s)、fi,2 (p)、fi,2 (n),同样的,如果一直没有第二次扫描到笔迹点,则这4个系数为0。行扫描完毕,分别累计各行得到的以上系数,得到8维特征: Σ i f i , 1 ( h ) , Σ i f i , 1 ( s ) , Σ i f i , 1 ( p ) , Σ i f i , 1 ( n ) , Σ i f i , 2 ( h ) , Σ i f i , 2 ( s ) , Σ i f i , 2 ( p ) , Σ i f i , 2 ( n ) . K2个子区域共得到K2×8维边缘特征。
然后接着从右、上、下另三个边缘及四个斜线扫描方向,如图7(b),重复以上步骤,共得到K2×8×8维的边缘特征。
(3)特征变换
用线性鉴别分析LDA从原始的统计结构特征中提取识别特征,以改善特征分布,提高识别性能,它依次含有以下步骤:
(3.1)用下式计算每个类别的均值μj以及所有类别的均值μ:
μ j = 1 N j Σ i = 1 N j V i ( j ) , μ = 1 C Σ j = 1 C μ j
其中,Vi (j)为属于第j个类别的第i个样本提取的原始特征向量,Nj表示第j个类别的样本个数,C表示类别数目。
(3.2)用下式计算类内散度矩阵Sw和类间散度矩阵Sb
S w = 1 C Σ j = 1 C ( 1 N j Σ i = 1 N j ( V i ( j ) - μ j ) ( V i ( j ) - μ j ) T )
S b = 1 C Σ j = 1 C ( μ j - μ ) ( μ j - μ ) T
(3.3)对矩阵Sw -1(Sb+Sw)进行特征值和特征向量分解,得到按特征值的大小降序排列的特征值γi,i=1,2,...,n和特征向量ξi,i=1,2,...,n。
(3.4)用前m个特征向量组成线性变换矩阵A=[ξ1,ξ2,...,ξm]。
(3.5)用原始特征V和变换矩阵A计算变换后的特征向量Y:
Y=AT·V
(4)用MQDF分类器进行联机手写汉字识别。
用MQDF分类器进行识别包括两个部分:首先要根据前面得到的识别特征通过事先采集好的样本训练生成识别库文件;然后才能利用识别库对实际输入待识样本进行识别。
(4.1)训练过程:
(4.1.1)首先对每个类别j,根据前面得到的m维识别特征,用下式统计其均值μj和协方差阵∑j
μ j = 1 N j Σ i = 1 N j Y i ( j ) , Σ j = 1 N j Σ i = 1 N j ( Y i ( j ) - μ j ) · ( Y i ( j ) - μ j ) T
其中,Yi (j)为属于第j个类别的第i个样本提取的识别特征向量,Nj表示第j个类别的样本个数。
(4.1.2)对每个类别的协方差阵∑j进行特征值和特征向量分解,得到按值的大小降序排列的特征值λi (j),i=1,2,...,m和特征向量ζi (j),i=1,2,...,m
(4.1.3)计算小特征值的替代值:
λ = 1 C Σ j = 1 C λ k + 1 ( j )
其中,k为小于m的正整数,由实验确定。
(4.1.4)把前面得到的λi (j),j=1,2,...,C,i=1,2,...,k、ζi (j),j=1,2,...,C,i=1,2,...,m、μj,j=1,2,...,C和λ存储到识别库文件中,供后续的识别使用。
(4.2)识别过程:
(4.2.1)由待识样本得到识别特征Y,用下式计算每个类别的判决函数gj(Y):
g j ( Y ) = Σ i = 1 k ( ( Y - μ j ) T ζ i ( j ) ) 2 λ i ( j ) + Σ i = k + 1 m ( ( Y - μ j ) T ζ i ( j ) ) 2 λ + Σ i = 1 k log λ i ( j ) + Σ i = k + 1 m log λ
其中,m、k的取值同训练过程。
(4.2.2)输入的待识样本被划分为使gj(Y)取最小值的类别。
实验证明,本发明的平均识别率为98.43%,达到令人满意的效果。
附图说明
图1联机手写汉字识别***的构成。
图2预处理流程
图3笔迹点方向的计算方法。
图4方向属性系数的计算方法。
图5笔迹点坐标空间的子块划分方法。
图6计算拐点的方法。
图7边缘特征的提取方法。
图8 LDA特征变换方法流程。
具体实施方式
实现基于统计结构特征的联机手写汉字识别***时,首先要通过训练得到识别库,然后就可以根据识别库对联机手写汉字字符进行识别。因而,实用的基于统计结构特征的联机手写汉字识别***的实现需要考虑训练过程的实现和识别过程的实现两个方面,其***构成如图1所示。这两个过程中有部分处理内容是相同的。
下面详细介绍***的各个部分:
A.训练过程的实现
A.1预处理
预处理流程如图2所示。假设一个联机手写汉字的笔迹为:P(x1,y1),P(x2,y2),…,P(xi,yi),(break),P(xi+1,yi+1),…,P(xN,yN)。
首先要去除孤立点噪声,从笔迹点序列中去除只由一两个点组成的笔划。
然后对相邻点的坐标值进行加权平均,滤除锯齿形噪声,滤波公式为:
x i ′ = 1 4 ( x i - 1 + 2 · x i + x i + 1 )
y i ′ = 1 4 ( y i - 1 + 2 · y i + y i + 1 )
重新采样的目的是消除笔速不匀。其方法是对书写的轨迹用一个固定长度间隔重新采样,使得一定长度的笔划用一定数量的点来代表,采样公式为:
xj″=[xi′·(si+1-jL)+xi+1′·(jL-si)]/di
yj″=[yi′·(si+1-jL)+yi+1′·(jL-si)]/di
上式中,L为固定采样间隔,取值为常数1;(xi′,yi′)为待采样笔划的N个坐标点,i满足1≤i≤N且si≤jL<si+1 d i = ( x i + 1 ′ - x i ′ ) 2 + ( y i + 1 ′ - y i ′ ) 2 为两个点之间的长度; s i = Σ k = 0 i - 1 d k 为累计长度,并设定 s 0 = 0 ; ( x j ′ ′ , y j ′ ′ ) , j = 0,1 , · · · , [ s N L ] 为重新采样得到的新坐标点。
整形处理的任务是消除待识汉字的部分书写变形,包括线性归一化、非线性归一化两个功能,使待识汉字所占空间区域映射到一个大小固定的位置,而且字符笔划在空间分布上更加均匀。整形处理后各笔迹点变换到新坐标,变换公式通过密度均衡法来计算:首先将联机汉字的笔迹转换成汉字图像[f(x″,y″)]W×H,图像宽度为W,高度为H,任何一个笔迹点P(xi″,yi″)坐标处对应黑象素点f(xi″,yi″)=1,其余为白象素点f(x″,y″)=0。H(x″),V(y″)分别表示象素点在水平和垂直方向上的密度投影,即:
U ( x ′ ′ ) = Σ y = 1 H f ( x ′ ′ , y ′ ′ ) + α U - - x ′ ′ = 1,2 , . . . , W
V ( y ′ ′ ) = Σ x = 1 W f ( x ′ ′ , y ′ ′ ) + α V - - y ′ ′ = 1,2 , . . . , H
其中,αU,αV为偏置常数,本发明中设定αU=αV=6。则原坐标为(x″,y″)的笔迹点的新坐标为(x’″,y’″):
x ′ ′ ′ = Σ k = 1 x ′ ′ U ( k ) × W ′ Σ k = 1 W U ( k ) , y ′ ′ ′ = Σ l = 1 y ′ ′ V ( l ) × H ′ Σ l = 1 H V ( l )
其中,W′为处理后的最大横坐标,H′为处理后的最大纵坐标。本发明中设定W′=H′=64。
A.2统计结构特征的提取
这一步是在预处理之后的联机手写汉字笔迹的基础上提取出适合联机手写汉字的结构特性的特征。本发明中设计和提取了两种统计结构特征,分别称为方向特征和边缘特征。
A.2.1方向特征的提取
方向特征是由相邻点方向特征和相邻拐点方向特征这两种特征合并而成。
相邻点方向特征的提取方法如下:
1)首先计算除最后一点外的所有笔迹点的相邻点方向:从当前点Pi指向下一点Pi+1的有向线段的方向θi,其值域范围为[0°,360°)。最后一点的方向设为无效。
2)根据每个笔迹点的方向值θi按下式计算该点的4种方向属性系数:
横方向属性系数函数
竖方向属性系数函数
Figure A20051001151000225
撇方向属性系数函数
Figure A20051001151000226
捺方向属性系数函数
Figure A20051001151000227
六个参数α16是角度阈值,它们的作用是确定方向属性系数函数的形状,在本发明中分别设为:α1=-10°,α2=260°,α31=280°,α4=250°,α5=300°,α6=330°。
3)把笔迹点坐标所占空间均匀划分成K1×K1个子块,分别统计每个子块中所有笔迹点的4种方向属性系数之和。以第(k,l)(1≤k≤K1,1≤l≤K1)个子块为例,统计得到的4维特征分别为: F k , l ( h ) = Σ P ( x , y ) ∈ D ( k , l ) f ( h ) ( θ ) , θ为点P(x,y)的方向值 F k , l ( s ) = Σ P ( x , y ) ∈ D ( k , l ) f ( s ) ( θ ) , θ为点P(x,y)的方向值 F k , l ( p ) = Σ P ( x , y ) ∈ D ( k , l ) f ( p ) ( θ ) , θ为点P(x,y)的方向值 F k , l ( n ) = Σ P ( x , y ) ∈ D ( k , l ) f ( n ) ( θ ) , θ为点P(x,y)的方向值
在本发明中,K1=8,所以相邻点方向特征共有8×8×4=256维。
相邻拐点方向特征的提取方法如下:
用多边形逼近的方法确定笔迹中的拐点,拐点即笔划书写的方向前后变化剧烈的点,包括笔划拐点在内,先计算笔划中每个点与相邻点间张角的余弦值;
张角γ的余弦值可利用三角余弦定理计算,设a,b,c分别为当前笔迹点与前后相邻笔迹点构成的三角形的三边,张角γ为边a,b的夹角,c为张角γ的对边,先根据三角形顶点的坐标分别计算三边的长度,由余弦定理可求得 cos γ = c 2 - a 2 - b 2 2 ab ;
拐点的判定是当张角γ的余弦值出现最大值并大于设定阈值,设为-0.8,此时γ约为2.5弧度;把笔划端点也设定为一种拐点。
计算每个笔迹点的相邻拐点方向:设点Pi和Pj,j>i为笔迹点中相邻的拐点,所有包括Pi点在内的在这两点之间的笔迹点的方向都设定为从点Pi指向点Pj的有向线段方向。
重复上面的相邻点方向特征提取方法中的(2)(3)两步,得到256维的相邻拐点方向特征。
相邻点方向特征和相邻拐点方向特征合并成512维的方向特征。
A.2.2边缘特征的提取
边缘特征与方向特征不同之处在于边缘特征能较好地反映出汉字的***结构信息。提取边缘特征的方法如下:
首先提取从左到右扫描方向的边缘特征:把预处理后的联机汉字笔迹所对应图像空间的左半部分等距分为K2个横向子区域,如图7(a)所示。在每一个子区域内,从箭头方向,即图像左边缘往右,进行逐行扫描。若第i次行扫描时,第一次扫描到某个坐标点为笔迹点时,计算这个笔迹点的4个相邻点方向属性系数,记做fi,1 (h)、fi,1 (s)、fi,1 (p)、fi,1 (n),如果一直没有扫描到笔迹点,则这4个系数为0;继续扫描,当第二次扫描到某个坐标点为笔迹点时,累计遇到的这个笔迹点的相邻点方向属性系数,记做fi,2 (h)、fi,2 (s)、fi,2 (p)、fi,2 (n),同样的,如果一直没有第二次扫描到笔迹点,则这4个系数为0。行扫描完毕,分别累计各行得到的以上系数,得到8维特征: Σ i f i , 1 ( h ) , Σ i f i , 1 ( s ) , Σ i f i , 1 ( p ) , Σ i f i , 1 ( n ) , Σ i f i , 2 ( h ) , Σ i f i , 2 ( s ) , Σ i f i , 2 ( p ) , Σ i f i , 2 ( n ) . K2个子区域共得到K2×8维边缘特征。
然后从右、上、下另三个边缘及4个斜线扫描方向重复以上方法,共得到K2×8×8维的边缘特征。
在本发明中,K2=8,边缘特征共有512维。
方向特征和边缘特征合并后得到完整的1024维联机手写汉字统计结构特征。
A.3特征变换
特征变换的流程如图8所示,采用了线性鉴别分析技术LDA方法,通过求取变换矩阵A,对原始特征进行变换压缩,得到最终的识别特征。
特征变换的具体步骤如下:
1)首先计算每个类别的均值以及所有类别的均值:
μ j = 1 N j Σ i = 1 N j V i ( j ) , μ = 1 C Σ j = 1 C μ j
2)然后计算类内散度矩阵Sw和类间散度矩阵Sb
S w = 1 C Σ j = 1 C ( 1 N j Σ i = 1 N j ( V i ( j ) - μ j ) ( V i ( j ) - μ j ) T )
S b = 1 C Σ j = 1 C ( μ j - μ ) ( μ j - μ ) T
3)对矩阵Sw -1(Sb+Sw)进行特征值和特征向量分解,得到特征值{γi,i=1,2,...,n},特征值按值的大小降序排列,以及特征向量ξi,i=1,2,...,n。用前m个特征向量组成矩阵A=[ξ1,ξ2,...,ξ256],则A就是要求取的线性变换矩阵。在本发明中,m取128。
这个变换矩阵A需要存储到文件中,供识别过程的特征变换使用。
4)得到变换矩阵A后,即可求取最终的特征,变换公式为:Y=AT·V。
A.4训练MQDF分类器
根据得到的m维识别特征Y,对每个类别用下式统计其均值和协方差阵:
μ j = 1 N j Σ i = 1 N j Y i ( j ) , Σ j = 1 N j Σ i = 1 N j ( Y i ( j ) - μ j ) · ( Y i ( j ) - μ j ) T
其中,Yi (j)表示第j个类别的第i个训练样本提取的特征向量,Nj是第j个类别的训练样本数目,μj表示第j个类别的均值,∑j表示第j个类别的协方差矩阵。
对每个类别的协方差阵进行特征值和特征向量分解,得到特征值λi (j),i=1,2,...,m,特征值按值的大小降序排列和特征向量ζi (j),i=1,2,...,m,λi (j)是∑j的第i个特征值,ζi (j)是∑j的第i个特征向量。
我们用下式计算MQDF分类器中的参数λ,即小特征值的替代值:
λ = 1 C Σ j = 1 C λ k + 1 ( j )
上式中,k为小于m的正整数,在本发明中,k取32,C表示类别数目。
把以上参数λi (j),j=1,2,...,C,i=1,2,...,k、ζi (j),j=1,2,...,C,i=1,2,...,m、μj,j=1,2,...,C、λ存储到识别库文件中,供识别过程使用。这样就完成了MQDF分类器的训练过程。
B.识别过程的实现
识别过程如图1所示。同训练过程一样,识别过程也需要首先进行预处理,然后提取得到原始的统计结构特征V。
在进行LDA特征变换时,识别过程直接采用训练过程提供的变换矩阵A,得到识别特征向量Y=AT·V。
用MQDF分类器进行识别时,所有相关的分类器参数从训练过程提供的识别库文件中读取。MQDF分类器的判决函数为:
g i ( Y ) = Σ i = 1 k ( ( Y - μ j ) T ζ i ( j ) ) 2 λ i ( j ) + Σ i = k + 1 m ( ( Y - μ j ) T ζ i ( j ) ) 2 λ + Σ i = 1 k log λ i ( j ) + Σ i = k + 1 m log λ - - j = 1.2 · · · · · · · , C
识别时用上式计算每个类别的gj(Y),分类规则如下:
把Y归为第i个类别,如果 g i ( Y ) = min 1 ≤ j ≤ C g i ( Y ) , 式中C为类别数目
为验证本发明的有效性,我们进行了如下实验:
训练样本集使用1000套国标二级汉字字集样本和400套GBK字集样本,另外60套国标二级汉字字集样本和30套GBK字集样本作为测试样本,在GBK字集识别范围内进行测试。以上样本均为自由书写的联机手写汉字。在联机手写汉字识别***的训练和识别过程中,具体参数值见上文具体实施方式中的设置。
实验结果如下:
  GB二级汉字字集6763个汉字60套共405,780个样本     GBK汉字字集14240个汉字30套共427,200个样本 综合平均
测试识别率     99.30%     98.17%     98.43%
从表中数据可看出,基于统计结构特征的联机手写汉字识别方法在两种不同识别范围下均达到很高的识别性能,识别速度在主频为PentiumIV-1.7GHz的计算机上达到35.27字/秒,完全能够满足实用需要。
综上所述,本发明提出的基于统计结构特征的联机手写汉字识别方法及识别***,能够识别自由书写的联机手写汉字,并且经实验证明达到极高的识别正确率和可靠性,具有非常广泛的应用前景。

Claims (1)

1.基于统计结构特征的联机手写汉字识别方法,其特征在于,它是在主频为PentiumIV-1.7GHz的计算机上依次按以下步骤实现的,整个实现过程由训练阶段和识别阶段分别构成:
训练阶段:
步骤1.预处理,它依次含有以下步骤:
步骤1.1:上述计算机通过一种数字化图像采集设备实时地对人的书写笔迹进行采样,得到的一个联机手写汉字的笔迹为:P(x1,y1),P(x2,y2),...,P(xi,yi),(break),P(xi+1,yi+1),...,P(xN,yN);
其中,(break)标记代表两个自然笔划间抬笔和落笔的中断;所述笔迹是在联机手写一个汉字时对笔尖的移动轨迹进行采样得到的一系列从时间上依次排列的点坐标,所述点坐标共有N个;
步骤1.2:上述计算机去除孤立点噪声,即从上述笔迹点序列中去除只由一两个点组成的笔划;
步骤1.3:滤除锯齿形噪声,即上述计算机对上述笔迹中每一个坐标点的相邻点的坐标值进行加权平均,以通过低通滤波来形成新的坐标点Xi′,Yi′:
x i ′ = 1 4 ( x i - 1 + 2 · x i + x i + 1 )
y i ′ = 1 4 ( y i - 1 + 2 · y i + y i + 1 )
步骤1.3上述计算机通过重新采样的方法来消除笔速不均匀,即用一个固定长度的采样间隔来重新采样,使得一定长度的笔划用一定数量的坐标点Xj″,Yj″来代表:
xj″=[xi′·(si+1-jL)+xi+1′·(jL-si)]/di
yj″=[yi′·(si+1-jL)+yi+1′·(jL-si)]/di
其中,L为固定坐标间隔,取值为常数1,
(xi′,yi′)为待采样笔划的N个坐标点,i满足1≤i≤N且si≤jL<si+1
si为累计长度, s i = Σ k = 0 i - 1 d k , s0=0,
d i = ( x i + 1 ′ - x i ′ ) 2 + ( y i + 1 ′ - y i ′ ) 2 di为两点之间的长度;
(Xj″,Yj″)为重新采样得到的新坐标点.
j = 0,1 , · · · , [ s N L ] ;
步骤1.4:用密度均衡法进行整形处理
步骤1.4.1:把联机汉字的笔迹转换成汉字图像,该图像表示为[f(x″,y″)]W×H,其中W为整形变换前的图像宽度,H为其高度,任何一个笔迹点P(xi″,yi″)坐标处对应黑象素点,取f(xi″,yi″)=1,其余为白象素点f(x″,y″)=0;
步骤1.4.2:计算图像在水平和垂直方向上的密度投影,分别用U(x″),V(y″)表示:
U ( x ′ ′ ) = Σ y = 1 H f ( x ′ ′ , y ′ ′ ) + α U , x ′ ′ = 1,2 , . . . , W
V ( y ′ ′ ) = Σ x = 1 W f ( x ′ ′ , y ′ ′ ) + α V , y ′ ′ = 1,2 , . . . , H
其中,αU,αV为偏置常数,此处设定αU=αV=6;
步骤1.4.3:计算原坐标为(x″,y″)的笔迹点的新坐标(x,y):
x ′ ′ ′ = Σ k = 1 x ′ ′ U ( k ) × W ′ Σ k = 1 W U ( k ) ; W’为整形后最大横坐标;
y ′ ′ ′ = Σ l = 1 y ′ ′ V ( l ) × H ′ Σ l = 1 H V ( l ) ; H’为整形后最大纵坐标;
W’、H’是处理后的笔迹点坐标范围的期望值,在处理之前预先设定,设W’=H’=64;
步骤1.4.4:插值和删除重合点
把每个自然笔划内的笔迹点都依序首尾相连,连线上与原笔迹点不重合的点***笔迹序列,并清除相邻笔迹点中的重合点;
步骤2提取统计结构特征
步骤2.1:提取方向特征;
步骤2.1.1:提取相邻点方向特征;
步骤2.1.1.1:计算每个笔迹点的方向;
任取一点Pi,最后一点除外,点Pi都有至少一个后继点Pj,j=i+1,则从点Pi的有向线段的方向便设定为Pj点的方向值,用θi表示,其值域范围为[0°,360°],称该方向值为相邻点方向;
θi计算方法为,设(Xi,Yi)为点Pi的坐标,(Xj,Yj)为点Pj的坐标;
由于θi的三角正切函数 tg ( θ i ) = Y j - Y i X j - X i ,
θ i = arctg ( Y j - Y i X j - X i ) ;
步骤2.1.1.2:计算每个笔迹点的方向属性系数,即指以该点的方向值为自变量,计算用以下函数表示的该点的4种函数值:
横方向属性系数函数用f(h)(θ)表示:
Figure A2005100115100004C3
竖方向属性系数函数,用f(s)(θ)表示:
Figure A2005100115100004C4
撇方向属性系数函数,用f(p)(θ)表示:
捺方向属性系数函数,用f(n)(θ)表示:
其中,α1~α6为角度及阈值,用于确定方向属性系数函数的形状,设:α1=-10°,α2=260°,α31=280°,α4=250°,α5=300°,α6=330°
步骤2.1.1.3:把笔迹点图像的坐标空间均匀划分成K1×K1个子块,在本发明中K1取值为8,分别统计每个子块中,所有笔迹点的各个方向属性系数之和,得到k1×k×4特征;对于其中任何一个子块(k,l),1≤k≤K1,1≤l≤K1,所述4维特征分别为:
第(k,l)个子块内,所有笔迹点的横方向属性系数函数之和用Fk,l (h)表示:
F k , l ( h ) = Σ P ( x , y ) ∈ D ( k , l ) f ( h ) ( θ ) , θ为点P(x,y)的方向值
第(k,l)个子块内,所有笔迹点的竖方向属性系数函数之和用Fk,l (s)表示:
F k . l ( s ) = Σ P ( x , y ) ∈ D ( k , l ) f ( s ) ( θ ) , θ为点P(x,y)的方向值
第(k,l)个子块内,所有笔迹点的撇方向属性系数函数之和,用Fk,l (p)表示
F k , l ( p ) = Σ P ( x , y ) ∈ D ( k , l ) f ( p ) ( θ ) , θ为点P(x,y)的方向值
第(k,l)个子块内,所有笔迹点的捺方向属性系数函数之和,用Fk,l (n)表示
F k , l ( n ) = Σ P ( x , y ) ∈ D ( k , l ) f ( n ) ( θ ) , θ为点P(x,y)的方向值
步骤2.1.2:提取相邻拐点方向特征
步骤2.1.2.1:用多边形逼近的方法确定笔迹中的拐点,拐点即笔划书写的方向前后变化剧烈的点,包括笔划拐点在内,先计算笔划中每个点与相邻点间张角的余弦值;
张角γ的余弦值可利用三角余弦定理计算,设a,b,c分别为当前笔迹点与前后相邻笔迹点构成的三角形的三边,张角γ为边a,b的夹角,c为张角γ的对边,先根据三角形顶点的坐标分别计算三边的长度,由余弦定理可求得 cos γ = c 2 - a 2 - b 2 2 ab ;
拐点的判定是当张角γ的余弦值出现最大值并大于设定阈值,设为-0.8,此时γ约为2.5弧度;
步骤2.1.2.2:按上述方法计算每个笔迹点的相邻拐点方向,设点Pi和Pj,j>i为笔迹点中相邻的拐点,所有包括Pi点在内的在这两点之间的笔迹点的方向都设定为从点Pi指向点Pj的有向线段方向,然后,根据这一点再重复上述步骤2.1.1.2和2.1.1.3,得到K1×K1×4维的相邻拐点方向特征;
步骤2.1.3合并相邻点方向特征和相邻拐点方向特征得到k1×k×8维方向特征;
步骤2.2提取边缘特征,它反映了汉字的***结构信息
步骤2.2.1:首先提取从左到右方向扫描的边缘特征:把预处理后的联机汉字笔迹所对应图像的左半部分空间等距分为K2个横向子区域,在每一个子区域内,从图像左缘往右进行逐行扫描,凡当扫描到某个坐标点为笔迹点是便计算这个笔迹点的4个相邻点方向属性系数,记为fi,1 (h)、fi,1 (s)、fi,1 (p)、fi,1 (n)其中,下标表示在第i次行扫描中第一次扫到笔迹点,若扫不到笔迹点,则这个系数为0,在其次行扫描中,若再次遇到作为笔迹点的坐标点时便计算这个笔迹点的4个相邻点方向属性系数,记为fi,2 (h)、fi,2 (s)、fi,2 (p)、fi,2 (n),下标表示第i次行扫描时,第二次遇到笔迹点,否则,这4个系数为0,该行扫描结束,接着,进行下一行扫描一直到行扫描共i次,便分别累计各行得到的以上系数,得到8维特征: Σ i f i , 1 ( h ) , Σ i f i , 1 ( s ) , Σ i f i , 1 ( p ) , Σ i f i , 1 ( n ) , Σ i f i , 2 ( h ) , Σ i f i , 2 ( s ) , Σ i f i , 2 ( p ) , Σ i f i , 2 ( n ) , 对于K2个子区域,共得到K2×8维边缘特征;
步骤2.2.2从右、上、下另外三个边缘以及四个对角线的方向重复步骤2.2.1所述的方法,从而从上述8个方向,共得到K2×8×8维的边缘特征;
步骤2.2.3:合并上述步骤2.2.1和2.2.2得到的方向特征和边缘特征,得到完整的一个联机手写汉字的统计结构特征,用V表示:
步骤3特征变换
步骤3.1:计算国家标准汉字集合中的一个汉字的原始特征向量集合,该集合用Vi (j)表示:
{{Vi (j),1≤i≤Nj},1≤j≤C}
其中,C表示类别数目,每个类别代表国家标准汉字集合中的一个汉字;C中的各类别用j表示,j表示其中第j个类别;
Nj表示第j个类别的样本个数,
i表示第j个类别中的第i个标本;
步骤3.2用下式计算每个类别的均值以及所有类别的均值,分别用μj,μ表示;
μ j = 1 N j Σ i = 1 N j V i ( j ) ;
在计算国家标准汉字集合中,每个类别所代表的一个汉字的均值μj后,按下式计算所有类别的均值:
μ = 1 C Σ j = 1 C μ j ;
步骤3.3计算类内散度矩阵和类间散度阵,分别用Sw、Sb表示:
S w = 1 C Σ j = 1 C ( 1 N j Σ i = 1 N j ( V i ( j ) - μ j ) ( V i ( j ) - μ j ) T )
S b = 1 C Σ j = 1 C ( μ j - μ ) ( μ j - μ ) T
步骤3.4把高维原始特征向量用线性鉴别分析方法变换到低维特征空间:
对矩阵Sw -1(Sb+Sw)进行特征值和特征向量分解,得到按值的大小降序排列的特征值,用γi,i=1,2,...,n表示,特征向量用ξi,i=1,2,...,n表示,按值 | A T ( S b + S w ) A A T S w A | 最大的原则,选择m,使前m个特征向量组成矩阵A,A为n×m维矩阵,A=[ξ1,ξ2,...,ξm],这是所述的线性变换矩阵;
步骤3.5:按下式计算变换后的特征向量Y:
Y=AT·V;V为从国家标准汉字集合中提取的所有类别汉字中得到的原始特征向量集合;
步骤4.训练分类器
根据上述步骤3得到的m维识别特征向量Y,对每个类别用下式分别统计其均值μj和协方差阵∑j
μ j = 1 N j Σ i = 1 N j Y i ( j ) , Σ j = 1 N j Σ i = 1 N j ( Y i ( j ) - μ j ) · ( Y i ( j ) - μ j ) T
其中,Yi (j)表示第j个类别的第i个训练样本提取的特征向量,Nj是第j个类别的训练样本数目,μj表示第j个类别的识别特征的均值,∑j表示第j个类别的协方差矩阵:
接着,再对每个类别的协方差阵进行特征值和特征向量分解,得到特征值λi (j),i=1,2,...,m,它表示第j个类别的第i个训练样本的特征值λi (j),i=1,2,...,m;按特征值大小降序排列;特征向量为ζi (j),i=1,2,...,m;
然后,接下式计算小特征值的替代值,即用事先确定的常数λ来代替较小的特征值,以降低小特征值统计不准时分类性能的不好影响:
λ = 1 C Σ j = 1 C λ k + 1 ( j ) , k为小于m的正整数
再把上述参数λi (j),j=1,2,...,C,i=1,2,...,k、ζi (j),j=1,2,...,C,i=1,2,...,m、μj,j=1,2,...,C、λ存储进识别库文件中:
由此得到针对高斯模型的改进型二次分类器,用MQDF表示,按下式计算输入特征向量的判决函数gj(Y),
g j ( Y ) = Σ i = 1 k ( ( Y - μ j ) T ζ i ( j ) ) 2 λ i ( j ) + Σ i = k + 1 m ( ( Y - μ j ) T ζ i ( j ) ) 2 λ + Σ i = 1 k log λ i ( j ) + Σ i = k + 1 m log λ , j = 1.2 · · · · · · , C
分类判决准则为:
如果: g i ( Y ) = min 1 ≤ j ≤ C g j ( Y )
则:把Y归为第j个类别;
识别阶段:
首先,由待识样本得到识别特征Y,用下式计算每个类别的判决函数gj(Y),m,K的取值与训练过程相同;
g j ( Y ) = Σ i = 1 k ( ( Y - μ j ) T ζ i ( j ) ) 2 λ i ( j ) + Σ i = k + 1 m ( ( Y - μ j ) T ζ i ( j ) ) 2 λ + Σ i = 1 k log λ i ( j ) + Σ i = k + 1 m log λ , j = 1.2 · · · · · · , C 其次,
把输入的待识样本划分到使gj(Y)取最小值的类别。
CNB200510011510XA 2005-04-01 2005-04-01 基于统计结构特征的联机手写汉字识别方法 Expired - Fee Related CN1333366C (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CNB200510011510XA CN1333366C (zh) 2005-04-01 2005-04-01 基于统计结构特征的联机手写汉字识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CNB200510011510XA CN1333366C (zh) 2005-04-01 2005-04-01 基于统计结构特征的联机手写汉字识别方法

Publications (2)

Publication Number Publication Date
CN1664846A true CN1664846A (zh) 2005-09-07
CN1333366C CN1333366C (zh) 2007-08-22

Family

ID=35035928

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB200510011510XA Expired - Fee Related CN1333366C (zh) 2005-04-01 2005-04-01 基于统计结构特征的联机手写汉字识别方法

Country Status (1)

Country Link
CN (1) CN1333366C (zh)

Cited By (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100394435C (zh) * 2006-05-25 2008-06-11 无敌科技(西安)有限公司 一种文字识别的方法
WO2010031242A1 (zh) * 2008-09-18 2010-03-25 炬力集成电路设计有限公司 一种手写符号的识别方法及装置
CN101320422B (zh) * 2008-06-06 2010-06-02 广东开心信息技术有限公司 手写汉字笔画交接离的规范性判定方法和装置
CN101901344A (zh) * 2010-08-13 2010-12-01 上海交通大学 基于腐蚀方法和DoG算子检测文字图像局部特征的方法
CN102043537A (zh) * 2010-12-28 2011-05-04 东莞宇龙通信科技有限公司 一种移动终端及手写输入的控制方法
CN102135820A (zh) * 2011-01-18 2011-07-27 浙江大学 一种平面化预处理方法
CN101393643B (zh) * 2007-09-21 2012-01-18 华东师范大学 计算机笔划变形***和方法
CN103646582A (zh) * 2013-12-04 2014-03-19 广东小天才科技有限公司 一种提示书写错误的方法及装置
CN104102450A (zh) * 2014-06-18 2014-10-15 深圳贝特莱电子科技有限公司 一种基于触摸屏手势识别的方法及***
CN104766101A (zh) * 2015-04-22 2015-07-08 福州大学 一种基于寻找特征值的k近邻手写识别***算法
CN106485280A (zh) * 2016-10-18 2017-03-08 安徽天达网络科技有限公司 一种基于计算机的图像识别方法
CN108416249A (zh) * 2017-02-10 2018-08-17 肖奇 一种书写笔迹鉴别***及方法
CN108932454A (zh) * 2017-05-23 2018-12-04 杭州海康威视***技术有限公司 一种基于图片的字体识别方法、装置及电子设备
CN111144064A (zh) * 2019-12-05 2020-05-12 稿定(厦门)科技有限公司 文字变形方法、介质、设备及装置
CN112001392A (zh) * 2019-05-27 2020-11-27 株式会社东芝 读取***、读取方法、存储介质以及移动体
CN112861709A (zh) * 2021-02-05 2021-05-28 金陵科技学院 一种基于简笔画的手绘草图识别方法
CN114495117A (zh) * 2022-02-15 2022-05-13 甘肃政法大学 一种中文手写汉字的笔划提取方法

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101299236B (zh) * 2008-06-25 2010-06-09 华南理工大学 一种中文手写词组识别方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09319826A (ja) * 1996-05-28 1997-12-12 Oki Electric Ind Co Ltd 手書き文字認識装置
JP3470541B2 (ja) * 1997-01-29 2003-11-25 株式会社日立製作所 オンライン手書き文字認識装置
CN1204817A (zh) * 1997-07-02 1999-01-13 株式会社三井高科技 联机手写输入字符的识别方法及装置、执行该方法的记录媒体
US6389166B1 (en) * 1998-10-26 2002-05-14 Matsushita Electric Industrial Co., Ltd. On-line handwritten Chinese character recognition apparatus

Cited By (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100394435C (zh) * 2006-05-25 2008-06-11 无敌科技(西安)有限公司 一种文字识别的方法
CN101393643B (zh) * 2007-09-21 2012-01-18 华东师范大学 计算机笔划变形***和方法
CN101320422B (zh) * 2008-06-06 2010-06-02 广东开心信息技术有限公司 手写汉字笔画交接离的规范性判定方法和装置
WO2010031242A1 (zh) * 2008-09-18 2010-03-25 炬力集成电路设计有限公司 一种手写符号的识别方法及装置
CN101901344A (zh) * 2010-08-13 2010-12-01 上海交通大学 基于腐蚀方法和DoG算子检测文字图像局部特征的方法
CN101901344B (zh) * 2010-08-13 2012-04-25 上海交通大学 基于腐蚀方法和DoG算子检测文字图像局部特征的方法
CN102043537A (zh) * 2010-12-28 2011-05-04 东莞宇龙通信科技有限公司 一种移动终端及手写输入的控制方法
CN102043537B (zh) * 2010-12-28 2013-12-25 东莞宇龙通信科技有限公司 一种手写输入的控制方法及装置
CN102135820A (zh) * 2011-01-18 2011-07-27 浙江大学 一种平面化预处理方法
CN102135820B (zh) * 2011-01-18 2013-03-06 浙江大学 一种平面化预处理方法
CN103646582A (zh) * 2013-12-04 2014-03-19 广东小天才科技有限公司 一种提示书写错误的方法及装置
CN103646582B (zh) * 2013-12-04 2016-08-17 广东小天才科技有限公司 一种提示书写错误的方法及装置
CN104102450A (zh) * 2014-06-18 2014-10-15 深圳贝特莱电子科技有限公司 一种基于触摸屏手势识别的方法及***
CN104766101A (zh) * 2015-04-22 2015-07-08 福州大学 一种基于寻找特征值的k近邻手写识别***算法
CN104766101B (zh) * 2015-04-22 2018-02-06 福州大学 一种基于寻找特征值的k近邻手写识别***算法
CN106485280A (zh) * 2016-10-18 2017-03-08 安徽天达网络科技有限公司 一种基于计算机的图像识别方法
CN108416249A (zh) * 2017-02-10 2018-08-17 肖奇 一种书写笔迹鉴别***及方法
CN108932454A (zh) * 2017-05-23 2018-12-04 杭州海康威视***技术有限公司 一种基于图片的字体识别方法、装置及电子设备
CN112001392A (zh) * 2019-05-27 2020-11-27 株式会社东芝 读取***、读取方法、存储介质以及移动体
CN111144064A (zh) * 2019-12-05 2020-05-12 稿定(厦门)科技有限公司 文字变形方法、介质、设备及装置
CN111144064B (zh) * 2019-12-05 2022-07-19 稿定(厦门)科技有限公司 文字变形方法、介质、设备及装置
CN112861709A (zh) * 2021-02-05 2021-05-28 金陵科技学院 一种基于简笔画的手绘草图识别方法
CN114495117A (zh) * 2022-02-15 2022-05-13 甘肃政法大学 一种中文手写汉字的笔划提取方法

Also Published As

Publication number Publication date
CN1333366C (zh) 2007-08-22

Similar Documents

Publication Publication Date Title
CN1664846A (zh) 基于统计结构特征的联机手写汉字识别方法
CN1235177C (zh) 手写签名认证程序、方法和装置
CN1191536C (zh) 手形手势识别装置及识别方法
CN100336070C (zh) 复杂背景图像中的鲁棒人脸检测方法
CN1161687C (zh) 手写体匹配技术
CN1156791C (zh) 模式识别设备与方法
CN1215433C (zh) 联机文字识别装置及方法
CN1151465C (zh) 利用候选表进行分类的模式识别设备及其方法
CN1818927A (zh) 指纹识别方法与***
CN100347719C (zh) 基于密度图模型的指纹识别方法
CN1794266A (zh) 生物特征融合的身份识别和认证方法
CN1177407A (zh) 基于速度的手写体识别方法和***
CN1310825A (zh) 用于分类文本以及构造文本分类器的方法和装置
CN1251130C (zh) 多字体多字号印刷体藏文字符识别方法
CN101055620A (zh) 形状比较装置和方法
CN1200387C (zh) 基于单个字符的统计笔迹鉴别和验证方法
CN1669052A (zh) 使用三维物体模型的图像匹配***、图像匹配方法以及图像匹配程序
CN1747559A (zh) 三维几何建模***和方法
CN1945599A (zh) 图像处理装置,图像处理方法和计算机程序产品
CN1719454A (zh) 几何代价和语义-识别代价融合的脱机手写汉字切分方法
CN1041773C (zh) 由字符图象直方图0-1图形表示识别字符的方法和装置
CN1973757A (zh) 基于舌象特征的病证计算机分析***
CN1696933A (zh) 基于动态规划的文本概念关系自动提取方法
CN1588425A (zh) 多注册指纹融合方法
CN1266643C (zh) 基于***字符集的印刷体字符识别方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C17 Cessation of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20070822

Termination date: 20140401