CN1437162A - 基于单个汉字字符的字体识别方法 - Google Patents
基于单个汉字字符的字体识别方法 Download PDFInfo
- Publication number
- CN1437162A CN1437162A CN 03119130 CN03119130A CN1437162A CN 1437162 A CN1437162 A CN 1437162A CN 03119130 CN03119130 CN 03119130 CN 03119130 A CN03119130 A CN 03119130A CN 1437162 A CN1437162 A CN 1437162A
- Authority
- CN
- China
- Prior art keywords
- mrow
- msub
- msubsup
- msup
- munderover
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 49
- 238000004458 analytical method Methods 0.000 claims abstract description 10
- 239000011159 matrix material Substances 0.000 claims description 34
- 230000009466 transformation Effects 0.000 claims description 34
- 239000013598 vector Substances 0.000 claims description 24
- 238000012549 training Methods 0.000 claims description 16
- 238000012545 processing Methods 0.000 claims description 8
- 238000000605 extraction Methods 0.000 claims description 6
- 238000002474 experimental method Methods 0.000 claims description 5
- 238000005070 sampling Methods 0.000 claims description 5
- 229910052799 carbon Inorganic materials 0.000 claims description 3
- 238000009966 trimming Methods 0.000 claims description 2
- 238000006243 chemical reaction Methods 0.000 abstract 1
- 238000007493 shaping process Methods 0.000 abstract 1
- 238000000354 decomposition reaction Methods 0.000 description 11
- 239000000284 extract Substances 0.000 description 6
- 238000004364 calculation method Methods 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 3
- 238000011084 recovery Methods 0.000 description 3
- 125000004432 carbon atom Chemical group C* 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 230000002411 adverse Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
Images
Landscapes
- Character Discrimination (AREA)
Abstract
基于单个汉字字符的字体识别方法属于汉字字体识别领域。其特征在于,它是一种利用小波变换的与文本无关的字体识别方法。它根据选定的层数J,用相应的尺度函数和小波函数的离散滤波器对离散信息作卷积处理,对原始图像进行J层小波变换,得到3J+1个子图像;再把各个子图像划分为子块,以每个子块中小波系数绝对值的加权和作为特征,经过整形处理后,得到原始图像的小波特征。然后再利用线性鉴别分析从小波特征中提取字体识别特征,最后用高斯模型的二次分类器进行训练和识别。本发明的平均识别率可达97.35%。
Description
技术领域
基于单个汉字字符的字体识别方法属于汉字字体识别技术领域。
背景技术
在文档自动处理过程中,字体信息是版面分析、理解和恢复的重要依据,还有助于实现高性能字符识别***。首先,汉字识别***不仅要能准确识别汉字的字符,还要能恢复原有的版面格式,而版面格式的恢复包含了字体信息的恢复。其次,由于版面中不同部分的文本往往使用不同的字体(如标题、摘要和正文一般使用不同的字体),字体信息可以用来辅助版面分析和理解。第三,由于单体字符识别相对于多体字符识别的简单性,单体字符识别***比多体字符识别***有更高的识别率和更好的鲁棒性。如果能够得到待识别汉字的字体信息,就能够用单体字符识别***进行识别,获得更好的识别性能。
要自动得到汉字的字体信息,必须使用字体识别技术。当前文献中的字体识别技术大多应用于英文等字母文字,这些技术使用了字母文字特有的一些属性,例如基线的位置、是否有衬线、同一个单词内各个字母间的空白长度、某些语言中高频率词汇的匹配、单词长度的直方图等方法。由于这些技术和字母文字的特点结合紧密,而汉字并不存在这些特点,使得这些技术无法应用于汉字字符的字体识别。文献中能够应用于汉字的字体识别技术非常少,有学者使用Gabor滤波器提取纹理特征,对汉字字符进行字体识别。该方法的处理对象是由多个汉字组成的字符块,无法对单个汉字字符的字体进行识别。事实上,目前还没有针对单个汉字进行的字体识别研究。而在实际应用中,至少有两种情况需要对单个汉字的字体进行识别:第一,为了强调某些内容,一个句子中的某几个字往往用不同的字体进行表示。第二,在某些情况下,无法得到较多的字符用来组成一个字符块(例如某些只有几个字的标题;以及在表格识别中,某些表格项常常只有几个汉字,甚至只有一个汉字)。
字体识别可以分为两类:文本相关的字体识别和文本无关的字体识别。文本相关的字体识别是指在进行字体识别时,已经知道待处理汉字的字符信息,并且在字体识别过程中使用了这些信息。文本无关的字体识别是指在进行字体识别时,并不知道待处理汉字的字符信息。对于一个汉字字符图像,字体信息体现在笔划本身的属性以及各个笔划之间的相互关系上。进行单个汉字字符的字体识别时,如果知道汉字的字符,就意味着知道该汉字中有哪些笔划以及这些笔划的基本分布和相互关系;如果不知道汉字的字符,则对汉字中某些笔划的存在与否以及相互关系毫无先验知识,在这种情况下,字体识别的难度非常大。
本发明实现了在文本无关情况下,对单个汉字字符的字体识别。本发明使用了小波特征识别字体,处理的对象是单个汉字字符,这些都是目前所有其他文献中所没有的。
发明内容
本发明能够在对字符没有先验知识的情况下,对单个汉字图像进行分析,得到该字符的字体信息。我们首先利用小波变换得到小波特征,然后使用线性鉴别分析(LDA)从小波特征中提取字体识别特征,并用MQDF分类器进行字体识别。本发明由以下几部分组成:小波特征提取,特征变换,分类器设计。
1.小波特征提取
研究文本相关的字体识别时,研究对象是不同字体表示下的相同汉字,其差异只体现在字体上,因此提取字体识别特征比较容易。但本发明考虑的是文本无关的字体识别,对汉字的字符先验知识没有要求,我们的研究对象是不同字体表示下的不同汉字。在这种情况下,首要的差异是不同字符之间的差异,字体之间的差异处于次要地位。如何在这种情况下提取能有效反映字体差别的特征,是字体识别***的基础。
小波变换是信号处理的一种变换方法,能够对信号进行局域分析。而且,小波变换能够很自然地导入多分辨率分析。由于小波变换具有以上特点,我们对字符图像进行小波变换,然后在变换图像上提取字体识别特征。
我们从多分辨率分析(MRA)开始引入小波变换。在MRA中,令{Vj},j∈Z为L2(R2)上的子空间序列,并且满足MRA的条件,其中Z为整数集。φ(·)为一维尺度函数,定义Φ(x,y)≡φ(x)·φ(y),则每个子空间Vj由标准正交基
,(n,m)∈Z2张成,式中
。令{Oj},j∈Z为L2(R2)上的子空间序列,而且满足Oj是Vj在Vj+1中的正交补空间,即Vj+1=VjOj。令(·)为对应尺度函数φ(·)的一维小波函数,我们定义如下三个函数:
ψ(1)(x,y)≡φ(x)·(y)
ψ(2)(x,y)≡(x)·φ(y) (1)
ψ(3)(x,y)≡(x)·(y)
并且定义
,则子空间Oj由如下的标准正交基张成:
由于实际处理的图像并不是理想图像,其分辨率是有限的,我们把实际图像看作是理想图像(有无穷分辨率)在分辨率20下的估计,即把原始图像视为
。设原始图像的大小为N×N,则在分辨率2j(j≤0)下每个子图像的大小为2-jN×2-jN。
对图像进行分析时,首先在最高分辨率20下对图像进行分解,得到2-1分辨率下的4个子图像
和
(分解结果如图4a所示,分解的计算过程参见后面的“具体实施方式”部分)。然后进一步分解子图像
,得到2-2分辨率下的4个子图像(如图4b所示),我们可以继续分解
并持续这个过程。通过以上分解方法,对于任意正整数J,原始图像由以下3J+1个子图像表示:
上式就是二维图像的小波变换(也称小波分解)。通过选取不同的尺度函数和小波函数,就可以实现不同的小波变换。从前面的说明可以看出(也可参考图4),如果原始图像(即
)的大小为N×N,则
的大小为2-JN×2-JN,
和
的大小为2-jN×2-jN。
在本发明中,我们首先把输入字符图像归一化为48*48大小。然后对归一化的图像进行小波变换。我们选择Spline2小波(要指出的是,本发明技术并不局限于Spline2小波。在大多数小波上,本发明技术都能取得令人满意的结果。这里选择Spline2小波,是出于对速度和识别性能的综合考虑。Spline2小波的尺度函数和小波函数见图5),进行三层小波变换(即式(4)中的J=3),得到10个子图像
。我们从这十个子图像中提取子波特征。
和
这三个子图像为24*24大小,我们把每个子图像划分为6*6个子块,统计每个子块中子波系数绝对值的加权和,得到36维特征,三个子图像共得到108维特征。
和
三个子图像为12*12大小,我们把每个子图像划分为4*4个子块,统计每个子块中子波系数绝对值的加权和,得到16维特征,三个子图像共得到48维特征。
和
四个子图像为6*6大小,我们直接用子波系数的绝对值作为特征,每个子图像得到36维特征,四个子图像共144维特征。综合以上三部分特征,我们得到108+48+144=300维特征。由于后续的特征变换和MQDF分类器都以高斯分布为基础,提取的特征越接近高斯分布,模型误差就越小,***性能就越高。为改善特征分布,使之更接近高斯分布,我们用Box-Cox变换对特征进行整形,公式如下:
上式中,α为Box-Cox变换的参数,本发明中取值0.7。对每维特征都进行以上变换,就得到300维的小波特征。
2.特征变换
前面提取的小波特征虽然能够反映不同字体间的差异,但也包含很多与字体识别无关的信息。这些信息会干扰字体识别的结果,降低字体识别的性能,因此需要进行特征变换,尽可能去除这部分信息。我们使用线性鉴别分析技术(LDA)进行特征变换,目的是对原始特征进行变换,有效提取对字体识别最有利的信息,同时尽可能去除与字体识别无关的信息,同时改善特征的分布。
然后计算类内散度矩阵Sw和类间散度矩阵Sb:
我们选取|(Sb+Sw)/Sw|作为优化准则,即求取线性变换W,使得
最大。变换矩阵W为n×m维矩阵,n为原始特征维数,m为变换后的特征维数。
我们对矩阵
(Sb+Sw)进行特征值和特征向量分解,得到特征值{γi,i=1,2,...,n}(特征值按值的大小降序排列)和特征向量{ξi,i=1,2,...,n}。用前m个特征向量组成矩阵W=[ξ1,ξ2,...,ξm],则W就是符合前面要求的线性变换矩阵。特征选择的公式如下:
Y=WT·V (8)
上式中,V为原始小波特征向量,Y是经过变换后的特征向量。
3.分类器设计
本发明使用了针对高斯模型的改进型二次分类器(MQDF)。这里先介绍标准二次分类器(QDF),QDF的判决函数为:
把Y归为第i个类别,如果
。(式中C为类别数目)
在实际应用中,由于对小特征值的估计不准确,造成QDF的性能下降。为降低小特征值估计不准对分类性能的不利影响,我们使用改进的二次分类器(MQDF)。MQDF对过小的特征值用事先确定的常数代替,其判别函数如下:
本发明的特征在于:
首先,它是一种利用小波特征的文本无关的单个汉字字符的字体识别方法。它依次含有以下步骤:
(1)用小波变换方法提取小波特征。
(1.2)从3J+1个子图像中提取子波特征:
从j=-1开始到j=-J止,按层把每个子图像划分成一定数量的子块,统计每个子
块中子波系数绝对值的加权和,得到对应该子块的一维特征。把各层所有子块求得的特
征进行组合,得到原始图像f(x,y)的总的子波特征。
(1.3)用Box-Cox变换对特征进行修整,使之接近高斯分布:
α为Box-Cox变换的参数,设α=0.7,对每维特征都进行以上变换,得到修正的小波特征。
(2)特征变换。用线性鉴别分析(LDA)从小波特征中提取字体识别特征,以改善特征分布,提高识别性能,它依次含有以下步骤:
(2.1)用下式计算每个类别的均值μi以及所有类别的均值μ:
别的样本个数,C表示类别数目。
(2.2)用下式计算类内散度矩阵Sw和类间散度矩阵Sb:
(2.4)用前m个特征向量组成线性变换矩阵W=[ξ1,ξ2,...,ξm]
(2.5)得到经变换后的特征向量,用Y表示:
Y=WT·V
其中V是小波特征向量。
(3)用MQDF分类器进行字体识别。(MQDF分类器是用于高斯模型的二次分类器)
(3.1)训练过程:
(3.1.1)首先提取小波特征,经过变换后得到m维特征。对每个类别j,用下式统计其均值μj和协方差阵∑j:
其中,
为属于第j个类别的第i个样本提取的小波特征向量经LDA变换后的特征向量,Nj表示第j个类别的样本个数。
(3.1.2)对每个类别的协方差阵∑j进行特征值和特征向量分解,得到按值的大小降序排列的特征值
和特征向量
(3.1.3)计算小特征值的替代值:
其中,k为小于m的正整数,由实验确定。本专利中,m取值为256,k取值为224。
(3.1.4)把前面得到的λ、μj(j=1,2,...,C)、
(j=1,2,...,C,i=1,2,...,m)、(j=1,2,...,C,i=1,2,...,k)存储到识别库文件中,供后续的识别使用。
(3.2)识别过程:
(3.2.1)用下式计算每个类别的判决函数gj(Y):
其中,k为小于m的正整数,λ是常数。k由实验确定,取值224。λ的计算见前面的训练过程。
(3.2.2)输入的图像被划分为使gj(Y)取最小值的类别。
前面所述的步骤(1)中的第(1.1)步,它依次含有以下步骤:
(1.1.1)在水平方向分别用根据尺度函数得到的离散滤波器H和根据小波函数得到的离散滤波器G对原始图像
进行卷积,并对滤波图像在水平方向进行亚取样处理,即每两个样本只保留一个,得到两个子图像;再对这两个子图像在垂直方向分别用离散滤波器H和G进行卷积,并按上述方式作亚取样处理,得到四个子图像,即
(1.1.3)按照以上步骤,一直进行到所选定的层次J,得到
,其中,-J≤j≤-1。
实验证明本发明的平均识别率为97.35%,是很令人满意的。
附图说明
图1字体识别***的训练过程。
图2字体识别***的识别过程。
图3图像的一层小波分解,图中,G/H表示用G/H在水平或垂直方向进行卷积,2↓1表示在水平或垂直方向进行亚取样,即每两个样本保留一个样本。
图5Spline2小波的尺度函数和小波函数,(a)尺度函数,(b)小波函数。
图6初始小波特征提取的流程图。
图7求取变换矩阵W的流程图。
图8字符“啊”的图像以及小波变换后的图像。
图9字符“啊”的小波变换图像示意图。
具体实施方式
实现单汉字字符的字体识别***时,首先通过训练得到识别库,然后就可以根据识别库对单个汉字字符的字体进行识别。***的训练过程如图1所示,识别过程如图2所示。
***的输入是归一化为48*48的单个汉字图像。汉字图像的切分和归一化部分不包含在本发明中,不进行详细说明。
下面详细介绍***的各个部分:
1.小波特征提取
我们首先对字符图像进行小波变换,然后在变换后的图像上提取小波特征。在前面发明内容的介绍中,我们已经介绍了小波变换。二维图像的小波变换可以用式(3)表示。我们用快速小波变换计算字符图像的小波变换,具体步骤如下:
1)首先,根据尺度函数φ(·)得到离散滤波器H,根据小波函数(·)得到离散滤波器G。本发明使用Spline2小波(要指出的是,本发明技术并不局限于Spline2小波。在大多数小波上,本发明技术都能取得令人满意的结果。这里选择Spline2小波,是出于对速度和识别性能的综合考虑),对应的H为
G为
。我们把输入的原始字符图像看做
2)如图3所示,在水平方向分别用滤波器H和G对图像
进行卷积,并对滤波图像在水平方向进行亚取样处理(每两个样本只保留一个),得到两个子图像。再对这两个子图像在垂直方向分别用滤波器H和G进行卷积,并对四个滤波图像在垂直方向进行亚取样处理(每两个样本只保留一个),得到四个子图像,即
对于
这三个图像,我们把每个图像等分为6*6个子块,每个子块为4*4大小,为使特征更稳定,我们把每个子块扩展为6*6大小,中心不变,即相邻子块间有两行(或列)象素的交叠。用下式统计一个子块中子波系数绝对值的加权和,得到一维特征:
上式中,B指某个子块区域,xcenter和ycenter为子块B的几何中心坐标,f(x,y)是子波图像中(x,y)点的象素值,也就是子波系数。计算图像最***的子块时,我们扩展图像的最外一圈象素(具体扩展方式:图像***增加一图象素,除四个角部外,每个新增加象素的值取相邻(此相邻指4连通,即每个象素和上、下、左、右的4个象素相邻)的原图象素值,四个角部的象素值取相邻(此相邻指8连通,即每个象素和上、下、左、右、左上、右上、左下、右下的8个象素相邻)的原图象素值),以保证每个子块都为6*6大小。对每个子块进行以上计算,每个图像得到36维特征,三个图像共得到108维特征。
对于
这三个图像,我们把每个图像等分为4*4个子块,每个子块为3*3大小,为使特征更稳定,我们把每个子块扩展为5*5大小,中心不变,即相邻子块间有两行(或列)象素的交叠。用式(12)统计一个子块中子波系数绝对值的加权和,得到一维特征。为保证每个子块都是5*5大小,我们用和前面相同的方法扩展原图像。经以上计算,每个图像得到16维特征,三个图像共得到48维特征。 和
四个子图像为6*6大小,我们直接用子波系数的绝对值作为特征,每个子图像得到36维特征,四个子图像共144维特征。
综合以上三部分特征,我们得到108+48+144=300维特征。由于后续的特征变换和MQDF分类器都以高斯分布为基础,提取的特征越接近高斯分布,模型误差就越小,***性能就越高。为改善特征分布,使之更接近高斯分布,我们用Box-Cox变换对特征进行整形,公式如下:
在本发明中,取α的值为0.7。经过以上变换,我们提取到的特征称为初始小波特征。
特征提取的流程图见图6。
2.特征变换
得到300维初始小波特征后,需要求取变换矩阵W,对初始小波特征进行变换,得到最终的特征。求取W的具体步骤如下:
1)用式(5)和式(6)计算每个类别的均值以及所有类别的均值。
2)用式(7)计算类内散度矩阵Sw和类间散度矩阵Sb。
3)对矩阵
进行特征值和特征向量分解,得到特征值{γi,i=1,2,...,n}(特征值按值的大小降序排列)和特征向量{ξi,i=1,2,...,n}。用前256个特征向量组成矩阵W=[ξ1,ξ2,...,ξ256],则W就是要求取的线性变换矩阵。
得到变换矩阵W后,用式(8)即可求取最终的特征。最终的特征为256维。
求取变换矩阵W的流程图见图7。
3.训练过程
训练过程如图1所示。首先提取300维小波特征,变换后得到256维特征向量Y。然后对每个类别,用下式统计其均值和协方差阵:
上式中,
表示第j个类别的第i个训练样本提取的特征向量,Nj是第j个类别的训练样本数目,μj表示第j个类别的均值,∑j表示第j个类别的协方差矩阵。
我们用下式计算MQDF分类器中的参数λ:
上式中,
表示∑j的第225个特征值,C表示类别数目。λ将被用在识别过程的MQDF分类器中,在后续部分会进一步说明。
4.识别过程
识别过程如图2所示。首先提取300维小波特征,变换后得到256维特征向量Y。我们用MQDF分类器对输入汉字的字体进行识别。MQDF分类器的判决函数见式(10)。我们用该式计算每个类别的gj(Y),分类规则如下:
把Y归为第i个类别,如果
。(式中C为类别数目)
用式(10)计算gi(Y)时,k取值224,λ在训练过程中用式(16)计算得到。所有需要的参数都从识别库文件中读取。
我们以字符“啊”为例来说明字体的识别过程。
i)输入字符“啊”如图8中的左图所示,经三级小波变换后的图像如图8中的右图所示。三级小波变换得到十个子图像,如图9所示。为清楚表示,图9中的每个子图像用一个矩形框围住。
ii)用图6所示的方法提取300维初始小波特征。
iii)用式(8)进行特征变换后,得到256维识别特征。(变换矩阵在训练过程中得到。)
iv)对每个类别,用式(10)计算判别函数的值。共得到C个判别函数值(C为类别数目)。(式(10)中的所有参数在训练过程中得到。)
v)在得到的C个判别函数值中,取最小的判别函数值,其对应的类别就是最终的识别结果。
为验证本发明的有效性,我们进行了如下实验:
测试样本集包含7种字体:宋体、仿宋、黑体、楷体、隶书、魏碑、园体。每种字体包含3755个不同的汉字字符(国标一级汉字集)。用前3000个字符训练,后755个字符测试,实验结果如下:
宋体 | 仿宋 | 黑体 | 楷体 | 隶书 | 魏碑 | 园体 | |
宋体 | 97.88% | 1.32% | 0.00% | 0.26% | 0.00% | 0.13% | 0.40% |
仿宋 | 2.12% | 95.63% | 0.00% | 1.32% | 0.00% | 0.13% | 0.79% |
黑体 | 0.13% | 0.00% | 99.21% | 0.13% | 0.00% | 0.26% | 0.26% |
楷体 | 1.06% | 3.31% | 0.40% | 94.04% | 0.00% | 0.66% | 0.53% |
隶书 | 0.00% | 0.00% | 1.46% | 0.00% | 97.88% | 0.66% | 0.00% |
魏碑 | 0.00% | 0.00% | 0.26% | 0.00% | 1.32% | 98.41% | 0.00% |
园体 | 1.06% | 0.00% | 0.40% | 0.00% | 0.00% | 0.13% | 98.41% |
平均 | 97.35% |
考虑到我们的处理对象是不知道字符信息的单个汉字,以上识别率是非常令人满意的。
综上所述,本发明能够在没有字符先验知识的前提下,对单个汉字字符的字体进行识别。本发明在实验中获得了优异的识别结果,具有非常广泛的应用前景。
Claims (3)
1.基于单个汉字字符的字体识别方法,依次会有特征提取、特征变换、训练和识别的步骤,其特点在于,它是一种利用小波特征的文本无关的单个汉字字符的字体识别方法,它依次含有以下步骤:
(1)用小波变换方法提取小波特征:
(1.1)根据选定的J(层数),用相应的尺度函数和小波函数对应的离散滤波器对原始图像即f(x,y)(后面用f表示),进行J层小波变换,得到3J+1个子图像,表示如下:
(1.2)从3J+1个子图像中提取子波特征:
从j=-1开始到j=-J止,按层把每个子图像划分成一定数量的子块,统计每个子块中子波系数绝对值的加权和,得到对应该子块的一维特征,把各层所有子块求得的特征进行组合,得到原始图像f(x,y)的总的子波特征;
α为Box-Cox变换的参数,设α=0.7,对每维特征都进行以上变换,得到修正的小波特征;
(2)特征变换,用线性鉴别分析(LDA)从小波特征中提取字体识别特征,以改善特征分布,提高识别性能,它依次含有以下步骤:
(2.1)用下式计算每个类别的均值μj以及所有类别的均值μ:
(2.2)用下式计算类内散度矩阵Sw和类间散度矩阵Sb:
(2.4)用前m个特征向量组成线性变换矩阵W=[ξ1,ξ2,...,ξm]
(2.5)得到经变换后的特征向量,用Y表示:
Y=WT·V
其中V是小波特征向量;
(3)用MQDF分类器进行字体识别(MQDF分类器是用于高斯模型的二次分类器);
(3.1)训练过程:
(3.1.1)首先提取小波特征,经过变换后得到m维特征,对每个类别j,用下式统计其均值μj和协方差阵∑j:
其中,
为属于第j个类别的第i个样本提取的小波特征向量经LDA变换后的特征向量,Nj表示第j个类别的样本个数;
(3.1.2)对每个类别的协方差阵∑j进行特征值和特征向量分解,得到按值的大小降序排列的特征值
和特征向量
(3.1.3)计算小特征值的替代值:
其中,k为小于m的正整数,由实验确定,本专利中,m取值为256,k取值为224;
(3.1.4)把前面得到的λ、μj(j=1,2,...,C)、
(j=1,2,...,C,i=1,2,...,m)、(j=1,2,...,C,i=1,2,...,k)存储到识别库文件中,供后续的识别使用;
(3.2)识别过程:
(3.2.1)用下式计算每个类别的判决函数gj(Y):
其中,k为小于m的正整数,λ是常数,k由实验确定,取值224,λ的计算见前面的训练过程;
(3.2.2)输入的图像被划分为使gi(Y)取最小值的类别。
3.根据权利要求1所述的基于单个汉字字符的字体识别方法,其特征在于:所述的小波是Spline2小波,它根据尺度函数得到的离散滤波器H为
,根据小波函数得到的离散滤波器G为
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 03119130 CN1238816C (zh) | 2003-03-14 | 2003-03-14 | 基于单个汉字字符的字体识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 03119130 CN1238816C (zh) | 2003-03-14 | 2003-03-14 | 基于单个汉字字符的字体识别方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1437162A true CN1437162A (zh) | 2003-08-20 |
CN1238816C CN1238816C (zh) | 2006-01-25 |
Family
ID=27634500
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN 03119130 Expired - Fee Related CN1238816C (zh) | 2003-03-14 | 2003-03-14 | 基于单个汉字字符的字体识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN1238816C (zh) |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2007090351A1 (en) * | 2006-02-09 | 2007-08-16 | Canon Kabushiki Kaisha | Method, apparatus and storage medium for image classification |
CN100338621C (zh) * | 2005-04-07 | 2007-09-19 | 上海交通大学 | 有限字符样本集上特征值误差补偿及参数分布修正方法 |
CN101901344A (zh) * | 2010-08-13 | 2010-12-01 | 上海交通大学 | 基于腐蚀方法和DoG算子检测文字图像局部特征的方法 |
CN101968847A (zh) * | 2009-06-30 | 2011-02-09 | 甲骨文美国公司 | 统计学在线字符识别 |
CN101216890B (zh) * | 2008-01-09 | 2011-02-16 | 北京中星微电子有限公司 | 一种彩色图像分割方法 |
CN101425141B (zh) * | 2007-10-31 | 2012-06-13 | 富士通株式会社 | 图像识别装置和图像识别方法 |
CN107844740A (zh) * | 2017-09-05 | 2018-03-27 | 中国地质调查局西安地质调查中心 | 一种脱机手写、印刷汉字识别方法及*** |
CN108932454A (zh) * | 2017-05-23 | 2018-12-04 | 杭州海康威视***技术有限公司 | 一种基于图片的字体识别方法、装置及电子设备 |
CN109409373A (zh) * | 2018-09-06 | 2019-03-01 | 昆明理工大学 | 一种基于图像处理的字体识别方法 |
-
2003
- 2003-03-14 CN CN 03119130 patent/CN1238816C/zh not_active Expired - Fee Related
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN100338621C (zh) * | 2005-04-07 | 2007-09-19 | 上海交通大学 | 有限字符样本集上特征值误差补偿及参数分布修正方法 |
WO2007090351A1 (en) * | 2006-02-09 | 2007-08-16 | Canon Kabushiki Kaisha | Method, apparatus and storage medium for image classification |
US8238670B2 (en) | 2006-02-09 | 2012-08-07 | Canon Kabushiki Kaisha | Method, apparatus and storage medium for image classification |
CN101425141B (zh) * | 2007-10-31 | 2012-06-13 | 富士通株式会社 | 图像识别装置和图像识别方法 |
CN101216890B (zh) * | 2008-01-09 | 2011-02-16 | 北京中星微电子有限公司 | 一种彩色图像分割方法 |
CN101968847A (zh) * | 2009-06-30 | 2011-02-09 | 甲骨文美国公司 | 统计学在线字符识别 |
CN101968847B (zh) * | 2009-06-30 | 2014-04-16 | 甲骨文美国公司 | 统计学在线字符识别 |
CN101901344A (zh) * | 2010-08-13 | 2010-12-01 | 上海交通大学 | 基于腐蚀方法和DoG算子检测文字图像局部特征的方法 |
CN101901344B (zh) * | 2010-08-13 | 2012-04-25 | 上海交通大学 | 基于腐蚀方法和DoG算子检测文字图像局部特征的方法 |
CN108932454A (zh) * | 2017-05-23 | 2018-12-04 | 杭州海康威视***技术有限公司 | 一种基于图片的字体识别方法、装置及电子设备 |
CN107844740A (zh) * | 2017-09-05 | 2018-03-27 | 中国地质调查局西安地质调查中心 | 一种脱机手写、印刷汉字识别方法及*** |
CN109409373A (zh) * | 2018-09-06 | 2019-03-01 | 昆明理工大学 | 一种基于图像处理的字体识别方法 |
Also Published As
Publication number | Publication date |
---|---|
CN1238816C (zh) | 2006-01-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1278280C (zh) | 基于内容的图像副本检测方法和计算机*** | |
Yan et al. | Beyond spatial pyramids: A new feature extraction framework with dense spatial sampling for image classification | |
CN1908960A (zh) | 一种基于特征分组的多分类器组合人脸识别方法 | |
CN109409384A (zh) | 基于细粒度图像的图像识别方法、装置、介质及设备 | |
CN1459761A (zh) | 基于Gabor滤波器组的字符识别技术 | |
CN101551864A (zh) | 基于频域方向特征相关性的图像分类方法 | |
CN101510259A (zh) | 一种联机手写藏文字丁的识别方法和识别*** | |
CN103593825A (zh) | 基于改进的非局部约束和局部自相似性的图像超分辨方法 | |
CN103473545A (zh) | 一种基于多特征的文本图像相似度度量方法 | |
Rajput et al. | Handwritten script recognition using DCT and wavelet features at block level | |
Padma et al. | Global approach for script identification using wavelet packet based features | |
CN1437162A (zh) | 基于单个汉字字符的字体识别方法 | |
CN1128423C (zh) | 基于纹理分析的字体和笔迹识别方法 | |
Moussa et al. | Fractal-based system for Arabic/Latin, printed/handwritten script identification | |
AlKhateeb et al. | Multiclass classification of unconstrained handwritten Arabic words using machine learning approaches | |
Singh et al. | A review of different content based image retrieval techniques | |
Jaiem et al. | Arabic font recognition based on a texture analysis | |
Campanini et al. | A novel approach to mass detection in digital mammography based on Support Vector Machines (SVM) | |
Bozkurt et al. | Classifying fonts and calligraphy styles using complex wavelet transform | |
CN112818779B (zh) | 一种基于特征优选与多种特征融合的人体行为识别方法 | |
Padma et al. | Entropy based texture features useful for automatic script identification | |
CN106874920A (zh) | 基于小波包分析和支持向量机的车牌字符识别方法 | |
CN104361354A (zh) | 一种基于稀疏编码k最近邻直方图的海量图像分类方法 | |
Siddiqui et al. | Feature extraction for cursive language document images: Using discrete cosine transform, discrete wavelet transform and gabor filter | |
Puspitasari et al. | Batik Classification using Texture Analysis and Multiclass Support Vector Machine |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
C17 | Cessation of patent right | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20060125 Termination date: 20130314 |