CN101256631A - 一种字符识别的方法、装置、程序和可读存储介质 - Google Patents
一种字符识别的方法、装置、程序和可读存储介质 Download PDFInfo
- Publication number
- CN101256631A CN101256631A CNA2007100787676A CN200710078767A CN101256631A CN 101256631 A CN101256631 A CN 101256631A CN A2007100787676 A CNA2007100787676 A CN A2007100787676A CN 200710078767 A CN200710078767 A CN 200710078767A CN 101256631 A CN101256631 A CN 101256631A
- Authority
- CN
- China
- Prior art keywords
- sample
- distortion sample
- character
- distortion
- recognition result
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Character Discrimination (AREA)
- Image Analysis (AREA)
Abstract
本发明提供一种字符识别的方法、装置、程序和可读存储介质。所述方法包括:对输入的字符样本进行识别,产生识别结果;生成所述识别结果的置信度;根据所述置信度判断所输入的字符样本是否属于变形样本;若为非变形样本,则将所述识别结果作为最终识别结果;若为变形样本,则对变形样本进行识别并生成最终识别结果。本发明的技术方案通过将第一级识别错误的样本直接作为第二级的基本训练样本,能有效的处理那些变形的样本,从而提高***的识别精度。
Description
技术领域
本发明关于模式识别领域,特别关于对变形或轻微异常字符进行识别的技术。具体的讲是一种字符识别的方法、装置、程序和可读存储介质。
背景技术
有很多技术可以用来识别字符。目前被广泛应用的一种方法为基于统计的识别方法,比如支持向量机(Support Vector Machine:SVM)(具体可详见V.N.Vapnik,Statistical Learning Theory,Springer,New York,2nd edition,1998,及C.J.C.Burges,A tutorial on support vector machines forpattern recognition,Data Mining and Knowledge Discovery,2(2):121-167,1998)是用来识别字符的最好的方法之一。当用支持向量机进行识别字符时,通常是事先搜集到很多字符样本,这个样本集也叫训练集。然后将训练集整批输入SVM进行训练.一般而言,SVM首先针对每俩类(如识别10个***数字,则一共有C(10,2)=45个俩类问题,如0和1的识别问题,0和2的识别问题,…,8和9的识别问题等),利用求解二次规划问题,构造一个分类决策函数。当新的字符输入识别时,每一个俩类决策函数对其分类结果投票,最终的分类结果则为得到票数最多的那个字符。
基于统计的方法,尤其支持向量机所得到的分类面通常能得到较好的识别率,但在很多实际应用中,往往需要更高的识别率。比如对银行票据的识别就需要更高精度。整体的输入训练样本,会导致支持向量机对某些变形的样本考虑不够。换言之,这些少量的变形或轻微异常的样本很可能被支持向量机处理为噪声点,而不加考虑。而实际中,对这些变形的样本的识别往往直接影响着***是否能取得更好的识别精度。同时基于统计的识别方法往往需要大量的训练样本,当仅存在少量变形样本时,直接应用基于统计的方法往往不能取得很好的识别效果。近年来有很多方法都集中在如何提高基于统计的方法如支持向量机的训练效率或识别速度
美国专利,专利号为6,327,581,发明名称为“Methods and apparatus forbuilding a support vector machine classifier”,以及美国专利,专利号为6,134,344,发明名称为“Method and apparatus for improving the efficiency ofsupport vector machines”的内容作为本发明的背景技术合并于此。然而,这些方法在处理高度变形样本时,由于它们同样整体的输入训练样本,同样会导致支持向量机对某些变形的样本考虑不够,从而不能取得好的识别效果。
发明内容
针对现有技术的缺陷,本发明提供一种字符识别的方法、装置、程序与可读存储介质。该字符识别方法采用两级识别的方式进行:在第一级里利用传统的统计方法,比如支持向量机对样本进行识别,那些变形或轻微异常的样本往往会被第一级识别错误,在第二级结构里则对第一级传统识别错误的样本单独进行处理。采用两级结构能够很好的处理变形的样本,从而能极大地提高***的精度。
本发明的目的之一是提供一种字符识别方法,所述方法包括以下步骤:对输入的字符样本进行识别,产生识别结果;生成所述识别结果的置信度;根据所述置信度判断所输入的字符样本是否属于变形样本;若为非变形样本,则将所述识别结果作为最终识别结果并输出;若为变形样本,则对变形样本进行识别,生成最终识别结果并输出。
所述对输入的字符样本进行识别采用支持向量机的方法。
所述置信度通过匹配距离拟合分布的方法来生成。
通过匹配距离拟合分布的方法来生成置信度,进一步包括以下步骤:产生识别结果和每个字符类别的匹配距离;按照匹配距离由小到大的顺序选择前l个匹配距离作为候选距离;根据所述l个候选距离计算所述识别结果的置信度。
根据所述置信度判断所输入的字符样本是否属于变形样本,具体包括以下步骤:若所述置信度大于设定阈值,则判断输入的字符样本为非变形样本;反之,则判断输入的字符样本为变形样本。
所述对变形样本进行识别,具体包括以下步骤:生成变形样本模板库,将所述变形样本与所述变形样本模板库的模板向量取差得到差异特征;将所述变形样本转换成类内差异和类间差异,并判断所述差异特征属于类内差异或类间差异;将所述变形样本识别成具有最大置信度的类内差异模板的类别。
所述生成变形样本模板库,具体包括以下步骤:生成变形样本基本库,所述变形样本基本库仅包含所述变形样本;将所述变形样本基本库进行自动聚类生成变形样本模板库。
将所述变形样本与所述变形样本模板库的模板向量取差得到差异特征是指:变形样本仅与所述识别结果的前N个候选类别的变形样本模板取差得到差异特征。
根据所述变形样本生成类间差异,具体包括以下步骤:按照一个给定的百分比进行采样来生成所述类间差异。
本发明的目的之二是提供一种字符识别装置,所述装置包括:第一级分类决策单元,用于对输入的字符样本进行识别,产生识别结果;置信度生成单元,用于生成识别结果的置信度;置信度判断单元,用于根据所述置信度判断所输入的字符样本是否属于变形样本,若为非变形样本则将所述识别结果作为最终识别结果;第二级分类决策单元,用于对变形样本进行识别,生成最终识别结果;输出单元,用于输出所述最终识别结果。
所述第一级分类决策单元为支持向量机。
所述置信度生成单元进一步包括:匹配距离生成单元,用于产生识别结果和每个字符类别的匹配距离;候选距离选择单元,用于按照匹配距离由小到大的顺序选择前l个匹配距离作为候选距离;计算单元,用于根据所述l个候选距离计算所述识别结果的置信度。
所述置信度判断单元进一步包括:阈值设定单元,用于设定一阈值;比较判断单元,比较所述识别结果的置信度与所述阈值的大小,若所述置信度大于设定阈值,则判断输入的字符样本为非变形样本并将所述识别结果作为最终识别结果,反之,则判断输入的字符样本为变形样本并将所述变形样本输入第二级分类决策单元。
所述第二级分类决策单元进一步包括:变形样本模板库生成单元,用于生成变形样本模板库;差异算子单元,用于将所述变形样本与所述变形样本模板库的模板向量取差得到差异特征;变形样本转换单元,用于将所述变形样本转换成类内差异和类间差异;差异特征决策单元,用于判断所述差异特征属于类内差异或类间差异,并将所述变形样本识别成具有最大置信度的类内差异模板的类别。
所述变形样本模板库生成单元进一步包括:变形样本基本库生成单元,用于生成变形样本基本库,所述变形样本基本库仅包含所述变形样本;样本聚类单元,用于将所述变形样本基本库进行自动聚类生成变形样本模板库。
所述差异算子单元,还用于将变形样本与所述识别结果的前N个候选类别的变形样本模板取差得到差异特征。
所述变形样本转换单元进一步包括采样单元,用于按照一个给定的百分比进行采样来生成所述类间差异。
本发明的目之三是提供一种字符识别程序,所述程序包括:对输入的字符样本进行识别,产生识别结果;生成所述识别结果的置信度;根据所述置信度判断所输入的字符样本是否属于变形样本;若为非变形样本,则将所述识别结果作为最终识别结果并输出;若为变形样本,则对变形样本进行识别,生成最终识别结果并输出。
本发明的目的之四是提供一种存储字符识别程序的可读存储介质,所述的可读存储介质存储有以下程序:对输入的字符样本进行识别,产生识别结果;生成所述识别结果的置信度;根据所述置信度判断所输入的字符样本是否属于变形样本;若为非变形样本,则将所述识别结果作为最终识别结果并输出;若为变形样本,则对变形样本进行识别,生成最终识别结果并输出。
本发明采用两级识别结构,第一级识别装置识别错误的样本能够继续进入第二级识别装置进行识别。因此,本发明的技术方案通过将第一级识别错误的样本直接作为第二级的基本训练样本,能有效的处理那些变形的样本,因此能提高***的识别精度。同时,利用错误样本自动生成变形样本库也避免了手动搜集样本库,极大的节省了人力,物力。
另外,本发明对变形样本进行的识别采用了差异特征的方法,通过将变形字符特征向量之间互相取差,从而将多类的字符识别问题转换为两类,也即类内差异和类间差异的识别问题。并在转换后的两类差异特征集合上训练分类器。将多类的字符识别问题转换为两类的识别,能极大地扩充样本数目,有效的利用基于统计的识别方法,改善了分类器训练效果,从而提高了***的精度。
附图说明
图1为本发明字符识别装置的结构框图;
图2a为本发明字符识别方法流程图;
图2b为本发明字符识别实施例的流程图;
图3为本发明置信度生成单元的结构框图;
图4为本发明置信度判断单元的结构框图;
图5为本发明第二级分类决策单元的结构框图;
图6为本发明变形样本模板库生成单元的结构图;
图7为本发明变形样本基本库的生成方法流程图;
图8为本发明变形样本训练库的生成方法流程图;
图9为本发明第二级分类决策单元工作原理图。
具体实施方式
本发明采用两级结构对输入的字符样本进行识别,由于第一级识别错误的样本往往是变形样本或轻微异常的样本,通过将这些识别错误的样本在第二级单独识别处理,从而能大幅度提高对变形样本的识别精度。以下结合附图对本发明进行详细说明。
图1为本发明字符识别装置的结构框图。如图所示,本发明的字符识别装置包括:第一级分类决策单元11、置信度生成单元12、置信度判断单元13和第二级分类决策单元14,在一个较佳的实施例中该字符识别装置还包括输出单元15。其中,第一级分类决策单元11用于对输入的字符样本进行识别,产生识别结果,本发明的第一级分类决策单元可以采用传统的支持向量机来实现;置信度生成单元12,用于生成识别结果的置信度;置信度判断单元13,用于根据所述置信度判断所输入的字符样本是否属于变形样本,若为非变形样本则将所述识别结果作为最终识别结果;第二级分类决策单元14,用于对变形样本进行识别并生成最终识别结果;输出单元15,用于输出所述最终识别结果。
图2a为本发明字符识别方法的流程图。如图所示,步骤S101,第一级分类决策单元11根据训练样本集T101对输入的字符样本进行识别,并产生识别结果。步骤S111,置信度生成单元12计算第一级分类决策单元11产生的识别结果的置信度。步骤S102,置信度判断单元13判断第一级分类决策单元11产生的识别结果置信度是否大于一设定阈值Th1,如果是,则说明输入样本能很可靠的被第一级分类决策单元11识别,于是第一级分类决策单元11的识别结果将是最终识别结果,并跳至步骤S105,由输出单元15输出该最终识别结果。否则,则判断该输入字符样本为变形样本,并进行步骤S106,该输入的变形样本(包括轻微异常样本)被第二级分类决策单元14识别,并将第二级分类决策单元14的识别结果作为最终识别结果,然后进入步骤S105,由输出单元15输出该最终识别结果。第二级分类决策单元14针对变形,能够更好的识别这些异常字符。采用两级结构能更好的针对不同性质的字符进行处理,从而能有效提高***的识别精度。图2b为本发明字符识别一实施例的流程图。
图3为本发明置信度生成单元12的结构框图。如图所示,本发明置信度生成单元12进一步包括匹配距离生成单元31、候选距离选择单元32和计算单元33。其中,匹配距离生成单元31,用于产生识别结果和每个字符类别的匹配距离;候选距离选择单元32,用于按照匹配距离由小到大的顺序选择前l个匹配距离作为候选距离;计算单元33,用于根据所述l个候选距离计算所述识别结果的置信度。以下详细说明置信度生成单元的工作原理:
置信度生成单元12采用从匹配距离拟合分布方法来生成识别结果的置信度。假设将输入样本I匹配为字符类别i的匹配距离Dis(I,i)与输入样本I匹配为字符类别i的条件概率p(I|i)满足如下关系
p(I|i)∝e-Dis(I,i)/t
其中t为一正的预设常数,可由经验或实验得到。实际应用中,很多分布都满足指数的概率分布,比如经常出现的正态分布就属于指数分布。根据贝叶斯理论,给定输入样本图像,将样本图像判断为类别i的后验概率也即置信度可计算为:
其中C为字符类数。上面的公式中,用到了每类字符的先验概率p(i)大致相等的假设,在训练过程中,如果保证每类字符的出现频率基本一致,则此假设可以得到满足。
具体计算置信度过程如下:首先,匹配距离生成单元31产生识别结果和每个字符类别的匹配距离Dis(I,i),其中,i取遍C个字符类别,由此得到输入样本I和所有字符类别的匹配距离。然后,候选距离选择单元32将得到的前l(l C)个匹配距离作为候选距离,其中,每个候选距离所对应的字符类别称为识别候选,记为Candi,i=1,2,...,l;每个识别侯选Candi的匹配距离称为候选距离,记为Disi,且侯选距离已经进行了由小到大的排序,即,Disi>Disj,for i>j i,j=1,2,...,l。最后,计算单元33利用以下公式计算第一级分类决策单元11的识别结果的置信度conf:
其中t为一正的预设常数。实际应用过程中,最后几个侯选的匹配距离往往很大,因此公式(2)中没有用到第l个侯选之后的类别,一方面可以提高计算的速度,另一方面也不会降低置信度的估计准确度。
图4为本发明置信度判断单元13的结构框图。如图所示,置信度判断单元13进一步包括阈值设定单元41和比较判断单元42。其中阈值设定单元41用于预先设定阈值Th1,通常Th1为一在0和1之间的正数;比较判断单元,比较第一级分类决策单元11的识别结果的置信度conf与阈值Th1的大小,若置信度conf大于阈值Th1,则判断输入的字符样本为非变形样本,并将第一级分类决策单元11的识别结果作为最终识别结果;反之,则判断输入的字符样本为变形样本,并将该变形样本输入第二级分类决策单元进行识别。
图5为本发明第二级分类决策单元14的结构框图。如图所示,第二级分类决策单元14进一步包括:变形样本模板库生成单元51、差异算子单元52、变形样本转换单元53和差异特征决策单元54。其中,变形样本模板库生成单元51,用于生成变形样本模板库;差异算子单元52,用于将所述变形样本与所述变形样本模板库的模板向量取差得到差异特征;变形样本转换单元53,用于将所述变形样本转换成类内差异和类间差异;差异特征决策单元54,用于判断所述差异特征属于类内差异或类间差异,并将所述变形样本识别成具有最大置信度的类内差异模板的类别。
图6为变形样本模板库生成单元51的结构图。在一个较佳的实施例中,本发明变形样本模板库由变形样本基本库用基于自动聚类比如C-Mean(A.K.Jain,M.N.Myrthy,and P.J.Flynn.Data clustering:A survey.ACM ComputingSurvey,31(3):264--323,1999.)的方法得到。如图所示,变形样本模板库生成单元51进一步包括变形样本基本库生成单元61和样本聚类单元62。变形样本基本库生成单元61用于生成变形样本基本库,该变形样本基本库仅包含变形样本;样本聚类单元62用于将变形样本基本库进行自动聚类生成变形样本模板库。
在一较佳实施例中,变形样本基本库生成单元61采用图7所示的方法生成变形样本基本库。如图所示,每个训练样本库中的样本被依次输入第一级分类决策单元11。然后,置信度判断单元13根据置信度生成单元12所生成的置信度来判断该样本是否被第一级分类决策单元11识别错误,如果识别错误则将该识别错误的样本加入变形样本基本库,因此,变形样本基本库中仅仅包含了被第一级分类决策单元识别错误的样本,即变形样本。样本聚类单元62针对变形样本基本库,对每一类采用自动聚类算法自动聚合成K个聚类中心,这K个聚类中心则作为这一类样本的K个模板,通过采用自动聚类算法可以生成变形样本模板库。
在一较佳实施例中,差异算子单元52仅将出现在第一级分类决策单元前N个识别候选集合中的类别的模板和输入的变形样本一起计算差异特征,并输入差异特征决策单元54进行识别。这样做避免了识别所有类别的模板和输入变形样本的差异特征,从而能有效的减低差异特征决策单元分类的次数,提高了识别速度。
变形样本转换单元53用于将变形样本训练成类内样本和类间样本。这种转换生成了变形样本训练库,其中类内样本组成类内训练库,类间样本组成类间训练库。本发明采用随机数产生的方法解决类间样本数目远大于类内样本数的不平衡问题,变形样本转化单元进一步包括采样单元,用于按照一个给定的百分比进行采样来生成所述类间差异。具体变形样本训练库的生成方法详见图8。
如图8所示,首先设置初始值,并从变形样本基本库Dw={V1,V2,...,Vq}中提取样本Vk,Vj,判断是否所有变形样本被取完,如果已经取完则结束该流程。如果没有取完则判断Vk,Vj是否是属于同一类别的样本,如果是,则将累加器i加1,计算差异特征Ni,该差异特征为类内差异,并将Ni加入变形样本训练库中的类内训练库。如果不是,则由概率转换单元将所述随机数转化为一概率P,并通过采样单元以概率p(0<p<1为一预设阈值)将Vk,Vj之间的差异特征Ni加入变形样本训练库中的类间训练库。以上过程循环直到所有变形样本之间的差异特征被遍历。
在上面的过程中,首先以一概率产生0至X之间的任意整数,X=[1/p],表示对1/p取其整数部分,由此产生取样概率P。这样采样单元将会以p的概率将类间差异特征加入类间训练库。
一方面在上面的过程中,实际上将多类的变形样本转换为一个两类问题,即判断一对样本为类内还是类间样本,这种方式将极大的扩充样本数量,从而弥补了变形样本数目不足的问题。另一方面采用随机数的方法,能有效的避免类间样本数目远大于类内样本数目的问题,从而使得第二级分类决策单元不会偏向于将差异特征识别为类内差异样本。下面将用示例具体说明该方法的特点。
假设第一级决策函数对训练样本识别错误的样本组成的变形样本基本库Dw中共有10类,比如为10个数字,0-9,每类样本的数目有相同数目q。通常使用基于统计的方法,如SVM的方法来训练第一级决策函数时,被错误识别的样本数目很少,即Dw里每类样本的数目很少,一个典型的数目为15左右。基于这样的小数目的样本,SVM将很难学***衡识别问题,训练出来的决策函数往往会倾向于把新的输入样本识别为样本数多的那类样本。本发明采用了用随机数来采样的办法,假设p=1/7,则采样单元将会以1/7*100%的概率将类间样本加入类间训练库,也即最后的类间库的样本数目将为 这样产生的类内和类间的样本数目一方面比较平衡,另一方面两类的分类问题的样本数目1050+1446=2496远多于原始的10类分类问题的样本数目15*10=150,从而可以运用基于统计的学习方法,训练出高精度的决策函数,极大的提高了***的精度。
差异特征决策单元54由变形样本基本库生成的变形样本训练库训练而来,具体分类器形式可为任意两类分类器,如SVM等。最后输出结果至输出单元15。具体而言,假设输入字符样本记为I。字符类别数一共为C类,变形样本模板库中每类的模板数为W,记为Tij为(1 i C,1 j W),假设第一识别单元前N识别候选集合为DN,则会得到NW个差异向量Δij=|I-Tij|(1≤i<C,i∈DN,1 j w)。|I-Tij|表示对向量I-Tij的每一维取绝对值。对每个差异向量,差异特征决策单元54判定该输入差异向量属于类内差异,还是类间差异。具体判定过程如下:
假设差异特征决策单元决策函数为fDw(fDw可由两类特征,即类内差异特征,和类间差异特征通过分类方法如SVM训练而成),
当fDw(Δij)≥0,输入差异特征Δij被判断为类内差异特征,也即I与模板Tij具有相同的字符类别。
当fDw(Δij)<0,输入差异特征Δij被判断为类间差异特征,也即I与模板Tij具有不同的字符类别。
具体如下所示
差异特征决策单元的识别输出0为
fDw(Δij)值越大,表示Δij为类内差异特征的可能性越大。于是针对所有出现在第一级识别候选集合的模板,Δij=|I-Tij|(1≤i<C,i∈DN,1 j w),差异特征分类器对样本I的分类结果为具有最大决策值的模板的类别。
在上面的差异特征分类器中有效的结合了模板匹配与两类分类器。一方面,这些模板由变形样本处理而成,因此能有效对变形样本进行识别。另外一方面采用差异特征仅将样本作为类内和类间来处理,能有效的扩充样本数目,从而能提高决策器,尤其是基于统计的决策分类器(如,SVM等)的分类精度。
图9是本发明第二级分类决策单元工作原理图。如图所示,当样本由置信度判断单元13判定为变形样本后,差异算子单元52将输入的变形样本与变形样本模板库中并且出现在第一级分类决策单元前N个识别候选集合中出现的字符类别的模板相减,得到差异特征。差异特征决策单元54根据输入的差异特征以及变形样本训练库,判断输入的差异特征属于类内差异还是类间差异,并将该变形样本识别成具有最大置信度的类内差异模板的类别。最后,由输出单元15将差异特征决策单元54的识别结果进行输出。其中,变形样本基本库通过样本聚类单元采用自动聚类算法生成变形样本模板库,变形样本基本库通过变形样本转换单元53生成变形样本训练库。
本发明采用两级识别结构,第一级识别装置识别错误的样本能够继续进入第二级识别装置进行识别。因此,本发明的技术方案通过将第一级识别错误的样本直接作为第二级的基本训练样本,能有效的处理那些变形的样本,因此能提高***的识别精度。同时,利用错误样本自动生成变形样本库也避免了手动搜集样本库,极大的节省了人力,物力。
另外,本发明对变形样本进行的识别采用了差异特征的方法,通过将变形字符特征向量之间互相取差,从而将多类的字符识别问题转换为两类,也即类内差异和类间差异的识别问题。并在转换后的两类差异特征集合上训练分类器。将多类的字符识别问题转换为两类的识别,能极大地扩充样本数目,有效的利用基于统计的识别方法,改善了分类器训练效果,从而提高了***的精度。
以上具体实施方式仅用于说明本发明,而非用于限定本发明。
Claims (17)
1. 一种字符识别方法,其特征在于,所述方法包括以下步骤:
对输入的字符样本进行识别,产生识别结果;
生成所述识别结果的置信度;
根据所述置信度判断所输入的字符样本是否属于变形样本;
若为非变形样本,则将所述识别结果作为最终识别结果;
若为变形样本,则对变形样本进行识别,生成最终识别结果;
输出所述最终识别结果。
2. 根据权利要求1所述的字符识别方法,其特征在于,所述置信度通过匹配距离拟合分布的方法来生成。
3. 根据权利要求2所述的字符识别方法,其特征在于,通过匹配距离拟合分布的方法来生成置信度,进一步包括以下步骤:
产生识别结果和每个字符类别的匹配距离;
按照匹配距离由小到大的顺序选择前l个匹配距离作为候选距离;
根据所述l个候选距离计算所述识别结果的置信度。
4. 根据权利要求1所述的字符识别方法,其特征在于,根据所述置信度判断所输入的字符样本是否属于变形样本,具体包括以下步骤:
若所述置信度大于设定阈值,则判断输入的字符样本为非变形样本;
反之,则判断输入的字符样本为变形样本。
5. 根据权利要求1所述的字符识别方法,其特征在于,所述对变形样本进行识别,具体包括以下步骤:
生成变形样本模板库,将所述变形样本与所述变形样本模板库的模板向量取差得到差异特征;
将所述变形样本转换成类内差异和类间差异,并判断所述差异特征属于类内差异或类间差异;
将所述变形样本识别成具有最大置信度的类内差异模板的类别。
6. 根据权利要求5所述的字符识别方法,其特征在于,所述生成变形样本模板库,具体包括以下步骤:
生成变形样本基本库,所述变形样本基本库仅包含所述变形样本;
将所述变形样本基本库进行自动聚类生成变形样本模板库。
7. 根据权利要求5所述的字符识别方法,其特征在于,将所述变形样本与所述变形样本模板库的模板向量取差得到差异特征是指:
变形样本仅与所述识别结果的前N个候选类别的变形样本模板取差得到差异特征。
8. 根据权利要求5所述的字符识别方法,其特征在于,将所述变形样本生成类间差异,具体包括以下步骤:按照一个给定的百分比进行采样来生成所述类间差异。
9. 一种字符识别装置,其特征在于,所述装置包括:
第一级分类决策单元,用于对输入的字符样本进行识别,产生识别结果;
置信度生成单元,用于生成识别结果的置信度;
置信度判断单元,用于根据所述置信度判断所输入的字符样本是否属于变形样本,若为非变形样本则将所述识别结果作为最终识别结果,若为变形样本则将所述变形样本输入第二级分类决策单元;
第二级分类决策单元,用于对变形样本进行识别,生成最终识别结果;
输出单元,用于输出所述最终识别结果。
10. 根据权利要求9所述的字符识别装置,其特征在于,所述置信度生成单元进一步包括:
匹配距离生成单元,用于产生识别结果和每个字符类别的匹配距离;
候选距离选择单元,用于按照匹配距离由小到大的顺序选择前l个匹配距离作为候选距离;
计算单元,用于根据所述l个候选距离计算所述识别结果的置信度。
11. 根据权利要求9所述的字符识别装置,其特征在于,所述置信度判断单元进一步包括:
阈值设定单元,用于设定一阈值;
比较判断单元,比较所述识别结果的置信度与所述阈值的大小,若所述置信度大于设定阈值,则判断输入的字符样本为非变形样本并将所述识别结果作为最终识别结果,反之,则判断输入的字符样本为变形样本并将所述变形样本输入第二级分类决策单元。
12. 根据权利要求9所述的字符识别装置,其特征在于,所述第二级分类决策单元进一步包括:
变形样本模板库生成单元,用于生成变形样本模板库;
差异算子单元,用于将所述变形样本与所述变形样本模板库的模板向量取差得到差异特征;
变形样本转换单元,用于将所述变形样本转换成类内差异和类间差异;
差异特征决策单元,用于判断所述差异特征属于类内差异或类间差异,并将所述变形样本识别成具有最大置信度的类内差异模板的类别。
13. 根据权利要求12所述的字符识别装置,其特征在于,所述变形样本模板库生成单元进一步包括:
变形样本基本库生成单元,用于生成变形样本基本库,所述变形样本基本库仅包含所述变形样本;
样本聚类单元,用于将所述变形样本基本库进行自动聚类生成变形样本模板库。
14. 根据权利要求12所述的字符识别装置,其特征在于,所述差异算子单元,还用于将变形样本与所述识别结果的前N个候选类别的变形样本模板取差得到差异特征。
15. 根据权利要求12所述的字符识别装置,其特征在于,所述变形样本转换单元进一步包括,
采样单元,用于按照一个给定的百分比进行采样来生成所述类间差异。
16. 一种字符识别程序,其特征在于,所述程序包括:
对输入的字符样本进行识别,产生识别结果;
生成所述识别结果的置信度;
根据所述置信度判断所输入的字符样本是否属于变形样本;
若为非变形样本,则将所述识别结果作为最终识别结果并输出;
若为变形样本,则对变形样本进行识别,生成最终识别结果并输出。
17. 一种存储字符识别程序的可读存储介质,其特征在于,所述的可读存储介质存储有以下程序:
对输入的字符样本进行识别,产生识别结果;
生成所述识别结果的置信度;
根据所述置信度判断所输入的字符样本是否属于变形样本;
若为非变形样本,则将所述识别结果作为最终识别结果并输出;
若为变形样本,则对变形样本进行识别,生成最终识别结果并输出。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2007100787676A CN101256631B (zh) | 2007-02-26 | 2007-02-26 | 一种字符识别的方法、装置 |
JP2008044928A JP5365026B2 (ja) | 2007-02-26 | 2008-02-26 | コードを識別する方法、装置及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2007100787676A CN101256631B (zh) | 2007-02-26 | 2007-02-26 | 一种字符识别的方法、装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101256631A true CN101256631A (zh) | 2008-09-03 |
CN101256631B CN101256631B (zh) | 2011-06-01 |
Family
ID=39786587
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2007100787676A Expired - Fee Related CN101256631B (zh) | 2007-02-26 | 2007-02-26 | 一种字符识别的方法、装置 |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP5365026B2 (zh) |
CN (1) | CN101256631B (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102402693A (zh) * | 2010-09-09 | 2012-04-04 | 富士通株式会社 | 处理包含字符的图像的方法和设备 |
CN105956590A (zh) * | 2016-04-27 | 2016-09-21 | 泰合鼎川物联科技(北京)股份有限公司 | 字符识别方法和字符识别*** |
CN106372634A (zh) * | 2015-07-21 | 2017-02-01 | 无锡天脉聚源传媒科技有限公司 | 一种繁体字的识别方法及装置 |
CN109902768A (zh) * | 2019-04-26 | 2019-06-18 | 上海肇观电子科技有限公司 | 光学字符识别技术的输出结果的处理 |
CN110176007A (zh) * | 2019-05-17 | 2019-08-27 | 广州视源电子科技股份有限公司 | 晶状体分割方法、装置及存储介质 |
CN111767909A (zh) * | 2020-05-12 | 2020-10-13 | 合肥联宝信息技术有限公司 | 一种字符识别方法、设备及计算机可读存储介质 |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6977345B2 (ja) * | 2017-07-10 | 2021-12-08 | コニカミノルタ株式会社 | 画像処理装置、画像処理方法、及び画像処理プログラム |
WO2021112234A1 (ja) * | 2019-12-06 | 2021-06-10 | 京セラ株式会社 | 情報処理システム、情報処理装置及び情報処理方法 |
JP7316203B2 (ja) * | 2019-12-06 | 2023-07-27 | 京セラ株式会社 | 情報処理システム、情報処理装置、および情報処理方法 |
JP7381330B2 (ja) * | 2019-12-24 | 2023-11-15 | 京セラ株式会社 | 情報処理システム、情報処理装置及び情報処理方法 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6142083A (ja) * | 1984-08-03 | 1986-02-28 | Fujitsu Ltd | 文字認識装置 |
JPH0528302A (ja) * | 1991-07-19 | 1993-02-05 | Nec Corp | 文字読取装置 |
JPH06309435A (ja) * | 1993-04-26 | 1994-11-04 | Hitachi Ltd | パターン認識方法および装置並びにそれが使用されたパターン読取装置 |
TW338815B (en) * | 1995-06-05 | 1998-08-21 | Motorola Inc | Method and apparatus for character recognition of handwritten input |
JPH11203414A (ja) * | 1998-01-08 | 1999-07-30 | Fuji Xerox Co Ltd | 大分類辞書作成装置 |
JP3919617B2 (ja) * | 2002-07-09 | 2007-05-30 | キヤノン株式会社 | 文字認識装置および文字認識方法、プログラムおよび記憶媒体 |
-
2007
- 2007-02-26 CN CN2007100787676A patent/CN101256631B/zh not_active Expired - Fee Related
-
2008
- 2008-02-26 JP JP2008044928A patent/JP5365026B2/ja not_active Expired - Fee Related
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102402693A (zh) * | 2010-09-09 | 2012-04-04 | 富士通株式会社 | 处理包含字符的图像的方法和设备 |
CN106372634A (zh) * | 2015-07-21 | 2017-02-01 | 无锡天脉聚源传媒科技有限公司 | 一种繁体字的识别方法及装置 |
CN105956590A (zh) * | 2016-04-27 | 2016-09-21 | 泰合鼎川物联科技(北京)股份有限公司 | 字符识别方法和字符识别*** |
CN109902768A (zh) * | 2019-04-26 | 2019-06-18 | 上海肇观电子科技有限公司 | 光学字符识别技术的输出结果的处理 |
CN109902768B (zh) * | 2019-04-26 | 2021-06-29 | 上海肇观电子科技有限公司 | 光学字符识别技术的输出结果的处理 |
CN110176007A (zh) * | 2019-05-17 | 2019-08-27 | 广州视源电子科技股份有限公司 | 晶状体分割方法、装置及存储介质 |
CN111767909A (zh) * | 2020-05-12 | 2020-10-13 | 合肥联宝信息技术有限公司 | 一种字符识别方法、设备及计算机可读存储介质 |
CN111767909B (zh) * | 2020-05-12 | 2022-02-01 | 合肥联宝信息技术有限公司 | 一种字符识别方法、设备及计算机可读存储介质 |
Also Published As
Publication number | Publication date |
---|---|
JP5365026B2 (ja) | 2013-12-11 |
JP2008210388A (ja) | 2008-09-11 |
CN101256631B (zh) | 2011-06-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101256631B (zh) | 一种字符识别的方法、装置 | |
CN108564129B (zh) | 一种基于生成对抗网络的轨迹数据分类方法 | |
CN111882446B (zh) | 一种基于图卷积网络的异常账户检测方法 | |
Wahono et al. | Metaheuristic optimization based feature selection for software defect prediction. | |
CN103632168B (zh) | 一种机器学习中的分类器集成方法 | |
US20150134578A1 (en) | Discriminator, discrimination program, and discrimination method | |
CN103366367B (zh) | 基于像素数聚类的模糊c-均值灰度图像分割方法 | |
CN100595780C (zh) | 一种基于模块神经网络的手写体数字自动识别方法 | |
CN102156871B (zh) | 基于类别相关的码本和分类器投票策略的图像分类方法 | |
CN104834940A (zh) | 一种基于支持向量机的医疗影像检查疾病分类方法 | |
CN106326984A (zh) | 用户意图识别方法和装置、自动应答*** | |
CN109635010B (zh) | 一种用户特征及特征因子抽取、查询方法和*** | |
CN101147160B (zh) | 自适应分类器以及建立其分类参数的方法 | |
CN108319987A (zh) | 一种基于支持向量机的过滤-封装式组合流量特征选择方法 | |
CN106909946A (zh) | 一种多模态融合的商品分类*** | |
CN104820825A (zh) | 基于Adaboost算法的人脸识别优化方法 | |
CN110363230A (zh) | 基于加权基分类器的stacking集成污水处理故障诊断方法 | |
CN114663002A (zh) | 一种自动化匹配绩效考核指标的方法及设备 | |
CN111597943B (zh) | 一种基于图神经网络的表格结构识别方法 | |
CN102004796B (zh) | 一种网页文本的无阻滞层次分类方法与装置 | |
CN110503537B (zh) | 一种财务记账数据智能匹配方法及*** | |
CN115470834A (zh) | 基于标签传播矫正标签置信度的不准确标记的多标签学习算法 | |
CN104537383A (zh) | 一种基于粒子群的海量组织机构数据分类方法及*** | |
CN111144462A (zh) | 一种雷达信号的未知个体识别方法及装置 | |
CN101702172A (zh) | 一种基于类-属性关系依赖度的数据离散化方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20110601 Termination date: 20180226 |