CN104915627A - 一种文字识别方法及装置 - Google Patents

一种文字识别方法及装置 Download PDF

Info

Publication number
CN104915627A
CN104915627A CN201410088106.1A CN201410088106A CN104915627A CN 104915627 A CN104915627 A CN 104915627A CN 201410088106 A CN201410088106 A CN 201410088106A CN 104915627 A CN104915627 A CN 104915627A
Authority
CN
China
Prior art keywords
identified
super limit
word
super
feature
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201410088106.1A
Other languages
English (en)
Other versions
CN104915627B (zh
Inventor
王进
卢影
颉小凤
陈乔松
邓欣
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Chongqing University of Post and Telecommunications
Original Assignee
Tencent Technology Shenzhen Co Ltd
Chongqing University of Post and Telecommunications
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd, Chongqing University of Post and Telecommunications filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN201410088106.1A priority Critical patent/CN104915627B/zh
Publication of CN104915627A publication Critical patent/CN104915627A/zh
Application granted granted Critical
Publication of CN104915627B publication Critical patent/CN104915627B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

本发明实施例公开了一种文字识别方法及装置,所述方法包括:接收输入的任一待识别文字;将所述待识别文字进行向量处理后,得到所述待识别文字的待识别特征集,所述待识别特征集包括待识别特征;根据所述待识别特征生成预设个数的待识别超边;将所述待识别超边与预先存储的超边库中的超边进行对比,当所述待识别超边与所述超边库中的超边匹配个数满足预设条件时,确定所述待识别文字识别成功。与现有技术相比,本发明能够提高文字的识别效率,同时尽量避免识别误差的产生。

Description

一种文字识别方法及装置
技术领域 
本发明涉及智能识别领域,具体涉及一种文字识别方法及装置。  
背景技术 
文字识别技术是通过智能终端的手写输入设备将文字写入,并提取文字特征信息,最后与预先存储的真实文字的特征信息进行比对,以实现鉴别手写文字真伪的技术。  
文字识别技术可以用于手写签名的识别,手写签名识别方法是一种身份验证识别方法,与其它身份识别技术相比,手写签名识别具有信息量大、不易模仿、准确度高和方便应用等优点,所以手写签名识别是一种被广大用户认可的安全的身份认证方式。  
现有技术的手写签名识别方法需要预先存储真实签名,在使用者通过触摸屏、手写板或其它手写输入设备输入签名后,手写签名识别***会采集签名的数据信息,如笔迹形状、书写速度、书写加速度及书写压力等,然后对所采集到的签名数据信息进行预处理,如起笔处理、合并、去除孤立点与冗余点、平滑和倾斜校正等,以尽可能去除误导识别结果的因素,进一步地,从预处理后的签名数据信息中提取签名的特征信息与真实签名进行匹配对比,以判断使用者的签名是否符合认证条件。  
现有的手写签名识别方法虽然可以实现对使用者输入的签名的识别,但是,由于该识别方法对输入的签名的处理算法比较复杂,占用内存较大,导致使用者输入签名后需要较长的时间才能完成识别工作,识别效率较低。同时,现有的识别方法识别精度不准确,识别出现误差的几率较大。  
发明内容 
针对上述问题,本发明提供了一种文字识别方法及装置,能够提高文字的识别效率,同时尽量避免识别误差的产生。  
本发明提供了一种文字识别方法,所述方法包括:  
接收输入的任一待识别文字;  
将所述待识别文字进行向量处理;  
确定所述待识别文字的待识别特征集,所述待识别特征集包括待识别特征;  
根据所述待识别特征生成预设个数的待识别超边;  
将所述待识别超边与预先存储的超边库中的超边进行对比,当所述待识别超边与所述超边库中的超边匹配个数满足预设条件时,确定所述待识别文字识别成功。  
优选地,所述方法还包括:  
预先学习并存储文字的超边库,所述超边库包括所述预设个数的超边。  
优选地,所述预先学习并存储文字的超边库,所述超边库包括所述预设个数的超边,包括:  
获取任一用户多次输入的同一文字;  
将所述文字进行向量处理后,得到所述文字的特征集,所述特征集包括所述文字的特征;  
根据所述文字的特征生成所述预设个数的超边,并利用生成的超边组成超边库。  
优选地,所述根据所述文字的特征生成所述预设个数的超边,并利用生成的超边组成超边库,包括:  
对所述文字的特征进行多次随机采样生成所述预设个数的超边;  
采用超边替代超网络分类器,将所述超边进行学习分类后,得到超边库,所述超边库包括学习分类后的超边。  
优选地,所述根据所述待识别特征生成预设个数的待识别超边,包括:  
采用超边替代超网络分类器,根据所述待识别特征生成预设个数的待识别超边。  
优选地,所述接收输入的任一待识别文字,包括:  
利用笔画追踪技术接收输入的任一待识别文字。  
优选地,所述将所述待识别文字进行向量处理后,得到所述待识别文字的待识别特征集,所述待识别特征集包括待识别特征,包括:  
按照笔画,将所述待识别文字划分为预设数量的特征段;  
利用最小二乘拟合方法,确定所述特征段的方向向量;  
根据所述特征段的方向向量确定所述待识别文字的待识别特征集,所述待识别特征集包括待识别特征。  
优选地,所述将所述文字进行向量处理后,得到所述文字的特征,包括:  
按照笔画,将所述文字划分为预设数量的特征段;  
利用最小二乘拟合方法,确定所述特征段的方向向量;  
根据所述特征段的方向向量确定所述文字的特征集。  
本发明还提供了一种文字识别装置,所述装置包括:  
接收模块,用于接收输入的任一待识别文字;  
处理模块,用于将所述待识别文字进行向量处理;  
确定模块,用于确定所述待识别文字的待识别特征集,所述待识别特征集包括所述待识别特征;  
生成模块,用于根据所述待识别特征生成预设个数的待识别超边;  
对比模块,用于将所述待识别超边与预先存储的超边库中的超边进行对比,当所述待识别超边与所述超边库中的超边匹配个数满足预设条件时,确定所述待识别文字识别成功。  
优选地,所述装置还包括:  
学习模块,用于预先学习并存储文字的超边库,所述超边库包括所述预设个数的超边。  
优选地,所述学习模块包括:  
获取子模块,用于获取任一用户多次输入的同一文字;  
处理子模块,用于将所述文字进行向量处理后,得到所述文字的特征集,所述特征集包括所述文字的特征;  
第一生成子模块,用于根据所述文字的特征生成预设个数的超边,并利用生成的超边组成超边库。  
优选地,所述第一生成子模块包括:  
采样子模块,用于对所述文字的特征进行多次随机采样生成所述预设个数 的超边;  
第一分类子模块,用于采用超边替代超网络分类器,将所述超边进行学习分类后,得到超边库,所述超边库包括学习分类后的超边。  
优选地,所述生成模块包括:  
第二生成子模块,用于采用超边替代超网络分类器,根据所述待识别特征生成预设个数的待识别超边。  
优选地,所述接收模块具体为用于利用笔画追踪技术接收用户输入的任一待识别文字的模块。  
优选地,所述处理模块包括:  
第一划分子模块,用于按照笔画,将所述待识别文字划分为预设数量的特征段;  
第一确定子模块,用于利用最小二乘拟合方法,确定所述特征段的方向向量;  
第二确定子模块,用于根据所述特征段的方向向量确定所述待识别文字的待识别特征集,所述待识别特征集包括待识别特征。  
优选地,所述处理子模块包括:  
第二划分子模块,用于按照笔画,将所述文字划分为预设数量的特征段;  
第三确定子模块,用于利用最小二乘拟合方法,确定所述特征段的方向向量;  
第四确定子模块,用于根据所述特征段的方向向量确定所述文字的特征集。  
本发明预先学习并存储文字的超边库,所述超边库包括预设个数的超边;接收用户输入的任一待识别文字;将所述待识别文字进行向量特征处理后,得到所述待识别文字的待识别向量特征集,所述待识别向量特征集包括所述待识别文字的特征;根据所述待识别向量特征集中的特征生成待识别超边;将所述待识别超边与所述超边库中的超边进行对比,当所述待识别超边与所述超边库中的超边匹配个数满足预设条件时,确定所述待识别文字识别成功。与现有技术相比,本发明能够提高文字的识别效率,同时尽量避免识别误差的产生。  
附图说明 
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。  
图1为本发明实施例一提供的文字识别方法流程图;  
图2为本发明实施例一提供的平面方向向量图;  
图3为本发明实施例二提供的文字识别方法流程图;  
图4为本发明实施例二提供的输入界面示意图;  
图5为本发明实施例三提供的文字识别装置结构图;  
图6为本发明实施例三提供的终端相关的手机的部分结构的框图。  
具体实施方式 
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。  
实施例一  
参考图1,图1为本实施例提供的文字识别方法流程图,具体包括:  
S101:接收输入的任一待识别文字。  
本实施例中,用户可以使用计算机、智能手机或者平板电脑输入任意一个或者多个文字作为待识别文字。  
具体的,本实施例可以利用笔画追踪技术接收用户输入的待识别文字,对所述待识别文字中的虚假抬笔进行自动补全,从落笔点开始追踪,记录到抬笔时所经过的所有的点。  
S102:将所述待识别文字进行向量处理;  
S103:确定所述待识别文字的待识别特征集,所述待识别特征集包括待识别特征。  
本实施例中,在接收用户输入的待识别文字后,对所述待识别文字进行向 量处理,以便得到所述待识别文字的待识别特征集。  
实际操作中,本实施例在接收所述待识别文字时,采用笔画追踪技术对所述待识别文字中的虚假抬笔进行自动补全,从落笔点开始追踪,记录到抬笔时所经过的所有的点,然后把这一系列有序的点平均分为N段,并根据每段的点利用最小二乘拟合计算每段斜率值,从而确定出方向向量,最终得到所述待识别文字的特征集。  
具体的,本实施例首先按照笔画,将所述待识别文字划分为预设数量的特征段;其次,利用最小二乘拟合方法,确定所述特征段的方向向量;最后,根据所述特征段的方向向量确定所述待识别文字的特征集。  
具体的,本实施例将平面空间划分为8个区域,每个区域代表一个方向,即可构造8个方向向量,如下图2所示,图2为平面方向向量图。利用最小二乘拟合方法,计算各个特征段对应的斜率,判断所述斜率处于图2的哪个区域,根据所属区域确定所述特征段的方向向量。  
S104:根据所述待识别特征生成预设个数的待识别超边。  
本实施例中,在获取所述待识别文字的待识别特征后,根据所述待识别特征生成待识别超边。具体的,采用超边替代超网络分类器,根据所述待识别特征生成待识别超边。其中,超边可以是通过超网络分类器随机初始化生成的。  
实际操作中,采用超边替代超网络分类器把排序好的超边中适应值低于给定的某个阈值的超边重新生成,再次对所有超边进行分类,直到满足所有超边均可靠或者达到给定的迭代次数为止。  
S105:将所述待识别超边与预先存储的超边库中的超边进行对比,当所述待识别超边与所述超边库中的超边匹配个数满足预设条件时,确定所述待识别文字识别成功。  
本实施例中,预先学习并存储文字的超边库,所述超边库包括预设个数的超边。  
由于文字识别技术是将输入的待识别文字与预先存储的真实文字的特征信息进行比对,以实现鉴别输入的文字真伪。所以,本实施例预先学习用户输入的若干真实的文字,并将学习的结果进行训练得到由超边组成的超边库,最终将用户输入的真实文字对应的超边库存储。  
实际应用中,针对任意一个用户,可以获取所述用户对同一个文字的多次输入。具体的,输入的次数不做限制,一般大于10次。将所述用户多次输入的文字进行向量特征处理,得到所述文字的特征。根据所述文字的特征生成预设个数的超边,并利用生成的超边组成超边库。  
其中,本实施例可以首先对所述文字的特征进行多次随机采样生成预设个数的超边;其次,采用超边替代超网络分类器,将所述超边进行学习分类后,得到超边库,所述超边库包括学习分类后的超边。  
本实施例中,同一个文字与一个存有预设个数超边的超边库存在对应关系。  
超网络分类器是一种基于超图模型的认知学习模型,演化超网络最初是作为一种并行联想记忆模型被提出,并通过DNA计算实现。该模型由大量超边组成,超边可以存储训练集数据的部分信息,表达样本的特征和样本类别之间的关联程度,因此非常适用于解决高维数据的模式识别问题。目前超网络已被成功应用于解决各种模式识别问题,如文本分类、手写体数字光学识别数据集分类等。超网络分类器的学习方法包括超边替代法,采用随机搜索的方法搜索超边,在超网络初始不好的情况下不会用别的种类的超边来覆盖本类的超边,而是重新从本类别中随机再生成新的超边,使得演化学习过程可以搜索到更大的空间,保证了每个类别都有对超边库作出贡献。本实施例采用超边替代超网络分类器,将所述文字的特征进行学习分类后,得到分类后特征;对所述分类后特征进行多次随机采样生成预设个数的超边,并利用生成的超边组成超边库。  
与现有技术相比,本实施例利用超边替代超网络分类器能够对文字的笔迹特征进行学习分类,搜索具有决策能力的最佳超边组成超边库。  
本实施例中,在获取所述待识别文字的待识别超边后,将所述待识别超边与预先存储的所述超边库中的超边进行对比。预先设置待识别文字识别成功的条件,当对比结果满足预设的条件时,确定所述待识别文字识别成功。  
具体的,可以将条件设置为:当存在1/3的所述待识别超边与所述超边库中的超边匹配成功时,所述待识别文字识别成功。  
本实施例预先学习并存储文字的超边库,所述超边库包括预设个数的超 边;接收用户输入的任一待识别文字;将所述待识别文字进行向量特征处理后,得到所述待识别文字的待识别向量特征集,所述待识别向量特征集包括所述待识别文字的特征;根据所述待识别向量特征集中的特征生成待识别超边;将所述待识别超边与所述超边库中的超边进行对比,当所述待识别超边与所述超边库中的超边匹配个数满足预设条件时,确定所述待识别文字识别成功。与现有技术相比,本实施例能够提高文字的识别效率,同时尽量避免识别误差的产生。  
实施例二  
参考图3,图3为本实施例提供的文字识别方法流程图,所述方法应用于签名鉴定领域,具体包括:  
S301:用户在界面内输入自己的签名,并可选择学习还是识别。  
本实施例中,使用安卓***作为用户交互平台,并根据需要定制输入界面。用户可以在所述定制的输入界面内输入自己的签名,如图4,用户可以通过点击界面下方的学习按钮触发签名的学习操作。  
S302:若用户选择学习,则对用户的签名进行向量处理,得到签名的特征集。  
当用户选择学***均分为N段,并根据每段的点利用最小二乘拟合计算每段斜率值,从而确定出方向向量,最终得到特征集合。  
S303:当用户输入多个签名之后,使用超边代替超网络分类器对签名的特征集进行训练,得到超边库,所述超边库包括超边。  
为了使得超边库中的超边更真准确,本实施例要求用户多次输入签名,并对签名进行多次学习,直到通过训练得到包括具有决策能力的最佳超边的超边库。  
S304:若用户选择识别,则将用户的签名进行向量处理后,得到所述签名的待识别特征集,所述待识别特征集中包括待识别特征。  
当用户在输入签名后选择识别按钮时,将用户的签名进行向量处理,得到所述签名的待识别特征集。  
本步骤获取待识别特征集的方法与实施例一相同,在此不再赘述。  
S305:使用超边代替超网络分类器,根据所述签名的待识别特征集生成待识别超边。  
本实施例采用超边替代超网络分类器,将所述签名的待识别特征进行学习分类后,得到所述签名的特征;对所述签名的特征进行多次随机采样生成预设个数的待识别超边。  
S306:将所述待识别超边与超边库中的超边匹配,如果匹配成功,则用户的签名成功识别,否则不识别为任何人的签名。  
与现有技术相比,本实施例能够提高用户签名的识别效率,同时尽量避免识别误差的产生。  
实施例三  
参考图5,图5为本实施例提供的文字识别装置结构图,所述装置包括:  
接收模块501,用于接收用户输入的任一待识别文字;  
处理模块502,用于将所述待识别文字进行向量处理;  
确定模块503,用于确定所述待识别文字的待识别特征集,所述待识别特征集包括所述待识别特征;  
生成模块504,用于根据所述待识别特征生成待识别超边;  
对比模块505,用于将所述待识别超边与所述超边库中的超边进行对比,当所述待识别超边与所述超边库中的超边匹配个数满足预设条件时,确定所述待识别文字识别成功。  
其中,所述学习模块包括:  
获取子模块,用于获取任一用户多次输入的同一文字;  
处理子模块,用于将所述文字进行向量处理后,得到所述文字的特征集,所述特征集包括所述文字的特征;  
第一生成子模块,用于根据所述文字的特征生成预设个数的超边,并利用生成的超边组成超边库。  
具体的,所述第一生成子模块包括:  
采样子模块,用于对所述文字的特征进行多次随机采样生成预设个数的超 边;  
第一分类子模块,用于采用超边替代超网络分类器,将所述超边进行学习分类后,得到超边库,所述超边库包括学习分类后的超边超边库,所述超边库包括学习分类后的超边。  
所述生成模块包括:  
第二分类子模块,用于采用超边替代超网络分类器,将所述待识别特征集中的特征进行学习分类后,得到分类后待识别特征;  
第二生成子模块,用于根据所述分类后待识别特征生成待识别超边。  
实际应用中,所述接收模块具体为用于利用笔画追踪技术接收用户输入的任一待识别文字的模块。  
具体的,所述处理模块包括:  
第一划分子模块,用于按照笔画,将所述待识别文字划分为预设数量的特征段;  
第一确定子模块,用于利用最小二乘拟合方法,确定所述特征段的方向向量;  
第二确定子模块,用于根据所述特征段的方向向量确定所述待识别文字的待识别特征集,所述待识别特征集包括待识别特征。  
具体的,所述处理子模块包括:  
第二划分子模块,用于按照笔画,将所述文字划分为预设数量的特征段;  
第三确定子模块,用于利用最小二乘拟合方法,确定所述特征段的方向向量;  
第四确定子模块,用于根据所述特征段的方向向量确定所述文字的特征集。  
本发明实施例还提供了一种终端,如图6所示,为了便于说明,仅示出了与本发明实施例相关的部分,具体技术细节未揭示的,请参照本发明实施例方法部分。该终端可以包括手机、平板电脑、PDA(Persona lDigita lAssistant,个人数字助理)、POS(Point of Sales,销售终端)、车载电脑等任意终端设备,以终端为手机为例:  
图6示出的是与本发明实施例提供的终端相关的手机的部分结构的框图。参考图6,手机包括:射频(Radio Frequency,RF)电路610、存储器620、输入单元630、显示单元640、传感器650、音频电路660、无线保真(wireless fidelity,WiFi)模块670、处理器680、以及电源690等部件。本领域技术人员可以理解,图6中示出的手机结构并不构成对手机的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。  
下面结合图6对手机的各个构成部件进行具体的介绍:  
RF电路610可用于收发信息或通话过程中,信号的接收和发送,特别地,将基站的下行信息接收后,给处理器680处理;另外,将设计上行的数据发送给基站。通常,RF电路包括但不限于天线、至少一个放大器、收发信机、耦合器、低噪声放大器(Low Noise Amplifier,LNA)、双工器等。此外,RF电路610还可以通过无线通信与网络和其他设备通信。上述无线通信可以使用任一通信标准或协议,包括但不限于全球移动通讯*** (G loba  lSystem  of  Mobile  communication,GSM)、通用分组无线服务(Genera lPacket Radio Service,GPRS)、码分多址(Code Division Multiple Access,CDMA)、宽带码分多址(Wideband  Code Division Multiple Access, WCDMA)、长期演进 (Long  Term  Evolution,LTE))、电子邮件、短消息服务(Short Messaging Service,SMS)等。  
存储器620可用于存储软件程序以及模块,处理器680通过运行存储在存储器620的软件程序以及模块,从而执行手机的各种功能应用以及数据处理。存储器620可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作***、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据手机的使用所创建的数据(比如音频数据、电话本等)等。本发明中的存储数据区可用于存储文字的超边库,其中,超边库包括预设个数的超边。此外,存储器620可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。  
输入单元630可用于接收输入的数字或字符信息,以及产生与手机600的用户设置以及功能控制有关的键信号输入。具体地,输入单元630可包括触控面板631以及其他输入设备632。触控面板631,也称为触摸屏,可收集用户 在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触控面板631上或在触控面板631附近的操作),并根据预先设定的程式驱动相应的连接装置。本发明中的触摸面板631可用于接收输入的任一待识别文字,用户可以通过在其上通过触摸操作输入待识别文字。可选的,触控面板631可包括触摸检测装置和触摸控制器两个部分。其中,触摸检测装置检测用户的触摸方位,并检测触摸操作带来的信号,将信号传送给触摸控制器;触摸控制器从触摸检测装置上接收触摸信息,并将它转换成触点坐标,再送给处理器680,并能接收处理器680发来的命令并加以执行。此外,可以采用电阻式、电容式、红外线以及表面声波等多种类型实现触控面板631。除了触控面板631,输入单元630还可以包括其他输入设备632。具体地,其他输入设备832可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆等中的一种或多种。   
显示单元640可用于显示由用户输入的信息或提供给用户的信息以及手机的各种菜单。显示单元640可包括显示面板641,可选的,可以采用液晶显示器(Liquid Crysta lDisplay,LCD)、有机发光二极管(Organic Light-Emitting  Diode, OLED)等形式来配置显示面板641。进一步的,触控面板631可覆盖显示面板641,当触控面板631检测到在其上或附近的触摸操作后,传送给处理器680以确定触摸事件的类型,随后处理器680根据触摸事件的类型在显示面板641上提供相应的视觉输出。虽然在图6中,触控面板631与显示面板641是作为两个独立的部件来实现手机的输入和输入功能,但是在某些实施例中,可以将触控面板631与显示面板641集成而实现手机的输入和输出功能。  
手机600还可包括至少一种传感器660,比如光传感器、运动传感器以及其他传感器。具体地,光传感器可包括环境光传感器及接近传感器,其中,环境光传感器可根据环境光线的明暗来调节显示面板641的亮度,接近传感器可在手机移动到耳边时,关闭显示面板641和/或背光。作为运动传感器的一种,加速计传感器可检测各个方向上(一般为三轴)加速度的大小,静止时可检测出重力的大小及方向,可用于识别手机姿态的应用(比如横竖屏切换、相关游戏、磁力计姿态校准)、振动识别相关功能(比如计步器、敲击)等 ;至于手机还可配置的陀螺仪、气压计、湿度计、温度计、红外线传感器等其他传感器, 在此不再赘述。  
音频电路660、扬声器661,传声器662可提供用户与手机之间的音频接口。音频电路660可将接收到的音频数据转换后的电信号,传输到扬声器661,由扬声器661转换为声音信号输出;另一方面,传声器662将收集的声音信号转换为电信号,由音频电路660接收后转换为音频数据,再将音频数据输出处理器680处理后,经RF电路610以发送给比如另一手机,或者将音频数据输出至存储器620以便进一步处理。  
WiFi属于短距离无线传输技术,手机通过WiFi模块670可以帮助用户收发电子邮件、浏览网页和访问流式媒体等,它为用户提供了无线的宽带互联网访问。虽然图6示出了WiFi模块670,但是可以理解的是,其并不属于手机600的必须构成,完全可以根据需要在不改变发明的本质的范围内而省略。  
处理器680是手机的控制中心,利用各种接口和线路连接整个手机的各个部分,通过运行或执行存储在存储器620内的软件程序和/或模块,以及调用存储在存储器620内的数据,执行手机的各种功能和处理数据,从而对手机进行整体监控。可选的,处理器680可包括一个或多个处理单元;优选的,处理器680可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作***、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器680中。  
手机600还包括给各个部件供电的电源690(比如电池),优选的,电源可以通过电源管理***与处理器680逻辑相连,从而通过电源管理***实现管理充电、放电、以及功耗管理等功能。  
尽管未示出,手机600还可以包括摄像头、蓝牙模块等,在此不再赘述。  
具体在本实施例中,终端中的处理器680会按照如下的指令,将一个或一个以上的应用程序的进程对应的可执行文件加载到存储器620中,并由处理器680来运行存储在存储器620中的应用程序,从而实现各种功能:  
接收输入的任一待识别文字;  
将所述待识别文字进行向量处理后,得到所述待识别文字的待识别特征集,所述待识别特征集包括待识别特征;  
根据所述待识别特征生成预设个数的待识别超边;  
将所述待识别超边与预先存储的超边库中的超边进行对比,当所述待识别超边与所述超边库中的超边匹配个数满足预设条件时,确定所述待识别文字识别成功。  
优选地,所述方法还包括:  
预先学习并存储文字的超边库,所述超边库包括所述预设个数的超边。  
优选地,所述预先学习并存储文字的超边库,所述超边库包括所述预设个数的超边,包括:  
获取任一用户多次输入的同一文字;  
将所述文字进行向量处理后,得到所述文字的特征集,所述特征集包括所述文字的特征,;  
根据所述文字的特征生成所述预设个数的超边,并利用生成的超边组成超边库。  
优选地,所述根据所述文字的特征生成预设个数的超边,并利用生成的超边组成超边库,包括:  
对所述文字的特征进行多次随机采样生成所述预设个数的超边;  
采用超边替代超网络分类器,将所述超边进行学习分类后,得到超边库,所述超边库包括学习分类后的超边。  
优选地,所述根据所述待识别特征生成预设个数的待识别超边,包括:  
采用超边替代超网络分类器,根据所述待识别特征生成预设个数的待识别超边。  
优选地,所述接收用户输入的任一待识别文字,具体为:  
利用笔画追踪技术接收用户输入的任一待识别文字。  
优选地,所述将所述待识别文字进行向量处理后,得到所述待识别文字的待识别特征集,所述待识别特征集包括待识别特征,包括:  
按照笔画,将所述待识别文字划分为预设数量的特征段;  
利用最小二乘拟合方法,确定所述特征段的方向向量;  
根据所述特征段的方向向量确定所述待识别文字的待识别特征集,所述待识别特征集包括待识别特征。  
优选地,所述将所述文字进行向量处理后,得到所述文字的特征,包括:  
按照笔画,将所述文字划分为预设数量的特征段;  
利用最小二乘拟合方法,确定所述特征段的方向向量;  
根据所述特征段的方向向量确定所述文字的特征集。  
与现有技术相比,本实施例提供的文字识别装置能够提高文字的识别效率,同时尽量避免识别误差的产生。  
对于装置实施例而言,由于其基本对应于方法实施例,所以相关之处参见方法实施例的部分说明即可。以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。  
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。  
以上对本发明实施例所提供的文字识别方法及装置进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。  

Claims (16)

1.一种文字识别方法,其特征在于,所述方法包括:
接收待识别文字;
将所述待识别文字进行向量处理;
确定所述待识别文字的待识别特征集,所述待识别特征集包括待识别特征;
根据所述待识别特征生成预设个数的待识别超边;
将所述待识别超边与预先存储的超边库中的超边进行对比,当所述待识别超边与所述超边库中的超边匹配个数满足预设条件时,确定所述待识别文字识别成功。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
预先学习并存储文字的超边库,所述超边库包括所述预设个数的超边。
3.根据权利要求2所述的方法,其特征在于,所述预先学习并存储文字的超边库,所述超边库包括所述预设个数的超边,包括:
获取任一用户多次输入的同一文字;
将所述文字进行向量处理后,得到所述文字的特征集,所述特征集包括所述文字的特征;
根据所述文字的特征生成所述预设个数的超边,并利用生成的超边组成超边库。
4.根据权利要求3所述的方法,其特征在于,所述根据所述文字的特征生成所述预设个数的超边,并利用生成的超边组成超边库,包括:
对所述文字的特征进行多次随机采样生成所述预设个数的超边;
采用超边替代超网络分类器,将所述超边进行学习分类后,得到超边库,所述超边库包括学习分类后的超边。
5.根据权利要求1-4中任一所述的方法,其特征在于,所述根据所述待识别特征生成预设个数的待识别超边,包括:
采用超边替代超网络分类器,根据所述待识别特征生成预设个数的待识别超边。
6.根据权利要求1-4中任一所述的方法,其特征在于,所述接收输入的任一待识别文字,包括:
利用笔画追踪技术接收输入的任一待识别文字。
7.根据权利要求1所述的方法,其特征在于,所述将所述待识别文字进行向量处理后,得到所述待识别文字的待识别特征集,所述待识别特征集包括待识别特征,包括:
按照笔画,将所述待识别文字划分为预设数量的特征段;
利用最小二乘拟合方法,确定所述特征段的方向向量;
根据所述特征段的方向向量确定所述待识别文字的待识别特征集,所述待识别特征集包括待识别特征。
8.根据权利要求3所述的方法,其特征在于,所述将所述文字进行向量处理后,得到所述文字的特征,包括:
按照笔画,将所述文字划分为预设数量的特征段;
利用最小二乘拟合方法,确定所述特征段的方向向量;
根据所述特征段的方向向量确定所述文字的特征集。
9.一种文字识别装置,其特征在于,所述装置包括:
接收模块,用于接收输入的任一待识别文字;
处理模块,用于将所述待识别文字进行向量处理;
确定模块,用于确定所述待识别文字的待识别特征集,所述待识别特征集包括所述待识别特征;
生成模块,用于根据所述待识别特征生成预设个数的待识别超边;
对比模块,用于将所述待识别超边与预先存储的超边库中的超边进行对比,当所述待识别超边与所述超边库中的超边匹配个数满足预设条件时,确定所述待识别文字识别成功。
10.根据权利要求9所述的装置,其特征在于,所述装置还包括:
学习模块,用于预先学习并存储文字的超边库,所述超边库包括所述预设个数的超边。
11.根据权利要求10所述的装置,其特征在于,所述学习模块包括:
获取子模块,用于获取任一用户多次输入的同一文字;
处理子模块,用于将所述文字进行向量处理后,得到所述文字的特征集,所述特征集包括所述文字的特征;
第一生成子模块,用于根据所述文字的特征生成预设个数的超边,并利用生成的超边组成超边库。
12.根据权利要求11所述的装置,其特征在于,所述第一生成子模块包括:
采样子模块,用于对所述文字的特征进行多次随机采样生成所述预设个数的超边;
第一分类子模块,用于采用超边替代超网络分类器,将所述超边进行学习分类后,得到超边库,所述超边库包括学习分类后的超边。
13.根据权利要求9-12中任一所述的装置,其特征在于,所述生成模块包括:
第二生成子模块,用于采用超边替代超网络分类器,根据所述待识别特征生成预设个数的待识别超边。
14.根据权利要求9-12中任一所述的装置,其特征在于,所述接收模块具体为用于利用笔画追踪技术接收用户输入的任一待识别文字的模块。
15.根据权利要求9所述的装置,其特征在于,所述处理模块包括:
第一划分子模块,用于按照笔画,将所述待识别文字划分为预设数量的特征段;
第一确定子模块,用于利用最小二乘拟合方法,确定所述特征段的方向向量;
第二确定子模块,用于根据所述特征段的方向向量确定所述待识别文字的待识别特征集,所述待识别特征集包括待识别特征。
16.根据权利要求11所述的装置,其特征在于,所述处理子模块包括:
第二划分子模块,用于按照笔画,将所述文字划分为预设数量的特征段;
第三确定子模块,用于利用最小二乘拟合方法,确定所述特征段的方向向量;
第四确定子模块,用于根据所述特征段的方向向量确定所述文字的特征集。
CN201410088106.1A 2014-03-11 2014-03-11 一种文字识别方法及装置 Active CN104915627B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410088106.1A CN104915627B (zh) 2014-03-11 2014-03-11 一种文字识别方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410088106.1A CN104915627B (zh) 2014-03-11 2014-03-11 一种文字识别方法及装置

Publications (2)

Publication Number Publication Date
CN104915627A true CN104915627A (zh) 2015-09-16
CN104915627B CN104915627B (zh) 2019-04-26

Family

ID=54084685

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410088106.1A Active CN104915627B (zh) 2014-03-11 2014-03-11 一种文字识别方法及装置

Country Status (1)

Country Link
CN (1) CN104915627B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107391015A (zh) * 2017-07-19 2017-11-24 广州视源电子科技股份有限公司 一种智能平板的控制方法、装置、设备及存储介质
CN108171144A (zh) * 2017-12-26 2018-06-15 四川大学 信息处理方法、装置、电子设备及存储介质
CN111079499A (zh) * 2019-07-02 2020-04-28 广东小天才科技有限公司 一种学习环境中的书写内容识别方法及***

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1619583A (zh) * 2003-11-20 2005-05-25 摩托罗拉公司 手写识别的方法和***
CN102073870A (zh) * 2011-01-10 2011-05-25 杭州电子科技大学 一种触摸屏汉字笔迹识别方法
CN102298486A (zh) * 2010-06-22 2011-12-28 广东国笔科技股份有限公司 一种基于触摸屏的快速调用***及方法
CN103136377A (zh) * 2013-03-26 2013-06-05 重庆邮电大学 一种基于演化超网络的中文文本分类方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1619583A (zh) * 2003-11-20 2005-05-25 摩托罗拉公司 手写识别的方法和***
CN102298486A (zh) * 2010-06-22 2011-12-28 广东国笔科技股份有限公司 一种基于触摸屏的快速调用***及方法
CN102073870A (zh) * 2011-01-10 2011-05-25 杭州电子科技大学 一种触摸屏汉字笔迹识别方法
CN103136377A (zh) * 2013-03-26 2013-06-05 重庆邮电大学 一种基于演化超网络的中文文本分类方法

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107391015A (zh) * 2017-07-19 2017-11-24 广州视源电子科技股份有限公司 一种智能平板的控制方法、装置、设备及存储介质
CN107391015B (zh) * 2017-07-19 2021-03-16 广州视源电子科技股份有限公司 一种智能平板的控制方法、装置、设备及存储介质
CN108171144A (zh) * 2017-12-26 2018-06-15 四川大学 信息处理方法、装置、电子设备及存储介质
CN108171144B (zh) * 2017-12-26 2020-12-11 四川大学 信息处理方法、装置、电子设备及存储介质
CN111079499A (zh) * 2019-07-02 2020-04-28 广东小天才科技有限公司 一种学习环境中的书写内容识别方法及***
CN111079499B (zh) * 2019-07-02 2023-08-25 广东小天才科技有限公司 一种学习环境中的书写内容识别方法及***

Also Published As

Publication number Publication date
CN104915627B (zh) 2019-04-26

Similar Documents

Publication Publication Date Title
CN103530040B (zh) 目标元素移动方法、装置及电子设备
CN103425736B (zh) 一种网页信息识别方法、装置及***
CN105912918B (zh) 一种指纹解锁方法及终端
CN106096361A (zh) 一种指纹解锁方法及移动终端
CN104217717A (zh) 构建语言模型的方法及装置
CN106951868B (zh) 一种基于身形特征的步态识别方法及装置
CN107153818A (zh) 光学指纹验证方法及相关产品
CN104636047A (zh) 对列表中的对象进行操作的方法、装置及触屏终端
CN104699973A (zh) 一种问卷逻辑控制方法,及装置
CN104852885A (zh) 一种进行验证码验证的方法、装置和***
CN109426783A (zh) 基于增强现实的手势识别方法及***
CN104965641A (zh) 信息显示方法和装置
CN107239737A (zh) 一种光学指纹识别方法及相关产品
CN104134043B (zh) 对内容进行隐藏、解隐藏的方法、装置及终端
CN104572430A (zh) 一种终端应用界面的测试方法、装置和***
CN106096359A (zh) 一种解锁控制方法及移动终端
CN107609379B (zh) 一种解锁控制方法及移动终端
CN105373237A (zh) 一种数据输入方法及终端
CN106874725A (zh) 一种指纹解锁方法及移动终端
CN104281394A (zh) 智能选词的方法和装置
CN104238918A (zh) 列表视图组件滑动显示方法及装置
CN105302452A (zh) 一种基于手势交互的操作方法及装置
CN105320701A (zh) 功能点测试实现方式的筛选方法、装置及终端
CN104239343A (zh) 一种用户输入信息的处理方法和装置
CN104793879A (zh) 终端设备上的对象选择方法和终端设备

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant