CN102831418A - 手写体汉字倾斜矫正方法及装置 - Google Patents

手写体汉字倾斜矫正方法及装置 Download PDF

Info

Publication number
CN102831418A
CN102831418A CN2011101632132A CN201110163213A CN102831418A CN 102831418 A CN102831418 A CN 102831418A CN 2011101632132 A CN2011101632132 A CN 2011101632132A CN 201110163213 A CN201110163213 A CN 201110163213A CN 102831418 A CN102831418 A CN 102831418A
Authority
CN
China
Prior art keywords
chinese character
direction histogram
handwritten chinese
handwritten
angle
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2011101632132A
Other languages
English (en)
Other versions
CN102831418B (zh
Inventor
邹明福
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hanwang Technology Co Ltd
Original Assignee
Hanwang Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hanwang Technology Co Ltd filed Critical Hanwang Technology Co Ltd
Priority to CN201110163213.2A priority Critical patent/CN102831418B/zh
Publication of CN102831418A publication Critical patent/CN102831418A/zh
Application granted granted Critical
Publication of CN102831418B publication Critical patent/CN102831418B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Character Discrimination (AREA)

Abstract

本发明公开了一种手写体汉字倾斜矫正方法及装置,属于文字识别领域。该方法包括:获取步骤,获取手写体汉字的方向直方图以及对手写体汉字进行倾斜矫正的定点;匹配步骤,将手写体汉字的方向直方图与样本库中多个方向直方图模版进行匹配,得到旋转角度;矫正步骤,根据确定的倾斜矫正的定点和旋转角度,对手写体汉字进行倾斜矫正。本发明提供的手写体汉字倾斜矫正方法及装置不依赖笔段方向信息,具有通用性,对任意角度的倾斜汉字都能够进行矫正,为进一步的手写识别提供更为准确的信息。

Description

手写体汉字倾斜矫正方法及装置
技术领域
本发明涉及文字识别领域,特别涉及一种手写体汉字倾斜矫正方法及装置。
背景技术
在汉字识别***中,从输入端获取的数据通常带有很大的随机噪声,需要在正式识别之前对该数据进行预处理。在这些随机噪声中,有一种就是汉字字符的书写倾斜,这种倾斜的随机性必然会对识别造成影响。因此,有必要在识别前的预处理过程中增加倾斜矫正的步骤,使得用端正书写样本训练所得的识别库能够识别各种情况下的斜体字或书写不端正的汉字。
在现有的手写体汉字倾斜矫正技术中,有一种方法是采用笔段方向信息进行的联机汉字的倾斜矫正,但是这种方法对横竖笔画较多的汉字有效果,对于横竖笔画部缺少的汉字却是无能为力,存在明显的误矫和漏矫的问题。
发明内容
本发明所要解决的技术问题是针对现有技术中对多样性的倾斜手写体汉字存在误矫和漏矫的缺陷,提出一种手写体汉字倾斜矫正方法及装置,为进一步的手写识别提供更为准确的信息。
为了解决上述技术问题,本发明提供了一种手写体汉字倾斜矫正方法,包括:
获取步骤,获取手写体汉字的方向直方图以及对手写体汉字进行倾斜矫正的定点;
匹配步骤,将手写体汉字的方向直方图与样本库中多个方向直方图模版进行匹配,得到旋转角度;
矫正步骤,根据确定的倾斜矫正的定点和旋转角度,对手写体汉字进行倾斜矫正。
进一步的,该方法还可以包括:样本库建立步骤,所述样本库建立步骤包括:
分别获取每个汉字的多个样本的方向直方图,并对各方向直方图取均值,得到该汉字的均值方向直方图;将多个汉字的均值方向直方图进行聚类,得到多个作为聚类中心的方向直方图模版,将所述各方向直方图模版组成样本库。
进一步的,所述获取步骤包括:
按照一定的时间间隔,对手写体汉字进行采样,得到连续的采样点;
将每两个连续的采样点进行连线,获得该连线的角度,并获得具有相同角度的连线个数;
根据具有相同角度的连线个数和连线的角度经量化形成的角度级别的对应关系,得到手写体汉字的方向直方图;
以及,确定所述手写体汉字的书写起笔点为倾斜矫正的定点。
进一步的,所述匹配步骤包括:
针对手写体汉字的每一个角度级别,分别计算手写体汉字的方向直方图中该角度级别对应的连线个数与样本库中每一个方向直方图模版中该角度级别对应的连线个数的差值;
比较得到差值的最小值,该差值的最小值对应的角度级别即为旋转角度的级别,从而得到旋转角度。
进一步的,所述矫正步骤具体为:以倾斜矫正的定点为旋转起点,按照旋转角度对手写体汉字进行旋转。
进一步的,所述将多个汉字的均值方向直方图进行聚类,得到多个作为聚类中心的方向直方图模版具体为:
采用基于均值距离的分级聚类方法将多个汉字的均值方向直方图进行聚类,得到多个作为聚类中心的方向直方图模版,其中采用均值距离作为两个类之间的相似性度量。
本发明提供了一种手写体汉字倾斜矫正装置,包括:
获取模块,用于获取手写体汉字的方向直方图以及对手写体汉字进行倾斜矫正的定点;
匹配模块,用于将手写体汉字的方向直方图与样本库中多个方向直方图模版进行匹配,得到旋转角度;
矫正模块,用于根据确定的倾斜矫正的定点和旋转角度,对手写体汉字进行倾斜矫正。
进一步的,该装置还可以包括:样本库建立模块;所述样本库建立模块包括:
直方图获取单元,用于分别获取每个汉字的多个样本的方向直方图,并对各方向直方图取均值,得到该汉字的均值方向直方图;
聚类单元,用于将多个汉字的均值方向直方图进行聚类,得到多个作为聚类中心的方向直方图模版,将所述各方向直方图模版组成样本库。
进一步的,所述获取模块包括:
采样单元,用于按照一定的时间间隔,对手写体汉字进行采样,得到连续的采样点;
连线单元,用于将每两个连续的采样点进行连线,获得该连线的角度,并获得具有相同角度的连线个数;
获取单元,用于根据具有相同角度的连线个数和连线的角度经量化形成的角度级别的对应关系,得到手写体汉字的方向直方图,以及
定点确定单元,用于确定所述手写体汉字的书写起笔点为倾斜矫正的定点。
进一步的,所述匹配模块包括:
计算单元,用于针对手写体汉字的每一个角度级别,分别计算手写体汉字的方向直方图中该角度级别对应的连线个数与样本库中每一个方向直方图模版中该角度级别对应的连线个数的差值;
比较单元,用于比较得到差值的最小值,该差值的最小值对应的角度级别即为旋转角度的级别,从而得到旋转角度。
进一步的,所述矫正模块具体用于以倾斜矫正的定点为旋转起点,按照旋转角度对手写体汉字进行旋转;所述倾斜矫正的定点为该手写体汉字的书写起笔点。
进一步的,所述聚类单元具体用于采用基于均值距离的分级聚类方法将多个汉字的均值方向直方图进行聚类,得到多个作为聚类中心的方向直方图模版,其中采用均值距离作为两个类之间的相似性度量。
本发明提供的手写体汉字倾斜矫正方法及装置不依赖笔段方向信息,具有通用性,对任意角度的倾斜汉字都能够进行矫正,为进一步的手写识别提供更为准确的信息。
附图说明
图1为本发明提供的手写体汉字倾斜矫正方法一实施例中样本库建立步骤的流程图;
图2为本发明提供的手写体汉字倾斜矫正方法一实施例的流程图;
图3为本发明提供的手写体汉字倾斜矫正方法一实施例中获取的手写体汉字的示意图;
图4为图3中圆圈标记部分连线的角度示意图;
图5为对图3所示的手写体汉字进行倾斜矫正后的汉字示意图;
图6为本发明提供的手写体汉字倾斜矫正装置一实施例的结构示意图。
具体实施方式
下面结合附图及优选实施方式对本发明技术方案进行详细说明。
本发明提供的手写体汉字倾斜矫正方法,首先获取手写体汉字的方向直方图,然后与样本库中的多个方向直方图模版进行匹配,得到旋转角度,最后借助倾斜矫正的定点和该旋转角度,对手写体汉字进行倾斜矫正。其中通过记忆手写时起笔的位置就可以确定倾斜矫正的定点。由此可见,本发明利用了样本库中的多个方向直方图模版,因此在手写体汉字倾斜矫正之前,需要获得该样本库。为了便于描述,本文中首先对样本库的获取步骤进行介绍。
图1为本发明提供的手写体汉字倾斜矫正方法一实施例中样本库建立步骤的流程图。如图1所示,该样本库建立步骤包括:
步骤101、分别获取每个汉字的多个样本的方向直方图,并对各方向直方图取均值,得到该汉字的均值方向直方图。
本实施例以字符集GB2312的字符为例,其中共包含6763个汉字,为每个汉字采集多个不同手写体的样本,如多个样本为不同人书写。对于同一个汉字,获取每个样本的方向直方图,获取方向直方图的具体方法是:
(a)按照一定的时间间隔对样本进行采样,得到连续的采样点;
(b)将每两个连续的采样点进行连线,获得该连线的角度,并获得具有相同角度的连线个数;
(c)将连线的角度量化为角度级别,理论上汉字的采样点之间连线的角度在-180°到180°(大于或等于-180°,小于180°)之间,该角度是相对于水平正方向的角度;将这360°范围的角度均匀量化成32个级别,表示为0-31级;
(d)根据角度级别与具有相同角度的连线个数的对应关系,得到样本的方向直方图。该方向直方图的横坐标为角度级别i,纵坐标为具有i对应的角度的连线个数。
采用上述方法获取同一个汉字的多个样本的方向直方图,然后将这些样本的方向直方图取均值,得到该汉字的均值方向直方图。由此可以得到6763个字符的均值方向直方图。
步骤102、将多个汉字的均值方向直方图进行聚类,得到多个可作为聚类中心的方向直方图模版,组成样本库。
如果直接利用上述6763个均值方向直方图组成样本库对手写体汉字进行矫正,将会花费大量的时间,影响矫正方法的效率。因此,本实施例要对这6763个汉字的均值方向直方图进行聚类。
本实施例中,具体采用基于均值距离的分级聚类方法进行聚类,其中采用欧式距离作为两个类之间的相似性度量值。在聚类过程中该方法的聚类中心的个数是动态的,这样可以避免因聚类中心个数过少导致信息量压缩过多,从而造成信息的丢失,也可以避免因聚类中心个数过多导致信息量压缩不够,从而造成信息的冗余。
在基于均值距离的分级聚类方法中,设第一层为初始层,该层聚类集合具有6763个类,依次向后,层数加1,类个数减1。Γi和Γj表示某一层第i个和第j个类,上述基于均值距离的分级聚类方法具体包括:
步骤(1):初始时,每一个均值方向直方图为一个类,Γi和Γj为6763个均值方向直方图中的两个,i,j∈I,I={1,2....,6763}。
步骤(2):在聚类集合中查找满足以下条件的聚类集合Γi和Γk
Δ(Γi,Γk)=minΔ(Γi,Γj),
其中,Δ(Γi,Γk)是Γi和Γk之间的相似性度量,i,j∈I。
在本方法中采用的相似性度量是均值距离:
Δ(Γi,Γk)=δ(mi,mj),其中的mi和mj分别是Γi和Γj的均值向量,而δ(·)是欧氏距离。
步骤(3):把Γi并入Γk,并去掉Γi
步骤(4):在集合I中去掉i,跳转执行步骤(2)直至聚类集合中类的个数达到聚类中心的个数。
当前后两层的相似性度量的差值达到波峰时,将后一层聚类集合中类的个数定义为聚类中心的个数。经过实验验证,当将6763个均值方向直方图聚类为256个类时,前后两层的相似性度量的差值达到波峰,因此本实施例得到256个方向直方图模版,组成样本库。
图2为本发明提供的手写体汉字倾斜矫正方法一实施例的流程图。如图2所示,该手写体汉字倾斜矫正方法包括:
步骤201、获取手写体汉字的方向直方图以及对手写体汉字进行倾斜矫正的定点。
图3为本发明提供的手写体汉字倾斜矫正方法一实施例中获取的手写体汉字的示意图。如图3所示,本实施例从输入端获取的数据为一手写的“阿”字,该“阿”字为一倾斜字体。该方法需要获取“阿”字的方向直方图,获取方向直方图的方法可以与样本库建立步骤中获取方向直方图的具体方法相同,参照图3和图4,获取方向直方图的方法具体描述如下:
(a)按照一定的时间间隔对手写体汉字“阿”进行采样,得到连续的采样点;
(b)将每两个连续的采样点进行连线,获得该连线的角度,统计整个手写字体采样点间的连线角度,并获得具有相同角度的连线个数;
参见图3中用圆圈所标记的部分,对该部分进行间隔采样后,获取前后连续两个采样点连线与水平方向构成的角度,参见图4所示。
(c)将连线的角度量化为角度级别,将角度量化为0-31之间的一级;
(d)根据角度级别与具有相同角度的连线个数的对应关系,得到手写体汉字的方向直方图。该方向直方图的横坐标为角度级别i,纵坐标为具有i对应的角度的连线个数。
记忆手写汉字时起笔的位置,并确定为手写体汉字倾斜矫正的定点。
步骤202、将手写体汉字的方向直方图与样本库中多个方向直方图模版进行匹配,得到旋转角度。
针对手写体汉字的每一个角度级别i,分别计算手写体汉字的方向直方图中该角度级别i对应的连线个数与样本库中每一个方向直方图模版中该角度级别i对应的连线个数的差值,即为:abs(φ(i)-Γ(i,j)),其中φ(i)表示手写体汉字的方向直方图中角度级别i对应的连线个数,0≤i≤31,Γ(i,j)表示样本库中第j个方向直方图模版中角度级别i对应的连线个数,在本实施例中1≤j≤256;
比较得到差值的最小值,该差值的最小值对应的角度级别即为旋转角度的级别,从而得到旋转角度。具体地说,比较得到差值的最小值表示为:min(abs(φ(i0)-Γ(i0,j0))),也即比较得到手写体汉字的方向直方图中i0对应的连线个数与样本库中第j0个方向直方图模版中i0对应的连线个数的差值是最小的,因此确定旋转角度的级别为i0
本实施例中设0°对应的角度级别为24。在实际操作过程中,手写体汉字的倾斜角度一般介于-45°与45°之间,也就是说,角度级别i0一般介于20与28之间,因此将旋转角度的级别i0代入下式即可得到旋转角度θ:
θ = 45 × ( i 0 - 20 ) / ( 24 - 20 ) 20 ≤ i 0 ≤ 24 0 i 0 = 24 - 45 × ( i 0 - 24 ) / ( 28 - 24 ) , 24 ≤ i 0 ≤ 28
步骤203、根据确定的倾斜矫正的定点和旋转角度,对手写体汉字进行倾斜矫正。
根据汉字的特点,大多数汉字的起笔部在汉字的左边、上边或是左上边,根据这一特点,只需记忆手写时起笔的位置,就可以确定手写体汉字倾斜矫正的定点。本发明选择手写体汉字的起笔点作为倾斜矫正的定点。以倾斜矫正的定点为旋转起点,按照旋转角度θ对手写体汉字进行旋转,从而实现对手写体汉字进行倾斜矫正。如图5所示,为倾斜矫正后的汉字。
本实施例提供的手写体汉字倾斜矫正方法具有通用性,对任意角度的倾斜汉字都能够进行矫正,为进一步的手写识别提供更为准确的信息。同时,由于采用分级聚类方法,能够使得信息量正好满足需求,既没有冗余也没有缺失,在保证矫正效果的同时也能够保证计算速度。
图6为本发明提供的手写体汉字倾斜矫正装置一实施例的结构示意图。如图6所示,该装置包括:获取模块10、匹配模块20和矫正模块30;其中:
获取模块10,用于获取手写体汉字的方向直方图;匹配模块20,用于将手写体汉字的方向直方图与样本库中多个方向直方图模版进行匹配,得到旋转角度;矫正模块30,用于根据确定的倾斜矫正的定点和旋转角度,对手写体汉字进行倾斜矫正。
进一步的,该装置还可以包括样本库建立模块40,该样本库建立模块40包括直方图获取单元41和聚类单元42,其中:直方图获取单元41,用于对于多个汉字中的每一个,分别获取该汉字的多个样本的方向直方图,并分别将获得的每个汉字的多个样本的方向直方图取均值,得到该汉字的均值方向直方图;聚类单元42,用于将多个汉字的均值方向直方图进行聚类,得到多个作为聚类中心的方向直方图模版,组成样本库。
进一步的,上述聚类单元42具体用于采用基于均值距离的分级聚类方法将多个汉字的均值方向直方图进行聚类,得到多个作为聚类中心的方向直方图模版,其中采用均值距离作为两个类之间的相似性度量。
上述获取模块10可以包括:采样单元11、连线单元12、获取单元13和定点确定单元14,其中:采样单元11,用于按照一定的时间间隔,对手写体汉字进行采样,得到连续的采样点;连线单元12,用于将每两个连续的采样点进行连线,获得该连线的角度,并获得具有相同角度的连线个数;获取单元13,用于将根据具有相同角度的连线个数和连线的角度经量化形成的角度级别的对应关系,得到手写体汉字的方向直方图;定点确定单元14,用于确定所述手写体汉字的书写起笔点为倾斜矫正的定点。
上述匹配模块20可以包括:计算单元21和比较单元22,其中:计算单元21,用于针对手写体汉字的每一个角度级别,分别计算手写体汉字的方向直方图中该角度级别对应的连线个数与样本库中每一个方向直方图模版中该角度级别对应的连线个数的差值;比较单元22,用于比较得到差值的最小值,该差值的最小值对应的角度级别即为旋转角度的级别,从而得到旋转角度。
上述矫正模块30具体用于以倾斜矫正的定点为旋转起点,按照旋转角度对手写体汉字进行旋转;所述倾斜矫正的定点是通过该手写体汉字的书写起笔位置来确定。
本实施例提供的手写体汉字倾斜矫正装置具有通用性,对任意角度的倾斜汉字都能够进行矫正,为进一步的手写识别提供更为准确的信息。同时,由于采用分级聚类方法,能够使得信息量正好满足需求,既没有冗余也没有缺失,在保证矫正效果的同时也能够保证计算速度。
最后,需要注意的是:以上列举的仅是本发明的具体实施例,当然本领域的技术人员可以对本发明进行改动和变型,倘若这些修改和变型属于本发明权利要求及其等同技术的范围之内,均应认为是本发明的保护范围。

Claims (12)

1.一种手写体汉字倾斜矫正方法,其特征在于,包括:
获取步骤,获取手写体汉字的方向直方图以及对手写体汉字进行倾斜矫正的定点;
匹配步骤,将手写体汉字的方向直方图与样本库中多个方向直方图模版进行匹配,得到旋转角度;
矫正步骤,根据确定的倾斜矫正的定点和旋转角度,对手写体汉字进行倾斜矫正。
2.根据权利要求1所述的方法,其特征在于,还包括:样本库建立步骤,所述样本库建立步骤包括:
分别获取每个汉字的多个手写体样本的方向直方图,对各方向直方图取均值,得到该汉字的均值方向直方图;
将多个汉字的均值方向直方图进行聚类,得到多个作为聚类中心的方向直方图模版,将所述各方向直方图模版组成样本库。
3.根据权利要求2所述的方法,其特征在于,所述将多个汉字的均值方向直方图进行聚类,得到多个作为聚类中心的方向直方图模版具体为:
采用基于均值距离的分级聚类方法将多个汉字的均值方向直方图进行聚类,得到多个作为聚类中心的方向直方图模版,其中采用均值距离作为两个类之间的相似性度量。
4.根据权利要求1-3所述的方法,其特征在于,所述获取步骤包括:
按照一定的时间间隔,对手写体汉字进行采样,得到连续的采样点;
将每两个连续的采样点进行连线,获得该连线的角度,并获得具有相同角度的连线个数;
根据具有相同角度的连线个数和连线的角度经量化形成的角度级别的对应关系,得到手写体汉字的方向直方图;以及
确定所述手写体汉字的书写起笔点为倾斜矫正的定点。
5.根据权利要求4所述的方法,其特征在于,所述匹配步骤包括:
针对手写体汉字的每一个角度级别,分别计算手写体汉字的方向直方图中该角度级别对应的连线个数与样本库中每一个方向直方图模版中该角度级别对应的连线个数的差值;
比较得到差值的最小值,该差值的最小值对应的角度级别为旋转角度的级别,从而得到旋转角度。
6.根据权利要求5所述的方法,其特征在于,所述矫正步骤具体为:以倾斜矫正的定点为旋转起点,按照旋转角度对手写体汉字进行旋转。
7.一种手写体汉字倾斜矫正装置,其特征在于,包括:
获取模块,用于获取手写体汉字的方向直方图以及对手写体汉字进行倾斜矫正的定点;
匹配模块,用于将手写体汉字的方向直方图与样本库中多个方向直方图模版进行匹配,得到旋转角度;
矫正模块,用于根据确定的倾斜矫正的定点和旋转角度,对手写体汉字进行倾斜矫正。
8.根据权利要求7所述的装置,其特征在于,还包括:样本库建立模块;所述样本库获取模块包括:
直方图获取单元,用于分别获取每个汉字的多个样本的方向直方图,并对各方向直方图取均值,得到该汉字的均值方向直方图;
聚类单元,用于将多个汉字的均值方向直方图进行聚类,得到多个作为聚类中心的方向直方图模版,将所述各方向直方图模版组成样本库。
9.根据权利要求8所述的装置,其特征在于,所述聚类单元具体用于采用基于均值距离的分级聚类方法将多个汉字的均值方向直方图进行聚类,得到多个作为聚类中心的方向直方图模版,其中采用均值距离作为两个类之间的相似性度量。
10.根据权利要求7-9所述的装置,其特征在于,所述获取模块包括:
采样单元,用于按照一定的时间间隔,对手写体汉字进行采样,得到连续的采样点;
连线单元,用于将每两个连续的采样点进行连线,获得该连线的角度,并获得具有相同角度的连线个数;
获取单元,用于根据具有相同角度的连线个数和连线的角度经量化形成的角度级别的对应关系,得到手写体汉字的方向直方图,以及
定点确定单元,用于确定所述手写体汉字的书写起笔点为倾斜矫正的定点。
11.根据权利要求10所述的装置,其特征在于,所述匹配模块包括:
计算单元,用于针对手写体汉字的每一个角度级别,分别计算手写体汉字的方向直方图中该角度级别对应的连线个数与样本库中每一个方向直方图模版中该角度级别对应的连线个数的差值;
比较单元,用于比较得到差值的最小值,该差值的最小值对应的角度级别即为旋转角度的级别,从而得到旋转角度。
12.根据权利要求11所述的装置,其特征在于,所述矫正模块具体用于以倾斜矫正的定点为旋转起点,按照旋转角度对手写体汉字进行旋转。
CN201110163213.2A 2011-06-17 2011-06-17 手写体汉字倾斜矫正方法及装置 Active CN102831418B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201110163213.2A CN102831418B (zh) 2011-06-17 2011-06-17 手写体汉字倾斜矫正方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201110163213.2A CN102831418B (zh) 2011-06-17 2011-06-17 手写体汉字倾斜矫正方法及装置

Publications (2)

Publication Number Publication Date
CN102831418A true CN102831418A (zh) 2012-12-19
CN102831418B CN102831418B (zh) 2015-11-25

Family

ID=47334546

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201110163213.2A Active CN102831418B (zh) 2011-06-17 2011-06-17 手写体汉字倾斜矫正方法及装置

Country Status (1)

Country Link
CN (1) CN102831418B (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104573655A (zh) * 2015-01-09 2015-04-29 安徽清新互联信息科技有限公司 一种基于视频的盲道方向检测方法
CN105590112A (zh) * 2015-09-22 2016-05-18 成都数联铭品科技有限公司 一种图像识别中倾斜文字判断方法
CN106373092A (zh) * 2016-09-09 2017-02-01 华南理工大学 一种基于图像空间能量分布的汉字旋转矫正方法
CN109993161A (zh) * 2019-02-25 2019-07-09 众安信息技术服务有限公司 一种文本图像旋转矫正方法及***
CN113128495A (zh) * 2019-12-30 2021-07-16 广州慧睿思通科技股份有限公司 文本倾斜矫正方法、装置、存储介质、计算机设备
US11087516B2 (en) 2019-01-28 2021-08-10 Samsung Electronics Co., Ltd. Electronic device and method for correcting handwriting by same
US11450041B2 (en) 2019-11-04 2022-09-20 Samsung Electronics Co., Ltd. Method and electronic device for correcting handwriting input

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09305712A (ja) * 1996-05-21 1997-11-28 N T T Data Tsushin Kk 文字認識方法及び装置、及び文字認識用プログラムを記憶した記憶媒体
JP2000003407A (ja) * 1998-06-11 2000-01-07 Seiko Epson Corp 手書き文字正規化方法及び手書き文字正規化装置並びに手書き文字正規化処理プログラムを記録した記録媒体
CN1542656A (zh) * 2003-04-30 2004-11-03 ������������ʽ���� 信息处理装置、信息处理方法、存储介质及程序
US7620244B1 (en) * 2004-01-06 2009-11-17 Motion Computing, Inc. Methods and systems for slant compensation in handwriting and signature recognition
CN101697200A (zh) * 2009-09-25 2010-04-21 华南理工大学 一种旋转无关的手写中文草书词组识别方法
CN101893960A (zh) * 2010-06-28 2010-11-24 北京捷通华声语音技术有限公司 一种基于方向向量的文字识别方法和识别装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09305712A (ja) * 1996-05-21 1997-11-28 N T T Data Tsushin Kk 文字認識方法及び装置、及び文字認識用プログラムを記憶した記憶媒体
JP2000003407A (ja) * 1998-06-11 2000-01-07 Seiko Epson Corp 手書き文字正規化方法及び手書き文字正規化装置並びに手書き文字正規化処理プログラムを記録した記録媒体
CN1542656A (zh) * 2003-04-30 2004-11-03 ������������ʽ���� 信息处理装置、信息处理方法、存储介质及程序
US7620244B1 (en) * 2004-01-06 2009-11-17 Motion Computing, Inc. Methods and systems for slant compensation in handwriting and signature recognition
CN101697200A (zh) * 2009-09-25 2010-04-21 华南理工大学 一种旋转无关的手写中文草书词组识别方法
CN101893960A (zh) * 2010-06-28 2010-11-24 北京捷通华声语音技术有限公司 一种基于方向向量的文字识别方法和识别装置

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104573655A (zh) * 2015-01-09 2015-04-29 安徽清新互联信息科技有限公司 一种基于视频的盲道方向检测方法
CN104573655B (zh) * 2015-01-09 2018-03-20 安徽清新互联信息科技有限公司 一种基于视频的盲道方向检测方法
CN105590112A (zh) * 2015-09-22 2016-05-18 成都数联铭品科技有限公司 一种图像识别中倾斜文字判断方法
CN105590112B (zh) * 2015-09-22 2018-12-04 成都数联铭品科技有限公司 一种图像识别中倾斜文字判断方法
CN106373092A (zh) * 2016-09-09 2017-02-01 华南理工大学 一种基于图像空间能量分布的汉字旋转矫正方法
US11087516B2 (en) 2019-01-28 2021-08-10 Samsung Electronics Co., Ltd. Electronic device and method for correcting handwriting by same
CN109993161A (zh) * 2019-02-25 2019-07-09 众安信息技术服务有限公司 一种文本图像旋转矫正方法及***
CN109993161B (zh) * 2019-02-25 2021-08-03 众安信息技术服务有限公司 一种文本图像旋转矫正方法及***
US11450041B2 (en) 2019-11-04 2022-09-20 Samsung Electronics Co., Ltd. Method and electronic device for correcting handwriting input
CN113128495A (zh) * 2019-12-30 2021-07-16 广州慧睿思通科技股份有限公司 文本倾斜矫正方法、装置、存储介质、计算机设备

Also Published As

Publication number Publication date
CN102831418B (zh) 2015-11-25

Similar Documents

Publication Publication Date Title
CN102831418A (zh) 手写体汉字倾斜矫正方法及装置
KR101877693B1 (ko) 문자성 객관식 문제에 이용되는 지능적 채점 방법 및 시스템
Farooq et al. Pre-processing methods for handwritten Arabic documents
US9519838B2 (en) Character recognition method
Romero et al. Influence of text line segmentation in handwritten text recognition
CN110598686A (zh) ***的识别方法、***、电子设备和介质
CN102103693B (zh) 一种手写字识别方法
US20150235097A1 (en) Segmentation of an Input by Cut Point Classification
US8494277B2 (en) Handwritten character recognition based on frequency variations in characters
Ul-Hasan et al. Ocroract: A sequence learning ocr system trained on isolated characters
US11823474B2 (en) Handwritten text recognition method, apparatus and system, handwritten text search method and system, and computer-readable storage medium
CN102853835A (zh) 基于尺度不变特征变换的无人飞行器景象匹配定位方法
CN101344918A (zh) 手写汉字笔画位置规范性的判断方法和装置
US8442310B2 (en) Affine distortion compensation
CN103400130B (zh) 基于能量最小化框架的文档图像倾斜度检测与纠正方法
CN105654082A (zh) 字符识别后处理方法、设备及包括该设备的图像拾取设备
US9418281B2 (en) Segmentation of overwritten online handwriting input
CN101364271B (zh) 手写汉字笔画的识别方法和识别装置
CN101388112A (zh) 一种变换字体风格的方法及***
CN102156869B (zh) 检测由任意线段组合的形状的方法及装置
US9152876B1 (en) Methods and systems for efficient handwritten character segmentation
CN115438682A (zh) 用于确定解码方向的方法、装置及解码设备
EP3561725B1 (en) Optical character recognition of connected characters
US20230036812A1 (en) Text Line Detection
Abu-Ain et al. Text normalization framework for handwritten cursive languages by detection and straightness the writing baseline

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant