CN109271882B - 一种区分颜色的手写体汉字提取方法 - Google Patents

一种区分颜色的手写体汉字提取方法 Download PDF

Info

Publication number
CN109271882B
CN109271882B CN201810984203.7A CN201810984203A CN109271882B CN 109271882 B CN109271882 B CN 109271882B CN 201810984203 A CN201810984203 A CN 201810984203A CN 109271882 B CN109271882 B CN 109271882B
Authority
CN
China
Prior art keywords
character
chinese characters
picture
processing
extracting
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810984203.7A
Other languages
English (en)
Other versions
CN109271882A (zh
Inventor
彭艺
尹玉梅
祁俊辉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kunming University of Science and Technology
Original Assignee
Kunming University of Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kunming University of Science and Technology filed Critical Kunming University of Science and Technology
Priority to CN201810984203.7A priority Critical patent/CN109271882B/zh
Publication of CN109271882A publication Critical patent/CN109271882A/zh
Application granted granted Critical
Publication of CN109271882B publication Critical patent/CN109271882B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/32Digital ink
    • G06V30/333Preprocessing; Feature extraction
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/26Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
    • G06V10/267Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion by performing operations on regions, e.g. growing, shrinking or watersheds
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/32Digital ink
    • G06V30/333Preprocessing; Feature extraction
    • G06V30/347Sampling; Contour coding; Stroke extraction
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/32Digital ink
    • G06V30/36Matching; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Data Mining & Analysis (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Computation (AREA)
  • Evolutionary Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Character Input (AREA)
  • Character Discrimination (AREA)

Abstract

本发明涉及一种区分颜色的手写体汉字提取方法,属于图像文字处理技术领域。本发明获取具有多种颜色手写体汉字的图片后,首先进行灰度化、二值化处理,去除多余痕迹;然后利用均值滤波去除图片中的高斯加性白噪声,再次利用二值化去除图片中的背景信息;接着利用阈值逼近法对汉字进行行分割、列分割等操作,再对其进行单字符归一化处理和细化处理,并对其进行特征提取;最后对待识别字符的特征向量与标准手写体样本数据库中字符的特征向量运用马氏距离公式求二者的距离,选择对应距离最小的字符识别输出。本发明增加了当前依靠计算机对多种颜色手写体汉字进行识别的有效性和准确性。

Description

一种区分颜色的手写体汉字提取方法
技术领域
本发明涉及一种区分颜色的手写体汉字提取方法,属于图像文字处理技术领域。
背景技术
中小学生在平时写作业时,老师批改到比较好的作文,家长认为有保存价值,就想将其做成电子档,若用人工操作方式,不仅效率低还容易出错。若能够利用计算机技术实现去除老师批改痕迹后的作文并将其识别出来作为电子档保存,则具有很大的实用意义和现实意义。
目前,对于去除图片上的多余痕迹,主要依靠Photoshop技术,这一工作既耗时又繁琐,并且对个人的操作能力还有严格的要求,导致并没有大范围的流行开来。倘若采用一种智能的方法,就完全可以避免这些问题。现在对手写体汉字识别的技术也在逐步成熟,运用的领域也越来越广,将其运用到日常生活中,无疑会给人们的生活带来极大的方便。
发明内容
本发明要解决的技术问题是针对现有技术的局限和不足,提供一种区分颜色的手写体汉字提取方法,以解决现有技术对具有多种颜色手写体汉字进行识别时,针对性差、效率低等现象,致力于增加当前依靠计算机对多种颜色手写体汉字进行识别的有效性和准确性。
本发明的技术方案是:一种区分颜色的手写体汉字提取方法,其特征在于:获取具有多种颜色手写体汉字的图片后,首先进行灰度化、二值化处理,去除多余痕迹;然后利用均值滤波去除图片中的高斯加性白噪声,再次利用二值化去除图片中的背景信息;接着利用阈值逼近法对汉字进行行分割、列分割等操作,再对其进行单字符归一化处理和细化处理,并对其进行特征提取;最后对待识别字符的特征向量与标准手写体样本数据库中字符的特征向量运用马氏距离公式求二者的距离,选择对应距离最小的字符识别输出。
具体步骤为:
Step1:采集老师批改后的手写体汉字作文图片{P1,P2,…,PN},并将其生成数据库P存储在电脑本地;
Step2:对图片Pi,i∈[1,N]进行灰度化处理后,利用阈值M1进行二值化阈值处理,去除老师的批改痕迹,得到新的图片P′i,i∈[1,N],并生成新的数据库P′;
Step3:对图片P′i,i∈[1,N]进行图片预处理,包括平滑去噪、二值化、行字切分、归一化和细化,具体如Step3.1~Step3.5所示;
Step3.1:平滑去噪;采用均值滤波法将图片P′i,i∈[1,N]中的高频成分滤除;
Step3.2:二值化;将图片P′i,i∈[1,N]利用阈值M2进行二值化阈值处理,从而保留图片中的汉字而去除图片中的背景;
Step3.3:行字切分;采用阈值逼近算法进行行分割,在此基础上进行字分割,考虑到手写字有重叠、连体等情况出现,采用分割线细化算法、消除过分割算法和交叠字断笔处理算法这三种算法来具体实现字分割,得到单个字符数据Q:{q1,q2,…,qn,…,qm};
Step3.4:归一化;汉字经过行字切分后,得到的特征块大小不一,故采取归一化操作来统一特征块图像的尺寸,得到归一化的单个字符数据Q′:{q1′,q2′,…,qn′,…,qm′};
Step3.5:细化;采用查表法对数据Q′进行细化,得到细化后的单个字符数据Q″:{q1″,q2″,…,qn″,…,qm″};
Step4:对数据Q″中的汉字进行基于弹性网格的特征提取,包括粗***特征提取、外轮廓特征提取、内轮廓提取和方向像素特征提取,具体如Step4.1~Step4.4所示;
Step4.1:粗***特征提取;首先对Q″中的骨架图像进行内部区域填充处理,若像素点P为白色,则检测其上下左右四个方向是否有笔画,若都有笔画则认为该点为内部区域,将白色置为黑色,依次处理完所有白点;然后将填充图分成4×4共16个小块,统计每一小块黑色点数数量,构成16维粗***特征;
Step4.2:外轮廓特征提取;对Q″中的图像沿上下左右4个方向进行扫描,用弹性网格对扫描区域进行划分,统计每个区域第一次碰到笔画的面积,每个方向被分为了4个区域,每个区域阴影面积是1维特征,处理后,得到4×4=16维特征;
Step4.3:内轮廓提取;对Q″中的图像沿上下左右4个方向扫描,扫描方式同外轮廓特征提取,统计第一次穿过笔画与第二次再次碰到笔画之间的面积,构成16维内轮廓特征;
Step4.4:方向像素特征提取;对Q′中的图像进行一阶微分运算,得到汉字的外部轮廓线图像;将外轮廓线图像分成8×8=64个区域,统计每个小块中有效像素的方向线素累积和;
Step5:识别输出;最小距离分类器在特征空间中,用一个基准模板作为某一模式类的代表把待识别样本的特征向量与此基准模板之间的距离作为实现分类判决的依据,并将待识别样本与第Ι类基准样本的最小距离作为识别结果;采用马氏距离dm(X,μi)来对距离进行测量,其具体表达式如式(1)所示;
Figure BDA0001779303040000021
其中,X=(x1,x2,…,xn)T表示待识别样本A的特征向量,μi=(μi1i2,…,μin)T表示第Ι类模式的均值向量,σi=(σi1i2,…,σin)T表示第Ι类模式的均方差。
进一步地,所述步骤Step2中,根据二值化阈值法,调节阈值参数M1,对老师的笔迹与学生的笔迹进行二值化,令老师的笔迹的像素值为0,学生的笔迹的像素值为255;其中阈值参数M1可根据实际进行选取。
进一步地,所述步骤Step3.2中,根据二值化阈值法,调节阈值参数M2,从而保留图片中的汉字而去除图片中的背景;其中阈值参数M2可根据实际进行选取。
进一步地,所述步骤Step3.4中,对图像依次进行坐标中心化、X-shearing归一化、缩放归一化、旋转归一化,最后得到64×64大小的汉字点阵。
进一步地,所述步骤Step3.5中,图像细化指从原来的图中去掉一些点,但仍要保持原来的形状;判断一个点是否能去掉是以8个相邻点的情况来作为判据的,即必须满足内部点不能删除、孤立点不能删除、直线端点不能删除、如果P是边界点,去掉P后,如果连通分量不增加,则P可删除。
进一步地,所述步骤Step4中,弹性网格就是根据汉字图像的笔画分布用非均匀的网线划分汉字得到的非均匀网格;而非均匀网线是根据汉字图像在水平、垂直两个方向上的直方图投影来确定的。
进一步地,所述步骤Step5中,选取的模板标准库是国家“863”标准手写体汉字样本数据库-HCL2000。
本发明的有益效果是:主要解决了现有技术对具有多种颜色手写体汉字进行识别时,针对性差、效率低等现象,增加了当前依靠计算机对多种颜色手写体汉字进行识别的有效性和准确性。
附图说明
图1是本发明总流程示意图;
图2是本发明图像预处理示意图;
图3是本发明字符特征提取流程示意图;
图4是本发明字符识别示意图。
具体实施方式
下面结合附图和具体实施方式,对本发明作进一步说明。
实施例1:如图1-4所示,一种区分颜色的手写体汉字提取方法,其特征在于:获取具有多种颜色手写体汉字的图片后,首先进行灰度化、二值化处理,去除多余痕迹;然后利用均值滤波去除图片中的高斯加性白噪声,再次利用二值化去除图片中的背景信息;接着利用阈值逼近法对汉字进行行分割、列分割等操作,再对其进行单字符归一化处理和细化处理,并对其进行特征提取;最后对待识别字符的特征向量与标准手写体样本数据库中字符的特征向量运用马氏距离公式求二者的距离,选择对应距离最小的字符识别输出。
具体步骤为:
Step1:采集老师批改后的手写体汉字作文图片{P1,P2,…,PN},并将其生成数据库P存储在电脑本地;
Step2:对图片Pi,i∈[1,N]进行灰度化处理后,利用阈值M1进行二值化阈值处理,去除老师的批改痕迹,得到新的图片P′i,i∈[1,N],并生成新的数据库P′;
Step3:对图片P′i,i∈[1,N]进行图片预处理,包括平滑去噪、二值化、行字切分、归一化和细化,具体如Step3.1~Step3.5所示;
Step3.1:平滑去噪;采用均值滤波法将图片P′i,i∈[1,N]中的高频成分滤除;
Step3.2:二值化;将图片P′i,i∈[1,N]利用阈值M2进行二值化阈值处理,从而保留图片中的汉字而去除图片中的背景;
Step3.3:行字切分;采用阈值逼近算法进行行分割,在此基础上进行字分割,考虑到手写字有重叠、连体等情况出现,采用分割线细化算法、消除过分割算法和交叠字断笔处理算法这三种算法来具体实现字分割,得到单个字符数据Q:{q1,q2,…,qn,…,qm};
Step3.4:归一化;汉字经过行字切分后,得到的特征块大小不一,故采取归一化操作来统一特征块图像的尺寸,得到归一化的单个字符数据Q′:{q1′,q2′,…,qn′,…,qm′};
Step3.5:细化;采用查表法对数据Q′进行细化,得到细化后的单个字符数据Q″:{q1″,q2″,…,qn″,…,qm″};
Step4:对数据Q″中的汉字进行基于弹性网格的特征提取,包括粗***特征提取、外轮廓特征提取、内轮廓提取和方向像素特征提取,具体如Step4.1~Step4.4所示;
Step4.1:粗***特征提取;首先对Q″中的骨架图像进行内部区域填充处理,若像素点P为白色,则检测其上下左右四个方向是否有笔画,若都有笔画则认为该点为内部区域,将白色置为黑色,依次处理完所有白点;然后将填充图分成4×4共16个小块,统计每一小块黑色点数数量,构成16维粗***特征;
Step4.2:外轮廓特征提取;对Q″中的图像沿上下左右4个方向进行扫描,用弹性网格对扫描区域进行划分,统计每个区域第一次碰到笔画的面积,每个方向被分为了4个区域,每个区域阴影面积是1维特征,处理后,得到4×4=16维特征;
Step4.3:内轮廓提取;对Q″中的图像沿上下左右4个方向扫描,扫描方式同外轮廓特征提取,统计第一次穿过笔画与第二次再次碰到笔画之间的面积,构成16维内轮廓特征;
Step4.4:方向像素特征提取;对Q′中的图像进行一阶微分运算,得到汉字的外部轮廓线图像;将外轮廓线图像分成8×8=64个区域,统计每个小块中有效像素的方向线素累积和;
Step5:识别输出;最小距离分类器在特征空间中,用一个基准模板作为某一模式类的代表把待识别样本的特征向量与此基准模板之间的距离作为实现分类判决的依据,并将待识别样本与第Ι类基准样本的最小距离作为识别结果;采用马氏距离dm(X,μi)来对距离进行测量,其具体表达式如式(1)所示;
Figure BDA0001779303040000051
其中,X=(x1,x2,…,xn)T表示待识别样本A的特征向量,μi=(μi1i2,…,μin)T表示第Ι类模式的均值向量,σi=(σi1i2,…,σin)T表示第Ι类模式的均方差。
进一步地,所述步骤Step2中,根据二值化阈值法,调节阈值参数M1,对老师的笔迹与学生的笔迹进行二值化,令老师的笔迹的像素值为0,学生的笔迹的像素值为255;其中阈值参数M1可根据实际进行选取。
进一步地,所述步骤Step3.2中,根据二值化阈值法,调节阈值参数M2,从而保留图片中的汉字而去除图片中的背景;其中阈值参数M2可根据实际进行选取。
进一步地,所述步骤Step3.4中,对图像依次进行坐标中心化、X-shearing归一化、缩放归一化、旋转归一化,最后得到64×64大小的汉字点阵。
进一步地,所述步骤Step3.5中,图像细化指从原来的图中去掉一些点,但仍要保持原来的形状;判断一个点是否能去掉是以8个相邻点的情况来作为判据的,即必须满足内部点不能删除、孤立点不能删除、直线端点不能删除、如果P是边界点,去掉P后,如果连通分量不增加,则P可删除。
进一步地,所述步骤Step4中,弹性网格就是根据汉字图像的笔画分布用非均匀的网线划分汉字得到的非均匀网格;而非均匀网线是根据汉字图像在水平、垂直两个方向上的直方图投影来确定的。
进一步地,所述步骤Step5中,选取的模板标准库是国家“863”标准手写体汉字样本数据库-HCL2000。
以上结合附图对本发明的具体实施方式作了详细说明,但是本发明并不限于上述实施方式,在本领域普通技术人员所具备的知识范围内,还可以在不脱离本发明宗旨的前提下作出各种变化。

Claims (7)

1.一种区分颜色的手写体汉字提取方法,其特征在于:获取具有多种颜色手写体汉字的图片后,首先进行灰度化、二值化处理,去除多余痕迹;然后利用均值滤波去除图片中的高斯加性白噪声,再次利用二值化去除图片中的背景信息;接着利用阈值逼近法对汉字进行行分割、列分割,再对其进行单字符归一化处理和细化处理,并对其进行特征提取;最后对待识别字符的特征向量与标准手写体样本数据库中字符的特征向量运用马氏距离公式求二者的距离,选择对应距离最小的字符识别输出;
具体步骤为:
Step1:采集老师批改后的手写体汉字作文图片{P1,P2,…,PN},并将其生成数据库P存储在电脑本地;
Step2:对图片Pi,i∈[1,N]进行灰度化处理后,利用阈值M1进行二值化阈值处理,去除老师的批改痕迹,得到新的图片P′i,i∈[1,N],并生成新的数据库P′;
Step3:对图片P′i,i∈[1,N]进行图片预处理,包括平滑去噪、二值化、行字切分、归一化和细化,具体如Step3.1~Step3.5所示;
Step3.1:平滑去噪;采用均值滤波法将图片P′i,i∈[1,N]中的高频成分滤除;
Step3.2:二值化;将图片P′i,i∈[1,N]利用阈值M2进行二值化阈值处理,从而保留图片中的汉字而去除图片中的背景;
Step3.3:行字切分;采用阈值逼近算法进行行分割,在此基础上进行字分割,考虑到手写字有重叠、连体出现,采用分割线细化算法、消除过分割算法和交叠字断笔处理算法这三种算法来具体实现字分割,得到单个字符数据Q:{q1,q2,…,qn,…,qm};
Step3.4:归一化;汉字经过行字切分后,得到的特征块大小不一,故采取归一化操作来统一特征块图像的尺寸,得到归一化的单个字符数据Q′:{q1′,q2′,…,qn′,…,qm′};
Step3.5:细化;采用查表法对数据Q′进行细化,得到细化后的单个字符数据Q″:{q1″,q2″,…,qn″,…,qm″};
Step4:对数据Q″中的汉字进行基于弹性网格的特征提取,包括粗***特征提取、外轮廓特征提取、内轮廓提取和方向像素特征提取,具体如Step4.1~Step4.4所示;
Step4.1:粗***特征提取;首先对Q″中的骨架图像进行内部区域填充处理,若像素点P为白色,则检测其上下左右四个方向是否有笔画,若都有笔画则认为该点为内部区域,将白色置为黑色,依次处理完所有白点;然后将填充图分成4×4共16个小块,统计每一小块黑色点数数量,构成16维粗***特征;
Step4.2:外轮廓特征提取;对Q″中的图像沿上下左右4个方向进行扫描,用弹性网格对扫描区域进行划分,统计每个区域第一次碰到笔画的面积,每个方向被分为了4个区域,每个区域阴影面积是1维特征,处理后,得到4×4=16维特征;
Step4.3:内轮廓提取;对Q″中的图像沿上下左右4个方向扫描,扫描方式同外轮廓特征提取,统计第一次穿过笔画与第二次再次碰到笔画之间的面积,构成16维内轮廓特征;
Step4.4:方向像素特征提取;对Q′中的图像进行一阶微分运算,得到汉字的外部轮廓线图像;将外轮廓线图像分成8×8=64个区域,统计每个小块中有效像素的方向线素累积和;
Step5:识别输出;最小距离分类器在特征空间中,用一个基准模板作为某一模式类的代表把待识别样本的特征向量与此基准模板之间的距离作为实现分类判决的依据,并将待识别样本与第Ι类基准样本的最小距离作为识别结果;采用马氏距离dm(X,μi)来对距离进行测量,其具体表达式如式(1)所示;
Figure FDA0002309033410000021
其中,X=(x1,x2,…,xn)T表示待识别样本A的特征向量,μi=(μi1i2,…,μin)T表示第Ι类模式的均值向量,σi=(σi1i2,…,σin)T表示第Ι类模式的均方差。
2.根据权利要求1所述的区分颜色的手写体汉字提取方法,其特征在于:所述步骤Step2中,根据二值化阈值法,调节阈值参数M1,对老师的笔迹与学生的笔迹进行二值化,令老师的笔迹的像素值为0,学生的笔迹的像素值为255。
3.根据权利要求1所述的区分颜色的手写体汉字提取方法,其特征在于:所述步骤Step3.2中,根据二值化阈值法,调节阈值参数M2,从而保留图片中的汉字而去除图片中的背景。
4.根据权利要求1所述的区分颜色的手写体汉字提取方法,其特征在于:所述步骤Step3.4中,对图像依次进行坐标中心化、X-shearing归一化、缩放归一化、旋转归一化,最后得到64×64大小的汉字点阵。
5.根据权利要求1所述的区分颜色的手写体汉字提取方法,其特征在于:所述步骤Step3.5中,图像细化指从原来的图中去掉一些点,但仍要保持原来的形状;判断一个点是否能去掉是以8个相邻点的情况来作为判据的,即必须满足内部点不能删除、孤立点不能删除、直线端点不能删除、如果P是边界点,去掉P后,如果连通分量不增加,则P可删除。
6.根据权利要求1所述的区分颜色的手写体汉字提取方法,其特征在于:所述步骤Step4中,弹性网格就是根据汉字图像的笔画分布用非均匀的网线划分汉字得到的非均匀网格;而非均匀网线是根据汉字图像在水平、垂直两个方向上的直方图投影来确定的。
7.根据权利要求1所述的区分颜色的手写体汉字提取方法,其特征在于:所述步骤Step5中,选取的模板标准库是国家“863”标准手写体汉字样本数据库-HCL2000。
CN201810984203.7A 2018-08-28 2018-08-28 一种区分颜色的手写体汉字提取方法 Active CN109271882B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810984203.7A CN109271882B (zh) 2018-08-28 2018-08-28 一种区分颜色的手写体汉字提取方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810984203.7A CN109271882B (zh) 2018-08-28 2018-08-28 一种区分颜色的手写体汉字提取方法

Publications (2)

Publication Number Publication Date
CN109271882A CN109271882A (zh) 2019-01-25
CN109271882B true CN109271882B (zh) 2020-05-15

Family

ID=65154717

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810984203.7A Active CN109271882B (zh) 2018-08-28 2018-08-28 一种区分颜色的手写体汉字提取方法

Country Status (1)

Country Link
CN (1) CN109271882B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110737364B (zh) * 2019-11-06 2023-12-12 广州炫视智能科技有限公司 一种安卓***下触摸书写加速的控制方法
CN111062398B (zh) * 2020-03-18 2021-01-19 杭州汇萃智能科技有限公司 字符识别方法、装置、计算机设备和存储介质
CN113688838B (zh) * 2021-10-25 2022-03-22 江西软云科技股份有限公司 红色笔迹提取方法、***、可读存储介质及计算机设备

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1652138A (zh) * 2005-02-08 2005-08-10 华南理工大学 一种手写文字的识别方法
CN101447022A (zh) * 2008-12-24 2009-06-03 华南理工大学 一种手写汉字图像的特征提取方法
CN103824072A (zh) * 2014-03-05 2014-05-28 广东小天才科技有限公司 对手写字符的字体结构进行检测的方法及装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006031299A (ja) * 2004-07-15 2006-02-02 Hitachi Ltd 文字認識方法、文字データの修正履歴処理方法およびシステム

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1652138A (zh) * 2005-02-08 2005-08-10 华南理工大学 一种手写文字的识别方法
CN101447022A (zh) * 2008-12-24 2009-06-03 华南理工大学 一种手写汉字图像的特征提取方法
CN103824072A (zh) * 2014-03-05 2014-05-28 广东小天才科技有限公司 对手写字符的字体结构进行检测的方法及装置

Also Published As

Publication number Publication date
CN109271882A (zh) 2019-01-25

Similar Documents

Publication Publication Date Title
CN104751142B (zh) 一种基于笔划特征的自然场景文本检测方法
CN109389121B (zh) 一种基于深度学习的铭牌识别方法及***
CN109409355B (zh) 一种新型变压器铭牌识别的方法及装置
CN109271882B (zh) 一种区分颜色的手写体汉字提取方法
Chen et al. Shadow-based Building Detection and Segmentation in High-resolution Remote Sensing Image.
CN110751154B (zh) 一种基于像素级分割的复杂环境多形状文本检测方法
Peng et al. Recognition of low-resolution logos in vehicle images based on statistical random sparse distribution
CN103295009B (zh) 基于笔画分解的车牌字符识别方法
CN112712273B (zh) 一种基于骨架相似度的手写体汉字美观度评判方法
CN111753706B (zh) 一种基于图像统计学的复杂表格交点聚类提取方法
TWI637325B (zh) 使用多顏色通道無記號偵測之便箋辨識與管理
CN103310211A (zh) 一种基于图像处理的填注标记识别方法
CN111783773B (zh) 一种面向角度倾斜电线杆标识牌的矫正方法
CN110991439A (zh) 一种基于像素级多特征联合分类的手写体字符的提取方法
CN110751619A (zh) 一种绝缘子缺陷检测方法
CN111507344A (zh) 从图像中识别出文字的方法和装置
CN112364834A (zh) 一种基于深度学习和图像处理的表格识别的还原方法
CN115471682A (zh) 一种基于SIFT融合ResNet50的图像匹配方法
CN113139535A (zh) 一种ocr文档识别方法
CN110516666B (zh) 基于mser和isodata相结合的车牌定位方法
Wang et al. Vehicle license plate recognition based on wavelet transform and vertical edge matching
Shi et al. License plate localization in complex environments based on improved GrabCut algorithm
Dong et al. An improved parallel thinning algorithm
CN112418210B (zh) 一种杆塔巡检信息智能分类方法
CN110766001A (zh) 基于cnn和rnn的银行卡***定位与端到端识别方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant