CN111695539A - 一种手写汉字的评价方法、装置及电子设备 - Google Patents
一种手写汉字的评价方法、装置及电子设备 Download PDFInfo
- Publication number
- CN111695539A CN111695539A CN202010554271.7A CN202010554271A CN111695539A CN 111695539 A CN111695539 A CN 111695539A CN 202010554271 A CN202010554271 A CN 202010554271A CN 111695539 A CN111695539 A CN 111695539A
- Authority
- CN
- China
- Prior art keywords
- stroke
- chinese character
- handwritten chinese
- recognition
- track
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/30—Writer recognition; Reading and verifying signatures
- G06V40/33—Writer recognition; Reading and verifying signatures based only on signature image, e.g. static signature recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Biomedical Technology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Character Discrimination (AREA)
Abstract
本发明提供了一种手写汉字的评价方法、装置及电子设备,其中,该方法包括:获取待识别的手写汉字轨迹;对所述手写汉字轨迹进行文字识别处理,确定所述手写汉字轨迹的识别置信度;对所述手写汉字轨迹进行笔画识别处理,确定每个所述笔画数据的笔画置信度;根据所述识别置信度和所述笔画置信度确定所述手写汉字轨迹的评价结果。通过本发明实施例提供的手写汉字的评价方法、装置及电子设备,实现对手写汉字轨迹的整体识别、以及其中每个笔画的识别,通过引入笔画识别处理,能够更加全面、准确地对用户的手写汉字进行评价;以笔画标识作为识别过程中的参数来进行笔画识别,识别过程简单,处理量小,能够提高处理效率。
Description
技术领域
本发明涉及文字处理技术领域,具体而言,涉及一种手写汉字的评价方法、装置、电子设备及计算机可读存储介质。
背景技术
手写汉字评分方法一般应用在小学低年级学生的汉字识字与书写教育上,用于对学生的手写汉字进行评分,帮助学生发现其手写汉字的不足。
目前基于手写体汉字的评分方法较为贫乏,其一般基于成熟的手写汉字识别技术来判断学生手写的汉字是否正确,进而实现评分。当前的汉字识别技术一般将汉字作为整体,通过比较手写笔画轨迹和标准字体轨迹来进行整体识别和评分。
在实现本发明的过程中,发明人发现现有的方案中至少存在如下问题:
当前的汉字识别技术进行整体识别,当手写汉字多一笔或少一笔时,难以区分正确的汉字或类似正确但实际错误的汉字。整体识别不能判断手写汉字的笔顺是否正确,不能满足教育要求;且评分时可参考指标较少,导致评分结果的可信度不高或者不准确。
发明内容
为解决现有存在的技术问题,本发明实施例提供一种手写汉字的评价方法、装置、电子设备及计算机可读存储介质。
第一方面,本发明实施例提供了一种手写汉字的评价方法,包括:
获取待识别的手写汉字轨迹,所述手写汉字轨迹包括一个笔画数据或多个有序的笔画数据;
对所述手写汉字轨迹进行文字识别处理,确定所述手写汉字轨迹的识别置信度,所述识别置信度为所述手写汉字轨迹被识别为预设的标准汉字的概率;
对所述手写汉字轨迹进行笔画识别处理,确定每个所述笔画数据的笔画置信度,所述笔画置信度为所述手写汉字轨迹中的所述笔画数据被识别为所述标准汉字中相应顺位的标准笔画标识的概率;
根据所述识别置信度和所述笔画置信度确定所述手写汉字轨迹的评价结果,所述评价结果与所述识别置信度和所述笔画置信度之间均为正相关关系。
第二方面,本发明实施例还提供了一种手写汉字的评价装置,包括:
获取模块,用于获取待识别的手写汉字轨迹,所述手写汉字轨迹包括一个笔画数据或多个有序的笔画数据;
文字识别模块,用于对所述手写汉字轨迹进行文字识别处理,确定所述手写汉字轨迹的识别置信度,所述识别置信度为所述手写汉字轨迹被识别为预设的标准汉字的概率;
笔画识别模块,用于对所述手写汉字轨迹进行笔画识别处理,确定每个所述笔画数据的笔画置信度,所述笔画置信度为所述手写汉字轨迹中的所述笔画数据被识别为所述标准汉字中相应顺位的标准笔画标识的概率;
评价模块,用于根据所述识别置信度和所述笔画置信度确定所述手写汉字轨迹的评价结果,所述评价结果与所述识别置信度和所述笔画置信度之间均为正相关关系。
第三方面,本发明实施例提供了一种电子设备,包括总线、收发器、存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述收发器、所述存储器和所述处理器通过所述总线相连,所述计算机程序被所述处理器执行时实现上述任意一项所述的手写汉字的评价方法中的步骤。
第四方面,本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任意一项所述的手写汉字的评价方法中的步骤。
本发明实施例提供的手写汉字的评价方法、装置、电子设备及计算机可读存储介质,通过对手写汉字轨迹分别进行文字识别处理和笔画识别处理,实现对手写汉字轨迹的整体识别、以及其中每个笔画的识别,通过引入笔画识别处理,可以确定手写汉字轨迹中的笔画以及笔画顺序是否正确,从而能够更加全面、准确地对用户的手写汉字进行评价;以笔画标识作为识别过程中的参数来进行笔画识别,识别过程简单,处理量小,能够提高处理效率。
附图说明
为了更清楚地说明本发明实施例或背景技术中的技术方案,下面将对本发明实施例或背景技术中所需要使用的附图进行说明。
图1示出了本发明实施例所提供的一种手写汉字的评价方法的流程图;
图2示出了本发明实施例所提供的一种手写汉字的评价装置的结构示意图;
图3示出了本发明实施例所提供的一种用于执行手写汉字的评价方法的电子设备的结构示意图。
具体实施方式
在本发明实施例的描述中,所属技术领域的技术人员应当知道,本发明实施例可以实现为方法、装置、电子设备及计算机可读存储介质。因此,本发明实施例可以具体实现为以下形式:完全的硬件、完全的软件(包括固件、驻留软件、微代码等)、硬件和软件结合的形式。此外,在一些实施例中,本发明实施例还可以实现为在一个或多个计算机可读存储介质中的计算机程序产品的形式,该计算机可读存储介质中包含计算机程序代码。
上述计算机可读存储介质可以采用一个或多个计算机可读存储介质的任意组合。计算机可读存储介质包括:电、磁、光、电磁、红外或半导体的***、装置或器件,或者以上任意的组合。计算机可读存储介质更具体的例子包括:便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM)、闪存(Flash Memory)、光纤、光盘只读存储器(CD-ROM)、光存储器件、磁存储器件或以上任意组合。在本发明实施例中,计算机可读存储介质可以是任意包含或存储程序的有形介质,该程序可以被指令执行***、装置、器件使用或与其结合使用。
上述计算机可读存储介质包含的计算机程序代码可以用任意适当的介质传输,包括:无线、电线、光缆、射频(Radio Frequency,RF)或者以上任意合适的组合。
可以以汇编指令、指令集架构(ISA)指令、机器指令、机器相关指令、微代码、固件指令、状态设置数据、集成电路配置数据或以一种或多种程序设计语言或其组合来编写用于执行本发明实施例操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言,例如:Java、Smalltalk、C++,还包括常规的过程式程序设计语言,例如:C语言或类似的程序设计语言。计算机程序代码可以完全的在用户计算机上执行、部分的在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行以及完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络,包括:局域网(LAN)或广域网(WAN),可以连接到用户计算机,也可以连接到外部计算机。
本发明实施例通过流程图和/或方框图描述所提供的方法、装置、电子设备。
应当理解,流程图和/或方框图的每个方框以及流程图和/或方框图中各方框的组合,都可以由计算机可读程序指令实现。这些计算机可读程序指令可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器,从而生产出一种机器,这些计算机可读程序指令通过计算机或其他可编程数据处理装置执行,产生了实现流程图和/或方框图中的方框规定的功能/操作的装置。
也可以将这些计算机可读程序指令存储在能使得计算机或其他可编程数据处理装置以特定方式工作的计算机可读存储介质中。这样,存储在计算机可读存储介质中的指令就产生出一个包括实现流程图和/或方框图中的方框规定的功能/操作的指令装置产品。
也可以将计算机可读程序指令加载到计算机、其他可编程数据处理装置或其他设备上,使得在计算机、其他可编程数据处理装置或其他设备上执行一系列操作步骤,以产生计算机实现的过程,从而使得在计算机或其他可编程数据处理装置上执行的指令能够提供实现流程图和/或方框图中的方框规定的功能/操作的过程。
下面结合本发明实施例中的附图对本发明实施例进行描述。
图1示出了本发明实施例所提供的一种手写汉字的评价方法的流程图。如图1所示,该方法包括:
步骤101:获取待识别的手写汉字轨迹,手写汉字轨迹包括一个笔画数据或多个有序的笔画数据。
本发明实施例中,手写汉字轨迹为用户(如学生等)输入的待识别的文字,该手写汉字轨迹包含一个或多个笔画,每个笔画对应相应的笔画数据。例如,用户输入的为汉字“中”,其包含四个笔画“竖”、“横折”、“横”、“竖”,每个笔画对应一个笔画数据。同时,由于每个文字一般具有相应的书写顺序,即其笔画是具有标准顺序的,在手写汉字轨迹包含多个笔画时,需要有序确定每个笔画的笔画数据,即此时该手写汉字轨迹包含多个有序的笔画数据。具体地,该手写汉字轨迹可以是用户基于客户端实时上传的轨迹,用户通过操作该客户端实时依次输入相应的笔画,并最终形成需要识别的汉字轨迹。例如,该客户端为具有触摸屏的电子设备,用户通过滑动操作来输入相应的笔画,进而可以输入完整的手写汉字轨迹。
可选地,用户输入的笔画本质上是多个坐标点(像素点)的集合,若直接对用户输入的笔画进行处理,会导致处理量过大的问题。本实施例中通过采样的方式来避免该问题,具体地,上述步骤101中“获取待识别的手写汉字轨迹”包括:
步骤A1:确定用户输入的汉字轨迹中每个笔画所对应的原始数据。
步骤A2:对原始数据进行降采样,提取原始数据中的多个采样点,根据原始数据中的多个采样点生成相应的笔画数据。
本发明实施例中,该原始数据为用户输入的完整的数据,其包含该笔画所对应的所有坐标点,本实施例中通过对原始数据进行降采样处理,可以从原始数据中提取出部分采样点,将该部分采样点作为后续处理的笔画数据。本实施例中通过降采样方式生成笔画数据,可以在保证后续笔画识别准确率的前提下,降低处理量,减小计算时间。
其中,上述步骤A2“对原始数据进行降采样,提取原始数据中的多个采样点”具体可以包括:对原始数据中的坐标点按照均匀间隔的方式进行采样,提取出预设数量的采样点。具体地,由于笔画的原始数据为用户实时输入的,该原始数据中的每个坐标点具有相应的时间属性,基于坐标点的时间属性进行均匀间隔采样,以提取出所需的采样点;可选地,可以首先提取出该原始数据所对应的笔画骨架(具体可对该原始数据进行腐蚀处理等,来提取相应的笔画骨架),之后对该笔画骨架进行均匀间隔采样,提取出预设数量的采样点。此外,若所提取出的采样点数量小于该预设数量,则可以进行补齐处理。本实施例中,每个笔画数据均包含相同数量的采样点,即均包含预设数量的采样点,使得后续处理过程具有一致性,方便后续处理,例如方便后续基于笔画识别模型进行笔画识别处理。若需要补齐处理时,可以在已提取出的采样点的首尾位置分别添加相应数量的坐标点,以保证该笔画数据具有预设数量的采样点。例如,预设数量为80,当前笔画的原始数据中只能提取出74个采样点,此时需要在首尾位置分别补充坐标点,例如分别补充三个坐标点[0,0],最终生成的笔画数据可以为:{[0,0],[0,0],[0,0],[68.65,7.91],.......,[66.86,98.95],[66.56,99.99],[0,0],[0,0],[0,0]}。
步骤102:对手写汉字轨迹进行文字识别处理,确定手写汉字轨迹的识别置信度,识别置信度为手写汉字轨迹被识别为预设的标准汉字的概率。
本发明实施例中,该手写汉字轨迹为用户基于预设的标准汉字所输入的轨迹,例如,若当前需要考核用户是否能够正确书写汉字A,则可以将汉字A作为标准汉字,并指示该用户手写汉字A,用户通过手写该汉字A即可形成相应的手写汉字轨迹。本实施例中,可以预先设置文字识别模型,基于该文字识别模型对手写汉字轨迹进行文字识别处理,从而可以确定该手写汉字轨迹被识别为相应的标准汉字的概率,即识别置信度,该识别置信度越高,说明用户输入的手写汉字轨迹与该标准汉字越相似,越说明该用户手写汉字正确。
可选地,由于不同用户手写的汉字轨迹大小不一,本实施例中可以先对该手写汉字轨迹进行归一化处理,即对手写汉字轨迹中的坐标点的坐标进行归一化处理,以方便将该手写汉字轨迹映射在预设大小的范围内,如将手写汉字轨迹映射在64×64大小的二值图像内,之后基于该文字识别模型进行文字识别即可。其中,该文字识别模型可以采用现有的成熟模型,如基于图像识别所实现的模型等,本实施例对此不做详述。
此外,基于文字识别模型进行文字识别处理的过程,本质上即为确定该手写汉字轨迹被识别为每个汉字的概率,一般将概率最高所对应的汉字作为基于该手写汉字轨迹所识别出的汉字。本实施例中,由于该概率可以表示的是手写汉字轨迹与相应标准汉字之间的相似度,在识别置信度(即概率)大于预设阈值时,说明手写汉字轨迹与标准汉字相似,此时可以确定手写汉字轨迹与标准汉字相匹配。可选地,也可以在识别置信度最大、且识别置信度大于预设阈值时,确定手写汉字轨迹与标准汉字相匹配。
步骤103:对手写汉字轨迹进行笔画识别处理,确定每个笔画数据的笔画置信度,笔画置信度为手写汉字轨迹中的笔画数据被识别为标准汉字中相应顺位的标准笔画标识的概率。
本发明实施例中,预先设置用于进行笔画识别的模型,即笔画识别模型,该笔画识别模型用于确定输入的笔画数据被识别为相应笔画标识的概率。在确定手写汉字轨迹之后,将该手写汉字轨迹输入至笔画识别模型中,即可确定该手写汉字轨迹的每个笔画数据被识别为某个笔画标识的概率;该识别概率越高,说明该笔画数据越可能对应相应的笔画标识。本实施例中,由于与手写汉字轨迹进行比较的对象是预先确定的,即预先确定了标准汉字,故此时只需要确定该手写汉字轨迹中的笔画数据被识别为标准汉字中相应顺位的标准笔画标识的概率即可。
同时,本实施例中进行笔画识别处理时,以笔画标识作为识别过程中的参数,即判断该笔画数据是否能够被识别为标准笔画标识,或者该笔画数据被识别为该标准笔画标识的概率。具体地,可以将笔画数据所对应的笔画标识与该标准笔画标识进行对比,以实现笔画识别处理。而传统的笔画识别方案中,一般需要搜集大量的静态示例图像,并获取标准笔划的标准方向和标准拐点的个数等前提文件,需要保存大量数据,同时导致匹配时处理量大,大量的数据保存与匹配检索会对笔画识别任务造成时间上的延迟。本实施例中以笔画标识作为识别过程中的参数来进行笔画识别,识别过程简单,处理量小,能够提高处理效率。
步骤104:根据识别置信度和笔画置信度确定手写汉字轨迹的评价结果,评价结果与识别置信度和笔画置信度之间均为正相关关系。
本发明实施例中,该识别置信度能够表示手写汉字轨迹被识别为标准汉字的概率,识别置信度越高,说明该手写汉字轨迹与标准汉字越接近,用户手写的汉字越标准,相应的评价结果越好,即评价结果与识别置信度之间为正相关关系。同样地,笔画置信度能够表示该笔画数据被识别为相应的标准笔画标识的概率,该笔画置信度越高,说明该笔画数据所对应的笔画与该标准笔画标识越匹配,用户手写的笔画越标准,相应的评价结果也越好,即评价结果与该笔画置信度之间也为正相关关系。
其中,由于手写汉字轨迹可以包含多个笔画数据,此时可以确定每个笔画数据的笔画置信度,基于一个或多个笔画置信度来直接确定评价结果;或者,也可以基于多个笔画数据的笔画置信度确定该手写汉字轨迹的整体笔画置信度,之后基于该整体笔画置信度来生成评价结果。
本发明实施例提供的一种手写汉字的评价方法,通过对手写汉字轨迹分别进行文字识别处理和笔画识别处理,实现对手写汉字轨迹的整体识别、以及其中每个笔画的识别,通过引入笔画识别处理,可以确定手写汉字轨迹中的笔画以及笔画顺序是否正确,从而能够更加全面、准确地对用户的手写汉字进行评价;以笔画标识作为识别过程中的参数来进行笔画识别,识别过程简单,处理量小,能够提高处理效率。
在上述实施例的基础上,上述步骤103“对手写汉字轨迹进行笔画识别处理,确定每个笔画数据的笔画置信度”具体包括:
步骤B1:根据预设的笔画识别模型,确定每个笔画数据被识别为标准汉字中相应顺位的标准笔画标识的识别置信度。
步骤B2:确定笔画数据被识别为相应笔画标识的概率,并将概率最高的前n个笔画标识作为笔画数据的有效笔画标识。
本发明实施例中,该笔画识别模型可以包含卷积神经网络(CNN,ConvolutionalNeural Networks)和全连接层。具体地,可以预先建立包含CNN和全连接层的笔画识别模型,之后基于预先设置的训练样本对该笔画识别模型进行训练,即可确定该笔画识别模型中的参数,从而得到训练好的笔画识别模型,之后基于训练好的笔画识别模型即可执行上述步骤B1和步骤B2。其中,CNN用于提取输入至该笔画识别模型的笔画数据中的笔画特征,全连接层用于根据笔画特征确定笔画数据被识别为相应笔画标识的概率,即该全连接层可以对笔画数据进行分类,进而确定概率最高的前n个有效笔画标识。同样的,标准笔画标识也是一种笔画标识,基于该笔画识别模型可以定向确定笔画数据被识别为标准汉字中相应顺位的标准笔画标识的概率,即识别置信度。该方法通过CNN分类的方式实现汉字笔画的轨迹识别,去掉了一些因旋转、长短、倾斜导致匹配不成功的因素,能够、提高笔画识别的准确率。可选地,可以在概率大于预设的概率阈值的笔画标识中选取有效笔画标识,以避免将识别概率较小的笔画标识误当作有效笔画标识。
本实例中,为了避免增加过多的处理量,步骤B2中不可以确定过多的有效笔画标识。例如,可以将识别概率最高的前三个笔画标识作为有效笔画标识,即n=3。例如,若手写汉字轨迹包含三个笔画数据A、B、C,且基于笔画识别模型确定三个笔画数据A、B、C的前三个最高识别概率、以及相应的笔画标识,其结果分别如下:
['_横撇/横钩','_撇','_横折钩'],[[9.9498415e-01 3.3675274e-035.1890750e-04];
['_点','_捺','_撇'],[4.6045738e-01 3.1391850e-01 5.5738050e-02];
['_竖','_撇','_横'],[5.3669679e-01 2.2616713e-01 3.3689443e-02]。
相应地,三个笔画数据A、B、C的有效笔画标识分别为['_横撇/横钩','_撇','_横折钩'],['_点','_捺','_撇'],['_竖','_撇','_横']。
可选地,在上述步骤B2“将概率最高的前n个笔画标识作为笔画数据的有效笔画标识”之后,该方法还包括:根据预设的相似关系确定与当前的有效笔画标识相似的其他笔画标识,并将其他笔画标识也作为笔画数据的有效笔画标识。
本实施例中,由于不同的笔画的轨迹可能是相似的,例如“捺”与“点”的轨迹相似,用户人工手写时可能难以进行区分,本实施例中预先设置笔画之间的相似关系,该相似关系用于表示某个笔画与哪些其他的笔画相似,该相似关系具体可以是:{'_横撇/横钩':['_横折'],'_横折':['_横撇/横钩'],'_横折钩':['_横折'],'_竖折/竖弯':['_撇折'],'_提':['_横'],'_横':['_提'],'_捺':['_点'],'_点':['_竖','_捺'],'_竖':['_点','_撇'],'_撇':['_竖'],};其中,'A'表示笔画标识A,'A':['B']表示与笔画标识A相似的笔画标识包括笔画标识B。
在上述步骤B2中基于识别概率确定n个有效笔画标识之后,继续基于该相似关系确定与当前的有效笔画标识相似的其他笔画标识,并将此时确定的其他笔画标识也作为有效笔画标识,以对有效笔画标识进行补充。例如,基于笔画识别模型确定笔画数据A的前三个概率最高的笔画标识分别为笔画标识a、b、c,则此时可以确定该笔画数据A对应三个有效笔画标识a、b、c;同时,若笔画标识a与笔画标识a1相似,即二者之间具有相似关系,此时也可以将笔画标识a1作为该笔画数据A的一个有效笔画标识,该笔画数据A的有效笔画标识共有a、a1、b、c。本实施例中通过相似关系对有效笔画标识进行补充,可以更加完整地确定笔画数据的有效笔画标识,避免笔画识别模型遗漏。
骤B3:在笔画数据中的一个有效笔画标识与标准汉字中相应顺位的标准笔画标识相一致时,确定笔画数据与标准笔画标识相匹配。
本发明实施例中,一个手写汉字轨迹中可以包含多个笔画数据,每个笔画数据对应多个有效笔画标识。同时,本实施例中预先设置每种笔画的标准标识,即标准笔画标识;若笔画数据中的一个有效笔画标识与某个标准笔画标识相一致,此时可以认为该笔画数据与该标准笔画标识相匹配,即可以认为该笔画数据所对应的笔画与该标准笔画标识对应的标准笔画是一致的,即二者相匹配,从而基于笔画标识实现笔画识别处理。例如,用户输入的手写汉字轨迹中,某个笔画A为一个竖,且下端向左倾斜,在提取出该笔画A的笔画数据a之后,基于笔画识别模型确定该笔画数据a的有效笔画标识为['_竖','_撇','_横'],即该笔画A可能是“竖”,也可能是“撇”或“横”;若需要对比的标准笔画标识①为'_竖',则该笔画数据a中存在一个有效笔画标识'_竖'与该标准笔画标识①相同,该笔画数据a与该标准笔画标识①相匹配,同时也可以确定该笔画数据a所对应的笔画为“竖”。
此外可选地,上述步骤103“对手写汉字轨迹进行笔画识别处理,确定每个笔画数据的笔画置信度”还包括:
步骤B4:在手写汉字轨迹的所有笔画数据分别与标准汉字的标准笔画标识依次匹配时,确定手写汉字轨迹的笔画数据与标准汉字的标准笔画标识整体相匹配。
本发明实施例中,此外,标准汉字为预先设置好的已知的汉字,每个标准汉字也会包含一个或多个笔画,每个笔画具有确定的笔画标识,即标准笔画标识,因此可以确定每个标准汉字所包含的所有标准笔画标识,且按照书写顺序可以设置标准笔画标识的顺位。基于上述的步骤B3,若手写汉字轨迹的所有笔画数据分别与该标准汉字的标准笔画标识相匹配,则说明该手写汉字轨迹的笔画与标准汉字的笔画具有相同的书写顺序,且每个笔画也依次相同,此时即可认为该手写汉字轨迹的笔画与该标准汉字的笔画相匹配,即用户输入该手写汉字轨迹时采用了正确的笔画以及顺序。例如,用户输入了某个手写汉字轨迹,该手写汉字轨迹的笔画与标准汉字汉字“中”的笔画相匹配,则可以确定用户输入的笔画是汉字“中”的笔画。
在上述实施例的基础上,为了更全面地对手写汉字轨迹进行评价,上述步骤104“根据识别置信度和笔画置信度确定手写汉字轨迹的评价结果”包括步骤C1-C2:
步骤C1:确定手写汉字轨迹的形态参数,形态参数包括轨迹重心偏移量、笔画位置偏移量、轨迹越界像素占比中的一项或多项;轨迹重心偏移量为手写汉字轨迹的重心位置与标准汉字的重心位置之间的位置差值,笔画位置偏移量为笔画数据的所在位置与相应的标准笔画标识所对应的标准笔画的所在位置之间的位置差值,轨迹越界像素占比为手写汉字轨迹中超出预设手写范围的像素与手写汉字轨迹总像素之间的比值。
本发明实施例中,可以确定手写汉字轨迹的重心位置和标准汉字的重心位置,进而确定二者之间的位置差值,该位置差值即为轨迹重心偏移量。其中,由于手写汉字轨迹或标准汉字都可以看作包含多个坐标点(像素点),可以将所有坐标点的坐标平均值作为相应的重心位置,也可采用其他方式确定重心位置,本实施例对此不做限定。同时,也可以确定笔画数据的所在位置和相应标准笔画的所在位置,进而可以确定二者之间的位置差值,即笔画位置偏移量。其中,笔画数据或标准笔画的所在位置可以由一个坐标点表示(如以重心位置表示),或者以多个坐标点表示,如以起点、拐点、终点等的位置表示,具体可基于实际情况而定。此外,标准汉字一般会预先设置手写范围,例如一般汉字需要位于标准的田字格内,若手写汉字轨迹超出该手写范围,则说明用户输入的手写汉字不规范,本实施例中基于手写汉字轨迹中超出预设手写范围的像素与手写汉字轨迹总像素之间的比值来确定轨迹越界像素占比。
步骤C2:根据形态参数、识别置信度和笔画置信度确定手写汉字轨迹的评价结果,该评价结果与形态参数之间为负相关关系。
本实施例中,在确定形态参数、识别置信度和笔画置信度之后,即可进一步确定该手写汉字轨迹的评价结果。其中,形态参数中的轨迹重心偏移量用于表示手写汉字轨迹的重心位置偏移程度,该轨迹重心偏移量越大,说明用户手写的汉字越不标准,评价结果越低,即评价结果与该轨迹重心偏移量之间为负相关关系;类似的,笔画位置偏移量表示相应笔画的偏移程度,笔画位置偏移量越大,也说明用户手写的汉字越不标准,评价结果越低,即评价结果与该笔画位置偏移量之间为负相关关系;轨迹越界像素占比也可以表示用户手写汉字是否标准,若该轨迹越界像素占比越大,说明手写汉字轨迹中有较多部分位于规定的范围之外,该手写汉字轨迹越不标准,评价结果越低,评价结果与该轨迹越界像素占比之间也为负相关关系。因此,评价结果与形态参数之间整体上均为负相关关系。
此外,由于一个汉字可能具有多个笔画,相应的对应多个笔画置信度,本实施例中也可以基于多个笔画置信度来确定汉字整体上的笔画置信度,基于该整体上的笔画置信度生成评价结果。此外,可以为形态参数、识别置信度、笔画置信度(或整体上的笔画置信度)预先设置相应的权重来确定评价结果。
可选地,上述步骤C2“根据形态参数、识别置信度和笔画置信度确定手写汉字轨迹的评价结果”包括步骤C21-C23:
步骤C21:根据形态参数、识别置信度和笔画置信度生成手写汉字轨迹的评分值,评分值与形态参数之间为负相关关系,评分值与识别置信度和笔画置信度之间均为正相关关系。
本实施例中,可以基于形态参数、识别置信度和笔画置信度生成一个中间值,即评分值,之后基于该评分值再得到最终的评价结果。具体地,在生成该评分值时,也可以为形态参数、识别置信度、笔画置信度设置相应的权重。例如,形态参数包括轨迹重心偏移量、笔画位置偏移量和轨迹越界像素占比,可以为轨迹重心偏移量、笔画位置偏移量、轨迹越界像素占比识别置信度、整体的笔画置信度分别设置权重:0.3、0.1、0.1、0.3、0.2,之后通过加权的方式即可得到评分值。该评分值能够客观、定量且准确地评价用户手写汉字轨迹是否标准。
步骤C22:确定手写汉字轨迹的文字识别结果和笔画识别结果,文字识别结果用于表示手写汉字轨迹与标准汉字是否相匹配,笔画识别结果用于表示手写汉字轨迹的笔画数据是否与标准汉字的标准笔画标识相匹配。
本发明实施例中,在对手写汉字轨迹进行文字识别处理时,可以确定识别置信度,同时也可以生成文字识别结果,即该手写汉字轨迹与标准汉字是否相匹配;如上述实施例所述,可以在识别置信度大于预设阈值时,确定手写汉字轨迹与标准汉字相匹配。同样的,在进行笔画识别处理时,除了可以确定笔画置信度之外,也可以确定笔画识别结果,即手写汉字轨迹中的笔画数据与标准汉字的标准笔画标识是否相匹配。可选地,可以在笔画置信度大于相应的阈值时确定其与标注汉字中相应顺位的标准笔画标识相匹配;或者,也可以基于上述步骤B3来确定笔画数据与相应的标准笔画标识是否相匹配。
步骤C23:根据评分值、文字识别结果和笔画识别结果确定手写汉字轨迹的评价结果。
本发明实施例中,上述的评分值能够表示手写汉字轨迹是否标准,即该评分值能够表示用户的手写汉字轨迹与标准汉字的轨迹是否相似,但是,由于汉字中存在形状相似但语义完全不同的文字,如“王”与“玉”、“住”与“往”等,仅仅通过评分值有时还不足以进行准确评价,本实施例中通过引入文字识别结果和笔画识别结果,综合评分值、文字识别结果和笔画识别结果来确定评价结果,使得最终确定的评价结果能够更加准确。本领域技术人员可以理解,正向的文字识别结果对应更高的评价结果,即手写汉字轨迹与标准汉字相匹配时、比手写汉字轨迹与标准汉字不相匹配时具有更高的评价结果。
例如,可以预先为评分值、文字识别结果和笔画识别结果分配相应的权重,如0.2、0.6、0.2。若文字识别结果为识别错误,即手写汉字轨迹与标准汉字不相匹配,此时该文字识别结果所对应的值可以设为最低值,如0;相反的,若文字识别结果为识别正确,即手写汉字轨迹与标准汉字相匹配,此时该文字识别结果所对应的值可以设为最高值,如1。笔画识别结果与该文字识别结果类似,此处不做赘述,在确定评分值、文字识别结果、笔画识别结果所对应的值之后,通过加权的方式即可确定最终的评价结果。
需要说明的是,本实施例中的A与B为正相关关系,指的是A与B之间可以为绝对的正相关关系,即B的任何变化均可以引起A的相应变化;或者,也可以指A与B之间为阶梯式的正相关关系,即B在某个范围内变动时,A不会发生变化,当B的变动超过预设范围时,A才会随B发生变化。例如,评分值与识别置信度之间为正相关关系,若二者之间为绝对的正相关关系,识别置信度的轻微变化即可导致评分值改变。若二者之间为阶梯式的正相关关系,则可以预先设置识别置信度的多个区间范围,并确定每个区间范围所对应的评分值(或调整系数);例如,识别置信度在0.99-1.0、0.975-0.99、0.95-0.975、0.90-0.95、0-0.90时,其对应的调整系数分别为1.0、0.8、0.6、0.4、0.2,基于该调整系数来调整识别置信度所对应的评分值分量,进而结合其他分量最终确定评分值。
本发明实施例提供的一种手写汉字的评价方法,通过对手写汉字轨迹分别进行文字识别处理和笔画识别处理,实现对手写汉字轨迹的整体识别、以及其中每个笔画的识别,通过引入笔画识别处理,可以确定手写汉字轨迹中的笔画以及笔画顺序是否正确,从而能够更加全面、准确地对用户的手写汉字进行评价;以笔画标识作为识别过程中的参数来进行笔画识别,识别过程简单,处理量小,能够提高处理效率。笔画识别过程不需要预先设置同一个汉字或笔画的多种静态示例图像,也不需要以图像本身作为比较的对象,极大地减小了处理量,且可以降低因旋转、长短、倾斜等因素导致匹配不成功的可能性,提高了笔画识别的准确率。通过相似关系对有效笔画标识进行补充,可以更加完整地确定笔画数据的有效笔画标识,避免笔画识别模型遗漏。综合评分值、文字识别结果和笔画识别结果来确定评价结果,使得最终确定的评价结果能够更加准确。
上文详细描述了本发明实施例提供的手写汉字的评价方法,该方法也可以通过相应的装置实现,下面将结合图2详细描述本发明实施例提供的手写汉字的评价装置。
图2示出了本发明实施例所提供的一种手写汉字的评价装置的结构示意图。如图2所示,该手写汉字的评价装置包括:
获取模块21,用于获取待识别的手写汉字轨迹,所述手写汉字轨迹包括一个笔画数据或多个有序的笔画数据;
文字识别模块22,用于对所述手写汉字轨迹进行文字识别处理,确定所述手写汉字轨迹的识别置信度,所述识别置信度为所述手写汉字轨迹被识别为预设的标准汉字的概率;
笔画识别模块23,用于对所述手写汉字轨迹进行笔画识别处理,确定每个所述笔画数据的笔画置信度,所述笔画置信度为所述手写汉字轨迹中的所述笔画数据被识别为所述标准汉字中相应顺位的标准笔画标识的概率;
评价模块24,用于根据所述识别置信度和多个所述笔画置信度确定所述手写汉字轨迹的评价结果,所述评价结果与所述识别置信度和所述笔画置信度之间均为正相关关系。
在上述实施例的基础上,所述评价模块24包括:
参数确定单元,用于确定所述手写汉字轨迹的形态参数,所述形态参数包括轨迹重心偏移量、笔画位置偏移量、轨迹越界像素占比中的一项或多项;所述轨迹重心偏移量为所述手写汉字轨迹的重心位置与所述标准汉字的重心位置之间的位置差值,所述笔画位置偏移量为所述笔画数据的所在位置与相应的标准笔画标识所对应的标准笔画的所在位置之间的位置差值,所述轨迹越界像素占比为所述手写汉字轨迹中超出预设手写范围的像素与所述手写汉字轨迹总像素之间的比值;
评价单元,用于根据所述形态参数、所述识别置信度和多个所述笔画置信度确定所述手写汉字轨迹的评价结果,所述评价结果与所述形态参数之间为负相关关系。
在上述实施例的基础上,所述评价单元根据所述形态参数、所述识别置信度和多个所述笔画置信度确定所述手写汉字轨迹的评价结果,包括:
根据所述形态参数、所述识别置信度和多个所述笔画置信度生成所述手写汉字轨迹的评分值,所述评分值与所述形态参数之间为负相关关系,所述评分值与所述识别置信度和所述笔画置信度之间均为正相关关系;
确定所述手写汉字轨迹的文字识别结果和笔画识别结果,所述文字识别结果用于表示所述手写汉字轨迹与所述标准汉字是否相匹配,所述笔画识别结果用于表示所述手写汉字轨迹的笔画数据是否与所述标准汉字的标准笔画标识相匹配;
根据所述评分值、所述文字识别结果和所述笔画识别结果确定所述手写汉字轨迹的评价结果。
在上述实施例的基础上,所述文字识别模块22对所述手写汉字轨迹进行文字识别处理,确定所述手写汉字轨迹的识别置信度,包括:
根据预设的文字识别模型,对所述手写汉字轨迹进行文字识别处理,确定所述手写汉字轨迹被识别为预设的标准汉字的识别置信度;
在所述识别置信度大于预设阈值时,确定所述手写汉字轨迹与所述标准汉字相匹配。
在上述实施例的基础上,所述笔画识别模块23对所述手写汉字轨迹进行笔画识别处理,确定每个所述笔画数据的笔画置信度,包括:
根据预设的笔画识别模型,确定每个所述笔画数据被识别为所述标准汉字中相应顺位的标准笔画标识的识别置信度;
确定所述笔画数据被识别为相应笔画标识的概率,并将概率最高的前n个笔画标识作为所述笔画数据的有效笔画标识;
在所述笔画数据中的一个有效笔画标识与所述标准汉字中相应顺位的标准笔画标识相一致时,确定所述笔画数据与所述标准笔画标识相匹配。
在上述实施例的基础上,所述笔画识别模块23在将概率最高的前n个笔画标识作为所述笔画数据的有效笔画标识之后,还用于:
根据预设的相似关系确定与当前的所述有效笔画标识相似的其他笔画标识,并将所述其他笔画标识也作为所述笔画数据的有效笔画标识。
在上述实施例的基础上,所述笔画识别模块23对所述手写汉字轨迹进行笔画识别处理,确定每个所述笔画数据的笔画置信度,还包括:
在所述手写汉字轨迹的所有所述笔画数据分别与所述标准汉字的标准笔画标识依次匹配时,确定所述手写汉字轨迹的笔画数据与所述标准汉字的标准笔画标识整体相匹配。
本发明实施例提供的一种手写汉字的评价装置,通过对手写汉字轨迹分别进行文字识别处理和笔画识别处理,实现对手写汉字轨迹的整体识别、以及其中每个笔画的识别,通过引入笔画识别处理,可以确定手写汉字轨迹中的笔画以及笔画顺序是否正确,从而能够更加全面、准确地对用户的手写汉字进行评价;以笔画标识作为识别过程中的参数来进行笔画识别,识别过程简单,处理量小,能够提高处理效率。笔画识别过程不需要预先设置同一个汉字或笔画的多种静态示例图像,也不需要以图像本身作为比较的对象,极大地减小了处理量,且可以降低因旋转、长短、倾斜等因素导致匹配不成功的可能性,提高了笔画识别的准确率。通过相似关系对有效笔画标识进行补充,可以更加完整地确定笔画数据的有效笔画标识,避免笔画识别模型遗漏。综合评分值、文字识别结果和笔画识别结果来确定评价结果,使得最终确定的评价结果能够更加准确。
此外,本发明实施例还提供了一种电子设备,包括总线、收发器、存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,该收发器、该存储器和处理器分别通过总线相连,计算机程序被处理器执行时实现上述手写汉字的评价方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
具体的,参见图3所示,本发明实施例还提供了一种电子设备,该电子设备包括总线1110、处理器1120、收发器1130、总线接口1140、存储器1150和用户接口1160。
在本发明实施例中,该电子设备还包括:存储在存储器1150上并可在处理器1120上运行的计算机程序,计算机程序被处理器1120执行时实现上述手写汉字的评价方法实施例的各个过程。
收发器1130,用于在处理器1120的控制下接收和发送数据。
本发明实施例中,总线架构(用总线1110来代表),总线1110可以包括任意数量互联的总线和桥,总线1110将包括由处理器1120代表的一个或多个处理器与存储器1150代表的存储器的各种电路连接在一起。
总线1110表示若干类型的总线结构中的任何一种总线结构中的一个或多个,包括存储器总线以及存储器控制器、***总线、加速图形端口(Accelerate Graphical Port,AGP)、处理器或使用各种总线体系结构中的任意总线结构的局域总线。作为示例而非限制,这样的体系结构包括:工业标准体系结构(Industry Standard Architecture,ISA)总线、微通道体系结构(Micro Channel Architecture,MCA)总线、扩展ISA(Enhanced ISA,EISA)总线、视频电子标准协会(Video Electronics Standards Association,VESA)、***部件互连(Peripheral Component Interconnect,PCI)总线。
处理器1120可以是一种集成电路芯片,具有信号处理能力。在实现过程中,上述方法实施例的各步骤可以通过处理器中硬件的集成逻辑电路或软件形式的指令完成。上述的处理器包括:通用处理器、中央处理器(Central Processing Unit,CPU)、网络处理器(Network Processor,NP)、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(FieldProgrammable Gate Array,FPGA)、复杂可编程逻辑器件(Complex Programmable LogicDevice,CPLD)、可编程逻辑阵列(Programmable Logic Array,PLA)、微控制单元(Microcontroller Unit,MCU)或其他可编程逻辑器件、分立门、晶体管逻辑器件、分立硬件组件。可以实现或执行本发明实施例中公开的各方法、步骤及逻辑框图。例如,处理器可以是单核处理器或多核处理器,处理器可以集成于单颗芯片或位于多颗不同的芯片。
处理器1120可以是微处理器或任何常规的处理器。结合本发明实施例所公开的方法步骤可以直接由硬件译码处理器执行完成,或者由译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存取存储器(Random Access Memory,RAM)、闪存(FlashMemory)、只读存储器(Read-Only Memory,ROM)、可编程只读存储器(Programmable ROM,PROM)、可擦除可编程只读存储器(Erasable PROM,EPROM)、寄存器等本领域公知的可读存储介质中。所述可读存储介质位于存储器中,处理器读取存储器中的信息,结合其硬件完成上述方法的步骤。
总线1110还可以将,例如***设备、稳压器或功率管理电路等各种其他电路连接在一起,总线接口1140在总线1110和收发器1130之间提供接口,这些都是本领域所公知的。因此,本发明实施例不再对其进行进一步描述。
收发器1130可以是一个元件,也可以是多个元件,例如多个接收器和发送器,提供用于在传输介质上与各种其他装置通信的单元。例如:收发器1130从其他设备接收外部数据,收发器1130用于将处理器1120处理后的数据发送给其他设备。取决于计算机***的性质,还可以提供用户接口1160,例如:触摸屏、物理键盘、显示器、鼠标、扬声器、麦克风、轨迹球、操纵杆、触控笔。
应理解,在本发明实施例中,存储器1150可进一步包括相对于处理器1120远程设置的存储器,这些远程设置的存储器可以通过网络连接至服务器。上述网络的一个或多个部分可以是自组织网络(ad hoc network)、内联网(intranet)、外联网(extranet)、虚拟专用网(VPN)、局域网(LAN)、无线局域网(WLAN)、广域网(WAN)、无线广域网(WWAN)、城域网(MAN)、互联网(Internet)、公共交换电话网(PSTN)、普通老式电话业务网(POTS)、蜂窝电话网、无线网络、无线保真(Wi-Fi)网络以及两个或更多个上述网络的组合。例如,蜂窝电话网和无线网络可以是全球移动通信(GSM)***、码分多址(CDMA)***、全球微波互联接入(WiMAX)***、通用分组无线业务(GPRS)***、宽带码分多址(WCDMA)***、长期演进(LTE)***、LTE频分双工(FDD)***、LTE时分双工(TDD)***、先进长期演进(LTE-A)***、通用移动通信(UMTS)***、增强移动宽带(Enhance Mobile Broadband,eMBB)***、海量机器类通信(massive Machine Type of Communication,mMTC)***、超可靠低时延通信(UltraReliable Low Latency Communications,uRLLC)***等。
应理解,本发明实施例中的存储器1150可以是易失性存储器或非易失性存储器,或可包括易失性存储器和非易失性存储器两者。其中,非易失性存储器包括:只读存储器(Read-Only Memory,ROM)、可编程只读存储器(Programmable ROM,PROM)、可擦除可编程只读存储器(Erasable PROM,EPROM)、电可擦除可编程只读存储器(Electrically EPROM,EEPROM)或闪存(Flash Memory)。
易失性存储器包括:随机存取存储器(Random Access Memory,RAM),其用作外部高速缓存。通过示例性但不是限制性说明,许多形式的RAM可用,例如:静态随机存取存储器(Static RAM,SRAM)、动态随机存取存储器(Dynamic RAM,DRAM)、同步动态随机存取存储器(Synchronous DRAM,SDRAM)、双倍数据速率同步动态随机存取存储器(Double Data RateSDRAM,DDRSDRAM)、增强型同步动态随机存取存储器(Enhanced SDRAM,ESDRAM)、同步连接动态随机存取存储器(Synchlink DRAM,SLDRAM)和直接内存总线随机存取存储器(DirectRambus RAM,DRRAM)。本发明实施例描述的电子设备的存储器1150包括但不限于上述和任意其他适合类型的存储器。
在本发明实施例中,存储器1150存储了操作***1151和应用程序1152的如下元素:可执行模块、数据结构,或者其子集,或者其扩展集。
具体而言,操作***1151包含各种***程序,例如:框架层、核心库层、驱动层等,用于实现各种基础业务以及处理基于硬件的任务。应用程序1152包含各种应用程序,例如:媒体播放器(Media Player)、浏览器(Browser),用于实现各种应用业务。实现本发明实施例方法的程序可以包含在应用程序1152中。应用程序1152包括:小程序、对象、组件、逻辑、数据结构以及其他执行特定任务或实现特定抽象数据类型的计算机***可执行指令。
此外,本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述手写汉字的评价方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
计算机可读存储介质包括:永久性和非永久性、可移动和非可移动媒体,是可以保留和存储供指令执行设备所使用指令的有形设备。计算机可读存储介质包括:电子存储设备、磁存储设备、光存储设备、电磁存储设备、半导体存储设备以及上述任意合适的组合。计算机可读存储介质包括:相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、非易失性随机存取存储器(NVRAM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带存储、磁带磁盘存储或其他磁性存储设备、记忆棒、机械编码装置(例如在其上记录有指令的凹槽中的穿孔卡或凸起结构)或任何其他非传输介质、可用于存储可以被计算设备访问的信息。按照本发明实施例中的界定,计算机可读存储介质不包括暂时信号本身,例如无线电波或其他自由传播的电磁波、通过波导或其他传输介质传播的电磁波(例如穿过光纤电缆的光脉冲)或通过导线传输的电信号。
在本申请所提供的几个实施例中,应该理解到,所披露的装置、电子设备和方法,可以通过其他的方式实现。例如,以上描述的装置实施例仅仅是示意性的,例如,所述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或可以集成到另一个***,或一些特征可以忽略,或不执行。另外,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口、装置或单元的间接耦合或通信连接,也可以是电的、机械的或其他的形式连接。
所述作为分离部件说明的单元可以是或也可以不是物理上分开的,作为单元显示的部件可以是或也可以不是物理单元,既可以位于一个位置,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或全部单元来解决本发明实施例方案要解决的问题。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以是两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读存储介质中。基于这样的理解,本发明实施例的技术方案本质上或者说对现有技术作出贡献的部分,或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(包括:个人计算机、服务器、数据中心或其他网络设备)执行本发明各个实施例所述方法的全部或部分步骤。而上述存储介质包括如前述所列举的各种可以存储程序代码的介质。
以上所述,仅为本发明实施例的具体实施方式,但本发明实施例的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明实施例披露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明实施例的保护范围之内。因此,本发明实施例的保护范围应以权利要求的保护范围为准。
Claims (10)
1.一种手写汉字的评价方法,其特征在于,包括:
获取待识别的手写汉字轨迹,所述手写汉字轨迹包括一个笔画数据或多个有序的笔画数据;
对所述手写汉字轨迹进行文字识别处理,确定所述手写汉字轨迹的识别置信度,所述识别置信度为所述手写汉字轨迹被识别为预设的标准汉字的概率;
对所述手写汉字轨迹进行笔画识别处理,确定每个所述笔画数据的笔画置信度,所述笔画置信度为所述手写汉字轨迹中的所述笔画数据被识别为所述标准汉字中相应顺位的标准笔画标识的概率;
根据所述识别置信度和所述笔画置信度确定所述手写汉字轨迹的评价结果,所述评价结果与所述识别置信度和所述笔画置信度之间均为正相关关系。
2.根据权利要求1所述的方法,其特征在于,所述根据所述识别置信度和所述笔画置信度确定所述手写汉字轨迹的评价结果包括:
确定所述手写汉字轨迹的形态参数,所述形态参数包括轨迹重心偏移量、笔画位置偏移量、轨迹越界像素占比中的一项或多项;所述轨迹重心偏移量为所述手写汉字轨迹的重心位置与所述标准汉字的重心位置之间的位置差值,所述笔画位置偏移量为所述笔画数据的所在位置与相应的标准笔画标识所对应的标准笔画的所在位置之间的位置差值,所述轨迹越界像素占比为所述手写汉字轨迹中超出预设手写范围的像素与所述手写汉字轨迹总像素之间的比值;
根据所述形态参数、所述识别置信度和所述笔画置信度确定所述手写汉字轨迹的评价结果,所述评价结果与所述形态参数之间为负相关关系。
3.根据权利要求2所述的方法,其特征在于,所述根据所述形态参数、所述识别置信度和所述笔画置信度确定所述手写汉字轨迹的评价结果,包括:
根据所述形态参数、所述识别置信度和所述笔画置信度生成所述手写汉字轨迹的评分值,所述评分值与所述形态参数之间为负相关关系,所述评分值与所述识别置信度和所述笔画置信度之间均为正相关关系;
确定所述手写汉字轨迹的文字识别结果和笔画识别结果,所述文字识别结果用于表示所述手写汉字轨迹与所述标准汉字是否相匹配,所述笔画识别结果用于表示所述手写汉字轨迹的笔画数据是否与所述标准汉字的标准笔画标识相匹配;
根据所述评分值、所述文字识别结果和所述笔画识别结果确定所述手写汉字轨迹的评价结果。
4.根据权利要求1-3任意一项所述的方法,其特征在于,所述对所述手写汉字轨迹进行文字识别处理,确定所述手写汉字轨迹的识别置信度,包括:
根据预设的文字识别模型,对所述手写汉字轨迹进行文字识别处理,确定所述手写汉字轨迹被识别为预设的标准汉字的识别置信度;
在所述识别置信度大于预设阈值时,确定所述手写汉字轨迹与所述标准汉字相匹配。
5.根据权利要求1-3任意一项所述的方法,其特征在于,所述对所述手写汉字轨迹进行笔画识别处理,确定每个所述笔画数据的笔画置信度,包括:
根据预设的笔画识别模型,确定每个所述笔画数据被识别为所述标准汉字中相应顺位的标准笔画标识的识别置信度;
确定所述笔画数据被识别为相应笔画标识的概率,并将概率最高的前n个笔画标识作为所述笔画数据的有效笔画标识;
在所述笔画数据中的一个有效笔画标识与所述标准汉字中相应顺位的标准笔画标识相一致时,确定所述笔画数据与所述标准笔画标识相匹配。
6.根据权利要求5所述的方法,其特征在于,在所述将概率最高的前n个笔画标识作为所述笔画数据的有效笔画标识之后,还包括:
根据预设的相似关系确定与当前的所述有效笔画标识相似的其他笔画标识,并将所述其他笔画标识也作为所述笔画数据的有效笔画标识。
7.根据权利要求5所述的方法,其特征在于,所述对所述手写汉字轨迹进行笔画识别处理,确定每个所述笔画数据的笔画置信度,还包括:
在所述手写汉字轨迹的所有所述笔画数据分别与所述标准汉字的标准笔画标识依次匹配时,确定所述手写汉字轨迹的笔画数据与所述标准汉字的标准笔画标识整体相匹配。
8.一种手写汉字的评价装置,其特征在于,包括:
获取模块,用于获取待识别的手写汉字轨迹,所述手写汉字轨迹包括一个笔画数据或多个有序的笔画数据;
文字识别模块,用于对所述手写汉字轨迹进行文字识别处理,确定所述手写汉字轨迹的识别置信度,所述识别置信度为所述手写汉字轨迹被识别为预设的标准汉字的概率;
笔画识别模块,用于对所述手写汉字轨迹进行笔画识别处理,确定每个所述笔画数据的笔画置信度,所述笔画置信度为所述手写汉字轨迹中的所述笔画数据被识别为所述标准汉字中相应顺位的标准笔画标识的概率;
评价模块,用于根据所述识别置信度和所述笔画置信度确定所述手写汉字轨迹的评价结果,所述评价结果与所述识别置信度和所述笔画置信度之间均为正相关关系。
9.一种电子设备,包括总线、收发器、存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述收发器、所述存储器和所述处理器通过所述总线相连,其特征在于,所述计算机程序被所述处理器执行时实现如权利要求1至7中任一项所述的手写汉字的评价方法中的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7中任一项所述的手写汉字的评价方法中的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010554271.7A CN111695539A (zh) | 2020-06-17 | 2020-06-17 | 一种手写汉字的评价方法、装置及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010554271.7A CN111695539A (zh) | 2020-06-17 | 2020-06-17 | 一种手写汉字的评价方法、装置及电子设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111695539A true CN111695539A (zh) | 2020-09-22 |
Family
ID=72481681
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010554271.7A Withdrawn CN111695539A (zh) | 2020-06-17 | 2020-06-17 | 一种手写汉字的评价方法、装置及电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111695539A (zh) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112434668A (zh) * | 2020-12-14 | 2021-03-02 | 北京一起教育科技有限责任公司 | 一种评价整洁度的方法、装置及电子设备 |
CN112863187A (zh) * | 2021-01-18 | 2021-05-28 | 北京百度网讯科技有限公司 | 感知模型的检测方法、电子设备、路侧设备和云控平台 |
CN113222075A (zh) * | 2021-04-27 | 2021-08-06 | 北京搜狗科技发展有限公司 | 一种评价方法、装置和电子设备 |
CN113627260A (zh) * | 2021-07-12 | 2021-11-09 | 科大讯飞股份有限公司 | 识别手写汉字的笔顺的方法、***和计算设备 |
CN114419626A (zh) * | 2021-12-29 | 2022-04-29 | 四川华西集采电子商务有限公司 | 一种基于ocr技术的高精度单据识别方法和*** |
CN115050217A (zh) * | 2022-05-06 | 2022-09-13 | 深圳大学 | 一种汉字读写能力训练***、训练设备和控制方法 |
WO2024065891A1 (zh) * | 2022-09-30 | 2024-04-04 | 朱芮叶 | 书写字体分析方法、装置、计算机设备及存储介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101465074A (zh) * | 2008-10-21 | 2009-06-24 | 华南理工大学 | 一种手写汉字布局评价方法 |
CN102609735A (zh) * | 2012-02-06 | 2012-07-25 | 安徽科大讯飞信息科技股份有限公司 | 一种字符书写规范度评测的方法和装置 |
CN110555403A (zh) * | 2019-08-29 | 2019-12-10 | 韶关市启之信息技术有限公司 | 一种手写字评价方法与*** |
-
2020
- 2020-06-17 CN CN202010554271.7A patent/CN111695539A/zh not_active Withdrawn
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101465074A (zh) * | 2008-10-21 | 2009-06-24 | 华南理工大学 | 一种手写汉字布局评价方法 |
CN102609735A (zh) * | 2012-02-06 | 2012-07-25 | 安徽科大讯飞信息科技股份有限公司 | 一种字符书写规范度评测的方法和装置 |
CN110555403A (zh) * | 2019-08-29 | 2019-12-10 | 韶关市启之信息技术有限公司 | 一种手写字评价方法与*** |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112434668A (zh) * | 2020-12-14 | 2021-03-02 | 北京一起教育科技有限责任公司 | 一种评价整洁度的方法、装置及电子设备 |
CN112863187A (zh) * | 2021-01-18 | 2021-05-28 | 北京百度网讯科技有限公司 | 感知模型的检测方法、电子设备、路侧设备和云控平台 |
CN113222075A (zh) * | 2021-04-27 | 2021-08-06 | 北京搜狗科技发展有限公司 | 一种评价方法、装置和电子设备 |
CN113222075B (zh) * | 2021-04-27 | 2024-03-08 | 北京搜狗科技发展有限公司 | 一种评价方法、装置和电子设备 |
CN113627260A (zh) * | 2021-07-12 | 2021-11-09 | 科大讯飞股份有限公司 | 识别手写汉字的笔顺的方法、***和计算设备 |
CN114419626A (zh) * | 2021-12-29 | 2022-04-29 | 四川华西集采电子商务有限公司 | 一种基于ocr技术的高精度单据识别方法和*** |
CN115050217A (zh) * | 2022-05-06 | 2022-09-13 | 深圳大学 | 一种汉字读写能力训练***、训练设备和控制方法 |
WO2024065891A1 (zh) * | 2022-09-30 | 2024-04-04 | 朱芮叶 | 书写字体分析方法、装置、计算机设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111695539A (zh) | 一种手写汉字的评价方法、装置及电子设备 | |
CN106649542B (zh) | 用于视觉问答的***和方法 | |
CN111476284A (zh) | 图像识别模型训练及图像识别方法、装置、电子设备 | |
CN109189767B (zh) | 数据处理方法、装置、电子设备及存储介质 | |
CN111414946B (zh) | 基于人工智能的医疗影像的噪声数据识别方法和相关装置 | |
CN110188654B (zh) | 一种基于移动未裁剪网络的视频行为识别方法 | |
CN102663454B (zh) | 一种字符书写规范度评测的方法和装置 | |
US11893773B2 (en) | Finger vein comparison method, computer equipment, and storage medium | |
CN111695458A (zh) | 一种视频图像帧处理方法及装置 | |
CN113254654A (zh) | 模型训练、文本识别方法、装置、设备和介质 | |
WO2023038574A1 (en) | Method and system for processing a target image | |
CN111401259A (zh) | 模型训练方法、***、计算机可读介质和电子设备 | |
CN111507467A (zh) | 神经网络模型的训练方法、装置、计算机设备及存储介质 | |
CN111695537A (zh) | 一种笔画识别的方法、装置及电子设备 | |
CN113569687B (zh) | 基于双流网络的场景分类方法、***、设备及介质 | |
CN114022687B (zh) | 一种基于增强学习的图像描述对抗生成方法 | |
CN111144462A (zh) | 一种雷达信号的未知个体识别方法及装置 | |
CN111429414B (zh) | 基于人工智能的病灶影像样本确定方法和相关装置 | |
WO2023232031A1 (zh) | 一种神经网络模型的训练方法、装置、电子设备及介质 | |
CN116152576B (zh) | 图像处理方法、装置、设备及存储介质 | |
CN110738129B (zh) | 一种基于r-c3d网络的端到端视频时序行为检测方法 | |
US9286544B2 (en) | Methods and apparatuses for facilitating object recognition | |
CN105512664A (zh) | 图像识别方法及装置 | |
CN112560728B (zh) | 目标对象识别方法及装置 | |
CN110059180B (zh) | 文章作者身份识别及评估模型训练方法、装置及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WW01 | Invention patent application withdrawn after publication | ||
WW01 | Invention patent application withdrawn after publication |
Application publication date: 20200922 |