CN111695537A - 一种笔画识别的方法、装置及电子设备 - Google Patents
一种笔画识别的方法、装置及电子设备 Download PDFInfo
- Publication number
- CN111695537A CN111695537A CN202010553700.9A CN202010553700A CN111695537A CN 111695537 A CN111695537 A CN 111695537A CN 202010553700 A CN202010553700 A CN 202010553700A CN 111695537 A CN111695537 A CN 111695537A
- Authority
- CN
- China
- Prior art keywords
- stroke
- data
- recognition
- target object
- standard
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/30—Writer recognition; Reading and verifying signatures
- G06V40/33—Writer recognition; Reading and verifying signatures based only on signature image, e.g. static signature recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Computational Biology (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Character Discrimination (AREA)
Abstract
本发明提供了一种笔画识别的方法、装置及电子设备,其中,该方法包括:获取待识别的目标对象,目标对象包括一个笔画数据或多个有序的笔画数据;根据预设的笔画识别模型,确定每个笔画数据所对应的、最高识别概率的多个有效笔画标识;在目标对象的所有笔画数据分别与预设的标准对象的标准笔画标识依次匹配时,确定目标对象的笔画与标准对象的笔画相匹配。通过本发明实施例提供的笔画识别的方法、装置及电子设备,以笔画标识作为识别过程中的参数来进行笔画识别,识别过程简单,处理量小;通过提取目标对象中多个最高识别概率的有效笔画标识,能够尽可能识别出相似的笔画,避免因手写笔画不规范导致识别错误的问题。
Description
技术领域
本发明涉及文字处理技术领域,具体而言,涉及一种笔画识别的方法、装置、电子设备及计算机可读存储介质。
背景技术
为了实现手写汉字识别的高精度识别率,目前在汉字识别领域中应用了一种新型辅助技术,即手写汉字的笔画识别方法。当前笔画识别技术主要是:根据当前文字的数据与标准文字的数据,对笔画的描写顺序以及描写方向进行匹配,实时的判断当前笔画顺序是否与标准一致。
在实现本发明的过程中,发明人发现现有的方案中至少存在如下问题:
现有方法的特点在于要搜集非常多的静态示例图像,获取标准笔画的标准方向和标准拐点的个数等前提文件,需要保存大量数据,同时导致匹配时处理量大,大量的数据保存与匹配检索会对笔画识别任务造成时间上的延迟。
发明内容
为解决现有存在的技术问题,本发明实施例提供一种笔画识别的方法、装置、电子设备及计算机可读存储介质。
第一方面,本发明实施例提供了一种笔画识别的方法,包括:
获取待识别的目标对象,所述目标对象包括一个笔画数据或多个有序的笔画数据;
根据预设的笔画识别模型,确定每个所述笔画数据所对应的、最高识别概率的多个有效笔画标识;
在所述目标对象的所有所述笔画数据分别与预设的标准对象的标准笔画标识依次匹配时,确定所述目标对象的笔画与所述标准对象的笔画相匹配;其中,在所述笔画数据中的一个有效笔画标识与标准笔画标识相一致时,确定所述笔画数据与所述标准笔画标识匹配。
第二方面,本发明实施例还提供了一种笔画识别的装置,包括:
获取模块,用于获取待识别的目标对象,所述目标对象包括一个笔画数据或多个有序的笔画数据;
识别模块,用于根据预设的笔画识别模型,确定每个所述笔画数据所对应的、最高识别概率的多个有效笔画标识;
匹配模块,用于在所述目标对象的所有所述笔画数据分别与预设的标准对象的标准笔画标识依次匹配时,确定所述目标对象的笔画与所述标准对象的笔画相匹配;其中,在所述笔画数据中的一个有效笔画标识与标准笔画标识相一致时,确定所述笔画数据与所述标准笔画标识匹配。
第三方面,本发明实施例提供了一种电子设备,包括总线、收发器、存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述收发器、所述存储器和所述处理器通过所述总线相连,所述计算机程序被所述处理器执行时实现上述任意一项所述的笔画识别的方法中的步骤。
第四方面,本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任意一项所述的笔画识别的方法中的步骤。
本发明实施例提供的笔画识别的方法、装置、电子设备及计算机可读存储介质,以笔画标识作为识别过程中的参数来进行笔画识别,识别过程简单,处理量小;通过提取目标对象中多个最高识别概率的有效笔画标识,能够尽可能识别出相似的笔画,避免因手写笔画不规范导致识别错误的问题。该方法不需要预先设置同一个汉字或笔画的多种静态示例图像,也不需要以图像本身作为比较的对象,极大地减小了处理量,且可以降低因旋转、长短、倾斜等因素导致匹配不成功的可能性,提高了笔画识别的准确率。
附图说明
为了更清楚地说明本发明实施例或背景技术中的技术方案,下面将对本发明实施例或背景技术中所需要使用的附图进行说明。
图1示出了本发明实施例所提供的一种笔画识别的方法的流程图;
图2示出了本发明实施例所提供的一种笔画识别的装置的结构示意图;
图3示出了本发明实施例所提供的一种用于执行笔画识别的方法的电子设备的结构示意图。
具体实施方式
在本发明实施例的描述中,所属技术领域的技术人员应当知道,本发明实施例可以实现为方法、装置、电子设备及计算机可读存储介质。因此,本发明实施例可以具体实现为以下形式:完全的硬件、完全的软件(包括固件、驻留软件、微代码等)、硬件和软件结合的形式。此外,在一些实施例中,本发明实施例还可以实现为在一个或多个计算机可读存储介质中的计算机程序产品的形式,该计算机可读存储介质中包含计算机程序代码。
上述计算机可读存储介质可以采用一个或多个计算机可读存储介质的任意组合。计算机可读存储介质包括:电、磁、光、电磁、红外或半导体的***、装置或器件,或者以上任意的组合。计算机可读存储介质更具体的例子包括:便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM)、闪存(Flash Memory)、光纤、光盘只读存储器(CD-ROM)、光存储器件、磁存储器件或以上任意组合。在本发明实施例中,计算机可读存储介质可以是任意包含或存储程序的有形介质,该程序可以被指令执行***、装置、器件使用或与其结合使用。
上述计算机可读存储介质包含的计算机程序代码可以用任意适当的介质传输,包括:无线、电线、光缆、射频(Radio Frequency,RF)或者以上任意合适的组合。
可以以汇编指令、指令集架构(ISA)指令、机器指令、机器相关指令、微代码、固件指令、状态设置数据、集成电路配置数据或以一种或多种程序设计语言或其组合来编写用于执行本发明实施例操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言,例如:Java、Smalltalk、C++,还包括常规的过程式程序设计语言,例如:C语言或类似的程序设计语言。计算机程序代码可以完全的在用户计算机上执行、部分的在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行以及完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络,包括:局域网(LAN)或广域网(WAN),可以连接到用户计算机,也可以连接到外部计算机。
本发明实施例通过流程图和/或方框图描述所提供的方法、装置、电子设备。
应当理解,流程图和/或方框图的每个方框以及流程图和/或方框图中各方框的组合,都可以由计算机可读程序指令实现。这些计算机可读程序指令可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器,从而生产出一种机器,这些计算机可读程序指令通过计算机或其他可编程数据处理装置执行,产生了实现流程图和/或方框图中的方框规定的功能/操作的装置。
也可以将这些计算机可读程序指令存储在能使得计算机或其他可编程数据处理装置以特定方式工作的计算机可读存储介质中。这样,存储在计算机可读存储介质中的指令就产生出一个包括实现流程图和/或方框图中的方框规定的功能/操作的指令装置产品。
也可以将计算机可读程序指令加载到计算机、其他可编程数据处理装置或其他设备上,使得在计算机、其他可编程数据处理装置或其他设备上执行一系列操作步骤,以产生计算机实现的过程,从而使得在计算机或其他可编程数据处理装置上执行的指令能够提供实现流程图和/或方框图中的方框规定的功能/操作的过程。
下面结合本发明实施例中的附图对本发明实施例进行描述。
图1示出了本发明实施例所提供的一种笔画识别的方法的流程图。如图1所示,该方法包括:
步骤101:获取待识别的目标对象,目标对象包括一个笔画数据或多个有序的笔画数据。
本发明实施例中,目标对象为待识别的文字,具体可以为汉字,该目标对象包含一个或多个笔画,每个笔画对应相应的笔画数据。例如,目标对象为汉字“中”,其包含四个笔画“竖”、“横折”、“横”、“竖”,每个笔画对应一个笔画数据。同时,由于每个文字一般具有相应的书写顺序,即其笔画是具有标准顺序的,在目标对象中包含多个笔画时,需要有序确定每个笔画的笔画数据,即此时该目标对象包含多个有序的笔画数据。具体地,该目标对象可以是用户基于客户端实时上传的对象,用户通过操作该客户端实时依次输入相应的笔画,并最终形成需要识别的对象,即目标对象。例如,该客户端为具有触摸屏的电子设备,用户通过滑动操作来输入相应的笔画,进而可以输入完整的目标对象,该目标对象是用户手写输入的文字。
可选地,用户输入的笔画本质上是多个坐标点(像素点)的集合,若直接对用户输入的笔画进行处理,会导致处理量过大的问题。本实施例中通过采样的方式来避免该问题,具体地,上述步骤101中“获取待识别的目标对象”包括:
步骤A1:确定目标对象中每个笔画所对应的原始数据。
步骤A2:对原始数据进行降采样,提取原始数据中的多个采样点,根据原始数据中的多个采样点生成相应的笔画数据。
本发明实施例中,该原始数据为用户输入的完整的数据,其包含该笔画所对应的所有坐标点,本实施例中通过对原始数据进行降采样处理,可以从原始数据中提取出部分采样点,将该部分采样点作为后续处理的笔画数据。本实施例中通过降采样方式生成笔画数据,可以在保证笔画识别准确率的前提下,降低了处理量,减小了计算时间。
其中,上述步骤A2“对原始数据进行降采样,提取原始数据中的多个采样点”具体可以包括:对原始数据中的坐标点按照均匀间隔的方式进行采样,提取出预设数量的采样点。具体地,由于笔画的原始数据为用户实时输入的,该原始数据中的每个坐标点具有相应的时间属性,基于坐标点的时间属性进行均匀间隔采样,以提取出所需的采样点;可选地,可以首先提取出该原始数据所对应的笔画骨架(具体可对该原始数据进行腐蚀处理等,来提取相应的笔画骨架),之后对该笔画骨架进行均匀间隔采样,提取出预设数量的采样点。此外,若所提取出的采样点数量小于该预设数量,则可以进行补齐处理。本实施例中,每个笔画数据均包含相同数量的采样点,即均包含预设数量的采样点,使得后续处理过程具有一致性,方便后续处理,例如方便后续基于笔画识别模型进行识别。若需要补齐处理时,可以在已提取出的采样点的首尾位置添加相应数量的坐标点,以保证该笔画数据具有预设数量的采样点。例如,预设数量为80,当前笔画的原始数据中只能提取出74个采样点,此时需要在首尾位置分别补充坐标点,例如分别补充三个坐标点[0,0],最终生成的笔画数据可以为:{[0,0],[0,0],[0,0],[68.65,7.91],.......,[66.86,98.95],[66.56,99.99],[0,0],[0,0],[0,0]}。
步骤102:根据预设的笔画识别模型,确定每个笔画数据所对应的、最高识别概率的多个有效笔画标识。
本发明实施例中,预先设置用于进行笔画识别的模型,即笔画识别模型,该笔画识别模型用于确定输入的笔画数据被识别为相应笔画标识的识别概率。在确定目标对象之后,将该目标对象输入至笔画识别模型中,即可确定该目标对象的每个笔画数据被识别为某个笔画标识的概率,即识别概率;该识别概率越高,说明该笔画数据越可能对应相应的笔画标识。本实施例中将最高识别概率的多个笔画标识作为笔画数据的有效笔画标识。本实施例中,“最高识别概率的多个有效笔画标识”指的是识别概率最高的前几个笔画标识为有效笔画标识;例如,最高识别概率的n个有效笔画标识,指的是识别概率最高的前n个笔画标识为有效笔画标识。可选地,可以在识别概率大于预设的概率阈值的笔画标识中选取有效笔画标识,以避免将识别概率较小的笔画标识误当作有效笔画标识。
本实例中,为了避免增加过多的处理量,步骤102中不可以确定过多的有效笔画标识。例如,可以将识别概率最高的前三个笔画标识作为有效笔画标识。具体地,若目标对象包含三个笔画数据A、B、C,且基于笔画识别模型确定三个笔画数据A、B、C的前三个最高识别概率、以及相应的笔画标识,其结果分别如下:
['_横撇/横钩','_撇','_横折钩'],[[9.9498415e-01 3.3675274e-035.1890750e-04];
['_点','_捺','_撇'],[4.6045738e-01 3.1391850e-01 5.5738050e-02];
['_竖','_撇','_横'],[5.3669679e-01 2.2616713e-01 3.3689443e-02]。
相应地,三个笔画数据A、B、C的有效笔画标识分别为['_横撇/横钩','_撇','_横折钩'],['_点','_捺','_撇'],['_竖','_撇','_横']。
可选地,该笔画识别模型包含卷积神经网络(CNN,Convolutional NeuralNetworks)和全连接层。上述步骤102“在根据预设的笔画识别模型,确定每个笔画数据所对应的、最高识别概率的多个有效笔画标识”之前,该方法还包括:
步骤B1:建立包含卷积神经网络和全连接层的笔画识别模型,卷积神经网络用于提取笔画数据中的笔画特征,全连接层用于根据笔画特征确定笔画数据被识别为相应笔画标识的识别概率。
本发明实施例中,预先建立包含CNN和全连接层的笔画识别模型,之后基于预先设置的训练样本对该笔画识别模型进行训练,即可确定该笔画识别模型中的参数,从而得到训练好的笔画识别模型,之后基于训练好的笔画识别模型即可执行上述步骤102。其中,CNN用于提取输入至该笔画识别模型的笔画数据中的笔画特征,全连接层用于根据笔画特征确定笔画数据被识别为相应笔画标识的识别概率,即该全连接层可以对笔画数据进行分类,进而确定识别概率最高的前几个有效笔画标识。该方法通过CNN分类的方式实现汉字笔画的轨迹识别,去掉了一些因旋转、长短、倾斜导致匹配不成功的因素,能够、提高笔画识别的准确率。
步骤103:在目标对象的所有笔画数据分别与预设的标准对象的标准笔画标识依次匹配时,确定目标对象的笔画与标准对象的笔画相匹配;其中,在笔画数据中的一个有效笔画标识与标准笔画标识相一致时,确定笔画数据与标准笔画标识匹配。
本发明实施例中,一个目标对象中可以包含多个笔画数据,每个笔画数据对应多个有效笔画标识。同时,本实施例中预先设置每种笔画的标准标识,即标准笔画标识;若笔画数据中的一个有效笔画标识与某个标准笔画标识相一致,此时可以认为该笔画数据与该标准笔画标识相匹配,即可以认为该笔画数据所对应的笔画与该标准笔画标识对应的标准笔画是一致的。例如,用户输入的目标对象中,某个笔画A为一个竖,且下端向左倾斜,在提取出该笔画A的笔画数据a之后,基于笔画识别模型确定该笔画数据a的有效笔画标识为['_竖','_撇','_横'],即该笔画A可能是“竖”,也可能是“撇”或“横”;若需要对比的标准笔画标识①为'_竖',则该笔画数据a中存在一个有效笔画标识'_竖'与该标准笔画标识①相同,该笔画数据a与该标准笔画标识①相匹配,同时也可以确定该笔画数据a所对应的笔画为“竖”。
此外,标准对象为预先设置好的已知的对象,每个标准对象也会包含一个或多个笔画,每个笔画具有确定的笔画标识,即标准笔画标识,因此可以确定每个标准对象所包含的所有标准笔画标识,且按照书写顺序可以设置标准笔画标识的顺序。若目标对象的所有笔画数据分别与该标准对象的标准笔画标识相匹配,则说明该目标对象的笔画与标准对象的笔画具有相同的书写顺序,且每个笔画也依次相同,此时即可认为该目标对象的笔画与该标准对象的笔画相匹配,即用户输入该目标对象时采用了正确的笔画以及顺序。例如,用户输入了某个目标对象,该目标对象的笔画与标准对象汉字“中”的笔画相匹配,则可以确定用户输入的笔画是汉字“中”的笔画。
此外,在某些场景下会预先要求用户输入某个对象,即标准对象是唯一确定的,此时基于该方法更容易进行笔画识别。例如,用户是学生,当前需要判断或考核学生书写汉字的正确率,此时即可将学生书写的汉字作为目标对象,将相应的标准答案作为标准对象,若二者相匹配,则说明学生书写该汉字的笔画是正确的,其书写的汉字大概率是正确的;若学生书写该汉字的笔画是错误的,则该学生所写的汉字也是错误的。即,若目标对象中的一个或多个笔画数据与标准对象的标准笔画标识不匹配,则该目标对象的笔画与标准对象的笔画不匹配,且目标对象与该标准对象本身也不匹配。
本发明实施例提供的一种笔画识别的方法,以笔画标识作为识别过程中的参数来进行笔画识别,识别过程简单,处理量小;通过提取目标对象中多个最高识别概率的有效笔画标识,能够尽可能识别出相似的笔画,避免因手写笔画不规范导致识别错误的问题。该方法不需要预先设置同一个汉字或笔画的多种静态示例图像,也不需要以图像本身作为比较的对象,极大地减小了处理量,且可以降低因旋转、长短、倾斜等因素导致匹配不成功的可能性,提高了笔画识别的准确率。
在上述实施例的基础上,上述步骤102“根据预设的笔画识别模型,确定每个笔画数据所对应的、最高识别概率的多个有效笔画标识”包括:
步骤C1:根据笔画识别模型确定笔画数据被识别为相应笔画标识的识别概率,并将识别概率最高的前n个笔画标识作为笔画数据的有效笔画标识。
本发明实施例中,将目标对象输入至该笔画识别模型后,该笔画识别模型即可确定目标对象中每个笔画数据的识别概率,该识别概率为该笔画数据被识别为相应的笔画标识的概率,由于存在多种笔画,每种笔画对应一个笔画标识,即此处每个笔画数据对应多个识别概率,本实施例中将识别概率最高的前n个笔画标识作为该笔画数据的有效笔画标识;一般情况下,n可以取值为3。
步骤C2:根据预设的相似关系确定与有效笔画标识相似的其他笔画标识,并将其他笔画标识也作为笔画数据的有效笔画标识。
本实施例中,由于不同的笔画的轨迹可能是相似的,例如“捺”与“点”的轨迹相似,用户人工手写时可能难以进行区分,本实施例中预先设置笔画之间的相似关系,该相似关系用于表示某个笔画与哪些其他的笔画相似,该相似关系具体可以是:{'_横撇/横钩':['_横折'],'_横折':['_横撇/横钩'],'_横折钩':['_横折'],'_竖折/竖弯':['_撇折'],'_提':['_横'],'_横':['_提'],'_捺':['_点'],'_点':['_竖','_捺'],'_竖':['_点','_撇'],'_撇':['_竖'],};其中,'A'表示笔画标识A,'A':['B']表示与笔画标识A相似的笔画标识包括笔画标识B。
在上述步骤C1中基于识别概率确定多个有效笔画标识之后,继续基于该相似关系确定与当前的有效笔画标识相似的其他笔画标识,并将此时确定的其他笔画标识也作为有效笔画标识,以对有效笔画标识进行补充。例如,基于笔画识别模型确定笔画数据A的前三个识别概率最高的笔画标识分别为笔画标识a、b、c,则此时可以确定该笔画数据A对应三个有效笔画标识a、b、c;同时,若笔画标识a与笔画标识a1相似,即二者之间具有相似关系,此时也可以将笔画标识a1作为该笔画数据A的一个有效笔画标识,该笔画数据A的有效笔画标识共有a、a1、b、c。本实施例中通过相似关系对有效笔画标识进行补充,可以更加完整地确定笔画数据的有效笔画标识,避免笔画识别模型遗漏。
在上述实施例的基础上,在步骤101“获取待识别的目标对象”之后,该方法还包括:
步骤D1:判断目标对象所包含的笔画数据数量与标准对象所包含的标准笔画标识的数量之间的差值是否小于预设阈值,在差值不小于预设阈值时,确定目标对象与标准对象不匹配。
本发明实施例中,目标对象中所包含的笔画数据的数量(即笔画数据数量)是确定,标准对象所包含的标准笔画标识的数量也是确定的,若两种数量之间的差值较大,即差值不小于预设阈值,此时即可直接确定该目标对象与标准对象不匹配,不需要进行后续处理,即不需要执行后续步骤102、步骤103等,从而可以节约处理资源。相反地,若该差值小于该预设阈值,说明目标对象与该标准对象可能是相匹配的,此时需要基于后续的步骤102和步骤103进行进一步匹配处理。其中,该差值可以为目标对象所包含的笔画数据数量-标准对象所包含的标准笔画标识的数量,也可以是两个数量相减后的绝对值。此外,预设阈值不宜过大,该预设阈值具体可以取值为0或1。
本发明实施例提供的一种笔画识别的方法,以笔画标识作为识别过程中的参数来进行笔画识别,识别过程简单,处理量小;通过提取目标对象中多个最高识别概率的有效笔画标识,能够尽可能识别出相似的笔画,避免因手写笔画不规范导致识别错误的问题。该方法不需要预先设置同一个汉字或笔画的多种静态示例图像,也不需要以图像本身作为比较的对象,极大地减小了处理量,且可以降低因旋转、长短、倾斜等因素导致匹配不成功的可能性,提高了笔画识别的准确率。通过相似关系对有效笔画标识进行补充,可以更加完整地确定笔画数据的有效笔画标识,避免笔画识别模型遗漏。预先基于笔画数据的数量进行初步比较,能进行快速地初步判断,在笔画数据数量异常时不进行后续处理,可以进一步节约处理资源。
上文详细描述了本发明实施例提供的笔画识别的方法,该方法也可以通过相应的装置实现,下面将详细描述本发明实施例提供的笔画识别的装置。
图2示出了本发明实施例所提供的一种笔画识别的装置的结构示意图。如图2所示,该笔画识别的装置包括:
获取模块21,用于获取待识别的目标对象,所述目标对象包括一个笔画数据或多个有序的笔画数据;
识别模块22,用于根据预设的笔画识别模型,确定每个所述笔画数据所对应的、最高识别概率的多个有效笔画标识;
匹配模块23,用于在所述目标对象的所有所述笔画数据分别与预设的标准对象的标准笔画标识依次匹配时,确定所述目标对象的笔画与所述标准对象的笔画相匹配;其中,在所述笔画数据中的一个有效笔画标识与标准笔画标识相一致时,确定所述笔画数据与所述标准笔画标识匹配。
在上述实施例的基础上,所述获取模块21获取待识别的目标对象包括:
确定目标对象中每个笔画所对应的原始数据;
对所述原始数据进行降采样,提取所述原始数据中的多个采样点,根据所述原始数据中的多个所述采样点生成相应的笔画数据。
在上述实施例的基础上,该装置还包括模型建立模块;
在所述识别模块22根据预设的笔画识别模型,确定每个所述笔画数据所对应的、最高识别概率的多个有效笔画标识之前,所述模型建立模块用于:建立包含卷积神经网络和全连接层的笔画识别模型,所述卷积神经网络用于提取笔画数据中的笔画特征,所述全连接层用于根据所述笔画特征确定所述笔画数据被识别为相应笔画标识的识别概率。
在上述实施例的基础上,所述识别模块22包括:
识别单元,用于根据所述笔画识别模型确定所述笔画数据被识别为相应笔画标识的识别概率,并将识别概率最高的前n个笔画标识作为所述笔画数据的有效笔画标识;
相似扩展单元,用于根据预设的相似关系确定与所述有效笔画标识相似的其他笔画标识,并将所述其他笔画标识也作为所述笔画数据的有效笔画标识。
在上述实施例的基础上,该装置还包括数量比较模块;
在所述获取模块21获取待识别的目标对象之后,所述数量比较模块用于:
判断所述目标对象所包含的笔画数据数量与标准对象所包含的标准笔画标识的数量之间的差值是否小于预设阈值,在所述差值不小于预设阈值时,确定所述目标对象与所述标准对象不匹配。
本发明实施例提供的一种笔画识别的装置,以笔画标识作为识别过程中的参数来进行笔画识别,识别过程简单,处理量小;通过提取目标对象中多个最高识别概率的有效笔画标识,能够尽可能识别出相似的笔画,避免因手写笔画不规范导致识别错误的问题。该装置不需要预先设置同一个汉字或笔画的多种静态示例图像,也不需要以图像本身作为比较的对象,极大地减小了处理量,且可以降低因旋转、长短、倾斜等因素导致匹配不成功的可能性,提高了笔画识别的准确率。通过相似关系对有效笔画标识进行补充,可以更加完整地确定笔画数据的有效笔画标识,避免笔画识别模型遗漏。预先基于笔画数据的数量进行初步比较,能进行快速地初步判断,在笔画数据数量异常时不进行后续处理,可以进一步节约处理资源。
此外,本发明实施例还提供了一种电子设备,包括总线、收发器、存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,该收发器、该存储器和处理器分别通过总线相连,计算机程序被处理器执行时实现上述笔画识别的方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
具体的,参见图3所示,本发明实施例还提供了一种电子设备,该电子设备包括总线1110、处理器1120、收发器1130、总线接口1140、存储器1150和用户接口1160。
在本发明实施例中,该电子设备还包括:存储在存储器1150上并可在处理器1120上运行的计算机程序,计算机程序被处理器1120执行时实现上述笔画识别的方法实施例的各个过程。
收发器1130,用于在处理器1120的控制下接收和发送数据。
本发明实施例中,总线架构(用总线1110来代表),总线1110可以包括任意数量互联的总线和桥,总线1110将包括由处理器1120代表的一个或多个处理器与存储器1150代表的存储器的各种电路连接在一起。
总线1110表示若干类型的总线结构中的任何一种总线结构中的一个或多个,包括存储器总线以及存储器控制器、***总线、加速图形端口(Accelerate Graphical Port,AGP)、处理器或使用各种总线体系结构中的任意总线结构的局域总线。作为示例而非限制,这样的体系结构包括:工业标准体系结构(Industry Standard Architecture,ISA)总线、微通道体系结构(Micro Channel Architecture,MCA)总线、扩展ISA(Enhanced ISA,EISA)总线、视频电子标准协会(Video Electronics Standards Association,VESA)、***部件互连(Peripheral Component Interconnect,PCI)总线。
处理器1120可以是一种集成电路芯片,具有信号处理能力。在实现过程中,上述方法实施例的各步骤可以通过处理器中硬件的集成逻辑电路或软件形式的指令完成。上述的处理器包括:通用处理器、中央处理器(Central Processing Unit,CPU)、网络处理器(Network Processor,NP)、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(FieldProgrammable Gate Array,FPGA)、复杂可编程逻辑器件(Complex Programmable LogicDevice,CPLD)、可编程逻辑阵列(Programmable Logic Array,PLA)、微控制单元(Microcontroller Unit,MCU)或其他可编程逻辑器件、分立门、晶体管逻辑器件、分立硬件组件。可以实现或执行本发明实施例中公开的各方法、步骤及逻辑框图。例如,处理器可以是单核处理器或多核处理器,处理器可以集成于单颗芯片或位于多颗不同的芯片。
处理器1120可以是微处理器或任何常规的处理器。结合本发明实施例所公开的方法步骤可以直接由硬件译码处理器执行完成,或者由译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存取存储器(Random Access Memory,RAM)、闪存(FlashMemory)、只读存储器(Read-Only Memory,ROM)、可编程只读存储器(Programmable ROM,PROM)、可擦除可编程只读存储器(Erasable PROM,EPROM)、寄存器等本领域公知的可读存储介质中。所述可读存储介质位于存储器中,处理器读取存储器中的信息,结合其硬件完成上述方法的步骤。
总线1110还可以将,例如***设备、稳压器或功率管理电路等各种其他电路连接在一起,总线接口1140在总线1110和收发器1130之间提供接口,这些都是本领域所公知的。因此,本发明实施例不再对其进行进一步描述。
收发器1130可以是一个元件,也可以是多个元件,例如多个接收器和发送器,提供用于在传输介质上与各种其他装置通信的单元。例如:收发器1130从其他设备接收外部数据,收发器1130用于将处理器1120处理后的数据发送给其他设备。取决于计算机***的性质,还可以提供用户接口1160,例如:触摸屏、物理键盘、显示器、鼠标、扬声器、麦克风、轨迹球、操纵杆、触控笔。
应理解,在本发明实施例中,存储器1150可进一步包括相对于处理器1120远程设置的存储器,这些远程设置的存储器可以通过网络连接至服务器。上述网络的一个或多个部分可以是自组织网络(ad hoc network)、内联网(intranet)、外联网(extranet)、虚拟专用网(VPN)、局域网(LAN)、无线局域网(WLAN)、广域网(WAN)、无线广域网(WWAN)、城域网(MAN)、互联网(Internet)、公共交换电话网(PSTN)、普通老式电话业务网(POTS)、蜂窝电话网、无线网络、无线保真(Wi-Fi)网络以及两个或更多个上述网络的组合。例如,蜂窝电话网和无线网络可以是全球移动通信(GSM)***、码分多址(CDMA)***、全球微波互联接入(WiMAX)***、通用分组无线业务(GPRS)***、宽带码分多址(WCDMA)***、长期演进(LTE)***、LTE频分双工(FDD)***、LTE时分双工(TDD)***、先进长期演进(LTE-A)***、通用移动通信(UMTS)***、增强移动宽带(Enhance Mobile Broadband,eMBB)***、海量机器类通信(massive Machine Type of Communication,mMTC)***、超可靠低时延通信(UltraReliable Low Latency Communications,uRLLC)***等。
应理解,本发明实施例中的存储器1150可以是易失性存储器或非易失性存储器,或可包括易失性存储器和非易失性存储器两者。其中,非易失性存储器包括:只读存储器(Read-Only Memory,ROM)、可编程只读存储器(Programmable ROM,PROM)、可擦除可编程只读存储器(Erasable PROM,EPROM)、电可擦除可编程只读存储器(Electrically EPROM,EEPROM)或闪存(Flash Memory)。
易失性存储器包括:随机存取存储器(Random Access Memory,RAM),其用作外部高速缓存。通过示例性但不是限制性说明,许多形式的RAM可用,例如:静态随机存取存储器(Static RAM,SRAM)、动态随机存取存储器(Dynamic RAM,DRAM)、同步动态随机存取存储器(Synchronous DRAM,SDRAM)、双倍数据速率同步动态随机存取存储器(Double Data RateSDRAM,DDRSDRAM)、增强型同步动态随机存取存储器(Enhanced SDRAM,ESDRAM)、同步连接动态随机存取存储器(Synchlink DRAM,SLDRAM)和直接内存总线随机存取存储器(DirectRambus RAM,DRRAM)。本发明实施例描述的电子设备的存储器1150包括但不限于上述和任意其他适合类型的存储器。
在本发明实施例中,存储器1150存储了操作***1151和应用程序1152的如下元素:可执行模块、数据结构,或者其子集,或者其扩展集。
具体而言,操作***1151包含各种***程序,例如:框架层、核心库层、驱动层等,用于实现各种基础业务以及处理基于硬件的任务。应用程序1152包含各种应用程序,例如:媒体播放器(Media Player)、浏览器(Browser),用于实现各种应用业务。实现本发明实施例方法的程序可以包含在应用程序1152中。应用程序1152包括:小程序、对象、组件、逻辑、数据结构以及其他执行特定任务或实现特定抽象数据类型的计算机***可执行指令。
此外,本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述笔画识别的方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
计算机可读存储介质包括:永久性和非永久性、可移动和非可移动媒体,是可以保留和存储供指令执行设备所使用指令的有形设备。计算机可读存储介质包括:电子存储设备、磁存储设备、光存储设备、电磁存储设备、半导体存储设备以及上述任意合适的组合。计算机可读存储介质包括:相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、非易失性随机存取存储器(NVRAM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带存储、磁带磁盘存储或其他磁性存储设备、记忆棒、机械编码装置(例如在其上记录有指令的凹槽中的穿孔卡或凸起结构)或任何其他非传输介质、可用于存储可以被计算设备访问的信息。按照本发明实施例中的界定,计算机可读存储介质不包括暂时信号本身,例如无线电波或其他自由传播的电磁波、通过波导或其他传输介质传播的电磁波(例如穿过光纤电缆的光脉冲)或通过导线传输的电信号。
在本申请所提供的几个实施例中,应该理解到,所披露的装置、电子设备和方法,可以通过其他的方式实现。例如,以上描述的装置实施例仅仅是示意性的,例如,所述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或可以集成到另一个***,或一些特征可以忽略,或不执行。另外,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口、装置或单元的间接耦合或通信连接,也可以是电的、机械的或其他的形式连接。
所述作为分离部件说明的单元可以是或也可以不是物理上分开的,作为单元显示的部件可以是或也可以不是物理单元,既可以位于一个位置,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或全部单元来解决本发明实施例方案要解决的问题。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以是两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读存储介质中。基于这样的理解,本发明实施例的技术方案本质上或者说对现有技术作出贡献的部分,或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(包括:个人计算机、服务器、数据中心或其他网络设备)执行本发明各个实施例所述方法的全部或部分步骤。而上述存储介质包括如前述所列举的各种可以存储程序代码的介质。
以上所述,仅为本发明实施例的具体实施方式,但本发明实施例的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明实施例披露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明实施例的保护范围之内。因此,本发明实施例的保护范围应以权利要求的保护范围为准。
Claims (10)
1.一种笔画识别的方法,其特征在于,包括:
获取待识别的目标对象,所述目标对象包括一个笔画数据或多个有序的笔画数据;
根据预设的笔画识别模型,确定每个所述笔画数据所对应的、最高识别概率的多个有效笔画标识;
在所述目标对象的所有所述笔画数据分别与预设的标准对象的标准笔画标识依次匹配时,确定所述目标对象的笔画与所述标准对象的笔画相匹配;其中,在所述笔画数据中的一个有效笔画标识与标准笔画标识相一致时,确定所述笔画数据与所述标准笔画标识匹配。
2.根据权利要求1所述的方法,其特征在于,所述获取待识别的目标对象包括:
确定目标对象中每个笔画所对应的原始数据;
对所述原始数据进行降采样,提取所述原始数据中的多个采样点,根据所述原始数据中的多个所述采样点生成相应的笔画数据。
3.根据权利要求1所述的方法,其特征在于,在所述根据预设的笔画识别模型,确定每个所述笔画数据所对应的、最高识别概率的多个有效笔画标识之前,还包括:
建立包含卷积神经网络和全连接层的笔画识别模型,所述卷积神经网络用于提取笔画数据中的笔画特征,所述全连接层用于根据所述笔画特征确定所述笔画数据被识别为相应笔画标识的识别概率。
4.根据权利要求1所述的方法,其特征在于,所述根据预设的笔画识别模型,确定每个所述笔画数据所对应的、最高识别概率的多个有效笔画标识,包括:
根据所述笔画识别模型确定所述笔画数据被识别为相应笔画标识的识别概率,并将识别概率最高的前n个笔画标识作为所述笔画数据的有效笔画标识;
根据预设的相似关系确定与所述有效笔画标识相似的其他笔画标识,并将所述其他笔画标识也作为所述笔画数据的有效笔画标识。
5.根据权利要求1所述的方法,其特征在于,在所述获取待识别的目标对象之后,还包括:
判断所述目标对象所包含的笔画数据数量与标准对象所包含的标准笔画标识的数量之间的差值是否小于预设阈值,在所述差值不小于预设阈值时,确定所述目标对象与所述标准对象不匹配。
6.一种笔画识别的装置,其特征在于,包括:
获取模块,用于获取待识别的目标对象,所述目标对象包括一个笔画数据或多个有序的笔画数据;
识别模块,用于根据预设的笔画识别模型,确定每个所述笔画数据所对应的、最高识别概率的多个有效笔画标识;
匹配模块,用于在所述目标对象的所有所述笔画数据分别与预设的标准对象的标准笔画标识依次匹配时,确定所述目标对象的笔画与所述标准对象的笔画相匹配;其中,在所述笔画数据中的一个有效笔画标识与标准笔画标识相一致时,确定所述笔画数据与所述标准笔画标识匹配。
7.根据权利要求6所述的装置,其特征在于,所述获取模块获取待识别的目标对象包括:
确定目标对象中每个笔画所对应的原始数据;
对所述原始数据进行降采样,提取所述原始数据中的多个采样点,根据所述原始数据中的多个所述采样点生成相应的笔画数据。
8.根据权利要求6所述的装置,其特征在于,所述识别模块包括:
识别单元,用于根据所述笔画识别模型确定所述笔画数据被识别为相应笔画标识的识别概率,并将识别概率最高的前n个笔画标识作为所述笔画数据的有效笔画标识;
相似扩展单元,用于根据预设的相似关系确定与所述有效笔画标识相似的其他笔画标识,并将所述其他笔画标识也作为所述笔画数据的有效笔画标识。
9.一种电子设备,包括总线、收发器、存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述收发器、所述存储器和所述处理器通过所述总线相连,其特征在于,所述计算机程序被所述处理器执行时实现如权利要求1至5中任一项所述的笔画识别的方法中的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至5中任一项所述的笔画识别的方法中的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010553700.9A CN111695537A (zh) | 2020-06-17 | 2020-06-17 | 一种笔画识别的方法、装置及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010553700.9A CN111695537A (zh) | 2020-06-17 | 2020-06-17 | 一种笔画识别的方法、装置及电子设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111695537A true CN111695537A (zh) | 2020-09-22 |
Family
ID=72481748
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010553700.9A Withdrawn CN111695537A (zh) | 2020-06-17 | 2020-06-17 | 一种笔画识别的方法、装置及电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111695537A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113095171A (zh) * | 2021-03-29 | 2021-07-09 | Oppo广东移动通信有限公司 | 书写字符识别方法及装置、电子设备、存储介质 |
CN113627260A (zh) * | 2021-07-12 | 2021-11-09 | 科大讯飞股份有限公司 | 识别手写汉字的笔顺的方法、***和计算设备 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103810506A (zh) * | 2014-01-03 | 2014-05-21 | 南京师范大学 | 一种手写汉字笔画识别方法 |
US9021379B1 (en) * | 2011-07-20 | 2015-04-28 | Google Inc. | Matching of gesture keyboard strokes with predefined stroke templates |
CN109858383A (zh) * | 2019-01-04 | 2019-06-07 | 广东智媒云图科技股份有限公司 | 笔画识别方法及装置 |
CN110555403A (zh) * | 2019-08-29 | 2019-12-10 | 韶关市启之信息技术有限公司 | 一种手写字评价方法与*** |
-
2020
- 2020-06-17 CN CN202010553700.9A patent/CN111695537A/zh not_active Withdrawn
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9021379B1 (en) * | 2011-07-20 | 2015-04-28 | Google Inc. | Matching of gesture keyboard strokes with predefined stroke templates |
CN103810506A (zh) * | 2014-01-03 | 2014-05-21 | 南京师范大学 | 一种手写汉字笔画识别方法 |
CN109858383A (zh) * | 2019-01-04 | 2019-06-07 | 广东智媒云图科技股份有限公司 | 笔画识别方法及装置 |
CN110555403A (zh) * | 2019-08-29 | 2019-12-10 | 韶关市启之信息技术有限公司 | 一种手写字评价方法与*** |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113095171A (zh) * | 2021-03-29 | 2021-07-09 | Oppo广东移动通信有限公司 | 书写字符识别方法及装置、电子设备、存储介质 |
CN113627260A (zh) * | 2021-07-12 | 2021-11-09 | 科大讯飞股份有限公司 | 识别手写汉字的笔顺的方法、***和计算设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111695539A (zh) | 一种手写汉字的评价方法、装置及电子设备 | |
EP3893125A1 (en) | Method and apparatus for searching video segment, device, medium and computer program product | |
US10678848B2 (en) | Method and a system for recognition of data in one or more images | |
CN111695537A (zh) | 一种笔画识别的方法、装置及电子设备 | |
US11893773B2 (en) | Finger vein comparison method, computer equipment, and storage medium | |
US20220067585A1 (en) | Method and device for identifying machine learning models for detecting entities | |
CN111435445A (zh) | 字符识别模型的训练方法及装置、字符识别方法及装置 | |
CN115100659A (zh) | 文本识别方法、装置、电子设备和存储介质 | |
US11989891B2 (en) | System and method for 3D multi-object tracking in LiDAR point clouds | |
CN113935349A (zh) | 一种扫描二维码的方法、装置、电子设备及存储介质 | |
US11733388B2 (en) | Method, apparatus and electronic device for real-time object detection | |
WO2023232031A1 (zh) | 一种神经网络模型的训练方法、装置、电子设备及介质 | |
CN113901976A (zh) | 一种恶意流量的识别方法、装置及电子设备 | |
CN112330408A (zh) | 一种产品推荐方法、装置及电子设备 | |
US9286544B2 (en) | Methods and apparatuses for facilitating object recognition | |
US20220327803A1 (en) | Method of recognizing object, electronic device and storage medium | |
CN105512664A (zh) | 图像识别方法及装置 | |
CN111401305B (zh) | 一种4s店顾客统计方法、装置及电子设备 | |
CN113064497A (zh) | 语句识别的方法、装置、设备及计算机存储介质 | |
CN113642443A (zh) | 模型的测试方法、装置、电子设备及存储介质 | |
CN112651394B (zh) | 一种图像检测方法、装置及电子设备 | |
CN112686170B (zh) | 一种图像识别方法、装置及电子设备 | |
CN115657916B (zh) | 获取电商数据的方法、装置及电子设备 | |
CN111783512B (zh) | 图像处理方法、装置、设备及存储介质 | |
CN114299369A (zh) | 目标识别模型的训练方法、目标识别方法及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WW01 | Invention patent application withdrawn after publication | ||
WW01 | Invention patent application withdrawn after publication |
Application publication date: 20200922 |