CN115311674A

CN115311674A - 手写处理方法、装置、电子设备和可读存储介质

Info

Publication number: CN115311674A
Application number: CN202211009903.7A
Authority: CN
Inventors: 杨文凤; 叶虹呐; 白峰; 王石
Original assignee: Boe Digital Technology Co ltd
Current assignee: Boe Digital Technology Co ltd
Priority date: 2022-08-22
Filing date: 2022-08-22
Publication date: 2022-11-08

Abstract

本申请提供一种手写处理方法、装置、电子设备和可读存储介质。手写处理方法包括以下步骤：接收目标对象的手写操作输入；根据与所述目标对象对应的手写数据库预测所述手写操作输入对应的目标文本，其中，所述目标文本为所述手写数据库中的文本数据；生成与所述目标文本对应的输出结果。本申请实施例有助于提高手写识别精确度和识别速度。

Description

手写处理方法、装置、电子设备和可读存储介质

技术领域

本申请实施例涉及软件技术领域，尤其涉及一种手写处理方法、装置、电子设备和可读存储介质。

背景技术

随着信息技术和电子技术的发展，用户对于手写输入的需求也逐渐增加。相关技术中，手写输入法的工作原理可以理解为，用户需要通过手写的方式完成文字的书写，进一步通过对于手写的文字进行解析对比确定其对应的文字。然而不同的人具有不同的书写习惯，其书写字体等具有较大的差异，且部分文字笔划可能较多，书写需要较多的视角，因此，现有技术中，对于手写输入的识别准确性较差且所需的时间较长。

发明内容

本申请实施例提供一种手写处理方法、装置、电子设备和可读存储介质，以解决对于手写输入的识别准确性较差且所需的时间较长的问题。

为解决上述问题，本申请是这样实现的：

第一方面，本申请实施例提供了一种手写处理方法，包括以下步骤：

接收目标对象的手写操作输入；

根据与所述目标对象对应的手写数据库预测所述手写操作输入对应的目标文本，其中，所述目标文本为所述手写数据库中的文本数据；

生成与所述目标文本对应的输出结果。

在一些实施例中，所述根据与所述目标对象对应的手写数据库预测所述手写操作输入对应的目标文本，包括：

解析所述手写操作输入获得笔划信息；

将所述手写数据库中与所述笔划信息的形状匹配程度大于预设匹配阈值的文本作为目标文本。

在一些实施例中，所述根据与所述目标对象对应的手写数据库预测所述手写操作输入对应的目标文本之前，所述方法还包括：

采集所述目标用户的书写数据，其中，所述书写数据包括笔划、文字、字母、符号中的一项或多项；

根据所述书写数据建立与所述目标用户对应的手写数据库。

在一些实施例中，所述根据所述书写数据建立与所述目标用户对应的手写数据库，包括：

提取所述书写数据的图像的特征向量，其中，所述特征向量包括查询向量、键向量和值向量；

根据所述查询向量和所述键向量的乘积确定所述特征向量的注意力值；

对所述注意力值进行归一化处理，并将归一化处理后的注意力值和所述值向量的乘积作为输出向量序列；

根据所述输出向量序列和所述书写数据对应的文本数据之间的对应关系建立与所述目标用户对应的手写数据库。

在一些实施例中，所述采集所述目标用户的书写数据，包括：

接收数据采集输入；

去除根据所述数据采集输入生成的手写笔迹的干扰点，其中，所述干扰点包括游离点和冗余点中的至少一项，所述游离点是根据所述数据采集输入的采样点的压力和/或所述采样点之间的相对位置确定的，所述冗余点是根据存在交叠的所述采样点确定的；

对去除所述干扰点的所述手写笔迹进行平滑处理；

将平滑处理后的所述手写笔迹作为所述书写数据。

在一些实施例中，所述接收目标对象的手写操作输入之后，所述方法还包括：

在所述手写数据库中不存在与所述手写操作输入对应的目标文本的情况下，识别根据所述手写操作输入得到的手写文本对应的文本信息；

根据所述文本信息和所述手写文本更新所述手写数据库。

第二方面，本申请实施例还提供一种手写处理装置，包括：

接收模块，用于接收目标对象的手写操作输入；

预测模块，用于根据与所述目标对象对应的手写数据库预测所述手写操作输入对应的目标文本，其中，所述目标文本为所述手写数据库中的文本数据；

生成模块，用于生成与所述目标文本对应的输出结果。

在一些实施例中，所述预测模块包括：

解析子模块，用于解析所述手写操作输入获得笔划信息；

确认子模块，用于将所述手写数据库中与所述笔划信息的形状匹配程度大于预设匹配阈值的文本作为目标文本。

第三方面，本申请实施例还提供一种电子设备，包括：存储器、处理器及存储在所述存储器上并可在所述处理器上运行的程序；所述处理器，用于读取存储器中的程序实现如前述第一方面所述方法中的步骤。

第四方面，本申请实施例还提供一种可读存储介质，用于存储程序，所述程序被处理器执行时实现如前述第一方面所述方法中的步骤。

在本申请实施例，通过与各目标对象对应的手写数据库对手写操作输入进行识别，有助于提高对于手写操作对应的文字的预测精度，进一步的，由于不同用户具有其相对独特的书写习惯，在手写输入过程中，根据其已书写的内容结合根据该用户的撰写习惯建立的手写数据库对目标文本进行预测，能够在内容书写完成之前就对其对应的目标文本进行相对准确的预测，有助于提高手写输入的效率。

附图说明

为了更清楚地说明本申请实施例的技术方案，下面将对本申请实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1是本申请实施例提供的手写处理方法的流程示意图；

图2A是本申请实施例中汉字模板示意图；

图2B是本申请实施例中汉字手写数据采集示意图；

图3A是本申请实施例中英文模板示意图；

图3B是本申请实施例中英文手写数据采集示意图；

图4A是本申请实施例中符号模板示意图；

图4B是本申请实施例中符号手写数据采集示意图；

图5A是本申请实施例中手写笔迹优化示意图；

图5B是本申请实施例中又一手写笔迹优化示意图；

图5C是本申请实施例中又一手写笔迹优化示意图；

图6是本申请实施例提供的自注意力模型示意图；

图7是本申请实施例提供的手写处理方法的一场景示意图；

图8是本申请实施例提供的手写处理方法的又一流程示意图

图9是本申请实施例提供的手写处理装置的结构示意图；

图10是本申请实施提供的电子设备的结构示意图。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

本申请实施例中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。此外，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、***、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。此外，本申请中使用“和/或”表示所连接对象的至少其中之一，例如A和/或B和/或C，表示包含单独A，单独B，单独C，以及A和B都存在，B和C都存在，A和C都存在，以及A、B和C都存在的7种情况。

本申请实施例提供了一种手写处理方法。

本实施例的技术方案应用于电子设备，电子设备支持手写输入功能，示例性的，电子设备可以是具有触控屏的智能手机、平板电脑、电子纸阅读器，也可以是包括手写板或触摸板的笔记本电脑、个人计算机等支持手写输入的电子设备，本实施例不对电子设备的具体类型做进一步描述和限定。

如图1所示，在一个实施例中，该方法包括以下步骤：

步骤101：接收目标对象的手写操作输入。

本实施例的技术方案中，目标对象可以通过包括但不限于手指触控、手写笔等方式在触控屏、手写板等设备上执行手写操作输入。

步骤102：根据与所述目标对象对应的手写数据库预测所述手写操作输入对应的目标文本。

在接收到手写操作输入后，本实施例中通过与目标对象对应的手写数据库进行预测。

本实施例中，提供与每一目标对象唯一对应的手写数据库，该手写数据库可以理解为包括了根据目标用户的手写数据建立的数据集。

在一个实施例中，在该步骤102之前还包括建立手写数据库的步骤。

在一个示例性的实施例中，建立手写数据库的步骤包括：

根据所述书写数据建立与所述目标用户对应的手写数据库。

如图2A所示，实施时，可以提供一特定的汉字笔划、偏旁部首以及文字模板。

在一个示例性的实施例中，汉字模板包括点(丶)、横(一)、竖(丨)、撇(丿)、捺

提(ノ)、折

钩(亅)等笔划。148个常用部首，以及随机选择的一定数量的汉字。如图2B所示，目标对象按照所提供的模板进行相应的内容的书写。

如图3A所示，本实施例中，进一步还可以提供一个包括英文字母以及英文单词的模板，本实施例中，英文模板包括26个字母的大小写，以及随机生成或选择的词组。如图3B所示，目标对象还可以按照该模板进行书写，以采集目标对象的英文手写数据。

如图4A和图4B所示，进一步的，还可以提供一个包括常用数学符号的目标，以采集目标对象书写数学符号的手写数据。

可以理解，针对不同的手写需求，可以提供相应的模板，以采集用户书写相应内容的手写数据，示例性的，可以包括日语、朝鲜语、***语、法语等不同的语言，或者数学领域符号、医学领域符号、速记业务符号、土木工程相关符号等，此处不对具体内容和领域做进一步限定和描述。

在其中一些实施例中，可以进一步提供针对不同人群的手写笔迹采集模板，示例性的，针对在校学生，则主要包括中文模板、英文模板和常用符号模板，针对特定区域或使用特定语言的群体，可以提供相应语言的模板，针对特定技术领域的群体，则可以提供相应的符号的模板等。

进一步的，本实施例中，还可以模拟不同的书写工具，例如，针对铅笔和圆珠笔，则保持其书写笔迹粗细一致，针对钢笔、毛笔或马克笔等书写工具，则进一步可以提供笔迹粗细、顿笔转折等相应的书写模拟，此处不做进一步限定和描述。

在采集到了用户的手写数据之后，还可以进一步对手写笔迹进行预处理，以提高对于手写数据的处理精度。

在一个实施例中，该方法还包括，包括：

接收数据采集输入；

去除根据所述数据采集输入生成的手写笔迹的干扰点；

对去除所述干扰点的所述手写笔迹进行平滑处理；

将平滑处理后的所述手写笔迹作为所述书写数据。

在数据采集输入之后，针对采集到的手写数据，首先进行采样点中的干扰点的去除。本实施例中，干扰点包括游离点和冗余点中的至少一项。

需要理解的是，手写采样实际上是通过触控采样实现的。以用户在手写板上执行手写操作做示例性说明，用户的手指接触到手写板时，手写板进行触控采样，这一过程中，手写板会采集多个时刻用户的手指的位置，然后根据用户的手指的位置变化，生成手指的移动轨迹，在执行书写操作时，该移动轨迹也就是书写笔迹。

在其中一些实施例中，可以按照一定的时间间隔确定采样点，示例性的，可以以0.1毫秒、0.2毫秒、0.5毫秒等不同的时间间隔进行触控采样，获得采样点，并根据采样点确定手写笔迹。

本实施例中，游离点根据数据采集输入的采样点的压力和/或采样点之间的相对位置确定的。

手写轨迹采样点集Ti＝{Pk|k＝1，2，3…n)，Pk(xk，yk，zk，dk)，其中，xk和yk分别为采样点Pk的横纵坐标，zk为采样时间，dk为该采样点的触控压力。

在一个示例性的实施例中，通过以下方式确定游离点。首先针对dk进行压力值过滤，压力值区间为(0，1]，当dk处于(0，1]区间及dk＝1且停留时间3s时，筛查出相应连续或者游离点集。接下来，继续对通过压力值筛查后的点集进行处理，计算Pk-1，Pk，Pk+1三点构成的角度的θ，设定角度阈值α，若θ<α，则判定为游离点，进行剔除。

本实施例中的冗余点是根据存在交叠的采样点确定的，可以理解为，如果存在两个采集时序不同，但是坐标相同的点，则将其中的一个作为冗余点，本实施例中，当存在两个采样点的坐标相同的情况下，保留时序相对靠前的采样点，这样，既不会对最终形成的手写笔迹的形状造成影响，也能够减少所需处理的数据数量，提高数据处理速度。

在剔除了干扰点之后，进一步进行平滑处理，如图5A所示，书写过程中，可能存在笔迹的部分位置像素点缺失，导致笔迹的局部出现明显的像素点，具体表现为局部呈锯齿状，本实施例中，针对锯齿状的手写笔迹边缘进行填充，使得手写笔迹的边缘更加平滑。

如图5B和图5C所示，其中，左侧为初始的手写笔迹，右侧为经过优化处理的手写笔迹，可见，经过优化处理后，在保留了目标对象的个性化的书写特征的同时，去除了干扰，使得手写笔迹更加美观。

本实施例中，接下来根据手写数据建立相应的手写数据库，在其中一个实施例中，是根据自注意力(self-attention)模型建立手写数据库，从而有助于减少样本数量，同时，通过手写体字体合成结合通过持续学习模型进行持续优化，减少方差，能够使得建立的手写数据库获得更贴合个人手写特征以及具有跟随性。同时通过自注意力和基于卷积网络的持续学习模型相结合，融入字体库生成算法，突出字符细节，且突破时效性，保留个人字体风格。

具体的，建立手写数据库的步骤包括：

如图6所示，样本中每一个汉字就代表每个输入，将每个输入，映射到三个空间，得到三个向量：查询变量q、键变量k和值变量v。图6中的Wq、Wk和Wv分别为外线性映射参数矩阵。

接下来，计算查询向量q和键向量k的乘积q·k作为注意力大小。

下一步，进行归一化处理，并施以softmax激活函数，得到：

将该值成义便利V得到输出向量序列H。

最后，将输出向量序列求和得到输出结果Z。

这样，本实施例通过进行特征转移，将输入汉字的特征转移至目标生成文字，获得最后的输出结果，即目标文字成为具有个人手写特征的字体。

进一步的，在一些实施例中，考虑到个人书写习惯可能会发生变化，本实施例中可以在手写输入时需要持续输入解析字体特征，并生成目标文字，使得整个模型基于卷积网络持续改进，最终更为贴合用户实际书写效果。

在一些实施例中，在步骤101之后，该方法还包括：

根据所述文本信息和所述手写文本更新所述手写数据库。

需要理解的是，由于模板所能提供的内容是有限的，而对于模板中不存在的手写数据是通过模型预测的，因此，对于手写数据的预测模拟结果可能存在偏差，这可能导致无法正确预测模拟相应的文本信息。

本实施例中，进一步保持对于手写数据库的不断更新，实施时，可以根据预测成功的文本信息以及未预测成功的文本信息不断对手写数据库进行更新，从而不断提高对于手写输入的预测结果的精度和可靠性。

本实施例的技术方案中，该步骤102包括：

解析所述手写操作输入获得笔划信息；

本实施例的技术方案中，在目标对象进行手写输入过程中，对用户已经撰写完成的部分进行解析，用户已经撰写的部分可能包括一个或多个笔划，将这些笔划的信息与手写数据库进行匹配，以确认这些笔划所匹配的文本。

可以理解的是，对于目标对象来说，其撰写相同的文字必然具有一定的相似性，因此，通过已经撰写完成的笔划和形状和手写数据库进行匹配，能够对笔划所对应的文字进行相对准确的预测。

相关技术中，需要在文字完全完成之后，进行文字的识别，而相关技术中对于笔划的识别仅能够针对笔划先后顺序，对符合其笔划顺序的文字进行筛选，然而很多用户的撰写习惯于实际的笔划存在差异，例如，书写“我”字的时候，第一步为从右向左撰写的撇，然而在行书等书写习惯中，“我”字的第一笔的书写方式为从左向右，这很会导致该笔划被识别为横。

而本实施例中，对用户已经撰写完成的部分进行识别之后，将其形状与手写数据库进行匹配，能够相对准确的预测用户手写的文字。

步骤103：生成与所述目标文本对应的输出结果。

本实施例中，可以选择以不同的模式生成输出结果。

在其中一个实施例中，输出结果为目标文本的标准字体，示例性的，可以将目标文本以宋体、楷体等标准字体的方式通过文档输出或保存。

在另外一个实施例中，输出结果也可以是手写字体，示例性的，可以以手写字体的方式将输入结果保存在记事本、文档文件中。

通过提供不同的输出方式，能够满足不同的使用需求，提高用户体验。

如图7所示，进一步的，在完成对于一个文字的撰写之后，还可以进一步结合通常的表达习惯或该用户的书写习惯对后续文字或词组等进行预测，以提高手写输入速度。

示例性的，本实施例中，在完成“智”的手写之后，进一步预测词组可能是“智能”、“智力”、“智慧”或“智商”，在完成“手”的手写之后，进一步预测词组可能是“手术”、“手写”或“手机”。

如图8所示，本实施例的技术方案可以概括为，首先采集用户的手写数据，然后对手写笔迹进行处理和美化，建立用户的手写数据库。

在用户进行手写输入时，如果用户关闭了预测模式，则直接输出用户的手写笔迹。

如果用户选择了预测模式，则对用户的手写输入进行手写识别，然后与手写数据库进行匹配，并进一步输出匹配的结果。

可以理解的是，这一过程中，如果手写笔迹和相应文本的对应关系已经存在于手写数据库中，可以根据本次的手写输入对手写数据库进行持续的优化，如果不存在与手写数据库中或者手写数据库无法有效的匹配该手写笔迹，也可以参照建立手写数据库的过程，根据本次的手写笔迹对手写数据库的识别匹配预测进行持续的学习。

本申请实施例还提供一种手写处理装置。

如图9所示，在一个实施例中，该手写处理装置900包括：

接收模块901，用于接收目标对象的手写操作输入；

预测模块902，用于根据与所述目标对象对应的手写数据库预测所述手写操作输入对应的目标文本，其中，所述目标文本为所述手写数据库中的文本数据；

生成模块903，用于生成与所述目标文本对应的输出结果。

在一些实施例中，所述预测模块802包括：

解析子模块，用于解析所述手写操作输入获得笔划信息；

在一些实施例中，还包括：

采集模块，用于采集所述目标用户的书写数据，其中，所述书写数据包括笔划、文字、字母、符号中的一项或多项；

数据库建立模块，用于根据所述书写数据建立与所述目标用户对应的手写数据库。

在一些实施例中，所述数据库建立模块包括：

提取子模块，用于提取所述书写数据的图像的特征向量，其中，所述特征向量包括查询向量、键向量和值向量；

确定子模块，用于根据所述查询向量和所述键向量的乘积确定所述特征向量的注意力值；

处理子模块，用于对所述注意力值进行归一化处理，并将归一化处理后的注意力值和所述值向量的乘积作为输出向量序列；

建立子模块，用于根据所述输出向量序列和所述书写数据对应的文本数据之间的对应关系建立与所述目标用户对应的手写数据库。

在一些实施例中，所述采集模块包括：

输入接收子模块，用于接收数据采集输入；

优化子模块，用于去除根据所述数据采集输入生成的手写笔迹的干扰点，其中，所述干扰点包括游离点和冗余点中的至少一项，所述游离点是根据所述数据采集输入的采样点的压力和/或所述采样点之间的相对位置确定的，所述冗余点是根据存在交叠的所述采样点确定的；

平滑处理子模块，用于对去除所述干扰点的所述手写笔迹进行平滑处理；

书写数据确认子模块，用于将平滑处理后的所述手写笔迹作为所述书写数据。

在一些实施例中，还包括：

文本识别模块，用于在所述手写数据库中不存在与所述手写操作输入对应的目标文本的情况下，识别根据所述手写操作输入得到的手写文本对应的文本信息；

数据库更新模块，用于根据所述文本信息和所述手写文本更新所述手写数据库。

本实施例的手写处理装置900能够实现上述手写处理方法实施例的各个步骤，并能实现基本相同的技术效果，此处不再赘述。

本申请实施例还提供一种电子设备。请参见图10，电子设备可以包括处理器1001、存储器1002及存储在存储器1002上并可在处理器1001上运行的程序10021。

程序10021被处理器1001执行时可实现上述方法实施例中的任意步骤及达到相同的有益效果，此处不再赘述。

本领域普通技术人员可以理解实现上述实施例方法的全部或者部分步骤是可以通过程序指令相关的硬件来完成，所述的程序可以存储于一可读取介质中。

本申请实施例还提供一种可读存储介质，所述可读存储介质上存储有计算机程序，所述计算机程序被处理器执行时可实现上述方法实施例中的任意步骤，且能达到相同的技术效果，为避免重复，这里不再赘述。

所述的存储介质，如只读存储器(Read-Only Memory，ROM)、随机存取存储器(Random Access Memory，RAM)、磁碟或者光盘等。

需要说明的是，应理解以上各个模块的划分仅仅是一种逻辑功能的划分，实际实现时可以全部或部分集成到一个物理实体上，也可以物理上分开。且这些模块可以全部以软件通过处理元件调用的形式实现；也可以全部以硬件的形式实现；还可以部分模块通过处理元件调用软件的形式实现，部分模块通过硬件的形式实现。例如，确定模块可以为单独设立的处理元件，也可以集成在上述装置的某一个芯片中实现，此外，也可以以程序代码的形式存储于上述装置的存储器中，由上述装置的某一个处理元件调用并执行以上确定模块的功能。其它模块的实现与之类似。此外这些模块全部或部分可以集成在一起，也可以独立实现。这里所述的处理元件可以是一种集成电路，具有信号的处理能力。在实现过程中，上述方法的各步骤或以上各个模块可以通过处理器元件中的硬件的集成逻辑电路或者软件形式的指令完成。

例如，各个模块、单元、子单元或子模块可以是被配置成实施以上方法的一个或多个集成电路，例如：一个或多个特定集成电路(Application Specific IntegratedCircuit，ASIC)，或，一个或多个微处理器(digital signal processor，DSP)，或，一个或者多个现场可编程门阵列(Field Programmable Gate Array，FPGA)等。再如，当以上某个模块通过处理元件调度程序代码的形式实现时，该处理元件可以是通用处理器，例如中央处理器(Central Processing Unit，CPU)或其它可以调用程序代码的处理器。再如，这些模块可以集成在一起，以片上***(system-on-a-chip，SOC)的形式实现。

以上所述是本申请实施例的优选实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本申请所述原理的前提下，还可以作出若干改进和润饰，这些改进和润饰也应视为本申请的保护范围。

Claims

1.一种手写处理方法，其特征在于，包括以下步骤：

接收目标对象的手写操作输入；

生成与所述目标文本对应的输出结果。

2.如权利要求1所述的方法，其特征在于，所述根据与所述目标对象对应的手写数据库预测所述手写操作输入对应的目标文本，包括：

解析所述手写操作输入获得笔划信息；

3.如权利要求1所述的方法，其特征在于，所述根据与所述目标对象对应的手写数据库预测所述手写操作输入对应的目标文本之前，所述方法还包括：

根据所述书写数据建立与所述目标用户对应的手写数据库。

4.如权利要求3所述的方法，其特征在于，所述根据所述书写数据建立与所述目标用户对应的手写数据库，包括：

5.如权利要求3所述的方法，其特征在于，所述采集所述目标用户的书写数据，包括：

接收数据采集输入；

对去除所述干扰点的所述手写笔迹进行平滑处理；

将平滑处理后的所述手写笔迹作为所述书写数据。

6.如权利要求1所述的方法，其特征在于，所述接收目标对象的手写操作输入之后，所述方法还包括：

根据所述文本信息和所述手写文本更新所述手写数据库。

7.一种手写处理装置，其特征在于，包括：

接收模块，用于接收目标对象的手写操作输入；

生成模块，用于生成与所述目标文本对应的输出结果。

8.如权利要求7所述的装置，其特征在于，所述预测模块包括：

解析子模块，用于解析所述手写操作输入获得笔划信息；

9.一种电子设备，包括：存储器、处理器及存储在所述存储器上并可在所述处理器上运行的程序；其特征在于，所述处理器，用于读取存储器中的程序实现如权利要求1至6中任一项所述的手写处理方法中的步骤。

10.一种可读存储介质，用于存储程序，其特征在于，所述程序被处理器执行时实现如权利要求1至6中任一项所述的手写处理方法中的步骤。