CN111144191B

CN111144191B - 字体识别方法、装置、电子设备及存储介质

Info

Publication number: CN111144191B
Application number: CN201910750071.6A
Authority: CN
Inventors: 周林
Original assignee: Guangdong Genius Technology Co Ltd
Current assignee: Guangdong Genius Technology Co Ltd
Priority date: 2019-08-14
Filing date: 2019-08-14
Publication date: 2024-03-22
Anticipated expiration: 2039-08-14
Also published as: CN111144191A

Abstract

本发明实施例公开了一种字体识别方法、装置、电子设备及存储介质，所述方法包括：首先获取目标文档图像，并从目标文档图像中获取待识别字符；接着将待识别字符输入预设的手写体特征识别模型中，得到待识别字符属于手写字体类型的第一评价值；然后将待识别字符输入预设的印刷体特征识别模型中，得到待识别字符属于印刷字体类型的第二评价值；最后根据第一评价值和第二评价值，确定待识别字符属于的字体类型。这样，通过预先构建不同字体类型的特征识别模型，使得可以根据不同特征识别模型获取到目标文档图像中的各个字符属于不同字体类型的评价值，从而基于评价值识别到各个字符的字体类型，实现了对文档图像进行字体识别。

Description

字体识别方法、装置、电子设备及存储介质

技术领域

本发明涉及字体处理技术领域，尤其涉及一种字体识别方法、装置、电子设备及存储介质。

背景技术

文档通常包含了两类字体，即手写字体和印刷字体。其中，印刷字体的字体类型包括较少种类(如宋体、楷体以及黑体等)，手写字体的字体类型包括较多种类，通过两种字体均可以进行信息传递。

考虑到文档图像中通常混合了手写字符和印刷体字符，但是，往往手写字符为关注信息，而印刷体字符为非关注信息，这样，手写字符和印刷体字符混合而导致无法准确地对该文档图像中的手写字符进行字符处理，因此，如何将文档图像中的字符进行字体识别是亟需解决的问题。

发明内容

本发明实施例公开了一种字体识别方法、装置、电子设备及存储介质，通过预先构建不同字体类型的特征识别模型，使得可以根据不同特征识别模型获取到目标文档图像中的各个字符属于不同字体类型的评价值，从而基于评价值识别到各个字符的字体类型，实现了对文档图像进行字体识别，避免了由于文档图像中混合手写字体和印刷字体导致的无法准确对手写字符进行字符处理的问题。

根据本发明实施例的第一方面，公开了一种字体识别方法，所述方法包括：

获取目标文档图像，并从所述目标文档图像中获取待识别字符；

将所述待识别字符输入预设的手写体特征识别模型中，得到所述待识别字符属于手写字体类型的第一评价值；

将所述待识别字符输入预设的印刷体特征识别模型中，得到所述待识别字符属于印刷字体类型的第二评价值；

根据所述第一评价值和所述第二评价值，确定所述待识别字符属于的字体类型。

作为一种可选的实施方式，在本发明实施例的第一方面中，在所述将所述待识别字符输入预设的手写体特征识别模型中，得到所述待识别字符属于手写字体类型的第一评价值之前，所述方法还包括：

获取手写字符样本；

对所述手写字符样本进行手写体特征提取得到手写体特征；

通过所述手写体特征构建所述手写体特征识别模型。

作为一种可选的实施方式，在本发明实施例的第一方面中，在所述将所述待识别字符输入预设的印刷体特征识别模型中，得到所述待识别字符属于印刷字体类型的第二评价值之前，所述方法还包括：

获取印刷字符样本；

对所述印刷字符样本进行印刷体特征提取得到印刷体特征；

通过所述印刷体特征构建所述印刷体特征识别模型。

作为一种可选的实施方式，在本发明实施例的第一方面中，所述根据所述第一评价值和所述第二评价值，确定所述待识别字符属于的字体类型，包括：

对所述第一评价值和所述第二评价值进行比较；

在所述第一评价值大于所述第二评价值的情况下，确定所述待识别字符为手写字体；

在所述第一评价值小于所述第二评价值的情况下，确定所述待识别字符为印刷字体；

在所述第一评价值等于所述第二评价值的情况下，根据所述待识别字符的上一相邻字符的字体识别结果，以及所述待识别字符的下一相邻字符的字体识别结果，确定所述待识别字符属于的字体类型。

作为一种可选的实施方式，在本发明实施例的第一方面中，在所述根据所述第一评价值和所述第二评价值，确定所述待识别字符属于的字体类型之后，所述方法还包括：

在所述目标文档图像中的全部字符识别完成后，将所述目标文档图像进行图像划分得到至少一个单个试题区域；

获取每个所述单个试题区域中的待分析手写区域；

将所述待分析手写区域中的手写字符串与预设字符串进行匹配，获取每个所述单个试题区域的手写匹配值。

作为一种可选的实施方式，在本发明实施例的第一方面中，在所述将所述待分析手写区域中的手写字符串与预设字符串进行匹配，获取每个所述单个试题区域的手写匹配值之后，还包括：

在任一所述单个试题区域的手写匹配值小于或者等于匹配阈值的情况下，将任一所述单个试题区域中的手写字符串和所述预设字符串进行输出比对。

作为一种可选的实施方式，在本发明实施例的第一方面中，所述获取目标文档图像，包括：

接收终端设备输入的目标文档图像；

在所述根据所述第一评价值和所述第二评价值，确定所述待识别字符属于的字体类型之后，所述方法还包括：

在所述目标文档图像中的全部字符识别完成后，获取所述目标文档图像中包括的待识别手写字符串；

识别所述待识别手写字符串，并将所述待识别手写字符串的识别结果发送至所述终端设备，以便所述终端设备展示所述识别结果。

根据本发明实施例的第二方面，公开了一种字体识别装置，所述装置包括：

图像获取模块，用于获取目标文档图像；

字符获取模块，用于从所述目标文档图像中获取待识别字符；

第一评价值获取模块，用于将所述待识别字符输入预设的手写体特征识别模型中，得到所述待识别字符属于手写字体类型的第一评价值；

第二评价值获取模块，用于将所述待识别字符输入预设的印刷体特征识别模型中，得到所述待识别字符属于印刷字体类型的第二评价值；

字体类型确定模块，用于根据所述第一评价值和所述第二评价值，确定所述待识别字符属于的字体类型。

作为一种可选的实施方式，在本发明实施例的第二方面中，所述装置还包括：

手写字符样本获取模块，用于获取手写字符样本；

手写体特征提取模块，用于对所述手写字符样本进行手写体特征提取得到手写体特征；

手写体特征识别模型构建模块，用于通过所述手写体特征构建所述手写体特征识别模型。

印刷字符样本获取模块，用于获取印刷字符样本；

印刷体特征提取模块，用于对所述印刷字符样本进行印刷体特征提取得到印刷体特征；

印刷体特征识别模型构建模块，用于通过所述印刷体特征构建所述印刷体特征识别模型。

作为一种可选的实施方式，在本发明实施例的第二方面中，所述字体类型确定模块，具体用于对所述第一评价值和所述第二评价值进行比较；

单个试题区域获取模块，用于在所述目标文档图像中的全部字符识别完成后，将所述目标文档图像进行图像划分得到至少一个单个试题区域；

待分析手写区域获取模块，用于获取每个所述单个试题区域中的待分析手写区域；

手写匹配值获取模块，用于将所述待分析手写区域中的手写字符串与预设字符串进行匹配，获取每个所述单个试题区域的手写匹配值。

输出模块，用于在任一所述单个试题区域的手写匹配值小于或者等于匹配阈值的情况下，将任一所述单个试题区域中的手写字符串和所述预设字符串进行输出比对。

作为一种可选的实施方式，在本发明实施例的第二方面中，所述图像获取模块，用于接收终端设备输入的目标文档图像；

所述装置还包括：

待识别手写字符串获取模块，用于在所述目标文档图像中的全部字符识别完成后，获取所述目标文档图像中包括的待识别手写字符串；

字符串处理模块，用于识别所述待识别手写字符串，并将所述待识别手写字符串的识别结果发送至所述终端设备，以便所述终端设备展示所述识别结果。

根据本发明实施例的第三方面，公开了一种电子设备，所述电子设备包括：

存储有可执行程序代码的存储器；

与所述存储器耦合的处理器；

所述处理器调用所述存储器中存储的所述可执行程序代码，执行本发明实施例第一方面所述的字体识别方法的步骤。

根据本发明实施例的第四方面，公开了一种计算机可读存储介质，所述计算机可读存储介质存储计算机程序，其中，所述计算机程序使得计算机执行本发明实施例第一方面所述的字体识别方法。

与现有技术相比，本发明实施例具备以下有益效果：

本发明实施例中，首先获取目标文档图像，并从所述目标文档图像中获取待识别字符；接着将所述待识别字符输入预设的手写体特征识别模型中，得到所述待识别字符属于手写字体类型的第一评价值；然后将所述待识别字符输入预设的印刷体特征识别模型中，得到所述待识别字符属于印刷字体类型的第二评价值；最后根据所述第一评价值和所述第二评价值，确定所述待识别字符属于的字体类型。这样，通过预先构建不同字体类型的特征识别模型，使得可以根据不同特征识别模型获取到目标文档图像中的各个字符属于不同字体类型的评价值，从而基于评价值识别到各个字符的字体类型，实现了对文档图像进行字体识别，避免了由于文档图像中混合手写字体和印刷字体导致的无法准确对手写字符进行字符处理的问题。

附图说明

为了更清楚地说明本发明实施例中的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本发明实施例公开的一种字体识别方法的流程示意图；

图2是本发明实施例公开的另一种字体识别方法的流程示意图；

图3是本发明实施例公开的另一种字体识别方法的流程示意图；

图4是本发明实施例公开的另一种字体识别方法的流程示意图；

图5是本发明实施例公开的另一种字体识别装置的结构示意图；

图6是本发明实施例公开的另一种字体识别装置的结构示意图；

图7是本发明实施例公开的另一种字体识别装置的结构示意图；

图8是本发明实施例公开的另一种字体识别装置的结构示意图；

图9是本发明实施例公开的另一种字体识别装置的结构示意图；

图10是本发明实施例公开的另一种字体识别装置的结构示意图；

图11是本发明实施例公开的一种电子设备的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

需要说明的是，本发明实施例的术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、***、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

首先，对本发明的应用场景进行描述，本发明可以应用于字体识别场景，通常可以将文档图像输入至电子设备，以便电子设备将文档图像中的各个字符进行字体识别。示例地，若该文档图像为试卷图像，则可以通过本发明所述的字体识别方法，识别出该试卷图像中的试题部分以及答题部分，从而电子设备检测该答题部分是否正确。可见，通过本发明所述的字体识别方法，实现了准确进行字体识别，从而使得可以对用户关注的手写体字符进行字符处理，避免了文档图像中混合手写字体和印刷字体导致的无法准确对手写字符进行字符处理的问题。

下面结合具体实施例对本发明进行详细说明。

图1是本发明实施例公开的一种字体识别方法的流程示意图，该方法可以应用于电子设备，如图1所示，该方法可以包括以下步骤：

S101、获取目标文档图像，并从目标文档图像中获取待识别字符。

在本发明实施例中，该电子设备中可以设置有摄像头，从而可以通过该摄像头采集该目标文档图像；或者，可以通过与该电子设备绑定的终端设备采集该目标文档图像，从而通过终端设备将该目标文档图像发送至该电子设备，其中，该终端设备可以为移动终端或者扫描设备等等。

示例地，该目标文档图像可以为试卷对应的图像，也可以是病例对应的图像，还可以账单票据对应的图像等等，上述示例只是举例说明，本发明对此不作限定。

在一种可能的实现方式中，可以首先对该目标文档图像进行图像预处理(如灰度化处理以及二值化处理等)；接着对该预处理后的目标文档图像进行图像分割，以使得预处理后的目标文档图像包括的各个字符分割开，如可以采用左右分割方法以及上下分割方法实现图像分割；然后本发明可以依次对该各个字符进行字体识别，因此，该待识别字符可以为该各个字符中的任一字符。

S102、将待识别字符输入预设的手写体特征识别模型中，得到待识别字符属于手写字体类型的第一评价值。

在本发明实施例中，可以在本步骤之前，通过以下步骤预先构建该手写体特征识别模型：

首先、获取手写字符样本。

其中，由于不同用户的书写方式不同，从而使得手写字符存在差异性，因此，为了使得本发明中的手写体特征识别模型的识别准确率较高，本发明可以采集数据量较大的手写字符样本，以及采集不同用户的手写字符样本。

接着、对手写字符样本进行手写体特征提取得到手写体特征。

在本发明实施例中，该手写体特征可以为手写字体比例特征、手写字体轮廓特征、手写字体笔划特征、手写字体笔划密度特征等等。

然后、通过手写体特征构建手写体特征识别模型。

在本发明实施例中，可以将该手写体特征输入至第一预设训练模型，使得对该第一预设训练模型进行多次训练，以便训练完成的手写体特征识别模型的识别准确率大于或者等于第一准确率阈值。其中，该第一预设训练模型可以为神经网络模型等。

S103、将待识别字符输入预设的印刷体特征识别模型中，得到待识别字符属于印刷字体类型的第二评价值。

在本发明实施例中，可以在本步骤之前，通过以下步骤预先构建该印刷体特征识别模型：

首先、获取印刷字符样本。

其中，由于印刷字符包括多种类型，如宋体、楷体、黑体等，因此，为了使得印刷体特征识别模型可以针对各个类型的印刷体字符的识别准确率较高，本发明可以采集数据量较大的印刷字符样本，以及采集不同类型的印刷字符样本。

接着、对印刷字符样本进行印刷体特征提取得到印刷体特征。

在本发明实施例中，该印刷体特征可以为印刷字体比例特征、印刷字体轮廓特征、印刷字体笔划特征、印刷字体笔划密度特征等等。

然后、通过印刷体特征构建印刷体特征识别模型。

在本发明实施例中，可以将该印刷体特征输入至第二预设训练模型，使得对该第二预设训练模型进行多次训练，以便训练完成的印刷体特征识别模型的识别准确率大于或者等于第二准确率阈值，该第一预设训练模型与该第二预设训练模型可以为相同类型的模型。

需要说明的是，由于印刷体可以包括宋体、楷体、黑体等多种类型，并且宋体、楷体、黑体等之间存在差异，如宋体、楷体均属于衬线字体，黑体属于非衬线字体，因此，本发明还可以针对不同类型的印刷体构建对应的特征识别模型，从而可以将待识别字符输入至不同类型的印刷体对应的特征识别模型中，以得到该待识别字符属于不同类型的印刷体的评价值，以便后续步骤中可以基于该待识别字符属于不同类型的印刷体的评价值，以及该待识别字符属于手写字体类型的第一评价值，确定待识别字符的字体类型，上述实现方式只是举例说明，本发明对此不作限定。

S104、根据第一评价值和第二评价值，确定待识别字符属于的字体类型。

在本步骤中，可以首先对该第一评价值和该第二评价值进行比较，在该第一评价值大于该第二评价值的情况下，确定该待识别字符为手写字体；在该第一评价值小于该第二评价值的情况下，确定该待识别字符为印刷字体；在第一评价值等于该第二评价值的情况下，可以根据待识别字符的上一相邻字符的字体识别结果，以及待识别字符的下一相邻字符的字体识别结果，确定待识别字符属于的字体类型，进一步地，在该待识别字符的上一相邻字符的字体识别结果，以及待识别字符的下一相邻字符的字体识别结果均为手写字体的情况下，确定该待识别字符为手写字体，在该待识别字符的上一相邻字符的字体识别结果，以及待识别字符的下一相邻字符的字体识别结果均为印刷字体的情况下，确定该待识别字符为印刷字体，在该待识别字符的上一相邻字符的字体识别结果，以及待识别字符的下一相邻字符的字体识别结果为不同字体类型的情况下，该电子设备可以生成人工字体确认消息，并将该人工字体确认消息发送至终端设备，以便终端设备向用户展示待识别字符，并且展示待识别字符的字体选择框，用户可以在该字体选择框中输入待识别字符的字体类型，并点击确认按钮，从而终端设备将用户选择的字体类型作为待识别字符属于的字体类型。

需要说明的是，为了提高手写体特征识别模型和印刷体特征识别模型的准确率，本发明可以通过人工确认结果对手写体特征识别模型和印刷体特征识别模型进行进一步训练，例如，若待识别字符的人工确认结果为手写字体，则将该待识别字符输入至手写体特征识别模型，以对手写体特征识别模型进行训练得到训练完成的手写体特征识别模型；若待识别字符的人工确认结果为印刷字体，则将该待识别字符输入至印刷体特征识别模型，以对印刷体特征识别模型进行训练得到训练完成的印刷体特征识别模型。

采用上述方法，首先获取目标文档图像，并从目标文档图像中获取待识别字符；接着将待识别字符输入预设的手写体特征识别模型中，得到待识别字符属于手写字体类型的第一评价值；然后将待识别字符输入预设的印刷体特征识别模型中，得到待识别字符属于印刷字体类型的第二评价值；最后根据第一评价值和第二评价值，确定待识别字符属于的字体类型。可见，本发明中考虑到手写字体和印刷字体之间存在特征差异性，因此，可以预先构建不同字体类型的特征识别模型，使得可以根据不同特征识别模型获取到目标文档图像中的各个字符属于不同字体类型的评价值，从而基于评价值识别到各个字符的字体类型，实现了对文档图像进行字体识别，避免了由于文档图像中混合手写字体和印刷字体导致的无法准确对手写字符进行字符处理的问题。

图2是本发明实施例公开的一种字体识别方法的流程示意图，如图2所示，该方法可以包括以下步骤：

S201、电子设备获取目标文档图像，并从目标文档图像中获取待识别字符。

具体过程可以参考步骤S101，不再赘述。

S202、电子设备将待识别字符输入预设的手写体特征识别模型中，得到待识别字符属于手写字体类型的第一评价值。

具体过程可以参考步骤S102，不再赘述。

S203、电子设备将待识别字符输入预设的印刷体特征识别模型中，得到待识别字符属于印刷字体类型的第二评价值。

具体过程可以参考步骤S103，不再赘述。

S204、电子设备根据第一评价值和第二评价值，确定待识别字符属于的字体类型。

具体过程可以参考步骤S104，不再赘述。

S205、在目标文档图像中的全部字符识别完成后，电子设备将目标文档图像进行图像划分得到至少一个单个试题区域。

由于该目标文档图像中可能包括多个试题，并且通常每个试题之间存在划分标识，因此，可以通过划分标识将该目标文档图像中的多个试题进行划分得到每个试题分别对应的单个试题区域。示例地，该划分标识可以为题目编号，等等，本发明对此不作限定。

S206、电子设备获取每个该单个试题区域中的待分析手写区域。

在本发明实施例中，考虑到该单个试题区域可能包括单行文本，也可能包括多行文本，因此，本发明可以首先对该单个试题区域进行多行文本检测；接着在检测到单个试题区域中包括单行文本的情况下，将该单行文本进行字符划分，即可以获取单行文本中连续为同一字体类型的目标字符，并将该目标字符所在区域确定为字符区域，该字符区域可以为待分析手写体区域，或者印刷体区域，即在该目标字符均为手写体的情况下，该字符区域即为待分析手写体区域，在该目标字符均为印刷体的情况下，该字符区域即为印刷体区域；在检测到单个试题区域中包括了多行文本的情况下，需要将该多行文本进行文本分割得到多个单行文本，以便通过多个单行文本对单个试题区域进行字符划分。其中，可以按照多个单行文本的先后行顺序，逐行获取连续为同一字体类型的目标字符，并将该目标字符所在区域确定为字符区域，同样地，该字符区域可以为待分析手写体区域，或者印刷体区域，即在该目标字符均为手写体的情况下，该字符区域即为待分析手写体区域，在该目标字符均为印刷体的情况下，该字符区域即为印刷体区域。

可见，本发明可以将单个试题区域进行字符划分，得到至少一个待分析手写体区域；或者；至少一个待分析手写体区域和至少一个印刷体区域。示例地，考虑到该单个试题区域对应的试题可能是选择题，也可能是开放性试题，还可能是填空题，又可能是听写题。因此，在该单个试题区域中包括开放性试题的情况下，则该单个试题区域划分为单个印刷体区域(即开放性试题所在区域)以及单个待分析手写体区域(即用户针对该开放性试题的答题区域)；在该单个试题区域中包括选择题的情况下，则该单个试题区域可以划分为多个印刷体区域(即选择题的题干区域、以及各个待选择项所在区域等)以及单个待分析手写体区域(即用户针对选择题的选项输入区域)；在该单个试题区域中包括填空题的情况下，则该单个试题区域可以划分为至少一个印刷体区域(即填空题的至少一个题干区域)以及至少一个待分析手写体区域(即用户针对填空题的至少一个文本输入区域)；需要说明的是，若本发明应用于听写场景，即用户通过听取到的音频信息进行文档书写，则该单个试题区域划分为至少一个待分析手写体区域(即针对听写题的至少一个文本输入区域)以及至少一个印刷体区域(即听写纸上存在的印刷体对应的区域)，等等。

S207、电子设备将待分析手写区域中的手写字符串与预设字符串进行匹配，获取每个该单个试题区域的手写匹配值。

在本发明实施例中，该预设字符串可以为预先设置的该单个试题区域对应的试题的答案。其中，若某单个试题区域中的待分析手写区域为选择题的选项输入区域，则该预设字符串即为选择题的标准选项，此时，在待分析手写体区域中手写字符串与预设字符串相同的情况下，该某单个试题区域的手写匹配值可以为第一数值(如100％)；在待分析手写区域中手写字符串与预设字符串不相同的情况下，该某单个试题区域的手写匹配值可以为第二数值(如0)；若某单个试题区域中的待分析手写区域为开放性试题的答题区域，则该预设字符串即为开放性试题的参***，此时，本发明需要通过对待分析手写体区域中手写字符串进行语义分析得到第一语义分析结果，并对该预设字符串进行语义分析得到第二语义分析结果，从而通过对该第一语义分析结果和第二语义分析结果进行匹配，以得到该某单个试题区域的手写匹配值；若某单个试题区域中的待分析手写区域为填空题的文本输入区域，则该预设字符串即为填空题的标准答案，此时，在某个待分析手写体区域中手写字符串与预设字符串相同的情况下，该某个待分析手写体区域的区域匹配值可以为第一数值，在某个待分析手写体区域中手写字符串与预设字符串不相同的情况下，该某个待分析手写体区域的区域匹配值可以为第二数值，这样，可以计算该某单个试题区域中全部待分析手写区域的区域匹配值之间的和值，得到该某单个试题区域的手写匹配值；若某单个试题区域中的待分析手写区域为听写题的单个文本输入区域，则该预设字符串可以为听写题的标准答案，此时，在单个待分析手写体区域中手写字符串与预设字符串相同的情况下，该某单个试题区域的手写匹配值可以为第一数值；在单个待分析手写区域中手写字符串与预设字符串不相同的情况下，该某单个试题区域的手写匹配值可以为第二数值，上述示例只是举例说明，本发明对此不作限定。

可见，通过上述步骤，电子设备可以识别到单个试题区域中的答题部分，从而智能地对答题部分进行审批，从而提高了审批效率，避免了相关技术中人工审批造成的审批效率较低的问题。

S208、在任一该单个试题区域的手写匹配值小于或者等于匹配阈值的情况下，将任一该单个试题区域中的手写字符串和预设字符串进行输出比对。

在本步骤中，考虑到学生用户的答题存在错误，或者存在偏差，因此，本发明可以将标准答案以及学生用户的错误答案共同展示，以便学生用户可以进一步地分析答题思路中存在的问题，从而提高了学习效率。示例地，本发明可以将手写字符串和预设字符串按照不同的字符样式进行展示，即该手写字符串按照第一字符样式进行展示，以及预设字符串按照第二字符样式进行展示，例如，该第一字符样式可以为四号字体、黑色字体等，该第二字符样式可以为三号字体、加粗、红色字体等，从而使得学生用户可以快速识别到需要查看的字符串，提高了查看效率。

当然，本发明在任一单个试题区域的手写匹配值小于或者等于匹配阈值的情况下，还可以将该任一单个试题区域对应的试题进行标注，从而可以将标注的试题存储至错题数据库中，进而电子设备按照预设周期将该错题数据库中的试题发送至学生用户配置的终端设备上，以便学生用户可以将错题数据库中的全部试题重新解答，避免了从每个文档中依次查找错题的繁琐过程。其中，在学生用户将错题数据库中的某个试题解答完成后，可以重新获取该某个试题的新手写匹配值，若重新获取的新手写匹配值大于匹配阈值，则将该某个试题从错题数据库中删除；若重新获取的新手写匹配值仍小于或者等于匹配阈值，则保持该某个试题存储至该错题数据库中，这样，可以实现对该错题数据库进行更新，从而更加符合学生用户当前的学***，进而智能性地针对学生用户加强错题训练。

在本发明的一可选实施例中，考虑到学生用户将某一单个试题区域中的试题做错，可能为学生用户粗心导致，还可能为学生用户并未完全掌握某一试题的试题类型导致。基于此，本发明在完成输出比对之后，可以向学生用户展示错题分析选择框，该错题分析选择框可以包括第一触发控件和第二触发控件，该第一触发控件可以为粗心导致的试题错误对应的控件，该第二触发控件可以为试题类型未掌握导致的试题错误对应的控件。这样，在学生用户触发该第一触发控件的情况下，确定该某一单个试题区域中的试题完成试题分析过程；在学生用户触发该第二触发控件的情况下，可以获取该某一试题区域中的试题对应的试题类型，并从题库中，获取该试题类型的多个试题样本，并将该多个试题样本向学生用户进行展示，以便用户可以将展示的多个试题样本进行练习，从而加深学生用户对同一类型试题的理解。需要说明的是，由于上述过程是由学生用户确定错题原因，本发明为了提升智能性，可以通过以下方式确定错题原因：在完成输出比对之后，获取任一该单个试题区域中试题对应的试题类型，并从题库中，获取该试题类型的测试试题，并将该测试试题向学生用户进行展示，以及根据用户对测试试题的解答内容，重新获取学生用户对该试题类型的试题的解答匹配值，从而在解答匹配值小于或者等于匹配阈值的情况下，确定该学生用户的错题原因可能为试题类型未掌握；在解答匹配值大于匹配阈值的情况下，确定该学生用户的错题原因可能为粗心，无需人工确定试题错误原因，提高了用户的使用体验。

在本发明的另一可选实施例中，考虑到学生用户的学***；若该总得分大于得分阈值，则无需传输该目标文档图像。这样，可以针对学生用户本次的测试成绩，以确定是否需要及时通知家长，从而在学生用户的测试成绩较差的情况下，家长可以对学生用户进行辅导帮助以及加强监督力度。

采用上述方法，本发明中考虑到手写字体和印刷字体之间存在特征差异性，因此，可以预先构建不同字体类型的特征识别模型，使得可以根据不同特征识别模型获取到目标文档图像中的各个字符属于不同字体类型的评价值，从而基于评价值识别到各个字符的字体类型，实现了对文档图像进行字体识别，进而可以获取到文档图像中各个试题的答题部分，并对答题部分进行智能审批，无需人工阅卷，提高了试卷审批效率。

图3是本发明实施例公开的一种字体识别方法的流程示意图，如图3所示，可以包括以下步骤：

S301、电子设备获取目标文档图像，并从目标文档图像中获取待识别字符。

具体过程可以参考步骤S101，不再赘述。

S302、电子设备将待识别字符输入预设的手写体特征识别模型中，得到待识别字符属于手写字体类型的第一评价值。

具体过程可以参考步骤S102，不再赘述。

S303、电子设备将待识别字符输入预设的印刷体特征识别模型中，得到待识别字符属于印刷字体类型的第二评价值。

具体过程可以参考步骤S103，不再赘述。

S304、电子设备根据第一评价值和第二评价值，确定待识别字符属于的字体类型。

具体过程可以参考步骤S104，不再赘述。

S305、在目标文档图像中的全部字符识别完成后，电子设备将目标文档图像进行图像划分得到至少一个单个试题区域。

具体过程参考步骤S205，不再赘述。

S306、电子设备获取每个该单个试题区域中的待分析手写区域。

具体过程可以参考步骤S206，不再赘述。

S307、电子设备将待分析手写区域中的手写字符串与预设字符串进行匹配，获取每个该单个试题区域的手写匹配值。

具体过程可以参考步骤S207，不再赘述。

S308、在任一该单个试题区域的手写匹配值小于或者等于匹配阈值的情况下，电子设备将任一该单个试题区域作为候选试题区域。

在任一该单个试题区域的手写匹配值小于或者等于匹配阈值的情况下，可以确定该学生用户对任一该单个试题区域对应的试题并未完全掌握，因此，可以将任一该单个试题区域作为候选试题区域，以便后续步骤中确定是否为该学生用户讲解该候选试题区域对应的试题；在任一该单个试题区域的手写匹配值大于匹配阈值的情况下，可以确定该学生用户对任一该单个试题区域对应的试题已经完全掌握，因此，无需重复为该学生用户讲解任一该单个试题区域对应的试题。

S309、电子设备从候选试题区域中，获取目标试题区域。

本实施例中考虑到多个学生用户可能对试卷中的同一试题均未完全掌握，因此，本发明在确定多个学生用户均未掌握该同一试题的情况下，可以针对该多个学生用户进行同一试题的试题讲解，从而掌握该同一试题的其他学生用户无需耗费时间进行后续的视频学习。

综上，本步骤可以首先获取每个候选试题区域的错误率，该错误率为第一图像数量与第二图像数量之间的比值，该第一图像数量为多个文档图像中存在候选试题区域的手写匹配值小于或者等于匹配阈值的图像数量，该第二图像数量为多个文档图像的总图像数量，示例地，该多个文档图像可以为一个班级中全部学生的试卷图像；接着判断该错误率是否大于或者等于错误率阈值，若该错误率大于或者等于错误率阈值，则确定该候选试题区域为该目标试题区域，若该错误率小于错误率阈值，则确定该候选试题区域不为目标试题区域。这样，通过每个候选试题区域的错误率，可以对该候选试题区域进行筛选，得到该目标试题区域。

S310、电子设备将目标试题区域对应试题的讲解视频，发送至目标学生用户的终端设备。

在本发明实施例中，若文档图像存在目标试题区域中的手写匹配值小于或者等于匹配阈值，则该文档图像所属学生用户为该目标学生用户，这样，可以针对该同一试题存在答题错误的多个学生用户，发送讲解视频。其中，该讲解视频可以为预先录制的针对每个试题的视频。

S311、目标学生用户的终端设备播放该讲解视频。

在本发明实施例中，为了提高交互，在目标学生用户的终端设备播放该讲解视频之前，可以将该目标学生用户聚合在一个交流群中，并在该交流群中播放该讲解视频，以使得在该讲解视频播放完成后，各个目标学生用户针对该讲解视频进行信息交互。当然，任一目标学生用户还可以通过终端设备向指定用户的用户设备发送交流请求消息，在用户设备响应于该交流请求消息生成同意交流请求的情况下，该指定用户也聚合在该交流群中，从而该指定用户可以与各个目标学生用户进行信息交互。

采用上述方法，本发明中考虑到手写字体和印刷字体之间存在特征差异性，因此，可以预先构建不同字体类型的特征识别模型，使得可以根据不同特征识别模型获取到目标文档图像中的各个字符属于不同字体类型的评价值，从而基于评价值识别到各个字符的字体类型，实现了对文档图像进行字体识别，进而可以获取到文档图像中各个试题的答题部分，并对答题部分进行智能审批，无需人工阅卷，提高了试卷审批效率。另外，针对错误人数较多的试题，本发明可以通过讲解视频的方式，使答错的多个学生对错误试题进行视频学习，从而提高了学习效率。

在本发明的另一场景中，该目标文档图像可以为病例图像，由于病例中的诊断说明通常为医生的手写体，而医生的手写体的识别难度较大，造成患者无法准确识别诊断说明。为了解决该问题，本发明通过字体识别方法，从病例图像中获取到诊断说明，接着对诊断说明进行识别，并将识别结果向患者展示，具体过程可以参考实施例4所述的内容。

图4是本发明实施例公开的一种字体识别方法的流程示意图，如图4所示，可以包括以下步骤：

S401、电子设备接收终端设备输入的目标文档图像，并从目标文档图像中获取待识别字符。

具体过程可以参考步骤S101，不再赘述。

S402、电子设备将待识别字符输入预设的手写体特征识别模型中，得到待识别字符属于手写字体类型的第一评价值。

具体过程可以参考步骤S102，不再赘述。

S403、电子设备将待识别字符输入预设的印刷体特征识别模型中，得到待识别字符属于印刷字体类型的第二评价值。

具体过程可以参考步骤S103，不再赘述。

S404、电子设备根据第一评价值和第二评价值，确定待识别字符属于的字体类型。

具体过程可以参考步骤S104，不再赘述。

步骤S401至S404所述的字体识别方法，可以应用于查看病例的场景，其中，通常病例上的患者基本信息为印刷字体，而医生的诊断说明为手写字体，因此，本发明可以将病例图像中的印刷字体和手写字体进行分类，从而后续步骤中对手写字体的字符进行字符识别。

S405、在目标文档图像中的全部字符识别完成后，电子设备获取目标文档图像中包括的待识别手写字符串。

其中，该待识别手写字符串可以为患者的诊断说明。

S406、电子设备识别待识别手写字符串，并将待识别手写字符串的识别结果发送至终端设备，以便终端设备展示识别结果。

在本发明实施例中，可以通过字符识别模型，识别待识别手写字符串。即将待识别手写字符串中的每个字符分别输入至字符识别模型，得到每个字符对应的字符识别结果，并将该字符识别结果按照字符的先后顺序进行合并得到待识别手写字符串的识别结果。其中，可以预先通过手写字符构建该字符识别模型，在一种可能的实现方式中，该电子设备可以针对不同医院设置有对应的字符识别模型，即采集每个医院中的全部医生的手写字符集合，并通过每个医院对应的手写字符集合训练预设的待训练模型，得到每个医院对应的字符识别模型，这样，电子设备可以在展示页面中设置有各个医院的医院标识，从而用户触发目标医院标识，则确定需要使用的目标字符识别模型为该目标医院标识对应的字符识别模型。当然，本发明也可以为了提高字符识别准确率，也可以针对不同医生设置对应的手写体识别模型，上述示例只是举例说明，本发明对此不作限定。

进一步地，由于该目标文档图像为病例图像，因此，通过字符识别模型得到诊断说明对应的印刷体字符串，此时，终端设备可以向用户展示该印刷体字符串，避免了由于医生手写的诊断说明难以识别导致的用户无法查看病例的问题。当然，在本发明中，该终端设备还可以通过语音播放该印刷体字符串，从而避免了用户读取文本字符串的繁琐操作。

在本发明的一可选实施例中，电子设备可以根据识别结果，获取患者的患病类型，并向患者配置的终端设备发送诊断评价消息，以便患者根据诊断评价消息，对本次就诊进行评价，终端设备将评价结果发送至电子设备，该评价结果可以包括就诊效果、以及就诊服务等等。这样，电子设备可以将同一患病类型的评价结果进行信息聚合，并将信息聚合后的评价结果发送至目标终端设备，该目标终端设备为同一患病类型的患者配置的终端设备，从而实现了信息共享。

采用上述方法，本发明中考虑到手写字体和印刷字体之间存在特征差异性，因此，可以预先构建不同字体类型的特征识别模型，使得可以根据不同特征识别模型获取到目标文档图像中的各个字符属于不同字体类型的评价值，从而基于评价值识别到各个字符的字体类型，实现了对文档图像进行字体识别，进而可以基于字体识别结果得到需要字符识别的待识别手写字符串，以及智能地对待识别手写字符串进行字符识别，解决了现有技术中用户无法准确识别诊断说明的问题。

需要说明的是，对于上述方法实施例，为了简单描述，故将其都表述为一系列的动作组合，但是本领域技术人员应该知悉，本发明并不受所描述的动作顺序的限制。其次，本领域技术人员也应该知悉，说明书中所描述的实施例均属于优选实施例，所涉及的动作和模块并不一定是本发明所必须的。

图5是本发明实施例公开的一种字体识别装置的框图，如图5所示，可以包括以下模块：

图像获取模块501，用于获取目标文档图像；

字符获取模块502，用于从所述目标文档图像中获取待识别字符；

第一评价值获取模块503，用于将所述待识别字符输入预设的手写体特征识别模型中，得到所述待识别字符属于手写字体类型的第一评价值；

第二评价值获取模块504，用于将所述待识别字符输入预设的印刷体特征识别模型中，得到所述待识别字符属于印刷字体类型的第二评价值；

字体类型确定模块505，用于根据所述第一评价值和所述第二评价值，确定所述待识别字符属于的字体类型。

图6是本发明实施例公开的一种字体识别装置的框图，如图6所示，还可以包括以下模块：

手写字符样本获取模块506，用于获取手写字符样本；

手写体特征提取模块507，用于对所述手写字符样本进行手写体特征提取得到手写体特征；

手写体特征识别模型构建模块508，用于通过所述手写体特征构建所述手写体特征识别模型。

图7是本发明实施例公开的一种字体识别装置的框图，如图7所示，还可以包括以下模块：

印刷字符样本获取模块509，用于获取印刷字符样本；

印刷体特征提取模块510，用于对所述印刷字符样本进行印刷体特征提取得到印刷体特征；

印刷体特征识别模型构建模块511，用于通过所述印刷体特征构建所述印刷体特征识别模型。

在本发明的一可选实施例中，所述字体类型确定模块505，具体用于对所述第一评价值和所述第二评价值进行比较；

图8是本发明实施例公开的一种字体识别装置的框图，如图8所示，还可以包括以下模块：

单个试题区域获取模块512，用于在所述目标文档图像中的全部字符识别完成后，将所述目标文档图像进行图像划分得到至少一个单个试题区域；

待分析手写区域获取模块513，用于获取每个所述单个试题区域中的待分析手写区域；

手写匹配值获取模块514，用于将所述待分析手写区域中的手写字符串与预设字符串进行匹配，获取每个所述单个试题区域的手写匹配值。

图9是本发明实施例公开的一种字体识别装置的框图，如图9所示，还可以包括以下模块：

输出模块515，用于在任一所述单个试题区域的手写匹配值小于或者等于匹配阈值的情况下，将任一所述单个试题区域中的手写字符串和所述预设字符串进行输出比对。

图10是本发明实施例公开的一种字体识别装置的框图，如图10所示，所述图像获取模块501，用于接收终端设备输入的目标文档图像；

所述装置还包括：

待识别手写字符串获取模块516，用于在所述目标文档图像中的全部字符识别完成后，获取所述目标文档图像中包括的待识别手写字符串；

字符串处理模块517，用于识别所述待识别手写字符串，并将所述待识别手写字符串的识别结果发送至所述终端设备，以便所述终端设备展示所述识别结果。

采用上述装置，首先获取目标文档图像，并从目标文档图像中获取待识别字符；接着将待识别字符输入预设的手写体特征识别模型中，得到待识别字符属于手写字体类型的第一评价值；然后将待识别字符输入预设的印刷体特征识别模型中，得到待识别字符属于印刷字体类型的第二评价值；最后根据第一评价值和第二评价值，确定待识别字符属于的字体类型。这样，通过预先构建不同字体类型的特征识别模型，使得可以根据不同特征识别模型获取到目标文档图像中的各个字符属于不同字体类型的评价值，从而基于评价值识别到各个字符的字体类型，实现了对文档图像进行字体识别，避免了由于文档图像中混合手写字体和印刷字体导致的无法准确对手写字符进行字符处理的问题。

上述装置实施例的具体内容可以参考方法实施例的叙述，不再赘述。

请参阅图11，图11是本发明实施例公开的一种电子设备的结构示意图。如图11所示，该电子设备可以包括：

存储有可执行程序代码的存储器1101；

与存储器1101耦合的处理器1102；

其中，处理器1102调用存储器1101中存储的可执行程序代码，执行以上各方法实施例中的方法的部分或全部步骤。

本发明实施例还公开一种计算机可读存储介质，其中，计算机可读存储介质存储了程序代码，其中，程序代码包括用于执行以上各方法实施例中的方法的部分或全部步骤的指令。

本发明实施例还公开一种计算机程序产品，其中，当计算机程序产品在计算机上运行时，使得计算机执行如以上各方法实施例中的方法的部分或全部步骤。

本发明实施例还公开一种应用发布平台，其中，应用发布平台用于发布计算机程序产品，其中，当计算机程序产品在计算机上运行时，使得计算机执行如以上各方法实施例中的方法的部分或全部步骤。

本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成，该程序可以存储于一计算机可读存储介质中，存储介质包括只读存储器(Read-Only Memory，ROM)、随机存储器(Random Access Memory，RAM)、可编程只读存储器(Programmable Read-only Memory，PROM)、可擦除可编程只读存储器(Erasable Programmable Read Only Memory，EPROM)、一次可编程只读存储器(One-time Programmable Read-Only Memory，OTPROM)、电子抹除式可复写只读存储器(Electrically-Erasable Programmable Read-Only Memory，EEPROM)、只读光盘(CompactDisc Read-Only Memory，CD-ROM)或其他光盘存储器、磁盘存储器、磁带存储器、或者能够用于携带或存储数据的计算机可读的任何其他介质。

以上对本发明实施例公开的一种字体识别方法、装置、电子设备及存储介质进行了详细介绍，本文中应用了具体个例对本发明的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本发明的方法及其核心思想；同时，对于本领域的一般技术人员，依据本发明的思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本发明的限制。

Claims

1.一种字体识别方法，其特征在于，所述方法包括：

对所述第一评价值和所述第二评价值进行比较；

2.根据权利要求1所述的方法，其特征在于，在所述将所述待识别字符输入预设的手写体特征识别模型中，得到所述待识别字符属于手写字体类型的第一评价值之前，所述方法还包括：

获取手写字符样本；

对所述手写字符样本进行手写体特征提取得到手写体特征；

通过所述手写体特征构建所述手写体特征识别模型。

3.根据权利要求1所述的方法，其特征在于，在所述将所述待识别字符输入预设的印刷体特征识别模型中，得到所述待识别字符属于印刷字体类型的第二评价值之前，所述方法还包括：

获取印刷字符样本；

对所述印刷字符样本进行印刷体特征提取得到印刷体特征；

通过所述印刷体特征构建所述印刷体特征识别模型。

4.根据权利要求1至3任一项所述的方法，其特征在于，在所述根据所述第一评价值和所述第二评价值，确定所述待识别字符属于的字体类型之后，所述方法还包括：

获取每个所述单个试题区域中的待分析手写区域；

5.根据权利要求4所述的方法，其特征在于，在所述将所述待分析手写区域中的手写字符串与预设字符串进行匹配，获取每个所述单个试题区域的手写匹配值之后，还包括：

6.根据权利要求1至3任一项所述的方法，其特征在于，所述获取目标文档图像，包括：

接收终端设备输入的目标文档图像；

7.一种字体识别装置，其特征在于，所述装置包括：

图像获取模块，用于获取目标文档图像；

字体类型确定模块，用于对所述第一评价值和所述第二评价值进行比较；在所述第一评价值大于所述第二评价值的情况下，确定所述待识别字符为手写字体；在所述第一评价值小于所述第二评价值的情况下，确定所述待识别字符为印刷字体；在所述第一评价值等于所述第二评价值的情况下，根据所述待识别字符的上一相邻字符的字体识别结果，以及所述待识别字符的下一相邻字符的字体识别结果，确定所述待识别字符属于的字体类型。

8.一种电子设备，其特征在于，所述电子设备包括：

存储有可执行程序代码的存储器；

与所述存储器耦合的处理器；

所述处理器调用所述存储器中存储的所述可执行程序代码，执行权利要求1至6任一项所述的字体识别方法的步骤。

9.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质存储计算机程序，其中，所述计算机程序使得计算机执行权利要求1至6任一项所述的字体识别方法的步骤。