CN112149680A

CN112149680A - 错字检测识别方法、装置、电子设备及存储介质

Info

Publication number: CN112149680A
Application number: CN202011037561.0A
Authority: CN
Inventors: 李全恩; 李雪冬
Original assignee: Wuhan Yuexuebang Network Technology Co Ltd
Current assignee: Wuhan Yuexuebang Network Technology Co Ltd
Priority date: 2020-09-28
Filing date: 2020-09-28
Publication date: 2020-12-29
Anticipated expiration: 2040-09-28
Also published as: CN112149680B

Abstract

本公开提供了一种错字检测识别方法、装置、电子设备及存储介质，该错字检测识别方法包括：获取用户的作文图片信息；对作文图片信息进行检测识别，以获取作文图片信息对应的文本内容；根据预先训练的语义模型对文本内容进行错字检测，并根据检测结果产生相应的提示信息。本公开实施例可以通过获取用户的手写作文图片来对作文中的错别字进行检测，并根据检测结果产生相应的提示信息，以对用户进行提醒，使得教师或者家长在批阅时可以直观快速的发现错字，避免了因错字而带来的审阅困扰，提高了审阅效率。

Description

错字检测识别方法、装置、电子设备及存储介质

技术领域

本公开涉及人工智能领域，具体而言，涉及一种错字检测识别方法、装置、电子设备以及存储介质。

背景技术

目前，针对学生、学员或者研究员手写的文章，在核稿阶段，都是由审批人员逐字逐句进行检查和批阅。但是，由于撰稿人在撰写过程中，不可避免会存在粗心和笔误的情况，使得写出来的文章难免会出现错别字和表达不正确的地方，这就给审批人员带来了不小的困扰。

发明内容

本公开实施例至少提供一种错字检测识别方法、装置、电子设备以及存储介质。

第一方面，本公开实施例提供了一种错字检测识别方法，包括：

获取用户的作文图片信息；

对所述作文图片信息进行检测识别，以获取所述作文图片信息对应的文本内容；

根据预先训练的语义模型对所述文本内容进行错字检测，并根据检测结果产生相应的提示信息。

本公开实施例中，通过获取用户作文图片信息，对作文图片信息进行检测识别以获取作文图片信息对应的文本内容，并根据预先训练的语义模型对所述文本内容进行错字检测，可以自动的对作文中的错别字进行检测，并根据检测结果产生相应的提示信息，以对用户进行提醒，使得教师或者家长在批阅时可以直观快速的发现错字，避免了因错字而带来的困扰，提高了审阅效率。

根据第一方面，在一种可能的实施方式中，所述对所述作文图片信息进行检测识别，以获取所述作文图片信息对应的文本内容，包括：

对所述作文图片信息进行切分以得到多个单字图像块，并确定每个单字图像块在所述作文图片信息中的位置；

对每个单字图像块进行检测识别，以得到每个单字图像块所对应的识别候选字以及每个识别候选字的概率；

将每个单字图像块所对应的识别候选字中概率最高且大于特定阈值的识别候选字确定为该单字图像块所对应单字文本；

根据每个单字文本的位置将多个单字文本组合以获得所述文本内容。

本公开实施例中，通过对作文图片信息的切分可以获得多个单字图像块，并通过对每个单字图像块进行识别以获得每个单字图像块对应的单字文本，再根据每个单字文本的位置将多个单字文本组合，从而实现了从图片到文本内容的提取与转换。

根据第一方面，在一种可能的实施方式中，所述将每个单字图像块所对应的识别候选字中概率最高且大于特定阈值的识别候选字确定为该单字图像块所对应单字文本之后，所述错字检测识别方法还包括：

基于已经识别出的单字文本，根据预先训练的语义模型对不存在某一识别候选字的概率大于该特定阈值的单字图像块进行识别，以得到其所对应的单字文本。

本公开实施例中，在无法识别出某一位置上的单字文本时，通过语义模型来进一步确认该位置上的单字文本，进一步提高了对作文图片识别的准确度。

根据第一方面，在一种可能的实施方式中，所述基于已经识别出的单字文本，根据预先训练的语义模型对不存在某一识别候选字的概率大于该特定阈值的单字图像块进行识别，以得到其所对应的单字文本，包括：

基于已经识别出的单字文本，根据所述语义模型对不存在某一识别候选字的概率大于该特定阈值的单字图像块进行识别，以获得其所对应的语义候选字以及每个语义候选字的概率；

根据所述语义候选字及其概率对所述识别候选字的概率进行调整，并将调整后的概率最高的识别候选字确认为所述单字图像块所对应的单字文本。

本公开实施例中，通过语义候选字及其概率对所述识别候选字的概率进行调整，并将调整后的概率最高的识别候选字确认为所述单字图像块所对应的单字文本，实现了高精度的文本提取。

对所述作文图片信息进行切分，以得到多个单字图像块，并确定每个单字图像块的坐标；

根据每个单字图像块的坐标将同一行的多个每个单字图像块进行组合，以得到重组单行图像条；

对所述作文图片信息进行行切分，以得到多个原始单行图像条，并确定每个原始单行图像条的坐标；

对每个原始单行图像条进行检测识别，以得到每个原始单行图像条中每个位置所对应的识别候选字以及每个识别候选字的概率；

若所述重组单行图像条与所述原始单行图像条中相应位置的最大概率的识别候选字相同，则将所述概率最大的识别候选字确定为该位置所对应单字文本；

根据每个单字文本的坐标将多个单字文本组合以获得所述文本内容。

本公开实施例中，将单字检测识别和单行检测识别相结合，并在二者检测出的最大概率识别候选字结果相同的情况下，将最大概率的识别候选字确定为撰稿人写的文字，进一步确保了识别精度。

根据第一方面，在一种可能的实施方式中，所述根据每个单字文本的坐标将多个单字文本组合以获得所述文本内容之前，所述错字检测识别方法还包括：

若所述重组单行图像条与所述原始单行图像条中相应位置的最大概率的识别候选字不相同，则基于已经识别出的单字文本，根据预先训练的语义模型对该位置进行语义识别，以得到其所对应的单字文本。本公开实施例中，将单字检测识别和单行检测识别相结合，并在二者出现不同，需要进行语义检测进一步判断，进而进一步提高了对作文图片的识别精度。根据第一方面，在一种可能的实施方式中，所述根据预先训练的语义模型对所述文本内容进行错字检测，并根据检测结果产生相应的提示信息，包括：

根据所述语义模型对所述文本内容按照预定的顺序依次对每个位置上的单字文本进行语义检测，以获得每个位置的语义候选字及每个语义候选字的概率；

判断每一位置上的当前单字文本是否属于该位置的待选候选字；其中，待选候选字为该位置上概率大于基准阈值的语义候选字；

若某一位置上的当前单字文本不属于该位置的待选候选字，则确定该位置上的单字文本为错字，并将错字和正确的字同时显示；其中，正确的字为该位置上的概率最高的语义候选字。

本公开实施例中，通过逐一对识别好的文本内的单字文本进行语义检测，可以获得每一位置的语义候选字及其概率，并通过将每一位置上的当前文本和语义候选字比对，即可确定当前的单字文本是否为错字，简单、快捷，提高了错字检测的效率。

根据第一方面，在一种可能的实施方式中，所述判断每一位置上的当前单字文本是否属于该位置的待选候选字之后，所述错字检测识别方法还包括：

若每一位置上的当前单字文本属于该位置的待选候选字，则确定所述文本内容中不存在错字，并产生提示信息。

本公开实施例中，当确定所述文本内容中不存在错字时，还发出提示信息以提醒用户当前作文文本没有错字，直观生动，提高了用户体验。

根据第一方面，在一种可能的实施方式中，所述根据预先训练的语义模型对所述文本内容进行错字检测，包括：

将所述文本内容以句子为单位进行拆分；

根据所述语义模型对所拆分的每个句子进行语义检测，以识别当前句子中是否存在错字。

第二方面，本公开实施例还提供一种错字检测识别装置，包括：

图像获取模块，用于获取用户的作文图片信息；

检测识别模块，用于对所述作文图片信息进行检测识别，以获取所述作文图片信息对应的文本内容；

纠错提示模块，用于根据预先训练的语义模型对所述文本内容进行错字检测，并根据检测结果产生相应的提示信息。

根据第二方面，在一种可能的实施方式中，所述检测识别模块具体用于：

根据第二方面，在一种可能的实施方式中，所述检测识别模块还具体用于：

根据第二方面，在一种可能的实施方式中，所述检测识别模块具体还用于：

若所述重组单行图像条与所述原始单行图像条中相应位置的最大概率的识别候选字不相同，则基于已经识别出的单字文本，根据预先训练的语义模型对该位置进行语义识别，以得到其所对应的单字文本。根据第二方面，在一种可能的实施方式中，所述纠错提示模块具体用于：

根据第二方面，在一种可能的实施方式中，所述纠错提示模块还具体用于：

根据第二方面，在一种可能的实施方式中，所述纠错提示模块具体用于：

将所述文本内容以句子为单位进行拆分；

第三方面，本公开实施例还提供一种电子设备，包括：处理器、存储器和总线，所述存储器存储有所述处理器可执行的机器可读指令，当电子设备运行时，所述处理器与所述存储器之间通过总线通信，所述机器可读指令被所述处理器执行时执行上述第一方面，或第一方面中任一种可能的实施方式中所述的错字检测识别方法的步骤。

第四方面，本公开实施例还提供一种计算机可读存储介质，该计算机可读存储介质上存储有计算机程序，该计算机程序被处理器运行时执行上述第一方面，或第一方面中任一种可能的实施方式中所述的错字检测识别方法的步骤。

关于上述错字检测识别装置、电子设备、及计算机可读存储介质的效果描述参见上述错字检测识别方法的说明，这里不再赘述。

为使本公开的上述目的、特征和优点能更明显易懂，下文特举较佳实施例，并配合所附附图，作详细说明如下。

附图说明

为了更清楚地说明本公开实施例的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，此处的附图被并入说明书中并构成本说明书中的一部分，这些附图示出了符合本公开的实施例，并与说明书一起用于说明本公开的技术方案。应当理解，以下附图仅示出了本公开的某些实施例，因此不应被看作是对范围的限定，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他相关的附图。

图1示出了本公开实施例所提供的一种错字检测识别方法的流程图；

图2示出了本公开实施例所提供的一种检测识别图片并获得文本内容的方法流程图。

图3示出了本公开实施例所提供的另一种检测识别图片并获得文本内容的方法流程图；

图4示出了本公开实施例所提供的一种检测错字并产生提示信息的方法流程图；

图5示出了本公开实施例所提供的一种错字检测识别装置的示意图；

图6示出了本公开实施例所提供的一种电子设备的示意图。

具体实施方式

为使本公开实施例的目的、技术方案和优点更加清楚，下面将结合本公开实施例中附图，对本公开实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本公开一部分实施例，而不是全部的实施例。通常在此处附图中描述和示出的本公开实施例的组件可以以各种不同的配置来布置和设计。因此，以下对在附图中提供的本公开的实施例的详细描述并非旨在限制要求保护的本公开的范围，而是仅仅表示本公开的选定实施例。基于本公开的实施例，本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例，都属于本公开保护的范围。

经研究发现，针对学生、学员或者研究员手写的文章，在核稿阶段，都是由审批人员逐字逐句进行检查和批阅。但是，由于撰稿人在撰写过程中，不可避免会存在粗心和笔误的情况，使得写出来的文章难免会出现错别字和表达不正确的地方，这就给审批人员带来了不小的困扰。例如，在语文教学中，作文教学是为了培养学生写作能力。然而，在撰写作文的过程中，由于笔误或者粗心，经常会出现写错字的情况，这给教师或者家长在检查或者批阅作文时带来了一定的困扰。

基于上述研究，本公开提供了一种错字检测识别方法，通过获取用户作文图片信息，对作文图片信息进行检测识别以获取作文图片信息对应的文本内容，并根据预先训练的语义模型对所述文本内容进行错字检测，可以自动的对作文中的错别字进行检测，进而减少了审批人在审阅过程中的烦恼，节省了审批人寻找错别字的时间，提高了审阅效率。

针对以上方案所存在的缺陷，均是发明人在经过实践并仔细研究后得出的结果，因此，上述问题的发现过程以及下文中本公开针对上述问题所提出的解决方案，都应该是发明人在本公开过程中对本公开做出的贡献。

应注意到：相似的标号和字母在下面的附图中表示类似项，因此，一旦某一项在一个附图中被定义，则在随后的附图中不需要对其进行进一步定义和解释。

为便于对本实施例进行理解，首先对本公开实施例所公开的一种错字检测识别方法进行详细介绍，本公开实施例所提供的错字检测识别方法的执行主体一般为具有一定计算能力的计算机设备，该计算机设备例如包括：终端设备或服务器或其它处理设备，终端设备包括但不限于诸如具有触摸敏感表面(例如，触摸屏显示器和/或触摸板)的移动电话、膝上型计算机、家教机或平板计算机之类的其他便携式设备。还应当理解的是，在某些实施例中，所述终端设备并非便携式通信设备，而是具有触摸敏感表面的台式计算机。

在一些可能的实现方式中，该错字检测识别方法可以通过处理器调用存储器中存储的计算机可读指令的方式来实现。

下面以执行主体为终端设备为例对本公开实施例提供的错字检测识别方法加以说明。

参见图1所示，为本公开实施例提供的错字检测识别方法的流程图，所述方法包括步骤S101～S103：

S101，获取用户的作文图片信息。

具体地，终端设备可以通过摄像头对用户的作文进行拍照从而获取作文图片信息，也可以通过对用户的作文进行扫描的方式获取作文图片信息。当作文长度较长时，例如，当同一篇作文分布在两页纸上时，可以分别对不同的页面进行拍照，以分别获取不同的作文图片信息，终端设备可以按照获取照片的先后顺序进行标记，以方便进行后续的判断处理。

需要说明的是，本申请实施例中所提到的作文不仅仅限于作文本身，其他以文字段落形式所记载的文本(如日记、信件、小说、故事、随笔、论文、技术文档或者操作手册等)均可以称之为作文。

在一些可能的实施方式中，在对作文进行拍照或者扫描之后，还可对得到的图片增强处理，以提升识别精度。

在一些可能的实施方式中，作文语言可以为中文、***语、字母、英文、日文、韩文等，当然，还可为各种语言的混合等，对此不做赘述。

S102，对所述作文图片信息进行检测识别，以获取所述作文图片信息对应的文本内容。

具体的，可以通过对作文图片信息中的单个字进行检测和识别来获取每个字的文本，然后再按照顺序将得到的每个字的文本进行组合以获得与该作文图片信息对应的文本内容。

S103，根据预先训练的语义模型对所述文本内容进行错字检测，并根据检测结果产生相应的提示信息。

其中，语义模型是指通过训练得到的能够理解语言潜在特征的网络模型。例如，针对不同的任务，可以训练具有不同功能的模型，比如能够找出文本中时间、地名、人物名称的模型，能够匹配古诗词的模型，能够匹配语法检测的模型，能够匹配修辞手法的模型以及能够匹配出英文固定搭配的模型等等。本申请实施例中的语义模型是能够基于上下文预测当前字的语义模型，是在bert双向语义模型的基础上通过改进得到的。

本公开实施例中，通过获取用户作文图片信息，对作文图片信息进行检测识别以获取作文图片信息对应的文本内容，并根据预先训练的语义模型对所述文本内容进行错字检测，可以自动的对作文中的错别字进行检测，并根据检测结果产生相应的提示信息，以对用户进行提醒，使得审批人(或者批阅人，例如教师、家长、编辑等)在批阅时可以直观快速的发现错字，节省了审批人寻找错别字的时间，提高了审阅效率，进而减少了审批人在审阅过程中的烦恼。

下面将结合具体实施例对上述S102～S103进行详细介绍。

针对上述S102，在对所述作文图片信息进行检测识别，以获取所述作文图片信息对应的文本内容时，如图2所示，可以包括以下S1021～S1026：

S1021，对所述作文图片信息进行切分以得到多个单字图像块，并确定每个单字图像块在所述作文图片信息中的位置。

示例地，可以先根据所述作文图片信息建立坐标系，然后确定每一行文本在作文图片信息中的坐标，接着依据坐标把每一行文本从该作文图片信息中切分出来，再对每一行文本进行切分，以得到多个单字图像块。由于每个单字图像块都带有坐标信息，因此可以根据坐标信息确定每个单字图像块在作文图片信息中的位置。

S1022，对每个单字图像块进行检测识别，以得到每个单字图像块所对应的识别候选字以及每个识别候选字的概率。

示例地，可以根据训练好的识别网络模型识别出每一个字位置上可能的多个识别候选字和每个识别候选字的概率。例如，经切分后的多个单字图像块分别为“我”、“爱”、“口”及“国”，经识别网络模型识别后得出每个位置上的识别候选字及每个识别候选字的概率如下表1所示：

表1：每个位置的识别候选字及其概率表

S1023，将每个单字图像块所对应的识别候选字中概率最高且大于特定阈值的识别候选字确定为该单字图像块所对应单字文本。

具体地，在某一位置上，若概率最高的识别候选字所对应的概率大于特定阈值，则确定该概率最高的识别候选字为该单字图像块所对应的单字文本，也即该概率最高的识别候选字即为撰稿人在该位置所写的字。

可以理解，特定阈值可以根据当前具体所应用的识别网络模型来设定，例如，本申请实施例中，特定阈值可以为0.9。当然，其他实施例中，特定阈值也可以为其他数值(比如：0.8)，在此不做限定。但为了保证文本的识别精度，特定阈值应尽量设定的高一些，比如0.9左右。因此，如上表1所示，位置1所对应的单字文本为我，位置2所对应的单字文本不能确定，为3所对应的单字文本为口，位置4所对应的单字文本为国。

需要说明的是，由于所有识别候选字的概率的和为1，因此，当特定阈值设定为0.5以上时，概率最高且大于特定阈值的识别候选字有且仅有一个，不会出现两个以上的情况。

S1024，基于已经识别出的单字文本，根据预先训练的语义模型对所有识别候选字的概率均小于该特定阈值的单字图像块进行识别，以得到其所对应的单字文本。

由于位置2上的各识别候选字的概率均不大于特定阈值，这就使得根据识别网络模型无法确认位置2上的单字文本，因此，需要进一步识别，才能确定位置2上的单字文本。

具体地，根据语义模型对位置2进行检测，可以获得位置2上的多个语义候选字以及每个语义候选字的概率，根据语义候选字及其概率对识别候选字的概率进行调整，并将调整后的概率最高的识别候选字确认为位置2的单字文本。

例如，可以获取其中连续的、最长的、已经识别好的文本，根据语义模型来对位置2上的单字文本进行确认。例如，可以根据前一个字“我”，以及后面两个字口和国通过语义检索与分析，确定以“我”和“国”之间可能包括语义候选字“爱”、“恨”及“惜”等，假设“爱”字的概率为0.63，“恨”字的概率为0.34，“惜”字的概率为0.02，再由于“爱”字在识别候选字中也出现了，因此，根据语义候选字及其概率可以对识别候选字中“爱”字的概率进行调整，比如，调整后的识别候选字中“爱”字的概率达到了0.8且最高，进而将“爱”字确定为该位置2的单字文本。其中，根据语义候选字及其概率对识别候选字的概率进行调整的方法在此不做限定，比如可以采用归一化处理法。

可以理解，在一些实施例中，若通过步骤S1023即可将全部的单字图像块所对应的单字文本识别出来，则步骤S1024可以省略。

S1025，根据每个单字文本的位置将多个单字文本组合以获得所述文本内容。

具体地，由于每个单字文本都携带有坐标信息，因此，根据每个单字文本的位置可以将多个单字文本组合以获得与作文图片信息里的内容相一致的文本内容。

本申请公开实施例中，通过对作文图片信息的切分可以获得多个单字图像块，并通过对每个单字图像块进行识别以获得每个单字图像块对应的单字文本，且在无法识别出某一位置上的单字文本时，通过语义模型来进一步确认该位置上的单字文本，进而提高了对作文图片识别的准确度。

为了提高手写作文图片的识别准确度，在另一些实施方式中，针对上述S102，在对所述作文图片信息进行检测识别，以获取所述作文图片信息对应的文本内容时，如图3所示，可以包括以下步骤S102a～S102i：

S102a，对所述作文图片信息进行切分，以得到多个单字图像块，并确定每个单字图像块的坐标。

其中，该步骤与上述步骤S1021类似，在此不再赘述。

S102b，对每个单字图像块进行检测识别，以得到每个单字图像块所对应的识别候选字以及每个识别候选字的概率。

其中，该步骤与上述步骤S1022类似，在此不再赘述。

S102c，根据每个单字图像块的坐标将同一行的多个每个单字图像块进行组合，以得到重组单行图像条。

本实施方式中，在对每个单字图像块进行检测识别后，再将其以行为单位进行重组。

S102d，对所述作文图片信息进行行切分，以得到多个原始单行图像条，并确定每个原始单行图像条的坐标。

其中，该步骤与上述步骤S1021类似，在此不再赘述。

S102e，对每个原始单行图像条进行检测识别，以得到每个原始单行图像条中每个位置所对应的识别候选字以及每个识别候选字的概率。

与单字识别类似，本实施方式中，还以行为单位对每个原始单行图像条中的每个位置的字进行检测识别。

S102f，判断重组单行图像条与原始单行图像条中相应位置的最大概率的识别候选字是否相同；若相同，则执行步骤S102g；若不相同，则执行步骤S102h。

可以理解，由于重组单行图像条中每个位置与原始单行图像条中相应的位置所采用的识别检测方法不同，若二者在相同的位置的最大概率的识别候选字相同，则表明该概率最大的识别候选字即为撰稿人写的字；若重组单行图像块在x位置没有识别候选字，而原始单行图像条在X位置确有相应的识别候选字，则说明在单字识别过程中存在漏检的情况，进而可以执行步骤S102h对该位置进行进一步检测识别，进一步保证了识别精度。

S102g，将概率最大的识别候选字确定为该位置所对应单字文本。

S102h，基于已经识别出的单字文本，根据预先训练的语义模型对该位置进行语义识别，以得到其所对应的单字文本。

其中，该步骤与上述步骤S1024类似，在此不再赘述。

S102i，根据每个单字文本的坐标将多个单字文本组合以获得所述文本内容。

其中，该步骤与上述步骤S1025类似，在此不再赘述。

本公开实施例中，由于将单字检测识别和单行检测识别相结合，并在二者检测出的最大概率识别候选字结果相同的情况下，将最大概率的识别候选字确定为撰稿人写的文字，而若二者出现不同则需要进行语义检测进一步判断，进而提高了对作文图片的识别精度。针对上述S103，在根据预先训练的语义模型对所述文本内容进行错字检测，并根据检测结果产生相应的提示信息时，如图4所示，可以包括步骤S1031～S1034：

S1031，根据所述语义模型对所述文本内容按照预定的顺序依次对每个位置上的单字文本进行语义检测，以获得每个位置的语义候选字及每个语义候选字的概率。

具体地，根据语义模型逐一对步骤S102识别出的文本内容进行语义检测，以获得每个位置的语义候选字及每个语义候选字的概率。例如，对位置i上的单字w进行语义检测时，将当前的字w遮挡，当做未知，然后根据未知i前后的字通过上下文的语义得出位置i所对应的语义候选字以及每个语义候选字的概率。

S1032，判断每一位置上的当前单字文本是否属于该位置的待选候选字；其中，待选候选字为该位置上概率大于基准阈值的语义候选字；若是，则执行步骤S1033；若否，则执行步骤S1034。

其中，将概率大于基准阈值的语义候选字确定为待选候选字，若当前单字文本在待选候选字中，说明撰稿人写的字是正确的字，而若不在待选候选字中，则说明撰稿人写的字是错别字。可以理解，基准阈值可以根据具体的语义模型而设定，在此不做限定。

S1033，确定所述文本内容中不存在错字，并产生提示信息。

当确定文本内容内不存在错字时，只要对用户进行简单的提示即可。其中，提示信息可以包括语音提示信息、文字提示信息、动画提示信息和闪光中的至少一种，这样通过终端设备对用户进行提示时，可以包括：以语音形式、文字形式、动画形式和闪光形式中的至少一种对用户进行提示。

S1034，确定该位置上的单字文本为错字，并将错字和正确的字同时显示；其中，正确的字为该位置上的概率最高的语义候选字。

结合上述步骤S1022，位置3上的单字文本为“口”，而通过对位置3进行语义检测时得出语义候选字“中”概率为0.54，“祖”概率为0.43，“美”概率为0.02等，而“口”字不属于该位置的待选候选字“中”，因此，确定该位置3上的文本“口”为错字，将该错字“口”以及相应的正确字“中”同时显示。如此，不仅可以将错字进行提示，还指示正确的结果，使得用户可以很好的对作文进行理解。

此外，还可以以句子为单位来对句子进行语义识别，进而识别出错字。其中，可以以标点符号、词组或者短句为单位来划分句子，具体在此不做限定。因此，在一些实施例中，所述根据预先训练的语义模型对所述文本内容进行错字检测，还可以包括：将所述文本内容以句子为单位进行拆分；根据所述语义模型对所拆分的每个句子进行语义检测，以识别当前句子中是否存在错字。

例如，应该写的是“我是小撰稿人”，但是由于撰稿人写错了，写的是“我是木撰稿人”，很容易确定错别字就是木；再比如把“我爱妈妈”写成“我爱好好”，很容易确定好好是错别字；再比如把“离离原上草”写成“离离圆上草”，因为是固定搭配，很容易确定出来错别字。

本领域技术人员可以理解，在具体实施方式的上述方法中，各步骤的撰写顺序并不意味着严格的执行顺序而对实施过程构成任何限定，各步骤的具体执行顺序应当以其功能和可能的内在逻辑确定。

基于同一发明构思，本公开实施例中还提供了与错字检测识别方法对应的错字检测识别装置，由于本公开实施例中的装置解决问题的原理与本公开实施例上述错字检测识别方法相似，因此装置的实施可以参见方法的实施，重复之处不再赘述。

参照图5所示，为本公开实施例提供的一种错字检测识别装置的架构示意图，所述装置包括：图像获取模块501、检测识别模块502以及纠错提示模块503；其中，

图像获取模块，用于获取用户的作文图片信息；

本公开实施例，通过获取用户作文图片信息，对作文图片信息进行检测识别以获取作文图片信息对应的文本内容，并根据预先训练的语义模型对所述文本内容进行错字检测，可以自动的对作文中的错别字进行检测，并根据检测结果产生相应的提示信息，以对用户进行提醒，使得教师或者家长在批阅时可以直观快速的发现错字，节省了审批人寻找错别字的时间，提高了审阅效率，进而减少了审批人在审阅过程中的烦恼。

在一种可能的实施方式中，所述检测识别模块具体用于：

在一种可能的实施方式中，所述检测识别模块还具体用于：

在一种可能的实施方式中，所述检测识别模块具体用于：

在一种可能的实施方式中，所述检测识别模块具体还用于：

若所述重组单行图像条与所述原始单行图像条中相应位置的最大概率的识别候选字不相同，则基于已经识别出的单字文本，根据预先训练的语义模型对该位置进行语义识别，以得到其所对应的单字文本。

在一种可能的实施方式中，所述纠错提示模块具体用于：

在一种可能的实施方式中，所述纠错提示模块还具体用于：

在一种可能的实施方式中，所述纠错提示模块具体用于：

将所述文本内容以句子为单位进行拆分；

关于装置中的各模块的处理流程、以及各模块之间的交互流程的描述可以参照上述方法实施例中的相关说明，这里不再详述。

基于同一技术构思，本公开实施例还提供了一种电子设备。参照图6所示，为本公开实施例提供的电子设备700的结构示意图，包括处理器701、存储器702、和总线703。其中，存储器702用于存储执行指令，包括内存7021和外部存储器7022；这里的内存7021也称内存储器，用于暂时存放处理器701中的运算数据，以及与硬盘等外部存储器7022交换的数据，处理器701通过内存7021与外部存储器7022进行数据交换。

本申请实施例中，存储器702具体用于存储执行本申请方案的应用程序代码，并由处理器701来控制执行。也即，当电子设备700运行时，处理器701与存储器702之间通过总线703通信，使得处理器701执行所述存储器702中存储的应用程序代码。

其中，存储器702可以是，但不限于，随机存取存储器(Random Access Memory，RAM)，只读存储器(Read Only Memory，ROM)，可编程只读存储器(Programmable Read－Only Memory，PROM)，可擦除只读存储器(Erasable Programmable Read－Only Memory，EPROM)，电可擦除只读存储器(Electric Erasable Programmable Read－Only Memory，EEPROM)等。其中，存储器702用于存储程序，所述处理器703在接收到执行指令后，执行所述程序，后述本发明实施例任一实施例揭示的流程定义的电子设备200所执行的方法可以应用于处理器703中，或者由处理器703实现。

处理器701可能是一种集成电路芯片，具有信号的处理能力。上述的处理器可以是通用处理器，包括中央处理器(Central Processing Unit，CPU)、网络处理器(NetworkProcessor，NP)等；还可以是数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

可以理解的是，本申请实施例示意的结构并不构成对电子设备700的具体限定。在本申请另一些实施例中，电子设备700可以包括比图示更多或更少的部件，或者组合某些部件，或者拆分某些部件，或者不同的部件布置。图示的部件可以以硬件，软件或软件和硬件的组合实现。

本公开实施例还提供一种计算机可读存储介质，该计算机可读存储介质上存储有计算机程序，该计算机程序被处理器运行时执行上述方法实施例中所述的错字检测识别方法的步骤。其中，该存储介质可以是易失性或非易失的计算机可读取存储介质。

本公开实施例所提供的错字检测识别方法的计算机程序产品，包括存储了程序代码的计算机可读存储介质，所述程序代码包括的指令可用于执行上述方法实施例中所述的错字检测识别方法的步骤，具体可参见上述方法实施例，在此不再赘述。

本公开实施例还提供一种计算机程序，该计算机程序被处理器执行时实现前述实施例的任意一种方法。该计算机程序产品可以具体通过硬件、软件或其结合的方式实现。在一个可选实施例中，所述计算机程序产品具体体现为计算机存储介质，在另一个可选实施例中，计算机程序产品具体体现为软件产品，例如软件开发包(Software DevelopmentKit，SDK)等等。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的***和装置的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。在本公开所提供的几个实施例中，应该理解到，所揭露的***、装置和方法，可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，又例如，多个单元或组件可以结合或者可以集成到另一个***，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本公开各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。

所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个处理器可执行的非易失的计算机可读取存储介质中。基于这样的理解，本公开的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台电子设备(可以是个人计算机，服务器，或者网络设备等)执行本公开各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(Read-OnlyMemory，ROM)、随机存取存储器(Random Access Memory，RAM)、磁碟或者光盘等各种可以存储程序代码的介质。

最后应说明的是：以上所述实施例，仅为本公开的具体实施方式，用以说明本公开的技术方案，而非对其限制，本公开的保护范围并不局限于此，尽管参照前述实施例对本公开进行了详细的说明，本领域的普通技术人员应当理解：任何熟悉本技术领域的技术人员在本公开揭露的技术范围内，其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化，或者对其中部分技术特征进行等同替换；而这些修改、变化或者替换，并不使相应技术方案的本质脱离本公开实施例技术方案的精神和范围，都应涵盖在本公开的保护范围之内。因此，本公开的保护范围应所述以权利要求的保护范围为准。

Claims

1.一种错字检测识别方法，其特征在于，包括：

获取用户的作文图片信息；

2.根据权利要求1所述的方法，其特征在于，所述对所述作文图片信息进行检测识别，以获取所述作文图片信息对应的文本内容，包括：

3.根据权利要求2所述的方法，其特征在于，所述将每个单字图像块所对应的识别候选字中概率最高且大于特定阈值的识别候选字确定为该单字图像块所对应单字文本之后，所述错字检测识别方法还包括：

基于已经识别出的单字文本，根据预先训练的语义模型对所有识别候选字的概率均小于该特定阈值的单字图像块进行识别，以得到其所对应的单字文本。

4.根据权利要求3所述的方法，其特征在于，所述基于已经识别出的单字文本，根据训练的语义模型对所有识别候选字的概率均小于该特定阈值的单字图像块进行识别，以得到其所对应的单字文本，包括：

基于已经识别出的单字文本，根据所述语义模型对所有识别候选字的概率均小于该特定阈值的单字图像块进行识别，以获得其所对应的语义候选字以及每个语义候选字的概率；

5.根据权利要求1所述的方法，其特征在于，所述对所述作文图片信息进行检测识别，以获取所述作文图片信息对应的文本内容，包括：

6.根据权利要求5所述的方法，其特征在于，所述根据每个单字文本的坐标将多个单字文本组合以获得所述文本内容之前，所述错字检测识别方法还包括：

7.根据权利要求1-6任一项所述的方法，其特征在于，所述根据预先训练的语义模型对所述文本内容进行错字检测，并根据检测结果产生相应的提示信息，包括：

8.根据权利要求7所述的方法，其特征在于，所述判断每一位置上的当前单字文本是否属于该位置的待选候选字之后，所述错字检测识别方法还包括：

9.根据权利要求1-6任一项所述的方法，其特征在于，所述根据预先训练的语义模型对所述文本内容进行错字检测，包括：

将所述文本内容以句子为单位进行拆分；

10.一种错字检测识别装置，其特征在于，包括：

图像获取模块，用于获取用户的作文图片信息；

11.一种电子设备，其特征在于，包括：处理器、存储器和总线，所述存储器存储有所述处理器可执行的机器可读指令，当电子设备运行时，所述处理器与所述存储器之间通过总线通信，所述机器可读指令被所述处理器执行时执行如权利要求1至9任一项所述的错字检测识别方法的步骤。

12.一种计算机可读存储介质，其特征在于，该计算机可读存储介质上存储有计算机程序，该计算机程序被处理器运行时执行如权利要求1至9任一项所述的错字检测识别方法的步骤。