CN112926587B

CN112926587B - 一种文本识别的方法、装置、可读存储介质和电子设备

Info

Publication number: CN112926587B
Application number: CN202110195725.0A
Authority: CN
Inventors: 宋安捷; 付治涓; 王宇峰; 李思思
Original assignee: Future Vipkid Ltd
Current assignee: Future Vipkid Ltd
Priority date: 2021-02-19
Filing date: 2021-02-19
Publication date: 2024-03-29
Anticipated expiration: 2041-02-19
Also published as: CN112926587A

Abstract

本发明实施例公开了一种文本识别的方法、装置、可读存储介质和电子设备。本发明实施例中执行终端接收第一图像获取指令，根据所述第一图像获取指令获取已书写待识别文本的格式作业纸图像，即第一图像，所述执行终端发送所述第一图像至处理终端，处理终端接收到第一图像后，根据所述第一图像与所述格式作业纸的格式信息，确定所述待识别文本的文本内容，所述格式信息表征了格式作业纸预先印刷的各词汇书写单元的位置；通过上述方法，由于设计了特定的格式作业纸，在书写文本时会将每个词汇分别写入各词汇书写单元，然后再对所述特定的格式作业纸进行识别，提高了已书写文本的识别准确率。

Description

一种文本识别的方法、装置、可读存储介质和电子设备

技术领域

本发明涉及数据处理领域，具体涉及一种文本识别的方法、装置、可读存储介质和电子设备。

背景技术

随着社会的进步，家长对孩子的学习越来越重视，很多家长在课后会对孩子进行辅导，例如，在外语学习过程中，家长会在课后监督孩子进行单词拼写练习或者进行写作练习，由于家长可能并不擅长孩子正在学习的外语，家长人工检查孩子的书写内容比较困难。

现有技术中，为了解决人工检查书写内容比较困难的问题，通过光学字符识别OCR对孩子的书写内容进行识别，但是由于孩子手写稚嫩潦草，识别效果不理想，识别的准确率较低。

综上所述，如何提高书写内容的识别准确率是目前需要解决的问题。

发明内容

有鉴于此，本发明实施例提供了一种文本识别的方法、装置、可读存储介质和电子设备，提高了书写内容的识别准确率。

第一方面，本发明实施例提供了一种文本识别的方法，该方法包括：

接收第一图像，其中，所述第一图像为已书写待识别文本的格式作业纸图像；

根据所述第一图像与所述格式作业纸的格式信息，确定所述待识别文本的文本内容，其中，所述格式信息表征了格式作业纸预先印刷的各词汇书写单元的位置。

优选地，所述根据所述第一图像与所述格式作业纸的格式信息，确定所述待识别文本的文本内容，具体包括：

通过光学字符识别OCR确定所述第一图像中已书写的文本内容的第一位置坐标；

根据所述第一位置坐标与所述格式信息，确定所述待识别文本的文本内容。

优选地，该方法还包括：

接收第二图像，其中，所述第二图像为部分词汇书写单元已书写文本的格式作业纸图像；

确定所述第二图像对应的格式信息，其中，所述格式信息还表征所述格式作业纸中空置的词汇书写单元的数量以及所述格式作业纸中空置的词汇书写单元的起始位置；

响应于所述格式作业纸中空置的词汇书写单元的数量大于或等于所述待识别文本中包含的词汇数量；

保存所述格式作业纸中空置的词汇书写单元的起始位置。

优选地，该方法还包括：

响应于所述格式作业纸中空置的词汇书写单元的数量小于所述待识别文本中包含的词汇数量，重新发送所述第二图像获取指令，其中，所述第二图像获取指令用于获取新的所述第二图像。

优选地，所述确定所述第二图像对应的格式信息，具体包括：

通过光学字符识别OCR确定所述第二图像中已书写文本的位置；

确定所述已书写文本对应的第一区域与第二区域的面积交并比，其中，所述第二区域为所述第二图像对应的格式作业纸中与第一区域的位置相同的词汇书写单元对应的区域；

根据所述面积交并比确定所述格式作业纸中空置的词汇书写单元的数量。

优选地，该方法还包括：

根据标准文本内容，对所述待识别文本的文本内容进行批改；

生成批改反馈信息。

优选地，该方法还包括：

通过自然语言处理，对所述待识别文本的文本内容进行批改；

生成批改反馈信息。

优选地，所述生成批改反馈信息，具体包括：

通过关键点匹配，确定出所述第一图像中每个所述待识别文本的文本内容所在的词汇书写单元对应的区域图像；

对所述区域图像进行图像去畸变，将所述去畸变后的区域图像按照所述文本内容进行排序；

按照所述排序的顺序将所述去畸变后的区域图像合成为所述批改反馈信息。

优选地，该方法还包括：

响应于所述批改反馈信息中存在书写错误的词汇，将所述书写错误的词汇存储到错题库。

优选地，该方法还包括：

根据预先设置的书写不规范词汇的规则对所述待识别文本的文本内容进行模糊匹配，确定所述文本内容中书写不规范的词汇。

第二方面，本发明实施例提供了一种文本识别的方法，该方法包括：

接收第一图像获取指令；

根据所述第一图像获取指令获取第一图像，其中，所述第一图像为已书写待识别文本的格式作业纸图像；

发送所述第一图像。

优选地，该方法还包括：

接收第二图像获取指令；

根据所述第二图像获取指令获取第二图像，其中，所述第二图像为部分词汇书写单元已书写文本的格式作业纸图像；

发送所述第二图像。

第三方面，本发明实施例提供了一种文本识别的装置，该装置包括：

第一接收单元，用于接收第一图像，其中，所述第一图像为已书写待识别文本的格式作业纸图像；

第一确定单元，用于根据所述第一图像与所述格式作业纸的格式信息，确定所述待识别文本的文本内容，其中，所述格式信息表征了格式作业纸预先印刷的各词汇书写单元的位置。

优选地，所述第一确定单元具体用于：通过光学字符识别OCR确定所述第一图像中已书写的文本内容的第一位置坐标；根据所述第一位置坐标与所述格式信息，确定所述待识别文本的文本内容。

优选地，所述第一接收单元，还用于接收第二图像，其中，所述第二图像为部分词汇书写单元已书写文本的格式作业纸图像；

所述第一确定单元还用于，确定所述第二图像对应的格式信息，其中，所述格式信息还表征所述格式作业纸中空置的词汇书写单元的数量以及所述格式作业纸中空置的词汇书写单元的起始位置；

第一处理单元，响应于所述格式作业纸中空置的词汇书写单元的数量大于或等于所述待识别文本中包含的词汇数量，用于保存所述格式作业纸中空置的词汇书写单元的起始位置。

优选地，响应于所述格式作业纸中空置的词汇书写单元的数量小于所述待识别文本中包含的词汇数量，所述第一发送单元还用于发送所述第二图像获取指令，其中，所述第二图像获取指令用于获取新的所述第二图像。

优选地，所述第一确定单元具体用于，通过光学字符识别OCR确定所述第二图像中已书写文本的位置；

优选地，所述第一处理单元还用于：

第一生成单元，用于生成批改反馈信息。

优选地，所述第一处理单元还用于：通过自然语言处理，对所述待识别文本的文本内容进行批改；

所述第一生成单元还用于，生成批改反馈信息。

优选地，所述第一生成单元具体用于：

优选地，该装置还包括存储单元，响应于所述批改反馈信息中存在书写错误的词汇，用于将所述书写错误的词汇存储到错题库。

优选地，所述第一确定单元还用于：根据预先设置的书写不规范词汇的规则对所述待识别文本的文本内容进行模糊匹配，确定所述文本内容中书写不规范的词汇。

第四方面，本发明实施例提供了一种文本识别的装置，该装置包括：

第二接收单元，用于接收第一图像获取指令；

第二获取单元，用于根据所述第一图像获取指令获取第一图像，其中，所述第一图像为已书写待识别文本的格式作业纸图像；

第二发送单元，用于发送所述第一图像。

优选地，所述第二接收单元还用于接收第二图像获取指令；

所述第二获取单元还用于，根据所述第二图像获取指令获取第二图像，其中，所述第二图像为部分词汇书写单元已书写文本的格式作业纸图像；

所述第二发送单元还用于发送所述第二图像。

第五方面，本发明实施例提供了一种计算机可读存储介质，其上存储计算机程序指令，所述计算机程序指令在被处理器执行时实现如第一方面、第一方面任一种可能、第二方面或第二方面任一种可能中任一项所述的方法。

第六方面，本发明实施例提供了一种电子设备，包括存储器和处理器，所述存储器用于存储一条或多条计算机程序指令，其中，所述一条或多条计算机程序指令被所述处理器执行以实现如第一方面、第一方面任一种可能、第二方面或第二方面任一种可能中任一项所述的方法。

本发明实施例通过执行终端接收第一图像获取指令，根据所述第一图像获取指令获取已书写待识别文本的格式作业纸图像，即第一图像，所述执行终端发送所述第一图像至处理终端，处理终端接收到第一图像后，根据所述第一图像与所述格式作业纸的格式信息，确定所述待识别文本的文本内容，所述格式信息表征了格式作业纸预先印刷的各词汇书写单元的位置；通过上述方法，由于设计了特定的格式作业纸，再书写文本时会将每个词汇分别写入各词汇书写单元，然后再对所述特定的格式作业纸进行识别，提高了已书写文本的识别准确率。

附图说明

通过以下参照附图对本发明实施例的描述，本发明的上述以及其它目的、特征和优点将更为清楚，在附图中：

图1是本发明实施例的一种格式作业纸的示意图；

图2是本发明实施例的一种格式作业纸的示意图；

图3是本发明实施例的一种文本识别的方法流程图；

图4是本发明实施例的一种文本识别的方法流程图；

图5是本发明实施例的第二图像的示意图；

图6是本发明实施例的一种文本识别的方法流程图；

图7是本发明实施例的一种文本识别的方法流程图；

图8是本发明实施例的第二图像的示意图；

图9是本发明实施例的一种文本识别的方法流程图；

图10是本发明实施例的一种文本识别的方法流程图；

图11是本发明实施例的一种批改反馈信息示意图；

图12是本发明实施例的一种文本识别的方法流程图；

图13是本发明实施例的一种文本识别的方法流程图；

图14是本发明实施例的一种文本识别的方法流程图；

图15是本发明实施例的一种文本识别的方法流程图；

图16是本发明实施例的一种***示意图；

图17是本发明实施例的一种文本识别的装置示意图；

图18是本发明实施例的一种文本识别的装置示意图；

图19是本发明实施例的一种电子设备的示意图。

具体实施方式

以下基于实施例对本发明公开进行描述，但是本发明公开并不仅仅限于这些实施例。在下文对本发明公开的细节描述中，详尽描述了一些特定的细节部分。对本领域技术人员来说没有这些细节部分的描述也可以完全理解本发明公开。为了避免混淆本发明公开的实质，公知的方法、过程、流程、元件和电路并没有详细叙述。

此外，本领域普通技术人员应当理解，在此提供的附图都是为了说明的目的，并且附图不一定是按比例绘制的。

除非上下文明确要求，否则整个申请文件中的“包括”、“包含”等类似词语应当解释为包含的含义而不是排他或穷举的含义；也就是说，是“包括但不限于”的含义。

在本发明公开的描述中，需要理解的是，术语“第一”、“第二”等仅用于描述目的，而不能理解为指示或暗示相对重要性。此外，在本发明公开的描述中，除非另有说明，“多个”的含义是两个或两个以上。

在外语学习过程中，家长会在课后监督孩子进行单词拼写练习或者进行写作练习，由于家长可能并不擅长孩子正在学习的外语，家长人工检查孩子的书写内容比较困难，为了解决人工检查书写内容比较困难的问题，通过光学字符识别OCR对孩子的书写内容进行识别，但是由于孩子手写稚嫩潦草，单词之间的间隔可能会存在不明显的情况，进行内容识别的时候无法对准确的对单词进行划分，例如，“go sailing”应该是两个单词，但是手写时会写出“gosailing”中间没有间隔，会导致识别错误，或者，孩子手写的比较潦草，例如，相邻的两个字母“o”和“l”，因为书写潦草，可能会识别为“d”；相邻的两个字母“v”和“v”两个字母，因为书写潦草，可能会识别为“w”等；上述情况都会使识别效果不理想，在词维度上，准确率可能在70％左右，识别的准确率较低。

本发明实施例中，执行终端接收第一图像获取指令，根据所述第一图像获取指令获取已书写待识别文本的格式作业纸图像，即第一图像，所述执行终端发送所述第一图像至处理终端，处理终端接收到第一图像后，根据所述第一图像与所述格式作业纸的格式信息，确定所述待识别文本的文本内容，所述格式信息表征了格式作业纸预先印刷的各词汇书写单元的位置；通过上述方法，由于设计了特定的格式作业纸，再书写文本时会将每个词汇分别写入各词汇书写单元，然后再对所述特定的格式作业纸进行识别，提高了已书写文本的识别准确率。

本发明实施例中，所述执行终端还可以称为学生端，所述执行终端为摄像头的智能设备，例如，智能台灯、点读笔、平板电脑、智能手机等；所述处理终端还可以成为教师端或家长端，所述处理终端为带有显示屏幕的智能设备，例如，平板电脑、智能手机等。

本发明实施例中，所述格式作业纸上预先印刷的各词汇书写单元，即预先印刷了词汇书写格，每个格子里只可以书写一个单词或一个字的拼音，例如，图1和图2所示，为两种格式作业纸的示例，图1和图2均为旋转不对称格式作业纸，采用旋转不对称的形式，可以提高识别的准确度；在一种可能的实现方式中，所述格式作业纸上还可以带有书写提示，提示学生每个书写单元中只可以书写一个单词、一个字的拼音、或者一个词组，以及提示学生书写顺序，例如，每一行从左到右书写，或者，每一列从上到下书写，本发明实施例对其不做限定。

本发明实施例中，图3是本发明实施例的一种文本识别的方法流程图。如图3所示，具体包括如下步骤：

步骤S300、接收第一图像，其中，所述第一图像为已书写待识别文本的格式作业纸图像。

具体的，处理终端接收到执行终端发送的第一图像，其中，所述处理终端除了是上述带有显示屏幕的智能设备之外，还可以为服务器，即服务器接收到执行终端发送的第一图像，也就是说可以通过带有显示屏幕的智能设备接收并处理第一图像，还可以为服务器接收并处理第一图像，本发明实施例对其不做限定。

步骤S301、根据所述第一图像与所述格式作业纸的格式信息，确定所述待识别文本的文本内容，其中，所述格式信息表征了格式作业纸预先印刷的各词汇书写单元的位置。

具体的，所述根据所述第一图像与所述格式作业纸的格式信息，确定所述待识别文本的文本内容，具体包括：通过光学字符识别OCR确定所述第一图像中已书写的文本内容的第一位置坐标；根据所述第一位置坐标与所述格式信息，确定所述待识别文本的文本内容。

在一种可能的实现方式中，所述格式作业纸的格式信息可以为文本信息，所述格式信息为预先印刷的各词汇书写单元的位置，即通过文本信息表示预先存储的格式作业纸预先印刷的各词汇书写单元的位置；所述格式作业纸的格式信息为预先印刷的各词汇书写单元的位置，可以为通过预先存储的格式作业纸的图像信息生成的；所述格式作业纸的格式信息为所述格式作业纸中空置的词汇书写单元的数量，可以为在学生书写之前通过执行终端获取到的格式作业纸的图像信息生成的。

针对上述三种格式信息的生成方式，分别对上述三种情况下，如何生成所述待识别文本的文本内容进行详细说明，具体如下：

情况一、通过文本信息表示预先存储的格式作业纸预先印刷的各词汇书写单元的位置时，如何生成所述待识别文本的文本内容。

具体的，通过光学字符识别(Optical Character Recognition，OCR)确定所述第一图像中已书写的文本内容的第一位置坐标；确定所述第一位置坐标与所述格式作业纸预先印刷的各词汇书写单元的位置的对应关系，然后将所述已书写的内容按照所述格式作业纸预先印刷的各词汇书写单元的位置进行排序，确定所述待识别文本的文本内容。

举例说明，假设所述第一图像中已书写的文本内容为10个单词，即使用了10个词汇书写单元，确定所述10个单词分别对应的第一位置坐标，然后分别确定所述10个单词分别对应的第一位置坐标所对应的所述格式作业纸预先印刷的各词汇书写单元的位置，由于所述格式作业纸预先印刷的各词汇书写单元的位置有设定的顺序，因此，按照所述顺序将识别出的10个单词进行排序，生成所述待识别文本的文本内容。

情况二、通过预先存储的格式作业纸的图像信息生成预先印刷的各词汇书写单元的位置时，如何生成所述待识别文本的文本内容。

具体的，确定所述格式作业纸的图像信息对应的文本信息，根据所述图像信息与所述文本信息确定所述格式作业纸中预先印刷的各词汇书写单元的位置，确定各词汇书写单元的位置之后的处理方式与情况一相同，本发明在此不在赘述。

本发明实施例中，所述预先存储的格式作业纸的图像信息所对应的图像为未书写任何内容的格式作业纸。

情况三、通过执行终端获取到的格式作业纸的图像信息确定所述格式作业纸中空置的词汇书写单元的数量时，如何生成所述待识别文本的文本内容。

具体的，所述通过执行终端获取到的格式作业纸的图像信息所对应的图像未部分词汇书写单元已书写文本的格式作业纸图像，情况三的处理方式相比于情况一和情况二的处理方式较为复杂，下面通过一个具体实施例进行详细说明。

本发明实施例中，图4是本发明实施例的一种文本识别的方法流程图。如图4所示，具体包括如下步骤：

步骤S400、接收第二图像，其中，所述第二图像为部分词汇书写单元已书写文本的格式作业纸图像。

举例说明，第二图像如图5所示，假设第二图像中包括40个词汇书写单元，其中，有5个词汇书写单元已经书写了内容。

步骤S401、确定所述第二图像对应的格式信息，其中，所述格式信息还表征所述格式作业纸中空置的词汇书写单元的数量以及所述格式作业纸中空置的词汇书写单元的起始位置。

具体的，根据如图5所示的第二图像，确定所述格式作业纸中空置的词汇书写单元的数量为45。

步骤S402、响应于所述格式作业纸中空置的词汇书写单元的数量大于或等于所述待识别文本中包含的词汇数量，保存所述格式作业纸中空置的词汇书写单元的起始位置。

在一种可能的实现方式中，所示执行终端还需要保存所述格式信息，然后根据保存的格式信息进行后续处理。

举例说明，假设待识别文本中包含的词汇数量为20，所述格式作业纸中空置的词汇书写单元的数量为45，大于待识别文本中包含的词汇数量，保存所述格式作业纸中空置的词汇书写单元的数量。

步骤S403、接收第一图像，其中，所述第一图像为已书写待识别文本的格式作业纸图像。

步骤S404、根据所述第一图像与所述格式作业纸的格式信息，确定所述待识别文本的文本内容。

具体的，所述格式信息表征了格式作业纸预先印刷的各词汇书写单元的位置以及所述格式作业纸中空置的词汇书写单元的数量。

本发明实施例中，在步骤S401之后，该方法还包括步骤S405，具体如图6所示，图6是本发明实施例的一种文本识别的方法流程图，具体包括如下步骤：

步骤S405、响应于所述格式作业纸中空置的词汇书写单元的数量小于所述待识别文本中包含的词汇数量，重新发送所述第二图像获取指令。

具体的，由于所述格式作业纸中空置的词汇书写单元的数量小于所述待识别文本中包含的词汇数量，即若使用该格式作业纸，则无法书写完所述待识别文本，因此，需要获取新的第二图像，即获取新的格式作业纸图像；若新的格式作业纸中空置的词汇书写单元的数量大于或等于所述待识别文本中包含的词汇数量，将所述待识别文本书写到新的格式作业纸中；若所述新的格式作业纸中空置的词汇书写单元的数量依旧小于所述待识别文本中包含的词汇数量，再次获取新的第二图像，以此类推。

在一种可能的实现方式中，由于所述格式作业纸中空置的词汇书写单元的数量小于所述待识别文本中包含的词汇数量，若使用该格式作业纸，则无法书写完所述待识别文本，则先将该格式作业纸中的空置的词汇书写单元使用完成，然后提示更换格式作业纸，发送新的格式作业纸获取指令，获取到新的格式作业纸，最后将剩余的没有书写为完成的部分待识别文本书写到新的格式作业纸中。

在一种可能的实现方式中，可以采用以下方法对确定所述第二图像对应的格式信息，此处的格式信息是指所述格式作业纸中空置的词汇书写单元的数量，具体如图7所示，图7是本发明实施例的一种文本识别的方法流程图，具体包括如下步骤：

步骤S700、通过光学字符识别OCR确定所述第二图像中已书写文本的位置。

假设，如图8所示，第二图像对应的格式作业纸中包括5个已书写文本，通过OCR确定所述5个已书写文本的位置。

步骤S701、确定所述已书写文本对应的第一区域与第二区域的面积交并比，其中，所述第二区域为所述第二图像对应的格式作业纸中与第一区域的位置相同的词汇书写单元对应的区域。

具体的，图8中，每个已书写文本对应的第一区域如图8中虚线框所示，所示第二区域即该为所述第二图像对应的格式作业纸中与第一区域的位置相同的词汇书写单元对应的区域，即每个实线框。

步骤S702、根据所述面积交并比确定所述格式作业纸中空置的词汇书写单元的数量。

假设，第一区域与第二区域的面积交并比大于或等于设定阈值，说明在词汇书写单元中已书写了文本；若第一区域与第二区域的面积交并比小于设定阈值，说明在词汇书写单元中没有书写文本，进而可以确定出所述格式作业纸中空置的词汇书写单元的数量。

在一种可能的实现方式中，在步骤S301确定出待识别文本的文本内容之后，还需要进行批改，具体流程如图9所示，图9是本发明实施例的一种文本识别的方法流程图，具体包括如下步骤：

步骤S302、根据标准文本内容，对所述待识别文本的文本内容进行批改。

具体的，所述标准文本内容即所述待识别文本对应的正确的文本内容，将所述正确的文本内容与学生书写的待识别文本的文本内容进行比较，即可以判断出待识别文本的文本内容是否正确。

步骤S303、生成批改反馈信息。

在一种可能的实现方式中，所述生成批改反馈信息的过程中，可以直接在第二图像上进行批改，生成批改反馈信息；也可以对第二图像进行处理后生成新的批改反馈信息，具体的处理方法如图10所示，步骤如下：

步骤S1000、通过关键点匹配，确定出所述第一图像中每个所述待识别文本的文本内容所在的词汇书写单元对应的区域图像。

具体的，所示关键点可以为格式作业纸中的特定点。

步骤S1001、对所述区域图像进行图像去畸变，将所述去畸变后的区域图像按照所述文本内容进行排序。

具体的，由于获取到的图像可能并非垂直拍摄的，因此图像会有变形，进而图像中的文本内容也会存在变形，因此需要对其进行去畸变。

步骤S1002、按照所述排序的顺序将所述去畸变后的区域图像合成为所述批改反馈信息。

具体的，合成的所述批改反馈信息如图11所示。

在一种可能的实现方式中，当待识别文本的文本内容没有标准答案时，例如，所述待识别文本的文本内容是学生书写的作文，则在步骤S301确定出待识别文本的文本内容之后，处理流程如图12所示，图12是本发明实施例的一种文本识别的方法流程图，具体包括如下步骤：

步骤S304、通过自然语言处理，对所述待识别文本的文本内容进行批改。

本发明实施例中，通过自然语言处理(Natural language processing，NLP)待识别文本的文本内容中多写、错写以及位置写反的内容进行批改。

步骤S305、生成批改反馈信息。

具体的，生成批改反馈信息的处理过程如上述图10所示，在此不再赘述。

在一种可能的实现方式中，该方法还包括：响应于所述批改反馈信息中存在书写错误的词汇，将所述书写错误的词汇存储到错题库。

具体的，存储所述书写错误的词汇之外，还可以使用大数据算法确定绝大多数学生容易写错的单词加入到错题库，或者，通过语音技术或自然语言处理查找与错题拼写相似、词义相似、以及发音相似的单词，加入到错题库，然后根据错题库存储的词汇对学生进行加强练习。

在一种可能的实现方式中，该方法还包括：根据预先设置的书写不规范词汇的规则对所述待识别文本的文本内容进行模糊匹配，确定所述文本内容中书写不规范的词汇。

具体的，如上述实施例中，相邻的两个字母“o”和“l”，因为书写潦草，可能会识别为“d”；相邻的两个字母“v”和“v”两个字母，因为书写潦草，可能会识别为“w”等；因此，预先设置书写不规范词汇的规则，对可能出现上述问题字母进行预先设置，当出现上述情况时，可以对所述待识别文本的文本内容进行模糊匹配，确定所述文本内容中书写不规范的词汇，以便确定出正确的文本内容，并把出现的问题进行保存，对学生进行提醒。

在一种可能的实现方式中，当处理终端获得第二图像时，首先还需要对第二图像是否为格式作业纸进行判断，若是，则执行后续处理，若不是也需要重新获取第二图像。

在一种可能的实现方式中，执行终端即学生端，所述执行终端为摄像头的智能设备，例如，智能台灯、点读笔、平板电脑、智能手机等；执行终端在文本识别的过程中，处理的方法流程如图13所示，具体包括如下步骤：

步骤S1300、接收第一图像获取指令。

具体的，所述执行终端接收学生触发的第一图像获取指令，所述触发的动作可以为点击拍摄按钮，或者发出语音指令等，本发明实施例对其不做限定。

步骤S1301、根据所述第一图像获取指令获取第一图像，其中，所述第一图像为已书写待识别文本的格式作业纸图像。

步骤S1302、发送所述第一图像。

具体的，所述执行终端将所述第一图像发送至所述处理终端。

在一种可能的实现方式中，在步骤S1300之前，还包括以下步骤，具体流程如图14所示，图14为一种文本识别的方法流程图，具体包括如下步骤：

步骤S1303、接收第二图像获取指令。

步骤S1304、根据所述第二图像获取指令获取第二图像，其中，所述第二图像为部分词汇书写单元已书写文本的格式作业纸图像。

步骤S1305、发送所述第二图像。

下面通过一个完整实施例，从执行终端和处理终端交互的角度对本发明实施例的一种文本识别的方法进行详细的说明，具体如图15所示，包括如下步骤：

步骤S1500、执行终端接收第二图像获取指令。

步骤S1501、所述执行终端根据所述第二图像获取指令获取第二图像，其中，所述第二图像为部分词汇书写单元已书写文本的格式作业纸图像。

可选的，所述第二图像也可以为未书写任何文本的格式作业纸图像。

步骤S1502、所述执行终端发送所述第二图像。

步骤S1503、所述处理终端接收所述第二图像。

步骤S1504、所述处理终端识别出所述第二图像为格式作业纸图像，确定所述第二图像对应的格式作业纸中空置的词汇书写单元的数量以及所述空置的词汇书写单元的起始位置。

具体的，所述起始位置可以为起始序号。

步骤S1505、所述处理终端确定所述格式作业纸中空置的词汇书写单元的数量大于所述待识别文本中包含的词汇数量，保存所述空置的词汇书写单元的起始位置。

步骤S1506、所述执行终端接收第一图像获取指令。

步骤S1507、所述执行终端根据所述第一图像获取指令获取第一图像，其中，所述第一图像为已书写待识别文本的格式作业纸图像。

步骤S1508、所述执行终端发送所述第一图像。

步骤S1509、所述处理终端接收第一图像，其中，所述第一图像为已书写待识别文本的格式作业纸图像。

步骤S1510、所述处理终端根据所述第一图像与所述格式作业纸的格式信息，确定所述待识别文本的文本内容，其中，所述格式信息表征了格式作业纸预先印刷的各词汇书写单元的位置。

步骤S1511、所述处理终端对所述待识别文本的文本内容进行批改。

步骤S1512、所述处理终端生成批改反馈信息，同时，响应于所述批改反馈信息中存在书写错误的词汇，将所述书写错误的词汇存储到错题库。

在一种可能的实现方式中，执行终端1601与处理终端1602组成了一个***，如图16所示，执行终端接收第一图像获取指令，根据所述第一图像获取指令获取已书写待识别文本的格式作业纸图像，即第一图像，所述执行终端发送所述第一图像至处理终端，处理终端接收到第一图像后，根据所述第一图像与所述格式作业纸的格式信息，确定所述待识别文本的文本内容，所述格式信息表征了格式作业纸预先印刷的各词汇书写单元的位置；通过上述方法，由于设计了特定的格式作业纸，再书写文本时会将每个词汇分别写入各词汇书写单元，然后再对所述特定的格式作业纸进行识别，提高了已书写文本的识别准确率。

图17是本发明实施例的一种文本识别的装置示意图。如图17所示，本实施例的装置包括第一接收单元1701和第一确定单元1702。

其中，第一接收单元1701，用于接收第一图像，其中，所述第一图像为已书写待识别文本的格式作业纸图像；第一确定单元1702，用于根据所述第一图像与所述格式作业纸的格式信息，确定所述待识别文本的文本内容，其中，所述格式信息表征了格式作业纸预先印刷的各词汇书写单元的位置。

图18是本发明实施例的一种文本识别的装置示意图。如图18所示，本实施例的装置包括第二接收单元1801、第二获取单元1802、和第二发送单元1803。

其中，第二接收单元1801，用于接收第一图像获取指令；第二获取单元1802，用于根据所述第一图像获取指令获取第一图像，其中，所述第一图像为已书写待识别文本的格式作业纸图像；第二发送单元1803，用于发送所述第一图像。

图19是本发明实施例的电子设备的示意图。图19所示的电子设备为通用文本识别装置，其包括通用的计算机硬件结构，其至少包括处理器1901和存储器1902。处理器1901和存储器1902通过总线1903连接。存储器1902适于存储处理器1901可执行的指令或程序。处理器1901可以是独立的微处理器，也可以是一个或者多个微处理器集合。由此，处理器1901通过执行存储器1902所存储的指令，从而执行如上所述的本发明实施例的方法流程实现对于数据的处理和对于其它装置的控制。总线1903将上述多个组件连接在一起，同时将上述组件连接到显示控制器1904和显示装置以及输入/输出(I/O)装置1905。输入/输出(I/O)装置1905可以是鼠标、键盘、调制解调器、网络接口、触控输入装置、体感输入装置、打印机以及本领域公知的其他装置。典型地，输入/输出装置1905通过输入/输出(I/O)控制器1906与***相连。

如本领域技术人员将意识到的，本发明实施例的各个方面可以被实现为***、方法或计算机程序产品。因此，本发明实施例的各个方面可以采取如下形式：完全硬件实施方式、完全软件实施方式(包括固件、常驻软件、微代码等)或者在本文中通常可以都称为“电路”、“模块”或“***”的将软件方面与硬件方面相结合的实施方式。此外，本发明实施例的各个方面可以采取如下形式：在一个或多个计算机可读介质中实现的计算机程序产品，计算机可读介质具有在其上实现的计算机可读程序代码。

可以利用一个或多个计算机可读介质的任意组合。计算机可读介质可以是计算机可读信号介质或计算机可读存储介质。计算机可读存储介质可以是如(但不限于)电子的、磁的、光学的、电磁的、红外的或半导体***、设备或装置，或者前述的任意适当的组合。计算机可读存储介质的更具体的示例(非穷尽列举)将包括以下各项：具有一根或多根电线的电气连接、便携式计算机软盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或闪速存储器)、光纤、便携式光盘只读存储器(CD-ROM)、光存储装置、磁存储装置或前述的任意适当的组合。在本发明实施例的上下文中，计算机可读存储介质可以为能够包含或存储由指令执行***、设备或装置使用的程序或结合指令执行***、设备或装置使用的程序的任意有形介质。

计算机可读信号介质可以包括传播的数据信号，所述传播的数据信号具有在其中如在基带中或作为载波的一部分实现的计算机可读程序代码。这样的传播的信号可以采用多种形式中的任何形式，包括但不限于：电磁的、光学的或其任何适当的组合。计算机可读信号介质可以是以下任意计算机可读介质：不是计算机可读存储介质，并且可以对由指令执行***、设备或装置使用的或结合指令执行***、设备或装置使用的程序进行通信、传播或传输。

可以使用包括但不限于无线、有线、光纤电缆、RF等或前述的任意适当组合的任意合适的介质来传送实现在计算机可读介质上的程序代码。

用于执行针对本发明实施例各方面的操作的计算机程序代码可以以一种或多种编程语言的任意组合来编写，所述编程语言包括：面向对象的编程语言如Java、Smalltalk、C++等；以及常规过程编程语言如“C”编程语言或类似的编程语言。程序代码可以作为独立软件包完全地在用户计算机上、部分地在用户计算机上执行；部分地在用户计算机上且部分地在远程计算机上执行；或者完全地在远程计算机或服务器上执行。在后一种情况下，可以将远程计算机通过包括局域网(LAN)或广域网(WAN)的任意类型的网络连接至用户计算机，或者可以与外部计算机进行连接(例如通过使用因特网服务供应商的因特网)。

上述根据本发明实施例的方法、设备(***)和计算机程序产品的流程图图例和/或框图描述了本发明实施例的各个方面。将要理解的是，流程图图例和/或框图的每个块以及流程图图例和/或框图中的块的组合可以由计算机程序指令来实现。这些计算机程序指令可以被提供至通用计算机、专用计算机或其它可编程数据处理设备的处理器，以产生机器，使得(经由计算机或其它可编程数据处理设备的处理器执行的)指令创建用于实现流程图和/或框图块或块中指定的功能/动作的装置。

还可以将这些计算机程序指令存储在可以指导计算机、其它可编程数据处理设备或其它装置以特定方式运行的计算机可读介质中，使得在计算机可读介质中存储的指令产生包括实现在流程图和/或框图块或块中指定的功能/动作的指令的制品。

计算机程序指令还可以被加载至计算机、其它可编程数据处理设备或其它装置上，以使在计算机、其它可编程设备或其它装置上执行一系列可操作步骤来产生计算机实现的过程，使得在计算机或其它可编程设备上执行的指令提供用于实现在流程图和/或框图块或块中指定的功能/动作的过程。

以上所述仅为本发明的优选实施例，并不用于限制本发明，对于本领域技术人员而言，本发明可以有各种改动和变化。凡在本发明的精神和原理之内所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种文本识别的方法，其特征在于，该方法包括：

响应于所述格式作业纸中空置的词汇书写单元的数量大于或等于待识别文本中包含的词汇数量，保存所述格式作业纸中空置的词汇书写单元的起始位置；

接收第一图像，其中，所述第一图像为已书写待识别文本的格式作业纸图像，所述第一图像中包括所述第二图像中的已书写文本的词汇书写单元；

2.如权利要求1所述的方法，其特征在于，所述根据所述第一图像与所述格式作业纸的格式信息，确定所述待识别文本的文本内容，具体包括：

3.如权利要求1所述的方法，其特征在于，该方法还包括：

4.如权利要求1所述的方法，其特征在于，所述确定所述第二图像对应的格式信息，具体包括：

5.如权利要求1所述的方法，其特征在于，该方法还包括：

生成批改反馈信息。

6.如权利要求1所述的方法，其特征在于，该方法还包括：

生成批改反馈信息。

7.如权利要求5或6所述的方法，其特征在于，所述生成批改反馈信息，具体包括：

8.如权利要求5或6所述的方法，其特征在于，该方法还包括：

9.如权利要求1所述的方法，其特征在于，该方法还包括：

10.一种文本识别的方法，其特征在于，该方法包括：

接收第二图像获取指令；

发送所述第二图像，其中，所述第二图像包括其对应的格式信息，所述格式信息还表征所述格式作业纸中空置的词汇书写单元的数量以及所述格式作业纸中空置的词汇书写单元的起始位置；

接收第一图像获取指令；

根据所述第一图像获取指令获取第一图像，其中，所述第一图像为已书写待识别文本的格式作业纸图像，所述第一图像中包括所述第二图像中的已书写文本的词汇书写单元；

发送所述第一图像。

11.一种文本识别的装置，其特征在于，该装置包括：

第一接收单元，用于接收第二图像，其中，所述第二图像为部分词汇书写单元已书写文本的格式作业纸图像；

第一确定单元，用于确定所述第二图像对应的格式信息，其中，所述格式信息还表征所述格式作业纸中空置的词汇书写单元的数量以及所述格式作业纸中空置的词汇书写单元的起始位置；

第一处理单元，响应于所述格式作业纸中空置的词汇书写单元的数量大于或等于待识别文本中包含的词汇数量，用于保存所述格式作业纸中空置的词汇书写单元的起始位置；

所述第一接收单元，用于接收第一图像，其中，所述第一图像为已书写待识别文本的格式作业纸图像，所述第一图像中包括所述第二图像中的已书写文本的词汇书写单元；

所述第一确定单元，用于根据所述第一图像与所述格式作业纸的格式信息，确定所述待识别文本的文本内容，其中，所述格式信息表征了格式作业纸预先印刷的各词汇书写单元的位置。

12.一种文本识别的装置，其特征在于，该装置包括：

第二接收单元，用于接收第二图像获取指令；

第二获取单元，用于根据所述第二图像获取指令获取第二图像，其中，所述第二图像为部分词汇书写单元已书写文本的格式作业纸图像；

第二发送单元，用于发送所述第二图像，其中，所述第二图像包括其对应的格式信息，所述格式信息还表征所述格式作业纸中空置的词汇书写单元的数量以及所述格式作业纸中空置的词汇书写单元的起始位置；

所述第二接收单元，用于接收第一图像获取指令；

所述第二获取单元，用于根据所述第一图像获取指令获取第一图像，其中，所述第一图像为已书写待识别文本的格式作业纸图像，所述第一图像中包括所述第二图像中的已书写文本的词汇书写单元；

所述第二发送单元，用于发送所述第一图像。

13.一种计算机可读存储介质，其上存储计算机程序指令，其特征在于，所述计算机程序指令在被处理器执行时实现如权利要求1-10中任一项所述的方法。

14.一种电子设备，包括存储器和处理器，其特征在于，所述存储器用于存储一条或多条计算机程序指令，其中，所述一条或多条计算机程序指令被所述处理器执行以实现如权利要求1-10任一项所述的方法。