CN111081103A

CN111081103A - 一种听写答案获取方法、家教设备及存储介质

Info

Publication number: CN111081103A
Application number: CN201910409633.0A
Authority: CN
Inventors: 崔颖
Original assignee: Guangdong Genius Technology Co Ltd
Current assignee: Guangdong Genius Technology Co Ltd
Priority date: 2019-05-17
Filing date: 2019-05-17
Publication date: 2020-04-28
Anticipated expiration: 2039-05-17
Also published as: CN111081103B

Abstract

本发明实施例涉及教育技术领域，公开了一种听写答案获取方法、家教设备及存储介质。该方法包括：拍摄获得用户书写前的第一页面，再播报听写内容的读音，以及拍摄获得用户书写后的第二页面，然后分别识别第一页面和第二页面，获得第一页面信息和第二页面信息，将第二页面信息和第一页面信息进行比较，获得用户书写的听写答案。实施本发明实施例，能够识别出更加准确的听写答案，从而提高听写答案的检测准确率。

Description

一种听写答案获取方法、家教设备及存储介质

技术领域

本发明涉及教育技术领域，具体涉及一种听写答案获取方法、家教设备及存储介质。

背景技术

目前，学生用户在课后经常使用点读机或学习平板等家教设备进行课文的听写练习，而家教设备会在用户完成听写练习后，采集用户的书写页面，识别书写页面中用户根据听写内容所书写的听写答案，并检测听写答案是否有误。然而在实践中发现，在用户进行听写练习之前，书写的页面上很多时候已经存在之前书写好了的书写内容，或者是用户直接使用带有其它印刷文字的纸张(比如报纸或练习册)进行书写。这样子家教设备在识别听写答案的时候，会把书写页面上所有的文字内容识别出来，以至于误将很多冗余的非答案信息识别为听写答案，导致家教设备对听写答案的检测准确率过低。

发明内容

针对上述缺陷，本发明实施例公开了一种听写答案获取方法、家教设备及存储介质，能够识别出更加准确的听写答案，从而提高听写答案的检测准确率。

本发明实施例第一方面公开一种听写答案获取方法，包括：

拍摄获得用户书写前的第一页面；播报听写内容的读音；

拍摄获得用户书写后的第二页面，所述第二页面是用户在所述第一页面上根据所述听写内容的读音进行书写后形成的页面；

识别所述第一页面，以获得第一页面信息；

识别所述第二页面，以获得第二页面信息；

将所述第二页面信息与所述第一页面信息进行比较，以获得所述用户书写的听写答案。

作为一种可选的实施方式，在本发明实施例第一方面中，所述拍摄获得用户书写前的第一页面之后，所述方法还包括：

判断所述第一页面是否为空白页面；

若不是所述空白页面，提取所述第一页面中任一特征区域；

以及，所述播报听写内容的读音之后，所述方法还包括：

在预设时间段内拍摄获得若干帧用户图像；

判断所述若干帧用户图像是否均包含所述特征区域；

若均包含所述特征区域，判断所述若干帧用户图像是否用于描述用户根据所述听写内容的读音进行书写完毕；

若书写完毕，执行所述拍摄获得用户书写后的第二页面的步骤。

作为一种可选的实施方式，在本发明实施例第一方面中，所述识别所述第一页面，以获得第一页面信息之前，所述方法还包括：

识别所述第一页面中用户手部所在的第一区域；将所述第一区域从所述第一页面中抠除，以获得目标第一页面；

所述识别所述第一页面，以获得第一页面信息，包括：

识别所述目标第一页面，以获得第一页面信息；

所述识别所述第二页面，以获得第二页面信息之前，所述方法还包括：

识别所述第二页面中用户手部所在的第二区域；将所述第二区域从所述第二页面中抠除，以获得目标第二页面；

所述识别所述第二页面，以获得第二页面信息，包括：

识别所述目标第二页面，以获得第二页面信息。

作为一种可选的实施方式，在本发明实施例第一方面中，所述听写内容包括若干个听写字词；所述方法还包括：

在播报所述听写内容的读音的过程中，记录用户在所述第一页面上根据所述听写内容中的每一个所述听写字词的读音进行书写的书写位置；

以及，所述将所述第二页面信息与所述第一页面信息进行比较以获得所述用户书写的听写答案之后，所述方法还包括：

对所述听写答案进行分词处理，获得若干个答案字词；

获取每一个所述答案字词在所述第二页面中的图像位置；

根据所述图像位置以及所述书写位置，确定与每一个所述答案字词对应的听写字词；

针对每一个所述答案字词，通过与所述答案字词对应的听写字词的标准答案对所述答案字词进行批改。

作为一种可选的实施方式，在本发明实施例第一方面中，所述方法还包括：

在播报所述听写内容的读音的过程中，记录用户在所述第一页面上根据所述听写内容中的每一个所述听写字词的读音进行书写的开始书写时刻；

以及，所述针对每一个所述答案字词，通过与所述答案字词对应的听写字词的标准答案对所述答案字词进行批改之后，所述方法还包括：

按照所述开始书写时刻从先到后的顺序，对批改后的若干个正确答案字词进行排序以获得正确答案字词序列，以及按照所述顺序对批改后的若干个错误答案字词进行排序以获得错误答案字词序列；其中，所述错误答案字词与其对应的标准答案不匹配，所述正确答案字词与其对应的标准答案相匹配；

输出包含所述正确答案字词序列和/或所述错误答案字词序列的列表。

本发明实施例第二方面公开一种家教设备，包括：

拍摄单元，用于拍摄获得用户书写前的第一页面；

播报单元，用于在所述拍摄单元拍摄获得用户书写前的第一页面之后，播报听写内容的读音；

所述拍摄单元，还用于拍摄获得用户书写后的第二页面，所述第二页面是用户在所述第一页面上根据所述听写内容的读音进行书写后形成的页面；

识别单元，用于识别所述第一页面以获得第一页面信息；以及，识别所述第二页面以获得第二页面信息；

对比单元，用于将所述第二页面信息与所述第一页面信息进行比较，以获得所述用户书写的听写答案。

作为一种可选的实施方式，在本发明实施例第二方面中，还包括：

判断单元，用于在所述拍摄单元拍摄获得用户书写前的第一页面之后，判断所述第一页面是否为空白页面；

提取单元，用于在所述判断单元判断出所述第一页面不是所述空白页面时，提取所述第一页面中任一特征区域；

所述拍摄单元，还用于在所述播报单元播报听写内容的读音之后，在预设时间段内拍摄获得若干帧用户图像；

所述判断单元，还用于判断所述若干帧用户图像是否均包含所述特征区域；以及，在判断出所述若干帧用户图像均包含所述特征区域时，判断所述若干帧用户图像是否用于描述用户根据所述听写内容的读音进行书写完毕；以及，在判断出用户书写完毕时，触发所述拍摄单元执行所述拍摄获得用户书写后的第二页面的操作。

抠除单元，用于在所述识别单元识别所述第一页面以获得第一页面信息之前，识别所述第一页面中用户手部所在的第一区域，将所述第一区域从所述第一页面中抠除以获得目标第一页面；以及，在所述识别单元识别所述第二页面以获得第二页面信息之前，识别所述第二页面中用户手部所在的第二区域，将所述第二区域从所述第二页面中抠除以获得目标第二页面；

所述识别单元，具体用于识别所述目标第一页面以获得第一页面信息；以及，识别所述目标第二页面以获得第二页面信息。

作为一种可选的实施方式，在本发明实施例第二方面中，所述听写内容包括若干个听写字词；所述家教设备还包括：

记录单元，用于在所述播报单元播报所述听写内容的读音的过程中，记录用户在所述第一页面上根据所述听写内容中的每一个所述听写字词的读音进行书写的书写位置；

分词单元，用于在所述对比单元将所述第二页面信息与所述第一页面信息进行比较以获得所述用户书写的听写答案之后，对所述听写答案进行分词处理，获得若干个答案字词；

获取单元，用于获取每一个所述答案字词在所述第二页面中的图像位置；

确定单元，用于根据所述图像位置以及所述书写位置，确定与每一个所述答案字词对应的听写字词；

批改单元，用于针对每一个所述答案字词，通过与所述答案字词对应的听写字词的标准答案对所述答案字词进行批改。

作为一种可选的实施方式，在本发明实施例第二方面中，所述记录单元，还用于在所述播报单元播报所述听写内容的读音的过程中，记录用户在所述第一页面上根据所述听写内容中的每一个所述听写字词的读音进行书写的开始书写时刻；

以及，所述家教设备还包括：

排序单元，用于在所述批改单元针对每一个所述答案字词，通过与所述答案字词对应的听写字词的标准答案对所述答案字词进行批改之后，按照所述开始书写时刻从先到后的顺序，对批改后的若干个正确答案字词进行排序以获得正确答案字词序列；以及，按照所述顺序对批改后的若干个错误答案字词进行排序以获得错误答案字词序列；其中，所述错误答案字词与其对应的标准答案不匹配，所述正确答案字词与其对应的标准答案相匹配；

输出单元，用于输出包含所述正确答案字词序列和/或所述错误答案字词序列的列表。

本发明实施例第三方面公开一种家教设备，包括：

存储有可执行程序代码的存储器；

与所述存储器耦合的处理器；

所述处理器调用所述存储器中存储的所述可执行程序代码，执行本发明实施例第一方面公开的一种听写答案获取方法。

本发明实施例第四方面公开一种计算机可读存储介质，其存储计算机程序，其中，所述计算机程序使得计算机执行本发明实施例第一方面公开的一种听写答案获取方法。

本发明实施例第五方面公开一种计算机程序产品，当所述计算机程序产品在计算机上运行时，使得所述计算机执行第一方面的任意一种方法的部分或全部步骤。

本发明实施例第六方面公开一种应用发布平台，所述应用发布平台用于发布计算机程序产品，其中，当所述计算机程序产品在计算机上运行时，使得所述计算机执行第一方面的任意一种方法的部分或全部步骤。

与现有技术相比，本发明实施例具有以下有益效果：

本发明实施例中，通过拍摄获得用户书写前的第一页面，再播报听写内容的读音，以及拍摄获得用户书写后的第二页面，然后分别识别第一页面和第二页面，获得第一页面信息和第二页面信息，将第二页面信息和第一页面信息进行比较，以获得用户书写的听写答案，能够识别出更加准确的听写答案，从而提高听写答案的检测准确率。

附图说明

为了更清楚地说明本发明实施例中的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本发明实施例公开的一种听写答案获取方法的流程示意图；

图2是本发明实施例公开的另一种听写答案获取方法的流程示意图；

图3是本发明实施例公开的又一种听写答案获取方法的流程示意图；

图4是本发明实施例公开的一种家教设备的结构示意图；

图5是本发明实施例公开的另一种家教设备的结构示意图；

图6是本发明实施例公开的又一种家教设备的结构示意图；

图7是本发明实施例公开的一种家教设备拍摄获得第一页面或第二页面的拍摄过程示例图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

需要说明的是，本发明的说明书和权利要求书中的术语“第一”、“第二”等是用于区别不同的对象，而不是用于描述特定顺序。本发明实施例的术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、***、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

本发明实施例公开了一种听写答案获取方法、家教设备及存储介质，能够识别出更加准确的听写答案，从而提高听写答案的检测准确率。其中，该方法适用于家教机、学***板或学习电脑等家教设备。其中，各类家教设备的操作***包括但不限于Android操作***、IOS操作***、Symbian(塞班)操作***、Black Berry(黑莓)操作***、Windows Phone8操作***等，本发明实施例不做限定。本发明实施例以家教设备为执行主体进行描述，应理解，不应对本发明构成任何限定。以下结合附图进行详细描述。

实施例一

请参阅图1，图1是本发明实施例公开的一种听写答案获取方法的流程示意图。如图1所示，该听写答案获取方法可以包括以下步骤：

101、家教设备拍摄获得用户书写前的第一页面。

需要说明的是，第一页面包括但不限于空白的作业页、已有内容的作业页、报纸页、教科书或练习册等可用于书写的页面。

本发明实施例中，若第一页面为空白的作业页，家教设备拍摄获得用户书写后的第二页面之后，可直接识别第二页面获得第二页面信息，将第二页面信息作为用户书写的听写答案。

本发明实施例中，用于拍摄图像的拍摄模组可设置于家教设备配有显示屏的一面，并且该面装设有反光装置，反光装置的镜面与拍摄模组的镜头面成预设的角度。请一并参阅图7，图7是本发明实施例公开的一种家教设备拍摄获得第一页面或第二页面的拍摄过程示例图。如图7所示，家教设备控制拍摄模组拍摄反光装置中的镜像作为用户书写前的第一页面或用户书写后的第二页面的方式可以为：图中家教设备10可以设置有拍摄模组20，拍摄模组20用于拍摄以获得第一页面或第二页面；在拍摄模组20正前方还可以设置有反光装置30(例如，反光镜、棱镜或凸透镜等)，反光装置30用于改变拍摄模组的光路，进而使得拍摄模组20拍摄到载体40获得用户书写前的第一页面或用户书写后的第二页面。通过使用家教设备10的拍摄模组20拍摄得到的载体40在反光装置30中的成像，而不用手动改变家教设备10的放置方式，能够简化拍摄过程，提高拍摄效率。其中，载体40具体可以为放置在桌面上的书本、练习册、绘本、试卷等，本发明实施例不做具体限定。

102、家教设备播报听写内容的读音。

本发明实施例中，听写内容包括但不限于听写单字、听写单词、听写词组、听写文段或听写文章等等。同时，听写内容所属学科包括但不限于语文、英语、音乐或化学等等，具体为哪一种学科，本发明也不限定。

103、家教设备拍摄获得用户书写后的第二页面，第二页面是用户在第一页面上根据听写内容的读音进行书写后形成的页面。

本发明实施例中，家教设备拍摄获得用户书写后的第二页面的具体实施方式可以是周期性地进行拍摄。比如，家教设备每播报一个听写内容的读音且检测到用户根据该听写内容写完一个听写答案时，家教设备拍摄一次，从而使得在整个听写过程中获得多张用户书写后的第二页面。基于此，能够对用户每一次写的一个听写答案进行实时识别，从而提高听写答案的获取效率。

周期性地进行拍摄又比如，家教设备每播报指定数量个听写内容且检测到用户写完指定数量个听写答案时，家教设备拍摄一次，从而使得在整个听写过程中获得多张用户书写后的第二页面；其中，指定数量可以预先设置，其具体数值可以是2、3或4等整数，本发明不作具体限定。基于此，能够在实时识别听写答案的同时减少设备功耗，从而提高电池的续航能力。

而在一些其它可能的实施例中，家教设备拍摄获得用户书写后的第二页面的具体实施方式也可以是在接收到用户输入的听写退出指令或者检测到家教设备退出听写模式时，才进行拍摄，从而获得一张用户书写后的第二页面。在这种情况下，家教设备在整个听写过程中只会拍摄获得一张用户书写前的第一页面以及一张用户书写后的第二页面，分别是在家教设备进入和退出听写模式的时候获取的。

作为一种可选的实施方式，若家教设备采取周期性地拍摄获得用户书写后的第二页面，具体可以包括：家教设备在播报听写内容的读音之后，且等待时长达到预设时长时，拍摄获得用户书写后的第二页面，其中等待时长为播报完毕时刻开始计时所获得的时长；以及，将用户书写后的第二页面作为下一周期的用户书写前的第一页面，进入下一周期。

实施该实施方式，通过周期性地拍摄获得用户书写前后的页面，能够对用户每一次写的一个听写答案进行实时识别，从而提高听写答案的获取效率。

作为另一种可选的实施方式，步骤103具体可以包括以下步骤：在家教设备处于听写模式时，家教设备控制装设于自身的摄像模组以预设频率拍摄反光装置中的镜像作为用户正在书写的页面；家教设备实时检测用户正在书写的页面上的各个书写区域是否均写有书写内容；若各个书写区域均写有书写内容，家教设备拍摄获得用户书写后的第二页面。

可以理解的是，若各个书写区域均写有书写内容，可以判定用户正在书写的页面已经即将或完全写满了，在这个时候家教设备可以执行拍摄获得用户书写后的第二页面的操作，否则，继续执行控制装设于自身的摄像模组以预设频率拍摄反光装置中的镜像作为用户正在书写的页面的操作。其中，书写区域可以是用户正在书写的页面中的部分或全部区域。

实施该实施方式，通过在用户正在书写的页面即将或完全写满的时候，拍摄获得用户书写后的第二页面，结合用户书写前的第一页面，获取用户的听写答案进行检测，能够克服周期性地拍摄获得用户书写前后的页面所导致的功耗较大的问题，进而减少设备功耗，提高电池的续航能力。

104、家教设备识别第一页面，以获得第一页面信息。

需要说明的是，本发明实施例中，具体可以通过光学字符识别(OpticalCharacter Recognition，OCR)进行字符识别。OCR一般包括图像预处理、文字识别、识别结果优化等操作；其中，图像预处理通常包括以下几个步骤：灰度化、二值化、降噪、倾斜校正、字符切分等。

105、家教设备识别第二页面，以获得第二页面信息。

106、家教设备将第二页面信息与第一页面信息进行比较，以获得用户书写的听写答案。

可以理解的是，在用户书写前后均存在的信息，即说，第二页面信息与第一页面信息中均出现的共有信息，该共有信息不属于用户根据本次听写过程中所播报的听写内容而书写的听写答案，属于冗余的无效信息。因此，将第二页面信息与第一页面信息中均出现的共有信息从第二页面信息中过滤掉，获得第二页面信息中存在但第一页面信息中不存在的新增信息，以将该新增信息作为用户书写的听写答案。

可见，实施图1所描述的方法，通过拍摄获得用户书写前的第一页面，再播报听写内容的读音，以及拍摄获得用户书写后的第二页面，然后分别识别第一页面和第二页面，获得第一页面信息和第二页面信息，将第二页面信息和第一页面信息进行比较，以获得用户书写的听写答案，能够识别出更加准确的听写答案，从而提高听写答案的检测准确率。

实施例二

请参阅图2，图2是本发明实施例公开的另一种听写答案获取方法的流程示意图。如图2所示，该听写答案获取方法可以包括以下步骤：

201、家教设备拍摄获得用户书写前的第一页面。

202、家教设备判断第一页面是否为空白页面。若否，执行步骤203；反之，结束本流程。

203、家教设备提取第一页面中任一特征区域。

其中，特征区域可以是形状区域，也可以是文字区域。

举例来说，假设特征区域是文字区域，即是，提取第一页面中位于左上角的第一个词组“中心思想”为特征区域。那么在步骤206中，家教设备通过不断地检测拍摄得到的用户图像的左上角是否依旧存在该词组“中心思想”，就可判定用户是否进行翻页动作。可以理解的是，若存在，判定用户没有进行翻页动作；若不存在，则判定用户进行了翻页动作。

204、家教设备播报听写内容的读音。

205、家教设备在预设时间段内拍摄获得若干帧用户图像。

其中，预设时间段可人为根据实际情况进行设定。在实际应用中，预设时间段可以是预设的实施例一中所提到的等待时长，等待时长为播报听写内容的完毕时刻开始计时所获得的时长。

206、家教设备判断若干帧用户图像是否均包含特征区域。若均包含特征区域，执行步骤207；反之，结束本流程。

207、家教设备判断若干帧用户图像是否用于描述用户根据听写内容的读音进行书写完毕。若书写完毕，执行步骤208；反之，结束本流程。

作为一种可选的实施方式，家教设备具体可以通过深度学习等方式在若干帧用户图像中识别出用户动作区域(即包含用于指示用户动作的区域)，判断用户动作区域中用户的当前姿态是否与用于指示书写完毕的预设姿态相适配；若相适配，判定用户根据听写内容的读音进行书写完毕。

进一步可选地，家教设备具体可以通过跟踪每一帧用户图像中的用户动作目标，获取用户动作目标对应的动作序列，对动作序列进行预处理，以及将预处理后的动作序列输入预先训练好的动作分类模型，在动作分类模型中提取动作序列的深度动作特征，并且根据深度动作特征在动作分类模型中识别动作序列是否用于描述用户根据听写内容的读音进行书写完毕。

其中，预处理包括动作序列的筛选、图像的均衡化、图像的归一化、动作校正、图像缩放中的一种或多种组合。其中，预先训练好的动作分类模型可以是以深度卷积神经网络为基线网络而构建并训练完成的。

通过上述的实施方式，能够提高对用户图像是否用于描述用户根据听写内容的读音进行书写完毕的判别准确率，从而减少家教设备拍摄获得用户书写后的第二页面的误触发，进而提高听写答案的获取准确率。

208、家教设备拍摄获得用户书写后的第二页面。

209、家教设备识别第一页面，以获得第一页面信息。

作为一种可选的实施方式，在执行步骤209之前，家教设备还可以识别第一页面中用户手部所在的第一区域，将第一区域从第一页面中抠除，以获得目标第一页面。因此，步骤209的具体实施方式是：家教设备识别目标第一页面，以获得第一页面信息。实施该实施方式，能够排除用户手部所在区域造成的识别干扰，从而提高页面信息的识别准确率。

210、家教设备识别第二页面，以获得第二页面信息。

作为一种可选的实施方式，在执行步骤210之前，家教设备还可以识别第二页面中用户手部所在的第二区域，将第二区域从第二页面中抠除，以获得目标第二页面。因此，步骤210的具体实施方式是：家教设备识别目标第二页面，以获得第二页面信息。实施该实施方式，能够排除用户手部所在区域造成的识别干扰，从而提高页面信息的识别准确率。

211、家教设备将第二页面信息与第一页面信息进行比较，以获得用户书写的听写答案。

可见，与实施图1所描述的方法相比较，实施图2所描述的方法，还能够在拍摄获得的用户书写前的第一页面不是空白页面时，提取第一页面中的任一特征区域，接着检测这一特征区域，以此判断用户是否进行了翻页动作，若用户没有进行翻页动作，且检测到用户书写完毕时，再拍摄获得用户书写后的第二页面，能够克服因用户进行了翻页动作而导致拍摄到的第二页面与第一页面不是同一页面的难题，进而提高听写答案的获取准确率。

实施例三

请参阅图3，图3是本发明实施例公开的另一种听写答案获取方法的流程示意图。如图3所示，该听写答案获取方法可以包括以下步骤：

301～302。其中，针对步骤301～302的描述，请参照实施例一中针对步骤101～102的详细描述，本发明在此不再赘述。其中，听写内容包括若干个听写字词，听写***括若干个听写字词。

303、家教设备在播报听写内容的读音的过程中，记录用户在第一页面上根据听写内容中的每一个听写字词的读音进行书写的书写位置。

需要说明的是，在一些可能的场景下，用户根据听写内容而书写的顺序并不一定是按照从左到右或从上到下的特定顺序，而是按照用户的随机意愿，在第一页面上的任意一个位置进行书写。

举例来说，假设第一页面为报纸，显而易见地，报纸并没有特定的文本行供用户进行书写，因此用户可能在第一页面上任意一个空白处书写，从而导致图像识别技术识别出的听写答案所包括的若干个答案字词并不是按照听写字词的读音播报顺序而排列的。在这种极大可能性的场景下，若一味按照听写字词的读音播报顺序，获取对应的标准答案对答案字词进行批改，则会出现批改错乱的现象，导致批改准确率过低。

综上所述，通过执行步骤303以及步骤308～311，可以实时记录用户在第一页面上根据听写字词的读音进行书写的书写位置，然后在识别出听写答案后，结合听写答案中每一个答案字词在第二页面中的图像位置，确定每一个答案字词对应的听写字词，以获得每一个答案字词对应的标准答案，最后根据标准答案对答案字词进行批改，能够克服一味按照听写字词的读音播报顺序，获取对应的标准答案对答案字词进行批改而出现批改错乱现象的难题，进而提高了批改准确率，使得家教设备更加智能化。

作为另一种可选的实施方式，家教设备在播报听写内容的读音的过程中，记录用户在第一页面上根据听写内容中的每一个听写字词的读音进行书写的书写位置的同时，还可以记录用户在第一页面上根据听写内容中的每一个听写字词的读音进行书写的开始书写时刻。

基于此，在执行步骤311之后，还可以执行以下步骤：家教设备按照开始书写时刻从先到后的顺序，对批改后的若干个正确答案字词进行排序以获得正确答案字词序列，以及按照该顺序对批改后的若干个错误答案字词进行排序以获得错误答案字词序列；其中，错误答案字词与其对应的标准答案不匹配，正确答案字词与其对应的标准答案相匹配；家教设备输出包含正确答案字词序列和/或错误答案字词序列的列表。

实施该实施方式，通过按照播报顺序，输出包含正确答案字词序列和/或错误答案字词序列的列表，能够帮助用户加深对答案字词的印象，从而加深对答案字词的记忆力，改善听写效果。

进一步可选地，家教设备输出包含错误答案字词序列的列表的方式具体可以是：家教设备输出包含错误答案字词序列以及对应的标准答案序列的列表，其中错误答案字词序列包括若干个错误答案字词，标准答案序列包括若干个与错误答案字词一一对应的标准答案。

举例来说，假设错误答案字词序列为“沙鱼-海样-星求”，那么对应的标准答案序列为“鲨鱼-海洋-星球”，其中，错误答案字词“沙鱼”与标准答案“鲨鱼”一一对应，错误答案字词“海样”与标准答案“海洋”一一对应，错误答案字词“星求”与标准答案“星球”一一对应。而且，标准答案“鲨鱼”、“海洋”以及“星球”的顺序与对应的听写字词的读音的播报顺序相同，播报顺序具体为听写字词的读音“sha(1声)yu(2声)”、“hai(3声)yang(2声)”以及“xing(1声)qiu(2声)”。

304～307。其中，针对步骤304～307的描述，请参照实施例一中针对步骤103～106的详细描述，本发明在此不再赘述。

308、家教设备对听写答案进行分词处理，获得若干个答案字词。

本发明实施例中，家教设备具体可以按照一定的规则，对听写答案中的字序列进行重新组合成词序列。假设听写内容所属科目为语文，那么听写答案也为中文文本，家教设备具体可以通过基于字符串匹配的分词、基于理解的分词或者基于统计的分词等方法来进行分词处理。

309、家教设备获取每一个答案字词在第二页面中的图像位置。

310、家教设备根据图像位置以及书写位置，确定与每一个答案字词对应的听写字词。

311、家教设备针对每一个答案字词，通过与答案字词对应的听写字词的标准答案对答案字词进行批改。

可见，与实施图1所描述的方法相比较，实施图3所描述的方法，还能够实时记录用户在第一页面上根据听写字词的读音进行书写的书写位置，然后在识别出听写答案后，结合听写答案中每一个答案字词在第二页面中的图像位置，确定每一个答案字词对应的听写字词，以获得每一个答案字词对应的标准答案，最后根据标准答案对答案字词进行批改，能够克服一味按照听写字词的读音播报顺序，获取对应的标准答案对答案字词进行批改而出现批改错乱现象的难题，进而提高了批改准确率，使得家教设备更加智能化。

除此之外，还能够通过按照播报顺序，输出包含正确答案字词序列和/或错误答案字词序列的列表，能够帮助用户加深对答案字词的印象，从而加深对答案字词的记忆力，改善听写效果。

实施例四

请参阅图4，图4是本发明实施例公开的一种家教设备的结构示意图。如图4所示，该家教设备可以包括：

拍摄单元401，用于拍摄获得用户书写前的第一页面。

播报单元402，用于在拍摄单元401拍摄获得用户书写前的第一页面之后，播报听写内容的读音。

上述的拍摄单元401，还用于拍摄获得用户书写后的第二页面，第二页面是用户在第一页面上根据听写内容的读音进行书写后形成的页面。

识别单元403，用于识别第一页面以获得第一页面信息；以及，识别第二页面以获得第二页面信息。

对比单元404，用于将第二页面信息与第一页面信息进行比较，以获得用户书写的听写答案。

作为一种可选的实施方式，对比单元404，还用于在拍摄单元401拍摄获得的用户书写前的第一页面为空白作业页时，将识别单元403识别第二页面获得的第二页面信息作为用户书写的听写答案。

作为一种可选的实施方式，上述的拍摄单元401拍摄获得用户书写后的第二页面的方式具体可以是周期性地进行拍摄。

进一步可选地，上述的拍摄单元401用于周期性地进行拍摄获得用户书写后的第二页面的方式具体可以是：

上述的拍摄单元401，用于在播报单元402播报听写内容的读音之后，且等待时长达到预设时长时，拍摄获得用户书写后的第二页面，其中等待时长为播报完毕时刻开始计时所获得的时长；以及，将用户书写后的第二页面作为下一周期的用户书写前的第一页面，进入下一周期。实施该实施方式，通过周期性地拍摄获得用户书写前后的页面，能够对用户每一次写的一个听写答案进行实时识别，从而提高听写答案的获取效率。

作为另一种可选的实施方式，上述的拍摄单元401用于拍摄获得用户书写后的第二页面的方式具体可以是：

上述的拍摄单元401，用于在家教设备处于听写模式时，控制装设于家教设备的摄像模组以预设频率拍摄反光装置中的镜像作为用户正在书写的页面；以及，实时检测用户正在书写的页面上的各个书写区域是否均写有书写内容；若是，拍摄获得用户书写后的第二页面。

可以理解的是，若各个书写区域均写有书写内容，可以判定用户正在书写的页面已经即将或完全写满了，上述的拍摄单元401可以执行拍摄获得用户书写后的第二页面的操作，否则，继续执行控制装设于家教设备的摄像模组以预设频率拍摄反光装置中的镜像作为用户正在书写的页面的操作。其中，书写区域可以是用户正在书写的页面中的部分或全部区域。

可见，实施图4所描述的家教设备，能够通过拍摄获得用户书写前的第一页面，再播报听写内容的读音，以及拍摄获得用户书写后的第二页面，然后分别识别第一页面和第二页面，获得第一页面信息和第二页面信息，将第二页面信息和第一页面信息进行比较，以获得用户书写的听写答案，能够识别出更加准确的听写答案，从而提高听写答案的检测准确率。

实施例五

请参阅图5，图5是本发明实施例公开的另一种家教设备的结构示意图。其中，图5所示的家教设备是由图4所示的家教设备进行优化得到的，与图4相比较，图5所示的家教设备还可以包括：

判断单元405，用于在拍摄单元401拍摄获得用户书写前的第一页面之后，判断第一页面是否为空白页面。

提取单元406，用于在判断单元405判断出第一页面不是空白页面时，提取第一页面中任一特征区域。

上述的拍摄单元401，还用于在播报单元402播报听写内容的读音之后，在预设时间段内拍摄获得若干帧用户图像。

上述的判断单元405，还用于判断若干帧用户图像是否均包含特征区域；以及，在判断出若干帧用户图像均包含特征区域时，判断若干帧用户图像是否用于描述用户根据听写内容的读音进行书写完毕；以及，在判断出用户书写完毕时，触发拍摄单元401执行拍摄获得用户书写后的第二页面的操作。

实施该实施方式，通过在拍摄获得的用户书写前的第一页面不是空白页面时，提取第一页面中的任一特征区域，接着检测这一特征区域，以此判断用户是否进行了翻页动作，若用户没有进行翻页动作，且检测到用户书写完毕时，再拍摄获得用户书写后的第二页面，能够克服因用户进行了翻页动作而导致拍摄到的第二页面与第一页面不是同一页面的难题，进而提高听写答案的获取准确率。

作为一种可选的实施方式，上述的判断单元405用于判断若干帧用户图像是否用于描述用户根据听写内容的读音进行书写完毕的方式具体可以是：

上述的判断单元405，用于通过深度学习等方式在若干帧用户图像中识别出用户动作区域(即包含用于指示用户动作的区域)，判断用户动作区域中用户的当前姿态是否与用于指示书写完毕的预设姿态相适配；若相适配，判定用户根据听写内容的读音进行书写完毕。

进一步可选地，上述的判断单元405用于判断若干帧用户图像是否用于描述用户根据听写内容的读音进行书写完毕的方式具体可以是：

上述的判断单元405，用于跟踪每一帧用户图像中的用户动作目标，获取用户动作目标对应的动作序列，对动作序列进行预处理，以及将预处理后的动作序列输入预先训练好的动作分类模型，以在动作分类模型中提取动作序列的深度动作特征，并且根据深度动作特征在动作分类模型中识别动作序列是否用于描述用户根据听写内容的读音进行书写完毕。

作为一种可选的实施方式，图5所示的家教设备还可以包括：

抠除单元407，用于在识别单元403识别第一页面以获得第一页面信息之前，识别第一页面中用户手部所在的第一区域，将第一区域从第一页面中抠除以获得目标第一页面；以及，在识别单元404识别第二页面以获得第二页面信息之前，识别第二页面中用户手部所在的第二区域，将第二区域从第二页面中抠除以获得目标第二页面。

上述的识别单元403，具体用于识别目标第一页面以获得第一页面信息；以及，识别目标第二页面以获得第二页面信息。

实施该实施方式，能够排除用户手部所在区域造成的识别干扰，从而提高页面信息的识别准确率。

作为一种可选的实施方式，听写内容包括若干个听写字词；那么图5所示的家教设备还可以包括：

记录单元408，用于在播报单元402播报听写内容的读音的过程中，记录用户在第一页面上根据听写内容中的每一个听写字词的读音进行书写的书写位置。

分词单元409，用于在对比单元404将第二页面信息与第一页面信息进行比较以获得用户书写的听写答案之后，对听写答案进行分词处理，获得若干个答案字词。

获取单元410，用于获取每一个答案字词在第二页面中的图像位置。

确定单元411，用于根据图像位置以及书写位置，确定与每一个答案字词对应的听写字词。

批改单元412，用于针对每一个答案字词，通过与答案字词对应的听写字词的标准答案对答案字词进行批改。

实施该实施方式，通过实时记录用户在第一页面上根据听写字词的读音进行书写的书写位置，然后在识别出听写答案后，结合听写答案中每一个答案字词在第二页面中的图像位置，确定每一个答案字词对应的听写字词，以获得每一个答案字词对应的标准答案，最后根据标准答案对答案字词进行批改，能够克服一味按照听写字词的读音播报顺序，获取对应的标准答案对答案字词进行批改而出现批改错乱现象的难题，进而提高了批改准确率，使得家教设备更加智能化。

作为另一种可选的实施方式，图5所示的家教设备中，上述的记录单元408，还用于在播报单元402播报听写内容的读音的过程中，记录用户在第一页面上根据听写内容中的每一个听写字词的读音进行书写的开始书写时刻。

以及，家教设备还可以包括：

排序单元413，用于在批改单元412针对每一个答案字词，通过与答案字词对应的听写字词的标准答案对答案字词进行批改之后，按照开始书写时刻从先到后的顺序，对批改后的若干个正确答案字词进行排序以获得正确答案字词序列；以及，按照顺序对批改后的若干个错误答案字词进行排序以获得错误答案字词序列；其中，错误答案字词与其对应的标准答案不匹配，正确答案字词与其对应的标准答案相匹配。

输出单元414，用于输出包含正确答案字词序列和/或错误答案字词序列的列表。

作为一种可选的实施方式，输出单元414用于输出包含错误答案字词序列的列表的方式具体可以是：

输出单元414，用于输出包含错误答案字词序列以及对应的标准答案序列的列表；其中，错误答案字词序列包括若干个错误答案字词，标准答案序列包括若干个与错误答案字词一一对应的标准答案。

实施上述实施方式，通过按照播报顺序，输出包含正确答案字词序列和/或错误答案字词序列的列表，能够帮助用户加深对答案字词的印象，从而加深对答案字词的记忆力，改善听写效果。

可见，与实施图4所描述的家教设备相比较，实施图5所描述的家教设备，还能够克服因用户进行了翻页动作而导致拍摄到的第二页面与第一页面不是同一页面的难题，进而提高听写答案的获取准确率。

除此之外，还能够排除用户手部所在区域造成的识别干扰，从而提高页面信息的识别准确率。

此外，还能够克服一味按照听写字词的读音播报顺序，获取对应的标准答案对答案字词进行批改而出现批改错乱现象的难题，进而提高了批改准确率，使得家教设备更加智能化。

以及，能够帮助用户加深对答案字词的印象，从而加深对答案字词的记忆力，改善听写效果。

实施例六

请参阅图6，图6是本发明实施例公开的又一种家教设备的结构示意图。如图6所示，该家教设备可以包括：

存储有可执行程序代码的存储器601；

与存储器601耦合的处理器602；

其中，处理器602调用存储器601中存储的可执行程序代码，执行图1～图3任意一种听写答案获取方法。

需要说明的是，图6所示的家教设备还可以包括电源、输入按键、扬声器、麦克风、屏幕、RF电路、Wi-Fi模块、蓝牙模块、传感器等未显示的组件，本实施例不作赘述。

本发明实施例公开一种计算机可读存储介质，其存储计算机程序，其中，该计算机程序使得计算机执行图1～图3任意一种听写答案获取方法。

本发明实施例还公开一种计算机程序产品，其中，当计算机程序产品在计算机上运行时，使得计算机执行如以上各方法实施例中的方法的部分或全部步骤。

本发明实施例还公开一种应用发布平台，其中，应用发布平台用于发布计算机程序产品，其中，当计算机程序产品在计算机上运行时，使得计算机执行如以上各方法实施例中的方法的部分或全部步骤。

应理解，说明书通篇中提到的“一个实施例”或“一实施例”意味着与实施例有关的特定特征、结构或特性包括在本发明的至少一个实施例中。因此，在整个说明书各处出现的“在一个实施例中”或“在一实施例中”未必一定指相同的实施例。此外，这些特定特征、结构或特性可以以任意适合的方式结合在一个或多个实施例中。本领域技术人员也应该知悉，说明书中所描述的实施例均属于可选实施例，所涉及的动作和模块并不一定是本发明所必须的。

在本发明的各种实施例中，应理解，上述各过程的序号的大小并不意味着执行顺序的必然先后，各过程的执行顺序应以其功能和内在逻辑确定，而不应对本发明实施例的实施过程构成任何限定。

上述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物单元，即可位于一个地方，或者也可以分布到多个网络单元上。可根据实际的需要选择其中的部分或全部单元来实现本实施例方案的目的。

另外，在本发明各实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

上述集成的单元若以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可获取的存储器中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或者部分，可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储器中，包括若干请求用以使得一台计算机设备(可以为个人计算机、服务器或者网络设备等，具体可以是计算机设备中的处理器)执行本发明的各个实施例上述方法的部分或全部步骤。

在本发明所提供的实施例中，应理解，“与A对应的B”表示B与A相关联，根据A可以确定B。但还应理解，根据A确定B并不意味着仅仅根据A确定B，还可以根据A和/或其他信息确定B。

本领域普通技术人员可以理解上述实施例的各种方法中的部分或全部步骤是可以通过程序来指令相关的硬件来完成，该程序可以存储于一计算机可读存储介质中，存储介质包括只读存储器(Read-Only Memory，ROM)、随机存储器(Random Access Memory，RAM)、可编程只读存储器(Programmable Read-only Memory，PROM)、可擦除可编程只读存储器(Erasable Programmable Read Only Memory，EPROM)、一次可编程只读存储器(One-time Programmable Read-Only Memory，OTPROM)、电子抹除式可复写只读存储器(Electrically-Erasable Programmable Read-Only Memory，EEPROM)、只读光盘(CompactDisc Read-Only Memory，CD-ROM)或其他光盘存储器、磁盘存储器、磁带存储器、或者能够用于携带或存储数据的计算机可读的任何其他介质。

以上对本发明实施例公开的一种听写答案获取方法、家教设备及存储介质进行了详细介绍，本文中应用了具体个例对本发明的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本发明的方法及其核心思想；同时，对于本领域的一般技术人员，依据本发明的思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本发明的限制。

Claims

1.一种听写答案获取方法，其特征在于，包括：

拍摄获得用户书写前的第一页面；播报听写内容的读音；

识别所述第一页面，以获得第一页面信息；

识别所述第二页面，以获得第二页面信息；

2.根据权利要求1所述的方法，其特征在于，所述拍摄获得用户书写前的第一页面之后，所述方法还包括：

判断所述第一页面是否为空白页面；

若不是所述空白页面，提取所述第一页面中任一特征区域；

以及，所述播报听写内容的读音之后，所述方法还包括：

在预设时间段内拍摄获得若干帧用户图像；

判断所述若干帧用户图像是否均包含所述特征区域；

3.根据权利要求1或2所述的方法，其特征在于，所述识别所述第一页面，以获得第一页面信息之前，所述方法还包括：

所述识别所述第一页面，以获得第一页面信息，包括：

识别所述目标第一页面，以获得第一页面信息；

所述识别所述第二页面，以获得第二页面信息，包括：

识别所述目标第二页面，以获得第二页面信息。

4.根据权利要求1至3任一项所述的方法，其特征在于，所述听写内容包括若干个听写字词；所述方法还包括：

对所述听写答案进行分词处理，获得若干个答案字词；

获取每一个所述答案字词在所述第二页面中的图像位置；

5.根据权利要求4所述的方法，其特征在于，所述方法还包括：

6.一种家教设备，其特征在于，包括：

拍摄单元，用于拍摄获得用户书写前的第一页面；

7.根据权利要求6所述的家教设备，其特征在于，还包括：

8.根据权利要求6或7所述的家教设备，其特征在于，还包括：

9.根据权利要求6至8任一项所述的家教设备，其特征在于，所述听写内容包括若干个听写字词；所述家教设备还包括：

10.根据权利要求9所述的家教设备，其特征在于：

所述记录单元，还用于在所述播报单元播报所述听写内容的读音的过程中，记录用户在所述第一页面上根据所述听写内容中的每一个所述听写字词的读音进行书写的开始书写时刻；

以及，所述家教设备还包括：

11.一种家教设备，其特征在于，包括：

存储有可执行程序代码的存储器；

与所述存储器耦合的处理器；

所述处理器调用所述存储器中存储的所述可执行程序代码，用于执行权利要求1至5任一项所述的一种听写答案获取方法。

12.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质存储计算机程序，其中，所述计算机程序使得计算机执行权利要求1至5任一项所述的一种听写答案获取方法。