CN115035763A

CN115035763A - 听写优化方法、装置、计算机设备和存储介质

Info

Publication number: CN115035763A
Application number: CN202210715630.1A
Authority: CN
Inventors: 高亮
Original assignee: Shenzhen Waterward Information Co Ltd
Current assignee: Shenzhen Waterward Information Co Ltd
Priority date: 2022-06-22
Filing date: 2022-06-22
Publication date: 2022-09-09

Abstract

本发明提供的一种听写优化方法、装置、计算机设备和存储介质，包括：执行听写文本录入操作，并获得听写文本；基于书本状态以及人形模板，判断听写者是否进入听写状态；若所述听写者进入所述听写状态，则基于预设方法确定所述听写文本中的目标词汇的播放时刻，并基于所述播放时刻执行听写操作。通过获得更人性化的播放时刻，学生既不着急写下个词，也不浪费时间等下个词，提高学生听写体验以及学生听写积极性，从而充分利用学习设备中的听写功能，提高听写功能的使用率。

Description

听写优化方法、装置、计算机设备和存储介质

技术领域

本发明涉及到智能台灯技术领域，特别是涉及到一种听写优化方法、装置、计算机设备和存储介质。

背景技术

现有的儿童学习设备会附带有听写功能，但在学生使用听写时，当前词与下一个词的时间间隔是相同的，但如果听写的词有多个字，会面临在设定的时间间隔里面无法写完，就匆忙开始写下一个词；如果听写的词是一个字，则会面临在时间间隔里早早就写完，但无法开始下一个词的听写，这样浪费学生学习时间，造成学习体验下降，学习积极性不高，最终导致学习设备中的听写功能成为了摆设，使用率极低。

发明内容

本发明的主要目的为提供一种听写优化方法、装置、计算机设备和存储介质，能够解决现有技术中学习设备的听写功能使用率低的技术问题。

本发明提供的一种听写优化方法，所述方法包括：

执行听写文本录入操作，并获得听写文本；

基于书本状态以及人形模板，判断听写者是否进入听写状态；

若所述听写者进入所述听写状态，则基于预设方法确定所述听写文本中的目标词汇的播放时刻，并基于所述播放时刻执行听写操作。

进一步，所述基于预设方法确定所述听写文本中的目标词汇的播放时刻的步骤，包括：

所述目标词汇播放后，进行时间记录，作为第一时间；

若所述第一时间小于或等于预设的时间阈值，检测到设定指令，以第一时间作为所述听写文本中的目标词汇的播放时刻；

若所述第一时间大于或等于预设的时间阈值，以时间阈值作为所述听写文本中的目标词汇的播放时刻；

其中，所述预设的时间阈值根据所述听写内容的字数、用户的平均书写速度以及所述听写内容的难易程度进行计算获得。

进一步，所述所述目标词汇播放后，进行时间记录，作为第一时间的步骤，包括：

所述目标词汇播放后，获取听写者当前的书写速度，判断当前的书写速度是否小于听写者的平均书写速度，其中，听写的平均书写速度根据听写者平时的书写速度设定；

若是，则重新播放所述目标词汇；

在第二次播放所述目标词汇后，进行时间记录，作为所述第一时间。

进一步，所述执行听写文本录入操作，并获得听写文本的步骤，包括：

获取听写语音信息，将所述听写语音信息进行匹配以及修正，并获得听写文本；

或，

将需要听写的文本所在的书本放置摄像头下，基于文本的图像以及学生手势，获得听写文本；

或，

通过扫描笔进行扫描，并获得听写文本。

进一步，所述基于书本状态以及人形模板，判断听写者是否进入听写状态的步骤，包括：

判断所述书本状态是否为合上以及听写者是否处于所述人形模板的检测范围中；

若所述书本状态为未合上且听写者未处于所述人形模板的检测范围中，则提醒听写者进入所述人形模板的检测范围中，且提醒听写者将所述书本状态改为合上；

若所述书本状态为未合上且听写者处于所述人形模板检测范围中，提醒听写者将所述书本状态改为合上；

若所述书本状态为合上且听写者未处于所述人形模板检测范围中，提醒听写者进入所述人形模板的检测范围中；

直至监测到所述书本状态为合上且听写者处于所述人形模板检测范围中，确认所述听写者进入所述听写状态。

进一步，所述判断所述书本状态是否合上的步骤，包括：

获得书本状态数据库，其中，书本状态数据库包含正负样本，正样本为所述书本状态为合上，负样本为所述书本状态为未合上；

将所述书本状态数据库输入神经网络进行有监督训练，获得书本状态判断模型；

将当前桌面图像作为所述书本状态判断模型的输入，通过所述书本状态判断模型的处理分析，获得所述当前桌面图像的概率值；

若所述概率值大于预设值，则符合所述正样本的特征，判定为所述书本状态为合上；若所述概率值小于预设值，则符合所述负样本的特征，判定为所述书本状态为未合上。

进一步，所述方法还包括：

监听到听写结束指令后，获取听写结果，将所述听写结果与数据库中的听写内容进行对比，获得错误字词；

将所述错误字词发送至终端进行显示。

一种听写优化装置，其特征在于，包括：

获取模块，执行听写文本录入操作，并获得听写文本；

判断模块，基于书本状态以及人形模板，判断听写者是否进入听写状态；

执行模块，若所述听写者进入所述听写状态，则基于预设方法确定所述听写文本中的目标词汇的播放时刻，并基于所述播放时刻执行听写操作。

本发明还提供一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，所述处理器执行所述计算机程序时实现上述任一项方法的步骤。

本发明还提供一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现上述任一项方法的步骤。

相对于现有技术，本发明提供了一种听写优化方法、装置、计算机设备和存储介质，通过执行听写文本录入操作，并获得听写文本；基于书本状态以及人形模板，判断听写者是否进入听写状态；若听写者进入听写状态，则基于预设方法确定听写文本中的目标词汇的播放时刻，并基于播放时刻执行听写操作，通过获得更人性化的播放时刻，学生既不着急写下个词，也不浪费时间等下个词，提高学生听写体验以及学生听写积极性，从而充分利用学习设备中的听写功能，提高听写功能的使用率。

附图说明

图1为本申请一实施例中的听写优化方法的步骤示意图；

图2为本申请一实施例中的听写优化装置的结构框图；

图3为本申请计算机设备的一实施例结构示意框图。

本发明目的的实现、功能特点及优点将结合实施例，参照附图做进一步说明。

具体实施方式

应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明的一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

参照图1，本发明实施例的一种听写优化方法，所述方法包括：

S1、执行听写文本录入操作，并获得听写文本；

S2、基于书本状态以及人形模板，判断听写者是否进入听写状态；

S3、若所述听写者进入所述听写状态，则基于预设方法确定所述听写文本中的目标词汇的播放时刻，并基于所述播放时刻执行听写操作。

具体地，上述步骤S1中获得听写文本可以通过以下方式获取：

方式一、通过语音录入进行获取。获取听写语音信息，将所述听写语音信息进行匹配以及修正，并获得听写文本。具体地，学生将想要进行听写的文本读出来，获取听写语音信息，并将听写语音信息进行匹配以及修正，获得听写文本，并将听写文本存入数据库中。在某些情况下，学生可能会读错音，通过语音录入，能够加深学生的印象，提高学习效果。

方式二、通过手势进行获取。将需要听写的文本所在的书本放置摄像头下，获取文本的图像以及学生手势，并获得听写文本。具体地，将需要听写的文本所在的书本放置摄像头下，通过摄像头获取图像以及学生手势配合获取听写文本，并将听写文本存入数据库中。上述的手势包括圆圈圈定、点指以及画直线下滑线等方式；

方式三、通过扫描笔进行扫描，并获得听写文本。可以通过智能台灯配备的扫描笔进行扫描，获得的听写文本更加快捷以及准确。

在上述步骤S2中，人形模板的获取可以是根据摄像头获取学生标准坐姿后的图像，将图像中人形与环境的边界像素赋值为设定像素颜色，获得人形模板；也可以进一步将人形模板扩大相应的范围，以应对误差。判断所述书本图像中的书本状态目的在于确认学生是否已经将包含有听写内容的书本合上，防止学生在听写过程中看到书本中的听写内容而失去听写的意义。

现有的儿童学习设备会附带有听写功能，例如在台灯上附带有听写功能。智能台灯在提供照明的同时，可以通过附带的听写功能来辅助儿童进行听写上述步骤S3中，通过预设方法确定所述听写文本中的目标词汇的播放时刻，这种方式动态的播放时刻设置更加人性化，使学生既不着急写下个词，也不浪费时间等下个词，就像真正的老师或者家长在给学生听写，提高学生听写体验以及学生听写积极性，从而进一步提高学生的成绩；或者是体验及效果更好，听写功能使用率提高。

S31、所述目标词汇播放后，进行时间记录，作为第一时间；

S32、若所述第一时间小于或等于预设的时间阈值，检测到设定指令，以第一时间作为所述听写文本中的目标词汇的播放时刻；

S33、若所述第一时间大于或等于预设的时间阈值，以时间阈值作为所述听写文本中的目标词汇的播放时刻；

具体地，目标词汇播放后，进行时间记录，作为第一时间；若第一时间小于或等于设置的时间阈值，但是在第一时间内检测到设定指令。设定指令可以为设定的动作，比如摆一个OK的动作，摆一个竖大拇指的动作或者轻轻触摸台灯等，以第一时间作为所述听写文本中的目标词汇的播放时刻，则开始播放下一个字词。此外，设定指令可以为设定语音，例如说一句“下一个”。上述步骤的目的在于在听写者很快写好了的情况下，不用浪费时间等下一个词，通过设定动作直接触发进行下一个字词的听写。若第一时间大于或等于设置的时间阈值，则开始播放下一个字词，上述步骤的目的在于在听写者不会写当前字词的情况下，避免出现无限制地等待学生完成。

上述的时间阈值是动态变化的，比如当前词可以是一个字，两个字，三个字，也可以是成语、古诗或者段落，字数不同对应的时间阈值也不能相同，所以时间阈值可以是根据数据库中存储的听写内容各个字数进行设定。此外，由于每一个学生的对听写内容的平均写字速度会有所不同，因此在设定时间阈值可以将平均书写速度的因素考虑进去。另外，不同听写内容的难易程度是不同的，可以根据人为判断的难易程度的为听写内容设置对应的难度等级，也可以根据大数据收集到的学生的学习情况为听写内容设置对应的难度等级，然后根据等级难度得到一个容错时间。综合上述因素，适应性计算获得的时间阈值。

S311、所述目标词汇播放后，获取听写者当前的书写速度，判断当前的书写速度是否小于听写者的平均书写速度，其中，听写的平均书写速度根据听写者平时的书写速度设定；

S312、若是，则重新播放所述目标词汇；

S313、在第二次播放所述目标词汇后，进行时间记录，作为所述第一时间。

具体地，目标词汇播放后，进行时间记录，作为第一时间；若第一时间小于或等于设置的时间阈值，但是在第一时间内检测到设定动作，比如摆一个OK的动作，摆一个竖大拇指的动作或者轻轻触摸台灯等，以第一时间作为所述听写文本中的目标词汇的播放时刻，则开始播放下一个字词。上述步骤的目的在于在听写者很快写好了的情况下，不用浪费时间等下一个词，通过设定动作直接触发进行下一个字词的听写。若第一时间大于或等于设置的时间阈值，则开始播放下一个字词，上述步骤的目的在于在听写者不会写当前字词的情况下，避免出现无限制地等待学生完成。

进一步，所述基于书本状态以及人形模板，判断听写者是否进入听写状态的步骤S2，包括：

S21、判断所述书本状态是否为合上以及听写者是否处于所述人形模板的检测范围中；

S22、若所述书本状态为未合上且听写者未处于所述人形模板的检测范围中，则提醒听写者进入所述人形模板的检测范围中，且提醒听写者将所述书本状态改为合上；

S23、若所述书本状态为未合上且听写者处于所述人形模板检测范围中，提醒听写者将所述书本状态改为合上；

S24、若所述书本状态为合上且听写者未处于所述人形模板检测范围中，提醒听写者进入所述人形模板的检测范围中；

S25、直至监测到所述书本状态为合上且听写者处于所述人形模板检测范围中，确认所述听写者进入所述听写状态。

在上述步骤中，判断听写者是否处于所述人形模板的检测范围中目的在于确认听写者是否准备好进行听写，防止听写者在没有准备好的情况下进行听写，导致听写结果不理想以及听写效果不佳。判断所述书本图像中的书本状态目的在于确认学生是否已经将包含有听写内容的书本合上，防止学生在听写过程中看到书本中的听写内容而失去听写的意义。当书本图像中的书本状态为未合上且用户未处于所述人形模板的检测范围中，说明未能检测到用户已经就位并且准备好听写了，而且书本处于未合上的状态，学生可能会看到书本上的听写内容，这时提醒用户进入所述人形模板的检测范围中并提醒用户将书本状态改为合上；当书本图像中的书本状态为未合上且用户处于所述人形模板检测范围中，说明检测到用户已经就位并且准备好听写了，但是书本处于未合上的状态，学生可能会看到书本上的听写内容，这时需要提醒用户将书本状态改为合上；当所述书本图像中的书本状态为合上且用户未处于所述人形模板检测范围中，说明检测到用户尚未就位，需要提醒用户进入所述人形模板的检测范围中，准备好听写；当所述书本图像中的书本状态为合上且用户处于所述人形模板检测范围中，说明检测到用户已经就位并且准备好听写了，而且书本处于合上的状态，学生不会看到书本上的听写内容，确认所述听写者进入所述听写状态。

进一步，所述判断所述书本状态是否合上的步骤S21，包括：

S211、获得书本状态数据库，其中，书本状态数据库包含正负样本，正样本为所述书本状态为合上，负样本为所述书本状态为未合上；

S212、将所述书本状态数据库输入神经网络进行有监督训练，获得书本状态判断模型；

S213、将当前桌面图像作为所述书本状态判断模型的输入，通过所述书本状态判断模型的处理分析，获得所述当前桌面图像的概率值；

S214、若所述概率值大于预设值，则符合所述正样本的特征，判定为所述书本状态为合上；若所述概率值小于预设值，则符合所述负样本的特征，判定为所述书本状态为未合上。

上述步骤中，将桌面图像输入至预先训练好的书本状态判断模型中，以快速获取桌面图像的概率值，获取过程简单方便，实现根据桌面图像进行风险识别。根据桌面图像的概率值，确定样本的特征，若概率值大于预设值，则符合正样本的特征，判定为书本状态为合上，若概率值小于预设值，则符合负样本的特征，判定为书本状态为未合上，实现对书本状态的识别。通过上述方式对桌面图像进行书本状态识别，提高识别的准确率。在本实施例中，预设值优选为0.5。

进一步，所述方法还包括：

S4、监听到听写结束指令后，获取听写结果，将所述听写结果与数据库中的听写内容进行对比，获得错误字词；

S5、将所述错误字词发送至终端进行显示。

上述步骤中的终端可以是父母端，教师端，也可以是孩子使用的各种终端，比如智能手表，平板等，便于及时复习。上述步骤中的对错误字词的显示方式可以标红显示，也可以将错别字的其他搭配词组等进行显示。在一个优选的实施方式中，听写结束后，通过摄像头拍摄书写有听写结果的图像，然后从图像中识别出书写结果，根据听写结果与书写内容进行对比，以获得批改结果；若批改结果表明书写结果中存在听写错误的听写内容，从而获取到错误字词。在显示装置中确定出听写错误的听写内容的位置信息，向所述书写页面中的位置信息投射出标注。其中，标注可以为加红加粗或者提示框进行框选的形式。

参照图2，本发明还提供一种听写优化装置，包括：

获取模块1，执行听写文本录入操作，并获得听写文本；

判断模块2，基于书本状态以及人形模板，判断听写者是否进入听写状态；

执行模块3，若所述听写者进入所述听写状态，则基于预设方法确定所述听写文本中的目标词汇的播放时刻，并基于所述播放时刻执行听写操作。

参照图3，本申请实施例中还提供一种计算机设备，该计算机设备的内部结构可以如图3所示。该计算机设备包括通过***总线连接的处理器、存储器、网络接口和显示装置及输入装置。其中，该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机设备的显示装置用于显示交互页面。该计算机设备的输入装置用于接收用户的输入。该计算机设备设计的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质。该非易失性存储介质存储有操作***、计算机程序和数据库。该计算机设备的数据库用于存放原始数据。该计算机程序被处理器执行时以实现一种听写优化方法。

上述处理器执行上述的听写优化方法，执行听写文本录入操作，并获得听写文本；基于书本状态以及人形模板，判断听写者是否进入听写状态；若所述听写者进入所述听写状态，则基于预设方法确定所述听写文本中的目标词汇的播放时刻，并基于所述播放时刻执行听写操作。通过获得更人性化的播放时刻，学生既不着急写下个词，也不浪费时间等下个词，提高学生听写体验以及学生听写积极性，从而充分利用学习设备中的听写功能，提高听写功能的使用率。

所述目标词汇播放后，进行时间记录，作为第一时间；

若是，则重新播放所述目标词汇；

或，

通过扫描笔进行扫描，并获得听写文本。

进一步，所述判断所述书本状态是否合上的步骤，包括：

进一步，所述方法还包括：

将所述错误字词发送至终端进行显示。

本申请还提供一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被所述处理器执行时实现一种听写优化方法，执行听写文本录入操作，并获得听写文本；基于书本状态以及人形模板，判断听写者是否进入听写状态；若所述听写者进入所述听写状态，则基于预设方法确定所述听写文本中的目标词汇的播放时刻，并基于所述播放时刻执行听写操作。通过获得更人性化的播放时刻，学生既不着急写下个词，也不浪费时间等下个词，提高学生听写体验以及学生听写积极性，从而充分利用学习设备中的听写功能，提高听写功能的使用率。

所述目标词汇播放后，进行时间记录，作为第一时间；

若是，则重新播放所述目标词汇；

或，

通过扫描笔进行扫描，并获得听写文本。

进一步，所述判断所述书本状态是否合上的步骤，包括：

进一步，所述方法还包括：

将所述错误字词发送至终端进行显示。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的计算机程序可存储于一非易失性计算机可读取存储介质中，该计算机程序在执行时，可包括如上述各方法的实施例的流程。其中，本申请所提供的和实施例中所使用的对存储器、存储、数据库或其它介质的任何引用，均可包括非易失性和/或易失性存储器。非易失性存储器可以包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限，RAM以多种形式可得，诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双速据率SDRAM(SSRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。

需要说明的是，在本文中，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、装置、物品或者方法不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、装置、物品或者方法所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括该要素的过程、装置、物品或者方法中还存在另外的相同要素。

以上所述仅为本申请的优选实施例，并非因此限制本申请的专利范围，凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换，或直接或间接运用在其他相关的技术领域，均同理包括在本申请的专利保护范围内。

Claims

1.一种听写优化方法，其特征在于，所述方法包括：

执行听写文本录入操作，并获得听写文本；

2.根据权利要求1所述听写优化方法，其特征在于，所述基于预设方法确定所述听写文本中的目标词汇的播放时刻的步骤，包括：

所述目标词汇播放后，进行时间记录，作为第一时间；

3.根据权利要求2所述听写优化方法，其特征在于，所述所述目标词汇播放后，进行时间记录，作为第一时间的步骤，包括：

若是，则重新播放所述目标词汇；

4.根据权利要求1所述听写优化方法，其特征在于，所述执行听写文本录入操作，并获得听写文本的步骤，包括：

或，

通过扫描笔进行扫描，并获得听写文本。

5.根据权利要求1所述听写优化方法，其特征在于，所述基于书本状态以及人形模板，判断听写者是否进入听写状态的步骤，包括：

6.根据权利要求5所述听写优化方法，其特征在于，所述判断所述书本状态是否合上的步骤，包括：

7.根据权利要求1所述听写优化方法，其特征在于，所述方法还包括：

将所述错误字词发送至终端进行显示。

8.一种听写优化装置，其特征在于，包括：

获取模块，执行听写文本录入操作，并获得听写文本；

9.一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，其特征在于，所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述方法的步骤。

10.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现权利要求1至7中任一项所述方法的步骤。