CN111079489A - 一种内容识别方法及电子设备 - Google Patents

一种内容识别方法及电子设备 Download PDF

Info

Publication number
CN111079489A
CN111079489A CN201910453238.2A CN201910453238A CN111079489A CN 111079489 A CN111079489 A CN 111079489A CN 201910453238 A CN201910453238 A CN 201910453238A CN 111079489 A CN111079489 A CN 111079489A
Authority
CN
China
Prior art keywords
identified
target
content
unit
pinyin
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910453238.2A
Other languages
English (en)
Other versions
CN111079489B (zh
Inventor
崔颖
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong Genius Technology Co Ltd
Original Assignee
Guangdong Genius Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong Genius Technology Co Ltd filed Critical Guangdong Genius Technology Co Ltd
Priority to CN201910453238.2A priority Critical patent/CN111079489B/zh
Publication of CN111079489A publication Critical patent/CN111079489A/zh
Application granted granted Critical
Publication of CN111079489B publication Critical patent/CN111079489B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/20Scenes; Scene-specific elements in augmented reality scenes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/24Character recognition characterised by the processing or recognition method
    • G06V30/242Division of the character sequences into groups prior to recognition; Selection of dictionaries
    • G06V30/244Division of the character sequences into groups prior to recognition; Selection of dictionaries using graphical properties, e.g. alphabet type or font
    • G06V30/2445Alphabet recognition, e.g. Latin, Kanji or Katakana
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/24Character recognition characterised by the processing or recognition method
    • G06V30/242Division of the character sequences into groups prior to recognition; Selection of dictionaries
    • G06V30/246Division of the character sequences into groups prior to recognition; Selection of dictionaries using linguistic properties, e.g. specific for English or German language
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09BEDUCATIONAL OR DEMONSTRATION APPLIANCES; APPLIANCES FOR TEACHING, OR COMMUNICATING WITH, THE BLIND, DEAF OR MUTE; MODELS; PLANETARIA; GLOBES; MAPS; DIAGRAMS
    • G09B7/00Electrically-operated teaching apparatus or devices working with questions and answers
    • G09B7/02Electrically-operated teaching apparatus or devices working with questions and answers of the type wherein the student is expected to construct an answer to the question which is presented or wherein the machine gives an answer to the question presented by a student
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computational Linguistics (AREA)
  • Business, Economics & Management (AREA)
  • Educational Administration (AREA)
  • Educational Technology (AREA)
  • Electrically Operated Instructional Devices (AREA)

Abstract

本发明实施例涉及教育技术领域,公开了一种内容识别方法及电子设备,该方法包括:获取答案图像;从答案图像中提取出待识别内容,并对待识别内容进行文本分割,以获得若干个待识别单元,其中,待识别单元为英文或拼音;将上述若干个待识别单元依次输入预设翻译脚本,并统计预设翻译脚本输出中文的次数,其中,预设翻译脚本用于将英文翻译为中文;判断目标比值是否大于或者等于预设比值,其中,目标比值为预设翻译脚本输出中文的次数与待识别单元的总数之间的比值;若是,将待识别内容标记为英文;若否,将待识别内容标记为拼音。实施本发明实施例,能够提高内容识别的准确率。

Description

一种内容识别方法及电子设备
技术领域
本发明涉及教育技术领域,具体涉及一种内容识别方法及电子设备。
背景技术
随着教育信息化的推进,市面上很多电子设备已配置有听写功能,用以辅助学生们进行听写练习与批改。目前,学生们在利用电子设备进行听写批改时,需要将拍摄到的答案图像输入电子设备,使得电子设备对答案图像进行字符识别,以获得学生的听写内容,并输出对听写内容的批改结果。然而,实践中发现,有些字符在不同的学习环境下代表不同的含义,例如,在语文学习环境下a通常表示拼音a,而在英文学习环境下a通常表示英文字母a,现有的技术难以分辨出这些字符当前学习环境下所代表的含义,进而降低了对答案图像进行内容识别的准确率。
发明内容
本发明实施例公开了一种内容识别方法及电子设备,能够提高内容识别的准确率。
本发明实施例第一方面公开一种内容识别方法,所述方法包括:
获取答案图像;
从所述答案图像中提取出待识别内容,并对所述待识别内容进行文本分割,以获得若干个待识别单元;所述待识别单元为英文或拼音;
将所述若干个待识别单元依次输入预设翻译脚本,并统计所述预设翻译脚本输出中文的次数;其中,所述预设翻译脚本用于将英文翻译为中文;
判断目标比值是否大于或者等于预设比值;其中,所述目标比值为所述预设翻译脚本输出中文的次数与所述待识别单元的总数之间的比值;
若是,将所述待识别内容标记为英文;若否,将所述待识别内容标记为拼音。
作为一种可选的实施方式,在本发明实施例第一方面中,所述将所述若干个待识别单元依次输入预设翻译脚本,并统计所述预设翻译脚本输出中文的次数,包括:
判断所述若干个待识别单元中是否存在包含声调符号的目标单元;
若否,将所述若干个待识别单元依次输入预设翻译脚本;若是,将所述若干个待识别单元中除去所述目标单元的其他单元依次输入预设翻译脚本;
统计所述预设翻译脚本输出中文的次数。
作为一种可选的实施方式,在本发明实施例第一方面中,所述将所述待识别内容标记为拼音之后,所述方法还包括:
获取所述待识别内容对应的正确答案;
根据所述正确答案,对所述待识别内容进行批改;
若目标声调符号有误,确定所述目标声调符号对应的拼音,并获得所述拼音对应的目标文字;其中,所述目标声调符号为所述待识别内容包含的声调符号;
将所述目标文字标记为注音错误类,并输出所述目标文字的正确注音信息。
作为一种可选的实施方式,在本发明实施例第一方面中,所述方法还包括:
在进入解锁页面时,根据被标记为注音错误类的文字,生成待补全声调的拼音图形;
在所述解锁页面显示所述被标记为注音错误类的文字以及所述待补全声调的拼音图形;
检测用户输入的声调符号是否位于所述拼音图形中正确字符的上方,以及所述用户输入的声调符号是否正确;
若所述用户输入的声调符号位于所述拼音图形中正确字符的上方,且所述用户输入的声调符号正确,进行解锁操作。
作为一种可选的实施方式,在本发明实施例第一方面中,所述方法还包括:
根据被标记的所述待识别内容,确定目标学习内容;
开启与所述目标学习内容关联的应用程序,并关闭与所述目标学习内容无关联的应用程序;
在开启的应用程序中显示所述目标学习内容。
本发明实施例第二方面公开一种电子设备,所述电子设备包括:
第一获取单元,用于获取答案图像;
文本分割单元,用于从所述答案图像中提取出待识别内容,并对所述待识别内容进行文本分割,以获得若干个待识别单元;所述待识别单元为英文或拼音;
统计单元,用于将所述若干个待识别单元依次输入预设翻译脚本,并统计所述预设翻译脚本输出中文的次数;其中,所述预设翻译脚本用于将英文翻译为中文;
判断单元,用于判断目标比值是否大于或者等于预设比值;其中,所述目标比值为所述预设翻译脚本输出中文的次数与所述待识别单元的总数之间的比值;
第一标记单元,用于在所述判断单元判定出所述目标比值大于或者等于所述预设比值时,将所述待识别内容标记为英文;以及,在所述判断单元判定出所述目标比值小于所述预设比值时,将所述待识别内容标记为拼音。
作为一种可选的实施方式,在本发明实施例第二方面中,所述统计单元,包括:
判断子单元,用于判断所述若干个待识别单元中是否存在包含声调符号的目标单元;
输入子单元,用于在所述判断子单元判定出所述若干个待识别单元中不存在所述目标单元时,将所述若干个待识别单元依次输入预设翻译脚本;以及,在所述判断子单元判定出所述若干个待识别单元中存在所述目标单元时,将所述若干个待识别单元中除去所述目标单元的其他单元依次输入预设翻译脚本;
统计子单元,用于统计所述预设翻译脚本输出中文的次数。
作为一种可选的实施方式,在本发明实施例第二方面中,所述电子设备还包括:
第二获取单元,用于在所述第一标记单元将所述待识别内容标记为拼音之后,获取所述待识别内容对应的正确答案;
批改单元,用于根据所述正确答案,对所述待识别内容进行批改;
第三获取单元,用于在目标声调符号有误时,确定所述目标声调符号对应的拼音,并获得所述拼音对应的目标文字;其中,所述目标声调符号为所述待识别内容包含的声调符号;
第二标记单元,用于将所述目标文字标记为注音错误类;
输出单元,用于输出所述目标文字的正确注音信息。
作为一种可选的实施方式,在本发明实施例第二方面中,所述电子设备还包括:
图形生成单元,用于在进入解锁页面时,根据被标记为注音错误类的文字,生成待补全声调的拼音图形;
第一显示单元,用于在所述解锁页面显示所述被标记为注音错误类的文字以及所述待补全声调的拼音图形;
检测单元,用于检测用户输入的声调符号是否位于所述拼音图形中正确字符的上方,以及所述用户输入的声调符号是否正确;
解锁单元,用于在所述用户输入的声调符号位于所述拼音图形中正确字符的上方,且所述用户输入的声调符号正确时,进行解锁操作。
作为一种可选的实施方式,在本发明实施例第二方面中,所述电子设备还包括:
确定单元,用于根据被标记的所述待识别内容,确定目标学习内容;
控制单元,用于开启与所述目标学习内容关联的应用程序,并关闭与所述目标学习内容无关联的应用程序;
第二显示单元,用于在开启的应用程序中显示所述目标学习内容。
本发明实施例第三方面公开一种电子设备,包括:
存储有可执行程序代码的存储器;
与所述存储器耦合的处理器;
所述处理器调用所述存储器中存储的所述可执行程序代码,执行本发明实施例第一方面公开的一种内容识别方法。
本发明实施例第四方面公开一种计算机可读存储介质,其存储计算机程序,其中,所述计算机程序使得计算机执行本发明实施例第一方面公开的一种内容识别方法。
本发明实施例第五方面公开一种计算机程序产品,当所述计算机程序产品在计算机上运行时,使得所述计算机执行第一方面的任意一种方法的部分或全部步骤。
本发明实施例第六方面公开一种应用发布平台,所述应用发布平台用于发布计算机程序产品,其中,当所述计算机程序产品在计算机上运行时,使得所述计算机执行第一方面的任意一种方法的部分或全部步骤。
与现有技术相比,本发明实施例具有以下有益效果:
本发明实施例中,通过从答案图像中提取出待识别内容,并对待识别内容进行文本分割,获得若干个待识别单元,其中,待识别单元为英文或者拼音;之后,将若干个待识别单元输入预设翻译脚本,从而基于预设翻译脚本用于将英文翻译为中文的特性,通过统计预设翻译脚本输出中文的次数,以获得被识别为英文的待识别单元的个数;并且,当被识别为英文的待识别单元在上述若干个待识别单元中所占比值大于或者等于预设比值时,将待识别内容标记为英文,否则将待识别内容标记为拼音,能够解决单个字符识别的局限性,从而分辨出待识别内容在当前学习环境下所代表的含义,提高内容识别的准确率,进而提升后续对答案内容进行批改的准确率,改善用户的学习体验。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例公开的一种内容识别方法的流程示意图;
图2是本发明实施例公开的一种答案检测的场景示意图;
图3是本发明实施例公开的另一种内容识别方法的流程示意图;
图4是本发明实施例公开的一种解锁页面的示意图;
图5是本发明实施例公开的一种电子设备的结构示意图;
图6是本发明实施例公开的另一种电子设备的结构示意图;
图7是本发明实施例公开的另一种电子设备的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书中的术语“第一”、“第二”、“第三”“第四”等是用于区别不同的对象,而不是用于描述特定顺序。本发明实施例的术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、***、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
本发明实施例公开了一种内容识别方法及电子设备,能够提高内容识别的准确率。以下结合附图进行详细描述。
实施例一
请参阅图1,图1是本发明实施例公开的一种内容识别方法的流程示意图。如图1所示,该内容识别方法可以包括以下步骤。
101、电子设备获取答案图像。
本发明实施例公开的内容识别方法适用于供用户使用的学习平板、学习手机、学习机、家教机、点读机等电子设备中,具体地,还适用于上述电子设备内的Web应用、APP或者专用软件。本发明实施例中用于获取答案图像的拍摄装置可设置于电子设备配有显示屏的一面。
请参阅图2,图2是本发明实施例公开的一种答案检测的场景示意图。在图2中,电子设备与水平面(比如桌面)呈一定角度摆放,电子设备设置有拍摄装置以及反光装置,反光装置用于改变拍摄装置的光路,进而使得拍摄装置拍摄到摆放在水平面上的纸质页面(比如课文、作业本等)的答案图像,以检测用户在纸质页面上书写的答案内容。
102、电子设备从答案图像中提取出待识别内容,并对待识别内容进行文本分割,以获得若干个待识别单元;其中,待识别单元为英文或拼音。
本发明实施例中,电子设备可以通过OCR(Optical Character Recognition,光学字符识别)技术将答案图像转为文本信息,以获得待识别内容。电子设备以空格符号以及预设标点符号(比如逗号、句号、省略号等)为分割符,将待识别内容分割为若干个待识别单元,其中,待识别单元可以为单个字母或者词语。举例来说,若待识别内容为“Nice to meetyou,Andy”,则电子设备对该待识别内容进行文本分割后获得5个待识别单元,包括:“Nice”、“to”、“meet”、“you”以及“Andy”。
103、电子设备将上述若干个待识别单元依次输入预设翻译脚本,并统计预设翻译脚本输出中文的次数;其中,预设翻译脚本用于将英文翻译为中文。
本发明实施例中,可以理解,由于预设翻译脚本用于将英文译为中文,若电子设备将任一待识别单元输入预设翻译脚本之后,预设翻译脚本输出中文,则该待识别单元可被识别为英文。比如,假设电子设备将5个待识别单元“Nice”、“to”、“meet”、“you”以及“Andy”依次输入预设翻译脚本,预设翻译脚本分别输出翻译结果:“美好的”、“到”、“遇见”、“你”以及“安迪”,可见,预设翻译脚本输出5次中文,故可知5个待识别单元均为英文。
104、电子设备判断目标比值是否大于或者等于预设比值,若是,执行步骤105;若否,执行步骤106。
本发明实施例中,目标比值为预设翻译脚本输出中文的次数与待识别单元的总数之间的比值。举例来说,假设预设比值为0.6,若电子设备将5个待识别单元“Chinese”、“character”、“shou”、“means”以及“longevity”依次输入预设翻译脚本,则预设翻译脚本可输出“Chinese(中国的)”、“character(字符)”、“means(意思是)”以及“longevity(长寿)”的中文,而无法翻译拼音“shou(寿)”,故统计得到预设翻译脚本输出4次中文。此时,目标比值=预设翻译脚本输出中文的次数÷待识别单元的总数=4÷5=0.8。由于目标比值0.8大于预设比值0.6,则电子设备将待识别内容标记为英文。
105、电子设备将待识别内容标记为英文。
106、电子设备将待识别内容标记为拼音。
作为一种可选的实施方式,本方案还可以包括:
电子设备将被标记的待识别内容加入与待识别内容的标记类型对应的学习任务列表中,以在进入标记类型对应的学习模式时依次执行学习任务列表中的学习任务;其中,学习任务列表用于按照添加顺序存放电子设备待处理的学习任务。
可见,电子设备通过将被标记为英文的待识别内容加入英文学科的学习任务列表,或者,将被标记为拼音的待识别内容加入语文学科的学习任务列表,能够根据待识别内容的标记类型对待识别内容进行合理的学科分类,有利于辅助用户进行针对性学习。
进一步地,作为一种可选的实施方式,电子设备还可以为智能手表、智能手环等可穿戴设备,并且,这些可穿戴设备一般可配置有拍摄装置,用以拍摄图像。因此,电子设备将被标记的待识别内容加入与待识别内容的标记类型对应的学习任务列表之前,本方案还可以包括:
电子设备判断当前设备端是否属于用户预设的学习设备端;
若是,执行上述将被标记的待识别内容加入与待识别内容的标记类型对应的学习任务列表的步骤;
若否,电子设备将待识别内容上传至云端服务器,以使得云端服务器将被标记的待识别内容发送至与电子设备绑定的学习设备端。
可以理解,在一些特殊的学习场景,学生们不一定会随身携带专用的学习设备(比如家教机、点读机等),此时,学生们通过利用日常佩戴的可穿戴设备,或者不属于预设的学习设备端的移动设备(比如个人手机),同样能够拍摄待识别的答案图像,使得上述可穿戴设备或者移动设备将从答案图像中获取的待识别内容经云端服务器转发至绑定的学习设备端,如此一来,学生们后续便可以在指定的学习设备上获取到更多与待识别内容相关的学习资源。可见,实施可选的实施方式,还能够不局限于设备的类型,拓宽用户的学习场景。
可见,实施图1所描述的方法,通过从答案图像中提取出待识别内容,并对待识别内容进行文本分割,获得若干个待识别单元,其中,待识别单元为英文或者拼音;之后,将若干个待识别单元输入预设翻译脚本,从而基于预设翻译脚本用于将英文翻译为中文的特性,通过统计预设翻译脚本输出中文的次数,以获得被识别为英文的待识别单元的个数;并且,当被识别为英文的待识别单元在上述若干个待识别单元中所占比值大于或者等于预设比值时,将待识别内容标记为英文,否则将待识别内容标记为拼音,能够解决单个字符识别的局限性,从而分辨出待识别内容在当前学习环境下所代表的含义,提高内容识别的准确率,进而提升后续对答案内容进行批改的准确率,改善用户的学习体验。
实施例二
请参阅图3,图3是本发明实施例公开的另一种内容识别方法的流程示意图。如图3所示,该内容识别方法可以包括以下步骤。
301、电子设备获取答案图像。
302、电子设备从答案图像中提取出待识别内容,并对待识别内容进行文本分割,以获得若干个待识别单元;其中,待识别单元为英文或拼音。
303、电子设备判断上述若干个待识别单元中是否存在包含声调符号的目标单元,若是,执行步骤304;若否,执行步骤305。
本发明实施例中,声调符号通常标注在拼音字母的上方,用以表示拼音字母对应的声调,例如ā、ó、ě、ù等。以待识别单元“who”为例,由于“who”中不包含声调符号,故该待识别单元不是目标单元;以待识别单元“shuǐ”为例,由于“shuǐ”中包含声调符号“ǐ”,故该待识别单元为目标单元。
304、电子设备将上述若干个待识别单元中除去目标单元的其他单元依次输入预设翻译脚本,并统计预设翻译脚本输出中文的次数,执行步骤306。
305、电子设备将上述若干个待识别单元依次输入预设翻译脚本,并统计预设翻译脚本输出中文的次数,执行步骤306。
可见,实施上述步骤303、步骤304以及步骤305,基于拼音标有声调、而英文字母或者英文单词不标声调的特点,通过从上述若干个待识别单元中去除包含有声调符号的目标单元,再将剩余的待识别单元输入预设翻译脚本,能够筛选出被识别为拼音的单元,简化了识别步骤,进而起到快速区分拼音与英文的作用。
306、电子设备判断目标比值是否大于或者等于预设比值,若是,执行步骤307;若否,执行步骤308;其中,目标比值为预设翻译脚本输出中文的次数与待识别单元的总数之间的比值。
307、电子设备将待识别内容标记为英文。
308、电子设备将待识别内容标记为拼音,并执行步骤309~步骤312。
309、电子设备获取待识别内容对应的正确答案。
310、电子设备根据正确答案,对待识别内容进行批改。
311、若目标声调符号有误,电子设备确定目标声调符号对应的拼音,并获得该拼音对应的目标文字;其中,目标声调符号为待识别内容包含的声调符号。
312、电子设备将目标文字标记为注音错误类,并输出目标文字的正确注音信息。
本发明实施例中,举例来说,已知词语“水果”的正确注音方式为“shuǐguǒ”,若电子设备检测到待识别内容中的拼音为“shǔi guǒ”,则判定出声调符号有误。此时,电子设备可确定出错拼音为“shǔi”,且该拼音对应的目标文字为“水”,因此电子设备将“水”字标记为注音错误类,并输出“水”字的正确注音信息“shuǐ”。可见,实施上述步骤309~步骤312,在确定待识别内容在当前学习环境下的含义后(比如英文或者拼音),能够适应性地调整对待识别内容的批改重点(比如,英文环境下,注重单词拼写与语法等;中文环境下,注重文字书写、拼音拼写和拼音声调等),提升批改的准确性;此外,在声调符号出错时,通过确定出错的声调符号对应的目标文字,并输出目标文字的正确注音信息,能够针对性地纠正用户的注音错误,并且还能够将目标文字标记为注音错误类,用以提供后续的复习内容,以及考察用户的学习效果。
作为一种可选的实施方式,本方案还可以包括以下步骤:
电子设备在进入解锁页面时,根据被标记为注音错误类的文字,生成待补全声调的拼音图形;
电子设备在解锁页面显示被标记为注音错误类的文字以及待补全声调的拼音图形;
电子设备检测用户输入的声调符号是否位于拼音图形中正确字符的上方,以及用户输入的声调符号是否正确;
若用户输入的声调符号位于拼音图形中正确字符的上方,且用户输入的声调符号正确,电子设备进行解锁操作。
请参与图4,图4是本发明实施例公开的一种解锁页面的示意图。在图4中,以目标文字“悄”为例,解锁页面显示有包含目标文字401的提示词语(即“悄然”),以及内容为“补充声调以解锁”的解锁提示语;其中,在非目标文字“然”上方标注有声调“rán”,而在目标文字401上方显示有待补充声调的拼音图形402。可见,通过检测用户在电子设备的触摸屏上的滑动轨迹,可以获得用户输入的声调符号403。此时,虽然用户输入的声调符号403位于拼音图形402中正确字符“a”的上方,但用户输入的声调符号(即阳平)不是正确的声调符号(即上声),此时电子设备不执行解锁操作。
可见,实施上述可选的实施方式,在进入解锁页面时,基于被标记为注音错误类的文字生成待补全声调的拼音图形,通过检测用户针对拼音图形输入的声调符号,能够随机检验用户的声调纠正效果,还能够提升注音练习的灵活性和趣味性。
作为另一种可选的实施方式,本方案还可以包括以下步骤:
电子设备在进入解锁页面时,根据被标记为注音错误类的文字,生成测试内容;其中,测试内容包括标记为注音错误类的文字,且测试内容可以为单个文字、词语、成语或者短句等;
电子设备在解锁页面显示测试内容以及用于指示用户朗读上述测试内容的解锁提示信息;
电子设备检测用户的语音信息,并根据语音信息判断用户是否发音正确;
若正确,电子设备进行解锁操作;若不正确,电子设备输出测试内容对应的正确朗读语音,并在重新检测到用户的正确发音之后进行解锁操作。可见,还能够通过语音交互的方式辅助用户巩固对汉字声调的学习,同样增添了学习的趣味性。
进一步地,作为一种可选的实施方式,本方案还可以包括:
电子设备根据被标记的待识别内容,确定目标学习内容;
电子设备开启与目标学习内容关联的应用程序,并关闭与目标学习内容无关联的应用程序;
电子设备在开启的应用程序中显示目标学习内容。
可以理解,通过分析待识别内容的学科类型、知识点、易错点等信息,可以确定供用户参考与学习的目标学习内容,比如,若被标记为英文的待识别内容为“Agood medicinetastes bitter(良药苦口)”,电子设备可确定出与英文学科以及英语谚语相关的目标学习内容。因此,电子设备将开启与英文学科相关的应用程序,关闭与英文学科无关的应用程序(比如其他学科的应用程序、非学习类游戏APP、社交APP等),并且在已开启的应用程序中推送英文短句或英语谚语等。可见,实施上述可选的实施方式,通过确定与待识别内容相匹配的目标学习内容,开启目标学习内容相关的应用程序,并且关闭目标学习内容无关的应用程序,能够提供符合用户需求的学习资源,还能够防止用户被与学习内容无关的应用程序分散注意力,提高用户的学习效率。
可见,实施图3所描述的方法,能够解决单个字符识别的局限性,从而分辨出待识别内容在当前学习环境下所代表的含义,提高内容识别的准确率,以及,适应性地调整对待识别内容的批改重点,提升批改的准确率,改善用户的学习体验;此外,能够筛选出被识别为拼音的单元,简化了识别步骤,进而起到快速区分拼音与英文的作用;进一步地,能够针对性地纠正用户的注音错误,将目标文字标记为注音错误类,用以提供后续的复习内容,以及考察用户的学习效果,并且,通过随机检验用户的声调纠正效果,还能够提升注音练习的灵活性和趣味性;再进一步地,还能够提供符合用户需求的学习资源,还能够防止用户被与学习内容无关的应用程序分散注意力,提高用户的学习效率。
实施例三
请参阅图5,图5是本发明实施例公开的一种电子设备的结构示意图。如图5所示,该电子设备可以包括:
第一获取单元501,用于获取答案图像;
文本分割单元502,用于从答案图像中提取出待识别内容,并对待识别内容进行文本分割,以获得若干个待识别单元;待识别单元为英文或拼音;
统计单元503,用于将上述若干个待识别单元依次输入预设翻译脚本,并统计预设翻译脚本输出中文的次数;其中,预设翻译脚本用于将英文翻译为中文;
判断单元504,用于判断目标比值是否大于或者等于预设比值;其中,目标比值为预设翻译脚本输出中文的次数与待识别单元的总数之间的比值;
第一标记单元505,用于在判断单元504判定出目标比值大于或者等于预设比值时,将待识别内容标记为英文;以及,在判断单元504判定出目标比值小于预设比值时,将待识别内容标记为拼音。
作为一种可选的实施方式,该电子设备还可以包括:
添加单元,用于将被标记的待识别内容加入与待识别内容的标记类型对应的学习任务列表中,以在进入标记类型对应的学习模式时依次执行学习任务列表中的学习任务;其中,学习任务列表用于按照添加顺序存放电子设备待处理的学习任务。
可见,通过将被标记为英文的待识别内容加入英文学科的学习任务列表,或者,将被标记为拼音的待识别内容加入语文学科的学习任务列表,能够根据待识别内容的标记类型对待识别内容进行合理的学科分类,有利于辅助用户进行针对性学习。
进一步地,作为一种可选的实施方式,电子设备还可以为智能手表、智能手环等可穿戴设备,并且,这些可穿戴设备一般可配置有拍摄装置,用以拍摄图像。因此,该电子设备还可以包括上传单元,其中:
判断单元504,还用于在添加单元将被标记的待识别内容加入与待识别内容的标记类型对应的学习任务列表之前,判断当前设备端是否属于用户预设的学习设备端;若是,触发添加单元执行将被标记的待识别内容加入与待识别内容的标记类型对应的学习任务列表;
上传单元,用于在判断单元504判定出当前设备端不属于用户预设的学习设备端时,将待识别内容上传至云端服务器,以使得云端服务器将被标记的待识别内容发送至与电子设备绑定的学习设备端。
可以理解,在一些特殊的学习场景,学生们不一定会随身携带专用的学习设备(比如家教机、点读机等),此时,学生们通过利用日常佩戴的可穿戴设备,或者不属于预设的学习设备端的移动设备(比如个人手机),同样能够拍摄待识别的答案图像,使得上述可穿戴设备或者移动设备将从答案图像中获取的待识别内容经云端服务器转发至绑定的学习设备端,如此一来,学生们后续便可以在指定的学习设备上获取到更多与待识别内容相关的学习资源。可见,实施可选的实施方式,还能够不局限于设备的类型,拓宽用户的学习场景。
可见,实施图5所描述的电子设备,通过从答案图像中提取出待识别内容,并对待识别内容进行文本分割,获得若干个待识别单元,其中,待识别单元为英文或者拼音;之后,将若干个待识别单元输入预设翻译脚本,从而基于预设翻译脚本用于将英文翻译为中文的特性,通过统计预设翻译脚本输出中文的次数,以获得被识别为英文的待识别单元的个数;并且,当被识别为英文的待识别单元在上述若干个待识别单元中所占比值大于或者等于预设比值时,将待识别内容标记为英文,否则将待识别内容标记为拼音,能够解决单个字符识别的局限性,从而分辨出待识别内容在当前学习环境下所代表的含义,提高内容识别的准确率,进而提升后续对答案内容进行批改的准确率,改善用户的学习体验。
实施例四
请参阅图6,图6是本发明实施例公开的另一种电子设备的结构示意图。其中,图6所示的电子设备是由图5所示的电子设备进行优化得到的。与图5所示的电子设备相比较,图6所示的电子设备还可以包括第二获取单元506、批改单元507、第三获取单元508、第二标记单元509以及输出单元510,其中:
统计单元503,包括:
判断子单元5031,用于判断若干个待识别单元中是否存在包含声调符号的目标单元;
输入子单元5032,用于在判断子单元5031判定出若干个待识别单元中不存在目标单元时,将若干个待识别单元依次输入预设翻译脚本;以及,在判断子单元5031判定出若干个待识别单元中存在目标单元时,将若干个待识别单元中除去目标单元的其他单元依次输入预设翻译脚本;
统计子单元5033,用于统计预设翻译脚本输出中文的次数。
第二获取单元506,用于在第一标记单元505将待识别内容标记为拼音之后,获取待识别内容对应的正确答案;
批改单元507,用于根据正确答案,对待识别内容进行批改;
第三获取单元508,用于在目标声调符号有误时,确定目标声调符号对应的拼音,并获得拼音对应的目标文字;其中,目标声调符号为待识别内容包含的声调符号;
第二标记单元509,用于将目标文字标记为注音错误类;
输出单元510,用于输出目标文字的正确注音信息。
作为一种可选的实施方式,该电子设备还可以包括:
图形生成单元,用于在进入解锁页面时,根据被标记为注音错误类的文字,生成待补全声调的拼音图形;
第一显示单元,用于在解锁页面显示被标记为注音错误类的文字以及待补全声调的拼音图形;
第一检测单元,用于检测用户输入的声调符号是否位于拼音图形中正确字符的上方,以及用户输入的声调符号是否正确;
解锁单元,用于在用户输入的声调符号位于拼音图形中正确字符的上方,且用户输入的声调符号正确时,进行解锁操作。
进一步地,该电子设备还可以包括:
确定单元,用于根据被标记的待识别内容,确定目标学习内容;
控制单元,用于开启与目标学习内容关联的应用程序,并关闭与目标学习内容无关联的应用程序;
第二显示单元,用于在开启的应用程序中显示目标学习内容。
此外,作为一种可选的实施方式,该电子设备还可以包括:
内容生成单元,用于在进入解锁页面时,根据被标记为注音错误类的文字,生成测试内容;其中,测试内容包括标记为注音错误类的文字,且测试内容可以为单个文字、词语、成语或者短句等;
第三显示单元,用于在解锁页面显示测试内容以及用于指示用户朗读上述测试内容的解锁提示信息;
第二检测单元,用于检测用户的语音信息,并根据语音信息判断用户是否发音正确;
解锁单元,还用于在第二检测单元判定出用户发音正确时,进行解锁操作;以及,在第二检测单元判定出用户发音错误时,输出测试内容对应的正确朗读语音,并在重新检测到用户的正确发音之后进行解锁操作。可见,还能够通过语音交互的方式辅助用户巩固对汉字声调的学习,同样增添了学习的趣味性。
可见,实施图6所描述的电子设备,能够解决单个字符识别的局限性,从而分辨出待识别内容在当前学习环境下所代表的含义,提高内容识别的准确率,以及,适应性地调整对待识别内容的批改重点,提升批改的准确率,改善用户的学习体验;此外,能够筛选出被识别为拼音的单元,简化了识别步骤,进而起到快速区分拼音与英文的作用;进一步地,能够针对性地纠正用户的注音错误,将目标文字标记为注音错误类,用以提供后续的复习内容,以及考察用户的学习效果,并且,通过随机检验用户的声调纠正效果,还能够提升注音练习的灵活性和趣味性;再进一步地,还能够提供符合用户需求的学习资源,还能够防止用户被与学习内容无关的应用程序分散注意力,提高用户的学习效率。
实施例五
请参阅图7,图7是本发明实施例公开的另一种电子设备的结构示意图。如图7所示,该电子设备可以包括:
存储有可执行程序代码的存储器701;
与存储器701耦合的处理器702;
其中,处理器702调用存储器701中存储的可执行程序代码,执行图1或者图3所示的一种内容识别方法。
本发明实施例公开一种计算机可读存储介质,其存储计算机程序,其中,该计算机程序使得计算机执行图1或者图3所示的一种内容识别方法。
本发明实施例还公开一种计算机程序产品,其中,当计算机程序产品在计算机上运行时,使得计算机执行如以上各方法实施例中的方法的部分或全部步骤。
本发明实施例还公开一种应用发布平台,该应用发布平台用于发布计算机程序产品,其中,当上述计算机程序产品在计算机上运行时,使得计算机执行如以上各方法实施例中的方法的部分或全部步骤。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质包括只读存储器(Read-Only Memory,ROM)、随机存储器(Random Access Memory,RAM)、可编程只读存储器(Programmable Read-only Memory,PROM)、可擦除可编程只读存储器(Erasable Programmable Read Only Memory,EPROM)、一次可编程只读存储器(One-time Programmable Read-Only Memory,OTPROM)、电子抹除式可复写只读存储器(Electrically-Erasable Programmable Read-Only Memory,EEPROM)、只读光盘(CompactDisc Read-Only Memory,CD-ROM)或其他光盘存储器、磁盘存储器、磁带存储器、或者能够用于携带或存储数据的计算机可读的任何其他介质。
以上对本发明实施例公开的一种内容识别方法及电子设备进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (10)

1.一种内容识别方法,其特征在于,所述方法包括:
获取答案图像;
从所述答案图像中提取出待识别内容,并对所述待识别内容进行文本分割,以获得若干个待识别单元;所述待识别单元为英文或拼音;
将所述若干个待识别单元依次输入预设翻译脚本,并统计所述预设翻译脚本输出中文的次数;其中,所述预设翻译脚本用于将英文翻译为中文;
判断目标比值是否大于或者等于预设比值;其中,所述目标比值为所述预设翻译脚本输出中文的次数与所述待识别单元的总数之间的比值;
若是,将所述待识别内容标记为英文;若否,将所述待识别内容标记为拼音。
2.根据权利要求1所述的方法,其特征在于,所述将所述若干个待识别单元依次输入预设翻译脚本,并统计所述预设翻译脚本输出中文的次数,包括:
判断所述若干个待识别单元中是否存在包含声调符号的目标单元;
若否,将所述若干个待识别单元依次输入预设翻译脚本;若是,将所述若干个待识别单元中除去所述目标单元的其他单元依次输入预设翻译脚本;
统计所述预设翻译脚本输出中文的次数。
3.根据权利要求2所述的方法,其特征在于,所述将所述待识别内容标记为拼音之后,所述方法还包括:
获取所述待识别内容对应的正确答案;
根据所述正确答案,对所述待识别内容进行批改;
若目标声调符号有误,确定所述目标声调符号对应的拼音,并获得所述拼音对应的目标文字;其中,所述目标声调符号为所述待识别内容包含的声调符号;
将所述目标文字标记为注音错误类,并输出所述目标文字的正确注音信息。
4.根据权利要求3所述的方法,其特征在于,所述方法还包括:
在进入解锁页面时,根据被标记为注音错误类的文字,生成待补全声调的拼音图形;
在所述解锁页面显示所述被标记为注音错误类的文字以及所述待补全声调的拼音图形;
检测用户输入的声调符号是否位于所述拼音图形中正确字符的上方,以及所述用户输入的声调符号是否正确;
若所述用户输入的声调符号位于所述拼音图形中正确字符的上方,且所述用户输入的声调符号正确,进行解锁操作。
5.根据权利要求1~4任一项所述的方法,其特征在于,所述方法还包括:
根据被标记的所述待识别内容,确定目标学习内容;
开启与所述目标学习内容关联的应用程序,并关闭与所述目标学习内容无关联的应用程序;
在开启的应用程序中显示所述目标学习内容。
6.一种电子设备,其特征在于,所述电子设备包括:
第一获取单元,用于获取答案图像;
文本分割单元,用于从所述答案图像中提取出待识别内容,并对所述待识别内容进行文本分割,以获得若干个待识别单元;所述待识别单元为英文或拼音;
统计单元,用于将所述若干个待识别单元依次输入预设翻译脚本,并统计所述预设翻译脚本输出中文的次数;其中,所述预设翻译脚本用于将英文翻译为中文;
判断单元,用于判断目标比值是否大于或者等于预设比值;其中,所述目标比值为所述预设翻译脚本输出中文的次数与所述待识别单元的总数之间的比值;
第一标记单元,用于在所述判断单元判定出所述目标比值大于或者等于所述预设比值时,将所述待识别内容标记为英文;以及,在所述判断单元判定出所述目标比值小于所述预设比值时,将所述待识别内容标记为拼音。
7.根据权利要求6所述的电子设备,其特征在于,所述统计单元,包括:
判断子单元,用于判断所述若干个待识别单元中是否存在包含声调符号的目标单元;
输入子单元,用于在所述判断子单元判定出所述若干个待识别单元中不存在所述目标单元时,将所述若干个待识别单元依次输入预设翻译脚本;以及,在所述判断子单元判定出所述若干个待识别单元中存在所述目标单元时,将所述若干个待识别单元中除去所述目标单元的其他单元依次输入预设翻译脚本;
统计子单元,用于统计所述预设翻译脚本输出中文的次数。
8.根据权利要求7所述的电子设备,其特征在于,所述电子设备还包括:
第二获取单元,用于在所述第一标记单元将所述待识别内容标记为拼音之后,获取所述待识别内容对应的正确答案;
批改单元,用于根据所述正确答案,对所述待识别内容进行批改;
第三获取单元,用于在目标声调符号有误时,确定所述目标声调符号对应的拼音,并获得所述拼音对应的目标文字;其中,所述目标声调符号为所述待识别内容包含的声调符号;
第二标记单元,用于将所述目标文字标记为注音错误类;
输出单元,用于输出所述目标文字的正确注音信息。
9.根据权利要求8所述的电子设备,其特征在于,所述电子设备还包括:
图形生成单元,用于在进入解锁页面时,根据被标记为注音错误类的文字,生成待补全声调的拼音图形;
第一显示单元,用于在所述解锁页面显示所述被标记为注音错误类的文字以及所述待补全声调的拼音图形;
检测单元,用于检测用户输入的声调符号是否位于所述拼音图形中正确字符的上方,以及所述用户输入的声调符号是否正确;
解锁单元,用于在所述用户输入的声调符号位于所述拼音图形中正确字符的上方,且所述用户输入的声调符号正确时,进行解锁操作。
10.根据权利要求6~9任一项所述的电子设备,其特征在于,所述电子设备还包括:
确定单元,用于根据被标记的所述待识别内容,确定目标学习内容;
控制单元,用于开启与所述目标学习内容关联的应用程序,并关闭与所述目标学习内容无关联的应用程序;
第二显示单元,用于在开启的应用程序中显示所述目标学习内容。
CN201910453238.2A 2019-05-28 2019-05-28 一种内容识别方法及电子设备 Active CN111079489B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910453238.2A CN111079489B (zh) 2019-05-28 2019-05-28 一种内容识别方法及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910453238.2A CN111079489B (zh) 2019-05-28 2019-05-28 一种内容识别方法及电子设备

Publications (2)

Publication Number Publication Date
CN111079489A true CN111079489A (zh) 2020-04-28
CN111079489B CN111079489B (zh) 2023-04-28

Family

ID=70310345

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910453238.2A Active CN111079489B (zh) 2019-05-28 2019-05-28 一种内容识别方法及电子设备

Country Status (1)

Country Link
CN (1) CN111079489B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112085090A (zh) * 2020-09-07 2020-12-15 百度在线网络技术(北京)有限公司 翻译方法、装置以及电子设备
CN112949381A (zh) * 2021-01-20 2021-06-11 涂益浪 一种图像内容识别方法及***

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050010391A1 (en) * 2003-07-10 2005-01-13 International Business Machines Corporation Chinese character / Pin Yin / English translator
CN101615180A (zh) * 2008-06-27 2009-12-30 国际商业机器公司 汉语拼音识别方法和装置
CN103092838A (zh) * 2011-10-28 2013-05-08 腾讯科技(深圳)有限公司 一种获取英文词的方法及装置
CN103745214A (zh) * 2014-01-08 2014-04-23 广东小天才科技有限公司 一种字符的识别方法和识别设备
US20140297256A1 (en) * 2013-03-15 2014-10-02 Translate Abroad, Inc. Systems and methods for determining and displaying multi-line foreign language translations in real time on mobile devices
CN107957994A (zh) * 2017-10-30 2018-04-24 努比亚技术有限公司 一种翻译方法、终端及计算机可读存储介质
CN109147769A (zh) * 2018-10-17 2019-01-04 北京猎户星空科技有限公司 一种语种识别方法、装置、翻译机、介质和设备
CN109190630A (zh) * 2018-08-29 2019-01-11 摩佰尔(天津)大数据科技有限公司 字符识别方法
CN109545015A (zh) * 2019-01-23 2019-03-29 广东小天才科技有限公司 一种科目类型的识别方法及家教设备
CN109766885A (zh) * 2018-12-29 2019-05-17 北京旷视科技有限公司 一种文字检测方法、装置、电子设备及存储介质

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050010391A1 (en) * 2003-07-10 2005-01-13 International Business Machines Corporation Chinese character / Pin Yin / English translator
CN101615180A (zh) * 2008-06-27 2009-12-30 国际商业机器公司 汉语拼音识别方法和装置
CN103092838A (zh) * 2011-10-28 2013-05-08 腾讯科技(深圳)有限公司 一种获取英文词的方法及装置
US20140297256A1 (en) * 2013-03-15 2014-10-02 Translate Abroad, Inc. Systems and methods for determining and displaying multi-line foreign language translations in real time on mobile devices
CN103745214A (zh) * 2014-01-08 2014-04-23 广东小天才科技有限公司 一种字符的识别方法和识别设备
CN107957994A (zh) * 2017-10-30 2018-04-24 努比亚技术有限公司 一种翻译方法、终端及计算机可读存储介质
CN109190630A (zh) * 2018-08-29 2019-01-11 摩佰尔(天津)大数据科技有限公司 字符识别方法
CN109147769A (zh) * 2018-10-17 2019-01-04 北京猎户星空科技有限公司 一种语种识别方法、装置、翻译机、介质和设备
CN109766885A (zh) * 2018-12-29 2019-05-17 北京旷视科技有限公司 一种文字检测方法、装置、电子设备及存储介质
CN109545015A (zh) * 2019-01-23 2019-03-29 广东小天才科技有限公司 一种科目类型的识别方法及家教设备

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112085090A (zh) * 2020-09-07 2020-12-15 百度在线网络技术(北京)有限公司 翻译方法、装置以及电子设备
CN112949381A (zh) * 2021-01-20 2021-06-11 涂益浪 一种图像内容识别方法及***

Also Published As

Publication number Publication date
CN111079489B (zh) 2023-04-28

Similar Documents

Publication Publication Date Title
US20180349734A1 (en) Method and apparatus for evaluating article value based on artificial intelligence, and storage medium
US11669712B2 (en) Robustness evaluation via natural typos
CN111324743A (zh) 文本关系抽取的方法、装置、计算机设备及存储介质
US20170318013A1 (en) Method and system for voice-based user authentication and content evaluation
CN109189895B (zh) 一种针对口算题的题目批改方法及装置
CN109410984B (zh) 一种朗读评分的方法及电子设备
CN112149680B (zh) 错字检测识别方法、装置、电子设备及存储介质
CN111881297A (zh) 语音识别文本的校正方法及装置
CN111079489B (zh) 一种内容识别方法及电子设备
CN112347997A (zh) 一种试题检测识别方法、装置、电子设备及介质
CN110970030A (zh) 一种语音识别转换方法及***
CN114297372A (zh) 个性化的笔记生成方法及***
CN111026786A (zh) 一种听写列表生成方法及家教设备
CN111027353A (zh) 一种搜索内容的提取方法及电子设备
CN111160347B (zh) 一种基于相似字符识别的文本识别方法及电子设备
CN109582971B (zh) 一种基于句法分析的批改方法及批改***
CN112307748A (zh) 用于处理文本的方法和装置
CN111159433B (zh) 一种内容定位方法及电子设备
CN111091120B (zh) 一种听写批改方法及电子设备
JP7222218B2 (ja) 文書校正支援システム、文書校正支援装置、文書校正支援方法、及びプログラム
CN111079725A (zh) 一种用于区分英文和拼音的方法及电子设备
CN111079486A (zh) 一种开启听写检测的方法及电子设备
CN110941709A (zh) 信息筛选方法、装置、电子设备及可读存储介质
CN111079504A (zh) 一种文字识别方法及电子设备
CN111090989A (zh) 一种基于文字识别的提示方法及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant