CN111079726B - 一种图像处理方法及电子设备 - Google Patents

一种图像处理方法及电子设备 Download PDF

Info

Publication number
CN111079726B
CN111079726B CN201910494086.0A CN201910494086A CN111079726B CN 111079726 B CN111079726 B CN 111079726B CN 201910494086 A CN201910494086 A CN 201910494086A CN 111079726 B CN111079726 B CN 111079726B
Authority
CN
China
Prior art keywords
image
content
initial image
target
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910494086.0A
Other languages
English (en)
Other versions
CN111079726A (zh
Inventor
崔颖
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong Genius Technology Co Ltd
Original Assignee
Guangdong Genius Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong Genius Technology Co Ltd filed Critical Guangdong Genius Technology Co Ltd
Priority to CN201910494086.0A priority Critical patent/CN111079726B/zh
Publication of CN111079726A publication Critical patent/CN111079726A/zh
Application granted granted Critical
Publication of CN111079726B publication Critical patent/CN111079726B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/22Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09BEDUCATIONAL OR DEMONSTRATION APPLIANCES; APPLIANCES FOR TEACHING, OR COMMUNICATING WITH, THE BLIND, DEAF OR MUTE; MODELS; PLANETARIA; GLOBES; MAPS; DIAGRAMS
    • G09B5/00Electrically-operated educational appliances
    • G09B5/04Electrically-operated educational appliances with audible presentation of the material to be studied
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/62Control of parameters via user interfaces

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Signal Processing (AREA)
  • Business, Economics & Management (AREA)
  • Educational Administration (AREA)
  • Educational Technology (AREA)
  • Electrically Operated Instructional Devices (AREA)

Abstract

本发明实施例公开一种图像处理方法及电子设备,该方法包括:判断拍摄到的初始图像中是否存在非印刷体内容;若存在,将非印刷体内容所处的区域确定为待填充区域;利用初始图像的背景像素填充待填充区域以遮盖非印刷体内容,得到目标图像;搜索目标图像匹配的预设图像,并将预设图像包含的内容作为初始图像的内容。通过实施本发明实施例,能够提高对存在有干扰因素的图像的识别效率,有利于提升学生的点读体验感。

Description

一种图像处理方法及电子设备
技术领域
本发明涉及电子设备技术领域,具体涉及一种图像处理方法及电子设备。
背景技术
学生利用家教设备对纸质书本面上不认识的字、词以及句进行点读时,家教设备往往需要对学生于纸质书本面的点击区域进行采集,以得到书本图像,并基于该书本图像的识别,实现对学生不认识的字、词以及句的报读。实践中发现,家教设备一般通过以图搜图的方式进行书本图像的识别,但若采集到的书本图像中存在手写笔记或者涂鸦等干扰因素,家教设备通常很难从图库中确定出与该书本图像匹配的图像。可见,现有家教设备对存在有干扰因素的图像的识别效率较低,影响学生的点读体验感。
发明内容
本发明实施例公开一种图像处理方法及电子设备,能够提高对存在有干扰因素的图像的识别效率。
本发明实施例第一方面公开一种图像处理方法,包括:
判断拍摄到的初始图像中是否存在非印刷体内容;
若存在,将所述非印刷体内容所处的区域确定为待填充区域;
利用所述初始图像的背景像素填充所述待填充区域以遮盖所述非印刷体内容,得到目标图像;
搜索所述目标图像匹配的预设图像,并将所述预设图像包含的内容作为所述初始图像的内容。
作为一种可选的实施方式,在本发明实施例第一方面中,所述判断拍摄到的初始图像中是否存在非印刷体内容之前,所述方法还包括:
依据当前环境亮度,确定拍摄模组的工作参数;
在收到用于启动图像采集进程的指示信息时,控制所述拍摄模组按照所述工作参数对当前学习页面进行拍摄,得到初始图像。
作为一种可选的实施方式,在本发明实施例第一方面中,所述在收到用于启动图像采集进程的指示信息时,控制所述拍摄模组按照所述工作参数拍摄当前学习页面,得到初始图像,包括:
在收到用于启动图像采集进程的指示信息时,控制所述拍摄模组按照所述工作参数拍摄当前学习页面,得到拍摄图像;
在所述拍摄图像中确定点击点;
依据所述点击点确定所述拍摄图像的点击区域;
从所述拍摄图像中裁剪出所述点击区域作为初始图像。
作为一种可选的实施方式,在本发明实施例第一方面中,所述将所述预设图像包含的内容作为所述初始图像的内容之后,所述方法还包括:
依据用户信息确定目标报读音色;
综合所述目标报读音色和所述初始图像的内容得到目标语音;
对所述目标语音执行输出操作。
作为一种可选的实施方式,在本发明实施例第一方面中,所述对所述目标语音执行输出操作之后,所述方法还包括:
判断是否收到用户的跟读语音;
若收到,依据所述目标语音对所述跟读语音进行分析,得到分析结果;
按照预设输出方式,输出所述分析结果。
本发明实施例第二方面公开一种电子设备,包括:
判断单元,用于判断拍摄到的初始图像中是否存在非印刷体内容;
第一确定单元,用于当所述初始图像存在所述非印刷体内容时,将所述非印刷体内容所处的区域确定为待填充区域;
填充单元,用于利用所述初始图像的背景像素填充所述待填充区域以遮盖所述非印刷体内容,得到目标图像;
识别单元,用于搜索所述目标图像匹配的预设图像,并将所述预设图像包含的内容作为所述初始图像的内容。
作为一种可选的实施方式,在本发明实施例第二方面中,所述电子设备还包括:
第二确定单元,用于判断单元判断拍摄到的初始图像中是否存在非印刷体内容之前,依据当前环境亮度,确定拍摄模组的工作参数;
拍摄单元,用于在收到用于启动图像采集进程的指示信息时,控制所述拍摄模组按照所述工作参数对当前学习页面进行拍摄,得到初始图像。
作为一种可选的实施方式,在本发明实施例第二方面中,所述拍摄单元用于在收到用于启动图像采集进程的指示信息时,控制所述拍摄模组按照所述工作参数对当前学习页面进行拍摄,得到初始图像的方式具体为:
所述拍摄单元,用于在收到用于启动图像采集进程的指示信息时,控制所述拍摄模组按照所述工作参数拍摄当前学习页面,得到拍摄图像;以及在所述拍摄图像中确定点击点;以及依据所述点击点确定所述拍摄图像的点击区域;以及从所述拍摄图像中裁剪出所述点击区域作为初始图像。
作为一种可选的实施方式,在本发明实施例第二方面中,所述电子设备还包括:
获取单元,用于所述识别单元将所述预设图像包含的内容作为所述初始图像的内容之后,依据用户信息确定目标报读音色,以及综合所述目标报读音色和所述初始图像的学习内容得到目标语音;
输出单元,用于对所述目标语音执行输出操作。
作为一种可选的实施方式,在本发明实施例第二方面中,所述判断单元,还用于所述输出单元对所述目标语音执行输出操作之后,判断是否收到用户的跟读语音;
所述电子设备还包括:
分析单元,用于在所述判断单元判断收到所述跟读语音时,依据所述目标语音对所述跟读语音进行分析,得到分析结果;
所述输出单元,还用于按照预设输出方式,输出所述分析结果。
本发明实施例第三方面公开一种电子设备,包括:
存储有可执行程序代码的存储器;
与所述存储器耦合的处理器;
所述处理器调用所述存储器中存储的所述可执行程序代码,执行本发明第一方面的任意一种方法的部分或全部步骤。
本发明实施例第四方面公开一种计算机可读存储介质,其存储计算机程序,所述计算机程序包括用于执行本发明第一方面的任意一种方法的部分或全部步骤。
本发明实施例第五面公开一种计算机程序产品,当所述计算机程序产品在计算机上运行时,使得所述计算机执行第一方面的任意一种方法的部分或全部步骤。
本发明实施例第六方面公开一种应用发布***,所述应用发布***用于发布计算机程序产品,其中,当所述计算机程序产品在计算机上运行时,使得所述计算机执行第一方面的任意一种方法的部分或全部步骤。
与现有技术相比,本发明实施例具有以下有益效果:
本发明实施例中,判断拍摄到的初始图像中是否存在非印刷体内容;若存在,将非印刷体内容所处的区域确定为待填充区域;利用初始图像的背景像素填充待填充区域以遮盖非印刷体内容,得到目标图像;搜索目标图像匹配的预设图像,并将预设图像包含的内容作为初始图像的内容。通过实施本发明实施例,对图像中非印刷体内容的所处区域进行像素填充,可以减少非印刷体内容对该图像处理的干扰,提高对存在有干扰因素的图像的识别效率,有利于提升学生的点读体验感。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造率劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例公开的一种图像处理方法的流程示意图;
图2是本发明实施例公开的另一种图像处理方法的流程示意图;
图3是本发明实施例公开的又一种图像处理方法的流程示意图;
图4是本发明实施例公开的一种电子设备的结构示意图;
图5是本发明实施例公开的另一种电子设备的结构示意图;
图6是本发明实施例公开的又一种电子设备的结构示意图;
图7是本发明实施例公开的又一种电子设备的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明的是,本发明实施例及附图中的术语“包括”“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、***、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。
本发明实施例公开一种图像处理方法及电子设备,能够提高对存在有干扰因素的图像的识别效率。在本发明实施例中,该图像处理方法可以适用于智能手机、智能手表以及平板等各类电子设备上,本发明实施例不做限定。其中,各类电子设备的操作***可包括但不限于Android操作***、IOS操作***、Symbian(塞班)操作***、Black Berry(黑莓)操作***、Windows Phone8操作***等等,本发明实施例不做限定。
实施例一
请参阅图1,图1是本发明实施例公开的一种图像处理方法的流程示意图。如图1所示的图像处理方法具体可以包括以下步骤:
101、判断拍摄到的初始图像中是否存在非印刷体内容,如果是,执行步骤102~步骤104;如果否,结束本流程。
在本发明实施例中,初始图像可以是通过拍摄纸质页面得到的,也可以是通过拍摄电子页面得到的,本发明实施例不做限定。若初始图像由拍摄纸质页面得到,存在于初始图像中的非印刷体内容可以为用户手写在纸质页面上的笔记或涂鸦内容,若初始图像由拍摄电子页面得到,存在于初始图像中的非印刷体内容可以为用户于电子页面上的笔记或涂鸦内容。其中,在步骤101的判断结果为否时,可以搜索上述初始图像匹配的预设图像。
作为一种可选的实施方式,在本发明实施例中,若上述非印刷体内容为用户于电子页面或者纸质页面上的笔记内容,在步骤101的判断结果为是时,还可以执行如下操作:
检测是否收到用户输入的笔记收录指令;
当收到笔记收录指令时,识别非印刷体内容,以得到笔记信息;
设置上述笔记信息的笔记标签;其中,该笔记标签至少可以包括学习页面标识;
将上述笔记信息和笔记标签关联存储至笔记库。
通过实施上述方法,可以实现用户笔记的自动整理,有利于提高用户学习效率。
进一步可选的,上述识别非印刷体内容,以得到笔记信息,可以包括:
获取用户的身份信息;
在电子设备的预设生字库中查找上述身份信息匹配的目标生字库;
依据目标生字库,识别非印刷体内容,以得到笔记信息。
其中,上述用户的身份信息可以为用户的脸部信息、指纹信息或者虹膜信息等,本发明实施例不做限定。上述预设生字库可以通过收录用户的历史手写字得到,通过实施上述方法,可以提高笔记内容的识别效率。
102、将非印刷体内容所处的区域确定为待填充区域。
103、利用初始图像的背景像素填充待填充区域以遮盖非印刷体内容,得到目标图像。
作为一种可选的实施方式,在本发明实施例中,在执行步骤102之前,还可以判断上述非印刷体内容中是否存在覆盖于印刷体内容上的非印刷体内容,若不存在覆盖于印刷体内容上的非印刷体内容,则继续执行步骤102。通过实施该方法,可以进一步提高对存在有干扰因素的图像的识别效率。
104、搜索目标图像匹配的预设图像,并将预设图像包含的内容作为初始图像的内容。
通过实施上述方法,可以提高对存在有干扰因素的图像的识别效率,有利于提升学生的点读体验,还可以实现用户笔记的自动整理,有利于提高用户学习效率,还可以提高笔记内容的识别效率。
实施例二
请参阅图2,图2是本发明实施例公开的另一种图像处理方法的流程示意图。如图2所示的图像处理方法具体可以包括以下步骤:
201、依据当前环境亮度,确定拍摄模组的工作参数。
202、在收到用于启动图像采集进程的指示信息时,控制拍摄模组按照上述工作参数对当前学习页面进行拍摄,得到初始图像。
在本发明实施例中,步骤201可以在电子设备处于点读模式时执行,执行步骤201~步骤202,可以依据当前环境亮度调整拍摄模组的工作参数,以起到保证图像质量的目的。
作为一种可选的实施方式,在本发明实施例中,在收到用于启动图像采集进程的指示信息时,控制拍摄模组按照上述工作参数对当前学习页面进行拍摄,得到初始图像可以包括:
在收到用于启动图像采集进程的指示信息时,控制拍摄模组按照上述工作参数拍摄当前学习页面,得到拍摄图像;
在拍摄图像中确定点击点;
依据点击点确定拍摄图像的点击区域;
从拍摄图像中裁剪出点击区域作为初始图像。
通过实施上述方法,可以基于点击点的识别,提高初始图像的确定效率,进而实现电子设备的精准点读。
进一步可选的,在收到用于启动图像采集进程的指示信息时,控制拍摄模组按照上述工作参数拍摄当前学习页面,得到拍摄图像可以包括:
在收到用于启动图像采集进程的指示信息时,开启投影装置,以通过投影装置在放置电子页面或纸质页面的水平面上投影拍摄指示区域;
检测当前学习页面是否处于拍摄指示区域;
在当前学习页面处于拍摄指示区域时,控制投影装置终止针对拍摄指示区域的投影进程,并控制拍摄模组按照上述工作参数拍摄当前学习页面,得到拍摄图像;
或者,在当前学习页面不处于拍摄指示区域时,输出用于指示用户调整学习页面位置的提示信息。
实施上述方法,通过拍摄指示区域的投影,可便于用户规范化放置学习页面。
其中,步骤203~步骤206的描述,请参照实施例一中针对步骤101~步骤104的描述,本发明实施例不再赘述。
207、依据用户信息确定目标报读音色。
208、综合目标报读音色和初始图像的内容得到目标语音。
209、对目标语音执行输出操作。
在本发明实施例中,步骤207提及的用户信息至少可以包括用户的年级信息、性别信息以及爱好信息等,通过执行步骤207~步骤209,基于用户信息实现学习内容报读,可以激发用户的学习兴趣,有利于提高用户的点读体验感。
作为一种可选的实施方式,在本发明实施例中,在步骤206之后,还可以执行如下步骤:
检测电子设备的当前电量是否小于预设电量;
如小于预设电量,判断电子设备是否与音频服务器连接;
若连接,电子设备向音频服务器发送携带有电子设备标识的音频请求信息;其中,该音频请求信息至少包括用户信息和初始图像的内容,以使音频服务器在收到音频请求信息时,依据用户信息在音频服务器的云端确定预选报读音色,以及将预选报读音色反馈至电子设备;
电子设备依据用户的选择操作,从预选报读音色中确定目标报读音色;
以及,电子设备将指示目标报读音色的反馈信息反馈至音频服务器,以使音频服务器综合目标报读音色和初始图像的内容得到目标语音,以及将该目标语音反馈至电子设备。
其中,实施上述方法,在电子设备电量较小的情况下,将目标语音的生成工作交付于音频服务器完成,可以有效减少电子设备的功耗。
通过实施上述方法,可以提高对存在有干扰因素的图像的识别效率,有利于提升学生的点读体验,还可以实现用户笔记的自动整理,有利于提高用户学习效率,还可以提高笔记内容的识别效率,还可以激发用户的学习兴趣,有利于提高用户的点读体验感,还可以在电子设备电量较小的情况下,将目标语音的生成工作交付于音频服务器完成,有效减少电子设备的功耗。
实施例三
请参阅图3,图3是本发明实施例公开的另一种图像处理方法的流程示意图。如图3所示的图像处理方法具体可以包括以下步骤:
其中,关于步骤301~步骤309的详细描述,请参照实施例二中针对步骤201~步骤209的描述,本发明实施例不再赘述。
310、判断是否收到用户的跟读语音,如果是,执行步骤311~步骤312;如果否,结束本流程。
311、依据目标语音对上述跟读语音进行分析,得到分析结果。
312、按照预设输出方式,输出分析结果。
在本发明实施例中,步骤312提及的预设输出方式可以为文本、音频或者视频等,本发明实施例不做限定。若上述初始图像的内容为生字,步骤311提及的分析结果可以包括口语得分、生字的标准拼音以及跟读拼音,通过执行步骤310~步骤312,可以实现用户的跟读语音的自动分析,有助于用户进行口语练习。
通过实施上述方法,可以提高对存在有干扰因素的图像的识别效率,有利于提升学生的点读体验,还可以实现用户笔记的自动整理,有利于提高用户学习效率,还可以提高笔记内容的识别效率,还可以激发用户的学习兴趣,有利于提高用户的点读体验感,还可以在电子设备电量较小的情况下,将目标语音的生成工作交付于音频服务器完成,有效减少电子设备的功耗,还可以实现用户的跟读语音的自动分析,有助于用户进行口语练习。
实施例四
请参阅图4,图4是本发明实施例公开的一种电子设备的结构示意图。如图4所示,该电子设备可以包括:
判断单元401,用于判断拍摄到的初始图像中是否存在非印刷体内容。
作为一种可选的实施方式,在本发明实施例中,若上述非印刷体内容为用户于电子页面或者纸质页面上的笔记内容,判断单元401,还可以用于在判断出初始图像中存在非印刷体内容时,检测是否收到用户输入的笔记收录指令;以及当收到笔记收录指令时,识别非印刷体内容,以得到笔记信息;以及设置上述笔记信息的笔记标签;其中,该笔记标签至少可以包括学习页面标识;以及将上述笔记信息和笔记标签关联存储至笔记库。通过实施该方式,可以实现用户笔记的自动整理,有利于提高用户学习效率。
进一步可选的,判断单元401用于识别非印刷体内容,以得到笔记信息的方式具体可以为:
判断单元401,用于获取用户的身份信息;以及在电子设备的预设生字库中查找上述身份信息匹配的目标生字库;以及依据目标生字库,识别非印刷体内容,以得到笔记信息。
其中,上述用户的身份信息可以为用户的脸部信息、指纹信息或者虹膜信息等,本发明实施例不做限定。上述预设生字库可以通过收录用户的历史手写字得到,通过实施上述方式,可以提高笔记内容的识别效率。
第一确定单元402,用于当初始图像存在非印刷体内容时,将非印刷体内容所处的区域确定为待填充区域。
作为一种可选的实施方式,在本发明实施例中,判断单元401,还可以用于在判断出初始图像中存在非印刷体内容时,判断上述非印刷体内容中是否存在覆盖于印刷体内容上的非印刷体内容,若不存在覆盖于印刷体内容上的非印刷体内容,则触发第一确定单元402执行上述的将非印刷体内容所处的区域确定为待填充区域的操作。通过实施该方式,可以进一步提高对存在有干扰因素的图像的识别效率。
填充单元403,用于利用初始图像的背景像素填充待填充区域以遮盖非印刷体内容,得到目标图像。
识别单元404,用于搜索目标图像匹配的预设图像,并将预设图像包含的内容作为初始图像的内容。
通过实施上述电子设备,可以提高对存在有干扰因素的图像的识别效率,有利于提升学生的点读体验,还可以实现用户笔记的自动整理,有利于提高用户学习效率,还可以提高笔记内容的识别效率。
实施例五
请参阅图5,图5是本发明实施例公开的另一种电子设备的结构示意图。图5所示的电子设备是由图4所示的电子设备优化得到的,如图5所示,该电子设备还可以包括:
第二确定单元405,用于判断单元401判断拍摄到的初始图像中是否存在非印刷体内容之前,依据当前环境亮度,确定拍摄模组的工作参数。
拍摄单元406,用于在收到用于启动图像采集进程的指示信息时,控制拍摄模组按照上述工作参数对当前学习页面进行拍摄,得到初始图像。
可选的,在本发明实施例中,拍摄单元406用于在收到用于启动图像采集进程的指示信息时,控制拍摄模组按照上述工作参数对当前学习页面进行拍摄,得到初始图像的方式具体可以为:
拍摄单元406,用于在收到用于启动图像采集进程的指示信息时,控制拍摄模组按照上述工作参数拍摄当前学习页面,得到拍摄图像;以及在拍摄图像中确定点击点;以及依据点击点确定拍摄图像的点击区域;以及从拍摄图像中裁剪出点击区域作为初始图像。
在本发明实施例中,拍摄单元406可以基于点击点的识别,提高初始图像的确定效率,进而实现电子设备的精准点读。
进一步可选的,拍摄单元406用于在收到用于启动图像采集进程的指示信息时,控制拍摄模组按照上述工作参数拍摄当前学习页面,得到拍摄图像的方式具体可以为:
拍摄单元406,用于在收到用于启动图像采集进程的指示信息时,开启投影装置,以通过投影装置在放置电子页面或纸质页面的水平面上投影拍摄指示区域;以及检测当前学习页面是否处于拍摄指示区域;以及在当前学习页面处于拍摄指示区域时,控制投影装置终止针对拍摄指示区域的投影进程,以及控制拍摄模组按照上述工作参数拍摄当前学习页面,得到拍摄图像;
或者,拍摄单元406,还可以用于在当前学习页面不处于拍摄指示区域时,输出用于指示用户调整学习页面位置的提示信息。实施上述方式,通过拍摄指示区域的投影,可便于用户规范化放置学习页面。
进一步可选的,图5所示的电子设备还可以包括:
获取单元407,用于上述识别单元404将预设图像包含的内容作为初始图像的内容之后,依据用户信息确定目标报读音色,以及综合目标报读音色和初始图像的学习内容得到目标语音。
输出单元408,用于对目标语音执行输出操作。
在本发明实施例中,上述用户信息至少可以包括用户的年级信息、性别信息以及爱好信息等,通过实施上述实施方式,基于用户信息实现学习内容报读,可以激发用户的学习兴趣,有利于提高用户的点读体验感。
作为一种可选的实施方式,在本发明实施例中,识别单元404,还可以用于将预设图像包含的内容作为初始图像的内容之后,检测电子设备的当前电量是否小于预设电量;以及当小于预设电量时,判断电子设备是否与音频服务器连接;以及当连接音频服务器时,向音频服务器发送携带有电子设备标识的音频请求信息;其中,该音频请求信息至少包括用户信息和初始图像的内容,以使音频服务器在收到音频请求信息时,依据用户信息在音频服务器的云端确定预选报读音色,以及将预选报读音色反馈至电子设备;以及依据用户的选择操作,从预选报读音色中确定目标报读音色;以及将指示目标报读音色的反馈信息反馈至音频服务器,以使音频服务器综合目标报读音色和初始图像的内容得到目标语音,以及将该目标语音反馈至电子设备。实施该实施方式,在电子设备电量较小的情况下,将目标语音的生成工作交付于音频服务器完成,可以有效减少电子设备的功耗。
通过实施上述电子设备,可以提高对存在有干扰因素的图像的识别效率,有利于提升学生的点读体验,还可以实现用户笔记的自动整理,有利于提高用户学习效率,还可以提高笔记内容的识别效率,还可以激发用户的学习兴趣,有利于提高用户的点读体验感,还可以在电子设备电量较小的情况下,将目标语音的生成工作交付于音频服务器完成,有效减少电子设备的功耗。
实施例六
请参阅图6,图6是本发明实施例公开的又一种电子设备的结构示意图。图6所示的电子设备是由图5所示的电子设备优化得到的,如图6所示的电子设备的判断单元401,还可以用于上述输出单元408对目标语音执行输出操作之后,判断是否收到用户的跟读语音。
图6所示的电子设备还可以包括:
分析单元409,用于在上述判断单元401判断收到用户的跟读语音时,依据目标语音对该跟读语音进行分析,得到分析结果。
上述输出单元408,还用于按照预设输出方式,输出所述分析结果。
在本发明实施例中,若上述初始图像的内容为生字,上述分析结果可以包括口语得分、生字的标准拼音以及跟读拼音,通过执行上述实施方式可以实现用户的跟读语音的自动分析,有助于用户进行口语练习。
通过实施上述电子设备,可以提高对存在有干扰因素的图像的识别效率,有利于提升学生的点读体验,还可以实现用户笔记的自动整理,有利于提高用户学习效率,还可以提高笔记内容的识别效率,还可以激发用户的学习兴趣,有利于提高用户的点读体验感,还可以在电子设备电量较小的情况下,将目标语音的生成工作交付于音频服务器完成,有效减少电子设备的功耗,还可以实现用户的跟读语音的自动分析,有助于用户进行口语练习。
请参阅图7,图7是本发明实施例公开的一种电子设备的结构示意图。如图7所示,该电子设备可以包括:
存储有可执行程序代码的存储器701;
与存储器701耦合的处理器702;
其中,处理器702调用存储器701中存储的可执行程序代码,执行图1~图3任意一种图像处理方法。
本发明实施例公开一种计算机可读存储介质,其存储计算机程序,其中,该计算机程序使得计算机执行图1~图3任意一种图像处理方法。
本发明实施例公开一种计算机程序产品,当该计算机程序产品在计算机上运行时,使得计算机执行图1~图3任意一种图像处理方法。
本发明实施例公开一种应用发布***,该应用发布***用于发布计算机程序产品,其中,当计算机程序产品在计算机上运行时,使得计算机执行图1~图3任意一种图像处理方法。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质包括只读存储器(Read-Only Memory,ROM)、随机存储器(Random Access Memory,RAM)、可编程只读存储器(Programmable Read-only Memory,PROM)、可擦除可编程只读存储器(Erasable Programmable Read Only Memory,EPROM)、一次可编程只读存储器(One-time Programmable Read-Only Memory,OTPROM)、电子抹除式可复写只读存储器(Electrically-Erasable Programmable Read-Only Memory,EEPROM)、只读光盘(CompactDisc Read-Only Memory,CD-ROM)或其他光盘存储器、磁盘存储器、磁带存储器、或者能够用于携带或存储数据的计算机可读的任何其他介质。
以上对本发明实施例公开的一种图像处理方法及电子设备进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,且上述具体个例中步骤序号的大小并不意味着执行顺序的必然先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。上述作为分离部件说明的单元可以是或者也可以不是物理上分开的,可根据实际的需要选择其中的部分或全部单元来实现本实施例方案的目的。
本文中字符“/”,一般表示前后关联对象是一种“或”的关系。在本发明所提供的实施例中,应理解,“与A相应的B”表示B与A相关联,根据A可以确定B。但还应理解,根据A确定B并不意味着仅仅根据A确定B,还可以根据A和/或其他信息确定B。另外,在本发明各实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。若上述集成的单元以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可获取的存储器中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或者部分,可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储器中,包括若干请求用以使得一台计算机设备(可以为个人计算机、服务器或者网络设备等,具体可以是计算机设备中的处理器)执行本发明的各个实施例上述方法的部分或全部步骤。
以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (10)

1.一种图像处理方法,其特征在于,包括:
判断拍摄到的初始图像中是否存在非印刷体内容;
若存在,将所述非印刷体内容所处的区域确定为待填充区域;利用所述初始图像的背景像素填充所述待填充区域以遮盖所述非印刷体内容,得到目标图像;搜索所述目标图像匹配的预设图像,并将所述目标图像匹配的预设图像包含的内容作为所述初始图像的内容;
若不存在,搜索所述初始图像匹配的预设图像,并将所述初始图像匹配的预设图像包含的内容作为所述初始图像的内容。
2.根据权利要求1所述的方法,其特征在于,所述判断拍摄到的初始图像中是否存在非印刷体内容之前,所述方法还包括:
依据当前环境亮度,确定拍摄模组的工作参数;
在收到用于启动图像采集进程的指示信息时,控制所述拍摄模组按照所述工作参数对当前学习页面进行拍摄,得到初始图像。
3.根据权利要求2所述的方法,其特征在于,所述在收到用于启动图像采集进程的指示信息时,控制所述拍摄模组按照所述工作参数拍摄当前学习页面,得到初始图像,包括:
在收到用于启动图像采集进程的指示信息时,控制所述拍摄模组按照所述工作参数拍摄当前学习页面,得到拍摄图像;
在所述拍摄图像中确定点击点;
依据所述点击点确定所述拍摄图像的点击区域;
从所述拍摄图像中裁剪出所述点击区域作为初始图像。
4.根据权利要求1~3任一项所述的方法,其特征在于,所述将所述目标图像匹配的预设图像包含的内容作为所述初始图像的内容之后,所述方法还包括:
依据用户信息确定目标报读音色;
综合所述目标报读音色和所述初始图像的内容得到目标语音;
对所述目标语音执行输出操作。
5.根据权利要求4所述的方法,其特征在于,所述对所述目标语音执行输出操作之后,所述方法还包括:
判断是否收到用户的跟读语音;
若收到,依据所述目标语音对所述跟读语音进行分析,得到分析结果;
按照预设输出方式,输出所述分析结果。
6.一种电子设备,其特征在于,包括:
判断单元,用于判断拍摄到的初始图像中是否存在非印刷体内容;
第一确定单元,用于当所述初始图像存在所述非印刷体内容时,将所述非印刷体内容所处的区域确定为待填充区域;
填充单元,用于利用所述初始图像的背景像素填充所述待填充区域以遮盖所述非印刷体内容,得到目标图像;
识别单元,用于搜索所述目标图像匹配的预设图像,并将所述目标图像匹配的预设图像包含的内容作为所述初始图像的内容;
用于当所述初始图像不存在所述非印刷体内容时,搜索所述初始图像匹配的预设图像,并将所述初始图像匹配的预设图像包含的内容作为所述初始图像的内容的单元。
7.根据权利要求6所述的电子设备,其特征在于,所述电子设备还包括:
第二确定单元,用于判断单元判断拍摄到的初始图像中是否存在非印刷体内容之前,依据当前环境亮度,确定拍摄模组的工作参数;
拍摄单元,用于在收到用于启动图像采集进程的指示信息时,控制所述拍摄模组按照所述工作参数对当前学习页面进行拍摄,得到初始图像。
8.根据权利要求7所述的电子设备,其特征在于,所述拍摄单元用于在收到用于启动图像采集进程的指示信息时,控制所述拍摄模组按照所述工作参数对当前学习页面进行拍摄,得到初始图像的方式具体为:
所述拍摄单元,用于在收到用于启动图像采集进程的指示信息时,控制所述拍摄模组按照所述工作参数拍摄当前学习页面,得到拍摄图像;以及在所述拍摄图像中确定点击点;以及依据所述点击点确定所述拍摄图像的点击区域;以及从所述拍摄图像中裁剪出所述点击区域作为初始图像。
9.根据权利要求6~8任一项所述的电子设备,其特征在于,所述电子设备还包括:
获取单元,用于所述识别单元将所述目标图像匹配的预设图像包含的内容作为所述初始图像的内容之后,依据用户信息确定目标报读音色,以及综合所述目标报读音色和所述初始图像的学习内容得到目标语音;
输出单元,用于对所述目标语音执行输出操作。
10.根据权利要求9所述的电子设备,其特征在于,所述判断单元,还用于所述输出单元对所述目标语音执行输出操作之后,判断是否收到用户的跟读语音;
所述电子设备还包括:
分析单元,用于在所述判断单元判断收到所述跟读语音时,依据所述目标语音对所述跟读语音进行分析,得到分析结果;
所述输出单元,还用于按照预设输出方式,输出所述分析结果。
CN201910494086.0A 2019-06-09 2019-06-09 一种图像处理方法及电子设备 Active CN111079726B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910494086.0A CN111079726B (zh) 2019-06-09 2019-06-09 一种图像处理方法及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910494086.0A CN111079726B (zh) 2019-06-09 2019-06-09 一种图像处理方法及电子设备

Publications (2)

Publication Number Publication Date
CN111079726A CN111079726A (zh) 2020-04-28
CN111079726B true CN111079726B (zh) 2024-03-22

Family

ID=70310044

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910494086.0A Active CN111079726B (zh) 2019-06-09 2019-06-09 一种图像处理方法及电子设备

Country Status (1)

Country Link
CN (1) CN111079726B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111461103B (zh) * 2020-05-14 2023-05-16 广东小天才科技有限公司 一种点读场景去干扰的方法、装置、电子设备和存储介质
CN113900602B (zh) * 2021-12-09 2022-03-11 北京辰光融信技术有限公司 一种自动消除目标对象填充信息的智能打印方法及***

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101237500A (zh) * 2006-12-14 2008-08-06 三星电子株式会社 图像形成装置和控制该图像形成装置的方法
CN104157171A (zh) * 2014-08-13 2014-11-19 三星电子(中国)研发中心 一种点读***及其方法
CN108509136A (zh) * 2018-04-12 2018-09-07 山东音为爱智能科技有限公司 一种基于人工智能的儿童绘本辅助阅读方法
CN108805126A (zh) * 2017-04-28 2018-11-13 上海斯睿德信息技术有限公司 一种文本图像的长干扰线去除方法
CN109637286A (zh) * 2019-01-16 2019-04-16 广东小天才科技有限公司 一种基于图像识别的口语训练方法及家教设备

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101237500A (zh) * 2006-12-14 2008-08-06 三星电子株式会社 图像形成装置和控制该图像形成装置的方法
CN104157171A (zh) * 2014-08-13 2014-11-19 三星电子(中国)研发中心 一种点读***及其方法
CN108805126A (zh) * 2017-04-28 2018-11-13 上海斯睿德信息技术有限公司 一种文本图像的长干扰线去除方法
CN108509136A (zh) * 2018-04-12 2018-09-07 山东音为爱智能科技有限公司 一种基于人工智能的儿童绘本辅助阅读方法
CN109637286A (zh) * 2019-01-16 2019-04-16 广东小天才科技有限公司 一种基于图像识别的口语训练方法及家教设备

Also Published As

Publication number Publication date
CN111079726A (zh) 2020-04-28

Similar Documents

Publication Publication Date Title
US20180260479A1 (en) Method, apparatus, system and electronic device for picture book recognition
CN109597943B (zh) 一种基于场景的学习内容推荐方法及学习设备
CN110232340B (zh) 建立视频分类模型以及视频分类的方法、装置
CN111626383B (zh) 字体识别方法及装置、电子设备、存储介质
CN110740389A (zh) 视频定位方法、装置、计算机可读介质及电子设备
CN110544470B (zh) 语音识别方法、装置、可读存储介质和电子设备
CN111079726B (zh) 一种图像处理方法及电子设备
CN113591437B (zh) 游戏文本翻译方法、电子设备及存储介质
CN111026949A (zh) 一种基于电子设备的搜题方法及***
CN110874554B (zh) 动作识别方法、终端设备、服务器、***及存储介质
CN111639158B (zh) 一种学习内容的显示方法及电子设备
CN110795918A (zh) 确定阅读位置的方法、装置及设备
CN110992958B (zh) 内容记录方法、装置、电子设备及存储介质
CN111079503B (zh) 一种文字识别方法及电子设备
CN110209280B (zh) 一种应答方法、应答装置及存储介质
CN112542163B (zh) 智能语音交互方法、设备及存储介质
CN112163513A (zh) 信息选取方法、***、装置、电子设备及存储介质
CN111027353A (zh) 一种搜索内容的提取方法及电子设备
CN111582281B (zh) 一种图片显示优化的方法、装置、电子设备和存储介质
CN109447081B (zh) 一种光学字符识别数据集的获取方法及***
CN111090383B (zh) 一种指令识别方法及电子设备
CN111078080B (zh) 一种点读控制方法及电子设备
CN111160347B (zh) 一种基于相似字符识别的文本识别方法及电子设备
CN111027317A (zh) 一种听写报读进度的控制方法及电子设备
CN111078082A (zh) 一种基于图像识别的点读方法及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant