CN110059686A - 字符识别方法、装置、设备及可读存储介质 - Google Patents
字符识别方法、装置、设备及可读存储介质 Download PDFInfo
- Publication number
- CN110059686A CN110059686A CN201910345757.7A CN201910345757A CN110059686A CN 110059686 A CN110059686 A CN 110059686A CN 201910345757 A CN201910345757 A CN 201910345757A CN 110059686 A CN110059686 A CN 110059686A
- Authority
- CN
- China
- Prior art keywords
- character
- terminal
- image
- identification result
- result
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/768—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using context analysis, e.g. recognition aided by known co-occurring patterns
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/60—Type of objects
- G06V20/62—Text, e.g. of license plates, overlay texts or captions on TV images
- G06V20/63—Scene text, e.g. street names
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Artificial Intelligence (AREA)
- Health & Medical Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Computing Systems (AREA)
- Databases & Information Systems (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Character Discrimination (AREA)
Abstract
本申请公开了一种字符识别方法、装置、设备及可读存储介质,涉及人工智能领域,该方法应用于设置有摄像头的终端中,该方法包括:调用摄像头进行图像采集;获取终端的稳定参数;当稳定参数符合预设条件时,获取摄像头采集的n帧图像,n≥2;对至少两帧图像进行字符识别,得到目标字符识别结果。在对图像进行采集的过程中,通过获取该终端的稳定参数,并根据稳定参数确定终端是否符合预设条件,当终端符合预设条件时,从摄像头采集图像进行字符识别,并根据该图像的字符识别结果确定目标字符识别结果,由于图像为终端处于稳定状态时获取的图像,确保该n帧图像的清晰度,以及提高了字符识别的准确率和效率。
Description
技术领域
本申请实施例涉及人工智能领域,特别涉及一种字符识别方法、装置、设备及可读存储介质。
背景技术
光学字符识别(Optical Character Recognition,OCR)是一种对图像中的字符进行识别的功能。通常,用户将带有字符的图像输入到光学字符识别模块,并得到识别结果。OCR技术可以应用于多个领域中,如:车牌识别、文档转换等。
相关技术中,首先通过拍摄的方式对带有字符的图像进行采集,并将该带有字符的图像输入光学字符识别模块进行OCR识别,输出得到识别结果,如:识别得到的车牌号、识别得到的文档内容等。
然而,通过上述方式进行OCR识别时,需要对带有字符的图像进行采集,而当图像由于设备抖动而导致采集结果不清晰时,该图像的识别结果准确率较低,需要重新进行图像采集并进行再次识别,OCR识别过程较为繁琐,识别效率较低。
发明内容
本申请实施例提供了一种字符识别方法、装置、设备及可读存储介质,可以解决当图像采集结果不清晰、图像曝光过度、采集设备抖动的情况下,该图像的识别结果准确率较低的问题。所述技术方案如下:
一方面,提供了一种字符识别方法,应用于设置有摄像头的终端中,所述方法包括:
调用所述终端的所述摄像头进行图像采集;
获取所述终端的稳定参数,所述稳定参数用于评估所述终端的稳定程度;
当所述稳定参数符合预设条件时,获取所述摄像头采集的n帧图像,n≥2;
对所述n帧图像中的至少两帧图像进行字符识别,并根据所述至少两帧图像的字符识别结果得到目标字符识别结果。
另一方面,提供了一种字符识别装置,应用于设置有摄像头的终端中,所述装置包括:
调用模块,用于调用所述终端的所述摄像头进行图像采集;
获取模块,用于获取所述终端的稳定参数,所述稳定参数用于评估所述终端的稳定程度;
所述获取模块,还用于当所述稳定参数符合预设条件时,获取所述摄像头采集的n帧图像,n≥2;
识别模块,用于对所述n帧图像中的至少两帧图像进行字符识别,并根据所述至少两帧图像的字符识别结果得到目标字符识别结果。
另一方面,提供了一种计算机设备,所述计算机设备包括处理器和存储器,所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现如上述本申请实施例中提供的字符识别方法。
另一方面,提供了一种计算机可读存储介质,所述可读存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现如上述本申请实施例中提供的字符识别方法。
另一方面,提供了一种计算机程序产品,当所述计算机程序产品在计算机上运行时,使得计算机执行如上述本申请实施例中提供的字符识别方法。
本申请实施例提供的技术方案带来的有益效果至少包括:
在对图像进行采集的过程中,通过获取该终端的稳定参数,并根据稳定参数确定终端是否符合预设条件,当终端符合预设条件时,从摄像头采集的图像中获取n帧图像作为进行字符识别的图像,并根据该n帧图像中至少两帧图像的字符识别结果确定目标字符识别结果,由于该n帧图像为终端处于稳定状态时获取的图像,确保该n帧图像的清晰度,以及提高了字符识别的准确率和效率。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请一个示例性实施例提供的相关技术中进行字符识别的过程示意图;
图2是本申请一个示例性实施例提供的实施环境示意图;
图3是本申请一个示例性实施例提供的字符识别方法的流程图;
图4是基于图3示出的实施例提供的摄像头开启过程示意图;
图5是基于图3示出的实施例提供的终端对应的坐标轴示意图;
图6是本申请另一个示例性实施例提供的字符识别方法的流程图;
图7是基于图6示出的实施例提供的第一识别结果和第二识别结果相似度比较示意图;
图8是基于图6示出的实施例提供的根据相似度结果输出置信度较高的识别结果的示意图;
图9是基于图6示出的实施例提供的结合第三识别结果进行相似度比较的示意图;
图10是本申请另一个示例性实施例提供的字符识别方法的流程图;
图11是基于图10示出的实施例提供的无线网络接入过程的示意图;
图12是本申请一个示例性实施例提供的字符识别方法整体过程示意图;
图13是本申请另一个示例性实施例提供的字符识别方法的流程图;
图14是本申请另一个示例性实施例提供的字符识别方法的流程图;
图15是本申请另一个示例性实施例提供的字符识别装置的结构框图;
图16是本申请另一个示例性实施例提供的字符识别装置的结构框图;
图17是本申请一个示例性实施例提供的终端的结构框图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施方式作进一步地详细描述。
首先,对本申请实施例中涉及的名词进行简单介绍:
光学字符识别(Optical Character Recognition,OCR):光学字符识别是通过字符识别将待识别文件中的文字转换成文本格式的过程。通常,OCR过程需要经过待识别文件输入、文字特征提取、比对识别等步骤后才能完成。
相关技术中,字符识别的过程如图1所示,由用户通过终端的摄像头对带有字符的图像进行拍摄后,得到待识别图像110,对该待识别图像110通过预处理模块120进行预处理后,将该预处理后的待识别图像110上传至服务器130,并通过该服务器130对该待识别图像110进行OCR识别,输出得到识别结果140。
也即,在上述相关技术中,识别结果140取决于用户所拍摄的待识别图像110的清晰度,当用户拍摄该待识别图像110时存在抖动现象,或者,光线条件较差,曝光严重时,导致该待识别图像110的清晰度较低,可识别度较低,则该识别结果140的识别准确率也较低,从而需要用户重新对带有字符的图像进行拍摄,并重新进行上传以及OCR识别的步骤,字符识别效率较低。
可选地,本申请提供的字符识别方法可以应用于终端中,也可以应用于终端和服务器交互的实施环境中,当该方法应用于终端中时,终端中包括OCR识别模块,用户在终端中开启摄像头后,确定该终端的稳定参数是否符合预设条件,并将终端的稳定参数符合预设条件时,获取该摄像头采集的n帧图像,对该n帧图像中的至少两帧图像通过OCR识别模块进行字符识别后,根据该至少两帧图像的字符识别结果得到目标字符识别结果。可选地,该终端中安装的操作***可以是iOS操作***,也可以是安卓操作***,本申请实施例对此不加以限定。
本实施例中,以该字符识别方法应用于终端和服务器交互的字符识别***中为例进行说明,如图2所示,该字符识别***中包括终端210、服务器220和通信网络230,其中,服务器220中包括OCR识别模块221;
可选地,终端210中提供有字符识别功能,该字符识别功能可以是终端中安装的应用程序提供的,也可以是终端本身提供的,可选地,该应用程序可以是无线网络管理程序、文档处理应用程序、社交应用程序、金融管理应用程序、音视频应用程序中的至少一种。可选地,用户在终端210中打开摄像头后,确定该终端的稳定参数是否符合预设条件,并将终端的稳定参数符合预设条件时,获取该摄像头采集的n帧图像,将该n帧图像通过通信网络230上传至服务器220。
服务器220通过OCR识别模块221对该n帧图像中的至少两帧图像进行OCR识别后,得到目标识别结果,并将该目标识别将结果发送至终端210进行应用。
示意性的,本申请实施例的应用场景至少包括如下场景中的至少一种:
第一,终端中安装有无线网络管理程序,用户在该无线网络管理应用程序时,打开扫一扫识别功能,终端根据该扫一扫识别功能打开终端摄像头,用户将终端摄像头对准无线名称和无线密码对应的显示区域,终端通过摄像头采集图像识别得到该无线名称和无线密码后,无线网络管理应用程序根据识别得到的无线名称搜索与该无线名称对应的无线网络,并自动输入识别得到的无线密码进行无线网络接入;
第二,终端中安装有备忘录,该备忘录应用程序中包括扫一扫生成提醒事项功能,用户在使用该备忘录时,打开该扫一扫生成提醒事项功能,并对纸质文件中记录的时间以及事件进行扫描,终端通过摄像头采集图像识别得到事件名称以及提醒时刻,从而生成对应的提醒事项。
值得注意的是,上述应用场景仅为示意性的实例,本申请实施例可以应用于任意通过摄像头拍摄实时内容进行字符识别的场景中。
结合上述名词简介和实施环境的说明,对本申请实施例提供的字符识别方法进行说明,图3是本申请一个示例性实施例提供的字符识别方法的流程图,以该方法应用于设置有摄像头的终端中为例进行说明,如图3所示,该方法包括:
步骤301,调用终端的摄像头进行图像采集。
可选地,调用该终端的摄像头进行采集,即开启该摄像头并通过该摄像头进行图像采集。
可选地,当接收摄像头开启操作后,应用程序对该终端的摄像头进行调用,并控制该摄像头持续处于图像采集的状态,也即,摄像头持续对图像进行采集。
可选地,调用该终端的摄像头进行采集为通过应用程序开启终端相机功能时对应的调用关系,该相机功能可以是终端中自带的功能,也可以是终端中安装的应用程序中调用的功能。如:终端中安装有无线网络管理应用程序,该无线网络管理应用程序中包括扫一扫上网功能,该扫一扫上网功能调用终端相机,通过终端的摄像头进行图像采集。示意性的,请参考图4,无线网络管理应用程序的显示界面410中显示有扫一扫上网功能对应的控件411,用户在该控件411上进行选择后,该无线网络管理应用程序调用终端的相机功能并开启终端的摄像头进行图像采集,图像采集过程在采集显示界面420的采集框421中进行显示。
步骤302,获取终端的稳定参数,该稳定参数用于评估终端的稳定程度。
可选地,该稳定参数用于表示该终端是否处于稳定状态,也即,该稳定参数用于表示该终端的抖动程度。可选地,当终端的抖动幅度较大时,则该终端的稳定参数表示该终端的稳定程度较低。
可选地,该终端的稳定参数可以通过终端中的传感器进行测量,如:陀螺仪传感器、重力传感器、加速度传感器、旋转矢量传感器等,示意性的,通过陀螺仪传感器测量终端在预设时长内的旋转角度、通过重力传感器测量终端在预设时长内在重力方向的位移,通过加速度传感器测量终端在预设时长内在个方向上的加速度值。
可选地,该稳定参数包括陀螺仪传感器、重力传感器、加速度传感器、旋转矢量传感器中的至少一种传感器测量得到的参数值。
步骤303,当稳定参数符合预设条件时,获取摄像头采集的n帧图像。
可选地,当稳定参数符合预设条件时,表示该终端处于稳定状态。可选地,该预设条件用于向终端的稳定状态提供稳定性要求进行匹配。
可选地,该稳定参数中包括终端的加速度值,当加速度值小于预设加速度值时,获取该摄像头采集的n帧图像。
可选地,通过终端中的陀螺仪传感器获取该终端的加速度值,和/或,通过终端中的加速度传感器获取该终端的加速度值。
可选地,该加速度值的获取方法包括测量终端在第一轴向的第一加速度,终端在第二轴向的第二加速度,以及终端在第三轴向的第三加速度,并根据第一加速度、第二加速度和第三加速度得到终端的加速度值。示意性的,根据第一加速度和第一轴向、第二加速度和第二轴向、第三加速度和第三轴向计算终端的加速度方向和在该方向上的加速度。
示意性的,以本申请实施例应用于安装有iOS***的终端中为例进行说明,通过该iOS***的Core Motion框架中的加速度仪确定稳定参数是否符合预设条件,通过该加速度仪返回的数据结构如下所示:
其中,typedef struct用于声明变量,double用于表示返回数值的类型,x用于表示终端在x轴的加速度,y用于表示终端在y轴的加速度,z用于表示终端在z轴的加速度,CMAcceleration用于表示加速度传感器返回的数据结构体的名称,也即该CMAcceleration用于表示返回加速度值,其中,x轴、y轴以及z轴的坐标轴方向请参考图5。
可选地,根据加速度仪返回的数据对终端的加速度值进行计算,计算公式请参考如下公式一:
公式一:
其中,aM用于表示终端的加速度值,t为加速度传感器的数据更新间隔,ax用于表示终端在x轴方向的加速度,也即加速度传感器返回的x轴方向的加速度,ay用于表示终端在y轴方向的加速度,也即加速度传感器返回的y轴方向的加速度,az用于表示终端在z轴方向的加速度,也即加速度传感器返回的z轴方向的加速度。计算得到aM的值,并当aM小于预设加速度值时,获取摄像头采集的n帧图像。示意性的,取t为0.1s作为更新间隔,则当aM<0.2时,也即各轴方向上的加速度小于0.02m/s时,确定该终端处于稳定状态,并获取摄像头采集的n帧图像。
步骤304,对n帧图像中的至少两帧图像进行字符识别,并根据至少两帧图像的字符识别结果得到目标字符识别结果。
可选地,该n帧图像为终端处于稳定状态时获取的图像。可选地,在对该n帧图像中的至少两帧图像进行字符识别的过程中,持续获取该终端的稳定参数,并当稳定参数不符合预设条件时,终止对该至少两帧图像的字符识别。可选地,终止对该至少两帧图像的字符识别后,当稳定参数符合预设条件时,重新获取摄像头在稳定参数符合预设条件后采集的n帧图像,并通过重新获取的n帧图像中的至少两帧图像进行字符识别,并根据至少两帧图像的字符识别结果得到目标字符识别结果。
综上所述,本实施例提供的字符识别方法,在对图像进行采集的过程中,通过获取该终端的稳定参数,并根据稳定参数确定终端是否符合预设条件,当终端符合预设条件时,从摄像头采集的图像中获取n帧图像作为进行字符识别的图像,并根据该n帧图像中至少两帧图像的字符识别结果确定目标字符识别结果,由于该n帧图像为终端处于稳定状态时获取的图像,确保该n帧图像的清晰度,以及提高了字符识别的准确率和效率。
在一个可选的实施例中,根据至少两帧图像的字符识别结果确定目标字符识别结果时,需要根据该两帧图像的字符识别结果之间的相似度进行确定,图6是本申请另一个示例性实施例提供的字符识别方法的流程图,以该方法应用于设置有摄像头的终端中为例进行说明,如图6所示,该方法包括:
步骤601,调用终端的摄像头进行图像采集。
可选地,调用该终端的摄像头进行采集,即开启该摄像头并通过该摄像头进行图像采集。
可选地,当接收摄像头开启操作后,应用程序对该终端的摄像头进行调用,并控制该摄像头持续处于图像采集的状态,也即,摄像头持续对图像进行采集。
步骤602,获取终端的稳定参数,该稳定参数用于评估终端的稳定程度。
可选地,该稳定参数用于表示该终端是否处于稳定状态,也即,该稳定参数用于表示该终端的抖动程度。可选地,当终端的抖动幅度较大时,则该终端的稳定参数表示该终端的稳定程度较低。
可选地,该稳定参数的获取方式在上述步骤302中已进行了详细说明,此处不再赘述。
步骤603,当稳定参数符合预设条件时,获取摄像头采集的n帧图像。
可选地,当稳定参数符合预设条件时,表示该终端处于稳定状态。
步骤604,对n帧图像中的第一图像进行字符识别得到第一字符识别结果,并对n帧图像中的第二图像进行字符识别得到第二字符识别结果,其中,第一字符识别对应有第一置信度,第二字符识别结果对应有第二置信度。
可选地,该第一图像和第二图像为摄像头采集的n帧图像中的图像,且该第一图像和第二图像可以是相邻的两帧图像,也可以是相隔预设帧图像的两帧图像,如:第一图像为n帧图像中的第一帧图像,第二图像为n帧图像中的第15帧图像。
可选地,该字符识别的过程是通过神经网络模型实现的,可选地在对字符进行识别的过程中,可以首先对字符区域进行检测,并根据检测得到的字符区域,对字符区域中的字符进行识别。可选地,将第一图像输入神经网络模型后,通过神经网络模型提取该第一图像的图像特征,并输出得到该第一图像中的字符。
可选地,该神经网络模型包括卷积神经网络(Convolutional Neural Networks,CNN)、循环神经网络(Recurrent neural Network,RNN)、前馈神经网络以及后馈神经网络中的至少一种。
可选地,该神经网络模型是通过样本字符进行训练后得到的模型,该样本字符为标注为实际字符结果的数据,可选地,该样本字符还标注有字符对应的类型,如:样本字符中包括“名称”、“Abc”、“密码”、“14546511”,其中,每个样本字符对应标注有字符内容,且“名称”对应标注有类型“标签”,“Abc”对应标注有类型“内容”,“密码”对应标注有类型“标签”,以及“14546511”对应标注有类型“内容”,可选地,根据样本字符的识别结果以及样本字符的实际字符内容,还可以得到每次识别结果的置信度,根据该置信度对神经网络模型进行训练,从而该神经网络模型在对图像进行字符识别时,还可以输出得到每次识别结果的置信度,可选地,神经网络模型在对置信度进行确定时,可以结合图像的图像要素进行确定,如:图像对比度、图像白平衡、图像清晰度等。
示意性的,该字符识别结果如下:
其中,struct用于声明返回值是名为OCRItem的结构体,label用于表示识别结果的标签,如:车牌识别中返回值会带有“Car”,便于接收端判断识别结果的类型,optional用于表示该返回值为可选的,value用于表示识别内容,rect用于表示该标签和内容在图像中的坐标,根据该坐标可以对该图像中的内容进行多次识别,confidence用于表示识别结果的置信度,该置信度的值越高表示识别结果的准确率越高。可选地,单次识别结果包括一个OCRItem数组,其中包括多个OCRItem,分别代表图像不同文字的识别结果。
可选地,对该第一图像和第二图像进行字符识别的过程可以先后执行,也可以同时执行。
步骤605,当第一字符识别结果和第二字符识别结果的相似度达到第一相似度要求时,将第一置信度和第二置信度中,较高的置信度对应的高置信字符识别结果作为目标字符识别结果。
示意性的,请参考图7,根据摄像头采集的第一图像710得到第一识别结果711,根据摄像头采集的第二图像720得到第二识别结果721,对该第一识别结果711和第二识别结果721进行相似度730的判断。
可选地,该第一字符识别结果和第二字符识别结果之间的相似度可以通过特征距离计算方式进行计算,如:欧氏距离计算方法、马氏距离计算方法等,可选地,该第一字符识别结果和第二字符识别结果之间的相似度还可以通过字符表的方式进行计算。
可选地,该字符表的方式包括如下过程:
1、根据第一字符识别结果和第二字符识别结果中的字符生成字符表;
可选地,根据第一字符识别结果中的字符与第二字符识别结果中的字符生成互不重复的字符表,示意性的,第一字符识别结果包括“astring”,第二字符识别结果中包括“bstringx”,则该字符表A包括[‘a’,‘s’,‘t’,‘r’,‘i’,‘n’,‘g’,‘x’,‘b’]。
2、将第一字符识别结果中的字符与字符表进行匹配,得到第一词频矩阵;
可选地,结合该字符表,将第一字符识别结果中的字符与该字符表进行匹配,得到字符表中每个字符在第一字符识别结果中的出现次数,即为该第一字符识别结果对应的第一词频矩阵。示意性的,结合上述字符表A以及上述第一字符识别结果,得到第一词频矩阵[1 1 1 1 1 1 1 0 0],即字母a出现1次,字母s出现1次,即字母t出现1次,即字母r出现1次,即字母i出现1次,即字母n出现1次,即字母g出现1次,即字母x出现0次,即字母b出现0次。
3、将第二字符识别结果中的字符与字符表进行匹配,得到第二词频矩阵;
可选地,结合该字符表,将第二字符识别结果中的字符与该字符表进行匹配,得到字符表中每个字符在第二字符识别结果中的出现次数,即为该第二字符识别结果对应的第二词频矩阵。示意性的,结合上述字符表A以及上述第二字符识别结果,得到第二词频矩阵[0 1 1 1 1 1 1 1 1]。
4、确定第一词频矩阵和第二词频矩阵之间的相似度,作为第一字符识别结果和第二字符识别结果之间的相似度。
可选地,该第一词频矩阵和第二词频矩阵之间的相似度,可以通过编辑距离算法或杰卡德系数算法进行计算。
其中,编辑距离算法是通过给定两个字符串s1和s2,通过计算将s1转换为s2的最小编辑操作数从而得到该s1和s2之间的距离的方法。
针对杰德卡系数算法,对于集合A和集合B的交集元素,该交集元素在集合A和集合B的并集中所占的比例,即为两个集合的杰卡德相似系数,示意性的,该杰德卡系数算法对应的计算公式如以下公式二所示:
公式二:
其中,A表示集合A,B表示集合B,dJ(A,B)以及1-J(A,B)表示集合A和集合B之间的相似度,则将上述第一词频矩阵和第二词频矩阵作为集合A和集合B代入上述公式二,得到该第一词频矩阵和第二词频矩阵之间的相似度。
可选地,当第一字符识别结果和第二字符识别结果的相似度达到第一相似度要求时,确定第一置信度和第二置信度中较高的置信度,并将该较高的置信度对应的高置信字符识别结果作为目标字符识别结果。示意性的,请参考图8,根据摄像头采集的第一图像810得到第一识别结果811,根据摄像头采集的第二图像820得到第二识别结果821,对该第一识别结果811和第二识别结果821进行相似度830的判断,得到的相似度大于第一相似度要求,则确定置信度高的识别结果840作为目标识别结果。示意性的,第一字符识别结果的置信度为82,第二字符识别结果的置信度为78,则当第一字符识别结果与第二字符识别结果的相似度大于90%(第一相似度条件为相似度大于90%)时,将高置信字符识别结果,也即第一字符识别结果作为目标字符识别结果。
步骤606,当第一字符识别结果与第二字符识别结果的相似度未达到第一相似度要求时,获取摄像头采集的第三图像。
可选地,该第三图像为判断第一字符识别结果与第二字符识别结果的相似度未达到第一相似度要求后,通过摄像头所采集的图像;或,该第三图像为上述摄像头采集的n帧图像中,除第一图像和第二图像之外的另一帧图像,可选地,该第三图像为在该第二图像之后进行采集的图像。
步骤607,对第三图像进行字符识别,得到第三字符识别结果。
可选地,对该第三图像进行字符识别的过程请参考上述步骤604中对第一图像和第二图像进行识别的过程,此处不再赘述。
步骤608,当高置信字符识别结果与第三字符识别结果的相似度达到第二相似度要求时,从第三字符识别结果和高置信字符识别结果中确定目标字符识别结果。
可选地,该第二相似度要求与第一相似度要求可以相同,也可以在与第一相似度要求不同,如,第一相似度要求为要求第一字符识别结果和第二字符识别结果的相似度大于90%,第二相似度要求为第三字符识别结果和高置信字符识别结果的相似度大于70%。
示意性的,请参考图9,根据摄像头采集的第一图像910得到第一识别结果911,根据摄像头采集的第二图像920得到第二识别结果921,对该第一识别结果911和第二识别结果921进行相似度930的判断,得到的相似度小于第一相似度要求,则获取摄像头采集的第三图像940并得到第三识别结果941,将第三识别结果941与第一识别结果911和第二识别结果921中置信度较高的识别结果950进行相似度960的判断。
可选地,从第三字符识别结果和高置信字符识别结果中确定目标字符识别结果时,可以从第三字符识别结果和高置信字符识别结果中确定置信度较高的字符识别结果作为目标字符识别结果,也可以直接将第三字符识别结果作为目标字符识别结果。
可选地,当高置信字符识别结果与第三字符识别结果的相似度未达到第二相似度要求时,重复上述步骤601至步骤608,重新获取摄像头采集的n帧图像并进行字符识别。
综上所述,本实施例提供的字符识别方法,在对图像进行采集的过程中,通过获取该终端的稳定参数,并根据稳定参数确定终端是否符合预设条件,当终端符合预设条件时,从摄像头采集的图像中获取n帧图像作为进行字符识别的图像,并根据该n帧图像中至少两帧图像的字符识别结果确定目标字符识别结果,由于该n帧图像为终端处于稳定状态时获取的图像,确保该n帧图像的清晰度,以及提高了字符识别的准确率和效率。
本实施例提供的方法,通过判断第一字符识别结果和第二字符识别结果之间的相似度,并当第一字符识别结果和第二字符识别结果之间的相似度大于第一相似度要求时,将置信度较高的识别结果作为目标字符识别结果,确保在终端处于稳定的状态进行字符识别,提高了字符识别准确度。
本实施例提供的方法,当第一字符识别结果和第二字符识别结果之间的相似度低于第一相似度要求时,重新获取第三图像并对第三图像进行字符识别,当第一字符识别结果和第二字符识别结果中置信度较高的字符识别结果,与第三字符识别结果之间的相似度高度第二相似度要求时,确定目标字符识别结果,提高了字符识别准确度。
本实施例提供的方法,由于第三字符识别结果为第三图像的字符识别结果,该第三图像为终端处于稳定状态后期采集的图像,也即采集该第三图像时,终端的稳定性较好,故将第三字符识别结果作为目标字符识别结果,提高了字符识别准确度。
在一个可选的实施例中,上述方案可以应用于安装有无线管理应用程序的终端中,该目标字符识别结果中包括识别得到的无线网络名称和无线网络密码,图10是本申请另一个示例性实施例提供的字符识别方法的流程图,以该方法应用于设置有摄像头的终端中为例进行说明,如图10所示,该方法包括:
步骤1011,调用终端的摄像头进行图像采集。
可选地,调用该终端的摄像头进行采集,即开启该摄像头并通过该摄像头进行图像采集。
可选地,该无线管理应用程序根据相机功能调用终端中的摄像头进行图像采集。
步骤1012,获取终端的稳定参数,该稳定参数用于评估终端的稳定程度。
可选地,该稳定参数用于表示该终端是否处于稳定状态,也即,该稳定参数用于表示该终端的抖动程度。可选地,当终端的抖动幅度较大时,则该终端的稳定参数表示该终端的稳定程度较低。
可选地,该稳定参数的获取方式在上述步骤302中已进行了详细说明,此处不再赘述。
步骤1013,当稳定参数符合预设条件时,获取摄像头采集的n帧图像。
可选地,当稳定参数符合预设条件时,表示该终端处于稳定状态。
步骤1014,对n帧图像中的至少两帧图像进行字符识别,并根据至少两帧图像的字符识别结果得到目标字符识别结果,该目标字符识别结果中包括无线网络名称和无线网络密码。
可选地,该目标字符识别结果中针对每一部分的识别结果对应的字符类型,如:针对无线网络名称,对应有标签名称,该标签名称对应的内容为“Abc”,即该无线网络名称为“Abc”;针对无线网络密码,对应有标签密码,该标签面对应的内容为“15489486163”,则该无线网络“Abc”对应的密码为“15489486163”。
步骤1015,根据无线网络名称搜索与无线网络名称对应的目标无线网络。
可选地,该无线管理应用程序能够对信号范围内的无线网络进行搜索,根据该识别得到的无线网络名称,在信号范围内的无线网络中搜索名称与该无线网络名称一致的无线网络作为目标无线网络。
步骤1016,通过无线网络密码接入目标无线网络。
可选地,当在信号范围内搜索到与该无线网络名称对应的目标无线网络时,在接入该目标无线网络的过程中根据识别得到的无线网络密码自动进行密码输入,从而接入该目标无线网络。
示意性的,请参考图11,无线网络管理应用程序的显示界面1110中显示有扫一扫上网功能对应的控件1111,用户在该控件1111上进行选择后,该无线网络管理应用程序调用终端的相机功能并开启终端的摄像头进行图像采集,图像采集过程在采集显示界面1120的采集框1121中进行显示。通过对采集的图像进行字符识别,得到目标字符识别结果1130,其中包括无线网络名称“Abc”,以及无线网络密码“14564616”,通过无线网络管理应用程序搜索信号范围内的无线网络表1140,得到名称为“Abc”的目标无线网络1141,并在接入该目标无线网络1141的过程中自动输入密码“14564616”,从而接入该目标无线网络1141“Abc”。
综上所述,本实施例提供的字符识别方法,在对图像进行采集的过程中,通过获取该终端的稳定参数,并根据稳定参数确定终端是否符合预设条件,当终端符合预设条件时,从摄像头采集的图像中获取n帧图像作为进行字符识别的图像,并根据该n帧图像中至少两帧图像的字符识别结果确定目标字符识别结果,由于该n帧图像为终端处于稳定状态时获取的图像,确保该n帧图像的清晰度,以及提高了字符识别的准确率和效率。
本实施例提供的方法,通过对无线网络名称和无线网络密码进行字符识别,从而通过自动搜索无线网络以及自动输入密码实现对无线网络的接入,提高了接入无线网络的便捷程度。
示意性的,请参考图12,本申请实施例中,通过将第一图像1210对应的第一识别结果1211、第二图像1220对应的第二识别结果1221,以及第三图像1230对应的第三识别结果1231进行整合,得到整合结果1240,并输出该整合结果1240在界面1250中进行展示。
示意性的,该将第一识别结果1211、第二识别结果1221和第三识别结果1231进行整合的过程请参考图13所示的字符识别方法的流程图,如图13所示,该方法包括:
步骤1301,用户进入扫一扫界面。
可选地,该扫一扫界面用于开启终端的摄像头,并通过该摄像头进行图像采集。
步骤1302,判断用户设备是否处于稳定状态。
可选地,通过用户设备中的加速度传感器判断该终端是否处于稳定状态。可选地,该判断的具体过程在上述步骤303中已进行了详细说明,此处不再赘述。
步骤1303,当用户设备处于稳定状态,开始扫描。
否则,持续判断用户设备是否处于稳定状态。
可选地,该开始扫描过程即获取该终端摄像头采集的图像的过程。
步骤1304,获取第一图像和第二图像。
可选地,该第二图像为该第一图像x帧之后采集的图像,或,该第二图像为第一图像之后一帧图像。
步骤1305,判断第一图像是否识别成功。
可选地,判断该第一图像的字符识别结果是否成功,可选地,根据该字符识别结果的置信度是否达到预设置信度判断该第一图像是否识别成功,或,根据第一图像的清晰度判断该第一图像是否识别成功。
步骤1306,当第一图像识别不成功时,重新获取第一图像。
步骤1307,当第一图像识别成功时,判断第二图像是否识别成功。
可选地,判断该第二图像的字符识别结果是否成功,可选地,根据该字符识别结果的置信度是否达到预设置信度判断该第二图像是否识别成功,或,根据第二图像的清晰度判断该第一图像是否识别成功。
步骤1308,当第二图像识别成功时,判断第一图像识别结果和第二图像识别结果的相似度是否大于90%。
可选地,该相似度大于90%为上述第一相似度要求,可选地,该第一相似度要求的数值可以由技术人员进行调整。
步骤1309,当相似度是否大于90%时,输出置信度较高的识别结果。
可选地,该置信度为第一图像识别结果和第二图像识别结果中附带的参数。
步骤1310,当相似度不大于90%时,确定置信度较高的识别结果。
步骤1311,进入额外比较流程。
可选地,该额外比较流程用于通过第三图像进行比较。
步骤1312,获取当前图像作为第三图像。
可选地,该当前图像为当前摄像头所采集的图像,也即额外比较流程开始时,摄像头所采集的图像。
步骤1313,判断第三图像识别是否成功。
可选地,判断该第三图像的字符识别结果是否成功,可选地,根据该字符识别结果的置信度是否达到预设置信度判断该第三图像是否识别成功,或,根据第三图像的清晰度判断该第一图像是否识别成功。
步骤1314,当第三图像识别成功时,判断第三图像识别结果与置信度较高的识别结果之间的相似度是否大于70%。
步骤1315,当第三图像识别不成功时,结束额外比较流程,并丢弃识别结果,重新开始扫描。
步骤1316,当第三图像识别结果与置信度较高的识别结果之间的相似度大于70%,输出第三图像的第三图像识别结果。
步骤1317,输出结果。
在一个可选的实施例中,上述方案可以应用于安装有备忘录的终端中,该目标字符识别结果中包括识别得到的事件名称以及提醒时刻,图14是本申请另一个示例性实施例提供的字符识别方法的流程图,以该方法应用于设置有摄像头的终端中为例进行说明,如图14所示,该方法包括:
步骤1411,调用终端的摄像头进行图像采集。
可选地,调用该终端的摄像头进行采集,即开启该摄像头并通过该摄像头进行图像采集。
可选地,该备忘录根据相机功能调用终端的摄像头进行图像采集。
步骤1412,获取终端的稳定参数,该稳定参数用于评估终端的稳定程度。
可选地,该稳定参数用于表示该终端是否处于稳定状态,也即,该稳定参数用于表示该终端的抖动程度。可选地,当终端的抖动幅度较大时,则该终端的稳定参数表示该终端的稳定程度较低。
可选地,该稳定参数的获取方式在上述步骤302中已进行了详细说明,此处不再赘述。
步骤1413,当稳定参数符合预设条件时,获取摄像头采集的n帧图像。
可选地,当稳定参数符合预设条件时,表示该终端处于稳定状态。
步骤1414,对n帧图像中的至少两帧图像进行字符识别,并根据至少两帧图像的字符识别结果得到目标字符识别结果,该目标字符识别结果中包括事件名称以及提醒时刻。
可选地,该目标字符识别结果中针对每一部分的识别结果对应的字符类型,如:针对事件名称,对应有标签名称,该标签名称对应的内容为“去图书馆”,即该事件名称为“去图书馆”;针对提醒时刻,对应有标签时刻,该标签面对应的内容为“4.12 9:00”,则该事件名称“去图书馆”对应的提醒时刻为4月12日9:00。
步骤1415,根据事件名称以及提醒时刻创建对应的提醒事项。
可选地,在备忘录中自动创建新提醒事项,并将该新提醒事项对应的名称设置为上述事件名称,以及将该新提醒事项对应的提醒时刻设置为上述提醒时刻。
图15是本申请一个示例性实施例提供的字符识别装置的结构框图,以该装置应用于设置有摄像头的终端中,如图15所示,该装置包括:调用模块1510、获取模块1520以及识别模块1530;
调用模块1510,用于调用所述终端的所述摄像头进行图像采集;
获取模块1520,用于获取所述终端的稳定参数,所述稳定参数用于评估所述终端的稳定程度;
所述获取模块1520,还用于当所述稳定参数符合预设条件时,获取所述摄像头采集的n帧图像,n≥2;
识别模块1530,用于对所述n帧图像中的至少两帧图像进行字符识别,并根据所述至少两帧图像的字符识别结果得到目标字符识别结果。
在一个可选的实施例中,所述稳定参数包括所述终端的加速度值;
所述获取模块1520,还用于通过所述终端中的陀螺仪传感器获取所述终端的所述加速度值;和/或,通过所述终端中的加速度传感器获取所述终端的所述加速度值。
在一个可选的实施例中,所述获取模块1520,还用于当所述加速度值小于预设加速度值时,获取所述摄像头采集的所述n帧图像。
在一个可选的实施例中,如图16所示,该装置,还包括:
测量模块1540,用于测量所述终端在第一轴向的第一加速度、所述终端在第二轴向的第二加速度以及所述终端在第三轴向的第三加速度;根据所述第一加速度、所述第二加速度以及所述第三加速度得到所述终端的所述加速度值。
在一个可选的实施例中,所述识别模块1530,还用于对所述n帧图像中的第一图像进行所述字符识别得到第一字符识别结果,并对所述n帧图像中的第二图像进行所述字符识别得到第二字符识别结果。
在一个可选的实施例中,所述第一字符识别结果对应有第一置信度,所述第二字符识别结果对应有第二置信度;
所述识别模块1530,还用于当所述第一字符识别结果和所述第二字符识别结果的相似度达到第一相似度要求时,将所述第一置信度和所述第二置信度中,较高的置信度对应的高置信字符识别结果作为所述目标字符识别结果。
在一个可选的实施例中,所述获取模块1520,还用于当所述第一字符识别结果和所述第二字符识别结果的相似度未达到所述第一相似度要求时,获取所述摄像头采集的第三图像;
所述识别模块1530,还用于对所述第三图像进行所述字符识别,得到第三字符识别结果;当所述高置信字符识别结果与所述第三字符识别结果的相似度达到第二相似度要求时,从所述第三字符识别结果和所述高置信字符识别结果中确定所述目标字符识别结果。
在一个可选的实施例中,所述识别模块1530,还用于从所述第三字符识别结果和所述高置信字符识别结果中确定所述置信度较高的字符识别结果作为所述目标字符识别结果;或,将所述第三字符识别结果作为所述目标字符识别结果。
在一个可选的实施例中,所述装置,还包括:
生成模块1550,用于根据所述第一字符识别结果和所述第二字符识别结果中的字符生成字符表;
匹配模块1560,用于将所述第一字符识别结果中的字符与所述字符表进行匹配,得到第一词频矩阵;将所述第二字符识别结果中的字符与所述字符表进行匹配,得到第二词频矩阵;确定所述第一词频矩阵和所述第二词频矩阵之间的相似度,作为所述第一字符识别结果和所述第二字符识别结果之间的相似度。
在一个可选的实施例中,所述装置应用于安装有无线管理应用程序的终端中,所述目标字符识别结果包括识别得到的无线网络名称和无线网络密码;
所述装置,还包括:
接入模块1570,用于根据所述无线网络名称搜索与所述无线网络名称对应的目标无线网络;通过所述无线网络密码接入所述目标无线网络。
综上所述,本实施例提供的字符识别装置,在对图像进行采集的过程中,通过获取该终端的稳定参数,并根据稳定参数确定终端是否符合预设条件,当终端符合预设条件时,从摄像头采集的图像中获取n帧图像作为进行字符识别的图像,并根据该n帧图像中至少两帧图像的字符识别结果确定目标字符识别结果,由于该n帧图像为终端处于稳定状态时获取的图像,确保该n帧图像的清晰度,以及提高了字符识别的准确率和效率。
需要说明的是:上述实施例提供的字符识别装置,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将设备的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的字符识别装置与字符识别方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
图17示出了本发明一个示例性实施例提供的终端1700的结构框图。该终端1700可以是:智能手机、平板电脑、MP3播放器(Moving Picture Experts Group Audio LayerIII,动态影像专家压缩标准音频层面3)、MP4(Moving Picture Experts Group AudioLayer IV,动态影像专家压缩标准音频层面4)播放器、笔记本电脑或台式电脑。终端1700还可能被称为用户设备、便携式终端、膝上型终端、台式终端等其他名称。
通常,终端1700包括有:处理器1701和存储器1702。
处理器1701可以包括一个或多个处理核心,比如4核心处理器、8核心处理器等。处理器1701可以采用DSP(Digital Signal Processing,数字信号处理)、FPGA(Field-Programmable Gate Array,现场可编程门阵列)、PLA(Programmable Logic Array,可编程逻辑阵列)中的至少一种硬件形式来实现。处理器1701也可以包括主处理器和协处理器,主处理器是用于对在唤醒状态下的数据进行处理的处理器,也称CPU(Central ProcessingUnit,中央处理器);协处理器是用于对在待机状态下的数据进行处理的低功耗处理器。在一些实施例中,处理器1701可以在集成有GPU(Graphics Processing Unit,图像处理器),GPU用于负责显示屏所需要显示的内容的渲染和绘制。一些实施例中,处理器1701还可以包括AI(Artificial Intelligence,人工智能)处理器,该AI处理器用于处理有关机器学习的计算操作。
存储器1702可以包括一个或多个计算机可读存储介质,该计算机可读存储介质可以是非暂态的。存储器1702还可包括高速随机存取存储器,以及非易失性存储器,比如一个或多个磁盘存储设备、闪存存储设备。在一些实施例中,存储器1702中的非暂态的计算机可读存储介质用于存储至少一个指令,该至少一个指令用于被处理器1701所执行以实现本申请中方法实施例提供的字符识别方法。
在一些实施例中,终端1700还可选包括有:***设备接口1703和至少一个***设备。处理器1701、存储器1702和***设备接口1703之间可以通过总线或信号线相连。各个***设备可以通过总线、信号线或电路板与***设备接口1703相连。具体地,***设备包括:射频电路1704、触摸显示屏1705、摄像头1706、音频电路1707、定位组件1708和电源1709中的至少一种。
***设备接口1703可被用于将I/O(Input/Output,输入/输出)相关的至少一个***设备连接到处理器1701和存储器1702。在一些实施例中,处理器1701、存储器1702和***设备接口1703被集成在同一芯片或电路板上;在一些其他实施例中,处理器1701、存储器1702和***设备接口1703中的任意一个或两个可以在单独的芯片或电路板上实现,本实施例对此不加以限定。
射频电路1704用于接收和发射RF(Radio Frequency,射频)信号,也称电磁信号。射频电路1704通过电磁信号与通信网络以及其他通信设备进行通信。射频电路1704将电信号转换为电磁信号进行发送,或者,将接收到的电磁信号转换为电信号。可选地,射频电路1704包括:天线***、RF收发器、一个或多个放大器、调谐器、振荡器、数字信号处理器、编解码芯片组、用户身份模块卡等等。射频电路1704可以通过至少一种无线通信协议来与其它终端进行通信。该无线通信协议包括但不限于:万维网、城域网、内联网、各代移动通信网络(2G、3G、4G及5G)、无线局域网和/或WiFi(Wireless Fidelity,无线保真)网络。在一些实施例中,射频电路1704还可以包括NFC(Near Field Communication,近距离无线通信)有关的电路,本申请对此不加以限定。
显示屏1705用于显示UI(UserInterface,用户界面)。该UI可以包括图形、文本、图标、视频及其它们的任意组合。当显示屏1705是触摸显示屏时,显示屏1705还具有采集在显示屏1705的表面或表面上方的触摸信号的能力。该触摸信号可以作为控制信号输入至处理器1701进行处理。此时,显示屏1705还可以用于提供虚拟按钮和/或虚拟键盘,也称软按钮和/或软键盘。在一些实施例中,显示屏1705可以为一个,设置终端1700的前面板;在另一些实施例中,显示屏1705可以为至少两个,分别设置在终端1700的不同表面或呈折叠设计;在再一些实施例中,显示屏1705可以是柔性显示屏,设置在终端1700的弯曲表面上或折叠面上。甚至,显示屏1705还可以设置成非矩形的不规则图形,也即异形屏。显示屏1705可以采用LCD(Liquid Crystal Display,液晶显示屏)、OLED(Organic Light-Emitting Diode,有机发光二极管)等材质制备。
摄像头组件1706用于采集图像或视频。可选地,摄像头组件1706包括前置摄像头和后置摄像头。通常,前置摄像头设置在终端的前面板,后置摄像头设置在终端的背面。在一些实施例中,后置摄像头为至少两个,分别为主摄像头、景深摄像头、广角摄像头、长焦摄像头中的任意一种,以实现主摄像头和景深摄像头融合实现背景虚化功能、主摄像头和广角摄像头融合实现全景拍摄以及VR(Virtual Reality,虚拟现实)拍摄功能或者其它融合拍摄功能。在一些实施例中,摄像头组件1706还可以包括闪光灯。闪光灯可以是单色温闪光灯,也可以是双色温闪光灯。双色温闪光灯是指暖光闪光灯和冷光闪光灯的组合,可以用于不同色温下的光线补偿。
音频电路1707可以包括麦克风和扬声器。麦克风用于采集用户及环境的声波,并将声波转换为电信号输入至处理器1701进行处理,或者输入至射频电路1704以实现语音通信。出于立体声采集或降噪的目的,麦克风可以为多个,分别设置在终端1700的不同部位。麦克风还可以是阵列麦克风或全向采集型麦克风。扬声器则用于将来自处理器1701或射频电路1704的电信号转换为声波。扬声器可以是传统的薄膜扬声器,也可以是压电陶瓷扬声器。当扬声器是压电陶瓷扬声器时,不仅可以将电信号转换为人类可听见的声波,也可以将电信号转换为人类听不见的声波以进行测距等用途。在一些实施例中,音频电路1707还可以包括耳机插孔。
定位组件1708用于定位终端1700的当前地理位置,以实现导航或LBS(LocationBased Service,基于位置的服务)。定位组件1708可以是基于美国的GPS(GlobalPositioning System,全球定位***)、中国的北斗***或俄罗斯的伽利略***的定位组件。
电源1709用于为终端1700中的各个组件进行供电。电源1709可以是交流电、直流电、一次性电池或可充电电池。当电源1709包括可充电电池时,该可充电电池可以是有线充电电池或无线充电电池。有线充电电池是通过有线线路充电的电池,无线充电电池是通过无线线圈充电的电池。该可充电电池还可以用于支持快充技术。
在一些实施例中,终端1700还包括有一个或多个传感器1710。该一个或多个传感器1710包括但不限于:加速度传感器1711、陀螺仪传感器1712、压力传感器1713、指纹传感器1714、光学传感器1715以及接近传感器1716。
加速度传感器1711可以检测以终端1700建立的坐标系的三个坐标轴上的加速度大小。比如,加速度传感器1711可以用于检测重力加速度在三个坐标轴上的分量。处理器1701可以根据加速度传感器1711采集的重力加速度信号,控制触摸显示屏1705以横向视图或纵向视图进行用户界面的显示。加速度传感器1711还可以用于游戏或者用户的运动数据的采集。
陀螺仪传感器1712可以检测终端1700的机体方向及转动角度,陀螺仪传感器1712可以与加速度传感器1711协同采集用户对终端1700的3D动作。处理器1701根据陀螺仪传感器1712采集的数据,可以实现如下功能:动作感应(比如根据用户的倾斜操作来改变UI)、拍摄时的图像稳定、游戏控制以及惯性导航。
压力传感器1713可以设置在终端1700的侧边框和/或触摸显示屏1705的下层。当压力传感器1713设置在终端1700的侧边框时,可以检测用户对终端1700的握持信号,由处理器1701根据压力传感器1713采集的握持信号进行左右手识别或快捷操作。当压力传感器1713设置在触摸显示屏1705的下层时,由处理器1701根据用户对触摸显示屏1705的压力操作,实现对UI界面上的可操作性控件进行控制。可操作性控件包括按钮控件、滚动条控件、图标控件、菜单控件中的至少一种。
指纹传感器1714用于采集用户的指纹,由处理器1701根据指纹传感器1714采集到的指纹识别用户的身份,或者,由指纹传感器1714根据采集到的指纹识别用户的身份。在识别出用户的身份为可信身份时,由处理器1701授权该用户执行相关的敏感操作,该敏感操作包括解锁屏幕、查看加密信息、下载软件、支付及更改设置等。指纹传感器1714可以被设置终端1700的正面、背面或侧面。当终端1700上设置有物理按键或厂商Logo时,指纹传感器1714可以与物理按键或厂商Logo集成在一起。
光学传感器1715用于采集环境光强度。在一个实施例中,处理器1701可以根据光学传感器1715采集的环境光强度,控制触摸显示屏1705的显示亮度。具体地,当环境光强度较高时,调高触摸显示屏1705的显示亮度;当环境光强度较低时,调低触摸显示屏1705的显示亮度。在另一个实施例中,处理器1701还可以根据光学传感器1715采集的环境光强度,动态调整摄像头组件1706的拍摄参数。
接近传感器1716,也称距离传感器,通常设置在终端1700的前面板。接近传感器1716用于采集用户与终端1700的正面之间的距离。在一个实施例中,当接近传感器1716检测到用户与终端1700的正面之间的距离逐渐变小时,由处理器1701控制触摸显示屏1705从亮屏状态切换为息屏状态;当接近传感器1716检测到用户与终端1700的正面之间的距离逐渐变大时,由处理器1701控制触摸显示屏1705从息屏状态切换为亮屏状态。
本领域技术人员可以理解,图17中示出的结构并不构成对终端1700的限定,可以包括比图示更多或更少的组件,或者组合某些组件,或者采用不同的组件布置。
本申请实施例还提供一种计算机设备,该计算机设备包括存储器和处理器,存储器中存储有至少一条指令、至少一段程序、代码集或指令集,至少一条指令、至少一段程序、代码集或指令集由处理器加载并实现上述字符识别方法。
本申请实施例还提供一种计算机可读存储介质,该可读存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现上述字符识别方法。
本申请还提供了一种计算机程序产品,当计算机程序产品在计算机上运行时,使得计算机执行上述各个方法实施例提供的上述字符识别方法。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,该计算机可读存储介质可以是上述实施例中的存储器中所包含的计算机可读存储介质;也可以是单独存在,未装配入终端中的计算机可读存储介质。该计算机可读存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现如上述字符识别方法。
可选地,该计算机可读存储介质可以包括:只读存储器(ROM,Read Only Memory)、随机存取记忆体(RAM,Random Access Memory)、固态硬盘(SSD,Solid State Drives)或光盘等。其中,随机存取记忆体可以包括电阻式随机存取记忆体(ReRAM,Resistance RandomAccess Memory)和动态随机存取存储器(DRAM,Dynamic Random Access Memory)。上述本申请实施例序号仅仅为了描述,不代表实施例的优劣。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
以上所述仅为本申请的较佳实施例,并不用以限制本申请,凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。
Claims (13)
1.一种字符识别方法,其特征在于,应用于设置有摄像头的终端中,所述方法包括:
调用所述终端的所述摄像头进行图像采集;
获取所述终端的稳定参数,所述稳定参数用于评估所述终端的稳定程度;
当所述稳定参数符合预设条件时,获取所述摄像头采集的n帧图像,n≥2;
对所述n帧图像中的至少两帧图像进行字符识别,并根据所述至少两帧图像的字符识别结果得到目标字符识别结果。
2.根据权利要求1所述的方法,其特征在于,所述稳定参数包括所述终端的加速度值;
所述获取所述终端的稳定参数,包括:
通过所述终端中的陀螺仪传感器获取所述终端的所述加速度值;
和/或,
通过所述终端中的加速度传感器获取所述终端的所述加速度值。
3.根据权利要求2所述的方法,其特征在于,所述当所述稳定参数符合预设条件时,获取所述摄像头采集的n帧图像,包括:
当所述加速度值小于预设加速度值时,获取所述摄像头采集的所述n帧图像。
4.根据权利要求2所述的方法,其特征在于,所述加速度值的测量方法包括:
测量所述终端在第一轴向的第一加速度、所述终端在第二轴向的第二加速度以及所述终端在第三轴向的第三加速度;
根据所述第一加速度、所述第二加速度以及所述第三加速度得到所述终端的所述加速度值。
5.根据权利要求1至4任一所述的方法,其特征在于,所述对所述n帧图像中的至少两帧图像进行字符识别,包括:
对所述n帧图像中的第一图像进行所述字符识别得到第一字符识别结果;
对所述n帧图像中的第二图像进行所述字符识别得到第二字符识别结果。
6.根据权利要求5所述的方法,其特征在于,所述第一字符识别结果对应有第一置信度,所述第二字符识别结果对应有第二置信度;
所述根据所述至少两帧图像的字符识别结果得到目标字符识别结果,包括:
当所述第一字符识别结果和所述第二字符识别结果的相似度达到第一相似度要求时,将所述第一置信度和所述第二置信度中,较高的置信度对应的高置信字符识别结果作为所述目标字符识别结果。
7.根据权利要求6所述的方法,其特征在于,所述方法还包括:
当所述第一字符识别结果和所述第二字符识别结果的相似度未达到所述第一相似度要求时,获取所述摄像头采集的第三图像;
对所述第三图像进行所述字符识别,得到第三字符识别结果;
当所述高置信字符识别结果与所述第三字符识别结果的相似度达到第二相似度要求时,从所述第三字符识别结果和所述高置信字符识别结果中确定所述目标字符识别结果。
8.根据权利要求7所述的方法,其特征在于,所述从所述第三字符识别结果和所述高置信字符识别结果中确定所述目标字符识别结果,包括:
从所述第三字符识别结果和所述高置信字符识别结果中确定所述置信度较高的字符识别结果作为所述目标字符识别结果;
或,
将所述第三字符识别结果作为所述目标字符识别结果。
9.根据权利要求6所述的方法,其特征在于,所述第一字符识别结果和所述第二字符识别结果的相似度确定方法包括:
根据所述第一字符识别结果和所述第二字符识别结果中的字符生成字符表;
将所述第一字符识别结果中的字符与所述字符表进行匹配,得到第一词频矩阵;
将所述第二字符识别结果中的字符与所述字符表进行匹配,得到第二词频矩阵;
确定所述第一词频矩阵和所述第二词频矩阵之间的相似度,作为所述第一字符识别结果和所述第二字符识别结果之间的相似度。
10.根据权利要求1至4任一所述的方法,其特征在于,所述方法应用于安装有无线管理应用程序的终端中,所述目标字符识别结果包括识别得到的无线网络名称和无线网络密码;
所述根据所述至少两帧图像的字符识别结果得到目标字符识别结果之后,还包括:
根据所述无线网络名称搜索与所述无线网络名称对应的目标无线网络;
通过所述无线网络密码接入所述目标无线网络。
11.一种字符识别装置,其特征在于,应用于设置有摄像头的终端中,所述装置包括:
调用模块,用于调用所述终端的所述摄像头进行图像采集;
获取模块,用于获取所述终端的稳定参数,所述稳定参数用于评估所述终端的稳定程度;
所述获取模块,还用于当所述稳定参数符合预设条件时,获取所述摄像头采集的n帧图像,n≥2;
识别模块,用于对所述n帧图像中的至少两帧图像进行字符识别,并根据所述至少两帧图像的字符识别结果得到目标字符识别结果。
12.一种计算机设备,其特征在于,所述计算机设备包括处理器和存储器,所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现如权利要求1至10任一所述的字符识别方法。
13.一种计算机可读存储介质,其特征在于,所述可读存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由处理器加载并执行以实现如权利要求1至10任一所述的字符识别方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910345757.7A CN110059686B (zh) | 2019-04-26 | 2019-04-26 | 字符识别方法、装置、设备及可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910345757.7A CN110059686B (zh) | 2019-04-26 | 2019-04-26 | 字符识别方法、装置、设备及可读存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110059686A true CN110059686A (zh) | 2019-07-26 |
CN110059686B CN110059686B (zh) | 2023-08-22 |
Family
ID=67321245
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910345757.7A Active CN110059686B (zh) | 2019-04-26 | 2019-04-26 | 字符识别方法、装置、设备及可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110059686B (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111353484A (zh) * | 2020-02-28 | 2020-06-30 | 深圳前海微众银行股份有限公司 | 图像字符识别方法、装置、设备及可读存储介质 |
CN111353434A (zh) * | 2020-02-28 | 2020-06-30 | 北京市商汤科技开发有限公司 | 信息识别方法及装置、***、电子设备和存储介质 |
CN111683285A (zh) * | 2020-08-11 | 2020-09-18 | 腾讯科技(深圳)有限公司 | 文件内容识别方法、装置、计算机设备及存储介质 |
CN111860590A (zh) * | 2020-06-15 | 2020-10-30 | 浙江大华技术股份有限公司 | 车牌投票方法、装置、计算机设备和存储介质 |
CN112784833A (zh) * | 2021-03-12 | 2021-05-11 | 支付宝(杭州)信息技术有限公司 | 证件识别方法、装置和服务器 |
CN113360113A (zh) * | 2021-05-24 | 2021-09-07 | 中国电子科技集团公司第四十一研究所 | 一种基于oled屏实现动态调整字符显示宽度的***及方法 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
BE1011273A4 (fr) * | 1997-07-11 | 1999-07-06 | Euresys Sa | Procede et dispositif de reconnaissance en ligne des caracteres manuscrits. |
US20080007620A1 (en) * | 2006-07-06 | 2008-01-10 | Nokia Corporation | Method, Device, Mobile Terminal and Computer Program Product for a Camera Motion Detection Based Scheme for Improving Camera Input User Interface Functionalities |
JP2009088944A (ja) * | 2007-09-28 | 2009-04-23 | Canon Inc | 文字認識装置、撮像装置及び映像再生装置 |
DE102013005658A1 (de) * | 2013-04-02 | 2014-10-02 | Docuware Gmbh | Erfassung eines dokuments |
CN104125487A (zh) * | 2013-04-28 | 2014-10-29 | 腾讯科技(深圳)有限公司 | 一种上传图像数据的方法和装置 |
CN105162960A (zh) * | 2015-08-04 | 2015-12-16 | 努比亚技术有限公司 | 一种无边框移动终端的拍照装置和方法 |
CN106203425A (zh) * | 2016-07-01 | 2016-12-07 | 北京旷视科技有限公司 | 字符识别方法及装置 |
CN108289176A (zh) * | 2018-02-11 | 2018-07-17 | 广东小天才科技有限公司 | 一种拍照搜题方法、搜题装置及终端设备 |
CN108694400A (zh) * | 2017-03-31 | 2018-10-23 | 佳能株式会社 | 信息处理装置、其控制方法及存储介质 |
-
2019
- 2019-04-26 CN CN201910345757.7A patent/CN110059686B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
BE1011273A4 (fr) * | 1997-07-11 | 1999-07-06 | Euresys Sa | Procede et dispositif de reconnaissance en ligne des caracteres manuscrits. |
US20080007620A1 (en) * | 2006-07-06 | 2008-01-10 | Nokia Corporation | Method, Device, Mobile Terminal and Computer Program Product for a Camera Motion Detection Based Scheme for Improving Camera Input User Interface Functionalities |
JP2009088944A (ja) * | 2007-09-28 | 2009-04-23 | Canon Inc | 文字認識装置、撮像装置及び映像再生装置 |
DE102013005658A1 (de) * | 2013-04-02 | 2014-10-02 | Docuware Gmbh | Erfassung eines dokuments |
CN104125487A (zh) * | 2013-04-28 | 2014-10-29 | 腾讯科技(深圳)有限公司 | 一种上传图像数据的方法和装置 |
CN105162960A (zh) * | 2015-08-04 | 2015-12-16 | 努比亚技术有限公司 | 一种无边框移动终端的拍照装置和方法 |
CN106203425A (zh) * | 2016-07-01 | 2016-12-07 | 北京旷视科技有限公司 | 字符识别方法及装置 |
CN108694400A (zh) * | 2017-03-31 | 2018-10-23 | 佳能株式会社 | 信息处理装置、其控制方法及存储介质 |
CN108289176A (zh) * | 2018-02-11 | 2018-07-17 | 广东小天才科技有限公司 | 一种拍照搜题方法、搜题装置及终端设备 |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111353484A (zh) * | 2020-02-28 | 2020-06-30 | 深圳前海微众银行股份有限公司 | 图像字符识别方法、装置、设备及可读存储介质 |
CN111353434A (zh) * | 2020-02-28 | 2020-06-30 | 北京市商汤科技开发有限公司 | 信息识别方法及装置、***、电子设备和存储介质 |
WO2021169384A1 (zh) * | 2020-02-28 | 2021-09-02 | 北京市商汤科技开发有限公司 | 信息识别方法及装置、***、电子设备、存储介质和计算机程序 |
TWI766458B (zh) * | 2020-02-28 | 2022-06-01 | 大陸商北京市商湯科技開發有限公司 | 資訊識別方法及裝置、電子設備、儲存媒體 |
CN111860590A (zh) * | 2020-06-15 | 2020-10-30 | 浙江大华技术股份有限公司 | 车牌投票方法、装置、计算机设备和存储介质 |
CN111683285A (zh) * | 2020-08-11 | 2020-09-18 | 腾讯科技(深圳)有限公司 | 文件内容识别方法、装置、计算机设备及存储介质 |
CN112784833A (zh) * | 2021-03-12 | 2021-05-11 | 支付宝(杭州)信息技术有限公司 | 证件识别方法、装置和服务器 |
CN113360113A (zh) * | 2021-05-24 | 2021-09-07 | 中国电子科技集团公司第四十一研究所 | 一种基于oled屏实现动态调整字符显示宽度的***及方法 |
CN113360113B (zh) * | 2021-05-24 | 2022-07-19 | 中国电子科技集团公司第四十一研究所 | 一种基于oled屏实现动态调整字符显示宽度的***及方法 |
Also Published As
Publication number | Publication date |
---|---|
CN110059686B (zh) | 2023-08-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110059686A (zh) | 字符识别方法、装置、设备及可读存储介质 | |
JP7058760B2 (ja) | 画像処理方法およびその、装置、端末並びにコンピュータプログラム | |
CN110121118A (zh) | 视频片段定位方法、装置、计算机设备及存储介质 | |
CN110087123A (zh) | 视频文件制作方法、装置、设备及可读存储介质 | |
CN109086709A (zh) | 特征提取模型训练方法、装置及存储介质 | |
CN110222789A (zh) | 图像识别方法及存储介质 | |
CN109712224A (zh) | 虚拟场景的渲染方法、装置及智能设备 | |
CN109815150A (zh) | 应用测试方法、装置、电子设备及存储介质 | |
CN110136228B (zh) | 虚拟角色的面部替换方法、装置、终端及存储介质 | |
CN111382624A (zh) | 动作识别方法、装置、设备及可读存储介质 | |
CN109729297A (zh) | 在视频中添加特效的方法和装置 | |
WO2022048398A1 (zh) | 多媒体数据拍摄方法及终端 | |
CN110148178A (zh) | 相机定位方法、装置、终端及存储介质 | |
CN110135336A (zh) | 行人生成模型的训练方法、装置及存储介质 | |
CN109977775A (zh) | 关键点检测方法、装置、设备及可读存储介质 | |
CN109558837A (zh) | 人脸关键点检测方法、装置及存储介质 | |
CN109068160A (zh) | 链接视频的方法、装置和*** | |
CN109922356A (zh) | 视频推荐方法、装置和计算机可读存储介质 | |
CN109948581A (zh) | 图文渲染方法、装置、设备及可读存储介质 | |
CN110515688A (zh) | 页面显示方法、装置、终端及存储介质 | |
CN110225390A (zh) | 视频预览的方法、装置、终端及计算机可读存储介质 | |
CN109992685A (zh) | 一种检索图片的方法及装置 | |
CN110290426A (zh) | 展示资源的方法、装置、设备及存储介质 | |
CN109547843A (zh) | 对音视频进行处理的方法和装置 | |
CN108682037A (zh) | 相机姿态追踪过程的重定位方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |