CN114299509A - 一种获取信息的方法、装置、设备及介质 - Google Patents

一种获取信息的方法、装置、设备及介质 Download PDF

Info

Publication number
CN114299509A
CN114299509A CN202111636198.9A CN202111636198A CN114299509A CN 114299509 A CN114299509 A CN 114299509A CN 202111636198 A CN202111636198 A CN 202111636198A CN 114299509 A CN114299509 A CN 114299509A
Authority
CN
China
Prior art keywords
image
target
character
recognized
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111636198.9A
Other languages
English (en)
Inventor
陈帅均
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alipay Hangzhou Information Technology Co Ltd
Original Assignee
Alipay Hangzhou Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alipay Hangzhou Information Technology Co Ltd filed Critical Alipay Hangzhou Information Technology Co Ltd
Priority to CN202111636198.9A priority Critical patent/CN114299509A/zh
Publication of CN114299509A publication Critical patent/CN114299509A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Image Analysis (AREA)

Abstract

本说明书实施例公开了一种获取信息的方法、装置、设备及介质。方案包括:获取待识别图像;识别所述待识别图像中的符合预设字符图像特征的目标字符;所述预设字符图像特征为模板图像中的字符图像包含的特征;基于所述目标字符的坐标,确定目标转换矩阵;基于所述目标转换矩阵调整所述待识别图像,得到调整后的待识别图像;从所述调整后的待识别图像的目标区域中获取目标信息。

Description

一种获取信息的方法、装置、设备及介质
技术领域
本申请涉及计算机技术领域,尤其涉及一种获取信息的方法、装置、设备及介质。
背景技术
随着技术的发展,人们通过拍照上传卡片证件进行办理业务越来越普及。例如,在进行身份信息录入时,可以对身份证进行扫描,以识别出姓名、身份证号码等身份信息;再如,在进行金融信息录入时,可以对***或储蓄卡进行扫描,识别出开户银行、账号等信息,等等。
现有技术中在进行卡证信息识别时,通常利用卡证图像的像素特征进行卡证信息识别,而由于图像容易受明暗、角度、噪声、色彩等等因素的影响,使得现有技术中卡证识别的准确性较低,而且准确率高的深度学习模型往往因计算复杂度高导致推理低效。
因此,如何更好的识别卡证信息是亟待解决的技术问题。
发明内容
本说明书实施例提供一种获取信息的方法、装置、设备及介质,以解决现有的卡证信息识别方法存在的识别准确率低的问题。
为解决上述技术问题,本说明书实施例是这样实现的:
本说明书实施例提供的一种获取信息的方法,包括:
获取待识别图像;
识别所述待识别图像中的符合预设字符图像特征的目标字符;所述预设字符图像特征为模板图像中的字符图像包含的特征;
基于所述目标字符的坐标,确定目标转换矩阵;
基于所述目标转换矩阵调整所述待识别图像,得到调整后的待识别图像;
从所述调整后的待识别图像的目标区域中获取目标信息。
本说明书实施例提供的一种获取信息的装置,包括:
图像获取模块,用于获取待识别图像;
字符图像识别模块,用于识别所述待识别图像中的符合预设字符图像特征的目标字符;所述预设字符图像特征为模板图像中的字符图像包含的特征;
矩阵确定模块,用于基于所述目标字符的坐标,确定目标转换矩阵;
图像调整模块,用于基于所述目标转换矩阵调整所述待识别图像,得到调整后的待识别图像;
信息识别模块,用于从所述调整后的待识别图像的目标区域中获取目标信息。
本说明书实施例提供的一种获取信息的设备,包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够:
获取待识别图像;
识别所述待识别图像中的符合预设字符图像特征的目标字符;所述预设字符图像特征为模板图像中的字符图像包含的特征;
基于所述目标字符的坐标,确定目标转换矩阵;
基于所述目标转换矩阵调整所述待识别图像,得到调整后的待识别图像;
从所述调整后的待识别图像的目标区域中获取目标信息。
本说明书实施例提供的一种计算机可读介质,其上存储有计算机可读指令,所述计算机可读指令可被处理器执行以实现一种获取信息的方法。
本说明书一个实施例实现了能够达到以下有益效果:
本说明书实施例中可以通过识别待识别图像中的目标字符,根据目标字符的坐标确定用于调整待识别图像的目标转换矩阵,得到调整后的待识别图像,从调整后的待识别图像的目标区域中获取目标信息。其中,可以基于图像中的字符特征进行图像的调整,能够更准确的进行图像匹配,进而提高信息获取的准确率。
附图说明
为了更清楚地说明本说明书实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本说明书实施例提供的一种获取信息的方法的应用场景示意图;
图2为本说明书实施例提供的一种获取信息的方法的流程示意图;
图3为本说明书实施例提供的一种字符关联匹配的示意图;
图4为本说明书实例中提供的一种模板图像的示意图;
图5为本说明书实施例提供的一种获取信息的方法的泳道图;
图6为本说明书实施例提供的一种获取信息的装置的结构示意图;
图7为本说明书实施例提供的一种获取信息的设备的结构示意图。
具体实施方式
为使本说明书一个或多个实施例的目的、技术方案和优点更加清楚,下面将结合本说明书具体实施例及相应的附图对本说明书一个或多个实施例的技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本说明书的一部分实施例,而不是全部的实施例。基于本说明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本说明书一个或多个实施例保护的范围。
以下结合附图,详细说明本说明书各实施例提供的技术方案。
现有技术中,在进行卡证信息识别时,通常利用卡证图像的像素特征进行卡证信息识别,其中通常会采用SIFT(Scale-invariant feature transform,尺度不变特征变换)特征、SURF(Speeded Up Robust Features,加速稳健特征)特征、FAST(Featuresfromaccelerated segment test,角点检测算法)特征、ORB(Oriented FAST and RotatedBRIEF,角点检测与特征描述算法)特征等进行图像配准,这些图像配准方法鲁棒性不好,准确率不高,速度较慢,影响图像的识别效率以及准确性。
为了解决现有技术中的缺陷,本方案给出了以下实施例:
图1为本说明书实施例提供的一种获取信息的方法的应用场景示意图。如图1所示,该方案可以包括待识别图像1、服务器2以及调整后的待识别图像3,其中服务器2可以获取待识别图像1,基于图像文字识别技术,识别图像中的目标字符,根据识别出的目标字符以及预先生成的模板图像,确定用于对待识别图像进行调整的目标转换矩阵,对待识别图像进行调整,得到调整后的待识别图像3,从调整后的待识别图像3的目标区域中获取所需的目标信息。
接下来,将针对说明书实施例提供的一种获取信息的方法结合附图进行具体说明:
图2为本说明书实施例提供的一种获取信息的方法的流程示意图。从程序角度而言,流程的执行主体可以为搭载于应用服务器的程序或应用客户端。
如图2所示,该流程可以包括以下步骤:
步骤202:获取待识别图像。
本说明书实施例中待识别图像可以是由终端采集或者上传的图像,终端可以是手机、电脑、智能手表、车机等。服务器可以获取终端采集或者上传的待识别图像。
步骤204:识别所述待识别图像中的符合预设字符图像特征的目标字符;所述预设字符图像特征为模板图像中的字符图像包含的特征。
本说明书实施例中可以基于图像文字识别技术,例如OCR(Optical CharacterRecognition,光学字符识别)等技术识别图像中的目标字符。其中,目标字符可以为图像中包含的文字、符号等文本信息。模板图像可以是预先存储在服务器中的图像,可作为待识别图像的调整基准。实际应用中,模板图像可以由用户提供也可由服务器根据预设条件确定。
预设字符图像特征可以包含字符的字体、颜色、大小、文本信息等特征。字符图像可以是识别出的字符在模板图像或者待识别图像中对应的图像。本说明书实施例中可以基于目标字符进行图像配准,对待识别图像进行调整,目标字符可以包括均能够从待识别图像与模板图像中识别出的字符。
步骤206:基于所述目标字符的坐标,确定目标转换矩阵。
实际应用中在识别图像中的文本信息时,也可以将文本信息中的各个字符对应的图像在待识别图像中的位置信息识别出来,可以以坐标的形式表示字符的位置信息。
步骤208:基于所述目标转换矩阵调整所述待识别图像,得到调整后的待识别图像。
本说明书实施例中可以根据目标字符的坐标,确定目标转换矩阵,对待识别图像进行调整,调整后的待识别图像与模板图像的角度以及尺寸相同。实际应用中,调整后的待识别图像与模板图像之间的角度以及尺寸之间的偏差很小或在可接受的范围内时,也可以理解为调整后的待识别图像与模板图像的角度以及尺寸相同。
步骤210:从所述调整后的待识别图像的目标区域中获取目标信息。
本说明书实施例中可以通过识别待识别图像中的目标字符,根据目标字符的坐标确定用于调整待识别图像的目标转换矩阵,得到调整后的待识别图像,从调整后的待识别图像的目标区域中获取目标信息。其中,可以基于图像中的字符特征进行图像的调整,由于字符特征相比像素特征,更精确、鲁棒性更好,因而能够更准确的进行图像匹配,提高信息获取的准确率。
并且,本说明书实施例中可以基于模板图像对待识别图像进行配准调整,无需采用大量的样本训练图像配准的模型的训练,也可降低成本。
应当理解,本说明书一个或多个实施例所述的方法其中部分步骤的顺序可以根据实际需要相互交换,或者其中的部分步骤也可以省略或删除。
基于图2的方法,本说明书实施例还提供了该方法的一些具体实施方案,下面进行说明。
实际应用中,在进行业务办理时,可能需要提供证件信息,本说明书实施例中可以针对证件的信息提取,具体的,待识别图像可以包括待识别的卡证图像。例如,身份证、结婚证、营业执照、境外身份证(英文)、结婚证、房产证、不动产权证、准考证等。
本说明书实施例中模板图像可以是与待识别图像同类别的卡证图像,基于同类别的模板图像进行信息识别。例如,待识别图像为公民身份证,模板图像也可以是根据公民身份证得到的模板图像。具体的,上述步骤204识别所述待识别图像中的符合预设字符图像特征的目标字符之前,还可以包括:
确定所述待识别图像对应的模板图像;所述模板图像与所述待识别图像的类别一致。
实际应用中,在对待识别图像进行识别时,用户可以选择待识别图像的类别,服务器也可以根据自行确定类别,根据待识别图像的类别,确定模板图像。
例如,用户在使用终端办理业务时,该业务需要用户先提供身份证信息,再提供营业执照信息。假设在进行到步骤A时,需要用户提供身份证信息,用户可以通过终端拍摄或者扫描身份证,服务器得到用户提供的身份证图像,确定用于对身份证图像进行配准的身份证模板图像,根据该模板图像提取用户提供的身份证中的信息。同理,假设在进行到步骤B时,需要用户提供营业执照信息,用户也可以通过终端拍摄或者扫描营业执照,服务器得到用户提供的营业执照图像,确定用于对营业执照图像进行配准的营业执照模板图像,根据该模板图像提取用户提供的营业执照中的信息。实际应用中,用户也可以自行选择待识别图像的类别,例如,在步骤A时,用户可以先选择待识别的证件为身份证,然后再拍摄或者扫描身份证,将身份证图像提供至服务器,以便服务器进行信息的识别与提取。
本说明书实施例中可以对模板图像与待识别图像中包含的相同的字符进行关联匹配,从关联匹配的字符中确定目标字符。其中,所述识别所述待识别图像中的符合预设字符图像特征的目标字符,具体可以包括:
基于所述模板图像中包含的第一字符的字符特征,从所述待识别图像中识别出与所述第一字符对应的文本信息相同的第二字符;
将所述第二字符中的至少部分字符确定为所述目标字符。
实际应用中,可以基于OCR等图像文字识别技术,确定模板图像中包含的第一字符,其中,第一字符可以为同类别卡证中均包含的文字信息,可以表示同类别卡证中的固定信息。本说明书实施例中目标字符可以是模板图像和待识别图像中均包含的字符。
图3为本说明书实施例提供的一种字符关联匹配的示意图。如图3所示,假设待识别图像32为某一身份证图像,模板图像31为待识别图像对应的同类别的模板图像,其中可以对模板图像以及待识别图像进行字符识别,可以将模板图像31与待识别图像32中相同的字符进行匹配,建立相同字符之间的关联关系,即建立第一字符与第二字符的关联关系。例如,模板图像31中的“姓”与待识别图像32中“姓”相对应,可以作为一个匹配对;模板图像31中的“住”与待识别图像32中“住”相对应,可以作为一个匹配对。实际应用中可以对模板图像中与待识别图像中的全部或者部分相同字符进行匹配,这里不再一一列举。
实际应用中,在利用图像字符识别技术识别图像中的字符时,也可以获得识别出的字符的在图像中的坐标,本说明书实施例中可以基于字符坐标得到目标转换矩阵,具体的,本说明书实施例中所述基于所述目标字符的坐标,确定目标转换矩阵,具体包括:
获取所述目标字符在所述模板图像中的第一坐标;
获取所述目标字符在所述待识别图像中的第二坐标;
基于所述第一坐标和所述第二坐标,得到所述目标转换矩阵。
本说明书实施例中可以根据公式X=M*U,得到目标转换矩阵,其中,X表示模板图像中目标字符的第一坐标,M表示目标转换矩阵,U表示待识别图像中目标字符的第二坐标。
对于二维的平面图像来讲,具体的可以表示为
Figure BDA0003442387860000061
其中,第一坐标X为(x,y),第二坐标U为(u,v),目标转换矩阵M为
Figure BDA0003442387860000062
考虑到实际应用中可能存在待识别图像或者模板图像本身包含相同的字符,例如,某人的姓名中包含“生”字,该人的身份证图像中就会包含两个相同的“生”,一个是“出生”中的“生”字,一个是姓名中的“生”字,这样在进行字符匹配时,可能就会存在将“出生”中的“生”与姓名中的“生”进行匹配的情况,如果利用该对匹配字符计算目标转换矩阵就会不准确,也会影响目标信息的识别。为了提高目标转换矩阵的准确性,提高信息识别的准确性,本说明书实施例中所述基于所述第一坐标和所述第二坐标,得到所述目标转换矩阵,具体包括:
基于所述第一坐标和所述第二坐标,得到待定转换矩阵;
基于所述待定转换矩阵调整所述待识别图像,得到待定调整后图像;
获取所述待定调整后图像中预设数量的第三字符;
获取所述模板图像中与所述第三字符对应的文本信息相同的第四字符;
基于所述第三字符在所述待定调整后图像中的坐标与所述第四字符在所述模板图像中的坐标的距离,判断所述待定转换矩阵是否为所述目标转换矩阵。
本说明书实施例中可以根据第三字符与第四字符的坐标距离,验证根据第一坐标和第二坐标得到的转换矩阵的准确性,进而可以利用正确的转换矩阵进行图像调整,进一步准确的获取目标信息。
作为一种实施方式,本说明书实施例中所述判断所述待定转换矩阵是否为所述目标转换矩阵,具体可以包括:
计算各个第三字符与对应的第四字符之间的坐标距离;
统计所述坐标距离小于或等于预设距离的第三字符的字符数量;
若所述字符数量大于或等于预设字符数量,则将所述待定转换矩阵确定为所述目标转换矩阵。
实际应用中,第三字符以及第四字符可以是存在匹配关系的字符,可以根据第三字符以及第四字符的坐标信息计算字符之间的坐标距离,第三字符与对应的第四字符之间的坐标距离越小,说明得到的待定转换矩阵越准确。本说明书实施例中可以选择预设数量的字符进行验证计算,当对应的坐标距离小于或等于预设距离的字符的数量越多时,越能说明验证的待定转换矩阵越准确。
为进一步提高验证的准确性,本说明书实施例中所述第三字符可以为所述待定调整后图像中所述目标字符之外的字符。
实际应用中,对待转换矩阵进行验证的字符的数量可以根据需要进行设定,可以是存在匹配关系的全部字符,也可以是部分字符;预设距离以及预设字符数量也可以根据实际需求进行设定,这里不作具体限定。例如,预设字符数量可以为具体的数值,也可以为第三字符对应的预设数量的占比,例如,当坐标距离小于或等于预设距离的第三字符的字符数量大于或等于总的第三字符的数量的一半时,可以确定待定转换矩阵确定为所述目标转换矩阵。
本说明书实施例中可以根据转换矩阵的计算需求,确定目标字符的数量,例如,模板图像以及待识别图像为二维图像时,目标字符的数量应该大于或等于4。
本说明书实施例中若统计得到的坐标距离小于或等于预设距离的第三字符的数量小于预设字符数量,则可确定待定转换矩阵的准确性不够,不能作为目标转换矩阵。若待定转换矩阵不能作为目标转换矩阵,则可以重新选择用于计算目标转换矩阵的字符,利用重新选择的字符进行计算以及验证,该过程可以与上述过程相同,这里不再赘述。
作为一种实施方式,本说明书实施例中也可以对模板图像进行调整,通过调整后的目标图像与待识别图像中字符的距离,确定目标转换矩阵。具体的,所述基于所述第一坐标和所述第二坐标,得到所述目标转换矩阵,具体可以包括:
基于所述第一坐标和所述第二坐标,得到待定转换矩阵;
基于所述待定转换矩阵调整所述模板图像,得到调整后模板图像;
获取所述待识别图像中预设数量的第三字符;
获取所述调整后模板图像中与所述第三字符对应的文本信息相同的第四字符;
基于所述第三字符在所述待识别图像中的坐标与所述第四字符在所述调整后模板图像中的坐标的距离,判断所述待定转换矩阵是否为所述目标转换矩阵。
实际应用中目标字符中至少可以包含计算待定转换矩阵所需的最少字符个数的字符。其中,在判断待定转换矩阵是否为目标转换矩阵时,还可以选择多组目标字符,每组目标字符中包含计算待定转换矩阵所需的最少字符个数的字符,可以得到多个待定转换矩阵,然后针对个待定转换矩阵,计算待识别图像或者模板图像中能够符合该待定换换矩阵的字符,即,将待识别图像中的全部或者除目标字符之外的其他字符作为第三字符,或者将待识别图像中与模板图像存在匹配对应关系的全部或者除目标字符之外的其他存在匹配对应关系的字符作为第三字符,这对各个待定转换矩阵,计算各个第三字符与对应的第四字符之间的坐标距离,统计坐标距离小于或等于预设距离的字符数量,可以将该字符数量最多的待定转换矩阵确定为目标转换矩阵。
本说明书实施例中还可以根据RANSAC(random sample consensus,随机抽样一致算法)过滤模板图像与待识别图像之间的错误匹配点,然后利用匹配关系正确的字符坐标计算得到目标转换矩阵。
实际应用中,OCR等图像识别技术的识别准确率已经可以达到99%,上述对转换矩阵验证的方式可以应对50%的错误匹配点的情况,通过验证本说明书实施例中对模板图像与待识别图像之间的匹配准确率可以有97%以上,可有效提高图像信息识别的准确率。
本说明书实施例中模板图像可以是包含同类别的图像中通常包含的字符信息的图像,以便模板图像可以对同类别的不同待识别图像进行识别。可以从模板图像中包含的字符中确定目标字符,其中,目标字符为所述待识别图像中的特定字符;所述特定字符可以为相同类别的不同待识别图像中均包含的字符。
实际应用中,模板图像可以理解待识别图像对应的模板,其中可包含一些在特定位置的特定信息。例如,用于对身份证图像进行识别的模板图像中可以为包含“姓名”、“性别”、“出生”、“公民身份号码”等信息的图像。
本说明书实例中可以预先建立模板图像,根据模板图像确定要获取的目标信息的位置信息,然后根据该位置信息确定待识别图像中的目标信息。具体的,本说明书实施例中所述从所述调整后的待识别图像的目标区域中获取目标信息,具体可以包括:
确定所述目标信息对应的目标字段;
根据预设区域对应关系,确定所述目标字段在所述模板图像中对应的信息显示区域;所述信息显示区域用于显示所述目标字段的描述信息;其中预设区域对应关系中包含目标字段以及与目标字段对应的信息显示区域的位置信息;
确定所述显示区域的目标坐标;
将所述调整后的待识别图像中所述目标坐标对应的区域确定为所述目标区域;
从所述调整后的待识别图像中所述目标坐标对应的区域中识别所述目标字段对应的目标信息;所述目标信息为所述调整后的待识别图像中用于描述所述目标字段的信息。
实际应用中,可以根据信息获取需求,确定目标字段,以便从待识别图像中提取需要的信息。例如,用户在办理某业务时,需要提供身份证上的姓名、身份证号码等信息,目标字段可以为身份证图像中的“姓名”、“公民身份号码”等。具体的目标字段可根据实际需求进行设定,这里不作具体限定。
本说明书实施例中可以根据目标转换矩阵将待识别图像进行调整,调整后的待识别图像与模板图像的大小以及角度相同。实际应用中,还可以基于图像中的字符对待识别图像进行仿射变换、等距变换、相似变换、投影变换等,将待识别图像配准到模板图像。
本说明书实施例中的模板图像可以是用户提供的字迹清晰、位置方正的图像,可以基于用户的操作建立模板图像中目标字段与信息显示区域的对应关系,以便根据该对应关系获取待识别图像中的信息。实际应用中,模板图像可以与待识别图像对应的卡证为同一卡证,也可为同类别中不同的卡证。例如,待识别图像可以是张三的身份证的图像,模板图像可以是李四的身份证的图像,也可以是张三的身份证图像。
本说明书实施例中所述获取待识别图像之前,还可以包括:
获取所述模板图像;
基于用户对所述模板图像的第一操作,确定所述模板图像中的目标字符;
基于用户对所述模板图像的第二操作,确定所述模板图像中所述目标字符对应的信息显示区域;所述信息显示区域用于显示所述目标字符的描述信息;
根据所述目标字符与所述信息显示区域的对应关系,得到所述预设区域对应关系。
本说明书实例中,第一操作以及第二操作可以是用户执行的选择操作,例如,在显示有模板图像的终端页面中可以通过在页面中勾选、框选、长摁等操作,通过第一操作可以确定模板图像中的目标字符,并标记,其中,可以将目标字符所在区域标记为第一指定颜色,例如,标记为红色等;通过第二操作可以确定目标字符对应的描述信息,可以显示描述信息的信息显示区域进行标记,其中,可以将目标字符所在区域标记为第二指定颜色,例如,标记为蓝色等。用户可以为提供待识别图像的用户,也可以是***或应用程序的工作人员。
图4为本说明书实例中提供的一种模板图像的示意图。如图4所示,可以基于用户的第一操作,确定模板图像中的目标字符41,标记目标字符41所在区域为第一预设颜色;基于用户的第二操作,确定模板图像中目标字符41对应的信息显示区域42,标记信息显示区域为第二预设颜色。模板图像中的目标字符可以为同类别图像中包含的固定信息,如图4所示的用实线框标记的“姓名”、“性别”、“民族”、“出生”、“年”等等,可以将该实线框内的区域标记为第一预设颜色;模板图像中对于目标字符对应的字段的描述信息可以为类别图像中包含的可变信息,如图4所示的用虚线框标记的“李四”、“男”、“汉”、“1988”等等,可以将该虚线框内的区域标记为第二预设颜色。
实际应用中,在用户执行第二操作时,还可以显示字符段填写界面,用户可以在字符段填写界面中输入信息显示区域对应的由目标字符构成的字符段,服务器可以获取信息显示区域对应的字符段,建立包含目标字符的字符段与信息显示区域的对应关系,得到预设区域对应关系。其中,信息显示区域可以以该区域所在位置的坐标表示。本说明书实施例中可以以键-值(key-value)对的方式记录字符段与信息显示区域的对应关系。其中,信息显示区域的位置信息可以以顶点坐标的形式表示,当信息显示区域为矩形时,可以以至少包含一对对角顶点的坐标表示信息显示区域。
本说明书实施例中还可以对标记后的模板图像进行掩膜操作,可以得到包含目标字符的图像,然后根据图像字符识别技术,得到目标字符以及目标字符对应的坐标,以便利用目标字符以及目标字符的坐标得到用于对待识别图像进行调整的转换矩阵。
本说明书实施例中可以基于模板图像对待识别图像进行调整,获取待识别图像中的信息,不需要大量样本训练,与深度学习需要大量样本训练相比较,本说明书实施例中提供的方法只需要一张质量较高的卡证图像作为模板即可获取待识别图像中的信息。
并且,实际应用中,若待识别图像为不常见的卡证图像时,如执业兽医资格证、印刷许可证等,可能用户使用的应用程序中没有对该类卡证信息进行提取的流程或者程序,需要升级应用程序或者采用其他方式提交卡证信息,这也会对用户带来不便。本说明书实施例中通过用户提供的模板图像,可以建立用于识别待识别图像的模板图像,进而可以在不修改代码或者更新应用程序的情况下就可以完成对待识别图像的信息提取,使得用户可以根据实际需求自定义识别模板,完成图像信息的提取,实用性强、应用广泛。
为更清楚的说明本说明书实施例中提供的获取信息的方法,图5为本说明书实施例提供的一种获取信息的方法的泳道图。如图5所示,该方法可以包括图像获取阶段、图像调整阶段以及信息获取阶段,具体的可以包括:
步骤502:获取待识别图像;
步骤504:确定待识别图像对应的模板图像;
步骤506:获取待识别图像与模板图像中包含的目标字符;
步骤508:基于目标字符在待识别图像中的坐标以及目标字符在模板图像中的坐标,确定目标转换矩阵;
步骤510:基于所述目标转换矩阵调整所述待识别图像,得到调整后的待识别图像;
步骤512:根据预设区域对应关系,确定需要提取的信息对应的目标字段在模板图像中对应的信息显示区域;
步骤514:确定该信息显示区域的坐标信息;
步骤516:确定在调整后的待识别图像中该坐标信息对应的目标显示区域;
步骤518:从调整后的待识别图像中的目标显示区域中获取目标信息。
基于同样的思路,本说明书实施例还提供了上述方法对应的装置。图6为本说明书实施例提供的一种获取信息的装置的结构示意图。如图6所示,该装置可以包括:
图像获取模块602,用于获取待识别图像;
字符识别模块604,用于识别所述待识别图像中的符合预设字符图像特征的目标字符;所述预设字符图像特征为模板图像中的字符图像包含的特征;
矩阵确定模块606,用于基于所述目标字符的坐标,确定目标转换矩阵;
图像调整模块608,用于基于所述目标转换矩阵调整所述待识别图像,得到调整后的待识别图像;
信息识别模块610,用于从所述调整后的待识别图像的目标区域中获取目标信息。
基于同样的思路,本说明书实施例还提供了上述方法对应的设备。
图7为本说明书实施例提供的一种获取信息的设备的结构示意图。如图7所示,设备700可以包括:
至少一个处理器710;以及,
与所述至少一个处理器通信连接的存储器730;其中,
所述存储器730存储有可被所述至少一个处理器710执行的指令720,所述指令被所述至少一个处理器710执行,以使所述至少一个处理器710能够:
获取待识别图像;
识别所述待识别图像中的符合预设字符图像特征的目标字符;所述预设字符图像特征为模板图像中的字符图像包含的特征;
基于所述目标字符的坐标,确定目标转换矩阵;
基于所述目标转换矩阵调整所述待识别图像,得到调整后的待识别图像;
从所述调整后的待识别图像的目标区域中获取目标信息。
基于同样的思路,本说明书实施例还提供了上述方法对应的计算机可读介质。计算机可读介质上存储有计算机可读指令,所述计算机可读指令可被处理器执行以实现上述获取信息的方法。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于图7所示的设备而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
在20世纪90年代,对于一个技术的改进可以很明显地区分是硬件上的改进(例如,对二极管、晶体管、开关等电路结构的改进)还是软件上的改进(对于方法流程的改进)。然而,随着技术的发展,当今的很多方法流程的改进已经可以视为硬件电路结构的直接改进。设计人员几乎都通过将改进的方法流程编程到硬件电路中来得到相应的硬件电路结构。因此,不能说一个方法流程的改进就不能用硬件实体模块来实现。例如,可编程逻辑器件(Programmable Logic Device,PLD)(例如现场可编程门阵列(Field Programmable GateArray,FPGA))就是这样一种集成电路,其逻辑功能由用户对器件编程来确定。由设计人员自行编程来把一个数字符***“集成”在一片PLD上,而不需要请芯片制造厂商来设计和制作专用的集成电路芯片。而且,如今,取代手工地制作集成电路芯片,这种编程也多半改用“逻辑编译器(logic compiler)”软件来实现,它与程序开发撰写时所用的软件编译器相类似,而要编译之前的原始代码也得用特定的编程语言来撰写,此称之为硬件描述语言(Hardware Description Language,HDL),而HDL也并非仅有一种,而是有许多种,如ABEL(Advanced Boolean Expression Language)、AHDL(Altera Hardware DescriptionLanguage)、Confluence、CUPL(Cornell University Programming Language)、HDCal、JHDL(Java Hardware Description Language)、Lava、Lola、MyHDL、PALASM、RHDL(RubyHardware Description Language)等,目前最普遍使用的是VHDL(Very-High-SpeedIntegrated Circuit Hardware Description Language)与Verilog。本领域技术人员也应该清楚,只需要将方法流程用上述几种硬件描述语言稍作逻辑编程并编程到集成电路中,就可以很容易得到实现该逻辑方法流程的硬件电路。
控制器可以按任何适当的方式实现,例如,控制器可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(Application Specific Integrated Circuit,ASIC)、可编程逻辑控制器和嵌入微控制器的形式,控制器的例子包括但不限于以下微控制器:ARC 625D、AtmelAT91SAM、Microchip PIC18F26K20以及Silicone Labs C8051F320,存储器控制器还可以被实现为存储器的控制逻辑的一部分。本领域技术人员也知道,除了以纯计算机可读程序代码方式实现控制器以外,完全可以通过将方法步骤进行逻辑编程来使得控制器以逻辑门、开关、专用集成电路、可编程逻辑控制器和嵌入微控制器等的形式来实现相同功能。因此这种控制器可以被认为是一种硬件部件,而对其内包括的用于实现各种功能的装置也可以视为硬件部件内的结构。或者甚至,可以将用于实现各种功能的装置视为既可以是实现方法的软件模块又可以是硬件部件内的结构。
上述实施例阐明的***、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的,计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字符助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。
为了描述的方便,描述以上装置时以功能分为各种单元分别描述。当然,在实施本申请时可以把各单元的功能在同一个或多个软件和/或硬件中实现。
本领域内的技术人员应明白,本发明的实施例可提供为方法、***、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(***)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字符多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带式磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
本领域技术人员应明白,本申请的实施例可提供为方法、***或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本申请,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
以上所述仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。

Claims (14)

1.一种获取信息的方法,包括:
获取待识别图像;
识别所述待识别图像中的符合预设字符图像特征的目标字符;所述预设字符图像特征为模板图像中的字符图像包含的特征;
基于所述目标字符的坐标,确定目标转换矩阵;
基于所述目标转换矩阵调整所述待识别图像,得到调整后的待识别图像;
从所述调整后的待识别图像的目标区域中获取目标信息。
2.根据权利要求1所述的方法,所述待识别图像包括待识别的卡证图像。
3.根据权利要求1所述的方法,所述识别所述待识别图像中的符合预设字符图像特征的目标字符之前,还包括:
确定所述待识别图像对应的模板图像;所述模板图像与所述待识别图像的类别一致。
4.根据权利要求1所述的方法,所述识别所述待识别图像中的符合预设字符图像特征的目标字符,具体包括:
基于所述模板图像中包含的第一字符的字符特征,从所述待识别图像中识别出与所述第一字符对应的文本信息相同的第二字符;
将所述第二字符中的至少部分字符确定为所述目标字符。
5.根据权利要求1所述的方法,所述基于所述目标字符的坐标,确定目标转换矩阵,具体包括:
获取所述目标字符在所述模板图像中的第一坐标;
获取所述目标字符在所述待识别图像中的第二坐标;
基于所述第一坐标和所述第二坐标,得到所述目标转换矩阵。
6.根据权利要求5所述的方法,所述基于所述第一坐标和所述第二坐标,得到所述目标转换矩阵,具体包括:
基于所述第一坐标和所述第二坐标,得到待定转换矩阵;
基于所述待定转换矩阵调整所述待识别图像,得到待定调整后图像;
获取所述待定调整后图像中预设数量的第三字符;
获取所述模板图像中与所述第三字符对应的文本信息相同的第四字符;
基于所述第三字符在所述待定调整后图像中的坐标与所述第四字符在所述模板图像中的坐标的距离,判断所述待定转换矩阵是否为所述目标转换矩阵。
7.根据权利要求6所述的方法,所述判断所述待定转换矩阵是否为所述目标转换矩阵,具体包括:
计算各个第三字符与对应的第四字符之间的坐标距离;
统计所述坐标距离小于或等于预设距离的第三字符的字符数量;
若所述字符数量大于或等于预设字符数量,则将所述待定转换矩阵确定为所述目标转换矩阵。
8.根据权利要求6所述的方法,所述第三字符为所述待定调整后图像中所述目标字符之外的字符。
9.根据权利要求1所述的方法,所述目标字符为所述待识别图像中的特定字符;所述特定字符为相同类别的不同待识别图像中均包含的字符。
10.根据权利要求1所述的方法,所述从所述调整后的待识别图像的目标区域中获取目标信息,具体包括:
确定所述目标信息对应的目标字段;
根据预设区域对应关系,确定所述目标字段在所述模板图像中对应的信息显示区域;所述信息显示区域用于显示所述目标字段的描述信息;
确定所述显示区域的目标坐标;
将所述调整后的待识别图像中所述目标坐标对应的区域确定为所述目标区域;
从所述调整后的待识别图像中所述目标坐标对应的区域中识别所述目标字段对应的目标信息;所述目标信息为所述调整后的待识别图像中用于描述所述目标字段的信息。
11.根据权利要求10所述的方法,所述获取待识别图像之前,还包括:
获取所述模板图像;
基于用户对所述模板图像的第一操作,确定所述模板图像中的目标字符;
基于用户对所述模板图像的第二操作,确定所述模板图像中所述目标字符对应的信息显示区域;所述信息显示区域用于显示所述目标字符的描述信息;
根据所述目标字符与所述信息显示区域的对应关系,得到所述预设区域对应关系。
12.一种获取信息的装置,包括:
图像获取模块,用于获取待识别图像;
字符识别模块,用于识别所述待识别图像中的符合预设字符图像特征的目标字符;所述预设字符图像特征为模板图像中的字符图像包含的特征;
矩阵确定模块,用于基于所述目标字符的坐标,确定目标转换矩阵;
图像调整模块,用于基于所述目标转换矩阵调整所述待识别图像,得到调整后的待识别图像;
信息识别模块,用于从所述调整后的待识别图像的目标区域中获取目标信息。
13.一种获取信息的设备,包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够:
获取待识别图像;
识别所述待识别图像中的符合预设字符图像特征的目标字符;所述预设字符图像特征为模板图像中的字符图像包含的特征;
基于所述目标字符的坐标,确定目标转换矩阵;
基于所述目标转换矩阵调整所述待识别图像,得到调整后的待识别图像;
从所述调整后的待识别图像的目标区域中获取目标信息。
14.一种计算机可读介质,其上存储有计算机可读指令,所述计算机可读指令可被处理器执行以实现权利要求1至11中任一项所述的获取信息的方法。
CN202111636198.9A 2021-12-29 2021-12-29 一种获取信息的方法、装置、设备及介质 Pending CN114299509A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111636198.9A CN114299509A (zh) 2021-12-29 2021-12-29 一种获取信息的方法、装置、设备及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111636198.9A CN114299509A (zh) 2021-12-29 2021-12-29 一种获取信息的方法、装置、设备及介质

Publications (1)

Publication Number Publication Date
CN114299509A true CN114299509A (zh) 2022-04-08

Family

ID=80971179

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111636198.9A Pending CN114299509A (zh) 2021-12-29 2021-12-29 一种获取信息的方法、装置、设备及介质

Country Status (1)

Country Link
CN (1) CN114299509A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116343232A (zh) * 2023-04-03 2023-06-27 内蒙古师范大学 一种基于预分类的古籍数学符号识别方法

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011258117A (ja) * 2010-06-11 2011-12-22 Sony Computer Entertainment Inc 画像処理装置、画像処理方法、コンピュータプログラム、記録媒体、及び半導体装置
US20170124386A1 (en) * 2015-10-30 2017-05-04 Xiaomi Inc. Method, device and computer-readable medium for region recognition
CN108985137A (zh) * 2017-06-02 2018-12-11 杭州海康威视数字技术股份有限公司 一种车牌识别方法、装置及***
CN111126125A (zh) * 2019-10-15 2020-05-08 平安科技(深圳)有限公司 证件中的目标文本提取方法、装置、设备及可读存储介质
CN111680688A (zh) * 2020-06-10 2020-09-18 创新奇智(成都)科技有限公司 字符识别方法及装置、电子设备、存储介质
CN111753575A (zh) * 2019-03-26 2020-10-09 杭州海康威视数字技术股份有限公司 文本识别方法、装置及设备
CN112396057A (zh) * 2019-08-13 2021-02-23 上海高德威智能交通***有限公司 一种字符识别方法、装置及电子设备
US20210312217A1 (en) * 2020-04-01 2021-10-07 Scandit Ag Mapping optical-code images to an overview image
CN113688821A (zh) * 2021-09-07 2021-11-23 四川中电启明星信息技术有限公司 一种基于深度学习的ocr文字识别方法

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011258117A (ja) * 2010-06-11 2011-12-22 Sony Computer Entertainment Inc 画像処理装置、画像処理方法、コンピュータプログラム、記録媒体、及び半導体装置
US20170124386A1 (en) * 2015-10-30 2017-05-04 Xiaomi Inc. Method, device and computer-readable medium for region recognition
CN108985137A (zh) * 2017-06-02 2018-12-11 杭州海康威视数字技术股份有限公司 一种车牌识别方法、装置及***
CN111753575A (zh) * 2019-03-26 2020-10-09 杭州海康威视数字技术股份有限公司 文本识别方法、装置及设备
CN112396057A (zh) * 2019-08-13 2021-02-23 上海高德威智能交通***有限公司 一种字符识别方法、装置及电子设备
CN111126125A (zh) * 2019-10-15 2020-05-08 平安科技(深圳)有限公司 证件中的目标文本提取方法、装置、设备及可读存储介质
US20210312217A1 (en) * 2020-04-01 2021-10-07 Scandit Ag Mapping optical-code images to an overview image
CN111680688A (zh) * 2020-06-10 2020-09-18 创新奇智(成都)科技有限公司 字符识别方法及装置、电子设备、存储介质
CN113688821A (zh) * 2021-09-07 2021-11-23 四川中电启明星信息技术有限公司 一种基于深度学习的ocr文字识别方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
王晨;尚媛园;丁辉;王少伟;胡峻铭;: "基于SSIM的车牌识别算法研究", 光学技术, no. 06, 15 November 2013 (2013-11-15) *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116343232A (zh) * 2023-04-03 2023-06-27 内蒙古师范大学 一种基于预分类的古籍数学符号识别方法

Similar Documents

Publication Publication Date Title
US11361570B2 (en) Receipt identification method, apparatus, device and storage medium
US11367310B2 (en) Method and apparatus for identity verification, electronic device, computer program, and storage medium
CN111242124B (zh) 一种证件分类方法、装置及设备
WO2018233055A1 (zh) 保单信息录入的方法、装置、计算机设备及存储介质
CN113490947A (zh) 检测模型训练方法、装置、检测模型使用方法及存储介质
CN112580707A (zh) 图像识别方法、装置、设备及存储介质
CN112597940B (zh) 证件图像识别方法、装置及存储介质
US11574492B2 (en) Efficient location and identification of documents in images
CN112861842A (zh) 基于ocr的案件文本识别方法及电子设备
CN111062262B (zh) ***识别方法以及***识别装置
CN112668580A (zh) 一种文本识别方法、文本识别装置及终端设备
CN110796145A (zh) 基于智能决策的多证件分割关联方法及相关设备
KR102351578B1 (ko) 글자 인식 장치 및 이에 의한 글자 인식 방법
CN114299509A (zh) 一种获取信息的方法、装置、设备及介质
CN111931557B (zh) 瓶装饮品的规格识别方法、装置、终端设备及可读存介质
US20230132261A1 (en) Unified framework for analysis and recognition of identity documents
CN111539424A (zh) 一种基于ocr的图像处理方法、***、设备及介质
CN114220103B (zh) 图像识别方法、装置、设备及计算机可读存储介质
CN112396057A (zh) 一种字符识别方法、装置及电子设备
Cai et al. Bank card and ID card number recognition in Android financial APP
CN115688166A (zh) 信息脱敏处理方法、装置、计算机设备及可读存储介质
Ou et al. ERCS: An efficient and robust card recognition system for camera-based image
CN114445807A (zh) 一种文本区域检测方法及装置
CN113128496B (zh) 一种从图像中提取结构化数据的方法、装置和设备
CN114092684A (zh) 一种文本校准方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination