CN110619252B - 识别图片中表单数据的方法、装置、设备及存储介质 - Google Patents

识别图片中表单数据的方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN110619252B
CN110619252B CN201810630395.1A CN201810630395A CN110619252B CN 110619252 B CN110619252 B CN 110619252B CN 201810630395 A CN201810630395 A CN 201810630395A CN 110619252 B CN110619252 B CN 110619252B
Authority
CN
China
Prior art keywords
target
picture file
type
target picture
determining
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810630395.1A
Other languages
English (en)
Other versions
CN110619252A (zh
Inventor
刘昊骋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201810630395.1A priority Critical patent/CN110619252B/zh
Publication of CN110619252A publication Critical patent/CN110619252A/zh
Application granted granted Critical
Publication of CN110619252B publication Critical patent/CN110619252B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/153Segmentation of character regions using recognition of characters or words
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/412Layout analysis of documents structured with printed lines or input boxes, e.g. business forms or tables

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Character Input (AREA)

Abstract

本申请提出一种识别图片中表单数据的方法、装置、设备及存储介质,其中方法包括:获取待识别的目标图片文件;将所述目标图片文件进行分类处理,确定所述目标图片文件中的表单所属的目标类型;根据所述表单所属的目标类型,确定目标识别模型;利用所述目标识别模型,对所述目标图片文件进行识别,以获取所述目标图片文件中包含的表单数据。该方法在目标图片文件中的表单格式不固定时,能够实现对目标图片文件中表单数据的准确识别,提高了识别的准确率,改善了用户体验。

Description

识别图片中表单数据的方法、装置、设备及存储介质
技术领域
本申请涉及字符识别技术领域,特别涉及一种识别图片中表单数据的方法、装置、设备及存储介质。
背景技术
近年来,无纸化办公在各个领域盛行,但是在如***、考勤表、调查表、试卷、银行开户单、医院诊断表等基础业务中,仍然使用印刷在纸张上的表单。为了对这类表单上的信息进行***管理,可以利用扫描仪扫描表单,再从生成的图片中识别出表单信息。
目前,可通过光学字符识别(Optical Character Recognition,OCR)技术,将图片中的文字识别出来。其中,OCR是指通过图像处理和模式识别技术对图片中的光学字符进行识别,并将光学字符翻译成计算机文字的过程。
但是,相关技术中,OCR识别仅能在图片中包括的表单格式固定时,实现对表单信息的准确识别,在图片中包括的表单格式不固定时,识别的准确率较低,用户体验差。
发明内容
本申请实施例提出一种识别图片中表单数据的方法、装置、设备及存储介质,用于解决相关技术中,对包含格式不固定的表单的图片进行识别时,识别的准确率低的问题。
本申请一方面实施例提出了一种识别图片中表单数据的方法,该方法包括:获取待识别的目标图片文件;将所述目标图片文件进行分类处理,确定所述目标图片文件中的表单所属的目标类型;根据所述表单所属的目标类型,确定目标识别模型;利用所述目标识别模型,对所述目标图片文件进行识别,以获取所述目标图片文件中包含的表单数据。
本申请实施例提供的识别图片中表单数据的方法,首先获取待识别的目标图片文件,然后将目标图片文件进行分类处理,确定目标图片文件中的表单所属的目标类型,再根据表单所属的目标类型,确定目标识别模型,最后利用目标识别模型,对目标图片文件进行识别,以获取目标图片文件中包含的表单数据。由此,即使在目标图片文件中的表单格式不固定时,也能够实现对目标图片文件中表单数据的准确识别,提高了识别的准确率,改善了用户体验。
本申请又一方面实施例提出了一种识别图片中表单数据的装置,该装置包括:第一获取模块,用于获取待识别的目标图片文件;分类模块,用于将所述目标图片文件进行分类处理,确定所述目标图片文件中的表单所属的目标类型;第一确定模块,根据所述表单所属的目标类型,确定目标识别模型;识别模块,用于利用所述目标识别模型,对所述目标图片文件进行识别,以获取所述目标图片文件中包含的表单数据。
本申请实施例提供的识别图片中表单数据的装置,首先获取待识别的目标图片文件,然后将目标图片文件进行分类处理,确定目标图片文件中的表单所属的目标类型,再根据表单所属的目标类型,确定目标识别模型,最后利用目标识别模型,对目标图片文件进行识别,以获取目标图片文件中包含的表单数据。由此,即使在目标图片文件中的表单格式不固定时,也能够实现对目标图片文件中表单数据的准确识别,提高了识别的准确率,改善了用户体验。
本申请又一方面实施例提出了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时,以实现上述实施例所述的识别图片中表单数据的方法。
本申请实施例提供的计算机设备,首先获取待识别的目标图片文件,然后将目标图片文件进行分类处理,确定目标图片文件中的表单所属的目标类型,再根据表单所属的目标类型,确定目标识别模型,最后利用目标识别模型,对目标图片文件进行识别,以获取目标图片文件中包含的表单数据。由此,在目标图片文件中的表单格式不固定时,也能够实现对目标图片文件中表单数据的准确识别,提高了识别的准确率,改善了用户体验。
本申请的又一方面实施例提出了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时,以实现上述实施例所述的识别图片中表单数据的方法。
本申请实施例提供的计算机可读存储介质,可以设置在能够识别图片中表单数据的计算机设备中,在目标图片文件中表单格式不固定时,通过执行其上存储的计算机程序,能够实现对目标图片文件中表单数据的准确识别,提高了识别的准确率,改善了用户体验。
本申请附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本申请的实践了解到。
附图说明
本申请上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
图1为本申请一个实施例的识别图片中表单数据的方法的流程示意图;
图2为本申请另一个实施例的识别图片中表单数据的方法的流程示意图;
图3为本申请一个实施例的预先设置的图像参数集中的各参数格式的示例图;
图4为本申请一个实施例的目标图片文件对应的图像参数集中的各参数格式的示例图;
图5为本申请一个实施例的识别图片中表单数据的装置的结构示意图;
图6为本申请另一个实施例的识别图片中表单数据的装置的结构示意图;
图7为本申请一个实施例的计算机设备的结构示意图;
图8为本申请另一个实施例的计算机设备的结构示意图。
具体实施方式
下面详细描述本申请的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本申请,而不能理解为对本申请的限制。
本申请中各实施例主要针对相关技术中,OCR识别仅能在图片中包括的表单格式固定时,实现对表单信息的准确识别,在图片中包括的表单格式不固定时,识别的准确率较低,用户体验差的问题,提出一种识别图片中表单数据的方法。
本申请实施例提供的识别图片中表单数据的方法,在获取待识别的目标图片文件后,先将目标图片文件进行分类处理,以确定目标图片文件中的表单所属的目标类型,然后根据表单所属的目标类型,确定目标识别模型,从而利用目标识别模型,对目标图片文件进行识别,以获取目标图片文件中包含的表单数据。由此,即使在目标图片文件中的表单格式不固定时,也能够实现对目标图片文件中表单数据的准确识别,提高了识别的准确率,改善了用户体验。
下面参考附图描述本申请实施例的识别图片中表单数据的方法、装置、设备及存储介质。
首先结合附图1,对本申请实施例提供的识别图片中表单数据的方法进行具体说明。
图1为本申请一个实施例的识别图片中表单数据的方法的流程示意图。
如图1所示,本申请的识别图片中表单数据的方法,可以包括以下步骤:
步骤101,获取待识别的目标图片文件。
具体的,本申请实施例提供的识别图片中表单数据的方法的执行主体,可以为本申请实施例提供的识别图片中表单数据的装置,以下简称识别装置。其中,该识别装置可以被配置在任何计算机设备中,以对待识别的目标图片文件进行准确识别。
其中,目标图片文件,可以是扫描仪对表单等文本资料进行扫描后生成的图片文件,也可以是摄像装置对文本资料进行拍摄后生成的图片文件,还可以是通过其它方式生成的图片文件,此处不作限制。
可以理解的是,在一些特定机构,如银行、医院和行政部门等,有其属于自身的专属表单,这些专属表单的格式通常是不固定的,例如表单中可能都有姓名、性别等内容,但这些内容所处的位置可能不同。在本申请实施例中,目标图片文件,可以是对具有不固定格式的银行、医院、行政部门等机构中的专属表单进行扫描后,生成的目标图片文件。当然,对于由身份证、护照、车牌号等具有固定格式的表单生成的图片文件,也可以采用本申请实施例的识别图片文件中表单数据的方法,本申请对此不作限制。
步骤102,将目标图片文件进行分类处理,确定目标图片文件中的表单所属的目标类型。
具体的,可以通过以下方式,将目标图片文件进行分类处理,以确定目标图片文件中的表单所属的目标类型。即,步骤102具体可以包括:
对目标图片文件进行图像识别,确定目标图片文件对应的图像参数集;
根据图像参数集中各参数与各表单类型的映射关系,确定目标图片文件中表单所属的目标类型。
其中,图像参数集中,可以包括姓名、身份证号码、电话号码、家庭住址、工作单位等参数。
具体实现时,可以预先设置各表单类型与图像参数集中各参数的映射关系,从而在确定目标图片文件对应的图像参数集后,可以根据目标图片文件对应的图像参数集中各参数,及预设的各表单类型与图像参数集中各参数的映射关系,确定目标图片文件中表单所属的目标类型。
举例来说,假设预先设置表单所属的类型为a时,对应的图像参数集中包括的参数为:A1、A2、A3、A4;表单所属的类型为b时,对应的图像参数集中包括的参数为:B1、B2、B3、B4;表单所属的类型为c时,对应的图像参数集中包括的参数为:C1、C2、C3、C4。则对目标图片文件进行图像识别,确定目标图片文件对应的图像参数集中包括A1、A2、A3、A4时,可以根据预设的各表单类型与图像参数集中各参数的映射关系,确定目标图片文件中表单所属的目标类型为a。
需要说明的是,在根据目标图片文件对应的图像参数集中各参数,及预设的各表单类型与图像参数集中各参数的映射关系,确定目标图片文件中表单所属的目标类型时,目标图片文件对应的图像参数集中各参数可能与预设的映射关系中的各图像参数集中各参数不能完全匹配。此时,可以根据目标图片文件对应的图像参数集与各表单类型分别对应的各图像参数集的匹配度,确定目标图片文件中表单所属的目标类型。
具体的,可以将目标图片文件对应的图像参数集中各参数与预设的各表单类型分别对应的各图像参数集中的各参数进行比对,从而根据目标图片文件对应的图像参数集中各参数,分别与各表单类型对应的各图像参数集中各参数的各匹配度,确定目标图片文件对应的图像参数集与各表单类型分别对应的各图像参数集的匹配度,从而将匹配度最高的图像参数集对应的表单类型,确定为目标图片文件中表单所属的目标类型。
比如,假设预先设置表单所属的类型为a时,对应的图像参数集中包括的参数为:A1、A2、A3、A4;表单所属的类型为b时,对应的图像参数集中包括的参数为:B1、B2、B3、B4;表单所属的类型为c时,对应的图像参数集中包括的参数为:C1、C2、C3、C4。对目标图片文件进行图像识别后,确定目标图片文件对应的图像参数集中包括A1、A2、A3、B4。由于A1、A2、A3分别与类型a对应的图像参数集中包括的参数匹配,B4与类型b对应的图像参数集中包括的参数匹配,则可以确定目标图片文件对应的图像参数集与类型a对应的图像参数集的匹配度为75%,与类型b对应的图像参数集的匹配度为25%,从而根据两个匹配度的大小,可以确定目标图片文件中表单所属的目标类型为a。
另外,在一种可能的实现形式中,目标图片文件对应的图像参数集中的某一个或多个参数,可能与预先设置的各表单类型分别对应的各图像参数集中的任一参数均不匹配。此时,可以不考虑该一个或多个参数,仅根据其余参数,确定目标图片文件中表单所属的目标类型。需要说明的是,若该一个或多个参数在目标图片文件对应的图像参数集中所占比例较大,还可以根据该目标图片文件,对预设的各表单类型与图像参数集中各参数的映射关系进行补充完善。
举例来说,假设预先设置表单所属的类型为a时,对应的图像参数集中包括的参数为:A1、A2、A3、A4;表单所属的类型为b时,对应的图像参数集中包括的参数为:B1、B2、B3、B4;表单所属的类型为c时,对应的图像参数集中包括的参数为:C1、C2、C3、C4。对目标图片文件进行图像识别后,确定目标图片文件对应的图像参数集中包括A1、A2、A3、D。由于D与预先设置的各表单类型分别对应的各图像参数集中的任一参数均不匹配,而A1、A2、A3分别与类型a对应的图像参数集中各参数匹配,则可以确定目标图片文件中表单所属的目标类型为a。
需要说明的是,在每次对目标图片文件进行识别时,可以记录目标图片文件对应的图像参数集中包括的各参数情况,从而可以根据多次记录,对预设的各表单类型与图像参数集中各参数的映射关系进行更新。
比如,继续以上述示例为例,可以预先设置一个阈值,在多次识别后发现,图像参数集中包括A1、A2、A3、D的情况出现的次数大于阈值时,则认为a类型的表单可能进行了更新。此时,可以将原有的映射关系中,类型a对应的图像参数集中的各参数A1、A2、A3、A4替换为A1、A2、A3、D;或者,在原有的映射关系中,增加类型a与图像参数集中的各参数A1、A2、A3、D的对应关系,以对预设的各表单类型与图像参数集中各参数的映射关系进行更新。
步骤103,根据表单所属的目标类型,确定目标识别模型。
具体的,可以预先训练各表单类型分别对应的识别模型,并存储各表单类型与识别模型的对应关系,从而在确定目标图片文件中的表单所属的目标类型后,可以根据表单所属的目标类型,及预先存储的各表单类型与识别模型的对应关系,确定目标识别模型。
举例来说,假设预先存储的各表单类型与识别模型的对应关系为:银行开户单类型对应识别模型A,考勤表类型对应识别模型B,医院诊断表类型对应识别模型C,则在确定目标图片文件中表单所属的目标类型为银行开户单类型时,可以确定目标识别模型为识别模型A。
进一步的,在根据表单所属的目标类型,及预先存储的各表单类型与识别模型的对应关系,确定目标识别模型之前,还需要先训练生成各表单类型分别对应的识别模型。
具体的,可以先获取各表单类型分别对应的表单样本数据集,并对各表单样本数据集中的各表单所属的类型分别进行标记,然后分别利用各表单类型的表单样本数据集中的各表单,对初始识别模型进行训练,以分别生成各个类型对应的识别模型。
也即是说,在步骤103之前,还可以包括:
获取与目标类型对应的表单样本数据集;
利用表单样本数据集中的各表单对初始识别模型进行训练,以生成与目标类型对应的目标识别模型。
其中,初始识别模型,可以是OCR的深度学习目标检测模型。
步骤104,利用目标识别模型,对目标图片文件进行识别,以获取目标图片文件中包含的表单数据。
具体的,根据表单所属的目标类型,确定目标识别模型后,即可利用目标识别模型,对目标图片文件进行识别,以获取目标图片文件中包含的表单数据。
可以理解的是,在实际运用中,用户需要的可能不是目标图片文件的表单中的所有数据,那么,在本申请实施例中,可以根据用户的需要,利用目标识别模型,仅识别出用户需要的表单数据,以更好的满足用户需求。
具体实现时,可以利用目标识别模型对目标图片文件进行识别,以获取目标图片文件中包含的字符数据集,然后根据目标识别模型对应的目标字段的属性信息,从字符数据集中获取目标表单数据。
其中,字符数据集中,包括目标图片文件的表单中的各字符数据。
另外,目标字段,指目标图片文件中,需要识别的字段。目标字段的属性信息,可以包括目标字段的长度、目标字段的名称、目标字段的个数等任意与目标字段有关的信息。目标表单数据,为用户需要的表单数据。其中,目标字段的属性信息,可以根据需要设置。
举例来说,假设目标图片文件中表单所属的类型为银行开户单类型,对应的目标识别模型为识别模型A。用户需要识别出目标图片文件的表单中的银行机构号和用户的身份证号码,则设置识别模型A对应的目标字段的个数为2个,2个目标字段的名称分别为“开户机构号”及“身份证号码”,对应的目标字段的长度分别为5个字符及18个字符。从而识别装置可以先利用识别模型A,对目标图片文件进行识别,获取目标图片文件中包含的字符数据集,然后根据识别模型A对应的目标字段的属性信息,从字符数据集中获取目标表单数据。其中,目标表单数据包括目标图片文件的表单中的开户机构号“178XX”及身份证号码“123456XXXXXXXXXXXX”。
可以理解的是,在对目标图片文件进行识别时,通过利用目标识别模型,对目标图片文件进行识别,获取目标图片文件中包含的字符数据集后,根据目标识别模型对应的目标字段的属性信息,从字符数据集中获取目标表单数据,实现了对目标图片文件中用户需要识别的字段进行识别,从而更好的满足了用户需求,改善了用户体验。
需要说明的是,为了实现利用目标识别模型,对目标图片文件中用户需要识别的目标字段进行识别,以获取用户需要的目标表单数据,在对初始识别模型进行训练时,还需要使生成的目标识别模型能够实现仅对用户需要识别的目标字段进行识别。
具体的,可以在获取与目标类型对应的表单样本数据集后,对表单样本数据集中,各表单对应的目标字段进行标记,从而利用标记后的各表单对初始识别模型进行训练,以生成与目标类型对应的目标识别模型。
本申请实施例提供的识别图片中表单数据的方法,首先获取待识别的目标图片文件,然后将目标图片文件进行分类处理,确定目标图片文件中的表单所属的目标类型,再根据表单所属的目标类型,确定目标识别模型,最后利用目标识别模型,对目标图片文件进行识别,以获取目标图片文件中包含的表单数据。由此,即使在目标图片文件中的表单格式不固定时,也能够实现对目标图片文件中表单数据的准确识别,提高了识别的准确率,改善了用户体验。
通过上述分析可知,本申请在对目标图片文件进行分类处理,确定目标图片中的表单所属的目标类型后,可以利用目标类型对应的目标识别模型,对目标图片文件进行识别,以获取目标图片文件中包含的表单数据。在实际运用中,相同类型的表单的格式可能不同,比如,在不同的银行卡中,可能都包括用户姓名、银行***码,有效年月,但这些内容在银行卡上所占区域的大小可能不同,所处的位置可能也不同。下面针对上述情况,结合图2,对本申请的识别图片中表单数据的方法进行进一步的说明。
图2为本申请另一个实施例的识别图片中表单数据的方法的流程示意图。
如图2所示,本申请实施例的识别图片中表单数据的方法,可以包括以下步骤:
步骤201,获取待识别的目标图片文件。
步骤202,对目标图片文件进行图像识别,确定目标图片文件对应的图像参数集。
步骤203,根据图像参数集中各参数与各表单类型的映射关系,确定目标图片文件中表单所属的目标类型。
步骤204,根据表单所属的目标类型,确定目标识别模型。
其中,上述步骤201-204的具体实现过程及原理,可以参照上述实施例的详细描述,此处不再赘述。
步骤205,将目标图片文件对应的图像参数集中的各参数进行重组处理,以生成待识别的图片文件。
其中,对各参数进行重组处理,可以包括对各参数在表单中所占区域的大小、各参数所处位置等进行的调整。
具体的,可以预先设置各个类型的表单对应的各参数的格式,并设置各表单类型对应的识别模型能够分别对其进行识别,则在识别装置根据表单所属的目标类型,确定目标识别模型后,即可根据预先设置的目标类型的表单对应的各参数的格式,对目标图片文件对应的图像参数集中的各参数进行重组处理,以将各参数的格式调整为目标识别模型能够识别的参数格式,从而生成待识别的图片文件。
举例来说,假设预先设置银行卡类型的表单对应的各参数的格式为图3所示的格式,对应识别模型A。则识别装置确定目标图片文件中的表单所属的类型为银行卡类型、目标识别模型为识别模型A,且目标图片文件对应的图像参数集中,各参数的格式为图4所示的格式后,即可将各参数的格式调整为图3所示的格式,从而生成待识别的图片文件。
通过在根据目标图片文件中表单所属的目标类型,确定目标识别模型后,将目标图片文件对应的图像参数集中的各参数进行重组处理,生成待识别的图片文件,再对待识别的图片文件进行识别,提高了对包含格式不固定的表单的图片文件进行识别的准确性。
步骤206,利用目标识别模型,对待识别的图片文件进行识别,以获取待识别的图片文件中包含的字符数据集。
步骤207,根据目标识别模型对应的目标字段的属性信息,从字符数据集中获取目标表单数据。
具体的,识别装置将目标图片文件对应的图像参数集中的各参数进行重组处理,生成待识别的图片文件后,即可利用目标识别模型,对待识别的图片文件进行识别,以获取待识别的图片文件中包含的字符数据集,进而根据目标识别模型对应的目标字段的属性信息,从字符数据集中获取目标表单数据。
在一种可能的实现形式中,可以通过以下方式,确定目标识别模型对应的目标字段的属性信息。即,在步骤207之前,还可以包括:
获取与目标识别模型对应的配置文件;
根据配置文件,确定目标识别模型对应的目标字段的属性信息。
其中,配置文件,用来对目标识别模型需要识别的字段的长度、名称等属性信息进行配置。
在本申请实施例中,配置文件,可以是用户根据需要配置的,也可以是识别装置在对目标识别模型进行训练时,根据获取的表单样本训练集自动生成的,此处不作限制。
具体的,识别装置获取与目标识别模型对应的配置文件后,即可根据配置文件,确定目标识别模型对应的目标字段的属性信息,从而在利用目标识别模型,对目标图片文件进行识别,获取目标图片文件中包含的字符数据集后,可以根据目标识别模型对应的目标字段的属性信息,从字符数据集中获取目标表单数据,以实现利用目标识别模型,对目标图片文件中需要识别的字段进行识别。
通过根据配置文件,确定目标识别模型对应的目标字段的属性信息,再根据属性信息,从获取的目标图片文件中包含的字符数据集中获取目标表单数据,实现了对目标图片文件中用户需要识别的字段进行识别,从而更好的满足了用户需求,改善了用户体验。
下面参照附图描述本申请实施例提出的识别图片中表单数据的装置。
图5为本申请一个实施例的识别图片中表单数据的装置的结构示意图。
如图5所示,该识别图片中表单数据的装置包括:第一获取模块51、分类模块52、第一确定模块53及识别模块54。
其中,第一获取模块51,用于获取待识别的目标图片文件;
分类模块52,用于将所述目标图片文件进行分类处理,确定所述目标图片文件中的表单所属的目标类型;
第一确定模块53,根据所述表单所属的目标类型,确定目标识别模型;
识别模块54,用于利用所述目标识别模型,对所述目标图片文件进行识别,以获取所述目标图片文件中包含的表单数据。
具体的,本申请实施例提供的识别图片中表单数据的装置,可以执行本申请实施例提供的识别图片中表单数据的方法。该识别图片中表单数据的装置可以被配置在任意计算机设备中,以对待识别的目标图片文件进行准确识别。
作为一种可选的实现形式,分类模块52,具体用于:
对所述目标图片文件进行图像识别,确定所述目标图片文件对应的图像参数集;
根据所述图像参数集中各参数与各表单类型的映射关系,确定所述目标图片文件中表单所属的目标类型。
作为一种可选的实现形式,识别模块54,具体用于:
利用所述目标识别模型,对所述目标图片文件进行识别,以获取所述目标图片文件中包含的字符数据集;
根据所述目标识别模型对应的目标字段的属性信息,从所述字符数据集中获取目标表单数据。
需要说明的是,本实施例的识别图片中表单数据的装置的实施过程和技术原理,参见前述对识别图片中表单数据的方法实施例的解释说明,此处不再赘述。
本申请实施例提供的识别图片中表单数据的装置,首先获取待识别的目标图片文件,然后将目标图片文件进行分类处理,确定目标图片文件中的表单所属的目标类型,再根据表单所属的目标类型,确定目标识别模型,最后利用目标识别模型,对目标图片文件进行识别,以获取目标图片文件中包含的表单数据。由此,即使在目标图片文件中的表单格式不固定时,也能够实现对目标图片文件中表单数据的准确识别,提高了识别的准确率,改善了用户体验。
在示例性实施例中,还提供了一种识别图片中表单数据的装置。
图6为本申请另一个实施例的识别图片中表单数据的装置的结构示意图。
参照图6所示,在图5所示的基础上,本申请的识别图片中表单数据的装置还包括:第二获取模块61、训练模块62、重组模块63、第三获取模块64及第二确定模块65。
其中,第二获取模块61,用于获取与所述目标类型对应的表单样本数据集;
训练模块62,用于利用所述表单样本数据集中的各表单对初始识别模型进行训练,以生成与所述目标类型对应的目标识别模型;
重组模块63,用于将所述目标图片文件对应的图像参数集中的各参数进行重组处理,以生成待识别的图片文件;
相应的,上述识别模块54,具体用于:
对所述待识别的图片文件进行识别。
作为一种可选的实现形式,识别图片中表单数据的装置还包括:
第三获取模块64,用于获取与所述目标识别模型对应的配置文件;
第二确定模块65,用于根据所述配置文件,确定所述目标识别模型对应的目标字段的属性信息。
需要说明的是,本实施例的识别图片中表单数据的装置的实施过程和技术原理,参见前述对识别图片中表单数据的方法实施例的解释说明,此处不再赘述。
本申请实施例提供的识别图片中表单数据的装置,首先获取待识别的目标图片文件,然后将目标图片文件进行分类处理,确定目标图片文件中的表单所属的目标类型,再根据表单所属的目标类型,确定目标识别模型,最后利用目标识别模型,对目标图片文件进行识别,以获取目标图片文件中包含的表单数据。由此,即使在目标图片文件中的表单格式不固定时,也能够实现对目标图片文件中表单数据的准确识别,提高了识别的准确率,改善了用户体验。
为了实现上述实施例,本申请还提出一种计算机设备。
图7为本申请一个实施例的计算机设备的结构示意图。图7显示的计算机设备仅仅是一个示例,不应对本申请实施例的功能和使用范围带来任何限制。
如图7所示,上述计算机设备200包括:存储器210、处理器220及存储在存储器210上并可在处理器220上运行的计算机程序,所述处理器220执行所述程序时,实现前述实施例所述的识别图片中表单数据的方法。
在一种可选的实现形式中,如图8所示,该计算机设备200还可以包括:存储器210及处理器220,连接不同组件(包括存储器210和处理器220)的总线230,存储器210存储有计算机程序,当处理器220执行所述程序时实现本申请实施例所述的识别图片中表单数据的方法。
总线230表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,***总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(ISA)总线,微通道体系结构(MAC)总线,增强型ISA总线、视频电子标准协会(VESA)局域总线以及***组件互连(PCI)总线。
计算机设备200典型地包括多种计算机设备可读介质。这些介质可以是任何能够被计算机设备200访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
存储器210还可以包括易失性存储器形式的计算机***可读介质,例如随机存取存储器(RAM)240和/或高速缓存存储器250。计算机设备200可以进一步包括其他可移动/不可移动的、易失性/非易失性计算机***存储介质。仅作为举例,存储***260可以用于读写不可移动的、非易失性磁介质(图8未显示,通常称为“硬盘驱动器”)。尽管图8中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如CD-ROM,DVD-ROM或者其他光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线230相连。存储器210可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本申请各实施例的功能。
具有一组(至少一个)程序模块270的程序/实用工具280,可以存储在例如存储器210中,这样的程序模块270包括——但不限于——操作***、一个或者多个应用程序、其他程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块270通常执行本申请所描述的实施例中的功能和/或方法。
计算机设备200也可以与一个或多个外部设备290(例如键盘、指向设备、显示器291等)通信,还可与一个或者多个使得用户能与该计算机设备200交互的设备通信,和/或与使得该计算机设备200能与一个或多个其他计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口292进行。并且,计算机设备200还可以通过网络适配器293与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器293通过总线230与计算机设备200的其他模块通信。应当明白,尽管图中未示出,可以结合计算机设备200使用其他硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID***、磁带驱动器以及数据备份存储***等。
需要说明的是,本实施例的计算机设备的实施过程和技术原理,参见前述对识别图片中表单数据的方法实施例的解释说明,此处不再赘述。
本申请实施例提供的计算机设备,首先获取待识别的目标图片文件,然后将目标图片文件进行分类处理,确定目标图片文件中的表单所属的目标类型,再根据表单所属的目标类型,确定目标识别模型,最后利用目标识别模型,对目标图片文件进行识别,以获取目标图片文件中包含的表单数据。由此,即使在目标图片文件中的表单格式不固定时,也能够实现对目标图片文件中表单数据的准确识别,提高了识别的准确率,改善了用户体验。
为实现上述实施例,本申请还提出一种计算机可读存储介质。
其中该计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时,以实现前述实施例所述的识别图片中表单数据的方法。
一种可选实现形式中,本实施例可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的***、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行***、装置或者器件使用或者与其结合使用。
计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括——但不限于——电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行***、装置或者器件使用或者与其结合使用的程序。
计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括——但不限于——无线、电线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言或其组合来编写用于执行本申请操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如”C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
为实现上述实施例,本申请还提出一种计算机程序,当计算机程序产品中的指令由处理器执行时,执行如前述实施例所述的识别图片中表单数据的方法。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本申请的至少一个实施例或示例中。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本申请的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本申请的实施例所属技术领域的技术人员所理解。
应当理解,本申请的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行***执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
上述提到的存储介质可以是只读存储器,磁盘或光盘等。尽管上面已经示出和描述了本申请的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本申请的限制,本领域的普通技术人员在本申请的范围内可以对上述实施例进行变化、修改、替换和变型。

Claims (9)

1.一种识别图片中表单数据的方法,其特征在于,包括:
获取待识别的目标图片文件;
将所述目标图片文件进行分类处理,确定所述目标图片文件中的表单所属的目标类型;
根据所述表单所属的目标类型,确定目标识别模型;
利用所述目标识别模型,对所述目标图片文件进行识别,以获取所述目标图片文件中包含的表单数据;所述将所述目标图片文件进行分类处理,包括:
对所述目标图片文件进行图像识别,确定所述目标图片文件对应的图像参数集;
根据所述图像参数集中各参数与预设的各表单类型分别对应的各图像参数集中的各参数进行比对,根据目标图片文件对应的图像参数集中各参数,分别与各表单类型对应的各图像参数集中各参数的各匹配度,确定目标图片文件对应的图像参数集与各表单类型分别对应的各图像参数集的匹配度,从而将匹配度最高的图像参数集对应的表单类型,确定为目标图片文件中表单所属的目标类型;
所述确定目标识别模型之后,还包括:根据据预先设置的目标类型的表单对应的各参数的格式,将所述目标图片文件对应的图像参数集中的各参数进行重组处理,以生成待识别的图片文件,其中,对各参数进行重组处理包括:对各参数在表单中所占区域的大小、各参数所处位置进行调整,生成目标识别模型能够识别的参数格式。
2.如权利要求1所述的方法,其特征在于,所述根据所述表单所属的目标类型,确定目标识别模型之前,还包括:
获取与所述目标类型对应的表单样本数据集;
利用所述表单样本数据集中的各表单对初始识别模型进行训练,以生成与所述目标类型对应的目标识别模型。
3.如权利要求1所述的方法,其特征在于,所述确定目标识别模型之后,还包括:
所述对所述目标图片文件进行识别,包括:
对所述待识别的图片文件进行识别。
4.如权利要求1-3任一所述的方法,其特征在于,所述利用所述目标识别模型,对所述目标图片文件进行识别,包括:
利用所述目标识别模型,对所述目标图片文件进行识别,以获取所述目标图片文件中包含的字符数据集;
根据所述目标识别模型对应的目标字段的属性信息,从所述字符数据集中获取目标表单数据。
5.如权利要求4所述的方法,其特征在于,所述从所述字符数据集中获取目标表单数据之前,还包括:
获取与所述目标识别模型对应的配置文件;
根据所述配置文件,确定所述目标识别模型对应的目标字段的属性信息。
6.一种识别图片中表单数据的装置,其特征在于,包括:
第一获取模块,用于获取待识别的目标图片文件;
分类模块,用于将所述目标图片文件进行分类处理,确定所述目标图片文件中的表单所属的目标类型;
第一确定模块,根据所述表单所属的目标类型,确定目标识别模型;
识别模块,用于利用所述目标识别模型,对所述目标图片文件进行识别,以获取所述目标图片文件中包含的表单数据;其中,所述将所述目标图片文件进行分类处理,包括:
对所述目标图片文件进行图像识别,确定所述目标图片文件对应的图像参数集;
根据所述图像参数集中各参数与预设的各表单类型分别对应的各图像参数集中的各参数进行比对,根据目标图片文件对应的图像参数集中各参数,分别与各表单类型对应的各图像参数集中各参数的各匹配度,确定目标图片文件对应的图像参数集与各表单类型分别对应的各图像参数集的匹配度,从而将匹配度最高的图像参数集对应的表单类型,确定为目标图片文件中表单所属的目标类型;所述确定目标识别模型之后,还包括:根据据预先设置的目标类型的表单对应的各参数的格式;将所述目标图片文件对应的图像参数集中的各参数进行重组处理,以生成待识别的图片文件,其中,对各参数进行重组处理包括:对各参数在表单中所占区域的大小、各参数所处位置进行调整,生成目标识别模型能够识别的参数格式。
7.如权利要求6所述的装置,其特征在于,还包括:
第二获取模块,用于获取与所述目标类型对应的表单样本数据集;
训练模块,用于利用所述表单样本数据集中的各表单对初始识别模型进行训练,以生成与所述目标类型对应的目标识别模型。
8.一种计算机设备,其特征在于,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时,以实现如权利要求1-5任一所述的识别图片中表单数据的方法。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时,实现如权利要求1-5任一所述的识别图片中表单数据的方法。
CN201810630395.1A 2018-06-19 2018-06-19 识别图片中表单数据的方法、装置、设备及存储介质 Active CN110619252B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810630395.1A CN110619252B (zh) 2018-06-19 2018-06-19 识别图片中表单数据的方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810630395.1A CN110619252B (zh) 2018-06-19 2018-06-19 识别图片中表单数据的方法、装置、设备及存储介质

Publications (2)

Publication Number Publication Date
CN110619252A CN110619252A (zh) 2019-12-27
CN110619252B true CN110619252B (zh) 2022-11-04

Family

ID=68920452

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810630395.1A Active CN110619252B (zh) 2018-06-19 2018-06-19 识别图片中表单数据的方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN110619252B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111598122B (zh) * 2020-04-01 2022-02-08 深圳壹账通智能科技有限公司 数据校验方法、装置、电子设备和存储介质
CN111695517B (zh) * 2020-06-12 2023-08-18 北京百度网讯科技有限公司 图像的表格提取方法、装置、电子设备及存储介质
CN112464925A (zh) * 2020-11-11 2021-03-09 湖北省楚建易网络科技有限公司 基于机器学习的移动端开户资料银行信息自动提取方法
CN112613513A (zh) * 2020-12-31 2021-04-06 北京市商汤科技开发有限公司 图像识别方法、装置和***
CN116823152A (zh) * 2023-05-31 2023-09-29 杭州微宏科技有限公司 一种线下表单的自动线上化方法、***、装置和介质

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103034848A (zh) * 2012-12-19 2013-04-10 方正国际软件有限公司 一种表单类型的识别方法
CN103793846A (zh) * 2014-01-20 2014-05-14 中国建设银行股份有限公司 业务凭证的要素信息的处理方法及装置
CN105095842A (zh) * 2014-05-22 2015-11-25 阿里巴巴集团控股有限公司 一种单据的信息识别的方法和装置
CN105426356A (zh) * 2015-10-29 2016-03-23 杭州九言科技股份有限公司 一种目标信息识别方法和装置
CN105678612A (zh) * 2015-12-30 2016-06-15 远光软件股份有限公司 移动端原始凭证电子化智能填单***及方法
CN106557747A (zh) * 2016-11-15 2017-04-05 平安科技(深圳)有限公司 识别保险单号码的方法及装置
CN107133571A (zh) * 2017-04-11 2017-09-05 上海众开信息科技有限公司 一种将纸质***自动生成财务报表的***及方法
CN107358232A (zh) * 2017-06-28 2017-11-17 中山大学新华学院 基于插件的***识别方法、及识别与管理***
CN107766809A (zh) * 2017-10-09 2018-03-06 平安科技(深圳)有限公司 电子装置、票据信息识别方法和计算机可读存储介质
CN107798299A (zh) * 2017-10-09 2018-03-13 平安科技(深圳)有限公司 票据信息识别方法、电子装置及可读存储介质

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103034848A (zh) * 2012-12-19 2013-04-10 方正国际软件有限公司 一种表单类型的识别方法
CN103793846A (zh) * 2014-01-20 2014-05-14 中国建设银行股份有限公司 业务凭证的要素信息的处理方法及装置
CN105095842A (zh) * 2014-05-22 2015-11-25 阿里巴巴集团控股有限公司 一种单据的信息识别的方法和装置
CN105426356A (zh) * 2015-10-29 2016-03-23 杭州九言科技股份有限公司 一种目标信息识别方法和装置
CN105678612A (zh) * 2015-12-30 2016-06-15 远光软件股份有限公司 移动端原始凭证电子化智能填单***及方法
CN106557747A (zh) * 2016-11-15 2017-04-05 平安科技(深圳)有限公司 识别保险单号码的方法及装置
CN107133571A (zh) * 2017-04-11 2017-09-05 上海众开信息科技有限公司 一种将纸质***自动生成财务报表的***及方法
CN107358232A (zh) * 2017-06-28 2017-11-17 中山大学新华学院 基于插件的***识别方法、及识别与管理***
CN107766809A (zh) * 2017-10-09 2018-03-06 平安科技(深圳)有限公司 电子装置、票据信息识别方法和计算机可读存储介质
CN107798299A (zh) * 2017-10-09 2018-03-13 平安科技(深圳)有限公司 票据信息识别方法、电子装置及可读存储介质

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
基于BP神经网络的银行票据识别;韩梦迪等;《信息通信》;20160915(第09期);全文 *
模式识别在银行票据自动化处理中的集成应用;石甲玉;《万方数据库》;20070807;第3章 *
石甲玉.模式识别在银行票据自动化处理中的集成应用.《万方数据库》.2007, *

Also Published As

Publication number Publication date
CN110619252A (zh) 2019-12-27

Similar Documents

Publication Publication Date Title
CN110619252B (zh) 识别图片中表单数据的方法、装置、设备及存储介质
CN108564035B (zh) 识别单据上记载的信息的方法及***
AU2017302250B2 (en) Optical character recognition in structured documents
RU2571545C1 (ru) Классификация изображений документов на основании контента
US11810070B2 (en) Classifying digital documents in multi-document transactions based on embedded dates
CN108549643B (zh) 翻译处理方法和装置
CN110084289B (zh) 图像标注方法、装置、电子设备及存储介质
EP3709212A1 (en) Image processing method and device for processing image, server and storage medium
JP2016048444A (ja) 帳票識別プログラム、帳票識別装置、帳票識別システム、および帳票識別方法
US11106933B2 (en) Method, device and system for processing image tagging information
CN112862024B (zh) 一种文本识别方法及***
KR102292775B1 (ko) 학습 서비스 시스템 및 방법
Lee et al. Robust handwriting extraction and lecture video summarization
CN112149663A (zh) 结合rpa和ai的图像文字的提取方法、装置及电子设备
EP3227855A1 (en) System and method for interacting with information posted in the media
US20220262154A1 (en) Determining experiments represented by images in documents
CN111914729A (zh) 凭证关联方法、装置、计算机设备及存储介质
CN110889406B (zh) 一种习题数据卡的信息采集方法、***及终端
JP6529254B2 (ja) 情報処理装置、情報処理方法、プログラムおよび記憶媒体
US11120074B2 (en) Streamlining citations and references
CN113158773A (zh) 一种活体检测模型的训练方法及训练装置
CN104992136B (zh) 识别条形码的方法及装置
US9928451B2 (en) Information processing apparatus, controlling method, and computer-readable storage medium
CN113486171B (zh) 一种图像处理方法及装置、电子设备
CN110941947A (zh) 一种文档编辑的方法、装置、计算机存储介质及终端

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant