CN109658584B - 一种票据信息识别方法及装置 - Google Patents

一种票据信息识别方法及装置 Download PDF

Info

Publication number
CN109658584B
CN109658584B CN201811534525.8A CN201811534525A CN109658584B CN 109658584 B CN109658584 B CN 109658584B CN 201811534525 A CN201811534525 A CN 201811534525A CN 109658584 B CN109658584 B CN 109658584B
Authority
CN
China
Prior art keywords
bill
template
identified
affine transformation
transformation matrix
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811534525.8A
Other languages
English (en)
Other versions
CN109658584A (zh
Inventor
马文伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Taikang Insurance Group Co Ltd
Taikang Online Property Insurance Co Ltd
Original Assignee
Taikang Insurance Group Co Ltd
Taikang Online Property Insurance Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Taikang Insurance Group Co Ltd, Taikang Online Property Insurance Co Ltd filed Critical Taikang Insurance Group Co Ltd
Priority to CN201811534525.8A priority Critical patent/CN109658584B/zh
Publication of CN109658584A publication Critical patent/CN109658584A/zh
Application granted granted Critical
Publication of CN109658584B publication Critical patent/CN109658584B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G07CHECKING-DEVICES
    • G07DHANDLING OF COINS OR VALUABLE PAPERS, e.g. TESTING, SORTING BY DENOMINATIONS, COUNTING, DISPENSING, CHANGING OR DEPOSITING
    • G07D7/00Testing specially adapted to determine the identity or genuineness of valuable papers or for segregating those which are unacceptable, e.g. banknotes that are alien to a currency
    • G07D7/20Testing patterns thereon
    • G07D7/202Testing patterns thereon using pattern matching
    • G07D7/206Matching template patterns

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Image Analysis (AREA)
  • Character Input (AREA)

Abstract

本发明实施例公开了一种票据信息识别方法及装置,通过多特征模板对待识别的票据进行校正,根据模板匹配结果计算特征模板与待识别票据之间的仿射变换矩阵,并验证仿射变换矩阵的正确性,再根据就近原则,通过特征模板与识别信息块的距离关系确定需要截取的识别信息块位于哪个特征模板校正后的票据图像里,进而实现对票面识别信息块的精确定位,提高了定位算法的鲁棒性,同时避免了管道式方式存在的算法关联问题。

Description

一种票据信息识别方法及装置
技术领域
本发明涉及图像识别领域,尤其涉及一种票据信息识别方法及装置。
背景技术
随着人工智能技术尤其是OCR(英文全称:Optical Character Recognition,中文全称:光学字符识别)技术逐渐被引入到智能财务***信息采集***中,利用OCR扫描识别技术自动采集增值税***等票据上的信息,并汇总到表格中。这种方式与人工录入的方式相比,极大地减小了工作量。但作为OCR票据识别的关键环节在于票面识别信息块定位。但是由于受到票据粘贴的平整程度以及票面噪声的影响,定位的票面识别信息块准确度不高,使得票据识别信息提取不完整,甚至提取错误,从而使得整张票据识别失败。
现有技术中,通常采用管道式的方式对票面识别信息块进行定位,例如图像二值化+轮廓检测的方法,或者图像二值化+直线检测的方法,这样的方法,一个算法的输出会作为另外一个算法的输入,但是若其中某个算法出现问题,都会导致整个方法失败。另外,上述方法中还存在着人工设定的经验值,导致算法的鲁棒性较低。
发明内容
有鉴于此,本发明实施例提供了一种票据信息识别方法及装置,解决了现有技术中票面识别信息块定位不准确,算法鲁棒性较低的问题,并且,避免了管道式方式存在的算法关联问题。
本发明实施例公开了一种票据信息识别方法,包括:
对待识别的票据进行分析,确定票据模板和所述票据模板对应的至少一个票据特征模板;
将所述票据特征模板与所述待识别的票据进行匹配,从所述待识别的票据中确定出与每个票据特征模板相匹配的目标区域;
计算每个票据特征模板与所述相匹配的目标区域之间的第一仿射变换矩阵;
验证每个第一仿射变换矩阵的准确度,剔除错误的第一仿射变换矩阵;
利用正确的第一仿射变换矩阵对所述待识别的票据进行校正,得到多个校正后的票据图像;
对多个校正后的票据图像进行识别,得到所述待识别的票据的票据信息。
可选的,所述将所述票据特征模板与所述待识别的票据进行匹配,从所述待识别的票据中确定出与每个票据特征模板相匹配的目标区域,包括:
分别提取每个所述票据特征模板与所述待识别的票据中的特征点;
针对于任何一个票据特征模板,将该票据特征模板中的每个特征点与待识别的票据中每个票据特征点进行匹配,并从所述待识别的票据中的各个特征点中,筛选出符合第一匹配条件的特征点;
将筛选出的符合匹配条件的多个特征点构成的区域作为与票据特征模板相匹配的目标区域。
可选的,所述根据匹配结果,从所述待识别的票据中的各个特征点中,筛选出符合预设条件的特征点之后,所述方法还包括:
对筛选出的多个特征点进行验证,剔除匹配错误的特征点。
可选的,所述验证每个仿射变换矩阵的准确度,剔除错误的仿射变换矩阵,包括:
从待识别的票据中识别出预设标识的位置;
依据所述预设标识在所述票据模板中的位置和待识别票据中的位置,计算第二仿射变换矩阵;
依据所述第二仿射变换矩阵对所述待识别的票据进行校正,得到第一校正票据图像;
判断所述第一校正票据图像中预设标识的位置是否与票据模板中预设标识相同;
若所述第一校正票据图像中预设标识的位置与票据模板中预设标识的位置相同,则依据所述第二仿射变换矩阵对各个第一仿射变换矩阵进行验证,确定出错误的第一仿射变换矩阵。
可选的,所述方法还包括:
根据所述待识别票据的尺寸和票据模板的尺寸,计算所述待识别票据与票据模板的缩放系数;
根据所述缩放系数对第二仿射变换矩阵进行验证。
可选的,所述对多个校正后的票据图像进行识别,得到所述待识别的票据的票据信息,包括:
依据待识别的票据中每个待识别信息的区域与符合条件的票据特征模板的距离,从所述符合条件的票据特征模板中筛选出符合距离条件的目标特征模板;
确定出与所述票据模板中每个待识别信息的区域距离最近的目标特征模板;
确定所述目标特征模板对应的第一仿射变换矩阵校正后的第二校正票据图像;
从所述第二校正票据图像中分割出与所述目标特征模板距离最近的目标待识别信息区域;
识别所述目标待识别信息区域中的票据信息。
可选的,所述依据待识别的票据中每个待识别信息的区域与符合条件的特征模板的距离,从所述符合条件的特征模板中筛选出符合距离条件的目标特征模板,包括:
计算所述票据模板中每个待识别信息的区域与每个票据特征模板的位置偏移矩阵;
依据各个所述偏移矩阵,计算每个待识别信息的区域与每个票据特征模板的距离;
根据每个待识别信息的区域与每个票据特征模板的距离,确定出与每个待识别信息的区域距离最近的目标特征模板。
本发明实施例还公开了一种票据信息识别装置,包括:
票据模板确定单元,用于对待识别的票据进行分析,确定票据模板和所述票据模板对应的至少一个票据特征模板;
匹配单元,用于将所述票据特征模板与所述待识别的票据进行匹配,从所述待识别的票据中确定出与每个票据特征模板相匹配的目标区域;
计算单元,用于计算每个票据特征模板与所述相匹配的目标区域之间的第一仿射变换矩阵;
验证单元,用于验证每个第一仿射变换矩阵的准确度,剔除错误的第一仿射变换矩阵;
校正单元,用于利用正确的第一仿射变换矩阵对所述待识别的票据进行校正,得到多个校正后的票据图像;
识别单元,用于对多个校正后的票据图像进行识别,得到所述待识别的票据的票据信息。
本发明实施例还公开了一种设备,所述设备包括:
存储器,用于存储程序;
处理器,用于运行所述程序,当所述处理器运行所述程序时,所述处理器实现了上述所述的票据信息识别方法。
本发明实施例还公开了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理设备执行时实现上述所述的票据信息识别方法。
本发明实施例公开了一种票据信息识别方法及装置,包括:对待识别的票据进行分析,确定票据模板和所述票据模板对应的至少一个票据特征模板;将所述票据特征模板与所述待识别的票据进行匹配,从所述待识别的票据中确定出与每个票据特征模板相匹配的目标区域;计算每个票据特征模板与所述相匹配的目标区域之间的第一仿射变换矩阵;验证每个第一仿射变换矩阵的准确度,剔除错误的第一仿射变换矩阵;利用正确的第一仿射变换矩阵对所述待识别的票据进行校正,得到多个校正后的票据图像;对多个校正后的票据图像进行识别,得到所述待识别的票据的票据信息。这样,通过多特征模板对待识别的票据进行校正,根据模板匹配结果计算特征模板与待识别票据之间的仿射变换矩阵,并验证仿射变换矩阵的正确性,再根据就近原则,通过特征模板与识别信息块的距离关系确定需要截取的识别信息块位于哪个特征模板校正后的票据图像里,进而实现对票面识别信息块的精确定位,提高了定位算法的鲁棒性,同时避免了管道式方式存在的算法关联问题。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1示出了本发明实施例提供的一种票据信息识别方法的流程示意图;
图2示出了本发明实施例提供的一种票据的示例图;
图3示出了本发明实施例提供一种验证每个仿射变换矩阵的准确度的方法的流程示意图;
图4示出了本发明实施例提供的一种票据信息识别装置的结构示意图;
图5本发明实施例提供了一种票据信息识别设备的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
参考图1,示出了本发明实施例提供的一种票据信息识别方法的流程示意图,在本实施例中,该方法包括:
S101:对待识别的票据进行分析,确定票据模板和所述票据模板对应的至少一个票据特模板;
本实施例中,票据模板为预先筛选出的打印清晰、摆放工整的票据图像。
票据特征模板为从所述票据模板中挑选的细节特征丰富的矩形区域,例如,图2中的***区域、购买方区域、NO.区域等。
通过对待识别的票据进行分析,确定票据模板的方法可以包括多种,本实施例中部进行限定,例如可以采用如下的方法:
将所述待识别的票据输入到已训练的票据识别模型中;所述票据识别模型为通过标记了票据类型的票据样本进行训练后得到的;
输出所述待识别的票据的票据类型;
确定所述票据类型对应的票据模板和所述票据模型对应的至少一个票据特征模板。
S102:将所述票据特征模板与所述待识别的票据进行匹配,从所述待识别的票据中确定出与每个票据特征模板相匹配的目标区域;
本实施例中,每个票据模板可以对应于待识别的票据中的一个矩形区域,在待识别的票据中也会存在相应的区域,具体的匹配过程包括:
分别提取每个所述票据特征模板与所述待识别的票据中的特征点;
针对于任何一个票据特征模板,将该票据特征模板中的每个特征点与待识别的票据中每个票据特征点进行匹配,并从所述待识别的票据中的各个特征点中,筛选出符合第一匹配条件的特征点;
将筛选出的符合匹配条件的多个特征点构成的区域作为与票据特征模板相匹配的目标区域。
本实施例中,特征点匹配的方式有多种,在本实施例中,不进行限定。
例如,可以计算票据特征模板中每个特征点与待识别的票据中每个特征点的相似度,进而筛选出符合预设条件的相似度。具体的,针对于票据特征模板中的任意一个特征点,计算该特征点与待识别的票据中每个特征点的相似度,筛选出相似度最高的特征点。并且,为了提高匹配的准确度,还设置了相似度阈值,过滤掉相似度小于相似度阈值的特征点。
除此之外,由于存在噪音和干扰,会导致一些特征点匹配错误,为了保证匹配的准确度,还可以对筛选出的各个特征点进行验证,确定各个特征点匹配正确,并剔除匹配错误的特征点。
例如,可以采用RANSAC(英文全称:Random Sample Consensus,中文全称:随机抽样一致)算法剔除分类错误的特征点。
S103:计算每个票据特征模板与所述相匹配的目标区域之间的第一仿射变换矩阵;
S104:验证每个第一仿射变换矩阵的准确度,剔除错误的第一仿射变换矩阵;
本实施例中,第一仿射变换矩阵用于对待识别的票据进行校正,例如将待识别的票据经过缩放、角度转换和/或平移操作后,使得校正后的待识别得票据与票据模板大小相同、角度相同以及位置相同,进而实现对待识别的票据中的待识别的票据信息区域进行定位。
例如,仿射变换的过程可以通过如下的公式1)表示:
1)
Figure GDA0002802430930000071
其中,(tx,ty)表示平移量,参数ai(i=1~4)表示仿射变换系数,例如反映图像旋转、缩放等变化。
本实施例中,由于噪声或者干扰问题,在待识别的票据中确定出的与票据特征模板匹配的目标区域可能会存在误差,为了保证校正的准确性,需要对第一仿射变换矩阵的正确性进行验证,具体的,参考图3,S104包括:
S301:从待识别的票据中识别出预设标识的位置;
本实施例中,预设的标识可以表示为票据中位置固定、特征固定的信息,例如图2中的***位置、NO.位置、购买方位置或者密码区位置。
S302:依据所述预设标识在所述票据模板中的位置和待识别票据中的位置,计算第二仿射变换矩阵;
本实施例中,可以采用多种方式从待识别的票据中识别出预设标识,进而确定预设标识的位置,在本实施例中不进行限定。
例如,可以采用预设的标识识别模型对待识别的票据中的标识进行识别,其中,预设的标识识别模型为通过大量的标识样本对预设的机器学习模型进行训练后得到的。
S303:依据所述第二仿射变换矩阵对所述待识别的票据进行校正,得到第一校正票据图像;
S304:判断所述第一校正票据图像中预设标识的位置是否与票据模板中预设标识相同;
S305:若所述第一校正票据图像中预设标识的位置与票据模板中预设标识的位置相同,则依据所述第二仿射变换矩阵对各个第一仿射变换矩阵进行验证,确定出错误的第一仿射变换矩阵。
其中,预设标识的位置为预先知道的位置,该标识在票据模板中的固定位置上。其中,该标识可以为特征模板中的任意一个,也可以为票据模板中其它的特征区域。
举例说明:假设预设的标识为图2中矩形框中的***,该***在增值税***模板中的位置是已知的,属于先验知识。从待识别的票据中识别出该***的位置,计算待识别的票据中***的位置与***模型中***的位置的第二仿射变换矩阵,但是由于第二仿射变换矩阵不一定是完全正确的,因此仍需要对该第二仿射变换的准确性进行校正。校正方法为:根据该第二仿射变换矩阵,可以将待识别的票据进行校正,得到第一校正票据,判断第一校正票据中***的位置是否与***在票据模板中的位置相同。若相同,则表示该第二仿射变换矩阵正确。
但是,若第二仿射变换矩阵不正确时,可以选取其它的预设标识,例如,在标识为***时,计算得到的第二仿射变换矩阵不正确时,可以采用NO.作为预设标识或者采用“购买方”作为特征标识,并重复执行上述S301~S305的步骤。
本实施例中,票据模板和待识别得票据的尺寸是可以准确计量的,可以通过尺寸信息进一步验证第二仿射变换矩阵的准确性,具体的,还包括:
根据所述待识别票据的尺寸和票据模板的尺寸,计算所述待识别票据与票据模板的缩放系数;
根据所述缩放系数对第二仿射变换矩阵进行验证。
举例说明:计算待识别票据和票据模版的长宽比,估计仿射变换的缩放系数,并根据该缩放系数验证第二仿射变换矩阵的准确性。例如,若该缩放系数与第二仿射变换矩阵的缩放系数差别不大,则表示第二仿射变换矩阵的准确度较高,若该缩放系数与第二仿射变换矩阵的缩放系数差别较大,则表示第二仿射变换矩阵准确度较低。S105:利用正确的第一仿射变换矩阵对所述待识别的票据进行校正,得到多个校正后的票据图像;
本实施例中,通过S104的筛选后,得到了多个仿射变换矩阵,依据每个仿射变换矩阵对待识别的票据进行校正,也就得到了多个校正后的票据。
S106:对多个校正后的票据图像进行识别,得到所述待识别的票据的票据信息。
本实施例中,为了提高对待识别信息区域定位的准确性,采用就近原则对校正后的票据中的某个区域的信息进行识别,具体的,包括:
依据待识别的票据中每个待识别信息的区域与符合条件的票据特征模板的距离,从所述符合条件的票据特征模板中筛选出符合距离条件的目标特征模板;
确定出与所述票据模板中每个待识别信息的区域距离最近的目标特征模板;
确定所述目标特征模板对应的第一仿射变换矩阵校正后的第二校正票据图像;
从所述第二校正票据图像中分割出与所述目标特征模板距离最近的目标待识别信息区域;
识别所述目标待识别信息区域中的票据信息。
本实施例中,对于目标特征模板的筛选可以包括如下的两种实施方式:
实施方式一:符合条件的票据特征模板为全部的票据特征模板,第一距离条件为:与待识别的票据中待识别信息区域距离最近的目标特征模板,具体的,包括:
计算所述票据模板中每个待识别信息的区域与每个票据特征模板的位置偏移矩阵;
依据各个所述偏移矩阵,计算每个待识别信息的区域与每个票据特征模板的距离;
根据每个待识别信息的区域与每个票据特征模板的距离,确定出与每个待识别信息的区域距离最近的目标特征模板。
其中,针对于确定出的目标特征模板,若校正后的图像中,并不包含通过目标特征模板对应的仿射变换矩阵得到的校正图像,则剔除掉该目标特征模板,再从剩余的特征模板中筛选一个与待识别票据中的待识别信息的区域距离最近的目标特征。
实施方式二:符合条件的特征模板为参与票据校正的第一仿射变换矩阵对应的票据特征模板,距离条件为:与待识别的票据中待识别信息区域距离最近的目标特征模板,具体的,包括:
计算所述票据模板中每个待识别信息的区域与每个符合预设条件的票据特征模板的位置偏移矩阵;
依据各个所述偏移矩阵,计算每个待识别信息的区域与每个符合预设条件的票据特征模板的距离;
根据每个待识别信息的区域与每个符合预设条件的票据特征模板的距离,确定出与每个待识别信息的区域距离最近的目标特征模板。
本实施例中,通过多特征模板对待识别的票据进行校正,根据模板匹配结果计算特征模板与待识别票据之间的仿射变换矩阵,并验证仿射变换矩阵的正确性,再根据就近原则,通过特征模板与识别信息块的距离关系确定需要截取的识别信息块位于哪个特征模板校正后的票据图像里,进而实现对票面识别信息块的精确定位,提高了定位算法的鲁棒性,同时避免了管道式方式存在的算法关联问题。
参考图4,示出了本发明实施例提供的一种票据信息识别装置的结构示意图,在本实施例中,该装置包括:
票据模板确定单元401,用于对待识别的票据进行分析,确定票据模板和所述票据模板对应的至少一个票据特征模板;
匹配单元402,用于将所述票据特征模板与所述待识别的票据进行匹配,从所述待识别的票据中确定出与每个票据特征模板相匹配的目标区域;
计算单元403,用于计算每个票据特征模板与所述相匹配的目标区域之间的第一仿射变换矩阵;
验证单元404,用于验证每个第一仿射变换矩阵的准确度,剔除错误的第一仿射变换矩阵;
校正单元405,用于利用正确的第一仿射变换矩阵对所述待识别的票据进行校正,得到多个校正后的票据图像;
识别单元406,用于对多个校正后的票据图像进行识别,得到所述待识别的票据的票据信息。
可选的,所述匹配单元,包括:
特征点提取子单元,用于分别提取每个所述票据特征模板与所述待识别的票据中的特征点;
筛选子单元,用于针对于任何一个票据特征模板,将该票据特征模板中的每个特征点与待识别的票据中每个票据特征点进行匹配,并从所述待识别的票据中的各个特征点中,筛选出符合第一匹配条件的特征点;
第一确定子单元,用于将筛选出的符合匹配条件的多个特征点构成的区域作为与票据特征模板相匹配的目标区域。
可选的,所述匹配单元,还包括:
第一验证子单元,用于对筛选出的多个特征点进行验证,剔除匹配错误的特征点。
可选的,所述验证单元,包括:
识别子单元,用于从待识别的票据中识别出预设标识的位置;
第一计算子单元,用于依据所述预设标识在所述票据模板中的位置和待识别票据中的位置,计算第二仿射变换矩阵;
第一校正子单元,用于依据所述第二仿射变换矩阵对所述待识别的票据进行校正,得到第一校正票据图像;
判断子单元,用于判断所述第一校正票据图像中预设标识的位置是否与票据模板中预设标识相同;
验证子单元,用于若所述第一校正票据图像中预设标识的位置与票据模板中预设标识的位置相同,则依据所述第二仿射变换矩阵对各个第一仿射变换矩阵进行验证,确定出错误的第一仿射变换矩阵。
可选的,所述验证单元,还包括:
第二计算子单元,用于根据所述待识别票据的尺寸和票据模板的尺寸,计算所述待识别票据与票据模板的缩放系数;
第二验证子单元,用于根据所述缩放系数对第二仿射变换矩阵进行验证。
可选的,所述识别单元,包括:
筛选子单元,用于依据待识别的票据中每个待识别信息的区域与符合条件的特征模板的距离,从所述符合条件的特征模板中筛选出符合第一距离条件的目标特征模板;
第二确定子单元,用于确定出与所述票据模板中每个待识别信息的区域距离最近的目标特征模板;
第三确定子单元,用于确定所述目标特征模板对应的仿射变换矩阵校正后的第二校正票据;
分割子单元,用于从所述第二校正票据中分割出与所述目标特征模板距离最近的目标待识别信息区域;
识别子单元,用于识别所述目标待识别信息区域中的票据信息。
可选的,所述筛选子单元,具体用于:
计算所述票据模板中每个待识别信息的区域与每个票据特征模板的位置偏移矩阵;
依据各个所述偏移矩阵,计算每个待识别信息的区域与每个票据特征模板的距离;
根据每个待识别信息的区域与每个票据特征模板的距离,确定出与每个待识别信息的区域距离最近的目标特征模板。
本实施例的装置,通过多特征模板对待识别的票据进行校正,并验证不同模板匹配过程中仿射变换矩阵的正确性,及时排除错误的仿射变换矩阵,并通过就近原则,通过距离待识别信息得区域距离最近的特征模板校正后图像中定位该待识别的信息的区域,进而实现对票面识别信息块更加精确的定位,提高了算法的鲁棒性,并且,避免了管道式方式存在的算法关联问题。
参考图5,示出了本发明实施例提供了一种票据信息识别设备的结构示意图,在本实施例中,该设备包括存储器501、处理器502;
其中,存储器501,用于存储程序;
处理器502,用于运行所述程序,具体的,处理器执行程序时实现以下步骤:
对待识别的票据进行分析,确定票据模板和所述票据模板对应的至少一个票据特征模板;
将所述票据特征模板与所述待识别的票据进行匹配,从所述待识别的票据中确定出与每个票据特征模板相匹配的目标区域;
计算每个票据特征模板与所述相匹配的目标区域之间的第一仿射变换矩阵;
验证每个仿射变换矩阵的准确度,剔除错误的第一仿射变换矩阵;
利用正确的第一仿射变换矩阵对所述待识别的票据进行校正,得到多个校正后的票据;
对多个校正后的票据进行识别,得到所述待识别的票据的票据信息。
可选的,所述将所述票据特征模板与所述待识别的票据进行匹配,从所述待识别的票据中确定出与每个票据特征模板相匹配的目标区域,包括:
分别提取每个所述票据特征模板与所述待识别的票据中的特征点;
计算所述待识别的票据中每个特征点与每个票据特征模板中各个特征点的相似度;依据所述待识别的票据中每个特征点与每个票据特征模板中各个特征点点的相似度,对所述待识别的票据中的各个特征点进行分类;
确定与每个类别所属的目标区域相匹配的特征模板。
可选的,所述确定与每个类别所属的目标区域相匹配的特征模板之后,还包括:
对任何一个类别包含的特征点进行验证,剔除分类错误的特征点。
可选的,所述验证每个仿射变换矩阵的准确度,剔除错误的仿射变换矩阵,包括:
从待识别的票据中识别出预设标识的位置;
依据所述预设标识在所述票据模板中的位置和待识别票据中的位置,计算第二仿射变换矩阵;
依据所述第二仿射变换矩阵对所述待识别的票据进行校正,得到第一校正票据;
判断所述第一校正票据中预设标识的位置是否与票据模板中预设标识相同;
若所述第一校正票据中预设标识的位置与票据模板中预设标识的位置相同,则依据所述第二仿射变换矩阵对各个第一仿射变换矩阵进行验证,确定出错误的第一仿射变换矩阵。
可选的,所述方法还包括:
根据所述待识别票据的尺寸和票据模板的尺寸,计算所述待识别票据与票据模板的缩放系数;
根据所述缩放系数对第二仿射变换矩阵进行验证。
可选的,所述对多个校正后的票据进行识别,得到所述待识别的票据的票据信息,包括:
依据待识别的票据中每个待识别信息的区域与符合条件的特征模板的距离,从所述符合条件的特征模板中筛选出符合第一距离条件的目标特征模板;
确定出与所述票据模板中每个待识别信息的区域距离最近的目标特征模板;
确定所述目标特征模板对应的仿射变换矩阵校正后的第二校正票据;
从所述第二校正票据中分割出与所述目标特征模板距离最近的目标待识别信息区域;
识别所述目标待识别信息区域中的票据信息。
可选的,所述所述依据待识别的票据中每个待识别信息的区域与符合条件的特征模板的距离,从所述符合条件的特征模板中筛选出符合第一距离条件的目标特征模板,包括:
计算所述票据模板中每个待识别信息的区域与每个票据特征模板的位置偏移矩阵;
依据各个所述偏移矩阵,计算每个待识别信息的区域与每个票据特征模板的距离;
根据每个待识别信息的区域与每个票据特征模板的距离,确定出与每个待识别信息的区域距离最近的目标特征模板。
其中,本实施例的设备中的存储器可以包括计算机可读存储介质中的非永久性存储器、随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器或者闪存(falshRAM),存储器包括至少一个存储芯片。
需要说明的是,本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (9)

1.一种票据信息识别方法,其特征在于,包括:
对待识别的票据进行分析,确定票据模板和所述票据模板对应的至少一个票据特征模板;
将所述票据特征模板与所述待识别的票据进行匹配,从所述待识别的票据中确定出与每个票据特征模板相匹配的目标区域;
计算每个票据特征模板与所述相匹配的目标区域之间的第一仿射变换矩阵;
从待识别的票据中识别出预设标识的位置;
依据所述预设标识在所述票据模板中的位置和待识别票据中的位置,计算第二仿射变换矩阵;
依据所述第二仿射变换矩阵对所述待识别的票据进行校正,得到第一校正票据图像;
判断所述第一校正票据图像中预设标识的位置是否与票据模板中预设标识相同;
若所述第一校正票据图像中预设标识的位置与票据模板中预设标识的位置相同,则依据所述第二仿射变换矩阵对各个第一仿射变换矩阵进行验证,确定出错误的第一仿射变换矩阵;
利用正确的第一仿射变换矩阵对所述待识别的票据进行校正,得到多个校正后的票据图像;
对多个校正后的票据图像进行识别,得到所述待识别的票据的票据信息。
2.根据权利要求1所述的方法,其特征在于,所述将所述票据特征模板与所述待识别的票据进行匹配,从所述待识别的票据中确定出与每个票据特征模板相匹配的目标区域,包括:
分别提取每个所述票据特征模板与所述待识别的票据中的特征点;
针对于任何一个票据特征模板,将该票据特征模板中的每个特征点与待识别的票据中每个票据特征点进行匹配,并从所述待识别的票据中的各个特征点中,筛选出符合第一匹配条件的特征点;
将筛选出的符合匹配条件的多个特征点构成的区域作为与票据特征模板相匹配的目标区域。
3.根据权利要求2所述的方法,其特征在于,根据匹配结果,从所述待识别的票据中的各个特征点中,筛选出符合预设条件的特征点之后,所述方法还包括:
对筛选出的多个特征点进行验证,剔除匹配错误的特征点。
4.根据权利要求1所述的方法,其特征在于,所述方法还包括:
根据所述待识别票据的尺寸和票据模板的尺寸,计算所述待识别票据与票据模板的缩放系数;
根据所述缩放系数对第二仿射变换矩阵进行验证。
5.根据权利要求1所述的方法,其特征在于,所述对多个校正后的票据图像进行识别,得到所述待识别的票据的票据信息,包括:
依据待识别的票据中每个待识别信息的区域与符合条件的票据特征模板的距离,从所述符合条件的票据特征模板中筛选出符合距离条件的目标特征模板;
确定出与所述票据模板中每个待识别信息的区域距离最近的目标特征模板;
确定所述目标特征模板对应的第一仿射变换矩阵校正后的第二校正票据图像;
从所述第二校正票据图像中分割出与所述目标特征模板距离最近的目标待识别信息区域;
识别所述目标待识别信息区域中的票据信息。
6.根据权利要求5所述的方法,其特征在于,所述依据待识别的票据中每个待识别信息的区域与符合条件的特征模板的距离,从所述符合条件的票据特征模板中筛选出符合距离条件的目标特征模板,包括:
计算所述票据模板中每个待识别信息的区域与每个票据特征模板的位置偏移矩阵;
依据各个所述偏移矩阵,计算每个待识别信息的区域与每个票据特征模板的距离;
根据每个待识别信息的区域与每个票据特征模板的距离,确定出与每个待识别信息的区域距离最近的目标特征模板。
7.一种票据信息识别装置,其特征在于,包括:
票据模板确定单元,用于对待识别的票据进行分析,确定票据模板和所述票据模板对应的至少一个票据特征模板;
匹配单元,用于将所述票据特征模板与所述待识别的票据进行匹配,从所述待识别的票据中确定出与每个票据特征模板相匹配的目标区域;
计算单元,用于计算每个票据特征模板与所述相匹配的目标区域之间的第一仿射变换矩阵;
验证单元,用于验证每个第一仿射变换矩阵的准确度,剔除错误的第一仿射变换矩阵;
校正单元,用于利用正确的第一仿射变换矩阵对所述待识别的票据进行校正,得到多个校正后的票据图像;
识别单元,用于对多个校正后的票据图像进行识别,得到所述待识别的票据的票据信息;
其中,所述验证单元,包括:
识别子单元,用于从待识别的票据中识别出预设标识的位置;
第一计算子单元,用于依据所述预设标识在所述票据模板中的位置和待识别票据中的位置,计算第二仿射变换矩阵;
第一校正子单元,用于依据所述第二仿射变换矩阵对所述待识别的票据进行校正,得到第一校正票据图像;
判断子单元,用于判断所述第一校正票据图像中预设标识的位置是否与票据模板中预设标识相同;
验证子单元,用于若所述第一校正票据图像中预设标识的位置与票据模板中预设标识的位置相同,则依据所述第二仿射变换矩阵对各个第一仿射变换矩阵进行验证,确定出错误的第一仿射变换矩阵。
8.一种设备,其特征在于,所述设备包括:
存储器,用于存储程序;
处理器,用于运行所述程序,当所述处理器运行所述程序时,所述处理器实现了权利要求1-6任一项所述的票据信息识别方法。
9.一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理设备执行时实现权利要求1-6任一项所述的票据信息识别方法。
CN201811534525.8A 2018-12-14 2018-12-14 一种票据信息识别方法及装置 Active CN109658584B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811534525.8A CN109658584B (zh) 2018-12-14 2018-12-14 一种票据信息识别方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811534525.8A CN109658584B (zh) 2018-12-14 2018-12-14 一种票据信息识别方法及装置

Publications (2)

Publication Number Publication Date
CN109658584A CN109658584A (zh) 2019-04-19
CN109658584B true CN109658584B (zh) 2021-01-12

Family

ID=66113231

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811534525.8A Active CN109658584B (zh) 2018-12-14 2018-12-14 一种票据信息识别方法及装置

Country Status (1)

Country Link
CN (1) CN109658584B (zh)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110263616A (zh) * 2019-04-29 2019-09-20 五八有限公司 一种文字识别方法、装置、电子设备及存储介质
CN110245530B (zh) * 2019-05-27 2023-03-07 苏州迈洛智能***有限公司 一种条码信息录入方法、装置及存储介质
CN110263694A (zh) * 2019-06-13 2019-09-20 泰康保险集团股份有限公司 一种票据识别方法及装置
CN112800807B (zh) * 2019-11-13 2023-05-23 上海高德威智能交通***有限公司 版面图像的识别方法、识别装置、计算设备及存储介质
CN111325092B (zh) * 2019-12-26 2023-09-22 湖南星汉数智科技有限公司 一种动车票识别方法、装置、计算机装置及计算机可读存储介质
CN111275037B (zh) * 2020-01-09 2021-06-08 上海知达教育科技有限公司 票据识别方法及装置
CN111546804B (zh) * 2020-04-08 2021-03-23 远光软件股份有限公司 一种原始票据自动粘贴方法及装置
CN111858977B (zh) * 2020-06-24 2023-04-21 苏宁云计算有限公司 票据信息采集方法、装置、计算机设备和存储介质
CN112598505A (zh) * 2020-12-25 2021-04-02 无锡航吴科技有限公司 一种基于比对规则的国有融资平台监管***及方法
CN112733916B (zh) * 2020-12-31 2023-04-07 五八有限公司 虚***图片的识别方法、装置、电子设备及存储介质
CN112907453B (zh) * 2021-03-16 2022-02-01 中科海拓(无锡)科技有限公司 一种笔记本内结构图像矫正方法
CN113449706A (zh) * 2021-08-31 2021-09-28 四川野马科技有限公司 基于人工智能的票据单据识别和归档的方法及***
CN113792681B (zh) * 2021-09-17 2024-05-28 平安科技(深圳)有限公司 基于点云匹配的信息采集方法、装置、电子设备及介质

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102542660A (zh) * 2011-12-05 2012-07-04 中钞实业有限公司 基于票据水印分布特征的票据防伪鉴别方法
CN103077384A (zh) * 2013-01-10 2013-05-01 北京万集科技股份有限公司 一种车标定位识别的方法与***
CN103593663A (zh) * 2013-09-27 2014-02-19 北京中钞钞券设计制版有限公司 一种钞券印版的图像定位方法
CN105095842A (zh) * 2014-05-22 2015-11-25 阿里巴巴集团控股有限公司 一种单据的信息识别的方法和装置
CN105930858A (zh) * 2016-04-06 2016-09-07 吴晓军 一种带旋转、缩放的快速高精度几何模板匹配方法
CN107203990A (zh) * 2017-04-02 2017-09-26 南京汇川图像视觉技术有限公司 一种基于模板匹配与图像质量评估的标贴破损检测方法
CN108717744A (zh) * 2018-04-27 2018-10-30 深圳怡化电脑股份有限公司 识别金融单据上的***序号的方法、装置及终端设备

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8050485B2 (en) * 2006-03-08 2011-11-01 Cashscan Corporation System for high speed processing of gaming documents
US8527354B2 (en) * 2006-08-08 2013-09-03 Serverside Group Limited Affinity group
CN101464951B (zh) * 2007-12-21 2012-05-30 北大方正集团有限公司 图像识别方法及***
CN102306415B (zh) * 2011-08-01 2013-06-26 广州广电运通金融电子股份有限公司 便携式有价文件识别装置
CN102509383B (zh) * 2011-11-28 2013-08-21 哈尔滨工业大学深圳研究生院 一种基于特征检测及模板匹配的混合号码识别方法
US9230383B2 (en) * 2012-12-28 2016-01-05 Konica Minolta Laboratory U.S.A., Inc. Document image compression method and its application in document authentication
US9652690B2 (en) * 2015-02-27 2017-05-16 Lexmark International, Inc. Automatically capturing and cropping image of check from video sequence for banking or other computing application
CN105243730B (zh) * 2015-10-28 2018-02-09 深圳怡化电脑股份有限公司 纸币识别方法及***
CN106845542B (zh) * 2017-01-18 2019-12-03 江苏阿瑞斯智能设备有限公司 基于dsp的纸币冠字号智能识别方法
CN108229463A (zh) * 2018-02-07 2018-06-29 众安信息技术服务有限公司 基于图像的文字识别方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102542660A (zh) * 2011-12-05 2012-07-04 中钞实业有限公司 基于票据水印分布特征的票据防伪鉴别方法
CN103077384A (zh) * 2013-01-10 2013-05-01 北京万集科技股份有限公司 一种车标定位识别的方法与***
CN103593663A (zh) * 2013-09-27 2014-02-19 北京中钞钞券设计制版有限公司 一种钞券印版的图像定位方法
CN105095842A (zh) * 2014-05-22 2015-11-25 阿里巴巴集团控股有限公司 一种单据的信息识别的方法和装置
CN105930858A (zh) * 2016-04-06 2016-09-07 吴晓军 一种带旋转、缩放的快速高精度几何模板匹配方法
CN107203990A (zh) * 2017-04-02 2017-09-26 南京汇川图像视觉技术有限公司 一种基于模板匹配与图像质量评估的标贴破损检测方法
CN108717744A (zh) * 2018-04-27 2018-10-30 深圳怡化电脑股份有限公司 识别金融单据上的***序号的方法、装置及终端设备

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
"基于矩阵互相关性的支票出票人账号定位方法";唐林;《内蒙古师范大学学报》;20160131;第45卷(第1期);第50-54页 *

Also Published As

Publication number Publication date
CN109658584A (zh) 2019-04-19

Similar Documents

Publication Publication Date Title
CN109658584B (zh) 一种票据信息识别方法及装置
CN110766014B (zh) 票据信息定位方法、***及计算机可读存储介质
CN111680688B (zh) 字符识别方法及装置、电子设备、存储介质
WO2019169532A1 (zh) 车牌识别方法及云***
US8494273B2 (en) Adaptive optical character recognition on a document with distorted characters
CN109740606B (zh) 一种图像识别方法及装置
CN104217203B (zh) 复杂背景卡面信息识别方法及***
US20080013803A1 (en) Method and apparatus for determining print image quality
CN110490190B (zh) 一种结构化图像文字识别方法及***
CN109947273B (zh) 一种点读定位方法及装置
CN111583180B (zh) 一种图像的篡改识别方法、装置、计算机设备及存储介质
CN115457565A (zh) 一种ocr文字识别方法、电子设备及存储介质
CN112396047B (zh) 训练样本生成方法、装置、计算机设备和存储介质
CN113191348B (zh) 一种基于模板的文本结构化提取方法及工具
CN113095307B (zh) 一种财务凭证信息自动识别方法
US8787702B1 (en) Methods and apparatus for determining and/or modifying image orientation
CN113011426A (zh) 一种识别证件的方法和装置
CN107240185A (zh) 一种冠字号识别方法、装置、设备及存储介质
CN111814673A (zh) 一种修正文本检测边界框的方法、装置、设备及存储介质
CN111079480A (zh) 身份证信息的识别方法、装置及终端设备
CN114694161A (zh) 一种特定版式证件的文本识别方法、设备及存储介质
CN111738979A (zh) 证件图像质量自动检查方法及***
WO2018107574A1 (zh) 一种对印防伪特征的检测方法及装置
JP2003109007A (ja) 帳票様式分類装置、帳票様式分類方法、帳票様式分類プログラムおよび画像照合装置
CN117058805A (zh) 纸币图像处理方法及***

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CP03 Change of name, title or address
CP03 Change of name, title or address

Address after: Floor 36, Zheshang Building, No. 718 Jianshe Avenue, Jiang'an District, Wuhan, Hubei 430019

Patentee after: TK.CN INSURANCE Co.,Ltd.

Patentee after: TAIKANG INSURANCE GROUP Co.,Ltd.

Address before: Taikang Life Building, 156 fuxingmennei street, Xicheng District, Beijing 100031

Patentee before: TAIKANG INSURANCE GROUP Co.,Ltd.

Patentee before: TK.CN INSURANCE Co.,Ltd.