CN110785773B - 票据识别*** - Google Patents
票据识别*** Download PDFInfo
- Publication number
- CN110785773B CN110785773B CN201980000684.6A CN201980000684A CN110785773B CN 110785773 B CN110785773 B CN 110785773B CN 201980000684 A CN201980000684 A CN 201980000684A CN 110785773 B CN110785773 B CN 110785773B
- Authority
- CN
- China
- Prior art keywords
- bill
- user
- recognition
- user name
- handwritten
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/98—Detection or correction of errors, e.g. by rescanning the pattern or by human intervention; Evaluation of the quality of the acquired patterns
- G06V10/987—Detection or correction of errors, e.g. by rescanning the pattern or by human intervention; Evaluation of the quality of the acquired patterns with the intervention of an operator
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/284—Lexical analysis, e.g. tokenisation or collocates
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/413—Classification of content, e.g. text, photographs or tables
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/416—Extracting the logical structure, e.g. chapters, sections or page numbers; Identifying elements of the document, e.g. authors
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
- G06F18/254—Fusion techniques of classification results, e.g. of results related to same input data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/28—Character recognition specially adapted to the type of the alphabet, e.g. Latin alphabet
- G06V30/287—Character recognition specially adapted to the type of the alphabet, e.g. Latin alphabet of Kanji, Hiragana or Katakana characters
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Multimedia (AREA)
- Artificial Intelligence (AREA)
- Quality & Reliability (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Character Discrimination (AREA)
Abstract
本发明提供一种票据识别***,能够提高用户填写的手写文字的识别精度,削减人工校正作业业务。经公共通信网络使中央服务器与***终端彼此可通信连接,其中,所述中央服务器识别票据中记载的用户的手写文字,所述***终端包括读取通过用户填写至所述票据中的手写文字的图像扫描仪,在该票据识别***中,所述中央服务器包括手写文字识别单元,其从所述***终端接收经所述图像扫描仪读取到的所述票据的图像数据,将接收到的所述票据的图像数据的用户手写文字通过至少两种以上不同算法的OCR识别程序分别识别,该识别结果一致的部分确定所述票据中记载的手写文字,识别结果不一致的部分作为校正处理的对象。
Description
技术领域
本发明涉及票据识别***,更详细地,涉及能够通过光学文字识别处理以高精度识别经图像扫描仪读取的定型票据中写入的手写文字的票据识别***。
背景技术
以往,在银行等地,用户在定型的票据上写入手写文字(汉字、片假名、数字等),基于该票据办理汇款等手续。此外,近年来,通常是经图像扫描仪读取该手写的票据,进行光学文字识别(OCR:Optical Character Recognition/Reader)处理,由此登记到计算机***上。
近年来,在进行光学文字识别处理(以下简称为OCR。)的程序中,尤其是印刷文字的识别精度(判别精度)正在提高。但是,用户所填写的手写文字的识别精度不够,例如,在片假名、数字等中,OCR无法识别的手写文字以相当的概率发生。作为这种情况的应对,最后根据银行职员的判断修正OCR不能识别的手写文字,该修正工作成为银行等的窗口业务的负担。
因此,公开了以下的文字识别***及文字识别方法,能够针对存在多个填写字段的票据,根据特定的填写字段所记载的内容高效地进行文字识别或修正(参照专利文献1)。
专利文献1:日本特开2007-011656号公报
发明内容
然而,上述专利文献1基本上只是为了高效地进行通过OCR读取出的票据的数据的修正而区别与票据对应的特定的填写字段,并不追求手写文字的识别率的提高。
因此,本发明的目的在于提供一种票据识别***,能够提高用户所填写的手写文字的识别精度,削减人工修改工作的票据识别***业务。
本发明的票据识别***经公共通信网络使中央服务器与***终端彼此可通信连接,其中,所述中央服务器识别票据中记载的用户的手写文字,所述***终端包括读取通过用户填写至所述票据中的手写文字的图像扫描仪,在该票据识别***中,所述中央服务器包括手写文字识别单元,其从所述***终端接收经所述图像扫描仪读取到的所述票据的图像数据,将接收到的所述票据的图像数据的用户手写文字通过至少两种以上不同算法的OCR识别程序分别识别,该识别结果一致的部分确定所述票据中记载的手写文字,识别结果不一致的部分作为校正处理的对象。
此外,所述手写文字识别单元进行数字确定处理,其从所述票据中记载的手写文字中提取数字,分析用户的手写数字的特征,由此确定所述OCR识别程序的各自的识别结果中未能识别出的部分的数字。
此外,所述手写文字识别单元进行第一用户名校正处理,其从所述票据中记载的、作为所述OCR识别程序的各自的识别结果而确定了的银行名、分店名、科目、账户号码中取得符合的用户名,比较取得了的用户名与作为所述OCR识别程序的各自的识别结果而确定了的用户名从而校正用户名。
此外,所述手写文字识别单元进行第二用户名校正处理,其提取基于所述票据中记载的、作为所述OCR识别程序的各自的识别结果而确定了的用户名的汉字识别的注音假名,比较提取出的注音假名与作为所述OCR识别程序的各自的识别结果而确定了的用户名从而校正用户名。
此外,多个种类的票据布局被预先登记,所述中央服务器基于所述票据的图像数据从所述多个种类的票据布局中指定票据布局,从指定好的票据布局的第一用户信息、第二用户信息及金额信息的填写栏提取用户的手写文字,通过所述OCR识别程序进行识别。
根据本发明,中央服务器包括至少两种以上的算法不同的OCR识别程序。并且,根据从***终端接收到的票据的图像数据,通过多个OCR识别程序识别票据(例如,银行等的金融机构的汇款请求书等)中记载(填写)的用户的手写文字,两种以上的算法不同的OCR识别程序的识别结果一致的手写文字作为确定,识别结果不一致的手写文字作为校正处理的对象。由此,能够快速判别票据记载的用户的手写文字。此外,成为校正处理的对象的手写文字,最终通过人工(例如,金融机构的员工)的判断等进行校正。由此,根据本发明,通过至少两种以上的不同算法的OCR识别程序自动地识别并确认用户在票据上填写的手写文字,因此能够提高手写文字的识别精度。
此外,手写文字识别单元从票据记载的手写文字中提取数字,分析用户手写数字的特征,由此进行数字确定处理,确定至少两种以上不同算法的OCR识别程序(以下,简称为多个OCR识别程序)的各个识别结果中不能识别的部分的数字。即,在本发明中,从票据记载的手写文字中仅提取数字,判断提取出的用户的手写数字的特征(例如,数字“7”以宽幅记载。数字“9”上部的圆很小等)。并且,对多个OCR识别程序的各个的识别结果中不能识别的部分的数字,加上上述特征,识别手写的数字并确定。这样,加入至以往OCR识别程序所具备的手写数字的识别样式,结合每个用户的手写数字的特征进行判断,由此还能够自动地识别确认多个OCR识别程序不能识别的部分的数字。
此外,手写文字识别单元进行第一用户名校正处理,从票据记载的、作为多个OCR识别程序的各个识别结果而确定的银行名、分店名、科目、账户号码中取得该用户名(在票据是汇款请求书时,是收款人名),比较取得了的用户名和多个作为OCR识别程序的各个识别结果而确定的用户名,从而校正用户名。即,在金融机构(本行或业务合作的其他银行等),通常,对应于用户开设的账号的银行名、分店名、科目、账号号码的用户名(片假名)被顾客管理计算机等正式登记。因而,在银行名、分店名、科目、帐户号码作为多个OCR识别程序的各自的识别结果而确定时,用户从开设帐户的金融机构的顾客管理计算机中取得符合银行名、分店名、科目、帐户号码的正式用户名(片假名)。然后,将取得了的用户名(片假名)和多个OCR识别程序识别确定的用户名(片假名)进行比较,当取得了的正式用户名(片假名)与多个OCR识别程序识别确定的用户名(片假名)不同时,校正为取得了的正式的用户名(片假名)。由此,暂时能够将多个OCR识别程序识别确定了的用户名(片假名)校正为正式的用户名,能够提高确定用户名(片假名)的可靠度。
此外,手写文字识别单元进行第二用户名校正处理,提取基于作为多个OCR识别程序各自的识别结果而确定的用户名(例如,票据是汇款请求书时,请求人名及收款人名)的汉字识别的注音假名,将提取出的注音假名与作为多个OCR识别程序各自的识别结果而确定的用户名(片假名)进行比较从而校正用户名。即,在金融机构(本行、业务合作的他行等)的票据(汇款请求书)中,通常是用户名以汉字和片假名两者的手写文字填写的结构。因此,当多个OCR识别程序各自的汉字识别确定时,将该汉字的注音假名和作为多个OCR识别程序的各自的识别结果而确定了的用户名(片假名)进行比较,用户名(片假名)不同时,将汉字的注音假名作为用户名(片假名)而进行校正。因此,当存在多个OCR识别程序的各自的识别结果中不能识别票据记载的用户名(片假名)的部分或者错误识别的部分时,能够基于该取得了的汉字的注音假名来确定用户名。即,能够提高确定用户名(片假名)的可靠度。
中央服务器预先登记了多种票据布局,基于票据的图像数据从多种票据布局中指定票据布局,从指定了的票据布局的第一用户信息、第二用户信息报以及金额信息的填写栏中提取用户的手写文字从,通过多个OCR识别程序识别。即,票据有多种类型的票据布局,例如,如果将票据设为汇款请求书,在每个该汇款请求书中,作为第一用户信息的收款人信息(银行名、分店名、科目、账户号码、姓名等)、作为第二用户信息的委托人信息(地址、姓名、电话号码等)及金额信息(汇款金额、汇款手续费等)等填写栏的位置不同。因此,将印刷在票据上的文字(请求人、收款人、金额等)作为触发条件,根据图像扫描仪读取的票据的图像数据识别票据布局,确定该文件布局相当于登记在中央服务器上的多个票据布局中的哪一个票据布局。然后,根据确定的票据布局提取用户填写了的手写文字,通过第一OCR识别程序及第二OCR识别程序进行识别。由此,能够可靠地识别第一用户信息、第二用户信息及金额信息。
附图说明
图1是示出本实施方式的票据识别***的结构的图。
图2是说明本实施方式的票据识别***的中央服务器的电结构的框图。
图3是本实施方式的票据识别***的中央服务器的各种处理的流程图。
图4是说明本实施方式的票据识别***的数字确定处理的图。
图5是本实施方式的票据识别***的片假名的类似文字的一览表。
图6是说明本实施方式的票据识别***的第一用户名校正处理的图。
图7是说明本实施方式的票据识别***的第二用户名校正处理的图。
图8是说明本实施方式的票据识别***的票据布局的图。
符号说明
1 票据识别***
10 ***终端
20 图像扫描仪
25 中央服务器
30 ***服务器
100 银行
具体实施方式
本发明的主旨是一种票据识别***,将识别票据中记载的用户的手写文字的中央服务器与包括读取通过用户填写至票据中的手写文字的图像扫描仪的***终端经公共通信网络彼此可通信连接,在该票据识别***中,所述中央服务器包括手写文字识别单元,其从***终端接收经图像扫描仪读取到的票据的图像数据,将接收到的票据的图像数据的用户手写文字通过至少两种以上不同算法的OCR识别程序分别识别,该识别结果一致的部分确定票据中记载的手写文字,识别结果不一致的部分作为校正处理的对象。
接下来,参照附图详细说明本发明的一个实施方式。图1是表示本实施方式的票据识别***的结构的图。图2是说明本实施方式的票据识别***的中央服务器的电结构的框图。图3是本实施方式的票据识别***的中央服务器的各种处理的流程图。图4是说明本实施方式的票据识别***的数字校正的图。图5是本实施方式的票据识别***的片假名的类似文字的一览表。图6是说明本实施方式的票据识别***的第一用户名校正处理的图。图7是说明本实施方式的票据识别***的第二用户名校正处理的图。图8是说明本实施方式的票据识别***的票据布局的图。
[票据识别***的结构]
接下来,参照图1说明本实施方式中的票据识别***的结构的概要。另外,在以下的说明中,将运用本***的运营商设为作为金融机构的银行,将票据的一种即汇款请求书中用户填写的手写文字的识别作为一例进行说明。
如图1所示,票据识别***1由设置在银行100的总部等的中央服务器25、设置在银行100的总店和多个分店110中的多个***终端10、和分别连接在该***终端10的图像扫描仪20构成。并且,中央服务器25与设置在银行100的总店、多个支店110的***终端10、业务合作的金融机关的其他银行的多个***服务器30经由公共通信网络50相互可通信地连接。
作为***终端10、中央服务器25及***服务器30,优选使用公知的计算机。另外,作为公知的计算机,优选地使用固定式的台式计算机等,但只要具备经由公共通信网络50相互可通信的功能即可。此外,作为图像扫描仪20,只要将填写至汇款请求书的用户的手写转换为数字方式的图像数据(以下简称为图像数据)而获取至***终端10即可,没有特别限定。此外,公共通信网络50是公知的因特网线路、手机通信线路、电话线路、通信卫星线路等。
中央服务器25具有手写文字识别单元(手写文字识别处理),根据从***终端10接收到的汇款请求书的图像数据,通过后述的算法不同的第一OCR识别程序及第二OCR识别程序,识别确定用户的手写文字。***末端10将记载了从连接的图像扫描仪20获取到的用户的手写文字的汇款请求书的图像数据发送给中央服务器25。
中央服务器25具有管理在该银行100开设账户的用户的顾客数据(银行名、分店名、科目、账号号码、用户名等)的顾客管理计算机的功能。另外,作为该顾客管理计算机的功能,也可以在本店等设置具有其它顾客管理功能的顾客管理服务器(未图示)。多个***服务器30是管理在与银行100进行业务协作的其他银行开设账户的用户的顾客数据(银行名、分店名、科目、账户号码、用户名等)的顾客管理计算机。
在上述结构中,在本实施方式中,设置于管理本***的银行100的总部的中央服务器25,从***终端10接收通过图像扫描仪20读取到***终端10的汇款请求书的图像数据。然后,预先在中央服务器25中存储算法的不同的第一OCR识别程序和第二OCR识别程序,通过这两种程序分别识别接收到的汇款请求书的图像数据中记载的用户的手写文字。另外,算法不同的OCR识别程序不限于两种,也可以具有三种以上。
进而,在本实施方式的票据识别***1中,根据上述第一OCR识别程序和第二OCR识别程序分别识别出的手写文字的识别结果一致的部分确定票据记载的手写文字,识别结果不一致的部分进行通过人工(例如,员工的观看)的校正处理。
这样,根据算法不同的第一OCR识别程序和第二OCR识别程序,通过识别汇款请求书的图像数据中记载的用户的手写文字,能够迅速识别确定票据中记载的用户的手写文字。
进而,在本实施方式中,在第一OCR识别程序及第二OCR识别程序各自的手写文字的识别结果中,执行各种校正处理(后述的数字确定处理、第一用户名校正处理、第二用户名校正处理),识别校正不能识别的部分、错误识别的部分的手写文字。通过这样执行各种校正处理,能够提高自动识别确定用户所填写的手写文字的精度,因此,能提供能够削减人工校正作业业务的票据识别***1。
[中央服务器25的结构]
接下来,参照图2,说明本实施方式的票据识别***1的中央服务器25的电结构。中央服务器25由存储部11、输入输出控制部12、控制部13、外部通信I/F(Inter Face)控制部14等构成。
存储部11由HDD(Hard Disk Drive)、闪存等大容量存储装置构成。在本实施方式中,图像扫描仪20读取了的汇款请求书的图像数据、后述的第一OCR识别程序及第二OCR识别程序读取了的汇款请求书的图像数据中记载的用户的手写文字的识别结果等,存储在存储部11的规定区域中。进而,在本实施方式中,后述的多个票据布局(参照图8)、类似文字数据(参照图5)等预先存储在存储部11的规定区域中。
输入输出控制部12控制与中央服务器25连接的未图示的液晶显示装置、键盘/鼠标等外部输入输出装置的各种数据的输入输出。
控制部13由未图示的CPU(中央运算装置)、ROM(Read Only Memory)、RAM(RandomAccess Memory)、闪存等构成。此外,该控制部13的CPU通过执行ROM或存储部11预先存储的各种程序,执行后述的手写文字识别处理(手写文字识别单元)、数字确定处理、第一用户名校正处理、第二用户名校正处理等。
外部通信I/F控制部14与外部的公共通信网络50连接,基于制御部13的指示,控制与票据识别***1中的多个***终端10、多个***服务器30的通信。外部通信I/F制御部14基于控制部13的指示,控制来自***末端10的通过图像扫描仪20读取完毕的汇款请求书的图像数据的接收、向其他行的顾客管理计算机的***服务器30的顾客数据(银行名、分店名、科目、账户号码、用户名等)的收发。在此接收到的顾客数据与多个用户的每个关联存储在存储部11中。
[数字确定处理]
接下来,参照图4,说明本实施方式的票据识别***1中的数字确定处理。这个数字确认处理是在后述的手写文字识别处理中执行的处理,是通过第一OCR识别程序及第二OCR识别程序,确定汇款请求书的图像数据中记载的手写文字的识别结果中不能识别的部分的数字的处理。
如图4所示,第一OCR识别程序及第二OCR识别程序不能识别的部分的数字是不能识别是“7”或“9”中的哪一个的手写数字40。然后,从汇款请求书的图像数据中记载的手写文字中只提取识别为“7”及“9”的数字。将被识别为“7”的数字表示为手写数字41,将被识别为“9”的数字表示为手写数字42。
然后,若分析提取出的用户的手写数字41和42,被识别为数字的“7”的手写数字41具有通过宽度记载的特征。此外,被识别为数字“9”的手写数字42具有上部圆圈很小的特征。因此,未识别出的部分的手写数字40具有不是通过宽度而是上部的圆圈很小的特征,所以能够作为数字“9”来识别确定。
这样,加入至现有的第一OCR识别程序及第二OCR识别程序所具备的手写数字的识别样式,进行结合每个用户的手写数字的特征而判断的数字确定处理,由此,第一OCR识别程序及第二OCR识别程序各自不能识别的部分的数字也能够自动识别确定。
另外,上述的用户的手写数字的特征只是一例,通过检测例如被识别为数字的“8”的手写数字下部的圆圈大、被识别为数字的“1”的手写数字向右倾斜角度大等各种用户的手写数字的特征,能够识别第一OCR识别程序及第二OCR识别程序各自未能识别出的部分的数字。此外,当用户的手写数字的样本等很少,在用户的手写数字中未找到特征时,该数字理应被确定为无法识别的部分的数字。
[第一用户名校正处理]
接下来,参照图6,说明本实施方式的票据识别***1中的第一用户名校正处理。该处理是如下的处理:在后述的手写文字识别处理中,根据第一OCR识别程序及第二OCR识别程序各自确定为识别结果的汇款请求书的图像数据所记载的银行名、分行名、科目、账户号码,取得符合的用户名(收款人名),将取得了的用户名与作为多个OCR识别程序的各自的识别结果而确定的以片假名手写的用户名进行比较,从而校正用户名。
在汇款请求书等票据中,设置有手写填写收款人的姓名(用户名)、收款人开设的账户的银行名、分店名、科目、账户号码的栏。然后,在开设该收款人的帐户的银行,收款人的正式的用户名(片假名)关联银行名、分店名、科目、账户号码而登记在顾客管理计算机(在本行是中央服务器25,在其他银行是***服务器30)。在本实施方式的第一用户名校正处理中,关注于此,当记载于汇款请求书的图像数据中的银行名、分店名、科目、账户号码作为第一OCR识别程序及第二OCR识别程序各自的识别结果而确定时,向顾客管理计算机查询该银行名、分店名、科目、账户号码,取得正式的收款人的用户名(片假名),进行作为第一OCR识别程序及第二OCR识别程序各自的识别结果而确定的用户名的校正。
如图6的(a)所示,在第一OCR识别程序及第二OCR识别程序中,确定了收款人开设账户的银行名“ニホン”、分店名“ギンザ”、科目“フツウ”、账户号码“9999999”。并且,当收款人在本行开设账户时,向中央服务器25(顾客管理计算机)查询收款人的正式的用户名,当收款人在他行开设账户时,向***服务器30(顾客管理计算机)查询收款人的正式的用户名。
其结果,取得表51所示的银行名、分店名、科目、账户号码、收款人的正式用户名。此时,通过第一OCR识别程序或第二OCR识别程序识别确定的银行名、分店名、科目、账户号码、收款人的用户名是表50所示的“ワキタアイ”,与之相对的,在表51中是“クキタマイ”。通常,在OCR识别程序中的片假名的识别中,类似文字多,识别率低。该片假名的类似文字的一个示例在图5中作为类似文字数据示出26种。另外,该图5所示的类似文字数据是预先登记在中央服务器25的存储部11中的数据,用于中央服务器25的控制部13根据需要判别片假名的类似文字时进行参照。
即,如果将所取得的表51中的收款人的用户名“クキタマイ”与表50所示的收款人的用户名“ワキタアイ”进行比较,很明显地,如图中M1所包围的片假名“ワ”和“ク”(图5中为17)、“ア”和“マ”(图5中为1)是片假名的类似文字,因此,考虑是第一OCR识别程序或第二OCR识别程序错误识别而确定的。但是,如表51所示,确认了正式的收款人的用户名是“クキタマイ”,因此将错误识别的收款人的用户名校正变更为表51所示的收款人的用户名(图中圆M1所包围的部分),由此,OCR识别程序的错误识别被消除,能够确定正式的收款人的用户名。
此外,同样,如图6的(b)所示,在第一OCR识别程序及第二OCR识别程序中,确定了收款人开设的账户的银行名“ニホン”、分店名“ギンザ”、科目“フツウ”、账户号码“0000000”。并且,当收款人在本行开设账户时,向中央服务器25(顾客管理计算机)查询收款人的正式的用户名,当收款人在他行开设账户时,向***服务器30(顾客管理计算机)查询收款人的正式的用户名。
其结果,取得表54所示的银行名、分店名、科目、账户号码、收款人的正式用户名。此时,本实施方式的第一OCR识别程序及第二OCR识别程序识别出的银行名、分店名、科目、账户号码、收款人的用户名在表53中为“ス?キイ?ロー”,与之相对的,在表54中是“スズキイチロー”。由此,了解到第一OCR识别程序及第二OCR识别程序不能识别的部分的收款人的用户名即图中圆M2所包围的“?”(或者,也可以是空白)部分是图中圆M2所包围的“ズ”和“チ”,能够将正式收款人的用户名确定为“スズキイチロー”。
这样,将第一OCR识别程序或第二OCR识别程序各自的用户名(片假名)的识别结果为错误识别而确定时、不能识别而确定时的收款人的用户名(片假名)校正为正式的收款人的用户名,由此,能够正确地确定用户通过片假名的手写文字向汇款申请书中填写的收款人的用户名。
[第二用户名校正处理]
接下来,参照图7,说明本实施方式的票据识别***1中的第二用户名校正处理。该处理是如下的处理:在后述的手写文字识别处理中,提取注音假名,该注音假名基于第一OCR识别程序及第二OCR识别程序各自作为识别结果而确定了的汇款请求书的图像数据中记载了的用户名(申请人名及收款人名)的汉字识别,将提取出的注音假名与作为第一OCR识别程序或第二OCR识别程序的各自的识别结果而确定的片假名的用户名进行比较,从而校正用户名。
如图7的(a)所示,沿着汉字名61“大和太郎”的注音假名“ヤマトタロウ”的片假名60确定为第一OCR识别程序或者第二OCR识别程序各自的识别结果时,保持原样,不进行片假名的用户名的校正。
如图7的(b)所示,与汉字名65的“秋山真纪子”的注音假名“アキヤママキコ”相对的,片假名62中的“アキヤアマキユ”与片假名63中的“アキヤ?マキ?”作为第一OCR识别程序或第二OCR识别程序的各自的识别结果而确定。
在片假名62中,被认为是由于第一OCR识别程序或第二OCR识别程序将图中圆M1所包围的片假名的“ア”和“マ”(在图5中为1)、“ユ”和“コ”(在图5中为4)作为片假名的类似文字而错误识别。因此,结合片假名64所示的“秋山真纪子”的注音假名“アキヤママキコ”,将用户名改变校正为片假名64(具体而言,将图中圆M1所包围的“ア”和“ユ”的部分校正为“マ”和“コ”)而确定。
在片假名63中,存在第一OCR识别程序及第二OCR识别程序无法识别的部分收款人的用户名即图中圆M2所包围的“?”部分。此时,结合片假名64所示的“秋山真纪子”的注音假名“アキヤママキコ”,将用户名改变校正为片假名64(具体而言,将图中圆M2所包围的“?”的部分校正为“マ”和“コ”)而确定。
根据该第二用户名校正处理,当作为第一OCR识别程序或者第二OCR识别程序各自的识别结果而确定的片假名的用户名无法识别时,或者,识别错误时,也能够基于汉字的注音假名确定用户名。即,能够提高确定正确用户名(片假名)的可靠度。
[手写文字识别处理]
接下来,参照图3,说明识别本实施方式的票据识别***1中的用户向作为票据的汇款申请书中填写的手写文字的手写文字识别处理。另外,该手写文字识别处理是在上述中央服务器25的控制部13中执行的处理。此外,该手写文字识别处理作为本实施方式的手写文字识别单元发挥作用。
如图3所示,执行手写文字识别处理的中央服务器25的控制部13(以下简称为控制部13)从***终端10接收连接***终端10的图像扫描仪20所读取的票据的一种即汇款请求书的图像数据(以下简称为图像数据),存储在存储部11的规定区域中(步骤S10)。
控制部13基于接收到的图像数据,指定识别手写文字的票据布局(步骤S11)。在本实施方式的中央服务器25中,预先登记有多个票据布局。当接收到的图像数据与通常使用的票据布局不同时,控制部13参照登记在中央服务器25的存储部11中的多个票据布局。然后,将图像数据的印刷作为触发条件从多个票据布局指定票据布局,基于指定的票据布局,提取作为第一用户信息、第二用户信息以及金额信息等记载的手写文字。
即,如图8的(a)~图8的(c)所示,作为票据的汇款请求书70具有多个(图中为3种)票据布局。即,在该汇款请求书中,设置有能够大致分为作为第一用户信息71的收款人信息(银行名、分店名、科目、账户号码、用户名(汉字、片假名)等),作为第二用户信息72的请求人信息(地址、用户名(汉字、片假名)、电话号码等),以及,金额信息73(汇款金额、汇款手续费等)这三项的填写栏。这三个填写栏的配置中,预先在中央服务器25的存储部11中登记有多个(图中为3样式)样式的票据布局。因此,控制部13将接收到的图像数据即汇款请求书70中印刷的文字(请求人、收款人、金额等)作为处罚条件从而识别票据布局,确定该票据布局相当于中央服务器25的存储部11中登记的多个票据布局的哪个票据布局。然后,基于指定好的票据布局,提取用户填写好的手写文字,通过第一OCR识别程序及第二OCR识别程序进行识别。由此,能够可靠地识别第一用户信息71、第二用户信息72及金额信息73。
控制部13识别由第一OCR识别程序接收到的票据数据中记载的手写文字(步骤S12)。在步骤S11中,由第一OCR识别程序接收到的图像数据的手写文字的识别结果存储在存储部11的规定区域中。
当存在第一OCR识别程序不能识别的部分的数字时,控制部13进行数字确定处理,校正不能识别的部分的数字(步骤S13)。如上所述,该数字确定处理是基于提取出的用户的手写数字的特征,确定第一OCR识别程序中不能识别的部分的数字的处理。控制部13使第一OCR识别程序的识别结果反映数字确定处理的结果。
控制部13执行第一用户名校正处理(步骤S14)。如上所述,该处理是如下的处理:从作为第一OCR识别程序的识别结果而确定的汇款请求书的图像数据所记载的银行名、分行名、科目、账户号码中,取得符合的用户名(收款人名),将取得了的用户名与作为第一OCR识别程序的识别结果而确定的用户名进行比较,从而校正用户名。控制部13使第一OCR识别程序的识别结果中反映第一用户名校正处理的结果。
控制部13执行第二用户名校正处理(步骤S15)。如上所述,该处理是如下的处理:取得接收到的图像数据中记载的用户名的汉字及片假名,当第一OCR识别程序的片假名的用户名的识别结果识别错误或者不能识别时,通过基于汉字识别的注音假名进行校正。控制部13使第一OCR识别程序的识别结果中反映第一用户名校正处理的结果。
如上所述,在上述步骤S12~步骤S15中,对于第一OCR识别程序的图像数据的识别和其识别结果,反映各种校正处理(数字确定处理、第一用户名校正处理、第二用户名校正处理)的执行结果,作为第一OCR识别程序的一次确定处理的结果存储在存储部11的规定区域中。
控制部13识别由第二OCR识别程序接收到的票据数据中记载的手写文字(步骤S16)。在该步骤S16中,通过第二OCR识别程序接收到的图像数据的手写文字的识别结果存储在存储部11的规定区域中。
当存在第二OCR识别程序无法识别的部分的数字时,控制部13执行数字确定处理,校正无法识别的部分的数字(步骤S17)。如上所述,该数字确定处理是基于提取出的用户的手写数字的特征,确定第二OCR识别程序不能识别的部分的数字的处理。控制部13使第二OCR识别程序的识别结果中反映数字确定处理的结果。
控制部13执行第一用户名校正处理(步骤S18)。如上所述,该处理是如下的处理:从作为第二OCR识别程序的识别结果而确定的汇款请求书的图像数据中记载的银行名、分店名、科目、账户号码中取得符合的用户名(收款人名),将取得了的用户名与作为第一OCR识别程序的识别结果而确定的用户名进行比较从而校正用户名。控制部13使第二OCR识别程序的识别结果中反映第一用户名校正处理的结果。
控制部13执行第二用户名校正处理(步骤S19)。如上所述,该处理是如下的处理:提取接收到的图像数据中记载的用户名的汉字及片假名,当第二OCR识别程序的片假名的用户名的识别结果为错误识别或者不能识别时,通过基于汉字识别的注音假名进行校正,对片假名进行修正。控制部13使第二OCR识别程序的识别结果中反映第二用户名校正处理的结果。
如上所述,在上述步骤S16~步骤S19中,对于第二OCR识别程序的图像数据的识别和该识别结果,反映各种校正处理(数字确认处理、第一用户名校正处理、第二用户名校正处理)的执行结果,作为第二OCR识别程序的一次确定处理的结果存储在存储部11的规定区域中。
控制部13比较第一OCR识别程序的一次确定处理的结果与第二OCR识别程序的一次确定处理的结果(步骤S20)。控制部13判断第一OCR识别程序的一次确定处理的结果与第二OCR识别程序的一次确定处理的结果是否一致(步骤S21)。然后,当判别为一致时(步骤S21:是),控制部13将处理转移到步骤S23。另一方面,当判别为不一致时(步骤S21:否),控制部13在步骤S22中,执行校正该不一致的部分的校正处理。在该校正处理中,将识别结果不一致的部分的手写文字,例如在中央服务器25的显示单元(未图示的液晶显示装置等)明确(图6的(b)中的圆M2包围的“?”或者,空白显示)显示。银行100的行员观看汇款请求书的图片数据,确定识别结果不一致部分的手写文字。如果该处理结束,控制部13将处理转移到步骤S23。
控制部13执行在图像数据中记载的手写文字识别确定处理(步骤S23)。如果该处理结束,控制部13结束手写文字识别处理。
上述步骤S20~步骤S23的处理比较第一OCR识别程序及第二OCR识别程序各自的图像数据的识别结果,作为第一OCR识别程序及第二OCR识别程序的二次确定处理的结果存储在存储部11的规定的区域中。
如上所述,在本实施方式的手写文字识别处理中,将通过图像扫描仪20读入完毕的汇款请求书的图像数据从***终端10发送到中央服务器25。中央服务器25通过两种算法的不同的OCR识别程序(第一OCR识别程序及第二OCR识别程序)分别识别接收到的图像数据中记载的用户的手写文字,对该识别结果分别进行各种校正(数字确定处理、第一用户名校正处理、第二用户名校正处理),作为第一OCR识别程序及第二OCR识别程序的一次确定处理的结果。然后,检测该第一OCR识别程序及第二OCR识别程序的一次确定处理的结果的一致或不一致,当存在不一致部分时,进行基于人工(例如员工的观看)的校正处理。基于这样决定的识别结果的二次确定处理的结果,确定汇款请求书记载的用户的手写文字的识别结果,在银行等金融机构执行汇款业务。
以上,说明了本发明的实施方式,但是,本发明的具体结构并不限定于上述实施方式,有不脱离本发明主题的范围的设计变更等也包含在本发明中。
Claims (2)
1.一种票据识别***,其特征在于,
经公共通信网络使中央服务器与***终端彼此可通信连接,其中,所述中央服务器识别票据中记载的用户的手写文字,所述***终端包括读取通过用户填写至所述票据中的手写文字的图像扫描仪,
在该票据识别***中,
所述中央服务器包括手写文字识别单元,其从所述***终端接收经所述图像扫描仪读取到的所述票据的图像数据,将接收到的所述票据的图像数据的用户手写文字通过至少两种以上不同算法的OCR识别程序分别识别,
所述手写文字识别单元进行如下处理:
数字确定处理,其从所述票据中记载的手写文字中提取数字,分析用户的手写数字的特征,由此确定所述OCR识别程序的各自的识别结果中未能识别出的部分的数字;
第一用户名校正处理,其从所述票据中记载的、作为所述OCR识别程序的各自的识别结果而确定了的银行名、分店名、科目、账户号码中取得符合的用户名,比较取得了的用户名与作为所述OCR识别程序的各自的识别结果而确定了的用户名从而校正用户名;以及
第二用户名校正处理,其提取基于所述票据中记载的、作为所述OCR识别程序的各自的识别结果而确定了的用户名的汉字识别的片假名的注音假名,比较提取出的注音假名与作为所述OCR识别程序的各自的识别结果而确定了的片假名的用户名,基于所述中央服务器中存储的片假名的类似文字数据从而校正用户名,
基于所述手写文字识别单元的所述OCR识别程序的各自的识别结果一致的部分确定所述票据中记载的手写文字,识别结果不一致的部分作为校正处理的对象。
2.根据权利要求1所述的票据识别***,其特征在于,
多个种类的票据布局被预先登记,所述中央服务器基于所述票据的图像数据从所述多个种类的票据布局中指定票据布局,从指定好的票据布局的第一用户信息、第二用户信息及金额信息的填写栏提取用户的手写文字,通过所述OCR识别程序进行识别。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018-100631 | 2018-05-25 | ||
JP2018100631A JP6711523B2 (ja) | 2018-05-25 | 2018-05-25 | 帳票認識システム |
PCT/JP2019/014036 WO2019225157A1 (ja) | 2018-05-25 | 2019-03-29 | 帳票認識システム |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110785773A CN110785773A (zh) | 2020-02-11 |
CN110785773B true CN110785773B (zh) | 2023-09-05 |
Family
ID=68616373
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201980000684.6A Active CN110785773B (zh) | 2018-05-25 | 2019-03-29 | 票据识别*** |
Country Status (4)
Country | Link |
---|---|
US (1) | US11227154B2 (zh) |
JP (1) | JP6711523B2 (zh) |
CN (1) | CN110785773B (zh) |
WO (1) | WO2019225157A1 (zh) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7275617B2 (ja) * | 2019-02-06 | 2023-05-18 | 日本電信電話株式会社 | 情報処理装置、判別方法および判別プログラム |
WO2020218471A1 (ja) * | 2019-04-24 | 2020-10-29 | 日本電気株式会社 | 処理装置、処理方法及びプログラム |
CN111768565B (zh) * | 2020-05-21 | 2022-03-18 | 程功勋 | 一种增值税***中***代码识别后处理方法 |
CN111753744B (zh) * | 2020-06-28 | 2024-04-16 | 北京百度网讯科技有限公司 | 用于票据图像分类的方法、装置、设备及可读存储介质 |
CN111898612A (zh) * | 2020-06-30 | 2020-11-06 | 北京来也网络科技有限公司 | 结合rpa和ai的ocr识别方法及装置、设备、介质 |
JP2022097260A (ja) * | 2020-12-18 | 2022-06-30 | 富士フイルムビジネスイノベーション株式会社 | 情報処理装置及び情報処理プログラム |
CN113536771B (zh) * | 2021-09-17 | 2021-12-24 | 深圳前海环融联易信息科技服务有限公司 | 基于文本识别的要素信息提取方法、装置、设备及介质 |
JP7184411B1 (ja) | 2022-06-20 | 2022-12-06 | 健彦 深山 | 文字認識プログラムの評価方法、文字認識プログラムの評価システムおよび文字認識プログラム用教師データの製造方法 |
Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06152845A (ja) * | 1992-11-13 | 1994-05-31 | N T T Data Tsushin Kk | データ送受信システム |
JPH06162273A (ja) * | 1992-11-19 | 1994-06-10 | Fujitsu Ltd | 文字認識装置 |
JP2001022883A (ja) * | 1999-07-12 | 2001-01-26 | Ricoh Co Ltd | 文字認識方式及び該文字認識方式の機能を実現させるための記録媒体 |
JP2003331214A (ja) * | 2002-05-15 | 2003-11-21 | Nippon Telegr & Teleph Corp <Ntt> | 文字認識誤り訂正方法、装置及びプログラム |
JP2006190093A (ja) * | 2005-01-06 | 2006-07-20 | Oki Electric Ind Co Ltd | Ocr為替集中処理システム |
JP2011150466A (ja) * | 2010-01-20 | 2011-08-04 | Fujitsu Ltd | 文字列認識装置、文字列認識プログラムおよび文字列認識方法 |
CN102156864A (zh) * | 2010-02-12 | 2011-08-17 | 冲电气工业株式会社 | 票据处理*** |
CN103903179A (zh) * | 2012-12-27 | 2014-07-02 | 冲电气工业株式会社 | 汇兑*** |
CN103914907A (zh) * | 2014-04-14 | 2014-07-09 | 陕西海基业高科技实业有限公司 | 纸质票据信息识别与核校***及应用方法 |
JP2016009223A (ja) * | 2014-06-23 | 2016-01-18 | 株式会社日立情報通信エンジニアリング | 光学文字認識装置及び光学文字認識方法 |
JP2016021109A (ja) * | 2014-07-14 | 2016-02-04 | 沖電気工業株式会社 | 帳票処理システム、帳票処理装置及び帳票処理装置用プログラム |
CN106407979A (zh) * | 2016-10-25 | 2017-02-15 | 深圳怡化电脑股份有限公司 | 一种票据字符校正的方法及装置 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4809637B2 (ja) | 2005-06-30 | 2011-11-09 | 日立コンピュータ機器株式会社 | 文字認識システム及び文字認識方法 |
CN101622620B (zh) * | 2007-01-23 | 2014-06-18 | 卡内基梅隆大学 | 控制访问计算机***和注释媒体文件的方法和装置 |
US20080294514A1 (en) * | 2007-05-23 | 2008-11-27 | Calman Matthew A | System and method for remote deposit capture and customer information gathering |
CN101916378B (zh) * | 2010-07-20 | 2013-01-09 | 青岛海信网络科技股份有限公司 | 易混淆字符的识别方法及装置 |
US10402590B2 (en) * | 2015-09-11 | 2019-09-03 | Infosys Limited | Method and system for masking of cheque image based on user access privileges |
US9824288B1 (en) * | 2016-05-04 | 2017-11-21 | Bank Of America Corporation | Programmable overlay for negotiable instrument electronic image processing |
-
2018
- 2018-05-25 JP JP2018100631A patent/JP6711523B2/ja active Active
-
2019
- 2019-03-29 US US16/463,239 patent/US11227154B2/en active Active
- 2019-03-29 CN CN201980000684.6A patent/CN110785773B/zh active Active
- 2019-03-29 WO PCT/JP2019/014036 patent/WO2019225157A1/ja active Application Filing
Patent Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06152845A (ja) * | 1992-11-13 | 1994-05-31 | N T T Data Tsushin Kk | データ送受信システム |
JPH06162273A (ja) * | 1992-11-19 | 1994-06-10 | Fujitsu Ltd | 文字認識装置 |
JP2001022883A (ja) * | 1999-07-12 | 2001-01-26 | Ricoh Co Ltd | 文字認識方式及び該文字認識方式の機能を実現させるための記録媒体 |
JP2003331214A (ja) * | 2002-05-15 | 2003-11-21 | Nippon Telegr & Teleph Corp <Ntt> | 文字認識誤り訂正方法、装置及びプログラム |
JP2006190093A (ja) * | 2005-01-06 | 2006-07-20 | Oki Electric Ind Co Ltd | Ocr為替集中処理システム |
JP2011150466A (ja) * | 2010-01-20 | 2011-08-04 | Fujitsu Ltd | 文字列認識装置、文字列認識プログラムおよび文字列認識方法 |
CN102156864A (zh) * | 2010-02-12 | 2011-08-17 | 冲电气工业株式会社 | 票据处理*** |
CN103903179A (zh) * | 2012-12-27 | 2014-07-02 | 冲电气工业株式会社 | 汇兑*** |
CN103914907A (zh) * | 2014-04-14 | 2014-07-09 | 陕西海基业高科技实业有限公司 | 纸质票据信息识别与核校***及应用方法 |
JP2016009223A (ja) * | 2014-06-23 | 2016-01-18 | 株式会社日立情報通信エンジニアリング | 光学文字認識装置及び光学文字認識方法 |
CN105320951A (zh) * | 2014-06-23 | 2016-02-10 | 株式会社日立信息通信工程 | 光学字符识别装置以及光学字符识别方法 |
JP2016021109A (ja) * | 2014-07-14 | 2016-02-04 | 沖電気工業株式会社 | 帳票処理システム、帳票処理装置及び帳票処理装置用プログラム |
CN106407979A (zh) * | 2016-10-25 | 2017-02-15 | 深圳怡化电脑股份有限公司 | 一种票据字符校正的方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN110785773A (zh) | 2020-02-11 |
JP6711523B2 (ja) | 2020-06-17 |
JP2019204417A (ja) | 2019-11-28 |
US20210110152A1 (en) | 2021-04-15 |
US11227154B2 (en) | 2022-01-18 |
WO2019225157A1 (ja) | 2019-11-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110785773B (zh) | 票据识别*** | |
CN107785021B (zh) | 语音输入方法、装置、计算机设备和介质 | |
US9684843B2 (en) | Video capture in data capture scenario | |
JP6528147B2 (ja) | 会計データ入力支援システム、方法およびプログラム | |
US7849398B2 (en) | Decision criteria for automated form population | |
US8326041B2 (en) | Machine character recognition verification | |
JP6268352B2 (ja) | 会計データ入力システム、方法、およびプログラム | |
US20180144205A1 (en) | Extracting card identification data | |
US9027833B2 (en) | Commodity information display apparatus and method for displaying commodity information in different forms | |
US20140052697A1 (en) | Correction of check processing defects | |
US20160379186A1 (en) | Element level confidence scoring of elements of a payment instrument for exceptions processing | |
US10049350B2 (en) | Element level presentation of elements of a payment instrument for exceptions processing | |
US20190109951A1 (en) | Devices and methods for enhanced image capture of documents | |
JP5462017B2 (ja) | 帳票処理システム、エントリ端末および帳票データ処理方法 | |
KR930006448B1 (ko) | 전표인식 방법 및 장치 | |
JP2020021458A (ja) | 情報処理装置、情報処理方法および情報処理システム | |
JP5304397B2 (ja) | 帳票処理装置及び帳票処理プログラム | |
TWM626292U (zh) | 業務導向要項鍵值辨識系統 | |
JP7456580B2 (ja) | 情報処理装置、情報処理システム及び情報処理方法 | |
JP5779671B2 (ja) | 帳票処理システム、エントリ端末、帳票データ処理方法およびプログラム | |
KR100908405B1 (ko) | 서식 이미지 품질 검사방법 및 시스템과 이를 위한 기록매체 | |
CN110456993B (zh) | 基于预设规则的***显示的方法和*** | |
US11875109B1 (en) | Machine learning (ML)-based system and method for facilitating correction of data in documents | |
JP4298904B2 (ja) | 文字認識方法 | |
US11328350B1 (en) | Systems and methods for payee identification via camera |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: DE Ref document number: 40016008 Country of ref document: HK |
|
GR01 | Patent grant | ||
GR01 | Patent grant |