CN111832423A - 一种票据信息识别方法、装置及*** - Google Patents
一种票据信息识别方法、装置及*** Download PDFInfo
- Publication number
- CN111832423A CN111832423A CN202010566121.8A CN202010566121A CN111832423A CN 111832423 A CN111832423 A CN 111832423A CN 202010566121 A CN202010566121 A CN 202010566121A CN 111832423 A CN111832423 A CN 111832423A
- Authority
- CN
- China
- Prior art keywords
- bill
- image
- information
- identified
- recognized
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/049—Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/22—Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/148—Segmentation of character regions
- G06V30/153—Segmentation of character regions using recognition of characters or words
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- General Health & Medical Sciences (AREA)
- Biophysics (AREA)
- Evolutionary Computation (AREA)
- Computational Linguistics (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Biomedical Technology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Image Analysis (AREA)
- Character Discrimination (AREA)
Abstract
本发明实施例提供了一种票据信息识别方法、装置及***。方案如下:接收对待识别票据图像的信息识别请求;对待识别票据图像进行预处理;利用预先训练好的票据信息识别模型,识别预处理后的待识别票据图像中的票据信息,得到待识别票据图像的票据信息;其中,票据信息识别模型是根据预设训练集训练得到的,预设训练集包括多个不同票据类型的样本票据图像,以及每一样本票据图像的样本票据信息;返回针对信息识别请求的第一响应消息,第一响应消息包括待识别票据图像的票据信息。通过本发明实施例提供的技术方案,有效解决了现有票据信息识别方法所存在的问题,从而降低了对人力资源数量的依赖,提高了票据识别方法的通用性。
Description
技术领域
本发明涉及图像识别技术领域,特别是涉及一种票据信息识别方法、装置及***。
背景技术
在生产生活中,票据的形式多种多样,例如,票据可以包括汇票、本票、支票、提单、存单等。每一票据中包含有大量的票据信息,以票据中的***为例,***可以包括***代码、***号码、开票日期、购买方名称等票据信息。
目前,在识别上述票据所包含的票据信息时,常用的票据识别方法包括人工识别和传统的光学字符识别(Optical Character Recognition,OCR)技术。其中,传统的OCR技术通过对票据图像中的每一字符进行识别,从而确定出该票据图像所包含的票据信息,即该票据图像对应票据中包含的票据信息。传统的OCR技术中的一个重要环节为字符识别,即将票据图像中的每一字符与预设候选模板中的每一字符进行匹配,识别出票据图像所包含的字符,或者提取票据图像中字符的字符特征信息,并根据该字符特征信息利用支持向量机(Support Vector Machine,SVM)识别票据图像所包含的字符。
对于上述人工识别方法,由于人力资源的数量限制,使得该方法将不适用于票据数量较多的场景。而对于传统的OCR技术,由于字符识别过程所采用的预设候选模板和字符特征信息存在一定的局限性,即预设候选模板限制了识别的票据的票据类型,字符特征信息的提取限制了可识别的字符的数量,这将使得传统的OCR技术的通用性较差。
发明内容
本发明实施例的目的在于提供一种票据信息识别方法、装置及***,以解决现有票据信息识别方法所存在的问题,从而降低对人力资源数量的依赖,提高票据识别方法的通用性。具体技术方案如下:
本发明实施例提供了一种票据信息识别方法,应用于票据信息识别***中的OCR设备,所述方法包括:
接收对待识别票据图像的信息识别请求;
基于所述信息识别请求,对所述待识别票据图像进行预处理,得到预处理后的待识别票据图像;
利用预先训练好的票据信息识别模型,识别所述预处理后的待识别票据图像中的票据信息,得到所述待识别票据图像的票据信息;其中,所述票据信息识别模型是根据预设训练集训练得到的,所述预设训练集包括多个不同票据类型的样本票据图像,以及每一样本票据图像的样本票据信息;
返回针对所述信息识别请求的第一响应消息,所述第一响应消息包括所述待识别票据图像的票据信息。
本发明实施例还提供了一种票据信息识别装置,应用于票据信息识别***中的OCR设备,所述装置包括:
接收模块,用于接收对待识别票据图像的信息识别请求;
预处理模块,用于基于所述信息识别请求,对所述待识别票据图像进行预处理,得到预处理后的待识别票据图像;
第一识别模块,用于利用预先训练好的票据信息识别模型,识别所述预处理后的待识别票据图像中的票据信息,得到所述待识别票据图像的票据信息;其中,所述票据信息识别模型是根据预设训练集训练得到的,所述预设训练集包括多个不同票据类型的样本票据图像,以及每一样本票据图像的样本票据信息;
第一返回模块,用于返回针对所述信息识别请求的第一响应消息,所述第一响应消息包括所述待识别票据图像的票据信息。
本发明实施例还提供了一种票据信息识别***,所述票据信息识别***包括的OCR设备和存储设备;
所述OCR设备,用于接收对待识别票据图像的信息识别请求;基于所述信息识别请求,对所述待识别票据图像进行预处理,得到预处理后的待识别票据图像;利用预先训练好的票据信息识别模型,识别所述预处理后的待识别票据图像中的票据信息,得到所述待识别票据图像的票据信息;其中,所述票据信息识别模型是根据预设训练集训练得到的,所述预设训练集包括多个不同票据类型的样本票据图像,以及每一样本票据图像的样本票据信息;返回针对所述信息识别请求的第一响应消息,所述第一响应消息包括所述待识别票据图像的票据信息;
所述存储设备,用于存储所述待识别票据图像的票据信息。
本发明实施例还提供了一种电子设备,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现上述任一所述的票据信息识别方法步骤。
本发明实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现上述任一所述的票据信息识别方法步骤。
本发明实施例还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述任一所述的票据信息识别方法。
本发明实施例有益效果:
本发明实施例提供的票据信息识别方法、装置及***,票据信息识别***中的OCR设备在接收到针对待识别票据图像的信息识别请求后,利用预先训练好的票据信息识别模型,识别预处理后的待识别票据图像中的票据信息,从而得到待处理票据图像的票据信息。相比于现有技术,利用OCR设备识别票据信息克服了人工识别对人力资源数量的依赖性,并且,由于票据信息识别模型是基于不同票据类型的样本票据图像训练得到的,使得票据信息识别模型直接可以识别出不同票据类型的票据图像的票据信息,有效降低了对预设候选模板以及字符特征信息的依赖,克服了传统的OCR技术中字符识别的局限性,这有效解决了现有票据信息识别方法所存在的问题,从而降低了对人力资源数量的依赖,提高了票据识别方法的通用性。
当然,实施本发明的任一产品或方法并不一定需要同时达到以上所述的所有优点。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的实施例。
图1为本发明实施例提供的票据信息识别模型训练方法的一种流程示意图;
图2为本发明实施例提供的预设深度学习网络的一种结构示意图;
图3为本发明实施例提供的票据信息识别方法的第一种流程示意图;
图4为本发明实施例提供的待识别票据图像预处理方法的一种流程示意图;
图5为本发明实施例提供的图像白边裁剪处理的一种示意图;
图6为本发明实施例提供的字符识别的一种示意图;
图7为本发明实施例提供的票据信息识别方法的第二种流程示意图;
图8为本发明实施例提供的票据信息识别方法的第三种流程示意图;
图9为本发明实施例提供的票据信息识别方法的第四种流程示意图;
图10为本发明实施例提供的票据信息识别过程的一种信令图;
图11为本发明实施例提供的票据识别装置的一种结构示意图;
图12为本发明实施例提供的票据识别***的一种结构示意图;
图13为本发明实施例提供的电子设备的一种结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
为了解决现有票据信息识别方法所存在的问题,本发明实施例提供了一种票据信息识别方法。该方法应用于票据信息识别***中的OCR设备。该OCR设备可以为用于票据信息识别的任一电子设备。在本发明实施例提供的方法中,接收对待识别票据图像的信息识别请求;基于信息识别请求,对待识别票据图像进行预处理,得到预处理后的待识别票据图像;利用预先训练好的票据信息识别模型,识别预处理后的待识别票据图像中的票据信息,得到待识别票据图像的票据信息;其中,票据信息识别模型是根据预设训练集训练得到的,该预设训练集包括多个不同票据类型的样本票据图像,以及每一样本票据图像的样本票据信息;返回针对信息识别请求的第一响应消息,第一响应消息包括待识别票据图像的票据信息。
在本发明实施例中,上述票据信息识别***可以包括上述OCR设备和存储设备。其中,票据信息识别***中OCR设备的数量至少为一个。
通过本发明实施例提供的方法,票据信息识别***中的OCR设备在接收到针对待识别票据图像的信息识别请求后,利用预先训练好的票据信息识别模型,识别预处理后的待识别票据图像中的票据信息,从而得到待处理票据图像的票据信息。相比于现有技术,利用OCR设备识别票据信息克服了人工识别对人力资源数量的依赖性,并且,由于票据信息识别模型是基于不同票据类型的样本票据图像训练得到的,使得票据信息识别模型直接可以识别出不同票据类型的票据图像的票据信息,有效降低了对预设候选模板以及字符特征信息的依赖,克服了传统的OCR技术中字符识别的局限性,这有效解决了现有票据信息识别方法所存在的问题,从而降低了对人力资源数量的依赖,提高了票据识别方法的通用性。
下面通过具体的实施例,对本发明实施例进行说明。
如图1所示,图1为本发明实施例提供的票据信息识别模型训练方法的一种流程示意图。该方法包括以下步骤。
步骤S101,获取预设训练集。
上述预设训练集包括多个不同票据类型的样本票据图像,以及每一样本票据图像的样本票据信息。
上述样本票据图像可以为对样本票据进行拍照后得到的图像,也可以是对样本票据进行扫描后得到的图像,还可以为对样本票据进行拍照或扫描所得到的图像进行预处理后的图像。其中,样本票据的票据类型包括但不限于汇票、本票、支票、提单、存单。关于预处理的方法可参照下文描述,在此不作具体说明。
根据上述预设训练集中样本票据对应票据类型的不同,每一样本票据图像所对应的样本票据信息也有所不同。例如,当上述样本票据为***时,该***的票据信息包括但不限于***代码、***号码、开票日期、购买方名称等信息。再例如,当上述样本票据为银行汇票时,该银行汇票的票据信息包括但不限于收款人、出票金额、实际计算金额、出票日期等信息。
在本发明实施例中,对上述预设训练集中的每一票据类型对应样本票据图像的数量、样本票据的票据类型、样本票据图像以及样本票据图像的票据信息不作具体限定。
步骤S102,针对每一样本票据图像,利用预设深度学习网络,识别该样本票据图像中票据信息,得到该样本票据图像的预测票据信息。
在本步骤中,针对每一样本票据图像,OCR设备可以将该样本票据图像输入到预设深度学习网络中,从而利用该预设深度学习网络识别该样本票据图像中包括的票据信息,并将识别出的票据信息作为该样本票据图像的预测票据信息输出。
一个可选的实施例中,为了提高训练得到的票据信息识别模型的准确性,上述预设深度学习网络可以是基于多种深度学习算法得到的。也就是上述预设深度学习网络可以由多种深度学习算法所对应的深度学习网络共同组成。
例如,上述预设深度学习网络可以是根据连续文本区域建议网络(ConnectionistText Proposal Network,CTPN)算法和卷积递归神经网络(Convolutional RecurrentNeural Network,CRNN)算法得到的深度学习网络。也就是上述预设深度学习网络可以由CTPN网络和CRNN网络共同组成。其中,CTPN算法/网络可以用于确定样本票据图像中字符所在的字符区域。CRNN算法/网络可以用于识别字符区域中的字符,从而得到样本票据图像中的字符串集合。
再例如,上述预设深度学习网络也可以是根据渐进尺度扩展网络(Shape RobustText Detection with Progressive Scale Expansion Network,PSENET)算法和卷积递归神经网络(Convolutional Recurrent Neural Network,CRNN)算法得到的深度学习网络。也就是上述预设深度学习网络可以由PSENET网络和CRNN网络共同组成。其中,PSENET算法/网络可以用于确定样本票据图像中字符所在的字符区域。CRNN算法/网络可以用于识别字符区域中的字符,从而得到样本票据图像中的字符串集合。
为便于理解,以上述预设深度学习网络可以是基于CTPN算法和CRNN算法得到的深度学习网络为例,对上述预设深度学习网络的进行说明。如图2所示,图2为本发明实施例提供的预设深度学习网络的一种结构示意图。在图2所示的预设深度学习网络中主要可以包括卷积层201,逻辑回归层202,全连接层203,卷积层204,循环层205和转录层206。其中,卷积层201,逻辑回归层202和全连接层203为上述CTPN网络的组成部分,卷积层204,循环层205和转录层206为上述CRNN网络的组成部分。除此以外,上述预设深度学习网络中还可以包括输入层、输出层(图2中未示出)等,在此不作具体说明。
上述卷积层201可以对输入的样本票据图像进行特征提取。也就是提取样本票据图像中每一像素点对应位置处全通道的特征,如红色绿色蓝色(Red Green Blue,RGB)通道的特征。
上述逻辑回归层202可以对卷积层201提取到的特征进行逻辑回归处理,如对卷积层201提取到的特征进行双向长短期记忆网络(Bi-directional Long Short-TermMemory,BLSTM)回归处理。
全连接层203对接收到的逻辑回归层202的输出进行全连接处理,可以得到2k个垂直坐标(vertical coordinates),2k个分数(scores),k个边细化(side-refinement)。其中,k为锚定点(anchor)个数,一般默认为10。vertical coordinates中包含有纵向偏移y和区域高度h两个参数值。Scores中包含了对样本票据图像的前景和背景的两种评分。side-refinement中包含了水平方向的偏移量x。
卷积层204对全连接层203的输出进行卷积处理,提取图像中的特征信息,得到特征序列。
循环层205为一个BLSTM网络,可以对卷积层204所提取到的特征序列进行进一步的预测,得到初步预测结果。相比于传统的循环神经网络(Recurrent Neural Network,RNN),在循环层205中包括忘记门、输入门、输出门三种门结构来处理RNN的细胞单元状态。其中,忘记门主要通过逻辑回归(sigmoid,也称S型生长曲线)函数来决定保留上一细胞状态的信息,输入门通过sigmoid和双曲正切(tanh)函数为细胞状态添加新的信息,并联合旧的细胞状态更新当前的细胞状态,输入门通过sigmoid函数决定着输出的特征。通过忘记门、输入门和输出门,可以将每个字符与之前的字符取得联系。
在本发明实施例中,采用两层BLSTM网络使得样本票据图像中的每个字符与其相邻字符(即该字符前后的字符)互相关联,经过两层LSTM后,循环层205输出每个特征序列预测的字符概率值,即上述初步预测结果。
转录层206基于上述初步预测结果进行转录得到最终预测结果。
在本发明实施例中,上述转录层206可以采用以下两种方式进行转录:
方式一,基于字典形式的转录。也就是在进行转录时,将输出的结果与预设字典对比,将概率最大预测值确定为最终的预测字符串,即上述最终预测结果。
方式二,基于无字典形式的转录。也就是不存在用于对比字符串或预设字典,在进行转录时,直接将概率最大的字符确定为最终的预测字符串,即上述最终预测结果。
在本发明实施例中,上述卷积层201和卷积层204中包含多个卷积单元和池化单元。以卷积层201为例进行说明,卷积层201可以对输入的样本票据图像进行多次卷积操作和池化操作,从而得到全通道的特征。在此,对上述卷积操作和池化操作过程不作具体说明。
一个可选的实施例中,在卷积层204对全连接层203的输出进行卷积处理之前,可以根据样本票据图像的大小,将该样本票据图像的高度等比例缩放为预设高度。例如,样本票据图像的宽度为W_0,高度为H_0,记为(W_0,H_0),预设高度为32,则等比例缩放后的样本票据图像的大小可以表示为(W,32)
通过对样本票据图像大小的调整可以使得卷积层204提取到的特征序列的感受野为矩形区域。具体的,可以将修改卷积层204中核尺度由正方形大小变为矩形大小,使得卷积层204得到矩形区域对应的特征序列。这将便于后期的字符识别,提高识别出的字符的准确性
根据上述预设深度学习网络所采用的深度学习算法的不同,上述预设深度学习网络的结构也有所不同。在此,对上述预设深度学习网络所采用的深度学习算法以及上述预设深度学习网络的结构不作具体说明。
步骤S103,基于每一样本票据图像对应的样本票据信息和预测票据信息,计算预设深度学习网络的的损失值。
在本步骤中,OCR设备可以根据上述预设训练集中每一样本票据图像所对应的样本票据信息和预测票据信息,利用预设损失函数,计算上述深度学习网络的损失值。
上述预设损失函数包括但不限于Softmax-交叉熵损失函数、对数损失函数以及L2回归损失函数。其中,Softmax-交叉熵损失函数中的Softmax表示Softmax函数,也可以称为归一化指数函数。L2回归损失函数也可以称为均方误差(Mean Square Error,MSE)损失函数。在此,对上述预设损失函数不作具体限定。
在本发明实施例中,由于上述预设深度学习网络可以是基于不同算法所构成的深度学习网络,因此,在计算上述深度学习网络的损失值时,OCR设备可以针对不同的算法分别计算对应的损失值。以上述预设深度学习网络是基于CTPN算法和CRNN算法所得到的深度学习网络为例,OCR设备可以利用上述L2回归损失函数,计算CTPN算法对应深度学习网络的损失值,利用上述Softmax-交叉熵损失函数,计算CRNN算法对应深度学习网络的损失值。在此,对上述损失值的计算过程不作具体说明。
步骤S104,当损失值大于预设损失值阈值时,调整预设深度学习网络的参数,并返回执行上述步骤S102。
在本步骤中,OCR设备可以将上述预设深度学习网络的损失值与预设损失值阈值进行比较,从而确定上述预设深度学习网络是否收敛。当预设深度学习网络的损失值大于预设损失值阈值时,OCR设备可以确定预设深度学习网络未收敛。此时,OCR设备可以调整预设深度学习网络的参数,并返回执行上述步骤S102。也就是返回执行上述针对每一样本票据图像,利用预设深度学习网络,识别该样本票据图像中票据信息,得到该样本票据图像的预测票据信息的步骤。
在本发明实施例中,上述对预设深度学习网络中参数的调整包括但不限于对预设深度学习网络中的偏置量和权重的调整。OCR设备所采用的参数调整方法包括但不限于梯度下降法、反向调节法。
步骤S105,当损失值不大于预设损失值阈值时,将当前的预设深度学习网络确定为训练好的票据信息识别模型。
在本步骤中,当上述预设深度学习网络的损失值不大于预设损失值阈值时,OCR设备可以确定预设深度学习网络收敛。此时,OCR设备可以将当前的预设深度学习网络确定为训练好的票据信息识别模型。
采用图1所示的方法,利用上述预设训练集训练得到的票据信息识别模型可以适用于对不同票据类型的票据的识别,提高了训练得到的票据信息识别模型的通用性,从而提高了票据识别方法的通用性。
基于图1所示的方法训练得到的票据信息识别模型,本发明实施例提供了一种票据信息识别方法。如图3所示,图3为本发明实施例提供的票据信息识别方法的第一种流程示意图。该方法应用于票据信息识别***中的OCR设备,具体包括以下步骤。
步骤S301,接收对待识别票据图像的信息识别请求。
上述信息识别请求中可以包括的待识别票据的待识别票据图像。关于待识别票据图像可参照上述对样本票据图像的描述,在此不作具体说明。
一个可选的实施例中,用户可以通过客户端向OCR设备发送针对待识别票据图像的信息识别请求。OCR设备接收用户发送的信息识别请求。
另一个可选的实施例中,上述OCR设备中可以包括多个OCR计算实例单元(即服务实例,Service Instance),为了实现各个OCR计算实例单元之间的负载均衡,在上述票据信息识别***中可以设置有一请求代理中间件,如反向代理(Reverse Proxy)。用户在向票据信息识别***发送对待识别票据图像的信息识别请求时,可以由该请求代理中间件接收该用户发送的信息识别请求,从而根据OCR设备中每一OCR计算实例单元的计算资源,将接收到的信息识别请求转发给计算资源未被占用的OCR计算实例单元。OCR设备中的该OCR计算实例单元接收请求代理中间件转发的信息识别请求。
上述请求代理中间件可以集成在上述OCR设备中,也可以集成在其他电子设备中。为便于描述,在本发明实施例中以上述请求代理中间件集成在OCR设备中为例进行说明,并不起任何限定作用。
步骤S302,基于信息识别请求,对待识别票据图像进行预处理,得到预处理后的待识别票据图像。
在本步骤中,上述预处理包括但不限于图像对比度增强处理、图像灰度化处理、图像二值化处理、图像白边裁剪处理、倾斜校正处理。也就是OCR设备在接收到上述信息识别请求时,可以按照预设预处理顺序,对该信息识别请求中携带的待识别票据图像进行预处理,得到预处理后的待识别票据图像。例如,OCR设备可以依次对待识别票据图像进行图像对比度增强处理、图像灰度化处理、图像二值化处理、图像白边裁剪处理、倾斜校正处理,得到预处理后的待识别票据图像。关于预处理的具体过程可参见下文描述,在此不作具体说明。
在本发明实施例中,根据上述待识别票据的票据类别的不同,以及待识别票据图像的不同,上述对待识别票据图像的预处理过程也有所不同。
例如,在一种常见的***中左上角区域为二维码所在区域。当上述待识别票据为该***时,上述预处理过程还可以包括文字方向校正过程。也就是OCR设备可以利用预设滤波器,如高斯滤波器对该***对应的待识别票据图像进行卷积处理,确定最大值所在位置,并将该最大值所在位置确定为该***的左上角位置,从而确定该待识别票据图像文字的方向。
再例如,当上述待识别票据图像为对待识别票据进行拍照得到的图像,即待识别票据图像为彩色图像时,上述预处理过程可以包括图像灰度化处理过程。当上述待识别票据图像为对待识别票据进行扫描后的图像,即该图像为灰度图像时,上述预处理过程可以不包括上述图像灰度化处理过程。
在本发明实施例中,对上述待识别票据图像的预处理过程不作具体限定。
一个可选的实施例中,当上述待识别票据图像中包括上述二维码时,OCR设备可以直接识别待识别票据图像中的二维码,得到待设备票据图像的票据信息,并存储该票据信息。当上述待识别票据图像中不包括上述二维码时,OCR设备执行上述步骤S302,也就是执行基于信息识别请求,对待识别票据图像进行预处理,得到预处理后的待识别票据图像的步骤。
步骤S303,利用预先训练好的票据信息识别模型,识别预处理后的待识别票据图像中的票据信息,得到待识别票据图像的票据信息;其中,票据信息识别模型是根据预设训练集训练得到的,预设训练集包括多个不同票据类型的样本票据图像,以及每一样本票据图像的样本票据信息。
关于待识别票据图像的票据信息的识别过程可参见下文描述,在此不作具体说明。
步骤S304,返回针对信息识别请求的第一响应消息,第一响应消息包括待识别票据图像的票据信息。
在本步骤中,OCR设备可以根据上述票据识别模型输出的识别结果,即上述待识别票据图像的票据信息,返回针对上述信息识别请求的第一响应消息。
一个可选的实施例中,若上述信息识别请求是由用户直接发送给OCR设备的,则OCR设备可以向用户所使用的客户端发送包括待识别票据图像的票据信息的第一响应消息。
另一个可选的实施例中,若上述信息识别请求是由上述请求代理中间件转发的,则OCR设备可以向请求代理中间件发送包括待识别票据图像的票据信息的第一响应消息。请求代理中间件将该第一消息消息发送给上述信息识别请求所对应的客户端,也就是发送上述信息识别请求的客户端。
采用图3所示的方法,票据信息识别***中的OCR设备在接收到针对待识别票据图像的信息识别请求后,利用预先训练好的票据信息识别模型,识别预处理后的待识别票据图像中的票据信息,从而得到待处理票据图像的票据信息。相比于现有技术,利用OCR设备识别票据信息克服了人工识别对人力资源数量的依赖性,并且,由于票据信息识别模型是基于不同票据类型的样本票据图像训练得到的,使得票据信息识别模型直接可以识别出不同票据类型的票据图像的票据信息,有效降低了对预设候选模板以及字符特征信息的依赖,克服了传统的OCR技术中字符识别的局限性,这有效解决了现有票据信息识别方法所存在的问题,从而降低了对人力资源数量的依赖,提高了票据识别方法的通用性。
一个可选的实施例中,由于上述OCR设备中的中央处理器(Central ProcessingUnit,CPU)、内存、图形处理单元(Graphics Processing Unit,GPU)的硬件特性等因素的影响,使得无法在OCR设备上同时启动多个进程进行服务。因此,在本发明实施例中上述OCR设备可以为单进程多线程模式处理上述信息识别请求,这使得OCR设备可以同步处理多个信息识别请求。
一个可选的实施例中,针对上述步骤S302,基于信息识别请求,对待识别票据图像进行预处理,得到预处理后的待识别票据图像,本发明实施例提供了一种待识别票据图像的预处理方法。如图4所示,图4为本发明实施例提供的待识别票据图像预处理方法的一种流程示意图。具体可以将上述步骤S302细化为如下步骤。
步骤S3021,利用预设伽玛系数,对信息识别请求中的待识别票据图像进行伽玛变换,得到第一图像。
在本步骤中,当上述信息识别请求中的待识别票据图像为彩色图像时,由于待识别票据图像中除了包括票据信息以外,还包括一些其他信息如边框信息等。例如,常见的票据中边框一般为褐色,文字一般为蓝色或红色。为了使得待识别票据图像中的票据信息与其他信息之间的区别更加明显,OCR设备可以对待识别票据图像进行图像对比度增强处理,也就是OCR设备可以利用预设伽玛系数,对信息识别请求中的待识别票据图像进行伽玛变换,得到第一图像,即图像对比度增强后的图像。其中,伽玛变换也可以称为Gamma变换。
一个可选的实施例中,上述预设伽玛系数可以为2.5。除此以外,上述预设伽玛系数也可以为其他数值,例如,上述预设伽玛系数的取值范围可以在1-3之间,其中,预设伽玛系数为1表示未进行图像对比度增强处理,即预设伽玛系数为1为上述待识别票据图像。
一个可选的实施例中,上述信息识别请求中的待识别票据图像为灰度图像时,OCR设备可以采用其他方法对该待识别票据图像进行图像对比对增强处理,得到第一图像。例如,OCR设备可以采用灰度变换法对待识别票据图像进行图像对比对增强处理,得到第一图像。
在本发明实施例中,对上述图像对比对增强处理所采用的方法不作具体限定。
步骤S3022,将第一图像转换为灰度图像,得到第二图像。
在本步骤中,OCR设备可以对上述第一图像进行图像灰度化处理,也就是将第一图像转换为灰度图像,得到第二图像。通过将第一图像中每一像素点的RGB值转换为灰度值,从而去除第一图像中的颜色信息,增强文字信息,即增强票据信息。关于图像灰度化处理的过程,在此不作具体说明。
步骤S3023,基于第二图像中各个像素点对应像素值的平均值,对第二图像进行图像二值化处理,得到第三图像。
在本步骤中,为了进步提高预处理后的待识别票据图像的准确性,OCR设备可以对上述第二图像进行图像二值化处理,从而区别待识别票据图像的前景和背景。也就是基于第二图像中各个像素点对应像素值的平均值,对第二图像进行图像二值化处理,得到第三图像,即得到对第二图像进行图像二值化处理后的图像。
具体的,OCR设备可以根据上述第二图像中每一像素点的像素值,即灰度值,计算该第二图像中像素值的平均值。以第二图像中包括的5个像素点,即像素点1-5为例,假设像素点1-5所对应的像素值为灰度1-5。第二图像中像素值的平均值Z可以表示为:
OCR设备可以将上述第二图像中每一像素点的像素值与上述平均值进行比较。针对每一像素点,当该像素点的像素值小于上述平均值时,OCR设备可以确定该像素点的像素值为0,即该像素点表示为黑色,也就是上述待识别票据图像的前景;当该像素点的像素值不小于上述平均值时,OCR设备可以确定该像素点的像素值为255,即该像素点表示为白色也就是上述待识别票据图像的背景,从而得到第三图像。
步骤S3024,根据第三图像中水平方向上每一行包括的各个像素点的像素值,竖直方向上每一列包括的各个像素点的像素值,以及预设像素值的像素点数量阈值,确定第三图像的外边框位置,并对外边框位置内的图像进行裁剪,得到第四图像。
为便于理解,以上述第三图像中任一水平方向上的像素点,结合图5为例进行说明,图5为本发明实施例提供的图像白边裁剪处理的一种示意图。
在图5中包括10个像素点,即像素点a-j。这10个像素点为上述第三图像中某一水平方向上包括的所有像素点。其中,像素点a、像素点c、像素点d、像素点h、像素点i和像素点j的像素值为0,像素点b、像素点e、像素点f、像素点g的像素值为255。
针对上述第三图像中水平方向上的每一行,OCR设备可以按照自左向右的顺序遍历每一像素点,并统计像素值为预设像素值的像素点的数量。当像素值为预设像素值的像素点的数量等于上述像素点数量阈值时,反向遍历上述像素点数量阈值个像素点,并将最后遍历到的像素点所在的位置确定为该行像素点的左边界位置。以此类推,OCR设备可以按照左外边界位置的确定方法,分别确定每一行像素点的右边界位置,每一列像素点的上边界位置以及每一列像素点的下边界位置。
为便于理解,以上述预设像素值为0,像素点数量阈值为4,结合上述图5对上述左边界位置的确定进行举例说明。针对上述第三图像中水平方向上的每一行,OCR设备可以按照自左向右的顺序遍历每一像素点,当遍历到像素点h时,像素值为0的像素点的数量为4。此时,OCR设备将反向遍历4个像素点,也就是从像素点h遍历至像素点d。OCR设备可以将像素点d的左边界确定该行像素点的左边界位置。
OCR设备可以根据确定出的水平方向上每一行的左边界位置和右边界位置,以及竖直方向上每一列的上边界位置和下边界位置,确定第三图像的外边框位置。例如,OCR设备可以将水平方向上的每一左边界位置和右边界位置,以及竖直方向上每一上边界位置和下边界位置所对应的最小矩形区域或者最小多边形区域,确定为第三图像的外边框位置。
OCR设备可以对第三图像中确定出的外边框位置内的图像进行裁剪,得到第四图像,也就是得到图像白边裁剪处理后的图像。
在本发明实施例中,上述步骤S3024是对第三图像的图像白边裁剪处理过程,在丢弃第三图像中无关白边信息的同时,可以降低图像白边裁剪处理后的第四图像中的噪声信息,如上述图5中的像素点a和像素点c对后期票据信息识别的影响,提高了票据信息识别的准确性。
步骤S3025,对第四图像进行倾斜校正,得到预处理后的待识别票据图像。
在本发明实施例中,由于在对待识别票据进行拍摄或扫描的过程中,可以能用于拍摄角度或者扫描时放置的位置,可能使得待识别票据图像中的待识别票据出现倾斜,如文字方向发生倾斜。为了降低图像倾斜给后期票据信息识别识别带来的影响,OCR设备可以对上述第四图像进行倾斜校正,从而得到倾斜校正处理后的图像,也就是预处理后的待识别票据图像,提高后期票据信息识别的准确性。
在图4所示的实施例中,上述对待识别票据图像的预处理过程包括但不限于上述图像对比度增强处理、图像灰度化处理、图像二值化处理、图像白边裁剪处理以及倾斜校正处理。上述预处理后的待识别票据图像为预处理过程最后一步处理后得到的图像,并不限于上述倾斜校正处理后的图像。
采用图4所示的方法,OCR设备通过对待识别票据图像的预处理过程,提高了后期对预处理后的待识别票据图像识别的准确性,从而提高了票据信息识别方法的准确性。
一个可选的实施例中,上述步骤S303,利用预先训练好的票据信息识别模型,识别预处理后的待识别票据图像中的票据信息,得到待识别票据图像的票据信息,具体可以包括以下步骤。
步骤一,基于预先训练好的票据信息识别模型,确定预处理后的待识别票据图像中各个字符所在的区域作为字符区域,并识别字符区域中的字符,得到字符串集合。
为便于理解,结合图6以票据信息识别模型是根据上述CTPN算法和CRNN算法所构成的深度神经网络为例进行说明,图6为本发明实施例提供的字符识别的一种示意图。
上述CTPN算法所对应的深度网络是结合了卷积神经网络(Convolutional NeuralNetworks,CNN)与长短期记忆网络(Long Short-Term Memory,LSTM)得到的。根据上述预处理后的待识别票据图像中文字的特点,可以将每一个文字看作是一个字符、部分字符或者多个字符所组成的一个序列。如图6所示,字符S是上述预处理后的待识别票据图像中的一个字符,利用CTPN算法可以确定该字符S可以有区域601-区域605中包括的部分字符所共同组成的。因此,区域601-区域605所共同构成的区域为预处理后的待识别票据图像中字符S所在的字符区域。以此类推,OCR设备可以识别预处理后的待识别票据图像中各个字符所在的区域,从而得到预处理后的待识别票据图像中的字符区域。
在本发明实施例中,由于上述LSTM具有上下文推断能力可以提取预处理后的待识别票据图像中各个字符间的特征,因此,OCR设备在确定字符区域时,可以将存在上下文关联关系的字符划分到同一字符区域中,如上述***中购买方名称中的每一字符之间存在上下文关联关系可以将购买方名称划分为同一字符区域。
在本发明实施例中,上述预处理后的待识别票据图像中的字符区域可以包括多个字符区域。每一字符区域中至少包括一个字符。
一个可选的实施例中,上述字符区域可以记录为左上角顶点所在的坐标位置和字符区域的宽高值。仍以图6为例进行说明。假设预处理后的待识别票据图像中图6所示的字符S所在区域为一字符区域。该字符区域可以记录为区域601所在位置的左上角顶点坐标,区域601-区域605所对应的宽度和值,以及区域601和区域605中任一区域对应的高度值。
一个可选的实施例中,由于上述预处理后的待识别票据图像中包括的文字信息可能较多,OCR设备可以根据每一字符区域对应的宽高比对确定出的多个字符区域进行筛选。以每一字符所在的区域为一正方形区域(即宽高比为1:1)为例进行说明,OCR设备可以可以筛选出宽高比大于2的字符区域,即丢弃宽高比不大于2的字符区域。也就是筛选出至少包括两个字符的字符区域。
在本发明实施例中,上述CTPN算法相比于传统的OCR技术识别方法中利用候选模板提取字符的方法,可以在很大程度上降低了对上述待识别票据图像的约束性,从而提高票据信息识别方法的通用性。
一个可选的实施例中,在确定预处理后的待识别票据图像中的字符区域后,OCR设备可以利用CRNN算法对字符区域中的文字进行识别,得到每一字符区域对应的字符串,进而得到预处理后的待识别票据图像对应的字符串集合。
在本发明实施例中,上述CRNN算法所对应的深度学***尺度归一化的前提下,保留了待识别票据中字符间的上下文特征,提高了票据识别模型对票据信息识别的准确性。除此以外,CRNN算法适用于无词典场景的字符识别任务,以及基于词典场景的文本识别任务,这提高了字符识别的通用性,从而提高票据信息识别方法的通用性。
步骤二,对字符串集合进行正则化匹配,得到待识别票据图像的票据信息。
在本步骤中,OCR设备可以按照预设匹配规则,对字符串集合进行正则化匹配,得到待识别票据图像的票据信息。例如,一种已知的增值税***中***代码的规则一般为10位数字或12位数字。OCR设备可以将该规则确定为预设匹配规则中的一条规则,从而根据该规则识别出增值税***中的***代码。
在本发明实施中,上述预设匹配规则可以根据不同的票据类型的票据中包括的票据信息的特征进行设定。在此,对上述预设匹配规则不作具体限定。
通过上述步骤一和步骤二,OCR设备可以准确识别预处理后的待识别票据中的票据信息,提高了票据信息识别的准确性以及票据信息识别方法的通用性。
一个可选的实施例中,根据图3所示的方法,本发明实施例还提供了一种票据信息识别方法。如图7所示,图7为本发明实施例提供的票据信息识别方法的第二种流程示意图。该方法包括以下步骤。
步骤S701,接收对待识别票据图像的信息识别请求。
上述步骤S701与上述步骤S301相同。
步骤S702,对信息识别请求进行认证,得到认证结果。
在本步骤中,OCR设备可以在接收到上述信息识别请求后,可以根据该信息识别请求中携带的除上述待识别票据图像以外的其他信息对该信息识别请求进行认证。
在本发明实施例中,上述信息识别请求在网络中传输是以报文的形式进行的。因此,上述信息识别请求中还可以包括其他信息。以信息识别请求为超文本传输协议(HyperText Transfer Protocol,HTTP)报文为例,信息识别请求中还可以发送端的地址信息,报文的报头(Headers)字段,报文的内容长度(Content-Length)等信息。
为便于理解,以上述内容长度对信息识别请求的认证过程进行说明。当信息识别请求的内容长度大于预设内容长度阈值时,OCR设备可以确定该信息识别请求为非法请求。当信息识别请求的内容长度不大于预设内容长度阈值时,OCR设备可以确定该信息识别请求为合法请求。
在本发明实施例中,对上述信息识别请求的合法认证过程不作具体限定。
步骤S703,在认证结果指示信息识别请求为合法请求时,基于信息识别请求,对待识别票据图像进行预处理,得到预处理后的待识别票据图像。
在本发明实施例中,通过上述信息识别请求的合法认证过程,可以及时避免OCR设备对非法的信息识别请求中的待识别票据信息进行识别,有效节约了OCR设备的计算资源,从而减少了OCR设备所需识别的票据图像的数量,提高了OCR设备的对票据信息的识别效率。
步骤S704,利用预先训练好的票据信息识别模型,识别预处理后的待识别票据图像中的票据信息,得到待识别票据图像的票据信息;其中,票据信息识别模型是根据预设训练集训练得到的,预设训练集包括多个不同票据类型的样本票据图像,以及每一样本票据图像的样本票据信息。
步骤S705,返回针对信息识别请求的第一响应消息,第一响应消息包括待识别票据图像的票据信息。
上述步骤S704-步骤S705与上述步骤S303-步骤S304相同。
一个可选的实施例中,根据图3所示的方法,本发明实施例还提供了一种票据信息识别方法。如图8所示,图8为本发明实施例提供的票据信息识别方法的第三种流程示意图。该方法包括以下步骤。
步骤S801,接收对待识别票据图像的信息识别请求。
上述步骤S801与上述步骤S301相同。
步骤S802,在当前计算资源被占用的情况下,返回针对信息识别请求的第二响应消息;第二响应消息包括指示计算资源被占用的标识码。
在本步骤中,OCR设备在接收到上述信息识别请求时,可以确定当前计算资源是否被占用,也就是判断OCR设备当前是否处理接收到的其他识别请求。在确定当前计算资源被占用时,OCR设备可以返回针对上述信息识别请求的第二响应消息。关于第二响应消息的发送方法可参照上述第一响应消息的发送方法,在此不作具体说明。
在传统的OCR技术中,请求消息一般是通过消息队列的形式进行处理的,但是由于OCR服务特性,较长的时延将会导致消息队列过长,出现不可预估的错误,如请求消息溢出等情况。在本发明实施例中,OCR设备根据当前计算资源的被占用情况,可以保证OCR设备中的每一OCR计算实例单元及时拒绝其他信息识别请求,保证了对信息识别请求响应的有序性。
步骤S803,基于信息识别请求,对待识别票据图像进行预处理,得到预处理后的待识别票据图像。
在本步骤中,当确定当前计算资源未被占用时,OCR设备可以基于信息识别请求,对待识别票据图像进行预处理,得到预处理后的待识别票据图像。
步骤S804,利用预先训练好的票据信息识别模型,识别预处理后的待识别票据图像中的票据信息,得到待识别票据图像的票据信息;其中,票据信息识别模型是根据预设训练集训练得到的,预设训练集包括多个不同票据类型的样本票据图像,以及每一样本票据图像的样本票据信息。
步骤S805,返回针对信息识别请求的第一响应消息,第一响应消息包括待识别票据图像的票据信息。
上述步骤S804-步骤S805与上述步骤S303-步骤S304相同。
一个可选的实施例中,根据图3所示的方法,本发明实施例还提供了一种票据信息识别方法。如图9所示,图9为本发明实施例提供的票据信息识别方法的第四种流程示意图。该方法包括以下步骤。
步骤S901,接收对待识别票据图像的信息识别请求。
步骤S902,基于信息识别请求,对待识别票据图像进行预处理,得到预处理后的待识别票据图像。
步骤S903,利用预先训练好的票据信息识别模型,识别预处理后的待识别票据图像中的票据信息,得到待识别票据图像的票据信息;其中,票据信息识别模型是根据预设训练集训练得到的,预设训练集包括多个不同票据类型的样本票据图像,以及每一样本票据图像的样本票据信息。
上述步骤S901-步骤S903与上述步骤S301-步骤S303相同。
步骤S904,将待识别票据图像和待识别票据图像的票据信息存储至票据信息识别***中的存储设备。
在本步骤中,OCR设备可以将上述待识别票据图像和待识别票据图像的票据信息发送给票据信息识别***中的存储设备。存储设备在接收到OCR设备发送的待识别票据图像和待识别票据图像的票据信息后,可以计算待识别票据图像进行哈希(Hash)计算,得到该待识别票据图像的Hash值,并存储该待识别票据图像。进而存储设备可以存储待识别票据图像所对应的Hash值,绝对地址以及票据信息。
一个可选的实施例中,上述存储设备可以利用预设Hash算法,对上述待识别票据图像进行Hash计算,得到待识别票据图像的Hash值。其中,预设Hash算法包括但不限于信息摘要算法(Message-Digest Algorithm,MD5)、安全散列(Secure Hash Algorithm,SHA)算法。
一个可选的实施例中,存储设备在对上述待识别票据图像对应的Hash值、绝对地址以及票据信息进行存储时,可以建立Hash值、绝对地址和票据信息三者之间对应关系,从而将该对应关系存储到上述存储设备中的预设对应关系列表中。如表1所示,表1为本发明实施例提供对应关系存储的一种方式。
表1
Hash值 | 绝对地址 | 票据信息 |
Hash值1 | 地址1 | 票据信息1 |
Hash值2 | 地址2 | 票据信息3 |
存储设备可以按照表1所示的方式将待识别票据图像对应的Hash值、绝对地址以及票据信息存储到上述表1中。在本发明实施例中,对上述将待识别票据图像对应的Hash值、绝对地址以及票据信息的存储方式不作具体限定。
在本发明实施例中,在确定待识别票据图像的票据信息后通过对该票据信息的持久化存储,可以便于后期的票据信息查询、统计等操作。
一个可选的实施例中,上述存储设备在接收到OCR设备发送的待识别票据图像和待识别票据图像的票据信息后,也可以直接对该待识别票据图像和待识别票据图像的票据信息进行存储。在此,上述待识别票据图像的票据信息的存储不作具体限定。
步骤S905,返回针对信息识别请求的第一响应消息,第一响应消息包括待识别票据图像的票据信息。
上述步骤S905与上述步骤S304相同。
在本发明实施例中,对上述步骤S904与步骤S905的执行顺序不作具体限定。
为便于理解,结合图10对上述本发明实施例提供的票据信息识别方法进行说明。图10为本发明实施例提供的票据信息识别过程的一种信令图。具体可以包括以下步骤。
步骤S1001,客户端向OCR设备发送包括待识别票据图像的信息识别请求。
步骤S1002,OCR设备接收信息识别请求。
步骤S1003,OCR设备对信息识别对信息识别请求进行认证,得到认证结果。
步骤S1004,OCR设备在认证结果指示信息识别请求为合法请求时,确定当前计算资源是否被占用。若是,则执行步骤S1005。若否,则执行步骤S1006。
当上述认证结果指示信息识别请求为非法请求时,OCR设备可以不响应该信息识别请求,如丢弃该信息识别请求。
步骤S1005,OCR设备返回针对信息识别请求的第二响应消息。
其中,上述第二响应消息包括指示计算资源被占用的标识码。
在本发明实施例中,上述步骤S1002-步骤S1005可以由上述OCR设备中的请求代理中间件执行。
步骤S1006,OCR设备基于信息识别请求,对待识别票据图像进行预处理,得到预处理后的待识别票据图像。
步骤S1007,OCR设备利用预先训练好的票据信息识别模型,识别预处理后的待识别票据图像中的票据信息,得到待识别票据图像的票据信息。
步骤S1008,OCR设备将待识别票据图像和待识别票据图像的票据信息发送给存储设备。
步骤S1009,存储设备对接收到的待识别票据图像和待识别票据图像的票据信息进行对应存储。
步骤S1010,OCR设备向客户端返回针对信息识别请求的第一响应消息。
其中,上述第一响应消息包括待识别票据图像的票据信息。
在本发明实施例中,对上述步骤S1008和步骤S1010的执行顺序不作具体限定。
基于同一种发明构思,根据上述本发明实施例提供的票据信息识别方法,本发明实施例还提供了一种票据信息识别装置。如图11所示,图11为本发明实施例提供的票据识别装置的一种结构示意图。该装置应用于据信息识别***中的OCR设备,具体包括以下模块。
接收模块1101,用于接收对待识别票据图像的信息识别请求;
预处理模块1102,用于基于信息识别请求,对待识别票据图像进行预处理,得到预处理后的待识别票据图像;
第一识别模块1103,用于利用预先训练好的票据信息识别模型,识别预处理后的待识别票据图像中的票据信息,得到待识别票据图像的票据信息;其中,票据信息识别模型是根据预设训练集训练得到的,预设训练集包括多个不同票据类型的样本票据图像,以及每一样本票据图像的样本票据信息;
第一返回模块1104,用于返回针对信息识别请求的第一响应消息,第一响应消息包括待识别票据图像的票据信息。
可选的,上述第一识别模块1103,具体可以用于基于预先训练好的票据信息识别模型,确定预处理后的待识别票据图像中各个字符所在的区域作为字符区域,并识别字符区域中的字符,得到字符串集合;对字符串集合进行正则化匹配,得到待识别票据图像的票据信息。
可选的,上述预处理模块1102,具体可以用于利用预设伽玛系数,对信息识别请求中的待识别票据图像进行伽玛变换,得到第一图像;
将第一图像转换为灰度图像,得到第二图像;
基于第二图像中各个像素点对应像素值的平均值,对第二图像进行图像二值化处理,得到第三图像;
根据第三图像中水平方向上每一行包括的各个像素点的像素值,竖直方向上每一列包括的各个像素点的像素值,以及预设像素值的像素点数量阈值,确定第三图像的外边框位置,并对外边框位置内的图像进行裁剪,得到第四图像;
对第四图像进行倾斜校正,得到预处理后的待识别票据图像。
可选的,上述票据信息设备装置还可以包括:
认证模块,用于对信息识别请求进行认证,得到认证结果;
上述预处理模块1102,具体可以用于在认证模块的认证结果指示信息识别请求为合法请求时,基于信息识别请求,对待识别票据图像进行预处理,得到预处理后的待识别票据图像。
可选的,上述票据信息设备装置还可以包括:
第二返回模块,用于在接收对待识别票据图像的信息识别请求之后,若当前计算资源被占用,则返回针对信息识别请求的第二响应消息;第二响应消息包括指示计算资源被占用的标识码。
可选的,上述票据信息设备装置还可以包括:
发送模块,用于在返回针对信息识别请求的第一响应消息之前,将待识别票据图像和待识别票据图像的票据信息存储至票据信息识别***中的存储设备。
可选的,上述票据信息设备装置还可以包括:
获取模块,用于获取预设训练集;
第二识别模块,用于针对每一样本票据图像,利用预设深度学习网络,识别该样本票据图像中票据信息,得到该样本票据图像的预测票据信息;
计算模块,用于基于每一样本票据图像对应的样本票据信息和预测票据信息,计算预设深度学习网络的的损失值;
调整模块,用于当损失值大于预设损失值阈值时,调整预设深度学习网络的参数,并返回执行针对每一样本票据图像,利用预设深度学习网络,识别该样本票据图像中票据信息,得到该样本票据图像的预测票据信息的步骤;
确定模块,用于当损失值不大于预设损失值阈值时,将当前的预设深度学习网络确定为训练好的票据信息识别模型。
通过本发明实施例提供的装置,票据信息识别***中的OCR设备在接收到针对待识别票据图像的信息识别请求后,利用预先训练好的票据信息识别模型,识别预处理后的待识别票据图像中的票据信息,从而得到待处理票据图像的票据信息。相比于现有技术,利用OCR设备识别票据信息克服了人工识别对人力资源数量的依赖性,并且,由于票据信息识别模型是基于不同票据类型的样本票据图像训练得到的,使得票据信息识别模型直接可以识别出不同票据类型的票据图像的票据信息,有效降低了对预设候选模板以及字符特征信息的依赖,克服了传统的OCR技术中字符识别的局限性,这有效解决了现有票据信息识别方法所存在的问题,从而降低了对人力资源数量的依赖,提高了票据识别方法的通用性。
基于同一种发明构思,根据上述本发明实施例提供的票据信息识别方法,本发明实施例还提供了一种票据信息识别***。如图12所示,图12为本发明实施例提供的票据识别***的一种结构示意图。该票据信息识别***包括的OCR设备1201和存储设备1202;
上述OCR设备1201,用于接收对待识别票据图像的信息识别请求;基于信息识别请求,对待识别票据图像进行预处理,得到预处理后的待识别票据图像;利用预先训练好的票据信息识别模型,识别预处理后的待识别票据图像中的票据信息,得到待识别票据图像的票据信息;其中,票据信息识别模型是根据预设训练集训练得到的,预设训练集包括多个不同票据类型的样本票据图像,以及每一样本票据图像的样本票据信息;返回针对信息识别请求的第一响应消息,第一响应消息包括待识别票据图像的票据信息;
上述存储设备1202,用于存储待识别票据图像的票据信息。
通过本发明实施例提供的***,票据信息识别***中的OCR设备在接收到针对待识别票据图像的信息识别请求后,利用预先训练好的票据信息识别模型,识别预处理后的待识别票据图像中的票据信息,从而得到待处理票据图像的票据信息。相比于现有技术,利用OCR设备识别票据信息克服了人工识别对人力资源数量的依赖性,并且,由于票据信息识别模型是基于不同票据类型的样本票据图像训练得到的,使得票据信息识别模型直接可以识别出不同票据类型的票据图像的票据信息,有效降低了对预设候选模板以及字符特征信息的依赖,克服了传统的OCR技术中字符识别的局限性,这有效解决了现有票据信息识别方法所存在的问题,从而降低了对人力资源数量的依赖,提高了票据识别方法的通用性。
基于同一种发明构思,根据上述本发明实施例提供的票据信息识别方法,本发明实施例还提供了一种电子设备,该电子设备为上述OCR设备,如图13所示,包括处理器1301、通信接口1302、存储器1303和通信总线1304,其中,处理器1301,通信接口1302,存储器1303通过通信总线1304完成相互间的通信;
存储器1303,用于存放计算机程序;
处理器1301,用于执行存储器1303上所存放的程序时,实现如下步骤:
接收对待识别票据图像的信息识别请求;
基于信息识别请求,对待识别票据图像进行预处理,得到预处理后的待识别票据图像;
利用预先训练好的票据信息识别模型,识别预处理后的待识别票据图像中的票据信息,得到待识别票据图像的票据信息;其中,票据信息识别模型是根据预设训练集训练得到的,预设训练集包括多个不同票据类型的样本票据图像,以及每一样本票据图像的样本票据信息;
返回针对信息识别请求的第一响应消息,第一响应消息包括待识别票据图像的票据信息。
通过本发明实施例提供的电子设备,票据信息识别***中的OCR设备在接收到针对待识别票据图像的信息识别请求后,利用预先训练好的票据信息识别模型,识别预处理后的待识别票据图像中的票据信息,从而得到待处理票据图像的票据信息。相比于现有技术,利用OCR设备识别票据信息克服了人工识别对人力资源数量的依赖性,并且,由于票据信息识别模型是基于不同票据类型的样本票据图像训练得到的,使得票据信息识别模型直接可以识别出不同票据类型的票据图像的票据信息,有效降低了对预设候选模板以及字符特征信息的依赖,克服了传统的OCR技术中字符识别的局限性,这有效解决了现有票据信息识别方法所存在的问题,从而降低了对人力资源数量的依赖,提高了票据识别方法的通用性。
上述电子设备提到的通信总线可以是外设部件互连标准(Peripheral ComponentInterconnect,PCI)总线或扩展工业标准结构(Extended Industry StandardArchitecture,EISA)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
通信接口用于上述电子设备与其他设备之间的通信。
存储器可以包括随机存取存储器(Random Access Memory,RAM),也可以包括非易失性存储器(Non-Volatile Memory,NVM),例如至少一个磁盘存储器。可选的,存储器还可以是至少一个位于远离前述处理器的存储装置。
上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,CPU)、网络处理器(Network Processor,NP)等;还可以是数字信号处理器(Digital SignalProcessing,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
基于同一种发明构思,根据上述本发明实施例提供的票据信息识别方法,本发明实施例还提供了一种计算机可读存储介质,该计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现上述任一票据信息识别方法的步骤。
基于同一种发明构思,根据上述本发明实施例提供的票据信息识别方法,本发明实施例还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述实施例中任一票据信息识别方法。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本发明实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如固态硬盘Solid State Disk(SSD))等。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置、***、电子设备、计算机可读存储介质及计算机程序产品等施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本发明的较佳实施例,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。
Claims (10)
1.一种票据信息识别方法,其特征在于,应用于票据信息识别***中的光学字符识别OCR设备,所述方法包括:
接收对待识别票据图像的信息识别请求;
基于所述信息识别请求,对所述待识别票据图像进行预处理,得到预处理后的待识别票据图像;
利用预先训练好的票据信息识别模型,识别所述预处理后的待识别票据图像中的票据信息,得到所述待识别票据图像的票据信息;其中,所述票据信息识别模型是根据预设训练集训练得到的,所述预设训练集包括多个不同票据类型的样本票据图像,以及每一样本票据图像的样本票据信息;
返回针对所述信息识别请求的第一响应消息,所述第一响应消息包括所述待识别票据图像的票据信息。
2.根据权利要求1所述的方法,其特征在于,所述利用预先训练好的票据信息识别模型,识别所述预处理后的待识别票据图像中的票据信息,得到所述待识别票据图像的票据信息的步骤,包括:
基于预先训练好的票据信息识别模型,确定所述预处理后的待识别票据图像中各个字符所在的区域作为字符区域,并识别所述字符区域中的字符,得到字符串集合;
对所述字符串集合进行正则化匹配,得到所述待识别票据图像的票据信息。
3.根据权利要求1所述的方法,其特征在于,所述基于所述信息识别请求,对所述待识别票据图像进行预处理,得到预处理后的待识别票据图像的步骤,包括:
利用预设伽玛系数,对所述信息识别请求中的待识别票据图像进行伽玛变换,得到第一图像;
将所述第一图像转换为灰度图像,得到第二图像;
基于所述第二图像中各个像素点对应像素值的平均值,对所述第二图像进行图像二值化处理,得到第三图像;
根据所述第三图像中水平方向上每一行包括的各个像素点的像素值,竖直方向上每一列包括的各个像素点的像素值,以及预设像素值的像素点数量阈值,确定所述第三图像的外边框位置,并对所述外边框位置内的图像进行裁剪,得到第四图像;
对所述第四图像进行倾斜校正,得到预处理后的待识别票据图像。
4.根据权利要求1所述的方法,其特征在于,在基于所述信息识别请求,对所述待识别票据图像进行预处理,得到预处理后的待识别票据图像之前,还包括:
对所述信息识别请求进行认证,得到认证结果;
所述基于所述信息识别请求,对所述待识别票据图像进行预处理,得到预处理后的待识别票据图像的步骤,包括:
在所述认证结果指示所述信息识别请求为合法请求时,基于所述信息识别请求,对所述待识别票据图像进行预处理,得到预处理后的待识别票据图像。
5.根据权利要求1-4任一所述的方法,其特征在于,在接收对待识别票据图像的信息识别请求之后,还包括:
在当前计算资源被占用的情况下,返回针对所述信息识别请求的第二响应消息;所述第二响应消息包括指示所述计算资源被占用的标识码。
6.根据权利要求1所述的方法,其特征在于,在返回针对所述信息识别请求的第一响应消息之前,还包括:
将所述待识别票据图像和待识别票据图像的票据信息存储至所述票据信息识别***中的存储设备。
7.根据权利要求1所述的方法,其特征在于,采用以下步骤训练得到所述票据信息识别模型:
获取所述预设训练集;
针对每一样本票据图像,利用预设深度学习网络,识别该样本票据图像中票据信息,得到该样本票据图像的预测票据信息;
基于每一样本票据图像对应的样本票据信息和预测票据信息,计算所述预设深度学习网络的的损失值;
当所述损失值大于预设损失值阈值时,调整所述预设深度学习网络的参数,并返回执行所述针对每一样本票据图像,利用预设深度学习网络,识别该样本票据图像中票据信息,得到该样本票据图像的预测票据信息的步骤;
当所述损失值不大于所述预设损失值阈值时,将当前的预设深度学习网络确定为训练好的票据信息识别模型。
8.一种票据信息识别装置,其特征在于,应用于票据信息识别***中的光学字符识别OCR设备,所述装置包括:
接收模块,用于接收对待识别票据图像的信息识别请求;
预处理模块,用于基于所述信息识别请求,对所述待识别票据图像进行预处理,得到预处理后的待识别票据图像;
第一识别模块,用于利用预先训练好的票据信息识别模型,识别所述预处理后的待识别票据图像中的票据信息,得到所述待识别票据图像的票据信息;其中,所述票据信息识别模型是根据预设训练集训练得到的,所述预设训练集包括多个不同票据类型的样本票据图像,以及每一样本票据图像的样本票据信息;
第一返回模块,用于返回针对所述信息识别请求的第一响应消息,所述第一响应消息包括所述待识别票据图像的票据信息。
9.根据权利要求8所述的装置,其特征在于,所述第一识别模块,具体用于基于预先训练好的票据信息识别模型,确定所述预处理后的待识别票据图像中各个字符所在的区域作为字符区域,并识别所述字符区域中的字符,得到字符串集合;对所述字符串集合进行正则化匹配,得到所述待识别票据图像的票据信息。
10.一种票据信息识别***,其特征在于,所述票据信息识别***包括的光学字符识别OCR设备和存储设备;
所述OCR设备,用于接收对待识别票据图像的信息识别请求;基于所述信息识别请求,对所述待识别票据图像进行预处理,得到预处理后的待识别票据图像;利用预先训练好的票据信息识别模型,识别所述预处理后的待识别票据图像中的票据信息,得到所述待识别票据图像的票据信息;其中,所述票据信息识别模型是根据预设训练集训练得到的,所述预设训练集包括多个不同票据类型的样本票据图像,以及每一样本票据图像的样本票据信息;返回针对所述信息识别请求的第一响应消息,所述第一响应消息包括所述待识别票据图像的票据信息;
所述存储设备,用于存储所述待识别票据图像的票据信息。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010566121.8A CN111832423A (zh) | 2020-06-19 | 2020-06-19 | 一种票据信息识别方法、装置及*** |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010566121.8A CN111832423A (zh) | 2020-06-19 | 2020-06-19 | 一种票据信息识别方法、装置及*** |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111832423A true CN111832423A (zh) | 2020-10-27 |
Family
ID=72897809
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010566121.8A Pending CN111832423A (zh) | 2020-06-19 | 2020-06-19 | 一种票据信息识别方法、装置及*** |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111832423A (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111401221A (zh) * | 2020-03-12 | 2020-07-10 | 重庆农村商业银行股份有限公司 | 一种卡票识别方法、装置、设备及存储介质 |
CN112818949A (zh) * | 2021-03-09 | 2021-05-18 | 浙江天派科技有限公司 | 一种产证文字的识别方法及*** |
CN112818951A (zh) * | 2021-03-11 | 2021-05-18 | 南京大学 | 一种票证识别的方法 |
CN112883954A (zh) * | 2021-02-22 | 2021-06-01 | 的卢技术有限公司 | Ocr票据识别方法、装置、计算机设备和存储介质 |
CN113516044A (zh) * | 2021-05-18 | 2021-10-19 | 山东新一代信息产业技术研究院有限公司 | 一种基于ocr与哈希算法的纸质合同信用增强方法及*** |
CN116403096A (zh) * | 2023-06-06 | 2023-07-07 | 爱拜尔(北京)科技有限公司 | 一种基于ocr票据识别的智能财务工作方法及*** |
Citations (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20020037097A1 (en) * | 2000-05-15 | 2002-03-28 | Hector Hoyos | Coupon recognition system |
CN101398894A (zh) * | 2008-06-17 | 2009-04-01 | 浙江师范大学 | 机动车车牌自动识别方法及其实现装置 |
CN101833859A (zh) * | 2010-05-14 | 2010-09-15 | 山东大学 | 基于虚拟线圈的自触发车牌识别方法 |
CN103870803A (zh) * | 2013-10-21 | 2014-06-18 | 北京邮电大学 | 一种基于粗定位与精定位融合的车牌识别方法和*** |
CN105528333A (zh) * | 2015-12-15 | 2016-04-27 | 网易(杭州)网络有限公司 | 一种文档优化显示的方法和装置 |
CN107392206A (zh) * | 2017-07-21 | 2017-11-24 | 武汉理工大学 | 一种工况条件下钢轨压印字符分割方法 |
CN108446621A (zh) * | 2018-03-14 | 2018-08-24 | 平安科技(深圳)有限公司 | 票据识别方法、服务器及计算机可读存储介质 |
CN108805023A (zh) * | 2018-04-28 | 2018-11-13 | 平安科技(深圳)有限公司 | 一种图像检测方法、装置、计算机设备及存储介质 |
CN109635627A (zh) * | 2018-10-23 | 2019-04-16 | 中国平安财产保险股份有限公司 | 图片信息提取方法、装置、计算机设备及存储介质 |
CN109754034A (zh) * | 2019-01-08 | 2019-05-14 | 北京邮电大学 | 一种基于二维码的终端设备定位方法及装置 |
CN109816606A (zh) * | 2019-01-18 | 2019-05-28 | 中国科学院电子学研究所 | 一种利用光学遥感卫星进行目标跟踪的方法 |
CN110136161A (zh) * | 2019-05-31 | 2019-08-16 | 苏州精观医疗科技有限公司 | 图像特征提取分析方法、***及装置 |
CN110263694A (zh) * | 2019-06-13 | 2019-09-20 | 泰康保险集团股份有限公司 | 一种票据识别方法及装置 |
CN111079738A (zh) * | 2019-11-23 | 2020-04-28 | 中国科学院长春光学精密机械与物理研究所 | 一种图像处理方法、***及终端设备 |
-
2020
- 2020-06-19 CN CN202010566121.8A patent/CN111832423A/zh active Pending
Patent Citations (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20020037097A1 (en) * | 2000-05-15 | 2002-03-28 | Hector Hoyos | Coupon recognition system |
CN101398894A (zh) * | 2008-06-17 | 2009-04-01 | 浙江师范大学 | 机动车车牌自动识别方法及其实现装置 |
CN101833859A (zh) * | 2010-05-14 | 2010-09-15 | 山东大学 | 基于虚拟线圈的自触发车牌识别方法 |
CN103870803A (zh) * | 2013-10-21 | 2014-06-18 | 北京邮电大学 | 一种基于粗定位与精定位融合的车牌识别方法和*** |
CN105528333A (zh) * | 2015-12-15 | 2016-04-27 | 网易(杭州)网络有限公司 | 一种文档优化显示的方法和装置 |
CN107392206A (zh) * | 2017-07-21 | 2017-11-24 | 武汉理工大学 | 一种工况条件下钢轨压印字符分割方法 |
CN108446621A (zh) * | 2018-03-14 | 2018-08-24 | 平安科技(深圳)有限公司 | 票据识别方法、服务器及计算机可读存储介质 |
CN108805023A (zh) * | 2018-04-28 | 2018-11-13 | 平安科技(深圳)有限公司 | 一种图像检测方法、装置、计算机设备及存储介质 |
CN109635627A (zh) * | 2018-10-23 | 2019-04-16 | 中国平安财产保险股份有限公司 | 图片信息提取方法、装置、计算机设备及存储介质 |
CN109754034A (zh) * | 2019-01-08 | 2019-05-14 | 北京邮电大学 | 一种基于二维码的终端设备定位方法及装置 |
CN109816606A (zh) * | 2019-01-18 | 2019-05-28 | 中国科学院电子学研究所 | 一种利用光学遥感卫星进行目标跟踪的方法 |
CN110136161A (zh) * | 2019-05-31 | 2019-08-16 | 苏州精观医疗科技有限公司 | 图像特征提取分析方法、***及装置 |
CN110263694A (zh) * | 2019-06-13 | 2019-09-20 | 泰康保险集团股份有限公司 | 一种票据识别方法及装置 |
CN111079738A (zh) * | 2019-11-23 | 2020-04-28 | 中国科学院长春光学精密机械与物理研究所 | 一种图像处理方法、***及终端设备 |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111401221A (zh) * | 2020-03-12 | 2020-07-10 | 重庆农村商业银行股份有限公司 | 一种卡票识别方法、装置、设备及存储介质 |
CN112883954A (zh) * | 2021-02-22 | 2021-06-01 | 的卢技术有限公司 | Ocr票据识别方法、装置、计算机设备和存储介质 |
CN112818949A (zh) * | 2021-03-09 | 2021-05-18 | 浙江天派科技有限公司 | 一种产证文字的识别方法及*** |
CN112818951A (zh) * | 2021-03-11 | 2021-05-18 | 南京大学 | 一种票证识别的方法 |
CN112818951B (zh) * | 2021-03-11 | 2023-11-21 | 南京大学 | 一种票证识别的方法 |
CN113516044A (zh) * | 2021-05-18 | 2021-10-19 | 山东新一代信息产业技术研究院有限公司 | 一种基于ocr与哈希算法的纸质合同信用增强方法及*** |
CN116403096A (zh) * | 2023-06-06 | 2023-07-07 | 爱拜尔(北京)科技有限公司 | 一种基于ocr票据识别的智能财务工作方法及*** |
CN116403096B (zh) * | 2023-06-06 | 2023-10-24 | 爱拜尔(北京)科技有限公司 | 一种基于ocr票据识别的智能财务工作方法及*** |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111832423A (zh) | 一种票据信息识别方法、装置及*** | |
CN109086714B (zh) | 表格识别方法、识别***及计算机装置 | |
CN113785305B (zh) | 一种检测倾斜文字的方法、装置及设备 | |
US11790499B2 (en) | Certificate image extraction method and terminal device | |
CN111401374A (zh) | 基于多任务的模型训练方法、字符识别方法及装置 | |
CN111046760A (zh) | 一种基于域对抗网络的笔迹鉴定方法 | |
CN110942067A (zh) | 文本识别方法、装置、计算机设备和存储介质 | |
CN113792659B (zh) | 文档识别方法、装置及电子设备 | |
CN113807353A (zh) | 图像转换模型训练方法、装置、设备及存储介质 | |
CN114444566A (zh) | 一种图像伪造检测方法、装置以及计算机存储介质 | |
CN113971644A (zh) | 基于数据增强策略选择的图像识别方法及装置 | |
CN113688821A (zh) | 一种基于深度学习的ocr文字识别方法 | |
CN115187456A (zh) | 基于图像强化处理的文本识别方法、装置、设备及介质 | |
CN115631112A (zh) | 一种基于深度学习的建筑轮廓矫正方法及装置 | |
RU2633182C1 (ru) | Определение направления строк текста | |
CN112365451B (zh) | 图像质量等级的确定方法、装置、设备及计算机可读介质 | |
CN113378609B (zh) | 代理商代签名的识别方法及装置 | |
CN110781936B (zh) | 基于纹理描述和深度学习的阈值可学习局部二进制网络的构建方法以及遥感图像分类方法 | |
US11715288B2 (en) | Optical character recognition using specialized confidence functions | |
CN113379001B (zh) | 针对图像识别模型的处理方法及装置 | |
CN111260623B (zh) | 图片评价方法、装置、设备及存储介质 | |
CN114677535A (zh) | 域适应图像分类网络的训练方法、图像分类方法及装置 | |
CN109933969B (zh) | 验证码识别方法、装置、电子设备及可读存储介质 | |
CN110837816A (zh) | 光学字符识别***、边缘节点及*** | |
CN111881778B (zh) | 文本检测的方法、装置、设备和计算机可读介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20201027 |