CN104077682A - 一种基于ocr识别和任务碎片化的单证数据录入方法 - Google Patents

一种基于ocr识别和任务碎片化的单证数据录入方法 Download PDF

Info

Publication number
CN104077682A
CN104077682A CN201410307381.8A CN201410307381A CN104077682A CN 104077682 A CN104077682 A CN 104077682A CN 201410307381 A CN201410307381 A CN 201410307381A CN 104077682 A CN104077682 A CN 104077682A
Authority
CN
China
Prior art keywords
field
typing
task
value
ocr
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201410307381.8A
Other languages
English (en)
Inventor
金东旭
刁维臻
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kunshan Yunjing Network Science & Technology Co Ltd
Original Assignee
Kunshan Yunjing Network Science & Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kunshan Yunjing Network Science & Technology Co Ltd filed Critical Kunshan Yunjing Network Science & Technology Co Ltd
Priority to CN201410307381.8A priority Critical patent/CN104077682A/zh
Publication of CN104077682A publication Critical patent/CN104077682A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及一种基于OCR识别和任务碎片化的单证数据录入方法,其步骤包括:1)读取单证的影像数据,并根据单证的标本信息数据将影像数据分成各类单证;2)采用OCR技术对单证的影像数据进行识别,得到各字段的内容;3)根据OCR识别的字段内容和各字段间的关系设置,判断各字段是否需要录入;4)根据OCR坐标定位对需要录入的字段进行切分,将其分切成若干碎片并分配成多个任务,通过互联网进行碎片式录入。之后还可包括数据核对、字段值整合、字段逻辑检查等步骤。本发明结合OCR识别技术与互联网资源,解决了影像模糊、不能精准定位等问题,减少了大量录入字段,能够大大提高数据处理的产能、质量和效率。

Description

一种基于OCR识别和任务碎片化的单证数据录入方法
技术领域
本发明属于影像数据识别与处理技术领域,具体涉及一种基于OCR识别和任务碎片化的单证数据录入方法。
背景技术
通常情况下,现有的数据处理***的处理流程大都是:影像入库——单证分类——设置默认坐标——数据录入——数据核对——输出成品。在这种业务流程下处理数据录入业务,需要定义项目处理规则,对作业人员进行数据录入、核对作业的一系列培训,项目才可以正式上线。
传统数据处理公司的***业务流程过于粗化,影像入库、单证分类后直接获取默认坐标定位,中间未对影像进行纠偏、去噪点等使影像清晰化的处理。这样生成的录入任务就会出现影像坐标与录入字段偏离、影像字段内容模糊等问题,影响录入任务的准确性及录入速度。而且由于以整张单证作为处理单元,不利于多人协同作业。另外,项目质量完全由作业人员把关,***没有一套全面的逻辑检查规则,对客户来讲项目质量无法得到较大保障。
现有的这种业务流程在获取到字段坐标后直接全部生成录入任务,中间未对影像各字段坐标内容进行识别判断是否为有填写,因数据处理业务经常会有很多影像字段内容为空,不进行空白判断直接生成任务,就会导致出现大量空白的录入任务,这些没有内容的录入任务会直接影响到我们作业人员的业务处理速度从而增加业务交付延时的风险。
同时,采用目前这种传统业务处理流程,公司需配备大量机器设备、招募大量作业人员,还需要根据业务规则进行强规则培训等一系列事宜,无疑大大增加了公司的运营成本。
发明内容
本发明提供一种基于OCR识别、任务碎片化的单证数据录入方法,对数据处理流程进行深度细化,并结合互联网资源,解决了影像模糊、不能精准定位和难以大规模生产等问题。精准的OCR识别减少了大量录入字段,结合业务规则的有效性验证,使得在保证质量的同时充分结合互联网资源进行大规模生产成为可能,能够大大提高数据处理的产能、质量和效率。
为实现上述目的,本发明采用的技术方案如下:
一种基于OCR识别和任务碎片化的单证数据录入方法,其步骤包括:
1)单证分类:读取单证的影像数据,并根据单证的标本信息数据将影像数据分成各类单证模板;
2)OCR识别:采用OCR技术对单证的影像数据进行识别,得到各字段的内容;
3)录入策略优化:根据OCR识别的字段内容和各字段间的关系设置,判断各字段是否需要录入;
4)数据录入:根据OCR坐标定位对需要录入的字段进行切分,根据规则将其分切成若干碎片并分配成多个录入任务,通过互联网进行碎片式录入。
进一步地,步骤2)所述采用OCR技术对单证进行识别,包括影像处理、字段坐标定位和字段值识别,得到各字段的内容以及精准坐标,同时剔除无内容字段。
进一步地,步骤4)将录入字段按切片内容的难宜、重要程度、***的逻辑配置和验证强度,可动态生成需要执行的录入次数,通过一次或数次完成录入任务。
进一步地,步骤4)之后进行数据核对,并将数据字段值整合。如同一个字段进行多次录入的结果不一致时,核对人员可以根据之前录入的结果进行比较、修改,填写正确的字段值。
进一步地,在字段值整合后还包括逻辑检查步骤。逻辑检查是将各字段的最终录入值根据配置好的各自的逻辑检查规则,进行逻辑校验与转换,生成字段成品值。逻辑检查分为:单字段逻辑检查和字段间的逻辑检查。
进一步地,在逻辑检查后进行成品检查及输出步骤。
与传统的数据处理***相比,本发明的有益效果如下:
1)本发明对数据处理流程进行深度细化,结合互联网资源可更加快速、大量交付客户成品。***增加精准定位(OCR识别技术)、策略优化、逻辑检查、互联网录入等特性,大大提高了数据处理的产能、质量和效率,解决了影像模糊、不能精准定位等问题,减少了大量录入字段,同时通过大量的业务规则进行逻辑检查保证数据的正确性。
2)本发明的整个业务处理流程通过配置完成,各流程模块独立,可根据业务需要灵活地配置运行流程,足以满足现代客户的多样化需求。业务规则需求基本都可以通过配置直接完成,不需要额外编写大量代码,***的易用、实用性强。与传统的数据处理***相比,可以更快速的上线项目,且***可以非常稳定的7*24小时顺利运行。
3)本发明的数据处理流程打破传统数据处理业务模式,将针对录入人员的大量复杂的业务规则通过***后台的业务规则引擎来完成,满足了互联网对录入碎片化、无规则的需求,企业不需要准备较大场地、招聘大量作业人员、采购大量设备、进行大量繁杂规则培训,运营成本可实现大幅度降低、业务处理效率可得以大幅度提高。
4)本发明的业务流程***采用互联网化作业录入模式,通过互联网平台为大众提供了利用闲暇时间兼职就业的机会,能够加速促进服务流程外包产业的转型升级和发展,满足客户多样化需求,降低自身企业运营成本的同时又能按时、按质向客户提供更好的服务。
附图说明
图1是实施例中基于OCR识别和任务碎片化的单证数据录入方法的步骤流程图。
图2是实施例中进行碎片式互联网录入的步骤流程图。
具体实施方式
下面通过具体实施例和附图,对本发明做进一步说明。
图1是本发明的基于OCR识别和任务碎片化的单证数据录入方法的步骤流程图,如该图所示,其运作流程为:
影像入库——单证分类——OCR识别——录入策略优化——数据录入——数据核对——字段值整合——字段逻辑检查——成品检查——输出(定制化客户成品)。
上述流程中的各个步骤具体介绍如下:
1.影像入库
程序自动读取下载客户传输的影像数据包并导入***。影像数据包是指客户对外包项目影像通过一定的规则和格式扫描后压缩形成的图片文件压缩包。
2.单证分类
根据写入***的各项目单证规则,自动识别读取入库影像相关信息,将其分成与***模板相对应的各类单证。***模板是运用建模程序生成的各类单证的标本信息数据。此分类过程由程序自动完成。
3.OCR识别
OCR识别节点对单证进行三步处理:影像处理、字段坐标定位、字段值识别。
影像处理是对原始影像进行纠偏、清晰化处理,使影像字段内容更清晰,获取的字段位置更精准,方便快速录入作业。
字段坐标定位是根据模板坐标配置,通过OCR识别技术对需要录入的字段进行坐标定位。
字段值识别是根据字段坐标位置,通过OCR技术识别字段的填写内容。
4.录入策略优化
录入策略优化是根据OCR识别的字段内容和各字段间的关系设置,来判断及决定各字段是否需要录入。
例如:通过被保人姓名和证件号码这两个字段的识别内容,来判断整个被保人信息(包括性别、生日、住址、电话等)是否为空。根据各单证规则,一般情况下如果客户资料的姓名和证件号码没有填写,其他信息也都为空。故此例可根据被保人姓名和证件号码两个字段的OCR识别内容是否为空,来判断整个被保人信息是否需要录入。
此外其它一些单个字段也可以根据OCR的字段识别内容判断是否需要录入,如基本资料、单位信息、健康信息、财务信息等的单个的勾选类和录入类字段,都可根据此字段的OCR识别内容来确定是否需要录入:识别为空时字段判定为空,不需要录入;识别有内容且内容完整时,可直接取识别内容作为字段值,也不需要进行录入;当识别内容不完整或无法识别出内容时,则字段需要生成人工录入任务。
5.数据录入
将录入字段按设定好的规则分配成多个录入任务,采用碎片式互联网录入。碎片式互联网录入是指将字段分切成若干碎片,打乱顺序后分别放到网上录入***进行处理。生成的碎片是根据录入字段的OCR坐标定位精准切分的,字段切片完整,内容清晰。图2是进行碎片式互联网录入的流程图。
采用碎片式互联网录入可以较好的保护客户信息资料的安全,另外碎片式录入切片精细简短,录入人员只需照图录入即可,不需要去记大量录入相关规则,每个切片内容简短也有利于提高录入内容的准确性,利用互联网资源可以更快速的完成交付,缩短任务处理时间。
例如:证件号码字段。中文单证证件号码基本都是身份证号码,针对身份证号码字段,为做好资料保密工作,***将其拆分切成3个碎片(也可以是其它数量,可根据业务和字段情况灵活配置)打乱顺序后分别放到网上录入***进行处理,分两次完成。具体做法如下:
1)证件号码的前两个切片字段(比如前6位和中间8位)直接获取之前的OCR识别值,暂不分配任务,证件号码最后一个字段(最后4位)分配到网上一录(即互联网的第一次录入);
2)在分配出去的所有第一次网上录入整字段和拆分字段的录入数据全部回来之后,将各字段的录入值以整字段为单位整合到一起,并将证件号码前两个字段的OCR值和最后一个字段的网上录入值合在一起;
3)对整合后的数据进行身份证***校验,看是否合法(身份证的验证可以采用现有算法),合法的直接进入下一步流程,不合法时将证件号码的前两个字段通过二次生成任务分配到网上进行再次录入(即互联网的第二次录入);
4)以最终录入值再进行身份证合法验证,合法则直接通过,不合法时将整个字段值回收到内部程序由质检人员进行审查。
6.数据核对
数据核对是在同一录入字段的两录处理结果不一致时,生成的由人工判断录入结果有效性的任务。两录处理结果均无效时,核对人员可以自行修改或填写字段的正确值。
7.字段值整合
字段值整合是将字段的录入值与核对值,通过配置的规则整合到一起,生成整份单证各字段的最终录入值。整合过程由程序自动完成。
8.逻辑检查
逻辑检查是将各字段的最终录入值根据配置好的各自的逻辑检查规则,进行逻辑校验与转换,生成字段成品值。逻辑检查分为单字段逻辑检查和字段间的逻辑检查。
单字段检查就是对于单个字段根据配置规则进行逻辑验证。例如电子邮箱字段,一般电子邮箱都会有固定的字符和格式,比如:电子邮箱里一定有一个符号等。据此先配置好电子邮箱的逻辑检查规则。当录入值与规则不符合时,经过逻辑检查流程时就会被提取出来。
字段间检查就是根据各字段之间的关系规则将相关字段相连一起检查,当逻辑验证不通过时,***会根据配置将相关字段的某个字段或全部字段提取出来。例如:国籍和证件号码字段,证件号码填写的是身份证号码时国籍肯定是中国。当国籍录入值不是中国时,***就会把国籍字段或证件号码字段单独或全部提取出来,再次进行录入值的审查。
部分字段可以设置单字段检查和字段间检查双重逻辑验证。例如:区号和邮编字段,即可以根据自身规则进行单字段的检查验证,也可以和地址字段结合起来,验证填写的区号和邮编与地址信息是否对应,加强字段录入值准确性的把关。
9.成品检查
成品检查是将逻辑检查验证失败提取出来的字段生成人工成品检查任务,由专业人员检查、判断及修改。成品检查完成后生成的就是最终的单证字段成品值。
10.输出
输出就是提取单证字段最终成品值,按照客户需求转换输出到相应格式的成品文件中。通过网络服务上传到客户指定成品接收目录。
以上实施例仅用以说明本发明的技术方案而非对其进行限制,本领域的普通技术人员可以对本发明的技术方案进行修改或者等同替换,而不脱离本发明的精神和范围,本发明的保护范围应以权利要求所述为准。

Claims (10)

1.一种基于OCR识别和任务碎片化的单证数据录入方法,其步骤包括:
1)读取单证的影像数据,并根据单证的标本信息数据将影像数据分成各类单证;
2)采用OCR技术对单证的影像数据进行识别,得到各字段的内容;
3)根据OCR识别的字段内容和各字段间的关系设置,判断各字段是否需要录入;
4)根据OCR坐标定位对需要录入的字段进行切分,将其分切成若干碎片并分配成多个任务,通过互联网进行碎片式录入。
2.如权利要求1所述的方法,其特征在于:步骤2)所述采用OCR技术对单证进行识别,包括影像处理、字段坐标定位和字段值识别。
3.如权利要求1所述的方法,其特征在于:步骤3)根据姓名和证件号码两个字段的OCR识别内容是否为空来判断各字段是否需要录入。
4.如权利要求1所述的方法,其特征在于:步骤3)根据单个字段的OCR识别内容判断是否需要录入:识别为空时字段判定为空,不需要录入;识别有内容且内容完整时,直接取识别内容做为字段值,也不需要进行录入;当识别内容不完整或无法识别出内容时,则生成人工录入任务。
5.如权利要求1所述的方法,其特征在于:步骤4)将录入字段按切片内容的难宜、重要程度、***的逻辑配置和验证强度动态生成需要执行的录入次数,通过一次或数次完成录入任务。
6.如权利要求5所述的方法,其特征在于:姓名、性别、生日、地址和电话字段直接一次完成录入任务生成;证件号码字段分两次完成录入任务生成,如果第一次回归值验证正确则不需要进行二次任务生成;单位名称字段不进行第一次的任务生成,等第一次生成任务的字段录入值回归后直接在二次生成时进行单位名称字段的任务分配。
7.如权利要求1至6中任一项所述的方法,其特征在于,步骤4)之后还包括数据核对和字段值整合步骤,其中:数据核对是在同一录入字段的两录处理结果不一致时,生成的由人工判断录入结果有效性的任务,两录处理结果均无效时,核对人员可以自行修改或填写字段的正确值;字段值整合是将字段的录入值与核对值,整合到一起生成整份单证各字段的最终录入值。
8.如权利要求7所述的方法,其特征在于:在字段值整合后还包括逻辑检查步骤,将各字段的最终录入值根据配置好的各自的逻辑检查规则,进行逻辑校验与转换,生成字段成品值。
9.如权利要求8所述的方法,其特征在于:所述逻辑检查分为单字段逻辑检查和字段间的逻辑检查。
10.如权利要求8所述的方法,其特征在于,在逻辑检查后进行成品检查及输出步骤,其中:成品检查是将逻辑检查验证失败提取出来的字段生成人工成品检查任务,由专业人员检查、判断及修改,从而得到最终的单证字段成品值;输出是提取单证字段最终成品值,按照客户需求转换输出到相应格式的成品文件中,通过网络服务上传到客户指定的成品接收目录。
CN201410307381.8A 2014-06-30 2014-06-30 一种基于ocr识别和任务碎片化的单证数据录入方法 Pending CN104077682A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410307381.8A CN104077682A (zh) 2014-06-30 2014-06-30 一种基于ocr识别和任务碎片化的单证数据录入方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410307381.8A CN104077682A (zh) 2014-06-30 2014-06-30 一种基于ocr识别和任务碎片化的单证数据录入方法

Publications (1)

Publication Number Publication Date
CN104077682A true CN104077682A (zh) 2014-10-01

Family

ID=51598927

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410307381.8A Pending CN104077682A (zh) 2014-06-30 2014-06-30 一种基于ocr识别和任务碎片化的单证数据录入方法

Country Status (1)

Country Link
CN (1) CN104077682A (zh)

Cited By (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105005742A (zh) * 2015-07-30 2015-10-28 四川长虹电器股份有限公司 一种数据处理方法及数据处理***
CN105022829A (zh) * 2015-07-30 2015-11-04 四川长虹电器股份有限公司 一种数据处理***和方法
CN105243583A (zh) * 2015-09-28 2016-01-13 四川长虹电器股份有限公司 一种数据处理方法及数据处理***
CN105550370A (zh) * 2016-01-26 2016-05-04 平安科技(深圳)有限公司 录入方法及录入***
CN105608452A (zh) * 2014-11-11 2016-05-25 金蝶软件(中国)有限公司 单据录入的方法和***
CN106446901A (zh) * 2016-10-31 2017-02-22 中国银行股份有限公司 一种银行票据录入方法、装置及***
CN106933870A (zh) * 2015-12-29 2017-07-07 平安科技(深圳)有限公司 投保资料的录单方法及***
CN107295357A (zh) * 2016-04-01 2017-10-24 深圳平安综合金融服务有限公司 影像文件资料录入方法、云服务器及终端
CN108053313A (zh) * 2018-01-02 2018-05-18 中国工商银行股份有限公司 跨境开户数据处理方法、装置及***
CN108228618A (zh) * 2016-12-14 2018-06-29 平安科技(深圳)有限公司 单证数据核对的方法和装置
CN108228320A (zh) * 2016-12-14 2018-06-29 平安科技(深圳)有限公司 任务分配的方法和装置
CN108363943A (zh) * 2017-12-27 2018-08-03 苏州工业园区报关有限公司 基于智能化识别技术的通关机器人
CN108597565A (zh) * 2018-04-11 2018-09-28 浙江大学 一种基于ocr与命名实体提取技术的临床队列数据协同校验方法
CN108962346A (zh) * 2017-05-22 2018-12-07 深圳大森智能科技有限公司 医疗检验报告电子化方法、存储设备及移动终端
CN109408807A (zh) * 2018-09-11 2019-03-01 厦门商集网络科技有限责任公司 Ocr识别正确率的自动化测试方法及测试设备
CN109800312A (zh) * 2018-12-11 2019-05-24 广东电网有限责任公司 一种电力营销信息管理资料录入***及方法
CN110348804A (zh) * 2019-06-19 2019-10-18 深圳壹账通智能科技有限公司 基于ai的订单录入方法、装置、计算机设备及存储介质
CN110427739A (zh) * 2019-08-09 2019-11-08 泰康保险集团股份有限公司 信息验证方法及装置、电子设备和计算机可读存储介质
CN110599317A (zh) * 2019-08-26 2019-12-20 湖南大唐先一科技有限公司 一种基于规则引擎和ocr的报账及审核自动化方法
CN112215159A (zh) * 2020-10-13 2021-01-12 苏州工业园区报关有限公司 一种基于ocr和人工智能技术的国际贸易单证拆分***
CN112766701A (zh) * 2021-01-13 2021-05-07 中国外运股份有限公司 一种提单纸和影印件管理方法、装置、设备及介质
CN114896964A (zh) * 2022-05-24 2022-08-12 中国银行股份有限公司 数据有效性的验证方法及装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012029121A (ja) * 2010-07-26 2012-02-09 Seiko Epson Corp 読取システム、画像取得装置、光学読取装置、画像取得装置の制御方法、及び、プログラム
CN102567324A (zh) * 2010-12-14 2012-07-11 金蝶软件(中国)有限公司 一种单据字段位置的调整方法及字段位置调整器
CN102567764A (zh) * 2012-01-13 2012-07-11 中国工商银行股份有限公司 一种提高电子影像识别效率的票据凭证及***
CN103246953A (zh) * 2013-04-25 2013-08-14 天津大学 一种单据稽核方法
CN103425977A (zh) * 2013-08-05 2013-12-04 福建亿榕信息技术有限公司 财务原始凭证影像化处理方法和***

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012029121A (ja) * 2010-07-26 2012-02-09 Seiko Epson Corp 読取システム、画像取得装置、光学読取装置、画像取得装置の制御方法、及び、プログラム
CN102567324A (zh) * 2010-12-14 2012-07-11 金蝶软件(中国)有限公司 一种单据字段位置的调整方法及字段位置调整器
CN102567764A (zh) * 2012-01-13 2012-07-11 中国工商银行股份有限公司 一种提高电子影像识别效率的票据凭证及***
CN103246953A (zh) * 2013-04-25 2013-08-14 天津大学 一种单据稽核方法
CN103425977A (zh) * 2013-08-05 2013-12-04 福建亿榕信息技术有限公司 财务原始凭证影像化处理方法和***

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
蒋春伦: "手写财务报表光电录入***的设计与实现", 《中国优秀博硕士学位论文全文数据库 (硕士) 信息科技辑》 *

Cited By (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105608452A (zh) * 2014-11-11 2016-05-25 金蝶软件(中国)有限公司 单据录入的方法和***
CN105022829A (zh) * 2015-07-30 2015-11-04 四川长虹电器股份有限公司 一种数据处理***和方法
CN105005742A (zh) * 2015-07-30 2015-10-28 四川长虹电器股份有限公司 一种数据处理方法及数据处理***
CN105243583A (zh) * 2015-09-28 2016-01-13 四川长虹电器股份有限公司 一种数据处理方法及数据处理***
CN106933870A (zh) * 2015-12-29 2017-07-07 平安科技(深圳)有限公司 投保资料的录单方法及***
CN105550370A (zh) * 2016-01-26 2016-05-04 平安科技(深圳)有限公司 录入方法及录入***
CN105550370B (zh) * 2016-01-26 2019-03-26 平安科技(深圳)有限公司 录入方法及录入***
CN107295357A (zh) * 2016-04-01 2017-10-24 深圳平安综合金融服务有限公司 影像文件资料录入方法、云服务器及终端
CN107295357B (zh) * 2016-04-01 2021-03-16 深圳平安综合金融服务有限公司 影像文件资料录入方法、云服务器及终端
CN106446901A (zh) * 2016-10-31 2017-02-22 中国银行股份有限公司 一种银行票据录入方法、装置及***
CN108228618A (zh) * 2016-12-14 2018-06-29 平安科技(深圳)有限公司 单证数据核对的方法和装置
CN108228320A (zh) * 2016-12-14 2018-06-29 平安科技(深圳)有限公司 任务分配的方法和装置
CN108228618B (zh) * 2016-12-14 2020-07-31 平安科技(深圳)有限公司 单证数据核对的方法和装置
CN108962346B (zh) * 2017-05-22 2023-12-15 深圳大森智能科技有限公司 医疗检验报告电子化方法、存储设备及移动终端
CN108962346A (zh) * 2017-05-22 2018-12-07 深圳大森智能科技有限公司 医疗检验报告电子化方法、存储设备及移动终端
CN108363943B (zh) * 2017-12-27 2020-12-01 苏州工业园区报关有限公司 基于智能化识别技术的通关机器人
CN108363943A (zh) * 2017-12-27 2018-08-03 苏州工业园区报关有限公司 基于智能化识别技术的通关机器人
CN108053313A (zh) * 2018-01-02 2018-05-18 中国工商银行股份有限公司 跨境开户数据处理方法、装置及***
CN108597565B (zh) * 2018-04-11 2021-07-02 浙江大学 一种基于ocr与命名实体提取技术的临床队列数据协同校验方法
CN108597565A (zh) * 2018-04-11 2018-09-28 浙江大学 一种基于ocr与命名实体提取技术的临床队列数据协同校验方法
CN109408807A (zh) * 2018-09-11 2019-03-01 厦门商集网络科技有限责任公司 Ocr识别正确率的自动化测试方法及测试设备
CN109800312A (zh) * 2018-12-11 2019-05-24 广东电网有限责任公司 一种电力营销信息管理资料录入***及方法
CN110348804A (zh) * 2019-06-19 2019-10-18 深圳壹账通智能科技有限公司 基于ai的订单录入方法、装置、计算机设备及存储介质
CN110427739A (zh) * 2019-08-09 2019-11-08 泰康保险集团股份有限公司 信息验证方法及装置、电子设备和计算机可读存储介质
CN110599317A (zh) * 2019-08-26 2019-12-20 湖南大唐先一科技有限公司 一种基于规则引擎和ocr的报账及审核自动化方法
CN112215159A (zh) * 2020-10-13 2021-01-12 苏州工业园区报关有限公司 一种基于ocr和人工智能技术的国际贸易单证拆分***
CN112215159B (zh) * 2020-10-13 2021-05-07 苏州工业园区报关有限公司 一种基于ocr和人工智能技术的国际贸易单证拆分***
CN112766701A (zh) * 2021-01-13 2021-05-07 中国外运股份有限公司 一种提单纸和影印件管理方法、装置、设备及介质
CN112766701B (zh) * 2021-01-13 2024-04-26 中国外运股份有限公司 一种提单纸和影印件管理方法、装置、设备及介质
CN114896964A (zh) * 2022-05-24 2022-08-12 中国银行股份有限公司 数据有效性的验证方法及装置

Similar Documents

Publication Publication Date Title
CN104077682A (zh) 一种基于ocr识别和任务碎片化的单证数据录入方法
CN108256074B (zh) 校验处理的方法、装置、电子设备和存储介质
CN110348214B (zh) 对恶意代码检测的方法及***
CN106489149A (zh) 一种基于数据挖掘和众包的数据标注方法及***
CN109934255B (zh) 一种适用于饮料瓶回收机投递物分类识别的模型融合方法
CN110990053A (zh) 机器学习方案模板的创建方法、使用方法及装置
CN111428599A (zh) 票据识别方法、装置和设备
EP2645309A2 (en) Automatic combination and mapping of text-mining services
CN114973290B (zh) 一种基于ocr引擎的智能审单方法及***
CN106681854A (zh) 一种信息校验方法、装置及***
CN110458600A (zh) 画像模型训练方法、装置、计算机设备及存储介质
CN109409326A (zh) 一种基于增值税***电子数据自动记账生成凭证的方法
CN109885541A (zh) 信息批量处理的方法和装置
CN104064182A (zh) 一种基于分类规则的语音识别***及方法
CN112308727A (zh) 保险理赔业务处理方法及装置
CN111752846A (zh) 一种接口测试方法及装置
CN114638597A (zh) 政务智能办应用***、方法、终端及介质
RU2702967C1 (ru) Способ и система для проверки электронного комплекта документов
CN106250755A (zh) 用于生成验证码的方法及装置
CN113901075A (zh) 生成sql语句的方法、装置、计算机设备及存储介质
US20220318546A1 (en) Intelligent engineering data digitization
CN114492446A (zh) 法律文书处理方法、装置、电子设备及存储介质
CN114140232A (zh) 一种会计数据转换方法、装置及电子设备
CN113537964A (zh) 申请单处理方法、设备、存储介质及装置
CN112991037A (zh) 信用证46域解析方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20141001