CN114202755A - 基于ocr和nlp技术的交易背景真实性审核方法和*** - Google Patents

基于ocr和nlp技术的交易背景真实性审核方法和*** Download PDF

Info

Publication number
CN114202755A
CN114202755A CN202111503088.5A CN202111503088A CN114202755A CN 114202755 A CN114202755 A CN 114202755A CN 202111503088 A CN202111503088 A CN 202111503088A CN 114202755 A CN114202755 A CN 114202755A
Authority
CN
China
Prior art keywords
ocr
data
image
invoice
area
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111503088.5A
Other languages
English (en)
Inventor
王敏
何平
谢凌奇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Industrial Bank Co Ltd
CIB Fintech Services Shanghai Co Ltd
Original Assignee
Industrial Bank Co Ltd
CIB Fintech Services Shanghai Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Industrial Bank Co Ltd, CIB Fintech Services Shanghai Co Ltd filed Critical Industrial Bank Co Ltd
Priority to CN202111503088.5A priority Critical patent/CN114202755A/zh
Publication of CN114202755A publication Critical patent/CN114202755A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)

Abstract

本发明提供了一种基于OCR和NLP技术的交易背景真实性审核方法和***,包括:步骤1:通过接口向交易***请求业务的应收账款信息数据,在获取数据后将数据整合为待校验数据格式;步骤2:通过影像平台获取该业务的影像资料列表;步骤3:基于OCR和NLP技术,根据影像的唯一编号进行影像识别,根据预设关键要素字段抓取对应的信息,得到待校验数据;步骤4:根据不同的业务场景、文档类型、指标类型构建比对规则,对待校验数据进行真实性校验,生成辅助审核的校验报告。本发明将智能影像识别、校验技术引入贸金融资交易背景真实性审核,具有识别准确率高、耗时短的特点,且能有效防止人为审核失误,有效节省人力资源成本。

Description

基于OCR和NLP技术的交易背景真实性审核方法和***
技术领域
本发明涉及OCR和NLP技术领域,具体地,涉及一种基于OCR和NLP技术的交易背景真实性审核方法和***。
背景技术
针对目前线上贸易融资申请流程及各分行贸易背景影像资料审核模式,应收类融资业务申请中的应收账款登记信息由客户经理逐条录入,后续主要对客户或客户经理上传贸易背景影像资料如合同、***等进行逐一的人工比对校验完成交易背景信息的真实性审核。随着审核材料数量的急剧增加,大量时间浪费在了材料的人工录入和比对,并且容易出错。
专利文献CN113221890A(申请号:CN202110574251.0)公开了一种基于OCR的云手机文字内容监管方法和***,该***包括文本信息处理模块、文本信息比对模块和敏感信息词库;采用基于文本行的检测和识别算法,对截屏数据进行文本行检测、文本行识别、敏感文字信息比对,并对云手机用户截屏数据中存在的违规文字内容进行预警和警告处理。
现有基于OCR的真实性辅助影像审核手段存在如下缺点:影像识别准确率低,无法满足辅助审核的要求;对文档多样性适应性差,仅能处理单一特定类型文档;对影像质量要求高,无法处理低质量影像;对包含图片、表格的混合型影像材料,存在表格定位不准、图表本身结构干扰识别效果等问题;另外对OCR识别出的各个信息要素均逐一的人工比对校验,及其耗时。
发明内容
针对现有技术中的缺陷,本发明的目的是提供一种基于OCR和NLP技术的交易背景真实性审核方法和***。
根据本发明提供的基于OCR和NLP技术的交易背景真实性审核方法,包括:
步骤1:通过接口向交易***请求业务的应收账款信息数据,在获取数据后将数据整合为待校验数据格式;
步骤2:通过影像平台获取该业务的影像资料列表;
步骤3:基于OCR和NLP技术,根据影像的唯一编号进行影像识别,根据预设关键要素字段抓取对应的信息,得到待校验数据;
步骤4:根据不同的业务场景、文档类型、指标类型构建比对规则,对待校验数据进行真实性校验,生成辅助审核的校验报告。
优选的,通过图像采集装置对待校验材料进行图像采集,并对采集的图像进行OCR区域定位,区域类别包含:文本区、表格区和***区;
在具有标注的数据上进行训练,构建基于深度卷积神经网络的OCR模型,将影像资料输入至OCR模型,输出各区域的内容分布,形成多个区域子图。
优选的,将各区域子图输入至OCR模型进行内容提取,输出各区域的内容文字,并根据输出的文字进行业务关键要素抽取;
文本区、表格区的业务关键要素包括:合同名称、合同编号、合同金额、合同签订日期、合同生效日期、合同签订方;
***区的业务关键要素包括:***代码、***号码、含税金额、税率、开票日期、货物品类。
优选的,结合命名实体识别模型和基于数据分析的规则,同时引入指标类型、位置信息和关键词,进行文本区、表格区业务关键要素抽取。
优选的,将***区域子图输入至深度卷积神经网络进行分类,每个类别对应***区中的每种业务关键要素,结合样本增强、SVM、目标检测、表格识别和跨页表格拼接的AI技术,进行***区关键要素抽取。
根据本发明提供的基于OCR和NLP技术的交易背景真实性审核***,包括:
模块M1:通过接口向交易***请求业务的应收账款信息数据,在获取数据后将数据整合为待校验数据格式;
模块M2:通过影像平台获取该业务的影像资料列表;
模块M3:基于OCR和NLP技术,根据影像的唯一编号进行影像识别,根据预设关键要素字段抓取对应的信息,得到待校验数据;
模块M4:根据不同的业务场景、文档类型、指标类型构建比对规则,对待校验数据进行真实性校验,生成辅助审核的校验报告。
优选的,通过图像采集装置对待校验材料进行图像采集,并对采集的图像进行OCR区域定位,区域类别包含:文本区、表格区和***区;
在具有标注的数据上进行训练,构建基于深度卷积神经网络的OCR模型,将影像资料输入至OCR模型,输出各区域的内容分布,形成多个区域子图。
优选的,将各区域子图输入至OCR模型进行内容提取,输出各区域的内容文字,并根据输出的文字进行业务关键要素抽取;
文本区、表格区的业务关键要素包括:合同名称、合同编号、合同金额、合同签订日期、合同生效日期、合同签订方;
***区的业务关键要素包括:***代码、***号码、含税金额、税率、开票日期、货物品类。
优选的,结合命名实体识别模型和基于数据分析的规则,同时引入指标类型、位置信息和关键词,进行文本区、表格区业务关键要素抽取。
优选的,将***区域子图输入至深度卷积神经网络进行分类,每个类别对应***区中的每种业务关键要素,结合样本增强、SVM、目标检测、表格识别和跨页表格拼接的AI技术,进行***区关键要素抽取。
与现有技术相比,本发明具有如下的有益效果:
(1)本发明利用光学字符识别OCR技术和自然语言处理NLP技术等人工智能技术,对贸易融资业务审批流程中提交的影像材料进行自动化识别和关键信息要素的智能抽取,并通过智能逻辑校验,提供检查建议包括商务合同的有效性、***的验真结果、***与合同的一致性等,供业务申请人员和审批人员做进一步判断和操作,提高审核效率;
(2)本发明能够针对不同制式、不同质量、多种内容类型混合编排的影像资料进行识别,并基于信息抽取、语义分析等NLP技术实现特定内容抽取,以满足信息比对、校验的需要;
(3)本发明将智能影像识别、校验技术引入贸金融资交易背景真实性审核,具有识别准确率高、耗时短的特点,且能有效防止人为审核失误,有效节省人力资源成本。
附图说明
通过阅读参照以下附图对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:
图1为本发明的一个具体实施方式的流程图;
图2为本发明中影像识别功能的流程图;
图3为本发明中业务关键要素抽取功能的流程图。
具体实施方式
下面结合具体实施例对本发明进行详细说明。以下实施例将有助于本领域的技术人员进一步理解本发明,但不以任何形式限制本发明。应当指出的是,对本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变化和改进。这些都属于本发明的保护范围。
实施例:
本发明提供了一种基于OCR和NLP技术的交易背景真实性审核方法,如图1,包括如下步骤:
S100:业务信息提取。通过接口向贸金***请求本笔业务的应收账款信息数据。获取数据后将信息整合为待校验数据格式,暂存于中台***备用。该进程可由操作人员点选或***自动触发;
S200:向影像平台请求该笔业务的影像资料列表。操作人员对需要进行校验的影像资料进行选定;
S300:中台***将选定影像的唯一编号提交至基于OCR和NLP的智能影像识别***,点选触发影像识别。根据预设关键要素字段,抓取对应的信息,形成待校验数据,返回中台***;
S400:触发智能校验功能。根据不同的业务场景、文档类型、指标类型构建具体的、不同的比对规则,生成辅助审核的校验报告,供审核业务人员参考;同时触发***验真功能,将智能影像识别后的***信息并发往验真接口,并将返回结果添加至校验报告。
如图2所示,所述S300基于OCR和NLP的智能影像识别***具体包括:
S310:影像资料采集。通过图像采集装置对待校验材料进行图像采集;
S320:OCR区域定位。区域类别包含:文本区、表格区和***区。将影像资料逐页输入至基于深度卷积神经网络的OCR模型。OCR模型输出以上各区域的内容分布,形成多个区域子图。该OCR模型已在大量有标注数据上进行训练,具备高准确率的区域定位能力;
S330:OCR内容提取。将各区域子图输入至OCR模型进行内容提取,输出各区域的内容文字。该OCR模型已在大量有标注的数据上进行训练,具备高准确率的内容识别能力;
S340:业务关键要素抽取。文本区、表格区的业务关键要素包括但不限于:合同名称、合同编号、合同金额、合同签订日期、合同生效日期、合同签订方;***区的业务关键要素包括但不限于:***代码、***号码、金额(含税)、税率、开票日期、货物品类。均可根据业务需要动态配置。
如图3所示,所述S340对业务关键要素进行抽取具体包括:
S341:文本区、表格区业务关键要素抽取。考虑到内容版式的多样化,对业务关键要素的抽取结合了命名实体识别模型和基于数据分析的规则两种技术手段。针对特殊行业和特定合同版式采取专用模型。例如:针对建筑行业的采购合同,需要对此类合同版式进行数据标注并训练专用于此类版式的模型。考虑识别模型的整体泛化能力,同时结引入指标类型、位置信息、关键词等规则进行业务关键要素抽取;
S342:***区关键要素抽取。将S320中的***区域子图输入至深度卷积神经网络进行分类,每个类别对应S340***区中的每种业务关键要素。结合样本增强、SVM、目标检测、表格识别和跨页表格拼接等多种AI技术手段,确保业务关键要素识别和抽取的准确性。
本发明的主要技术难点在于:1、客户上传的影像资料质量参差不齐,同一份影像文件中存在多种类型的材料,需要通过识别手段对不同的影像类型进行识别分类;2、影像文件中合同文件属于非制式文件,格式变化多样且多数文本内容较长,需抽取的关键信息较为分散,如货品名称、单价和数量等信息抽取难度较大;3、影像文件中***文件包含多种***类型,且存在折叠、多种版式排布、套打等情况增加识别和关键要素抽取的难度;4、贸易背景资料信息要素比对审核需要根据多种类型影像文件抽取的信息要素进行验真、校核,需要通过一定的方案将不同的要素进行归类和分析。
本方案使用的方法如下:
1、对上传的影像文件进行逐页分割,采用卷积神经网络对影像文件进行分类,同时针对合同等具有上下文特征的文件进行归类,便于后续的关键业务要素识别和抽取;
2、考虑到合同文件版式的多样化,对合同关键要素的抽取结合了命名实体识别模型和基于数据分析的规则两种技术手段,针对特殊行业和特定合同版式采取专用模型,同时结合关键指标类型、位置信息、关键词等提取的规则提高识别模型的整体泛化能力;
关键要素:例如合同名称、合同主体(甲方、乙方)、合同签订日期、合同编号、合同总金额、付款方式、货品信息、合同有效期等;
专用模型:针对具体行业训练的命名实体识别模型等;
特殊行业和特定版式:针对不同的行业,如建筑行业的采购合同,有特定的合同版式。
3、针对不同类型的***,采用深度卷积神经网络进行分类,并采用了样本增强、SVM、目标检测、表格识别和跨页表格拼接等多种AI技术手段,提高了不同***类型多种信息要素的识别和抽取准确性,同时结合外部***验真数据的接口调用进行信息确认和比对;
4、基于影像文件抽取的关键信息要素与应收账款登记信息进行对比审核,采用分类文件验真、同类信息指标对比验证的技术手段,结合业务申请的场景形成对应的比对规则,并结合自然语言处理NLP技术提供辅助审核的结果报告,供审核业务人员参考。
分类文件:例如商务合同、协议、不同种类的***、交易流水票据等;
同类信息指标:例如商务合同中的合同金额和***总金额等同类型信息指标的比对验真。
根据本发明提供的基于OCR和NLP技术的交易背景真实性审核***,包括:模块M1:通过接口向交易***请求业务的应收账款信息数据,在获取数据后将数据整合为待校验数据格式;模块M2:通过影像平台获取该业务的影像资料列表;模块M3:基于OCR和NLP技术,根据影像的唯一编号进行影像识别,根据预设关键要素字段抓取对应的信息,得到待校验数据;模块M4:根据不同的业务场景、文档类型、指标类型构建比对规则,对待校验数据进行真实性校验,生成辅助审核的校验报告。
通过图像采集装置对待校验材料进行图像采集,并对采集的图像进行OCR区域定位,区域类别包含:文本区、表格区和***区;在具有标注的数据上进行训练,构建基于深度卷积神经网络的OCR模型,将影像资料输入至OCR模型,输出各区域的内容分布,形成多个区域子图。将各区域子图输入至OCR模型进行内容提取,输出各区域的内容文字,并根据输出的文字进行业务关键要素抽取;文本区、表格区的业务关键要素包括:合同名称、合同编号、合同金额、合同签订日期、合同生效日期、合同签订方;***区的业务关键要素包括:***代码、***号码、含税金额、税率、开票日期、货物品类。结合命名实体识别模型和基于数据分析的规则,同时引入指标类型、位置信息和关键词,进行文本区、表格区业务关键要素抽取。将***区域子图输入至深度卷积神经网络进行分类,每个类别对应***区中的每种业务关键要素,结合样本增强、SVM、目标检测、表格识别和跨页表格拼接的AI技术,进行***区关键要素抽取。
本领域技术人员知道,除了以纯计算机可读程序代码方式实现本发明提供的***、装置及其各个模块以外,完全可以通过将方法步骤进行逻辑编程来使得本发明提供的***、装置及其各个模块以逻辑门、开关、专用集成电路、可编程逻辑控制器以及嵌入式微控制器等的形式来实现相同程序。所以,本发明提供的***、装置及其各个模块可以被认为是一种硬件部件,而对其内包括的用于实现各种程序的模块也可以视为硬件部件内的结构;也可以将用于实现各种功能的模块视为既可以是实现方法的软件程序又可以是硬件部件内的结构。
以上对本发明的具体实施例进行了描述。需要理解的是,本发明并不局限于上述特定实施方式,本领域技术人员可以在权利要求的范围内做出各种变化或修改,这并不影响本发明的实质内容。在不冲突的情况下,本申请的实施例和实施例中的特征可以任意相互组合。

Claims (10)

1.一种基于OCR和NLP技术的交易背景真实性审核方法,其特征在于,包括:
步骤1:通过接口向交易***请求业务的应收账款信息数据,在获取数据后将数据整合为待校验数据格式;
步骤2:通过影像平台获取该业务的影像资料列表;
步骤3:基于OCR和NLP技术,根据影像的唯一编号进行影像识别,根据预设关键要素字段抓取对应的信息,得到待校验数据;
步骤4:根据不同的业务场景、文档类型、指标类型构建比对规则,对待校验数据进行真实性校验,生成辅助审核的校验报告。
2.根据权利要求1所述的基于OCR和NLP技术的交易背景真实性审核方法,其特征在于,通过图像采集装置对待校验材料进行图像采集,并对采集的图像进行OCR区域定位,区域类别包含:文本区、表格区和***区;
在具有标注的数据上进行训练,构建基于深度卷积神经网络的OCR模型,将影像资料输入至OCR模型,输出各区域的内容分布,形成多个区域子图。
3.根据权利要求2所述的基于OCR和NLP技术的交易背景真实性审核方法,其特征在于,将各区域子图输入至OCR模型进行内容提取,输出各区域的内容文字,并根据输出的文字进行业务关键要素抽取;
文本区、表格区的业务关键要素包括:合同名称、合同编号、合同金额、合同签订日期、合同生效日期、合同签订方;
***区的业务关键要素包括:***代码、***号码、含税金额、税率、开票日期、货物品类。
4.根据权利要求3所述的基于OCR和NLP技术的交易背景真实性审核方法,其特征在于,结合命名实体识别模型和基于数据分析的规则,同时引入指标类型、位置信息和关键词,进行文本区、表格区业务关键要素抽取。
5.根据权利要求3所述的基于OCR和NLP技术的交易背景真实性审核方法,其特征在于,将***区域子图输入至深度卷积神经网络进行分类,每个类别对应***区中的每种业务关键要素,结合样本增强、SVM、目标检测、表格识别和跨页表格拼接的AI技术,进行***区关键要素抽取。
6.一种基于OCR和NLP技术的交易背景真实性审核***,其特征在于,包括:
模块M1:通过接口向交易***请求业务的应收账款信息数据,在获取数据后将数据整合为待校验数据格式;
模块M2:通过影像平台获取该业务的影像资料列表;
模块M3:基于OCR和NLP技术,根据影像的唯一编号进行影像识别,根据预设关键要素字段抓取对应的信息,得到待校验数据;
模块M4:根据不同的业务场景、文档类型、指标类型构建比对规则,对待校验数据进行真实性校验,生成辅助审核的校验报告。
7.根据权利要求6所述的基于OCR和NLP技术的交易背景真实性审核***,其特征在于,通过图像采集装置对待校验材料进行图像采集,并对采集的图像进行OCR区域定位,区域类别包含:文本区、表格区和***区;
在具有标注的数据上进行训练,构建基于深度卷积神经网络的OCR模型,将影像资料输入至OCR模型,输出各区域的内容分布,形成多个区域子图。
8.根据权利要求7所述的基于OCR和NLP技术的交易背景真实性审核***,其特征在于,将各区域子图输入至OCR模型进行内容提取,输出各区域的内容文字,并根据输出的文字进行业务关键要素抽取;
文本区、表格区的业务关键要素包括:合同名称、合同编号、合同金额、合同签订日期、合同生效日期、合同签订方;
***区的业务关键要素包括:***代码、***号码、含税金额、税率、开票日期、货物品类。
9.根据权利要求8所述的基于OCR和NLP技术的交易背景真实性审核***,其特征在于,结合命名实体识别模型和基于数据分析的规则,同时引入指标类型、位置信息和关键词,进行文本区、表格区业务关键要素抽取。
10.根据权利要求8所述的基于OCR和NLP技术的交易背景真实性审核***,其特征在于,将***区域子图输入至深度卷积神经网络进行分类,每个类别对应***区中的每种业务关键要素,结合样本增强、SVM、目标检测、表格识别和跨页表格拼接的AI技术,进行***区关键要素抽取。
CN202111503088.5A 2021-12-09 2021-12-09 基于ocr和nlp技术的交易背景真实性审核方法和*** Pending CN114202755A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111503088.5A CN114202755A (zh) 2021-12-09 2021-12-09 基于ocr和nlp技术的交易背景真实性审核方法和***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111503088.5A CN114202755A (zh) 2021-12-09 2021-12-09 基于ocr和nlp技术的交易背景真实性审核方法和***

Publications (1)

Publication Number Publication Date
CN114202755A true CN114202755A (zh) 2022-03-18

Family

ID=80651797

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111503088.5A Pending CN114202755A (zh) 2021-12-09 2021-12-09 基于ocr和nlp技术的交易背景真实性审核方法和***

Country Status (1)

Country Link
CN (1) CN114202755A (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114973290A (zh) * 2022-07-26 2022-08-30 简单汇信息科技(广州)有限公司 一种基于ocr引擎的智能审单方法及***
CN115130989A (zh) * 2022-06-24 2022-09-30 北京百度网讯科技有限公司 一种业务文档的审核方法、装置、设备及存储介质
CN116959018A (zh) * 2023-06-05 2023-10-27 简单汇信息科技(广州)有限公司 一种基于ocr的智能查验方法、***及设备
CN117291740A (zh) * 2023-09-26 2023-12-26 湖北盈嘉集团有限公司 一种基于大数据的应收账款资料真实性智能识别审核***
CN117391068A (zh) * 2023-10-27 2024-01-12 中国人寿保险股份有限公司山东省分公司 一种基于rpa的寿险保全业务信息核验方法及***
CN117726300A (zh) * 2023-12-22 2024-03-19 国网江苏省电力工程咨询有限公司 用于招标代理业务资料校验的自动化智能处理***
WO2024060759A1 (zh) * 2022-09-21 2024-03-28 深圳前海环融联易信息科技服务有限公司 供应链金融资产审核方法、装置、设备及介质

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115130989A (zh) * 2022-06-24 2022-09-30 北京百度网讯科技有限公司 一种业务文档的审核方法、装置、设备及存储介质
CN114973290A (zh) * 2022-07-26 2022-08-30 简单汇信息科技(广州)有限公司 一种基于ocr引擎的智能审单方法及***
CN114973290B (zh) * 2022-07-26 2022-11-04 简单汇信息科技(广州)有限公司 一种基于ocr引擎的智能审单方法及***
WO2024060759A1 (zh) * 2022-09-21 2024-03-28 深圳前海环融联易信息科技服务有限公司 供应链金融资产审核方法、装置、设备及介质
CN116959018A (zh) * 2023-06-05 2023-10-27 简单汇信息科技(广州)有限公司 一种基于ocr的智能查验方法、***及设备
CN116959018B (zh) * 2023-06-05 2024-02-23 简单汇信息科技(广州)有限公司 一种基于ocr的智能查验方法、***及设备
CN117291740A (zh) * 2023-09-26 2023-12-26 湖北盈嘉集团有限公司 一种基于大数据的应收账款资料真实性智能识别审核***
CN117291740B (zh) * 2023-09-26 2024-04-19 湖北盈嘉集团有限公司 一种基于大数据的应收账款资料真实性智能识别审核***
CN117391068A (zh) * 2023-10-27 2024-01-12 中国人寿保险股份有限公司山东省分公司 一种基于rpa的寿险保全业务信息核验方法及***
CN117391068B (zh) * 2023-10-27 2024-04-05 中国人寿保险股份有限公司山东省分公司 一种基于rpa的寿险保全业务信息核验方法及***
CN117726300A (zh) * 2023-12-22 2024-03-19 国网江苏省电力工程咨询有限公司 用于招标代理业务资料校验的自动化智能处理***
CN117726300B (zh) * 2023-12-22 2024-05-24 国网江苏省电力工程咨询有限公司 用于招标代理业务资料校验的自动化智能处理***

Similar Documents

Publication Publication Date Title
CN114202755A (zh) 基于ocr和nlp技术的交易背景真实性审核方法和***
CN109887153B (zh) 一种财税处理方法和处理***
CN107608958B (zh) 基于条款统一建模的合同文本风险信息挖掘方法和***
CN110069623B (zh) 摘要文本生成方法、装置、存储介质和计算机设备
CN114862540B (zh) 一种票据审核***及其方法
CN114117171B (zh) 一种基于赋能思维的工程档案智能收整方法及***
CN111652232B (zh) 票据识别方法及装置、电子设备和计算机可读存储介质
US20070237427A1 (en) Method and system for simplified recordkeeping including transcription and voting based verification
CN110414927B (zh) 一种票据处理自动生成凭证的方法及装置
CN103678109A (zh) 一种转储文件分析方法、装置和***
US20140207631A1 (en) Systems and Method for Analyzing and Validating Invoices
CN112732897A (zh) 文档处理方法、装置、电子设备及存储介质
CN110941702A (zh) 一种法律法规和法条的检索方法及装置、可读存储介质
CN111914729A (zh) 凭证关联方法、装置、计算机设备及存储介质
CN111400529B (zh) 数据处理方法以及装置
CN116701506A (zh) 融合非结构化数据的需求计划合规性检验方法
CN111709464A (zh) 基于数据字典配置和***图像识别技术的***及筛选方法
US11783605B1 (en) Generalizable key-value set extraction from documents using machine learning models
CN110717732A (zh) 一种信息认证方法及***
CN105913071A (zh) 信息处理装置、信息处理***、信息处理方法
CN115907673A (zh) 一种供应链***
CN105243584A (zh) 一种数据处理的方法和***
KR102416998B1 (ko) 세무 문서 수집 및 분류 자동화 장치 및 방법
CN113537964A (zh) 申请单处理方法、设备、存储介质及装置
CN114549177A (zh) 保函审查方法、装置、***与计算机可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination