CN113094520A - 一种检查电子合同的方法 - Google Patents

一种检查电子合同的方法 Download PDF

Info

Publication number
CN113094520A
CN113094520A CN202110336101.6A CN202110336101A CN113094520A CN 113094520 A CN113094520 A CN 113094520A CN 202110336101 A CN202110336101 A CN 202110336101A CN 113094520 A CN113094520 A CN 113094520A
Authority
CN
China
Prior art keywords
information
contract
checking
rewriting
electronic contract
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110336101.6A
Other languages
English (en)
Other versions
CN113094520B (zh
Inventor
黄勇
汤文青
张妍洁
冯宇
李开宇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sichuan XW Bank Co Ltd
Original Assignee
Sichuan XW Bank Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sichuan XW Bank Co Ltd filed Critical Sichuan XW Bank Co Ltd
Priority to CN202110336101.6A priority Critical patent/CN113094520B/zh
Publication of CN113094520A publication Critical patent/CN113094520A/zh
Application granted granted Critical
Publication of CN113094520B publication Critical patent/CN113094520B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/38Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/383Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/153Segmentation of character regions using recognition of characters or words
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Engineering & Computer Science (AREA)
  • Library & Information Science (AREA)
  • Databases & Information Systems (AREA)
  • Multimedia (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Character Input (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种检查电子合同的方法,涉及软件开发和软件测试领域,本发明包括以下步骤:步骤1:依据所有合同模板进行信息库建立并建立核对规则;步骤2:设定特定合同核对规则;步骤3:通过OCR识别技术将电子合同的图片数据转变成为文本数据,转换后的文本数据再同源数据进行比对。本发明的有益效果在于:本发明依据合同模板,将所有类型的合同,需要反写的数据进行归纳整理形成反写信息库,针对每一类信息,编写能够在合同文本中进行匹配抽取该信息的正则表达式。从而只需要归纳整理,后续对所有类型的合同都可以复用该反写信息库,快速实现对电子合同文本中的反写信息进行抽取。

Description

一种检查电子合同的方法
技术领域
本发明涉及软件开发和软件测试领域,尤其是一种检查电子合同的方法。
背景技术
由于电子合同是通过业务***程序控制自动生成,可能会存在业务需求和程序编写不一致的情况发生,为了保证***生成的电子合同是符合业务需求,且数据正确,需要对电子合同进行单独复核。当前的方案是人工抽查部分正式生成的电子合同文本,与合同模板文件的文字描述进行比对,检查文字描述是否正确;对于合同模板中标注的需要反写的数据,复核人员通过人工将电子合同的数据,同业务数据进行手动核对,确认数据的正确性。该方案存在检查速度慢,不能全面及时进行检查的问题,以及业务数据真实性的复核完全依靠人工检查,存在人为差错的情况。
相关技术术语介绍:
电子合同:又称电子商务合同,根据***国际贸易法委员会《电子商务示范法》以及世界各国颁布的电子交易法,同时结合我国《合同法》的有关规定,电子合同可以界定为:电子合同是双方或多方当事人之间通过电子信息网络以电子的形式达成的设立、变更、终止财产性民事权利义务关系的协议。
合同模板文件:指作为模板的合同文本,里面包含了固定不变的合同内容文字描述及需要反写的标识,反写的标识在生成正式合同的时候,通过将真实的业务数据反写到模板文件里,最终生成一个真实的具有法律效力的电子合同。
OCR(Optical Character Recognition,光学字符识别):指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程。
正则表达式:又称规则表达式。(英语:Regular Expression,在代码中常简写为regex、regexp或RE),计算机科学的一个概念。正则表达式通常被用来检索、替换那些符合某个模式(规则)的文本。
发明内容
针对上述现有技术中存在的不足,本发明的目的在于提供一种检查电子合同的方法,解决现有技术准确率低且效率低的问题。
为解决上述问题,本发明公开了一种检查电子合同的方法,包括以下步骤:步骤1:依据所有合同模板进行信息库建立并建立核对规则;步骤2:设定特定合同核对规则;步骤3:通过OCR识别技术将电子合同的图片数据转变成为文本数据,转换后的文本数据再同源数据进行比对。
作为优先,步骤1具体包括以下步骤:
1.1根据合同模板所有可能的反写内容进行归纳整理形成反写信息库,并对信息库里的每一类信息取名,综合每类信息的各种特征、数据类型及信息的上下文,针对每一类信息,编写能够在合同文本中进行匹配抽取该信息的正则表达式,后续通过对电子合同文本进行模式匹配,抽取出制定的反写信息;
1.2根据每一类反写信息确定其数据类型,并对每一类数据类型设定判断规则。
作为优选:步骤2具体包括以下步骤:
2.1根据特定合同模板,确定需要核对的固定格式文本;
2.2根据特定合同模板的反写部分,确定特定合同需要核对的反写信息并确认反写信息的数据类型;
2.3根据特定合同模板的反写信息,并同业务设计文档及程序设计文档核对,确定该反写信息的源数据在业务***数据库的存储位置及存储方式,及最终生产信息反写到电子合同的计算转换方式,然后依据存储位置、存储方式、计算转换方式及业务设计文档,再编写一套独立于业务***设计的反写数据生成方法,作为同电子合同文本内容进行核对基准;
2.4依据特定合同模板需要比对的信息及数据类型,按照步骤1.2设计的检核规则及步骤2.3实现的核对基准,确定电子合同核对规则。
作为优选:步骤3具体包括以下步骤:
3.1对电子合同进行OCR识别,将电子合同的图片数据转化为文本数据;
3.2根据模板合同的反写部分,使用步骤1.1设计的正则表达式规则从步骤3.1识别出来的文本数据里抽取出电子合同的反写信息内容;
3.3根据步骤2.3的生成的核对基准与步骤3.2获得的电子合同反写信息及步骤2.4设定的电子合同检核规则进行比对,从而发现电子合同内容存在与核对基准不一致的地方,从而实现通过程序手动,自动执行合同比对。
作为优选:所述步骤1.1中对信息库里的每一类信息取名如下:身份证信息、电话号码信息、邮箱信息、借款金额信息、利率信息、借款人信息、贷款人信息。
作为优选:所述步骤1.2中设定判断规则如下:对文本类型设定完全等于、包含、不等于检核规则;对数字类型设定等于、大于、小于检核规则;对日期类型设置大于、小于、等于检核规则。
本发明的有益效果如下:
本发明依据合同模板,将所有类型的合同,需要反写的数据进行归纳整理形成反写信息库,针对每一类信息,编写能够在合同文本中进行匹配抽取该信息的正则表达式。从而只需要归纳整理,后续对所有类型的合同都可以复用该反写信息库,快速实现对电子合同文本中的反写信息进行抽取。本发明提出了根据合同模板反写信息的每一类信息,确定其数据类型,并对每一类数据类型,设定判断规则的方法,从而可以快速实现对每一类反写信息进行核对,极大提升了准确率和工作效率。
附图说明
图1是本发明的实施例示意图。
具体实施方式
以下结合附图对本发明的实施例进行详细说明,但是本发明可以由权利要求限定和覆盖的多种不同方式实施。
如图1,为解决上述问题,本发明公开了一种检查电子合同的方法,包括:
步骤1:依据所有合同模板进行信息库建立并建立核对规则:
1.1根据合同模板所有可能的反写内容进行归纳整理形成反写信息库,并对信息库里的每一类信息取名(如:身份证信息、电话号码信息、邮箱信息、借款金额信息、利率信息、借款人信息、贷款人信息等),综合每类信息的各种特征、数据类型及信息的上下文,针对每一类信息,编写能够在合同文本中进行匹配抽取该信息的正则表达式等各种匹配方式,后续通过对对电子合同文本进行模式匹配,抽取出制定的反写信息;
1.2根据每一类反写信息,确定其数据类型如数字类型,百分制类型,文本类型,日期规则等,并对每一类数据类型,设定判断规则:如对文本类型设定完全等于、包含、不等于检核规则;对数字类型设定等于、大于、小于等检核规则;对日期类型设置大于、小于、等于检核规则。
步骤2:特定合同检核规则设定。
2.1根据特定合同模板,确定需要核对的固定格式文本;
2.2根据特定合同模板的反写部分,确定特定合同需要核对的反写信息并确认反写信息的数据类型;
2.3根据特定合同模板的反写信息,并同业务设计文档及程序设计文档核对,确定该反写信息的源数据在业务***数据库的存储位置及存储方式,及最终生产信息反写到电子合同的计算转换方式,然后依据存储位置、存储方式、计算转换方式及业务设计文档,再编写一套独立于业务***设计的反写数据生成方法,作为同电子合同文本内容进行核对基准;
2.4依据特定合同模板需要比对的信息及数据类型,按照步骤1.2设计的检核规则,及步骤2.3实现的核对基准,确定电子合同检核规则。
步骤3:电子合同比对。
本步骤包括如下步骤:
3.1对电子合同进行OCR识别,将合同的图片数据转化为文本数据;
3.2根据模板合同的反写部分,使用步骤1.1设计的正则表达式规则从步骤3.1识别出来的文本里抽取出电子合同的反写信息内容;
3.3根据步骤2.3的生成的核对基准与步骤3.2获得的电子合同反写信息及步骤2.4设定的电子合同检核规则进行比对,从而发现电子合同内容存在与核对基准不一致的地方,从而实现通过程序手动,自动执行合同比对。
以上所述仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (6)

1.一种检查电子合同的方法,其特征在于,包括以下步骤:
步骤1:依据所有合同模板进行信息库建立并建立核对规则;步骤2:设定特定合同核对规则;步骤3:通过OCR识别技术将电子合同的图片数据转变成为文本数据,转换后的文本数据再同源数据进行比对。
2.根据权利要求1所述的一种检查电子合同的方法,其特征在于:
步骤1具体包括以下步骤:
1.1根据合同模板所有可能的反写内容进行归纳整理形成反写信息库,并对信息库里的每一类信息取名,综合每类信息的各种特征、数据类型及信息的上下文,针对每一类信息,编写能够在合同文本中进行匹配抽取该信息的正则表达式,后续通过对电子合同文本进行模式匹配,抽取出制定的反写信息;
1.2根据每一类反写信息确定其数据类型,并对每一类数据类型设定判断规则。
3.根据权利要求2所述的一种检查电子合同的方法,其特征在于:
步骤2具体包括以下步骤:
2.1根据特定合同模板,确定需要核对的固定格式文本;
2.2根据特定合同模板的反写部分,确定特定合同需要核对的反写信息并确认反写信息的数据类型;
2.3根据特定合同模板的反写信息,并同业务设计文档及程序设计文档核对,确定该反写信息的源数据在业务***数据库的存储位置及存储方式,及最终生产信息反写到电子合同的计算转换方式,然后依据存储位置、存储方式、计算转换方式及业务设计文档,再编写一套独立于业务***设计的反写数据生成方法,作为同电子合同文本内容进行核对基准;
2.4依据特定合同模板需要比对的信息及数据类型,按照步骤1.2设计的检核规则及步骤2.3实现的核对基准,确定电子合同核对规则。
4.根据权利要求3所述的一种检查电子合同的方法,其特征在于:
步骤3具体包括以下步骤:
3.1对电子合同进行OCR识别,将电子合同的图片数据转化为文本数据;
3.2根据模板合同的反写部分,使用步骤1.1设计的正则表达式规则从步骤3.1识别出来的文本数据里抽取出电子合同的反写信息内容;
3.3根据步骤2.3的生成的核对基准与步骤3.2获得的电子合同反写信息及步骤2.4设定的电子合同检核规则进行比对,从而发现电子合同内容存在与核对基准不一致的地方,从而实现通过程序手动,自动执行合同比对。
5.根据权利要求2所述的一种检查电子合同的方法,其特征在于:所述步骤1.1中对信息库里的每一类信息取名如下:身份证信息、电话号码信息、邮箱信息、借款金额信息、利率信息、借款人信息、贷款人信息。
6.根据权利要求2所述的一种检查电子合同的方法,其特征在于:所述步骤1.2中设定判断规则如下:对文本类型设定完全等于、包含、不等于检核规则;对数字类型设定等于、大于、小于检核规则;对日期类型设置大于、小于、等于检核规则。
CN202110336101.6A 2021-03-29 2021-03-29 一种检查电子合同的方法 Active CN113094520B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110336101.6A CN113094520B (zh) 2021-03-29 2021-03-29 一种检查电子合同的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110336101.6A CN113094520B (zh) 2021-03-29 2021-03-29 一种检查电子合同的方法

Publications (2)

Publication Number Publication Date
CN113094520A true CN113094520A (zh) 2021-07-09
CN113094520B CN113094520B (zh) 2023-05-12

Family

ID=76670649

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110336101.6A Active CN113094520B (zh) 2021-03-29 2021-03-29 一种检查电子合同的方法

Country Status (1)

Country Link
CN (1) CN113094520B (zh)

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102855304A (zh) * 2012-08-20 2013-01-02 清华大学 用于b2c交易中的可变条款电子合同自动生成方法
CN103679315A (zh) * 2012-09-21 2014-03-26 金蝶软件(中国)有限公司 基于业务流程的单据反写的方法和装置
CN103699693A (zh) * 2014-01-10 2014-04-02 中国南方电网有限责任公司 一种基于元数据的数据质量管理方法及***
CN109033058A (zh) * 2018-08-14 2018-12-18 深圳壹账通智能科技有限公司 合同文本验证方法、装置、计算机设备和存储介质
CN109800404A (zh) * 2019-01-03 2019-05-24 深圳壹账通智能科技有限公司 电子合同模板生成方法、装置、计算机设备和存储介质
CN109816327A (zh) * 2018-12-14 2019-05-28 平安国际融资租赁有限公司 合同数据处理方法、装置、计算机设备和存储介质
CN110222692A (zh) * 2019-05-21 2019-09-10 深圳壹账通智能科技有限公司 一种合同校验方法及相关设备
WO2020077895A1 (zh) * 2018-10-16 2020-04-23 深圳壹账通智能科技有限公司 签约意向判断方法、装置、计算机设备和存储介质
CN111753090A (zh) * 2020-06-30 2020-10-09 北京来也网络科技有限公司 基于rpa及ai的文档审核方法、装置、设备及介质

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102855304A (zh) * 2012-08-20 2013-01-02 清华大学 用于b2c交易中的可变条款电子合同自动生成方法
CN103679315A (zh) * 2012-09-21 2014-03-26 金蝶软件(中国)有限公司 基于业务流程的单据反写的方法和装置
CN103699693A (zh) * 2014-01-10 2014-04-02 中国南方电网有限责任公司 一种基于元数据的数据质量管理方法及***
CN109033058A (zh) * 2018-08-14 2018-12-18 深圳壹账通智能科技有限公司 合同文本验证方法、装置、计算机设备和存储介质
WO2020077895A1 (zh) * 2018-10-16 2020-04-23 深圳壹账通智能科技有限公司 签约意向判断方法、装置、计算机设备和存储介质
CN109816327A (zh) * 2018-12-14 2019-05-28 平安国际融资租赁有限公司 合同数据处理方法、装置、计算机设备和存储介质
CN109800404A (zh) * 2019-01-03 2019-05-24 深圳壹账通智能科技有限公司 电子合同模板生成方法、装置、计算机设备和存储介质
CN110222692A (zh) * 2019-05-21 2019-09-10 深圳壹账通智能科技有限公司 一种合同校验方法及相关设备
CN111753090A (zh) * 2020-06-30 2020-10-09 北京来也网络科技有限公司 基于rpa及ai的文档审核方法、装置、设备及介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
LUKE V RASMUSSEN ET AL.: "Development of an optical character recognition pipeline for handwritten form fields from an electronic health record", 《JOURNAL OF THE AMERICAN MEDICAL INFORMATICS ASSOCIATION》 *
曾庆军: "财务视角下采购挂账信息化转型实践", 《冶金财会》 *

Also Published As

Publication number Publication date
CN113094520B (zh) 2023-05-12

Similar Documents

Publication Publication Date Title
US20070033118A1 (en) Document Scanning and Data Derivation Architecture.
US20140207631A1 (en) Systems and Method for Analyzing and Validating Invoices
WO2020233402A1 (zh) 应付账款订单校验方法、装置、设备及存储介质
CN109271951A (zh) 一种提升记账审核效率的方法及***
CN115116068B (zh) 一种基于ocr的档案智能归档***
CN111539414B (zh) 一种ocr图像字符识别和字符校正的方法及***
CN114358798A (zh) 一种基于图片识别的企业信息认证的方法、装置及***
CN112749649A (zh) 一种智能识别并生成电子合同的方法及***
CN111462388A (zh) 一种票据检验方法、装置、终端设备及存储介质
CN113841156B (zh) 基于图像识别的控制方法与装置
CN109886076B (zh) ***存储方法
CN107818502A (zh) 一种票据的票价税额的自动检查方法
CN114445836A (zh) 结合rpa和ai的信息审核方法、装置及电子设备
CN111382742A (zh) 一种云财务平台集成ocr识别软件的方法
CN112613367A (zh) 票据信息文本框获取方法、***、设备及存储介质
CN112560855A (zh) 图像信息提取方法、装置、电子设备及存储介质
CN113094520B (zh) 一种检查电子合同的方法
CN111768565A (zh) 一种增值税***中***代码识别后处理方法
CN116798061A (zh) 一种票据审核识别方法、装置、终端和存储介质
CN111104853A (zh) 图像信息录入方法、装置、电子设备及存储介质
CN114511854A (zh) 一种合同规范性的审核方法、装置、设备和介质
CN111046864A (zh) 一种合同扫描件五要素自动提取方法及***
CN110751110A (zh) 身份影像信息核验方法、装置、设备及存储介质
CN114913517B (zh) 一种自动获取并分析关键数据形成避免可疑资金交易报告的方法及装置
CN114118949B (zh) 一种票据的信息处理***和方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant