CN111882419B - 质检文件的方法、装置及服务器 - Google Patents
质检文件的方法、装置及服务器 Download PDFInfo
- Publication number
- CN111882419B CN111882419B CN202010448777.XA CN202010448777A CN111882419B CN 111882419 B CN111882419 B CN 111882419B CN 202010448777 A CN202010448777 A CN 202010448777A CN 111882419 B CN111882419 B CN 111882419B
- Authority
- CN
- China
- Prior art keywords
- file
- service
- variable
- detected
- format
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000007689 inspection Methods 0.000 title claims abstract description 68
- 238000000034 method Methods 0.000 title claims abstract description 37
- 238000003908 quality control method Methods 0.000 claims abstract description 7
- 238000010586 diagram Methods 0.000 description 16
- 230000006870 function Effects 0.000 description 6
- 230000008569 process Effects 0.000 description 6
- 238000012545 processing Methods 0.000 description 5
- 230000000694 effects Effects 0.000 description 4
- 238000012986 modification Methods 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- 230000008901 benefit Effects 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 238000013461 design Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000009877 rendering Methods 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/03—Credit; Loans; Processing thereof
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/166—Editing, e.g. inserting or deleting
- G06F40/186—Templates
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/18—Legal services
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Health & Medical Sciences (AREA)
- Strategic Management (AREA)
- Technology Law (AREA)
- Economics (AREA)
- Tourism & Hospitality (AREA)
- Finance (AREA)
- Accounting & Taxation (AREA)
- Health & Medical Sciences (AREA)
- Marketing (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Engineering & Computer Science (AREA)
- Development Economics (AREA)
- Human Resources & Organizations (AREA)
- Primary Health Care (AREA)
- Machine Translation (AREA)
Abstract
本发明实施例提供一种质检文件的方法、装置及服务器,该方法包括:获取待检文件;从与所述待检文件对应的文件模板中,获取包含变量参数的文本内容;根据所述文本内容,在所述待检文件中匹配得到所述变量参数的变量参数值获取与所述待检文件对应业务的业务参数和业务参数值;将所述变量参数和所述变量参数值与所述业务参数和所述业务参数值进行比对,生成所述待检文件的质检结果,这样可以实现自动对待检文件的质检,提高文件质检的效率和准确性。
Description
技术领域
本发明实施例涉及计算机技术领域,具体涉及一种质检文件的方法、装置及服务器。
背景技术
当前企业或多或少都存在一些存档文件的需求,就像前端用户通过页面看到的一些协议,需进行存档。比如,用户在申请贷款时,用户在应用程序(Application,APP)上看到的贷款合同,当用户成功贷款后,需要把这份贷款合同以PDF(Portable Document Format的简称,意为“便携式文档格式”)的形式进行存储。
由于贷款合同数量较多,目前只能通过人为抽检的方式判断贷款合同中是否存在问题,这种质检方式效率较低,且无法对所有贷款合同进行质检,导致无法确保贷款合同内容的正确性。
发明内容
本发明实施例的一个目的在于提供一种质检文件的方法、装置及服务器,解决现有文件质检效率较低的问题。
第一方面,本发明实施例提供一种质检文件的方法,包括:
获取待检文件;
从与所述待检文件对应的文件模板中,获取包含变量参数的文本内容;
根据所述文本内容,在所述待检文件中匹配得到所述变量参数的变量参数值;
获取与所述待检文件对应业务的业务参数和业务参数值;
将所述变量参数和所述变量参数值与所述业务参数和所述业务参数值进行比对,生成所述待检文件的质检结果。
第二方面,本发明实施提供一种质检文件的装置,包括:
第一获取模块,用于获取待检文件;
第二获取模块,用于从与所述待检文件对应的文件模板中,获取包含变量参数的文本内容;
匹配模块,用于根据所述文本内容,在所述待检文件中匹配得到所述变量参数的变量参数值;
第三获取模块,用于获取与所述待检文件对应业务的业务参数和业务参数值;
比对模块,用于将所述变量参数和所述变量参数值与所述业务参数和所述业务参数值进行比对,生成所述待检文件的质检结果。
第三方面,本发明实施例提供了一种服务器,包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的程序,所述程序被所述处理器执行时实现上述质检文件的方法的步骤。
第四方面,本发明实施例提供了一种可读存储介质,其上存储有程序,所述程序被处理器执行时实现上述质检文件的方法的步骤。
在本发明实施例中,从与待检文件对应的文件模板中解析包含变量参数的文本内容,然后根据该文本内容从待检文件中得到变量参数的变量参数值,最后将变量参数和变量参数值与真实的业务参数和业务参数值进行比对,生成该待检文件的质检结果,这样可以实现自动对待检文件的质检,提高文件质检的效率和准确性。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1为本发明实施例的质检文件的方法流程图;
图2为本发明实施例的质检PDF合同的方法流程图;
图3为本发明实施例的合同模板的示意图;
图4为本发明实施例的生成PDF合同的示意图;
图5为本发明实施例的解析合同模板的示意图;
图6为本发明实施例的解析图3生成的PDF合同的示意图;
图7为本发明实施例的通过合同号获取合同数据的示意图;
图8为本发明实施例的质检文件的装置的示意图;
图9为本发明实施例的服务器的示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本申请的说明书和权利要求书中的术语“包括”以及它的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、***、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。此外,说明书以及权利要求中使用“和/或”表示所连接对象的至少其中之一,例如A和/或B,表示包含单独A,单独B,以及A和B都存在三种情况。
在本发明实施例中,“示例性的”或者“例如”等词用于表示作例子、例证或说明。本发明实施例中被描述为“示例性的”或者“例如”的任何实施例或设计方案不应被解释为比其它实施例或设计方案更优选或更具优势。确切而言,使用“示例性的”或者“例如”等词旨在以具体方式呈现相关概念。
参见图1,本发明实施例提供一种质检文件的方法,具体步骤包括:步骤101、步骤102、步骤103、步骤104和步骤105。
步骤101:获取待检文件;
上述待检文件的类型可以是合同协议,当然并不限于此。需要说明的是,在下面的介绍中是以合同协议为例进行介绍的,其他类型文件的质检方式与此类似,在此不再敷述。
可以理解的是,在本发明实施例中对于待检文件的生成方式不做限定。比如,根据用户操作的APP和类型,查询出对应的贷款模板;从业务***中获取出用户的贷款数据,即相关的用户信息(姓名、身份证号等)、贷款信息(比如金额、用途、期限)等,最终生成jason格式的数据;再通过获取的jason格式的数据和贷款模板通过渲染(即利用jason格式的数据,把贷款模板中定义的参数标签进行替换,比如,将贷款模板中的参数标签“${contractNo}”替换为对应的合同编号“11012019120700001”),供用户在APP查看和确认。最后,当用户在APP上确认后,生成贷款协议,比如将渲染得到的HTML数据,通过wkhtmltopdf转换成PDF文件进行存储。
步骤102:从与所述待检文件对应的文件模板中,获取包含变量参数的文本内容;
可以理解的是,上述文本内容也可以称为字符串。
变量参数指的是文件模板中的可变信息,即针对不同的用户,该变量参数的数值可能不同,也就是,该变量参数的变量参数值属于需要质检的内容,如果该变量参数值存在问题,则表示该待检文件存在问题,比如,姓名定义的变量参数为${name},身份证号码定义的变量参数为:${idNo},当然并不限于此。
参见图3,图中示意一种贷款模板,当然可以理解的是,本发明实施例中对文件模板的形式不做具体限定。
步骤103:根据所述文本内容,在所述待检文件中匹配得到所述变量参数的变量参数值;
比如,通过预先配置的正则表达式和步骤102中获取的文本内容,在待检文件中匹配得到变量参数的变量参数值,可以理解的是,该正则表达式用于从待检文件中提取出该变量参数的变量参数值,其中正则表达式(regular expression)描述了一种字符串匹配的模式(pattern),可以用于检查一个字符串是否含有某种子字符串。在本发明实施例中对于该正则表达式的具体形式不做限定。
步骤104:获取与所述待检文件对应业务的业务参数和业务参数值;
比如,通过合同协议的合同号从账务***中获取对应业务的业务参数和业务参数值,可以理解的是,在本发明实施例中不限定获取业务参数和业务参数值的具体方式。
上述待检文件对应的业务是指与该待检文件对应的实际业务,比如,待检文件为合同协议,则该业务为贷款业务,该业务参数值用于对变量参数值进行质检,如果一致,则说明待检文件没有问题,如果不一致,则说明待检文件存在问题,而业务参数用于与业务参数值组成jason格式的数据,以提高质检的准确性和效率。
步骤105:将所述变量参数和所述变量参数值与所述业务参数和所述业务参数值进行比对,生成所述待检文件的质检结果。
也就是,将步骤102和步骤103中获得的变量参数和变量参数值与步骤104中获取的业务参数和业务参数值进行比对。如果参数值一致,表示待检文件与实际的是一致的;如果不一致,就说明待检文件的数据有问题。这样,可以实现自动对待检文件的质检,提高文件质检的效率和准确性。
需要说明的是,可以在对待检文件中的每个变量参数值进行质检后,均生成该待检文件的质检结果,或者,也可以在对待检文件中的所有变量参数值进行质检后,再生成该待检文件的质检结果,如果所有的变量参数值都没有问题,则提示该质检文件合格。
进一步地,如果该变量参数值与业务参数值不一致,可以输出提示信息,该提示信息中可以包括质检结果,该质检结果中可以包括存在问题的变量参数值。当出现变量参数值与业务参数值不一致的情况时,会自动生成一条记录,质检***会将不一致的数据进行记录,譬如具体是哪一个变量参数值和业务参数值不一致,同时也会将合同号进行记录,这样便于确定待检文件中出现问题数据的位置,便于业务***去修复出现问题数据的这个待检文件以及跟踪待检文件中出现问题数据的修复时间以及修复处理人等信息。
在一些实施方式中,待检文件可以基于文件模板,以及业务类型和/或用户信息生成,具体方式如下,步骤101可以包括:
步骤1011:根据模板类型,获取对应的文件模板;
例如,根据用户选择的模板类型获取对应的文件模板,其中,模板类型可以为合同模板,当然并不限于此。可以理解的是步骤1011为可选步骤,比如有多个文件模板时,可以根据模板类型选择对应的文件模板,可选地,模板类型可以根据业务类型进行设置。
步骤1012:根据业务类型,获取对应的业务数据;
例如,根据用户选择的业务类型,获取对应的业务数据,其中,业务类型可以是金融业务,比如,贷款业务。
步骤1013:根据所述业务数据、所述文件模板和用户信息,生成超文本标记语言(HyperText Markup Language,HTML)格式的待检文件;
可以理解的是,用户信息可以包括用户姓名、身份证号码等个人信息,当然并不限于此。
步骤1014:将所述HTML格式的待检文件转换为第一格式的待检文件。
可以理解的是,在本发明实施例中不限定格式转换的方式,以及不限定第一格式的具体类型,比如,第一格式可以是便携式文档格式(Portable Document Format,PDF)或者图片格式。
比如,通过步骤1011~步骤1014可以得到PDF格式的合同协议。
在本发明实施例中,步骤102中的文本内容除了包括变量参数还可以包括其他的字符,例如该字符位于变量参数的左边,和/或,该字符位于变量参数的右边。由于不是仅从文件模板中解析出变量参数,而是解析出包括该变量参数的文本内容,这样可以提高后续基于该文本内容从待检文件中匹配与变量参数对应的变量参数值的准确性。
在一些实施方式中,步骤102可以包括:
步骤1021:将所述文件模板的文件格式转换为文本格式;
例如,将文件模板的文件格式由PDF格式转换为纯文本格式。
比如,可以采用PDFbox组件将PDF格式的文件模板转换为纯文本格式的文件模板,PDFbox组件是一个开源的、基于Java的、支持PDF文档生成的工具库,它可以用于创建新的PDF文档,修改现有的PDF文档,还可以从PDF文档中提取所需的内容。
在将文件模板的文件格式转换为文本格式的步骤之前,还包括:
将所述文件模板的格式转换为第一格式;
可以理解的是,步骤101中获取的待检文件的格式也可以是第一格式,由于待检文件和文件模板的格式都是第一格式,避免由于文件格式的不同,导致后续文件比较一致性时出现无法比较,或者由于格式不一致导致比较出错的问题。
比如,所述第一格式为PDF或图片格式,示例性地,通过wkhtmltopdf将HTML格式的文件模板转换为PDF格式的文件模板。
步骤1022:根据预设的正则表达式,从所述文件模板中获取文本内容,所述指定文本内容包括:变量参数和第一字符,所述第一字符包括:位于所述变量参数左边的字符和/或位于所述变量参数右边的字符。
其中,预设的正则表达式用于解析出变量参数和该变量参数左边的字符和/或右边的字符。在文本内容中包括:变量参数以及该变量参数左边的一个或多个字符和右边的一个或多个字符的情况下,
在本发明实施例,以变量参数的形式为${}标签为例,预设的正则表达式的匹配标准包括:;
(1)${}标签的一侧(比如${}标签的左侧)的最大为N个字符,当N个字符出现所述标签截止,比如N=20;
(2)${}标签的另一侧(比如${}标签的右侧)的最大值为M个字符,将M个字符中的所述标签替换为“.*”字符,比如M=100,替换的正则代码为:
replaceAll("\\$\\{"+"(?<=\\$\\{)(.+?)(?=\\})"+"\\}",".*");
(3)通过以下正则表达式进行解析:
Pattern.compile("(?<=\\$\\{)(.+?)(?=\\})")。
可以理解的是,文件模板中可以包括一个或多个变量参数,不同的待检文件的变量参数的变量参数值可以相同,也可以不同。比如,文件模板为合同模板,该合同模板中的变量参数包括以下一项或多项:合同版本、编号、签署日期、贷款人、借款人、身份证号码、信用额度、额度期限等。
比如,变量参数为借款人,第一字符包括:位于变量参数左边的字符“贷款人”和位于变量参数右边的字符“身份证号码”。
在一些实施方式中,步骤103可以包括:
步骤1031:将所述待检文件的格式转换为文本格式;例如,将PDF格式的待检文件转换为文本格式的待检文件。
步骤1032:根据所述文本内容和预设的正则表达式,在所述待检文件中匹配得到所述变量参数的变量参数值;
步骤1033:将所述变量参数和所述变量参数值,以名称/值对的格式进行存储。
比如,将所述变量参数和所述变量参数值以jason格式进行存储,可以理解的是,对“名称/值对的格式”不做具体限定。
在一些实施方式中,步骤104可以包括:
步骤1041:根据所述待检文件的标识,从存储服务器中获取对应业务的业务参数和业务参数值;
比如,待检文件的标识可以是合同协议的合同号,当然并不限于此。
步骤1042:保存所述业务参数和业务参数值。
例如,将所述业务参数和业务参数值以名称/值对的格式进行存储。
在一些实施方式中,步骤105可以包括:
步骤1051:若所述待检文件中的所有变量参数和变量参数值与存储服务器中存储的对应业务的业务参数和业务参数值一致,则生成并反馈质检结果,所述质检结果包括:所述待检文件正确;
步骤1052:若所述待检文件中的变量参数和变量参数值与存储服务器中存储的对应业务的业务参数和业务参数值不一致,则生成并反馈该待检文件的质检结果,所述质检结果包括:所述待检文件有误,比如反馈问题变量参数和/或问题变量参数值。
也就是,将步骤102和步骤103中获得的变量参数和变量参数值与步骤104中获取的业务参数和业务参数值进行比对。如果参数值一致,表示待检文件与实际的是一致的,即表示待检文件通过质检;如果不一致,就说明待检文件的数据有问题。这样,可以实现自动对待检文件的质检,提高文件质检的效率和准确性。
需要说明的是,可以在对待检文件中的每个变量参数值进行质检后,均生成该待检文件的质检结果,或者,也可以在对待检文件中的所有变量参数值进行质检后,再生成该待检文件的质检结果,如果所有的变量参数值都没有问题,则提示该质检文件合格。
进一步地,如果该变量参数值与业务参数值不一致,可以输出提示信息,该提示信息中可以包括质检结果,该质检结果中可以包括存在问题的变量参数值。当出现变量参数值与业务参数值不一致的情况时,会自动生成一条记录,质检***会将不一致的数据进行记录,譬如具体是哪一个变量参数值和业务参数值不一致,同时也会将合同号进行记录,这样便于确定待检文件中出现问题数据的位置,便于业务***去修复出现问题数据的这个待检文件以及跟踪待检文件中出现问题数据的修复时间以及修复处理人等信息。
在本发明实施例中,从与待检文件对应的文件模板中解析包含变量参数的文本内容,然后根据该文本内容从待检文件中得到变量参数的变量参数值,最后将变量参数和变量参数值与真实的业务参数和业务参数值进行比对,生成该待检文件的质检结果,这样可以实现自动对待检文件的质检,提高文件质检的效率和准确性。
下面结合图2~图7介绍质检贷款合同的流程在质检贷款合同的流程中上述文件模板为合同协议模板,上述待检文件为贷款合同。
步骤一、配置合同协议模板;
合同协议模板,即提供一个可见即所得的界面,用于把合同的内容录入进去,并在需要替换的地方******所定义的变量参数。合同协议模板相当于原始的合同文本,用户在APP上看到和用户确认贷款后生产的PDF格式的合同贷款协议,都是基于此模板进行生成的,参见图3。
比如,贷款人姓名定义的变量参数为:${borrowname},身份证号码定义的变量参数为:${borrowcard},贷款金额定义的变量参数为:${amount},签署日期定义的变量参数为:${signDate},信用额度定义的变量参数为:${principal},贷款金额的变量参数:${amount}。
步骤二、用户贷款成功后,生成PDF格式的贷款合同;
用户在APP上申请贷款审批通过后会在APP上展示贷款合同,以供用户在APP上进行确认,展示的贷款合同是基于第一步定义的模板生成的,参见图4,具体的实现方式步骤为:
(1)根据用户操作的APP和业务类型,查询出步骤一中定义的具体的合同协议模板;
(2)从业务***中获取用户的贷款数据,比如,用户信息(姓名、身份证等)、贷款信息(金额、用途、期限)等,生成jason格式的数据;
(3)将(2)中获取的jason格式的数据和(1)获取的合同协议模板通过渲染得到HTML数据,供用户在APP查看和确认;
例如,将(2)中获取的jason格式的数据,替换(1)获取的合同协议模板中的变量参数,比如,把“${contractNo}”替换为对应的合同编号“11012019120700001”。
(4)当用户在APP上确认后,标记用户认同本次贷款,所以后台需要生成贷款协议,并把协议存储起来;
比如,将(3)渲染出来的HTML数据,通过wkhtmltopdf转换成PDF格式的贷款合同,并在存储***中进行存储。
步骤三、解析合同协议模板,并解析出包含变量参数的文本内容;
参见图5,具体实施步骤包括:
(1)定义解析标准,用于解析出变量参数和变量参数两侧的多个字符;
a)变量参数的标签(以下用“${}”表示)左边的标准默认最大为N个字符,当N个字符内包含${}截止,比如N=20;
b)${}右边的标准默认最大值为M个字符,当M个字符内包含标签${},就把此${}替换为“.*”字符,替换的正则表达式为:
replaceAll("\\$\\{"+"(?<=\\$\\{)(.+?)(?=\\})"+"\\}",".*");
比如,M=100。
c)通过如下正则表达式来进行解析:
Pattern.compile("(?<=\\$\\{)(.+?)(?=\\})")。
(2)把合同协议模板的格式转换为txt格式;
比如,通过wkhtmltopdf把合同协议模板的格式转换为PDF格式,然后再通过pdfbox组件将合同协议模板的格式由PDF格式转换为txt格式,并去掉文本内容中的空格和换行字符,并把内容存储到数据库中。
(3)根据(1)中定义的标准进行数据的解析,利用正则表达式来实现。把(2)中的文本内容解析出所有的包含变量参数的文本内容。
比如:合同号的变量,变量参数为:“contractNo”,左边的字符包括:“合同版本:V3.0标准版本编号:”,右边的字符包括:“签署日期:.*甲方(贷款人):马上消费金融股份有限公司乙方(借款人):.*身份证”。最终把文本中所有的变量参数和左右两边的字符在数据库中存储起来。
具体如下正则表达式来获取合同号变量参数“contractNo”:
"(?<="合同版本:V3.0标准版本编号:")(.+?)(?="签署日期:.*甲方(贷款人):马上消费金融股份有限公司乙方(借款人):.*身份证")";
步骤四、基于步骤三解析出的包含变量参数的文本内容,在PDF格式的贷款合同中进行匹配,得到变量参数和对应的变量参数值。
参见图5,将PDF格式的贷款合同,通过pdfbox组件将格式转换为文本格式,并去掉文本内容中的空格和换行字符;再利用第三步中解析出的包含变量参数的文本内容对文本内容进行正则搜索匹配,最终匹配出变量参数和对应的变量参数值。
比如,合同号变量参数左边的字符包括:“合同版本:V3.0标准版本编号:”,合同号变量参数右边的字符包括:“签署日期:.*甲方(贷款人):马上消费金融股份有限公司乙方(借款人):.*身份证”,解析出合同号“11012019120700001”,将合同号变量参数和合同号以jason格式的数据进行存储起来。
比如,{"contractNo":"11012019120700001"}。
具体可以通过以下正则表达式来获取:
“11012019120700001”:"(?<="合同版本:V3.0标准版本编号:")(.+?)(?="签署日期:.*甲方(贷款人):马上消费金融股份有限公司乙方(借款人):.*身份证")"。
步骤五、通过合同号获取账务***中相关业务参数值;
参见图6,步骤四已经解析出存储归档的PDF格式的贷款合同中的变量参数值。作为对贷款合同的质检,需要去获取真实业务的业务参数值,即需要去获取业务***(例如账务***)中获取真实数据库存储的业务参数值。最终以jason格式的数据进行存储。
比如,{"contractNo":"11012019120700001"}
步骤六、比对步骤四和步骤五中获取的变量参数和变量参数值,以及业务参数和业务参数值,比较是否一致,一致说明生成的合同贷款没问题,不一致说明存在问题。
比如,将步骤四和步骤五中解析出来的jason格式的数据,转换为Map对象,将基于步骤四获得的Map对象,与步骤五获得的Map对象对应的变量参数值进行比较。如果全部一致,则比对成功,质检完成;如果存在不一致的情况,并把不一致的数据存储和标记起来,然后进行告警,这样可以根据告警对存在问题的数据进行后续的补充。
参见图8,本发明实施例还提供一种质检文件的装置,该装置800包括:
第一获取模块801,用于获取待检文件;
第二获取模块802,用于从与所述待检文件对应的文件模板中,获取包含变量参数的文本内容;
匹配模块803,用于根据所述文本内容,在所述待检文件中匹配得到所述变量参数的变量参数值;
第三获取模块804,用于获取与所述待检文件对应业务的业务参数和业务参数值;
比对模块805,用于将所述变量参数和所述变量参数值与所述业务参数和所述业务参数值进行比对,生成所述待检文件的质检结果。
在一些实施方式中,第一获取模块801进一步用于:根据业务类型,获取对应的业务数据;根据所述业务数据、所述文件模板和用户信息,生成HTML格式的待检文件;将所述HTML格式的待检文件转换为第一格式的待检文件,所述第一格式为PDF或图片格式。
在一些实施方式中,第二获取模块802进一步用于:将所述文件模板的文件格式转换为文本格式;根据预设的正则表达式,从所述文件模板中获取文本内容,所述文本内容包括:所述变量参数和第一字符,所述第一字符包括:位于所述变量参数左边的字符和/或位于所述变量参数右边的字符。
在一些实施方式中,匹配模块803进一步用于:将所述待检文件的格式转换为文本格式;根据所述文本内容和预设的正则表达式,在所述待检文件中匹配出所述变量参数的变量参数值;将所述变量参数和所述变量参数值,以名称/值对的格式进行存储。
在一些实施方式中,第三获取模块804进一步用于:根据所述待检文件的标识,从存储服务器中获取对应业务的业务参数和对应的业务参数值;将所述业务参数和业务参数值,以名称/值对的格式进行存储。
在一些实施方式中,比对模块805进一步用于:若所述待检文件中的所有变量参数和变量参数值与存储服务器中存储的对应业务的业务参数和业务参数值一致,则生成并反馈质检结果,所述质检结果包括:所述待检文件正确。
在一些实施方式中,比对模块805还进一步用于:若所述待检文件中的变量参数和变量参数值与存储服务器中存储的对应业务的业务参数和业务参数值不一致,则生成并反馈所述待检文件的质检结果,所述质检结果包括:所述待检文件有误。
本发明实施例提供的质检文件的装置,可以执行上述图1所示方法实施例,其实现原理和技术效果类似,本实施例此处不再赘述。
请参阅图9,图9是本发明实施例提供的一种服务器的结构图,如图9所示,测试应用程序的装置900包括:处理器901、收发机902、存储器903和总线接口,其中:
在本发明的一个实施例中,测试应用程序的装置900还包括:存储在存储器上903并可在处理器901上运行的程序,程序被处理器901执行时实现如图1所示的步骤。
在图9中,总线架构可以包括任意数量的互联的总线和桥,具体由处理器901代表的一个或多个处理器和存储器903代表的存储器的各种电路链接在一起。总线架构还可以将诸如***设备、稳压器和功率管理电路等之类的各种其他电路链接在一起,这些都是本领域所公知的,因此,本文不再对其进行进一步描述。总线接口提供接口。收发机902可以是多个元件,即包括发送机和接收机,提供用于在传输介质上与各种其他装置通信的单元。
处理器901负责管理总线架构和通常的处理,存储器903可以存储处理器901在执行操作时所使用的数据。
本发明实施例提供的服务器,可以执行上述方法实施例,其实现原理和技术效果类似,本实施例此处不再赘述。
本发明实施例还提供一种可读存储介质,可读存储介质上存储有程序,该程序被处理器执行时实现上述质检文件的方法的实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。其中,所述的可读存储介质,如只读存储器(Read-OnlyMemory,简称ROM)、随机存取存储器(Random Access Memory,简称RAM)、磁碟或者光盘等。
本发明实施例提供的可读存储介质,可以执行上述方法实施例,其实现原理和技术效果类似,本实施例此处不再赘述。
本领域技术人员应该可以意识到,在上述一个或多个示例中,本发明所描述的功能可以用硬件、软件、固件或它们的任意组合来实现。当使用软件实现时,可以将这些功能存储在计算机可读介质中或者作为计算机可读介质上的一个或多个指令或代码进行传输。计算机可读介质包括计算机存储介质和通信介质,其中通信介质包括便于从一个地方向另一个地方传送程序的任何介质。存储介质可以是通用或专用计算机能存取的任何可用介质。
以上所述的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施方式而已,并不用于限定本发明的保护范围,凡在本发明的技术方案的基础之上,所做的任何修改、等同替换、改进等,均应包括在本发明的保护范围之内。
本领域内的技术人员应明白,本发明实施例可提供为方法、***、或程序产品。因此,本发明实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的程序产品的形式。
本发明实施例是参照根据本发明实施例的方法、设备(***)、和程序产品的流程图和/或方框图来描述的。应理解可由程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
显然,本领域的技术人员可以对本发明实施例进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明实施例的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。
Claims (9)
1.一种质检文件的方法,其特征在于,包括:
获取待检文件;
从与所述待检文件对应的文件模板中,获取包含变量参数的文本内容;
根据所述文本内容,在所述待检文件中匹配得到所述变量参数的变量参数值;
获取与所述待检文件对应业务的业务参数和业务参数值;
将所述变量参数和所述变量参数值与所述业务参数和所述业务参数值进行比对,生成所述待检文件的质检结果;
所述从与所述待检文件对应的文件模板中,获取包含变量参数的文本内容,包括:
将所述文件模板的文件格式转换为文本格式;
根据预设的正则表达式,从所述文件模板中获取文本内容,所述文本内容包括:所述变量参数和第一字符,所述第一字符包括:位于所述变量参数左边的字符和/或位于所述变量参数右边的字符。
2.根据权利要求1所述的方法,其特征在于,所述获取待检文件,包括:
根据业务类型,获取对应的业务数据;
根据所述业务数据、所述文件模板和用户信息,生成超文本标记语言HTML格式的待检文件;
将所述HTML格式的待检文件转换为第一格式的待检文件,所述第一格式为便携式文档格式PDF或图片格式。
3.根据权利要求1所述的方法,其特征在于,所述根据所述文本内容,在所述待检文件中匹配得到所述变量参数的变量参数值,包括:
将所述待检文件的格式转换为文本格式;
根据所述文本内容和预设的正则表达式,在所述待检文件中匹配得到所述变量参数的变量参数值;
将所述变量参数和所述变量参数值,以名称/值对的格式进行存储;
其中,所述文本内容包括:所述变量参数和第一字符,所述第一字符包括:位于所述变量参数左边的字符和/或位于所述变量参数右边的字符。
4.根据权利要求1所述的方法,其特征在于,所述获取与所述待检文件对应业务的业务参数和业务参数值,包括:
从存储服务器中获取与所述待检文件的标识对应的业务的业务参数和对应的业务参数值;
保存所述业务参数和业务参数值。
5.根据权利要求1所述的方法,其特征在于,所述将所述变量参数和所述变量参数值与所述业务参数和所述业务参数值进行比对,生成所述待检文件的质检结果,包括:
若所述待检文件中的所有变量参数和变量参数值与存储服务器中存储的对应业务的业务参数和业务参数值一致,则生成并反馈质检结果,所述质检结果包括:所述待检文件正确。
6.根据权利要求5所述的方法,其特征在于,所述方法还包括:
若所述待检文件中的变量参数和变量参数值与存储服务器中存储的对应业务的业务参数和业务参数值不一致,则生成并反馈所述待检文件的质检结果,所述质检结果包括:所述待检文件有误。
7.一种质检文件的装置,其特征在于,包括:
第一获取模块,用于获取待检文件;
第二获取模块,用于从与所述待检文件对应的文件模板中,获取包含变量参数的文本内容;
匹配模块,用于根据所述文本内容,在所述待检文件中匹配得到所述变量参数的变量参数值;
第三获取模块,用于获取与所述待检文件对应业务的业务参数和业务参数值;
比对模块,用于将所述变量参数和所述变量参数值与所述业务参数和所述业务参数值进行比对,生成所述待检文件的质检结果;
所述第二获取模块进一步用于:将所述文件模板的文件格式转换为文本格式;根据预设的正则表达式,从所述文件模板中获取文本内容,所述文本内容包括:所述变量参数和第一字符,所述第一字符包括:位于所述变量参数左边的字符和/或位于所述变量参数右边的字符。
8.一种服务器,其特征在于,包括:处理器、存储器及存储在所述存储器上并可在所述处理器上运行的程序,所述程序被所述处理器执行时实现包括如权利要求1至6中任一项所述的质检文件的方法的步骤。
9.一种可读存储介质,其特征在于,所述可读存储介质上存储有程序,所述程序被处理器执行时实现包括如权利要求1至6中任一项所述的质检文件的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010448777.XA CN111882419B (zh) | 2020-05-25 | 2020-05-25 | 质检文件的方法、装置及服务器 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010448777.XA CN111882419B (zh) | 2020-05-25 | 2020-05-25 | 质检文件的方法、装置及服务器 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111882419A CN111882419A (zh) | 2020-11-03 |
CN111882419B true CN111882419B (zh) | 2022-02-08 |
Family
ID=73154100
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010448777.XA Active CN111882419B (zh) | 2020-05-25 | 2020-05-25 | 质检文件的方法、装置及服务器 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111882419B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113723059B (zh) * | 2021-07-29 | 2024-07-05 | 微易签(杭州)科技有限公司 | 一种基于区块链将html转换成pdf的方法和*** |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109033058A (zh) * | 2018-08-14 | 2018-12-18 | 深圳壹账通智能科技有限公司 | 合同文本验证方法、装置、计算机设备和存储介质 |
CN109325729A (zh) * | 2018-08-21 | 2019-02-12 | 平安科技(深圳)有限公司 | 一种生成电子合同的方法及服务器 |
CN109710902A (zh) * | 2018-08-17 | 2019-05-03 | 深圳壹账通智能科技有限公司 | Pdf文档的生成方法、装置、设备及计算机可读存储介质 |
CN109711972A (zh) * | 2018-08-20 | 2019-05-03 | 平安普惠企业管理有限公司 | 合同生成方法、装置、设备及可读存储介质 |
CN110738038A (zh) * | 2019-10-23 | 2020-01-31 | 泰康保险集团股份有限公司 | 合同文本的生成方法、装置、设备及计算机可读存储介质 |
CN110765770A (zh) * | 2019-09-04 | 2020-02-07 | 平安科技(深圳)有限公司 | 一种合同自动生成方法及装置 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106980605B (zh) * | 2017-02-17 | 2018-01-19 | 平安科技(深圳)有限公司 | 合同生成方法和装置 |
-
2020
- 2020-05-25 CN CN202010448777.XA patent/CN111882419B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109033058A (zh) * | 2018-08-14 | 2018-12-18 | 深圳壹账通智能科技有限公司 | 合同文本验证方法、装置、计算机设备和存储介质 |
CN109710902A (zh) * | 2018-08-17 | 2019-05-03 | 深圳壹账通智能科技有限公司 | Pdf文档的生成方法、装置、设备及计算机可读存储介质 |
CN109711972A (zh) * | 2018-08-20 | 2019-05-03 | 平安普惠企业管理有限公司 | 合同生成方法、装置、设备及可读存储介质 |
CN109325729A (zh) * | 2018-08-21 | 2019-02-12 | 平安科技(深圳)有限公司 | 一种生成电子合同的方法及服务器 |
CN110765770A (zh) * | 2019-09-04 | 2020-02-07 | 平安科技(深圳)有限公司 | 一种合同自动生成方法及装置 |
CN110738038A (zh) * | 2019-10-23 | 2020-01-31 | 泰康保险集团股份有限公司 | 合同文本的生成方法、装置、设备及计算机可读存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN111882419A (zh) | 2020-11-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20180018322A1 (en) | System and method for automatically understanding lines of compliance forms through natural language patterns | |
CN111680634B (zh) | 公文文件处理方法、装置、计算机设备及存储介质 | |
CN114424257A (zh) | 使用机器学习对表格数据进行自动描绘和提取 | |
CN109685668B (zh) | 订单批量处理方法、装置、计算机设备及存储介质 | |
CN110727580A (zh) | 响应数据生成、全流程接口数据处理方法及相关设备 | |
CN111985202A (zh) | 基于模板生成pdf电子签章的方法、设备及存储介质 | |
CN110347984B (zh) | 保单页面变更方法、装置、计算机设备及存储介质 | |
CN110795697A (zh) | 逻辑表达式的获取方法、装置、存储介质以及电子装置 | |
CN110688830A (zh) | 征信模板的转换方法及装置 | |
CN111435367A (zh) | 知识图谱的构建方法、***、设备及存储介质 | |
CN110688823B (zh) | Xml文件验证方法及装置 | |
CN112115107A (zh) | 合同文本自动生成方法及装置 | |
CN111882419B (zh) | 质检文件的方法、装置及服务器 | |
CN114386853A (zh) | 基于通用审核模型的数据审核处理方法、装置及设备 | |
CN114003692A (zh) | 合同文本信息的处理方法、装置、计算机设备及存储介质 | |
CN113723063A (zh) | 一种rtf转html并在pdf文件实现效果的方法 | |
CN110633258B (zh) | 日志***方法、装置、计算机装置及存储介质 | |
CN111581937A (zh) | 文档生成方法、装置、计算机可读介质及电子设备 | |
Logan et al. | Documents are an essential part of model based systems engineering | |
US12033414B2 (en) | Document readability enhancements | |
CN115544973A (zh) | 文档生成方法、装置、电子设备及存储介质 | |
CN113296785A (zh) | 文档生成方法、***、设备及可读存储介质 | |
CN111783391B (zh) | 一种在线人工文本标记***及方法 | |
CN111652272B (zh) | 图像处理方法及装置、计算机设备、存储介质 | |
CN111950248A (zh) | 基于xml的产品报告生成方法及*** |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |