CN111985201B - 一种数据处理规则生成方法、装置及电子设备 - Google Patents
一种数据处理规则生成方法、装置及电子设备 Download PDFInfo
- Publication number
- CN111985201B CN111985201B CN202010841096.XA CN202010841096A CN111985201B CN 111985201 B CN111985201 B CN 111985201B CN 202010841096 A CN202010841096 A CN 202010841096A CN 111985201 B CN111985201 B CN 111985201B
- Authority
- CN
- China
- Prior art keywords
- cells
- preset
- information corresponding
- index
- data processing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000012545 processing Methods 0.000 title claims abstract description 115
- 238000000034 method Methods 0.000 title claims abstract description 86
- 238000000605 extraction Methods 0.000 claims abstract description 27
- 238000004364 calculation method Methods 0.000 claims description 30
- 238000004458 analytical method Methods 0.000 claims description 25
- 238000004590 computer program Methods 0.000 claims description 16
- 238000007689 inspection Methods 0.000 abstract 1
- 210000004027 cell Anatomy 0.000 description 215
- 238000012550 audit Methods 0.000 description 27
- 230000008569 process Effects 0.000 description 13
- 238000010586 diagram Methods 0.000 description 12
- 230000006870 function Effects 0.000 description 8
- 230000006872 improvement Effects 0.000 description 8
- 238000005516 engineering process Methods 0.000 description 6
- 238000004519 manufacturing process Methods 0.000 description 6
- 230000009286 beneficial effect Effects 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 238000012544 monitoring process Methods 0.000 description 3
- 238000009825 accumulation Methods 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000007726 management method Methods 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 238000005065 mining Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000008520 organization Effects 0.000 description 2
- 230000000750 progressive effect Effects 0.000 description 2
- 230000001105 regulatory effect Effects 0.000 description 2
- 238000012795 verification Methods 0.000 description 2
- 210000000677 aggregate cell Anatomy 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000013524 data verification Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 230000005055 memory storage Effects 0.000 description 1
- 229920001296 polysiloxane Polymers 0.000 description 1
- 239000010979 ruby Substances 0.000 description 1
- 229910001750 ruby Inorganic materials 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 238000011144 upstream manufacturing Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/166—Editing, e.g. inserting or deleting
- G06F40/186—Templates
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2455—Query execution
- G06F16/24564—Applying rules; Deductive queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/335—Filtering based on additional data, e.g. user or group profiles
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/166—Editing, e.g. inserting or deleting
- G06F40/177—Editing, e.g. inserting or deleting of tables; using ruled lines
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本说明书实施例提供一种数据处理规则生成方法、装置及电子设备。所述方法包括:获取一个或多个目标报表,对所述目标报表执行信息提取操作,得到所述目标报表中的单元格所对应的表头信息以及所述表头信息对应的文本信息;确定所述单元格的表头所对应的文本信息中的关键字符,将所述关键字符与预设的数据处理规则生成策略所包含的信息进行匹配;确定成功匹配的关键字符所对应的文本信息以及该文本信息所对应的表头,根据所述数据处理规则生成策略建立该表头所属单元格之间的关联关系,并将所述单元格之间的关联关系作为生成的数据处理规则。本技术方案可以应用于监管领域,利用生成的数据处理规则可进一步实现对目标报表的合规检查。
Description
技术领域
本说明书涉及计算机技术领域,尤其涉及一种数据处理规则生成方法、装置及电子设备。
背景技术
随着网络和信息化技术的快速发展,各行各业对业务经营过程中所产生的数据进行管理和监督的需求越来越明显,报表是一种常用的对业务数据或经营数据进行收集、汇总的数据展示形式。由于同一报表内或不同报表之间的数据往往存在一些相关性,通过对这种相关关系进行深入挖掘生产出一定的规则,并利用这些规则对其他报表进行数据核验,从而能够发现报表中存在的一些问题,避免出现错报。
现有技术中,通过采取人工对报表数据进行梳理的方式来发现报表数据间的数据处理规则,然后再对发现的数据处理规则进行人工验证。但是,由于报表的数据量往往比较大,不同报表之间的指标也不相同,因此通过人工方式生产数据处理规则的方式效率较低,更无法深入地推导出准确的规则,且生产出来的规则的可信度和有效性都比较差。
发明内容
本说明书实施例提供一种数据处理规则生成方法、装置及电子设备,以解决现有技术存在的数据处理规则生成效率较低,无法生成准确性高的数据处理规则,导致数据处理规则的可信度和有效性比较差的问题。
为解决上述技术问题,本说明书实施例是这样实现的:
第一方面,本说明书实施例提供的一种数据处理规则生成方法,所述方法包括:
获取一个或多个目标报表,其中,所述目标报表为预定的目标报表模板所对应的样表或者对所述目标报表模板进行数据填写后生成的报表;
对所述目标报表执行信息提取操作,得到所述目标报表中的单元格所对应的表头信息以及所述表头信息对应的文本信息;
确定所述单元格的表头所对应的文本信息中的关键字符,将所述关键字符与预设的数据处理规则生成策略所包含的信息进行匹配;
确定成功匹配的关键字符所对应的文本信息以及所述成功匹配的关键字符所对应的文本信息的表头,根据所述数据处理规则生成策略建立所述成功匹配的关键字符所对应的文本信息的表头所属单元格之间的关联关系,并将所述单元格之间的关联关系作为生成的数据处理规则。
第二方面,本说明书实施例提供的一种数据处理规则生成方法,所述方法包括:
获取一个或多个目标报表,其中,所述目标报表包括根据预定的目标报表模板进行数据填写且已完成上报的报表;
对所述目标报表执行信息提取操作,得到所述目标报表中预定单元格内所填写的数据信息以及所述预定单元格所对应的表头信息;
根据预设的数据处理规则生成策略对所述预定单元格所对应的数据信息执行比对或计算操作;
根据所述比对或计算操作的结果以及所述预定单元格对应的表头信息,建立所述预定单元格之间的关联关系,并将所述预定单元格之间的关联关系作为生成的数据处理规则。
第三方面,本说明书实施例提供的一种数据处理规则生成方法,所述方法包括:
获取多个目标报表,其中,所述目标报表包括根据预定的目标报表模板和指标库进行数据填写后得到的报表;
对所述目标报表执行信息提取操作,得到所述目标报表中预定单元格所对应的指标信息和表头信息;
根据预设的数据处理规则生成策略对所述预定单元格所对应的指标信息进行分析,得到指标分析的结果;
根据对所述指标分析的结果以及所述预定单元格对应的表头信息,建立所述预定单元格之间的关联关系,并将所述预定单元格之间的关联关系作为生成的数据处理规则。
第四方面,本说明书实施例提供的一种数据处理规则生成装置,所述装置包括:
获取模块,用于获取一个或多个目标报表,其中,所述目标报表包括预定的目标报表模板所对应的样表和/或根据所述目标报表模板已填写好数据的报表;
提取模块,用于对所述目标报表执行信息提取操作,得到所述目标报表中的单元格所对应的表头信息以及所述表头信息对应的文本信息;
匹配模块,用于确定所述单元格的表头所对应的文本信息中的关键字符,将所述关键字符与预设的数据处理规则生成策略所包含的信息进行匹配;
关联模块,用于确定成功匹配的关键字符所对应的文本信息以及所述文本信息所对应的表头信息,根据所述数据处理规则生成策略建立该表头信息所属单元格之间的关联关系,并将所述单元格之间的关联关系作为生成的数据处理规则。
第五方面,本说明书实施例提供的一种数据处理规则生成装置,所述装置包括:
获取模块,用于获取一个或多个目标报表,其中,所述目标报表包括根据预定的目标报表模板进行数据填写且已完成上报的报表;
提取模块,用于对所述目标报表执行信息提取操作,得到所述目标报表中预定单元格内所填写的数据信息以及所述预定单元格所对应的表头信息;
比对计算模块,用于根据预设的数据处理规则生成策略对所述预定单元格所对应的数据信息执行比对或计算操作;
关联模块,用于根据所述比对或计算操作的结果以及所述预定单元格对应的表头信息,建立所述预定单元格之间的关联关系,并将所述预定单元格之间的关联关系作为生成的数据处理规则。
第六方面,本说明书实施例提供的一种数据处理规则生成装置,所述装置包括:
获取模块,用于获取多个目标报表,其中,所述目标报表包括根据预定的目标报表模板和指标库进行数据填写后得到的报表;
提取模块,用于对所述目标报表执行信息提取操作,得到所述目标报表中预定单元格所对应的指标信息和表头信息;
指标分析模块,用于根据预设的数据处理规则生成策略对所述预定单元格所对应的指标信息进行分析,得到指标分析的结果;
关联模块,用于根据对所述指标分析的结果以及所述预定单元格对应的表头信息,建立所述预定单元格之间的关联关系,并将所述预定单元格之间的关联关系作为生成的数据处理规则。
第七方面,本说明书实施例提供的一种电子设备,包括存储器,处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述第一方面中的一种数据处理规则生成方法。
第八方面,本说明书实施例提供的一种电子设备,包括存储器,处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述第二方面中的一种数据处理规则生成方法。
第九方面,本说明书实施例提供的一种电子设备,包括存储器,处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述第三方面中的一种数据处理规则生成方法。
本说明书实施例采用的上述至少一个技术方案能够达到以下有益效果:
通过获取一个或多个目标报表,其中,所述目标报表为预定的目标报表模板所对应的样表或者对所述目标报表模板进行数据填写后生成的报表;对所述目标报表执行信息提取操作,得到所述目标报表中的单元格所对应的表头信息以及所述表头信息对应的文本信息;确定所述单元格的表头所对应的文本信息中的关键字符,将所述关键字符与预设的数据处理规则生成策略所包含的信息进行匹配;确定成功匹配的关键字符所对应的文本信息以及所述成功匹配的关键字符所对应的文本信息的表头,根据所述数据处理规则生成策略建立所述成功匹配的关键字符所对应的文本信息的表头所属单元格之间的关联关系,并将所述单元格之间的关联关系作为生成的数据处理规则。基于本方案,通过提取目标报表中单元格所对应的表头和表头的文本描述信息,进而根据文本描述信息中的关键字符与数据处理规则生成策略的信息进行匹配,当成功匹配时即可根据数据处理规则生成策略自动建立单元格之间的关联关系,因此,通过平台自动化推导目标报表中单元格之间的勾稽关系,提高了规则生成效率,可以更加准确、便捷地生产出数据处理规则,并且提升了数据处理规则的可信度和有效性。
附图说明
为了更清楚地说明本说明书实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本说明书中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本说明书实施例一提供的一种数据处理规则生成方法的流程示意图;
图2为本说明书实施例二提供的一种数据处理规则生成方法的流程示意图;
图3为本说明书实施例三提供的一种数据处理规则生成方法的流程示意图;
图4为本说明书实施例提供的一种数据处理规则生成装置的结构示意图;
图5为本说明书实施例提供的另一种数据处理规则生成装置的结构示意图;
图6为本说明书实施例提供的另一种数据处理规则生成装置的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本说明书中的技术方案,下面将结合本说明书实施例中的附图,对本说明书实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本说明书实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
如前文所述,各行各业都有对业务经营过程中所产生的数据进行管理和监督的需求,通过对报表中的数据加以分析和挖掘有助于发现数据之间的关系规则,通过这种关系规则能够实现对其他报表的校验,从而发现其中存在的一些问题。下面以金融监管领域为例,对金融监管领域中报表的数据处理规则生产过程中存在的问题以及原因进行详细介绍,具体内容如下:
按照我国监管部门(如银监会、***、国家外汇管理局、中国人民银行等)对金融机构监管的相关要求,外部银行等机构的各种业务应用***需要定期或非定期的向各个监管机构主动上报监管数据,其中用于业务数据采集及对口报送的***称之为监管报送***。近年来随着监管当局对于金融机构的监管力度越来越大,各类监管单位都在持续不断地完善原有的监管体系,因此对于监管数据的报送也提出了更高的要求。
为了保障上报到监管机构的数据的一致性及准确性,避免受到合规处罚,保障各类业务顺利开展,需要利用生产出来的稽核规则对监管数据进行核验。现有的稽核规则生产过程中,采用人工方式对监管报表数据进行梳理,从而发现其中可能存在的数据关系规则,然后再对发现的数据关系规则进行验证。但是,由于监管报表数据总量较大,不同报表之间的指标也不相同,因此通过人工方式生产稽核规则的方式效率较低,更无法深入地推导出准确的稽核规则,且生产出来的稽核规则的可信度和有效性都比较差。
基于现有技术,需要提供一种高效、便捷、准确的稽核规则生成方法,从而能够达到提高稽核规则的可信度和有效性的技术效果。
基于上述背景,首先对本方案的应用场景进行以下说明,由于本说明书技术方案是以监管领域中的报表数据的处理规则生产过程为例进行展开说明的,因此,以下实施例中数据处理规则也可以认为是一种稽核规则,目标报表则可以认为是监管报表,名词上的变换只是为了便于对具体实施例进行描述,不构成对本方案应用场景的限定,本技术方案不限于金融监管领域,其他涉及对报表数据的勾稽关系进行推导和生成的技术场景都可能适用于本方案。
由于监管数据上报存在多种不同的渠道,例如:邮件报送、C/S客户端报送、网页报送、线下邮寄等,负责监管数据报送的操作人员可以根据实际需求选择相应的报送渠道将监管数据上报给监管机构。当监管数据上报负责人在将监管数据上报到监管后,可以由统一报送平台对各个渠道报送的监管数据进行收集并存储,本技术方案正是由应用在统一报送平台中的稽核规则自动生产装置执行技术方案的方法来实现的。
基于上述场景,下面对本说明书的方案进行详细说明。
实施例一
图1为本说明书实施例一提供的一种数据处理规则生成方法的流程示意图,该方法具体可以包括以下步骤:
在步骤S110中,获取一个或多个目标报表,其中,所述目标报表为预定的目标报表模板所对应的样表或者对所述目标报表模板进行数据填写后生成的报表。
在本说明书一个或多个实施例中,监管报表可以认为是金融机构向监管机构所报送的以表格作为数据载体的数据报表,监管报表既可以是采用excel格式的表格,也可以是其他的将单元格按照行列排列形成的表格,本说明书实施例不对监管报表的形式做具体限定。
在实际应用中,本说明书实施例一中所获取的监管报表,可以包括由监管机构所下发的监管报表模板的样表,也可以称之为表样,所谓表样是指监管机构根据监管要求所生成的包含指标等内容的表格模板,表样中需要由金融机构来填写数据的单元格既可以是空白单元格,也可以填写数值为零,金融机构根据自身的企业经营数据在空白单元格或者数值为零的单元格中根据指标的内容填写数值。
需要说明的是,本说明书实施例中所获取的监管报表可以包括以下类型的报表:同一期上报的同一监管报表,同一期上报的不同监管报表,不同期上报的同一监管报表,不同期上报的不同监管报表等等。所谓的同期或不同期是指金融机构按照监管报送周期上报数据的时间,例如金融机构可以每个月上报一次,也可以每个季度上报一次。
在步骤S120中,对所述目标报表执行信息提取操作,得到所述目标报表中的单元格所对应的表头信息以及所述表头信息对应的文本信息。
在本说明书一个或多个实施例中,在获取监管报表之后,可以对监管报表中各个单元格的信息进行提取,得到每个单元格所对应的表头信息和表头信息对应的文本信息。
在实际应用中,单元格的表头信息可以认为是单元格在监管报表中的坐标位置,即单元格位于监管报表中的哪一列和哪一行,因此,表头信息中可以包含所述单元格所对应的行头信息和列头信息。例如,在一具体实施例中,监管报表中的单元格D6就表示了该单元格位于表格中的D列和第6行,D表示列头,6表示行头。
表头信息对应的文本信息可以认为是单元格的表头所对应的文本描述信息,例如,在一具体实施例中,D列描述的是该列为本期数值,E列描述的是该列为上期数值,第6行描述的是资产类总计金额。
进一步地,在本说明书实施例中,在将监管报表中的数据按照行列的形式提取出来之后,可以将所有单元格的行列数据以及文本数据存储在统一报送平台中,以便于统一报送平台进一步地对这些数据进行分析发现单元格的数据之间可能存在的勾稽关系。
在步骤S130中,确定所述单元格的表头所对应的文本信息中的关键字符,将所述关键字符与预设的数据处理规则生成策略所包含的信息进行匹配。
在本说明书一个或多个实施例中,在提取了单元格对应的表头以及表头的文本描述信息之后,可以通过表头的文本描述信息中的关键字与预设的稽核规则生成策略所包含的信息进行匹配,从而发现表头所对应单元格之间的某种联系。
具体地,在本说明书实施例中,所述单元格包括待填写数据的空白单元格,可以采用以下方式确定所述单元格的表头所对应的文本信息中的关键字符,具体包括以下内容:
根据空白单元格所对应的行和列,确定行和列分别对应的文本描述信息,并根据预先设置的关键字符与文本描述信息进行匹配,确定文本描述信息中所包含的关键字符。
下面结合一具体实施例对关键字符进行说明,例如:报表中D6单元格为需要填写数值的空白单元格,D6单元格所对应的列头(即D列)的文本描述信息为本期,那么就可以将“本期”作为关键字,利用关键字作为搜索条件,在预设的稽核规则生成策略的信息中去搜索或匹配相同的字符。
进一步地,在本说明书实施例中,可以预先设置稽核规则生成策略,稽核规则生成策略可以是根据监管报表内部各单元格的行和列分别对应的文本描述信息,预先建立的单元格自身以及若干个单元格之间的稽核规则生成策略。在实际应用中,可以预先设置以下稽核规则生成策略:
1)上期单元格=上期报表中本期单元格;
2)本年累计单元格=本年所有报表的本期单元格汇总;
3)本年累计单元格=上期报表中本年累计+本期单元格;
4)年初单元格=本年第一期的当期单元格;
5)其中单元格:总计≥其中;
6)合计单元格=当期列和;
7)同比单元格=本期单元格&上年单元格计算;
8)环比单元格=本期单元格&上期单元格计算;
9)笔数、人员等信息单元格≥0;
10)身份证、邮箱、手机号、统一社会信用代码等信息符合满足对应格式。
上述所列举1-10的稽核规则生成策略是根据实际应用场景所配置的生成策略,在实际应用中,可根据不同类型以及不同指标的报表自定义生成策略,以适用于不同报表的稽核规则的生产。
继续前述实施例的内容进行描述,例如D6单元格中的列头对应的文本描述信息为本期,那么以本期作为关键字与上述稽核规则生成策略进行匹配,如本期在上述第一个稽核规则生成策略中出现,那么就可以认为是命中了该稽核规则生成策略,进一步根据该稽核规则生成策略可以发现,上期的本期单元格(即上一期所报送的监管报表中的当期单元格)应该与当期的上期单元格具备相等的关系。因此,就可以认为这两个单元格之间存在符合上述策略的稽核规则。
在步骤S140中,确定成功匹配的关键字符所对应的文本信息以及所述成功匹配的关键字符所对应的文本信息的表头,根据所述数据处理规则生成策略建立所述成功匹配的关键字符所对应的文本信息的表头所属单元格之间的关联关系,并将所述单元格之间的关联关系作为生成的数据处理规则。
在本说明书一个或多个实施例中,当关键字符成功命中某个稽核规则生成策略之后,可以根据稽核规则生成策略中对应行和列的文本描述信息,以及成功匹配的文本信息所对应的行和列,建立行和列所对应单元格之间的关联关系;其中,所述行和列用于表示所述单元格在监管报表中的坐标。
下面结合一具体实施例对建立关联关系的过程进行说明,继续前述实施例中的内容,例如当D6单元格中的列头对应的文本描述信息的关键字与某个稽核规则生成策略(如上述第一种策略)匹配成功了,那么就可以根据该稽核规则生成策略中的信息所对应的单元格建立这些单元格之间的关联关系,比如匹配成功的稽核规则生成策略为上期单元格=上期报表中本期单元格,假设本期单元格对应的列头为D,上期单元格对应的列头为E,而报表中同一行的指标是相同的,因此就可以建立以下单元格之间的关联关系:E6=上期报表的D6,E7=上期报表的D7,E8=上期报表的D8……。
通过本说明书实施一的技术方案,根据表样中的文本描述信息中的关键字与稽核规则生成策略进行匹配,并根据匹配成功的稽核规则生成策略推导出单元格之间的勾稽关系,从而生成相应的稽核规则。这种通过对表样的文本描述信息进行计算推导出稽核规则的方式可以无需借助真实填写的经营数据和业务数据的监管报表,并且生成的稽核规则的准确性较高。
实施例二
图2为本说明书实施例二提供的一种数据处理规则生成方法的流程示意图,该方法具体可以包括以下步骤:
在步骤S210中,获取一个或多个目标报表,其中,所述目标报表包括根据预定的目标报表模板进行数据填写且已完成上报的报表。
在本说明书一个或多个实施例中,实施例二中获取监管报表的过程与实施例一获取监管报表的具体执行过程相似,在此不再详细描述。需要说明的是,在实施例二中,监管报表可以是金融机构在获取监管机构下发的监管数据填写模板后,根据表样中对填写数据内容的描述进行数据填写之后,并且由监管报送客户端上报到监管机构之后的报表,也就是说,这些报表可以认为是历史监管报表。
在步骤S220中,对所述目标报表执行信息提取操作,得到所述目标报表中预定单元格内所填写的数据信息以及所述预定单元格所对应的表头信息。
在本说明书一个或多个实施例中,在获取监管报表之后,可以对监管报表中各个预定单元格的信息进行提取,得到每个预定单元格内已填写并上报过的数据信息(即每个单元格中所填写的具体监管数据对应的数值)和预定单元格所对应的表头。
在实际应用中,上述预定单元格可以认为是监管报表中用于金融机构填写数据的单元格,即可以认为相当于未填写数据前的监管报表模板中对应的空白单元格。通过对所述监管报表中各个预定单元格的信息进行提取,可以得到预定单元格内所填写的数据信息以及预定单元格所对应的表头信息。
数据信息包含根据监管报表模板所填写的业务数据,即预定单元格内的数据信息可以认为是金融机构按照监管报表模板中行列的文字描述信息所填写的符合内容要求的数据,例如D列对应的文字描述为本期,第6行对应的文字描述为资产类总计,那么D6单元所包含的数据信息就是实际填写的本期资产类总计金额。所述表头信息可以认为是所述预定单元格所对应的行头信息和列头信息。
在步骤S230中,根据预设的数据处理规则生成策略对所述预定单元格所对应的数据信息执行比对或计算操作。
在本说明书一个或多个实施例中,所述预设的稽核规则生成策略可以包括比对策略和计算策略,在实际应用中,可以采用以下方式根据预设的稽核规则生成策略对所述预定单元格所对应的数据信息执行比对或计算操作,具体包括以下内容:
根据所述比对策略将每个预定单元格所对应的数据信息与同一监管报表或不同监管报表中的其他预定单元格所对应的数据信息分别进行比对;
或者,
根据所述计算策略将每个预定单元格所对应的数据信息与同一监管报表或不同监管报表中的其他预定单元格所对应的数据信息分别进行计算,和/或,将每个预定单元格所对应的数据信息与同一监管报表或不同监管报表中的至少两个其他预定单元格所对应的数据信息一起进行计算。
下面结合一具体实施例对上述两种不同的策略进行说明,具体内容如下:
比对策略可以包括等值策略,所谓等值策略是指根据历史报表中的单元格中的数据信息与任意监管报表中的所有其他单元格的数据信息进行一一比对,从而发现存在等值关系的数据。例如,通过比对发现,某期报表中的单元格D6中的数据与其他期报表中的单元格E6中的数据相等,那么单元格D6与E6之间便存在等值关系,在实际应用中,存在等值关系的相同期数越多,那么稽核规则的可信概率越大。
计算策略可以包括但不限于以下策略:倍数策略、加和策略、恒值策略、趋势策略、区间策略等。其中,
倍数策略可以认为是根据某一个单元格的数据信息与其他单元格(可以是同期不同表或者不同期不同表)的数据信息进行倍数关系的计算寻找,从而发现具有倍数关系的所有单元格。
加和策略可以认为是在同表同期中搜索当期同一张表所有单元格数据之间的加和关系,例如对单元格执行以下加和关系的寻找:A=B+C、A=B+C+D等;也可以是在跨表同期中搜索当期所有表的所有单元格数据之间的加和关系例如对单元格执行以下加和关系的寻找:A=B+C等。
恒值策略可以认为是在不同的报表中某个单元格的期值恒定为某个值,比如某个单元格的行头描述为“最高利率”,经过计算查询发现同期不同表或跨期不同表中该单元格的值恒定为12%。
趋势策略可以认为是某个单元格的数据存在递增或递减的趋势。
区间策略可以认为是某个单元格的数据一直处于某个区间数值中。
计算策略还可以包括某个单元格一直满足身份证、邮箱、手机号或者统一社会信用代码的格式的策略。
在步骤S240中,根据所述比对或计算操作的结果以及所述预定单元格对应的表头信息,建立所述预定单元格之间的关联关系,并将所述预定单元格之间的关联关系作为生成的数据处理规则。
在本说明书一个或多个实施例中,根据上述列举的稽核规则生成策略对预定单元格的数据信息执行比对或计算操作后,可以根据所述比对或计算操作的结果确定所述预定单元格与至少一个其他预定单元格之间的关联关系,从而根据具有关联关系的预定单元格,建立所述预定单元格的表头信息之间的关联关系。
在实际应用中,经过执行上述比对和计算操作后,便可以寻找出单元格之间存在的各种勾稽关系,例如,单元格之间的等值关系、倍数关系、加和关系等。根据上述策略所推导出的单元格之间的关联关系,便可以建立出这些单元格所对应表头之间的稽核规则,即通过单元格对应的坐标具体表示这些稽核规则,比如:D6=E6=F6等。
通过本说明书实施二的技术方案,根据统一报送平台中已上报的监管报表的单元格数据,通过将单元格的数据与数据之间进行比对和计算,从而根据稽核规则生成策略推导出单元格之间的勾稽关系,并生成相应的稽核规则。与实施例一不同的是,这种通过历史监管报表中的数据推导出稽核规则的方式依赖于根据历史经营数据填写的监管报表,但是同样可以提升稽核规则的准确性。
实施例三
图3为本说明书实施例三提供的一种数据处理规则生成方法的流程示意图,该方法具体可以包括以下步骤:
在步骤S310中,获取多个目标报表,其中,所述目标报表包括根据预定的目标报表模板和指标库进行数据填写后得到的报表。
在本说明书一个或多个实施例中,本实施例中的监管报表是通过以下方式得到的,在实际应用中,可以在统一报送平台中预设指标库,指标库中维护有业务经营时产生的运行数据,因此,当统一报送平台获取监管报表模板后,可以通过对监管报表模板中的描述信息进行分析,判断哪些单元格的数值可以从指标库中直接获取,对于存在于指标库中的数据,可以直接从指标库中自动获取并填写到表样中。
在步骤S320中,对所述目标报表执行信息提取操作,得到所述目标报表中预定单元格所对应的指标信息和表头信息。
在本说明书一个或多个实施例中,对于通过指标库获取数据并自动进行填写所生成的监管报表,在获取到这些监管报表后,可以对监管报表中各个预定单元格的信息进行提取,得到每个预定单元格对应的指标信息和表头信息。
在实际应用中,所述预定单元格包括用于填写数据的单元格,可以采用以下方式对所述监管报表执行信息提取操作,得到所述监管报表中预定单元格所对应的指标信息和表头信息,具体包括以下内容:
当从指标库中获取用于填写预定单元格的数据信息时,确定数据信息所对应的指标库中的指标以及与指标相关的指标信息,并建立预定单元格与指标信息之间的对应关系;
当对监管报表中各个预定单元格的信息进行提取时,根据对应关系确定预定单元格所对应的指标信息,并确定预定单元格所对应的表头信息;其中,表头信息包含预定单元格所对应的行头信息和列头信息。
在步骤S330中,根据预设的数据处理规则生成策略对所述预定单元格所对应的指标信息进行分析,得到指标分析的结果。
在本说明书一个或多个实施例中,当所述指标信息中包含指标标识时,可以采用以下方式根据预设的稽核规则生成策略对所述预定单元格所对应的指标信息进行分析,得到指标分析的结果,具体包括以下内容:
将每个所述预定单元格所对应的指标标识与不同监管报表中的其他预定单元格所对应的指标标识分别进行比对分析,确定所述指标标识相同的多个预定单元格。
具体地,在本说明书实施例中,指标标识可以包括指标编号或者指标名称等,由于单元格中所填写的数据是从指标库中获取的,而通过指标库获取数据并自动填写到监管数据模板中时,会建立所填写数据的单元格与获取数据的指标库中的指标标识之间的对应关系,因此通过将不同单元格所对应的指标标识分别进行比对,就可以判断哪些单元格是从同一指标库中的同一指标中获取的数据,从而基于这种具有相同指标标识的策略推导出具有勾稽关系的单元格。
在本说明书一个或多个实施例中,当所述指标信息中还包含总指标以及总指标对应的指标维度时,可以采用以下方式根据预设的稽核规则生成策略对所述预定单元格所对应的指标信息进行分析,得到指标分析的结果,具体包括以下内容:
当通过比对分析多个预定单元格属于同一总指标所对应的单元格时,判断预定单元格分别对应所述总指标下的不同指标维度,根据总指标以及指标维度确定多个预定单元格之间的关联关系。
具体地,在本说明书实施例中,还可以根据同一总指标下的不同指标维度来推导出单元格之间的勾稽关系,当不同报表中的单元格数据之间具有这种指标维度的关系时,便可以对这些单元格建立稽核规则。例如在一实际应用场景中,总指标为全国交易笔数,该总指标下面可以分为34个维度的指标(对应34个省份),当某一报表中存在全国交易笔数这一总指标,且另外存在34张地区报表时,那么这34张报表中地区交易笔数相加就应当等于报表中总指标的值。
另外,在实际应用中,当多张报表的单元格之间引用同一监管数据指标库的指标,且这些指标在数据上游存在稽核关系时,也可以根据本实施例的方案生成相应的稽核规则。
在步骤S340中,根据对所述指标分析的结果以及所述预定单元格对应的表头信息,建立所述预定单元格之间的关联关系,并将所述预定单元格之间的关联关系作为生成的数据处理规则。
在本说明书一个或多个实施例中,在根据相同指标标识或者同一总指标下的不同指标维度的策略推导出具有这种关联关系的单元格之后,从而进一步根据分析后得到的对应相同指标标识的多个预定单元格,或者属于同一总指标下的不同指标维度的多个预定单元格,建立所述预定单元格的表头信息之间的稽核规则。
通过本说明书实施三的技术方案,当报表中的单元格数据是从指标库中自动获取及填写的情况下,可以根据这些单元格数据所对应的指标标识以及指标之间的维度关系,基于这种策略推导出单元格之间的勾稽关系,并生成相应的稽核规则。从而提升稽核规则生成的准确性,提高稽核规则的可信度和有效性。
进一步地,在本说明书实施例中,通过上述方案产出稽核规则之后,可以利用生产出来的稽核规则自动对所有往期报表进行规则试算,以便根据往期报表通过的比例计算出规则的可信度,当稽核规则的可信度达到要求时,将由运维人员确定规则有效性并将规则部署到统一报送平台。
基于同样的思路,本说明书实施例还提供了一种数据处理规则生成装置,如图4为本说明书实施例提供的一种数据处理规则生成装置的结构示意图,该装置400主要包括:
获取模块401,用于获取一个或多个目标报表,其中,所述目标报表包括预定的目标报表模板所对应的样表和/或根据所述目标报表模板已填写好数据的报表;
提取模块402,用于对所述目标报表执行信息提取操作,得到所述目标报表中的单元格所对应的表头信息以及所述表头信息对应的文本信息;
匹配模块403,用于确定所述单元格的表头所对应的文本信息中的关键字符,将所述关键字符与预设的数据处理规则生成策略所包含的信息进行匹配;
关联模块404,用于确定成功匹配的关键字符所对应的文本信息以及所述文本信息所对应的表头信息,根据所述数据处理规则生成策略建立该表头信息所属单元格之间的关联关系,并将所述单元格之间的关联关系作为生成的数据处理规则。
基于同样的思路,本说明书实施例还提供了另一种数据处理规则生成装置,如图5为本说明书实施例提供的另一种数据处理规则生成装置的结构示意图,该装置500主要包括:
获取模块501,用于获取一个或多个目标报表,其中,所述目标报表包括根据预定的目标报表模板进行数据填写且已完成上报的报表;
提取模块502,用于对所述目标报表执行信息提取操作,得到所述目标报表中预定单元格内所填写的数据信息以及所述预定单元格所对应的表头信息;
比对计算模块503,用于根据预设的数据处理规则生成策略对所述预定单元格所对应的数据信息执行比对或计算操作;
关联模块504,用于根据所述比对或计算操作的结果以及所述预定单元格对应的表头信息,建立所述预定单元格之间的关联关系,并将所述预定单元格之间的关联关系作为生成的数据处理规则。
基于同样的思路,本说明书实施例还提供了另一种数据处理规则生成装置,如图6为本说明书实施例提供的另一种数据处理规则生成装置的结构示意图,该装置600主要包括:
获取模块601,用于获取多个目标报表,其中,所述目标报表包括根据预定的目标报表模板和指标库进行数据填写后得到的报表;
提取模块602,用于对所述目标报表执行信息提取操作,得到所述目标报表中预定单元格所对应的指标信息和表头信息;
指标分析模块603,用于根据预设的数据处理规则生成策略对所述预定单元格所对应的指标信息进行分析,得到指标分析的结果;
关联模块604,用于根据对所述指标分析的结果以及所述预定单元格对应的表头信息,建立所述预定单元格之间的关联关系,并将所述预定单元格之间的关联关系作为生成的数据处理规则。
本说明书实施例还提供一种电子设备,包括存储器,处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述实施例一中的一种数据处理规则生成方法。
本说明书实施例还提供一种电子设备,包括存储器,处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述实施例二中的一种数据处理规则生成方法。
本说明书实施例还提供一种电子设备,包括存储器,处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述实施例三中的一种数据处理规则生成方法。
上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置、电子设备、非易失性计算机存储介质实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本说明书实施例提供的装置、电子设备、非易失性计算机存储介质与方法是对应的,因此,装置、电子设备、非易失性计算机存储介质也具有与对应方法类似的有益技术效果,由于上面已经对方法的有益技术效果进行了详细说明,因此,这里不再赘述对应装置、电子设备、非易失性计算机存储介质的有益技术效果。
在20世纪90年代,对于一个技术的改进可以很明显地区分是硬件上的改进(例如,对二极管、晶体管、开关等电路结构的改进)还是软件上的改进(对于方法流程的改进)。然而,随着技术的发展,当今的很多方法流程的改进已经可以视为硬件电路结构的直接改进。设计人员几乎都通过将改进的方法流程编程到硬件电路中来得到相应的硬件电路结构。因此,不能说一个方法流程的改进就不能用硬件实体模块来实现。例如,可编程逻辑器件(Programmable Logic Device,PLD)(例如现场可编程门阵列(Field Programmable GateArray,FPGA))就是这样一种集成电路,其逻辑功能由用户对器件编程来确定。由设计人员自行编程来把一个数字***“集成”在一片PLD上,而不需要请芯片制造厂商来设计和制作专用的集成电路芯片。而且,如今,取代手工地制作集成电路芯片,这种编程也多半改用“逻辑编译器(logic compiler)”软件来实现,它与程序开发撰写时所用的软件编译器相类似,而要编译之前的原始代码也得用特定的编程语言来撰写,此称之为硬件描述语言(Hardware Description Language,HDL),而HDL也并非仅有一种,而是有许多种,如ABEL(Advanced Boolean Expression Language)、AHDL(Altera Hardware DescriptionLanguage)、Confluence、CUPL(Cornell University Programming Language)、HDCal、JHDL(Java Hardware Description Language)、Lava、Lola、MyHDL、PALASM、RHDL(RubyHardware Description Language)等,目前最普遍使用的是VHDL(Very-High-SpeedIntegrated Circuit Hardware Description Language)与Verilog。本领域技术人员也应该清楚,只需要将方法流程用上述几种硬件描述语言稍作逻辑编程并编程到集成电路中,就可以很容易得到实现该逻辑方法流程的硬件电路。
控制器可以按任何适当的方式实现,例如,控制器可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(Application Specific Integrated Circuit,ASIC)、可编程逻辑控制器和嵌入微控制器的形式,控制器的例子包括但不限于以下微控制器:ARC 625D、Atmel AT91SAM、Microchip PIC18F26K20以及Silicone Labs C8051F320,存储器控制器还可以被实现为存储器的控制逻辑的一部分。本领域技术人员也知道,除了以纯计算机可读程序代码方式实现控制器以外,完全可以通过将方法步骤进行逻辑编程来使得控制器以逻辑门、开关、专用集成电路、可编程逻辑控制器和嵌入微控制器等的形式来实现相同功能。因此这种控制器可以被认为是一种硬件部件,而对其内包括的用于实现各种功能的装置也可以视为硬件部件内的结构。或者甚至,可以将用于实现各种功能的装置视为既可以是实现方法的软件模块又可以是硬件部件内的结构。
上述实施例阐明的***、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的,计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。
为了描述的方便,描述以上装置时以功能分为各种单元分别描述。当然,在实施本说明书一个或多个实施例时可以把各单元的功能在同一个或多个软件和/或硬件中实现。
本领域内的技术人员应明白,本说明书实施例可提供为方法、***、或计算机程序产品。因此,本说明书实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本说明书实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本说明书是参照根据本说明书实施例的方法、设备(***)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
本说明书可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践说明书,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于***实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本说明书实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。
Claims (20)
1.一种数据处理规则生成方法,所述方法包括:
获取一个或多个目标报表,其中,所述目标报表为预定的目标报表模板所对应的样表或者对所述目标报表模板进行数据填写后生成的报表;
对所述目标报表执行信息提取操作,得到所述目标报表中的单元格所对应的表头信息以及所述表头信息对应的文本信息;
确定所述单元格的表头所对应的文本信息中的关键字符,将所述关键字符与预设的数据处理规则生成策略所包含的信息进行匹配;
确定成功匹配的关键字符所对应的文本信息以及所述成功匹配的关键字符所对应的文本信息的表头,根据所述数据处理规则生成策略建立所述成功匹配的关键字符所对应的文本信息的表头所属单元格之间的关联关系,并将所述单元格之间的关联关系作为生成的数据处理规则。
2.如权利要求1所述的方法,所述对所述目标报表执行信息提取操作,得到所述目标报表中的单元格所对应的表头信息以及所述表头信息对应的文本信息,包括:
对所述目标报表中各个单元格的信息进行提取,得到所述单元格所对应的表头信息和所述表头信息对应的文本信息;
其中,所述表头信息包含所述单元格所对应的行头信息和列头信息,所述文本信息包含所述单元格的表头所对应的文本描述信息。
3.如权利要求2所述的方法,所述单元格包括待填写数据的空白单元格,所述确定所述单元格的表头所对应的文本信息中的关键字符,包括:
根据所述空白单元格所对应的行和列,确定所述行和列分别对应的文本描述信息,并根据预先设置的关键字符与所述文本描述信息进行匹配,确定所述文本描述信息中所包含的关键字符。
4.如权利要求2所述的方法,所述预设的数据处理规则生成策略,包括:
根据所述目标报表内部各单元格的行和列分别对应的文本描述信息,预先建立的所述单元格自身以及若干个单元格之间的数据处理规则生成策略。
5.如权利要求2所述的方法,所述根据所述数据处理规则生成策略建立所述成功匹配的关键字符所对应的文本信息的表头所属单元格之间的关联关系,包括:
根据所述数据处理规则生成策略中对应行和列的文本描述信息,以及成功匹配的文本信息所对应的行和列,建立所述行和列所对应单元格之间的关联关系;其中,所述行和列用于表示所述单元格在目标报表中的坐标。
6.一种数据处理规则生成方法,所述方法包括:
获取一个或多个目标报表,其中,所述目标报表包括根据预定的目标报表模板进行数据填写且已完成上报的报表;
对所述目标报表执行信息提取操作,得到所述目标报表中预定单元格内所填写的数据信息以及所述预定单元格所对应的表头信息;
根据预设的数据处理规则生成策略对所述预定单元格所对应的数据信息执行比对或计算操作;
根据所述比对或计算操作的结果以及所述预定单元格对应的表头信息,建立所述预定单元格之间的关联关系,并将所述预定单元格之间的关联关系作为生成的数据处理规则。
7.如权利要求6所述的方法,所述预定单元格包括用于填写数据的单元格,所述对所述目标报表执行信息提取操作,得到所述目标报表中预定单元格内所填写的数据信息以及所述预定单元格所对应的表头信息,包括:
对所述目标报表中各个预定单元格的信息进行提取,得到所述预定单元格内所填写的数据信息以及所述预定单元格所对应的表头信息;
其中,所述数据信息包含根据目标报表模板所填写的业务数据;所述表头信息包含所述预定单元格所对应的行头信息和列头信息。
8.如权利要求6所述的方法,所述预设的数据处理规则生成策略包括比对策略和计算策略,所述根据预设的数据处理规则生成策略对所述预定单元格所对应的数据信息执行比对或计算操作,包括:
根据所述比对策略将每个所述预定单元格所对应的数据信息与同一目标报表或不同目标报表中的其他预定单元格所对应的数据信息分别进行比对;
或者,
根据所述计算策略将每个所述预定单元格所对应的数据信息与同一目标报表或不同目标报表中的其他预定单元格所对应的数据信息分别进行计算,和/或,将每个所述预定单元格所对应的数据信息与同一目标报表或不同目标报表中的至少两个其他预定单元格所对应的数据信息一起进行计算。
9.如权利要求8所述的方法,所述根据所述比对或计算操作的结果以及所述预定单元格对应的表头信息,建立所述预定单元格之间的关联关系,包括:
根据所述比对或计算操作的结果确定所述预定单元格与至少一个其他预定单元格之间的关联关系,从而根据具有关联关系的预定单元格,建立所述预定单元格的表头信息之间的关联关系。
10.一种数据处理规则生成方法,所述方法包括:
获取多个目标报表,其中,所述目标报表包括根据预定的目标报表模板和指标库进行数据填写后得到的报表;
对所述目标报表执行信息提取操作,得到所述目标报表中预定单元格所对应的指标信息和表头信息;
根据预设的数据处理规则生成策略对所述预定单元格所对应的指标信息进行分析,得到指标分析的结果;
根据对所述指标分析的结果以及所述预定单元格对应的表头信息,建立所述预定单元格之间的关联关系,并将所述预定单元格之间的关联关系作为生成的数据处理规则。
11.如权利要求10所述的方法,所述预定单元格包括用于填写数据的单元格,所述对所述目标报表执行信息提取操作,得到所述目标报表中预定单元格所对应的指标信息和表头信息,包括:
当从指标库中获取用于填写所述预定单元格的数据信息时,确定所述数据信息所对应的所述指标库中的指标以及与所述指标相关的指标信息,并建立所述预定单元格与所述指标信息之间的对应关系;
当对所述目标报表中各个预定单元格的信息进行提取时,根据所述对应关系确定所述预定单元格所对应的指标信息,并确定所述预定单元格所对应的表头信息;其中,所述表头信息包含所述预定单元格所对应的行头信息和列头信息。
12.如权利要求10所述的方法,所述指标信息中包含指标标识,所述根据预设的数据处理规则生成策略对所述预定单元格所对应的指标信息进行分析,得到指标分析的结果,包括:
将每个所述预定单元格所对应的指标标识与不同目标报表中的其他预定单元格所对应的指标标识分别进行比对分析,确定所述指标标识相同的多个预定单元格。
13.如权利要求11所述的方法,所述指标信息中还包含总指标以及总指标对应的指标维度,所述根据预设的数据处理规则生成策略对所述预定单元格所对应的指标信息进行分析,得到指标分析的结果,包括:
当通过比对分析多个预定单元格属于同一总指标所对应的单元格时,判断所述预定单元格分别对应所述总指标下的不同指标维度,根据所述总指标以及指标维度确定多个预定单元格之间的关联关系。
14.如权利要求13所述的方法,所述根据对所述指标分析的结果以及所述预定单元格对应的表头信息,建立所述预定单元格之间的关联关系,包括:
根据分析后得到的对应相同指标标识的多个预定单元格,或者属于同一总指标下的不同指标维度的多个预定单元格,建立所述预定单元格的表头信息之间的关联关系。
15.一种数据处理规则生成装置,所述装置包括:
获取模块,用于获取一个或多个目标报表,其中,所述目标报表包括预定的目标报表模板所对应的样表和/或根据所述目标报表模板已填写好数据的报表;
提取模块,用于对所述目标报表执行信息提取操作,得到所述目标报表中的单元格所对应的表头信息以及所述表头信息对应的文本信息;
匹配模块,用于确定所述单元格的表头所对应的文本信息中的关键字符,将所述关键字符与预设的数据处理规则生成策略所包含的信息进行匹配;
关联模块,用于确定成功匹配的关键字符所对应的文本信息以及所述文本信息所对应的表头信息,根据所述数据处理规则生成策略建立该表头信息所属单元格之间的关联关系,并将所述单元格之间的关联关系作为生成的数据处理规则。
16.一种数据处理规则生成装置,所述装置包括:
获取模块,用于获取一个或多个目标报表,其中,所述目标报表包括根据预定的目标报表模板进行数据填写且已完成上报的报表;
提取模块,用于对所述目标报表执行信息提取操作,得到所述目标报表中预定单元格内所填写的数据信息以及所述预定单元格所对应的表头信息;
比对计算模块,用于根据预设的数据处理规则生成策略对所述预定单元格所对应的数据信息执行比对或计算操作;
关联模块,用于根据所述比对或计算操作的结果以及所述预定单元格对应的表头信息,建立所述预定单元格之间的关联关系,并将所述预定单元格之间的关联关系作为生成的数据处理规则。
17.一种数据处理规则生成装置,所述装置包括:
获取模块,用于获取多个目标报表,其中,所述目标报表包括根据预定的目标报表模板和指标库进行数据填写后得到的报表;
提取模块,用于对所述目标报表执行信息提取操作,得到所述目标报表中预定单元格所对应的指标信息和表头信息;
指标分析模块,用于根据预设的数据处理规则生成策略对所述预定单元格所对应的指标信息进行分析,得到指标分析的结果;
关联模块,用于根据对所述指标分析的结果以及所述预定单元格对应的表头信息,建立所述预定单元格之间的关联关系,并将所述预定单元格之间的关联关系作为生成的数据处理规则。
18.一种电子设备,包括存储器,处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现权利要求1至5中任一项所述的方法。
19.一种电子设备,包括存储器,处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现权利要求6至9中任一项所述的方法。
20.一种电子设备,包括存储器,处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现权利要求10至14中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010841096.XA CN111985201B (zh) | 2020-08-19 | 2020-08-19 | 一种数据处理规则生成方法、装置及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010841096.XA CN111985201B (zh) | 2020-08-19 | 2020-08-19 | 一种数据处理规则生成方法、装置及电子设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111985201A CN111985201A (zh) | 2020-11-24 |
CN111985201B true CN111985201B (zh) | 2023-12-29 |
Family
ID=73443458
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010841096.XA Active CN111985201B (zh) | 2020-08-19 | 2020-08-19 | 一种数据处理规则生成方法、装置及电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111985201B (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113191128B (zh) * | 2021-05-24 | 2024-03-19 | 中国工商银行股份有限公司 | 报表核对工具的生成方法、装置及电子设备 |
CN113673213B (zh) * | 2021-08-25 | 2023-11-07 | 北京智通云联科技有限公司 | 基于模板的表格信息抽取方法及*** |
CN114881508A (zh) * | 2022-05-24 | 2022-08-09 | 中国能源建设集团广东省电力设计研究院有限公司 | 一种电网指标报表的数据处理方法、装置及设备 |
CN115310407B (zh) * | 2022-09-19 | 2023-09-08 | 长沙丹渥智能科技有限公司 | 一种Excel模型的解析方法及*** |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019052532A1 (zh) * | 2017-09-18 | 2019-03-21 | 阿里巴巴集团控股有限公司 | 关于物联网设备的信息交互方法、装置及设备 |
WO2019242124A1 (zh) * | 2018-06-19 | 2019-12-26 | 平安科技(深圳)有限公司 | 金额信息的提取方法、装置、终端设备及介质 |
CN111159697A (zh) * | 2019-12-27 | 2020-05-15 | 支付宝(杭州)信息技术有限公司 | 一种密钥检测方法、装置及电子设备 |
-
2020
- 2020-08-19 CN CN202010841096.XA patent/CN111985201B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019052532A1 (zh) * | 2017-09-18 | 2019-03-21 | 阿里巴巴集团控股有限公司 | 关于物联网设备的信息交互方法、装置及设备 |
WO2019242124A1 (zh) * | 2018-06-19 | 2019-12-26 | 平安科技(深圳)有限公司 | 金额信息的提取方法、装置、终端设备及介质 |
CN111159697A (zh) * | 2019-12-27 | 2020-05-15 | 支付宝(杭州)信息技术有限公司 | 一种密钥检测方法、装置及电子设备 |
Non-Patent Citations (1)
Title |
---|
基于自然语言处理和Office COM组件的电量智能统计分析***;李新利;李昕其;马凯;李卫东;于磊;;计算机应用与软件(12);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN111985201A (zh) | 2020-11-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111985201B (zh) | 一种数据处理规则生成方法、装置及电子设备 | |
CN109636091B (zh) | 一种需求文档风险识别方法及装置 | |
TWI710917B (zh) | 資料處理方法及裝置 | |
CN111159184B (zh) | 元数据追溯方法、装置及服务器 | |
CN110634030B (zh) | 应用的业务指标挖掘方法、装置及设备 | |
CN107704512A (zh) | 基于社交数据的金融产品推荐方法、电子装置及介质 | |
CN111831629B (zh) | 一种数据处理方法及装置 | |
CN108205580A (zh) | 一种图像检索方法、装置及计算机可读存储介质 | |
CN111539811B (zh) | 风险账户的识别方法及装置 | |
CN113360676A (zh) | 一种基于知识图谱确定企业潜在关系的方法及装置 | |
CN106878242B (zh) | 一种确定用户身份类别的方法及装置 | |
CN112560444A (zh) | 文本处理方法、装置、计算机设备和存储介质 | |
CN110263817B (zh) | 一种基于用户账号的风险等级划分方法及装置 | |
CN110232156B (zh) | 基于长文本的信息推荐方法及装置 | |
CN107729330B (zh) | 获取数据集的方法和装置 | |
CN114138869A (zh) | 一种企业信用数据处理方法及装置 | |
CN114611850A (zh) | 业务分析方法、装置及电子设备 | |
CN112487181B (zh) | 关键词确定方法和相关设备 | |
CN110008252B (zh) | 数据核对方法及装置 | |
CN111967769B (zh) | 一种风险识别方法、装置、设备及介质 | |
CN111078867A (zh) | 一种文本分类方法及装置 | |
CN115495587A (zh) | 一种基于知识图谱的告警分析方法及装置 | |
CN113849702A (zh) | 一种确定目标数据的方法、装置、电子设备及存储介质 | |
CN110245136B (zh) | 数据检索方法及装置、设备及存储设备 | |
CN113065657A (zh) | 一种基于银行对公数据的知识图谱构建方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |