CN115098738A - 业务数据的提取方法、装置、存储介质及电子设备 - Google Patents

业务数据的提取方法、装置、存储介质及电子设备 Download PDF

Info

Publication number
CN115098738A
CN115098738A CN202210737128.0A CN202210737128A CN115098738A CN 115098738 A CN115098738 A CN 115098738A CN 202210737128 A CN202210737128 A CN 202210737128A CN 115098738 A CN115098738 A CN 115098738A
Authority
CN
China
Prior art keywords
service
target
attribute
sub
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210737128.0A
Other languages
English (en)
Inventor
韩金涛
李江涛
卢永安
马坤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Industrial and Commercial Bank of China Ltd ICBC
Original Assignee
Industrial and Commercial Bank of China Ltd ICBC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Industrial and Commercial Bank of China Ltd ICBC filed Critical Industrial and Commercial Bank of China Ltd ICBC
Priority to CN202210737128.0A priority Critical patent/CN115098738A/zh
Publication of CN115098738A publication Critical patent/CN115098738A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/90335Query processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/90335Query processing
    • G06F16/90344Query processing by using string matching techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请公开了一种业务数据的提取方法、装置、存储介质及电子设备。涉及大数据领域,获取查询请求,其中,查询请求用于请求查询具有目标业务属性的业务数据;从具有对应关系的参考业务属性和参考业务中获取目标业务属性对应的目标业务;从日志文件集合中筛选目标业务对应的目标日志文件,其中,日志文件集中包括执行业务所产生的日志文件;从目标日志文件中提取业务数据,得到目标业务数据,其中,目标业务数据为具有目标业务属性的业务数据,采用上述技术方案,解决了相关技术中业务数据的查询效率较低等问题,实现了提高业务数据的查询效率的技术效果。

Description

业务数据的提取方法、装置、存储介质及电子设备
技术领域
本申请涉及大数据领域,具体而言,涉及一种业务数据的提取方法、装置、存储介质及电子设备。
背景技术
随着互联网技术的快速发展,越来越多的企业或者服务机构通过网络为用户提供业务服务,随机也就产生了越来越多的业务数据,在这种情况下,推进数据价值挖掘,促进数据业务服务支撑成为了企业或者服务机构的重点工作任务,当前,企业常用构建用于查询不同数据的数据查询程序的方式,即构建查询特定业务数据的查询程序,在数据查询程序中将执行业务的程序信息写死,从而在查询业务数据时,通过运行对应的查询程序从而查询业务数据,但是这种方式局限性较强,不利于数据查询的灵活拓展,比如,在新增统计逻辑或者新增业务功能的时候,就需要从新编写新的查询程序,造成了程序查询程序维护成本高、扩展性差等问题。
针对相关技术中业务数据的查询效率较低等问题,尚未提出有效的解决方案。
发明内容
本申请的主要目的在于提供一种业务数据的提取方法、装置、存储介质及电子设备,以解决相关技术中业务数据的查询效率较低的问题。
为了实现上述目的,根据本申请的一个方面,提供了一种业务数据的提取方法。该方法包括:获取查询请求,其中,所述查询请求用于请求查询具有目标业务属性的业务数据;从具有对应关系的参考业务属性和参考业务中获取所述目标业务属性对应的目标业务;从日志文件集合中筛选所述目标业务对应的目标日志文件,其中,所述日志文件集中包括执行业务所产生的日志文件;从所述目标日志文件中提取业务数据,得到目标业务数据,其中,所述目标业务数据为具有所述目标业务属性的业务数据。
可选的,所述从具有对应关系的参考业务属性和参考业务中获取所述目标业务属性对应的目标业务,包括:将目标子属性集合与具有对应关系的参考子属性集合和参考程序标识中的每个参考子属性集合进行匹配,其中,所述参考子属性集合中包括多个参考业务子属性,所述多个参考业务子属性用于从多个维度对业务的业务类型进行划分,所述目标业务属性包括所述目标子属性集合;获取与所述目标子属性集合匹配成功的参考子属性集合所对应的目标程序标识,其中,所述目标程序标识用于唯一标识所述目标业务。
可选的,所述将目标子属性集合与具有对应关系的参考子属性集合和参考程序标识中的每个参考子属性集合进行匹配,包括:确定所述目标子属性集合中所包括的一个或者多个目标业务子属性中每个目标业务子属性的目标属性值与所述每个所述参考子属性集合中对应维度的参考业务子属性的参考属性值是否一致;将所述参考属性值与所述目标属性值全部一致的参考子属性集合确定为与所述目标子属性集合匹配成功的参考子属性集合。
可选的,所述确定所述目标子属性集合中所包括的一个或者多个目标业务子属性中每个目标业务子属性的目标属性值与所述每个所述参考子属性集合中对应维度的参考业务子属性的参考属性值是否一致,包括:在所述一个或者多个目标业务子属性中包括目标部门类型标识的情况下,从所述参考子属性集合中获取具有参考部门类型标识的参考标识值与所述目标部门类型标识的目标标识值一致的候选子属性集合;确定所述目标业务子属性中所包括的目标业务标识串中的每个目标标识位与每个所述候选子属性集合中所包括的候选业务标识串上对应的候选标识位是否一致,其中,所述目标业务标识串包括以下至少之一:登录业务标识,动账类业务标识,业务动户类业务标识,线程类业务标识,接口类业务标识,登出业务标识;在所述一个或者多个目标业务子属性中不包括目标部门类型标识的情况下,确定所述目标业务子属性中所包括的目标业务标识串中的每个目标标识位与每个所述参考子属性集合中所包括的参考业务标识串上对应的参考标识位是否一致,其中,所述目标业务标识串包括以下至少之一:登录业务标识,动账类业务标识,业务动户类业务标识,线程类业务标识,接口类业务标识,登出业务标识。
可选的,所述从所述目标日志文件中提取业务数据,得到目标业务数据,包括:根据所述目标业务属性对应的目标字段生成目标数据提取脚本,其中,所述目标数据提取脚本用于运行提取所述目标字段对应数据的程序;对所述目标日志文件运行所述目标数据提取脚本,得到所述目标业务数据。
可选的,所述根据所述目标业务属性对应的目标字段生成目标数据提取脚本,包括:获取初始数据提取脚本,其中,所述初始数据提取脚本记录了提取数据的程序模板;将所述目标字段编辑至所述初始数据提取脚本中的对应位置,得到所述目标数据提取脚本。
可选的,在所述根据所述目标业务属性对应的目标字段生成目标数据提取脚本之前,所述方法还包括以下之一:从所述查询请求中提取所述目标业务属性的目标字段;从具有对应关系的参考业务属性和参考业务中提取与所述目标业务属性对应的所述参考业务属性的字段作为所述目标字段。
为了实现上述目的,根据本申请的另一方面,提供了一种业务数据的提取装置。该装置包括:第一获取模块,用于获取查询请求,其中,所述查询请求用于请求查询具有目标业务属性的业务数据;第二获取模块,用于从具有对应关系的参考业务属性和参考业务中获取所述目标业务属性对应的目标业务;筛选模块,用于从日志文件集合中筛选所述目标业务对应的目标日志文件,其中,所述日志文件集中包括执行业务所产生的日志文件;第一提取模块,用于从所述目标日志文件中提取业务数据,得到目标业务数据,其中,所述目标业务数据为具有所述目标业务属性的业务数据。
为了实现上述目的,根据本申请的另一方面,提供了一种非易失性存储介质,上述非易失性存储介质存储有多条指令,上述指令适于由处理器加载并执行任意一项上述的方法。
为了实现上述目的,根据本申请的另一方面,提供了一种电子设备。该电子设备包括:一个或多个处理器和存储器,上述存储器用于存储一个或多个程序,其中,当上述一个或多个程序被上述一个或多个处理器执行时,使得上述一个或多个处理器实现任意一项上述的方法。
通过本申请,采用以下步骤:获取查询请求,其中,所述查询请求用于请求查询具有目标业务属性的业务数据;从具有对应关系的参考业务属性和参考业务中获取所述目标业务属性对应的目标业务;从日志文件集合中筛选所述目标业务对应的目标日志文件,其中,所述日志文件集中包括执行业务所产生的日志文件;从所述目标日志文件中提取业务数据,得到目标业务数据,其中,所述目标业务数据为具有所述目标业务属性的业务数据,即参考业务属性和参考业务具有对应关系,查询请求用于请求查询具有目标业务属性的业务数据,通过查询请求能够知道要查询的业务数据的目标业务属性,进而能够在具有对应关系的参考业务属性和参考业务中获取待与目标业务属性对应的目标业务,即通过目标业务属性确定出产生要查询的业务数据的目标业务,进而在目标业务的目标日志文件中提取出目标业务数据,实现在查询时只需要知道要查询的业务数据的目标业务属性,通过目标业务属性查询业务,进而提取业务对应的目标业务数据,从而实现了业务数据查询的灵活性和可扩展性。采用上述技术方案,解决了相关技术中业务数据的查询效率较低等问题,实现了提高业务数据的查询效率的技术效果。
附图说明
构成本申请的一部分的附图用来提供对本申请的进一步理解,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1是根据本申请实施例提供的业务数据的提取方法的流程图;
图2是根据本申请实施例的一种可选的查询请求选择界面示意图;
图3是根据本申请实施例的一种可选的参考业务子属性集合对照表示意图
图4是根据本申请实施例的一种可选的业务数据的提取流程图;
图5是根据本申请实施例的业务数据的提取装置的示意图;
图6是根据本申请实施例的一种业务数据的提取方法的硬件环境示意图。
具体实施方式
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、***、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
需要说明的是,本公开所涉及的相关信息(包括但不限于用户设备信息、用户个人信息等)和数据(包括但不限于用于展示的数据、分析的数据等),均为经用户授权或者经过各方充分授权的信息和数据。例如,本***和相关用户或机构间设置有接口,在获取相关信息之前,需要通过接口向前述的用户或机构发送获取请求,并在接收到前述的用户或机构反馈的同意信息后,获取相关信息。
本方案可以应用于具有对用户数据的统计需求的企业或者服务机构,比如银行、医院、保险公司等,这些企业有不同的用户的业务数据,这些数据涉及不同的业务,并且企业的业务类型具有变化性,在进行数据统计时统计需求也具有多变性。
下面结合优选的实施步骤对本发明进行说明,图1是根据本申请实施例提供的业务数据的提取方法的流程图,如图1所示,该方法包括如下步骤:
步骤S102,获取查询请求,其中,所述查询请求用于请求查询具有目标业务属性的业务数据;
步骤S104,从具有对应关系的参考业务属性和参考业务中获取所述目标业务属性对应的目标业务;
步骤S106,从日志文件集合中筛选所述目标业务对应的目标日志文件,其中,所述日志文件集中包括执行业务所产生的日志文件;
步骤S108,从所述目标日志文件中提取业务数据,得到目标业务数据,其中,所述目标业务数据为具有所述目标业务属性的业务数据。
在上述步骤S102提供的技术方案中,查询请求中携带有目标业务属性的相关信息,查询请求中可以但不限于携带目标业务属性的名称以及对应的属性值,目标业务属性对应的标识信息(如字符串,字符串中不同字符位代表属性的属性值)。
可选地,在本实施例中,目标业务属性可以包括一个或者多个子属性,不同的业务属性用于从不同维度对业务的业务类型进行划分。
可选地,在本实施例中,查询请求中还可以携带有数据查询时间条件,即查询某一段时间的业务数据,在进行数据查询时可以根据数据查询时间条件对日志文件进行筛选。
可选地,在本实施例中,查询请求可以是根据数据查询人员在前段界面上的点选的业务属性生成的,在前段界面上会标有相应的业务属性,用户根据自己需要的数据在前端界面上进行勾选,从而选出目标业务属性,图2是根据本申请实施例的一种可选的查询请求选择界面示意图,如图2所示,可以但不限于包括登录业务标识,动账类业务标识,业务动户类业务标识,线程类业务标识,接口类业务标识,登出业务标识等子业务属性标识,操作人员根据数据查询需求点选响应的属性标识。
在上述步骤S104提供的技术方案中,具有对应关系的参考业务属性和参考业务中可以是参考业务属性和参考业务名称的对应关系,或者还可以是参考业务属性和参考程序标识的对应关系,参考程序标识用于指示执行对应参考业务的程序的信息,或者还可以是参考业务属性包括的多个参考子属性集合和参考业务名称的对应关系。
可选地,在本实施例中,获取目标业务属性对应的目标业务的方式可以是通过确定每个参考业务属性和目标业务属性匹配是否一致的方式,将与目标业务属性匹配一致的参考业务属性对应的参考业务确定为目标业务,比如,在多个参考业务属性中确定与目标业务属性的属性名匹配一致的参考业务属性,或者还可以是在多个参考业务属性中确定与目标业务属性对应维度属性的属性值匹配一致的参考业务属性,本方案对此不作限定。
可选地,在本实施例中,在新增业务时,需要根据业务的业务属性维护参考业务属性和参考业务的对应关系,即将新增的业务属性和业务的对应关系更新到具有对应关系的参考业务属性和参考业务的对应关系中。
在上述步骤S106提供的技术方案中,在日志文件集合中筛选出目标日志文件的方式可以是通过搜索目标业务对应的标识信息的方式,比如标识信息可以是用于指示业务名称的标识信息,或者还可以是用于指示执行业务对应的程序的标识,比如,日志文件中可以携带有目标业务的业务名称(如转账、数据发送等关键字),通过在日志文件集合中搜索含有业务名称的日志文件,从而得到目标日志文件,或者日志文件中还可以携带有程序的程序信息(如程序名称、程序序号等),通过在日志文件集合中搜索含有程序信息的日志文件,从而得到目标日志文件。
可选地,在本实施例中,程序的日志文件再存储时,会根据程序的名称或者程序的功能进行分类存储,比如将不同名称的程序存储在同一存储空间中,将不同功能的程序存储在同一个存储空间中,在筛选目标日志文件是还可以根据程序的名称和程序的功能调去对应的存储空间,将存储空间中存储的全部日志文件作为目标日志文件。
在上述步骤S108提供的技术方案中,提取业务数据的方式可以是通过使用具有数据提取功能的脚本程序,该脚本程序可以是预先构建好的,或者还可以是根据目标业务属性生成的,比如将用于目标业务属性的关键字输入值初始脚本程序中,初始脚本程序为具有数据提取的基本功能的程序,并将目标业务属性的关键字***值初始脚本程序中的对应位置从而得到提取目标业务数据的脚本程序。
需要说明的是,相关技术中通过构建用于查询不同数据的数据查询程序的方式,即构建查询特定业务数据的查询程序,在数据查询程序中将执行业务的程序信息写死,从而在查询业务数据时,通过运行对应的查询程序从而查询业务数据,但是这种方式局限性较强,不利于数据查询的灵活拓展。
通过上述步骤,参考业务属性和参考业务具有对应关系,查询请求用于请求查询具有目标业务属性的业务数据,通过查询请求能够知道要查询的业务数据的目标业务属性,进而能够在具有对应关系的参考业务属性和参考业务中获取待与目标业务属性对应的目标业务,即通过目标业务属性确定出产生要查询的业务数据的目标业务,进而在目标业务的目标日志文件中提取出目标业务数据,实现在查询时只需要知道要查询的业务数据的目标业务属性,通过目标业务属性查询业务,进而提取业务对应的目标业务数据,从而实现了业务数据查询的灵活性和可扩展性。采用上述技术方案,解决了相关技术中业务数据的查询效率较低等问题,实现了提高业务数据的查询效率的技术效果。
作为一种可选的实施例,所述从具有对应关系的参考业务属性和参考业务中获取所述目标业务属性对应的目标业务,包括:
将目标子属性集合与具有对应关系的参考子属性集合和参考程序标识中的每个参考子属性集合进行匹配,其中,所述参考子属性集合中包括多个参考业务子属性,所述多个参考业务子属性用于从多个维度对业务的业务类型进行划分,所述目标业务属性包括所述目标子属性集合;
获取与所述目标子属性集合匹配成功的参考子属性集合所对应的目标程序标识,其中,所述目标程序标识用于唯一标识所述目标业务。
可选地,在本实施例中,程序标识为标识程序的信息,程序标识可以但不限于包括程序名称、程序序号等,通过程序标识对程序进行标记,使得程序具有唯一性,即一个程序标识唯一对应一个程序,即通过一个程序标识智能找到一个对应的程序,进而通过一个目标程序标识能够唯一标识一个目标业务。
可选地,在本实施例中,为了保证程序标识的唯一性,可以但不限于使用程序标识生成模型生成程序标识,在构建好了新增业务的程序时,需要对程序进行注册上线,将构建程序时的程序构建需求(及业务属性)导入到程序标识生成模型,程序标识生成模型会查询序列表,获取程序标识当前序列值,并在此基础上+1并返回程序标识,序列表pub_sequence,表结构如下:SEQNAME:序列名称;SEQVALUE:当前序列值;MINVALUE:最小值;MAXVALUE:最大值;STEP:每次取值数步长。程序标识最小值从100001开始,最大为999999,每次步长增加1,即:如果本次新增一个程序标识,当前序列值为100001,则新生成的程序标识为100002,并且更新当前序列值为100002。最后根据返回的程序标识和导入的业务属性维护参考业务属性和参考业务的对应关系表。
可选地,在本实施例中,程序标识对应的程序用于执行具有对应的业务属性的业务。
可选地,在本实施例中,一个业务可以具有多个维度的业务子属性,比如,以银行转账业务为例,可以根据办理方式分为线上业务和线下业务,根据办理位置分为总行业务和分行业务,根据金额分为大额业务和小额业务。
可选地,在本实施例中,对于目标子属性集合中的每个目标子属性,参考属性集合中都有一个参考子属性与其匹配一致,则可以确定目标子属性集合和参考子属性集合匹配成功,与目标子属性集合匹配成功的参考子属集合中的参考子属性的数量可以和目标子属性集合中目标子属性的数量相等,或者还可以比目标子属性集合中目标子属性的数量多,本方案对此不做限定。
作为一种可选的实施例,所述将目标子属性集合与具有对应关系的参考子属性集合和参考程序标识中的每个参考子属性集合进行匹配,包括:
确定所述目标子属性集合中所包括的一个或者多个目标业务子属性中每个目标业务子属性的目标属性值与所述每个所述参考子属性集合中对应维度的参考业务子属性的参考属性值是否一致;
将所述参考属性值与所述目标属性值全部一致的参考子属性集合确定为与所述目标子属性集合匹配成功的参考子属性集合。
可选地,在本实施例中,属性值用于指示是否具有该属性,属性值的取值可以但不限于取值为“0”、“1”或者空值,其中“0”表示不具有该属性,“1”表示具有该属性,空值表示既可以是具有该属性又可以是不具有该属性,比如目标业务子属性的目标属性值取控制,则该目标业务子属性可以和对应维度的取值为“0”或“1”的参考业务子属性匹配,或者属性值还可以取值为具体的数值,比如业务子属性用于指示业务办理的办理部门时,属性值可以是部门的部门编号。
作为一种可选的实施例,所述确定所述目标子属性集合中所包括的一个或者多个目标业务子属性中每个目标业务子属性的目标属性值与所述每个所述参考子属性集合中对应维度的参考业务子属性的参考属性值是否一致,包括:
在所述一个或者多个目标业务子属性中包括目标部门类型标识的情况下,从所述参考子属性集合中获取具有的参考部门类型标识的参考标识值与所述目标部门类型标识的目标标识值一致的候选子属性集合;确定所述目标业务子属性中所包括的目标业务标识串中的每个目标标识位与每个所述候选子属性集合中所包括的候选业务标识串上对应的候选标识位是否一致,其中,所述目标业务标识串包括以下至少之一:登录业务标识,动账类业务标识,业务动户类业务标识,线程类业务标识,接口类业务标识,登出业务标识;
在所述一个或者多个目标业务子属性中不包括目标部门类型标识的情况下,确定所述目标业务子属性中所包括的目标业务标识串中的每个目标标识位与每个所述参考子属性集合中所包括的参考业务标识串上对应的参考标识位是否一致,其中,所述目标业务标识串包括以下至少之一:登录业务标识,动账类业务标识,业务动户类业务标识,线程类业务标识,接口类业务标识,登出业务标识。
可选地,在本实施例中,部门类型标识用于指示业务的办理部门信息,以业务为银行业务为例,部门类型标识可以用于指示办理的业务是总行办理还是分行办理,或者贷款部门业务还是理财部门业务,此时标识值可以取值为“0”、“1”、空值或者具体部门编号。
可选地,在本实施例中,登陆业务标识用于标识是否为帐号登陆业务,比如,用户使用用户注册的帐号登陆了业务对应的程序。
可选地,在本实施例中,动账类业务标识用于指示业务是否存在虚拟资源的转换,比如,以银行转账业务为例,用户的发起转账交易或者接受其他用户的转账都可以成为动账类业务。
可选地,在本实施例中,业务动户类业务标识用于指示是否存在用户帐户的新增,比如,用户在银行中开户或者在应用上注册帐户。
可选地,在本实施例中,线程类业务标识用于指示业务是否触发预设线程程序的业务,比如,在用户进行消费或者转账是,随着虚拟资源的增加或者减少会触发短信通知的线程程序,从而该业务为线程类业务。
可选地,在本实施例中,接口类业务标识用于指示业务执行时是否存其他程序的接口调用,比如,以银行转账为例,在用户进行转账时,会进行用户身份验证,此时,需要调用用户身份验证程序的接口,该业务为接口类业务。
具有对应关系的参考业务属性集合和参考业务包括具有对应关系的参考业务子属性集合和参考程序标识,参考业务子属性集合中包括多个参考业务子属性以及参考业务子属性的属性值,比对时,将目标业务子属性和对应的参考业务子属性的属性值进行比对,图3是根据本申请实施例的一种可选的参考业务子属性集合对照表示意图,如图3所示,表中对应存储了参考业务子属性的属性值和参考程序标识,参考程序标识用于执行执行对应业务的程序,参考业务子属性的属性值用于从多个维度对业务的业务类型进行划分,参考业务子属性可以但不限于包括参考部门类型标识、登录业务标识,动账类业务标识,业务动户类业务标识,线程类业务标识,接口类业务标识,登出业务标识,此外参考业务子属性还可以包括业务栏目标识,业务栏目标识用于指示业务所述的栏目(比如转账类业务、理财类业务等等),在该表中,字符“0”、“1”表示属性的取值,“0”表示不具有该属性,“1”标识具有该属性,在新增业务或者新增程序时,需要对该参考业务子属性集合对照表进行维护,将新增的程序的程序标识添加至该表中,并将程序执行的业务的业务属性对应添加在表中。
作为一种可选的实施例,所述从所述目标日志文件中提取业务数据,得到目标业务数据,包括:
根据所述目标业务属性对应的目标字段生成目标数据提取脚本,其中,所述目标数据提取脚本用于运行提取所述目标字段对应数据的程序;
对所述目标日志文件运行所述目标数据提取脚本,得到所述目标业务数据。
可选地,在本实施例中,目标字段为用于指示目标业务属性的信息,目标字段可以是目标业务属性的属性名称或者目标业务属性的编码,在对应的业务的日志文件中携带有该字段,进而在日志文件中通过目标字段能够找到对应的业务数据。
可选地,在本实施例中,目标数据提取脚本可以是预先构建好的数据提取脚本,或者还可以是根据目标字段的目标数据提取脚本。
作为一种可选的实施例,所述根据所述目标业务属性对应的目标字段生成目标数据提取脚本,包括:
获取初始数据提取脚本,其中,所述初始数据提取脚本记录了提取数据的程序模板;
将所述目标字段编辑至所述初始数据提取脚本中的对应位置,得到所述目标数据提取脚本。
可选地,在本实施例中,初始数据提取脚本可以但不限于是具有数据查询功能的查询语句。
可选地,在本实施例中,初始数据提取脚本可以是预先存储的,或者还可以是对具有相同数据提取功能的目标数据提取脚本进行编辑后得到的。
作为一种可选的实施例,在所述根据所述目标业务属性对应的目标字段生成目标数据提取脚本之前,所述方法还包括以下之一:
从所述查询请求中提取所述目标业务属性的目标字段;
从具有对应关系的参考业务属性和参考业务中提取与所述目标业务属性对应的所述参考业务属性的字段作为所述目标字段。
可选地,在本实施例中,查询请求中可以是携带有目标业务属性的目标字段,或者还可以是携带有业务属性的属性值的字符串,字符串中每个字符位都对应一个属性的属性值,具有对应关系的参考业务属性和参考业务中有参考业务属性的字段和对应的属性值,根据字符串中的字符找到对应字符位的参考业务属性的字段作为目标字段。
为了方便准确筛选用户的业务数据以及获取相关栏目的业务信息,本方案还可以使用数据湖的方式,通过构建参考业务属性和参考业务的对应关系,并将参考业务属性和参考业务的对应关系下沉到数据湖中,并且将用户使用程序办理业务是的业务日志同样下沉到数据湖中,进而能够实现根据要查询的业务数据的业务属性自动生成数据查询策略,根据业务属性确定对应的业务,并调取业务对应的日志文件,从日志文件中查询数据。图4是根据本申请实施例的一种可选的业务数据的提取流程图,该流程可以但不限于应用于对银行业务数据的统计,如图4所示,可以但不限于包括如下步骤:
S401,构建参考业务属性和参考业务的对应关系,该对应关系可以是具有对应关系的参考程序标识和参考子属性集合,参考子属性集合包括多个参考业务子属性,用于从多个维度对业务的业务类型进行划分,参考业务子属性包括分行特色业务标识(1-是分行特色交易,0-是总行交易;)、交易标识串(FLAGS,第一位登录业务标识1-是,0-否;第二位动账类业务标识1-是,0-否;第三位业务动户类动账类业务标识1-是,0-否;第四位线程类动账类业务标识1-是,0-否;第五位接口类动账类业务标识1-是,0-否;第六位登出动账类业务标识1-是,0-否。
S402,将个人交易日志表B下传到数据湖,B表包含字段如下:LOGSERIALNO:日志流水号;LOGDATE:日志日期、时间;TRANCODE:交易代码;USERID:用户id/账号;AREACODE:地区代码;INACCTNO:转入账号;OUTACCTNO:转出帐号;NETCODE:网点号;AMOUNT:交易金额;CURRTYPE:币种;FMENUID:一级栏目编号;MENUID:末级栏目编号;FEEFAVER:手续费折扣率;RATEFAVER:成交汇率;INCURRTYPE:转入币种;SESSIONID:客户;TRADEDATE:网银交易日期;RATEFLAG:汇率正反标志;TRANSERIALNO:交易编号;OUTPRODUCTID:转出产品种类;OUTPRODUCTNO:转出产品序号;OUTSUBPRODUCTID:转出子产品种类;OUTSUBPRODUCTNO:转出子产品序号;INPRODUCTID:转入产品种类;INPRODUCTNO:转入产品序号;INSUBPRODUCTID:转入子产品种类;INSUBPRODUCTNO:转入子产品序号;SUBMENUID:栏目分支序号;IPADDR:IP地址IPADDR;MACADDR:MAC地址;USERAGENT:用户agent;TRADECOUNT:交易笔数;LANGCODE:语言标识;SUBEBANKFLAG:分行标识;SUMMARY:描述;CUSTTYPE:认证介质类型;CHANNELID:渠道唯一标识;CURRTYPE_PRCETYP:币种牌价类型;INCURRTYPE_PRCETYP:转入币种牌价类型;TEMP:备用字段;TEMP1:备用字段1;TEMP2:备用字段2;;TEMP3:备用字段3;ATTESTWAY:认证方式;MSCOUNTRYCODE:短信认证国家代码;MSPHONE:短信认证手机号;SERVERIP:服务器IP;PODNAME:PAAS容器名称;SERVERTYPE:服务器类型。
S403,获取数据查询请求中携带的请求查询的业务数据的目标业务属性。
S404,将目标业务属性和多个参考业务属性进行匹配,将匹配一致的参考业务属性对应的参考程序标识作为目标程序标识,从而找到目标程序标识对应的目标业务,并调取目标业务对应的目标日志文件。
S405,使用目标数据提取脚本在目标日志文件中提取目标数据。
上述流程中数据查询方式采用直接入数据湖查询,而数据湖与业务数据库不为同一个数据库实例,产生业务数据的数据库通过每日的日终批量与数据湖的数据进行同步,即将通过程序,将当天新增的参考业务属性和参考业务的对应关系或者业务日志文件的数据生成一个文件,并将文件下发到数据湖进行更新,这种操作既能保证数据湖与业务数据库的数据信息保持一致,也能避免了因为统计报表导致的读写任务过多占用过多服务器资源的问题,避免对正常业务产生影响。
需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机***中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
本申请实施例还提供了一种业务数据的提取装置,需要说明的是,本申请实施例的业务数据的提取装置可以用于执行本申请实施例所提供的用于业务数据的提取方法。以下对本申请实施例提供的业务数据的提取装置进行介绍。
图5是根据本申请实施例的业务数据的提取装置的示意图。如图5所示,该装置包括:第一获取模块502、第二获取模块504、筛选模块506、第一提取模块508,其中:
第一获取模块502,用于获取查询请求,其中,所述查询请求用于请求查询具有目标业务属性的业务数据;第二获取模块504与上述第一获取模块502连接,用于从具有对应关系的参考业务属性和参考业务中获取所述目标业务属性对应的目标业务;筛选模块506与上述第二获取模块504连接,用于从日志文件集合中筛选所述目标业务对应的目标日志文件,其中,所述日志文件集中包括执行业务所产生的日志文件;第一提取模块508与上述筛选模块506连接,用于从所述目标日志文件中提取业务数据,得到目标业务数据,其中,所述目标业务数据为具有所述目标业务属性的业务数据。
可选地,在本申请实施例提供的业务数据的提取装置中,参考业务属性和参考业务具有对应关系,查询请求用于请求查询具有目标业务属性的业务数据,通过查询请求能够知道要查询的业务数据的目标业务属性,进而能够在具有对应关系的参考业务属性和参考业务中获取待与目标业务属性对应的目标业务,即通过目标业务属性确定出产生要查询的业务数据的目标业务,进而在目标业务的目标日志文件中提取出目标业务数据,实现在查询时只需要知道要查询的业务数据的目标业务属性,通过目标业务属性查询业务,进而提取业务对应的目标业务数据,从而实现了业务数据查询的灵活性和可扩展性。采用上述技术方案,解决了相关技术中业务数据的查询效率较低等问题,实现了提高业务数据的查询效率的技术效果。
可选的,所述第二获取模块,包括:匹配单元,用于将目标子属性集合与具有对应关系的参考子属性集合和参考程序标识中的每个参考子属性集合进行匹配,其中,所述参考子属性集合中包括多个参考业务子属性,所述多个参考业务子属性用于从多个维度对业务的业务类型进行划分,所述目标业务属性包括所述目标子属性集合;获取单元,用于获取与所述目标子属性集合匹配成功的参考子属性集合所对应的目标程序标识,其中,所述目标程序标识用于唯一标识所述目标业务。
可选的,所述匹配单元,用于:确定所述目标子属性集合中所包括的一个或者多个目标业务子属性中每个目标业务子属性的目标属性值与所述每个所述参考子属性集合中对应维度的参考业务子属性的参考属性值是否一致;将所述参考属性值与所述目标属性值全部一致的参考子属性集合确定为与所述目标子属性集合匹配成功的参考子属性集合。
可选的,所述匹配单元,用于:在所述一个或者多个目标业务子属性中包括目标部门类型标识的情况下,从所述参考子属性集合中获取具有参考部门类型标识的参考标识值与所述目标部门类型标识的目标标识值一致的候选子属性集合;确定所述目标业务子属性中所包括的目标业务标识串中的每个目标标识位与每个所述候选子属性集合中所包括的候选业务标识串上对应的候选标识位是否一致,其中,所述目标业务标识串包括以下至少之一:登录业务标识,动账类业务标识,业务动户类业务标识,线程类业务标识,接口类业务标识,登出业务标识;在所述一个或者多个目标业务子属性中不包括目标部门类型标识的情况下,确定所述目标业务子属性中所包括的目标业务标识串中的每个目标标识位与每个所述参考子属性集合中所包括的参考业务标识串上对应的参考标识位是否一致,其中,所述目标业务标识串包括以下至少之一:登录业务标识,动账类业务标识,业务动户类业务标识,线程类业务标识,接口类业务标识,登出业务标识。
可选的,所述第一提取模块包括,包括:生成单元,用于根据所述目标业务属性对应的目标字段生成目标数据提取脚本,其中,所述目标数据提取脚本用于运行提取所述目标字段对应数据的程序;运行单元,用于对所述目标日志文件运行所述目标数据提取脚本,得到所述目标业务数据。
可选的,所述根据所述生成单元,用于:获取初始数据提取脚本,其中,所述初始数据提取脚本记录了提取数据的程序模板;将所述目标字段编辑至所述初始数据提取脚本中的对应位置,得到所述目标数据提取脚本。
可选的,所述装置包括以下之一:第二提取模块,用于在所述根据所述目标业务属性对应的目标字段生成目标数据提取脚本之前,从所述查询请求中提取所述目标业务属性的目标字段;第三提取模块,用于从具有对应关系的参考业务属性和参考业务中提取与所述目标业务属性对应的所述参考业务属性的字段作为所述目标字段。
本申请的实施例还提供了一种存储介质,该存储介质包括存储的程序,其中,上述程序运行时执行上述任一项业务数据的提取方法。
可选地,在本实施例中,上述存储介质可以被设置为存储用于执行以下步骤的程序代码:获取查询请求,其中,所述查询请求用于请求查询具有目标业务属性的业务数据;从具有对应关系的参考业务属性和参考业务中获取所述目标业务属性对应的目标业务;从日志文件集合中筛选所述目标业务对应的目标日志文件,其中,所述日志文件集中包括执行业务所产生的日志文件;从所述目标日志文件中提取业务数据,得到目标业务数据,其中,所述目标业务数据为具有所述目标业务属性的业务数据。
本申请的实施例还提供了一种电子装置,包括存储器和处理器,该存储器中存储有计算机程序,该处理器被设置为运行计算机程序以执行上述任一项业务数据的提取方法实施例中的步骤。
可选地,上述电子装置还可以包括传输设备以及输入输出设备,其中,该传输设备和上述处理器连接,该输入输出设备和上述处理器连接。
可选地,在本实施例中,上述处理器可以被设置为通过计算机程序执行以下步骤:获取查询请求,其中,所述查询请求用于请求查询具有目标业务属性的业务数据;从具有对应关系的参考业务属性和参考业务中获取所述目标业务属性对应的目标业务;从日志文件集合中筛选所述目标业务对应的目标日志文件,其中,所述日志文件集中包括执行业务所产生的日志文件;从所述目标日志文件中提取业务数据,得到目标业务数据,其中,所述目标业务数据为具有所述目标业务属性的业务数据。
所述业务数据的提取装置包括处理器和存储器,上述单元等均作为程序单元存储在存储器中,由处理器执行存储在存储器中的上述程序单元来实现相应的功能。
处理器中包含内核,由内核去存储器中调取相应的程序单元。内核可以设置一个或以上,通过调整内核参数来实现提高业务数据的查询效率的效果。
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM),存储器包括至少一个存储芯片。
本发明实施例提供了一种计算机可读存储介质,其上存储有程序,该程序被处理器执行时实现所述业务数据的提取方法。
本发明实施例提供了一种处理器,所述处理器用于运行程序,其中,所述程序运行时执行所述业务数据的提取方法。
图6是根据本申请实施例的一种业务数据的提取方法的硬件环境示意图,如图6所示,发明实施例提供了一种电子设备,设备包括处理器、存储器及存储在存储器上并可在处理器上运行的程序,处理器执行程序时实现以下步骤:获取查询请求,其中,所述查询请求用于请求查询具有目标业务属性的业务数据;从具有对应关系的参考业务属性和参考业务中获取所述目标业务属性对应的目标业务;从日志文件集合中筛选所述目标业务对应的目标日志文件,其中,所述日志文件集中包括执行业务所产生的日志文件;从所述目标日志文件中提取业务数据,得到目标业务数据,其中,所述目标业务数据为具有所述目标业务属性的业务数据。
可选的,所述从具有对应关系的参考业务属性和参考业务中获取所述目标业务属性对应的目标业务,包括:将目标子属性集合与具有对应关系的参考子属性集合和参考程序标识中的每个参考子属性集合进行匹配,其中,所述参考子属性集合中包括多个参考业务子属性,所述多个参考业务子属性用于从多个维度对业务的业务类型进行划分,所述目标业务属性包括所述目标子属性集合;获取与所述目标子属性集合匹配成功的参考子属性集合所对应的目标程序标识,其中,所述目标程序标识用于唯一标识所述目标业务。
可选的,所述将目标子属性集合与具有对应关系的参考子属性集合和参考程序标识中的每个参考子属性集合进行匹配,包括:确定所述目标子属性集合中所包括的一个或者多个目标业务子属性中每个目标业务子属性的目标属性值与所述每个所述参考子属性集合中对应维度的参考业务子属性的参考属性值是否一致;将所述参考属性值与所述目标属性值全部一致的参考子属性集合确定为与所述目标子属性集合匹配成功的参考子属性集合。
可选的,所述确定所述目标子属性集合中所包括的一个或者多个目标业务子属性中每个目标业务子属性的目标属性值与所述每个所述参考子属性集合中对应维度的参考业务子属性的参考属性值是否一致,包括:在所述一个或者多个目标业务子属性中包括目标部门类型标识的情况下,从所述参考子属性集合中获取具有参考部门类型标识的参考标识值与所述目标部门类型标识的目标标识值一致的候选子属性集合;确定所述目标业务子属性中所包括的目标业务标识串中的每个目标标识位与每个所述候选子属性集合中所包括的候选业务标识串上对应的候选标识位是否一致,其中,所述目标业务标识串包括以下至少之一:登录业务标识,动账类业务标识,业务动户类业务标识,线程类业务标识,接口类业务标识,登出业务标识;在所述一个或者多个目标业务子属性中不包括目标部门类型标识的情况下,确定所述目标业务子属性中所包括的目标业务标识串中的每个目标标识位与每个所述参考子属性集合中所包括的参考业务标识串上对应的参考标识位是否一致,其中,所述目标业务标识串包括以下至少之一:登录业务标识,动账类业务标识,业务动户类业务标识,线程类业务标识,接口类业务标识,登出业务标识。
可选的,所述从所述目标日志文件中提取业务数据,得到目标业务数据,包括:根据所述目标业务属性对应的目标字段生成目标数据提取脚本,其中,所述目标数据提取脚本用于运行提取所述目标字段对应数据的程序;对所述目标日志文件运行所述目标数据提取脚本,得到所述目标业务数据。
可选的,所述根据所述目标业务属性对应的目标字段生成目标数据提取脚本,包括:获取初始数据提取脚本,其中,所述初始数据提取脚本记录了提取数据的程序模板;将所述目标字段编辑至所述初始数据提取脚本中的对应位置,得到所述目标数据提取脚本。
可选的,在所述根据所述目标业务属性对应的目标字段生成目标数据提取脚本之前,所述方法还包括以下之一:从所述查询请求中提取所述目标业务属性的目标字段;从具有对应关系的参考业务属性和参考业务中提取与所述目标业务属性对应的所述参考业务属性的字段作为所述目标字段。
本文中的设备可以是服务器、PC、PAD、手机等。
本申请还提供了一种计算机程序产品,当在数据处理设备上执行时,适于执行初始化有如下方法步骤的程序:获取查询请求,其中,所述查询请求用于请求查询具有目标业务属性的业务数据;从具有对应关系的参考业务属性和参考业务中获取所述目标业务属性对应的目标业务;从日志文件集合中筛选所述目标业务对应的目标日志文件,其中,所述日志文件集中包括执行业务所产生的日志文件;从所述目标日志文件中提取业务数据,得到目标业务数据,其中,所述目标业务数据为具有所述目标业务属性的业务数据。。
可选的,上述计算机程序产品还适于执行初始化有如下方法步骤的程序:将目标子属性集合与具有对应关系的参考子属性集合和参考程序标识中的每个参考子属性集合进行匹配,其中,所述参考子属性集合中包括多个参考业务子属性,所述多个参考业务子属性用于从多个维度对业务的业务类型进行划分,所述目标业务属性包括所述目标子属性集合;获取与所述目标子属性集合匹配成功的参考子属性集合所对应的目标程序标识,其中,所述目标程序标识用于唯一标识所述目标业务。
可选的,上述计算机程序产品还适于执行初始化有如下方法步骤的程序:确定所述目标子属性集合中所包括的一个或者多个目标业务子属性中每个目标业务子属性的目标属性值与所述每个所述参考子属性集合中对应维度的参考业务子属性的参考属性值是否一致;将所述参考属性值与所述目标属性值全部一致的参考子属性集合确定为与所述目标子属性集合匹配成功的参考子属性集合。
可选的,上述计算机程序产品还适于执行初始化有如下方法步骤的程序:在所述一个或者多个目标业务子属性中包括目标部门类型标识的情况下,从所述参考子属性集合中获取具有参考部门类型标识的参考标识值与所述目标部门类型标识的目标标识值一致的候选子属性集合;确定所述目标业务子属性中所包括的目标业务标识串中的每个目标标识位与每个所述候选子属性集合中所包括的候选业务标识串上对应的候选标识位是否一致,其中,所述目标业务标识串包括以下至少之一:登录业务标识,动账类业务标识,业务动户类业务标识,线程类业务标识,接口类业务标识,登出业务标识;在所述一个或者多个目标业务子属性中不包括目标部门类型标识的情况下,确定所述目标业务子属性中所包括的目标业务标识串中的每个目标标识位与每个所述参考子属性集合中所包括的参考业务标识串上对应的参考标识位是否一致,其中,所述目标业务标识串包括以下至少之一:登录业务标识,动账类业务标识,业务动户类业务标识,线程类业务标识,接口类业务标识,登出业务标识。
可选的,上述计算机程序产品还适于执行初始化有如下方法步骤的程序:根据所述目标业务属性对应的目标字段生成目标数据提取脚本,其中,所述目标数据提取脚本用于运行提取所述目标字段对应数据的程序;对所述目标日志文件运行所述目标数据提取脚本,得到所述目标业务数据。
可选的,上述计算机程序产品还适于执行初始化有如下方法步骤的程序:获取初始数据提取脚本,其中,所述初始数据提取脚本记录了提取数据的程序模板;将所述目标字段编辑至所述初始数据提取脚本中的对应位置,得到所述目标数据提取脚本。
可选的,上述计算机程序产品还适于执行初始化有如下方法步骤的程序:从所述查询请求中提取所述目标业务属性的目标字段;从具有对应关系的参考业务属性和参考业务中提取与所述目标业务属性对应的所述参考业务属性的字段作为所述目标字段。
本领域内的技术人员应明白,本申请的实施例可提供为方法、***、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(***)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。存储器是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。
本领域技术人员应明白,本申请的实施例可提供为方法、***或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
以上仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。

Claims (10)

1.一种业务数据的提取方法,其特征在于,包括:
获取查询请求,其中,所述查询请求用于请求查询具有目标业务属性的业务数据;
从具有对应关系的参考业务属性和参考业务中获取所述目标业务属性对应的目标业务;
从日志文件集合中筛选所述目标业务对应的目标日志文件,其中,所述日志文件集中包括执行业务所产生的日志文件;
从所述目标日志文件中提取业务数据,得到目标业务数据,其中,所述目标业务数据为具有所述目标业务属性的业务数据。
2.根据权利要求1所述的方法,其特征在于,所述从具有对应关系的参考业务属性和参考业务中获取所述目标业务属性对应的目标业务,包括:
将目标子属性集合与具有对应关系的参考子属性集合和参考程序标识中的每个参考子属性集合进行匹配,其中,所述参考子属性集合中包括多个参考业务子属性,所述多个参考业务子属性用于从多个维度对业务的业务类型进行划分,所述目标业务属性包括所述目标子属性集合;
获取与所述目标子属性集合匹配成功的参考子属性集合所对应的目标程序标识,其中,所述目标程序标识用于唯一标识所述目标业务。
3.根据权利要求2所述的方法,其特征在于,所述将目标子属性集合与具有对应关系的参考子属性集合和参考程序标识中的每个参考子属性集合进行匹配,包括:
确定所述目标子属性集合中所包括的一个或者多个目标业务子属性中每个目标业务子属性的目标属性值与所述每个所述参考子属性集合中对应维度的参考业务子属性的参考属性值是否一致;
将所述参考属性值与所述目标属性值全部一致的参考子属性集合确定为与所述目标子属性集合匹配成功的参考子属性集合。
4.根据权利要求3所述的方法,其特征在于,所述确定所述目标子属性集合中所包括的一个或者多个目标业务子属性中每个目标业务子属性的目标属性值与所述每个所述参考子属性集合中对应维度的参考业务子属性的参考属性值是否一致,包括:
在所述一个或者多个目标业务子属性中包括目标部门类型标识的情况下,从所述参考子属性集合中获取具有参考部门类型标识的参考标识值与所述目标部门类型标识的目标标识值一致的候选子属性集合;确定所述目标业务子属性中所包括的目标业务标识串中的每个目标标识位与每个所述候选子属性集合中所包括的候选业务标识串上对应的候选标识位是否一致,其中,所述目标业务标识串包括以下至少之一:登录业务标识,动账类业务标识,业务动户类业务标识,线程类业务标识,接口类业务标识,登出业务标识;
在所述一个或者多个目标业务子属性中不包括目标部门类型标识的情况下,确定所述目标业务子属性中所包括的目标业务标识串中的每个目标标识位与每个所述参考子属性集合中所包括的参考业务标识串上对应的参考标识位是否一致,其中,所述目标业务标识串包括以下至少之一:登录业务标识,动账类业务标识,业务动户类业务标识,线程类业务标识,接口类业务标识,登出业务标识。
5.根据权利要求1所述的方法,其特征在于,所述从所述目标日志文件中提取业务数据,得到目标业务数据,包括:
根据所述目标业务属性对应的目标字段生成目标数据提取脚本,其中,所述目标数据提取脚本用于运行提取所述目标字段对应数据的程序;
对所述目标日志文件运行所述目标数据提取脚本,得到所述目标业务数据。
6.根据权利要求5所述的方法,其特征在于,所述根据所述目标业务属性对应的目标字段生成目标数据提取脚本,包括:
获取初始数据提取脚本,其中,所述初始数据提取脚本记录了提取数据的程序模板;
将所述目标字段编辑至所述初始数据提取脚本中的对应位置,得到所述目标数据提取脚本。
7.根据权利要求5所述的方法,其特征在于,在所述根据所述目标业务属性对应的目标字段生成目标数据提取脚本之前,所述方法还包括以下之一:
从所述查询请求中提取所述目标业务属性的目标字段;
从具有对应关系的参考业务属性和参考业务中提取与所述目标业务属性对应的所述参考业务属性的字段作为所述目标字段。
8.一种业务数据的提取装置,其特征在于,包括:
第一获取模块,用于获取查询请求,其中,所述查询请求用于请求查询具有目标业务属性的业务数据;
第二获取模块,用于从具有对应关系的参考业务属性和参考业务中获取所述目标业务属性对应的目标业务;
筛选模块,用于从日志文件集合中筛选所述目标业务对应的目标日志文件,其中,所述日志文件集中包括执行业务所产生的日志文件;
第一提取模块,用于从所述目标日志文件中提取业务数据,得到目标业务数据,其中,所述目标业务数据为具有所述目标业务属性的业务数据。
9.一种处理器,其特征在于,所述处理器用于运行程序,其中,所述程序运行时执行权利要求1至7中任意一项所述的方法。
10.一种电子设备,其特征在于,包括一个或多个处理器和存储器,所述存储器用于存储一个或多个程序,其中,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现权利要求1至7中任意一项所述的方法。
CN202210737128.0A 2022-06-27 2022-06-27 业务数据的提取方法、装置、存储介质及电子设备 Pending CN115098738A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210737128.0A CN115098738A (zh) 2022-06-27 2022-06-27 业务数据的提取方法、装置、存储介质及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210737128.0A CN115098738A (zh) 2022-06-27 2022-06-27 业务数据的提取方法、装置、存储介质及电子设备

Publications (1)

Publication Number Publication Date
CN115098738A true CN115098738A (zh) 2022-09-23

Family

ID=83294192

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210737128.0A Pending CN115098738A (zh) 2022-06-27 2022-06-27 业务数据的提取方法、装置、存储介质及电子设备

Country Status (1)

Country Link
CN (1) CN115098738A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115357630A (zh) * 2022-10-24 2022-11-18 北京国电通网络技术有限公司 信息检测方法、装置、设备、计算机可读介质和程序产品

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115357630A (zh) * 2022-10-24 2022-11-18 北京国电通网络技术有限公司 信息检测方法、装置、设备、计算机可读介质和程序产品
CN115357630B (zh) * 2022-10-24 2023-01-17 北京国电通网络技术有限公司 信息检测方法、装置、设备、计算机可读介质和程序产品

Similar Documents

Publication Publication Date Title
US10257187B2 (en) Prompting login account
CN108737325B (zh) 一种多租户数据隔离方法、装置及***
US20110302277A1 (en) Methods and apparatus for web-based migration of data in a multi-tenant database system
CN111046237B (zh) 用户行为数据处理方法、装置、电子设备及可读介质
CN106997557B (zh) 订单信息采集方法及装置
CN104579909B (zh) 一种用户信息的分类、用户分组信息的获取方法和设备
CN106776973B (zh) 黑名单数据生成方法和装置
WO2020000720A1 (zh) 服务器、报文处理方法、程序和计算机可读存储介质
CN111459985A (zh) 标识信息处理方法及装置
CN109241384B (zh) 一种科研信息的可视化方法及装置
CN106547646B (zh) 一种数据备份及恢复方法、数据备份及恢复装置
CN106529953B (zh) 一种对业务属性进行风险识别的方法及装置
CN110019754A (zh) 一种知识库的建立方法、装置及设备
CN111177481B (zh) 用户标识映射方法及装置
KR102114532B1 (ko) 정보 운용
US11151088B2 (en) Systems and methods for verifying performance of a modification request in a database system
CN115098738A (zh) 业务数据的提取方法、装置、存储介质及电子设备
CN111200645B (zh) 业务请求处理方法、装置、设备及可读存储介质
CN116993523A (zh) 配置化对账方法、装置、设备及存储介质
CN106874327B (zh) 一种针对业务数据的计数方法及装置
US9576062B1 (en) Resource object resolution management
CN110781375A (zh) 一种用户状态标识确定方法及装置
CN110851446B (zh) 数据表的生成方法、装置、计算机设备及存储介质
CN112148925B (zh) 用户标识关联查询方法、装置、设备及可读存储介质
CN113902415A (zh) 财务数据核对方法、装置、计算机设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination