CN112613853A - 一种数据归集方法、装置、计算机设备和可读存储介质 - Google Patents
一种数据归集方法、装置、计算机设备和可读存储介质 Download PDFInfo
- Publication number
- CN112613853A CN112613853A CN202011620902.7A CN202011620902A CN112613853A CN 112613853 A CN112613853 A CN 112613853A CN 202011620902 A CN202011620902 A CN 202011620902A CN 112613853 A CN112613853 A CN 112613853A
- Authority
- CN
- China
- Prior art keywords
- data
- target
- service
- information
- client
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 47
- 230000002776 aggregation Effects 0.000 title claims description 31
- 238000004220 aggregation Methods 0.000 title claims description 31
- 238000013480 data collection Methods 0.000 claims abstract description 20
- 238000012216 screening Methods 0.000 claims abstract description 20
- 238000004590 computer program Methods 0.000 claims description 7
- 238000000605 extraction Methods 0.000 claims description 5
- 238000005516 engineering process Methods 0.000 abstract description 2
- 238000007726 management method Methods 0.000 description 21
- 238000012545 processing Methods 0.000 description 7
- 230000008569 process Effects 0.000 description 6
- 238000004458 analytical method Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 230000008901 benefit Effects 0.000 description 3
- 238000004891 communication Methods 0.000 description 3
- 238000007405 data analysis Methods 0.000 description 3
- 238000013507 mapping Methods 0.000 description 3
- 230000007246 mechanism Effects 0.000 description 3
- 230000009467 reduction Effects 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 230000004931 aggregating effect Effects 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 238000007670 refining Methods 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/10—Office automation; Time management
- G06Q10/103—Workflow collaboration or project management
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/21—Design, administration or maintenance of databases
- G06F16/215—Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Strategic Management (AREA)
- Human Resources & Organizations (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Quality & Reliability (AREA)
- Entrepreneurship & Innovation (AREA)
- General Engineering & Computer Science (AREA)
- Economics (AREA)
- Marketing (AREA)
- Operations Research (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种数据归集方法,该方法具体包括:在检测到数据归集指令时,获取目标业务数据;从目标业务数据中筛选出目标业务节点对应的业务数据,其中,所述目标业务节点对应的业务数据包括询价数据、保单数据和/或***数据;获取目标业务节点的业务规则配置;根据目标业务节点的业务规则配置从对应的业务数据中提取具有从属关系的目标业务元素;将提取的目标业务元素进行归集。另外,本发明还涉及区块链技术。
Description
技术领域
本发明涉及计算机技术领域,具体涉及一种数据归集方法、装置、计算机设备和计算机可读存储介质。
背景技术
客户识别是客户经营分析、业务精细化管理的基础。在目前的大客户识别过程中,一般通过客户公开的工商注册信息和对外投资信息等来获取客户集团性质、控股关系和总分关系等数据,并以此为规则来收集、清洗、归集和分析数据,最终形成大客户与单一法人客户之间的映射关系,同时还可将此映射关系作为基础进一步进行业务分析和管理,以细化公司业务管理粒度。
但是在实际的业务管理场景中,用户发现由于实际业务开展的复杂性以及部分业务的特殊性,根据上述规则归集出的客户间映射关系,与实际情况相差甚远,反而对业务精细化管理造成阻碍。
针对现有的归集方案中数据归集的不准确,为用户数据分析、业务精细化管理和降低成本造成巨大阻碍的技术问题,目前尚未提供有效的解决方案。
发明内容
本发明的目的在于提供了一种数据归集方法、装置、计算机设备和计算机可读存储介质,能够解决现有技术中数据归集的不准确,为用户数据分析、业务精细化管理和降低成本造成巨大阻碍的技术问题。
本发明的一个方面提供了一种数据归集方法,所述方法包括:在检测到数据归集指令时,获取目标业务数据;从所述目标业务数据中筛选出目标业务节点对应的业务数据,其中,所述目标业务节点对应的业务数据包括询价数据、保单数据和/或***数据;获取所述目标业务节点的业务规则配置;根据所述目标业务节点的业务规则配置从对应的业务数据中提取具有从属关系的目标业务元素;将提取的所述目标业务元素进行归集。
可选地,所述目标业务节点包括询价节点,所述目标业务节点对应的业务数据包括询价数据,所述根据所述目标业务节点的业务规则配置从对应的业务数据中提取具有从属关系的目标业务元素的步骤包括:在所述询价数据中,筛选出完成报价、属于特定业务类型且属于特定产品类型的询价数据,记为目标询价数据;从所述目标询价数据中提取询价客户信息作为目标主客户信息,并提取隶属于所述询价客户的客户信息作为目标子客户信息。
可选地,所述目标业务节点包括保单节点,所述目标业务节点对应的业务数据包括保单数据,所述根据所述目标业务节点的业务规则配置从对应的业务数据中提取具有从属关系的目标业务元素的步骤包括:在所述保单数据中,筛选出属于特定产品类型、同一投保客户购买的保单数量大于等于第一阈值且隶属于该投保客户的被保客户数量大于等于第二阈值的保单数据,记为目标保单数据;从所述目标保单数据中提取投保客户信息作为目标主客户信息,并提取对应被保客户信息作为目标子客户信息。
可选地,所述目标业务节点包括***节点,所述目标业务节点对应的业务数据包括***数据,所述根据所述目标业务节点的业务规则配置从对应的业务数据中提取具有从属关系的目标业务元素的步骤包括:若客户申请开具***的***抬头数量大于等于第三阈值,则从所述***数据中提取该客户信息记为目标主客户信息,并提取对应***抬头的客户信息记为目标子客户信息,其中,提取的***抬头的客户隶属于申请开具***的客户。
可选地,所述将提取的所述目标元素进行归集的步骤包括:根据每个目标主客户信息和其关联的目标子客户信息生成一条记录;以及遍历所有目标主客户信息,合并存在重复目标客户信息的记录;和/或遍历所有目标子客户信息,合并存在重复目标子客户信息的记录。
可选地,所述合并存在重复目标子客户信息的记录的步骤包括:若任意两条记录的目标子客户信息之间存在包含关系,则合并该两条记录;或若任意两条记录的目标子客户信息之间的覆盖率大于等于第四阈值,则合并该两条记录。
可选地,在所述在检测到数据归集指令时,获取目标业务数据的步骤之前,所述方法还包括:将历史业务数据按其业务时间和预置时间长度进行划分,得到N个所述目标业务数据,其中,N为大于等于1的整数。
本发明的另一个方面提供了一种数据归集装置,所述装置包括:第一获取模块,用于在检测到数据归集指令时,获取目标业务数据;筛选模块,用于从所述目标业务数据中筛选出目标业务节点对应的业务数据,其中,所述目标业务节点对应的业务数据包括询价数据、保单数据和/或***数据;第二获取模块,用于获取所述目标业务节点的业务规则配置;提取模块,用于根据所述目标业务节点的业务规则配置从对应的业务数据中提取具有从属关系的目标业务元素;归集模块,用于将提取的所述目标业务元素进行归集。
本发明的再一个方面提供了一种计算机设备,所述计算机设备包括:存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述任一实施例所述的数据归集方法。
本发明的又一个方面提供了一种计算机可读存储介质,其上存储有计算机程序,上述计算机程序被处理器执行时实现上述任一实施例所述的数据归集方法。进一步地,所述计算机可读存储介质可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作***、至少一个功能所需的应用程序等;存储数据区可存储根据区块链节点的使用所创建的数据等。
本发明提供的数据归集方法,并不是如传统方案那般根据客户公开的工商注册信息和对外投资信息对数据进行归集,由于这些***息不准确,使得数据归集结果准确性也较低,而是基于实际业务数据出发,从实际业务数据中归集具有从属关系的业务元素,与传统数据相比,数据归集准确性较高。并且,由于业务数据量庞大,通过针对不同节点预置不同业务规则配置,在提取业务元素时按照业务节点筛选对应业务规则配置,可以提高业务元素提取速度,从而提高数据归集速度。通过本发明提供的数据归集方法,提升了企业业务管理的能力,细化管理的颗粒度,降低管理成本和人力成本,解决了现有技术中数据归集的不准确,为用户数据分析、业务精细化管理和降低成本造成巨大阻碍的技术问题。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1示意性示出了根据本发明实施例一的数据归集方法的流程图;
图2示意性示出了根据本发明实施例二的数据归集装置的框图;
图3示意性示出了根据本发明实施例三的适于实现数据归集方法的计算机设备的框图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
实施例一
本实施例一公开了一种数据归集方法,该方法可以应用于电子设备,如手机、笔记本电脑、平板电脑或台式电脑等。如图1所示,图1示意性示出了根据本发明实施例一的数据归集方法的流程图,其中,该数据归集方法可以包括步骤S1~步骤S5,具体地:
步骤S1,在检测到数据归集指令时,获取目标业务数据。
数据归集,指同一类数据集合存放在一起。
数据归集指令,用于触发电子设备执行数据归集方法,其中,数据归集指令可以是电子设备定时发出的,还可以是用户通过操作电子设备发出的,如语音操作、触摸操作或VR手势操作等。
目标业务数据,可以是按时间统计的业务数据,如按年份统计、按季度统计或按月份统计等。例如,目标业务数据为2019年度的所有业务数据。其中,本实施例所述的业务数据可以保险业务数据,具体可以为寿险业务数据、重疾险业务数据、车险业务数据和养老险业务数据等等。
可选地,在步骤S1之前,该数据归集方法还可以包括:
将历史业务数据按照其业务时间和预置时间段进行划分,得到N个所述目标业务数据,其中,N为大于等于1的整数。
其中,业务时间可以是历史业务数据的创建时间,也可以是历史业务数据的生效时间,还可以是历史业务数据的失效时间,具体可根据实际业务需求进行选择,本实施例对此不做限定。
预置时间长度可以是以年为单位的长度、以季度为单位的长度或者以月为单位的长度等,本实施例对此不做限定。
例如,业务时间为生效时间,预置时间长度是以年为单位的长度,历史业务数据的生效时间为2010-2019年,则可以将2010的历史业务数据划分在一起,将2011年的历史业务数据划分在一起,…,将2019年的历史业务数据划分在一起。其中,划分得到的每年的历史业务数据均可称为目标业务数据。
步骤S2,从所述目标业务数据中筛选出目标业务节点对应的业务数据,其中,所述目标业务节点对应的业务数据包括询价数据、保单数据和/或***数据。
目标业务数据包含多个业务节点,如询价节点、保单节点、***节点、理赔节点和终止节点等,其中,每个业务节点对应有自己的业务数据,目标业务数据的所有业务节点所对应的业务数据构成该目标业务数据。
目标业务节点可以是目标业务数据包含的众多业务节点中的一个或多个。若目标业务节点为理赔节点,则目标业务节点对应的业务数据可称为理赔数据。
步骤S3,获取所述目标业务节点的业务规则配置。
其中,为了确保数据安全性,可以将业务规则配置预先存储至区块链中。
步骤S4,根据所述目标业务节点的业务规则配置从对应的业务数据中提取具有从属关系的目标业务元素。
每个目标业务节点对应一个预置的业务规则配置,该业务规则配置用于定义将符合何种条件的具有从属关系的业务元素从目标业务节点对应的业务数据中提取出来,即提取目标业务元素,其中,业务元素可以为客户信息、价格信息和/或车辆信息等。以目标业务元素为目标客户信息为例,具有从属关系的目标业务元素例如为:**集团,**地产和**影院,其中,**地产和**影院均隶属于**集团。
本实施例以目标业务元素为目标客户信息为示例,结合以下三种方案详细阐述步骤S4,其中,目标客户信息可以包括目标主客户信息和目标子客户信息,这些客户信息可以包括客户名称、客户位置和客户身份等。另外,以下三种方案既可单独存在,又可相互结合。
方案一
所述目标业务节点包括询价节点,所述目标业务节点对应的业务数据包括询价数据,步骤S4可以包括步骤A1和步骤A2,其中:
步骤A1,在所述询价数据中,筛选出完成报价、属于特定业务类型且属于特定产品类型的询价数据,记为目标询价数据。
步骤A2,从所述目标询价数据中提取询价客户信息作为目标主客户信息,并提取隶属于所述询价客户的客户信息作为目标子客户信息。
报价,指询价后被询价方返回具体价格。业务类型可以包括普通询价类型和统括询价类型,普通询价类型指针对单一客户的询价;统括询价类型指针对多个有关系的客户一起询价。对于统括询价类型的数据,预置有统括标记,通过查询统括标记可以确定哪些询价数据属于统括询价类型。其中,特定业务类型可以是预定的业务类型,例如为统括询价类型。相应地,特定产品类型也可以是预定的产品类型,例如为综福业务下的产品类型。其中,特定业务类型和特定产品类型可以根据实际业务需求设定,上述实施例只用于解释说明,并不起到限定作用。
询价客户信息可以是交易客户信息,如购买保单的客户信息。询价客户关联的客户信息可以是询价客户的子公司。如询价客户为**集团,询价客户关联的客户可以为该集团下的**超市、**地产和**影院等。
为了便于统一管理,在提取出询价客户信息和隶属于询价客户的客户信息之后,可将询价客户信息作为目标主客户信息并将隶属于询价客户的客户信息作为目标子客户信息,其中,目标主客户信息和目标子客户信息之间具有关联关系。
下面以一个具体示例解析说明。
例如,从询价节点对应的所有询价数据中,将满足以下三个条件的询价数据筛选出来作为目标询价数据:完成报价的询价数据、包含统括标记的询价数据以及属于综福业务产品类型的询价数据。进一步,提取目标询价数据中的询价客户信息作为目标主客户信息,并提取隶属于询价客户的客户信息作为目标子客户信息,然后将提取的目标主客户信息、目标子客户信息及二者关联关系汇聚成临时集团客户清单。
方案二
所述目标业务节点包括保单节点,所述目标业务节点对应的业务数据包括保单数据,步骤S4可以包括步骤B1和步骤B2,其中:
步骤B1,在所述保单数据中,筛选出属于特定产品类型、同一投保客户购买的保单数量大于等于第一阈值且隶属于该投保客户的被保客户数量大于等于第二阈值的保单数据,记为目标保单数据。
步骤B2,从所述目标保单数据中提取投保客户信息作为目标主客户信息,并提取对应被保客户信息作为目标子客户信息。
本实施例中,业务员可以针对同一询价客户发起多次询价,每次询价对应一个询价号,每个询价号对应一个询价客户,但业务员可以对同一客户发起多次询价,因此一个询价客户可以对应多个询价号。当询价客户成功购买保单时,该询价客户又称为投保客户,此时询价号对应的询价客户又称为询价号对应的投保客户。也即,步骤B1又可以为:在所述保单数据中,筛选出属于特定产品类型、同一询价号关联的保单数量大于等于第一阈值且该询价号关联的被保客户数量大于等于第二阈值的保单数据,记为目标保单数据。
目标保单数据可以包括多份保单的数据,每份保单可以对应一个投保客户和一个被保客户,每个投保客户可通过购买多份保单从而关联多个被保客户,相应地,每个被保客户可以通过多个保单从而关联多个投保客户。
为了便于统一管理,在提取出投保客户信息和被保客户信息之后,可将投保客户信息作为目标主客户信息并将被保客户信息作为目标子客户信息,其中,目标主客户信息和目标子客户信息之间具有关联关系。
下面以一个具体示例解析说明。
例如,从保险节点对应的所有保险数据中,将满足以下三个条件的保险数据筛选出来作为目标保险数据:属于综福业务产品类型、同一投保客户购买的保单数量大于等于2且隶属于该投保客户的被保客户数量也大于等于2的保险数据。进一步,提取目标保险数据中的投保客户信息作为目标主客户信息,并提取被保客户信息作为目标子客户信息,然后将提取的目标主客户信息、目标子客户信息及二者的关联关系汇聚成临时集团客户清单。
方案三
所述目标业务节点包括***节点,所述目标业务节点对应的业务数据包括***数据,步骤S4可以包括:
若客户申请开具***的***抬头数量大于等于第三阈值,则从所述***数据中提取该客户信息记为目标主客户信息,并提取对应***抬头的客户信息记为目标子客户信息,其中,提取的***抬头的客户隶属于申请开具***的客户。
具体地,在***节点对应的所有***数据中,判断任一申请开具***的客户所对应的***抬头数量是否大于等于第三阈值,若是,则提取该客户的信息即为目标主客户信息,并提取对应***抬头的客户信息即为目标子客户信息。然后可以将提取的目标主客户信息、目标子客户信息及二者的关联关系汇聚成临时集团客户清单。
需要说明的是,为了保证提取的目标业务元素字段的准确性和规范化,还可以在获取目标业务数据后,预先对目标业务数据中的所有业务元素进行规范处理,如统一的去空格、全半角和怪字符处理,规范统一的识别标准。
步骤S5,将提取的所述目标业务元素进行归集。
本实施例中,可以将方案一、方案二和方案三中任意一个或多个方案提取的目标业务元素进行归集。
可选地,步骤S5可以包括步骤S51和步骤S52,或者步骤S51和步骤S53,或者步骤S51~步骤S53,其中:
步骤S51,根据每个目标主客户信息和其关联的目标子客户信息生成一条记录。
步骤S52,遍历所有目标主客户信息,合并存在重复目标客户信息的记录。
步骤S53,遍历所有目标子客户信息,合并存在重复目标子客户信息的记录。
本实施例中,对数据进行归集时,可以将每个目标主客户信息和其关联的目标子客户信息生成一条记录,然后将生成的这些记录进行存储。例如,可以从临时集团客户清单中获取每个目标主客户信息和其关联的目标子客户信息,然后根据获取的这些信息生成一条记录。对于每条记录可以进行规范字处理,如,每条记录的标准字段如下:目标客户编号、目标主客户信息和目标子客户信息,其中:目标客户编号为空;若目标主客户信息为空值,则可进行手工维护;目标子客户信息包含有目标主客户信息关联的所有客户的信息。其中,在目标主客户信息和其关联的目标子客户信息中,这些目标子客户均隶属于该目标主客户。另外,为了保证数据的整洁性,还可以对生成的记录去重处理,具体可以将存在重复目标客户信息的记录进行合并,和/或将存在重复目标子客户信息的记录。然后可以自动生成去重后的记录中的目标客户编号,进一步将这些完整记录作为大客户池用于后续业务分析。
此外,由于一个目标主客户信息可能关联多个目标子客户信息,因此在合并存在重复目标子客户信息的记录时,可以执行步骤S531或步骤S532的方法,其中:
步骤S531,若任意两条记录的目标子客户信息之间存在包含关系,则合并该两条记录。
例如,记录1的目标子客户信息为A、B、C、D、E、F,记录2的目标子客户信息A、B、C,则记录1的目标子客户信息包含记录2的目标子客户信息,则可以将记录1和记录2合并。
步骤S532,若任意两条记录的目标子客户信息之间的覆盖率大于等于第四阈值,则合并该两条记录。
例如,第四阈值为50%,记录1的目标子客户信息为A、B、C、D、E、F、G,记录3的目标子客户信息A、B、C、D,则记录1的目标子客户信息与记录2的目标子客户信息的覆盖率为50%,则可以将记录1和记录3合并。
需要说明的是,为了确保数据安全性,可以将去重的记录存储至区块链中。
本发明从实际业务出发,对不同节点的业务数据设置不同的业务规则属性,在需要进行数据归集时,可以自动根据业务规则配置筛选目标业务元素并对其归集,提升了企业业务管理的能力,细化管理的颗粒度,降低管理成本和人力成本。并且在具体实例中,以目标业务元素为客户为例,设置多种符合业务需求的筛选机制,建立主客户和子客户之间的逻辑关系,可以明确的细分到总、分、机构等层级,为进一步的业务精细化管理、过程管理、品质管理和续保管理提供数据基础,使得***化和精细化管理得以实现。同时鉴于本场景的特殊性,即子客户的多样性,还设置了合并机制,进一步提升了数据归集的整洁和准确性。
实施例二
本发明的实施例二提供了一种数据归集装置,该数据归集装置与上述实施例一相对应,相应的技术特征和技术效果在本实施例中不再详述,相关之处可参考上述实施例一。具体地,图2示意性示出了根据本发明实施例二的数据归集装置的框图,如图2所示,该数据归集装置200可以包括第一获取模块201、筛选模块202、第二获取模块203、提取模块204和归集模块205,其中:
第一获取模块201,用于在检测到数据归集指令时,获取目标业务数据;
筛选模块202,用于从所述目标业务数据中筛选出目标业务节点对应的业务数据,其中,所述目标业务节点对应的业务数据包括询价数据、保单数据和/或***数据;
第二获取模块203,用于获取所述目标业务节点的业务规则配置;
提取模块204,用于根据所述目标业务节点的业务规则配置从对应的业务数据中提取具有从属关系的目标业务元素;
归集模块205,用于将提取的所述目标业务元素进行归集。
可选地,所述目标业务节点包括询价节点,所述目标业务节点对应的业务数据包括询价数据,所述提取模块还用于:在所述询价数据中,筛选出完成报价、属于特定业务类型且属于特定产品类型的询价数据,记为目标询价数据;从所述目标询价数据中提取询价客户信息作为目标主客户信息,并提取隶属于所述询价客户的客户信息作为目标子客户信息。
可选地,所述目标业务节点包括保单节点,所述目标业务节点对应的业务数据包括保单数据,所述提取模块还用于:在所述保单数据中,筛选出属于特定产品类型、同一投保客户购买的保单数量大于等于第一阈值且隶属于该投保客户的被保客户数量大于等于第二阈值的保单数据,记为目标保单数据;从所述目标保单数据中提取投保客户信息作为目标主客户信息,并提取对应被保客户信息作为目标子客户信息。
可选地,所述目标业务节点包括***节点,所述目标业务节点对应的业务数据包括***数据,所述提取模块还用于:若客户申请开具***的***抬头数量大于等于第三阈值,则从所述***数据中提取该客户信息记为目标主客户信息,并提取对应***抬头的客户信息记为目标子客户信息,其中,提取的***抬头的客户隶属于申请开具***的客户。
可选地,所述归集模块还用于:根据每个目标主客户信息和其关联的目标子客户信息生成一条记录;以及遍历所有目标主客户信息,合并存在重复目标客户信息的记录;和/或遍历所有目标子客户信息,合并存在重复目标子客户信息的记录。
可选地,所述归集模块在执行合并存在重复目标子客户信息的记录的步骤时,还用于:在任意两条记录的目标子客户信息之间存在包含关系的情况下,合并该两条记录;或,在任意两条记录的目标子客户信息之间的覆盖率大于等于第四阈值的情况下,合并该两条记录。
可选地,所述装置还包括:划分模块,用于在所述在检测到数据归集指令时,获取目标业务数据的步骤之前,将历史业务数据按其业务时间和预置时间长度进行划分,得到N个所述目标业务数据,其中,N为大于等于1的整数。
实施例三
图3示意性示出了根据本发明实施例三的适于实现数据归集方法的计算机设备的框图。本实施例中,计算机设备300可以是执行程序的智能手机、平板电脑、笔记本电脑、台式计算机、机架式服务器、刀片式服务器、塔式服务器或机柜式服务器(包括独立的服务器,或者多个服务器所组成的服务器集群)等。如图3所示,本实施例的计算机设备300至少包括但不限于:可通过***总线相互通信连接的存储器301、处理器302、网络接口303。需要指出的是,图3仅示出了具有组件301-303的计算机设备300,但是应理解的是,并不要求实施所有示出的组件,可以替代的实施更多或者更少的组件。
本实施例中,存储器303至少包括一种类型的计算机可读存储介质,可读存储介质包括包括闪存、硬盘、多媒体卡、卡型存储器(例如,SD或DX存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘等。在一些实施例中,存储器301可以是计算机设备300的内部存储单元,例如该计算机设备300的硬盘或内存。在另一些实施例中,存储器301也可以是计算机设备300的外部存储设备,例如该计算机设备300上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。当然,存储器301还可以既包括计算机设备300的内部存储单元也包括其外部存储设备。在本实施例中,存储器301通常用于存储安装于计算机设备300的操作***和各类应用软件,例如数据归集方法的程序代码等。此外,存储器301还可以用于暂时地存储已经输出或者将要输出的各类数据。
处理器302在一些实施例中可以是中央处理器(Central Processing Unit,CPU)、控制器、微控制器、微处理器、或其他数据处理芯片。该处理器302通常用于控制计算机设备300的总体操作。例如执行与计算机设备300进行数据交互或者通信相关的控制和处理等的数据归集方法的程序代码。
在本实施例中,存储于存储器301中的数据归集方法还可以被分割为一个或者多个程序模块,并由一个或多个处理器(本实施例为处理器302)所执行,以完成本发明。
网络接口303可包括无线网络接口或有线网络接口,该网络接口303通常用于在计算机设备300与其他计算机设备之间建立通信链接。例如,网络接口303用于通过网络将计算机设备300与外部终端相连,在计算机设备300与外部终端之间的建立数据传输通道和通信链接等。网络可以是企业内部网(Intranet)、互联网(Internet)、全球移动通讯***(Global System of Mobile communication,简称为GSM)、宽带码分多址(Wideband CodeDivision Multiple Access,简称为WCDMA)、4G网络、5G网络、蓝牙(Bluetooth)、Wi-Fi等无线或有线网络。
实施例四
本实施例四还提供一种计算机可读存储介质,包括闪存、硬盘、多媒体卡、卡型存储器(例如,SD或DX存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘、服务器、App应用商城等,其上存储有计算机程序,所述计算机程序被处理器执行时实现数据归集方法。进一步地,所述计算机可读存储介质可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作***、至少一个功能所需的应用程序等;存储数据区可存储根据区块链节点的使用所创建的数据等。
本发明所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。
显然,本领域的技术人员应该明白,上述的本发明实施例的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,并且在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明实施例不限制于任何特定的硬件和软件结合。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
Claims (10)
1.一种数据归集方法,其特征在于,所述方法包括:
在检测到数据归集指令时,获取目标业务数据;
从所述目标业务数据中筛选出目标业务节点对应的业务数据,其中,所述目标业务节点对应的业务数据包括询价数据、保单数据和/或***数据;
获取所述目标业务节点的业务规则配置;
根据所述目标业务节点的业务规则配置从对应的业务数据中提取具有从属关系的目标业务元素;
将提取的所述目标业务元素进行归集。
2.根据权利要求1所述的方法,其特征在于,所述目标业务节点包括询价节点,所述目标业务节点对应的业务数据包括询价数据,所述根据所述目标业务节点的业务规则配置从对应的业务数据中提取具有从属关系的目标业务元素的步骤包括:
在所述询价数据中,筛选出完成报价、属于特定业务类型且属于特定产品类型的询价数据,记为目标询价数据;
从所述目标询价数据中提取询价客户信息作为目标主客户信息,并提取隶属于所述询价客户的客户信息作为目标子客户信息。
3.根据权利要求1所述的方法,其特征在于,所述目标业务节点包括保单节点,所述目标业务节点对应的业务数据包括保单数据,所述根据所述目标业务节点的业务规则配置从对应的业务数据中提取具有从属关系的目标业务元素的步骤包括:
在所述保单数据中,筛选出属于特定产品类型、同一投保客户购买的保单数量大于等于第一阈值且隶属于该投保客户的被保客户数量大于等于第二阈值的保单数据,记为目标保单数据;
从所述目标保单数据中提取投保客户信息作为目标主客户信息,并提取对应被保客户信息作为目标子客户信息。
4.根据权利要求1所述的方法,其特征在于,所述目标业务节点包括***节点,所述目标业务节点对应的业务数据包括***数据,所述根据所述目标业务节点的业务规则配置从对应的业务数据中提取具有从属关系的目标业务元素的步骤包括:
若客户申请开具***的***抬头数量大于等于第三阈值,则从所述***数据中提取该客户信息记为目标主客户信息,并提取对应***抬头的客户信息记为目标子客户信息,其中,提取的***抬头的客户隶属于申请开具***的客户。
5.根据权利要求2至4任一项所述的方法,其特征在于,所述将提取的所述目标元素进行归集的步骤包括:
根据每个目标主客户信息和其关联的目标子客户信息生成一条记录;以及
遍历所有目标主客户信息,合并存在重复目标客户信息的记录;和/或
遍历所有目标子客户信息,合并存在重复目标子客户信息的记录。
6.根据权利要求5所述的方法,其特征在于,所述合并存在重复目标子客户信息的记录的步骤包括:
若任意两条记录的目标子客户信息之间存在包含关系,则合并该两条记录;或
若任意两条记录的目标子客户信息之间的覆盖率大于等于第四阈值,则合并该两条记录。
7.根据权利要求1所述的方法,其特征在于,在所述在检测到数据归集指令时,获取目标业务数据的步骤之前,所述方法还包括:
将历史业务数据按其业务时间和预置时间长度进行划分,得到N个所述目标业务数据,其中,N为大于等于1的整数。
8.一种数据归集装置,其特征在于,所述装置包括:
第一获取模块,用于在检测到数据归集指令时,获取目标业务数据;
筛选模块,用于从所述目标业务数据中筛选出目标业务节点对应的业务数据,其中,所述目标业务节点对应的业务数据包括询价数据、保单数据和/或***数据;
第二获取模块,用于获取所述目标业务节点的业务规则配置;
提取模块,用于根据所述目标业务节点的业务规则配置从对应的业务数据中提取具有从属关系的目标业务元素;
归集模块,用于将提取的所述目标业务元素进行归集。
9.一种计算机设备,所述计算机设备包括:存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7任一项所述的方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011620902.7A CN112613853A (zh) | 2020-12-31 | 2020-12-31 | 一种数据归集方法、装置、计算机设备和可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011620902.7A CN112613853A (zh) | 2020-12-31 | 2020-12-31 | 一种数据归集方法、装置、计算机设备和可读存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112613853A true CN112613853A (zh) | 2021-04-06 |
Family
ID=75249521
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011620902.7A Pending CN112613853A (zh) | 2020-12-31 | 2020-12-31 | 一种数据归集方法、装置、计算机设备和可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112613853A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114791915A (zh) * | 2022-06-22 | 2022-07-26 | 深圳高灯计算机科技有限公司 | 数据归集方法、装置、计算机设备和存储介质 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101556718A (zh) * | 2009-05-21 | 2009-10-14 | 中国建设银行股份有限公司 | 多级账户资金管理***及装置 |
CN110851663A (zh) * | 2019-11-05 | 2020-02-28 | 北京明略软件***有限公司 | 管理元数据的方法和装置 |
CN110851496A (zh) * | 2018-12-07 | 2020-02-28 | 深圳市智税链科技有限公司 | 在区块链网络中查询交易信息的方法、装置、记账节点和介质 |
CN110910108A (zh) * | 2019-11-01 | 2020-03-24 | 华青融天(北京)软件股份有限公司 | 一种数据关联方法、装置、电子设备及存储介质 |
CN111241347A (zh) * | 2019-12-30 | 2020-06-05 | 北京邮电大学 | 一种图数据库的创建方法、企业数据查询方法及装置 |
CN111538872A (zh) * | 2020-07-09 | 2020-08-14 | 太平金融科技服务(上海)有限公司 | 业务节点信息的可视化方法、装置、计算机设备和介质 |
CN111694793A (zh) * | 2020-06-12 | 2020-09-22 | 北京金山云网络技术有限公司 | 一种日志存储方法、装置及日志查询方法、装置 |
-
2020
- 2020-12-31 CN CN202011620902.7A patent/CN112613853A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101556718A (zh) * | 2009-05-21 | 2009-10-14 | 中国建设银行股份有限公司 | 多级账户资金管理***及装置 |
CN110851496A (zh) * | 2018-12-07 | 2020-02-28 | 深圳市智税链科技有限公司 | 在区块链网络中查询交易信息的方法、装置、记账节点和介质 |
CN110910108A (zh) * | 2019-11-01 | 2020-03-24 | 华青融天(北京)软件股份有限公司 | 一种数据关联方法、装置、电子设备及存储介质 |
CN110851663A (zh) * | 2019-11-05 | 2020-02-28 | 北京明略软件***有限公司 | 管理元数据的方法和装置 |
CN111241347A (zh) * | 2019-12-30 | 2020-06-05 | 北京邮电大学 | 一种图数据库的创建方法、企业数据查询方法及装置 |
CN111694793A (zh) * | 2020-06-12 | 2020-09-22 | 北京金山云网络技术有限公司 | 一种日志存储方法、装置及日志查询方法、装置 |
CN111538872A (zh) * | 2020-07-09 | 2020-08-14 | 太平金融科技服务(上海)有限公司 | 业务节点信息的可视化方法、装置、计算机设备和介质 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114791915A (zh) * | 2022-06-22 | 2022-07-26 | 深圳高灯计算机科技有限公司 | 数据归集方法、装置、计算机设备和存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107945024B (zh) | 识别互联网金融借贷企业经营异常的方法、终端设备及存储介质 | |
CN108268593B (zh) | ***投保信息的处理方法、装置、服务器和存储介质 | |
CN111177129B (zh) | 标签体系的构建方法、装置、设备及存储介质 | |
WO2019076062A1 (zh) | 功能页面定制方法及应用服务器 | |
CN104866484A (zh) | 一种数据处理方法和装置 | |
CN109064343B (zh) | 风险模型建立方法、风险匹配方法、装置、设备及介质 | |
CN109271564B (zh) | 保单查询方法及设备 | |
CN108257019A (zh) | 一种保单的试报价方法和装置 | |
CN105446990A (zh) | 一种业务数据处理方法及设备 | |
CN112507212A (zh) | 智能回访方法、装置、电子设备及可读存储介质 | |
CN111159183B (zh) | 报表生成方法、电子装置及计算机可读存储介质 | |
CN112148995A (zh) | 产品推荐方法、装置、电子设备及可读存储介质 | |
CN111882399A (zh) | 服务信息推荐方法、装置、计算机***及可读存储介质 | |
CN110191097B (zh) | 登录页面安全性的检测方法、***、设备及存储介质 | |
CN109919667B (zh) | 一种用于识别企业ip的方法和装置 | |
KR101927578B1 (ko) | 기업정보 제공 시스템 및 방법 | |
CN111415067A (zh) | 企业及个人信用评级*** | |
CN112613853A (zh) | 一种数据归集方法、装置、计算机设备和可读存储介质 | |
US20150095349A1 (en) | Automatically identifying matching records from multiple data sources | |
CN112511632A (zh) | 基于多源数据的对象推送方法、装置、设备及存储介质 | |
CN112733049A (zh) | 一种车辆信息展示方法及装置 | |
US20230088044A1 (en) | End-to-end prospecting platform utilizing natural language processing to reverse engineer client lists | |
CN114511314A (zh) | 一种支付账户管理的方法、装置、计算机设备和存储介质 | |
JP6364633B2 (ja) | 推定システム、及び、推定方法 | |
CN113254672A (zh) | 异常账号的识别方法、***、设备及可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |