CN111506613A - 一种数据记录的关联关系的查询方法、***、装置及设备 - Google Patents

一种数据记录的关联关系的查询方法、***、装置及设备 Download PDF

Info

Publication number
CN111506613A
CN111506613A CN202010321078.9A CN202010321078A CN111506613A CN 111506613 A CN111506613 A CN 111506613A CN 202010321078 A CN202010321078 A CN 202010321078A CN 111506613 A CN111506613 A CN 111506613A
Authority
CN
China
Prior art keywords
node
record
query
subsystem
associated path
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010321078.9A
Other languages
English (en)
Inventor
李启睿
杨程远
楼景华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alipay Hangzhou Information Technology Co Ltd
Original Assignee
Alipay Hangzhou Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alipay Hangzhou Information Technology Co Ltd filed Critical Alipay Hangzhou Information Technology Co Ltd
Priority to CN202010321078.9A priority Critical patent/CN111506613A/zh
Publication of CN111506613A publication Critical patent/CN111506613A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2455Query execution
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/248Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/27Replication, distribution or synchronisation of data between databases or within a distributed database system; Distributed database system architectures therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0635Risk analysis of enterprise or organisation activities

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Strategic Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Economics (AREA)
  • Computational Linguistics (AREA)
  • Marketing (AREA)
  • Game Theory and Decision Science (AREA)
  • Computing Systems (AREA)
  • Development Economics (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Educational Administration (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

公开了一种数据记录的关联关系的查询方法、***、装置及设备。在线存储子***从离线计算子***中预先获取预先计算得到的结点记录、边记录和关联路径记录。当需要关联关系的批量查询时,不再需要直接实时的计算,而是可以直接从在线存储子***进行查询。

Description

一种数据记录的关联关系的查询方法、***、装置及设备
技术领域
本说明书实施例涉及信息技术领域,尤其涉及一种数据记录的关联关系的查询方法、***、装置及设备。
背景技术
在企业风险分析和预警场景,经常有挖掘企业关联方、进而分析企业关联风险的需求,例如银行对企业进行信贷资质审核,金融办挖掘企业风险线索,中介机构、保荐机构对拟上市公司做尽职调查和材料审核等等。
这时候就有可能会涉及到需要查询任意M个企业和另外N个企业的关联详情,或者任意N个企业间的关联详情。随着批量查询数量的增大,常规方式下的查询效率将越来越低。
基于此,本说明书实施例提供一种更为高效的数据记录的关联关系的查询方案。
发明内容
本申请实施例的目的是提供一种更为高效的数据记录的关联关系的查询方法。
为解决上述技术问题,本申请实施例是这样实现的:
一种数据记录的关联关系的查询方法,包括:
离线计算子***,计算获取包含结点标识的结点记录,计算获取包含两个结点标识和所述两个结点标识的共同特征的边记录,计算获取结点对所对应的的关联路径记录,所述关联路径记录包含多个结点标识,相邻的两个结点标识之间存在至少一条边记录,所述结点对包含两个结点标识;
在线存储子***,从离线计算子***中获取计算所得到的结点记录、边记录和关联路径记录,存储所述结点记录、边记录和关联路径记录;
业务查询子***,确定待查询的多个结点对,发送针对所述多个结点对的查询请求所述在线存储子***;
所述在线存储子***,接受业务查询子***所发送的查询请求,针对任一结点对,查询获取该结点对所对应的关联路径记录,生成关于所述关联路径记录的查询结果,并返回所述查询结果至业务查询子***;
所述业务查询子***,接收所述在线存储子***所返回的查询结果,展示所述查询结果。
对应的,本说明书实施例还提供一种数据记录的关联关系的查询***,包括离线计算子***、在线存储子***和业务查询子***,在所述***中:
离线计算子***,计算获取包含结点标识的结点记录,计算获取包含两个结点标识和所述两个结点标识的共同特征的边记录,计算获取结点对所对应的的关联路径记录,所述关联路径记录包含多个结点标识,相邻的两个结点标识之间存在至少一条边记录,所述结点对包含两个结点标识;
在线存储子***,从离线计算子***中获取计算所得到的结点记录、边记录和关联路径记录,存储所述结点记录、边记录和关联路径记录;
业务查询子***,确定待查询的多个结点对,发送针对所述多个结点对的查询请求所述在线存储子***;
所述在线存储子***,接受业务查询子***所发送的查询请求,针对任一结点对,查询获取该结点对所对应的关联路径记录,生成关于所述关联路径记录的查询结果,并返回所述查询结果至业务查询子***;
所述业务查询子***,接收所述在线存储子***所返回的查询结果,展示所述查询结果。
对应的,本说明书实施例还提供一种数据记录的关联关系的查询方法,应用于在线存储子***中,所述方法包括:
从离线计算子***中获取计算所得到的结点记录、边记录和关联路径记录,并存储所述结点记录、边记录和关联路径记录;
接收业务查询子***所发送的查询请求,针对任一结点对,查询获取该结点对所对应的关联路径记录;
生成关于所述关联路径记录的查询结果;
返回所述查询结果至业务查询子***。
对应的,本说明书实施例还提供一种数据记录的关联关系的查询装置,应用于在线存储子***中,所述装置包括:
存储模块,从离线计算子***中获取计算所得到的结点记录、边记录和关联路径记录,并存储所述结点记录、边记录和关联路径记录;
接收模块,接收业务查询子***所发送的查询请求,针对任一结点对,查询获取该结点对所对应的关联路径记录;
生成模块,生成关于所述关联路径记录的查询结果;
返回模块,返回所述查询结果至业务查询子***。
通过本说明书实施例所提供的方案,在线存储子***从离线计算子***中预先获取预先计算得到的结点记录、边记录和关联路径记录。当需要关联关系的批量查询时,不再需要直接实时的计算,而是可以直接从在线存储子***进行查询,减少了查询耗时,实现对高效的关联关系的批量查询。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本说明书实施例。
此外,本说明书实施例中的任一实施例并不需要达到上述的全部效果。
附图说明
为了更清楚地说明本说明书实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本说明书实施例中记载的一些实施例,对于本领域普通技术人员来讲,还可以根据这些附图获得其他的附图。
图1为本说明书实施例所涉及的***的架构示意图;
图2为本说明书实施例所提供的一种数据记录的关联关系的方法的流程示意图;
图3为本说明书实施例所提供的一种数据记录的关联关系的查询方法的流程示意图;
图4是本说明书实施例提供的一种数据记录的关联关系的查询装置的结构示意图;
图5是用于配置本说明书实施例方法的一种设备的结构示意图。
具体实施方式
为了使本领域技术人员更好地理解本说明书实施例中的技术方案,下面将结合本说明书实施例中的附图,对本说明书实施例中的技术方案进行详细地描述,显然,所描述的实施例仅仅是本说明书的一部分实施例,而不是全部的实施例。基于本说明书中的实施例,本领域普通技术人员所获得的所有其他实施例,都应当属于保护的范围。
在企业风险分析和预警场景,经常有挖掘企业关联方、进而分析企业关联风险的需求,比如银行对企业进行信贷资质审核,金融办挖掘企业风险线索,中介机构、保荐机构对拟上市公司做尽职调查和材料审核。
单独查询两个企业(比如企业A和企业B)的关联关系是很简单的。当前市场上的这类的产品也很多。但是这些查询的方式一般都是需要实时的进行计算。特别在批量查询需求,需要在服务端采用多线程进行查询,对于服务端要求较高,在高并发场景下,服务端一般都是限制查询线程的数量,这就导致在线图查询的方式在批量查询场景下,查询性能和功能都存在一定的局限性。
基于此,本说明书实施例提供一种数据记录的关联关系的查询***,如图1所示,图1为本说明书实施例所涉及的***的架构示意图,在该***中,包括了离线计算子***、在线存储子***和业务查询子***。各子***的功能概览如下:
(1)离线计算子***,通过离线的预先计算,产生出结点记录、边记录和关联路径记录,并存储。数据量的规模非常大,可能达到100亿以上。
(2)在线存储子***,从离线计算子***中导入结点记录、边记录和关联路径记录,并存储,从而可以接收业务子***的查询。
(3)业务查询子***,接收用户的查询请求,并转发请求至在线存储子***。
以下基于图1所示的***,对本说明书实施例所提供的方案进行说明,如图2所示,图2为本说明书实施例所提供的一种数据记录的关联关系的方法的流程示意图,包括:
S201,离线计算子***,计算获取包含结点标识的结点记录,计算获取包含两个结点标识和所述两个结点标识的共同特征的边记录,计算获取结点对所对应的的关联路径记录。
在不同的场景下,结点记录和结点标识的内容不同。以企业之间的关联关系查询为例,此时的结点记录中可以包含诸如法定代表人、持股人员、持股机构、持股比例、企业管理人员、企业控股的其它企业名称等等企业信息,结点标识即用于唯一对应于该企业。
例如,一种结点记录的形式可以是如下:{"id":"A","name":"公司A","公司A的信息",……},从而可以根据结点标识“A”直接找到该企业所对应的结点记录,"公司A的信息"既可以包含了前述的持股人员、持股机构等企业信息。
进而,基于结点记录,可以计算得到任意的两个结点标识的所包含的共同特征,从而生成包含两个结点标识和所述两个结点标识的共同特征的边记录,在边记录中,包含了起点和终点。
例如,假设公司A和公司B的持股人员的法定代表人相同,为用户“xxxx”,则可以生成如下形式的边记录:{"start_id":"A","edge_name":"法定代表人","end_id":"B","ext_info":"xxxx"}。
在一条边记录中,只能包含一个共同特征。如果两个结点标识所对应的结点记录中存在N个共同特征,则在这两个结点标识之间,应当生成互不相同的N条边记录。
进而,基于计算得到的边记录,针对任意的包含两个结点的结点对,可以得到结点对所对应的的关联路径记录。所述关联路径记录包含多个结点标识,相邻的两个结点标识之间存在至少一条边记录。关联路径表征了两个结点标识可以存在关联关系,这种关联关系可以通过关联路径所表征出来。
例如,假设结点标识A和B之间存在边记录,B和D之间又存在边记录,则A和D之间的关联路径记录可以包含如下信息[“A,B,D”]。即关联路径记录的每个元素只需要包含多个结点标识即可,无需包含其他信息。
在实际应用中,两个结点标识之间可能存在多个关联路径,此时,同一个关联路径记录中可以包含多个元素,每个元素对应了一条关联路径,例如,对于A和D之间的关联路径记录可以是如下形式:["A,B,D","A,C,D","A,E,F,G,D"],即A和D之间存在三条关联路径。显然,在同一个关联路径记录中,每个元素的起始结点标识和结束结点标识均应当相同,而中间的结点标识不同,以避免重复。
在实际应用中,如果一个关联路径记录中存在的元素过多,还可以对每个关联路径进行权重计算(例如,给每个结点赋予权重),然后按照权重取topN条关联路径。
S203,在线存储子***,从离线计算子***中获取计算所得到的结点记录、边记录和关联路径记录,存储所述结点记录、边记录和关联路径记录。
在实际应用中,可以采用诸如Hbase等非关系型数据库存储所述结点记录、边记录和所述结点对的关联路径记录。
具体的获取方式可以采用诸如增量更新的方式。即先全量的导入,进而离线计算子***实时的计算当前的结点记录、边记录和关联路径记录有哪些变动,进而可以针对产生了变动的记录进行增量更新。在诸如企业信息查询的场景下,由于企业信息实际上比较稳定,计算得到的点记录、边记录和关联路径记录并不会短时间发生大量的改变,因此,可以采用增量更新的方式。而如果在一些数据记录的变化很快的场景下,由于数据量太大,显然增量更新的方式就不再适应了。
其原因在于,在基于关系型数据库的查询时,一次响应时间可能在几百毫秒,而非关系型数据库的一次响应只需要几毫秒。在批量查询的情形下,关系型数据库无法达到快速响应的效果。
具体而言,采用非关系型的点表存储所述结点记录,其中,所述点表中以结点标识作为主键。如表1所示,表1为一种本说明书实施例所提供的一种点表。
表1
主键 数据记录
A {"id":"A","name":"公司A"}
B {"id":"B","name":"公司B"}
采用非关系型的边表存储所述边记录,其中,所述边表中以边记录中所包含的两个结点标识作为主键。如表2所示,表2为一种本说明书实施例所提供的一种边表。
表2
Figure BDA0002461425270000071
采用非关系型的路径表存储所述关联路径记录,其中,所述路径中以关联路径记录的结点对中所包含的两个结点标识作为主键。如表3所示,表3为一种本说明书实施例所提供的一种路径表。
表3
主键 数据记录 最小关联度数
A_B ["A,C,B","A,E,B","A,E,F,B"] 2
A_D ["A,B,D","A,C,D","A,E,F,G,D"] 2
在实际应用中,上述的路径表中还可以包含对于关联路径记录进行关联度数的确定,关联度数表征了两个企业之间最少经过多少个结点标识既可以互相关联起来,因此所述关联度数与关联路径记录中最短关联路径的结点标识的数量正相关。
例如,对于一条关联路径"A,C,B",其关联度数可以是其中所包含的边的数量(即结点标识的数量-1)。显然,对于关联路径记录而言,其中每条关联路径的关联度数可能都有所差异。但是可以将各关联路径中的最小关联度数作为两个结点标识之间的关联路径记录关联度数,并且建立所述关联度数与所述关联路径记录的主键的对应关系,并写入所述路径表中,即如表3中所示。
S205,业务查询子***,确定待查询的多个结点对,发送针对所述多个结点对的查询请求所述在线存储子***。
虽然本申请的方案也可以用在一个结点对的查询,但是显然这并不是本申请的目的。本申请主要解决的是批量查询的效率问题。例如,在当前常规的图查询下,可同时查询的结点对的数量不会超过服务端所能提供的线程(例如,10个),并且效率太低。而本申请中的批量查询而不会有这个限制。
具体而言,以企业之间的关联关系查询为例,在批量查询时,可以有如下几种方式来确定结点对:
第一种,查询单个企业与另外N个企业的关联关系。例如,用户输入起点企业以及N个终点企业,要求查询企业A与其它N个企业的关联关系。这种方式下将会产生N个结点对,即[<A,N1>,<A,N2>,……,<A,Nn>];
第二种,查询N个企业之间的关联关系。此时,将会产生N*(N-1)/2个结点对。例如,用户输入A,B,C,D四个企业,要求查询该四个企业之间的之间的关联关系,会产生4*(4-1)/=6个结点对,[<A,B>,<A,C>,<A,D>,<B,C>,<B,D>,<C,D>]。
第三种,查询N个企业与另外M个企业之间的关系。显然,此时将会共产生N*M个结点对。
总之,在业务查询子***这一侧,可以针对用户输入的起点结点标识和终点结点标识,来生成批量查询的多个结点对,其中,起点结点标识和终点结点标识至少有一端的数量是多个,进而,可以将发送针对所述多个结点对的查询请求所述在线存储子***。或者,还可以针对用户输入的多个结点标识,分别确定出起点标识,进而确定出相应的多组节点对。
例如,可以将多个结点对统一在一个查询请求中进行发送,当然,在结点对数量较多时,也可以分批发送,以便在线存储子***分批次查询。
S207,所述在线存储子***,接受业务查询子***所发送的查询请求,针对任一结点对,查询获取该结点对所对应的关联路径记录,生成关于所述关联路径记录的查询结果,并返回所述查询结果至业务查询子***。
所述在线存储子***既可以根据结点对中所包含的两个结点标识,从前述的非关系型数据库中根据两个结点标识所对应的主键进行关联路径查询。
例如,针对结点对[<A,B>,即可以从表3中查询包含结点标识A和B的主键“A_B”,从而得到对应的关联路径为"A,C,B"、"A,E,B"和"A,E,F,B",从而生成包含有关联路径"A,C,B"、"A,E,B"和"A,E,F,B"的查询结果,并返回至业务查询子***。
在一种实施方式下,还可以针对查询得到的关联路径记录,从所述边表中查询获取每条路径中所述每组相邻的两个结点标识所对应的边记录;从所述点表中查询获取关联路径记录中每个结点标识所对应的结点记录;生成包含所述结点记录、边记录和关联路径记录的查询结果。
进一步地,当路径表中还包含有关联度数时,此时还可以生成包含有对应于该结点对的所述关联度数的查询结果,即对于结点对<A,B>,其最小关联度数为2,并将该数值写入查询结果中进行返回。
在一种实施方式中,还可以不返回该关联路径,而仅返回关联度数至业务查询子***。例如,当批量查询的结点对数量很多(例如,计算指定企业和另外200个企业的关联关系),这时候,关联路径的数量可能就会比较多,同时,每条关联路径也会比较深(即结点标识的数量较多),造成每条关联路径的占用空间较大,这就会增加存储和传输耗时。
此时,既可以仅返回每条关联路径上的关联度数(没有关联关系,则关联度数可以是0)至业务查询子***,以便业务子***根据所返回的关联路径的关联度数进行概览。在有需要详细了解时,再点击有关联关系的结点对时,查询其路径表,获取关联路径上的所有点和边,查询边表和点表获取路径上点和边的详细信息。
在这种实施方式下,在线存储子***可以预先确定出一个阈值,阈值数量可以和批量查询的结点对的数量相关,也可以和查询结果的占用空间大小相关。当批量查询的结点对的数量或最终返回结果大小超过指定阈值时,即仅返回不返回该关联路径,而仅返回关联度数至业务查询子***。从而减少简单查询时多次查询边表和点表的耗时,进一步压缩简单查询的耗时。
在一种实施方式中,用户在业务查询子***中还可以预先指示一个预设关联度数,用于指示在线存储子***,如果查询得到的关联路径的关联度数超过这个预设关联度数,就不必返回。此时,在线存储子***既可以确定查询得到的关联路径记录的关联度数,并生成包含不超过所述预设关联度数的关联路径记录的查询结果。
S209,所述业务查询子***,接收所述在线存储子***所返回的查询结果,展示所述查询结果。
具体而言,业务查询子***可以基于所接收到的查询结果的情形,进行相应的展示。
当返回的查询结果包含有具体的关联路径记录时。所述业务查询子***可以以包含结点和边的图谱的形式展示所述查询结果,在所述图谱中,关联路径记录中的结点标识和图谱中的结点一一对应,关联路径记录中相邻的两个结点标识的边记录和图谱中的边一一对应。
进而用户可以对于图谱中的某个点或者某条边进行确定,生成关于目标(边或者结点)对象的确认指令,生成包含所述目标对象所对应的结点标识的查询请求,从而所述在线存储子***,接收包含所述目标对象所对应的结点标识的查询请求,查询获取所述结点标识所对应的结点记录和边记录,并返回查询结构至业务查询子***。进而用户可以对于每个边记录、每个节点记录的相关信息进行详细的浏览。
当然如果返回的结果中就包含有结点记录、边记录,则此时在线存储子***就可以直接在本地获取相应的信息并展示给用户。
当批量查询的结点对较多时,此时返回的查询结果可能仅包含包含所述关联度数且不包含所述关联路径记录时,那么业务查询子***则可以展示对于每个结点对所对应的关联路径的关联度数,以便用户进行大致的了解。
进而,用户可以对于具有关联关系(例如关联度数大于0)的感兴趣的结点对进行确认,从而可以查询其路径表,获取关联路径上的所有点和边,查询边表和点表获取路径上点和边的详细信息,这样就免去了大量的无用查询,进一步地高了相应速度。
通过本说明书实施例所提供的方案,在线存储子***从离线计算子***中预先获取预先计算得到的结点记录、边记录和关联路径记录。当需要大规模图谱下关联关系的批量查询时,不再需要直接实时的计算,而是可以直接从在线存储子***进行查询,减少了查询耗时,实现对高效的关联关系的批量查询。
对应的,本说明书实施例还提供一种数据记录的关联关系的查询***,包括离线计算子***、在线存储子***和业务查询子***,在所述***中:
离线计算子***,计算获取包含结点标识的结点记录,计算获取包含两个结点标识和所述两个结点标识的共同特征的边记录,计算获取结点对所对应的的关联路径记录,所述关联路径记录包含多个结点标识,相邻的两个结点标识之间存在至少一条边记录,所述结点对包含两个结点标识;
在线存储子***,从离线计算子***中获取计算所得到的结点记录、边记录和关联路径记录,存储所述结点记录、边记录和关联路径记录;
业务查询子***,确定待查询的多个结点对,发送针对所述多个结点对的查询请求所述在线存储子***;
所述在线存储子***,接受业务查询子***所发送的查询请求,针对任一结点对,查询获取该结点对所对应的关联路径记录,生成关于所述关联路径记录的查询结果,并返回所述查询结果至业务查询子***;
所述业务查询子***,接收所述在线存储子***所返回的查询结果,展示所述查询结果。
对应的,本说明书是实施例还提供一种数据记录的关联关系的查询方法,应用于在线存储子***中,如图3所示,图3为本说明书实施例所提供的一种数据记录的关联关系的查询方法的流程示意图,所述方法包括:
S301,从离线计算子***中获取计算所得到的结点记录、边记录和关联路径记录,并存储所述结点记录、边记录和关联路径记录;
S303,接收业务查询子***所发送的查询请求,针对任一结点对,查询获取该结点对所对应的关联路径记录;
S305,生成关于所述关联路径记录的查询结果;
S307,返回所述查询结果至业务查询子***。
对于在线存储子***更为具体的应用方式,在前文已经进行了详细的说明,此处不再赘述。
对应的,本说明书实施例还提供一种数据记录的关联关系的查询装置,应用于在线存储子***中,如图4所示,图4是本说明书实施例提供的一种数据记录的关联关系的查询装置的结构示意图,包括:
S401,存储模块,从离线计算子***中获取计算所得到的结点记录、边记录和关联路径记录,并存储所述结点记录、边记录和关联路径记录;
S403,接收模块,接收业务查询子***所发送的查询请求,针对任一结点对,查询获取该结点对所对应的关联路径记录;
S405,生成模块,生成关于所述关联路径记录的查询结果;
S407,返回模块,返回所述查询结果至业务查询子***。
本说明书实施例还提供一种计算机设备,其至少包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其中,处理器执行所述程序时实现图3所示的关联关系的查询方法。
图5示出了本说明书实施例所提供的一种更为具体的计算设备硬件结构示意图,该设备可以包括:处理器1010、存储器1020、输入/输出接口1030、通信接口1040和总线1050。其中处理器1010、存储器1020、输入/输出接口1030和通信接口1040通过总线1050实现彼此之间在设备内部的通信连接。
处理器1010可以采用通用的CPU(Central Processing Unit,中央处理器)、微处理器、应用专用集成电路(Application Specific Integrated Circuit,ASIC)、或者一个或多个集成电路等方式实现,用于执行相关程序,以实现本说明书实施例所提供的技术方案。
存储器1020可以采用ROM(Read Only Memory,只读存储器)、RAM(Random AccessMemory,随机存取存储器)、静态存储设备,动态存储设备等形式实现。存储器1020可以存储操作***和其他应用程序,在通过软件或者固件来实现本说明书实施例所提供的技术方案时,相关的程序代码保存在存储器1020中,并由处理器1010来调用执行。
输入/输出接口1030用于连接输入/输出模块,以实现信息输入及输出。输入输出/模块可以作为组件配置在设备中(图中未示出),也可以外接于设备以提供相应功能。其中输入设备可以包括键盘、鼠标、触摸屏、麦克风、各类传感器等,输出设备可以包括显示器、扬声器、振动器、指示灯等。
通信接口1040用于连接通信模块(图中未示出),以实现本设备与其他设备的通信交互。其中通信模块可以通过有线方式(例如USB、网线等)实现通信,也可以通过无线方式(例如移动网络、WIFI、蓝牙等)实现通信。
总线1050包括一通路,在设备的各个组件(例如处理器1010、存储器1020、输入/输出接口1030和通信接口1040)之间传输信息。
需要说明的是,尽管上述设备仅示出了处理器1010、存储器1020、输入/输出接口1030、通信接口1040以及总线1050,但是在具体实施过程中,该设备还可以包括实现正常运行所必需的其他组件。此外,本领域的技术人员可以理解的是,上述设备中也可以仅包含实现本说明书实施例方案所必需的组件,而不必包含图中所示的全部组件。
本说明书实施例还提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现图3所示的关联关系的查询方法。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
通过以上的实施方式的描述可知,本领域的技术人员可以清楚地了解到本说明书实施例可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本说明书实施例的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本说明书实施例各个实施例或者实施例的某些部分所述的方法。
上述实施例阐明的***、方法、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机,计算机的具体形式可以是个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件收发设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任意几种设备的组合。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于方法实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。以上所描述的方法实施例仅仅是示意性的,其中所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,在实施本说明书实施例方案时可以把各模块的功能在同一个或多个软件和/或硬件中实现。也可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
以上所述仅是本说明书实施例的具体实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本说明书实施例原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本说明书实施例的保护范围。

Claims (15)

1.一种数据记录的关联关系的查询方法,包括:
离线计算子***,计算获取包含结点标识的结点记录,计算获取包含两个结点标识和所述两个结点标识的共同特征的边记录,计算获取结点对所对应的的关联路径记录,所述关联路径记录包含多个结点标识,相邻的两个结点标识之间存在至少一条边记录,所述结点对包含两个结点标识;
在线存储子***,从离线计算子***中获取计算所得到的结点记录、边记录和关联路径记录,存储所述结点记录、边记录和关联路径记录;
业务查询子***,确定待查询的多个结点对,发送针对所述多个结点对的查询请求所述在线存储子***;
所述在线存储子***,接受业务查询子***所发送的查询请求,针对任一结点对,查询获取该结点对所对应的关联路径记录,生成关于所述关联路径记录的查询结果,并返回所述查询结果至业务查询子***;
所述业务查询子***,接收所述在线存储子***所返回的查询结果,展示所述查询结果。
2.如权利要求1所述的方法,所述在线存储子***,存储所述结点记录、边记录和关联路径记录,包括:
所述在线存储子***,并采用非关系型数据库存储所述结点记录、边记录和所述结点对的关联路径记录。
3.如权利要求2所述的方法,在线存储子***,采用非关系型数据库存储所述结点记录、边记录和所述结点对的关联路径记录,包括:
在线存储子***,采用非关系型的点表存储所述结点记录,其中,所述点表中以结点标识作为主键;
采用非关系型的边表存储所述边记录,其中,所述边表中以边记录中所包含的两个结点标识作为主键;
采用非关系型的路径表存储所述关联路径记录,其中,所述路径中以关联路径记录的结点对中所包含的两个结点标识作为主键。
4.如权利要求3所述的方法,所述在线存储子***,采用非关系型的路径表存储所述关联路径记录,包括:
所述在线存储子***,针对任一关联路径记录,确定该关联路径记录的关联度数,其中,所述关联度数与关联路径中的结点标识的数量正相关;
建立所述关联度数与所述关联路径记录的主键的对应关系,并写入所述路径表中;
相应的,查询获取该结点对所对应的关联路径记录,包括:查询获取该结点对的关联度数,用于判断该结点对是否有关联关系,若有,查询获取该结点对所对应的关联路径记录;
相应的,生成关于所述关联路径记录的查询结果,包括:生成包含所述关联度数且不包含所述关联路径记录的查询结果,或者,生成包含所述关联度数和关联路径记录的查询结果。
5.如权利要求4所述的方法,生成仅包含所述关联度数的查询结果,包括:
判断查询的结点对的数量是否超过阈值,或者,判断生成的查询结果的占用空间是否超过阈值,若是,生成包含所述关联度数且不包含所述关联路径记录的查询结果。
6.如权利要求4所述的方法,所述业务查询子***,展示所述查询结果,包括:针对所述待查询的多个结点对,展示包含所述关联度数的查询结果。
7.如权利要求4所述的方法,当查询请求中还包含预设关联度数时,在线存储子***,生成关于所述关联路径记录的查询结果,包括:
确定查询得到的关联路径记录的关联度数,生成包含不超过所述预设关联度数的关联路径记录的查询结果。
8.如权利要求3所述的方法,所述在线存储子***,生成包含所述关联路径记录的查询结果,包括:
所述在线存储子***,确定关联路径记录中每组相邻的两个结点标识;
从所述边表中查询获取所述每组相邻的两个结点标识所对应的边记录;
从所述点表中查询获取关联路径记录中每个结点标识所对应的结点记录;
生成包含所述结点记录、边记录和关联路径记录的查询结果。
9.如权利要求1所述的方法,所述业务查询子***,展示所述查询结果,包括:
以包含结点和边的图谱的形式展示所述查询结果,在所述图谱中,关联路径记录中的结点标识和图谱中的结点一一对应,关联路径记录中相邻的两个结点标识的边记录和图谱中的边一一对应。
10.如权利要求9所述的方法,所述业务查询子***,还包括:接收对于图谱中目标对象的确认指令,生成包含所述目标对象所对应的结点标识的查询请求,所述目标对象包含边或者结点;
相应的,所述在线存储子***,接收包含所述目标对象所对应的结点标识的查询请求,查询获取所述结点标识所对应的结点记录和边记录,并返回查询结构至业务查询子***。
11.如权利要求1所述的方法,所述在线存储子***,从离线计算子***中获取计算所得到的结点记录、边记录和关联路径记录,包括:
所述在线存储子***,以增量更新的方式从离线计算子***中获取计算所得到的结点记录、边记录和关联路径记录。
12.一种数据记录的关联关系的查询***,包括离线计算子***、在线存储子***和业务查询子***,在所述***中:
离线计算子***,计算获取包含结点标识的结点记录,计算获取包含两个结点标识和所述两个结点标识的共同特征的边记录,计算获取结点对所对应的的关联路径记录,所述关联路径记录包含多个结点标识,相邻的两个结点标识之间存在至少一条边记录,所述结点对包含两个结点标识;
在线存储子***,从离线计算子***中获取计算所得到的结点记录、边记录和关联路径记录,存储所述结点记录、边记录和关联路径记录;
业务查询子***,确定待查询的多个结点对,发送针对所述多个结点对的查询请求所述在线存储子***;
所述在线存储子***,接受业务查询子***所发送的查询请求,针对任一结点对,查询获取该结点对所对应的关联路径记录,生成关于所述关联路径记录的查询结果,并返回所述查询结果至业务查询子***;
所述业务查询子***,接收所述在线存储子***所返回的查询结果,展示所述查询结果。
13.一种数据记录的关联关系的查询方法,应用于在线存储子***中,所述方法包括:
从离线计算子***中获取计算所得到的结点记录、边记录和关联路径记录,并存储所述结点记录、边记录和关联路径记录;
接收业务查询子***所发送的查询请求,针对任一结点对,查询获取该结点对所对应的关联路径记录;
生成关于所述关联路径记录的查询结果;
返回所述查询结果至业务查询子***。
14.一种数据记录的关联关系的查询装置,应用于在线存储子***中,所述装置包括:
存储模块,从离线计算子***中获取计算所得到的结点记录、边记录和关联路径记录,并存储所述结点记录、边记录和关联路径记录;
接收模块,接收业务查询子***所发送的查询请求,针对任一结点对,查询获取该结点对所对应的关联路径记录;
生成模块,生成关于所述关联路径记录的查询结果;
返回模块,返回所述查询结果至业务查询子***。
15.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其中,所述处理器执行所述程序时实现如权利要求13所述的方法。
CN202010321078.9A 2020-04-22 2020-04-22 一种数据记录的关联关系的查询方法、***、装置及设备 Pending CN111506613A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010321078.9A CN111506613A (zh) 2020-04-22 2020-04-22 一种数据记录的关联关系的查询方法、***、装置及设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010321078.9A CN111506613A (zh) 2020-04-22 2020-04-22 一种数据记录的关联关系的查询方法、***、装置及设备

Publications (1)

Publication Number Publication Date
CN111506613A true CN111506613A (zh) 2020-08-07

Family

ID=71871208

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010321078.9A Pending CN111506613A (zh) 2020-04-22 2020-04-22 一种数据记录的关联关系的查询方法、***、装置及设备

Country Status (1)

Country Link
CN (1) CN111506613A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117076465A (zh) * 2023-10-16 2023-11-17 支付宝(杭州)信息技术有限公司 一种数据关联查询方法及相关设备

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101458716A (zh) * 2008-12-31 2009-06-17 北京大学 一种图中节点间最短路径的查找方法
US20140006542A1 (en) * 2012-06-29 2014-01-02 William M Pitts Recursive ascent network link failure notifications
CN105893572A (zh) * 2016-03-31 2016-08-24 北京奇艺世纪科技有限公司 一种目标数据输出方法、装置及***
CN110688541A (zh) * 2019-10-08 2020-01-14 中国建设银行股份有限公司 一种报表数据的查询方法、装置、存储介质及电子设备
CN110765215A (zh) * 2019-09-30 2020-02-07 深圳云天励飞技术有限公司 人员共同关系的查询方法、装置、电子设备及存储介质

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101458716A (zh) * 2008-12-31 2009-06-17 北京大学 一种图中节点间最短路径的查找方法
US20140006542A1 (en) * 2012-06-29 2014-01-02 William M Pitts Recursive ascent network link failure notifications
CN105893572A (zh) * 2016-03-31 2016-08-24 北京奇艺世纪科技有限公司 一种目标数据输出方法、装置及***
CN110765215A (zh) * 2019-09-30 2020-02-07 深圳云天励飞技术有限公司 人员共同关系的查询方法、装置、电子设备及存储介质
CN110688541A (zh) * 2019-10-08 2020-01-14 中国建设银行股份有限公司 一种报表数据的查询方法、装置、存储介质及电子设备

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117076465A (zh) * 2023-10-16 2023-11-17 支付宝(杭州)信息技术有限公司 一种数据关联查询方法及相关设备
CN117076465B (zh) * 2023-10-16 2024-04-05 支付宝(杭州)信息技术有限公司 一种数据关联查询方法及相关设备

Similar Documents

Publication Publication Date Title
CN107798038B (zh) 数据响应方法及数据响应设备
CN109885786B (zh) 数据缓存处理方法、装置、电子设备及可读存储介质
CN110162512B (zh) 一种日志检索方法、装置及存储介质
CN106547646B (zh) 一种数据备份及恢复方法、数据备份及恢复装置
CN113535721A (zh) 一种数据写入方法及装置
US20150120697A1 (en) System and method for analysis of a database proxy
CN111046052B (zh) 一种数据库中的操作记录存储方法、装置及设备
CN112328575B (zh) 数据资产血缘生成方法、装置、电子设备
CN111506613A (zh) 一种数据记录的关联关系的查询方法、***、装置及设备
CN110928895B (zh) 一种数据查询、数据表建立方法、装置及设备
CN111553749A (zh) 一种活动推送策略配置方法及装置
US9984235B2 (en) Transmission of trustworthy data
CN116069810A (zh) 数据查询方法、装置及终端设备
CN111444198B (zh) 一种基于中心化块链式账本的交易存储、查询方法
CN111680112B (zh) 一种数据分析方法及装置
CN113761102B (zh) 数据处理方法、装置、服务器、***和存储介质
CN111339152B (zh) 一种门店拓展记录数据处理装置
CN112364030B (zh) 一种基于可信账本数据库的业务衍生记录存储方法
CN117076465B (zh) 一种数据关联查询方法及相关设备
CN112364031B (zh) 一种基于可信账本数据库的业务衍生记录存储方法
CN109299139B (zh) 一种信息查询方法及装置
CN116795835A (zh) 关联查询方法和装置
CN117216164A (zh) 金融数据同步处理方法、装置、设备、介质和程序产品
CN117235149A (zh) 公积金账单生成方法、装置、设备、存储介质和程序产品
CN115983691A (zh) 异常企业甄别方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40034586

Country of ref document: HK