CN109656946A - 一种多表关联查询方法、装置及设备 - Google Patents

一种多表关联查询方法、装置及设备 Download PDF

Info

Publication number
CN109656946A
CN109656946A CN201811144099.7A CN201811144099A CN109656946A CN 109656946 A CN109656946 A CN 109656946A CN 201811144099 A CN201811144099 A CN 201811144099A CN 109656946 A CN109656946 A CN 109656946A
Authority
CN
China
Prior art keywords
query
query statement
cost
statement
results
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201811144099.7A
Other languages
English (en)
Other versions
CN109656946B (zh
Inventor
马平
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Advanced New Technologies Co Ltd
Advantageous New Technologies Co Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN201811144099.7A priority Critical patent/CN109656946B/zh
Publication of CN109656946A publication Critical patent/CN109656946A/zh
Application granted granted Critical
Publication of CN109656946B publication Critical patent/CN109656946B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本说明书实施例公开了多表关联查询方法、装置及设备。方案包括:获取第一查询语句;获取第二查询语句;所述第一查询语句与所述第二查询语句中的查询条件具有相同的字段;估算所述第一查询语句的第一查询代价;估算所述第二查询语句的第二查询代价;确定最小查询代价;根据所述最小查询代价对应的查询语句进行查询,得到第一查询结果集;根据所述第一查询结果集,改写另外的查询语句;根据所述改写后的查询语句进行查询,得到第二查询结果集;根据所述第一查询结果集与所述第二查询结果集,得到关联查询结果集。

Description

一种多表关联查询方法、装置及设备
技术领域
本申请涉及计算机技术领域,尤其涉及一种多表关联查询方法、装置及设备。
背景技术
现有技术中,用户的数据会以多张表的方式存储在数据库中。为了查询用户的某些行为,需要进行多表关联查询。多表关联查询,通常是指从多个数据表中查询具有某些共同属性的记录。
例如,假设有表A、表B和表C三个数据表。其中,表A存储有用户编号和用户姓名,表B存储有用户编号和用户年龄,表C存储有用户编号和用户性别。每个用户具有一个唯一的编号。那么,如果要查询姓名为“张三”,年龄为20岁的男性,就需要根据这三个表进行多表关联查询,才能够得到查询结果。
但是,现有的多表关联查询方法,通常是将多表关联查询脚本中涉及到的每个数据表的查询结果,分别获取到查询发起设备的内存中,再对每个数据表的查询结果进行过滤。这种方式进行多表查询,效率较低。
发明内容
有鉴于此,本申请实施例提供了一种多表关联查询方法、装置及设备,用于提高查询效率。
为解决上述技术问题,本说明书实施例是这样实现的:
本说明书实施例提供的一种多表关联查询方法,包括:
获取针对第一表格的第一查询语句;所述第一查询语句是对多表关联查询脚本进行解析得到的;
获取针对第二表格的第二查询语句;所述第二查询语句是对所述多表关联查询脚本进行解析得到的;所述第一查询语句与所述第二查询语句中的查询条件具有相同的字段;
估算所述第一查询语句的第一查询代价;
估算所述第二查询语句的第二查询代价;
比较所述第一查询代价与所述第二查询代价,确定最小查询代价;
根据所述最小查询代价对应的查询语句进行查询,得到第一查询结果集;
根据所述第一查询结果集,改写另外的查询语句;
根据所述改写后的查询语句进行查询,得到第二查询结果集;
根据所述第一查询结果集与所述第二查询结果集,得到关联查询结果集。
本说明书实施例提供的一种多表关联查询装置,包括:
第一查询语句获取模块,用于获取针对第一表格的第一查询语句;所述第一查询语句是对多表关联查询脚本进行解析得到的;
第二查询语句获取模块,用于获取针对第二表格的第二查询语句;所述第二查询语句是对所述多表关联查询脚本进行解析得到的;所述第一查询语句与所述第二查询语句中的查询条件具有相同的字段;
第一查询代价估算模块,用于估算所述第一查询语句的第一查询代价;
第二查询代价估算模块,用于估算所述第二查询语句的第二查询代价;
查询代价比较模块,用于比较所述第一查询代价与所述第二查询代价,确定最小查询代价;
第一查询模块,用于根据所述最小查询代价对应的查询语句进行查询,得到第一查询结果集;
查询语句改写模块,用于根据所述第一查询结果集,改写另外的查询语句;
第二查询模块,用于根据所述改写后的查询语句进行查询,得到第二查询结果集;
关联结果生成模块,用于根据所述第一查询结果集与所述第二查询结果集,得到关联查询结果集。
本说明书实施例提供的一种设备,包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够:
获取针对第一表格的第一查询语句;所述第一查询语句是对多表关联查询脚本进行解析得到的;
获取针对第二表格的第二查询语句;所述第二查询语句是对所述多表关联查询脚本进行解析得到的;所述第一查询语句与所述第二查询语句中的查询条件具有相同的字段;
估算所述第一查询语句的第一查询代价;
估算所述第二查询语句的第二查询代价;
比较所述第一查询代价与所述第二查询代价,确定最小查询代价;
根据所述最小查询代价对应的查询语句进行查询,得到第一查询结果集;
根据所述第一查询结果集,改写另外的查询语句;
根据所述改写后的查询语句进行查询,得到第二查询结果集;
根据所述第一查询结果集与所述第二查询结果集,得到关联查询结果集。
本说明书实施例采用的上述至少一个技术方案能够达到以下有益效果:
通过对各个表格的查询代价进行估算,先执行查询代价较小的查询语句,再根据得到的查询结果集,对另外的查询语句进行改写,从而可以缩小另外的查询语句的查询范围,减小另外的查询语句的查询代价,进而提高多表关联查询的查询效率。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1为本说明书实施例中多表关联查询方法的一种应用场景的示意图;
图2为本说明书实施例提供的一种多表关联查询方法的流程示意图;
图3为本说明书实施例提供的对应于图2的一种多表关联查询装置的结构示意图;
图4为本说明书实施例提供的对应于图2的一种多表关联查询设备的结构示意图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚,下面将结合本申请具体实施例及相应的附图对本申请技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
以下结合附图,详细说明本申请各实施例提供的技术方案。
图1为本说明书实施例中多表关联查询方法的一种应用场景的示意图。如图1所示,工作站10与数据库11、数据库12、数据库13之间可通信连接。数据库11、数据库12与数据库13分别存储有大量的数据表。数据库11、数据库12与数据库13可以分别位于不同的地点。数据库11、数据库12与数据库13也可以是不同类型的数据库。当工作站10获取到多表关联查询脚本,并且脚本中涉及到的表分别位于数据库11、数据库12与数据库13中时,需要分别从数据库11、数据库12与数据库13获取相关的数据信息。
图2为本说明书实施例提供的一种多表关联查询方法的流程示意图。从程序角度而言,流程的执行主体可以为搭载于应用服务器或工作站计算机的程序或应用客户端。
如图2所示,该流程可以包括以下步骤:
S201:获取针对第一表格的第一查询语句;所述第一查询语句是对多表关联查询脚本进行解析得到的;
所述多表关联查询脚本,可以是采用SQL语句的脚本。
本说明书实施例中的第一表格,可以是数据库中存储的数据表。
可以采用开源软件对多表关联查询脚本解析,得到针对各个表格的查询语句。
S202:获取针对第二表格的第二查询语句;所述第二查询语句是对所述多表关联查询脚本进行解析得到的;所述第一查询语句与所述第二查询语句中的查询条件具有相同的字段;
例如,下面是一段简单的多表关联查询脚本:
上面的一段脚本中,涉及表格a和表格b。可以采用开源软件对该脚本解析,得到针对表格a的查询语句,以及针对表格b的查询语句。
针对表格a的查询语句可以是
针对表格a的查询语句可以是
可以看出,针对表格a的查询语句与针对表格b的查询语句中的查询条件具有相同的字段id。
S203:估算所述第一查询语句的第一查询代价;
查询代价,可以是指执行查询所消耗的时间或者占用的硬件资源的多少。本说明书实施例中,可以从查询结果的数据量的角度估算查询代价,也可以从数据表格中元数据的数据量的角度估算查询代价,还可以按照查询结果的数据量,内存的占用率,CPU的占用率三者综合考虑的方式估算查询代价。
可以采用动态规划算法、遗传算法结合数据库元数据估算查询代价。
S204:估算所述第二查询语句的第二查询代价;
S205:比较所述第一查询代价与所述第二查询代价,确定最小查询代价;
查询代价的结果可以是具体数值。比较具体数值的大小,可以确定最小查询代价。
S206:根据所述最小查询代价对应的查询语句进行查询,得到第一查询结果集;
对于查询代价最小的查询语句,可以先进行查询。
S207:根据所述第一查询结果集,改写另外的查询语句;
可以用所述第一查询结果集作为新增加的限制条件,对另外的查询语句增加限定条件。
当第一查询语句的查询代价最小时,所述另外的查询语句是第二查询语句;当第二查询语句的查询代价最小时,所述另外的查询语句是第一查询语句。
S208:根据所述改写后的查询语句进行查询,得到第二查询结果集;
由于改写后的查询语句的限制条件增加了,所以第二查询结果集的数据量,小于改写前的查询语句的查询结果。
S209:根据所述第一查询结果集与所述第二查询结果集,得到关联查询结果集。
具体的,可以通过连接算法将所述第一查询结果集与所述第二查询结果集进行连接,得到最终的关联查询结果集。
在上面给出的查询语句的例子中,假设针对表格a的查询语句的查询代价是100(表示预计查询结果为100条),针对表格b的查询语句的查询代价是1000(表示预计查询结果为1000条),则可以先执行针对表格a的查询语句。假设执行后得到结果集为D(A)={id}={1,2,3,..100},则可以据此将针对表格b的查询语句改写为select b.age,b.sex fromB b where b.aid in(1,2,3,...100)and b.age>20and b.sex='male'。改写后,意味着针对表格b的查询语句只需要从id为1到100之间的数据进行查询,缩小了查询范围,并且对于表格b的查询结果也会在100以内。相较于改写之前的查询代价,改写后的查询语句的查询代价变小了。更具体的,改写之前,在执行对于表格b的查询语句时,工作站的设备需要从数据库中读取1000条左右的数据到自身的内存中,再从这1000条左右的数据中过滤与表格a相关的数据,才能够得到最终的100条以内的数据。改写后,工作站的设备只需要从数据库中读取100条以内的数据到自身的内存中,再将这100条以内的数据与表格a的查询结果集进行连接即可。
综上所述,图2中的方法,通过对各个表格的查询代价进行估算,先执行查询代价较小的查询语句,再根据得到的查询结果集,对另外的查询语句进行改写,从而可以缩小另外的查询语句的查询范围,减小另外的查询语句的查询代价,进而提高多表关联查询的查询效率。
基于图2的方法,本说明书实施例还提供了该方法的一些具体实施方案,下面进行说明。
本说明书实施例中,步骤S207:根据所述第一查询结果集,改写另外的查询语句,具体可以包括:
将所述另外的查询语句中的所述相同的字段,用所述第一查询结果集的值进行限定。
实际应用中,当某个数据表格的数据量很大时,对于该表格的查询代价的估算也会消耗大量的资源。当数据量超过一定数值时,估算对于该表格的查询代价,会引起数据库的崩溃。为了避免这种情况的发生,本说明书实施例中,步骤S203:估算所述第一查询语句的第一查询代价之前,还可以包括以下步骤:
判断所述第一表格的数据量是否大于预设阈值,得到第一判断结果;
所述估算所述第一查询语句的第一查询代价,具体为:
当所述第一判断结果表示所述第一表格的数据量不大于所述预设阈值时,估算所述第一查询语句的第一查询代价。
当所述第一判断结果表示所述第一表格的数据量大于所述预设阈值时,可以不再执行估算所述第一查询语句的第一查询代价的步骤。
上述步骤中,所述预设阈值的具体数值可以根据数据库的性能进行设置。
当所述第一判断结果表示所述第一表格的数据量不大于所述预设阈值时,估算所述第一查询语句的第一查询代价,不会引起数据库的崩溃。
当所述第一判断结果表示所述第一表格的数据量大于所述预设阈值时,可以不再估算所述第一查询语句的第一查询代价,直接执行以下步骤:
根据所述第一查询语句进行查询,得到第三查询结果集;
根据所述第二查询语句进行查询,得到第四查询结果集;
根据所述第三查询结果集与所述第四查询结果集,得到关联查询结果集。
上述步骤,不再对查询语句进行改写,直接采用原始的第一查询语句与第二查询语句进行查询,从而避免引起数据库的崩溃。
上面的例子中,针对的是对两个表格进行的多表关联查询。实际应用中,还可以对三个表格或更多表格进行多表关联查询。
若对三个表格进行多表关联查询,可以采用以下步骤:
获取针对第三表格的第三查询语句;所述第三查询语句中的查询条件具有所述相同的字段;
计算所述第三查询语句的第三查询代价;
上述步骤S205确定最小查询代价之后,步骤S206根据所述最小查询代价对应的查询语句进行查询之前,还可以包括:
比较所述第三查询代价与所述最小查询代价;
若所述第三查询代价小于所述最小查询代价,则根据所述第三查询语句进行查询,得到第五查询结果集;
根据所述第五查询结果集,改写所述最小查询代价对应的查询语句;
步骤S206根据所述最小查询代价对应的查询语句进行查询,具体可以包括:
根据改写后的所述最小查询代价对应的查询语句进行查询。
上述步骤中,当涉及三个表格时,可以分别对三个表格的查询代价进行估算,从三个估算结果中选取查询代价最小的表格,先进行查询。得到查询结果后,再根据查询结果对查询代价居中的表格的查询语句进行改写。得到第二个表格的查询结果后,再根据第二个表格的查询结果,对第三个表格的查询语句进行改写,而后查询,从而实现对于三个表格的多表关联查询的语句优化。
更进一步的,由上例中三个表格的查询方式,可以知道,当有更多表格需要进行关联查询时,可以对各个表格的查询代价进行估算,根据估算得到的查询代价的大小进行从小到大的排序,先对查询代价最小的表格进行查询,再根据查询结果改写查询代价次小的查询语句,依次进行查询和改写,直至得到查询语句被改写后的各个表格的查询结果。
实际应用中,对于查询语句的执行过程是循环进行的。有时当数据表中的数据已经全部被查询过一遍后,由于查询过程还在循环进行,有可能导致***还在进行循环查询,浪费查询时间。
为了避免上面的情况发生,本说明书实施例中,根据所述最小查询代价对应的查询语句进行查询之后,还可以包括步骤:
将所述最小查询代价对应的查询语句针对的表格的状态标记为已查询。
同理,本说明书实施例中,根据所述改写后的查询语句进行查询之后,还可以包括步骤:
将所述改写后的查询语句针对的表格的状态标记为已查询。
表格的状态为已查询,表示该表格已查询完毕,后续进程识别出该状态标记后,可以不再进行对于该表格的循环查询。
实际应用中,每个查询结果集中可以包含多条查询数据,各个查询结果集进行关联可以得到最终的关联查询结果集。具体的关联方式,可以采用外连接的方式进行。外连接包括,左连接与右连接。具体采用何种外连接的方式,是由最初的多表关联查询脚本决定的。最初的多表关联查询脚本中,可以用left join表示左连接,right join表示右连接。
还需要说明的是,本说明书实施例中的第一查询语句,第二查询语句等,是由最初的多表关联查询脚本进行解析得到的。也就是说,获取针对第一表格的第一查询语句之前,还可以包括以下步骤:
获取多表关联查询脚本;
解析所述脚本,得到所述第一查询语句与所述第二查询语句。
可以采用Jsqlparser或druid等开源软件实现对于多表关联查询脚本的解析。
基于同样的思路,本说明书实施例还提供了上述方法对应的装置。图3为本说明书实施例提供的对应于图2的一种多表关联查询装置的结构示意图。如图3所示,该装置可以包括:
第一查询语句获取模块301,用于获取针对第一表格的第一查询语句;所述第一查询语句是对多表关联查询脚本进行解析得到的;
第二查询语句获取模块302,用于获取针对第二表格的第二查询语句;所述第二查询语句是对所述多表关联查询脚本进行解析得到的;所述第一查询语句与所述第二查询语句中的查询条件具有相同的字段;
第一查询代价估算模块303,用于估算所述第一查询语句的第一查询代价;
第二查询代价估算模块304,用于估算所述第二查询语句的第二查询代价;
查询代价比较模块305,用于比较所述第一查询代价与所述第二查询代价,确定最小查询代价;
第一查询模块306,用于根据所述最小查询代价对应的查询语句进行查询,得到第一查询结果集;
查询语句改写模块307,用于根据所述第一查询结果集,改写另外的查询语句;
第二查询模块308,用于根据所述改写后的查询语句进行查询,得到第二查询结果集;
关联结果生成模块309,用于根据所述第一查询结果集与所述第二查询结果集,得到关联查询结果集。
可选的,所述查询语句改写模块307,具体可以包括:
查询语句改写单元,用于将所述另外的查询语句中的所述相同的字段,用所述第一查询结果集的值进行限定。
可选的,该装置还可以包括:
第一判断模块,用于在估算所述第一查询语句的第一查询代价之前,判断所述第一表格的数据量是否大于预设阈值,得到第一判断结果;
所述第一查询代价估算模块303,具体可以用于:
当所述第一判断结果表示所述第一表格的数据量不大于所述预设阈值时,估算所述第一查询语句的第一查询代价。
可选的,该装置,还可以包括:
第三查询模块,用于当所述第一判断结果表示所述第一表格的数据量大于所述预设阈值时,根据所述第一查询语句进行查询,得到第三查询结果集;
第四查询模块,用于根据所述第二查询语句进行查询,得到第四查询结果集;
所述关联结果生成模块309,还用于根据所述第三查询结果集与所述第四查询结果集,得到关联查询结果集。
可选的,该装置,还可以包括:
第三查询语句获取模块,用于获取针对第三表格的第三查询语句;所述第三查询语句中的查询条件具有所述相同的字段;
第三查询代价估算模块,用于估算所述第三查询语句的第三查询代价;
所述查询代价比较模块305,还用于在确定最小查询代价之后,所述根据所述最小查询代价对应的查询语句进行查询之前,比较所述第三查询代价与所述最小查询代价;
第四查询模块,用于若所述第三查询代价小于所述最小查询代价,则根据所述第三查询语句进行查询,得到第五查询结果集;
所述查询语句改写模块307,还用于根据所述第五查询结果集,改写所述最小查询代价对应的查询语句;
所述第一查询模块306,还用于:
根据改写后的所述最小查询代价对应的查询语句进行查询。
可选的,该装置还可以包括:
第一标记模块,用于根据所述最小查询代价对应的查询语句进行查询之后,将所述最小查询代价对应的查询语句针对的表格的状态标记为已查询。
可选的,该装置还可以包括:
第二标记模块,用于根据所述改写后的查询语句进行查询之后,将所述改写后的查询语句针对的表格的状态标记为已查询。
可选的,所述关联结果生成模块309,具体用于:
将所述第一查询结果集与所述第二查询结果集进行外连接,得到连接后的查询结果集。
可选的,该装置还可以包括:
查询脚本获取模块,用于在获取针对第一表格的第一查询语句之前,获取多表关联查询脚本;
脚本解析模块,用于解析所述脚本,得到所述第一查询语句与所述第二查询语句。
基于同样的思路,本说明书实施例还提供了上述方法对应的设备。
图4为本说明书实施例提供的对应于图2的一种多表关联查询设备的结构示意图。如图4所示,设备400可以包括:
至少一个处理器410;以及,
与所述至少一个处理器通信连接的存储器430;其中,
所述存储器430存储有可被所述至少一个处理器410执行的指令420,所述指令被所述至少一个处理器410执行,以使所述至少一个处理器410能够:
获取针对第一表格的第一查询语句;所述第一查询语句是对多表关联查询脚本进行解析得到的;
获取针对第二表格的第二查询语句;所述第二查询语句是对所述多表关联查询脚本进行解析得到的;所述第一查询语句与所述第二查询语句中的查询条件具有相同的字段;
估算所述第一查询语句的第一查询代价;
估算所述第二查询语句的第二查询代价;
比较所述第一查询代价与所述第二查询代价,确定最小查询代价;
根据所述最小查询代价对应的查询语句进行查询,得到第一查询结果集;
根据所述第一查询结果集,改写另外的查询语句;
根据所述改写后的查询语句进行查询,得到第二查询结果集;
根据所述第一查询结果集与所述第二查询结果集,得到关联查询结果集。
在20世纪90年代,对于一个技术的改进可以很明显地区分是硬件上的改进(例如,对二极管、晶体管、开关等电路结构的改进)还是软件上的改进(对于方法流程的改进)。然而,随着技术的发展,当今的很多方法流程的改进已经可以视为硬件电路结构的直接改进。设计人员几乎都通过将改进的方法流程编程到硬件电路中来得到相应的硬件电路结构。因此,不能说一个方法流程的改进就不能用硬件实体模块来实现。例如,可编程逻辑器件(Programmable Logic Device,PLD)(例如现场可编程门阵列(Field Programmable GateArray,FPGA))就是这样一种集成电路,其逻辑功能由用户对器件编程来确定。由设计人员自行编程来把一个数字***“集成”在一片PLD上,而不需要请芯片制造厂商来设计和制作专用的集成电路芯片。而且,如今,取代手工地制作集成电路芯片,这种编程也多半改用“逻辑编译器(logic compiler)”软件来实现,它与程序开发撰写时所用的软件编译器相类似,而要编译之前的原始代码也得用特定的编程语言来撰写,此称之为硬件描述语言(Hardware Description Language,HDL),而HDL也并非仅有一种,而是有许多种,如ABEL(Advanced Boolean Expression Language)、AHDL(Altera Hardware DescriptionLanguage)、Confluence、CUPL(Cornell University Programming Language)、HDCal、JHDL(Java Hardware Description Language)、Lava、Lola、MyHDL、PALASM、RHDL(RubyHardware Description Language)等,目前最普遍使用的是VHDL(Very-High-SpeedIntegrated Circuit Hardware Description Language)与Verilog。本领域技术人员也应该清楚,只需要将方法流程用上述几种硬件描述语言稍作逻辑编程并编程到集成电路中,就可以很容易得到实现该逻辑方法流程的硬件电路。
控制器可以按任何适当的方式实现,例如,控制器可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(Application Specific Integrated Circuit,ASIC)、可编程逻辑控制器和嵌入微控制器的形式,控制器的例子包括但不限于以下微控制器:ARC 625D、Atmel AT91SAM、Microchip PIC18F26K20以及Silicone Labs C8051F320,存储器控制器还可以被实现为存储器的控制逻辑的一部分。本领域技术人员也知道,除了以纯计算机可读程序代码方式实现控制器以外,完全可以通过将方法步骤进行逻辑编程来使得控制器以逻辑门、开关、专用集成电路、可编程逻辑控制器和嵌入微控制器等的形式来实现相同功能。因此这种控制器可以被认为是一种硬件部件,而对其内包括的用于实现各种功能的装置也可以视为硬件部件内的结构。或者甚至,可以将用于实现各种功能的装置视为既可以是实现方法的软件模块又可以是硬件部件内的结构。
上述实施例阐明的***、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的,计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。
为了描述的方便,描述以上装置时以功能分为各种单元分别描述。当然,在实施本申请时可以把各单元的功能在同一个或多个软件和/或硬件中实现。
本领域内的技术人员应明白,本发明的实施例可提供为方法、***、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(***)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
本申请可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本申请,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于***实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。

Claims (19)

1.一种多表关联查询方法,包括:
获取针对第一表格的第一查询语句;所述第一查询语句是对多表关联查询脚本进行解析得到的;
获取针对第二表格的第二查询语句;所述第二查询语句是对所述多表关联查询脚本进行解析得到的;所述第一查询语句与所述第二查询语句中的查询条件具有相同的字段;
估算所述第一查询语句的第一查询代价;
估算所述第二查询语句的第二查询代价;
比较所述第一查询代价与所述第二查询代价,确定最小查询代价;
根据所述最小查询代价对应的查询语句进行查询,得到第一查询结果集;
根据所述第一查询结果集,改写另外的查询语句;
根据所述改写后的查询语句进行查询,得到第二查询结果集;
根据所述第一查询结果集与所述第二查询结果集,得到关联查询结果集。
2.如权利要求1所述的方法,所述根据所述第一查询结果集,改写另外的查询语句,具体包括:
将所述另外的查询语句中的所述相同的字段,用所述第一查询结果集的值进行限定。
3.如权利要求1所述的方法,所述估算所述第一查询语句的第一查询代价之前,还包括:
判断所述第一表格的数据量是否大于预设阈值,得到第一判断结果;
所述估算所述第一查询语句的第一查询代价,具体包括:
当所述第一判断结果表示所述第一表格的数据量不大于所述预设阈值时,估算所述第一查询语句的第一查询代价。
4.如权利要求3所述的方法,还包括:
当所述第一判断结果表示所述第一表格的数据量大于所述预设阈值时,根据所述第一查询语句进行查询,得到第三查询结果集;
根据所述第二查询语句进行查询,得到第四查询结果集;
根据所述第三查询结果集与所述第四查询结果集,得到关联查询结果集。
5.如权利要求1所述的方法,还包括:
获取针对第三表格的第三查询语句;所述第三查询语句中的查询条件具有所述相同的字段;
估算所述第三查询语句的第三查询代价;
所述确定最小查询代价之后,所述根据所述最小查询代价对应的查询语句进行查询之前,还包括:
比较所述第三查询代价与所述最小查询代价;
若所述第三查询代价小于所述最小查询代价,则根据所述第三查询语句进行查询,得到第五查询结果集;
根据所述第五查询结果集,改写所述最小查询代价对应的查询语句;
所述根据所述最小查询代价对应的查询语句进行查询,具体包括:
根据改写后的所述最小查询代价对应的查询语句进行查询。
6.如权利要求1所述的方法,所述根据所述最小查询代价对应的查询语句进行查询之后,还包括:
将所述最小查询代价对应的查询语句针对的表格的状态标记为已查询。
7.如权利要求1所述的方法,所述根据所述改写后的查询语句进行查询之后,还包括:
将所述改写后的查询语句针对的表格的状态标记为已查询。
8.如权利要求1所述的方法,根据所述第一查询结果集与所述第二查询结果集,得到关联查询结果集,具体包括:
将所述第一查询结果集与所述第二查询结果集进行外连接,得到连接后的查询结果集。
9.如权利要求1所述的方法,所述获取针对第一表格的第一查询语句之前,还包括:
获取多表关联查询脚本;
解析所述脚本,得到所述第一查询语句与所述第二查询语句。
10.一种多表关联查询装置,包括:
第一查询语句获取模块,用于获取针对第一表格的第一查询语句;所述第一查询语句是对多表关联查询脚本进行解析得到的;
第二查询语句获取模块,用于获取针对第二表格的第二查询语句;所述第二查询语句是对所述多表关联查询脚本进行解析得到的;所述第一查询语句与所述第二查询语句中的查询条件具有相同的字段;
第一查询代价估算模块,用于估算所述第一查询语句的第一查询代价;
第二查询代价估算模块,用于估算所述第二查询语句的第二查询代价;
查询代价比较模块,用于比较所述第一查询代价与所述第二查询代价,确定最小查询代价;
第一查询模块,用于根据所述最小查询代价对应的查询语句进行查询,得到第一查询结果集;
查询语句改写模块,用于根据所述第一查询结果集,改写另外的查询语句;
第二查询模块,用于根据所述改写后的查询语句进行查询,得到第二查询结果集;
关联结果生成模块,用于根据所述第一查询结果集与所述第二查询结果集,得到关联查询结果集。
11.如权利要求10所述的装置,所述查询语句改写模块,具体包括:
查询语句改写单元,用于将所述另外的查询语句中的所述相同的字段,用所述第一查询结果集的值进行限定。
12.如权利要求10所述的装置,还包括:
第一判断模块,用于在估算所述第一查询语句的第一查询代价之前,判断所述第一表格的数据量是否大于预设阈值,得到第一判断结果;
所述第一查询代价估算模块,具体用于:
当所述第一判断结果表示所述第一表格的数据量不大于所述预设阈值时,估算所述第一查询语句的第一查询代价。
13.如权利要求12所述的装置,还包括:
第三查询模块,用于当所述第一判断结果表示所述第一表格的数据量大于所述预设阈值时,根据所述第一查询语句进行查询,得到第三查询结果集;
第四查询模块,用于根据所述第二查询语句进行查询,得到第四查询结果集;
所述关联结果生成模块,还用于根据所述第三查询结果集与所述第四查询结果集,得到关联查询结果集。
14.如权利要求10所述的装置,还包括:
第三查询语句获取模块,用于获取针对第三表格的第三查询语句;所述第三查询语句中的查询条件具有所述相同的字段;
第三查询代价估算模块,用于估算所述第三查询语句的第三查询代价;
所述查询代价比较模块,还用于在确定最小查询代价之后,所述根据所述最小查询代价对应的查询语句进行查询之前,比较所述第三查询代价与所述最小查询代价;
第四查询模块,用于若所述第三查询代价小于所述最小查询代价,则根据所述第三查询语句进行查询,得到第五查询结果集;
所述查询语句改写模块,还用于根据所述第五查询结果集,改写所述最小查询代价对应的查询语句;
所述第一查询模块,还用于:
根据改写后的所述最小查询代价对应的查询语句进行查询。
15.如权利要求10所述的装置,还包括:
第一标记模块,用于根据所述最小查询代价对应的查询语句进行查询之后,将所述最小查询代价对应的查询语句针对的表格的状态标记为已查询。
16.如权利要求10所述的装置,还包括:
第二标记模块,用于根据所述改写后的查询语句进行查询之后,将所述改写后的查询语句针对的表格的状态标记为已查询。
17.如权利要求10所述的装置,所述关联结果生成模块,具体用于:
将所述第一查询结果集与所述第二查询结果集进行外连接,得到连接后的查询结果集。
18.如权利要求10所述的装置,还包括:
查询脚本获取模块,用于在获取针对第一表格的第一查询语句之前,获取多表关联查询脚本;
脚本解析模块,用于解析所述脚本,得到所述第一查询语句与所述第二查询语句。
19.一种多表关联查询设备,包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够:
获取针对第一表格的第一查询语句;所述第一查询语句是对多表关联查询脚本进行解析得到的;
获取针对第二表格的第二查询语句;所述第二查询语句是对所述多表关联查询脚本进行解析得到的;所述第一查询语句与所述第二查询语句中的查询条件具有相同的字段;
估算所述第一查询语句的第一查询代价;
估算所述第二查询语句的第二查询代价;
比较所述第一查询代价与所述第二查询代价,确定最小查询代价;
根据所述最小查询代价对应的查询语句进行查询,得到第一查询结果集;
根据所述第一查询结果集,改写另外的查询语句;
根据所述改写后的查询语句进行查询,得到第二查询结果集;
根据所述第一查询结果集与所述第二查询结果集,得到关联查询结果集。
CN201811144099.7A 2018-09-29 2018-09-29 一种多表关联查询方法、装置及设备 Active CN109656946B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811144099.7A CN109656946B (zh) 2018-09-29 2018-09-29 一种多表关联查询方法、装置及设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811144099.7A CN109656946B (zh) 2018-09-29 2018-09-29 一种多表关联查询方法、装置及设备

Publications (2)

Publication Number Publication Date
CN109656946A true CN109656946A (zh) 2019-04-19
CN109656946B CN109656946B (zh) 2022-12-16

Family

ID=66110687

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811144099.7A Active CN109656946B (zh) 2018-09-29 2018-09-29 一种多表关联查询方法、装置及设备

Country Status (1)

Country Link
CN (1) CN109656946B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112307050A (zh) * 2020-09-16 2021-02-02 苏宁云计算有限公司 一种重复关联计算的识别方法、装置及计算机***
CN113297248A (zh) * 2020-07-27 2021-08-24 阿里巴巴集团控股有限公司 数据处理、资源分配方法、装置、设备及可读存储介质
CN113434529A (zh) * 2021-06-22 2021-09-24 青岛海尔科技有限公司 业务数据查询方法、装置、存储介质、处理器及电子设备

Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1556482A (zh) * 2003-12-31 2004-12-22 中兴通讯股份有限公司 一种用于实现数据库多表查询的数据处理方法
CN101561817A (zh) * 2009-06-02 2009-10-21 天津大学 一种XQuery到SQL查询语言的转换算法及关系数据的查询方法
CN101739453A (zh) * 2009-12-17 2010-06-16 中国电力科学研究院 一种对数据库表进行条件查询的方法及装置
US20100185643A1 (en) * 2009-01-20 2010-07-22 Oracle International Corporation Techniques for automated generation of queries for querying ontologies
CN103092998A (zh) * 2013-02-21 2013-05-08 用友软件股份有限公司 数据查询***和数据查询方法
US20130173588A1 (en) * 2011-12-28 2013-07-04 Teradata Us, Inc. Techniques for updating join indexes
US20130262498A1 (en) * 2012-03-30 2013-10-03 International Business Machines Corporation Database query optimization
US20140032588A1 (en) * 2012-07-29 2014-01-30 Sergiy GETMANETS Systems And Methods For Providing A Simplified Application Programming Interface For Converting From Two-Dimensional Query Languages Into Multi-Dimensional Query Languages To Query Multi-Dimensional Data Sources And MDX Servers
CN105574052A (zh) * 2014-11-06 2016-05-11 中兴通讯股份有限公司 数据库查询方法及装置
CN105630881A (zh) * 2015-12-18 2016-06-01 陕西师范大学 一种rdf的数据存储方法和查询方法
CN106250519A (zh) * 2016-08-04 2016-12-21 曙光信息产业(北京)有限公司 用于并行数据库的数据查询方法和装置
CN107315790A (zh) * 2017-06-14 2017-11-03 腾讯科技(深圳)有限公司 一种非相关子查询的优化方法和装置
CN108073641A (zh) * 2016-11-18 2018-05-25 华为技术有限公司 查询数据表的方法和装置
CN108509637A (zh) * 2018-04-10 2018-09-07 口碑(上海)信息技术有限公司 数据表关联查询方法及装置

Patent Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1556482A (zh) * 2003-12-31 2004-12-22 中兴通讯股份有限公司 一种用于实现数据库多表查询的数据处理方法
US20100185643A1 (en) * 2009-01-20 2010-07-22 Oracle International Corporation Techniques for automated generation of queries for querying ontologies
CN101561817A (zh) * 2009-06-02 2009-10-21 天津大学 一种XQuery到SQL查询语言的转换算法及关系数据的查询方法
CN101739453A (zh) * 2009-12-17 2010-06-16 中国电力科学研究院 一种对数据库表进行条件查询的方法及装置
US20130173588A1 (en) * 2011-12-28 2013-07-04 Teradata Us, Inc. Techniques for updating join indexes
US20130262498A1 (en) * 2012-03-30 2013-10-03 International Business Machines Corporation Database query optimization
US20140032588A1 (en) * 2012-07-29 2014-01-30 Sergiy GETMANETS Systems And Methods For Providing A Simplified Application Programming Interface For Converting From Two-Dimensional Query Languages Into Multi-Dimensional Query Languages To Query Multi-Dimensional Data Sources And MDX Servers
CN103092998A (zh) * 2013-02-21 2013-05-08 用友软件股份有限公司 数据查询***和数据查询方法
CN105574052A (zh) * 2014-11-06 2016-05-11 中兴通讯股份有限公司 数据库查询方法及装置
CN105630881A (zh) * 2015-12-18 2016-06-01 陕西师范大学 一种rdf的数据存储方法和查询方法
CN106250519A (zh) * 2016-08-04 2016-12-21 曙光信息产业(北京)有限公司 用于并行数据库的数据查询方法和装置
CN108073641A (zh) * 2016-11-18 2018-05-25 华为技术有限公司 查询数据表的方法和装置
CN107315790A (zh) * 2017-06-14 2017-11-03 腾讯科技(深圳)有限公司 一种非相关子查询的优化方法和装置
CN108509637A (zh) * 2018-04-10 2018-09-07 口碑(上海)信息技术有限公司 数据表关联查询方法及装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
何志学等: "一种基于语义信息的XML Twig查询处理方法", 《微电子学与计算机》 *
陈荦等: "基于尺度选择性的空间数据源选择与预取策略", 《国防科技大学学报》 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113297248A (zh) * 2020-07-27 2021-08-24 阿里巴巴集团控股有限公司 数据处理、资源分配方法、装置、设备及可读存储介质
CN112307050A (zh) * 2020-09-16 2021-02-02 苏宁云计算有限公司 一种重复关联计算的识别方法、装置及计算机***
CN112307050B (zh) * 2020-09-16 2022-11-15 苏宁云计算有限公司 一种重复关联计算的识别方法、装置及计算机***
CN113434529A (zh) * 2021-06-22 2021-09-24 青岛海尔科技有限公司 业务数据查询方法、装置、存储介质、处理器及电子设备
CN113434529B (zh) * 2021-06-22 2023-06-16 青岛海尔科技有限公司 业务数据查询方法、装置、存储介质、处理器及电子设备

Also Published As

Publication number Publication date
CN109656946B (zh) 2022-12-16

Similar Documents

Publication Publication Date Title
TWI701588B (zh) 詞向量處理方法、裝置以及設備
TWI709931B (zh) 一種指標異常檢測方法、裝置以及電子設備
CN107562775A (zh) 一种基于区块链的数据处理方法及设备
CN107391526A (zh) 一种基于区块链的数据处理方法及设备
US11030411B2 (en) Methods, apparatuses, and devices for generating word vectors
CN107679700A (zh) 业务流程处理方法、装置及服务器
CN105468797B (zh) 一种信息处理方法及装置
CN109582485A (zh) 一种配置变更异常检测方法及装置
CN107622080B (zh) 一种数据处理方法及设备
CN109086961A (zh) 一种信息风险监测方法及装置
CN109656946A (zh) 一种多表关联查询方法、装置及设备
CN106201673B (zh) 一种地震数据处理方法及装置
CN105824830A (zh) 一种显示页面的方法、客户端及设备
CN109241026A (zh) 数据管理的方法、装置及***
CN108763059A (zh) 一种异常检测方法、装置及设备
CN110263050A (zh) 数据处理方法、装置、设备及存储介质
CN107038058A (zh) 一种代码处理方法及装置
CN108021610A (zh) 随机游走、基于分布式***的随机游走方法、装置以及设备
CN105868216A (zh) 一种实现对象过期操作的方法、装置和设备
CN110119381A (zh) 一种索引更新方法、装置、设备及介质
CN110245978A (zh) 策略组中的策略评估、策略选择方法及装置
CN110516915A (zh) 业务节点训练、评估方法、装置及电子设备
CN108170663A (zh) 基于集群的词向量处理方法、装置以及设备
CN108959330A (zh) 一种数据库的处理、数据查询方法及设备
CN105426676B (zh) 一种钻井数据处理方法和***

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20200927

Address after: Cayman Enterprise Centre, 27 Hospital Road, George Town, Grand Cayman Islands

Applicant after: Advanced innovation technology Co.,Ltd.

Address before: A four-storey 847 mailbox in Grand Cayman Capital Building, British Cayman Islands

Applicant before: Alibaba Group Holding Ltd.

Effective date of registration: 20200927

Address after: Cayman Enterprise Centre, 27 Hospital Road, George Town, Grand Cayman Islands

Applicant after: Innovative advanced technology Co.,Ltd.

Address before: Cayman Enterprise Centre, 27 Hospital Road, George Town, Grand Cayman Islands

Applicant before: Advanced innovation technology Co.,Ltd.

TA01 Transfer of patent application right
GR01 Patent grant
GR01 Patent grant