CN106933897A - 数据查询方法和装置 - Google Patents

数据查询方法和装置 Download PDF

Info

Publication number
CN106933897A
CN106933897A CN201511031422.6A CN201511031422A CN106933897A CN 106933897 A CN106933897 A CN 106933897A CN 201511031422 A CN201511031422 A CN 201511031422A CN 106933897 A CN106933897 A CN 106933897A
Authority
CN
China
Prior art keywords
data
tables
checked
metadata
target matrix
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201511031422.6A
Other languages
English (en)
Other versions
CN106933897B (zh
Inventor
洪超
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Gridsum Technology Co Ltd
Original Assignee
Beijing Gridsum Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Gridsum Technology Co Ltd filed Critical Beijing Gridsum Technology Co Ltd
Priority to CN201511031422.6A priority Critical patent/CN106933897B/zh
Publication of CN106933897A publication Critical patent/CN106933897A/zh
Application granted granted Critical
Publication of CN106933897B publication Critical patent/CN106933897B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/288Entity relationship models

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请公开了一种数据查询方法和装置。其中,该方法包括:接收数据查询请求,其中,数据查询请求中携带有待查询数据的维度和指标;利用数据仓库中预先配置的元数据确定出目标数据表集合,其中,元数据中预先配置有数据仓库中数据表的关联关系;检测目标数据表集合中是否包含雪花模型的数据表;在目标数据表集合中包含雪花模型的数据表时,连接雪花模型的数据表;通过雪花模型的数据表连接目标数据表集合中其他的星型模型的数据表;以及根据连接的数据表查询待查询数据。本申请解决了现有的查询***无法对星型模型和雪花模型结合的数据组织方式的数据仓库进行数据查询的技术问题。

Description

数据查询方法和装置
技术领域
本申请涉及数据分析领域,具体而言,涉及一种数据查询方法和装置。
背景技术
在分析数据领域,数据模型通常包括星型模型和雪花模型,其中,星形模型的数据组织模式是:一张数据事实表,其它的表都是维度表,如时间维度,地理维度表等,维度表成辐射状分布在事实表的四周;雪花模型的数据组织模式是:一张事实表与维度表关联时需要经过中间事实表或中间维度表,这样构成了多层关联的关系,类似于雪花一样的形状,如通过产品名称去剖析会话相关数据时,得通过中间数据订单表来进行关联。即先需要通过产品查找出其对应的所有订单,再通过订单关联到其所有相关的会话,最终得到想要的结果。
由于星型模型的主要数据都集中在事实表中,所以只要扫描事实表就可以进行数据查询,查询效率高,但会造成大量的数据冗余;而雪花模型能够在一定程度上减少存储空间,规范化的数据结构更容易更新和维度,然而,雪花模型由于比较复杂,用户不易理解,浏览内容相对困难,额外的连接将使查询性能下降。
发明人发现,基于两种数据模型的优缺点,数据仓库可以采用星型模型和雪花模型结合的方式来组织数据,从而利用不同数据模型的优点,并降低其缺点带来的影响。然而,现有的很多数据查询***例如Impala,还无法实现对星型模型和雪花模型结合的数据组织方式的数据仓库的查询,也就无法对该数据仓库中的数据进行多维度的剖析。
针对上述的问题,目前尚未提出有效的解决方案。
发明内容
本申请实施例提供了一种数据查询方法和装置,以至少解决现有的查询***无法对星型模型和雪花模型结合的数据组织方式的数据仓库进行数据查询的技术问题。
根据本申请实施例的一个方面,提供了一种数据查询方法,包括:接收数据查询请求,其中,所述数据查询请求用于查询数据仓库中待查询数据,所述数据查询请求中携带有所述待查询数据的维度和指标;利用所述数据仓库中预先配置的元数据确定出目标数据表集合,其中,所述目标数据表集合包括与所述待查询数据的维度和指标关联的数据表,所述元数据中预先配置有所述数据仓库中数据表的关联关系;检测所述目标数据表集合中是否包含雪花模型的数据表;在所述目标数据表集合中包含所述雪花模型的数据表时,连接所述雪花模型的数据表;通过所述雪花模型的数据表连接所述目标数据表集合中其他的星型模型的数据表;以及根据连接的数据表查询所述待查询数据。
进一步地,利用所述数据仓库中预先配置的元数据确定出目标数据表集合包括:在所述元数据中查询所述待查询数据的维度和指标;根据所述元数据中记录的维度和指标与数据表的映射关系,确定出所述待查询数据的维度和指标关联的数据表,得到所述目标数据表集合。
进一步地,所述数据仓库中的雪花模型的数据表在所述元数据中配置有对应的桥接表,所述桥接表为对应的雪花模型的数据表中的任意一张数据表,其中,通过所述雪花模型的数据表连接所述目标数据表集合中其他的星型模型的数据表包括:通过所述雪花模型的数据表对应的桥接表连接所述目标数据表集合中其他的星型模型的数据表。
进一步地,根据连接的数据表查询所述待查询数据包括:根据所述连接的数据表和所述待查询数据的维度和指标生成查询语句;执行所述查询语句,查询得到所述待查询数据。
进一步地,在接收数据查询请求之前,所述方法还包括:配置所述数据仓库中所有数据表的所述元数据,其中,所述元数据中通过外键表示数据表之间的关联关系。
根据本申请实施例的另一方面,还提供了一种数据查询装置,包括:接收单元,接收数据查询请求,其中,所述数据查询请求用于查询数据仓库中待查询数据,所述数据查询请求中携带有所述待查询数据的维度和指标;确定单元,用于利用所述数据仓库中预先配置的元数据确定出目标数据表集合,其中,所述目标数据表集合包括与所述待查询数据的维度和指标关联的数据表,所述元数据中预先配置有所述数据仓库中数据表的关联关系;检测单元,用于检测所述目标数据表集合中是否包含雪花模型的数据表;第一连接单元,用于在所述目标数据表集合中包含所述雪花模型的数据表时,连接所述雪花模型的数据表;第二连接单元,用于通过所述雪花模型的数据表连接所述目标数据表集合中其他的星型模型的数据表;以及查询单元,用于根据连接的数据表查询所述待查询数据。
进一步地,所述确定单元包括:查询模块,用于在所述元数据中查询所述待查询数据的维度和指标;确定模块,用于根据所述元数据中记录的维度和指标与数据表的映射关系,确定出所述待查询数据的维度和指标关联的数据表,得到所述目标数据表集合。
进一步地,所述数据仓库中的雪花模型的数据表在所述元数据中配置有对应的桥接表,所述桥接表为对应的雪花模型的数据表中的任意一张数据表,其中,所述第二连接单元包括:连接模块,用于通过所述雪花模型的数据表对应的桥接表连接所述目标数据表集合中其他的星型模型的数据表。
进一步地,所述查询单元包括:生成模块,用于根据所述连接的数据表和所述待查询数据的维度和指标生成查询语句;执行模块,用于执行所述查询语句,查询得到所述待查询数据。
进一步地,所述装置还包括:配置单元,用于在接收数据查询请求之前,配置所述数据仓库中所有数据表的所述元数据,其中,所述元数据中通过外键表示数据表之间的关联关系。
根据本申请实施例,接收数据查询请求,其中,数据查询请求用于查询数据仓库中待查询数据,数据查询请求中携带有待查询数据的维度和指标;利用数据仓库中预先配置的元数据确定出目标数据表集合,其中,目标数据表集合包括与待查询数据的维度和指标关联的数据表,元数据中预先配置有数据仓库中数据表的关联关系;检测目标数据表集合中是否包含雪花模型的数据表;通过雪花模型的数据表连接目标数据表集合中其他的星型模型的数据表根据连接的数据表查询待查询数据。通过利用元数据配置数据表之间的关联关系,在进行数据查询时,可以利用元数据来连接雪花模型和星型模型的数据表,实现数据查询,解决了现有的查询***无法对星型模型和雪花模型结合的数据组织方式的数据仓库进行数据查询的技术问题。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1是根据本申请实施例的数据查询方法的流程图;
图2是根据本申请实施例的数据查询装置的示意图。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、***、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
根据本申请实施例,提供了一种数据查询方法的方法实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机***中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
图1是根据本申请实施例的数据查询方法的流程图,如图1所示,该方法包括如下步骤:
步骤S102,接收数据查询请求,其中,数据查询请求用于查询数据仓库中待查询数据,数据查询请求中携带有待查询数据的维度和指标。
步骤S104,利用数据仓库中预先配置的元数据确定出目标数据表集合,其中,目标数据表集合包括与待查询数据的维度和指标关联的数据表,元数据中预先配置有数据仓库中数据表的关联关系。
本申请实施例中,数据仓库中的数据组织方式包括星型模型和雪花模型,该数据仓库中预先通过元数据来配置各数据表之间的关联关系。当需要查询数据时,向查询***发送数据查询请求,查询***接收到数据查询请求之后,可以从该数据查询请求中解析出待查询数据的维度和指标等信息,再根据元数据确定出所要用到的数据表,及数据表上的数据列,得到目标数据表集合。
步骤S106,检测目标数据表集合中是否包含雪花模型的数据表。
步骤S108,在目标数据表集合中包含雪花模型的数据表时,连接雪花模型的数据表。
对于上述目标数据表集合,为了提高查询效率,先检测其中是否包含有雪花模型的数据表,如果有则,先连接该雪花模型的数据表。
步骤S110,通过雪花模型的数据表连接目标数据表集合中其他的星型模型的数据表。
步骤S112,根据连接的数据表查询待查询数据。
在连接完雪花模型的数据表之后,再连接其他的星型模型的数据表,然后执行数据查询,得到所要查询的数据即待查询数据。
根据本申请实施例,接收数据查询请求,其中,数据查询请求用于查询数据仓库中待查询数据,数据查询请求中携带有待查询数据的维度和指标;利用数据仓库中预先配置的元数据确定出目标数据表集合,其中,目标数据表集合包括与待查询数据的维度和指标关联的数据表,元数据中预先配置有数据仓库中数据表的关联关系;检测目标数据表集合中是否包含雪花模型的数据表;通过雪花模型的数据表连接目标数据表集合中其他的星型模型的数据表根据连接的数据表查询待查询数据。通过利用元数据配置数据表之间的关联关系,在进行数据查询时,可以利用元数据来连接雪花模型和星型模型的数据表,实现数据查询,解决了现有的查询***无法对星型模型和雪花模型结合的数据组织方式的数据仓库进行数据查询的技术问题。
可选地,可以在元数据中配置有每张数据表的相关信息,例如数据表的类型。这样,检测目标数据表集合中是否存在雪花模型的数据表可以查找该集合中所有数据表的元数据,判断是否有标记为雪花模型的数据表,如果有,则确定该集合中存在雪花模型的数据表。
需要说明的是,本申请实施例中,由于雪花模型和星型模型均为包括多张数据表(包括维度表和事实表),因此,本申请实施例中所述的雪花模型和星型模型的数据表均表示组成雪花模型和星型模型的数据表组。
优选地,在接收数据查询请求之前,方法还包括:配置数据仓库中所有数据表的元数据,其中,元数据中通过外键表示数据表之间的关联关系。
本实施例中,在进行数据查询之前,配置数据仓库中数据表的元数据,并通过数据表的外键表示各数据表之间的关联关系。
本申请实施例中,元数据可以采用任意格式进行配置,只要能表达整个数据仓库所有表的数据对应关系即可。本实施例中,以JSON格式配置的元数据示例如下:
上面示例中,Tables表示数据表,雪花模型的数据表由于是多个数据表,因此,其对应的字段中包含有多个表名,如上述示例中所示。TableJoinColumns字段表示外键,通过该字段表示不同表之间的关联关系。IsSnowTable字段表示是否是雪花型关系(true表示雪花模型,false表示非雪花模型)。本实施例中,所有底层的星型模型的数据表在最后的IsSnowTable为false的节点进行配置,雪花模型的数据表按照上面示例进行配置,并提供各数据表关联的数据列字段。
优选地,利用数据仓库中预先配置的元数据确定出目标数据表集合包括:在元数据中查询待查询数据的维度和指标;根据元数据中记录的维度和指标与数据表的映射关系,确定出待查询数据的维度和指标关联的数据表,得到目标数据表集合。
本申请实施例中,元数据中还记录有每张数据表对应的维度和/或指标的信息。在在确定出待查询数据的维度和指标等信息之后,可以在元数据中匹配出包含有这些维度和指标的数据表,得到目标数据表集合。
根据本申请实施例,通过在元数据中配置数据表所包含的数据维度和/或指标信息,便于在数据查询时,通过这些信息确定出所要用到的数据表,提高数据查询效率。
优选地,数据仓库中的雪花模型的数据表在元数据中配置有对应的桥接表,桥接表为对应的雪花模型的数据表中的任意一张数据表,其中,通过雪花模型的数据表连接目标数据表集合中其他的数据表包括:通过雪花模型的数据表对应的桥接表连接目标数据表集合中其他的数据表。
由于雪花模型为多张数据表的数据组织形式,因此,本申请实施例中,可以在元数据中将雪花模型的数据表中的任意一张数据表配置为桥接表。在进行表连接时,通过该桥接表与其他的数据表连接。
如上面的元数据配置示例中,MediumTable字段表示桥接表。
本实施例中,通过雪花模型的数据表中预先定义的桥接表与其他数据表连接,避免雪花模型的数据表与其他数据表之间连接出现问题,实现数据表之间的准确连接。
优选地,根据连接的数据表查询待查询数据包括:根据连接的数据表和待查询数据的维度和指标生成查询语句;执行查询语句,查询得到待查询数据。
本实施例中,在连接完所有需要用到的数据表之后,生成相应的查询语句,如SQL语句,然后***执行该生成的查询语句,得到查询结果。
本申请实施例还提供了一种数据查询装置,该装置可以用于执行本申请实施例的数据查询方法,如图2所示,该装置包括:接收单元10、确定单元20、检测单元30、第一连接单元40、第二连接单元50和查询单元60。
接收单元10接收数据查询请求,其中,数据查询请求用于查询数据仓库中待查询数据,数据查询请求中携带有待查询数据的维度和指标。
确定单元20用于利用数据仓库中预先配置的元数据确定出目标数据表集合,其中,目标数据表集合包括与待查询数据的维度和指标关联的数据表,元数据中预先配置有数据仓库中数据表的关联关系。
本申请实施例中,数据仓库中的数据组织方式包括星型模型和雪花模型,该数据仓库中预先通过元数据来配置各数据表之间的关联关系。当需要查询数据时,向查询***发送数据查询请求,查询***接收到数据查询请求之后,可以从该数据查询请求中解析出待查询数据的维度和指标等信息,再根据元数据确定出所要用到的数据表,及数据表上的数据列,得到目标数据表集合。
检测单元30用于检测目标数据表集合中是否包含雪花模型的数据表。
第一连接单元40用于在目标数据表集合中包含雪花模型的数据表时,连接雪花模型的数据表。
对于上述目标数据表集合,为了提高查询效率,先检测其中是否包含有雪花模型的数据表,如果有则,先连接该雪花模型的数据表。
第二连接单元50用于通过雪花模型的数据表连接目标数据表集合中其他的星型模型的数据表。
查询单元60用于根据连接的数据表查询待查询数据。
在连接完雪花模型的数据表之后,再连接其他的星型模型的数据表,然后执行数据查询,得到所要查询的数据即待查询数据。
根据本申请实施例,接收数据查询请求,其中,数据查询请求用于查询数据仓库中待查询数据,数据查询请求中携带有待查询数据的维度和指标;利用数据仓库中预先配置的元数据确定出目标数据表集合,其中,目标数据表集合包括与待查询数据的维度和指标关联的数据表,元数据中预先配置有数据仓库中数据表的关联关系;检测目标数据表集合中是否包含雪花模型的数据表;通过雪花模型的数据表连接目标数据表集合中其他的星型模型的数据表根据连接的数据表查询待查询数据。通过利用元数据配置数据表之间的关联关系,在进行数据查询时,可以利用元数据来连接雪花模型和星型模型的数据表,实现数据查询,解决了现有的查询***无法对星型模型和雪花模型结合的数据组织方式的数据仓库进行数据查询的技术问题。
可选地,可以在元数据中配置有每张数据表的相关信息,例如数据表的类型。这样,检测目标数据表集合中是否存在雪花模型的数据表可以查找该集合中所有数据表的元数据,判断是否有标记为雪花模型的数据表,如果有,则确定该集合中存在雪花模型的数据表。
需要说明的是,本申请实施例中,由于雪花模型和星型模型均为包括多张数据表(包括维度表和事实表),因此,本申请实施例中所述的雪花模型和星型模型的数据表均表示组成雪花模型和星型模型的数据表组。
优选地,装置还包括:配置单元,用于在接收数据查询请求之前,配置数据仓库中所有数据表的元数据,其中,元数据中通过外键表示数据表之间的关联关系。
本实施例中,在进行数据查询之前,配置数据仓库中数据表的元数据,并通过数据表的外键表示各数据表之间的关联关系。本申请实施例中,元数据可以采用任意格式进行配置,只要能表达整个数据仓库所有表的数据对应关系即可。
优选地,确定单元包括:查询模块,用于在元数据中查询待查询数据的维度和指标;确定模块,用于根据元数据中记录的维度和指标与数据表的映射关系,确定出待查询数据的维度和指标关联的数据表,得到目标数据表集合。
本申请实施例中,元数据中还记录有每张数据表对应的维度和/或指标的信息。在在确定出待查询数据的维度和指标等信息之后,可以在元数据中匹配出包含有这些维度和指标的数据表,得到目标数据表集合。
根据本申请实施例,通过在元数据中配置数据表所包含的数据维度和/或指标信息,便于在数据查询时,通过这些信息确定出所要用到的数据表,提高数据查询效率。
优选地,数据仓库中的雪花模型的数据表在元数据中配置有对应的桥接表,桥接表为对应的雪花模型的数据表中的任意一张数据表,其中,第二连接单元包括:连接模块,用于通过雪花模型的数据表对应的桥接表连接目标数据表集合中其他的星型模型的数据表。
由于雪花模型为多张数据表的数据组织形式,因此,本申请实施例中,可以在元数据中将雪花模型的数据表中的任意一张数据表配置为桥接表。在进行表连接时,通过该桥接表与其他的数据表连接。
如上面的元数据配置示例中,MediumTable字段表示桥接表。
本实施例中,通过雪花模型的数据表中预先定义的桥接表与其他数据表连接,避免雪花模型的数据表与其他数据表之间连接出现问题,实现数据表之间的准确连接。
优选地,查询单元包括:生成模块,用于根据连接的数据表和待查询数据的维度和指标生成查询语句;执行模块,用于执行查询语句,查询得到待查询数据。
本实施例中,在连接完所有需要用到的数据表之后,生成相应的查询语句,如SQL语句,然后***执行该生成的查询语句,得到查询结果。
根据本申请上述实施例,通过构建元数据,对待查询数据的维度和指标进行元数据映射,找到需要的数据表和相关的数据列,在做数据表连接时,根据元数据中配置的数据表的关联关系,优先将雪花模型的数据表进行连接,再将剩下的所有星形表进行连接,最后生成相应的查询语句,执行并得到所需要的结果。
所述数据查询装置包括处理器和存储器,上述接收单元10、确定单元20、检测单元30、第一连接单元40、第二连接单元50和查询单元60等均作为程序单元存储在存储器中,由处理器执行存储在存储器中的上述程序单元。
处理器中包含内核,由内核去存储器中调取相应的程序单元。内核可以设置一个或以上,通过调整内核参数来从数据仓库中查询数据。
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM),存储器包括至少一个存储芯片。
本申请还提供了一种计算机程序产品的实施例,当在数据处理设备上执行时,适于执行初始化有如下方法步骤的程序代码:接收数据查询请求,其中,数据查询请求用于查询数据仓库中待查询数据,数据查询请求中携带有待查询数据的维度和指标;利用数据仓库中预先配置的元数据确定出目标数据表集合,其中,目标数据表集合包括与待查询数据的维度和指标关联的数据表,元数据中预先配置有数据仓库中数据表的关联关系;检测目标数据表集合中是否包含雪花模型的数据表;在目标数据表集合中包含雪花模型的数据表时,连接雪花模型的数据表;通过雪花模型的数据表连接目标数据表集合中其他的星型模型的数据表;以及根据连接的数据表查询待查询数据。
上述本申请实施例序号仅仅为了描述,不代表实施例的优劣。
在本申请的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的技术内容,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,可以为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个***,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅是本申请的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本申请的保护范围。

Claims (10)

1.一种数据查询方法,其特征在于,包括:
接收数据查询请求,其中,所述数据查询请求用于查询数据仓库中待查询数据,所述数据查询请求中携带有所述待查询数据的维度和指标;
利用所述数据仓库中预先配置的元数据确定出目标数据表集合,其中,所述目标数据表集合包括与所述待查询数据的维度和指标关联的数据表,所述元数据中预先配置有所述数据仓库中数据表的关联关系;
检测所述目标数据表集合中是否包含雪花模型的数据表;
在所述目标数据表集合中包含所述雪花模型的数据表时,连接所述雪花模型的数据表;
通过所述雪花模型的数据表连接所述目标数据表集合中其他的星型模型的数据表;以及
根据连接的数据表查询所述待查询数据。
2.根据权利要求1所述的方法,其特征在于,利用所述数据仓库中预先配置的元数据确定出目标数据表集合包括:
在所述元数据中查询所述待查询数据的维度和指标;
根据所述元数据中记录的维度和指标与数据表的映射关系,确定出所述待查询数据的维度和指标关联的数据表,得到所述目标数据表集合。
3.根据权利要求1所述的方法,其特征在于,所述数据仓库中的雪花模型的数据表在所述元数据中配置有对应的桥接表,所述桥接表为对应的雪花模型的数据表中的任意一张数据表,其中,通过所述雪花模型的数据表连接所述目标数据表集合中其他的星型模型的数据表包括:
通过所述雪花模型的数据表对应的桥接表连接所述目标数据表集合中其他的星型模型的数据表。
4.根据权利要求1所述的方法,其特征在于,根据连接的数据表查询所述待查询数据包括:
根据所述连接的数据表和所述待查询数据的维度和指标生成查询语句;
执行所述查询语句,查询得到所述待查询数据。
5.根据权利要求1所述的方法,其特征在于,在接收数据查询请求之前,所述方法还包括:
配置所述数据仓库中所有数据表的所述元数据,其中,所述元数据中通过外键表示数据表之间的关联关系。
6.一种数据查询装置,其特征在于,包括:
接收单元,接收数据查询请求,其中,所述数据查询请求用于查询数据仓库中待查询数据,所述数据查询请求中携带有所述待查询数据的维度和指标;
确定单元,用于利用所述数据仓库中预先配置的元数据确定出目标数据表集合,其中,所述目标数据表集合包括与所述待查询数据的维度和指标关联的数据表,所述元数据中预先配置有所述数据仓库中数据表的关联关系;
检测单元,用于检测所述目标数据表集合中是否包含雪花模型的数据表;
第一连接单元,用于在所述目标数据表集合中包含所述雪花模型的数据表时,连接所述雪花模型的数据表;
第二连接单元,用于通过所述雪花模型的数据表连接所述目标数据表集合中其他的星型模型的数据表;以及
查询单元,用于根据连接的数据表查询所述待查询数据。
7.根据权利要求6所述的装置,其特征在于,所述确定单元包括:
查询模块,用于在所述元数据中查询所述待查询数据的维度和指标;
确定模块,用于根据所述元数据中记录的维度和指标与数据表的映射关系,确定出所述待查询数据的维度和指标关联的数据表,得到所述目标数据表集合。
8.根据权利要求6所述的装置,其特征在于,所述数据仓库中的雪花模型的数据表在所述元数据中配置有对应的桥接表,所述桥接表为对应的雪花模型的数据表中的任意一张数据表,其中,所述第二连接单元包括:
连接模块,用于通过所述雪花模型的数据表对应的桥接表连接所述目标数据表集合中其他的星型模型的数据表。
9.根据权利要求6所述的装置,其特征在于,所述查询单元包括:
生成模块,用于根据所述连接的数据表和所述待查询数据的维度和指标生成查询语句;
执行模块,用于执行所述查询语句,查询得到所述待查询数据。
10.根据权利要求6所述的装置,其特征在于,所述装置还包括:
配置单元,用于在接收数据查询请求之前,配置所述数据仓库中所有数据表的所述元数据,其中,所述元数据中通过外键表示数据表之间的关联关系。
CN201511031422.6A 2015-12-31 2015-12-31 数据查询方法和装置 Active CN106933897B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201511031422.6A CN106933897B (zh) 2015-12-31 2015-12-31 数据查询方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201511031422.6A CN106933897B (zh) 2015-12-31 2015-12-31 数据查询方法和装置

Publications (2)

Publication Number Publication Date
CN106933897A true CN106933897A (zh) 2017-07-07
CN106933897B CN106933897B (zh) 2020-02-07

Family

ID=59444233

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201511031422.6A Active CN106933897B (zh) 2015-12-31 2015-12-31 数据查询方法和装置

Country Status (1)

Country Link
CN (1) CN106933897B (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107515916A (zh) * 2017-08-18 2017-12-26 北京奇虎科技有限公司 数据查询的性能优化方法及装置
CN107515912A (zh) * 2017-08-15 2017-12-26 上海数聚软件***股份有限公司 一种基于行业管理模型的报表数据获取方法
CN109684300A (zh) * 2018-11-20 2019-04-26 成都四方伟业软件股份有限公司 一种基于可视化的大数据仓库设计方法及***
CN109902100A (zh) * 2019-01-31 2019-06-18 平安科技(深圳)有限公司 报表查询方法、装置及存储介质
CN109933771A (zh) * 2019-03-22 2019-06-25 广州市玄武无线科技股份有限公司 一种报表自动合并方法、装置、设备及存储介质
CN110688541A (zh) * 2019-10-08 2020-01-14 中国建设银行股份有限公司 一种报表数据的查询方法、装置、存储介质及电子设备

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050065939A1 (en) * 2003-09-23 2005-03-24 International Business Machines Corporation Method and system for optimizing snow flake queries
WO2006136025A1 (en) * 2005-06-24 2006-12-28 Orbital Technologies Inc. System and method for translating between relational database queries and multidimensional database queries
US20130117217A1 (en) * 2011-11-09 2013-05-09 International Business Machines Corporation Star and snowflake schemas in extract, transform, load processes
US20130254199A1 (en) * 2009-06-12 2013-09-26 Microsoft Corporation Providing knowledge content to users
US20130275362A1 (en) * 2012-04-17 2013-10-17 Sap Ag Classic to In-Memory Cube Conversion
CN103927337A (zh) * 2014-03-26 2014-07-16 北京国双科技有限公司 用于联机分析处理中关联关系的数据处理方法和装置
CN104252506A (zh) * 2013-06-28 2014-12-31 易保网络技术(上海)有限公司 同步构建业务模型和数据仓库模型及其映射的方法及***
CN104657476A (zh) * 2015-02-16 2015-05-27 百度在线网络技术(北京)有限公司 联机分析处理的方法及***
US20150261820A1 (en) * 2014-03-13 2015-09-17 Xun Cheng Splitting of a join operation to allow parallelization

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050065939A1 (en) * 2003-09-23 2005-03-24 International Business Machines Corporation Method and system for optimizing snow flake queries
WO2006136025A1 (en) * 2005-06-24 2006-12-28 Orbital Technologies Inc. System and method for translating between relational database queries and multidimensional database queries
US20130254199A1 (en) * 2009-06-12 2013-09-26 Microsoft Corporation Providing knowledge content to users
US20130117217A1 (en) * 2011-11-09 2013-05-09 International Business Machines Corporation Star and snowflake schemas in extract, transform, load processes
US20130275362A1 (en) * 2012-04-17 2013-10-17 Sap Ag Classic to In-Memory Cube Conversion
CN104252506A (zh) * 2013-06-28 2014-12-31 易保网络技术(上海)有限公司 同步构建业务模型和数据仓库模型及其映射的方法及***
US20150261820A1 (en) * 2014-03-13 2015-09-17 Xun Cheng Splitting of a join operation to allow parallelization
CN103927337A (zh) * 2014-03-26 2014-07-16 北京国双科技有限公司 用于联机分析处理中关联关系的数据处理方法和装置
CN104657476A (zh) * 2015-02-16 2015-05-27 百度在线网络技术(北京)有限公司 联机分析处理的方法及***

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107515912A (zh) * 2017-08-15 2017-12-26 上海数聚软件***股份有限公司 一种基于行业管理模型的报表数据获取方法
CN107515916A (zh) * 2017-08-18 2017-12-26 北京奇虎科技有限公司 数据查询的性能优化方法及装置
CN107515916B (zh) * 2017-08-18 2020-12-04 北京奇虎科技有限公司 数据查询的性能优化方法及装置
CN109684300A (zh) * 2018-11-20 2019-04-26 成都四方伟业软件股份有限公司 一种基于可视化的大数据仓库设计方法及***
CN109902100A (zh) * 2019-01-31 2019-06-18 平安科技(深圳)有限公司 报表查询方法、装置及存储介质
CN109933771A (zh) * 2019-03-22 2019-06-25 广州市玄武无线科技股份有限公司 一种报表自动合并方法、装置、设备及存储介质
CN109933771B (zh) * 2019-03-22 2023-04-14 广州市玄武无线科技股份有限公司 一种报表自动合并方法、装置、设备及存储介质
CN110688541A (zh) * 2019-10-08 2020-01-14 中国建设银行股份有限公司 一种报表数据的查询方法、装置、存储介质及电子设备

Also Published As

Publication number Publication date
CN106933897B (zh) 2020-02-07

Similar Documents

Publication Publication Date Title
CN106933897A (zh) 数据查询方法和装置
US9471440B2 (en) Method and system for processing product properties
CN110019540B (zh) 企业图谱的实现方法、展示方法及装置、设备
CN104462430B (zh) 关系型数据库的数据处理方法及装置
CN110782318A (zh) 基于音频交互的营销方法、装置以及存储介质
CN104462429B (zh) 数据库查询语句的生成方法及装置
CN106649368A (zh) 数据存储方法、装置和数据查询方法、装置
CN103064989B (zh) 网页保存、打开方法及装置
CN108268565A (zh) 基于数据仓库处理用户浏览行为数据的方法及***
CN106933935A (zh) 任务存储方法和装置
CN109284326A (zh) 一种数据库访问方法和装置
US10140347B2 (en) Exposing data to query generating applications using usage profiles
CN107483381A (zh) 关联账户的监控方法及装置
CN106708886A (zh) 站内搜索词的显示方法及装置
CN107967279A (zh) 分布式数据库的数据更新方法及装置
CN109819002B (zh) 数据推送方法和装置、存储介质及电子装置
CN110134698A (zh) 数据管理方法及相关产品
CN109614521A (zh) 一种高效的隐私保护子图查询处理方法
US9098543B2 (en) Attribute detection
CN106708873A (zh) 数据整合方法和装置
CN110472019A (zh) 舆情搜索方法及装置
CN104408188B (zh) 数据处理方法和装置
CN106933896B (zh) 最短访问路径识别方法及装置
CN104463627A (zh) 数据处理方法和装置
CN107040603A (zh) 用于确定应用程序App活跃场景的方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information
CB02 Change of applicant information

Address after: 100083 No. 401, 4th Floor, Haitai Building, 229 North Fourth Ring Road, Haidian District, Beijing

Applicant after: Beijing Guoshuang Technology Co.,Ltd.

Address before: 100086 Cuigong Hotel, 76 Zhichun Road, Shuangyushu District, Haidian District, Beijing

Applicant before: Beijing Guoshuang Technology Co.,Ltd.

GR01 Patent grant
GR01 Patent grant