CN103631910A - 一种分布式数据库多列复合查询的***及方法 - Google Patents

一种分布式数据库多列复合查询的***及方法 Download PDF

Info

Publication number
CN103631910A
CN103631910A CN201310615977.XA CN201310615977A CN103631910A CN 103631910 A CN103631910 A CN 103631910A CN 201310615977 A CN201310615977 A CN 201310615977A CN 103631910 A CN103631910 A CN 103631910A
Authority
CN
China
Prior art keywords
index
query
data
module
result
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201310615977.XA
Other languages
English (en)
Inventor
孙杰
阎星娥
赵万亮
杨昆
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fiberhome Telecommunication Technologies Co Ltd
Original Assignee
Fiberhome Telecommunication Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fiberhome Telecommunication Technologies Co Ltd filed Critical Fiberhome Telecommunication Technologies Co Ltd
Priority to CN201310615977.XA priority Critical patent/CN103631910A/zh
Publication of CN103631910A publication Critical patent/CN103631910A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2455Query execution
    • G06F16/24553Query execution of query operations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2228Indexing structures

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请公开一种分布式数据库多列复合查询的***及方法,由存储子***、索引子***、线性序列生成器、入库模块、查询模块组成。在数据入库建立索引时,为每一条数据记录生成一个单调递增序列值,将索引字段的值和单调递增序列值组合作为索引表的行键;索引扫描时,返回结果按行键顺序排序,执行效率较高,且占用***资源较少;并且,索引键值的查询、索引结果的合并、查找存储子***可以并发执行,大大提高了查询响应的速度。

Description

一种分布式数据库多列复合查询的***及方法
技术领域
本申请属于信息技术领域,尤其涉及一种分布式数据库多列复合查询的***及方法。
背景技术
当前很多行业,每天都在产生大量的数据,随着技术和业务的发展,数据产生的速度不断加快,数据量不断膨胀。对于这种海量数据集,要进行存储并从中快速的查找需要的数据,传统的数据库已经不太适合,于是诞生了各种分布式数据库。
在大规模的数据管理中,影响数据查询速度的关键因素在于需要访问的数据量和磁盘IO。索引技术是数据库实践中提高查询性能的重要方法。
目前常见的分布式数据库***中,针对多列查询,即查询条件中包括多个索引键值的查询,通常有如下几种处理方式:
1.依据各个索引键值分别做索引查询,得到一系列结果集,然后根据各个索引键值之间的逻辑关系,对各结果集取交集或取并集,最终得到一个没有重复的结果集。合并时需要依次查找每个结果集中的每条结果是否存在于其他结果集之中,为提高合并效率,通常又有两种具体实现方式:
a)对各结果集进行排序,对排序后的结果集再做合并;
b)将各结果集的值存入HASH容器中,提高查找速度。
2.从多个索引键值中,选取一个选择性比较高的做索引查询,得到一个结果集,扫描此结果集内的全部数据,使用查询条件中其他未做索引查询的索引键值对这些数据做过滤,得到最终的查询结果集。
比如下面的查询:
select*from user_info where username=‘CC’and sex=‘male’,
单独根据username查找得到的结果数比较少,即username列的选择性比较高,于是只根据username=‘CC’这一条件做查找,遍历其结果集,将其中满足条件sex=‘male’的结果返回给查询用户。
然而,现有技术在多列查询时,存在效率低下、资源占用率较高等问题。
在前述处理方式1(a)中,需要对各个结果集做排序,必须等各索引键值的查询全部结束,才能完成排序,排序完成后才能开始做合并和返回结果。采用这种方式时,如果有一个结果集的数据量很大,即使其余结果集的数据量都很小,也无法很快返回结果,其响应速度受制于最慢的一个子查询。
在前述处理方式1(b)中,需要将各结果集存入HASH类容器,这样会占用较大的内存,当结果集数据量很大时,还会超过***最大负荷。
前述处理方式2,只适用于多个索引键值之间逻辑关系为与的情况,如果多个索引键值之间的逻辑关系为或,则不适用。其次,由于实际运行环境中的业务和数据复杂多变,准确选取可选择性大的索引键值并不容易做到,有时甚至是无法做到,这样单对一个索引键值做查询会得到很多结果,将这些索引结果对应的数据全部从原始数据存储模块中读出来做过滤,会造成大量的磁盘IO,而过大的数据访问量和磁盘IO正是海量数据库的常见性能瓶颈所在。
发明内容
本专利申请要解决的技术问题是:提供一种在分布式数据库多列复合查询的优化方法,解决当前分布式数据库***针对多列查询效率低下、资源占用率较高等问题。
为了解决上述技术问题,本专利申请提供了一种分布式数据库多列复合查询的***及方法。本申请所述***由存储子***、索引子***、线性序列生成器、入库模块、查询模块组成,其中:
存储子***采用分布式文件***,包括分区存储的多个数据块,用于存储完整的原始数据;
索引子***采用分布式列存储数据库,用于存储数据的索引;
线性序列生成器在数据入库前为每一条数据记录生成一个单调递增的序列值;
入库模块负责将原始数据写入存储子***,并在索引子***中建立对应的索引;
查询模块又分为查询解析模块、索引查询模块、原始数据扫描模块等儿个子模块,查询模块负责处理用户的查询请求,返回查询结果。
在数据入库建立索引时,为每一条数据记录生成一个单调递增序列值,将索引字段的值和单调递增序列值组合作为索引表的行键。索引扫描时,返回结果按行键顺序排序。这样,在根据某一个指定的索引键值做查询时,得到的结果是按其序列值排序的。因而,对多个索引键值的查询结果做合并,是对多个有序队列做归并,其执行效率较高且资源占用率较低,有助于提高***的查询响应速度和可支持的并发数。
数据查询时,查询模块中的查询解析模块将查询语句分解为多个查询子条件,每个查询子条件为一个索引键值,由此索引键值可以得到一系列包含该索引键值的数据记录,以及这些数据记录的存储位置,组成一个结果集。查询模块将这些结果集合并成一个。合并操作时,可以用记录的单调递增序列值或者存储位置作为区分是否为不同记录的依据。根据合并得到的结果集,查找存储子***,将得到的原始数据记录内容返回给查询客户端。
本申请的有益后果是:
1、由于每个子结果集都是按照统一的单调递增序列排序的,所以本专利申请所述的分布式数据库多列复合查询的方法合并操作执行速度比较快;
2、各索引键值的查询返回部分结果时,就可以开始对这些结果做合并,不必等各索引键值的查询结束再做合并;
3、与此同时,根据合并的结果集查找存储子***也不必等待合并全部完成,这样,索引键值的查询、索引结果的合并、查找存储子***可以并发执行,大大提高了查询响应速度。
4、由于进行列式存储,访问所需要的IO量局限在所需要的字段,极大地降低了IO访问要求。
经过测算和模拟,如此数据访问优化、流程优化和结果集计算预启动后,IO请求平均减少一半,能提高响应速度一倍以上;如果设立了返回数量上限,响应速度可以提高十倍多。
附图说明
附图1为***架构图
附图2为数据入库流程图
附图3为实施例1的索引表示意图
附图4为数据查询流程图
具体实施方式
本专利申请所述的一种分布式数据库多列复合查询的***由索引子***、线性序列生成器、入库模块、查询模块组成。其***架构图如附图1所示。其中,查询模块包括查询解析模块,索引查询模块,原始数据扫描模块。
数据入库流程如附图2所示,数据入库前,为每一条数据记录生成一个序列值。该序列值由线性序列生成器生成,是一个单调递增序列。较佳的,如果原始记录中已经存在这样一个字段,其值满足单调递增条件且都不为空,线性序列生成器可以直接使用该字段的值作为序列值。
数据入库时,首先将原始数据存入原始数据存储子***,得到数据存储位置,再对该条数据记录建立索引。
一张原始数据表里可以对多个字段分别建立索引。建立索引时,将原始数据中需要用做查询条件的字段作为索引字段,每一个索引字段在索引子***中对应一张索引表。每条索引包括行键和行值两个部分,行键由索引字段的值和该数据记录的单调递增序列值两部分组成;行值为数据记录在存储子***中的存储位置,所述数据存储位置包括数据记录所在数据块的位置以及数据记录在数据块内的偏移量,因此根据此存储位置可以直接定位到数据记录。
索引扫描时,返回的结果是按行键排序的,因此以某一指定索引键值做查询时,得到的结果是按序列值排序的。
实施例1:有一张用户交易记录表(ExchangeInfo),每一条用户交易信息中包括用户标识字段(UserName),商品类别字段(Category),交易价格字段(Price),此外为每条记录生成一个序列值(Sequence),交易记录表详细数据如下表所示:
表1用户交易信息表
Sequence UserName Category Price
1 张三 百货 100
2 李四 数码 1000
3 李四 百货 200
4 王五 百货 300
以用户标识和商品类别为索引字段,则索引子***中对应两张索引表,用户标识索引表和商品类别索引表,如附图3所示,索引表中包括两列,行键(RowKey)、行值(即数据记录存储位置(RecordLocation))。
数据查询流程如附图4所示。查询解析模块将查询语句分解为多个查询子条件,每个查询子条件为一个索引键值,由此索引键值可以得到一系列包含该索引键值的数据记录,以及这些数据记录的存储位置,组成一个结果集。查询模块将这些结果集合并成一个。
当查询子条件之间的逻辑关系为“与”时,对各查询子条件的结果集取交集;如果有一个查询子条件已经查询结束且其查询结果都已完成归并,或者查询结果数量达到设定的返回结果数量上限,则终止其他查询子条件的查询和结果集合并操作;
当查询子条件之间的逻辑关系为“或”时,对各查询子条件的结果集取并集。此时如果只剩一路结果没有归并结束,则其余结果可以直接放入合并后的结果集。
以上实施方案的说明只适用于帮助理解本专利申请的原理,同时对本领域的一般技术人员,依据本专利申请实施例,在具体实施方式以及应用范围上均会有改变之处,因此本说明书内容不应理解为对本专利申请的限制。

Claims (6)

1.一种分布式数据库多列复合查询的***,其特征在于:由存储子***、索引子***、线性序列生成器、入库模块、查询模块组成。
2.如权利要求1所述的一种分布式数据库多列复合查询的***,其特征在于:存储子***采用分布式文件***,索引子***采用分布式列存储数据库,查询模块包括查询解析模块、索引查询模块和原始数据扫描模块。
3.一种分布式数据库多列复合查询的方法,其特征在于:在数据入库建立索引时,为每一条数据记录生成一个单调递增序列值,将索引字段的值和单调递增序列值组合作为索引表的行键;索引扫描时,返回结果按行键顺序排序。
4.如权利要求3所述的一种分布式数据库多列复合查询的方法,其特征在于:如果原始记录中已经存在一个字段的值满足单调递增条件且都不为空,则可以直接使用该字段的值做为序列值。
5.如权利要求3所述的一种分布式数据库多列复合查询的方法,其特征在于:数据查询时,查询模块中的查询解析模块将查询语句分解为多个查询子条件,每个查询子条件为一个索引键值,由此索引键值可以得到一系列包含该索引键值的数据记录,以及这些数据记录的存储位置,组成一个结果集;查询模块将这些结果集合并成一个,根据合并得到的结果集查找存储子***,然后将得到的原始数据记录内容返回给查询客户端。
6.如权利要求3所述的一种分布式数据库多列复合查询的方法,其特征在于:
当查询子条件之间的逻辑关系为“与”时,对各查询子条件的结果集取交集;如果有一个查询子条件已经查询结束且其查询结果都已完成归并,或者查询结果数量达到设定的返回结果数量上限,则终止其他查询子条件的查询和结果集合并操作;
当查询子条件之间的逻辑关系为“或”时,对各查询子条件的结果集取并集;如果只剩一路结果没有归并结束,则其余结果直接放入合并后的结果集。
CN201310615977.XA 2013-11-26 2013-11-26 一种分布式数据库多列复合查询的***及方法 Pending CN103631910A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310615977.XA CN103631910A (zh) 2013-11-26 2013-11-26 一种分布式数据库多列复合查询的***及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310615977.XA CN103631910A (zh) 2013-11-26 2013-11-26 一种分布式数据库多列复合查询的***及方法

Publications (1)

Publication Number Publication Date
CN103631910A true CN103631910A (zh) 2014-03-12

Family

ID=50212951

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310615977.XA Pending CN103631910A (zh) 2013-11-26 2013-11-26 一种分布式数据库多列复合查询的***及方法

Country Status (1)

Country Link
CN (1) CN103631910A (zh)

Cited By (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104462291A (zh) * 2014-11-27 2015-03-25 杭州华为数字技术有限公司 一种数据处理的方法及装置
CN104462206A (zh) * 2014-10-31 2015-03-25 国云科技股份有限公司 一种通用的数据库序列生成方法
CN105574093A (zh) * 2015-12-10 2016-05-11 深圳市华讯方舟软件技术有限公司 一种在基于HDFS的spark-sql大数据处理***上建立索引的方法
CN105589915A (zh) * 2014-11-06 2016-05-18 郑毓融 透过运算索引值与混合式层式快取的数据库加速方法
CN105740373A (zh) * 2016-01-27 2016-07-06 国网上海市电力公司 基于分布式内存的虚拟现实平台数据查询方法
CN105930407A (zh) * 2016-04-18 2016-09-07 北京思特奇信息技术股份有限公司 一种分布式数据库跨库关联查询方法及***
WO2016180123A1 (zh) * 2015-09-25 2016-11-17 中兴通讯股份有限公司 HBase二级索引创建方法和装置
CN106250409A (zh) * 2016-07-21 2016-12-21 中国农业银行股份有限公司 数据查询方法及装置
CN106445968A (zh) * 2015-08-11 2017-02-22 阿里巴巴集团控股有限公司 一种数据合并方法及装置
CN106802900A (zh) * 2015-11-26 2017-06-06 北京国双科技有限公司 基于星形数据库的检索方法及装置
CN106845263A (zh) * 2015-12-04 2017-06-13 阿里巴巴集团控股有限公司 一种访问数据库的方法、装置及电子设备
CN106844539A (zh) * 2016-12-30 2017-06-13 曙光信息产业(北京)有限公司 实时数据分析方法及***
CN106933206A (zh) * 2015-10-09 2017-07-07 费希尔-罗斯蒙特***公司 分布式工业***中的独立于源的查询
CN108170726A (zh) * 2015-10-21 2018-06-15 华为技术有限公司 数据查询方法和装置
CN108959457A (zh) * 2018-06-15 2018-12-07 北京文创园投资管理有限公司 一种证书的查询、验证方法和***
CN109271409A (zh) * 2018-11-08 2019-01-25 成都索贝数码科技股份有限公司 一种基于容器资源分配的数据库分片执行方法
CN109471863A (zh) * 2018-11-12 2019-03-15 北京懿医云科技有限公司 基于分布式数据库的信息查询方法及装置、电子设备
CN110019218A (zh) * 2017-12-08 2019-07-16 阿里巴巴集团控股有限公司 数据存储与查询方法及设备
CN112104743A (zh) * 2020-09-21 2020-12-18 北京金山云网络技术有限公司 序列生成方法、装置和电子设备
CN112416925A (zh) * 2020-11-02 2021-02-26 浙商银行股份有限公司 基于有序分布式索引结构的查询方法和分布式数据库***
CN112445873A (zh) * 2020-12-02 2021-03-05 深圳市镜玩科技有限公司 列表显示处理方法、相关装置、设备及介质
CN110019212B (zh) * 2017-11-29 2021-06-18 杭州海康威视数字技术股份有限公司 一种数据处理方法、装置及数据库服务器
CN113032400A (zh) * 2021-03-31 2021-06-25 上海天旦网络科技发展有限公司 海量数据的高性能TopN查询方法、***及介质
CN113268502A (zh) * 2020-12-23 2021-08-17 上海右云信息技术有限公司 一种用于提供信息的方法与设备

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101751406A (zh) * 2008-12-18 2010-06-23 赵伟 一种实现基于列存储的关系型数据库的方法及装置
CN102375853A (zh) * 2010-08-24 2012-03-14 ***通信集团公司 分布式数据库***、在其中建立索引的方法和查询方法
CN102521406A (zh) * 2011-12-26 2012-06-27 中国科学院计算技术研究所 海量结构化数据复杂查询任务的分布式查询方法和***
CN102591970A (zh) * 2011-12-31 2012-07-18 北京奇虎科技有限公司 一种分布式键-值查询方法和查询引擎***

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101751406A (zh) * 2008-12-18 2010-06-23 赵伟 一种实现基于列存储的关系型数据库的方法及装置
CN102375853A (zh) * 2010-08-24 2012-03-14 ***通信集团公司 分布式数据库***、在其中建立索引的方法和查询方法
CN102521406A (zh) * 2011-12-26 2012-06-27 中国科学院计算技术研究所 海量结构化数据复杂查询任务的分布式查询方法和***
CN102591970A (zh) * 2011-12-31 2012-07-18 北京奇虎科技有限公司 一种分布式键-值查询方法和查询引擎***

Cited By (37)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104462206A (zh) * 2014-10-31 2015-03-25 国云科技股份有限公司 一种通用的数据库序列生成方法
CN105589915A (zh) * 2014-11-06 2016-05-18 郑毓融 透过运算索引值与混合式层式快取的数据库加速方法
CN104462291A (zh) * 2014-11-27 2015-03-25 杭州华为数字技术有限公司 一种数据处理的方法及装置
CN104462291B (zh) * 2014-11-27 2018-01-09 杭州华为数字技术有限公司 一种数据处理的方法及装置
CN106445968A (zh) * 2015-08-11 2017-02-22 阿里巴巴集团控股有限公司 一种数据合并方法及装置
WO2016180123A1 (zh) * 2015-09-25 2016-11-17 中兴通讯股份有限公司 HBase二级索引创建方法和装置
CN106933206A (zh) * 2015-10-09 2017-07-07 费希尔-罗斯蒙特***公司 分布式工业***中的独立于源的查询
CN106933206B (zh) * 2015-10-09 2021-07-06 费希尔-罗斯蒙特***公司 分布式工业***中的独立于源的查询
CN108170726A (zh) * 2015-10-21 2018-06-15 华为技术有限公司 数据查询方法和装置
CN106802900A (zh) * 2015-11-26 2017-06-06 北京国双科技有限公司 基于星形数据库的检索方法及装置
CN106845263A (zh) * 2015-12-04 2017-06-13 阿里巴巴集团控股有限公司 一种访问数据库的方法、装置及电子设备
WO2017096939A1 (zh) * 2015-12-10 2017-06-15 深圳市华讯方舟软件技术有限公司 一种在基于HDFS的spark-sql大数据处理***上建立索引的方法
CN105574093B (zh) * 2015-12-10 2019-09-10 深圳市华讯方舟软件技术有限公司 一种在基于HDFS的spark-sql大数据处理***上建立索引的方法
CN105574093A (zh) * 2015-12-10 2016-05-11 深圳市华讯方舟软件技术有限公司 一种在基于HDFS的spark-sql大数据处理***上建立索引的方法
CN105740373A (zh) * 2016-01-27 2016-07-06 国网上海市电力公司 基于分布式内存的虚拟现实平台数据查询方法
CN105740373B (zh) * 2016-01-27 2019-11-08 国网上海市电力公司 基于分布式内存的虚拟现实平台数据查询方法
CN105930407A (zh) * 2016-04-18 2016-09-07 北京思特奇信息技术股份有限公司 一种分布式数据库跨库关联查询方法及***
CN105930407B (zh) * 2016-04-18 2019-05-17 北京思特奇信息技术股份有限公司 一种分布式数据库跨库关联查询方法及***
CN106250409A (zh) * 2016-07-21 2016-12-21 中国农业银行股份有限公司 数据查询方法及装置
CN106844539A (zh) * 2016-12-30 2017-06-13 曙光信息产业(北京)有限公司 实时数据分析方法及***
CN110019212B (zh) * 2017-11-29 2021-06-18 杭州海康威视数字技术股份有限公司 一种数据处理方法、装置及数据库服务器
CN110019218A (zh) * 2017-12-08 2019-07-16 阿里巴巴集团控股有限公司 数据存储与查询方法及设备
CN110019218B (zh) * 2017-12-08 2023-08-25 阿里巴巴集团控股有限公司 数据存储与查询方法及设备
CN108959457B (zh) * 2018-06-15 2020-11-13 北京文创园投资管理有限公司 一种证书的查询、验证方法和***
CN108959457A (zh) * 2018-06-15 2018-12-07 北京文创园投资管理有限公司 一种证书的查询、验证方法和***
CN109271409B (zh) * 2018-11-08 2021-11-02 成都索贝数码科技股份有限公司 一种基于容器资源分配的数据库分片执行方法
CN109271409A (zh) * 2018-11-08 2019-01-25 成都索贝数码科技股份有限公司 一种基于容器资源分配的数据库分片执行方法
CN109471863A (zh) * 2018-11-12 2019-03-15 北京懿医云科技有限公司 基于分布式数据库的信息查询方法及装置、电子设备
CN112104743A (zh) * 2020-09-21 2020-12-18 北京金山云网络技术有限公司 序列生成方法、装置和电子设备
CN112104743B (zh) * 2020-09-21 2022-08-16 北京金山云网络技术有限公司 序列生成方法、装置和电子设备
CN112416925A (zh) * 2020-11-02 2021-02-26 浙商银行股份有限公司 基于有序分布式索引结构的查询方法和分布式数据库***
CN112416925B (zh) * 2020-11-02 2024-04-09 浙商银行股份有限公司 基于有序分布式索引结构的查询方法和分布式数据库***
CN112445873A (zh) * 2020-12-02 2021-03-05 深圳市镜玩科技有限公司 列表显示处理方法、相关装置、设备及介质
CN112445873B (zh) * 2020-12-02 2024-03-26 深圳市镜玩科技有限公司 列表显示处理方法、相关装置、设备及介质
CN113268502A (zh) * 2020-12-23 2021-08-17 上海右云信息技术有限公司 一种用于提供信息的方法与设备
CN113032400A (zh) * 2021-03-31 2021-06-25 上海天旦网络科技发展有限公司 海量数据的高性能TopN查询方法、***及介质
CN113032400B (zh) * 2021-03-31 2022-11-08 上海天旦网络科技发展有限公司 海量数据的高性能TopN查询方法、***及介质

Similar Documents

Publication Publication Date Title
CN103631910A (zh) 一种分布式数据库多列复合查询的***及方法
CN102270232B (zh) 一种存储优化的语义数据查询***
US20120047158A1 (en) Method and system for performing query optimization using a hybrid execution plan
US20050165733A1 (en) System and method for an in-memory roll up-on-the-fly OLAP engine with a relational backing store
Zou et al. Pareto-based dominant graph: An efficient indexing structure to answer top-k queries
He et al. Efficient iceberg query evaluation using compressed bitmap index
CN105637506B (zh) 用于优化数据存储上的查询执行的方法
CN107491487A (zh) 一种全文数据库架构及位图索引创建、数据查询方法、服务器及介质
CN102201001A (zh) 基于倒排技术的快速检索方法
CN103970902A (zh) 一种大量数据情况下的可靠即时检索方法及***
CN102222099A (zh) 一种数据存储、查找方法及装置
Giannakouris et al. MuSQLE: Distributed SQL query execution over multiple engine environments
CN102456055A (zh) 兴趣点检索的方法及装置
CN102495834A (zh) 基于内存映像的增量数据清洗方法
CN108268612B (zh) 一种基于olap预计算模型的预校验方法及预校验***
CN101963993B (zh) 一种数据库单表记录快速查找的方法
CN114064660B (zh) 基于ElasticSearch的数据结构化分析方法
CN102402540A (zh) 基于多层优化平衡树的数值与文本混合倒排索引算法
CN109299143A (zh) 基于Redis缓存的数据互操作测试知识库的知识快速索引方法
JP2001216307A (ja) リレーショナルデータベース管理システム及びそれを記憶した記憶媒体
Zhang et al. Improving performance by creating a native join-index for OLAP
Ni et al. An Efficient Method for Improving Query Efficiency in Data Warehouse.
CN110688386A (zh) 面向新型供电轨道交通大数据的分布式列族数据索引方法
Chao et al. A performance study on large-scale data analytics using disk-based and in-memory database systems
Sangat et al. Atrie group join: A parallel star group join and aggregation for in-memory column-stores

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20140312