CN105117417A - 一种读优化的内存数据库Trie树索引方法 - Google Patents

一种读优化的内存数据库Trie树索引方法 Download PDF

Info

Publication number
CN105117417A
CN105117417A CN201510459589.6A CN201510459589A CN105117417A CN 105117417 A CN105117417 A CN 105117417A CN 201510459589 A CN201510459589 A CN 201510459589A CN 105117417 A CN105117417 A CN 105117417A
Authority
CN
China
Prior art keywords
node
value
data
pointer
character
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201510459589.6A
Other languages
English (en)
Other versions
CN105117417B (zh
Inventor
段章峰
伍卫国
崔金华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xian Jiaotong University
Original Assignee
Xian Jiaotong University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xian Jiaotong University filed Critical Xian Jiaotong University
Priority to CN201510459589.6A priority Critical patent/CN105117417B/zh
Publication of CN105117417A publication Critical patent/CN105117417A/zh
Application granted granted Critical
Publication of CN105117417B publication Critical patent/CN105117417B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/901Indexing; Data structures therefor; Storage structures
    • G06F16/9027Trees

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

一种读优化的内存数据库Trie树索引方法,对于字符型数据,提供了O(1)的写入和查询时间复杂度,优化后的Trie树结构通过动态的分配前缀节点,减少了索引结构所占用的内存空间,通过使用节点内部的排序链表,完成范围查询操作,对list和set数据类型的支持扩展了数据库的数据格式,使数据库能有效的应对多种应用场景,面对字符数据写回可持久化存储时数据量大的问题,优化后的Trie树索引结构利用字符串间的共享前缀特点,对写回可持久化设备的数据进行压缩,在节省存储空间的同时,也加快了数据写回的速度。

Description

一种读优化的内存数据库Trie树索引方法
技术领域
本发明属于计算机技术领域,具体涉及一种读优化的内存数据库Trie树索引方法。
背景技术
在数据库应用中,可以通过对数据建立索引加快数据的访问速度,索引是一个或多个列(例如,employee表的姓氏(lname)列)的值进行排序的结构。如果想按特定职员的姓来查找,则与在表中搜索所有的行相比,索引有助于更快地获取信息。常见的磁盘数据库索引有B树索引,B+树索引,它们的使用可以显著的减少磁盘I/O数。随着内存价格的降低,内存数据库技术得到了广泛的应用。不同于磁盘数据库***,内存数据库***在数据访问时显著的减少或消除了磁盘I/O,提高了数据访问的速度,原来的数据库索引方法,如B树索引,由于其节点中存在着大量的指针结构,内存的空间利用率不高,而且由于节点内部存储的关键字个数少,导致Cache命中率不高,降低了内存数据库的数据访问效率。并且当数据库针对字符类型数据进行操作时有如下特点:
1)对于字符串类型的数据,不能直接利用“>”和“<”等比较操作符进行大小比较,而需要调用strcmp函数,这相比于int类型的比较来说,增加了时间消耗。
2)共享前缀信息,在存储如URL或者数据库中的关键日志信息时,key与key之间具有共享相同字符前缀的特点,例如:key为“201401055656”和key为“201401056565”的数据,共享的前缀为“20140105”。
3)原始数据的存储量大,如果针对原始的字符串类型数据进行简单的存储,那么数据量相比于其他结构化类型将增加很多,所以,在以字符串为key类型的***上,当需要将数据持久化到硬盘等存储设备上时,有必要进行数据压缩,以减少和磁盘交互的数据量,但是,采用数据压缩算法后,在数据的压缩和解压缩过程中,会增加CPU的计算开销,影响数据库性能。
传统的Trie树是一种针对字符数据存储的查找结构,它提供了常数级的数据访问时间复杂度。在对待查找数据进行查找时,只需要从Trie树根节点开始,和字符串同步遍历一遍就可以得到操作结构,中间没有比较操作。是一种高效的针对字符数据的索引结构。但是,Trie树的节点内部,子节点指针静态分配,在针对所有可打印字符的数据的查找时,其子节点指针包括了所有ASCII字符中的可打印字符。但是,在应用中,待查找数据中存在着热点字符,即有的字符不会出现,静态的分配子节点空间,会造成内存空间的浪费。针对这些问题,需要通过优化索引结构的空间利用率和数据访问时间复杂度来提高数据的访问效率,提高内存数据库性能。
发明内容
为了克服上述现有技术的缺点,本发明的目的在于提供一种读优化的内存数据库Trie树索引方法,针对字符型数据,提高数据的Cache命中率,减少写回磁盘的数据量,提高数据写回效率。
为了达到上述目的,本发明所采用的技术方案是:
一种读优化的内存数据库Trie树索引方法,包括以下步骤:
第1步,构造基本的数据结构:
向优化的Trie树结构中写入数据,其过程如下:
1.1)如果根节点为空,则分配根节点空间,并进行初始化;
1.2)根据当前字符指针所指字符,在索引结构当前节点内部的哈希表中查找相应的子节点指针是否为空,如果为空,参照步骤1.1),分配节点空间,并且按照字符的大小顺序,***到节点内部的排序链表中,保证数据有序;如果不为空,则跳转到步骤1.3);
1.3)索引结构指针指向相应的子节点指针,字符指针顺序后移,直到字符串结尾;判断节点内部的value域是否为空,如果为空,则直接进行拷贝操作,将新的value值拷贝进节点内部;如果不为空,那么判断新的value值所需空间是否大于当前节点内部的value值空间,如果大于,则重新申请空间;如果小于,则直接进行拷贝操作,并更新节点内部相应字段的值;
第2步,在已经建立好的优化的Trie树中进行数据查询操作:
查询操作分为单值查询和范围查询两种,单值查询操作的步骤如下:
2.1)如果根节点为空,则直接返回,否则,进行步骤2.2);
2.2)根据当前字符指针所指字符,计算其哈希值,在哈希表中查找对应的子节点指针,如果哈希表中没有找到,则需要在哈希链表中进一步查找,如果找到,则将哈希表中子节点指针值赋给当前索引结构指针,进行步骤2.3);如果没有找到,则返回,表示没有查找到key对应的value;
2.3)字符指针顺序后移,直到字符串结尾,返回索引结构指针所指节点内的value值,即为key对应的value值;
范围查询的步骤如下:
2.1’)采用逐级递归的方法,确定存储范围查询中左值的节点;
2.2’)采用逐级递归的方法,确定存储范围查询中右值的节点;
2.3’)对于位于左值和右值区间内部的节点,采用直接递归的方法来确定查询结果;对于区间的边界,根据应用的需要确定最终的结果。
所述的优化的Trie树索引中的前缀压缩方法步骤如下:
1)从根节点开始对索引结构进行递归遍历,每访问一个索引结构节点,其内部排序链表中存储的子节点指针所指节点即共享相同前缀;
2)计算出每一个节点的共享前缀,向磁盘中写入共享前缀部分,遍历排序链表,针对排序链表中的每一个节点,只需要写入key的非共享部分;
3)value值不进行压缩操作,写入原始的value值。
本发明的有益效果是:
本发明提出了一种优化的Trie树索引方法,方法时间复杂度降到了O(c),优于传统的B树结构,T树结构的O(Logm)时间复杂度。方法利用字符数据的共享前缀特点,提高Cache命中率,减少了数据访问延迟。针对原始Trie树内存空间利用率不高的问题,通过动态的分配子节点指针空间,减少索引结构内存空间使用量,这样可以将更多的key-value数据存储在内存中,提高内存数据库性能。
附图说明
附图是本发明优化的Trie树示意图。
具体实施方式
下面结合附图对本发明做详细描述。
参照附图,一种读优化的内存数据库Trie树索引方法,包括以下步骤:
第1步,构造基本的数据结构:
向优化的Trie树结构中写入数据,其过程如下:
1.1)如果根节点为空,则分配根节点空间,并进行初始化;
1.2)根据当前字符指针所指字符,在索引结构当前节点内部的哈希表L0中查找相应的子节点指针是否为空,如果为空,参照步骤1.1),分配节点空间,并且按照字符的大小顺序,***到节点内部的排序链表L1中,保证数据有序;如果不为空,则跳转到步骤1.3);
1.3)索引结构指针指向相应的子节点指针,字符指针顺序后移,直到字符串结尾;判断节点内部的value域是否为空,如果为空,则直接进行拷贝操作,将新的value值拷贝进节点内部;如果不为空,那么判断新的value值所需空间是否大于当前节点内部的value值空间,如果大于,则重新申请空间;如果小于,则直接进行拷贝操作,并更新节点内部相应字段的值;
第2步,在已经建立好的优化的Trie树中进行数据查询操作:
查询操作分为单值查询和范围查询两种,单值查询操作的步骤如下:
2.1)如果根节点为空,则直接返回,否则,进行步骤2.2);
2.2)根据当前字符指针所指字符,计算其哈希值,在哈希表L0中查找对应的子节点指针,如果哈希表L0中没有找到,则需要在哈希链表中进一步查找,如果找到,则将哈希表L0中子节点指针值赋给当前索引结构指针,进行步骤2.3);如果没有找到,则返回,表示没有查找到key对应的value;
2.3)字符指针顺序后移,直到字符串结尾,返回索引结构指针所指节点内的value值,即为key对应的value值;
范围查询的步骤如下:
2.1’)采用逐级递归的方法,确定存储范围查询中左值的节点;
2.2’)采用逐级递归的方法,确定存储范围查询中右值的节点;
2.3’)对于位于左值和右值区间内部的节点,采用直接递归的方法来确定查询结果;对于区间的边界,根据应用的需要,例如,闭区间,半开半闭区间等,确定最终的结果。
所述的优化的Trie树索引中的前缀压缩方法步骤如下:
1)从根节点开始对索引结构进行递归遍历,每访问一个索引结构节点,其内部排序链表L1中存储的子节点指针所指节点即共享相同前缀;
2)计算出每一个节点的共享前缀,向磁盘中写入共享前缀部分,遍历排序链表L1,针对排序链表L1中的每一个节点,只需要写入key的非共享部分;
3)value值不进行压缩操作,写入原始的value值。
为了满足多种应用的需求,在数据库基本操作的基础上,本发明中的索引结构扩展了存储的数据格式,包括list类型和set类型。其中list类型表示列表类型,支持基本的数据写入和查询,其中***分为从列表头***、列表尾***和指定位置***。set表示集合类型,支持的操作有基本的查询和集合数据的写入操作,其中主要为两个集合的交并运算。通过对数据库中可操作数据类型的扩展,满足了多种应用场景的需求。

Claims (2)

1.一种读优化的内存数据库Trie树索引方法,其特征在于,包括以下步骤:
第1步,构造基本的数据结构:
向优化的Trie树结构中写入数据,其过程如下:
1.1)如果根节点为空,则分配根节点空间,并进行初始化;
1.2)根据当前字符指针所指字符,在索引结构当前节点内部的哈希表中查找相应的子节点指针是否为空,如果为空,参照步骤1.1),分配节点空间,并且按照字符的大小顺序,***到节点内部的排序链表中,保证数据有序;如果不为空,则跳转到步骤1.3);
1.3)索引结构指针指向相应的子节点指针,字符指针顺序后移,直到字符串结尾;判断节点内部的value域是否为空,如果为空,则直接进行拷贝操作,将新的value值拷贝进节点内部;如果不为空,那么判断新的value值所需空间是否大于当前节点内部的value值空间,如果大于,则重新申请空间;如果小于,则直接进行拷贝操作,并更新节点内部相应字段的值;
第2步,在已经建立好的优化的Trie树中进行数据查询操作:
查询操作分为单值查询和范围查询两种,单值查询操作的步骤如下:
2.1)如果根节点为空,则直接返回,否则,进行步骤2.2);
2.2)根据当前字符指针所指字符,计算其哈希值,在哈希表中查找对应的子节点指针,如果哈希表中没有找到,则需要在哈希链表中进一步查找,如果找到,则将哈希表中子节点指针值赋给当前索引结构指针,进行步骤2.3);如果没有找到,则返回,表示没有查找到key对应的value;
2.3)字符指针顺序后移,直到字符串结尾,返回索引结构指针所指节点内的value值,即为key对应的value值;
范围查询的步骤如下:
2.1’)采用逐级递归的方法,确定存储范围查询中左值的节点;
2.2’)采用逐级递归的方法,确定存储范围查询中右值的节点;
2.3’)对于位于左值和右值区间内部的节点,采用直接递归的方法来确定查询结果;对于区间的边界,根据应用的需要确定最终的结果。
2.根据权利要求1所述的一种读优化的内存数据库Trie树索引方法,其特征在于:所述的优化的Trie树索引中的前缀压缩方法步骤如下:
1)从根节点开始对索引结构进行递归遍历,每访问一个索引结构节点,其内部排序链表中存储的子节点指针所指节点即共享相同前缀;
2)计算出每一个节点的共享前缀,向磁盘中写入共享前缀部分,遍历排序链表,针对排序链表中的每一个节点,只需要写入key的非共享部分;
3)value值不进行压缩操作,写入原始的value值。
CN201510459589.6A 2015-07-30 2015-07-30 一种读优化的内存数据库Trie树索引方法 Active CN105117417B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510459589.6A CN105117417B (zh) 2015-07-30 2015-07-30 一种读优化的内存数据库Trie树索引方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510459589.6A CN105117417B (zh) 2015-07-30 2015-07-30 一种读优化的内存数据库Trie树索引方法

Publications (2)

Publication Number Publication Date
CN105117417A true CN105117417A (zh) 2015-12-02
CN105117417B CN105117417B (zh) 2018-04-17

Family

ID=54665407

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510459589.6A Active CN105117417B (zh) 2015-07-30 2015-07-30 一种读优化的内存数据库Trie树索引方法

Country Status (1)

Country Link
CN (1) CN105117417B (zh)

Cited By (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106874348A (zh) * 2016-12-26 2017-06-20 贵州白山云科技有限公司 文件存储和索引方法、装置及读取文件的方法
CN107862026A (zh) * 2017-10-31 2018-03-30 北京小度信息科技有限公司 数据存储方法及装置、数据查询方法及装置、电子设备
CN108846013A (zh) * 2018-05-04 2018-11-20 昆明理工大学 一种基于geohash与Patricia Trie的空间关键词查询方法及装置
CN108874880A (zh) * 2018-05-04 2018-11-23 昆明理工大学 一种基于Trie的空间关键词查询方法及装置
CN109740249A (zh) * 2018-12-29 2019-05-10 西安智多晶微电子有限公司 一种mux树逻辑结构优化方法、模块及存储介质
CN110020001A (zh) * 2017-12-29 2019-07-16 阿里巴巴集团控股有限公司 字符串数据的存储、查询方法以及相应的设备
CN110109914A (zh) * 2018-01-16 2019-08-09 恒为科技(上海)股份有限公司 一种应用驱动的数据存储与索引方法
CN110222238A (zh) * 2019-04-30 2019-09-10 上海交通大学 字符串与识别符双向映射的查询方法和***
CN110347685A (zh) * 2019-06-28 2019-10-18 华中科技大学 基于字典树的索引结构、数据查询优化方法、主存管理器
CN110489516A (zh) * 2019-08-15 2019-11-22 厦门铅笔头信息科技有限公司 一种快速为海量结构化数据建立前缀索引的方法
CN110825733A (zh) * 2019-10-08 2020-02-21 华中科技大学 一种面向多采样流的时间序列数据管理方法及***
CN111159329A (zh) * 2019-12-24 2020-05-15 深圳市优必选科技股份有限公司 敏感词检测方法、装置、终端设备和计算机可读存储介质
CN111316255A (zh) * 2017-11-20 2020-06-19 华为技术有限公司 数据存储***以及用于提供数据存储***的方法
CN111373389A (zh) * 2017-11-20 2020-07-03 华为技术有限公司 数据存储***以及用于提供数据存储***的方法
CN113626432A (zh) * 2021-08-03 2021-11-09 浪潮云信息技术股份公司 一种支持任意Key值的自适应基数树的改进方法
CN113672586A (zh) * 2020-05-15 2021-11-19 永中软件股份有限公司 基于Java技术的内存数据库及其实现方法
CN114758727A (zh) * 2022-04-26 2022-07-15 安徽农业大学 基于携带缓存Trie树加速生物基因的检索方法
CN117194440A (zh) * 2023-11-08 2023-12-08 本原数据(北京)信息技术有限公司 数据库索引压缩方法、装置、电子设备及存储介质
CN118035360A (zh) * 2024-04-12 2024-05-14 山东浪潮数字商业科技有限公司 一种增量数据识别、定位、更新方法

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109299100B (zh) * 2018-10-12 2019-08-30 第四范式(北京)技术有限公司 管理内存数据及在内存中维护数据的方法和***

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020059185A1 (en) * 2000-10-14 2002-05-16 Lg Electronics Inc. Method of managing index data in main memory database
CN1838124A (zh) * 2006-02-20 2006-09-27 南京联创科技股份有限公司 海量数据内存数据库中快速定位的网格+t树索引的方法
CN103902693A (zh) * 2014-03-28 2014-07-02 西安交通大学 一种读优化的内存数据库t树索引结构的方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020059185A1 (en) * 2000-10-14 2002-05-16 Lg Electronics Inc. Method of managing index data in main memory database
CN1838124A (zh) * 2006-02-20 2006-09-27 南京联创科技股份有限公司 海量数据内存数据库中快速定位的网格+t树索引的方法
CN103902693A (zh) * 2014-03-28 2014-07-02 西安交通大学 一种读优化的内存数据库t树索引结构的方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
QIU XIU-QIN ET AL: "Research about the index mechanism base on embedded database system", 《INFORMATION TECHNOLOGY AND ARTIFICIAL INTELLIGENCE CONFERENCE (ITAIC), 2011 6TH IEEE JOINT INTERNATIONAL》 *
吕鹏 等: "一种T-树的优化设计与实现方法", 《计算机工程》 *
王平 等: "一种优化的T-tree索引算法", 《计算机应用与软件》 *

Cited By (31)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106874348A (zh) * 2016-12-26 2017-06-20 贵州白山云科技有限公司 文件存储和索引方法、装置及读取文件的方法
CN106874348B (zh) * 2016-12-26 2020-06-16 贵州白山云科技股份有限公司 文件存储和索引方法、装置及读取文件的方法
CN107862026A (zh) * 2017-10-31 2018-03-30 北京小度信息科技有限公司 数据存储方法及装置、数据查询方法及装置、电子设备
CN107862026B (zh) * 2017-10-31 2021-01-01 北京小度信息科技有限公司 数据存储方法及装置、数据查询方法及装置、电子设备
CN111373389B (zh) * 2017-11-20 2023-11-17 华为技术有限公司 数据存储***以及用于提供数据存储***的方法
CN111316255B (zh) * 2017-11-20 2023-11-03 华为技术有限公司 数据存储***以及用于提供数据存储***的方法
CN111316255A (zh) * 2017-11-20 2020-06-19 华为技术有限公司 数据存储***以及用于提供数据存储***的方法
CN111373389A (zh) * 2017-11-20 2020-07-03 华为技术有限公司 数据存储***以及用于提供数据存储***的方法
CN110020001A (zh) * 2017-12-29 2019-07-16 阿里巴巴集团控股有限公司 字符串数据的存储、查询方法以及相应的设备
CN110109914A (zh) * 2018-01-16 2019-08-09 恒为科技(上海)股份有限公司 一种应用驱动的数据存储与索引方法
CN108846013B (zh) * 2018-05-04 2021-11-23 昆明理工大学 一种基于geohash与Patricia Trie的空间关键词查询方法及装置
CN108874880B (zh) * 2018-05-04 2021-11-23 昆明理工大学 一种基于Trie的空间关键词查询方法及装置
CN108874880A (zh) * 2018-05-04 2018-11-23 昆明理工大学 一种基于Trie的空间关键词查询方法及装置
CN108846013A (zh) * 2018-05-04 2018-11-20 昆明理工大学 一种基于geohash与Patricia Trie的空间关键词查询方法及装置
CN109740249A (zh) * 2018-12-29 2019-05-10 西安智多晶微电子有限公司 一种mux树逻辑结构优化方法、模块及存储介质
CN109740249B (zh) * 2018-12-29 2023-03-24 西安智多晶微电子有限公司 一种mux树逻辑结构优化方法、模块及存储介质
CN110222238A (zh) * 2019-04-30 2019-09-10 上海交通大学 字符串与识别符双向映射的查询方法和***
CN110222238B (zh) * 2019-04-30 2022-02-25 上海交通大学 字符串与识别符双向映射的查询方法和***
CN110347685A (zh) * 2019-06-28 2019-10-18 华中科技大学 基于字典树的索引结构、数据查询优化方法、主存管理器
CN110347685B (zh) * 2019-06-28 2021-08-20 华中科技大学 基于字典树的索引结构、数据查询优化方法、主存管理器
CN110489516A (zh) * 2019-08-15 2019-11-22 厦门铅笔头信息科技有限公司 一种快速为海量结构化数据建立前缀索引的方法
CN110825733A (zh) * 2019-10-08 2020-02-21 华中科技大学 一种面向多采样流的时间序列数据管理方法及***
CN111159329B (zh) * 2019-12-24 2023-09-08 深圳市优必选科技股份有限公司 敏感词检测方法、装置、终端设备和计算机可读存储介质
CN111159329A (zh) * 2019-12-24 2020-05-15 深圳市优必选科技股份有限公司 敏感词检测方法、装置、终端设备和计算机可读存储介质
CN113672586A (zh) * 2020-05-15 2021-11-19 永中软件股份有限公司 基于Java技术的内存数据库及其实现方法
CN113626432A (zh) * 2021-08-03 2021-11-09 浪潮云信息技术股份公司 一种支持任意Key值的自适应基数树的改进方法
CN113626432B (zh) * 2021-08-03 2023-10-13 上海沄熹科技有限公司 一种支持任意Key值的自适应基数树的改进方法
CN114758727A (zh) * 2022-04-26 2022-07-15 安徽农业大学 基于携带缓存Trie树加速生物基因的检索方法
CN117194440A (zh) * 2023-11-08 2023-12-08 本原数据(北京)信息技术有限公司 数据库索引压缩方法、装置、电子设备及存储介质
CN117194440B (zh) * 2023-11-08 2024-02-13 本原数据(北京)信息技术有限公司 数据库索引压缩方法、装置、电子设备及存储介质
CN118035360A (zh) * 2024-04-12 2024-05-14 山东浪潮数字商业科技有限公司 一种增量数据识别、定位、更新方法

Also Published As

Publication number Publication date
CN105117417B (zh) 2018-04-17

Similar Documents

Publication Publication Date Title
CN105117417A (zh) 一种读优化的内存数据库Trie树索引方法
US10162598B2 (en) Flash optimized columnar data layout and data access algorithms for big data query engines
US11468027B2 (en) Method and apparatus for providing efficient indexing and computer program included in computer readable medium therefor
CN102129458B (zh) 关系型数据库的存储方法及装置
US9262458B2 (en) Method and system for dynamically partitioning very large database indices on write-once tables
CN107423422B (zh) 基于网格的空间数据分布式存储及检索方法和***
Larson et al. Enhancements to SQL server column stores
US10558495B2 (en) Variable sized database dictionary block encoding
US8924373B2 (en) Query plans with parameter markers in place of object identifiers
CN103914483B (zh) 文件存储方法、装置及文件读取方法、装置
US20120303633A1 (en) Systems and methods for querying column oriented databases
CN107077453B (zh) 用于使用集群缓存进行数据库查询的并行优化的***和方法
Hsieh et al. SQLMR: A scalable database management system for cloud computing
CN103810219A (zh) 一种基于行存储数据库的数据处理方法及装置
CN106155934A (zh) 一种云环境下基于重复数据的缓存方法
US20150186255A1 (en) Re-use of invalidated data in buffers
US8396858B2 (en) Adding entries to an index based on use of the index
CN104462080A (zh) 针对检索结果进行分组统计的索引结构创建方法和***
CN103902693A (zh) 一种读优化的内存数据库t树索引结构的方法
WO2015129109A1 (ja) インデックス管理装置
CN109213760B (zh) 非关系数据存储的高负载业务存储及检索方法
CN105243099A (zh) 一种基于翻译文件的大数据实时存储方法
US20220365905A1 (en) Metadata processing method and apparatus, and a computer-readable storage medium
Shi et al. SQLiteKV: An efficient LSM-tree-based SQLite-like database engine for mobile devices
Ge et al. Cinhba: A secondary index with hotscore caching policy on key-value data store

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant