CN111858759A - 一种基于共识算法的htap数据库 - Google Patents

一种基于共识算法的htap数据库 Download PDF

Info

Publication number
CN111858759A
CN111858759A CN202010654486.6A CN202010654486A CN111858759A CN 111858759 A CN111858759 A CN 111858759A CN 202010654486 A CN202010654486 A CN 202010654486A CN 111858759 A CN111858759 A CN 111858759A
Authority
CN
China
Prior art keywords
column
bank
data
row
requests
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010654486.6A
Other languages
English (en)
Other versions
CN111858759B (zh
Inventor
刘奇
黄东旭
崔秋
方祝和
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Pingkai Star Beijing Technology Co Ltd
Original Assignee
Pingkai Star Beijing Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Pingkai Star Beijing Technology Co Ltd filed Critical Pingkai Star Beijing Technology Co Ltd
Priority to CN202010654486.6A priority Critical patent/CN111858759B/zh
Publication of CN111858759A publication Critical patent/CN111858759A/zh
Priority to PCT/CN2020/137984 priority patent/WO2022007339A1/zh
Priority to EP20944203.7A priority patent/EP4180988A1/en
Priority to US18/004,582 priority patent/US20230244681A1/en
Application granted granted Critical
Publication of CN111858759B publication Critical patent/CN111858759B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/27Replication, distribution or synchronisation of data between databases or within a distributed database system; Distributed database system architectures therefor
    • G06F16/278Data partitioning, e.g. horizontal or vertical partitioning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/221Column-oriented storage; Management thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2453Query optimisation
    • G06F16/24534Query rewriting; Transformation
    • G06F16/24539Query rewriting; Transformation using cached or materialised query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2471Distributed queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/27Replication, distribution or synchronisation of data between databases or within a distributed database system; Distributed database system architectures therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/27Replication, distribution or synchronisation of data between databases or within a distributed database system; Distributed database system architectures therefor
    • G06F16/273Asynchronous replication or reconciliation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/283Multi-dimensional databases or data warehouses, e.g. MOLAP or ROLAP

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Computing Systems (AREA)
  • Software Systems (AREA)
  • Computational Linguistics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Mathematical Physics (AREA)
  • Fuzzy Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于共识算法的HTAP数据库,该HTAP数据库包括行列混存的分布式存储***和分布式SQL执行引擎;所述行列混存的分布式存储***包括行存库和列存库,所述列存库中存储的数据是行存库所存储数据的子集;所述分布式SQL执行引擎,用于接收客户端发送的事务型请求和/或分析型请求,并在执行所述事务型请求时访问所述行存库,在执行所述分析型请求时访问所述列存库;本发明保证了事务型请求和分析型请求的隔离性,实现负载隔离,保证了数据的新鲜性和一致性,同时保证了***的高可扩展性和高可用性。

Description

一种基于共识算法的HTAP数据库
技术领域
本发明涉及数据库领域,具体涉及一种基于共识算法的HTAP数据库。
背景技术
传统数据库无法同时应对互联网应用中大数据的高并发事务、快速分析和海量数据管理的挑战,因此它分为联机事务处理(On-Line Transactional Processing,简称为OLTP)***和联机分析处理(On-Line Analytical Processing,简称为OLAP)***。OLTP***支持高并发事务,并且保证高可用性、事务一致性以及高可扩展性;OLAP***快速分析数据,但是所分析的并非实时数据。然而新鲜数据蕴含更高的商业价值,这就要求同时处理高并发事务以及实时分析数据,也就是支持混合事务/分析型处理(Hybrid Transactional/Analytical Processing,简称为HTAP)。HTAP***能够实时分析从事务处理产生的数据,并且同时具有OLTP和OLAP***的上述优点。
相关技术中的做法是通过提取-转化-加载(Extract-Transform-Load,简称为ETL)过程将OLTP和OLAP***连接到一起,通过ETL过程,OLTP***定期地将最新的一批数据导入到OLAP***中进行分析。然而这个ETL过程通常耗费几个小时甚至几天的时间,不能保证实时分析;同时多个***之间缺乏全局一致性模型,并且维护多个***引入更高的维护和管理成本。
为了保证数据新鲜性,一些内存数据库(例如HyPer、SAP HANA和MemSQL)允许读取本地事务处理的最新数据,但是这些内存数据库不能同时提供OLTP和OLAP的高性能,因为OLAP严重影响OLTP的性能,影响程度可以通过CH-benCHmark这种HTAP测试集进行评估。已有文献表明,通过运行CH-benCHmark测试,HyPer处理OLTP负载的峰值至少降低五倍,而SAPHANA的OLTP能力峰值至少降低三倍,因为OLTP和OLAP同时访问同一个副本数据,不可避免竞争资源。
为了避免资源竞争,数据库***不得不为OLTP和OLAP负载提供不同的数据副本。多个副本配置到不同的机器,从而隔离OLTP和OLAP负载的干扰。然而实时维护多个副本的一致性是一个必须解决的问题。BatchDB和SAP HANA ATR通过主从复制的方式将OLTP主副本的事务日志复制到OLAP从副本上,从而维护副本数据一致性。但是这种定制的复制方式容易遇到数据不一致的异常,并且没有考虑***的可用性和可扩展性。
发明内容
本发明的主要目的在于提供一种基于共识算法的HTAP数据库,以解决现有数据库***无法同时满足支持负载隔离、数据新鲜性、数据一致性、高可用性和可扩展性。
为了实现上述目的,根据本发明的第一方面,提供了一种基于共识算法的HTAP数据库,所述HTAP数据库包括行列混存的分布式存储***和分布式SQL执行引擎;
所述行列混存的分布式存储***包括行存库和列存库,所述列存库中存储的数据是行存库所存储数据的子集;
所述分布式SQL执行引擎,用于接收客户端发送的事务型请求和/或分析型请求,并在执行所述事务型请求时访问所述行存库,在执行所述分析型请求时访问所述列存库。
可选地,所述行存库包括分块和共识组,所述列存库包括分片和学习者;
所述分片和所述学习者存储列存格式的数据,所述列存格式的数据是所述共识组按照复制状态机机制对所述行存库中的数据进行异步复制后,在本地复制状态机中转换格式得到的。
进一步地,所述共识组包括分块的至少三个副本,所述副本是采用共识算法按照复制状态机机制将分块中的数据进行多数派复制得到的,所述副本以行存格式存储数据。
进一步地,所述列存库中的一个所述分片对应所述行存库中的一个所述分块或多个连续的所述分块;
所述列存库中的一个学习者对应所述行存库中的一个共识组或多个连续的共识组;
所述列存库中的一个分片被配置为所述列存库中的一个学习者或多个学习者。
进一步地,所述分块是行存库中的表数据按照范围分区的方式进行切分得到的,所述分片是列存库中的表数据按照范围分区的方式进行切分得到的。
进一步地,所述范围分区的方式包括:
若分块的数据量或访问量大于预设范围的最大值,则切分该分块,且切分后各分块的数据量或访问量大于预设范围的最小值;
若分块的数据量或访问量小于预设范围的最小值,则将该分块与和该分块连续的分块合并,且合并后分块的数据量或访问量小于预设范围的最大值。
可选地,所述分布式SQL执行引擎,还用于在执行所述事务型请求时访问所述列存库,在执行所述分析可选地型请求时访问所述行存库。
进一步地,所述分布式SQL执行引擎在执行所述事务型请求时访问与分析型请求不同的列存库。
进一步地,所述分布式SQL执行引擎在执行所述分析型请求时访问所述行存库中预设数据量的数据。
可选地,所述列存库响应的分析型请求的数量多于事务型请求的数量,所述行存库响应的事务型请求的数量多于分析型请求的数量;
所述列存库响应的分析型请求的数量多于所述行存库响应的分析型请求的数量,所述行存库响应的事务型请求的数量多于所述列存库响应的分析型请求的数量。
本发明所提供的基于共识算法的HTAP数据库包括行列混存的分布式存储***和分布式SQL执行引擎,所述行列混存的分布式存储***包括行存库和列存库,所述列存库和所述行存库中存储的数据相同;所述分布式SQL执行引擎用于接收客户端发送的事务型请求和/或分析型请求,并将所述事务型请求调度至所述行存库,将所述分析型请求调度至所述列存库;通过引入和行存库所存数据相同的列存库,然后将事务型请求和分析型请求调度到不同机器上执行,达到了负载隔离的目的。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的HTAP数据库***架构图;
图2为本发明实施例提供的复制机制图;
图3为本发明实施例提供的分布式存储逻辑关系图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、***、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
在本发明中,术语“安装”、“设置”、“设有”、“连接”、“相连”、“套接”应做广义理解。例如,可以是固定连接,可拆卸连接,或整体式构造;可以是机械连接,或电连接;可以是直接相连,或者是通过中间媒介间接相连,又或者是两个装置、元件或组成部分之间内部的连通。对于本领域普通技术人员而言,可以根据具体情况理解上述术语在本发明中的具体含义。
需要说明的是,在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本发明。
根据本发明实施例,提供一种基于共识算法的HTAP数据库,***架构如图1所示,所述HTAP数据库包括行列混存的分布式存储***和分布式SQL执行引擎;
所述行列混存的分布式存储***包括行存库和列存库,所述列存库中存储的数据是行存库所存储数据的子集;
具体的,所述列存库中存储的数据可以根据实际需求被配置为和行存库所存储数据的内容相同或行存库所存储数据内容的一部分,且所述列存库和所述行存库所存储数据的格式不同;在同一套HTAP数据库中同时具备行存库和列存库,可以避免不必要的ETL过程,简化软件栈,节省维护和运维成本,降低复杂软件架构带来的技术风险,提升数据资源的利用效率。
所述分布式SQL执行引擎,用于接收客户端发送的事务型请求和/或分析型请求,并在执行事务型请求时访问所述行存库,在执行所述分析型请求时访问所述列存库。
具体为,所述分布式SQL执行引擎接收客户端发送的事务型请求并将该事务型请求调度至行存库所在机器,接收客户端发送的分析型请求并将该分析型请求调度至列存库所在机器,同时接收客户端发送的事务型请求和分析型请求并分别调度至行存库所在机器和列存库所在机器;事务型请求包括读请求和写请求,分析型请求包括读请求,通过将不同请求调度至不同库所在的机器上执行,以隔离所述事务型请求和所述分析型请求,保证OLTP和OLAP查询的隔离性,实现资源隔离和负载隔离,同时保证OLTP和OLAP负载的写入和读取效率。
其中,所述行存库包括分块和共识组,所述列存库包括分片和学习者;
所述分片和所述学习者存储列存格式的数据,所述列存格式的数据是所述共识组按照复制状态机机制对所述行存库中的数据进行异步复制后,在本地复制状态机中转换格式得到的。
具体的,所述学习者为共识组按照复制状态机机制对所述行存库中的数据进行异步复制并将数据格式转换为列存之后得到的。共识组按照复制状态机机制,将行存库副本中的日志异步复制到学习者,学习者将日志中行存格式的数据转化为列存格式的数据,并将该列存格式的数据存储在复制状态机中。通过共识组的异步复制,将数据同步的耗时控制在秒级,保证了数据的新鲜性。
所述HTAP数据库包括行列混存的分布式存储***和分布式SQL执行引擎,分布式存储***包括行存库和列存库,行存库包括共识组,列存库包括学习者,且学习者中的数据是通过共识组中的数据异步复制并转换数据格式后得到的;分布式SQL执行引擎将客户端发送的数据查询请求调度至不同库所在的不同的机器,具体为,主要将事务型请求调度到行存库所在的机器执行,并将分析型请求调度到列存库所在的机器执行。
本发明实施例提供的复制机制如图2所示,通过共识模块采用共识算法进行多数派复制,将日志复制到副本1、副本2和副本3,各副本的日志顺序一致,并且日志应用到本地之后,产生相同的结果;日志复制到一个共识组的大多数副本之后才能提交,并且返回给客户端,已提交的数据可以被读请求读取,读写操作可以配置不同的隔离级别,例如快照隔离;各副本中的复制状态机以行存格式存储数据,采用共识算法维护多副本一致性,保证了***的高可用性。共识组采用共识算法将一个副本通过共识模块按照复制状态机机制进行异步复制,将日志中的行存格式的数据复制到学习者中,复制状态机将行存格式的数据转化为列存格式的数据并存储。
其中,所述共识组包括分块的至少三个副本,所述副本是采用共识算法按照复制状态机机制将分块中的数据进行多数派复制得到的,所述副本以行存格式存储数据。
具体的,采用共识算法按照复制状态机机制,将每个分块中的数据多数派复制到至少三个副本,维护多副本一致性,保证了***的高可用性。
其中,所述列存库中的一个所述分片对应所述行存库中的一个所述分块或多个连续的所述分块;
所述列存库中的一个学习者对应所述行存库中的一个共识组或多个连续的共识组;
所述列存库中的一个分片被配置为所述列存库中的一个学习者或多个学习者。
所述分块是行存库中的表数据按照范围分区的方式进行切分得到的,所述分片是列存库中的表数据按照范围分区的方式进行切分得到的。
具体的,将行存库中的表数据切分成多个分块,保证了***的高可扩展性。
其中,所述范围分区的方式包括:
若分块的数据量或访问量大于预设范围的最大值,则切分该分块,且切分后各分块的数据量或访问量大于预设范围的最小值;
若分块的数据量或访问量小于预设范围的最小值,则将该分块与和该分块连续的分块合并,且合并后分块的数据量或访问量小于预设范围的最大值。
具体的,分块的访问量包括访问该分块的数据查询请求的数量和数据查询请求访问该分块的数据量,所述数据量或访问量的预设范围可以根据***负载进行设置或调整,例如,将数据量的预设范围设为1MB-1GB。
本发明实施例提供的分布式存储逻辑关系如图3所示,将表数据划分为多个分块,保证***的高可扩展性,每个分块采用共识算法按照复制状态机机制进行多数派复制,将分块中的数据复制到至少三个副本,保证***的高可用性,一个分块的所有副本构成共识组,共识组按照复制状态机机制进行异步复制,将日志复制到分片和学习者并以列存格式存储,分片进行日志回放,即分片解析出已经提交的行存数据,并将行存格式的数据转换成列存格式的数据存放到本地,然后该列存格式的数据可以被读取。需要注意的是,本图为逻辑关系图,图中分块和分片是表的逻辑概念,不代表表数据的具体存储位置,具体数据存储在行存库和列存库中的不同副本和学习者。
其中,所述分布式SQL执行引擎,还用于在执行所述事务型请求时访问所述列存库,在执行所述分析型请求时访问所述行存库。
所述分布式SQL执行引擎采用两阶段提交的方式执行事务,并且支持乐观事务以及悲观事务。行存库主要用于物化事务型请求,所有的事务修改都物化到行存库中。对于访问每张表的数据查询请求,行存库提供两种访问路径:行扫描和索引扫描,列存库提供一种访问路径:列扫描,这三种不同的访问路径提供不同的顺序属性和代价,查询优化器可以选择这三种访问路径,因此,同一个数据查询请求访问不同表时会采用不同的访问路径。
具体的,所述分布式SQL执行引擎在执行所述事务型请求时访问与分析型请求不同的列存库;
所述分布式SQL执行引擎在执行所述分析型请求时访问所述行存库中预设数据量的数据;
所述分布式SQL执行引擎在执行的过程中将事务型请求和分析型请求调度到不同的机器上执行,它们分别访问行存库和列存库,这种资源隔离能够保证事务型请求和分析型请求分别达到高性能,减少性能干扰。同时,在保证隔离性的前提下,事务型请求和分析型请求可以同时访问行存库和列存库。事务型请求可以访问单独设置的列存库,所述单独设置的列存库与分析型请求访问的列存库分隔开,以隔离对所述分析型请求的干扰;分析型请求访问行存库时访问所述行存库中预设数据量的数据,该预设数据量的值较小,只会涉及到小范围数据,并且可根据实际需求配置或调整预设数据量的值,使分析型请求访问的数据量受到限制,以隔离对所述事务型请求的干扰。
具体的,所述列存库响应的分析型请求的数量多于事务型请求的数量,所述行存库响应的事务型请求的数量多于分析型请求的数量;
所述列存库响应的分析型请求的数量多于所述行存库响应的分析型请求的数量,所述行存库响应的事务型请求的数量多于所述列存库响应的分析型请求的数量。
从以上的描述中,可以看出,本发明实现了如下技术效果:
将行存库中的表数据切分成多个分块,保证了***的高可扩展性;采用共识算法将每个分块中的数据多数派复制到至少三个副本,维护多副本一致性,保证了***的高可用性;在同一套HTAP数据库中同时具备行存库和列存库,可以避免不必要的ETL过程,简化软件栈,节省维护和运维成本,降低复杂软件架构带来的技术风险,提升数据资源的利用效率;共识组按照复制状态机机制将数据异步复制到学习者,耗时在秒级,保证了数据的新鲜性;通过将不同请求调度至不同库所在的机器上执行,保证OLTP和OLAP查询的隔离性,实现资源隔离和负载隔离,同时保证OLTP和OLAP负载的写入和读取效率。
虽然结合附图描述了本发明的实施方式,但是本领域技术人员可以在不脱离本发明的精神和范围的情况下作出各种修改和变型,这样的修改和变型均落入由所附权利要求所限定的范围之内。

Claims (10)

1.一种基于共识算法的HTAP数据库,其特征在于,所述HTAP数据库包括行列混存的分布式存储***和分布式SQL执行引擎;
所述行列混存的分布式存储***包括行存库和列存库,所述列存库中存储的数据是行存库所存储数据的子集;
所述分布式SQL执行引擎,用于接收客户端发送的事务型请求和/或分析型请求,并在执行所述事务型请求时访问所述行存库,在执行所述分析型请求时访问所述列存库。
2.根据权利要求1所述的HTAP数据库,其特征在于,所述行存库包括分块和共识组,所述列存库包括分片和学习者;
所述分片和所述学习者存储列存格式的数据,所述列存格式的数据是所述共识组按照复制状态机机制对所述行存库中的数据进行异步复制后,在本地复制状态机中转换格式得到的。
3.根据权利要求2所述的HTAP数据库,其特征在于,所述共识组包括分块的至少三个副本,所述副本是采用共识算法按照复制状态机机制将分块中的数据进行多数派复制得到的,所述副本以行存格式存储数据。
4.根据权利要求2所述的HTAP数据库,其特征在于,所述列存库中的一个所述分片对应所述行存库中的一个所述分块或多个连续的所述分块;
所述列存库中的一个学习者对应所述行存库中的一个共识组或多个连续的共识组;
所述列存库中的一个分片被配置为所述列存库中的一个学习者或多个学习者。
5.根据权利要求4所述的HTAP数据库,其特征在于,所述分块是行存库中的表数据按照范围分区的方式进行切分得到的,所述分片是列存库中的表数据按照范围分区的方式进行切分得到的。
6.根据权利要求5所述的HTAP数据库,其特征在于,所述范围分区的方式包括:
若分块的数据量或访问量大于预设范围的最大值,则切分该分块,且切分后各分块的数据量或访问量大于预设范围的最小值;
若分块的数据量或访问量小于预设范围的最小值,则将该分块与和该分块连续的分块合并,且合并后分块的数据量或访问量小于预设范围的最大值。
7.根据权利要求1所述的HTAP数据库,其特征在于,所述分布式SQL执行引擎,还用于在执行所述事务型请求时访问所述列存库,在执行所述分析型请求时访问所述行存库。
8.根据权利要求7所述的HTAP数据库,其特征在于,所述分布式SQL执行引擎在执行所述事务型请求时访问与分析型请求不同的列存库。
9.根据权利要求7所述的HTAP数据库,其特征在于,所述分布式SQL执行引擎在执行所述分析型请求时访问所述行存库中预设数据量的数据。
10.根据权利要求1所述的HTAP数据库,其特征在于,所述列存库响应的分析型请求的数量多于事务型请求的数量,所述行存库响应的事务型请求的数量多于分析型请求的数量;
所述列存库响应的分析型请求的数量多于所述行存库响应的分析型请求的数量,所述行存库响应的事务型请求的数量多于所述列存库响应的分析型请求的数量。
CN202010654486.6A 2020-07-08 2020-07-08 一种基于共识算法的htap数据库*** Active CN111858759B (zh)

Priority Applications (4)

Application Number Priority Date Filing Date Title
CN202010654486.6A CN111858759B (zh) 2020-07-08 2020-07-08 一种基于共识算法的htap数据库***
PCT/CN2020/137984 WO2022007339A1 (zh) 2020-07-08 2020-12-21 一种基于共识算法的htap数据库
EP20944203.7A EP4180988A1 (en) 2020-07-08 2020-12-21 Htap database based on consensus algorithm
US18/004,582 US20230244681A1 (en) 2020-07-08 2020-12-21 HTAP Database Based On Consensus Algorithm

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010654486.6A CN111858759B (zh) 2020-07-08 2020-07-08 一种基于共识算法的htap数据库***

Publications (2)

Publication Number Publication Date
CN111858759A true CN111858759A (zh) 2020-10-30
CN111858759B CN111858759B (zh) 2021-06-11

Family

ID=73152913

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010654486.6A Active CN111858759B (zh) 2020-07-08 2020-07-08 一种基于共识算法的htap数据库***

Country Status (4)

Country Link
US (1) US20230244681A1 (zh)
EP (1) EP4180988A1 (zh)
CN (1) CN111858759B (zh)
WO (1) WO2022007339A1 (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022007339A1 (zh) * 2020-07-08 2022-01-13 平凯星辰(北京)科技有限公司 一种基于共识算法的htap数据库
CN115599790A (zh) * 2022-11-10 2023-01-13 星环信息科技(上海)股份有限公司(Cn) 一种数据存储***、数据处理方法、电子设备和存储介质
WO2023033719A3 (en) * 2021-08-31 2023-04-13 Lemon Inc. Hybrid data processing system and method
WO2023033721A3 (en) * 2021-08-31 2023-05-25 Lemon Inc. Storage engine for hybrid data processing
CN116737810A (zh) * 2023-05-06 2023-09-12 清华大学 一种用于分布式时序数据库的共识服务接口
US11841845B2 (en) 2021-08-31 2023-12-12 Lemon Inc. Data consistency mechanism for hybrid data processing

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106777027A (zh) * 2016-12-08 2017-05-31 北京国电通网络技术有限公司 大规模并行处理行列混合数据存储装置及存储、查询方法
CN110019251A (zh) * 2019-03-22 2019-07-16 深圳市腾讯计算机***有限公司 一种数据处理***、方法及设备
CN110147372A (zh) * 2019-05-21 2019-08-20 电子科技大学 一种面向htap的分布式数据库智能混合存储方法
CN110188108A (zh) * 2019-06-10 2019-08-30 北京平凯星辰科技发展有限公司 数据存储方法、装置、***、计算机设备及存储介质
CN110309233A (zh) * 2018-03-28 2019-10-08 腾讯科技(深圳)有限公司 数据存储的方法、装置、服务器和存储介质
JP2020013318A (ja) * 2018-07-18 2020-01-23 国立大学法人東京工業大学 データベース管理システム、メモリ管理装置、データベース管理方法およびプログラム
CN110874290A (zh) * 2019-10-09 2020-03-10 上海交通大学 分布式内存数据库的事务分析混合处理方法及数据库

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9047331B2 (en) * 2011-04-21 2015-06-02 International Business Machines Corporation Scalable row-store with consensus-based replication
US11048725B2 (en) * 2017-07-25 2021-06-29 Sap Se Methods and systems for unified data sources
US10860612B2 (en) * 2018-04-19 2020-12-08 Sap Se Parallel replication across formats
CN111858759B (zh) * 2020-07-08 2021-06-11 平凯星辰(北京)科技有限公司 一种基于共识算法的htap数据库***

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106777027A (zh) * 2016-12-08 2017-05-31 北京国电通网络技术有限公司 大规模并行处理行列混合数据存储装置及存储、查询方法
CN110309233A (zh) * 2018-03-28 2019-10-08 腾讯科技(深圳)有限公司 数据存储的方法、装置、服务器和存储介质
JP2020013318A (ja) * 2018-07-18 2020-01-23 国立大学法人東京工業大学 データベース管理システム、メモリ管理装置、データベース管理方法およびプログラム
CN110019251A (zh) * 2019-03-22 2019-07-16 深圳市腾讯计算机***有限公司 一种数据处理***、方法及设备
CN110147372A (zh) * 2019-05-21 2019-08-20 电子科技大学 一种面向htap的分布式数据库智能混合存储方法
CN110188108A (zh) * 2019-06-10 2019-08-30 北京平凯星辰科技发展有限公司 数据存储方法、装置、***、计算机设备及存储介质
CN110874290A (zh) * 2019-10-09 2020-03-10 上海交通大学 分布式内存数据库的事务分析混合处理方法及数据库

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
陈陆等: "改进的raft一致性算法及其研究", 《江苏科技大学学报(自然科学版)》 *

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022007339A1 (zh) * 2020-07-08 2022-01-13 平凯星辰(北京)科技有限公司 一种基于共识算法的htap数据库
WO2023033719A3 (en) * 2021-08-31 2023-04-13 Lemon Inc. Hybrid data processing system and method
WO2023033721A3 (en) * 2021-08-31 2023-05-25 Lemon Inc. Storage engine for hybrid data processing
US11789936B2 (en) 2021-08-31 2023-10-17 Lemon Inc. Storage engine for hybrid data processing
US11841845B2 (en) 2021-08-31 2023-12-12 Lemon Inc. Data consistency mechanism for hybrid data processing
CN115599790A (zh) * 2022-11-10 2023-01-13 星环信息科技(上海)股份有限公司(Cn) 一种数据存储***、数据处理方法、电子设备和存储介质
CN115599790B (zh) * 2022-11-10 2024-03-15 星环信息科技(上海)股份有限公司 一种数据存储***、数据处理方法、电子设备和存储介质
CN116737810A (zh) * 2023-05-06 2023-09-12 清华大学 一种用于分布式时序数据库的共识服务接口

Also Published As

Publication number Publication date
CN111858759B (zh) 2021-06-11
US20230244681A1 (en) 2023-08-03
EP4180988A1 (en) 2023-05-17
WO2022007339A1 (zh) 2022-01-13

Similar Documents

Publication Publication Date Title
CN111858759B (zh) 一种基于共识算法的htap数据库***
Huang et al. TiDB: a Raft-based HTAP database
CN108600321A (zh) 一种基于分布式内存云的图数据存储方法和***
Han et al. A novel solution of distributed memory nosql database for cloud computing
JP7263297B2 (ja) ハイブリッドクラウド弾性スケーリングおよび高性能データ仮想化のためのリアルタイムクロスシステムデータベースレプリケーション
CN106528717A (zh) 数据处理方法和***
US11314719B2 (en) Method for implementing change data capture in database management system
Cubukcu et al. Citus: Distributed postgresql for data-intensive applications
CN111639114A (zh) 一种基于物联网平台的分布式数据融合管理***
CN109918450A (zh) 基于分析类场景下的分布式并行数据库及存储方法
CN105677915A (zh) 一种基于引擎的分布式业务数据存取方法
CN115114374B (zh) 事务执行方法、装置、计算设备及存储介质
CN112328700A (zh) 一种分布式数据库
Cheng et al. Taobench: An end-to-end benchmark for social network workloads
Jiang et al. Alibaba hologres: A cloud-native service for hybrid serving/analytical processing
CN115114294A (zh) 数据库存储模式的自适应方法、装置、计算机设备
Qu et al. Are current benchmarks adequate to evaluate distributed transactional databases?
Qian et al. An evaluation of Lucene for keywords search in large-scale short text storage
Yuan et al. Rubato DB: A highly scalable staged grid database system for OLTP and big data applications
Schreiner et al. NewSQL through the looking glass
CN113849478A (zh) 一种云原生大数据分析引擎
US11449521B2 (en) Database management system
Schreiner et al. A hybrid partitioning strategy for NewSQL databases: the VoltDB case
CN115083538A (zh) 一种药物数据的处理***、运行方法及数据处理方法
CN110569310A (zh) 一种云计算环境下的关系大数据的管理方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant