CN106294772A

CN106294772A - 分布式内存列式数据库的缓存管理方法

Info

Publication number: CN106294772A
Application number: CN201610659223.8A
Authority: CN
Inventors: 段翰聪; 闵革勇; 张建; 郑松; 詹文翰
Original assignee: University of Electronic Science and Technology of China
Current assignee: University of Electronic Science and Technology of China
Priority date: 2016-08-11
Filing date: 2016-08-11
Publication date: 2017-01-04
Anticipated expiration: 2036-08-11
Also published as: CN106294772B

Abstract

本发明公开了一种分布式内存列式数据库的缓存管理方法，包括：在缓存主控节点中建立缓存队列；以每个物理任务为根节点切割其所在的物理执行计划以获得每个物理任务对应的缓存计算轨迹；根据每个物理任务对应的缓存计算轨迹在缓存主控节点中构建缓存特征树；在查询请求到来时，查询执行引擎将SQL语句解析成物理执行计划；从物理执行计划的根节点开始层次遍历物理执行计划中每个节点，判断每个物理任务对应的缓存计算轨迹是否与缓存特征树匹配；若匹配，直接从缓存从节点中读取该物理任务的缓存实际数据，否则计算该物理任务。本发明提供的分布式内存列式数据库的缓存管理方法，通过高效的缓存匹配算法迅速检测缓存是否命中，提高了查询效率。

Description

分布式内存列式数据库的缓存管理方法

技术领域

本发明涉及计算机软件技术领域，具体涉及一种分布式内存列式数据库的缓存管理方法。

背景技术

随着信息时代的发展，数据规模呈现***性增长，如何从这些海量数据中提取有价值的信息，是当前社会面临的巨大挑战。而联机分析处理(OLAP，On-Line AnalyticalProcessing)***表现了其强大的数据分析能力，它已广泛应用于银行、电信、证券交易所等商业领域。

支持OLAP***的分布式内存列式数据库允许用户以多个维度从海量数据中提取和分析有价值的信息，这些信息可能是一个简单的报表，也可能是一个复杂的分析结果。随着查询语句复杂度的提升，查询操作所需要的时间也会越长，而高复杂度的查询语句在支持OLAP***的分布式内存列式数据库中出现的频率很高。

数据库中查询请求在语义方面具有很强的相关性，因此部分查询结果很可能在历史查询中出现过。分布式内存列式数据库引入缓存管理***来保存某些历史查询信息，从而减少重复查询的执行次数。图1是分布式内存列式数据库的缓存管理***的结构示意图，所述缓存管理***包括查询执行引擎(Query Engine)11、缓存主控节点(Cache Master)12、备用节点(Standby Cache Master)13以及至少一个缓存从节点(Cache Slave)14。其中，所述查询执行引擎11负责解析和执行用户SQL请求，返回查询结果；所述缓存主控节点12负责管理所有缓存从节点14，维护缓存元数据，根据相关算法淘汰缓存，维护缓存一致性；所述备用节点13定期同步所述缓存主控节点12的所有缓存元数据，当所述缓存主控节点12出现故障时，立即替代所述缓存主控节点12，继续提供缓存服务；所述缓存从节点14负责存储缓存实际数据，响应所述查询执行引擎11读取缓存的请求。

如何在分布式场景下尽可能缓存访问频率高的数据、加快数据库查询速度，正是分布式缓存管理***要解决的问题。

发明内容

本发明所要解决的是如何在分布式场景下尽可能缓存访问频率高的数据、加快数据库查询速度的问题。

本发明通过下述技术方案实现：

一种分布式内存列式数据库的缓存管理方法，所述分布式内存列式数据库的缓存管理***包括查询执行引擎、缓存主控节点以及至少一个缓存从节点，所述缓存管理方法包括：在缓存主控节点中建立缓存队列，所述缓存队列中每项元素对应为一个物理任务的缓存元数据；以每个物理任务为根节点切割其所在的物理执行计划以获得每个物理任务对应的缓存计算轨迹；根据每个物理任务对应的缓存计算轨迹在缓存主控节点中构建缓存特征树；在查询请求到来时，查询执行引擎将SQL语句解析成物理执行计划；从物理执行计划的根节点开始层次遍历物理执行计划中每个节点，判断每个物理任务对应的缓存计算轨迹是否与所述缓存特征树匹配；若匹配，直接从缓存从节点中读取该物理任务的缓存实际数据，否则计算该物理任务。

本发明采用缓存计算轨迹唯一标识缓存，在查询请求到来时，只需要将每个物理任务对应的缓存计算轨迹与缓存特征树进行匹配，能够迅速检测缓存是否命中，从一定程度上减少分布式数据库中重复任务的计算，节省查询时间，提高查询效率。

进一步地，所述缓存队列中每项元素按权重从大到小的顺序排列。

进一步地，所述缓存队列中每项元素的权重根据W_i＝q_i×(a×S_i+b×P_i)获得，其中，W_i为第i项元素的权重，q_i为第i项元素对应的物理任务的权重因子，S_i为第i项元素的时空比且t_i为第i项元素对应的缓存计算轨迹中到根节点最长路径的时间，k_i为第i项元素对应的存储策略常量，m_i为第i项元素实际所占的***存储空间，P_i为第i项元素的命中频率且n_i为第i项元素的历史命中次数，d_i为第i项元素距离上一次命中的时间间隔，v_i为第i项元素平均命中时间间隔，a为时空比对权重的影响因子，b为命中频率对权重的影响因子，i为正整数。

进一步地，所述分布式内存列式数据库的缓存管理方法还包括当所述缓存管理***收到新缓存的存储请求时进行如下步骤：步骤S1，更新所述缓存队列中每项元素的权重；步骤S2，判断所述缓存管理***当前剩余空间是否足以存储新缓存；若所述缓存管理***当前剩余空间足以存储新缓存，执行步骤S3，缓存主控节点通知缓存从节点存储新缓存，将新缓存元数据放入所述缓存队列，并在所述缓存特征树中记录新缓存对应的缓存计算轨迹；若所述缓存管理***当前剩余空间不足以存储新缓存，执行步骤S4，判断新缓存的权重是否大于所述缓存队列中最后一项元素的权重；若新缓存的权重不大于所述缓存队列中最后一项元素的权重，执行步骤S5，缓存主控节点通知缓存从节点拒绝存储新缓存；若新缓存的权重大于所述缓存队列中最后一项元素的权重，执行步骤S6，判断是否仍有查询操作正在使用所述缓存队列中最后一项元素；若仍有查询操作正在使用所述缓存队列中最后一项元素，执行步骤S7，将所述缓存队列中最后一项元素标记为待删除；若无查询操作正在使用所述缓存队列中最后一项元素，执行步骤S8，缓存主控节点删除所述缓存队列中最后一项元素，回收所述缓存管理***中被淘汰缓存占用的存储空间，从所述缓存特征树中删除所述缓存队列中最后一项元素对应的缓存计算轨迹，并转到步骤S2。

进一步地，所述分布式内存列式数据库的缓存管理方法还包括：为所述缓存队列中每项元素设置一个对应的引用计数，当一项元素首次命中时，将该项元素对应的引用计数置1，并且启动一个计时器；若在计时器超时前，缓存主控节点收到使用一项元素的SQL语句查询完毕的反馈，则将该项元素的引用计数减1，并重置计时器；在一项元素对应的引用计数等于0时，则关闭计时器。

进一步地，判断是否仍有查询操作正在使用所述缓存队列中最后一项元素为判断所述缓存队列中最后一项元素对应的引用计数是否为0。

进一步地，每个物理任务对应的缓存计算轨迹包括每个节点的结果计算时间、结果存储大小以及每条边代表的数据传输时间。

进一步地，所述缓存特征树中所有节点所涉及的表都拥有版本号。

本发明与现有技术相比，具有如下的优点和有益效果：

本发明提供的分布式内存列式数据库的缓存管理方法，通过高效的缓存匹配算法迅速检测缓存是否命中，利用合理的缓存淘汰算法保证***可用性和稳定性，从一定程度上减少了分布式数据库中重复任务的计算，节省了查询时间和存储空间，提高了查询效率。

附图说明

此处所说明的附图用来提供对本发明实施例的进一步理解，构成本申请的一部分，并不构成对本发明实施例的限定。在附图中：

图1是分布式内存列式数据库的缓存管理***的结构示意图；

图2是本发明实施例的物理执行计划的结构示意图；

图3是本发明实施例的缓存计算轨迹的结构示意图；

图4是本发明实施例的缓存特征树的结构示意图；

图5是本发明实施例的T2-Join计算轨迹的结构示意图；

图6是本发明实施例的T3-Join计算轨迹的结构示意图；

图7是本发明实施例的缓存匹配结果的结构示意图；

图8是本发明实施例的缓存淘汰方法的流程示意图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚明白，下面结合实施例和附图，对本发明作进一步的详细说明，本发明的示意性实施方式及其说明仅用于解释本发明，并不作为对本发明的限定。

实施例

本实施例提供一种分布式内存列式数据库的缓存管理方法，所述分布式内存列式数据库的缓存管理***的结构示意图可参考图1，包括查询执行引擎、缓存主控节点、备用节点以及至少一个缓存从节点。

在查询请求到来时，查询执行引擎将SQL语句解析成由DAG表示的物理执行计划。物理执行计划中的每个节点代表一个物理任务，物理任务又分为GetColumn、Join、Filter、Group和BuildRow等，每条边代表两个物理任务之间计算结果的传输关系。一条典型的查询语句(SELECT A.id FROM A,B WHERE A.id＝B.id AND A.id<＝100AND B.id<＝80)的物理执行计划如图1所示。在缓存管理***中，缓存数据的粒度是单个物理任务的计算结果。当缓存是BuildRow的计算结果时，则缓存了整条SQL语句的最终查询结果。本实施例采用缓存计算轨迹唯一标识缓存。

首先，在缓存主控节点中建立缓存队列，所述缓存队列中每项元素对应为一个物理任务的缓存元数据。如前所述，缓存数据的粒度是单个物理任务的计算结果，在最初建立缓存队列时，所述缓存管理***有足够的存储空间，因此，在接收到缓存请求时，直接将物理任务的计算结果存储在缓存从节点中，将物理任务的缓存元数据作为缓存队列的一个元素。

以每个物理任务为根节点切割其所在的物理执行计划以获得每个物理任务对应的缓存计算轨迹。具体地，请求缓存的每个物理任务均对应有一个物理执行计划。在物理执行计划中，以该请求缓存的物理任务为根结点切割物理执行计划获得子图，该子图就是根节点对应的缓存计算轨迹。缓存计算轨迹记录了从原始数据到生成该缓存的所有信息，包括每个节点的结果计算时间、结果存储大小以及每条边代表的数据传输时间。缓存计算轨迹的每个节点是一个特征点，所有特征点及其关系构成缓存的特征。以图2所示的物理执行计划为例，假如用户要缓存T3-Join物理任务的计算结果，则以该物理任务节点为根节点，获得对应的缓存计算轨迹如图3所示。

根据每个物理任务对应的缓存计算轨迹在缓存主控节点中构建缓存特征树。所述缓存特征树记录了各个缓存的特征点及其关系，它根据表关系按层次结构组织，层数代表该层涉及的表数，最底层只涉及一张表。所述缓存特征树的每个节点代表一个缓存特征点，特征点之间通过连线表示相互的依赖关系，一个缓存的特征是由一系列特征点及其关系构成。

为了防止缓存数据和数据库原始数据不一致，所述缓存特征树中所有节点所涉及的表都拥有版本号，只有在表版本号一致的前提下才能进行匹配。用户尝试读取或写入缓存时，输入均包含涉及的表在当前分布式数据库中最新的版本号，当缓存主控节点发现某个表的版本过期时，则删除与该表有关的所有缓存。一个典型的缓存特征树如图4所示，其中，实线框表示该特征点描述的缓存存在，虚线框表示该特征点描述的缓存不存在，后者只是为了保证它所属缓存的特征完整性。

在查询请求到来时，查询执行引擎将SQL语句解析成物理执行计划，物理执行计划由一张物理任务DAG表示。本领域技术人员知晓查询执行引擎如何将SQL语句解析成物理执行计划，在此不再赘述。

从物理执行计划的根节点开始层次遍历物理执行计划中每个节点，判断每个物理任务对应的缓存计算轨迹是否与所述缓存特征树匹配。缓存匹配包括两种情况：完全匹配和部分匹配。完全匹配是指请求的缓存计算轨迹中所有特征点及其关系都能在所述缓存特征树中找到；部分匹配基本与完全匹配一致，唯一区别在于，缓存计算轨迹的根结点是所述缓存特征树中某个特征点的子集。若匹配，直接从缓存从节点中读取该物理任务的缓存实际数据，否则计算该物理任务。

在图4描述的缓存特征树基础上，以图2描述的SQL语句(SELECT A.id FROM A,BWHERE A.id＝B.id AND A.id<＝100AND B.id<＝80)为例，从物理执行计划根节点开始层次遍历每个节点，对应的缓存匹配步骤如下：

检测T1-BuildRow是否命中缓存。T1-BuildRow的缓存计算轨迹就是整张DAG图，从根结点开始层次扫描每个特征点是否命中，只要检测到一个特征点未命中，则该任务未命中缓存。由于节点T1涉及两张表AB，所以在特征树的Level 2查找是否存在该特征点，实际结果是无，所以T1-BuildRow未命中缓存。

检测T2-Join是否命中缓存。T2-Join的缓存计算轨迹如图5所示，节点T2匹配缓存特征树中的特征点2_1，节点T5匹配缓存特征树中的特征点1_1，而节点T4是特征点1_5的子集，但关系(1_5，2_1)不存在，所以T2-Join未命中缓存。

检测T3-Join是否命中缓存。T3-Join的缓存计算轨迹如图6所示，节点T3匹配缓存特征树中的特征点2_1，节点T6匹配缓存特征树中的特征点1_2，而由前述可知节点T5匹配缓存特征树中的特征点1_1，关系(T5，T3)匹配关系(1_1，2_1)，关系(T6，T3)匹配关系(1_2，2_1)，所以T3-Join完全匹配。

节点T4是特征点1_5的子集，即T4-GetColumn部分匹配，节点T5匹配特征点1_1，故T5-GetColumn完全匹配。节点T6匹配特征点1_2，即T6-GetColumn完全匹配。

上述步骤结束后，可以得到该SQL语句的缓存匹配结果如图7所示。从图7可以看出，查询执行引擎只需要计算T1和T2物理任务，就可以完成整条SQL语句的查询，极大地提高了查询效率。

由于缓存管理***的存储空间是有限的，在存储空间都被占用后，接收到新缓存的存储请求时需要对现有的缓存进行淘汰。缓存淘汰是缓存管理***的核心之一，决定缓存的换入换出，进而影响缓存的命中率和缓存服务的稳定性。在本实施例中，所述缓存队列中每项元素按权重从大到小的顺序排列，队尾权重最小。每次淘汰缓存时，均从队尾弹出元素。

假设t_i是第i项元素对应的缓存计算轨迹中到根节点最长路径的时间(单位：ms)，m_i是第i项元素实际所占的***存储空间(单位：Byte)，k_i是第i项元素对应的存储策略常量，不同的存储策略，其读取缓存数据的方式和时间都不同。第i项元素的时空比计算公式为：

假设d_i是第i项元素距离上一次命中的时间间隔(单位：ms)，n_i是第i项元素的历史命中次数，v_i是第i项元素平均命中时间间隔(单位：ms)。第i项元素的命中频率计算公式为：如果第i项元素是首次加入队列，则P_i＝1。

综上所述，所述缓存队列中第i项元素的权重计算公式为：W_i＝q_i×(a×S_i+b×P_i)。其中，W_i为第i项元素的权重，q_i为第i项元素对应的物理任务的权重因子。第i项元素对应的物理任务越复杂，第i项元素对应的物理任务的权重因子q_i的值越大。比如Join任务对应的权重因子的值要比GetColumn任务对应的权重因子的值大。默认情况下，第i项元素对应的物理任务的权重因子q_i等于1.0。a和b均是常量，分别代表时空比和命中频率对权重的影响因子。如果***存储空间比较小，则可以调大a的值，增加时空比对权重的影响，反之则调小a。

在本实施例中，为所述缓存队列中每项元素设置一个对应的引用计数，代表正在使用该缓存的查询操作个数。当一项元素首次命中时，该项元素对应的引用计数置1，并且启动一个计时器，缺省值可以根据实际情况进行设置，例如30秒。如果在计时器超时前，缓存主控节点收到某条使用一项元素的SQL语句查询完毕的反馈，则将该项元素对应的引用计数减1，并重置计时器。在一项元素对应的引用计数等于0时，则关闭计时器。计时器的作用在于防止查询执行引擎出现故障，导致缓存主控节点无法收到查询完毕的反馈。

缓存被淘汰时，假如被淘汰缓存对应的引用计数不为0，说明仍有查询操作在使用该缓存，如果立即删除该缓存，可能导致查询执行引擎获取缓存失败，耗费多余时间进行任务故障恢复。被淘汰的缓存仅仅被标记为待删除，等到引用计数为0时才真正被删除。

图8是本发明实施例的缓存淘汰方法的流程示意图，当***收到一个新缓存的存储请求时，缓存主控节点进行如下步骤：

步骤S1，更新所述缓存队列中每项元素的权重。由于缓存队列中每项元素距离上一次命中的时间间隔会随着时间推移增大，所以需要先更新缓存队列中每项元素的权重。

步骤S2，判断所述缓存管理***当前剩余空间是否足以存储新缓存。

若所述缓存管理***当前剩余空间足以存储新缓存，执行步骤S3，缓存主控节点通知缓存从节点存储新缓存，将新缓存元数据放入所述缓存队列，并在所述缓存特征树中记录新缓存对应的缓存计算轨迹。

若所述缓存管理***当前剩余空间不足以存储新缓存，执行步骤S4，判断新缓存的权重是否大于所述缓存队列中最后一项元素的权重。

若新缓存的权重不大于所述缓存队列中最后一项元素的权重，执行步骤S5，缓存主控节点通知缓存从节点拒绝存储新缓存。

若新缓存的权重大于所述缓存队列中最后一项元素的权重，执行步骤S6，判断是否仍有查询操作正在使用所述缓存队列中最后一项元素，即判断所述缓存队列中最后一项元素对应的引用计数是否为0。

若仍有查询操作正在使用所述缓存队列中最后一项元素，执行步骤S7，将所述缓存队列中最后一项元素标记为待删除。待所述缓存队列中最后一项元素对应的引用计数为0时，再将所述缓存队列中最后一项元素删除。

若无查询操作正在使用所述缓存队列中最后一项元素，执行步骤S8，缓存主控节点删除所述缓存队列中最后一项元素，回收所述缓存管理***中被淘汰缓存占用的存储空间，从所述缓存特征树中删除所述缓存队列中最后一项元素对应的缓存计算轨迹，并转到步骤S2。

以上所述的具体实施方式，对本发明的目的、技术方案和有益效果进行了进一步详细说明，所应理解的是，以上所述仅为本发明的具体实施方式而已，并不用于限定本发明的保护范围，凡在本发明的精神和原则之内，所做的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种分布式内存列式数据库的缓存管理方法，所述分布式内存列式数据库的缓存管理***包括查询执行引擎、缓存主控节点以及至少一个缓存从节点，其特征在于，所述缓存管理方法包括：

在缓存主控节点中建立缓存队列，所述缓存队列中每项元素对应为一个物理任务的缓存元数据；

以每个物理任务为根节点切割其所在的物理执行计划以获得每个物理任务对应的缓存计算轨迹；

根据每个物理任务对应的缓存计算轨迹在缓存主控节点中构建缓存特征树；

在查询请求到来时，查询执行引擎将SQL语句解析成物理执行计划；

从物理执行计划的根节点开始层次遍历物理执行计划中每个节点，判断每个物理任务对应的缓存计算轨迹是否与所述缓存特征树匹配；

若匹配，直接从缓存从节点中读取该物理任务的缓存实际数据，否则计算该物理任务。

2.根据权利要求1所述的分布式内存列式数据库的缓存管理方法，其特征在于，所述缓存队列中每项元素按权重从大到小的顺序排列。

3.根据权利要求2所述的分布式内存列式数据库的缓存管理方法，其特征在于，所述缓存队列中每项元素的权重根据W_i＝q_i×(a×S_i+b×P_i)获得，其中，W_i为第i项元素的权重，q_i为第i项元素对应的物理任务的权重因子，S_i为第i项元素的时空比且t_i为第i项元素对应的缓存计算轨迹中到根节点最长路径的时间，k_i为第i项元素对应的存储策略常量，m_i为第i项元素实际所占的***存储空间，P_i为第i项元素的命中频率且n_i为第i项元素的历史命中次数，d_i为第i项元素距离上一次命中的时间间隔，v_i为第i项元素平均命中时间间隔，a为时空比对权重的影响因子，b为命中频率对权重的影响因子，i为正整数。

4.根据权利要求3所述的分布式内存列式数据库的缓存管理方法，其特征在于，还包括当所述缓存管理***收到新缓存的存储请求时进行如下步骤：

步骤S1，更新所述缓存队列中每项元素的权重；

步骤S2，判断所述缓存管理***当前剩余空间是否足以存储新缓存；

若所述缓存管理***当前剩余空间足以存储新缓存，执行步骤S3，缓存主控节点通知缓存从节点存储新缓存，将新缓存元数据放入所述缓存队列，并在所述缓存特征树中记录新缓存对应的缓存计算轨迹；

若所述缓存管理***当前剩余空间不足以存储新缓存，执行步骤S4，判断新缓存的权重是否大于所述缓存队列中最后一项元素的权重；

若新缓存的权重不大于所述缓存队列中最后一项元素的权重，执行步骤S5，缓存主控节点通知缓存从节点拒绝存储新缓存；

若新缓存的权重大于所述缓存队列中最后一项元素的权重，执行步骤S6，判断是否仍有查询操作正在使用所述缓存队列中最后一项元素；

若仍有查询操作正在使用所述缓存队列中最后一项元素，执行步骤S7，将所述缓存队列中最后一项元素标记为待删除；

5.根据权利要求4所述的分布式内存列式数据库的缓存管理方法，其特征在于，还包括：

为所述缓存队列中每项元素设置一个对应的引用计数，当一项元素首次命中时，将该项元素对应的引用计数置1，并且启动一个计时器；

若在计时器超时前，缓存主控节点收到使用一项元素的SQL语句查询完毕的反馈，则将该项元素对应的引用计数减1，并重置计时器；

在一项元素对应的引用计数等于0时，则关闭计时器。

6.根据权利要求5所述的分布式内存列式数据库的缓存管理方法，其特征在于，判断是否仍有查询操作正在使用所述缓存队列中最后一项元素为判断所述缓存队列中最后一项元素对应的引用计数是否为0。

7.根据权利要求1所述的分布式内存列式数据库的缓存管理方法，其特征在于，每个物理任务对应的缓存计算轨迹包括每个节点的结果计算时间、结果存储大小以及每条边代表的数据传输时间。

8.根据权利要求1所述的分布式内存列式数据库的缓存管理方法，其特征在于，所述缓存特征树中所有节点所涉及的表都拥有版本号。