CN116644086B

CN116644086B - 一种基于SST的Insert SQL语句实现方法

Info

Publication number: CN116644086B
Application number: CN202310587092.7A
Authority: CN
Inventors: 张晖; 史大义; 冯友旭; 刘芳蕾
Original assignee: Shanghai Yunxi Technology Co ltd
Current assignee: Shanghai Yunxi Technology Co ltd
Priority date: 2023-05-24
Filing date: 2023-05-24
Publication date: 2024-02-20
Anticipated expiration: 2043-05-24
Also published as: CN116644086A

Abstract

本发明提供一种基于SST的Insert SQL语句实现方法，属于数据库技术领域，本发明主要解决insert语句小批量数据持续写入场景。通过预先分配固定数量的range数据分区，不同分区写入不同的数据节点，在数据节点上，接收到数据后，本地数据攒批，达到一定数量后，内存中生成SST文件，之后异步的将生成的SST直接调用本地的rocksdb接口，直接落入到rocksdb存储的L0层，减少了中间的数据拷贝和转换，提高insert语句的热点写入性能，同时也避免的rocksdb的flush写失速场景的出现。

Description

一种基于SST的Insert SQL语句实现方法

技术领域

本发明涉及数据库技术领域，尤其涉及一种基于SST的Insert SQL语句实现方法。

背景技术

数据库中现有数据写入方式主要有两种，数据导入和数据动态的insert写入，当用户数据是大批量同时到来或者是历史数据，可以使用数据导入方式入库，这种方式往往需要用户先将需要入库的数据生成对应的物理文件，存放到对应磁盘路径，由加载工具去读取数据，并批量加载的数据库的存储引擎，加载工具的启动关闭的开销都比较大，属于比较重的数据写入方式，但当用户数据是小批量动态到来时，就需要用到insert sql语句方式进行数据写入，用户可以将要写入的数据动态的拼接为一条insert sql语句，带有多条要写入的数据行，在经过parser和校验后，启动执行引擎，将insert sql语句要写入的数据行拼接为batch请求，之后由分布式层将请求拆分到不同节点，由节点的存储引擎，拆分为一条条数据行后，写入实际的SST存储文件，相比加载方式提高实时性，减少加载启动的开销，但在实际使用时，当用户的数据产生热点时，大量的数据行集中在少量或者某个节点的存储引擎后，会导致存储引擎在解析数据行，做数据顺序写入到存储文件时出现拥塞现象导致整条insert语句执行卡住，多条insert语句排队现象。因此需要一种新的insert方式，解决这种多表持续小批量写入场景，可以有限的降低单条insert语句的性能，但在一定时长的统计周期内，整体的insert语句性能是明显提升的。

发明内容

为了解决以上技术问题，本发明提供了一种基于SST的Insert SQL语句实现方法。

本发明的技术方案是：

一种基于SST的Insert SQL语句实现装置，为每条insert sql语句单独创建对应的scheduler服务，并按照数据分片创建对应的writer服务，并双向注册到scheduler服务和SST-save服务中，由scheduler服务统一调度，多条语句统一由节点级别的SST-save进行统一汇总，并通过副本层批量落盘。

进一步的，

writer服务由数据接收服务，数据组织服务，通知服务以及数据缓存服务组成；

SST-save服务接收writer服务通知进行数据提取落盘，同时能主动触发writer服务强制进行数据流转；

当writer服务创建后，双向注册到scheduler服务和SST-save服务中，接受双向调度管理。

通过为每个表在每个节点建立一个公用的writer服务，进行数据临时攒批，在合理的时间或者数据量的阈值控制下，统一直接生成存储引擎使用的SST文件，数据由节点统一的SSTWriter服务进行统一调度落盘，并释放成功信号，让参与攒批的语句都返回用户成功标记，通过节点的表级的统一赞批处理，并且统一落盘，减少的执行中的处理冲突，也减少了存储的写入冲突，提高了小批量频繁写入场景的写入性能。

再进一步的，

通过为每个表在每个节点建立一个公用的writer服务，进行数据临时攒批，在阈值控制下，统一直接生成存储引擎使用的SST文件，数据由节点统一的SSTWriter服务进行统一调度落盘，并释放成功信号，让参与攒批的语句都返回用户成功标记，通过节点的表级的统一赞批处理，并且统一落盘，减少的执行中的处理冲突，减少存储的写入冲突。

再进一步的，

scheduler服务是insert sql语句接入集群节点数据路由服务，负责按照表的range分布合并成节点分布图，按照从insert sql语句解析到的数据键值路由对应数据到对应集群节点，writer为节点的表的range级别数据行接收拼接服务，其中包括数据接收服务负责接收scheduler服务路由过来的数据。

数据组织服务负责将接收到的数据按照数据特征和SST文件组织格式，在内存中拼接SST内存数据块，同时writer也接收SST-save的通知状态，来决定是否临时终止当前SST内存数据块拼装，强制将不满的SST数据块提前加入缓存。

数据缓存服务负责将拼接完成的SST数据块临时缓存，标记为只读状态，并通知SST-save进行落盘；

SST-save服务负责将一段时间接收到的通知的SST数据块按照表的本地range进行整合为一个大的SST内存文件，将每个sst数据块封装成raft日志格式发送给副本层，这里复用了副本层的高可用机制，同时将数据按照执行顺序写入到实际存储；数据实际完成写入后，SST-save服务会等待写入成功信号，并返回给对应的writer，writer之后会通知对应的scheduler，当本次insert sql语句对应的数据都写入到存储后，并拿到了左右数据的写入成功信号，那么本次insert sql语句的执行就可以返回给用户成功。

另外当SST-save处于空闲状态时，会通知对应的writer服务需要进行强制数据下推，减少磁盘的等待。

Insert sql语句执行完成后，退出流程，由scheduler先接收到表删除或者***退出信号，其通知对应的writer退出，并等待writer正在进行的数据写入操作停止后并通知节点的SST-save服务取消注册，并返回对应的完成对出信号后，清楚对应的注册信息，再进行scheduler自身退出。

SST-save服务常驻内存，接收writer服务的注册和取消注册；

Insert sql语句执行初始化，语句在生成对应的物理计划后会进行执行前的准备，第一步判断本次insert ***的数据量，如果大于阈值，则进入本装置执行流程，首先开始当前语句的scheduler服务启动，并根据当前表数据分布，构造writer创建命令下发给对应节点的分布式服务，创建对应的writer服务，writer服务启动后，会向本地的SST-save进行注册，完成本装置执行框架的创建，Insert sql语句执行初始化也完成。

本发明的有益效果是

1、本发明提出的方法可以解决小批量数据频繁写入场景数据批量落盘，增加吞吐量需求。

2、本发明提出为写入节点按照数据切片单独创建writer服务，同时writer服务自动注册到统一的落盘服务，由writer服务串联上层的scheduler服务。

3、本发明提出的新增SST-save，汇总多条insert语句的写入请求，统一落盘，减少执行排队，资源争抢。

4、本发明提出的SST-save空闲状态，主动通知注册的writer进行强制推送数据，可以更加有效的利用资源。

附图说明

图1是Insert sql执行整体结构图；

图2是writer和SST-Save双向注册通知交互示意图。

实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例，基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例，都属于本发明保护的范围。

本发明提供了一种基于SST的insert sql语句实现装置，解决小批量频繁写入场景吞吐量不足。

实现构架如图1所示，scheduler是insert sql语句接入集群节点数据路由服务，负责按照表的range分布合并成节点分布图，按照从insert sql语句解析到的数据键值路由对应数据到对应集群节点，writer为节点的表的range级别数据行接收拼接服务，其中包括数据接收服务负责接收scheduler服务路由过来的数据。数据组织服务负责将接收到的数据按照数据特征和SST文件组织格式，在内存中拼接SST内存数据块，同时writer也接收SST-save的通知状态，来决定是否临时终止当前SST内存数据块拼装，强制将不满的SST数据块提前加入缓存。数据缓存服务，负责将拼接完成的SST数据块临时缓存，标记为只读状态，并通知SST-save进行落盘。SST-save服务负责将一段时间接收到的通知的SST数据块按照表的本地range进行整合为一个大的SST内存文件，将每个sst数据块封装成raft日志格式发送给副本层，这里复用了副本层的高可用机制，同时将数据按照执行顺序写入到实际存储。数据实际完成写入后，SST-save服务会等待写入成功信号，并返回给对应的writer，writer之后会通知对应的scheduler，当本次insert sql语句对应的数据都写入到存储后，并拿到了左右数据的写入成功信号，那么本次insert sql语句的执行就可以返回给用户成功。另外当SST-save处于空闲状态时，会通知对应的writer服务需要进行强制数据下推，减少磁盘的等待。

SST-save服务常驻内存，接收writer服务的注册和取消注册。

以上所述仅为本发明的较佳实施例，仅用于说明本发明的技术方案，并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所做的任何修改、等同替换、改进等，均包含在本发明的保护范围内。

Claims

1.一种基于SST的Insert SQL语句实现方法，其特征在于，

为每条insert sql语句单独创建对应的scheduler服务，并按照数据分片创建对应的writer服务，并双向注册到scheduler服务和SST-save服务中，由scheduler服务统一调度，数条语句统一由节点级别的SST-save进行统一汇总，并通过副本层批量落盘；

当writer服务创建后，双向注册到scheduler服务和SST-save服务中，接受双向调度管理；

Scheduler服务是insert sql语句接入集群节点数据路由服务，负责按照表的range分布合并成节点分布图，按照从insert sql语句解析到的数据键值路由对应数据到对应集群节点，writer为节点的表的range级别数据行接收拼接服务，其中包括数据接收服务负责接收scheduler服务路由过来的数据；

数据组织服务负责将接收到的数据按照数据特征和SST文件组织格式，在内存中拼接SST内存数据块，同时writer也接收SST-save的通知状态，来决定是否临时终止当前SST内存数据块拼装，强制将不满的SST数据块提前加入缓存；

SST-save服务负责将一段时间接收到的通知的SST数据块按照表的本地range进行整合为一个大的SST内存文件，将每个SST数据块封装成raft日志格式发送给副本层，这里复用了副本层的高可用机制，同时将数据按照执行顺序写入到实际存储；数据实际完成写入后，SST-save服务会等待写入成功信号，并返回给对应的writer，writer之后会通知对应的scheduler，当本次insert sql语句对应的数据都写入到存储后，并拿到了左右数据的写入成功信号，那么本次insert sql语句的执行就返回给用户成功。

2.根据权利要求1所述的方法，其特征在于，

通过为每个表在每个节点建立一个公用的writer服务，进行数据临时攒批，在阈值控制下，统一直接生成存储引擎使用的SST文件，数据由节点统一的SSTWriter服务进行统一调度落盘，并释放成功信号，让参与攒批的语句都返回用户成功标记，通过节点的表级的统一攒批处理，并且统一落盘，减少执行中的处理冲突，减少存储的写入冲突。

3.根据权利要求1所述的方法，其特征在于，

4.根据权利要求3所述的方法，其特征在于，

5.根据权利要求4所述的方法，其特征在于，

SST-save服务常驻内存，接收writer服务的注册和取消注册；