CN104484469B

CN104484469B - 一种支持多hash map数据库集群***不停机的扩容方法

Info

Publication number: CN104484469B
Application number: CN201410847870.2A
Authority: CN
Inventors: 张绍勇; 孔德生; 武新; 崔维力
Original assignee: TIANJIN NANKAI UNIVERSITY GENERAL DATA TECHNOLOGIES Co Ltd
Current assignee: TIANJIN NANKAI UNIVERSITY GENERAL DATA TECHNOLOGIES Co Ltd
Priority date: 2014-12-31
Filing date: 2014-12-31
Publication date: 2017-12-15
Anticipated expiration: 2034-12-31
Also published as: CN104484469A

Abstract

本发明创造提供一种支持多hash map数据库集群***不停机的扩容方法，包括以下步骤：S1.集群中的原表都绑定到现有的hash map上，现有的hash map命名为old hash map；S2.进行集群扩容时，执行产生新hash map的命令，集群产生新的hash map，并把该hash map设定为current hash map；S3.集群扩容后新创建的表自动绑定到current hash map上；S4.对原表和新表的任何操作将以current hash map为当前操作的hash map,基于old hash map的老表的原有的hash特性将丢失，需要按照current hash map进行数据动态重分布后参与和新表的运算。S5.迁移部分数据到新节点上，迁移完成后该表即可绑定到current hash map上。这种设计性能不衰减，数据过渡自然。

Description

一种支持多hash map数据库集群***不停机的扩容方法

技术领域

本发明创造涉及分布式数据库领域，具体涉及一种支持多hash map数据库集群***不停机的扩容方法。

背景技术

在客户的业务场景中，当前集群满足不了用户的业务需求而需要对集群进行扩容时，需要在给定的时间窗口完成集群的扩容。传统意义的集群扩容主要技术为数据的搬移，通过将原有集群节点上的部分数据重分布到新加入的节点来完成扩容过程。根据数据量的大小，数据重分布的耗时在几小时到几天不等，并且在扩容过程中集群不允许DML与DDL操作，仅允许查询操作，这就为集群用户带来很大不便，特别是实时***用户不允许集群停机时间过长。

发明内容

本发明创造要解决的是扩容过程不允许用户执行DML与DDL操作的问题。

为解决上述技术问题，本发明创造采用的技术方案是：一种支持多hash map数据库集群***不停机的扩容方法，包括以下步骤：

S1.集群中的原表都绑定到现有的hash map上，现有的hash map命名为old hashmap；

S2.进行集群扩容时，执行产生新hash map的命令，集群产生新的hash map，并把该hash map设定为current hash map；

S3.集群扩容后新创建的表自动绑定到current hash map上；

S4.对原表的任何操作将均使用old hash map,数据运算均在原有节点进行。对新表的任何操作将均使用current hash map,数据运算在所有的节点进行。对原表和新表的任何操作将以current hash map为当前操作的hash map,基于old hash map的老表的原有的hash特性将丢失，需要按照current hash map进行数据动态重分布后参与和新表的运算。

S5.当数据自然老化后，基于old hash map的原表的数据将从集群中移除，当数据无法老化时，为了提高性能，迁移部分数据到新节点上，迁移完成后该表即可绑定到current hash map上。

进一步地，步骤S2包括以下步骤：

S21.发起生成hash map的命令；

S22.根据hash桶数以及集群总节点数生成包含hash key和nodeid对应的hashmap；

S23.集群新生成的hash map设定为current hash map，作为集群的缺省hashmap。

进一步地，步骤S22中生成hash map的公式为每个节点分配的hash key的总数＝(集群hash桶数[65536]/物理节点总数)。

进一步地，每个节点分配的hash map的范围从0-65535中平均获取连续的一段hash key。

进一步地，步骤S5包括以下步骤：

S51.接受原表动态重分布操作的命令；

S52.获得集群old hash map和扩容时新产生的current hash map；

S53.在集群所有节点上创建中间临时表；

S54.集群原表按照current hash map动态重分布数据到所有节点上的中间临时表中；

S55.删除集群原表，中间临时表重命名为原表，并绑定在current hash map上。

本发明创造具有的优点和积极效果是：

性能不衰减：由于老的集群节点存储旧数据，对于原表的查询操作，原表的DML操作均在原集群节点上进行，性能与原有性能相当。新表的操作由于在集群扩容后的所有节点上，因此操作性能将得到提升。

数据过渡自然：老集群数据依据老化原则自然老化，集群扩容后新表将创建到所有的节点上，在老表的数据没有自然老化前，只基于老表，只基于新表，以及老表和新表的混合操作都自然支持。

附图说明

图1是集群扩容后产生current hash map的流程图；

图2是原表数据重分布到新节点操作的流程图。

具体实施方式

一种支持多hash map数据库集群***不停机的扩容方法，包括以下步骤：

S3.集群扩容后新创建的表自动绑定到current hash map上；

S4.对原表的任何操作将均使用old hash map,数据运算均在原有节点进行。对新表的任何操作将均使用current hash map,数据运算在所有的节点进行。对原表和新表的任何操作将以current hash map为当前操作的hash map,基于old hash map的老表的原有的hash特性将丢失，需要按照current hash map进行数据动态重分布后参与和新表的运算；

步骤S2包括以下步骤：

S21.发起生成hash map的命令；

步骤S22中生成hash map的公式为每个节点分配的hash key的总数＝(集群hash桶数[65536]/物理节点总数)。

每个节点分配的hash map的范围从0-65535中平均获取连续的一段hash key。

步骤S5包括以下步骤：

S51.接受原表动态重分布操作的命令；

S52.获得集群old hash map和扩容时新产生的current hash map；

S53.在集群所有节点上创建中间临时表；

以上对本发明创造的实施例进行了详细说明，但所述内容仅为本发明创造的较佳实施例，不能被认为用于限定本发明的实施范围。凡依本发明创造范围所作的均等变化与改进等，均应仍归属于本专利涵盖范围之内。

Claims

1.一种支持多hash map数据库集群***不停机的扩容方法，其特征在于：包括以下步骤：

S1.集群中的原表都绑定到现有的hash map上，现有的hash map命名为old hash map；

S3.集群扩容后新创建的表自动绑定到current hash map上；

S4.对原表的任何操作将均使用old hash map,数据运算均在原有节点进行；对新表的任何操作将均使用current hash map,数据运算在所有的节点进行；对原表和新表的任何操作将以current hash map为当前操作的hash map,基于old hash map的老表的原有的hash特性将丢失，需要按照current hash map进行数据动态重分布后参与和新表的运算；

S5.当数据自然老化后，基于old hash map的原表的数据将从集群中移除，当数据无法老化时，迁移部分数据到新节点上，迁移完成后该表即可绑定到current hash map上。

2.根据权利要求1所述的一种支持多hash map数据库集群***不停机的扩容方法，其特征在于：步骤S2包括以下步骤：

S21.发起生成hash map的命令；

S22.根据hash桶数以及集群总节点数生成包含hash key和nodeid对应的hash map；

S23.集群新生成的hash map设定为current hash map，作为集群的缺省hash map。

3.根据权利要求2所述的一种支持多hash map数据库集群***不停机的扩容方法，其特征在于：步骤S22中生成hash map的公式为每个节点分配的hash key的总数＝(集群hash桶数[65536]/物理节点总数)。

4.根据权利要求3所述的一种支持多hash map数据库集群***不停机的扩容方法，其特征在于：每个节点分配的hash map的范围从0-65535中平均获取连续的一段hash key。

5.根据权利要求1所述的一种支持多hash map数据库集群***不停机的扩容方法，其特征在于：步骤S5包括以下步骤：

S51.接受原表动态重分布操作的命令；

S52.获得集群old hash map和扩容时新产生的current hash map；

S53.在集群所有节点上创建中间临时表；