CN106909556B

CN106909556B - 内存集群的存储均衡方法及装置

Info

Publication number: CN106909556B
Application number: CN201510976653.8A
Authority: CN
Inventors: 杨维
Original assignee: China Telecom Corp Ltd
Current assignee: Tianyi Cloud Technology Co Ltd
Priority date: 2015-12-23
Filing date: 2015-12-23
Publication date: 2020-03-20
Anticipated expiration: 2035-12-23
Also published as: CN106909556A

Abstract

本发明公开了一种内存集群的存储均衡方法和装置，涉及数据库领域。其中的方法包括：对原始一级键K1的表分区段进行切分得到分片号；根据原始一级键K1、分片号生成均衡一级键K1’；采用(K1’，DO)的数据存储形式存储键值数据；其中，原始一级键K1为定制对象DO的原始逻辑键，所述原始一级键K1由数据库段、数据表段、表分区段组成，均衡一级键K1’为定制对象DO的均衡逻辑键。从而实现数据在内存集群数据节点上的均匀分布，进而充分利用内存集群的存储容量。

Description

内存集群的存储均衡方法及装置

技术领域

本发明涉及数据库领域，特别涉及一种内存集群的存储均衡方法及装置。

背景技术

由代理服务器对集群中的键(key)做一致性哈希，理想情况下能保证键在集群节点上的均匀分布。由于分区的数据量通常不一样，分区数据量的不同会导致集群节点的存储资源占用不均衡。

如图1所示，假设集群有4个节点，每个节点的存储是10。分两次存储8个分区数据，第一次存储4个分区(4个键)，数据量分别是1、2、4、8；第二次再存储4个分区(4个键)，数据量都是2。如果两次的存储的分区数据都被均匀保存在4个节点上，那么4个节点的数据量分别是3、4、6、10。如果再向集群节点***数据，很可能数据被一致性哈希到存储为10的节点上，则存储失败。此时，其它3个节点都有不同程度的闲置资源但却不可用。

可见，传统的一致性哈希算法未考虑分区影响，直接对数据成员对等处理，同时近年来加入虚拟节点的方式加剧了分区分布不均的情况，因此有必要解决分区数据过度集中于若干服务节点造成整体性能瓶颈问题。

发明内容

本发明所要解决的技术问题是：如何实现数据在内存集群数据节点上的均匀分布，进而充分利用内存集群的存储容量。

根据本发明实施例的一个方面，提供了一种内存集群的存储均衡方法，包括：对原始一级键K1的表分区段进行切分得到分片号；根据原始一级键K1、分片号生成均衡一级键K1’；采用(K1’，DO)的数据存储形式存储键值数据；其中，原始一级键K1为定制对象DO的原始逻辑键，所述原始一级键K1由数据库段、数据表段、表分区段组成，均衡一级键K1’为定制对象DO的均衡逻辑键。

根据本发明实施例的另一个方面，提供了一种内存集群的存储均衡装置，包括：切分模块，用于对原始一级键K1的表分区段进行切分得到分片号；均衡一级键生成模块，用于根据原始一级键K1、分片号生成均衡一级键K1’；键值数据存储模块，用于采用(K1’，DO)的数据存储形式存储键值数据；其中，原始一级键K1为定制对象DO的原始逻辑键，所述原始一级键K1由数据库段、数据表段、表分区段组成，均衡一级键K1’为定制对象DO的均衡逻辑键。

本发明至少具有以下优点：

通过对原始键的表分区段进一步切分得到分片号，然后根据原始键和分片号重新构建均衡键，并基于均衡键进行数据的存储，实现数据在内存集群数据节点上的均匀分布，进而充分利用内存集群的存储容量。

通过以下参照附图对本发明的示例性实施例的详细描述，本发明的其它特征及其优点将会变得清楚。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1示出传统哈希算法导致集群节点的存储资源占用不均衡的示意图。

图2示出本发明内存集群的存储均衡方法的一个实施例的流程示意图。

图3示出本发明对原始一级键K1的表分区段进行切分得到分片号的示意图。

图4示出本发明对原始一级键K1的表分区段进行切分得到分片号的一个实施例的示意图。

图5示出本发明对原始一级键K1的表分区段进行切分得到分片号的一个实施例的示意图。

图6示出本发明内存集群的存储均衡装置的一个实施例的示意图。

图7示出本发明键值数据存储模块的一个实施例的示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。以下对至少一个示例性实施例的描述实际上仅仅是说明性的，决不作为对本发明及其应用或使用的任何限制。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

下面结合图2描述本发明一个实施例的内存集群的存储均衡方法。

图2示出本发明内存集群的存储均衡方法的一个实施例的流程示意图。如图2所示，该实施例的方法包括：

步骤S202，对原始一级键K1的表分区段进行切分得到分片号。原始一级键K1为定制对象DO的原始逻辑键，原始一级键K1由数据库段、数据表段、表分区段组成,从而在Redis集群上提供数据库、数据表、分区的数据组织方式。其中，数据库db是最大的数据隔离单位，是一个逻辑概念。用户可以创建多个数据库。一般来说，一类的数据应放在一个内存数据库中。数据表table是一类主题、业务、概念相同数据的集合，如用户表、明细表等，是一个逻辑概念。表分区partition是基于Redis集群特性，将大数据表进一步逻辑拆分的单位。不同分区中的数据是分开存储，使数据的分布更加均匀。此外，数据库、数据表、分区这些逻辑概念可以用元数据来描述。用于存储元数据的键名为STORE，值类型为Hash(哈希表)。所有元数据信息，都存放在以STORE为键的哈希表下。所有数据库的元数据描述信息都以Key-Value的形式保存在元数据库中(哈希表)，数据库的键名可以为DB_[数据库名]。所有数据表的元数据描述信息都以Key-Value的形式保存在元数据库中(哈希表)。数据表的键名可以为TB_[数据库名]_[数据表名]，从而在键名上体现数据表与数据库的关系。数据分区是数据表的进一步逻辑划分，数据分区以元数据的方式保存的数据表的元数据中。数据分区的键名可以为[数据库名]_[数据表名]_[分区名]。

其中，定制对象DO中存储(K2，V)，二级键K2为定制对象DO的数据键，V为定制对象DO的数据值。

步骤S204，根据原始一级键K1、分片号生成均衡一级键K1’。其中，均衡一级键K1’为定制对象DO的均衡逻辑键。

步骤S206，采用(K1’，DO)的数据存储形式存储键值数据。

通过上述方法，对原始一级键K1的表分区段进行进一步细分，然后根据原始键和分片号重新构建均衡键，并基于均衡键进行数据的存储，实现了数据在内存集群数据节点上的均匀分布，进而充分利用内存集群的存储容量。

图3示出本发明对原始一级键K1的表分区段进行切分得到分片号的示意图。分片是由用户存储的结点数计算出来的。未存储数据时，不能确定一个分区具体被分成了多少个分片。当用户存储Key-Value时，对Key取哈希值，再按计划分片数取余。把计算的结果与原分区的完整键名组合，形成新的分片键名，

下面结合图4描述本发明一个实施例的对原始一级键K1的表分区段进行切分得到分片号方法。

图4示出本发明对原始一级键K1的表分区段进行切分得到分片号的一个实施例的示意图。如图4所示，定制对象DO中存储(K2，V)，二级键K2为定制对象DO的数据键，V为定制对象DO的数据值。对原始一级键K1的表分区段进行切分得到分片号的一种具体实现方法包括：

步骤S402，对原始一级键K1和二级键K2进行哈希运算。

步骤S404，将哈希运算所得哈希值对计划分片数M进行取余运算。

步骤S406，将取余运算的结果作为分片号。

例如，集群节点数是4，分区的最大分片数设计为40。那么用户向db1的table1中存储一新的值：Key-Value，该值对应的分区是：String slice＝String.valueOf(Math.abs(Key.hashCode())/40)。假设计算的结果为23。如果完整的分区键名为db1_table1_p1，则新的分区名为db1_table1_p1_23。

在分区的基础上进一步把数据“切”分成片。当切片数大于节点数时，切片就会根据TwemProxy的特性被均匀分布到不同的节点上。原则上切片数越多，数据存储粒度越小，数据分布就越均匀，从而实现数据在内存集群数据节点上的均匀分布，进而充分利用内存集群的存储容量。但切片数据也没必要过大，一般保持在节点数的N(N≤10)倍即可。

下面结合图5描述本发明一个另实施例的对原始一级键K1的表分区段进行切分得到分片号方法。

图5示出本发明对原始一级键K1的表分区段进行切分得到分片号的另一个实施例的示意图。如图5所示，对原始一级键K1的表分区段进行切分得到分片号的另一种具体实现方法包括：

步骤S502，对原始一级键K1和二级键K2进行md5运算；

步骤S504，取md5运算所得摘要值的后n位作为分片号，n位所能表示的最大数值不大于计划分片数M。

通过对原始一级键K1和二级键K2进行md5运算获取分片号，同样可以使得数据存储粒度越小，数据分布就越均匀，从而实现数据在内存集群数据节点上的均匀分布，进而充分利用内存集群的存储容量。与图4所示的实施例相比，md5算法可以根据原始一级键K1和二级键K2计算出结果为唯一值的分片号，但是md5算法对CPU的占用较高，在大的并发压力下会影响性能。

此外，定制对象DO可以通过MAP的形式存储。

下面结合图6描述本发明一个实施例的内存集群的存储均衡装置。

图6示出本发明内存集群的存储均衡装置的一个实施例的示意图。如图6所示，该实施例的内存集群的存储均衡装置60包括：

切分模块602，用于对原始一级键K1的表分区段进行切分得到分片号。

均衡一级键生成模块604，用于根据原始一级键K1、分片号生成均衡一级键K1’。

键值数据存储模块606，用于采用(K1’，DO)的数据存储形式存储键值数据。

其中，原始一级键K1为定制对象DO的原始逻辑键，所述原始一级键K1由数据库段、数据表段、表分区段组成，均衡一级键K1’为定制对象DO的均衡逻辑键。

在一个实施例中，定制对象DO中存储(K2，V)，二级键K2为定制对象DO的数据键，V为定制对象DO的数据值；

切分模块602用于：对原始一级键K1和二级键K2进行哈希运算；将哈希运算所得哈希值对计划分片数M进行取余运算；将取余运算的结果作为分片号。

在另一个实施例中，切分模块602可以用于：对原始一级键K1和二级键K2进行md5运算；取md5运算所得摘要值的后n位作为分片号，n位所能表示的最大数值不大于计划分片数M。

内存集群的存储均衡装置60还可以包括：

计划分片数确定模块608，用于根据用户存储的节点数确定所述计划分片数M，所述计划分片数M为节点数的N倍，其中N为不大于10的自然数。

下面结合图7描述本发明一个实施例的键值数据存储模块。

图7示出本发明键值数据存储模块的一个实施例的示意图。如图7所示，该实施例的键值数据存储模块606包括定制对象存储单元6062，用于以MAP的形式存储定制对象DO。

本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成，也可以通过程序来指令相关的硬件完成，所述的程序可以存储于一种计算机可读存储介质中，上述提到的存储介质可以是只读存储器，磁盘或光盘等。

以上所述仅为本发明的较佳实施例，并不用以限制本发明，凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种内存集群的存储均衡方法，包括：

对原始一级键K1的表分区段进行切分得到分片号；

根据原始一级键K1、分片号生成均衡一级键K1’；

采用(K1’，DO)的数据存储形式存储键值数据；

其中，原始一级键K1为定制对象DO的原始逻辑键，所述原始一级键K1由数据库段、数据表段、表分区段组成，均衡一级键K1’为定制对象DO的均衡逻辑键；定制对象DO中存储(K2，V)，二级键K2为定制对象DO的数据键，V为定制对象DO的数据值；

所述对原始一级键K1的表分区段进行切分得到分片号包括：

对原始一级键K1和二级键K2进行哈希运算；将哈希运算所得哈希值对计划分片数M进行取余运算；将取余运算的结果作为分片号；

或者，

对原始一级键K1和二级键K2进行md5运算；取md5运算所得摘要值的后n位作为分片号，n位所能表示的最大数值不大于计划分片数M。

2.根据权利要求1所述的方法，其特征在于，还包括：

根据用户存储的节点数确定所述计划分片数M，所述计划分片数M为节点数的N倍，其中N为不大于10的自然数。

3.根据权利要求1所述的方法，其特征在于，其中，所述定制对象DO以MAP的形式存储。

4.一种内存集群的存储均衡装置，包括：

切分模块，用于对原始一级键K1的表分区段进行切分得到分片号；

均衡一级键生成模块，用于根据原始一级键K1、分片号生成均衡一级键K1’；

键值数据存储模块，用于采用(K1’，DO)的数据存储形式存储键值数据；

其中，原始一级键K1为定制对象DO的原始逻辑键，所述原始一级键K1由数据库段、数据表段、表分区段组成，均衡一级键K1’为定制对象DO的均衡逻辑键；定制对象DO中存储(K2，V)，二级键K2为定制对象DO的数据键，V为定制对象DO的数据值；所述切分模块用于：对原始一级键K1和二级键K2进行哈希运算；将哈希运算所得哈希值对计划分片数M进行取余运算；将取余运算的结果作为分片号；或者，所述切分模块用于：对原始一级键K1和二级键K2进行md5运算；取md5运算所得摘要值的后n位作为分片号，n位所能表示的最大数值不大于计划分片数M。

5.根据权利要求4所述的装置，其特征在于，还包括：

计划分片数确定模块，用于根据用户存储的节点数确定所述计划分片数M，所述计划分片数M为节点数的N倍，其中N为不大于10的自然数。

6.根据权利要求4所述的装置，其特征在于，键值数据存储模块还包括定制对象存储单元，用于以MAP的形式存储定制对象DO。