CN113703685B - 一种数据存储方法、装置、设备及介质 - Google Patents

一种数据存储方法、装置、设备及介质 Download PDF

Info

Publication number
CN113703685B
CN113703685B CN202111012344.0A CN202111012344A CN113703685B CN 113703685 B CN113703685 B CN 113703685B CN 202111012344 A CN202111012344 A CN 202111012344A CN 113703685 B CN113703685 B CN 113703685B
Authority
CN
China
Prior art keywords
storage
preset
level
hierarchy
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202111012344.0A
Other languages
English (en)
Other versions
CN113703685A (zh
Inventor
余利华
蒋鸿翔
范欣欣
祝江华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Netease Hangzhou Network Co Ltd
Original Assignee
Netease Hangzhou Network Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Netease Hangzhou Network Co Ltd filed Critical Netease Hangzhou Network Co Ltd
Priority to CN202111012344.0A priority Critical patent/CN113703685B/zh
Publication of CN113703685A publication Critical patent/CN113703685A/zh
Application granted granted Critical
Publication of CN113703685B publication Critical patent/CN113703685B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0602Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
    • G06F3/061Improving I/O performance
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/18File system types
    • G06F16/182Distributed file systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0629Configuration or reconfiguration of storage systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0668Interfaces specially adapted for storage systems adopting a particular infrastructure
    • G06F3/067Distributed or networked storage systems, e.g. storage area networks [SAN], network attached storage [NAS]
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本公开涉及了一种数据存储方法、装置、设备及介质。由于任一存储层级对应的利用率是根据从属于该存储层级的叶子存储层级所包含的各存储节点的存储空间的利用率确定的,根据存储层级对应的利用率,可监控从属于该存储层级的叶子存储层级所包含的各存储节点的存储空间的使用情况,方便对各叶子存储层级下所包含的存储节点的存储空间进行管控。基于所确定的目标存储层级及其中的各个存储节点,实现从所有存储节点中快速确定比较适合存储目标数据的部分存储节点,再从位于目标存储层级下的各存储节点中快速确定目标存储节点,提高目标数据存储的效率。

Description

一种数据存储方法、装置、设备及介质
技术领域
本公开涉及数据存储技术领域,尤其涉及一种数据存储方法、装置、设备及介质。
背景技术
在当前比较常见的分布式存储***中,用于存储数据的存储节点通常会有很多,比如,分布式文件存储***(Hadoop Distributed File System,HDFS)中可以有多个集群,任一集群可以包含有数百,甚至数千台用于存储数据的存储节点,使得在确定用于存储某一数据的存储节点时,可供选择的存储节点有很多。对于集群来讲,数据分布以及数据如何存储到各个存储节点至关重要,如果数据存储分布不均匀,这将不利于对数据的管理。因此,如何将数据均匀分配到各个存储节点进行存储,以便于数据管理是近几年来人们日益关注的问题。
发明内容
本公开提供了一种数据存储方法、装置、设备及介质,用以解决现有存储目标数据的效率低的技术问题。
本公开提供了一种数据存储方法,所述方法包括:
响应于目标数据的数据存储指令,根据每个存储层级分别对应的利用率以及所允许的预设存储范围,确定用于存储所述目标数据的目标存储层级;其中,任一存储层级对应的利用率是根据从属于该存储层级的叶子存储层级所包含的各存储节点的存储空间的利用率确定,所述叶子存储层级之下不包含有除所述叶子存储层级之外的其它的存储层级;
根据所述目标存储层级所包含的各存储节点的存储空间的利用率,确定用于存储所述目标数据的目标存储节点;
将所述目标数据存储至所述目标存储节点。
在某些可能的实施方式中,所述根据每个存储层级分别对应的利用率以及所允许的预设存储范围,确定用于存储所述目标数据的目标存储层级,包括:
A、根据参考存储层级对应的利用率及预设存储范围,确定所述参考存储层级的空闲率;其中,所述参考存储层级为预先配置的根存储层级,或,所述每个存储层级中除所述根存储层级之外的至少一个存储层级;所述根存储层级不从属于除所述根存储层级之外的其它的存储层级;
B、确定所述参考存储层级的数量是否大于1;
C、若确定所述数量不大于1,则判断所述参考存储层级之下是否包含有除所述参考存储层级之外的其它的存储层级,若包含,执行F,若不包含,执行H;
D、若确定所述数量大于1,则确定每个所述参考存储层级分别对应的空闲率中的最大值,获取所述最大值对应的参考存储层级,判断该参考存储层级是否包含有除该参考存储层级之外的其它的存储层级,若包含,执行E,若不包含,执行G;
E、根据该参考存储层级之下包含的除该参考存储层级之外的其它的存储层级,对每个所述参考存储层级进行更新,执行步骤A;
F、根据所述参考存储层级之下包含的除所述参考存储层级之外的其它的存储层级,对所述参考存储层级进行更新,执行步骤A;
G、将该参考存储层级确定为所述目标存储层级;
H、将所述参考存储层级确定为所述目标存储层级。
在某些可能的实施方式中,所述方法还包括:
若确定所述参考存储层级的空闲率不大于预设的第一阈值,则按照预设的通知方式,将新增存储节点的提醒消息发送至预设管理设备。
在某些可能的实施方式中,确定所述叶子存储层级所包含的各存储节点,包括:
获取每个所述存储节点的存储空间分别对应的预设最大存储率;
将预设最大存储率在所述叶子存储层级对应的预设存储范围内的存储节点,确定为所述叶子存储层级所包含的各存储节点。
在某些可能的实施方式中,所述方法还包括:
接收所述存储节点在启动读写业务时发送的同步信息;
根据所述同步信息中携带的预设最大存储率,对所述存储节点对应的预设最大存储率进行更新。
在某些可能的实施方式中,所述存储节点对应的预设最大存储率是根据所述存储节点的读写速率确定的,读写速率越快的存储节点所对应的预设最大存储率越大。
在某些可能的实施方式中,所述存储节点包括固态硬盘SSD、混合硬盘HHD以及机械硬盘HDD中的至少一种。
在某些可能的实施方式中,所述SSD对应的预设最大存储率高于所述HHD对应的预设最大存储率;
所述HHD对应的预设最大存储率高于所述HDD对应的预设最大存储率。
在某些可能的实施方式中,所述根据所述目标存储层级所包含的各存储节点的存储空间的利用率,确定用于存储所述目标数据的目标存储节点,包括:
根据所述各存储节点分别对应的利用率和预设最大存储率,确定所述各存储节点分别对应的空闲率;
将所述各存储节点中,所述空闲率满足预设的存储条件的存储节点确定为所述目标存储节点。
在某些可能的实施方式中,确定所述空闲率满足预设的存储条件包括:
确定每个所述空闲率中的最大值满足预设的存储条件;和/或
确定每个所述空闲率中的任一目标空闲率满足预设的存储条件;其中,所述目标空闲率大于预设的第二阈值。
在某些可能的实施方式中,所述方法还包括:
若确定所述目标存储节点存在故障,则将所述目标存储节点在预设时间段内标记为不可用,并重新确定用于存储所述目标数据的目标存储节点。
本公开提供了一种数据处理装置,所述装置包括:
接收单元,用于接收目标数据的数据存储指令;
处理单元,用于响应于所述数据存储指令,根据每个存储层级分别对应的利用率以及所允许的预设存储范围,确定用于存储所述目标数据的目标存储层级;其中,任一存储层级对应的利用率是根据从属于该存储层级的叶子存储层级所包含的各存储节点的存储空间的利用率确定,所述叶子存储层级之下不包含有除所述叶子存储层级之外的其它的存储层级;根据所述目标存储层级所包含的各存储节点的存储空间的利用率,确定用于存储所述目标数据的目标存储节点;
存储单元,用于将所述目标数据存储至所述目标存储节点。
在某些可能的实施方式中,所述处理单元,具体用于以下步骤:
A、根据参考存储层级对应的利用率及预设存储范围,确定所述参考存储层级的空闲率;其中,所述参考存储层级为预先配置的根存储层级,或,所述每个存储层级中除所述根存储层级之外的至少一个存储层级;所述根存储层级不从属于除所述根存储层级之外的其它的存储层级;
B、确定所述参考存储层级的数量是否大于1;
C、若确定所述数量不大于1,则判断所述参考存储层级之下是否包含有除所述参考存储层级之外的其它的存储层级,若包含,执行F,若不包含,执行H;
D、若确定所述数量大于1,则确定每个所述参考存储层级分别对应的空闲率中的最大值,获取所述最大值对应的参考存储层级,判断该参考存储层级是否包含有除该参考存储层级之外的其它的存储层级,若包含,执行E,若不包含,执行G;
E、根据该参考存储层级之下包含的除该参考存储层级之外的其它的存储层级,对每个所述参考存储层级进行更新,执行步骤A;
F、根据所述参考存储层级之下包含的除所述参考存储层级之外的其它的存储层级,对所述参考存储层级进行更新,执行步骤A;
G、将该参考存储层级确定为所述目标存储层级;
H、将所述参考存储层级确定为所述目标存储层级。
在某些可能的实施方式中,所述装置还包括:提醒单元;
所述提醒单元,用于若确定所述参考存储层级的空闲率不大于预设的第一阈值,则按照预设的通知方式,将新增存储节点的提醒消息发送至预设管理设备。
在某些可能的实施方式中,所述装置还包括:预处理单元;
所述预处理单元,用于获取每个所述存储节点的存储空间分别对应的预设最大存储率;将预设最大存储率在所述叶子存储层级对应的预设存储范围内的存储节点,确定为所述叶子存储层级所包含的各存储节点。
在某些可能的实施方式中,所述接收单元,还用于接收所述存储节点在启动读写业务时发送的同步信息;
所述装置还包括:更新单元;
所述更新单元,用于根据所述同步信息中携带的预设最大存储率,对所述存储节点对应的预设最大存储率进行更新。
在某些可能的实施方式中,所述处理单元,具体用于根据所述各存储节点分别对应的利用率和预设最大存储率,确定所述各存储节点分别对应的空闲率;将所述各存储节点中,所述空闲率满足预设的存储条件的存储节点确定为所述目标存储节点。
在某些可能的实施方式中,所述处理单元,具体用于通过如下方式确定所述空闲率满足预设的存储条件:
确定每个所述空闲率中的最大值满足预设的存储条件;和/或
确定每个所述空闲率中的任一目标空闲率满足预设的存储条件;其中,所述目标空闲率大于预设的第二阈值。
在某些可能的实施方式中,所述处理单元,还用于若确定所述目标存储节点存在故障,则将所述目标存储节点在预设时间段内标记为不可用,并重新确定用于存储所述目标数据的目标存储节点。
本公开提供了一种电子设备,所述电子设备至少包括处理器和存储器,所述处理器用于执行存储器中存储的计算机程序时实现如上述中任一所述数据存储方法的步骤。
本公开提供了一种计算机可读存储介质,其存储有计算机程序,所述计算机程序被处理器执行时实现如上述中任一所述数据存储方法的步骤。
在数据存储过程中,接收到目标数据的数据存储指令后,可以根据每个存储层级分别对应的利用率以及所允许的预设存储范围,确定适合于保存目标数据的目标存储层级。然后根据位于目标存储层级的各存储节点的存储空间的利用率,确定用于存储目标数据的目标存储节点。由于任一存储层级对应的利用率是根据从属于该存储层级的叶子存储层级所包含的各存储节点的存储空间的利用率确定的,根据存储层级对应的利用率,不仅可以监控从属于该存储层级的叶子存储层级所包含的各存储节点的存储空间的使用情况,方便对各叶子存储层级下所包含的存储节点的存储空间进行管控,还有利于在数据存储过程中,根据每个存储层级分别对应的利用率以及所允许的预设存储范围,快速且准确地确定出适合保存目标存储层级。基于所确定的目标存储层级以及其中的各个存储节点,能够实现先从所有存储节点中快速确定比较适合存储目标数据的部分存储节点,然后再从位于目标存储层级下的多个存储节点中确定目标存储节点,从而无需从所有存储节点中确定目标存储节点,大大减少了确定目标存储节点所需的工作量,有利于快速找到适合保存目标数据的存储节点,而提高目标数据存储的效率。
附图说明
此处所说明的附图用来提供对本公开的进一步理解,构成本公开的一部分,本公开的示意性实施例及其说明用于解释本公开,并不构成对本公开的不当限定。在附图中:
图1为本公开实施例提供的一种数据存储过程示意图;
图2为本公开实施例提供的一种多叉树的结构示意图;
图3为本公开实施例提供的一种网格图的结构示意图;
图4为本公开实施例提供的具体的数据存储流程的示意图;
图5为本公开实施例提供的一种数据存储装置的结构示意图;
图6为本公开实施例提供的一种电子设备结构示意图。
具体实施方式
下面将结合附图对本公开作进一步地详细描述,显然,所描述的实施例仅仅是本公开一部分实施例,而不是全部的实施例。基于本公开中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本公开保护的范围。
本领域技术人员知道,本公开的实施方式可以实现为一种***、装置、设备、方法或计算机程序产品。因此,本公开可以具体实现为以下形式,即:完全的硬件、完全的软件(包括固件、驻留软件、微代码等),或者硬件和软件结合的形式。
在本文中,需要理解的是,附图中的任何元素数量均用于示例而非限制,以及任何命名都仅用于区分,而不具有任何限制含义。
为了方便理解,下面对本公开实施例中涉及的部分概念进行解释:
主机名称(Hostname),也可称为节点名称:用于标识某一台确定存在的机器,一个机器也可以理解为是一个节点。
主机IP(Host IP):根据该Host IP,可以访问到该Host IP所对应的机器。
主节点(Master):具有管理能力的存储节点,能够对其他存储节点进行管理,主节点会管理数据分配的哪个存储节点上,也会管理存储节点的健康周期等。每个存储节点代表一台机器或一个数据节点(比如,Hostname或Host IP)。
固态硬盘(Solid State Disk或Solid State Drive,SSD),又称固态驱动器:是用固态电子存储芯片阵列制成的硬盘。
混合硬盘(Hybrid Hard Disk,HHD):是混合硬盘磁性硬盘和闪存集成到一起的一种硬盘。
机械硬盘(Hard Disk Drive,HDD):就是传统普通硬盘,主要由盘片,磁头,盘片转轴及控制电机,磁头控制器,数据转换器,接口,缓存等几个部分组成。
节点域:在分布式***中,同一节点域中包含具有相同硬件特点的多个节点。比如,具有相同内核数量的存储节点、具有相同内存大小的存储节点、具有相同的硬盘类型(例如固态硬盘SSD)的存储节点。
索引:用于快速查找所需数据的目录,可以根据目录的指示,快速找到所需要的数据。
随着数字化的发展,为了满足大量数据的存储,通常采用的方式是将数据保存在用于存储数据的存储节点中。然而,对于数据存储的分布状况以及如何将数据存储到各个存储节点,具有十分重要的意义。如果数据存储分布不均匀,这将不利于对数据的管理。因此,如何将数据均匀分配到各个存储节点进行存储,以便于数据管理是近几年来人们日益关注的问题。
相关技术中,当接收到目标数据的数据存储指令之后,一般是先确定所有存储节点的存储空间分别对应的空闲存储容量,即所有存储节点的存储空间中还可以存储数据的存储空间的容量。根据所有存储节点的存储空间分别对应的空闲存储容量,从所述存储节点中,确定空闲存储容量大于预设存储阈值的候选存储节点。然后将空闲存储容量最大的候选存储节点确定为目标存储节点,以通过该目标存储节点保存目标数据。对于该种方法,由于所有存储节点的数量非常的多,在确定所有存储节点的存储空间分别对应的空闲存储容量之后,需要将所有存储节点的存储节点分别对应的空闲存储容量均与预设存储阈值进行比较,确定空闲存储容量大于预设存储阈值的候选存储节点,该过程非常的繁琐,耗费大量的时间和资源,降低确定目标存储节点的效率,进而降低目标数据存储的效率。
因此,为了解决现有存储目标数据的效率低的技术问题,本公开提供了一种数据存储方法、装置、设备及介质。在数据存储过程中,接收到目标数据的数据存储指令后,可以根据每个存储层级分别对应的利用率以及所允许的预设存储范围,确定适合于保存目标数据的目标存储层级。然后根据位于目标存储层级的各存储节点的存储空间的利用率,确定用于存储目标数据的目标存储节点。由于任一存储层级对应的利用率是根据从属于该存储层级的叶子存储层级所包含的各存储节点的存储空间的利用率确定的,根据存储层级对应的利用率,不仅可以监控从属于该存储层级的叶子存储层级所包含的各存储节点的存储空间的使用情况,方便对各叶子存储层级下所包含的存储节点的存储空间进行管控,还有利于在数据存储过程中,根据每个存储层级分别对应的利用率以及所允许的预设存储范围,快速且准确地确定出适合保存目标存储层级。基于所确定的目标存储层级以及其中的各个存储节点,能够实现先从所有存储节点中快速确定比较适合存储目标数据的部分存储节点,然后再从位于目标存储层级下的多个存储节点中确定目标存储节点,从而无需从所有存储节点中确定目标存储节点,大大减少了确定目标存储节点所需的工作量,有利于快速找到适合保存目标数据的存储节点,而提高目标数据存储的效率。
图1为本公开实施例提供的一种数据存储过程示意图,该过程包括:
S101:响应于目标数据的数据存储指令,根据每个存储层级分别对应的利用率以及所允许的预设存储范围,确定用于存储所述目标数据的目标存储层级;其中,任一存储层级对应的利用率是根据从属于该存储层级的叶子存储层级所包含的各存储节点的存储空间的利用率确定,所述叶子存储层级之下不包含有除所述叶子存储层级之外的其它的存储层级。
本公开提供的数据存储方法可应用于电子设备,该电子设备可以是服务器,也可以是智能设备,比如,手机、电脑、监控设备等。具体实施过程中,可以根据实际需求进行灵活设置,在此不做具体限定。
在一种可能的应用场景中,当某一客户端设备获取到目标数据并且需要存储该目标数据时,可以根据该目标数据,生成数据存储指令并发送至用于数据存储的电子设备。用于数据存储的电子设备接收到该目标数据的数据存储指令后,可以对该数据存储指令进行响应,以确定用于存储目标数据的目标存储节点。
为了方便且准确地确定用于存储目标数据的目标存储节点,在本公开中,预先配置多个存储层级分别对应的所允许的预设存储范围,每个预设存储范围是不同的。针对每个存储层级,可以从多个存储层级分别对应的预设存储范围中,确定与该存储层级对应的预设存储范围存在包含关系的预设存储范围,即从所有预设存储范围中,确定包含该存储层级对应的预设存储范围的预设存储范围,和/或,从所有预设存储范围中,确定被该存储层级对应的预设存储范围包含的预设存储范围,将该存在包含关系的预设存储范围所对应的存储层级,确定为与该存储层级存在从属关系的关联存储层级。针对至少一个关联存储层级,若该关联存储层级之下不包含有除该关联存储层级之外的其它的存储层级,则可以将该关联存储层级确定为从属于该存储层级的叶子存储层级;若该关联存储层级不从属于除该关联存储层级之外的其它的存储层级,则可以将该关联存储层级确定为根存储层级。
其中,任一存储层级对应的预设存储范围,用于指示从属于该存储层级的叶子存储层级所能包含的各个存储节点的存储空间分别对应的预设最大存储率,任一存储节点的存储空间对应的预设最大存储率是由该存储节点的存储空间的最大存储容量、与该存储节点的存储空间的总容量的比值确定的。该预设存储范围可以由百分比数值表示,也可以由小数表示。比如,以预设存储范围由百分比数值表示,存储层级X对应的预设存储范围是[60,90),从属于该存储层级X的叶子存储层级只包括存储层级Y为例,该预设存储范围[60,90)中的60,用于指示存储层级Y所包含的各存储节点的存储空间分别对应的预设最大存储率中,最小的预设最大存储率不小于60,该预设存储范围[60,90)中的90,用于指示存储层级Y所包含的各存储节点的存储空间分别对应的预设最大存储率中,最大的预设最大存储率小于90。
需要说明的是,该存储层级本身是与该存储层级存在特殊从属关系的存储层级,该存储层级本身从属于该存储层级,该存储层级之下也包含有该存储层级。
在一种可能的实施方式中,为了快速且准确地确定与该存储层级存在从属关系的关联存储层级,在本公开中,可以根据每个存储层级分别对应的预设存储范围,利用预设的多叉树算法(比如,二叉树算法),生成该多个预设存储范围对应的多叉树图。对于该多叉树图中的每个预设存储范围分别对应的节点,根据该预设存储范围对应的节点在多叉树图中的位置、以及该预设存储范围对应的节点在该多叉树图中与其它预设存储范围对应的节点之间的连接关系,可以快速且准确地确定多个预设存储范围之间的包含关系,进而根据多个预设存储范围之间的包含关系以及多个预设存储范围分别对应的存储层级,快速且准确地确定多个存储层级之间的从属关系,确定每个存储层级分别对应的关联存储层级。其中,该多叉树图可以理解为是用于快速确定目标存储层级和/或目标存储节点的索引。
例如,图2为本公开实施例提供的一种多叉树的结构示意图。图2所示,预设存储范围[10,90)对应存储层级A,预设存储范围[10,45)对应存储层级B,预设存储范围[45,90)对应存储层级C,预设存储范围[10,30)对应存储层级D,预设存储范围[45,60)对应存储层级E,预设存储范围[60,90)对应存储层级F。根据每个预设存储范围,利用二叉树算法,生成图2所示的多叉树。以根据多叉树图,确定存储层级A对应的关联存储层级为例,根据该生成的多叉树,可以看出预设存储范围[10,45)对应的节点以及[45,90)对应的节点,均与预设存储范围[10,90)对应的节点连接。由于预设存储范围[10,45)以及[45,90)均被该预设存储范围[10,90)包含,则预设存储范围[10,45)以及[45,90)分别对应的存储层级B和C,均从属于该预设存储范围[10,90)对应的存储层级A,即存储层级A、B、C均为与存储层级A存在从属关系的关联存储层级。
以根据多叉树图,确定存储层级B对应的关联存储层级为例,根据该生成的多叉树,确定预设存储范围[10,90)对应的节点以及[10,30)对应的节点均与该预设存储范围[10,45)对应的节点连接。由于该预设存储范围[10,45)被预设存储范围[10,90)包含,则该预设存储范围[10,45)对应的存储层级B从属于该预设存储范围[10,90)对应的存储层级A。由于该预设存储范围[10,45)包含该预设存储范围[10,30),则该预设存储范围[10,30)对应的存储层级D从属于该预设存储范围[10,45)对应的存储层级B。因此,存储层级A、B和D均为与存储层级B存在从属关系的关联存储层级。
以根据多叉树图,确定存储层级E对应的关联存储层级为例,根据该生成的多叉树,确定预设存储范围[45,90)对应的节点与该预设存储范围[45,60)对应的节点连接。由于该预设存储范围[45,90)包含该预设存储范围[45,60),则该预设存储范围[45,60)对应的存储层级E,从属于该预设存储范围[45,90)对应的存储层级C。因此,存储层级C和E均为与存储层级E存在从属关系的关联存储层级。
仍以上述为例,根据图2所示的多叉树,确定并不存在除该预设存储范围[10,90)之外的,包含该预设存储范围[10,90)的其它预设存储范围,即该预设存储范围[10,90)不从属于除该预设存储范围[10,90)之外的其它预设存储范围,则可以将该预设存储范围[10,90)对应的存储层级A确定为根存储层级;根据图2所示的多叉树,确定预设存储范围[10,30)之下不包含除该预设存储范围[10,30)之外的其它预设存储范围,则可以将该预设存储范围[10,30)对应的存储层级D确定为叶子存储层级;根据图2所示的多叉树,确定预设存储范围[45,60)之下不包含除该预设存储范围[45,60)之外的其它预设存储范围,则可以将该预设存储范围[45,60)对应的存储层级E确定为叶子存储层级;根据图2所示的多叉树,确定预设存储范围[60,90)之下不包含除该预设存储范围[60,90)之外的其它预设存储范围,则可以将该预设存储范围[60,90)对应的存储层级F确定为叶子存储层级。
需要说明的是,为了方便对所有存储节点进行管理,在多个存储层级中,只有叶子存储层级之下才会包含有存储节点。
在一种可能的实施方式中,所述存储节点包括固态硬盘SSD、混合硬盘HHD以及机械硬盘HDD中的至少一种。
需要说明的是,对于任一存储层级,该存储层级在多个存储层级中,可以从属于除该存储层级之外的其它的存储层级,也可以包含除该存储层级之外的其它的存储层级,还可以从属于除该存储层级之外的其它的存储层级,并包含除该存储层级之外的其它的存储层级。
由于可以根据每个存储层级分别对应的预设存储范围,利用预设的多叉树算法(比如,二叉树算法),生成该多个预设存储范围对应的多叉树图。根据该生成的多叉树图,可以快速且准确地确定每个存储层级之间的从属关系,并准确地确定从属于不同存储层级的叶子存储层级。然后根据每个叶子存储层级下所包含的各存储节点的存储空间的利用率以及每个存储层级之间的从属关系,准确地确定每个存储层级分别对应的利用率,进而方便监控每个叶子存储层级下所包含的各存储节点的存储空间的使用情况,并对各存储节点的存储空间进行管理,且有利于后续在数据存储过程中,根据每个存储层级分别对应的利用率以及所允许的预设存储范围,快速且准确地确定适合于保存目标数据的目标存储层级。
在一种可能的实施方式中,可以先获取各个存储层级分别对应的预设存储范围。然后针对各存储层级,确定该存储层级所对应的预设存储范围与其他存储层级所对应的预设存储范围之间的包含关系;根据该存储层级所对应的预设存储范围与其他存储层级所对应的预设存储范围之间的包含关系,确定该存储层级所对应的等级。其中,对于任一存储层级而言,如果该存储层级对应的预设存储范围能够被M个除该存储层级之外的其它存储层级的预设存储范围所包含,则M越大说明该存储层级的等级越低,M越小说明该存储层级的等级越高。该M为大于等于0的整数。如果至少两个存储层级分别对应的M相同,即存在至少两个存储层级分别对应的预设存储范围,被相同数量的其它存储层级的预设存储范围所包含,则该至少两个存储层级分别对应的等级是相同的。其中,同一等级的各存储层级分别对应的预设存储范围是互不重叠的。
例如,仍以图2为例,预设存储范围[10,90)对应存储层级A,预设存储范围[10,45)对应存储层级B,预设存储范围[45,90)对应存储层级C,预设存储范围[10,30)对应存储层级D,预设存储范围[45,60)对应存储层级E,预设存储范围[60,90)对应存储层级F。确定只有预设存储范围[10,90)包含该存储层级A对应的预设存储范围[10,90),存储层级A对应的M为0。确定预设存储范围[10,90)以及预设存储范围[10,45)均包含该存储层级B对应的预设存储范围[10,45),该存储层级B对应的M为1。确定预设存储范围[10,90)以及预设存储范围[45,90)均包含该存储层级C对应的预设存储范围[45,90),该存储层级C对应的M为1。确定预设存储范围[10,90)、预设存储范围[10,45)以及预设存储范围[10,30),均包含该存储层级D对应的预设存储范围[10,30),该存储层级D对应的M为2。确定预设存储范围[10,90)、预设存储范围[45,90)以及预设存储范围[45,60),均包含该存储层级E对应的预设存储范围[45,60),该存储层级E对应的M为2。确定预设存储范围[10,90)、预设存储范围[45,90)以及预设存储范围[60,90),均包含该存储层级F对应的预设存储范围[60,90),该存储层级F对应的M为2。根据每个存储层级分别对应的M,确定存储层级A的等级最高,该等级为1;存储层级B和存储层级C的等级均为2,低于存储层级A的等级,且存储层级B对应的预设存储范围[10,45)和存储层级C对应的预设存储范围[45,90)是互不重叠的;存储层级D、存储层级E和存储层级F的等级均为3,低于存储层级B和存储层级C的等级,且存储层级D对应的预设存储范围[10,30)、存储层级E对应的预设存储范围[45,60)和存储层级F对应的预设存储范围[60,90)是互不重叠的。
基于上述的实施例确定了每个存储层级分别对应的等级之后,在后续数据存储过程中,可以按照存储层级对应的等级从高到底的顺序,从多个存储层级中确定目标存储层级。在确定目标存储层级的过程中,当根据某一等级下的至少一个存储层级分别对应的利用率以及所允许的预设存储范围,确定从属于该等级的某一存储层级的叶子存储层级更适合存储目标数据时,则不继续确定该等级下除该存储层级之外的其它的存储层级之下所包含的存储层级是否适合存储目标数据。
由于根据每个存储层级所从属的存储层级的数量,确定每个存储层级分别对应的等级,以根据每个存储层级分别对应的等级,将多个存储层级进行分层,方便对多个存储层级进行层次化的管理。并且后续在数据存储过程中,当根据某一等级下的至少一个存储层级分别对应的利用率以及所允许的预设存储范围,确定从属于该等级的某一存储层级的叶子存储层级更适合存储目标数据时,则不继续确定该等级下除该存储层级之外的其它的存储层级之下所包含的存储层级是否适合存储目标数据,实现了快速且有条理地确定目标存储层级,避免根据所有存储层级分别对应的利用率以及所允许的预设存储范围,确定目标存储层级所耗费的大量工作量。
用于数据存储的电子设备可以接收到每个存储节点分别对应的存储空间的利用率。根据每个存储节点分别对应的存储空间的利用率以及每个叶子存储层级所包含的各个存储节点,可以确定每个叶子存储层级分别对应的利用率。根据每个存储层级之下所包含有的叶子存储层级以及每个叶子存储层级分别对应的利用率,确定每个存储层级分别对应的利用率。可以理解的是,任一存储层级对应的利用率是根据从属于该存储层级的叶子存储层级所包含的各存储节点的存储空间的利用率确定的。其中,用于数据存储的电子设备可以实时接收到每个存储节点分别对应的存储空间的利用率,可以按照预设的周期获取每个存储节点分别对应的存储空间的利用率,也可以是在接收到目标数据的数据存储指令后,获取每个存储节点分别对应的存储空间的利用率。具体实施过程中,可以根据实际需求进行灵活设置,在此不做具体限定。
在一种可能的实施方式中,任一存储层级对应的利用率可以是根据从属于该存储层级的叶子存储层级所包含的各存储节点分别对应的利用率中的最小值确定的。
例如,基于上述对图2的介绍,并结合图2所示的各个存储层级以及各存储层级分别对应的预设存储范围为例,确定叶子存储层级分别为图2所示的存储层级D、E和F,存储层级D从属于存储层级B和存储层级A,存储层级E和存储层级F从属于存储层级C和存储层级A。假设存在存储节点1、2、3、4、5、6、7以及8,预先根据每个存储节点分别对应的预设最大存储率,确定存储节点1和2位于存储层级D,存储节点3-5位于存储层级E,存储节点6-8位于存储层级F。假设获取到存储节点1、2、3、4、5、6、7以及8的存储空间的利用率分别为10%、20%、30%、40%、50%、60%、70%和80%,则可以根据存储节点1和存储节点2分别对应的存储空间的利用率中的最小值,确定存储层级D所对应的利用率为10%;根据存储节点3-5分别对应的存储空间的利用率中的最小值,确定存储层级E所对应的利用率为30%;根据存储节点6-8分别对应的存储空间的利用率中的最小值,确定存储层级F所对应的利用率为60%;根据从属于存储层级B的叶子存储层级对应的利用率,即根据存储层级D对应的利用率10%,确定存储层级B所对应的利用率为10%;根据从属于存储层级C的叶子存储层级分别对应的利用率中的最小值,即根据存储层级E对应的利用率30%和存储层级F对应的利用率60%中的最小值,确定存储层级C所对应的利用率为30%;根据从属于存储层级A的叶子存储层级分别对应的利用率中的最小值,即根据存储层级D对应的利用率10%、存储层级E对应的利用率30%和存储层级F对应的利用率60%中的最小值,确定存储层级A所对应的利用率为10%。
基于上述的实施例确定了每个存储层级分别对应的利用率之后,即可根据每个存储层级分别对应的利用率以及所允许的预设存储范围,确定用于存储数据的目标存储层级。
在一种可能的实施方式中,当用于数据存储的电子设备获取到每个存储层级分别对应的利用率以及所允许的预设存储范围之后,可以对任一参考存储层级执行以下步骤,以确定用于存储所述目标数据的目标存储层级,包括:
A、根据参考存储层级对应的利用率及预设存储范围,确定所述参考存储层级的空闲率。其中,所述参考存储层级为预先配置的根存储层级,或,所述每个存储层级中除所述根存储层级之外的至少一个存储层级;所述根存储层级不从属于除所述根存储层级之外的其它的存储层级。
在一种可能的实施方式中,用于数据存储的电子设备可以从根存储层级开始,将该根存储层级确定为参考存储层级。然后根据该参考存储层级对应的利用率以及预设存储范围,确定该参考存储层级的空闲率。后续基于该空闲率,进行相应的处理,从预先配置的多个存储层级中,确定除该根存储层级之外的至少一个存储层级为参考存储层级。
例如,结合图2所示的每个存储层级以及每个存储层级分别对应的预设存储范围,确定该图2中的存储层级A不从属于除该存储层级之外的其它的存储层级,该存储层级A是根存储层级。可以从该存储层级A开始,将该存储层级A确定为参考存储层级A。然后根据该参考存储层级A对应的利用率以及预设存储范围,确定该参考存储层级A的空闲率。
例如,若确定参考存储层级为图2所示的存储层级B和存储层级C,则根据该参考存储层级B对应的利用率以及预设存储范围,确定该参考存储层级B的空闲率。并根据该参考存储层级C对应的利用率以及预设存储范围,确定该参考存储层级C的空闲率。
再例如,若确定参考存储层级为图2所示的存储层级E和存储层级F,则根据该参考存储层级E对应的利用率以及预设存储范围,确定该参考存储层级E的空闲率。并根据该参考存储层级F对应的利用率以及预设存储范围,确定该参考存储层级F的空闲率。
其中,可以将该参考存储层级对应的预设存储范围内的任一数值与该参考存储层级对应的利用率之间的差值,确定为该参考存储层级的空闲率。该预设存储范围内的任一数值可以是该预设存储范围内的最大值、最小值、中值等特殊值,也可以是该预设存储范围内的除这些特殊值之外的任一数值。具体实施过程中,可以根据实际需求进行灵活设置,在此不做具体赘述。
B、确定所述参考存储层级的数量是否大于1。
基于上述的实施例可以确定的是,当前确定的参考存储层级可能是1个,也可能是多个。如果参考存储层级的数量不大于1,则不需要将该参考存储层级对应的空闲率与其它的空闲率进行比较,只能对该参考存储层级进行后续的处理。如果参考存储层级的数量大于1,则需要从确定的多个参考存储层级进行筛选,以方便根据筛选后的参考存储层级,确定用于存储目标数据的目标存储层级。
C、若确定所述数量不大于1,则判断所述参考存储层级之下是否包含有除所述参考存储层级之外的其它的存储层级,若包含,执行F,若不包含,执行H。
在本公开中,用于存储目标数据的目标存储层级一般为叶子存储层级,即目标存储层级之下是不包含有除该目标存储层级之外的其它的存储层级的。因此,当确定该参考存储层级的数量不大于1后,可以判断该参考存储层级是否可能为叶子存储层级,即确定该参考存储层级之下是否包含有除该参考存储层级之外的其它的存储层级。
D、若确定所述数量大于1,则确定每个所述参考存储层级分别对应的空闲率中的最大值,获取所述最大值对应的参考存储层级,判断该参考存储层级是否包含有除该参考存储层级之外的其它的存储层级,若包含,执行E,若不包含,执行G。
为了实现合理且均匀地存储数据,在本公开中,通常会选择空闲率较高的存储层级作为用于存储目标数据的目标存储层级,以避免总是将目标数据保存在某一存储节点所导致的数据的存储极度不平衡的情况的发生,进而避免该经常被用于存储数据的存储节点被过热访问,降低该存储节点在存储数据以及读取数据过程中的压力。因此,当基于上述实施例确定了参考存储层级的数量大于1,则从每个参考存储层级分别对应的空闲率中确定最大值,确定该最大值对应的参考存储层级,然后对该参考存储层级进行后续的处理。
基于上述相同的理由,当确定了最大值所对应的参考存储层级后,可以判断该参考存储层级是否可能为叶子存储层级,即确定该参考存储层级之下是否包含有除该参考存储层级之外的其它的存储层级。
在一种可能的实施方式中,如果每个参考存储层级分别对应的空闲率相同,比如,如图2所示的存储层级B和存储层级C分别对应的空闲率均为50%,则可以从每个参考存储层级中,随机选择一个存储层级,将该存储层级确定为最大值所对应的存储层级。确定该存储层级之下是否包含除该存储层级之外的其它的存储层级。
E、根据该参考存储层级之下包含的除该参考存储层级之外的其它的存储层级,对每个所述参考存储层级进行更新,执行步骤A。
在本公开中,如果确定该参考存储层级之下包含有除该参考存储层级之外的其它的存储层级,说明该参考存储层级不是叶子存储层级,该参考存储层级不是用于存储目标数据的目标存储层级,需要获取该参考存储层级之下包含的除该参考存储层级之外的其它的存储层级,根据每个其它的存储层级,对当前确定的参考存储层级进行更新,然后执行步骤A。
例如,以参考存储层级包括图2所示的存储层级B和存储层级C为例,假设基于上述的实施例确定该参考存储层级B对应的空闲率为60%,参考存储层级C对应的空闲率为50%,确定该参考存储层级的总数量为2,该数量2大于1,则确定参考存储层级B和参考存储层级C分别对应的空闲率中的最大值为60%,获取该60%的空闲率所对应的参考存储层级为参考存储层级B。确定该参考存储层级B之下是否包含有除该参考存储层级B之外的其它的存储层级。如图2所示,该参考存储层级B之下包含有除该参考存储层级B之外的其它的存储层级,该其它的存储层级为存储层级D。然后根据该存储层级D,对参考存储层级B和参考存储层级C进行更新,执行步骤A。
F、根据所述参考存储层级之下包含的除所述参考存储层级之外的其它的存储层级,对所述参考存储层级进行更新,执行步骤A。
同样的,如果确定该参考存储层级之下包含有除该参考存储层级之外的其它的存储层级,说明该参考存储层级不是叶子存储层级,该参考存储层级不是用于存储目标数据的目标存储层级,需要获取该参考存储层级之下包含的除该存储层级之外的其它的存储层级,根据每个其它的存储层级,对当前确定的参考存储层级进行更新,然后执行步骤A。
例如,以参考存储层级为图2所示的存储层级A为例,确定该参考存储层级A的空闲率之后,确定该参考存储层级A的数量为1,该数量不大于1,则确定该参考存储层级A之下是否包含有除该参考存储层级A之外的其它的存储层级。如图2所示,该参考存储层级A之下包含有除该参考存储层级A之外的其它的存储层级,分别为存储层级B和C。然后根据存储层级B和C,对该参考存储层级A进行更新,执行步骤A。
G、将该参考存储层级确定为所述目标存储层级。
在本公开中,如果确定该参考存储层级之下不包含有除该参考存储层级之外的其它的存储层级,说明该参考存储层级是叶子存储层级,则确定该参考存储层级是用于存储目标数据的目标存储层级。
例如,以参考存储层级包括图2所示的存储层级E和存储层级F为例,假设基于上述的实施例确定该参考存储层级E对应的空闲率为50%,参考存储层级F对应的空闲率为40%,确定该参考存储层级的总数量为2,该数量2大于1,则确定参考存储层级E和参考存储层级F分别对应的空闲率中的最大值为50%,获取该50%的空闲率所对应的参考存储层级为参考存储层级E。确定该参考存储层级E之下是否包含有除该参考存储层级E之外的其它的存储层级。如图2所示,该参考存储层级E之下不包含有除该参考存储层级E之外的其它的存储层级。将该参考存储层级E确定为目标存储层级。
H、将所述参考存储层级确定为所述目标存储层级。
同样的,如果确定该参考存储层级之下不包含有除该参考存储层级之外的其它的存储层级,说明该参考存储层级是叶子存储层级,则确定该参考存储层级是用于存储目标数据的目标存储层级。
例如,以参考存储层级为图2所示的存储层级D为例,确定该参考存储层级D的空闲率之后,确定该参考存储层级D的数量为1,该数量不大于1,则确定该参考存储层级D之下是否包含有除该参考存储层级D之外的其它的存储层级。如图2所示,该参考存储层级D之下不包含有除该参考存储层级D之外的其它的存储层级。将该参考存储层级D确定为目标存储层级。
在一种可能的实施方式中,在数据存储的过程中,可能出现各存储节点的存储空间的利用率均非常的高,导致各存储节点不适合再继续保存数据。基于此,预设有第一阈值。其中,该第一阈值用于指示参考存储层级的空闲率所能够达到的最低阈值。当基于上述实施例获取到参考存储层级的空闲率之后,可以将该参考存储层级的空闲率与预设的第一阈值进行比较。若确定该参考存储层级的空闲率大于预设的第一阈值,说明该参考存储层级的存储空间还可以继续存储数据,则可以继续根据该参考存储层级,确定用于存储目标数据的目标存储层级。若确定该参考存储层级的空闲率不大于预设的第一阈值,说明该参考存储层级的存储空间不可以继续存储数据,则可以按照预设的通知方式,将新增存储节点的提醒消息发送至预设管理设备,以通知相关的工作人员对已有的存储节点的存储空间进行扩容,或者是,增加新的存储节点用于存储数据。
需要说明的是,在设置第一阈值时,可以根据场景的不同,设置不同的值。如果希望尽可能利用存储节点的存储空间,则可以将该第一阈值设置的低一些。如果希望减少存储节点存储数据的压力,则可以将该第一阈值设置的高一些。具体实施过程中,可以根据实际需求进行灵活设置,在此不做具体限定。
S102:根据所述目标存储层级所包含的各存储节点的存储空间的利用率,确定用于存储所述目标数据的目标存储节点。
当基于上述实施例确定了目标存储层级之后,可以从该目标存储层级所包含的各存储节点中,快速且准确地确定用于存储目标数据的目标存储节点,无需根据所有存储节点的存储空间分别对应的利用率,确定用于存储目标数据的目标存储节点,节省了确定目标存储节点所耗费的资源,提高了确定目标存储节点的效率。
在本公开中,为了方便且准确地确定用于存储目标数据的目标存储节点,预先配置了每个存储节点的存储空间分别对应的预设最大存储率,例如,存储节点2对应的预设最大存储率为95%。其中,任一存储节点的存储空间对应的预设最大存储率的含义已在上述实施例中进行说明,在此不做赘述。对于每个存储节点,在获取到了该存储节点的存储空间对应的预设最大存储率之后,该存储节点可以根据该存储节点对应的预设最大存储率,生成相应的文件,并将该文件持久化到本地硬盘中,以便于该存储节点或用于数据存储的电子设备重启后,可以通过该文件,确定该存储节点的存储空间对应的预设最大存储率。
例如,某一存储节点在提供服务时,会先重启服务,重启后可以先读取保存有该存储节点对应的预设最大存储率的文件,通过解析该文件,确定该存储节点的存储空间对应的预设最大存储率,即该存储节点的存储空间对应的最多可以存储数据的容量。该存储节点获取到该预设最大存储率后,还会将携带有该预设最大存储率的通知消息发送至用于数据存储的电子设备(比如,主节点),以便于用于数据存储的电子设备可以根据每个存储节点分别对应的利用率以及预设最大存储率,确定用于存储目标数据的目标存储节点。
相关技术中,由于不同类型的存储节点的读写速率是不同的,但不同类型的存储节点的存储空间分别对应的预设最大存储率却一般是相同的,导致在数据存储过程中,如果只是根据每个存储节点所剩余的存储空间的大小,确定用于存储目标数据的目标存储节点的话,存储在读写速率快的存储节点的数据被读取的速度比较快,存储在读写速率慢的存储节点的数据被读取的速度比较慢,影响数据的读取效率,不便于数据管理。因此,为了方便数据管理,在配置每个存储节点的存储空间分别对应的预设最大存储率时,可以考虑每个存储节点的读写速率,即所述存储节点对应的预设最大存储率是根据所述存储节点的读写速率确定的,读写速率越快的存储节点所对应的预设最大存储率越大。
例如,一个集群中包含有3种类型的存储节点,存储节点分别为SSD、HHD和HDD。每种存储节点的读写速率是不一样的,一般SSD的读写速率要快于HHD的读写速率,而HHD的读写速率要快于HDD的读写速率。因此,在设置每个存储节点的存储空间分别对应的预设最大存储率时,可以设置SSD对应的预设最大存储率,在所有类型的存储节点分别对应的预设最大存储率中最大(比如80%),设置HHD对应的预设最大存储率小于SSD对应的预设最大存储率(比如40%),设置HDD对应的预设最大存储率小于HHD对应的预设最大存储率(比如10%)。
用于数据存储的电子设备在获取到存储节点发送的携带有预设最大存储率的通知消息后,可以根据每个存储节点的存储空间分别对应的预设最大存储率以及每个叶子存储层级分别对应的预设存储范围,确定每个叶子存储层级下所包含的各个存储节点。其中,由于不同叶子存储层级分别对应的预设存储范围是不同的,使得根据每个存储节点的存储空间分别对应的预设最大存储率以及每个叶子存储层级分别对应的预设存储范围,确定每个叶子存储层级下所包含的各个存储节点也是不同的。
例如,预设最大存储率以及预设存储范围均是由百分比值表示的。假设存在存储节点1、2、3、4、5、6、7以及8,存储节点1、2、3、4、5、6、7以及8的存储空间分别对应的预设最大存储率分别为10%、20%、25%、45%、50%、60%、70%和80%,叶子存储层级分别包括存储层级D、存储层级E以及存储层级F,存储层级D对应的预设存储范围为[10,30),存储层级E对应的预设存储范围为[45,60),以及存储层级F对应的预设存储范围为[60,90)。确定存储节点1的存储空间对应的预设最大存储率10%、存储节点2的存储空间对应的预设最大存储率20%、以及存储节点3的存储空间对应的预设最大存储率30%,均位于存储层级D对应的预设存储范围[10,30)内,确定该存储层级D所包含的各存储节点分别为存储节点1、2、3。确定存储节点4的存储空间对应的预设最大存储率45%、以及存储节点5的存储空间对应的预设最大存储率50%,均位于存储层级E对应的预设存储范围[45,60)内,确定该存储层级E所包含的各存储节点分别为存储节点4和5。确定存储节点6的存储空间对应的预设最大存储率60%、存储节点7的存储空间对应的预设最大存储率70%、以及存储节点8的存储空间对应的预设最大存储率80%,均位于存储层级F对应的预设存储范围[60,90)内,确定该存储层级F所包含的各存储节点分别为存储节点6、7、8。
在一种可能的实施方式中,如果每个存储节点分别对应的预设最大存储率,是根据存储节点的读写速率确定的,使得根据每个存储节点的存储空间分别对应的预设最大存储率以及每个叶子存储层级分别对应的预设存储范围,确定每个叶子存储层级下所包含的各个存储节点时,可能存在至少一个叶子存储层级下只包含一种类型的存储节点,从而可以实现按照存储节点的类型,对每个存储节点存储数据的情况进行分层次的管理,能更加规范地管理存储节点及待存储的数据,提升对不同类型的存储节点的有效管控和使用,实现针对性的对一些类型的存储节点进行保护,以避免该类型的存储节点遭受较热(高频次)访问。
比如,SSD的读写速率要快于HHD的读写速率,而HHD的读写速率要快于HDD的读写速率,根据不同类型的存储节点的读写速率,设置的SSD对应的预设最大存储率在所有类型的存储节点分别对应的预设最大存储率中最大,设置的HHD对应的预设最大存储率小于SSD对应的预设最大存储率,设置的HDD对应的预设最大存储率小于HHD对应的预设最大存储率。由于SSD、HHD、HDD分别对应的预设最大存储率不同,使得根据各存储节点分别对应的预设最大存储率以及各叶子存储层级分别对应的预设存储范围,确定各叶子存储层级分别包含的存储节点时,可能出现某一叶子存储层级所包含的存储节点均为SSD,另一叶子存储层级所包含的存储节点均为HHD,还有一个叶子存储层级所包含的存储节点均为HDD,即存在至少一个叶子存储层级下只包含一种类型的存储节点。
在一种可能的实施方式中,确定所述叶子存储层级所包含的各存储节点,包括:
获取每个所述存储节点的存储空间分别对应的预设最大存储率;
将预设最大存储率在所述叶子存储层级对应的预设存储范围内的存储节点,确定为所述叶子存储层级所包含的各存储节点。
针对每个叶子存储层级,在确定该叶子存储层级所包含的各存储节点时,可以确定每个存储节点的存储空间分别对应的预设最大存储率,是否位于该叶子存储层级所对应的预设存储范围内。将预设最大存储率在该叶子存储层级对应的预设存储范围内的存储节点,确定为该叶子存储层级所包含的各存储节点。由于不同叶子存储层级所包含的各存储节点是不同的,当确定某一存储节点归属于某一叶子存储层级后,该存储节点一定不再归属于除该叶子存储层级之外的其它的叶子存储层级。因此,当基于上述实施例确定了某一存储节点归属于某一叶子存储层级之后,则可以不再确定该存储节点是否归属于除该叶子存储层级之外的其它的叶子存储层级,以减少确定每个叶子存储层级所包含的各存储节点所耗费的资源。
在一种可能的实施方式中,可能存在修改某一存储节点的存储空间对应的预设最大存储率的情况,且在每次修改了该存储节点的存储空间对应的预设最大存储率之后,该存储节点一般会重启读写业务,并重新读取保存有预设最大存储率的文件,以获取修改后的预设最大存储率。存储节点读取到修改后的预设最大存储率后,可以根据该修改后的预设最大存储率,生成启动读写业务的同步信息并将该同步信息发送至用于数据存储的电子设备。用于数据存储的电子设备接收到存储节点在启动读写业务时发送的同步信息后,可以根据该同步信息中携带的预设最大存储率,对保存的该存储节点对应的预设最大存储率进行更新,提高确定的目标存储节点的准确性,避免了由于不及时更新每个存储节点的存储空间分别对应的预设最大存储率,所导致得无法准确地确定用于存储目标数据的目标存储节点的问题。
在一种可能的实施方式中,用于数据存储的电子设备在获取到了每个存储节点的存储空间分别对应的预设最大存储率后,可以采用网格的方式,将预设最大存储率相同的各个存储节点划分到同一网格中,以实现对相同预设最大存储率的各个存储节点进行统一的管理,并有利于后续确定每个叶子存储层级所包含的各个存储节点,并方便对每个存储节点进行管理。图3为本公开实施例提供的一种网格图的结构示意图,如图3所示,一个虚线框表示一个网格,根据每个存储节点的存储空间分别对应的预设最大存储率,确定预设最大存储率相同的至少一个存储节点划分到同一网格中。如图3所示的,预设最大存储率均为80%的4个存储节点,均被划分到对应预设最大存储率为80%的网格中;预设最大存储率均为40%的4个存储节点,均被划分到对应预设最大存储率为40%的网格中;预设最大存储率均为60%的4个存储节点,均被划分到对应预设最大存储率为60%的网格中;预设最大存储率均为10%的4个存储节点,均被划分到对应预设最大存储率为10%的网格中。
在一种可能的实施方式中,由于在设置每个存储节点的存储空间分别对应的预设最大存储率时,还会考虑存储节点的读写速率,使得后续采用网格的方式,可以将预设最大存储率相同且读写速率相同的各个存储节点划分到同一网格中。可以理解的是,可以将预设最大存储率相同且类型相同的各个存储节点划分到同一网格中。
仍以上述图3为例,预先配置了4个类型为SSD的存储节点的存储空间分别对应的预设最大存储率均为80%,该4个类型为SSD归属于同一网格中;预先还配置了另外的4个类型为SSD的存储节点的存储空间分别对应的预设最大存储率均为60%,该4个类型为SSD归属于同一网格中;预先配置了4个类型为HDD的存储节点的存储空间分别对应的预设最大存储率均为40%,该4个类型为HDD归属于同一网格中;预先配置了4个类型为HHD的存储节点的存储空间分别对应的预设最大存储率均为10%,该4个类型为HHD归属于同一网格中。
当基于上述的实施例确定了目标存储层级之后,可以获取该目标存储层级所包含的各存储节点的存储空间的利用率。然后根据所述各存储节点分别对应的利用率和预设最大存储率,确定所述各存储节点分别对应的空闲率;将所述各存储节点中,所述空闲率满足预设的存储条件的存储节点确定为所述目标存储节点。
在一种可能的实施方式中,确定所述空闲率满足预设的存储条件包括:
确定每个所述空闲率中的最大值满足预设的存储条件;和/或
确定每个所述空闲率中的任一目标空闲率满足预设的存储条件;其中,所述目标空闲率大于预设的第二阈值。
为了准确地确定目标存储节点,预先对存储节点的空闲率设置有存储条件,该存储条件可以为目标存储层级所包含的各个存储节点分别对应的空闲率中的最大值,或,目标存储层级所包含的各个存储节点分别对应的空闲率中的任一目标空闲率,该目标空闲率为多个空闲率中大于预设的第二阈值的空闲率。当基于上述的实施例获取到目标存储层级所包含的存储节点对应的空闲率之后,可以确定该存储节点对应的空闲率是否满足预设的存储条件。如果该存储节点对应的空闲率满足预设的存储条件,则确定该存储节点为用于存储目标数据的目标存储节点;如果该存储节点对应的空闲率不满足预设的存储条件,则确定该存储节点不为用于存储目标数据的目标存储节点。
作为一种可能的实施方式,若预设的存储条件为目标存储层级所包含的各个存储节点分别对应的空闲率中的最大值,则获取到目标存储层级所包含的各个存储节点分别对应的空闲率之后,获取每个空闲率中的最大值,并确定该最大值满足预设的存储条件,将最大值所对应的存储节点确定为目标存储节点。
作为另一种可能的实施方式,若预设的存储条件为存储节点对应的空闲率大于预设的第二阈值。当基于上述的实施例获取到目标存储层级所包含的存储节点对应的空闲率之后,可以确定该存储节点对应的空闲率是否大于预设的第二阈值。如果确定该存储节点对应的空闲率大于预设的第二阈值,则确定该空闲率为目标空闲率且满足预设的存储条件,将该目标空闲率对应的存储节点确定为目标存储节点。如果确定该存储节点对应的空闲率不大于预设的第二阈值,则确定该空闲率不满足预设的存储条件,该空闲率不为目标空闲率。
作为再一种可能的实施方式,若预设的存储条件为目标存储层级所包含的各个存储节点分别对应的空闲率中的最大值大于预设的第二阈值。获取到目标存储层级所包含的各个存储节点分别对应的空闲率之后,获取每个空闲率中的最大值,确定该最大值是否大于预设的第二阈值。如果确定该最大值大于预设的第二阈值,则确定该最大值满足预设的存储条件,且该最大值为目标空闲率,将该最大值对应的存储节点确定为目标存储节点。如果确定该最大值不大于预设的第二阈值,则确定该最大值不满足预设的存储条件,且该最大值不为目标空闲率。
需要说明的是,具体选择哪种存储条件,可以根据实际需求进行灵活设置,在此不做具体限定。
S103:将所述目标数据存储至所述目标存储节点。
当基于上述的实施例确定了目标存储节点后,即可将目标数据发送至目标存储节点,以使目标存储节点存储该目标数据。
在一种可能的实施方式中,用于数据存储的电子设备也可以基于上述的实施例确定了目标存储节点后,可以将目标存储节点的信息发送至客户端设备。客户端设备接收到目标存储节点的信息后,可以根据该目标存储节点的信息访问到目标存储节点,并将目标数据发送至目标存储节点,以使目标存储节点保存该目标数据。
在一种可能的实施方式中,在确定了目标存储节点后,该目标存储节点可能出现宕机等故障,从而无法通过目标存储节点保存目标数据。为了及时保存目标数据并避免再次为目标数据分配原有的目标存储节点,若确定所述目标存储节点存在故障,则将所述目标存储节点在预设时间段内标记为不可用,以使在预设时间段内不再考虑使用该目标存储节点用于存储目标数据,并重新确定用于存储所述目标数据的目标存储节点。
在本公开中,任一存储层级对应的利用率是根据从属于该存储层级的叶子存储层级所包含的各存储节点的存储空间的利用率确定的,根据存储层级对应的利用率,不仅可以监控从属于该存储层级的叶子存储层级所包含的各存储节点的存储空间的使用情况,方便对各叶子存储层级下所包含的存储节点的存储空间进行管控,还有利于在数据存储过程中,根据每个存储层级分别对应的利用率以及所允许的预设存储范围,快速且准确地确定出适合保存目标存储层级。基于所确定的目标存储层级以及其中的各个存储节点,能够实现先从所有存储节点中快速确定比较适合存储目标数据的部分存储节点,然后再从位于目标存储层级下的多个存储节点中确定目标存储节点,从而无需从所有存储节点中确定目标存储节点,大大减少了确定目标存储节点所需的工作量,有利于快速找到适合保存目标数据的存储节点,而提高目标数据存储的效率。
下面通过具体的实施例对本申请提供的数据存储方法进行说明,图4为本公开实施例提供的具体的数据存储流程的示意图,该流程包括:
S401:接收目标数据的数据存储指令。
S402:根据参考存储层级对应的利用率及预设存储范围,确定该参考存储层级的空闲率。
其中,该参考存储层级为预先配置的根存储层级,或,每个存储层级中除根存储层级之外的至少一个存储层级;该根存储层级不从属于除该根存储层级之外的其它的存储层级;任一存储层级对应的利用率是根据从属于该存储层级的叶子存储层级所包含的各存储节点的存储空间的利用率确定,该叶子存储层级之下不包含有除该叶子存储层级之外的其它的存储层级。
S403:若确定该参考存储层级的空闲率不大于预设的第一阈值,则按照预设的通知方式,将新增存储节点的提醒消息发送至预设管理设备。
S404:确定该参考存储层级的数量是否大于1,若是,执行S405,否则,执行S406。
S405:判断该参考存储层级之下是否包含有除该参考存储层级之外的其它的存储层级,若包含,执行S407,若不包含,执行S408。
S406:确定每个参考存储层级分别对应的空闲率中的最大值,获取所述最大值对应的参考存储层级,判断该参考存储层级是否包含有除该参考存储层级之外的其它的存储层级,若包含,执行S407,否则,执行S408。
S407:根据该参考存储层级之下包含的除该参考存储层级之外的其它的存储层级,对每个参考存储层级进行更新,执行S402。
S408:将该参考存储层级确定为目标存储层级。
在一种可能的实施方式中,用于数据存储的电子设备可以根据预先配置的每个存储层级分别对应的预设存储范围,利用多叉树算法,生成多叉树图。后续在需要进行目标数据的存储时,通过查找该多叉树图,可以更加高效地定位到目标存储层级。如图2所示,从存储层级A到从属于该存储层级A的叶子存储层级的路径上进行逐层选择,先获取与该存储层级A连接的存储层级B和存储层级C分别对应的空闲率,确定空闲率最大值所对应的存储层级为存储层级B。然后获取该存储层级B之下包含的除该存储层级B之外的其它的存储层级为存储层级D,直接快速确定存储层级D为目标存储层级。
S409:根据目标存储层级所包含的各存储节点分别对应的利用率和预设最大存储率,确定目标存储层级所包含的各存储节点分别对应的空闲率。
其中,该存储节点包括固态硬盘SSD、混合硬盘HHD以及机械硬盘HDD中的至少一种。
在设置每个存储节点分别对应的预设最大存储率时,该存储节点对应的预设最大存储率是根据该存储节点的读写速率确定的,读写速率越快的存储节点所对应的预设最大存储率越大。
例如,SSD对应的预设最大存储率大于HHD对应的预设最大存储率,而HHD对应的预设最大存储率大于HDD对应的预设最大存储率。
在一种可能的实施方式中,若接收某一存储节点在启动读写业务时发送的同步信息,则根据该同步信息中携带的预设最大存储率,对该存储节点对应的预设最大存储率进行更新。
在一种可能的实施方式中,确定叶子存储层级所包含的各个存储节点的过程包括:
获取每个存储节点的存储空间分别对应的预设最大存储率;
将预设最大存储率在该叶子存储层级对应的预设存储范围内的存储节点,确定为该叶子存储层级所包含的各存储节点。
S410:将各存储节点中,空闲率满足预设的存储条件的存储节点确定为目标存储节点。
其中,确定空闲率满足预设的存储条件包括:
确定每个空闲率中的最大值满足预设的存储条件;和/或
确定每个空闲率中的任一目标空闲率满足预设的存储条件;其中,该目标空闲率大于预设的第二阈值。
S411:确定目标存储节点是否存在故障,若存在,执行S412,若不存在,执行S413。
S412:将该目标存储节点在预设时间段内标记为不可用,并重新确定用于存储该目标数据的目标存储节点。
S413:将目标数据存储至该目标存储节点。
在数据存储过程中,通过上述的步骤,可以将数据均衡的分散存储在各个存储节点中,不会过于频繁采用某一存储节点作为目标存储节点,进而导致频繁访问该存储节点,造成对该存储节点的过热访问,有效保证了各个存储节点的稳定性。
前文介绍了本公开实施例的方法,下文中将介绍本公开实施例中的装置。方法、装置是基于同一技术构思的,由于方法、装置解决问题的原理相似,因此装置与方法的实施可以相互参见,重复之处不再赘述。
本公开实施例提供了一种数据存储装置,图5为本公开实施例提供的一种数据存储装置的结构示意图,该装置包括:
接收单元51,用于接收目标数据的数据存储指令;
处理单元52,用于响应于所述数据存储指令,根据每个存储层级分别对应的利用率以及所允许的预设存储范围,确定用于存储所述目标数据的目标存储层级;其中,任一存储层级对应的利用率是根据从属于该存储层级的叶子存储层级所包含的各存储节点的存储空间的利用率确定,所述叶子存储层级之下不包含有除所述叶子存储层级之外的其它的存储层级;根据所述目标存储层级所包含的各存储节点的存储空间的利用率,确定用于存储所述目标数据的目标存储节点;
存储单元53,用于将所述目标数据存储至所述目标存储节点。
在某些可能的实施方式中,所述处理单元52,具体用于以下步骤:
A、根据参考存储层级对应的利用率及预设存储范围,确定所述参考存储层级的空闲率;其中,所述参考存储层级为预先配置的根存储层级,或,所述每个存储层级中除所述根存储层级之外的至少一个存储层级;所述根存储层级不从属于除所述根存储层级之外的其它的存储层级;
B、确定所述参考存储层级的数量是否大于1;
C、若确定所述数量不大于1,则判断所述参考存储层级之下是否包含有除所述参考存储层级之外的其它的存储层级,若包含,执行F,若不包含,执行H;
D、若确定所述数量大于1,则确定每个所述参考存储层级分别对应的空闲率中的最大值,获取所述最大值对应的参考存储层级,判断该参考存储层级是否包含有除该参考存储层级之外的其它的存储层级,若包含,执行E,若不包含,执行G;
E、根据该参考存储层级之下包含的除该参考存储层级之外的其它的存储层级,对每个所述参考存储层级进行更新,执行步骤A;
F、根据所述参考存储层级之下包含的除所述参考存储层级之外的其它的存储层级,对所述参考存储层级进行更新,执行步骤A;
G、将该参考存储层级确定为所述目标存储层级;
H、将所述参考存储层级确定为所述目标存储层级。
在某些可能的实施方式中,所述装置还包括:提醒单元;
所述提醒单元,用于若确定所述参考存储层级的空闲率不大于预设的第一阈值,则按照预设的通知方式,将新增存储节点的提醒消息发送至预设管理设备。
在某些可能的实施方式中,所述装置还包括:预处理单元;
所述预处理单元,用于获取每个所述存储节点的存储空间分别对应的预设最大存储率;将预设最大存储率在所述叶子存储层级对应的预设存储范围内的存储节点,确定为所述叶子存储层级所包含的各存储节点。
在某些可能的实施方式中,所述接收单元51,还用于接收所述存储节点在启动读写业务时发送的同步信息;
所述装置还包括:更新单元;
所述更新单元,用于根据所述同步信息中携带的预设最大存储率,对所述存储节点对应的预设最大存储率进行更新。
在某些可能的实施方式中,所述处理单元52,具体用于根据所述各存储节点分别对应的利用率和预设最大存储率,确定所述各存储节点分别对应的空闲率;将所述各存储节点中,所述空闲率满足预设的存储条件的存储节点确定为所述目标存储节点。
在某些可能的实施方式中,所述处理单元52,具体用于通过如下方式确定所述空闲率满足预设的存储条件:
确定每个所述空闲率中的最大值满足预设的存储条件;和/或
确定每个所述空闲率中的任一目标空闲率满足预设的存储条件;其中,所述目标空闲率大于预设的第二阈值。
在某些可能的实施方式中,所述处理单元52,还用于若确定所述目标存储节点存在故障,则将所述目标存储节点在预设时间段内标记为不可用,并重新确定用于存储所述目标数据的目标存储节点。
在数据存储过程中,接收到目标数据的数据存储指令后,可以根据每个存储层级分别对应的利用率以及所允许的预设存储范围,确定适合于保存目标数据的目标存储层级。然后根据位于目标存储层级的各存储节点的存储空间的利用率,确定用于存储目标数据的目标存储节点。由于任一存储层级对应的利用率是根据从属于该存储层级的叶子存储层级所包含的各存储节点的存储空间的利用率确定的,根据存储层级对应的利用率,不仅可以监控从属于该存储层级的叶子存储层级所包含的各存储节点的存储空间的使用情况,方便对各叶子存储层级下所包含的存储节点的存储空间进行管控,还有利于在数据存储过程中,根据每个存储层级分别对应的利用率以及所允许的预设存储范围,快速且准确地确定出适合保存目标存储层级。基于所确定的目标存储层级以及其中的各个存储节点,能够实现先从所有存储节点中快速确定比较适合存储目标数据的部分存储节点,然后再从位于目标存储层级下的多个存储节点中确定目标存储节点,从而无需从所有存储节点中确定目标存储节点,大大减少了确定目标存储节点所需的工作量,有利于快速找到适合保存目标数据的存储节点,而提高目标数据存储的效率。
如图6为本公开实施例提供的一种电子设备结构示意图,在上述各实施例的基础上,本公开实施例还提供了一种电子设备,如图6所示,包括:处理器601、通信接口602、存储器603和通信总线604,其中,处理器601,通信接口602,存储器603通过通信总线604完成相互间的通信;
所述存储器603中存储有计算机程序,当所述程序被所述处理器601执行时,使得所述处理器601执行如下步骤:
响应于目标数据的数据存储指令,根据每个存储层级分别对应的利用率以及所允许的预设存储范围,确定用于存储所述目标数据的目标存储层级;其中,任一存储层级对应的利用率是根据从属于该存储层级的叶子存储层级所包含的各存储节点的存储空间的利用率确定,所述叶子存储层级之下不包含有除所述叶子存储层级之外的其它的存储层级;
根据所述目标存储层级所包含的各存储节点的存储空间的利用率,确定用于存储所述目标数据的目标存储节点;
将所述目标数据存储至所述目标存储节点。
由于上述电子设备解决问题的原理与数据存储方法相似,因此上述电子设备的实施可以参见方法的实施,重复之处不再赘述。
上述电子设备提到的通信总线可以是外设部件互连标准(Peripheral ComponentInterconnect,PCI)总线或扩展工业标准结构(Extended Industry StandardArchitecture,EISA)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
通信接口602用于上述电子设备与其他设备之间的通信。
存储器可以包括随机存取存储器(Random Access Memory,RAM),也可以包括非易失性存储器(Non-Volatile Memory,NVM),例如至少一个磁盘存储器。可选地,存储器还可以是至少一个位于远离前述处理器的存储装置。
上述处理器可以是通用处理器,包括中央处理器、网络处理器(NetworkProcessor,NP)等;还可以是数字指令处理器(Digital Signal Processing,DSP)、专用集成电路、现场可编程门陈列或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。
在上述各实施例的基础上,本公开实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质内存储有可由处理器执行的计算机程序,当所述程序在所述处理器上运行时,使得所述处理器执行时实现如下步骤:
响应于目标数据的数据存储指令,根据每个存储层级分别对应的利用率以及所允许的预设存储范围,确定用于存储所述目标数据的目标存储层级;其中,任一存储层级对应的利用率是根据从属于该存储层级的叶子存储层级所包含的各存储节点的存储空间的利用率确定,所述叶子存储层级之下不包含有除所述叶子存储层级之外的其它的存储层级;
根据所述目标存储层级所包含的各存储节点的存储空间的利用率,确定用于存储所述目标数据的目标存储节点;
将所述目标数据存储至所述目标存储节点。
由于计算机可读存储介质解决问题的原理与上述数据存储方法相似,因此具体实施可以参见数据处理方法的实施,重复之处不再赘述。
本领域内的技术人员应明白,本申请的实施例可提供为方法、***、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请的方法、设备(***)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。

Claims (21)

1.一种数据存储方法,其特征在于,所述方法包括:
响应于目标数据的数据存储指令,根据每个存储层级分别对应的利用率以及所允许的预设存储范围,确定用于存储所述目标数据的目标存储层级;其中,任一存储层级对应的利用率是根据从属于该存储层级的叶子存储层级所包含的各存储节点的存储空间的利用率确定,所述叶子存储层级之下不包含有除所述叶子存储层级之外的其它的存储层级;
根据所述目标存储层级所包含的各存储节点的存储空间的利用率,确定用于存储所述目标数据的目标存储节点;
将所述目标数据存储至所述目标存储节点。
2.根据权利要求1所述的方法,其特征在于,所述根据每个存储层级分别对应的利用率以及所允许的预设存储范围,确定用于存储所述目标数据的目标存储层级,包括:
A、根据参考存储层级对应的利用率及预设存储范围,确定所述参考存储层级的空闲率;其中,所述参考存储层级为预先配置的根存储层级,或,所述每个存储层级中除所述根存储层级之外的至少一个存储层级;所述根存储层级不从属于除所述根存储层级之外的其它的存储层级;
B、确定所述参考存储层级的数量是否大于1;
C、若确定所述数量不大于1,则判断所述参考存储层级之下是否包含有除所述参考存储层级之外的其它的存储层级,若包含,执行F,若不包含,执行H;
D、若确定所述数量大于1,则确定每个所述参考存储层级分别对应的空闲率中的最大值,获取所述最大值对应的参考存储层级,判断该参考存储层级是否包含有除该参考存储层级之外的其它的存储层级,若包含,执行E,若不包含,执行G;
E、根据该参考存储层级之下包含的除该参考存储层级之外的其它的存储层级,对每个所述参考存储层级进行更新,执行步骤A;
F、根据所述参考存储层级之下包含的除所述参考存储层级之外的其它的存储层级,对所述参考存储层级进行更新,执行步骤A;
G、将该参考存储层级确定为所述目标存储层级;
H、将所述参考存储层级确定为所述目标存储层级。
3.根据权利要求2所述的方法,其特征在于,所述方法还包括:
若确定所述参考存储层级的空闲率不大于预设的第一阈值,则按照预设的通知方式,将新增存储节点的提醒消息发送至预设管理设备。
4.根据权利要求1所述的方法,其特征在于,确定所述叶子存储层级所包含的各存储节点,包括:
获取每个所述存储节点的存储空间分别对应的预设最大存储率;
将预设最大存储率在所述叶子存储层级对应的预设存储范围内的存储节点,确定为所述叶子存储层级所包含的各存储节点。
5.根据权利要求4所述的方法,其特征在于,所述方法还包括:
接收所述存储节点在启动读写业务时发送的同步信息;
根据所述同步信息中携带的预设最大存储率,对所述存储节点对应的预设最大存储率进行更新。
6.根据权利要求5所述的方法,其特征在于,所述存储节点对应的预设最大存储率是根据所述存储节点的读写速率确定的,读写速率越快的存储节点所对应的预设最大存储率越大。
7.根据权利要求1-6任一所述的方法,其特征在于,所述存储节点包括固态硬盘SSD、混合硬盘HHD以及机械硬盘HDD中的至少一种。
8.根据权利要求7所述的方法,其特征在于,所述SSD对应的预设最大存储率高于所述HHD对应的预设最大存储率;
所述HHD对应的预设最大存储率高于所述HDD对应的预设最大存储率。
9.根据权利要求1所述的方法,其特征在于,所述根据所述目标存储层级所包含的各存储节点的存储空间的利用率,确定用于存储所述目标数据的目标存储节点,包括:
根据所述各存储节点分别对应的利用率和预设最大存储率,确定所述各存储节点分别对应的空闲率;
将所述各存储节点中,所述空闲率满足预设的存储条件的存储节点确定为所述目标存储节点。
10.根据权利要求9所述的方法,其特征在于,确定所述空闲率满足预设的存储条件包括:
确定每个所述空闲率中的最大值满足预设的存储条件;和/或
确定每个所述空闲率中的任一目标空闲率满足预设的存储条件;其中,所述目标空闲率大于预设的第二阈值。
11.根据权利要求1所述的方法,其特征在于,所述方法还包括:
若确定所述目标存储节点存在故障,则将所述目标存储节点在预设时间段内标记为不可用,并重新确定用于存储所述目标数据的目标存储节点。
12.一种数据处理装置,其特征在于,所述装置包括:
接收单元,用于接收目标数据的数据存储指令;
处理单元,用于响应于所述数据存储指令,根据每个存储层级分别对应的利用率以及所允许的预设存储范围,确定用于存储所述目标数据的目标存储层级;其中,任一存储层级对应的利用率是根据从属于该存储层级的叶子存储层级所包含的各存储节点的存储空间的利用率确定,所述叶子存储层级之下不包含有除所述叶子存储层级之外的其它的存储层级;根据所述目标存储层级所包含的各存储节点的存储空间的利用率,确定用于存储所述目标数据的目标存储节点;
存储单元,用于将所述目标数据存储至所述目标存储节点。
13.根据权利要求12所述的装置,其特征在于,所述处理单元,具体用于以下步骤:
A、根据参考存储层级对应的利用率及预设存储范围,确定所述参考存储层级的空闲率;其中,所述参考存储层级为预先配置的根存储层级,或,所述每个存储层级中除所述根存储层级之外的至少一个存储层级;所述根存储层级不从属于除所述根存储层级之外的其它的存储层级;
B、确定所述参考存储层级的数量是否大于1;
C、若确定所述数量不大于1,则判断所述参考存储层级之下是否包含有除所述参考存储层级之外的其它的存储层级,若包含,执行F,若不包含,执行H;
D、若确定所述数量大于1,则确定每个所述参考存储层级分别对应的空闲率中的最大值,获取所述最大值对应的参考存储层级,判断该参考存储层级是否包含有除该参考存储层级之外的其它的存储层级,若包含,执行E,若不包含,执行G;
E、根据该参考存储层级之下包含的除该参考存储层级之外的其它的存储层级,对每个所述参考存储层级进行更新,执行步骤A;
F、根据所述参考存储层级之下包含的除所述参考存储层级之外的其它的存储层级,对所述参考存储层级进行更新,执行步骤A;
G、将该参考存储层级确定为所述目标存储层级;
H、将所述参考存储层级确定为所述目标存储层级。
14.根据权利要求13所述的装置,其特征在于,所述装置还包括:提醒单元;
所述提醒单元,用于若确定所述参考存储层级的空闲率不大于预设的第一阈值,则按照预设的通知方式,将新增存储节点的提醒消息发送至预设管理设备。
15.根据权利要求12所述的装置,其特征在于,所述装置还包括:预处理单元;
所述预处理单元,用于获取每个所述存储节点的存储空间分别对应的预设最大存储率;将预设最大存储率在所述叶子存储层级对应的预设存储范围内的存储节点,确定为所述叶子存储层级所包含的各存储节点。
16.根据权利要求15所述的装置,其特征在于,所述接收单元,还用于接收所述存储节点在启动读写业务时发送的同步信息;
所述装置还包括:更新单元;
所述更新单元,用于根据所述同步信息中携带的预设最大存储率,对所述存储节点对应的预设最大存储率进行更新。
17.根据权利要求16所述的装置,其特征在于,所述处理单元,具体用于根据所述各存储节点分别对应的利用率和预设最大存储率,确定所述各存储节点分别对应的空闲率;将所述各存储节点中,所述空闲率满足预设的存储条件的存储节点确定为所述目标存储节点。
18.根据权利要求17所述的装置,其特征在于,所述处理单元,具体用于通过如下方式确定所述空闲率满足预设的存储条件:
确定每个所述空闲率中的最大值满足预设的存储条件;和/或
确定每个所述空闲率中的任一目标空闲率满足预设的存储条件;其中,所述目标空闲率大于预设的第二阈值。
19.根据权利要求12所述的装置,其特征在于,所述处理单元,还用于若确定所述目标存储节点存在故障,则将所述目标存储节点在预设时间段内标记为不可用,并重新确定用于存储所述目标数据的目标存储节点。
20.一种电子设备,其特征在于,所述电子设备至少包括处理器和存储器,所述处理器用于执行存储器中存储的计算机程序时实现如权利要求1-11中任一所述数据存储方法的步骤。
21.一种计算机可读存储介质,其特征在于,其存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1-11中任一所述数据存储方法的步骤。
CN202111012344.0A 2021-08-31 2021-08-31 一种数据存储方法、装置、设备及介质 Active CN113703685B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111012344.0A CN113703685B (zh) 2021-08-31 2021-08-31 一种数据存储方法、装置、设备及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111012344.0A CN113703685B (zh) 2021-08-31 2021-08-31 一种数据存储方法、装置、设备及介质

Publications (2)

Publication Number Publication Date
CN113703685A CN113703685A (zh) 2021-11-26
CN113703685B true CN113703685B (zh) 2023-09-08

Family

ID=78657996

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111012344.0A Active CN113703685B (zh) 2021-08-31 2021-08-31 一种数据存储方法、装置、设备及介质

Country Status (1)

Country Link
CN (1) CN113703685B (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013191658A1 (en) * 2012-06-20 2013-12-27 Singapore University Of Technology And Design System and methods for distributed data storage
CN105959350A (zh) * 2016-04-22 2016-09-21 深圳市永兴元科技有限公司 分布式数据存储方法及装置
CN106775464A (zh) * 2016-12-02 2017-05-31 郑州云海信息技术有限公司 一种数据分层存储***及方法
CN110489415A (zh) * 2019-07-23 2019-11-22 平安科技(深圳)有限公司 一种数据更新方法及相关设备
CN112379841A (zh) * 2020-11-16 2021-02-19 北京金山云网络技术有限公司 数据处理方法、装置和电子设备
CN113312004A (zh) * 2021-06-15 2021-08-27 华录光存储研究院(大连)有限公司 一种多层级分布式存储***及存储方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102662855B (zh) * 2012-04-17 2015-02-25 华为技术有限公司 一种二叉树的存储方法、***
US8793373B2 (en) * 2012-12-06 2014-07-29 Hitachi, Ltd. Network system and method for operating the same
US10831371B2 (en) * 2018-01-02 2020-11-10 International Business Machines Corporation Quota controlled movement of data in a tiered storage system

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013191658A1 (en) * 2012-06-20 2013-12-27 Singapore University Of Technology And Design System and methods for distributed data storage
CN105959350A (zh) * 2016-04-22 2016-09-21 深圳市永兴元科技有限公司 分布式数据存储方法及装置
CN106775464A (zh) * 2016-12-02 2017-05-31 郑州云海信息技术有限公司 一种数据分层存储***及方法
CN110489415A (zh) * 2019-07-23 2019-11-22 平安科技(深圳)有限公司 一种数据更新方法及相关设备
CN112379841A (zh) * 2020-11-16 2021-02-19 北京金山云网络技术有限公司 数据处理方法、装置和电子设备
CN113312004A (zh) * 2021-06-15 2021-08-27 华录光存储研究院(大连)有限公司 一种多层级分布式存储***及存储方法

Also Published As

Publication number Publication date
CN113703685A (zh) 2021-11-26

Similar Documents

Publication Publication Date Title
US10768857B2 (en) Storage system having a controller that selects a die of a solid state disk to store data
US10740308B2 (en) Key_Value data storage system
CN107667363B (zh) 具有多种可选数据处理策略的基于对象的存储集群
CN109597567B (zh) 一种数据处理方法和装置
US9027017B2 (en) Methods and apparatus for movement of virtual resources within a data center environment
CN113037794B (zh) 计算资源配置调度方法、装置及***
CN105701099B (zh) 用于在分布式环境中执行任务的方法、装置及***
CN107870802B (zh) 一种虚拟机迁移方法和装置
CN110147203B (zh) 一种文件管理方法、装置、电子设备及存储介质
US12026536B2 (en) Rightsizing virtual machine deployments in a cloud computing environment
CN108874502B (zh) 云计算集群的资源管理方法、装置及设备
US11886905B2 (en) Host upgrade method and device
CN107656807A (zh) 一种虚拟资源的自动弹性伸缩方法及装置
CN112269661B (zh) 基于Kafka集群的分区迁移方法和装置
CN109033365B (zh) 一种数据处理方法及相关设备
CN110737717B (zh) 一种数据库迁移方法及装置
CN105760391B (zh) 数据动态重分布的方法、数据节点、名字节点及***
CN111694505B (zh) 数据存储管理方法、装置和计算机可读存储介质
CN110688065A (zh) 一种存储空间管理方法、***、电子设备及存储介质
CN113703685B (zh) 一种数据存储方法、装置、设备及介质
CN107547622B (zh) 一种资源调整方法及装置
CN115599547A (zh) 一种数据库资源池自动化管理和分配方法及***
CN109376001A (zh) 一种资源分配的方法及设备
CN109151016B (zh) 流量转发方法和装置、服务***、计算设备及存储介质
CN115904211A (zh) 一种存储***、数据处理方法及相关设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant