CN117331487A - 一种数据重删方法及相关*** - Google Patents
一种数据重删方法及相关*** Download PDFInfo
- Publication number
- CN117331487A CN117331487A CN202211132110.4A CN202211132110A CN117331487A CN 117331487 A CN117331487 A CN 117331487A CN 202211132110 A CN202211132110 A CN 202211132110A CN 117331487 A CN117331487 A CN 117331487A
- Authority
- CN
- China
- Prior art keywords
- partition
- data block
- data
- metadata
- fingerprint
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 129
- 238000005192 partition Methods 0.000 claims abstract description 630
- 238000003860 storage Methods 0.000 claims abstract description 225
- 238000000638 solvent extraction Methods 0.000 claims abstract description 21
- 238000013507 mapping Methods 0.000 claims description 138
- 230000015654 memory Effects 0.000 claims description 97
- 230000008901 benefit Effects 0.000 claims description 43
- 238000009826 distribution Methods 0.000 claims description 20
- 230000008030 elimination Effects 0.000 claims description 15
- 238000003379 elimination reaction Methods 0.000 claims description 15
- 238000004891 communication Methods 0.000 claims description 7
- 238000004590 computer program Methods 0.000 claims description 7
- 238000007726 management method Methods 0.000 description 65
- 230000008569 process Effects 0.000 description 44
- 230000006870 function Effects 0.000 description 39
- 238000011156 evaluation Methods 0.000 description 17
- 238000012545 processing Methods 0.000 description 16
- 238000012217 deletion Methods 0.000 description 12
- 230000037430 deletion Effects 0.000 description 12
- 238000010586 diagram Methods 0.000 description 12
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 11
- 230000004044 response Effects 0.000 description 9
- 230000000903 blocking effect Effects 0.000 description 7
- 238000013209 evaluation strategy Methods 0.000 description 6
- 230000002085 persistent effect Effects 0.000 description 6
- 230000001960 triggered effect Effects 0.000 description 6
- 230000008859 change Effects 0.000 description 5
- 239000000284 extract Substances 0.000 description 5
- 238000012005 ligant binding assay Methods 0.000 description 5
- 238000004422 calculation algorithm Methods 0.000 description 4
- 230000002441 reversible effect Effects 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 3
- 238000000605 extraction Methods 0.000 description 3
- 239000004744 fabric Substances 0.000 description 3
- 230000010365 information processing Effects 0.000 description 3
- 239000007787 solid Substances 0.000 description 3
- 238000013144 data compression Methods 0.000 description 2
- 238000013500 data storage Methods 0.000 description 2
- 230000009977 dual effect Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000004927 fusion Effects 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- 238000013519 translation Methods 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 238000013523 data management Methods 0.000 description 1
- 238000013524 data verification Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 229920001485 poly(butyl acrylate) polymer Polymers 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000004904 shortening Methods 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 238000012911 target assessment Methods 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0602—Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
- G06F3/0608—Saving storage space on storage systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/10—File systems; File servers
- G06F16/17—Details of further file system functions
- G06F16/174—Redundancy elimination performed by the file system
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0628—Interfaces specially adapted for storage systems making use of a particular technique
- G06F3/0638—Organizing or formatting or addressing of data
- G06F3/064—Management of blocks
- G06F3/0641—De-duplication techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0668—Interfaces specially adapted for storage systems adopting a particular infrastructure
- G06F3/0671—In-line storage system
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Human Computer Interaction (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请提供了一种数据重删方法,包括:接收写请求,将写请求中的第一数据块写入存储设备,将第一数据块的元数据,如指纹和逻辑地址,写入元数据管理结构的多个分区中根据第一数据块的特征确定的第一分区,当第一分区中存在与第一数据块的指纹相同的指纹时,删除第一分区中第一数据块的元数据,并根据第一数据块的地址信息从存储设备中删除第一数据块。该方法通过对元数据管理结构主动分区,将数据块的元数据写入与该数据块的特征对应的分区,由此避免更新不频繁的数据被更新频繁的数据挤占资源,进而被淘汰,提高了重删率。
Description
本申请要求于2022年06月24日提交中国国家知识产权局、申请号为202210730080.0、发明名称为“一种数据重删方法”的中国专利申请的优先权,其全部内容通过引用结合在本申请中。
技术领域
本申请涉及存储技术领域,尤其涉及一种数据重删方法、装置、存储***、计算机可读存储介质、计算机程序产品。
背景技术
随着计算产业的发展,数据价值得到充分释放,数据中心的规模从拍字节(petabyte,PB)级向泽字节(zettabyte,ZB)级增长。数据中心存储的大量数据中存在大量冗余数据,统计表明在主存储***和备份存储***这两大主要应用场景中,分别存在约50%和85%的数据冗余。如何有效减少冗余数据,进而降低存储成本已成为研究的热点方向。
业界通常采用重复数据删除(Data Deduplication,DD)以减少数据冗余。数据重复删除也可以简称为重删,具体是通过对数据进行分块,并基于数据块的内容计算得到数据块的指纹,再通过比对不同数据块的指纹,识别并删除内容重复的数据块,进而达到消除数据冗余的目标。
其中,数据块的指纹通常是以追加写入方式写入日志文件。在进行重删时,通过手动或周期性触发的方式将日志文件中的指纹排序,并将排序后的指纹与指纹文件中的指纹合并,根据合并结果删除内容重复的数据块。
数据中心存储的数据可以根据更新频次分为更新频繁的数据和更新不频繁的数据。然而,更新频繁的数据的占比通常高于更新不频繁的数据的占比。更新频繁的数据通常难以被重删,也即难以被重删的数据占比反而高,此时就会出现资源挤占的情况,更新不频繁的数据所分配的空间占比就会较低,由此导致易被淘汰,从而损失重删率。
发明内容
本申请提供了一种数据重删方法,该方法通过对元数据管理结构进行主动分区,将数据块的指纹以及地址信息等元数据写入与数据块的特征对应的分区,由此避免更新不频繁的数据被更新频繁的数据挤占资源,进而被淘汰,提高了重删率。本申请还提供了上述方法对应的装置、存储***、计算机可读存储介质以及计算机程序产品。
第一方面,本申请提供一种数据重删方法。该方法可以应用于存储***,包括集中式存储***或者分布式存储***。其中,集中存储式***还可以分为盘控一体或盘控分离的集中式存储***,分布式存储***还可以分为存算一体的分布式存储***或存算分离的分布式存储***。集中式存储***具有引擎,该引擎包括控制器,控制器可以包括处理器和内存,处理器可以加载内存中的程序代码,从而执行本申请的数据重删方法。类似地,分布式存储***包括计算节点和存储节点,计算节点包括处理器和内存,处理器可以加载内存中的程序代码,从而执行本申请的数据重删方法。
具体地,存储***接收写请求,该写请求中包括第一数据块,然后存储***将第一数据块写入存储设备(例如是硬盘),接着将第一数据块的元数据写入元数据管理结构的多个分区中的第一分区。该第一分区为根据第一数据块的特征确定的。第一数据块的元数据包括第一数据块的指纹及地址信息。当第一分区中存在与第一数据块的指纹相同的指纹时,存储***删除第一分区中第一数据块的元数据,并根据第一数据块的地址信息从存储设备中删除第一数据块。
在该方法中,不同特征的数据块的元数据可以写入元数据管理结构的不同分区,例如更新频繁的数据块的元数据可以写入容量较小的分区,更新不频繁的数据块的元数据可以写入容量较大的分区,由此避免更新不频繁的数据被更新频繁的数据挤占资源,进而被淘汰,提高了重删率。
在一些可能的实现方式中,第一数据块的特征为所述第一数据块的指纹。需要说明的是,不同数据块可以对应相同的指纹,例如在进行备份时,可以存在多个数据块对应同一指纹。存储***在将所述第一数据块的元数据写入元数据管理结构时,可以先确定第一数据块对应的指纹的热度,根据第一数据块对应的指纹的热度确定该热度对应的元数据管理结构的多个分区中的第一分区,然后将第一数据块的元数据写入所述第一分区。
该方法中,存储***通过确定第一数据块对应的指纹的热度,并根据该热度将第一数据块写入对应的第一分区,可以避免更新不频繁的数据被更新频繁的数据挤占资源,进而被淘汰,提高了重删率。
在一些可能的实现方式中,第一数据块的地址信息包括第一数据块的逻辑地址,相应地,存储***还可以在将第一数据块的元数据写入第一分区之后,对第一数据块对应的指纹的热度进行更新。其中,存储***可以确定第一数据块的逻辑地址的热度,将逻辑地址的热度累加至所述第一数据块对应的指纹的热度,以更新所述第一数据块对应的指纹的热度。
在该方法中,通过将逻辑地址的热度累加至数据块对应的指纹的热度,进行指纹的热度更新,可以为后续元数据写入提供参考。
在一些可能的实现方式中,写请求中还可以包括第二数据块,第二数据块对应的指纹的热度可以高于所述第一数据块对应的指纹的热度。相应地,存储***还可以将第二数据块写入存储设备,将第二数据块的元数据写入元数据管理结构的多个分区中的第二分区。其中,第二分区的容量小于第一分区的容量。
该方法通过将指纹的热度不同的数据块写入元数据管理结构的不同分区,由此避免热度低的数据块的元数据被热度高的数据块的元数据挤占资源,进而被淘汰,提高了重删率。
在一些可能的实现方式中,写请求中还可以包括第三数据块,第三数据块的指纹与第一数据块的指纹相同。当写入第一数据块的元数据时,第一数据块对应的指纹的热度小于预设热度,当写入第三数据块的元数据时,第三数据块对应的指纹的热度大于预设热度,则存储***可以将第三数据块的元数据写入第二分区,并将第一分区中与第三数据块具有相同指纹的数据块的元数据移动至第二分区。
如此,可以实现随着数据块的不断写入,对元数据的存储位置进行调整,例如将指纹的热度较高的数据块的元数据移动至第二分区,从而在第一分区中为指纹的热度较低的数据块的元数据留出存储空间,以及在第二分区中存储具有相同指纹的数据块的元数据,以支持第二分区触发重删,进一步提升重删率。
在一些可能的实现方式中,存储***也可以将第三数据块的元数据写入第二分区,将第一分区中与第三数据块具有相同指纹的数据块的元数据淘汰,无需移动至第二分区,一方面可以减少移动开销,另一方面可以在第一分区中为指纹的热度较低的数据块的元数据留出存储空间,进一步提升重删率。
在一些可能的实现方式中,元数据管理结构的多个分区的容量根据分区决策模型确定。其中,分区决策模型用于预测预设的分区容量组合中每个分区容量组合应用于所述元数据管理结构后对应的分区收益,并确定分区收益最大的分区容量组合作为所述元数据管理结构的多个分区的容量,所述分区收益根据重删率和分区调整成本中的至少一个确定。
该方法通过构建分区决策模型,通过分区决策模型对元数据管理结构进行主动分区,由此避免了更新频繁的数据挤占更新不频繁的数据的资源,进而避免更新不频繁的数据被淘汰,导致损失重删率。
在一些可能的实现方式中,分区收益可以为重删率,预设的分区容量组合可以包括第一容量组合。分区决策模型可以通过预估数据的命中率,从而预测分区容量组合应用于数据管理结构后对应的重删率。
具体地,分区决策模型通过如下方式预测所述第一分区容量组合应用于所述元数据管理结构后对应的重删率:获取所述第一分区容量组合应用于所述元数据管理结构所形成的多个分区中各个分区对应的工作负载特征,根据所述各个分区对应的工作负载特征,获得所述各个分区对应的数据分布,根据所述各个分区对应的数据分布以及所述各个分区的容量,获得所述重删率。
该方法基于各个分区对应的工作负载特征,拟合各个分区对应的数据分布,基于各个分区对应的数据分布和分区容量可以预测命中率,进而预测出应用分区容量组合后对应的重删率,无需实际运行存储***,即可通过较低成本预测出重删率最大的分区容量组合,能够满足业务的需求。
在一些可能的实现方式中,考虑到工作负载可能发生变化,分区的容量还支持调整。例如,存储***可以周期性调整分区的容量。在具体工程实施过程中,分区调整需要重新进行分区初始化等操作,产生分区调整成本。分区决策模型可以基于调整前后的分区容量占比预测分区调整成本。分区决策模型可以根据收益率和分区调整成本,预测分区收益。例如,分区决策模型可以将预测的收益率与预测的分区调整成本的差值,作为预测的分区收益。
该方法通过重构分区收益,可以使得分区收益的评估更精准、合理,以重构的分区收益最大化为目标,所确定的分区容量组合更具有参考价值,能够实现重删率和分区调整成本的均衡。
在一些可能的实现方式中,存储***可以周期性地调整元数据管理结构的多个分区的容量,当到达调整时刻时,根据所述调整时刻前的周期对应的分区收益、分区容量组合或各个分区对应的工作负载特征,确定是否调整多个分区的容量。
该方法通过调整时刻前的周期对应的反馈信息,如分区收益、分区容量组合或各个分区对应的工作负载特征,决策是否对分区的容量进行调整,使得分区能够基于工作负载的变化灵活调整,尽可能保障在不同阶段均具有较好的分区收益。
在一些可能的实现方式中,存储***可以在第一分区中存储与第一数据块的指纹相同的指纹,且第一分区中与第一数据块的指纹相同的指纹的数量达到预设阈值时,删除第一数据块的元数据,并根据第一数据块的地址信息从存储设备中删除第一数据块。
其中,预设阈值可以根据经验值设置。例如,预设阈值可以设置为1,则第一分区中存在与第一数据块相同的指纹,存储***即删除第一数据块的元数据以及第一数据块。又例如,预设阈值可以设置为2,则第一分区中存在2个数据块的指纹与第一数据块的指纹相同时,存储***删除第一数据块的元数据以及第一数据块,进一步地,存储***保留与第一数据块的指纹相同的2个数据块中的一个数据块及其元数据,删除另一个数据块及其元数据。
当预设阈值设置为较小值时,可以及时删除冗余的数据块和元数据,当预设阈值设置为较大值时,可以减少重删次数,避免频繁重删占用大量资源,影响业务正常运行。
在一些可能的实现方式中,第一数据块的地址信息为第一数据块的逻辑地址。存储***还可以将第一数据块的逻辑地址和物理地址写入地址映射表。相应地,存储***在删除第一数据块时,可以根据所述第一数据块的逻辑地址,从所述地址映射表中获取所述第一数据块的物理地址,然后根据所述物理地址从所述存储设备中找到所述第一数据块,并删除所述第一数据块。
在该方法中,存储***基于地址映射表中逻辑地址到物理地址的单跳映射直接定位第一数据块,缩短了查找时间,提高了重删效率。
在一些可能的实现方式中,在删除第一分区中的第一数据块的元数据之后,存储***还可以将前向映射表中第一数据块的物理地址修改为所述第一数据块的指纹。
该方法可以实现对被重删的数据块的重定位,以便于后续可以基于指纹查找到具有相同指纹的数据块的物理地址,并通过访问该物理地址访问该数据块。
在一些可能的实现方式中,存储***还可以在所述逆映射表中的至少一个分区满足淘汰条件时,对所述至少一个分区中的所述元数据进行淘汰。
该方法通过对逆映射表进行元数据淘汰,以降低元数据的规模,进而降低内存开销,保障***性能。
第二方面,本申请提供一种数据重删装置。所述装置包括:
通信模块,用于接收写请求,所述写请求中包括第一数据块;
写数据模块,用于将所述第一数据块写入存储设备;
所述写数据模块,还用于将所述第一数据块的元数据写入元数据管理结构的多个分区中的第一分区,所述第一分区为根据所述第一数据块的特征确定的,所述第一数据块的元数据包括所述第一数据块的指纹及地址信息;
重删模块,用于在所述第一分区中存在与所述第一数据块的指纹相同的指纹时,删除所述第一分区中所述第一数据块的元数据,并根据所述第一数据块的地址信息从所述存储设备中删除所述第一数据块。
在一些可能的实现方式中,所述第一数据块的特征为所述第一数据块对应的指纹,所述写数据模块具体用于:
确定所述第一数据块对应的指纹的热度;
根据所述第一数据块对应的指纹的热度确定所述热度对应的所述元数据管理结构的多个分区中的所述第一分区;
将所述第一数据块的元数据写入所述第一分区。
在一些可能的实现方式中,所述写数据模块还用于:
在将所述第一数据块的元数据写入所述第一分区之后,确定所述第一数据块的逻辑地址的热度;
将所述逻辑地址的热度累加至所述第一数据块对应的指纹的热度,以更新所述第一数据块对应的指纹的热度。
在一些可能的实现方式中,所述写请求中还包括第二数据块,所述第二数据块对应的指纹的热度高于所述第一数据块对应的指纹的热度,所述写数据模块还用于:
将所述第二数据块写入所述存储设备,将所述第二数据块的元数据写入所述元数据管理结构的多个分区中的第二分区,所述第二分区的容量小于所述第一分区的容量。
在一些可能的实现方式中,所述元数据管理结构的多个分区的容量根据分区决策模型确定,所述分区决策模型用于预测预设的分区容量组合中每个分区容量组合应用于所述元数据管理结构后对应的分区收益,并确定分区收益最大的分区容量组合作为所述元数据管理结构的多个分区的容量,所述分区收益根据重删率和分区调整成本中的至少一个确定。
在一些可能的实现方式中,所述分区收益为重删率,所述预设的分区容量组合包括第一分区容量组合,所述分区决策模型通过如下方式预测所述第一分区容量组合应用于所述元数据管理结构后对应的重删率:
获取所述第一分区容量组合应用于所述元数据管理结构所形成的多个分区中各个分区对应的工作负载特征;
根据所述各个分区对应的工作负载特征,获得所述各个分区对应的数据分布;
根据所述各个分区对应的数据分布以及所述各个分区的容量,获得所述重删率。
在一些可能的实现方式中,所述装置还包括分区模块,所述分区模块用于:
周期性地调整所述元数据管理结构的多个分区的容量;
当到达调整时刻时,根据所述调整时刻前的周期对应的分区收益、分区容量组合或各个分区对应的工作负载特征,确定是否调整所述多个分区的容量。
在一些可能的实现方式中,所述重删模块具体用于:
在所述第一分区中存在与所述第一数据块的指纹相同的指纹,且所述第一分区中的所述指纹的数量达到预设阈值时,删除所述第一数据块的元数据,并根据所述第一数据块的地址信息从所述存储设备中删除所述第一数据块。
在一些可能的实现方式中,所述第一数据块的地址信息为所述第一数据块的逻辑地址,所述写数据模块还用于:
将所述第一数据块的逻辑地址和物理地址写入地址映射表;
所述重删模块具体用于:
根据所述第一数据块的逻辑地址,从所述地址映射表中获取所述第一数据块的物理地址;
根据所述物理地址从所述存储设备中找到所述第一数据块,并删除所述第一数据块。
在一些可能的实现方式中,所述重删模块还用于:
在删除所述第一分区中的所述第一数据块的元数据之后,将所述地址映射表中所述第一数据块的物理地址修改为所述第一数据块的指纹。
在一些可能的实现方式中,所述装置还包括:
淘汰模块,用于当所述逆映射表中的至少一个分区满足淘汰条件,对所述至少一个分区中的所述元数据进行淘汰。
第三方面,本申请提供一种计算机集群。所述计算机集群包括至少一台计算机,所述至少一台计算机包括至少一个处理器和至少一个存储器。所述至少一个处理器、所述至少一个存储器进行相互的通信。所述至少一个处理器用于执行所述至少一个存储器中存储的指令,以使得计算机或计算机集群执行如第一方面或第一方面的任一种实现方式所述的数据重删方法。
第四方面,本申请提供一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,所述指令指示计算机或计算机集群执行上述第一方面或第一方面的任一种实现方式所述的数据重删方法。
第五方面,本申请提供了一种包含指令的计算机程序产品,当其在计算机或计算机集群上运行时,使得计算机或计算机集群执行上述第一方面或第一方面的任一种实现方式所述的数据重删方法。
本申请在上述各方面提供的实现方式的基础上,还可以进行进一步组合以提供更多实现方式。
附图说明
为了更清楚地说明本申请实施例的技术方法,下面将对实施例中所需使用的附图作以简单地介绍。
图1为本申请实施例提供的一种集中式存储***的***架构图;
图2为本申请实施例提供的一种分布式存储***的***架构图;
图3为本申请实施例提供的一种追加写入日志文件进行元数据管理的示意图;
图4为本申请实施例提供的一种通过日志文件和逆映射表进行元数据管理的示意图;
图5为本申请实施例提供的一种数据重删方法的流程图;
图6为本申请实施例提供的一种数据重删方法的流程图;
图7为本申请实施例提供的一种***资源特征提取的示意图;
图8为本申请实施例提供的一种特征归并的示意图;
图9为本申请实施例提供的一种获取结构化特征的示意图;
图10为本申请实施例提供的一种分区决策建模的流程示意图;
图11为本申请实施例提供的一种评估策略选择的流程示意图;
图12为本申请实施例提供的一种数据重删方法的应用场景示意图;
图13为本申请实施例提供的一种数据重删方法应用于全局缓存的流程示意图;
图14为本申请实施例提供的一种数据重删装置的结构示意图。
具体实施方式
本申请实施例中的术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。
首先对本申请实施例中所涉及到的一些技术术语进行介绍。
重复数据删除(Data Deduplication,DD),也可以简称为重删,是一种对重复数据进行删除,使得存储介质中对于相同数据仅存储一份,从而节约数据存储空间的数据缩减方案。重删具体可以通过对数据进行分块,并基于数据块的内容计算得到数据块的指纹(fingerprint,FP),再通过比对不同数据块的指纹,识别并删除内容重复的数据块,进而达到消除数据冗余的目标。
指纹是指基于数据块的内容确定的、用于标识数据块的身份信息。数据块的指纹可以是通过消息摘要算法对数据块的内容计算所得的消息摘要。其中,消息摘要算法通常基于散列函数,也即哈希(hash)函数实现,因此,数据块的指纹也可以是通过散列函数或哈希函数确定的散列值或哈希值。
重删还可以按照执行时间分类。例如,重删可以包括前重删或后重删。前重删是指数据在写入存储介质(简称为存储,例如可以是硬盘等设备)之前,进行重删。前重删也可以称作在线重删。后重删是指数据在写入存储介质(例如是硬盘等设备)之后,进行重删。后重删也称作后台重删、离线重删。
本申请实施例提供的数据重删方法可以应用于不同应用场景,例如可以应用于集中式存储***或分布式存储***。
所谓集中式存储***就是指由一台或多台主设备组成中心节点,数据集中存储于这个中心节点中,并且整个***的所有数据处理业务都集中部署在这个中心节点上。换言之,集中式存储***中,终端或客户端仅负责数据的录入和输出,而数据的存储与控制处理完全交由中心节点来完成。集中式***最大的特点就是部署结构简单,无需考虑如何对服务进行多个节点的部署,也就不用考虑多个节点之间的分布式协作问题。
其中,集中式存储***可以包括盘控一体的集中式存储***,或盘控分离的集中式存储***。盘控一体是指存储介质(如硬盘)与控制器是一体化的,盘控分离是指存储介质与控制器分离。
图1为本申请实施例所应用的一种集中式存储***的***架构图,在图1所示的应用场景中,用户通过应用程序来存取数据。运行这些应用程序的计算机被称为“应用服务器”。应用服务器100可以是物理机,也可以是对物理机进行虚拟化形成的虚拟机。物理机包括但不限于桌面电脑、服务器、笔记本电脑以及移动设备。
应用服务器通过光纤交换机110访问存储***以存取数据。然而,交换机110只是一个可选设备,应用服务器100也可以直接通过网络与存储***120通信。或者,光纤交换机110也可以替换成以太网交换机、无限带宽(InfiniBand,IB)交换机、基于融合以太网的远程直接内存访问(RDMA over Converged Ethernet,RoCE)交换机等。
图1所示的存储***120是一个集中式存储***。集中式存储***的特点是有一个统一的入口,所有从外部设备来的数据都要经过这个入口,这个入口就是集中式存储***的引擎121。引擎121是集中式存储***中最为核心的部件,许多存储***的高级功能都在其中实现。
如图1所示,引擎121中有一个或多个控制器,图1以引擎包含两个控制器为例予以说明。控制器0与控制器1之间具有镜像通道,那么当控制器0将一份数据写入其内存124后,可以通过所述镜像通道将所述数据的副本发送给控制器1,控制器1将所述副本存储在自己本地的内存124中。由此,控制器0和控制器1互为备份,当控制器0发生故障时,控制器1可以接管控制器0的业务,当控制器1发生故障时,控制器0可以接管控制器1的业务,从而避免硬件故障导致整个存储***120的不可用。当引擎121中部署有4个控制器时,任意两个控制器之间都具有镜像通道,因此任意两个控制器互为备份。
引擎121还包含前端接口125和后端接口126,其中前端接口125用于与应用服务器100通信,从而为应用服务器100提供存储服务。而后端接口126用于与硬盘134通信,以扩充存储***的容量。通过后端接口126,引擎121可以连接更多的硬盘134,从而形成一个非常大的存储资源池。
在硬件上,如图1所示,控制器0至少包括处理器123、内存124。处理器123是一个中央处理器(central processing unit,CPU),用于处理来自存储***外部(服务器或者其他存储***)的数据访问请求(如读请求或写请求),也用于处理存储***内部生成的请求。示例性的,处理器123通过前端端口125接收应用服务器100发送的写请求时,会将这些写请求中的数据暂时保存在内存124中。当内存124中的数据总量达到一定阈值时,处理器123通过后端端口将内存124中存储的数据发送给硬盘134进行持久化存储。
内存124是指与处理器直接交换数据的内部存储器,它可以随时读写数据,而且速度很快,作为操作***或其他正在运行中的程序的临时数据存储器。内存包括至少两种存储器,例如内存既可以是随机存取存储器,也可以是只读存储器(Read Only Memory,ROM)。举例来说,随机存取存储器是动态随机存取存储器(Dynamic Random Access Memory,DRAM),或者存储级存储器(Storage Class Memory,SCM)。DRAM是一种半导体存储器,与大部分随机存取存储器(Random Access Memory,RAM)一样,属于一种易失性存储器(volatile memory)设备。SCM是一种同时结合传统储存装置与存储器特性的复合型储存技术,存储级存储器能够提供比硬盘更快速的读写速度,但存取速度上比DRAM慢,在成本上也比DRAM更为便宜。然而,DRAM和SCM在本实施例中只是示例性的说明,内存还可以包括其他随机存取存储器,例如静态随机存取存储器(Static Random Access Memory,SRAM)等。而对于只读存储器,举例来说,可以是可编程只读存储器(Programmable Read Only Memory,PROM)、可抹除可编程只读存储器(Erasable Programmable Read Only Memory,EPROM)等。另外,内存124还可以是双列直插式存储器模块或双线存储器模块(Dual In-line MemoryModule,简称DIMM),即由动态随机存取存储器(DRAM)组成的模块,还可以是固态硬盘(Solid State Disk,SSD)。实际应用中,控制器0中可配置多个内存124,以及不同类型的内存124。本实施例不对内存113的数量和类型进行限定。此外,可对内存124进行配置使其具有保电功能。保电功能是指***发生掉电又重新上电时,内存124中存储的数据也不会丢失。具有保电功能的内存被称为非易失性存储器。
内存124中存储有软件程序,处理器123运行内存124中的软件程序可实现对硬盘的管理。例如将硬盘抽象化为存储资源池,然后划分为逻辑单元设备(logic unit numberdevice,LUN)提供给服务器使用等。这里的LUN其实就是在服务器上看到的硬盘。当然,一些集中式存储***本身也是文件服务器,可以为服务器提供共享文件服务。
控制器1(以及其他图1中未示出的控制器)的硬件组件和软件结构与控制器0类似,这里不再赘述。
图1所示的是一种盘控分离的集中式存储***。在该***中,引擎121可以不具有硬盘槽位,硬盘134可以放置在硬盘框130中。按照引擎121与硬盘框130之间通信协议的类型,硬盘框130可能是串行连接小型计算机***接口(Serial Attached Small ComputerSystem Interface,SAS)硬盘框,也可能是非易失性内存主机控制器接口规范(non-volatile memory express,NVMe)硬盘框,网际协议(Internet Protocol,IP)硬盘框以及其他类型的硬盘框。SAS硬盘框,采用SAS3.0协议,每个框支持25块SAS硬盘。引擎121通过板载SAS接口或者SAS接口模块与硬盘框130连接。NVMe硬盘框,更像一个完整的计算机***,NVMe硬盘插在NVMe硬盘框内。NVMe硬盘框再通过RDMA端口与引擎121连接。
后端接口126与硬盘框130通信。后端接口126以适配卡的形态存在于引擎121中,一个引擎121上可以同时使用两个或两个以上后端接口126来连接多个硬盘框130。或者,适配卡也可以集成在主板上,此时适配卡可通过PCIE总线与处理器112通信。
需要说明的是,图1中只示出了一个引擎121,然而在实际应用中,存储***中可包含两个或两个以上引擎121,多个引擎121之间做冗余或者负载均衡。
图1所示的存储***120为盘控分离的存储***。在一些可能的实现方式中,集中式存储***也可以是盘控一体的存储***。在盘控一体的存储***中,引擎121可以具有硬盘槽位,硬盘134可直接部署在引擎121中,后端接口126属于可选配置,当***的存储空间不足时,可通过后端接口126连接更多的硬盘或硬盘框。
分布式存储***是指将数据分散存储在多***立的存储节点上的***。分布式存储***采用可扩展的***结构,利用多台存储节点分担存储负荷,它不但提高了***的可靠性、可用性和存取效率,还易于扩展。
如图2所示,本实施例提供的存储***包括计算节点集群和存储节点集群。计算节点集群包括一个或多个计算节点110(图2中示出了三个计算节点110,但不限于三个计算节点110),各个计算节点110之间可以相互通信。计算节点110是一种计算设备,如服务器、台式计算机或者存储阵列的控制器等。在硬件上,如图2所示,计算节点110至少包括处理器112、内存113和网卡114。其中,处理器112是一个中央处理器(central processing unit,CPU),用于处理来自计算节点110外部的数据访问请求,或者计算节点110内部生成的请求。示例性的,处理器112接收用户发送的写请求时,会将这些写请求中的数据暂时保存在内存113中。当内存113中的数据总量达到一定阈值时,处理器112将内存113中存储的数据发送给存储节点100进行持久化存储。除此之外,处理器112还用于对数据进行计算或处理,例如元数据管理、重删、数据压缩、虚拟化存储空间以及地址转换等。图2中仅示出了一个处理器112,在实际应用中,处理器112的数量往往有多个,其中,一个处理器112又具有一个或多个处理器核。本实施例不对处理器的数量,以及处理器核的数量进行限定。
内存113是指与处理器直接交换数据的内部存储器,它可以随时读写数据,而且速度很快,作为操作***或其他正在运行中的程序的临时数据存储器。内存包括至少两种存储器,例如内存既可以是随机存取存储器RAM,也可以是只读存储器ROM。实际应用中,计算节点110中可配置多个内存113,以及不同类型的内存113。本实施例不对内存113的数量和类型进行限定。此外,可对内存113进行配置使其具有保电功能。保电功能是指***发生掉电又重新上电时,内存113中存储的数据也不会丢失。具有保电功能的内存被称为非易失性存储器。
网卡114用于与存储节点100通信。例如,当内存113中的数据总量达到一定阈值时,计算节点110可通过网卡114向存储节点100发送请求以对所述数据进行持久化存储。另外,计算节点110还可以包括总线,用于计算节点110内部各组件之间的通信。在功能上,由于图1中的计算节点110的主要功能是计算业务,在存储数据时可以利用远程存储器来实现持久化存储,因此它具有比常规服务器更少的本地存储器,从而实现了成本和空间的节省。但这并不代表计算节点110不能具有本地存储器,在实际实现中,计算节点110也可以内置少量的硬盘,或者外接少量硬盘。
任意一个计算节点110可通过网络访问存储节点集群中的任意一个存储节点100。存储节点集群包括多个存储节点100(图1中示出了三个存储节点100,但不限于三个存储节点100)。一个存储节点100包括一个或多个控制器101、网卡104与多个硬盘105。网卡104用于与计算节点110通信。硬盘105用于存储数据,可以是磁盘或者其他类型的存储介质,例如固态硬盘或者叠瓦式磁记录硬盘等。控制器101用于根据计算节点110发送的读/写数据请求,往硬盘105中写入数据或者从硬盘105中读取数据。在读写数据的过程中,控制器101需要将读/写数据请求中携带的地址转换为硬盘能够识别的地址。由此可见,控制器101也具有一些简单的计算功能。
需要说明的是,网卡114或网卡104为智能网卡时,处理器112的功能如重删等也可以卸载至智能网卡。智能网卡是指融合有计算资源的网卡,例如是具有数据处理单元(dataprocessing unit,DPU)的网卡。DPU具有CPU的通用性和可编程性,但更具有专用性,可以在网络数据包,存储请求或分析请求上高效运行。通过将重删等功能卸载至DPU,一方面可以减少对CPU资源的占用,另一方面可以缩短访问路径。
图2所示的存储***为存算分离的分布式存储***,在一些可能的实现方式中,存储***也可以为存算一体的分布式存储***。存储一体的分布式存储***包括存储集群(也称作存储节点集群),存储节点集群可以包括一个或多个服务器,服务器之间可以相互通信。服务器是一种既具有计算能力又具有存储能力的设备。在硬件上,服务器至少包括处理器、内存、网卡和硬盘。处理器用于处理来自服务器外部(应用服务器或者其他服务器)的数据访问请求,也用于处理服务器内部生成的请求。示例性的,处理器接收写请求时,会将这些写请求中的数据暂时保存在内存中。当内存中的数据总量达到一定阈值时,处理器将内存中存储的数据发送给硬盘进行持久化存储。处理器还用于对数据进行计算或处理,例如元数据管理、重复数据删除、数据压缩、数据校验、虚拟化存储空间以及地址转换等。
需要说明,以上仅仅是对存储***的示例说明,在本申请实施例其他可能的实现方式中,存储***还可以是全融合架构的分布式存储***或者是memory fabric架构的分布式存储***。在此不再赘述。
为了实现重删功能,存储***通常需要引入“两级元数据映射”(Two-levelMetadata Mapping)。
一般情况下,例如是在不支持重删功能的存储***中,元数据映射可以为逻辑块地址(Logical Block Address,LBA)到物理块地址(Physical Block Address,PBA)的直接映射。其中,逻辑块地址也称作逻辑地址,物理块地址也称作物理地址。逻辑地址是存储介质呈现给主机的逻辑空间的地址。主机在向存储介质发送写请求或读请求时,会将逻辑地址携带在写请求或读请求中。存储介质接收到送写请求或读请求时,会获取写请求或读请求携带的逻辑地址,对逻辑地址经过一次或多次地址转换确定物理地址,向物理地址写入数据或者从物理地址读取数据。通过采用LBA作为数据的地址,将物理地址这种基于磁头、柱面和扇区的三维寻址方式转变为一维的线性寻址,可以提高寻址的效率。
逻辑地址到物理地址的映射为单跳映射,在引入重删功能后,由于逻辑地址和数据内容并不匹配,如果按照逻辑地址进行路由难以找到数据,因此需要增加一跳按指纹的路由,因此,单跳映射可以变更为逻辑地址到指纹,再由指纹到物理地址的两级映射。
在图1或图2所示的存储***中,处理器(例如是图1中的处理器123或者图2中的处理器112)可以将数据重删方法对应的计算机可读指令加载进内存(例如是图1中的内存124或者图2中的内存113),然后处理器执行上述计算机可读指令,以执行数据重删方法,从而节省存储空间、提升存储性能。
为了便于描述,以存储***对应用产生的数据进行后重删示例说明。
具体地,应用写入数据时,存储***(例如是存储***中的处理器)可以将数据分块,该示例中假设以4千字节(kilo byte,KB)的粒度将数据分为多个数据块,然后存储***中的重删模块可以对每个4KB的数据块计算指纹,将指纹写入日志文件,接着将数据块下盘(写入硬盘等存储设备)。用户可以手动触发重删操作,或者设置重删周期,如此,应用可以响应于用户的重删操作下发重删命令,或者是周期性地向重删模块下发重删命令,重删模块响应于重删命令,对日志文件中的指纹进行排序,将排序后的指纹与指纹文件中的指纹合并,根据合并结果删除内容重复的数据块。
如图3所示,对于新写入硬盘等存储介质(也可以为存储设备)的数据块,该数据块的指纹等元数据可以采用追加写入日志文件(Write-ahead Log,WAL)的方式进行管理。当触发重删时,重删模块将日志文件中的指纹进行排序,并将排序后的指纹与指纹文件中的指纹合并,基于合并结果可以保留具有相同指纹的多个数据块中的一个数据块,删除内容重复的数据块,并更新指纹文件。需要说明,图3中不同图案的矩形块代表不同指纹。
然而,很多应用的工作负载(workload)通常是非均匀的,也即应用写入硬盘等存储设备进行持久化存储的数据可以具有不同的更新频次。其中,更新频繁的数据的占比通常高于更新不频繁的数据的占比。更新频繁的数据通常难以被重删,也即难以被重删的数据占比反而高,此时就会出现资源挤占的情况,更新不频繁的数据所分配的空间占比就会较低,由此导致易被淘汰,从而损失重删率。
有鉴于此,本申请提供的数据重删方法可以对元数据管理结构进行主动分区,在将写请求中的数据块写入存储设备(如硬盘)后,将数据块的指纹以及地址信息等元数据写入元数据管理结构的多个分区中与该数据块的特征对应的分区,并在该分区中存在与该数据块的指纹相同的指纹时,删除该分区中该数据块的元数据,以及根据该数据块的地址信息从存储设备删除该数据块。
如此,不同特征的数据块的元数据可以写入元数据管理结构的不同分区,例如更新频繁的数据块的元数据可以写入容量较小的分区,更新不频繁的数据块的元数据可以写入容量较大的分区,由此避免更新不频繁的数据被更新频繁的数据挤占资源,进而被淘汰,提高了重删率。
进一步地,本申请引入了一种新的元数据管理结构,即用于存储数据块的指纹到逻辑地址的映射关系的逆映射表(Inverse Mapping Table)。如图4所示,区别于基于日志文件的元数据管理,本申请实施例通过逆映射表对指纹、逻辑地址等元数据进行管理,当逆映射表的分区中与当前写入的数据块的指纹相同的指纹的数量达到预设阈值,即触发重删,无需等待用户手动触发或者周期性地触发,能够及时地删除内存中重复的指纹等元数据,减少了元数据内存开销,保障了***性能。此外,当前写入数据块的逻辑地址和物理地址可以写入地址映射表,被重删的数据块的物理地址可以修改为指纹。如此,被重删的数据块可以通过两级映射进行寻址,未被重删的数据块可以通过单级映射进行寻址,缩短了未被重删的数据块的响应时间。
需要说明,重删后的逆映射表中的指纹和逻辑地址还可以写入指纹表,如此指纹表中可以存储重删后的数据块的指纹和逻辑地址。存储***也可以通过指纹表、前向映射表进行寻址。基于此,逆映射表的各个分区还可以在满足淘汰条件时,对分区中的元数据进行淘汰,从而降低元数据的规模,减小内存开销。
为了使得本申请的技术方案更加清楚、易于理解,下面将以图1所示的存储***120为例,对本申请提供的数据重删方法进行介绍。
参见图5所示的数据重删方法的流程图,存储***120包括引擎121和硬盘框130,引擎121中包括互为备份的控制器0和控制器1,为了便于描述,图5从控制器0的角度进行示例说明,硬盘框130中包括多个硬盘134,该方法包括如下步骤:
S502:控制器0接收来自于应用服务器100的写请求。
写请求是指用于写数据的请求。写请求中包括数据,该写请求即用于将该数据写入硬盘134,进行持久化存储。其中,写请求可以由部署于应用服务器100上的应用基于业务需求生成。例如,应用服务器100上可以部署视频应用,视频应用可以为短视频应用或长视频应用,该视频应用可以生成写请求,其中,写请求中包括用户上传的视频流。又例如,应用服务器100上可以部署文件管理应用,该文件管理应用可以是文件管理器,文件管理器可以生成写请求,写请求中包括待归档的图像。
在图1的示例中,控制器0包括处理器123和前端接口125,控制器0的处理器123可以通过前端接口125,接收应用服务器100通过交换机110转发的写请求。
S504:控制器0将写请求中数据分块,获得至少一个数据块。
在本实施例中,控制器0可以采用定长分块或变长分块,对写请求中数据进行分块,从而获得至少一个数据块。其中,定长分块是指按照设置好的分块粒度对数据流进行分块。变长分块是将数据流分为大小不固定的数据块,变长分块可以包括基于滑动窗口的变长分块和基于内容的变长分块(content-defined chunking,CDC)。
为了便于理解,下面以定长分块进行示例说明。具体地,数据流的大小为分块粒度的整数倍时,控制器0可以将数据均匀地切分为一个或多个数据块。数据大小并非分块粒度的整数倍时,控制器0可以将数据进行填充,例如是在数据的末端填零,使得填充后的数据为分块粒度的整数倍,接着控制器0按照该分块粒度将数据均匀地切分为一个或多个数据块。例如,数据的大小为19KB时,控制器0可以在该数据的末端填零,使得填充后的数据的大小为20KB,然后控制器0按照4KB的分块粒度进行分块,可以获得5个大小为4KB的数据块。
考虑到不同存储场景的输入输出(input output,IO)模式、IO大小、特性要求不同,控制器0可以根据存储场景选择合适的分块策略进行分块。例如,主存储场景中,IO通常较小,并且IO模式以随机读写为主,控制器0可以选择采用定长分块;备份存储场景中,IO通常较大,IO模式以顺序读写为主,控制器0可以选择变长分块,以获得较好的重删率。
需要说明的是,对数据进行分块是本申请实施例中数据重删方法的可选步骤,执行本申请实施例的数据重删方法也可以不执行上述步骤。例如,数据的大小等于分块粒度,或者小于分块粒度时,可以直接将数据作为一个数据块。又例如,数据的大小是固定大小时,也可以直接将数据作为一个数据块。
S506:控制器0确定至少一个数据块的指纹。
针对至少一个数据块中的任意数据块,控制器0可以根据该数据块的内容,通过消息摘要算法进行计算,获得该数据块的指纹。数据块的指纹可以是该数据块的消息摘要,例如是数据块的哈希值。
S508:控制器0根据至少一个数据块中第一数据块的指纹查询指纹表。当第一数据块的指纹在指纹表中存在时,执行S509,当第一数据块的指纹在指纹表中不存在时执行S510、S511、S512。
S509:控制器0向应用服务器100返回写响应。
S510:控制器0将第一数据块写入硬盘134。
指纹表用于记录硬盘134存储的数据块的指纹和地址信息。其中,地址信息可以包括逻辑地址。进一步地,地址信息还可以包括物理地址。指纹表可以采用键值对(keyvalue,kv)方式存储指纹和地址信息。具体地,指纹表可以以指纹为key,以逻辑地址等地址信息为value进行存储。
指纹表中记录的指纹和地址信息可以来自逆映射表。逆映射表是一种存储已下盘的数据块的指纹和逻辑地址的元数据管理结构。具体地,逆映射表触发重删后,控制器0可以将重删后的逆映射表同步至指纹表,具体是将重删后的逆映射表中的元数据(例如是指纹和逻辑地址)存储至指纹表。
该指纹表中存储有已下盘的数据块的指纹,因此可以支持前重删,从而减少硬盘134的存储压力。具体地,控制器0可以根据第一数据块的指纹查询指纹表。例如,控制器0可以将第一数据块的指纹与指纹表中的指纹进行比对,或者控制器0可以根据第一数据块的指纹以及指纹表的索引快速查找指纹。
当第一数据块的指纹在指纹表中存在时,表明具有相同内容的数据块已写入硬盘134,控制器0可以执行S509,以直接返回写响应,该写响应用于表征写成功。当第一数据块的指纹在指纹表中不存在时,表明磁盘134中并未存储相同内容的数据块,控制器0可以执行S510,将第一数据块写入磁盘134。进一步地,控制器0也可以在第一数据块写入硬盘134成功后,向应用服务器100返回写响应。
需要说明的是,在业务的初始阶段,指纹表可以为空。随着应用服务器100不断向硬盘134存储数据,逆映射表中可以记录已下盘的数据块的元数据,当逆映射表中的分区触发重删,重删后的逆映射表中的元数据可以同步至指纹表。在该阶段,控制器0可以查询指纹表,从而实现前重删。与后重删相比,前重删通过在数据落盘之前删除重复数据,无需将重复数据写入硬盘134等存储介质,避免了对资源的占用。
基于此,执行本申请实施例的方法也可以不执行上述S508、S509。例如,在业务的初始节点,指纹表为空,控制器0可以直接将数据块下盘进行后重删,并在指纹表中记录的元数据达到预设条数,支持前重删。又例如,控制器0可以不对数据块进行前重删,直接将数据块下盘进行后重删。
S511:控制器0向地址映射表中写入第一数据块的逻辑地址和物理地址。
地址映射表用于存储写入硬盘134的数据块的地址信息。例如,地址映射表可以存储数据块的逻辑地址和物理地址。具体实现时,地址映射表可以采用kv方式存储逻辑地址和物理地址。为了便于查找或定位数据块,地址映射表可以以逻辑地址为key,以物理地址为value,存储逻辑地址到物理地址的映射关系。一方面可以便于后续访问该数据块时快速寻址,另一方面可以记录该操作,便于后续追溯或故障恢复。
区别于逆映射表以逻辑地址为value,地址映射表以逻辑地址为key,因此也可以称之为前向映射表。需要说明的是,如果第一数据块被前重删,也就表明第一数据块并未被写入硬盘134,也就不存在相应的物理地址,控制器0可以在前向映射表中存储第一数据块的逻辑地址和指纹。当需要查找第一数据块时,可以根据前向映射表查找该第一数据块的指纹,然后查找指纹表,获得与该第一数据块具有相同指纹的数据块,获得具有相同指纹的数据块的逻辑地址,基于具有相同指纹的数据块的逻辑地址可以通过前向映射表,获得具有相同指纹的数据块的物理地址,基于具有相同指纹的数据块的物理地址可以访问具有相同指纹的数据块,由此可以实现访问第一数据块。
需要说明的是,上述S510、S511的执行顺序并不限定。在一些可能的实现方式中,控制器0也可以先在前向映射表中写入逻辑地址和物理地址,然后再向硬盘134等存储设备中写入第一数据块。
S512:控制器0将第一数据块的指纹和逻辑地址***逆映射表的第一分区。在第一分区中存在与第一数据块的指纹相同的指纹时,执行S514、S516。
逆映射表用于存储指纹和逻辑地址。其中,逆映射表可以是以键值对形式组织的表结构。逆映射表中的键值对用于表征逆映射关系。区别于地址映射表中自逻辑地址映射到物理地址的映射形式,逆映射表中用于存储指纹到逻辑地址的逆映射关系。其中,键值对中的key为指纹,value为逻辑地址。控制器0可以将第一数据块的指纹和逻辑地址有序***逆映射表。
其中,控制器0可以将第一数据块的指纹和逆映射表中第一分区的指纹进行多路归并(N-Way Merge)排序,然后根据排序结果,将第一数据块的指纹和逻辑地址***逆映射表的第一分区。
多路归并排序是指待排序的对象(例如是数据块的指纹)分为多路分别进行排序,然后将各路排序结果进行合并,从而实现归并排序。假设每路的排序结果可以记作具有n个元素的有序小集合S={x|xi≤xj,i,j∈[0,n)},假设待排序的指纹被分为m路,则可以对m个小集合S1、S2、…Sm进行合并以实现归并排序。其中,控制器0可以按照如下公式确定所有小集合中的最小值,写入大集合:
min=min(min(S1),min(S2),…min(Sm)) (1)
假设所有小集合中的最小值为集合Si中最小值,控制器0可以在将该最小值写入大集合后,将该最小值从集合Si去除,然后继续按照上述公式(1)计算,确定更新后的所有小集合的最小值,并将最小值写入大集合。控制器0重复上述过程,直至所有小集合中的元素均写入大集合,完成归并排序。
在一些可能的实现方式中,控制器0可以采用日志结构合并树(log structuredmerge tree,LSM tree)将第一数据块的指纹和逆映射表中的指纹进行排序,进而将第一数据块的指纹和逻辑地址有序***逆映射表的第一分区。其中,逆映射表的各个分区均可以维护一个LSM tree,从而将待写入该分区的指纹和逻辑地址等元数据有序***。
在本实施例中,逆映射表包括多个分区,第一分区可以根据第一数据块的特征确定。其中,第一数据块的特征可以是第一数据块对应的指纹。在一些情况下,多个数据块可以对应相同指纹。例如,在备份场景中,多个数据块可以对应相同指纹。控制器0可以根据第一数据块对应的指纹,确定该指纹的热度,然后根据第一数据块对应的指纹的热度确定该热度对应的逆映射表的多个分区中的第一分区。例如,控制器0可以将指纹的热度与预设热度进行比较,当指纹的热度小于预设热度,则可以确定第一分区为逆映射表中用于存储冷数据的元数据的分区,也称作冷分区,当指纹的热度大于或等于预设热度,则可以确定第一分区为用于存储热数据的分区,也称作热分区。其中,冷分区可以是容量较大的分区,热分区可以是容量较小的分区。冷分区的容量大于热分区的容量。接着控制器0将第一数据块的指纹和逻辑地址写入第一分区。
进一步地,在将第一数据块的指纹和逻辑地址等元数据写入第一分区后,控制器0还可以更新第一数据块对应的指纹的热度,以用于确定后续写入的具有相同指纹的数据块所对应的分区。具体地,控制器0可以确定第一数据块的逻辑地址的热度,将逻辑地址的热度累加至第一数据块对应的指纹的热度,从而更新第一数据块对应的指纹的热度。
为了便于理解,下面结合一示例进行说明。该示例中,控制器0可以在每次写入数据块的元数据后,更新数据块对应的指纹的热度。例如,控制器0写入硬盘134的第一数据块为数据块10,数据块10的指纹记作FP3,由于之前曾写入具有相同指纹的数据块,并且最近一次写入指纹为FP3的数据块为数据块8,控制器0可以获取写入数据块8的元数据后所更新的FP3的热度。该示例中假设FP3的热度为5。控制器0可以基于该热度确定逆映射表的多个分区中的第一分区,例如第一分区可以是用于存储冷数据的元数据的分区,也称作冷分区。控制器0还可以确定数据块10的逻辑地址的热度,假设逻辑地址的热度为2,则可以将逻辑地址的热度累计至指纹的热度,从而更新指纹的热度。在该示例中,更新后的指纹的热度可以为7。
随着数据块的不断写入,数据块对应的指纹的热度可以发生变化。为此,控制器0还可以根据数据块对应的指纹的热度,将数据块的元数据在不同分区移动。例如,在初始阶段,各数据块对应的指纹的热度通常较低,可以将这些数据块的元数据写入冷分区。随着数据块的不断写入,部分指纹的热度不断增加,当在写入某个数据块后,该数据块对应的指纹的热度大于预设热度时,控制器0可以将该数据块的元数据写入热分区,以及将具有相同指纹的数据块的元数据移动至热分区。
在一些可能的实现方式中,考虑到在不同分区移动元数据的开销,控制器0也可以不移动元数据,而是将元数据淘汰。例如,当在写入某个数据块后,该数据块对应的指纹的热度大于预设热度时,控制器0可以将该数据块的元数据写入热分区,以及将具有相同指纹的数据块的元数据淘汰出冷分区。
进一步地,控制器可以在第一分区存在与第一数据块的指纹相同的指纹时,即触发重删,也可以在第一分区中存在与第一数据块的指纹相同的指纹,且第一分区中与第一数据块的指纹相同的指纹的数量达到预设阈值时,触发重删,执行S514、S516。
其中,预设阈值可以根据经验值进行设置。例如,预设阈值可以设置为2,以图4示例说明,该示例中,逆映射表的分区1(如第一分区)中与第一数据块的指纹相同的指纹的数量达到2,则可以触发重删。又例如,预设阈值也可以设置为1,也即存在与第一数据块的指纹相同的指纹,即可触发重删。也就是说,当第一分区中存在与第一数据块的指纹相同的指纹时,控制器0可以执行S514、S516实现重删,但本申请实施例对重删时机不作限定,例如,控制器0可以在第一分区中相同的指纹的数量达到预设阈值时触发重删,也可以在存在相同的指纹时即触发重删。
在本实施例中,控制器0通过直接将第一数据块写入硬盘134,然后执行后重删。如此可以避免消耗计算资源影响业务正常运行,以及出现计算瓶颈时导致存储性能下降。
需要说明的是,逆映射表为本实施例引入的一种新型元数据管理结构,在本申请实施例其他可能的实现方式中,元数据管理结构也可以采用其他组织形式。
S514:控制器0根据第一数据块的地址信息从硬盘134中删除第一数据块。
对于具有相同指纹的数据块,控制器0可以保留一个数据块,从硬盘134中删除其他具有相同指纹的数据块。具体实现时,控制器0可以根据第一数据块的逻辑地址,从地址映射表中获取第一数据块的物理地址,然后根据该物理地址从硬盘134等存储设备中找到该第一数据块,并删除第一数据块。
进一步地,预设阈值大于1时,控制器0还可以保留一个与第一数据块指纹相同的数据块,删除其他指纹相同的数据块。具体地,针对指纹相同的数据块,控制器0可以保留最先写入的数据块,删除后写入的数据块。
S516:控制器0从逆映射表的第一分区中删除第一数据块的指纹以及逻辑地址。
具体地,控制器0可以从逆映射表中查找第一数据块的指纹,然后删除第一数据块的指纹以及逻辑地址。需要说明的是,当逆映射表中指纹与逻辑地址的键值对采用LSMtree的方式存储时,控制器0可以采用表格合并的方式删除第一数据块的指纹以及对应的逻辑地址。
进一步地,预设阈值大于1时,控制器0还可以保留一个与第一数据块指纹相同的数据块的元数据,删除其他指纹相同的数据块的元数据。具体地,针对指纹相同的数据块,控制器0可以保留最先写入的数据块的元数据,删除后写入的数据块的元数据。
此外,控制器0在执行上述S514、516时可以并行执行,也可以按照设定的顺序先后执行。例如,控制器0也可以先执行S516,然后执行S514。本实施例对S514和S516的执行顺序不作限定。
需要说明的是,至少一个数据块还可以包括第二数据块。其中,第二数据块对应的指纹的热度可以高于第一数据块对应的指纹的热度,例如第二数据块可以为热数据,第一数据块可以为冷数据。相应地,控制器0可以将第二数据块写入硬盘134,将第二数据块的元数据,如第二数据块的指纹和逻辑地址,写入逆映射表的多个分区中的第二分区。第二分区具体是用于存储热数据的元数据的热分区。第二分区的容量小于第一分区的容量。
进一步地,数据块对应的指纹的热度还可以分为更多的类型或级别,例如指纹的热度也可以分为热、温、冷三个级别。相应地,逆映射表可以包括更多的分区,例如逆映射表可以包括用于存储热数据的元数据的分区、用于存储温数据的元数据的分区和用于存储冷数据的元数据的分区。
上述S516为本申请实施例中删除第一分区中第一数据块的元数据的一种实现方式,当元数据管理结构用于存储指纹、逻辑地址和物理地址时,控制器0可以删除元数据管理结构的第一分区中第一数据块的指纹、逻辑地址和物理地址。
S518:控制器0将重删后的逆映射表中的指纹和逻辑地址写入指纹表。
具体地,控制器0还可以将重删后的逆映射表中的指纹和逻辑地址等元数据,以同步方式写入至指纹表。其中,控制器0可以以分区为粒度,将重删后的逆映射表中的元数据同步写入指纹表。例如,第一分区触发重删后,控制器0可以将第一分区重删后的元数据同步写入指纹表,第二分区触发重删后,控制器0再将第二分区重删后的元数据同步写入指纹表。考虑到分区可以触发多次重删,为了减少资源占用,控制器0可以采用增量同步机制,将重删后的元数据同步写入指纹表。
S520:当逆映射表中的至少一个分区满足淘汰条件,控制器0对至少一个分区中的元数据进行淘汰。
具体地,逆映射表中的分区可以设置用于淘汰的水位,当该分区中的元数据占用的资源量到达该水位,则控制器0可以对该分区中的元数据进行淘汰,从而避免元数据溢出。其中,由于不同分区存储有不同热度的指纹,分区的水位可以是不同的。例如,第一分区的容量为逆映射表的总容量的80%,第二分区的容量为逆映射表的总容量的20%时,第一分区的水位可以是逆映射表的总容量的70%,第一分区的水位可以是逆映射表的总容量的10%。
在一些可能的实现方式中,逆映射表中的分区的水位可以包括高水位和低水位。当分区中的元数据占用的资源量到达高水位时,可以对分区中的元数据进行淘汰,使得淘汰后的分区中元数据占用的资源量,不低于上述低水位,且不高于高水位。
控制器0对逆映射表的分区中的元数据进行淘汰,尤其是对更新频繁的热数据对应的分区中的元数据进行淘汰,可以大幅降低元数据规模,减少内存开销。
S522:控制器0将地址映射表中被重删的第一数据块的物理地址修改为第一数据块的指纹。
由于第一数据块已经从硬盘134中删除,基于地址映射表中的物理地址难以定位该第一数据块,因此,控制器0可以将地址映射表中被重删的第一数据块的物理地址修改为第一数据块的指纹,表征该第一数据块为被重删的数据块,可以通过指纹表查找到与该数据块具有相同指纹的数据块,进而确定具有相同指纹的数据块的物理地址,如此可以实现被重删的第一数据块的寻址。
基于此,未被重删的数据块仍能基于前向映射表中逻辑地址与物理地址之间的映射关系实现寻址,而不需要通过两级元数据映射,大幅缩短了寻址时间,进而缩短了响应时间,提高了响应效率。
需要说明的是,上述S518至S522为本申请实施例的可选步骤,例如内存为大容量内存时,控制器0也可以不执行将逆映射表中的数据写入指纹表,并对逆映射表中的元数据进行淘汰的步骤。
基于上述内容描述,本申请提供的数据重删方法通过对元数据管理结构进行主动分区,以差异化处理不同更新频次的数据的元数据。其中,更新不频繁的数据能够分配足够的配额资源以支持重删,而更新频繁的数据因为被频繁无效掉,因此分配的配额资源就相对较少;这样使得最终可以被重删的数据基本都可以被重删掉而不是被挤占淘汰,获得重删率的提升;同时难以重删的数据能够被淘汰,进而降低整体元数据映射规模,获得***性能提升。
进一步地,该方法还引入逆映射表这一新型元数据管理结构,当逆映射表的第一分区中存在与第一数据块的指纹相同的指纹可以触发重删,无需用户手动重删,或者周期性地触发重删,如此可以实现及时进行重删,减少元数据规模,进而减少了元数据内存开销,保障了***性能。而且,该方法在逆映射表中记录下盘的数据块的逻辑地址和物理地址,并将被重删的数据块的物理地址修改为指纹,如此可以使得未被重删的数据块仍能通过单跳映射寻址,缩短了寻址时间,提高了响应效率。
图5所示实施例的关键在于对逆映射表等元数据管理结构进行分区。其中,元数据管理结构中各个分区的容量可以根据分区决策模型确定。分区决策模型用于预测预设的分区容量组合中每个分区容量组合应用于元数据管理结构后对应的分区收益,并确定分区收益最大的分区容量组合作为所述元数据管理结构的多个分区的容量。
其中,分区容量组合表示一组分区中各个分区的容量。分区的容量是指分区所分配到的资源量。一组分区中各个分区的容量之和等于元数据管理结构的总容量。基于此,分区容量组合可以通过各分区的实际容量表征,也可以通过各分区的容量占比表征。
为了便于描述,下文均以分区容量组合通过分区容量占比示例说明。例如,一个分区容量组合可以表示为80%:20%,用于表征该元数据管理结构包括两个分区,容量分别为总容量的80%和20%。又例如,一个分区容量组合可以表示为60%:30%:10%,用于表征该元数据管理结构包括三个分区,容量分别为总容量的60%、30%和10%。
分区收益是指对元数据管理结构实施分区后所获得的收益。例如,在对元数据管理结构实施分区后可以获得重删率的提升,因此,分区收益可以为重删率。
分区决策模型可以通过预估数据的命中率,从而预测重删率。为了便于描述,以预设的分区容量组合中的第一分区容量组合示例说明。分区决策模型可以通过以下方式预测第一分区容量组合应用于所述元数据管理结构后对应的重删率:
获取第一分区容量组合应用于所述元数据管理结构所形成的多个分区中各个分区对应的工作负载特征,然后根据各个分区对应的工作负载特征,获得各个分区对应的数据分布,接着根据各个分区对应的数据分布以及各个分区的容量,获得重删率。
进一步地,考虑到工作负载可能发生变化,分区的容量还支持调整。工作负载可以为一段时间内正在使用或等待使用CPU等计算资源的任务。在业务高峰期,正在使用或等待使用CPU等计算资源的任务较多,工作负载较大,在业务低谷期,正在使用或等待使用CPU等计算资源的任务较少,工作负载较小。基于此,控制器0可以对分区进行调整。在具体工程实施过程中,分区调整需要重新进行分区初始化等操作,产生分区调整成本。基于此,分区收益可以根据收益率和分区调整成本中的至少一个确定。
在一些可能的实现方式中,控制器0可以周期性地调整元数据管理结构的多个分区的容量。其中,每个周期也可以称作分区调整周期。当到达调整时刻时,控制器0可以根据调整时刻前的周期(例如是上一分区调整周期)对应的分区收益、分区容量组合或各个分区对应的工作负载特征,确定是否调整多个分区的容量。其中,工作负载特征是指从工作负载信息中提取的特征,例如工作负载特征可以包括重用距离、重用周期、重用频次中的一种或多种。
为了便于理解,下面结合附图对本申请实施例的数据重删方法中分区过程进行详细介绍。为了便于描述,下面仍以对逆映射表分区进行示例说明。
参见图6所示的数据重删方法的流程图,在图5所示实施例基础上,控制器0在将第一数据块写入硬盘134之后还可以执行如下步骤:
S602:控制器0获取上一分区调整周期的***资源使用信息和各个分区对应的工作负载信息。
***资源包括计算资源(如CPU等处理器资源)、内存资源、磁盘资源、网络资源中的一种或多种。基于此,***资源使用信息包括CPU占用比例、内存占用比例、磁盘IO量、以及带宽占用量。
工作负载(workload)是指一段时间内正在使用或等待使用CPU等计算资源的任务。该任务可以是写数据。基于此,工作负载信息可以包括数据的重用距离(ReuseDistance)、重用周期或重用频次中的一种或多种。重用距离可以为对同一数据的相邻两次访问之间所间隔的访问次数。在统计重用距离时,可以以数据块为粒度进行统计。重用周期可以为不同写请求中对同一数据的相邻两次访问之间所间隔的写请求个数。重用频次可以是重用周期的倒数。需要说明的是,控制器0在获取重用距离、重用周期或重用频次等工作负载信息时,可以针对各个分区分别提取重用距离、重用周期或重用频次,从而获得各个分区对应的工作负载信息。
S604:控制器0从***资源使用信息中提取***资源特征,从各个分区对应的工作负载信息中提取各个分区对应的工作负载特征。
具体地,控制器0可以对***资源使用信息进行向量化,获得***资源特征,以及对工作负载信息进行向量化,获得工作负载特征。为了便于理解,下文以对CPU占用比例、重用距离的向量化进行示例说明。
在对CPU占用比例进行向量化时,控制器0可以将CPU占用比例与CPU占用阈值进行比较。其中,CPU占用阈值可以根据历史业务经验设置。例如,CPU占用阈值可以设置为70%。当CPU占用比例高于CPU占用阈值,则可以输出“1”,当CPU占用比例不高于CPU占用阈值,则可以输出“0”,具体可以参见如下公式:
其中,F表示特征,F可以采用向量表示。
类似地,参见图7所示的***资源特征提取的示意图,控制器0可以将内存占用比例、磁盘IO量、带宽占用量等***资源使用信息与该资源对应的阈值进行比较,根据比较结果输出上述***资源使用信息对应的***资源特征,例如为F(内存占用)、F(磁盘IO量)、F(带宽占用量)。
在对重用距离进行向量化时,可以累计本批次数据(如本次写请求中数据包括的数据块)的重用距离,然后由此计算出重用距离的均值和方差,具体如下所示:
类似地,控制器0可以采用和处理重用距离相同的统计方法,对重用周期、重用周期进行统计,以充分挖掘其中的时间关联性和空间关联性,从而实现从工作负载信息中提取工作负载特征。
需要说明的是,上述S602、S604为本申请实施例的可选实施方式,执行本申请实施例的方法也可以不执行上述S602、S604。例如,控制器0也可以不获取***资源使用信息,提取***资源特征。
S606:控制器0根据***资源特征和工作负载特征,获得结构化特征。
结构化特征包括***资源特征和工作负载特征。该***资源特征从***资源使用信息提取得到,该工作负载特征从工作负载信息提取得到。控制器0可以对***资源特征和工作负载特征进行融合,从而得到结构化特征。例如,控制器0可以将***资源特征和工作负责特征进行拼接,从而实现融合得到结构化特征。
其中,控制器0还可以对***资源特征进行归并。从业务角度分析,某些时刻某一***资源出现占用过高,就会造成***性能瓶颈,此时相同类型的***资源特征(也可以称作关联特征、共性影响特征)已不再必要。对于此类特征,可执行特征归并。如图8所示,控制器0可以采用“或”运算即可实现特征归并。例如,F(CPU占用)、F(内存占用)、F(磁盘IO量)、F(带宽占用量)属于共性影响特征,控制器0可以将上述共性影响特征归并。
如图9所示,控制器0通过多源信息处理,获得工作负载特征以及具有共性影响的***资源特征。在归并共性影响特征后,控制器0可以对共性影响特征进行标准化、归一化,类似地,控制器0可以在提取到工作负载特征后,对工作负载特征进行标准化、归一化。其中,标准化、归一化后的***资源特征可以为a0a1…ak,标准化、归一化后的工作负载特征可以为b0b1…bk。控制器0可以将上述***资源特征a0a1…ak以及工作负载特征b0b1…bk进行拼接,从而获得结构化特征。
控制器0通过特征归并与归一化等通用特征处理手段,对特征进行清洗处理,可实现以较低的计算开销,生成对当前情况准确刻画的特征模型,为分区决策提供可靠依据。
上述S602至S606为控制器0获取结构化特征的一种实现方式,在本申请实施例其他可能的实现方式中,控制器0也可以通过其他方式获取结构化特征。进一步地,当控制器0不获取***资源使用信息,并从中提取***资源特征时,控制器0也可以不执行上述S606。
S608:控制器0获取上一分区调整周期的反馈信息,根据上一分区调整周期的反馈信息确定是否触发分区调整。若是,则执行S610;若否,则执行S622。
控制器0可以设置分区调整的触发条件。控制器0可以根据上一分区调整周期的反馈信息,例如是上一分区调整周期的分区收益(如重删率)、各个分区对应的工作负载特征,判断分区调整的触发条件是否被满足,从而确定是否触发分区调整。
其中,针对当前分区调整周期,分区调整的触发条件可以设置为:上一分区调整周期的重删率小于预设值或者下降幅度达到预设幅度,或者上一分区调整周期的工作负载特征相对于上上分区调整周期的工作负载特征的变化满足预设条件。其中,预设值、预设幅度或预设条件可以根据历史的业务经验设置。
例如,上上分区调整周期的工作负载特征表示工作负载以大IO为主,上一分区调整周期的工作负载特征表征工作负载以小IO为主,也即上一分区调整周期的工作负载特征相对于上上分区调整周期的工作负载特征的变化较为显著,可以触发分区调整。
需要说明的是,执行本申请实施例的数据重删方法也可以不执行上述S608。例如,控制器0可以直接触发分区调整,进而根据分区决策建模的结果进行分区更新。
S610:控制器0根据所述结构化特征从建模策略集合中确定目标建模策略。
S612:控制器0根据结构化特征和反馈信息从分区收益评估策略集合中选择目标评估策略。
S614:控制器0根据所述目标评估策略确定所述分区决策模型的目标函数。
S616:控制器0根据所述结构化特征,通过所述目标建模策略和所述目标函数进行分区决策建模,获得分区决策模型。
S618:控制器0根据分区决策模型获得分区收益最大的分区容量组合。
控制器0可以根据多源信息处理所得的结构化特征,通过分区决策建模,并在前期的反馈信息,例如是上一分区调整周期的工作负载特征、重删率等先验知识的辅助下完成分区决策。如图10所示,控制器0可以根据结构化特征,从建模策略集合中进行建模策略选择,以确定目标建模策略,根据上一分区调整周期的工作负载特征、重删率等反馈信息,从分区收益评估策略集合中进行评估策略选择,以确定目标评估策略,根据该目标评估策略可以确定分区决策模型的目标函数,接着控制器0可以基于结构化特征,通过目标建模策略、目标函数进行建模,进而根据建模得到的分区决策模型获得分区收益最大的分区容量组合。其中,分区收益最大的分区容量组合也可以称作分区决策。
为了使得本申请的技术方案更加清楚、易于理解,下面结合示例对建模策略选择、评估策略选择、分区决策建模等过程进行示例说明。
以工作负载较大、***资源占用比例大的情况为例。
在该示例中,建模策略集合包括:①基于打点分区的建模策略;②基于高斯过程回归的建模策略。基于打点分区的建模策略面向一般场景,也即简单场景,基于高斯过程回归的建模策略面向复杂场景。其中,打点分区是指提供多种预设的分区容量组合,从中选择选择分区收益最大的分区容量组合。
在该示例中,结构化特征向量中工作负载特征反映出该业务场景为简单场景,此外,与CPU占用特征相关的标志位为1,表征CPU等***资源占用较高,为了避免分区决策建模占用较多的***资源,控制器0可以选择基于打点分区的建模策略进行建模。
该示例中,假设工作负载的重用距离分布服从正态分布,如下所示:
其中,σ表示方差,μ表示均值。控制器0可以采用多源信息处理所得的结构化特征中重用距离的均值μ重用距离均值和重用距离的方差σ重用距离方差拟合重用距离的概率密度函数,具体参见如下公式:
该示例以提供两个分区进行示例说明。两个分区具体为更新频繁的数据对应的热分区和更新不频繁的数据对应的冷分区,控制器0可以根据基于打点分区的建模策略,设置如下分区组合:
表1分区组合
热分区占比 | 10% | 20% | 30% | 40% | 50% | 60% | 70% | 80% | 90% |
冷分区占比 | 90% | 80% | 70% | 60% | 50% | 40% | 30% | 20% | 10% |
结合上面公式(5)的重用距离概率密度函数,控制器0可通过积分的方式获得两种类型数据分布的命中率,再通过命中率和数据占比的乘积,获得该种分区方案所获得的重删率,如下所示:
f(P)=P*∫F1+(1-P)*∫F2 (6)
其中,F1和F2分别表示两个分区对应的数据分布,具体可以通过两个分区对应的数据的重用距离的概率密度函数表示,P为一个分区的容量占比。
在该示例中,控制器0可以根据结构化特征,从分区收益评估策略集合中选择“重删率最大化”的评估策略,作为目标评估策略。也就是,控制器0可以直接以上述公式(6)的函数为目标函数,进行分区决策建模。具体地,控制器0将不同分区组合的参数代入上述目标函数,获得不同分区组合的重删率,控制器0从中选择重删率最大的分区容量组合。
上述示例是直接基于结构化特征进行评估策略选择示例说明。在一些可能的实现方式中,控制器0还可以结合其他约束条件对分区收益的评估策略进行重构。例如,在具体工程实施过程中,前后两次分区大小变化幅度不应过大,否则将会影响分区部署性能,造成不必要的开销。基于此,其他约束条件可以包括最小化分区调整成本。重构的分区收益的评估策略可以是基于重删率和分区调整成本的评估策略。
如图11所示,控制器0可以获取上一分区调整周期的反馈信息,该反馈信息可以包括工作负载特征、重删率中的一种或多种,控制器0可以根据该反馈信息调整分区收益的评估策略。具体地,上一分区调整周期的重删率小于预设值或者下降幅度达到预设幅度,控制器0可以将分区收益的评估策略调整为基于重删率和分区调整成本的评估策略。类似地,上一分区调整周期的工作负载特征相对于上上分区调整周期的工作负载特征的变化满足预设条件,控制器0可以将分区收益的评估策略调整为基于重删率和分区调整成本的评估策略。
与基于重删率的评估策略相比,基于重删率和分区调整成本的评估策略考虑了多种因素,更具有针对性,由此选出的分区容量组合也具有更高的分区收益。
分区收益的评估策略调整为基于重删率和分区调整成本的评估策略时,目标函数可以由上述公式(6)调整为:
f(P)=P*∫F1+(1-P)*∫F2-||P-P当前分区比例||2 (7)
其中,上述S610至S616为控制器0根据上一分区调整周期的工作负载特征,构建所述分区决策模型的一种实现方式。其中,S618为确定分区决策(具体为目标分区组合)的一种实现方式。需要说明的是,控制器0在建模分区决策模型时,也可以不执行上述S612、S614,例如,控制器0可以基于目标建模策略以及默认的目标函数,进行分区决策建模,获得分区决策模型。
S620:控制器0根据分区收益最大的分区容量组合对逆映射表进行分区。
分区容量组合包括不同分区的容量占比,也即不同分区所分配到的资源占比。例如,分区容量组合可以包括热分区所分配到的资源占比和冷分区所分配到的资源占比。控制器0可以根据热分区所分配到的资源占比和冷分区所分配到的资源占比,对逆映射表的***资源进行分区。
例如,分区容量组合为热分区所分配到的资源占比为20%,冷分区所分配到的资源占比为80%,控制器0可以将逆映射表中20%的存储空间分配至热分区,逆映射表中80%的存储空间分配至冷分区。
S620:控制器0将第一数据块的指纹和逻辑地址写入第一分区。
其中,第一分区是根据第一数据块的特征从多个分区中确定的分区,例如第一数据块对应的指纹具有较高热度时,第一分区可以是热分区,第一数据块对应的指纹具有较低热度时,第一分区可以是冷分区。
控制器0将第一数据块的指纹和逻辑地址写入第一分区的具体实现可以参见图5所示实施例相关内容描述,在此不再赘述。
S622:控制器0确定是否触发重删。若是,则执行S624,若否,则执行S626。
参见图5所示实施例相关内容描述,控制器0可以比较第一数据块的指纹与逆映射表的第一分区中的指纹,当第一分区中存在与第一数据块的指纹相同的指纹,可以触发重删。例如,第一分区中与第一数据块的指纹相同的指纹的数量达到预设阈值时,可以执行S624,以进行重删。
S624:控制器0基于LSM tree进行重删。
控制器0可以通过合并LSM tree的方式对第一分区中的指纹和逻辑地址进行重删,并根据逻辑地址对应的物理地址从硬盘134中重删相应的数据块,例如控制器0可以通过合并LSM tree删除第一分区中第一数据块的指纹和逻辑地址,并根据第一数据块的逻辑地址对应的物理地址,从硬盘134删除第一数据块。基于LSM tree进行重删的具体实现可以参见图5所示实施例中S514至S516相关内容描述,在此不再赘述。
S626:控制器0对逆映射表的至少一个分区中的指纹和逻辑地址进行淘汰。
逆映射表的各个分区可以设置相应的淘汰条件,当逆映射表中的分区满足对应的淘汰条件,则可以对该分区中的指纹和逻辑地址等元数据进行淘汰。具体地,控制器0可以在各分区内部,基于分区容量以及数据块对应的指纹的热度,决策需要淘汰的元数据,例如是非重删元数据的指纹和逻辑地址,部分重删元数据的指纹和逻辑地址,然后将其淘汰出逆映射表,如此可以降低元数据规模,保障***性能。
S628:控制器0将重删后的指纹和逻辑地址存放于指纹表。
S630:控制器0获取当前分区调整周期的反馈信息,以用于控制器0判断下一分区调整周期是否触发分区调整。
在本实施例中,控制器0可以获取上述反馈信息,从而协助进行分区决策调整,提高分区精度。
需要说明的是,上述S628至S630为本申请实施例的可选步骤,执行本申请实施例的数据重删方法也可以不执行上述步骤。
基于上述内容描述,本申请实施例的数据重删方法,提供一种主动分区机制,将隐式分区变为主动分区,例如将逆映射表分为热分区、冷分区,热分区以及冷分区被分配相应配额的***资源,其中,更新不频繁的数据能够分配足够的存储空间以支持重删,而更新频繁的数据因为被频繁无效掉,因此分能够配的配额资源就相对较少;这样使得最终可以被重删的数据基本都可以被重删掉而不是被挤占淘汰,获得重删率的提升;同时难以重删的数据能够被淘汰,进而降低整体元数据映射规模,获得***性能提升。
图6主要以简单场景中,控制器0采用基于打点分区的建模策略进行建模示例说明。在复杂场景中,控制器0也可以采用基于高斯过程回归的建模策略进行建模。下面对复杂场景下的建模过程进行说明。
在机器学习中,机器学习算法通常情况下是根据输入值x预测出一个最佳输出值y,用于分类或回归任务。这种情况将y看作普通的变量。某些情况下,任务并不需要预测出一个函数值,而是给出这个函数值的后验概率分布,记作p(y|x)。此时,函数值y可以视作随机变量。高斯过程回归(Gaussian Process Regression,GPR)即是对表达式未知的函数(也称黑盒函数)的一组函数值进行贝叶斯建模,给出函数值的概率分布。
在利用高斯过程回归建模分区策略模型时,可以将问题描述为在分区配置资源有限的前提下,通过合理分配各分区配置的资源占比,进而获得最大重删率。为了更好的描述问题,本实施例采用分区容量组合S来描述各个分区的资源占比,S为一个n维数组,第i个元素Si表示第i个分区的资源占比,在其他因素不变的前提下,重删率可以被视为由S决定,此时可以定义重删率与分区容量组合之间的关系为f(S)。由于f(S)不可以显式获得,本实施例采用高斯过程回归的建模策略来刻画f(S)。
基于高斯过程回归的建模策略来建模f(S),可以包括如下阶段:
初始化阶段:控制器0随机生成若干个分区容量组合并添加进集合Set。然后控制器0分别将上述分区容量组合应用于存储***,通过存储***运行得到各分区容量组合配置下的重删率。通过上述分区容量组合与重删率间的对应关系,初步建立分区容量组合与重删率之间的高斯模型G来刻画f(S)。
迭代更新阶段:高斯模型G推荐出一个分区容量组合,将该分区容量组合添加进集合Set。控制器0将该分区容量组合应用到存储***,通过存储***运行得到该配置下的重删率。控制器0将该分区容量组合及其对应的重删率反馈给高斯模型进行模型更新,重复执行迭代更新步骤L次(L为预先设定迭代次数)。
输出阶段:输出集合Set中对应重删率最高的一组分区资源配置。
如此,可以实现复杂场景下基于高斯过程回归的建模策略进行建模,并基于上述高斯模型提供重删率最高的一组分区资源配置,即目标分区组合。
为了使得本申请的技术方案更加清楚、易于理解,下面以本申请实施例的数据重删方法应用于具有全局缓存(global cache)的存储***进行示例说明。
参见图12所示的数据重删方法的应用场景示意图,针对存算分离的分布式存储***,至少一台主机上运行的客户端连接多个存储节点。存储节点如Node1、Node2可以启动重删服务进程,以执行数据重删方法。其中,存储节点还可以拉起LUN服务进程,以协助重删服务进程执行数据重删方法。
具体地,客户端可以发送写请求,写请求中包括数据,该数据可以被分为至少一个数据。对于数据块,存储节点可以先在前向映射表中记录数据位置信息后即进行数据落盘操作。然后,存储节点如Node1上的重删服务进程可以执行数据重删方法对磁盘等存储介质中的冗余数据进行识别和重删,从而显著提高用户可用容量,降低用户成本。
在数据落盘的基础上,存储节点采用异步写入的方式,将数据块的指纹和逻辑地址有序***逆映射表。该逆映射表为本申请引入的指纹元数据管理结构。对于不同更新频度的数据,存储节点采用分别构建LSM Tree的数据结构进行有效管理,该结构能够以表格合并的方式触发重删。在完成重删后,存储节点的重删服务进程将逆映射表中重删后的元数据发送至指纹表中,并相应更新前向映射表(也即LUN地址映射表)中重删数据的物理地址信息为指纹。
接着参见图13所示的数据重删方法应用于具有全局缓存的存储***的流程示意图,全局缓存的上层具有写缓存和读缓存。其中,写缓存可以用于LBA的热度统计,无需额外设计统计模块进行热度统计。
如图13所示,客户端可以通过网络发送写请求,该写请求经过全局缓存的服务端适配层到达写缓存,重删服务进程可以将写请求中数据进行分块,然后计算各个数据块的指纹。接着,重删服务进程查询指纹表。若数据块的指纹在指纹表中命中,则表明存储设备中存储具有相同指纹的数据块,重删服务进程可以直接返回写响应。若数据块的指纹在指纹表中未命中,则表明存储设备中未存储具有相同指纹的数据块,重删服务进程可以将数据块写入硬盘等存储设备,然后返回写响应。
重删服务进程还可以将数据块的指纹与逻辑地址有序***逆映射表。此外,重删服务进程还可以通过批量获取的方式,从写缓存获取LBA的热度,根据LBA的热度更新数据块对应的指纹的热度。重删服务进程还可以获取重用距离、重用周期等工作负载特征,以及获取***资源使用信息,并根据***资源使用信息获取***资源特征,重删服务进程基于上述特征进行通用特征处理,获得结构化特征。
重删服务进程根据上述结构化特征,进行分区决策建模,进而根据建模得到的分区决策模型确定分区收益最大的分区容量组合。重删服务进程基于该分区容量组合对逆映射表的***资源进行分区,具体是按照热分区所分配到的资源占比和冷分区所分配到的资源占比,对逆映射表的***资源进行分区。重删服务进程在不同分区分别构建LSM Tree的数据结构,以实现对指纹、逻辑地址等元数据进行有效管理。例如,重删服务进程可以根据LSM tree通过表格合并的方式触发重删。重删服务进程还可以根据分区容量和数据块对应的指纹的热度,决策需要淘汰的元数据,并将其从逆映射表的LSM tree中淘汰,由此缩减元数据规模。
在该示例中,重删服务进程还可以在完成重删后,将逆映射表中重删后的元数据发送至指纹表中,并通过LUN服务进程相应更新地址映射表中重删数据对应的物理地址为指纹。进一步地,重删服务进程还可以获取反馈信息,以便基于该反馈信息,在后续阶段如下一分区调整周期确定是否触发分区调整,由此可以实现更精确地分区,进而实现重删率的提升。
基于本申请实施例提供的数据重删方法,本申请实施例还提供了一种数据重删装置。接下来,从功能模块化的角度,结合附图对本申请实施例的数据重删装置进行介绍。
参见图14所示的数据重删装置的结构示意图,该装置1400包括:
通信模块1402,用于接收写请求,所述写请求中包括第一数据块;
写数据模块1404,用于将所述第一数据块写入存储设备;
所述写数据模块1404,还用于将所述第一数据块的元数据写入元数据管理结构的多个分区中的第一分区,所述第一分区为根据所述第一数据块的特征确定的,所述第一数据块的元数据包括所述第一数据块的指纹及地址信息;
重删模块1406,用于在所述第一分区中存在与所述第一数据块的指纹相同的指纹时,删除所述第一分区中所述第一数据块的元数据,并根据所述第一数据块的地址信息从所述存储设备中删除所述第一数据块。
其中,通信模块1402可以用于实现图5所示实施例中S502相关内容描述。写数据模块1404用于实现图5所示实施例中S510相关内容描述,写数据模块1404还用于实现图5所示实施例中S512相关内容描述。重删模块1406用于实现图5所示实施例中S514、S516相关内容描述。
在一些可能的实现方式中,所述第一数据块的特征为所述第一数据块对应的指纹,所述写数据模块1404具体用于:
确定所述第一数据块对应的指纹的热度;
根据所述第一数据块对应的指纹的热度确定所述热度对应的所述元数据管理结构的多个分区中的所述第一分区;
将所述第一数据块的元数据写入所述第一分区。
其中,写数据模块1404确定第一数据块对应的指纹的热度,基于该热度确定第一分区,并将元数据写入第一分区的实现可以参见图5所示实施例中S506、S512相关内容描述,在此不再赘述。
在一些可能的实现方式中,所述写数据模块1404还用于:
在将所述第一数据块的元数据写入所述第一分区之后,确定所述第一数据块的逻辑地址的热度;
将所述逻辑地址的热度累加至所述第一数据块对应的指纹的热度,以更新所述第一数据块对应的指纹的热度。
其中,写数据模块1404更新热度的实现可以参见图5所示实施例中相关内容描述,在此不再赘述。
在一些可能的实现方式中,所述写请求中还包括第二数据块,所述第二数据块对应的指纹的热度高于所述第一数据块对应的指纹的热度,所述写数据模块1404还用于:
将所述第二数据块写入所述存储设备,将所述第二数据块的元数据写入所述元数据管理结构的多个分区中的第二分区,所述第二分区的容量小于所述第一分区的容量。
其中,写数据模块1404写入第二数据块以及第二数据块的元数据的具体实现可以参考写入第一数据块及其元数据的相关内容描述,在此不再赘述。
在一些可能的实现方式中,所述元数据管理结构的多个分区的容量根据分区决策模型确定,所述分区决策模型用于预测预设的分区容量组合中每个分区容量组合应用于所述元数据管理结构后对应的分区收益,并确定分区收益最大的分区容量组合作为所述元数据管理结构的多个分区的容量,所述分区收益根据重删率和分区调整成本中的至少一个确定。
在一些可能的实现方式中,分区收益为重删率,预设的分区容量组合包括第一分区容量组合。所述装置1400还包括分区模块1408,所述分区模块1408用于通过如下方式预测所述第一分区容量组合应用于所述元数据管理结构后对应的重删率:
获取所述第一分区容量组合应用于所述元数据管理结构所形成的多个分区中各个分区对应的工作负载特征;
根据所述各个分区对应的工作负载特征,获得所述各个分区对应的数据分布;
根据所述各个分区对应的数据分布以及所述各个分区的容量,获得所述重删率。
其中,分区模块1408构建分区决策模型的具体实现可以参见图6所示实施例中S610至S616相关内容描述,在此不再赘述。
在一些可能的实现方式中,所述装置1400还包括分区模块1408,所述分区模块1408用于:
周期性地调整所述元数据管理结构的多个分区的容量;
当到达调整时刻时,根据所述调整时刻前的周期对应的分区收益、分区容量组合或各个分区对应的工作负载特征,确定是否调整所述多个分区的容量。
在一些可能的实现方式中,所述重删模块1406具体用于:
在所述第一分区中存在与所述第一数据块的指纹相同的指纹,且所述第一分区中的所述指纹的数量达到预设阈值时,删除所述第一数据块的元数据,并根据所述第一数据块的地址信息从所述存储设备中删除所述第一数据块。
其中,重删模块1406用于实现图5所示实施例中S514、S516相关内容描述。在此不再赘述。
在一些可能的实现方式中,所述第一数据块的地址信息为所述第一数据块的逻辑地址,所述写数据模块1404还用于:
将所述第一数据块的逻辑地址和物理地址写入地址映射表;
所述重删模块1406具体用于:
根据所述第一数据块的逻辑地址,从所述地址映射表中获取所述第一数据块的物理地址;
根据所述物理地址从所述存储设备中找到所述第一数据块,并删除所述第一数据块。
其中,写数据模块1404还用于实现图5所示实施例中S518相关内容描述。在此不再赘述。
在一些可能的实现方式中,所述重删模块1406还用于:
在删除所述第一分区中的所述第一数据块的元数据之后,将所述地址映射表中所述第一数据块的物理地址修改为所述第一数据块的指纹。
其中,重删模块1406还用于实现图5所示实施例中S518相关内容描述。在此不再赘述。
在一些可能的实现方式中,所述装置1400还包括:
淘汰模块1409,用于当所述逆映射表中的至少一个分区满足淘汰条件,对所述至少一个分区中的所述元数据进行淘汰。
其中,淘汰模块1409还用于实现图5所示实施例中S520相关内容描述。在此不再赘述。
根据本申请实施例的数据重删装置1400可对应于执行本申请实施例中描述的方法,并且数据重删装置1400的各个模块/单元的上述和其它操作和/或功能分别为了实现图5、图6所示实施例中的各个方法的相应流程,为了简洁,在此不再赘述。
本申请实施例还提供了一种计算机可读存储介质。所述计算机可读存储介质可以是计算机能够存储的任何可用介质或者是包含一个或多个可用介质的数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如固态硬盘)等。该计算机可读存储介质包括指令,所述指令指示计算设备或计算设备集群(例如是存储***)执行上述数据重删方法。
本申请实施例还提供了一种计算机程序产品。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机指令时,全部或部分地产生按照本申请实施例所述的流程或功能。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机或数据中心进行传输。所述计算机程序产品可以为一个软件安装包,在需要使用前述数据重删方法的任一方法的情况下,可以下载该计算机程序产品并在计算设备或计算设备集群上执行该计算机程序产品。
上述各个附图对应的流程或结构的描述各有侧重,某个流程或结构中没有详述的部分,可以参见其他流程或结构的相关描述。
Claims (25)
1.一种数据重删方法,其特征在于,所述方法包括:
接收写请求,所述写请求中包括第一数据块;
将所述第一数据块写入存储设备;
将所述第一数据块的元数据写入元数据管理结构的多个分区中的第一分区,所述第一分区为根据所述第一数据块的特征确定的,所述第一数据块的元数据包括所述第一数据块的指纹及地址信息;
在所述第一分区中存在与所述第一数据块的指纹相同的指纹时,删除所述第一分区中所述第一数据块的元数据,并根据所述第一数据块的地址信息从所述存储设备中删除所述第一数据块。
2.根据权利要求1所述的方法,其特征在于,所述第一数据块的特征为所述第一数据块对应的指纹,所述将所述第一数据块的元数据写入元数据管理结构的多个分区中的第一分区,包括:
确定所述第一数据块对应的指纹的热度;
根据所述第一数据块对应的指纹的热度确定所述热度对应的所述元数据管理结构的多个分区中的所述第一分区;
将所述第一数据块的元数据写入所述第一分区。
3.根据权利要求2所述的方法,其特征在于,在将所述第一数据块的元数据写入所述第一分区之后,所述方法还包括:
确定所述第一数据块的逻辑地址的热度;
将所述逻辑地址的热度累加至所述第一数据块对应的指纹的热度,以更新所述第一数据块对应的指纹的热度。
4.根据权利要求1至3任一项所述的方法,其特征在于,所述写请求中还包括第二数据块,所述第二数据块对应的指纹的热度高于所述第一数据块对应的指纹的热度,所述方法还包括:
将所述第二数据块写入所述存储设备,将所述第二数据块的元数据写入所述元数据管理结构的多个分区中的第二分区,所述第二分区的容量小于所述第一分区的容量。
5.根据权利要求1至4任一项所述的方法,其特征在于,所述元数据管理结构的多个分区的容量根据分区决策模型确定,所述分区决策模型用于预测预设的分区容量组合中每个分区容量组合应用于所述元数据管理结构后对应的分区收益,并确定分区收益最大的分区容量组合作为所述元数据管理结构的多个分区的容量,所述分区收益根据重删率和分区调整成本中的至少一个确定。
6.根据权利要求5所述的方法,其特征在于,所述分区收益为重删率,所述预设的分区容量组合包括第一分区容量组合,所述分区决策模型通过如下方式预测所述第一分区容量组合应用于所述元数据管理结构后对应的重删率:
获取所述第一分区容量组合应用于所述元数据管理结构所形成的多个分区中各个分区对应的工作负载特征;
根据所述各个分区对应的工作负载特征,获得所述各个分区对应的数据分布;
根据所述各个分区对应的数据分布以及所述各个分区的容量,获得所述重删率。
7.根据权利要求5或6所述的方法,其特征在于,所述方法还包括:
周期性地调整所述元数据管理结构的多个分区的容量;
当到达调整时刻时,根据所述调整时刻前的周期对应的分区收益、分区容量组合或各个分区对应的工作负载特征,确定是否调整所述多个分区的容量。
8.根据权利要求1至7任一项所述的方法,其特征在于,所述在所述第一分区中存在与所述第一数据块的指纹相同的指纹时,删除所述第一分区中所述第一数据块的元数据,并根据所述第一数据块的地址信息从所述存储设备中删除所述第一数据块,包括:
在所述第一分区中存在与所述第一数据块的指纹相同的指纹,且所述第一分区中的所述指纹的数量达到预设阈值时,删除所述第一数据块的元数据,并根据所述第一数据块的地址信息从所述存储设备中删除所述第一数据块。
9.根据权利要求1至8任一项所述的方法,其特征在于,所述第一数据块的地址信息为所述第一数据块的逻辑地址,所述方法还包括:
将所述第一数据块的逻辑地址和物理地址写入地址映射表;
所述根据所述第一数据块的地址信息从所述存储设备中删除所述第一数据块,包括:
根据所述第一数据块的逻辑地址,从所述地址映射表中获取所述第一数据块的物理地址;
根据所述物理地址从所述存储设备中找到所述第一数据块,并删除所述第一数据块。
10.根据权利要求9所述的方法,其特征在于,在删除所述第一分区中的所述第一数据块的元数据之后,所述方法还包括:
将所述地址映射表中所述第一数据块的物理地址修改为所述第一数据块的指纹。
11.根据权利要求9所述的方法,其特征在于,所述方法还包括:
当所述元数据管理结构中的至少一个分区满足淘汰条件,对所述至少一个分区中的所述元数据进行淘汰。
12.一种数据重删装置,其特征在于,所述装置包括:
通信模块,用于接收写请求,所述写请求中包括第一数据块;
写数据模块,用于将所述第一数据块写入存储设备;
所述写数据模块,还用于将所述第一数据块的元数据写入元数据管理结构的多个分区中的第一分区,所述第一分区为根据所述第一数据块的特征确定的,所述第一数据块的元数据包括所述第一数据块的指纹及地址信息;
重删模块,用于在所述第一分区中存在与所述第一数据块的指纹相同的指纹时,删除所述第一分区中所述第一数据块的元数据,并根据所述第一数据块的地址信息从所述存储设备中删除所述第一数据块。
13.根据权利要求12所述的装置,其特征在于,所述第一数据块的特征为所述第一数据块对应的指纹,所述写数据模块具体用于:
确定所述第一数据块对应的指纹的热度;
根据所述第一数据块对应的指纹的热度确定所述热度对应的所述元数据管理结构的多个分区中的所述第一分区;
将所述第一数据块的元数据写入所述第一分区。
14.根据权利要求13所述的装置,其特征在于,所述写数据模块还用于:
在将所述第一数据块的元数据写入所述第一分区之后,确定所述第一数据块的逻辑地址的热度;
将所述逻辑地址的热度累加至所述第一数据块对应的指纹的热度,以更新所述第一数据块对应的指纹的热度。
15.根据权利要求12至14任一项所述的装置,其特征在于,所述写请求中还包括第二数据块,所述第二数据块对应的指纹的热度高于所述第一数据块对应的指纹的热度,所述写数据模块还用于:
将所述第二数据块写入所述存储设备,将所述第二数据块的元数据写入所述元数据管理结构的多个分区中的第二分区,所述第二分区的容量小于所述第一分区的容量。
16.根据权利要求12至15任一项所述的装置,其特征在于,所述元数据管理结构的多个分区的容量根据分区决策模型确定,所述分区决策模型用于预测预设的分区容量组合中每个分区容量组合应用于所述元数据管理结构后对应的分区收益,并确定分区收益最大的分区容量组合作为所述元数据管理结构的多个分区的容量,所述分区收益根据重删率和分区调整成本中的至少一个确定。
17.根据权利要求16所述的装置,其特征在于,所述分区收益为重删率,所述预设的分区容量组合包括第一分区容量组合,所述分区决策模型通过如下方式预测所述第一分区容量组合应用于所述元数据管理结构后对应的重删率:
获取所述第一分区容量组合应用于所述元数据管理结构所形成的多个分区中各个分区对应的工作负载特征;
根据所述各个分区对应的工作负载特征,获得所述各个分区对应的数据分布;
根据所述各个分区对应的数据分布以及所述各个分区的容量,获得所述重删率。
18.根据权利要求16或17所述的装置,其特征在于,所述装置还包括分区模块,所述分区模块用于:
周期性地调整所述元数据管理结构的多个分区的容量;
当到达调整时刻时,根据所述调整时刻前的周期对应的分区收益、分区容量组合或各个分区对应的工作负载特征,确定是否调整所述多个分区的容量。
19.根据权利要求12至18任一项所述的装置,其特征在于,所述重删模块具体用于:
在所述第一分区中存在与所述第一数据块的指纹相同的指纹,且所述第一分区中的所述指纹的数量达到预设阈值时,删除所述第一数据块的元数据,并根据所述第一数据块的地址信息从所述存储设备中删除所述第一数据块。
20.根据权利要求12至19任一项所述的装置,其特征在于,所述第一数据块的地址信息为所述第一数据块的逻辑地址,所述写数据模块还用于:
将所述第一数据块的逻辑地址和物理地址写入地址映射表;
所述重删模块具体用于:
根据所述第一数据块的逻辑地址,从所述地址映射表中获取所述第一数据块的物理地址;
根据所述物理地址从所述存储设备中找到所述第一数据块,并删除所述第一数据块。
21.根据权利要求20所述的装置,其特征在于,所述重删模块还用于:
在删除所述第一分区中的所述第一数据块的元数据之后,将所述地址映射表中所述第一数据块的物理地址修改为所述第一数据块的指纹。
22.根据权利要求20所述的装置,其特征在于,所述装置还包括:
淘汰模块,用于当所述逆映射表中的至少一个分区满足淘汰条件,对所述至少一个分区中的所述元数据进行淘汰。
23.一种存储***,其特征在于,所述存储***包括至少一个处理器和至少一个存储器,所述至少一个存储器中存储有计算机可读指令;所述至少一个处理器执行所述计算机可读指令,以使得所述存储***执行如权利要求1至11中任一项所述的方法。
24.一种计算机可读存储介质,其特征在于,包括计算机可读指令;所述计算机可读指令用于实现权利要求1至11中任一项所述的方法。
25.一种计算机程序产品,其特征在于,包括计算机可读指令;所述计算机可读指令用于实现权利要求1至11中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/CN2023/101303 WO2023246754A1 (zh) | 2022-06-24 | 2023-06-20 | 一种数据重删方法及相关*** |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210730080 | 2022-06-24 | ||
CN2022107300800 | 2022-06-24 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117331487A true CN117331487A (zh) | 2024-01-02 |
Family
ID=89277971
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211132110.4A Pending CN117331487A (zh) | 2022-06-24 | 2022-09-16 | 一种数据重删方法及相关*** |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN117331487A (zh) |
WO (1) | WO2023246754A1 (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117931092A (zh) * | 2024-03-20 | 2024-04-26 | 苏州元脑智能科技有限公司 | 数据重删调整方法、装置、设备、存储***及存储介质 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103514250B (zh) * | 2013-06-20 | 2017-04-26 | 易乐天 | 一种全局重复数据删除的方法和***及存储装置 |
CN107329692B (zh) * | 2017-06-07 | 2020-02-28 | 杭州宏杉科技股份有限公司 | 一种数据重删的方法及存储设备 |
US11216199B2 (en) * | 2018-10-31 | 2022-01-04 | EMC IP Holding Company LLC | Applying deduplication digests to avoid same-data writes |
CN110618789B (zh) * | 2019-08-14 | 2021-08-20 | 华为技术有限公司 | 一种重复数据的删除方法及装置 |
CN111381779B (zh) * | 2020-03-05 | 2024-02-23 | 深信服科技股份有限公司 | 数据处理方法、装置、设备及存储介质 |
-
2022
- 2022-09-16 CN CN202211132110.4A patent/CN117331487A/zh active Pending
-
2023
- 2023-06-20 WO PCT/CN2023/101303 patent/WO2023246754A1/zh unknown
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117931092A (zh) * | 2024-03-20 | 2024-04-26 | 苏州元脑智能科技有限公司 | 数据重删调整方法、装置、设备、存储***及存储介质 |
CN117931092B (zh) * | 2024-03-20 | 2024-05-24 | 苏州元脑智能科技有限公司 | 数据重删调整方法、装置、设备、存储***及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
WO2023246754A1 (zh) | 2023-12-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102457611B1 (ko) | 터넌트-어웨어 스토리지 쉐어링 플랫폼을 위한 방법 및 장치 | |
US10459657B2 (en) | Storage system with read cache-on-write buffer | |
US10303797B1 (en) | Clustering files in deduplication systems | |
US9582421B1 (en) | Distributed multi-level caching for storage appliances | |
US8712963B1 (en) | Method and apparatus for content-aware resizing of data chunks for replication | |
US8639669B1 (en) | Method and apparatus for determining optimal chunk sizes of a deduplicated storage system | |
WO2019001020A1 (zh) | 基于分布式***的存储空间整理方法、装置及*** | |
CN110908589B (zh) | 数据文件的处理方法、装置、***和存储介质 | |
US10540095B1 (en) | Efficient garbage collection for stable data | |
JPWO2017149592A1 (ja) | ストレージ装置 | |
CN114253908A (zh) | 键值存储***的数据管理方法及其装置 | |
US11620263B2 (en) | Data compression using dictionaries | |
US20240231657A1 (en) | Data processing method and storage system | |
WO2023246754A1 (zh) | 一种数据重删方法及相关*** | |
CN113867627A (zh) | 一种存储***性能优化方法及*** | |
CN117312256B (zh) | 文件***、操作***和电子设备 | |
CN117312261B (zh) | 文件的压缩编码方法、装置存储介质及电子设备 | |
CN117312260B (zh) | 文件的压缩存储方法、装置、存储介质和电子设备 | |
US20240070120A1 (en) | Data processing method and apparatus | |
CN112799590B (zh) | 一种针对在线主存储重删的差异化缓存方法 | |
CN114360607A (zh) | 存储控制器、存储装置和存储装置的操作方法 | |
US20240126722A1 (en) | Doctrine of MEAN: Realizing High-performance Data Caching at Unreliable Edge | |
CN116450053B (zh) | 数据存储方法、装置、***、电子设备和存储介质 | |
US11226769B2 (en) | Large-scale storage system and data placement method in large-scale storage system | |
WO2022267508A1 (zh) | 元数据压缩方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |