CN102833298A - 分布式的重复数据删除***及其处理方法 - Google Patents

分布式的重复数据删除***及其处理方法 Download PDF

Info

Publication number
CN102833298A
CN102833298A CN201110172532XA CN201110172532A CN102833298A CN 102833298 A CN102833298 A CN 102833298A CN 201110172532X A CN201110172532X A CN 201110172532XA CN 201110172532 A CN201110172532 A CN 201110172532A CN 102833298 A CN102833298 A CN 102833298A
Authority
CN
China
Prior art keywords
fingerprint characteristic
processing unit
characteristic value
data processing
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201110172532XA
Other languages
English (en)
Inventor
朱明胜
王辉
陈志丰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Inventec Electronics Tianjin Co Ltd
Inventec Corp
Original Assignee
Inventec Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Inventec Corp filed Critical Inventec Corp
Priority to CN201110172532XA priority Critical patent/CN102833298A/zh
Priority to US13/240,360 priority patent/US20120323864A1/en
Publication of CN102833298A publication Critical patent/CN102833298A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

一种分布式的重复数据删除***及其处理方法,客户端对输入文件运行重复数据删除程序,用以生成切分数据块与相应的指纹特征值;客户端向派发服务器发送具有指纹特征值的查询要求;派发服务器纪录切分数据块的储存位置;派发服务器根据指纹特征值将查询要求转发至相应的重复数据处理装置;重复数据处理装置判断指纹特征值是否已经存在;若不存在该笔指纹特征值,则重复数据处理装置根据新的指纹特征值将新的切分数据块存储至存储服务端。

Description

分布式的重复数据删除***及其处理方法
技术领域
本发明涉及一种重复数据删除***及其方法,特别涉及一种分布式的重复数据删除***及其处理方法。
背景技术
随着因特网的兴起的缘故,因此许多网络供应者为能有效保存使用者的文件,进而在网络上提供许多存放的空间。以往是由单一服务端提供网络空间的存储服务。然而,单一服务器的运算能力有限,因此演进为多服务器以平行处理的方式来提供存储服务。这种存储方式被称为分布式存储***。
请参考图1所示,其为现有技术的存储数据示意图。一般而言,分布式存储***为能完整备份使用者的文件数据。所以会在不同服务端121中存储相同的数据。举例来说,分布式存储***是具有三个存储服务端121。当客户端111欲将100Mbytes的数据存储至网络空间中,则分布式存储***会将这100Mbytes分别存储至这三台存储服务端121中。如此一来,所有的存储服务端121就会占用掉300Mbytes的空间。若是每一个客户端111的文件均要备份在每一台存储服务端121上,这对于网络供应者而言不啻为一种沉重的负担。
发明内容
鉴于以上的问题,本发明的目的在于提供一种分布式的重复数据删除***,用以存储客户端所产生的至少一切分数据块。
本发明所揭露的分布式的重复数据删除***包括:客户端、派发服务器、重复数据处理装置(De-dup Engine)与存储服务端。客户端对输入文件进行重复数据删除程序(de-duplication),并生成切分数据块与相应的指纹特征值(Fingerprint)。
派发服务器(Dispatch Server)纪录输入文件的切分数据块的储存位置;派发服务器根据指纹特征值将查询要求转发至相应的重复数据处理装置;重复数据处理装置(Dedup.Engine)从指纹特征查找表(hash table)中查找指纹特征值是否已经存在;若指纹特征查找表中未存储指纹特征值,则重复数据处理装置根据指纹特征值将相应的切分数据块指派到存储服务端,并向客户端发送包含所指派的存储服务端的存储节点信息。
指纹特征值是由SHA-1、哈希程序(Hash)或单向算法所产生,使得每一切分数据块只能对应到唯一的指纹特征值。并且在存储服务端存储新的切分数据块后,重复数据处理装置会运行指纹特征查找表的同步处理,用以更新其它重复数据处理装置的指纹特征查找表。
本发明还提出一种重复数据删除的分布式处理方法,包括步骤:客户端接收输入文件后产生切分数据块,并向派发服务器发送具有指纹特征值的查询要求;派发服务器根据指纹特征值将查询要求转发至相应的重复数据处理装置;重复数据处理装置判断指纹特征值是否已经存在于指纹特征查找表中;若指纹特征查找表中未存储指纹特征值,则重复数据处理装置根据指纹特征值将相应的切分数据块指派到存储服务端,并向客户端发送包含所指派的存储服务端的存储节点信息;客户端根据存储节点信息将切分数据块传送至存储服务端。
本发明所提出的分布式的重复数据删除***及其方法通过分层指派与重复数据对比的处理,使得每一台数据存储服务器的数据量可以有效的降低,进而提高整体数据量的存储空间。
以下结合附图和具体实施例对本发明进行详细描述,但不作为对本发明的限定。
附图说明
图1为现有技术的存储数据示意图;
图2为本发明的架构示意图;
图3为本发明的运作流程示意图。
其中,附图标记
客户端111
服务端121
客户端211
派发服务器212
重复数据处理装置213
存储服务端214
具体实施方式
下面结合附图对本发明的结构原理和工作原理作具体的描述:
请参考图2所示,其为本发明的架构示意图。本发明分布式的重复数据删除***可以应用于局域网络或因特网之中,而本发明的分布式重复数据删除***包括:客户端211、派发服务器212(Dispatch Server)、重复数据处理装置213(De-dup Engine)与存储服务端214。客户端211用以接收输入文件,并对输入文件执行切分处理,用以进行重复数据删除的判断。
重复数据删除是一种数据缩减技术,通常用于基于磁盘的备份***,主要目的在于减少存储***中使用的存储容量。它的工作方式是在某个时间周期内查找不同文件中不同位置的重复可变大小数据块(文中将其定义为切分数据块)。重复的数据块用指示符(token)取代。采用“重复数据删除”技术可以让出更多的备份空间,不仅可以使存储服务端214上的备份数据保存更长的时间,而且还可以节约离线存储时所需的大量的带宽。
在进行重复数据删除的过程中,客户端211会对输入文件进行切分的处理。输入文件在经过切分处理后会产生多个切分数据块。随后,客户端211会对数据区块进行哈希处理,并产生相应各数据区块的一哈希值。客户端211将所得到的哈希值与储存于存储服务端21中的哈希值进行对比,并判断有无相同的哈希值。若是存在相同的哈希值时,则代表此一数据区块曾经被存放于存储服务端21中。
在本发明的客户端211在完成数据切分的处理后,会产生对应输入文件的多笔切分数据块与其指纹特征值(Fingerprint)。指纹特征值是由SHA-1程序、哈希程序(Hash)或单向算法(One way function)所产生,使得每一切分数据块只能对应到唯一的指纹特征值。客户端211发送将具有指纹特征值的查询要求传送至派发服务器212。
派发服务器212除了根据指纹特征值将该查询要求转发至相应的重复数据删除处理装置,派发服务器212还可用以纪录输入文件的切分数据块的储存位置。重复数据删除处理装置的数量是由客户端211的数量所决定。每一台重复数据处理装置213还包括指纹特征查找表,指纹特征查找表用以记录每一个切分数据块所相应的指纹特征值。重复数据处理装置213接收到指纹特征值后会进行判断该指纹特征值是否已经存在。当指纹特征查找表中不存在欲查询的指纹特征值时,重复数据删除处理装置会选取任一存储服务端214用以存放相应的切分数据块。
为能清楚说明本案的运作过程,还请参考图3所示,其为本发明的运作流程示意图,本发明包括以下步骤:
步骤S310:客户端接收输入文件后产生切分数据块,并向派发服务器发送具有指纹特征值的查询要求;
步骤S320:派发服务器根据指纹特征值将查询要求转发至相应的重复数据处理装置;
步骤S330:重复数据处理装置判断指纹特征值是否已经存在于指纹特征值查找表中;
步骤S340:若指纹特征值查找表中已存储指纹特征值,则重复数据处理装置是通过派发服务器向客户端响应该笔切分数据块已存在;
步骤S350:若指纹特征值查找表中未存储指纹特征值,则重复数据处理装置根据指纹特征值将相应的切分数据块指派到存储服务端,并向客户端发送包含所指派的存储服务端的存储节点信息;以及
步骤S360:客户端根据存储节点信息将切分数据块传送至存储服务端。
客户端211接收输入文件并执行切分处理,用以产生切分数据块。客户端211将具有指纹特征值的查询要求传送至派发服务器212发送。派发服务器212根据指纹特征值将查询要求转发至相应的重复数据处理装置213。而重复数据处理装置213可以根据指纹特征值进行取余数处理,并根据取余数处理后的结果将查询要求转发至派发服务器212。
举例来说,客户端211将输入文件切分为1024笔切分数据块,并通过SHA-1对切分数据块产生相应的指纹特征值(也是1024笔)。另假设派发服务器212的数量为3台,则分别对这1024笔指纹特征值进行取余数(意即取3的余数)。在实际运作时,可以根据派发服务器212的数量决定取余数的参数。接着,根据取余的结果将查询要求转发至相应的重复数据处理装置213。例如:余数为“0”的指纹特征值的查询要求转发至第一台重复数据处理装置213、余数为“1”的指纹特征值的查询要求转发至第二台重复数据处理装置213、余数为“2”的指纹特征值的查询要求转发至第三台重复数据处理装置213。
接下来,重复数据处理装置213接获查询要求后,重复数据处理装置213会查找指纹特征值查找表中是否存在指纹特征值。若指纹特征值查找表中已存储指纹特征值,则重复数据处理装置213是通过派发服务器212向客户端211响应该笔切分数据块已存在。反之,则重复数据处理装置213根据指纹特征值将相应的切分数据块指派到存储服务端214,并向客户端211发送包含所指派的存储服务端214的存储节点信息。而通知客户端211的方式有:派发服务器212将查询要求转发至相应的重复数据处理装置213后,并发送存储节点信息至客户端211。或者是,派发服务器212将查询要求转发至相应的重复数据处理装置213后,并通过重复数据处理装置213发送存储节点信息至客户端211。
此外,重复数据处理装置213还记录切分数据块的元数据信息(Metadata)。元数据信息用以维护切分数据块所存储服务端、在相应存储服务端上的存储位置及长度。当客户端211需要读取切分数据块时,重复数据处理装置213可通过元数据信息进而找到相应的切分数据块的位置并读取,同时也可以通过指纹特征值来确认切分数据块的正确性。
最后,当客户端211收到指定存储位置的存储节点信息,客户端211根据存储节点信息将切分数据块传送至存储服务端214。于此同时,重复数据处理装置213会执行指纹特征查找表(hash table)的同步处理,用以更新其它重复数据处理装置213中的指纹特征查找表所记录的指纹特征值与相应的切分数据块所储存的位置。当其它重复数据处理装置213在接收到已存储过的切分数据块的查询要求时,重复数据处理装置213可以实时的判断该笔切分数据块是否已经存在。
本发明所提出的分布式的重复数据删除***及其方法是通过分层指派与重复数据对比的处理,使得每一台数据存储服务器的数据量可以有效的降低,进而提高整体数据量的存储空间。
当然,本发明还可有其它多种实施例,在不背离本发明精神及其实质的情况下,熟悉本领域的技术人员当可根据本发明作出各种相应的改变和变形,但这些相应的改变和变形都应属于本发明所附的权利要求的保护范围。

Claims (9)

1.一种分布式的重复数据删除***,用以存储客户端的所产生至少一切分数据块,其特征在于,该重复数据删除***包括:
至少一存储服务端,用以存储该些切分数据块;
一客户端,将一输入文件运行一重复数据删除程序,生成该些切分数据块与相应的一指纹特征值,该客户端发送具有该指纹特征值的一查询要求,并根据一存储节点信息将该切分数据块传送至该存储服务端;
一重复数据处理装置,用以判断该指纹特征值是否已经存在,并根据新的该指纹特征值将新的该切分数据块指派到该存储服务端;以及
一派发服务器,其纪录该输入文件的该些切分数据块的储存位置,该派发服务器根据该指纹特征值将该查询要求转发至相应的该重复数据处理装置
2.根据权利要求1所述的分布式的重复数据删除***,其特征在于,该重复数据处理装置将该指纹特征值进行取余数处理,并根据取余数处理后的结果将该查询要求转发至该派发服务器。
3.根据权利要求1所述的分布式的重复数据删除***,其特征在于,该派发服务器将该查询要求转发至相应的该重复数据处理装置后,并向发送该存储节点信息至该客户端。
4.根据权利要求1所述的分布式的重复数据删除***,其特征在于,该派发服务器将该查询要求转发至相应的该重复数据处理装置后,并通过该重复数据处理装置发送该存储节点信息至该客户端。
5.根据权利要求1所述的分布式的重复数据删除***,其特征在于,该重复数据处理装置还记录该切分数据块的一元数据信息。
6.根据权利要求1所述的分布式的重复数据删除***,其特征在于,该存储服务端存储该些切分数据块后,该些重复数据处理装置运行一指纹特征查找表的一同步处理,用以更新其它该些重复数据处理装置的该指纹特征查找表。
7.一种重复数据删除的分布式处理方法,用以存储一客户端的所产生至少一切分数据块,其特征在于,该处理方法包括:
该客户端接收一输入文件后产生该些切分数据块,并向一派发服务器发送具有一指纹特征值的一查询要求;
该派发服务器根据该指纹特征值将该查询要求转发至相应的一重复数据处理装置;
该重复数据处理装置判断该指纹特征值是否已经存在于一指纹特征查找表中;
若该指纹特征查找表中未存储该指纹特征值,则该重复数据处理装置根据该指纹特征值将相应的该切分数据块指派到该存储服务端,并向该客户端发送包含所指派的该存储服务端的一存储节点信息;以及
该客户端根据该存储节点信息将该切分数据块传送至该存储服务端。
8.根据权利要求7所述的重复数据删除的分布式处理方法,其特征在于,该重复数据处理装置将该指纹特征值进行取余数处理,并根据取余数处理后的结果将该查询要求转发至该派发服务器。
9.根据权利要求7所述的重复数据删除的分布式处理方法,其特征在于,该重复数据处理装置还记录该切分数据块的一元数据信息。
CN201110172532XA 2011-06-17 2011-06-17 分布式的重复数据删除***及其处理方法 Pending CN102833298A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201110172532XA CN102833298A (zh) 2011-06-17 2011-06-17 分布式的重复数据删除***及其处理方法
US13/240,360 US20120323864A1 (en) 2011-06-17 2011-09-22 Distributed de-duplication system and processing method thereof

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201110172532XA CN102833298A (zh) 2011-06-17 2011-06-17 分布式的重复数据删除***及其处理方法

Publications (1)

Publication Number Publication Date
CN102833298A true CN102833298A (zh) 2012-12-19

Family

ID=47336268

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201110172532XA Pending CN102833298A (zh) 2011-06-17 2011-06-17 分布式的重复数据删除***及其处理方法

Country Status (2)

Country Link
US (1) US20120323864A1 (zh)
CN (1) CN102833298A (zh)

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103023796A (zh) * 2012-12-25 2013-04-03 中国科学院深圳先进技术研究院 网络数据压缩方法和***
CN103067525A (zh) * 2013-01-18 2013-04-24 广东工业大学 一种基于特征码的云存储数据备份方法
CN103177111A (zh) * 2013-03-29 2013-06-26 西安理工大学 重复数据删除***及其删除方法
CN103858125A (zh) * 2013-12-17 2014-06-11 华为技术有限公司 重复数据处理方法、装置及存储控制器和存储节点
CN103916421A (zh) * 2012-12-31 2014-07-09 ***通信集团公司 云存储数据服务装置、数据传输***、服务器及方法
CN103944988A (zh) * 2014-04-22 2014-07-23 南京邮电大学 一种适用于云存储的重复数据删除***和方法
CN104010042A (zh) * 2014-06-10 2014-08-27 浪潮电子信息产业股份有限公司 一种云服务的重复数据删除的备份机制
CN104239575A (zh) * 2014-10-08 2014-12-24 清华大学 一种虚拟机镜像文件存储、分发方法及装置
WO2015042909A1 (zh) * 2013-09-29 2015-04-02 华为技术有限公司 一种数据处理方法、***及客户端
CN105630834A (zh) * 2014-11-07 2016-06-01 中兴通讯股份有限公司 一种实现重复数据删除的方法及装置
CN105824881A (zh) * 2016-03-10 2016-08-03 中国人民解放军国防科学技术大学 一种基于负载均衡的重复数据删除数据放置方法器
CN105897921A (zh) * 2016-05-27 2016-08-24 重庆大学 一种结合指纹抽样和减少数据碎片的数据块路由方法
CN106649556A (zh) * 2016-11-08 2017-05-10 深圳市中博睿存科技有限公司 基于分布式文件***的多层重复数据删除方法及装置
CN109947731A (zh) * 2017-07-31 2019-06-28 星辰天合(北京)数据科技有限公司 重复数据的删除方法和装置

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3425493A1 (en) * 2012-12-28 2019-01-09 Huawei Technologies Co., Ltd. Data processing method and apparatus
US8937562B1 (en) 2013-07-29 2015-01-20 Sap Se Shared data de-duplication method and system
CN105612489B (zh) * 2014-09-15 2017-08-29 华为技术有限公司 重复数据删除方法和存储阵列
CN104484126B (zh) * 2014-11-13 2017-06-13 华中科技大学 一种基于纠删码的数据安全删除方法和***
CN105843551B (zh) 2015-01-29 2020-09-15 爱思开海力士有限公司 高性能和大容量储存重复删除中的数据完整性和损耗电阻
US10127237B2 (en) * 2015-12-18 2018-11-13 International Business Machines Corporation Assignment of data within file systems
CN105892953B (zh) * 2016-04-25 2019-07-26 深圳市永兴元科技股份有限公司 分布式数据处理方法及装置
KR102337673B1 (ko) * 2020-07-16 2021-12-09 (주)휴먼스케이프 데이터 열람 검증 시스템 및 그 방법

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080005141A1 (en) * 2006-06-29 2008-01-03 Ling Zheng System and method for retrieving and using block fingerprints for data deduplication
CN101706825A (zh) * 2009-12-10 2010-05-12 华中科技大学 一种基于文件内容类型的重复数据删除方法
CN101741536A (zh) * 2008-11-26 2010-06-16 中兴通讯股份有限公司 数据级容灾方法、***和生产中心节点
CN101764824A (zh) * 2010-01-28 2010-06-30 深圳市同洲电子股份有限公司 一种分布式缓存控制方法、装置及***
CN101814045A (zh) * 2010-04-22 2010-08-25 华中科技大学 一种用于备份服务的数据组织方法
CN101882141A (zh) * 2009-05-08 2010-11-10 北京众志和达信息技术有限公司 一种实现重复数据数据删除的方法和***

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080243769A1 (en) * 2007-03-30 2008-10-02 Symantec Corporation System and method for exporting data directly from deduplication storage to non-deduplication storage
JP5026213B2 (ja) * 2007-09-28 2012-09-12 株式会社日立製作所 ストレージ装置及びデータ重複排除方法
US7870105B2 (en) * 2007-11-20 2011-01-11 Hitachi, Ltd. Methods and apparatus for deduplication in storage system
US8082228B2 (en) * 2008-10-31 2011-12-20 Netapp, Inc. Remote office duplication
US8060715B2 (en) * 2009-03-31 2011-11-15 Symantec Corporation Systems and methods for controlling initialization of a fingerprint cache for data deduplication
US8442942B2 (en) * 2010-03-25 2013-05-14 Andrew C. Leppard Combining hash-based duplication with sub-block differencing to deduplicate data
US8244992B2 (en) * 2010-05-24 2012-08-14 Spackman Stephen P Policy based data retrieval performance for deduplicated data

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080005141A1 (en) * 2006-06-29 2008-01-03 Ling Zheng System and method for retrieving and using block fingerprints for data deduplication
CN101741536A (zh) * 2008-11-26 2010-06-16 中兴通讯股份有限公司 数据级容灾方法、***和生产中心节点
CN101882141A (zh) * 2009-05-08 2010-11-10 北京众志和达信息技术有限公司 一种实现重复数据数据删除的方法和***
CN101706825A (zh) * 2009-12-10 2010-05-12 华中科技大学 一种基于文件内容类型的重复数据删除方法
CN101764824A (zh) * 2010-01-28 2010-06-30 深圳市同洲电子股份有限公司 一种分布式缓存控制方法、装置及***
CN101814045A (zh) * 2010-04-22 2010-08-25 华中科技大学 一种用于备份服务的数据组织方法

Cited By (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103023796A (zh) * 2012-12-25 2013-04-03 中国科学院深圳先进技术研究院 网络数据压缩方法和***
CN103023796B (zh) * 2012-12-25 2015-08-19 中国科学院深圳先进技术研究院 网络数据压缩方法和***
CN103916421B (zh) * 2012-12-31 2017-08-25 ***通信集团公司 云存储数据服务装置、数据传输***、服务器及方法
CN103916421A (zh) * 2012-12-31 2014-07-09 ***通信集团公司 云存储数据服务装置、数据传输***、服务器及方法
CN103067525A (zh) * 2013-01-18 2013-04-24 广东工业大学 一种基于特征码的云存储数据备份方法
CN103067525B (zh) * 2013-01-18 2015-11-25 广东工业大学 一种基于特征码的云存储数据备份方法
CN103177111A (zh) * 2013-03-29 2013-06-26 西安理工大学 重复数据删除***及其删除方法
CN103177111B (zh) * 2013-03-29 2016-02-24 西安理工大学 重复数据删除***及其删除方法
US11163734B2 (en) 2013-09-29 2021-11-02 Huawei Technologies Co., Ltd. Data processing method and system and client
US10210186B2 (en) 2013-09-29 2019-02-19 Huawei Technologies Co., Ltd. Data processing method and system and client
WO2015042909A1 (zh) * 2013-09-29 2015-04-02 华为技术有限公司 一种数据处理方法、***及客户端
CN103858125A (zh) * 2013-12-17 2014-06-11 华为技术有限公司 重复数据处理方法、装置及存储控制器和存储节点
CN103944988A (zh) * 2014-04-22 2014-07-23 南京邮电大学 一种适用于云存储的重复数据删除***和方法
CN104010042A (zh) * 2014-06-10 2014-08-27 浪潮电子信息产业股份有限公司 一种云服务的重复数据删除的备份机制
CN104239575A (zh) * 2014-10-08 2014-12-24 清华大学 一种虚拟机镜像文件存储、分发方法及装置
CN105630834A (zh) * 2014-11-07 2016-06-01 中兴通讯股份有限公司 一种实现重复数据删除的方法及装置
CN105824881A (zh) * 2016-03-10 2016-08-03 中国人民解放军国防科学技术大学 一种基于负载均衡的重复数据删除数据放置方法器
CN105824881B (zh) * 2016-03-10 2019-03-29 中国人民解放军国防科学技术大学 一种基于负载均衡的重复数据删除数据放置方法
CN105897921A (zh) * 2016-05-27 2016-08-24 重庆大学 一种结合指纹抽样和减少数据碎片的数据块路由方法
CN105897921B (zh) * 2016-05-27 2019-02-26 重庆大学 一种结合指纹抽样和减少数据碎片的数据块路由方法
CN106649556A (zh) * 2016-11-08 2017-05-10 深圳市中博睿存科技有限公司 基于分布式文件***的多层重复数据删除方法及装置
CN109947731A (zh) * 2017-07-31 2019-06-28 星辰天合(北京)数据科技有限公司 重复数据的删除方法和装置

Also Published As

Publication number Publication date
US20120323864A1 (en) 2012-12-20

Similar Documents

Publication Publication Date Title
CN102833298A (zh) 分布式的重复数据删除***及其处理方法
CN109299336B (zh) 数据备份方法、装置、存储介质及计算设备
CN106096023B (zh) 数据读取方法、数据写入方法及数据服务器
EP3754515A1 (en) Reshard method and system in distributed storage system
Das et al. Big data analytics: A framework for unstructured data analysis
CN102456059A (zh) 重复数据删除的处理***
CN102375837B (zh) 数据采集***和方法
CN102790760B (zh) 安全网盘***中一种基于目录树的数据同步方法
CN105025053A (zh) 基于云存储技术的分布式文件的上传方法及其***
CN102799598A (zh) 重复数据删除的数据复原方法
CN106294352B (zh) 一种文件处理方法、装置和文件***
CN102467572B (zh) 支持重复数据删除程序的数据区块查询方法
CN103186652A (zh) 分布式的重复数据删除***及其方法
CN101158954B (zh) 一种在计算机存储中识别重复数据的方法
CN103067525A (zh) 一种基于特征码的云存储数据备份方法
CN102968498A (zh) 数据处理方法及装置
CN105159604A (zh) 一种磁盘数据读写方法和***
CN107256182A (zh) 一种数据库还原的方法及设备
CN103227818A (zh) 终端、服务器、文件传输方法、文件存储管理***和方法
CN106874348A (zh) 文件存储和索引方法、装置及读取文件的方法
CN103279502B (zh) 一种具有与并行文件***结合的重复数据删除文件***的架构及方法
CN104348859B (zh) 文件同步方法、装置、服务器、终端及***
CN102467458B (zh) 建立数据区块的索引方法
CN106708822B (zh) 一种文件存储方法和装置
CN101159795A (zh) 一种话单排重方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20121219