CN110674084A - 用于数据保护的方法、设备和计算机可读存储介质 - Google Patents

用于数据保护的方法、设备和计算机可读存储介质 Download PDF

Info

Publication number
CN110674084A
CN110674084A CN201810622741.1A CN201810622741A CN110674084A CN 110674084 A CN110674084 A CN 110674084A CN 201810622741 A CN201810622741 A CN 201810622741A CN 110674084 A CN110674084 A CN 110674084A
Authority
CN
China
Prior art keywords
metadata
format
response
size
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810622741.1A
Other languages
English (en)
Inventor
廖兰君
郑庆霄
杨广为
李科
李海涛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
EMC Corp
Original Assignee
EMC IP Holding Co LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by EMC IP Holding Co LLC filed Critical EMC IP Holding Co LLC
Priority to CN201810622741.1A priority Critical patent/CN110674084A/zh
Priority to US16/146,755 priority patent/US20190384825A1/en
Publication of CN110674084A publication Critical patent/CN110674084A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/17Details of further file system functions
    • G06F16/178Techniques for file synchronisation in file systems
    • G06F16/1794Details of file format conversion
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/13File access structures, e.g. distributed indices
    • G06F16/137Hash-based
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1415Saving, restoring, recovering or retrying at system level
    • G06F11/1435Saving, restoring, recovering or retrying at system level using file system or storage system metadata
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1446Point-in-time backing up or restoration of persistent data
    • G06F11/1448Management of the data involved in backup or backup restore
    • G06F11/1451Management of the data involved in backup or backup restore by selection of backup contents
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1446Point-in-time backing up or restoration of persistent data
    • G06F11/1458Management of the backup or restore process
    • G06F11/1464Management of the backup or restore process for networked environments
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/2053Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant
    • G06F11/2094Redundant storage or storage space
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/16File or folder operations, e.g. details of user interfaces specifically adapted to file systems
    • G06F16/164File meta data generation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/211Schema design and management
    • G06F16/213Schema design and management with details for schema evolution support

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Quality & Reliability (AREA)
  • Human Computer Interaction (AREA)
  • Library & Information Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本公开的实施例涉及用于数据保护的方法、设备和计算机可读存储介质。该方法包括:响应于获取与数据保护相关联的第一元数据,确定所述第一元数据的大小;响应于所述第一元数据的大小超过预定大小,以第一格式存储所述第一元数据的指示,以及以第二格式存储所述第一元数据,所述第一格式与固定大小的存储空间相关联,所述第二格式比所述第一格式占用更大的存储空间;响应于确定所述第一元数据的大小不超过所述预定大小,以所述第一格式存储所述第一元数据。

Description

用于数据保护的方法、设备和计算机可读存储介质
技术领域
本公开的实施例涉及数据保护,并且更具体地涉及用于数据保护的方法、设备和计算机可读存储介质。
背景技术
对于数据保护(DP)***,元数据以层次结构来记录用户、域、机器和备份的基本信息。元数据还指示了备份的真实数据的位置。为了快速查询,使用特定格式设计并按顺序存储元数据。大多数DP***使用固定大小的数据结构为每个元数据项保留空间,而不是使用动态语言或标准数据库。
在产品较长的生命周期中,随着新特征的增加,元数据的数据结构可能无法满足新的需求。因此,期望扩展DP***中的这些固定大小的元数据的数据结构以用于扩展业务和延长产品寿命。
发明内容
本公开的实施例提供了用于数据保护的方法、数据保护***、计算机可读介质和计算机程序产品。
在第一方面,提供了一种用于数据保护的方法。该方法包括:响应于获取与数据保护相关联的第一元数据,确定所述第一元数据的大小;响应于所述第一元数据的大小超过预定大小,以第一格式存储所述第一元数据的指示,以及以第二格式存储所述第一元数据,所述第一格式与固定大小的存储空间相关联,所述第二格式比所述第一格式占用更大的存储空间;响应于确定所述第一元数据的大小不超过所述预定大小,以所述第一格式存储所述第一元数据。
在第二方面,提供了一种数据保护***。该数据保护***包括:处理单元;存储器,耦合至所述处理单元并且包括存储于其上的指令,所述指令在由所述处理单元执行时使所述设备执行动作,所述动作包括:响应于获取与数据保护相关联的第一元数据,确定所述第一元数据的大小;响应于所述第一元数据的大小超过预定大小,以第一格式存储所述第一元数据的指示,以及以第二格式存储所述第一元数据,所述第一格式与固定大小的存储空间相关联,所述第二格式比所述第一格式占用更大的存储空间;响应于确定所述第一元数据的大小不超过所述预定大小,以所述第一格式存储所述第一元数据。
在第三方面,提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有机器可执行指令,当所述机器可执行指令在被至少一个处理器执行时,使得所述至少一个处理器实现根据第一方面所述的方法。
根据第四方面,提供了一种计算机程序产品,所述计算机程序产品被存储在计算机可读介质上并且包括机器可执行指令,所述机器可执行指令在被执行时使机器执行根据第一方面所述的方法。
提供发明内容部分是为了以简化的形式来介绍对概念的选择,它们在下文的具体实施方式中将被进一步描述。发明内容部分无意标识本公开的关键特征或主要特征,也无意限制本公开的范围。
附图说明
通过结合附图对本公开示例性实施例进行更详细的描述,本公开的上述以及其他目的、特征和优势将变得更加明显,其中,在本公开示例性实施例中,相同的参考标号通常代表相同部件。
图1示出了根据本公开的一些实施例的元数据的层级结构的示意图;
图2示出了根据本公开的一些实施例的用于数据保护的方法的流程图;
图3示出了根据本公开的一些实施例的创建元数据的示意图;
图4示出了根据本公开的一些实施例的查询元数据的示意图;以及
图5示出了根据本公开的一些实施例的可以用来实施本公开的实施例的示例设备的示意性框图。
具体实施方式
下面将参照附图更详细地描述本公开的优选实施例。虽然附图中显示了本公开的优选实施例,然而应该理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了使本公开更加透彻和完整,并且能够将本公开的范围完整地传达给本领域的技术人员。
在本文中使用的术语“包括”及其变形表示开放性包括,即“包括但不限于”。除非特别申明,术语“或”表示“和/或”。术语“基于”表示“至少部分地基于”。术语“一个示例实施例”和“一个实施例”表示“至少一个示例实施例”。术语“另一实施例”表示“至少一个另外的实施例”。术语“第一”、“第二”等等可以指代不同的或相同的对象。下文还可能包括其他明确的和隐含的定义。
元数据是提供关于其他数据的信息的数据。图1示出了根据本公开的一些实施例的服务器的元数据的层级结构。如图1所示,根节点102下包括一个或多个域,例如,客户端104、备份106和***108。每一个域可以包括一个或多个机器,例如,如图1所示,客户端104包括机器110、112和114,每一台机器可以运行相同或不同的操作***。与根节点102到机器110、112和114相关的元数据可以被称为机器元数据,其可以以列表的形式存储在用户数据条带文件120中。
例如,机器元数据可以记录注册的客户端的信息。在数据保护***中,对于一些字段保留了预定长度(例如,64字节长度),这对于真正的机器名称完全足够。然而,对于云平台生成的新的字段,长度限制可能需要扩展到256字节,这将会导致错误的出现。
在机器的运行过程中,会产生备份数据。图1示出了与机器110的备份数据相关联的元数据116,也称备份元数据。例如,元数据116可以记录备份的时间、类型、位置等信息,并且可以以列表形式存储在数据条带文件140中。在数据保护***支持新的备份类型时,需要一些新的备份字段来呈现一些新的逻辑。因此,需要对备份元数据进行扩充。
基于此,本公开的实施例提供了一种用于数据保护的方案,特别是扩展已知的数据保护***的元数据的数据结构的方案。
图2示出了根据本公开的一些实施例的用于数据保护的方法200的流程图。在框202,响应于获取与数据保护相关联的元数据,确定该元数据的大小。例如,元数据可以是结合图1所描述的机器元数据或备份元数据。
在框204,确定元数据的大小是否超过预定大小。预定大小可以是传统格式或传统数据结构能接受的最大可能的大小,这可以与元数据的类型或者相应的字段相关联。
如果在框204确定元数据的大小超过预定大小,则方法200可以前进至框206。在框206,可以以第一格式存储该元数据的指示,并以第二格式来存储该元数据。第一格式与固定大小的存储空间相关联,并且第二格式比第一格式占用更大的存储空间。例如,第一格式可以包括第一数据结构,其可以指定固定大小的存储空间,例如,其可以是位置寻址的存储方式。第二格式可以包括第二数据结构,其可以用于存储常规的数据保护***不支持的数据项,例如,其可以使用内容寻址的存储方式。在一些实施例中,第一格式的数据可以存储在一个或多个列表中,第二格式的数据可以存储在与之不同的一个或多个列表中。在一些实施例中,可以以第二格式同时存储元数据的指示和元数据两者,以提供进一步的校验,特别是在具有位置冲突的情况下。
如果在框204确定元数据的大小不超过预定大小,则方法200可以前进至框208。在框208,可以以第一格式存储该元数据。例如,在数据保护***中,可以仍然使用遗留数据结构来记录和显示遗留数据项。在服务器正在运行时,已经以紧凑的遗留数据结构在服务器中记录了大量的遗留数据项。方法200使得这些数据项可以保持其原来的工作方式。
在一些实施例中,元数据的指示可以是该元数据的哈希值。例如,使用元数据的哈希值等引用来替换元数据的遗留数据结构。尽管遗留数据结构比扩展数据结构小,但是足以保存元数据的哈希值。例如,可以将第一数据结构的元数据和第二数据结构的元数据的指示(例如,哈希值)保存在一个字段中。可以容易地识别该数据结构是第一数据结构还是第二数据结构。扩展数据可以基于内容寻址存储(CAS)记录文件的指示(例如,哈希值)来检索。根据哈希值添加和查询位置具有较高的性能。然而,应当理解,也可以使用已知的或将来开发的其他类型的指示来代替哈希值,例如使用索引等方法。
图3示出了根据本公开的一个实施例的元数据的示意图。元数据302的大小超过了预定大小,因而需要对其进行扩展。在添加这样的元数据的数据项时,可以在服务器中创建一个附加的记录文件320。例如,扩展数据项基于内容寻址存储(CAS)的形式被保存在记录文件320中。扩展数据项的哈希值306是指示数据结构在记录文件320中的位置的键(key)。
如图3所示,函数(fun)可以将元数据302的哈希值304均匀分布在0到1的范围内,然后乘以记录文件320的长度以获得元数据302的位置。该位置表示元数据302的记录文件中的一个桶(bucket)310。例如,一个桶可以包括10-20个数据项。
对于大多数情况,桶310中的第一个位置就是哈希值304的项目。例如,在桶310中,在第一个位置处存储了哈希值306和元数据308,哈希值306通常与哈希值304匹配。在一些情况下,桶310中的第一个位置被另一个具有相同位置的数据项占用。在这种情况下,可以转到该桶310的下一个位置,直到找到用于添加操作的空白位置,或者为查询操作找到相同的哈希值。例如,如果桶310已满并且需要将新的数据项添加到桶310,则可以增加桶310的大小,例如将桶310的大小翻倍。如果在一个记录文件中具有位置冲突的数据项越多,在执行添加或查询操作时就要执行越多的比较。
在一些实施例中,方法200包括响应于接收到针对元数据的查询,可以从查询指示的存储位置来读取相应的数据。如果该数据是元数据,则可以直接将该数据作为元数据提供。相反,如果确定该数据是元数据的指示(例如,哈希值),则可以基于元数据的指示来读取该元数据。例如,在指示是哈希值的情况下,可以基于该哈希值确定元数据的位置,并从该位置来读取元数据。为了更清楚地描述查询过程,
图4示出了根据本公开的一些实施例的用于查询元数据的方法的示意图。如图4所示,列表420是表示机器401-408的元数据的列表,其中机器403、404和407存储的是相应的元数据的指示,例如哈希值。列表420可以是位置寻址的存储方式。在记录文件440中,存储了相应的元数据及其指示,并且可以是内容寻址的存储方式。例如,在413、414和417处分别存储了与403、404和407相对应的指示,并在423、424和427处分别存储了403、404和407相对应的元数据。
例如,在接收到针对与机器403相关联的元数据的查询时,可以在列表420中找到与机器403相关的数据。在这种情况下,由于在列表420中,存储的并非元数据本身,而是其哈希值,则可以基于哈希值来确定元数据的存储位置,例如,在记录文件440中的位置,并从列表440中读取元数据423。在这种情况下,还可以通过哈希值413来判断是否寻址到了相应的元数据,以防出现位置冲突的情况。例如,在接收到针对与机器401相关联的元数据的查询时,可以在列表420中找到与机器401相关的数据。在这种情况下,由于在列表420中存储的是元数据本身,则可以直接返回相应的元数据。
在一些实施例中,可以将记录文件(例如,记录文件320、440)复制到远程服务器,以用于备份。在灾难恢复时,可以从远程服务器获取记录文件以用于恢复。记录文件是获取元数据的真实信息的核心。因此,记录文件可以被备份并复制到远程服务器。在复制之后,指示或引用的功能可以被传递到远程服务器。另外,在灾难恢复时,与可以恢复相同的记录文件。
根据本公开的实施例,该方法可以兼容目前的数据保护***,并在升级过程中不需要对目前的数据保护***进行大量的更新操作。此外,由于仅对新型的元数据执行更深一层次的操作,节省了存储空间。由于利用了基于内容寻址的存储方式,因而对性能并没有显著的影响。由于元数据的指示(例如,哈希值)与遗留元数据等价地存储和维护在列表中,因此与遗留元数据具有相同的层次结构,这可以节省频繁转换数据项的工作。
图5示出了一个可以用来实施本公开的实施例的设备500的示意性框图。如图所示,设备500包括中央处理单元(CPU)501,其可以根据存储在只读存储器(ROM)502中的计算机程序指令或者从存储单元508加载到随机访问存储器(RAM)503中的计算机程序指令,来执行各种适当的动作和处理。在RAM 503中,还可存储设备500操作所需的各种程序和数据。CPU 501、ROM 502以及RAM 503通过总线504彼此相连。输入/输出(I/O)接口505也连接至总线504。
设备500中的多个部件连接至I/O接口505,包括:输入单元506,例如键盘、鼠标等;输出单元507,例如各种类型的显示器、扬声器等;存储单元508,例如磁盘、光盘等;以及通信单元509,例如网卡、调制解调器、无线通信收发机等。通信单元509允许设备500通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
上文所描述的各个过程和处理,例如方法200,可由处理单元501执行。例如,在一些实施例中,方法200可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元508。在一些实施例中,计算机程序的部分或者全部可以经由ROM 502和/或通信单元509而被载入和/或安装到设备500上。当计算机程序被加载到RAM 503并由CPU 501执行时,可以执行上文描述的方法200的一个或多个步骤。
本公开可以是方法、装置、***和/或计算机程序产品。计算机程序产品可以包括计算机可读存储介质,其上载有用于执行本公开的各个方面的计算机可读程序指令。
计算机可读存储介质可以是可以保持和存储由指令执行设备使用的指令的有形设备。计算机可读存储介质例如可以是――但不限于――电存储设备、磁存储设备、光存储设备、电磁存储设备、半导体存储设备或者上述的任意合适的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、静态随机存取存储器(SRAM)、便携式压缩盘只读存储器(CD-ROM)、数字多功能盘(DVD)、记忆棒、软盘、机械编码设备、例如其上存储有指令的打孔卡或凹槽内凸起结构、以及上述的任意合适的组合。这里所使用的计算机可读存储介质不被解释为瞬时信号本身,诸如无线电波或者其他自由传播的电磁波、通过波导或其他传输媒介传播的电磁波(例如,通过光纤电缆的光脉冲)、或者通过电线传输的电信号。
这里所描述的计算机可读程序指令可以从计算机可读存储介质下载到各个计算/处理设备,或者通过网络、例如因特网、局域网、广域网和/或无线网下载到外部计算机或外部存储设备。网络可以包括铜传输电缆、光纤传输、无线传输、路由器、防火墙、交换机、网关计算机和/或边缘服务器。每个计算/处理设备中的网络适配卡或者网络接口从网络接收计算机可读程序指令,并转发该计算机可读程序指令,以供存储在各个计算/处理设备中的计算机可读存储介质中。
用于执行本公开操作的计算机程序指令可以是汇编指令、指令集架构(ISA)指令、机器指令、机器相关指令、微代码、固件指令、状态设置数据、或者以一种或多种编程语言的任意组合编写的源代码或目标代码,所述编程语言包括面向对象的编程语言—诸如Smalltalk、C++等,以及常规的过程式编程语言—诸如“C”语言或类似的编程语言。计算机可读程序指令可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络—包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。在一些实施例中,通过利用计算机可读程序指令的状态信息来个性化定制电子电路,例如可编程逻辑电路、现场可编程门阵列(FPGA)或可编程逻辑阵列(PLA),该电子电路可以执行计算机可读程序指令,从而实现本公开的各个方面。
这里参照根据本公开实施例的方法、装置(***)和计算机程序产品的流程图和/或框图描述了本公开的各个方面。应当理解,流程图和/或框图的每个方框以及流程图和/或框图中各方框的组合,都可以由计算机可读程序指令实现。
这些计算机可读程序指令可以提供给通用计算机、专用计算机或其它可编程数据处理装置的处理单元,从而生产出一种机器,使得这些指令在通过计算机或其它可编程数据处理装置的处理单元执行时,产生了实现流程图和/或框图中的一个或多个方框中规定的功能/动作的装置。也可以把这些计算机可读程序指令存储在计算机可读存储介质中,这些指令使得计算机、可编程数据处理装置和/或其他设备以特定方式工作,从而,存储有指令的计算机可读介质则包括一个制造品,其包括实现流程图和/或框图中的一个或多个方框中规定的功能/动作的各个方面的指令。
也可以把计算机可读程序指令加载到计算机、其它可编程数据处理装置、或其它设备上,使得在计算机、其它可编程数据处理装置或其它设备上执行一系列操作步骤,以产生计算机实现的过程,从而使得在计算机、其它可编程数据处理装置、或其它设备上执行的指令实现流程图和/或框图中的一个或多个方框中规定的功能/动作。
附图中的流程图和框图显示了根据本公开的多个实施例的***、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或指令的一部分,所述模块、程序段或指令的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的***来实现,或者可以用专用硬件与计算机指令的组合来实现。
以上已经描述了本公开的各实施例,上述说明是示例性的,并非穷尽性的,并且也不限于所披露的各实施例。在不偏离所说明的各实施例的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。本文中所用术语的选择,旨在最好地解释各实施例的原理、实际应用或对市场中的技术的技术改进,或者使本技术领域的其它普通技术人员能理解本文披露的各实施例。

Claims (11)

1.一种用于数据保护的方法,包括:
响应于获取与数据保护相关联的第一元数据,确定所述第一元数据的大小;
响应于所述第一元数据的大小超过预定大小,
以第一格式存储所述第一元数据的指示,以及
以第二格式存储所述第一元数据,所述第一格式与固定大小的存储空间相关联,所述第二格式比所述第一格式占用更大的存储空间;
响应于确定所述第一元数据的大小不超过所述预定大小,以所述第一格式存储所述第一元数据。
2.根据权利要求1所述的方法,其中所述第一元数据的指示是所述第一元数据的哈希值。
3.根据权利要求1所述的方法,还包括:
响应于接收到针对第二元数据的查询,从由所述查询指示的存储位置读取数据;以及
响应于确定所读取的数据是所述第二元数据的指示,基于所述第二元数据的指示,读取所述第二元数据。
4.根据权利要求1所述的方法,还包括:
响应于接收到针对第二元数据的查询,从由所述查询指示的存储位置读取数据;以及
响应于确定所读取的数据是所述第二元数据,提供所述第二元数据。
5.根据权利要求1所述的方法,还包括:
响应于确定所述第一元数据的大小超过所述预定大小,将所述第一元数据复制到另一服务器。
6.一种用于数据保护的设备,包括:
处理单元;
存储器,耦合至所述处理单元并且包括存储于其上的指令,所述指令在由所述处理单元执行时使所述设备执行动作,所述动作包括:
响应于获取与数据保护相关联的第一元数据,确定所述第一元数据的大小;
响应于所述第一元数据的大小超过预定大小,
以第一格式存储所述第一元数据的指示,以及
以第二格式存储所述第一元数据,所述第一格式与固定大小的存储空间相关联,所述第二格式比所述第一格式占用更大的存储空间;
响应于确定所述第一元数据的大小不超过所述预定大小,以所述第一格式存储所述第一元数据。
7.根据权利要求6所述的设备,其中所述第一元数据的指示是所述第一元数据的哈希值。
8.根据权利要求6所述的设备,还包括:
响应于接收到针对第二元数据的查询,从由所述查询指示的存储位置读取数据;以及
响应于确定所读取的数据是所述第二元数据的指示,基于所述第二元数据的指示,读取所述第二元数据。
9.根据权利要求6所述的设备,还包括:
响应于接收到针对第二元数据的查询,从由所述查询指示的存储位置读取数据;以及
响应于确定所读取的数据是所述第二元数据,提供所述第二元数据。
10.根据权利要求6所述的设备,还包括:
响应于确定所述第一元数据的大小超过所述预定大小,将所述第一元数据复制到另一服务器。
11.一种计算机可读存储介质,所述计算机可读存储介质上存储有机器可执行指令,当所述机器可执行指令在被至少一个处理器执行时,使得所述至少一个处理器实现根据权利要求1-5中任一项所述的方法。
CN201810622741.1A 2018-06-15 2018-06-15 用于数据保护的方法、设备和计算机可读存储介质 Pending CN110674084A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201810622741.1A CN110674084A (zh) 2018-06-15 2018-06-15 用于数据保护的方法、设备和计算机可读存储介质
US16/146,755 US20190384825A1 (en) 2018-06-15 2018-09-28 Method and device for data protection and computer readable storage medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810622741.1A CN110674084A (zh) 2018-06-15 2018-06-15 用于数据保护的方法、设备和计算机可读存储介质

Publications (1)

Publication Number Publication Date
CN110674084A true CN110674084A (zh) 2020-01-10

Family

ID=68840029

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810622741.1A Pending CN110674084A (zh) 2018-06-15 2018-06-15 用于数据保护的方法、设备和计算机可读存储介质

Country Status (2)

Country Link
US (1) US20190384825A1 (zh)
CN (1) CN110674084A (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112612651B (zh) * 2021-01-06 2023-11-28 新华三技术有限公司 一种数据保护方法、装置、电子设备及存储介质
CN113535092B (zh) * 2021-07-20 2024-05-17 阿里巴巴创新公司 用于减少内存元数据的存储引擎、方法和可读介质
CN114238548A (zh) * 2021-11-25 2022-03-25 上海序言泽网络科技有限公司 索引用存储***、方法、电子设备和可读存储介质
CN117668090B (zh) * 2024-02-01 2024-06-04 安徽容知日新科技股份有限公司 数据交换方法、装置、电子设备和计算机可读存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150317339A1 (en) * 2014-05-04 2015-11-05 Symantec Corporation Systems and methods for aggregating information-asset metadata from multiple disparate data-management systems
CN105740303A (zh) * 2014-12-12 2016-07-06 国际商业机器公司 改进的对象存储的方法及装置
CN107667351A (zh) * 2015-05-27 2018-02-06 谷歌公司 用于移动设备上的自动基于云的全数据备份和恢复的***和方法
US20180096030A1 (en) * 2014-11-10 2018-04-05 International Business Machines Corporation Materialized query tables with shared data

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150317339A1 (en) * 2014-05-04 2015-11-05 Symantec Corporation Systems and methods for aggregating information-asset metadata from multiple disparate data-management systems
US20180096030A1 (en) * 2014-11-10 2018-04-05 International Business Machines Corporation Materialized query tables with shared data
CN105740303A (zh) * 2014-12-12 2016-07-06 国际商业机器公司 改进的对象存储的方法及装置
CN107667351A (zh) * 2015-05-27 2018-02-06 谷歌公司 用于移动设备上的自动基于云的全数据备份和恢复的***和方法

Also Published As

Publication number Publication date
US20190384825A1 (en) 2019-12-19

Similar Documents

Publication Publication Date Title
US10235244B2 (en) Block level backup of virtual machines for file name level based file search and restoration
CN110674084A (zh) 用于数据保护的方法、设备和计算机可读存储介质
CN113760971B (zh) 用于检索图数据库的数据的方法、计算设备和存储介质
US10585760B2 (en) File name level based file search and restoration from block level backups of virtual machines
CN107203574B (zh) 数据管理和数据分析的聚合
US20170154050A1 (en) Optimized content object storage service for large scale content
CN110795399B (zh) 一种为应用产生机器id的方法、装置和***
CN111858577B (zh) 存储管理的方法、设备和计算机程序产品
CN109885577B (zh) 数据处理方法、装置、终端及存储介质
US11175993B2 (en) Managing data storage system
CN111143113B (zh) 复制元数据的方法、电子设备和计算机程序产品
CN109726039B (zh) 用于管理虚拟机的方法和设备
CN111104249A (zh) 用于数据备份的方法、设备和计算机程序产品
CN111143231A (zh) 用于数据处理的方法、设备和计算机程序产品
CN110968417A (zh) 管理存储单元的方法、装置、***和计算机程序产品
CN112000971B (zh) 一种文件权限记录方法、***及相关装置
CN112231288A (zh) 日志存储方法和装置、介质
CN113590543A (zh) 信息处理的方法、设备和计算机程序产品
US11243932B2 (en) Method, device, and computer program product for managing index in storage system
CN110609731A (zh) 用于管理虚拟机的方法、设备和计算机程序产品
CN111104787B (zh) 用于比较文件的方法、设备和计算机程序产品
US20200133792A1 (en) Method, apparatus, and computer program product for managing virtual machine
CN111858145B (zh) 数据备份与恢复的方法、设备和计算机程序产品
CN110750268A (zh) 文件清理方法、装置、计算机可读存储介质及电子设备
CN111858144A (zh) 存储管理的方法、设备和计算机程序产品

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20200110