CN109086172B - 一种数据处理的方法以及相关装置 - Google Patents

一种数据处理的方法以及相关装置 Download PDF

Info

Publication number
CN109086172B
CN109086172B CN201811108304.4A CN201811108304A CN109086172B CN 109086172 B CN109086172 B CN 109086172B CN 201811108304 A CN201811108304 A CN 201811108304A CN 109086172 B CN109086172 B CN 109086172B
Authority
CN
China
Prior art keywords
target data
storage device
identifier
data packet
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811108304.4A
Other languages
English (en)
Other versions
CN109086172A (zh
Inventor
何孝金
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhengzhou Yunhai Information Technology Co Ltd
Original Assignee
Zhengzhou Yunhai Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhengzhou Yunhai Information Technology Co Ltd filed Critical Zhengzhou Yunhai Information Technology Co Ltd
Priority to CN201811108304.4A priority Critical patent/CN109086172B/zh
Publication of CN109086172A publication Critical patent/CN109086172A/zh
Application granted granted Critical
Publication of CN109086172B publication Critical patent/CN109086172B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1446Point-in-time backing up or restoration of persistent data
    • G06F11/1458Management of the backup or restore process
    • G06F11/1464Management of the backup or restore process for networked environments

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请实施例公开了一种数据处理的方法,包括:第一存储设备读取目标数据;第一存储设备检测目标数据是否存在对应的第一标识以及对应的第二标识,其中,第二标识用于标记目标数据经过压缩处理;若目标数据存在对应的第一标识以及对应的第二标识,则第一存储设备向第二存储设备发送第一目标数据包。本申请实施例还公开了一种数据处理装置。本申请实施例减轻了主存储设备和备份存储设备数据处理的负担。

Description

一种数据处理的方法以及相关装置
技术领域
本申请涉及数据存储领域,尤其涉及一种数据处理的方法以及相关装置。
背景技术
远程复制技术是一种基于存储设备的远程数据备份技术,通常分为同步远程复制和异步远程复制。同步远程复制主要原理是数据需要同时写到主存储设备和备份存储设备上,异步远程复制的主要原理则是将数据先写到主存储设备上,后续将数据从主存储设备复制到备份存储设备上。
大数据时代中,海量的数据存储占用大量的存储空间。重删处理技术以及压缩处理技术是当前可减少数据存储空间的核心技术,尤其在存储空间成本较高的全闪存存储阵列(all flash array,AFA),重删处理技术以及压缩处理技术已经成为AFA中必备的特性。重删处理技术通常为:将新写入的数据计算一个哈希值,然后与已存储的哈希值对比,如果发现有相同哈希值,则记录相同哈希值对应数据的位置,当前数据不写入存储设备中。
然而,在现有的远程复制技术中,主存储设备与备份存储设备之间进行目标数据的复制时,并不感知目标数据是否进行重删处理和压缩处理,导致在数据复制的时候,即使目标数据已进行了重删处理和压缩处理,主存储设备还是会对目标数据进行解压缩后发送至备份存储设备,备份存储设备对解压缩后的目标数据再次进行重删处理和压缩处理。由此,不仅加重了主存储设备和备份存储设备数据处理的负担,同时主存储设备和备份存储设备之间传输的数据量很大,导致异步远程复制时复原点目标(recovery pointobjective,RPO)很高。
发明内容
本申请实施例提供了一种数据处理的方法,用于存储设备的远程数据备份。
有鉴于此,本申请第一方面提供了一种数据处理的方法,包括:
第一存储设备读取目标数据;
该第一存储设备检测该目标数据是否存在对应的第一标识以及对应的第二标识,其中,该第二标识用于标记该目标数据经过压缩处理;
若该目标数据存在对应的该第一标识以及对应的该第二标识,则该第一存储设备向第二存储设备发送第一目标数据包,以使得该第二存储设备根据该第一目标数据包对该目标数据进行处理;
其中,该第一目标数据包中至少携带该目标数据、该第一标识以及该第二标识,该第一标识用于指示该第二存储设备根据该第一标识对该目标数据进行重删处理,该第二标识用于指示该第二存储设备对该目标数据进行写入处理。
结合本申请实施例的第一方面,在第一方面的第一种可能的实现方式中,该第一存储设备检测该目标数据是否存在对应的第一标识以及对应的第二标识之后,该方法还包括:
若该目标数据不存在对应的该第一标识以及对应的该第二标识,则该第一存储设备向该第二存储设备发送第二目标数据包,以使得该第二存储设备根据该第二目标数据包对该目标数据进行处理;
其中,该第二数据包中至少携带该目标数据以及第三标识,该第三标识用于指示该第二存储设备对该目标数据进行压缩处理。
结合本申请实施例的第一方面的第一种可能的实现方式,在第一方面的第二种可能的实现方式中,该第一存储设备读取该目标数据之后,该方法还包括:
若该目标数据存储于该第一存储设备的缓存区域,则该第一存储设备向该第二存储设备发送该第二目标数据包,以使得该第二存储设备根据该第二目标数据包对该目标数据进行处理;
其中,该第二数据包中至少携带该目标数据以及该第三标识。
结合本申请实施例的第一方面,在第一方面的第三种可能的实现方式中,该第一存储设备检测该目标数据是否存在对应的第一标识以及对应的第二标识之后,该方法还包括:
若该目标数据存在对应的该第一标识且不存在对应的该第二标识,则该第一存储设备向该第二存储设备发送第三目标数据包,以使得该第二存储设备根据该第三目标数据包对该目标数据进行处理;
其中,该第三目标数据包中至少携带该目标数据、该第一标识以及该第三标识。
结合本申请实施例的第一方面,在第一方面的第四种可能的实现方式中,该第一存储设备检测该目标数据是否存在对应的第一标识以及对应的第二标识之后,该方法还包括:
若该目标数据不存在对应的该第一标识且存在对应的该第二标识,则该第一存储设备向该第二存储设备发送第四目标数据包,以使得该第二存储设备根据该第四目标数据包对该目标数据进行处理;
其中,该第四目标数据包中至少携带该目标数据以及该第二标识。
本申请第二方面提供了一种数据处理装置,该数据处理装置包括:
读取模块,用于读取目标数据;
检测模块,用于检测该目标数据是否存在对应的第一标识以及对应的第二标识,其中,该第二标识用于标记该目标数据经过压缩处理;
发送模块,用于若该目标数据存在对应的该第一标识以及对应的该第二标识,则该发送模块向第二存储设备发送第一目标数据包,以使得该第二存储设备根据该第一目标数据包对该目标数据进行处理;
其中,该第一目标数据包中至少携带该目标数据、该第一标识以及该第二标识,该第一标识用于指示该第二存储设备根据该第一标识对该目标数据进行重删处理,该第二标识用于指示该第二存储设备对该目标数据进行写入处理。
结合本申请实施例的第二方面,在第二方面的第一种可能的实现方式中,提供了一种数据处理装置,包括:
该发送模块,还用于若该目标数据不存在对应的该第一标识以及对应的该第二标识,则该发送模块向该第二存储设备发送第二目标数据包,以使得该第二存储设备根据该第二目标数据包对该目标数据进行处理;
其中,该第二数据包中至少携带该目标数据以及第三标识,该第三标识用于指示该第二存储设备对该目标数据进行压缩处理。
结合本申请实施例的第二方面的第一种可能的实现方式,在第二方面的第二种可能的实现方式中,提供了一种数据处理装置,包括:
该发送模块,还用于若该目标数据存储于该第一存储设备的缓存区域,则该发送模块向该第二存储设备发送该第二目标数据包,以使得该第二存储设备根据该第二目标数据包对该目标数据进行处理;
其中,该第二数据包中至少携带该目标数据以及该第三标识。
结合本申请实施例的第二方面,在第二方面的第三种可能的实现方式中,提供了一种数据处理装置,包括:
该发送模块,还用于若该目标数据存在对应的该第一标识且不存在对应的该第二标识,则该发送模块向该第二存储设备发送第三目标数据包,以使得该第二存储设备根据该第三目标数据包对该目标数据进行处理;
其中,该第三目标数据包中至少携带该目标数据、该第一标识以及该第三标识。
结合本申请实施例的第二方面,在第二方面的第四种可能的实现方式中,提供了一种数据处理装置,包括:
该发送模块,还用于若该目标数据不存在对应的该第一标识且存在对应的该第二标识,则该发送模块向该第二存储设备发送第四目标数据包,以使得该第二存储设备根据该第四目标数据包对该目标数据进行处理;
其中,该第四目标数据包中至少携带该目标数据以及该第二标识。
从以上技术方案可以看出,本申请实施例具有以下优点:
本申请实施例提供了一种数据处理的方法,用于存储设备的远程数据备份。减轻了主存储设备和备份存储设备数据处理的负担,同时降低了主存储设备和备份存储设备之间传输的数据量,降低了异步远程复制时的复原点目标。
附图说明
图1为本申请实施例中存储设备的网络框架示意图;
图2为本申请的应用场景中数据处理的一个流程示意图;
图3为本申请实施例中数据处理的方法的一个实施例示意图;
图4为本申请实施例中数据处理装置的一个实施例示意图。
具体实施方式
本申请实施例提供了一种数据处理的方法,用于存储设备的远程数据备份。减轻了主存储设备和备份存储设备数据处理的负担,同时降低了主存储设备和备份存储设备之间传输的数据量,降低了异步远程复制时的复原点目标。
本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的实施例能够以除了在这里图示或描述的内容以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、***、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
本申请提供的数据处理装置可部署于由主存储设备以及备份存储设备建立的数据备份网络框架中,为了便于理解,请参阅图1,图1为本申请实施例中存储设备的网络框架示意图。虽然图1中包括一个主存储设备以及一个备份存储设备,但是应当理解的是,主存储设备的类型和数量以及备份存储设备的类型和数量均应根据实际场景确定,在实际应用中,不对主存储设备的类型和数量以及备份存储设备的类型和数量进行限定,主存储设备以及备份存储设备既可以是单个存储设备也可以是多个存储设备组成的存储阵列,其中,存储设备既可以是固态硬盘(solid state drive,SSD)也可以是混合硬盘(hybrid harddrive,HHD)也可以是机械硬盘(hard disk drive,HDD)也可以是光盘库以及磁带库等,当主存储设备以及备份存储设备为多个存储设备组成的存储阵列时,可以由上述SSD、HHD、HDD、光盘库以及磁带库的一种或多种组成,此处不作限定。主存储设备与备份存储设备之间的数据通信可以通过传输控制协议/因特网互联协议(transmission controlprotocol/internet protocol,TCP/IP)传输。
本申请可应用于数据的远程复制技术,其中,数据的远程复制技术通常分为同步远程复制和异步远程复制。同步远程复制是指通过远程镜像软件,将主存储设备的数据以同步镜像的方式复制到备份存储设备,每一主存储设备的输入/输出(in/out,I/O)事务均需等待远程复制的完成确认信息,方予以释放。同步镜像使远程拷贝总能与本地机要求复制的内容相匹配。当主存储设备出现故障时,用户的应用程序切换到备份存储设备后,被镜像的远程副本可以保证业务继续执行而没有数据的丢失。异步远程复制指的是保证在更新备份存储设备之前完成主存储***的基本I/O操作,主存储设备的I/O操作不受备份存储设备的I/O操作影响。远程的数据复制是以后台同步的方式进行的,这使本地***性能受到的影响很小,传输距离长(可达1000公里以上),对网络带宽要求小。
以下从主存储设备以及备份存储设备的角度进行详细说明。为了便于理解,下面将结合图2介绍一种数据处理的方法的应用场景,请参阅图2,图2为本申请的应用场景中数据处理的一个流程示意图,如图所示,具体地:
步骤S1中,数据的远程复制过程中,当数据需要进行数据同步作业时,主存储设备会生成一个差异位图,该差异位图用于标记主存储设备上与备份存储设备不同的数据,该数据通常为主存储设备上新写入的数据,此时需要在备份存储设备上写入该数据,完成数据同步作业,首先主存储设备会根据差异位图查找到需要复制的数据的逻辑卷地址,在实际应用中,数据通常以数据块(data block)的形式存储于存储设备中,将包含该目标数据的数据块称为目标数据块,由于在软件层级,对数据的处理是通过逻辑卷地址进行操作,因此在本申请提出的数据处理的方法中,首先获取主存储设备中目标数据块的逻辑卷地址;
步骤S2中,在获取到主存储设备中目标数据块的逻辑卷地址后,根据该地址,可读取到目标数据块,由于数据经过重删处理时首先会对数据进行计算,生成对应的指纹信息,该指纹信息用于指示主存储设备使用该指纹信息查找该主存储设备中是否存在相同的已存储的指纹信息,若存在则记录相同的已存储的指纹信息对应数据的地址,当前要写入的数据不写入存储设备中,以记录的对应数据的地址建立映射关系,完成重删处理,通常该指纹信息存储于该数据的数据块的块头。数据进行压缩处理后,会生成一个标识,用于标识该数据经过压缩处理,通常该压缩处理的标识存储于该数据的数据块的块头。在获取到主存储设备中目标数据块的逻辑卷地址后,根据该地址,可读取到目标数据块,通过查找目标数据块中是否存在指纹信息以及压缩处理对应的标识以此判断该数据是否做了重删压缩。若查找到目标数据块中存在指纹信息以及压缩处理对应的标识,判断该数据做了重删处理以及压缩处理,判断结果为是,进入步骤S4,若查找到目标数据块中不存在指纹信息以及压缩处理对应的标识,判断该数据没有做重删处理以及压缩处理,判断结果为否,进入步骤S3。
步骤S3中,当查找到目标数据块中不存在指纹信息以及压缩处理对应的标识后,主存储设备直接将目标数据块中对应的数据发送至备份存储设备,备份存储设备根据自身业务处理需求对接收到的数据进行进一步的处理。
步骤S4中,当查找到目标数据块中存在指纹信息以及压缩处理对应的标识,判断该数据做了重删处理以及压缩处理后,主存储设备通过目标数据块地址查询目标数据块中块头处存储的目标数据的重删指纹信息,若此时需要同时复制多个批量的数据块时进入步骤S5,若此时需要复制的数据块为单个数据块时,进入步骤S6;
步骤S5中,在查询到目标数据对应的指纹信息后,当目前需要同时复制多个批量的数据块时,主存储设备可以使用该指纹对其它同时需要复制的数据块的指纹信息进行比对,若存在相同的指纹,则保留一个数据块,并记录其它同时需要复制的数据块的信息,进行去重处理。
步骤S6中,在查找到该目标数据对应的重删指纹信息之后,由于该目标数据已经过压缩处理,因此读取到的与重删指纹信息对应的目标数据,为已压缩的目标数据。
步骤S7中,在读取到已压缩的目标数据后,主存储设备将目标数据块的逻辑卷地址、重删指纹以及读取到的已压缩数据以数据包的形式发送至备份存储设备,备份存储设备根据自身业务处理需求对接收到的数据进行进一步的处理。
本方案中,主存储设备在向备份存储设备发送目标数据前,会先对该目标数据所在的目标数据块进行查询,查询是否存在重删指纹信息以及压缩处理的标识,若存在则将该重删指纹信息以及压缩处理的标识与已压缩的目标数据以数据包的形式发送至备份存储设备,备份存储设备可以根据重删指纹信息以及压缩处理的标识,不再重复计算目标数据,直接使用该重删指纹信息进行重删处理。备份存储设备还可以根据接收到的压缩处理的标识,判断当前接收到的目标数据已经进行了压缩处理,因此不需要再次进行压缩处理,可以直接写入。减轻了主存储设备和备份存储设备数据处理的负担,同时降低了主存储设备和备份存储设备之间传输的数据量,降低了异步远程复制时的复原点目标。
请参阅图3,图3为本申请实施例中数据处理的方法的一个实施例示意图,本申请实施例中数据处理的方法的一个实施例包括:
101、第一存储设备读取目标数据;
本实施例中,第一存储设备通过获取第一存储设备与第二存储设备之间记录不同数据的差异位图或差异标识确定目标数据,并根据该目标数据所在的逻辑卷地址,读取到该目标数据,其中,逻辑卷地址是一种位置码,通过***数字表示数据的位置信息,例如:数据1对应的逻辑卷地址为1,数据2对应的逻辑卷地址为2,以此类推。
102、第一存储设备检测目标数据是否存在对应的第一标识以及对应的第二标识;
本实施例中,当目标数据进行重删处理时,存储设备会对目标数据进行哈希运算以生成对应的哈希值(hash),该哈希值称为该数据的指纹信息,在本实施例中称为第一标识,进行哈希运算需要使用哈希算法,本申请中适用的哈希算法可以包括:xxhash算法、MDhash算法、SHA-1哈希算法、SHA-2哈希算法、MD5哈希算法等,此处不作限定。当目标数据进行压缩处理后,存储设备会生成一个标识用于标记该目标数据已进行了压缩处理,该标识本实施例中称为第二标识。第一标识、第二标识以及目标数据的逻辑卷地址为目标数据的元数据,元数据通常存储于目标数据所存储的数据块的块头,也会根据不同存储厂商的设置存储于不同的区域,例如,元数据存储于存储设备中非易失性存储器中,此处不作限定。第一存储设备检测本存储设备中是否存在第一标识以及第二标识。
103、若目标数据存在对应的第一标识以及对应的第二标识,则第一存储设备向第二存储设备发送第一目标数据包;
本实施例中,当第一存储设备检测到本存储设备中存在与目标数据对应的第一标识以及与目标数据对应的第二标识后,第一存储设备使用获取到的第一标识、第二标识以及目标数据制作第一目标数据包,第一目标数据包中还包含有目标数据的逻辑卷地址。第一存储设备将第一目标数据包通过TCP/IP协议发送至第二存储设备,第二存储设备在接收到该第一目标数据包后,可以使用该第一目标数据包中的第一标识,检测第二存储设备中是否存在与第一标识相同的指纹信息,若存在,则第一目标数据包中的目标数据不写入,并记录该目标数据的逻辑卷地址,与存在相同指纹信息的对应数据的地址建立映射关系,完成目标数据在第二存储设备中的重删处理。第二存储设备根据第一目标数据包中的第二标识,可以确定当前接收到的目标数据为已压缩后的数据,因此不需要再对该目标数据进行压缩处理。
本申请实施例中,第一存储设备在向第二存储设备发送目标数据前,会先对该目标数据所在的目标数据块进行检测,检测是否存在重删指纹信息以及压缩处理的标识,若存在则将该重删指纹信息以及压缩处理的标识与已压缩的目标数据以数据包的形式发送至第二存储设备。第二存储设备可以根据重删指纹信息以及压缩处理的标识,不再重复计算目标数据,直接使用该重删指纹信息进行重删处理。第二存储设备还可以根据接收到的压缩处理的标识,判断当前接收到的目标数据已经进行了压缩处理,因此不需要再次进行压缩处理,可以直接写入。减轻了第一存储设备和第二存储设备数据处理的负担,同时降低了第一存储设备和第二存储设备之间传输的数据量,降低了异步远程复制时的复原点目标。
可选地,在图3对应的实施例的基础上,本申请实施例提供的第二种数据处理的方法的实施例中,第一存储设备检测目标数据是否存在对应的第一标识以及对应的第二标识之后,方法还包括:
若目标数据不存在对应的第一标识以及对应的第二标识,则第一存储设备向第二存储设备发送第二目标数据包,以使得第二存储设备根据第二目标数据包对目标数据进行处理;
其中,第二数据包中至少携带目标数据以及第三标识,第三标识用于指示第二存储设备对目标数据进行压缩处理。
本实施例中,第一存储设备检测目标数据是否存在对应的第一标识以及对应的第二标识之后,若目标数据不存在对应的第一标识以及对应的第二标识,即该目标数据未经过重删处理以及压缩处理之后,第一存储设备获取第三标识,并使用第三标识以及目标数据制作第二目标数据包,第二目标数据包中还包含有目标数据的逻辑卷地址。其中第三标识为第一存储设备在检测到该目标数据未经压缩处理后,新建的标识该目标数据为未经压缩处理数据的标识。第二存储设备根据接收到的第二目标数据包中携带的第三标识,确定第二目标数据包中的目标数据为未经压缩处理的数据,同时由于第二目标数据包中未携带第一标识,因此第二存储设备可以根据自身需求选择是否需要对该目标数据进行重删处理以及压缩处理。
本申请实施例中,当第一存储设备检测到目标数据不存在第一标识以及第二标识之后,向第二存储设备发送第二目标数据包,第二目标数据包中携带目标数据以及第三标识。提供了目标数据未经重删处理以及压缩处理的数据处理的方法,提升了方案的实现灵活性。
可选地,在本申请实施例提供的第二种数据处理的方法的实施例的基础上,本申请实施例提供的第三种数据处理的方法的实施例中,第一存储设备读取目标数据之后,方法还包括:
若目标数据存储于第一存储设备的缓存区域,则第一存储设备向第二存储设备发送第二目标数据包,以使得第二存储设备根据第二目标数据包对目标数据进行处理;
其中,第二数据包中至少携带目标数据以及第三标识。
本实施例中,当第一存储设备读取到目标数据之后,第一存储设备可以判断目标数据当前存储的位置是否是第一存储设备的缓存区域(cache),若是,则跳过检测第一存储设备中是否存在第一标识以及第二标识的步骤,向第二存储设备发送第二目标数据包。第二存储设备接收到第二目标数据包后执行的处理流程,类似本申请实施例提供的第二种数据处理的方法的实施例,此处不再赘述。
本申请实施例中,当目标数据存储于第一存储设备的缓存区域中时,由于缓存区域中的数据是不经过重删处理以及压缩处理的,可以直接判断该目标数据为未经重删处理以及压缩处理的数据,第一存储设备向第二存储设备发送第二目标数据包。提供了一种目标数据存储于缓存区域时,数据处理的方法,简化了第一存储设备对目标数据的处理流程,提升了方案的可行性。
可选地,在图3对应的实施例的基础上,本申请实施例提供的第四种数据处理的方法的实施例中,第一存储设备检测目标数据是否存在对应的第一标识以及对应的第二标识之后,方法还包括:
若目标数据存在对应的第一标识且不存在对应的第二标识,则第一存储设备向第二存储设备发送第三目标数据包,以使得第二存储设备根据第三目标数据包对目标数据进行处理;
其中,第三目标数据包中至少携带目标数据、第一标识以及第三标识。
本实施例中,当第一存储设备检测到目标数据存在对应的第一标识且不存在对应的第二标识时,即目标数据经过重删处理且未经压缩处理,此时,第一存储设备向第二存储设备发送第三目标数据包,该第三目标数据包中携带目标数据、第一标识、第三标识以及目标数据的逻辑卷地址。第二存储设备接收第三目标数据包之后,第二存储设备可以使用该第一目标数据包中的第一标识,检测第二存储设备中是否存在与第一标识相同的指纹信息,若存在,则第一目标数据包中的目标数据不写入,并记录该目标数据的逻辑卷地址,与存在相同指纹信息的对应数据的地址建立映射关系,完成目标数据在第二存储设备中的重删处理,第二存储设备根据接收到的第三目标数据包中携带的第三标识,确定第三目标数据包中的目标数据为未经压缩处理的数据,第二存储设备可以根据自身需求选择是否需要对该目标数据进行压缩处理。
本申请实施例中,提供了目标数据为经过重删处理且未经过压缩处理的数据处理的方法,第二存储设备根据接收到的第三目标数据包对目标数据进行重删处理,并根据自身的需求选择是否对目标数据进行压缩处理,提升了方案的实现灵活性。
可选地,在图3对应的实施例的基础上,本申请实施例提供的第五种数据处理的方法的实施例中,第一存储设备检测目标数据是否存在对应的第一标识以及对应的第二标识之后,方法还包括:
若目标数据不存在对应的第一标识且存在对应的第二标识,则第一存储设备向第二存储设备发送第四目标数据包,以使得第二存储设备根据第四目标数据包对目标数据进行处理;
其中,第四目标数据包中至少携带目标数据以及第二标识。
本实施例中,当第一存储设备检测到目标数据不存在对应的第一标识且存在对应的第二标识时,即目标数据未经过重删处理且经压缩处理,第一存储设备向第二存储设备发送第四目标数据包,第四目标数据包中携带目标数据、第二标识以及目标数据的逻辑卷地址。由于第四目标数据包中未携带第一标识,因此第二存储设备可以根据自身需求选择是否需要对该目标数据进行重删处理。第二存储设备根据第四目标数据包中的第二标识,可以确定当前接收到的目标数据为已压缩后的数据,因此不需要再对该目标数据进行压缩处理。
本申请实施例中,提供了目标数据为未经过重删处理且经过压缩处理的数据处理的方法,第二存储设备根据自身的需求选择是否对目标数据进行重删处理,提升了方案的实现灵活性。
下面对本申请中数据处理装置进行详细描述,请参阅图4,图4为本申请实施例中数据处理装置的一个实施例示意图,本申请实施例提供的数据处理装置20的第一个实施例中,数据处理装置20包括:
读取模块201,用于读取目标数据;
检测模块202,用于检测目标数据是否存在对应的第一标识以及对应的第二标识,其中,第二标识用于标记目标数据经过压缩处理;
发送模块203,用于若目标数据存在对应的第一标识以及对应的第二标识,则发送模块203向第二存储设备发送第一目标数据包,以使得第二存储设备根据第一目标数据包对目标数据进行处理。
本实施例中,读取模块201读取目标数据,检测模块202检测目标数据是否存在对应的第一标识以及对应的第二标识,其中,第二标识用于标记目标数据经过压缩处理,若目标数据存在对应的第一标识以及对应的第二标识,则通过发送模块203向第二存储设备发送第一目标数据包,以使得第二存储设备根据第一目标数据包对目标数据进行处理。
本申请实施例中,第一存储设备在向第二存储设备发送目标数据前,会先对该目标数据所在的目标数据块进行检测,检测是否存在重删指纹信息以及压缩处理的标识,若存在则将该重删指纹信息以及压缩处理的标识与已压缩的目标数据以数据包的形式发送至第二存储设备。第二存储设备可以根据重删指纹信息以及压缩处理的标识,不再重复计算目标数据,直接使用该重删指纹信息进行重删处理。第二存储设备还可以根据接收到的压缩处理的标识,判断当前接收到的目标数据已经进行了压缩处理,因此不需要再次进行压缩处理,可以直接写入。减轻了第一存储设备和第二存储设备数据处理的负担,同时降低了第一存储设备和第二存储设备之间传输的数据量,降低了异步远程复制时的复原点目标。
可选地,在图4对应的实施例的基础上,本申请实施例提供的第二种数据处理装置的实施例中,
发送模块203,还用于若目标数据不存在对应的第一标识以及对应的第二标识,则发送模块203向第二存储设备发送第二目标数据包,以使得第二存储设备根据第二目标数据包对目标数据进行处理;
其中,第二数据包中至少携带目标数据以及第三标识,第三标识用于指示第二存储设备对目标数据进行压缩处理。
本申请实施例中,当第一存储设备检测到目标数据不存在第一标识以及第二标识之后,向第二存储设备发送第二目标数据包,第二目标数据包中携带目标数据以及第三标识。提供了目标数据未经重删处理以及压缩处理的数据处理的方法,提升了方案的实现灵活性。
可选地,在本申请实施例提供的第二种数据处理装置的实施例的基础上,本申请实施例提供的第三种数据处理装置的实施例中,
发送模块203,还用于若目标数据存储于第一存储设备的缓存区域,则发送模块203向第二存储设备发送第二目标数据包,以使得第二存储设备根据第二目标数据包对目标数据进行处理;
其中,第二数据包中至少携带目标数据以及第三标识。
本申请实施例中,当目标数据存储于第一存储设备的缓存区域中时,由于缓存区域中的数据是不经过重删处理以及压缩处理的,可以直接判断该目标数据为未经重删处理以及压缩处理的数据,第一存储设备向第二存储设备发送第二目标数据包。提供了一种目标数据存储于缓存区域时,数据处理的方法,简化了第一存储设备对目标数据的处理流程,提升了方案的可行性。
可选地,在图4对应的实施例的基础上,本申请实施例提供的第四种数据处理装置的实施例中,
发送模块203,还用于若目标数据存在对应的第一标识且不存在对应的第二标识,则发送模块203向第二存储设备发送第三目标数据包,以使得第二存储设备根据第三目标数据包对目标数据进行处理;
其中,第三目标数据包中至少携带目标数据、第一标识以及第三标识。
本申请实施例中,提供了目标数据为经过重删处理且未经过压缩处理的数据处理的方法,第二存储设备根据接收到的第三目标数据包对目标数据进行重删处理,并根据自身的需求选择是否对目标数据进行压缩处理,提升了方案的实现灵活性。
可选地,在图4对应的实施例的基础上,本申请实施例提供的第五种数据处理装置的实施例中,
发送模块203,还用于若目标数据不存在对应的第一标识且存在对应的第二标识,则发送模块203向第二存储设备发送第四目标数据包,以使得第二存储设备根据第四目标数据包对目标数据进行处理;
其中,第四目标数据包中至少携带目标数据以及第二标识。
本申请实施例中,提供了目标数据为未经过重删处理且经过压缩处理的数据处理的方法,第二存储设备根据自身的需求选择是否对目标数据进行重删处理,提升了方案的实现灵活性。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的***,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的***,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个***,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(read-only memory,ROM)、随机存取存储器(random access memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,以上实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。

Claims (6)

1.一种数据处理的方法,其特征在于,包括:
第一存储设备读取目标数据;
所述第一存储设备检测所述目标数据是否存在对应的第一标识以及对应的第二标识,其中,所述第二标识用于标记所述目标数据经过压缩处理;
若所述目标数据存在对应的所述第一标识以及对应的所述第二标识,则所述第一存储设备向第二存储设备发送第一目标数据包,以使得所述第二存储设备根据所述第一目标数据包对所述目标数据进行处理;
其中,所述第一目标数据包中至少携带所述目标数据、所述第一标识以及所述第二标识,所述第一标识用于指示所述第二存储设备根据所述第一标识对所述目标数据进行重删处理,所述第二标识用于指示所述第二存储设备对所述目标数据进行写入处理;
若所述目标数据不存在对应的所述第一标识以及对应的所述第二标识,则所述第一存储设备向所述第二存储设备发送第二目标数据包,以使得所述第二存储设备根据所述第二目标数据包对所述目标数据进行处理;
其中,所述第二数据包中至少携带所述目标数据以及第三标识,所述第三标识用于指示所述第二存储设备对所述目标数据进行压缩处理;
所述第一存储设备读取所述目标数据之后,所述方法还包括:
若所述目标数据存储于所述第一存储设备的缓存区域,则所述第一存储设备向所述第二存储设备发送所述第二目标数据包,以使得所述第二存储设备根据所述第二目标数据包对所述目标数据进行处理;
其中,所述第二数据包中至少携带所述目标数据以及所述第三标识。
2.根据权利要求1所述的方法,其特征在于,所述第一存储设备检测所述目标数据是否存在对应的第一标识以及对应的第二标识之后,所述方法还包括:
若所述目标数据存在对应的所述第一标识且不存在对应的所述第二标识,则所述第一存储设备向所述第二存储设备发送第三目标数据包,以使得所述第二存储设备根据所述第三目标数据包对所述目标数据进行处理;
其中,所述第三目标数据包中至少携带所述目标数据、所述第一标识以及所述第三标识。
3.根据权利要求1所述的方法,其特征在于,所述第一存储设备检测所述目标数据是否存在对应的第一标识以及对应的第二标识之后,所述方法还包括:
若所述目标数据不存在对应的所述第一标识且存在对应的所述第二标识,则所述第一存储设备向所述第二存储设备发送第四目标数据包,以使得所述第二存储设备根据所述第四目标数据包对所述目标数据进行处理;
其中,所述第四目标数据包中至少携带所述目标数据以及所述第二标识。
4.一种数据处理装置,其特征在于,包括:
读取模块,用于读取目标数据;
检测模块,用于检测所述目标数据是否存在对应的第一标识以及对应的第二标识,其中,所述第二标识用于标记所述目标数据经过压缩处理;
发送模块,用于若所述目标数据存在对应的所述第一标识以及对应的所述第二标识,则所述发送模块向第二存储设备发送第一目标数据包,以使得所述第二存储设备根据所述第一目标数据包对所述目标数据进行处理;
其中,所述第一目标数据包中至少携带所述目标数据、所述第一标识以及所述第二标识,所述第一标识用于指示所述第二存储设备根据所述第一标识对所述目标数据进行重删处理,所述第二标识用于指示所述第二存储设备对所述目标数据进行写入处理;
所述发送模块,还用于若所述目标数据不存在对应的所述第一标识以及对应的所述第二标识,则所述发送模块向所述第二存储设备发送第二目标数据包,以使得所述第二存储设备根据所述第二目标数据包对所述目标数据进行处理;
其中,所述第二数据包中至少携带所述目标数据以及第三标识,所述第三标识用于指示所述第二存储设备对所述目标数据进行压缩处理;
所述发送模块,还用于若所述目标数据存储于所述第一存储设备的缓存区域,则所述发送模块向所述第二存储设备发送所述第二目标数据包,以使得所述第二存储设备根据所述第二目标数据包对所述目标数据进行处理;
其中,所述第二数据包中至少携带所述目标数据以及所述第三标识。
5.根据权利要求4所述的数据处理装置,其特征在于,
所述发送模块,还用于若所述目标数据存在对应的所述第一标识且不存在对应的所述第二标识,则所述发送模块向所述第二存储设备发送第三目标数据包,以使得所述第二存储设备根据所述第三目标数据包对所述目标数据进行处理;
其中,所述第三目标数据包中至少携带所述目标数据、所述第一标识以及所述第三标识。
6.根据权利要求4所述的数据处理装置,其特征在于,
所述发送模块,还用于若所述目标数据不存在对应的所述第一标识且存在对应的所述第二标识,则所述发送模块向所述第二存储设备发送第四目标数据包,以使得所述第二存储设备根据所述第四目标数据包对所述目标数据进行处理;
其中,所述第四目标数据包中至少携带所述目标数据以及所述第二标识。
CN201811108304.4A 2018-09-21 2018-09-21 一种数据处理的方法以及相关装置 Active CN109086172B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811108304.4A CN109086172B (zh) 2018-09-21 2018-09-21 一种数据处理的方法以及相关装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811108304.4A CN109086172B (zh) 2018-09-21 2018-09-21 一种数据处理的方法以及相关装置

Publications (2)

Publication Number Publication Date
CN109086172A CN109086172A (zh) 2018-12-25
CN109086172B true CN109086172B (zh) 2022-12-06

Family

ID=64842307

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811108304.4A Active CN109086172B (zh) 2018-09-21 2018-09-21 一种数据处理的方法以及相关装置

Country Status (1)

Country Link
CN (1) CN109086172B (zh)

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107179878B (zh) * 2016-03-11 2021-03-19 伊姆西Ip控股有限责任公司 基于应用优化的数据存储的方法和装置
CN106648469B (zh) * 2016-12-29 2020-01-17 华为技术有限公司 一种缓存数据处理方法、装置和存储控制器
CN107025289B (zh) * 2017-04-14 2018-12-11 腾讯科技(深圳)有限公司 一种数据处理的方法及相关设备
CN107229420B (zh) * 2017-05-27 2020-05-26 苏州浪潮智能科技有限公司 数据存储方法、读取方法、删除方法和数据操作***
CN107193503B (zh) * 2017-05-27 2020-05-29 杭州宏杉科技股份有限公司 一种数据重删方法及存储设备
CN108268219B (zh) * 2018-02-01 2021-02-09 杭州宏杉科技股份有限公司 一种处理io请求的方法及装置

Also Published As

Publication number Publication date
CN109086172A (zh) 2018-12-25

Similar Documents

Publication Publication Date Title
US9892005B2 (en) System and method for object-based continuous data protection
US11232151B2 (en) Systems, methods, and software for improved video data recovery effectiveness
JP4354233B2 (ja) バックアップシステム及び方法
JP5774794B2 (ja) ストレージシステム及びストレージシステムの制御方法
CN107544871B (zh) 一种虚拟机磁盘备份方法及装置
US7681001B2 (en) Storage system
US10866742B1 (en) Archiving storage volume snapshots
US10572335B2 (en) Metadata recovery method and apparatus
WO2023000674A1 (zh) 云硬盘数据压缩备份及恢复方法、装置、设备及存储介质
CN103034592B (zh) 数据处理方法和装置
CN110442298B (zh) 存储设备异常检测方法及装置、分布式存储***
US20170269847A1 (en) Method and Device for Differential Data Backup
US20210157513A1 (en) Data reading method, apparatus, and system, and distributed system
CN103838645B (zh) 一种基于哈希的远程差异合成备份实现方法
JPWO2007099636A1 (ja) ファイルシステム移行方法、ファイルシステム移行プログラム及びファイルシステム移行装置
JP2016181142A (ja) バックアップ制御装置、バックアップ制御方法、及び、プログラム
JP5600015B2 (ja) バックアップシステム及びバックアップ方法
US8560789B2 (en) Disk apparatus, data replicating method onto disk apparatus and program recording medium
CN111400248B (zh) 写数据、恢复数据的方法及文件***
US10360108B2 (en) System and method of using performance-maintaining commands for generating a backup of unsupported file systems
CN109086172B (zh) 一种数据处理的方法以及相关装置
CN117743024A (zh) 从远程存储装置恢复备份
US20090185762A1 (en) Data structure for image file
CN105138429B (zh) 一种写时拷贝快照方法和***
US7587466B2 (en) Method and computer system for information notification

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant