CN104714864A - 一种计算机数据智能备份方法 - Google Patents

一种计算机数据智能备份方法 Download PDF

Info

Publication number
CN104714864A
CN104714864A CN201510123310.7A CN201510123310A CN104714864A CN 104714864 A CN104714864 A CN 104714864A CN 201510123310 A CN201510123310 A CN 201510123310A CN 104714864 A CN104714864 A CN 104714864A
Authority
CN
China
Prior art keywords
file
backup
list
rule
delta
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201510123310.7A
Other languages
English (en)
Inventor
胡晓勤
黄传波
谢俊峰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chengdu Yun Qi Science And Technology Ltd
Original Assignee
Chengdu Yun Qi Science And Technology Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chengdu Yun Qi Science And Technology Ltd filed Critical Chengdu Yun Qi Science And Technology Ltd
Priority to CN201510123310.7A priority Critical patent/CN104714864A/zh
Publication of CN104714864A publication Critical patent/CN104714864A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提出一种计算机数据智能备份方法,确定哪些数据属于用户数据,并备份用户数据。在完全备份过程中,扫描用户操作***,获得操作***名称、版本、安装路径,应用程序名称、版本、安装路径等特征,和云端已备份文件对比后,备份时可以不备份此类公知文件,另一方面,比较用户已备份文件的全路径名和摘要值,匹配后,也不用备份此类用户目标文件,从而提高备份速度。在完成一次完全备份后,在用户使用计算机过程中确定哪些目标文件发生了变化,当接收到备份指令后直接备份发生变化的目标文件,而不通过扫描来确定变化文件,可极大的提高备份软件性能。同时,用户也不需再需要设置备份路径,克服了目标文件遗漏、数据丢失风险的缺陷。

Description

一种计算机数据智能备份方法
技术领域
本发明涉及信息安全领域,尤其涉及一种计算机数据智能备份方法。
背景技术
随着计算机技术的普遍使用,产生了大量的数据,这些数据主要以卷、文件、数据库的形式保存在各种存储介质上,这些数据以文件形式大量存储、使用和传输。由于计算机自身脆弱性特点,数据经常受到各种威胁,如病毒、误操作、失窃、机器故障、灾难等,使得数据非常容易被删除、损坏和丢失。应对这些威胁最好的办法是进行数据备份。
 对于文件备份来说,通常的做法为:在用户计算机上安装一个备份代理程序,采用定时备份或者实时备份策略,定期或实时将用户文件数据(以下称为目标文件)备份到本地存储介质或云端。在备份过程中,备份代理要求用户提供配置信息,如文件路径、文件类型、创建时间、修改时间等。然而,很多初级用户并不知道目标文件路径,也不了解文件类型,更不用说创建时间、修改时间了。因此,经常造成重要的目标文件并没有进行备份。
通常的备份策略可分为完全备份、增量备份和差异备份。完全备份是将所有备份对象全部复制一遍。增量备份是复制两次备份之间变化的数据。差异备份是复制本次备份和完全备份之间变化的数据。对于增量备份和差异备份,采用定时备份策略时,都需要对比两次备份之间的变化,目前确定数据变化的通用办法是扫描需要目标文件并确定哪些文件发生了变化。
在扫描过程中,第一个步骤为获取目标文件的元数据,如全路径文件名、文件长度、修改时间、最后访问时间等,以此来判断目标文件是否发生了变化;如果第一个步骤能够确认目标文件发生了变化,则备份该目标文件,如果不能确认,通常计算目标文件的摘要值来确认目标文件是否发生变化,如果发生了变化,则备份该目标文件。对于目标文件占用空间较大情况下,如达到TB级,或目标文件数目较多情况下,如达到百万级,则备份代理将扫描所有的目标文件,扫描耗时较长,导致用户计算机性能严重下降,甚至不能正常使用。而实际上,在一个备份周期内,如一天时间以内,用户正真使用的目标文件,实际发生数据变化的目标文件比较少,需要扫描并确定是否发生数据变化的目标文件占大多数。备份代理花费了大量的读写资源和时间来判断一个目标文件是否发生了变化,造成大量浪费,严重拖慢计算机性能。
发明内容
为了解决上述问题,本发明提出一种计算机数据智能备份方法,帮助用户确定哪些数据属于用户数据,并备份用户数据。在完全备份过程中,扫描用户操作***,获得操作***名称、版本、安装路径,应用程序名称、版本、安装路径等特征,和云端已备份文件对比后,备份时可以不备份此类公知文件,另一方面,比较用户已备份文件的全路径名和摘要值,匹配后,也不用备份此类用户目标文件,从而提高备份速度。在完成一次完全备份后,在用户使用计算机过程中确定哪些目标文件发生了变化,当接收到备份指令后直接备份发生变化的目标文件,而不通过扫描来确定变化文件,可极大的提高备份软件性能。同时,用户也不需再需要设置目标文件路径,克服了目标文件遗漏、数据丢失风险的缺陷。
本发明涉及一种计算机数据智能备份方法,包括:
 步骤1,完全备份模块暂停文件变化检测,扫描用户***,获得用户***特征并发送到云端,生成未备份文件列表并向云端进行完全备份,用户***特征至少包括操作***名称、版本、安装路径以及所有安装的应用程序的名称、版本、安装路径;
步骤2,激活文件变化检测,完全备份模块向文件变化检测模块发送激活消息,文件变化模块从暂停状态改为运行状态;
步骤3,文件变化检测并发送,文件变化检测模块获取***中文件变化事件,并获得和该文件变化事件相关的文件全路径名、时间、进程名和类型组成一条文件变化事件消息,并发送给增量判定模块;
步骤4,规则载入步骤,增量判定模块从规则库中载入规则,至少包括用户类规则和***类规则;
步骤5,增量文件判定步骤,增量判定模块等待接收文件变化事件,判断文件变化事件是否为重复事件,匹配规则库中的规则,如果不匹配所有用户类规则或匹配任意一条***类规则,则将文件变化事件的文件全路径名写入到增量文件列表,否则丢弃该文件变化事件消息;
步骤6,读入增量文件列表步骤,增量备份模块读入所有的增量文件的全路径名;
步骤7,增量备份查找出增量文件所在的增备卷,遍历每个增备卷,对每个增备卷生成快照,挂载快照,并将增量文件、增量文件全路径名、增量文件摘要值发送到云端,删除快照,最后清空增量文件列表;
步骤8,规则库更新步骤,规则库更新模块向云端发送主机特性,云端根据主机特性,返回规则库;
步骤9,规则库写入步骤,规则更新模块将更新后的规则写入到规则库中。
所述步骤1中生成未备份文件列表并向云端进行完全备份进一步为:
步骤21,云端根据用户***特征,与预先备份的操作***文件、应用程序文件进行比较,当匹配后,结合本地***安装路径,生成匹配文件的全路径名写入到已备份文件列表中(但不需要文件摘要值),同时将以前备份的用户数据文件列表及摘要值写到已备份文件列表中,将备份文件列表发送给完全备份模块;
步骤22,枚举***所有卷,生成全备卷列表;
步骤23,判断全备卷列表是否为空,如果为空,转步骤28,如果不为空,转步骤24;
步骤24,选择全备卷列表中的一个全备卷,对该全备卷生成快照;
步骤25,生成未备份文件列表步骤,挂载步骤24生成的快照,遍历快照中的每个文件夹、文件,生成全路径名,将全路径名和已备份文件列表对比,对于在已备份文件列表中匹配上的全路径名,如果该全路径名不含有摘要值的,则认为匹配成功,该文件已经备份,否则,如果含有摘要值,则计算本地***中该文件的摘要值,并和备份文件列表中对应记录的摘要值比较是否相等,如果相等,则认为该文件已备份,否则将该文件全路径添加到未备份文件列表,对于在已备份文件列表中未匹配的全路径名,将该文件全路径添加到未备份文件列表;
步骤26,向云端发送未备份文件列表、未备份文件、摘要值,清空未备份文件列表;
步骤27,删除步骤24生成的快照,从全备卷列表中移除该全备卷,转步骤23;
步骤28,向云端发送完全备份结束消息;
步骤29,向文件变化检测模块发送激活消息,文件变化检测从暂停状态变为运行状态。
所述步骤4中用户类规则和***类规则,其特征在于:
用户类规则至少包括:用户进程排除规则、用户进程目录名排除规则、文件名称排除规则;***类规则至少包括:***进程包含规则;
用户进程排除规则匹配条件:进程名称;
用户进程目录名排除规则匹配条件:用户进程名且目录的全路径名;
文件名称排除规则匹配条件:文件的全路径名;
***进程包含规则匹配条件:进程名称。
所述步骤5进一步为:
步骤41,等待接收文件变化事件消息,包括文件创建、文件写、文件移动,接收到文件变化事件消息后转步骤42;
步骤42,在增量文件列表中查找,如果某个文件全路径名和当前文件变化事件消息的文件全路径名相同,则认为该文件变化事件为重复事件,转步骤41,否则转步骤43;
步骤43,比较进程名称是否属于***用户,如果是,则为***进程,转步骤44,如果否,转步骤45;
步骤44,比较进程名称是否匹配某条***进程包含规则,如果匹配,则认为该文件变化事件属于备份范围,转步骤46,否则转步骤41;
步骤45,将文件全路径名写入到增量文件列表,转步骤41;
步骤46,比较进程名称是否和某条用户进程排除规则匹配,如果匹配,则认为该文件变化不在备份范围内,转步骤41,否则转步骤47;
步骤47,比较变化文件目录名且进程名称是否匹配某条用户进程目录名排除规则,如果匹配,则认为该文件变化不在备份范围内,转步骤41,否则转步骤48;
步骤48,比较变化文件全路径名是否匹配某条用户文件名排除规则,如果匹配,则认为该文件变化不在备份范围内,转步骤41,否则转步骤45。
所述步骤7进一步为:
步骤51,遍历每个增量文件全路径名,得到增量文件所在卷的卷名,如果增量卷列表中没有该卷名,则写入增备卷列表,否则不写入;
步骤52,判断增备卷列表是否为空,如为空,则转步骤56,否则转步骤53;
步骤53,在增备卷列表中选择一个增备卷,生成该增备卷的快照;
步骤54,遍历增量文件列表,找到属于该增量卷的增量文件全路径名,在该增备卷的快照上读取该增量文件,发送增量文件、增量文件全路径名、增量文件摘要值到云端;
步骤D55,删除该增备卷快照,从增备卷列表中移除卷名,转步骤53;
步骤56,清空增量文件列表。
所述步骤8进一步为:
步骤61,规则库更新模块扫描用户操作***,获取用户***特征,获取当前***时间;
步骤62,向云端发送用户***特征和当前***时间;
步骤63,如果未收到云端回应,则转步骤67,否则转步骤64;
步骤64,将云端返回的规则库版本和当前版本比较,如发生变化,转步骤65,否则转步骤66;
步骤65,从云端下载新的规则库;
步骤66,等待时间间隔P步骤,转步骤61;
步骤67,等待时间间隔Q步骤,转步骤61。
 本发明的有益效果在于用户不需要配置目标文件路径,用户目标文件不遗漏,降低了用户使用备份***的负担;无需备份已预置云端的操作***文件、应用程序文件,无需备份已备份过的数据,提高完全备份速度;增量备份时无需扫描目标文件获取文件变化,使用进程分类和规则过滤,获得具有备份价值的用户增量文件,直接备份增量文件,节约了***I/O,大大加快了备份速度。
附图说明
图1为各模块架构图。
图2为数据智能备份流程图。
图3为完全备份流程图。
图4为文件增量变化判定流程图。
图5为增量备份流程如图。
图6为规则库更新流程图。
具体实施方式
下面结合附图,对本发明做进一步的详细描述。
 本发明各模块架构图如图1所示。
文件变化检测模块A,用于检测文件变化事件,文件变化检测模块为安装在操作***文件***驱动层的过滤驱动或微过滤驱动,通常位于操作***内核中,当检测到文件变化事件后,如文件创建、文件写、文件移动等,将文件变化事件打包为文件变化事件消息发送给增量判定模块。每个文件变化事件组成一条文件变化事件消息,文件变化事件消息由包括如下字段:
文件全路径名:发生文件变化事件的文件存储路径及文件名,例如:C:\testA\testB.txt;
时间:文件变化发生的***时间,精确到毫秒;
类型:为文件创建、文件写、文件移动的其中一种;
进程名:导致文件变化的进程名。
完全备份模块B,用于执行完全备份,检测存在于操作***上的所有文件,获得本地***特征,和云端已有的操作***文件、应用程序文件和用户已备份文件做比较,将未备份文件备份到云端。
增量文件列表C,用于存储经增量判定模块确定为增量文件的记录,每个增量文件一个记录,每个记录包括如下字段:
文件全路径名:目标文件的文件存储路径及文件名,例如:C:\testA\testB.txt。
增量备份模块D,用于备份增量文件。在执行增量备份时,从增量文件列表C中读取增量文件信息,将增量文件传输到云端完成备份。
增量判定模块E,用于判定从文件变化检测模块发送来的文件变化事件是否为用户文件发生的数据变化,如果是,写入增量文件列表C,如果否,则丢弃。
规则库F,用于存储文件变化判定模块E所需的判定规则。规则至少包括两大类,第一类规则为用户类规则,第二类规则为***类规则,在第一类规则中又至少包括三小类规则,分别为用户进程排除规则FR101、用户进程目录名排除规则FR102、文件名称排除规则FR103,每个小类规则可包括一条或多条;在第二类规则中至少包括一小类规则,为***进程包含规则FR201,每个小类规则可包括一条或多条。
用户进程排除规则FR101可描述为:
进程名称:例如:视频播放器。
用户进程排除规则FR101作用:排除不会产生用户数据的用户进程,如视频播放器、音频播放器,此类用户进程可能会从网络上下载数据并在文件***中缓存,但此类视频、音频数据不是用户产生的数据,不具有备份价值,予以排除。
用户进程目录名排除规则FR102可描述为:
用户进程名:例如办公处理软件;
目录的全路径名:例如:C:\testA\。
用户进程目录名排除规则FR102作用:排除某些软件产生的临时文件,此类软件会在制定目录产生临时文件,但此类文件在用户使用过程中产生,不是用户实际编辑的文件,不具有备份价值,如浏览器在上网过程中的缓存文件。
文件名称排除规则FR103可描述为:
文件的全路径名:例如:C:\pagefile.sys。
文件名称排除规则FR103的作用:排除***或应用缓存或交换文件。
***进程包含规则FR201可描述为:
进程名称:例如:mysqld-nt.exe,其为MySql数据库的***服务进程。
***进程包含规则FR201的作用:包含发生用户数据变化的***进程所导致的文件变化。
规则库更新模块G,用于从云端读取规则,并更新规则库。
云端H,用于存储用户备份文件、已备份文件列表、摘要值、规则库等,云端为一个或一组服务器组成,放置于本地或远程提供备份服务。
本发明的数据智能备份流程图如图2所示。
步骤T201,完全备份步骤,完全备份模块暂停文件变化检测,扫描用户***,获得用户***特征,上传用户***特征到云端,云端返回已备份文件列表,完全备份模块枚举所有卷,生成全备卷列表,对全备卷列表中的每个卷生成快照,挂载快照,遍历快照中的所有文件夹、文件,并与已备份文件列表对比,生成未备份文件列表,完全备份模块按照未备份文件列表,向云端发送未备份文件列表、未备份文件、摘要值,传输完成后清空未备份文件列表,删除快照,向云端发送完全备份结束消息。
步骤T202,激活文件变化检测步骤,完全备份模块向文件变化检测模块发送激活消息,文件变化模块从暂停状态改为运行状态。
步骤T203,文件变化检测并发送步骤,文件变化检测模块获取***中文件变化事件,并获得和该文件变化事件相关的文件全路径名、时间、进程名和类型组成一条文件变化事件消息,并发送给增量判定模块。
步骤T204,规则载入步骤,增量判定模块从规则库中载入规则,至少包括用户类规则和***类规则。
步骤T205,增量文件判定步骤,增量判定模块首先判断文件变化事件是否为重复事件,然后匹配规则库中的规则,如果匹配,则将增量文件全路径名写入到增量文件列表,否则丢弃该文件变化事件消息。
步骤T206,读入增量文件列表步骤,增量备份模块从增量文件列表中读入所有的增量文件全路径名。
步骤T207,增量备份步骤,增量备份模块从增量文件列表中读出所有文件全路径名,查找出增量文件所在的增备卷,遍历每个增备卷,对每个增备卷生成快照,挂载快照,并将增量文件、增量文件全路径名、增量文件摘要值发送到云端,删除快照,最后清空增量文件列表。
步骤T208,规则库更新步骤,规则库更新模块向云端发送主机特性,如操作***名称、版本、安装路径,应用程序名称、版本、安装路径和当前***时间,如果云端未响应,则等待时间间隔Q再次发送,云端根据主机特性,返回规则库,规则库更新模块下载新规则库后等待时间间隔P,再执行规则库更新步骤。
步骤T209,规则库写入步骤,规则更新模块将更新后的规则写入到规则库中。
本发明的完全备份流程如图3所示。
步骤B301,暂停文件变化检测,得到用户***特征并发送到云端步骤,完全备份模块向文件变化检测模块发送暂停检测的消息,扫描用户***,获得操作***名称、版本、安装路径以及所有安装的应用程序的名称、版本、安装路径,并将上述信息发到云端。
步骤B302,得到用户已备份文件列表步骤,云端根据用户***特征,包括操作***名称、版本,应用程序名称、版本,与预先备份的操作***文件、应用程序文件进行比较,当匹配后,结合本地***安装路径,生成匹配文件的全路径名写入到备份文件列表中(但不需要文件摘要值),同时将以前备份的用户数据文件列表及摘要值写到备份文件列表中,将备份文件列表发送给完全备份模块。备份文件列表由备份文件记录组成,每个备份文件记录包括两个部分,一个部分为全路径名,另一个部分为摘要值。
 步骤B303,生成全备卷列表步骤,枚举***所有卷,生成全备卷列表。
步骤B304,判断全备卷列表中是否为空步骤,如果为空,转步骤B309,如果不为空,转步骤B305。
步骤B305,选择全备卷并生成快照步骤,选择全备卷列表中的一个全备卷,对该全备卷生成快照。
步骤B306,生成未备份文件列表步骤,挂载步骤B305生成的快照,遍历快照中的每个文件夹、文件,生成全路径名,将全路径名和已备份文件列表对比,对于在已备份文件列表中匹配上的全路径名,如果该全路径名不含有摘要值的,则认为匹配成功,该文件已经备份,否则,如果含有摘要值,则计算本地***中该文件的摘要值,并和备份文件列表中对应记录的摘要值比较是否相等,如果相等,则认为该文件已备份,否则将该文件全路径添加到未备份文件列表;对于在已备份文件列表中未匹配的全路径名,将该文件全路径添加到位备份文件列表。
步骤B307,向云端发送未备份文件列表、未备份文件、摘要值步骤,首先向云端发送未备份文件列表,完全备份模块再根据未备份文件列表,逐项向云端发送未备份文件和摘要值,最后清空未备份文件列表。
步骤B308,删除快照,从全备卷列表中移除该全备卷步骤,该全备卷相关文件备份完成后,完全备份模块删除步骤B305生成的快照,然后从全备卷列表中移除该卷,转步骤B304。
步骤B309,向云端发送完全备份结束消息,一次完全备份结束后,完全备份模块向云端发送完全备份结束消息。
步骤B310,向文件变化检测模块发送激活消息,完全备份模块向文件变化检测模块发送激活消息,文件变化检测从暂停状态变为运行状态。
本发明的文件增量变化判定流程如图3所示。
步骤E401,等待接收文件变化事件消息步骤,增量判定模块等待从文件变化检测模块发送来的文件变化事件消息,当接收到文件变化事件消息,包括文件创建、文件写、文件移动,转步骤E402。
步骤E402,比较文件变化事件是否为重复事件步骤,增量判定模块从当前文件变化事件消息中解析出文件全路径名,遍历增量文件列表,当某条记录的文件全路径名和当前文件变化事件消息的文件全路径名相等时,则认为该文件变化事件为重复事件,转步骤E401,否则转步骤E403。
步骤E403,比较进程是否属于***进程的步骤,增量判定模块根据进程名,调用***接口,判定进程所有者是否属于***用户,如果是,则该进程为***进程,转步骤E404,如果否,转步骤E405。
步骤E404,比较进程名是否匹配某条***进程包含规则的步骤,如果匹配,则认为该文件变化事件属于备份范围,转步骤E406,否则转步骤E401。
步骤E405,将变化文件全路径名写入到增量文件列表的步骤,将变化文件全路径名写入到增量文件列表,转步骤E401。
步骤E406,比较进程名是否和某条用户进程排除规则匹配的步骤,如果匹配,则认为该文件变化不在备份范围内,转步骤E401,否则转步骤E407。
步骤E407,比较变化文件目录名和进程名是否同时匹配某条用户进程目录名排除规则的步骤,如果匹配,则认为该文件变化不在备份范围内,转步骤E401,否则转步骤E408。
步骤E408,比较变化文件全路径名是否匹配某条用户文件名排除规则的步骤,如果匹配,则认为该文件变化不在备份范围内,转步骤E401,否则转步骤E405。
 本发明的增量备份流程如图5所示。
步骤D501,得到增备卷列表的步骤,遍历每条增量文件记录,得到存储增量文件的卷名,如果增量卷列表中没有该卷名,则写入增备卷列表,否则不写入。
步骤D502,增备卷列表中是否为空步骤,判断增备卷列表是否为空,如为空,则转D506,否则转D503。
步骤D503,选择一个增备卷并生成快照步骤,在增备卷列表中选择一个增备卷,生成该增备卷的快照。
步骤D504,发送增量文件、增量文件全路径名、增量文件摘要值到云端步骤,增量备份模块遍历增量文件列表,找到属于该增量卷的增量文件全路径名,在该增备卷的快照上读取该增量文件,发送增量文件、增量文件全路径名、增量文件摘要值到云端。
步骤D505,删除该增备卷快照,从增备卷列表中移除卷名步骤,转步骤D503。
步骤D506,清空增量文件列表步骤。
 本发明的规则库更新流程如图6所示。
步骤G601,获得用户***特征和当前***时间步骤,规则库更新模块扫描用户操作***,获取操作***名称、版本、安装路径,应用程序名称、版本、安装路径作为用户***特征。
步骤G602,向云端发送用户***特征和当前***时间步骤。
步骤G603,是否收到云端回应步骤,如果未收到云端回应,则转步骤G607,否则转步骤G604。
步骤G604,判断规则库发生变化步骤,将云端返回的规则库版本和当前版本比较,如发生变化,转步骤G605,否则转步骤G606。
步骤G605,下载规则库,更新规则库步骤,规则更新库模块从云端下载新的规则库,更新规则库。
步骤G606,等待时间间隔P步骤,转步骤G601。
步骤G607,等待时间间隔Q步骤,转步骤G601。
本领域的技术人员在不脱离权力要求书确定的本发明的精神和范围的条件下,还可以对以上内容进行各种各样的修改。因此本发明的范围并不仅限于以上的说明,而是由权力要求书的范围来确定的。

Claims (6)

1.一种计算机数据智能备份方法,其特征在于,包括:
步骤1,完全备份模块暂停文件变化检测,扫描用户***,获得用户***特征并发送到云端,生成未备份文件列表并向云端进行完全备份,用户***特征至少包括操作***名称、版本、安装路径以及所有安装的应用程序的名称、版本、安装路径;
步骤2,激活文件变化检测,完全备份模块向文件变化检测模块发送激活消息,文件变化模块从暂停状态改为运行状态;
步骤3,文件变化检测并发送,文件变化检测模块获取***中文件变化事件,并获得和该文件变化事件相关的文件全路径名、时间、进程名和类型组成一条文件变化事件消息,并发送给增量判定模块;
步骤4,规则载入步骤,增量判定模块从规则库中载入规则,至少包括用户类规则和***类规则;
步骤5,增量文件判定步骤,增量判定模块等待接收文件变化事件,判断文件变化事件是否为重复事件,匹配规则库中的规则,如果不匹配所有用户类规则或匹配任意一条***类规则,则将文件变化事件的文件全路径名写入到增量文件列表,否则丢弃该文件变化事件消息;
步骤6,读入增量文件列表步骤,增量备份模块读入所有的增量文件的全路径名;
步骤7,增量备份查找出增量文件所在的增备卷,遍历每个增备卷,对每个增备卷生成快照,挂载快照,并将增量文件、增量文件全路径名、增量文件摘要值发送到云端,删除快照,最后清空增量文件列表;
步骤8,规则库更新步骤,规则库更新模块向云端发送主机特性,云端根据主机特性,返回规则库;
步骤9,规则库写入步骤,规则更新模块将更新后的规则写入到规则库中。
2.如权力要求1所述的计算机数据智能备份方法,其特征在于,所述步骤1中生成未备份文件列表并向云端进行完全备份进一步为:
步骤21,云端根据用户***特征,与预先备份的操作***文件、应用程序文件进行比较,当匹配后,结合本地***安装路径,生成匹配文件的全路径名写入到已备份文件列表中(但不需要文件摘要值),同时将以前备份的用户数据文件列表及摘要值写到已备份文件列表中,将备份文件列表发送给完全备份模块;
步骤22,枚举***所有卷,生成全备卷列表;
步骤23,判断全备卷列表是否为空,如果为空,转步骤28,如果不为空,转步骤24;
步骤24,选择全备卷列表中的一个全备卷,对该全备卷生成快照;
步骤25,生成未备份文件列表步骤,挂载步骤24生成的快照,遍历快照中的每个文件夹、文件,生成全路径名,将全路径名和已备份文件列表对比,对于在已备份文件列表中匹配上的全路径名,如果该全路径名不含有摘要值的,则认为匹配成功,该文件已经备份,否则,如果含有摘要值,则计算本地***中该文件的摘要值,并和备份文件列表中对应记录的摘要值比较是否相等,如果相等,则认为该文件已备份,否则将该文件全路径添加到未备份文件列表,对于在已备份文件列表中未匹配的全路径名,将该文件全路径添加到未备份文件列表;
步骤26,向云端发送未备份文件列表、未备份文件、摘要值,清空未备份文件列表;
步骤27,删除步骤24生成的快照,从全备卷列表中移除该全备卷,转步骤23;
步骤28,向云端发送完全备份结束消息;
步骤29,向文件变化检测模块发送激活消息,文件变化检测从暂停状态变为运行状态。
3.如权力要求1所述的计算机数据智能备份方法,其特征在于,所述步骤4中用户类规则和***类规则,其特征在于:
用户类规则至少包括:用户进程排除规则、用户进程目录名排除规则、文件名称排除规则;***类规则至少包括:***进程包含规则;
用户进程排除规则匹配条件:进程名称;
用户进程目录名排除规则匹配条件:用户进程名且目录的全路径名;
文件名称排除规则匹配条件:文件的全路径名;
***进程包含规则匹配条件:进程名称。
4. 如权力要求1所述的计算机数据智能备份方法,其特征在于,所述步骤5进一步为:
步骤41,等待接收文件变化事件消息,包括文件创建、文件写、文件移动,接收到文件变化事件消息后转步骤42;
步骤42,在增量文件列表中查找,如果某个文件全路径名和当前文件变化事件消息的文件全路径名相同,则认为该文件变化事件为重复事件,转步骤41,否则转步骤43;
步骤43,比较进程名称是否属于***用户,如果是,则为***进程,转步骤44,如果否,转步骤45;
步骤44,比较进程名称是否匹配某条***进程包含规则,如果匹配,则认为该文件变化事件属于备份范围,转步骤46,否则转步骤41;
步骤45,将文件全路径名写入到增量文件列表,转步骤41;
步骤46,比较进程名称是否和某条用户进程排除规则匹配,如果匹配,则认为该文件变化不在备份范围内,转步骤41,否则转步骤47;
步骤47,比较变化文件目录名且进程名称是否匹配某条用户进程目录名排除规则,如果匹配,则认为该文件变化不在备份范围内,转步骤41,否则转步骤48;
步骤48,比较变化文件全路径名是否匹配某条用户文件名排除规则,如果匹配,则认为该文件变化不在备份范围内,转步骤41,否则转步骤45。
5. 如权力要求1所述的计算机数据智能备份方法,其特征在于,所述步骤7进一步为:
步骤51,遍历每个增量文件全路径名,得到增量文件所在卷的卷名,如果增量卷列表中没有该卷名,则写入增备卷列表,否则不写入;
步骤52,判断增备卷列表是否为空,如为空,则转步骤56,否则转步骤53;
步骤53,在增备卷列表中选择一个增备卷,生成该增备卷的快照;
步骤54,遍历增量文件列表,找到属于该增量卷的增量文件全路径名,在该增备卷的快照上读取该增量文件,发送增量文件、增量文件全路径名、增量文件摘要值到云端;
步骤D55,删除该增备卷快照,从增备卷列表中移除卷名,转步骤53;
步骤56,清空增量文件列表。
6. 如权力要求1所述的计算机数据智能备份方法,其特征在于,所述步骤8进一步为:
步骤61,规则库更新模块扫描用户操作***,获取用户***特征,获取当前***时间;
步骤62,向云端发送用户***特征和当前***时间;
步骤63,如果未收到云端回应,则转步骤67,否则转步骤64;
步骤64,将云端返回的规则库版本和当前版本比较,如发生变化,转步骤65,否则转步骤66;
步骤65,从云端下载新的规则库;
步骤66,等待时间间隔P步骤,转步骤61;
步骤67,等待时间间隔Q步骤,转步骤61。
CN201510123310.7A 2015-03-20 2015-03-20 一种计算机数据智能备份方法 Pending CN104714864A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510123310.7A CN104714864A (zh) 2015-03-20 2015-03-20 一种计算机数据智能备份方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510123310.7A CN104714864A (zh) 2015-03-20 2015-03-20 一种计算机数据智能备份方法

Publications (1)

Publication Number Publication Date
CN104714864A true CN104714864A (zh) 2015-06-17

Family

ID=53414226

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510123310.7A Pending CN104714864A (zh) 2015-03-20 2015-03-20 一种计算机数据智能备份方法

Country Status (1)

Country Link
CN (1) CN104714864A (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105373452A (zh) * 2015-12-11 2016-03-02 上海爱数信息技术股份有限公司 一种数据备份方法
CN106598785A (zh) * 2016-12-16 2017-04-26 广东美晨通讯有限公司 文件***备份与还原的方法及装置
CN109522160A (zh) * 2018-11-29 2019-03-26 上海英方软件股份有限公司 通过保存文件信息摘要进行文件目录比较备份方法和***
WO2020037985A1 (zh) * 2018-08-23 2020-02-27 华为技术有限公司 一种计算备份文件大小的方法及装置
CN111159109A (zh) * 2019-11-26 2020-05-15 陶壮壮 一种磁盘空间占用文件的检测方法及***
CN112181756A (zh) * 2019-07-04 2021-01-05 上海泰宇信息技术股份有限公司 一种数据监测保全方法
CN115061856A (zh) * 2022-08-16 2022-09-16 四川大学 基于块的持久卷备份方法、***、存储介质及其恢复方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101403988A (zh) * 2008-11-05 2009-04-08 中国科学院计算技术研究所 一种计算机***中文件备份的***及方法
US20100058010A1 (en) * 2008-09-04 2010-03-04 Oliver Augenstein Incremental backup using snapshot delta views
CN102521075A (zh) * 2011-12-01 2012-06-27 浪潮电子信息产业股份有限公司 一种快速可靠的文件增量备份方法
CN103389925A (zh) * 2012-05-09 2013-11-13 南京壹进制信息技术有限公司 一种基于进程名识别的实时备份方法
CN103412801A (zh) * 2013-08-09 2013-11-27 厦门天锐科技有限公司 基于进程识别文件进行文件备份的方法
CN103995757A (zh) * 2014-05-12 2014-08-20 浪潮电子信息产业股份有限公司 一种基于变化文件监控的快速文件备份方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100058010A1 (en) * 2008-09-04 2010-03-04 Oliver Augenstein Incremental backup using snapshot delta views
CN101403988A (zh) * 2008-11-05 2009-04-08 中国科学院计算技术研究所 一种计算机***中文件备份的***及方法
CN102521075A (zh) * 2011-12-01 2012-06-27 浪潮电子信息产业股份有限公司 一种快速可靠的文件增量备份方法
CN103389925A (zh) * 2012-05-09 2013-11-13 南京壹进制信息技术有限公司 一种基于进程名识别的实时备份方法
CN103412801A (zh) * 2013-08-09 2013-11-27 厦门天锐科技有限公司 基于进程识别文件进行文件备份的方法
CN103995757A (zh) * 2014-05-12 2014-08-20 浪潮电子信息产业股份有限公司 一种基于变化文件监控的快速文件备份方法

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105373452A (zh) * 2015-12-11 2016-03-02 上海爱数信息技术股份有限公司 一种数据备份方法
CN105373452B (zh) * 2015-12-11 2019-02-01 上海爱数信息技术股份有限公司 一种数据备份方法
CN106598785A (zh) * 2016-12-16 2017-04-26 广东美晨通讯有限公司 文件***备份与还原的方法及装置
WO2020037985A1 (zh) * 2018-08-23 2020-02-27 华为技术有限公司 一种计算备份文件大小的方法及装置
CN109522160A (zh) * 2018-11-29 2019-03-26 上海英方软件股份有限公司 通过保存文件信息摘要进行文件目录比较备份方法和***
CN109522160B (zh) * 2018-11-29 2020-05-05 上海英方软件股份有限公司 通过保存文件信息摘要进行文件目录比较备份方法和***
CN112181756A (zh) * 2019-07-04 2021-01-05 上海泰宇信息技术股份有限公司 一种数据监测保全方法
CN111159109A (zh) * 2019-11-26 2020-05-15 陶壮壮 一种磁盘空间占用文件的检测方法及***
CN115061856A (zh) * 2022-08-16 2022-09-16 四川大学 基于块的持久卷备份方法、***、存储介质及其恢复方法

Similar Documents

Publication Publication Date Title
CN104714864A (zh) 一种计算机数据智能备份方法
US10198451B2 (en) Systems and methods for using metadata to enhance data identification operations
CN102880663B (zh) 部分去重复的文件的优化
CN101809566B (zh) 高效的文件散列标识符计算
US8112464B2 (en) On-demand access to container file directories
US8478729B2 (en) System and method for controlling the storage of redundant electronic files to increase storage reliability and space efficiency
US9141289B2 (en) Intelligent data storage utilizing one or more records
US8321482B2 (en) Selectively modifying files of a container file
US20090228669A1 (en) Storage Device Optimization Using File Characteristics
CN104462389B (zh) 基于分级存储的分布式文件***实现方法
CN109697016B (zh) 用于改进容器的存储性能的方法和装置
MX2011010287A (es) Restauracion de archivo de sistema de diferencial apartir de pares y la nube.
CN104408111A (zh) 一种删除重复数据的方法及装置
CN103037004A (zh) 云存储***操作的实现方法和装置
US7640588B2 (en) Data processing system and method
US20090024768A1 (en) Connection management program, connection management method and information processing apparatus
US11550913B2 (en) System and method for performing an antivirus scan using file level deduplication
CN113448946B (zh) 数据迁移方法及装置、电子设备
CN102142010A (zh) 嵌入式设备上的多媒体服务数据库录入数据的方法和设备
US10228961B2 (en) Live storage domain decommissioning in a virtual environment
CN110352410A (zh) 跟踪索引节点的访问模式以及预提取索引节点
WO2014163852A1 (en) Grouping files for optimized file operations
CN109325005A (zh) 一种数据处理方法和电子设备
CN101872406A (zh) 计算机文件跟踪方法
CN108733753B (zh) 一种文件读取方法及应用实体

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20150617

WD01 Invention patent application deemed withdrawn after publication