CN102650961A - 监控容灾***数据复制的方法、***和一种容灾*** - Google Patents

监控容灾***数据复制的方法、***和一种容灾*** Download PDF

Info

Publication number
CN102650961A
CN102650961A CN2012101018713A CN201210101871A CN102650961A CN 102650961 A CN102650961 A CN 102650961A CN 2012101018713 A CN2012101018713 A CN 2012101018713A CN 201210101871 A CN201210101871 A CN 201210101871A CN 102650961 A CN102650961 A CN 102650961A
Authority
CN
China
Prior art keywords
data
performance state
data replication
replication performance
state transition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2012101018713A
Other languages
English (en)
Other versions
CN102650961B (zh
Inventor
伍慧峰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Transsion Holdings Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Priority to CN201210101871.3A priority Critical patent/CN102650961B/zh
Publication of CN102650961A publication Critical patent/CN102650961A/zh
Application granted granted Critical
Publication of CN102650961B publication Critical patent/CN102650961B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Debugging And Monitoring (AREA)
  • Hardware Redundancy (AREA)

Abstract

本发明实施例提供监控容灾***数据复制的方法、***和一种容灾***,以一定程度上降低数据复制中断的几率,提高数据复制可靠性。所述方法包括:获取容灾***主备机的状态或待复制数据写操作日志SRL的当前剩余容量;根据容灾***主备机的状态或SRL的当前剩余容量,确定容灾***的当前的数据复制性能状态;根据上一个数据复制性能状态和当前数据复制性能状态,确定当前的数据复制性能状态迁移类型;针对应用***,执行处理策略集合中与确定的数据复制性能状态迁移类型匹配的处理策略。本发明可以减少容灾***中由于应用***出现数据洪峰导致数据同步溢出或中断的几率;在数据复制过程中断后,自动恢复数据复制,降低了容灾***失效的时间。

Description

监控容灾***数据复制的方法、***和一种容灾***
技术领域
本发明涉及通信领域,尤其涉及监控容灾***数据复制的方法、***和一种容灾***。
背景技术
电信***对可靠性有较高的要求,容灾***是一种增强电信***可靠性的常见方案,其基本原理是将被保护的数据块(例如,磁盘和文件卷等)同步复制到备份***中同时监控活动节点的状态,当活动节点发生故障时,可以将***切换到备用***上继续运行,以达到故障快速恢复的目的。采用Veritas公司的卷复制(Veritas Volume Replicator,VVR)软件加上Veritas公司的簇服务器(Veritas Cluster Server,VCS)搭建的容灾***是业界目前较常见的容灾***方案。
在VVR+VCS搭建的容灾***中,数据复制是其中非常重要的一环。其基本过程是:在磁盘上通过Veritas公司的卷管理(Veritas Volume Manager,VxVM)软件建卷,在这些卷上面存放待复制的文件***、数据库等数据块,然后,VVR通过网络实时将卷上面的数据块复制到备份***的磁盘上,使主备两个***的数据保持实时同步。
随着电信***日益庞大,容灾***中待复制数据的大小不断增加。在业务繁忙时长时间内产生大量数据(即长时间产生的数据洪峰)的情况频繁发生,而容灾***,特别是异地的容灾***的数据复制带宽却受到成本等因素限制不能随意增加。当应用***的数据产生速度大于数据复制速度时,可能使数据复制溢出、中断,导致容灾***失效。
为了解决上述容灾***失效的问题,现有技术提供的一种方案是采用VVR软件,通过待复制数据写操作日志(Storage Replicator Log,SRL)提高数据复制的可靠性。在上述方案中,应用***写磁盘时,VVR软件先将数据写入到SRL上,然后再将数据写入物理设备以及将数据同步到备机,其执行过程包括:
S01,应用***写磁盘,此时,应用***的输入/输出(Input/Output,I/O)操作一直执行到写操作完成前被阻塞;
S02,主机的VVR将数据修改日志写入SRL;
S03,主机的VVR向应用程序报告磁盘写入结束,应用程序的IO阻塞结束。
S04,主机的VVR将修改的数据写入到本地磁盘,与此同时,将修改的数据通过网络发送到备机的VVR;
S05,备机的VVR接收到数据后,向主机发送网络响应,示意已经接收到数据;
S06,备机的VVR将修改的数据写入到备机磁盘;
S07,备机的VVR磁盘写入结束后,向主机的VVR发送数据响应,示意已经完成数据同步,主机的VVR则会释放SRL的对应数据修改日志,以便这些日志占用SRL的空间可以被重复利用。
本案发明人经过研究和实践发现,由于上述现有技术提供的解决容灾***失效问题的方案中,SRL的大小有限。当应用***的数据产生速度持续大于数据同步复制速度时,SRL的可用空间逐步减少。一旦这种情况持续时间较长,会导致磁盘缓存溢出,从而中断数据复制过程。出现这种情况时,必须通过手工执行增量同步命令恢复数据复制。在数据复制恢复期间,容灾***基本失效。换言之,现有技术技术不能从根源上解决容灾***中应用***产生数据的速度大于数据被复制到备机时的复制速度而可能导致的数据复制中断问题。
发明内容
本发明实施例提供监控容灾***数据复制的方法、***和一种容灾***,以一定程度上降低数据复制中断的几率,提高数据复制可靠性。
本发明实施例提供一种监控容灾***数据复制的方法,所述方法包括:获取容灾***主备机的状态或待复制数据写操作日志SRL的当前剩余容量;
根据所述容灾***主备机的状态或待复制数据写操作日志SRL的当前剩余容量,确定容灾***的当前的数据复制性能状态;
根据上一个所述数据复制性能状态和当前所述数据复制性能状态,按照数据复制性能状态迁移模型,确定当前的数据复制性能状态迁移类型;
针对应用***,执行处理策略集合中与所述确定的数据复制性能状态迁移类型匹配的处理策略,所述处理策略执行结果包括:改变数据复制时所述应用***写入数据的速度。
本发明实施例提供一种监控容灾***数据复制的***,所述***包括:监控装置、应用***和复制模块,所述监控装置包括复制信息获取模块、状态确定模块、迁移类型确定模块和策略执行模块;
所述复制信息获取模块,用于获取容灾***主备机的状态或待复制数据写操作日志SRL的当前剩余容量;
所述状态确定模块,用于根据所述容灾***主备机的状态或待复制数据写操作日志SRL的当前剩余容量,确定容灾***的数据复制性能状态;
所述迁移类型确定模块,用于根据上一个所述数据复制性能状态和当前所述数据复制性能状态,按照数据复制性能状态迁移模型,确定当前的数据复制性能状态迁移类型;
所述策略执行模块,用于针对应用***,执行处理策略集合中与所述确定的数据复制性能状态迁移类型匹配的处理策略,所述处理策略执行结果包括:改变数据复制时所述应用***写入数据的速度;
所述应用***,用于向所述复制模块写入数据,并根据所述处理策略改变数据复制时所述应用***写入数据的速度;
所述复制模块,用于将所述应用***写入的数据复制到所述容灾***的备机。
本发明实施例提供一种监控装置,所述监控装置包括复制信息获取模块、状态确定模块、迁移类型确定模块和策略执行模块;
所述复制信息获取模块,用于获取容灾***主备机的状态或待复制数据写操作日志SRL的当前剩余容量;
所述状态确定模块,用于根据所述容灾***主备机的状态或待复制数据写操作日志SRL的当前剩余容量,确定容灾***的数据复制性能状态;
所述迁移类型确定模块,用于根据上一个所述数据复制性能状态和当前所述数据复制性能状态,按照数据复制性能状态迁移模型,确定当前的数据复制性能状态迁移类型;
所述策略执行模块,用于针对应用***,执行处理策略集合中与所述确定的数据复制性能状态迁移类型匹配的处理策略,所述处理策略执行结果包括:改变数据复制时所述应用***写入数据的速度。
本发明实施例提供一种容灾***,所述容灾***包括:主机和备机,所述主机包括上述监控容灾***数据复制的***,所述主机用于通过网络将应用***写入的数据复制到所述备机,所述备机用于对所述主机复制过来的数据进行备份。
从上述本发明实施例可知,由于容灾***的数据复制性能状态是根据容灾***主备机的状态或SRL的当前剩余容量获得,在所述数据复制性能状态发生变化时,执行针对应用***的处理策略,以使所述应用***改变数据复制时写入数据的速度。因此,与现有技术解决容灾***失效问题的方案中不考虑SRL剩余容量大小相比,本发明实施例提供的监控容灾***数据复制的方法在SRL剩余容量变小、数据复制性能状态劣化时可以使应用***降低数据写入速度,减少容灾***中由于应用***出现数据洪峰导致数据同步溢出或中断的几率;在数据复制过程中断(此时的复制性能状态对应劣化到最高阶段)后,自动恢复数据复制,降低了数据复制中断时容灾***失效的时间。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对现有技术或实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域技术人员来讲,还可以如这些附图获得其他的附图。
图1是本发明实施例提供的监控容灾***数据复制的方法流程示意图;
图2a是本发明实施例提供的数据复制性能状态迁移模型图;
图2b是本发明另一实施例提供的数据复制性能状态迁移模型图;
图3是本发明实施例提供的监控容灾***数据复制的***结构示意图;
图4a是本发明另一实施例提供的监控容灾***数据复制的***结构示意图;
图4b是本发明另一实施例提供的监控容灾***数据复制的***结构示意图;
图5是本发明另一实施例提供的监控容灾***数据复制的***结构示意图;
图6a是本发明另一实施例提供的监控容灾***数据复制的***结构示意图;
图6b是本发明另一实施例提供的监控容灾***数据复制的***结构示意图;
图7a是本发明另一实施例提供的监控容灾***数据复制的***结构示意图;
图7b是本发明另一实施例提供的监控容灾***数据复制的***结构示意图;
图7c是本发明另一实施例提供的监控容灾***数据复制的***结构示意图;
图7d是本发明另一实施例提供的监控容灾***数据复制的***结构示意图;
图8是本发明实施例提供的容灾***结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域技术人员所获得的所有其他实施例,都属于本发明保护的范围。
请参阅附图1,是本发明实施例提供的监控容灾***数据复制的方法流程示意图,其执行主体可以是容灾***新增加的监控程序,主要包括步骤S101、S102、S103和S104:
S101,获取容灾***主备机的状态或待复制数据写操作日志SRL的当前剩余容量。
在本发明实施例中,容灾***主备机的状态可能是双主状态或主备分离状态。所谓双主状态,是指主备机之间间的网络中断,导致备机认为主机出现异常而触发备机的倒换动作,这时主机和备机同时变成活动(Active)状态,相当于具有两个活动节点,发生这个状态后,主机到备机的数据复制将会终止。所谓主备分离状态,是指主备机没有建立数据复制的状态,此时两机完全独立,不存在数据复制和倒换关系。
在本发明实施例中,可以通过执行vradmin repstatus命令获取待复制数据的大小和待复制数据写操作日志SRL的当前剩余容量。例如,运行命令:vradmin-g<diskgroupname>repstatus<rvgname>,则输出信息的样式如下:
Replicated Data Set:datarvg
Primary:
Host name:            129.9.1.1
RVG name:             datarvg
DG name:              datadg
RVG state:            enabled for I/O
Data volumes:         1
VSets:                0
SRL name:             srl_vol
SRL size:             1.00G
Total secondaries:    1
Secondary:
Host name:            129.9.1.2
RVG name:             datarvg
DG name:              datadg
Data status:          consistent,up-to-date
Replication status:   replicating(connected)
Current mode:         asynchronous
Logging to:           SRL
Timestamp Information:behind by 0h 0m 0s
其中,SRL的当前剩余容量由上述输出信息中“SRL Size”的值给出,而待复制数据大小由上述输出信息中“Data status”对应的参量给出。
S102,根据所述容灾***主备机的状态或待复制数据写操作日志SRL的当前剩余容量,确定容灾***的数据复制性能状态。
在本发明实施例中,容灾***的数据复制性能状态可以根据容灾***主备机的状态来定,也可以根据待复制数据与SRL的当前剩余容量大小关系来定。例如,当监控程序发现容灾***主备机的状态是双主状态或主备分离状态时,则此时所确定的获取容灾***的数据复制性能状态为“停止”状态,除“停止”状态之外的数据复制性能状态都是“非停止”状态,而“非停止”的数据复制性能状态又包括“正常”和“非正常”的数据复制性能状态。
在本发明实施例中,可以根据待复制数据写操作日志SRL的当前剩余容量来确定“正常”和“非正常”的数据复制性能状态。具体地,可以比较待复制数据占用的容量与SRL的当前剩余容量的阈值百分比,该阈值百分比不大于1。例如,当通过执行vradmin repstatus命令而输出的信息获知待复制数据占用的容量小于SRL的当前剩余容量的第一阈值百分比时,确定容灾***的数据复制性能状态为“正常”,其中,第一阈值百分比小于1,例如30%;反之,当通过执行vradmin repstatus命令而输出的信息获知待复制数据占用的容量大于SRL的当前剩余容量的所述第一阈值百分比(例如30%)时,确定容灾***的数据复制性能状态为“非正常”。
为了更加精确地确定容灾***的数据复制性能状态,可以根据待复制数据占用的容量与所述SRL的当前剩余容量的关系,将“非正常”这一容灾***的数据复制性能状态进一步划分。具体地,当通过执行vradmin repstatus命令而输出的信息获知待复制数据占用的容量为SRL的当前剩余容量的第二阈值百分比时,确定容灾***的数据复制性能状态为“劣化”,其中,所述SRL的当前剩余容量的第二阈值百分比大于前述示例的SRL的当前剩余容量的第一阈值百分比(例如30%)而小于1,例如30%~70%;当通过执行vradmin repstatus命令而输出的信息获知待复制数据占用的容量为SRL的当前剩余容量的第三阈值百分比时,确定容灾***的数据复制性能状态为“严重劣化”,其中,所述SRL的当前剩余容量的第三阈值百分比大于前述示例的SRL的当前剩余容量的第二阈值百分比而不大于1,例如70%~100%;当通过执行vradminrepstatus命令而输出的信息获知待复制数据占用的容量大于SRL的当前剩余容量时,确定容灾***的数据复制性能状态为“溢出”。
在上述举例中,当数据复制过程恢复后、直到SRL剩余容量小于30%前,数据复制性能状态都是“停止”。SRL剩余容量小于30%时,数据复制性能状态直接恢复为“正常”。
需要说明的是,上述根据待复制数据占用的容量与SRL的当前剩余容量大小关系来确定容灾***的数据复制性能状态仅仅是举例说明。本领域技术人员能够理解,SRL的当前剩余容量的阈值百分比及其等级是可以根据需要设定的,并不局限于上述实施例中提到的30%、30%~70%和70%~100%等;相应地,容灾***的数据复制性能状态也不局限于上述示例的“停止”、“正常”、“劣化”、“严重劣化”和“溢出”等,还可以有多种情形。
S103,根据上一个所述数据复制性能状态和当前所述数据复制性能状态,按照数据复制性能状态迁移模型,确定当前的数据复制性能状态迁移类型。由于数据复制是一个动态过程,因此,本发明实施例提及的几种数据复制性能状态可能随时发生变化。例如,数据复制性能状态由“正常”向“非正常”变化以及由“停止”向“非停止”变化等等,数据复制性能状态的这些变化被称为数据复制性能状态迁移。如附图2a所示,是本发明实施例提供的容灾***在数据复制过程中的数据复制性能状态迁移模型图,其中,方框的文字说明是数据复制性能状态,箭头旁的文字说明是数据复制性能状态迁移类型。
作为本发明一个实施例,在根据上一个所述数据复制性能状态和当前所述数据复制性能状态,按照数据复制性能状态迁移模型,确定当前的数据复制性能状态迁移类型时,可以是根据上一个数据复制性能状态为“正常”和当前数据复制性能状态为“非正常”,按照数据复制性能状态迁移模型,例如,附图2a示例的容灾***在数据复制过程中的数据复制性能状态迁移模型,确定当前的数据复制性能状态迁移类型为“状态劣化”。
作为本发明另一个实施例,在根据上一个所述数据复制性能状态和当前所述数据复制性能状态,按照数据复制性能状态迁移模型,确定当前的数据复制性能状态迁移类型时,可以是根据上一个数据复制性能状态为“停止”和当前数据复制性能状态为“非停止”,按照数据复制性能状态迁移模型,例如,附图2a示例的容灾***在数据复制过程中的数据复制性能状态迁移模型,确定当前的数据复制性能状态迁移类型为“状态劣化”。
S104,针对应用***,执行处理策略集合中与所述确定的数据复制性能状态迁移类型匹配的处理策略,所述处理策略执行结果包括:改变数据复制时所述应用***写入数据的速度。
与附图2a示例的数据复制性能状态迁移类型相应的是各种数据复制性能状态迁移类型的处理策略集合,如下表1a所示,是数据复制性能状态迁移类型对应的处理策略。
Figure BDA0000149371980000091
表1a
按照附图2a和表1a的示例,针对应用***,执行所述处理策略集合中与所述确定的数据复制性能状态迁移类型匹配的处理策略可以是:根据所述表1a示例的处理策略集合中与所述“状态劣化”所匹配的处理策略,向所述应用***发送告警和/或关闭所述应用***的非关键组件。或者,根据所述表1a示例的处理策略表中与所述“状态恢复”所匹配的处理策略,向所述应用***发送恢复的通知。
应用***在收到如表1a示例的处理策略后,执行这些处理策略,其结果包括:所述应用***改变数据复制时写入数据的速度或者提高数据复制时写入数据的速度等等。例如,根据所述表1a示例的处理策略集合中与所述“状态劣化”所匹配的处理策略,向所述应用***发送告警和/或关闭所述应用***的非关键组件,所述应用***降低数据复制时写入数据的速度,或者,根据所述表1a示例的处理策略集合中与所述“状态恢复”所匹配的处理策略,向应用***发送恢复的通知,所述应用***提高数据复制时写入数据的速度,即恢复数据复制。
按照前述提供的实施例,容灾***在复制数据过程中,可能出现的数据复制性能状态包括“正常”、“劣化”、“严重劣化”、“溢出”和“停止”等几种。这几种数据复制性能状态可能随时发生变化。例如,数据复制性能状态由“正常”依次向“劣化”、“严重劣化”、“溢出”和“停止”变化,或者,由“溢出”依次向“严重劣化”和“劣化”变化等等,如前所述,数据复制性能状态的这些变化被称为数据复制性能状态迁移。在本发明实施例中,与本发明相关的数据复制性能状态迁移的迁移类型有“复制劣化”、“复制严重劣化”、“复制溢出中断”、“溢出状态恢复”、“严重劣化状态恢复”、“劣化状态恢复”、“复制停止”和“复制恢复”等几种,如附图2b所示,是本发明实施例提供的容灾***在数据复制过程中的数据复制性能状态迁移模型图,其中,方框的文字说明是数据复制性能状态,箭头旁的文字说明是数据复制性能状态迁移类型。与附图2b示例的数据复制性能状态迁移类型相应的是各种数据复制性能状态迁移类型的处理策略,如下表1b所示,是数据复制性能状态迁移类型对应的处理策略。
Figure BDA0000149371980000101
表1b
需要说明的是,附图2b示例的数据复制性能状态迁移图和表1示例的数据复制性能状态迁移类型对应的处理策略,可以在所述数据复制性能状态发生变化时或在所述数据复制性能状态发生变化前生成。
作为根据上一个数据复制性能状态和当前数据复制性能状态,按照数据复制性能状态迁移模型,确定当前的数据复制性能状态迁移类型,并针对应用***,执行处理策略集合中与所述确定的数据复制性能状态迁移类型匹配的处理策略的实施例,可以包括:基于如附图2b示例的数据复制性能状态迁移模型图;当数据复制性能状态由“正常”向“劣化”变化时,确定当前数据复制性能状态迁移类型为“复制劣化”;根据表1b示例的处理策略集合中与所述“复制劣化”所匹配的处理策略,向所述应用***发送数据复制劣化告警;或者
基于如附图2b示例的数据复制性能状态迁移模型图;当数据复制性能状态由“劣化”向“严重劣化”变化时,确定当前数据复制性能状态迁移类型为“复制严重劣化”;根据表1b示例的处理策略集合中与所述“复制严重劣化”所匹配的处理策略,关闭所述应用***的非关键组件并向所述应用***发送数据复制严重劣化告警;或者
基于如附图2b示例的数据复制性能状态迁移模型图;当数据复制性能状态由“严重劣化”向“溢出”变化时,确定当前数据复制性能状态迁移类型为“复制溢出中断”;根据表1b示例的处理策略集合中与所述“复制溢出中断”所匹配的处理策略,关闭所述应用***的非关键组件并向所述应用***发送数据复制中断告警;或者
基于如附图2b示例的数据复制性能状态迁移模型图;当数据复制性能状态由“正常”、“劣化”、“严重劣化”或/和“溢出”向“停止”变化时,确定当前数据复制性能状态迁移类型为“复制停止”;根据所述处理策略集合中与所述“复制停止”所匹配的处理策略,重启所述应用***的非关键组件并向所述应用***发送数据复制停止通知。
需要说明的是,附图2b示例的数据复制性能状态迁移模型图及其对应的表1b示例的处理策略集合仅仅是举例说明。本领域技术人员能够理解,随作数据复制性能状态的增多,附图2b示例的数据复制性能状态迁移模型图及其对应的表1b示例的处理策略集合将会适当扩充,但这些扩充都没有背离本发明实施例的精神原则,仍然是在本发明实施例限定的范围内。
在容灾***的监控程序执行针对应用***的处理策略后,应用***按照所述执行的处理策略,根据劣化级别降低数据写入速度或者恢复数据复制。例如,在收到容灾***的监控程序发送的数据复制劣化告警、数据复制严重劣化告警或数据复制中断告警后,应用***需要根据劣化级别逐级降低数据写入速度或数据产生速度,例如,可通过在应用***内加入延迟以暂时降低程序运行效率。
再如,在收到容灾***的监控程序发送的数据复制中断恢复通知、数据复制严重劣化恢复通知或数据复制劣化恢复通知后,应用***逐级恢复其数据产生速度。
从上述本发明实施例提供的监控容灾***数据复制的方法可知,由于容灾***的数据复制性能状态是根据容灾***主备机的状态或SRL的当前剩余容量获得,在所述数据复制性能状态发生变化时,执行针对应用***的处理策略,以使所述应用***降低数据写入速度或者恢复数据复制。因此,与现有技术解决容灾***失效问题的方案中不考虑SRL剩余容量大小相比,本发明实施例提供的增强容灾***复制可靠性的方法在SRL剩余容量变小、数据复制性能状态劣化时可以使应用***降低数据写入速度,减少容灾***中由于应用***出现数据洪峰导致数据同步溢出或中断的几率;在数据复制过程中断(此时的复制性能状态对应劣化到最高阶段)后,自动恢复数据复制,降低了数据复制中断时容灾***失效的时间。
请参阅附图3,是本发明实施例提供的监控容灾***数据复制的***结构示意图。为了便于说明,仅仅示出了与本发明实施例相关的部分。附图3示例的监控容灾***数据复制的***包括监控装置31、应用***32和复制模块33,所述监控装置31包括复制信息获取模块311、状态确定模块312、迁移类型确定模块313和策略执行模块314,其中:
复制信息获取模块311,用于获取容灾***主备机的状态或待复制数据写操作日志SRL的当前剩余容量,所述容灾***主备机的状态可以是双主状态或主备分离状态。所谓双主状态,是指主备机之间间的网络中断,导致备机认为主机出现异常而触发备机的倒换动作,这时主机和备机同时变成活动(Active)状态,相当于具有两个活动节点,发生这个状态后,主机到备机的数据复制将会终止。所谓主备分离状态,是指主备机没有建立数据复制的状态,此时两机完全独立,不存在数据复制和倒换关系。待复制数据的大小和待复制数据写操作日志SRL的当前剩余容量,复制信息获取模块可以通过执行vradmin repstatus命令获取。例如,运行命令:vradmin-g<diskgroupname>repstatus<rvgname>,则输出信息的样式如下:
Replicated Data Set:datarvg
Primary:
Host name:           129.9.1.1
RVG name:            datarvg
DG name:             datadg
RVG state:           enabled for I/O
Data volumes:       1
VSets:              0
SRL name:           srl_vol
SRL size:           1.00G
Total secondaries:  1
Secondary:
Host name:          129.9.1.2
RVG name:           datarvg
DG name:            datadg
Data status:        consistent,up-to-date
Replication status: replicating(connected)
Current mode:       asynchronous
Logging to:         SRL
Timestamp Information:behind by 0h 0m 0s
其中,SRL的当前剩余容量由上述输出信息中“SRL Size”的值给出,而待复制数据大小由上述输出信息中“Data status”对应的参量给出。
状态确定模块312,用于根据所述容灾***主备机的状态或待复制数据写操作日志SRL的当前剩余容量,确定容灾***的数据复制性能状态。对于容灾***的数据复制性能状态,状态确定模块312可以根据容灾***主备机的状态确定,也可以根据待复制数据与SRL的当前剩余容量大小关系确定。例如,当监控程序发现容灾***主备机的状态是双主状态或主备分离状态时,则此时状态确定模块312确定的获取容灾***的数据复制性能状态为“停止”状态,除“停止”状态之外的数据复制性能状态都是“非停止”状态,而“非停止”的数据复制性能状态又包括“正常”和“非正常”的数据复制性能状态。
迁移类型确定模块313,用于根据上一个所述数据复制性能状态和当前所述数据复制性能状态,按照数据复制性能状态迁移模型,确定当前的数据复制性能状态迁移类型。
策略执行模块314,用于针对应用***,执行处理策略集合中与所述确定的数据复制性能状态迁移类型匹配的处理策略,所述处理策略执行结果包括:改变数据复制时所述应用***写入数据的速度。
应用***32,用于向所述复制模块写入数据,并根据所述处理策略改变数据复制时所述应用***写入数据的速度。
复制模块33,用于将所述应用***写入的数据复制到所述容灾***的备机。在本实施例中,复制模块33可以是Veritas公司的卷复制(Veritas VolumeReplicator,VVR)软件实体,也可以是与之类似的卷复制软件实体,本发明对此不做限制。
需要说明的是,以上监控容灾***数据复制的***的实施方式中,各功能模块的划分仅是举例说明,实际应用中可以根据需要,例如相应硬件的配置要求或者软件的实现的便利考虑,而将上述功能分配由不同的功能模块完成,即将所述监控容灾***数据复制的***的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。而且,实际应用中,本实施例中的相应的功能模块可以是由相应的硬件实现,也可以由相应的硬件执行相应的软件完成,例如,前述的复制信息获取模块,可以是具有执行前述获取容灾***主备机的状态或待复制数据写操作日志SRL的当前剩余容量的硬件,例如复制信息获取器,也可以是能够执行相应计算机程序从而完成前述功能的一般处理器或者其他硬件设备;再如前述的状态确定模块,可以是具有执行前述根据所述容灾***主备机的状态或待复制数据写操作日志SRL的当前剩余容量,确定容灾***的数据复制性能状态功能的硬件,例如状态确定器,也可以是能够执行相应计算机程序从而完成前述功能的一般处理器或者其他硬件设备(本说明书提供的各个实施例都可应用上述描述原则)。
在附图3示例的监控容灾***数据复制的***中,状态确定模块312可以包括第一状态确定模块401或者状态确定模块312包括第二状态确定模块402和第三状态确定模块403,如附图4a或附图4b所示本发明另一实施例提供的监控容灾***数据复制的***,其中:
第一状态确定模块401,用于若所述容灾***主备机是双主状态或主备分离状态,确定所述容灾***的数据复制性能状态为“停止”。
第二状态确定模块402,用于当待复制数据占用的容量小于所述SRL的当前剩余容量的第一阈值百分比时,确定容灾***的数据复制性能状态为“正常”,所述第一阈值百分比小于1,例如30%。
第三状态确定模块403,用于当待复制数据占用的容量大于所述SRL的当前剩余容量的第一阈值百分比(例如30%)而小于1时,确定容灾***的数据复制性能状态为“非正常”。
为了更加精确地确定容灾***的数据复制性能状态,可以根据待复制数据占用的容量与所述SRL的当前剩余容量的关系,将“非正常”这一容灾***的数据复制性能状态进一步划分。具体地,在附图4b示例的监控容灾***数据复制的***中,第三状态确定模块403可以包括第四状态确定单元501、第五状态确定单元502和第六状态确定单元503,如附图5所示本发明另一实施例提供的监控容灾***数据复制的***,其中:第四状态确定单元501,用于当待复制数据占用的容量为所述SRL的当前剩余容量的第二阈值百分比时,确定容灾***的数据复制性能状态为“劣化”,所述SRL的当前剩余容量的第二阈值百分比大于所述SRL的当前剩余容量的第一阈值百分比(例如30%)而小于1,例如30%~70%。
第五状态确定单元502,用于当待复制数据占用的容量为所述SRL的当前剩余容量的第三阈值百分比时,确定容灾***的数据复制性能状态为“严重劣化”,所述SRL的当前剩余容量的第三阈值百分比大于所述SRL的当前剩余容量的第二阈值百分比(例如30%~70%)而不大于1,例如70%~100%。
第六状态确定单元503,用于当待复制数据占用的容量大于所述SRL的当前剩余容量时,确定容灾***的数据复制性能状态为“溢出”。
在上述附图5的示例中,当数据复制过程恢复后、直到SRL剩余容量小于30%前,数据复制性能状态都是“停止”。SRL剩余容量小于30%时,数据复制性能状态直接恢复为“正常”。
需要说明的是,上述附图5中,第三状态确定模块403根据待复制数据占用的容量与SRL的当前剩余容量大小关系来确定容灾***的数据复制性能状态仅仅是举例说明。本领域技术人员能够理解,SRL的当前剩余容量的阈值百分比及其等级是可以根据需要设定的,并不局限于上述实施例中提到的30%、30%~70%和70%~100%等;相应地,容灾***的数据复制性能状态也不局限于上述示例的“停止”、“正常”、“劣化”、“严重劣化”和“溢出”等,还可以有多种情形。
由于数据复制是一个动态过程,因此,本发明实施例提及的几种数据复制性能状态可能随时发生变化。例如,数据复制性能状态由“正常”向“非正常”变化以及由“停止”向“非停止”变化等等,数据复制性能状态的这些变化被称为数据复制性能状态迁移。如附图2a所示,是本发明实施例提供的容灾***在数据复制过程中的数据复制性能状态迁移模型图,其中,方框的文字说明是数据复制性能状态,箭头旁的文字说明是数据复制性能状态迁移类型。与附图2a示例的数据复制性能状态迁移类型相应的是各种数据复制性能状态迁移类型的处理策略,如表1a所示,是数据复制性能状态迁移类型对应的处理策略。
按照附图2a和表1a的示例,在附图3示例的监控容灾***数据复制的***中,迁移类型确定模块313可以包括第一迁移类型确定单元601,策略执行模块314可以包括第一策略执行单元602,如附图6a所示本发明另一实施例提供的监控容灾***数据复制的***,其中:
第一迁移类型确定单元601,用于根据上一个数据复制性能状态为“停止”和当前数据复制性能状态为“非停止”,按照数据复制性能状态迁移模型,确定当前的数据复制性能状态迁移类型为“状态劣化”。
第一策略执行单元602,用于基于数据复制性能状态迁移模型,按照数据复制性能状态由“正常”向“非正常”的变化确定当前数据复制性能状态迁移类型为“状态劣化”,根据所述处理策略表中与所述“状态劣化”所匹配的处理策略,向所述应用***发送告警和/或关闭所述应用***的非关键组件。
按照附图2a和表1a的示例,在附图3示例的监控容灾***数据复制的***中,迁移类型确定模块313也可以包括第二迁移类型确定单元603,策略执行模块314可以包括第二策略执行单元604,如附图6b所示本发明另一实施例提供的监控容灾***数据复制的***,其中:
第二迁移类型确定单元603,用于根据上一个数据复制性能状态为“停止”和当前数据复制性能状态为“非停止”,按照数据复制性能状态迁移模型,确定当前的数据复制性能状态迁移类型为“状态恢复”。
第二策略执行单元604,用于基于数据复制性能状态迁移模型,按照数据复制性能状态由“停止”向“非停止”的变化确定当前数据复制性能状态迁移类型为“状态恢复”,根据所述处理策略表中与所述“状态恢复”所匹配的处理策略,向所述应用***发送恢复的通知。
按照前述提供的实施例,容灾***在复制数据过程中,可能出现的数据复制性能状态包括“正常”、“劣化”、“严重劣化”、“溢出”和“停止”等几种。这几种数据复制性能状态可能随时发生变化。例如,数据复制性能状态由“正常”依次向“劣化”、“严重劣化”、“溢出”和“停止”变化,或者,由“溢出”依次向“严重劣化”和“劣化”变化等等,如前所述,数据复制性能状态的这些变化被称为数据复制性能状态迁移。在本发明实施例中,与本发明相关的数据复制性能状态迁移的迁移类型有“复制劣化”、“复制严重劣化”、“复制溢出中断”、“溢出状态恢复”、“严重劣化状态恢复”、“劣化状态恢复”、“复制停止”和“复制恢复”等几种,如附图2b所示,是本发明实施例提供的容灾***在数据复制过程中的数据复制性能状态迁移图,其中,方框的文字说明是数据复制性能状态,箭头旁的文字说明是数据复制性能状态迁移类型。与附图2b示例的数据复制性能状态迁移类型相应的是各种数据复制性能状态迁移类型的处理策略,如表1b所示,是数据复制性能状态迁移类型对应的处理策略。具体地,附图5示例的迁移类型确定模块313包括第三迁移类型确定单元701,策略执行模块313包括第三策略执行单元702,或者迁移类型确定模块313包括第四迁移类型确定单元703,策略执行模块313包括第四策略执行单元704,或者迁移类型确定模块313包括第四迁移类型确定单元705,策略执行模块313包括第五策略执行单元706,或者迁移类型确定模块313包括第三迁移类型确定单元707,策略执行模块313包括第六策略执行单元708,如附图7a、附图7b、附图7c和附图7d所示本发明另一实施例提供的监控容灾***数据复制的***,其中:
第三迁移类型确定单元701,用于基于数据复制性能状态迁移模型,当数据复制性能状态由“正常”向“劣化”变化时,确定当前数据复制性能状态迁移类型为“复制劣化”;
第三策略执行单元702,用于根据所述处理策略表中与所述“复制劣化”所匹配的处理策略,向所述应用***发送数据复制劣化告警;
第四迁移类型确定单元703,用于基于数据复制性能状态迁移模型,当数据复制性能状态由“劣化”向“严重劣化”变化时,确定当前数据复制性能状态迁移类型为“复制严重劣化”;
第四策略执行单元704,用于根据所述处理策略表中与所述“复制严重劣化”所匹配的处理策略,关闭所述应用***的非关键组件并向所述应用***发送数据复制严重劣化告警;
第五迁移类型确定单元705,用于基于数据复制性能状态迁移模型,当数据复制性能状态由“严重劣化”向“溢出”变化时,确定当前数据复制性能状态迁移类型为“复制溢出中断”;
第五策略执行单元706,用于根据所述处理策略表中与所述“复制溢出中断”所匹配的处理策略,关闭所述应用***的非关键组件并向所述应用***发送数据复制中断告警;
第六迁移类型确定单元707,用于基于数据复制性能状态迁移模型,当数据复制性能状态由“正常”、“劣化”、“严重劣化”或/和“溢出”向“停止”变化时,确定当前数据复制性能状态迁移类型为“复制停止”;
第六策略执行单元708,用于根据所述处理策略表中与所述“复制停止”所匹配的处理策略,重启所述应用***的非关键组件并向所述应用***发送数据复制停止通知。
在附图5示例的策略执行模块313执行针对应用***的处理策略后,应用***按照所述执行的处理策略,根据劣化级别降低数据写入速度或者恢复数据复制。例如,在收到容灾***的监控程序发送的数据复制劣化告警、数据复制严重劣化告警或数据复制中断告警后,应用***需要根据劣化级别逐级降低数据写入速度或数据产生速度,例如,可通过在应用***内加入延迟以暂时降低程序运行效率。
再如,在收到容灾***的监控程序发送的数据复制中断恢复通知、数据复制严重劣化恢复通知或数据复制劣化恢复通知后,应用***逐级恢复其数据产生速度。
请参阅附图8,是本发明实施例提供的容灾***结构示意图。为了便于说明,仅仅示出了与本发明实施例相关的部分。附图8示例的容灾***包括主机81和备机82,主机81包括附图3至附图7d任意一示例的监控容灾***数据复制的***811(换言之,主机81上部署有如附图3至附图7d任意一示例的监控容灾***数据复制的***811),监控容灾***数据复制的***811包括监控装置8111、应用***8112、磁盘阵列8113和复制模块8114,监控装置8111包括复制信息获取模块81111、状态确定模块81112和策略执行模块81113,备机82包括复制模块821和磁盘阵列822,其中,主机81的复制模块8114和备机82的复制模块821都可以是VVR实体,两者通过网络83进行交互,将主机81的应用***8112写入的数据从主机81复制到备机82,备机82的复制模块821将复制过来的数据写入其磁盘阵列822。
具体地,复制信息获取模块81111获取容灾***主备机的状态或待复制数据写操作日志SRL的当前剩余容量,状态确定模块81112根据所述容灾***主备机的状态或待复制数据写操作日志SRL的当前剩余容量,确定容灾***的数据复制性能状态,策略执行模块81113在所述数据复制性能状态由“正常”向“非正常”变化时,执行针对应用***8112的处理策略,以使所述应用***8112降低数据写入速度,在所述数据复制性能状态由“停止”向“非停止”变化时,执行针对应用***8112的处理策略,以使所述应用***8112恢复数据复制。应用***8112向复制模块8114写入数据,在所述数据复制性能状态由“正常”向“非正常”变化时,降低数据写入速度,在所述数据复制性能状态由“停止”向“非停止”变化时,恢复数据复制。例如,在收到策略执行模块81113发送的数据复制劣化告警、数据复制严重劣化告警或数据复制中断告警后,应用***8112需要根据劣化级别逐级降低数据写入速度或数据产生速度,例如,可通过在应用***内加入延迟以暂时降低程序运行效率。再如,在收到策略执行模块81113发送的数据复制中断恢复通知、数据复制严重劣化恢复通知或数据复制劣化恢复通知后,应用***8112逐级恢复其数据产生速度。
本发明实施例还提供监控装置,所述监控装置包括复制信息获取模块、状态确定模块、迁移类型确定模块和策略执行模块;所述复制信息获取模块,用于获取容灾***主备机的状态或待复制数据写操作日志SRL的当前剩余容量;所述状态确定模块,用于根据所述容灾***主备机的状态或待复制数据写操作日志SRL的当前剩余容量,确定容灾***的数据复制性能状态;所述迁移类型确定模块,用于根据上一个所述数据复制性能状态和当前所述数据复制性能状态,按照数据复制性能状态迁移模型,确定当前的数据复制性能状态迁移类型;所述策略执行模块,用于针对应用***,执行处理策略集合中与所述确定的数据复制性能状态迁移类型匹配的处理策略,所述处理策略执行结果包括:改变数据复制时所述应用***写入数据的速度。
需要说明的是,上述装置各模块/单元之间的信息交互、执行过程等内容,由于与本发明方法实施例基于同一构思,其带来的技术效果与本发明方法实施例相同,具体内容可参见本发明方法实施例中的叙述,此处不再赘述。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,比如以下各种方法的一种或多种或全部:
获取容灾***主备机的状态或待复制数据写操作日志SRL的当前剩余容量;
根据所述容灾***主备机的状态或待复制数据写操作日志SRL的当前剩余容量,获取容灾***的数据复制性能状态;
在所述数据复制性能状态发生变化时,执行针对应用***的处理策略,以使所述应用***降低数据写入速度或者恢复数据复制。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:只读存储器(ROM,Read Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁盘或光盘等。
以上对本发明实施例提供的监控容灾***数据复制的方法、***和一种容灾***进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (14)

1.一种监控容灾***数据复制的方法,其特征在于,所述方法包括:
获取容灾***主备机的状态或待复制数据写操作日志SRL的当前剩余容量;
根据所述容灾***主备机的状态或待复制数据写操作日志SRL的当前剩余容量,确定容灾***的当前的数据复制性能状态;
根据上一个所述数据复制性能状态和当前所述数据复制性能状态,按照数据复制性能状态迁移模型,确定当前的数据复制性能状态迁移类型;
针对应用***,执行处理策略集合中与所述确定的数据复制性能状态迁移类型匹配的处理策略,所述处理策略执行结果包括:改变数据复制时所述应用***写入数据的速度。
2.如权利要求1所述的方法,其特征在于,所述根据所述容灾***主备机的状态,确定容灾***的数据复制性能状态包括:
如果所述容灾***主备机是双主状态或主备分离状态,确定所述容灾***的数据复制性能状态为“停止”;或者
所述根据待复制数据写操作日志SRL的当前剩余容量,确定容灾***的数据复制性能状态包括:
当待复制数据占用的容量小于所述SRL的当前剩余容量的第一阈值百分比时,确定容灾***的数据复制性能状态为“正常”,所述第一阈值百分比小于1;
当待复制数据占用的容量大于所述SRL的当前剩余容量的第一阈值百分比而小于1时,确定容灾***的数据复制性能状态为“非正常”。
3.如权利要求2所述的方法,其特征在于,所述确定容灾***的数据复制性能状态为“非正常”包括:
当待复制数据占用的容量为所述SRL的当前剩余容量的第二阈值百分比时,确定容灾***的数据复制性能状态为“劣化”,所述SRL的当前剩余容量的第二阈值百分比大于所述SRL的当前剩余容量的第一阈值百分比,所述第二阈值百分比小于1;
当待复制数据占用的容量为所述SRL的当前剩余容量的第三阈值百分比时,确定容灾***的数据复制性能状态为“严重劣化”,所述SRL的当前剩余容量的第三阈值百分比大于所述SRL的当前剩余容量的第二阈值百分比,所述第三阈值百分比不大于1;
当待复制数据占用的容量大于所述SRL的当前剩余容量时,确定容灾***的数据复制性能状态为“溢出”。
4.如权利要求1所述的方法,其特征在于,所述根据上一个所述数据复制性能状态和当前所述数据复制性能状态,按照数据复制性能状态迁移模型,确定当前的数据复制性能状态迁移类型包括:根据上一个数据复制性能状态为“正常”和当前数据复制性能状态为“非正常”,按照数据复制性能状态迁移模型,确定当前的数据复制性能状态迁移类型为“状态劣化”;
所述针对应用***,执行所述处理策略集合中与所述确定的数据复制性能状态迁移类型匹配的处理策略包括:根据所述处理策略集合中与所述“状态劣化”所匹配的处理策略,向所述应用***发送告警和/或关闭所述应用***的非关键组件;所述改变数据复制时所述应用***写入数据的速度包括:降低数据复制时所述应用***写入数据的速度。
5.如权利要求1所述的方法,其特征在于,所述根据上一个所述数据复制性能状态和当前所述数据复制性能状态,按照数据复制性能状态迁移模型,确定当前的数据复制性能状态迁移类型包括:根据上一个数据复制性能状态为“停止”和当前数据复制性能状态为“非停止”,按照数据复制性能状态迁移模型,确定当前的数据复制性能状态迁移类型为“状态恢复”;
所述针对应用***,执行所述处理策略集合中与所述确定的数据复制性能状态迁移类型匹配的处理策略包括:根据所述处理策略集合中与所述“状态恢复”所匹配的处理策略,向所述应用***发送恢复的通知;所述改变数据复制时所述应用***写入数据的速度包括:提高数据复制时所述应用***写入数据的速度。
6.如权利要求3所述的方法,其特征在于,所述根据上一个所述数据复制性能状态和当前所述数据复制性能状态,按照数据复制性能状态迁移模型,确定当前的数据复制性能状态迁移类型包括:基于数据复制性能状态迁移模型,当数据复制性能状态由“正常”向“劣化”变化时,确定当前数据复制性能状态迁移类型为“复制劣化”;所述针对应用***,执行所述处理策略集合中与所述确定的数据复制性能状态迁移类型匹配的处理策略包括:根据所述处理策略集合中与所述“复制劣化”所匹配的处理策略,向所述应用***发送数据复制劣化告警;或者
所述根据上一个所述数据复制性能状态和当前所述数据复制性能状态,按照数据复制性能状态迁移模型,确定当前的数据复制性能状态迁移类型包括:基于数据复制性能状态迁移模型,当数据复制性能状态由“劣化”向“严重劣化”变化时,确定当前数据复制性能状态迁移类型为“复制严重劣化”;所述针对应用***,执行所述处理策略集合中与所述确定的数据复制性能状态迁移类型匹配的处理策略包括:根据所述处理策略集合中与所述“复制严重劣化”所匹配的处理策略,关闭所述应用***的非关键组件并向所述应用***发送数据复制严重劣化告警;或者
所述根据上一个所述数据复制性能状态和当前所述数据复制性能状态,按照数据复制性能状态迁移模型,确定当前的数据复制性能状态迁移类型包括:基于数据复制性能状态迁移模型,当数据复制性能状态由“严重劣化”向“溢出”变化时,确定当前数据复制性能状态迁移类型为“复制溢出中断”;所述针对应用***,执行所述处理策略集合中与所述确定的数据复制性能状态迁移类型匹配的处理策略包括:根据所述处理策略集合中与所述“复制溢出中断”所匹配的处理策略,关闭所述应用***的非关键组件并向所述应用***发送数据复制中断告警;或者
所述根据上一个所述数据复制性能状态和当前所述数据复制性能状态,按照数据复制性能状态迁移模型,确定当前的数据复制性能状态迁移类型包括:基于数据复制性能状态迁移模型,当数据复制性能状态由“正常”、“劣化”、“严重劣化”或/和“溢出”向“停止”变化时,确定当前数据复制性能状态迁移类型为“复制停止”;所述针对应用***,执行所述处理策略集合中与所述确定的数据复制性能状态迁移类型匹配的处理策略包括:根据所述处理策略集合中与所述“复制停止”所匹配的处理策略,重启所述应用***的非关键组件并向所述应用***发送数据复制停止通知。
7.一种监控容灾***数据复制的***,其特征在于,所述***包括监控装置、应用***和复制模块,所述监控装置包括复制信息获取模块、状态确定模块、迁移类型确定模块和策略执行模块;
所述复制信息获取模块,用于获取容灾***主备机的状态或待复制数据写操作日志SRL的当前剩余容量;
所述状态确定模块,用于根据所述容灾***主备机的状态或待复制数据写操作日志SRL的当前剩余容量,确定容灾***的数据复制性能状态;
所述迁移类型确定模块,用于根据上一个所述数据复制性能状态和当前所述数据复制性能状态,按照数据复制性能状态迁移模型,确定当前的数据复制性能状态迁移类型;
所述策略执行模块,用于针对应用***,执行处理策略集合中与所述确定的数据复制性能状态迁移类型匹配的处理策略,所述处理策略执行结果包括:改变数据复制时所述应用***写入数据的速度;
所述应用***,用于向所述复制模块写入数据,并根据所述处理策略改变数据复制时所述应用***写入数据的速度;
所述复制模块,用于将所述应用***写入的数据复制到所述容灾***的备机。
8.如权利要求7所述的***,其特征在于,所述状态确定模块为第一状态确定模块,或者所述状态确定模块包括第二状态确定模块和第三状态确定模块;
所述第一状态确定模块,用于若所述容灾***主备机是双主状态或主备分离状态,确定所述容灾***的数据复制性能状态为“停止”;
所述第二状态确定模块,用于当待复制数据占用的容量小于所述SRL的当前剩余容量的第一阈值百分比时,确定容灾***的数据复制性能状态为“正常”,所述第一阈值百分比小于1;
所述第三状态确定模块,用于当待复制数据占用的容量大于所述SRL的当前剩余容量的第一阈值百分比而小于1时,确定容灾***的数据复制性能状态为“非正常”。
9.如权利要求8所述的***,其特征在于,所述第三状态确定模块包括:
第四状态确定单元,用于当待复制数据占用的容量为所述SRL的当前剩余容量的第二阈值百分比时,确定容灾***的数据复制性能状态为“劣化”,所述SRL的当前剩余容量的第二阈值百分比大于所述SRL的当前剩余容量的第一阈值百分比,所述第二阈值百分比小于1;
第五状态确定单元,用于当待复制数据占用的容量为所述SRL的当前剩余容量的第三阈值百分比时,确定容灾***的数据复制性能状态为“严重劣化”,所述SRL的当前剩余容量的第三阈值百分比大于所述SRL的当前剩余容量的第二阈值百分比,所述第三阈值百分比不大于1;
第六状态确定单元,用于当待复制数据占用的容量大于所述SRL的当前剩余容量时,确定容灾***的数据复制性能状态为“溢出”。
10.如权利要求7所述的***,其特征在于,所述迁移类型确定模块为第一迁移类型确定单元,所述策略执行模块为第一策略执行单元;
所述第一迁移类型确定单元,用于根据上一个数据复制性能状态为“停止”和当前数据复制性能状态为“非停止”,按照数据复制性能状态迁移模型,确定当前的数据复制性能状态迁移类型为“状态劣化”;
所述第一策略执行单元,用于根据所述处理策略集合中与所述“状态劣化”所匹配的处理策略,向所述应用***发送告警和/或关闭所述应用***的非关键组件;所述改变数据复制时所述应用***写入数据的速度包括:降低数据复制时所述应用***写入数据的速度。
11.如权利要求7所述的***,其特征在于,所述迁移类型确定模块为第二迁移类型确定单元,所述策略执行模块为第二策略执行单元;
所述第二迁移类型确定单元,根据上一个数据复制性能状态为“停止”和当前数据复制性能状态为“非停止”,按照数据复制性能状态迁移模型,确定当前的数据复制性能状态迁移类型为“状态恢复”;
所述第二策略执行单元,用于根据所述处理策略集合中与所述“状态恢复”所匹配的处理策略,向所述应用***发送恢复的通知;所述改变数据复制时所述应用***写入数据的速度包括:提高数据复制时所述应用***写入数据的速度。
12.如权利要求9所述的***,其特征在于,所述迁移类型确定模块为第三迁移类型确定单元,所述策略执行模块为第三策略执行单元,或者所述迁移类型确定模块为第四迁移类型确定单元,所述策略执行模块为第四策略执行单元,或者所述迁移类型确定模块为第五迁移类型确定单元,所述策略执行模块为第五策略执行单元,或者所述迁移类型确定模块为第六迁移类型确定单元,所述策略执行模块为第六策略执行单元;
所述第三迁移类型确定单元,用于基于数据复制性能状态迁移模型,当数据复制性能状态由“正常”向“劣化”变化时,确定当前数据复制性能状态迁移类型为“复制劣化”;
所述第三策略执行单元,用于根据所述处理策略集合中与所述“复制劣化”所匹配的处理策略,向所述应用***发送数据复制劣化告警;
所述第四迁移类型确定单元,用于基于数据复制性能状态迁移模型,当数据复制性能状态由“劣化”向“严重劣化”变化时,确定当前数据复制性能状态迁移类型为“复制严重劣化”;
所述第四策略执行单元,用于根据所述处理策略集合中与所述“复制严重劣化”所匹配的处理策略,关闭所述应用***的非关键组件并向所述应用***发送数据复制严重劣化告警;
所述第五迁移类型确定单元,用于基于数据复制性能状态迁移模型,当数据复制性能状态由“严重劣化”向“溢出”变化时,确定当前数据复制性能状态迁移类型为“复制溢出中断”;
所述第五策略执行单元,用于根据所述处理策略集合中与所述“复制溢出中断”所匹配的处理策略,关闭所述应用***的非关键组件并向所述应用***发送数据复制中断告警;
所述第六迁移类型确定单元,用于基于数据复制性能状态迁移模型,当数据复制性能状态由“正常”、“劣化”、“严重劣化”或/和“溢出”向“停止”变化时,确定当前数据复制性能状态迁移类型为“复制停止”;
所述第六策略执行单元,用于根据所述处理策略集合中与所述“复制停止”所匹配的处理策略,重启所述应用***的非关键组件并向所述应用***发送数据复制停止通知。
13.一种容灾***,其特征在于,所述容灾***包括主机和备机,所述主机包括权利要求7至权利要求12任意一项所述的监控容灾***数据复制的***,所述主机用于通过网络将应用***写入的数据复制到所述备机,所述备机用于对所述主机复制过来的数据进行备份。
14.一种监控装置,其特征在于,所述监控装置包括复制信息获取模块、状态确定模块、迁移类型确定模块和策略执行模块;
所述复制信息获取模块,用于获取容灾***主备机的状态或待复制数据写操作日志SRL的当前剩余容量;
所述状态确定模块,用于根据所述容灾***主备机的状态或待复制数据写操作日志SRL的当前剩余容量,确定容灾***的数据复制性能状态;
所述迁移类型确定模块,用于根据上一个所述数据复制性能状态和当前所述数据复制性能状态,按照数据复制性能状态迁移模型,确定当前的数据复制性能状态迁移类型;
所述策略执行模块,用于针对应用***,执行处理策略集合中与所述确定的数据复制性能状态迁移类型匹配的处理策略,所述处理策略执行结果包括:改变数据复制时所述应用***写入数据的速度。
CN201210101871.3A 2012-03-31 2012-03-31 监控容灾***数据复制的方法、***和一种容灾*** Active CN102650961B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210101871.3A CN102650961B (zh) 2012-03-31 2012-03-31 监控容灾***数据复制的方法、***和一种容灾***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210101871.3A CN102650961B (zh) 2012-03-31 2012-03-31 监控容灾***数据复制的方法、***和一种容灾***

Publications (2)

Publication Number Publication Date
CN102650961A true CN102650961A (zh) 2012-08-29
CN102650961B CN102650961B (zh) 2014-01-01

Family

ID=46692969

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210101871.3A Active CN102650961B (zh) 2012-03-31 2012-03-31 监控容灾***数据复制的方法、***和一种容灾***

Country Status (1)

Country Link
CN (1) CN102650961B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106502833A (zh) * 2016-10-25 2017-03-15 广东欧珀移动通信有限公司 数据备份方法及装置
CN109101371A (zh) * 2018-08-01 2018-12-28 阿里巴巴集团控股有限公司 一种容灾切换方法及装置
CN110445663A (zh) * 2019-08-30 2019-11-12 苏州浪潮智能科技有限公司 一种数据监控方法、装置、设备及存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10285364A (ja) * 1997-04-10 1998-10-23 Ricoh Co Ltd ディジタル複合機
CN1504902A (zh) * 2002-12-05 2004-06-16 国际商业机器公司 在存储器部件之间保持数据一致性的方法和***
US20080201607A1 (en) * 2006-10-24 2008-08-21 Bernd Braeker Disaster recovery in a data processing system
CN101951651A (zh) * 2005-12-27 2011-01-19 富士通株式会社 基站和越区切换控制方法及移动通信***
CN102360323A (zh) * 2011-10-28 2012-02-22 东莞市正欣科技有限公司 一种网络服务器宕机自修复的方法及***

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10285364A (ja) * 1997-04-10 1998-10-23 Ricoh Co Ltd ディジタル複合機
CN1504902A (zh) * 2002-12-05 2004-06-16 国际商业机器公司 在存储器部件之间保持数据一致性的方法和***
CN101951651A (zh) * 2005-12-27 2011-01-19 富士通株式会社 基站和越区切换控制方法及移动通信***
US20080201607A1 (en) * 2006-10-24 2008-08-21 Bernd Braeker Disaster recovery in a data processing system
CN102360323A (zh) * 2011-10-28 2012-02-22 东莞市正欣科技有限公司 一种网络服务器宕机自修复的方法及***

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106502833A (zh) * 2016-10-25 2017-03-15 广东欧珀移动通信有限公司 数据备份方法及装置
US10922193B2 (en) 2016-10-25 2021-02-16 Guangdong Oppo Mobile Telecommunications Corp., Ltd. Data backup method, storage medium, and terminal
CN109101371A (zh) * 2018-08-01 2018-12-28 阿里巴巴集团控股有限公司 一种容灾切换方法及装置
CN110445663A (zh) * 2019-08-30 2019-11-12 苏州浪潮智能科技有限公司 一种数据监控方法、装置、设备及存储介质

Also Published As

Publication number Publication date
CN102650961B (zh) 2014-01-01

Similar Documents

Publication Publication Date Title
CN105389230B (zh) 一种结合快照技术的持续数据保护***及方法
US9773015B2 (en) Dynamically varying the number of database replicas
CN101741536B (zh) 数据级容灾方法、***和生产中心节点
CN105335251B (zh) 一种故障恢复方法及***
CN101539873B (zh) 数据恢复的方法、数据节点及分布式文件***
CN106815097A (zh) 数据库容灾***和方法
CN102890716B (zh) 分布式文件***和分布式文件***的数据备份方法
CN102521083A (zh) 一种云计算***中虚拟机备份方法和***
CN102467508A (zh) 提供数据库服务的方法及数据库***
CN102708150A (zh) 异步复制数据的方法、装置和***
CN110581782A (zh) 一种容灾数据的处理方法、装置及***
CN104407940A (zh) 一种快速恢复cdp***的方法
CN104735107A (zh) 分布式存储***中数据副本恢复方法及装置
CN106603279A (zh) 一种容灾方法和容灾***
CN109117310A (zh) 实现数据备份的容灾***、方法及装置
WO2024148856A1 (zh) 数据写入方法、***、存储硬盘、电子设备及存储介质
CN102650961B (zh) 监控容灾***数据复制的方法、***和一种容灾***
CN105790825A (zh) 一种分布式保护中控制器热备份的方法和装置
CN107368485A (zh) 一种数据库的管理方法及数据库***
CN112948484A (zh) 分布式数据库***和数据灾备演练方法
CN111045602A (zh) 集群***控制方法及集群***
CN102487332B (zh) 故障处理方法、装置和***
CN103931139A (zh) 一种冗余保护方法、装置、设备及***
CN113268395B (zh) 业务数据的处理方法、处理装置及终端
CN115237674A (zh) 基于opendaylight的SDN控制器的数据备份方法及设备、介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20190212

Address after: 518057 Desai Science and Technology Building, 9789 Shennan Avenue, Yuehai Street, Nanshan District, Shenzhen City, Guangdong Province, 17th Floor (15th Floor of Natural Floor) 1702-1703

Patentee after: Shenzhen acoustic Cmi Holdings Ltd

Address before: 518129 Bantian HUAWEI headquarters office building, Longgang District, Guangdong, Shenzhen

Patentee before: Huawei Technologies Co., Ltd.

TR01 Transfer of patent right