CN110635950A - 一种双数据中心容灾*** - Google Patents

一种双数据中心容灾*** Download PDF

Info

Publication number
CN110635950A
CN110635950A CN201910939003.4A CN201910939003A CN110635950A CN 110635950 A CN110635950 A CN 110635950A CN 201910939003 A CN201910939003 A CN 201910939003A CN 110635950 A CN110635950 A CN 110635950A
Authority
CN
China
Prior art keywords
data center
heartbeat
data
monitoring
module
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910939003.4A
Other languages
English (en)
Inventor
陈辉
强春雨
薛文娟
罗文洁
颜旭乐
谭秀瑶
时琛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Power Supply Bureau Co Ltd
Original Assignee
Shenzhen Power Supply Bureau Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Power Supply Bureau Co Ltd filed Critical Shenzhen Power Supply Bureau Co Ltd
Priority to CN201910939003.4A priority Critical patent/CN110635950A/zh
Publication of CN110635950A publication Critical patent/CN110635950A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0654Management of faults, events, alarms or notifications using network fault recovery
    • H04L41/0663Performing the actions predefined by failover planning, e.g. switching to standby network elements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/10Active monitoring, e.g. heartbeat, ping or trace-route

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Cardiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Hardware Redundancy (AREA)

Abstract

本发明提供一种双数据中心容灾***,包括第一数据中心、第二数据中心,以及集中灾备切换装置;第一和第二数据中心均监测本地数据中心的故障状态,以及根据对方反馈回的心跳响应情况来得到对方数据中心的运行状态;集中灾备切换装置对比各数据中心的故障状态及运行状态,分别形成第一和第二对比结果,并根据第一和第二对比结果,识别出第一及第二数据中心之中的故障数据中心和正常数据中心,且进一步让正常数据中心接管故障数据中心的所有数据服务。实施本发明,能自动对双数据中心识别异常状况并作出相应切换操作。

Description

一种双数据中心容灾***
技术领域
本发明涉及数据中心技术领域,尤其涉及一种双数据中心容灾***。
背景技术
95598供电服务面向千家万户,服务要求高、社会影响力大。客户服务中心作为公司的窗口部门,其信息***的可靠性十分重要,特别是95598核心业务***的业务连续性保障体系建设尤为重要。通过业务连续性保障体系的建设,可以提高客户服务中心核心业务***抵御灾难和重大事故的能力,减少灾难打击和重大事故造成的损失,确保客户服务中心重要信息***的数据安全和作业持续性,避免引起社会重要服务功能的严重中断,从而保障社会经济的稳定。
业务连续性保障是95598核心业务***灾备建设的目标,客户服务中心可以采用双活数据中心的架构,双中心同时分区域受理用户业务访问,业务运行在本中心内完成,双中心之间的数据通过数据库逻辑复制技术进行互备。当某一个中心发生灾难或故障事件时,为了满足业务连续性保障,两个数据中心必须能分别对故障中心的远程用户提供访问服务。
因此,亟需一种可自动对双数据中心识别异常状况并作出相应切换操作的容灾***。
发明内容
本发明实施例所要解决的技术问题在于,提供一种双数据中心容灾***,能自动对双数据中心识别异常状况并作出相应切换操作。
为了解决上述技术问题,本发明实施例提供了一种双数据中心容灾***,包括相互连接的第一数据中心和第二数据中心,以及与所述第一数据中心和所述第二数据中心均相连的集中灾备切换装置;其中,
所述第一数据中心,用于监测本地数据中心的故障状态,以及通过向所述第二数据中心发送心跳请求信息后,由接收所述第二数据中心反馈回的心跳响应情况来得到所述第二数据中心的运行状态;
所述第二数据中心,用于监测本地数据中心的故障状态,以及通过向所述第一数据中心发送心跳请求信息后,由接收所述第一数据中心反馈回的心跳响应情况来得到所述第一数据中心的运行状态;
所述集中灾备切换装置,用于对比所述第一数据中心的故障状态及所述第二数据中心得到的所述第一数据中心的运行状态形成第一对比结果,以及对比所述第二数据中心的故障状态及所述第一数据中心得到的所述第二数据中心的运行状态形成第二对比结果,并根据所述第一对比结果和所述第二对比结果,识别出所述第一数据中心及所述第二数据中心之其中的故障数据中心和正常数据中心,且进一步让所述正常数据中心接管所述故障数据中心的所有数据服务。
其中,所述第一数据中心和所述第二数据中心在建立连接后,提供的数据服务相同或相异。
其中,所述第一数据中心包括均与所述集中灾备切换装置连接的第一本地故障状态监测模块及第一对端运行状态监测模块;其中,所述第一本地故障状态监测模块,用于监测所述第一数据中心的故障状态;所述第一对端运行状态监测模块,用于通过向所述第二数据中心发送心跳请求信息后,由接收所述第二数据中心反馈回的心跳响应情况来得到所述第二数据中心的运行状态;
所述第二数据中心包括均与所述集中灾备切换装置连接的第二本地故障状态监测模块及第二对端运行状态监测模块,且所述第二对端运行状态监测模块还与所述第一对端运行状态监测模块建立通道连接;其中,所述第二本地故障状态监测模块,用于监测所述第二数据中心的故障状态;所述第二对端运行状态监测模块,用于通过向所述第一数据中心发送心跳请求信息后,由接收所述第一数据中心反馈回的心跳响应情况来得到所述第一数据中心的运行状态。
其中,所述第一本地故障状态监测模块包括第一设备状态监测子模块和第一环境监测子模块;其中,所述第一设备状态监测子模块,用于监测所述第一数据中心中设备健康数据,得到所述第一数据中心中设备健康状态;所述第一环境监测子模块,用于监测所述第一数据中心中环境数据,得到所述第一数据中心的环境状态;
所述第二本地故障状态监测模块包括第二设备状态监测子模块和第二环境监测子模块;其中,所述第二设备状态监测子模块,用于监测所述第二数据中心中设备健康数据,得到所述第二数据中心中设备健康状态;所述第二环境监测子模块,用于监测所述第二数据中心中环境数据,得到所述第二数据中心的环境状态。
其中,所述第一数据中心及所述第二数据中心的设备健康数据均包括设备电流值和设备电压值;所述第一数据中心及所述第二数据中心的环境数据均包括湿度和温度。
其中,所述第一对端运行状态监测模块包括第一心跳请求信息发送子模块、第一心跳响应信息接收子模块和与所述集中灾备切换装置连接的第一心跳监控管理子模块;其中,所述第一心跳请求信息发送子模块,用于向所述第二数据中心发送心跳请求信息;所述第一心跳响应信息接收子模块,用于接收所述第二数据中心反馈回的心跳响应情况;所述第一心跳监控管理子模块,用于根据所述第二数据中心反馈回的心跳响应情况来得到所述第二数据中心的运行状态;
所述第二对端运行状态监测模块包括第二心跳请求信息发送子模块、第二心跳响应信息接收子模块和与所述集中灾备切换装置连接的第二心跳监控管理子模块;其中,所述第二心跳请求信息发送子模块,用于向所述第一数据中心发送心跳请求信息;所述第二心跳响应信息接收子模块,用于接收所述第一数据中心反馈回的心跳响应情况;所述第二心跳监控管理子模块,用于根据所述第一数据中心反馈回的心跳响应情况来得到所述第一数据中心的运行状态。
其中,所述第一心跳监控管理子模块包括第一计时计数单元和第一运行状态监控管理单元;其中,所述第一计时计数单元,用于当所述第一心跳请求信息发送模块向所述第二数据中心发送心跳请求信息时,开始计时,若超出预设时间所述第一心跳响应信息接收模块还未收到所述第二数据中心反馈回的心跳相应信息,则开始计数,数值加1;或若在所述预设时间内所述第一心跳响应信息接收模块收到所述第二数据中心反馈回的心跳相应信息,则计数的数值清零;所述第一运行状态监控管理单元,用于若所述第一计时计数单元的计数的数值大于阈值,则标记所述第二数据中心的运行状态为故障;反之,则标记所述第二数据中心的运行状态为正常;
所述第二心跳监控管理子模块包括第二计时计数单元和第二运行状态监控管理单元;其中,所述第二计时计数单元,用于当所述第二心跳请求信息发送模块向所述第一数据中心发送心跳请求信息时,开始计时,若超出所述预设时间所述第二心跳响应信息接收模块还未收到所述第一数据中心反馈回的心跳相应信息,则开始计数,数值加1;或若在所述预设时间内所述第二心跳响应信息接收模块收到所述第一数据中心反馈回的心跳相应信息,则计数的数值清零;所述第二运行状态监控管理单元,用于若所述第二计时计数单元的计数的数值大于所述阈值,则标记所述第一数据中心的运行状态为故障;反之,则标记所述第一数据中心的运行状态为正常。
其中,所述第一心跳请求信息发送子模块或所述第二心跳请求信息发送子模块每隔一定时间向对方发送心跳请求信息,以周期性检测所述第一数据中心和所述第二数据中心之间的心跳连接情况。
其中,所述集中灾备切换装置包括监测信息接收模块、监测信息处理模块、故障信息管理模块和接管模块;其中,
所述监测信息接收模块,用于接收所述第一数据中心的故障状态及其得到的所述第二数据中心的运行状态,以及接收所述第二数据中心的故障状态及其得到的所述第一数据中心的运行状态;
所述监测信息处理模块,用于根据预设的故障特征数据,对比所述第一数据中心的故障状态及所述第二数据中心得到的所述第一数据中心的运行状态形成第一对比结果,以及对比所述第二数据中心的故障状态及所述第一数据中心得到的所述第二数据中心的运行状态形成第二对比结果;
所述故障信息管理模块,用于根据所述第一对比结果和所述第二对比结果,识别出所述第一数据中心及所述第二数据中心之其中的故障数据中心和正常数据中心;
所述接管模块,用于在预设的故障逻辑原则中生成相应的接管指令,让所述正常数据中心接管所述故障数据中心的所有数据服务。
其中,所述集中灾备切换装置还包括修正模块;其中,
所述修正模块,用于修正和更新所述预设的故障逻辑原则。
实施本发明实施例,具有如下有益效果:
本发明通过各数据中心的本地故障状态监测模块及对端运行状态监测模块分别监测自身数据中心的故障状态和对方数据中心的运行状态,为集中灾备切换装置提供分析数据,使集中灾备切换装置达到自动识别双数据中心异常状况并作出相应切换操作的目的。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,根据这些附图获得其他的附图仍属于本发明的范畴。
图1为本发明实施例提供的双数据中心容灾***的结构示意图;
图2为图1中第一数据中心的结构示意图;
图3为图1中第二数据中心的结构示意图;
图4为图1中集中灾备切换装置的结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作进一步地详细描述。
如图1所示,为本发明实施例中,提供的一种双数据中心容灾***,包括相互连接的第一数据中心1和第二数据中心2,以及与第一数据中心1和第二数据中心2均相连的集中灾备切换装置3;其中,
第一数据中心1,用于监测本地数据中心的故障状态,以及通过向第二数据中心2发送心跳请求信息后,由接收第二数据中心2反馈回的心跳响应情况来得到第二数据中心2的运行状态;
第二数据中心2,用于监测本地数据中心的故障状态,以及通过向第一数据中心1发送心跳请求信息后,由接收第一数据中心1反馈回的心跳响应情况来得到第一数据中心1的运行状态;
集中灾备切换装置3,用于对比第一数据中心1的故障状态及第二数据中心2得到的第一数据中心1的运行状态形成第一对比结果,以及对比第二数据中心2的故障状态及第一数据中心1得到的第二数据中心2的运行状态形成第二对比结果,并根据第一对比结果和第二对比结果,识别出第一数据中心1及第二数据中心2之其中的故障数据中心和正常数据中心,且进一步让正常数据中心接管故障数据中心的所有数据服务。
应当说明的是,第一数据中心1和第二数据中心2在建立连接后,提供的数据服务可以相同或相异,一旦任意一个出现故障时,所有数据服务会通过集中灾备切换装置3集中到正常的数据中心上,从而确保所有数据服务正常运行,起到了灾备效果。
在本发明实施例中,如图2所示,第一数据中心1包括均与集中灾备切换装置3连接的第一本地故障状态监测模块11及第一对端运行状态监测模块12;其中,第一本地故障状态监测模块11,用于监测第一数据中心1的故障状态;第一对端运行状态监测模块12,用于通过向第二数据中心2发送心跳请求信息后,由接收第二数据中心2反馈回的心跳响应情况来得到第二数据中心2的运行状态;
其中,第一本地故障状态监测模块11包括第一设备状态监测子模块111和第一环境监测子模块112;其中,第一设备状态监测子模块111,用于监测第一数据中心1中设备健康数据,得到第一数据中心1中设备健康状态;第一环境监测子模块112,用于监测第一数据中心1中环境数据,得到第一数据中心1的环境状态;其中,设备健康数据包括设备电流值和设备电压值;环境数据包括湿度和温度;
其中,第一对端运行状态监测模块12包括第一心跳请求信息发送子模块121、第一心跳响应信息接收子模块122和与集中灾备切换装置3连接的第一心跳监控管理子模块123;其中,第一心跳请求信息发送子模块121,用于向第二数据中心2发送心跳请求信息;第一心跳响应信息接收子模块122,用于接收第二数据中心2反馈回的心跳响应情况;第一心跳监控管理子模块123,用于根据第二数据中心2反馈回的心跳响应情况来得到第二数据中心2的运行状态;
其中,第一心跳监控管理子模块123包括第一计时计数单元1231和第一运行状态监控管理单元1232;其中,第一计时计数单元1231,用于当第一心跳请求信息发送模块121向第二数据中心2发送心跳请求信息时,开始计时,若超出预设时间(如10S)第一心跳响应信息接收模块122还未收到第二数据中心2反馈回的心跳相应信息,则开始计数,数值加1;或若在预设时间(如10S)内第一心跳响应信息122接收模块收到第二数据中心2反馈回的心跳相应信息,则计数的数值清零;第一运行状态监控管理单元1232,用于若第一计时计数单元1231的计数的数值大于阈值(如3),则标记第二数据中心2的运行状态为故障;反之,则标记第二数据中心2的运行状态为正常。
在本发明实施例中,如图3所示,第二数据中心2包括均与集中灾备切换装置3连接的第二本地故障状态监测模块21及第二对端运行状态监测模块22,且第二对端运行状态监测模块22还与第一对端运行状态监测模块21建立通道连接;其中,第二本地故障状态监测模块21,用于监测第二数据中心2的故障状态;第二对端运行状态监测模块22,用于通过向第一数据中心1发送心跳请求信息后,由接收第一数据中心1反馈回的心跳响应情况来得到第一数据中心1的运行状态;
其中,第二本地故障状态监测模块21包括第二设备状态监测子模块211和第二环境监测子模块212;其中,第二设备状态监测子模块211,用于监测第二数据中心2中设备健康数据,得到第二数据中心2中设备健康状态;第二环境监测子模块212,用于监测第二数据中心2中环境数据,得到第二数据中心2的环境状态;其中,设备健康数据同样包括设备电流值和设备电压值;环境数据同样包括湿度和温度;
其中,第二对端运行状态监测模块22包括第二心跳请求信息发送子模块221、第二心跳响应信息接收子模块222和与集中灾备切换装置3连接的第二心跳监控管理子模块223;其中,第二心跳请求信息发送子模块221,用于向第一数据中心1发送心跳请求信息;第二心跳响应信息接收子模块222,用于接收第一数据中心1反馈回的心跳响应情况;第二心跳监控管理子模块223,用于根据第一数据中心1反馈回的心跳响应情况来得到第一数据中心1的运行状态;
其中,第二心跳监控管理子模块223包括第二计时计数单元2231和第二运行状态监控管理单元2232;其中,第二计时计数单元2231,用于当第二心跳请求信息发送模块221向第一数据中心1发送心跳请求信息时,开始计时,若超出预设时间(如10S)第二心跳响应信息接收模块222还未收到第一数据中心1反馈回的心跳相应信息,则开始计数,数值加1;或若在预设时间(如10S)内第二心跳响应信息接收模块222收到第一数据中心1反馈回的心跳相应信息,则计数的数值清零;第二运行状态监控管理单元2232,用于若第二计时计数单元2231的计数的数值大于阈值(如3),则标记第一数据中心1的运行状态为故障;反之,则标记第一数据中心1的运行状态为正常。
应当说明的是,第一心跳请求信息发送子模块121或第二心跳请求信息发送子模块221每隔一定时间向对方发送心跳请求信息,以周期性检测第一数据中心1和第二数据中心2之间的心跳连接情况,即周期性自动识别双数据中心异常状况。
在本发明实施例中,如图4所示,集中灾备切换装置3包括监测信息接收模块31、监测信息处理模块32、故障信息管理模块33和接管模块34;其中,
监测信息接收模块31,用于接收第一数据中心1的故障状态及其得到的第二数据中心2的运行状态,以及接收第二数据中心2的故障状态及其得到的第一数据中心1的运行状态;
监测信息处理模块32,用于根据预设的故障特征数据,对比第一数据中心1的故障状态及第二数据中心2得到的第一数据中心1的运行状态形成第一对比结果,以及对比第二数据中心2的故障状态及第一数据中心1得到的第二数据中心2的运行状态形成第二对比结果;
故障信息管理模块33,用于根据第一对比结果和第二对比结果,识别出第一数据中心及第二数据中心之其中的故障数据中心和正常数据中心;应当说明的是,第一数据中心及第二数据中心最多只有一个故障,否则整个数据中心都瘫痪;
接管模块34,用于在预设的故障逻辑原则中生成相应的接管指令,让正常数据中心接管故障数据中心的所有数据服务。
更进一步的,集中灾备切换装置3还包括修正模块35;其中,修正模块35,用于修正和更新预设的故障逻辑原则。
实施本发明实施例,具有如下有益效果:
本发明通过各数据中心的本地故障状态监测模块及对端运行状态监测模块分别监测自身数据中心的故障状态和对方数据中心的运行状态,为集中灾备切换装置提供分析数据,使集中灾备切换装置达到自动识别双数据中心异常状况并作出相应切换操作的目的。
值得注意的是,上述***实施例中,所包括的各个模块只是按照功能逻辑进行划分的,但并不局限于上述的划分,只要能够实现相应的功能即可;另外,各功能单元的具体名称也只是为了便于相互区分,并不用于限制本发明的保护范围。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,所述的程序可以存储于一计算机可读取存储介质中,所述的存储介质,如ROM/RAM、磁盘、光盘等。
以上所揭露的仅为本发明较佳实施例而已,当然不能以此来限定本发明之权利范围,因此依本发明权利要求所作的等同变化,仍属本发明所涵盖的范围。

Claims (10)

1.一种双数据中心容灾***,其特征在于,包括相互连接的第一数据中心和第二数据中心,以及与所述第一数据中心和所述第二数据中心均相连的集中灾备切换装置;其中,
所述第一数据中心,用于监测本地数据中心的故障状态,以及通过向所述第二数据中心发送心跳请求信息后,由接收所述第二数据中心反馈回的心跳响应情况来得到所述第二数据中心的运行状态;
所述第二数据中心,用于监测本地数据中心的故障状态,以及通过向所述第一数据中心发送心跳请求信息后,由接收所述第一数据中心反馈回的心跳响应情况来得到所述第一数据中心的运行状态;
所述集中灾备切换装置,用于对比所述第一数据中心的故障状态及所述第二数据中心得到的所述第一数据中心的运行状态形成第一对比结果,以及对比所述第二数据中心的故障状态及所述第一数据中心得到的所述第二数据中心的运行状态形成第二对比结果,并根据所述第一对比结果和所述第二对比结果,识别出所述第一数据中心及所述第二数据中心之其中的故障数据中心和正常数据中心,且进一步让所述正常数据中心接管所述故障数据中心的所有数据服务。
2.如权利要求1所述的双数据中心容灾***,其特征在于,所述第一数据中心和所述第二数据中心在建立连接后,提供的数据服务相同或相异。
3.如权利要求1所述的双数据中心容灾***,其特征在于,所述第一数据中心包括均与所述集中灾备切换装置连接的第一本地故障状态监测模块及第一对端运行状态监测模块;其中,所述第一本地故障状态监测模块,用于监测所述第一数据中心的故障状态;所述第一对端运行状态监测模块,用于通过向所述第二数据中心发送心跳请求信息后,由接收所述第二数据中心反馈回的心跳响应情况来得到所述第二数据中心的运行状态;
所述第二数据中心包括均与所述集中灾备切换装置连接的第二本地故障状态监测模块及第二对端运行状态监测模块,且所述第二对端运行状态监测模块还与所述第一对端运行状态监测模块建立通道连接;其中,所述第二本地故障状态监测模块,用于监测所述第二数据中心的故障状态;所述第二对端运行状态监测模块,用于通过向所述第一数据中心发送心跳请求信息后,由接收所述第一数据中心反馈回的心跳响应情况来得到所述第一数据中心的运行状态。
4.如权利要求3所述的双数据中心容灾***,其特征在于,所述第一本地故障状态监测模块包括第一设备状态监测子模块和第一环境监测子模块;其中,所述第一设备状态监测子模块,用于监测所述第一数据中心中设备健康数据,得到所述第一数据中心中设备健康状态;所述第一环境监测子模块,用于监测所述第一数据中心中环境数据,得到所述第一数据中心的环境状态;
所述第二本地故障状态监测模块包括第二设备状态监测子模块和第二环境监测子模块;其中,所述第二设备状态监测子模块,用于监测所述第二数据中心中设备健康数据,得到所述第二数据中心中设备健康状态;所述第二环境监测子模块,用于监测所述第二数据中心中环境数据,得到所述第二数据中心的环境状态。
5.如权利要求4所述的双数据中心容灾***,其特征在于,所述第一数据中心及所述第二数据中心的设备健康数据均包括设备电流值和设备电压值;所述第一数据中心及所述第二数据中心的环境数据均包括湿度和温度。
6.如权利要求3所述的双数据中心容灾***,其特征在于,所述第一对端运行状态监测模块包括第一心跳请求信息发送子模块、第一心跳响应信息接收子模块和与所述集中灾备切换装置连接的第一心跳监控管理子模块;其中,所述第一心跳请求信息发送子模块,用于向所述第二数据中心发送心跳请求信息;所述第一心跳响应信息接收子模块,用于接收所述第二数据中心反馈回的心跳响应情况;所述第一心跳监控管理子模块,用于根据所述第二数据中心反馈回的心跳响应情况来得到所述第二数据中心的运行状态;
所述第二对端运行状态监测模块包括第二心跳请求信息发送子模块、第二心跳响应信息接收子模块和与所述集中灾备切换装置连接的第二心跳监控管理子模块;其中,所述第二心跳请求信息发送子模块,用于向所述第一数据中心发送心跳请求信息;所述第二心跳响应信息接收子模块,用于接收所述第一数据中心反馈回的心跳响应情况;所述第二心跳监控管理子模块,用于根据所述第一数据中心反馈回的心跳响应情况来得到所述第一数据中心的运行状态。
7.如权利要求6所述的双数据中心容灾***,其特征在于,所述第一心跳监控管理子模块包括第一计时计数单元和第一运行状态监控管理单元;其中,所述第一计时计数单元,用于当所述第一心跳请求信息发送模块向所述第二数据中心发送心跳请求信息时,开始计时,若超出预设时间所述第一心跳响应信息接收模块还未收到所述第二数据中心反馈回的心跳相应信息,则开始计数,数值加1;或若在所述预设时间内所述第一心跳响应信息接收模块收到所述第二数据中心反馈回的心跳相应信息,则计数的数值清零;所述第一运行状态监控管理单元,用于若所述第一计时计数单元的计数的数值大于阈值,则标记所述第二数据中心的运行状态为故障;反之,则标记所述第二数据中心的运行状态为正常;
所述第二心跳监控管理子模块包括第二计时计数单元和第二运行状态监控管理单元;其中,所述第二计时计数单元,用于当所述第二心跳请求信息发送模块向所述第一数据中心发送心跳请求信息时,开始计时,若超出所述预设时间所述第二心跳响应信息接收模块还未收到所述第一数据中心反馈回的心跳相应信息,则开始计数,数值加1;或若在所述预设时间内所述第二心跳响应信息接收模块收到所述第一数据中心反馈回的心跳相应信息,则计数的数值清零;所述第二运行状态监控管理单元,用于若所述第二计时计数单元的计数的数值大于所述阈值,则标记所述第一数据中心的运行状态为故障;反之,则标记所述第一数据中心的运行状态为正常。
8.如权利要求6所述的双数据中心容灾***,其特征在于,所述第一心跳请求信息发送子模块或所述第二心跳请求信息发送子模块每隔一定时间向对方发送心跳请求信息,以周期性检测所述第一数据中心和所述第二数据中心之间的心跳连接情况。
9.如权利要求1所述的双数据中心容灾***,其特征在于,所述集中灾备切换装置包括监测信息接收模块、监测信息处理模块、故障信息管理模块和接管模块;其中,
所述监测信息接收模块,用于接收所述第一数据中心的故障状态及其得到的所述第二数据中心的运行状态,以及接收所述第二数据中心的故障状态及其得到的所述第一数据中心的运行状态;
所述监测信息处理模块,用于根据预设的故障特征数据,对比所述第一数据中心的故障状态及所述第二数据中心得到的所述第一数据中心的运行状态形成第一对比结果,以及对比所述第二数据中心的故障状态及所述第一数据中心得到的所述第二数据中心的运行状态形成第二对比结果;
所述故障信息管理模块,用于根据所述第一对比结果和所述第二对比结果,识别出所述第一数据中心及所述第二数据中心之其中的故障数据中心和正常数据中心;
所述接管模块,用于在预设的故障逻辑原则中生成相应的接管指令,让所述正常数据中心接管所述故障数据中心的所有数据服务。
10.如权利要求9所述的双数据中心容灾***,其特征在于,所述集中灾备切换装置还包括修正模块;其中,
所述修正模块,用于修正和更新所述预设的故障逻辑原则。
CN201910939003.4A 2019-09-30 2019-09-30 一种双数据中心容灾*** Pending CN110635950A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910939003.4A CN110635950A (zh) 2019-09-30 2019-09-30 一种双数据中心容灾***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910939003.4A CN110635950A (zh) 2019-09-30 2019-09-30 一种双数据中心容灾***

Publications (1)

Publication Number Publication Date
CN110635950A true CN110635950A (zh) 2019-12-31

Family

ID=68973549

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910939003.4A Pending CN110635950A (zh) 2019-09-30 2019-09-30 一种双数据中心容灾***

Country Status (1)

Country Link
CN (1) CN110635950A (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112540873A (zh) * 2020-12-03 2021-03-23 华云数据控股集团有限公司 容灾方法、装置、电子设备及容灾***
CN113037560A (zh) * 2021-03-18 2021-06-25 同盾科技有限公司 业务流量切换方法及装置、存储介质、电子设备
CN113765705A (zh) * 2021-08-12 2021-12-07 深圳市珍爱捷云信息技术有限公司 一种跨公有云双活结构的流量切换方法及流量管理服务器
CN114338359A (zh) * 2021-12-29 2022-04-12 中国邮政储蓄银行股份有限公司 一种数据中心异常的处理方法及装置
CN114679376A (zh) * 2022-02-22 2022-06-28 兴业证券股份有限公司 一种多数据中心灾备方法和***
WO2023093379A1 (zh) * 2021-11-26 2023-06-01 中兴通讯股份有限公司 容灾倒换方法、***、电子设备和存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060193252A1 (en) * 2005-02-25 2006-08-31 Cisco Technology, Inc. Active-active data center using RHI, BGP, and IGP anycast for disaster recovery and load distribution
CN103106048A (zh) * 2013-01-30 2013-05-15 浪潮电子信息产业股份有限公司 一种多控多活的存储***
CN105574590A (zh) * 2015-12-28 2016-05-11 中国民航信息网络股份有限公司 自适应总控灾备切换装置、***及信号发生方法
CN109451189A (zh) * 2018-09-25 2019-03-08 国家电网有限公司客户服务中心 一种基于事件驱动的95598异地双活***全景切换***及方法
CN110177007A (zh) * 2019-04-16 2019-08-27 平安科技(深圳)有限公司 实现网关异地多活的方法、装置、计算机设备及存储介质

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060193252A1 (en) * 2005-02-25 2006-08-31 Cisco Technology, Inc. Active-active data center using RHI, BGP, and IGP anycast for disaster recovery and load distribution
CN103106048A (zh) * 2013-01-30 2013-05-15 浪潮电子信息产业股份有限公司 一种多控多活的存储***
CN105574590A (zh) * 2015-12-28 2016-05-11 中国民航信息网络股份有限公司 自适应总控灾备切换装置、***及信号发生方法
CN109451189A (zh) * 2018-09-25 2019-03-08 国家电网有限公司客户服务中心 一种基于事件驱动的95598异地双活***全景切换***及方法
CN110177007A (zh) * 2019-04-16 2019-08-27 平安科技(深圳)有限公司 实现网关异地多活的方法、装置、计算机设备及存储介质

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112540873A (zh) * 2020-12-03 2021-03-23 华云数据控股集团有限公司 容灾方法、装置、电子设备及容灾***
CN112540873B (zh) * 2020-12-03 2021-12-31 华云数据控股集团有限公司 容灾方法、装置、电子设备及容灾***
CN113037560A (zh) * 2021-03-18 2021-06-25 同盾科技有限公司 业务流量切换方法及装置、存储介质、电子设备
CN113037560B (zh) * 2021-03-18 2022-09-30 同盾科技有限公司 业务流量切换方法及装置、存储介质、电子设备
CN113765705A (zh) * 2021-08-12 2021-12-07 深圳市珍爱捷云信息技术有限公司 一种跨公有云双活结构的流量切换方法及流量管理服务器
WO2023093379A1 (zh) * 2021-11-26 2023-06-01 中兴通讯股份有限公司 容灾倒换方法、***、电子设备和存储介质
CN114338359A (zh) * 2021-12-29 2022-04-12 中国邮政储蓄银行股份有限公司 一种数据中心异常的处理方法及装置
CN114679376A (zh) * 2022-02-22 2022-06-28 兴业证券股份有限公司 一种多数据中心灾备方法和***

Similar Documents

Publication Publication Date Title
CN110635950A (zh) 一种双数据中心容灾***
CN107465721B (zh) 基于双活架构的全局负载均衡方法和***及调度服务器
CN102355368B (zh) 一种网络设备的故障处理方法及***
CN107862626A (zh) 一种基于计量终端告警信息的实时停电监控方法及装置
CN108737574B (zh) 一种节点离线判断方法、装置、设备及可读存储介质
WO2016183967A1 (zh) 一种关键组件的故障告警方法、装置及大数据管理***
US7730029B2 (en) System and method of fault tolerant reconciliation for control card redundancy
CN112422684B (zh) 目标消息的处理方法及装置、存储介质、电子装置
CN111901176B (zh) 故障确定方法、装置、设备及存储介质
CN111565133B (zh) 专线切换方法、装置、电子设备和计算机可读存储介质
CN113535480A (zh) 数据灾备***、方法
CN110674096A (zh) 节点故障排查方法、装置、设备及计算机可读存储介质
CN111953808B (zh) 一种双机双活架构的数据传输切换方法及架构构建***
CN109510730B (zh) 分布式***及其监控方法、装置、电子设备及存储介质
US20210326224A1 (en) Method and system for processing device failure
CN107026762B (zh) 一种基于分布式集群的容灾***及方法
CN111404737B (zh) 一种容灾处理方法以及相关装置
KR20190104759A (ko) 지능형 장비 이상 증상 사전 탐지 시스템 및 방법
CN111309515B (zh) 一种容灾控制方法、装置及***
CN115102862B (zh) 一种用于sdn设备的自动同步方法及装置
CN116506340A (zh) 流量链路的测试方法、装置、电子设备及存储介质
CN112751722A (zh) 数据传输质量监控方法和***
CN109104314A (zh) 一种修改日志配置文件的方法及装置
CN114301763A (zh) 分布式集群故障的处理方法及***、电子设备及存储介质
JP2015162806A (ja) 遠隔監視システム

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20191231

RJ01 Rejection of invention patent application after publication