CN106170948B - 一种用于双活数据中心的仲裁方法、装置及*** - Google Patents

一种用于双活数据中心的仲裁方法、装置及*** Download PDF

Info

Publication number
CN106170948B
CN106170948B CN201580001781.9A CN201580001781A CN106170948B CN 106170948 B CN106170948 B CN 106170948B CN 201580001781 A CN201580001781 A CN 201580001781A CN 106170948 B CN106170948 B CN 106170948B
Authority
CN
China
Prior art keywords
data center
arbitration
communication
arbitration device
disconnected
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201580001781.9A
Other languages
English (en)
Other versions
CN106170948A (zh
Inventor
曾敬勇
黄苏红
欧阳戟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Publication of CN106170948A publication Critical patent/CN106170948A/zh
Application granted granted Critical
Publication of CN106170948B publication Critical patent/CN106170948B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0654Management of faults, events, alarms or notifications using network fault recovery
    • H04L41/0668Management of faults, events, alarms or notifications using network fault recovery by dynamic selection of recovery network elements, e.g. replacement by the most appropriate element after failure
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0695Management of faults, events, alarms or notifications the faulty arrangement being the maintenance, administration or management system
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0805Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability
    • H04L43/0811Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability by checking connectivity
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/10Active monitoring, e.g. heartbeat, ping or trace-route
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/40Support for services or applications
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/1001Protocols in which an application is distributed across nodes in the network for accessing one among a plurality of replicated servers
    • H04L67/1004Server selection for load balancing
    • H04L67/101Server selection for load balancing based on network conditions
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/104Peer-to-peer [P2P] networks
    • H04L67/1044Group management mechanisms 
    • H04L67/1051Group master selection mechanisms
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/1095Replication or mirroring of data, e.g. scheduling or transport for data synchronisation between network nodes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/50Network services
    • H04L67/60Scheduling or organising the servicing of application requests, e.g. requests for application data transmissions using the analysis and optimisation of the required network resources
    • H04L67/61Scheduling or organising the servicing of application requests, e.g. requests for application data transmissions using the analysis and optimisation of the required network resources taking into account QoS or priority requirements

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Cardiology (AREA)
  • Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Environmental & Geological Engineering (AREA)
  • Multimedia (AREA)
  • Computer And Data Communications (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)
  • Hardware Redundancy (AREA)

Abstract

本发明实施例提供了一种用于双活数据中心的仲裁方法、装置及***,涉及计算机技术领域,所述仲裁方法包括:当第一数据中心确定与第二数据中心之间的通信断开,且仲裁设备不能进行仲裁时,第一数据中心查看预先设定的仲裁策略;当根据仲裁策略确定第一数据中心为优先数据中心时,继续提供服务;当根据所述仲裁策略确定第一数据中心不是优先数据中心时,停止提供服务;其中,所述第一数据中心和所述第二数据中心为双活数据中心。本发明通过上述方案使第一数据中心确定与第二数据中心之间的通信断开,且仲裁设备不能进行仲裁时,只有优先数据中心继续提供服务,解决了由于仲裁设备出现故障而造成服务中断的问题,保证了为用户提供不中断的服务。

Description

一种用于双活数据中心的仲裁方法、装置及***
技术领域
本发明涉及计算机技术领域,特别涉及一种用于双活数据中心的仲裁方法、装置及***。
背景技术
出于灾备(Disaster Recovery)的目的,一般都会建设至少两个数据中心,一个数据中心承担用户的业务,另一个数据中心备份数据、配置、业务等。双活数据中心是指两个数据中心同时承担业务且相互备份,以提高两个数据中心的整体服务能力和***资源利用率。
双活数据中心中的两个数据中心之间每隔设定时间会向对方发送一个心跳包,若在设定时间内未接收到对方的心跳包,则备份中断。此时如果两个数据中心都继续承担业务,就会出现数据不一致的问题。仲裁机制是当前避免出现数据不一致问题的手段之一,其实现方式为:两个数据中心分别向独立于两个数据中心设置的仲裁设备发送仲裁请求,仲裁设备根据仲裁请求确定获胜的数据中心,获胜的数据中心继续提供服务(即承担业务),没有获胜的数据中心停止提供服务。
在实现本发明的过程中,发明人发现现有技术至少存在以下问题:
当仲裁设备出现故障时,仲裁机制失效。此时若两个数据中心在设定时间内未接收到对方的心跳包,则无法确定继续提供服务的数据中心。为了避免出现数据不一致的问题,两个数据中心会同时停止服务,造成服务中断。
发明内容
为了解决现有技术仲裁设备出现故障造成服务中断的问题,本发明实施例提供了一种用于双活数据中心的仲裁方法、装置及***。所述技术方案如下:
第一方面,本发明实施例提供了一种用于双活数据中心的仲裁方法,所述仲裁方法包括:
当第一数据中心确定与第二数据中心之间的通信断开,且仲裁设备不能进行仲裁时,所述第一数据中心查看预先设定的仲裁策略;
当所述第一数据中心根据所述仲裁策略确定所述第一数据中心为优先数据中心时,所述第一数据中心继续提供服务;
当所述第一数据中心根据所述仲裁策略确定所述第一数据中心不是优先数据中心时,所述第一数据中心停止提供服务;
其中,所述第一数据中心和所述第二数据中心为双活数据中心。
在第一方面一种可能的实现方式中,所述仲裁方法还包括:
所述第一数据中心确定所述第一数据中心是否处于设定的异常状态;
当所述第一数据中心处于设定的异常状态,且所述第一数据中心与所述第二数据中心之间的通信没有断开时,所述第一数据中心向所述第二数据中心发送通知消息,所述通知消息用于指示所述第二数据中心代替所述第一数据中心提供服务。
在第一方面另一种可能的实现方式中,所述仲裁设备采用容灾设备,所述容灾设备用于备份所述第一数据中心和所述第二数据中心的数据。
可选地,所述仲裁方法还包括:
当所述第一数据中心确定与所述第二数据中心之间的通信断开,且所述仲裁设备能进行仲裁时,所述第一数据中心采用数据备份链路向所述仲裁设备发送仲裁请求,所述数据备份链路用于传输所述第一数据中心发送给所述仲裁设备的备份数据。
优选地,所述第一数据中心采用所述数据备份链路向所述仲裁设备发送仲裁请求,包括:
当所述第一数据中心同时需要向所述仲裁设备发送所述仲裁请求和所述第一数据中心的数据时,所述第一数据中心优先向所述仲裁设备发送所述仲裁请求;或者,
所述第一数据中心采用仲裁逻辑链路向所述仲裁设备发送所述仲裁请求,所述数据备份链路划分为所述仲裁逻辑链路和数据逻辑链路,所述数据逻辑链路用于传输所述第一数据中心发送给所述仲裁设备的备份数据。
在第一方面又一种可能的实现方式中,所述仲裁方法还包括:
所述第一数据中心实时监测所述第一数据中心与所述仲裁设备之间、以及所述第二数据中心与所述仲裁设备之间的通信是否断开;
所述第一数据中心根据监测结果,设置仲裁设备标志位,所述仲裁设备标志位用于表示所述仲裁设备能否进行仲裁;
所述第一数据中心根据所述仲裁设备标志位确定所述仲裁设备能否进行仲裁。
可选地,所述第一数据中心根据监测结果,设置仲裁设备标志位,包括:
当所述第一数据中心确定与所述仲裁设备之间的通信没有断开时,或者,当所述第一数据中心确定所述第二数据中心与所述仲裁设备之间的通信没有断开时,所述第一数据中心将所述仲裁设备标志位设置为所述仲裁设备能进行仲裁;
当所述第一数据中心确定与所述仲裁设备之间的通信断开,且确定与所述第二数据中心之间的通信断开时,所述第一数据中心将所述仲裁设备标志位设置为所述仲裁设备能进行仲裁;
当所述第一数据中心确定与所述仲裁设备之间的通信断开,且确定所述第二数据中心与所述仲裁设备之间的通信断开时,所述第一数据中心将所述仲裁设备标志位设置为所述仲裁设备不能进行仲裁。
在第一方面又一种可能的实现方式中,所述仲裁方法还包括:
当所述第一数据中心确定与所述第二数据中心之间的通信断开,且所述仲裁设备能进行仲裁时,所述第一数据中心查看所述仲裁策略;
当所述第一数据中心根据所述仲裁策略确定所述第一数据中心为所述优先数据中心时,所述第一数据中心即时向所述仲裁设备发送仲裁请求;
当所述第一数据中心根据所述仲裁策略确定所述第一数据中心不是所述优先数据中心时,所述第一数据中心延迟设定时间后向所述仲裁设备发送仲裁请求。
在第一方面又一种可能的实现方式中,所述仲裁设备采用云服务器。
第二方面,本发明实施例提供了一种用于双活数据中心的仲裁装置,所述仲裁装置包括:
第一查看模块,用于当第一数据中心与第二数据中心之间的通信断开,且仲裁设备不能进行仲裁时,查看预先设定的仲裁策略;
第一服务模块,用于当根据所述仲裁策略确定所述第一数据中心为优先数据中心时,继续提供服务;当根据所述仲裁策略确定所述第一数据中心不是优先数据中心时,停止提供服务;
其中,所述第一数据中心和所述第二数据中心为双活数据中心。
在第二方面一种可能的实现方式中,所述仲裁装置还包括:
状态确定模块,用于确定所述第一数据中心是否处于设定的异常状态;
消息发送模块,用于当所述第一数据中心处于设定的异常状态,且所述第一数据中心与所述第二数据中心之间的通信没有断开时,向所述第二数据中心发送通知消息,所述通知消息用于指示所述第二数据中心代替所述第一数据中心提供服务。
在第二方面另一种可能的实现方式中,所述仲裁设备采用容灾设备,所述容灾设备用于备份所述第一数据中心和所述第二数据中心的数据。
可选地,所述仲裁装置还包括:
请求发送模块,用于当所述第一数据中心与所述第二数据中心之间的通信断开,且所述仲裁设备能进行仲裁时,采用数据备份链路向所述仲裁设备发送仲裁请求,所述数据备份链路用于传输所述第一数据中心发送给所述仲裁设备的备份数据。
优选地,所述请求发送模块用于,
当所述第一数据中心同时需要向所述仲裁设备发送所述仲裁请求和所述第一数据中心的数据时,优先向所述仲裁设备发送所述仲裁请求;或者,
采用仲裁逻辑链路向所述仲裁设备发送所述仲裁请求,所述数据备份链路划分为所述仲裁逻辑链路和数据逻辑链路,所述数据逻辑链路用于传输所述第一数据中心发送给所述仲裁设备的备份数据。
在第二方面又一种可能的实现方式中,所述仲裁装置还包括:
监测模块,用于实时监测所述第一数据中心与所述仲裁设备之间、以及所述第二数据中心与所述仲裁设备之间的通信是否断开;
设置模块,用于根据监测结果,设置仲裁设备标志位,所述仲裁设备标志位用于表示所述仲裁设备能否进行仲裁;
仲裁设备确定模块,用于所述第一数据中心根据所述仲裁设备标志位确定所述仲裁设备能否进行仲裁。
可选地,所述设置模块用于,
当所述第一数据中心与所述仲裁设备之间的通信没有断开时,或者,当确定所述第二数据中心与所述仲裁设备之间的通信没有断开时,将所述仲裁设备标志位设置为所述仲裁设备能进行仲裁;
当所述第一数据中心与所述仲裁设备之间的通信断开,且所述第一数据中心与所述第二数据中心之间的通信断开时,将所述仲裁设备标志位设置为所述仲裁设备能进行仲裁;
当所述第一数据中心与所述仲裁设备之间的通信断开,且确定所述第二数据中心与所述仲裁设备之间的通信断开时,将所述仲裁设备标志位设置为所述仲裁设备不能进行仲裁。
在第二方面又一种可能的实现方式中,所述仲裁装置还包括:
第二查看模块,用于当所述第一数据中心与所述第二数据中心之间的通信断开,且所述仲裁设备能进行仲裁时,查看所述仲裁策略;
第二服务模块,当根据所述仲裁策略确定所述第一数据中心为所述优先数据中心时,即时向所述仲裁设备发送仲裁请求;当根据所述仲裁策略确定所述第一数据中心不是所述优先数据中心时,延迟设定时间后向所述仲裁设备发送仲裁请求。
在第二方面又一种可能的实现方式中,所述仲裁设备采用云服务器。
第三方面,本发明实施例提供了一种用于双活数据中心的仲裁***,所述仲裁***包括:
第一数据中心,用于当确定与第二数据中心之间的通信断开,且仲裁设备不能进行仲裁时,查看预先设定的仲裁策略;当根据所述仲裁策略确定所述第一数据中心为优先数据中心时,继续提供服务;当根据所述仲裁策略确定所述第一数据中心不是优先数据中心时,停止提供服务;
所述第二数据中心,用于当确定与所述第一数据中心之间的通信断开,且仲裁设备不能进行仲裁时,查看预先设定的仲裁策略;当根据所述仲裁策略确定所述第二数据中心为优先数据中心时,继续提供服务;当根据所述仲裁策略确定所述第二数据中心不是优先数据中心时,停止提供服务;
其中,所述第一数据中心和所述第二数据中心为双活数据中心。
本发明实施例提供的技术方案的有益效果是:
通过当第一数据中心确定与第二数据中心之间的通信断开,且仲裁设备不能进行仲裁时,第一数据中心查看预先设定的仲裁策略,并当根据仲裁策略确定第一数据中心为优先数据中心时继续提供服务,当根据仲裁策略确定第一数据中心不是优先数据中心时停止提供服务,使第一数据中心确定与第二数据中心之间的通信断开,且仲裁设备不能进行仲裁时,只有优先数据中心继续提供服务,解决了由于仲裁设备出现故障而造成服务中断的问题,保证了为用户提供不中断的服务。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例1提供的一种用于双活数据中心的仲裁方法的应用场景图;
图2是本发明实施例1提供的一种用于双活数据中心的仲裁方法的流程图;
图3是本发明实施例2提供的一种用于双活数据中心的仲裁方法的信息交互图;
图4是本发明实施例2提供的确定仲裁设备是否能进行仲裁的流程图;
图5是本发明实施例2提供的异常状态处理过程的流程图;
图6是本发明实施例3提供的一种用于双活数据中心的仲裁方法的应用场景图;
图7是本发明实施例4提供的一种用于双活数据中心的仲裁方法的应用场景图;
图8是本发明实施例5提供的一种用于双活数据中心的仲裁装置的结构示意图;
图9是本发明实施例6提供的一种用于双活数据中心的仲裁装置的结构示意图;
图10是本发明实施例7提供的一种用于双活数据中心的仲裁装置的硬件示意图;
图11是本发明实施例8提供的一种用于双活数据中心的仲裁***的结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明实施方式作进一步地详细描述。
下面先结合图1简单介绍一下本实施例提供的用于双活数据中心的仲裁方法的应用场景:
图1所示的应用场景中设置有第一数据中心1和第二数据中心2,第一数据中心1和第二数据中心2为双活数据中心,即第一数据中心1和第二数据中心2同时提供服务且相互备份。如图1所示,第一数据中心1与第二数据中心2连接。具体地,第一数据中心1和第二数据中心2之间可以通过光纤或网线连接。第一数据中心1和第二数据中心2通过该光纤或网线备份数据,并且每隔设定时间(如1s)通过该光纤或网线相互发送心跳包,以确定第一数据中心与第二数据中心之间的连接是否断开。
在实际应用中,第一数据中心1和第二数据中心2之间的数据备份可以为同步复制。为了实现同步复制,一方面可以采用光纤等传输速度快的链路传输备份的数据,另一方面可以将第一数据中心1和第二数据中心2之间的距离限定在设定距离(如100km)内,如第一数据中心1和第二数据中心2设置在同一个城市里。
具体地,第一数据中心1和第二数据中心2可以均包括存储层、应用层、网络层,第一数据中心1和第二数据中心2的同一层(存储层、应用层、或网络层)上分别设置有一个或多个集群(如应用层上的Oracle真正应用集群)的部分节点,本发明实施例提供的仲裁方法可以具体适用于第一数据中心1和第二数据中心2的同一层的仲裁,也可以具体适用于第一数据中心1和第二数据中心2上同一个集群的仲裁。
可选地,图1所示的应用场景中还可以设置有仲裁设备3,仲裁设备3独立于第一数据中心1和第二数据中心2设置,仲裁设备3分别与第一数据中心1、第二数据中心2连接。具体地,仲裁设备3可以为用于实现背景技术部分所述的仲裁机制而专门设置的一个设备。
需要说明的是,图1所示的应用场景仅为举例,本发明并不限制于此。
实施例1
本发明实施例提供了一种用于双活数据中心的仲裁方法,参见图2,该仲裁方法包括:
步骤101:当第一数据中心确定与第二数据中心之间的通信断开,且仲裁设备不能进行仲裁时,第一数据中心查看预先设定的仲裁策略。
在本实施例中,第一数据中心和第二数据中心为双活数据中心。
在实际应用中,第一数据中心和第二数据中心之间的通信是否断开,可以根据第一数据中心和第二数据中心之间每隔设定时间(如1s)相互发送的心跳包确定。若第一数据中心在设定的阈值时间(如1s、5s)内接收到第二数据中心发送的心跳包,则第一数据中心确定第一数据中心与第二数据中心之间的通信没有断开;若第一数据中心在设定的阈值时间内没有接收到第二数据中心发送的心跳包,则第一数据中心确定第一数据中心与第二数据中心之间的通信断开。同样地,若第二数据中心在设定的阈值时间内接收到第一数据中心发送的心跳包,则第二数据中心确定第一数据中心与第二数据中心之间的通信没有断开;若第二数据中心在设定的阈值时间内没有接收到第一数据中心发送的心跳包,则第二数据中心确定第一数据中心与第二数据中心之间的通信断开。
可选地,该方法还可以包括:
第一数据中心监测第一数据中心与第二数据中心之间的通信是否断开。
步骤102:当第一数据中心根据仲裁策略确定第一数据中心为优先数据中心时,第一数据中心继续提供服务。
步骤103:当第一数据中心根据仲裁策略确定第一数据中心不是优先数据中心时,第一数据中心停止提供服务。
需要说明的是,本实施例以执行主体为第一数据中心为例进行说明,在具体实现中,第二数据中心也会和第一数据中心一样,执行如下步骤:当第二数据中心确定与第一数据中心之间的通信断开,且仲裁设备不能进行仲裁时,第二数据中心查看预先设定的仲裁策略;当第二数据中心根据仲裁策略确定第二数据中心为优先数据中心时,第二数据中心继续提供服务;当第二数据中心根据仲裁策略确定第二数据中心不是优先数据中心时,第二数据中心停止提供服务。
在实际应用中,用户会在双活数据中心中,选择一个数据中心作为优先数据中心,并根据选择的结果在各个数据中心中设置用于表示是否为优先数据中心的标志位,如1表示为优先数据中心,0表示不是优先数据中心。当第一数据中心与第二数据中心之间的通信断开,且仲裁设备不能进行仲裁时,第一数据中心和第二数据中心均通过各自的标志位确定其是否为优先数据中心,为优先数据中心的那个数据中心继续提供服务,不是优先数据中心的那个数据中心停止提供服务,以避免由于备份中断的两个数据中心同时提供服务而出现数据不一致的问题。
本发明实施例通过当第一数据中心确定与第二数据中心之间的通信断开,且仲裁设备不能进行仲裁时,第一数据中心查看预先设定的仲裁策略,并当根据仲裁策略确定第一数据中心为优先数据中心时继续提供服务,当根据仲裁策略确定第一数据中心不是优先数据中心时停止提供服务,使第一数据中心确定与第二数据中心之间的通信断开,且仲裁设备不能进行仲裁时,只有优先数据中心继续提供服务,解决了由于仲裁设备出现故障而造成服务中断的问题,保证了为用户提供不中断的服务。
实施例2
本发明实施例提供了一种用于双活数据中心的仲裁方法,本实施例是对实施例1提供的用户双活数据中心的仲裁方法进行进一步详细介绍,参见图3,该仲裁方法包括:
步骤201:第一数据中心实时监测第一数据中心与仲裁设备之间、以及第二数据中心与仲裁设备之间的通信是否断开。
在本实施例中,第一数据中心和第二数据中心为双活数据中心,仲裁设备独立于第一数据中心和第二数据中心设置。
在实际应用中,第一数据中心和第二数据中心之间的通信是否断开,可以根据第一数据中心和第二数据中心之间每隔设定时间(如1s)相互发送的心跳包确定。若第一数据中心在设定的阈值时间(如1s、5s)内接收到第二数据中心发送的心跳包,则第一数据中心确定第一数据中心与第二数据中心之间的通信没有断开;若第一数据中心在设定的阈值时间内没有接收到第二数据中心发送的心跳包,则第一数据中心确定第一数据中心与第二数据中心之间的通信断开。同样地,若第二数据中心在设定的阈值时间内接收到第一数据中心发送的心跳包,则第二数据中心确定第一数据中心与第二数据中心之间的通信没有断开;若第二数据中心在设定的阈值时间内没有接收到第一数据中心发送的心跳包,则第二数据中心确定第一数据中心与第二数据中心之间的通信断开。
在具体实现中,当第一数据中心确定与第二数据中心的通信没有断开时,第一数据中心可以向第二数据中心询问第二数据中心与仲裁设备之间的通信是否断开,实现确定第二数据中心与仲裁设备之间的通信是否断开。
第一数据中心和第二数据中心自身与仲裁设备之间的通信是否断开,可以根据第一数据中心和第二数据中心各自与仲裁设备之间每隔设定时间(如1s)相互发送的心跳包确定。若第一数据中心(或第二数据中心)在设定的阈值时间(如1s、5s)内接收到仲裁设备发送的心跳包,则第一数据中心(或第二数据中心)确定第一数据中心(或第二数据中心)与仲裁设备之间的通信没有断开;若第一数据中心(或第二数据中心)在设定的阈值时间内没有接收到在仲裁设备发送的心跳包,则第一数据中心(或第二数据中心)确定第一数据中心(或第二数据中心)与仲裁设备之间的通信断开。
步骤202:第一数据中心根据监测结果,设置仲裁设备标志位。
在本实施例中,仲裁设备标志位用于表示仲裁设备能否进行仲裁。
在本实施例中,参见图4,该步骤202可以包括:
当第一数据中心确定与仲裁设备之间的通信没有断开时,或者,当第一数据中心确定第二数据中心与仲裁设备之间的通信没有断开时,第一数据中心将仲裁设备标志位设置为仲裁设备能进行仲裁;
当第一数据中心确定与仲裁设备之间的通信断开,且确定与第二数据中心之间的通信断开时,第一数据中心将仲裁设备标志位设置为仲裁设备能进行仲裁;
当第一数据中心确定与仲裁设备之间的通信断开,且确定第二数据中心与仲裁设备之间的通信断开时,第一数据中心将仲裁设备标志位设置为仲裁设备不能进行仲裁。
可以理解地,当第一数据中心确定与仲裁设备之间的通信没有断开时,或者,当第一数据中心确定第二数据中心与仲裁设备之间的通信没有断开时,第一数据中心将仲裁设备标志位设置为仲裁设备能进行仲裁,即当确定有一个数据中心(第一数据中心或第二数据中心)可以使用仲裁设备时,即确定仲裁设备能进行仲裁,以充分利用仲裁设备进行仲裁,以避免存在根据优先数据中心进行仲裁(详见步骤205a-步骤205c)时优先数据中心是发生故障的一方的风险。
当第一数据中心确定与仲裁设备之间的通信断开,且确定与第二数据中心之间的通信断开时,第一数据中心将仲裁设备标志位设置为仲裁设备能进行仲裁,即当不能确定第二数据中心与仲裁设备之间的通信是否断开时,默认采用仲裁设备进行仲裁,以避免第二数据中心与仲裁设备之间的通信没有断开而继续提供服务,同时第一数据中心刚好为优先数据中心也继续提供服务而造成数据不一致的情况发生。
步骤203:第一数据中心根据仲裁设备标志位确定仲裁设备能否进行仲裁。当仲裁设备能进行仲裁时,执行步骤204a-步骤204d;当仲裁设备不能进行仲裁时,执行步骤205a-步骤205c。
例如,仲裁设备标志位为1表示仲裁设备能进行仲裁,仲裁设备标志位为0表示仲裁设备不能进行仲裁。
步骤204a:当第一数据中心确定与第二数据中心之间的通信断开时,第一数据中心向仲裁设备发送仲裁请求。
在本实施例中,该步骤204a可以包括:
第一数据中心查看预先设定的仲裁策略;
当第一数据中心根据仲裁策略确定第一数据中心为优先数据中心时,第一数据中心即时向仲裁设备发送仲裁请求;
当第一数据中心根据仲裁策略确定第一数据中心不是优先数据中心时,第一数据中心延迟设定时间后向仲裁设备发送仲裁请求。
在实际应用中,当第一数据中心和第二数据中心之间的通信断开时,用户会希望某个数据中心能优先存活(继续提供服务的数据中心)。因此用户会在双活数据中心中,选择一个数据中心作为优先数据中心,并根据选择的结果在各个数据中心中设置用于表示是否为优先数据中心的标志位,如1表示为优先数据中心,0表示不是优先数据中心。当第一数据中心与第二数据中心之间的通信断开时,第一数据中心和第二数据中心均通过各自的标志位确定其是否为优先数据中心,为优先数据中心的那个数据中心即时向仲裁设备发送仲裁请求,不是优先数据中心的那个数据中心延迟设定时间后向仲裁设备发送仲裁请求,从而提高为优先数据中心的那个数据中心的存活概率。
步骤204b:仲裁设备根据仲裁请求,确定仲裁结果。
在具体实现中,仲裁设备可以根据接收到仲裁请求的先后顺序确定仲裁结果,即仲裁设备将最先接收到的仲裁请求的发送方确定为获胜方(继续提供服务的数据中心)。具体地,仲裁设备中设有标志位,1表示已接收过仲裁请求(即获胜方已确定),0表示未接收到仲裁请求。当某个数据中心向仲裁设备发送仲裁请求时,仲裁设备查看标志位,若标志位为0,则回复该数据中心其为获胜方,同时将该标志位改为0;若标志位为1,则回复该数据中心其不是获胜方。
仲裁设备也可以根据各数据中心承担业务的多少确定仲裁结果,即仲裁设备将承担最多业务的数据中心确定为获胜方,以节省由获胜方承担所有业务所需的过渡时间。
仲裁设备还可以根据其它基准确定仲裁结果,本发明对此不作限制。
步骤204c:仲裁设备向第一数据中心发送仲裁结果。
步骤204d:第一数据中心根据仲裁结果,继续或停止提供服务。
具体地,该步骤204d可以包括:
当仲裁结果包括第一数据中心是获胜方时,第一数据中心继续提供服务;
当仲裁结果包括第一数据中心不是获胜方时,第一数据中心停止提供服务。
需要说明的是,执行步骤204a-204d时,第一数据中心会暂停服务,以保证第一数据中心和第二数据中心的数据一致。
步骤201-步骤204d为可选步骤。由于根据优先数据中心进行仲裁(详见步骤205a-步骤205c)是预先指定获胜方(继续提供服务的数据中心),因此存在获胜方是发生故障的数据中心的风险。又由于发生故障的数据中心不可能向仲裁设备发送仲裁请求,因此由仲裁设备进行仲裁不存在获胜方是发生故障的数据中心的风险。当执行步骤201-步骤204d时,优先使用仲裁设备进行仲裁,当仲裁设备不能进行仲裁时,才根据优先数据中心进行仲裁,一方面尽可能避免产生获胜方是发生故障的数据中心的风险,另一方面也保证了在仲裁设备不能进行仲裁时,可以确定获胜方,保证服务不中断。当不执行步骤201-步骤204d时,可以避免专门设置实现仲裁机制的仲裁设备,降低了实现成本。
步骤205a:当第一数据中心确定与第二数据中心之间的通信断开时,第一数据中心查看预先设定的仲裁策略。当第一数据中心根据仲裁策略确定第一数据中心为优先数据中心时,执行步骤205b;当第一数据中心根据仲裁策略确定第一数据中心不是优先数据中心时,执行步骤205c。
步骤205b:第一数据中心继续提供服务。
步骤205c:第一数据中心停止提供服务。
如前所述,用户会在双活数据中心中,选择一个数据中心作为优先数据中心,并根据选择的结果在各个数据中心中设置用于表示是否为优先数据中心的标志位,如1表示为优先数据中心,0表示不是优先数据中心。当第一数据中心与第二数据中心之间的通信断开,且仲裁设备不能进行仲裁时,第一数据中心和第二数据中心均通过各自的标志位确定其是否为优先数据中心,为优先数据中心的那个数据中心继续提供服务,不是优先数据中心的那个数据中心停止提供服务,以避免由于备份中断的两个数据中心同时提供服务而出现数据不一致的问题。
在本实施例的一种实现方式中,参见图5,该方法还可以包括:
第一数据中心确定第一数据中心是否处于设定的异常状态;
当第一数据中心处于设定的异常状态,且第一数据中心与第二数据中心之间的通信没有断开时,第一数据中心向第二数据中心发送通知消息,通知消息用于指示第二数据中心代替第一数据中心提供服务;
第二数据中心根据通知信息代替第一数据中心提供服务;
第一数据中心停止提供服务。
在实际应用中,第一数据中心和第二数据中心中会预先配置仲裁策略,第一数据中心和第二数据中心根据仲裁策略可以定时进行自检,以确定其是否处于设定的异常状态。当确定自身处于设定的异常状态时,向对方发送通知消息;当接收到对方发送的通知消息时,替代对方提供服务。
第一数据中心停止提供服务可以在接收到第二数据中心完成代替第一数据中心提供服务的交接工作后发送的消息之后,也可以在接收到第二数据中心开始代替第一数据中心提供服务的交接工作后发送的消息之后,还可以在第一数据中心完成数据备份之后,还可以在第一数据中心已无法提供服务之后,本发明对此不作限制。
可选地,设定的异常状态可以包括掉电、电池故障、透写运行、双盘失效中的至少一种。其中,双盘失效是指失效盘数超过可校验的位数,此时数据无法恢复和使用。透写运行是指数据实时写入磁盘中,此时数据写入速率极低。电池故障是指在掉电时没有备用电源将存储器中的数据写入磁盘中,此时一般会采用透写运行。掉电是指没有足够的电能持续进行数据备份。
可以理解地,当第一数据中心处于设定的异常状态时,会影响双活数据中心整体的运行效率和性能,由第一数据中心主动通知第二数据中心代替其提供服务,可以保证双活数据中心提供最优服务。
在实际应用中,上述实现方式与步骤201-步骤203的执行没有先后顺序。由于第一数据中心处于设定的异常状态时,第一数据中心的运行效率和性能已无法满足用户需求,因此在第二数据中心没有发生故障的情况下(第一数据中心和第二数据中心之间的通信没有断开),不再由仲裁设备或根据优先数据中心进行仲裁,直接确定第二数据中心为获胜方,节省由第二数据中心替代第一数据中心提供服务所需的时间,提高效率。当第二数据中心发生故障的情况下,第一数据中心虽然处于设定的异常状态,但是可能还能继续提供服务,为了保证服务不中断,此时会由仲裁设备或根据设定存活的数据中心进行仲裁,将第一数据中心确定为获胜方。
需要说明的是,第一数据中心和第二数据中心之间的通信在断开之后恢复连接时,第一数据中心和第二数据中心会重新同时提供服务且相互备份。具体地,第一数据中心和第二数据中心可以在确定第一数据中心和第二数据中心之间的通信断开之后,依然继续向对方发送心跳包(此时心跳包的发送间隔可以与第一数据中心和第二数据中心之间的通信没有断开时相同,也可以比第一数据中心和第二数据中心之间的通信没有断开时长),然后当连续接收到设定次数的心跳包时,即可确定第一数据中心和第二数据中心之间的通信恢复,以避免第一数据中心和第二数据中心之间的通信偶然恢复而造成判断错误,确保结论的准确性。第一数据中心和第二数据中心也可以通信设备(如光模块)在第一数据中心和第二数据中心之间的连接恢复之后上报的连通信号(如光信号)确定第一数据中心和第二数据中心之间的通信恢复。
本发明实施例通过当第一数据中心确定与第二数据中心之间的通信断开,且仲裁设备不能进行仲裁时,第一数据中心查看预先设定的仲裁策略,并当根据仲裁策略确定第一数据中心为优先数据中心时继续提供服务,当根据仲裁策略确定第一数据中心不是优先数据中心时停止提供服务,使第一数据中心确定与第二数据中心之间的通信断开,且仲裁设备不能进行仲裁时,只有优先数据中心继续提供服务,解决了由于仲裁设备出现故障而造成服务中断的问题,保证了为用户提供不中断的服务。
实施例3
本发明实施例提供了一种用于双活数据中心的仲裁方法,下面先结合图6简单介绍一下本实施例提供的用于双活数据中心的仲裁方法的应用场景:
与图1所示的应用场景相比,图6所示的应用场景中还设置有容灾设备4,容灾设备4用于备份第一数据中心1和第二数据中心2的数据,并在第一数据中心1和第二数据中心2均发生故障时提供服务。如图6所示,容灾设备4分别与第一数据中心1、第二数据中心2连接。
在实际应用中,如图1所示的应用场景部分所述,第一数据中心1和第二数据中心2一般设置在同一个城市里。当设置第一数据中心1和第二数据中心2的城市发生地震等自然灾害时,第一数据中心1和第二数据中心2很可能会同时发生故障,为了保证容灾设备4此时可以提供服务,容灾设备4与第一数据中心1、第二数据中心2可以分别设置在相隔距离超过设定距离(如100km)的两地,如不同的城市里(即两地三中心)。容易知道,由于容灾设备4与第一数据中心1、第二数据中心2相隔距离较远,容灾设备4与第一数据中心1、第二数据中心2之间的数据备份为异步复制。
可选地,容灾设备4和仲裁设备3可以为两个独立的设备,此时第一数据中心、第二数据中心、仲裁设备的执行步骤与实施例2相同,在此不再详述。
可选地,容灾设备4和仲裁设备3也可以为同一个设备,即由容灾设备4实现仲裁设备3的功能。在具体实现中,会在容灾设备4上划分出一块独立的存储空间,专门用于存放仲裁的信息,如进行仲裁的程序、表示是否接收到仲裁请求的标志位等。可以理解地,与专门设置仲裁设备3相比,采用容灾设备4实现仲裁设备3的功能,简化了双活数据中心的架构,大大降低了实现成本。
当容灾设备4和仲裁设备3为同一个设备时,本实施例中第一数据中心、第二数据中心、仲裁设备的执行步骤与实施例2基本相同,不同之处在于通信链路的设置。
具体地,第一数据中心向仲裁设备发送仲裁请求,可以包括:
第一数据中心采用数据备份链路向仲裁设备发送仲裁请求,数据备份链路用于传输第一数据中心发送给仲裁设备的备份数据。
可以理解地,直接采用数据备份链路传输仲裁请求,可以避免单独铺设传输仲裁请求的物理链路,进一步降低了实现成本。
在本实施例的一种实现方式中,第一数据中心采用数据备份链路向仲裁设备发送仲裁请求,可以包括:
当第一数据中心同时需要向仲裁设备发送仲裁请求和第一数据中心的数据时,第一数据中心优先向仲裁设备发送仲裁请求。
在本实施例的另一种实现方式中,第一数据中心采用数据备份链路向仲裁设备发送仲裁请求,可以包括:
第一数据中心采用仲裁逻辑链路向仲裁设备发送仲裁请求,数据备份链路划分为仲裁逻辑链路和数据逻辑链路,数据逻辑链路用于传输第一数据中心发送给仲裁设备的备份数据。
例如,数据备份链路的带宽为50M,将其中的1M划分给仲裁逻辑链路,专门用于传输仲裁请求。
具体地,划分给仲裁逻辑链路的带宽大小可以由用户根据实际情况(如进行仲裁的数据中心的数量)进行设定,在此不再详述。
可以理解地,上述两种方式均可以实现仲裁请求的优先传输,避免由于整个数据备份链路被备份数据占用而导致无法仲裁的情况发生。
本发明实施例通过当第一数据中心确定与第二数据中心之间的通信断开,且仲裁设备不能进行仲裁时,第一数据中心查看预先设定的仲裁策略,并当根据仲裁策略确定第一数据中心为优先数据中心时继续提供服务,当根据仲裁策略确定第一数据中心不是优先数据中心时停止提供服务,使第一数据中心确定与第二数据中心之间的通信断开,且仲裁设备不能进行仲裁时,只有优先数据中心继续提供服务,解决了由于仲裁设备出现故障而造成服务中断的问题,保证了为用户提供不中断的服务。
实施例4
本发明实施例提供了一种用于双活数据中心的仲裁方法,下面先结合图7简单介绍一下本实施例提供的用于双活数据中心的仲裁方法的应用场景:
与图1所示的应用场景相比,图7所示的应用场景中由云服务器5实现仲裁设备3的功能。如图7所示,云服务器5分别与第一数据中心1、第二数据中心2连接。
在具体实现中,可以先向云服务器5申请提供一台虚拟机,然后将进行仲裁的程序部署在申请的虚拟机上,即可由云服务器5进行仲裁。
具体地,云服务器5可以采用第三方提供商提供的免费或成本低廉的公有云,如华为、亚马逊、阿里巴巴、微软提供的公有云。
可以理解地,采用公有云实现仲裁设备3,可以大大降低仲裁设备3的实现成本。
容易知道,公有云的核心属性是共享资源服务,为了保证用户数据的安全,本实施例中除了与实施例2中第一数据中心、第二数据中心、仲裁设备的执行步骤基本相同步骤之外,还包括一些提高数据中心存储数据安全性的设置。
在本实施例的一种实现方式中,第一数据中心向仲裁设备发送仲裁请求,可以包括:
第一数据中心采用虚拟专用网络(Virtual Private Network,简称VPN)向仲裁设备发送仲裁请求。
在本实施例的另一种实现方式中,第一数据中心向仲裁设备发送仲裁请求,可以包括:
第一数据中心向仲裁设备发送仲裁请求,该仲裁请求的目的端口为设定端口号。
在实际应用中,可以在第一数据中心和仲裁设备之间设置防火墙,通过防火墙设置与第一数据中心通信的云服务器的端口号。当传输到防火墙的消息的源端口和目的端口包括除第一数据中心的端口号和设定端口号之外的端口号时,防火墙会直接将该消息删除,即终止该消息的传输。
在本实施例的又一种实现方式中,第一数据中心向仲裁设备发送仲裁请求,可以包括:
第一数据中心向仲裁设备发送通信请求;
第一数据中心在接收到仲裁设备发送的通信请求回复后,向仲裁设备发送仲裁请求。
在实际应用中,可以在第一数据中心和仲裁设备之间设置防火墙,通过防火墙将云服务器与第一数据中心之间的通信设置为只能由第一数据中心发起,即只有第一数据中心发送的通信请求才能通过防火墙传输给仲裁设备。若云服务器向第一数据中心发送通信请求,则防火墙会直接将其删除,通信请求无法发送到第一数据中心,该通信不会建立。
本发明实施例通过当第一数据中心确定与第二数据中心之间的通信断开,且仲裁设备不能进行仲裁时,第一数据中心查看预先设定的仲裁策略,并当根据仲裁策略确定第一数据中心为优先数据中心时继续提供服务,当根据仲裁策略确定第一数据中心不是优先数据中心时停止提供服务,使第一数据中心确定与第二数据中心之间的通信断开,且仲裁设备不能进行仲裁时,只有优先数据中心继续提供服务,解决了由于仲裁设备出现故障而造成服务中断的问题,保证了为用户提供不中断的服务。
实施例5
参见图8,本发明实施例提供了一种用于双活数据中心的仲裁装置,该装置设置在第一数据中心上,该仲裁装置包括:
第一查看模块501,用于当第一数据中心与第二数据中心之间的通信断开,且仲裁设备不能进行仲裁时,查看预先设定的仲裁策略;
第一服务模块502,用于当根据仲裁策略确定第一数据中心为优先数据中心时,继续提供服务;当根据仲裁策略确定第一数据中心不是优先数据中心时,停止提供服务;
其中,第一数据中心和第二数据中心为双活数据中心。
本发明实施例通过当第一数据中心确定与第二数据中心之间的通信断开,且仲裁设备不能进行仲裁时,第一数据中心查看预先设定的仲裁策略,并当根据仲裁策略确定第一数据中心为优先数据中心时继续提供服务,当根据仲裁策略确定第一数据中心不是优先数据中心时停止提供服务,使第一数据中心确定与第二数据中心之间的通信断开,且仲裁设备不能进行仲裁时,只有优先数据中心继续提供服务,解决了由于仲裁设备出现故障而造成服务中断的问题,保证了为用户提供不中断的服务。
实施例6
参见图9,本发明实施例提供了一种用于双活数据中心的仲裁装置,本实施例是对实施例5提供的用于双活数据中心的仲裁装置的进一步详细描述,该装置设置在第一数据中心上,该仲裁装置包括:
第一查看模块601,用于当第一数据中心与第二数据中心之间的通信断开,且仲裁设备不能进行仲裁时,查看预先设定的仲裁策略;
第一服务模块602,用于当根据仲裁策略确定第一数据中心为优先数据中心时,继续提供服务;当根据仲裁策略确定第一数据中心不是优先数据中心时,停止提供服务;
其中,第一数据中心和第二数据中心为双活数据中心。
在本实施例的一种实现方式中,该仲裁装置还可以包括:
状态确定模块603,用于确定第一数据中心是否处于设定的异常状态;
消息发送模块604,用于当第一数据中心处于设定的异常状态,且第一数据中心与第二数据中心之间的通信没有断开时,向第二数据中心发送通知消息,通知消息用于指示第二数据中心代替第一数据中心提供服务。
在本实施例的另一种实现方式中,仲裁设备可以采用容灾设备,容灾设备用于备份第一数据中心和第二数据中心的数据。
可选地,该仲裁装置还可以包括:
请求发送模块605,用于当第一数据中心与第二数据中心之间的通信断开,且仲裁设备能进行仲裁时,采用数据备份链路向仲裁设备发送仲裁请求,数据备份链路用于传输第一数据中心发送给仲裁设备的备份数据。
优选地,请求发送模块605可以用于,
当第一数据中心同时需要向仲裁设备发送仲裁请求和第一数据中心的数据时,优先向仲裁设备发送仲裁请求;或者,
采用仲裁逻辑链路向仲裁设备发送仲裁请求,数据备份链路划分为仲裁逻辑链路和数据逻辑链路,数据逻辑链路用于传输第一数据中心发送给仲裁设备的备份数据。
在本实施例的又一种实现方式中,该仲裁装置还可以包括:
监测模块606,用于实时监测第一数据中心与仲裁设备之间、以及第二数据中心与仲裁设备之间的通信是否断开;
设置模块607,用于根据监测结果,设置仲裁设备标志位,仲裁设备标志位用于表示仲裁设备能否进行仲裁;
仲裁设备确定模块608,用于第一数据中心根据仲裁设备标志位确定仲裁设备能否进行仲裁。
可选地,设置模块607可以用于,
当第一数据中心与仲裁设备之间的通信没有断开时,或者,当确定第二数据中心与仲裁设备之间的通信没有断开时,将仲裁设备标志位设置为仲裁设备能进行仲裁;
当第一数据中心与仲裁设备之间的通信断开,且第一数据中心与第二数据中心之间的通信断开时,将仲裁设备标志位设置为仲裁设备能进行仲裁;
当第一数据中心与仲裁设备之间的通信断开,且确定第二数据中心与仲裁设备之间的通信断开时,将仲裁设备标志位设置为仲裁设备不能进行仲裁。
在本实施例的又一种实现方式中,该仲裁装置还可以包括:
第二查看模块609,用于当第一数据中心与第二数据中心之间的通信断开,且仲裁设备能进行仲裁时,查看仲裁策略;
第二服务模块610,用于当根据仲裁策略确定第一数据中心为优先数据中心时,即时向仲裁设备发送仲裁请求;当根据仲裁策略确定第一数据中心不是优先数据中心时,延迟设定时间后向仲裁设备发送仲裁请求。
在本实施例的又一种实现方式中,仲裁设备可以采用云服务器。
本发明实施例通过当第一数据中心确定与第二数据中心之间的通信断开,且仲裁设备不能进行仲裁时,第一数据中心查看预先设定的仲裁策略,并当根据仲裁策略确定第一数据中心为优先数据中心时继续提供服务,当根据仲裁策略确定第一数据中心不是优先数据中心时停止提供服务,使第一数据中心确定与第二数据中心之间的通信断开,且仲裁设备不能进行仲裁时,只有优先数据中心继续提供服务,解决了由于仲裁设备出现故障而造成服务中断的问题,保证了为用户提供不中断的服务。
实施例7
本发明实施例提供了一种用于双活数据中心的仲裁装置,该仲裁装置可以例如是服务器、个人电脑。参见图10,该设备包括:网络接口701、存储器702以及处理器703(例如CPU),可以用于执行实施例1、实施例2、实施例3或者实施例4的方法。
下面结合图10对***700的各个构成部件进行具体的介绍:
存储器702可用于存储软件程序以及应用模块,处理器703通过运行存储在存储器702的软件程序以及应用模块,从而执行***700的各种功能应用以及数据处理。存储器702可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作***、至少一个功能所需的应用程序等;存储数据区可存储根据***700的处理所创建的数据(比如广告推送策略、推送记录)等。此外,存储器702可以包括高速RAM(Random Access Memory,随机存取存储器),还可以包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
处理器703是***700的控制中心,利用各种接口和线路连接整个***700的各个部分。
具体地,处理器703通过运行或执行存储在存储器702内的软件程序和应用模块,以及调用存储在存储器702内的数据,处理器703可以实现,当第一数据中心与第二数据中心之间的通信断开,且仲裁设备不能进行仲裁时,查看预先设定的仲裁策略;当根据仲裁策略确定第一数据中心为优先数据中心时,继续提供服务;当根据仲裁策略确定第一数据中心不是优先数据中心时,停止提供服务;其中,第一数据中心和第二数据中心为双活数据中心。
在本实施例的一种实现方式中,处理器703可实现,确定第一数据中心是否处于设定的异常状态;当第一数据中心处于设定的异常状态,且第一数据中心与第二数据中心之间的通信没有断开时,向第二数据中心发送通知消息,通知消息用于指示第二数据中心代替第一数据中心提供服务。
在本实施例的另一种实现方式中,仲裁设备可以采用容灾设备,容灾设备用于备份第一数据中心和第二数据中心的数据。
可选地,处理器703可实现,当第一数据中心与第二数据中心之间的通信断开,且仲裁设备能进行仲裁时,采用数据备份链路向仲裁设备发送仲裁请求,数据备份链路用于传输第一数据中心发送给仲裁设备的备份数据。
优选地,处理器703可实现,当第一数据中心同时需要向仲裁设备发送仲裁请求和第一数据中心的数据时,优先向仲裁设备发送仲裁请求;或者,采用仲裁逻辑链路向仲裁设备发送仲裁请求,数据备份链路划分为仲裁逻辑链路和数据逻辑链路,数据逻辑链路用于传输第一数据中心发送给仲裁设备的备份数据。
在本实施例的又一种实现方式中,处理器703可实现,实时监测第一数据中心与仲裁设备之间、以及第二数据中心与仲裁设备之间的通信是否断开;根据监测结果,设置仲裁设备标志位,仲裁设备标志位用于表示仲裁设备能否进行仲裁;第一数据中心根据仲裁设备标志位确定仲裁设备能否进行仲裁。
可选地,处理器703可实现,当第一数据中心与仲裁设备之间的通信没有断开时,或者,当确定第二数据中心与仲裁设备之间的通信没有断开时,将仲裁设备标志位设置为仲裁设备能进行仲裁;当第一数据中心与仲裁设备之间的通信断开,且第一数据中心与第二数据中心之间的通信断开时,将仲裁设备标志位设置为仲裁设备能进行仲裁;当第一数据中心与仲裁设备之间的通信断开,且确定第二数据中心与仲裁设备之间的通信断开时,将仲裁设备标志位设置为仲裁设备不能进行仲裁。
在本实施例的又一种实现方式中,处理器703可实现,当第一数据中心与第二数据中心之间的通信断开,且仲裁设备能进行仲裁时,查看仲裁策略;当根据仲裁策略确定第一数据中心为优先数据中心时,即时向仲裁设备发送仲裁请求;当根据仲裁策略确定第一数据中心不是优先数据中心时,延迟设定时间后向仲裁设备发送仲裁请求。
在本实施例的又一种实现方式中,仲裁设备可以采用云服务器。
本发明实施例通过当第一数据中心确定与第二数据中心之间的通信断开,且仲裁设备不能进行仲裁时,第一数据中心查看预先设定的仲裁策略,并当根据仲裁策略确定第一数据中心为优先数据中心时继续提供服务,当根据仲裁策略确定第一数据中心不是优先数据中心时停止提供服务,使第一数据中心确定与第二数据中心之间的通信断开,且仲裁设备不能进行仲裁时,只有优先数据中心继续提供服务,解决了由于仲裁设备出现故障而造成服务中断的问题,保证了为用户提供不中断的服务。
实施例8
参见图11,本发明实施例提供了一种仲裁***,该***包括:
第一数据中心801,用于当确定与第二数据中心802之间的通信断开,且仲裁设备不能进行仲裁时,查看预先设定的仲裁策略;当根据仲裁策略确定第一数据中心801为优先数据中心时,继续提供服务;当根据仲裁策略确定第一数据中心801不是优先数据中心时,停止提供服务;
第二数据中心802,用于当确定与第一数据中心801之间的通信断开,且仲裁设备不能进行仲裁时,查看预先设定的仲裁策略;当根据仲裁策略确定第二数据中心802为优先数据中心时,继续提供服务;当根据仲裁策略确定第二数据中心802不是优先数据中心时,停止提供服务;
其中,第一数据中心801和第二数据中心802为双活数据中心。
本发明实施例通过当第一数据中心确定与第二数据中心之间的通信断开,且仲裁设备不能进行仲裁时,第一数据中心查看预先设定的仲裁策略,并当根据仲裁策略确定第一数据中心为优先数据中心时继续提供服务,当根据仲裁策略确定第一数据中心不是优先数据中心时停止提供服务,使第一数据中心确定与第二数据中心之间的通信断开,且仲裁设备不能进行仲裁时,只有优先数据中心继续提供服务,解决了由于仲裁设备出现故障而造成服务中断的问题,保证了为用户提供不中断的服务。
需要说明的是:上述实施例提供的用于双活数据中心的仲裁装置在仲裁时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将装置的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的用于双活数据中心的仲裁装置与用于双活数据中心的仲裁方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (29)

1.一种用于双活数据中心的仲裁方法,其特征在于,所述仲裁方法包括:
当第一数据中心确定与第二数据中心之间的通信断开,且仲裁设备不能进行仲裁时,所述第一数据中心查看预先设定的仲裁策略;
当所述第一数据中心根据所述仲裁策略确定所述第一数据中心为优先数据中心时,所述第一数据中心继续提供服务;
当所述第一数据中心根据所述仲裁策略确定所述第一数据中心不是优先数据中心时,所述第一数据中心停止提供服务;
其中,所述第一数据中心和所述第二数据中心为双活数据中心;
所述仲裁方法还包括:
当所述第一数据中心确定与所述第二数据中心之间的通信断开,并且所述仲裁设备能进行仲裁时,所述第一数据中心查看所述仲裁策略;当所述第一数据中心根据所述仲裁策略确定所述第一数据中心为所述优先数据中心之时,所述第一数据中心向所述仲裁设备发送仲裁请求;当所述第一数据中心根据所述仲裁策略确定所述第一数据中心不是所述优先数据中心时,所述第一数据中心延迟设定时间后向所述仲裁设备发送仲裁请求。
2.根据权利要求1所述的仲裁方法,其特征在于,所述仲裁方法还包括:
所述第一数据中心确定所述第一数据中心是否处于设定的异常状态;
当所述第一数据中心处于设定的异常状态,且所述第一数据中心与所述第二数据中心之间的通信没有断开时,所述第一数据中心向所述第二数据中心发送通知消息,所述通知消息用于指示所述第二数据中心代替所述第一数据中心提供服务。
3.根据权利要求1或2所述的仲裁方法,其特征在于,所述仲裁设备采用容灾设备,所述容灾设备用于备份所述第一数据中心和所述第二数据中心的数据。
4.根据权利要求3所述的仲裁方法,其特征在于,所述仲裁方法还包括:
当所述第一数据中心确定与所述第二数据中心之间的通信断开,且所述仲裁设备能进行仲裁时,所述第一数据中心采用数据备份链路向所述仲裁设备发送仲裁请求,所述数据备份链路用于传输所述第一数据中心发送给所述仲裁设备的备份数据。
5.根据权利要求4所述的仲裁方法,其特征在于,所述第一数据中心采用所述数据备份链路向所述仲裁设备发送仲裁请求,包括:
当所述第一数据中心同时需要向所述仲裁设备发送所述仲裁请求和所述第一数据中心的数据时,所述第一数据中心优先向所述仲裁设备发送所述仲裁请求;或者,
所述第一数据中心采用仲裁逻辑链路向所述仲裁设备发送所述仲裁请求,所述数据备份链路划分为所述仲裁逻辑链路和数据逻辑链路,所述数据逻辑链路用于传输所述第一数据中心发送给所述仲裁设备的备份数据。
6.根据权利要求1或2所述的仲裁方法,其特征在于,所述仲裁方法还包括:
所述第一数据中心实时监测所述第一数据中心与所述仲裁设备之间、以及所述第二数据中心与所述仲裁设备之间的通信是否断开;
所述第一数据中心根据监测结果,设置仲裁设备标志位,所述仲裁设备标志位用于表示所述仲裁设备能否进行仲裁;
所述第一数据中心根据所述仲裁设备标志位确定所述仲裁设备能否进行仲裁。
7.根据权利要求6所述的仲裁方法,其特征在于,所述第一数据中心根据监测结果,设置仲裁设备标志位,包括:
当所述第一数据中心确定与所述仲裁设备之间的通信没有断开时,或者,当所述第一数据中心确定所述第二数据中心与所述仲裁设备之间的通信没有断开时,所述第一数据中心将所述仲裁设备标志位设置为所述仲裁设备能进行仲裁;
当所述第一数据中心确定与所述仲裁设备之间的通信断开,且确定与所述第二数据中心之间的通信断开时,所述第一数据中心将所述仲裁设备标志位设置为所述仲裁设备能进行仲裁;
当所述第一数据中心确定与所述仲裁设备之间的通信断开,且确定所述第二数据中心与所述仲裁设备之间的通信断开时,所述第一数据中心将所述仲裁设备标志位设置为所述仲裁设备不能进行仲裁。
8.根据权利要求1或2所述的仲裁方法,其特征在于,所述仲裁设备采用云服务器。
9.一种用于双活数据中心的仲裁方法,其特征在于,所述仲裁方法包括:
当第一数据中心确定与第二数据中心之间的通信断开,且仲裁设备不能进行仲裁时,所述第一数据中心查看预先设定的仲裁策略;
当所述第一数据中心根据所述仲裁策略确定所述第一数据中心为优先数据中心时,所述第一数据中心继续提供服务;
当所述第一数据中心根据所述仲裁策略确定所述第一数据中心不是优先数据中心时,所述第一数据中心停止提供服务;
其中,所述第一数据中心和所述第二数据中心为双活数据中心;
其中,所述仲裁方法还包括:
所述第一数据中心实时监测所述第一数据中心与所述仲裁设备之间、以及所述第二数据中心与所述仲裁设备之间的通信是否断开;
所述第一数据中心根据监测结果,设置仲裁设备标志位,所述仲裁设备标志位用于表示所述仲裁设备能否进行仲裁;
所述第一数据中心根据所述仲裁设备标志位确定所述仲裁设备能否进行仲裁;
其中,所述第一数据中心根据监测结果,设置仲裁设备标志位,包括:
当所述第一数据中心确定与所述仲裁设备之间的通信没有断开时,或者,当所述第一数据中心确定所述第二数据中心与所述仲裁设备之间的通信没有断开时,所述第一数据中心将所述仲裁设备标志位设置为所述仲裁设备能进行仲裁;
当所述第一数据中心确定与所述仲裁设备之间的通信断开,且确定与所述第二数据中心之间的通信断开时,所述第一数据中心将所述仲裁设备标志位设置为所述仲裁设备能进行仲裁;
当所述第一数据中心确定与所述仲裁设备之间的通信断开,且确定所述第二数据中心与所述仲裁设备之间的通信断开时,所述第一数据中心将所述仲裁设备标志位设置为所述仲裁设备不能进行仲裁。
10.根据权利要求9所述的仲裁方法,其特征在于,
所述仲裁方法还包括:
所述第一数据中心确定所述第一数据中心是否处于设定的异常状态;
当所述第一数据中心处于设定的异常状态,且所述第一数据中心与所述第二数据中心之间的通信没有断开时,所述第一数据中心向所述第二数据中心发送通知消息,所述通知消息用于指示所述第二数据中心代替所述第一数据中心提供服务。
11.一种用于双活数据中心的仲裁方法,其特征在于,所述仲裁方法包括:
当第一数据中心确定与第二数据中心之间的通信断开,并且仲裁设备能进行仲裁时,所述第一数据中心查看仲裁策略;当所述第一数据中心根据所述仲裁策略确定所述第一数据中心为优先数据中心之时,所述第一数据中心向所述仲裁设备发送仲裁请求;当所述第一数据中心根据所述仲裁策略确定所述第一数据中心不是所述优先数据中心时,所述第一数据中心延迟设定时间后向所述仲裁设备发送仲裁请求;
其中,所述第一数据中心和所述第二数据中心为双活数据中心。
12.根据权利要求11所述的仲裁方法,其特征在于,所述仲裁方法还包括:
所述第一数据中心确定所述第一数据中心是否处于设定的异常状态;
当所述第一数据中心处于设定的异常状态,且所述第一数据中心与所述第二数据中心之间的通信没有断开时,所述第一数据中心向所述第二数据中心发送通知消息,所述通知消息用于指示所述第二数据中心代替所述第一数据中心提供服务。
13.一种用于双活数据中心的仲裁装置,其特征在于,所述仲裁装置包括:
第一查看模块,用于当第一数据中心与第二数据中心之间的通信断开,且仲裁设备不能进行仲裁时,查看预先设定的仲裁策略;
第一服务模块,用于当根据所述仲裁策略确定所述第一数据中心为优先数据中心时,继续提供服务;当根据所述仲裁策略确定所述第一数据中心不是优先数据中心时,停止提供服务;
其中,所述第一数据中心和所述第二数据中心为双活数据中心;
其中,所述仲裁装置还包括:
第二查看模块,用于当所述第一数据中心与所述第二数据中心之间的通信断开,且所述仲裁设备能进行仲裁时,查看所述仲裁策略;
第二服务模块,当根据所述仲裁策略确定所述第一数据中心为所述优先数据中心时,向所述仲裁设备发送仲裁请求;当根据所述仲裁策略确定所述第一数据中心不是所述优先数据中心时,延迟设定时间后向所述仲裁设备发送仲裁请求。
14.根据权利要求13所述的仲裁装置,其特征在于,所述仲裁装置还包括:
状态确定模块,用于确定所述第一数据中心是否处于设定的异常状态;
消息发送模块,用于当所述第一数据中心处于设定的异常状态,且所述第一数据中心与所述第二数据中心之间的通信没有断开时,向所述第二数据中心发送通知消息,所述通知消息用于指示所述第二数据中心代替所述第一数据中心提供服务。
15.根据权利要求13或14所述的仲裁装置,其特征在于,所述仲裁设备采用容灾设备,所述容灾设备用于备份所述第一数据中心和所述第二数据中心的数据。
16.根据权利要求15所述的仲裁装置,其特征在于,所述仲裁装置还包括:
请求发送模块,用于当所述第一数据中心与所述第二数据中心之间的通信断开,且所述仲裁设备能进行仲裁时,采用数据备份链路向所述仲裁设备发送仲裁请求,所述数据备份链路用于传输所述第一数据中心发送给所述仲裁设备的备份数据。
17.根据权利要求16所述的仲裁装置,其特征在于,所述请求发送模块用于,
当所述第一数据中心同时需要向所述仲裁设备发送所述仲裁请求和所述第一数据中心的数据时,优先向所述仲裁设备发送所述仲裁请求;或者,
采用仲裁逻辑链路向所述仲裁设备发送所述仲裁请求,所述数据备份链路划分为所述仲裁逻辑链路和数据逻辑链路,所述数据逻辑链路用于传输所述第一数据中心发送给所述仲裁设备的备份数据。
18.根据权利要求13或14所述的仲裁装置,其特征在于,所述仲裁装置还包括:
监测模块,用于实时监测所述第一数据中心与所述仲裁设备之间、以及所述第二数据中心与所述仲裁设备之间的通信是否断开;
设置模块,用于根据监测结果,设置仲裁设备标志位,所述仲裁设备标志位用于表示所述仲裁设备能否进行仲裁;
仲裁设备确定模块,用于所述第一数据中心根据所述仲裁设备标志位确定所述仲裁设备能否进行仲裁。
19.根据权利要求18所述的仲裁装置,其特征在于,所述设置模块用于,
当所述第一数据中心与所述仲裁设备之间的通信没有断开时,或者,当确定所述第二数据中心与所述仲裁设备之间的通信没有断开时,将所述仲裁设备标志位设置为所述仲裁设备能进行仲裁;
当所述第一数据中心与所述仲裁设备之间的通信断开,且所述第一数据中心与所述第二数据中心之间的通信断开时,将所述仲裁设备标志位设置为所述仲裁设备能进行仲裁;
当所述第一数据中心与所述仲裁设备之间的通信断开,且确定所述第二数据中心与所述仲裁设备之间的通信断开时,将所述仲裁设备标志位设置为所述仲裁设备不能进行仲裁。
20.根据权利要求13或14所述的仲裁装置,其特征在于,所述仲裁设备采用云服务器。
21.一种用于双活数据中心的仲裁装置,其特征在于,所述仲裁装置包括:
第一查看模块,用于当第一数据中心与第二数据中心之间的通信断开,且仲裁设备不能进行仲裁时,查看预先设定的仲裁策略;
第一服务模块,用于当根据所述仲裁策略确定所述第一数据中心为优先数据中心时,继续提供服务;当根据所述仲裁策略确定所述第一数据中心不是优先数据中心时,停止提供服务;
其中,所述第一数据中心和所述第二数据中心为双活数据中心;
其中,所述仲裁装置还包括:
监测模块,用于实时监测所述第一数据中心与所述仲裁设备之间、以及所述第二数据中心与所述仲裁设备之间的通信是否断开;
设置模块,用于根据监测结果,设置仲裁设备标志位,所述仲裁设备标志位用于表示所述仲裁设备能否进行仲裁;
仲裁设备确定模块,用于所述第一数据中心根据所述仲裁设备标志位确定所述仲裁设备能否进行仲裁;
其中,所述设置模块用于,
当所述第一数据中心与所述仲裁设备之间的通信没有断开时,或者,当确定所述第二数据中心与所述仲裁设备之间的通信没有断开时,将所述仲裁设备标志位设置为所述仲裁设备能进行仲裁;
当所述第一数据中心与所述仲裁设备之间的通信断开,且所述第一数据中心与所述第二数据中心之间的通信断开时,将所述仲裁设备标志位设置为所述仲裁设备能进行仲裁;
当所述第一数据中心与所述仲裁设备之间的通信断开,且确定所述第二数据中心与所述仲裁设备之间的通信断开时,将所述仲裁设备标志位设置为所述仲裁设备不能进行仲裁。
22.根据权利要求21所述的仲裁装置,其特征在于,所述仲裁装置还包括:
状态确定模块,用于确定所述第一数据中心是否处于设定的异常状态;
消息发送模块,用于当所述第一数据中心处于设定的异常状态,且所述第一数据中心与所述第二数据中心之间的通信没有断开时,向所述第二数据中心发送通知消息,所述通知消息用于指示所述第二数据中心代替所述第一数据中心提供服务。
23.一种用于双活数据中心的仲裁装置,其特征在于,所述仲裁装置包括:
第二查看模块,用于当第一数据中心与第二数据中心之间的通信断开,且仲裁设备能进行仲裁时,查看仲裁策略;
第二服务模块,当根据所述仲裁策略确定所述第一数据中心为优先数据中心时,向所述仲裁设备发送仲裁请求;当根据所述仲裁策略确定所述第一数据中心不是所述优先数据中心时,延迟设定时间后向所述仲裁设备发送仲裁请求;
其中,所述第一数据中心和所述第二数据中心为双活数据中心。
24.根据权利要求23所述的仲裁装置,其特征在于,所述仲裁装置还包括:
状态确定模块,用于确定所述第一数据中心是否处于设定的异常状态;
消息发送模块,用于当所述第一数据中心处于设定的异常状态,且所述第一数据中心与所述第二数据中心之间的通信没有断开时,向所述第二数据中心发送通知消息,所述通知消息用于指示所述第二数据中心代替所述第一数据中心提供服务。
25.一种用于双活数据中心的仲裁装置,其特征在于,所述仲裁装置包括:网络接口、存储器和处理器;所述存储器用于存储计算机执行指令,当所述仲裁装置运行时,所述处理器执行所述存储器存储的所述计算机执行指令,以使所述仲裁装置执行如权利要求1-12任一项所述的方法。
26.一种用于双活数据中心的仲裁***,其特征在于,所述仲裁***包括:
第一数据中心,用于当确定与第二数据中心之间的通信断开,且仲裁设备不能进行仲裁时,查看预先设定的仲裁策略;当根据所述仲裁策略确定所述第一数据中心为优先数据中心时,继续提供服务;当根据所述仲裁策略确定所述第一数据中心不是优先数据中心时,停止提供服务;
所述第二数据中心,用于当确定与所述第一数据中心之间的通信断开,且仲裁设备不能进行仲裁时,查看预先设定的仲裁策略;当根据所述仲裁策略确定所述第二数据中心为优先数据中心时,继续提供服务;当根据所述仲裁策略确定所述第二数据中心不是优先数据中心时,停止提供服务;
其中,所述第一数据中心和所述第二数据中心为双活数据中心;
所述第一数据中心还用于,当确定与所述第二数据中心之间的通信断开,并且所述仲裁设备能进行仲裁时,所述第一数据中心查看所述仲裁策略;当所述第一数据中心根据所述仲裁策略确定所述第一数据中心为所述优先数据中心之时,所述第一数据中心向所述仲裁设备发送仲裁请求;当所述第一数据中心根据所述仲裁策略确定所述第一数据中心不是所述优先数据中心时,所述第一数据中心延迟设定时间后向所述仲裁设备发送仲裁请求。
27.一种用于双活数据中心的仲裁***,其特征在于,所述仲裁***包括:
第一数据中心,用于当确定与第二数据中心之间的通信断开,并且仲裁设备能进行仲裁时,所述第一数据中心查看仲裁策略;当所述第一数据中心根据所述仲裁策略确定所述第一数据中心为优先数据中心之时,所述第一数据中心向所述仲裁设备发送仲裁请求;当所述第一数据中心根据所述仲裁策略确定所述第一数据中心不是所述优先数据中心时,所述第一数据中心延迟设定时间后向所述仲裁设备发送仲裁请求;
所述第二数据中心,用于当确定与所述第一数据中心之间的通信断开,且仲裁设备不能进行仲裁时,查看预先设定的仲裁策略;当根据所述仲裁策略确定所述第二数据中心为优先数据中心时,继续提供服务;当根据所述仲裁策略确定所述第二数据中心不是优先数据中心时,停止提供服务;
其中,所述第一数据中心和所述第二数据中心为双活数据中心。
28.一种用于双活数据中心的仲裁***,其特征在于,所述仲裁***包括:
第一数据中心,用于当确定与第二数据中心之间的通信断开,且仲裁设备不能进行仲裁时,查看预先设定的仲裁策略;当根据所述仲裁策略确定所述第一数据中心为优先数据中心时,继续提供服务;当根据所述仲裁策略确定所述第一数据中心不是优先数据中心时,停止提供服务;
所述第二数据中心,用于当确定与所述第一数据中心之间的通信断开,且仲裁设备不能进行仲裁时,查看预先设定的仲裁策略;当根据所述仲裁策略确定所述第二数据中心为优先数据中心时,继续提供服务;当根据所述仲裁策略确定所述第二数据中心不是优先数据中心时,停止提供服务;
其中,所述第一数据中心和所述第二数据中心为双活数据中心;
所述第一数据中心还用于,实时监测所述第一数据中心与所述仲裁设备之间、以及所述第二数据中心与所述仲裁设备之间的通信是否断开;根据监测结果,设置仲裁设备标志位,所述仲裁设备标志位用于表示所述仲裁设备能否进行仲裁;根据所述仲裁设备标志位确定所述仲裁设备能否进行仲裁;
其中,所述第一数据中心根据监测结果,设置仲裁设备标志位,包括:
当所述第一数据中心确定与所述仲裁设备之间的通信没有断开时,或者,当所述第一数据中心确定所述第二数据中心与所述仲裁设备之间的通信没有断开时,所述第一数据中心将所述仲裁设备标志位设置为所述仲裁设备能进行仲裁;
当所述第一数据中心确定与所述仲裁设备之间的通信断开,且确定与所述第二数据中心之间的通信断开时,所述第一数据中心将所述仲裁设备标志位设置为所述仲裁设备能进行仲裁;
当所述第一数据中心确定与所述仲裁设备之间的通信断开,且确定所述第二数据中心与所述仲裁设备之间的通信断开时,所述第一数据中心将所述仲裁设备标志位设置为所述仲裁设备不能进行仲裁。
29.一种计算机可读存储介质,其特征在于,所述一种计算机可读存储介质存储有计算机程序,所述计算机程序用于指令相关的硬件,来完成权利要求1至12任意一项所述的方法。
CN201580001781.9A 2015-07-30 2015-07-30 一种用于双活数据中心的仲裁方法、装置及*** Active CN106170948B (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/CN2015/085591 WO2017015961A1 (zh) 2015-07-30 2015-07-30 一种用于双活数据中心的仲裁方法、装置及***

Publications (2)

Publication Number Publication Date
CN106170948A CN106170948A (zh) 2016-11-30
CN106170948B true CN106170948B (zh) 2019-11-29

Family

ID=57359013

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201580001781.9A Active CN106170948B (zh) 2015-07-30 2015-07-30 一种用于双活数据中心的仲裁方法、装置及***

Country Status (4)

Country Link
US (2) US10659292B2 (zh)
EP (3) EP3793172A3 (zh)
CN (1) CN106170948B (zh)
WO (1) WO2017015961A1 (zh)

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106170948B (zh) * 2015-07-30 2019-11-29 华为技术有限公司 一种用于双活数据中心的仲裁方法、装置及***
CN108063787A (zh) * 2017-06-26 2018-05-22 杭州沃趣科技股份有限公司 基于分布式一致性状态机实现双活架构的方法
CN107911159A (zh) * 2017-10-12 2018-04-13 北京电子工程总体研究所 一种基于wifi协议的星载无线容错通讯***
CN107918570B (zh) * 2017-10-20 2021-07-23 杭州沃趣科技股份有限公司 一种双活***共享仲裁逻辑盘的方法
CN107995021A (zh) * 2017-10-20 2018-05-04 杭州沃趣科技股份有限公司 一种基于优先级的双活***的实现方式
CN108134712B (zh) * 2017-12-19 2020-12-18 海能达通信股份有限公司 一种分布式集群脑裂的处理方法、装置及设备
CN110535714B (zh) 2018-05-25 2023-04-18 华为技术有限公司 一种仲裁方法及相关装置
US11068351B2 (en) * 2018-11-19 2021-07-20 International Business Machines Corporation Data consistency when switching from primary to backup data storage
CN110442094B (zh) * 2019-07-26 2021-05-07 新华三大数据技术有限公司 一种分布式***仲裁方法及装置
CN110688262B (zh) * 2019-08-23 2023-01-06 苏州浪潮智能科技有限公司 一种基于主机仲裁的双活存储***及存储方法
JP7495713B2 (ja) 2020-03-31 2024-06-05 株式会社アラヤ 情報処理装置及び情報処理方法
CN112540873B (zh) * 2020-12-03 2021-12-31 华云数据控股集团有限公司 容灾方法、装置、电子设备及容灾***
CN115051911B (zh) * 2022-06-22 2023-10-13 中国平安财产保险股份有限公司 一种双活容灾***、方法、计算机设备及存储介质
CN117614805B (zh) * 2023-11-21 2024-06-14 杭州沃趣科技股份有限公司 一种监控数据中心状态的数据处理***

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103812929A (zh) * 2014-01-11 2014-05-21 浪潮电子信息产业股份有限公司 一种云数据中心管理平台双活方法
CN104469699A (zh) * 2014-11-27 2015-03-25 华为技术有限公司 集群仲裁方法和多集群配合***
CN104717077A (zh) * 2013-12-11 2015-06-17 ***通信集团山东有限公司 一种管理数据中心的方法、装置及***

Family Cites Families (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6529995B1 (en) * 1999-06-18 2003-03-04 Storage Technology Corporation Method and apparatus for maintaining and restoring mapping table entries and data in a raid system
US7010607B1 (en) * 1999-09-15 2006-03-07 Hewlett-Packard Development Company, L.P. Method for training a communication link between ports to correct for errors
US7245928B2 (en) * 2000-10-27 2007-07-17 Cellemetry, Llc Method and system for improved short message services
JP2008512759A (ja) * 2004-09-13 2008-04-24 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 分散ストレージシステムを管理する方法
US7609619B2 (en) * 2005-02-25 2009-10-27 Cisco Technology, Inc. Active-active data center using RHI, BGP, and IGP anycast for disaster recovery and load distribution
US7457835B2 (en) * 2005-03-08 2008-11-25 Cisco Technology, Inc. Movement of data in a distributed database system to a storage location closest to a center of activity for the data
JP4577242B2 (ja) * 2006-03-10 2010-11-10 日本電気株式会社 データバックアップシステム、データバックアップ方法、及びその動作制御プログラム
US10026255B2 (en) * 2006-04-13 2018-07-17 Igt Presentation of remotely-hosted and locally rendered content for gaming systems
US8968077B2 (en) * 2006-04-13 2015-03-03 Idt Methods and systems for interfacing with a third-party application
US8149725B2 (en) * 2006-07-31 2012-04-03 Tekelec Methods, systems, and computer program products for a hierarchical, redundant OAM&P architecture for use in an IP multimedia subsystem (IMS) network
US7925917B1 (en) * 2008-04-03 2011-04-12 United Services Automobile Association (Usaa) Systems and methods for enabling failover support with multiple backup data storage structures
CN101692212B (zh) * 2009-06-19 2012-11-14 无锡中星微电子有限公司 一种访问存储器的方法、***和总线仲裁装置
US8504690B2 (en) * 2009-08-07 2013-08-06 Broadcom Corporation Method and system for managing network power policy and configuration of data center bridging
US8856319B1 (en) * 2010-02-03 2014-10-07 Citrix Systems, Inc. Event and state management in a scalable cloud computing environment
US20120078494A1 (en) * 2010-09-23 2012-03-29 Honeywell International Inc. Systems and methods for managing non-integrated controller pilot data link communications (cpdlc) systems on an aircraft
US8655516B2 (en) * 2010-11-29 2014-02-18 General Electric Company Communication system for a rail vehicle consist and method for communicating with a rail vehicle consist
US8578204B1 (en) * 2010-12-29 2013-11-05 Emc Corporation Witness facility for distributed storage system
CN102185717A (zh) * 2011-05-05 2011-09-14 中国联合网络通信集团有限公司 业务处理设备、方法及***
US8745125B2 (en) * 2011-08-25 2014-06-03 Verizon Patent And Licensing Inc. Routing traffic after power failure
JP6019653B2 (ja) * 2012-03-24 2016-11-02 日本電気株式会社 情報処理システム、情報処理方法、情報処理装置およびその制御方法と制御プログラム
US9069799B2 (en) * 2012-12-27 2015-06-30 Commvault Systems, Inc. Restoration of centralized data storage manager, such as data storage manager in a hierarchical data storage system
CN103647849B (zh) * 2013-12-24 2017-02-08 华为技术有限公司 一种业务迁移方法、装置和一种容灾***
CN106063229B (zh) * 2014-03-05 2020-04-14 柏思科技有限公司 用于转发数据的方法和***
WO2016054770A1 (en) * 2014-10-08 2016-04-14 Intel Corporation Techniques for checkpointing/delivery between primary and secondary virtual machines
US9953072B2 (en) * 2014-12-31 2018-04-24 Vmware, Inc. Disaster recovery of mobile data center via location-aware cloud caching
US10275328B2 (en) * 2015-04-02 2019-04-30 Vmware, Inc. Fault tolerance for hybrid cloud deployments
CN106170948B (zh) * 2015-07-30 2019-11-29 华为技术有限公司 一种用于双活数据中心的仲裁方法、装置及***

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104717077A (zh) * 2013-12-11 2015-06-17 ***通信集团山东有限公司 一种管理数据中心的方法、装置及***
CN103812929A (zh) * 2014-01-11 2014-05-21 浪潮电子信息产业股份有限公司 一种云数据中心管理平台双活方法
CN104469699A (zh) * 2014-11-27 2015-03-25 华为技术有限公司 集群仲裁方法和多集群配合***

Also Published As

Publication number Publication date
EP3217627A4 (en) 2018-02-28
EP3217627A1 (en) 2017-09-13
EP3518500A1 (en) 2019-07-31
US20200274754A1 (en) 2020-08-27
EP3217627B1 (en) 2019-02-06
US20170317875A1 (en) 2017-11-02
CN106170948A (zh) 2016-11-30
EP3793172A2 (en) 2021-03-17
WO2017015961A1 (zh) 2017-02-02
US11075795B2 (en) 2021-07-27
EP3793172A3 (en) 2021-04-28
EP3518500B1 (en) 2022-06-01
US10659292B2 (en) 2020-05-19

Similar Documents

Publication Publication Date Title
CN106170948B (zh) 一种用于双活数据中心的仲裁方法、装置及***
US10862966B2 (en) Storage area network attached clustered storage system
WO2019085875A1 (zh) 存储集群的配置修改方法、存储集群及计算机***
CN103207841B (zh) 基于键值对缓存的数据读写方法及装置
US9639437B2 (en) Techniques to manage non-disruptive SAN availability in a partitioned cluster
CN102447624B (zh) 在服务器集群上实现负载均衡的方法、节点服务器及集群
WO2016107173A1 (zh) 一种集群脑裂后仲裁处理方法、仲裁存储装置以及***
US20140026000A1 (en) Highly available server system based on cloud computing
WO2017050254A1 (zh) 热备方法、装置及***
WO2016202051A1 (zh) 一种通信***中管理主备节点的方法和装置及高可用集群
WO2012097588A1 (zh) 数据存储方法、设备和***
US20170270015A1 (en) Cluster Arbitration Method and Multi-Cluster Cooperation System
CN103763155A (zh) 分布式云存储***多服务心跳监测方法
CN106909307B (zh) 一种管理双活存储阵列的方法及装置
CN109391691A (zh) 一种单节点故障下nas服务的恢复方法及相关装置
CN114553900B (zh) 一种分布式块存储管理***、方法及电子设备
WO2018157605A1 (zh) 一种集群文件***中消息传输的方法及装置
CN112887367B (zh) 实现分布式集群高可用的方法、***及计算机可读介质
WO2022218346A1 (zh) 一种故障处理方法及装置
WO2024067051A1 (zh) 一种多az仲裁***及方法
CN104158681A (zh) Sdn网络中区域控制器失效的处理方法和处理装置
JP2015158787A (ja) サーバ

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant