CN109032830A - 一种分布式存储***的故障恢复方法、***及相关组件 - Google Patents

一种分布式存储***的故障恢复方法、***及相关组件 Download PDF

Info

Publication number
CN109032830A
CN109032830A CN201810826771.4A CN201810826771A CN109032830A CN 109032830 A CN109032830 A CN 109032830A CN 201810826771 A CN201810826771 A CN 201810826771A CN 109032830 A CN109032830 A CN 109032830A
Authority
CN
China
Prior art keywords
node
address
client
virtual
cluster
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810826771.4A
Other languages
English (en)
Inventor
丁瑞锋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong Inspur Smart Computing Technology Co Ltd
Original Assignee
Guangdong Inspur Big Data Research Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong Inspur Big Data Research Co Ltd filed Critical Guangdong Inspur Big Data Research Co Ltd
Priority to CN201810826771.4A priority Critical patent/CN109032830A/zh
Publication of CN109032830A publication Critical patent/CN109032830A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0766Error or fault reporting or storing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0793Remedial or corrective actions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3006Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system is distributed, e.g. networked systems, clusters, multiprocessor systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本申请公开了一种分布式存储***的故障恢复方法,所述故障恢复方法包括当检测到节点故障信息时,利用所述主节点对集群内所有正常节点进行集群IP地址重分配操作为每一个所述正常节点分配一一对应的虚拟IP地址;查询所述集群内的客户端信息表,并根据查询结果将连接有客户端的所述虚拟IP地址对应的正常节点设置为目标节点;控制每一所述目标节点向对应的客户端发送TCP重连信号,以便恢复业务连接。本方法能够可以在业务节点出现故障后快速实现故障恢复,提高分布式存储***的稳定性。本申请还公开了一种分布式存储***的故障恢复***、一种计算机可读存储介质及一种电子设备,具有以上有益效果。

Description

一种分布式存储***的故障恢复方法、***及相关组件
技术领域
本发明涉及数据存储技术领域,特别涉及一种分布式存储***的故障恢复方法、***、一种计算机可读存储介质及一种电子设备。
背景技术
分布式存储***,是将数据分散存储在多***立的设备上。传统的网络存储***采用集中的存储服务器存放所有数据,存储服务器成为***性能的瓶颈,也是可靠性和安全性的焦点,不能满足大规模存储应用的需要。分布式网络存储***采用可扩展的***结构,利用多台存储服务器分担存储负荷,利用位置服务器定位存储信息,它不但提高了***的可靠性、可用性和存取效率,还易于扩展。
CTDB是一个集群TDB数据库,可以被Samba或者其他的应用使用来存储数据。CTDB有一套虚拟IP机制,可以让集群在某个节点故障后,业务IP从一个节点飘到另外一个节点,业务可自动恢复。
在现有技术中,客户端与集群的连接中断后,再次连接耗费的时间较长,原因是TCP连接的重连的超时时间算法是指数退避算法,即如果对端IP连接不上,会尝试重连,但是重连的间隔会越来越长,时间依次是1s、3s、6s、12s、24s、48s、64s、64s。这样,如果在客户端在某时刻A发送一次重连信号,但是集群虚拟IP还未漂移完成,则客户端在A+24s时刻才会再次发送重连信号,而如果集群在A+5s时刻已经漂移完了IP,但是仍然需要等待24s-5s=19s的时间,导致整个业务中断时间较长。
因此,如何在业务节点出现故障后快速实现故障恢复,提高分布式存储***的稳定性是本领域技术人员目前需要解决的技术问题。
发明内容
本申请的目的是提供一种分布式存储***的故障恢复方法、***、一种计算机可读存储介质及一种电子设备,能够在业务节点出现故障后快速实现故障恢复,提高分布式存储***的稳定性。
为解决上述技术问题,本申请提供一种分布式存储***的故障恢复方法,该故障恢复方法包括:
当检测到节点故障信息时,利用所述主节点对集群内所有正常节点进行集群IP地址重分配操作为每一个所述正常节点分配一一对应的虚拟IP地址;
查询所述集群内的客户端信息表,并根据查询结果将连接有客户端的所述虚拟IP地址对应的正常节点设置为目标节点;
控制每一所述目标节点向对应的客户端发送TCP重连信号,以便恢复业务连接。
可选的,在利用所述主节点对集群内所有正常节点进行集群IP地址重分配操作之前,还包括:
根据所述节点故障信息确定故障节点,并判断所述故障节点是否为主节点;
若是,则从所有所述正常节点中重新选举所述主节点。
可选的,在将连接有客户端的所述虚拟IP地址对应的正常节点设置为目标节点之后,还包括:
控制所有所述目标节点向集群内的所有所述正常节点发送ARP广播,以使所有所述正常节点更新ARP表;其中,所述ARP表存储有虚拟IP地址与MAC地址的对应关系。
可选的,还包括:
当接收到信息发送指令时,根据所述信息发送指令确定目标虚拟IP地址;
根据所述ARP表查询所述目标虚拟IP地址对应的MAC地址,并将所述信息发送指令对应的信息发送至所述MAC地址。
可选的,将连接有客户端的所述虚拟IP地址对应的正常节点设置为目标节点包括:
根据所述客户端信息表查询每一所述虚拟IP地址是否连接客户端;
若是,则将所述虚拟IP地址对应的正常节点设置为目标节点。
可选的,还包括:
按照预设周期接收所述集群内所有节点发送的客户端信息,根据所述客户端信息更新所述客户端信息表。
可选的,所述业务节点为运行有CTDB服务的节点。
本申请还提供了一种分布式存储***的故障恢复***,该***包括:
IP重分配模块,用于当检测到节点故障信息时,利用所述主节点对集群内所有正常节点进行集群IP地址重分配操作为每一个所述正常节点分配一一对应的虚拟IP地址;
目标节点确定模块,用于查询所述集群内的客户端信息表,并根据查询结果将连接有客户端的所述虚拟IP地址对应的正常节点设置为目标节点;
重连模块,用于控制每一所述目标节点向对应的客户端发送TCP重连信号,以便恢复业务连接。
本申请还提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序执行时实现上述分布式存储***的故障恢复方法执行的步骤。
本申请还提供了一种电子设备,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器调用所述存储器中的计算机程序时实现上述分布式存储***的故障恢复方法执行的步骤。
本发明提供了一种分布式存储***的故障恢复方法,包括当检测到节点故障信息时,利用所述主节点对集群内所有正常节点进行集群IP地址重分配操作为每一个所述正常节点分配一一对应的虚拟IP地址;查询所述集群内的客户端信息表,并根据查询结果将连接有客户端的所述虚拟IP地址对应的正常节点设置为目标节点;控制每一所述目标节点向对应的客户端发送TCP重连信号,以便恢复业务连接。
本申请在出现节点故障之后,为所有的正常节点分配虚拟IP地址,由于客户端信息表存储在集群内,因此本申请可以查询虚拟IP地址是否已经连接有客户端,并将主动向连接有虚拟IP地址的客户端发送TCP重连信号。由于本申请的恢复业务连接的操作是在虚拟IP地址分配后目标节点主动执行的,因此无需被动等待客户端的重连信号。故本申请可以在业务节点出现故障后快速实现故障恢复,提高分布式存储***的稳定性。本申请同时还提供了一种分布式存储***的故障恢复***、一种计算机可读存储介质和一种电子设备,具有上述有益效果,在此不再赘述。
附图说明
为了更清楚地说明本申请实施例,下面将对实施例中所需要使用的附图做简单的介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例所提供的一种分布式存储***的故障恢复方法的流程图;
图2为本申请实施例所提供的另一种分布式存储***的故障恢复方法的流程图;
图3为本申请实施例所提供的一种分布式存储***的故障恢复***的结构示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
下面请参见图1,图1为本申请实施例所提供的一种分布式存储***的故障恢复方法的流程图。
具体步骤可以包括:
S101:当检测到节点故障信息时,利用所述主节点对集群内所有正常节点进行集群IP地址重分配操作为每一个所述正常节点分配一一对应的虚拟IP地址;
其中,本实施例默认是在分布式存储***中实施的,分布式存储***中存在有多个节点,当检测到节点故障信息时说明分布式存储***中的某一节点出现故障,故障节点无法与客户端建立正常的业务连接,为了保证业务的正常运行,需要恢复客户端与分布式存储***的业务连接。
需要说明的是,在分布式存储***中各个节点的虚拟IP地址分配都需要通过主节点来执行。当故障节点为主节点时需要在集群中确定新的主节点,再利用新的主节点来分配虚拟IP地址。进行集群IP重分配的方法理由很多,作为一种优选的实施方式,可以利用CTDB服务自带的集群IP重分配功能来实现虚拟IP的重新分配。举例说明CTDB服务的集群IP重分配功能,例如在分布式存储***中,每个节点都运行有CTDB服务,用于提供集群对外的虚拟IP,客户端可与一个虚拟IP连接,假如当前集群有A,B,C三个节点,A,B,C三个节点上分别有虚拟IP:A(192.168.0.11),B(192.168.0.12),C(192.168.0.13)。客户端D连接到192.168.0.11,则192.168.0.11就是业务IP,如果A节点故障,通过CTDB服务执行完IP漂移后,当前虚拟IP的分布如下所示:B(192.168.0.11,192.168.0.12),C(192.168.0.13)。这时候客户端会通过节点B和集群建立连接。需要说明的是,在通过CTDB服务重新分配虚拟IP地址时,若该IP有客户端连着,则不会把这个IP重新分配到其他节点,只把原来故障节点对应的虚拟IP地址分配到正常节点即可。
可以理解的是,本步骤中关于虚拟IP重新分配的操作都是针对集群中正常节点实施的,存在故障的节点不会被分配虚拟IP地址。本实施例默认将集群中的所有节点划分为两类:故障节点和正常节点。
S102:查询所述集群内的客户端信息表,并根据查询结果将连接有客户端的所述虚拟IP地址对应的正常节点设置为目标节点;
其中,本实施例将客户端信息表存储在集群内,以便虚拟IP地址重新分配好之后主动进行查询虚拟IP连接客户端的状况。客户端信息表中存储有虚拟IP地址与客户端的对应关系,可以根据客户端信息表判断某个虚拟IP地址是否已经与某个客户端建立业务连接。
关于集群内的客户端信息对照表,其构建过程如下:对本地客户端连接进行实时检测,广播客户端信息到集群其他节点,接收其他节点发送的客户端信息;可以采用linux***自带的ss命令,检索指定端口的TCP(Transmission Control Protocol传输控制协议)连接,符合该特性的连接即为一个客户端。由于客户端信息表是存储在内存里的一张表:***重启后,该表被清零,并重新写入数据到该表;客户端信息表的新增与删除均只有有两种方式:本地实时检测,以及接收其他节点发送的信息表。
当某一正常节点分配的虚拟IP地址已经连接有客户端,则可以建立该正常节点与客户端的连接关系,恢复客户端的业务连接。需要说明的是,本申请将所有的正常节点的虚拟IP地址都进行了分配,重新分配虚拟IP地址后无法确定哪些节点应该与哪些客户端连接,因此本实施例中将连接有客户端的所述虚拟IP地址对应的正常节点设置为目标节点,目标节点就是与客户端连接并执行相关业务的节点。
S103:控制每一所述目标节点向对应的客户端发送TCP重连信号,以便恢复业务连接。
其中,本步骤建立在S102已经确定目标节点的基础上,控制目标节点向其虚拟IP地址对应的客户端发送TCP(Transmission Control Protocol,传输控制协议)重连信号,以便建立目标节点与客户端的正常业务连接,恢复业务操作,使原本由于节点故障造成的业务中断恢复正常。
本实施例在出现节点故障之后,为所有的正常节点分配虚拟IP地址,由于客户端信息表存储在集群内,因此本申请可以查询虚拟IP地址是否已经连接有客户端,并将主动向连接有虚拟IP地址的客户端发送TCP重连信号。由于本申请的恢复业务连接的操作是在虚拟IP地址分配后目标节点主动执行的,因此无需被动等待客户端的重连信号。故本实施例可以在业务节点出现故障后快速实现故障恢复,提高分布式存储***的稳定性。
下面请参见图2,图2为本申请实施例所提供的另一种分布式存储***的故障恢复方法的流程图;
具体步骤可以包括:
S201:当检测到节点故障信息时,根据所述节点故障信息确定故障节点,并判断所述故障节点是否为主节点;若是,则进入S202;若否,则进入S203;
其中,由于虚拟IP地址重分配需要依赖主节点,因此若故障节点为集群中的主节点时,需要从所有的正常节点中重新选举得到新的主节点。
S202:从所有所述正常节点中重新选举所述主节点。
其中,所述业务节点为运行有CTDB服务的节点,可以通过CTDB服务重新选举主节点。
S203:利用所述主节点对集群内所有正常节点进行集群IP地址重分配操作为每一个所述正常节点分配一一对应的虚拟IP地址;
S204:根据所述客户端信息表查询每一所述虚拟IP地址是否连接客户端;若是,则进入S205;若否,则结束流程。
其中,可以在本实施例之前按照预设周期接收所述集群内所有节点发送的客户端信息,根据所述客户端信息更新所述客户端信息表。
S205:将所述虚拟IP地址对应的正常节点设置为目标节点。
S206:控制所有所述目标节点向集群内的所有所述正常节点发送ARP广播,以使所有所述正常节点更新ARP表;其中,所述ARP表存储有虚拟IP地址与MAC地址的对应关系。
APR(Address Resolution Protocol,地址解析协议)广播包可以通知所有的节点更新ARP表,ARP表存储的是虚拟IP地址和MAC(Medium Access Control,介质访问),即控制物理地址,可以告诉所有节点,该业务IP对应的MAC地址变化了,如果需要发送信息,则往该MAC地址发送。
S207:控制每一所述目标节点向对应的客户端发送TCP重连信号,以便恢复业务连接。
请参见图3,图3为本申请实施例所提供的一种分布式存储***的故障恢复***的结构示意图;
该***可以包括:
IP重分配模块100,用于当检测到节点故障信息时,利用所述主节点对集群内所有正常节点进行集群IP地址重分配操作为每一个所述正常节点分配一一对应的虚拟IP地址;
目标节点确定模块200,用于查询所述集群内的客户端信息表,并根据查询结果将连接有客户端的所述虚拟IP地址对应的正常节点设置为目标节点;
重连模块300,用于控制每一所述目标节点向对应的客户端发送TCP重连信号,以便恢复业务连接。
进一步的,该故障恢复***还包括:
节点判断模块,用于根据所述节点故障信息确定故障节点,并判断所述故障节点是否为主节点;
主节点选举模块,用于当故障节点是否为主节点,则从所有所述正常节点中重新选举所述主节点。
进一步的,该故障恢复***还包括:
APR广播模块,用于控制所有所述目标节点向集群内的所有所述正常节点发送ARP广播,以使所有所述正常节点更新ARP表;其中,所述ARP表存储有虚拟IP地址与MAC地址的对应关系。
进一步的,该故障恢复***还包括:
地址确定模块,用于当接收到信息发送指令时,根据所述信息发送指令确定目标虚拟IP地址;
信息发送模块,用于根据所述ARP表查询所述目标虚拟IP地址对应的MAC地址,并将所述信息发送指令对应的信息发送至所述MAC地址。
进一步的,所述目标节点确定模块200具体为根据所述客户端信息表查询每一所述虚拟IP地址是否连接客户端;若是,则将所述虚拟IP地址对应的正常节点设置为目标节点的模块。
进一步的,该故障恢复***还包括:
按照预设周期接收所述集群内所有节点发送的客户端信息,根据所述客户端信息更新所述客户端信息表。
进一步的,所述业务节点为运行有CTDB服务的节点。
由于***部分的实施例与方法部分的实施例相互对应,因此***部分的实施例请参见方法部分的实施例的描述,这里暂不赘述。
本申请还提供了一种计算机可读存储介质,其上存有计算机程序,该计算机程序被执行时可以实现上述实施例所提供的步骤。该存储介质可以包括:U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
本申请还提供了一种电子设备,可以包括存储器和处理器,所述存储器中存有计算机程序,所述处理器调用所述存储器中的计算机程序时,可以实现上述实施例所提供的步骤。当然所述电子设备还可以包括各种网络接口,电源等组件。
说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的***而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以对本申请进行若干改进和修饰,这些改进和修饰也落入本申请权利要求的保护范围内。
还需要说明的是,在本说明书中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的状况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

Claims (10)

1.一种分布式存储***的故障恢复方法,其特征在于,包括:
当检测到节点故障信息时,利用所述主节点对集群内所有正常节点进行集群IP地址重分配操作为每一个所述正常节点分配一一对应的虚拟IP地址;
查询所述集群内的客户端信息表,并根据查询结果将连接有客户端的所述虚拟IP地址对应的正常节点设置为目标节点;
控制每一所述目标节点向对应的客户端发送TCP重连信号,以便恢复业务连接。
2.根据权利要求1所述故障恢复方法,其特征在于,在利用所述主节点对集群内所有正常节点进行集群IP地址重分配操作之前,还包括:
根据所述节点故障信息确定故障节点,并判断所述故障节点是否为主节点;
若是,则从所有所述正常节点中重新选举所述主节点。
3.根据权利要求1所述故障恢复方法,其特征在于,在将连接有客户端的所述虚拟IP地址对应的正常节点设置为目标节点之后,还包括:
控制所有所述目标节点向集群内的所有所述正常节点发送ARP广播,以使所有所述正常节点更新ARP表;其中,所述ARP表存储有虚拟IP地址与MAC地址的对应关系。
4.根据权利要求3所述故障恢复方法,其特征在于,还包括:
当接收到信息发送指令时,根据所述信息发送指令确定目标虚拟IP地址;
根据所述ARP表查询所述目标虚拟IP地址对应的MAC地址,并将所述信息发送指令对应的信息发送至所述MAC地址。
5.根据权利要求1所述故障恢复方法,其特征在于,将连接有客户端的所述虚拟IP地址对应的正常节点设置为目标节点包括:
根据所述客户端信息表查询每一所述虚拟IP地址是否连接客户端;
若是,则将所述虚拟IP地址对应的正常节点设置为目标节点。
6.根据权利要求1所述故障恢复方法,其特征在于,还包括:
按照预设周期接收所述集群内所有节点发送的客户端信息,根据所述客户端信息更新所述客户端信息表。
7.根据权利要求1所述故障恢复方法,其特征在于,所述业务节点为运行有CTDB服务的节点。
8.一种分布式存储***的故障恢复***,其特征在于,包括:
IP重分配模块,用于当检测到节点故障信息时,利用所述主节点对集群内所有正常节点进行集群IP地址重分配操作为每一个所述正常节点分配一一对应的虚拟IP地址;
目标节点确定模块,用于查询所述集群内的客户端信息表,并根据查询结果将连接有客户端的所述虚拟IP地址对应的正常节点设置为目标节点;
重连模块,用于控制每一所述目标节点向对应的客户端发送TCP重连信号,以便恢复业务连接。
9.一种电子设备,其特征在于,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现如权利要求1至7任一项所述的分布式存储***的故障恢复方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述的分布式存储***的故障恢复方法的步骤。
CN201810826771.4A 2018-07-25 2018-07-25 一种分布式存储***的故障恢复方法、***及相关组件 Pending CN109032830A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810826771.4A CN109032830A (zh) 2018-07-25 2018-07-25 一种分布式存储***的故障恢复方法、***及相关组件

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810826771.4A CN109032830A (zh) 2018-07-25 2018-07-25 一种分布式存储***的故障恢复方法、***及相关组件

Publications (1)

Publication Number Publication Date
CN109032830A true CN109032830A (zh) 2018-12-18

Family

ID=64645229

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810826771.4A Pending CN109032830A (zh) 2018-07-25 2018-07-25 一种分布式存储***的故障恢复方法、***及相关组件

Country Status (1)

Country Link
CN (1) CN109032830A (zh)

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110750379A (zh) * 2019-10-28 2020-02-04 无锡华云数据技术服务有限公司 一种etcd集群恢复方法、***、设备及计算机介质
CN111258795A (zh) * 2019-11-29 2020-06-09 浪潮电子信息产业股份有限公司 一种samba集群故障重连方法、装置、设备、介质
CN111314117A (zh) * 2020-01-20 2020-06-19 苏州浪潮智能科技有限公司 一种故障转移的方法、装置、设备及可读存储介质
CN111949452A (zh) * 2020-09-18 2020-11-17 苏州浪潮智能科技有限公司 一种存储***单节点故障快速恢复io的方法及装置
CN112511317A (zh) * 2020-12-31 2021-03-16 河南信大网御科技有限公司 输入分发方法、输入代理及拟态分布式存储***
CN113596068A (zh) * 2020-04-30 2021-11-02 北京金山云网络技术有限公司 建立tcp连接的方法、装置和服务器
CN113742416A (zh) * 2020-05-29 2021-12-03 浙江正泰电器股份有限公司 数据处理方法、设备、***及存储介质
CN114116216A (zh) * 2021-11-24 2022-03-01 北京大道云行科技有限公司 一种基于vip实现分布式块存储高可用方法和装置
CN114285729A (zh) * 2021-11-29 2022-04-05 苏州浪潮智能科技有限公司 分布式集群管理节点部署方法、装置、设备及存储介质
CN114553900A (zh) * 2022-02-18 2022-05-27 苏州浪潮智能科技有限公司 一种分布式块存储管理***、方法及电子设备
CN115437843A (zh) * 2022-08-25 2022-12-06 北京万里开源软件有限公司 一种基于多级分布式共识的数据库存储分区恢复方法
CN115866018A (zh) * 2023-02-28 2023-03-28 浪潮电子信息产业股份有限公司 业务处理方法、装置、电子设备及计算机可读存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102932500A (zh) * 2012-11-07 2013-02-13 曙光信息产业股份有限公司 故障接口节点接管方法及***
CN103475732A (zh) * 2013-09-25 2013-12-25 浪潮电子信息产业股份有限公司 一种基于虚拟地址池的分布式文件***数据卷部署方法
CN104090992A (zh) * 2014-08-06 2014-10-08 浪潮电子信息产业股份有限公司 一种集群存储***中转换节点间高可用配置方法
US9342390B2 (en) * 2013-01-31 2016-05-17 International Business Machines Corporation Cluster management in a shared nothing cluster
US20170220418A1 (en) * 2009-12-29 2017-08-03 International Business Machines Corporation Determining completion of migration in a dispersed storage network

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170220418A1 (en) * 2009-12-29 2017-08-03 International Business Machines Corporation Determining completion of migration in a dispersed storage network
CN102932500A (zh) * 2012-11-07 2013-02-13 曙光信息产业股份有限公司 故障接口节点接管方法及***
US9342390B2 (en) * 2013-01-31 2016-05-17 International Business Machines Corporation Cluster management in a shared nothing cluster
CN103475732A (zh) * 2013-09-25 2013-12-25 浪潮电子信息产业股份有限公司 一种基于虚拟地址池的分布式文件***数据卷部署方法
CN104090992A (zh) * 2014-08-06 2014-10-08 浪潮电子信息产业股份有限公司 一种集群存储***中转换节点间高可用配置方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
THANDA SHWE ET AL.: "A fault tolerant approach in cluster computing system", 《2008 5TH INTERNATIONAL CONFERENCE ON ELECTRICAL ENGINEERING/ELECTRONICS, COMPUTER, TELECOMMUNICATIONS AND INFORMATION TECHNOLOGY》 *
李昌隆: "云存储***中数据访问和存储接口的研究与实现", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *

Cited By (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110750379A (zh) * 2019-10-28 2020-02-04 无锡华云数据技术服务有限公司 一种etcd集群恢复方法、***、设备及计算机介质
CN110750379B (zh) * 2019-10-28 2023-10-31 无锡华云数据技术服务有限公司 一种etcd集群恢复方法、***、设备及计算机介质
CN111258795A (zh) * 2019-11-29 2020-06-09 浪潮电子信息产业股份有限公司 一种samba集群故障重连方法、装置、设备、介质
CN111258795B (zh) * 2019-11-29 2022-06-17 浪潮电子信息产业股份有限公司 一种samba集群故障重连方法、装置、设备、介质
CN111314117A (zh) * 2020-01-20 2020-06-19 苏州浪潮智能科技有限公司 一种故障转移的方法、装置、设备及可读存储介质
CN113596068A (zh) * 2020-04-30 2021-11-02 北京金山云网络技术有限公司 建立tcp连接的方法、装置和服务器
CN113742416A (zh) * 2020-05-29 2021-12-03 浙江正泰电器股份有限公司 数据处理方法、设备、***及存储介质
CN111949452B (zh) * 2020-09-18 2022-09-20 苏州浪潮智能科技有限公司 一种存储***单节点故障快速恢复io的方法及装置
CN111949452A (zh) * 2020-09-18 2020-11-17 苏州浪潮智能科技有限公司 一种存储***单节点故障快速恢复io的方法及装置
CN112511317A (zh) * 2020-12-31 2021-03-16 河南信大网御科技有限公司 输入分发方法、输入代理及拟态分布式存储***
CN114116216A (zh) * 2021-11-24 2022-03-01 北京大道云行科技有限公司 一种基于vip实现分布式块存储高可用方法和装置
CN114285729A (zh) * 2021-11-29 2022-04-05 苏州浪潮智能科技有限公司 分布式集群管理节点部署方法、装置、设备及存储介质
CN114285729B (zh) * 2021-11-29 2023-08-25 苏州浪潮智能科技有限公司 分布式集群管理节点部署方法、装置、设备及存储介质
CN114553900B (zh) * 2022-02-18 2023-08-04 苏州浪潮智能科技有限公司 一种分布式块存储管理***、方法及电子设备
CN114553900A (zh) * 2022-02-18 2022-05-27 苏州浪潮智能科技有限公司 一种分布式块存储管理***、方法及电子设备
CN115437843A (zh) * 2022-08-25 2022-12-06 北京万里开源软件有限公司 一种基于多级分布式共识的数据库存储分区恢复方法
CN115866018A (zh) * 2023-02-28 2023-03-28 浪潮电子信息产业股份有限公司 业务处理方法、装置、电子设备及计算机可读存储介质
CN115866018B (zh) * 2023-02-28 2023-05-16 浪潮电子信息产业股份有限公司 业务处理方法、装置、电子设备及计算机可读存储介质

Similar Documents

Publication Publication Date Title
CN109032830A (zh) 一种分布式存储***的故障恢复方法、***及相关组件
US7856488B2 (en) Electronic device profile migration
CN1554055B (zh) 高可用性集群虚拟服务器***
CN108780386A (zh) 一种数据存储的方法、装置和***
US10320905B2 (en) Highly available network filer super cluster
CN113037560A (zh) 业务流量切换方法及装置、存储介质、电子设备
US9118595B2 (en) Graceful failover of a principal link in a fiber-channel fabric
US10001945B2 (en) Method of storing data and data storage managing server
EP2418824A1 (en) Method for resource information backup operation based on peer to peer network and peer to peer network thereof
US20130128722A1 (en) Streaming service load sharing method, streaming service processing method, and corresponding device and system
CN108696581A (zh) 分布式信息的缓存方法、装置、计算机设备以及存储介质
CN104967691A (zh) 一种分布式存储控制方法及***
CN110633046A (zh) 一种分布式***的存储方法、装置、存储设备及存储介质
CN114500523A (zh) 一种基于容器云平台的固定ip应用发布方法
US11153173B1 (en) Dynamically updating compute node location information in a distributed computing environment
EP3570169A1 (en) Method and system for processing device failure
CN108089934A (zh) 集群管理方法及集群服务器
CN103002038B (zh) 弹性负载均衡的处理方法和装置
JP2005011331A (ja) 負荷分散システム及び計算機管理プログラム
CN114338670B (zh) 一种边缘云平台和具有其的网联交通三级云控平台
US11977450B2 (en) Backup system, method therefor, and program
CN107087021A (zh) 主从服务器确定方法及装置
CN109788007B (zh) 一种基于两地三中心的云平台及其通信方法
US20060168108A1 (en) Methods and systems for defragmenting subnet space within an adaptive infrastructure
CN110855495B (zh) 任务动态平衡方法、装置、***、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20181218