CN108509296B - 一种处理设备故障的方法和*** - Google Patents

一种处理设备故障的方法和*** Download PDF

Info

Publication number
CN108509296B
CN108509296B CN201810226159.3A CN201810226159A CN108509296B CN 108509296 B CN108509296 B CN 108509296B CN 201810226159 A CN201810226159 A CN 201810226159A CN 108509296 B CN108509296 B CN 108509296B
Authority
CN
China
Prior art keywords
target
node
equipment
standby
shared storage
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201810226159.3A
Other languages
English (en)
Other versions
CN108509296A (zh
Inventor
范家星
过晓春
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wangsu Science and Technology Co Ltd
Original Assignee
Wangsu Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wangsu Science and Technology Co Ltd filed Critical Wangsu Science and Technology Co Ltd
Priority to CN201810226159.3A priority Critical patent/CN108509296B/zh
Priority to EP18893326.1A priority patent/EP3570169B1/en
Priority to US16/340,241 priority patent/US20210326224A1/en
Priority to PCT/CN2018/081562 priority patent/WO2019178891A1/zh
Publication of CN108509296A publication Critical patent/CN108509296A/zh
Application granted granted Critical
Publication of CN108509296B publication Critical patent/CN108509296B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1479Generic software techniques for error detection or fault masking
    • G06F11/1489Generic software techniques for error detection or fault masking through recovery blocks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/2053Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant
    • G06F11/2094Redundant storage or storage space
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/202Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
    • G06F11/2023Failover techniques
    • G06F11/2025Failover techniques using centralised failover control functionality
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/202Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
    • G06F11/2023Failover techniques
    • G06F11/2028Failover techniques eliminating a faulty processor or activating a spare
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/202Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
    • G06F11/2046Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant where the redundant components share persistent storage
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/2053Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant
    • G06F11/2089Redundant storage control functionality
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/2053Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant
    • G06F11/2089Redundant storage control functionality
    • G06F11/2092Techniques of failing over between control units
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0602Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
    • G06F3/0614Improving the reliability of storage systems
    • G06F3/0617Improving the reliability of storage systems in relation to availability
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0629Configuration or reconfiguration of storage systems
    • G06F3/0634Configuration or reconfiguration of storage systems by changing the state or mode of one or more devices
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0668Interfaces specially adapted for storage systems adopting a particular infrastructure
    • G06F3/067Distributed or networked storage systems, e.g. storage area networks [SAN], network attached storage [NAS]

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • Human Computer Interaction (AREA)
  • Hardware Redundancy (AREA)
  • Retry When Errors Occur (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种处理设备故障的方法和***,属于数据存储技术领域。所述方法包括:目标共享存储设备关联的目标备用设备检测管理所述目标共享存储设备的目标控制设备的运行状态;如果所述目标控制设备发生故障,所述目标备用设备向所述目标共享存储设备发送管理请求,并向所述集群管理节点发送对于所述目标控制设备的替换请求;所述目标共享存储设备将所述目标备用设备设置为本地管理设备;所述集群管理节点确定所述目标备用设备为所述目标控制设备的替换设备。采用本发明,可以保证分布式存储***的存储服务质量。

Description

一种处理设备故障的方法和***
技术领域
本发明涉及数据存储技术领域,尤其涉及一种处理设备故障的方法和***。
背景技术
当前网络业务的种类越来越多,功能也越来越丰富,也随之产生了海量的数据。业务提供方一般采用分布式存储***来存储数据,其中的数据可以分散存储在存储集群的多个存储服务器(可称为存储节点)中。
分布式存储***在提供存储服务时,可以对每份数据创建多份数据副本,并将这些数据副本存储在多个存储节点中。如果某个存储节点发生故障,不能继续提供数据存储服务,分布式存储***的集群管理节点可以先确定故障节点存储的数据,再查找存储有相应数据副本的多个存储节点,同时可以选择多个目标存储节点,然后可以指示上述存储有数据副本的存储节点,利用数据副本将数据恢复到上述多个目标存储节点中。
在实现本发明的过程中,发明人发现现有技术至少存在以下问题:
上述用于数据恢复的多个存储节点,需要调配大量的设备处理资源来进行上述数据恢复处理,导致没有足够的设备处理资源来提供数据存储服务,故而分布式存储***的存储服务质量较差。
发明内容
为了解决现有技术的问题,本发明实施例提供了一种处理设备故障的方法和***。所述技术方案如下:
一方面,提供了一种处理设备故障的方法,所述方法应用于分布式存储***,所述分布式存储***包括集群管理节点和多个存储节点,每个存储节点包括一个共享存储设备,每个共享存储设备与一个控制设备、一个备用设备关联,所述方法包括:
目标共享存储设备关联的目标备用设备检测管理所述目标共享存储设备的目标控制设备的运行状态;
如果所述目标控制设备发生故障,所述目标备用设备向所述目标共享存储设备发送管理请求,并向所述集群管理节点发送对于所述目标控制设备的替换请求;
所述目标共享存储设备将所述目标备用设备设置为本地管理设备;
所述集群管理节点确定所述目标备用设备为所述目标控制设备的替换设备。
进一步的,所述管理请求中携带有所述目标备用设备的元数据信息;
所述目标共享存储设备将所述目标备用设备设置为本地管理设备,包括:
所述目标共享存储设备通过将所述目标共享存储设备的归属者信息修改为所述目标备用设备的元数据信息,确定所述目标备用设备为所述共享存储设备的本地管理设备。
进一步的,所述替换请求中携带有所述目标控制设备所属存储节点的节点标识和所述目标备用设备的元数据信息;
所述集群管理节点确定所述目标备用设备为所述目标控制设备的替换设备,包括:
所述集群管理节点通过将所述目标控制设备所属存储节点的节点标识对应的元数据信息修改为所述目标备用设备的元数据信息,确定所述目标备用设备为所述目标控制设备的替换设备。
进一步的,每个共享存储设备还与至少一个空闲设备关联;
所述方法还包括:
当确定所述目标备用设备为所述目标控制设备的替换设备时,所述集群管理节点在与所述目标共享存储设备关联的至少一个空闲设备中,随机确定目标空闲设备,以使所述目标空闲设备检测所述目标备用设备的运行状态。
进一步的,所述集群管理节点确定所述目标备用设备作为所述目标控制设备的替换设备之后,还包括:
所述集群管理节点将节点信息列表中所述目标控制设备所属存储节点的节点标识对应的元数据信息,更新为所述目标备用设备的元数据信息,并将更新后的节点信息列表推送至集群内部的所有存储节点。
另一方面,提供了一种处理设备故障的***,所述***为分布式存储***,所述分布式存储***包括集群管理节点和多个存储节点,每个存储节点包括一个共享存储设备,每个共享存储设备与一个控制设备、一个备用设备关联,其中:
目标备用设备,用于检测管理目标共享存储设备的目标控制设备的运行状态,其中,所述目标备用设备与所述目标共享存储设备关联;
所述目标备用设备,还用于如果所述目标控制设备发生故障,向所述目标共享存储设备发送管理请求,并向所述集群管理节点发送对于所述目标控制设备的替换请求;
所述目标共享存储设备,用于将所述目标备用设备设置为本地管理设备;
所述集群管理节点,用于确定所述目标备用设备为所述目标控制设备的替换设备。
进一步的,所述管理请求中携带有所述目标备用设备的元数据信息;
所述目标共享存储设备,还用于通过将所述目标共享存储设备的归属者信息修改为所述目标备用设备的元数据信息,确定所述目标备用设备为所述共享存储设备的本地管理设备。
进一步的,所述替换请求中携带有所述目标控制设备所属存储节点的节点标识和所述目标备用设备的元数据信息;
所述集群管理节点,还用于通过将所述目标控制设备所属存储节点的节点标识对应的元数据信息修改为所述目标备用设备的元数据信息,确定所述目标备用设备为所述目标控制设备的替换设备。
进一步的,每个共享存储设备还与至少一个空闲设备关联;
所述集群管理节点,还用于:
当确定所述目标备用设备为所述目标控制设备的替换设备时,在与所述目标共享存储设备关联的至少一个空闲设备中,随机确定目标空闲设备,以使所述目标空闲设备检测所述目标备用设备的运行状态。
进一步的,所述集群管理节点,还用于:
将节点信息列表中所述目标控制设备所属存储节点的节点标识对应的元数据信息,更新为所述目标备用设备的元数据信息,并将更新后的节点信息列表推送至所有的存储节点。
本发明实施例提供的技术方案带来的有益效果是:
本发明实施例中,目标共享存储设备关联的目标备用设备检测管理目标共享存储设备的目标控制设备的运行状态;如果目标控制设备发生故障,目标备用设备向目标共享存储设备发送管理请求,并向集群管理节点发送对于目标控制设备的替换请求;目标共享存储设备将目标备用设备设置为本地管理设备;集群管理节点确定目标备用设备为目标控制设备的替换设备。这样,存储节点可以将数据存储在共享存储设备中,当存储节点的控制设备发生故障时,与共享存储设备关联的备用设备可以作为控制设备的替换设备,代替控制设备继续提供服务,其它存储节点无需耗费设备处理资源来进行数据恢复处理,故而可以一定程度上保证分布式存储***的存储服务质量。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的一种处理设备故障的***结构示意图;
图2是本发明实施例提供的一种处理设备故障的***结构示意图;
图3是本发明实施例提供的一种处理设备故障的方法流程图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明实施方式作进一步地详细描述。
本发明实施例提供了一种处理设备故障的方法,该方法的执行主体为分布式存储***,其可以部署于业务提供方的机房。如图1所示,该分布式存储***包括由集群管理节点和多个存储节点组成的存储集群,每个存储节点包括一个共享存储设备,每个共享存储设备可以通过有线或无线的通信方式与一个控制设备、一个备用设备关联,其中,集群管理节点可以管理存储集群中的存储节点,如增加、删除存储集群中的存储节点,检测存储节点的服务状态等;存储节点的控制设备可以提供数据的存储与读取服务,其可以将数据存储在与其关联的共享存储设备中;在控制设备故障后,备用设备可以作为控制设备的替换设备,代替控制设备继续提供数据的存储与读取服务。
在另一种情况下,如图2所示,单个控制设备可以利用自身的设备处理资源,构造出多个虚拟控制设备,每个虚拟控制设备均可以提供数据的存储与读取服务,这样,每个虚拟控制设备可以作为一个存储节点的控制设备,并与不同的共享存储设备进行关联。
下面将结合具体实施方式,对图3所示的一种处理设备故障的处理流程进行详细的说明,内容可以如下:
步骤301:目标共享存储设备关联的目标备用设备检测管理目标共享存储设备的目标控制设备的运行状态。
其中,目标控制设备的运行状态可以分为正常状态和故障状态。
在实施中,当目标控制设备处于正常状态时,其可以接收外部设备的数据存储或读取请求,在其管理的目标共享存储设备中存储或读取相应数据。与目标共享存储设备关联的目标备用设备,可以通过向目标控制设备周期性发送心跳查询请求,来检测目标控制设备的运行状态,如果在预设时间内,目标备用设备接收到目标控制设备的心跳应答,则可以记录目标控制设备为正常状态,否则记录目标控制设备为故障状态。
步骤302:如果目标控制设备发生故障,目标备用设备向目标共享存储设备发送管理请求,并向集群管理节点发送对于目标控制设备的替换请求。
在实施中,当目标控制设备发生了宕机、硬件损坏等故障时,目标备用设备可以检测到目标控制设备处于故障状态。之后,目标备用设备可以向目标共享存储设备发送管理请求,以接管目标控制设备对目标共享存储设备的管理功能,同时,目标备用设备还可以向集群管理节点发送对于目标控制设备的替换请求,以作为目标控制设备的替换设备,代替目标控制设备继续提供数据的存储与读取服务。
步骤303:目标共享存储设备将目标备用设备设置为本地管理设备。
在实施中,目标共享存储设备在接收到目标备用设备发送的管理请求后,可以取消目标控制设备的管理权限,并基于该管理请求将目标备用设备设置为目标共享存储设备的本地管理设备。
可选的,步骤303的具体处理过程可以如下:目标共享存储设备通过将共享存储设备的归属者信息修改为目标备用设备的元数据信息,确定目标备用设备为共享存储设备的本地管理设备。
其中,目标备用设备向目标共享存储设备发送的管理请求中携带有目标备用设备的元数据信息。
在实施中,目标共享存储设备的本地管理设备可以由目标共享存储设备记录的归属者信息所决定,因此,可以通过修改目标共享存储设备记录的归属者信息,来更换目标共享存储设备的本地管理设备。上述归属者信息可以是设备的元数据信息,如设备标识、通信地址等,其中,设备标识可以是设备自身的唯一识别码,例如A2001,通信地址可以是IP(Internet Protocol,网络互连协议)地址,例如1.1.1.106。当检测到目标控制设备处于故障状态时,目标备用设备可以向目标共享存储设备发送携带有目标备用设备的元数据信息的管理请求。之后,目标共享存储设备可以接收到管理请求,并从管理请求中获取目标备用设备的元数据信息。之后,目标共享存储设备可以将本地记录的归属者信息修改为目标备用设备的元数据信息,从而可以将目标备用设备确定为共享存储设备的本地管理设备。
步骤304:集群管理节点确定目标备用设备为目标控制设备的替换设备。
在实施中,在接收到目标备用设备发送的对于目标控制设备的替换请求后,集群管理节点可以确定目标备用设备为目标控制设备的替换设备。进一步的,集群管理节点还可以向目标控制设备发送心跳查询请求,来检测目标控制设备的运行状态。如果检测到目标控制设备处于故障状态,则集群管理节点可以执行上述替换请求,确定目标备用设备作为目标控制设备的替换设备,否则拒绝上述替换请求。这样,集群管理节点可以识别错误的替换请求,保证目标控制设备的正常运行。
可选的,步骤304的具体处理过程可以如下:集群管理节点通过将目标控制设备所属存储节点的节点标识对应的元数据信息修改为目标备用设备的元数据信息,确定目标备用设备为目标控制设备的替换设备。
其中,目标备用设备向集群管理节点发送的对于目标控制设备的替换请求中,携带有目标控制设备所属存储节点的节点标识和目标备用设备的元数据信息。
在实施中,目标备用设备在接管目标共享存储设备后,可以从目标共享存储设备中获取到目标控制设备所属存储节点的节点标识,之后,目标备用设备可以生成携带有目标控制设备所属存储节点的节点标识和目标备用设备的元数据信息的替换请求,并将该替换请求发送至集群管理节点。集群管理节点在接收到目标备用设备发送的替换请求后,可以将目标控制设备所属存储节点的节点标识对应的元数据信息,修改为目标备用设备的元数据信息,则集群管理节点可以确定目标备用设备为目标控制设备的替换设备。
可选的,集群管理节点还可以在备用设备管理共享存储设备时,确定一个空闲设备,作为该备用设备的备用设备,则相应的处理可以如下:当确定目标备用设备为目标控制设备的替换设备时,集群管理节点在与目标共享存储设备关联的至少一个空闲设备中,随机确定目标空闲设备,以使目标空闲设备检测目标备用设备的运行状态。
在实施中,除了控制设备和备用设备,每个共享存储设备还可以与至少一个空闲设备关联。这样,当集群管理节点确定目标备用设备为目标控制设备的替换设备之后,为了应对目标备用设备发生故障的情况,集群管理节点可以在与目标共享存储设备关联的至少一个空闲设备中,随机确定一个目标空闲设备为目标备用设备的备用设备,该目标空闲设备可以检测目标备用设备的运行状态,如果目标备用设备发生故障,该目标空闲设备的后续处理可以参考上述目标备用设备的处理过程,在此不再赘述。
可选的,集群管理节点可以只对在预设时间内接收到的替换请求进行响应,相应的处理可以如下:集群管理节点检测所有控制设备的运行状态;如果在检测到目标控制设备为故障状态之后的预设时间内,集群管理节点接收到替换请求,则确定目标备用设备作为目标控制设备的替换设备,否则在与目标共享存储设备关联的至少一个空闲设备中,重新选取一个空闲设备作为目标备用设备。
在实施中,集群管理节点可以周期性向存储节点的控制设备发送心跳查询请求,以检测存储节点的服务状态。当集群管理节点检测到目标控制设备处于故障状态时,集群管理节点可以开始计时,如果在预设时间内,例如2秒,集群管理节点接收到对于目标控制设备的替换请求,则执行该替换请求,确定目标备用设备作为目标控制设备的替换设备;如果在预设时间内,集群管理节点未接收到对于目标控制设备的替换请求,则集群管理节点可以在与目标共享存储设备关联的至少一个空闲设备中,重新选取一个空闲设备作为目标备用设备。之后,新选取的目标备用设备可以按照上述流程,向目标共享存储设备发送管理请求,并向集群管理节点发送对于目标控制设备的替换请求。后续处理可参照前述处理,在此不再赘述。
可选的,在目标备用设备被确定为目标控制设备的替换设备后,集群管理节点还可以对节点信息列表进行更新,并进行推送,相应的处理可以如下:集群管理节点将节点信息列表中目标控制设备所属存储节点的节点标识对应的元数据信息,更新为目标备用设备的元数据信息,并将更新后的节点信息列表推送至所有的存储节点。
在实施中,集群管理节点中可以维护有节点信息列表,节点信息列表中记录有存储集群内所有存储节点的节点标识、元数据信息和服务状态,其中,节点标识为可以唯一确定存储节点的标识信息;元数据信息可以为控制设备提供数据存储和读取的访问地址,如IP地址;服务状态可以为控制设备的运行状态。集群管理节点可以将本地维护的节点信息列表推送给所有的存储节点,以使存储节点通过节点信息列表,获取各存储节点当前的元数据信息,进而存储节点可以通过各存储节点当前的元数据信息,与各存储节点进行数据的存储和读取。进一步的,在确定目标备用设备为目标控制设备的替换设备后,集群管理节点可以将节点信息列表中目标控制设备所属存储节点的节点标识对应的元数据信息,更新为目标备用设备的元数据信息,同时,集群管理节点可以将更新后的节点信息列表推送给所有的存储节点,以使所有的存储节点可以及时获取到上述更新后的元数据信息。
本发明实施例中,目标共享存储设备关联的目标备用设备检测管理目标共享存储设备的目标控制设备的运行状态;如果目标控制设备发生故障,目标备用设备向目标共享存储设备发送管理请求,并向集群管理节点发送对于目标控制设备的替换请求;目标共享存储设备将目标备用设备设置为本地管理设备;集群管理节点确定目标备用设备为目标控制设备的替换设备。这样,存储节点可以将数据存储在共享存储设备中,当存储节点的控制设备发生故障时,与共享存储设备关联的备用设备可以作为控制设备的替换设备,代替控制设备继续提供服务,其它存储节点无需耗费设备处理资源来进行数据恢复处理,故而可以一定程度上保证分布式存储***的存储服务质量。
基于相同的技术构思,本发明实施例还提供了一种处理设备故障的***,如图1或图2所示,所述***为分布式存储***,所述分布式存储***包括集群管理节点和多个存储节点,每个存储节点包括一个共享存储设备,每个共享存储设备与一个控制设备、一个备用设备关联,其中:
目标备用设备,用于检测管理目标共享存储设备的目标控制设备的运行状态,其中,所述目标备用设备与所述目标共享存储设备关联;
所述目标备用设备,还用于如果所述目标控制设备发生故障,向所述目标共享存储设备发送管理请求,并向所述集群管理节点发送对于所述目标控制设备的替换请求;
所述目标共享存储设备,用于将所述目标备用设备设置为本地管理设备;
所述集群管理节点,用于确定所述目标备用设备为所述目标控制设备的替换设备。
可选的,所述管理请求中携带有所述目标备用设备的元数据信息;
所述目标共享存储设备,还用于通过将所述目标共享存储设备的归属者信息修改为所述目标备用设备的元数据信息,确定所述目标备用设备为所述共享存储设备的本地管理设备。
可选的,所述替换请求中携带有所述目标控制设备所属存储节点的节点标识和所述目标备用设备的元数据信息;
所述集群管理节点,还用于通过将所述目标控制设备所属存储节点的节点标识对应的元数据信息修改为所述目标备用设备的元数据信息,确定所述目标备用设备为所述目标控制设备的替换设备。
可选的,每个共享存储设备还与至少一个空闲设备关联;
所述集群管理节点,还用于:当确定所述目标备用设备为所述目标控制设备的替换设备时,在与所述目标共享存储设备关联的至少一个空闲设备中,随机确定目标空闲设备,以使所述目标空闲设备检测所述目标备用设备的运行状态。
可选的,所述集群管理节点,还用于:将节点信息列表中所目标控制设备所属存储节点的节点标识对应的元数据信息,更新为所述目标备用设备的元数据信息,并将更新后的节点信息列表推送至集群内部的所有存储节点。
本发明实施例中,目标共享存储设备关联的目标备用设备检测管理目标共享存储设备的目标控制设备的运行状态;如果目标控制设备发生故障,目标备用设备向目标共享存储设备发送管理请求,并向集群管理节点发送对于目标控制设备的替换请求;目标共享存储设备将目标备用设备设置为本地管理设备;集群管理节点确定目标备用设备为目标控制设备的替换设备。这样,存储节点可以将数据存储在共享存储设备中,当存储节点的控制设备发生故障时,与共享存储设备关联的备用设备可以作为控制设备的替换设备,代替控制设备继续提供服务,其它存储节点无需耗费设备处理资源来进行数据恢复处理,故而可以一定程度上保证分布式存储***的存储服务质量。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务端,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种处理设备故障的方法,其特征在于,所述方法应用于分布式存储***,所述分布式存储***包括集群管理节点和多个存储节点,每个存储节点包括一个共享存储设备,每个共享存储设备与一个控制设备、一个备用设备关联,每个共享存储设备还与至少一个空闲设备关联,所述方法包括:
目标共享存储设备关联的目标备用设备检测管理所述目标共享存储设备的目标控制设备的运行状态;
如果所述目标控制设备发生故障,所述目标备用设备向所述目标共享存储设备发送管理请求,并向所述集群管理节点发送对于所述目标控制设备的替换请求;
所述目标共享存储设备将所述目标备用设备设置为本地管理设备;
所述集群管理节点周期性检测所有控制设备的运行状态,如果在检测到所述目标控制设备为故障状态之后的预设时间内接收到所述替换请求,则确定所述目标备用设备为所述目标控制设备的替换设备,否则选取一个所述空闲设备作为所述目标备用设备。
2.根据权利要求1所述的方法,其特征在于,所述管理请求中携带有所述目标备用设备的元数据信息;
所述目标共享存储设备将所述目标备用设备设置为本地管理设备,包括:
所述目标共享存储设备通过将所述目标共享存储设备的归属者信息修改为所述目标备用设备的元数据信息,确定所述目标备用设备为所述共享存储设备的本地管理设备。
3.根据权利要求1所述的方法,其特征在于,所述替换请求中携带有目标控制设备所属存储节点的节点标识和所述目标备用设备的元数据信息;
所述集群管理节点确定所述目标备用设备为所述目标控制设备的替换设备,包括:
所述集群管理节点通过将所述目标控制设备所属存储节点的节点标识对应的元数据信息修改为所述目标备用设备的元数据信息,确定所述目标备用设备为所述目标控制设备的替换设备。
4.根据权利要求1所述的方法,其特征在于,所述方法还包括:
当确定所述目标备用设备为所述目标控制设备的替换设备时,所述集群管理节点在与所述目标共享存储设备关联的至少一个空闲设备中,随机确定目标空闲设备,以使所述目标空闲设备检测所述目标备用设备的运行状态。
5.根据权利要求3所述的方法,其特征在于,所述集群管理节点确定所述目标备用设备作为所述目标控制设备的替换设备之后,还包括:
所述集群管理节点将节点信息列表中所述目标控制设备所属存储节点的节点标识对应的元数据信息,更新为所述目标备用设备的元数据信息,并将更新后的节点信息列表推送至集群内部的所有存储节点。
6.一种处理设备故障的***,其特征在于,所述***为分布式存储***,所述分布式存储***包括集群管理节点和多个存储节点,每个存储节点包括一个共享存储设备,每个共享存储设备与一个控制设备、一个备用设备关联,每个共享存储设备还与至少一个空闲设备关联,其中:
目标备用设备,用于检测管理目标共享存储设备的目标控制设备的运行状态,其中,所述目标备用设备与所述目标共享存储设备关联;
所述目标备用设备,还用于如果所述目标控制设备发生故障,向所述目标共享存储设备发送管理请求,并向所述集群管理节点发送对于所述目标控制设备的替换请求;
所述目标共享存储设备,用于将所述目标备用设备设置为本地管理设备;
所述集群管理节点,用于周期性检测所有控制设备的运行状态,如果在检测到所述目标控制设备为故障状态之后的预设时间内接收到所述替换请求,则确定所述目标备用设备为所述目标控制设备的替换设备,否则选取一个所述空闲设备作为所述目标备用设备。
7.根据权利要求6所述的***,其特征在于,所述管理请求中携带有所述目标备用设备的元数据信息;
所述目标共享存储设备,还用于通过将所述目标共享存储设备的归属者信息修改为所述目标备用设备的元数据信息,确定所述目标备用设备为所述共享存储设备的本地管理设备。
8.根据权利要求6所述的***,其特征在于,所述替换请求中携带有所述目标控制设备所属存储节点的节点标识和所述目标备用设备的元数据信息;
所述集群管理节点,还用于通过将所述目标控制设备所属存储节点的节点标识对应的元数据信息修改为所述目标备用设备的元数据信息,确定所述目标备用设备为所述目标控制设备的替换设备。
9.根据权利要求6所述的***,其特征在于,所述集群管理节点,还用于:
当确定所述目标备用设备为所述目标控制设备的替换设备时,在与所述目标共享存储设备关联的至少一个空闲设备中,随机确定目标空闲设备,以使所述目标空闲设备检测所述目标备用设备的运行状态。
10.根据权利要求8所述的***,其特征在于,所述集群管理节点,还用于:
将节点信息列表中所述目标控制设备所属存储节点的节点标识对应的元数据信息,更新为所述目标备用设备的元数据信息,并将更新后的节点信息列表推送至集群内部的所有存储节点。
CN201810226159.3A 2018-03-19 2018-03-19 一种处理设备故障的方法和*** Expired - Fee Related CN108509296B (zh)

Priority Applications (4)

Application Number Priority Date Filing Date Title
CN201810226159.3A CN108509296B (zh) 2018-03-19 2018-03-19 一种处理设备故障的方法和***
EP18893326.1A EP3570169B1 (en) 2018-03-19 2018-04-02 Method and system for processing device failure
US16/340,241 US20210326224A1 (en) 2018-03-19 2018-04-02 Method and system for processing device failure
PCT/CN2018/081562 WO2019178891A1 (zh) 2018-03-19 2018-04-02 一种处理设备故障的方法和***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810226159.3A CN108509296B (zh) 2018-03-19 2018-03-19 一种处理设备故障的方法和***

Publications (2)

Publication Number Publication Date
CN108509296A CN108509296A (zh) 2018-09-07
CN108509296B true CN108509296B (zh) 2021-02-02

Family

ID=63375944

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810226159.3A Expired - Fee Related CN108509296B (zh) 2018-03-19 2018-03-19 一种处理设备故障的方法和***

Country Status (4)

Country Link
US (1) US20210326224A1 (zh)
EP (1) EP3570169B1 (zh)
CN (1) CN108509296B (zh)
WO (1) WO2019178891A1 (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110445871A (zh) * 2019-08-14 2019-11-12 益逻触控***公司 自助服务终端的操作方法及自助服务终端
CN112835915B (zh) * 2019-11-25 2023-07-18 ***通信集团辽宁有限公司 Mpp数据库***、数据存储方法及数据查询方法
CN111638995A (zh) * 2020-05-08 2020-09-08 杭州海康威视***技术有限公司 元数据备份方法、装置及设备、存储介质

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9607001B2 (en) * 2012-07-13 2017-03-28 Facebook, Inc. Automated failover of a metadata node in a distributed file system
JP6122126B2 (ja) * 2013-08-27 2017-04-26 株式会社東芝 データベースシステム、プログラムおよびデータ処理方法
US9483367B1 (en) * 2014-06-27 2016-11-01 Veritas Technologies Llc Data recovery in distributed storage environments
CN105991325B (zh) * 2015-02-10 2019-06-21 华为技术有限公司 处理至少一个分布式集群中的故障的方法、设备和***
CN105117171B (zh) * 2015-08-28 2018-11-30 南京国电南自维美德自动化有限公司 一种能源scada海量数据分布式处理***及其方法
US10452490B2 (en) * 2016-03-09 2019-10-22 Commvault Systems, Inc. Data management and backup of distributed storage environment
US10564852B2 (en) * 2016-06-25 2020-02-18 International Business Machines Corporation Method and system for reducing memory device input/output operations
CN107547653B (zh) * 2017-09-11 2021-03-30 华北水利水电大学 一种分布式文件存储***

Also Published As

Publication number Publication date
US20210326224A1 (en) 2021-10-21
WO2019178891A1 (zh) 2019-09-26
CN108509296A (zh) 2018-09-07
EP3570169A4 (en) 2020-03-04
EP3570169B1 (en) 2021-02-24
EP3570169A1 (en) 2019-11-20
EP3570169A8 (en) 2020-04-29

Similar Documents

Publication Publication Date Title
CN106982236B (zh) 一种信息处理方法、装置和***
CN106911524B (zh) 一种ha实现方法及装置
US7539150B2 (en) Node discovery and communications in a network
CN111651291B (zh) 一种共享存储集群防脑裂的方法、***、计算机存储介质
US20230041089A1 (en) State management methods, methods for switching between master application server and backup application server, and electronic devices
US9367261B2 (en) Computer system, data management method and data management program
CN108509296B (zh) 一种处理设备故障的方法和***
US20180300210A1 (en) Method for Processing Acquire Lock Request and Server
CN109428740B (zh) 设备故障恢复的方法和装置
CN102394914A (zh) 集群脑裂处理方法和装置
CN112328421B (zh) 一种***故障处理方法、装置、计算机设备和存储介质
TWI677797B (zh) 主備資料庫的管理方法、系統及其設備
CN113347037B (zh) 一种数据中心访问方法及装置
CN108600284B (zh) 一种基于Ceph的虚拟机高可用实现方法及***
CN107508700B (zh) 容灾方法、装置、设备及存储介质
CN107547512B (zh) 一种多级云平台中的用户认证方法和装置
CN106533751B (zh) 一种sdn控制器集群合并方法及装置
CN111342986B (zh) 分布式节点管理方法及装置、分布式***、存储介质
CN109189854B (zh) 提供持续业务的方法及节点设备
CN113126925B (zh) 一种成员列表确定方法、装置、设备及可读存储介质
CN105323271B (zh) 一种云计算***以及云计算***的处理方法和装置
US10853892B2 (en) Social networking relationships processing method, system, and storage medium
CN113055203B (zh) Sdn控制平面的异常恢复方法及装置
WO2017080362A1 (zh) 数据管理方法及装置
CN110928945B (zh) 一种针对数据库的数据处理方法及装置,数据处理***

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20210202

CF01 Termination of patent right due to non-payment of annual fee