CN109144788B - 一种重建osd的方法、装置及*** - Google Patents

一种重建osd的方法、装置及*** Download PDF

Info

Publication number
CN109144788B
CN109144788B CN201811051405.2A CN201811051405A CN109144788B CN 109144788 B CN109144788 B CN 109144788B CN 201811051405 A CN201811051405 A CN 201811051405A CN 109144788 B CN109144788 B CN 109144788B
Authority
CN
China
Prior art keywords
osd
reconstruction
storage node
script
condition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811051405.2A
Other languages
English (en)
Other versions
CN109144788A (zh
Inventor
李静
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wangsu Science and Technology Co Ltd
Original Assignee
Wangsu Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wangsu Science and Technology Co Ltd filed Critical Wangsu Science and Technology Co Ltd
Priority to CN201811051405.2A priority Critical patent/CN109144788B/zh
Publication of CN109144788A publication Critical patent/CN109144788A/zh
Application granted granted Critical
Publication of CN109144788B publication Critical patent/CN109144788B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1415Saving, restoring, recovering or retrying at system level
    • G06F11/142Reconfiguring to eliminate the error

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Debugging And Monitoring (AREA)
  • Stored Programmes (AREA)

Abstract

本发明公开了一种重建OSD的方法、装置及***,其中,该方法包括:存储节点监测本节点中OSD的状态;当所述存储节点监测到所述OSD处于异常状态时,利用重建判断脚本确定所述OSD是否满足重建条件;当所述存储节点确定出所述OSD满足所述重建条件时,利用重建脚本重建所述OSD。本发明的整个流程均利用自动化来实现,能够大大缩减判断时间,提高OSD重建效率,并且,利用自动化判断OSD能否重建,能够解决人工误判或漏判的问题,提高OSD重建的准确性。

Description

一种重建OSD的方法、装置及***
技术领域
本发明涉及计算机技术领域,特别涉及一种重建OSD的方法、装置及***。
背景技术
Ceph是一种高可用、易于管理、开源的分布式存储***。Ceph OSD(ObjectStorage Device,对象存储设备)是Ceph存储集群最重要的组件,OSD将数据以对象的形式存储到集群中每个存储节点的物理磁盘上。在OSD的状态出现异常,例如OSD挂掉(down)后的处理方法有重启OSD和重建OSD。
对于每个存储节点的OSD,可以在从节点上设置相应的OSD副本,在OSD处于异常的期间,可以改用OSD副本处理用户请求。待OSD重启时,重启的OSD将OSD副本磁盘中异常期间存入的数据同步到本OSD的磁盘中,同时OSD副本也停止处理用户请求。如果OSD状态异常时间持续比较久,重启OSD耗时比较长时,会长时间阻塞用户请求,影响用户正常读写,为避免这种情况可以选择重建OSD。
目前,重建OSD通常通过人为判断OSD是否满足重建条件,再决定是否重建,这样会耗费比较长的时间,OSD重建不及时,并且在通过人为判断OSD是否满足重建条件时,容易出现误判或漏判等问题。若状态异常的OSD没有被及时重建,唯一剩下的OSD副本又发生了磁盘故障,则会造成数据丢失。而且若OSD长时间没有被恢复,再次重建时,重建过程中数据恢复会耗费更长的时间。因此,在OSD出现异常后,重建速度越快,***性能越稳定。
发明内容
为了解决现有技术的问题,本发明实施例提供了一种重建OSD的方法、装置及***。所述技术方案如下:
第一方面,提供了一种重建OSD的方法,所述方法包括:
存储节点监测本节点中OSD的状态;
当所述存储节点监测到所述OSD处于异常状态时,利用重建判断脚本确定所述OSD是否满足重建条件;
当所述存储节点确定出所述OSD满足所述重建条件时,利用重建脚本重建所述OSD。
可选的,当所述存储节点监测到所述OSD处于异常状态时,利用重建判断脚本确定所述OSD是否满足所述重建条件,包括:
当所述存储节点监测到所述OSD处于异常状态时,向中心节点发送OSD异常信息;
所述中心节点接收所述OSD异常信息,并向所述存储节点发送重建检测信息,所述重建检测信息包括所述重建判断脚本;
所述存储节点接收所述重建检测信息,并利用所述重建判断脚本确定所述OSD是否满足所述重建条件。
可选的,所述存储节点利用重建判断脚本确定所述OSD是否满足所述重建条件,包括:
所述存储节点确定所述OSD的磁盘中是否存在以孤本形式存储的对象;
如果不存在,则确定所述OSD满足所述重建条件;
如果存在,则确定所述OSD不满足所述重建条件。
可选的,所述存储节点利用重建判断脚本确定所述OSD是否满足所述重建条件,还包括:
所述存储节点基于所述重建检测信息,确定所述OSD是否属于本机、所述OSD的磁盘中是否存在以孤本形式存储的对象以及所述OSD是否处于异常状态;
如果所述OSD属于本机、所述OSD的磁盘中不存在以孤本形式存储的对象以及所述OSD处于异常状态,则确定所述OSD满足所述重建条件,否则确定所述OSD不满足所述重建条件。
可选的,当所述存储节点确定出所述OSD满足所述重建条件时,利用重建脚本重建所述OSD,包括:
当所述存储节点确定出所述OSD满足所述重建条件时,向中心节点发送重建信息;
所述中心节点接收所述重建信息,并向所述存储节点发送所述重建脚本;
所述存储节点接收所述重建脚本,利用所述重建脚本重建所述OSD。
可选的,当所述存储节点确定出所述OSD满足所述重建条件时,利用重建脚本重建所述OSD之后,包括:
所述存储节点向中心节点发送重建结果
第二方面,提供了一种重建OSD的装置,包括:
监测模块,用于监测本节点中OSD的状态;
确定模块,用于当所述OSD处于异常状态时,利用重建判断脚本确定所述OSD是否满足重建条件;
重建模块,用于当所述OSD满足所述重建条件时,利用重建脚本重建所述OSD。
可选的,所述确定模块,用于:
当所述OSD处于异常状态时,向中心节点发送OSD异常信息,以使所述中心节点基于所述OSD异常信息向所述存储节点发送重建检测信息,所述重建检测信息包括所述重建判断脚本;
接收所述中心节点发送的所述重建检测信息,并利用所述重建判断脚本确定所述OSD是否满足所述重建条件。
可选的,所述确定模块,还用于:
确定所述OSD的磁盘中是否存在以孤本形式存储的对象;
如果不存在,则确定所述OSD满足所述重建条件;
如果存在,则确定所述OSD不满足所述重建条件。
可选的,所述确定模块,还用于:
基于所述重建检测信息,确定所述OSD是否属于本机、所述OSD的磁盘中是否存在以孤本形式存储的对象以及所述OSD是否处于异常状态;
如果所述OSD属于本机、所述OSD的磁盘中不存在以孤本形式存储的对象以及所述OSD处于异常状态,则确定所述OSD满足所述重建条件,否则确定所述OSD不满足所述重建条件。
可选的,所述重建模块,用于:
当所述OSD满足所述重建条件时,向中心节点发送重建信息,以使所述中心节点基于所述重建信息向所述存储节点发送所述重建脚本;
接收所述中心节点发送的所述重建脚本,并利用所述重建脚本重建所述OSD。
可选的,所述重建模块,还用于:
在重建所述OSD之后,向中心节点发送重建结果。
第三方面,提供了一种重建OSD的***,包括存储节点以及中心节点;
所述存储节点包括第一方面所述的重建OSD的装置;
所述中心节点,用于接收所述存储节点发送的重建结果。
可选的,所述中心节点,还用于接收存储节点发送的OSD异常信息,并基于所述OSD异常信息向所述存储节点发送重建检测信息,所述重建检测信息包括所述重建判断脚本,以使所述存储节点利用所述重建判断脚本确定所述OSD是否满足所述重建条件。
可选的,所述中心节点,还用于接收存储节点发送的重建信息,并基于所述重建信息向所述存储节点发送重建脚本,以使所述存储节点利用所述重建脚本重建所述OSD。
本发明实施例可以实时监测OSD的状态,当监测到有OSD处于异常状态时,利用重建判断脚本确定该OSD是否满足重建条件,当确定出该OSD满足重建条件时,利用重建脚本重建OSD,整个流程均利用自动化来实现,能够大大缩减判断时间,提高OSD重建效率,并且,利用自动化判断OSD能否重建,能够解决人工误判或漏判的问题,提高OSD重建的准确性。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的一种重建OSD的方法的流程图;
图2是本发明实施例提供的一种重建OSD的装置的结构框图;
图3是本发明实施例提供的一种重建OSD的***的结构框图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明实施方式作进一步地详细描述。
本发明实施例提供了一种重建OSD的方法,该方法主要由存储节点来实现。存储节点可以是分布式存储***中的任一存储节点,用于处理用户的请求,例如数据写入,数据读取等等。上述存储节点可以包括处理器、存储器、收发器,处理器可以用于进行下述流程中的OSD重建,存储器可以用于存储下述OSD重建过程中需要的数据以及产生的数据,收发器可以用于接收和发送下述OSD重建过程中的相关数据。
参见图1,为本发明实施例提供的一种重建OSD的方法的流程图,该方法具体可以包括以下步骤。
步骤101,存储节点监测本节点中OSD的状态。
每个存储节点可以包括一个OSD,也可以包括多个OSD。存储节点可以实时监测本节点中各个OSD的状态。一般情况下,当OSD处于up时,则表示OSD处于正常状态,可以正常提供服务,当OSD处于状态异常时,说明OSD处于异常状态。步骤102,当所述存储节点监测到所述OSD处于异常状态时,利用重建判断脚本确定所述OSD是否满足所述重建条件。
在实施中,可以将重建判断脚本预先保存在存储节点中,当存储节点监测到所述OSD处于异常状态时,可以调用该预存的重建判断脚本确定是否可以重建所述OSD。具体的,所述存储节点可以确定所述OSD的磁盘中是否存在以孤本形式存储的对象,如果不存在,则确定所述OSD满足所述重建条件,否则确定所述OSD不满足所述重建条件。其中,孤本是指只存在于一个可用的OSD的磁盘中的存储对象,如果异常OSD的磁盘中存在存储对象的孤本,并且重建OSD,会造成数据丢失,所以在OSD重建的过程中,需要判断待重建的OSD中是否存在孤本。
在判断所述OSD的磁盘中是否存在以孤本形式存储的对象时,可以通过查看PG(Placement Group,归置组)状态进行判断。PG是组成存储池的基本单位,每个存储对象会固定映射到一个PG中,PG类似于数据库中的索引。由于存在OSD副本,同一个存储对象可能存储于多个OSD的磁盘中。在判断当前OSD的磁盘中是否存在存储对象的孤本时,可以根据每个存储对象对应的PG的副本状态确定该存储对象是否只剩下一个可用状态的副本,如果是,说明该存储对象是孤本,并确定当前OSD的磁盘中存在存储对象的孤本,当前OSD不满足重建条件。可选的,OSD重建条件还可以规定存储对象的最小副本数量值,当OSD的磁盘中存储对象所剩的副本数量小于该最小值时,说明当前OSD不满足重建条件。
优选的,本发明实施例还可以采用中心管理方式,即通过中心节点对存储节点进行管理。在采用中心管理方式中,可以将重建判断脚本保存在中心节点中,当存储节点监测到OSD处于异常状态时,从中心节点中获取重建判断脚本。
从中心节点中获取重建判断脚本并进行重建判断的过程可以包括:当所述存储节点监测到所述OSD处于异常状态时,向中心节点发送OSD异常信息,所述中心节点接收所述OSD异常信息,并向所述存储节点发送重建检测信息,所述重建检测信息包括所述重建判断脚本,所述存储节点接收所述重建检测信息,并利用重建判断脚本确定所述OSD是否满足所述重建条件。
存储节点向中心节点发送的OSD异常信息可以包括该存储节点的标识以及处于异常状态的OSD的标识。中心节点向存储节点发送的重建检测信息还可以包括处于异常状态的OSD的标识。存储节点利用中心节点发送的重建判断脚本确定所述OSD是否满足所述重建条件的过程可以包括:存储节点基于所述重建检测信息,确定所述OSD是否属于本机、所述OSD的磁盘中是否存在以孤本形式存储的对象以及所述OSD是否处于异常状态;如果所述OSD属于本机、所述OSD的磁盘中不存在以孤本形式存储的对象以及所述OSD处于异常状态,则确定所述OSD满足所述重建条件,否则确定所述OSD不满足所述重建条件。
可选的,存储节点确定所述OSD是否满足所述重建条件的过程具体可以包括:所述存储节点基于所述重建检测信息确定所述OSD是否属于本机;当所述存储节点确定出所述OSD属于本机时,确定所述OSD的磁盘中是否存在以孤本形式存储的对象;当所述存储节点确定出所述OSD的磁盘中不存在以孤本形式存储的对象时,确定所述OSD是否处于异常状态;当所述存储节点确定出所述OSD处于异常状态时,确定所述OSD满足所述重建条件。存储节点在确定所述OSD是否满足所述重建条件的过程中,如果任一条件不满足要求时,则可以确定出所述OSD不满足所述重建条件,并结束该过程。
可选的,当存储节点监测到所述OSD处于异常状态时,在利用预存于本节点中的重建判断脚本确定所述OSD是否满足重建条件时,还可以向中心节点发送OSD异常信息,以使中心节点了解OSD的异常情况,方便中心节点的集中管理。
步骤103,当所述存储节点确定出所述OSD满足所述重建条件时,利用重建脚本重建所述OSD。
在实施中,可以将重建脚本预先保存在存储节点中,当存储节点确定出所述OSD满足所述重建条件时,可以调用该预存的重建脚本重建所述OSD。
优选的,在采用中心管理方式中,可以将重建条件保存在中心节点中,当存储节点确定出所述OSD满足所述重建条件时,可以从中心节点中获取重建判断脚本。从中心节点中获取重建脚本并重建OSD的过程可以包括:当所述存储节点确定出所述OSD满足所述重建条件时,向中心节点发送重建信息;所述中心节点接收所述重建信息,并向所述存储节点发送所述重建脚本;所述存储节点接收所述重建脚本,利用所述重建脚本重建所述OSD。
当存储节点确定出所述OSD不满足重建条件时,可以向中心节点发送所述OSD不满足重建条件的信息,中心节点接收到该信息后,则不会向该存储节点发送重建脚本。
在采用中心管理方式中,存储节点判断OSD是否满足重建条件所需的重建判断脚本可以由中心节点下发,并且重建OSD所需的重建脚本也可以由中心节点下发,使中心节点能够参与并监控存储节点执行重建OSD的过程,以方便中心节点对存储节点以及数据的集中管理。在采用中心管理方式中,可以通过分析存储节点的重建记录,比如哪个存储节点会频繁重建,从而方便从根本上去解决问题,还可以及时人为干预操作过程,比如对于突发情况,可以从中心节点之间控制重建判断脚本暂停下发,或重建脚本暂停下发。并且,当重建判断脚本或者重建脚本需要升级或修改时,可以只对中心节点中的重建判断脚本或者重建脚本进行变更即可,而无需对各个存储节点进行任何处理,所以脚本变更更加方便简单。
存储节点利用重建脚本重建所述OSD之后,可以向中心节点发送重建结果,以使运维人员能够通过中心节点了解各个存储节点的OSD重建情况,并防止存储节点的OSD重建出现异常情况,保证OSD重建能够准确执行。
本发明实施例可以实时监测OSD的状态,当监测到有OSD处于异常状态时,利用重建判断脚本确定该OSD是否满足重建条件,当确定出该OSD满足重建条件时,利用重建脚本重建OSD,整个流程均利用自动化来实现,能够大大缩减判断时间,提高OSD重建效率,并且,利用自动化判断OSD能否重建,能够解决人工误判或漏判的问题,提高OSD重建的准确性。
参照图2,为本发明实施例提供的一种重建OSD的装置的结构框图,该装置可以配置于存储节点中,或者为存储节点本身,该装置可以包括监测模块201、确定模块202以及重建模块203。
其中,监测模块201,用于监测本节点中OSD的状态;
确定模块202,用于当所述OSD处于异常状态时,利用重建判断脚本确定所述OSD是否满足重建条件;
重建模块203,用于当所述OSD满足所述重建条件时,利用重建脚本重建所述OSD。
优选的,所述确定模块202,用于:
当所述OSD处于异常状态时,向中心节点发送OSD异常信息,以使所述中心节点基于所述OSD异常信息向所述存储节点发送重建检测信息,所述重建检测信息包括所述重建判断脚本;
接收所述中心节点发送的所述重建检测信息,并利用所述重建判断脚本确定所述OSD是否满足所述重建条件。
优选的,所述确定模块202,还用于:
确定所述OSD的磁盘中是否有孤本;
如果没有孤本,则确定所述OSD满足所述重建条件;
如果有孤本,则确定所述OSD不满足所述重建条件。
优选的,所述确定模块202,还用于:
基于所述重建检测信息,确定所述OSD是否属于本机、所述OSD的磁盘中是否有孤本以及所述OSD是否处于异常状态;
如果所述OSD属于本机、所述OSD的磁盘中没有孤本以及所述OSD处于异常状态,则确定所述OSD满足所述重建条件,否则确定所述OSD不满足所述重建条件。
优选的,所述重建模块203,还用于:
当所述OSD满足所述重建条件时,向中心节点发送重建信息,以使所述中心节点基于所述重建信息向所述存储节点发送所述重建脚本;
接收所述中心节点发送的所述重建脚本,并利用所述重建脚本重建所述OSD。
优选的,所述重建模块203,还用于:
在重建所述OSD之后,向中心节点发送重建结果。
本发明实施例可以实时监测OSD的状态,当监测到有OSD处于异常状态时,利用重建判断脚本确定该OSD是否满足重建条件,当确定出该OSD满足重建条件时,利用重建脚本重建OSD,整个流程均利用自动化来实现,能够大大缩减判断时间,提高OSD重建效率,并且,利用自动化判断OSD能否重建,能够解决人工误判或漏判的问题,提高OSD重建的准确性。
需要说明的是:上述实施例提供的重建OSD的装置在重建OSD时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将装置的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的重建OSD的装置与重建OSD的方法的实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
参照图3,为本发明实施例提供的一种重建OSD的***的结构框图,该***可以包括存储节点以及中心节点。
其中,所述存储节点包括上述的重建OSD的装置,存储节点具体包括的功能模块,可参考上述重建OSD的装置的实施例,在此不再赘述。
所述中心节点,用于接收所述存储节点发送的重建结果。
优选的,所述中心节点,还用于接收存储节点发送的OSD异常信息,并基于所述OSD异常信息向所述存储节点发送重建检测信息,所述重建检测信息包括所述重建判断脚本,以使所述存储节点利用所述重建判断脚本确定所述OSD是否满足所述重建条件。
优选的,所述中心节点,还用于接收存储节点发送的重建信息,并基于所述重建信息向所述存储节点发送重建脚本,以使所述存储节点利用所述重建脚本重建所述OSD。
本发明实施例可以实时监测OSD的状态,当监测到有OSD处于异常状态时,利用重建判断脚本确定该OSD是否满足重建条件,当确定出该OSD满足重建条件时,利用重建脚本重建OSD,整个流程均利用自动化来实现,能够大大缩减判断时间,提高OSD重建效率,并且,利用自动化判断OSD能否重建,能够解决人工误判或漏判的问题,提高OSD重建的准确性。
需要说明的是:上述实施例提供的重建OSD的***与重建OSD的方法的实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (13)

1.一种重建OSD的方法,其特征在于,所述方法包括:
存储节点监测本节点中OSD的状态;
当所述存储节点监测到所述OSD处于异常状态时,向中心节点发送OSD异常信息;所述中心节点接收所述OSD异常信息,并向所述存储节点发送重建检测信息,所述重建检测信息包括重建判断脚本;所述存储节点接收所述重建检测信息,并利用所述重建判断脚本确定所述OSD是否满足重建条件,其中,所述异常状态为down;
当所述存储节点确定出所述OSD满足所述重建条件时,利用重建脚本重建所述OSD。
2.根据权利要求1所述的方法,其特征在于,所述存储节点利用重建判断脚本确定所述OSD是否满足所述重建条件,包括:
所述存储节点确定所述OSD的磁盘中是否存在以孤本形式存储的对象;
如果不存在,则确定所述OSD满足所述重建条件;
如果存在,则确定所述OSD不满足所述重建条件。
3.根据权利要求1所述的方法,其特征在于,所述存储节点利用重建判断脚本确定所述OSD是否满足所述重建条件,还包括:
所述存储节点基于所述重建检测信息,确定所述OSD是否属于本机、所述OSD的磁盘中是否存在以孤本形式存储的对象以及所述OSD是否处于异常状态;
如果所述OSD属于本机、所述OSD的磁盘中不存在以孤本形式存储的对象以及所述OSD处于异常状态,则确定所述OSD满足所述重建条件,否则确定所述OSD不满足所述重建条件。
4.根据权利要求1所述的方法,其特征在于,当所述存储节点确定出所述OSD满足所述重建条件时,利用重建脚本重建所述OSD,包括:
当所述存储节点确定出所述OSD满足所述重建条件时,向中心节点发送重建信息;
所述中心节点接收所述重建信息,并向所述存储节点发送所述重建脚本;
所述存储节点接收所述重建脚本,利用所述重建脚本重建所述OSD。
5.根据权利要求1所述的方法,其特征在于,当所述存储节点确定出所述OSD满足所述重建条件时,利用重建脚本重建所述OSD之后,包括:
所述存储节点向中心节点发送重建结果。
6.一种重建OSD的装置,其特征在于,应用于存储模块,所述装置包括:
监测模块,用于监测本节点中OSD的状态;
确定模块,用于当所述OSD处于异常状态时,向中心节点发送OSD异常信息;所述中心节点接收所述OSD异常信息,并向存储节点发送重建检测信息,所述重建检测信息包括重建判断脚本;所述存储节点接收所述重建检测信息,并利用所述重建判断脚本确定所述OSD是否满足重建条件,其中,所述异常状态为down;
重建模块,用于当所述OSD满足所述重建条件时,利用重建脚本重建所述OSD。
7.根据权利要求6所述的装置,其特征在于,所述确定模块,还用于:
确定所述OSD的磁盘中是否存在以孤本形式存储的对象;
如果不存在,则确定所述OSD满足所述重建条件;
如果存在,则确定所述OSD不满足所述重建条件。
8.根据权利要求6所述的装置,其特征在于,所述确定模块,还用于:
基于所述重建检测信息,确定所述OSD是否属于本机、所述OSD的磁盘中是否存在以孤本形式存储的对象以及所述OSD是否处于异常状态;
如果所述OSD属于本机、所述OSD的磁盘中不存在以孤本形式存储的对象以及所述OSD处于异常状态,则确定所述OSD满足所述重建条件,否则确定所述OSD不满足所述重建条件。
9.根据权利要求6所述的装置,其特征在于,所述重建模块,用于:
当所述OSD满足所述重建条件时,向中心节点发送重建信息,以使所述中心节点基于所述重建信息向所述存储节点发送所述重建脚本;
接收所述中心节点发送的所述重建脚本,并利用所述重建脚本重建所述OSD。
10.根据权利要求6所述的装置,其特征在于,所述重建模块,还用于:
在重建所述OSD之后,向中心节点发送重建结果。
11.一种重建OSD的***,其特征在于,包括存储节点以及中心节点;
所述存储节点包括如权利要求6-10中任一项所述的重建OSD的装置;
所述中心节点,用于接收所述存储节点发送的重建结果。
12.根据权利要求11所述的***,其特征在于,
所述中心节点,还用于接收所述存储节点发送的OSD异常信息,并基于所述OSD异常信息向所述存储节点发送重建检测信息,所述重建检测信息包括所述重建判断脚本,以使所述存储节点利用所述重建判断脚本确定所述OSD是否满足所述重建条件。
13.根据权利要求11所述的***,其特征在于,
所述中心节点,还用于接收所述存储节点发送的重建信息,并基于所述重建信息向所述存储节点发送重建脚本,以使所述存储节点利用所述重建脚本重建所述OSD。
CN201811051405.2A 2018-09-10 2018-09-10 一种重建osd的方法、装置及*** Active CN109144788B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811051405.2A CN109144788B (zh) 2018-09-10 2018-09-10 一种重建osd的方法、装置及***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811051405.2A CN109144788B (zh) 2018-09-10 2018-09-10 一种重建osd的方法、装置及***

Publications (2)

Publication Number Publication Date
CN109144788A CN109144788A (zh) 2019-01-04
CN109144788B true CN109144788B (zh) 2021-10-22

Family

ID=64824143

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811051405.2A Active CN109144788B (zh) 2018-09-10 2018-09-10 一种重建osd的方法、装置及***

Country Status (1)

Country Link
CN (1) CN109144788B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110515771A (zh) * 2019-08-23 2019-11-29 北京浪潮数据技术有限公司 一种对象存储设备设置方法、***、设备及计算机介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102164165A (zh) * 2011-02-18 2011-08-24 杭州宏杉科技有限公司 一种网络存储***的管理方法及装置
CN102385537A (zh) * 2011-10-25 2012-03-21 曙光信息产业(北京)有限公司 一种多副本存储***的磁盘故障处理方法
CN107239383A (zh) * 2017-06-28 2017-10-10 郑州云海信息技术有限公司 一种OpenStack虚拟机的故障监控方法及装置
CN107682460A (zh) * 2017-11-21 2018-02-09 郑州云海信息技术有限公司 一种分布式存储集群数据通信方法及***
CN107832164A (zh) * 2017-11-20 2018-03-23 郑州云海信息技术有限公司 一种基于Ceph的故障硬盘处理的方法及装置

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
BR112016030547B1 (pt) * 2014-11-06 2022-11-16 Huawei Cloud Computing Technologies Co., Ltd Sistema e método de replicação e de armazenamento distribuído
CN106559441B (zh) * 2015-09-25 2020-09-04 华为技术有限公司 一种基于云计算服务的虚拟机监控方法、装置及***
CN105892950A (zh) * 2016-04-01 2016-08-24 浪潮电子信息产业股份有限公司 一种磁盘阵列的重建方法及***

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102164165A (zh) * 2011-02-18 2011-08-24 杭州宏杉科技有限公司 一种网络存储***的管理方法及装置
CN102385537A (zh) * 2011-10-25 2012-03-21 曙光信息产业(北京)有限公司 一种多副本存储***的磁盘故障处理方法
CN107239383A (zh) * 2017-06-28 2017-10-10 郑州云海信息技术有限公司 一种OpenStack虚拟机的故障监控方法及装置
CN107832164A (zh) * 2017-11-20 2018-03-23 郑州云海信息技术有限公司 一种基于Ceph的故障硬盘处理的方法及装置
CN107682460A (zh) * 2017-11-21 2018-02-09 郑州云海信息技术有限公司 一种分布式存储集群数据通信方法及***

Also Published As

Publication number Publication date
CN109144788A (zh) 2019-01-04

Similar Documents

Publication Publication Date Title
CN108234170B (zh) 一种服务器集群的监控方法和装置
CN105718570B (zh) 用于数据库的数据迁移方法和装置
CN111124850A (zh) Mqtt服务器性能测试方法、***、计算机设备及存储介质
CN107015872A (zh) 监控数据的处理方法及装置
CN109189680B (zh) 一种应用发布和配置的***及方法
CN109144789B (zh) 一种重启osd的方法、装置及***
CN110647460B (zh) 一种测试资源管理方法、装置和测试客户端
CN113312153B (zh) 一种集群部署方法、装置、电子设备及存储介质
CN111796959B (zh) 宿主机容器自愈方法、装置及***
CN109558260A (zh) Kubernetes故障排除***、方法、设备及介质
CN114064414A (zh) 一种高可用的集群状态监控方法及***
CN111339118A (zh) 基于Kubernetes的资源变更历史记录方法及装置
CN105354102B (zh) 一种文件***维护和修复的方法和装置
CN108733808B (zh) 大数据软件***切换方法、***、终端设备及存储介质
CN109144788B (zh) 一种重建osd的方法、装置及***
CN111506388B (zh) 容器性能探测方法、容器管理平台及计算机存储介质
US9898490B2 (en) Systems and methods for supporting multiple database server versions on a database machine
CN114816866A (zh) 故障处理方法、装置、电子设备和存储介质
CN114896128A (zh) 基于区块链的应用程序性能测试方法及装置
CN109921963B (zh) 一种网络状态巡检方法及***
CN110362464B (zh) 软件分析方法及设备
CN116582453B (zh) 一种多业务集群场景下的监控数据迁移方法和***
CN107832145B (zh) 一种基于虚拟机的***资源释放方法
JP2018077775A (ja) 制御装置および制御プログラム
CN113778842A (zh) 容错测试的方法、装置、电子设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant