CN107678918B - 一种分布式文件***的osd心跳机制设置方法及装置 - Google Patents

一种分布式文件***的osd心跳机制设置方法及装置 Download PDF

Info

Publication number
CN107678918B
CN107678918B CN201710881603.0A CN201710881603A CN107678918B CN 107678918 B CN107678918 B CN 107678918B CN 201710881603 A CN201710881603 A CN 201710881603A CN 107678918 B CN107678918 B CN 107678918B
Authority
CN
China
Prior art keywords
heartbeat
osd
node
message
file system
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710881603.0A
Other languages
English (en)
Other versions
CN107678918A (zh
Inventor
李彦博
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhengzhou Yunhai Information Technology Co Ltd
Original Assignee
Zhengzhou Yunhai Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhengzhou Yunhai Information Technology Co Ltd filed Critical Zhengzhou Yunhai Information Technology Co Ltd
Priority to CN201710881603.0A priority Critical patent/CN107678918B/zh
Publication of CN107678918A publication Critical patent/CN107678918A/zh
Application granted granted Critical
Publication of CN107678918B publication Critical patent/CN107678918B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3089Monitoring arrangements determined by the means or processing involved in sensing the monitored data, e.g. interfaces, connectors, sensors, probes, agents
    • G06F11/3096Monitoring arrangements determined by the means or processing involved in sensing the monitored data, e.g. interfaces, connectors, sensors, probes, agents wherein the means or processing minimize the use of computing system or of computing system component resources, e.g. non-intrusive monitoring which minimizes the probe effect: sniffing, intercepting, indirectly deriving the monitored data from other directly available data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3006Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system is distributed, e.g. networked systems, clusters, multiprocessor systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3089Monitoring arrangements determined by the means or processing involved in sensing the monitored data, e.g. interfaces, connectors, sensors, probes, agents
    • G06F11/3093Configuration details thereof, e.g. installation, enabling, spatial arrangement of the probes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/17Details of further file system functions
    • G06F16/1734Details of monitoring file system events, e.g. by the use of hooks, filter drivers, logs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/18File system types
    • G06F16/182Distributed file systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/10Active monitoring, e.g. heartbeat, ping or trace-route
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2201/00Indexing scheme relating to error detection, to error correction, and to monitoring
    • G06F2201/875Monitoring of systems including the internet

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Computing Systems (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • Cardiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Mathematical Physics (AREA)
  • Multi Processors (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种分布式文件***的OSD心跳机制设置方法、装置及计算机可读存储介质,该方法包括:第一节点按预设时间间隔根据自身所有OSD的状态信息,组装心跳消息,并将心跳消息发送到对应的接收节点上;每个接收节点根据接收的心跳消息,调用自身所有OSD的心跳处理函数,更新自身所有OSD各自保存的PG组信息中心跳消息对应的OSD的心跳相关信息;本发明通过第一节点按预设时间间隔根据自身所有OSD的状态信息,组装心跳消息,并将心跳消息发送到对应的接收节点上,可以在单进程模式下,利用节点与节点之间发送的包含节点上所有OSD的状态信息的心跳消息,减少OSD的心跳消息数量,减少***资源消耗,提升***稳定性。

Description

一种分布式文件***的OSD心跳机制设置方法及装置
技术领域
本发明涉及分布式文件***领域,特别涉及一种分布式文件***的OSD心跳机制设置方法、装置及计算机可读存储介质。
背景技术
随着现代社会科技的发展,分布式文件***的应用越来越受到人们的重视。分布式文件***运行过程中,需要对故障进行及时响应,所以就需要依靠OSD心跳机制来对***的健康状况进行检测。
现有技术中,OSD(Object-based Storage Device,对象存储设备)心跳机制是一组OSD之间互发消息来进行状态检测,OSD心跳机制的发送和接收可以如图1所示,一个PG(数据对象存储的集合)所在的OSD为一个心跳检测小组,组中各个节点之间互发心跳消息,随着集群规模增大,OSD所属的PG组数量增多,心跳的发送规模将成指数的增加,这样既消耗***资源,也容易因为***资源匮乏导致心跳超时,进而引发集群状态异常。因此,如何减少OSD的心跳消息数量,减少***资源消耗,提升***稳定性,是现今亟需解决的问题。
发明内容
本发明的目的是提供一种分布式文件***的OSD心跳机制设置方法、装置及计算机可读存储介质,以采用节点与节点之间发送心跳消息的方式,将心跳消息合并后进行发送和接收,极大降低心跳消息发送的数量,从而降低***资源消耗,提高***稳定性。
为解决上述技术问题,本发明提供一种分布式文件***的OSD心跳机制设置方法,包括:
第一节点按预设时间间隔根据自身所有OSD的状态信息,组装心跳消息,并将所述心跳消息发送到对应的接收节点上;
每个所述接收节点根据接收的所述心跳消息,调用自身所有OSD的心跳处理函数,更新自身所有OSD各自保存的PG组信息中所述心跳消息对应的OSD的心跳相关信息。
可选的,所述将所述心跳消息发送到对应的接收节点上,包括:
所述第一节点根据自身每个OSD保存的PG组信息中的其他OSD的信息,将所述心跳消息发送到所述其他OSD所在的所述接收节点上。
可选的,所述调用自身所有OSD的心跳处理函数,更新自身所有OSD各自保存的PG组信息中所述心跳消息对应的OSD的心跳相关信息之后,包括:
每个OSD的心跳处理函数提取所述心跳消息中的OSD的状态信息;
遍历自身保存的PG组信息,判断是否存在所述心跳消息中的OSD对应的OSD;
若是,则更新自身保存的PG组信息中所述心跳消息中的OSD对应的OSD的心跳相关信息。
可选的,每个所述接收节点所有OSD的心跳处理函数处理完成后,还包括:
每个所述接收节点组装心跳回复消息,并将所述心跳回复消息发送到所述第一节点;
所述第一节点根据接收的所述心跳回复消息,调用自身所有OSD的心跳回复处理函数,对所述心跳回复消息对应的自身的OSD进行心跳状态更新。
可选的,所述调用自身所有OSD的心跳回复处理函数,对所述心跳回复消息对应的自身的OSD进行心跳状态更新,包括:
每个OSD的心跳回复处理函数提取所述心跳回复消息中所需的回复消息,进行心跳状态更新。
本发明还提供了一种分布式文件***的OSD心跳机制设置装置,包括:
发送模块,用于按预设时间间隔根据自身所有OSD的状态信息,组装第一心跳消息,并将所述第一心跳消息发送到对应的节点上;
接收模块,用于根据接收的第二心跳消息,调用自身所有OSD的心跳处理函数,更新自身所有OSD各自保存的PG组信息中所述第二心跳消息对应的OSD的心跳相关信息。
可选的,所述发送模块,包括:
发送子模块,用于根据自身每个OSD保存的PG组信息中的其他OSD的信息,将所述第一心跳消息发送到所述其他OSD所在的节点上。
可选的,所述接收模块,包括:
心跳处理子模块,用于利用每个OSD的心跳处理函数提取所述第二心跳消息中的OSD的状态信息;遍历自身保存的PG组信息,判断是否存在所述第二心跳消息中的OSD对应的OSD;若是,则更新自身保存的PG组信息中所述第二心跳消息中的OSD对应的OSD的心跳相关信息。
可选的,该装置还包括:
第二发送模块,用于所有OSD的心跳处理函数处理完成后,组装第一心跳回复消息,并将所述第一心跳回复消息发送到所述心跳消息的发送节点;
第二接收模块,用于接收的第二心跳回复消息,调用自身所有OSD的心跳回复处理函数,对所述第二心跳回复消息对应的自身的OSD进行心跳状态更新;其中,所述第二心跳回复消息为所述其他OSD所在的节点发送的心跳回复消息。
此外,本发明还提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如上述任一项所述的分布式文件***的OSD心跳机制设置方法的步骤。
本发明所提供的一种分布式文件***的OSD心跳机制设置方法,包括:第一节点按预设时间间隔根据自身所有OSD的状态信息,组装心跳消息,并将心跳消息发送到对应的接收节点上;每个接收节点根据接收的心跳消息,调用自身所有OSD的心跳处理函数,更新自身所有OSD各自保存的PG组信息中心跳消息对应的OSD的心跳相关信息;
可见,本发明通过第一节点按预设时间间隔根据自身所有OSD的状态信息,组装心跳消息,并将心跳消息发送到对应的接收节点上,可以在单进程模式下,利用节点与节点之间发送心跳消息,心跳消息包含节点上所有OSD的状态信息,极大的减少OSD的心跳消息数量,减少了***资源消耗,提升了***稳定性。此外,本发明还提供了一种分布式文件***的OSD心跳机制设置装置及计算机可读存储介质,同样具有上述有益效果。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为现有技术中的OSD心跳机制的示意图;
图2为本发明实施例所提供的一种分布式文件***的OSD心跳机制设置方法的流程图;
图3为本发明实施例所提供的一种分布式文件***的OSD心跳机制设置方法的OSD心跳机制的示意图;
图4为本发明实施例所提供的一种分布式文件***的OSD心跳机制设置装置的结构图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参考图2,图2为本发明实施例所提供的一种分布式文件***的OSD心跳机制设置方法的流程图。该方法可以包括:
步骤101:第一节点按预设时间间隔根据自身所有OSD的状态信息,组装心跳消息,并将心跳消息发送到对应的接收节点上。
其中,第一节点可以为分布式文件***中的任意一个节点。对于执行本步骤的第一节点的选择,可以由设计人员根据实用场景和用户需求自行设置,如可以将分布式文件***中的每个节点均设置为第一节点。
具体的,本步骤可以为***启动时,第一节点的OSDmananger层开启定时器线程,遍历第一节点上所有OSD的状态信息,组装成心跳消息,然后将该心跳消息发送到对应的接收节点上。
可以理解的是,本步骤中的接收节点的设置可以由设计人员根据实用场景和用户需求自行设置,如可以为分布式文件***中包括第一节点的全部节点,也可以为第一节点的自身每个OSD保存的PG组信息中的其他OSD所在的节点。只要接收节点可以包括第一节点的自身每个OSD保存的PG组信息中的其他OSD所在的节点,对于接收节点的具体设置,可以由设计人员自行设置,本实施例对此不做任何限制。
对应的,本步骤中将心跳消息发送到对应的接收节点上的过程,可以为:第一节点根据自身每个OSD保存的PG组信息中的其他OSD的信息,将心跳消息发送到其他OSD所在的接收节点上。
需要说明的是,本步骤中的接收节点中可以包括第一节点,如图1所示的OSD心跳机制中的PG组,可以通过图3所示的OSD心跳机制,由第一节点(节点1)将心跳消息发送到接收节点(节点1和节点2)。
步骤102:每个接收节点根据接收的心跳消息,调用自身所有OSD的心跳处理函数,更新自身所有OSD各自保存的PG组信息中心跳消息对应的OSD的心跳相关信息。
其中,每个接收节点调用自身所有OSD的心跳处理函数,更新自身所有OSD各自保存的PG组信息中心跳消息对应的OSD的心跳相关信息的方式,可以为逐一调用自身所有OSD的心跳处理函数;也可以为同时调用自身所有OSD的心跳处理函数,也就是同步进行更新自身所有OSD各自保存的PG组信息中心跳消息对应的OSD的心跳相关信息。本实施例对此不做任何限制。
具体的,本步骤中每个接收节点调用自身所有OSD的心跳处理函数,更新自身所有OSD各自保存的PG组信息中心跳消息对应的OSD的心跳相关信息的具体过程,可以为每个OSD的心跳处理函数提取心跳消息中的OSD状态信息,然后遍历自身保存的PG组信息,在这个PG组中,更新心跳相关信息。如每个OSD的心跳处理函数提取心跳消息中的OSD的状态信息;遍历自身保存的PG组信息,判断是否存在心跳消息中的OSD对应的OSD;若是,则更新自身保存的PG组信息中心跳消息中的OSD对应的OSD的心跳相关信息。
可以理解的是,与现有的OSD心跳机制相对应的,本步骤之后还可以包括每个接收节点在所有OSD的心跳处理函数处理完成后,组装心跳回复消息,并将心跳回复消息发送到第一节点的步骤。
对应的,第一节点可以根据接收的心跳回复消息,调用自身所有OSD的心跳回复处理函数,对心跳回复消息对应的自身的OSD进行心跳状态更新。
需要说明的是,心跳回复消息可以为第一节点发送的心跳消息对应的回复消息,只要第一节点可以根据心跳回复消息,对心跳回复消息对应的自身的OSD进行心跳状态更新,对于心跳回复消息的具体内容,本实施例对此不做任何限制。
可以理解的是,当接收节点为第一节点的自身每个OSD保存的PG组信息中的其他OSD所在的节点时,每个接收节点均可以向第一节点发送心跳回复消息;当接收节点为全部节点时,第一节点的自身每个OSD保存的PG组信息中的其他OSD所在的节点之外的其他接收节点,可以不向第一节点发送心跳回复消息,减少第一节点的心跳回复处理函数的工作量。本实施例对此不做任何限制。
本实施例中,本发明实施例通过第一节点按预设时间间隔根据自身所有OSD的状态信息,组装心跳消息,并将心跳消息发送到对应的接收节点上,可以在单进程模式下,利用节点与节点之间发送心跳消息,心跳消息包含节点上所有OSD的状态信息,极大的减少OSD的心跳消息数量,减少了***资源消耗,提升了***稳定性。
请参考图4,图4为本发明实施例所提供的一种分布式文件***的OSD心跳机制设置装置的结构图。该装置可以包括:
发送模块100,用于按预设时间间隔根据自身所有OSD的状态信息,组装第一心跳消息,并将第一心跳消息发送到对应的节点上;
接收模块200,用于根据接收的第二心跳消息,调用自身所有OSD的心跳处理函数,更新自身所有OSD各自保存的PG组信息中第二心跳消息对应的OSD的心跳相关信息。
可选的,发送模块100,可以包括:
发送子模块,用于根据自身每个OSD保存的PG组信息中的其他OSD的信息,将第一心跳消息发送到其他OSD所在的节点上。
可选的,接收模块200,可以包括:
心跳处理子模块,用于利用每个OSD的心跳处理函数提取第二心跳消息中的OSD的状态信息;遍历自身保存的PG组信息,判断是否存在第二心跳消息中的OSD对应的OSD;若是,则更新自身保存的PG组信息中第二心跳消息中的OSD对应的OSD的心跳相关信息。
可选的,该装置还可以包括:
第二发送模块,用于所有OSD的心跳处理函数处理完成后,组装第一心跳回复消息,并将第一心跳回复消息发送到心跳消息的发送节点;
第二接收模块,用于接收的第二心跳回复消息,调用自身所有OSD的心跳回复处理函数,对第二心跳回复消息对应的自身的OSD进行心跳状态更新;其中,第二心跳回复消息为其他OSD所在的节点发送的心跳回复消息。
可选的,第二接收模块,可以包括:
心跳回复处理子模块,用于利用每个OSD的心跳回复处理函数提取第二心跳回复消息中所需的回复消息,进行心跳状态更新。
可以理解的是,本实施例是以分布式文件***中的一个节点为例进行的展示,其中,若该节点的发送模块100将第一心跳消息发送到该节点时,也就是,该节点自身每个OSD保存的PG组信息中的其他OSD中存在该节点的OSD,则该节点的接收模块200,可以用于根据接收的第一心跳消息,调用自身所有OSD的心跳处理函数,更新自身所有OSD各自保存的PG组信息中第一心跳消息对应的OSD的心跳相关信息。也就是说,本实施例中的第二心跳消息可以包括第一心跳消息。
本实施例中,本发明实施例通过发送模块100按预设时间间隔根据自身所有OSD的状态信息,组装第一心跳消息,并将第一心跳消息发送到对应的节点上,可以在单进程模式下,利用节点与节点之间发送心跳消息,心跳消息包含节点上所有OSD的状态信息,极大的减少OSD的心跳消息数量,减少了***资源消耗,提升了***稳定性。
本发明实施例还提供了一种计算机可读存储介质,其上存有计算机程序,该计算机程序被执行时可以实现上述实施例所提供的分布式文件***的OSD心跳机制设置方法的步骤。该存储介质可以包括:U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置及计算机可读存储介质而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
以上对本发明所提供的分布式文件***的OSD心跳机制设置方法、装置及计算机可读存储介质进行了详细介绍。本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以对本发明进行若干改进和修饰,这些改进和修饰也落入本发明权利要求的保护范围内。

Claims (8)

1.一种分布式文件***的OSD心跳机制设置方法,其特征在于,包括:
第一节点按预设时间间隔根据自身所有OSD的状态信息,组装心跳消息,并将所述心跳消息发送到对应的接收节点上;所述接收节点包括所述分布式文件***中包含所述第一节点的全部节点;所述第一节点为所述分布式文件***中任意一个节点;
每个所述接收节点根据接收的所述心跳消息,调用自身所有OSD的心跳处理函数,更新自身所有OSD各自保存的PG组信息中所述心跳消息对应的OSD的心跳相关信息。
2.根据权利要求1所述的分布式文件***的OSD心跳机制设置方法,其特征在于,所述调用自身所有OSD的心跳处理函数,更新自身所有OSD各自保存的PG组信息中所述心跳消息对应的OSD的心跳相关信息,包括:
每个OSD的心跳处理函数提取所述心跳消息中的OSD的状态信息;
遍历自身保存的PG组信息,判断是否存在所述心跳消息中的OSD对应的OSD;
若是,则更新自身保存的PG组信息中所述心跳消息中的OSD对应的OSD的心跳相关信息。
3.根据权利要求2所述的分布式文件***的OSD心跳机制设置方法,其特征在于,每个所述接收节点所有OSD的心跳处理函数处理完成后,还包括:
每个所述接收节点组装心跳回复消息,并将所述心跳回复消息发送到所述第一节点;
所述第一节点根据接收的所述心跳回复消息,调用自身所有OSD的心跳回复处理函数,对所述心跳回复消息对应的自身的OSD进行心跳状态更新。
4.根据权利要求3所述的分布式文件***的OSD心跳机制设置方法,其特征在于,所述调用自身所有OSD的心跳回复处理函数,对所述心跳回复消息对应的自身的OSD进行心跳状态更新,包括:
每个OSD的心跳回复处理函数提取所述心跳回复消息中所需的回复消息,进行心跳状态更新。
5.一种分布式文件***的OSD心跳机制设置装置,其特征在于,应用于第一节点,包括:
发送模块,用于按预设时间间隔根据自身所有OSD的状态信息,组装第一心跳消息,并将所述第一心跳消息发送到对应的节点上;所述节点包括所述分布式文件***中的全部节点;所述第一节点为所述分布式文件***中任意一个节点;
接收模块,用于根据接收的第二心跳消息,调用自身所有OSD的心跳处理函数,更新自身所有OSD各自保存的PG组信息中所述第二心跳消息对应的OSD的心跳相关信息。
6.根据权利要求5所述的分布式文件***的OSD心跳机制设置装置,其特征在于,所述接收模块,包括:
心跳处理子模块,用于利用每个OSD的心跳处理函数提取所述第二心跳消息中的OSD的状态信息;遍历自身保存的PG组信息,判断是否存在所述第二心跳消息中的OSD对应的OSD;若是,则更新自身保存的PG组信息中所述第二心跳消息中的OSD对应的OSD的心跳相关信息。
7.根据权利要求6所述的分布式文件***的OSD心跳机制设置装置,其特征在于,还包括:
第二发送模块,用于所有OSD的心跳处理函数处理完成后,组装第一心跳回复消息,并将所述第一心跳回复消息发送到所述心跳消息的发送节点;
第二接收模块,用于接收第二心跳回复消息,调用自身所有OSD的心跳回复处理函数,对所述第二心跳回复消息对应的自身的OSD进行心跳状态更新;其中,所述第二心跳回复消息为其他OSD所在的节点发送的心跳回复消息。
8.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至4任一项所述的分布式文件***的OSD心跳机制设置方法的步骤。
CN201710881603.0A 2017-09-26 2017-09-26 一种分布式文件***的osd心跳机制设置方法及装置 Active CN107678918B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710881603.0A CN107678918B (zh) 2017-09-26 2017-09-26 一种分布式文件***的osd心跳机制设置方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710881603.0A CN107678918B (zh) 2017-09-26 2017-09-26 一种分布式文件***的osd心跳机制设置方法及装置

Publications (2)

Publication Number Publication Date
CN107678918A CN107678918A (zh) 2018-02-09
CN107678918B true CN107678918B (zh) 2021-06-29

Family

ID=61137254

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710881603.0A Active CN107678918B (zh) 2017-09-26 2017-09-26 一种分布式文件***的osd心跳机制设置方法及装置

Country Status (1)

Country Link
CN (1) CN107678918B (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108509157A (zh) * 2018-04-13 2018-09-07 郑州云海信息技术有限公司 一种应用于分布式文件***的数据均衡方法及装置
CN109669822B (zh) * 2018-11-28 2023-06-06 平安科技(深圳)有限公司 电子装置、备用存储池的创建方法和计算机可读存储介质
CN109857344B (zh) * 2019-01-30 2022-05-20 平安科技(深圳)有限公司 基于共享内存的心跳状态判断方法、装置和计算机设备
CN110457176B (zh) * 2019-07-12 2022-09-27 平安普惠企业管理有限公司 用于分布式***的监控方法、装置、存储介质及电子设备
CN111064613B (zh) * 2019-12-13 2022-03-22 新华三大数据技术有限公司 一种网络故障检测方法及装置
CN111506263B (zh) * 2020-03-31 2022-07-12 新华三技术有限公司成都分公司 一种心跳连接的建立方法及装置
CN113079065A (zh) * 2021-03-26 2021-07-06 山东英信计算机技术有限公司 基于Ambari的心跳检测方法、装置、设备及介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105553760A (zh) * 2015-12-11 2016-05-04 中国科学院信息工程研究所 一种基于心跳的软件模块故障处理方法及***
CN106062717A (zh) * 2014-11-06 2016-10-26 华为技术有限公司 一种分布式存储复制***和方法
CN106936662A (zh) * 2015-12-31 2017-07-07 杭州华为数字技术有限公司 一种实现心跳机制的方法、装置及***
CN107181637A (zh) * 2016-03-11 2017-09-19 华为技术有限公司 一种心跳信息发送方法、装置及心跳发送节点

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8949380B2 (en) * 2003-09-29 2015-02-03 Eqapez Foundation, L.L.C. Method and system for distributing images to client systems

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106062717A (zh) * 2014-11-06 2016-10-26 华为技术有限公司 一种分布式存储复制***和方法
CN105553760A (zh) * 2015-12-11 2016-05-04 中国科学院信息工程研究所 一种基于心跳的软件模块故障处理方法及***
CN106936662A (zh) * 2015-12-31 2017-07-07 杭州华为数字技术有限公司 一种实现心跳机制的方法、装置及***
CN107181637A (zh) * 2016-03-11 2017-09-19 华为技术有限公司 一种心跳信息发送方法、装置及心跳发送节点

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
"ceph存储 ceph集群osd故障自我检测";skdkjzz;《CSDN博客 公开网址:https://blog.csdn.net/skdkjzz/article/details/41980885?depth_1-utm_source=distribute.pc_relevant.none-task&utm_source=distribute.pc_relevant.none-task》;20141217;第1-6页 *

Also Published As

Publication number Publication date
CN107678918A (zh) 2018-02-09

Similar Documents

Publication Publication Date Title
CN107678918B (zh) 一种分布式文件***的osd心跳机制设置方法及装置
CN106155454B (zh) 一种界面显示方法、装置及电子设备
CN106569585B (zh) 一种管理应用程序进程的方法及终端
CN107562556B (zh) 故障的恢复方法、恢复装置及存储介质
CN106059825A (zh) 一种分布式***及配置方法
CN112260853B (zh) 容灾切换方法、装置、存储介质及电子设备
CN112597249B (zh) 一种业务数据的同步分发存储方法及***
CN110032451A (zh) 分布式多语言消息实现方法、装置及服务器
CN106331081B (zh) 一种信息同步方法及装置
CN111064626A (zh) 配置更新方法、装置、服务器及可读存储介质
CN110569135A (zh) 一种基于发布订阅模式的进程间通信方法及***
CN112583879B (zh) 请求的处理方法、装置及***、存储介质和电子设备
CN109669642B (zh) 存储***的节点加入方法、***、装置及可读存储介质
CN112044061A (zh) 游戏画面处理方法、装置、电子设备以及存储介质
CN112181724A (zh) 大数据容灾方法、装置和电子设备
US20170034005A1 (en) Flow Entry Management Method and Device
CN111638871A (zh) 一种设备信息处理方法、装置、设备、介质
CN105183288A (zh) 单窗口多任务显示方法及其智能移动终端
CN107562469B (zh) 一种标题栏数据展示方法及***
CN107479982B (zh) 一种数据同步的方法及终端
CN112087365A (zh) 应用于群组的即时通信方法、装置、电子设备及存储介质
CN111367932B (zh) 数据库表单变更通知方法、装置、计算机设备及存储介质
CN107623602B (zh) 一种自动化排查方法及***
CN107506491B (zh) 一种分布式文件***的osd数据分发方法及装置
CN107025096B (zh) 异步渲染模块的同步方法及***

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant