CN111901405A - 一种多节点监控方法、装置、电子设备及存储介质 - Google Patents

一种多节点监控方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN111901405A
CN111901405A CN202010706635.9A CN202010706635A CN111901405A CN 111901405 A CN111901405 A CN 111901405A CN 202010706635 A CN202010706635 A CN 202010706635A CN 111901405 A CN111901405 A CN 111901405A
Authority
CN
China
Prior art keywords
monitoring
monitoring data
data
node
host
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010706635.9A
Other languages
English (en)
Other versions
CN111901405B (zh
Inventor
郭健伟
季统凯
贺忠堂
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
G Cloud Technology Co Ltd
Original Assignee
G Cloud Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by G Cloud Technology Co Ltd filed Critical G Cloud Technology Co Ltd
Priority to CN202010706635.9A priority Critical patent/CN111901405B/zh
Publication of CN111901405A publication Critical patent/CN111901405A/zh
Priority to PCT/CN2021/073799 priority patent/WO2022016845A1/zh
Application granted granted Critical
Publication of CN111901405B publication Critical patent/CN111901405B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/1097Protocols in which an application is distributed across nodes in the network for distributed storage of data in networks, e.g. transport arrangements for network file system [NFS], storage area networks [SAN] or network attached storage [NAS]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/1001Protocols in which an application is distributed across nodes in the network for accessing one among a plurality of replicated servers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/1001Protocols in which an application is distributed across nodes in the network for accessing one among a plurality of replicated servers
    • H04L67/1004Server selection for load balancing
    • H04L67/101Server selection for load balancing based on network conditions
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/02Total factory control, e.g. smart factories, flexible manufacturing systems [FMS] or integrated manufacturing systems [IMS]

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本申请实施例公开了一种多节点监控方法、装置、电子设备及存储介质。本申请实施例提供的技术方案,通过各个宿主机分别根据预先配置的公共资源监控项和监控权重启动采集对应公共资源的监控数据,并提取各个宿主机与监控数据存储节点的网络延迟数据,根据网络延迟数据和监控权重使用预定义的可靠性计算公式计算各个宿主机采集的各个监控数据的可靠性数值,最终筛选可靠性数值最高的监控数据并存储于所述监控数据存储节点。采用上述技术手段,通过筛选可靠性数值最高的监控数据并存储,可以保障监控数据获取存储的高可靠性,减少云计算平台的***开销。并通过筛选监控数据存储,可以避免监控数据的重复获取存储,进而减少数据库存储资源的占用。

Description

一种多节点监控方法、装置、电子设备及存储介质
技术领域
本申请实施例涉及云计算监控技术领域,尤其涉及一种多节点监控方法、装置、电子设备及存储介质。
背景技术
云计算平台作为新兴的商业计算模型,其通常由多个计算节点(即宿主机)构成,并通过多个计算节点对平台生成的资源进行管理和监控。云计算平台在进行监控时,一般是利用宿主机对宿主机上的资源进行相关数据的获取,并且存储到相应的数据库当中,以此来实现云计算平台的监控。
但是,因为宿主机有多个,而云计算平台中,有很多的资源是共享的,即不同的宿主机会共用相同的资源。因此在获取存储资源时,云计算平台的各个宿主机会重复获取该公用的资源,并存储。重复获取、重复存储相同的监控数据会增大监控数据的存储体积,占用数据库的存储资源。
发明内容
本申请实施例提供一种多节点监控方法、装置、电子设备及存储介质,能够避免监控数据重复获取存储,减少数据库存储资源的占用。
在第一方面,本申请实施例提供了一种多节点监控方法,包括:
各个宿主机分别根据预先配置的公共资源监控项和监控权重启动采集对应公共资源的监控数据,所述监控权重用于调整所述监控数据的采集频率和采集时间点;
提取各个所述宿主机与监控数据存储节点的网络延迟数据,根据所述网络延迟数据和所述监控权重使用预定义的可靠性计算公式计算各个所述宿主机采集的各个所述监控数据的可靠性数值;
筛选所述可靠性数值最高的所述监控数据并存储于所述监控数据存储节点。
进一步的,各个宿主机分别根据预先配置的公共资源监控项和监控权重启动采集对应公共资源的监控数据,包括:
各个所述宿主机根据所述采集频率和所述采集时间点采集对应公共资源的初始数据,基于所述初始数据的采集频次和数据量计算平均值,以所述平均值作为所述监控数据。
进一步的,筛选所述可靠性数值最高的所述监控数据并存储于所述监控数据存储节点,包括:
将所述可靠性数值最高的所述监控数据的数据值、数据采集时间、对应的公共资源监控项名称及数据获取对象存储于所述监控数据存储节点。
进一步的,所述监控数据存储节点为时序型数据库。
进一步的,在筛选所述可靠性数值最高的所述监控数据并存储于所述监控数据存储节点之后,还包括:
以所述可靠性数值最高的所述监控数据所对应的所述宿主机作为监控节点,设定时段内保持所述监控节点采集对应公共资源的监控数据,并停止其余的所述宿主机采集对应公共资源的监控数据。
进一步的,在以所述可靠性数值最高的所述监控数据所对应的所述宿主机作为监控节点,设定时段内保持所述监控节点采集对应公共资源的监控数据,并停止其余的所述宿主机采集对应公共资源的监控数据之后,还包括:
设定时间段之后,重新计算各个所述宿主机采集对应公共资源监控数据的所述可靠性数值,并根据重新计算的所述可靠性数值重新确定所述监控节点。
进一步的,在各个宿主机分别根据预先配置的公共资源监控项和监控权重启动采集对应公共资源的监控数据之前,还包括:
各个所述宿主机根据用户定义或随机设置对应公共资源的所述监控权重。
在第二方面,本申请实施例提供了一种多节点监控装置,包括:
采集模块,用于通过各个宿主机分别根据预先配置的公共资源监控项和监控权重启动采集对应公共资源的监控数据,所述监控权重用于调整所述监控数据的采集频率和采集时间点;
计算模块,用于提取各个所述宿主机与监控数据存储节点的网络延迟数据,根据所述网络延迟数据和所述监控权重使用预定义的可靠性计算公式计算各个所述宿主机采集的各个所述监控数据的可靠性数值;
筛选模块,用于筛选所述可靠性数值最高的所述监控数据并存储于所述监控数据存储节点。
在第三方面,本申请实施例提供了一种电子设备,包括:
存储器以及一个或多个处理器;
所述存储器,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如第一方面所述的多节点监控方法。
在第四方面,本申请实施例提供了一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行如第一方面所述的多节点监控方法。
本申请实施例通过各个宿主机分别根据预先配置的公共资源监控项和监控权重启动采集对应公共资源的监控数据,并提取各个宿主机与监控数据存储节点的网络延迟数据,根据网络延迟数据和监控权重使用预定义的可靠性计算公式计算各个宿主机采集的各个监控数据的可靠性数值,最终筛选可靠性数值最高的监控数据并存储于所述监控数据存储节点。采用上述技术手段,通过筛选可靠性数值最高的监控数据并存储,可以保障监控数据获取存储的高可靠性,减少云计算平台的***开销。并通过筛选监控数据存储,可以避免监控数据的重复获取存储,进而减少数据库存储资源的占用。
附图说明
图1是本申请实施例一提供的一种多节点监控方法的流程图;
图2是本申请实施例一中云计算平台的结构示意图;
图3是本申请实施例二提供的一种多节点监控装置的结构示意图;
图4是本申请实施例三提供的一种电子设备的结构示意图。
具体实施方式
为了使本申请的目的、技术方案和优点更加清楚,下面结合附图对本申请具体实施例作进一步的详细描述。可以理解的是,此处所描述的具体实施例仅仅用于解释本申请,而非对本申请的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本申请相关的部分而非全部内容。在更加详细地讨论示例性实施例之前应当提到的是,一些示例性实施例被描述成作为流程图描绘的处理或方法。虽然流程图将各项操作(或步骤)描述成顺序的处理,但是其中的许多操作可以被并行地、并发地或者同时实施。此外,各项操作的顺序可以被重新安排。当其操作完成时所述处理可以被终止,但是还可以具有未包括在附图中的附加步骤。所述处理可以对应于方法、函数、规程、子例程、子程序等等。
本申请提供的多节点监控方法,旨在通过计算各个宿主机(即计算节点)所采集的监控数据的可靠性数值,基于可靠性数值选择一宿主机采集的监控数据进行存储,以此来避免监控数据重复获取存储,减少数据库存储资源的占用。相对于传统的云计算平台,其一般由多个计算节点或者说是多个宿主机进行业务的处理,云计算监控基于这种结构进行对资源的监测。而云计算高度调度,统领管理各种资源,共享各种资源,不可以避免的在监控的时候对公用资源进行监控,这种情况下会造成不同的宿主机重复获取公用资源的监控数据。其中,数据的重复存储容易造成数据体积过于庞大,特别是云计算平台存在特别多的宿主机的情况下,会导致监控数据存储节点的数据存储量过大。而各个宿主机获取相同监控数据的时候,所有的宿主机也需要对监控该数据使用额外的存储开销。基于此,提供本申请实施例的一种多节点监控方法,以解决现有云计算平台监控数据重复存储,存储资源过度占用的技术问题。
实施例一:
图1给出了本申请实施例一提供的一种多节点监控方法的流程图,本实施例中提供的多节点监控方法可以由多节点监控设备执行,该多节点监控设备可以通过软件和/或硬件的方式实现,该多节点监控设备可以是两个或多个物理实体构成,也可以是一个物理实体构成。一般而言,该多节点监控设备为云计算平台。
下述以该云计算平台为执行多节点监控方法的主体为例,进行描述。参照图1,该多节点监控方法具体包括:
S110、各个宿主机分别根据预先配置的公共资源监控项和监控权重启动采集对应公共资源的监控数据,所述监控权重用于调整所述监控数据的采集频率和采集时间点。
云计算平台在运行过程中,对各类资源进行监控。其中,对于公共资源的监控,由各个宿主机预先配置的公共资源监控项对应进行监控。参照图2,提供云计算平台的结构示意图。云计算平台将各个宿主机11与中心管理节点12连接,用于进行相关参数的配置。并通过宿主机11连接监控数据存储节点13,已将宿主机11采集的监控数据存储于该监控数据存储节点13。具体的,在对公共资源进行监控之前,需要预先在各个宿主机上配置好公用资源监控项,公共资源监控项指示了宿主机需要监控的公共资源,根据该公共资源监控项,宿主机对应进行公共资源的监控数据采集。需要说明的是,对于不同的宿主机,其配置的公共资源监控项可以相同,也可以不同。对于一个宿主机,其公共资源监控项通常有多个。一般而言,根据实际监控需要,为一个公共资源监控项配置相应数量的宿主机。后续在对应公共资源的监控时,则由配置了该公共资源监控项的各个宿主机进行监控数据的采集。
另一方面,在各个宿主机上,为不同公共资源监控项配置监控权重,监控权重表示宿主机用于监控对应公共资源所付出的***开销。具体的,各个所述宿主机根据用户定义或随机设置对应公共资源的所述监控权重。可以理解的是,对应同一宿主机上配置的不同公共资源监控项,其配置的监控权重可以相同,也可以不同。需要说明的是,上述公共资源监控项和监控权重的配置,可以由用户通过与该中心管理节点进行交互,配置各个宿主机的公共资源监控项和对应的监控权重,中心管理节点根据用户的配置操作,下发相应的配置信息至各个宿主机以进行公共资源监控项和监控权重的配置。此外,用户也可以直接在宿主机上进行资源监控项和对应监控权重的配置。需要说明的是,如若某一公共资源监控项未配置宿主机进行监控,则随机为该公共资源监控项配置宿主机,并且,其监控权重也对应随机设置。
进一步的,各个宿主机根据预先配置对应公共资源监控项的监控权重,调整对应公共资源的监控数据的采集频率和采集时间点。其中,采集频率表示单位时间内采集监控数据的频次,采集时间点表示采集监控数据的时间戳。在此之后,在进行对应公共资源的监控数据采集时,基于该采集频率和采集时间点进行监控数据的采集。
在一个实施例中,各个所述宿主机根据所述采集频率和所述采集时间点采集对应公共资源的初始数据,基于所述初始数据的采集频次和数据量计算平均值,以所述平均值作为所述监控数据。举例而言,在监控Ceph(分布式文件***)时,要获取Ceph的读写速率(即监控数据)。Ceph的读写速率可以理解为在1分钟内Ceph的平均数据读写量。那么根据监控权重调整采集频率和采集时间点后,如若监控权重为1,则宿主机在1分钟内只采集1次Ceph的读写量,然后去平均值;如若监控权重为设置为10,则宿主机在1分钟内收采集10次Ceph的读写量,然后去平均值。最终以得到的平均值作为监控数据,这样可以体现监控数据的广泛性和可代表性,使数据更具可靠性。需要说明的是,本申请实施例中,对应任一公共资源一分钟内的监控数据采集,其监控权重一般取值为1-60。例如,监控权重为30,则采集频率为60/30,即2S采集一次监控数据。采集时间点可以为0S、2S、4S...,依次类推,以此来完成对应监控数据的采集。
S120、提取各个所述宿主机与监控数据存储节点的网络延迟数据,根据所述网络延迟数据和所述监控权重使用预定义的可靠性计算公式计算各个所述宿主机采集的各个所述监控数据的可靠性数值。
由于一个公共资源有多个宿主机进行监控数据的采集,对于同一公共资源,为了避免监控数据的重复存储,本申请实施例通过筛选可靠性最高的监控数据进行存储,以此来节省***开销。其中,根据各个宿主机与监控数据存储节点的网络连通性,以及各个宿主机对该公共资源的监控权重来确定各个宿主机采集的监控数据的可靠性。本申请实施例中,使用网络延迟数据来表示各个宿主机与监控数据存储节点的网络连通性。可以理解的是,宿主机与监控数据存储节点的网络连通性越好,则其网络延迟数据的值越小。
具体的,使用预定义的可靠性计算公式计算各个宿主机采集的监控数据的可靠性数值。以可靠性数值表示各个监控数据的可靠性。可以理解的是,可靠性数值越高,则监控数据的可靠性就越高。其中,可靠性计算公式为:
h=(w*0.3*0.01)+(100/g*0.7)*100
其中,h为可靠性数值,w为监控权重,取值1-60,g为网络延迟数据。0.3和0.7表示网络连通性和监控权重影响可靠性数值的占比,其根据实测数据定义。需要说明的是,对应可靠性数值的印象,网络连通性占7成,因为相比监控权重,宿主机与监控数据存储节点的网络连通性更加符合***开销来源。而由于监控权重是人为设定或随机设定的,其客观性相对较低,因此分别设置0.3和0.7表示网络连通性和监控权重影响可靠性数值的占比。此外,由于网络延迟与网络连通性成反比,因此不同于上述可靠性计算公式中的监控权重计算方式,使用“(100/g*0.7)*100”来计算该部分的可靠性数值。需要说明的是,上述可靠性计算公式仅为本申请实施例计算监控数据可靠性数值的一种形式,实际应用中,根据可靠性数值计算需求,还可以预先定义其他计算公式进行可靠性数值的计算。另一方面,网络延迟数据g使用的单位为“毫秒”,并且,在提取网络延迟数据时,只需要提取其数值代入公式,无需使用其单位。
进一步的,基于上述可靠性计算公式,提取各个宿主机与监控数据存储节点的网络延迟数据,以及对应监控数据的监控权重,将其代入上述可靠性计算公式,计算得到对应各个宿主机采集监控数据的可靠性数值。
S130、筛选所述可靠性数值最高的所述监控数据并存储于所述监控数据存储节点。
最终,基于上述可靠性计算公式计算得到的各个宿主机监控数据的可靠性数值,即可通过比对各个可靠性数值的大小,筛选出可靠性数值最大的监控数据进程存储。其中,在存储可靠性数值最大的监控数据时,将所述可靠性数值最高的所述监控数据的数据值、数据采集时间、对应的公共资源监控项名称及数据获取对象存储于所述监控数据存储节点。
进一步的,本申请实施例中,监控数据存储节点可以是关系型数据库或是时序型数据库。由于从处理效率而言,存储监控数据的***开销是最耗时的,若是利用关系型的数据库,时间的获取在程序当中会消耗一部分的资源,而且关系型的数据库无法满足大量数据的处理。而利用时序型数据库influxdb能够解决时间消耗的部分资源,时序型数据库influxdb能够自行对***的数据进行时间的获取,并且能够满足大量数据的同时处理。因此,本申请实施例的监控数据存储节点优选为时序型数据库。
进一步的,在确定可靠性数值最高的监控数据之后,本申请实施例还以所述可靠性数值最高的所述监控数据所对应的所述宿主机作为监控节点,设定时段内保持所述监控节点采集对应公共资源的监控数据,并停止其余的所述宿主机采集对应公共资源的监控数据。进一步的,设定时间段之后,重新计算各个所述宿主机采集对应公共资源监控数据的所述可靠性数值,并根据重新计算的所述可靠性数值重新确定所述监控节点。
举例而言,以10分钟为一个设定时段,在每10分钟的一个周期内进行公共资源监控时,在这一个周期的第一次监控数据采集时(如第一分钟的监控数据采集),各个宿主机均先根据公共资源监控项和对应的监控权重采集监控数据,进一步对应每一个公共资源,均通过比对各个宿主机采集的监控数据的可靠性数值,确定可靠性数值最高的监控数据,将这一监控数据存储与监控数据存储节点。并且以该监控数据所对应的宿主机为监控节点,在这一个周期内接下来对应公共资源的监控数据采集时,均由该监控节点进行采集并存储。以此类推,每10分钟的一个周期均循环上述确定监控节点,并由监控节点采集存储监控数据的流程,其余宿主机暂停对应公共资源的监控数据采集,以此来节省计算云平台的***开销。
上述,通过各个宿主机分别根据预先配置的公共资源监控项和监控权重启动采集对应公共资源的监控数据,并提取各个宿主机与监控数据存储节点的网络延迟数据,根据网络延迟数据和监控权重使用预定义的可靠性计算公式计算各个宿主机采集的各个监控数据的可靠性数值,最终筛选可靠性数值最高的监控数据并存储于所述监控数据存储节点。采用上述技术手段,通过筛选可靠性数值最高的监控数据并存储,可以保障监控数据获取存储的高可靠性,减少云计算平台的***开销。并通过筛选监控数据存储,可以避免监控数据的重复获取存储,进而减少数据库存储资源的占用。
实施例二:
在上述实施例的基础上,图3为本申请实施例二提供的一种多节点监控装置的结构示意图。参考图3,本实施例提供的多节点监控装置具体包括:采集模块21、计算模块22和筛选模块23。
其中,采集模块21用于通过各个宿主机分别根据预先配置的公共资源监控项和监控权重启动采集对应公共资源的监控数据,所述监控权重用于调整所述监控数据的采集频率和采集时间点;
计算模块22用于提取各个所述宿主机与监控数据存储节点的网络延迟数据,根据所述网络延迟数据和所述监控权重使用预定义的可靠性计算公式计算各个所述宿主机采集的各个所述监控数据的可靠性数值;
筛选模块23用于筛选所述可靠性数值最高的所述监控数据并存储于所述监控数据存储节点。
上述,通过各个宿主机分别根据预先配置的公共资源监控项和监控权重启动采集对应公共资源的监控数据,并提取各个宿主机与监控数据存储节点的网络延迟数据,根据网络延迟数据和监控权重使用预定义的可靠性计算公式计算各个宿主机采集的各个监控数据的可靠性数值,最终筛选可靠性数值最高的监控数据并存储于所述监控数据存储节点。采用上述技术手段,通过筛选可靠性数值最高的监控数据并存储,可以保障监控数据获取存储的高可靠性,减少云计算平台的***开销。并通过筛选监控数据存储,可以避免监控数据的重复获取存储,进而减少数据库存储资源的占用。
本申请实施例二提供的多节点监控装置可以用于执行上述实施例一提供的多节点监控方法,具备相应的功能和有益效果。
实施例三:
本申请实施例三提供了一种电子设备,参照图4,该电子设备包括:处理器31、存储器32、通信模块33、输入装置34及输出装置35。该电子设备中处理器的数量可以是一个或者多个,该电子设备中的存储器的数量可以是一个或者多个。该电子设备的处理器、存储器、通信模块、输入装置及输出装置可以通过总线或者其他方式连接。
存储器32作为一种计算机可读存储介质,可用于存储软件程序、计算机可执行程序以及模块,如本申请任意实施例所述的多节点监控方法对应的程序指令/模块(例如,多节点监控装置中的采集模块、计算模块和筛选模块)。存储器可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作***、至少一个功能所需的应用程序;存储数据区可存储根据设备的使用所创建的数据等。此外,存储器可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实例中,存储器可进一步包括相对于处理器远程设置的存储器,这些远程存储器可以通过网络连接至设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
通信模块33用于进行数据传输。
处理器31通过运行存储在存储器中的软件程序、指令以及模块,从而执行设备的各种功能应用以及数据处理,即实现上述的多节点监控方法。
输入装置34可用于接收输入的数字或字符信息,以及产生与设备的用户设置以及功能控制有关的键信号输入。输出装置35可包括显示屏等显示设备。
上述提供的电子设备可用于执行上述实施例一提供的多节点监控方法,具备相应的功能和有益效果。
实施例四:
本申请实施例还提供一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行一种多节点监控方法,该多节点监控方法包括:各个宿主机分别根据预先配置的公共资源监控项和监控权重启动采集对应公共资源的监控数据,所述监控权重用于调整所述监控数据的采集频率和采集时间点;提取各个所述宿主机与监控数据存储节点的网络延迟数据,根据所述网络延迟数据和所述监控权重使用预定义的可靠性计算公式计算各个所述宿主机采集的各个所述监控数据的可靠性数值;筛选所述可靠性数值最高的所述监控数据并存储于所述监控数据存储节点。
存储介质——任何的各种类型的存储器设备或存储设备。术语“存储介质”旨在包括:安装介质,例如CD-ROM、软盘或磁带装置;计算机***存储器或随机存取存储器,诸如DRAM、DDR RAM、SRAM、EDO RAM,兰巴斯(Rambus)RAM等;非易失性存储器,诸如闪存、磁介质(例如硬盘或光存储);寄存器或其它相似类型的存储器元件等。存储介质可以还包括其它类型的存储器或其组合。另外,存储介质可以位于程序在其中被执行的第一计算机***中,或者可以位于不同的第二计算机***中,第二计算机***通过网络(诸如因特网)连接到第一计算机***。第二计算机***可以提供程序指令给第一计算机用于执行。术语“存储介质”可以包括驻留在不同位置中(例如在通过网络连接的不同计算机***中)的两个或更多存储介质。存储介质可以存储可由一个或多个处理器执行的程序指令(例如具体实现为计算机程序)。
当然,本申请实施例所提供的一种包含计算机可执行指令的存储介质,其计算机可执行指令不限于如上所述的多节点监控方法,还可以执行本申请任意实施例所提供的多节点监控方法中的相关操作。
上述实施例中提供的多节点监控装置、存储介质及电子设备可执行本申请任意实施例所提供的多节点监控方法,未在上述实施例中详尽描述的技术细节,可参见本申请任意实施例所提供的多节点监控方法。
上述仅为本申请的较佳实施例及所运用的技术原理。本申请不限于这里所述的特定实施例,对本领域技术人员来说能够进行的各种明显变化、重新调整及替代均不会脱离本申请的保护范围。因此,虽然通过以上实施例对本申请进行了较为详细的说明,但是本申请不仅仅限于以上实施例,在不脱离本申请构思的情况下,还可以包括更多其他等效实施例,而本申请的范围由权利要求的范围决定。

Claims (10)

1.一种多节点监控方法,其特征在于,包括:
各个宿主机分别根据预先配置的公共资源监控项和监控权重启动采集对应公共资源的监控数据,所述监控权重用于调整所述监控数据的采集频率和采集时间点;
提取各个所述宿主机与监控数据存储节点的网络延迟数据,根据所述网络延迟数据和所述监控权重使用预定义的可靠性计算公式计算各个所述宿主机采集的各个所述监控数据的可靠性数值;
筛选所述可靠性数值最高的所述监控数据并存储于所述监控数据存储节点。
2.根据权利要求1所述的多节点监控方法,其特征在于,各个宿主机分别根据预先配置的公共资源监控项和监控权重启动采集对应公共资源的监控数据,包括:
各个所述宿主机根据所述采集频率和所述采集时间点采集对应公共资源的初始数据,基于所述初始数据的采集频次和数据量计算平均值,以所述平均值作为所述监控数据。
3.根据权利要求1所述的多节点监控方法,其特征在于,筛选所述可靠性数值最高的所述监控数据并存储于所述监控数据存储节点,包括:
将所述可靠性数值最高的所述监控数据的数据值、数据采集时间、对应的公共资源监控项名称及数据获取对象存储于所述监控数据存储节点。
4.根据权利要求3所述的多节点监控方法,其特征在于,所述监控数据存储节点为时序型数据库。
5.根据权利要求1所述的多节点监控方法,其特征在于,在筛选所述可靠性数值最高的所述监控数据并存储于所述监控数据存储节点之后,还包括:
以所述可靠性数值最高的所述监控数据所对应的所述宿主机作为监控节点,设定时段内保持所述监控节点采集对应公共资源的监控数据,并停止其余的所述宿主机采集对应公共资源的监控数据。
6.根据权利要求5所述的多节点监控方法,其特征在于,在以所述可靠性数值最高的所述监控数据所对应的所述宿主机作为监控节点,设定时段内保持所述监控节点采集对应公共资源的监控数据,并停止其余的所述宿主机采集对应公共资源的监控数据之后,还包括:
设定时间段之后,重新计算各个所述宿主机采集对应公共资源监控数据的所述可靠性数值,并根据重新计算的所述可靠性数值重新确定所述监控节点。
7.根据权利要求1所述的多节点监控方法,其特征在于,在各个宿主机分别根据预先配置的公共资源监控项和监控权重启动采集对应公共资源的监控数据之前,还包括:
各个所述宿主机根据用户定义或随机设置对应公共资源的所述监控权重。
8.一种多节点监控装置,其特征在于,包括:
采集模块,用于通过各个宿主机分别根据预先配置的公共资源监控项和监控权重启动采集对应公共资源的监控数据,所述监控权重用于调整所述监控数据的采集频率和采集时间点;
计算模块,用于提取各个所述宿主机与监控数据存储节点的网络延迟数据,根据所述网络延迟数据和所述监控权重使用预定义的可靠性计算公式计算各个所述宿主机采集的各个所述监控数据的可靠性数值;
筛选模块,用于筛选所述可靠性数值最高的所述监控数据并存储于所述监控数据存储节点。
9.一种电子设备,其特征在于,包括:
存储器以及一个或多个处理器;
所述存储器,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-7任一所述的多节点监控方法。
10.一种包含计算机可执行指令的存储介质,其特征在于,所述计算机可执行指令在由计算机处理器执行时用于执行如权利要求1-7任一所述的多节点监控方法。
CN202010706635.9A 2020-07-21 2020-07-21 一种多节点监控方法、装置、电子设备及存储介质 Active CN111901405B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202010706635.9A CN111901405B (zh) 2020-07-21 2020-07-21 一种多节点监控方法、装置、电子设备及存储介质
PCT/CN2021/073799 WO2022016845A1 (zh) 2020-07-21 2021-01-26 一种多节点监控方法、装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010706635.9A CN111901405B (zh) 2020-07-21 2020-07-21 一种多节点监控方法、装置、电子设备及存储介质

Publications (2)

Publication Number Publication Date
CN111901405A true CN111901405A (zh) 2020-11-06
CN111901405B CN111901405B (zh) 2023-05-05

Family

ID=73190386

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010706635.9A Active CN111901405B (zh) 2020-07-21 2020-07-21 一种多节点监控方法、装置、电子设备及存储介质

Country Status (2)

Country Link
CN (1) CN111901405B (zh)
WO (1) WO2022016845A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022016845A1 (zh) * 2020-07-21 2022-01-27 国云科技股份有限公司 一种多节点监控方法、装置、电子设备及存储介质

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115473834B (zh) * 2022-09-14 2024-04-02 中国电信股份有限公司 监控任务调度方法和***
CN115685817B (zh) * 2022-10-17 2024-07-05 南京邮电大学 Can网络多节点通信时数据并发的处理方法、装置及介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102761454A (zh) * 2011-04-28 2012-10-31 中兴通讯股份有限公司 一种物联网监控方法及***
US20170155560A1 (en) * 2015-12-01 2017-06-01 Quanta Computer Inc. Management systems for managing resources of servers and management methods thereof
CN109062699A (zh) * 2018-08-15 2018-12-21 郑州云海信息技术有限公司 一种资源监控方法、装置、服务器及存储介质
CN109688106A (zh) * 2018-11-19 2019-04-26 中国科学院信息工程研究所 一种数据协同采集方法及***
CN109714402A (zh) * 2018-12-12 2019-05-03 胡书恺 一种冗余数据采集***及其运行使用方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104917836A (zh) * 2015-06-10 2015-09-16 北京奇虎科技有限公司 基于集群监控分析计算设备可用性的方法及装置
CN107844402A (zh) * 2017-11-17 2018-03-27 北京联想超融合科技有限公司 一种基于超融合存储***的资源监控方法、装置及终端
CN111258870A (zh) * 2020-01-17 2020-06-09 中国建设银行股份有限公司 分布式存储***的性能分析方法、装置、设备及存储介质
CN111901405B (zh) * 2020-07-21 2023-05-05 国云科技股份有限公司 一种多节点监控方法、装置、电子设备及存储介质

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102761454A (zh) * 2011-04-28 2012-10-31 中兴通讯股份有限公司 一种物联网监控方法及***
US20170155560A1 (en) * 2015-12-01 2017-06-01 Quanta Computer Inc. Management systems for managing resources of servers and management methods thereof
CN109062699A (zh) * 2018-08-15 2018-12-21 郑州云海信息技术有限公司 一种资源监控方法、装置、服务器及存储介质
CN109688106A (zh) * 2018-11-19 2019-04-26 中国科学院信息工程研究所 一种数据协同采集方法及***
CN109714402A (zh) * 2018-12-12 2019-05-03 胡书恺 一种冗余数据采集***及其运行使用方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022016845A1 (zh) * 2020-07-21 2022-01-27 国云科技股份有限公司 一种多节点监控方法、装置、电子设备及存储介质

Also Published As

Publication number Publication date
CN111901405B (zh) 2023-05-05
WO2022016845A1 (zh) 2022-01-27

Similar Documents

Publication Publication Date Title
CN108512719B (zh) 一种基于开源云平台的一体化资源监控***
CN111901405B (zh) 一种多节点监控方法、装置、电子设备及存储介质
CN108920153B (zh) 一种基于负载预测的Docker容器动态调度方法
CN111522636A (zh) 应用容器的调整方法、调整***、计算机可读介质及终端设备
CN112527848B (zh) 基于多数据源的报表数据查询方法、装置、***及存储介质
WO2021093365A1 (zh) 一种gpu显存管理控制方法及相关装置
CN107908521A (zh) 一种应用于云环境下的服务器性能以及节点上的容器性能的监控方法
CN110807145A (zh) 查询引擎获取方法、设备和计算机可读存储介质
CN111680085A (zh) 数据处理任务分析方法、装置、电子设备和可读存储介质
CN109597764A (zh) 一种目录配额的测试方法及相关装置
JPWO2011077533A1 (ja) 性能データ収集方法、性能データ収集装置及び性能データ管理システム
CN107193749B (zh) 测试方法、装置及设备
CN111858656A (zh) 一种基于分布式架构的静态数据的查询方法和设备
CN113239059B (zh) 一种分布式锁的切换方法、装置、服务器和存储介质
CN115563160A (zh) 数据处理方法、装置、计算机设备和计算机可读存储介质
CN109522124B (zh) 存储管理***加载方法、装置、设备及可读存储介质
CN114020214A (zh) 存储集群的扩容方法、装置、电子设备及可读存储介质
CN113448867A (zh) 一种软件压力测试方法及装置
JP2023519292A (ja) モデリング方法及び装置
CN107943902B (zh) 话单采集方法和装置
CN112860529A (zh) 通用分析装置与方法
CN108733484A (zh) 管理应用程序的方法与装置
CN112084022B (zh) 一种项目容量规划方法、装置、计算机设备和存储介质
CN112463524B (zh) 一种外部存储实时监控方法、***、终端及存储介质
CN117389841B (zh) 加速器资源监控方法、装置、集群设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant