CN117076253A - 一种数据中心业务及设施多维度智能运维*** - Google Patents

一种数据中心业务及设施多维度智能运维*** Download PDF

Info

Publication number
CN117076253A
CN117076253A CN202311109508.0A CN202311109508A CN117076253A CN 117076253 A CN117076253 A CN 117076253A CN 202311109508 A CN202311109508 A CN 202311109508A CN 117076253 A CN117076253 A CN 117076253A
Authority
CN
China
Prior art keywords
data
node
module
maintenance
fault
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202311109508.0A
Other languages
English (en)
Other versions
CN117076253B (zh
Inventor
熊芳
张涛
苏镇生
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Yiyun Information Technology Co ltd
Original Assignee
Guangzhou Yiyun Information Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Yiyun Information Technology Co ltd filed Critical Guangzhou Yiyun Information Technology Co ltd
Priority to CN202311109508.0A priority Critical patent/CN117076253B/zh
Publication of CN117076253A publication Critical patent/CN117076253A/zh
Application granted granted Critical
Publication of CN117076253B publication Critical patent/CN117076253B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3089Monitoring arrangements determined by the means or processing involved in sensing the monitored data, e.g. interfaces, connectors, sensors, probes, agents
    • G06F11/3093Configuration details thereof, e.g. installation, enabling, spatial arrangement of the probes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3006Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system is distributed, e.g. networked systems, clusters, multiprocessor systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3058Monitoring arrangements for monitoring environmental properties or parameters of the computing system or of the computing system component, e.g. monitoring of power, currents, temperature, humidity, position, vibrations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/20Administration of product repair or maintenance

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • General Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Human Resources & Organizations (AREA)
  • Mathematical Physics (AREA)
  • Economics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及数据处理技术领域,尤其涉及一种数据中心业务及设施多维度智能运维***,本运维***包括若干节点数据处理器、云服务器、数据库以及运维中心,本发明通过对数据中心的各个节点设施进行监控,以对各个节点设施的监测数据进行故障分析,实现对数据中心中节点设施的精准监控,并通过数据处理模块对各节点设施的监测数据进行分析处理,从而得到对应节点设施的故障数据,并将故障数据传输至云服务器的数据分析模块进行分析,以根据分析结果确定是否进行运维操作,从而精简云服务器的计算量,提高了对节点设施的控制禁锢的,从而进一步提高了运维效率。

Description

一种数据中心业务及设施多维度智能运维***
技术领域
本发明涉及数据处理技术领域,尤其涉及一种数据中心业务及设施多维度智能运维***。
背景技术
数据中心基础设施管理是将信息技术(I nformat ion Techno logy,I T)和设备管理结合起来对数据中心关键设备进行集中监控、容量规划等集中管理。通过软件、硬件和传感器等实现对生产过程的精准控制。
中国专利公开号:CN109492044A公开了一种大数据中心运维监控***,包括:数据采集模块、统一管理模块、数据处理模块、业务应用模块;数据采集模块用于实现数据信息的采集、汇聚与存储,其中所述数据信息包含状态信息、运维信息与处理结果信息;统一管理模块用于实现数据信息与设备设施的统一管理,并通过WebService接口对外提供服务;其中所述设备设施包含硬件设备与中间件软件;数据处理模块实现对数据信息的提取、聚合和分析;并返回处理结果;业务应用模块用于实现对数据信息的呈现;调取统一管理模块提供的接口,实现对设备的控制,支撑对运维业务的管理。该发明提供了业务覆盖全面、技术体系完整的运维监控***;由此可见,现有技术存在对数据中心基础设施管理过程中对节点设施控制精度不足导致运维效率低的问题。
发明内容
为此,本发明提供一种数据中心业务及设施多维度智能运维***,用以克服现有技术中对数据中心基础设施管理过程中对节点设施控制精度不足导致运维效率低的问题。
为实现上述目的,本发明提供一种数据中心业务及设施多维度智能运维***,包括:
若干节点数据处理器,其设置在数据中心的若干节点设施上,包括用以采集数据中心的单个节点设施的传感器的节点监测数据的数据采集模块,用以对所述节点监测数据进行处理的数据处理模块,用以根据所述节点监测数据对单个节点进行故障判断故障判定模块,以及用以将所述节点监测数据发送至云服务的数据发送模块;
云服务器,其与各所述节点数据处理器连接,所述云服务器包括用以接收所述数据发送模块发送的所述节点监测数据的数据接收模块,用以对所述节点监测数据进行分析的数据分析模块,以及用以根据所述数据分析模块的分析结果分别向数据库和运维中心传输数据的数据传输模块;
数据库,其与所述云服务器连接,用以存储所述数据分析模块传输的节点监测数据;
运维中心,其与所述云服务器连接,用以接收所述数据分析模块的分析结果以使对所述数据中心进行运维。
进一步地,所述节点数据处理器在预设监测周期根据所述数据中心的节点设施的重要性指数和预设重要性指数的比对结果确定所述数据处理模块处理所述节点设施的监测数据的若干处理方式,若干所述处理方式包括所述数据处理模块对所述监测数据进行聚类分析以剔除重复数据以使所述数据发送模块将剩余数据发送至所述数据中心的第一处理方式和所述数据发送模块直接将所述监测数据发送至所述数据中心的第二处理方式;
其中,预设监测周期为所述节点设施执行所述数据中心的指令完成。
进一步地,所述数据分析模块在预设条件下统计关联节点设施之间存在所述监测数据与标准数据不对应的节点数量,并将该节点数量与预设节点数量进行比对,以根据比对结果确定所述数据中心的若干运维方式,若干所述运维方式包括在节点数量小于等于预设节点数量条件下的第一运维方式和在节点数量大于预设节点数量条件下的第二运维方式;
其中,预设条件为所述数据发送模块想所述数据分析模块发送所述监测数据。
进一步地,所述数据分析模块在第一运维方式下,将单个节点的所述监测数据与历史故障数据进行比对分析,以确定所述监测数据是否为故障数据,若为故障数据,则所述数据传输模块将该节点作为故障节点的故障数据传输至运维中以进行运维。
进一步地,所述数据分析模块在第二运维方式下,以距离所述数据中心最远的节点为初始分析节点对若干故障节点进行分析,并确定若干故障节点的故障数据的数据量,以根据所述故障数据的数据量和预设故障数据的数据量的比对结果确定运维的紧迫度。
进一步地,所述数据分析模块在对应处理方式下,根据所述数据发送模块的实时数据传输量和预设数据传输量的比对结果确定所述数据传输路径是否存在错误,若所述数据分析模块确定所述数据传输路径存在错误,则重新获取数据进行故障分析;若所述数据分析模块确定所述数据传输路径不存在错误,所述数传输模块生成故障数据传输至维修中心。
进一步地,所述数据分析在第二运维方式下,获取当前设施的维护时间点与前一维护时间点的间隔时长,并在该间隔时长大于标准间隔时长条件下所述数据分析模块确定需调整所述紧迫度。
进一步地,所述数据分析模块在对应运维方式下,获取所述数据库中历史数据中若干节点设施的平均故障率,以在该平均故障率大于预设平均故障率的比对结果下确定对所述运维方式进行优化。
进一步地,所述数据分析模块在确定对运维方式优化条件下,计算所述平均故障率和预设平均故障率的故障率差值,以根据该故障率差值和预设故障率差值的比对结果确定对运维方式的若干优化方式,若干所述优化方式包括对所述监测数据聚类分析后的提出比例的第一优化方式和对所述紧迫度进行修正的第二优化方式。
进一步地,所述数据分析模块在第二优化方式下,计算所述所述数据接收模块接收所述数据处理模块聚类分析后的剔除数据,并确定剔除数据中的故障数据比例,以在该故障数据比例与预设故障数据比例的比对结果下确定确定增加节点设施,同时确定以初始增加数量增加节点设施。
与现有技术相比,本发明的有益效果在于,本发明通过对数据中心的各个节点设施进行监控,以对各个节点设施的监测数据进行故障分析,实现对数据中心中节点设施的精准监控,并通过数据处理模块对各节点设施的监测数据进行分析处理,从而得到对应节点设施的故障数据,并将故障数据传输至云服务器的数据分析模块进行分析,以根据分析结果确定是否进行运维操作,从而精简云服务器的计算量,提高了对节点设施的控制禁锢的,从而进一步提高了运维效率。
进一步地,本发明通过节点数据处理器对对应节点进行重要性指数确定,以根据确定的重要性指数确定数据处理模块对节点设施的监测数据的处理方式,实现灵活对节点设施的监测数据的处理,进一步提高了对节点设施的控制禁锢的,从而进一步提高了运维效率。
进一步地,本发明通过在预设条件下对关联节点设施之间的存在与标准数据不对应的监测数据的节点数量,以根据该节点数量确定数据中心的运维方式,并分别对对应运维方式下分别将故障数据传输至运维中心或设置节点设施的故障运维时的紧迫度,实现灵活对数据中心的灵活运维,进一步提高了对节点设施的控制禁锢的,从而进一步提高了运维效率。
进一步地,本发明通过在对应运维方式下,将数据中心的数据库中的历史监测数据进行分析,以根据历史监测数据的故障率确定对运维方式进行优化的优化方式,并分别在对应优化方式下,分别设置根据数据处理模块的剔除数据比例确定是否发送剔除数据至运维中心或增加节点设施以对数据中心业务进行进准监控,进一步提高了对节点设施的控制禁锢的,从而进一步提高了运维效率。
附图说明
图1为本发明实施例数据中心业务及设施多维度智能运维***的结构示意图;
图2为本发明实施例数据中心业务及设施多维度智能运维***中节点数据处理器的结构示意图;
图3为本发明实施例数据中心业务及设施多维度智能运维***中云服务器的结构示意图;
图中,1-节点数据处理器,2-数据库,3-云服务器,4-运维中心。
具体实施方式
为了使本发明的目的和优点更加清楚明白,下面结合实施例对本发明作进一步描述;应当理解,此处所描述的具体实施例仅仅用于解释本发明,并不用于限定本发明。
下面参照附图来描述本发明的优选实施方式。本领域技术人员应当理解的是,这些实施方式仅仅用于解释本发明的技术原理,并非在限制本发明的保护范围。
需要说明的是,在本发明的描述中,术语“上”、“下”、“左”、“右”、“内”、“外”等指示的方向或位置关系的术语是基于附图所示的方向或位置关系,这仅仅是为了便于描述,而不是指示或暗示所述装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。
此外,还需要说明的是,在本发明的描述中,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域技术人员而言,可根据具体情况理解上述术语在本发明中的具体含义。
请参阅图1-图3所示,图1为本发明实施例数据中心业务及设施多维度智能运维***的结构示意图;图2为本发明实施例数据中心业务及设施多维度智能运维***中节点数据处理器的结构示意图;图3为本发明实施例数据中心业务及设施多维度智能运维***中云服务器的结构示意图。
本发明实施例数据中心业务及设施多维度智能运维***,包括:
若干节点数据处理器,其设置在数据中心的若干节点设施上,包括用以采集数据中心的单个节点设施的传感器的节点监测数据的数据采集模块,用以对所述节点监测数据进行处理的数据处理模块,用以根据所述节点监测数据对单个节点进行故障判断故障判定模块,以及用以将所述节点监测数据发送至云服务的数据发送模块;
云服务器,其与各所述节点数据处理器连接,所述云服务器包括用以接收所述数据发送模块发送的所述节点监测数据的数据接收模块,用以对所述节点监测数据进行分析的数据分析模块,以及用以根据所述数据分析模块的分析结果分别向数据库和运维中心传输数据的数据传输模块;
数据库,其与所述云服务器连接,用以存储所述数据分析模块传输的节点监测数据;
运维中心,其与所述云服务器连接,用以接收所述数据分析模块的分析结果以使对所述数据中心进行运维。
具体而言,所述节点数据处理器在预设监测周期根据所述数据中心的节点设施的重要性指数F和预设重要性指数F0的比对结果确定所述数据处理模块处理所述节点设施的监测数据的处理方式;
若F≤F0,所述数据处理模块确定以第一处理方式对所述节点设施的监测数据进行处理;
若F>F0,所述数据处理模块确定以第二处理方式对所述节点设施的监测数据进行处理;
其中,预设监测周期为所述节点设施执行所述数据中心的指令完成,所述第一处理方式满足所述数据处理模块对所述监测数据进行聚类分析以剔除重复数据以使所述数据发送模块将剩余数据发送至所述数据中心,所述第二处理方式满足所述数据发送模块直接将所述监测数据发送至所述数据中心。
具体而言,所述数据处理模块根据以下公式计算所述节点设施的重要性指数F,设定
F=W/Wz
其中,W为数据中心中单个节点设施关联的节点设施的数量,Wz为数据中心中节点设施的总数量。
具体而言,所述数据分析模块在预设条件下统计关联节点设施之间存在所述监测数据与标准数据不对应的节点数量U,并将该节点数量U与预设节点数量U0进行比对,以根据比对结果确定所述数据中心的运维方式;
若U≤U0,所述数据分析模块确定所述运维方式为第一运维方式;
若U>U0,所述数据分析模块确定所述运维方式为第二运维方式。
本发明实施例中,预设条件为所述数据发送模块想所述数据分析模块发送所述监测数据,预设节点数量为1。
具体而言,所述数据分析模块在第一运维方式下,将单个节点的所述监测数据与历史故障数据进行比对分析,以确定所述监测数据是否为故障数据,若为故障数据,则所述数据传输模块将该节点作为故障节点的故障数据传输至运维中以进行运维。
本发明实施例中,若所述监测数据与历史故障数据相同,则确定所述监测数据为故障数据。
具体而言,所述数据分析模块在第二运维方式下,以距离所述数据中心最远的节点为初始分析节点对若干故障节点进行分析,并确定若干故障节点的故障数据的数据量R,以根据所述故障数据的数据量R和预设故障数据的数据量R0的比对结果确定运维的紧迫度;
若R≤R0,所述数据分析模块确定所述紧迫度为第一紧迫度;
若R>R0,所述数据分析模块确定所述紧迫度为第二紧迫度。
本发明实施例中,预设故障数据的数据量R0的取值为历史故障数据的数据量5%,第一紧迫度的取值为0.75,第二紧迫度的取值为0.80。
具体而言,所述数据分析模块在对应处理方式下,根据所述数据发送模块的实时数据传输量E和预设数据传输量E0的比对结果确定所述数据传输路径是否存在错误;
若E<E0,所述数据分析模块确定所述数据传输路径存在错误,并重新获取数据进行故障分析;
若E≥E0,所述数据分析模块确定所述数据传输路径不存在错误,所述数传输模块生成故障数据传输至维修中心。
本发明实施例中,预设数据传输量E0为对应传输路径的标准值,并且该标准值为不低于数据传输路径总容量的80%。
具体而言,所述数据分析在第二运维方式下,获取当前设施的维护时间点与前一维护时间点的间隔时长T,并将该间隔时长T与标准间隔时长T0进行比对以根据比对结果确定是否调整所述紧迫度;
若T≤T0,所述数据分析模块确定不调整所述紧迫度;
若T>T0,所述数据分析模块确定需调整所述紧迫度;
所述数据分析模块在预设间隔时长条件下,将调节后的紧迫度设置为J i×K,其中j i为第i紧迫度,K为紧迫度调节系数。
本发明实施例中,标准间隔时长为当前设施的维护周期的50%,紧迫度调节系数的取值为1.2。
具体而言,所述数据分析模块在对应运维方式下,获取所述数据库中历史数据中若干节点设施的平均故障率G,以根据该平均故障率G和预设平均故障率G0的比对结果确定是否对所述运维方式进行优化;
若G≤G0,所述数据分析模块确定不对所述运维方式进行优化;
若G>G0,所述数据分析模块确定对所述运维方式进行优化。
本发明实施例中,预设平均故障率的取值为5%。
具体而言,所述数据分析模块在确定对运维方式优化条件下,计算所述平均故障率G和预设平均故障率G0的故障率差值ΔG,以根据该故障率差值ΔG和预设故障率差值ΔG0的比对结果确定对运维方式的优化方式;
若ΔG≤ΔG0,所述数据分析模块确定以第一优化方式优化所述运维方式;若ΔG>ΔG0,所述数据分析模块确定以第二优化方式优化所述运维方式;其中,第一优化方式为确定对所述监测数据聚类分析后的提出比例,第二优化方式为对所述紧迫度进行修正。
本发明实施例中,预设故障率差值的取值3%。
具体而言,所述数据分析模块在第一优化方式下,所述数据接收模块接收所述数据处理模块聚类分析后的剔除数据,并确定剔除数据中的故障数据比例B,以根据该故障数据比例B与预设故障数据比例B0的比对结果确定是否将对应节点设施的监测数据发送至运维中心;
若B≤B0,所述数据分析模块确定不发送对应节点设施的监测数据发送至运维中心;
若B>B0,所述数据分析模块确定发送对应节点设施的监测数据发送至运维中心。
本发明实施例中,预设故障数据比例B0的取值为剔除数据的数据量的50%。
具体而言,所述数据分析模块在第二优化方式下,计算所述所述数据接收模块接收所述数据处理模块聚类分析后的剔除数据,并确定剔除数据中的故障数据比例B,以根据该故障数据比例B与预设故障数据比例B0的比对结果确定是否增加节点设施;
若B≤B0,所述数据分析模块确定不增加节点设施;
若B>B0,所述数据分析模块确定增加节点设施,同时确定以初始增加数量增加节点设施。
本发明实施例中,初始增加数量的取值为原始节点设施总数的2%。
至此,已经结合附图所示的优选实施方式描述了本发明的技术方案,但是,本领域技术人员容易理解的是,本发明的保护范围显然不局限于这些具体实施方式。在不偏离本发明的原理的前提下,本领域技术人员可以对相关技术特征做出等同的更改或替换,这些更改或替换之后的技术方案都将落入本发明的保护范围之内。
以上所述仅为本发明的优选实施例,并不用于限制本发明;对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种数据中心业务及设施多维度智能运维***,其特征在于,包括:
若干节点数据处理器,其设置在数据中心的若干节点设施上,包括用以采集数据中心的单个节点设施的传感器的节点监测数据的数据采集模块,用以对所述节点监测数据进行处理的数据处理模块,用以根据所述节点监测数据对单个节点进行故障判断故障判定模块,以及用以将所述节点监测数据发送至云服务的数据发送模块;
云服务器,其与各所述节点数据处理器连接,所述云服务器包括用以接收所述数据发送模块发送的所述节点监测数据的数据接收模块,用以对所述节点监测数据进行分析的数据分析模块,以及用以根据所述数据分析模块的分析结果分别向数据库和运维中心传输数据的数据传输模块;
数据库,其与所述云服务器连接,用以存储所述数据分析模块传输的节点监测数据;
运维中心,其与所述云服务器连接,用以接收所述数据分析模块的分析结果以使对所述数据中心进行运维。
2.根据权利要求1所述的数据中心业务及设施多维度智能运维***,其特征在于,所述节点数据处理器在预设监测周期根据所述数据中心的节点设施的重要性指数和预设重要性指数的比对结果确定所述数据处理模块处理所述节点设施的监测数据的若干处理方式,若干所述处理方式包括所述数据处理模块对所述监测数据进行聚类分析以剔除重复数据以使所述数据发送模块将剩余数据发送至所述数据中心的第一处理方式和所述数据发送模块直接将所述监测数据发送至所述数据中心的第二处理方式;
其中,预设监测周期为所述节点设施执行所述数据中心的指令完成。
3.根据权利要求2所述的数据中心业务及设施多维度智能运维***,其特征在于,所述数据分析模块在预设条件下统计关联节点设施之间存在所述监测数据与标准数据不对应的节点数量,并将该节点数量与预设节点数量进行比对,以根据比对结果确定所述数据中心的若干运维方式,若干所述运维方式包括在节点数量小于等于预设节点数量条件下的第一运维方式和在节点数量大于预设节点数量条件下的第二运维方式;
其中,预设条件为所述数据发送模块想所述数据分析模块发送所述监测数据。
4.根据权利要求3所述的数据中心业务及设施多维度智能运维***,其特征在于,所述数据分析模块在第一运维方式下,将单个节点的所述监测数据与历史故障数据进行比对分析,以确定所述监测数据是否为故障数据,若为故障数据,则所述数据传输模块将该节点作为故障节点的故障数据传输至运维中以进行运维。
5.根据权利要求4所述的数据中心业务及设施多维度智能运维***,其特征在于,所述数据分析模块在第二运维方式下,以距离所述数据中心最远的节点为初始分析节点对若干故障节点进行分析,并确定若干故障节点的故障数据的数据量,以根据所述故障数据的数据量和预设故障数据的数据量的比对结果确定运维的紧迫度。
6.根据权利要求5所述的数据中心业务及设施多维度智能运维***,其特征在于,所述数据分析模块在对应处理方式下,根据所述数据发送模块的实时数据传输量和预设数据传输量的比对结果确定所述数据传输路径是否存在错误,若所述数据分析模块确定所述数据传输路径存在错误,则重新获取数据进行故障分析;若所述数据分析模块确定所述数据传输路径不存在错误,所述数传输模块生成故障数据传输至维修中心。
7.根据权利要求6所述的数据中心业务及设施多维度智能运维***,其特征在于,所述数据分析在第二运维方式下,获取当前设施的维护时间点与前一维护时间点的间隔时长,并在该间隔时长大于标准间隔时长条件下所述数据分析模块确定需调整所述紧迫度。
8.根据权利要求7所述的数据中心业务及设施多维度智能运维***,其特征在于,所述数据分析模块在对应运维方式下,获取所述数据库中历史数据中若干节点设施的平均故障率,以在该平均故障率大于预设平均故障率的比对结果下确定对所述运维方式进行优化。
9.根据权利要求8所述的数据中心业务及设施多维度智能运维***,其特征在于,所述数据分析模块在确定对运维方式优化条件下,计算所述平均故障率和预设平均故障率的故障率差值,以根据该故障率差值和预设故障率差值的比对结果确定对运维方式的若干优化方式,若干所述优化方式包括对所述监测数据聚类分析后的提出比例的第一优化方式和对所述紧迫度进行修正的第二优化方式。
10.根据权利要求9所述的数据中心业务及设施多维度智能运维***,其特征在于,所述数据分析模块在第二优化方式下,计算所述所述数据接收模块接收所述数据处理模块聚类分析后的剔除数据,并确定剔除数据中的故障数据比例,以在该故障数据比例与预设故障数据比例的比对结果下确定确定增加节点设施,同时确定以初始增加数量增加节点设施。
CN202311109508.0A 2023-08-30 2023-08-30 一种数据中心业务及设施多维度智能运维*** Active CN117076253B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311109508.0A CN117076253B (zh) 2023-08-30 2023-08-30 一种数据中心业务及设施多维度智能运维***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311109508.0A CN117076253B (zh) 2023-08-30 2023-08-30 一种数据中心业务及设施多维度智能运维***

Publications (2)

Publication Number Publication Date
CN117076253A true CN117076253A (zh) 2023-11-17
CN117076253B CN117076253B (zh) 2024-05-28

Family

ID=88716934

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311109508.0A Active CN117076253B (zh) 2023-08-30 2023-08-30 一种数据中心业务及设施多维度智能运维***

Country Status (1)

Country Link
CN (1) CN117076253B (zh)

Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160055045A1 (en) * 2013-03-28 2016-02-25 Telefonaktiebolaget L M Ericsson (Publ) Method and arrangement for fault management in infrastructure as a service clouds
CN106452922A (zh) * 2016-11-30 2017-02-22 长春工业大学 一种应用于物联网的数据中心处理方法
CN107016057A (zh) * 2017-02-28 2017-08-04 北京铁路局 列控车载atp设备一体化智能运维方法及***
US20170279703A1 (en) * 2016-03-25 2017-09-28 Advanced Micro Devices, Inc. Managing variations among nodes in parallel system frameworks
CN108092813A (zh) * 2017-12-21 2018-05-29 郑州云海信息技术有限公司 数据中心综合管理***服务器硬件管理框架及实现方法
CN109101400A (zh) * 2018-08-16 2018-12-28 郑州云海信息技术有限公司 一种云计算数据中心整机柜服务器的监控***
CN109255531A (zh) * 2018-08-28 2019-01-22 中金数据***有限公司 一种数据中心智能化运维管理***
CN112165501A (zh) * 2020-08-05 2021-01-01 宁夏无线互通信息技术有限公司 基于工业互联网标识解析产品远程运维***及运维方法
CN112269673A (zh) * 2020-11-02 2021-01-26 深圳市巨文科技有限公司 一种数据中心智能运维管理***及方法
US20210135924A1 (en) * 2018-01-19 2021-05-06 Nec Corporation Network monitoring system and method, and non-transitory computer readable medium storing program
WO2021169270A1 (zh) * 2020-02-27 2021-09-02 平安科技(深圳)有限公司 服务器故障预警方法、装置、计算机设备及存储介质
CN115562933A (zh) * 2022-09-21 2023-01-03 新华三技术有限公司 作业监控数据的处理方法及装置、存储介质、电子设备
US20230161661A1 (en) * 2021-11-22 2023-05-25 Accenture Global Solutions Limited Utilizing topology-centric monitoring to model a system and correlate low level system anomalies and high level system impacts

Patent Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160055045A1 (en) * 2013-03-28 2016-02-25 Telefonaktiebolaget L M Ericsson (Publ) Method and arrangement for fault management in infrastructure as a service clouds
US20170279703A1 (en) * 2016-03-25 2017-09-28 Advanced Micro Devices, Inc. Managing variations among nodes in parallel system frameworks
CN106452922A (zh) * 2016-11-30 2017-02-22 长春工业大学 一种应用于物联网的数据中心处理方法
CN107016057A (zh) * 2017-02-28 2017-08-04 北京铁路局 列控车载atp设备一体化智能运维方法及***
CN108092813A (zh) * 2017-12-21 2018-05-29 郑州云海信息技术有限公司 数据中心综合管理***服务器硬件管理框架及实现方法
US20210135924A1 (en) * 2018-01-19 2021-05-06 Nec Corporation Network monitoring system and method, and non-transitory computer readable medium storing program
CN109101400A (zh) * 2018-08-16 2018-12-28 郑州云海信息技术有限公司 一种云计算数据中心整机柜服务器的监控***
CN109255531A (zh) * 2018-08-28 2019-01-22 中金数据***有限公司 一种数据中心智能化运维管理***
WO2021169270A1 (zh) * 2020-02-27 2021-09-02 平安科技(深圳)有限公司 服务器故障预警方法、装置、计算机设备及存储介质
CN112165501A (zh) * 2020-08-05 2021-01-01 宁夏无线互通信息技术有限公司 基于工业互联网标识解析产品远程运维***及运维方法
CN112269673A (zh) * 2020-11-02 2021-01-26 深圳市巨文科技有限公司 一种数据中心智能运维管理***及方法
US20230161661A1 (en) * 2021-11-22 2023-05-25 Accenture Global Solutions Limited Utilizing topology-centric monitoring to model a system and correlate low level system anomalies and high level system impacts
CN115562933A (zh) * 2022-09-21 2023-01-03 新华三技术有限公司 作业监控数据的处理方法及装置、存储介质、电子设备

Also Published As

Publication number Publication date
CN117076253B (zh) 2024-05-28

Similar Documents

Publication Publication Date Title
US8667126B2 (en) Dynamic rate heartbeating for inter-node status updating
KR20080044508A (ko) 통계적인 분석을 이용한 성능장애 관리시스템 및 그 방법
EP3771152B1 (en) Network analysis program, network analysis device, and network analysis method
CN110929896A (zh) 一种***设备的安全分析方法及装置
CN116820014B (zh) 一种交通机电设备智能化监控预警方法及***
CN116955091A (zh) 基于机器学习的数据中心故障检测***
CN115695150A (zh) 一种基于分布式异构融合组网设备检测方法及装置
CN117076253B (zh) 一种数据中心业务及设施多维度智能运维***
CN110855001A (zh) 一种配电自动化及电网优化管理运行***
CN117235460B (zh) 一种基于电力时序数据的数据传输处理方法及***
CN116866154B (zh) 一种基于虚拟机集群的配电网通讯服务智能调度管理***
CN117519005A (zh) 一种基于mes的车间设备数据采集***
CN114138750B (zh) 一种基于ai咨询数据库集群搭建方法和***
CN116600329A (zh) 一种消息错误识别码定界方法及装置
CN112306722A (zh) 识别故障的方法、装置、设备和计算机可读介质
CN115603448A (zh) 一种基于边缘计算的低压线路运维管理方法
CN106533730B (zh) Hadoop集群组件指标的采集方法及装置
CN114615637A (zh) 一种基于双级轮询的高信息时效性数据传输方法
KR20230124638A (ko) 관리 시스템, 관리 방법 및 관리 프로그램
CN117134508B (zh) 一种配电一键式集控装置的多数据融合监测***
CN110687346A (zh) 一种电网电压异常原因数据检查及优化方法
CN117294774B (zh) 具有协议转换功能的智能边缘网关***
CN117495357B (zh) 一种基于大数据的电力数据监管***及方法
CN118210578B (zh) 一种用于多数据源平台的管理***
WO2024066292A1 (zh) 设备群障识别方法、装置和计算机可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant