CN114564758A - 一种运维数据的管理方法及其*** - Google Patents

一种运维数据的管理方法及其*** Download PDF

Info

Publication number
CN114564758A
CN114564758A CN202210455694.2A CN202210455694A CN114564758A CN 114564758 A CN114564758 A CN 114564758A CN 202210455694 A CN202210455694 A CN 202210455694A CN 114564758 A CN114564758 A CN 114564758A
Authority
CN
China
Prior art keywords
data
maintenance
environment
result
management
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210455694.2A
Other languages
English (en)
Inventor
刘凤屿
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ruizhi Technology Group Co ltd
Original Assignee
Ruizhi Technology Group Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ruizhi Technology Group Co ltd filed Critical Ruizhi Technology Group Co ltd
Priority to CN202210455694.2A priority Critical patent/CN114564758A/zh
Publication of CN114564758A publication Critical patent/CN114564758A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/64Protecting data integrity, e.g. using checksums, certificates or signatures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3006Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system is distributed, e.g. networked systems, clusters, multiprocessor systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3058Monitoring arrangements for monitoring environmental properties or parameters of the computing system or of the computing system component, e.g. monitoring of power, currents, temperature, humidity, position, vibrations
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/14Network analysis or design
    • H04L41/142Network analysis or design using statistical or mathematical methods
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/12Protocols specially adapted for proprietary or special-purpose networking environments, e.g. medical networks, sensor networks, networks in vehicles or remote metering networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Computer Security & Cryptography (AREA)
  • Mathematical Physics (AREA)
  • General Health & Medical Sciences (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Medical Informatics (AREA)
  • Bioethics (AREA)
  • Software Systems (AREA)
  • Algebra (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Computer Hardware Design (AREA)
  • Probability & Statistics with Applications (AREA)
  • Pure & Applied Mathematics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请公开了一种运维数据的管理方法及其***,其中,运维数据的管理***,包括:多个服务器和管理中心;服务器:用于发送传输请求;发送运维环境数据;接收并执行运维数据获取指令,并将获取到的运维数据发送至管理中心;管理中心:用于执行如下步骤:根据传输请求获取运维环境数据,对运维环境数据进行分析,获得运维环境结果;若运维环境结果为正常,则发送运维数据获取指令,并接收执行运维数据获取指令后发送的运维数据,对运维数据进行处理,获得待检测存储数据;对待检测存储数据进行处理,获得标准运维数据,并对标准运维数据进行存储。本申请具有便于对运维数据进行统一管理,并提高了存储的运维数据的准确性的技术效果。

Description

一种运维数据的管理方法及其***
技术领域
本申请涉及计算机技术领域,尤其涉及一种运维数据的管理方法及其***。
背景技术
运维数据主要包括监控、日志、性能、配置、流程和应用运行数据等。除了统一监控报警、配置、机器日志和ITIL(Information Technology Infrastructure Library,信息技术基础构架库)里的几大流程的数据格式是相关标准,其它数据存在格式众多、非结构化、实时性要求高、数据量大、采集方式复杂等特点,在运维数据管理过程中容易出现不完整和不准确等数据质量问题。此外,运行维护***中各个网络、***、终端监控及安全工具都是面向设备的单方面分散管理,该管理方式无形中将本应一体化的信息***安全运行工作进行了拆分,会导致单一问题出现后多处报警、多方排查,浪费大量人力,且故障处理效率低下等问题。
发明内容
本申请的目的在于提供一种运维数据的管理方法及其***,具有便于对运维数据进行统一管理,并提高了存储的运维数据的准确性的技术效果。
为达到上述目的,本申请提供一种运维数据的管理***,包括:多个服务器和管理中心;服务器:用于发送传输请求;发送运维环境数据;接收并执行运维数据获取指令,并将获取到的运维数据发送至管理中心;管理中心:用于执行如下步骤:根据传输请求获取运维环境数据,对运维环境数据进行分析,获得运维环境结果;若运维环境结果为正常,则发送运维数据获取指令,并接收执行运维数据获取指令后发送的运维数据,对运维数据进行处理,获得待检测存储数据;对待检测存储数据进行处理,获得标准运维数据,并对标准运维数据进行存储。
如上的,其中,管理中心包括:检测单元、收发单元、分析单元、处理单元和存储单元;其中,检测单元:进行管理环境检测,生成管理环境结果,管理环境结果包括:正常和异常;接收运维环境数据,对运维环境数据进行分析,获得运维环境结果,运维环境结果包括:正常和异常;收发单元:若管理环境结果为正常,则接收传输请求,根据传输请求发送运维环境数据获取指令;接收运维环境数据,并将运维环境数据发送至检测单元;分析单元:若运维环境结果为正常,则发送运维数据获取指令,并接收执行运维数据获取指令后发送的运维数据,对运维数据进行处理,获得待检测存储数据;处理单元:对待检测存储数据进行处理,获得标准运维数据;存储单元:用于存储历史管理环境数据库和运维标准数据库;接收标准运维数据,并将标准运维数据存储于运维标准数据库。
如上的,其中,分析单元包括:异常检测单元和整理单元;其中,异常检测单元:用于对运维数据进行分类,确定数据类型;根据数据类型对运维数据进行异常检测,生成异常检测结果,其中,异常检测结果包括:正常和异常;整理单元:当异常检测结果为正常时,调取存储模板,根据存储模板对运维数据进行存储,获得待检测存储数据。
如上的,其中,处理单元包括:第一检测模型、第二检测模型和校核模型;第一检测模型:对待检测存储数据进行完整性检测,获得完整性结果,完整性结果包括:完整和缺失;第二检测模型:当完整性结果为完整时,对待检测存储数据进行准确性检测,获得准确性结果,准确性结果包括:准确和错误,当准确性结果为准确时,则将待检测存储数据作为标准运维数据发送至存储单元;校核模型:当完整性结果为缺失或者准确性结果为错误时,重新获取运维数据和存储模板,并根据存储模板重新对运维数据进行存储,并将存储数据作为新的待检测存储数据,重新对新的待检测存储数据进行完整性检测。
本申请还提供一种运维数据的管理方法,包括如下步骤:根据传输请求获取运维环境数据,对运维环境数据进行分析,获得运维环境结果;若运维环境结果为正常,则发送运维数据获取指令,并接收执行运维数据获取指令后发送的运维数据,对运维数据进行处理,获得待检测存储数据;对待检测存储数据进行处理,获得标准运维数据,并对标准运维数据进行存储。
如上的,其中,根据传输请求获取运维环境数据,对运维环境数据进行分析,获得运维环境结果的子步骤如下:进行管理环境检测,生成管理环境结果,管理环境结果包括:正常和异常;若管理环境结果为正常,则接收传输请求,并根据传输请求发送运维环境数据获取指令;接收根据运维环境数据获取指令获得的运维环境数据,对运维环境数据进行分析,获得运维环境结果,其中,运维环境结果包括:正常和异常。
如上的,其中,进行管理环境检测,生成管理环境结果的子步骤如下:
获取管理环境数据,其中,管理环境数据包括:网络性能数据和电力数据;
获取标准历史数据,对标准历史数据进行处理,获得阈值范围,其中,阈值范围包括:网络阈值范围和电力阈值范围;利用阈值范围对管理环境数据进行判断,若管理环境数据落于阈值范围内,则生成管理环境结果为正常;若管理环境数据落于阈值范围外,则生成管理环境结果为异常,并结束进程,发出警报。
如上的,其中,阈值范围包括:网络阈值范围和电力阈值范围;网络阈值范围包括:吞吐量阈值范围、时延阈值范围和信道利用率阈值范围;电力阈值范围包括:电压阈值范围和电流阈值范围;其中,吞吐量阈值范围的表达式如下:
Figure 191877DEST_PATH_IMAGE001
;其中,
Figure 398868DEST_PATH_IMAGE002
为吞吐量阈值范围;
Figure 214115DEST_PATH_IMAGE003
为第
Figure 873766DEST_PATH_IMAGE004
个历史吞吐量,
Figure 98074DEST_PATH_IMAGE005
Figure 159571DEST_PATH_IMAGE006
为历史吞吐量的总个数;
Figure 178342DEST_PATH_IMAGE007
为管理中心正常运行时的最大吞吐量。
如上的,其中,对运维数据进行处理,获得待检测存储数据的子步骤如下:对运维数据进行异常检测,生成异常检测结果,其中,异常检测结果为:正常和异常;若异常检测结果为正常,则调取存储模板,根据存储模板对运维数据进行存储,获得待检测存储数据。
如上的,其中,对待检测存储数据进行处理,获得标准运维数据,并对标准运维数据进行存储的子步骤如下:对待检测存储数据进行完整性检测,获得完整性结果,完整性结果包括:完整和缺失;当完整性结果为完整时,对待检测存储数据进行准确性检测,获得准确性结果,准确性结果包括:准确和错误;当准确性结果为准确时,则将待检测存储数据作为标准运维数据,并对标准运维数据进行存储。
本申请具有便于对运维数据进行统一管理,并提高了存储的运维数据的准确性的技术效果。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请中记载的一些实施例,对于本领域普通技术人员来讲,还可以根据这些附图获得其他的附图。
图1为运维数据的管理***一种实施例的结构示意图;
图2为运维数据的管理方法一种实施例的流程图。
具体实施方式
下面结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1所示,本申请提供一种运维数据的管理***,包括:多个服务器110和管理中心120。
服务器110:用于发送传输请求;发送运维环境数据;接收并执行运维数据获取指令,并将获取到的运维数据发送至管理中心。
管理中心120:用于执行如下步骤:
根据传输请求获取运维环境数据,对运维环境数据进行分析,获得运维环境结果;
若运维环境结果为正常,则发送运维数据获取指令,并接收执行运维数据获取指令后发送的运维数据,对运维数据进行处理,获得待检测存储数据;
对待检测存储数据进行处理,获得标准运维数据,并对标准运维数据进行存储。
进一步的,管理中心包括:检测单元、收发单元、分析单元、处理单元和存储单元。
其中,检测单元:进行管理环境检测,生成管理环境结果,管理环境结果包括:正常和异常;接收运维环境数据,对运维环境数据进行分析,获得运维环境结果,运维环境结果包括:正常和异常。
收发单元:若管理环境结果为正常,则接收传输请求,根据传输请求发送运维环境数据获取指令;接收运维环境数据,并将运维环境数据发送至检测单元。
分析单元:若运维环境结果为正常,则发送运维数据获取指令,并接收执行运维数据获取指令后发送的运维数据,对运维数据进行处理,获得待检测存储数据。
处理单元:对待检测存储数据进行处理,获得标准运维数据。
存储单元:用于存储历史管理环境数据库和运维标准数据库;接收标准运维数据,并将标准运维数据存储于运维标准数据库。
进一步的,分析单元包括:异常检测单元和整理单元。
其中,异常检测单元:用于对运维数据进行分类,确定数据类型;根据数据类型对运维数据进行异常检测,生成异常检测结果,其中,异常检测结果包括:正常和异常。
整理单元:当异常检测结果为正常时,调取存储模板,根据存储模板对运维数据进行存储,获得待检测存储数据。
进一步的,处理单元包括:第一检测模型、第二检测模型和校核模型。
第一检测模型:对待检测存储数据进行完整性检测,获得完整性结果,完整性结果包括:完整和缺失。
第二检测模型:当完整性结果为完整时,对待检测存储数据进行准确性检测,获得准确性结果,准确性结果包括:准确和错误,当准确性结果为准确时,则将待检测存储数据作为标准运维数据发送至存储单元。
校核模型:当完整性结果为缺失或者准确性结果为错误时,重新获取运维数据和存储模板,并根据存储模板重新对运维数据进行存储,并将存储数据作为新的待检测存储数据,重新对新的待检测存储数据进行完整性检测。
如图2所示,本申请提供一种运维数据的管理方法,包括如下步骤:
S210:根据传输请求获取运维环境数据,对运维环境数据进行分析,获得运维环境结果。
进一步的,根据传输请求获取运维环境数据,对运维环境数据进行分析,获得运维环境结果的子步骤如下:
S2101:进行管理环境检测,生成管理环境结果,管理环境结果包括:正常和异常。
进一步的,进行管理环境检测,生成管理环境结果的子步骤如下:
S21011:获取管理环境数据,其中,管理环境数据包括:网络性能数据和电力数据。
具体的,检测单元获取管理中心的管理环境数据,其中,管理环境数据包括:网络性能数据和电力数据。
其中,网络性能数据至少包括:吞吐量、时延和信道利用率。具体的,吞吐量表示在管理中心的网络中,单位时间内实际传输的数据量。时延表示在管理中心的网络中,从网络中的一端开始发送数据算起,至网络中的另一端完全接收这个数据的时间间隔。信道利用率等于发送时延/(发送时延+往返传输时延),例如:信道的长度为10km,往返传输时延为10ms,传输数据长度为2048bit,发送端的发送速率为1Mbps,在其他时延忽略的情况下, 发送时延为:2048/(1*1000*1000)=2.048ms;信道利用率为:2.048/(2.048+10)=17%。
电力数据至少包括;电压和电流。
S21012:获取标准历史数据,对标准历史数据进行处理,获得阈值范围,其中,阈值范围包括:网络阈值范围和电力阈值范围。
具体的,存储单元预先存储的历史管理环境数据库中包括多个历史管理环境数据,每个历史管理环境数据均包括:历史吞吐量、历史时延和历史信道利用率。取预设时间范围内的历史管理环境数据作为标准历史数据。预设时间范围可以为m天,m天为自管理中心本次运行的时间往前推m天,例如:本次运行时间为3月30日,m=20,则预设的实际范围为3月10日至3月30日这20天,则这20天内的历史管理环境数据均为标准历史数据。
其中,阈值范围包括:网络阈值范围和电力阈值范围。网络阈值范围包括:吞吐量阈值范围、时延阈值范围和信道利用率阈值范围。电力阈值范围包括:电压阈值范围和电流阈值范围。
进一步的,吞吐量阈值范围的表达式如下:
Figure 325290DEST_PATH_IMAGE008
其中,
Figure 822130DEST_PATH_IMAGE009
为吞吐量阈值范围;
Figure 3713DEST_PATH_IMAGE010
为第
Figure 193386DEST_PATH_IMAGE011
个历史吞吐量,
Figure 827630DEST_PATH_IMAGE012
Figure 597003DEST_PATH_IMAGE013
为历史吞吐量的总个数;
Figure 367512DEST_PATH_IMAGE014
为管理中心正常运行时的最大吞吐量。
进一步的,时延阈值范围的表达式如下:
Figure 728087DEST_PATH_IMAGE015
其中,
Figure 849626DEST_PATH_IMAGE016
为时延阈值范围;
Figure 688269DEST_PATH_IMAGE017
为第
Figure 844444DEST_PATH_IMAGE018
个历史时延,
Figure 874455DEST_PATH_IMAGE019
Figure 217712DEST_PATH_IMAGE020
为历史时延的总个数;
Figure 391204DEST_PATH_IMAGE021
为管理中心正常运行时的最大时延。
进一步的,信道利用率阈值范围的表达式如下:
Figure 136306DEST_PATH_IMAGE022
其中,
Figure 838683DEST_PATH_IMAGE023
为信道利用率阈值范围;
Figure 934815DEST_PATH_IMAGE024
为第
Figure 115260DEST_PATH_IMAGE018
个历史信道利用率,
Figure 980448DEST_PATH_IMAGE025
Figure 853726DEST_PATH_IMAGE013
为历史信道利用率的总个数;
Figure 171575DEST_PATH_IMAGE026
为管理中心正常运行时的最大信道利用率。
进一步的,电压阈值范围的表达式如下:
Figure 421291DEST_PATH_IMAGE027
其中,
Figure 140985DEST_PATH_IMAGE028
为电压阈值范围;
Figure 185165DEST_PATH_IMAGE029
为第
Figure 990310DEST_PATH_IMAGE030
个历史电压,
Figure 43716DEST_PATH_IMAGE031
Figure 617917DEST_PATH_IMAGE013
为历史电压的总个数;
Figure 832998DEST_PATH_IMAGE032
为管理中心正常运行时的最大电压。
进一步的,电流阈值范围的表达式如下:
Figure 859860DEST_PATH_IMAGE033
其中,
Figure 716957DEST_PATH_IMAGE034
为电流阈值范围;
Figure 145664DEST_PATH_IMAGE035
为第
Figure 531646DEST_PATH_IMAGE030
个历史电流,
Figure 576963DEST_PATH_IMAGE036
Figure 205128DEST_PATH_IMAGE037
为历史电流的总个数;
Figure 488342DEST_PATH_IMAGE038
为管理中心正常运行时的最大电流。
S21013:利用阈值范围对管理环境数据进行判断,若管理环境数据落于阈值范围内,则生成管理环境结果为正常;若管理环境数据落于阈值范围外,则生成管理环境结果为异常,并结束进程,发出警报。
具体的,利用阈值范围对管理环境数据进行判断,若吞吐量落于吞吐量阈值范围内,则表示吞吐量正常;若时延落于时延阈值范围内,则表示时延正常;若信道利用率落于信道利用率阈值范围内,则表示信道利用率正常;若电压落于电压阈值范围内,则表示电压正常;若电流落于电流阈值范围内,则表示电流正常。若吞吐量落于吞吐量阈值范围外,则表示吞吐量异常;若时延落于时延阈值范围外,则表示时延异常;若信道利用率落于信道利用率阈值范围外,则表示信道利用率异常;若电压落于电压阈值范围外,则表示电压异常;若电流落于电流阈值范围外,则表示电流异常。若吞吐量、时延、信道利用率、电压和电流均为正常,则生成管理环境结果为正常,执行S2102;若吞吐量、时延、信道利用率、电压和电流中有一个或多个异常,则生成管理环境结果为异常,并结束进程,发出警报。
S2102:若管理环境结果为正常,则接收传输请求,并根据传输请求发送运维环境数据获取指令。
具体的,若管理环境结果为正常,则通过收发单元接收服务器发送的传输请求,根据传输请求生成运维环境数据获取指令,并将运维环境数据获取指令发送至服务器。其中,传输请求至少包括:服务器ID。
S2103:接收根据运维环境数据获取指令获得的运维环境数据,对运维环境数据进行分析,获得运维环境结果,其中,运维环境结果包括:正常和异常。
具体的,服务器接收并执行运维环境数据获取指令,并将运维环境数据发送至管理中心,管理中心接收运维环境数据,并对运维环境数据进行分析,获得运维环境结果。
其中,运维环境数据至少包括:服务器ID、实时运行参数、实时网络数据和实时电力数据。
其中,实时运行参数为服务器本次运行时的设备运行参数。
实时网络数据为服务器本次运行时的网络性能数据。实时网络数据包括:实时吞吐量、实时时延和实时信道利用率。
实时电力数据为服务器本次运行时的电力数据。实时电力数据包括:实时电压和实时电流。
进一步的,对运维环境数据进行分析,获得运维环境结果的子步骤如下:
S21031:根据运维环境数据生成访问请求,并发送,其中,访问请求包括:服务器ID和访问内容。
具体的,检测单元接收运维环境数据,并根据运维环境数据生成访问请求,其中,访问请求包括:服务器ID和访问内容,其中,访问内容为获取运维标准数据。检测单元生成访问请求后,将访问请求发送至存储单元。
S21032:接收根据访问请求发送的允许访问指令,根据允许访问指令获取运维标准数据,其中,允许访问指令包括:服务器ID和访问位置;运维标准数据包括:运行参数标准范围、网络数据标准范围和电力数据标准范围。
具体的,存储单元接收到访问请求后,根据访问请求中的访问内容生成允许访问指令,并将允许访问指令发送至检测单元,检测单元根据允许访问指令中的访问位置对存储单元的运维标准数据库进行访问,从而获得相应的运维标准数据。
其中,运维标准数据库包括多个运维标准数据,每个运维标准数据对应一个服务器ID,每个运维标准数据至少包括:运行参数标准范围、网络数据标准范围和电力数据标准范围。
具体的,运行参数标准范围为
Figure 310804DEST_PATH_IMAGE039
其中,
Figure 312258DEST_PATH_IMAGE040
为支持服务器正常运行时所需的设备的运行参数的最小值,
Figure 245579DEST_PATH_IMAGE041
为支持服务器正常运行时所需的设备的运行参数的最大值。
其中,网络数据标准范围包括:吞吐量标准范围、时延标准范围和信道利用率标准范围。
具体的,吞吐量标准范围为
Figure 648879DEST_PATH_IMAGE042
其中,
Figure 642243DEST_PATH_IMAGE043
为服务器正常运行时吞吐量的最小值,
Figure 130993DEST_PATH_IMAGE044
为服务器正常运行时吞吐量的最大值。
时延标准范围为
Figure 868005DEST_PATH_IMAGE045
其中,
Figure 125811DEST_PATH_IMAGE046
为服务器正常运行时时延的最小值,
Figure 24496DEST_PATH_IMAGE047
为服务器正常运行时时延的最大值。
信道利用率标准范围为
Figure 266122DEST_PATH_IMAGE048
其中,
Figure 541245DEST_PATH_IMAGE049
为服务器正常运行时信道利用率的最小值,
Figure 653558DEST_PATH_IMAGE050
为服务器正常运行时信道利用率的最大值。
电力数据标准范围包括:电压标准范围和电流标准范围。
电压标准范围为
Figure 254304DEST_PATH_IMAGE051
其中,
Figure 452067DEST_PATH_IMAGE052
为服务器正常运行时电压的最小值,
Figure 530881DEST_PATH_IMAGE053
为服务器正常运行时电压的最大值。
电流标准范围为
Figure 763279DEST_PATH_IMAGE054
其中,
Figure 269347DEST_PATH_IMAGE055
为服务器正常运行时电流的最小值,
Figure 219986DEST_PATH_IMAGE056
为服务器正常运行时电流的最大值。
S21033:根据运维标准数据对运维环境数据进行分析,获得运维环境结果。
具体的,若实时运行参数落于运行参数标准范围内,则表示服务器运行正常;实时网络数据落于网络数据标准范围内,则表示服务器运行时的网络性能正常;实时电力数据落于电力数据标准范围内,则表示服务器运行时的电力资源正常;若实时运行参数、实时网络数据和实时电力数据均正常,则生成运维环境结果为正常。
若实时运行参数落于运行参数标准范围外,则表示服务器运行异常;实时网络数据落于网络数据标准范围外,则表示服务器运行时的网络性能异常;实时电力数据落于电力数据标准范围外,则表示服务器运行时的电力资源异常;若实时运行参数、实时网络数据和实时电力数据中具有至少一个异常,生成运维环境结果为异常,则结束进程,发送警报。
S220:若运维环境结果为正常,则发送运维数据获取指令,并接收执行运维数据获取指令后发送的运维数据,对运维数据进行处理,获得待检测存储数据。
具体的,若运维环境结果为正常,分析单元生成运维数据获取指令,并将运维数据获取指令发送至服务器,服务器将采集到的运维数据发送至管理中心,由分析单元对运维数据进行分析。
进一步的,对运维数据进行处理,获得待检测存储数据的子步骤如下:
S2201:对运维数据进行异常检测,生成异常检测结果,其中,异常检测结果为:正常和异常。
进一步的,对运维数据进行异常检测,生成异常检测结果的子步骤如下:
S22011:将运维数据输入至分类单元进行分类,确定数据类型。
具体的,异常检测单元中设置有预先训练好的用于对运维数据进行分类的神经网络,将运维数据输入至异常检测单元中,由异常检测单元对运维数据进行分类,从而确定运维数据的数据类型。
其中,运维数据包括:运维数据的数据内容和运维数据的数值。
其中,作为一个实施例,数据类型是根据运维数据的作用进行分类的。例如:用于管理网络状况的运维数据、用于管理设备状况的运维数据、用于管理存储状况的运维数据等。
S22012:根据数据类型确定运维数据的配置数量。
具体的,分析单元的异常检测单元中预先设置有配置数据库。配置数据库包括多个子配置数据,每个子配置数据对应一个数据类型。子配置数据包括:配置数量、突变阈值和存储模板。
其中,配置数量表示单位时间内按照时序采集到的运维数据的设定的数量。
分析单元根据运维数据的数据类型从配置数据库中获得相应的子配置数据,并将该子配置数据中的配置数量作为运维数据的配置数量。
S22013:根据配置数量计算运维数据的动态偏差。
进一步的,动态偏差的表达式如下:
Figure 836912DEST_PATH_IMAGE057
其中,
Figure 422352DEST_PATH_IMAGE058
为运维数据的动态偏差;
Figure 99321DEST_PATH_IMAGE059
为第
Figure 271676DEST_PATH_IMAGE060
个运维数据的数值;
Figure 692293DEST_PATH_IMAGE061
为运维数据的配置数量;
Figure 899283DEST_PATH_IMAGE062
为运维数据的运维数量;
Figure 747154DEST_PATH_IMAGE063
为滑动窗口的大小;
Figure 406805DEST_PATH_IMAGE064
表示取
Figure 631113DEST_PATH_IMAGE065
中的最大值。
其中,运维数量为当前的运维数据在单位时间内按照时序采集到的运维数据的实际的数量。滑动窗口的大小为配置数量与运维数量的商值的最小整数值。
S22014:获取突变阈值,利用突变阈值对动态偏差进行分析,当动态偏差大于突变阈值,则生成的异常检测结果为异常;当动态偏差小于或等于突变阈值,则生成的异常检测结果为正常。
具体的,从配置数据库中获取相应的突变阈值,若动态偏差大于突变阈值,则表示运维数据的变化率过大,运维数据中存在异常运维数据,生成的异常检测结果为异常,结束进程,发出警报。若动态偏差小于或等于突变阈值,则表示运维数据的变化率正常,运维数据中不存在异常运维数据,生成的异常检测结果为正常。
S2202:若异常检测结果为正常,则调取存储模板,根据存储模板对运维数据进行存储,获得待检测存储数据。
具体的,若异常检测结果为正常,分析单元从配置数据库调取相应的存储模板,并利用存储模板对运维数据进行存储,并将存储后的数据作为待检测存储数据。分析单元获得待检测存储数据后,将待检测存储数据发送至处理单元,执行S230。存储模板为预先设置的,可以为表格等存储形式,本申请优选为数据表的存储形式。
其中,运维数据按照滑动窗口的大小截断为多个子运维数据,按照存储模板分别对每个子运维数据进行存储,获得多个待检测存储数据。
S230:对待检测存储数据进行处理,获得标准运维数据,并对标准运维数据进行存储。
进一步的,对待检测存储数据进行处理,获得标准运维数据,并对标准运维数据进行存储的子步骤如下:
S2301:对待检测存储数据进行完整性检测,获得完整性结果,完整性结果包括:完整和缺失。
具体的,处理单元中预先设置有训练好的用于检测完整性的第一检测模型,将待检测存储数据输入至第一检测模型,有第一检测模型获取待检测存储数据的完整性值,并根据预先设置的完整性阈值对完整性值进行分析,若完整性值大于或等于完整性阈值,则表示待检测存储数据存储完整,生成的完整性结果为完整,若完整性值小于完整性阈值,则表示待检测存储数据存储不完整,生成的完整性结果为缺失。若完整性结果为完整,则执行S2302。若完整性结果为缺失,则重新获取运维数据和存储模板,并将运维数据和存储模板发送至校核单元重新进行存储,并将存储数据作为新的待检测存储数据,并重新执行S2301。
进一步的,完整性值的表达式如下:
Figure 692610DEST_PATH_IMAGE066
其中,
Figure 711382DEST_PATH_IMAGE067
为完整性值;
Figure 592750DEST_PATH_IMAGE068
为第
Figure 355170DEST_PATH_IMAGE069
个待检测存储数据中违反存储模板中预设的存储规则的记录个数,
Figure 536752DEST_PATH_IMAGE070
为第
Figure 726425DEST_PATH_IMAGE069
个待检测存储数据中实际的记录个数的总个数;
Figure 360669DEST_PATH_IMAGE071
Figure 926779DEST_PATH_IMAGE072
为待检测存储数据的总个数。
记录个数表示每个存储模板中记录的待检测存储数据中的数据的个数。
S2302:当完整性结果为完整时,对待检测存储数据进行准确性检测,获得准确性结果,准确性结果包括:准确和错误。
具体的,处理单元中预先设置有训练好的用于检测准确性的第二检测模型,将待检测存储数据输入至第二检测模型,由第二检测模型获取待检测存储数据的准确性值,并根据预先设置的准确性阈值对准确性值进行分析,若准确性值大于或等于准确性阈值,则表示待检测存储数据的存储准确,生成准确性结果为准确,执行S2303。若准确性值小于准确性阈值,则表示待检测存储数据的存储有错误,生成准确性结果为错误,则重新获取运维数据和存储模板,并将运维数据和存储模板发送至校核单元重新进行存储,并将存储数据作为新的待检测存储数据,并重新执行S2301。
S2303:当准确性结果为准确时,则将待检测存储数据作为标准运维数据,并对标准运维数据进行存储。
具体的,当准确性结果为准确时,处理单元将待检测存储数据作为标准运维数据发送至存储单元,存储单元将标准运维数据存储于运维标准数据库中,便于对运维数据进行统一管理。
本申请具有便于对运维数据进行统一管理,并提高了存储的运维数据的准确性的技术效果。
尽管已描述了本申请的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,本申请的保护范围意欲解释为包括优选实施例以及落入本申请范围的所有变更和修改。显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样,倘若本申请的这些修改和变型属于本申请保护范围及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。

Claims (10)

1.一种运维数据的管理***,其特征在于,包括:多个服务器和管理中心;
服务器:用于发送传输请求;发送运维环境数据;接收并执行运维数据获取指令,并将获取到的运维数据发送至管理中心;
管理中心:用于执行如下步骤:
根据传输请求获取运维环境数据,对运维环境数据进行分析,获得运维环境结果;
若运维环境结果为正常,则发送运维数据获取指令,并接收执行运维数据获取指令后发送的运维数据,对运维数据进行处理,获得待检测存储数据;
对待检测存储数据进行处理,获得标准运维数据,并对标准运维数据进行存储。
2.根据权利要求1所述的运维数据的管理***,其特征在于,管理中心包括:检测单元、收发单元、分析单元、处理单元和存储单元;
其中,检测单元:进行管理环境检测,生成管理环境结果,管理环境结果包括:正常和异常;接收运维环境数据,对运维环境数据进行分析,获得运维环境结果,运维环境结果包括:正常和异常;
收发单元:若管理环境结果为正常,则接收传输请求,根据传输请求发送运维环境数据获取指令;接收运维环境数据,并将运维环境数据发送至检测单元;
分析单元:若运维环境结果为正常,则发送运维数据获取指令,并接收执行运维数据获取指令后发送的运维数据,对运维数据进行处理,获得待检测存储数据;
处理单元:对待检测存储数据进行处理,获得标准运维数据;
存储单元:用于存储历史管理环境数据库和运维标准数据库;接收标准运维数据,并将标准运维数据存储于运维标准数据库。
3.根据权利要求2所述的运维数据的管理***,其特征在于,分析单元包括:异常检测单元和整理单元;
其中,异常检测单元:用于对运维数据进行分类,确定数据类型;根据数据类型对运维数据进行异常检测,生成异常检测结果,其中,异常检测结果包括:正常和异常;
整理单元:当异常检测结果为正常时,调取存储模板,根据存储模板对运维数据进行存储,获得待检测存储数据。
4.根据权利要求3所述的运维数据的管理***,其特征在于,处理单元包括:第一检测模型、第二检测模型和校核模型;
第一检测模型:对待检测存储数据进行完整性检测,获得完整性结果,完整性结果包括:完整和缺失;
第二检测模型:当完整性结果为完整时,对待检测存储数据进行准确性检测,获得准确性结果,准确性结果包括:准确和错误,当准确性结果为准确时,则将待检测存储数据作为标准运维数据发送至存储单元;
校核模型:当完整性结果为缺失或者准确性结果为错误时,重新获取运维数据和存储模板,并根据存储模板重新对运维数据进行存储,并将存储数据作为新的待检测存储数据,重新对新的待检测存储数据进行完整性检测。
5.一种运维数据的管理方法,其特征在于,包括如下步骤:
根据传输请求获取运维环境数据,对运维环境数据进行分析,获得运维环境结果;
若运维环境结果为正常,则发送运维数据获取指令,并接收执行运维数据获取指令后发送的运维数据,对运维数据进行处理,获得待检测存储数据;
对待检测存储数据进行处理,获得标准运维数据,并对标准运维数据进行存储。
6.根据权利要求5所述的运维数据的管理方法,其特征在于,根据传输请求获取运维环境数据,对运维环境数据进行分析,获得运维环境结果的子步骤如下:
进行管理环境检测,生成管理环境结果,管理环境结果包括:正常和异常;
若管理环境结果为正常,则接收传输请求,并根据传输请求发送运维环境数据获取指令;
接收根据运维环境数据获取指令获得的运维环境数据,对运维环境数据进行分析,获得运维环境结果,其中,运维环境结果包括:正常和异常。
7.根据权利要求6所述的运维数据的管理方法,其特征在于,进行管理环境检测,生成管理环境结果的子步骤如下:
获取管理环境数据,其中,管理环境数据包括:网络性能数据和电力数据;
获取标准历史数据,对标准历史数据进行处理,获得阈值范围,其中,阈值范围包括:网络阈值范围和电力阈值范围;
利用阈值范围对管理环境数据进行判断,若管理环境数据落于阈值范围内,则生成管理环境结果为正常;若管理环境数据落于阈值范围外,则生成管理环境结果为异常,并结束进程,发出警报。
8.根据权利要求7所述的运维数据的管理方法,其特征在于,网络阈值范围包括:吞吐量阈值范围、时延阈值范围和信道利用率阈值范围;电力阈值范围包括:电压阈值范围和电流阈值范围;
其中,吞吐量阈值范围的表达式如下:
Figure 546769DEST_PATH_IMAGE001
其中,
Figure 787257DEST_PATH_IMAGE002
为吞吐量阈值范围;
Figure 3475DEST_PATH_IMAGE003
为第
Figure 620401DEST_PATH_IMAGE004
个历史吞吐量,
Figure 707306DEST_PATH_IMAGE005
Figure 384275DEST_PATH_IMAGE006
为历史吞吐量的总个数;
Figure 556630DEST_PATH_IMAGE007
为管理中心正常运行时的最大吞吐量。
9.根据权利要求5所述的运维数据的管理方法,其特征在于,对运维数据进行处理,获得待检测存储数据的子步骤如下:
对运维数据进行异常检测,生成异常检测结果,其中,异常检测结果为:正常和异常;
若异常检测结果为正常,则调取存储模板,根据存储模板对运维数据进行存储,获得待检测存储数据。
10.根据权利要求5所述的运维数据的管理方法,其特征在于,对待检测存储数据进行处理,获得标准运维数据,并对标准运维数据进行存储的子步骤如下:
对待检测存储数据进行完整性检测,获得完整性结果,完整性结果包括:完整和缺失;
当完整性结果为完整时,对待检测存储数据进行准确性检测,获得准确性结果,准确性结果包括:准确和错误;
当准确性结果为准确时,则将待检测存储数据作为标准运维数据,并对标准运维数据进行存储。
CN202210455694.2A 2022-04-28 2022-04-28 一种运维数据的管理方法及其*** Pending CN114564758A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210455694.2A CN114564758A (zh) 2022-04-28 2022-04-28 一种运维数据的管理方法及其***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210455694.2A CN114564758A (zh) 2022-04-28 2022-04-28 一种运维数据的管理方法及其***

Publications (1)

Publication Number Publication Date
CN114564758A true CN114564758A (zh) 2022-05-31

Family

ID=81720821

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210455694.2A Pending CN114564758A (zh) 2022-04-28 2022-04-28 一种运维数据的管理方法及其***

Country Status (1)

Country Link
CN (1) CN114564758A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114840770A (zh) * 2022-07-04 2022-08-02 睿至科技集团有限公司 一种基于大数据的管理方法及其***

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102025536A (zh) * 2010-11-25 2011-04-20 成都勤智数码科技有限公司 一种Unix/Linux***运维数据收集方法和装置
CN105893628A (zh) * 2016-05-17 2016-08-24 中国农业银行股份有限公司 一种数据实时收集***及方法
CN106100868A (zh) * 2016-05-27 2016-11-09 努比亚技术有限公司 一种项目运维管理装置、***及方法
CN107086944A (zh) * 2017-06-22 2017-08-22 北京奇艺世纪科技有限公司 一种异常检测方法和装置
CN108809701A (zh) * 2018-05-23 2018-11-13 郑州云海信息技术有限公司 一种数据中心智慧数据平台及其实现方法
CN112132555A (zh) * 2020-11-25 2020-12-25 睿至科技集团有限公司 一种运维运营一体化平台及其工作方法
CN113835387A (zh) * 2021-09-16 2021-12-24 国家计算机网络与信息安全管理中心 运维管理方法、***及介质
CN114070654A (zh) * 2022-01-17 2022-02-18 睿至科技集团有限公司 一种基于大数据的安全管控方法及其***
CN114142614A (zh) * 2021-12-03 2022-03-04 浙江省交通运输科学研究院 一种基于sd-wan网络的高速公路配电房智能运维管理***

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102025536A (zh) * 2010-11-25 2011-04-20 成都勤智数码科技有限公司 一种Unix/Linux***运维数据收集方法和装置
CN105893628A (zh) * 2016-05-17 2016-08-24 中国农业银行股份有限公司 一种数据实时收集***及方法
CN106100868A (zh) * 2016-05-27 2016-11-09 努比亚技术有限公司 一种项目运维管理装置、***及方法
CN107086944A (zh) * 2017-06-22 2017-08-22 北京奇艺世纪科技有限公司 一种异常检测方法和装置
CN108809701A (zh) * 2018-05-23 2018-11-13 郑州云海信息技术有限公司 一种数据中心智慧数据平台及其实现方法
CN112132555A (zh) * 2020-11-25 2020-12-25 睿至科技集团有限公司 一种运维运营一体化平台及其工作方法
CN113835387A (zh) * 2021-09-16 2021-12-24 国家计算机网络与信息安全管理中心 运维管理方法、***及介质
CN114142614A (zh) * 2021-12-03 2022-03-04 浙江省交通运输科学研究院 一种基于sd-wan网络的高速公路配电房智能运维管理***
CN114070654A (zh) * 2022-01-17 2022-02-18 睿至科技集团有限公司 一种基于大数据的安全管控方法及其***

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114840770A (zh) * 2022-07-04 2022-08-02 睿至科技集团有限公司 一种基于大数据的管理方法及其***

Similar Documents

Publication Publication Date Title
CN111475370A (zh) 基于数据中心的运维监控方法、装置、设备及存储介质
CN111611146B (zh) 一种微服务故障预测方法和装置
CN112611936A (zh) 一种基于边缘计算的配网变压器故障动态检测与分类***
CN113553210A (zh) 告警数据的处理方法、装置、设备及存储介质
CN115529595A (zh) 一种日志数据的异常检测方法、装置、设备及介质
CN109308225B (zh) 一种虚拟机异常检测方法、装置、设备及存储介质
CN114201374A (zh) 基于混合机器学习的运维时序数据异常检测方法及***
CN115454778A (zh) 大规模云网络环境下的时序指标异常智能监控***
CN116680113B (zh) 一种设备检测实施控制***
CN111860980A (zh) 一种电力负荷预测中应用分类回归树插补补充缺失值的方法
CN110929896A (zh) 一种***设备的安全分析方法及装置
CN114564758A (zh) 一种运维数据的管理方法及其***
CN115576738A (zh) 一种基于芯片分析实现设备故障确定的方法及***
CN112365186A (zh) 一种电力信息***健康度评估方法及其评估***
CN110138613B (zh) 一种网络测试模板构建方法、电力网络测试方法及相关装置
CN110689272A (zh) 一种基于流式计算的敏感设备耐受特性实时在线评估方法
CN115114124A (zh) 主机风险的评估方法及评估装置
CN115150248A (zh) 网络流量异常检测方法、装置、电子设备和存储介质
CN113891342A (zh) 基站巡检方法、装置、电子设备及存储介质
CN110990223A (zh) 一种基于***日志的监控告警方法及装置
CN116541728A (zh) 一种基于密度聚类的故障诊断方法及装置
CN116415851A (zh) 一种基于深度学习的设施运维性态指标智能识别评价方法
CN112737120B (zh) 区域电网控制报告的生成方法、装置和计算机设备
CN115580524A (zh) 一种服务器故障的定位方法及装置
CN116126807A (zh) 一种日志分析方法及相关装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20220531