CN116149954A - 一种服务器智能运维***及其方法 - Google Patents

一种服务器智能运维***及其方法 Download PDF

Info

Publication number
CN116149954A
CN116149954A CN202310217735.9A CN202310217735A CN116149954A CN 116149954 A CN116149954 A CN 116149954A CN 202310217735 A CN202310217735 A CN 202310217735A CN 116149954 A CN116149954 A CN 116149954A
Authority
CN
China
Prior art keywords
server
unit
data
module
terminal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN202310217735.9A
Other languages
English (en)
Inventor
谢才权
冯亮
曾新平
曾志
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Zhongyuan Computer Technology Co ltd
Original Assignee
Shanghai Zhongyuan Computer Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Zhongyuan Computer Technology Co ltd filed Critical Shanghai Zhongyuan Computer Technology Co ltd
Priority to CN202310217735.9A priority Critical patent/CN116149954A/zh
Publication of CN116149954A publication Critical patent/CN116149954A/zh
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3024Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system component is a central processing unit [CPU]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3089Monitoring arrangements determined by the means or processing involved in sensing the monitored data, e.g. interfaces, connectors, sensors, probes, agents
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/32Monitoring with visual or acoustical indication of the functioning of the machine
    • G06F11/324Display of status information
    • G06F11/327Alarm or error message display
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5005Allocation of resources, e.g. of the central processing unit [CPU] to service a request
    • G06F9/5011Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resources being hardware resources other than CPUs, Servers and Terminals
    • G06F9/5022Mechanisms to release resources
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5005Allocation of resources, e.g. of the central processing unit [CPU] to service a request
    • G06F9/5027Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Quality & Reliability (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Hardware Redundancy (AREA)

Abstract

本发明提供一种服务器智能运维***及其方法,涉及运维实施与管理技术领域。该服务器智能运维***,包括后台服务器运行监控模块,所述后台服务器运行监控模块用于对服务器的运行状态进行实时监测;服务器终端管理模块,所述服务器终端管理模块通过数据链接信号连接后台服务器运行监控模块;服务器分布式运行告警模块,所述服务器分布式运行告警模块通过数据链接信号连接后台服务器运行监控模块。通过设置独立的服务器分布式运行告警模块,能够对整个***中的多个服务器终端机房进行运行状态的监测,同时可以让管理员自由设置单项服务器的警报策略,并且智能化的为***管理员提供多项组合式解决方案,提高了整个服务器***的运维效率。

Description

一种服务器智能运维***及其方法
技术领域
本发明涉及运维实施与管理技术领域,具体为一种服务器智能运维***及其方法。
背景技术
对于大部分的企业来说,公司内部数据大多都存储在相关的服务器主机中,服务器是计算机程序或设备的实例,主要用于管理网络资源,以及处理请求并通过互联网或本地网络将数据传送到另一台计算机,用户可以设置服务器以控制对网络的访问,某些服务器还致力于特定任务,通常称为专用任务,当前的许多服务器都是共享服务器,这就对服务器运维管理***的日常的维护和管理工作提出了很高的要求,如何能够保证信息化***中企业数据的安全性、持续稳定地运行是目前服务器运维管理***的主要问题。
服务器***的日常检查十分重要,包括服务端口是否正常运行,CPU内存等利用率是否正常,任何的故障在出现之前都可能会有所表现,但是当前的企业服务器在运行过程中,一般是通过总线互相连接,当其中一个服务器突发故障时,***整体会先切换到备用设备上恢复业务,再进行后续的故障排查操作,进行此操作需要占用大量的时间,对备用服务器的响应速度有着一定的要求,同时采用总线连接的方式会导致***维护成本高,维护效率低等问题,因此,本领域技术人员提出了一种服务器智能运维***及其方法,以解决上述存在的技术问题。
发明内容
(一)解决的技术问题
针对现有技术的不足,本发明提供了一种服务器智能运维***及其方法,解决了当前企业服务器一般通过总线连接,无法对多组服务器进行分区监测与维护,导致突发故障时服务器***整体受到影响的问题。
(二)技术方案
为实现以上目的,本发明通过以下技术方案予以实现:一种服务器智能运维***,所述服务器智能运维***包括:
后台服务器运行监控模块,所述后台服务器运行监控模块用于对服务器的运行状态进行实时监测;
服务器终端管理模块,所述服务器终端管理模块通过数据链接信号连接后台服务器运行监控模块;
服务器分布式运行告警模块,所述服务器分布式运行告警模块通过数据链接信号连接后台服务器运行监控模块;
服务器缓存数据智能清理模块,所述服务器缓存数据智能清理模块通过以太网络连接服务器终端管理模块;
服务器预处理升级模块,所述服务器预处理升级模块通过数据链接信号链接服务器终端管理模块;
服务器备用资源管理模块,所述服务器备用资源管理模块通过数据链接信号分别连接后台服务器运行监控模块与服务器终端管理模块。
优选的,所述后台服务器运行监控模块包括信息数据显示终端和服务器机房分布监控单元,所述服务器机房分布监控单元包括访问权限检测单元、数据库安全检测单元、机房环境检测单元和端口访问记录单元,所述信息数据显示终端用于进行数据可视化展示,所述访问权限检测单元用于进行外部访问权限的记录检测,所述数据库安全检测单元用于记录服务器数据库的调取列表,并进行标记,所述机房环境检测单元用于检测机房内部的环境信息,所述端口访问记录单元用于监测各个服务器端口的启用状态。
优选的,所述服务器终端管理模块包括终端数据接收单元、线路配置单元、主控配置单元、数据配置单元、防火墙管理单元和指令执行单元,所述线路配置单元、主控配置单元、数据配置单元和防火墙管理单元均通过网络信号连接指令执行单元,所述终端数据接收单元用于接收以太网络数据信号,所述线路配置单元用于配置***单元的连接线路,所述主控配置单元用于配置服务器维护计划数据报表,所述数据配置单元用于将待传输数据进行压缩处理,所述防火墙管理单元用于对***内部的服务器防火墙进行配置管理,所述指令执行单元用于生成执行命令信号,并传输至服务器缓存数据智能清理模块。
优选的,所述服务器分布式运行告警模块包括分级线路接入单元、管理员控制终端和服务器突发故障模拟实验单元,所述分级线路接入单元通过数据链接信号连接管理员控制终端,所述管理员控制终端的输出端电性连接服务器突发故障模拟实验单元的输入端,所述服务器突发故障模拟实验单元的输出端通过数据链接信号依次连接有服务器故障模拟生成单元、实验日志生成单元和***维护策略生产单元,所述分级线路接入单元用于与多组服务器终端进行线路连接,所述服务器突发故障模拟实验单元用于进行服务器故障应急处理能力的计算实验分析,所述服务器故障模拟生成单元用于进行服务器故障模拟实验的进行,所述实验日志生成单元用于生成实验数据的报表信息,并发送至后台服务器运行监控模块,所述***维护策略生产单元用于进行***实验日志的备份处理。
优选的,所述管理员控制终端依次连接有服务器防火墙检测单元、服务器运行状态报警单元和硬件设备监测终端,所述服务器防火墙检测单元用于检测***防火墙的运行状态,所述服务器运行状态报警单元用于在服务器发生故障时进行快速告警处理,所述硬件设备监测终端用于服务器***硬件设置的运行状态。
优选的,所述服务器缓存数据智能清理模块包括服务器端口启闭单元、服务器存储空间计算重组单元、冷数据回收清理单元和信息确认单元,所述服务器端口启闭单元通过数据链接信号连接服务器存储空间计算重组单元和冷数据回收清理单元,所述服务器存储空间计算重组单元与冷数据回收清理单元的输出端均电性连接信息确认单元的输入端,所述服务器端口启闭单元用于控制服务器连接端口的开启与关闭,所述服务器存储空间计算重组单元用于计算服务器的数据存储余量,所述冷数据回收清理单元用于对服务器内部的沉默数据进行清理,所述信息确认单元用于管理员对***指令进行二次确认。
优选的,所述服务器预处理升级模块包括升级包预下载单元、更新时段设置单元、历史数据覆盖单元和***回退处理单元,所述升级包预下载单元通过以太网络连接更新时段设置单元,所述历史数据覆盖单元通过数据链接信号连接历史数据覆盖单元,所述升级包预下载单元用于进行***固件的预下载,所述更新时段设置单元用于设置***更新的时段,所述历史数据覆盖单元用于进行历史数据的覆盖替换。
优选的,所述服务器备用资源管理模块包括副线接入终端和数据收发单元,所述副线接入终端的输出端依次连接有服务器资源访问管控单元、数据备份资源储存库和服务器智能调度单元,所述服务器资源访问管控单元、数据备份资源储存库和服务器智能调度单元的输出端均电性连接数据收发单元的输入端,所述副线接入终端用于服务器备用线路的接入,所述服务器资源访问管控单元用于对外部访问数据进行管理控制,所述数据备份资源储存库用于储存服务器的备份数据,所述服务器智能调度单元用于进行备用服务器的调度处理,所述数据收发单元用于进行数据信息的传输。
优选的,所述服务器终端管理模块用于进行多组服务器的连接管控,所述服务器分布式运行告警模块用于***告警处理,所述服务器缓存数据智能清理模块用于将服务器内部的缓存数据进行筛选处理,所述服务器预处理升级模块用于***的更新升级,所述服务器备用资源管理模块用于进行备用服务器资源的管理调取。
一种服务器智能运维方法,包括以下方法步骤:
S1、运维管理员首先通过服务器终端管理模块进行***线路、数据以及防火墙预设值的设定,并通过指令执行单元传输控制命令至服务器分布式运行告警模块中;
S2、启动后台服务器运行监控模块进行运作,对后台服务器的运行状态进行实时监控,之后通过服务器分布式运行告警模块内部的分级线路接入单元与多组服务器进行连接,同时服务器突发故障模拟实验单元每隔6~10小时进行一次服务器故障应急处理实验,验证***的应急处理能力;
S3、运维管理员通过启动服务器缓存数据智能清理模块内部的服务器端口启闭单元运作,根据访问时段选择性关闭部分端口,同时通过服务器存储空间计算重组单元对服务器存储容量进行计算处理,并通过冷数据回收清理单元清理沉默数据;
S4、完成服务器容量的计算与冷数据的清理后,运维管理员通过服务器预处理升级模块内部的更新时段设置单元进行***更新时段的设置,并通过升级包预下载单元进行***升级包的预下载;
S5、通过服务器备用资源管理模块内部的副线接入终端与多组服务器进行连接,再通过服务器资源访问管控单元进行外部访问指令的管控,同时通过服务器智能调度单元进行服务器的智能调用,通过数据收发单元来接收后台服务器运行监控模块与服务器终端管理模块的连接信息。
(三)有益效果
本发明提供了一种服务器智能运维***及其方法。具备以下有益效果:
1、本发明通过设置独立的服务器分布式运行告警模块,能够对整个***中的多个服务器终端机房进行运行状态的监测,同时可以让管理员自由设置单项服务器的警报策略,并且智能化的为***管理员提供多项组合式解决方案,提高了整个服务器***的运维效率。
2、本发明通过设置服务器突发故障模拟实验单元,能够分时间区段对整个服务器***进行故障进行模拟实验,并生成实验日志,发送至***维护策略生成单元中产生相应的解决策略,从而以不同的计划数据进行运维管控,提高了整个服务器***的运行稳定性与应急处理能力。
3、本发明通过设置服务器缓存数据智能清理模块,能够对服务器中暂时性不用的服务端口进行停用,减少服务器***资源的占用,降低了服务器端口的安全隐患,同时通过设置冷数据回收清理单元,可以有效扩展服务器的冗余储存能力,降低沉默的冷数据对服务器空间的占用,提高了服务器的整体性能。
附图说明
图1为本发明的***整体架构示意图;
图2为本发明的后台服务器运行监控模块架构示意图;
图3为本发明的服务器终端管理模块架构示意图;
图4为本发明的服务器分布式运行告警模块架构示意图;
图5为本发明的服务器突发故障模拟实验单元架构示意图;
图6为本发明的服务器缓存数据智能清理模块架构示意图;
图7为本发明的服务器预处理升级模块架构示意图;
图8为本发明的服务器备用资源管理模块架构示意图。
其中,1、后台服务器运行监控模块;101、信息数据显示终端;102、服务器机房分布监控单元;103、访问权限检测单元;104、数据库安全检测单元;105、机房环境检测单元;106、端口访问记录单元;2、服务器终端管理模块;201、终端数据接收单元;202、线路配置单元;203、主控配置单元;204、数据配置单元;205、防火墙管理单元;206、指令执行单元;3、服务器分布式运行告警模块;301、分级线路接入单元;302、管理员控制终端;303、服务器防火墙检测单元;304、服务器运行状态报警单元;305、硬件设备监测终端;306、服务器突发故障模拟实验单元;307、服务器故障模拟生成单元;308、实验日志生成单元;309、***维护策略生产单元;4、服务器缓存数据智能清理模块;401、服务器端口启闭单元;402、服务器存储空间计算重组单元;403、冷数据回收清理单元;404、信息确认单元;5、服务器预处理升级模块;501、升级包预下载单元;502、更新时段设置单元;503、历史数据覆盖单元;504、***回退处理单元;6、服务器备用资源管理模块;601、副线接入终端;602、服务器资源访问管控单元;603、数据备份资源储存库;604、服务器智能调度单元;605、数据收发单元。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整的描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例:
如图1所示,一种服务器智能运维***,包括:后台服务器运行监控模块1,后台服务器运行监控模块用于对服务器的运行状态进行实时监测;服务器终端管理模块2,服务器终端管理模块2通过数据链接信号连接后台服务器运行监控模块1;服务器分布式运行告警模块3,服务器分布式运行告警模块3通过数据链接信号连接后台服务器运行监控模块1;服务器缓存数据智能清理模块4,服务器缓存数据智能清理模块4通过以太网络连接服务器终端管理模块2;服务器预处理升级模块5,服务器预处理升级模块5通过数据链接信号链接服务器终端管理模块2;服务器备用资源管理模块6,服务器备用资源管理模块6通过数据链接信号分别连接后台服务器运行监控模块1与服务器终端管理模块2。
具体的,服务器终端管理模块2用于进行多组服务器的连接管控,服务器分布式运行告警模块3用于***告警处理,服务器缓存数据智能清理模块4用于将服务器内部的缓存数据进行筛选处理,服务器预处理升级模块5用于***的更新升级,服务器备用资源管理模块6用于进行备用服务器资源的管理调取。
进一步地,如图1所示,后台服务器运行监控模块1包括信息数据显示终端101和服务器机房分布监控单元102,服务器机房分布监控单元102包括访问权限检测单元103、数据库安全检测单元104、机房环境检测单元105和端口访问记录单元106。
具体的,信息数据显示终端101用于进行数据可视化展示,访问权限检测单元103用于进行外部访问权限的记录检测,数据库安全检测单元104用于记录服务器数据库的调取列表,并进行标记,机房环境检测单元105用于检测机房内部的环境信息,端口访问记录单元106用于监测各个服务器端口的启用状态。
进一步地,如图3所示,服务器终端管理模块2包括终端数据接收单元201、线路配置单元202、主控配置单元203、数据配置单元204、防火墙管理单元205和指令执行单元206,线路配置单元202、主控配置单元203、数据配置单元204和防火墙管理单元205均通过网络信号连接指令执行单元206。
具体的,终端数据接收单元201用于接收以太网络数据信号,线路配置单元202用于配置***单元的连接线路,主控配置单元203用于配置服务器维护计划数据报表,数据配置单元204用于将待传输数据进行压缩处理,防火墙管理单元205用于对***内部的服务器防火墙进行配置管理,指令执行单元206用于生成执行命令信号,并传输至服务器缓存数据智能清理模块4。
进一步地,如图4-5所示,服务器分布式运行告警模块3包括分级线路接入单元301、管理员控制终端302和服务器突发故障模拟实验单元306,分级线路接入单元301通过数据链接信号连接管理员控制终端302,管理员控制终端302的输出端电性连接服务器突发故障模拟实验单元306的输入端,服务器突发故障模拟实验单元306的输出端通过数据链接信号依次连接有服务器故障模拟生成单元307、实验日志生成单元308和***维护策略生产单元309,通过设置独立的服务器分布式运行告警模块3,能够对整个***中的多个服务器终端机房进行运行状态的监测,同时可以让管理员自由设置单项服务器的警报策略,并且智能化的为***管理员提供多项组合式解决方案,提高了整个服务器***的运维效率。
具体的,分级线路接入单元301用于与多组服务器终端进行线路连接,服务器突发故障模拟实验单元306用于进行服务器故障应急处理能力的计算实验分析,服务器故障模拟生成单元307用于进行服务器故障模拟实验的进行,实验日志生成单元308用于生成实验数据的报表信息,并发送至后台服务器运行监控模块1,***维护策略生产单元309用于进行***实验日志的备份处理,通过设置服务器突发故障模拟实验单元306,能够分时间区段对整个服务器***进行故障进行模拟实验,并生成实验日志,发送至***维护策略生成单元309中产生相应的解决策略,从而以不同的计划数据进行运维管控,提高了整个服务器***的运行稳定性与应急处理能力。
进一步的,管理员控制终端302依次连接有服务器防火墙检测单元303、服务器运行状态报警单元304和硬件设备监测终端305。
具体的,服务器防火墙检测单元303用于检测***防火墙的运行状态,服务器运行状态报警单元304用于在服务器发生故障时进行快速告警处理,硬件设备监测终端305用于服务器***硬件设置的运行状态。
进一步的,如图6所示,服务器缓存数据智能清理模块4包括服务器端口启闭单元401、服务器存储空间计算重组单元402、冷数据回收清理单元403和信息确认单元404,服务器端口启闭单元401通过数据链接信号连接服务器存储空间计算重组单元402和冷数据回收清理单元403,服务器存储空间计算重组单元402与冷数据回收清理单元403的输出端均电性连接信息确认单元404的输入端,通过设置服务器缓存数据智能清理模块4,能够对服务器中暂时性不用的服务端口进行停用,减少服务器***资源的占用,降低了服务器端口的安全隐患,同时通过设置冷数据回收清理单元403,可以有效扩展服务器的冗余储存能力,降低沉默的冷数据对服务器空间的占用,提高了服务器的整体性能。
具体的,服务器端口启闭单元401用于控制服务器连接端口的开启与关闭,服务器存储空间计算重组单元402用于计算服务器的数据存储余量,冷数据回收清理单元403用于对服务器内部的沉默数据进行清理,信息确认单元404用于管理员对***指令进行二次确认。
进一步的,如图7所示,服务器预处理升级模块5包括升级包预下载单元501、更新时段设置单元502、历史数据覆盖单元503和***回退处理单元504,升级包预下载单元501通过以太网络连接更新时段设置单元502,历史数据覆盖单元503通过数据链接信号连接历史数据覆盖单元503。
具体的,升级包预下载单元501用于进行***固件的预下载,更新时段设置单元502用于设置***更新的时段,历史数据覆盖单元503用于进行历史数据的覆盖替换。
进一步的,如图8所示,服务器备用资源管理模块6包括副线接入终端601和数据收发单元605,副线接入终端601的输出端依次连接有服务器资源访问管控单元602、数据备份资源储存库603和服务器智能调度单元604,服务器资源访问管控单元602、数据备份资源储存库603和服务器智能调度单元604的输出端均电性连接数据收发单元605的输入端。
具体的,副线接入终端601用于服务器备用线路的接入,服务器资源访问管控单元602用于对外部访问数据进行管理控制,数据备份资源储存库603用于储存服务器的备份数据,服务器智能调度单元604用于进行备用服务器的调度处理,数据收发单元605用于进行数据信息的传输。
一种服务器智能运维方法,包括以下方法步骤:
S1、运维管理员首先通过服务器终端管理模块2进行***线路、数据以及防火墙预设值的设定,并通过指令执行单元206传输控制命令至服务器分布式运行告警模块3中;
S2、启动后台服务器运行监控模块1进行运作,对后台服务器的运行状态进行实时监控,之后通过服务器分布式运行告警模块3内部的分级线路接入单元301与多组服务器进行连接,同时服务器突发故障模拟实验单元306每隔6~10小时进行一次服务器故障应急处理实验,验证***的应急处理能力;
S3、运维管理员通过启动服务器缓存数据智能清理模块4内部的服务器端口启闭单元401运作,根据访问时段选择性关闭部分端口,同时通过服务器存储空间计算重组单元402对服务器存储容量进行计算处理,并通过冷数据回收清理单元403清理沉默数据;
S4、完成服务器容量的计算与冷数据的清理后,运维管理员通过服务器预处理升级模块5内部的更新时段设置单元502进行***更新时段的设置,并通过升级包预下载单元501进行***升级包的预下载;
S5、通过服务器备用资源管理模块6内部的副线接入终端601与多组服务器进行连接,再通过服务器资源访问管控单元602进行外部访问指令的管控,同时通过服务器智能调度单元604进行服务器的智能调用,通过数据收发单元605来接收后台服务器运行监控模块1与服务器终端管理模块2的连接信息。
尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。

Claims (10)

1.一种服务器智能运维***,其特征在于:所述服务器智能运维***包括:
后台服务器运行监控模块(1),所述后台服务器运行监控模块(1)用于对服务器的运行状态进行实时监测;
服务器终端管理模块(2),所述服务器终端管理模块(2)通过数据链接信号连接后台服务器运行监控模块(1);
服务器分布式运行告警模块(3),所述服务器分布式运行告警模块(3)通过数据链接信号连接后台服务器运行监控模块(1);
服务器缓存数据智能清理模块(4),所述服务器缓存数据智能清理模块(4)通过以太网络连接服务器终端管理模块(2);
服务器预处理升级模块(5),所述服务器预处理升级模块(5)通过数据链接信号链接服务器终端管理模块(2);
服务器备用资源管理模块(6),所述服务器备用资源管理模块(6)通过数据链接信号分别连接后台服务器运行监控模块(1)与服务器终端管理模块(2)。
2.根据权利要求1所述的一种服务器智能运维***,其特征在于:所述后台服务器运行监控模块(1)包括信息数据显示终端(101)和服务器机房分布监控单元(102),所述服务器机房分布监控单元(102)包括访问权限检测单元(103)、数据库安全检测单元(104)、机房环境检测单元(105)和端口访问记录单元(106),所述信息数据显示终端(101)用于进行数据可视化展示,所述访问权限检测单元(103)用于进行外部访问权限的记录检测,所述数据库安全检测单元(104)用于记录服务器数据库的调取列表,并进行标记,所述机房环境检测单元(105)用于检测机房内部的环境信息,所述端口访问记录单元(106)用于监测各个服务器端口的启用状态。
3.根据权利要求1所述的一种服务器智能运维***,其特征在于:所述服务器终端管理模块(2)包括终端数据接收单元(201)、线路配置单元(202)、主控配置单元(203)、数据配置单元(204)、防火墙管理单元(205)和指令执行单元(206),所述线路配置单元(202)、主控配置单元(203)、数据配置单元(204)和防火墙管理单元(205)均通过网络信号连接指令执行单元(206),所述终端数据接收单元(201)用于接收以太网络数据信号,所述线路配置单元(202)用于配置***单元的连接线路,所述主控配置单元(203)用于配置服务器维护计划数据报表,所述数据配置单元(204)用于将待传输数据进行压缩处理,所述防火墙管理单元(205)用于对***内部的服务器防火墙进行配置管理,所述指令执行单元(206)用于生成执行命令信号,并传输至服务器缓存数据智能清理模块(4)。
4.根据权利要求1所述的一种服务器智能运维***,其特征在于:所述服务器分布式运行告警模块(3)包括分级线路接入单元(301)、管理员控制终端(302)和服务器突发故障模拟实验单元(306),所述分级线路接入单元(301)通过数据链接信号连接管理员控制终端(302),所述管理员控制终端(302)的输出端电性连接服务器突发故障模拟实验单元(306)的输入端,所述服务器突发故障模拟实验单元(306)的输出端通过数据链接信号依次连接有服务器故障模拟生成单元(307)、实验日志生成单元(308)和***维护策略生产单元(309),所述分级线路接入单元(301)用于与多组服务器终端进行线路连接,所述服务器突发故障模拟实验单元(306)用于进行服务器故障应急处理能力的计算实验分析,所述服务器故障模拟生成单元(307)用于进行服务器故障模拟实验的进行,所述实验日志生成单元(308)用于生成实验数据的报表信息,并发送至后台服务器运行监控模块(1),所述***维护策略生产单元(309)用于进行***实验日志的备份处理。
5.根据权利要求4所述的一种服务器智能运维***,其特征在于:所述管理员控制终端(302)依次连接有服务器防火墙检测单元(303)、服务器运行状态报警单元(304)和硬件设备监测终端(305),所述服务器防火墙检测单元(303)用于检测***防火墙的运行状态,所述服务器运行状态报警单元(304)用于在服务器发生故障时进行快速告警处理,所述硬件设备监测终端(305)用于服务器***硬件设置的运行状态。
6.根据权利要求1所述的一种服务器智能运维***,其特征在于:所述服务器缓存数据智能清理模块(4)包括服务器端口启闭单元(401)、服务器存储空间计算重组单元(402)、冷数据回收清理单元(403)和信息确认单元(404),所述服务器端口启闭单元(401)通过数据链接信号连接服务器存储空间计算重组单元(402)和冷数据回收清理单元(403),所述服务器存储空间计算重组单元(402)与冷数据回收清理单元(403)的输出端均电性连接信息确认单元(404)的输入端,所述服务器端口启闭单元(401)用于控制服务器连接端口的开启与关闭,所述服务器存储空间计算重组单元(402)用于计算服务器的数据存储余量,所述冷数据回收清理单元(403)用于对服务器内部的沉默数据进行清理,所述信息确认单元(404)用于管理员对***指令进行二次确认。
7.根据权利要求6所述的一种服务器智能运维***,其特征在于:所述服务器预处理升级模块(5)包括升级包预下载单元(501)、更新时段设置单元(502)、历史数据覆盖单元(503)和***回退处理单元(504),所述升级包预下载单元(501)通过以太网络连接更新时段设置单元(502),所述历史数据覆盖单元(503)通过数据链接信号连接历史数据覆盖单元(503),所述升级包预下载单元(501)用于进行***固件的预下载,所述更新时段设置单元(502)用于设置***更新的时段,所述历史数据覆盖单元(503)用于进行历史数据的覆盖替换。
8.根据权利要求1所述的一种服务器智能运维***,其特征在于:所述服务器备用资源管理模块(6)包括副线接入终端(601)和数据收发单元(605),所述副线接入终端(601)的输出端依次连接有服务器资源访问管控单元(602)、数据备份资源储存库(603)和服务器智能调度单元(604),所述服务器资源访问管控单元(602)、数据备份资源储存库(603)和服务器智能调度单元(604)的输出端均电性连接数据收发单元(605)的输入端,所述副线接入终端(601)用于服务器备用线路的接入,所述服务器资源访问管控单元(602)用于对外部访问数据进行管理控制,所述数据备份资源储存库(603)用于储存服务器的备份数据,所述服务器智能调度单元(604)用于进行备用服务器的调度处理,所述数据收发单元(605)用于进行数据信息的传输。
9.根据权利要求1所述的一种服务器智能运维***,其特征在于:所述服务器终端管理模块(2)用于进行多组服务器的连接管控,所述服务器分布式运行告警模块(3)用于***告警处理,所述服务器缓存数据智能清理模块(4)用于将服务器内部的缓存数据进行筛选处理,所述服务器预处理升级模块(5)用于***的更新升级,所述服务器备用资源管理模块(6)用于进行备用服务器资源的管理调取。
10.一种服务器智能运维方法,其特征在于:应用于权利要求1-9任一项所述的一种服务器智能运维***,包括以下方法步骤:
S1、运维管理员首先通过服务器终端管理模块(2)进行***线路、数据以及防火墙预设值的设定,并通过指令执行单元(206)传输控制命令至服务器分布式运行告警模块(3)中;
S2、启动后台服务器运行监控模块(1)进行运作,对后台服务器的运行状态进行实时监控,之后通过服务器分布式运行告警模块(3)内部的分级线路接入单元(301)与多组服务器进行连接,同时服务器突发故障模拟实验单元(306)每隔6~10小时进行一次服务器故障应急处理实验,验证***的应急处理能力;
S3、运维管理员通过启动服务器缓存数据智能清理模块(4)内部的服务器端口启闭单元(401)运作,根据访问时段选择性关闭部分端口,同时通过服务器存储空间计算重组单元(402)对服务器存储容量进行计算处理,并通过冷数据回收清理单元(403)清理沉默数据;
S4、完成服务器容量的计算与冷数据的清理后,运维管理员通过服务器预处理升级模块(5)内部的更新时段设置单元(502)进行***更新时段的设置,并通过升级包预下载单元(501)进行***升级包的预下载;
S5、通过服务器备用资源管理模块(6)内部的副线接入终端(601)与多组服务器进行连接,再通过服务器资源访问管控单元(602)进行外部访问指令的管控,同时通过服务器智能调度单元(604)进行服务器的智能调用,通过数据收发单元(605)来接收后台服务器运行监控模块(1)与服务器终端管理模块(2)的连接信息。
CN202310217735.9A 2023-03-07 2023-03-07 一种服务器智能运维***及其方法 Withdrawn CN116149954A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310217735.9A CN116149954A (zh) 2023-03-07 2023-03-07 一种服务器智能运维***及其方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310217735.9A CN116149954A (zh) 2023-03-07 2023-03-07 一种服务器智能运维***及其方法

Publications (1)

Publication Number Publication Date
CN116149954A true CN116149954A (zh) 2023-05-23

Family

ID=86360059

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310217735.9A Withdrawn CN116149954A (zh) 2023-03-07 2023-03-07 一种服务器智能运维***及其方法

Country Status (1)

Country Link
CN (1) CN116149954A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116582369A (zh) * 2023-07-13 2023-08-11 北京点聚信息技术有限公司 一种在线签约的意愿认证的方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116582369A (zh) * 2023-07-13 2023-08-11 北京点聚信息技术有限公司 一种在线签约的意愿认证的方法
CN116582369B (zh) * 2023-07-13 2023-09-12 北京点聚信息技术有限公司 一种在线签约的意愿认证的方法

Similar Documents

Publication Publication Date Title
US11397647B2 (en) Hot backup system, hot backup method, and computer device
KR100575497B1 (ko) 내고장성 컴퓨터 시스템
CN1770707B (zh) 计算机簇中基于法定成员数关无响应服务器的装置和方法
CN102355368B (zh) 一种网络设备的故障处理方法及***
CN102929224B (zh) 变电设备状态接入控制器及***控制方法
CN105430327A (zh) 一种nvr集群备份方法及装置
CN108199901B (zh) 硬件报修方法、***、设备、硬件管理服务器与存储介质
CN105450472A (zh) 一种自动获取服务器物理部件状态的方法及装置
CN109257564A (zh) 一种电气设备运行状态监控***
CN108984320A (zh) 一种消息队列集群防脑裂方法及装置
CN111431754A (zh) 配用电通信网故障分析方法和***
CN115658420A (zh) 数据库监控方法及***
CN116149954A (zh) 一种服务器智能运维***及其方法
Wang et al. Reliability modeling and analysis for linear consecutive-k-out-of-n: F retrial systems with two maintenance activities
WO2024113780A1 (zh) 一种fc链路管理方法、装置、设备及可读存储介质
CN111897697A (zh) 服务器硬件故障修复方法和装置
CN110291505A (zh) 减少应用的恢复时间
CN110119325A (zh) 服务器故障处理方法、装置、设备及计算机可读存储介质
CN113448947B (zh) 一种mongo数据库分布式部署运维的方法和装置
CN105119765B (zh) 一种智能处理故障体系架构
CN117391675B (zh) 一种数据中心基础设施运维管理方法
CN117453036A (zh) 调整服务器中的设备的功耗的方法、***及装置
WO2023125702A1 (zh) 换电站的云管理方法、***、服务器及存储介质
CN112541011A (zh) 基于rpa和ai的电网终端故障处理方法及装置
CN116074180A (zh) 故障定位方法、故障修复方法、装置及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
WW01 Invention patent application withdrawn after publication
WW01 Invention patent application withdrawn after publication

Application publication date: 20230523