CN111181775B - 基于自动发现主机资产的一体化运维管理告警方法 - Google Patents

基于自动发现主机资产的一体化运维管理告警方法 Download PDF

Info

Publication number
CN111181775B
CN111181775B CN201911298627.9A CN201911298627A CN111181775B CN 111181775 B CN111181775 B CN 111181775B CN 201911298627 A CN201911298627 A CN 201911298627A CN 111181775 B CN111181775 B CN 111181775B
Authority
CN
China
Prior art keywords
monitoring
asset
module
alarm
maintenance
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201911298627.9A
Other languages
English (en)
Other versions
CN111181775A (zh
Inventor
刘超
范渊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
DBAPPSecurity Co Ltd
Original Assignee
DBAPPSecurity Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by DBAPPSecurity Co Ltd filed Critical DBAPPSecurity Co Ltd
Priority to CN201911298627.9A priority Critical patent/CN111181775B/zh
Publication of CN111181775A publication Critical patent/CN111181775A/zh
Application granted granted Critical
Publication of CN111181775B publication Critical patent/CN111181775B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0631Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/08Logistics, e.g. warehousing, loading or distribution; Inventory or stock management
    • G06Q10/087Inventory or stock management, e.g. order filling, procurement or balancing against orders
    • G06Q10/0875Itemisation or classification of parts, supplies or services, e.g. bill of materials
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/02Total factory control, e.g. smart factories, flexible manufacturing systems [FMS] or integrated manufacturing systems [IMS]

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Economics (AREA)
  • Quality & Reliability (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Signal Processing (AREA)
  • Mathematical Physics (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Development Economics (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供一种基于自动发现主机资产的一体化运维管理告警方法,包括以下步骤:一:流量引擎的分析探测;二:资产平台接收入库;三:自动化运维资产更新和监测告警流程设计。本发明只需要利用资产平台实现联动,保持流量引擎的高辨识性,这样可以减少一大部分的日常运维工作,可以空余出大量时间不必再去处理这种繁杂重复和耗费时间的工作。利用这种方法可以保持较高的工作效率,做到工作处理都在一个平台上面。

Description

基于自动发现主机资产的一体化运维管理告警方法
技术领域
本发明涉及一种运维管理方法,具体涉及一种基于自动发现主机资产的一体化运维管理告警方法。
背景技术
互联网的高速发展,信息***,服务平台的多样性造成的主机资产的增加,还有以往主机资产的交接过程中丢失遗漏对运维人员会造成很大的困扰。在资产梳理过程中往往需要耗费大量的时间和精力,利用流量探测主机资产入库然后审核,提供更为准确的资产信息和资产列表,资产实时变动减少因更新不及时产生信息误差,入库的资产的利用自动运维流程,将打过标签的主机列入监控列表自动分配监控添加告警信息,实现告警自动恢复操作。这样就可以做到资产的实时运维监控,减轻运维人员的工作压力,减少失误操作。
各种公司,服务平台,在需要网络服务的地方就会存在主机资产来提供服务,现在的网络服务越来越多,提供服务的主机资产也会变的越来越庞大,如何管理这些主机资产确保不会丢失资产,影响服务,是主机运维人员最主要的问题。本发明主要解决人力疏忽,告警处理疏忽等问题造成的不良后果,实现自动检查监测告警恢复,减少人为影响。
现有的运维管理方式中资产和自动化运维是分开的,资产管理依旧依靠人工修改,存在人为失误的风险,运维平台和资产平台之间没有自动对接,运维平台局限于现有资产管理,新增资产和变动资产无法做到对比修改。
因此,需要对现有技术进行改进。
发明内容
本发明要解决的技术问题是提供一种高效的基于自动发现主机资产的一体化运维管理告警方法。
为解决上述技术问题,本发明提供一种基于自动发现主机资产的一体化运维管理告警方法,包括以下步骤:
一:流量引擎的分析探测;
二:资产平台接收入库;
三:自动化运维资产更新和监测告警流程设计。
作为对本发明基于自动发现主机资产的一体化运维管理告警方法的改进:
步骤一包括:
将出入口流量进行端口镜像到一台承载流量引擎的服务器上,流量引擎进行对镜像流量进行报文分析,获取其中的源地址和目的地址,将获取到的地址进行对比去重,获取到最后的结果后录入自身数据库。
作为对本发明基于自动发现主机资产的一体化运维管理告警方法的进一步改进:
步骤二包括:
流量引擎入库数据后发送接收消息给资产平台,资产平台接收到消息开始收录资产;资产平台将收录的资产进行安装内外网进行分类,对比原有资产列表进行更新,得到新的资产列表。
作为对本发明基于自动发现主机资产的一体化运维管理告警方法的进一步改进:
步骤三包括以下步骤:
1)、在自动化运维模块里面添加对新的资产列表监控后,自动化运维会将添加消息发送给流程设计模块;
2)、流程设计模块根据添加消息,发送监控信息给监测告警模块;
3)、监测告警模块根据监控信息对新的资产列表中相应的资产获取监控数据;
4)、在监控数据等于阈值的时候会触发告警,监测模块将告警信息发送给用户。
作为对本发明基于自动发现主机资产的一体化运维管理告警方法的进一步改进:
在步骤三中:还包括恢复方法,监测模块会根据恢复方法尝试恢复告警,恢复成功会通知用户恢复成功,如果恢复失败会再次通知用户尽快手动排查处理。
本发明基于自动发现主机资产的一体化运维管理告警方法的技术优势为:
本发明只需要利用资产平台实现联动,保持流量引擎的高辨识性,这样可以减少一大部分的日常运维工作,可以空余出大量时间不必再去处理这种繁杂重复和耗费时间的工作。利用这种方法可以保持较高的工作效率,做到工作处理都在一个平台上面。
附图说明
下面结合附图对本发明的具体实施方式作进一步详细说明。
图1为步骤一流量引擎得到的流量报文内容;
通过引擎对报文的解析获取到其中的源地址和目的地址;
图2为步骤二资产平台接收入库的流程示意图;
流量引擎将获取到的主机资产地址(源地址、目的地址)传送给资产平台,在资产平台接收到数据之后,按照平台配置的资产识别信息识别接收到的资产;
图3为本发明基于自动发现主机资产的一体化运维管理告警方法的流程示意图;
图4为步骤二中资产平台归类资产信息的配置例图;
图5为资产入库参考示意图;
图6为新建流程参考示意图;
图7为节点管理参考示意图;
图8为批量升级实力参考示意图;
图9为创建流程的参考示意图。
具体实施方式
下面结合具体实施例对本发明进行进一步描述,但本发明的保护范围并不仅限于此。
实施例1、基于自动发现主机资产的一体化运维管理告警方法,如图1-3所示,包括三个步骤:
一:流量引擎的分析探测;
将出入口流量进行端口镜像到一台承载流量引擎的服务器上,流量引擎进行对镜像流量进行报文分析,获取其中的源地址和目的地址,将获取到的源地址和目的地址进行去重验证得到最后的主机资产,验证完成的主机资产(源地址、目的地址)录入自身数据库完成入库处理。
二:资产平台接收入库;
流量引擎入库数据后发送一条标记信息给资产平台,资产平台接收到标记信息后开始主动同步流量引擎收录入库的资产信息(主机资产)。平台同步数据完成后,按照平台设置的资产归属信息将平台同步的资产信息进行分类入库,对比原有资产列表进行更新,得到新的资产列表。资产平台设置密码库,密码库权限只有超级管理拥有,资产平台结合密码库和资产列表进行获取资产信息,详细信息为:内存;cpu;硬盘;服务器型号;cpu型号;操作***信息。
具体的资产平台运行过程图2所示;
资产平台在同步分类资产完成后,会利用命令尝试连接主机资产,密码库里面存放是的账号和用户名,其中的账号和用户名是根据内部员工使用习惯和默认密码组成,在尝试连接主机资产的过程是一个撞库操作,连通正常的主机资产会被分配到设置好的资源池中,效果如图5所示。
资产平台接收资产数据后会调用密码库,不会发送信息,密码库是一个独立不受影响的,修改权限和内容查看权限只有管理员拥有。
三:自动化运维资产更新和监测告警流程设计模块;
资产平台生成新的资产列表后就可以调用监控接口进行监控,在资产平台里面接入自动运维模块结合新的资产列表可以做到管理所有资产的功能,利用流程设计模块,完成一系列自动升级,更新,软件部署操作,利用自动部署流程在资产中部署监测告警agent端,配置资源监控和基础服务监控,编写告警恢复流程实现告警自动恢复。自动运维模块是通过流程模板里面添加流程将主机资产导入节点管理进行安装agent客户端,安装完成agent客户端后,同样使用流程模板发布更新,升级,软件部署操作。在自动运维模块里面可以增加一系列的监控和部署操作,在自动化运维模块里面添加对主机资产某服务监控后自动化运维会将添加的这个消息发送给流程设计模块,流程设计模块会根据自动化运维模块发布的任务,自动建立一个监测流程,回送消息给自动化运维模块和监测告警模块,监测告警建立详细的监测告警机制,监控数据会回送给自动化运维模块显示。
流程设计模块根据自动化运维模块发布任务,自动化运维模块发布任务后会生成一条运行流程图,将运维步骤分解成单命令,同时会生成一个shell脚本,这些信息通过自动化运维模块发送至流程设计模块,流程设计模块根据运维模块发过来得信息进行编排流程,将相应得shell脚本***相应得流程步骤中,流程编排完成后会发送任务开始得消息给自动运维模块。如果是监测任务,则流程设计模块将建立好得步骤发送到监测模块中,监测模块会解析流程步骤建立相应得监控。
例:监控主机内存使用情况,任务下发后流程设计调整流程,第一步先将获取内存信息的监控key值和配置内容发送到主机上,然后设置数据更新频率,设置监控告警阈值,流程编排完成后将此流程通知发送给监测模块,然后监测模块通过流程设置相应的监测。
监测告警模块在接收到运维平台发送的详细监控信息,通过流程设计模块的步骤的新建一个监测任务,监测任务的监控原型是参考zabbix监控来做的,监控任务通过agent端获取监控数据,同时会有一个触发器,在监控数据等于触发器设置的阈值的时候会触发告警,监测模块通过已有的任务信息将告警信息发送给用户,在触发告警之后,会执行下一个流程,发布任务时候会要求带上恢复方法,监测模块会根据这些恢复方法尝试恢复告警,恢复成功会通知用户恢复成功,如果恢复失败会再次通知用户尽快手动排查处理。
其中运维模块和密码库是需要人为维护,流程设计和监测告警模块都具有自动调整和人为干预两种方式,其中每个模块之间都是有数据交互,消息头状态信息通过kafka进行发送改变状态。
流程设计模块作为自动化运维监控中是比较重要的一环,流程设计模块要求严谨,逻辑无错误,中间流程报错有补救或者中断措施,流程设计模块可以解放一大部分人力,只需要巡检流程运行情况就可以正确掌握资产动向。
根据图8所示,批量下发任务,按照升级流程添加步骤,点击流程框会有基本属性设置可以设置类型,名称,创建参数,设置参数类型,流程设计模块的原型就是程序运行的流程,按照程序的运行步骤创建流程。如图9所示。
整个***的运行流程图如图3所示。
最后,还需要注意的是,以上列举的仅是本发明的若干个具体实施例。显然,本发明不限于以上实施例,还可以有许多变形。本领域的普通技术人员能从本发明公开的内容直接导出或联想到的所有变形,均应认为是本发明的保护范围。

Claims (3)

1.基于自动发现主机资产的一体化运维管理告警方法,其特征在于:包括以下步骤:
一:流量引擎的分析探测;
将端口的出入口流量镜像到一台承载流量引擎的服务器上,流量引擎对镜像流量进行报文分析,获取其中的源地址和目的地址,将获取到的源地址和目的地址进行去重验证得到最后的主机资产,验证完成的主机资产录入自身数据库完成入库处理;
二:资产平台接收入库;
流量引擎入库数据后发送一条标记信息给资产平台,资产平台接收到标记信息后开始主动同步流量引擎收录入库的主机资产;资产平台同步数据完成后,按照资产平台设置的资产归属信息将资产平台同步的主机资产进行分类入库,对比原有资产列表进行更新,得到新的资产列表;
三:自动化运维资产更新和监测告警流程设计:
步骤三包括以下内容:
资产平台生成新的资产列表后就可以调用监控接口进行监控,在资产平台里面接入自动化 运维模块结合新的资产列表能够管理所有的主机资产,利用流程设计模块,完成一系列自动升级,更新,软件部署操作,利用自动部署流程在主机资产中部署监测告警agent端,配置资源监控和基础服务监控,编写告警恢复流程实现告警自动恢复;具体的,自动化 运维模块是通过在流程模板里面添加流程将主机资产导入节点管理进行安装agent客户端,安装完成agent客户端后,使用流程模板发布更新,升级,软件部署操作;在自动化 运维模块里增加一系列的监控和部署操作的功能,在自动化运维模块里添加对主机资产某服务监控后自动化运维模块会将添加的这个消息发送给流程设计模块,流程设计模块会根据自动化运维模块发布的任务,自动建立一个监测流程,回送消息给自动化运维模块和监测告警模块,监测告警模块建立详细的监测告警机制,监控数据会回送给自动化运维模块显示;
具体的,自动化运维模块发布任务后会生成一条运行流程图,将运维步骤分解成单命令,同时会生成一个shell脚本,这些信息通过自动化运维模块发送至流程设计模块,流程设计模块根据自动化运维模块发过来的信息进行编排流程,将相应的shell脚本***相应的流程步骤中,流程编排完成后会发送任务开始的消息给自动化运维模块;如果是监测任务,则流程设计模块将建立好的步骤发送到监测模块中,监测模块会解析流程步骤建立相应的监控。
2.根据权利要求1所述的基于自动发现主机资产的一体化运维管理告警方法,其特征在于:
步骤二中:
资产平台在主机资产分类完成后,会利用命令尝试连接主机资产,连接正常的主机资产会被分配到设置好的资源池中。
3.根据权利要求2所述的基于自动发现主机资产的一体化运维管理告警方法,其特征在于:
步骤三还包括:
监控主机资产内存使用情况,任务下发后流程设计模块调整流程,第一步先将获取内存信息的监控key值和配置内容发送到主机资产上,然后设置数据更新频率,设置监控告警阈值,流程编排完成后将此流程通知发送给监测模块,然后监测模块通过流程设置相应的监测;
监测告警模块在接收到自动化运维模块发送的详细监控信息后,通过流程设计模块新建一个监测任务,监测任务的监控原型是参考zabbix监控来做的,监控任务通过agent端获取监控数据,监测告警模块中设置一个触发器,在监控数据等于触发器设置的阈值时会触发告警,监测告警模块通过已有的任务信息将告警信息发送给用户,在触发告警之后,会执行下一个流程,发布任务时会要求带上恢复方法,监测模块会根据这些恢复方法尝试恢复告警,恢复成功会通知用户恢复成功,如果恢复失败会再次通知用户尽快手动排查处理。
CN201911298627.9A 2019-12-17 2019-12-17 基于自动发现主机资产的一体化运维管理告警方法 Active CN111181775B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911298627.9A CN111181775B (zh) 2019-12-17 2019-12-17 基于自动发现主机资产的一体化运维管理告警方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911298627.9A CN111181775B (zh) 2019-12-17 2019-12-17 基于自动发现主机资产的一体化运维管理告警方法

Publications (2)

Publication Number Publication Date
CN111181775A CN111181775A (zh) 2020-05-19
CN111181775B true CN111181775B (zh) 2023-01-31

Family

ID=70657366

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911298627.9A Active CN111181775B (zh) 2019-12-17 2019-12-17 基于自动发现主机资产的一体化运维管理告警方法

Country Status (1)

Country Link
CN (1) CN111181775B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111722986A (zh) * 2020-07-24 2020-09-29 杭州迪普科技股份有限公司 软件性能监测方法及装置
CN114595848A (zh) * 2022-04-29 2022-06-07 武汉四通信息服务有限公司 设备监管方法和装置
CN115840951B (zh) * 2022-11-02 2024-02-13 长扬科技(北京)股份有限公司 一种网络安全基于全流量资产发现的实现方法与***

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104506348A (zh) * 2014-12-12 2015-04-08 上海新炬网络信息技术有限公司 一种自动化发现并配置监控对象的方法
CN107862392A (zh) * 2017-10-23 2018-03-30 珠海许继芝电网自动化有限公司 一种基于配电网智能运维管控平台的设备台帐管控方法
CN110083503A (zh) * 2019-03-27 2019-08-02 上海德衡数据科技有限公司 基于数据中心运维的知识库信息感知方法
CN110311931A (zh) * 2019-08-02 2019-10-08 杭州安恒信息技术股份有限公司 资产自动发现方法及装置
CN110413485A (zh) * 2019-08-02 2019-11-05 上海数讯信息技术有限公司 一种基于Zabbix开源平台的一站式网络监控管理***与方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090327102A1 (en) * 2007-03-23 2009-12-31 Jatin Maniar System and method for providing real time asset visibility

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104506348A (zh) * 2014-12-12 2015-04-08 上海新炬网络信息技术有限公司 一种自动化发现并配置监控对象的方法
CN107862392A (zh) * 2017-10-23 2018-03-30 珠海许继芝电网自动化有限公司 一种基于配电网智能运维管控平台的设备台帐管控方法
CN110083503A (zh) * 2019-03-27 2019-08-02 上海德衡数据科技有限公司 基于数据中心运维的知识库信息感知方法
CN110311931A (zh) * 2019-08-02 2019-10-08 杭州安恒信息技术股份有限公司 资产自动发现方法及装置
CN110413485A (zh) * 2019-08-02 2019-11-05 上海数讯信息技术有限公司 一种基于Zabbix开源平台的一站式网络监控管理***与方法

Also Published As

Publication number Publication date
CN111181775A (zh) 2020-05-19

Similar Documents

Publication Publication Date Title
CN111181775B (zh) 基于自动发现主机资产的一体化运维管理告警方法
CN110647580B (zh) 分布式容器集群镜像管理主节点、从节点、***及方法
US9940373B2 (en) Method and system for implementing an operating system hook in a log analytics system
US6792456B1 (en) Systems and methods for authoring and executing operational policies that use event rates
US7421621B1 (en) Application integration testing
CN110088744B (zh) 一种数据库维护方法及其***
CN109088773B (zh) 故障自愈方法、装置、服务器及存储介质
CN110971464A (zh) 一种适合灾备中心的运维自动化***
CN110063042B (zh) 一种数据库故障的响应方法及其终端
CN103473643A (zh) 一种boss***的产品管理数据稽核方法及***
US7512675B2 (en) Cleaning and removing duplicated unique identifiers from remote network nodes
CN114327678A (zh) 一种支持多引擎的实时数据处理***及方法
US8244644B2 (en) Supply chain multi-dimensional serial containment process
CN103026337B (zh) 配给组件的提取和重构
CN112650688A (zh) 自动化回归测试方法、关联设备以及计算机程序产品
CN106547861A (zh) 一种智能管理机器节点的数据库的方法及装置
CN111930354A (zh) 一种用于软件开发的框架组件及其构建方法
EP3514680B1 (en) Identification of changes in functional behavior and runtime behavior of a system during maintenance cycles
JP2003216457A (ja) エラーログ収集解析エージェントシステム
KR100496958B1 (ko) 시스템 장애 통합관리방법
CN109656740A (zh) 一种支持超时处理任务流的方法
CN117828515A (zh) 一种基于低代码平台的智能日志异常诊断***及方法
CN114328721A (zh) 烟草行业数据同步方法及装置
CN117749603A (zh) 一种网络故障自动化修复方法、装置、电子设备及介质
CN117575128A (zh) 一种SoC阵列服务器产品生命周期管理***

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant