CN102708035A - 一种基于模式匹配的集群***监控方法 - Google Patents

一种基于模式匹配的集群***监控方法 Download PDF

Info

Publication number
CN102708035A
CN102708035A CN2012101721751A CN201210172175A CN102708035A CN 102708035 A CN102708035 A CN 102708035A CN 2012101721751 A CN2012101721751 A CN 2012101721751A CN 201210172175 A CN201210172175 A CN 201210172175A CN 102708035 A CN102708035 A CN 102708035A
Authority
CN
China
Prior art keywords
service
monitoring
equipment
pattern
configuration file
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2012101721751A
Other languages
English (en)
Inventor
王通
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Inspur Electronic Information Industry Co Ltd
Original Assignee
Inspur Electronic Information Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Inspur Electronic Information Industry Co Ltd filed Critical Inspur Electronic Information Industry Co Ltd
Priority to CN2012101721751A priority Critical patent/CN102708035A/zh
Publication of CN102708035A publication Critical patent/CN102708035A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Debugging And Monitoring (AREA)

Abstract

本发明公开了一种基于模式匹配的集群***监控方法,属于服务器、存储监控领域,在目前的集群服务器、集群存储设备中利用模式方法设计来实现对硬件设备及服务的监控,将各类硬件设备及各类软件服务按预定义的模式分类,动态监控指定模式的具体硬件设备及服务信息,以此来实现服务器、存储设备的大规模动态实时监控,包括:模式分析模块、设备及服务检测模块。本发明的一种基于模式匹配的集群***监控方法,实现了监控的动态性、实时性、可靠性、更好的扩展能力和可管理性。

Description

一种基于模式匹配的集群***监控方法
 
技术领域
  本发明涉及一种服务器、存储监控领域,具体地说是一种基于模式匹配的集群***监控方法。
背景技术
目前,整个IT业界关于大规模存储的讨论已经蔚然成风。实现存储***监控的方式有很多,包括硬件和软件方法。由于存储***的规模越来越大,网络存储发展迅速,对大规模甚至超大规模存储的硬件及服务的实时监控告警就成为一个难点及热点问题,企业、科研院所都将它视为一个重要的研究领域。同时,随着存储***规模的增大,整个存储的内外部环境异常复杂。
服务器、存储监控技术是指从设备安全和数据安全的角度出发,用来监控硬件、服务及数据的实时信息、降低服务器、存储设备的设备损坏、服务及数据丢失危险的技术。服务器、存储监控技术的核心是实时发现硬件设备以及服务的异常、危险信息,并及时告警。服务器、存储监控技术涉及所有服务器、存储软硬件监控技术,包括磁盘容量监控、IPMI硬件信息监控、网络监控、CPU监控、内存监控,文件服务和逻辑卷容量监控等可以降低风险,及时告警,并降低建设成本和运行成本的服务器、存储技术,其目的是提高服务器、存储设备及服务的安全性。
目前较为流行的集群服务器、集群存储监控软件如ganglia等大多需要在配置文件中指明需要监控的具体设备及具体服务,以硬盘为例,需要在配置文件中填写被监控硬盘在***中的设备名。在大规模集群监控中,需要监控的硬件设备及服务数量极大,需要大规模填写监控配置文件,并且当今服务器、存储设备多实现了硬件设备热插拔方式,集群存储也多采用高可用方法实现在线迁移服务,因此硬件设备及服务常常动态变化,采用原有方式在热插拔硬件,人工修改监控配置文件,会对整个集群***的实时监控不利,同时高可用软件自动迁移服务后,在人工修改监控配置文件之前,迁移的服务在目标节点上无法监控。
集群服务器、集群存储上使用的原有监控方式需要在配置文件中具体的指明需要监控哪一个设备,这对大规模集群来说,要监控的设备众多,逐一填写不利于大规模的实施,同时随着存储***规模的增大,整个存储的环境异常复杂,硬件设备的热插拔及服务的自动迁移,实现了大规模***的高可扩展性及高可用性,如果仍按照原先方式,管理员需要逐一修改改变的硬件及服务信息,从而无法实现监控的实时性、可靠性,这种监控策略应变性差的问题仍需要解决。
发明内容  
  本发明的技术任务是提供一种保证监控的实时性、可靠性,应变性好的一种基于模式匹配的集群***监控方法。
本发明的技术任务是按以下方式实现的,在目前的集群服务器、集群存储设备中利用模式方法设计来实现对硬件设备及服务的监控,将各类硬件设备及各类软件服务按预定义的模式分类,动态监控指定模式的具体硬件设备及服务信息,以此来实现服务器、存储设备的大规模动态实时监控,包括:模式分析模块、设备及服务检测模块,模式分析模块分析用户填写的模式监控配置文件,并依据分析的结果即时检测***中存在的属于用户指定模式的具体硬件设备及服务,并将具体硬件设备及服务信息填入具体设备及服务监控配置文件;设备及服务检测模块动态方式监控,动态监测硬件设备热插拔及服务迁移,并将已经改变的硬件及服务环境信息反映到具体设备监控配置文件中去,在用户改变***硬件配置或服务迁移时,不需要自己修改配置文件。
模式分析模块是已有监控方式的改进,目前的监控方式需要用户写入具体的需要被监控的设备及服务在***中的名字,改进后,用户只需要写入希望被监控的某类或某几类设备及服务在***中的定义,模式分析模块分析该模式监控配置文件,并依据此在***中搜索具体的满足模式监控配置文件内的模式的硬件设备及服务,并写入具体设备及服务监控配置文件,以备监控模块使用。
设备及服务检测模块是对硬件设备热插拔及服务迁移的检测及报告模块,在如今服务器及存储设备中,部分硬件设备如硬盘都实现了热插拔,当热插拔操作发生时,该模块可以检测到热插拔操作,得到热插拔设备的具体信息,然后按照用户配置,或者通知模式分析模块重新分析生成具体设备及服务监控配置文件或对直接修改具体设备及服务监控配置文件,并通知监控模块。集群环境中,多采用高可用方法,发生故障时实现服务的在线迁移,当服务迁移时,设备及服务检测模块可以检测到被迁移走或迁入的服务,然后按照用户配置,或者通知模式分析模块重新分析生成具体设备及服务监控配置文件或对直接修改具体设备及服务监控配置文件,并通知监控模块。
用户需要监控某类硬件设备或服务时,仅需要在模式监控配置文件中填写该类硬件设备或服务的模式,模式分析模块分析该文件并即时检测***中符合该模式的所有硬件设备或服务,生成***中相应设备的设备文件名或服务名并写入具体设备及服务监控配置文件,当发生硬件热插拔或服务在线迁移操作(如数据卷在线迁移)时,设备及服务检测模块被触发获取被热插拔的设备或自动迁移的服务,并自动修改配置文件。
本发明的一种基于模式匹配的集群***监控方法,实现了监控的动态性、实时性、可靠性、 更好的扩展能力和可管理性,因而,具有很好的推广使用价值。
附图说明
    下面结合附图对本发明进一步说明。
附图1为一种基于模式匹配的集群***监控方法的模式分析及实时检测策略;
  附图2为一种基于模式匹配的集群***监控方法的集群模式监控框图。
具体实施方式
  参照说明书附图和具体实施例对本发明的一种基于模式匹配的集群***监控方法作以下详细地说明。
实施例:
本发明的一种基于模式匹配的集群***监控方法,在目前的集群服务器、集群存储设备中利用模式方法设计来实现对硬件设备及服务的监控,将各类硬件设备及各类软件服务按预定义的模式分类,动态监控指定模式的具体硬件设备及服务信息,以此来实现服务器、存储设备的大规模动态实时监控,包括:模式分析模块、设备及服务检测模块,模式分析模块分析用户填写的模式监控配置文件,并依据分析的结果即时检测***中存在的属于用户指定模式的具体硬件设备及服务,并将具体硬件设备及服务信息填入具体设备及服务监控配置文件;设备及服务检测模块动态方式监控,动态监测硬件设备热插拔及服务迁移,并将已经改变的硬件及服务环境信息反映到具体设备监控配置文件中去,在用户改变***硬件配置或服务迁移时,不需要自己修改配置文件。
模式分析模块是已有监控方式的改进,目前的监控方式需要用户写入具体的需要被监控的设备及服务在***中的名字,改进后,用户只需要写入希望被监控的某类或某几类设备及服务在***中的定义,模式分析模块分析该模式监控配置文件,并依据此在***中搜索具体的满足模式监控配置文件内的模式的硬件设备及服务,并写入具体设备及服务监控配置文件,以备监控模块使用。
设备及服务检测模块是对硬件设备热插拔及服务迁移的检测及报告模块,在如今服务器及存储设备中,部分硬件设备如硬盘都实现了热插拔,当热插拔操作发生时,该模块可以检测到热插拔操作,得到热插拔设备的具体信息,然后按照用户配置,或者通知模式分析模块重新分析生成具体设备及服务监控配置文件或对直接修改具体设备及服务监控配置文件,并通知监控模块。集群环境中,多采用高可用方法,发生故障时实现服务的在线迁移,当服务迁移时,设备及服务检测模块可以检测到被迁移走或迁入的服务,然后按照用户配置,或者通知模式分析模块重新分析生成具体设备及服务监控配置文件或对直接修改具体设备及服务监控配置文件,并通知监控模块。
编写模式分析模块,分析模式配置文件,并实现在整个***内的扫描,并将发现的符合指定模式的硬件设备或服务写入具体设备及服务监控配置文件;
编写设备及服务检测模块,检测设备热插拔操作或服务迁移动作,并按用户指定方式,或者直接修改具体设备及服务监控配置文件,或者触发模式分析模块重新生成具体设备及服务监控配置文件;
***启动后,模式分析模块及设备及服务检测模块以守护进程方式运行。
本发明的一种基于模式匹配的集群***监控方法,除说明书所述的技术特征外,均为本专业技术人员的已知技术。

Claims (3)

1.一种基于模式匹配的集群***监控方法,其特征在于在目前的集群服务器、集群存储设备中利用模式方法设计来实现对硬件设备及服务的监控,将各类硬件设备及各类软件服务按预定义的模式分类,动态监控指定模式的具体硬件设备及服务信息,以此来实现服务器、存储设备的大规模动态实时监控,包括:模式分析模块、设备及服务检测模块,模式分析模块分析用户填写的模式监控配置文件,并依据分析的结果即时检测***中存在的属于用户指定模式的具体硬件设备及服务,并将具体硬件设备及服务信息填入具体设备及服务监控配置文件;设备及服务检测模块动态方式监控,动态监测硬件设备热插拔及服务迁移,并将已经改变的硬件及服务环境信息反映到具体设备监控配置文件中去,在用户改变***硬件配置或服务迁移时,不需要自己修改配置文件。
2.根据权利要求1所述的一种基于模式匹配的集群***监控方法,其特征在于模式分析模块用户只需要写入希望被监控的某类或某几类设备及服务在***中的定义,模式分析模块分析该模式监控配置文件,并依据此在***中搜索具体的满足模式监控配置文件内的模式的硬件设备及服务,并写入具体设备及服务监控配置文件,以备监控模块使用。
3.根据权利要求1所述的一种基于模式匹配的集群***监控方法,其特征在于设备及服务检测模块是对硬件设备热插拔及服务迁移的检测及报告模块,当热插拔操作发生时,该模块可以检测到热插拔操作,得到热插拔设备的具体信息,然后按照用户配置,或者通知模式分析模块重新分析生成具体设备及服务监控配置文件或对直接修改具体设备及服务监控配置文件,并通知监控模块。
CN2012101721751A 2012-05-30 2012-05-30 一种基于模式匹配的集群***监控方法 Pending CN102708035A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2012101721751A CN102708035A (zh) 2012-05-30 2012-05-30 一种基于模式匹配的集群***监控方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2012101721751A CN102708035A (zh) 2012-05-30 2012-05-30 一种基于模式匹配的集群***监控方法

Publications (1)

Publication Number Publication Date
CN102708035A true CN102708035A (zh) 2012-10-03

Family

ID=46900842

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2012101721751A Pending CN102708035A (zh) 2012-05-30 2012-05-30 一种基于模式匹配的集群***监控方法

Country Status (1)

Country Link
CN (1) CN102708035A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106155945A (zh) * 2015-04-28 2016-11-23 安富科技股份有限公司 多媒体装置媒体来源热插拔实时通知***的通知方法
CN107357645A (zh) * 2017-08-24 2017-11-17 郑州云海信息技术有限公司 开放式监控***中任务的管理方法和装置
TWI629594B (zh) * 2015-04-10 2018-07-11 安富科技股份有限公司 Notification method for multimedia device media source hot plugging instant notification system
CN113965582A (zh) * 2020-07-20 2022-01-21 中移(苏州)软件技术有限公司 一种模式转换方法和***,及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7191445B2 (en) * 2001-08-31 2007-03-13 Texas Instruments Incorporated Method using embedded real-time analysis components with corresponding real-time operating system software objects
CN101808122A (zh) * 2010-03-05 2010-08-18 浪潮(北京)电子信息产业有限公司 大规模集群存储***及其构造方法
CN101820384A (zh) * 2010-02-05 2010-09-01 浪潮(北京)电子信息产业有限公司 一种集群服务动态分配方法及装置
CN102135932A (zh) * 2011-03-08 2011-07-27 浪潮(北京)电子信息产业有限公司 一种监控***及监控方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7191445B2 (en) * 2001-08-31 2007-03-13 Texas Instruments Incorporated Method using embedded real-time analysis components with corresponding real-time operating system software objects
CN101820384A (zh) * 2010-02-05 2010-09-01 浪潮(北京)电子信息产业有限公司 一种集群服务动态分配方法及装置
CN101808122A (zh) * 2010-03-05 2010-08-18 浪潮(北京)电子信息产业有限公司 大规模集群存储***及其构造方法
CN102135932A (zh) * 2011-03-08 2011-07-27 浪潮(北京)电子信息产业有限公司 一种监控***及监控方法

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI629594B (zh) * 2015-04-10 2018-07-11 安富科技股份有限公司 Notification method for multimedia device media source hot plugging instant notification system
CN106155945A (zh) * 2015-04-28 2016-11-23 安富科技股份有限公司 多媒体装置媒体来源热插拔实时通知***的通知方法
CN106155945B (zh) * 2015-04-28 2020-03-06 安富科技股份有限公司 多媒体装置媒体来源热插拔实时通知***的通知方法
CN107357645A (zh) * 2017-08-24 2017-11-17 郑州云海信息技术有限公司 开放式监控***中任务的管理方法和装置
CN113965582A (zh) * 2020-07-20 2022-01-21 中移(苏州)软件技术有限公司 一种模式转换方法和***,及存储介质
CN113965582B (zh) * 2020-07-20 2024-04-09 中移(苏州)软件技术有限公司 一种模式转换方法和***,及存储介质

Similar Documents

Publication Publication Date Title
US20240195833A1 (en) System for automated capture and analysis of business information for security and client-facing infrastructure reliability
CN102135932A (zh) 一种监控***及监控方法
US8850263B1 (en) Streaming and sampling in real-time log analysis
CN106027328B (zh) 一种基于应用容器部署的集群监控的方法及***
CN103812699A (zh) 基于云计算的监控管理***
CN103475544A (zh) 一种基于云资源监控平台的业务监控方法
CN104881352A (zh) 基于移动端的***资源监控装置
US20170124501A1 (en) System for automated capture and analysis of business information for security and client-facing infrastructure reliability
CN108632100B (zh) 发现与呈现网络应用访问信息的方法和***
WO2020087830A1 (zh) 数据分析方法、装置、服务器及存储介质
EP3321821B1 (en) Big data exchange method and device
Küçükkeçeci et al. Big data model simulation on a graph database for surveillance in wireless multimedia sensor networks
CN105243004A (zh) 一种故障资源检测方法及装置
US20170322833A1 (en) Measuring provisioning capacity across distributed systems
CN102708035A (zh) 一种基于模式匹配的集群***监控方法
CN106649344B (zh) 一种网络日志压缩方法和装置
CN104915460A (zh) 一种日志存储方法及***
CN110377489A (zh) 日志信息处理的方法和装置
CN110278101B (zh) 一种资源管理方法及设备
US10331484B2 (en) Distributed data platform resource allocator
CN110807050B (zh) 性能分析方法、装置、计算机设备及存储介质
CN111800292A (zh) 基于历史流量的预警方法、装置、计算机设备及存储介质
CN203301532U (zh) 云桌面***
WO2012158389A2 (en) Real-time diagnostics pipeline for large scale services
CN103823743A (zh) 软件***的监控方法和设备

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20121003