CN105591788A - 一种信息化机房故障点影响范围分析***及方法 - Google Patents

一种信息化机房故障点影响范围分析***及方法 Download PDF

Info

Publication number
CN105591788A
CN105591788A CN201410652779.5A CN201410652779A CN105591788A CN 105591788 A CN105591788 A CN 105591788A CN 201410652779 A CN201410652779 A CN 201410652779A CN 105591788 A CN105591788 A CN 105591788A
Authority
CN
China
Prior art keywords
fault
machine room
module
information
trouble point
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201410652779.5A
Other languages
English (en)
Inventor
韩嵩峰
王汉军
向勇
李喜旺
张千里
李丹
代宇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenyang Institute of Computing Technology of CAS
Original Assignee
Shenyang Institute of Computing Technology of CAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenyang Institute of Computing Technology of CAS filed Critical Shenyang Institute of Computing Technology of CAS
Priority to CN201410652779.5A priority Critical patent/CN105591788A/zh
Publication of CN105591788A publication Critical patent/CN105591788A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Debugging And Monitoring (AREA)

Abstract

本发明涉及一种信息化机房故障点影响范围分析***及方法,数据采集模块连接被监控对象,任务调度模块连接数据采集模块、故障信息处理模块和故障影响分析模块;对机房中设备和应用***进行数据建模,并定义被监测对象故障判断规则和故障影响范围判断规则;任务调度模块调度数据采集模块采集被监测对象的实时状态信息;故障信息处理模块根据故障判断规则判断当前被监测对象的故障状态;当被监测对象为故障状态时,故障影响分析模块根据故障影响范围判断规则判断当前故障影响范围。本发明适合设备众多、接线复杂、业务***间关系复杂的大型机房,尤其是对安全性要求较高的能源、电力、国防、政府等各类企、事业单位信息化机房。

Description

一种信息化机房故障点影响范围分析***及方法
技术领域
本发明涉及机房故障点监测领域,具体地说是一种信息化机房故障点影响范围分析***及方法。
背景技术
近年来,随着信息化技术的普及和大规模应用,各类企、事业单位建设了大量的应用***,与之相对应,多数单位建设了现代化的信息化机房。作为企业信息化建设的基础设施,机房具有高复杂性、高投入性、高技术密集性和高风险性等特点,它的稳定运行关系到企业的生产安全、信息安全以及日常的业务流程处理,在企业的运转过程中起到了越来越重要的作用。
目前,大多企业机房都具备一些保障***,如网络管理***、监控***、消防报警***等,这些***在一定程度上提高了机房运行的安全性,但是,这些***往往只关注机房运行的单一方面,且技术路线不统一,数据难共享,难以从整体分析故障的位置及影响范围;另一方面,随着机房规模的不断扩大、网络接线的增加、应用***的增多以及应用***间业务关联不断增强,故障点的定位和处理也变得更复杂,很难通过人工手段来解决。
目前缺少专门的工具从机房整体考虑、并综合多种因素来分析故障点可能带来的影响范围,以及引起该故障的可能故障源,这给机房的日常维护带来困难;另一方面,当对机房设备或***进行检修时,也难以方便、快速、准确的评估检修可能影响到的其它设备、***及业务流程,从而影响检修预案的质量,给机房的日常维护带来潜在的风险。
发明内容
针对现有技术的不足,本发明提供一种可以提高机房的管理水平的信息化机房故障点影响范围分析***及方法,用来协助机房管理人员及时发现故障点,并通过智能分析,向管理员提供该故障点可能影响到的设备和应用***。
本发明为实现上述目的所采用的技术方案是:一种信息化机房故障点影响范围分析***,其中,数据采集模块连接被监控对象,采集被监控对象的状态信息;任务调度模块连接数据采集模块,接收数据采集模块发送的被监控对象的状态信息;任务调度模块连接故障信息处理模块,调度故障信息处理模块进行故障判断;其特征在于:任务调度模块连接故障影响分析模块,调度故障影响分析模块分析故障影响。
所述任务调度模块为负责***整体业务调度和控制,同时将数据进行汇总、缓存和同步的模块。
所述故障影响分析模块为负责分析故障点影响范围的模块。
还包括***运行监控模块与任务调度模块连接,接收任务调度模块的实时数据,对其运行情况进行监控。
一种信息化机房故障点影响范围分析方法,包括以下过程:
步骤1:对机房中设备和应用***进行数据建模,并定义被监测对象故障判断规则和故障影响范围判断规则;
步骤2:任务调度模块调度数据采集模块采集被监测对象的实时状态信息;
步骤3:故障信息处理模块根据故障判断规则判断当前被监测对象的故障状态;
步骤4:当被监测对象为故障状态时,故障影响分析模块根据故障影响范围判断规则判断当前故障影响范围。
所述故障判断规则为:根据需求设定每个被监测对象的非故障范围,则超出非故障范围判定为故障状态。
所述故障影响范围判断规则包括网络拓扑判断规则和应用***判断规则。
所述网络拓扑判断规则为找出与故障点相关的网络拓扑设备,设备范围为故障影响范围。
所述应用***判断规则为找出与故障点相关的应用***,以及与该***有逻辑关系的应用***,应用***范围为故障影响范围。
本发明具有以下有益效果及优点:
1.本发明故障点的判断以及故障影响范围分析都采用基于表达式的规则定义方式,处理灵活,扩展性强,效率高。
2.本发明从机房整体作为分析对象,综合考虑了设备、网络、应用、机房环境多种因素对故障点进行影响范围分析,相比现有的其它***,具有更高的判断准确性和技术先进性。
附图说明
图1是本发明的总体结构关系图;
图2是本发明的模块结构图。
具体实施方式
下面结合附图及实施例对本发明做进一步的详细说明。
如图1所示为本发明的总体结构关系图,本发明的***是一种多层次、模块化、支持分布式部署的信息化***,它主要可分为三个层次,从下向上依次为数据存储层、平台功能层和业务应用层。
数据存储层由平台数据中心组成,平台数据中心包括了***运行所依赖的底层的模型定义数据和业务数据,以及操作这些数据的接口方法。
平台数据中心包括的数据主要有监控模型数据(包括设备、***、机房环境对象信息及监测点定义等数据)、故障判断规则模型、故障范围分析模型等数据定义,另外还包括***运行时采集的业务数据和生成的日志信息。这些数据的存储方式有多种选择方式,如数据库、文件等。
平台数据中心可以独立部署,也可以与整个***共同部署,它提供数据访问接口供上层应用调用,提高了***部署的灵活性。
如图1所示,平台功能层是***的核心部分,它又可以进一步分为任务调度模块、数据采集模块、故障信息处理模块、故障影响分析模块、***运行监控模块等几部分。
平台***初始化的时候,会通过平台数据中心加载各种模型数据、网络拓扑信息、应用***关系数据、故障判断规则、故障影响范围规则等基础数据,特别是对网络拓扑信息、应用***关系数据,平台会根据它们的逻辑关系生成有向图模型,以便于数据的遍历和处理。
如图2所示为本发明的模块结构图,任务调度模块与数据采集模块是两个相对独立的子***,可以分布式部署,通过网络实现互联,提高***的灵活性和扩展性。任务调度模块是***的核心业务调度模块,同时负责业务数据的缓存及同步;数据采集模块涵盖了数据采集协议的解析、采集数据处理、数据采集等底层功能,实现外部监测数据的接入。
故障信息处理模块的运行依赖任务调度模块,它以采集数据、故障判断规则为基础数据进行计算,完成监控点状态的判断,实现故障信息的生成和日志记录。
故障影响分析模块由任务调用模块调用,它以故障信息处理模块生成的报警信息、故障范围分析规则为基础数据进行分析计算,得出当前故障影响的范围,或者引起当前故障的潜在故障源信息。
***运行监控模块,是平台管理员对平台运行情况进行监控的接口,保证***的安全稳定运行。
业务应用层根据具体的业务需求,提供用户与***交互的人机界面,完成用户的业务操作。它分为应用控制中心和各类应用页面两部分,应用控制中心负责平台核心模块与业务页面的连接,实现业务模型分析、业务数据处理、页面数据解析、数据质量校验等核心功能;各类应用页面负责数据的显示和对用户操作的响应。

Claims (9)

1.一种信息化机房故障点影响范围分析***,其中,数据采集模块连接被监控对象,采集被监控对象的状态信息;任务调度模块连接数据采集模块,接收数据采集模块发送的被监控对象的状态信息;任务调度模块连接故障信息处理模块,调度故障信息处理模块进行故障判断;其特征在于:任务调度模块连接故障影响分析模块,调度故障影响分析模块分析故障影响。
2.根据权利要求1所述的信息化机房故障点影响范围分析***,其特征在于:所述任务调度模块为负责***整体业务调度和控制,同时将数据进行汇总、缓存和同步的模块。
3.根据权利要求1所述的信息化机房故障点影响范围分析***,其特征在于:所述故障影响分析模块为负责分析故障点影响范围的模块。
4.根据权利要求1所述的信息化机房故障点影响范围分析***,其特征在于:还包括***运行监控模块与任务调度模块连接,接收任务调度模块的实时数据,对其运行情况进行监控。
5.一种信息化机房故障点影响范围分析方法,其特征在于,包括以下过程:
步骤1:对机房中设备和应用***进行数据建模,并定义被监测对象故障判断规则和故障影响范围判断规则;
步骤2:任务调度模块调度数据采集模块采集被监测对象的实时状态信息;
步骤3:故障信息处理模块根据故障判断规则判断当前被监测对象的故障状态;
步骤4:当被监测对象为故障状态时,故障影响分析模块根据故障影响范围判断规则判断当前故障影响范围。
6.根据权利要求5所述的信息化机房故障点影响范围分析方法,其特征在于,所述故障判断规则为:根据需求设定每个被监测对象的非故障范围,则超出非故障范围判定为故障状态。
7.根据权利要求5所述的信息化机房故障点影响范围分析方法,其特征在于:所述故障影响范围判断规则包括网络拓扑判断规则和应用***判断规则。
8.根据权利要求7所述的信息化机房故障点影响范围分析方法,其特征在于:所述网络拓扑判断规则为找出与故障点相关的网络拓扑设备,设备范围为故障影响范围。
9.根据权利要求7所述的信息化机房故障点影响范围分析方法,其特征在于:所述应用***判断规则为找出与故障点相关的应用***,以及与该***有逻辑关系的应用***,应用***范围为故障影响范围。
CN201410652779.5A 2014-11-14 2014-11-14 一种信息化机房故障点影响范围分析***及方法 Pending CN105591788A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410652779.5A CN105591788A (zh) 2014-11-14 2014-11-14 一种信息化机房故障点影响范围分析***及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410652779.5A CN105591788A (zh) 2014-11-14 2014-11-14 一种信息化机房故障点影响范围分析***及方法

Publications (1)

Publication Number Publication Date
CN105591788A true CN105591788A (zh) 2016-05-18

Family

ID=55931047

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410652779.5A Pending CN105591788A (zh) 2014-11-14 2014-11-14 一种信息化机房故障点影响范围分析***及方法

Country Status (1)

Country Link
CN (1) CN105591788A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112486715A (zh) * 2019-09-12 2021-03-12 华为技术有限公司 车载***异常处理的方法及装置

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102608939A (zh) * 2012-01-19 2012-07-25 山西省电力公司电力通信中心 三维机房监控***及方法
CN102724071A (zh) * 2012-06-19 2012-10-10 国网电力科学研究院 基于网络模型和规则模型的电力通信故障预警分析方法及其***
CN103048965A (zh) * 2012-12-17 2013-04-17 江苏省电力公司 一种动态机房承载视频的可视化集中监控***
CN103095488A (zh) * 2012-12-14 2013-05-08 北京思特奇信息技术股份有限公司 一种自助终端外设硬件状态监控***及方法
CN103178991A (zh) * 2011-12-21 2013-06-26 ***通信集团黑龙江有限公司 一种多网络关系分析的方法和***
CN103259333A (zh) * 2013-03-30 2013-08-21 国家电网公司 智能告警及故障综合分析***
CN104125094A (zh) * 2014-06-12 2014-10-29 国家电网公司 国家电网通信网络故障处理***及故障处理方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103178991A (zh) * 2011-12-21 2013-06-26 ***通信集团黑龙江有限公司 一种多网络关系分析的方法和***
CN102608939A (zh) * 2012-01-19 2012-07-25 山西省电力公司电力通信中心 三维机房监控***及方法
CN102724071A (zh) * 2012-06-19 2012-10-10 国网电力科学研究院 基于网络模型和规则模型的电力通信故障预警分析方法及其***
CN103095488A (zh) * 2012-12-14 2013-05-08 北京思特奇信息技术股份有限公司 一种自助终端外设硬件状态监控***及方法
CN103048965A (zh) * 2012-12-17 2013-04-17 江苏省电力公司 一种动态机房承载视频的可视化集中监控***
CN103259333A (zh) * 2013-03-30 2013-08-21 国家电网公司 智能告警及故障综合分析***
CN104125094A (zh) * 2014-06-12 2014-10-29 国家电网公司 国家电网通信网络故障处理***及故障处理方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112486715A (zh) * 2019-09-12 2021-03-12 华为技术有限公司 车载***异常处理的方法及装置

Similar Documents

Publication Publication Date Title
CN107330056B (zh) 基于大数据云计算平台的风电场scada***及其运行方法
CN102518553B (zh) 一种用于风电场群的远程实时监控***
CN103136976B (zh) 一种实现电网变电站一体化仿真的方法
CN102882969B (zh) 一种工矿企业的安全生产云服务平台
CN103283208B (zh) 基于云计算的远程实时监控***
CN106651633A (zh) 一种基于大数据技术的用电信息采集***及其采集方法
CN103559562A (zh) 电网智能运行***及其实现方法
CN106878466B (zh) 一种水电机组数据管理和设备控制一体化平台
CN106774062A (zh) 充电桩的采集与监控***和充电桩
CN104182902A (zh) 一种基于调度数据网集中运维***的监控方法
CN105262210A (zh) 一种变电站网络安全性分析预警***和方法
CN106357414B (zh) 用于基站发电管理的信息交互方法和***
CN103560590B (zh) 电网智能调度架构及其实现方法
CN104463696A (zh) 电网运行风险识防方法及***
CN103400516A (zh) 调度自动化仿真培训***和方法
CN104462730A (zh) 电厂在线仿真***和方法
CN107480027A (zh) 一种分布式深度学习运维***
US20230350369A1 (en) Integrated management and control system for power plant
CN113627656A (zh) 基于区块链的电力安全管控方法
CN102169343B (zh) 电网集中监控中心程序化遥控操作***及其操作方法
CN113922502B (zh) 一种智能视频运维管理***及管理方法
CN110245163A (zh) 一种电力***运行隐患排查方法
CN202711028U (zh) 梯级水电站群联合优化调控***
CN105591788A (zh) 一种信息化机房故障点影响范围分析***及方法
CN107832857A (zh) 一种智慧城市的低压配电网***

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20160518