CN100403273C - 基于双向信息流的分布式监控方法 - Google Patents

基于双向信息流的分布式监控方法 Download PDF

Info

Publication number
CN100403273C
CN100403273C CNB031472559A CN03147255A CN100403273C CN 100403273 C CN100403273 C CN 100403273C CN B031472559 A CNB031472559 A CN B031472559A CN 03147255 A CN03147255 A CN 03147255A CN 100403273 C CN100403273 C CN 100403273C
Authority
CN
China
Prior art keywords
monitoring
information
party
control
faults
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CNB031472559A
Other languages
English (en)
Other versions
CN1485737A (zh
Inventor
范中磊
许鲁
韩月
王敏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Zhongke Blue Whale Information Technology Co Ltd
Original Assignee
Institute of Computing Technology of CAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Institute of Computing Technology of CAS filed Critical Institute of Computing Technology of CAS
Priority to CNB031472559A priority Critical patent/CN100403273C/zh
Publication of CN1485737A publication Critical patent/CN1485737A/zh
Application granted granted Critical
Publication of CN100403273C publication Critical patent/CN100403273C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Debugging And Monitoring (AREA)
  • Multi Processors (AREA)
  • Computer And Data Communications (AREA)

Abstract

一种基于双向信息流的分布式监控方法,包括:位于监控方上的监测模块(5)从被监控方接收监测信息;位于监控方上的中心控制与分析模块(7)从监测模块(5)接收监测信息并对接收的监测信息进行分析决策;位于被监控方上的控制信息通道接口(9),接收来自中心控制与分析模块(7)的文件数据和控制命令数据。当监控方发现被监控方出现故障或存在潜在的故障时,便根据不同的故障确定相应的处理方案,然后通过控制信息通道下载相应的处理程序到被监控方并执行,排除故障。这样,就大大提高了监控方对被监控方的控制能力,实现了自动的故障分析和排除。从而不仅使故障得到及时处理,提高了整个机群***的性能和可用性,而且为***的升级和维护带来了很大的方便,极大地节省了人力、物力和财力。

Description

基于双向信息流的分布式监控方法
技术领域
本发明涉及信息技术领域,特别涉及一种基于双向信息流的分布式监控方法。
背景技术
随着网络技术的迅速发展,基于网络互联的各种分布式应用***也逐渐增多。如提供WWW服务的Web服务器机群、提供数据库服务的数据库服务器机群、提供计算服务的计算服务器机群等。在很多应用场合,如数据中心、电子商务、科学计算等,机群中包含大量的服务器节点和网络设备,往往是少则几十个,多则成百上千个,而且这些服务器节点和设备的物理位置的分布范围也可能是很广的。如何对上述这样的分布式***进行有效地监测和控制,以能够及时地发现并排除***中已存在的和潜在的故障,保证***高效可靠的运行,便成为分布式监控***需要解决的问题。
传统的分布式监控***大多集中在信息获取方面,也就是监测方面,而在对***的控制能力上相对是比较弱的,特别是在自动控制能力上就更加薄弱了。比较有代表性的就是基于简单网络管理协议(SNMP)的监控***,其大多数***都是利用SNMP来获取所需的信息,加以显示和分析,当发现一些可能的问题时便通知管理员,通过人工干预进行故障发现和排除。这种人工控制方式往往会导致***的故障不能及时得到处理,影响整个***的工作。在有大量节点,而且节点物理位置分布广泛的机群应用中,这个问题会更加突出,同时导致人力、物力和财力的花费。
对传统的分布式监控***结构进行分析,我们发现,导致上述问题的一个重要原因就是其信息流大多是单向的,即信息大多是从被监控方流向监控方,而缺乏一个有效的从监控方到被监控方的控制信息流。尽管像SNMP协议也提供了从监控方到被监控方的信息流功能,但其功能很弱,一般只能通过其进行字符型或整型数据的传送,很难满足一些复杂控制的需求。例如监控方远程下载某个故障处理程序到被监控方并运行,排除故障。
图1为传统的分布式监控***结构示意图。被监控方1通过其上的监控代理2传送监测信息3到监控方4,监控方4上的监测、显示和报警5接受其所需的监测信息3,进行显示或报警等;监控方4上的监测、显示和报警5也可以通过被监控方1上的监控代理2向其传送手符型或整型数据信息6,进行一些阈值的设定等。
发明内容
本发明的目的是提出一种基于双向信息流的分布式监控***结构和方法。
为实现上述目的,一种基于双向信息流的分布式监控方法,包括:
位于监控方上的监测模块5从被监控方接收监测信息;
位于监控方上的中心控制与分析模块7从监测模块5接收监测信息并对接收的监测信息进行分析决策;
位于被监控方上的控制信息通道接口9,接收来自中心控制与分析模块7的文件数据和控制命令数据并执行来自中心控制与分析模块7的控制命令,然后,返回结果给中心控制与分析模块7。
采用这种结构,当监控方发现被监控方出现故障或存在潜在的故障时,便根据不同的故障确定相应的处理方案,然后通过控制信息通道下载相应的处理程序到被监控方并执行,排除故障。这样,就大大提高了监控方对被监控方的控制能力,实现了自动的故障分析和排除。从而不仅使故障得到及时处理,提高了整个机群***的性能和可用性,而且为***的升级和维护带来了很大的方便,极大地节省了人力、物力和财力。
具体实施方式
图2为基于双向信息流的分布式监控***结构示意图。与图1所示的传统分布式监控***结构相比,其不同在于,监控方4上的监测、显示和报警模块5接受到监测信息3之后,将其传送到中心分析和控制模块7,中心控制与分析模块7对接受的监测信息3进行分析决策,通过其上的控制信息通道接口8和被监控方上1的控制信息通道接口9传送文件数据或控制命令数据10到被监控方1,并控制被监控方1执行所需的处理程序或控制命令。
采用基于双向信息流的分布式监控***,当监控方的分析控制软件发现被监控方出现故障或存在潜在的故障时,便可以根据需要,主动地、有针对性地、动态地下载一些故障检测程序到被监控方,改变被监控方的监测信息(如增加或减少监视信息的节点种类和上报频率、提高监视信息密度等),为其提供分析控制所需的监测信息;在获取充分的监测信息之后,通过故障原因分析,最终定位故障原因;针对其故障,确定相应的处理方案,并通过控制信息通道下载相应的处理程序到被监控方并执行,排除故障。这样,就大大提高了监控方对被监控方的控制能力,实现了自动的故障分析和排除。从而不仅使故障得到及时处理,提高了整个机群***的性能和可用性,而且为***的升级和维护带来了很大的方便,极大地节省了人力、物力和财力。
图3给出了基于双向信息流分布式监控***结构的一种实施方式。其工作流程描述如下:
(1)监控方4上的中心控制与分析模块7通过其上SNMP程序5定购其所需的监测信息,SNMP程序5将定购信息转化为SNMP SET信息6传送到被监控方1上的SNMP程序2;
(2)被监控方1上的SNMP程序2根据收到的定购信息进行处理,将监控方4所需的监测信息转化为SNMP GET信息3传送到监控方4上的SNMP程序5,监控方4上的SNMP程序5对收到的监测信息进行整理和预处理之后,将其传给监控方4上的中心分析和控制模块7;
(3)中心控制与分析模块7对接受到的监测信息进行分析、处理和决策,如有必要,决定动态增加监视信息节点,进一步收集***信息;(这一步骤有可能被多次重复)
(4)中心控制与分析7对接受到的监测信息进行分析、处理和决策,从文件和控制命令库13中获取所需的文件和控制命令属性信息14,转化为相应的控制命令,通过其上的控制命令发送接口8传送控制命令数据10到被监控方上1的控制命令接受和执行程序9;
(5)被监控方上1的控制命令接受和执行程序9根据所接受的控制命令,采取相应的处理。如果是运行已经下载的程序或***命令,则直接控制执行;如果是需要下载文件,则调用被监控方1上的FTP客户端程序11下载文件;
(6)被监控方1上的FTP客户端程序11接受来自控制命令接受和执行程序9的下载命令17后,发送文件访问请求15到监控方4上的FTP服务器程序12,FTP服务器程序12从文件和控制命令库13中取得文件数据16,将其传递给FTP客户端程序11,FTP客户端程序11在完成文件传输后,返回结果给控制命令接受和执行程序9;
(7)控制命令接受和执行程序9接受FTP客户端程序11的返回结果以及其直接控制运行程序的返回结果,通过监控方4上的控制命令发送接口8返回结果给中心分析和控制模块7。
这样,就实现了从信息的定购、采集、分析处理、故障发现到故障排除的自动化。当然,这只是一种实施方式,根据具体的应用环境还会有其它的实施方式。如不采用FTP协议传递文件等。

Claims (5)

1.一种基于双向信息流的分布式监控方法,包括:
位于监控方上的监测模块(5)从被监控方接收监测信息;
位于监控方上的中心控制与分析模块(7)从监测模块(5)接收监测信息并对接收的监测信息进行分析决策;
位于被监控方上的控制信息通道接口(9),接收来自中心控制与分析模块(7)的文件数据和控制命令数据并执行来自中心控制与分析模块(7)的控制命令,然后,返回结果给中心控制与分析模块(7)。
2.按权利要求1所述的方法,其特征在于:所述监测模块(5)包括显示和报警功能。
3.按权利要求1所述的方法,其特征在于:所述文件数据是包括故障监测程序和故障处理程序的各种可执行程序和配置文件。
4.按权利要求1所述的方法,其特征在于:所述控制命令数据包括下载文件命令、运行程序命令和***命令。
5.按权利要求1所述的方法,其特征在于:所述控制命令存储在监控方的数据库中。
CNB031472559A 2003-07-10 2003-07-10 基于双向信息流的分布式监控方法 Expired - Fee Related CN100403273C (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CNB031472559A CN100403273C (zh) 2003-07-10 2003-07-10 基于双向信息流的分布式监控方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CNB031472559A CN100403273C (zh) 2003-07-10 2003-07-10 基于双向信息流的分布式监控方法

Publications (2)

Publication Number Publication Date
CN1485737A CN1485737A (zh) 2004-03-31
CN100403273C true CN100403273C (zh) 2008-07-16

Family

ID=34156127

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB031472559A Expired - Fee Related CN100403273C (zh) 2003-07-10 2003-07-10 基于双向信息流的分布式监控方法

Country Status (1)

Country Link
CN (1) CN100403273C (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101529795B (zh) * 2006-11-02 2013-03-13 皇家飞利浦电子股份有限公司 分布式设备撤销
CN102811208B (zh) * 2011-06-03 2016-08-03 深圳市汇川控制技术有限公司 通信桥接***及方法
CN102833216B (zh) * 2011-06-16 2017-05-03 深圳市汇川控制技术有限公司 通信桥接装置
US9942245B2 (en) * 2014-06-27 2018-04-10 Siemens Aktiengesellschaft Resilient control design for distributed cyber-physical systems
CN104991528B (zh) * 2015-05-14 2018-02-13 福州福大自动化科技有限公司 Dcs信息安全控制方法及控制站

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1195137A (zh) * 1996-12-20 1998-10-07 日本电气株式会社 用于错误监测***的错误信息报告***
CN1252875A (zh) * 1997-02-28 2000-05-10 全斯美达有限公司 纠正计算机***内错误的方法和装置
CN1260538A (zh) * 1999-12-22 2000-07-19 杭州南望电力科技有限公司 远程图像监控服务器
US6256748B1 (en) * 1997-04-29 2001-07-03 Bull, S.A. Method and device for connecting a data processing system central unit to a redundancy data storage subsystem
CN1349164A (zh) * 2001-12-04 2002-05-15 上海复旦光华信息科技股份有限公司 主机性能监测及自动反应***
CN1388722A (zh) * 2001-05-28 2003-01-01 深圳市中兴通讯股份有限公司上海第二研究所 分布式phs基站***本地程序下载方法和装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1195137A (zh) * 1996-12-20 1998-10-07 日本电气株式会社 用于错误监测***的错误信息报告***
CN1252875A (zh) * 1997-02-28 2000-05-10 全斯美达有限公司 纠正计算机***内错误的方法和装置
US6256748B1 (en) * 1997-04-29 2001-07-03 Bull, S.A. Method and device for connecting a data processing system central unit to a redundancy data storage subsystem
CN1260538A (zh) * 1999-12-22 2000-07-19 杭州南望电力科技有限公司 远程图像监控服务器
CN1388722A (zh) * 2001-05-28 2003-01-01 深圳市中兴通讯股份有限公司上海第二研究所 分布式phs基站***本地程序下载方法和装置
CN1349164A (zh) * 2001-12-04 2002-05-15 上海复旦光华信息科技股份有限公司 主机性能监测及自动反应***

Also Published As

Publication number Publication date
CN1485737A (zh) 2004-03-31

Similar Documents

Publication Publication Date Title
CN110519365B (zh) 一种变更设备业务的方法和业务变更***
EP3072260B1 (en) Methods, systems, and computer readable media for a network function virtualization information concentrator
US20040024859A1 (en) Method and apparatus for communications network resource utilization assessment
CN103546343B (zh) 网络流量分析***的网络流量展示方法和***
US8498635B2 (en) Dynamic fault analysis for a centrally managed network element in a telecommunications system
KR102001898B1 (ko) 알람 정보 처리 방법, 관련 디바이스 및 시스템
EP3780496B1 (en) Feature engineering programming method and apparatus
CN112929187B (zh) 网络切片管理方法、装置和***
US20190335349A1 (en) Assurance framework for cp and dp slices
KR102338425B1 (ko) 인공지능 기반 모니터링 대상 서버의 어플리케이션 자동 설정 및 모니터링 방법, 장치 및 시스템
CN108563455A (zh) 一种k-ux操作***上中间件部署方法、***及设备
CN108021485A (zh) 应用程序运行状态的监控方法及装置
CN104809506A (zh) 房间信息交互方法、装置及***
CN110855481B (zh) 数据采集***及方法
CN107463490B (zh) 一种应用于平台开发中的集群日志集中收集方法
CN100403273C (zh) 基于双向信息流的分布式监控方法
JP2016146020A (ja) データ分析システム及び分析方法
US6779186B2 (en) Method for operating and maintenance by base station using remote procedure call in IMT-2000 system
JP3766540B2 (ja) 通知サービスを含むネットワークにおける通知伝送方法とこれを利用するためのネットワーク
CN102238571B (zh) 物联网m2m业务处理的装置、***以及方法
CN113760634A (zh) 一种数据处理方法和装置
CN112235164A (zh) 一种基于控制器的神经网络流量预测装置
CN108989116B (zh) 大数据收集分析***及方法
CN115080363B (zh) 一种基于业务日志的***容量评估方法及装置
KR101536350B1 (ko) 유무선 센서네트워크 기반 생산자원 자율 관리시스템

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
ASS Succession or assignment of patent right

Owner name: TIANJIN ZHONGKE BLUE WHALE INFORMATION TECHNOLOGY

Free format text: FORMER OWNER: INST. OF COMPUTING TECHN. ACADEMIA SINICA

Effective date: 20091204

C41 Transfer of patent application or patent right or utility model
TR01 Transfer of patent right

Effective date of registration: 20091204

Address after: Tianjin New Technology Industrial Park Huayuan Industrial Park Haitai development 6 Road 6 green industrial base F 5 gate 201.

Patentee after: Tianjin Branch Blue Whale Information Technology Co., Ltd.

Address before: No. 6 South Road, Zhongguancun Academy of Sciences, Beijing

Patentee before: Institute of Computing Technology, Chinese Academy of Sciences

ASS Succession or assignment of patent right

Owner name: BEIJING ZHONGKE BLUEWHALE INFORMATION TECHNOLOGY C

Effective date: 20140813

C41 Transfer of patent application or patent right or utility model
TR01 Transfer of patent right

Effective date of registration: 20140813

Address after: 300384 Tianjin Huayuan Industrial Park New Technology Industrial Park Development Road No. 6 6 Haitai green industry base building F 5 door No. 201

Patentee after: Tianjin Branch Blue Whale Information Technology Co., Ltd.

Patentee after: Beijing Zhongke blue whale Information Technology Co., Ltd.

Address before: 300384 Tianjin Huayuan Industrial Park New Technology Industrial Park Development Road No. 6 6 Haitai green industry base building F 5 door No. 201

Patentee before: Tianjin Branch Blue Whale Information Technology Co., Ltd.

CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20080716

Termination date: 20210710

CF01 Termination of patent right due to non-payment of annual fee