CN101206610A - 计算机运行事件的管理***及其方法 - Google Patents

计算机运行事件的管理***及其方法 Download PDF

Info

Publication number
CN101206610A
CN101206610A CNA2006101701165A CN200610170116A CN101206610A CN 101206610 A CN101206610 A CN 101206610A CN A2006101701165 A CNA2006101701165 A CN A2006101701165A CN 200610170116 A CN200610170116 A CN 200610170116A CN 101206610 A CN101206610 A CN 101206610A
Authority
CN
China
Prior art keywords
level
event report
event
equipment
report
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA2006101701165A
Other languages
English (en)
Inventor
杜萱
庄钦平
陈玄同
刘文涵
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Inventec Corp
Original Assignee
Inventec Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Inventec Corp filed Critical Inventec Corp
Priority to CNA2006101701165A priority Critical patent/CN101206610A/zh
Publication of CN101206610A publication Critical patent/CN101206610A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Debugging And Monitoring (AREA)

Abstract

一种计算机运行事件的管理***及其方法,其***包含有事件配置模块、事件管理模块与事件处理模块。通过事件配置模块配置处理至少一设备在状态变更时产生的至少一事件报告的处理程序,并定义各个事件报告的处理级别,接着,事件管理模块接收各个事件报告,并根据事件处理程序与处理级别进行转发程序,最后,由事件处理模块进行事件处理程序,由此提升计算机运行事件的处理效率与可靠性。

Description

计算机运行事件的管理***及其方法
技术领域
本发明涉及一种设备事件的管理***及其方法,特别是一种计算机运行事件的管理***及其方法。
背景技术
在计算机运行过程中产生的事件(indication)往往会影响计算机是否可以继续正常运作,而上述事件可以例如是设备状态变更、操作发生等,计算机会收集这些事件信息并视需要进行处理,例如产生警报信息通知管理者等采取补救措施。
目前常见的事件处理方法有轮询(polling)方式与中断处理方式两种。其中轮询方式即由事件管理模块轮询每一个接受控管的设备,当查询到某个设备产生了待处理事件时,则事件管理模块进行待处理事件的处理程序,直到待处理事件处理完毕后转回轮询过程。但是轮询方式的事件处理方法具有以下缺点:(1)每隔一定的时间(轮询周期)事件管理模块就要被唤起进行轮询,即便没有任何事件产生,轮询过程也不可缺少,因此这个轮询常驻程序(daemon)的运行无疑需要***资源的额外开销,可以说是一种浪费。(2)无论设备在何时产生事件,必须等到轮询常驻程序作轮询之后才能够被发现,所以轮询方式对事件的处理是非实时性的,而且轮询周期越大事件就越得不到实时的处理。(3)轮询常驻程序发现有事件时便去处理该事件,在处理完毕后返回主常驻程序继续轮询,如果在处理事件的过程中出现了异常导致程序无法返回,便会使常驻程序异常当掉或是退出,所以可靠性较低。
而相较于轮询方式的事件处理方法,中断方式的事件处理方法虽然提高了可靠性,且大部分事件也能够得到实时的处理。但是当设备同时产生较多事件的时候,事件的处理往往需要排队等候,换句话说,较重要的事件(例如,设备毁损)不能得到实时处理。
发明内容
鉴于以上的问题,本发明的主要目的在于提供一种计算机运行事件的管理***及其方法,利用对设备产生的事件报告进行分级管理,并根据级别顺序处理计算机运行事件,由此提升计算机运行事件的处理效率与可靠性。
根据本发明所公开的计算机运行事件的管理***,包括有事件配置模块、事件管理模块与一个以上的事件处理模块。
首先,通过事件配置模块配置一事件处理程序,而事件处理程序用于处理至少一个设备在状态变更时产生的至少一个事件报告,并定义各个事件报告的处理级别。接着,利用事件管理模块接收各个设备在状态变更时产生的各个事件报告,并根据事件配置模块配置的事件处理程序与处理级别进行一转发程序。最后,由事件处理模块接收事件管理模块转发的事件处理程序,并进行事件处理程序。
根据本发明所公开的计算机运行事件的管理方法,包括有下列步骤:首先,配置处理至少一个设备在状态变更时产生的至少一个事件报告,并定义各个事件报告的处理级别,接着,接收各个设备在状态变更时产生的各个事件报告,并根据事件处理程序与处理级别进行一转发程序,最后,进行事件处理程序。
通过这种计算机运行事件的管理***及其方法,至少可以达到下列的有益效果:
(1)利用设备在状态变更时主动产生的事件报告,以节省查询事件的***资源开销,且通过多个事件处理模块并行处理各个事件,由此提升处理效率。
(2)根据所产生事件的重要级别对事件进行不同顺序的处理,以提升重要事件的处理实时性。
(3)利用监控单元对于各个事件进行记录,并在预定时间内事件未处理完成时,持续发出通知信息给管理者,以使管理者对计算机状况进行持续性追踪和维护。
下面结合具体实施例及其所示附图,对本发明作进一步详细说明。
附图说明
图1为本发明实施例的***方框图;
图2为本发明实施例的流程图。
其中,附图标记说明如下:
10事件配置模块
20事件管理模块
21监控单元
30事件处理模块
40设备
步骤100配置处理至少一设备在状态变更时产生的至少一事件报告的事件处理程序
步骤101定义各个事件报告的处理级别
步骤102接收各个设备在状态变更时产生的各个事件报告
步骤103是否为第一级别事件?
步骤104记录各个事件报告
步骤105是否有来自同一设备的第二或第三级别事件?
步骤106清除来自同一设备的第二或第三级别事件报告记录
步骤107根据事件处理程序与处理级别进行一转发程序
步骤108进行事件处理程序
步骤109预定时间内第二或第三级别事件报告记录未清除?
具体实施方式
参照图1,其为本发明实施例的***的方框图。如图1所示,本发明实施例的计算机运行事件的管理***,包含有事件配置模块10、事件管理模块20与一个以上的事件处理模块30,以下就各模块、单元进行说明。
事件配置模块10,用于配置一事件处理程序,而事件处理程序用于处理至少一个设备在状态变更时产生的至少一个事件报告,换句话说,事件配置模块10用于配置各个事件报告所对应的事件处理模块30与处理方法,并定义各个事件报告的处理级别。其中处理级别可以区分为第一级别、第二级别与第三级别,而各个级别的定义说明如下:
第一级别:其对应于各个设备40的操作事件报告,可以例如是数据创建或数据删除等动作。一般来说,第一级别事件有两种来源:一是由管理者发起,是由人为处理操作产生的并且经过认证和确认,对计算机正常运行没有负面影响;二是设备状态由其它状态转变为正常。
第二级别:其对应于各个设备40的警报事件报告,可以例如磁盘健康状况、磁盘阵列降格(Raid Degrade)等。第二级别事件发生时,设备40还可以使用,但存在进一步恶化的可能性。当第二级别事件产生时,如果有正在被处理的来自同一设备40的第一级别事件,那么第一级别事件的处理过程将被打断,换句话说,第二级别事件的处理顺序优先于第一级别事件。
第三级别:其对应于各个设备40的损坏事件报告。此类事件对计算机运行的影响大,需要立即进行处理。当第三级别事件产生时,如果有正在被处理的来自同一设备40中的第一级别事件,那么第二级别事件的处理过程将被打断。其中第三级别事件的处理顺序优先于第二级别事件。
事件管理模块20,用于接收各个设备40(例如,第一设备、第二设备、第三设备……第m设备)在状态变更时产生的各个事件报告,并根据事件配置模块10配置的事件处理程序与处理级别进行转发程序,而转发程序是按照处理级别的顺序将处理方法加以封装处理后转发到对应的事件处理模块30。其中事件管理模块20还包含有监控单元21,而监控单元21用于记录或清除由事件管理模块20接收的各个事件报告,当事件管理模块10接收到第二级别或第三级别的事件报告时,监控单元21则记录第二级别或第三级别的事件报告;当事件管理模块10接收到第一级别事件报告时,则继续判断监控单元21中是否有来自同一设备的第二或第三级别事件的记录;若有,则清除监控单元21的来自同一设备的第二或第三级别事件的记录。
一个以上的事件处理模块30(例如,第一事件处理模块、第二事件处理模块……第n事件处理模块),用于接收事件管理模块20转发的事件处理程序,并进行事件处理程序,而事件处理程序的内容包含有通过用户定义的渠道(如SNMP、Email等)通知用户;对于计算机能够自行处理的事件则调用预先定义的相应接口进行处理。如果是一些计算机无法自动处理的事件,就必须等用户介入采取相应措施。
参照图2,其为本发明实施例的流程图。如图2所示,本发明实施例的计算机运行事件的管理方法,包含有下列步骤:
首先,管理者利用事件配置模块10配置处理至少一个设备在状态变更时产生的至少一个事件报告的事件处理程序(步骤100),并定义各个事件报告的处理级别(步骤101)。其中处理级别可区分为第一级别:是对应于各个设备的操作事件报告;第二级别:是对应于各个设备的警告事件报告;第三级别:是对应于各个设备的损坏事件报告。
接着,事件管理模块20接收各个设备在状态变更时产生的各个事件报告(步骤102),事件管理模块20判断各个事件报告是否为第一级别事件?(步骤103),当事件管理模块20判断各个事件报告为第二或第三级别事件时,监控单元21则记录各个设备产生的第二或第三级别事件(步骤104);当事件管理模块20判断各个事件报告为第一级别事件时,则继续判断监控单元21中是否有来自同一设备的第二或第三级别事件?(步骤105),若监控单元21中有来自同一设备的第二或第三级别事件时,则清除监控单元21中来自同一设备的第二或第三级别事件报告记录(步骤106)。
接着,事件管理模块20根据事件处理程序与处理级别进行一转发程序(步骤107)。其中转发程序是按照处理级别的顺序将处理方法加以封装处理后转发到对应的事件处理模块30。
在步骤104的记录各个设备产生的第二或第三级别事件后、步骤105的监控单元21中无来自同一设备的第二或第三级别事件后以及步骤106的清除监控单元21中来自同一设备的第二或第三级别事件报告记录后,事件处理模块30进行事件处理程序(步骤108),在预定时间内第二或第三级别事件报告记录仍未清除?(步骤109),则回到步骤107,再次进行该转发程序。在预定时间内第二或第三级别事件报告记录已清除时,则回到步骤102继续接收各个设备在状态变更时产生的各个事件报告。
以下举一个应用例子作说明:
首先,计算机对设备D1预先定义了以下三个事件:第一级别事件EL1、第二级别事件EM1与第三级别事件EI1。
在第一时间t1时,设备D1上产生了第二级别事件EM1,于是设备D1将这一事件告知事件管理模块20,而事件管理模块20在接收到之后发现其为第二级别事件EM1,于是在监控单元21中记录这个事件,并按照配置将第二级别事件EM1转发给事件处理模块30,由事件处理模块30完成对该事件的处理。
在第一时间t1之后的第二时间t2,事件处理模块30对第二级别事件EM1的处理尚未完成,而设备D1上产生了第三级别事件EI1,于是设备D1将这一事件告知事件管理模块20,而事件管理模块20接收到之后发现其为第三级别事件EI1,于是将其记录在监控单元21中,并按照配置将第三级别事件EI1转发给事件处理模块30,由于第二级别事件EM1的处理级别比第三级别事件EI1低且处理尚未完成,所以处理过程被打断,由事件处理模块30优先对第三级别事件EI1进行处理,等第三级别事件EI1处理完后才继续处理第二级别事件EM1。
接着,在第二时间t2之后的第三时间t3,监控单元21发现事件第三级别事件EI1被记录的时间超过了预定时间Δt(例如第三级别事件EI1自动处理失败或者第三级别事件EI1需要管理者介入),于是向事件管理模块20报告这一情况,而事件管理模块20接收到后再次将第三级别事件EI1转发给事件处理模块30进行处理。
在第三时间t3之后的第四时间t4,设备D1上产生了第一级别事件EL1,于是设备D1将这一事件告知事件管理模块20,而事件管理模块20接收到之后发现其为第一级别事件EL1,于是查询监控单元21,发现有来自同一设备(D1)的第二级别事件EM1与第三级别事件EI1,于是将第二级别事件EM1与第三级别事件EI1从监控单元21中清除,同时事件管理模块20按照配置将第一级别事件EL1转发给事件处理模块30,由事件处理模块30完成对第一级别事件EL1的处理。最后,监控单元21中来自设备D1的事件记录列表为空,代表设备D1已恢复至正常状态。
综合以上所述,本发明的计算机运行事件的管理***及其方法,是利用设备在状态变更时主动产生事件报告,以节省查询事件的***资源开销,并根据所产生事件的重要级别对事件进行不同顺序的处理,以提升重要事件的处理实时性。另外,利用监控单元对于各个事件进行记录,并在预定时间内事件未处理完成时,持续发出通知信息给管理者,以使管理者对计算机状况进行持续性追踪和维护。

Claims (12)

1.一种计算机运行事件的管理***,其特征在于,包含有:
一事件配置模块,用于配置一事件处理程序,该事件处理程序用于处理至少一设备在状态变更时产生的至少一事件报告,并定义所述事件报告的处理级别;
一事件管理模块,用于接收所述设备在状态变更时产生的所述事件报告,并根据该事件配置模块配置的该事件处理程序与该处理级别进行一转发程序;及
一个以上的事件处理模块,用于接收该事件管理模块转发的该事件处理程序,并进行该事件处理程序。
2.如权利要求1所述的计算机运行事件的管理***,其特征在于,该处理级别区分为:
一第一级别,其对应于所述设备的操作事件报告;
一第二级别,其对应于所述设备的警告事件报告;及
一第三级别,其对应于所述设备的损坏事件报告。
3.如权利要求2所述的计算机运行事件的管理***,其特征在于,该事件管理模块还包含有一监控单元,用于记录或清除所述事件报告。
4.如权利要求3所述的计算机运行事件的管理***,其特征在于,当该事件管理模块接收到该第二级别或该第三级别的所述事件报告时,该监控单元记录所述事件报告。
5.如权利要求3所述的计算机运行事件的管理***,其特征在于,当该事件管理模块接收到同一设备的该第一级别的所述事件报告时,该监控单元清除同一设备的该第二级别或该第三级别的所述事件报告。
6.如权利要求3所述的计算机运行事件的管理***,其特征在于,在一预定时间内,该监控单元中的该第二级别或该第三级别的所述事件报告未清除时,则该事件管理模块再次进行该转发程序。
7.一种计算机运行事件的管理方法,其特征在于,包含有下列步骤:
配置处理至少一设备在状态变更时产生的至少一事件报告;
定义所述事件报告的处理级别;
接收所述设备在状态变更时产生的所述事件报告;
根据该事件处理程序与该处理级别进行一转发程序;及
进行该事件处理程序。
8.如权利要求7所述的计算机运行事件的管理方法,其特征在于,该处理级别系区分为:
一第一级别,其对应于所述设备的操作事件报告;
一第二级别,其对应于所述设备的警告事件报告;及
一第三级别,其对应于所述设备的损坏事件报告。
9.如权利要求8所述的计算机运行事件的管理方法,其特征在于,在接收所述设备在状态变更时产生的所述事件报告的步骤后,还包含有记录或清除所述事件报告的步骤。
10.如权利要求9所述的计算机运行事件的管理方法,其特征在于,当接收到该第二级别或该第三级别的所述事件报告时,则记录所述事件报告。
11.如权利要求9所述的计算机运行事件的管理方法,其特征在于,当接收到同一设备的该第一级别的所述事件报告时,则清除同一设备的该第二级别或该第三级别的所述事件报告。
12.如权利要求9所述的计算机运行事件的管理方法,其特征在于,在一预定时间内,该第二级别或该第三级别的所述事件报告未清除时,则再次进行该转发程序。
CNA2006101701165A 2006-12-22 2006-12-22 计算机运行事件的管理***及其方法 Pending CN101206610A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CNA2006101701165A CN101206610A (zh) 2006-12-22 2006-12-22 计算机运行事件的管理***及其方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CNA2006101701165A CN101206610A (zh) 2006-12-22 2006-12-22 计算机运行事件的管理***及其方法

Publications (1)

Publication Number Publication Date
CN101206610A true CN101206610A (zh) 2008-06-25

Family

ID=39566837

Family Applications (1)

Application Number Title Priority Date Filing Date
CNA2006101701165A Pending CN101206610A (zh) 2006-12-22 2006-12-22 计算机运行事件的管理***及其方法

Country Status (1)

Country Link
CN (1) CN101206610A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103530173A (zh) * 2012-07-06 2014-01-22 上海宝信软件股份有限公司 动态权重事件处理***和方法
CN108199980A (zh) * 2017-12-29 2018-06-22 天津芯海创科技有限公司 交换芯片的事件监听方法和监听***
CN108234476A (zh) * 2017-12-29 2018-06-29 天津芯海创科技有限公司 交换芯片的事件监听方法和监听***

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103530173A (zh) * 2012-07-06 2014-01-22 上海宝信软件股份有限公司 动态权重事件处理***和方法
CN103530173B (zh) * 2012-07-06 2018-07-17 上海宝信软件股份有限公司 动态权重事件处理***和方法
CN108199980A (zh) * 2017-12-29 2018-06-22 天津芯海创科技有限公司 交换芯片的事件监听方法和监听***
CN108234476A (zh) * 2017-12-29 2018-06-29 天津芯海创科技有限公司 交换芯片的事件监听方法和监听***

Similar Documents

Publication Publication Date Title
CN110581773A (zh) 一种自动化服务监控与报警管理***
CN101222361B (zh) 一种告警频率监控器及告警处理方法
CN111339175B (zh) 数据处理方法、装置、电子设备及可读存储介质
CN106487574A (zh) 自动化运行维护监测***
CN101997925A (zh) 具有预警功能的服务器监控方法及其***
US8341637B2 (en) Utilization management
CN110659307A (zh) 一种事件流的关联分析方法与***
CN111143167B (zh) 用于多平台的告警归并方法及装置、设备、存储介质
CN104407959A (zh) 基于应用的监控方法及监控装置
CN104408654A (zh) 一种财务监控管理***
CN103763127A (zh) 一种设备状态告警监控方法及***
CN108304293A (zh) 一种基于大数据技术的软件***监控方法
CN103823743B (zh) 软件***的监控方法和设备
CN101206610A (zh) 计算机运行事件的管理***及其方法
CN112256548B (zh) 异常数据的监听方法、装置、服务器及存储介质
CN113672452A (zh) 一种数据采集任务的运行监控方法、***
CN103995759B (zh) 基于核内外协同的高可用计算机***故障处理方法及装置
CN101677278A (zh) 网络信息***可用性的监控方法及***
CN114090382B (zh) 超融合集群健康巡检方法和装置
CN115766768A (zh) 一种算力网络操作***中感知中枢设计方法及装置
CN110851316A (zh) 异常预警方法及装置、***、电子设备、存储介质
CN113868094A (zh) 一种大数据异常信息监控***
JP2008263237A (ja) アラーム管理方法およびその装置
CN110502404B (zh) 一种基于数据治理平台的预警处理方法及相关设备
CN115222181A (zh) 机器人运营状态监控***及方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication