CN1490982A - 网络故障分析监测方法及装置 - Google Patents
网络故障分析监测方法及装置 Download PDFInfo
- Publication number
- CN1490982A CN1490982A CNA031536328A CN03153632A CN1490982A CN 1490982 A CN1490982 A CN 1490982A CN A031536328 A CNA031536328 A CN A031536328A CN 03153632 A CN03153632 A CN 03153632A CN 1490982 A CN1490982 A CN 1490982A
- Authority
- CN
- China
- Prior art keywords
- information
- record
- network failure
- statistical
- module
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Maintenance And Management Of Digital Transmission (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
Abstract
本发明提供了一种网络故障分析监测方法,属于计算机网络通信领域,该方法包括:在任务进行切换重新调度时,对***日常工作的信息进行统计并记录到一个公用缓存区中,通过定时器定时从公用缓存区中搜集所统计的信息,并对统计信息进行分析监测,如监测到异常,输出到串口上给出提示警告,同时记录到***日志中以及非易失随机存取存储器中,并可根据需要随时读取统计信息的记录。在***发生问题时,能够提供定位的信息,以协助开发人员尽快有效的解决问题;在***看似正常的时候,可以提早发现***中隐藏的运行错误,及时定位、纪录、告警,提示工作人员关注问题模块。
Description
所属技术领域
本发明属于计算机网络通信领域,具体涉及一种网络故障分析监测方法。
背景技术
目前,***监控的方法有很多种,但大多数都是采用轮询监测的方式,即需要由主任务定时检查一遍***中所有需要监控的模块,同时进行信息的分析,一般来说,负责监测分析的任务优先级都较高,这样如果在监测任务中处理太多的业务,在实时操作***中就会影响其它任务的正常执行以及正常业务的处理,因此以轮询处理的方式会大大消耗***时间,降低***性能。
发明内容
本发明目的:提供一种在***任务重新调度切换时进行***监测的网络故障分析监测方法及装置,可使开发人员快速、有效了解***的运行情况,及时确定网络故障的所在位置。
本发明的技术内容:一种网络故障分析监测方法,包括:
(1)在任务进行切换重新调度时,对***日常工作的信息进行统计并记录到一个公用缓存区中;
(2)通过定时器定时从公用缓存区中搜集所统计的信息,并对统计信息进行分析监测,如监测到异常,输出到串口上给出提示警告,同时记录到***日志(syslog)中。
步骤(1)还包括给统计信息加时间戳。
在步骤(2)中所述记录还包括将信息记录在非易失随机存取存储器中。
进一步包括通过命令行读取记录并提供统计信息的输出命令。
步骤(1)中所述信息包括:通用***信息、内存管理信息、任务信息、消息队列和信号量。
一种网络故障分析监测装置,包括:
统计模块,用于记录每一次任务切换时刻的***日常工作中所需的统计信息:
记录模块,用于对信息进行分析监测,如果监测到异常,在日志中给出提示警告并将当前信息存放在***日志(syslog)中作纪录;
调度模块,负责每隔一定时间,从统计模块中取得统计信息,并调用记录模块进行分析和记录。
统计模块可对所统计的信息打上时间戳标记。
记录模块可对统计信息进行管理,维护内存中的统计表,定期更新***存储设备的纪录。
记录模块可将统计信息记录在非易失随机存取存储器中。
设置命令接口,通过该命令接口与外部的命令行模块连接,可以实现统计信息的直接读取和输出。
本发明的技术效果:在***任务重新调度切换时,进行***各项统计信息的统计,另外使用一个定时器定时读取统计信息进行分析和纪录,从而达到了对***中各项性能进行全方位的实时监测和纪录的目的,如果监测到异常,可在显示屏上给出提示,报告工作人员哪一部分模块出现问题,同时将异常时刻的***信息记录在日志和非易失随机存取存储器(Non-Volatile Random AccessMemory,NVRAM)中,并给出提示警告,以便在***重启后,仍然有足够信息以供开发人员诊断故障所在的位置,还可根据需要随时读取统计信息的记录。本发明在***发生问题时,能够提供丰富的故障位置的定位的信息,以协助开发人员尽快有效的解决问题。另外在***看似正常的时候,可以提早发现***中隐藏的运行错误,及时定位、纪录、告警,提示工作人员关注问题模块。并可按照用户需求增加统计信息的内容,具有很强的扩展性。
附图说明
本发明的示意框图。
具体实施方式
本发明提供了一种网络故障分析监测方法,参考附图,步骤1,***运行时,在每次任务进行切换重新调度时,对***日常工作中所需的信息进行统计,同时对所有统计信息打上时间戳,所统计的信息包括:(1)通用***信息:包括有CPU利用率、内存占用、任务状态、(硬)中断次数、指定的变量的变化情况;(2)内存管理信息(memory,MEM):某个内存占用是否有增长情况、是否丢内存;(3)任务信息(TASK):任务标识、名称、优先级、状态;各任务执行以来CPU占用时间、上次CPU占用时间、上次被调用的时间戳、上上次被调用的时间戳、(为了得到调用频度)调度次数、被抢占次数;(4)消息队列(Message):启动以来消息总数、队列长度、等待处理消息的任务;(5)信号量(Semephore):信号量被释放总数、Take的任务列表。步骤2,使用一个定时器定时读取统计信息,对统计信息的合法性进行分析,如监测到异常,报告工作人员哪一部分模块出现问题,输出到syslog日志和串口(console)上,并在显示屏上给出提示,将异常时刻的***信息保存到内存记录和NVRAM中。在***重启后,由于当时的***运行关键数据得到了保存,使开发人员可及时进行问题的定位。,
通过与外部的命令行模块连接的命令接口,实现读取记录信息,并将统计信息输出成容易理解的格式。如按时间顺序显示内存中的***监视记录;显示重启前的***监控模块所纪录的所有信息;显示几个重要消息队列的长度;设置内存告警的百分比,当***使用内存达到这个数值时,***将会提出告警信息。同时由于统计信息是采用加时间戳的方法来纪录的,所以通过显示一段时间内的统计信息就可以得到一个阶段内***运行情况的变化,如果输入最后的时间参数,可表示显示前几秒、前几分钟、前几小时的***监控信息,这种加时间戳的记录方式给用户提供了一种快照功能,对于比较分析一段时间内***的变化情况极为方便。
本发明提供了一种网络故障分析监测装置,包括:
统计模块,在每次任务重新调度进行切换时进行一系列信息的统计工作,它负责提供每一次任务切换时当前***的各项统计信息,并对每一项纪录都加上时间戳标记;
记录模块,用于对信息的合法性作分析,如果检测到异常,需要在显示屏上给出提示,报告工作人员哪一部分模块出现问题。出现异常后,还需要在日志中给出提示警告并将当前***信息存放在NVRAM中作纪录;以及对统计信息进行管理,维护内存中的统计表,定期更新***存储设备的纪录,并在***崩溃前dump出相关数据。
调度模块,负责每隔一定时间进行调用,实现方式是由一个定时器触发,从统计模块中取得统计信息,并调用记录模块进行分析和记录。
设置命令接口,通过该命令接口与外部的命令行模块连接,实现记录信息的读取和输出。可以通过命令接口一次输出前几秒、前几分钟、前几小时的***纪录,通过前后时间的比较,就可以得到当前***是否处于正常运行状况。
由上述可见,当***正常运行时,本发明对于***中各项性能可进行全方位的自我运行状况监测和纪录,发现错误或异常时,及时发出告警同时保存错误以备查询,如***发生死机,重起***之后能够得到死机前的***内部情况。并可通过复位模块、芯片使相应的模块和芯片复位。
同时可以按照用户需求增加监测模块,具有很强的扩展性。
Claims (10)
1.一种网络故障分析监测方法,其特征在于包括:
(1)在任务进行切换重新调度时,对***日常工作的信息进行统计并记录到一个公用缓存区中;
(2)通过定时器定时从公用缓存区中搜集所统计的信息,并对统计信息进行分析监测,如监测到异常,输出到串口上给出提示警告,同时记录到***日志(syslog)中。
2.如权利要求1所述的网络故障分析监测方法,其特征在于步骤(1)还包括给统计信息加时间戳。
3.如权利要求1或2所述的网络故障分析监测方法,其特征在于步骤(2)中所述记录还包括将统计信息记录在非易失随机存取存储器中。
4.如权利要求1所述的网络故障分析监测方法,其特征在于进一步包括通过命令行读取统计信息的记录并提供输出命令。
5.如权利要求1所述的网络故障分析监测方法,其特征在于步骤(1)中所述信息包括:通用***信息、内存管理信息、任务信息、消息队列和信号量。
6.一种网络故障分析监测装置,其特征在于该装置包括:
统计模块,用于记录每一次任务切换时刻的***日常工作中所需的统计信息;
记录模块,用于对信息进行分析监测,如果监测到异常,在日志中给出提示警告并将当前信息存放在***日志(syslog)中作纪录;
调度模块,用于负责每隔一定时间,从统计模块中取得统计信息,并调用记录模块进行分析。
7.如权利要求6所述的网络故障分析监测装置,其特征在于统计模块对所统计的信息打上时间戳标记。
8.如权利要求6所述的网络故障分析监测装置,其特征在于记录模块对统计信息进行管理,维护内存中的统计表,定期更新***存储设备的纪录。
9.如权利要求6或8所述的网络故障分析监测装置,其特征在于记录模块将统计信息记录在非易失随机存取存储器中。
10.如权利要求6所述的网络故障分析监测装置,其特征在于设置命令接口通过该命令接口与外部的命令行模块连接,实现统计信息的直接读取和输出。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CNA031536328A CN1490982A (zh) | 2003-08-18 | 2003-08-18 | 网络故障分析监测方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CNA031536328A CN1490982A (zh) | 2003-08-18 | 2003-08-18 | 网络故障分析监测方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN1490982A true CN1490982A (zh) | 2004-04-21 |
Family
ID=34156735
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNA031536328A Pending CN1490982A (zh) | 2003-08-18 | 2003-08-18 | 网络故障分析监测方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN1490982A (zh) |
Cited By (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN100370866C (zh) * | 2005-03-02 | 2008-02-20 | 华为技术有限公司 | 无线网络控制器日志记录***及其方法 |
CN100389567C (zh) * | 2004-08-25 | 2008-05-21 | 富士通株式会社 | 用于检测网络中的网络异常的方法和*** |
WO2008095390A1 (fr) * | 2007-02-07 | 2008-08-14 | Huawei Technologies Co., Ltd. | Équipement de détection d'incident de ligne en émulation de pseudo-fil et procédé correspondant |
CN100415026C (zh) * | 2004-08-23 | 2008-08-27 | 华为技术有限公司 | 单板告警监测方法 |
CN100450016C (zh) * | 2005-06-03 | 2009-01-07 | 华为技术有限公司 | 通信网络中在线维护的实现方法 |
CN100456695C (zh) * | 2005-03-08 | 2009-01-28 | 日本电气株式会社 | 无线电接入网***和对该***进行故障分析的方法 |
CN100461924C (zh) * | 2005-11-01 | 2009-02-11 | 华为技术有限公司 | 一种NodeB小区级故障的定位分析方法 |
CN101201786B (zh) * | 2006-12-13 | 2010-05-19 | 中兴通讯股份有限公司 | 一种故障日志监控方法及装置 |
CN101166124B (zh) * | 2006-10-20 | 2010-10-06 | 中兴通讯股份有限公司 | 网络处理器微引擎运行异常的检测处理方法 |
CN101222742B (zh) * | 2007-11-22 | 2010-12-01 | ***通信集团山东有限公司 | 移动通信网管***中告警自定位和自处理的方法及*** |
CN1905590B (zh) * | 2006-08-16 | 2011-01-05 | 华为技术有限公司 | 一种单板信息采集的方法 |
CN101741681B (zh) * | 2008-11-18 | 2013-03-06 | 富士通株式会社 | 节点装置 |
WO2013071755A1 (zh) * | 2011-11-17 | 2013-05-23 | 中兴通讯股份有限公司 | 基站设备自愈的实现方法及装置 |
CN104462606A (zh) * | 2014-12-31 | 2015-03-25 | 中国科学院深圳先进技术研究院 | 一种基于日志数据确定诊断处理措施的方法 |
CN106326049A (zh) * | 2016-08-16 | 2017-01-11 | 广东欧珀移动通信有限公司 | 一种故障定位方法及终端 |
CN106682746A (zh) * | 2016-12-25 | 2017-05-17 | 杭州博烁晟斐智能科技有限公司 | 一种通信铁塔维护作业单的生成方法及*** |
CN107202604A (zh) * | 2017-03-02 | 2017-09-26 | 湖南工业大学 | 一种告警处理方法及*** |
CN107480002A (zh) * | 2017-07-26 | 2017-12-15 | 阿里巴巴集团控股有限公司 | 消息处理方法及装置、电子设备 |
-
2003
- 2003-08-18 CN CNA031536328A patent/CN1490982A/zh active Pending
Cited By (24)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN100415026C (zh) * | 2004-08-23 | 2008-08-27 | 华为技术有限公司 | 单板告警监测方法 |
CN100389567C (zh) * | 2004-08-25 | 2008-05-21 | 富士通株式会社 | 用于检测网络中的网络异常的方法和*** |
CN100370866C (zh) * | 2005-03-02 | 2008-02-20 | 华为技术有限公司 | 无线网络控制器日志记录***及其方法 |
CN100456695C (zh) * | 2005-03-08 | 2009-01-28 | 日本电气株式会社 | 无线电接入网***和对该***进行故障分析的方法 |
US8064352B2 (en) | 2005-06-03 | 2011-11-22 | Huawei Technologies Co., Ltd. | Method for implementing online maintenance in communication network |
CN100450016C (zh) * | 2005-06-03 | 2009-01-07 | 华为技术有限公司 | 通信网络中在线维护的实现方法 |
CN100461924C (zh) * | 2005-11-01 | 2009-02-11 | 华为技术有限公司 | 一种NodeB小区级故障的定位分析方法 |
CN1905590B (zh) * | 2006-08-16 | 2011-01-05 | 华为技术有限公司 | 一种单板信息采集的方法 |
CN101166124B (zh) * | 2006-10-20 | 2010-10-06 | 中兴通讯股份有限公司 | 网络处理器微引擎运行异常的检测处理方法 |
CN101201786B (zh) * | 2006-12-13 | 2010-05-19 | 中兴通讯股份有限公司 | 一种故障日志监控方法及装置 |
CN101013928B (zh) * | 2007-02-07 | 2011-09-14 | 华为技术有限公司 | 实现伪线仿真线路故障检测的装置及方法 |
WO2008095390A1 (fr) * | 2007-02-07 | 2008-08-14 | Huawei Technologies Co., Ltd. | Équipement de détection d'incident de ligne en émulation de pseudo-fil et procédé correspondant |
CN101222742B (zh) * | 2007-11-22 | 2010-12-01 | ***通信集团山东有限公司 | 移动通信网管***中告警自定位和自处理的方法及*** |
CN101741681B (zh) * | 2008-11-18 | 2013-03-06 | 富士通株式会社 | 节点装置 |
WO2013071755A1 (zh) * | 2011-11-17 | 2013-05-23 | 中兴通讯股份有限公司 | 基站设备自愈的实现方法及装置 |
CN104462606A (zh) * | 2014-12-31 | 2015-03-25 | 中国科学院深圳先进技术研究院 | 一种基于日志数据确定诊断处理措施的方法 |
CN104462606B (zh) * | 2014-12-31 | 2018-06-22 | 中国科学院深圳先进技术研究院 | 一种基于日志数据确定诊断处理措施的方法 |
CN106326049A (zh) * | 2016-08-16 | 2017-01-11 | 广东欧珀移动通信有限公司 | 一种故障定位方法及终端 |
CN106326049B (zh) * | 2016-08-16 | 2019-07-19 | Oppo广东移动通信有限公司 | 一种故障定位方法及终端 |
CN106682746A (zh) * | 2016-12-25 | 2017-05-17 | 杭州博烁晟斐智能科技有限公司 | 一种通信铁塔维护作业单的生成方法及*** |
CN107202604A (zh) * | 2017-03-02 | 2017-09-26 | 湖南工业大学 | 一种告警处理方法及*** |
CN107202604B (zh) * | 2017-03-02 | 2019-09-03 | 湖南工业大学 | 一种告警处理方法及*** |
CN107480002A (zh) * | 2017-07-26 | 2017-12-15 | 阿里巴巴集团控股有限公司 | 消息处理方法及装置、电子设备 |
CN107480002B (zh) * | 2017-07-26 | 2020-06-30 | 阿里巴巴集团控股有限公司 | 消息处理方法及装置、电子设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1490982A (zh) | 网络故障分析监测方法及装置 | |
Castelli et al. | Proactive management of software aging | |
US5796633A (en) | Method and system for performance monitoring in computer networks | |
US5432932A (en) | System and method for dynamically controlling remote processes from a performance monitor | |
US5553235A (en) | System and method for maintaining performance data in a data processing system | |
US5506955A (en) | System and method for monitoring and optimizing performance in a data processing system | |
CA2753019C (en) | Monitoring of distributed applications | |
CN101620562B (zh) | 一种嵌入式***性能的评估方法及*** | |
US20110035366A1 (en) | Real-time database performance and availability monitoring method and system | |
US20070150581A1 (en) | System and method for monitoring system performance levels across a network | |
WO2003073203A2 (en) | System and method for analyzing input/output activity on local attached storage | |
KR20120023703A (ko) | 서버 관리 프로그램을 기록한 컴퓨터 판독 가능한 기록 매체, 관리 서버, 가상 서버 배치 방법 | |
CN101169752A (zh) | 一种捕获导致内存被野指针改写的函数的方法 | |
US20110160923A1 (en) | Method and apparatus for monitoring the performance of a power delivery control system | |
CN107807872A (zh) | 一种输变电***运行状态监测方法 | |
CN100530126C (zh) | 一种记录导致***异常的函数的方法 | |
CN101719852A (zh) | 一种中间件性能的监控方法和设备 | |
CN113595776B (zh) | 监控数据处理方法与*** | |
CN1581094A (zh) | 远程判断***状态的方法 | |
US20040059865A1 (en) | System and method for using removalble storage for computer troubleshooting | |
CN114090644B (zh) | 一种数据处理方法及装置 | |
Dell | ||
CN112597372A (zh) | 分布式爬虫实现方法和装置 | |
Chakraborty et al. | Observability | |
CN116610532B (zh) | Redis客户端监测方法、***、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C02 | Deemed withdrawal of patent application after publication (patent law 2001) | ||
WD01 | Invention patent application deemed withdrawn after publication |