CN103092746A - 线程异常的定位方法及*** - Google Patents

线程异常的定位方法及*** Download PDF

Info

Publication number
CN103092746A
CN103092746A CN2013100468750A CN201310046875A CN103092746A CN 103092746 A CN103092746 A CN 103092746A CN 2013100468750 A CN2013100468750 A CN 2013100468750A CN 201310046875 A CN201310046875 A CN 201310046875A CN 103092746 A CN103092746 A CN 103092746A
Authority
CN
China
Prior art keywords
thread
abnormal
monitored
monitored thread
dump file
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2013100468750A
Other languages
English (en)
Other versions
CN103092746B (zh
Inventor
林三龙
程晓龙
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Datang Mobile Communications Equipment Co Ltd
Original Assignee
Datang Mobile Communications Equipment Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Datang Mobile Communications Equipment Co Ltd filed Critical Datang Mobile Communications Equipment Co Ltd
Priority to CN201310046875.0A priority Critical patent/CN103092746B/zh
Publication of CN103092746A publication Critical patent/CN103092746A/zh
Application granted granted Critical
Publication of CN103092746B publication Critical patent/CN103092746B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Debugging And Monitoring (AREA)

Abstract

本发明公开了一种线程异常的定位方法及***,所述方法包括:监控各被监控线程的运行状态,判断被监控线程运行是否异常;在判断得到被监控线程发生异常时生成转储文件,所述转储文件包括进程内各线程的内存、堆栈信息;通过调试所述转储文件,定位被监控线程异常所在的代码位置。本发明不仅能监控线程运行状态,而且当线程运行异常时,通过转储文件自动记录线程当前运行的内存和堆栈信息,开发人员根据记录的内存和堆栈信息,就可以快速定位引起线程异常的代码位置。

Description

线程异常的定位方法及***
技术领域
本发明涉及计算机技术领域,尤其涉及一种线程异常的定位方法及***。
背景技术
线程是操作***分配处理器时间的基本单元,进程中可以有多个线程同时执行代码。每个线程都维护异常处理程序、调度优先级和一组***用于在调度该线程前保存线程上下文的结构。现有监控线程运行状态的方法有两种:
心跳检测:建立一个监控线程,监控各个线程是否有心跳,如果一段时间内某个线程没心跳,则认为这个线程异常;
状态轮询:建立一个监控线程,每隔一段时间查询各个线程的运行状态,如果发现某个线程运行停止,则认为这个线程异常;
以上两种现有技术共有的主要缺点是:
只能监控线程的状态,如果线程异常并不能确定线程异常的具***置;
当线程在进行复杂耗时运算时,采用以上两种技术可能存在误判线程运行状态的情况。
发明内容
(一)要解决的技术问题
本发明要解决的技术问题是:提供一种线程异常的定位方法及***,以快速定位引起线程异常的代码位置。
(二)技术方案
为解决上述问题,一方面,本发明提供了一种线程异常的定位方法,包括:
监控各被监控线程的运行状态,判断被监控线程运行是否异常;
在判断得到被监控线程发生异常时生成转储文件,所述转储文件包括进程内各线程的内存、堆栈信息;
通过调试所述转储文件,定位被监控线程异常所在的代码位置。
优选地,在所述监控被监控线程的运行状态的步骤之前还包括增加监控线程的步骤,通过所述监控线程来监控各被监控线程的运行状态。
优选地,通过所述监控线程来监控各被监控线程的运行状态,判断被监控线程运行是否异常的步骤包括:
所述各被监控线程在初始化时注册到所述监控线程,并设定各被监控线程的超时时间、计数器的初始值、异常次数的初始值和异常次数限值;
各被监控线程在正常运行过程中更新自身的计数器;
若监控线程发现某个被监控线程在所述设定的超时时间内未更新自身的计数器,则为该被监控线程的异常次数加1;
如果被监控线程对应的异常次数大于所述设定的异常次数限值,则判断该被监控线程发生异常,并将该被监控线程对应的计数器和异常次数重置为对应的初始值。
优选地,所述如果被监控线程对应的异常次数大于所述设定的异常次数限值,则判断该被监控线程发生异常的步骤包括:如果被监控线程对应的连续异常次数大于所述设定的异常次数限值,则判断该被监控线程发生异常。
优选地,若监控线程发现某个被监控线程在前一个超时时间内未更新自身的计数器,但是在当前超时时间内更新了自身的计数器,则将所述被监控线程对应的异常次数重置为对应的初始值。
优选地,在判断该被监控线程发生异常的步骤之后还包括在日志中记录异常线程的识别号的步骤。
优选地,所述调试转储文件的步骤包括:根据所述异常线程的识别号找到对应的异常线程。
优选地,所述转储文件为dmp文件。
另一方面,本发明还提供了一种线程异常的定位***,包括:
监控模块,用于监控各被监控线程的运行状态,判断被监控线程运行是否异常;
转储文件生成模块,用于在判断得到被监控线程发生异常时生成转储文件,所述转储文件包括进程内各线程的内存、堆栈信息;
异常定位模块,用于通过调试所述转储文件,定位被监控线程异常所在的代码位置。
(三)有益效果
本发明不仅能监控线程运行状态,而且当线程运行异常时,通过转储文件自动记录线程当前运行的内存和堆栈信息,开发人员根据记录的内存和堆栈信息,就可以快速定位引起线程异常的代码位置,方便线程的调试和修复。
本发明被监控线程对应的连续异常次数大于所述设定的异常次数限值时才判断该被监控线程发生异常,可以降低某些复杂并耗时线程误判的概率。
本发明的方法增加监控线程即可完成,适用范围较广,对已发布的软件也适用。
附图说明
图1为根据本发明实施例的一种线程异常的定位方法的流程示意图;
图2为根据本发明实施例的一种线程异常的定位方法的流程示意图;
图3为根据本发明实施例监控线程和被监控线程之间的时序图;
图4为根据本发明实施例一种线程异常的定位***的结构示意框图。
具体实施方式
下面结合附图及实施例对本发明进行详细说明如下。
实施例一:
图1所示为本实施例记载的一种线程异常的定位方法的流程示意图,所述方法包括:
S110:监控各被监控线程的运行状态,判断被监控线程运行是否异常;
S120:在判断得到被监控线程发生异常时生成转储文件;
S130:通过调试所述转储文件,定位被监控线程异常所在的代码位置。
在本实施例中,所述转储文件包括进程内各线程的内存、堆栈信息。
本实施例的方法不仅能监控线程运行状态,而且当线程运行异常时,通过转储文件自动记录线程当前运行的内存和堆栈信息,开发人员根据记录的内存和堆栈信息,就可以快速定位引起线程异常的代码位置,方便线程的调试和修复。
实施例二:
图2所示为本实施例记载的另一种线程异常的定位方法的流程示意图,所述方法包括:
S210:在应用中增加监控线程;
S220:所述各被监控线程在初始化时注册到所述监控线程,并设定各被监控线程的超时时间、计数器的初始值、异常次数的初始值和异常次数限值;
S230:各被监控线程在正常运行过程中更新自身的计数器;
S240:若监控线程发现某个被监控线程在所述设定的超时时间内未更新自身的计数器,则为该被监控线程的异常次数加1;
S250:如果被监控线程对应的连续异常次数大于所述设定的异常次数限值,则判断该被监控线程发生异常,生成所述转储文件,并将该被监控线程对应的计数器和异常次数重置为对应的初始值,在日志中记录异常线程的识别号;其中,为了获得被监控线程的连续异常次数,若监控线程发现某个被监控线程在前一个超时时间内未更新自身的计数器,但是在当前超时时间内更新了自身的计数器,则将所述被监控线程对应的异常次数重置为对应的初始值;所述异常线程的识别号用于在调试转储文件时根据所述异常线程的识别号找到对应的异常线程;
S260:通过调试所述转储文件,定位被监控线程异常所在的代码位置。
在本实施例中,所述转储文件为dmp文件,本实施例中在判断到被监控线程发生异常时,通过调用MiniDump WriteDump函数生成所述dmp文件;生成dmp文件后,通过WinDBG工具调试dmp文件,即可快速定位异常线程运行代码位置。
图3为本实施例监控线程和被监控线程之间的时序图,如图3所示,在该实现方式中包含一个监控线程Monitor和三个被监控线程ThreadA、ThreadB和ThreadC。其中,前两个被监控线程ThreadA和ThreadB先后经过初始化,注册到所述监控线程,并设定了超时时间Ti、计数器C1i的初始值、异常次数C2i的初始值和异常次数限值;被监控线程ThreadC还没有进行初始化。
在两个被监控线程ThreadA和ThreadB的运行过程中不断的更新自身的计数器C1i,监控线程发现某个被监控线程在设定的超时时间Ti内,未能更新其计数器C1i,则认为这个线程异常,其异常次数C2i加1;
在被监控线程连续异常次数C2i大于设定的异常次数限值时,生成所述dmp文件,并且重置计数器C1i和异常次数C2i为初始值。
被监控线程对应的连续异常次数大于所述设定的异常次数限值时才判断该被监控线程发生异常,可以降低某些复杂并耗时线程误判的概率。
实施例三:
图4所示为本实施例记载的一种线程异常的定位***的结构示意框图,所述***包括:
监控模块410,用于监控各被监控线程的运行状态,判断被监控线程运行是否异常;
转储文件生成模块420,用于在判断得到被监控线程发生异常时生成转储文件,所述转储文件包括进程内各线程的内存、堆栈信息;
异常定位模块430,用于通过调试所述转储文件,定位被监控线程异常所在的代码位置。
本实施例的***不仅能监控线程运行状态,而且当线程运行异常时,通过转储文件自动记录线程当前运行的内存和堆栈信息,开发人员根据记录的内存和堆栈信息,就可以快速定位引起线程异常的代码位置,方便线程的调试和修复。
以上实施方式仅用于说明本发明,而并非对本发明的限制,有关技术领域的普通技术人员,在不脱离本发明的精神和范围的情况下,还可以做出各种变化和变型,因此所有等同的技术方案也属于本发明的范畴,本发明的专利保护范围应由权利要求限定。

Claims (9)

1.一种线程异常的定位方法,其特征在于,包括:
监控各被监控线程的运行状态,判断被监控线程运行是否异常;
在判断得到被监控线程发生异常时生成转储文件,所述转储文件包括进程内各线程的内存、堆栈信息;
通过调试所述转储文件,定位被监控线程异常所在的代码位置。
2.如权利要求1所述的方法,其特征在于,在所述监控被监控线程的运行状态的步骤之前还包括增加监控线程的步骤,通过所述监控线程来监控各被监控线程的运行状态。
3.如权利要求2所述的方法,其特征在于,通过所述监控线程来监控各被监控线程的运行状态,判断被监控线程运行是否异常的步骤包括:
所述各被监控线程在初始化时注册到所述监控线程,并设定各被监控线程的超时时间、计数器的初始值、异常次数的初始值和异常次数限值;
各被监控线程在正常运行过程中更新自身的计数器;
若监控线程发现某个被监控线程在所述设定的超时时间内未更新自身的计数器,则为该被监控线程的异常次数加1;
如果被监控线程对应的异常次数大于所述设定的异常次数限值,则判断该被监控线程发生异常,并将该被监控线程对应的计数器和异常次数重置为对应的初始值。
4.如权利要求3所述的方法,其特征在于,所述如果被监控线程对应的异常次数大于所述设定的异常次数限值,则判断该被监控线程发生异常的步骤包括:如果被监控线程对应的连续异常次数大于所述设定的异常次数限值,则判断该被监控线程发生异常。
5.如权利要求4所述的方法,其特征在于,若监控线程发现某个被监控线程在前一个超时时间内未更新自身的计数器,但是在当前超时时间内更新了自身的计数器,则将所述被监控线程对应的异常次数重置为对应的初始值。
6.如权利要求3所述的方法,其特征在于,在判断该被监控线程发生异常的步骤之后还包括在日志中记录异常线程的识别号的步骤。
7.如权利要求6所述的方法,其特征在于,所述调试转储文件的步骤包括:根据所述异常线程的识别号找到对应的异常线程。
8.如权利要求1所述的方法,其特征在于,所述转储文件为dmp文件。
9.一种线程异常的定位***,其特征在于,包括:
监控模块,用于监控各被监控线程的运行状态,判断被监控线程运行是否异常;
转储文件生成模块,用于在判断得到被监控线程发生异常时生成转储文件,所述转储文件包括进程内各线程的内存、堆栈信息;
异常定位模块,用于通过调试所述转储文件,定位被监控线程异常所在的代码位置。
CN201310046875.0A 2013-02-05 2013-02-05 线程异常的定位方法及*** Active CN103092746B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310046875.0A CN103092746B (zh) 2013-02-05 2013-02-05 线程异常的定位方法及***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310046875.0A CN103092746B (zh) 2013-02-05 2013-02-05 线程异常的定位方法及***

Publications (2)

Publication Number Publication Date
CN103092746A true CN103092746A (zh) 2013-05-08
CN103092746B CN103092746B (zh) 2015-12-02

Family

ID=48205347

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310046875.0A Active CN103092746B (zh) 2013-02-05 2013-02-05 线程异常的定位方法及***

Country Status (1)

Country Link
CN (1) CN103092746B (zh)

Cited By (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103810099A (zh) * 2013-11-21 2014-05-21 北京奇虎科技有限公司 代码跟踪方法及其***
CN103984898A (zh) * 2014-05-29 2014-08-13 北京神州绿盟信息安全科技股份有限公司 一种喷射模式攻击的检测方法和装置
CN104932964A (zh) * 2014-03-17 2015-09-23 无锡天脉聚源传媒科技有限公司 一种计算机功能程序的监控处理方法和装置
CN105740080A (zh) * 2016-03-11 2016-07-06 深圳市茁壮网络股份有限公司 一种程序卡死检测方法及处理器
CN105824749A (zh) * 2016-03-09 2016-08-03 上海博达数据通信有限公司 一种linux***下用户态进程异常的分析方法
CN106445769A (zh) * 2015-08-11 2017-02-22 腾讯科技(深圳)有限公司 计算机运行监测方法、装置和***
CN106708710A (zh) * 2015-11-12 2017-05-24 高德软件有限公司 用于识别线程卡顿的方法及装置
CN106980555A (zh) * 2017-03-24 2017-07-25 山东浪潮商用***有限公司 一种超时线程处理方法及装置
CN107479986A (zh) * 2017-07-03 2017-12-15 阿里巴巴集团控股有限公司 业务流量的控制方法和装置
CN107704356A (zh) * 2017-06-12 2018-02-16 平安科技(深圳)有限公司 异常堆栈信息获取方法、装置及计算机可读存储介质
CN108153651A (zh) * 2016-12-06 2018-06-12 阿里巴巴集团控股有限公司 卡慢异常定位方法、电子设备及***
CN108243056A (zh) * 2016-12-27 2018-07-03 大唐移动通信设备有限公司 一种获取异常信息的方法及装置
CN108415806A (zh) * 2018-02-07 2018-08-17 深圳市亿联智能有限公司 一种高效率线程生命监测方式
CN108959015A (zh) * 2017-05-19 2018-12-07 北京京东尚科信息技术有限公司 判断***或***模块是否阻塞的方法和装置
CN109542632A (zh) * 2018-11-30 2019-03-29 郑州云海信息技术有限公司 一种处理访问请求的方法及装置
CN109947636A (zh) * 2017-12-20 2019-06-28 浙江宇视科技有限公司 异常线程定位方法及装置
CN110032435A (zh) * 2019-03-25 2019-07-19 北京和利时***工程有限公司 控制***中管理线程的方法和装置
CN110413432A (zh) * 2019-07-02 2019-11-05 Oppo广东移动通信有限公司 一种信息处理方法、电子设备及存储介质
CN111125008A (zh) * 2019-12-20 2020-05-08 浪潮电子信息产业股份有限公司 一种异常inode的动态修复方法、***及相关组件
CN112948158A (zh) * 2021-02-19 2021-06-11 山东英信计算机技术有限公司 一种文件共享方法、装置、设备及计算机可读存储介质
CN113407368A (zh) * 2020-03-16 2021-09-17 广东龙芯中科电子科技有限公司 进程管理方法、装置和电子设备
CN113672449A (zh) * 2021-07-07 2021-11-19 浙江大华技术股份有限公司 智能运维异常监测方法、装置、计算机设备和存储介质
CN114003390A (zh) * 2021-11-16 2022-02-01 平安养老保险股份有限公司 一种确定异常线程的方法、装置、计算机设备及存储介质
CN114625428A (zh) * 2020-12-10 2022-06-14 荣耀终端有限公司 一种应用异常的处理方法及电子设备

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5930470A (en) * 1996-09-03 1999-07-27 Kabushiki Kaisha Toshiba Debugging system and debugging method
CN1996257A (zh) * 2006-12-26 2007-07-11 华为技术有限公司 对进程进行监控的方法和***
CN102855160A (zh) * 2012-08-22 2013-01-02 北京奇虎科技有限公司 软件修复方法、装置及***

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5930470A (en) * 1996-09-03 1999-07-27 Kabushiki Kaisha Toshiba Debugging system and debugging method
CN1996257A (zh) * 2006-12-26 2007-07-11 华为技术有限公司 对进程进行监控的方法和***
CN102855160A (zh) * 2012-08-22 2013-01-02 北京奇虎科技有限公司 软件修复方法、装置及***

Cited By (38)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103810099A (zh) * 2013-11-21 2014-05-21 北京奇虎科技有限公司 代码跟踪方法及其***
CN103810099B (zh) * 2013-11-21 2017-05-24 北京奇虎科技有限公司 代码跟踪方法及其***
CN104932964A (zh) * 2014-03-17 2015-09-23 无锡天脉聚源传媒科技有限公司 一种计算机功能程序的监控处理方法和装置
CN103984898B (zh) * 2014-05-29 2017-02-01 北京神州绿盟信息安全科技股份有限公司 一种喷射模式攻击的检测方法和装置
CN103984898A (zh) * 2014-05-29 2014-08-13 北京神州绿盟信息安全科技股份有限公司 一种喷射模式攻击的检测方法和装置
CN106445769A (zh) * 2015-08-11 2017-02-22 腾讯科技(深圳)有限公司 计算机运行监测方法、装置和***
CN106445769B (zh) * 2015-08-11 2020-12-15 腾讯科技(深圳)有限公司 计算机运行监测方法、装置和***
CN106708710A (zh) * 2015-11-12 2017-05-24 高德软件有限公司 用于识别线程卡顿的方法及装置
CN105824749A (zh) * 2016-03-09 2016-08-03 上海博达数据通信有限公司 一种linux***下用户态进程异常的分析方法
CN105824749B (zh) * 2016-03-09 2019-06-25 上海博达数据通信有限公司 一种linux***下用户态进程异常的分析方法
CN105740080B (zh) * 2016-03-11 2019-02-22 深圳市茁壮网络股份有限公司 一种程序卡死检测方法及处理器
CN105740080A (zh) * 2016-03-11 2016-07-06 深圳市茁壮网络股份有限公司 一种程序卡死检测方法及处理器
CN108153651A (zh) * 2016-12-06 2018-06-12 阿里巴巴集团控股有限公司 卡慢异常定位方法、电子设备及***
CN108243056A (zh) * 2016-12-27 2018-07-03 大唐移动通信设备有限公司 一种获取异常信息的方法及装置
CN106980555A (zh) * 2017-03-24 2017-07-25 山东浪潮商用***有限公司 一种超时线程处理方法及装置
CN106980555B (zh) * 2017-03-24 2020-04-07 山东浪潮商用***有限公司 一种超时线程处理方法及装置
CN108959015A (zh) * 2017-05-19 2018-12-07 北京京东尚科信息技术有限公司 判断***或***模块是否阻塞的方法和装置
US11010227B2 (en) 2017-06-12 2021-05-18 Ping An Technology (Shenzhen) Co., Ltd. Exception stack information acquisition method and device and computer-readable storage medium
CN107704356A (zh) * 2017-06-12 2018-02-16 平安科技(深圳)有限公司 异常堆栈信息获取方法、装置及计算机可读存储介质
CN107704356B (zh) * 2017-06-12 2019-06-28 平安科技(深圳)有限公司 异常堆栈信息获取方法、装置及计算机可读存储介质
CN107479986A (zh) * 2017-07-03 2017-12-15 阿里巴巴集团控股有限公司 业务流量的控制方法和装置
CN109947636A (zh) * 2017-12-20 2019-06-28 浙江宇视科技有限公司 异常线程定位方法及装置
CN109947636B (zh) * 2017-12-20 2022-11-04 浙江宇视科技有限公司 异常线程定位方法及装置
CN108415806A (zh) * 2018-02-07 2018-08-17 深圳市亿联智能有限公司 一种高效率线程生命监测方式
CN109542632A (zh) * 2018-11-30 2019-03-29 郑州云海信息技术有限公司 一种处理访问请求的方法及装置
CN110032435A (zh) * 2019-03-25 2019-07-19 北京和利时***工程有限公司 控制***中管理线程的方法和装置
CN110032435B (zh) * 2019-03-25 2021-06-08 北京和利时***工程有限公司 控制***中管理线程的方法和装置
CN110413432A (zh) * 2019-07-02 2019-11-05 Oppo广东移动通信有限公司 一种信息处理方法、电子设备及存储介质
CN110413432B (zh) * 2019-07-02 2023-09-01 Oppo广东移动通信有限公司 一种信息处理方法、电子设备及存储介质
CN111125008A (zh) * 2019-12-20 2020-05-08 浪潮电子信息产业股份有限公司 一种异常inode的动态修复方法、***及相关组件
US11650875B2 (en) 2019-12-20 2023-05-16 Inspur Electronic Information Industry Co., Ltd. Abnormal inode dynamic repair method and system, and related component
CN111125008B (zh) * 2019-12-20 2022-04-22 浪潮电子信息产业股份有限公司 一种异常inode的动态修复方法、***及相关组件
CN113407368A (zh) * 2020-03-16 2021-09-17 广东龙芯中科电子科技有限公司 进程管理方法、装置和电子设备
CN114625428A (zh) * 2020-12-10 2022-06-14 荣耀终端有限公司 一种应用异常的处理方法及电子设备
CN114625428B (zh) * 2020-12-10 2024-03-26 荣耀终端有限公司 一种应用异常的处理方法及电子设备
CN112948158A (zh) * 2021-02-19 2021-06-11 山东英信计算机技术有限公司 一种文件共享方法、装置、设备及计算机可读存储介质
CN113672449A (zh) * 2021-07-07 2021-11-19 浙江大华技术股份有限公司 智能运维异常监测方法、装置、计算机设备和存储介质
CN114003390A (zh) * 2021-11-16 2022-02-01 平安养老保险股份有限公司 一种确定异常线程的方法、装置、计算机设备及存储介质

Also Published As

Publication number Publication date
CN103092746B (zh) 2015-12-02

Similar Documents

Publication Publication Date Title
CN103092746B (zh) 线程异常的定位方法及***
CN114328102B (zh) 设备状态监控方法、装置、设备及计算机可读存储介质
US10095576B2 (en) Anomaly recovery method for virtual machine in distributed environment
CN103415840A (zh) 跨硬件层和软件层的错误管理
CN105243004A (zh) 一种故障资源检测方法及装置
WO2017220013A1 (zh) 业务处理方法及装置、存储介质
CN104320308A (zh) 一种服务器异常检测的方法及装置
CN104360952A (zh) 一种软件测试***及方法
US8332069B2 (en) Fault tolerance method and apparatus for robot software component
US8984333B2 (en) Automatic computer storage medium diagnostics
CN110659147B (zh) 一种基于模块自检行为的自修复方法和***
CN104834584A (zh) 一种监测主机硬件负载的方法和***
US20140164851A1 (en) Fault Processing in a System
JP6880961B2 (ja) 情報処理装置、およびログ記録方法
CN117032974A (zh) 基于资源申请的动态调度方法及终端
CN104158843A (zh) 分布式文件存储***的存储单元失效检测方法及装置
CN108021463B (zh) 一种基于有限状态机的gpu故障管理方法
CN108491297A (zh) 一种服务器监控信息获取方法、装置、设备及存储介质
CN112905375A (zh) 双芯智能电表管理单元的自恢复方法、装置和计算机设备
CN111625185A (zh) 一种磁盘故障监控的方法、***及相关组件
CN117349127B (zh) Gpu掉卡检测方法及装置
CN111611048A (zh) 云计算环境中虚拟机的迁移方法、装置和计算机设备
CN113986142B (zh) 磁盘故障监控方法、装置、计算机设备及存储介质
US20140047102A1 (en) Network monitoring
JP3596744B2 (ja) 資源利用状況監視制御方法およびそのプログラムを記録した記録媒体

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant